苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper万能框架(V2.3-含.netcore) HttpHelper官方出品,无敌框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 最牛的爬虫类,没有爬不到只有想不到 源码 - 代码生成器 - 讨论区 - 教程- 例子

查看: 1428|回复: 6

[求助] 搜狗微信改版后采集不了

[复制链接]
发表于 2019-3-29 19:19:11 | 显示全部楼层 |阅读模式
https://weixin.sogou.com/weixin?type=2&query=%E9%A9%AC%E4%BA%91

获取到这个页面内容后,带cookie访问像下面的文章,如

https://weixin.sogou.com/link?ur ... =%E9%A9%AC%E4%BA%91

会提示输入验证码,查看后发现获取的url少了几个参数,正确的网址应该是

https://weixin.sogou.com/link?ur ... =%E9%A9%AC%E4%BA%91&k=55&h=6


基本郁闷的是https://weixin.sogou.com/weixin?type=2&query=%E9%A9%AC%E4%BA%91 这个网页中的html源码[url=view-source:https://weixin.sogou.com/weixin? ... =%E9%A9%AC%E4%BA%91]view-source:https://weixin.sogou.com/weixin? ... =%E9%A9%AC%E4%BA%91[/url]
也是不带上面红色参数的,但是通过审查元素时,链接是有参数的

请各位帮忙看看,谢谢。

 楼主| 发表于 2019-3-30 21:00:27 | 显示全部楼层
回复

使用道具 举报

发表于 2019-4-1 08:41:33 | 显示全部楼层
根据抓到的包直接提交应该是没有问题的,我试过,是不是少参数了
 楼主| 发表于 2019-4-1 09:51:47 | 显示全部楼层
 楼主| 发表于 2019-4-1 09:52:22 | 显示全部楼层
站长苏飞 发表于 2019-4-1 08:41
根据抓到的包直接提交应该是没有问题的,我试过,是不是少参数了

站长再帮我看看,谢谢
 楼主| 发表于 2019-4-1 10:44:46 | 显示全部楼层
我发现是底部有一段代码导致的
<script>
    (function(){$("a").on("click contextmenu",function(){var b=Math.floor(100*Math.random())+1,a=this.href.indexOf("url="),c=this.href.indexOf("&k=");-1!==a&&-1===c&&(a=this.href.substr(a+4+parseInt("26")+b,1),this.href+="&k="+b+"&h="+a)})})();
</script>
发表于 2019-4-1 14:17:27 | 显示全部楼层
qqtest 发表于 2019-4-1 10:44
我发现是底部有一段代码导致的

    (function(){$("a").on("click contextmenu",function(){var b=Math. ...

找到问题了是吧,恭喜
您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备17001017号-1)

GMT+8, 2019-11-22 00:50

© 2017-2018

快速回复 返回顶部 返回列表