http://www.sufeinet.com/plugin.php?id=keke_group

苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper爬虫框架(V2.7-含.netcore) HttpHelper官方出品,爬虫框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 开源的爬虫类,支持多种模式和属性 源码 - 代码生成器 - 讨论区 - 教程- 例子

查看: 5080|回复: 6

[求助] 搜狗微信改版后采集不了

[复制链接]
发表于 2019-3-29 19:19:11 | 显示全部楼层 |阅读模式
https://weixin.sogou.com/weixin?type=2&query=%E9%A9%AC%E4%BA%91

获取到这个页面内容后,带cookie访问像下面的文章,如

https://weixin.sogou.com/link?ur ... =%E9%A9%AC%E4%BA%91

会提示输入验证码,查看后发现获取的url少了几个参数,正确的网址应该是

https://weixin.sogou.com/link?ur ... =%E9%A9%AC%E4%BA%91&k=55&h=6


基本郁闷的是https://weixin.sogou.com/weixin?type=2&query=%E9%A9%AC%E4%BA%91 这个网页中的html源码[url=view-source:https://weixin.sogou.com/weixin? ... =%E9%A9%AC%E4%BA%91]view-source:https://weixin.sogou.com/weixin? ... =%E9%A9%AC%E4%BA%91[/url]
也是不带上面红色参数的,但是通过审查元素时,链接是有参数的

请各位帮忙看看,谢谢。



1. 开通SVIP会员,免费下载本站所有源码,不限次数据,不限时间
2. 加官方QQ群,加官方微信群获取更多资源和帮助
3. 找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
 楼主| 发表于 2019-3-30 21:00:27 | 显示全部楼层
@站长苏飞
回复

使用道具 举报

发表于 2019-4-1 08:41:33 | 显示全部楼层
根据抓到的包直接提交应该是没有问题的,我试过,是不是少参数了
 楼主| 发表于 2019-4-1 09:51:47 | 显示全部楼层
01.png

html中的网址少了类似&k=95&h=N这样的参数。
 楼主| 发表于 2019-4-1 09:52:22 | 显示全部楼层
站长苏飞 发表于 2019-4-1 08:41
根据抓到的包直接提交应该是没有问题的,我试过,是不是少参数了

站长再帮我看看,谢谢
 楼主| 发表于 2019-4-1 10:44:46 | 显示全部楼层
我发现是底部有一段代码导致的
<script>
    (function(){$("a").on("click contextmenu",function(){var b=Math.floor(100*Math.random())+1,a=this.href.indexOf("url="),c=this.href.indexOf("&k=");-1!==a&&-1===c&&(a=this.href.substr(a+4+parseInt("26")+b,1),this.href+="&k="+b+"&h="+a)})})();
</script>
发表于 2019-4-1 14:17:27 | 显示全部楼层
qqtest 发表于 2019-4-1 10:44
我发现是底部有一段代码导致的

    (function(){$("a").on("click contextmenu",function(){var b=Math. ...

找到问题了是吧,恭喜
您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备18043678号-2)

GMT+8, 2024-3-29 17:09

© 2014-2021

快速回复 返回顶部 返回列表