http://www.sufeinet.com/plugin.php?id=keke_group

苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper爬虫框架(V2.7-含.netcore) HttpHelper官方出品,爬虫框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 开源的爬虫类,支持多种模式和属性 源码 - 代码生成器 - 讨论区 - 教程- 例子

查看: 3036|回复: 7

[其他] 为什么软件get获得的html和浏览器访问的不一样的呢

[复制链接]
发表于 2013-12-8 18:43:11 | 显示全部楼层 |阅读模式
请问为什么软件get获得的html和浏览器访问的不一样的呢
比如说http://www.google.com.hk/search?q=site%3Awww.baidu.com 使用httphelper 获得的html却是繁体中文,以及结果不一样。谢谢


1. 开通SVIP会员,免费下载本站所有源码,不限次数据,不限时间
2. 加官方QQ群,加官方微信群获取更多资源和帮助
3. 找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
发表于 2013-12-9 08:18:27 | 显示全部楼层
肯定是不一样的啊,浏览器会执行JS,会解析Html,Http请求只是返回原始的Html代码
 楼主| 发表于 2013-12-10 11:42:12 | 显示全部楼层
站长苏飞 发表于 2013-12-9 08:18
肯定是不一样的啊,浏览器会执行JS,会解析Html,Http请求只是返回原始的Html代码

用的httphelper访问,那怎么样才能使与浏览器获取的一样呢
发表于 2013-12-10 11:43:38 | 显示全部楼层
sandy1231 发表于 2013-12-10 11:42
用的httphelper访问,那怎么样才能使与浏览器获取的一样呢

你看看浏览器都执行了什么,需要慢慢分析,看看Htttphelper没有的Cookie是怎么生成的,然后想办法生成。别的没什么好办法
发表于 2013-12-10 11:48:30 | 显示全部楼层
你这个好像通过参数设置,设置为中文简体就行了吧。Google有参数可以控制,你查查
 楼主| 发表于 2013-12-10 18:02:35 | 显示全部楼层
站长苏飞 发表于 2013-12-10 11:48
你这个好像通过参数设置,设置为中文简体就行了吧。Google有参数可以控制,你查查

http://www.google.com.hk/search? ... ite%3Awww.17usa.com 参数设置成了这样,返回302,之后把Allowautoredirect 设置成了true, 有时返回 “重定向次数过多”,有时提示“远程服务器返回错误: (503) 服务器不可用。” 这是什么问题飞哥
发表于 2013-12-10 18:42:16 | 显示全部楼层
设置为False,然后再请求,获取请求的Cookei再重定向
 楼主| 发表于 2013-12-10 20:00:06 | 显示全部楼层
站长苏飞 发表于 2013-12-10 18:42
设置为False,然后再请求,获取请求的Cookei再重定向

搞定 谢谢飞哥
您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备18043678号-2)

GMT+8, 2024-5-29 10:24

© 2014-2021

快速回复 返回顶部 返回列表