http://www.sufeinet.com/plugin.php?id=keke_group

苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper爬虫框架(V2.7-含.netcore) HttpHelper官方出品,爬虫框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 开源的爬虫类,支持多种模式和属性 源码 - 代码生成器 - 讨论区 - 教程- 例子

查看: 3284|回复: 5

[HttpHelper] httpHelp类编码识别不正确

[复制链接]
发表于 2018-2-3 09:41:18 | 显示全部楼层 |阅读模式
使用的是自动识别状态

http://88pj8.vip  这的网站,代码里面写的是  gb2312  实际用UTF8的编码才正常,这个要怎么处理呀?

请告诉解决方案,谢谢



1. 开通SVIP会员,免费下载本站所有源码,不限次数据,不限时间
2. 加官方QQ群,加官方微信群获取更多资源和帮助
3. 找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
 楼主| 发表于 2018-2-3 09:43:08 | 显示全部楼层
非常让人崩溃,不知道怎么解决
发表于 2018-2-4 02:35:47 | 显示全部楼层
Content-Type:text/html; charset=utf-8 看的是这个 不是看的代码,里边写的会根据这个自动转换的,文件内的只代表文件用格式,而不是获取的时候的格式
发表于 2018-2-5 08:41:19 | 显示全部楼层
你手动设置一个吧,自动也不是万能的。
 楼主| 发表于 2018-2-5 11:45:41 | 显示全部楼层
站长苏飞 发表于 2018-2-5 08:41
你手动设置一个吧,自动也不是万能的。

类库能否调整一下,解决这种个别奇葩的问题
发表于 2018-2-5 14:11:16 | 显示全部楼层
haifding 发表于 2018-2-5 11:45
类库能否调整一下,解决这种个别奇葩的问题

暂时不好解决,因为我也无法知道他到底是以那个为准,根据我以前做的数据分析写在页面里的成功几率是在远远超过charset的几率的,但是两种只能选择一种。如果后期我采用根据头信息识别会解决这种问题,需要继续努力
您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备18043678号-2)

GMT+8, 2024-4-26 04:56

© 2014-2021

快速回复 返回顶部 返回列表