http://www.sufeinet.com/plugin.php?id=keke_group

苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper爬虫框架(V2.7-含.netcore) HttpHelper官方出品,爬虫框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 开源的爬虫类,支持多种模式和属性 源码 - 代码生成器 - 讨论区 - 教程- 例子

查看: 5014|回复: 9

[求助] 请问如何请求网址中带有^字符的网站的内容?

[复制链接]
发表于 2016-9-23 14:44:20 | 显示全部楼层 |阅读模式
我用HttpHelper的GetHtml请求一个网站的内容(get),这个网站的网址中带有^字符(变态)。
但是返回内容不正确,提示失败。同样的网址放到我的WebBorwser中就可以正确访问,一直找不到原因。
后来抓包发现在使用HttpWebRequest访问的时候,^被编码成了%5E,造成无法正确访问。而用WebBorwser.Naviget访问时就没有编码成%5E,所以可以正确访问。
回头HttpWebRequest.RequestUri,这里是未编码的。
难道WebBorwser.Naviget不是调用HttpWebRequest.GetResponse的?

我怎样做才能用HttpWebRequest.GetResponse访问地址中带有^字符的网站?


1. 开通SVIP会员,免费下载本站所有源码,不限次数据,不限时间
2. 加官方QQ群,加官方微信群获取更多资源和帮助
3. 找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
发表于 2016-9-23 15:33:40 | 显示全部楼层
发出来网址看看啊
 楼主| 发表于 2016-9-23 16:30:12 | 显示全部楼层
使用这个重载的构造函数可以解决问题:Uri (String, Boolean)。
但是有一个已过时的警告!
发表于 2016-9-23 16:34:36 | 显示全部楼层
那不影响直接用吧
 楼主| 发表于 2016-9-23 17:00:49 | 显示全部楼层

可以使用,但是因为有个警告,所以有些不爽。
我是不是真的有强迫症了?
 楼主| 发表于 2016-9-23 17:20:37 | 显示全部楼层

但是,因为需要用Uri(string uriString, bool dontEscape),所以必须使用这个重载:WebRequest.Create (Uri)而不是WebRequest.Create (string)
这样如果老大你的HttpHelper只能使用string格式的网址的话可能无法满足这个要求。
另外我还奇怪:WebBrowser没有使用WebRequest吗?为什么用WebBrowser就没有这个转义的问题?
发表于 2016-9-23 17:46:42 | 显示全部楼层
你提供一个网址,我测试一下,一般情况下都是通用的
 楼主| 发表于 2016-9-23 17:50:39 | 显示全部楼层
站长苏飞 发表于 2016-9-23 17:46
你提供一个网址,我测试一下,一般情况下都是通用的

http://hq.htsc.com.cn/cssweb?type=GET_PRICE_VOLUMEJY^cssweb_type=GET_HQ_B^stockcode=150205^0.9631194835528731
发表于 2016-9-23 18:01:08 | 显示全部楼层
看写成这样可以吗?

^是可以转为%5e 的
 楼主| 发表于 2016-9-24 19:54:13 | 显示全部楼层
关于“另外我还奇怪:WebBrowser没有使用WebRequest吗?为什么用WebBrowser就没有这个转义的问题?”。
是这样的,WebBrowser确实没有使用WebRequest。
WebBrowser不是用C#写的,她是COM的C#封装。
您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备18043678号-2)

GMT+8, 2024-4-26 21:34

© 2014-2021

快速回复 返回顶部 返回列表