苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper爬虫框架(V2.3-含.netcore) HttpHelper官方出品,爬虫框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 开源的爬虫类,支持多种模式和属性 源码 - 代码生成器 - 讨论区 - 教程- 例子

查看: 430|回复: 3

[HttpHelper] 抓取验证码出错

[复制链接]
发表于 2020-11-8 18:28:06 | 显示全部楼层 |阅读模式
本帖最后由 dxdong007 于 2020-11-8 18:39 编辑

HttpHelper http = new HttpHelper();
            HttpItem item = new HttpItem()
            {
              URL = "file:///C:/Users/Dxdong/AppData/Roaming/Tencent/QQ/Temp/%W@GJ$ACOF(TYDYECOKVDYB.pnghttp://59.203.5.92/jguaac-server/imageServlet?now=1604629471833",//URL     必需项                              Method = "GET",//URL     可选项 默认为Get
                Timeout = 1000,//连接超时时间     可选项默认为100000
                ReadWriteTimeout = 30000,//写入Post数据超时时间     可选项默认为30000
                IsToLower = false,//得到的HTML代码是否转成小写     可选项默认转小写
                Cookie = cookie,//字符串Cookie     可选项
                UserAgent = "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:18.0) Gecko/20100101 Firefox/18.0",//用户的浏览器类型,版本,操作系统     可选项有默认值
                Accept = "textfile:///C:\Users\Dxdong\AppData\Roaming\Tencent\QQTempSys\@IR3P(8S$C$Z$TY~5I{QEPC.gifml, application/xhtml+xml, */*",//    可选项有默认值
                ContentType = "application/x-www-form-urlencoded",//返回类型    可选项有默认值
                Referer = "file:///C:\Users\Dxdong\AppData\Roaming\Tencent\QQ\Temp\%W@GJ$ACOF(TYDYECOKVDYB.pnghttp://59.203.5.92/jguaac-server/login",//来源URL     可选项
                                                                   //Allowautoredirect = False,//是否根据301跳转     可选项
                                                                   //AutoRedirectCookie = False,//是否自动处理Cookie     可选项
                                                                   //CerPath = "d:\123.cer",//证书绝对路径     可选项不需要证书时可以不写这个参数
                                                                   //Connectionlimit = 1024,//最大连接数     可选项 默认为1024
                                                                   //Postdata = "userid=" + userid + "&pwd=" + pwd + "&lang=cn&cmd=CLIENT_USER_LOGIN&sid=&deviceType=pc&_CACHE_LOGIN_TIME_=" + GetTimeStamp() + "&pwdEncode=RSA&timeZone=8",//Post数据     可选项GET时不需要写
                                                                   //ProxyIp = "file:///C:\Users\Dxdong\AppData\Roaming\Tencent\QQ\Temp\%W@GJ$ACOF(TYDYECOKVDYB.png192.168.1.105:2020",//代理服务器ID     可选项 不需要代理 时可以不设置这三个参数
                                                                   //ProxyPwd = "123456",//代理服务器密码     可选项
                                                                   //ProxyUserName = "administrator",//代理服务器账户名     可选项
                ResultType = ResultType.Byte,//返回数据类型,是Byte还是String

            };
            try
            {
                HttpResult result = http.GetHtml(item);
                //string html = result.Html;
                picBox.Image = byteArrayToImage(result.ResultByte);//这里是134行
                cookie = result.Cookie;
                //log(html);
            }

找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
 楼主| 发表于 2020-11-8 18:29:53 | 显示全部楼层
本帖最后由 dxdong007 于 2020-11-8 18:32 编辑

QQ图片20201108182611.png VKI_241JOS`OFIX]D[1C$EY.png

有时候可以正确运行一次,再刷新抓取就会报错,有时候直接报错URL为我们办公的内网,外网没法打开,我测试过其它图片的URL可以正常打开并刷新
找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
 楼主| 发表于 2020-11-8 19:07:14 | 显示全部楼层
本帖最后由 dxdong007 于 2020-11-8 19:19 编辑

HttpHelper http = new HttpHelper();
            HttpItem item = new HttpItem()
            {
                URL = "http://59.203.5.92/jguaac-server/imageServlet?now=1604629471833",//URL     必需项
                Method = "GET",//URL     可选项 默认为Get
                Timeout = 1000,//连接超时时间     可选项默认为100000
                ReadWriteTimeout = 30000,//写入Post数据超时时间     可选项默认为30000
                IsToLower = false,//得到的HTML代码是否转成小写     可选项默认转小写
                Cookie = cookie,//字符串Cookie     可选项
                UserAgent = "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:18.0) Gecko/20100101 Firefox/18.0",//用户的浏览器类型,版本,操作系统     可选项有默认值
                Accept = "text/html, application/xhtml+xml, */*",//    可选项有默认值
                ContentType = "application/x-www-form-urlencoded",//返回类型    可选项有默认值
                Referer = "http://59.203.5.92/jguaac-server/login",//来源URL     可选项
                                                                   //Allowautoredirect = False,//是否根据301跳转     可选项
                                                                   //AutoRedirectCookie = False,//是否自动处理Cookie     可选项
                                                                   //CerPath = "d:\123.cer",//证书绝对路径     可选项不需要证书时可以不写这个参数
                                                                   //Connectionlimit = 1024,//最大连接数     可选项 默认为1024
                                                                   //Postdata = "userid=" + userid + "&pwd=" + pwd + "&lang=cn&cmd=CLIENT_USER_LOGIN&sid=&deviceType=pc&_CACHE_LOGIN_TIME_=" + GetTimeStamp() + "&pwdEncode=RSA&timeZone=8",//Post数据     可选项GET时不需要写
                                                                   //ProxyIp = "192.168.1.105:2020",//代理服务器ID     可选项 不需要代理 时可以不设置这三个参数
                                                                   //ProxyPwd = "123456",//代理服务器密码     可选项
                                                                   //ProxyUserName = "administrator",//代理服务器账户名     可选项
                ResultType = ResultType.Byte,//返回数据类型,是Byte还是String

            };
            try
            {
                HttpResult result = http.GetHtml(item);
                //string html = result.Html;
                picBox.Image = byteArrayToImage(result.ResultByte);
                //MemoryStream ms = new MemoryStream(result.ResultByte);
                //Image i = Image.FromStream(ms);
                //byteArrayToImage(result.ResultByte);
                cookie = result.Cookie;
                //log(html);
            }

重贴下代码,一楼复制的有错 123.png 调试看  result.ResultByte里是有数据的
找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
发表于 2020-11-9 08:19:11 | 显示全部楼层
找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备17001017号-1)

GMT+8, 2020-12-4 21:29

© 2014-2021

快速回复 返回顶部 返回列表