http://www.sufeinet.com/plugin.php?id=keke_group

苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper爬虫框架(V2.7-含.netcore) HttpHelper官方出品,爬虫框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 开源的爬虫类,支持多种模式和属性 源码 - 代码生成器 - 讨论区 - 教程- 例子

楼主: 1602264241

[例子] HttpHelper类登录淘宝联盟并下载淘宝客订单xls

  [复制链接]
发表于 2013-8-13 21:20:06 | 显示全部楼层
{:soso_e104:}看了半天,还是迷迷糊糊的,呵呵,水平有效,行下载来,以后慢慢学,谢谢。


1. 开通SVIP会员,免费下载本站所有源码,不限次数据,不限时间
2. 加官方QQ群,加官方微信群获取更多资源和帮助
3. 找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
发表于 2013-8-16 22:16:36 | 显示全部楼层
看看,学习一下!!!
发表于 2013-8-19 09:56:24 | 显示全部楼层
不错~~~~~~~~
发表于 2013-8-19 11:46:37 | 显示全部楼层
非常感谢!
回复

使用道具 举报

发表于 2013-8-21 09:32:45 | 显示全部楼层
学习学习~~~
回复

使用道具 举报

发表于 2013-8-23 16:34:28 | 显示全部楼层
必须看看
回复

使用道具 举报

发表于 2013-8-25 22:38:03 | 显示全部楼层
版主我用了你的HttpHelper类登录微淘,可以说正常情况下是没有问题的。如果在多次输入密码错误或者多次登录出现了验证码,我也是获取到验证码了,然后拼接起来提交怎么都不行,求指教,代码如下:

  1. <p>   HttpItem item = new HttpItem();
  2.                
  3. string cookie = "";
  4. </p><p> string name="XXX"
  5.                
  6. item.URL =  string.Format(
  7.                         
  8. "<a >https://login.taobao.com/member/request_nick_check.do?_ksTS=1377391470565_83&_input_charset=utf-8&username={0</a>}",
  9.                         
  10. HttpUtility.UrlEncode(userName));
  11.                
  12. item.Method = "get";
  13.                
  14. item.Accept = "Accept application/json, text/javascript, */*; q=0.01";
  15. HttpResult result = m_Http.GetHtml(item);
  16.      string html   = result.Html;
  17.    cookie = result.Cookie;</p><p>      
  18. <font color="red">//第一步判断是否要输入验证码:</font>
  19.                  
  20. Match needcode = Regex.Match(html, "(?<="needcode":)\\w+");</p><p>    if (needcode.Value == "false")
  21.    {        
  22. <font color="red">     //模拟登录完全没有问题</font>     
  23. }</p><p>else
  24. //有验证码</p><p>  {</p><p> //首先得到验证码
  25. 把它保存到一个目录Codeimg
  26. Match sessionid = Regex.Match(cookie, "(?<=cookie2=)\\w+");                  
  27. item.URL =string.Format( "<a >https://regcheckcode.taobao.com/auction/checkcode?sessionID={0}&rad=0.3025266655735114&_r_=1377393595015</a>", sessionid);        
  28. item.Method = "get";         
  29. item.ResultType = ResultType.Byte;                    
  30. item.Accept = "image/png, image/svg+xml, image/*;q=0.8, */*;q=0.5";
  31.                   
  32. result = m_Http.GetHtml(item);                    
  33. html = result.Html;
  34.                     
  35. String path =
  36. HttpContext.Current.Request.MapPath("/Codeimg");
  37.                     
  38. FileUtil.CreateFolder(path);
  39.                     
  40. path = path + "<a href="file://\\taobao-code.jpg">\\taobao-code.jpg</a>";
  41.                     
  42. FileUtil.writeBytes(path, result.ResultByte);</p>               
  43. //开始模拟登录            
  44. item.URL = "<a >https://login.taobao.com/member/login.jhtml</a>";
  45. //URL     必需项                 
  46. item.Method = "post"; //URL     可选项 默认为Get                  
  47. //下面使用POST方式提交用户名和密码,为什么用POST?因为HttpWatch上面有               
  48. item.Postdata =
  49. string.Format("ua=<font color="red">用工具抓去的,论坛留言数据不够,先去了</font>","用户名","密码","这里填写生成的验证码");<font color="red"> //Post数据   
  50. 这个是我安装你的方法抓取</font>
  51.                     
  52. item.ContentType = "application/x-www-form-urlencoded;

  53. charset=UTF-8";//返回类型    可选项有默认值               
  54. item.Allowautoredirect = true;//是否根据301跳转     可选项                       
  55. HttpResult result1 =m_Http.GetHtml(item);
  56.   string html1 = result1.Html;                 
  57. string cookie1 = result1.Cookie;               
  58. Match m1 = Regex.Match(html1, "(?<=,"message":").*?(?=",)");
  59. <p>                   <font color="red"> //在这个token
  60. 取不到,html直接跑首页去了。如果Post用你之前写阿里妈妈里面的那个,直接报验证码输入失败,我确认了弹出框输入验证码正确了的,怎么也不行,弄的快要疯了,求指点</font>
  61. </p><p>          }</p>
复制代码
发表于 2013-9-1 01:30:28 | 显示全部楼层
不错,来看看如何了。。哇咔咔
发表于 2013-9-1 03:42:12 | 显示全部楼层
学而时习之不亦乐乎!
发表于 2013-9-1 21:51:41 | 显示全部楼层
正在学习登陆与抓取
您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备18043678号-2)

GMT+8, 2024-4-20 16:13

© 2014-2021

快速回复 返回顶部 返回列表