苏飞论坛广告位

苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

分布式系统框架(V1.3) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程 - 订阅更新

HttpHelper万能框架(V2.2) HttpHelper官方出品,无敌框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V1.9) 最牛的爬虫类,没有爬不到只有想不到 源码 - 代码生成器 - 讨论区 - 教程- 例子

查看: 13777|回复: 17

[教程] C#HttpHelper类1.3正式版教程与升级报告

[复制链接]
  • TA的每日心情
    开心
    昨天 11:24
  • 签到天数: 602 天

    [LV.9]以坛为家II

    发表于 2013-4-29 08:40:37 | 显示全部楼层 |阅读模式
                     C#HttpHelper类1.3正式版教程与升级报告
    导读部分
    -------------------------------------------------------------------------------------------------------------
    C#HttpHelper类苏飞版--系列教程导航
    http://www.sufeinet.com/thread-3-1-1.html

                          本站是C#HttpHelper类唯一官方网站,唯一更新网站,希望大家收藏关注。
    1.升级报告

    1. 1.修正了在发生访问异常时对response.StatusCode!=null的检测
    2. 2.因为【myde520】的反馈,修正了取编码格式时的Bug(当编码中有空格时会报错),为此表示感谢
    3. 3.增加Url转码与解码的方法
    4. 4.修改当设置编码时不进行Copy方法的执行,因为这是没有必要的,会影响性能,感谢xlj_qq的建议
    5. 5.代理带端口的无法连接Bug  xiaotianbao  Eagle changlei  感谢他们提供的建议
    6. 6. //得到返回的HTML
    7. 这个问题目前还没有想到解决的办法,希望大家一起来想想办法看看怎么解决类似的问题

    8.                     result.Html = encoding.GetString(RawResponse).ToString();
    9. 加一个.ToString()方法,在文本中出现|的时候会显示不全,其实内容是完整的,这个问题感谢kidsoft的反馈
    10. 反馈过程http://www.sufeinet.com/thread-2398-1-1.html
    复制代码
    2.HttpHelper1.3正式版下载

    下载地址http://www.sufeinet.com/thread-3-1-1.html
    在线测试工具:http://www.sufeinet.com/thread-3690-1-1.html
    专用Cookie分析类http://www.sufeinet.com/thread-2382-1-1.html
    要学习更多关于C# Http的请是看我的文章 C# HttpWebRequest 绝技
    代码如下所示
    [C#] 纯文本查看 复制代码
    /// <summary>
    /// 类说明:HttpHelps类,用来实现Http访问,Post或者Get方式的,直接访问,带Cookie的,带证书的等方式,可以设置代理
    /// 重要提示:请不要自行修改本类,如果因为你自己修改后将无法升级到新版本。如果确实有什么问题请到官方网站提建议,
    /// 我们一定会及时修改
    /// 编码日期:2011-09-20
    /// 编 码 人:苏飞
    /// 联系方式:361983679  
    /// 官方网址:[url=http://www.sufeinet.com/thread-3-1-1.html]http://www.sufeinet.com/thread-3-1-1.html[/url]
    /// 修改日期:2013-04-29
    /// </summary>
    using System;
    using System.Collections.Generic;
    using System.Text;
    using System.Net;
    using System.IO;
    using System.Text.RegularExpressions;
    using System.IO.Compression;
    using System.Security.Cryptography.X509Certificates;
    using System.Net.Security;
    
    namespace DotNet.Utilities
    {
        /// <summary>
        /// Http连接操作帮助类
        /// </summary>
        public class HttpHelper
        {
            #region 预定义方法或者变更
            //默认的编码
            private Encoding encoding = Encoding.Default;
            //HttpWebRequest对象用来发起请求
            private HttpWebRequest request = null;
            //获取影响流的数据对象
            private HttpWebResponse response = null;
            /// <summary>
            /// 根据相传入的数据,得到相应页面数据
            /// </summary>
            /// <param name="objhttpitem">参数类对象</param>
            /// <returns>返回HttpResult类型</returns>
            private HttpResult GetHttpRequestData(HttpItem objhttpitem)
            {
                //返回参数
                HttpResult result = new HttpResult();
                try
                {
                    #region 得到请求的response
                    using (response = (HttpWebResponse)request.GetResponse())
                    {
                        result.StatusCode = response.StatusCode;
                        result.StatusDescription = response.StatusDescription;
                        result.Header = response.Headers;
                        if (response.Cookies != null)
                            result.CookieCollection = response.Cookies;
                        if (response.Headers["set-cookie"] != null)
                            result.Cookie = response.Headers["set-cookie"];
                        MemoryStream _stream = new MemoryStream();
                        //GZIIP处理
                        if (response.ContentEncoding != null && response.ContentEncoding.Equals("gzip", StringComparison.InvariantCultureIgnoreCase))
                        {
                            //开始读取流并设置编码方式
                            //new GZipStream(response.GetResponseStream(), CompressionMode.Decompress).CopyTo(_stream, 10240);
                            //.net4.0以下写法
                            _stream = GetMemoryStream(new GZipStream(response.GetResponseStream(), CompressionMode.Decompress));
                        }
                        else
                        {
                            //开始读取流并设置编码方式
                            //response.GetResponseStream().CopyTo(_stream, 10240);
                            //.net4.0以下写法
                            _stream = GetMemoryStream(response.GetResponseStream());
                        }
                        //获取Byte
                        byte[] RawResponse = _stream.ToArray();
                        _stream.Close();
                        //是否返回Byte类型数据
                        if (objhttpitem.ResultType == ResultType.Byte)
                            result.ResultByte = RawResponse;
                        //从这里开始我们要无视编码了
                        if (encoding == null)
                        {
                            Match meta = Regex.Match(Encoding.Default.GetString(RawResponse), "<meta([^<]*)charset=([^<]*)[\"']", RegexOptions.IgnoreCase);
                            string charter = (meta.Groups.Count > 2) ? meta.Groups[2].Value.ToLower() : string.Empty;
                            charter = charter.Replace("\"", "").Replace("'", "").Replace(";", "").Replace("iso-8859-1", "gbk");
                            if (charter.Length > 2)
                                encoding = Encoding.GetEncoding(charter.Trim());
                            else
                            {
                                if (string.IsNullOrEmpty(response.CharacterSet))
                                    encoding = Encoding.UTF8;
                                else
                                    encoding = Encoding.GetEncoding(response.CharacterSet);
                            }
                        }
                        //得到返回的HTML
                        result.Html = encoding.GetString(RawResponse);
                    }
                    #endregion
                }
                catch (WebException ex)
                {
                    //这里是在发生异常时返回的错误信息
                    response = (HttpWebResponse)ex.Response;
                    result.Html = ex.Message;
                    if (response!= null)
                    {
                        result.StatusCode = response.StatusCode;
                        result.StatusDescription = response.StatusDescription;
                    }
                }
                catch (Exception ex)
                {
                    result.Html = ex.Message;
                }
                if (objhttpitem.IsToLower)
                    result.Html = result.Html.ToLower();
    
                return result;
            }
            /// <summary>
            /// 4.0以下.net版本取数据使用
            /// </summary>
            /// <param name="streamResponse">流</param>
            private static MemoryStream GetMemoryStream(Stream streamResponse)
            {
                MemoryStream _stream = new MemoryStream();
                int Length = 256;
                Byte[] buffer = new Byte[Length];
                int bytesRead = streamResponse.Read(buffer, 0, Length);
                // write the required bytes  
                while (bytesRead > 0)
                {
                    _stream.Write(buffer, 0, bytesRead);
                    bytesRead = streamResponse.Read(buffer, 0, Length);
                }
                return _stream;
            }
            /// <summary>
            /// 为请求准备参数
            /// </summary>
            ///<param name="objhttpItem">参数列表</param>
            /// <param name="_Encoding">读取数据时的编码方式</param>
            private void SetRequest(HttpItem objhttpItem)
            {
                // 验证证书
                SetCer(objhttpItem);
                //设置Header参数
                if (objhttpItem.Header != null && objhttpItem.Header.Count > 0)
                {
                    foreach (string item in objhttpItem.Header.AllKeys)
                    {
                        request.Headers.Add(item, objhttpItem.Header[item]);
                    }
                }
                // 设置代理
                SetProxy(objhttpItem);
                //请求方式Get或者Post
                request.Method = objhttpItem.Method;
                request.Timeout = objhttpItem.Timeout;
                request.ReadWriteTimeout = objhttpItem.ReadWriteTimeout;
                //Accept
                request.Accept = objhttpItem.Accept;
                //ContentType返回类型
                request.ContentType = objhttpItem.ContentType;
                //UserAgent客户端的访问类型,包括浏览器版本和操作系统信息
                request.UserAgent = objhttpItem.UserAgent;
                // 编码
                encoding = objhttpItem.Encoding;
                //设置Cookie
                SetCookie(objhttpItem);
                //来源地址
                request.Referer = objhttpItem.Referer;
                //是否执行跳转功能
                request.AllowAutoRedirect = objhttpItem.Allowautoredirect;
                //设置Post数据
                SetPostData(objhttpItem);
                //设置最大连接
                if (objhttpItem.Connectionlimit > 0)
                    request.ServicePoint.ConnectionLimit = objhttpItem.Connectionlimit;
            }
            /// <summary>
            /// 设置证书
            /// </summary>
            /// <param name="objhttpItem"></param>
            private void SetCer(HttpItem objhttpItem)
            {
                if (!string.IsNullOrEmpty(objhttpItem.CerPath))
                {
                    //这一句一定要写在创建连接的前面。使用回调的方法进行证书验证。
                    ServicePointManager.ServerCertificateValidationCallback = new System.Net.Security.RemoteCertificateValidationCallback(CheckValidationResult);
                    //初始化对像,并设置请求的URL地址
                    request = (HttpWebRequest)WebRequest.Create(objhttpItem.URL);
                    //将证书添加到请求里
                    request.ClientCertificates.Add(new X509Certificate(objhttpItem.CerPath));
                }
                else
                    //初始化对像,并设置请求的URL地址
                    request = (HttpWebRequest)WebRequest.Create(objhttpItem.URL);
            }
            /// <summary>
            /// 设置Cookie
            /// </summary>
            /// <param name="objhttpItem">Http参数</param>
            private void SetCookie(HttpItem objhttpItem)
            {
                if (!string.IsNullOrEmpty(objhttpItem.Cookie))
                    //Cookie
                    request.Headers[HttpRequestHeader.Cookie] = objhttpItem.Cookie;
                //设置Cookie
                if (objhttpItem.CookieCollection != null)
                {
                    request.CookieContainer = new CookieContainer();
                    request.CookieContainer.Add(objhttpItem.CookieCollection);
                }
            }
            /// <summary>
            /// 设置Post数据
            /// </summary>
            /// <param name="objhttpItem">Http参数</param>
            private void SetPostData(HttpItem objhttpItem)
            {
                //验证在得到结果时是否有传入数据
                if (request.Method.Trim().ToLower().Contains("post"))
                {
                    byte[] buffer = null;
                    //写入Byte类型
                    if (objhttpItem.PostDataType == PostDataType.Byte && objhttpItem.PostdataByte != null && objhttpItem.PostdataByte.Length > 0)
                    {
                        //验证在得到结果时是否有传入数据
                        buffer = objhttpItem.PostdataByte;
                    }//写入文件
                    else if (objhttpItem.PostDataType == PostDataType.FilePath && !string.IsNullOrEmpty(objhttpItem.Postdata))
                    {
                        StreamReader r = new StreamReader(objhttpItem.Postdata, encoding);
                        buffer = Encoding.Default.GetBytes(r.ReadToEnd());
                        r.Close();
                    } //写入字符串
                    else if (!string.IsNullOrEmpty(objhttpItem.Postdata))
                    {
                        buffer = Encoding.Default.GetBytes(objhttpItem.Postdata);
                    }
                    if (buffer != null)
                    {
                        request.ContentLength = buffer.Length;
                        request.GetRequestStream().Write(buffer, 0, buffer.Length);
                    }
                }
            }
            /// <summary>
            /// 设置代理
            /// </summary>
            /// <param name="objhttpItem">参数对象</param>
            private void SetProxy(HttpItem objhttpItem)
            {
                if (!string.IsNullOrEmpty(objhttpItem.ProxyIp))
                {
                    //设置代理服务器
                    if (objhttpItem.ProxyIp.Contains(":"))
                    {
                        string[] plist = objhttpItem.ProxyIp.Split(':');
                        WebProxy myProxy = new WebProxy(plist[0].Trim(), Convert.ToInt32(plist[1].Trim()));
                        //建议连接
                        myProxy.Credentials = new NetworkCredential(objhttpItem.ProxyUserName, objhttpItem.ProxyPwd);
                        //给当前请求对象
                        request.Proxy = myProxy;
                    }
                    else
                    {
                        WebProxy myProxy = new WebProxy(objhttpItem.ProxyIp, false);
                        //建议连接
                        myProxy.Credentials = new NetworkCredential(objhttpItem.ProxyUserName, objhttpItem.ProxyPwd);
                        //给当前请求对象
                        request.Proxy = myProxy;
                    }
                    //设置安全凭证
                    request.Credentials = CredentialCache.DefaultNetworkCredentials;
                }
            }
    
            /// <summary>
            /// 回调验证证书问题
            /// </summary>
            /// <param name="sender">流对象</param>
            /// <param name="certificate">证书</param>
            /// <param name="chain">X509Chain</param>
            /// <param name="errors">SslPolicyErrors</param>
            /// <returns>bool</returns>
            public bool CheckValidationResult(object sender, X509Certificate certificate, X509Chain chain, SslPolicyErrors errors)
            {
                // 总是接受    
                return true;
            }
            #endregion
            #region 普通类型
            ///<summary>
            ///采用https协议访问网络,根据传入的URl地址,得到响应的数据字符串。
            ///</summary>
            ///<param name="objhttpItem">参数列表</param>
            ///<returns>String类型的数据</returns>
            public HttpResult GetHtml(HttpItem objhttpItem)
            {
                try
                {
                    //准备参数
                    SetRequest(objhttpItem);
                }
                catch (Exception ex)
                {
                    HttpResult Result = new HttpResult()
                    {
                        Cookie = "",
                        Header = null,
                        Html = ex.Message,
                        StatusDescription = "配置参考时报错"
                    };
                    return Result;
                }
                //调用专门读取数据的类
                return GetHttpRequestData(objhttpItem);
            }
            #endregion
        }
        /// <summary>
        /// Http请求参考类
        /// </summary>
        public class HttpItem
        {
            string _URL = string.Empty;
            /// <summary>
            /// 请求URL必须填写
            /// </summary>
            public string URL
            {
                get { return _URL; }
                set { _URL = value; }
            }
            string _Method = "GET";
            /// <summary>
            /// 请求方式默认为GET方式,当为POST方式时必须设置Postdata的值
            /// </summary>
            public string Method
            {
                get { return _Method; }
                set { _Method = value; }
            }
            int _Timeout = 100000;
            /// <summary>
            /// 默认请求超时时间
            /// </summary>
            public int Timeout
            {
                get { return _Timeout; }
                set { _Timeout = value; }
            }
            int _ReadWriteTimeout = 30000;
            /// <summary>
            /// 默认写入Post数据超时间
            /// </summary>
            public int ReadWriteTimeout
            {
                get { return _ReadWriteTimeout; }
                set { _ReadWriteTimeout = value; }
            }
            string _Accept = "text/html, application/xhtml+xml, */*";
            /// <summary>
            /// 请求标头值 默认为text/html, application/xhtml+xml, */*
            /// </summary>
            public string Accept
            {
                get { return _Accept; }
                set { _Accept = value; }
            }
            string _ContentType = "text/html";
            /// <summary>
            /// 请求返回类型默认 text/html
            /// </summary>
            public string ContentType
            {
                get { return _ContentType; }
                set { _ContentType = value; }
            }
            string _UserAgent = "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0)";
            /// <summary>
            /// 客户端访问信息默认Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0)
            /// </summary>
            public string UserAgent
            {
                get { return _UserAgent; }
                set { _UserAgent = value; }
            }
            Encoding _Encoding = null;
            /// <summary>
            /// 返回数据编码默认为NUll,可以自动识别,一般为utf-8,gbk,gb2312
            /// </summary>
            public Encoding Encoding
            {
                get { return _Encoding; }
                set { _Encoding = value; }
            }
            private PostDataType _PostDataType = PostDataType.String;
            /// <summary>
            /// Post的数据类型
            /// </summary>
            public PostDataType PostDataType
            {
                get { return _PostDataType; }
                set { _PostDataType = value; }
            }
            string _Postdata = string.Empty;
            /// <summary>
            /// Post请求时要发送的字符串Post数据
            /// </summary>
            public string Postdata
            {
                get { return _Postdata; }
                set { _Postdata = value; }
            }
            private byte[] _PostdataByte = null;
            /// <summary>
            /// Post请求时要发送的Byte类型的Post数据
            /// </summary>
            public byte[] PostdataByte
            {
                get { return _PostdataByte; }
                set { _PostdataByte = value; }
            }
            CookieCollection cookiecollection = null;
            /// <summary>
            /// Cookie对象集合
            /// </summary>
            public CookieCollection CookieCollection
            {
                get { return cookiecollection; }
                set { cookiecollection = value; }
            }
            string _Cookie = string.Empty;
            /// <summary>
            /// 请求时的Cookie
            /// </summary>
            public string Cookie
            {
                get { return _Cookie; }
                set { _Cookie = value; }
            }
            string _Referer = string.Empty;
            /// <summary>
            /// 来源地址,上次访问地址
            /// </summary>
            public string Referer
            {
                get { return _Referer; }
                set { _Referer = value; }
            }
            string _CerPath = string.Empty;
            /// <summary>
            /// 证书绝对路径
            /// </summary>
            public string CerPath
            {
                get { return _CerPath; }
                set { _CerPath = value; }
            }
            private Boolean isToLower = false;
            /// <summary>
            /// 是否设置为全文小写,默认为不转化
            /// </summary>
            public Boolean IsToLower
            {
                get { return isToLower; }
                set { isToLower = value; }
            }
            private Boolean allowautoredirect = false;
            /// <summary>
            /// 支持跳转页面,查询结果将是跳转后的页面,默认是不跳转
            /// </summary>
            public Boolean Allowautoredirect
            {
                get { return allowautoredirect; }
                set { allowautoredirect = value; }
            }
            private int connectionlimit = 1024;
            /// <summary>
            /// 最大连接数
            /// </summary>
            public int Connectionlimit
            {
                get { return connectionlimit; }
                set { connectionlimit = value; }
            }
            private string proxyusername = string.Empty;
            /// <summary>
            /// 代理Proxy 服务器用户名
            /// </summary>
            public string ProxyUserName
            {
                get { return proxyusername; }
                set { proxyusername = value; }
            }
            private string proxypwd = string.Empty;
            /// <summary>
            /// 代理 服务器密码
            /// </summary>
            public string ProxyPwd
            {
                get { return proxypwd; }
                set { proxypwd = value; }
            }
            private string proxyip = string.Empty;
            /// <summary>
            /// 代理 服务IP
            /// </summary>
            public string ProxyIp
            {
                get { return proxyip; }
                set { proxyip = value; }
            }
            private ResultType resulttype = ResultType.String;
            /// <summary>
            /// 设置返回类型String和Byte
            /// </summary>
            public ResultType ResultType
            {
                get { return resulttype; }
                set { resulttype = value; }
            }
            private WebHeaderCollection header = new WebHeaderCollection();
            //header对象
            public WebHeaderCollection Header
            {
                get { return header; }
                set { header = value; }
            }
        }
        /// <summary>
        /// Http返回参数类
        /// </summary>
        public class HttpResult
        {
            string _Cookie = string.Empty;
            /// <summary>
            /// Http请求返回的Cookie
            /// </summary>
            public string Cookie
            {
                get { return _Cookie; }
                set { _Cookie = value; }
            }
            CookieCollection cookiecollection = new CookieCollection();
            /// <summary>
            /// Cookie对象集合
            /// </summary>
            public CookieCollection CookieCollection
            {
                get { return cookiecollection; }
                set { cookiecollection = value; }
            }
            private string html = string.Empty;
            /// <summary>
            /// 返回的String类型数据 只有ResultType.String时才返回数据,其它情况为空
            /// </summary>
            public string Html
            {
                get { return html; }
                set { html = value; }
            }
            private byte[] resultbyte = null;
            /// <summary>
            /// 返回的Byte数组 只有ResultType.Byte时才返回数据,其它情况为空
            /// </summary>
            public byte[] ResultByte
            {
                get { return resultbyte; }
                set { resultbyte = value; }
            }
            private WebHeaderCollection header = new WebHeaderCollection();
            //header对象
            public WebHeaderCollection Header
            {
                get { return header; }
                set { header = value; }
            }
            private string statusDescription = "";
            /// <summary>
            /// 返回状态说明
            /// </summary>
            public string StatusDescription
            {
                get { return statusDescription; }
                set { statusDescription = value; }
            }
            private HttpStatusCode statusCode = HttpStatusCode.OK;
            /// <summary>
            /// 返回状态码,默认为OK
            /// </summary>
            public HttpStatusCode StatusCode
            {
                get { return statusCode; }
                set { statusCode = value; }
            }
        }
        /// <summary>
        /// 返回类型
        /// </summary>
        public enum ResultType
        {
            /// <summary>
            /// 表示只返回字符串 只有Html有数据
            /// </summary>
            String,
            /// <summary>
            /// 表示返回字符串和字节流 ResultByte和Html都有数据返回
            /// </summary>
            Byte
        }
        /// <summary>
        /// Post的数据格式默认为string
        /// </summary>
        public enum PostDataType
        {
            /// <summary>
            /// 字符串类型,这时编码Encoding可不设置
            /// </summary>
            String,
            /// <summary>
            /// Byte类型,需要设置PostdataByte参数的值编码Encoding可设置为空
            /// </summary>
            Byte,
            /// <summary>
            /// 传文件,Postdata必须设置为文件的绝对路径,必须设置Encoding的值
            /// </summary>
            FilePath
        }
    }

    3.HttpHelper类使用方法

    使用方法如下
    [C#] 纯文本查看 复制代码
     HttpHelper http = new HttpHelper();
                HttpItem item = new HttpItem()
                {
                    URL = "http://www.sufeinet.com",//URL     必需项
                    Encoding = null,//编码格式(utf-8,gb2312,gbk)     可选项 默认类会自动识别
                    //Encoding = Encoding.Default,
                    Method = "get",//URL     可选项 默认为Get
                    Timeout = 100000,//连接超时时间     可选项默认为100000
                    ReadWriteTimeout = 30000,//写入Post数据超时时间     可选项默认为30000
                    IsToLower = false,//得到的HTML代码是否转成小写     可选项默认转小写
                    Cookie = "",//字符串Cookie     可选项
                    UserAgent = "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0)",//用户的浏览器类型,版本,操作系统     可选项有默认值
                    Accept = "text/html, application/xhtml+xml, */*",//    可选项有默认值
                    ContentType = "text/html",//返回类型    可选项有默认值
                    Referer = "http://www.sufeinet.com",//来源URL     可选项
                    Allowautoredirect = true,//是否根据301跳转     可选项
                    CerPath = "d:\\123.cer",//证书绝对路径     可选项不需要证书时可以不写这个参数
                    Connectionlimit = 1024,//最大连接数     可选项 默认为1024
                    Postdata = "C:\\PERKYSU_20121129150608_ScrubLog.txt",//Post数据     可选项GET时不需要写
                    PostDataType = PostDataType.FilePath,//默认为传入String类型,也可以设置PostDataType.Byte传入Byte类型数据
                    ProxyIp = "192.168.1.105:8015",//代理服务器ID 端口可以直接加到后面以:分开就行了    可选项 不需要代理 时可以不设置这三个参数
                    ProxyPwd = "123456",//代理服务器密码     可选项
                    ProxyUserName = "administrator",//代理服务器账户名     可选项
                    ResultType = ResultType.Byte,//返回数据类型,是Byte还是String
                    PostdataByte = System.Text.Encoding.Default.GetBytes("测试一下"),//如果PostDataType为Byte时要设置本属性的值
                    CookieCollection = new System.Net.CookieCollection(),//可以直接传一个Cookie集合进来
                };
                item.Header.Add("测试Key1", "测试Value1");
                item.Header.Add("测试Key2", "测试Value2");
                //得到HTML代码
                HttpResult result = http.GetHtml(item);
                //取出返回的Cookie
                string cookie = result.Cookie;
                //返回的Html内容
                string html = result.Html;
                if (result.StatusCode == System.Net.HttpStatusCode.OK)
                {
                    //表示访问成功,具体的大家就参考HttpStatusCode类
                }
                //表示StatusCode的文字说明与描述
                string statusCodeDescription = result.StatusDescription;
                //把得到的Byte转成图片
                Image img = byteArrayToImage(result.ResultByte);
            }
            /// <summary>
            /// 字节数组生成图片
            /// </summary>
            /// <param name="Bytes">字节数组</param>
            /// <returns>图片</returns>
            private Image byteArrayToImage(byte[] Bytes)
            {
                using (MemoryStream ms = new MemoryStream(Bytes))
                {
                    Image outputImg = Image.FromStream(ms);
                    return outputImg;
                }
            }

    本例子是一个统一的标准写法,大家可以根据需要自行修改,在下面还会有对特定功能的说明请大家继续看
    4.最简单的Post与Get的写法

    [C#] 纯文本查看 复制代码
     HttpHelper http = new HttpHelper();
                HttpItem item = new HttpItem()
                {
                    URL = "http://www.sufeinet.com",//URL这里都是测试     必需项
                    Method = "get",//URL     可选项 默认为Get
                };
                //得到HTML代码
                HttpResult result = http.GetHtml(item);
                item = new HttpItem()
               {
                   URL = "http://tool.sufeinet.com",//URL这里都是测试URl   必需项
                   Encoding = null,//编码格式(utf-8,gb2312,gbk)     可选项 默认类会自动识别
                   //Encoding = Encoding.Default,
                   Method = "post",//URL     可选项 默认为Get
                   Postdata = "user=123123&pwd=1231313"
               };
                //得到新的HTML代码
                result = http.GetHtml(item);

    5.HttpHelper设置Header参考的方法

    [C#] 纯文本查看 复制代码
      HttpHelper http = new HttpHelper();
                HttpItem item = new HttpItem()
                {
                    URL = "http://www.sufeinet.com",//URL     必需项
                    Encoding = null,//编码格式(utf-8,gb2312,gbk)     可选项 默认类会自动识别
                     //Encoding = Encoding.Default,
                    Method = "get",//URL     可选项 默认为Get
                };
                item.Header.Add("测试Key1", "测试Value1");
                item.Header.Add("测试Key2", "测试Value2");
                //得到HTML代码
                HttpResult result = http.GetHtml(item);
                //取出返回的Cookie
                string cookie = result.Cookie;
                //返回的Html内容
                string html = result.Html;
                if (result.StatusCode == System.Net.HttpStatusCode.OK)
                {
                    //表示访问成功,具体的大家就参考HttpStatusCode类
                }
                //表示StatusCode的文字说明与描述
                string statusCodeDescription = result.StatusDescription;



    下面我列出一些不能直接Add的参数
    6.HttpHelper获取图片的方式
    [C#] 纯文本查看 复制代码
      HttpHelper http = new HttpHelper();
                HttpItem item = new HttpItem()
                {
                    URL = "http://www.sufeinet.com",//URL     必需项
                    Encoding = null,//编码格式(utf-8,gb2312,gbk)     可选项 默认类会自动识别
                    //Encoding = Encoding.Default,
                    ResultType = ResultType.Byte
                };
                //得到HTML代码
                HttpResult result = http.GetHtml(item);
                if (result.StatusCode == System.Net.HttpStatusCode.OK)
                {
                    //表示访问成功,具体的大家就参考HttpStatusCode类
                }
                //表示StatusCode的文字说明与描述
                string statusCodeDescription = result.StatusDescription;
                //把得到的Byte转成图片
                Image img = byteArrayToImage(result.ResultByte);
            }
    
            /// <summary>
            /// 字节数组生成图片
            /// </summary>
            /// <param name="Bytes">字节数组</param>
            /// <returns>图片</returns>
            private Image byteArrayToImage(byte[] Bytes)
            {
                using (MemoryStream ms = new MemoryStream(Bytes))
                {
                    Image outputImg = Image.FromStream(ms);
                    return outputImg;
                }
            }

    7.二次或多次使用Cookie的方式

    [C#] 纯文本查看 复制代码
      HttpHelper http = new HttpHelper();
                HttpItem item = new HttpItem()
                {
                    URL = "http://www.sufeinet.com",//URL这里都是测试     必需项
                    Encoding = null,//编码格式(utf-8,gb2312,gbk)     可选项 默认类会自动识别
                    //Encoding = Encoding.Default,
                    Method = "get",//URL     可选项 默认为Get
                };
                //得到HTML代码
                HttpResult result = http.GetHtml(item);
                item = new HttpItem()
               {
                   URL = "http://tool.sufeinet.com",//URL这里都是测试URl   必需项
                   Encoding = null,//编码格式(utf-8,gb2312,gbk)     可选项 默认类会自动识别
                   //Encoding = Encoding.Default,
                   Method = "get",//URL     可选项 默认为Get
                   Cookie = result.Cookie,
               };
                //得到新的HTML代码
                result = http.GetHtml(item);

    大家有什么问题请回复我吧

    本帖被以下淘专辑推荐:

    该用户从未签到

    发表于 2013-4-29 09:11:04 | 显示全部楼层
  • TA的每日心情
    无聊
    2017-5-29 20:14
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2013-4-30 17:43:54 | 显示全部楼层
    我在做QQ邮箱登录的时候 也是用的这个方法,但是总是会返回  ptuiCB('7','0','','0','很遗憾,网络连接出现异常,请您稍后再试。(2567963424)', '10000');

    第一次获取到验证码的cookies 然后带上cookies去访问第二个登录链接,这个思路应该没问题的吧。。
  • TA的每日心情
    无聊
    2017-5-29 20:14
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 2013-4-30 17:45:20 | 显示全部楼层
    额  我说的是第7~
    二次或多次使用Cookie的方式。。

    点评

    有问题请发新贴  详情 回复 发表于 2013-5-1 07:11
    有问题请发新贴  详情 回复 发表于 2013-5-1 07:10
  • TA的每日心情
    开心
    昨天 11:24
  • 签到天数: 602 天

    [LV.9]以坛为家II

     楼主| 发表于 2013-5-1 07:10:50 | 显示全部楼层
    yyhapy 发表于 2013-4-30 17:45
    额  我说的是第7~
    二次或多次使用Cookie的方式。。

    有问题请发新贴
  • TA的每日心情
    开心
    昨天 11:24
  • 签到天数: 602 天

    [LV.9]以坛为家II

     楼主| 发表于 2013-5-1 07:11:52 | 显示全部楼层
    yyhapy 发表于 2013-4-30 17:45
    额  我说的是第7~
    二次或多次使用Cookie的方式。。

    有问题请发新贴

    该用户从未签到

    发表于 2013-5-4 14:39:03 | 显示全部楼层
    BUG

    警告        1        由于“System.Net.HttpStatusCode”类型的值永不等于“System.Net.HttpStatusCode?”类型的“null”,该表达式的结果始终为“true”         

      if (response.StatusCode != null)
                    {
                        result.StatusCode = response.StatusCode;
                        result.StatusDescription = response.StatusDescription;
                    }
    条件始终成立的

    这句写的无意义了吧。升级头条就是这样

    点评

    呵呵,写错参数了,感谢你的反馈  详情 回复 发表于 2013-5-4 19:48
  • TA的每日心情
    开心
    昨天 11:24
  • 签到天数: 602 天

    [LV.9]以坛为家II

     楼主| 发表于 2013-5-4 19:48:37 | 显示全部楼层
    ReEnter 发表于 2013-5-4 14:39
    BUG

    警告        1        由于“System.Net.HttpStatusCode”类型的值永不等于“System.Net.HttpStatusCode?”类型的 ...

    呵呵,写错参数了,感谢你的反馈
  • TA的每日心情
    擦汗
    2018-2-5 13:29
  • 签到天数: 9 天

    [LV.3]偶尔看看II

    发表于 2013-5-16 19:42:07 | 显示全部楼层

    该用户从未签到

    发表于 2013-5-24 13:27:40 | 显示全部楼层
    您好,用你这个能够抓取阿里巴巴数据嘛?阿里巴巴有限制,一会就要求输入验证码~这个怎么解决?
    您需要登录后才可以回帖 登录 | 马上注册

    本版积分规则

    QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备17001017号-1 )

    GMT+8, 2018-10-18 14:04

    © 2017-2018

    快速回复 返回顶部 返回列表