苏飞论坛

标题: 关于httphelper获取网页源码的问题 [打印本页]

作者: glayee    时间: 2015-4-3 15:11
标题: 关于httphelper获取网页源码的问题
获取的代码为什么都不是像 浏览器右键选择源代码的时候看到的 一行一行的代码
而是没有换行 一大串的代码呢?

[C#] 纯文本查看 复制代码
string mainTypeReg = "<div\\s*style=\"font-size:14px;\"><b><a\\s*?href=\"(?<value>.*?)\">(?<key>.*?)</a></b></div>";
            

            
            HttpHelper http = new HttpHelper();
            HttpItem item = new HttpItem()
            {
                URL = "http://www.newsmth.net/bbsdoc.php?board=DotNET&ftype=6",//URL     必需项   
                Method = "get",//URL     可选项 默认为Get   
                IsToLower = false,//得到的HTML代码是否转成小写     可选项默认转小写   
                Cookie = "",//字符串Cookie     可选项   
                Referer ="",//来源URL     可选项   
                Postdata = "",//Post数据     可选项GET时不需要写   
                Timeout = 100000,//连接超时时间     可选项默认为100000   
                ReadWriteTimeout = 30000,//写入Post数据超时时间     可选项默认为30000   
                UserAgent = "",//用户的浏览器类型,版本,操作系统     可选项有默认值   
                ContentType = "text/html",//返回类型    可选项有默认值   
                Allowautoredirect = false,//是否根据301跳转     可选项   
                //CerPath = "d:\123.cer",//证书绝对路径     可选项不需要证书时可以不写这个参数   
                //Connectionlimit = 1024,//最大连接数     可选项 默认为1024   
                ProxyIp = "",//代理服务器ID     可选项 不需要代理 时可以不设置这三个参数   
                //ProxyPwd = "123456",//代理服务器密码     可选项   
                //ProxyUserName = "administrator",//代理服务器账户名     可选项   
                ResultType = ResultType.String
            };
            HttpResult result = http.GetHtml(item);
            string html = result.Html;
            textBox1.Text = result.Html;


作者: 水手    时间: 2015-4-3 17:01
浏览器会自动处理编码问题(包括换行)好不~~
作者: glayee    时间: 2015-4-5 19:59
网站上那个助手 生成的网页代码就是换行的
我同样也是把代码放到textbox里 就是不换行的。。。
作者: myc#test    时间: 2018-8-31 10:25
用这个京东的秒杀,网页源码还是抓不全。




欢迎光临 苏飞论坛 (http://www.sufeinet.com/) Powered by Discuz! X3.4