http://www.sufeinet.com/plugin.php?id=keke_group

苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper爬虫框架(V2.7-含.netcore) HttpHelper官方出品,爬虫框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 开源的爬虫类,支持多种模式和属性 源码 - 代码生成器 - 讨论区 - 教程- 例子

查看: 3478|回复: 3

[HttpHelper] 怎么解析百度的跳转连接??

[复制链接]
发表于 2018-3-10 20:35:45 | 显示全部楼层 |阅读模式
怎么解析百度的跳转连接??

http://www.baidu.com/link?url=_s ... f16000000035aa3d111




解析玩:www.sufeinet.com



1. 开通SVIP会员,免费下载本站所有源码,不限次数据,不限时间
2. 加官方QQ群,加官方微信群获取更多资源和帮助
3. 找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
发表于 2018-3-12 08:22:34 | 显示全部楼层
用框架取301后的地址就行了。
这个基本没有办法直接解析出来的
发表于 2018-3-12 08:24:42 | 显示全部楼层
[C#] 纯文本查看 复制代码
HttpHelper http = new HttpHelper();
HttpItem item = new HttpItem()
{
    URL = "http://www.baidu.com/link?url=_sERcBsTCgKElwFi7Hf9FVsM7Je48F6oFXsxpX_OJGzAdKsZCFKXSMVNVess4vhU&wd=&eqid=b346669000072f16000000035aa3d111",//URL     必需项
    Method = "GET",//URL     可选项 默认为Get
    Referer ="http://www.baidu.com/link?url=_sERcBsTCgKElwFi7Hf9FVsM7Je48F6oFXsxpX_OJGzAdKsZCFKXSMVNVess4vhU&wd=&eqid=b346669000072f16000000035aa3d111",//来源URL     可选项
    Allowautoredirect = False,//是否根据301跳转     可选项

};
HttpResult result = http.GetHtml(item);
string html = result.Html;
string cookie = result.Cookie;



返回的Html如下
[HTML] 纯文本查看 复制代码
<meta content="always" name="referrer"><script>try{if(window.opener&&window.opener.bds&&window.opener.bds.pdc&&window.opener.bds.pdc.sendLinkLog){window.opener.bds.pdc.sendLinkLog();}}catch(e) {};var timeout = 0;if(/bdlksmp/.test(window.location.href)){var reg = /bdlksmp=([^=&]+)/,matches = window.location.href.match(reg);timeout = matches[1] ? matches[1] : 0};setTimeout(function(){window.location.replace("http://www.sufeinet.com/")},timeout);window.opener=null;</script>
<noscript><META http-equiv="refresh" content="0;URL='http://www.sufeinet.com/'"></noscript>


直接提取window.location.replace("http://www.sufeinet.com/")}的值就行了。
发表于 2018-3-12 22:15:38 | 显示全部楼层
路过学习下
您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备18043678号-2)

GMT+8, 2024-6-5 12:33

© 2014-2021

快速回复 返回顶部 返回列表