http://www.sufeinet.com/plugin.php?id=keke_group

苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper爬虫框架(V2.7-含.netcore) HttpHelper官方出品,爬虫框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 开源的爬虫类,支持多种模式和属性 源码 - 代码生成器 - 讨论区 - 教程- 例子

查看: 3729|回复: 1

[Asp.Net] ASP.NET实现根据URL获取网站完整的页面内容

[复制链接]
发表于 2013-1-12 17:31:06 | 显示全部楼层 |阅读模式
今天主要是来说一下ASP.NET实现根据URL获取网站完整的页面内容,这种实现也可以用于实现获取网站的缩略图,获取网站的源码,获取网站的编码和Title等标签纸,本文只写出获得网站完整的内容,具体的大家可以自己扩展一下,我们可以进行深入交流,呵呵呵。
这个实现主要是用了ASP.NET的文件流形式实现,本文以获取http://www.zzdaohang.cn/ 的网站内容为例,进行说明。
写个测试页面,如下图:
  1. //获取相关编码,这里建议使用GB2312
  2.         Encoding code = Encoding.GetEncoding("gb2312");
  3.         StreamReader sr = null;
  4.         StreamWriter sw = null;
  5.         string str = null;

  6.         //根据URL读取远程路径
  7.         WebRequest temp = WebRequest.Create(txtUrl.Text.Trim());
  8.         WebResponse myTemp = temp.GetResponse();
  9.         sr = new StreamReader(myTemp.GetResponseStream(), code);
  10.         try
  11.         {
  12.             sr = new StreamReader(myTemp.GetResponseStream(), code);
  13.             str = sr.ReadToEnd();
  14.         }
  15.         catch (Exception ex)
  16.         {
  17.             throw ex;
  18.         }
  19.         finally
  20.         {
  21.             sr.Close();
  22.         }
  23.         //这里是按时间随机生成文件名称,当然也可以自己定义
  24.         string fileName = DateTime.Now.ToString("yyyyMMddHHmmss") + ".htm";
  25.         //写入,这里注意要写入的文件可以不存在,但是文件夹一定要存在
  26.         try
  27.         {
  28.             sw = new StreamWriter(Server.MapPath("url/") + fileName, false, code);
  29.             sw.Write(str);
  30.             sw.Flush();
  31.         }
  32.         catch (Exception ex)
  33.         {
  34.             throw ex;
  35.         }
  36.         finally
  37.         {
  38.             sw.Close();
  39.             Response.Write("测试结果!文件已经生成,并保存在url文件夹下!访问这个链接试试:<a href=url/" + fileName + " target=_blank>" + fileName + "</a>。");
  40.         }
复制代码
实现的结果进行访问测试,我截了图说明一下,大家可以看看,真的很完美,你也可以测试一下百度网址试一下,呵呵呵。站长站的首页被完整的抓去了过来,效果可以吧。


//*********代码创 建 人:youhaoxinqin                                ********//
//*********联 系  方式:QQ:417643479 邮箱:youhaoxinqin@sina.com     ********//


1. 开通SVIP会员,免费下载本站所有源码,不限次数据,不限时间
2. 加官方QQ群,加官方微信群获取更多资源和帮助
3. 找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
发表于 2013-1-12 18:17:04 | 显示全部楼层
您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备18043678号-2)

GMT+8, 2024-5-3 04:36

© 2014-2021

快速回复 返回顶部 返回列表