苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

分布式系统框架(V1.3) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper万能框架(V2.3-含.netcore) HttpHelper官方出品,无敌框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 最牛的爬虫类,没有爬不到只有想不到 源码 - 代码生成器 - 讨论区 - 教程- 例子

查看: 15220|回复: 8

[教程] 获取所有的Img(图片)对象(src、img、Html整个标签)并生成List对象

[复制链接]
发表于 2014-9-11 08:39:12 | 显示全部楼层 |阅读模式
导读部分

【HttpHelper万能框架】教程目录贴  http://www.sufeinet.com/thread-9989-1-1.html


教程部分


我们在得到一个网页时,里面肯定会有或多或少的A图片。那么我们怎么样获取这些图片呢。
现在我在Httphelper万能框架中加入一个方法,可以提取到所有的img标签,并以对象的方法显示给大家

对结构如下
[C#] 纯文本查看 复制代码
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;

namespace CsharpHttpHelper.Item
{
    /// <summary>
    /// 图片对象  Copyright:[url]http://www.httphelper.com/[/url]
    /// </summary>
   public class ImgItem
    {
       /// <summary>
       /// 图片网址
       /// </summary>
       public string Src { get; set; }
       /// <summary>
       /// 图片标签Html
       /// </summary>
       public string Html { get; set; }
    }
}


下面看看怎么通过Httphelper万能框架来提取所有的A链接吧。
引入命名空间
[C#] 纯文本查看 复制代码
using CsharpHttpHelper;
using CsharpHttpHelper.Item;

开始提取
[C#] 纯文本查看 复制代码
            //创建Httphelper对象
            HttpHelper http = new HttpHelper();
            //创建Httphelper参数对象
            HttpItem item = new HttpItem()
            {
                URL = "http://www.sufeinet.com",//URL     必需项    
                Method = "get",//URL     可选项 默认为Get   
                ContentType = "text/html",//返回类型    可选项有默认值   
                //ContentType = "application/x-www-form-urlencoded",//返回类型    可选项有默认值   
            };
            //请求的返回值对象
            HttpResult result = http.GetHtml(item);
            //获取请请求的Html
            string html = result.Html;


            List<ImgItem> imglist = HttpHelper.GetImgList(html);

看一下执行效果

QQ截图20140911083753.jpg
总共提取了131个图片。
而每一个都是有这个对象组成的。
这样大家再用起来会很方便,
有了这个大家就可以做一些关于图片方面的功能了。


发表于 2014-9-12 13:42:36 | 显示全部楼层
发表于 2014-10-17 10:06:42 | 显示全部楼层
发表于 2016-1-23 23:54:59 | 显示全部楼层
这个获取图片的正则表达式有问题,不能获取到所有的图片,应该使用
@"<img\b[^<>]*?\bsrc[\s\t\r\n]*=[\s\t\r\n]*[""']?[\s\t\r\n]*(?<imgUrl>[^\s\t\r\n""'<>]*)[^<>]*?/?[\s\t\r\n]*>";
发表于 2016-6-19 19:35:17 | 显示全部楼层
发表于 2016-8-16 16:24:59 | 显示全部楼层
很久没回来看了,来了之后依然是这么亲切,祝站长网站越来越好
发表于 2016-10-29 12:23:18 | 显示全部楼层
发表于 2016-10-29 13:26:34 | 显示全部楼层
发表于 2018-11-15 13:13:47 | 显示全部楼层
您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备17001017号-1)

GMT+8, 2019-10-21 18:17

© 2017-2018

快速回复 返回顶部 返回列表