http://www.sufeinet.com/plugin.php?id=keke_group

苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper爬虫框架(V2.7-含.netcore) HttpHelper官方出品,爬虫框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 开源的爬虫类,支持多种模式和属性 源码 - 代码生成器 - 讨论区 - 教程- 例子

查看: 31974|回复: 10

[教程] 获取所有的Img(图片)对象(src、img、Html整个标签)并生成List对象

[复制链接]
发表于 2014-9-11 08:39:12 | 显示全部楼层 |阅读模式
导读部分

【HttpHelper万能框架】教程目录贴  http://www.sufeinet.com/thread-9989-1-1.html


教程部分


我们在得到一个网页时,里面肯定会有或多或少的A图片。那么我们怎么样获取这些图片呢。
现在我在Httphelper万能框架中加入一个方法,可以提取到所有的img标签,并以对象的方法显示给大家

对结构如下
[C#] 纯文本查看 复制代码
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;

namespace CsharpHttpHelper.Item
{
    /// <summary>
    /// 图片对象  Copyright:[url]http://www.httphelper.com/[/url]
    /// </summary>
   public class ImgItem
    {
       /// <summary>
       /// 图片网址
       /// </summary>
       public string Src { get; set; }
       /// <summary>
       /// 图片标签Html
       /// </summary>
       public string Html { get; set; }
    }
}


下面看看怎么通过Httphelper万能框架来提取所有的A链接吧。
引入命名空间
[C#] 纯文本查看 复制代码
using CsharpHttpHelper;
using CsharpHttpHelper.Item;

开始提取
[C#] 纯文本查看 复制代码
            //创建Httphelper对象
            HttpHelper http = new HttpHelper();
            //创建Httphelper参数对象
            HttpItem item = new HttpItem()
            {
                URL = "http://www.sufeinet.com",//URL     必需项    
                Method = "get",//URL     可选项 默认为Get   
                ContentType = "text/html",//返回类型    可选项有默认值   
                //ContentType = "application/x-www-form-urlencoded",//返回类型    可选项有默认值   
            };
            //请求的返回值对象
            HttpResult result = http.GetHtml(item);
            //获取请请求的Html
            string html = result.Html;


            List<ImgItem> imglist = HttpHelper.GetImgList(html);

看一下执行效果

QQ截图20140911083753.jpg
总共提取了131个图片。
而每一个都是有这个对象组成的。
这样大家再用起来会很方便,
有了这个大家就可以做一些关于图片方面的功能了。




1. 开通SVIP会员,免费下载本站所有源码,不限次数据,不限时间
2. 加官方QQ群,加官方微信群获取更多资源和帮助
3. 找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
发表于 2014-9-12 13:42:36 | 显示全部楼层
受教了学习中……
发表于 2014-10-17 10:06:42 | 显示全部楼层
强烈支持楼主ing……
发表于 2016-1-23 23:54:59 | 显示全部楼层
这个获取图片的正则表达式有问题,不能获取到所有的图片,应该使用
@"<img\b[^<>]*?\bsrc[\s\t\r\n]*=[\s\t\r\n]*[""']?[\s\t\r\n]*(?<imgUrl>[^\s\t\r\n""'<>]*)[^<>]*?/?[\s\t\r\n]*>";
发表于 2016-6-19 19:35:17 | 显示全部楼层
我只是路过打酱油的。
发表于 2016-8-16 16:24:59 | 显示全部楼层
很久没回来看了,来了之后依然是这么亲切,祝站长网站越来越好
发表于 2016-10-29 12:23:18 | 显示全部楼层
若是获取<tr><td>的话该怎么获取啊 ?
发表于 2016-10-29 13:26:34 | 显示全部楼层
强烈支持楼主ing……
发表于 2018-11-15 13:13:47 | 显示全部楼层
接下来就是下载图片了
发表于 2020-3-9 17:25:33 | 显示全部楼层
获取图片地址后,因为图片地址可能是相对路径,那么如何获取图片的完全路径呢?
您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备18043678号-2)

GMT+8, 2024-12-10 22:49

© 2014-2021

快速回复 返回顶部 返回列表