苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper爬虫框架(V2.4-含.netcore) HttpHelper官方出品,爬虫框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 开源的爬虫类,支持多种模式和属性 源码 - 代码生成器 - 讨论区 - 教程- 例子

查看: 10765|回复: 5

[教程] 【HttpHelper万能框架教程】过滤所有的html标签

[复制链接]
发表于 2014-9-11 09:28:17 | 显示全部楼层 |阅读模式
导读部分

【HttpHelper万能框架】教程目录贴  http://www.sufeinet.com/thread-9989-1-1.html


教程部分


在开发过程中,我们时不时的会用到要过滤Html标签的功能。为了方便大家使用,我把这个方法集成到了万能框架中。方便大家调用。

方法签名如下
[C#] 纯文本查看 复制代码
  /// <summary>
        /// 过滤html标签
        /// </summary>
        /// <param name="html">html的内容</param>
        /// <returns>处理后的文本</returns>
        public static string StripHTML(string html)


直接输入Html,就会返回过滤后的数据
看代码
[C#] 纯文本查看 复制代码
            //创建Httphelper对象
            HttpHelper http = new HttpHelper();
            //创建Httphelper参数对象
            HttpItem item = new HttpItem()
            {
                URL = "http://www.sufeinet.com",//URL     必需项    
                Method = "get",//URL     可选项 默认为Get   
                ContentType = "text/html",//返回类型    可选项有默认值   
                //ContentType = "application/x-www-form-urlencoded",//返回类型    可选项有默认值   
            };
            //请求的返回值对象
            HttpResult result = http.GetHtml(item);
            //获取请请求的Html
            string html = result.Html;


            html = HttpHelper.StripHTML(html);
效果

处理之前



过滤过Html之后的



这个很简单,大家先用着,如果有什么不到之处还什么批评指正




1. 开通SVIP会员,免费下载本站所有源码,不限次数据,不限时间
2. 加官方QQ群,加官方微信群获取更多资源和帮助
3. 找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
发表于 2014-9-12 13:42:22 | 显示全部楼层
受教了学习中……
发表于 2014-10-17 10:07:40 | 显示全部楼层
强烈支持楼主ing……
发表于 2015-12-10 16:24:41 | 显示全部楼层
强烈支持楼主ing……
发表于 2018-1-22 22:01:10 | 显示全部楼层
能不能提取指定标签的HTML
 楼主| 发表于 2018-1-23 08:11:43 | 显示全部楼层
温柔地杀了它 发表于 2018-1-22 22:01
能不能提取指定标签的HTML

这个自己写正则就行了
您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备18043678号-2)

GMT+8, 2022-5-24 20:08

© 2014-2021

快速回复 返回顶部 返回列表