http://www.sufeinet.com/plugin.php?id=keke_group

苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper爬虫框架(V2.7-含.netcore) HttpHelper官方出品,爬虫框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 开源的爬虫类,支持多种模式和属性 源码 - 代码生成器 - 讨论区 - 教程- 例子

查看: 2037|回复: 5

[其他] 求助正则表达式..

[复制链接]
发表于 2013-8-26 10:53:07 | 显示全部楼层 |阅读模式
获取的HTML代码中有下面这一行,我想获取<td  valign='bottom' class=''>要获取的内容<br />中间这些数字,并且存入一个数组,应该怎么写正则表达式?还是有更好的办法?PS:最后一个是<td  valign='bottom' class='line_r'><br />
[code=html]<td  valign='bottom' class=''>12<br /><img height='12px' width='8px' src='/analysis/images/zzt02.gif'></td><td  valign='bottom' class=''>8<br /><img height='8px' width='8px' src='/analysis/images/zzt02.gif'></td><td  valign='bottom' class=''>0<br /><img height='0px' width='8px' src='/analysis/images/zzt02.gif'></td><td  valign='bottom' class=''>30<br /><img height='30px' width='8px' src='/analysis/images/zzt02.gif'></td><td  valign='bottom' class=''>24<br /><img height='24px' width='8px' src='/analysis/images/zzt02.gif'></td><td  valign='bottom' class=''>1<br /><img height='1px' width='8px' src='/analysis/images/zzt02.gif'></td><td  valign='bottom' class=''>3<br /><img height='3px' width='8px' src='/analysis/images/zzt02.gif'></td><td  valign='bottom' class=''>7<br /><img height='7px' width='8px' src='/analysis/images/zzt02.gif'></td><td  valign='bottom' class=''>2<br /><img height='2px' width='8px' src='/analysis/images/zzt02.gif'></td><td  valign='bottom' class='line_r'>4<br /><img height='4px' width='8px' src='/analysis/images/zzt02.gif'></td>[/code]


1. 开通SVIP会员,免费下载本站所有源码,不限次数据,不限时间
2. 加官方QQ群,加官方微信群获取更多资源和帮助
3. 找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
发表于 2013-8-26 11:25:20 | 显示全部楼层
正则如下
QQ截图20130826112439.jpg
代码如下
[code=csharp]
  string html = "你的内容";
          MatchCollection mc = Regex.Matches(html, @"<td  valign='bottom' class='>(\d{1,10})<br />|<td  valign='bottom' class='line_r'>(\d{1,10})<br />");
          foreach (Match m in mc)
          {
              Console.WriteLine(m.Groups[1].Value);
          }
[/code]
mc 就是一个数组
m.Groups[1].Value是安顺序的每一个数字

 楼主| 发表于 2013-8-26 17:11:19 | 显示全部楼层
站长苏飞 发表于 2013-8-26 11:25
正则如下

代码如下

谢谢战长,这样是对了,但是最后一个是在Group[2],如何合并成一条新的数组,集合包括Group[2]的value
发表于 2013-8-26 17:18:34 | 显示全部楼层
你直接取
Console.WriteLine(m.Groups[1].Value+m.Groups[2].Value);
就行了,这个只会同时有一个存在。
 楼主| 发表于 2013-8-26 17:24:57 | 显示全部楼层
站长苏飞 发表于 2013-8-26 17:18
你直接取
Console.WriteLine(m.Groups[1].Value+m.Groups[2].Value);
就行了,这个只会同时有一个存在。

对哦,谢谢,问题解决了
发表于 2013-8-26 17:52:59 | 显示全部楼层
fnz1988 发表于 2013-8-26 17:24
对哦,谢谢,问题解决了

已揭帖,呵呵
您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备18043678号-2)

GMT+8, 2024-5-7 08:55

© 2014-2021

快速回复 返回顶部 返回列表