抓取的时候获取到了一些&#+5位数字+;的内容，怎么转换？

inghot · 发表于 2012-11-1 17:37:16

在抓取的时候，有些网站的内容可能进行过某种编码，好让中文显示。
如下：
& # 24050 ;
这个是【已】字，把& # 2中间的空格去掉。
这样的内容该如何转换(C#)，不知道是什么编码来着。

站长苏飞 · 发表于 2012-11-1 18:02:07

帮顶，没见过

inghot · 发表于 2012-11-1 18:33:46

是html 编码解码地址
C# WINFORM 解决方法：
在WINFORM中引入System.Web
然后使用System.Web.HttpUtility.HtmlDecode("已签收");就行了。
如果是WEBFORM就不用引入System.Web。

enerst · 发表于 2013-1-29 00:35:07

跟&nbsp一个原理汉字是10进止的unicode

inghot · 发表于 2014-3-13 14:04:34

ching126 · 发表于 2014-9-9 23:04:34

我只是路过打酱油的。

ching126 · 发表于 2014-9-9 23:05:49

路过，哈哈

		自动登录	找回密码
密码			马上注册

[抓取] 抓取的时候获取到了一些&#+5位数字+;的内容，怎么转换？