苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper爬虫框架(V2.7-含.netcore) HttpHelper官方出品,爬虫框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 开源的爬虫类,支持多种模式和属性 源码 - 代码生成器 - 讨论区 - 教程- 例子

百度分词技术

查看数: 11467 | 评论数: 4 | 收藏 0
关灯 | 提示:支持键盘翻页<-左 右->
    组图打开中,请稍候......
发布时间: 2013-3-29 14:51

正文摘要:

百度分词现在是按照怎么个算法来的? 前后匹配?求具体例子

回复

古哥 发表于 2013-9-5 16:24:40
这个可以有。

百度的分词还是很有意思的。
站长苏飞 发表于 2013-4-2 09:55:29
Eagle 发表于 2013-3-29 15:23
我寻求的就是一个算法!准确的说,是黑帽技术!弄一个网站,通过分词,做到首页显示,目前本站的关键字

这个你只要检查关键字用什么分割的就行了,设置几个常用的,方法
站长苏飞 发表于 2013-3-29 15:02:52
分词算法是一方面,主要是百度这类网站有强大的词库,他们有办法区别什么样的词是导航,什么样的词是标题,也是根据各个网站出现的次数算的,机率问题,他们我估计现在没有什么特别的算法,更多的是利用词库。所以有些时候有些公司的强大,不是因为技术也不是因为设计,而是有着别人无法相比的资源。就像QQ的用户群一样,做什么网站只要在每个QQ右下角弹出个小窗口网站就火了。
  
   如果是我要这些的话我开始可能就不管他们,直接使用现成的就行,等强大了就做词库。

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备18043678号-2)

GMT+8, 2025-12-15 06:47

© 2014-2021

快速回复 返回顶部 返回列表