苏飞论坛

标题: 百度分词技术 [打印本页]

作者: Eagle    时间: 2013-3-29 14:51
标题: 百度分词技术
百度分词现在是按照怎么个算法来的?

前后匹配?求具体例子
作者: 站长苏飞    时间: 2013-3-29 15:02
分词算法是一方面,主要是百度这类网站有强大的词库,他们有办法区别什么样的词是导航,什么样的词是标题,也是根据各个网站出现的次数算的,机率问题,他们我估计现在没有什么特别的算法,更多的是利用词库。所以有些时候有些公司的强大,不是因为技术也不是因为设计,而是有着别人无法相比的资源。就像QQ的用户群一样,做什么网站只要在每个QQ右下角弹出个小窗口网站就火了。
  
   如果是我要这些的话我开始可能就不管他们,直接使用现成的就行,等强大了就做词库。
作者: Eagle    时间: 2013-3-29 15:23
我寻求的就是一个算法!准确的说,是黑帽技术!弄一个网站,通过分词,做到首页显示,目前本站的关键字
(, 下载次数: 161)