http://www.sufeinet.com/plugin.php?id=keke_group

苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper爬虫框架(V2.7-含.netcore) HttpHelper官方出品,爬虫框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 开源的爬虫类,支持多种模式和属性 源码 - 代码生成器 - 讨论区 - 教程- 例子

查看: 5155|回复: 0

[搜索引擎] 360违返R0bot协议惹众怒:部分站长封杀360浏览器

[复制链接]
发表于 2012-9-4 16:37:12 | 显示全部楼层 |阅读模式
近日,部分网站突然不再允许360搜索或者是浏览器直接访问,据悉,站长采取这一举措,主要是因为360违反robots协议而随意抓取未经授权数据,让站长及用户的数据受到极大威胁,从而使得不少站长对360相关产品产生抵触情绪,并有部分网站开始拒绝360访问。
  Robots协议是国际搜索引擎的通用规则,任何网站都可以根据自己的意愿,设置自己的robots协议,限定搜索引擎那些数据是可以被抓取的,哪些则拒绝被访问。
  (众多站长号召用户停止使用360浏览器)
  自360搜索推出以来,其违反robots协议,窥探用户隐私的问题便屡屡遭到各方的质疑和反感。之前微博网友zeracker指出360抓取用户账户、密码及订单、优惠码等信息,并晒出图片,图片让360浏览器抓取很多国内知名网游的后台订单、优惠码等敏感记录的行为尽显无遗。
  (用户优惠码等信息被360泄漏)
  360的抓取不仅让用户账户信息存在风险,邮件等信息也难逃厄运。细心的网友发现在使用360搜索时,360搜索居然会抓取IBM lotus domino 邮件系统后台和个人邮件文件存储地址。360违反robots(拒绝抓取)协议的抓取行为,将使用户邮件信息的内容,可以被搜索引擎抓取,更可以被网民搜索。

  (360搜索抓取IBM lotus domino 邮件系统后台和个人邮件文件存储地址)
  在360搜索违反robots协议的抓取下,不仅用户隐私受到威胁,公司的商业机密更是无法保证。IBM国际商业机器中国有限公司的黑客老鹰在微博中指出,360搜索能抓取公司内网信息,而这些信息在正常状态下仅能通过VPN+动态口令才允许访问。这也就意味着公司所有的内部信息、商业机密等将在360面前暴露无疑。随后该微博立刻被删除,不禁让人猜测,该微博碰到了360的痛处。
  也正是这些事实,让众多站长开始担忧自己网站及用户的信息安全问题。“IT茶馆”站长王佳伦指出,“robots协议是搜索引擎国际惯例,界定了信息自由分享的权利与边界。如果互联网企业都不遵守这些规则,整个互联网行业的环境必将大乱。”在他看来,“360违反Robots协议,不利于行业良性发展,应该受到批评。”
作为中小站长中的一员,“迅游网”站长谢应表示,无视robots协议的行为,其本质是对所有站长权利的侵犯。谢应称,robots协议是国际公认的互联网最基本规则,360破坏这一规则、肆意抓取网站并未授权开放的隐私内容,“将让数百万站长以及他们的用户毫无安全可言,甚至会引发严重的隐私信息泄露事件。此种行为,需要企业自律,也需要政府和主管部门更多法律法规的监督制约。”
  聚巴适网站站长志明则指出,如果互联网企业都像360一样践踏规则,随意去抓取未经别人授权的数据和内容,不仅会增加服务器的负荷,更将导致涉及网站安全和用户隐私的数据泄露,这也是近期站长们联合抵制360的原因所在。
  不过值得关注的是,尽管业内对360无视robots协议的质疑与批评不绝于耳,后者似乎依然我行我素。截至目前,不少明令禁止搜索引擎抓取的数据,仍然出现在360综合搜索的结果页面中,其中不乏政府机构网站、企业管理后台及个人博客信息。


1. 开通SVIP会员,免费下载本站所有源码,不限次数据,不限时间
2. 加官方QQ群,加官方微信群获取更多资源和帮助
3. 找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备18043678号-2)

GMT+8, 2024-11-1 07:19

© 2014-2021

快速回复 返回顶部 返回列表