360违反Robots协议收集敏感数据引发隐私恐慌

本月16日，百度诉奇虎360违反"Robots协议"抓取、复制其网站内容侵权一案将在北京市第一中级人民法院开庭审理。据了解，2012年8月，360搜索悄然上线后不久即被爆出公开违反国际通行的行业规则Robots协议，强行抓取百度旗下网站百度知道、百度百科、百度贴吧、百度旅游等内容，引发包括百度在内的互联网业界同行严重抗议。同时，360违反Robots协议内容收集敏感数据的行为，也曾一度引发网民恐慌，而此次庭审在即，再度引起隐私争端。

据了解，Robots协议也就是爬虫协议，其设置的目的正是为保护网站数据和敏感信息以及用户个人信息和隐私不被侵犯，网站所有者拥有Robots协议自主的设定权利。百度指出，360公司未经许可，违反国际通行的Robots规则、百度权利声明和技术措施，抓取百度网站页面并生成"快照"复制件存储于被告自身服务器中。更为严重的是，360公司在网民点击其搜索结果中涉及百度网站内容的标题时，直接向网民提供其非法复制存储在其自身服务器上的"网页快照"，替代百度向网民提供服务。

早前，百度工程师就曾详细揭露360如何绕过Robots协议，利用浏览器记录并上传用户数据和上网行为，并形成自己的网址库，再用伪装和隐藏过的爬虫来抓取快照，生成搜索结果。这也意味着只要用户通过360浏览器访问过一个网页，无论是私人账号信息，还是公司内网机密数据，都会被360浏览器记录下来，并被360搜索爬虫抓取。这种通过浏览器端直接搜集网页信息的行为，将导致企业和普通用户信息的泄露，带来严重的隐私安全风险。

央广新闻此前也报道称，360违反Robots协议带来的隐私安全问题引发不少网民恐慌--由于360搜索并不遵守搜索引擎通用的Robots协议，导致很多网站出于安全和隐私的考虑，不允许搜索引擎抓取的一些内网信息也泄漏在了360搜索上，这些隐私甚至可能包括银行帐号、密码、内部邮件等一些信息。用户曾经反馈，公司原本需要动态口令访问的内部网站现在也能被360搜索抓取，而业内人士专家分析，这可能正是因为公司内部有人使用360浏览器而导致的隐私安全隐患。更有网友发现， 360搜索还抓取一些知名网游的后台订单、电子优惠券编号等信息，甚至IBM lotus domino 邮件系统后台和个人邮件文件存储地址也能在360中搜索到。

2012年11月1日，在工信部指导下，中国互联网协会牵头百度、360、搜狗等12家搜索引擎服务企业签署的《互联网搜索引擎服务自律公约》中明确规定：Robots协议是国际通行的行业惯例与商业规则，搜索引擎企业应当遵守Robots协议。对于公布《自律公约》前违反Robots抓取的行为，收到权利人通知后，搜索引擎应及时进行删除、断链。但公约签订后，360却并未完全遵守公约规定删除相关快照内容，并被曝出原封不动地抄袭百度知道、百度百科等网站内容。