一個(gè)是搜索引擎市場具有壟斷地位的巨頭,一個(gè)是頗具爭議的闖入者,這場圍繞搜索引擎的“3B大戰(zhàn)”進(jìn)入了第二個(gè)回合:釣魚。

  幾天前,百度工程師放出“鬼節(jié)捉鬼”的釣魚策略,將爭論引向一直以隱私安全為底牌的360。問題出在一個(gè)叫做Robots的協(xié)議上。360被指不遵守協(xié)議,直接用瀏覽器抓取用戶瀏覽信息,可能致使用戶信息泄露。“3B大戰(zhàn)”的對手百度等互聯(lián)網(wǎng)公司發(fā)出了要求員工卸載360瀏覽器的號(hào)召,搜狗CEO王小川也表示應(yīng)遵守Robot協(xié)議,擔(dān)心360在安全上做裁判又做球員。

  CNNIC新的統(tǒng)計(jì)數(shù)據(jù)顯示,360搜索覆蓋中國網(wǎng)民比例已由上周的13.04%降為11.61%,覆蓋人數(shù)由3420萬降為3052萬,近一周時(shí)間,損失用戶達(dá)368萬。

  3B大戰(zhàn)第二回合,落在了瀏覽器端直接搜集網(wǎng)頁信息的爭議上!睹咳战(jīng)濟(jì)新聞》在調(diào)查中發(fā)現(xiàn),Robots協(xié)議被瀏覽器開發(fā)人員視為“Google自己制定的協(xié)議規(guī)范”,“連行業(yè)規(guī)范都算不上”,搜索引擎對用戶隱私權(quán)的定義,目前還是空白。

  百度非原創(chuàng)式捉“鬼”

  8月31日,一則由百度工程師發(fā)布的微博引發(fā)了業(yè)內(nèi)的廣泛討論。

  這位名叫趙明華的百度互聯(lián)網(wǎng)數(shù)據(jù)研發(fā)部經(jīng)理稱,百度的工程師制作的幾個(gè)特殊頁面沒有任何外鏈,由于搜索引擎爬蟲只能通過鏈接爬行網(wǎng)頁,因此這個(gè)網(wǎng)頁是完全封閉的 “孤島”,不可能被搜索引擎抓取到。但令人意外的是,百度工程師試著在360搜索中輸入以上關(guān)鍵詞,結(jié)果這個(gè)網(wǎng)頁赫然出現(xiàn)在搜索結(jié)果第一行,并可以直接點(diǎn)擊訪問瀏覽網(wǎng)頁內(nèi)容。但再換百度、谷歌、搜狗、搜搜等其他瀏覽器搜索相同內(nèi)容,卻無法返回相應(yīng)網(wǎng)頁。

  為什么一個(gè)完全封閉的網(wǎng)頁竟然能被360搜索引擎抓取到?趙明華的解釋是,他曾用360瀏覽器打開過這個(gè)網(wǎng)頁。在360瀏覽器的隱私策略中,注明了360安全瀏覽器會(huì)在用戶的計(jì)算機(jī)上記錄有關(guān)瀏覽歷史記錄的實(shí)用信息。

  百度認(rèn)為,百度釣魚流程揭示了360搜索存在安全隱患:只要用戶通過360瀏覽器訪問過一個(gè)網(wǎng)頁,無論是私人賬號(hào)信息,還是公司內(nèi)網(wǎng)機(jī)密數(shù)據(jù),都會(huì)被360瀏覽器記錄下來,并被360搜索爬蟲抓取、上傳到360服務(wù)器。

  不過,360卻有著自己的說法。360在官方微博上指出,百度以所謂的“孤島”數(shù)據(jù)污蔑360泄露用戶隱私。其實(shí)百度的做法很簡單,只要通過外部鏈接引導(dǎo)360爬蟲抓取頁面,同時(shí)屏蔽其他搜索引擎,然后切斷外鏈,可以造成只有360搜索收錄所謂“孤島”的假象。

  9月2號(hào),360董事長周鴻?對此回應(yīng),“這是百度在濫用Robots協(xié)議,阻礙360進(jìn)入搜索市場。”

  百度“鬼節(jié)抓鬼”的行為,在互聯(lián)網(wǎng)界并非首例。2011年初,谷歌由于懷疑必應(yīng)借鑒其搜索結(jié)果,也采取過這種做法。

  2010年10月份,谷歌注意到Bing的搜索結(jié)果越來越多地和谷歌重合,頭條結(jié)果相同的趨勢也越來越高,由此必應(yīng)抄襲了他們的搜索結(jié)果。

  為了驗(yàn)證猜想,谷歌在去年12月進(jìn)行了一場釣魚行動(dòng)。他們選擇了100個(gè)異常釣餌進(jìn)行手動(dòng)搜索排名,將這些關(guān)鍵詞的搜索結(jié)果指向毫無關(guān)聯(lián)的頁面。當(dāng)時(shí)約20位谷歌工程師在電腦上使用IE瀏覽器來搜索這些關(guān)鍵詞,然后通過IE在谷歌上搜索這些釣餌,誘使必應(yīng)上鉤。兩周后,谷歌工程師再通過必應(yīng)搜索當(dāng)時(shí)的釣餌,預(yù)先埋下的結(jié)果開始陸續(xù)出現(xiàn)在必應(yīng)結(jié)果中,由此發(fā)現(xiàn)必應(yīng)通過IE收集用戶上網(wǎng)的隱私數(shù)據(jù),直接記錄上傳了用戶訪問網(wǎng)址并隨后放入搜索結(jié)果中。

  搜索引擎與商業(yè)網(wǎng)站博弈

  趙明華稱,360繞過了Robots協(xié)議,利用瀏覽器記錄并上傳用戶數(shù)據(jù)和上網(wǎng)行為,并形成自己的網(wǎng)址庫,再用偽裝和隱藏過的爬蟲來抓取快照,生成搜索結(jié)果。

  那么,從瀏覽器端直接搜集網(wǎng)頁信息是否正當(dāng)?

  實(shí)際上,Robots協(xié)議并非強(qiáng)制性法規(guī),而是搜索引擎誕生后,互聯(lián)網(wǎng)業(yè)界經(jīng)過長期博弈,終在搜索引擎與商業(yè)站點(diǎn)、公眾知情權(quán)和用戶隱私權(quán)之間達(dá)成的一種妥協(xié)。

  據(jù)《每日經(jīng)濟(jì)新聞》了解,早期的互聯(lián)網(wǎng)主要是“用戶-網(wǎng)站”模式。用戶通過網(wǎng)站獲取信息,網(wǎng)站通過吸引用戶點(diǎn)擊來實(shí)現(xiàn)廣告收入。不過,當(dāng)谷歌把搜索引擎變成一種成功的商業(yè)模式之后,很多網(wǎng)站原有的商業(yè)模式遭到了嚴(yán)重破壞。

  為了維護(hù)自身的利益,一些歐美大型網(wǎng)站聯(lián)合起來與谷歌談判,要求谷歌“有所為有所不為”,于是有了Robots協(xié)議。該協(xié)議的核心思想是要求Robots程序不要去檢索那些站長不希望被直接搜索到的內(nèi)容,并將約束Robots程序的具體方法規(guī)范成格式代碼,成了Robots協(xié)議。一般來說,網(wǎng)站是通過Robots.txt文件來實(shí)現(xiàn)Robots協(xié)議。

  國內(nèi)使用Robots協(xié)議典型的案例是淘寶網(wǎng)拒絕百度搜索。此外還有大量的用戶注冊、郵件等信息,都利用Robots協(xié)議來防止這些內(nèi)容在互聯(lián)網(wǎng)上被搜索到。