Web Design
Mobile Internet
Brand Design
Innovative
News
Encyclopedias

淺談百度抓取淘寶那點事

Date:2012-02-06 Aource:尚品中國 Type:網(wǎng)站百科
Word Size:small  medium  big

大家都知道大概是“百度有啊”上線之前,淘寶網(wǎng)為了避免百度惡意抓取,直接屏蔽了百度蜘蛛,也就是當時鬧得沸沸揚揚的robots.txt協(xié)議 。

就算是現(xiàn)在打開淘寶的robots.txt協(xié)議,依然可以看到淘寶還在屏蔽百度的蜘蛛。

可是事實上真的如此么

看下圖

事實證明淘寶的robots.txt文件根本對百度蜘蛛起不到任何作用。

小弟推測百度之所以這么做是因為百度考慮到戰(zhàn)略方向的問題,因為查詢了一下發(fā)現(xiàn)一些知名店鋪在百度的排名都很不錯。足以證明百度對淘寶這種店鋪的重要性。更加戲曲化的是天貓網(wǎng)(淘寶商城)也是使用robots.txt協(xié)議的。同樣屏蔽了百度蜘蛛。

同樣百度采取的態(tài)度是瘋狂抓取 如圖

還有一種可能就是淘寶網(wǎng)以及天貓網(wǎng)的權重太高了,導致了百度蜘蛛不遵循搜索引擎協(xié)議而進行的抓取。不過對于這種事情可以聯(lián)想到前些日子,一淘網(wǎng)惡意抓取京東商城以及新蛋網(wǎng)等的商品數(shù)據(jù),也是不遵循搜索引擎規(guī)則的。

直到現(xiàn)在京東商城等也在屏蔽一淘網(wǎng)的蜘蛛,

小編想說的是現(xiàn)在的搜索引擎為了自身利益而不遵循互聯(lián)網(wǎng)協(xié)議的規(guī)則,是值得反思的,呼吁這種互聯(lián)網(wǎng)大公司能在整個IT行業(yè)樹立標榜。

?

Please contact our consultant

+86 10-60259772

Please provide your contact number. The project manager of shangpin China will contact you as soon as possible.