網(wǎng)站設(shè)置robots協(xié)議的幾個(gè)原因
網(wǎng)站設(shè)置robots.txt的幾個(gè)原因。
1:設(shè)置訪問權(quán)限保護(hù)網(wǎng)站安全。
2:禁止搜索引擎爬取無(wú)效頁(yè)面,集中權(quán)值到主要頁(yè)面。
怎么用標(biāo)準(zhǔn)寫法書寫協(xié)議?
有幾個(gè)概念需掌握。
User-agent表示定義哪個(gè)搜索引擎,如User-agent:Baiduspider,定義百度蜘蛛。
Disallow表示禁止訪問。
Allow表示運(yùn)行訪問。
通過以上三個(gè)命令,可以組合多種寫法,允許哪個(gè)搜索引擎訪問或禁止哪個(gè)頁(yè)面。
robots.txt文件放在那里?
此文件需放置在網(wǎng)站的根目錄,且對(duì)字母大小有限制,文件名必須為小寫字母。所有的命令第一個(gè)字母需大寫,其余的小寫。且命令之后要有一個(gè)英文字符空格。
哪些時(shí)候需要使用該協(xié)議。
1:無(wú)用頁(yè)面,很多網(wǎng)站都有聯(lián)系我們,用戶協(xié)議等頁(yè)面,這些頁(yè)面相對(duì)于搜索引擎優(yōu)化來講,作用不大,此時(shí)需要使用Disallow命令禁止這些頁(yè)面被搜索引擎抓取。
2:動(dòng)態(tài)頁(yè)面,企業(yè)類型站點(diǎn)屏蔽動(dòng)態(tài)頁(yè)面,有利于網(wǎng)站安全。且多個(gè)網(wǎng)址訪問同一頁(yè)面,會(huì)造成權(quán)重分散。因此,一般情況下,屏蔽動(dòng)態(tài)頁(yè)面,保留靜態(tài)或偽靜態(tài)頁(yè)面。
3:網(wǎng)站后臺(tái)頁(yè)面,網(wǎng)站后臺(tái)也可以歸類于無(wú)用頁(yè)面,禁止收錄有百益而無(wú)一害。