推薦閱讀

robots.txt寫法大全及語法的靈活運(yùn)用

時(shí)間：2016-04-07 | 分類：功能說明

瀏覽：13458

robots在英語之中的意思是機(jī)器人，Robots協(xié)議（也稱為爬蟲協(xié)議、機(jī)器人協(xié)議等）全稱是“網(wǎng)絡(luò)爬蟲排除標(biāo)準(zhǔn)”（Robots Exclusion Protocol），網(wǎng)站通過Robots協(xié)議告訴搜索引擎哪些頁面可以抓取，哪些頁面不能抓取。Robots協(xié)議的本質(zhì)是網(wǎng)站和搜索引擎爬蟲的溝通方式，用來指導(dǎo)搜索引擎更好地抓取網(wǎng)站內(nèi)容，而不是作為搜索引擎之間互相限制和不正當(dāng)競(jìng)爭的工具。

當(dāng)搜索引擎在訪問一個(gè)站點(diǎn)時(shí)，首先檢索的將是該站點(diǎn)根目錄下面的robots.txt文件（如果沒有我們可以建立一個(gè)空白的文本文檔，命名為robots.txt放在網(wǎng)站的根目錄下即可?。绻宋募嬖?，那么搜索引擎將率先訪問并識(shí)別此文件的規(guī)則，它會(huì)按照此文件里面的規(guī)則進(jìn)行爬?。∠旅嬖敿?xì)敘述一下相關(guān)語法：

1、允許所有搜索引擎訪問網(wǎng)站的所有部分：

User-agent：*

Disallow：

2、禁止所有搜索引擎訪問網(wǎng)站的所有部分:

User-agent：*

Disallow：/

3、如果不需要某一個(gè)搜索引擎抓取的話，比如百度，禁止百度索引我們的網(wǎng)站

User-agent：Baiduspider

Disallow：/

注：如果我們需要禁止Google索引我們的網(wǎng)站，就把User-agent：蜘蛛名字改成谷歌的Googlebot即可！

4、如果我們禁止除Google外的一切搜索引擎索引我們的網(wǎng)站

User-agent：Googlebot

Disallow：

User-agent：*

Disallow：/

5、如果我們需要禁止蜘蛛訪問某一個(gè)目錄，比如禁止login、newtravel等目錄被索引

User-agent：*

Disallow：/login/

Disallow：/newtravel/

6、如果我們?cè)试S蜘蛛訪問網(wǎng)站某個(gè)目錄中的某些特定網(wǎng)址

User-agent：*

Allow：/login/my

Allow：/newtravel/html

Disallow：/login/

Disallow：/newtravel/

7、很多網(wǎng)站的robots.txt里的Disallow或者Allow里面會(huì)有很多的符號(hào)，比如星號(hào)、問號(hào)什么的，如果使用“*”號(hào)，主要是限制訪問某個(gè)后綴的域名，比如禁止訪問/html/ 目錄下的所有以“.htm”為后綴的URL（包含子目錄）

User-agent：*

Disallow：/html/*.htm

8、使用“$”符號(hào)是僅允許訪問某目錄下某個(gè)后綴的文件

User-agent：*

Allow：.asp$

Disallow：/

9、如果是禁止搜索引擎索引網(wǎng)站中所用動(dòng)態(tài)的頁面（這里演示的是以“?”號(hào)為域名，例如：index.asp?id=1）

User-agent:*

Disallow：/*?*

10、為了節(jié)省服務(wù)器資源，需要禁止各類蜘蛛來索引網(wǎng)站的圖片，除了使用常見的 “Disallow:/images/”這樣直接屏蔽圖片文件夾的方式以外，還可以采取直接屏蔽圖片后綴名的方式。如果我們禁止百度搜索引擎索引我們網(wǎng)站的圖片：

User-agent：Baiduspider

Disallow：.jpg$

Disallow：.jpeg$

Disallow：.gif$

Disallow：.png$

11、僅允許百度抓取網(wǎng)站上的“JPG”格式的文件

User-agent:baiduspider

Allow：.jpg$

Disallow:jpeg$

Disallow:gif$

Disallow:png$

12、僅僅禁止百度抓取網(wǎng)站上的“JPG”格式的文件

User-agent：Baiduspider

Disallow：.jpg$

更多詳細(xì)幫助，參考閱讀

robots 360百科

參與評(píng)論

積分獲取更多

會(huì)員注冊(cè) +50立即注冊(cè)
CMS授權(quán) +490立即前往
參與投票 +20立即前往
文章評(píng)論 +10立即前往

思途CMS系統(tǒng)更新動(dòng)態(tài)

2025-03-20

1、【新增功能】新增導(dǎo)覽講解應(yīng)用，基礎(chǔ)系統(tǒng)依賴更新
2、【BUG修復(fù)】推廣掛件視頻無法刪除
3、【BUG修復(fù)】庫存無法刪除
4、【BUG修改】編輯框保存編碼問題utf8更改為utf8mb4
5、【功能優(yōu)化】搜索接口提升匹配產(chǎn)品
6、【BUG修復(fù)】后臺(tái)廣告位點(diǎn)搜索時(shí)沒有帶上對(duì)應(yīng)端
7、【BUG修復(fù)】未安裝充值應(yīng)用時(shí)PC端不顯示入口
8、【BUG修復(fù)】圖庫和添加圖片窗口的圖片鏈接改動(dòng)
9、【功能優(yōu)化】保險(xiǎn)功能修復(fù)

大家都在看

產(chǎn)品更新優(yōu)惠券包產(chǎn)品介紹
產(chǎn)品更新思途Deepeek AI售后助手——解鎖一站式智能售后服務(wù)體驗(yàn)
產(chǎn)品更新城市站點(diǎn)：旅游企業(yè)精準(zhǔn)營銷的致勝法寶
產(chǎn)品更新思途CMS高并發(fā)、高性能、高可用架構(gòu)設(shè)計(jì)
產(chǎn)品更新供應(yīng)商如何管理？優(yōu)惠券和旅游卡的區(qū)別？多平臺(tái)訂單退訂如何管理？
產(chǎn)品更新小白也能學(xué)會(huì)的郵輪小程序搭建教程來了！

掃一掃官方微信號(hào)

国语对白无码视频最新|久久久久人妻一区视色|国产精品制服丝袜美腿控|A v无码久久久久不卡|激情久久AV一区二区AV|制服丝袜亚洲欧美一区二区|99人妻碰碰碰久久久久禁片|亚洲国产成人无码av在线播放

推薦閱讀

robots.txt寫法大全及語法的靈活運(yùn)用

相關(guān)閱讀

提點(diǎn)意見當(dāng)前用戶：游客

參與評(píng)論

他們說...

掃一掃官方微信號(hào)

国语对白无码视频最新|久久久久人妻一区视色|国产精品制服丝袜美腿控|A v无码久久久久不卡|激情久久AV一区二区AV|制服丝袜亚洲欧美一区二区|99人妻碰碰碰久久久久禁片|亚洲国产成人无码av在线播放

推薦閱讀

robots.txt寫法大全及語法的靈活運(yùn)用

相關(guān)閱讀

提點(diǎn)意見 當(dāng)前用戶：游客

參與評(píng)論

他們說...

掃一掃官方微信號(hào)

提點(diǎn)意見當(dāng)前用戶：游客