百度站長中有關(guān)于sitemap常見問題,這里我們轉(zhuǎn)述如下,建議網(wǎng)站管理員都要重視這個問題。
一、什么是Sitemap?
Sitemap(即站點地圖)就是您網(wǎng)站上網(wǎng)頁網(wǎng)址的列表。創(chuàng)建并提交Sitemap有助于百度發(fā)現(xiàn)并了解您網(wǎng)站上的所有網(wǎng)頁。
您還可以使用Sitemap提供有關(guān)您網(wǎng)站的其他信息,如上次更新日期、Sitemap文件的更新頻率等,供百度抓取程序參考。
百度對已提交的數(shù)據(jù),不保證一定會抓取及索引所有網(wǎng)址。但是,我們會使用Sitemap中的數(shù)據(jù)來了解網(wǎng)站的結(jié)構(gòu)等信息,這樣可以幫助我們改進(jìn)抓取策略,并在日后能更好地對網(wǎng)站進(jìn)行抓取。
注間:Sitemap 與搜索排名沒有關(guān)系,但有利于搜索引擎更好的理解網(wǎng)站結(jié)構(gòu)。
二、百度Sitemap協(xié)議都支持哪些格式?
百度Sitemap協(xié)議支持三種格式:文本格式、xml格式、Sitemap索引格式,可以根據(jù)自己情況來選擇任意一種格式組織sitemap。
具體格式說明及示例如下:
1.第一種格式樣例:txt文本格式
在一個txt文本列明需要向百度提交的鏈接地址,將txt文本文件通過站長平臺進(jìn)行提交
http://www.example.com/repaste/101562698_5230191316.html
http://www.example.com/repaste/101586283_5230215075.html
http://www.example.com/repaste/101639435_5230310576.html
此文本文件需要遵循以下指南:
文本文件每行都必須有一個網(wǎng)址。網(wǎng)址中不能有換行。不應(yīng)包含網(wǎng)址列表以外的任何信息。
您必須書寫完整的網(wǎng)址,包括 http。
每個文本文件最多可包含 50,000 個網(wǎng)址,并且應(yīng)小于10MB(10,485,760字節(jié))。如果網(wǎng)站所包含的網(wǎng)址超過 50,000 個,則可將列表分割成多個文本文件,然后分別添加每個文件。
文本文件需使用 UTF-8 編碼或GBK編碼。
2.第二種格式樣例:xml格式,sitemap.xml的編碼方式可以是UTF-8(推薦)或者GBK
如圖示:
有多個sitemap,按上述格式重復(fù)之間的片斷,列明所有sitemap地址,向站長平臺進(jìn)行提交。
三、創(chuàng)建sitemap時有哪些注意事項?
一個sitemap文件包含的網(wǎng)址不得超過 5 萬個,且文件大小不得超過 10 MB。如果您的sitemap超過了這些限值,請將其拆分為幾個小的sitemap。這些限制條件有助于確保您的網(wǎng)絡(luò)服務(wù)器不會因提供大文件而超載。
一次性最多提交50個地址,提交地址的文件類型和更新周期必須一致。
如果驗證了網(wǎng)站的主域,那么Sitemap文件中可包含該網(wǎng)站主域下的所有網(wǎng)址。
如果驗證的www.example.com,你只能提交該驗證網(wǎng)站的網(wǎng)址,不能出現(xiàn)其他網(wǎng)站的網(wǎng)址。
四、如何提交sitemap?
第一步,將需提交的網(wǎng)頁列表制作成一個sitemap文件,文件格式請閱讀百度sitemap協(xié)議都支持哪些格式。
第二步,將sitemap文件放置在網(wǎng)站目錄下。
比如您的網(wǎng)站為example.com,您已制作了一個sitemap_example.xml的sitemap文件,將sitemap_example.xml上傳至網(wǎng)站根目錄即example.com/sitemap_example.xml
第三步,登錄百度站長平臺,確保提交sitemap數(shù)據(jù)的網(wǎng)站已驗證歸屬。
第四步,進(jìn)入sitemap工具,點擊“添加新數(shù)據(jù)”,文件類型選擇“URL列表”,填寫抓取周期和sitemap文件地址(如:www.example.com/sitemap_example.xml),進(jìn)行提交。
以上兩步是向百度站長平臺的的提交步驟。
提交完之后,可在sitemap列表里看到提交的sitemap文件,如果sitemap文件里面有新的網(wǎng)站鏈接,可以選擇文件后,點擊更新所選,即對更新的網(wǎng)站鏈接進(jìn)行了提交。
整體流程如下圖:
五、我提交時填寫的周期是什么含義?
百度spider會參考設(shè)置周期抓取sitemap文件,因此請根據(jù)sitemap文件內(nèi)容的更新(比如增加新url)來設(shè)置。
請注意若url不變而僅是url對應(yīng)的頁面內(nèi)容更新(比如論壇帖子頁有新回復(fù)內(nèi)容),不在此更新范圍內(nèi)。sitemap工具不能解決頁面更新問題。
六、sitemap提交后,多久能被百度處理?
sitemap數(shù)據(jù)提交后,一般在1小時內(nèi)百度會開始處理。處理完成的時間視文件大小和您設(shè)置的抓取周期而定。
七、提交的sitemap都會被百度抓取并收錄嗎?
百度對已提交的數(shù)據(jù),不保證一定會抓取及收錄所有網(wǎng)址。是否收錄與頁面質(zhì)量相關(guān)。
<八、我可以壓縮我的 sitemap 嗎?它們是否需要用 gzip 壓縮?< p="">
可以。請使用 gzip 壓縮 Sitemap。無論壓縮與否,Sitemap 應(yīng)該小于 10MB(10,485,759字節(jié))。
<p九、xml格式的 sitemap 中,“priority”提示會影響我的網(wǎng)頁在搜索結(jié)果中的排名嗎?< p="">
不會。Sitemap 中的“priority”提示只是說明該網(wǎng)址相對于您自己網(wǎng)站上其他網(wǎng)址的重要性,并不會影響網(wǎng)頁在搜索結(jié)果中的排名。
十、網(wǎng)址在 Sitemap 中的位置是否會影響它的使用?
不會。網(wǎng)址在 Sitemap 中的位置并不會影響百度對它的識別或使用方式。
十一、Sitemap中提交的url能否包含中文?
因為轉(zhuǎn)碼問題建議最好不要包含中文。
生成工具
思途旅游CMS系統(tǒng)可以直接生成,并或者url地址。
贊
1
有一點幫助
0
沒有幫助
參與評論