新(xīn)聞中心

百度站(zhàn)長平台:什(shén)麽樣的網站(zhàn)符合百度蜘蛛抓取習慣

類型 : 行業動态

 

    9月(yuè)(yuè)12日百度站(zhàn)長平台lee撰文介紹了(le)怎樣的網站(zhàn)才是符合搜索抓取習慣的網站(zhàn)。站(zhàn)長們建站(zhàn)時(shí)主要應注意:1、簡單明了(le)的網站(zhàn)結構;2、簡潔美觀的url規則;還有robots文件、sitemap文件等相關(guān)因素亦不可忽略。
 
以下(xià)為(wèi)百度站(zhàn)長平台lee發布全文《建立符合搜索抓取習慣的網站(zhàn)》:
 
1、簡單明了(le)的網站(zhàn)結構
 
Spider抓取相當于對web這(zhè)個(gè)有向圖進行遍曆,那麽一(yī)個(gè)簡單明了(le)結構層次分(fēn)明的網站(zhàn)肯定是它所喜歡的,并盡量保證spider的可讀性。
 
(1)樹型結構最優的結構即“首頁—頻道—詳情頁”;
 
(2)扁平首頁到詳情頁的層次盡量少,既對抓取友好(hǎo)(hǎo)又可以很好(hǎo)(hǎo)的傳遞權重。
 
(3)網狀保證每個(gè)頁面都至少有一(yī)個(gè)文本鏈接指向,可以使網站(zhàn)盡可能(néng)全面的被抓取收錄,内鏈建設同樣對排序能(néng)夠産生(shēng)積極作(zuò)用。
 
(4)導航為(wèi)每個(gè)頁面加一(yī)個(gè)導航方便用戶知曉所在路(lù)徑。
 
(5)子(zǐ)域與目錄的選擇相信有大批的站(zhàn)長對此有疑問,在我們看來(lái),當内容較少并且内容相關(guān)度較高時(shí)建議(yì)以目錄形式來(lái)實現(xiàn),有利于權重的繼承與收斂;當内容量較多并且與主站(zhàn)相關(guān)度略差時(shí)建議(yì)再以子(zǐ)域的形式來(lái)實現(xiàn)。
 
2、簡潔美觀的url規則
 
(1)唯一(yī)性網站(zhàn)中同一(yī)内容頁隻與唯一(yī)一(yī)個(gè)url相對應,過多形式的url将分(fēn)散該頁面的權重,并且目标url在系統中有被濾重的風(fēng)險;
 
(2)簡潔性動态參數盡量少,保證url盡量短;
 
(3)美觀性使得用戶及機器(qì)能(néng)夠通過url即可判斷出頁面内容的主旨;
 
我們推薦如(rú)下(xià)形式的url:url盡量短且易讀使得用戶能(néng)夠快(kuài)速理(lǐ)解,例如(rú)使用拼音(yīn)作(zuò)為(wèi)目錄名稱;同一(yī)内容在系統中隻産生(shēng)唯一(yī)的url與之對應,去掉無意義的參數;如(rú)果無法保證url的唯一(yī)性,盡量使不同形式的url301到目标url;防止用戶輸錯的備用域名301至主域名。
 
3、其他注意事(shì)項
 
(1)不要忽略倒黴的robots文件,默認情況下(xià)部分(fēn)系統robots是封禁搜索引擎抓取的,當網站(zhàn)建立後及時(shí)查看并書寫合适的robots文件,網站(zhàn)日常維護過程中也(yě)要注意定期檢查;
 
(2)建立網站(zhàn)sitemap文件、死鏈文件,并及時(shí)通過百度站(zhàn)長平台進行提交;
 
(3)部分(fēn)電商(shāng)網站(zhàn)存在地域跳(tiào)轉問題,有貨無貨建議(yì)統一(yī)做成一(yī)個(gè)頁面,在頁面中标識有無貨即可,不要此地區無貨即返回一(yī)個(gè)無效頁面,由于spider出口的有限性将造成正常頁面無法收錄。
 
(4)合理(lǐ)利用站(zhàn)長平台提供的robots、sitemap、索引量、抓取壓力、死鏈提交、網站(zhàn)改版等工具。
地址 : 浙江省湖州市(shì)吳興區加利廣場(chǎng)
QQ : 2279641406 547859428
電話(huà):13735195038 傳真:0572-2198989
電子(zǐ)郵件:[email protected] 網址:www.hzhope.com
後普網絡 版權所有 Copyright © 2018 網站(zhàn)地圖 | 免責申明 | 聯系我們