有一些內容質量強的網頁頁面,客戶能夠正常的訪問,但百度Pider沒法正常的訪問和爬取,造成百度搜索普及率不夠,給百度百度搜索引擎和網站產生損害。百度稱這樣的事情為“占領除外”。百度百度搜索引擎會考慮到具體內容量大的網站在客戶體驗上存有沒法正常的爬取的缺點,減少對網站的評論在爬取、數據庫索引和排名層面,百度百度搜索引擎將遭受一定程度的不良影響,這將危害網站從百度得到的總流量。
以內敘述了對網站站長出現異常爬取的一些比較常見緣故:
服務器連接出現異常有2種狀況:一是網站不穩定,百度pider在試著聯接時臨時無法連接到您網站的網絡服務器;二是百度pider一直無法連接到您網站的網絡服務器。
服務器連接出現異常的緣故一般是您網站網絡服務器很大和負載。您網站也有可能運作異常請檢查網站的web服務器(如apache、iis)是否正常組裝和運作,并使用瀏覽器查驗主頁面能否正常的訪問。您網站和服務器也可能阻攔Baiduspider的訪問你必須查驗網站和服務器的服務器防火墻。
營運商除外:營運商分成電信和聯通兩大類百度Pider沒法根據電信網或網通電信訪問您網站。要是產生這樣的事情,您必須聯絡互聯網服務供應商,或購買服務器與二線服務項目或CDN服務。
DNS出現異常:當Baiduspider無法解析您網站的IP地址時,將發生DNS出現異常。有可能是您網站的IP地址不正確,或是域名注冊商早已嚴禁了Baiduspider請使用whois或host查驗您網站的IP地址是否正確和可分析。要是沒有,請聯系域名服務商升級您IP地址。
IP堵塞:IP堵塞是限制網絡的導出來IP地址,嚴禁該IP段的客戶訪問具體內容這兒,它實際是指百度Piderip的屏蔽掉。此設定僅在您網站不希望百度Pider訪問時才必須。如果您期待百度Pider訪問您網站,請檢查百度Pider IP是不是不正確地加入到有關設置中。你網站所屬的區域服務供應商也有可能嚴禁百度IP這時,您必須聯絡服務供應商以變更設定。
UA堵塞:UA是客戶服務器代理根據UA鑒別訪問者的真實身份。當一個網站訪問一個選定的UA并回到一個出現異常頁面(如403500)或跳轉到另一個頁面時,稱之為UA堵塞此設定僅在您不希望baidu pider訪問您網站時才必須。如果你想百度皮德訪問你網站,是不是有百度皮德魯在客戶代理商有關設定并立即改動它。
死鏈:頁面失效,不可以向使用者給予一切有使用價值信息內容的頁面為死鏈,包含協議書死鏈和具體內容死鏈
協議書死鏈:頁面的TCP協議書情況/HTTP協議書情況清楚地表明出死鏈,如404、403、503情況等。
具體內容死鏈:缺少對象的情況是正常的,但具體內容已被更改成不存在的、已被刪掉或需要權限的信息內容頁,與初始具體內容不相干。
針對死鏈,大家提議網站使用協議死鏈,根據百度百度站長工具死鏈專用工具遞交給百度,那樣百度能夠迅速地尋找死鏈,降低死鏈對客戶和各大搜索引擎的不良影響。
出現異常跳轉:跳轉是由網絡請求跳轉到另一個部位出現異常跳轉指下列狀況:
1)現階段頁面為失效頁面(具體內容已被刪掉、死鏈等),立即跳轉到上一個文件目錄或主頁,百度提議網站站長刪掉失效頁面的通道網頁鏈接
針對長期性跳轉到別的網站域名,當在網站上變更網站域名,百度提議應用301跳轉協議書開展設定。
別的出現異常:
1)針對百度邀請人的不可抗力事件:網頁頁面回到與百度邀請人正常的具體內容不一樣的方式。
2)針對百度UA的不可抗力事件:回到百度UA的網頁頁面個人行為與頁面的初始具體內容不一樣。
3)JS跳轉出現異常:網頁加載了百度無法識別的JS跳轉編碼,客戶根據百度搜索進到網頁頁面后跳轉。
4)壓力過大導致的出現意外堵塞:百度會依據網站經營規模、訪問量等數據,自動設置有效的工作壓力開展爬取。但壓力控制出現異常等異常現象下,網絡服務器會按照本身負荷開展維護出現意外鎖閉。在這樣的情況下,請在返回碼中回到503(近義“服務不可用”),便于百度Pider在一段時間內再度試著獲得連接。假如該網站處在空余情況,則將取得成功獲得該網站。