我們做的每一個方面都使搜索引擎捕獲和輸入,但事實上,在許多情況下我們也需要防止搜索引擎捕獲和輸入,例如,公司的內部測試網站,也許內部網,也許后臺登錄頁面,一定不能指望被外部人員發現,所以我們需要停止搜索引擎捕獲。
給咱們發一張制止查找引擎抓取網站的查找成果截圖:咱們能夠看到,描繪沒有被抓取到,而是有一句提示:因為該網站的robotstxt文件存在約束指令(約束查找引擎抓取),體系無法供給該頁面的內容描繪。Robots是站點與spider交流的重要途徑,站點經過robots文件聲明本網站中不想被查找引擎錄入的部分或許指定查找引擎只錄入特定的部分。
百度查找robots全新晉級晉級后robots將對網站視頻URL錄入抓取狀況僅當您的網站包括不期望被視頻查找引擎錄入的內容時,才需求運用robotstxt文件如果您期望查找引擎錄入網站上一切內容,請勿樹立robotstxt文件。
如您的網站未設置robots協議,百度查找對網站視頻URL的錄入將包括視頻播放頁URL,及頁面中的視頻文件視頻周邊文本等信息,查找對已錄入的短視頻資源將對用戶呈現為視頻極速體會頁此外,綜藝影視類長視頻,查找引擎僅錄入頁面URL.