很多初學者一直分不清“抓取”與“收錄”有什么區別,甚至認為這兩者是同一個意思,那么真是大錯特錯。掌握搜索引擎抓取、收錄的工作原理,對于seo優化甚至其他搜索引擎優化將會有很大的幫助。
一、抓取原理 搜索引擎在抓取到我們網站的前提是必須要有渠道,當你新建一個域名,新建了一個普通頁面,頁面沒有經過任何人的訪問,也沒有任何地方出現過你的頁面,那么搜索引擎是無法正確的抓取到你的頁面的,之所你建議頁面以后什么都沒有操作,搜索引擎一樣可以抓取和收錄,其原因主要是通過以下幾個渠道。 鏈接渠道:我們做外鏈的主要目的是什么,更重要的是讓搜索引擎能夠通過此鏈接正確的抓取到我們的網站,這也是SEOER都在說,現在新站建議做外鏈,老站就沒必要的原因之一。 提交渠道:80%的站點在建立以后會手動提交到搜索引擎,這是搜索引擎在收錄到更多站點的一個重點渠道。 二、收錄原理 為什么同時發布兩篇文章,一篇被收錄,還有一篇未收錄? 對比:當搜索引擎在抓取到你網站的文章頁面的時候,會識別你的每一個內頁的相同區與不同區,也你網站的不同區將會被定義為主題內容區域,然后拿著你的主題內容與其他網站的主題內容進行對比,分出你頁面主題內容的原創度。 分類:通過對你的站點進行對比后,可以直接對你的內容進行分類,如同一篇關于SEO相關的文章,搜索引擎可直接通過對比來判斷,你的網站屬于那種類型,是否適合你的站點。 用戶得分:分類之后,并不是代表搜索引擎就一定會收錄你的文章,主要還是要依靠用戶的得分,用戶的點擊率、停留時間判斷出此文的價值。