百度收錄網站的基本要求是什么？

　　提到百度收錄的網站的要求，最開始我不得不說的就是搜索引擎爬蟲的抓取。如果搜索引擎爬蟲不能抓取你的網站，或者爬蟲無法識別網頁內容的話，那百度幾乎不會收錄你的網站了。

　　爬蟲抓取的可識別性

　　在爬蟲抓取網頁時，如果根本不知道你的網頁內容是什么，那基本上是不會被百度收錄的。所以讓爬蟲識別到我們網頁的內容也是較為關鍵的一個問題。

　　1、robots協議的封禁

　　robots是一個txt文件，放置于網站的根目錄下。可以通過www.xxx.com/robots.txt進行訪問打開。如果你的robots文件封禁了百度爬蟲，那么收錄簡直是不可能的。

　　因為robots協議文件是搜索引擎與網站之間的協議文件。是網站告知搜索引擎爬蟲，哪些內容你可以抓取，哪些內容你是不可以抓取。所以你都告訴爬蟲不讓它抓取了，他還怎么會抓取呢?

　　2、影響網站收錄的ajax技術

　　js的ajax技術，其實很多做seo的都知道不能使用js，但這并不完全是。因為爬蟲抓取的是網頁源代碼，只要你源代碼中有這些內容就是可以的。但通過js實現異步加載的內容就不行了。

　　這里解釋一下什么是異步加載，就是當前網頁源代碼沒有的內容。通過觸發網頁某個事件，js通過ajax技術動態加載出來的內容。例如典型的瀑布流網頁，當你鼠標滾動到最底部，然后地步就會出現更多新的內容。多數是采用這個ajax技術。