經常有客戶來深圳商企云信息技術有限公司,咨詢網站建設的相關方案,尋求網站的優化推廣的方法,近日我們對此也做了一系列的總結,希望能幫助到一部分網絡新人。
第一、網站首頁不收錄的幾點問題
1.網站模板是套用的模板
沒有做任何的布局或者框架改動,很多網絡公司為了省時、省力、省錢。直接給客戶套用的模板。導致網絡重復率過高,百度不喜歡重復率過高的東西。
解決方法:
在套用模板的基礎上適當的改一下布局,稀釋一下網絡相似度,能提高收錄的成功率。最好的解決方法就是人工設計網站架構。
2.網站內容過少
網站剛剛制作出來就上線,百度蜘蛛來爬取之后發現沒有任何有用的價值。
解決方法:
網站制作完先本地測試或者服務器域名測試,測試無誤后開始添加內容,最起碼把內容填充滿頁面之后再解析域名上線,百度蜘蛛再來抓取能抓取到很多內容。能大大的提高收錄幾率。
3.robots.txt設置的問題
robots設置了蜘蛛禁止爬取或者你的站內沒有robots文件。
解決方案:
查看你站內是否有robots.txt文件,如果沒有,那么你制作一個上傳。網站必須要有robots文件。
查看方法直接在你的域名后面輸入:域名/robots.txt能打開就是有,打不開就是沒有。
4.有的robots.txt自動屏蔽動態頁面,你的內容是動態的所以導致不收錄。
解決方法:
把你的網站生成靜態頁面,很多程序自帶生成靜態頁面功能;
把robots禁止抓取動態取消掉即可。
常規robots.txt的相關寫法(更多方法可咨詢深圳商企云信息技術有限公司):
User-agent:*這里的*代表的所有的搜索引擎種類,*是一個通配符
Disallow:/admin/這里定義是禁止爬尋admin目錄下面的目錄
Disallow:/require/這里定義是禁止爬尋require目錄下面的目錄
Disallow:/ABC/這里定義是禁止爬尋ABC目錄下面的目錄
Disallow:/cgi-bin/*.htm禁止訪問/cgi-bin/目錄下的所有以”.htm”為后綴的URL(包含子目錄)。
Disallow:/*?*禁止訪問網站中所有包含問號(?)的網址
Disallow:/.jpg$禁止抓取網頁所有的.jpg格式的圖片
Disallow:/ab/adc.html禁止爬取ab文件夾下面的adc.html文件
Allow:/cgi-bin/這里定義是允許爬尋cgi-bin目錄下面的目錄
Allow:/tmp這里定義是允許爬尋tmp的整個目錄
Allow:.htm$僅允許訪問以”.htm”為后綴的URL
Allow:.gif$允許抓取網頁和gif格式圖片
Sitemap:網站地圖告訴爬蟲這個頁面是網站地圖
5.內容違反百度規定
例如你的站是灰色行業或者黑色行業。百度當然不會讓你收錄的。
解決方法:
利用heimao技術從代碼上騙過百度蜘蛛,認為你是正規行業,而客戶訪問的時候顯示的是你要宣傳的產品。
以上五點是新站不收錄的主要原因,還有很多次要原因如以下:
1.服務器不穩定:這個不會是影響首頁收錄的主要因素,服務器不穩定會影響內頁的收錄。
2.過多的js代碼:百度不喜歡js代碼,如果你站內js代碼過多,又加上網站不是很討人喜歡,那么恭喜你。怎么會給你收錄。
3.域名以前被K過:以前被K過的域名短期內是不會被收錄的,注冊購買域名的時候需謹慎。
二、網站內頁不收錄的原因和解決方法
1.文章內容過少
隨著做seo時間越來越長你會慢慢的發現,文章越長越容易收錄。
原因和解決方法:
因為文章長會減少網絡相似度,百度會判定你為原創的幾率高。文章長說明內容豐富,不豐富幾句就完事。
在合理的情況下盡量的增加文章內容,但并不意味著是復制黏貼。
2.在1的基礎上增加內容的豐富度
在文章里合理的穿插圖片,所謂的圖文并用,能大大提高文章的質量。切記:圖片要標示一個和文章標題相似或者相關的alt。
圖片內容要和文章相關,不要隨意穿插圖片。
3.網站架構問題,樣板文字過多。
用站長工具模擬蜘蛛搜索可以看出,百度對比的都是頁面。
由于頁面本身架構和內容過多,會提高文章的相似度。對于你站內來說你更新的大部分文章百度會認為是一篇。因為相似度太高。
4.直接抄襲
很多人懶到了極致,抄襲文章都不帶改的。甚至都沒有閱讀一遍,連別人的文章內有超鏈接、品牌詞等一起抄襲了過來。
不知道你這么做的意義何在?最起碼給被抄襲的人帶來了宣傳。
解決方法:
復制的內容要走一遍txt,去掉相關的格式和鏈接;
抄襲的文章要進行修飾修改,閱讀一遍在原文章的基礎上改的更利于閱讀。
5.網站層次問題
由于你的網站層次太深,百度蜘蛛無法抓取到你的內容,既然抓取不到何來收錄之說?
解決方法:
減少網站的層次,層次比較少又比較重要的內容在首頁增加一個入口。
6.網站權重問題
百度曾經說過第三方工具的權重不準,說明百度是有權重等級的,只是沒有公布出來。所以權重越高越利于收錄。
解決方法:
在優化過程中多多提高網站的權重。站得高才能尿的遠。權重高了才是王道。
7.外鏈
不光你的首頁需要外鏈,你的內頁有的時候也需要外鏈。內容適當的發布幾個外鏈,能大大的提高該內容的收錄率。
8.空間不穩定、內部鏈接不合理。
這兩條網站不收錄的次要因素也是主要因素。因為你的空間非常不穩定,幾乎打不開。那能收錄就怪了。