? ? 如果我們從搜索引擎蜘蛛的角度去看待一個網站,在抓取、索引和排名時會遇到哪些問題呢?解決了這些問題的網站設計就是搜索引擎友好的。
? ? 1、 搜索引擎蜘蛛能不能找到網頁
? ? 要讓搜索引擎發現網站首頁,就必須要有外部鏈接到首頁,找到首頁后,蜘蛛沿著內部鏈接找到更深的內容頁,所以要求網站要有良好的結構,符合邏輯,并且所有頁面都可以通過可爬行的普通HTML鏈接達到。Javascript鏈接、Flash中的鏈接等搜索引擎蜘蛛一般不能跟蹤爬行,就會造成收錄問題。
? ? 網站所有頁面離首頁點擊距離不能太遠,最好在四五次點擊之內。要被搜索引擎收錄,頁面需要都有最基本的權重,良好的網站鏈接結構可以適當傳遞權重,使盡量多的頁面達到收錄門檻。
? ? 2、 找到網頁后能不能抓取頁面內容
? ? 被發現的URL必須是可以被抓取的。帶有過多參數的URL、Session ID、整個頁面是Flash、框架結構、可疑的轉向、大量復制內容等都可能使搜索引擎敬而遠之。
? ? 某些文件站長可能不希望被收錄,除了不鏈接到這些文件,更保險的方法是使用robots文件或者meta robots標簽禁止收錄。
? ? 3、 抓取頁面后怎樣提煉有用信息
關鍵詞在頁面重要位置的合理分布、重要標簽的撰寫、HTML代碼精簡、起碼的兼容性等,可以幫助搜索引擎理解頁面內容,提取有用信息。
? ? 只有搜索引擎能順利找到所有頁面,抓取這些頁面并提取出其中真正有關性的內容,網站才可以被視為是搜索引擎友好的。關于網站結構的優化,有一句話非常精辟:“良好引用、良好結構、良好導航”。
? ?