搜索引擎優(yōu)化SEO規(guī)范
搜索引擎簡介和SEO基礎
搜索引擎及其用戶價值
搜索引擎,是對互聯(lián)網(wǎng)的數(shù)據(jù)信息進行收集、整理,并提供檢索查詢服務的系統(tǒng)。搜索引擎擅長理解用戶搜索需求、對海量數(shù)據(jù)抓取、信息甄別和打分、快速查詢等工作。
搜索引擎根據(jù)用戶的檢索查詢要求,對數(shù)據(jù)信息進行打分排序,并按照順序輸出呈現(xiàn),幫助用戶方便、快速、準確、全面地找到所需信息,這是搜索引擎最重要的用戶價值。
[提示]一切SEO工作,都應以遵循搜索引擎工作原理和用戶價值為前提。
白帽SEO和黑帽SEO
白帽SEO,指通過合理優(yōu)化網(wǎng)站,提升用戶體驗,與搜索引擎良好交互,真實反映網(wǎng)站質(zhì)量和權威性的搜索引擎優(yōu)化方法。
黑帽SEO,以搜索引擎禁止的方法影響搜索引擎排序(作弊),與用戶價值和搜索體驗相背離,以短期利益為主要目標的搜索引擎優(yōu)化方法。搜索引擎會維護互聯(lián)網(wǎng)網(wǎng)站的公正排序,給用戶提供正確合理的搜索結果,而黑帽SEO的做法與此相違背。
搜索引擎在不斷通過技術革新、策略優(yōu)化來識別作弊行為。任何利用搜索引擎的策略缺陷漏洞,利用惡意手段獲取與網(wǎng)頁質(zhì)量不符的排名,引起用搜索結果質(zhì)量和用戶搜索體驗下降的行為都可能被搜索引擎識別為作弊行為。對待作弊行為,輕則被搜索引擎剝奪作弊權重,重則可能整個網(wǎng)站被搜索引擎拒絕收錄。
搜索引擎工作流程圖
[提示]對外,面向用戶和整個互聯(lián)網(wǎng)內(nèi)容;對內(nèi),分為抓取、索引、檢索幾個重要模塊。
搜索引擎爬蟲
搜索引擎的爬蟲程序(也叫Spider、蜘蛛、爬蟲機器人),是搜索引擎收集信息、數(shù)據(jù)的工具。爬蟲程序不斷發(fā)現(xiàn)和下載互聯(lián)網(wǎng)網(wǎng)頁,這個過程是互聯(lián)網(wǎng)網(wǎng)頁進入搜索引擎內(nèi)部必須經(jīng)歷的一關。
爬蟲程序擅長:分配下載資源,海量并發(fā)下載,讀取文字(特別是網(wǎng)頁文本),分析站點地圖并依此指引抓取頁面。相反爬蟲程序不擅長:讀取圖片、flash、JS、Ajax、frame,深層次、持續(xù)性抓取,讀取有權限控制的頁面,發(fā)現(xiàn)孤島頁面。
針對爬蟲程序的SEO工作應該根據(jù)其特點針對性進行。
[提示]搜索引擎爬行軌跡示意圖
搜索結果排序
搜索引擎通過理解用戶搜索詞、對數(shù)據(jù)進行檢索,可以得到諸多可能的搜索結果。對這些結果的排序要靠成百上千的相關性策略實現(xiàn)。
相關性排序的目的是將結果按照對用戶價值的高低排列,整個排序過程會參考網(wǎng)站、頁面的相關度、質(zhì)量、時新性、權威性等諸多因素綜合考察。
SEO工作很大一部分跟搜索引擎相關性策略有關,簡單來講即通過SEO來告訴搜索引擎:哪些頁面更有價值,哪些頁面更搜索詞更相關,而應該被排序到更靠前的位置。
網(wǎng)站建立
域名注冊
域名是網(wǎng)站的重要品牌印象。域名注冊時應選擇簡單、易記、方便輸入、貼近網(wǎng)站名稱、能反映網(wǎng)站內(nèi)容的域名。如fanli.qq.com、www.paipai.com。
域名一旦選定,不應隨意變更;同一網(wǎng)站擁有多個域名應確定主要域名,并設置其他域名向主要域名跳轉。
服務部署和網(wǎng)站上線
網(wǎng)站需要部署上線才能被用戶訪問。
租用/購買安全可靠、高速穩(wěn)定的服務器部署網(wǎng)站,是用戶訪問體驗的有效保障,同時會影響搜索引擎爬蟲的爬取。
網(wǎng)站部署上線并進行域名解析后,即面向用戶開發(fā)訪問,同時也意味著向搜索引擎爬蟲開放。
讓搜索引擎發(fā)現(xiàn)網(wǎng)站
新建立的網(wǎng)站是互聯(lián)網(wǎng)中的孤島,搜索引擎也很難發(fā)現(xiàn)和收錄它。在網(wǎng)站建立之初,可以將網(wǎng)站推薦給搜索引擎或者引導爬取收錄。
向搜索引擎提交網(wǎng)站域名或入口。如向SOSO的提交新網(wǎng)站,http://www.soso.com/help/usb/urlsubmit.shtml;
建立外鏈,如創(chuàng)建友情鏈接、向導航網(wǎng)站申請收錄等;
網(wǎng)站建立之初可重點經(jīng)營內(nèi)容列表頁,在不影響用戶體驗的前提下,方便搜索引擎爬蟲一次發(fā)現(xiàn)更多鏈接。
內(nèi)容建設
樹型扁平網(wǎng)狀結構
層級分明的樹型扁平網(wǎng)狀結構是較理想的網(wǎng)站部署結構,每個頁面與其父子頁面有鏈接關聯(lián),可以幫助用戶快速定位到感興趣的頻道、正文,也有利于搜索引擎理解網(wǎng)站結構層次和更好的爬取內(nèi)容。
明確區(qū)分出,網(wǎng)站首頁、列表頁/索引頁/頻道頁、內(nèi)容頁,根據(jù)各個頁面所在層級用鏈接相連,無孤島頁面;
層級、各層級分支內(nèi)容不要過多,便于搜索引擎爬蟲爬取;
內(nèi)容和質(zhì)量相似的頁面組織在同一層級/目錄中,便于搜索引擎進行聚合挖掘;
越重要的內(nèi)容,越應放置于高層級位置,或在高層級頁面中有鏈接直接可達;
在頁面中建立導航鏈接、面包屑,便于用戶和爬蟲理解網(wǎng)站結構和在不同層級內(nèi)容間跳轉;
站點中新的內(nèi)容應該盡量在深度較淺的列表頁或首頁發(fā)布入口,便于被搜索引擎爬蟲快速發(fā)現(xiàn)。
頁面標題
頁面標題是頁面內(nèi)容的重要標識,準確簡潔的標題有助于用戶快速識別頁面內(nèi)容。頁面標題會被搜索引擎展現(xiàn)在搜索結果列表中,是用戶通過搜索進入網(wǎng)站頁面的重要入口。
標題內(nèi)容在頁面代碼中被
每個頁面都應該擁有標題內(nèi)容,避免不寫標題,或無意義標題(如“無標題文檔”、“網(wǎng)站建設中”);
避免不同頁面使用相同標題(甚至全站公用相同標題);
不在標題內(nèi)容中堆砌關鍵詞,避免影響可讀性和被判作弊;
“標題黨”、“文不對題”對用戶搜索體驗和搜索引擎收錄排序均有副作用,應堅決杜絕。
Meta信息
Meta信息中,keywords和description分別以關鍵詞和概括摘要兩種方式描述頁面內(nèi)容,會被搜索引擎特別關注。
keywords部分應填入最能表現(xiàn)頁面內(nèi)容的幾個關鍵詞,詞與詞之間以半角逗號間隔開;
description部分應填入一段介紹頁面內(nèi)容的文字,這段文字有可能被搜索引擎選取作為結果摘要。網(wǎng)站首頁、索引頁、頻道入口等無大篇幅頁面正文的頁面,應該盡可能提供description信息。
keywords和description信息缺失不會對排序權重產(chǎn)生直接影響;在keywords和description信息中堆砌關鍵詞作弊可能受到搜索引擎懲罰。
鏈接
制定規(guī)范統(tǒng)一、簡潔、可讀的url,有利于搜索引擎的收錄和排序,也會方便用戶識別頁面內(nèi)容,記錄和輸入鏈接。
每個頁面都應擁有其獨一無二的正常態(tài)url:
網(wǎng)站內(nèi)統(tǒng)一使用正常url,不出現(xiàn)異常url;
指向同一頁面異常url,應跳統(tǒng)一跳轉到正常url上;
必須帶有參數(shù)的url需要精簡參數(shù)個數(shù)和內(nèi)容,對頁面功能/展現(xiàn)無作用(如統(tǒng)計參數(shù))的應盡量去除。
鏈接結構設計建議:
url結構的設計應同時考慮用戶和搜索引擎的需求,方便用戶識別、記憶,并利于搜索引擎爬取和展現(xiàn);
url應盡量短。較短的url會在搜索結果頁完全展現(xiàn),方便用戶通過讀取其以了解頁面內(nèi)容,也易于記憶和傳播。搜索引擎本身不會對url進行限制,排序跟url長度無關;
url目錄層級越少越好。層級過多的url設計可能對搜索引擎的爬取形成障礙,使得收錄變少或不收錄;
url中目錄名、文件名應具有描述性,不使用無意義的名稱;
url中盡量只使用小寫字母或數(shù)字,特別注意不要使用特殊字符,如“.”“,”“;”等;
去除url中不必要參數(shù)和靜態(tài)化。無論動態(tài)或靜態(tài)url ,搜索引擎均可正常爬取和檢索,但建議盡量精簡去除url中不必要的參數(shù),特別是與頁面功能/展現(xiàn)無關的參數(shù)。
錨文本設計建議
鏈接應選擇文字作為鏈接描述,即錨文本,盡量少使用圖片作為鏈接內(nèi)容,必須使用圖片時,應同時使用alt標記補充文字描述,不要用flash、js替代文本鏈接(特別是重要入口);
錨文本應簡潔精煉,明確描述頁面內(nèi)容;不要在錨文本里編寫與頁面內(nèi)容無關的文字,更不要堆砌關鍵詞或者“標題黨”;
非必要的情況下,不要使用url本身作為錨文本。
鏈接設計GoodCase
http://finance.qq.com/stock,http://t.qq.com/liuxiang,子域名、目錄描述了頁面主題或內(nèi)容;
http://finance.qq.com/a/20110317/005789.htm,新聞頁面目錄標識了發(fā)布日期;
鏈接設計BadCase
鏈接url為js生成,搜索引擎無法爬取到鏈接指向頁面。
http://7.sixjoy.com/webplat/info/news_version3/87/97/98/99/m51/201103/2763.shtml,鏈接陷阱/黑洞,這類url目錄構造對用戶和搜索引擎均無意義,搜索引擎可能不會爬取或者不索引這類url。
錨文本內(nèi)容無意義。類似“更多”“返回”的文本對頁面內(nèi)容的描述沒有貢獻,不建議使用。
首頁鏈接全部在flash內(nèi)部,無法獲取更多站內(nèi)鏈接,同時結果頁摘要顯相關較差。
全站頁面標題全部相同,無法體現(xiàn)頁面內(nèi)容,在搜索結果和瀏覽器中均不易讓用戶識別,同時搜索引擎無法通過標題了解頁面內(nèi)容;
頁面內(nèi)容和服務
提供高質(zhì)量的網(wǎng)站內(nèi)容和服務是網(wǎng)站的立足之本,同時也是影響搜索引擎對網(wǎng)站內(nèi)容評價的重要因素和指標。
提供圍繞網(wǎng)站主題或頁面主題的內(nèi)容或數(shù)據(jù),自然、美觀的書寫頁面內(nèi)容,滿足用戶的閱讀需求,這是對用戶最有價值的服務:
給用戶提供便于閱讀的頁面。頁面布局合理,突出展現(xiàn)重點內(nèi)容,內(nèi)容間有主次、段落,避免一大堆文字的粗暴羅列;
在頁面中放置面包屑導航。面包屑對用戶辨識頁面作為位置、層級有幫助,還能快速在不同頻道間切換。SOSO音樂/SOSO問問/騰訊網(wǎng)新聞頻道的面包屑導航:
提供與眾不同的原創(chuàng)內(nèi)容或服務,避免抄襲內(nèi)容或重復發(fā)布相似、相同內(nèi)容;
與主題不相關或弱關性的內(nèi)容,如廣告、站內(nèi)推廣鏈接等,應放置于頁面次要內(nèi)容,并且不占用過多篇幅;
不要有拼寫錯誤或錯別字。
同時,頁面內(nèi)容建設也照顧搜索引擎讀取頁面的“感受”:
頁面正文用文本書寫,不要用圖片、flash代替,或用ajax生成;
站內(nèi)導航和面包屑易于搜索引擎爬取頁面、獲取錨文本和分析鏈接權重;
使用圖片作為內(nèi)容時,為圖片添加alt信息,圖片文件使用簡潔直白的命名(類似給頁面的命名);
不要使用iframe構造頁面。
robots.txt和Sitemap
robots.txt和sitemap是站長和搜索引擎交流的工具,為搜索引擎的爬取、收錄、排序行為提供參考。robots.txt和sitemap均不涉及對用戶體驗的直接影響。
robots.txt:
robots.txt文件,需要準確命名為”robots.txt”(文件名小寫,擴展名為txt,),放置于網(wǎng)站域名的根目錄下,能被正常訪問;
可以使用robots.txt限制搜索引擎爬蟲訪問某些頁面、目錄或者整合網(wǎng)站。如供網(wǎng)站管理員使用的在線管理系統(tǒng),或用戶隱私信息頁面,均可以此方法控制;
可以在robots.txt指定sitemap地址。
User-agent: *
Disallow: /admin/
Disallow: /ads/
Sitemap: http://www.soso.com/sitemap.xml
[提示]以上是一段robots.txt文件的示例。標識了拒絕搜索引擎訪問的路徑和sitemap地址
Sitemap:
Sitemap中可以指定url的更新時間、更新頻率、相對權重等信息;
重要的url應該出現(xiàn)在Sitemap中,給予較高權重;
搜索引擎會參考Sitemap中的信息進行爬取、索引和排序,但不會完全遵守;
其他
搜索引擎在響應網(wǎng)站內(nèi)容變化需要時間,特別是針對網(wǎng)站內(nèi)容建設的SEO是逐漸生效的,改變網(wǎng)站幾個頁網(wǎng)頁內(nèi)容就能迅速提高網(wǎng)站排名的觀點是錯誤的;
搜索引擎對于不符合規(guī)范的網(wǎng)站建設方式或者過度SEO有一定容忍能力,并不會因為網(wǎng)站建設不當而直接拒絕爬取、收錄、索引某個網(wǎng)站;
面向SEO的網(wǎng)站建設策略和用戶體驗應兼顧,甚至更多考慮用戶體驗,避免為了SEO而SEO。
網(wǎng)站運營和推廣
面向用戶的網(wǎng)站運營和推廣工作,可以起到引入和沉淀用戶、建設網(wǎng)站口碑、增強用戶黏性的作用。而然,網(wǎng)站運營和推廣同樣可以在SEO工作中發(fā)揮作用,下面從這個維度來簡單介紹。
內(nèi)容運營
原創(chuàng)內(nèi)容建設
網(wǎng)站建設以內(nèi)容為王,在內(nèi)容質(zhì)量、原創(chuàng)、全面、權威等方面有優(yōu)勢的網(wǎng)站,更容易贏得用戶好感,同時也會贏得搜索引擎收錄和排序的傾向。
搜索引擎非常喜歡原創(chuàng)內(nèi)容(特別是對于新站來說)在網(wǎng)站上主動發(fā)布或引導用戶來發(fā)布原創(chuàng)內(nèi)容,增加原創(chuàng)內(nèi)容比例,會讓搜索引擎更快收錄,同時在內(nèi)容排重、排序上占得優(yōu)勢。
規(guī)律的內(nèi)容維護
規(guī)律的內(nèi)容更新時間和更新規(guī)模,有助于搜索引擎合理調(diào)度爬蟲進行抓取。更新較快較多的網(wǎng)站,也容易贏得搜索引擎爬蟲的高頻率光顧。
廣告內(nèi)容運營
廣告能為網(wǎng)站帶來收入,是網(wǎng)站運營不能回避的運營工作。從SEO角度看來,也有些應注意的優(yōu)化點。
網(wǎng)站內(nèi)容和廣告內(nèi)容應區(qū)分出主次,突出頁面核心內(nèi)容,利于搜索引擎理解頁面內(nèi)容,而不應滿屏廣告;
廣告內(nèi)容應配合頁面內(nèi)容,與頁面內(nèi)容、主題相關(搜索引擎爬蟲可能采集廣告內(nèi)容作為頁面正文);
不要將廣告內(nèi)容偽裝成頁面正文或鏈接,誘導點擊。
增加外鏈和積累有效錨文本
站外鏈接和錨文本是網(wǎng)站的重要SEO資源,承擔著入口、頁面內(nèi)容識別、權重引入等諸多參與搜索引擎爬取、排重、排序工作的信息。對外鏈和錨文本的建設,是SEO工作中極重要的一環(huán)。
以下是一些外鏈、錨文本建設的建議:
互換友情鏈接、申請導航站收錄;
建設外鏈資源時,應合理設置錨文本,盡量不要以url做錨文本;
不止網(wǎng)站首頁需要外鏈,二級列表頁、專題頁、頻道首頁、特色頁面等,同樣需要外鏈建設;
可以發(fā)布網(wǎng)站功能特色介紹的文章,期間包含網(wǎng)站外鏈;
博客博文、微博、論壇帖子中出現(xiàn)的網(wǎng)站鏈接,對外鏈和錨文本建設有益,可將網(wǎng)站介紹文章轉發(fā)于此,但不要泛濫建設;
博客評論區(qū)、留言板、bbs簽名檔等非主要區(qū)域的外鏈價值極低,可能被搜索引擎忽略;
外鏈、錨文本應避免泛濫建設,否則可能被判為作弊。
用戶推薦和評價
用戶有鑒別內(nèi)容質(zhì)量的能力,通過用戶對網(wǎng)站內(nèi)容的推薦和評價,可以幫助網(wǎng)站篩選好的內(nèi)容,甚至制造外鏈。
建立用戶對內(nèi)容投票機制,獲取用戶評價;
提供方便的分享工具,可將內(nèi)容推薦到其他產(chǎn)品平臺,形成有價值外鏈;
[提示]一個常見的分享功能設計
培養(yǎng)用戶黏性,并適當鼓勵用戶對朋友推薦網(wǎng)站內(nèi)容(包括在IM、博客、論壇等平臺上推薦)。
TAG:
評論加載中...
|