幫助文檔
駁“凡客目錄的長度(深度)對SEO的影響”論
在長時間服務(wù)凡客用戶的過程中,經(jīng)常有部分用戶向我抱怨:凡客的目錄有四個文件夾,目錄太深,不影響SEO。我也有時候問他們:為什么會認為有影響?他們對此的回答多為:太長了用戶體驗性不好、會影響權(quán)限、其次是影響蜘蛛抓取,對此論調(diào),我也會搜索網(wǎng)站相關(guān)文章,也不乏有些類似的文章做依據(jù),(注:凡客的最長目錄樣式為:http://demo.ecisp.cn/html/cn/news/gongsixinwen/18.html),但介于本人從事多年的軟件開發(fā),也從事過搜索引擎相關(guān)的系統(tǒng)開發(fā)工作,對蜘蛛原理也算了解,本文階于通過技術(shù)層面來分析:為什么這些論調(diào)是錯誤的。
在反駁相關(guān)問題之前,我們先來了解一下網(wǎng)絡(luò)蜘蛛及網(wǎng)站權(quán)重的基本知識。
一、網(wǎng)絡(luò)蜘蛛
網(wǎng)絡(luò)蜘蛛又稱網(wǎng)絡(luò)爬蟲,傳統(tǒng)的爬蟲從一個或若干初始網(wǎng)頁的URL開始,獲得初始網(wǎng)頁上的URL,在抓取網(wǎng)頁的過程中,不斷從當前頁面上抽取新的URL放入隊列,直到滿足系統(tǒng)的一定停止條件,而后來對抓取頁面進行不同的分析和處理,以提高智能化的搜索結(jié)果排名。如果把整個互聯(lián)網(wǎng)當成一個網(wǎng)站,那么網(wǎng)絡(luò)蜘蛛就可以用這個原理把互聯(lián)網(wǎng)上所有的網(wǎng)頁都抓取下來。
由于不可能抓取所有的網(wǎng)頁,有些網(wǎng)絡(luò)蜘蛛對一些不太重要的網(wǎng)站,設(shè)置了訪問的層數(shù)。例如,在圖1中,A為起始網(wǎng)頁,屬于0層,B、C、D、E、F屬于第1層,G、H屬于第2層,I、J屬于第3層。如果網(wǎng)絡(luò)蜘蛛設(shè)置的訪問層數(shù)為2的話,網(wǎng)頁I、J是不會被訪問到的。這也讓有些網(wǎng)站上一部分網(wǎng)頁能夠在搜索引擎上搜索到,另外一部分不能被搜索到。但按如圖2中,假如J的層級在A層級中出現(xiàn),則J被視為和A一樣的同一級,也會被抓取。所以,對于網(wǎng)站設(shè)計者來說,扁平化的網(wǎng)站結(jié)構(gòu)設(shè)計有助于搜索引擎抓取其更多的網(wǎng)頁。
圖1
圖2
?
網(wǎng)絡(luò)蜘蛛進入一個網(wǎng)站,一般會訪問一個特殊的文本文件Robots.txt,這個文件一般放在網(wǎng)站服務(wù)器的根目錄下,網(wǎng)站管理員可以通過robots.txt來定義哪些目錄網(wǎng)絡(luò)蜘蛛不能訪問,或者哪些目錄對于某些特定的網(wǎng)絡(luò)蜘蛛不能訪問。例如有些網(wǎng)站的可執(zhí)行文件目錄和臨時文件目錄不希望被搜索引擎搜索到,那么網(wǎng)站管理員就可以把這些目錄定義為拒絕訪問目錄。Robots.txt語法很簡單,例如如果對目錄沒有任何限制,可以用以下兩行來描述:?User-agent:?*?Disallow:
當然,Robots.txt只是一個協(xié)議,如果網(wǎng)絡(luò)蜘蛛的設(shè)計者不遵循這個協(xié)議,網(wǎng)站管理員也無法阻止網(wǎng)絡(luò)蜘蛛對于某些頁面的訪問,但一般的網(wǎng)絡(luò)蜘蛛都會遵循這些協(xié)議,而且網(wǎng)站管理員還可以通過其它方式來拒絕網(wǎng)絡(luò)蜘蛛對某些網(wǎng)頁的抓取。
網(wǎng)絡(luò)蜘蛛在下載網(wǎng)頁的時候,會去識別網(wǎng)頁的HTML代碼,在其代碼的部分,會有META標識。通過這些標識,可以告訴網(wǎng)絡(luò)蜘蛛本網(wǎng)頁是否需要被抓取,還可以告訴網(wǎng)絡(luò)蜘蛛本網(wǎng)頁中的鏈接是否需要被繼續(xù)跟蹤。例如:?表示本網(wǎng)頁不需要被抓取,但是網(wǎng)頁內(nèi)的鏈接需要被跟蹤。
一般的網(wǎng)站都希望搜索引擎能更全面的抓取自己網(wǎng)站的網(wǎng)頁,因為這樣可以讓更多的訪問者能通過搜索引擎找到此網(wǎng)站。為了讓本網(wǎng)站的網(wǎng)頁更全面被抓取到,網(wǎng)站管理員可以建立一個網(wǎng)站地圖,即Site?Map。許多網(wǎng)絡(luò)蜘蛛會把sitemap.htm文件作為一個網(wǎng)站網(wǎng)頁爬取的入口,網(wǎng)站管理員可以把網(wǎng)站內(nèi)部所有網(wǎng)頁的鏈接放在這個文件里面,那么網(wǎng)絡(luò)蜘蛛可以很方便的把整個網(wǎng)站抓取下來,避免遺漏某些網(wǎng)頁,也會減小對網(wǎng)站服務(wù)器的負擔。
?
二、企業(yè)網(wǎng)站權(quán)重
在了解了網(wǎng)絡(luò)蜘蛛原基本原理之后,我們現(xiàn)在了解一下網(wǎng)站權(quán)重的基本知識,網(wǎng)站權(quán)重是指:搜索引擎給網(wǎng)站賦予一定的權(quán)威值,對網(wǎng)站權(quán)威的評估評價,一個網(wǎng)站權(quán)重越高,在搜索引擎所占的份量越大,在搜索引擎排名就越好。網(wǎng)站權(quán)重雖然很多SEOER都在議論,不過可能這個標準在部分搜索引擎中根本就不存在,概括的說:就是網(wǎng)站與網(wǎng)站在搜索引擎眼中的分級制“待遇”的不同表現(xiàn)。誤區(qū):例如人們經(jīng)常討論的百度權(quán)重其實并不是百度官方給出的概念,而是一些第三方站長網(wǎng)站推出的針對網(wǎng)站關(guān)鍵詞排名預(yù)計給網(wǎng)站帶來流量,劃分等級0-10第三方網(wǎng)站歡迎度評估數(shù)據(jù)。影響網(wǎng)站權(quán)重的因素較多,主要有以下幾種:
網(wǎng)站架構(gòu)
網(wǎng)站架構(gòu)不僅要迎合搜索引擎,更要符合用戶體驗的要求。優(yōu)質(zhì)的網(wǎng)站架構(gòu)應(yīng)是扁平式,即:主頁>欄目頁>內(nèi)容頁,同時站點還應(yīng)包含TAG標簽,留言評論、文章搜索等。
域名類型
一般而言,gov和edu類型的域名權(quán)重自身就比較高,因為這樣的站點屬于政府高校一般不會成為垃圾站點,不會是草根個人小站。其次,com、net、org的域名權(quán)重相對較高,一些有國家和地區(qū)特點的域名后綴建議不要選。從用戶習(xí)慣來看,com已成為首選。最后域名的注冊年齡越久,搜索引擎給予的信任越高。
導(dǎo)入鏈接
所謂的導(dǎo)入鏈接即外鏈。外鏈的質(zhì)量和數(shù)量應(yīng)認真做好。通常,我們要堅持每天穩(wěn)定的增加外鏈,在數(shù)量和質(zhì)量上,優(yōu)先考慮質(zhì)量。所以平時我們應(yīng)注意多收集一些能做外鏈的優(yōu)質(zhì)博客、論壇,以備不時之需。
網(wǎng)站內(nèi)容
雖說“天下文章一大抄,看你會抄不會抄”,但我們?nèi)越ㄗh站長能練就一副好筆桿。若能堅持給網(wǎng)站創(chuàng)造出優(yōu)質(zhì)的原創(chuàng)內(nèi)容,事實上就是給搜索引擎注入了新鮮的血液。實在是不能原創(chuàng)的時候,一定要偽原創(chuàng)下。切忌原封不動的復(fù)制粘貼,尤其是機器采集后進行所謂的自動偽原創(chuàng),更有甚者前后兩段抄堆疊關(guān)鍵詞或者所謂的偽原創(chuàng),其實段落語句不通,用戶體驗差,網(wǎng)站跳出率高,同樣也不會有好的權(quán)重。
收錄數(shù)量
堅持更新站點,合理布置鏈接誘餌,增加站點頁面的收錄數(shù)量。雖說收錄數(shù)量與權(quán)重之間不是絕對關(guān)系,但你見過同類型同行業(yè)的網(wǎng)站收錄數(shù)量僅有幾十的權(quán)重高于幾萬的情況嗎?
關(guān)鍵詞排名
尤其是核心關(guān)鍵詞的排名。首先要明白搜索引擎為什么會給你的關(guān)鍵詞一個較高的排名,因為權(quán)重高了。其次,認真做好相關(guān)關(guān)鍵詞和長尾關(guān)鍵詞的排名,這有利于提升網(wǎng)站的整體權(quán)重。
更新頻率
堅持有規(guī)律的更新網(wǎng)站,除了會獲得及時的網(wǎng)頁快照外,還能增加搜索引擎的信任度,一個更新頻繁的網(wǎng)站比那些僵尸網(wǎng)站的權(quán)重肯定會高很多。同時,應(yīng)注意更新時間和更新數(shù)量,避免之前積累的權(quán)重慢慢流失了。
內(nèi)容頁
內(nèi)頁是否和首頁以及網(wǎng)站主題有較為緊密的聯(lián)系,內(nèi)頁之間的銜接、關(guān)鍵字的布局,以及內(nèi)頁是否具有專業(yè)性,權(quán)威度如何。
網(wǎng)站的誠信度
Google除PR值以外,還有一個誠信指數(shù)。即通過對一些高質(zhì)量網(wǎng)站的分析,給出一個“誠信”網(wǎng)站應(yīng)該有的一些指標,并用這些指標來分析一個網(wǎng)站的誠信度。
網(wǎng)站服務(wù)器
服務(wù)器穩(wěn)定是關(guān)鍵,如果說搜索引擎抓取頁面時網(wǎng)站空間無法訪問,特別是新站,網(wǎng)站服務(wù)器不穩(wěn)定可能導(dǎo)致搜索引擎不收錄網(wǎng)站。其次是網(wǎng)站頁面的打開速度,這些服務(wù)器因素對權(quán)重都有影響。
最后聲明下,權(quán)重跟排名不能劃為等號;就像PR≠排名,當然這只是SEO細節(jié)中的一個重要組成部分。權(quán)重的高低是影響關(guān)鍵詞排名其中的一項重要因素而已。
?
三、凡客的路徑原理及影響
談了這么多關(guān)于搜索技術(shù)的基本原理,現(xiàn)在我們根據(jù)這些原理來闡述一下,凡客域名路徑長短到底是否有影響,首先我們先了解一下凡客的靜態(tài)路徑規(guī)則:
凡客的路徑規(guī)則為的:域名/靜態(tài)總目錄/語言目錄/主分類/子分類/內(nèi)容名.html,其實靜態(tài)總目錄是可以去掉或者修改的。如果為單語言的情況下面,語言目錄也是可以去掉的,但如果為多語言,則此目錄必須保留,以避免相同語言相同目錄及內(nèi)容的覆蓋。
在上面介紹中,我們說過網(wǎng)絡(luò)蜘蛛抓取,是根據(jù)頁面訪問層級來進行抓取的,而不是目錄層級,下圖3所示:
圖3
假如現(xiàn)在內(nèi)容J中有URL為:http://www.ecisp.cn/html/cn/templates/current/418.html,如果此內(nèi)容的鏈接出現(xiàn)在J和出現(xiàn)在A層,那么可以分別理解為0層和3?層,這種意義是不一樣。如果出現(xiàn)在A層中,那么網(wǎng)絡(luò)蜘蛛在第一次抓取中就比較容易尋獲取此URL,并進行抓取保存,而如果出現(xiàn)在J層中,那么當網(wǎng)絡(luò)蜘蛛只設(shè)定了二層后,就抓取不到了。這種層級關(guān)系的理解,不是域名文件夾的層級關(guān)系,而是瀏覽深度指向的層級。
所以凡客生成靜態(tài)URL文件夾的多少,實際對SEO是沒有影響的,但如果您的網(wǎng)站是英文網(wǎng)站,請注意,文件夾的生成文件名,是有一定的影響的。比如產(chǎn)品文件夾的名稱設(shè)定成products和設(shè)定成cb,那是有很大的關(guān)系的,所以切記一條:文件夾盡量取英文名或者英文代表關(guān)鍵字。
那有人又會說了:既然您網(wǎng)絡(luò)蜘蛛沒有影響,那權(quán)重呢?總會有一定的影響吧?先前說過了,網(wǎng)頁權(quán)重影響主要是內(nèi)容質(zhì)量、關(guān)鍵字、域名、點擊數(shù)量、收錄數(shù)量、服務(wù)器速度等因素,URL的長短實際很少,如果不信,您要中以搜索一下百度或者谷歌,他們收錄中,同樣有非常長的URL網(wǎng)頁。
談了這么多原理性之后,不知您還是否跟其它SEOER一樣,同樣認為URL長度影響質(zhì)量呢?如果您還堅持您的觀點,可以多了解一下搜索技術(shù)方面的文章,而不是SEO營銷方面的文章,SEOER更不該誤人子弟,正確理解SEO的重要性,還是對您網(wǎng)站內(nèi)容的質(zhì)量、內(nèi)鏈著手吧!