SEO: 搜索引擎優(yōu)化(Search Engine Optimization);指為了提升網(wǎng)頁在搜索引擎自然搜索結(jié)果中的收錄數(shù)量及排序位置而做的優(yōu)化行為。
對于網(wǎng)站和用戶,搜索引擎優(yōu)化是一種免費的引流渠道。對于搜索引擎,SEO是一種網(wǎng)站建設和優(yōu)化需要遵循的規(guī)則。
SEO 是職業(yè) 還是 技能?
在不少公司中,都有專門的SEO部門-->搜索引擎中拉免費的流量、提高搜索流量轉(zhuǎn)化率的相關用戶體驗、運營的一職多能的角色。
SEO 不是機械的發(fā)鏈接和堆砌關鍵詞。
不同層次不同理解
1. SEO是技術 關鍵字,描述,各種鏈接等 覺得SEO各方面都是通過技術實現(xiàn)的
2. SEO是策略 制定一系列SEO相關的策略計劃,指導技術,編輯,數(shù)據(jù)分析及外鏈專員等人員進行專項工作。
3. SEO是藝術 挑逗搜索引擎或更深入研究搜索引擎
技術不能支撐起SEO的全部,但技術是SEO的重要組成部分。會技術的不一定是SEO大牛,但SEO大??隙夹g也很牛。
為什么要SEO
-----------
引流。為了從搜索引擎中獲得更多的免費流量,以及更好地展現(xiàn)網(wǎng)站形象。
SEO五個階段
-----------
- 收錄
- 排名
- 流量
- 轉(zhuǎn)化
- 重復上述
搜索引擎工作原理
================
搜索引擎主動抓取網(wǎng)頁的步驟
1. 派出Spider :按照一定策略把網(wǎng)頁抓回到搜索引擎服務器
2. 內(nèi)容處理 :對抓取回來的網(wǎng)頁進行鏈接抽離、內(nèi)容處理,消除噪聲、提取該頁主題文本內(nèi)容。
3. 中文分詞 :對網(wǎng)頁的內(nèi)容進行中文分詞、去除停止詞。
4. 索引 :去重,對剩余網(wǎng)頁進行倒序索引,等待用戶的檢索
搜索引擎工作流程
1. 查詢分析:查詢關鍵詞分詞
2. 緩存機制:查詢緩存中是否有該關鍵詞的查詢結(jié)果
3. 網(wǎng)頁排序:沒有緩存,索引庫的網(wǎng)頁進行調(diào)取排名
4. 反作弊: (最重要 也是作弊最多的部分) 內(nèi)容相關性,重要性(鏈接權重分析),用戶體驗高低(搜索結(jié)果頁的使用體驗)。
Spider 分類
-----------
按網(wǎng)絡上所有spider 的作用及表現(xiàn)出來的特征進行分類:批量型、增量型、垂直型。
### 批量型
針對性;有明確抓取范圍和目標,設置抓取的時間,數(shù)據(jù)的限制、固定范圍內(nèi)頁面的限制。
### 增量型
通用爬蟲 。追求廣而全的抓取,沒有固定目標,范圍和時間限制。盡可能全的抓取網(wǎng)頁,還要針對已更新的網(wǎng)頁進行相應的再次抓取和更新
### 垂直型
聚焦爬蟲。具有特定主體,特定內(nèi)容或特定行業(yè)的網(wǎng)頁進行抓取。
Spider 抓取策略
---------------
spider 抓取的頁面類型可分為:已抓取頁面,待抓取頁面,可抓取頁面,暗網(wǎng)中的頁面。
針對這些頁面的爬蟲抓取策略:深度優(yōu)先策略、廣度優(yōu)先策略、重要頁面優(yōu)先策略、大站優(yōu)先策略
### 深度優(yōu)先策略
一條連接爬到底,再返回上一層
### 廣度優(yōu)先策略
一層頁面爬完,再爬更深一層
其中:深度優(yōu)先策略和廣度優(yōu)先策略是抓取全網(wǎng)的策略。但是爬蟲的資源的有限性,決定了爬蟲資源有限針對重要優(yōu)先抓取。
### 重要頁面優(yōu)先策略
重要性的定義:受寄主站點本身質(zhì)量和權重,導入連接的多少和導入連接的質(zhì)量
### 大站優(yōu)先策略
大站的定義:穩(wěn)定的服務器、良好的網(wǎng)站結(jié)構(gòu)、優(yōu)秀的用戶體驗、及時的咨詢內(nèi)容、豐富的內(nèi)容類型、權威的相關資料,龐大的網(wǎng)頁數(shù)量,大量高質(zhì)量的外鏈
分布式Spider
------------
spider數(shù)量眾多,涉及分布式計算,確保spider作業(yè)不重復
暗網(wǎng)抓取
--------
暗網(wǎng):是通過普通抓取策略 永遠抓取不到的網(wǎng)頁。解決辦法:站長提交資源。百度數(shù)據(jù)開放平臺提交結(jié)構(gòu)化數(shù)據(jù)。
降權蜘蛛
--------
該網(wǎng)站被降權或者屏蔽,百度會把該站點的抓取任務分發(fā)給這個spider。如果有這個ip的spider 來訪問你的網(wǎng)站,恭喜你,你的網(wǎng)站出問題了被降權或者屏蔽了。
spider和普通用戶的區(qū)別
----------------------
1. spider 可以分辨隱藏內(nèi)容,黑鏈等
2. spider 沒有Referer,普通用戶有
3. spider 不支持cookie
4. spider 不會主動注冊網(wǎng)站
5. spider 對于動態(tài)參數(shù)網(wǎng)站,可能會死循環(huán)
6. spider 不能很好分辨是否原創(chuàng)
用戶體驗
--------
普通網(wǎng)頁的用戶體驗:
1. 感官體驗:試聽上的體驗,舒適性
2. 交互體驗:操作上的體驗,易用、可用性
3. 情感體驗:心理上的體驗,友好性
4. 瀏覽體驗:瀏覽上的體驗,吸引性
5. 信任體驗:信任體驗,可靠性
SEO 判斷體驗
1、簡潔的頁面,廣告不會干擾主體內(nèi)容頁面,沒有大量彈窗跳轉(zhuǎn)(感官體驗)
2、網(wǎng)站品牌、網(wǎng)站曝光度、網(wǎng)站備案(信任體驗)
3、網(wǎng)頁在搜索結(jié)果中的點擊率,又反饋搜索引擎二次搜索的比例,內(nèi)容原創(chuàng)性、時效性、豐富性及更新頻率,網(wǎng)頁標題和內(nèi)容相關性(瀏覽體驗)
4、網(wǎng)頁功能性,評論數(shù)量,踩頂次數(shù)、頁面分享次數(shù)、頁面風向次數(shù)等用戶投票數(shù)據(jù)(瀏覽體驗)關鍵詞研究
==========
關鍵詞研究的意義:
1. 精準的關鍵詞 容易在搜索引擎中獲得排名。
2. 從SEO的角度根據(jù)所挖掘的關鍵詞 來為網(wǎng)站提供運營方向。
關鍵詞分類
### 按搜索目的(這里所列的)
#### 導航類
不記得網(wǎng)址 或者 懶得輸入網(wǎng)址 使用的關鍵詞
- 精確型 QQ空間登入 等
- 模糊型
不知道是找官網(wǎng)或者找官網(wǎng)相關新聞或者評價之類的信息
#### 事務類
重點關鍵詞,通過這些關鍵詞來訪的用戶有比較高的轉(zhuǎn)化率。
具有明顯動作目的而搜索的關鍵詞: 比如購買意向,比如大姨媽計算,大姨媽來了相關貼士。
#### 信息類
尋找某種信息使用的關鍵詞。數(shù)量占總搜索詞的絕大多數(shù),也是絕大部分網(wǎng)站搶占流量空間最大的一類關鍵詞。
典型的例子:零基礎SEO培訓網(wǎng)站SEO優(yōu)化建議指導
### 按關鍵詞長短
長尾關鍵詞、短尾關鍵詞
在考慮關鍵詞長短的時候,要注意兩個理論
#### 2/8理論
80%的經(jīng)歷和資源來主攻20%的核心關鍵詞的優(yōu)化,這部分關鍵詞如果能優(yōu)化成功,將會帶來很可觀的流量。彰顯網(wǎng)站在行業(yè)中的地位。
#### 長尾理論
大部分的長尾關鍵詞的搜索量雖然很小,但是核心關鍵詞的數(shù)量有限,一定的長尾的累積搜索量肯定比核心多
### 按關鍵詞熱度
1. 熱門關鍵詞;流量非常大,但詞量少;"魔獸世界" "dota"
2. 一般關鍵詞; 一定搜索量,介于長尾和短尾之間。"iphone 7 長度"
3. 冷門關鍵詞;偶爾有那么幾次搜索量的關鍵詞,搜索量極低?!芭龅脚粫f話怎么辦”
關鍵詞挖掘
----------
- 同行競爭對手
- 針對資源批量擴展
- 按屬性擴展
- 搜索引起提供的數(shù)據(jù)
- 小工具: 很多站長工具都提供 關鍵詞挖掘工具
關鍵詞處理
----------
### 選擇
挖掘出來的關鍵詞進行篩選,布局到網(wǎng)站中
1. 與內(nèi)容相關
2. 搜索量大 競爭小
### 分組
1. 適合首頁和核心目錄
2. 適合擴展子目錄
3. 適合專題頁面
4. 適合布局到內(nèi)容中去
5. 適合資源聚合頁面
細分:搜索量 競爭強度 詞性 商業(yè)價值及所屬細分類等因素
### 關鍵詞間建立相關關系
分布到網(wǎng)站中。架構(gòu)比較大,內(nèi)容比較多的網(wǎng)站是有必要的。
關鍵詞部署
----------
### 原則
1. 每個頁面只部署2~3個關鍵詞
2. 除內(nèi)容頁外的頁面,頁面之間的關鍵詞不可重復,甚至不可太相近
3. 對于太相近的關鍵詞或同義詞進行組合部署,盡可能分配到一個頁面中,如果站內(nèi)資源豐富,可以進行單獨部署
4. 除內(nèi)容頁外的頁面,部署的關鍵詞最好是規(guī)范的關鍵詞,沒有太多定于形容詞
### 方法
參照關鍵詞分組。出去網(wǎng)站首頁和主要欄目頁優(yōu)化一些高搜量,高競爭強度,高行業(yè)地位的關鍵詞之外,其他關鍵詞根據(jù)關鍵詞本身的搜索量、長短性質(zhì)、規(guī)范層度就可以布局到內(nèi)容頁、專題頁和聚合頁中去了。
網(wǎng)站分析
========網(wǎng)站數(shù)據(jù)分析
------------
### 基礎數(shù)據(jù)
這是長期工作的內(nèi)容
數(shù)據(jù)可視化處理:數(shù)據(jù)轉(zhuǎn)為圖形
比如針對收錄,要通過對短期數(shù)據(jù)的分析來進行中長期的演化,從而獲得優(yōu)化收錄需要注意的問題。另外還包括了重點欄目的長期跟蹤、外鏈數(shù)量的跟蹤等等。
### 關鍵詞分析
需要持續(xù)對網(wǎng)站 關鍵詞數(shù)量 和 排名 以及轉(zhuǎn)化率等數(shù)據(jù)進行持續(xù)跟蹤,并且作好記錄,并通過SPSS統(tǒng)計學軟件進行統(tǒng)計分析,查看是否具有統(tǒng)計學意義,當然目前也有很多專業(yè)的網(wǎng)站能提供相應的軟件工具來幫助進行統(tǒng)計學分析,從而掌握關鍵詞數(shù)量和轉(zhuǎn)化率等趨勢和發(fā)展,從而有效提升數(shù)據(jù)分析能力,為網(wǎng)站的SEO優(yōu)化提供參考。《核裂變方程式·黑白帽SEO變異培訓》課程中就有。
### 流量分析
競爭對手分析
------------
搞SEO優(yōu)化,最終目的是超過競爭對手,成為行業(yè)領軍。知己知彼才能百戰(zhàn)百勝。
1. 網(wǎng)站收錄數(shù)據(jù)
2. 外鏈來源
3. 數(shù)量數(shù)據(jù)
4. 關鍵詞種類
5. 相關關鍵詞排名
6. 網(wǎng)站結(jié)構(gòu)和內(nèi)鏈布局
7. 分析頁面和內(nèi)容
站內(nèi)優(yōu)化
========
基礎優(yōu)化
--------
- 404頁面:減少網(wǎng)站跳出率,提升用戶體驗。(tips:良好的404頁面)
- robot.txt (跟spider交互的唯一文件)
- 完整整體結(jié)構(gòu)優(yōu)化 (樹形結(jié)構(gòu),層結(jié)最好不超過三層,超過三層可能就爬不了。不要采用主流搜索引擎難于識別的形式,內(nèi)容盡可能用文字形式表現(xiàn),如果非要使用到圖片或者Flash也要加個標簽,說明文字。雖然現(xiàn)在開始有針對圖片的搜索引擎)
- 錨文本布局:規(guī)劃布局好站內(nèi)的錨文本絕對是一件富有價值的工作,而站內(nèi)的錨文本遵循的原則跟外部鏈接沒有多大區(qū)別。
- META標簽優(yōu)化:title、keyword、decription
- 清理死鏈
- 網(wǎng)站地圖 :它就是一個頁面,上面放置了網(wǎng)站上所有頁面的鏈接。當用戶在網(wǎng)站上找不到自己所需要的信息時,可能會將網(wǎng)站地圖作為一種補救措施。
另外,搜索引擎蜘蛛非常喜歡網(wǎng)站地圖,有利于蜘蛛的爬行抓取。
- 內(nèi)部權重分配
一等頁面 關鍵詞搜索量很大,比如首頁,欄目頁,專題頁等,一旦排名會獲取很大流量,那最好整個網(wǎng)站每個頁面都有指向一等頁面的鏈接,并且站外也要做外鏈。
二等頁面 關鍵詞搜索量一般,比如文章頁等,但也能帶來流量,那針對這些頁面鏈接最好長期在一等頁面中存在,另外,再發(fā)布文章的時候,多給這類頁面做內(nèi)部鏈接,如果有精力也可以對這類頁面做點外鏈。
三等頁面 幾乎沒有搜索量,比如很多企業(yè)站的新聞等,但這類頁面的存在可以提高整個網(wǎng)站的收錄量以及給以上兩種頁面提供權重。
營銷頁面 本身沒有搜索量,頁面流量來自上面三種頁面,靠站內(nèi)引流,這類頁面只要是那些產(chǎn)品介紹頁,引導消費頁等。
一個營銷類網(wǎng)站最好做到上面幾個頁面的劃分,同時我們也可以做下規(guī)劃。
轉(zhuǎn)化層:就是上面說的營銷頁面,網(wǎng)站將大量流量引流到這里進行消化,讓流量變成現(xiàn)金。
營養(yǎng)層:就是上面說的三等頁面,給別的頁面提供權重,本身不需要排名。
流量層:就是上面說的一等頁面和二等頁面,通過站內(nèi)和站外的權重集中獲取很好的排名,又將流量引流到轉(zhuǎn)化層。
- 硬件優(yōu)化
代碼優(yōu)化
恰當?shù)氖褂脴祟}標簽
- 避免重復頁面:每個頁面包括標題、描述和關鍵字等都應該不一樣,需要注意的是很多設計師會做一個通用的模板,而用的時候又忘記修改。標題一定要是具有獨特性的!
- 網(wǎng)站導航優(yōu)化:網(wǎng)站的導航全站通用,至關重要,盡量用文字導航,不要用圖片和flash等,若一定要用圖片請一定加上alt屬性。Flash則盡量避免,F(xiàn)lash的效果是很好的,但加載很慢,搜索引擎也無法讀取Flash文件。
- 精簡代碼:符合web2.0標準,使用div+css設計網(wǎng)頁,合理布局標簽盡量減少div層,使用描述標簽,精練描述你的網(wǎng)頁,將網(wǎng)站重點內(nèi)容與經(jīng)常更新的內(nèi)容代碼盡量靠近的位置。頁面不要超過125K
- 圖片與文字鏈接優(yōu)化:給圖片加上alt描述屬性。
- js、css腳本優(yōu)化: 網(wǎng)站的JavaScript和CSS等文件一律外部調(diào)用,不要把代碼寫在網(wǎng)頁中,并且盡量減少腳本文件個數(shù),這樣不僅僅有利于網(wǎng)頁加載速度也有利于搜索引擎蜘蛛的抓取!
- 網(wǎng)頁布局優(yōu)化: 面包屑型導航,樹狀扁平化結(jié)構(gòu)。首頁點擊不出三次可以到達網(wǎng)站任何一個頁面,任何頁面都可以很快的回到想要的頁面。文章內(nèi)容部分先于其他部分顯示,設置上一篇、下一篇文章,根據(jù)文章的關鍵詞設置“相關文章",如果文章內(nèi)容多分幾頁顯示,需要保持每頁的網(wǎng)頁標題、文章內(nèi)容均不同,避免出現(xiàn)復制內(nèi)容問題 。
網(wǎng)站優(yōu)化
--------
- 不要和域名重復: 對于國內(nèi)區(qū)別不大。因為他們一般對于URL的關注沒有國外那么敏感,不過建議最好還是使用清晰獨立的URL,盡量避免和域名重復。
URL最好靜態(tài)化: 靜態(tài)化有利于搜索引擎抓取,另外對于一些必要的轉(zhuǎn)向盡量使用301處理,同時建立一個404導航頁面以免出現(xiàn)打開錯誤時可以幫助導航。
- URL被懲罰: 如果你懷疑這個URL有被搜索引擎認為作弊的嫌疑,可以檢查URL里:可疑的關鍵詞、符號、內(nèi)容。
- 管理好文件擴展: 不要用.exe之類搜索引擎無法識別的文件類型來結(jié)尾,這種會導致搜索引擎無法收錄。
- URL的長度: 在URL里最好不要超過3-5個關鍵詞,當然這個是相對的,并不是超過5個關鍵詞的URL就不會取得好的排名,畢竟URL只是其中的一個部分而已,而對于一個優(yōu)秀的SEO人員可能是寸步必爭,不會輕易放棄每一個可能超越對手的地方。并且最近的研究顯示,在排名較好的位置里面,較短的URL獲得的點擊率是長的2倍,所以為了你的排名和點擊率,最好還是用較短的URL。