這一篇主要介紹搜索引擎的工作原理和常用的高級搜索指令,對于我們深入了解seo和靈活使用搜索引擎。
雖然很多人喜歡的內容是——
“你就告訴我,怎么三下五除二,能把網站優化到第一頁就行了,不要給我扯這些花里胡哨的”。
但我覺得這一章其實是很有必要的。在深入了解搜索引擎的工作原理之后,我們才能從宏觀層面有個大概的操作思路,授之于魚不如授之以漁。
不啰嗦了,我開始啦~
2.1搜索引擎與目錄
對于現在的人來說,已經很少用到目錄網站,典型的類似hao123,http://265.com等,網站上面有許許多多的人工搜集并整理的網站。在早期,許多seo資料把目錄也稱為搜索引擎的一種,其實這是不準確的。
搜索引擎是由蜘蛛程序沿著鏈接爬行,抓取網上的大量頁面,存進數據庫,經過預處理,用戶在搜索框內輸入查詢詞后,搜索引擎排序程序從數據庫中挑選出符合查詢詞的頁面。蜘蛛的爬行,頁面的收錄以及排序都是自動處理的——這就是搜索引擎和目錄網站最大的區別。
2.2搜索引擎工作原理簡介
搜索引擎的工作過程可分為三個階段
爬行和抓取:搜索引擎蜘蛛通過跟蹤鏈接發現和訪問網頁,讀取頁面html代碼,存入數據庫。
預處理:索引程序對抓取來的頁面數據進行文字提取、中文分詞、索引、倒排索引等處理
排名:用戶輸入查詢詞后,排名程序調用索引庫數據,計算相關性,然后按一定格式生成搜索結果頁面。
從搜索引擎的原理上來分析,我們想做的事情就是,第一,吸引蜘蛛,盡可能地讓蜘蛛爬行我們的頁面,第二:要注意網站或網頁的結構優化,有利于蜘蛛爬行,才會盡可能讓我們網站更多的頁面被收錄。
想要吸引蜘蛛來爬取,要做好以下幾點:
網站和頁面權重的提升
頁面經常更新
每個頁面都有導入鏈接
與首頁的點擊距離不能太遠
url短,層次淺
2.3用戶怎樣瀏覽和點擊搜索結果
當用戶在搜索框輸入一個關鍵詞,搜索引擎給出了搜索結果,那么用戶會點擊哪一個呢?
從大量的研究可以得出以下的結果:
排名第一的結果獲得了大概40%的點擊率
排名第二的結果獲得了大概11%的點擊率
排名第三的結果獲得了大概8%的點擊率
排名靠后的結果點擊率逐漸下降,第二頁的結果則斷崖式下降。
雖然不同的行業,不同的關鍵詞會使得這個結論有一定的差異,但是我們依然能得出一些對我們有用的結論:
第一和第二名流量差異巨大,第二頁和第一頁的流量差距也很大;
有時候我們可以找到網站有哪些關鍵詞排名在第二位,想辦法提高到第一位,,能使流量提升好幾倍。第二頁優化到第一頁也是同理。
2.4常用的高級搜索指令
雙引號:完全匹配搜索
釋義:搜索結果返回的頁面包含雙引號中出現的所有詞,連順序也必須完全匹配。
如:“飛機微博圖片”
指令支持:谷歌和百度都支持
減號
釋義:搜索不包含減號后面詞的頁面。使用時,減號前面必須是空格,減號后面沒有空格,緊跟著需要排除的詞。
如:新加 -坡
指令支持:谷歌和百度都支持
星號
釋義:常用的通配符。
如:郭*綱,其中*代表任何文字。
指令支持:谷歌支持,百度不支持
inurl:
釋義:用于詞搜索查詢詞出現在url中的頁面。由于關鍵詞出現在url中對排名有一定影響,因此使用inurl:搜索可以更準確地找到競爭對手
如:inurl:搜索引擎優化
指令支持:谷歌支持,百度不支持
inanchor:
釋義:指令返回的結果是導入鏈接錨文字中包含搜索詞的頁面。
如:inanchor:點擊這里
返回的結果頁面本身不一定包含“點擊這里”四個字,而是指向這些頁面的錨文字中出現了“點擊這里”這四個字。
鏈接錨文字是關鍵詞排名因素之一,有經驗的seo會盡量使外部鏈接錨文字中出現一定次數的目標關鍵詞。使用inanchor:指令可以找到某個關鍵詞的競爭對手,而這些對手往往都是做過seo的。
指令支持:谷歌支持,百度不支持
intitle:
釋義:指令返回的是頁面title中包含關鍵詞的頁面
如:intitle:搜索引擎優化
title是頁面優化的重要因素,使用intitle指令找到的文件都是更準確的競爭頁面。如果關鍵詞只出現在頁面卻沒有在title中,說明也不是有力的競爭對手。
指令支持:谷歌和百度都支持
filetype:
釋義:用于搜索特定的文件格式
如:filetype:pdf SEO
返回的就是包含SEO這個關鍵詞的所有PDF文件
用于搜索特定的資源,如pdf電子書,word文件等非常有效
指令支持:谷歌和百度都支持
site:
釋義:用于搜索某個域名下的所有文件
如:site:http://seozac.com
返回的就是seozac這個域名下的所有頁面,這個指令是查詢網站收錄頁面最有效的方法。不過這個指令不是很準確,只能作為參考。
指令支持:谷歌和百度都支持
link:
釋義:用于搜索某個url的反向鏈接,既包含內部鏈接,也包含外部鏈接
如:link:http://seozac.com
指令支持:谷歌支持,百度不支持
高級搜索指令也是可以搭配起來使用的
如inurl:http://edu.cnintitle:交換鏈接
返回的則是來自http://edu.cn域名,標題中包含“交換鏈接”這四個字的頁面,大部分應該是愿意交換鏈接的學校網站。
(來源:希聲碎碎念)
以上內容屬作者個人觀點,不代表雨果跨境立場!本文經原作者授權轉載,轉載需經原作者授權同意。?