搜索引擎有兩個主要功能:爬行和構(gòu)建索引,并為搜索用戶提供他們確定的網(wǎng)站的排名列表最相關(guān)。
第一,抓取和索引。
在互聯(lián)網(wǎng)上對數(shù)十億個文檔,頁面,文件,新聞,視頻和媒體進行爬行和編制索引。想象一下互聯(lián)網(wǎng)是大城市地鐵系統(tǒng)中的??烤W(wǎng)絡(luò)。每個站點都是一個獨特的文檔,通常是一個網(wǎng)頁,但有時是PDF,JPG或其他文件。搜索引擎需要一種方法來“爬行”整個城市并找到沿途的所有站點,因此他們使用最佳路徑可用鏈接。
Web的鏈接結(jié)構(gòu)用于將所有頁面綁定在一起。鏈接允許搜索引擎的自動機器人稱為“爬蟲”或“蜘蛛”到達網(wǎng)絡(luò)上數(shù)十億個互連文檔。一旦引擎找到這些頁面,它們就會從它們中解密代碼并將選定的部分存儲在海量數(shù)據(jù)庫中,以便稍后在搜索查詢需要時進行調(diào)用。為了完成持有可在幾分之一秒內(nèi)訪問的數(shù)十億頁面的巨大任務(wù),搜索引擎公司已經(jīng)在全世界構(gòu)建了數(shù)據(jù)中心。這些巨大的存儲設(shè)施可以容納數(shù)千臺機器,可以非常快速地處理大量信息。當一個人在任何一個主要引擎上進行搜索時,他們會立即要求結(jié)果;即使是一秒或兩秒的延遲也會引起不滿,因此引擎很難盡快提供答案。
第二,提供答案
提供用戶查詢的答案,最常見的是通過他們檢索的相關(guān)頁面列表以及相關(guān)性排名。搜索引擎是應(yīng)答機器。當一個人進行在線搜索時,搜索引擎會搜索其數(shù)十億個文檔的語料庫并做兩件事:首先,它只返回那些與搜索者查詢相關(guān)或有用的結(jié)果;第二,它根據(jù)服務(wù)信息的網(wǎng)站的受歡迎程度對這些結(jié)果進行排名。SEO的過程旨在影響它的相關(guān)性和普及性。
搜索引擎如何確定相關(guān)性和受歡迎程度?
對于搜索引擎,相關(guān)性不僅僅意味著找到具有正確單詞的頁面。在網(wǎng)絡(luò)的早期,搜索引擎并沒有比這個簡單的步驟更進一步,搜索結(jié)果的價值有限。多年來,程序工程師已經(jīng)設(shè)計出更好的方法來將結(jié)果與搜索者的查詢相匹配。搜索引擎通常假設(shè)網(wǎng)站,頁面或文檔越受歡迎,其包含的信息必須越有價值。在用戶對搜索結(jié)果的滿意度方面,這一假設(shè)已被證明相當成功。流行度和相關(guān)性不是手動確定的。相反,引擎使用數(shù)學(xué)方程算法從相關(guān)性中分類,然后按質(zhì)量以及流行度的順序?qū)?nèi)容進行排序。這些算法通常包含數(shù)百個變量。在搜索營銷領(lǐng)域,我們將它們稱為“排名因素”專門針對此主題制作了一個資源:搜索引擎排名因素。
如何獲得成功?或者說是搜索營銷如何成功呢?
搜索引擎的復(fù)雜算法似乎難以理解。實際上,引擎本身幾乎沒有提供如何獲得更好結(jié)果或獲得更多流量的洞察力。他們?yōu)槲覀兲峁┑挠嘘P(guān)優(yōu)化和最佳實踐的內(nèi)容如下所述:
來自BAIDU站長的SEO信息。BAIDU建議通過以下方式在搜索引擎中獲得更好的排名:
1、制作主要面向用戶的頁面,而不是搜索引擎。不要欺騙您的用戶或向搜索引擎展示與向用戶顯示的內(nèi)容不同的內(nèi)容,這種做法通常被稱為“隱藏真實內(nèi)容”。
2、創(chuàng)建一個具有清晰層次結(jié)構(gòu)和文本鏈接的站點。應(yīng)至少從一個靜態(tài)文本鏈接訪問每個頁面。
3、創(chuàng)建一個有用的,信息豐富的網(wǎng)站,并編寫清晰準確地描述您的內(nèi)容的頁面。確保<title>元素和ALT屬性具有描述性和準確性。
4、使用關(guān)鍵字創(chuàng)建描述性的,人性化的網(wǎng)址。提供一個URL版本來訪問文檔,使用301重定向或rel=“canonical”屬性來解決重復(fù)內(nèi)容。
來自BING的SEO信息,微軟的Bing工程師推薦以下內(nèi)容,以便在搜索引擎中獲得更好的排名:
1、確保使用干凈,關(guān)鍵字豐富的URL結(jié)構(gòu)。
2、確保內(nèi)容不包含在富媒體中,并驗證富媒體不會隱藏來自爬網(wǎng)程序的鏈接。
3、創(chuàng)建關(guān)鍵字豐富的內(nèi)容并將關(guān)鍵字與用戶搜索的內(nèi)容進行匹配。定期制作新鮮內(nèi)容。
4、不要將要編入索引的文本放在圖像中。例如,如果您希望將公司名稱或地址編入索引,請確保它不會顯示在公司徽標中。
除了這種自由提供的建議之外,在網(wǎng)絡(luò)搜索存在的15年多的時間里,搜索網(wǎng)站運維已經(jīng)找到了提取有關(guān)搜索引擎如何對網(wǎng)頁進行排名的信息的方法。SEO和網(wǎng)站運維使用這些數(shù)據(jù)來幫助他們的網(wǎng)站及其客戶實現(xiàn)更好的定位。
研究引擎活動的網(wǎng)站管理員可能沒有比利用搜索引擎本身進行實驗,測試假設(shè)和形成意見的自由更多的工具。通過這種迭代,時是艱苦的過程,已經(jīng)收集了大量關(guān)于發(fā)動機功能的知識。我們嘗試過的一些實驗是這樣的:
1、使用無意義關(guān)鍵字注冊新網(wǎng)站。
2、在該網(wǎng)站上創(chuàng)建多個頁面,所有頁面都針對類似的荒謬術(shù)語。
3、使頁面盡可能接近相同,然后一次更改一個變量,嘗試放置文本,格式化,使用關(guān)鍵字,鏈接結(jié)構(gòu)等。
4、將域中的鏈接指向其他域上的已編制索引,爬網(wǎng)良好的頁面。
5、記錄搜索引擎中頁面的排名。
6、現(xiàn)在對頁面進行小的更改并評估它們對搜索結(jié)果的影響,以確定哪些因素可能會導(dǎo)致結(jié)果上升或下降。
7、記錄任何看似有效的結(jié)果,并在其他域或其他術(shù)語上重新測試它們。如果多個測試始終返回相同的結(jié)果,那么您很可能會發(fā)現(xiàn)搜索引擎使用的模式。
我們從一個假設(shè)開始,即頁面上較早鏈接比頁面下方的鏈接承載更多的權(quán)重。我們通過創(chuàng)建一個帶有主頁的無意義域來測試這一點,該主頁具有指向三個遠程頁面的鏈接,這三個遠程頁面都具有在頁面上恰好出現(xiàn)一次的相同無意義單詞。在搜索引擎抓取頁面后,我們發(fā)現(xiàn)主頁上最早鏈接的頁面排名第一。這個過程很有用,但并不是唯一有助于教育搜索網(wǎng)站運維的過程。搜索網(wǎng)站運維還可以收集關(guān)于搜索引擎如何通過主要引擎用戶企業(yè)的競爭情報。搜索網(wǎng)站運維作為一個社區(qū)已經(jīng)開始了解搜索引擎的許多基本操作以及創(chuàng)建獲得高排名和大量流量的網(wǎng)站和頁面的關(guān)鍵組件。