亚洲视频二区_亚洲欧洲日本天天堂在线观看_日韩一区二区在线观看_中文字幕不卡一区

公告:魔扣目錄網(wǎng)為廣大站長(zhǎng)提供免費(fèi)收錄網(wǎng)站服務(wù),提交前請(qǐng)做好本站友鏈:【 網(wǎng)站目錄:http://www.430618.com 】, 免友鏈快審服務(wù)(50元/站),

點(diǎn)擊這里在線咨詢客服
新站提交
  • 網(wǎng)站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會(huì)員:747

前面2期介紹seo的時(shí)候就講到了關(guān)于SEO的基本定義,這里再次簡(jiǎn)單回顧下吧!

SEO(搜索引擎優(yōu)化)通常定義為:在了解搜索引擎的工作原理基礎(chǔ)上,對(duì)網(wǎng)站進(jìn)行內(nèi)外調(diào)整優(yōu)化,提高網(wǎng)站關(guān)鍵詞排名,獲得更多流量,達(dá)成網(wǎng)站的營(yíng)銷目的。通過(guò)這一定義,我們可以看到,做SEO首先需要知道我們搜索引擎的工作原理是怎樣的,只有搞清楚它的原理,我們才可以本著這一原理進(jìn)行做后期優(yōu)化工作。這就是今天這一期重點(diǎn)和大家分享的話題:搜索引擎的工作原理!

由于搜索引擎這一塊的專業(yè)知識(shí)涉及很廣,可以單獨(dú)作為一門學(xué)科來(lái)系統(tǒng)化學(xué)習(xí)的,所以建議新手剛開始學(xué)SEO的時(shí)候可以先多學(xué)習(xí)下搜索引擎這一塊知識(shí)哦,也可以自己買本搜索引擎原理的書籍看看也行,只有理解了搜索引擎的工作原理后,我們對(duì)后期優(yōu)化工作才有了明確的方向!

 

淺談搜索引擎的工作原理

搜索引擎的工作原理

 

首先搜索引擎的工作原理大體上分為三個(gè)階段:

  1. 爬行與抓取:搜索引擎蜘蛛(Spider)通過(guò)跟蹤鏈接發(fā)現(xiàn)和訪問(wèn)頁(yè)面,然后讀取html代碼,存入數(shù)據(jù)庫(kù)中;
  2. 預(yù)處理:搜索引擎蜘蛛抓取來(lái)的頁(yè)面數(shù)據(jù)進(jìn)行文字提取,中文分詞,索引(正向索引),倒排索引等,以備后面排名和展現(xiàn);
  3. 排名:通過(guò)一定的搜索相關(guān)性計(jì)算,按照一定格式生成搜索結(jié)果頁(yè)面。

 

淺談搜索引擎的工作原理

搜索引擎的工作原理

 

針對(duì)這三個(gè)階段詳細(xì)說(shuō)下搜索引擎的工作原理:

爬行與抓取

1、跟蹤鏈接:一般是深度優(yōu)先和廣度優(yōu)先兩種跟蹤方式,如圖所示:

 

淺談搜索引擎的工作原理

深度優(yōu)先跟蹤鏈接

 

淺談搜索引擎的工作原理

廣度優(yōu)先跟蹤鏈接

理論上,無(wú)論是哪種跟蹤方式,只要給蜘蛛足夠多時(shí)間,都能爬完整個(gè)互聯(lián)網(wǎng)上的鏈接,但實(shí)際上,蜘蛛的寬帶資源和時(shí)間都是非常有限的,不可能爬完所有的鏈接,最多只能爬行和收錄一小部分,所以我們做SEO工作就需要主動(dòng)吸引蜘蛛來(lái)爬行和收錄我們的頁(yè)面。

2、吸引蜘蛛:哪些頁(yè)面可以吸引到蜘蛛呢?符合以下幾點(diǎn)就足以。

  • 第一,網(wǎng)站和頁(yè)面權(quán)重。權(quán)重越高,蜘蛛就越喜歡,尤其是老網(wǎng)站,質(zhì)量高的網(wǎng)站;
  • 第二,頁(yè)面更新頻率。蜘蛛喜歡新鮮事物,所以網(wǎng)站這一塊也需要經(jīng)常多跟新;
  • 第三,導(dǎo)入鏈接。無(wú)論是外鏈還是內(nèi)鏈,只要多給蜘蛛爬行頁(yè)面的路徑,頁(yè)面收錄率和排名會(huì)更高;
  • 第四,與首頁(yè)點(diǎn)擊距離。一般網(wǎng)站首頁(yè)權(quán)重最高,所以頁(yè)面里首頁(yè)的點(diǎn)擊距離越近,爬行和收錄機(jī)會(huì)更高;
  • 第五,URL結(jié)構(gòu)。首先符合靜態(tài)化最好,其次URL越短,層次越少,蜘蛛爬行的機(jī)會(huì)就更大些,頁(yè)面收錄機(jī)會(huì)也就更大。

預(yù)處理

這里所說(shuō)的預(yù)處理包括:提取文字,中文分詞,去停止詞,消除噪聲,去重,正向索引,倒排索引,鏈接關(guān)系計(jì)算,特殊文件處理以及質(zhì)量判斷等等,由于內(nèi)容過(guò)多,這里不多做詳細(xì)說(shuō)明,主要講下正向索引和倒排索引這兩塊核心內(nèi)容,有些書籍把預(yù)處理這一階段定義為索引,其實(shí)也是說(shuō)明了正向索引和倒排索引的重點(diǎn),首先看下面示意圖:

 

淺談搜索引擎的工作原理

正向索引結(jié)構(gòu)

 

淺談搜索引擎的工作原理

倒排索引結(jié)構(gòu)

上圖中文件就是指頁(yè)面了,關(guān)鍵詞就是與用戶所搜索的詞相匹配的關(guān)鍵詞,這里的關(guān)鍵詞是搜索引擎內(nèi)部存儲(chǔ)的關(guān)鍵詞,也是基于過(guò)去用戶所搜索過(guò)的詞,進(jìn)行一次收集和整理所得出來(lái)的。通過(guò)對(duì)比兩種索引結(jié)構(gòu)就可以看出,倒排索引更能符合搜索引擎的工作要求,當(dāng)用戶搜索某一關(guān)鍵詞時(shí)候,搜索引擎系統(tǒng)內(nèi)部便能一次性直接導(dǎo)出與關(guān)鍵詞相匹配的頁(yè)面,然后再通過(guò)鏈接相關(guān)性計(jì)算,特殊文件處理,頁(yè)面質(zhì)量判斷得出哪些頁(yè)面可以用作搜索結(jié)果頁(yè)面中,最后以排名的方式顯示出來(lái)。

排名

進(jìn)行預(yù)處理過(guò)后,尤其是倒排索引處理之后,然后對(duì)用戶搜索詞處理以及相應(yīng)的文件匹配,得出初始文件的子集,這里的初始文件子集并不能直接用于排名,還要進(jìn)行相關(guān)性計(jì)算,排名過(guò)濾和調(diào)整,最終顯示出頁(yè)面的排名結(jié)果。這里的相關(guān)性計(jì)算,主要是根據(jù)關(guān)鍵詞常用程度、詞頻和密度、關(guān)鍵詞位置及形式、關(guān)鍵詞距離、鏈接分析及頁(yè)面權(quán)重等來(lái)得出頁(yè)面的內(nèi)容是否和用戶搜索的詞高度相關(guān)。

好了,關(guān)于搜索引擎的工作原理大致上就說(shuō)這么多了,其實(shí)還有很多詳細(xì)地方?jīng)]有具體說(shuō)到,由于涉及過(guò)廣,大家可以多了解下搜索引擎這一塊的內(nèi)容,可以借助相關(guān)書籍來(lái)系統(tǒng)學(xué)習(xí)這一塊的內(nèi)容哦!本期的SEO分享就到這里了,大家有任何問(wèn)題和想法都可以在評(píng)論下方留言咨詢哦!

分享到:
標(biāo)簽:搜索引擎
用戶無(wú)頭像

網(wǎng)友整理

注冊(cè)時(shí)間:

網(wǎng)站:5 個(gè)   小程序:0 個(gè)  文章:12 篇

  • 51998

    網(wǎng)站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會(huì)員

趕快注冊(cè)賬號(hào),推廣您的網(wǎng)站吧!
最新入駐小程序

數(shù)獨(dú)大挑戰(zhàn)2018-06-03

數(shù)獨(dú)一種數(shù)學(xué)游戲,玩家需要根據(jù)9

答題星2018-06-03

您可以通過(guò)答題星輕松地創(chuàng)建試卷

全階人生考試2018-06-03

各種考試題,題庫(kù),初中,高中,大學(xué)四六

運(yùn)動(dòng)步數(shù)有氧達(dá)人2018-06-03

記錄運(yùn)動(dòng)步數(shù),積累氧氣值。還可偷

每日養(yǎng)生app2018-06-03

每日養(yǎng)生,天天健康

體育訓(xùn)練成績(jī)?cè)u(píng)定2018-06-03

通用課目體育訓(xùn)練成績(jī)?cè)u(píng)定