亚洲视频二区_亚洲欧洲日本天天堂在线观看_日韩一区二区在线观看_中文字幕不卡一区

公告:魔扣目錄網(wǎng)為廣大站長提供免費(fèi)收錄網(wǎng)站服務(wù),提交前請(qǐng)做好本站友鏈:【 網(wǎng)站目錄:http://www.430618.com 】, 免友鏈快審服務(wù)(50元/站),

點(diǎn)擊這里在線咨詢客服
新站提交
  • 網(wǎng)站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會(huì)員:747

搜索引擎的工作流程對(duì)于外界來說神秘而高不可測(cè),其實(shí)搜索引擎的工作流程非常簡單。當(dāng)作為一般用戶在使用搜索引擎時(shí),很難去想象或者了解搜索引擎的工作原理是怎樣的?所以正是因?yàn)閷?duì)搜索引擎的工作流程不太了解,導(dǎo)致現(xiàn)在很多人都認(rèn)為搜索引擎返回的結(jié)果是動(dòng)態(tài)的,也就是用戶輸入一個(gè)語句進(jìn)行關(guān)鍵字查詢的時(shí)候,搜索引擎馬上從互聯(lián)網(wǎng)上抓取篩選結(jié)果,然后把查詢的關(guān)鍵字結(jié)果反饋給用戶。其實(shí)搜索引擎返回的結(jié)果是提前就已經(jīng)抓取好了的,然后經(jīng)過了一系列算法篩選之后放入數(shù)據(jù)庫。當(dāng)用戶查詢時(shí)就立即對(duì)索引數(shù)據(jù)庫進(jìn)行查找,然后又反饋給用戶準(zhǔn)確的關(guān)鍵字查詢結(jié)果。

1、搜集信息形成快照

網(wǎng)頁快照收錄是搜索引擎通過蜘蛛程序在互聯(lián)網(wǎng)上抓取頁面并進(jìn)行存儲(chǔ)形成快照的過程,他為搜索引擎開展各項(xiàng)工作提供了數(shù)據(jù)支持。

搜索引擎的信息搜集基本上都是自動(dòng)的。搜索引擎利用稱為蜘蛛的自動(dòng)搜集機(jī)器人程序來連上每一個(gè)網(wǎng)頁的超鏈接。機(jī)器人程序根據(jù)網(wǎng)頁鏈到其他網(wǎng)頁中的超鏈接,就像日常生活中所說的“一傳十,十傳百......”一樣,從少數(shù)幾個(gè)網(wǎng)頁開始,連到數(shù)據(jù)庫上所有到其他網(wǎng)頁的鏈接。理論上,若網(wǎng)頁上有適當(dāng)?shù)某溄樱瑱C(jī)器人便可以遍歷絕大部分網(wǎng)頁。

2、整理信息分析界面

普通用戶看頁面,看到的都是文字、圖片等直觀信息,但是搜索引擎看的是網(wǎng)頁的源代碼,而且會(huì)根據(jù)這些源代碼來確定網(wǎng)頁的重要信息。

在看一個(gè)網(wǎng)頁時(shí),會(huì)發(fā)現(xiàn)一些粗體、斜體、加色等形式的漢字,還有一些比較大的字體,有些文字還像標(biāo)題一樣被隔開,這些設(shè)置不光讓是用戶在瀏覽信息的時(shí)候要特別注意,還有一點(diǎn)就是它們可能是網(wǎng)頁的重點(diǎn)。

在搜索引擎看來,源代碼頭部或者靠近頭部的信息往往是比其他位置的文字重要,大家可以很形象的將一個(gè)網(wǎng)頁和一張報(bào)紙的頁面比較著看。確定重要文字或詞語,這是搜索引擎建立網(wǎng)頁搜索過程的一個(gè)步驟。

搜索引擎整理信息的過程稱為“建立索引”。搜索引擎不僅要保存搜集起來的信息,還要將他們按照一定的規(guī)則進(jìn)行編排。這樣,搜索引擎根本不用重新翻查它所保存的信息就能迅速找到用戶所需要的資料。想象一下,如果信息是不按任何規(guī)則地隨意堆放在搜索引擎的數(shù)據(jù)庫中,那么它每次找資料都得把整個(gè)資料庫完全翻查一遍,如此一來,再快的計(jì)算機(jī)系統(tǒng)也沒用。

3、接受查詢處理關(guān)鍵詞

搜索引擎還會(huì)根據(jù)同義詞和潛在語義進(jìn)行拓展查詢檢索項(xiàng)。如搜索引擎會(huì)將“寵物”和“狗狗”,“藏獒”和“犬”,“人民”和“百姓”當(dāng)做一個(gè)概念進(jìn)行處理。另外,搜索引擎在查詢的時(shí)候,還會(huì)根據(jù)主題來進(jìn)行歸類,如當(dāng)查詢seo的時(shí)候,系統(tǒng)會(huì)自動(dòng)將“網(wǎng)絡(luò)營銷”、“搜索引擎優(yōu)化”、“網(wǎng)站優(yōu)化”之類的都?xì)w為一個(gè)主題處理。

當(dāng)用戶使用搜索引擎進(jìn)行查詢的時(shí)候,在搜索框中輸入一個(gè)關(guān)鍵詞,當(dāng)索引中有這樣一個(gè)完全匹配的結(jié)果的時(shí)候,就會(huì)顯示出來。對(duì)于英文來說,相對(duì)就比較簡單了,只要對(duì)英文的單復(fù)數(shù),時(shí)態(tài)、詞根、組合詞等進(jìn)行分析即可。不過對(duì)于中文,則一定要進(jìn)行分詞,然后對(duì)關(guān)鍵詞進(jìn)行向量計(jì)算,得出哪個(gè)網(wǎng)站的哪個(gè)關(guān)鍵詞的權(quán)重比較高,就顯示在索引中。

用戶向搜索引擎發(fā)出查詢,搜索引擎接受查詢并向用戶返回資料。搜索引擎每時(shí)每刻都要接受來自大量用戶的幾乎是同時(shí)發(fā)出的查詢,它按照每個(gè)用戶的要求檢查自己的索引,在極短的時(shí)間內(nèi)找到用戶需要的資料,并返回給用戶。目前,搜索引擎返回主要是以網(wǎng)頁鏈接的形式提供的,通過這些鏈接,用戶便能到達(dá)含有自己所需資料的網(wǎng)頁。通常搜索引擎會(huì)在鏈接下來提供一小段來自這些網(wǎng)頁的摘要信息以幫助用戶判斷此網(wǎng)頁是否含有自己所需要的內(nèi)容。

分享到:
標(biāo)簽:搜索引擎
用戶無頭像

網(wǎng)友整理

注冊(cè)時(shí)間:

網(wǎng)站:5 個(gè)   小程序:0 個(gè)  文章:12 篇

  • 51998

    網(wǎng)站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會(huì)員

趕快注冊(cè)賬號(hào),推廣您的網(wǎng)站吧!
最新入駐小程序

數(shù)獨(dú)大挑戰(zhàn)2018-06-03

數(shù)獨(dú)一種數(shù)學(xué)游戲,玩家需要根據(jù)9

答題星2018-06-03

您可以通過答題星輕松地創(chuàng)建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學(xué)四六

運(yùn)動(dòng)步數(shù)有氧達(dá)人2018-06-03

記錄運(yùn)動(dòng)步數(shù),積累氧氣值。還可偷

每日養(yǎng)生app2018-06-03

每日養(yǎng)生,天天健康

體育訓(xùn)練成績?cè)u(píng)定2018-06-03

通用課目體育訓(xùn)練成績?cè)u(píng)定