大家好,這里是一濤說(shuō)電腦,很高興今天我們來(lái)聊聊我們常用的搜索引擎。
搜索引擎分類
搜索引擎大致可分為四種:全文搜索引擎、元搜索引擎、垂直搜索引擎和目錄搜索引擎幾大類
搜索引擎原理
通俗的講就是收集了萬(wàn)維網(wǎng)上眾多的網(wǎng)頁(yè)中的每一個(gè)詞并記錄到數(shù)據(jù)庫(kù)中,然后建立數(shù)據(jù)庫(kù)索引的搜索引擎。當(dāng)用戶輸入關(guān)鍵詞時(shí),就在數(shù)據(jù)庫(kù)中查找該詞,并迅速將擁有該詞的網(wǎng)頁(yè)展現(xiàn)在用戶面前。
引擎結(jié)構(gòu)
搜索引擎基本結(jié)構(gòu)一般包括:搜索器、索引器、檢索器、用戶接口等四個(gè)功能模塊。
- 搜索器,顧名思義就是搜索用的,也被稱為網(wǎng)絡(luò)蜘蛛,程序員俗稱爬蟲(chóng),更為形象的比喻就是螞蟻搬家,是搜索引擎用來(lái)抓取網(wǎng)頁(yè)內(nèi)容的一個(gè)全自動(dòng)程序,在他們系統(tǒng)后臺(tái)全天不停歇的在萬(wàn)維網(wǎng)上爬行抓取內(nèi)容到他們服務(wù)器上。
- 索引器,就是將搜索器抓取的內(nèi)容就行分類存儲(chǔ)在數(shù)據(jù)庫(kù)中并就行索引。
- 檢索器,當(dāng)我們輸入關(guān)鍵詞時(shí),此時(shí)會(huì)在他們數(shù)據(jù)庫(kù)中得到很多結(jié)果(先進(jìn)行預(yù)處理),檢索器就是優(yōu)化結(jié)果,將最接近我們輸入的關(guān)鍵詞的結(jié)果優(yōu)先輸出。
- 用戶接口,就是檢索器優(yōu)化后的結(jié)果展現(xiàn)到我們面前。
工作原理
搜索器工作原理,通過(guò)網(wǎng)絡(luò)蜘蛛程序:掃描程序指定范圍內(nèi)IP地址網(wǎng)站,通過(guò)鏈接遍歷整個(gè)Web空間,來(lái)進(jìn)行采集網(wǎng)頁(yè)資料,為保證采集的資料最新,蜘蛛程序可能會(huì)回訪已抓取過(guò)的網(wǎng)頁(yè),以防萬(wàn)一。
屏蔽百度搜索引擎
有的時(shí)候我們網(wǎng)站的信息并不希望搜索引擎能夠爬取,例如:獨(dú)家新聞、視頻、門(mén)戶網(wǎng)站,一些登錄頁(yè)面,或者不想分享的內(nèi)容,此時(shí)我們就會(huì)想辦法屏蔽搜索引擎。其實(shí)屏蔽搜索引擎的方法很多,小編列舉幾種,僅供參考切勿用于不法用途!
- robots.txt方法
robots協(xié)議也叫robots.txt(統(tǒng)一小寫(xiě))是一種存放于網(wǎng)站根目錄下的ASCII編碼的文本文件,它通常告訴網(wǎng)絡(luò)搜索引擎的漫游器(又稱網(wǎng)絡(luò)蜘蛛),此網(wǎng)站中的哪些內(nèi)容是不應(yīng)被搜索引擎的漫游器獲取的,哪些是可以被漫游器獲取的。因?yàn)橐恍┫到y(tǒng)中的URL是大小寫(xiě)敏感的,所以robots.txt的文件名應(yīng)統(tǒng)一為小寫(xiě)。robots.txt應(yīng)放置于網(wǎng)站的根目錄下。如果想單獨(dú)定義搜索引擎的漫游器訪問(wèn)子目錄時(shí)的行為,那么可以將自定的設(shè)置合并到根目錄下的robots.txt,或者使用robots元數(shù)據(jù)(Metadata,又稱元數(shù)據(jù))。
搜索引擎一般情況下是默認(rèn)遵守robots.txt協(xié)議的,所以我們可以通過(guò)robots協(xié)議來(lái)屏蔽搜索引擎
編輯代碼如下:User-agent:*Disallow:,保存為robots.txt文本文件上傳至網(wǎng)站根目錄下即可。
還可以通過(guò)網(wǎng)頁(yè)代碼,在網(wǎng)站首頁(yè)代碼<head>與</head>之間,加入<metaname="robots"content="noarchive">
此標(biāo)記禁止搜索引擎抓取網(wǎng)站并顯示網(wǎng)頁(yè)快照。
可以聯(lián)系百度管理人員,信箱地址為:[email protected],用網(wǎng)站聯(lián)系人信箱發(fā)電郵,如實(shí)說(shuō)明刪除網(wǎng)頁(yè)快照的情況,經(jīng)百度核實(shí)后,網(wǎng)頁(yè)停止收錄抓取。
登陸百度自己的“百度快照”貼吧和“百度投訴”貼吧,發(fā)個(gè)帖子,表明刪除網(wǎng)頁(yè)收錄網(wǎng)站快照的原因,當(dāng)百度管理人員,看到會(huì)給予處理。
列舉幾個(gè)國(guó)內(nèi)知名搜索引擎
搜索引擎是如何盈利的
說(shuō)到搜索引擎的盈利方式那真是太多了,五花八門(mén),今天說(shuō)說(shuō)我們熟悉的百度吧!
百度的盈利方式其實(shí)也很多,今天說(shuō)說(shuō)最主要的幾種:
方式一、競(jìng)價(jià)排名
百度營(yíng)收重要功臣
百度競(jìng)價(jià)排名也被稱作百度搜索推廣、百度關(guān)鍵字推廣。是一種按效果付費(fèi)的網(wǎng)絡(luò)推廣方式,企業(yè)在購(gòu)買(mǎi)該項(xiàng)服務(wù)后,提交自己定制的關(guān)鍵詞,其推廣信息就會(huì)率先出現(xiàn)在網(wǎng)民相應(yīng)的搜索結(jié)果中。簡(jiǎn)單來(lái)說(shuō)就是當(dāng)用戶利用某一關(guān)鍵詞進(jìn)行檢索,在檢索結(jié)果頁(yè)面會(huì)出現(xiàn)與該關(guān)鍵詞相關(guān)的廣告內(nèi)容。百度按照實(shí)際點(diǎn)擊量進(jìn)行收費(fèi)。其好處也是顯而可見(jiàn),可以更直接給企業(yè)帶來(lái)一個(gè)潛在客戶,但是在同一關(guān)鍵字下,誰(shuí)的價(jià)格高,誰(shuí)的排名將會(huì)更靠前,這也讓百度賺的盆滿缽滿。其實(shí)并非百度,大多數(shù)的搜索引擎都靠競(jìng)價(jià)來(lái)賺錢(qián)。
方式二、火爆地帶
火爆地帶即百度火爆地帶是一種針對(duì)特定關(guān)鍵詞的網(wǎng)絡(luò)推廣方式,按時(shí)間段固定付費(fèi),出現(xiàn)在百度網(wǎng)頁(yè)搜索結(jié)果第一頁(yè)的右側(cè),不同位置價(jià)格不同。
企業(yè)購(gòu)買(mǎi)了火爆地帶關(guān)鍵詞后,就會(huì)被主動(dòng)查找這些關(guān)鍵詞的用戶找到,給企業(yè)帶來(lái)更多的商業(yè)機(jī)會(huì)!
表現(xiàn)形式
百度火爆地帶出現(xiàn)在網(wǎng)頁(yè)搜索結(jié)果第一頁(yè)的右側(cè)區(qū)域內(nèi), 點(diǎn)擊后可直接進(jìn)入企業(yè)所指定的網(wǎng)站
方式三、圖片推廣收入
是一種針對(duì)特定關(guān)鍵詞的網(wǎng)絡(luò)推廣方式,按時(shí)間段固定付費(fèi),搜索結(jié)果第一頁(yè)的結(jié)果區(qū)域,不同詞匯價(jià)格不同。企業(yè)購(gòu)買(mǎi)了圖片推廣關(guān)鍵詞后,就會(huì)被主動(dòng)查找這些關(guān)鍵詞的用戶內(nèi)找到并向其展示企業(yè)推廣圖片,給企業(yè)帶來(lái)商業(yè)機(jī)會(huì)!
方式四、品牌專區(qū)收入
百度品牌專區(qū),位于百度搜索結(jié)果首位,以超大黃金首屏展示位置,以文字、圖片、視頻等多種廣告形式全方位推廣展示企業(yè)品牌信息,將最為精華和直接的品牌信息展現(xiàn)在網(wǎng)民面前,眾多網(wǎng)民也得以更便捷的了解品牌官網(wǎng)信息,更方便的獲取所需企業(yè)資訊,是提升企業(yè)品牌推廣效能的創(chuàng)新品牌推廣模式。
好了,這里是一濤說(shuō)電腦,我們下期再見(jiàn)!






