亚洲视频二区_亚洲欧洲日本天天堂在线观看_日韩一区二区在线观看_中文字幕不卡一区

公告:魔扣目錄網(wǎng)為廣大站長提供免費收錄網(wǎng)站服務,提交前請做好本站友鏈:【 網(wǎng)站目錄:http://www.430618.com 】, 免友鏈快審服務(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網(wǎng)站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

在我沒接觸這一行時這個問題困擾了我很長時間,讓我十分的不理解到底什么是爬蟲,它難道是一種實體工具?,直到我學習Python 深入分析了解以后才揭開了它神秘的面紗。

爬蟲到底是什么?爬蟲是否違法?簡談爬蟲概念

 

爬蟲是什么呢?爬蟲有簡單的爬蟲和復雜的爬蟲。實際上簡單的爬蟲是一種腳本,是一種按照一定的規(guī)則,自動地抓取萬維網(wǎng)信息的程序或者腳本。

腳本就是粗糙的,但往往非常實用的小程序(一般來說不會超過幾千行,有時候也就幾百幾十行的代碼構成)。舉個簡單的例子,你現(xiàn)在要從一個學生租房的網(wǎng)站上讀取關于出租的學生公寓的信息。你一條一條去抄寫肯定是不現(xiàn)實的。所以就要用爬蟲。可以把一個信息類網(wǎng)站上幾千條信息一次全部扒下來。百度,谷歌這類的搜索引擎你也可以認為是一種爬蟲,只不過這類的技術十分的復雜,不是簡單的腳本。

搜索引擎是如何工作的?其實就是通過網(wǎng)絡爬蟲技術,將互聯(lián)網(wǎng)中數(shù)以百億計的網(wǎng)頁信息保存到本地,形成一個鏡像文件,為整個搜索引擎提供數(shù)據(jù)支撐。

這樣的技術首先就會涉及到一個十分重要并且人人關注的問題——是否違法?

爬蟲到底是什么?爬蟲是否違法?簡談爬蟲概念

 

仔細探究后總結出了如下觀點:

1.遵守 Robots 協(xié)議,但有沒有 Robots 都不代表可以隨便爬,

2.限制你的爬蟲行為,禁止近乎 DDoS 的請求頻率,一旦造成服務器癱瘓,約等于網(wǎng)絡攻擊;

3.對于明顯反爬,或者正常情況不能到達的頁面不能強行突破,否則是 Hacker 行為;

4.審視清楚自己爬的內容,絕不能觸碰法律的紅線。

至此你應該明白,爬蟲本身并不違法,而是要看你使用的方式和目的,還要看其商業(yè)用途。

分享到:
標簽:爬蟲
用戶無頭像

網(wǎng)友整理

注冊時間:

網(wǎng)站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網(wǎng)站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網(wǎng)站吧!
最新入駐小程序

數(shù)獨大挑戰(zhàn)2018-06-03

數(shù)獨一種數(shù)學游戲,玩家需要根據(jù)9

答題星2018-06-03

您可以通過答題星輕松地創(chuàng)建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學四六

運動步數(shù)有氧達人2018-06-03

記錄運動步數(shù),積累氧氣值。還可偷

每日養(yǎng)生app2018-06-03

每日養(yǎng)生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定