亚洲视频二区_亚洲欧洲日本天天堂在线观看_日韩一区二区在线观看_中文字幕不卡一区

公告:魔扣目錄網為廣大站長提供免費收錄網站服務,提交前請做好本站友鏈:【 網站目錄:http://www.430618.com 】, 免友鏈快審服務(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

今天我們仍舊利用scrapy框架實現自動翻頁爬取數據,爬取詩詞胖排行榜(
https://www.shicimingju.com/paiming)中的標題。

1.新建文件夾

scrapy starproject 文件名(wallpaper)

scrapy翻頁爬取--scrapy爬蟲案例

2.新建爬蟲文件

scrapy genspider 文件名(landscape)www.xxx.com

scrapy翻頁爬取--scrapy爬蟲案例

3.發送請求并解析數據

上兩節課有詳細的講解,所以這部分不再贅述。

scrapy翻頁爬取--scrapy爬蟲案例

4.建立翻頁鏈接

上面我們放的鏈接為第一頁的地址,根據翻頁網頁的地址我們可以發現,“p”對應的值為變量,因此我們拼接網址:

scrapy翻頁爬取--scrapy爬蟲案例

scrapy翻頁爬取--scrapy爬蟲案例

5.對翻頁鏈接發送請求

基本格式為:yield scrapy.Request(url地址,callback=self.parse),當遇到第二頁的時候,會根據上面的拼接地址填入,并解析數據

scrapy翻頁爬取--scrapy爬蟲案例

6.總結

要實現翻頁自動發送請求,需要先建立好第一頁的請求并解析,然后寫入翻頁的網址之后,通過調用yield關鍵字實現翻頁自動發送請求

分享到:
標簽:scrapy
用戶無頭像

網友整理

注冊時間:

網站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網站吧!
最新入駐小程序

數獨大挑戰2018-06-03

數獨一種數學游戲,玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學四六

運動步數有氧達人2018-06-03

記錄運動步數,積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定