網站首頁 編程語言 正文
前言:
我們想要在爬蟲中使用xpath
、beautifulsoup
、正則表達式,css選擇器等來提取想要的數據,但是因為scrapy
是一個比較重的框架,每次運行都要等到一段時間,因此要去驗證我們提取規則是否正確,是一個比較麻煩的事情,因此,scrapy
提供了一個shell。用來方便的測試規則,當然也不僅僅局限于這一個功能。
打開Scrapy shell:
進入命令行終端,進入到scrapy
項目所在的目錄,然后進入到scrapy框架所在的虛擬環境中,輸入命令 scrapy shell [鏈接]
,就會進入到scrapy的shell環境中。在這個環境中,你可以跟在爬蟲的parse
方法中一樣使用了。
進入到scrapy項目所在的目錄:
cd /Volumes/development/Python_learn/PycharmProjects/scrapy_demo/bmw_img_demo/
進入到scrapy框架所在的虛擬環境中:
?source /Volumes/development/Python_learn/PycharmProjects/venv/crawler_evn/bin/activate
輸入命令 scrapy shell [鏈接] :
rapy shell https://car.autohome.com.cn/pic/series/66.html
?輸入我們需要測試的語句:
? ? ? ?srcs = response.xpath('//div[contains(@class,"uibox-con")]/ul/li/a/img/@src').getall()
原文鏈接:https://feige.blog.csdn.net/article/details/122775755
相關推薦
- 2022-07-11 iOS開發創建frame實現window窗口view視圖示例_IOS
- 2022-06-16 Go基礎教程系列之回調函數和閉包詳解_Golang
- 2022-09-21 Android?Intent傳遞大量數據出現問題解決_Android
- 2022-09-26 Qt如何實現輸入框@聯系人的@檢測的示例_C 語言
- 2024-02-28 UNI-APP,設置某個頁面橫屏后,恢復豎屏,返回再次進入其他頁面時,頁面內容放大錯亂
- 2022-02-27 Remove untracked files, stash or commit any change
- 2023-06-16 C語言中如何在結構體內定義函數_C 語言
- 2022-11-11 Android利用Canvas類繪制圖形_Android
- 最近更新
-
- window11 系統安裝 yarn
- 超詳細win安裝深度學習環境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權
- redisson分布式鎖中waittime的設
- maven:解決release錯誤:Artif
- restTemplate使用總結
- Spring Security之安全異常處理
- MybatisPlus優雅實現加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發現-Nac
- Spring Security之基于HttpR
- Redis 底層數據結構-簡單動態字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支