網站首頁 編程語言 正文
前言:
我們想要在爬蟲中使用xpath
、beautifulsoup
、正則表達式,css選擇器等來提取想要的數據,但是因為scrapy
是一個比較重的框架,每次運行都要等到一段時間,因此要去驗證我們提取規則是否正確,是一個比較麻煩的事情,因此,scrapy
提供了一個shell。用來方便的測試規則,當然也不僅僅局限于這一個功能。
打開Scrapy shell:
進入命令行終端,進入到scrapy
項目所在的目錄,然后進入到scrapy框架所在的虛擬環境中,輸入命令 scrapy shell [鏈接]
,就會進入到scrapy的shell環境中。在這個環境中,你可以跟在爬蟲的parse
方法中一樣使用了。
進入到scrapy項目所在的目錄:
cd /Volumes/development/Python_learn/PycharmProjects/scrapy_demo/bmw_img_demo/
進入到scrapy框架所在的虛擬環境中:
?source /Volumes/development/Python_learn/PycharmProjects/venv/crawler_evn/bin/activate
輸入命令 scrapy shell [鏈接] :
rapy shell https://car.autohome.com.cn/pic/series/66.html
?輸入我們需要測試的語句:
? ? ? ?srcs = response.xpath('//div[contains(@class,"uibox-con")]/ul/li/a/img/@src').getall()
原文鏈接:https://feige.blog.csdn.net/article/details/122775755
相關推薦
- 2022-03-14 文件上傳錯誤the request doesn't contain a multipart/form
- 2023-01-03 c語言malloc函數的用法示例和意義_C 語言
- 2022-03-27 mongodb啟動方法小結_MongoDB
- 2022-10-17 python?文件讀寫和數據清洗_python
- 2022-03-30 C#算法之回文數_C#教程
- 2022-07-25 View事件分發原理和ViewPager+ListView嵌套滑動沖突_Android
- 2022-04-15 Android一個類實現錄音與播放實例_Android
- 2023-04-06 Pytorch中關于model.eval()的作用及分析_python
- 最近更新
-
- window11 系統安裝 yarn
- 超詳細win安裝深度學習環境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權
- redisson分布式鎖中waittime的設
- maven:解決release錯誤:Artif
- restTemplate使用總結
- Spring Security之安全異常處理
- MybatisPlus優雅實現加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發現-Nac
- Spring Security之基于HttpR
- Redis 底層數據結構-簡單動態字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支