網(wǎng)站首頁 編程語言 正文
一)安裝scrapy:
1、打開cmd命令窗口,輸入:pip install Scrapy。
2、安裝成功之后會顯示下面字符,表示未將scrapy設(shè)置到環(huán)境變量。
3、配置環(huán)境變量:右鍵我的電腦-->屬性-->高級設(shè)置--->環(huán)境變量---->系統(tǒng)變量中的Path--->編輯--->添加--->將上文中黃色的路徑添加到環(huán)境變量即可。
4、scrapy安裝完畢。
二)創(chuàng)建一個scrapy爬蟲項目:
1、創(chuàng)建一個普通的Pycharm項目,然后找到下面的terminal
?2、輸入命令scrapy startproject 模塊名稱(可以自己隨便起,我以名為mine為例),成功之后你會發(fā)現(xiàn)自己的項目中多了一個mine的包文件。
?3、上述操作成功后終端會顯示下圖文字:此時我們輸入cd那條命令。進入目標文件。
?4、這時就可以創(chuàng)建爬蟲目標文件啦,
????????輸入scrapy genspider 爬取名 網(wǎng)站域名
1、爬取名是自己隨便起的,比如我要爬百度那么我就可以起名為baidu
2、網(wǎng)站域名就是去掉? https:www.? 剩下的部分,以博客園的為例:
網(wǎng)址為:https://www.cnblogs.com/
域名為?cnblogs.com
?2和3操作截圖:?
5、此時我們會在目錄里看見一個新的py文件:里自動生成如下代碼:
三)開啟pycharm對scrapy框架的調(diào)試功能:
由于pycharm沒有創(chuàng)建scrapy框架的模塊,所以我們想調(diào)試scrapy程序時要自己寫一個小腳本來開啟pycharm對scrapy的調(diào)試功能。
?1、在與mine包同級條件下創(chuàng)建一個main.py文件:
?2、mine文件將一下代碼賦值進去:
import os
import sys
from scrapy.cmdline import execute
sys.path.append(os.path.dirname(os.path.abspath(__file__)))
execute(["scrapy", "crawl", "cnblog"]) # 第三個參數(shù)為自己創(chuàng)建的那個爬取的名稱
?這樣就大功告成啦!
總結(jié)
原文鏈接:https://blog.csdn.net/weixin_60414376/article/details/124023917
相關(guān)推薦
- 2023-05-06 Python執(zhí)行ping操作的簡單方法_python
- 2022-03-26 Unity實現(xiàn)坦克模型_C#教程
- 2023-10-09 對Uni-app進行原生開發(fā)
- 2022-08-21 golang類型推斷與隱式類型轉(zhuǎn)換_Golang
- 2022-03-14 Go使用Gin框架開發(fā)博客系統(tǒng)(一)之環(huán)境搭建和項目初始化
- 2022-12-13 sql索引失效的情況以及超詳細解決方法_MsSql
- 2022-03-14 Spring mvc解決跨域請求:Response to preflight request doe
- 2022-04-10 Python?tkinter實現(xiàn)計算器功能_python
- 最近更新
-
- window11 系統(tǒng)安裝 yarn
- 超詳細win安裝深度學習環(huán)境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎(chǔ)操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區(qū)別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權(quán)
- redisson分布式鎖中waittime的設(shè)
- maven:解決release錯誤:Artif
- restTemplate使用總結(jié)
- Spring Security之安全異常處理
- MybatisPlus優(yōu)雅實現(xiàn)加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務(wù)發(fā)現(xiàn)-Nac
- Spring Security之基于HttpR
- Redis 底層數(shù)據(jù)結(jié)構(gòu)-簡單動態(tài)字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應(yīng)用詳解
- 聊聊消息隊列,發(fā)送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支