網(wǎng)站首頁 編程語言 正文
?一、Xpath概述
1、Xpath簡(jiǎn)介
Xpath(XML Path Language)?是一門在 XML 文檔中查找信息的語言,可以用來在XML文檔中對(duì)元素和屬性進(jìn)行遍歷。XPath 用于在 XML 文檔中通過元素和屬性進(jìn)行導(dǎo)航。其是一種路徑語言(XML Path Language),用來確定XML文檔中某部分的位置。
XPath基于XML的樹狀結(jié)構(gòu),提供在數(shù)據(jù)結(jié)構(gòu)樹中找尋節(jié)點(diǎn)的能力。起初XPath的提出的初衷是將其作為一個(gè)通用的、介于XPointer與XSL間的語法模型。但是XPath很快的被開發(fā)者采用來當(dāng)作小型*查詢語言被廣泛使用。
2、?Xpath的安裝
Xpath只是?lxml
?庫中的一個(gè)模塊,想要使用?Xpath
?那么就需要安裝?lxml
?庫
pip install lxml
二、Xpath的常用規(guī)則
1、路徑查找
Xpath 的主要語法
2、節(jié)點(diǎn)查找
查找節(jié)點(diǎn)的一些語法
3、未知節(jié)點(diǎn)
當(dāng)我們匹配時(shí)會(huì)出現(xiàn)路徑不確定的情況,這個(gè)時(shí)候我們就要涉及到匹配未知節(jié)點(diǎn)。匹配未知節(jié)點(diǎn)也有對(duì)應(yīng)的語法。
4、獲取節(jié)點(diǎn)中的文本
通過 屬性方法可以獲取屬性內(nèi)的內(nèi)容,但是位于節(jié)點(diǎn)之間的內(nèi)容無法獲取到,這個(gè)時(shí)候就可以通過?text()
?與?string()
?方法來獲得其中的文本。
通過?text()
?獲取某個(gè)節(jié)點(diǎn)中的文本
In [1]: page.xpath('//li/a[3]/text()') Out[1]: ['霸道總裁愛上我', '斗羅大陸'] #通過 text() 屬性可以很輕松的獲取標(biāo)簽之間的文本。
通過?string()
?獲取某個(gè)節(jié)點(diǎn)中的文本
In [1]: page.xpath('string(//li[1]/a[3])') Out[1]: '霸道總裁愛上我'
5、選取多個(gè)路徑
需要同時(shí)查找多個(gè)條件時(shí)可以通過在路徑表達(dá)式中使用管道符("|"),選取若干個(gè)路徑
In [1]: page.xpath('XXXXXXX | XXXXXXXtext()')
Out[1]: ['']
總結(jié)
原文鏈接:https://blog.csdn.net/m0_63794226/article/details/126377840
相關(guān)推薦
- 2022-06-16 Golang項(xiàng)目搭配nginx部署反向代理負(fù)載均衡講解_Golang
- 2022-12-13 Python使用Matplotlib繪制三維散點(diǎn)圖詳解流程_python
- 2022-06-01 c++深入淺出講解堆排序和堆_C 語言
- 2022-03-23 Qt實(shí)現(xiàn)兩個(gè)獨(dú)立窗口的信號(hào)通信_(tái)C 語言
- 2022-03-27 Android顯示富文本+夜間深色模式_Android
- 2022-07-15 初識(shí)python的numpy模塊_python
- 2022-01-29 yii 關(guān)聯(lián)表外鍵用法
- 2022-06-15 GO語言中err接口及defer延遲異常處理分析_Golang
- 最近更新
-
- window11 系統(tǒng)安裝 yarn
- 超詳細(xì)win安裝深度學(xué)習(xí)環(huán)境2025年最新版(
- Linux 中運(yùn)行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲(chǔ)小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎(chǔ)操作-- 運(yùn)算符,流程控制 Flo
- 1. Int 和Integer 的區(qū)別,Jav
- spring @retryable不生效的一種
- Spring Security之認(rèn)證信息的處理
- Spring Security之認(rèn)證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權(quán)
- redisson分布式鎖中waittime的設(shè)
- maven:解決release錯(cuò)誤:Artif
- restTemplate使用總結(jié)
- Spring Security之安全異常處理
- MybatisPlus優(yōu)雅實(shí)現(xiàn)加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務(wù)發(fā)現(xiàn)-Nac
- Spring Security之基于HttpR
- Redis 底層數(shù)據(jù)結(jié)構(gòu)-簡(jiǎn)單動(dòng)態(tài)字符串(SD
- arthas操作spring被代理目標(biāo)對(duì)象命令
- Spring中的單例模式應(yīng)用詳解
- 聊聊消息隊(duì)列,發(fā)送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠(yuǎn)程分支