網站首頁 編程語言 正文
?一、Xpath概述
1、Xpath簡介
Xpath(XML Path Language)?是一門在 XML 文檔中查找信息的語言,可以用來在XML文檔中對元素和屬性進行遍歷。XPath 用于在 XML 文檔中通過元素和屬性進行導航。其是一種路徑語言(XML Path Language),用來確定XML文檔中某部分的位置。
XPath基于XML的樹狀結構,提供在數據結構樹中找尋節點的能力。起初XPath的提出的初衷是將其作為一個通用的、介于XPointer與XSL間的語法模型。但是XPath很快的被開發者采用來當作小型*查詢語言被廣泛使用。
2、?Xpath的安裝
Xpath只是?lxml
?庫中的一個模塊,想要使用?Xpath
?那么就需要安裝?lxml
?庫
pip install lxml
二、Xpath的常用規則
1、路徑查找
Xpath 的主要語法
2、節點查找
查找節點的一些語法
3、未知節點
當我們匹配時會出現路徑不確定的情況,這個時候我們就要涉及到匹配未知節點。匹配未知節點也有對應的語法。
4、獲取節點中的文本
通過 屬性方法可以獲取屬性內的內容,但是位于節點之間的內容無法獲取到,這個時候就可以通過?text()
?與?string()
?方法來獲得其中的文本。
通過?text()
?獲取某個節點中的文本
In [1]: page.xpath('//li/a[3]/text()') Out[1]: ['霸道總裁愛上我', '斗羅大陸'] #通過 text() 屬性可以很輕松的獲取標簽之間的文本。
通過?string()
?獲取某個節點中的文本
In [1]: page.xpath('string(//li[1]/a[3])') Out[1]: '霸道總裁愛上我'
5、選取多個路徑
需要同時查找多個條件時可以通過在路徑表達式中使用管道符("|"),選取若干個路徑
In [1]: page.xpath('XXXXXXX | XXXXXXXtext()')
Out[1]: ['']
總結
原文鏈接:https://blog.csdn.net/m0_63794226/article/details/126377840
相關推薦
- 2022-06-01 關于nginx?反向代理?URL替換方案_nginx
- 2022-04-17 axios token失效刷新token怎么重新請求_Token 刷新并發處理解決方案
- 2022-04-03 Android?App應用退到后臺顯示通知的實現方法_Android
- 2022-07-07 Python自動化測試selenium指定截圖文件名方法_python
- 2023-03-11 React中的for循環解讀_React
- 2022-08-16 C語言超詳細講解函數指針的運用_C 語言
- 2023-01-26 詳解Python手寫數字識別模型的構建與使用_python
- 2022-05-27 Jmeter通過OS進程取樣器調用Python腳本實現參數互傳_python
- 最近更新
-
- window11 系統安裝 yarn
- 超詳細win安裝深度學習環境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權
- redisson分布式鎖中waittime的設
- maven:解決release錯誤:Artif
- restTemplate使用總結
- Spring Security之安全異常處理
- MybatisPlus優雅實現加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發現-Nac
- Spring Security之基于HttpR
- Redis 底層數據結構-簡單動態字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支