網站首頁 編程語言 正文
前言
正則表達式是一個特殊的字符序列,它能幫助你方便的檢查一個字符串是否與某種模式匹配。
Python 自1.5版本起增加了re 模塊,它提供 Perl 風格的正則表達式模式。
re 模塊使 Python 語言擁有全部的正則表達式功能。
利用正則表達式從字符串提取數字
主要用到下面幾個函數
(1)compile 函數根據一個模式字符串和可選的標志參數生成一個正則表達式對象。該對象擁有一系列方法用于正則表達式匹配和替換。
語法格式為:
re.compile(pattern[, flags])
參數:
- pattern : 一個字符串形式的正則表達式
- flags 可選,表示匹配模式,比如忽略大小寫,多行模式等,具體參數為:
- re.I 忽略大小寫
- re.L 表示特殊字符集 \w, \W, \b, \B, \s, \S 依賴于當前環境
- re.M 多行模式
- re.S 即為' . '并且包括換行符在內的任意字符(' . '不包括換行符)
- re.U 表示特殊字符集 \w, \W, \b, \B, \d, \D, \s, \S 依賴于 Unicode 字符屬性數據庫
- re.X 為了增加可讀性,忽略空格和' # '后面的注釋
(2)re.match 嘗試從字符串的起始位置匹配一個模式,如果不是起始位置匹配成功的話,match()就返回none。
函數語法:
re.match(pattern, string, flags=0)
(3)re.search 掃描整個字符串并返回第一個成功的匹配。
函數語法:
re.search(pattern, string, flags=0)
注:
re.match只匹配字符串的開始,如果字符串開始不符合正則表達式,則匹配失敗,函數返回None;而re.search匹配整個字符串,直到找到一個匹配。
(4)findall
在字符串中找到正則表達式所匹配的所有子串,并返回一個列表,如果沒有找到匹配的,則返回空列表。
注意: match 和 search 是匹配一次 findall 匹配所有。
語法格式為:
findall(string[, pos[, endpos]])
參數:
string 待匹配的字符串。
pos 可選參數,指定字符串的起始位置,默認為 0。
endpos 可選參數,指定字符串的結束位置,默認為字符串的長度。
下面是實現的具體方法:
def findnum(string): comp=re.compile(-?[1-9]\d*) list_str=comp.findall(string) list_num=[] for item in list_str: item=int(item) list_num.append(item) return list_num
re.compile()的一些匹配參數:
- [1-9]\d* ? ? ?正整數
- -[1-9]\d* ?負整數
- -?[1-9]\d* 整數
- [1-9]\d*|0 ?非負整數
- -[1-9]\d*|0 ?非正整數
- [1-9]\d*\.\d*|0\.\d*[1-9]\d*$ ?正浮點數
- -([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$ ?負浮點數
- -?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$ ?浮點數
附python正則表達式抽取文本中的時間日期
使用python的正則表達式抽取文本中的年月日信息,如2020年5月19日。
def find_time(yanbao_txt, entity): paras = [para.strip() for para in yanbao_txt.split('\n') if para.strip()][:5] for para in paras: ret = re.findall(r'(\d{4})\s*[\./年-]\s*(\d{1,2})\s*[\./月-]\s*(\d{1,2})\s*日?', para) if ret: year, month, day = ret[0] time = '{}/{}/{}'.format(year, month.lstrip(), day.lstrip()) return time return None
總結
原文鏈接:https://blog.csdn.net/Buer_zhu/article/details/79636619
相關推薦
- 2022-07-11 Android?Studio實現注冊頁面跳轉登錄頁面的創建_Android
- 2022-08-19 Android開發自定義實時圖表控件實現示例_Android
- 2022-08-25 C++超詳細梳理IO流操作_C 語言
- 2022-07-07 Python?pluggy框架使用示例代碼_python
- 2022-05-10 ioc基于注解方式
- 2022-05-01 pytorch中的torch.nn.Conv2d()函數圖文詳解_python
- 2022-11-04 關于docker部署服務時ip無法訪問服務正常的問題_docker
- 2023-03-18 pandas檢查和填充缺失值的N種方法總結_python
- 最近更新
-
- window11 系統安裝 yarn
- 超詳細win安裝深度學習環境2025年最新版(
- Linux 中運行的top命令 怎么退出?
- MySQL 中decimal 的用法? 存儲小
- get 、set 、toString 方法的使
- @Resource和 @Autowired注解
- Java基礎操作-- 運算符,流程控制 Flo
- 1. Int 和Integer 的區別,Jav
- spring @retryable不生效的一種
- Spring Security之認證信息的處理
- Spring Security之認證過濾器
- Spring Security概述快速入門
- Spring Security之配置體系
- 【SpringBoot】SpringCache
- Spring Security之基于方法配置權
- redisson分布式鎖中waittime的設
- maven:解決release錯誤:Artif
- restTemplate使用總結
- Spring Security之安全異常處理
- MybatisPlus優雅實現加密?
- Spring ioc容器與Bean的生命周期。
- 【探索SpringCloud】服務發現-Nac
- Spring Security之基于HttpR
- Redis 底層數據結構-簡單動態字符串(SD
- arthas操作spring被代理目標對象命令
- Spring中的單例模式應用詳解
- 聊聊消息隊列,發送消息的4種方式
- bootspring第三方資源配置管理
- GIT同步修改后的遠程分支