日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

學無先后,達者為師

網站首頁 編程語言 正文

Python利用正則表達式從字符串提取數字_python

作者:Buer_zhu ? 更新時間: 2022-04-11 編程語言

前言

正則表達式是一個特殊的字符序列,它能幫助你方便的檢查一個字符串是否與某種模式匹配。

Python 自1.5版本起增加了re 模塊,它提供 Perl 風格的正則表達式模式。

re 模塊使 Python 語言擁有全部的正則表達式功能。

利用正則表達式從字符串提取數字

主要用到下面幾個函數

(1)compile 函數根據一個模式字符串和可選的標志參數生成一個正則表達式對象。該對象擁有一系列方法用于正則表達式匹配和替換。

語法格式為:

re.compile(pattern[, flags])

參數:

  • pattern : 一個字符串形式的正則表達式
  • flags 可選,表示匹配模式,比如忽略大小寫,多行模式等,具體參數為:
  • re.I 忽略大小寫
  • re.L 表示特殊字符集 \w, \W, \b, \B, \s, \S 依賴于當前環境
  • re.M 多行模式
  • re.S 即為' . '并且包括換行符在內的任意字符(' . '不包括換行符)
  • re.U 表示特殊字符集 \w, \W, \b, \B, \d, \D, \s, \S 依賴于 Unicode 字符屬性數據庫
  • re.X 為了增加可讀性,忽略空格和' # '后面的注釋

(2)re.match 嘗試從字符串的起始位置匹配一個模式,如果不是起始位置匹配成功的話,match()就返回none。

函數語法:

re.match(pattern, string, flags=0)

(3)re.search 掃描整個字符串并返回第一個成功的匹配。

函數語法:

re.search(pattern, string, flags=0)

注:

re.match只匹配字符串的開始,如果字符串開始不符合正則表達式,則匹配失敗,函數返回None;而re.search匹配整個字符串,直到找到一個匹配。

(4)findall

在字符串中找到正則表達式所匹配的所有子串,并返回一個列表,如果沒有找到匹配的,則返回空列表。

注意: match 和 search 是匹配一次 findall 匹配所有。

語法格式為:

findall(string[, pos[, endpos]])

參數:

string 待匹配的字符串。
pos 可選參數,指定字符串的起始位置,默認為 0。
endpos 可選參數,指定字符串的結束位置,默認為字符串的長度。

下面是實現的具體方法:

def findnum(string):
    comp=re.compile(-?[1-9]\d*)
    list_str=comp.findall(string)
    list_num=[]
    for item in list_str:
        item=int(item)
        list_num.append(item)
    return list_num

re.compile()的一些匹配參數:

  • [1-9]\d* ? ? ?正整數
  • -[1-9]\d*  ?負整數
  • -?[1-9]\d* 整數
  • [1-9]\d*|0 ?非負整數
  • -[1-9]\d*|0  ?非正整數
  • [1-9]\d*\.\d*|0\.\d*[1-9]\d*$  ?正浮點數
  • -([1-9]\d*\.\d*|0\.\d*[1-9]\d*)$ ?負浮點數
  • -?([1-9]\d*\.\d*|0\.\d*[1-9]\d*|0?\.0+|0)$ ?浮點數

附python正則表達式抽取文本中的時間日期

使用python的正則表達式抽取文本中的年月日信息,如2020年5月19日。

def find_time(yanbao_txt, entity):
    paras = [para.strip() for para in yanbao_txt.split('\n') if para.strip()][:5]
    for para in paras:
        ret = re.findall(r'(\d{4})\s*[\./年-]\s*(\d{1,2})\s*[\./月-]\s*(\d{1,2})\s*日?', para)
        if ret:
            year, month, day = ret[0]
            time = '{}/{}/{}'.format(year, month.lstrip(), day.lstrip())
            return time
    return None

總結

原文鏈接:https://blog.csdn.net/Buer_zhu/article/details/79636619

欄目分類
最近更新