日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

學無先后,達者為師

網站首頁 編程語言 正文

Python語法學習之正則表達式的量詞匯總_python

作者:渴望力量的哈士奇 ? 更新時間: 2022-06-17 編程語言

正則表達式中的符號

符號 描述
re1 | re2 匹配正則表達式 re1 或者 re2 ;re1 與 re2 代表兩個匹配的字符串信息
^ 匹配字符串起始部分
$ 匹配字符串終止部分(也就是末尾部分)
* 匹配0次或者多次前面出現的正則表達式
+ 匹配1次或者多次前面出現的正則表達式
{N} 匹配 N 次前面出現的正則表達式
{M, N} 匹配 M - N 次前面出現的正則表達式
[…] 匹配來自字符集的任意單一字符
[…x-y…] 匹配 x-y 范圍內的任意單一字符
[^…] 不匹配此字符集內出現的任何一個字符,包括某一范圍的字符(如果在此字符集中出現)
\ 將特殊字符無效化

通過這樣的描述可能大家很難理解,接下來我們看一些簡單的例子,幫助理解它們的用法。(下文示例順序按照上述表格順序排列)

示例 - 1

代碼示例如下:

import re


test_data = 'Neo@protonmail.com'

print(re.findall('Neo|proton|com|mail', test_data))

# >>> 執行結果如下:
# >>> ['Neo', 'proton', 'mail', 'com']

PS:|?為 或 的關系,只要存在就能捕獲;匹配到的順序只按照字符串的順序返回,而不是按照匹配規則返回。

示例 - 2

代碼示例如下:

import re


test_data = 'Neo@protonmail.com'

print(re.findall('^Neo', test_data))

# >>> 執行結果如下:
# >>> ['Neo']

print(re.findall('^HanMeiMei', test_data))		# 沒有開頭是 HanMeiMei 的數據
# >>> 執行結果如下:
# >>> []

PS:^?匹配字符串起始部分; 等同于上一章節我們學習的?\A

示例 - 3

代碼示例如下:

import re


test_data = 'Neo@protonmail.com'

print(re.findall('com$', test_data))

# >>> 執行結果如下:
# >>> ['com']

print(re.findall('com.cn$', test_data))		# 沒有結尾是 com.cn 的數據

# >>> 執行結果如下:
# >>> []

PS:$?匹配字符串末尾部分; 等同于上一章節我們學習的?\Z

示例 - 4

代碼示例如下:

import re


test_data = 'Neo@protonmail.com'

print(re.findall('\w*', test_data))     # 匹配 0 次 或者 多次 數字或字母,[含空格]((解決上一章節的思考問題

# >>> 執行結果如下:
# >>> ['Neo', '', 'protonmail', '', 'com', '']

PS:匹配 0 次 或者 多次 數字或字母,[含空格]((解決上一章節的思考問題)

示例 - 5

代碼示例如下:

import re


test_data = 'Neo@protonmail.com'

print(re.findall('\w+', test_data))     # 匹配 1 次 或者 多次 數字或字母,[不含空格]

# >>> 執行結果如下:
# >>> ['Neo', 'protonmail', 'com']
  • w+?: 匹配1次或者多次數字或者字母
  • @?和?.?:屬于 0 次 范圍,不會被匹配出來

示例 - 6

代碼示例如下:

import re


test_data = 'Neo@protonmail.com'

print(re.findall('\w{3}', test_data))		# 匹配3次數字或者字母

# >>> 執行結果如下:
# >>> ['Neo', 'pro', 'ton', 'mai', 'com']

print(re.findall('[a-z]{3}', test_data))	# 匹配小寫的 [a-z] 3次

# >>> 執行結果如下:
# >>> ['pro', 'ton', 'mai', 'com']
  • {N}:對于匹配到的數據只獲取 N 個
  • [a-zA-Z0-9]:基本上等同于?\w

示例 - 7

代碼示例如下:

import re


test_data = 'Neo@protonmail.com'

print(re.findall('\w{1,5}', test_data))    # 匹配 1 次 到 5次 的數字或字母[這是一個范圍]

# >>> 執行結果如下:
# >>> ['Neo', 'proto', 'nmail', 'com']

print(re.findall('\w{1, 5}', test_data)) 

# >>> 執行結果如下:
# >>> []
  • [1,5]:給出匹配到的數據的范圍
  • [1, 5]:需要注意的是 N 和 M 中間的逗號不能有空格,否則會返回的是空列表。

示例 - 8

代碼示例如下:

import re


test_data = 'Neo@protonmail.com'

print(re.findall('[^Neo]', test_data))      # 這里的 ^ 不再代表開始的位置,而是不匹配 Neo 此字符集

# >>> 執行結果如下:
# >>> ['@', 'p', 'r', 't', 'n', 'm', 'a', 'i', 'l', '.', 'c', 'm']

PS:[^...]?這里中括號內的?^?不再代表開始的位置,而是過濾掉當前字符集中的字符。

組的概念

符號 描述
() 在匹配規則中獲取指定的數據

代碼示例如下:

import re


data = "My name is Neo, I'm 30 year's old."
result = re.search('My name is (.*), I\'m (.*) year\'s old.', data)   # search 函數是一個獲取組的概念

print(result.groups())	

# >>> 執行結果如下:
# >>> ('Neo', '30')

print(result.group(1))	# 獲取 組 的第一個數據
# >>> 執行結果如下:
# >>> Neo

print(result.group(2))	# 獲取 組 的第二個數據

# >>> 執行結果如下:
# >>> 30

利用 search 函數組的概念,獲取指定字符串中指定的數據。

貪婪模式與非貪婪模式

在上文的例子中,我們使用的 '.*' 或者 '\w+' 等的這種匹配0次或者多次就是屬于 貪婪模式

而非貪婪模式,就是可以匹配到多個信息,但是進行了限制,就是非貪婪模式。實現非貪婪模式,通過? 組合編程非貪婪模式。

\d+? 或者 \w*? 等模式

原文鏈接:https://blog.csdn.net/weixin_42250835/article/details/124222979

欄目分類
最近更新