網站首頁編程語言正文

Python正則表達式re.search()用法詳解_python

作者：IT之一小佬 ? 更新時間： 2022-11-15 編程語言

re.search()：匹配整個字符串，并返回第一個成功的匹配。如果匹配失敗，則返回None?

pattern: 匹配的規則,

string : 要匹配的內容,

flags 標志位這個是可選的,就是可以不寫,可以寫, 比如要忽略字符的大小寫就可以使用標志位

flags?: 可選，表示匹配模式，比如忽略大小寫，多行模式等，具體參數為：

re.I 忽略大小寫

re.L 表示特殊字符集 \w, \W, \b, \B, \s, \S 依賴于當前環境

re.M 多行模式

re.S 即為 . 并且包括換行符在內的任意字符（. 不包括換行符）

re.U 表示特殊字符集 \w, \W, \b, \B, \d, \D, \s, \S 依賴于 Unicode 字符屬性數據庫

re.X 為了增加可讀性，忽略空格和 # 后面的注釋

示例代碼：【檢查字符串是否以 "Long" 開頭并以 "China" 結尾】

import re
 
s = "Long live the people's Republic of China"
ret = re.search("^Long.*China$", s)
 
print(ret)
print(ret.group())
print(ret[0])

運行結果：

?示例代碼：【在字符串中搜索第一個空白字符】

import re
 
s = "Long live the people's Republic of China"
ret = re.search("\s", s)
 
print(ret)
print(ret.start())

運行結果：

示例代碼：【如果search未匹配到，返回None】

import re
 
s = "Long live the people's Republic of China"
ret = re.search("USA", s)
 
print(ret)

運行結果：

?示例代碼：【忽略大小寫】

import re
 
s = "Long live the people's Republic of China"
# ret1 = re.search('long', s)  這行代碼直接報錯
ret1 = re.search('l', s)
print(ret1)
print(ret1.span())
print(ret1.string)
print(ret1.group())
 
print("*" * 50)
 
ret2 = re.search('long', s, re.I)
print(ret2)
print(ret2.span())
print(ret2.string)
print(ret2.group())

運行結果：

示例代碼：【group()的使用】?

import re
 
s = 'abc123def456ghi789'
ret_compile = re.compile("([a-z]*)([0-9]*)([a-z]*)")
print(ret_compile)
 
ret = ret_compile.search(s)
print(ret)
print(ret.group())
print(ret.group(0))  # group()和group(0) 一樣匹配的是整體
print(ret.group(1))  # 匹配第1個小括號的內容
print(ret.group(2))  # 匹配第2個小括號的內容
print(ret.group(3))  # 匹配第3個小括號的內容

運行效果：

?示例代碼：【group()分組的使用】

import re
 
s = 'abc123def456ghi789'
ret_compile = re.compile("(?P<num1>[a-z]*)(?P<num2>[0-9]*)(?P<num3>[a-z]*)")
print(ret_compile)
 
ret = ret_compile.search(s)
print(ret)
print(ret.group())
print(ret.group(0))  # group()和group(0) 一樣匹配的是整體
print(ret.group(1))  # 匹配第1個小括號的內容
print(ret.group(2))  # 匹配第2個小括號的內容
print(ret.group(3))  # 匹配第3個小括號的內容
 
print("*" * 100)
 
print(ret.group())
print(ret.group("num1"))  # 這里效果等同于group(1)
print(ret.group("num2"))  # 這里效果等同于group(3)
print(ret.group("num3"))  # 這里效果等同于group(3)

運行效果：

總結：為匹配方便，能用search就不用match，match方法限定匹配時，頭部必須是一致的

匹配演練：最后我們做些匹配演練，實戰下

import re

html='''<div id="songs-list">
    <h2 class="title">經典老歌</h2>
    <p class="introduction">
        經典老歌列表
    </p>
    <ul id ="list" class="list-group">
        <li data-view="2">一路上有你</li>
        <li data-view="7">
            <a href="/2.mp3" singer="任賢齊">滄海一聲笑</a>
        </li>
        <li data-view="4" class="active">
            <a href="/3.mp3" singer="齊秦">往事隨風</a>
        </li>
        <li data-view="6"><a href="/4.mp3" singer="beyond">光輝歲月</a></li>
        <li data-view="5"><a href="/5.mp3" singer="陳惠琳">記事本</a></li>
        <li data-view="5">
            <a href="/6.mp3" singer="鄧麗君"><i class="fa fa-user"></i>但愿人長久</a>
        </li>
    </ul>
</div>
'''

上面是html代碼，要求匹配出第3個li標簽中的齊秦往事隨風，代碼如下：

result = re.search('<li.*?active.*?singer="(.*?)">(.*?)</a>',html,re.S)#re.S確保.能匹配到換行符
if result:
    print(result.group(1),result.group(2))

結果：

齊秦往事隨風

我們還要求匹配出第二個li標簽中的內容任賢齊滄海一聲笑

result = re.search('<li.*?singer="(.*?)">(.*?)</a>',html,re.S)
if result:
    print(result.group(1),result.group(2))

結果：

任賢齊滄海一聲笑

如果匹配時候不需要匹配換行符，那么參數中就沒必要帶re.S,比如匹配第4個和第5個li標簽中的歌手和歌名。但是re.search也僅僅是返回一個符合匹配的結果。如果我們要返回符合匹配的所有結果，要用到re.findall。這一節的re.search就說到這里。

總結?

原文鏈接：https://blog.csdn.net/weixin_44799217/article/details/122069415

上一篇：Golang?使用os?庫的?ReadFile()?讀文件最
下一篇：Apache?Doris的Bitmap索引和BloomFil

日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

網站首頁編程語言正文

Python正則表達式re.search()用法詳解_python

相關推薦

日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

網站首頁 編程語言 正文

Python正則表達式re.search()用法詳解_python

相關推薦

網站首頁編程語言正文