日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

學無先后,達者為師

網站首頁 編程語言 正文

Python正則表達式re.search()用法詳解_python

作者:IT之一小佬 ? 更新時間: 2022-11-15 編程語言

re.search():匹配整個字符串,并返回第一個成功的匹配。如果匹配失敗,則返回None?

pattern: 匹配的規則,

string : 要匹配的內容,

flags 標志位 這個是可選的,就是可以不寫,可以寫, 比如要忽略字符的大小寫就可以使用標志位

flags?: 可選,表示匹配模式,比如忽略大小寫,多行模式等,具體參數為:

  1. re.I 忽略大小寫
  2. re.L 表示特殊字符集 \w, \W, \b, \B, \s, \S 依賴于當前環境
  3. re.M 多行模式
  4. re.S 即為 . 并且包括換行符在內的任意字符(. 不包括換行符)
  5. re.U 表示特殊字符集 \w, \W, \b, \B, \d, \D, \s, \S 依賴于 Unicode 字符屬性數據庫
  6. re.X 為了增加可讀性,忽略空格和 # 后面的注釋

示例代碼:【檢查字符串是否以 "Long" 開頭并以 "China" 結尾

import re
 
s = "Long live the people's Republic of China"
ret = re.search("^Long.*China$", s)
 
print(ret)
print(ret.group())
print(ret[0])

運行結果:

?示例代碼:【在字符串中搜索第一個空白字符

import re
 
s = "Long live the people's Republic of China"
ret = re.search("\s", s)
 
print(ret)
print(ret.start())

運行結果:

示例代碼:【如果search未匹配到,返回None】

import re
 
s = "Long live the people's Republic of China"
ret = re.search("USA", s)
 
print(ret)

運行結果:

?示例代碼:【忽略大小寫】

import re
 
s = "Long live the people's Republic of China"
# ret1 = re.search('long', s)  這行代碼直接報錯
ret1 = re.search('l', s)
print(ret1)
print(ret1.span())
print(ret1.string)
print(ret1.group())
 
print("*" * 50)
 
ret2 = re.search('long', s, re.I)
print(ret2)
print(ret2.span())
print(ret2.string)
print(ret2.group())

運行結果:

示例代碼:【group()的使用】?

import re
 
s = 'abc123def456ghi789'
ret_compile = re.compile("([a-z]*)([0-9]*)([a-z]*)")
print(ret_compile)
 
ret = ret_compile.search(s)
print(ret)
print(ret.group())
print(ret.group(0))  # group()和group(0) 一樣匹配的是整體
print(ret.group(1))  # 匹配第1個小括號的內容
print(ret.group(2))  # 匹配第2個小括號的內容
print(ret.group(3))  # 匹配第3個小括號的內容

運行效果:

?示例代碼:【group()分組的使用】

import re
 
s = 'abc123def456ghi789'
ret_compile = re.compile("(?P<num1>[a-z]*)(?P<num2>[0-9]*)(?P<num3>[a-z]*)")
print(ret_compile)
 
ret = ret_compile.search(s)
print(ret)
print(ret.group())
print(ret.group(0))  # group()和group(0) 一樣匹配的是整體
print(ret.group(1))  # 匹配第1個小括號的內容
print(ret.group(2))  # 匹配第2個小括號的內容
print(ret.group(3))  # 匹配第3個小括號的內容
 
print("*" * 100)
 
print(ret.group())
print(ret.group("num1"))  # 這里效果等同于group(1)
print(ret.group("num2"))  # 這里效果等同于group(3)
print(ret.group("num3"))  # 這里效果等同于group(3)

運行效果:

總結:為匹配方便,能用search就不用match,match方法限定匹配時,頭部必須是一致的

匹配演練:最后我們做些匹配演練,實戰下

import re

html='''<div id="songs-list">
    <h2 class="title">經典老歌</h2>
    <p class="introduction">
        經典老歌列表
    </p>
    <ul id ="list" class="list-group">
        <li data-view="2">一路上有你</li>
        <li data-view="7">
            <a href="/2.mp3" singer="任賢齊">滄海一聲笑</a>
        </li>
        <li data-view="4" class="active">
            <a href="/3.mp3" singer="齊秦">往事隨風</a>
        </li>
        <li data-view="6"><a href="/4.mp3" singer="beyond">光輝歲月</a></li>
        <li data-view="5"><a href="/5.mp3" singer="陳惠琳">記事本</a></li>
        <li data-view="5">
            <a href="/6.mp3" singer="鄧麗君"><i class="fa fa-user"></i>但愿人長久</a>
        </li>
    </ul>
</div>
'''

上面是html代碼,要求匹配出 第3個li標簽中的齊秦 往事隨風 ,代碼如下:

result = re.search('<li.*?active.*?singer="(.*?)">(.*?)</a>',html,re.S)#re.S確保.能匹配到換行符
if result:
    print(result.group(1),result.group(2))

結果:

齊秦 往事隨風

我們還要求匹配出第二個li標簽中的內容 任賢齊 滄海一聲笑

result = re.search('<li.*?singer="(.*?)">(.*?)</a>',html,re.S)
if result:
    print(result.group(1),result.group(2))

結果:

任賢齊 滄海一聲笑

如果匹配時候不需要匹配換行符,那么參數中就沒必要帶re.S,比如匹配第4個和第5個li標簽中的歌手和歌名。但是re.search也僅僅是返回一個符合匹配的結果。如果我們要返回符合匹配的所有結果,要用到re.findall。這一節的re.search就說到這里。

總結?

原文鏈接:https://blog.csdn.net/weixin_44799217/article/details/122069415

欄目分類
最近更新