日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

學(xué)無(wú)先后,達(dá)者為師

網(wǎng)站首頁(yè) 編程語(yǔ)言 正文

正則表達(dá)式中關(guān)于對(duì)原生字符串的簡(jiǎn)單理解_正則表達(dá)式

作者:、Lu ? 更新時(shí)間: 2022-10-04 編程語(yǔ)言

在正則表達(dá)式中,有些字符是有特殊意義的字符。因此如果想要匹配這些字符,那么就必須使用反斜杠進(jìn)行轉(zhuǎn)義。比如$代表的是以...結(jié)尾,如果想要匹配$,那么就必須使用\$。示例代碼如下:

text = "apple price is \$99,orange paice is $88"
ret = re.search('\$(\d+)',text)
print(ret.group())
>> $99

原生字符串:

在正則表達(dá)式中,\是專(zhuān)門(mén)用來(lái)做轉(zhuǎn)義的。在Python中\(zhòng)也是用來(lái)做轉(zhuǎn)義的。因此如果想要在普通的字符串中匹配出\,那么要給出四個(gè)\。示例代碼如下:

text = "apple \c"
ret = re.search('\\\\c',text)
print(ret.group())

因此要使用原生字符串(r標(biāo)記)就可以解決這個(gè)問(wèn)題:

text = "apple \c"
ret = re.search(r'\\c',text)
print(ret.group())

那么原理是什么呢?為什么在不使用r來(lái)標(biāo)記原生字符串的時(shí)候需要四個(gè)\呢?使用r的時(shí)候需要兩個(gè)\呢?

我們需要先來(lái)了解一下正則表達(dá)式的一個(gè)匹配過(guò)程,例如 ret = re.search('\\\\c',text) 這句代碼:我們都知道 \ 字符無(wú)論是在python中還是正則表達(dá)式中都表示轉(zhuǎn)義字符,這句代碼 首先python將其解釋成 \\c(第一個(gè)和第三個(gè)\分別表示轉(zhuǎn)義,那么第二個(gè)和第四個(gè)表示普通字符\,最終即成為了\\c),接下來(lái)正則表達(dá)式拿到\\c后第一個(gè)\表示轉(zhuǎn)義,因此將最后解釋為普通的 \c 兩個(gè)字符,再去匹配的文本里比較。而使用r來(lái)標(biāo)記原生字符串后,python默認(rèn)解釋其為\\c三個(gè)字符,最后交由正則表達(dá)式再經(jīng)過(guò)轉(zhuǎn)義后即普通的\c兩個(gè)字符。?

原生字符串這里比較繞,希望對(duì)大家有所幫助

補(bǔ)充:在正則表達(dá)式的使用過(guò)程中,有個(gè)小小的疑問(wèn)r‘’ ,代表什么意思?

其實(shí)在《python基礎(chǔ)教程》中,作者已經(jīng)進(jìn)行了詳細(xì)的說(shuō)明。

加入要匹配字符串‘python.org’,可以直接使用‘python.org’ 嗎?當(dāng)然是可以的,但是不要忘記 “.” 代表通配符,此時(shí)也與‘pythonaorg’匹配。

怎么讓'.'不代表統(tǒng)配符呢?只要加上‘\’即可,但是為了表示模塊re要求的單個(gè)反斜杠,需要再字符串中加入兩個(gè)反斜杠,讓解釋器對(duì)其進(jìn)行轉(zhuǎn)義,(這里不太理解),作者解釋為解釋器執(zhí)行的轉(zhuǎn)義和模塊re執(zhí)行的轉(zhuǎn)義。

如果厭煩了兩個(gè)反斜杠,只需使用r'python\.org'?

總結(jié)

原文鏈接:https://blog.csdn.net/qq_39504519/article/details/107075923

欄目分類(lèi)
最近更新