日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

學無先后,達者為師

網站首頁 編程語言 正文

正則表達式中關于對原生字符串的簡單理解_正則表達式

作者:、Lu ? 更新時間: 2022-10-04 編程語言

在正則表達式中,有些字符是有特殊意義的字符。因此如果想要匹配這些字符,那么就必須使用反斜杠進行轉義。比如$代表的是以...結尾,如果想要匹配$,那么就必須使用\$。示例代碼如下:

text = "apple price is \$99,orange paice is $88"
ret = re.search('\$(\d+)',text)
print(ret.group())
>> $99

原生字符串:

在正則表達式中,\是專門用來做轉義的。在Python中\也是用來做轉義的。因此如果想要在普通的字符串中匹配出\,那么要給出四個\。示例代碼如下:

text = "apple \c"
ret = re.search('\\\\c',text)
print(ret.group())

因此要使用原生字符串(r標記)就可以解決這個問題:

text = "apple \c"
ret = re.search(r'\\c',text)
print(ret.group())

那么原理是什么呢?為什么在不使用r來標記原生字符串的時候需要四個\呢?使用r的時候需要兩個\呢?

我們需要先來了解一下正則表達式的一個匹配過程,例如 ret = re.search('\\\\c',text) 這句代碼:我們都知道 \ 字符無論是在python中還是正則表達式中都表示轉義字符,這句代碼 首先python將其解釋成 \\c(第一個和第三個\分別表示轉義,那么第二個和第四個表示普通字符\,最終即成為了\\c),接下來正則表達式拿到\\c后第一個\表示轉義,因此將最后解釋為普通的 \c 兩個字符,再去匹配的文本里比較。而使用r來標記原生字符串后,python默認解釋其為\\c三個字符,最后交由正則表達式再經過轉義后即普通的\c兩個字符。?

原生字符串這里比較繞,希望對大家有所幫助

補充:在正則表達式的使用過程中,有個小小的疑問r‘’ ,代表什么意思?

其實在《python基礎教程》中,作者已經進行了詳細的說明。

加入要匹配字符串‘python.org’,可以直接使用‘python.org’ 嗎?當然是可以的,但是不要忘記 “.” 代表通配符,此時也與‘pythonaorg’匹配。

怎么讓'.'不代表統配符呢?只要加上‘\’即可,但是為了表示模塊re要求的單個反斜杠,需要再字符串中加入兩個反斜杠,讓解釋器對其進行轉義,(這里不太理解),作者解釋為解釋器執行的轉義和模塊re執行的轉義。

如果厭煩了兩個反斜杠,只需使用r'python\.org'?

總結

原文鏈接:https://blog.csdn.net/qq_39504519/article/details/107075923

欄目分類
最近更新