日本免费高清视频-国产福利视频导航-黄色在线播放国产-天天操天天操天天操天天操|www.shdianci.com

學無先后,達者為師

網站首頁 編程語言 正文

Python?re.split方法分割字符串的實現示例_python

作者:Chao?Hsin-fang ? 更新時間: 2022-10-16 編程語言

re.split方法

注:使用前需要引入包(import re)

功能:split能夠按照所能匹配的字串將字符串進行切分,返回切分后的字符串列表

形式:

re.split(pattern, string[, maxsplit=0, flags=0])
  • pattern:匹配的字符串
  • string:需要切分的字符串
  • maxsplit:分隔次數,默認為0(即不限次數)
  • flags:標志位,用于控制正則表達式的匹配方式,比如:是否區分大小寫

問題

你需要將一個字符串分割為多個字段,但是分隔符(還有周圍的空格)并不是固定的。

解決方案

string 對象的 split() 方法只適應于非常簡單的字符串分割情形, 它并不允許有多個分隔符或者是分隔符周圍不確定的空格。 當你需要更加靈活的切割字符串的時候,最好使用 re.split() 方法:

>>> line = 'asdf fjdk; afed, fjek,asdf, foo'
>>> import re
>>> re.split(r'[;,\s]\s*', line)
['asdf', 'fjdk', 'afed', 'fjek', 'asdf', 'foo']

討論

函數 re.split() 是非常實用的,因為它允許你為分隔符指定多個正則模式。 比如,在上面的例子中,分隔符可以是逗號,分號或者是空格,并且后面緊跟著任意個的空格。 只要這個模式被找到,那么匹配的分隔符兩邊的實體都會被當成是結果中的元素返回。 返回結果為一個字段列表,這個跟 str.split() 返回值類型是一樣的。

當你使用 re.split() 函數時候,需要特別注意的是正則表達式中是否包含一個括號捕獲分組。 如果使用了捕獲分組,那么被匹配的文本也將出現在結果列表中。比如,觀察一下這段代碼運行后的結果:

>>> fields = re.split(r'(;|,|\s)\s*', line)
>>> fields
['asdf', ' ', 'fjdk', ';', 'afed', ',', 'fjek', ',', 'asdf', ',', 'foo']
>>>

獲取分割字符在某些情況下也是有用的。 比如,你可能想保留分割字符串,用來在后面重新構造一個新的輸出字符串:

>>> values = fields[::2]
>>> delimiters = fields[1::2] + ['']
>>> values
['asdf', 'fjdk', 'afed', 'fjek', 'asdf', 'foo']
>>> delimiters
[' ', ';', ',', ',', ',', '']
>>> # Reform the line using the same delimiters
>>> ''.join(v+d for v,d in zip(values, delimiters))
'asdf fjdk;afed,fjek,asdf,foo'
>>>

如果你不想保留分割字符串到結果列表中去,但仍然需要使用到括號來分組正則表達式的話, 確保你的分組是非捕獲分組,形如 (?:...) 。比如:

>>> re.split(r'(?:,|;|\s)\s*', line)
['asdf', 'fjdk', 'afed', 'fjek', 'asdf', 'foo']
>>>

原文鏈接:https://blog.csdn.net/weixin_43866211/article/details/95310991

欄目分類
最近更新