如何避免在RegEx拆分结果中捕获组？ - python

我正在尝试使用re匹配以'\ n'开头的模式，然后是可能的'real(r8)'，然后是零个或多个空格，然后是单词'function'，然后我想要在发生匹配的地方拆分字符串。所以对于这个字符串，

text = '''functional \n   function disdat \nkitkat function wakawak\nreal(r8) function noooooo \ndoit'''

我想要:

['functional ',
 ' disdat \nkitkat function wakawak',
 ' noooooo \ndoit']

然而，

regex = re.compile(r'''\n(real\(r8\))?\s*\bfunction\b''')

regex.split(text)

退货

['functional ',
 None,
 ' disdat \nkitkat function wakawak',
 'real(r8)',
 ' noooooo \ndoit']

split也返回比赛的组。我怎么要求不要呢？

python大神给出的解决方案

您可以使用非捕获组，例如

>>> regex = re.compile(r'\n(?:real\(r8\))?\s*\bfunction\b')
>>> regex.split(text)
['functional ', ' disdat \nkitkat function wakawak', ' noooooo \ndoit']

注意?:中的(?:real\(r8\))。引用Python documentation for (?:..)

非捕获版本的常规括号。匹配括号内的任何正则表达式，但是在执行匹配后或在模式中稍后引用后，无法检索到与该组匹配的子字符串。

腾讯的同事天天给我安利让我看《三体》，说马化腾和雷军也在…

腾讯的同事天天给我安利让我看《三体》，说马化腾和雷军也在看。自己强行看了两个月，全部给看完了。感觉这文笔也就我读初中的水平……而且写着国内的一些情况，外国人能理解吗？这书为什么会这么火？这水平我也可以去写呀[笑哭][笑哭][笑哭] 招商银行员工：可以写赶紧写一个啊，能拿科幻文学雨果奖。包清白：哦楼主：pei ！tui ！你也配姓龙楼主：@赵龙王呵呵 […]