Python正则表达式函数：re模块常用函数及用法

发布时间：2023-08-18 17:13:47

Python的re模块是用于处理正则表达式的模块，通过使用正则表达式可以完成复杂的字符串匹配和替换操作。re模块中提供了一些常用的函数来操作正则表达式。

1. re.match(pattern, string, flags=0)：从字符串的起始位置开始匹配，如果匹配成功则返回一个Match对象，否则返回None。

2. re.search(pattern, string, flags=0)：在字符串中搜索匹配正则表达式的个位置，如果匹配成功则返回一个Match对象，否则返回None。

3. re.findall(pattern, string, flags=0)：返回字符串中所有匹配正则表达式的子串，并以列表的形式返回。

4. re.sub(pattern, repl, string, count=0, flags=0)：在字符串中找到匹配正则表达式的所有子串，并将其替换为指定的字符串。

5. re.split(pattern, string, maxsplit=0, flags=0)：根据正则表达式的匹配结果对字符串进行分割，并返回包含分割后的子串的列表。

6. re.compile(pattern, flags=0)：将一个正则表达式编译成Pattern对象，可以在之后的操作中重复使用。

7. Match对象的方法和属性：

- group()：返回被匹配的子串。

- start()：返回匹配开始的位置。

- end()：返回匹配结束的位置。

- span()：返回一个元组包含匹配开始和结束的位置。

下面以一个简单的例子来说明这些函数的用法：

import re

# 匹配以字母A开头的单词
pattern = r'A\w+'
string = 'Apple is a fruit. I love Apple.'

# 使用match函数匹配
result = re.match(pattern, string)
print(result.group())  # 输出：Apple

# 使用search函数查找
result = re.search(pattern, string)
print(result.group())  # 输出：Apple

# 使用findall函数查找所有匹配的单词
result = re.findall(pattern, string)
print(result)  # 输出：['Apple', 'Apple']

# 使用sub函数替换所有匹配的单词
result = re.sub(pattern, 'Orange', string)
print(result)  # 输出：Orange is a fruit. I love Orange.

# 使用split函数分割字符串
result = re.split(r'\s', string)
print(result)  # 输出：['Apple', 'is', 'a', 'fruit.', 'I', 'love', 'Apple.']

# 使用compile函数编译正则表达式
pattern = re.compile(r'A\w+')
result = pattern.search(string)
print(result.group())  # 输出：Apple

以上就是re模块常用函数的用法示例，通过使用正则表达式可以方便地对字符串进行匹配、查找、替换和分割。在实际应用中，可以根据实际需要选择合适的函数和正则表达式来完成相应的操作。