Python正则表达式函数:使用Python正则表达式函数进行字符串匹配、提取等操作。
Python正则表达式函数是一种基于正则表达式模式来匹配、转换和查找字符串的函数。这些函数可以很方便地用来进行字符串的匹配、提取等操作,是Python语言中的一项非常强大的功能。
本文将详细介绍Python正则表达式函数的使用方法,包括re.match(), re.search(), re.findall(), re.sub()等常用函数。
1. re.match()
re.match()函数是Python中最基本的正则表达式函数之一,用于在字符串的起始位置匹配正则表达式。该函数返回一个匹配对象,如果匹配成功,则可以使用group()或groups()方法获取匹配结果。
示例代码:
import re
str = "hello world, hello China"
matchObj = re.match(r'hello', str)
if matchObj:
print "matchObj.group() : ", matchObj.group()
else:
print "No match!!"
输出结果:
matchObj.group() : hello
2. re.search()
re.search()函数用于搜索字符串中 次出现正则表达式的位置,并返回一个匹配对象。该函数与re.match()的区别在于:re.match()只匹配字符串的开始部分,而re.search()匹配整个字符串。
示例代码:
import re
str = "hello world, hello China"
searchObj = re.search(r'China', str)
if searchObj:
print "searchObj.group() : ", searchObj.group()
else:
print "Nothing found!!"
输出结果:
searchObj.group() : China
3. re.findall()
re.findall()函数用于查找字符串中所有符合正则表达式的子串,并返回一个列表。该函数可以用来提取字符串中的特定信息,例如查找所有数字等。
示例代码:
import re
str = "hello 123 world, 456 hello China"
list = re.findall(r'\d+', str)
print list
输出结果:
['123', '456']
4. re.sub()
re.sub()函数用于替换字符串中符合正则表达式的子串为指定字符串,并返回替换后的字符串。该函数常用于字符串的格式化处理。
示例代码:
import re
str = "hello 123 world, 456 hello China"
newStr = re.sub(r'\d+', '000', str)
print newStr
输出结果:
hello 000 world, 000 hello China
总结:
Python正则表达式函数是Python语言中非常强大和实用的功能之一。通过re.match(), re.search(), re.findall(), re.sub()等函数,我们可以很方便地进行字符串的匹配、提取、替换等操作。在实际应用中,我们可以根据具体的需求选择不同的函数,来实现对字符串的完美处理。
