python正则-re的用法详解

(编辑：jimmy 日期: 2024/9/27 浏览：2)

天在刷题的时候用到了正则，用的过程中就感觉有点不太熟练了，很久没有用正则都有点忘了。所以现在呢，我们就一起来review一下python中正则模块re的用法吧。

今天是review，所以一些基础的概念就不做介绍了，先来看正则中的修饰符以及它的功能：

修饰符

"color: #ff0000">模式

"color: #ff0000">接下来我们看re的一些方法：

re.compile

这个方法会生成一个正则对象，他的第一个参数是正则字符串，第二个参数是修饰符，就是 re.I, re.S 这些。

生成的这个正则对象呢，它还有一些方法，比如match、findall、finditer、search等等，这些方法的用法请往下看。

re.match

match方法是从给定字符串的开头开始进行匹配，并且只匹配一次。也就是说如果字符串和正则的第一个字母就对不上那就匹配失败了。

ta的参数是pettern，string，flags

"htmlcode">

st = 'www.baidu.com www.taobao.com'
result = re.split('bai(du)', st)
print(result)

结果：

['www.', 'du', '.com www.taobao.com']

可以看到，字符串‘du'是被括号括起来的，所以在结果中也有'du'这个元素，而'bai'没有被括号括起来，在结果中就不会有‘bai'这个元素。

re.findall

这个函数是我在爬虫项目中用的最多的一个函数了，它可以把所有匹配的结果以列表的形式返回，而不是像match和search一样只匹配一个结果。我们来试一下：

st = 'www.baidu.com www.taobao.com'
result = re.findall(r'www\.(\w*)\.(com)', st)
print(result)
[('baidu', 'com'), ('taobao', 'com')]
re.finditer

这个函数和findall的功能一样。不同之处在于这个函数返回的结果是一个生成器，而生成器中的每一项是一个match对象，我们一起来看一下：

st = 'www.baidu.com www.taobao.com'
result = re.finditer(r'www\.(\w*)\.(com)', st)
print(result.__next__().group(0, 1, 2))
print(next(result).groups(2))
('www.baidu.com', 'baidu', 'com')
('taobao', 'com')
re.sub

这个函数是用来替换字符串的。可以将匹配的字符串替换成指定的字符串，我们来看一下：

st = 'www.111.com www.222.com'
result = re.sub(r'\d+', 'OK', st)
print(result)

结果：

www.OK.com www.OK.com

我们的第二个参数除了可以是一个给定的字符串还可以是一个函数：

def toOK(matched):
  value = matched.group()
  return str(int(value)*2)
st = 'www.111.com www.222.com'
result = re.sub(r'\d+', toOK, st)
print(result)

结果：

www.222.com www.444.com

总结

以上所述是小编给大家介绍的python正则-re的用法详解,希望对大家有所帮助，如果大家有任何疑问请给我留言，小编会及时回复大家的。在此也非常感谢大家对网站的支持！
如果你觉得本文对你有帮助，欢迎转载，烦请注明出处，谢谢！

上一篇：django之静态文件 django 2.0 在网页中显示图片的例子

下一篇：django ModelForm修改显示缩略图 imagefield类型的实例

python正则-re的用法详解

最新资源