Python 正则表达式
发布日期:2022-04-02 18:15:32 浏览次数:10 分类:博客文章

本文共 1077 字,大约阅读时间需要 3 分钟。

2017-07-24 13:16:17

正则表达式是用来更简洁的匹配查找字符串的一种语言。使用正则表达式可以更方便的处理字符串。在Python中使用re库可以进行字符串的正则匹配。正则表达式本身其实就是一个字符串,不过这个字符串里有一些语法,通过这些语法的约束,可以像解迷一样将字符串中自己需要的部分提取出来。

一、语法

二、常用的函数

re.search(正则表达式,string) : 返回值为真或者假

re.findall(正则表达式,string) : 返回值为一个列表,将字符串中所有符合条件的字串都返回

 三、练手

 

import rex = '[asdf]: 我的全部的尊严就在于思想'#匹配空格后的所有字符# . : 通配符# * :匹配任意多个字符# (): 最终返回的是()中匹配的内容y = re.findall('.* (.*)', x)print(y)

 

 

import rex = '[asdf]: 我的全部的尊严就在于思想'#匹配[]中的所有字符# . : 通配符# * :匹配任意多个字符# (): 最终返回的是()中匹配的内容y = re.findall('.*\[(.*)]', x)print(y)

 

 

import rex = 'From 
window@microsoft.com
DA GD'# 匹配
...
中的内容,注意必须是连着的,不能有空格# ^ : 开头# . : 通配符# \S : 匹配除空格外的所有字符# * :匹配任意多个字符# + :匹配至少一个字符# (): 最终返回的是()中匹配的内容pattern = re.compile('(?<=
)\S+(?=
)')y = re.findall(pattern, x)print(y)
import rex = 'From window@microsoft.com DA GD'# 匹配From开头的邮箱号(这里必须使用懒惰方式!)# ^ : 开头# . : 通配符# \S : 匹配除空格外的所有字符# * :匹配任意多个字符# + :匹配至少一个字符# (): 最终返回的是()中匹配的内容pattern = re.compile('^From.*?(\S+@\S+)')y = re.findall(pattern, x)print(y)

 

转载地址:https://www.cnblogs.com/hyserendipity/p/7228884.html 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!

上一篇:Python 爬虫-Robots协议
下一篇:Python 网络编程和Socket

发表评论

最新留言

留言是一种美德,欢迎回访!
[***.207.175.100]2024年04月01日 11时38分15秒