Python学习之字符串相关
发布日期:2022-02-19 23:50:28
浏览次数:46
分类:技术文章
本文共 2340 字,大约阅读时间需要 7 分钟。
ord()与chr()用法以及区别
- ord()函数主要用来返回对应字符的ASCII码。
- chr()主要用来表示ASCII码对应的字符他的输入时数字,可以用十进制,也可以用十六进制。
#以上程序主要实现对字符串str1里面所有的字符,转换成ASCII码中比他们小一位的字符。str1='asdfasdf123123'for i in range(len(str1)): print( chr(ord(str1[i])-1))#遍历A-Zfor i in range(ord("A"),ord("Z")+1): print(chr(i))
常用的字符串相关函数
函数 | 说明 |
---|---|
string.strip() | 去除首尾空格 |
string.lstrip() | 截掉 string 左边的空格 |
string.rstrip([chars]) | 删除 string 字符串末尾的指定字符(默认为空格) |
string.upper() | 转换 string 中的小写字母为大写 |
string.lower() | 转换 string 中所有大写字符为小写. |
string.join(seq) | 以 string 作为分隔符,将 seq 中所有的元素(的字符串表示)合并为一个新的字符串 |
string.replace(str1, str2, num=string.count(str1)) | 把 string 中的 str1 替换成 str2,如果 num 指定,则替换不超过 num 次. |
string.split(str="", num=string.count(str)) | 以 str 为分隔符切片 string,如果 num 有指定值,则仅分隔 num+ 个子字符串 |
string.decode(encoding=‘UTF-8’, errors=‘strict’) | 以 encoding 指定的编码格式解码 string,如果出错默认报一个 ValueError 的 异 常 , 除非 errors 指 定 的 是 ‘ignore’ 或 者’replace’ |
string.encode(encoding=‘UTF-8’, errors=‘strict’) | 以 encoding 指定的编码格式编码 string,如果出错默认报一个ValueError 的异常,除非 errors 指定的是’ignore’或者’replace’ |
string.isspace() | 检测字符串是否只由空白字符组成。 |
#从双语单词文本中只提取英文单词with open('./2.txt','w',encoding = 'utf-8') as h: f = open('./java.txt',encoding = 'utf-8')#相对路径(相对于当前工作目录) a = f.readlines() #只读取单词表中的的英文字符 for item in a: x = '' for i in item: #判断是否读取到非单词内容,如汉字,特殊字符 if i == ':' or ('\u4e00' <= i <= '\u9fff') or i == '(' or i == '(': break x += i x.lower() #解码 编码 删除字符串末尾的'\n' vc = x.encode('utf-8').decode('utf-8-sig').rstrip('\n') if len(vc)==0: break #所有的元素合并为一个新的字符串 w = "".join(vc) #检测字符串是否只由空白字符组成。 if w.isspace(): continue #个别单词中有/,过滤掉 if '/' in w: continue #去除首尾空格 大写转小写 word=w.strip().lower() url = 'http://www.youdao.com/w/'+word+'/#keyfrom=dict2.top' html = get_page(url) # 构造 lxml.etree._Element 对象 # lxml.etree._Element 对象还具有代码补全功能 # 假如我们得到的 XML 文档不是规范的文档,该对象将会自动补全缺失的闭合标签 html_elem = etree.HTML(html) #// 表示后代节点 * 表示所有节点 text() 表示文本节点 # xpath 方法返回字符串或者匹配列表,匹配列表中的每一项都是 lxml.etree._Element 对象 wd1 = html_elem.xpath('//*[@id="phrsListTab"]/h2/span/text()') wd = "".join(wd1) if (wd !=""): h.write(wd+"\n") h.flush() f.close()#关闭文件
转载地址:https://blog.csdn.net/Leslie_Waong/article/details/105590232 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!
发表评论
最新留言
第一次来,支持一个
[***.219.124.196]2024年04月09日 15时40分47秒
关于作者
喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!
推荐文章
[double free] 9447 CTF : Search Engine
2019-04-30
python 函数式编程
2019-04-30
python编码
2019-04-30
scala maven plugin
2019-04-30
flink 1-个人理解
2019-04-30
redis cli
2019-04-30
redis api
2019-04-30
flink physical partition
2019-04-30
java 解析json
2019-04-30
java http请求
2019-04-30
tensorflow 数据格式
2019-04-30
tf rnn layer
2019-04-30
常用中间件
2019-04-30
tf input layer
2019-04-30
tf model create
2019-04-30
tf dense layer两种创建方式的对比和numpy实现
2019-04-30
tf initializer
2019-04-30
tf 从RNN到BERT
2019-04-30
tf keras SimpleRNN源码解析
2019-04-30