Python学习之字符串相关
发布日期:2022-02-19 23:50:28 浏览次数:46 分类:技术文章

本文共 2340 字,大约阅读时间需要 7 分钟。

ord()与chr()用法以及区别

  • ord()函数主要用来返回对应字符的ASCII码。
  • chr()主要用来表示ASCII码对应的字符他的输入时数字,可以用十进制,也可以用十六进制。
#以上程序主要实现对字符串str1里面所有的字符,转换成ASCII码中比他们小一位的字符。str1='asdfasdf123123'for i in range(len(str1)):    print( chr(ord(str1[i])-1))#遍历A-Zfor i in range(ord("A"),ord("Z")+1):	print(chr(i))

常用的字符串相关函数

函数 说明
string.strip() 去除首尾空格
string.lstrip() 截掉 string 左边的空格
string.rstrip([chars]) 删除 string 字符串末尾的指定字符(默认为空格)
string.upper() 转换 string 中的小写字母为大写
string.lower() 转换 string 中所有大写字符为小写.
string.join(seq) 以 string 作为分隔符,将 seq 中所有的元素(的字符串表示)合并为一个新的字符串
string.replace(str1, str2, num=string.count(str1)) 把 string 中的 str1 替换成 str2,如果 num 指定,则替换不超过 num 次.
string.split(str="", num=string.count(str)) 以 str 为分隔符切片 string,如果 num 有指定值,则仅分隔 num+ 个子字符串
string.decode(encoding=‘UTF-8’, errors=‘strict’) 以 encoding 指定的编码格式解码 string,如果出错默认报一个 ValueError 的 异 常 , 除非 errors 指 定 的 是 ‘ignore’ 或 者’replace’
string.encode(encoding=‘UTF-8’, errors=‘strict’) 以 encoding 指定的编码格式编码 string,如果出错默认报一个ValueError 的异常,除非 errors 指定的是’ignore’或者’replace’
string.isspace() 检测字符串是否只由空白字符组成。
#从双语单词文本中只提取英文单词with open('./2.txt','w',encoding = 'utf-8') as h:      f = open('./java.txt',encoding = 'utf-8')#相对路径(相对于当前工作目录)    a = f.readlines()    #只读取单词表中的的英文字符    for item in a:        x = ''        for i in item:            #判断是否读取到非单词内容,如汉字,特殊字符            if i == ':' or ('\u4e00' <= i <= '\u9fff') or i == '(' or i == '(':                break            x += i        x.lower()        #解码 编码 删除字符串末尾的'\n'         vc = x.encode('utf-8').decode('utf-8-sig').rstrip('\n')        if len(vc)==0:            break        #所有的元素合并为一个新的字符串        w = "".join(vc)        #检测字符串是否只由空白字符组成。        if w.isspace():            continue        #个别单词中有/,过滤掉        if '/' in w:            continue        #去除首尾空格 大写转小写        word=w.strip().lower()        url = 'http://www.youdao.com/w/'+word+'/#keyfrom=dict2.top'        html =  get_page(url)        # 构造 lxml.etree._Element 对象        # lxml.etree._Element 对象还具有代码补全功能        # 假如我们得到的 XML 文档不是规范的文档,该对象将会自动补全缺失的闭合标签        html_elem = etree.HTML(html)        #// 表示后代节点  * 表示所有节点  text() 表示文本节点        # xpath 方法返回字符串或者匹配列表,匹配列表中的每一项都是 lxml.etree._Element 对象        wd1 = html_elem.xpath('//*[@id="phrsListTab"]/h2/span/text()')        wd = "".join(wd1)        if (wd !=""):                h.write(wd+"\n")                h.flush()        f.close()#关闭文件

转载地址:https://blog.csdn.net/Leslie_Waong/article/details/105590232 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!

上一篇:Python学习之用Requests和XPath多进程爬取有道单词数据
下一篇:Python学习之BeautifulSoup和XPath爬取英语文章和音频

发表评论

最新留言

第一次来,支持一个
[***.219.124.196]2024年04月09日 15时40分47秒

关于作者

    喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!

推荐文章