ord()与chr()用法以及区别

ord()函数主要用来返回对应字符的ASCII码。

chr()主要用来表示ASCII码对应的字符他的输入时数字，可以用十进制，也可以用十六进制。

#以上程序主要实现对字符串str1里面所有的字符，转换成ASCII码中比他们小一位的字符。str1='asdfasdf123123'for i in range(len(str1)):    print( chr(ord(str1[i])-1))#遍历A-Zfor i in range(ord("A"),ord("Z")+1):	print(chr(i))

常用的字符串相关函数

函数	说明
string.strip()	去除首尾空格
string.lstrip()	截掉 string 左边的空格
string.rstrip([chars])	删除 string 字符串末尾的指定字符（默认为空格）
string.upper()	转换 string 中的小写字母为大写
string.lower()	转换 string 中所有大写字符为小写.
string.join(seq)	以 string 作为分隔符，将 seq 中所有的元素(的字符串表示)合并为一个新的字符串
string.replace(str1, str2, num=string.count(str1))	把 string 中的 str1 替换成 str2,如果 num 指定，则替换不超过 num 次.
string.split(str="", num=string.count(str))	以 str 为分隔符切片 string，如果 num 有指定值，则仅分隔 num+ 个子字符串
string.decode(encoding=‘UTF-8’, errors=‘strict’)	以 encoding 指定的编码格式解码 string，如果出错默认报一个 ValueError 的异常，除非 errors 指定的是 ‘ignore’ 或者’replace’
string.encode(encoding=‘UTF-8’, errors=‘strict’)	以 encoding 指定的编码格式编码 string，如果出错默认报一个ValueError 的异常，除非 errors 指定的是’ignore’或者’replace’
string.isspace()	检测字符串是否只由空白字符组成。

#从双语单词文本中只提取英文单词with open('./2.txt','w',encoding = 'utf-8') as h:      f = open('./java.txt',encoding = 'utf-8')#相对路径（相对于当前工作目录）    a = f.readlines()    #只读取单词表中的的英文字符    for item in a:        x = ''        for i in item:            #判断是否读取到非单词内容，如汉字，特殊字符            if i == ':' or ('\u4e00' <= i <= '\u9fff') or i == '(' or i == '（':                break            x += i        x.lower()        #解码 编码 删除字符串末尾的'\n'         vc = x.encode('utf-8').decode('utf-8-sig').rstrip('\n')        if len(vc)==0:            break        #所有的元素合并为一个新的字符串        w = "".join(vc)        #检测字符串是否只由空白字符组成。        if w.isspace():            continue        #个别单词中有/，过滤掉        if '/' in w:            continue        #去除首尾空格 大写转小写        word=w.strip().lower()        url = 'http://www.youdao.com/w/'+word+'/#keyfrom=dict2.top'        html =  get_page(url)        # 构造 lxml.etree._Element 对象        # lxml.etree._Element 对象还具有代码补全功能        # 假如我们得到的 XML 文档不是规范的文档，该对象将会自动补全缺失的闭合标签        html_elem = etree.HTML(html)        #// 表示后代节点  * 表示所有节点  text() 表示文本节点        # xpath 方法返回字符串或者匹配列表，匹配列表中的每一项都是 lxml.etree._Element 对象        wd1 = html_elem.xpath('//*[@id="phrsListTab"]/h2/span/text()')        wd = "".join(wd1)        if (wd !=""):                h.write(wd+"\n")                h.flush()        f.close()#关闭文件

转载地址：https://blog.csdn.net/Leslie_Waong/article/details/105590232 如侵犯您的版权，请留言回复原文章的地址，我们会给您删除此文章，给您带来不便请您谅解！

上一篇：Python学习之用Requests和XPath多进程爬取有道单词数据

下一篇：Python学习之BeautifulSoup和XPath爬取英语文章和音频

发表评论

关于作者

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！

-- 愿君每日到此一游！

ord()与chr()用法以及区别

常用的字符串相关函数

发表评论

最新留言

关于作者

推荐文章