unicode,ascii和utf-8的编码认识
发布日期:2022-02-23 07:42:44 浏览次数:12 分类:技术文章

本文共 668 字,大约阅读时间需要 2 分钟。

编码格式

ascii,最原始127个字母,数字和一些符号

unicode,万国码,大部分两个字节,少数四个字节,不会乱码,是一种规范,、

     utf-8是unicode规范的一种实现方式,还有unicode-16等等实现方式。

     utf-8,不是编码格式,而是存储方式,在存储和传输上节约空间

gbk是我国的一种编码格式,Windows默认的编码格式,linux默认的编码格式是utf-8。

 

encode decode 

a = '你好'

b = a.encode('utf-8')

c = b.decode('utf-8')

a的类型时字符串str,b的类型时字节bytes, c的类型时字符串str。

encode的作用将字符串编码成字节,decode作用将字节解码成字符串。

 

python与编解码

# coding=utf-8是告诉python interpret使用utf-8格式解释字符串的编码。

#coding=utf-8声明的作用:

      即会使用utf-8格式解码字符串。

      即python中字符串的格式为utf-8,默认字符串的保存格式为utf-8。

修改python的默认编码格式:

查看是sys.getdefalutencoding()

设置python的默认编码:

1,在程序中加入代码

2,python的Lib\site-packages文件夹下新建一个sitecustomize.py

  1. # encoding=utf8  
  2. import sys  
  3.   
  4. reload(sys)  
  5. sys.setdefaultencoding(’utf8’)   

 

转载地址:https://blog.csdn.net/weixin_42781748/article/details/81412514 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!

上一篇:python优化和内存管理
下一篇:str函数和repr函数

发表评论

最新留言

路过按个爪印,很不错,赞一个!
[***.219.124.196]2024年04月08日 14时39分18秒