
笨办法学python之中文字符编码问题
发布日期:2021-05-08 12:52:11
浏览次数:19
分类:精选文章
本文共 677 字,大约阅读时间需要 2 分钟。
Python 在处理 字符串 编码问题时,常常会出现乱码现象。这种问题主要是由于编码格式不一致导致的。以下是常见的乱码问题及解决方法:
1. 文件中出现汉字报错
源代码默认以 ASCII 码存储,ASCII 无法表示汉字,因此会导致报错。解决方法是设置文件编码格式:
# 在文件的第一行或第二行添加#encoding: utf-8
推荐编码格式为 UTF-8,适用于大多数中文环境。
2. 控制台出现乱码(加 u 法)
Python 的默认编码是 UTF-8,而控制台通常使用 GBK。将字符串预先转换为 Unicode 格式:
s1 = u'我'print(s1)
这样可以确保字符串在输出时正确显示。
3. 控制台出现乱码(转换编码法)
方法一:使用 unicode() 函数
s1 = unicode('我', 'utf-8')print(s1)
方法二:使用 decode() 和 encode() 方法
s2 = '我'.decode('utf-8')print(s2)s3 = unicode('哈', 'utf-8').encode('utf-8')
4. raw_input() 中出现中文乱码
raw_input()
函数默认返回 bytes 格式,需先将其转换为 Unicode:
n = raw_input('请输入文字'.decode('utf-8').encode('gbk'))
或者:
n = raw_input(unicode('请输入文字','utf-8').encode('gbk'))
这些方法可以有效解决乱码问题。
发表评论
最新留言
路过,博主的博客真漂亮。。
[***.116.15.85]2025年04月07日 10时12分17秒
关于作者

喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!
推荐文章
常量表达式
2019-03-06
POD类型
2019-03-06
const与常量,傻傻分不清楚~
2019-03-06
Head First设计模式——迭代器模式
2019-03-06
MongoDB版本及存储引擎区别
2019-03-06
shell echo单行和多行文字定向写入到文件中
2019-03-06
AtCoder Beginner Contest 100 题解
2019-03-06
【数据结构】可持久化线段树初步
2019-03-06
后缀树
2019-03-06
Java高性能编程之CAS与ABA及解决方法
2019-03-06
从BIO到Netty的演变
2019-03-06
《算法导论》第二章笔记
2019-03-06
HTML节点操作
2019-03-06
HTML5新特性
2019-03-06
async/await剖析
2019-03-06
cmp命令
2019-03-06
一次编辑
2019-03-06
长按键入
2019-03-06
JavaScript中的链式调用
2019-03-06
day-04-列表
2019-03-06