技术 python
Python中文编码解决办法2

python的中文编码真是个让人头痛的问题

在如下问题中,如果两个字符串一个是日文一个是中文,如何将两个字符串合并到一个文件中而不至于生成乱码呢?

编码格式是中文编码GB2312

日文编码SHIFT_JIS

,可以采用把两个文件的内容都转成UTF-8格式,因为UTF-8里包含了中文编码和日文编码。

#先decode成UTF-16,再encode成UTF-8 
jap=japtext.decode("SHIFT_JIS").encode("UTF-8") #不转成utf-8也可以 
chn=chntext.decode("GB2312").encode("UTF-8")#编码方式大小写都行utf-8也一样
"文章为作者独立观点, 不代表老订阅立场"

本站作者

每日荐书

在不完美的世界力求正常——读《公司的坏话》

书名:《公司的坏话》

作者:李天田(脱不花妹妹)

出版社:北京大学出版社

赞助商

广告