博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
python encode decode unicode区别及用法
阅读量:4318 次
发布时间:2019-06-06

本文共 830 字,大约阅读时间需要 2 分钟。

decode 解码

encode 转码

unicode是一种编码,具体可以百度搜

# coding: UTF-8 u = u'汉'print repr(u) # u'\u6c49's = u.encode('UTF-8')print repr(s) # '\xe6\xb1\x89'u2 = s.decode('UTF-8')print repr(u2) # u'\u6c49' # 对unicode进行解码是错误的# s2 = u.decode('UTF-8')# 同样,对str进行编码也是错误的# u2 = s.encode('UTF-8')
s = u.encode('UTF-8') 是把u转码成utf-8
u2 = s.decode('UTF-8')是把u解码成utf-8 如果是windows下编码一般是gbk,所以解码时候要用  u.decode('gbk'),如下
>>> u='格式'>>> u.decode('gbk')u'\u683c\u5f0f'>>> u.decode('utf-8')Traceback (most recent call last):  File "
", line 1, in
u.decode('utf-8') File "C:\Python27\lib\encodings\utf_8.py", line 16, in decode return codecs.utf_8_decode(input, errors, True)UnicodeDecodeError: 'utf8' codec can't decode byte 0xb8 in position 0: invalid start byte>>>
 

 

 
 

转载于:https://www.cnblogs.com/paisen/p/3483531.html

你可能感兴趣的文章
顺序串c语言,数据结构c语言实现定长顺序串
查看>>
sql的一个查询,情景:a表中存在的数据,且在b表中不存在 (not in,not exists...
查看>>
关于MDK编译器优化产生的一个小问题
查看>>
为什么说 Java 程序员到了必须掌握 Spring Boot 的时候?
查看>>
Prefixes and Suffixes
查看>>
HMAC256 Token
查看>>
HDU 2586 + HDU 4912 最近公共祖先
查看>>
POJ 3481 SBT做法
查看>>
Css 后代选择器与子代选择器的区别
查看>>
广播技术
查看>>
shell-运算符
查看>>
js 问题集锦 之 二
查看>>
MySQL-优化之 index merge(索引合并)
查看>>
20190509 感叹
查看>>
Jlink v8仿真器在64位系统上刷固件
查看>>
入门训练 Fibonacci数列
查看>>
20189222 《网络攻防技术》第一周作业
查看>>
第十二周编程总结
查看>>
数据结构——树——二叉查找树
查看>>
StringBuilder動態串
查看>>