python encode decode unicode区别及用法-白红宇

强烈建议你试试无所不能的chatGPT，快点击我

python encode decode unicode区别及用法

阅读量：4318 次

发布时间：2019-06-06

本文共 830 字，大约阅读时间需要 2 分钟。

decode 解码

encode 转码

unicode是一种编码，具体可以百度搜

# coding: UTF-8 u = u'汉'print repr(u) # u'\u6c49's = u.encode('UTF-8')print repr(s) # '\xe6\xb1\x89'u2 = s.decode('UTF-8')print repr(u2) # u'\u6c49' # 对unicode进行解码是错误的# s2 = u.decode('UTF-8')# 同样，对str进行编码也是错误的# u2 = s.encode('UTF-8')

s = u.encode('UTF-8') 是把u转码成utf-8

u2 = s.decode('UTF-8')是把u解码成utf-8 如果是windows下编码一般是gbk，所以解码时候要用  u.decode('gbk')，如下

>>> u='格式'>>> u.decode('gbk')u'\u683c\u5f0f'>>> u.decode('utf-8')Traceback (most recent call last):  File "
     
      ", line 1, in 
      
           u.decode('utf-8')  File "C:\Python27\lib\encodings\utf_8.py", line 16, in decode    return codecs.utf_8_decode(input, errors, True)UnicodeDecodeError: 'utf8' codec can't decode byte 0xb8 in position 0: invalid start byte>>>

转载于:https://www.cnblogs.com/paisen/p/3483531.html

你可能感兴趣的文章

顺序串c语言,数据结构c语言实现定长顺序串

sql的一个查询，情景：a表中存在的数据，且在b表中不存在（not in，not exists...

关于MDK编译器优化产生的一个小问题

为什么说 Java 程序员到了必须掌握 Spring Boot 的时候？

Prefixes and Suffixes

HDU 2586 + HDU 4912 最近公共祖先

POJ 3481 SBT做法

Css 后代选择器与子代选择器的区别

shell-运算符

js 问题集锦之二

MySQL-优化之 index merge(索引合并)

20190509 感叹

Jlink v8仿真器在64位系统上刷固件

入门训练 Fibonacci数列

20189222 《网络攻防技术》第一周作业

第十二周编程总结

数据结构——树——二叉查找树

StringBuilder動態串

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2024-10-06 10:38:28 当前IP: 3.16.218.221 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我