编码 - ASCII码 - EASCII - GBK - UTF-8
字节对比比特位
1个字节相当于8个比特位
8个比特位可以表示256个符号
ASCII码美国 最早
字符A对应的二进制数值是01000001,对应的十进制就是65
www.ascii-code.com
EASCII(ISO/8859-1)欧洲 稍早
GBK中国人 最近
GB2312又称GB0
GB2312 编码共收录了6763个汉字,同时他还兼容 ASCII
Unicode国际的utf-8 国际通用几乎包含所有语言
好
Unicode是597D
区间是00000800一0000FFFF
597D用二进制表示是:0101100101111101
填充到1110xxxx10xxxxxx10xxxxxx得到111001011010010110111101
16进制:e5a5bd
UTF-8编码是"E5A5BD"
unicode u'好'
从unicode转换到str
c = b.encode('utf-8') # 以 utf-8 方式编码
'\xe5\xa5\xbd'
从str类型转换到unicode
d = c.decode('utf-8') # 以 utf-8 方式解码
u'\u597d'
Unicode国际的utf-8 mb4
可以存表情包