一、字符串
Python3.x完全支持中文字符,默认内存使用Unicode编码,存储时默认使用UTF8编码格式,无论是一个数字、英文字母,还是一个汉字,都按一个字符对待和处理。
UTF-8是针对Unicode的一种可变长度字符编码,它可以用来表示Unicode标准中的任何字符。Unicode对全世界所有国家的文字进行了编码,编码空间1(原设计为31,兼容UCS-4),UTF-8以1个字节表示英语字符(兼容ASCII码),以3个字节表示中文,还有些语言的符号使用个字节或4个字节(编码空间1的Unicode,UTF-8用1~4个字节表示;编码空间31的Unicode,UTF-8用1~6个字节表示)。
详见本