三:字符集和比较规则
1:字符集和比较规则简介
1:字符集简介
1:什么叫字符集
计算机存储二进制数据, 字符集就是字符串中各个字符和二进制数据的映射关系。
2:什么叫编解码
字符串依据字符集,编码成二进制数叫做编码
二进制数据依据字符集解码成字符串,叫做解码。
2:比较规则简介
1:了解编码之后,如何比较两个字符串的大小顺序呢?
自定义比较规则:
将字符全部转换成小写+按照编码二进制数据大小比较
2:同一个字符集会有多个比较规则。
3:一些常用的字符集
ASCII字符集 ISO 8859-1 GB2312 GBK UTF-8
1:计算机读取一个字节序列的时候,怎么区分某个字节代表的是一个单独的字符还是某个字符的一部分呢?
读取字节的时候从高位进行读取,如果最高位为0代表,一个字节代表一个字符,如果高位是1,就代表后边还有。
UTF-8是Unicode字符集的一种编解码方式。Unicode字符集有UTF-8 UTF-16 UTF-32单重编解码方案。
UTF-8 1-4个字节
UTF-16 2-4个字节
UTF-32 4个字节