字符集Unicode、ISO 10646 和 字符编码ASCII 、UTF 您所在的位置:网站首页 utf32编码汉字占多少字节 字符集Unicode、ISO 10646 和 字符编码ASCII 、UTF

字符集Unicode、ISO 10646 和 字符编码ASCII 、UTF

2023-03-30 04:22| 来源: 网络整理| 查看: 265

前言

一个Byte为8Bit,可以标识2^8共256种状态,如果给每一个状态对应一个符号,则可表示256个符号,那么就可以规定一套以一个字节为基础的二进制的字符集(即ASCII码),当然同理也可使用多个字节规定一套字符集

UCS & Unicode字符集 UCS:1984年国际标准化组织ISO制定的“通用字符集”(Universal Character Set,简称UCS),并最终制定了ISO 10646标准 Unicode:由Xerox、Apple等软件制造商于1988年组成,并且开发的Unicode标准。具体的符号对应表,可以查询unicode.org,或者专门的汉字对应表,另外也可以借用escape('')方法返回带%u的形式 需要注意 时间点,由于两个字符集互不兼容,于是从1991年开始,Unicode2.0采用了与ISO 10646-1相同的字库和字码,同时ISO 10646将不会替超出U+10FFFF的UCS-4编码赋值,以便两者保持一致 字符集只是规定二进制代码,没有规定如何存储二进制,不同的符号需要的字节数也不一样 ASCII字符编码

U0000.pdf 美国制定的一套字符编码对英语字符和二进制位之间的关系做了规定即ASCII码,ASCII码共规定128个字符的编码(ASCII值的范围为0~0x7F),并且只占用一个字节的后7位,最前面的一位统一规定为0,但是对非英语的符号,明显就不够用了,因此延伸出更多的字符编码

UCS-4 & UTF-32字符编码

在 UCS 和 Unicode 合并之前,UCS定义了UCS-4这种31位的编码形式,固定占用4个字节,编码空间为0x00000000 ~ 0x7FFFFFFF,可以编码20多亿个字符。实际适用范围不超过0x10FFFF,并且为了兼容Unicode,ISO承诺不会为超出0x10FFFF的UCS-4编码,UTF32与UCS-4相同,但是编码空间被限定在0~0xFFFF之间,因此UTF-32基本是UCS-4的子集

UCS-2 & UTF-16字符编码

UCS-2固定是占用2个字节,包含了65536个编码空间,为了兼容Unicode,0xD800~0xDFFF之间的码位未使用,UTF-16也使用2个字节为最常用的63k字符编码,对不常用的则使用4个字节,因此是一种变长的字符编码

UTF-8字符编码,主要看下这个

针对没必要使用多个字节的符号,如很多英文国家这种,很明显多个字节占用过多带宽,因此 UTF-8 最大的一个特点,就是它是一种变长的编码方式。它可以使用1~4个字节表示一个符号,根据不同的符号而变化字节长度

对于ASCII码中的符号使用一个字节:第一位为0,后面7位为这个符号的 Unicode 码 对大于1个字节(如n字节)的符号:第一个字节的前n位都设为1,第n + 1位设为0,后面字节的前两位一律设为10。剩下的没有提及的二进制位,全部为这个符号的 Unicode 码 规则如下 字节数 Unicode(16进制) UTF-8编码(二进制) 1 0000 0000~0000 007F 0xxxxxxx 2 0000 0080~0000 07FF 110xxxxx 10xxxxxx 3 0000 0800~0000 FFFF 1110xxxx 10xxxxxx 10xxxxxx 4 0001 0000~0010 FFFF 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx

解读UTF-8编码即:看第一个字节第一位,是0则是简单的一个字节符号,是1则看有多少位连续的1就表示有多少个字节

例如「润」字的Unicode16位编码表是escape('润')=%u6DA6,0x6DA6.toString(2)转为二进制是1101101 10100110,先补全这2个字节的8位为01101101 10100110,然后用3个字节中的x开始替换,最终为11100110 10110110 10100110,为啥用3个字节,因为2个字节放不下16位,4个字节又有未使用的x。最后将这三个字节转为16进制parseInt('xxx', 2).toString(16)为E6B6A6,每位前面加上百分号,然后再decode一下decodeURI('%E6%B6%A6')为润

参考文档

UCS通用字符集 Unicode 阮一峰:字符编码笔记:ASCII,Unicode和UTF-8



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有