utf | 您所在的位置:网站首页 › 汉字的utf-8编码 › utf |
utf-8编码汉字占几个字节? 在UTF-8编码中:一个中文等于三个字节,中文标点占三个字节。 一个英文字符等于一个字节,英文标点占一个字节。 Unicode编码:一个英文等于两个字节,一个中文(含繁体)等于两个字节。中文标点占两个字节,英文标点。 UTF-8使用1~4字节为每个字符编码: 1、一个US-ASCIl字符只需1字节编码(Unicode范围由U+0000~U+007F)。 2、带有变音符号的拉丁文、希腊文、西里尔字母、亚美尼亚语、希伯来文、阿拉伯文、叙利亚文等字母则需要2字节编码(Unicode范围由U+0080~U+07FF)。 3、其他语言的字符(包括中日韩文字、东南亚文字、中东文字等)包含了大部分常用字,使用3字节编码。 4、其他极少使用的语言字符使用4字节编码。 |
CopyRight 2018-2019 实验室设备网 版权所有 |