字符编码查看 编码查看字符

最近查询记录

韩语编码转字符串 简体中文(GB2312)编码转字符串 韩语(Mac)编码转字符串 UTF-8转TCA 中国台湾编码 UTF-8转韩语(EUC)编码 UTF-8转简体中文(Mac)编码 UTF-8转韩语(Mac)编码 韩语(EUC)编码转字符串 简体中文(EUC)编码转字符串 简体中文(HZ)编码转字符串 UTF-8转简体中文(EUC)编码 UTF-8转简体中文(ISO-2022)编码 UTF-8转简体中文(GB2312)编码 UTF-8转Unicode (UTF-8)编码 UTF-8转Unicode (UTF-32 Big-Endian... 简体中文(Mac)编码转字符串 简体中文(ISO-2022)编码转字符串 UTF-8转土耳其字符(Mac)编码 UTF-8转IBM EBCDIC (美国-加拿大)编码 UTF-8转繁体中文(CNS)编码 UTF-8转Unicode (UTF-7)编码 UTF-8转IBM5550 中国台湾编码 UTF-8转西欧字符(ISO)编码 UTF-8转Unicode编码 ISCII 孟加拉语编码转字符串 Unicode (UTF-32 Big-Endian)编码转字符串 西里尔字符(KOI8-R)编码转字符串 OEM 美国编码转字符串 UTF-8转波罗的海字符(DOS)编码 Unicode (UTF-8)编码转字符串 UTF-8转简体中文(GB18030)编码 UTF-8转阿拉伯字符(Mac)编码 Unicode (UTF-32)编码转字符串 UTF-8转繁体中文(Big5)编码 日语(Shift-JIS)编码转字符串 日语(EUC)编码转字符串 繁体中文(Mac)编码转字符串 日语(JIS)编码转字符串 日语(JIS-允许 1 字节假名)编码转字符串 日语(Mac)编码转字符串 UTF-8转IBM EBCDIC (UK)编码 UTF-8转爱沙尼亚语(ISO)编码 UTF-8转中欧字符(DOS)编码 UTF-8转ISCII 孟加拉语编码 UTF-8转希腊字符(Mac)编码 UTF-8转繁体中文(Mac)编码 UTF-8转日语(Shift-JIS)编码 繁体中文(CNS)编码转字符串 Unicode (Big-Endian)编码转字符串 UTF-8转希伯来字符(ISO-Logical)编码 UTF-8转希腊字符(Windows)编码 IBM EBCDIC (日语片假名)编码转字符串 UTF-8转OEM 多语言拉丁语 I编码 IBM EBCDIC (美国-加拿大-欧洲)编码转字符串 Unicode编码转字符串 越南字符(Windows)编码转字符串 UTF-8转日语(EUC)编码 UTF-8转ISO-6937编码 TeleText 中国台湾编码转字符串 Wang 中国台湾编码转字符串 ISCII 古吉拉特语编码转字符串 UTF-8转日语(JIS-允许 1 字节假名)编码 US-ASCII编码转字符串 希伯来字符(ISO-Logical)编码转字符串 韩语(Johab)编码转字符串 韩语(ISO)编码转字符串 IBM EBCDIC (美国-加拿大)编码转字符串 德语(IA5)编码转字符串 挪威语(IA5)编码转字符串 IBM EBCDIC (丹麦-挪威)编码转字符串 UTF-8转Wang 中国台湾编码 Unicode (UTF-7)编码转字符串 UTF-8转Unicode (UTF-32)编码 繁体中文(Eten)编码转字符串 IBM EBCDIC (国际)编码转字符串 泰语(Mac)编码转字符串 UTF-8转波罗的海字符(ISO)编码 克罗地亚语(Mac)编码转字符串 韩语 Wansung编码转字符串 T.61编码转字符串 繁体中文(Big5)编码转字符串 简体中文(GB2312-80)编码转字符串 UTF-8转西里尔字符(Mac)编码 UTF-8转西里尔字符(Windows)编码 UTF-8转US-ASCII编码 OEM 西里尔语编码转字符串 简体中文(GB18030)编码转字符串 UTF-8转ISCII 梵文编码 UTF-8转IBM EBCDIC (现代希腊语)编码 UTF-8转IBM EBCDIC (日语片假名)编码 IBM5550 中国台湾编码转字符串 爱沙尼亚语(ISO)编码转字符串 IBM EBCDIC (UK)编码转字符串 乌克兰语(Mac)编码转字符串 ISCII 泰卢固语编码转字符串 UTF-8转IBM EBCDIC (芬兰-瑞典-欧洲)编码 中欧字符(ISO)编码转字符串 UTF-8转IBM EBCDIC (意大利-欧洲)编码 西欧字符(ISO)编码转字符串 TCA 中国台湾编码转字符串 UTF-8转ISCII 马拉雅拉姆语编码 UTF-8转希腊字符(DOS)编码 UTF-8转IBM EBCDIC (泰语)编码 UTF-8转IBM EBCDIC (国际)编码 UTF-8转简体中文(HZ)编码 UTF-8转OEM 美国编码 UTF-8转韩语(Johab)编码 UTF-8转日语(Mac)编码 ISCII 旁遮普语编码转字符串 UTF-8转Unicode (Big-Endian)编码 UTF-8转IBM EBCDIC (美国-加拿大-欧洲)编码 UTF-8转IBM EBCDIC (西里尔塞尔维亚-保加利亚语)编码 UTF-8转IBM EBCDIC (希腊语)编码 UTF-8转ISCII 泰米尔语编码 UTF-8转IBM EBCDIC (德国-欧洲)编码 UTF-8转阿拉伯字符(ISO)编码

Unicode 是容纳世界所有文字符号的国际标准编码,使用四个字节为每个字符编码。

UTF 是英文 Unicode Transformation Format 的缩写,意为把 Unicode 字符转换为某种格式。UTF 系列编码方案(UTF-8、UTF-16、UTF-32)均是由 Unicode 编码方案衍变而来,以适应不同的数据存储或传递,它们都可以完全表示 Unicode 标准中的所有字符。目前,这些衍变方案中 UTF-8 被广泛使用,而 UTF-16 和 UTF-32 则很少被使用。

UTF-8 使用一至四个字节为每个字符编码,其中大部分汉字采用三个字节编码,少量不常用汉字采用四个字节编码。因为 UTF-8 是可变长度的编码方式,相对于 Unicode 编码可以减少存储占用的空间,所以被广泛使用。

UTF-16 使用二或四个字节为每个字符编码,其中大部分汉字采用两个字节编码,少量不常用汉字采用四个字节编码。UTF-16 编码有大尾序和小尾序之别,即 UTF-16BE 和 UTF-16LE,在编码前会放置一个 U+FEFF 或 U+FFFE(UTF-16BE 以 FEFF 代表,UTF-16LE 以 FFFE 代表),其中 U+FEFF 字符在 Unicode 中代表的意义是 ZERO WIDTH NO-BREAK SPACE,顾名思义,它是个没有宽度也没有断字的空白。

UTF-32 使用四个字节为每个字符编码,使得 UTF-32 占用空间通常会是其它编码的二到四倍。UTF-32 与 UTF-16 一样有大尾序和小尾序之别,编码前会放置 U+0000FEFF 或 U+0000FFFE 以区分。