ASCII

来自康健生活
跳到导航 跳到搜索

返回上一级

ASCII

ASCII(American Standard Code for Information Interchange,美国信息交换标准代码)码于1961年提出,被国际标准化组织(International Organization for Standardization, ISO)批准为国际标准。

编码系统 国际标准 用途
单字节 ISO/IEC 646 显示现代英语

计算机的内部信息存储为二进制的字符串。每一个二进制位(bit)有0和1两种状态,八个二进制位合在一起被称为一个字节(byte),一个字节可以组合出2⁷ = 256种状态。在ASCII字符编码的规则中规定,用单个字节共8位来表示字符,其中最高位为0,使用其他7位(bits)的值映射到某个特定的字符。

ASCII字符集

要包括控制字符(回车键、退格、换行键等);可显示字符(英文大小写字符、阿拉伯数字和西文符号)。ASCII字符集映射到数字编码规则如下图所示:

其中0x00 - 0x1F等32个字符被叫做不可见字符 = 不可打印(non-printable)字符 = 控制字符(control character) = 功能字符(function code,function character)。

探讨

ASCII的最大缺点是只能显示26个基本拉丁字母、阿拉伯数目字和英式标点符号,因此只能用于显示现代美国英语(而且在处理英语当中的外来词如naïve、café、élite等等时,所有重音符号都不得不去掉,即使这样做会违反拼写规则)。而EASCII虽然解决了部份西欧语言的显示问题,但对更多其他语言依然无能为力。因此现在的苹果电脑已经抛弃ASCII而转用Unicode。

各种单字节编码标准的关系
标题文字 单个字节=8位=2⁸=256个字符
编码标准 注释 用到了前7位=2⁷=128个字符 用到了第8位
0x0-0x1F 0x20-0x7E 0x7F 0x80-0x9F 0xA0-0xFF
ASCII =ISO/IEC 646 yes yes yes
ISO/IEC 6429 =C0 control + C1 control yes yes
ISO 8859 ISO/IEC 8859-n yes yes
ISO-8859 ISO-8859-n yes yes yes yes yes