Page 42 - 江西普通高校专升本信息技术

P. 42

江西普通高校专升本信息技术

续表
ASCII 控制 ASCII
二进制控制字符含义二进制字符 ASCII 值二进制字符 ASCII 值二进制字符
值字符值
23 00010111 TB 传输块结束 55 00110111 7 87 01010111 W 119 01110111 w
24 00011000 CAN 取消 56 00111000 8 88 01011000 X 120 01111000 x
25 00011001 EM 介质中断 57 00111001 9 89 01011001 Y 121 01111001 y
26 00011010 SUB 替补 58 00111010 90 01011010 Z 122 01111010 z

27 00011011 ESC 溢出 59 00111011 ; 91 01011011 [ 123 01111011 {
28 00011100 FS 文件分割符 60 00111100 < 92 01011100 \ 124 01111100 |
29 00011101 GS 分组符 61 00111101 = 93 01011101 ] 125 01111101 }
30 00011110 RS 记录分离符 62 00111110 > 94 01011110 ^ 126 01111110 `
31 00011111 US 单元分隔符 63 00111111 ？ 95 01011111 _ 127 01111111 DEL

2.Unicode码
英语用 128 个字符来编码完全是足够的，但是用来表示其他语言，128 个字符是远远不够
的。于是，一些欧洲的国家就决定，将 ASCII 码中闲置的最高位利用起来，这样一来就能表示

256 个字符。但是，这里又有了一个问题，那就是不同的国家的字符集可能不同，就算它们都能
用 256 个字符表示完，但是同一个编码（也就是 8 位二进制数）表示的字符也可能不同。例如，
144 在阿拉伯人的 ASCII 码中是，而在俄罗斯的 ASCII 码中是。

因此，ASCII 码的问题在于尽管所有人都在 0~127 号字符上达成了一致，但对于 128~255 号
字符上却有很多种不同的解释。与此同时，全球每个国家语言有更多的字符需要被存储，一个字
节已经不够用了。于是，人们开始使用两个字节来存储字符。
Unicode码也是一种国际标准编码，扩展自ASCII码，与ASCII码不兼容。在ASCII码中，每
个编码用7位表示或者8位表示；而Unicode使用16位编码，它用2个字节来编码一个字符。这使得

Unicode能够表示世界上所有的书写语言中可能用于电脑通讯的编码、象形文字和其他符号，目前
广泛应用于程序设计语言中。
1.7.3 汉字编码

由于汉字是象形文字，字的数目很多，而且构成汉字的形状笔画差异极大。因此编码工作复
杂，难度大。根据应用目的的不同，汉字编码分为外码、区位码、交换码、机内码和字形码。
1.外码（输入码）
外码也叫输入码，是指从键盘输入汉字时采用的编码。常用的输入码有拼音码、五笔字型
码、自然码、表形码、区位码和电报码等，一种好的编码应有编码规则简单、易学好记、操作方

便、重码率低、输入速度快等优点，每个人可根据自己的需要进行选择。汉字的外码（输入码）
可以有很多，所以外码（输入码）属于有重码。
常用的汉字输入法有四种。

（1）数字编码：如区位码输入法。
（2）拼音码：如各种拼音输入法。
（3）字形编码：如五笔字型码、手写输入法等。
（4）音形结合码：如智能ABC输入法。
2.区位码

由于汉字数量较多，为区分每个汉字，可以把所有汉字、图形符号放在一个94×94的方阵

·20·

37 38 39 40 41 42 43 44 45 46 47