Page 42 - 江西普通高校专升本信息技术
P. 42

江西普通高校专升本信息技术

                                                                                                     续表
                ASCII         控制              ASCII
                       二进制         控制字符含义            二进制    字符    ASCII 值  二进制   字符 ASCII 值  二进制    字符
                  值           字符               值
                  23  00010111  TB  传输块结束      55   00110111  7     87   01010111  W   119   01110111  w
                  24  00011000  CAN   取消       56   00111000  8     88   01011000  X   120   01111000  x
                  25  00011001  EM   介质中断      57   00111001  9     89   01011001  Y   121   01111001  y
                  26  00011010  SUB   替补       58   00111010        90   01011010  Z   122   01111010  z

                  27  00011011  ESC   溢出       59   00111011  ;     91   01011011  [   123   01111011  {
                  28  00011100  FS  文件分割符      60   00111100  <     92   01011100  \   124   01111100  |
                  29  00011101  GS   分组符       61   00111101  =     93   01011101  ]   125   01111101  }
                  30  00011110  RS  记录分离符      62   00111110  >     94   01011110  ^   126   01111110  `
                  31  00011111  US  单元分隔符      63   00111111  ?     95   01011111  _   127   01111111  DEL

                   2.Unicode码
                   英语用 128 个字符来编码完全是足够的,但是用来表示其他语言,128 个字符是远远不够
               的。于是,一些欧洲的国家就决定,将 ASCII 码中闲置的最高位利用起来,这样一来就能表示

               256 个字符。但是,这里又有了一个问题,那就是不同的国家的字符集可能不同,就算它们都能
               用 256 个字符表示完,但是同一个编码(也就是 8 位二进制数)表示的字符也可能不同。例如,
               144 在阿拉伯人的 ASCII 码中是  ,而在俄罗斯的 ASCII 码中是  。

                   因此,ASCII 码的问题在于尽管所有人都在 0~127 号字符上达成了一致,但对于 128~255 号
               字符上却有很多种不同的解释。与此同时,全球每个国家语言有更多的字符需要被存储,一个字
               节已经不够用了。于是,人们开始使用两个字节来存储字符。
                   Unicode码也是一种国际标准编码,扩展自ASCII码,与ASCII码不兼容。在ASCII码中,每
               个编码用7位表示或者8位表示;而Unicode使用16位编码,它用2个字节来编码一个字符。这使得

               Unicode能够表示世界上所有的书写语言中可能用于电脑通讯的编码、象形文字和其他符号,目前
               广泛应用于程序设计语言中。
               1.7.3 汉字编码

                   由于汉字是象形文字,字的数目很多,而且构成汉字的形状笔画差异极大。因此编码工作复
               杂,难度大。根据应用目的的不同,汉字编码分为外码、区位码、交换码、机内码和字形码。
                   1.外码(输入码)
                   外码也叫输入码,是指从键盘输入汉字时采用的编码。常用的输入码有拼音码、五笔字型
               码、自然码、表形码、区位码和电报码等,一种好的编码应有编码规则简单、易学好记、操作方

               便、重码率低、输入速度快等优点,每个人可根据自己的需要进行选择。汉字的外码(输入码)
               可以有很多,所以外码(输入码)属于有重码。
                   常用的汉字输入法有四种。

                   (1)数字编码:如区位码输入法。
                   (2)拼音码:如各种拼音输入法。
                   (3)字形编码:如五笔字型码、手写输入法等。
                   (4)音形结合码:如智能ABC输入法。
                   2.区位码

                   由于汉字数量较多,为区分每个汉字,可以把所有汉字、图形符号放在一个94×94的方阵


                                                          ·20·
   37   38   39   40   41   42   43   44   45   46   47