计算机机内码,国标码,区位码的问题

国标码=区位码+2020H机内码=区位码+A0A0H机内码=国标码+8080H
这是三个的转化公式,但是我想知道这三个公式的依据是什么。比如说为什么国标码=区位码+2020H,+2020H的原因是什么?知道的请回答下,谢谢。

汉字编码用两个字节进行编码,每个字节的最高位为0,这就是国标码。但如果就这样放入电脑,就会与一个字节的ASCII冲突。为此,规定放入机器时每个字节的最高位都置为1,这就是机内码。
可以将机内码看作是国标码的变形。它们的区别就是每个字节的最高位是否为1 区位码:将GB 2312—80的全部字符集组成一个94×94的方阵,每一行称为一个“区”,编号为0l~94;每一列称为一个“位”,编号为0l~94,这样得到GB 2312—80的区位图,用区位图的位置来表示的汉字编码,称为区位码。机内码:为了避免ASCII码和国标码同时使用时产生二义性问题,大部分汉字系统都采用将国标码每个字节高位置1作为汉字机内码。这样既解决了汉字机内码与西文机内码之间的二义性,又使汉字机内码与国标码具有极简单的对应关系。汉字交换码:汉字信息处理系统之间或通信系统之间传输信息时,对每一个汉字所规定的统一编码,我国已指定汉字交换码的国家标准“信息交换用汉字编码字符集——基本集”,代号为GB 2312—80,又称为“国标码”。
汉字机内码、国标码和区位码三者之间的关系:区位码(十进制)的两个字节分别转换为十六进制后加20H得到对应的国标码;机内码是汉字交换码(国标码)两个字节的最高位分别加1,即汉字交换码(国标码)的两个字节分别加80H得到对应的机内码;区位码(十进制)的两个字节分别转换为十六进制后加A0H得到对应的机内码。
(1)区位码先转换成十六进制数表示
(2)国标码=区位码的十六进制表示+2020H
(3)机内码=国标码+8080H=区位码+A0A0H举例:以汉字“大”为例,“大”字的区内码为2083 1、区号为20,位号为83 2、将区位号2083转换为十六进制表示为1453H 3、1453H+2020H=3473H,得到国标码3473H 4、3473H+8080H=B4F3H,得到机内码为B4F3H
温馨提示:答案为网友推荐,仅供参考
第1个回答  2013-11-06
简单点理解,区位码也就是国标码。
所谓“国标码”,是指国家标准汉字编码。一般是指国家标准局1981年发布的《信息交换用汉字编码字符集(基本集)》,简称GB-2312。在这个集中,收进汉字6763个,其中一级汉字3755个,二级汉字3008个。一级汉字为常用字,按拼音顺序排列,二级汉字为次常用字,按部首排列。
GB-2312中,把没字分为94个区,每个区94个位。每个收进的汉字有一个因定的区位。例如“啊”字,位于16区,01位,这个区号和位号就构成了它的区位码“1601”。这就是我上面说的,区位码就是国标码。
但区位码和国标码还是有一点差别,那就是在GB-2312中预留了一些空位,可以进行补充、扩展,经扩展的区位码就从数量、范围上超过了GB-2312了。
上面是就大陆而言的,台湾、香港、和其他汉语国家,也是用区位码,但他们的区位号与大陆用的就不一定相同了。这是区位与国标的又一区别。
区位码、国标码与机内码的转换关系 方法: (1)区位码先转换成十六进制数表示 (2)(区位码的十六进制表示)+2020H=国标码; (3)国标码+8080H=机内码 举例:以汉字“大”为例,“大”字的区内码为2083 解:1、区号为20,位号为83 2、将区位号2083转换为十六进制表示为1453H 3、1453H+2020H=3473H,得到国标码3473H 4、3473H+8080H=B4F3H,得到机内码为B4F3H
区位码的区码和位码均采用从01到94的十进制,国标码采用十六进制的21H到73H(数字后加H表示其为十六进制数).