原创 HotC51共产儿童团第七课:汉字区位码都是94之来历

2009-2-25 22:54 3733 3 3 分类: MCU/ 嵌入式
HotC51 发表于 2009-2-25 22:50 裸奔式实时操作系统HotTask51 ←返回版面 按此察看该网友的资料 按此把文章加入收藏夹 按此编辑本帖

楼主: HotC51共产儿童团第七课:汉字区位码都是94之来历


开课:

汉字区位码为何各有94个区94个位,汉字从16区开始。有何道理?

1980年颁布了《信息交换用汉字编码字符集—基本集》的国标交换码,国家标准号为:GB2312-80,选入了6763个汉字,分为两级,一级字库中有3755个,是常用汉字,二级字库中有3008个,是次常用汉字;还选入了682个字符,包含有数字、一般符号、拉丁字母、日本假名、希腊字母、俄文字母、拼音符号、注音字母等。以前我国大陆的各种中文DOS版本、Windows3.1 /3.2版本,装入的字库都是国标一二级字库。

这是gb2312-80之规定,但为何都是94呢???88、98、118多好听~~~

菜农那时20出头,肯定不会坐在“圆桌”上~~~不过俺会“反汇编”

ASCII码对照表

下表列出了字符集中的 0 - 127。

代码 字符 代码 字符 代码 字符 代码 字符
0    32 [空格] 64 @ 96 `
1   33 ! 65 A 97 a
2   34 " 66 B 98 b
3   35 # 67 C 99 c
4   36 $ 68 D 100 d
5   37 % 69 E 101 e
6   38 & 70 F 102 f
7   39 ' 71 G 103 g
8 ** 40 ( 72 H 104 h
9 ** 41 ) 73 I 105 i
10 ** 42 * 74 J 106 j
11   43 + 75 K 107 k
12   44 , 76 L 108 l
13 ** 45 - 77 M 109 m
14   46 . 78 N 110 n
15  47 / 79 O 111 o
16  48 0 80 P 112 p
17  49 1 81 Q 113 q
18  50 2 82 R 114 r
19 51 3 83 S 115 s
20 52 4 84 T 116 t
21 53 5 85 U 117 u
22  54 6 86 V 118 v
23  55 7 87 W 119 w
24  56 8 88 X 120 x
25  57 9 89 Y 121 y
26  58 : 90 Z 122 z
27 59 ; 91 [ 123 {
28 &#129; 60 < 92 \ 124 |
29 &#129; 61 = 93 ] 125 }
30 - 62 > 94 ^ 126 ~
31   63 ? 95 _ 127 &#129;


上表为“美国信息交换标准代码”--ASCII码表

它的范围在0x00~07f.

Binary-Coded Decimal&#8206;,简称BCD,称BCD码或二-十进制代码,亦称二进码十进数。是一种二进制的数字编码形式,用二进制编码的十进制代码。这种编码形式利用了四个位元来储存一个十进制的数码,使二进制和十进制之间的转换得以快捷的进行。这种编码技巧,最常用于会计系统的设计里,因为会计制度经常需要对很长的数字串作准确的计算。相对于一般的浮点式记数法,采用BCD码,既可保存数值的精确度,又可免却使电脑作浮点运算时所耗费的时间。此外,对于其他需要高精确度的计算,BCD编码亦很常用。


  由于十进制数共有0、1、2、……、9十个数码,因此,至少需要4位二进制码来表示1位十进制数。4位二进制码共有2^4=16种码组,在这16种代码中,可以任选10种来表示10个十进制数码,共有N=16!/(16-10)!约等于2.9乘以10的10次方种方案。常用的BCD代码列于末。

而BCD码的范围是0x00~0x99

故“逼迫”GB2312-80的范围应该在0x9A~0xFF之间

所以应该合理地选0xA0~0xFF之间。

又因为人们习惯计数从1开始,即区码、位码都从1开始,

故汉字区位码的范围被定义在0xA1~0xFF之间。

而编程人员又习惯0xFF为“空”,

所以最终“商定”:汉字区位码的范围被定义在0xA1~0xFE。

故0xfe-0xa1+1=94.

至于汉字为何编入16区,即0xB0,估计和十六进制数有关。

0xA1~0xAF即非汉字区(字符和外码),A和B有差距。

故汉字从0xB0即16区“看着比较顺眼”~~~

课毕:

本科纯属虚构,若有雷同请告知农会~~~

HotC51@126.com   2009.2.25 于菜地。
团部:http://group.ednchina.com/1623/



国标第01区  0 1 2 3 4 5 6 7 8 9 0     、 。 · ˉ ˇ ¨ 〃 々 1 — ~ ‖ … ‘ ’ “ ” 〔 〕 2 〈 〉 《 》 「 」 『 』 〖 〗 3 【 】 ± × ÷ ∶ ∧ ∨ ∑ ∏ 4 ∪ ∩ ∈ ∷ √ ⊥ ∥ ∠ ⌒ ⊙ 5 ∫ ∮ ≡ ≌ ≈ ∽ ∝ ≠ ≮ ≯ 6 ≤ ≥ ∞ ∵ ∴ ♂ ♀ ° ′ ″ 7 ℃ $ ¤ ¢ £ ‰ § № ☆ ★ 8 ○ ● ◎ ◇ ◆ □ ■ △ ▲ ※ 9 → ← ↑ ↓ 〓 
国标第02区  0 1 2 3 4 5 6 7 8 9 0   ⅰ ⅱ ⅲ ⅳ ⅴ ⅵ ⅶ ⅷ ⅸ 1 ⅹ       ⒈ ⒉ ⒊ 2 ⒋ ⒌ ⒍ ⒎ ⒏ ⒐ ⒑ ⒒ ⒓ ⒔ 3 ⒕ ⒖ ⒗ ⒘ ⒙ ⒚ ⒛ ⑴ ⑵ ⑶ 4 ⑷ ⑸ ⑹ ⑺ ⑻ ⑼ ⑽ ⑾ ⑿ ⒀ 5 ⒁ ⒂ ⒃ ⒄ ⒅ ⒆ ⒇ ① ② ③ 6 ④ ⑤ ⑥ ⑦ ⑧ ⑨ ⑩     ㈠ 7 ㈡ ㈢ ㈣ ㈤ ㈥ ㈦ ㈧ ㈨ ㈩  8  Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ Ⅵ Ⅶ Ⅷ Ⅸ 9 Ⅹ Ⅺ Ⅻ   
国标第03区  0 1 2 3 4 5 6 7 8 9 0   ! " # ¥ % & ' ( ) 1 * + , - . / 0 1 2 3 2 4 5 6 7 8 9 : ; < = 3 > ? @ A B C D E F G 4 H I J K L M N O P Q 5 R S T U V W X Y Z [ 6 \ ] ^ _ ` a b c d e 7 f g h i j k l m n o 8 p q r s t u v w x y 9 z { | }  ̄ 
国标第04区  0 1 2 3 4 5 6 7 8 9 0   ぁ あ ぃ い ぅ う ぇ え ぉ 1 お か が き ぎ く ぐ け げ こ 2 ご さ ざ し じ す ず せ ぜ そ 3 ぞ た だ ち ぢ っ つ づ て で 4 と ど な に ぬ ね の は ば ぱ 5 ひ び ぴ ふ ぶ ぷ へ べ ぺ ほ 6 ぼ ぽ ま み む め も ゃ や ゅ 7 ゆ ょ よ ら り る れ ろ ゎ わ 8 ゐ ゑ を ん       9      
国标第05区  0 1 2 3 4 5 6 7 8 9 0   ァ ア ィ イ ゥ ウ ェ エ ォ 1 オ カ ガ キ ギ ク グ ケ ゲ コ 2 ゴ サ ザ シ ジ ス ズ セ ゼ ソ 3 ゾ タ ダ チ ヂ ッ ツ ヅ テ デ 4 ト ド ナ ニ ヌ ネ ノ ハ バ パ 5 ヒ ビ ピ フ ブ プ ヘ ベ ペ ホ 6 ボ ポ マ ミ ム メ モ ャ ヤ ュ 7 ユ ョ ヨ ラ リ ル レ ロ ヮ ワ 8 ヰ ヱ ヲ ン ヴ ヵ ヶ    9      
国标第06区  0 1 2 3 4 5 6 7 8 9 0   Α Β Γ Δ Ε Ζ Η Θ Ι 1 Κ Λ Μ Ν Ξ Ο Π Ρ Σ Τ 2 Υ Φ Χ Ψ Ω      3    α β γ δ ε ζ η 4 θ ι κ λ μ ν ξ ο π ρ 5 σ τ υ φ χ ψ ω    6     ︵ ︶ ︹ ︺ ︿ ﹀ 7 ︽ ︾ ﹁ ﹂ ﹃ ﹄   ︻ ︼ 8 ︷ ︸ ︱  ︳ ︴     9      
国标第07区  0 1 2 3 4 5 6 7 8 9 0   А Б В Г Д Е Ё Ж З 1 И Й К Л М Н О П Р С 2 Т У Ф Х Ц Ч Ш Щ Ъ Ы 3 Ь Э Ю Я       4          а 5 б в г д е ё ж з и й 6 к л м н о п р с т у 7 ф х ц ч ш щ ъ ы ь э 8 ю я         9      
国标第08区(由于Mircosoft的原因,本区在此状态下排不齐)  0 1 2 3 4 5 6 7 8 9 0   ā   á  ǎ    à  ē   é  ě  è   ī 1 í    ǐ    ì  ō  ó  ǒ  ò  ū  ú   ǔ 2 ù   ǖ   ǘ ǚ  ǜ   ü  ê  ɑ   ń 3 ň   &#505;   ɡ      ㄅ ㄆ ㄇ 4 ㄈ ㄉ ㄊ ㄋ ㄌ ㄍ ㄎ ㄏ ㄐ ㄑ 5 ㄒ ㄓ ㄔ ㄕ ㄖ ㄗ ㄘ ㄙ ㄚ ㄛ 6 ㄜ ㄝ ㄞ ㄟ ㄠ ㄡ ㄢ ㄣ ㄤ ㄥ 7 ㄦ ㄧ ㄨ ㄩ       8           9      
国标第09区  0 1 2 3 4 5 6 7 8 9 0       ─  ━  │  ┃  ┄  ┅ 1 ┆   ┇  ┈  ┉   ┊  ┋  ┌  ┍  ┎  ┏ 2 ┐   ┑  ┒   ┓  └ ┕   ┖  ┗   ┘ ┙ 3 ┚   ┛  ├   ┝  ┞ ┟  ┠   ┡  ┢  ┣ 4 ┤  ┥   ┦   ┧  ┨ ┩  ┪   ┫  ┬  ┭ 5 ┮  ┯   ┰   ┱  ┲ ┳  ┴   ┵  ┶  ┷ 6 ┸  ┹   ┺   ┻  ┼ ┽  ┾   ┿  ╀  ╁ 7 ╂  ╃   ╄   ╅  ╆ ╇  ╈   ╉  ╊  ╋ 8            9      
 
第16区至55区为一级汉字,以拼音排序,共计3755字  
国标第 16区  0 1 2 3 4 5 6 7 8 9 0   啊 阿 埃 挨 哎 唉 哀 皑 癌 1 蔼 矮 艾 碍 爱 隘 鞍 氨 安 俺 2 按 暗 岸 胺 案 肮 昂 盎 凹 敖 3 熬 翱 袄 傲 奥 懊 澳 芭 捌 扒 4 叭 吧 笆 八 疤 巴 拔 跋 靶 把 5 耙 坝 霸 罢 爸 白 柏 百 摆 佰 6 败 拜 稗 斑 班 搬 扳 般 颁 板 7 版 扮 拌 伴 瓣 半 办 绊 邦 帮 8 梆 榜 膀 绑 棒 磅 蚌 镑 傍 谤 9 苞 胞 包 褒 剥 

PARTNER CONTENT

文章评论0条评论)

登录后参与讨论
EE直播间
更多
我要评论
0
3
关闭 站长推荐上一条 /3 下一条