开课:
汉字区位码为何各有94个区94个位,汉字从16区开始。有何道理?
1980年颁布了《信息交换用汉字编码字符集—基本集》的国标交换码,国家标准号为:GB2312-80,选入了6763个汉字,分为两级,一级字库中有3755个,是常用汉字,二级字库中有3008个,是次常用汉字;还选入了682个字符,包含有数字、一般符号、拉丁字母、日本假名、希腊字母、俄文字母、拼音符号、注音字母等。以前我国大陆的各种中文DOS版本、Windows3.1 /3.2版本,装入的字库都是国标一二级字库。
这是gb2312-80之规定,但为何都是94呢???88、98、118多好听~~~
菜农那时20出头,肯定不会坐在“圆桌”上~~~不过俺会“反汇编”
ASCII码对照表
下表列出了字符集中的 0 - 127。
代码 字符 代码 字符 代码 字符 代码 字符 0 32 [空格] 64 @ 96 ` 1 33 ! 65 A 97 a 2 34 " 66 B 98 b 3 35 # 67 C 99 c 4 36 $ 68 D 100 d 5 37 % 69 E 101 e 6 38 & 70 F 102 f 7 39 ' 71 G 103 g 8 ** 40 ( 72 H 104 h 9 ** 41 ) 73 I 105 i 10 ** 42 * 74 J 106 j 11 43 + 75 K 107 k 12 44 , 76 L 108 l 13 ** 45 - 77 M 109 m 14 46 . 78 N 110 n 15  47 / 79 O 111 o 16  48 0 80 P 112 p 17  49 1 81 Q 113 q 18  50 2 82 R 114 r 19 51 3 83 S 115 s 20 52 4 84 T 116 t 21 53 5 85 U 117 u 22  54 6 86 V 118 v 23  55 7 87 W 119 w 24  56 8 88 X 120 x 25  57 9 89 Y 121 y 26  58 : 90 Z 122 z 27 59 ; 91 [ 123 { 28  60 < 92 \ 124 | 29  61 = 93 ] 125 } 30 - 62 > 94 ^ 126 ~ 31 63 ? 95 _ 127 
上表为“美国信息交换标准代码”--ASCII码表
它的范围在0x00~07f.
Binary-Coded Decimal‎,简称BCD,称BCD码或二-十进制代码,亦称二进码十进数。是一种二进制的数字编码形式,用二进制编码的十进制代码。这种编码形式利用了四个位元来储存一个十进制的数码,使二进制和十进制之间的转换得以快捷的进行。这种编码技巧,最常用于会计系统的设计里,因为会计制度经常需要对很长的数字串作准确的计算。相对于一般的浮点式记数法,采用BCD码,既可保存数值的精确度,又可免却使电脑作浮点运算时所耗费的时间。此外,对于其他需要高精确度的计算,BCD编码亦很常用。
由于十进制数共有0、1、2、……、9十个数码,因此,至少需要4位二进制码来表示1位十进制数。4位二进制码共有2^4=16种码组,在这16种代码中,可以任选10种来表示10个十进制数码,共有N=16!/(16-10)!约等于2.9乘以10的10次方种方案。常用的BCD代码列于末。
而BCD码的范围是0x00~0x99
故“逼迫”GB2312-80的范围应该在0x9A~0xFF之间
所以应该合理地选0xA0~0xFF之间。
又因为人们习惯计数从1开始,即区码、位码都从1开始,
故汉字区位码的范围被定义在0xA1~0xFF之间。
而编程人员又习惯0xFF为“空”,
所以最终“商定”:汉字区位码的范围被定义在0xA1~0xFE。
故0xfe-0xa1+1=94.
至于汉字为何编入16区,即0xB0,估计和十六进制数有关。
0xA1~0xAF即非汉字区(字符和外码),A和B有差距。
故汉字从0xB0即16区“看着比较顺眼”~~~
课毕:
本科纯属虚构,若有雷同请告知农会~~~
HotC51@126.com 2009.2.25 于菜地。 团部:http://group.ednchina.com/1623/
国标第01区 0 1 2 3 4 5 6 7 8 9 0 、 。 · ˉ ˇ ¨ 〃 々 1 — ~ ‖ … ‘ ’ “ ” 〔 〕 2 〈 〉 《 》 「 」 『 』 〖 〗 3 【 】 ± × ÷ ∶ ∧ ∨ ∑ ∏ 4 ∪ ∩ ∈ ∷ √ ⊥ ∥ ∠ ⌒ ⊙ 5 ∫ ∮ ≡ ≌ ≈ ∽ ∝ ≠ ≮ ≯ 6 ≤ ≥ ∞ ∵ ∴ ♂ ♀ ° ′ ″ 7 ℃ $ ¤ ¢ £ ‰ § № ☆ ★ 8 ○ ● ◎ ◇ ◆ □ ■ △ ▲ ※ 9 → ← ↑ ↓ 〓 国标第02区 0 1 2 3 4 5 6 7 8 9 0 ⅰ ⅱ ⅲ ⅳ ⅴ ⅵ ⅶ ⅷ ⅸ 1 ⅹ ⒈ ⒉ ⒊ 2 ⒋ ⒌ ⒍ ⒎ ⒏ ⒐ ⒑ ⒒ ⒓ ⒔ 3 ⒕ ⒖ ⒗ ⒘ ⒙ ⒚ ⒛ ⑴ ⑵ ⑶ 4 ⑷ ⑸ ⑹ ⑺ ⑻ ⑼ ⑽ ⑾ ⑿ ⒀ 5 ⒁ ⒂ ⒃ ⒄ ⒅ ⒆ ⒇ ① ② ③ 6 ④ ⑤ ⑥ ⑦ ⑧ ⑨ ⑩ ㈠ 7 ㈡ ㈢ ㈣ ㈤ ㈥ ㈦ ㈧ ㈨ ㈩ 8 Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ Ⅵ Ⅶ Ⅷ Ⅸ 9 Ⅹ Ⅺ Ⅻ 国标第03区 0 1 2 3 4 5 6 7 8 9 0 ! " # ¥ % & ' ( ) 1 * + , - . / 0 1 2 3 2 4 5 6 7 8 9 : ; < = 3 > ? @ A B C D E F G 4 H I J K L M N O P Q 5 R S T U V W X Y Z [ 6 \ ] ^ _ ` a b c d e 7 f g h i j k l m n o 8 p q r s t u v w x y 9 z { | }  ̄ 国标第04区 0 1 2 3 4 5 6 7 8 9 0 ぁ あ ぃ い ぅ う ぇ え ぉ 1 お か が き ぎ く ぐ け げ こ 2 ご さ ざ し じ す ず せ ぜ そ 3 ぞ た だ ち ぢ っ つ づ て で 4 と ど な に ぬ ね の は ば ぱ 5 ひ び ぴ ふ ぶ ぷ へ べ ぺ ほ 6 ぼ ぽ ま み む め も ゃ や ゅ 7 ゆ ょ よ ら り る れ ろ ゎ わ 8 ゐ ゑ を ん 9 国标第05区 0 1 2 3 4 5 6 7 8 9 0 ァ ア ィ イ ゥ ウ ェ エ ォ 1 オ カ ガ キ ギ ク グ ケ ゲ コ 2 ゴ サ ザ シ ジ ス ズ セ ゼ ソ 3 ゾ タ ダ チ ヂ ッ ツ ヅ テ デ 4 ト ド ナ ニ ヌ ネ ノ ハ バ パ 5 ヒ ビ ピ フ ブ プ ヘ ベ ペ ホ 6 ボ ポ マ ミ ム メ モ ャ ヤ ュ 7 ユ ョ ヨ ラ リ ル レ ロ ヮ ワ 8 ヰ ヱ ヲ ン ヴ ヵ ヶ 9 国标第06区 0 1 2 3 4 5 6 7 8 9 0 Α Β Γ Δ Ε Ζ Η Θ Ι 1 Κ Λ Μ Ν Ξ Ο Π Ρ Σ Τ 2 Υ Φ Χ Ψ Ω 3 α β γ δ ε ζ η 4 θ ι κ λ μ ν ξ ο π ρ 5 σ τ υ φ χ ψ ω 6 ︵ ︶ ︹ ︺ ︿ ﹀ 7 ︽ ︾ ﹁ ﹂ ﹃ ﹄ ︻ ︼ 8 ︷ ︸ ︱ ︳ ︴ 9 国标第07区 0 1 2 3 4 5 6 7 8 9 0 А Б В Г Д Е Ё Ж З 1 И Й К Л М Н О П Р С 2 Т У Ф Х Ц Ч Ш Щ Ъ Ы 3 Ь Э Ю Я 4 а 5 б в г д е ё ж з и й 6 к л м н о п р с т у 7 ф х ц ч ш щ ъ ы ь э 8 ю я 9 国标第08区(由于Mircosoft的原因,本区在此状态下排不齐) 0 1 2 3 4 5 6 7 8 9 0 ā á ǎ à ē é ě è ī 1 í ǐ ì ō ó ǒ ò ū ú ǔ 2 ù ǖ ǘ ǚ ǜ ü ê ɑ ń 3 ň ǹ ɡ ㄅ ㄆ ㄇ 4 ㄈ ㄉ ㄊ ㄋ ㄌ ㄍ ㄎ ㄏ ㄐ ㄑ 5 ㄒ ㄓ ㄔ ㄕ ㄖ ㄗ ㄘ ㄙ ㄚ ㄛ 6 ㄜ ㄝ ㄞ ㄟ ㄠ ㄡ ㄢ ㄣ ㄤ ㄥ 7 ㄦ ㄧ ㄨ ㄩ 8 9 国标第09区 0 1 2 3 4 5 6 7 8 9 0 ─ ━ │ ┃ ┄ ┅ 1 ┆ ┇ ┈ ┉ ┊ ┋ ┌ ┍ ┎ ┏ 2 ┐ ┑ ┒ ┓ └ ┕ ┖ ┗ ┘ ┙ 3 ┚ ┛ ├ ┝ ┞ ┟ ┠ ┡ ┢ ┣ 4 ┤ ┥ ┦ ┧ ┨ ┩ ┪ ┫ ┬ ┭ 5 ┮ ┯ ┰ ┱ ┲ ┳ ┴ ┵ ┶ ┷ 6 ┸ ┹ ┺ ┻ ┼ ┽ ┾ ┿ ╀ ╁ 7 ╂ ╃ ╄ ╅ ╆ ╇ ╈ ╉ ╊ ╋ 8 9 第16区至55区为一级汉字,以拼音排序,共计3755字 国标第 16区 0 1 2 3 4 5 6 7 8 9 0 啊 阿 埃 挨 哎 唉 哀 皑 癌 1 蔼 矮 艾 碍 爱 隘 鞍 氨 安 俺 2 按 暗 岸 胺 案 肮 昂 盎 凹 敖 3 熬 翱 袄 傲 奥 懊 澳 芭 捌 扒 4 叭 吧 笆 八 疤 巴 拔 跋 靶 把 5 耙 坝 霸 罢 爸 白 柏 百 摆 佰 6 败 拜 稗 斑 班 搬 扳 般 颁 板 7 版 扮 拌 伴 瓣 半 办 绊 邦 帮 8 梆 榜 膀 绑 棒 磅 蚌 镑 傍 谤 9 苞 胞 包 褒 剥
|
|
文章评论(0条评论)
登录后参与讨论