原创嵌入式系统简易汉字输入法

 2010-10-18 10:31  1662 15 15 分类: MCU/ 嵌入式

汉字输入法的实质是建立一种按键组合到汉字编码的映射关系，因此，使用数字键盘的嵌入式系统的输入法与使用标准键盘的PC机的输入法没有本质的不同，其区别主要在于嵌入式应用中处理器、存储器等资源比较有限。如对应汉字“你”，拼音输入法下PC键盘按键组合为“ni”，而在一般数字键盘下，其按键组合则为“64”。
在多数手持式设备中，以0~9数字键与几个简单的控制键实现汉字输入，例如手机中广泛采用的T9 和iTap 输入法。这里我们介绍一种简单的拼音输入法的实现方法。
一般终端键盘包括12个按键，分别是0~9数字键和“*”、“#”两个特殊键。按通用规则，数字1对应空格，其功能基本等同于PC机中的空格键，用于输入空格或作为当前汉字的确认键；2~9数字键分别对应下述汉语拼音字母：
1：         2：a b c   3：d e f
4：g h i    5：j k l      6：m n o
7：p q r s 8：t u v     9：w x y z
而 “*”、 “0”、“#”键则作为输入法中的控制键。一般将”*”作为特殊字符（如标点符号等）选择键；将“#”作为功能选择键，用于选取同一数字键组合下的不同拼音组合。
输入法中使用了两个重要数据结构，分别是PY_NODE和PY_SUBNODE。每个PY_NODE对应一个数字键组合，PY_SUBNODE则对应一组拼音组合。由于一个数字组合可对应多个拼音组合(如“226”对应“ban”、“bao”、“can ”、“cao”)，因此这两个结构实现的是一个两级的对应表。PY_NODE按树组织，而PY_SUBNODE按双向链表组织。
以下是两个结构的定义：
typedef struct py_node{
unsigned int son[8];   //对应下次2~9按键输入时应转到的PY_NODE的ID号
unsigned int father;     //父节点ID号
struct py_subnode *ptrpy;   //指向下属第一个PY_SUBNODE的指针
}PY_NODE;
typedef rom struct py_subnode{
unsigned char py[7];                   //本节点的拼音字符串
struct py_subnode *prev;           //指向前一PY_SUBNODE的指针
struct py_subnode *next;            //指向下一PY_SUBNODE的指针
unsigned char *ptrUnicode;        //指向本节点对应Unicode码表的指针
}PY_SUBNODE;
程序中所参照的汉语拼音表中共有412种组合，这样系统中必须有412个PY_SUBNODE与其一一对应；系统中共建立了250个PY_NODE。建立此部分数据的工作比较繁琐，分以下5个步骤进行：
1、汉字按拼音进行分组，按常用程度排序，并将汉字转化为Unicode码或国标码，码型视系统要求而定；
2、将有效拼音转换为数字键盘值组合，如拼音“cui”转为数字值“284”，这些值对应了部分PY_NODE；
3、增加中间PY_NODE，用于表示本身无效但后续输入有效的拼音，如“b”、“c”、“don”、“dua”等节点；
4、将数字键组合相同的PY_SUBNODE编成链表，由某一PY_NODE中的ptrpy指针指向表头；
5、按数字键组合的关系，将PY_NODE组成树。
在改变当前PY_NODE时，一般应伴有一些显示操作，因应用不同各有差异，此处不做过多说明。在当前节点下，可以用某一指定控制键(如“#”键)来选择此PY_NODE下属的PY_SUBNODE以缩小汉字的选取范围。
对于一些常用的特殊符号、英文和数字的输入，较常用的做法是将以单独的输入法实现。
值得注意的是，对于很多8位MCU，地址空间不大于64kB。这样小的空间对于汉字界面中的汉字库和输入法中的大量数据结构是远远不够的(如一、二级常用字的16×16点阵汉字库至少需要约220kB)，因此常使用地址分页方式实现地址扩展。在MCU外部设一锁存器作为“页”寄存器，每页大小根据MCU特性和实际需求确定，如MCS51系列最大可为64kB一页。由于页寄存器的操作为独占型的，因此在中断内不能进行操作；而在基于RTOS的多任务环境下，应避免多个任务同时使用页寄存器。