我们知道,一个合字体的取码规则是这个字的一、二、三、末字根,这只是针对四个字根以上的汉字。如果是这个字只有二个字根或三个字根构成,比如“叭”,这时怎么输入呢?
只键入这两个字根的编码不行吗?
我们试试,在五笔状态下键入“叭”的两个字根的编码,KW,我们发现出现在第一条的是“只”字,原来“叭”与“只”都是由字根“口”和“八”组成的,其编码也是KW。
那怎么办呢?
由于编码少,信息量不足,会造成重码。我们要想办法把这两个字加以区别。 你注意到没有,“叭”是左右型汉字,“只”是上下型汉字。 我们给这两个字加上字型代号,以区别它们:
叭: K W 1 只: K W 2
我们把后面这个数字叫做字型代码,用来补充字根的不足。现在这两个字的编码就不一样了!
噢,我猜到了!是不是用这个数字作为识别码?输入KW1就是“叭”,输入KW2就是“只”?
假设你说得对,我们再看下面这个例子怎么办:
比如“洒”、“沐”、“汀”三个字,字根编码都是IS,并且字型都是左右型的,字型代码都是1。
噢,看来字型代码并不能消除重码!
别泄气,我们再找一找这些字有什么不同。你注意到没有,这三个字的最后一笔是不同的。“洒”的最后一笔是横,“汀”的最后一笔是竖勾,“沐”的最后一笔是捺,这些笔划都有区位代号,你还记得吗?
噢,知道,横竖撇捺折,分别在12345区。
这样,我们就可以用最后一个笔划代号来区分这几个字了。“洒”是IS1,“汀”是IS2,“沐”是IS4。我们把这个数字叫做末笔代码。
现在我们有两个数字来区别基本字根相同的字,一个是字型代码,一个是末笔代码。这两个识别码都是数字,不便直接输入,最好能把它们转化为字母代码。你还记得我们前面讲的区位号吗?
记得,就是11、12、13,一直到55的那些数字吧!
不错。既然字型代码和末笔代码单独都不能区分所有的重码,我们就把这两个数字合起来,组成一个数字,我们把这个两数字与区位号联系起来,用区位号对应的字母作为识别码。
原来我一直以为那些区位号没有什么用,原来可以当作识别码!
我们来看看识别码的构成。把汉字的末笔代号作为十位,字型代号作为个位,就组成了一个二位数,对应区位上的字母,就是识别码,又称为“末笔字型交叉识别码”。
比如我们刚才这三个字,“洒”字的末笔为横,末笔代码是1,字型为左右型,字型代码是1,识别码就是为11,也就是字母G;“汀”字的末笔为竖,末笔代码是2,字型代码是1,识别码就是为21,也就是字母H;“沐”字末笔为捺,末笔代码为4,字型代码为1,识别码为41,也就是字母Y。
现在,这三个字的编码分别是ISG、ISH、ISY,已经区分开了。
这几个字加了识别码后仍然不够四码,所以在录入时要敲空格。启动输入法,键入ISG,再按空格,“洒”字就也现了。 你来判断一下“只”和“叭”的识别码吧!
好的。“只”的最后一笔是捺,末笔代码为4,这个字是上下结构的,字型代码为2,所以识别码为42,也就是U,“叭”的最后一笔也是捺,末笔代码还是4,字是左右结构的,字型代码为1,所以识别码为41,也就是Y。
嗯,“只”的编码为KWU,“叭”的编码为KWY。
你分析得很好!
汉字的笔画有5种,字型有3种,所以末笔字型交叉识别码共15种,也就是每个区位的前三位是作为识别码来用的。
要学会识别码,就要多思考,勤练习。
好的,我一定多练多想!
练习:请键入下列字的识别码。
把 反
务 血 备
吧 邑 叹 吗
杜 杆 材 村
卡 逐 召 市
答案:
RCN RCI
TLB TLD TLF
KCN KCB KCY KCG
SFG SFH SFT SFY
HHU EPI VKF YMHJ