许多方法的实践都证实,词汇编码输入可以有效降低重码率并显著缩短码长,从而大大提高速度、效率。在五笔字型输入方法中增强了词汇输入的功能,并给出开放式结构,以利于用户根据自己专业需要自行组织词库。可以说,五笔字型最有效的还是词汇输入。
五笔字型词语输入法有一个特点,那就是它与单个汉字输入是统一的,即输入时不用加字或词的输入标记(如五笔画词语输入时必须先输入"7"),也不用换档。这主要是由于单个汉字才6700多个,所以还有大量的编码空间空闲着。词语的编码大部分就是利用边些空闲的编码区。
一、二字词的编码
二字词在汉语词汇中占有相当大的比重。二字词的编码由所含的两个汉字各取前两个字根码组成,即每个汉字按书写顺序取前两个字根来进行编码。如:
机器:木 几 口 口 SMKK
计算:言 十 竹 目 YFTH
数量:米 女 日 一 OVJG
二、三字词的编码
三字词的编码与二字词的编码类似 ,只不过它的编码是由前两个汉字的第一个字根码和后一个汉字的前两个字根码构成。如:
计算机:言 竹 木 几 YTSM
工艺品:工 艹 口 口 AAKK
三、四字词的编码
四字词的编码是由每个汉字的前一字根码组成,共四码,例如
巧夺天工:工 大 一 工 ADGA
原原本本:厂 厂 大 大 DDSS
四、多字词的编码
多字词是指构成词的单个汉字数超四个,多个词的编码按"一、二、三、末"的规则,即分别取第一、第二、第三及最末一个汉字的第一个字根码来构成的编码。例如:
中华人民共和国:口 亻 人 国 KWWL