据北京语言学院张普教授的总结,至少经历了三个误区。
第一误区:重码率越低越好
其实稍有编码常识的人都明白,不论是数码、音码、形码或者是混合码,要做到一字一码、绝无重码并不困难,电报码和区位码就都没有重码。但是都必须以增加规则和记忆作为代价。若能发挥软件优势,例如通过“高频先见”、“第一高频免空格键”以及“智能化电脑根据上文自动选词”等功能,方案中虽然有少量的重码,使用中去仍然感到很方便。以前所有的汉字输入法都是把规则教给人脑的,现在则教给了电脑。这是汉字键盘输入法研究中的重大突破,是一次关键性的战略转移。
第二误区: 速度越快越好
从道理上说,只有方案的发明人才对方案的使用最熟悉,但是实际上几乎每一个方案的发明人都是本方案的最快速操作者。一个方案的输入速度是快是慢,很大程度上取决于打字员的素质(包括反应能力、智力、文化水平、语文水平甚至思想水平等很多方面),同时和机型、软件的质量好坏也有很大关系。
一个汉字输入方案是否优秀,输入速度固然是考核的因素之一,但绝不是唯一的因素。一方面,速度是有极限的;超过了极限,就不是科学,而是变戏法,也就是弄虚作假。一分钟六十秒,每秒錾输入一个汉字,每分钟就是六十个字,这已经够快的了;每秒钟输入两个汉字,每分钟就达一百二十个字,可以列为高速方案;每秒钟输入三个汉字,这在常人几乎已经不可能,应该说是到了极限或接近极限了。一般人的阅读速度是每分钟180个字左右。另一方面,除了专职的电脑打字员之外,随着计算机的日益普及,更多的秘书、编辑、作家、教师、记者、学者、科技人员、办公人员等等,都要开始使用电脑进行一般的公文、信函、讲稿、论文、消息、专著等的起草、修改、打印等工作。这些人的工作方式主要是“想打”而不是“看打”或“听打”,一般是先有腹稿,一边击键一边思考。他们对汉字输入的速度要求并不高。对这些人来说,选择输入方案的时候,最愿意接受的,是容易学而又不容易遗忘的方案,而且最好就用他们在学龄教育中所接受的背景知识来编码。
所以说:面向一般用户的汉字输入方案,最好能兼顾易学和速度两个方面,或者可以从低速到高速自然过渡,绝不能因为追求速度而牺牲了易学性。跟输入速度接近的另一个小误区就是片面追求最短的“码长”。从理论上说,码长越短,输入的速度也就越快;但是平均码长也有一个极限。
目前,这一误区基本上已经从专家范围内走出来了。许多编码专家都已经考虑到了一般用户与专业用户的差别,考虑到了“想打”与“看打”、“听打”的差别;懂得了易学性与速度应该并重,甚至强调为一般用户“想打”而编制的汉字输入方案,应该把易学性放在第一位。
第三误区: 词库越大越好
语言学界有一句名言:“词儿是无限的。”因此,世界上既没有一个无所不包的词库,作为计算机输入使用的词库也不是越大越好。从已有词库的使用情况来看,第一,按照词典收词范围建立的词库(例如《现代汉语词典》中的五万六千词),其中有一些词是古汉语用词,一些是方言用词,很多人根本用不着;第二,任何人的用词领域都有一定的范围(例如:化学、冶金、医药、农业、财贸、法律等),再大的词库,也不可能满足各行各业的不同需求。因此,在通用词库之外,不妨分别建立若干个专业词库,以备各种行业的人使用。例如,农业领域就曾经提出至少要增加三四万条农业专用词语。此外,在不同地区还可以增加一些方言用词或地域用词。
由此得出结论:比较合理的词库结构应该是:通用词库+专用词库+个人词库
这一误区,还没有被更多的人所认识,不论是研究者还是使用者,至今还有人在盲目追求尽量扩大词库。