CN1093182A - 声韵笔对码汉字输入方法及键盘 - Google Patents
声韵笔对码汉字输入方法及键盘 Download PDFInfo
- Publication number
- CN1093182A CN1093182A CN 93103600 CN93103600A CN1093182A CN 1093182 A CN1093182 A CN 1093182A CN 93103600 CN93103600 CN 93103600 CN 93103600 A CN93103600 A CN 93103600A CN 1093182 A CN1093182 A CN 1093182A
- Authority
- CN
- China
- Prior art keywords
- code
- chinese
- word
- pen
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
声韵笔对码是一种非常简便易学的汉字输入方
法,它将汉字中连续书写的两笔做为一个笔对,将25
种笔对分为五组,有规律地排列在字母键盘上,每字
取声母、首笔对、末笔对三码或声母、韵母、首笔对、末
笔对四码。规则简明,没有特例,不用拆字根,不用分
析字形结构,经试验小学生或任何识字的人只要五分
钟即可完全学会。简码自动显示,无需记忆,单字输
入重码率0.2%,单字动态码长包括分隔符为3.1键,
键位安排符合指法规律,能充分提高击键速度,能装
入大量词组,具有良好的输入效率。
Description
本发明属于汉字信息处理技术。
汉字编码事业已进行了多年,到现在编码界取得的共识是:一,汉字编码能否在计算机上实现,输入速度能否与西文相比的问题已经解决;二,汉字编码及键盘输入方式将与其它输入方式长期共存,但汉字编码要规范化,软件处理要智能化;三,汉字编码事业的方向已由原来以降低重码率,提高速度为主,转向以提高易学性为主,最终目的是要实现人人都能用计算机写字;四,迄今为止,易学性问题,或者说汉字编码向全民族普及的问题尚未得到根本解决。
不少方案在刚一接触时的确很简单,但稍一深入,难度立即增大到使非专业人员望而却步的程度。
如“以音托形”类的编码,只看“人可何-RKH,立早章-LZZ”的例子,的确极简单,但由于汉字千变万化的复杂性,象例子中这样简单的字并不多,大量的问题难以处理,如“维—纟隹”,字根“纟”无读音,结果有人用“J”(绞丝),有人用“L”(乱绞丝),有人用“N”(扭丝),也有人干脆就用“S”(丝),象这种无读音的字根有很多,如“讠,冂,勹,亠,阝,廴,廾,彡,犭,忄,丬,宀,彐,屮,……”;而字根“隹”有读音(ZHUI,CUI),但读音一般人不熟悉,象这类有读音但又难读的字根就更多,如“聿,厶,殳,彳,兀,爿,幺,艮,豸,豕,缶,耒,口,糸,巛,弋,尢,酉,亢,氐,乇,壬,……”。又比如,有相当数量的汉字很难明确地拆为两个可读的字根,如“求,单,非,录,角,率,既,赣,隶,……”等等。为解决这些问题,势必要搞一个字根表,选哪些字根,赋予什么音,就必须强记下来,对于大量没有选入字根表的字根,则必须拆根,于是,拆根规则就会随之而来。
又如表形码,只看例子“氵-3,匚-C,义-X,则:沤-3CX”,的确极为直观,但汉字字根中真正与西文字母相象的只是极少数,对于大部分不象的字根只好采用联想,近似,甚至强行规定的办法与键位对应。比如该码用G键对应“巨,臣,月,用,犭,豸,豕”等;用S键对应“井,曲,开,兼,弋,戋,电,石,饣”等。这些部件和这些字母之间几乎没有多少相象之处,所以用部件与字母外形的相像来“表形”,实际上是比较困难的。
再比如有些角形,笔形类,编码取自汉字的边角,但汉字并不都是方方正正的,有时边角十分复杂,如何拆取就成了模糊困难的问题。
要解决易学性问题首先要搞清是针对什么人的,对于专业录入员来说,以上各类方案并不算很难,但如果我们的目的是为了在全民族中普及汉字编码汉字编码,则对象主要是非专业人员,他们对重码率的要求不是很高,但对易学性的要求极高,任何一个方案,只要还需要一段专门培训过程才能掌握,那就几乎无法在非专业人员中普及。象上面这些入门看似容易,而深入后则困难的方案都不适于真正的普及。
可以说,到目前为止,所有的编码方案除了拼音码之外,基本上都没能在非专业人员中推广,五笔字型码虽已占领全国大部分专业录入员阵地,但在非专业人员中一直无法推广,其原因就在于这些方案都未能充分满足非专业人员的要求。
综上所述,各种方案之难于普及的症结主要在以下四点:
一,方案没有建立在一般人所熟悉的学校教育的基础上,而是建立在各家自造的人工编码系统上,就连笔形、字型结构的分类或笔画的顺序也往往与学校教育不一致,更不用说形形色色的人工部件。
二,各类方案普遍存在相当严重的模糊性,缺乏规范化的制约。不是选用的汉字属性本身模糊,就是拆分规则模糊或取码顺序模糊。
三,为了对模糊性加以限制,必然造成规则复杂繁琐,但即使如此有时仍免不了模糊矛盾,并由此产生众多的难检字。比如在五笔型码中,按照“取大优先”,“行”字应拆为“彳二丨”,而按照“能散不连”,“行”字又应该拆为“彳一丁”,为此只好采用“容错码”,这正说明规则模糊矛盾而产生的歧义性。
四,记忆量大,回生率高。
本发明的目的是要从根本上解决汉字编码的普及问题。针对上述问题,本发明建立的普及目标体系是:
一,方案应建立在学校教育这个最大的规范化体系的基础上,即所选用的汉字属性最起码应该是中小学语文教学中的必修内容,做为最高要求应该是所有小学生都能基本掌握的属性。对于普及方案来说这是先决条件。
二,编码体系(包括所选用做为编码元件的汉字属性和编码系统的分类体系)应尽可能明确,严密,规范化,有公认的统一标准可循。那些模糊、歧义、无公认标准的属性尽量不选用;也不用那些形似,相象,联想之类的概念做为分类标准,而用“是”和“否”做为分类标准,从而彻底消除模糊性。
三,编码规则应尽可能简单直观。对所有汉字最好使用同一规则处理,规则之间不要有矛盾,最好不要有特例。
四,记忆量尽可能小。编码元件与键位的对应关系最好是一元对应,即对于同一汉字属性来说,一个键位最好只对应一种码元,否则记忆量将成倍增加。
显然,这个目标是极高的。但即使达到以上目标,解决了易学性问题,并不等于从根本上解决了普及问题,这里还有个效率问题,如拼音码或五笔划码可以说基本达到了以上目标,但重码太多,严重影响速度,所以要能真正普及,在输入速度方面也应有一个与上面相适应的目标体系。
一 码元最好全部采用字母而不用数字,因数字键距离远,影响速度。同时上面已分析过,从记忆量角度考虑码元与键位最好是一元对应,综合这两种考虑,对于同一种汉字属性来说,码元数量应当最大限度地贴近26这个目标。
二 码元在键位上的排列分布应最大限度地符合指法规律,以发挥击键的潜力。
三 无论看打还是听打,录入员的记忆单位一般都是整句或整词,因此在键入每个汉字时的心理反应过程总是先音后形,所以供录入员使用的专业型方案最好以音码为主,这样可以最大限度地减少心理转换过程,发挥速度潜力。
四 码长最长不超过四键。
五 重码率应在0.5%以下。
六 能装入大量词组。
以上就是我们提出的效率目标体系。
然而,在汉字编码中有一条普遍的规律:凡易学者一般都重码多,输入慢,凡快速者一般都难学。所以,如果一个方案能够在绝对保证易学性所有目标的前提下又同时达到上述效率目标,就可以说这个方案的确从根本上解决了汉字编码的普及问题。为实现上述设想,我们应将汉字的所有属性做一系统全面的分析排队,进行优化组合,从而选出最合适的编码材料。
本发明依据上述易学性目标体系对汉字的所有属性(包括部首,字根,角形,字型结构,笔顺,笔画数,声母,韵母,声调等)从是否为中小学语文课所必修,是否明确规范,是否简单易学,是否记忆量少等四个方面进行定量分析,规定出必修系数,规范系数,简单系数和记忆系数四个基本指标,以汉字各属性对各项指标的隶属度做为其系数量值,完全符合标准者隶属度为1,完全不符合标准者隶属度为0,介于二者之间隶属度为0.5。采用评估法给出数据,然后再进行筛选。依上述标准对汉字各属性的评估结果见附图1。
将附图1与《汉字属性字典》对照,《汉字属性字典》所选的属性与本表相重合的有只有声母、韵母、声调、笔顺、笔画数、部首这几种,《汉字属性字典》之所以只选这几个属性,说明只有这几种属性比较规范,有公认的标准,而其它属性则规范性比较差,无法建立公认的标准。
现将附图1中各属性的易学性综合指标依高低排列如下:
第1组:声母,笔顺(4分);第2组:韵母(3.5分);第3组:声调,字型结构(3分);第4组:部首(2.5分);第5组:笔画数,角形(2分);第6组:字根(0分)。
由此可见,字根是易学性最差的汉字属性。正如汉字编码专家陈一文先生所指出的:“做为编码部件的字根是造成专业型编码太难学的关键”,现在已有数百种字根码方案,但没有一种是真正易学,能在非专业人员中全面推广开的,这充分证明了上述结论。因此,要编制真正易学的汉字编码方案,一定要避开字根及其拆分。以上结果表明:声母,笔画,韵母等三种汉字属性最符合普及目标体系的要求,因此筛选出做为编码材料。
另外,为使笔画类型的数量最大限度地贴近字母数量26,以利于离散重码,提高击键速度,本发明将汉字中连续书写的两笔做为一个笔对,从汉字的五种基本笔画“一丨丿丶乙”出发,组合成25种“笔对”,从而使笔画的变化类型的数量与字母数量相近,以便于安排在字母键上。
本发明所采用的笔顺以北京图书馆编著的《汉字属性字典》为规范,以适应中小学的语文教学。
本发明以声母,韵母和笔对做为编码元件进行优化组合,从而编制出一套简明易学,科学合理,即既适于非专业人员使用,又适于专业人员使用的编码方案。
本发明的实施方案如下:
声韵笔对码是一种音形码,规则简单,编码明确,输入效率高。包括声形三键、音形四键两种输入方式,供操作者选择。
汉字中连续书写的两笔叫做一个“笔对”如“华”字可分为三个笔对,“亻匕十”。
汉字的单笔画共有五种:
横,包括横,提(指由横演变的“提”,如“提土旁”的末笔)。
竖,单指竖,不包括竖钩。
撇,单指撇。
点,包括点,捺,及由点演变的“点提”,如“氵冫”的末笔,“状”字的第二笔等。
折,指各种折笔,包括竖钩在内。
这五种单笔画可以组合成25种笔对,我们按照笔对的第一笔可以把25种笔对分为五组,即横组,竖组,撇组,点组,折组。
笔对在键盘上的安排见图2。
在键盘图中先找到“横”(H)键作为横组的第一键安排横组,然后依顺时针方向依次安排竖组,撇组,点组,折组。每组中再按第二笔的“一丨丿丶乙”顺序从左到右排列五个位,这样便形成一套有规律,便于记忆的排列图。
第一种输入方式为声形三键码。这种编码主要供非专业人员使用。特点是简单易学,键位图见图3。
编码规则为:每个汉字编三码,即:声母+首笔对+末笔对
如:“华”-HSJ
这里所说的声母实际指汉语拼音码中第一码。包括真正的声母,以及零声母A.O.E和准声母Y.W.其中双声母ZH.CH.SH用V.I.U.代替。
如果编码不足三码,以M键补足,如:力-LIM。
如遇三画字或一画字,单笔凑不足笔对时,以单笔对应的双笔对代替,即“一”对应“--”;“丨”对应“丨丨”等,如“工”-GJH,“乙”-YPM。
当需要单独输入偏旁部首时,因偏旁部首没有声母,规定一律以O做为声母。如:艹-OJX,钅-OAN,丿-ODM
编码举例如下:
中 - UBJ 国 - GBQ 键 - JAO
工 - GJH 飞 - FIR 虍 - OZG
厂 - IKM 一 - YHM 忄 - OWR
简码:
声形三键码有共两级简码,按照汉字频率高低依次排列,最高频字为一级简码字,次高频字为二级简码字,其余为全码字。
当敲第一键时,提示行出现该键对应的一级简码字,如:R-人,D-的,U-是,等等。如要的就是该字则敲空格键,该字即跳上编辑位。此时如果敲字母之外的其它ASCII字符(如标点符号或数字等),则提示行中的汉字与ASCII字符都上编辑位。此时如果敲光标控制键或删除键等,则不予认可并报警。
敲第二键时,提示行出现二级简码字,如:BU-部,YS-用,等等。处理方法同上。
一.二级简码相加,占使用频率的67%,即三分之二,其余三分之一可用全码敲出。
全码及重码:
敲完三键提示行出现全码字(包括有简码的全码字,即简码与全码兼容)),如没有重码,敲空格键上编辑位;如有重码,重码第一字敲空格键上编辑位,其余字依数字序号从1到0选重,如此一屏最多可显示11个字。重码字排列顺序为:该组重码中无简码字中的最高频字为第一字,其它字按频率高低排列。当重码字在提示行显示不下时,后面加“[→]”符号,以示可翻页。
空码:
在输入前三键时如遇空码,不报警也不清除已输入码,只清除提示行汉字;在输入到第四键时(即词组码)如遇空码,报警并清除第四码,提示行只留前三码及对应汉字,以待修改。
词组:
如果继续往下敲到第四键时即为词组码,编码规则为:
两字词-第一字的前两码+第二字的前两码
如:科技-KAJN 团结-TBJP
三字词-三字声母+M
如:无线电-WXDM
四字词及四字以上的词取一,二,三,末字声母,
如:自力更生-ZLGU
新疆维吾尔自治区-XJWQ
如果词组有重码,处理方式基本同单字重码处理方式,唯一不同的是对重码第一词可以不做任何处理,直接输入下文该词即跳上编缉位置。
为满足某些用户节省内存开销,以便运行容量较大的软件的要求,词库可采用灵活挂接的方式,每次开机调用声韵笔对码文件后,由用户自行决定是否调用词组文件。如果不调用词组文件,则单字输入敲满三键时,如无重码,直接上编缉位,如有重码,处理方法基本同有词组方式,但对于重码第一字可不做任何处理,直接输入下文,该字即跳上编缉位。
重复输入:
当一个汉字(或词组)输入完成后,如果想重复输入该字词或输入提示行中其它字词时,可按ALT+序号键,如果该字词在提示行中第一位,则按ALT+空格键。
模糊键:
凡不清楚的码均可用“\”键来代替,用了模糊键后一二键内出现的是简码字,第三键是全码字,提示行中的重码字按区位码排列,每屏11个字。选中后,提示行出现该字的全码以供学习。词组码不能使用模糊键。
第二种输入方法为音形四键码:该码主要供专业录人员使用,特点是重码率低。键位图见图4,其中声母和韵母与键位的对应关系并非本发明的本质特征,所以图4中声母和韵母与键位的对应关系只是一种范例,实施者可不拘泥于图4,采用任何一种对应关系(包括今后国家制定的标准双拼方案)都是符合本发明的。
编码规则:每字全码为四键,即:声母+韵母+首笔对+末笔对
如:华-HBSJ
声母和韵母分别按键位图所示双拼码输入。
如:机-JIJG 学-XVRY
韵母中的八个常用韵母如:AN、ANG、EN、ENG、ONG、AO、AI、ING等与CCDOS拼音码中的压缩码一样,分别用J、H、F、G、S、K、L、Y来代替,便于已熟悉CCDOS拼音码的人员掌握。如:
中-VSBJ 央-YHBF
对于以“a,o,e”开头的汉字,如果原拼音码只有一个字母,为使双拼码补足两位,在声韵位连打两下该字母(无读音的“部首”连打两下OO),如:
啊-AABN 哦-OOBF
鹅-EEAY 钅-OOAN
如果原拼音码为两个字母,为输入方便,声韵位直接按原拼音码输入,如:
安-ANRA 恩-ENBR
埃-AIJF 欧-OUKF
而-ERKX 二-ERHM
原拼音码为三个字母的汉字只有三个:肮,昂,盎,声韵位输入AH(H即ang),如:
昂-AHBU 肮-AHGG
单笔以对应的双笔笔对代替:
如:兀-WUKP
如不够四码则补M键
卜-BUVM 乙-YIPM
简码:
设计原理及使用方法基本同声形三键码,共三级简码字,有3612字,占汉字使用频率的95%。
全码及重码:
敲够四键即为全码,如无重码直接上编辑位,如有重码处理方法同前,但对重码第一字可不做任何处理,直接输入下文该字即跳上编辑位。重码的排列以频率为序。
简码与全码兼容方式的选择:
为减少重码,提高输入效率,并方便操作者,音形四键码的简码与全码之间采用兼容与不兼容两种方式。兼容方式为有简码的字当敲到全码时仍然出现,初学者如果对简码不熟悉,“敲过了站”,敲完全码时仍能找到该字。而不兼容方式为:凡有简码的字全都取消全码,一个字只对应一码,任何字只要在敲前几键时出现,则敲到全码时该字就不再出现。如“班”字与“斑”字的四键全码都是BKSF,是一对重码,但“班”字属于三级简码字,在不兼容方式下只对应简码BKS,则全码BKSF只对应“斑”字,这样这一对重码就被“消灭”了。由于四键码的简码字占汉字使用频率的95%,所以采用不兼容方式能大幅度降低单字重码率。
这两种方式的选择可用CTRL+F1切换。系统默认不兼容方式,初学者可选用兼容方式,待常用字的简码记熟之后,可直接使用系统默认的不兼容方式。
空码处理同声形三键码。
词组
两字词为第一字前两码+第二字前两码
如:科技-KEJI 团结-TCJM
三字词为三字声母+X
如:无线电-WXDX
四字词及四字以上的词取一,二,三,末字声母,
如:自力更生-ZLGU
新疆维吾尔自治区-XJWQ
在音形四键码中当选择简码与全码不兼容方式时,在敲第四键时简码字不再出现,就不会与词组形成重码,由于简码字占汉字使用频率的95%,所以能大幅度降低单字与词组之间的重码率。
因为与词组形成重码的全码字几乎全都是生僻字,而词组的使用频率比较高,所以当词组与单字重码时,提示行排列顺序为词组在前,单字在后。
模糊键同声形三键码。
重复处理同声形三键码。
输入方式的切换:以上两种输入方式均用ALT+F10键进入和切换。进入顺序依次为声形三键码,音形四键码。在使用其中某一输入方式过程中,如果切换到区位码,拼音码,首尾码等内部码后,或进行纯中文等方式的切换后,又切换回来时,仍为原输入方式。
对输入方式的切换可采用选择控制方法,即:将声韵笔对码调入内存时,系统首先显示一个选择菜单:“1-三键 2-四键 其它-组合”,当用户选1后,ALT+F10键只对应声形三键码;当用户选2后,ALT+F10键只对应音形四键码;当用户选其它键后,ALT+F10键对应两种输入方法,用该键来回切换。这种选择控制方法可使各种需求的用户都得到方便。
自造词组功能:
在操作系统下调入造词程序,主菜单中有“造词”、“改词”、“删词”、“存盘退出”、不存盘退出“五项。选择“造词”项后,先用汉字输入二到十七个字之间的一个词组,如果该词在词库中已存在,屏幕将提示“另造它词”或“结束造词”供选择;如果该词确为新词,计算机将自动组合出词组码供操作者修正,因有些汉字是多音字,如“会计”由计算机自动组合出的音形四键词组码为HVJI,需由人工修正为KXJI。只要四键码改正之后,声形三键码也随之由计算机自动改正。这种方法也可用来自定义词组码,如“人民代表大会常务委员会”与“人民代表大会”形成重码RMDH,我们可以将“人民代表大会常务委员会”修改为“人大常会”四字的声母RDIH。
如果该词组在两种输入方式中有重码词或在音形四键码中有重码单字(指无简码的全码字),则屏幕上将逐一列出,由操作者选择“放弃”新词,或“认可”新词与其它词做为重码。词组重码每组中字符总长度(包括所有词组,单字,数字序号,冒号,空格等)不得超过提示行允许长度,如超过,计算机不予认可,并给出提示:操作者可以在本次造词完成之后,删去原词库中该重码组词条中之一,然后在该重码组中再补充新词。
该词输完之后,操作者可选择“继续造词”或“结束造词”。如果选择结束造词,计算机则将本次所造新词全部显示在屏幕上,操作者可选择“存盘退出”或“不存盘退出”回到主菜单。
在主菜单下选择“改词”即修改原词库中的词码(包括声形词码和音形词码)。
在主菜单下选择“删词”即删去原词库中的词条。
由于本发明不用拆分汉字,没有特例,规则简单,用户只要掌握图3和图4两张表就可以方便地输入全部汉字,因此本发明将图3和图4中所示的键盘图及所附使用规则设计为两张背面涂有不干胶的卡片,尺寸均为45mm×180mm,可贴在标准键盘上部空余处,从而形成一种方便实用的声韵笔对码汉字输入提示型键盘。本发明的全部思想均压缩在这两张卡片中。用户也可根据自己的方便将卡片贴在其它任何汉字信息处理设备的任何部位,从而形成声韵笔对码汉字信息处理提示型设备。
以上编码输入方法完全适用于繁体汉字,因本方法不涉及字根,所以不用另外编制繁体字根表,只是对首笔对和末笔对依据每个繁体汉字的首二笔和末二笔进行编码即可。
声韵笔对码的特点以及比已有技术的提高分析如下:
将声韵笔对码方案与本发明制定的易学性目标体系逐条对照,不难发现该方案在各方面均已基本达到目标,尤以声形三键码更为显著,一,编码所用的汉字属性(笔顺、声母、韵母)全都是中小学教学所必学,必掌握的,并与学校教学规范完全一致;二,这几种属性都有明确的,公认的规范标准可循,无任何模糊性、歧义性;三,规则简单,相互之间无矛盾,所有汉字全都使用同一规则编码,无任何特例;四,记忆量极少,由于二十五种笔对有规律的排列以及双拼韵母与CCDOS拼音压缩码的一致性,几乎不存在需要死记硬背的东西。总之,做为向全民族普及的目标方案,其优势非常明显。本发明通过试验,将声形三键码对小学生讲解五分钟就能完全学会,此后编码将几乎不会再碰到什么难题,剩下的只是熟练问题。以前有些部门也曾以行政方式向中小学推广过某些编码,如五笔字型等,但收效甚微。众所周知,小学阶段是集中学习拼音和笔画的阶段,小学生在这方面往往比成人更符合规范,本发明认为,如果有关部门将声韵笔对码向中小学推广,将可以从根本上解决汉字编码的普及问题。
在现有技术中有一些汉字编码方案也在不同程度上使用了“双笔顺”做为码元,如《中文信息》1990年第1期《第三代汉字键盘输入法二维三码》一文中介绍的张旗的《双笔码》(专利号为87100555)、栗兴民的《声形四笔》(86107235)、戴銮谟的《六笔声形》、崔巍的《双笔顺法》(专利号为85103321)等,以及已申请专利的胡金的《汉字笔顺数字码》(专利号92101943)、扬永莉的《笔顺汉字输入法》(专利号90105765)等,他们与本发明的不同在于:一,这些方案仍未脱离“字根”“部首”“部件”的传统观念。因为这些方案都需要提取全字的第二乃至第三“部件”或“字根”上的首两笔,所以仍然需要将汉字拆为字根,仍然要建立字根表,仍然要背字根,仍然要分析字型(如“左右、上下、包围、半包围、独体”等)因此也就无法避开“字根”观念带来的一切困难,而本发明则完全脱离字根和字型观念,只取每字的前两笔和末两笔做为码元,不用拆根,不用背字根表,不用分析字型,所以易学性高。其关键就在于本发明设计了其它方案都没有用过的“末笔对”,从而避开了字根拆分这个最大的难题;二,这些方案在双笔码元的键盘设计上,为了降低重码率,码元安排并不完全符合双笔的键位规则,因此需要操作者进行一定的强制记忆,而本发明则采用码元安排与键位规则完全一致的设计,这样可将记忆量减少到最低程度。至于因此而产生的重码率增大的问题,本发明创造了提示型简码以及简码与全码不兼容的方法来解决,既不增加编码难度,又能大幅度降低重码率。
首笔对的直观性是显而易见的,对末笔对的直观性经试验证明,只要连续学习几天汉字输入,对大部分汉字部件的末笔对就熟悉了,如“口”在字首时对应“丨乙”(B键),在字尾时对应“乙一”(Y键);“木”在字首时对应“一丨”(J键),在字尾时对应“丿丶”(F键),等等。实际上这只是个习惯问题。
声韵笔对码的全部编码体系(包括编码元件,码元分布,编码规则等)都是建立在规范化基础上的。音码和形码完全以《汉字属性字典》为依据,便于与学校的规范化教育衔接,便于向全社会推广。而有些方案则在笔形的处理上不够规范,如笔形码的笔形取码顺序为“先高后低、先左后右、先外后内”,造成与常用笔顺不一致的现象,如“中”字先取当中的一竖等;又比如“竖钩”本应属折笔,但五笔字型等方案则做为竖笔处理,有些汉字的末笔笔顺也与规范不同,因此不利于向学校和社会推广。
声韵笔对码只取首末各两笔,无论字形多么复杂中间部分都被忽略,这样就降低了字形分析难度,如“爨”字有30笔之多,但我们只须知道首笔对为“丿丨”,末笔对为“丿丶”就可以了。
从声形三键码向音形四键码过渡,只须加一个韵母即可,比五笔划向五笔型过渡要容易得多。
本发明所依据的汉字属性-笔顺具有广泛的群众基础。任何一个识字的人,可以不懂部首,也不懂字型,字根,角形等等,但一定懂笔画,而且90%以上的笔顺必然是正确的,否则就无法写字。所以任何一个人在没有接触声韵笔对码之前就已经有了90%以上的基础。而学习其它各种人造编码元件及其方案则必须从零开始。
综上所述,本发明从根本上解决了汉字编码的易学性问题。
其次,将方案与本发明制定的效率目标体系对比可以看出,本发明也同时解决了输入效率问题。
声韵笔对码只用26个字母键,对数字和标点符号都没有干扰,这是一种击键速度比较高的安排。
其键位分布完全符合指法规律,经频率统计,字母键各键位使用频率依纵排十列(每列包含上下三个键位)从左至右分别统计如下:第1列9.5%;第2列7.7%;第3列8.8%;第4列13.4%;第5列16.3%;第6列15.5%;第7列15.6%;第8列5.8%;第9列5.8%;第10列1.8%。
字母键的各键位使用频率依横排三行从上到下分别统计如下:上行34.6%;中行42.7%;下行22.8%。
由此可以看出,所有键位中间部分使用频率高,周围部分使用频率低,所以能充分发挥十指击键的最大潜力。
音形方案的词组是声韵双拼,一、二级简码也是声韵,因此在输入文字量中音码可占到90%-95%,形码只起离散重码的辅助作用,也就是说,对绝大多数汉字都不必思索它的字形,这样就能最大限度地减少心理转换过程,发挥速度潜力,常用韵母与CCDOS拼音码的压缩码一致也有利于计算机人员的掌握。
两种输入方式码长都没有超过四键,连分隔键包括在内(分隔键按一键计算)声形三键码平均码长为3.11键,音形四键码平均码长为3.15键,均少于五笔字型码3.19键的平均码长。另外,与五笔字型及其它方案的强记型简码不同,声韵笔对码的简码为提示型,每敲一键相应的简码字就出现在提示行,当出现所需字时就不用继续往下敲了,既能解除操作人员的记忆负担,又能充分发挥简码的作用,所以在实际输入比五笔型击键次数更少,速度比五笔型更快。据操作试验,录入人员几天之内就可基本掌握大部分常用字的简码,实际上置这些汉字的全码于无用,这样就便于本发明在四键码中采用简码与全码不兼容方式。
声韵笔对码中的声形三键码主要是供一般人使用的,对重码率的要求不很高,该方案重码处理率5%,还是可以接受的。如果使用全部词组,则重码处理率可降至1%-2%,一级汉字的首屏显示率为100%,二级汉字中需要翻屏的字不到汉字使用频率的0.002%,因此具有良好的输入效率。
音形四键码主要是供录入员使用的,对重码的要求比较高。降低重码率的方法可以有很多,一般方案大都采取打乱文字规律,使编码元件尽量离散,尽量均匀地分布在各键位上,加设各种特例,从而增加了编码难度。本发明不采取任何上述增加编码难度的方法,对音形四键码采用的是用不兼容型简码来制约重码的方法,可大幅度降低重码率而不增加编码难度,将重码率由1.1%降到0.2%。如果使用全部词组,重码率可降至0.05%,完全可以满足专业录入员的要求。
在声形方案中,词码为四键,不会与单字形成重码,四个字母可以有45万种组合方式,因此可容纳大量词组。在音形方案中,如使用不兼容型简码,全码字从六千多减少到三千多,与词组重码的机会大大减少,而且由于全码字基本上都是生僻字,所以方案允许词组与单字重码,因此同样可容纳大量词组。
综上所述,声形三键码与音形四键码都具有较高的易学性,都适于非专业人员使用;同时,这两种码都具有较高的效率,也都适于专业人员使用,这两种码并不象五笔型与五笔划那样有明显的专业与非专业的分工,只是各有侧重罢了。因此各类人员可根据本身基础和需要随意选用。
本发明提供了可贴在汉字信息处理设备上的编码提示卡片。在已有技术中五笔字型码采用在计算机每个字母键的键帽上贴纸片的方法,纸片上印制键位与字根的对应关系。本发明与其相比,不同和提高之点在于:首先,五笔字型码在键帽上贴纸片,随着用户频繁击键,用不干胶贴的纸片很快就会掉落,因此实用价值不高,而本发明在设备的空余处贴的卡片则不易掉落,可长期使用;其次,五笔字型码要求用户将印制好的整张卡片剪成几十个键帽大小的纸片,一一粘贴,比较麻烦,所以在实践中很少看到五笔字型码的用户贴键帽,而本发明则无此麻烦,使用方便,有较好的实用价值;再次,由于本发明的编码方法简单,规则少,整齐划一,没有特例,易于掌握,所以可以将所有主要编码规则与键盘图一并印制在卡片上,给用户的学习使用带来方便,而其它编码方法大多规则较多,特例较多,汉字拆分的困难较多,一般必须对照篇幅较大的学习教材进行周期较长的练习才能学会,所以难于将全部规则压缩印制为卡片贴在设备上。
本发明对繁简汉字都用同一套方法编码输入,与五笔字型等字根码要编制繁简两套字根表相比,用户的记忆负担要少得多。
附图
图1:汉字属性易学性指标综合评估表
图2:汉字笔对与键位对应关系表
图3:印有声形三键码码元与键位对应关系表及编码规则的编码提示卡片
图4:印有音形四键码码元与键位对应关系表及编码规则的编码提示卡片
Claims (8)
1、一种声韵笔对码汉字信息处理装置,利用26个字母键的键盘,其特征在于:以汉字中连续书写的两笔做为一个笔对,依据汉字中首笔对和末笔对在中文信息处理时的使用频率及键盘的指法规则,并兼顾使用者的记忆方便,将汉字中的25种笔对按第一笔分为五区,在每区中再按第二笔分为五位,有规律地排列在标准键盘的字母键上,即图2;
2、一种声韵笔对码汉字信息处理方法,其特征在于:
不依据汉字字型结构或字根、字元、部首、部件、角型等汉字属性,而完全依据汉字的声母、韵母及全字首末各两笔构成的首末笔对组合而成的编码体系;
第一种输入方法:声形输入,对每个汉字先输入汉语拼音的第一个字母,然后再输入该字的首笔对和末笔对;
第二种输入方法:音形输入,对每个汉字先输入汉语拼音的第一个字母,然后再输入该字的双拼韵母,最后输入该字的首笔对和末笔对;
3、按照权利要求1和2,对GB-2312(80)中全部6763个汉字进行编码,形成了声形三键、音形四键两套声韵笔对码码本,其中含有汉字全码,简码和通用词汇的编码;
4、按照权利要求1和2,对繁体汉字集的全部汉字进行编码,形成了声形三键、音形四键两套声韵笔对码码本,其中含有汉字全码,简码和通用词汇的编码;
5、按照权利要求1、2、3、4的方法,简码的处理方法是,在输入全码的过程中,简码字随着敲键在提示行逐级换字提示,以帮助使用者记忆简码,当出现所需字时,敲空格键使其上编辑位;
6、按照权利要求1、2、3、4的方法,在声韵笔对码的音形四键码中,简码与全码之间采用兼容和不兼容两种方式,兼容方式为:凡有简码的字也对应其全码,即一字对应两码;不兼容方式为:凡有简码的字一律不对应其全码,即所有的汉字均为一字一码;这两种方式由操作者自由切换选择,初学者可选择兼容方式,待常用字的简码记熟之后,选用不兼容方式,可降低单字重码率及单字和词组之间的重码率;
7、依照权利要求1、2、5、6,将两种输入方法中码元与键位对应的键盘图及各自的简要输入方法分别印制成两种背面有不干胶的卡片,即图3、图4,将卡片贴在计算机键盘的空余处或任何汉字信息处理装置的任何部位,从而形成一种声韵笔对码的提示性键盘或其它声韵笔对码汉字输入系统的提示性装置;
8、按照前述权利要求1-7中的任何一条,对汉字和中文词组进行编码的方法,可以用在字典,一切大,中,小微型中文信息处理电脑系统,汉字电传机,汉字电脑打字机,汉字终端机,电报,通讯系统中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 93103600 CN1093182A (zh) | 1993-03-31 | 1993-03-31 | 声韵笔对码汉字输入方法及键盘 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 93103600 CN1093182A (zh) | 1993-03-31 | 1993-03-31 | 声韵笔对码汉字输入方法及键盘 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1093182A true CN1093182A (zh) | 1994-10-05 |
Family
ID=4984691
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 93103600 Pending CN1093182A (zh) | 1993-03-31 | 1993-03-31 | 声韵笔对码汉字输入方法及键盘 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1093182A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103186242A (zh) * | 2011-12-28 | 2013-07-03 | 武汉科技大学 | 中华键盘 |
CN103246359A (zh) * | 2012-02-14 | 2013-08-14 | 武汉科技大学 | 一种既方便拼音又方便形码输入的计算机键盘 |
CN106227363A (zh) * | 2016-07-28 | 2016-12-14 | 周言 | 拼音基础上的精确汉字编码和键盘输入方法 |
-
1993
- 1993-03-31 CN CN 93103600 patent/CN1093182A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103186242A (zh) * | 2011-12-28 | 2013-07-03 | 武汉科技大学 | 中华键盘 |
CN103186242B (zh) * | 2011-12-28 | 2016-03-16 | 武汉科技大学 | 中华键盘 |
CN103246359A (zh) * | 2012-02-14 | 2013-08-14 | 武汉科技大学 | 一种既方便拼音又方便形码输入的计算机键盘 |
CN106227363A (zh) * | 2016-07-28 | 2016-12-14 | 周言 | 拼音基础上的精确汉字编码和键盘输入方法 |
CN106227363B (zh) * | 2016-07-28 | 2019-07-23 | 周言 | 拼音基础上的精确汉字编码和键盘输入方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1015218B (zh) | 字根编码输入法及其设备 | |
CN1023916C (zh) | 简繁五笔字根汉字输入系统 | |
CN1342276A (zh) | 键盘输入设备、方法和系统 | |
CN101038508A (zh) | Gb拼音输入法 | |
WO2005078604A1 (ja) | 文字表示方法 | |
CN1093182A (zh) | 声韵笔对码汉字输入方法及键盘 | |
CN101587381B (zh) | 音形汉字无重码输入法 | |
CN1150272A (zh) | 全拼双拼规范码汉字输入方法 | |
CN1028680C (zh) | 汉字全息码 | |
CN1020052C (zh) | 形元汉字信息处理方法及其键盘 | |
CN1033540C (zh) | 简易音形码汉字输入法 | |
CN85100087A (zh) | 《中文声数编码》方案及其实现方法 | |
CN1108551C (zh) | 优化赋音形码计算机汉字输入方法 | |
CN1031812C (zh) | 赋音形码汉字输入系统 | |
CN1052200A (zh) | 音形义字词兼容编码系列及键盘 | |
CN1058342C (zh) | 汉字编码的计算机输入方法 | |
CN1080748A (zh) | 简繁体声形特征码汉字输入法及其键盘 | |
CN1150441C (zh) | 字形笔顺码汉字输入法及其键盘 | |
CN1374577A (zh) | 英文字母键盘和数字键盘通用汉字电脑输入法及其键盘 | |
CN1162766C (zh) | 一种汉字音形编码输入方法 | |
CN1337616A (zh) | 快易码汉字输入法及键盘 | |
CN1066333A (zh) | 计算机中文数字化输入方法及简便灵巧键盘 | |
CN1317631C (zh) | 整体拼形汉字输入法 | |
CN1108776A (zh) | 乾坤音轨汉字输入法(QKy) | |
CN1055434A (zh) | 字符的图元输入方法及其键盘 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |