CN1080746A - 双拼词组选择编码输入法及其键盘 - Google Patents

双拼词组选择编码输入法及其键盘 Download PDF

Info

Publication number
CN1080746A
CN1080746A CN 92105011 CN92105011A CN1080746A CN 1080746 A CN1080746 A CN 1080746A CN 92105011 CN92105011 CN 92105011 CN 92105011 A CN92105011 A CN 92105011A CN 1080746 A CN1080746 A CN 1080746A
Authority
CN
China
Prior art keywords
input
phrase
word
chinese
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 92105011
Other languages
English (en)
Inventor
杨银良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN 92105011 priority Critical patent/CN1080746A/zh
Publication of CN1080746A publication Critical patent/CN1080746A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

双拼词组选择编码输入法及其键盘以双拼为基 础,词组选择为中心,结合汉字的组词能力特性,把汉 字分为无词组字、词组字、两字词组、多字词组四种不 同的方式进行编码输入;同时,亦可利用普通双拼法 对正常单汉字进行编码输入,从而达到单字和词组兼 容的汉字编码输入方法。本发明简单易学,重码率小 于3%,输入效率高,每分钟可输入150—180个汉 字,可进行听打和盲打,对普通人员和专业人员都非 常适用,可广泛用于各种中文信息处理设备中。

Description

本发明属于一种汉字编码输入方法及其所用键盘。
随着电子计算机、中文处理机、打字机、电传机等中文信息处理设备在我国的广泛应用,人们越来越感到一个极为棘手的问题,那就是汉字的输入问题,被称为中文信息处理的瓶颈。而如何利用计算机等的西文通用键盘,解决数以万计的汉字、词汇及其它纯图形文字的编码输入问题,便成为我国即将发生的信息革命的一个划时代贡献。
自从一九七八年以来,国内外先后出现了上千种的汉字编码输入方法。它们各自从字音、字形、音形结合及词组、字串、联想等方式对汉字进行编码输入,并且有一些方法已取得了一定的成果,如从字形入手的五笔字型法、五十字元法及从字音入手的紧缩拼音法、双拼法、四码拼音词组法等。然而在实际应用中,从字形或音形结合的编码方法一般都不能避免编码规则复杂难学、输入难度大、出错率高、有重码、输入速度慢的缺点,并且有的还需要重新设计专用键盘,实践证明这条路行不通。而如何利用汉字的语音特性,制定一种同输入西文那样方便、高效的编码输入方法,则是人们追求的最终目标。同时,也是汉字拼音化的一种极佳方式,即通过计算机等对编码的输入,而得到汉字的音形分离方式。
目前,国内外从拼音入手的汉字编码输入方法有近百种,其中主要有紧缩拼音法、纯拼音法、双拼法、四码拼音词组法等,尤其是有关双拼和拼音词组方面的编码方法具有编码短、重码率低、输入速率快、字词兼容等优点。例如四码拼音词组编码输入法(见专利公开说明书88107832.8),利用汉语语音的声韵特性及词组重码率低的特点,把汉字输入中的词组整体输入,字词兼容,减少了输入中的重码现象,加快了输入速度。另外,还有利用联想词作为区分码的汉字拼音联想编码法(见专利公开说明书CN    85100094A)等都对汉字的拼音化输入作出了贡献。然而这些方法又都有一定的局限,没有从根本上达到避免重码、简便高效地输入汉字,且稳定性亦不高,难以真正实现听打、盲打等目标。
本发明的目的在于针对上述问题,从汉语单字和词组的语音及汉字的组词特性的深层次上,寻求一种既简单易学,又高速高效、字词兼容的拼音编码输入方法及中西兼容的输入键盘。
双拼词组选择编码输入法是一种以双拼为基础,即根据汉语语音的声韵特性,单个汉字的编码由拼成其的声母代码和韵母代码组成,词组的编码由组成其的汉字的编码组合而成;词组选择为中心,即根据汉语词组语音的不重复特性,也就是词组语音编码重码率极低的特点来选择需要的汉字,输入中以词组输入为主,单个汉字由输入包容其的词组后删除一字而得,结合汉字的组词能力特性,即根据汉字的组词能力大小,把输入的汉字划分为不能组成词组的无词组字、能组成词组的词组字、由两个汉字组成的两字词组、由三个或三个以上汉字组成多字词组;实际输入中,以无词组字、词组字、两字词组、多字词组几种不同的方式进行编码输入;同时,亦可利用普通双拼法对正常单汉字进行编码输入;从而达到高度的单字和词组兼容的汉字编码输入方法。
本发明的具体编码输入实施方案如下:
1.两个字母,正常单汉字输入。(,)键翻前页,(.)键翻后页,数字键选择。
2.两个字母+空格键,无词组字输入。
3.四个字母+([)/(])键,词组字输入。([)删除词组的前一个汉字,(])删除词组的后一个汉字,而得到所需的汉字。
4.四个字母,两字词组输入。
5.四个字母+(,)键,多字词组输入。
6.按ALT+(.)键,将自动重输入一汉字或词组。
7.对于26个高频汉字,采用相应的字母键+空格键输入。
方案说明:a.上述两个字母为其能够拼成一个汉字的声母代码和韵母代码,四个字母对于两字词组为拼成其的两个汉字的四个代码,对于多字词组为其前两个汉字的四个代码。b.本方案中无特殊表明词组为两字词组,多字词组为三个或三个以上汉字组成的词组,无词组字为不能组成词组的少数汉字。c.上述某键+某键除ALT+(.)为复合键外,都为连续输入。d.常用的字、词组优选输入。e.对于新华字典中的所有音字本方案皆可输入。
本发明的编码输入根据是:a.汉字的组词能力极大。据统计表明,在现代常用的汉字中除了一些虚词、代词、助动词、方位词外,大约有90%以上的汉字都能组成词组。b.汉语词组的语音无重复性,从而达到唯一的汉字选择输入。据统计表明,常用词组中仅有不到1%的词组有除四声外声韵完全相同的重码词组。c.无词组汉字仅占国标一、二级汉字的5%-15%,且几乎都是使用频率很高的助词、系词、介词、代词、副词等,对之采取本方案高频汉字方式和无词组字输入方式可尽快输入。d.汉语词组的连续性和丰富性。从而更发挥了双拼词组选择编码法的优越性,达到连续、便捷地输入的目的。
同其它编码方案相比,本发明的具有以下优点:
1.简单易学,能很快掌握。
双拼词组选择编码输入法是根据汉语中单字和词组的语音特点,以双拼为编码基础,词组选择为中心,具有规则简单,易编易学,极易掌握的特点。
2.汉字平均输入码长短,可高速、高效地输入。
在实际汉字输入中,根据统计表明,汉语词组一般占语句的65-85%,而单字仅占15-35%,应用本输入法,两字词组需打四个字符,多字词组需打五个字符,无词组字需打三个或四个字符,词组字需打五个字符,常用的高频汉字需两个字符,所以,本输入方案中每个汉字一般需打2-5个字符,平均在2.7个字符左右,平均每分钟可输入150-180个汉字。
3.克服了汉字的重码现象。
由于汉语词组的重音率几乎为零,本发明采用词组进行选择和确定每一个汉字,克服了其它汉字输入法的重码和不易选择现象。同时,本发明对于不同的汉字据其属性有不同方式的编码,更加减少了重码的可能性。在实际应用中,对于较高的汉语水平者,平均重码率在3%以下。
4.出错率极小,可进行听打或盲打。
由于双拼词组选择输入法克服了汉字的重码现象,每个汉字或词组都有唯一的不同方式的编码确定,而且编码简单易记,望文生音,音到码出,这样便在汉字和编码间建立起简单且牢固的一一对应关系,出错率极小,可进行听打或盲打。
5.将汉字划分为无词组字、词组字、两字词组、多字词组及高频汉字几种不同的输入方式是本发明的一个独特的特点。
根据汉语拼音方案新华字典1987年版,共有声母21个,同时为了输入方便,把“y”和“w”也作为声母处理,其代码如(图1);共有韵母除(ueng)外34个,其代码和(图2);这样共有声母代码23个,韵母代码26个,有498个语音容量,足以容纳新华字典中的415个字音;同时声母代码还可扩充到26个,即本方案最终可有676个语音容量。
根据本编码输入方案,对新华字典中的所有汉字和语音进行编排(见图6和图7),需对以下音字进行特殊处理:
1.对于汉字“咯”,可在相应的代码“lo”中反映输入。
2.韵母音字处理:
对于o,e,ai,ao,an,ou,en,ang,eng,用x+字母代码输入。
对于a,用a+空格键作为高频汉字输入。
对于ei,用e+i输入。
3.对于不常用音字en,e,m,n,ng,nm,nng,处理如下:
er(二),用e+r输入。
ê(诶),用e+e输入。
m(呒),用m+m输入。
n(嗯),用n+n输入。
ng(嗯),在n+g中输入。
nm(),在n+m中输入。
eng(哼),在n+g中输入。
4.对于国标一、二级汉字字库中其它非汉字符号和各类语言文字,进行以下处理:
v+t,特殊符号。
v+s,数字符号。
v+c,一般符号、字母。
v+n,日文平假名。
v+p,日文片假名。
v+l,罗马字母。
v+e,俄文字母。
v+y,拼音字母。
v+b,偏旁部首。
v+z,中文制表字符。
为了更方便迅速地输入汉字,本发明根据汉字的使用频度、词组能力(一些常用的无词组字,主要是一些介词、助词、副词、连词、叹词、量词、代词等)、编码的复杂性(即不易编码输入的汉字,如韵母音汉字,不常用音字等)和需其它特殊处理的汉字在国标一二级汉字中选择了26个高频汉字优选输入(见图3)。
并且同时,在高频汉字表中,高频汉字后还跟有一些与其同类或相近、相反的有关联的字,且大多亦是常用字,记住它们的顺序,在实际应用中利用数字键可很快的选择输入,事实上起到了扩展高频汉字的作用。
本发明在实际输入过程中,除正常单汉字输入必须用数字键选择外,如没有重码,则自动输入并显示于编缉光标处;如有重码,常用的单字或词组优先输入并显示于编缉光标处,若需要则可继续输入下文,否则用相同序号的数字键选择,系统自动替换并显示之。
本发明除正常单汉字输入方式外,重码字或词组的现象极少,即使有也不超过2-3个,一般仅一个,因此很容易选择,不影响输入速度。
本发明的窗口提示为除常用优先字或词组外,重码按使用频度大小顺序的排列;即有一个重码,窗口为“1.X”,以此类推。
本发明在使用键盘输入汉字过程中,可出现两种报警信号;长声表示输入码无单字或词组与之对应,即空码,同时光标不动;短声表示输入码是重码,此时可按上述重码处理方法处理。
由于本发明中每一个汉字都可能有几种不同的输入方式,所以在使用过程中进行一些容错处理,如在有些无词组字中仍设置一些易被认为是无词组字的词组字或增加一些并非词组却经常一起使用“词组”等,从而增加汉字的输入方式,减少空码的发生,降低出错率。
本发明在实际应用中,还可根据需要用普通双拼法进行正常的单汉字输入作为补充,且不用切换,使单字和词组的输入高度兼容。
在本方案实施中,除给每一汉字字音声韵代码内码外,建立每一词组的内码。在输入过程中,当输入两个字母时,系统找到此读音的汉字,并显示到提示窗口,供选择输入,这时如敲数字键则输入,而如继续敲字母键到四个字母,则系统继续找读音为输入语音的词组,显示到屏幕编缉处,如需则可继续输入或按“.”输入多字词组、按“[”或“]”输入词组字,否则选择后继续。如输入“ci”时,系统根据其内码,找出“疵茨磁雌辞慈瓷词此刺”等,这时如敲入的是数字键,则据之输入汉字;如继续敲入“zu”后,则系统根据词组内码找出词组“词组”进行输入。
本发明为了更加方便用户的使用和增加适用性,增加了以下用户功能(ALT+F8):
1.建立用户造字功能。
即用户根据所需,可造出其常用和专用的字或图形等,并且用户可利用本方案的剩余空间,指定编码并输入。
2.建立用户造词组功能。
即用户可根据所需,造出其专用的或经常使用的词组,以使用户更加便捷的输入词组和单字。
3.建立用户所需的高频汉字功能。
即用户可根据所需,改变或重设高频汉字,使用户的输入更加方便与迅速。
4.建立用户改变优选字或词组功能。
即用户对有重码的字、词组和高频汉字等,可改变其顺序(包括优先权)及增、删,从而大大地扩充了用户的权利。
此外,本发明为了更加地方便用户,还设置了简、繁体汉字转换功能(CTRL+F8)。
为了更加形象地说明本发明,特举以下实例说明之:
实例1.正常的单汉字输入及选择。
本方案在正常的单字输入时,常有重码现象出现。如输入“双”时,当您打入“um”后,屏幕窗口便出现“1.霜2.双3.爽4.孀”供您选择,这时您可再打入数字键“2”,“双”字便输入到屏幕编缉处。同时,如您选择第一个“霜”字,您便可打“1”,“霜”字便输入到屏幕编缉处。与此同时,您也可利用词组选择方式进行输入。
实例2.无词组字的输入及选择。
对于无词组字,本方案采取两个拼音代码+空格进行输入的办法。如您输入“钠”字,在输入“na+_”后,常用字“钠”便出现在屏幕编缉处;同时如果要输入的是其它重码字,便可敲入相应的数字键选择之。
实例3.词组字的输入及选择。
词组字的输入本方案采取四个代码+“[“或”]”进行选择输入,四个代码即包容所要输入的词组字的词组代码。如果要输入的词组字是词组的前一个字,则再敲入“]”删除后一个字;如果要输入的词组字是词组的后一个字,则再敲入“[”删除前一个字;而得到所需的汉字。
如您输入“拼”字,您就可利用“拼”和“音”组成的词组“拼音”,先敲入“pdyd”,再敲入“]”即可得到您所需的“拼”字。同时,如您输入“音”字,您亦可利用词组“拼音”,敲入“pdyd”后,再敲入“[”即可得到“音”字。与此同时,您还可利用其它词组如“拼凑,拼命,拼写,拼死”等进行选择输入。
实例4.两字词组的输入及选择。
两字词组的输入本方案采取四个代码的输入方法,四个代码即所要输入两字词组的双拼代码。如输入词组“方案”时,在敲入“fhxj”后,屏幕编缉处便出现“方案”二字。
实例5.多字词组的输入及选择。
多字词组的输入本方案采取四个代码+“,”的输入方法。四个代码为所要输入词组的开头二字的双拼代码。如输入多字词组“华盛顿”时,您在敲入“houg”后,再敲入“.”键,屏幕便出现“华盛顿”三个字。
实例6.高频汉字的输入。
高频汉字的输入本方案采取高频代码键+空格键的输入方法。如输入“能”字,当您输入字符键“g”后,再敲一下空格键屏幕编缉处便出现“能”字。另外,对于扩展高频汉字的输入可在敲入高频代码键+空格键后,再敲入相应的数字键选择输入之。
实例7.汉字的连续输入及语句输入。
在汉语输入过程中,常有各种字、词及符号出现,因此能不能连续输入便成为约束汉语输入速度的一个因素。本方案中,字编码严格采用双个字符区分之,词组编码采用四个字符区分之,因此可连续输入。同时,本方案中的高频汉字和特殊处理音字也给连续输入带来很大方便。
如您要输入这样一句话:“双拼词组选择方案解决了汉字的计算机输入问题,实在太棒了!”,您便可这样输入“wuum[(双)pdyd](拼)clzu(词组)xtze(选择)fnxj(方案)jxjz(解决)k_(了)hjzi(汉字)d_(的)jiut>(计算机)uuru(输入)wfti(问题),(.)uixp](实)1_(在)tltl(太)mubh[(棒)k_(了)!(!)”,共68个字符,输入汉字26个汉字和两个标点符号,平均每个汉字2,54个字符。
本发明为了有利于用户更快、更易地掌握和应用,还增加了几种辅助输入方案,有区位码输入法(ALT+F1)、纯拼音输入法(ALT+F4)、五笔字型输入法(ALT+F5)、五划输入法(ALT+F7)。其中尤其是纯拼音输入法对码长不足6个的加入一空格键作为结束,紧缩拼音汉字输入法对码长不足3个的加入一空格键作为结束,从而使它们也能够利用词组进行汉字的输入和选择,具有一部分词组选择输入特性。在实际应用中,可由纯拼音输入法入手,逐渐熟练。然后再练习紧缩拼音输入方案,等紧缩拼音输入方案熟练以后。再练习双拼词组选择输入方案。这样循序渐进,从而达到熟能生巧、运用自如地输入汉字。同时,对于一些不能读出音或疑难字,可利用五笔字型法或五划法从字形结构上进行编码输入,从而达到顺利地输入汉字。
本发明在输入中,要求能读出输入字的正确普通话读音,并不要求有底稿,能听打或盲打,甚可与速记媲美。
本发明的键盘设计是根据拼音代码在生产时将代码刻在相应的键帽上或以印有代码的标签胶粘在键帽上而成(见图4),其特点是同通用英文键盘相互兼容。
本方案复合键安排如图5。
附图说明:
图1:声母代码表
图2:韵母代码表
图3:高频汉字代码表
图4:双拼词组选择编码输入法键盘图
图5:复合键安排表
图6:双拼编码方案表一
图7:双拼编码方案表二

Claims (11)

1、一种汉字编码输入方法,其特征在于:它是从汉语单字和词组的语音特性及汉字的组词特性的深层次上,以双拼为基础,词组选择为中心,结合汉字的组词能力特性,把汉字分为无词组字、词组字、两字词组、多字词组四种不同的方式进行编码输入。
2、根据权利要求1所述的方法,其特征在于:它还可以利用普通双拼法对正常单汉字进行编码输入,且不用切换。
3、根据权利要求1或2所述的方法,其特征在于:它还根据汉字的使用频度、组词能力、编码的复杂性和需特殊处理的汉字中,优选出26个高频汉字优先输入;并且它还有一些相联系的扩展高频汉字。
4、根据权利要求1或2或3所述的方法,其特征在于:
a.正常的单汉字的编码输入规则同普通双拼法一致,输入其声韵代码后,“,”键翻前页,“.”翻后页,相同序号的数字键选择之;
b.无词组字的编码输入规则为输入其声韵代码后,再输入一空格键;
c.词组字的编码输入规则为输入包容其的词组代码后,如果要输入的词组字是词组的前一个字再输入“]”键,如果是词组的后一个字再敲入“[”键;
d.两字词组的编码输入规则为输入其词组代码;
e.多字词组的编码输入规则为输入其前两字的声韵代码后,再输入“,”键;
f.高频汉字的编码输入规则为输入代码键后,再输入一空格键;
g.扩展高频汉字的编码输入规则为输入代码键+空格键后,再输入同窗口提示相同序号的数字键。
5、根据权利要求1或4所述的方法,其特征在于:当输入码为无单字或词组与之对应的空码时,以长声报警提示;当输入码是重码时,以短声报警提示。
6、根据权利要求1或5所述的方法,其特征在于:其重码处理方式为常用的单字或词组优先显示于编缉光标处,若需要可继续输入下文,否则用相同序号的数字键选择,系统自动替换并显示之。
7、根据权利要求1或6所述的方法,其特征在于:其窗口提示为除常用优先字或词组外,重码按使用频度大小顺序的排列。
8、根据权利要求1-7所述的任意一方法,其特征在于:其在输入过程中,可随时进行简、繁体汉字转换;在简体汉字状态下输入汉字为简体,在繁体汉字状态下输入汉字为繁体。
9、一种汉字输入键盘,其特征在于:它是根据双拼词组选择编码输入法的汉字声韵代码方案,在通用键盘生产时将代码刻在键帽上的而成键盘。
10、一种汉字输入键盘,其特征在于:它是根据双拼词组选择编码输入法的汉字声韵代码方案,将代码印刷在标签并胶粘在通用键盘键帽上的而成的键盘。
11、根据权利要求1-10所述的任意一条,其特征在于:它可用于一切大、中、小计算机、中文处理机、打字机、电传机、桌面系统、通讯系统等中文信息处理设备中。
CN 92105011 1992-06-25 1992-06-25 双拼词组选择编码输入法及其键盘 Pending CN1080746A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 92105011 CN1080746A (zh) 1992-06-25 1992-06-25 双拼词组选择编码输入法及其键盘

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 92105011 CN1080746A (zh) 1992-06-25 1992-06-25 双拼词组选择编码输入法及其键盘

Publications (1)

Publication Number Publication Date
CN1080746A true CN1080746A (zh) 1994-01-12

Family

ID=4941136

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 92105011 Pending CN1080746A (zh) 1992-06-25 1992-06-25 双拼词组选择编码输入法及其键盘

Country Status (1)

Country Link
CN (1) CN1080746A (zh)

Similar Documents

Publication Publication Date Title
CN1262473A (zh) 小型数字键盘拼音汉字输入方法
CN1645356A (zh) 多维汉语学习系统
CN1080746A (zh) 双拼词组选择编码输入法及其键盘
CN1054219C (zh) 一种汉语拼音输入法及其键盘
CN1035083C (zh) 面向词的中文文字处理输入装置
WO2011035705A1 (zh) 一种数序码元键盘及其信息输入方法
CN1018205B (zh) 计算机中文声数编码输入技术
CN1475896A (zh) 一种汉语拼音简捷全拼输入法及其键盘
CN1052200A (zh) 音形义字词兼容编码系列及键盘
CN1106146A (zh) 电脑汉字声韵调编码输入法及其键盘
CN1034245C (zh) 缅文字型智能四码输入系统
CN86102418A (zh) 汉语音节处理机及汉语音节处理方法
CN1138197C (zh) 十笔字型形音码输入方法
CN1293452C (zh) 一种见字即识形码也可使用音码的汉字键盘输入方法
CN1025540C (zh) 汉字拼音编码计算机输入的一种键盘方案
CN1026271C (zh) 智能拼音汉字输入系统
CN1023843C (zh) 双位中文电脑键盘的中文输入技术
CN1088210C (zh) 六区五位汉语音节和汉字键盘输入方法
CN1325051A (zh) 计算机汉语全音输入法
CN1138714A (zh) 基于词组的汉字输入方法
CN1081773A (zh) “多声递推联想”汉语词字编码
CN1037043A (zh) 计算机汉字输入方法
CN1095502A (zh) 字元谱汉字编码法(炎黄码)及其键盘
CN1068203A (zh) 音形义字词兼容编码系统与键盘
CN1074296A (zh) 一种汉语声韵音位汉字编码方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C01 Deemed withdrawal of patent application (patent law 1993)
WD01 Invention patent application deemed withdrawn after publication