CN1120408C - 一种计算机结构声读汉字输入方法 - Google Patents
一种计算机结构声读汉字输入方法 Download PDFInfo
- Publication number
- CN1120408C CN1120408C CN 99105551 CN99105551A CN1120408C CN 1120408 C CN1120408 C CN 1120408C CN 99105551 CN99105551 CN 99105551 CN 99105551 A CN99105551 A CN 99105551A CN 1120408 C CN1120408 C CN 1120408C
- Authority
- CN
- China
- Prior art keywords
- sound
- read
- word
- sign indicating
- indicating number
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Abstract
本发明涉及一种计算机输入方法,是一种结构声读汉字输入方法,从汉字连续笔划在汉字中所形成的最大整体的角度出发,是一种以方块汉字对方块汉字编码的方法。该方法以四位声读码输入,重码率17%左右,几乎全为两字相重码,以五位声读码输入,重码率仅为5%左右,仅有一百多个汉字涉及从两字中选择的问题。
Description
技术领域
本发明涉及一种计算机的输入方法,是一种汉字的计算机输入方法。
背景技术
在现有的计算机汉字输入方法中,百家争鸣,纷繁复杂,可分为五类,(1)分类序号类(如区位码),(2)拼音类(如全拼、双拼等),(3)笔画类(如笔顺码),(4)字根部件类(如五笔字型及声声输入法等),(5)想像归属类(字元码)。分类序号类无重码但无法记忆,拼音笔划类易学,但码位长,字根部件类重码较少,但难学难记又易忘,如声声输入法中的诸多部件为常人所不知,既非汉字又非常用,却要记忆并声读,增加了许多汉字文化以外的多余的额外负担;想象归属类易产生想象偏差等。这些输入方法都不符合汉字本身的文化、不符合汉字的教学和识字的习惯。偏离了汉字文化自身的规律和内容的重心,故而显现出以上方法的不足。
发明内容
本发明的目的是提供一种与识字教育相互支持,对应于汉字内部规律和汉字文化的易学、易记、易用、通俗化和大众化,特别是重码率极低,输入便捷的计算机汉字输入方法。
本发明的方法是一种计算机结构声读汉字的输入方法,汉字输入的声、韵母键与对应于计算机的键盘上的英文字母键,其特点是:按书写笔划顺序,连续笔划形成方块汉字等整体,以其最大整体的原则声读并取读音第一字母等作为对应码位的声读码。声读码可以选用四位码、也可以采用五位码,或多位码的形式进行汉字输入。
最大整体主要为汉字整体的偏旁整体或汉字笔划,以其为声读对象,具体定义如下:
1、成字整体(即汉字整体)的范畴可定义在国标一级、二级汉字的范围内;
2、偏旁整体内容为常见熟知偏旁,此以下内容以外的偏旁部首编码时不以偏旁整体论,(括号内的字为其读音汉字):
廴(建)辶(建)钅(金)
(卷)丬(将)爿(将)
巛(拐)ㄍ(拐)凵(匡)冂(匡)(虎)攵(文)
夂(文)犭(犬)饣(食)纟(丝)礻(示)四(四)
扌(手)
(足)(竹)彡(撇)疒(病)ㄅ(包)
廾(弄)癶(登)
(登)勹(刀)刂(刀)ン(点)
シ(点)灬(点)忄(心)
3、汉字笔划声读读音定义如下:(括号内为其读音):
(1)、单一笔划:
(2)单折的笔划:
(3)弯形或两折以上的笔划:
(弯)
(弯)弓(弯)ㄋ(弯)
(弯)ㄅ(弯)
(弯)ㄣ(弯)
所述的四位码:
四位声读码依次对汉字的组成整体,既最大整体进行声读,取其读音的第一位字母作为声读码,最后形成四位有序的英文字母(亦即拼音字母),其组合具体如下:
1>、第一位码
即为该汉字读音第一字母;
对于字库中无读音的整体第一位码规定为“V”;
2>、第二位码
遵循以下优先顺序,即:
首先,按书写顺序,第一最大成字整体读音的第一字母,此整体相对独立,与其它部分无穿插;
其次,按书写顺序,第一最大偏旁整体读音的第一字母,此整体相对独立,与其它部分无穿插;
最后,按书写顺序,第一笔划读音第一字母;
3>、第三位码
遵循以下优先顺序,即:
首先,按书写顺序,其余部分中第一最大成字整体读音的第一字母,此整体与其它部分相对独立,无穿插;
其次,按书写顺序,其余部分中第一最大偏旁整体读音的第一字母,此整体与其它部分相对独立,无穿插;
最后,按书写顺序,其余部分中第一笔划读音第一字母;
4>、第四位码
遵循以下优先顺序,即;
首先,按书写顺序,其余部分(前面声读整体以外的部分)第一最大成字整体读音的第一字母,与其它部分相对独立,无穿插;
其次,按书写顺序,其余部分第一最大偏旁整体读音的第一个字母与其它部分相对独立,无穿插;
再次,按书写顺序,最后几笔最大成字整体处于已取过码的整体读音的第一字母,与其它部分相对独立,无穿插;
最后,按书写顺序,最后一笔读音的第一个字母;
所述的五位声读码:
即在四位声读码的基础上再追加编制第五位声读码;具体规则如下:
它是一个严格的优先顺序,适用于各种汉字的不同情形;
首先,前第一声读整体中第一成字最大整体声读并编码,与第四位码的声读整体不能重复;
其次,前第二声读整体中第一成字最大整体声读并编码,与第四位码的声读整体不能重复;
再次,对前第一声读整体中第一最大偏旁整体声读并编码;
最后,对前第二声读整体中第一最大偏旁整体声读并编码;
当然,当无有以上整体可声读时,则原四位声读码即同时为该字五位声读码;
它还包括除声读码外还另有的全码或次全码;
1>、次全码:对汉字结构中按以上编码方法,整体读尽,形成该字的次全码;
2>、全码:对声读码、次全码中各位声读码对应整体进行声读,各自形成四位码,并按声读码中对应位置顺次排列,形成全码。
它还包括双字词和各类多字词的输入编码,并用以下符号表示:
1>I,II,III,......表示多字词中第一字,第二字,第三字,......;
2>1,2,3......作为角标,表示读位字的第一位,第二位,第三位......声读码;如“II2”表示词中第二字的第二位结构声读码;于是:双字词的编码:I1II2II2II3
一级简码:I1II1
二级简码:I1II1I2II2三字词的编码:I1II1III1II2III2
简码:I1II1III1四字词的编码:I1II1III1IV1IV2
简码:I1II1III1IV1
五字词的编码:I1II1III1IV1V1
六字词及六字以上词的编码:I1II1III1IV1V1VI1。
它还包括码位通配符“]”右方括号,用作查询和替代未知部分的声读码。
它还包括字数的识别位,设在编码的第六位上,以数字表示。声读字或词、或者手敲键盘入字词的一级简码后,按空格键由程序完成该位数字的编制和输入,六字及更多字词则无有此数字识别位。
本发明的方法是以汉字对应汉字编码的方法,易学、易记、易用,实现了大众化和通俗化,能够与汉字文化、汉字教学相结合,在汉字教育中边识字边可在计算机上学习汉字输入。重码率极低,四位声读码重码率为17%,大多数为两字相重码;五位声读码重码率仅为5%,仅有一百多个二级汉字涉及从两字中选择的问题,它大大地提高了汉字的计算机输入速度,是计算机在中国普及应用较好的输入方法之一。在该方法及理论下的次全码和全码,则更能反映出汉字本质和全貌。其中全码能在绝对意义上消灭了重码,其编码犹如录音带一样详细全面地反映出汉字笔划在该汉字中所能形成的各种信息,这对汉字的研究也将起到积极的作用。
具体实施方式
本发明一种计算机结构声读汉字的输入方法,在使用方法时,可以采用四位声读码编码输入,也可以采用五位声读码编码输入。
1、四位码读码的编制方法:
四位声读码依次对汉字的组成整体(最大整体)进行声读,取其读音的第一位字母作为声读码,最后形成四位有序的英文字母(亦即拼音字母),其组合具体如下:
1>、第一位码
即为该汉字读音第一字母。
对于字库中无读音的整体第一位码规定为“V”如二:丶,一,一。VDHH(5779区位码)
2>、第二位码
有一个严格的优先顺序,即:
首先,按书写顺序,第一最大成字整体读音的第一字母,此整体相对独立,与其它部分无穿插。
其次,按书写顺序,第一最大偏旁整体读音的第一字母,此整体相对独立,与其它部分无穿插。
最后,按书写顺序,第一笔划读音第一字母。
3>、第三位码
也有一个严格的优先顺序,即:
首先,按书写顺序,其余部分中第一最大成字整体读音的第一字母,此整体与其它部分相对独立,无穿插。
其次,按书写顺序,其余部分中第一最大偏旁整体读音的第一字母,此整体与其它部分相对独立,无穿插。
最后,按书写顺序,其余部分中第一笔划读音第一字母。
4>、第四位码
也有一个严格的优先顺序,即:
首先,按书写顺序,其余部分(前面声读整体以外的部分)第一最大成字整体读音的第一字母,与其它部分相对独立,无穿插。
其次,按书写顺序,其余部分第一最大偏旁整体读音的第一个字母与其它部分相对独立,无穿插。
再次,按书写顺序,最后几笔最大成字整体处于已取过码的整体读音的第一字母,与其它部分相对独立,无穿插。
最后,按书写顺序,最后一笔读音的第一个字母。
例:最:旦,二,又。ZDEY
宝:玉,宀,丶。BYGD
复:白,攵,。FRWN
八:丿,,。BPNN
旧:日,丨,二。JRSE
湖:沽,月,二。HGYE
在编码时,每一位码的确定必须遵循以下原则:
1>、最大整体的原则
无论是成字,还是成偏旁部首,都要遵从最大整体的原则,即按汉字书写笔划顺序,连续笔划构成的整体必须是最大的。如:
最:旦,二,又。ZDEY,而不能是:日,取,又。ZRQY
将:夕,寸,丬。JXCJ,而不能是:夕,寸,ン。JXCD
复:白,攵,。FRWN,而不能是:日,又,。FRYN
2>、所成最大整体要与其它结构部分相对独立,无穿插,所谓穿插,即为穿过,穿透,插入通过之意,所谓相对独立,指最大整体成块成团,独立可分空间范围下交叉(重叠是可以的)。
例:天:大,一,。TDHN,而不是:二,人,。TERN
奥:米,大,ㄇ。AMDK,而不是:类,ㄇ,大。ALKD
3>、错位两部分不能视为单元整体
例:格:木,各,口。GMEK,而不是:木,口,一。GMKH
葫:胡,艹,日。HUCR,而不是:苦,月,二。HKYE
4>、成字整体的声码与该字的第一位码不相重复,具体为发生重复的开头字母为“JI、QI、XI、ZI、CH、SH”时,取第三位拼音字母作为该位声读码,其余情况发生重复时,只取第二位拼音字母作为该位声读码。
例:消:肖,シ,月。XADY,而不是:XXDY
肿:月,中, 丨。ZYOS,而不是:ZYZS
而对于A、O、E开头拼音的成字整体不考虑此原则。
例:噢:口,奥,大。AKAD
2、五位声读码的编制方法:
即在四位声读码的基础上再追加编制第五位声读码。具体规则如下:
它是一个严格的优先顺序,适用于各种汉字的不同情形。
首先,前第一声读整体中第一成字最大整体声读并编码,与第四位码的声读整体不能重复。
其次,前第二声读整体中第一成字最大整体声读并编码,与第四位码的声读整体不能重复。
再次,对前第一声读整体中第一最大偏旁整体声读并编码。
最后,对前第二声读整体中第一最大偏旁整体声读并编码。
当然,当无有以上整体可声读时,则原四位声读码即同时为该字五位声读码。
例:码:石,马,一。四位声读码为:MSDH
石,马,一,口。五位声读码为:MSAHK
弯:亦,弓,ㄅ。四位声读码为:WYGW
无声读整体,故五位码也为:WYGW
本发明方法规定的一级简码的汉字如下:
全(Q),我(W),二(E),人(R),他(T),要(Y),无(U),一(I),偶(O),片(P),安(A),是(S),的(D),非(F),个(G),和(H),及(J),可(K),了(L),在(Z),小(X),次(C),着(V),不(B),你(N),没(M)。
助字词为:你我他 一和二
的及了 全无偶
非要不可 平安在
个人次小 是没着
本发明方法还包括全码和次全码。
1>、次全码:对汉字结构中按前边规则定出的整体读尽,形成该字的次全码。如:
例:璺:二,同,二。四位声读码为:WETE
其余整体:玉、冖
次全码为:WETEYG
2>、全码:对声读码,次全码中各位声读码对应整体进行声读;各自形成四位码声读码,并按原声读码中对应位置顺次排列。
例:鲍:鱼,包,己。BYAS
鱼:田 ク,一。YTDH
全码为:BYTDH ASBW SZHW打点的为原声读码。
.. . .
本发明方法,还包括双字词、各类多字词及习惯用语的编码输入,以符号说明如下:
a:I、II、III...表示多字词的第一字、第二字、第三字...;
b:1、2、3...作下角标,表示该位字第一位,第二位,第三位等的结构读声码。(如II2表示词中第二字的第二位结构声读码);
1、双字词的编码:I1II1I2II2II3,五位码;
一级简码:I1II1
二级简码:I1II1I2II2
例:我们:我:WPHD们:MERW
双字词编码为:WMPEW
一级简码:WM
二级简码:WMPE
2、三字词的编码:I1II1III3II2III2,五位码;简码:I1II1III1
例:计算机:计:JSYS算:SMEN机:JMIW
三字词的编码为:JSJMM简码:JSJ
3、四字词的编码为:I1II1III1IV1IV2简码:I1II1III1IV1
例:社会主义:义:YDPN
四字词编码为:SHZYD简码:SHZY
4、五字词的编码:I1II1III1IV1V1
例:吐鲁番盆地:编码为:TLFPD
中华人民共和国::编码为:ZHRMGH
5、六字及六词以上字词的编码:I1II1III1IV1V1VI1
例:中华人民共和国::编码为:ZHRMGH
在字词输入中还包括字数数字识别位,在编码的第六位,以数字表示出字数。声读字、词或手敲键盘输入字或词的一级简码后,按空格键,由程序完成该位数字的编制和输入,六字及六字以上多字词则无有此数字识别位。
例:“我们”先输入“WM”,一级简码,按空格键,电脑在输入字的显示位置的第三位处显示“2”,“WM___2”。
例“键”,先输入“J”,一级简码,按空格键,电脑在输入位置的第六处显示“1”,即“J___1”。
本发明的方法中还包括有码位通配符“]”右方括号键,用来查询和代替未知部分的声读码,管理程序会将只有该位码不同的所有存在汉字输出,让操作者寻找选用并学习编码。
本发明方法还包括键盘输入方法以外的一种全新输入方法“声读加键盘输入法”,具体为用口发音读句子中的字或词,借助于读音识别系统,即实现一级简码和字数识别位的编制和输入,所需剩余码位字母由键盘输入,最终完成字词的输入。
例1:词组“经济界”的输入,语音声读“经济界”由语音识别系统识别输入“JJJ__3”,手敲操作键盘,输入“QJ”两位编码,即显示为:“JJJQJ3”于是“经济界”一词在计算机屏幕上显示,再敲空格键完成该词的输入。
例2:单字“晚”的输入,语音声读“晚”(Wan)由语音识别系统识别输入“W____1”手敲键盘,输入“RMW”(五位声读码输入时,要输入“RMWE”),显示为“WRMW_1”(五位码输入时“WRMWE”)于是该字在计算机屏幕上显示,再按空格键实现输入。
该方法可使单一键盘输入法中的工作量下降至30%,由语音声读原文自然不觉地完成汉字输入,它是编码输入的新概念,大大提高了速度,减轻了脑手等的疲劳程度。
Claims (5)
1、一种计算机结构声读汉字输入方法,汉字输入的声、韵母键与对应于计算机的键盘上的英文字母键,其特征在于:按书写笔划顺序连续笔划形成方块汉字整体,以其最大整体的原则,声读并取读音第一字母等作为对应码位的声读码,声读码可以以四位码或者五位码,或者至少一位码的形式进行汉字输入;
所述的最大整体主要为汉字整体的偏旁整体或汉字笔划,以其为声读对象,具体定义如下:
1>、成字整体的范畴可定义在国标一级、二级汉字的范围内;内;
2>、偏旁整体内容为常见熟知偏旁,此以下内容以外的偏旁部首编码时不以偏旁整体论:“讠:言”“衤:衣”“尢:尤”“艹:草”
春”“亻:人”“廴:建”“辶:建”“钅:金”
卷”“丬:将”“爿:将”“ㄗ:耳”“阝:耳”“冖:盖”“宀:盖”“穴:盖”
盖”“巛:拐”“ㄍ:拐”“凵:匡”“冂:匡”:虎”“攵:文”“夂:文”“犭:犬”“饣:食”“纟:丝”“礻:示”“四:四”“扌:手”“
:足”“:竹”“彡:撇”“疒:病”“ㄅ:包”“廾:弄”“癶:登”
登”“勹:刀”“刂:刀”“
ン:点”“シ:点”“灬:点”“忄:心”
3>、汉字笔划声读读音定义如下:其引号内为其读音
所述的四位码:
四位声读码依次对汉字的组成整体,既最大整体进行声读,取其读音的第一位字母作为声读码,最后形成四位有序的英文字母(亦即拼音字母),其组合具体如下:
(1)、第一位码
即为该汉字读音第一字母;
对于字库中无读音的整体第一位码规定为“V”;
(2)、第二位码
遵循以下优先顺序,即:
首先,按书写顺序,第一最大成字整体读音的第一字母,此整体相对独立,与其它部分无穿插;
其次,按书写顺序,第一最大偏旁整体读音的第一字母,此整体相对独立,与其它部分无穿插;
最后,按书写顺序,第一笔划读音第一字母;
(3)、第三位码
遵循以下优先顺序,即:
首先,按书写顺序,其余部分中第一最大成字整体读音的第一字母,此整体与其它部分相对独立,无穿插;
其次,按书写顺序,其余部分中第一最大偏旁整体读音的第一字母,此整体与其它部分相对独立,无穿插;
最后,按书写顺序,其余部分中第一笔划读音第一字母;
(4)、第四位码
遵循以下优先顺序,即:
首先,按书写顺序,其余部分(前面声读整体以外的部分)第一最大成字整体读音的第一字母,与其它部分相对独立,无穿插;
其次,按书写顺序,其余部分第一最大偏旁整体读音的第一个字母与其它部分相对独立,无穿插;
再次,按书写顺序,最后几笔最大成字整体处于已取过码的整体读音的第一字母,与其它部分相对独立,无穿插;
最后,按书写顺序,最后一笔读音的第一个字母;
所述的五位声读码:
即在四位声读码的基础上再追加编制第五位声读码;具体规则如下:
它是一个严格的优先顺序,适用于各种汉字的不同情形;
首先,前第一声读整体中第一成字最大整体声读并编码,与第四位码的声读整体不能重复;
其次,前第二声读整体中第一成字最大整体声读并编码,与第四位码的声读整体不能重复;
再次,对前第一声读整体中第一最大偏旁整体声读并编码;
最后,对前第二声读整体中第一最大偏旁整体声读并编码;
当然,当无有以上整体可声读时,则原四位声读码即同时为该字五位声读码;
2、根据权利要求1所述的一种计算机结构声读汉字输入方法,其特征在于:它还包括除声读码外还另有全码或次全码;
(1)、次全码:对汉字结构中按声读码编码方法,整体读尽,形成该字的次全码;
(2)、全码:对声读码、次全码中各位声读码对应整体进行声读,各自形成四位码,并按声读码中对应位置顺次排列,形成全码;
3、根据权利要求1所述的一种计算机结构声读汉字输入方法,其特征在于:它还包括双字词及各类多字词的输入编码,并用以下符号表示:
(1)、I,II,III,.......表示多字词中第一字,第二字,第三字,......;
(2)、1,2,3,.......作为角标,表示读位字的第一位,第二位,第三位,......声读码;如“II2”表示词中第二字的第二位结构声读码;双字词的编码:I1II2II2II3
一级简码:I1II1
二级简码:I1II1I2II2三字词的编码:I1II1III1II2III2
简码:I1II1III1
四字词的编码:I1II1III1IV1IV2
简码:I1II1III1IV1
五字词的编码:I1II1III1IV1V1
六字词及六字以上词的编码:I1II1III1IV1V1VI1。
4、根据权利要求2所述的一种计算机结构声读汉字输入方法,其特征在于:它还包括码位通配符“]”右方括号,用作查询和替代未知部分的声读码。
5、根据权利要求2所述的一种计算机结构声读汉字输入方法,其特征在于:它还包括字数的识别位,并在编码的第六位上以数字表示,声读字或词、或者手敲键盘输入字词的一级简码后,按空格键由计算机程序完成该位数字的编制和输入,六字及更多字词则无有此数字识别位。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 99105551 CN1120408C (zh) | 1999-04-12 | 1999-04-12 | 一种计算机结构声读汉字输入方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 99105551 CN1120408C (zh) | 1999-04-12 | 1999-04-12 | 一种计算机结构声读汉字输入方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1270343A CN1270343A (zh) | 2000-10-18 |
CN1120408C true CN1120408C (zh) | 2003-09-03 |
Family
ID=5272024
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 99105551 Expired - Fee Related CN1120408C (zh) | 1999-04-12 | 1999-04-12 | 一种计算机结构声读汉字输入方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1120408C (zh) |
-
1999
- 1999-04-12 CN CN 99105551 patent/CN1120408C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN1270343A (zh) | 2000-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1120408C (zh) | 一种计算机结构声读汉字输入方法 | |
CN1121645C (zh) | 音形字理码汉字输入方法 | |
CN1166997C (zh) | 汉字免拆分快速输入法 | |
CN1081355C (zh) | 三音码计算机汉字输入方法及其键盘 | |
CN1020052C (zh) | 形元汉字信息处理方法及其键盘 | |
CN1266577C (zh) | 音数形汉字输入方法 | |
CN1374577A (zh) | 英文字母键盘和数字键盘通用汉字电脑输入法及其键盘 | |
CN1123819C (zh) | 计算机汉字键位码输入方法 | |
CN1808351A (zh) | 声拼计算机汉字输入法 | |
CN1059508C (zh) | 中文电脑笔结编码输入法 | |
CN1050913C (zh) | 中文部首代码编码输入的文书处理装置 | |
CN1838044A (zh) | 中文拼音声调笔划组合输入法 | |
CN1196989C (zh) | 汉字形体示意输入法及其键盘 | |
CN1156744C (zh) | 元根码汉字输入方法 | |
CN1186976A (zh) | 计算机汉字八四码输入法及键盘 | |
CN1054447C (zh) | 计算机汉字输入坐标码编码方法 | |
CN1058342C (zh) | 汉字编码的计算机输入方法 | |
CN1841278A (zh) | 双联码免拆高效汉字输入技术 | |
CN1379307A (zh) | 全息万能规范汉字编码及高速输入法 | |
CN1108552C (zh) | 拼音汉字完善汉字法(phf) | |
CN1268689A (zh) | 一种用于电子计算机的汉字音形编码输入方法 | |
CN1734404A (zh) | 音码和识别音码、级库技术、笔码和数字笔码 | |
CN1409240A (zh) | 一种全新的表征万物和字词的音象形信息系统 | |
CN1527184A (zh) | 汉字输入方法及其键盘 | |
CN1228565A (zh) | 电脑文档自动检错、改错装置及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |