CN1023916C - 简繁五笔字根汉字输入系统 - Google Patents
简繁五笔字根汉字输入系统 Download PDFInfo
- Publication number
- CN1023916C CN1023916C CN89103862.0A CN89103862A CN1023916C CN 1023916 C CN1023916 C CN 1023916C CN 89103862 A CN89103862 A CN 89103862A CN 1023916 C CN1023916 C CN 1023916C
- Authority
- CN
- China
- Prior art keywords
- chinese character
- simplified
- keyboard
- chinese
- radical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/018—Input/output arrangements for oriental characters
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B41—PRINTING; LINING MACHINES; TYPEWRITERS; STAMPS
- B41J—TYPEWRITERS; SELECTIVE PRINTING MECHANISMS, i.e. MECHANISMS PRINTING OTHERWISE THAN FROM A FORME; CORRECTION OF TYPOGRAPHICAL ERRORS
- B41J3/00—Typewriters or selective printing or marking mechanisms characterised by the purpose for which they are constructed
- B41J3/01—Typewriters or selective printing or marking mechanisms characterised by the purpose for which they are constructed for special character, e.g. for Chinese characters or barcodes
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B41—PRINTING; LINING MACHINES; TYPEWRITERS; STAMPS
- B41J—TYPEWRITERS; SELECTIVE PRINTING MECHANISMS, i.e. MECHANISMS PRINTING OTHERWISE THAN FROM A FORME; CORRECTION OF TYPOGRAPHICAL ERRORS
- B41J5/00—Devices or arrangements for controlling character selection
- B41J5/08—Character or syllable selected by means of keys or keyboards of the typewriter type
- B41J5/10—Arrangements of keyboards, e.g. key button disposition
Abstract
简繁字根汉字输入技术及其键盘以实用化的汉字输入技术为核心,完全采用计算机辅助设计,每个功能都有定量的指标,具有较高的完备性和实用性。本发明包含一系列从简单易学到快速高效的汉字输入方法,使其既能处理简体汉字,又能处理繁体汉字,并且简、繁体汉字可以互相转换。本发明包含众多的辅助输入方法,可以广泛地适应各种不同要求的用户。在键盘设计上,本发明提出多页键盘的设计方案,充分发挥了标准键盘的潜力。
Description
近年来,电子计算机特别是微型计算机在我国迅速普及,涌现出了许多计算机汉字编码方案,到目前为止,已有方案尚存在下面一些问题:
已有方案一般都只处理简体汉字。随着我们同港澳台同胞和广大海外华桥之间经济、文化、技术交流的不断发展,海内外越来越多的用户要求计算机不仅能处理简体汉字,而且还要能处理繁体汉字,且要求简繁汉字能方便地互相转换,而国内外现有的繁体方案尚不能满足用户的这些需要。
当前国内流行的《五笔字型》汉字编码方案,其末笔字型交叉识别一直是用户最头痛的一个问题,其字型、成字字根、键名等概念都增大了记忆量,这些问题在此以前一直未能解决。
现有的键盘汉字输入技术一般都仅仅着眼于汉字编码方案,没有从输入系统的全局考虑,达不到较高的实用化程度,不能广泛地适应各种用户的需要。
现有的汉字编码方案,大部分是用手工搞出来的,没有经过计算机定量的分析研究,很难达到最优化的设计。
本发明的目的是利用计算机辅助设计的方法,创造一种可适用于简繁汉字的输入系统,以解决上述现有技术中的问题。
本发明总体上包含以下内容:
本发明以汉字字根输入编码方法为核心,采用计算机辅助设计,使每个功能都有定量的指标,以达到较高的完备性和实用性。本发明
包含有快速高效的字根汉字输入方法和简章易学的笔画汉字输入方法,既能处理简体汉字,又能处理繁体汉字,并且简、繁体汉字可以互相转换。本发明可以广泛地适应各种不同要求的用户。
在键盘设计上,本发明提出多页键盘的设计方案,以充分发挥标准键盘的潜力。
该多页键盘包括以下15个键盘页(总体示意图如图24):
1.繁体字根键盘页(如图1、图2)
2.简体字根键盘页(如图3、图4)
3.笔画键盘页(如图12)
4.拼音键盘页(如图15)
5.电报键盘页(如图16)
6.区位键盘页(如图17)
7.国标键盘页(如图18)
8.汉字实线表格符号键盘页(如图5)
9.汉字双实线表格符号键盘页(如图6)
10.汉字标点符号键盘页(如图7)
11.汉字选择键盘页(如图19)
12.ASCⅡ字符键盘页(如图20)
13.换页控制键盘页(如图21)
14.状态选择键盘页(如图22)
15.混合控制键盘页(如图23)
该多页键盘的“页”,是逻辑意义上的页,并非物理意义上的页,建立“页”的概念,可以使操作人员同计算机保持同步,简单清楚地使用复杂的、被多层次定义过的汉字化键盘。一个键盘页,就是整个键盘或键盘上部分区域的一个定义表,一个键盘页处于表面,就是计算机默认键盘上的对应区域使用这个定义表。
该多页键盘的诸键盘页在同一时刻不可能全处于键盘表面,而只有几个键盘页处于表面,其余键盘页则被覆盖。需要时,可使用换页
控制键或混合控制键把有关键盘页调整到表面,如:当前“拼音键盘页”、“汉字双实线表格符号键盘页”和部分“ASCⅡ键盘页”处于表面,若要把:“繁体字根键盘页”、“汉字标点符号键盘页”和“汉字实线表格符号键盘页”调整到表面,则只要键入“换页控制键盘页”上的“字根”键(ALT+F2)、“标点”键(ALT+F9)和“混合控制键盘页”上的“繁/简”键(SHIFT+F4)、“实线/双实线”键(SHIFT+F5)即可。
下面分别介绍每个键盘页。
1.繁体字根键盘页(如图1、图2)
该键盘页分布于标准键盘左边主键盘上,该键盘页是根据繁体字根汉字编码输入法的汉字字根体系、拆分体系和编码体系,综合考虑字根规律性和指法要求的频度分布等各项指标而设计成。
2.简体字根键盘页(如图3、图4)
该键盘页分布于标准键盘左边主键盘上,该键盘页是根据简体字根汉字编码输入法的汉字字根体系、拆分体系和编码体系,综合考虑字根规律性和指法要求的频度分布等各项指标而设计成。在“混合功能控制键盘页”上专设一个“Q/X”方式转换键,以便于使用繁体字根和简体字根键盘页时,可以根据频度和习惯随时调整键位布局,附图一和附图二就分别代表两种键位习惯。
3.笔画键盘页(如图12)
该键盘页分布于标准键盘右边数字小键盘上,根据GB2312-80中对五种基本笔画的划分和排列顺序,将它们分别置于“1”、“2”、“3”、“4”、“5”五个数字键上,用“6”作模糊键,用“7”作词汇引导键,用“8”作重码倒选键,用“9”作重码正选键,用“0”作结束键。
4.拼音键盘页(如图15)
该键盘页分布于标准键盘左边主键盘上,使用26个英文字母键作为汉语拼音字母键,使用两个单引号作为重码正选键和重码倒选键,空格亦作为重码正选键。
5.电报键盘页(如图16)
该键盘页分布于标准键盘左上方数字键和右边数字键上,同时使用两边键盘上的“0”到“9”十个数字键作为电报码输入键。
6.区位键盘页(如图17)
该键盘页分布于标准键盘左上方数字键和右边数字键上,同时使用两边键盘上的“0”到“9”十个数字键作为区位码输入键。
7.国标键盘页(如图18)
该键盘页分布于标准键盘左边主键盘上,使用数字键“0”到“9”和字母键“A”、“B”、“C”、“D”、“E”、“F”作为国标内码输入键。
8.汉字实线表格符号键盘页(如图5)
该键盘页分布于标准键盘右边数字键盘上,在“1”至“9”9个数字键上定义9个制表符,使之形成一个“田”字形,在“0”键上定义“丨”(竖线)在“-”(减号)键上定义“-”(横线),在“+”(加号)键上定义“+”(十字交叉线)。
9.汉字双实线表格符号键盘页(如图6)
该键盘页分布于标准键盘右边数字键盘上,在“1”至“9”9个数字键上定义9个双线制表符,使之形成一个空心的“田”字形,在“0”键上定义“丨丨”(双竖线),在“-”(减号)键上定义“=”(双横线)在“+”(加号)键上定义“#”(空心双十字交叉线)。
10.汉字标点符号键盘页(如图7)
该键盘页分布于标准键盘的英文标点符号键上,一些在汉字文件输入和编辑时用不上的英文标点符号键被定义成意义相近的汉字标点符号。
11.汉字选择键盘页(如图19)
该键盘页分布于标准键盘右上方数字键上,当重码显于提示行时,该键盘页即自动浮于表面,这些数字键上原来的键盘页暂时被覆盖。
12.ASCⅡ字符键盘页(如图20)
该键盘页即标准键盘上的基本定义,在当前键盘上处于表面的诸
键盘页不能完全覆盖整个键盘时,其余部分总是露出ASCⅡ键盘页。
13.换页控制键盘页(如图21)
该键盘页分布于键盘上“F1”到“F10”十个功能键上,当“ALT”被按下时,该键盘页即浮于表面,当需要某个键盘页浮于表面时,按下该键盘页上对应键即可。在下次使用该键盘页之前,对应键盘页会一直处于表面,但“字根”键需根据“混合控制键盘页”上的“繁/简”转换键的状态决定当前处于表面的是“繁体字根键盘页”还是“简体字根键盘页”;“表格”键需根据“混合控制键盘页”上的“实线/双实线”转换键的状态决定“汉字实线表格符号键盘页”还是“汉字双实线表格符号键盘页”处于表面。该键盘页上的“HELP”键被按下后,“换页控制键盘页”、“状态选择键盘页”和“混合控制键盘页”的定义和当前状态会显于屏幕上,若再按下这三个键盘页上的基它键,则对应的键盘页或功能简介会显于屏幕上,再按其它键则屏幕上原来内容被恢复。
14.状态选择键盘页(如图22)
该键盘页分布于标准键盘“F1”到“F10”十个功能键上,当“CTRL”被按下时,该键盘页即浮于表面,其中,“F1”到“F8”为屏幕状态选择键,“F9”为“立即造词”状态引导键,“F10”为打印机状态设定键。
15.混合控制键盘页(如图23)
该键盘页分布于标准键盘“F1”到“F10”十个功能键上,当“SHIFT”被按下时,该键盘页即浮于表面,其中“F1”到“F3”是六个混合输入方法的启动键;“F4”到“F6”是“简/繁”状态、“实线/双实线”状态和“Q/X”状态转换键;“F7”到“F10”是辅助输入方法启动键。
本发明在产生过程中一直注重使用科学的研究方法,其每一步骤的实现都由计算机完成,反过来,在计算机完成的过程中,又为确定下一步的研究方向提供了大量的数据资料。
为研究繁体汉字输入技术,本发明首先考察了简体字和繁体字之间的各种关系,研制了强功能的造字软件,然后使用这些软件造出了16×16和24×24点阵的繁体字库(样张加附图8、附图9),这些字库为繁体汉字输入技术的研究提供了很大的方便。
本发明包含两种快速的字根类输入法、两种易学性笔画类输入法和数种辅助输入法,可以用其中任何一种方法来学习其它方法。另外还有区位、国标拼音和电报输入法也包含在本发明组成的实用化系统中。
每种输入法使用不同的编码字典,但所有输入法使用同一个词库,这个词库只为快速的简体字根和繁体字根输入法提供编码,其它方法的词汇编码都是在使用时临时产生的。
本发明的各个输入方法是这样实现的:
1.简繁五笔字根汉字编码输入法
本发明为实现繁体五笔字根汉字编码输入法和简体五笔字根汉字编码输入法,首先要建立两个汉字编码研究专用汉字属性库和常用词汇库,包括每个简体汉字和繁体汉字的笔顺,笔画拆分序列,字根拆分序列,最新实用频度,拼音码、国标码、电报码等信息;其次,要研制一系列计算机辅助设计程序,包括:字根使用频度和组字能力统计分析程序;根据限制条件权衡字根使用频度和组字能力的字根自动选取程序;使用汉字属性库的汉字和词汇自动编码、各级简码自动生成、重码频度自动标记程序;重码自动统计程序;供人工干予的重码结果自动分析程序;各种条件下的动态、静态码长自动计算程序;键位概率、键位二次概率、键位码序概率和码元熵值自动计算程序;编码效率自动计算程序;国标序、自编码序和字根拆分的单字码本及词汇码本的打印程序。
为确定编码字根集,首先要根据传统的字根拆分方法,选出一个较全面的原始字根集,为每一字根确定一个代码,据此字根集对国标汉字进行拆分和编码,产生一个字根直接编码集,并据此统计每个字
根的出现次数即字根组字频度,然后把国标集中每个汉字的使用频度加权到每个字根的代码下,即可算出每个字根的实用频度,最后综合考虑组字频度、实用频度、记忆规律性和信息量等因素,选出代表性较强的字根,即可得初选字根集。
为完成编码集,要把入选字根按一定键位数和规律分组,如图3、图4和图14所示,是根据首笔相同和频度加权均匀性分组。利用字根选取时产生的字根直接编码集,把被删除的字根用初始字根集中的字根组成,把所有字根代码换为其所属分组的代码,即可产生一个初始编码集。然后,进行多指标的编码分析,以确定简码集和重码次序。
对初始编码按外码大小排序,在排序文件中,相邻编码相同的即为重码。为确定简码,对排序结果进行分组,当键位数为K,码长极限为四时,可分三组。
A.一码分组:把第一码相同的编码子集分为一组,这样,结果是K组。
B.两码分组:把第一码和第二码都相同的编码子集分为一组,结果应不大于K∧2组。
C.三码分组:把第一、第二、第三码都相同的编码子集分为一组,其结果应不大于K∧3组。
对每一种分组,应考察其组内编码的以下几个方面的情况:
A.重码:对重码者,应优先考虑定义其中使用频度高的为简码,以减少重码率和重码处理率。
B.末笔:以末笔追加结尾的,优先考虑定义为简码,以减轻操作人员因末笔追加所造成的负担。
C.频度:使用频度高的,应优先考虑定义为简码,以减少动态平均码长,提高键入速度。
根据考察结果,按某种优先级算法,即可在每组中确定一个简码。
简码确定后,综合考虑每组重码的以下几方面情况:
A.频度:
一般情况,对一组重码汉字中每个字应按其使用频度高低排序,并把频度高者定义在默认位置。
B.简码:
若一组重码汉字中,频度最高者已被定义为简码,应考虑把频度次高者定义在默认位置。
根据考查结果,按一定的优先级算法即可在每组汉字中,选定一个,定义在默认位置,在实际使用中,操作人员遇到一组重码汉字时,系统根据预先排好的顺序,依次提示其中每个汉字,当准备选择其被定义在默认位置者(第一个)时,可不作任何处理,继续正常输入,系统自动接受被定义在默认位置者。
对上述结果,考察其以下几个重要指标,进行定量分析:
A.重码数:
B.重码率:
C.重码处理率:
D.键位概率:
E.键位二次概率:
F.键位码序概率:
G.码元商值:
H.静态全码平均码长:
I.动态简码平均码长:
对以上定量分析的指标,根据设计目标进行综合权衡,对某些不能令人满意指标,分析其原因,采取相应对策,如减少字根、调整字根、增加字根、修改规则等等。然后,据此产生一新的编码集,回到前面再行分析,如此循环往复,直到产生理想的结果。
单字编码完成以后即可考虑词汇编码,先选定基本词汇集,如5000条,然后到单字码集中取来每条词汇中每个字的编码再按词汇
编码规则,抽取每个字中特定位置编码即可产生每条词汇码,进而组成词汇码集。
按照某种格式把每个汉字的全码、简码结合在一起,即可打印出国标顺序或自编码顺序的码本(码本样品如附图10、图11)。
繁体字根和简体字根汉字编码输入法正是这样产生的。
最后产生的繁体字根和简体字根汉字编码输入法,都有160多个基本字根及字根类,如图3、图4有162个字根,它们按起笔被分为5大组25小组,分别置于“A”~“Y”25个英文字母键上,形成繁体字根键盘页和简体字根键盘页,如图1、图2、图3和图4。在图1和图3的键盘页上,频度分布如图13和图14,可以看出,其分布规律是基本符合指法要求的。
繁体字根和简体字根汉字编码输入法的GB2312-80序列码本样张如图10和图11,整个码本按区分页,每页划分100个方格,一个区的所有汉字放在其中的94个方格中,每个方格有五行信息,第一行是“X”方式的编码,第二行是“Q”方式的编码,第三是汉字本身和二级简码及三级简码标专,第四行是字根拆分,第五行是字根数字编码。
使用繁体字根或简体字根汉字编码输入法对任一汉字进行编码输入时,先依其书写顺序拆取其第一、二、三个字根,若还未拆取完,则直接拆取其最后一个字根,若三个以内已拆完则在字根拆分序列后补加整个字的最后一个笔画,如:
德-丿(T)亻(R)十(X)心(N);
怀-忄(H)不(I)丶(Y)
对于本身是字根的汉字,仍用上面的方法把它拆成更小的字根序列,如果这个字根序列的长度小于四,则追加基本身于这个拆分序列之尾。如:
甲-日(T)丨(H)丨(H)甲(L);
这种方法不再特殊考虑键名、成字字根、字型、交叉识别等问题。
其一、二、三级简码和词汇码都由计算机用前述方法自动产生。如:
依-
三级简码:亻(R)二(I)
(E);
二级简码:亻(R)二(I);
依据-
词汇码:亻(R)二(I)才(W)尸(M);
2.全拆分笔画输入法
这种方法依照GB2312-80内对五个基本笔画的划分和排序,把每个汉字按照五个基本笔划拆成一个笔划序列,建立一个从汉字到笔画序列的对照表,这种方法在软件处理时,对从键盘输入的每一个笔画序列,所有笔画拆分序列包含这个输入序列的汉字都算命中,由计算机显示提示行供选择。
用这种方法输入一个汉字时,可以输入这个汉字的全部笔划或前几个笔画,这个汉字即可显示在提示行上。
用这种方法输入一条词汇时,可以依次输入词汇中每个汉字的前几个笔划,输入的笔划越多,这条词汇就越容易命中。如:
专:一一乙丶
家:丶丶乙一丿乙丿丿丿丶
“中华人民共和国”可有如下多种打法:
丨丿丿乙一丿丨
丨乙丿丨丿乙一丿丨
丨乙一丨丿丨丿丶乙一丿丨
3.字根笔划混合输入法
在这种输入方法下,可以用左边字母键盘按繁体字根或简体字根
输入法输入,也可以用右边数字键盘按全拆分笔划输入法输入,也可先用右边字母键输入1~3个字根,再用右边数字键输入几个笔划,反之亦可,这样可以方便准确地输入一个汉字,如:
“梁”有如下多种打法:
氵(I)刀(V)八(W)木(S)
氵(I)刀(V)八(W)丶(4)
丶(4)丶(4)一(1)?(Z)刀(V)
……
4.强化联想辅助输入法
这是一种辅助输入法,在使用其它输入方法输入汉字时,原输入法照常使用,但每输入一个汉字时,提示行会自动显示包含此字的所有词汇供选择,如果提示行中没有所要词汇,则可打“TAB”键继续向后寻找。如:
输入“道”,提示行即显示:
“联想:0道1道德2道理3道路……9难道”
若打一空格键,提示行即继续显示:
“联想:0道1街道2知道4报道……9通道”
若打1,则“街道”即显于编辑位置。
5.模糊式辅助输入法
在用任何一种输入法输入汉字时,如果遇到不能确定的输入码,可用“?”或“Z”或“6”代替,计算机会自动寻找符合条件的汉字,若仅有一个,则直接提供出来,若有几个,则显示提示行供选择。如:
在拼音字词转换法下,可用“?”作模糊键,若打入“?NG”,提示行就显示如下:
“?ng 1肮ANG 2昂ANG 3盎ANG 4盎司ANGSI”
6.自动式输入法
这是一种辅助输入法,在自动状态下用任何一种输入法输入汉字时,每输入一键,前几键符合此键的汉字会显于提示行供选择,如:
在繁体字根输入状态,从键盘每输入一键,提示行就逐步显示如下:
“w 1人W 2WX發3分WV 4父WQ 5公WP”
“wnn 1今WN 2今WNN 3念WNNY 4捻CWNN 5巷AWNN”
“wnny 1念WNNY”
7.立即造词辅助输入法
使用这种方法,在任何汉字输入状态或编辑状态,当需要把屏幕上一串汉字作为词组时,把光标移至这串汉字的第一个汉字上,键入立即造词键,然后光标移至这串汉字的末尾一个汉字上,键入结束键,由软件把光标扫过的这串汉字作为词组存入词汇库,并根据每种汉字输入法的规则自动为这条词组编出每种方法下的编码,在以后的汉字输入中即可马上使用这些编码输入这条词组。
8.编码返回式学习法
这是一种辅助学习方法,在一种输入法的学习状态下,用另一种输入法输入一个汉字,提示行会显示出这个汉字的编码,如:
在拼音学习状态下,用简体字根输入“政”字,则提示行就显示:
“ghty 1政ZHENG”
9.字根笔划返回式学习法
这是一种辅助学习方法,在一种字形输入法的学习状态下,用另一种输入法输入一个汉字,提示行会显示出这个汉字的字根笔划,如:
在简体字根学习状态下,用繁体字根输入“体”字,则提示行就显示:
“mvmo 1體亻木一一”
10.简繁转换法
选取一定数量的由多个繁体字对应一个简体字或一个简体字对应多个繁体字中的不同意义的繁体字或简体字构成的词汇,如果有一篇简体字文章要转换成繁体字文章,在使用简繁转换法转换时,光标逐个走过被转换的文章中汉字,对没有疑问的汉字,光标不停留,对于一个简体字对应多个繁体字的汉字,先在内部专用词库中检索,找到此字后,考察上下文是否符合一条词,若是,则这条词包含的那个繁体字即对应的繁体字,若不是,则继续检索;若用这种方法还不能确定,则光标停留于这个汉字上,屏幕上显示出对应繁体汉字中常用的一个繁体字请用户选择,用户可输入任一字母键或空格键,这个汉字对应的繁体汉字会逐一显示出,若欲选之繁体字出现,则按回车键,即表示选中,光标自动向后继续移动。
本发明对汉字进行编码、对键盘进行设计或定义、对码本进行编排、对字库进行构造的方法,可以用于一切型号的计算机、打字机、终端和电传机上。
Claims (5)
1、一种简繁五笔字根汉字输入系统,包括依照传统和频度选定汉字字根集的步骤、按照规律性和频度均匀性对字根进行分组的步骤、把25组字根对应到相应键位上的步骤、在组成汉字的字根个数小于等于4时取全部字根输入和当组成汉字的字根个数大于4时取一、二、三、末字根输入的步骤,其特征在于:
1)还包括简繁五笔字根转换步骤;
2)选定汉字字根集的步骤包括选定如下162个字根及其分组:
组号 字根
1 七大工戈弋艹廿
2 子阝耳卩了也凵冂
3 又巴马厶
5 月彡乃用豕
爫
7 主戋五一
10 日早虫‖刂
11 口川
12 田甲皿车力禾小
16 之冖宀辶廴礻
19 木丁
21 立丷辛冫丬六门疒
22 女刀九臼彐巛
23 人亻
八
25 言讠文方广丶
圭
3)当组成汉字的字根数少于4个时,在输入全部字根后,还要追加输入其末笔字根。
2、根据权利要求1所述的简繁五笔字根汉字输入系统,其特征在于:把25组字根对应到相应键位上的步骤包括如下对应关系:
组号 键位
1 A
2 B
3 C
4 D
5 E
6 F
7 G
8 H
9 I
10 J
11 K
12 L
13 M
14 N
15 O
16 P
17 Q
18 R
19 S
20 T
21 U
22 V
23 W
24 X
25 Y
3、根据权利要求1所述的简繁五笔字根汉字输入系统,其特征在于:当需用简体字根输入繁体汉字或用繁体字根输入简体汉字时,采用简繁转换法,其步骤包括:
(1)选取一定数量的由多个繁体字对应一个简体字或一个简体字对应多个繁体字中的不同意义的繁体字或简体字构成的词汇,建立简繁转换专用词库;
(2)逐个考察要被转换文章中的每个汉字,对不存在一对多情况的汉字,直接做一对一转换;
(3)对于一个简体字对应多个繁体字的汉字,先在内部专用词库中检索,找到此字后,考察被转换文章的上下文是否与专用词库中的某条词相同,若是,则这条词包含的那个繁体字即对应的繁体字,返回第(2)步;若不是,则继续检索;
(4)若用这种方法还不能确定,则光标停留于这个汉字上,显出对应繁体汉字中常用的一个繁体字请用户选择,用户可输入任一字母键或空格键,这个汉字对应的繁体汉字会逐一显示出,当欲选之繁体字出现,用户控回车键,即表示选中;
(5)返回第(2)步,如此循环,直至完成转换。
4、一种用于学习简繁五笔字根汉字输入系统的全拆分笔画输入法,包括选定“一丨丿丶乙”五种基本笔画的步骤、将汉字的所有笔画分类归入上述五种基本笔画的步骤、将上述五种基本笔画依次命名代码“1、2、3、4、5”的步骤、将汉字根据其书写笔顺拆分成上述五种基本笔画所组成的序列的步骤、将汉字的上述笔画序列输入计算机的步骤,其特征是将汉字的上述笔画序列输入计算机的步骤,在输入汉字时,对从键盘输入的每一个笔画序列,所有笔画拆分序列包含这个输入序列的汉字都算命中,由计算机显于提示行供选择。
5、根据权利要求1所述的简繁五笔字根汉字输入系统,其特征在于采用强化联想辅助输入法,包括:在输入汉字时,每输入一个汉字或词组,就把这个汉字或这条词组的最后一个汉字作为联想源同机内词汇库每条词组中的每个汉字比较,所有包含联想源的词组都作为命中词组显示提示行供选择。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN89103862.0A CN1023916C (zh) | 1989-06-19 | 1989-06-19 | 简繁五笔字根汉字输入系统 |
US07/540,491 US5197810A (en) | 1989-06-19 | 1990-06-19 | Method and system for inputting simplified form and/or original complex form of Chinese character |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN89103862.0A CN1023916C (zh) | 1989-06-19 | 1989-06-19 | 简繁五笔字根汉字输入系统 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN92108505A Division CN1026271C (zh) | 1993-07-05 | 1993-07-05 | 智能拼音汉字输入系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1040276A CN1040276A (zh) | 1990-03-07 |
CN1023916C true CN1023916C (zh) | 1994-03-02 |
Family
ID=4855328
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN89103862.0A Expired - Fee Related CN1023916C (zh) | 1989-06-19 | 1989-06-19 | 简繁五笔字根汉字输入系统 |
Country Status (2)
Country | Link |
---|---|
US (1) | US5197810A (zh) |
CN (1) | CN1023916C (zh) |
Families Citing this family (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6366697B1 (en) | 1993-10-06 | 2002-04-02 | Xerox Corporation | Rotationally desensitized unistroke handwriting recognition |
US5410306A (en) * | 1993-10-27 | 1995-04-25 | Ye; Liana X. | Chinese phrasal stepcode |
CN1039666C (zh) * | 1993-11-06 | 1998-09-02 | 黄飞梦 | 基于两笔形与两笔符的汉字输入方法及键盘 |
CA2137981C (en) * | 1993-12-22 | 2001-04-17 | Steven A. Shaiman | Method and system for presenting alternatives for selection using adaptive learning |
DE69533479T2 (de) | 1994-07-01 | 2005-09-22 | Palm Computing, Inc., Los Altos | Zeichensatz mit zeichen aus mehreren strichen und handschrifterkennungssystem |
CN1107254C (zh) * | 1996-03-24 | 2003-04-30 | 陈劲松 | 汉字阴阳双极声韵形码输入系统 |
US6351726B1 (en) * | 1996-12-02 | 2002-02-26 | Microsoft Corporation | Method and system for unambiguously inputting multi-byte characters into a computer from a braille input device |
US5889888A (en) | 1996-12-05 | 1999-03-30 | 3Com Corporation | Method and apparatus for immediate response handwriting recognition system that handles multiple character sets |
US7257528B1 (en) * | 1998-02-13 | 2007-08-14 | Zi Corporation Of Canada, Inc. | Method and apparatus for Chinese character text input |
US6094666A (en) * | 1998-06-18 | 2000-07-25 | Li; Peng T. | Chinese character input scheme having ten symbol groupings of chinese characters in a recumbent or upright configuration |
AUPP665398A0 (en) * | 1998-10-22 | 1998-11-12 | Charactech Pty. Limited | Chinese keyboard, input devices, methods and systems |
JP2000235567A (ja) * | 1999-02-17 | 2000-08-29 | Matsushita Electric Ind Co Ltd | 声調符号無入力式中国語文字変換装置 |
KR100344947B1 (ko) * | 2000-04-03 | 2002-07-22 | 이관동 | 한자입력장치 및 방법 |
US7013422B2 (en) * | 2001-06-15 | 2006-03-14 | International Business Machines Corporation | Noise removal in multibyte text encodings using statistical models |
WO2003003184A1 (en) * | 2001-06-27 | 2003-01-09 | Timespace System Co., Ltd. | Arabic-persian alphabet input apparatus |
KR100704093B1 (ko) * | 2001-08-30 | 2007-04-05 | 에이오엘 엘엘씨 | 콤포넌트 기반의, 적응성 스트로크 명령 시스템 |
US20040221236A1 (en) * | 2001-09-20 | 2004-11-04 | Choi Kam Chung | Happy, interesting, quick learning inputting method of Chinese characters in stroke character pattern codes |
TW530223B (en) * | 2001-12-07 | 2003-05-01 | Inventec Corp | Chinese phonetic input system having functions of incomplete spelling and fuzzy phonetic comparing, and the method thereof |
JP4558482B2 (ja) | 2002-06-05 | 2010-10-06 | ス、ロンビン | 各国語文字情報の最適化デジタル操作的コード化及び入力の方法、そして、その情報処理システム |
CA2409915C (en) * | 2002-10-29 | 2012-01-03 | Research In Motion Limited | Electronic device having keyboard for thumb typing |
US20050027534A1 (en) * | 2003-07-30 | 2005-02-03 | Meurs Pim Van | Phonetic and stroke input methods of Chinese characters and phrases |
US7395203B2 (en) * | 2003-07-30 | 2008-07-01 | Tegic Communications, Inc. | System and method for disambiguating phonetic input |
US20050264584A1 (en) * | 2004-05-27 | 2005-12-01 | Zhu-Min Di | [method for fast input of chinese character] |
TWI447636B (zh) * | 2006-12-18 | 2014-08-01 | Semantic Ompaction Systems | 用於中文字選擇及輸出的裝置,方法及電腦可讀媒體 |
US8677237B2 (en) * | 2007-03-01 | 2014-03-18 | Microsoft Corporation | Integrated pinyin and stroke input |
US20080211777A1 (en) * | 2007-03-01 | 2008-09-04 | Microsoft Corporation | Stroke number input |
US8316295B2 (en) * | 2007-03-01 | 2012-11-20 | Microsoft Corporation | Shared language model |
TWI412955B (zh) * | 2009-08-19 | 2013-10-21 | Inventec Appliances Corp | 漢字書寫筆順之提示方法、電子裝置及電腦程式產品 |
CN102004557A (zh) * | 2010-04-29 | 2011-04-06 | 丁树雄 | 笔顺声码汉字输入技术方案 |
US8438008B2 (en) | 2010-08-03 | 2013-05-07 | King Fahd University Of Petroleum And Minerals | Method of generating a transliteration font |
USD667414S1 (en) * | 2011-05-18 | 2012-09-18 | King Saud University | Ergonomic arabic keyboard |
USD768670S1 (en) * | 2014-03-28 | 2016-10-11 | Jan Magnus Edman | Display screen with graphical user interface |
CN104793757B (zh) * | 2015-04-29 | 2019-03-01 | 陈治宇 | 汉字输入方法和装置 |
USD846564S1 (en) | 2016-02-12 | 2019-04-23 | Yonggui Li | Display screen or portion thereof with keyboard graphical user interface |
USD846563S1 (en) | 2016-02-12 | 2019-04-23 | Yonggui Li | Display screen or portion thereof with keyboard graphical user interface |
CN110232172A (zh) * | 2019-06-12 | 2019-09-13 | 周业勇 | 一种文字拆分方式 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4379288A (en) * | 1980-03-11 | 1983-04-05 | Leung Daniel L | Means for encoding ideographic characters |
US4559615A (en) * | 1982-09-15 | 1985-12-17 | Goo Atkin Y | Method and apparatus for encoding, storing and accessing characters of a Chinese character-based language |
US4505602A (en) * | 1982-09-30 | 1985-03-19 | Wong Wyman S | Method for encoding ideographic characters |
US4684926A (en) * | 1984-05-14 | 1987-08-04 | Yong Min Wang | Universal system of encoding chinese characters and its keyboard |
CA1279128C (en) * | 1986-08-18 | 1991-01-15 | Andrew Chiu | Means and method for electronic coding of ideographic characters |
US5006001A (en) * | 1989-09-27 | 1991-04-09 | Vulcano Terrance E | Keyboard with one hand character key array and one hand mapping key array |
-
1989
- 1989-06-19 CN CN89103862.0A patent/CN1023916C/zh not_active Expired - Fee Related
-
1990
- 1990-06-19 US US07/540,491 patent/US5197810A/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US5197810A (en) | 1993-03-30 |
CN1040276A (zh) | 1990-03-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1023916C (zh) | 简繁五笔字根汉字输入系统 | |
CN1607491A (zh) | 使用操纵杆输入中文的系统和方法 | |
CN1095560C (zh) | 修改汉字转换结果的系统 | |
CN100351757C (zh) | 一种藏字计算机输入方法 | |
CN1166997C (zh) | 汉字免拆分快速输入法 | |
CN1556452A (zh) | 数字键盘智能拼音汉字输入方法 | |
CN1052200A (zh) | 音形义字词兼容编码系列及键盘 | |
CN1259615C (zh) | 字母键盘和数字键盘通用汉字输入法及其左半字形识别法 | |
CN100342311C (zh) | 根拆式汉字输入及其显示方法 | |
CN1023917C (zh) | 汉语文字处理之方法 | |
CN1058342C (zh) | 汉字编码的计算机输入方法 | |
CN1055434A (zh) | 字符的图元输入方法及其键盘 | |
CN1201220C (zh) | 核心码计算机输入法 | |
CN1123819C (zh) | 计算机汉字键位码输入方法 | |
CN1492303A (zh) | 二分汉字编码小键盘输入及其显示方法 | |
CN1175722A (zh) | 计算机中文通用输入法 | |
CN1162766C (zh) | 一种汉字音形编码输入方法 | |
CN1347023A (zh) | 二笔手写智能输入系统 | |
CN1532676A (zh) | 键盘及非键盘汉字输入法 | |
CN1026829C (zh) | 中文头尾码输入法及其键盘装置 | |
CN1073539A (zh) | 汉字拼音编码及输入方法 | |
CN1015751B (zh) | 计算机汉字十笔字拼写输入方法 | |
CN1114066A (zh) | 意群输入、编辑和字词语码 | |
CN1050913C (zh) | 中文部首代码编码输入的文书处理装置 | |
CN1056357A (zh) | 中文输入法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C15 | Extension of patent right duration from 15 to 20 years for appl. with date before 31.12.1992 and still valid on 11.12.2001 (patent law change 1993) | ||
OR01 | Other related matters | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |