CN1040276A - 简繁字根汉字输入技术及其键盘 - Google Patents

简繁字根汉字输入技术及其键盘 Download PDF

Info

Publication number
CN1040276A
CN1040276A CN89103862.0A CN89103862A CN1040276A CN 1040276 A CN1040276 A CN 1040276A CN 89103862 A CN89103862 A CN 89103862A CN 1040276 A CN1040276 A CN 1040276A
Authority
CN
China
Prior art keywords
chinese character
keyboard
radical
input
input method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN89103862.0A
Other languages
English (en)
Other versions
CN1023916C (zh
Inventor
张道政
梁念蓉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN89103862.0A priority Critical patent/CN1023916C/zh
Publication of CN1040276A publication Critical patent/CN1040276A/zh
Priority to US07/540,491 priority patent/US5197810A/en
Application granted granted Critical
Publication of CN1023916C publication Critical patent/CN1023916C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/018Input/output arrangements for oriental characters
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B41PRINTING; LINING MACHINES; TYPEWRITERS; STAMPS
    • B41JTYPEWRITERS; SELECTIVE PRINTING MECHANISMS, i.e. MECHANISMS PRINTING OTHERWISE THAN FROM A FORME; CORRECTION OF TYPOGRAPHICAL ERRORS
    • B41J3/00Typewriters or selective printing or marking mechanisms characterised by the purpose for which they are constructed
    • B41J3/01Typewriters or selective printing or marking mechanisms characterised by the purpose for which they are constructed for special character, e.g. for Chinese characters or barcodes
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B41PRINTING; LINING MACHINES; TYPEWRITERS; STAMPS
    • B41JTYPEWRITERS; SELECTIVE PRINTING MECHANISMS, i.e. MECHANISMS PRINTING OTHERWISE THAN FROM A FORME; CORRECTION OF TYPOGRAPHICAL ERRORS
    • B41J5/00Devices or arrangements for controlling character selection
    • B41J5/08Character or syllable selected by means of keys or keyboards of the typewriter type
    • B41J5/10Arrangements of keyboards, e.g. key button disposition

Abstract

简繁字根汉字输入技术及其键盘以实用化的汉字输入技术为核心,完全采用计算机辅助设计,每个功能都有定量的指标,具有较高的完备性的实用性。本发明包含一系列从简单易学到快速高效的汉字输入方法,使其既能处理简体汉字,又能处理繁体汉字,并且简、繁体汉字可以互相转换,本发明包含众多的辅助输入方法,可以广泛地适应各种不同要求的用户。在键盘设计上,本发明提出多页键盘的设计方案,充分发挥了标准键盘的潜力。

Description

近年来,电子计算机特别是微型计算机在我国迅速普及,涌现出了许多计算机汉字编码方案,到目前为止,已有方案尚存在下面一些问题:
已有方案一般都只处理简体汉字。随着我们同港澳台同胞和广大海外华侨之间经济、文化、技术交流的不断发展,海内外越来越多的用户要求计算机不仅能处理简体汉字,而且还要能处理繁体汉字,且要求简繁汉字能方便地互相转换,而国内外现有的繁体方案尚不能满足用户的这些需要。
当前国内流行的《五笔字型》汉字编码方案,其末笔字型交叉识别一直是用户最头痛的一个问题,其字型、成字字根、键名等概念都增大了记忆量,这些问题在此以前一直未能解决。
现有的键盘汉字输入技术一般都仅仅着眼于汉字编码方案,没有从输入技术的全局考虑,达不到较高的实用化程度,不能广泛地适应各种用户的需要。
现有的汉字编码方案,大部分是用手工搞出来的,没有经过计算机定量的分析研究,很难达到最优化的设计。
本发明的目的是利用计算机辅助设计的方法,创造一种具有多种汉字输入方法和汉字辅助输入方法的装置,以解决上述现有技术中的问题。
本发明总体上包括以下内容:
本发明以实用化的汉字输入技术为核心,完全采用计算机辅助设计,使每个功能都有定量的指标,以达到较高的完备性和实用性。本发明包含一系列从简单易学到快速高效的汉字输入方法,使其既能处理简体汉字,又能处理繁体汉字,并且简、繁体汉字可以互相转换。本发明包含众多的辅助输入方法,可以广泛地适应各种不同要求的用户。
在键盘设计上,本发明提出多页键盘的设计方案,充分发挥了标准键盘的潜力。
该多页键盘包括以下15个键盘页(总体示意图如图24):
1.繁体字根键盘页(如图1、图2)
2.简体字根键盘页(如图3、图4)
3.笔画键盘页(如图12)
4.拼音键盘页(如图15)
5.电报键盘页(如图16)
6.区位键盘页(如图17)
7.国标键盘页(如图18)
8.汉字实线表格符号键盘页(如图5)
9.汉字双实线表格符号键盘页(如图6)
10.汉字标点符号键盘页(如图7)
11.汉字选择键盘页(如图19)
12.ASCII字符键盘页(如图20)
13.换页控制键盘页(如图21)
14.状态选择键盘页(如图22)
15.混合控制键盘页(如图23)
该多页键盘的“页”,是逻辑意义上的页,并非物理意义上的页,建立“页”的概念,可以使操作人员同计算机保持同步,简单清楚地使用复杂的、被多层次定义过的汉字化键盘。一个键盘页,就是整个键盘或键盘上部分区域的一个定义表,一个键盘页处于表面,就是计算机默认键盘上的对应区域使用这个定义表。
该多页键盘的诸键盘页在同一时刻不可能全处于键盘表面,而只有几个键盘页处于表面,其余键盘页则被覆盖。需要时,可使用换页控制键或混合控制键把有关键盘页调整到表面,如:当前“拼音键盘页”、“汉字双实线表格符号键盘页”和部分“ASCII键盘页”处于表面,若要把“繁体字根键盘页”、“汉字标点符号键盘页”和“汉字实线表格符号键盘页”调整到表面,则只要键入“换页控制键盘页”上的“字根”键(ALT+F2)、“标点”键(ALT+F9)和“混合控制键盘页”上的“繁/简”键(SHIFT+F4)、“实线/双实线”键(SHIFT+F5)即可。
下面分别介绍每个键盘页。
1.繁体字根键盘页(如图1、图2)
该键盘页分布于标准键盘左边主键盘上,该键盘页是根据繁体字根汉字编码输入法的汉字字根体系、拆分体系和编码体系,综合考虑字根规律性和指法要求的频度分布等各项指标而设计成。
2.简体字根键盘页(如图3、图4)
该键盘页分布于标准键盘左边主键盘上,该键盘页是根据简体字根汉字编码输入法的汉字字根体系、拆分体系和编码体系,综合考虑字根规律性和指法要求的频度分布等各项指标而设计成。在“混合功能控制键盘页”上专设一个“Q/X”方式转换键,以便于使用繁体字根和简体字根键盘页时,可以根据频度和习惯随时调整键位布局,附图一和附图二就分别代表两种键位习惯。
3.笔画键盘页(如图12)
该键盘页分布于标准键盘右边数字键盘上,根据GB2312-80中对五种基本笔画的划分和排列顺序,将它们分别置于“1”、“2”、“3”、“4”、“5”五个数字键上,用“6”作模糊键,用“7”作词汇引导键,用“8”作重码倒选键,用“9”作重码正选键,用“0”作结束键。
4.拼音键盘页(如图15)
该键盘页分布于标准键盘左边主键盘上,使用26个英文字母键作为汉语拼音字母键,使用两个单引号作为重码正选键和重码倒选键,空格亦作为重码正选键。
5.电报键盘页(如图16)
该键盘页分布于标准键盘左上方数字键和右边数字键上,同时,使用两边键盘上的“0”到“9”十个数字键作为电报码输入键。
6.区位键盘页(如图17)
该键盘页分布于标准键盘左上方数字键和右边数字键上,同时使用两边键盘上的“0”到“9”十个数字键作为区位码输入键。
7.国标键盘页(如图18)
该键盘页分布于标准键盘左边主键盘上,使用数字键“0”到“9”和字母键“A”、“B”、“C”、“D”、“E”、“F”作为国标内码输入键。
8.汉字实线表格符号键盘页(如图5)
该键盘页分布于标准键盘右边数字键盘上,在“1”至“9”9个数字键上定义9个制表符,使之形成一个“田”字形,在“0”键上定义“丨”(竖线),在“-”(减号)键上定义“-”(横线),在“+”(加号)键上定义“+”(十字交叉线)。
9.汉字双实线表格符号键盘页(如图6)
该键盘页分布于标准键盘右边数字键盘上,在“1”至“9”9个数字键上定义9个双线制表符,使之形成一个空心的“田”字形,在“0”键上定义“‖”(双竖线),在“-”(减号)键上定义“=”(双横线),在“+”(加号)键上定义“ ”(空心双十字交叉线)。
10.汉字标点符号键盘页(如图7)
该键盘页分布于标准键盘的英文标点符号键上,一些在汉字文件输入和编辑时用不上的英文标点符号键被定义成意义相近的汉字标点符号。
11.汉字选择键盘页(如图19)
该键盘页分布于标准键盘右上方数字键上,当重码显示提示行时,该键盘页即自动浮于表面,这些数字键上原来的键盘页暂时被覆盖。
12.ASCII字符键盘页(如图20)
该键盘页即标准键盘上的基本定义,在当前键盘上处于表面的诸键盘页不能完全覆盖整个键盘时,其余部分总是露出ASCII键盘页。
13.换页控制键盘页(如图21)
该键盘页分布于键盘上“F1”到“F10”十个功能键上,当“ALT”被按下时,该键盘页即浮于表面,当需要某个键盘页浮于表面时,按下该键盘页上对应键即可。在下次使用该键盘页之前,对应键盘页会一直处于表面,但“字根”键需根据“混合控制键盘页”上的“繁/简”转换键的状态决定当前处于表面的是“繁体字根键盘页”还是“简体字根键盘页”;“表格”键需根据“混合控制键盘页”上的“实线/双实线”转换键的状态决定“汉字实线表格符号键盘页”还是“汉字双实线表格符号键盘页”处于表面。该键盘页上的“HELP”键被按下后,“换页控制键盘页”、“状态选择键盘页”和“混合控制键盘页”的定义和当前状态会显示屏幕上,若再按下这三个键盘页上的其它键,则对应的键盘页或功能简介会显于屏幕上,再按其它键则屏幕上原来内容被恢复。
14.状态选择键盘页(如图22)
该键盘页分布于标准键盘“F1”到“F10”十个功能键上,当“CTRL”被按下时,该键盘页即浮于表面,其中,“F1”到“F8”为屏幕状态选择键,“F9”为“立即造词”状态引导键,“F10”为打印机状态设定键。
15.混合控制键盘页(如图23)
该键盘页分布于标准键盘“F1”到“F10”十个功能键上,当“SHIFT”被按下时,该键盘页即浮于表面,其中,“F1”到“F3”是六个混合输入方法的启动键;“F4”到“F6”是“简/繁”状态、“实线/双实线”状态和“Q/X”状态转换键;“F7”到“F10”是辅助输入方法启动键。
本发明在产生过程中一直注重使用先进的研究方法,其每一步骤的实现都由计算机完成,反过来,在计算机完成的过程中,又为确定下一步的研究方向提供了大量的数据资料。
为研究繁体汉字输入技术,本发明首先考察了简体字和繁体字之间的各种关系,研制了强功能的造字软件,然后使用这些软件造出了16×16和24×24点阵的繁体字库(样张如附图8、附图9),这些字库为繁体汉字输入技术的研究提供了很大的方便。
本发明包含两种字根有快速输入法,一种拼音转换法,两种易学性笔画输入法,六种辅助性混合输入法,四种辅助输入法,一种辅助学习法,一种简繁汉字转换法,另外还有区位、国标和电报输入法也包含在本发明组成的实用化系统中。
每种输入法使用不同的编码字典,但所有输入法使用同一个词库,这个词库只为快速的简体字根和繁体字根输入法提供编码,其它方法的词汇编码都是在使用时临时产生的。
本发明的各个输入方法是这样实现的:
1.繁体字根汉字编码输入法和简体字根汉字编码输入法
本发明为实现繁体字根汉字编码输入法和简体字根汉字编码输入法,首先建立了两个汉字编码研究专用汉字属性库和常用词汇库,包括每个简体汉字和繁体汉字的笔顺,笔画拆分序列,字根拆分序列,最新实用频度,拼音码、国标码、电报码等信息;其次,研制了一系列计算机辅助设计程序,包括:字根使用频度和组字能力统计分析程序;根据限制条件权衡字根使用频度和组字能力的字根自动选取程序;使用汉字属性库的汉字和词汇自动编码、各级简码自动生成、重码频度自动标记程序;重码自动统计程序;供人工干予的重码结果自动分析程序;各种条件下的动态、静态码长自动计算程序;键位概率、键位二次概率、键位码序概率和码元熵值自动计算程序;编码效率自动计算程序;国标序、自编码序和字根拆分的单字码本及词汇码本的打印程序。
为确定编码字根集,首先根据传统的字根拆分方法,选出一个较全面的原始字根集,为每一字根确定一个代码,据此字根集对国标汉字进行拆分和编码,产生一个字根直接编码集,并据此统计每个字根的出现次数即字根组字频度,然后把国标集中每个汉字的使用频度加权到每个字根的代码下,既可算出每个字根的实用频度,最后综合考虑组字频度、实用频度、记忆规律性和信息量等因素,选出代表性较强的字根,即可得初选字根集。
为完成编码集,把入选字根按一定键位数和规律分组,并使每组字根的总频度大至相同。利用字根选取时产生的字根直接编码集,把被删除的字根用初始字根集中的字根组成,把所有字根代码换为其所属分组的代码,即可产生一个初始编码集。然后,进行多指标的编码分析,以确定简码集和重码次序。
对初始编码按外码大小排序,在排序文件中,相邻编码相同的即为重码。为确定简码,对排序结果进行分组,当键位数为K,码长极限为四时,可分三组。
A.一码分组:把第一码相同的编码子集分为一组,这样,结果是K组。
B.两码分组:把第一码和第二码都相同的编码子集分为一组,结果应不大于K^2组。
C.三码分组:把第一、第二、第三码都相同的编码子集分为一组,其结果应不大于K^3组。
对每一种分组,应考察其组内编码的以下几个方面的情况:
A.重码:对重码者,应优先考虑定义其中使用频度高的为简码,以减少重码率和重码处理率。
B.末笔:以末笔追加结尾的,优先考虑定义为简码,以减轻操作人员因末笔追加所造成的负担。
C.频度:使用频度高的,应优先考虑定义为简码,以减少动态平均码长,提高键入速度。
根据考察结果,按某种优先级算法,即可在每组中确定一个简码。
简码确定后,综合考虑每组重码的以下几方面情况:
A.频度:
一般情况,对一组重码汉字中每个字应按其使用频度高低排序,并把频度高者定义在默认位置。
B.简码:
若一组重码汉字中,频度最高者已被定义为简码,应考虑把频度次高者定义在默认位置。
根据考查结果,按一定的优先级算法即可在每组汉字中,选定一个,定义在默认位置,在实际使用中,操作人员遇到一组重码汉字时,系统根据预先排好的顺序,依次提示其中每个汉字,当准备选择其被定义在默认位置者(第一个)时,可不作任何处理,继续正常输入,系统自动接受被定义在默认位置者。
对上述结果,考察其以下几个重要指标,进行定量分析:
A.重码数:
B.重码率:
C.重码处理率:
D.键位概率:
E.键位二次概率:
F.键位码序概率:
G.码元商值:
H.静态全码平均码长:
I.动态简码平均码长:
对以上定量分析的指标,根据设计目标进行综合权衡,对某些不能令人满意指标,分析其原因,采取相应对策,如减少字根、调整字根、增加字根、修改规则等等。然后,据此产生一新的编码集,回到前面再行分析,如此循环往复,直到产生理想的结果。
单字编码完成以后即可考虑词汇编码,先选定基本词汇集,如5000条,然后到单字码集中取来每条词汇中每个字的编码再按词汇编码规则,抽取每个字中特定位置编码即可产生每条词汇码,进而组成词汇码集。
按照某种格式把每个汉字的全码、简码结合在一起,即可打印出国标顺序或自编码顺序的码本(码本样品如附图10、图11)。
繁体字根和简体字根汉字编码输入法正是这样产生的。
最后产生的繁体字根和简体字根汉字编码输入法,都有187个基本字根及字根类,被分为5组,分别置于“A”~“Y”25个英文字母键上,形成繁体字根键盘页和简体字根键盘页,如图1、图2、图3和图4。在图1和图3的键盘页上,频度分布如图13和图14,可以看出,其分布规律是基本符合指法要求的。
繁体字根和简体字根汉字编码输入法的GB2312-80序列码本样张如图10和图11,整个码本按区分页,每页划分100个方格,一个区的所有汉字放在其中的94个方格中,每个方格有五行信息,第一行是“X”方式的编码,第二行是“Q”方式的编码,第三是汉字本身和二级简码及三级简码标志,第四行是字根拆分,第五行是字根数字编码。
使用繁体字根或简体字根汉字编码输入法对任一汉字进行编码输入时,先依其书写顺序拆取其第一、二、三个字根,若还未拆取完,则直接拆取其最后一个字根,若三个以内已拆完则在字根拆分序列后补加整个字的最后一个笔画,如:
德-丿(T)亻(R)十(X)心(N);
怀-忄(H)不(I)、(Y)
对于本身是字根的汉字,仍用上面的方法把它拆成更小的字根序列,如果这个字根序列的长度小于四,则追加其本身于这个拆分序列之尾。如:
甲-日(T)丨(H)丨(H)甲(L);
馬-
Figure 891038620_IMG3
(D)乙(N)灬(O)丶(Y);
这种方法不再特殊考虑键名、成字字根、字型、交叉识别等问题。
其一、二、三级简码和词汇码都由计算机用前述方法自动产生。如:
依-
全码:亻(R)亠(I)
Figure 891038620_IMG4
(E)丶(Y);
三级简码:亻(R)亠(I)
Figure 891038620_IMG5
(E);
二级简码:亻(R)亠(I);
依据-
词汇码:亻(R)亠(I)扌(W)尸(M);
2.拼音字词转换法
这种方法拥有一张独立的拼音汉字对照表,但使用公共的词汇库。
要输入一个汉字时,只有输入这个汉字的前一个到几个拼音字母,这个字就会显示在提示行,如果要这个字,则打对应选择键,如果要打以这个字开头的一条词组,则不管这个字已输入了几个拼音字母,随时都可打第二个汉字的前几个拼音字母,这条词汇即显于提示行,否则接着打第三个字的前几个拼音字母,直至这条词汇显于提示行。如:
“中华人民共和国”的拼音单字转换码是:
ZHONG    HUA    REN    MIN    GOWG    HE    GON;
如打词汇则有如下多种打法:
ZHHRMGHG
ZHOHUAREGHG
ZHONGHUARMGHGH
……
这种转换法的内部实现方法是:
(1)当从键盘输入一个汉字拼音的前一个至几个字母时,软件即检索出那些拼音的前几个字母同输入字母序列相同的所有汉字,并根据当前所处的是自动状态还是非自动状态决定是把检索出的汉字送至提示行还是等待键盘继续输入发来结束符。
(2)如果此时发来结束符或处于自动状态则将检索出的汉字送至提示行供选择。
(3)如果此时键盘发一选择键则把相应汉字送出,如果发来字母键,则把此字母追加入(1)步时之字母序则考察这个序列是否一个汉字拼音的前几个字母,若是则回第(1)步,若非则:
(4)把此键及此后诸键看成下一汉字的拼音字母的前几个,检索出前几个拼音字母与之相同的所有汉字。
(5)若这些汉字与前面检索出的汉字顺序组合起来,同公共词汇库中的一些词组相同,则将这些词组检出,回到第三步,同处理单字一样处理词组,否则送出提示行的第一个汉字,把(4)步所选出的汉字显示提示行,如是循环,即可完成转换。
3.全拆分笔画输入法
这种方法依照GB2312-80内对五个基本笔画的划分和排序,把每个汉字按照五个基本笔划拆成一个笔划序列,建立一个从汉字到笔画序列的对照表,这种方法的软件处理同拼音字词转换法非常相似。
用这种方法输入一个汉字时,可以输入这个汉字的全部笔划或前几个笔画,这个汉字即可显示在提示行上。
用这种方法输入一条词汇时,可以依次输入词汇中每个汉字的前几个笔划,输入的笔划越多,这条词汇就越容易命中。如:
专:一一乙丶
家:丶丶乙一丿乙丿丿丿丶
“中华人民共和国”可有如下多种打法:
丨丿丿乙一丿丨
丨乙丿丨丿乙一丿丨
丨乙一丨丿丨丿丶乙一丿丨
4.字根笔划混合输入法
在这种输入方法下,可以用左边字母键盘按繁体字根或简体字根输入法输入,也可以用右边数字键盘按全拆分笔划输入法输入,也可先用右边字母键输入1~3个字根,再用右边数字键输入几个笔划,反之亦可,这样可以方便准确地输入一个汉字,如:
“梁”有如下多种打法:
氵(I)刀(V)八(W)木(S)
氵(I)刀(V)八(W)丶(4)
丶(4)丶(4)一(1)?(Z)刀(V)
……
5.字根拼音混合输入法
在这种输入方法下,可以用下铛键按繁体字根或简体字根输入法、用上档键按拼音字词转换法混合输入,如:
“梁”有如下多种打法:
氵(I)刀(V)l(l)i(i)
氵(I)刀(V)八(W)l(l)
l(l)氵(I)刀(V)八(W)
l(l)i(i)a(a)氵(I)
……
6.笔画拼音混合输入法
在这种输入方法下,可以用左边字母键盘按拼音字词转换法、用右边数字键盘按全拆分笔划输入法混合输入,如:
“梁”有如下多种打法:
l(l)i(i)丶(4)丶(4)一(l)
丶(4)丶(4)一(l)l(l)i(i)a(a)
……
7.强化联想辅助输入法
这是一种辅助输入法,在使用其它输入方法输入汉字时,原输入法照常使用,但每输入一个汉字时,提示行会自动显示包含此字的所有词汇供选择,如果提示行中没有所要词汇,则可打“TAB”键继续向后寻找。如:
输入“道”,提示行即显示:
“联想:0道    1道德    2道理    3道路……9难道”
若打一下空格键,提示行即继续显示:
“联想:0道    1街道    2知道    4报道……9通道”
若打1,则“街道”即显示编辑位置。
8.模糊式辅助输入法
在用任何一种输入法输入汉字时,如果遇到不能确定的输入码,可用“?”或“Z”或“6”代替,计算机会自动寻找符合条件的汉字,若仅有一个,则直接提供出来,若有几个,则显示提示行供选择。如:
在拼音字词转换法下,可用“?”作模糊键,若打入“?NG”,提示行就显示如下:
“?ng    1肮ANG    2昂ANG    3盎ANG    4盎司ANGSI”
9.自动式输入法
这是一种辅助输入法,在自动状态下用任何一种输入法输入汉字时,每输入一键,前几键符合此键的汉字会显于提示行供选择,如:
在繁体字根输入状态,从键盘每输入一键,提示行就逐步显示如下:
“w    1人W    2发WX    3分WV    4父WQ    5公WP”
“wn    1今WN    2含WNK    3今WNN    4贪WNM    5衾WNI”
“wnn    1今WN    6今WNN    3念WNNY    4捻CWNN    5巷AWNN”
“wnny    1念WNNY”
10.立即造词辅助输入法
使用这种方法,在任何汉字输入状态或编辑状态,当需要把屏幕上一串汉字作为词组时,把光标移至这串汉字的第一个汉字上,键入立即造词键,然后光标移至这串汉字的末尾一个汉字上,键入结束键,由软件把光标扫过的这串汉字作为词组存入词汇库,并根据每种汉字输入法的规则自动为这条词组编出每种方法下的编码,在以后的汉字输入中即可马上使用这些编码输入这条词组。
11.编码返回式学习法
这是一种辅助学习方法,在一种输入法的学习状态下,用另一种输入法输入一个汉字,提示行会显示出这个汉字的编码,如:
在拼音学习状态下,用简体字根输入“政”字,则提示行就显示:
“ghty    1政    ZHENG”
12.汉字注汉语拼音、电报码程序
编码返回式学习法做成独立程序即可为汉字注汉语拼音、电报、国标、及简体字根、繁体字根的编码。如汉字注拼音程序名为“ZY”,执行之,输入“简繁字根汉字编码输入法”,则被注音如下:
“JIAN    FAN    ZI    GEN    HAN    ZI    BIAN    MA    SHU    RU    FA
简    繁    字    根    汉    字    编    码    输    入    法”
13.字根笔划返回式学习法
这是一种辅助学习方法,在一种字形输入法的学习状态下,用另一种输入法输入一个汉字,提示行会显示出这个汉字的字根笔划,如:
在简体字根学习状态下,用繁体字根输入“体”字,则提示行就显示:
“mvmo    1    体    亻木一一”
14.简繁转换法
选取一定数量的由多个繁体字对应一个简体字或一个简体字对应多个繁体字中的不同意义的繁体字或简体字构成的词汇,如果有一篇简体字文章要转换成繁体字文章,在使用简繁转换法转换时,光标逐个走过被转换的文章中汉字,对没有疑问的汉字,光标不停留,对于一个简体字对应多个繁体字的汉字,先在内部专用词库中检索,找到此字后,考察上下文是否符合一条词,若是,则这条词包含的那个繁体字即对应的繁体字,若不是,则继续检索;若用这种方法还不能确定,则光标停留于这个汉字上,显出对应繁体汉字中常用的一个繁体字请用户选择,用户可输入任一字母键或空格键,这个汉字对应的繁体汉字会逐一显示出,若欲选之繁体字出现,则按回车键,即表示选中,光标自动向后继续移动。
本发明对汉字进行编码、对键盘进行设计或定义、对码本进行编排、对字库进行构造的方法,可以用于一切型号的计算机、打字机、终端和电传机上。
附图目录
图1……繁体字根键盘页(Q方式)
图2……繁体字根键盘页(X方式)
图3……简体字根键盘页(Q方式)
图4……简体字根键盘页(X方式)
图5……汉字实线表格键盘页
图6……汉字双实线表格键盘页
图7……汉字标点符号键盘页
图8……16×16点阵字样
图9……24×24点阵字样
图10…繁体字根汉字编码输入法码本样品
图11…简体字根汉字编码输入法码本样品
图12…全拆分繁体和简体笔画输入法键盘页
图13…繁体字根汉字编码输入法键盘静态频度分布表
图14…简体字根汉字编码输入法键盘静态频度分布表
图15…拼音键盘页
图16…电报键盘页
图17…区位键盘页
图18…国标键盘页
图19…汉字选择键盘页
图20…ASCII字符键盘页
图21…换页控制键盘页
图22…状态选择键盘页
图23…混合控制键盘页
图24…多页键盘总体示意图

Claims (21)

1、一种标准英文键盘的汉字化装置或一种专用汉字键盘,其特征在于其包含以下键盘页的多页式设计方案:
(1)繁体字根键盘页(如图1、图2)
(2)简体字根键盘页(如图3、图4)
(3)汉字实线表格符号键盘页(如图5)
(4)汉字双实线表格符号键盘页(如图6)
(5)汉字标点符号键盘页(如图7)
2、根据权利要求1的汉字化装置,包含多种汉字输入方法和辅助输入方法:
(1)字形类繁体字根编码输入法
(2)字形类简体字根编码输入法
(3)拼音类拼音字词转换法
(4)易学性字形类全拆分繁体笔画输入法
(5)易学性字形类全拆分简体笔画输入法
(6)辅助性繁体字根笔画混合输入法
(7)辅助性简体字根笔画混合输入法
(8)辅助性繁体字根拼音混合输入法
(9)辅助性简体字根拼音混合输入法
(10)辅助性繁体笔画拼音混合输入法
(11)辅助性简体笔画拼音混合输入法
(12)强化联想辅助输入法
(13)模糊式辅助输入法
(14)自动式辅助输入法
(15)立即造词辅助输入法
(16)编码返回式辅助学习法
(17)字根笔画返回式辅助学习法
3、根据权利要求2的繁体字根编码输入法,其特征在于,根据使最终重码少,记忆量小等原则,考虑汉字书写习惯,使用计算机辅助设计的方法,选择一定数量符合汉字拆分习惯的字根和字根类;按照字根形似等规律,考虑频度均匀性,把字根分组,并按指法要求将每组字根分别命一英文字母作代码;对所有汉字,按书写顺序拆取其一、二、三、末四个字根,并根据前述分组进行编码,从而形成一个汉字拆分体系和编码体系。
4、如同权利要求3的方法,对任一汉字一律按照书写顺序将其拆成比自身小的由前面选定的字根组成之序列;若一个序列的长度小于四,则在序列尾加上这个汉字最后一个笔画字根,若一个序列的长度大于四则在序列中抽去第四个到倒数第二个字根。
5、如同权利要求4的方法,对已被选作字根的汉字,使用与普通汉字相同的方法把其拆分成比本身更小的字根组成之序列,直至单笔画,如果这个字根序列的长度小于四,则追加其本身于这个拆分序列之尾。
6、根据权利要求2的16×16点阵和24×24点阵繁体汉字库(字样如图8、图9),其特征是在选取汉字集时以GB2312-80基本集为基础,把其中对应有繁体字和异体字的2218个汉字改为繁体字形或异体字形,其它字字形不变,并增加121个繁体字形及异体字形,用于存放被一个简体字对应的多个繁体字,把由此产生的字形集以16×16点阵和24×24点阵数字化。
7、根据权利要求3、4、5处理繁体汉字的编码输入法,也可以处理简体汉字,从而产生简体字根汉字编码输入法。繁体字根汉字编码输入法和简体字根汉字编码输入法具有相同的编码规则和基本相同的键盘页安排。繁体字根汉字编码输入法和简体字根汉字编码输入法的GB2312-80顺序码本(样品如图10、图11)同时给出两种不同键位的编码和两种简码,并且给出汉字的字根拆分序列。
8、根据权利要求1的繁体字根键盘页和简体字根键盘页,其特征是可以根据频度和习惯随时调整键位布局(如图一、图二分别代表两种键位习惯)。
9、根据权利要求1的汉字实线表格符号键盘页(如图5)和汉字双实线表格符号键盘页(如图6),其特征是创造一种直观记忆装置,在右边数字键盘的“1”至“9”9个数字键上定义9个制表符,使之形成一个“田”字形,在“0”键上定义“丨”(竖线),在“-”(减号)键上定义“-”(横线),在“+”(加号)键上定义“+”(十字交叉线)。
10、根据权利要求1的汉字标点符号键盘页(如图7),其特征是把一些在汉字文件输入和编辑时用不上的英文标点符号键定义成意义相近的汉字标点符号。
11、根据权利要求2的拼音字词转换法,其特征是通过如下过程完成转换:
(1)建立一张每个汉字与其拼音码序列的对照表,称为基本拼音表。
(2)使用一个包含一定数量汉字词组的公共动态词汇库。
(3)当从键盘输入一个汉字拼音的前一个至几个字母时,软件即检索出那些拼音的前几个字母同输入字母序列相同的所有汉字,并根据当前所处的是自动状态还是非自动状态决定是把检索出的汉字送至提示行还是等待键盘继续输入发来结束符。
(4)如果此时发来结束符或处于处于自动状态则将检索出的汉字送至提示行供选择。
(5)如果此时键盘发一选择键则把相应汉字送出,如果发来字母键,则把此字母追加入3步时之字母序并考察这个序列是否一个汉字拼音的前几个字母,若是则回第3步,若非则:
(6)把此键及此后诸键看成下一汉字的拼音字母的前几个,检索出前几个拼音字母与之相同的所有汉字。
(7)若这些汉字与前面检索出的汉字顺序组合起来,同2中建立的词汇库中的一些词组相同,则将这些词组检出,回到第三步,同处理单字一样处理词组,否则送出提示行的第一个汉字,把6步所选出的汉字显于提示行,如是循环,即可完成转换。
12、根据权利要求2的全拆分笔画输入法,其特征是将汉字拆成“一丨丿丶乙”五种基本笔画的序列,对从键盘输入的一个笔画序列,所有笔画拆分序列包含这个输入序列的汉字都算命中,显示提示行供选择。这种方法用于繁体汉字即繁体汉字笔画全拆分输入法;这种方法用于简体汉字即简体汉字笔画全拆分输入法。
13、根据权利要求2的字根笔画混合输入法,其特征是使用左边大键盘作字根输入键盘,用右边小键盘作笔画输入键盘,输入时,把从左边大键盘输入的编码所命中的汉字的集合和右边小键盘输入的编码所命中的汉字的集合的交集作为命中汉字的集合显示提示行供选择。这种方法用于繁体汉字即繁体字根笔画混合输入法;这种方法用于简体汉字即简体字根笔画混合输入法。
14、根据权利要求2的字根拼音混合输入法,其特征为使用下档键作字根输入,使用上档键作拼音输入,把两种输入方法各自命中汉字的集合的交集作为命中汉字的集合,显于提示行供选择。这种方法用于繁体汉字即繁体字根拼音混合输入法;这种方法用于简体汉字即简体字根拼音混合输入法。
15、根据权利要求2的笔画拼音混合输入法,其特征为用左边字母键盘作拼音输入,用右边数字键盘作笔画输入,把两种方法命中汉字的交集作为命中汉字的集合显于提示行供选择。这种方法用于繁体汉字即繁体笔画拼音混合输入法;这种方法用于简体汉字即简体笔画拼音混合输入法。
16、根据权利要求2的强化联想辅助输入法,其特征是,在使用任何一种输入方法输入汉字时,每输入一个汉字或词组,就把这个汉字或这条词组的最后一个汉字作为联想源同机内词汇库每条词组中的每个汉字比较,所有包含联想源的词组都作为命中词组显示提示行供选择。
17、根据权利要求2的模糊式辅助输入法,其特征是在使用任何输入方法输入汉字时对于不能确定的编码用“?”或其它特定键代替,则软件可在提示行显示正确汉字。
18、根据权利要求2的自动式辅助输入法,其特征是用任一种输入方法输入汉字时,从键盘上每输入一键或几键,即把所有首键或前几键与输入键相同的汉字或词组作为命中汉字或词组的集合显示提示行,这时,如果从键盘打入选择键,则送出相应汉字或词组,如果继续输入编码键,则把此键追加入输入键的序列,再回到前面继续检索,如此循环直至输入选择键或结束键。
19、根据权利要求2的立即造词辅助输入法,其特征是在任何汉字输入状态或编辑状态,当需要把屏幕上一串汉字作为词组时,把光标移至这串汉字的第一个汉字上,键入立即造词键,然后光标移至这串汉字的末尾一个汉字上,键入结束键,由软件把光标扫过的这串汉字作为词组存入词汇库,并根据每种汉字输入法的规则自动为这条词组编出每种方法下的编码,在以后的汉字输入中即可马上使用这些编码输入这条词组。
20、根据权利要求2的编码返回式学习法,其特征是在某种输入法学习状态下,无论用何种输入法输入之汉字,都在提示行显示被学习输入法的这个汉字的所有编码。
21、根据权利要求2的字根笔画返回式学习法,其特征是在某种字形输入法学习状态下,无论用何种输入法输入之汉字,都在提示行显示被学习输入法的这个汉字的所有字根拆分或笔画拆分。
CN89103862.0A 1989-06-19 1989-06-19 简繁五笔字根汉字输入系统 Expired - Fee Related CN1023916C (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN89103862.0A CN1023916C (zh) 1989-06-19 1989-06-19 简繁五笔字根汉字输入系统
US07/540,491 US5197810A (en) 1989-06-19 1990-06-19 Method and system for inputting simplified form and/or original complex form of Chinese character

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN89103862.0A CN1023916C (zh) 1989-06-19 1989-06-19 简繁五笔字根汉字输入系统

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN92108505A Division CN1026271C (zh) 1993-07-05 1993-07-05 智能拼音汉字输入系统

Publications (2)

Publication Number Publication Date
CN1040276A true CN1040276A (zh) 1990-03-07
CN1023916C CN1023916C (zh) 1994-03-02

Family

ID=4855328

Family Applications (1)

Application Number Title Priority Date Filing Date
CN89103862.0A Expired - Fee Related CN1023916C (zh) 1989-06-19 1989-06-19 简繁五笔字根汉字输入系统

Country Status (2)

Country Link
US (1) US5197810A (zh)
CN (1) CN1023916C (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1107254C (zh) * 1996-03-24 2003-04-30 陈劲松 汉字阴阳双极声韵形码输入系统

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6366697B1 (en) 1993-10-06 2002-04-02 Xerox Corporation Rotationally desensitized unistroke handwriting recognition
US5410306A (en) * 1993-10-27 1995-04-25 Ye; Liana X. Chinese phrasal stepcode
CN1039666C (zh) * 1993-11-06 1998-09-02 黄飞梦 基于两笔形与两笔符的汉字输入方法及键盘
CA2137981C (en) * 1993-12-22 2001-04-17 Steven A. Shaiman Method and system for presenting alternatives for selection using adaptive learning
WO1996001453A1 (en) 1994-07-01 1996-01-18 Palm Computing, Inc. Multiple pen stroke character set and handwriting recognition system
US6351726B1 (en) * 1996-12-02 2002-02-26 Microsoft Corporation Method and system for unambiguously inputting multi-byte characters into a computer from a braille input device
US5889888A (en) 1996-12-05 1999-03-30 3Com Corporation Method and apparatus for immediate response handwriting recognition system that handles multiple character sets
US7257528B1 (en) * 1998-02-13 2007-08-14 Zi Corporation Of Canada, Inc. Method and apparatus for Chinese character text input
US6094666A (en) * 1998-06-18 2000-07-25 Li; Peng T. Chinese character input scheme having ten symbol groupings of chinese characters in a recumbent or upright configuration
AUPP665398A0 (en) * 1998-10-22 1998-11-12 Charactech Pty. Limited Chinese keyboard, input devices, methods and systems
JP2000235567A (ja) * 1999-02-17 2000-08-29 Matsushita Electric Ind Co Ltd 声調符号無入力式中国語文字変換装置
KR100344947B1 (ko) * 2000-04-03 2002-07-22 이관동 한자입력장치 및 방법
US7013422B2 (en) * 2001-06-15 2006-03-14 International Business Machines Corporation Noise removal in multibyte text encodings using statistical models
US6799914B2 (en) * 2001-06-27 2004-10-05 Timespace System Co., Ltd. Arabic-persian alphabeth input apparatus
JP2005508031A (ja) * 2001-08-30 2005-03-24 アメリカ オンライン インコーポレーティッド 部首に基づいた、適合化可能な画の書き順システム
US20040221236A1 (en) * 2001-09-20 2004-11-04 Choi Kam Chung Happy, interesting, quick learning inputting method of Chinese characters in stroke character pattern codes
TW530223B (en) * 2001-12-07 2003-05-01 Inventec Corp Chinese phonetic input system having functions of incomplete spelling and fuzzy phonetic comparing, and the method thereof
AU2003246114B2 (en) * 2002-06-05 2010-06-03 Rongbin Su Input method for optimizing digitize operation code for the world characters information and information processing system thereof
US20040080487A1 (en) * 2002-10-29 2004-04-29 Griffin Jason T. Electronic device having keyboard for thumb typing
US20050027534A1 (en) * 2003-07-30 2005-02-03 Meurs Pim Van Phonetic and stroke input methods of Chinese characters and phrases
US7395203B2 (en) * 2003-07-30 2008-07-01 Tegic Communications, Inc. System and method for disambiguating phonetic input
US20050264584A1 (en) * 2004-05-27 2005-12-01 Zhu-Min Di [method for fast input of chinese character]
TWI447636B (zh) * 2006-12-18 2014-08-01 Semantic Ompaction Systems 用於中文字選擇及輸出的裝置,方法及電腦可讀媒體
US8677237B2 (en) * 2007-03-01 2014-03-18 Microsoft Corporation Integrated pinyin and stroke input
US8316295B2 (en) * 2007-03-01 2012-11-20 Microsoft Corporation Shared language model
US20080211777A1 (en) * 2007-03-01 2008-09-04 Microsoft Corporation Stroke number input
TWI412955B (zh) * 2009-08-19 2013-10-21 Inventec Appliances Corp 漢字書寫筆順之提示方法、電子裝置及電腦程式產品
CN102004557A (zh) * 2010-04-29 2011-04-06 丁树雄 笔顺声码汉字输入技术方案
US8438008B2 (en) 2010-08-03 2013-05-07 King Fahd University Of Petroleum And Minerals Method of generating a transliteration font
USD667414S1 (en) * 2011-05-18 2012-09-18 King Saud University Ergonomic arabic keyboard
USD768670S1 (en) * 2014-03-28 2016-10-11 Jan Magnus Edman Display screen with graphical user interface
CN104793757B (zh) * 2015-04-29 2019-03-01 陈治宇 汉字输入方法和装置
USD846563S1 (en) 2016-02-12 2019-04-23 Yonggui Li Display screen or portion thereof with keyboard graphical user interface
USD846564S1 (en) 2016-02-12 2019-04-23 Yonggui Li Display screen or portion thereof with keyboard graphical user interface
CN110232172A (zh) * 2019-06-12 2019-09-13 周业勇 一种文字拆分方式

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4379288A (en) * 1980-03-11 1983-04-05 Leung Daniel L Means for encoding ideographic characters
US4559615A (en) * 1982-09-15 1985-12-17 Goo Atkin Y Method and apparatus for encoding, storing and accessing characters of a Chinese character-based language
US4505602A (en) * 1982-09-30 1985-03-19 Wong Wyman S Method for encoding ideographic characters
US4684926A (en) * 1984-05-14 1987-08-04 Yong Min Wang Universal system of encoding chinese characters and its keyboard
CA1279128C (en) * 1986-08-18 1991-01-15 Andrew Chiu Means and method for electronic coding of ideographic characters
US5006001A (en) * 1989-09-27 1991-04-09 Vulcano Terrance E Keyboard with one hand character key array and one hand mapping key array

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1107254C (zh) * 1996-03-24 2003-04-30 陈劲松 汉字阴阳双极声韵形码输入系统

Also Published As

Publication number Publication date
CN1023916C (zh) 1994-03-02
US5197810A (en) 1993-03-30

Similar Documents

Publication Publication Date Title
CN1040276A (zh) 简繁字根汉字输入技术及其键盘
CN1095560C (zh) 修改汉字转换结果的系统
CN1259615C (zh) 字母键盘和数字键盘通用汉字输入法及其左半字形识别法
CN1026924C (zh) 汉字析音编码计算机汉字输入方法
CN1129058C (zh) 仿真拼音汉字输入法
CN1036422C (zh) 汉字笔形关联编码计算机输入方法及其键盘
CN1123819C (zh) 计算机汉字键位码输入方法
CN1275732A (zh) 汉语键盘输入系统及其应用技术
CN1092815C (zh) 一种汉字辞书检索和微机输入法及键盘
CN1052200A (zh) 音形义字词兼容编码系列及键盘
CN1143231C (zh) 汉语信息处理装置
CN1604017A (zh) 基于一健一字的汉字特征定位编码复合输入方法
CN1317906A (zh) 移动通信与计算机信息处理中英文数字化输入集成系统
CN1845053A (zh) 手写拼式移动虚拟键盘认别拼音汉字英文输入技术
CN1453692A (zh) 一种汉字拼形输入法的智能输入处理方法
CN1062797A (zh) 文字输入键盘及方法
CN1591293A (zh) 汉字拼形输入法
CN1115620C (zh) 音形多能码中文字符输入法
CN1058342C (zh) 汉字编码的计算机输入方法
CN1019527B (zh) 字符的图元输入方法及其键盘
CN100342311C (zh) 根拆式汉字输入及其显示方法
CN1220127C (zh) 双分汉字与双分输入法及合成字模
CN1050913C (zh) 中文部首代码编码输入的文书处理装置
CN1713120A (zh) 英文字根输入法
CN1134561A (zh) 九笔特征汉字编码

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C15 Extension of patent right duration from 15 to 20 years for appl. with date before 31.12.1992 and still valid on 11.12.2001 (patent law change 1993)
OR01 Other related matters
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee