CN1032559C - 文字输入加速方法 - Google Patents
文字输入加速方法 Download PDFInfo
- Publication number
- CN1032559C CN1032559C CN 92112716 CN92112716A CN1032559C CN 1032559 C CN1032559 C CN 1032559C CN 92112716 CN92112716 CN 92112716 CN 92112716 A CN92112716 A CN 92112716A CN 1032559 C CN1032559 C CN 1032559C
- Authority
- CN
- China
- Prior art keywords
- keyboard
- word
- key
- input
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
一种用于计算机的文字输入加速方法,采用词长分离原则,把所用文字的常用字词根据词长的差异分成两到四个集,并在计算机存储器中建立相应的词库,在计算机健盘上设置输入加速健,在此基础上用词长多重分流截尾加速输入的处理技术,当计算机从键盘接收到字符串后,分别从上述各词库中检索出相应的候选词并在显示器上显示,用户根据目标词的匹配情况,以相应的加速键选中目标词结束输入。该方法适用于各种文字和编码方法,能显著提高输入速度。
Description
本发明涉及数字计算机的输入机构技术领域,尤其是一种用于计算机的键盘式文字输入方法和实现该方法的设备。
键盘式输入是在计算机上输入文字的最主要和最普遍的手段。
计算机键盘是机械式打字机在计算机设备中的自然延续。计算机键盘和打字机键盘在基本键位的排列上是一致的。
对于拼音文字,例如英文,用计算机键盘输入文字与用打字机打印文字几乎是相同的。计算机逐个字符接受并存储或显示操作员在键盘上输入的文字信息。这是一种直接输入方式。
对于非拼音的形意文字,例如汉字,在计算机上输入文字,一般是采用编码的方法,按某种规则把文字中的字和词用字母或数字等键盘通用符号编码,由计算机程序将接收到的字符串转换成对应的字或词后存储或显示。这是一种间接输入方式。
目前在我国大陆、香港和台湾市场上流行的各种主要汉字编码输入法,尚未达到易学性和高效性的良好统一,能被各种层次广大用户普遍接受的很少。从社会普遍应用的角度考察,目前汉字的间接输入方式从整体上讲确实还比不上拼音文字的直接输入方式方便快捷。
由于这种状况,我国国家科研机构和民间科研力量都在大力继续研究汉字输入方法的改进,希望取得汉字输入的新突破。
迄今为止的绝大部分汉字键盘式输入的研究,都遵循基本相同的思路:继续研制寻找新的编码方法。各种新编码方法不断问世。虽然每一种编码方法一般都具有自己的特色,但各种不同的编码方法之间缺少兼容性与相通性。编码方法越多,用户越是难于选择;而且由于每一种科技产品都有它的生命周期,编码方法也不例外,一旦市场主导的编码方法发生淘汰与更新,大量用户立刻陷入已掌握的编码方法也要随之淘汰、必须重新学习新方法的状况。这样势必造成对人类主体知识资源的巨大浪费。
如果提升到较高的层面,可以考虑另一种思路:是否存在着适用于任何编码系统的独立的高速输入方法。
从更广泛的角度考察,还可以提出这样的问题,是否存在着适合于任何文字的独立的高速输入方法。
这是电脑键盘式文字输入方法改进的根本性的问题。换言之,目前缺少一种独立于任何具体文字,独立于任何文字中的具体编码方法的普遍适用的文字高速输入方法。
电脑键盘是西文打字机在计算机设备中的自然延续,所以西文的计算机键盘输入法也是机械式打字机打字法的自然延续。由于计算机键盘的击键力度明显小于机械式打字机,它能够提高打字员的击键速度从而提高输入速度。但提高的幅度很有限。除此以外,西文计算机键盘输入与打字机打字相比,缺乏根本性的进步。
直接式输入方式是传统机械式打字机唯一可以使用的方法,因为机械式打字机没办法采用间接输入方法。但这并不意味着直接式输入方法就是最好的输入法。换言之,对西文输入来说,计算机键盘输入没有能够摆脱机械式打字机直接输入这种传统模式的束缚。
如果仅仅从表面层次分析,就会得出间接输入方式不如直接输入方式直观方便的结论。但实际上,汉字编码计算机键盘间接输入的方法,却包含了计算机键盘输入改革与发展的方向,蕴藏着巨大的优越性。可是这一发展方向和潜在的优越性并没有得到清醒的认识和足够的重视。
撇开具体的语种和编码方法,从基本方法论上考察,间接输入的本质是计算机程序对接收的字符串进行智能化的预处理。这实际上代表着计算机键盘输入发展进步的根本方向,是提高计算机键盘输入速度的主要途径,具有普遍的实用意义。
本发明的目的是提供一种灵活通用的计算机键盘输入的方法和实现该方法的设备。它独立于任何具体文字,独立于任何一种文字中的具体编码方法;它与现有的计算机键盘完全兼容;它能够显著提高计算机键盘的文字输入速度;它适用于任何一种文字,适用于任何一种文字中的任何一种编码方法。
本发明的目的可以通过以下措施来达到:将所用文字按字、词本身的长度不同分类为两到四个子集,在计算机存储器中建立相应的库,键盘上设置加速键,并与显示器结合一起在数字计算机上实现。这种方法适用于各种文字各种编码方案,并且采用如下步骤:
1)按字、词本身的长度,将所用文字中的常用字、词和短语构成的词汇全集,根据其相对于词长的静态量分布和动态使用频度分布,以词长差异为界线划分成两到四个子集,一般划分为三个子集;
2)对上述划分出的词汇子集分别在计算机存储器中建立相应的词库,并对每个词库中的字、词和短语按高频优先的原则建立利于检索和显示的数据结构;
3)计算机程序对从键盘接收到的文字字符串或编码字符串分别在上述数据结构中进行检索,将相应词库中前缀字母与该字符串相同的多个候选词检索出来,同时在显示器提示行中分别显示;
4)用户根据目标词的匹配情况,击打预先设置的空格键(21)或加速键(22)、(23),从上述显示器提示行的候选词中选中目标词以结束输入。
与上述步骤相配合,以计算机传统键盘为基础,重新定义两到四组键位内容或改造两到四个键位以适合文字输入加速方法。这种加速键的设置可以有多种方式,第一种方案是把传统计算机键盘上的单空格键分隔成两
二.词库词长梯度分离的通用原则
所谓词库词长梯度分离,是把一种特定语言中的常用字、词和短语根据它们词长的量差异划分成若干个子集、一般划分为三个子集。也可以划分为两个或四个子集。现主要以三个子集为例说明。
字、词和短语是语言的建筑材料。在拼音文字中,词可以由一个到数十个字母组成。在汉语中,词是由一个到数个汉字组成,撇开具体语种,人类的任何一种书面语中的字、词和短语都可以看作是平面上线性排列的符号串。为方便起见,将此符号串的长度,即符号的个数,统称为词长。
对于每一种文字,按照词长的差异,把字、词和短语划分为三个子集。我们主要以具有代表性的英文和汉字为例说明划分方法,其他文字可以用相通的原则类推。
英文:把由1到5个字母组成的词归入一个子集,把6到10个字母组成的字、词和短语归入一个子集,把超过10个字母组成的字、词和短语归入一个子集。对后两个子集分别建立词库,称作梯度二词库和梯度三词库。
汉字:把单字词归入一个子集,把双字词归入一个子集,把三字和三字以上的字、词和短语归入一个子集。对三个子集分别建立词库。分别称作梯度一、梯度二和梯度三词库,也就是单字词库、双字词库和多字词库。
需要说明的是,以上划分方法不是唯一的。对于每一种文字,应当根据该文字中词条相对于词长的静态量分布和动态使用频度分布、同时结合认知心理学的认知操作复杂度分析原理,确定词长划分的分界线。
三.词长梯度多重分流截尾加速输入技术
在计算机存储介质中,分别对两个(拼音文字)或三个词库(汉字)子集库中的字、词和短语按高频优先的原则建立方便检索与显示的数据结构。这里所谓两个或三个词库是功能上的而非物理上的,数据结构的实现方法可以有多种。到四个空格键;第二种方案是在现有键盘上增加一到三个加速功能专用键;第三种方案是不改变现有键盘,而指定一到三组已有键位作为原有功能与加速功能双重键;第四种方案是在以上三种方案之间进行某种组合。用加速键的尾键切换方式将程序根据词长检索分流出的高频词输入计算机,从而使计算机键盘输入的速度大大提高。
附图的图面说明如下:
图1是本发明中将键盘的单空格键改成两个空格键的示意图;
图2是本发明中将键盘的单空格键改成三个空格键的示意图;
图3是本发明中将键盘的单空格键改成四个空格键的示意图;
以下结合附图详细介绍具体实施方案。我们将主要以三梯度加速输入方案为例叙述。也可以实施简化的双梯度加速输入方案或强化的四梯度加速输入方案,这三种方案的基本原理是相通的。
一.在计算机传统键盘上设置加速键
如上文所述,在计算机键盘上设置输入加速功能键有多种变通的实施方法,包括对现有键盘不做任何物理上的改变,仅仅对某些选定的键位增设加速功能。我们下面主要以对传统空格键改造为例进行介绍,因为发明者认为这是较好的实现方法。其他的实施方法,由于原则相通,可以类推。
把传统键盘的单空格键改造成为左右两空格键(11,12),或者改造成为左中右三个空格键(21,22,23),或者改造成为左、中左、中右、右四个空格键(31,32,33,34),如图1、图2和图3所示。双空格键方式中,右空格键(12)是空格加速双功能键。三空格键方式中,右侧两个空格键(22,23)是空格加速双功能键。四空格键方式中,右侧三个空格键(32,33,34)是空格加速双功能键。一般设置三个空格键。以下叙述主要对应于三空格键方式(图2)。
将左空格键规定为普通空格键(21),中空格键规定为一级加速键(22),右空格键规定为二级加速键(23)。在通常状态下它们都起普通空格键(21)的作用,在文字加速输入状态下,中右两空格键既有空格键的功能,又有尾键切换加速输入的功能。
当用户在键盘上输入时,计算机对接收到的字符串在两个(拼音文字)或三个词库(汉字)中进行并行分流式检索,将前缀字母或前缀码相同的候选词集合中对应的两个(英文)或三个(汉字)高频词检索出,同时在屏幕上显示。用户根据目标词的匹配情况,击打对应的普通空格键(21)或加速尾键(22,23)以结束输入。如果目标词没有出现,用户继续输入后续字符,计算机按同样原理继续工作,直至用户需要的目标词被检索出完成匹配输入为止。
下面举两个直观的例子说明上述原理的运用方法。一个例子是汉字输入,另一个是英文输入。
汉字:
在汉字编码输入状态下,计算机程序对用户输入的每一个汉字编码字符进行检索,将对应的高频字,高频双字词和高频多字词在提示行按从左到右的方式排列显示(也可以采用其他排列方式和显示技术,例如窗口技术等)。高频字用普通空格键(21)结束;高频双字词用一级加速键(22)结束;高频多字词用二级加速键(23)结束。
假定用户用全拼音方式输入,目标词为"改革开放",全部编码是"gaigekaifang",不考虑重码时共十二个字符。当输入第一个字符"g"时,提示行显示如下:全拼:g:个:工作:国务院(一码加速字词)
高频 一级加速 二级加速
字 高频双字词 高频多字词用户需要的目标词还未在提示行出现,继续输入下一个字符"a",提示行显示如下:全拼:ga:该:高兴:改革开放(双码加速字词)此时目标词已检索出并显示,用户只需击打二级加速键(23),目标词"改革开放"就自动到位,不需再考虑后续的编码字符。
又如,在以上例子中,若用户要输入的目标词是"国务院",那么一键"g"加二级加速键(23)就可以完成输入。
英文:
传统英文输入是计算机将从键盘上接收到的非功能性字符,包括英文字母和数字,直接存储并显示。在本方案下,可以设置普通输入与加速输入两种状态,用一功能键进行切换。普通输入状态的处理方法与原来相同,加速输入状态的处理方法叙述如下。
当计算机从键盘上接收到的字符串是英文字母串时,立即将此字母串在屏幕的提示行显示,同时在梯度二词库(由6到10个字母组成的词和短语库)中和梯度三词库(由多于10个字母组成的词和短语库)中检索出前缀字母相同的对应的高频词,在提示行按左右排列顺序显示(同样可以采用其他的显示方式),用户根据目标词的匹配情况,击打对应的普通空格键(21)、一级加速键(22)或二级加速键(23)以结束输入。
例如,用户要输入的目标词是"international",当第一个字母"i"被计算机接收后,根据以上处理过程在提示行显示为:*i*important*interesting(后两项为单字母加速词)
输入 一级加速 二级加速
字母 高频词 高频词
用户需要的目标词尚未出现,继续输入下一个字母"n",提示行显示为:=in*inside *international(后两项为双字母加速词)此时目标词已检索出并显示,用户击打右空格键,目标词"international"自动到位并存储进相应文件,不需再输入它的后续字母。
在加速输入状态中,普通空格键(21)的作用与普通输入状态没有区别。例如,在上述例子中,用户也可以将‘international’的每一个字母全部输入,然后打普通空格键(21)结束输入。六个字母以内的词也是用普通空格键(21)结束。
需要指出的是,上述目标词的匹配反应过程从表面上看与汉字输入中的重码字选择操作过程有些类似,实质上却有本质的差别。在汉字输入重码字的选择操作中,用户不知道目标字或词将在提示行的什么位置上出现,他或她必须顺序注视搜索提示行显示的多个甚至全部显示项,直到找到目标字或词为止,经常还需要换页检索。在本加速输入方案中,提示行最多只有三个显示项,且用户对于目标词的出现已有定向预测性,只需在预定位置上观察目标词是否出现,反应的过程很快,并且能够在短期操作实践中进一步提高。此外,实验心理学的研究早已证实,视知觉的瞬间注意广度在一个线性行上一般不超过四个组块,在此范围内认知操作反应具有并行性,所以速度极高。超过这个范围,认知操作反应时间将迅速增长。所以定向匹配反应与多项选择反应存在显著差异,前者比后者速度高得多。
四.其他变通的实施方案
以上我们已经详细介绍了实施方案原理和实施过程的各个部分,其中键盘加速键的设置与指法操作可以有多种变通的方法。这里再介绍一种,其他的方法可以类推派生出多种。
用任意数字键兼做一级加速键,用分号键兼做二级加速键。其余的操作原理都不变。注意数字键和分号键本身的功能并不受影响,可以由计算机程序方便地控制它们在两种功能之间自动来回转换。当进入一个字或词的输入状态时,它们也自动进入加速功能键的状态;当一个字或词的输入完成之后,它们自动恢复到原有符号键的状态。
文字输入加速方法的优点是很明显的。
首先,它是一种超越任何具体文字,任何具体编码方法之上的通用的方法,可以与任何文字或任何编码方法有机地结合在一起。它适用于任何书面语言,任何编码方法。这是迄今为止任何一种编码方案或输入方案所不具备的。
第二,它能使文字的键盘输入速度显著提高。我们按三梯度加速输入方案在数据库中对使用频度最高的两万个英文词条进行了初步的模拟测试,对使用频度最高的一万六千个汉字词条进行了模拟测试(采用简易音形码汉字输入法中的双拼加形码的编码方案),英文的词输入平均击键次数减少55%左右(与原词长比较),汉字输入的平均击键次数减少60%以上(与按字输入的码长比较),也就是说,两者的输入速度可分别提高1.2倍和1.67倍。
第三,对于汉字编码输入,词长梯度分流、加速键尾码切换的原理使大量重码字词以简码截尾方式完成输入,它能显著地扩大编码空间(采用n梯度加速输入法使原编码空间增加n倍),降低重码率,从而进一步提高输入速度。
第四,它与现有计算机键盘兼容,易学易用。
下面结合汉字输入,介绍一个利用现行通用键盘实现的方案。由于在以上技术方案的叙述中已详细介绍了实施原理与过程的各个方面,并配有实例,所以以下介绍较为简略。1采用根据简易音形码汉字输入法(专利申请号为92108715.2)原理设计的双拼加形码的编码规则,规定每个字或词最多可有五码(这五码相当于拼音文字中的原有词长,在实际输入中绝大部分字词的输入都在三码以内完成)。
字词取码规则如下:
第一字 第二字 第三字 末字 合 计单字 五码 五 码双字词 前两码 前三码 五 码三字词 前两码 前一码 前两码 五 码多字词 前两码 前一码 前一码 前一码 五 码说明:单字的五码的排列顺序是
声母+韵母+一到三个形码
2.将数字键[1].[2].[3].[4].[5]统一设置为一级加速键,[6].[7].[8].[9].[0]统一设置为二级加速键。多键加速功能统一的设置方法可以方便指法操作,提高击键速度。
3.将动态覆盖率达到99.9%以上的汉字常用词,包括短语、成语和俗语共五万条分别收入三个词库:单字词库、双字词库和多字词库,根据统计语言学和认知心理学相结合的原理给每一个词赋以一个优先权数。在此基础上,运用算法理论与计算机技术在三个词库中建立方便高速检索的数据结构,在每一个词库中,前缀码相同的候选词集合中优先权数最高者最先被检索到。我们称它们为高频词。
4.用户从键盘上输入汉字时,计算机程序在提示行从左向右同时显示高频字、高频双字词、高频多字词。用户用空格键(21)结束高频字的输入,用一级加速键(22)结束高频双字词的输入,用二级加速键(23)结束高频多字词的输入。
5.将系统设计成能够与各种流行的汉字操作系统兼容,能够悬挂到这些操作系统下运行。
Claims (5)
1、一种用于计算机的文字输入加速方法,按字、词本身的长度不同分类为两到四个子集,在计算机存储器中建立相应的库,键盘上设置加速键,并与显示器结合一起在数字计算机上实现,其特征在于:所述文字输入加速方法适用于各种编码方案并且采用如下步骤:
1)按字、词本身的长度,对所用文字中的常用字、词和短语构成的词汇全集,根据其相对于词长的静态量分布和动态使用频度分布,以词长差异为界线划分成两到四个子集,一般划为三个子集;对上述划分出的词汇子集分别在计算机存储器中建立相应的词库,并对每个词库中的字、词和短语按高频优先的原则建立利于检索和显示的顺序结构;
2)计算机程序对从键盘按收到文字字符串或编码字符串的每一个字符时都分别在上述顺序结构中进行检索,将相应词库中前缀字母与该字符串相同的多个候选词检索出来,同时在显示器提示行中分别依照使用频度逐次显示;
3)用户根据目标词的匹配情况,击打预先设置的空格键(21)或加速键(22)、(23),从上述显示器提示行的候选词中选中目标词以结速输入。
2、一种用于计算机的文字输入加速键盘,其特征在于:是以传统键盘为基础,重新定义两到四组键位内容或改造两到四个键位使之分别对应着显示器中分别以字词长度为依据划分的并按使用频度依次分别显示的字词,以适合文字输入加速方法。
3、按照权利要求2所述的键盘,所述改造两到四个键位使之适合文字输入加速方法,其特征是把传统计算机键盘上的单空格键分隔成两到四个空格键,并依次设置为空格键(21)、一级加速键(22)、二级加速键(23)。
4、按照权利要求2所述的键盘,所述改造两到四个键位使之适合文字输入加速方法,其特征是在现有键盘上增加一到三个加速功能专用键。
5、按照权利要求2所述的键盘,所述改造两到四个键位使之适合文字输入加速方法,其特征是不改变现有键盘,而指定一到三组已有键位作为原有功能与加速功能双重键。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 92112716 CN1032559C (zh) | 1992-11-07 | 1992-11-07 | 文字输入加速方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 92112716 CN1032559C (zh) | 1992-11-07 | 1992-11-07 | 文字输入加速方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1085671A CN1085671A (zh) | 1994-04-20 |
CN1032559C true CN1032559C (zh) | 1996-08-14 |
Family
ID=4946074
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 92112716 Expired - Fee Related CN1032559C (zh) | 1992-11-07 | 1992-11-07 | 文字输入加速方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1032559C (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102282526B (zh) * | 2009-01-13 | 2015-06-24 | 富士通株式会社 | 信息处理装置、输入模式适宜化方法 |
-
1992
- 1992-11-07 CN CN 92112716 patent/CN1032559C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN1085671A (zh) | 1994-04-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5360343A (en) | Chinese character coding method using five stroke codes and double phonetic alphabets | |
CN86101871A (zh) | 选择和再生语言字符的方法 | |
CN1032559C (zh) | 文字输入加速方法 | |
CN1097766C (zh) | 汉字五键输入法 | |
CN1215397C (zh) | 小键盘拼音汉字输入方法 | |
CN100476826C (zh) | 中文字型排序检索方法和装置以及一种信息系统 | |
CN1645356A (zh) | 多维汉语学习系统 | |
CN101071337B (zh) | 一种拼音字母、数字的汉字输入法及键盘和屏幕的显示方法 | |
CN1081353C (zh) | 现代汉语单词拉丁化语音码汉字输入法 | |
CN1035083C (zh) | 面向词的中文文字处理输入装置 | |
CN1072785A (zh) | 无理序号数字综合编码法及其键盘 | |
CN1027839C (zh) | 中华双拼汉字编入的计算机键盘 | |
CN1106146A (zh) | 电脑汉字声韵调编码输入法及其键盘 | |
CN100440112C (zh) | 拼音型中文输入法 | |
CN101034403A (zh) | 一种小键盘电子字典的智能检索方法 | |
CN1139023C (zh) | 一种计算机汉字输入方法 | |
CN85104831A (zh) | 头腹尾数码和声韵母码组合式简便汉字编码法和多功能汉字输入中型键盘 | |
CN1325051A (zh) | 计算机汉语全音输入法 | |
CN1244855C (zh) | 中文信息处理汉字数字化规范编码输入技术 | |
CN1156277A (zh) | 计算机汉字输入方法 | |
CN1208711C (zh) | 英文数码输入法 | |
CN1081523A (zh) | 双拼汉语编码法及其键盘 | |
CN1138714A (zh) | 基于词组的汉字输入方法 | |
CN1049418A (zh) | 统一码计算机汉字键盘输入方法 | |
CN1079062A (zh) | 字根首音编码输入法及其键盘 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C15 | Extension of patent right duration from 15 to 20 years for appl. with date before 31.12.1992 and still valid on 11.12.2001 (patent law change 1993) | ||
OR01 | Other related matters | ||
C57 | Notification of unclear or unknown address | ||
DD01 | Delivery of document by public notice |
Addressee: Wang Lu Document name: Notice of extension of patent right |
|
C57 | Notification of unclear or unknown address | ||
DD01 | Delivery of document by public notice |
Addressee: Wang Lu Document name: Notification of Termination of Patent Right |
|
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |