CN1048343C - 自由组合码汉字输入方法及键盘 - Google Patents
自由组合码汉字输入方法及键盘 Download PDFInfo
- Publication number
- CN1048343C CN1048343C CN94103700A CN94103700A CN1048343C CN 1048343 C CN1048343 C CN 1048343C CN 94103700 A CN94103700 A CN 94103700A CN 94103700 A CN94103700 A CN 94103700A CN 1048343 C CN1048343 C CN 1048343C
- Authority
- CN
- China
- Prior art keywords
- key
- word
- input
- character
- initial consonant
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Input From Keyboards Or The Like (AREA)
- Document Processing Apparatus (AREA)
Abstract
自由组合码是开放型的汉字输入系统,它以汉字的声母、韵母、声调、笔对、笔画等标准编码元件及汉字字型结构做为编码材料,除系统默认的十八种输入法之外,允许用户自由定义编码组合方式,自由定义各类键盘,可组合出无限种编码输入方法,从而充分满足各种人员的不同需求,达到易学、规范、易记、高效的目的。系统默认的声韵双拼键盘以韵母内在组合规律为依据,形成二维矩阵排列的新型双拼键盘,规律性强,易学易记。
Description
本发明属于汉字信息处理技术领域。
目前,汉字编码的输入速度问题已获得阶段性解决,当前的大趋势是计算机正在开始走向办公室,走向家庭,汉字输入正在从专业录入员走向广大干部群众,所以解决易学问题已转化为刻不容缓的紧迫问题,而真正能彻底解决易学问题的方案尚未问世,因此研制普及方案应该是当前汉字编码的主攻方向。而现在的问题在于以下三个方面:
第一点,方向不明确是主要的思想障碍。
编码界很多人目前仍然在集中向速度攻坚,而非集中向易学性攻坚;社会上目前最关心的仍然是某种编码每分钟能输入多少汉字,而非多长时间能学会。
有些编码作者对“兼顾”的要求太高,希望自己的方案同时成为各方案中易学性和速度两个方面的冠军,没有主攻方向,结果往往顾此失彼。
即使以追求易学性为主的方案,也往往有两点不明确:一方面未能充分估计到群众对易学性的要求有多高多严,往往不自觉地降低了易学性的标准;另一方面当易学性与速度产生矛盾的时候,往往为了速度而牺牲易学性。
第二点,编码材料选择不当。普及码的选材与专业码应该有不同要求,但一般方案普遍存在以下问题:
编码材料的选择没有建立在一般人所熟悉的学校教育的基础上,而是建立在各家自造的人工编码系统上,就连笔画、字型结构的分类或笔画的顺序也往往与学校教育不一致,更不用说形形色色的人工部件。
选用的汉字属性大多比较模糊,缺乏公认的规范制约,而且其编码表达也比较模糊。比如字根就是一种典型的模糊属性,无论是采用“音托”还是“形托”的方式来表达字根都是非常模糊的。
选用的汉字属性大多比较复杂,往往需要拆分汉字,从而造成歧义性。
选用的汉字属性其元素往往比较多,记忆量大。规律性差,回生率高。
以上四点论述请参阅本发明者的另一项发明专利说明书《声韵笔对码汉字输入方法及键盘》,申请号为93103600.3。
第三点,是组合方式上的缺陷。组合方式包括两种,一是键盘组合,指码元与键位如何对应,二是编码组合,指码元以何种方式组成编码。在组合方式方面五笔字型和双拼键盘非常典型,以下对这两类组合方式做重点分析。
键盘组合:
在五笔字型之前,许多形码对字根或部件在键盘上的安排极为混乱,有的毫无规律,有的以相象、近义、近类等做为分类依据,十分模糊,困难。而五笔字型对字根按首两笔分为25类,对键盘分为5区25键位与之对应,是一个很大的进步。
但五笔字型在键盘组合方面从普及角度看(并非专业角度)有以下缺陷:
很多字根与5区25位的键位排列规律不一致,特例太多;
键面上只有140个字根,实际还有近70个左右的变形字根不在键面上,须由用户逐步摸索、试验、强记。
5个区的位置安排规律性不强。另外,折区与上面两区错一个键位,容易记乱。
除了五笔字型之外,随着各种汉字编辑软件的出现,功能越来越强,功能键越来越多,键位分配也就越来越紧张,而汉字输入软件的功能也越来越强,就免不了产生键位冲突。
双拼键盘现在是多种类型并存,极不统一,不利于规范化和双拼输入的普及。已有的双拼键盘可分为三类:
第一类:主要根据韵母的使用频率和指法规律来安排双拼键位,但键盘的规律性比较差,不易记忆,如声数码双拼键盘。
第二类:主要特征是与CCDOS简拼码的8个常用韵母及3个双声母取得一致,利于已会简拼码的人员掌握,如自然码双拼键盘,但对不会简拼的人来说,所有韵母的排列都没有什么规律。
第三类:主要根据韵母的规律性来安排键位,如WPS和四通采用的双拼键盘。但其规律还是停留在外形的,表面的阶段,规律还不够彻底。该键盘上行左半边主要是以E开头的韵母,中行左半边主要是以A开头的韵母,下行左半边主要是以U开头的韵母,中下行的右半边主要是以I开头的韵母,这种排列主要是在横向上有一些规律,在纵向上则规律性不强,也就是说,主要是一维规律。通过规律只能知道以什么字母开头的韵母处于哪一行的哪半边,而不能确知每个韵母处在哪个具体的键位上。本发明认为其原因在于该双拼键盘没能更深入地发掘出韵母本身的内在组合规律。另外,该键盘还占用了一个标点符号键位(分号),这也不利于双拼键盘的标准化。
编码组合:
在五笔字型之前,许多形码的取码顺序难度很大,与汉字书写顺序不一致,各行其是,而五笔字型和其它某些方案按笔顺取“前三末一”字根,是一个很大的进步。
但五笔字型在编码组合方面从普及的角度看有以下缺陷(这些问题从专业码角度看不一定算缺陷,也许正是降低重码、提高速度所必需的):
对键名字、成字根字、键外字取码不一致;
除字根外还要加末笔字型交叉识别符,是一个难点,而且有些末笔和字型结构与学校教育不一致;
取大优先、兼顾直观、能连不交、能散不连四个取码原则比较难掌握,比较模糊,有时相互矛盾。
简码不能随着敲键而逐级在提示行显示,必须死记硬背。
其它编码方案在组合方式上也有形形色色的类似问题,如二维三码在码元与键盘对应的规律性方面构思极为巧妙,而且只用三键,重码率却很低。但在码元分类、取码顺序方面也存在不少模糊性和困难。
事实上任何一种组合方式都不可能适应所有用户和所有编辑软件,所以有些方案中同时包含好几种组合方式,以满足不同用户的需求,如五笔字型码中包括五笔型和五笔划,五十字元码中包括五种输入方式,这是一种进步,但仍有以下缺陷:
用户只能选择,无法根据自己的特殊需求参与设计,自行更改、增加组合方式;
所谓多种方式大多只是编码组合有变化,有选择,而键盘组合一般都是固定的,如用户不满意,只能适应,或者放弃。
综上所述,组合方式方面的缺陷不在于未找到理想的组合,而在于组合方式的绝对固定(只有一种组合方式)或相对固定(只有几种组合方式)。用户无法参与设计,无法重新自由组合。
双拼键盘的缺陷主要在于未能根据韵母自身的内部组合规律安排键位,因而使键盘的规律性不强,不易记忆。
本发明的总目的是要从根本上解决汉字编码的普及问题。即主要解决易学性问题,同时兼顾输入速度。用户对象主要是非专业录入员,同时兼顾专业录入员。为使总目的具体化,本发明将总目的分解为三个目标体系:编码材料目标体系、组合方式目标体系、双拼键盘目标体系。
针对编码材料选择方面的缺陷,本发明的目标体系为:
选材应建立在学校教育这个最大的规范化体系的基础上。即所选用的汉字属性最起码应该是中小学语文教学中的必修内容,做为最高要求应该是所有小学生都能基本掌握的属性。对于普及方案来说这是先决条件。
所选用做为编码材料的汉字属性应尽可能明确,严密,规范化,有公认的统一标准可循。那些模糊、歧义、无公认标准的属性尽量不选用;
所选用做为编码材料的汉字属性应尽可能简单易学,容易分类,尽量不要拆分汉字。那些复杂的属性尽量不选用;
所选用做为编码材料的汉字属性记忆量尽可能小,即属性元素数量尽可能少,但如果太少又不利于离散重码,元素数量最理想的数值是26,即与字母键位的数量越接近越好。
总起来四点:必修性、规范性、易学性、易记性。
针对组合方式方面的缺陷,本发明的目标体系为:
主导思想是要设计成开发系统,让用户直接介入,对组合方式参与设计,自由选择,任意修改,反复试验,不是只产生有限几种编码方法,而是能在选定的汉字编码元件的基础上产生几乎所有可能存在的编码方法,以满足各类用户的特殊需求,形成符合自我的个性软件,从而实现真正的普及。
为适应标准化、规范化的自由组合方式,并提高输入速度,对组合方式有以下要求:
在每一种编码方式中对所有汉字必须使用统一的编码规则,不能允许有特例存在,规则不能有任何模糊性,规则之间不能有矛盾;
为提高输入速度,同时不要对标点符号和数字造成干扰,要求所有码元只能对应字母键位;
为适应广大非专业用户和“想打”、“听打”用户的需求,并为提高输入速度,系统默认的编码组合最好以音码为主,以减少从音到形的心理转换过程。
为提高输入速度,要求能装入大量词组,并能动态自定义词组;
系统应具有良好的可扩展性,能逐步提高其智能化水平。
针对双拼键盘方面的缺陷,本发明的目标体系为:
根据韵母本身的内在组合规律设计双拼键盘,使其规律性强,整齐易记,符合双拼相容规律,兼顾使用频率与键盘指法的协调,而且不要占用26个字母键以外的键位。为双拼键盘的标准化贡献一个切实可行的方案。
为达到本发明的总目标,本发明的总方针是:
从所有汉字属性中选择必修性、规范性、易学性、易记性最佳的属性做为标准化编码元件,采用用户直接介入的自由组合方式将编码元件组合成为多种方法并存的整套编码系统,其中包括音形码、纯音码、纯形码,适应各种用户的需求。总起来可用一句话概括:汉字标准元件,用户自由组合。故此本发明命名为“自由组合码”。
对以上三方面的分目标,本发明分别采取不同的解决方针。
为达到编码材料选择的目标体系,本发明的解决方针是:
本发明依据上述编码材料选择目标体系对汉字的所有属性(包括部首,字根,角形,字型结构,笔顺,笔画数,声母,韵母,声调等)从是否为中小学语文课所必修,是否明确规范,是否简单易学,是否记忆量少等四个方面进行分析,按照易学性的高低依次筛选出声母、笔画、韵母、声调等四个属性。
以上分析的具体过程略,实施者可参阅发明人的另一项发明《声韵笔对码汉字输入方法及键盘》(专利申请号93103600.3)
为使笔画类型的数量最大限度地贴近字母数量26,以利于离散重码,提高击键速度,本发明将汉字中连续书写的两笔做为一个笔对,从汉字的五种基本笔画“一丨丿丶乙”出发,组合成25种“笔对”,从而使笔画的变化类型的数量与字母数量相近,以便于安排在字母键上。
本发明所采用的笔顺以北京图书馆编著的《汉字属性字典》为规范,以适应中小学的语文教学。
在汉字的全字中究竟取哪些笔对最符合目标体系?本发明认为:由全字前两笔组成的“首笔对”和由全字末两笔组成的“末笔对”比较合适,因为:一,规范性强,与汉字的字根拆分或字型结构无关,所以明确无模糊性;二,比较直观,规则简单;三,首末两个笔对各取汉字的两个对角,能取到汉字中具有代表性的信息。因此,本发明以首末笔对做为汉字的标准元件。
为了适应易学的需求,将单笔画即全字的首、次、末笔也做为编码材料。而且笔对和笔画可以在同一个输入法中同时使用(见后文“声首尾码”)
总之,本发明选定的标准元件共有八种:声母、韵母、声调、首笔对、末笔对、首笔、次笔、末笔。为在使用中称呼简便并便于区别,这八种属性分别简称为“声、韵、调、首、末、头、二、尾”。
但对于纯形码和以形为主的音形码来说,只取首末两个笔对则感信息量不足,有必要从汉字的中部取笔对码,因此本发明扩大选材范围,增加“次笔对”做为编码元件,次笔对的定义为:对独体字来说,次笔对为全字第三、四两笔,对合体字来说,次笔对为全字第二部分的首两笔。但需要说明的是:
如果取次笔对,就需要将汉字拆分为两部分,则首笔对和末笔对的定义也必须随之变化,首笔对的定义将变为全字字第一部分的前两笔,末笔对将变为全字第二部分的末两笔。这种定义和做为标准元件的首末笔对的定义不同,所以对某些汉字来说,其实际取码也将不同。如对“医”字来说,按照《汉字属性字典》,其笔顺为:、矢、乙,所以标准元件的首末笔对为“一丿”和“丶乙”,如果取次笔对,则“医”字分为两部分:ㄈ、矢,所以首、次、末笔对分别为“一乙”、“丿一”、“丿丶”。
因为取次笔对必须要涉及到汉字的字型结构,而字型结构并没有公认的规范,所以包括次笔对在内的首、次、末笔对均属于非标准元件,但因本发明已规定了比较详细的取码顺序,一般情况下取码还是可以统一的,而且在规定的定义下不允许有任何特例,所以也可以认为属于“准标准元件”。
为使字型结构有一个可以遵循的规范,本发明规定了字型结构的分类,见图25,所以字型结构也可以做为一种“准标准编码元件”。
如此,本发明的编码元件中共增加四种准标准元件:按分部方式取的首、次、末笔对和字型结构,分别简称为“首、次、末、型”,与标准元件合计共有十二种。其中准标准元件的首、次、末笔对与标准元件的首、末笔对在本发明提供的“汉字属性信息表”中同时并存,由用户选用。只要用户选了次笔对,则首、末笔对自动取相应的准标准元件,反之,则取标准元件。
为达到组合方式的目标体系,本发明的解决方针是:
主要采用多级菜单方式来解决用户对组合方式的自由设计和选择。主菜单的主要功能分为两类:键盘组合设置和编码组合设置。
键盘组合设置:可自由定义各类编码元件(包括声母、韵母、声调、笔对、笔画、字型结构等)与键盘的对应关系;可自由定义全角标点符号与键盘的对应关系;可自由定义各功能键与键盘的对应关系。
编码组合设置:可从定义好的编码元件中任意选择组合成不同的编码方式;由于非等长码是几种固定的输入方法,所以用户可以自由组合的编码均为等长码,可组合出全码从二码直到五码的各种编码方式,要说明的是双拼码虽然也属于等长码,但它是固定的输入方法,不属于编码自由组合的范围。
对以上各类组合方式,既可由用户自由定义,也备有各类定型的模式,供用户选择,使用户省去一一定义的麻烦。在定型模式中既有包括所有组合方式的整套模式,也有每类组合方式各自对应的模式。
在各套模式中有一套为系统默认模式,供用户直接使用。如果用户不满意,可选择其它模式,或通过自定义建立新模式。
针对已有技术中双拼键盘的缺陷,本发明的解决方针如下:
韵母本身的内在组合规律反映在新华字典后面附的韵母表中。该表实际上是一个二维矩阵式的表格,其横坐标是IUü这三个“介母”,其纵坐标是以AOE开头的13个韵母,亦即“开口呼”类韵母,而表体内则是纵横坐标交叉的坐标点,比如以“I”为横坐标的一列韵母,全是“I”与其对应的横坐标的组合,组成了“齐齿呼”类韵母,如第一列IA,就是“I”和横坐标“A”的组合。同样,U列和ü列也都是U和ü与纵坐标韵母的组合,组成了“合口呼”和“撮口呼”类韵母。也可以说,以AOE开头的纵坐标开口呼韵母是基本韵母,其它三列是它们的扩展。
恰好英文键盘也是一个二维矩阵,本发明的主导设计思想就是把新华字典附的韵母表旋转90度横放在键盘上,从而组成一个充分体现韵母内在组合规律的二维双拼键盘,当然其中还要做不少调整。
下面结合附图介绍本发明的两个实施例。
实施例一是一套完整的系统,它分为两大子系统:系统设置子系统和汉字输入子系统,其结构与关系见图1(双拼码实际上属于二键码,双拼调码实际属于三键码)。
每次调入内存用于实际输入的只是汉字输入子系统,如果用户需要对组合方式重新设置,则在操作系统下运行系统设置子系统,待设置确认后,系统根据设置好的模式对汉字输入子系统进行调整修改,形成新的汉字输入子系统。到实际使用时将该子系统调入内存,用户即可用新的输入方式工作。
系统设置子系统中的主文件为系统设置主菜单(见图2),共分为六个模块。刚进入主菜单时,屏幕上只有顶部横行六个主选择项和第一个选择项下拉出的分菜单,此时第一选择项成为与其它项不同的特殊显示,表明它是当前选项。其它五个主选项下为空白。当用光标键左右移动时,移到哪项则该项变为特殊显示,同时该项下拉出相应的分菜单,其它主选项成为正常显示,其下方为空白。当用光标键上下移动时,分菜单中的相应选择项成为特殊显示,表明当前选择的是该项,此时敲回车键则表明已确认选中该项。这种菜单选择方法与WPS系统的编辑菜单选择方法完全相同。其它菜单选择方法亦同。
下面分别介绍六个模块:
挂接系统;
挂接系统选择项下的分菜单中包括“参数挂接”项和国内当前比较流行的一些中文系统。
如果用户只固定挂接某一种中文系统,则可直接选择相应项次,当内存中已调入该中文系统之后,直接以本发明的汉字输入子系统主文件名调用即可与该中文系统挂接;
如果用户希望在不同的中文系统下灵活挂接,则可选择“参数挂接”,对应于每种中文系统有一个参数,在不同的中文系统下调用本发明的汉字输入系统时,只要在其主文件名后缀以相应的参数即可与该中文系统挂接。
如果实施者能实现对各种中文系统的自动识别和自动挂接,或实现与任何中文系统都可挂接的“万能挂接”,则挂接系统模块也可不要。
设置模式:
为使用户省去对键盘和编码一一设置的麻烦,用户可在此菜单中选择成套的定型模式。
其中“系统模式”是指系统默认的设置模式,要说明的是系统模式也并不是一成不变的,在软件的开发、完善和应用过程中,实施者可以根据技术的发展和用户需求的变化,改变系统默认模式。最典型的如双拼键盘,目前各家设计都不一样,本发明在系统模式中默认自行设计的一种,待到国家颁布标准双拼键盘后,系统默认模式亦可改为国家标准模式。
其它模式如WPS模式并不是将本系统完全变成和WPS系统一样,而是指:凡本发明的功能与WPS相同者则使用同一个功能键,进行同样的工作;凡本发明的功能与WPS不同而功能键位冲突者,则另改换为与WPS不冲突的空闲键位,各自的功能互不妨碍;凡本发明的功能与WPS不同而功能键位又不冲突者,键位仍为本发明系统默认键位。也就是说,所谓“WPS模式”就是本发明的系统与WPS能很好兼容的模式,原WPS功能与本发明功能均不受影响,与WPS挂接后成为“增强型的WPS”。
设置键盘:
其分菜单中包括六类键盘设置:系统键盘、音码、形码、标点符号、功能键、外文。
系统键盘:
如果选择该项,则所有各类键盘设置均为系统默认方式。实际上系统键盘模式正是“系统模式”中的一部分。系统模式的其它部分也同此道理。
音码类:
双拼键盘:当选择该项后,在其右侧拉出一分菜单,包括系统双拼、四通双拼(即WPS双拼)、声数码双拼、自然码双拼、……,以及自定义双拼等选项。用户可选择任一种固定双拼键盘,也可选择自定义双拼。
如选择WPS双拼,因该方式以分号键对应韵母ING,与本发明不得定义字母之外的键位的规定冲突,所以此处的“WPS双拼”模式中韵母ING与韵母IN合并安排在键位L上。其它类似问题照此原则处理。
如选择自定义双拼,则屏幕上依次出现声母键盘自定义菜单和韵母键盘自定义菜单(见图3、图4)。图中“键位”栏中的默认值即为系统双拼键盘的设置值(其它键盘菜单均与此同),如果用户已设置过其它双拼模式,则默认值为其它双拼键盘的设置值,用户可修改默认值以完成自定义。
图3中“零声母”指拼音码以A、O、E开头的情况,因零声母的定义同时关系到声母和韵母,所以只在图3(双拼声母自定义菜单)中将声韵位同时定义好,图4中不再定义。表中列出三种情况供用户选择,系统默认第一种情况。
第一种选择的含义从表中看很清楚。第二种选择分三种情况处理,其一是指当拼音只有“A、O、E”中一个字母时的情况,即“啊、哦、俄”等汉字的情况,此时声韵位为该字母的重复,即AA、OO、EE;其二是指拼音为两个字母的情况,即AN、EN、AO、OU等情况,此时声韵位即原拼音两个字母,其三是指当拼音为ANG时的情况,即汉字为“昂、肮”等字,此时声母为A,韵母为ANG的双拼韵母所对应的字母。第三种选择是指对“零声母”汉字的声母位统一取一个键位,由用户选择,比如统一取“E”,韵母位则仍取双拼韵母。
图3中“无声母”指单独的偏旁部首如“讠、氵、亻”的情况。如果用户希望为每一个偏旁部首指定一个读音,则可将无声母键位和图4的无韵母键位清为空格,即表示不存在无声母无韵母的情况。待系统设置全部完成后,用户可进入单字库的文本文件“汉字属性表”中(见后文软件实现部分)将所有偏旁部首的声韵位和无韵母汉字(“呒、嗯”二字)的韵母位自行填入读音,如此则取消了无读音字符。
图3中附有“简拼码双声母定义”栏目,因简拼码是供熟悉CCDOS简拼码而没有时间学习其它方法的人员使用的,等于功能增强的简拼码,所以系统默认的双声母键位与CCDOS简拼码的一致,用户也可以自定义键位。
图4中“ER”的设置需要说明,如果在零声母设置中选了2,则此处“ER”的键位将自动置为空格,不允许用户自定义,意即对ER取消定义。
韵母“UENG”在实际拼式“WENG”(翁)中并不出现,所以不放在韵母自定义菜单里。
双拼声母和韵母自定义完成后,系统将检查自定义中是否有相冲突的声母或韵母,如有则在菜单下方一一列出,由用户决定确认或重新设置。
同时,菜单下方出现“重新设置、模式名称、确认退出、放弃退出”四个选项供选择。如果希望将本次自定义键盘设置为固定模式,则选“模式名称”,其右方出现一个填框,可输入名称(否则回车),以后再进入双拼键盘设置后,该名称亦做为双拼模式之一。
比如某些方言区对ZH(CH、SH)与Z(C、S)分不清,将它们定义在同一个键位上,系统检查后将指出键位冲突,用户如果选择“确认退出”则该双拼键盘成为方言键盘。
又如用户因疏忽将不相容韵母UE和UAN定义在同一键位上,系统将指出键位冲突,提醒用户修改;如果将相容韵母UE和UI定义在同一键位上,则系统不指出键位冲突。
其它键盘自定义菜单定义完成后也与此相同,进行键位检查并出现四个选项供选择。
声调键盘:声调分菜单选项包括“系统声调、自定义声调”,自定义菜单见图7。之所以将四个声调定在“VBNM”四个键位上,主要是为了在简拼调码和全拼调码中使用声调码元时不与韵母码元冲突。轻声的汉字很少,可以归入去声。偏旁部首没有声调也一律归入去声。
注音键盘:考虑到目前五十岁以上的用户中很多人不会汉语拼音而会注音字母,而本发明主要解决普及问题,所以有必要设置注音键盘。有两个选项:系统注音和自定义注音,自定义菜单见图5。
形码类:
笔对和笔画键盘:分菜单选项中包括“系统笔对、五笔型笔对、自定义笔对”。系统笔对键盘与本发明人的另一项汉字编码发明《声韵笔对码汉字输入方法及键盘》中的笔对键盘一致,五笔型笔对键盘与五笔字型码的字根前两笔顺按区位排列的方式一致,自定义菜单见图6。其中“单笔”栏是指笔对码元中遇到的单笔(见声韵首末码说明),而“笔画”栏是指笔画码元,“空笔”是指当用来编码的笔画不足时的补充码(见声头二尾码说明)。
笔对键盘只允许选择25个字母键位,剩下的一个字母即为笔对编码补充键(见声韵首末码介绍)。
字型结构键盘。字型结构分菜单选项中包括“系统字型、自定义字型”,自定义菜单见图8。
标点符号键盘:
因各类输入方法或中文系统对全角标点符号(以下简称“标点”)的设置都不相同,且各有合理之处,所以本发明也允许用户对标点进行设置。标点分菜单选项中包括“系统标点、WPS标点、神通标点、……、自定义标点”,自定义菜单见图9,其中键位栏中的字符可用上档键输入,如果用户对菜单中某键位栏设置为空格,表明对该标点不做设置,则该标点的使用方法与挂接的中文系统相同,比如对“顿号”不做设置,而挂接的是213系统,则全角“顿号”就按照213系统的设置用纯中文的撇号“丶”输入。
如果对双标点中的左右标点用同一个键位定义,则在使用时,奇数次为左标点,偶数次为右标点。
功能键键盘:
功能键分菜单选项包括“系统功能键、WPS功能键、……、自定义功能键”。
本发明功能键分为三类:汉字输入方式切换键、汉字输入状态切换键、其它功能切换键。其说明和记忆方法见图10、图11、图12。各功能键的具体使用方法见“声韵首末码”的说明。
其中预备状态中“任意时刻”是指从把本发明的输入系统调入内存后直到将本编码从内存中退出为止的所有时刻;“本编码”是指从第一次按了“进入本编码”的功能键之后直到将本编码从内存中退出为止,其间即使切换到了本编码之外的其它输入方式时(ASCLL码、区位码、其它汉字输入码等),仍属于“本编码”状态;“本编码汉字输入方式”包括图10所指的各种汉字输入方式,即使没挂词组输入方式也包括在内;“本编码汉字字词输入方式”包括图10所指的各种汉字输入方式,而且必须挂有词组,其中“词组升级”必须在挂有后备词组的状态下起作用。
如选择系统功能键,则所有功能键的定义均为以上三图中的系统默认方式。
如选择自定义功能键,其定义菜单见图14。因功能键一般都使用复合键,故键位填框一般为控制键+功能键或字符键,当用户进行定义时屏幕下方显示出本系统可以使用的所有功能键组合的范围,用户在填框中填写时可直接敲击要定义的功能键的组合,则填框中出现该功能键组合的字样,比如用户定义某功能键时,按了ALT+J键,则填框中出现“ALT+J”字样。如果用户按的键位在本系统允许范围以外,则填框中不出现字符并报警。
在“默认状态”栏有内容的填框中用户可重新定义,定义方法是将光标移到填框中用回车键循环选择,选定后将光标从填框中移出。
为尽量避免与其它系统的功能键冲突,自由组合码调用键为进入本发明输入系统的唯一入口,当未进入时,所有功能键定义均不起作用。当进入之后,用本系统之外的输入方式(如“区位、首尾、快速、ASCLL等)可以暂时退出到其它方式中,此时除了按本发明定义的输入方式(包括汉字输入和其它文字输入)切换键之外,本发明其它功能键均不起作用,如果按本发明定义的输入方式切换键,则又回到本发明状态,其它功能键均可起作用。
外文键盘:
外文键盘分菜单选项中包括区位码中已有的俄文、日文和希腊文三种,选择每种外文后均可再拉出一个分菜单,选项一般包括其它中文系统(如WPS等)的外文键盘模式及自定义外文键盘,在外文键盘的自定义菜单中,俄文键盘自定义菜单见图15。因俄文字母较多,26个字母键不够,需要占用7个标点符号键,所以在图15中对被占用的标点符号设置有重新定义的键位,只要在字母定义时占用了哪个标点键位,哪个被占用标点就出现在菜单中等待定义。
希腊文键盘自定义菜单见图17,只须定义小写字母,则大写字母自动定义为小写字母的上档键。
日文因假名较多,有的系统用两个字母对应一个假名,所以本发明的日文自定义菜单允许用户用一到两个字符对应一个假名,见图16。
除了可在本系统内设置以上三种外文键盘之外,本发明的汉字输入系统还允许挂接独立的外文输入模块以及中国的少数民族文字输入模块,见“选择调用”部分。
设置编码:
分菜单选项中包括“系统编码”和其它各输入方式切换键(从“二键”到“注音”)对应的单字编码组合,“系统编码”即本发明系统默认的一整套编码组合方式。
用本发明提供的十二种编码元件,按照常规方式可以组合出55种编码方法,详见图13,其中声首、首末、声首末、声韵首、声首尾、声韵首末、声韵头尾、声头二尾、声韵首末调、声韵头二尾、双拼、双拼调、双拼句、全拼、全拼调、简拼、简拼调、注音等十八种输入方式为系统默认方式,可以看出系统默认编码方法全部为标准元件的组合,而且以音码为主,形码为辅。
所谓常规方式即:一,声韵位不能颠倒,二,首次末位不能颠倒,三,头二尾位不能颠倒,四,音码和形码不能互相穿插交错(但字型结构和声调位例外,可以附在最后一位)。
如果用户选择“系统编码”之外的其它输入方式切换键,则意味采用自定义编码组合方式。选择了某一输入方式切换键后,则在其右侧拉出一分菜单。
其中“二键”到“五键”,每个分菜单都是四条空白填框,空白填框分为两段,第一段填写单字编码组合方式,即每个分菜单最多可拥有四种输入方法,可填的字符个数等于该输入法全码键数,如“二键”的每条单字编码填框中只能填写两个字符,以此类推。此时,屏幕下方对可填字符进行提示:
S-声母 Y-韵母 D-声调 U-首笔对 C-次笔对 M-末笔对 T-头一笔画 E-第二笔画 W-尾笔画X-字型结构
如果“二键”的四条单字编码填框中依次填写“UC、UX、SU”和空白,则表示“二键”切换键只对应三种输入方法,依次为“首笔对+次笔对、首笔对+字型结构、声母+首笔对”,在实际进行汉字输入时可用二键码切换键循环切换出这三种输入方法。
只要在某一种编码组合中选用了“次笔对”,则所有编码组合中的笔对码均为准标准元件,即首末笔对分别指汉字两部分的首笔对和末笔对。
如果在某切换键分菜单中只填写一条单字编码组合方式,则表示该切换键只能切换这一种输入方法。
如果四条方法全部设置为空白,则表示该切换键功能取消,不对应任何输入方法。
空白填框的第二段只有一个字符的空位,填写“Y”或“N”,用来表示该输入方式中是否带有词组输入,系统Y”,如果填写“N”,则表示该输入方法不用词组码。
其中从“简拼”到“注音”,每个分菜单不是空白填框,而是具体的单字编码方式选项,单字选项与图13中各栏中对应的输入方法相同,如“全拼”栏对应“全拼”和“全拼调”两种编码方法。每个选项文字条的右方有两个填框,第一个填框可填写一位数字,表示该选项的输入方法是该切换键对应的第几种输入方法,如果填为空白则表示不要该方法。第二个填框填写“Y”或“N”,表明该输入方法是要词组码还是不要词组码。
词组编码方式是固定的,不用定义,两字词组合方式为“1212”,即第一字前两码加第二字前两码,三字词组合方式为“1112”,即三字首码加第三字次码,多字词的组合方式为“1111”,即前三字首码和末一字首码。
基本词库(包括常规词库和多音词库)中只有词组的汉字,没有词组编码(详见软件实现部分),所以各种输入法都能使用基本词库。后备词库中的词组既有词组汉字,也有词码,词码一律采用四键码中第一种编码方法的词组码,所以只有采用前两码与四键码中第一种编码方法相同的编码方法才适于使用后备词库。由于系统默认“声韵首末码”为四键码中第一种方法,所以系统默认的后备词库的词码为声韵双拼的词码。
选择调用:
该选项的分菜单中包括“动态调用、不等长码、双拼句、基本词库、后备词库、外文输入、外部模块”等七项,每项后面都带有一个字符的空白填框,可填写“Y”或“N”,表示是否调用该项。
如果选择“动态调用”,则每次调用“自由组合码”时,系统都要向用户依次提问是否调用其它各项,便于灵活机动地调用。其它各选项是否填写就没有作用了。
如果不选择“动态调用”,则每次开机时系统将按选择调用的设置自动调用各项。但如果不调用基本词库是不能调用后备词库的。由于等长码是本发明的主要部分,所以必须调入,而不等长码则可以选择调入。由于“双拼句”输入法本身就是一个很大的相对独立的系统,所以是否调用它需要经过选择来决定。
如果选择“外文输入”,则其右侧拉出一个分菜单,其选项包括在“设置键盘”中已经设置过的外文输入方法。只有在该菜单中经过调用选择的外文模块才能在实际输入时用相应的切换键调用。
如果选择“外部模块”,则其右侧拉出一个分菜单,包括若干空白填框,其中可填写外部模块的文件名及路径,如汉字输入外码(如五笔字型等)、其它外文输入法、民文输入法,以及其它外部模块。在实际使用时这些模块即可与自由组合码一同调入内存,不过要注意的是调用这些模块的切换键不要与自由组合码的功能键发生冲突,否则这些模块将无法使用。
如果用户对所有选项均填“N”,则表示只使用本系统的最基本配置,即等长码的单字输入方法,此时占用内存最少。
出口:
生成清单、显示清单:
当用户对系统进行了全部或部分设置后,希望观察当前设置的结果,可先选择“生成清单”,系统将根据设置生成临时的系统设置清单,再选择“显示清单”,则屏幕上出现一个关于系统设置清单的选择菜单,见图20(其中“功能说明”部分属于热键帮助菜单,在该菜单中不显示),通过选择可察看清单的任一部分。对于键盘设置,每个清单的内容基本上为一个相应的键盘图,比如双拼键盘的清单实际上就相当于图22中的声韵键位图部分,笔对键盘的清单实际上就相当于图22中的笔对键位图部分,但功能键键盘的清单可用图表方式表示;对于编码设置,每个清单的内容与每种设置的自定义菜单形式相仿。
该清单是一组文本文件,在退出“系统设置”之后,可用任何一种文字编辑系统(如WS、WPS、CCED等)将清单打印出来,供用户随时查阅。
存盘:
如果用户确认新设置的结果,则可选择“存盘”,即将键盘和编码的设置结果全部存盘,并进行以下工作:
如果用户对键盘设置和编码设置做了修改,则用新生成的系统设置清单代替原来的系统设置清单。
如果用户对键盘设置做了修改,或在设置编码时对“次笔对”使用与否做了修改,或修改了单字库文本文件(见软件实现部分),则系统生成新的单字码表;
如果用户对编码设置做了修改,则系统修改输入程序中的全部参数,形成新的输入方法。
确定新的挂接系统的方式和选择调用的方式。
但如果用户对键盘和编码未做任何修改,则前三项工作免做,只做第四项。所以用户可以随时对“挂接系统”和“选择调用”做调整。
换后备库:
如果用户对四键码中第一种输入方法做了重新设置,则系统将提醒用户更换后备词库,选择此项后系统根据四键码中第一种输入方法的编码对后备词库的编码进行全面更换。
退出
无论用户是否已生成清单、已存盘、已更换后备词库,都可以选择“退出”,即退出系统设置子系统,回到操作系统下。显然,如果未存盘就退出则等于放弃所有新的设置,所以在退出时,如果用户做过新的设置而未存盘,系统将提醒用户是否放弃存盘。
以上是对系统设置子系统的说明,以下将开始对汉字输入子系统进行说明。
本发明的输入方法可以由用户自由组合,仅编码组合方面图13就列出55种常规组合方式,同时系统允许用户以非常规方式设置编码组合,组合方式就更多了,另一方面,键盘组合方式的可能变化种类数量就象棋盘变化数量那样更是非常巨大的,而汉字输入方法则是键盘组合与编码组合两者的再组合,所以本发明包括的输入方法可以认为是无限多的。而系统默认的一整套输入法只是本发明所有输入法中极少的一部分,只是为了方便用户而提供的一套样例。所以不能认为本发明的输入方法只指系统默认的十八种,实际上本发明覆盖了用十二种编码元件所能组合出的无限多种输入方法,这正是本发明与目前所有汉字输入方案最本质的区别。
为节省篇幅,此处只重点讲述系统默认输入法中的几种有代表性的输入方法,其余方法都可以此类推。
每当用切换键切换到某一输入方法时,提示行出现该方法的名称,如“声首、声首末、声韵首末、声韵首末调、双拼调、全拼”等。对等长码来说,名称有几个字就说明属于几键码。
本发明输入法中的重点是“声首末码”和“声韵首末码”两种,对后者做比较详细的介绍。在不等长码中主要介绍全拼码。
声韵首末码:
该码主要供专业录入员使用,特点是重码率和平均码长均较低,输入速度快。
图22是第一实施例的汉字输入键盘图,它包括第一实施例的双拼键盘、声调键盘、笔对键盘、笔画键盘、字型结构键盘,可用于第一实施例中的所有输入方法。该键盘实际上包含了两种主要的键盘设计思想:一是笔对键盘设计,它与发明人的另一项发明《声韵笔对码汉字输入方法及键盘》中的笔对键盘设计一样,其设计思想以及与已有技术相比所具有的先进性可参阅该发明的说明书。笔对键位的记忆方法是:在键盘图中先找到“横”(H)键作为横组的第一键安排横组,然后依顺时针方向依次安排竖组、撇组、点组、折组。每组中再按第二笔的“一丨丿丶乙”顺序从左到右排列五个位,这样便形成一套有规律,便于记忆的排列图。
该键盘中包含的另一种键盘设计思想是双拼键盘设计,简述如下:
韵母表中的纵坐标韵母(开口呼)基本上放在键盘的中行做为基准,韵母表中的“U”列(合口呼)和“ü”列(撮口呼)放在上行,“I”列(齐齿呼)放在下行。在中行,因为字母A在最左边,所以将以A开头的韵母紧跟着放在中行的左半边,连同A共占左手的五个键位,以E和O开头的韵母放在右半边。上下行的韵母与中行韵母按纵列组合对应。比如中行最左键位是A,上行相对应的键位为UA,下行相应键位为IA。其中UN的键位因与U冲突,向左移一位,放在Y键上
之所以将韵母表中的“ü”列与“U”列合并放在上行,是因为在绝大多数情况下,含有U和ü的每组相对应拼式的读音是可以相容的,所以本发明只用含有U的拼式来代替这两类拼式。
将单韵母ü安排在W键上,因为上行是以U和ü为横坐标的行,所以把ü放在上行比较合乎规律,从键位上看,W的形状与ü也有一点相象。
由于韵母比英文键位多,所以不可避免地会有两个韵母同占一个键位而产生特例,但特例只有“IU、OU、UI、IE、UE”五个,其中,以E结尾的IE和UE其横坐标还是符合规律的,而且键位安排也都有助记方法。IE的读音与I跟AI的相拼(当然实际上不能拼)比较接近,另外,“爷”字的上部有个X形,对应X键。UE与T键的对应可以用“约他(她)”这个词语来助记。OU从纵坐标上看还是处在O区的,从横坐标上看它也含有U。真正的,完全的特例只是IU和UI这两个,恰好IU的读音与其键位上的英文字母Q的读音相近,很好记忆,UI从纵列上看与U同列,有助于记忆,UI与M键的对应也可以用“为民”这个词语助记。
以复韵母结尾的全部韵母中只有IONG不符合横坐标,但它与ONG放在一起,是符合大部分双拼键盘的习惯的。
总之,这个根据韵母本身组合规律排列的二维双拼键盘具有整齐易记,规律性强,坐标定位性好的特点。
单字编码:声母+韵母+首笔对+末笔对
如:华-HQSJ 机-JIJG 学-XTRY
这里所说的声母实际指汉语拼音码中第一码。包括真正的声母,以及零声母A、O、E和准声母Y、W,其中双声母ZH、CH、SH用V、U、I、代替。
对于拼音码以“a,o,e”开头的汉字,声母位分别为A、O、E,韵母位为相应的双拼韵母,如:
啊-AABN 哦-O OBF
鹅-EEAY 该-EITF
安-AFRA 恩-EJBR
埃-ASJF 欧-OPKF
昂-AGBU 傲-ADSF原拼音码ER者,声韵位仍按ER输入,如:
二-ERHM 儿-ERGM
对于无韵母汉字(在汉字集中只有两个字),其韵母位以Z代替,如:
呒-MZBG 嗯-NZBR
对于无读音字符(即单独的偏旁部首),其声韵位以OZ代替,如:
讠-OZTM 氵-OZRR
-OZZG 卩-OZUM
如编码不够四码(即笔对空码)则补M
卜-BUVM 力-LIGM
如遇三画字或一画字,单笔凑不足笔对时,以单笔对应的双笔对代替。即“一”对应“一一”;“丨”对应“丨丨”等,如:
兀-WUKP 乙-YIPM 编码举例如下:
中-VLBJ 国-GOBQ 键-JVAO
工-GLJH 飞-FKIR -OZZG
厂-IGKM 一-YIHM 忄-OZWR
进入简码方式:
系统默认进入简码方式,用户可用简码切换键退出简码方式,也可再切换回来。
声韵首末码共有三级简码,按照汉字频率高低依次排列。
因为本发明可包括无限种输入方法,因而单字码表中不可能安排各输入方法的简码标志位,所以一级单字库不按区位码排列,而按使用频率高低排列,或加频率标志位(以下输入机制按照一级字库依频率排序的方式叙述),故而简码输入机制与一般汉字输入法有所区别。
当敲第一键时,提示行出现与该键对应的最先找到的汉字,即为一级简码字,如:R-人,D-的,H-和,等等。如要该字则敲空格键,该字即跳上编辑位。此时如果敲字母之外的其它ASCII字符(如标点符号或数字等),则提示行中的汉字与ASCII字符都上编缉位。此时如果敲光标控制键或删除键等,则不予认可并报警。其它各级简码字出现在提示行中之后处理方法同此。
敲第二键时,提示行出现与已输入码对应的最先找到的汉字,即为二级简码字,如:BU-部,YL-用,等等。
如果完全没有相应的汉字则为空码(如输入NB不对应任何汉字),见空码处理。
当敲到第三键时,如果恰巧二级简码字的前三码也与输入码相同,则分为两种情况处理。如果除二级简码字之外没有与输入码相应的汉字,则该二级简码字仍留在提示行,用户可用空格使其上编辑位,即继续充当三级简码字,比如“能”字是二级简码字,当输入到NHO时,没有相应的汉字,则“能”字仍留在提示行。如果除二级简码字之外还有其它相应汉字,则以其它相应汉字中最先找到的做为三级简码字。比如敲ZS键时“再”字做为二级简码字出现,当敲到ZSJ时,虽然“再”字仍符合输入码,但还能找到其它与ZSJ相应的汉字,则以最先找到的“载”字做为三级简码字。总之,只要存在与输入码相应的汉字就不做为空码处理。
简码有三千多字,占汉字使用频率的95%,即一级汉字基本上都是简码字。
退出简码方式:
当退出简码方式时,每敲一键,提示行都分屏出现前几码与输入码相同的全部汉字,排列顺序如下:每次排在首位的都是按“进入简码方式”中所述方法找出的相应级别的简码字,比如敲“Z”时提示行中排在第一位的是一级简码“在”字,而敲“ZL”时提示行中排在第一位的则是二级简码“再”字。其它汉字按查找的先后顺序排列。当敲到第三、四键时,与输入码相应的全部汉字和基本词组都出现在提示行中。如敲到“KEJ”时则“克、可、棵、……”以及相应的词组“科技、可见”等均出现在提示行中,排列顺序为字先词后,只要在“退出简码”方式下,各种等长码在未输够全码时,排列顺序一律为字先词后。当敲到KEJF时,只有全码字“棵”,则直接上编辑位。
全码及重码:
敲完四键提示行出现全码字,如无重码直接上编辑位;
如有重码字,排列顺序为:该组重码中非简码字中的最高频字为第一字,然后是其它字,按查找出的先后顺序(即频率高低顺序)排列。在“进入简码”方式下,有简码的字在全码时是否做为重码出现取决于当前是兼容方式还是不兼容方式(见后文)。重码第一字敲空格键上编辑位,其余字依数字序号从1到0选重,每屏可排11个字。当重码字在提示行显示不下时,后面加“[->]”符号,以示可翻页。对重码第一字也可不做任何处理,直接输入下文(包括汉字和标点符号)该字即跳上编辑位。
在“退出简码”方式下如有重码,则所有重码字组一律分屏出现在提示行中,按查找出的先后顺序排序。选重方法同上。
空码:
如果用户定义该输入法可输入词组,在输入前三键时如遇空码(即没有相应的单字和短码词),不报警也不清除已输入码,只清除提示行字词;在输入到第四键时如遇空码,报警并清除输入码。如果用户定义不能输入词组,在输入前三码时如遇空码(仅指单字),报警并清除最后一码和提示行汉字,等待用户改正或全部清除;在输入到第四键时如遇空码,报警并清除输入码。
单字和词组的模糊键:
单字输入中凡不清楚的码均可用“\”键来代替,用了模糊键后,当处于“进入简码”状态时,前三键内出现的是简码字,第四键出现全部相应字;当处于“退出简码”状态时,每键都出现全部相应字。提示行中的重码字按单字库顺序排列,选中后,提示行出现该字的全码以供学习。
词组输入中凡不清楚的码均可用“\”键的上档键“丨”来代替,用了词组模糊键后,前三码提示行无字词显示,到第四键后基本词组中的所有相应词组全都分屏出现,无重码则直接上编辑位,有重码选重。选中后提示行出现该词组的词码以供学习。
全角半角方式切换:
系统默认半角方式,用户可用全角半角切换键切换为全角方式,即相当于纯中文方式。也可切换回来。但当用户将输入方式切换到自由组合码以外的输入方式时(如区位码、ASCLL码等),全角或半角方式不起作用,再切换回去时继续起作用。比如在本发明输入方式中切换为全角方式,当切换到ASCLL码输入方式时,仍保持原来的非纯中文方式,再切换回到本发明输入方式时,又回到全角方式
简码与全码兼容方式的选择:
为减少重码,提高输入效率,并方便操作者,当处于“进入简码”方式时,声韵首末码的简码与全码之间采用兼容与不兼容两种方式。兼容方式为有简码的字当敲到全码时仍然出现,初学者如果对简码不熟悉,“敲过了站”,敲完全码时仍能找到该字。而不兼容方式为:凡有简码的字当敲到全码时如果与其它字词发生重码则该字不出现,如没有重码则该字直接上编辑位。如“保”字与“煲”字全码都是BDSF,是一对重码,但“班”字属于三级简码字,在不兼容方式下只对应简码BDS,则全码BDSF只对应“煲字,这样这一对重码就被“消灭”了。由于声韵首末码的简码字占汉字使用频率的95%,所以采用不兼容方式能大幅度降低单字重码率。又如“的”字是一级简码字,其全码为DESO,与其它字词不发生重码,所以在敲到全码时仍然可直接上编辑位。
当处于“进入简码”状态时,系统默认不兼容方式,但初学者可用兼容方式切换键切换为兼容方式,待常用字的简码记熟之后,可直接使用系统默认的不兼容方式。
兼容和不兼容方式的转换只在四键码(如声韵首末码、首次末型码等)时才起作用。
基本词组:
两字词为第一字前两码+第二字前两码
如:科技-KEJI 团结-TRJX
三字词为三字声母+第三字韵母
如:无线电-WXDV
四字词及四字以上的词取一、二、三、末字声母,
如:自力更生-ZLGI
新疆维吾尔自治区-XJWQ
在处于“进入简码”状态下,除了这种四码词组之外,还有两字短码词和三字短码词。
当敲到第二码时,无论提示行是否出现二级简码字,提示行右端还可能出现一个两字词组,该词组两字首码与输入码相同,比如当输入码为“XZ”时,提示行出现二级简码字“夏”,同时在提示行右端出现相应的两字短码词“现在”,在词组前有一分号,表示此时只要按分号键该词组即上编辑位。如果没有对应词组,则不出现短码词。同样,当敲到第三码时,也可能出现三字短码词,如敲“WXD”,提示行右端出现词组“无线电”,敲分号键上编辑位。
后备词组:
系统规定只有四键码中第一种输入方法以及前两码与四键码第一方法相同的其它输入方法适合于使用后备词库。
当第四键输入完成之后,分两种情况处理:
如果有对应的单字或基本词库中的词组,则后备词库中的词组不出现在提示行与基本字词形成重码。此时如果基本字词没有重码则直接上编辑位。但基本字词如果不是所需要的字词,虽然已经上了编辑位,但还可以用CTRL+翻页键连续翻页,寻找并选用后备词库的字词。如果基本字词本身有重码等待选重,此时可用翻页键翻到下页,对应的后备词组在第二页等待选重。只要用翻页键翻到后备词组,则不能再用翻前页键翻回基本词组或单字。
如果第四键输入之后没有对应的基本字词,则后备词组直接出现在提示行等待选重,如无重码则直接上编辑位。
词组升级:
后备词组被选中后提示行提示用户可敲词组升级键使该词升级为基本词组,则以后再输入该码时,该词组即与自造词组一样出现在第一屏。如果不升级,则仍为后备词组。
如果希望将升级后的词组存盘见“词组存盘”。
字词优先选择;
系统默认词优先方式,即当词组出现在提示行时,如无重码,则该词整个跳上编辑位;如有重码,当用户选中该词时,该词整个跳上编辑位。用户可用字词优先选择键切换为字优先方式,即当词组出现在提示行时,如无重码,则该词第一字跳上编辑位,如有重码,当用户选中该词时,该词第一字跳上编辑位,此时如敲空格则整个词组都跳上编辑位。
词优先方式利于快速输入词组,字优先方式利于用词组输入单字,减少字形分析的困难。
重复输入:
当一个汉字(或词组)输入完成后,无论移动光标或输入数字、标点符号等,只要提示行中的字词仍存在,均可进行重复输入。如果想重复输入该字词或想输入提示行中其它字词时,可按ALT+序号键,如果该字词在提示行中第一位,则按ALT+空格键。
智能联想;
系统默认退出智能联想状态,用户按切换键之后提示行显示;进入联想。当用户选中一个汉字或词组之后,提示行出现联想字词,即从本次开机后使用本编码开始以来(不是从开始切换到智能联想状态时算起),每次输入该字词之后接着所输入的全部字词。如在前文中已输入过“张建国”这个姓名,当时是输完“张”之后接着又输入“建国”这个词组,则以后凡输入“张”字之后,提示行便出现“建国”。
如果前面输完“张”之后,还接着输入过其它字词,则全都做为智能联想词出现在提示行中,如有重复字词只取一个,重码排列顺序的原则有两个,一是重复次数越多的字词越往前排,二是在重复次数相同的字词中越是刚刚输入的字词越往前排。用空格和数字键选重。当重码超过一屏后,后面的字词便自动取消联想关系。即重码只有一屏,翻页无效。
智能联想的结果不存盘。
当不需要联想时,再按一次切换键,提示行显示:退出联想。
动态造词:
按一下造词键,提示行显示:造词开始(不得超过128个汉字长度),然后用户开始输入任意字符串(可以包括非汉字字符),直到再按一次造词键,造词结束。
如果该字符串的前三末一个字中含有非汉字字符,则系统提示用户自编一个四个字母的词码,如对字符串“华达DOS系统”可自编词码为“HDDT”,则该词在存盘时将放在多音词库中(参见软件处理部分);如果该字符串的前三末一个字中含有多音字,则系统根据多音字库中的信息自动列出多音字的读音,如用户输入“音乐”一词,系统列出“乐-1:LE、2:YV”,其中1为常用音,2为非常用音,用户可选2;又如用户输入“剥削”一词,系统列出“剥-1:BAO、2:BO;削-1;XIAO、2:XUE”,用户可选22,如果在用户的选择中含有“2”(即多音字中的非常用音),则该词为多音词,如果在用户的选择中没有“2”则为常规词,比如用户输入“会议”一词,“会”字虽然是多音字,但因用户选择了“1”(即HUI),所以该词为常规词。如果该字符串的前三末一个字中既没有非汉字字符,也没有多音汉字,则直接显示“造词结束”。
如果所造字符串的前三末一字中既含有多音字又含有非汉字字符,则按非汉字字符情况处理。
此时所造新词均在内存中,如果用户希望存盘,见“词组存盘”。
删除词组:
当用户认为某基本词用处不大且与其它字词造成重码,可从基本词组中删除。按一下“删除词组”键,提示行提示用户输入欲删除的词组,然后系统向用户提问:是否确认删除该词(Y/N),如果用户回答“Y”,则系统将该词从基本词组中删除(但此时的删除只在内存中进行,如果用户希望将词组真正从基本词库中删除,见“词组存盘”),然后删除词组状态自动取消。如果回答“N”,该词组不删除,删除词组状态自动取消。
词组存盘:
按一下造词存盘键即把新造词组和升级词组存盘,多音词和前三末一字中有非汉字字符的词组补充在多音词库的末尾,其它词补充在常规词库的末尾。同时将删除词组的结果存盘,即真正从基本词库中将词组删除。
对声韵首末码做了详细介绍后,对其它等长码的许多功能就可以以此类推。等长码在一般功能上都比较类似,只是因码长不同在输入步骤上有所不同,即随着每一码的键入提示行上显示哪类字词,以及字词的排列先后顺序不同,所有这些情况都详细列在在图21中,图表每栏中的内容表示在相应情况下显示行中出现的字词类型,字词的先后顺序与栏中字词先后顺序同,从中可以看出一个规律:在全码时字词发生重码词先字后,在全码之前字词重码时字先词后。凡图21中讲到的,下面一般不用再叙述。
声首末码:
该方法简明易学,且效率也比较高,适合于非专业人员。
单字编码:声母+首笔对+末笔对,如:“华”-HSJ。
该输入法与声韵首末码相同或相似处不再重复,主要说明不同处。
全码及重码:
敲完三键提示行出现全码字(包括有简码的全码字,即简码与全码兼容)),如没有重码,敲空格键上编辑位;如有重码,与声韵首末码处理方法相同。如果当该输入法不挂词组时,则当全码没有重码时,该字自动跳上编辑位。该处理方法适用于所有词组码长大于单字全码码长的等长码情况。
空码:
当挂有词组时,在输入前三键时如遇空码,不报警也不清除已输入码,只清除提示行汉字;在输入到第四键时(即词组码)如遇空码,报警并清除输入码。如果该输入法不挂词组,则当单字输入为空码时报警并清除刚输入的最后一码,等待用户改正或全部清除输入码。该处理方法适用于所有词组码长大于单字全码码长的等长码情况。
其它各项,如单笔处理、笔对空码时补M键、重复输入、模糊键、全角半角切换、智能联想、动态造词、删除词组等均与声韵首末码相同。但没有兼容方式选择、后备词库、词组升级等功能。
全拼码:
全拼码是不等长码,最短只有一码,如A、O、E等,最长6码,如ZHUANG,不使用简码方式。每输一码,提示行即分屏出现与已输入码对应的全部汉字,如:
Z:在、再、咱、杂、脏、造、则、......
ZH:这......
ZHU:主......
ZHUA:抓.....
ZHUAN:转......
ZHUANG:装......
重码:当提示行有重码时,用空格键或数字键选重,无重码时也用空格键选重,如:“能、日”,以备后面还要继续输入组成词组码。
空码:第三键之前不报警也不清除输入码,到第三键时如果单字为空码,则自动转入多字词组处理。
在全拼码中ü用V代替。如“吕-LV”。
两字词组:两字之间用分号键“;”分隔(其它不等长码均同,但全拼码也可以在词组两字之间不加分隔符)。比如想输入“服装”,先输入“FU;”,再输入ZHUANG。
当第二字输入到ZHU时,提示行出现“辅助、扶助”等词组,等待选重,如不选再继续输入。
当第二字输入到ZHUA时,为空码,不报警,也不清除提示行,等待继续输入。
当第二字输入到ZHUAN时,提示行出现“复转”等词组,如不选再继续输入。
当第二字输入到ZHUANG时,因已输满全码,不可能再输入,所以如无重码就自动上编辑位,有重码用空格或数字键选重。此时如果继续输入下文(字母、标点符号等)则重码第一词上编辑位。
多字词:即超过两字的词组,词码为该词组前三个汉字的第一个字母,如:缝纫机-FRJ、各级领导-GJL,等等。当输入码为三键并对单字是空码时,出现相应的多字词,如没有相应的多字词,则报警并清除输入码。
凡是不等长码一律没有简码方式,词组方式与上面类似,不能使用后备词库,没有词组升级、模糊键等功能。
全拼调码:
在全拼码的后面加声调码,声调与键位的对应见图7,最短码为两键,最长码为七键,规则与全拼码相同。
声头二尾码:
每字输入四码:声母、全字第一笔、第二笔、末笔,该方法简明易学,记忆量极小。笔画码元规定见图6,即:横竖撇点(捺)折五类笔画分别对应HIJDV五个键位,记忆方法为:“横竖点折”的声母为HIDV(“撇”的声母P键位较远,敲击不方便,故“撇”未对应P键),且“横竖撇点折”的形状与对应字母相象,如:H的中部为一横,I为竖笔,J象撇笔,D象点笔的轮廓,V为折笔。举例如下:
科-KJHI、技-JHVO、信-XJIH、息-XJID
不足三笔(即全码不足四键)以K(空笔)补足,如:力-LVPK、乙-YVKK。
其余规则均与声韵首末码相似,但没有后备词库、词组升级等功能。
声首码、首末码:均为二键码,所有二键码因其全码太短,所以一律没有简码功能,不能使用后备词库和词组升级功能,其它均与声首末码规则相同。
声韵首码、声首尾码:均为三键码。规则同声首末码。但声韵首码可使用后备词库。
其中声首尾码是笔对和笔画码元同时使用的输入方法,主要是因为在声首末码中末笔对有时不是很直观,所以此处改用末笔画,可以降低难度,但同时带来的问题是重码率略高。它与声首末码几乎完全相同,只是第三键的取码完全按照单笔画码元处理。当汉字在三画以上时,第三键取该字末笔,“一丨丿丶乙”五种笔画分别对应HUJDV五个字母,当汉字为两画时,末笔为空,对应K键(空码),当汉字只有一笔时,首笔对仍按笔对码元方式取码,即与声首末码相同,末笔码为K。举例如下:
科-KAU 技-JND
力-LIK 乙-YPK
用户如果觉得笔对码元与单笔码元键位不统一造成不方便,亦可重新定义笔对笔画键盘,但会影响其它含有单笔码元的编码。
声韵头尾码:为四键码,规则同声韵首末码,可使用后备词库。
声韵首末调码、声韵头二尾码:均为五键码。前者重码很低,后者很易学。其规则与四键码相仿,其中声调与键位的对应关系见图7。输入步骤比较特殊,当输入到第四键时,出现词组和四级简码字,词先字后,如果当只有词组没有单字,而且词组没有重码时,该词组直接跳上编辑位,可使用后备词库,当输入到第五键时,只出现全码字,且全码与简码兼容。参见图21。
双拼码、双拼调码:前者规则与二键码同,后者规则与三键码同。可以使用后备词库。
双拼句码:
这是一种特殊的智能输入方式,所有汉字一律输入声韵两码,各字之间不加间隔符,等到输入空格或标点符号时,系统对输入码进行处理,根据字词之间的可搭配关系组成整句输出。当系统无法确定所对应的字词时,由用户帮助确定。这种句输入方法在已有技术中已实现,开发者可参考已有技术(见王晓龙《第一代汉字输入技术的研究和发展》《中文信息学会十周年学术报告论文集》和哈尔滨工业大学推出的IS系统《中国计算机报94年1月18日)。
简拼码,简拼调码:
和CCDOS拼音压缩码的键位及规则基本一样,当声韵同键时(比如输入“J”键),则提示行先出现与该韵母(即AN)对应的一级汉字,再出现与该声母(即J)对应的一级汉字,最后出现与该声母和该韵母对应的二级汉字。该方法是不等长码,在词组方面与全拼码规则一致。
注音码:
注音码键位图见图19,每个键位中左下方是注音声母,右下方是注音韵母。当输入第一键时,提示行分屏出现与该键位注音一致的所有汉字,如果声韵同键,规则与简拼码同。其它规则均与全拼码一致。
附:首次末型码
该输入方法因包含准标准元件“次笔对”和“字型结构”,所以不属于系统默认的输入方法,用户可通过编码设置得到该输入法,因该方法是比较典型的准标准方法,也是一种重码比较少的纯形码,因此附带予以说明。
该方法的字型结构与键位的对应关系见字型结构键盘自定义菜单,即图8。对各种字型的汉字首、次、末笔对的取码顺序说明如下:
对独体字,首、次、末笔对分别取全字的一、二、三、四笔和最末两笔,如:事一JYNF。如果取某笔对时只剩一个单笔,则以相应的双笔代替,如“生”最末只剩一横,则末笔对取“一一”,即H键,全码为AJHF。如果其中笔对码不够三码,以M键补足,如:力-IMMF、工-JHMF。
对左右型字,左部只取首笔对,右部取次、末笔对。如:倍-SQYG,削-VBMG。
对上下型字,上部只取首笔对,下部取次、末笔对。如:宛-RGPH,势-NIMH。
对包围型字,包围部分和被包围部分中首笔在先者为第一部分,取首笔对,另一部分为第二部分,取次笔对和末笔对。如:团-BNDJ,进-HTRJ,赵-JFMJ、病-QJFJ,区-NFMJ,网-BFFJ、函-PBMJ、司-PJYJ。
简码、词组、模糊键、联想、造词等功能均同声韵首末码,如果用户将首次末型码设置为四键码中第一方法,则可使用后备词库、词组升级等功能。
附:首末声韵码、头尾声韵码。
该两方法以形为主,也不属于系统默认方法。它们与声韵首末码基本一样,不同之处在于,该两方法将笔对或笔画码放在全码的前面,当笔对或笔画有空码时补充笔对或笔画的空码键(如M或K)。
汉字输入以外的其它功能:
只要处在本编码的汉字输入和外文(俄、日、希)输入状态下,以下功能均有效。
制表符。
按制表符切换键ALT+B后,小键盘区的数字键定义即被设置为制表符。见图18,当NUMLOCK键未锁定时,直接按光标键和INS键、DEL键仍然为光标、插入、删除等原作用,按住SHIFT键时再按这几个键即为制表符,当NUMLOCK键锁定后,这几个键的作用与上面相反,直接按键即为制表符,在SHIFT键控制下则为原作用。
在制表符设置后,无论NUMLOCK键是否锁定,小键盘区的加减乘除键均为制表符,见图18,但加减乘除键与INS键、DEL键作用不同,后者两键只是按一键出一个“一”或“丨”制表符,同时光标往右移位,而加减乘除键则可用来直接向上下左右方向画线。因除号和乘号是左右排列,所以为左右画线,除号往左画,乘号往右画,减号和加号是上下排列,所以为上下画线,减号往上画,加号往下画,无论是否在改写状态,这四个键画线时均为改写状态,而非插入制表符,当画线时遇到屏幕上已有的表格线时,可自动按情况画出不同的制表符。比如用乘号键向右画线时遇到竖制表符,自动画出““
”符,如果再继续往右画,则横竖交叉处自动变为“
””符;如果遇到下面是竖线,而上面没竖线,则自动画出“”符,如果再继续往右画,则横竖相交处自动变为“
”符。也就是说,只用这四个键就能很快捷地画出很复杂的表格来。如果按住SHIFT键,则加减乘除键叉变成抹表线键,可向上下左右方向抹去表格线,如果在前进方向上不是表格线,而是其它字符,则其作用为:将前进方向改写为空格。
当没置制表符后,其它所有功能,如移动光标,输入汉字、词组、标点符号、外文、图形字符,以及联想、造词等完全不受影响,可照常进行。当再按一次制表符印换键,则取消制表符。
图形字符:
按图形字符切换键ALT+T后,区位码中1区的字符出现在提示行中,按数字键选重,选中一个字符后,仍可直接用数字键选重,用翻页键可继续寻找本区其它字符,输入字符后仍可继续翻页寻找,提示行不清空。
如果连续按ALT+T键,则提示行依次出现各区字符,按第几次,就出现第几区字符,当超过第九次时,又从第一区开始循环。
除了按ALT+T键之外,当处于图形字符状态时,也可以按ALT+1到ALT+9,1区到9区的字符分别出现在提示行中,输入方法同上。
如果按其它输入法切换键,则取消图形字符输入状态。
热键帮助:
只要进入本编码后而未全部退出本编码前,无论什么时刻(包括本编码输入状态和本编码以外的输入状态),按ALT+H均可进入帮助菜单(见图20)。从图中可以看出,帮助菜单就是系统设置清单的目录菜单再加上各种功能的说明,所选各项也正是系统设置清单中的各个图表和说明。“功能说明”栏中的“系统说明”是对本发明整个系统的概要说明。
“模式清单”栏有三项,其中“挂接系统”是当前挂于何系统的设置清单,“设置模式”是当前定义模式(系统默认模式或自定义模式或其它模式)的设置清单,“选择调用”是当前选择调用的设置清单。
俄文输入:
在本编码状态下按ALT+E即进入俄文输入方式,键盘图见图23,它与王码系统中的俄文键盘基本一致。输入方法是:在CAPSLOCK键未锁定时,直接按键输出小写俄文字母,在SHIFT控制下按键输出大写字母。当CAPSLOCK键锁定时,字母键作用相反。
在俄文状态下按其它输入方式切换键(本编码和本编码之外的各种输入方式)即退出俄文状态,返回原来的输入状态。
日文输入:
在本编码状态下按ALT+R即进入日文输入状态,假名与键位的对应关系见图16,它与WPS系统中的日文键盘一致。输入方法为每按两个相应的小写英文字母键输出一个日文平假名,用SHIFT+小写字母(或直接锁定为大写字母)可输出片假名。退出方法与俄文相仿。
希腊文输入:
在本编码状态下按ALT+R即进入希腊文输入状态。输入方法和退出方法与俄文相仿。键盘图见图24,它与北大方正系统中的希腊文键盘一致。
以上是本发明的汉字输入方法及其它功能的说明,以下说明本发明软件实现的某些要点。
软件实现本不属于汉字编码发明的专利说明书范围,但因该系统比较庞大复杂,所以对软件实现的某些要点略加说明有助于软件开发工作。该说明主要基于软件存放在硬盘上且计算机内存较小的情况,空间和速度的矛盾较大,如果开发成硬卡或将系统放在640K常规内存之外则可与此不同。
等长库字库结构及查找:
本发明的主要部分在于等长码,全拼、简拼等非等长码在已有技术中已比较成熟,可以借鉴,注音码和简拼码实质上非常相象,也可借鉴。因此主要说明等长码。
等长码单字库分为两个分字库。
一级字库
本发明以文本方式提供一级汉字属性信息表,叫做一级字表,分主表和附表两部分,两表中包括以下信息项:汉字、声母、韵母、声调、全字首笔对、全字末笔对、第一部分首笔对、第二部分首笔对(次笔对)、第二部分末笔对(这五种笔对简称“全首、全末、部首、部次、部末”)、字型结构。其中零声母的声母位为数字“0”,偏旁部首的声韵位均为空格,以数字“12345”依次代表五种笔画“一丨丿丶乙”,以数字“0”代表笔画空缺,以“1234”依次代表阴、阳、上、去四种声调,以“1234”依次代表“独体、左右、上下、包围半包围”四种字型结构。
该表按汉字使用频率降序排列,对一般字、零声母字、无声母字、偏旁部首等举例如下:
汉 声 韵 声 全 全 部 部 部 字
字 母 母 调 首 末 首 次 末 型
的 d e 4 32 54 32 35 40 2
一 y i 1 10 10 10 00 00 1
........................
昂 0 ang 1 25 52 25 35 52 3
........................
呒 m 4 25 35 25 11 35 2
........................
纟 55 10 55 10 00 1
........................
在一级汉字主表的末尾增添若干多音字,如“行”(HANG)、“长”(ZHANG)等做为附表,也就是多音字库的文本文件。在主附表之间用一行星号做为分隔,或将主表和附表分为两个文件。
在附表中用户可自行增添自造字。对多音字的排列顺序,用户也可自行在表中更改,如“率”字在主表中音码为lü,在附表中为SHUAI,如用户认为后者更常用,也可互换位置。对主表中所有汉字的顺序用户均可按自己的实际需求进行调整。用户也可对自己认为不合适的各项信息予以修改。
用户可以在修改后运行系统设置中的“存盘”功能,即可生成新的单字码表,代替原来的单字码表放在输入系统中(二级字库同)。
一级字表相应的码表结构为:每字占6个字节,共48位,其中25位存放声、韵、首、次、末五种码元的字母,如果不用次笔对则该位置空闲,如果用次笔对则在运行“存盘”功能时,将“全首”和“全末”换为“部首”和“部末”。16位存放汉字,剩下的7位中2位存放声调,2位存放字型结构。空闲3位。
字库码表中不为单笔画单独设置码元位,当使用单笔画码元时,程序可从笔对码元中提取到信息,比如输入的“头笔”为H(横),则凡首笔对属于横组者(即HJKLN)均符合输入码,同理可提取出第二笔和末笔的信息。
如果实施者用另外的方法能够妥善处理码表占用内存问题,也可以在字库码表中为单笔画单独设置码元位。
该字库(即码表)按单字主表的顺序排列,即按频率排序,所以可以不设置简码标志位,重码标志位等,而且因输入方法很多,各方法的简码字、重码字各不相同,也无法在码表中设置简码和重码标志位。当输入码处于简码时,顺着字库查找到的第一个符合输入码的汉字就是相应的简码字,当输入码为全码时,则顺序查找全部相应汉字。
除了按频率排序方式构造码表之外,实施者也可以采用另一种方式,即一级字库的码表按区位码排列,不存放汉字,另加一个频序标志位,占12位,因2的12次方为4096,正好大于一级汉字的总数,每个字的频序值就是该字在一级汉字主表中的序号。
如果为节省内存,频序标志位也可以只用11位,2的11次方为2048,一级汉字共3755个,多于频序号。可以这样分配频序号:前面频率最高的855个字每字占一个频序号,其后1400个字每两个字占一个号,最后1500个字每三个字占一个号,如此3755个字正好占2048个号。这样一个汉字在码表中全部只占40位。5个字节整个一级字库比原来少3755个字节。
这种方式的好处在于系统对每个词组编码时,可以比较快地找到相应的汉字提取编码,因为这种码表是按照区位码排序的。而且占内存也小一些,问题主要是输出每个简码和对重码排序时必须要查遍一级字库才能确定,单字输入时稍慢一些。综合单字和词组两方面的考虑,后一种方式速度要快些。
二级字库:
其文本文件叫做二级字表,信息项次与一级字表相同,但汉字可以按任意顺序排列,当系统将字表转换为码表时自动按区位码排序,用户可对其中的信息项次进行修改。
相应的码表结构与一级码表基本相同,但因按区位码排列,所以不用存放汉字,每字少用两个字节。查找方法同一级字库。
词组库结构及其查找:
本发明以文本方式提供两个基本词库和一个后备词库。基本词库中包括常规词库和多音词库。
常规词库:
在该库中每行为一个词组,只有汉字,没有词码。按词组使用频率排序。用户如果认为顺序不合适,可自行调整。
多音词库:
凡是词组的前三末一字中含有多音字组的第二音字,则该词组放在多音词库。在该库中每行一个词组,前四个字符为数字和空格,用来表示该词组中多音字的位置,后面紧跟词组,如:
12银行
121音乐厅
1112保障供给
1211西藏自治区
..................
自造词组:
自造词组如果不属于多音词组,则存放于常规词库后面,如果属于多音词组,则存放在多音词库后面。
如果自造词组的前三末一字中含有非汉字字符,则存放在多音词库中,其前四位存放用户自造词码。如:
hddt华达DOS系统
基本词库的查找
每次启动本编码时,程序由基本词库的文本文件生成码表放入内存。当输入词码后,程序在词库中顺序取出词组,按照词组编码规则,到单字库中找出有关汉字,取出单字码再按词组编码规则,生成词组码,与输入码对照。在多音词库中查找时,如果每行第一个字符为数字则为多音词组,每行第一个字符为字母则为自造词组,如果属于多音词组,则分解成单字后到多音字库部分查找,再组成词码,如果是自造词组,则直接以用户自造词码与输入码对照。
后备词库:
该库的文本文件中每行存放一个词组,由系统设置中的“更换后备库”功能根据四键码中第一种输入方法的单字码和词组编码规则为每个词组编制词码,从而生成后备词库的码表。
后备词库放在硬盘上进行查找,查找方式为输入码与词码直接对照。
标准化输入程序:
由于本发明使用的完全是标准元件和标准化编码组合方式,所以有可能只用少数几个标准化输入子程序,采取不同的参数进行不同组合,生成无数种输入方法。
比如对等长码单字查询程序来说,只须编制标准的首键、二键、三键、……,及末键查询子程序,再组合成二键码至五键码查询模块,对不同的键盘设置和编码设置,只要更换不同的参数就能组成无数种输入方法。
虽然不等长码已有成熟技术可以借鉴,但也可以利用本发明的等长码字库和词库并借鉴等长码的软件实现方法。由于不等长码全都是音码,所以可以利用等长码字库中的双拼部分做为自己的字库,关键问题是需要一个转换机制,比如对全拼码来说,可以在系统设置中通过声韵双拼自定义菜单的结果生成一个全拼音节、简拼音节、注音音节与双拼音节的对照表,当用户用全拼码输入时,每输入一个字母,程序就到对照表中查出相应的全拼音节,然后转换为双拼音节,再到字库中去查找,比如用户输入了ZHAN,程序到对照表中查到该音节后,转换为相应的双拼音节VF,就可以到字库查找,词组也可以做类似转换。简拼码和注音码的实现方法与此类似。
以上是实施例一的全部说明。
实施例二与实施例一基本一样,只是字型结构的定义和首、次、末笔对的取码顺序以及二维双拼键盘与第一方案不同。
该方案将字型结构分为17种(见图25),每种一个代码(该代码是指存放在单字主表文本文件中的代码,不是指键位代码,每个键位代码只能用一个字母,由用户在字型结构自定义菜单中定义),字型结构分得细可以减少重码率,实施者可以参照实施例一中的字型结构键盘自定义菜单(即图8)为实施例二设计一个字型结构键盘自定义菜单,用户如果嫌分得太细可通过键位自定义将字型结构合并为10类、8类等。
在这种字型结构分类法的基础上对首、次、末笔对的取码顺序与第一方案也有所不同,见图26。图26每格内左方图形表示针对一种字型结构对首、次、末三个笔对的取码顺序,右上角是例字,右下方是首、次、末三种笔对。可以看出这种取码部位比第一方案要更能取到汉字中较多的信息,如对“势”字,第方案中只能从“扌”和“力”中取到首、次笔对“一乙”和“乙丿”,末笔对为空;而第二方案则能从“扌、丸、力”中取到首、次、末笔对“一乙、丿乙、乙丿”;同理,对“部”字也是第二方案取的信息更多一些。可进一步降低重码率,提高输入效率。
字型结构的类型比实施方案一要多,可降低重码率,但分的太细,又会增加字型分析和编码的难度,实施者可根据需要对两种方案进行选择。
图27是第二实施例的汉字输入键盘,它包括第二实施例的双拼键盘、声调键盘、笔对键盘、笔画键盘、字型结构键盘,可用于第二实施例中的所有输入方法。其中双拼键盘与图22中双拼键盘的区别主要在于AN和ANG的键位互换,EN和ENG的键位互换,并连带使IAN、UAN、IANG、UANG、IN、ING等键位与图22不同,其目的在于使UN的键位与EN的键位在纵向上对齐,使图27比图22更符合纵向对应规律。而图22排列方式的好处在于AN和EN两个韵母比ANG和ENG的使用频率更高一些,安排在食指的本位键J和F上有利于提高速度,另一方面,让三个字母的ANG和ENG集中在中间键位上,让两个字母的AN、AO、AI、EN、EI等排列在两边,比较整齐易记。总之,两种双拼键盘各有所长,本发明认为从总体上看图22更好些。
以下论述本发明与已有技术对照所具有的进步:
编码选材的进步:
已有技术大多是专业码,主要解决速度问题,即使有些方案也注意到了易学性问题,但因编码方向没有明确转向以易学性为主,没有对所有汉字属性的易学性指标进行全面系统的评价和分析,所以易学性问题没能彻底解决。本发明明确指出主要解决易学性问题,制定了易学性目标,对汉字属性进行了全面分析,从而确定了易学性最好的编码材料,从而使本发明具有以下特点:
编码材料全都是人人通过学校教育熟练掌握的汉字属性,充分利用了人们已有的知识背景,所以极易掌握。
编码材料全都具有公认的,明确的标准,所以彻底摆脱了模糊性。
编码规则特别简单,统一,不用拆分汉字,没有特例。
规律性强,记忆量很小,不易回生。
组合方式的进步:
已有编码大多是一种或几种固定的组合方式,无法满足各种用户的不同需求,李一新的“组合码”(又称“音形义字词兼容编码”或“音形义码”,见《中文信息1991年论文集》和《中文信息》1993年第4期),也只是全拼码、双拼码、音义码、音形码、字形码、两字码、多字码、简码等几种固定编码方法的组合,用户无法自由组合,定义新的键盘,生成新的编码方法。而本发明则允许用户在标准编码元件的基础上自由选择,自由组合,自由设计键盘和编码方案,自由定义功能键,几乎可生成无限多种输入方式,从而使每位用户都能得到得到最适合本人特点的方案。这种充分自由组合的方法是已有技术中所没有的,这也是本发明最主要的特点。
本发明之所以能采用自由组合方法,其基础在于规范化的标准编码元件。如果选用字根做为编码元件,哪几个字根为一组,安排在哪个键位上,都是经过大量计算和实验才确定的,一旦打乱技术指标就会下降,因而不可能由用户任意更改。只有采用标准化元件,才能实现彻底的自由组合。也就是说,这两点进步是紧密相关的。
本发明设计的二维双拼键盘基本上是韵母表的再现,按“四呼”分行,按“四呼”之间的对应关系分列。所以较好地体现了韵母自身的内在规律,不仅能通过韵母的第一字母确定它们在哪一行,而且能根据基准行确定它们在哪个具体的键位上,即通过纵横坐标找到准确的坐标点,使每个韵母都有自己应该安放的位置。就象字典后面的韵母表一样,排列整齐,易学易记。我们知道,二维三码是形码中键盘排列比较有规律的,其主要思想就在于二维坐标的矩阵排列。而其它双拼键盘或者没有规律,或者只有局部或表面或一维的规律性,与本发明相比规律性和易记性都要差一些。
中行的中间四个键位AN、ANG、ENG、EN是左右手对称的排列方式,所以连带着上下两行的对应键位也都呈现出左右对称性,也提高了易记性。
在体现规律的同时,比较好地照顾到了韵母的使用频率与键位指法的关系。从横的方向看,中行的基本韵母使用频率比较高,从竖的方向看,中行位于中间的四个键位上的AN、ANG、EN、ENG几个韵母以及与它们对应的上下行的IAN、IANG、IN、ING、UAN等韵母的使用频率也都是比较高的,而两边的IA、UA、IE、UAI、IU等韵母的使用频率是比较低的。从左右手的使用频率看,左方频率为48.9%,右方频率为51.1%,是符合左右手基本均衡,右手应略高于左手的键盘指法要求的。
总之,二维双拼键盘比已有技术中的双拼键盘规律性要强,规律的层次要深,易学易记性好,键位安排符合指法规律,有较好的输入效率。
附图图1 自由组合码系统总图图2 自由组合码系统设置菜单图3 双拼声母自定义菜单图4 双拼韵母自定义菜单图5 注音字母自定义菜单图6 笔对和笔画键位自定义菜单图7 声调键盘定义菜单图8 字型结构键盘图9 全角标点符号自定义菜单图10 汉字输入方式切换功能键表图11 汉字输入状态功能键表图12 其它功能键表图13 编码组合表图14 功能键自定义菜单图15 俄文键盘自定义菜单图16 日文键盘自定义菜单图17 希腊文键盘自定义菜单图18 制表符键盘图图19 注音码键盘图图20 帮助菜单/系统设置清单的选择菜单图21 等长码输入步骤表图22 第一实施方案汉字输入码元键盘图图23 俄文输入键盘图图24 希腊文输入键盘图图25 字型结构分类表图26 首次末笔对取码顺序表图27 第二实施方案汉字输入码元键盘图
Claims (7)
1,一种自由组合码计算机汉字输入方法,利用26个字母键的键盘,其特征在于:以汉字中的声母、韵母、声调、笔对、单笔画、字型结构等属性做为码元,利用本发明提供的汉字属性库和设置系统,用户可以将以上码元以任意方式安排在标准键盘的字母键上,生成无数多种键盘,即形成可以由用户自由定义的键盘,并可以在自由键盘的基础上对码元进行任意组合,从而生成无数种编码方法,其中包括适合每个用户自己要求的各种不同方法;
系统可附带18种已生成好的编码方法做为样例或默认方法,这18种输入法以以下键盘布局为基础:
声母键盘:b-b键、p-p键、m-m键、f-f键、d-d键、t-t键、n-n键、l-l键、g-g键、k-k键、h-h键、j-j键、q-q键、x-x键、y-y键、w-w键、zh-v键、ch-u键、sh-i键、r-r键、z-z键、c-c键、s-s键:
韵母键盘:a-a键、o-o键、e-e键、ai-s键、ei-k键、ao-d键、ou-p键、an-f键、en-j键、ang-g键、eng-h键、ong-l键、i-i键、ia-z键、ie-x键、iao-c键、iou-q键、ian-b键、in-m键、iang-b键、ingn键、iong-l键、u-u键、ua-q键、uo-o键、uai-w键、uei-v键、uan-r键、uen-y键、uang-t键、ü-w键、üe-r键、üan-r键、ün-y键、er-r键;
声调键盘:阴平-V键、阳平-B键、上声-N键、去声-M键;
字型键盘:独体-F键、左右-G键、上下-H键、包围-J键;
笔对键盘:一一-H键、一丨-J键、一丿-K键、一丶-L键、一乙-N键、丨一-Z键、丨丨-X键、丨丿-C键、丨丶-V键、丨乙-B键、丿一-A键、丿丨-S键、丿丿-D键、丿丶-F键、丿乙-G键、丶一-Q键、丶丨-W键、丶丿-E键、丶丶-R键、丶乙-T键、乙一-Y键、乙丨-U键、乙丿-I键、乙丶-O键、乙乙-P键、一-H键;
单笔键盘:丨-U键、丿-J键、丶-D键、乙-V键、空笔-K键;
简拼键盘:与CCDOS简拼键盘一样,即:an-J键、ang-H键、en-F键、eng-G键、ao-K键、ai-L键、ing-Y键、ong-S键、ZH-A键、CH-I键、SH-U键,其余声韵母全部采用全拼方式;
注音键盘:ㄅ-b键、ㄆ-p键、ㄇ-m键、ㄈ-f键、ㄉ-d键、ㄊ-t键、ㄋ-n键、ㄌ-l键、ㄍ-g键、ㄎ-k键、厂-h键、ㄐ-j键、ㄑ-q键、ㄒ-x键、ㄓ-v键、彳-w键、尸-y键、ㄖ-r键、ㄗ-z键、ㄘ-c键、ㄙ-s键、丫-a键、ㄛ-o键、ㄜ-e键、ㄝ-x键、ㄞ-s键、ㄟ-k键、ㄠ-d键、ㄡ-p键、ㄢ-f键、ㄣ-j键、尢-g键、ㄥ-h键、儿-r键、丨-i键、ㄨ-u键、ㄩ-v键;
除了系统默认的以上键盘之外,还可由用户利用设置系统自由地重新定义码元对应的键位,或选择系统已定义的各种备用键盘,从而形成以以上码元为基础的各种可能存在的键盘;
这18种输入法是:
声首输入法:单字输入:每个汉字输入声母和首笔对,词组输入:两字词为第一字声母和首笔对+第二字声母和首笔对,三字词为三字声母+第三字首笔对,多字词为前三字声母+末一字声母;
首末输入法:单字输入:每个汉字输入首笔对和末笔对,词组输入:两字词为第一字首笔对和末笔对+第二字首笔对和末笔对,三字词为三字首笔对+第三字末笔对,多字词为前三字首笔对+末一字末笔对;
声首末输入法:单字输入:每个汉字输入声母、首笔对和末笔对,词组输入:两字词为第一字声母和首笔对+第二字声母和首笔对,三字词为三字声母+第三字首笔对,多字词为前三字声母+末一字声母;
声韵首输入法:单字输入:每个汉字输入声母、韵母和首笔对,词组输入:两字词为第一字声母和韵母+第二字声母和韵母,三字词为三字声母+第三字韵母,多字词为前三字声母+末一字声母;
声首尾输入法:单字输入:每个汉字输入声母、首笔对和尾笔,词组输入:两字词为第一字声母和首笔对+第二字声母和首笔对,三字词为三字声母+第三字首笔对,多字词为前三字声母+末一字声母;
声韵首末输入法:单字输入:每个汉字输入声母、韵母、首笔对和末笔对,词组输入:两字词为第一字声母和韵母+第二字声母和韵母,三字词为三字声母+第三字韵母,多字词为前三字声母+末一字声母;
声韵头尾输入法:单字输入:每个汉字输入声母、韵母、头笔和尾笔,词组输入:两字词为第一字声母和韵母+第二字声母和韵母,三字词为三字声母+第三字韵母,多字词为前三字声母+末一字声母;
声头二尾输入法:单字输入:每个汉字输入声母、头笔、二笔和尾笔,词组输入:两字词为第一字声母和头笔+第二字声母和头笔,三字词为三字声母+第三字头笔,多字词为前三字声母+末一字声母;
声韵首末调输入法:单字输入:每个汉字输入声母、韵母、首笔对、末笔对和声调,词组输入:两字词为第一字声母和韵母+第二字声母和韵母,三字词为三字声母+第三字韵母,多字词为前三字声母+末一字声母;
声韵头二尾输入法:单字输入:每个汉字输入声母、韵母、头笔、二笔和尾笔,词组输入:两字词为第一字声母和韵母+第二字声母和韵母,三字词为三字声母+第三字韵母,多字词为前三字声母+末一字声母;
双拼输入法:单字输入:每个汉字输入声母、韵母,词组输入:两字词为第一字声母和韵母+第二字声母和韵母,三字词为三字声母+第三字韵母,多字词为前三字声母+末一字声母;
双拼调输入法:单字输入:每个汉字输入声母、韵母、声调,词组输入:两字词为第一字声母和韵母+第二字声母和韵母,三字词为三字声母+第三字韵母,多字词为前三字声母+末一字声母;
双拼句输入法:所有汉字一律输入声韵两码,各字之间不加间隔符,等到输入空格或标点符号时,系统对输入码进行处理,根据字词之间的可搭配关系组成整句输出,当系统无法确定所对应的字词时,由用户帮助确定;
全拼输入法:单字输入:完全按照各字汉语拼音的全码输入,词组输入:两字词输入两字的拼音全码,也可在两个全码之间加分号键,多字词只输入各字的声母;
全拼调输入法:单字输入,每个汉字的拼音全码和声调,词组输入:两字词输入两字的拼音全码,多字词只输入各字的声母;
简拼输入法:单字输入;每个汉字按简拼键盘的规定输入简拼全码,词组输入:两字词输入两字简拼码,中间加分号键,多字词只输入各字的声母;
简拼调输入法:单字输入:每个汉字输入简拼码和声调,词组输入:两字词输入两字简拼码,中间加分号键,多字词只输入各字的声母;
注音输入法:单字输入:每个汉字按注音键盘规定输入注音全码,词组输入:两字词输入两字注音全码,中间加分号键,多字词只输入各字的声母;
除了系统默认的18种输入方法之外,还包括用户在以上码元基础上自由组合出的各种可能的输入方法,用户可以利用设置系统修改或删除系统默认的输入方法,形成自己的系统默认方法;
2.按照权利要求1,对GB-2312(80)中全部6763个汉字提供汉字属性信息表,并包括可以灵活追加和删除的多音字表,系统利用该表形成各种可能存在的输入方法的码表,在该码表中不设置简码标志位和重码标志位,由程序完成各种输入方法的简码和重码输入,从而实现多种单字输入方法的共存;
3,按照权利要求1,提供常规词表和多音词表,组成基本词表,在该表中不出现词码,其中多音词表中含有多音字的序位信息,由程序根据词组的汉字和单字库信息在输入过程中按词组编码规则形成词码,从而实现多种词组输入方法的共存;
4,按照权利要求1,提供后备词表,对于任一输入码当基本字词不存在时出现后备词组,当基本字词存在并选中后,可用翻页键找出相应的后备词组,并可利用词组升级键使后备词组变为基本词组;
5,按照权利要求1,在输入过程中可利用词组删除键随时将基本词组从基本词库中删除;
6,按照权利要求1,在输入过程中可以随时按造词键进入造词状态,输入词组汉字,即完成动态造词;
7.按照前述权利要求1-7中的任何一条,对汉字和中文词组进行编码的方法,可以用在字典,一切大,中,小微型中文信息处理电脑系统,汉字电传机,汉字电脑打字机,汉字终端机,电报,通讯系统中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN94103700A CN1048343C (zh) | 1994-04-02 | 1994-04-02 | 自由组合码汉字输入方法及键盘 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN94103700A CN1048343C (zh) | 1994-04-02 | 1994-04-02 | 自由组合码汉字输入方法及键盘 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1109608A CN1109608A (zh) | 1995-10-04 |
CN1048343C true CN1048343C (zh) | 2000-01-12 |
Family
ID=5031222
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN94103700A Expired - Fee Related CN1048343C (zh) | 1994-04-02 | 1994-04-02 | 自由组合码汉字输入方法及键盘 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1048343C (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3842651B2 (ja) * | 2001-06-13 | 2006-11-08 | 富士通株式会社 | 中国語入力プログラム |
CN105072552A (zh) * | 2006-12-21 | 2015-11-18 | Gn瑞声达A/S | 具有用户接口的听力设备 |
CN102750000A (zh) * | 2011-04-20 | 2012-10-24 | 武汉科技大学 | 双拼王输入法 |
CN103246359A (zh) * | 2012-02-14 | 2013-08-14 | 武汉科技大学 | 一种既方便拼音又方便形码输入的计算机键盘 |
CN103376910A (zh) * | 2012-04-23 | 2013-10-30 | 武汉科技大学 | 无重码双拼输入法 |
CN103425250A (zh) * | 2012-05-16 | 2013-12-04 | 武汉科技大学 | 一种方便中英文输入的数字化键盘 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN87100555A (zh) * | 1987-02-01 | 1988-08-24 | 霍象新 | 双笔顺计算机汉字输入方案及其键盘 |
-
1994
- 1994-04-02 CN CN94103700A patent/CN1048343C/zh not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN87100555A (zh) * | 1987-02-01 | 1988-08-24 | 霍象新 | 双笔顺计算机汉字输入方案及其键盘 |
Also Published As
Publication number | Publication date |
---|---|
CN1109608A (zh) | 1995-10-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1276336C (zh) | 实现快速书写系统的方法和快速书写机 | |
CN1218233C (zh) | 依据歧异编码及方法而设计的可键入装置 | |
CN1678975A (zh) | 仿效qwerty型布局和键入的缩减键盘系统 | |
CN1759593A (zh) | 字母字符输入装置和方法 | |
CN1577229A (zh) | 输入音符串进入计算机及文句生产方法及其计算机与媒体 | |
CN1586066A (zh) | 在按键上输入字母字符的装置和方法 | |
CN1280748C (zh) | 使用计算机键入字母表中字母的方法 | |
CN1694049A (zh) | 一种基于五键的汉字输入系统 | |
CN1048343C (zh) | 自由组合码汉字输入方法及键盘 | |
CN1154502A (zh) | 教育规范五笔字型汉字输入法及其装置 | |
CN1241101C (zh) | 一种基于汉语音节双读方案的信息输入方法 | |
CN1598744A (zh) | 一种基于按键的输入装置及其操作方式 | |
CN1324438C (zh) | 在小键盘上输入字母字符的装置和方法 | |
CN1275732A (zh) | 汉语键盘输入系统及其应用技术 | |
CN1026924C (zh) | 汉字析音编码计算机汉字输入方法 | |
CN1178935A (zh) | 世界文百语转换装置和方法 | |
CN1025896C (zh) | 新概念编码计算机汉字输入键盘 | |
CN1068127C (zh) | 文字信息处理方法和装置 | |
CN1402110A (zh) | 一种信息输入的方法和应用 | |
CN1019527B (zh) | 字符的图元输入方法及其键盘 | |
CN1155874C (zh) | 一种简繁汉字统一键盘编码的输入方法 | |
CN1102488A (zh) | 中文数码电脑汉字输入法及其键盘 | |
CN1493146A (zh) | 在小键盘上输入字母字符的装置和方法 | |
CN1357814A (zh) | 计算机汉语键盘及其汉语信息的输入和处理方法 | |
CN1065973C (zh) | 音速码汉字输入方法及其输入键盘 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |