CN1246760C - 四四方阵汉字输入编码法及其配套键盘 - Google Patents

四四方阵汉字输入编码法及其配套键盘 Download PDF

Info

Publication number
CN1246760C
CN1246760C CN 03124621 CN03124621A CN1246760C CN 1246760 C CN1246760 C CN 1246760C CN 03124621 CN03124621 CN 03124621 CN 03124621 A CN03124621 A CN 03124621A CN 1246760 C CN1246760 C CN 1246760C
Authority
CN
China
Prior art keywords
word
code
pen
key
stroke
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 03124621
Other languages
English (en)
Other versions
CN1482530A (zh
Inventor
曾艾明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN 03124621 priority Critical patent/CN1246760C/zh
Publication of CN1482530A publication Critical patent/CN1482530A/zh
Application granted granted Critical
Publication of CN1246760C publication Critical patent/CN1246760C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本发明公开了一种能通用于各种大中小型计算机(电脑)的汉字输入编码法及其配套键盘。其特点是采用4×4型方阵汉字输入键盘,每个方阵键各对应于一种汉字笔画在字结构中的层位及该笔画字成后的线段节数,以首笔、末笔、四码输入汉字及词语,汉字的每个最小基本单元(字根、部件)的首笔和末笔,均在方阵盘中有各自的对应键码。本发明提供一套易学、实用、且能通用于各种大中小型电脑的理想汉字编码输入技术,能极大的提升全民族的电脑普及率。

Description

四四方阵汉字输入编码法及其配套键盘
技术领域
本发明涉及一种能通用于各种大中小型计算机(电脑)的汉字输入编码法及其配套键盘。
技术背景
目前,汉字键盘输入法  已达数百种,尽管种类繁多,但真正比较有实用性的(即已在社会上不同程度流行使用的),其实只有数得清的很少几种,即便这些已经在使用的汉字键盘输入法,也因各自的不同局限而无法在社会各阶层中能真正广泛普及使用,如:
一、音码及音形混合码:学用这两类码必须要有扎实的拼音基础,而国人且别说是成年人,即便是初中以上的在读生,大多数人都是重字义轻字音,再说,音码无视角上的直观性,对尚在识字阶段的中小学生来说,当一些不认识的生字(当然不知道其读音)出现时,即使拼音学得再好也无法可施,况且,音码的单字重码率高得离奇、这些都是音码、及音形混合码无法在大众中真正普及的症结所在。
二、形码:因初学时一般须背记大量字根,且其拆分字难以掌握,目前也只是在部分高知、白领,以及各类电脑专业操作人员中使用较广,而非能在社会各阶层中广泛普及使用。
三、数字码:因使用键码少,能用在小型电脑键盘上(如手机),但因其使用键码太少,则编码容量过小,重码率高,不能输入词组码,故其实用性很有限。
四、多选式输入法:因其无完整设定编码,需在输入过程中多次检索选择,故其输入过程过于缓慢,节奏不流畅,且在小键盘上(如手机),同样不能输入词组码。
从上世纪八十年代初算起,汉字键盘输入法的研制和应用,已有二十多年。然而时至今日,为什么还没有一套比较理想的编码能在全民各阶层中广泛普及使用?其根本原因就在于:汉字键盘输入法的研制从其开始,人们就不由自主地走进了“繁琐”与“简单”两大误区:
一、繁琐地套用英文大键盘
这是受英文键盘先入为主而形成的一种惯性思维。对于只有26个基本单元的英文来说采用一对一,照搬式的大键盘,当然直截了当轻松自如,这是无可非议的最佳选择。虽然汉语拼音也可以一对一地套用英文键盘,但国人应用的是汉字不是拼音,要把拼音转换成汉字,单字重码率太高和国人大多数不谙拼音,则是两座无法逾越的“山峰”。
众所周知,汉字是一种由多层次多单元组合成的异形方块体,组成汉字的基本单元有数百种之多,无论采用何种创意方案,要把如此之多的基本单元(即便整缩成少量其他符号)套摊在散乱而庞大的几十个键位上,根本无法达到简单明了提纲挈领的直观效果。尽管二十多年来(即便以后),不知道有多少人在此键盘上“趋之若鹜”“前仆后继”地耗费了心血,其结果只能是让大多数初学者或死记硬背、或眼花缭乱、或望而却步。
二、简单地套用几个数字键
因大键盘繁琐不尽人意,部分人便“弃繁从简”(忽略了编码容量这个制约因素)简单搬用几个纯数字键。
按数理常识可知,任何编码方案均存在着各自相应的编码容量(即该编码法最多能组合成多少组不同的码子),编码容量由该编码的码位数(即几位码)和需使用的输入键码数量(不包括其它功能键)决定。
计算式为:每码位上最多使用键码数的连乘积
例(假设):一种在手机上使用的四位数字编码,其每位上均使用(0至9)十个数字键,则编码容量=10×10×10×10=10000(组)
这是理论容量,而实际上由于各编码方案各自的局限,其使用率则远小于此,有些用于大键盘的编码,其容量使用率还不到5%,小键盘上的高些,但最多不会超过40%。上列中的,最多只能使用到三、四千组码。
而一种汉字编码,若想要有较好的实用性,则至少要编入四万条词组,再加上单字,字词条要达五万条左右,以平均重码2条为限,应需使用2.5万组码子,按40%倒算,其编码容量应高于六万组,上例中的手机码只有一万容量,两者相差甚远。
这就是在手机上仅使用十个以内的数字键,不能输入词组码的根本原因。至于有些编码方案把码位拉长至五、六码以上,想以此来增大容量,其实这只不过是一种割肉补疮的得不偿失之举。要知道,四位码是汉字编码这一特定范畴(使用输入键码30以内,字词条5万左右)内,惟一最佳的选择,“减一”则容量过小,“增一”则会使输入过程缓慢、零乱、节奏不流畅,更让人望而生畏。
纵观电脑应用发展的潮流趋势,当今世界,已没有哪种科技产品会像电脑一样,能如此地深入到社会的方方面面,并极大地提高人们的工作效率,充实丰富人们的生活内涵。显而易见,理想的汉字键盘输入法完全应当兼具易学、实用、通用三个基本要素:
一、易学:即规则简单,无过多的背记;时间上,以小半天就可学会,二、三天就可熟练为宜。倘若像学一门手艺(准技术)那样费力费时,则根本无法在全民各阶层中普及使用。
二、实用:即要有较快的输入速度,至少比手写应快数倍,如果某种键盘输入法只是容易学会,但使用起来“寸步难行”(输速太慢),其作用不过是略胜于无,这种键盘输入法即使半分钟就能学会,也毫无意义可言。
三、通用:即学会一套输入法能在各种大中小型电脑上输入使用。
因此,一套能在绝大多数阶层中广泛普及,易学、实用、且能通用于各种大中小型计算(电脑)的汉字键盘输入法的问世,已成为广大消费者的期盼和市场的呼唤。
发明内容
1、一种通用于各种大中小型计算机(电脑)的汉字输入编码法及其配套键盘,其特征是采用4×4型方阵汉字输入键盘,每个方阵键各对应于一种汉字笔画在字结构中的层位及该笔画字成后的线段节数,以首笔、末笔、四码输入汉字及词语,汉字的每个最小基本单元(字根、部件)的首笔和末笔,均在方阵盘中有各自的对应键码。
以汉字笔画(首末笔)在结构中的层位及字成后的线段节数为汉字编码法的输入视角点,加上特创的4×4型方阵输入键盘,这“三位一体”的突破性创新是本发明的核心特征。
1.1键盘(键码对应的层位和线段节数)    1.2键码(编码)代码
Figure C0312462100071
          
Figure C0312462100072
2、本发明的具体技术如下:
2.1、键盘、键码(对应层位、线段节数、编码代码)
16个方阵键分列成四层(空位键、数字0键、其他功能键在方阵外),各对应于汉字笔画在字结构中所处的四种层位(顶、上、中、下);每层四键,凡属侧撇1节(线段)的笔画均对应相应层位的左侧键,如:斤(侧顶)、朱(侧上)、片(侧中)、厂(侧下);凡属顶撇1节的则按其撇下的支点头数,分别对应于顶层各节数键,如:乏(顶1)、豸(顶2)、采(顶3);其他所有类型笔画,均按其线段节数对应于相应层位的1、2、3键。
线段节数:汉字笔画自身弯、折、勾、及与前后笔画相交字成后形成的线段数量,超过3节的均算3节。
键码(编码)代码:方阵内保留3×3型1-9常规数字键(兼作他用),顶层及左侧各键选用形似键位特征的字母(A、V、W、S、P、D、Q)为代码。
2.2、复笔的处理:汉字笔画中的连续点、横、竖、(或含撇、捺),均视作一笔,按其节数(并将单节点、横、竖归入)整合成横列式复笔阵、竖列式复笔阵两类,如:丶、丷、_
Figure C0312462100081
Figure C0312462100082
|、
Figure C0312462100083
川;一、二、三;_
Figure C0312462100084
Figure C0312462100085
水(雨):分别对应于顶层和左侧面各相应节数键(侧上、侧中、侧下、侧顶键又分别兼作侧一、侧二、侧三、侧四键)。
2.3、汉字的拆分:
2.3.1、拆分原则:
2.3.1.1、交笔、单体、夹体不拆,
2.3.1.2、一字拆作“二”;将组合体字简洁拆作两部分,便于首笔、末笔、四码输入。
2.3.2、拆分方法:
2.3.2.1、上下型:上部含“字”的,取最大字及同层左右笔拆出,中部或末部含“字”的,拆出“字”前非“字”笔画。
2.3.2.2、半包容型、三围框、四围框:将其内外分拆。
2.3.2.3、左右型:右部不含“字”的,将左右分拆;右部含“字”将右部按上下型或半包容型分拆,其上部与左部合成首部,右下部为末部。
2.3.2.4、左中右型:将左部中部拆出,四列式(如:雌),将左1、左2拆出。
2.4、笔顺:最小字根(部件)按常规笔顺,多种并用的统一为一种,组合体笔顺则按首部首笔,末部末笔定。
2.5、首笔、末笔定位(层位):
2.5.1、定位原则:在最小字体中确定“字”笔层位。
2.5.2、定位方法;
2.5.2.1、单层笔画(拆分后):
“字”笔(如“十”的横、竖),按定位原则可独自定位,其笔不上不下则为中。
非“字”笔按在原结构中的层位相对定:
a、相对为上,如“布”的上横;
b、相对为下,如“举”的末竖;
c、无相对层为中,如“布”的撇笔(侧偏在旁)。
2.5.2.2、多层笔(竖向):首层为上(或顶),末层为下,如丁、
Figure C0312462100091
Figure C0312462100092
两头封为中,如“口”的首竖。
2.5.2.3、特殊结构笔:
a、角折笔:竖向三围框的折笔,均按其与角内笔或与框对边笔的包容程度定位,包上部为上(如:买、
Figure C0312462100093
):齐头包为中(如:
Figure C0312462100094
刀),上下兼具为中(如: );包下部为下(如:
Figure C0312462100096
力)。
b、底横侧连(串)笔局部定位:横线上为上(如:“正”的末竖),横线侧连(串)为中(如:乡、私、车、 的末笔)。
2.6、编码方法:
2.6.1、汉字:
2.6.1.1、不可拆字:取其首、末笔代码(夹体围框体则框上首笔,框内末笔),再补两空码编足四码。
2.6.1.2、可拆字:各取两部分的首、末笔代码,不足码的补空码,依次编成四码。末部为口字空框时(按框体末笔在框内规则推断)其末笔用空码。
2.6.1.3、特常用可拆字:代词、介词、常用动词、单位词等常在语句中以单字出现的汉字,除按拆字规则编了四码外,还按不可拆字只取首末笔及空码编了简码。
2.6.2、词组:
2.6.2.1、二字词:每字各取首、末笔代码(一笔字用空码补末笔码),依次编成四码。
2.6.2.2、三字词:首字取首笔码,次字取末笔码、第三字取首笔、末笔码,依次编成四码。
2.6.2.3、四字以上词:首字首笔码、次字末笔码、第三字首笔码,末字末笔码。
2.6.2.4、词中一笔字用码:需用二码时,末笔码用空码;只需一末笔码时,则用首笔码(实笔码)。
2.6.2.5、各字为末笔码时,若末部为三围框、四围框,则其末笔为框内末笔(但框内先发笔的三框字则反之,如“凶”字),若末部为空框,除口字框用空码外,其他空框末笔均为框上末笔。
2.6.3、复体(复件、复字、复词):
2.6.3.1、复件(字中连续有数个非字的相同构件):该部分直接用一码相应的复笔码(后面均简称复码)。
2.6.3.2、复字(字中有几个连续相同字根):
a、纯复字(如:品):首笔码+复码+两空码
b、部分复字,只需用二码时(如:棚),该部分为:首笔码+复码;只需用一码时(如:操),该部分直接用一复码。
2.6.3.3、复词(词语中连续几个相同字):
a、全复词:用四码,首笔码+末笔码+空码+复码。
b、部分复词:只能用二码时(复词在词语前面或后面),该部分为:首笔码+复码;只能和一码时(复词在词语中间或最后),该部分直接用一复码。
2.7、重码处理:
2.7.1、无重码时,输入四码,字或词语即在屏幕上直接显示。
2.7.2、有重码时,则在提示栏的1-9数点后同时显示第一档的9个以内重码,可直击相应数字键选择。
2.7.3、现代基本不用的单字、非常用的词语,所有地名(省会以上除外),人名、国名(中、美、英、法、俄除外)、药名、疾病名、专业术语等,以及超过9个的重码,均设在第二档重码栏内,输入四码后,只需加击一下空位键,即可在提示栏中显示,再直击数字键选择。
具体实施方式:
汉字很复杂,但也很奇妙,如果把汉字结构的多层位和其笔画的多线段(笔画自身弯、折、勾,及与前后笔画相交所致)这两个基本特征,分解转换到一个形似中文汉字构架的4×4型方阵键盘上(表1),使之和各键码一一对应,则整个键盘条理清晰、直观简洁、键码数量适中(编码容量近八万组),且键盘结构紧凑,既可用于小型键盘(与现行手机上的3×3型数字盘相较,只在周边作了“_”
Figure C0312462100111
线的小幅调整),也可在大键盘上“立足”(由其右侧数字键改制)。
表1:键盘(键码对应的层位和线段节数)        表2:键码(编码)代码
             
Figure C0312462100113
四四方阵汉字输入编码法的问世,将给人们提供一套易学、实用、且能通用于各种大中小型电脑的理想汉字键盘输入技术。
本发明的具体技术如下:
一、键盘:
1、层位:16个方阵键分列四层,每层四个键(空位键、数字0键、其他功能键在方阵盘外),汉字各部分的首笔和末笔均在方阵盘上有各自的对应层位(顶、上、中、下)。
2、线段节数:
(1)汉字笔画自身弯、折、勾而成,如:一、_
Figure C0312462100114
Figure C0312462100115
分别为1、2、3、节。
(2)或被前后笔画相交而成,如:“又”,其首、末两笔分别为3、2节。
(3)线段节数超过3节,如:“毛、事”,两字末笔超过3节,但仍视作3节。
3、键码(编码)代码:方阵内保留3×3型1-9常规数字键(以便兼作他用)、顶层及左侧各键选用形似键位特征的字母为编码代码,见表2。方阵外另设空位键共17个编码代码。
4、键码与首末笔的对应:汉字的每个基本单元(字根、部件)的首笔和未笔,按其所处的结构层位和字成后的线段节数,均在方阵盘中有对应的键码。即:
(1)凡属侧撇1节的笔画均对应相应层位的左侧键。如:斤(首笔为侧顶)、朱(首笔为侧上)、片(首笔为侧中)、厂(末笔为侧下)。
(2)凡属顶撇1节的笔画,则按其撇下的支点头数(不论是否相连),分别对应于顶层各相应节数键。如:乏(顶1)、豸(顶2)、采(顶3)。
(3)其他所有类型笔画,均按其线段节数对应于相应层位的1、2、3键。
如“丁”字,其首、末笔对应键位分别为上1、下2,换成编码代码则为1键、8键;“羊”字,其首、末笔对应顶2、下3(即V键、9键)。
二、复笔的处理:
为使编码输入简洁,对连续相同的笔画(即复笔)均视作一笔(一码)。复笔不分层位,凡横列式复笔均对应于顶层相应节数键码,如:丶、丷、_
Figure C0312462100122
分别对应于顶1、顶2、顶3、侧顶(亦即横复1、横复2、横复3、复4)键;竖列式复笔则对应于左侧相应键码,如:一、二、三,分别对应于侧上、侧中、侧下(亦即竖复1、竖复2、竖复3)键。为使各复笔阵列整齐,相关单笔(点、横、竖)均列其中。
复笔基本特点:
1、各复笔均需连续完成,间隔笔不属,如:镸,其首横和中间两横不属连续笔;扌:其上横和下提不连续(但心、必的上3点虽不是连续笔,则仍算复3点,这是仅一的例外)。
2、各笔节数相同:如:_
Figure C0312462100123
三、丰,3种复笔中,每种内各笔线段节数相同,分别为1、1、2节(仅有
Figure C0312462100124
其各笔节数不同,仍为横复3,为唯一例外)。
3、横列同层位,竖列同边邻:如“升”字,其末
Figure C0312462100125
竖虽是连续复笔,但左竖在首撇下,右竖属中,两竖不同层,则不属复笔;如部件
Figure C0312462100131
其上横有边邻、下横无,则不属复笔。
4、除纯横复笔从严外(如二、三、_、
Figure C0312462100132
丰,均为横笔,不可撇横混用),其他各类复笔(单节除外)均要求不严,可点、竖、撇、捺混用,如:丷、_、
Figure C0312462100133
Figure C0312462100134
川、艹、
Figure C0312462100135
Figure C0312462100136
水(唯“八”、“儿”字不属复笔)。
5、分列于对称轴两边的点、撇、捺、均视为复笔(但对角交叉不属,如:为)如:木、半、舟、雨、水。
6、复件(_)、复字(品)复词(好好)的相关内容在编码规则中补述。
三、汉字的拆分:
(一)、拆分原则:一字拆作二,一定、六不拆。
1、一字拆作二:由于采用首笔、末笔、四码输入汉字,这种编码法能兼收汉字笔画在字头字尾的不同层位不同线段节数的多样性,使字、词条在编码中分布均匀合理重码少。
本编码容量为:16×17×17×17=78608组,实际使用3万组,除编入了6700个单字外,还编入了5.2万条词语,但字词条的平均重码未超过2条,输入快捷均匀。因此,在考虑重码因素的前提下,须采用一种较简洁的拆分方法,将汉字块状地一分为二,使其由一字变一“词”,便于首笔、末笔四码输入。
2、六不拆:为达到上述目的,则须对部分特殊结构作一些拆分限制,以免拆分过于零碎见表3。
表3:六不拆
Figure C0312462100141
3、“一定”:定字中“字”的范围
“字”的范围:按本编码的汉字拆分方法(在后),字中含“字”的上下型汉字才可拆成两部分,故须对“字”的范围界定。
a、现代书面行文常用的字(也即国标一、二级标准的6763个汉字以内)且去除一、二、三几个字。如:“丁”字就不能认为含“一”字而拆成两部分。
b、易出现在字头字尾的几个非常用字(部首):_、 厶、口(所有口字框),除上述两点范围内,其他古字,偏字均不算本拆分意义上的“字”。
(二)、拆分方法:
表4:拆分方法
Figure C0312462100151
四、笔顺:
1、基本字根(部件)按常规书写笔顺,多种笔顺并用的字根统一为一种,即:力(_、力)、万(一、 万)、乃(ㄋ、乃)、及(丿、
Figure C0312462100153
及)。
2、本编码设制之需而作调整的唯一部首:犭(
Figure C0312462100154
Figure C0312462100155
犭)
3、组合字笔顺按首部首笔,末部末笔定。如“国”字,其书写末笔为框底横,而本编码将其拆为:“口”、“玉”两部分,则“国”的末笔应为“玉”上的点,而非“国”字的底横。
五、首笔、末笔定位(层位);
1、定位原则:
凡“字”笔均在最小字体中确定层位。
如“辜”按规则拆成“古”、“辛”两部分,若对“古”的首笔“一横”定层位,因该笔所属的最小字为“十”,则首笔“一横”的层位应是中(在“十”字里,该笔不上不下),而不是“古”字的上,同理,“辛”的末笔“1竖”的层位也是中,而不是“辛”字的下。
2、定位方法:
表5:定位方法
(表中未及之例,可参看表6及相关内容)
六、首末笔在方阵键盘上的分布(见表6):
表6非死记硬背的字根表,只是将各类首、末笔(图表中各字粗笔处)示例,按点、横、竖、撇、捺、折分类成横列,分置于各相应键码,使相关内容上下左右横竖成行,便于理解。虽有一定字幅,但因条理简洁,初学者看完本说明相关内容结合表6,再用以下口诀统揽归纳,稍加体会即可熟识,无须背记。
                        方阵共四层,单撇绕三边:
                        横复按顶层,竖复摆左侧;
                        中间数字键,位层一二三;
                        冰河水下流,仁行须到底。
(一)、“方阵共四层,单撇绕三边”
在4×4型方阵键盘上,有一明显规律,汉字笔画中,凡一节的撇笔(即单撇),按本编码的有关规则,它们刚好能(也只能)出现在方阵键盘的顶层,左侧、下层三边的所有十个键码上。
(二)、“横复按顶层,竖复摆左侧”
1、横列复笔:可分为点、撇、竖笔三个横向复笔阵列。
(1)、点:汉字中的所有横列2、3、4复点,以及除属侧壁、侧顶的左右边点外(如:卜、礼、为、我)的其他所有层位的单点,均分别对应于顶层的A、V、W、S。
(2)、撇:除边顶撇(如白、我)定在左侧S键上外,其他各顶撇均按其撇下所对应的“支点”头数(不论是否相连)、分别对应于A、V、W键。
但可拆字应按拆后状态定位,如“质”拆成“_、
Figure C0312462100172
”,其顶撇对应于顶键S键,而不是对应于“二支点”的V键。
(3)、竖:除单竖从严外(必须是处于上下连接笔中部的中垂线,如:山、工、斤、亻,和左右结构中的平行单竖,如:旧、刂)其余复2、复3、复4从宽:如:工、业、
Figure C0312462100173
川、
Figure C0312462100174
水、豕
2、竖列复笔:可分为横线复笔、侧壁上复笔两个阵列:
(1)、横线:如:一、二、三、豆、旦、_、
Figure C0312462100175
丰。
其中组合字的“一”横,其对应面应是平行面,如:“豆、旦,但字中非两面平行的夹横则按拆分后确定,如“贵”按规则拆成“中、 ”,
Figure C0312462100182
中的上横属横线复笔在P键。
(2)、侧壁上复笔:汉字笔画除有上、中、下相连的结构类型外,还有一类笔画立足在侧壁(直竖或立式撇、捺笔)上引出,如:卜、 礻、衤、犭、人、内。
侧壁上笔画特点:
a、可点、横、撇、捺并用,但不和上下笔相连,如“长”的首撇,“内”的末撇,“衤”的侧2点。
b、侧壁上各笔无上下层之分,只有数量之分,其侧一、侧二、侧三、侧四分别对应左侧P、D、Q、S键。
3、特殊键位:侧顶S键
其键位兼具顶层、侧位、横列复四
Figure C0312462100184
竖列侧壁复四(水、家、雨)四重特征,故特选带有双向转角且其音近似“四”音的字母“S”为代码,字根X、乙也分别因音似、形似“S”定位在S键上(包括九、亏、乃等含内错角的双折笔)
(三)、“中间数字键,层位一二三”
除去上述对应于顶层和左侧各键位的笔画,其余首、末笔画只须按其所属层位和线段节数(一、二、三),对应于中间各数字键。
(四)、“冰河水下流,仁行须到底”
按照规则,部首冫、氵和亻、彳、彡的撇笔各属竖列复笔阵列应对应于左侧各键位,但从编码分布角度考虑,特将其移至下层,因其分别是冰、河、仁、行、须的部首,且均是从上层,或中层移至下层,故取其句字面意加深记忆。
七、编码规则(见表7)
八、其他(字词范围,重码、错码处理):
(一)、字词范围:
1、字:国标GB2312-80的一、二级6763个异体汉字。对于其他在现代无实用意义偏冷古字暂未编入;繁体字商家制作软件时,可按通用做法设置功能键用简化字置换。
2、词语:为满足实用性(在手机上人们单手击键的速度不可能很快,因此在保证重码率正常的前提下,尽可能地编入较多的常用词语是提高编码输入速度的唯一途径),本编码能输入5万多条词语,包括全部常规词组、成语、警句、格言,地名(设区市以上、各国国名首都名)、物名(所有生活用品)、人名(国家领导人、古今名人)、生活常用品、政府各部局名、公共场所名、新闻公文中常出现的特定联词、时间词、序列词、以及日常口语及书面中需常用的非常规联词(如:你来、我去、他想、不能等),总之,除了代词、介词、连词、副词、县以下地名、一般人名,偏冷物名专业技术语等,本编码输入过程中极少单独输入单字。
(二)重码处理
1、编码容量:16×17×17×17=78608组(除首码外,后三位码上均会输入空位码,多一位数)。
2、重码:实际使用3万多组码,能输入字词条6万多条,平均重码不到2条;其中16500组码无重码(占总使用码55%),12500组码的重码在2至5条之间(占总数41%),900组码的重码在6条至10条之间,只有35组码的重码超过10条(但不超过18条),前两类共占总数96%,后两者只占4%。且编码设置时,将重码中的较偏冷单字和词语均放在第二档重码提示栏中,超过十个重码的则增设第三档提示栏,因此,实际输入过程中的无重码比例远高于55%,而重码提示栏的重码极少超过5条,能适用小屏幕电脑(手机),极具实用、通用性。
(三)错码处理
1、对个别字因笔顺原因而输入了错码,电脑屏幕上该字则会被小括号框住,以示笔顺有误,如:“力”字,折为首笔,若反之而输入,荧幕上则出现(力)字。
2、对人们因习惯而在词组中常误用的字,则用中括号框住显示,如:“委曲求全”误输为“委[屈]求全”。
(四)汉字拆分、编码流程示例见表8。
表6:首、末笔在方阵键盘上的分布(图表中各字粗笔处)
表7:编码规则
  类  型   说明   例字(码)
  单字   不可拆字   一般单体:取其首、末笔代码、不足四码用空码,依次编足四码   一(PΔΔΔ)、乙(SΔΔΔ)万(1QΔΔ)、成(2WΔΔ)
  围框体:框首笔+内末笔+Δ+Δ   皿(4VΔΔ)
  夹体:框首笔码+内末笔码+Δ+Δ   王(D5ΔΔ)、粥(VVΔΔ)
  局部夹体:首笔码+末笔码+Δ+Δ   夹(D7ΔΔ)、来(DVΔΔ)
可拆字   取每部分首末笔码依次编成四码   字(A828)、抗(27QS)
  末部为口字时,按末部末笔规则,其末笔为内空笔则用空码(但为使空键位简洁,其他空框则不)   各(P84Δ)识(SΔD4)、
  复体 复件   字中有数个相同(不成字)构件,该部分直接用一相应(横或竖列)复键代码。   竿(VΔ15)、丝(vΔPΔ)丽(PΔVΔ)、红(DPDA)
复字   纯复字:首笔码+相应复码+Δ+Δ   朋(QVΔΔ)、品(4WΔΔ)
  部分复字:需用二码时,该部分:首码+复码只用一码时,该部分直接用复码   掇(286S)操(2W5V)
  复词   全复:首笔码+末笔码+Δ+复码   好好(68ΔV)好好好(68ΔW)
  部分复词:只能用二码时(在词语前或后)复码部分:首笔码+复码只能用一码时(在词语中间)复码部分直接用一码复码   嘻嘻笑(4VV7)笑嘻嘻(V74V)一阵阵的(PVSA)
词组 二字   每字各首、末笔代码,依次成四码,(一笔字用空码补足)   首先(VDP6)一定(PΔAP)
  三字   依次:首字首笔、次字末笔、末字首末笔码   大不了(2W28)
  四字以上   依次:首字首笔、次字末笔、第三字首笔、末字末笔成四码   千辛万苦(A51Δ)哭笑不得(V71A)
  一笔字用码   词中一笔字,按规则只能用一笔末笔码时则只能用实笔码,不能用空码   第一名(VPPΔ)大小不一(2V1P)
  末笔为全框其末笔码   框内有笔画,末笔码为框内末笔   杷(5V2A)
  框内无笔画,末笔码为框上末笔   户(AΔ2Q)
  为正口字空框、末笔码为空位键   培(5V4Δ)
特常用可拆字的简码   对于常在语句中以单字出现的可拆代词、介词、连词、副词、动词等,除按规则设置了四码,为实用方便,还设置了只需输入首末笔再加两空码的简码   要(1V62、12ΔΔ)去(5754、54ΔΔ)有(25QD、2DΔΔ)
表8:汉字拆分、编码流程示例:

Claims (1)

1、一种汉字输入编码法,其特征是采用4×4型方阵汉字输入键盘,每个方阵键各对应于一种汉字笔画在字结构中的层位及该笔画字成后的线段节数,以首笔、末笔、四码输入汉字及词语,汉字的每个最小基本单元的首笔和末笔,均在方阵键盘中有各自的对应键码,
1.1键盘及键码对应的层位和线段节数        1.2键码及编码代码 侧顶 顶1 顶2 顶3 侧上 上1 上2 上3 侧中 中1 中2 中3 侧下 下1 下2 下3 空键 0
    S     A     V     W     P     1     2     3     D     4     5     6     Q     7     8     9     △     O
2  键盘、键码
16个方阵键分列成四层,各对应于汉字笔画在结构中所处的四种层位,即顶、上、中、下,每层四键,空位键、数字0键、其它功能键在方阵外,凡属侧撇1节的笔画均对应相应层位的左侧键,凡属顶撇1节则按其撇下的支点头数,分别对应于顶层各节数键,其它所有类型笔画,均按其线段节数对应于相应层位的1、2、3键,
线段节数:汉字笔画自身弯、折、勾,及与前后笔画相交字成后所形成的线段数量,超过3节的均算3节,
键码及编码代码:方阵内保留3×3型1-9常规数字键,可兼作他用,顶层及左侧各键选用形似键位特征的字母A、V、W、S、P、D、Q为代码,方阵外设空位键△,共17个编码代码,
3.1复笔的处理:汉字笔画中的连续点、横、竖,或含撇、捺,均视作一笔,按其节数,并将单节点、横、竖归入,整合成横列式复笔阵、竖列式复笔阵两类,分别对应于顶层和左侧面各相应节数键,侧上、侧中、侧下、侧顶键又分别兼作侧一、侧二、侧三、侧四键,
3.2汉字的拆分:
3.2.1拆分原则:
3.2.1.1交笔、单体、夹体不拆,
3.2.1.2一字拆作“二”,将可拆组合体字简洁拆作两部分,便于首笔、末笔、四码输入,
3.2.2拆分方法:
3.2.2.1上下型:上部含“字”的,取最大字及同层笔拆出,中部或末部含“字”的,拆出“字”前非“字”笔画,
3.2.2.2半包容型、三围框、四围框:将其内外分拆,
3.2.2.3左右型:右部不含“字”的,将左右分拆;右部含“字”,将右部按上下型或半包容型分拆,其上部与左部合成首部,右下部为末部,
3.2.2.4左中右型:将左部中部拆出,四列式时,将左1、左2拆出,
3.3笔顺:最小字根及部件,按常规笔顺,多种并用的统一为一种,组合体笔顺则按首部首笔,末部末笔定,
3.4首笔、末笔定层位:
3.4.1定位原则:在最小字体中确定“字”笔层位,
3.4.2定位方法:
3.4.2.1单层笔画:
“字”笔,按定位原则可独自定位,非“字”笔按在原结构中的层位相对定,
3.4.2.2多层笔,竖向:首层为上或顶,末层为下,两头封为中,不上不下为中,
3.4.2.3特殊结构笔:
a折笔、竖向三围折笔:均按其与角内笔或框对边的包空容程度定位,包上部为上,齐头包为中、上下兼具为中,包下部为下,
b底横侧连或串笔局部定位:横线上为上,横线侧连或串为中,即上空为上,下空为下,两头空为中,
3.5编码方法:
3.5.1汉字:
3.5.1.1不可拆字:取其首、末笔代码,夹体、围体则内外各一码,再补两空码编足四码,
3.5.1.2可拆字:各取两部分的首、末笔代码,不足码的补空码,依次编成四码,末部为口字空框时,其末笔用空码,
3.5.1.3特常用可拆字:代词、介词、常用动词、单位词等常在语句中以单字出现的汉字,除按可拆字规则编了四码外,还按不可拆字只取首末笔及空码编了简码,
3.5.2词组:
3.5.2.1二字词:每字各取首、末笔代码,一笔字用空码补末笔码,依次编成四码,
3.5.2.2三字词:首字取首笔码、次字取末笔码、第三字取首笔、末笔码,依次编成四码,
3.5.2.3四字以上词:首字首笔码、次字末笔码、第三字首笔码,末字末笔码,
3.5.2.4词中一笔字用码:需用二码时,末笔码用空码,只需一末笔码时,则用首笔码即实笔码,
3.5.2.5各字为末笔码时,若末部为三围框、四围框,则其末笔为框内末笔,但框内先发笔的三框字则反之,若末部为空框,除口字框用空码外,其他空框末笔均为框上末笔,
3.5.3复体,即复件、复字、复词:
3.5.3.1复件,即字中连续有数个非字的相同构件,该部分直接用一码相应的复笔码,
3.5.3.2复字,即字中有几个连续相同字根:
a纯复字:首笔码+复笔码+两空码,
b部分复字:需用二码时,该部分为,首笔码+复笔码,只需用一码时,该部分直接用一复笔码,
3.5.3.3复词,即词语中连续几个相同字:
a全复词:用四码,首笔码+末笔码+空码+复笔码,
b部分复词:只能用二码时,即复词在词语前面或后面,该部分为,首笔码+复笔码,只能用一码时,即复词在词语中间或最后,该部分直接用一复笔码,
3.6重码处理:
3.6.1无重码时,输入四码,字或词语即在屏幕上直接显示,
3.6.2有重码时,则在提示栏的1-9数点后同时显示第一档的9个以内重码,可直击相应数字键选择,
3.6.3现代基本不用的单字、非常用的词语,除省会以上外所有地名、人名、除中美英法俄以外所有国名、药名、疾病名、专业术语等,以及超过9个重码,均设在第二档重码栏内,输入四码后,只需加击一下空位键,即可在提示栏中显示,再直击数字键选择。
CN 03124621 2003-07-04 2003-07-04 四四方阵汉字输入编码法及其配套键盘 Expired - Fee Related CN1246760C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 03124621 CN1246760C (zh) 2003-07-04 2003-07-04 四四方阵汉字输入编码法及其配套键盘

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 03124621 CN1246760C (zh) 2003-07-04 2003-07-04 四四方阵汉字输入编码法及其配套键盘

Publications (2)

Publication Number Publication Date
CN1482530A CN1482530A (zh) 2004-03-17
CN1246760C true CN1246760C (zh) 2006-03-22

Family

ID=34152886

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 03124621 Expired - Fee Related CN1246760C (zh) 2003-07-04 2003-07-04 四四方阵汉字输入编码法及其配套键盘

Country Status (1)

Country Link
CN (1) CN1246760C (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107066114A (zh) * 2017-02-02 2017-08-18 童立志 二分结构码

Also Published As

Publication number Publication date
CN1482530A (zh) 2004-03-17

Similar Documents

Publication Publication Date Title
CN1015218B (zh) 字根编码输入法及其设备
CN1246760C (zh) 四四方阵汉字输入编码法及其配套键盘
CN1387109A (zh) 盲文数码(小键盘)输入法
CN1103181A (zh) 多键并击式高速汉字输入方法及键盘装置
CN1036422C (zh) 汉字笔形关联编码计算机输入方法及其键盘
CN1056007C (zh) 一种以汉字音角特征为信息元的计算机汉字输入方法
CN1288185A (zh) 音形字理码汉字输入方法
CN1089175C (zh) 规范部首笔画合成输入法
CN1379307A (zh) 全息万能规范汉字编码及高速输入法
CN1108552C (zh) 拼音汉字完善汉字法(phf)
CN1171138C (zh) 一种汉字及符号的计算机键盘输入法
CN1058342C (zh) 汉字编码的计算机输入方法
CN1015751B (zh) 计算机汉字十笔字拼写输入方法
CN1173248C (zh) 六字元结构字根无重码输入法
CN1309342A (zh) 计算机汉字音形模糊输入法
CN1050913C (zh) 中文部首代码编码输入的文书处理装置
CN1295589C (zh) 无根码汉字输入法
CN1081354C (zh) 一笔字形字词无重码输入法
CN1366227A (zh) 汉字免拆分快速输入法
CN1150444C (zh) 计算机字母化中文输入法
CN1092186A (zh) 汉字数控方位码及输入方法
CN1099495A (zh) 声形位汉字输入系统
CN1734404A (zh) 音码和识别音码、级库技术、笔码和数字笔码
CN1223398A (zh) 计算机汉字键位码输入方法
CN1848051A (zh) 标准汉字输入法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee