CN1265269C - 左部右部笔画数字编码汉字电脑输入法及其键盘 - Google Patents
左部右部笔画数字编码汉字电脑输入法及其键盘 Download PDFInfo
- Publication number
- CN1265269C CN1265269C CN 01121568 CN01121568A CN1265269C CN 1265269 C CN1265269 C CN 1265269C CN 01121568 CN01121568 CN 01121568 CN 01121568 A CN01121568 A CN 01121568A CN 1265269 C CN1265269 C CN 1265269C
- Authority
- CN
- China
- Prior art keywords
- stroke
- word
- chinese character
- parts
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
一种左部右部笔画数字编码汉字电脑输入法及其键盘,其最大的特征是将左右结构的汉字从结构上划分为“左部”和“右部”两个部分,把其它所有的汉字都当作“整体字”,并在数字键上安排几组“形意”极为相似的部件,按照取码规则而形成10键5码(或6码)左部右部笔画数字编码汉字输入法及其键盘。本发明极其简单,重码率低,使用效率高,可应用于通讯、信息、管理、网络等系统。
Description
本发明属于汉字电脑输入法及其键盘,特别是将左右(含左中右)结构的汉字分为“左部”和“右部”,称这些汉字为“左右字”,把其它所有的汉字作为“整体字”的一种电脑汉字输入法。
目前,数字键盘的应用范围十分广泛,如手机、电话、收款机、掌上电脑、电子字典、PC机等设备都使用了数字键盘。汉字输入的数字化,已成为人们日常生活中的一种需求。目前有不少的数码汉字输入法,CN1264859A的“五笔数码键盘汉字电脑输入法及其键盘,就是其中的一种。这种输入法的最大特征就是把汉字中的“上下、上中下、左右、左中右、包围、半包围”结构的汉字一分为二——“首部”和“余部”。本发明人认为,采用这种方法,一个很重要的目的就是在“跳跃技术”(如先取某字的前3码加最后2码,而不是直接连续取5码,这种方法称为“跳跃技术”)帮助下,降低重码率。事实上,这种输入法的“键选率”也大大低于国家标准。但是,由此而产生一个问题,即增加了学习难度和降低了使用效率。其主要表现在以下两点:一是在划分“首部”和“余部”时产生了严重的二义性,该发明人不得不增加规则、约定之类的东西,加以阐述和定义,但还是有二义性的地方。人们要记住这些规则、约定,确实有一定的困难;二是对90%以上的合体字,采用了二次跳跃技术一次是“首部”,一次是“余部”),也给人们带来了难度,降低了使用效率。总之,“五笔数码”还是没有很好解决“易学”与“重码”这一长期困扰众多编码工作者面前的矛盾。
本发明的目的,就是提出一种全新的“左部右部笔画数字编码汉字电脑输入法及其键盘”的技术方案,以克服现有技术中“易学”与“重码”的矛盾,做到规则简单明了,记忆量少,重码率低,使含有数字键盘的设备,如PC机、掌上电脑、记事本、电子字典、手机、电话、收款机等有一种行之有效的汉字输入法。
本发明首创的“左部右部笔画数字编码汉字电脑输入法及其键盘”,是用数字键盘上的1、2、3、4、5五个数字键分别代表汉字的横(提)、竖(竖左钩)、撇、点(捺)、折五种笔画,并在6、7、8、9、0五个数字键位上安排了五组且每组“形意”相似的部件,其特征是将汉字中能够清楚划分的左右(含左中右)结构的字,从结构上划分为“左部”和“右部”,称这些汉字为“左右字”,把其它的汉字全部看作“整体字”;由“左部”的前二笔画(部件)、“右部”前二笔画(部件)或前三笔画(部件)和最后一笔画(部件)构成的“左右字”数字编码,再加上“整体字”的前四笔画(部件)和最后一笔画(部件)的“整体字”的数字编码,而构成完整的汉字数字编码。
众所周知,数字键盘上只有10个数字键可用于编成,编码空间有限,而大键盘有26个以上的按键可用于编码。因此,数字编码的重码率不大可能低于大键盘输入法的重码率。基于这种情况,本发明始终把“易学性”作为第一位来考虑,其次再考虑重码率的问题。要做到易学易用,就必须定义清楚,在实际使用过程中不能有二义性,规则或约定要少,尽可能减少记忆量等。从这一思路出发,本发明人经过长期的研究发现,“左右”(含左中右)结构的汉字,其“形状”最容易被人们辩认,在划分“左部”和“右部”时不产生“二义性”,并具有很好的离散能力。本发明人把这一认识用于编码的实践,成功地解决了现行技术方案中对汉字划分的“二义性”严重、规则或约定多的问题,并在五组精选的部件的帮助下,大大降低了重码率,提高了输入速度和使用效率。
“左部”是指:对于“左右字”,按书写顺序,先写到的那一部分,例如:
本发明的数字键盘与笔画和部件的对应关系如下:
一、按照国家标准,把“横(提)、竖(竖左钩)、撇、点(捺)、折(所有的折)”分别安排在数字键盘上的“1、2、3、4、5”上,其中“折”用“乙”象征性代表;
二、部件与数字键6、7、8、9、0的对应关系是:
“6”——十、ナ、ㄨ、
即只要记住一句话,“十”变形的连续两笔画相交的部件;
“0”——二、亠、。
采用这五组且每组“形状”极为相似的部件又是本发明的一个重大特征。它有二大作用:
一是便于记忆,大大增加易学度。在现有的技术方案中,一般都是直接选取使用频度比较高的部件(如:月、日、口、目),来加强编码的离散能力,提高输入速度。但对部件之间的形状和规律缺乏足够的研究和分析,所选取的部件多,且部件之间的“联想性”差,其直接后果是大大增加了记忆量和学习难度大。本发明不仅考虑到如何用部件来提高速度,降低重码率,而且也充分考虑到它们的“易学性”、“易记性”和“易用性”。例如:日、月、口、目这几个使用频度较高的部件,现有的很多技术方案都是“全盘接收”。其实这四个部件的外形有一个共同的特点,即外围的形状都是“、
”。选取了这两个部件就代表了“月、日、口、目、冖、、
”这七个部件的外围,就记忆而言,只要记住一个,即“连续两笔画组成的三面包围”,延伸出来,自然会联想到“冂、、ㄩ、匚、几、
、冖、
”等部件。再如“钅”与“亻”这两个部件,其“外形”都是“人”的变形,只要记住一句话“人”的变形,自然就可以延伸出“人、亻、”这三个部件;总之,本发明所选取的五组部件,每组“形意”都非常相似,便于记忆,易学度极高,这与传统技术中多直接采用高频的部件有着质的区别。
二是把汉字的笔画(部件)较为平均地分配在10个数字键上,并大大降低了重码率。本方案主要从两个方面来考虑降低重码率。一方面是,由于汉字的五种笔画只占用1-5五个数字键,且这五种笔画的数量大小差别较大。如何把数量比较大的笔画,以部件的形式分离出来,分配到6、7、8、9、0这五个“空闲”的数字键上,尽可能使这10个数字键各自所表示的笔画(部件)的数量相接近,以达到平均分配、减少重码的效果。另一方面是必须同时考虑这些部件能够离散因上下、上中下、包围结构的汉字与“独体字”一样当作“整体字”看待而产生的重码。例如,在国家一、二级字库中,用“”作为“上部”的汉字就有114个,按照“整体字”的取码规则前4末1,单“上部”的“”就占了4码,只剩下1码来完成114个汉字的重码离散工作,即使是最平均地分配到0——9十个键位上,也会产生10组且每组有11.4个汉字的重码。象这样的“上部”就占用了3——4个码,且使用频度较高的汉字还有不少。如“
亠、艹、ナ
”等部件在汉字“上部”的几率极高,仅“上部”就占用了2-4码,若不把它们当作一个部件取一码,只剩下1-3码来离散含有这些部件汉字的重码,重码率必定很高。把它们作为部件取一码后,还有4码来离散这些汉字其余的笔画结构,降低了重码率。
三是大大减少了拆字取码的“二义性”。众所周知,由于长期存在的汉字书写顺序的因人而异,任何用笔画作为码元的汉字输入法,都面临着汉字书写顺序的“二义性”问题。传统的做法往往是从取码的位置来寻找解决的方法,即多采用选取前几笔和后一、二笔(因为前后笔画书写顺序写错的可能性较小,同时具有较好离散编码的能力),而忽略了把这些容易写错的“笔画对”作为一个部件取码来解决问题。如:
类似这些问题不解决,势必增加一部分人的学习难度。若用容错码解决,这将大量增加实际使用中的重码率。本发明把类似这样的部件,当成一个整体取一码,就成功地解决了这一问题。
当字集比较大时,为了减少重码,“左右字”的取码规则为左部的第一、二笔画(部件),加上右部件的第一、二、三笔画(部件)和最后一笔画(部件),最大码长为6码,不足六码的有多少取多少。
当字集比较小时,取码规则是:
1、对于“左右字”,按书写顺序,先取“左部”的第一、二笔画(部件),再取“右部”的第一、二笔画(部件)和最后一笔画(部件),共五码,不足五码的有多少取多少。
2、对于“整体字”,按书写顺序,先取第一、二、三、四笔画(部件),再取最后一笔画(部件),共五码,不足五码的有多少取多少。
约定:
1、在取码时,按书写顺序,有部件的先取部件,没有部件的取笔画,即部件优先于笔画。
2、部件是相对独立的。若是部件中的任何一笔画被其它的笔画穿透,则该部件就不算为本方案中所述的部件。例:
“中”:“冂”被“丨”穿透,所以此时的“冂”不算为本方案中的部件“冂”,而是应将其拆成笔画。其正确的编码是:
“中”——丨、乙、一、丨——2512,而不是冂、一、丨或冂、十;
“广”由于“亠”中的任何笔画没有被“丿”穿透,所以,“亠”是本方案所述的部件,其编码是:“广”——亠、丿——03;
“甘”字中的“卄”和“二”都没有被任何笔画穿透,所以按书写顺序所取的“卄”、“二”仍是本方案中的部件,其编码是:“甘”——卄、二——70。
图1是本发明所用到的数字键盘输入键位图。
下面结合附图和具体实施方式对本发明作进一步的详细说明。
一、左右字
二、整体字
例:在PC机上
“/”作为重码字选择的引导键和数字的引导键。如:“37”对应的汉字有1:毛 2:牛 3:手;输入37/3,则选中了“手”字。
输入/1234597/则认为是输入“1234597”。
输入//816444则认为是输入“伟大”。
“+”、“-”作为翻屏键。
“*”作为断码或空格键和标点、英文字母、符号的引导键。如“37”对应的汉字有:
1:毛 2:牛 3:手;
输“37*”,则选中了第一个字,即选中了“毛”这个字。
若输入“**”,则认为是输入空格。
若输入“*00”,则认为是输入“,”。
若输入“*26”,则认为是输入“a”。
“Del”相当于大键盘上的“backspace”。
在手机上:
“#”作为重码字选择和引导键;
“*”作为空格键;
“c”相当于PC机上的“backspace”键。
词组的取码规则是:
1、两字词:取第一个字的前2码和第二个字的前4码共6码:当第一或第二个字的最长码长不足2码或4码时,重复取该字的最后一个码,直到取足为止。例:
“同意”的两个单字编码分别是“同-9191”,“意-08194”,则“同意”的编码是“91+0819”-“910819”;
“伟大”的两个单字编码分别是“伟-81152”,“大-64”,则“伟大”的编码是“81+6444”-“816444”。
2、三个字以上(含三个字)取第一、二字的前2码和最后一个字的前2码,若所取的各字的最大码长不足2码时,重复取该字的最后一个码,直到取足为止。例:
“计算机”的各个单字编码是“计-456”,“算-09012”,“机-689”,则“计算机”的编码是“45+09+69”-“450968”。
“一心一意”的各个单字编码是“一-1”,“心-4544”,“意-08194”,则“一心一意”的编码是“11+45+08”-“114508”。
以3755个国家一级字为例,本发明的根本特点和重大的技术进步,可以从本发明与现有技术方案进行比较中可以看出来。
本发明 | 现有技术方案 | ||
约定、规则和分类的条数 | 3 | 12 | |
部件分布在键位的个数 | 5 | 9 | |
部件分布的“规律性” | 非常好。除了“0”外,其余的都可用一句话记住 | 较好,但要记住9个键位上的22个部件 | |
取码时,采用“跳跃技术”的次数 | 所有的汉字只跳跃一次 | 90%的汉字跳跃二次10%的独体字跳跃一次 | |
最大码长都是6码时 | 平均码长 | 4.3 | 4.37 |
键选率 | 2.26% | 3.86% | |
重码字 | 441 | 579 | |
本发明最大码长为5码,现有技术方案最大码长为6码 | 平均码长 | 4.12 | 4.37 |
键选率 | 2.62% | 3.86% | |
重码字 | 591 | 579 |
表格注明:一、所有技术指标都是简码后得到的;二、现有技术方案中的各项数据是从其使用说明书和编码宝典中统计出来的;三、单字的使用频度取自李公宜、刘如水主编的《汉字信息字典》;四、“跳跃技术”是指取码时,不连续取足码长,而是非连续取码。这种技术可降低重码率,但会增加拆字取码难度。
总之,本发明无论在“易学性”,还是在降低重码率、提高输入速度和使用效率方面都比现有方案有了实质性的突破,特别是“易学性”方面更是显而易见。另外,现有技术方案在拆字取码时,由于笔画书写顺序“二义性”,如:
要么增加容错码,但这势必增加实际使用的重码率;要么有一些人无法正确拆字取码,增加了学习的难度,推广应用范围受到了限制;而本方案都把它们当作一个部件取一码,不存在二义性。
Claims (2)
1、一种左部右部笔画数字编码汉字电脑输入法及其键盘,利用数字键盘上的1、2、3、4、5五个数字键分别表示汉字的横(提)、竖(竖左钩)、撇、捺(点)、折五种笔画,其特征在于将汉字中左右结构(含左中右结构)的合体字从结构上分为“左部”和“右部”两部分,称这些字为“左右字”,把其余的汉字全部看成“整体字”;由“左部”的前二笔画、“右部”的前二笔画或前三笔画和最后一笔画构成的“左右字”汉字笔画数字编码,再加上“整体字”取前四笔画和最后一笔画的汉字笔画数字编码而形成的完整的汉字数字编码体系(当“左右字”的“左部”、“右部”或“整体字”的现有笔画不足取码时,只取现有的笔画),使用数字键盘向电脑或通讯设备输入单字和或词语。
2、如权利要求1所述的汉字电脑输入法及其键盘,其特征在于数字键6、7、8、9、0上,分别安置以下五组汉字部件:
(5)数字键0----“二、亠、”
取码时,当遇到这些部件时,不能将其拆成笔划,而是作为一个整体进行取码。当“左右字”的“左部”、“右部”或“整体字”的现有笔画或部件不足取码时,只取现有的笔画或部件。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 01121568 CN1265269C (zh) | 2001-03-02 | 2001-06-30 | 左部右部笔画数字编码汉字电脑输入法及其键盘 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN01108849 | 2001-03-02 | ||
CN01108849.4 | 2001-03-02 | ||
CN 01121568 CN1265269C (zh) | 2001-03-02 | 2001-06-30 | 左部右部笔画数字编码汉字电脑输入法及其键盘 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1327188A CN1327188A (zh) | 2001-12-19 |
CN1265269C true CN1265269C (zh) | 2006-07-19 |
Family
ID=25740327
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 01121568 Expired - Fee Related CN1265269C (zh) | 2001-03-02 | 2001-06-30 | 左部右部笔画数字编码汉字电脑输入法及其键盘 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1265269C (zh) |
-
2001
- 2001-06-30 CN CN 01121568 patent/CN1265269C/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN1327188A (zh) | 2001-12-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1265269C (zh) | 左部右部笔画数字编码汉字电脑输入法及其键盘 | |
CN1178120C (zh) | 汉字编码计算机输入方法 | |
CN1264859A (zh) | 五笔数码键盘汉字电脑输入法及其键盘 | |
CN1118742C (zh) | 笔形部首混合汉字数码输入法及键盘 | |
CN1162767C (zh) | 方圆归类象形码汉字输入法 | |
CN1029046C (zh) | 汉字部首笔画输入法 | |
CN1203391C (zh) | 左右音形数码汉字电脑输入法及其键盘 | |
CN1534444A (zh) | 《汉字结构》输入法 | |
CN1114853C (zh) | 一种使用计算机数字键盘的数字编码双笔划汉字输入法 | |
CN1744014A (zh) | 数字二笔和汉字输入法及键盘 | |
CN1291299C (zh) | 数字键盘七键五码汉字编码输入方法 | |
CN1435745A (zh) | 左右数码汉字电脑输入法及其键盘 | |
CN1043381C (zh) | 汉字四笔画数码输入法 | |
CN1060867C (zh) | 汉字自由输入法 | |
CN1029760C (zh) | 一种使用普通数字键盘向计算机输入汉字的方法 | |
CN1744006A (zh) | 手机码汉字输入法 | |
CN100342314C (zh) | 汉字数字特征码输入法及键盘 | |
CN1284666A (zh) | 数字码汉字输入法 | |
CN1467613A (zh) | 汉字位码手写输入法及输入装置 | |
CN1538278A (zh) | 一种数码汉字输入法及其键盘 | |
CN1687874A (zh) | 一种基于小键盘的文字输入方法 | |
CN1141632C (zh) | 一种汉字二位数码输入法 | |
CN1570833A (zh) | 汉字笔形数字两码总图标输入法及键盘 | |
CN101075160A (zh) | 汉字三键输入法 | |
CN1700154A (zh) | 和码汉字数字输入法的第二种编码方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20060719 |