CN1460914A - 一种数码汉字输入法及其键盘 - Google Patents
一种数码汉字输入法及其键盘 Download PDFInfo
- Publication number
- CN1460914A CN1460914A CN 03129316 CN03129316A CN1460914A CN 1460914 A CN1460914 A CN 1460914A CN 03129316 CN03129316 CN 03129316 CN 03129316 A CN03129316 A CN 03129316A CN 1460914 A CN1460914 A CN 1460914A
- Authority
- CN
- China
- Prior art keywords
- stroke
- strokes
- combination
- code
- totally
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Input From Keyboards Or The Like (AREA)
- Document Processing Apparatus (AREA)
Abstract
一种数码汉字输入法及其键盘,其键盘包括有0、1、2……9共10个数字键,其特征在于各键所对应的汉字笔形及部件为:“1”对应“横”类;“2”对应:“竖”类,“3”对应“撇”类;“4”对应“捺”类;“5”对应“折”类;“6”对应“交”类;“7”对应“插”类;“8”对应“八”类;“9”对应“小”类;“0”对应“口”类;并且,单个汉字按“前4末1”规则取码,即;按规范的书写顺序,取第一、二、三、四、末共五个笔形的代码,不足五码按实际码长。对于可按左右、上下或内外分成首部和尾部二部分的汉字,取码规则还可以变更为“首2尾3”或“首2尾2”;汉字词组的编码则可以为六码。与现有技术相比,本发明不仅可以适用于具有简繁汉字的大字符集,而且重码率低,并且由于各字形仅与10个数字键相关联,因而可以适用于手机、电话、电子字典、个人数字助理(PDA)、个人电脑(PC)等各种具有数字输入设备的产品。
Description
技术领域
本发明涉及一种数码汉字输入法及键盘,属于计算机中文信息处理技术领域。
背景技术
目前,数字键盘的应用十分广泛。如:手机、电话、电子字典、掌上电脑、PC机等设备都使用了数字键盘。利用数字键盘输入汉字,已成为中文信息处理领域急待解决的课题。
在现有技术中,利用数字键盘进行汉字输入的方法主要有以下几种:
①笔划输入法:
在5个或10个数字键上定义若干种笔划,依照书写笔顺,依次按键输入汉字的每一笔划。这一方法显而易见的优点是“不用学习”,只要会写字便会输入,其缺点是按键次数多,输入速度慢,效率不高。
②拼音输入法:
这是参考英文字母的数字输入方法,通过按1至4次数字键逐个输入汉语拼音的字母。其优点是可以直接在数字键盘上打拼音,简单易学,其缺点是大量的同音字需要挑选,而且击键次数多,同样效率不高。
③九键六码汉字输入法:
这一输入方法由五笔字型的发明人王永民先生提出,其中国发明专利申请为00103505.3号(公开号为CN1264859A)的《五笔数码键盘汉字电脑输入法及其键盘》,该输入法利用1~9共九个数字键来输入汉字,单字最大码长为6码。其优点是重码率低,缺点是单字编码过长,影响了编码方案的实用性。
另外,已有技术的各种汉字编码方案,一直来都沿袭五笔字型输入法的字词编码兼容技术,其缺陷在于,词组的容量不能太多,否则将产生大量地字、词重码,影响输入速度。
发明内容
本发明所要解决的技术问题是针对上述现有技术现状而提供一种简单易学、科学规范的数码汉字输入法及其键盘。
本发明解决上述技术问题所采用的技术方案为:该数码汉字输入法的键盘包括有0、1、2……9共10个数字键,其特征在于各键所对应的汉字笔形及部件为:
“2”:“竖”类,对应“丨”、“亅”及部件“日”;
“3”:“撇”类,对应“丿”及部件“月”;
“4”:“捺”类,对应“丶”、“ㄟ”及部件“亠、讠”;
“5”:“折”类,对应“乙”及部件“幺、纟”;
“0”:“口”类,对应“口、囗、
并且,单个汉字按“前4末1”规则取码,即:按规范的书写顺序,取第一、二、三、四、末共五个笔形的代码,不足五码按实际码长。
对于可按左右、上下或内外分成首部和尾部二部分的汉字,取码规则可以为:
首部或尾部只有一个或二个笔形的,则仍按所述的“前4末1”规则取码;
首部、尾部的笔形均在三个以上的,则按“首2尾3”规则取码,即:首部按书写顺序取第一、第二共二个笔形的代码;尾部按书写顺序取第一、二、末共三个笔形的代码,一共五码。
或者,
首部或尾部只有一个笔形的,则仍按前述的“前4末1”规则取码;
首部的笔形在二个及二个以上、尾部的笔形在三个及三个以上的,则按”首2尾3”规则取码,即:首部按书写顺序取第一、第二共二个笔形的代码,尾部按书写顺序取第一、二、末共三个笔形的代码,共五码;
首部的笔形在二个及二个以上、尾部的笔形为二个的,则按“首2尾2”规则取码,即:首部按书写顺序取第一、第二共二个笔形的代码,尾部按书写顺序取第一、第二共二个笔形的代码,共四码。
而汉字词组的编码方法可以为:
二字词:分别取第1字的一、二、末三个笔形和第2字的一、二、末三个笔形,共六码,其中如有汉字不足三个笔形的,则以“0”补齐;
三字及三字以上的多字词:分别取第1、第2和最后一个汉字的前两个笔形的代码,共六码,其中如有汉字不足二个笔形的,则以“0”补齐。
由于单字和词组的码长不等,因此当汉字输入系统有词组编码存在时,在输完单字编码后,可以键入数字键盘上的“非数字键”作为输码结束键。
与现有技术相比,本发明由于将汉字拆分笔形增加至10种,因而在单字码长为5、词组码长为6的情形下,不仅可以适用于具有简繁汉字的大字符集,而且重码率低,并且由于各字形仅与10个数字键相关联,因而可以适用于手机、电话、电子字典、个人数字助理(PDA)、个人电脑(PC)等各种具有数字输入设备的产品。
附图说明
图1为本发明实施例的笔形—键位分布图。
具体实施方式
以下结合附图实施例对本发明作进一步详细描述。
(一)笔形、部件及代码
本发明将构成汉字的基本笔形分为5种单笔形和5种复笔形。
5种单笔形的划分采用国家统一标准,即分为“横(含提)、竖(含左竖钩)、撇、捺(含点)、折”,不再详述。
5种复笔形为:
(括号前的笔形为代表性笔形,括号内为形似笔形,下同)
上述10种笔形的代码分别为:
“横1、竖2、撇3、捺4、折5、交6、插7、八8、小9、口0”
代码助记记词为:
“1、2、3、4、5,横竖撇捺折;
6、7、8、9、0,交插八小口。”
为离散重码,本发明还优选了10余个高频部件,按照易记、便于联想的原则定义在数字键上,具体如下:
(1)艹(
)因其首笔为“一”,故定义在数字键“1”上。
(2)日 因其首笔为“丨”,故定义在数字键“2”上。
(3)月 因其首笔为“丿”,故定义在数字键“3”上。
(4)讠、亠 因其首笔为“丶”,故定义在数字键“4”上。
(5)幺、纟 因其首笔为“乙”,故定义在数字键“5”上。
(6)木 因其首笔形为“十”,故定义在数字键“6”上。
(7)扌 因其笔形与“插”笔形相似,故定义在数字键“7”上。
(8)氵灬辶心()因笔形中有多个点,故定义在最大的数字键“9”上。
以上十个基本笔形及10余个优选部件构成了本发明的笔形体系,这是本发明的核心技术。需要说明的是:上述笔形及部件是本发明人根据规范、易记、高效等原则优选得到,在具体实施本发明时,允许作适当增减。如:在“交”笔形中,可增加“又、力”等部件;可将“丈、
”等部件也定义为“插”笔形。
(二)单字取码规则:
(1)独体字(含对称结构、部分包围结构的汉字)
独体字按“前4末1”规则取码。即:按规范的书写顺序,取一、二、三、四、末共五个笔形的代码,共为五码。不足五码按实际码长输入。如:
独体结构: 我3764 重31261 本61
对称结构: 乘36288 坐8861 爽16668
包围结构: 可102 或10164 匿11605
(上述包围结构的汉字,因其包围部分不是连续写成,故按笔顺取码。)
(2)合体字
合体字,先从结构上将其分成两部分。具体是:
左右(左中右)结构的合体字分成左、右(左、中右)两部分;
上下(上中下)结构的合体字分成上、下(上、中下)两部分;
包围结构的合体字分为内、外两部分。
为便于叙述,下文中将合体字的第一部分称为“首部”,第二部分称为“尾部”。
合体字分成首、尾两部分后,若首部、尾部只有一个或二个笔形,则该合体字仍按独体字“前4末1”规则取码。若首部、尾部的笔形均在三个以上,则按“首2尾3”规则取码。即:首部按书写顺序取一、二共两个笔形的代码;尾部按书写顺序取一、二、末共三个笔形的代码,一共五码。
合体字也可按如下规则取码:
合体字分成首、尾两部分后,若首部或尾部只有一个笔形,则该合体字仍按独体字“前4末1”规则取码。若首部、尾部的笔形均在二个以上,则按“首2尾3”规则取码,尾部不足3码按实际码长输入。
合体字结构的划分,以现行的教科书及规范的写字字典为依据。
由于汉字间架结构具有很强的直观性,因此,只要略懂汉字结构知识,对合体字都能很容易地切分,不会产生“二义性”。对少数几个结构不好切分的汉字,则可通过设置“容错码”加以解决。
合体字编码举例如下:
左右、左中右结构:
村664 撬73737 情82713 鲍35355 鞭11816 辫48546
上下、上中下结构:
京409 赢45034 露14020 翼58068 登54101 英1274
半包围结构:
磨43660 着81011 左6121 虚21221
匈35652 氧81817 司510 灰688
毯37888 起61215 彪21333 邂35329
闼42649 同2510 凶652 函52882
全包围结构:
国01614 圆00258
本发明不仅可对国GB2312中的简体字编码,同样可对GBK中的繁体字及其它汉字编码,且简、繁汉字编码不同。如:
镕81440 詡41588 垚61611 頌85138 絞59486
本发明还可对非成字部首、常用标点、字母进行编码输入。如:
一177 丨277 宀44577 卩5277 氵977 疒43877
,188 。288 、388 ;488
其中,“77”、“88”、“99”为特殊符号的编码后缀。
(三)词组的取码规则:
词组按“二字词”与“多字词”两种方式取码。
二字词:取每字的一、二、末三个笔形的代码,一共六码。若某字取不足三个笔形,则以“0”补齐。如:
词语450410 不是190218
多字词(三字及三字以上):取第1、第2和最后一个汉字的前两个笔形的代码,一共六码。若某字取不足二个笔形,则以“0”补齐。如:
计算机468463 精益求精868186
教育委员会664581 中华人民共和国028301
本发明的特征是采用字、词编码分离技术。这一技术的进步性在于:实现了文字录入以词组输入为主这一录入方式。并且将词组的编码空间扩大到一百万,基本实现词组输入无重码。从而极大地提高汉字的录入速度。
由于采用字、词编码分离技术,因此当输完单字编码(或简码)后,可以键入数字键盘上的某一“非数字键”作为输码结束键。如果没有重码,则该字直接上屏,如果有重码,则用数字键进行选择。对于词组,当输完六码后,如果无重码,则该词组直接上屏,如果有重码,则用数字键进行选择。
Claims (5)
1、一种数码汉字输入法及其键盘,其键盘包括有0、1、2……9共10个数字键,其特征在于各键所对应的汉字笔形及部件为:
“2”:“竖”类,对应“丨”、“亅”及部件“日”;
“3”:“撇”类,对应“丿”及部件“月”;
“4”:“捺”类,对应“丶”、“ㄟ”及部件“亠、讠”;
“5”:“折”类,对应“乙”及部件“幺、纟”;
并且,单个汉字按“前4末1”规则取码,即:按规范的书写顺序,取第一、二、三、四、末共五个笔形的代码,不足五码按实际码长。
2、根据权利要求1所述的数码汉字输入法及其键盘,其特征在于对于可按左右、上下或内外分成首部和尾部二部分的汉字,取码规则为:
首部或尾部只有一个或二个笔形的,则仍按所述的“前4末1”规则取码;
首部、尾部的笔形均在三个以上的,则按“首2尾3”规则取码,即:首部按书写顺序取第一、第二共二个笔形的代码;尾部按书写顺序取第一、二、末共三个笔形的代码,一共五码。
3、根据权利要求1所述的数码汉字输入法及其键盘,其特征在于对于可按左右、上下或内外分成首部和尾部二部分的汉字,取码规则为:
首部或尾部只有一个笔形的,则仍按前述的”前4末1”规则取码;
首部的笔形在二个及二个以上、尾部的笔形在三个及三个以上的,则按”首2尾3”规则取码,即:首部按书写顺序取第一、第二共二个笔形的代码,尾部按书写顺序取第一、二、末共三个笔形的代码,共五码;
首部的笔形在二个及二个以上、尾部的笔形为二个的,则按“首2尾2”规则取码,即:首部按书写顺序取第一、第二共二个笔形的代码,尾部按书写顺序取第一、第二共二个笔形的代码,共四码。
4、根据权利要求1、2或3所述的数码汉字输入法及其键盘,其特征在于,汉字词组的编码方法为:
二字词:分别取第1字的一、二、末三个笔形和第2字的一、二、末三个笔形,共六码,其中如有汉字不足三个笔形的,则以“0”补齐;
三字及三字以上的多字词:分别取第1、第2和最后一个汉字的前两个笔形的代码,共六码,其中如有汉字不足二个笔形的,则以“0”补齐。
5、根据权利要求4所述的数码汉字输入法及其键盘,其特征在于,在输完单个汉字编码后,再键入数字键盘上的“非数字键”作为输码结束键。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 03129316 CN1460914A (zh) | 2003-06-14 | 2003-06-14 | 一种数码汉字输入法及其键盘 |
CNB2004100320504A CN1315026C (zh) | 2003-06-14 | 2004-03-29 | 一种数码汉字输入法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 03129316 CN1460914A (zh) | 2003-06-14 | 2003-06-14 | 一种数码汉字输入法及其键盘 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1460914A true CN1460914A (zh) | 2003-12-10 |
Family
ID=29591201
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 03129316 Pending CN1460914A (zh) | 2003-06-14 | 2003-06-14 | 一种数码汉字输入法及其键盘 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1460914A (zh) |
-
2003
- 2003-06-14 CN CN 03129316 patent/CN1460914A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1652070A (zh) | 汉字音笔输入法 | |
CN1737739A (zh) | 基于英文键盘的藏文输入法 | |
CN1141633C (zh) | 计算机二十四部首汉字排序输入法 | |
CN101046706A (zh) | 用于不同人群电脑和手机可通用的输入法 | |
CN1460914A (zh) | 一种数码汉字输入法及其键盘 | |
CN1315026C (zh) | 一种数码汉字输入法 | |
CN1148637C (zh) | 一种通用数字键盘拼音文字的精确输入方法 | |
CN100339808C (zh) | U码汉字输入法 | |
CN1059281C (zh) | 汉字声韵调三拼音形编码输入方法 | |
CN1112629C (zh) | 一种汉字和英文的数字小键盘输入方法 | |
CN1257445C (zh) | 音义码汉字输入方法 | |
CN1293452C (zh) | 一种见字即识形码也可使用音码的汉字键盘输入方法 | |
CN1347023A (zh) | 二笔手写智能输入系统 | |
CN1243302C (zh) | 汉字辅元音形码输入法 | |
CN1123814C (zh) | 计算机二笔体系根形码汉字输入方法 | |
CN1187676C (zh) | 汉字辅元码输入法 | |
CN1031964C (zh) | 计算机汉字部首代码输入法 | |
CN1115619C (zh) | 一种字元拼形计算机汉字输入法 | |
CN1272693C (zh) | 仿真拼音数字输入法 | |
CN1256649C (zh) | 基于键选双拼的中文整句输入法及其键盘布局 | |
CN1292329C (zh) | 一种象形码数字键盘的英文字母输入方法 | |
CN1598743A (zh) | 按规范笔顺输入汉字的输入法及其键盘 | |
CN1554994A (zh) | 与数字符号象形相关式手机汉字输入法及其键盘 | |
CN1504863A (zh) | 简明数码韩文输入方法 | |
CN1244671A (zh) | 数符汉字编码输入法及键盘 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |