CN1357815A - 汉字数码输入法 - Google Patents
汉字数码输入法 Download PDFInfo
- Publication number
- CN1357815A CN1357815A CN 01137658 CN01137658A CN1357815A CN 1357815 A CN1357815 A CN 1357815A CN 01137658 CN01137658 CN 01137658 CN 01137658 A CN01137658 A CN 01137658A CN 1357815 A CN1357815 A CN 1357815A
- Authority
- CN
- China
- Prior art keywords
- chinese character
- stroke
- combination
- kinds
- strokes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Document Processing Apparatus (AREA)
- Input From Keyboards Or The Like (AREA)
Abstract
本发明涉及一种计算机汉字数码输入法及其派生的两种输入法。它使用的是由0至9十个数字组成的数字小键盘。它通过汉字的字音,结构和笔形三要素的合理配置从而形成了太阳甲,太阳乙和太阳丙三种数码输入法。每种输入法既可以输入国标6763个汉字,又可以输入常用的两字,三字和四字词组两万多条。并且,各种输入方式不需要切换。其中,太阳丙汉字数码输入法。它的码长与国标区位码的码长相同,只有四位。并且重码字也不多。在各种数码输入法中,它达到了码长最短的极限。太阳码的三种输入法优势互补,使汉字输入非常方便。
Description
本发明涉及一种计算机汉字数码输入法及其派生的两种输入法。它的显著特点是把汉字的三要素,即:字音,结构和笔形,按照国家有关规范合理的布局在,由0至9十个数字组成的小键盘上。三种输入法优势互补,构成一套完整的小键盘汉字数码输入方法。
目前,适用于25键位大键盘的汉字输入法有多种。适用于10键位小键盘的,虽然也有一些,但是,由于其自身的缺陷,即:编码规则复杂或码长太长等,使其不便于使用或普及。五笔数码输入法继承了五笔字型的优点。但是,由于它码长太长(一般是6键)以及需要大量记忆一级至四级简码才能实现快速输入。因此,不便于使用或普及。当前,适用于10键位小键盘的输入法有待于进一步发展。
本发明的任务是解决数码的适用性问题。(后文将详述)
下面介绍汉字数码输入法
本发明使用的是0至9十个数字组成的小键盘。选用了汉字的字音,结构和笔形三大特征为编码要素。下面分别介绍三要素及其键盘布局。
一.字音及其键盘布局。音码是指汉字的声母。它的键盘布局基础是汉语拼音方案。在拼音方案中有声母23个即:B,P,M,F;D,T,N,L;Z,C,S;ZH,CH,SH;J,Q,X;G,K,H;R,Y,W。其中,Z和ZH,C和CH,S和SH这三组分别用Z,C,S表示。这样就只有20个声母了。20个声母布局在小键盘上,平均每键布局2个声母。在国标6763个汉字中,有41个没有发音的偏旁部首。另外,还有一些汉字没有声母,它们是以A,E,O开头的零声母汉字。零声母汉字总量不多,偏旁部首字符也不多。把这两部分汉字的音码都归入R部。因为R部的汉字总量也不多。这样就把国标6763个汉字的音码布局完毕。(详见附表1)
二.汉字的结构及其键盘布局。人们通常把汉字的结构分为四种。即:左右结构,上下结构,包围结构和独体结构。但是,它们所占的比重相差甚远。左右结构约占63%,上下结构约占23%,包围结构约占8%,独体结构约占5%。为了适应数字小键盘输入汉字的需要,有必要对四种结构进行细化。包围和独体两种结构不变。下面谈一谈上下和左右两种结构的细化问题。
第一,上下结构的细化。在上下结构的汉字中,又含有左右结构特征的占很大比重,约占1/3。其中多数为“花,萌”等等,形如汉字的“品”字。因此,把这种上下含左右形式的汉字叫做“品”字型结构。这样上下结构就被细化为两种。即:上下结构和“品”字型结构。例如:茄,华,卒,燕,器等等都是“品”字型结构。
第二,左右结构的细化。汉字中左右结构的最多,占60%以上。因此,有必要对其详细分类。在左右结构的字中,按照它们是否还含有左右,上下,包围或独体结构的特征,可以把它们分为四种。即:左右含左右,左右含上下,左右含包围和左右含独体。左右含左右又叫多重左右;左右含独体又叫单纯左右。需要注意的是左右含上下的这一类数量特别多。左右含上下有三种情况,即:左含,右含或双含。由于右含的很多,因此把它单独列为一类。左含和双含的列为另一类。左右含上下(右含)的这一类其字型特征为“将,特”等等,用图形表示为“
”,形如汉字的“品”字左旋转90度,“品”字底“
”在右部,因此,把左右含上下(右含)的这一类叫做右“品”字型结构。左右含上下(左含和双含)的这一类,其字型特征多数为“别,数”等等,用图形表示为“
”,形如汉字的“品”字右旋转90度,“品”字底“
”在左部。因此,把左右含上下(左含和双含)的这一类,叫做左“品”字型结构。
综合上述情况,左右结构细化的结果为分成五种结构。即:多重左右结构,单纯左右结构,左“品”字型结构,右“品”字型结构和左右包围结构。
通过结构分类的细化,汉字的结构总共分为九种。即:1.多重左右,2.单纯左右,3.左品字结构,4.右品字结构,5.左右包围结构,6.上下结构,7.品字结构,8.包围结构,9.独体结构。它们分别用1至9九个数字表示,就可以布局在数字小键盘上。(详见附表2)
三.汉字的笔形及其键盘布局。目前,横,竖,撇,捺,折五种笔形,被人们广泛采用。这五种笔形只是汉字的单笔的特征。另外,汉字还有一些形如“口,十,门”等等常用笔画组合特征。汉字的常用笔画组合有很多种。大致可以分为四类。即:正交笔画组合,斜交笔画组合,全围笔画组合和半围笔画组合。下面分别介绍它们。
1.正交笔画组合:它是指只有横,竖相交的笔画组合。如:“十,艹”等等
2.斜交笔画组合:凡是含有撇,捺,折相交的笔画组合。如:“七,又”等等
3.全围笔画组合:它是指四面围,形如“口”例如:“团,田,日,目,四”等等它们的外部都是全围笔形。
另外,再补充一种“0”笔形,即:零笔形,或者叫“空”笔形。零笔形的作用是替代太阳码中的空字符。
综上所述,汉字的五种单笔特征和四种笔画组合特征,构成了汉字的九种基本笔形。即:横笔,竖笔,撇笔,捺笔,折笔,正交笔形,斜交笔形,全围笔形和半围笔形。再加上零笔形,一共十种笔形。它们分别用0至9十个数字表示就可以布局在数字小键盘上。(详见附表3)
本发明就是以汉字的上述三大特征为基础。通过各要素的合理选配,从而形成了太阳甲,太阳乙和太阳丙三种输入法。每种输入法都有单字输入和词组输入。它们中,太阳甲是主输入法,另两种是辅助输入法。
下面分别介绍三种汉字输入法。
一.太阳甲输入法。太阳甲的码长是五位。它的第一位码是音码。它的后四位码是笔形码,即:把汉字分成两块后,每块的首笔和末笔的编码,一共四位。
1.太阳甲=1位+2位+3位+4位+5位
=音码+1块首笔+1块末笔+2块首笔+2块末笔
2.音码:它是汉字的声母的编码。(详见附表1)
3.笔形码:它是汉字的十种笔形的编码。(详见附表3)
4.独体字问题:独体字不能拆分成两块,它的码长只有三位。即,太阳甲的前三位码。
5.汉字的拆分规则。大多数汉字都可以非常直观的分成两块。但是,也有少数汉字不容易拆分。这就需要按照一定的规则进行拆分。
第一.相离可分,相接可分,相交不分,单笔不成块。
1.相离可分:如,“华”字可以分为“化”和“十”两块。
2.相接可分:如,“示”字可以分为“二”和“小”两块。
3.相交不分:如,“夫”字不能分为“二”和“人”两块。
4.单笔不成块:如,“旦”字不能分为“日”和“一”两块。还有亿,旧,习,乱等都是单块字。按照这个规则,三笔以下的汉字都是单块字。
第二.成字优先,固定搭配优先。
1.成字优先:如,“意”字可以分为“音”和“心”两块。
第三.相对均匀,先少后多。
2.先少后多:如,“参”字可以分为“厶”和“
”两块。
用太阳甲方案编制的太阳码,其重码率很底。单个汉字的最高重码次数为11,即:只有12个重码字。例如,编码为“64174”的太阳码,它只有12个重码字。
二.太阳乙输入法。太阳乙的码长是六位。它的第一位码是结构码,它的第二至第五位四个码与太阳甲的后四位码相同,它的第六位码是固定码“0”,即:零笔形。
1.太阳乙=1位+2位+3位+4位+5位+6位
=结构码+1块首笔+1块末笔+2块首笔+2块末笔+零笔
2.结构码:它是汉字九种结构的编码。(详见附表2)
3.零笔形:即,零笔,它的作用是使太阳甲和太阳乙不会有重码。它也为运行各种输入方式不需切换打下了基础。码长不同,可以实现各输入法不需切换。
太阳乙的特征是没有音码。不知道字音的汉字可以方便的输入。在太阳乙中,单个汉字的最高重码次数为18,即:只有19个重码字。例如:编码为“541440”的太阳乙码,它只有19个重码字。
三.太阳丙输入法。太阳丙的码长是四位。它的第一位码是音码,它的第二位码是结构码,它的第三,第四两位码是笔形码。
1.太阳丙=1位+2位+3位+4位
=音码+结构码+首笔码+末笔码
2.音码:它与太阳甲的音码相同。(详见附表1)
3.首笔码:它是汉字的第一个笔画(单笔画或笔画组合)的编码。(详见附表3)
4.末笔码:它是汉字的最后一个笔画(单笔画或笔画组合)的编码。(详见附表3)
太阳丙的特点是汉字不需要拆分两块。凡是不容易拆分成两块的汉字,它的结构码很容易确定。因此,它可以弥补太阳甲的不足,它是很好的辅助方案。例如:“参,彬”它们的两块都不容易拆分。但是,它们的结构都容易确定。在太阳丙中,单个汉字的最高重码次数是20,即:一共有21个重码字。例如:编码为“5544”和“6534”的两个太阳丙码,都是有21个重码字。
四.太阳词组输入法。太阳甲,乙,丙三种输入法合用一种词组输入法。它可以输入两万五千多条两字,三字和四字常用词组。太阳码没有编制5字以上的词组。词组输入以音码为主。词组码长都是六位。它们的输入规则如下:
1.四字词组=1音+2音+3音+4音+3首+4首
2.三字词组=1音+2音+3音+1首+2首+3首
3.两字词组=1音+2音+1首+2首+1结构+2结构
在规则中,“音”是指音码;“首”是指首笔;“结构”是指结构码。太阳词组输入法,它的词条很多,达两万多条。但是,它的重码率很低,词组的最高重码次数为5,即:只有6个重码词。例如:编码为“448468”的太阳词码,它只有6个重码词。
五.简码字输入法。在常用汉字中,有一些字的使用频度很高,即:高频字。为了简化它们的输入,太阳码编制了十个最常用的高频字的输入法。这十个字的编码用小键盘上的0至9十个数字表示,它们的码长都是一位,即:击一键就可以输入它。具体编码如下:
0 1 2 3 4 5 6 7 8 9
这 人 有 和 的 不 在 是 一 了
六.太阳汉字演示盘。该盘中一共有19个文件。首先,有两个文本文件是演示盘的说明。其次,有3个FOXBASE+语言文件,太阳码的演示程序是用FOXBASE+语言编写的。它需要在此环境下运行。再次,有八个字词库文件。它们分别是三个字库文件及其三个索引文件;一个词库文件及其索引文件。最后,是一套太阳码运行程序文件,一共有6个文件。它们分别是一个总程序文件,三个主程序文件和两个子程序文件。
在演示盘中,重码字词的显示是通过两个子程序(YT1.prg和YT2.prg)实现的。YT1是重码单字显示程序,每屏可以显示十个重码字。YT2是重码词组显示程序,每屏可以显示十个重码词。重码字一屏显示不完时,可以翻页显示。翻页键为:“+”号键是向后翻页;“-”号键是向前翻页。
前面叙述了太阳码的各种输入方式。为了直观的显示各种输入码的特点,后文编制了一张表格,用于它们之间的对比(详见附表4)。下面谈一谈本发明的任务的解决问题。为了使太阳码方便适用,本方案采取了以下四项措施。
第一,编码要素的选取。太阳码所选的字音,结构和笔形,都是汉字的最有代表性的显著特征。这样可以传人们容易掌握太阳码。
第二,一套太阳码优势互补。太阳码有甲,乙,丙三种。人们可以避繁就简,避难从易。从而,使人们输入汉字方便快捷。
第三,太阳丙码长短。它的码长与区位码相同,只有四位。在数码输入法中,它达到了码长最短的极限。可以加快输入速度。
第四,太阳码用途广泛。由于采用的是10键位小键盘,因此,它可以制成硬件芯片,植入固定电话,移动电话,计算器,寻呼机等等使用数字小键盘的机器设备上。方便它们传输汉字信息。
上述措施的实现,使人们可以方便的输入单字或词组。并且适用于各种十键位数字键盘。因此,它充分显示了太阳码的适用性。 附表.1音码键位布局表
附表.2结构码键位布局表 附表3笔形码键位布局表
7R零声G偏首 | 8K Y | 9H W |
4ZHZ J | 5CHC Q | 6SHS X |
1P T | 2M N | 3F L |
0B D |
7品字结构 | 8上下 | 9独体 |
4左品字结构 | 5右品字结构 | 6包围 |
1多重左右 | 2单纯左右 | 3左右包围结构 |
0 |
7正交 | 8斜交 | 9半围 |
4捺笔 | 5折笔 | 6全围 |
1横笔 | 2竖笔 | 3撇笔 |
0零笔 |
附表.4典型字词编码举例
汉字 | 简码 | 太阳甲 | 太阳乙 | 太阳丙 |
的 | 4 | 03634 | 236340 | 0234 |
这 | 0 | 44848 | 648480 | 4648 |
十 | 67 | 970 | 697 | |
花 | 97738 | 777380 | 9778 | |
数 | 64838 | 448380 | 6448 | |
特 | 13774 | 537740 | 1534 | |
河 | 94112 | 341120 | 9342 |
词组 | 编码 | 词组 | 编码 | 词组 | 编码 |
安居乐业 | 743832 | 电话机 | 094247 | 暗暗 | 776655 |
澳大利亚 | 703831 | 工程师 | 756132 | 啊啊 | 776611 |
磋酡岁月 | 516829 | 河南省 | 926472 | 中国 | 472696 |
杞人忧天 | 578141 | 计算机 | 464437 | 魅力 | 233869 |
莺歌燕舞 | 878973 | 秦始皇 | 569883 | 人民 | 723999 |
足智多谋 | 440234 | 西安市 | 676144 | 我们 | 923392 |
自作主张 | 444449 | 自然界 | 474336 | 座谈 | 414465 |
Claims (1)
1.太阳码的适用性体现在它的编码要素的选取方面。
有一些数码输入法,选用汉字的字根为编码要素。由于字根太多,往往是编码规则复杂,码长太长,甚至需要大量记忆各级简码才能方便输入汉字。太阳码选用的字音,结构和笔形三要素,都是汉字最有代表性的显著的特征。人们非常容易掌握。下面简要说明三要素。
汉字的字音是编码要素之一。太阳码把汉字的声母按照汉语拼音方案的规律合理的布局在0至9十个数字组成的小键盘上。规则简单,使用方便。如下所示:
0 1 2 3 4 5 6 7 8 9
B P M F J Q X G K H
D T N L Z C S R Y W
ZH CH SH
汉字的结构也是编码要素之一。太阳码按照人们通常的划分结构的规则。把汉字的结构区分为九种。即,<1>.多重左右结构,<2>.单纯左右结构,<3>.左品字结构,<4>.右品字结构,<5>.左右包围结构,<6>.上下结构,<7>.品字型结构,<8>.包围结构,<9>.独体结构。这样,使结构码很容易的布局在数字小键盘上,方便人们使用。如下所示:
1 2 3 4 5 6 7 8 9
多重 单纯 左右 左品 右品 包围 品字 上下 独体
左右 左右 包围 结构 结构 结构 结构 结构 结构
汉字的笔形还是编码要素之一。在传统的五种笔形的基础上,本发明又发现了汉字的四种常用笔画组合的显著特征。即:<1>.正交笔画组合,<2>.斜交笔画组合,<3>.全围笔画组合,<4>.半围笔画组合。五种传统笔形和四种笔画组合构成了汉字的九种基本笔形。另外,再加一种零笔形。十种笔形分别布局在小键盘的0至9十个键位上。如下所示:
0 1 2 3 4 5 6 7 8 9
零笔 横笔 竖笔 撇笔 捺笔 折笔 全围 正交 斜交 半围
太阳码的字词库文件是编码三要素的特征的具体体现。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 01137658 CN1357815A (zh) | 2001-11-01 | 2001-11-01 | 汉字数码输入法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 01137658 CN1357815A (zh) | 2001-11-01 | 2001-11-01 | 汉字数码输入法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1357815A true CN1357815A (zh) | 2002-07-10 |
Family
ID=4674241
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 01137658 Pending CN1357815A (zh) | 2001-11-01 | 2001-11-01 | 汉字数码输入法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1357815A (zh) |
-
2001
- 2001-11-01 CN CN 01137658 patent/CN1357815A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1258132C (zh) | 用于进行字母符号输入的小键盘布局 | |
CN1869892A (zh) | 一种中文短语、短句快速输入的方法和系统 | |
CN87100555A (zh) | 双笔顺计算机汉字输入方案及其键盘 | |
CN1357815A (zh) | 汉字数码输入法 | |
CN1177271C (zh) | 四笔号码字词不重输入法及其键盘 | |
CN1147780C (zh) | 三笔数码汉字输入方法 | |
CN1034245C (zh) | 缅文字型智能四码输入系统 | |
CN1196057C (zh) | 一码二形数字编码汉字输入方法 | |
CN1818836A (zh) | 快易码数码象形输入法 | |
CN1112629C (zh) | 一种汉字和英文的数字小键盘输入方法 | |
CN1266576C (zh) | 数码汉语输入方法 | |
CN1178121C (zh) | 汉字笔顺部首双重输入方法及系统 | |
CN1120403C (zh) | 一种汉字数字编码输入法 | |
CN1188773C (zh) | 英文快速输入法 | |
CN1530805A (zh) | 中华形码汉字输入系统 | |
CN1142474C (zh) | 字典码汉字输入法 | |
CN1043381C (zh) | 汉字四笔画数码输入法 | |
CN1195257C (zh) | 结构数码汉字输入方法 | |
CN1299995A (zh) | 汉字输入法编码方案 | |
CN113253853A (zh) | 一种计算机和手机的汉字输入方法 | |
CN1584804A (zh) | 数字键盘汉字输入法 | |
CN101034317A (zh) | 汉字输入法 | |
CN1068444C (zh) | 一种汉字编码输入方法 | |
CN1100288C (zh) | 四笔序音计算机汉字键盘输入方法 | |
CN1238780C (zh) | 汉语拼音输入法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |