CN1357815A - 汉字数码输入法 - Google Patents

汉字数码输入法 Download PDF

Info

Publication number
CN1357815A
CN1357815A CN 01137658 CN01137658A CN1357815A CN 1357815 A CN1357815 A CN 1357815A CN 01137658 CN01137658 CN 01137658 CN 01137658 A CN01137658 A CN 01137658A CN 1357815 A CN1357815 A CN 1357815A
Authority
CN
China
Prior art keywords
chinese character
stroke
combination
kinds
strokes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 01137658
Other languages
English (en)
Inventor
王孝东
张平发
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN 01137658 priority Critical patent/CN1357815A/zh
Publication of CN1357815A publication Critical patent/CN1357815A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Input From Keyboards Or The Like (AREA)

Abstract

本发明涉及一种计算机汉字数码输入法及其派生的两种输入法。它使用的是由0至9十个数字组成的数字小键盘。它通过汉字的字音,结构和笔形三要素的合理配置从而形成了太阳甲,太阳乙和太阳丙三种数码输入法。每种输入法既可以输入国标6763个汉字,又可以输入常用的两字,三字和四字词组两万多条。并且,各种输入方式不需要切换。其中,太阳丙汉字数码输入法。它的码长与国标区位码的码长相同,只有四位。并且重码字也不多。在各种数码输入法中,它达到了码长最短的极限。太阳码的三种输入法优势互补,使汉字输入非常方便。

Description

汉字数码输入法
本发明涉及一种计算机汉字数码输入法及其派生的两种输入法。它的显著特点是把汉字的三要素,即:字音,结构和笔形,按照国家有关规范合理的布局在,由0至9十个数字组成的小键盘上。三种输入法优势互补,构成一套完整的小键盘汉字数码输入方法。
目前,适用于25键位大键盘的汉字输入法有多种。适用于10键位小键盘的,虽然也有一些,但是,由于其自身的缺陷,即:编码规则复杂或码长太长等,使其不便于使用或普及。五笔数码输入法继承了五笔字型的优点。但是,由于它码长太长(一般是6键)以及需要大量记忆一级至四级简码才能实现快速输入。因此,不便于使用或普及。当前,适用于10键位小键盘的输入法有待于进一步发展。
本发明的任务是解决数码的适用性问题。(后文将详述)
下面介绍汉字数码输入法
本发明使用的是0至9十个数字组成的小键盘。选用了汉字的字音,结构和笔形三大特征为编码要素。下面分别介绍三要素及其键盘布局。
一.字音及其键盘布局。音码是指汉字的声母。它的键盘布局基础是汉语拼音方案。在拼音方案中有声母23个即:B,P,M,F;D,T,N,L;Z,C,S;ZH,CH,SH;J,Q,X;G,K,H;R,Y,W。其中,Z和ZH,C和CH,S和SH这三组分别用Z,C,S表示。这样就只有20个声母了。20个声母布局在小键盘上,平均每键布局2个声母。在国标6763个汉字中,有41个没有发音的偏旁部首。另外,还有一些汉字没有声母,它们是以A,E,O开头的零声母汉字。零声母汉字总量不多,偏旁部首字符也不多。把这两部分汉字的音码都归入R部。因为R部的汉字总量也不多。这样就把国标6763个汉字的音码布局完毕。(详见附表1)
二.汉字的结构及其键盘布局。人们通常把汉字的结构分为四种。即:左右结构,上下结构,包围结构和独体结构。但是,它们所占的比重相差甚远。左右结构约占63%,上下结构约占23%,包围结构约占8%,独体结构约占5%。为了适应数字小键盘输入汉字的需要,有必要对四种结构进行细化。包围和独体两种结构不变。下面谈一谈上下和左右两种结构的细化问题。
第一,上下结构的细化。在上下结构的汉字中,又含有左右结构特征的占很大比重,约占1/3。其中多数为“花,萌”等等,形如汉字的“品”字。因此,把这种上下含左右形式的汉字叫做“品”字型结构。这样上下结构就被细化为两种。即:上下结构和“品”字型结构。例如:茄,华,卒,燕,器等等都是“品”字型结构。
第二,左右结构的细化。汉字中左右结构的最多,占60%以上。因此,有必要对其详细分类。在左右结构的字中,按照它们是否还含有左右,上下,包围或独体结构的特征,可以把它们分为四种。即:左右含左右,左右含上下,左右含包围和左右含独体。左右含左右又叫多重左右;左右含独体又叫单纯左右。需要注意的是左右含上下的这一类数量特别多。左右含上下有三种情况,即:左含,右含或双含。由于右含的很多,因此把它单独列为一类。左含和双含的列为另一类。左右含上下(右含)的这一类其字型特征为“将,特”等等,用图形表示为“
Figure A0113765800031
”,形如汉字的“品”字左旋转90度,“品”字底“
Figure A0113765800032
”在右部,因此,把左右含上下(右含)的这一类叫做右“品”字型结构。左右含上下(左含和双含)的这一类,其字型特征多数为“别,数”等等,用图形表示为“
Figure A0113765800033
”,形如汉字的“品”字右旋转90度,“品”字底“ ”在左部。因此,把左右含上下(左含和双含)的这一类,叫做左“品”字型结构。
综合上述情况,左右结构细化的结果为分成五种结构。即:多重左右结构,单纯左右结构,左“品”字型结构,右“品”字型结构和左右包围结构。
通过结构分类的细化,汉字的结构总共分为九种。即:1.多重左右,2.单纯左右,3.左品字结构,4.右品字结构,5.左右包围结构,6.上下结构,7.品字结构,8.包围结构,9.独体结构。它们分别用1至9九个数字表示,就可以布局在数字小键盘上。(详见附表2)
三.汉字的笔形及其键盘布局。目前,横,竖,撇,捺,折五种笔形,被人们广泛采用。这五种笔形只是汉字的单笔的特征。另外,汉字还有一些形如“口,十,门”等等常用笔画组合特征。汉字的常用笔画组合有很多种。大致可以分为四类。即:正交笔画组合,斜交笔画组合,全围笔画组合和半围笔画组合。下面分别介绍它们。
1.正交笔画组合:它是指只有横,竖相交的笔画组合。如:“十,艹”等等
2.斜交笔画组合:凡是含有撇,捺,折相交的笔画组合。如:“七,又”等等
3.全围笔画组合:它是指四面围,形如“口”例如:“团,田,日,目,四”等等它们的外部都是全围笔形。
4.半围笔画组合:它是指三面围,形如“门,冂,匚,凵,
Figure A0113765800043
Figure A0113765800044
”等等,例如:“同,间,凶,区,贝,弓,月”等等,它们都含有半围笔形。
另外,再补充一种“0”笔形,即:零笔形,或者叫“空”笔形。零笔形的作用是替代太阳码中的空字符。
综上所述,汉字的五种单笔特征和四种笔画组合特征,构成了汉字的九种基本笔形。即:横笔,竖笔,撇笔,捺笔,折笔,正交笔形,斜交笔形,全围笔形和半围笔形。再加上零笔形,一共十种笔形。它们分别用0至9十个数字表示就可以布局在数字小键盘上。(详见附表3)
本发明就是以汉字的上述三大特征为基础。通过各要素的合理选配,从而形成了太阳甲,太阳乙和太阳丙三种输入法。每种输入法都有单字输入和词组输入。它们中,太阳甲是主输入法,另两种是辅助输入法。
下面分别介绍三种汉字输入法。
一.太阳甲输入法。太阳甲的码长是五位。它的第一位码是音码。它的后四位码是笔形码,即:把汉字分成两块后,每块的首笔和末笔的编码,一共四位。
1.太阳甲=1位+2位+3位+4位+5位
        =音码+1块首笔+1块末笔+2块首笔+2块末笔
2.音码:它是汉字的声母的编码。(详见附表1)
3.笔形码:它是汉字的十种笔形的编码。(详见附表3)
4.独体字问题:独体字不能拆分成两块,它的码长只有三位。即,太阳甲的前三位码。
5.汉字的拆分规则。大多数汉字都可以非常直观的分成两块。但是,也有少数汉字不容易拆分。这就需要按照一定的规则进行拆分。
第一.相离可分,相接可分,相交不分,单笔不成块。
1.相离可分:如,“华”字可以分为“化”和“十”两块。
2.相接可分:如,“示”字可以分为“二”和“小”两块。
3.相交不分:如,“夫”字不能分为“二”和“人”两块。
4.单笔不成块:如,“旦”字不能分为“日”和“一”两块。还有亿,旧,习,乱等都是单块字。按照这个规则,三笔以下的汉字都是单块字。
第二.成字优先,固定搭配优先。
1.成字优先:如,“意”字可以分为“音”和“心”两块。
2.固定搭配优先:如,“寒”字可以分为“
Figure A0113765800051
”和“
Figure A0113765800052
”两块。“寨”字可以分为“
Figure A0113765800053
”和“
Figure A0113765800054
”两块。
第三.相对均匀,先少后多。
1.相对均匀:如,“篡”字可以分为“
Figure A0113765800055
”和“
Figure A0113765800056
”两块。
2.先少后多:如,“参”字可以分为“厶”和“ ”两块。
用太阳甲方案编制的太阳码,其重码率很底。单个汉字的最高重码次数为11,即:只有12个重码字。例如,编码为“64174”的太阳码,它只有12个重码字。
二.太阳乙输入法。太阳乙的码长是六位。它的第一位码是结构码,它的第二至第五位四个码与太阳甲的后四位码相同,它的第六位码是固定码“0”,即:零笔形。
1.太阳乙=1位+2位+3位+4位+5位+6位
        =结构码+1块首笔+1块末笔+2块首笔+2块末笔+零笔
2.结构码:它是汉字九种结构的编码。(详见附表2)
3.零笔形:即,零笔,它的作用是使太阳甲和太阳乙不会有重码。它也为运行各种输入方式不需切换打下了基础。码长不同,可以实现各输入法不需切换。
太阳乙的特征是没有音码。不知道字音的汉字可以方便的输入。在太阳乙中,单个汉字的最高重码次数为18,即:只有19个重码字。例如:编码为“541440”的太阳乙码,它只有19个重码字。
三.太阳丙输入法。太阳丙的码长是四位。它的第一位码是音码,它的第二位码是结构码,它的第三,第四两位码是笔形码。
1.太阳丙=1位+2位+3位+4位
        =音码+结构码+首笔码+末笔码
2.音码:它与太阳甲的音码相同。(详见附表1)
3.首笔码:它是汉字的第一个笔画(单笔画或笔画组合)的编码。(详见附表3)
4.末笔码:它是汉字的最后一个笔画(单笔画或笔画组合)的编码。(详见附表3)
太阳丙的特点是汉字不需要拆分两块。凡是不容易拆分成两块的汉字,它的结构码很容易确定。因此,它可以弥补太阳甲的不足,它是很好的辅助方案。例如:“参,彬”它们的两块都不容易拆分。但是,它们的结构都容易确定。在太阳丙中,单个汉字的最高重码次数是20,即:一共有21个重码字。例如:编码为“5544”和“6534”的两个太阳丙码,都是有21个重码字。
四.太阳词组输入法。太阳甲,乙,丙三种输入法合用一种词组输入法。它可以输入两万五千多条两字,三字和四字常用词组。太阳码没有编制5字以上的词组。词组输入以音码为主。词组码长都是六位。它们的输入规则如下:
1.四字词组=1音+2音+3音+4音+3首+4首
2.三字词组=1音+2音+3音+1首+2首+3首
3.两字词组=1音+2音+1首+2首+1结构+2结构
在规则中,“音”是指音码;“首”是指首笔;“结构”是指结构码。太阳词组输入法,它的词条很多,达两万多条。但是,它的重码率很低,词组的最高重码次数为5,即:只有6个重码词。例如:编码为“448468”的太阳词码,它只有6个重码词。
五.简码字输入法。在常用汉字中,有一些字的使用频度很高,即:高频字。为了简化它们的输入,太阳码编制了十个最常用的高频字的输入法。这十个字的编码用小键盘上的0至9十个数字表示,它们的码长都是一位,即:击一键就可以输入它。具体编码如下:
0   1   2   3   4   5   6   7   8   9
这  人  有  和  的  不  在  是  一  了
六.太阳汉字演示盘。该盘中一共有19个文件。首先,有两个文本文件是演示盘的说明。其次,有3个FOXBASE+语言文件,太阳码的演示程序是用FOXBASE+语言编写的。它需要在此环境下运行。再次,有八个字词库文件。它们分别是三个字库文件及其三个索引文件;一个词库文件及其索引文件。最后,是一套太阳码运行程序文件,一共有6个文件。它们分别是一个总程序文件,三个主程序文件和两个子程序文件。
在演示盘中,重码字词的显示是通过两个子程序(YT1.prg和YT2.prg)实现的。YT1是重码单字显示程序,每屏可以显示十个重码字。YT2是重码词组显示程序,每屏可以显示十个重码词。重码字一屏显示不完时,可以翻页显示。翻页键为:“+”号键是向后翻页;“-”号键是向前翻页。
前面叙述了太阳码的各种输入方式。为了直观的显示各种输入码的特点,后文编制了一张表格,用于它们之间的对比(详见附表4)。下面谈一谈本发明的任务的解决问题。为了使太阳码方便适用,本方案采取了以下四项措施。
第一,编码要素的选取。太阳码所选的字音,结构和笔形,都是汉字的最有代表性的显著特征。这样可以传人们容易掌握太阳码。
第二,一套太阳码优势互补。太阳码有甲,乙,丙三种。人们可以避繁就简,避难从易。从而,使人们输入汉字方便快捷。
第三,太阳丙码长短。它的码长与区位码相同,只有四位。在数码输入法中,它达到了码长最短的极限。可以加快输入速度。
第四,太阳码用途广泛。由于采用的是10键位小键盘,因此,它可以制成硬件芯片,植入固定电话,移动电话,计算器,寻呼机等等使用数字小键盘的机器设备上。方便它们传输汉字信息。
上述措施的实现,使人们可以方便的输入单字或词组。并且适用于各种十键位数字键盘。因此,它充分显示了太阳码的适用性。                                                    附表.1音码键位布局表
    7R零声G偏首    8K    Y     9H    W
    4ZHZ    J    5CHC    Q    6SHS    X
    1P    T     2M    N     3F    L
      0B    D
附表.2结构码键位布局表                                              附表3笔形码键位布局表
 7品字结构  8上下   9独体
 4左品字结构 5右品字结构   6包围
 1多重左右 2单纯左右   3左右包围结构
          0
7正交   8斜交   9半围
4捺笔   5折笔   6全围
1横笔   2竖笔   3撇笔
        0零笔
附表.4典型字词编码举例
 汉字 简码 太阳甲 太阳乙 太阳丙
  的   4 03634  236340   0234
  这   0 44848  648480   4648
  十 67  970   697
  花 97738  777380   9778
  数 64838  448380   6448
  特 13774  537740   1534
  河 94112  341120   9342
  词组   编码   词组   编码   词组   编码
安居乐业 743832 电话机 094247   暗暗 776655
澳大利亚 703831 工程师 756132   啊啊 776611
磋酡岁月 516829 河南省 926472   中国 472696
杞人忧天 578141 计算机 464437   魅力 233869
莺歌燕舞 878973 秦始皇 569883   人民 723999
足智多谋 440234 西安市 676144   我们 923392
自作主张 444449 自然界 474336   座谈 414465

Claims (1)

1.太阳码的适用性体现在它的编码要素的选取方面。
有一些数码输入法,选用汉字的字根为编码要素。由于字根太多,往往是编码规则复杂,码长太长,甚至需要大量记忆各级简码才能方便输入汉字。太阳码选用的字音,结构和笔形三要素,都是汉字最有代表性的显著的特征。人们非常容易掌握。下面简要说明三要素。
汉字的字音是编码要素之一。太阳码把汉字的声母按照汉语拼音方案的规律合理的布局在0至9十个数字组成的小键盘上。规则简单,使用方便。如下所示:
0    1    2    3    4    5    6    7    8    9
B    P    M    F    J    Q    X    G    K    H
D    T    N    L    Z    C    S    R    Y    W
                    ZH   CH   SH
汉字的结构也是编码要素之一。太阳码按照人们通常的划分结构的规则。把汉字的结构区分为九种。即,<1>.多重左右结构,<2>.单纯左右结构,<3>.左品字结构,<4>.右品字结构,<5>.左右包围结构,<6>.上下结构,<7>.品字型结构,<8>.包围结构,<9>.独体结构。这样,使结构码很容易的布局在数字小键盘上,方便人们使用。如下所示:
 1     2     3    4     5    6     7     8    9
多重  单纯  左右  左品  右品  包围  品字  上下  独体
左右  左右  包围  结构  结构  结构  结构  结构  结构
汉字的笔形还是编码要素之一。在传统的五种笔形的基础上,本发明又发现了汉字的四种常用笔画组合的显著特征。即:<1>.正交笔画组合,<2>.斜交笔画组合,<3>.全围笔画组合,<4>.半围笔画组合。五种传统笔形和四种笔画组合构成了汉字的九种基本笔形。另外,再加一种零笔形。十种笔形分别布局在小键盘的0至9十个键位上。如下所示:
 0     1    2     3     4    5     6     7    8     9
零笔  横笔  竖笔  撇笔  捺笔  折笔  全围  正交  斜交  半围
太阳码的字词库文件是编码三要素的特征的具体体现。
CN 01137658 2001-11-01 2001-11-01 汉字数码输入法 Pending CN1357815A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 01137658 CN1357815A (zh) 2001-11-01 2001-11-01 汉字数码输入法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 01137658 CN1357815A (zh) 2001-11-01 2001-11-01 汉字数码输入法

Publications (1)

Publication Number Publication Date
CN1357815A true CN1357815A (zh) 2002-07-10

Family

ID=4674241

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 01137658 Pending CN1357815A (zh) 2001-11-01 2001-11-01 汉字数码输入法

Country Status (1)

Country Link
CN (1) CN1357815A (zh)

Similar Documents

Publication Publication Date Title
CN1258132C (zh) 用于进行字母符号输入的小键盘布局
CN1869892A (zh) 一种中文短语、短句快速输入的方法和系统
CN87100555A (zh) 双笔顺计算机汉字输入方案及其键盘
CN1357815A (zh) 汉字数码输入法
CN1177271C (zh) 四笔号码字词不重输入法及其键盘
CN1147780C (zh) 三笔数码汉字输入方法
CN1034245C (zh) 缅文字型智能四码输入系统
CN1196057C (zh) 一码二形数字编码汉字输入方法
CN1818836A (zh) 快易码数码象形输入法
CN1112629C (zh) 一种汉字和英文的数字小键盘输入方法
CN1266576C (zh) 数码汉语输入方法
CN1178121C (zh) 汉字笔顺部首双重输入方法及系统
CN1120403C (zh) 一种汉字数字编码输入法
CN1188773C (zh) 英文快速输入法
CN1530805A (zh) 中华形码汉字输入系统
CN1142474C (zh) 字典码汉字输入法
CN1043381C (zh) 汉字四笔画数码输入法
CN1195257C (zh) 结构数码汉字输入方法
CN1299995A (zh) 汉字输入法编码方案
CN113253853A (zh) 一种计算机和手机的汉字输入方法
CN1584804A (zh) 数字键盘汉字输入法
CN101034317A (zh) 汉字输入法
CN1068444C (zh) 一种汉字编码输入方法
CN1100288C (zh) 四笔序音计算机汉字键盘输入方法
CN1238780C (zh) 汉语拼音输入法

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication