CN100594469C - 汉字笔码输入法 - Google Patents

汉字笔码输入法 Download PDF

Info

Publication number
CN100594469C
CN100594469C CN200710102878A CN200710102878A CN100594469C CN 100594469 C CN100594469 C CN 100594469C CN 200710102878 A CN200710102878 A CN 200710102878A CN 200710102878 A CN200710102878 A CN 200710102878A CN 100594469 C CN100594469 C CN 100594469C
Authority
CN
China
Prior art keywords
sign indicating
indicating number
pen
chinese character
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN200710102878A
Other languages
English (en)
Other versions
CN101303623A (zh
Inventor
陈新伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN200710102878A priority Critical patent/CN100594469C/zh
Publication of CN101303623A publication Critical patent/CN101303623A/zh
Priority to HK09101532.4A priority patent/HK1121555A1/xx
Application granted granted Critical
Publication of CN100594469C publication Critical patent/CN100594469C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本发明提供一种汉字笔码输入法,其中将汉字视作由至少一线段构成,并将所述线段归为三种单笔码,即横笔、竖笔和斜笔,横笔表示汉字中的横,竖笔表示汉字中的竖和弯钩,斜笔表示汉字中非横非竖线段,通过至少两单笔码组合形成多个结构笔码,结构笔码包括由至少两单笔码相互连接或交叉形成的结合笔码和由至少两单笔码相互撮合形成的撮合笔码,将单笔码、结合笔码和撮合笔码按照不同分组设定于计算机键位,该输入法包括:利用所述结构笔码和单笔码将待输入汉字进行拆分;从所拆分出结构和剩余的单笔码中选取最多三个笔码;及键入所述笔码所对应的键,输入该汉字。

Description

汉字笔码输入法
技术领域
本发明涉及一种汉字输入法,更具体地涉及一种汉字笔码输入法,其按照汉字的字形,对待输入的汉字进行拆分编码,从而输入所需汉字。
背景技术
随着计算机技术的不断发展,人们对于汉字输入法的要求越来越高。近年来,两岸三地的汉字输入法开发者创造出了多种汉字输入法。这些汉字输入法主要分为汉字拼音输入法、汉字字形输入法以及拼音字形混合输入法。汉字拼音输入法是利用汉字的拼音进行编码的方法,其要求使用者掌握标准的汉字发音,否则就无法输入相应的汉字,然而各地方言差异较大,使得某些人士根本无法使用拼音输入法进行快速有效的输入。汉字字形输入法是根据汉字的字形,通过对汉字进行拆分编码,并输入与所取码相对应的键以进行汉字输入。使用范围较广的汉字字形输入法包括“仓颉”输入法和“五笔”输入法。然而,这两种输入法存在以下缺点:均比较难学,需要长期训练方能掌握,而且容易遗忘;每个汉字需要输入4-5个码,非专业人士无法进行快速输入;不易进行繁简体字交替输入。
从而,令人遗憾的是,迄今为止尚无一种汉字输入法,能够如同输入英文那样自然流畅,以供人们方便地使用。如果一种汉字输入法能够达到以下条件,则其就已经接近英文输入:易学不易遗忘;只需26个或更少的输入键;贯通繁简两种中文字体;每个汉字只需三键即可输入;选字率在2%以下。
发明内容
针对现有技术中存在的上述问题,本发明提出了一种新颖的汉字笔码输入法,其特征在于,将每个汉字视作由至少一个线段构成,并将所述线段归为三种单笔码,即横笔、竖笔和斜笔,其中横笔表示汉字中的横,竖笔表示汉字中的竖和弯钩,斜笔表示汉字中非横非竖的线段,通过至少两个单笔码相互组合而形成多个结构笔码,所述结构笔码包括由至少两个单笔码相互连接或交叉形成的结合笔码和由至少两个单笔码相互撮合形成的撮合笔码,将所述单笔码、结合笔码和撮合笔码按照不同的分组设定在计算机键位上,该输入法包括步骤:利用所述结构笔码和单笔码对待输入汉字进行拆分,并根据从各个汉字中拆分出的结构的数量,将汉字分为单结构形式字、双结构形式字、多结构形式字以及无结构字,所述结构为所述汉字中由一个结构笔码构成的组织或者由相互连接或交叉的多个结构笔码构成的组织;从该汉字中所拆分出结构和剩余的单笔码中选取最多三个笔码;以及键入所述最多三个笔码所对应的键,从而输入该汉字。
优选地,对所述多结构形式字进行输入的步骤包括:按照从上到下、从左到右和从外到内的顺序将该多结构形式字中的第一结构、第二结构和末结构拆分出来;依次将所述第一结构、第二结构和末结构中的头码作为该汉字的第一、第二和第三码;和依次键入表示所述第一、第二和第三码的结构笔码所对应的键,从而输入该多结构形式字。
优选地,对所述双结构形式字进行输入的步骤包括:按照从上到下、从左到右和从外到内的顺序确定该双结构形式字中的第一结构和第二结构;依次将所述第一结构和第二结构的头码作为该汉字的第一和第二码,并且在该汉字中存在剩余的笔码的情况下,依次将所述第一结构或第二结构的次码或者该汉字中按照从上到下、从左到右和从外到内的顺序选取的剩余单笔码作为该汉字的第三码;和依次键入表示所述第一和第二码的结构笔码所对应的键和/或表示所述第三码的结构笔码或单笔码所对应的键,从而输入该双结构形式字。
所述单结构形式字包括单笔单码单结构形式字和普通单结构形式字,所述单笔单码单结构形式字由单个结构笔码和单个单笔码构成,所述普通单结构形式字为除单笔单码单结构形式字之外的其他包含单个结构的字。
对所述单笔单码单结构形式字进行输入的步骤包括:对该汉字中所包括的两个笔码按照从上到下、从左到右和从外到内的顺序取码;和依次键入所述结构笔码和单笔码所对应的键,从而输入该单笔单码单结构形式字。
对所述普通单结构形式字进行输入的步骤包括:将所述普通单结构形式字的结构中的头码作为第一码,并在该汉字中存在剩余的笔码的情况下,依次将所述结构中的次码、第二次码或者按照从上到下、从左到右和从外到内的顺序选取的该汉字中剩余的单笔码作为该汉字的第二码和/或第三码;和依次键入表示所述第一、第二和/或第三码的结构笔码或单笔码所对应的键,从而输入该普通单结构形式字。
对于所述无结构字,则直接键入该无结构字中的笔码所对应的键即可输入该无结构字。
本发明的输入法的拆字取码方法简单,使得初学者容易学会,而且不易遗忘。另外,本发明的输入法最多取三码即可输入一个汉字,从而可以有效提高汉字的输入速度。此外,本发明的拆字取码方法可以有效的降低重码率,从而可以将选择率控制在1%左右。
附图说明
下面参照附图详细描述本发明,其中:
图1示出根据本发明原理构造出的笔码的一个示例;
图2示出本发明所选取的组合的一个示例。
具体实施方式
汉字具有横平竖直、方方正正的特点。每个汉字是由笔划构成的,所述笔划包括横、竖、撇、捺、点、提、弯钩等。传统汉字输入法通常采用这些笔划作为基本单元,而对汉字进行拆分编码。然而,本发明根据汉字横平竖直的特点,突破了汉字中笔划的限制,而将每个汉字看成由横、竖和斜三种线段组成,并将这三种线段称之为单笔码,即横笔、竖笔和斜笔。横笔表示汉字中的笔画“横”;竖笔表示汉字中的笔画“竖”和“弯钩”;而斜笔表示汉字中非横非竖的线段,例如撇、捺、点、提、斜钩、
Figure C20071010287800091
钩等。在这三个单笔码的基础上,通过这些单笔码相互连接(即,一个单笔码连接于另一单笔码但并不相互横穿后者)、交叉(即,至少两个单笔码相互横穿)或者撮合(即,各单笔码聚集在一起但不互相连接或交叉),而形成多组结构笔码。通过将所述单笔码和结构笔码设置在相应的键位上,按照后面详述的拆字取码方法即可对汉字进行输入。
图1示出了根据本发明的笔码的示例。
除了笔码中特别指明的之外,在利用本发明的笔码进行汉字拆分取码时,无需考虑笔码的长短以及实际汉字书写中两笔码之间的圆弧连接,也不需要考虑斜笔的倾斜方向,并且不考虑各个笔划末端的钩。
在图1的示例中,本发明的笔码主要分为单笔码和结构笔码。结构笔码包括结合笔码、撮合笔码、变换笔码和特定笔码,其中结合笔码是由多个单笔码连接或交叉而形成的笔码的统称;撮合笔码是由多个单笔码撮合而形成的笔码;变换笔码是对基本码进行变化而得到的;特定笔码是对汉字中较常出现的部分进行固化,而形成的一种笔码;其中单笔码、结合笔码和撮合笔码组成基本码,其可以用于对任何汉字进行拆字编码,而变换笔码和特定笔码主要用于减少汉字编码的重码率。下面首先对基本码进行说明。
在本示例中,所有笔码被分成26组,这26组可以分别设定于计算机键盘的26个键位上,例如,按顺序分别设定于A-Z这26个键位上,但是,其也可以按照不同的次序设定于A-Z字母键上或者其他键位上。下文将以按顺序设定于A-Z键位上为例进行说明。应当注意,图1的码表中的笔码应当理解为分别代表同一类型的笔码,即部分笔划线段长短、斜向以及是否带钩,而并非仅仅代表其自身所显示出的笔码形式。从而,以下利用文字表述出各笔码所代表的笔码类型。
第一组设定于A键上,包括撮合笔码儿、小,其中的笔码儿表示斜笔、竖笔和横笔相撮合,而横笔和竖笔之间利用圆弧进行连接,其也用以表示笔码ル;而笔码小则表示竖笔与分别位于其两侧斜笔相撮合。笔码儿、ル是固化的笔码,其不受汉字中与其相连接或交叉的线段的影响,也不影响其他笔码的构成,并且其可以与其他单笔码组成暗码(稍后将对暗码进行介绍),例如,从“光”、“西”或“凡”字中均能拆出笔码儿,从“耀”中能拆出笔码ル。
第二组设定于B键上,其包括:结合笔码
Figure C20071010287800101
表示两斜笔相交叉;和撮合笔码八,表示两斜笔相撮合,该笔码八也可以表示两同向倾斜的斜笔相撮合。
第三组设定于C键上,其包括:结合笔码
Figure C20071010287800102
表示横笔和向右倾斜的斜笔交叉;和撮合笔码
Figure C20071010287800103
Figure C20071010287800104
表示横笔或竖笔与位于其同一侧的两斜笔相撮合。
第四组设定于D键上,其包括:结合笔码
Figure C20071010287800105
(表示横笔与向左倾斜的斜笔交叉)、艹(表示横笔与两平行竖笔交叉);和撮合笔码匕(表示竖笔与位于其同一侧的斜笔和横笔撮合,其中竖笔与横笔通过圆弧连接)。
第五组设定于E键上,其包括:结合笔码
Figure C20071010287800106
表示竖笔与斜笔交叉;和撮合笔码亠、
Figure C20071010287800111
表示竖笔或横笔与斜笔相撮合。
第六组设定于F键上,其包括:结合笔码丆、
Figure C20071010287800112
表示斜笔连接于横笔或竖笔而不横穿横笔或竖笔亦非端部相连,此笔码也用以表示笔码
Figure C20071010287800113
和撮合笔码二,表示两横笔相撮合。
第七组设定于G键上,其包括:结合笔码,表示横笔连接于斜笔而不横穿斜笔亦非端部相连,此笔码也用以表示笔码
Figure C20071010287800114
和撮合笔码表示两竖笔相撮合。
第八组设定于H键上,其包括:结合笔码亻、
Figure C20071010287800116
表示竖笔连接于斜笔而不横穿斜笔亦非端部相连,此笔码也用以表示笔码
Figure C20071010287800117
和撮合笔码三,表示三横笔相撮合。另外,竖笔下端带右钩即当作笔码
Figure C20071010287800118
第九组设定于I键上,其包括结合笔码
Figure C20071010287800119
表示横笔与竖笔端部相连接,而竖笔在横笔左端。
第十组设定于J键上,其包括结合笔码
Figure C200710102878001110
扌,其中
Figure C200710102878001111
表示横笔与竖笔端部相连接,而竖笔在横笔右端,扌表示竖笔与一横笔和一斜笔相交叉。
第十一组设定于K键上,其包括结合笔码
Figure C200710102878001112
∧,表示两斜笔中部或端部相连接。
第十二组设定于L键上,其包括结合笔码
Figure C200710102878001113
其表示横笔或竖笔与斜笔端部相连接而不横穿斜笔。
第十三组设定于M键上,其包括结合笔码⊥(表示竖笔从上侧连接于横笔而不横穿横笔,亦非端部相连)、
Figure C200710102878001114
(表示横笔从右侧连接于竖笔而不横穿竖笔,亦非端部相连)、丰(竖笔与并排设置的三横笔交叉)、
Figure C200710102878001115
(横笔与并排设置的三竖笔交叉)。
第十四组设定于N键上,其包括结合笔码T(表示竖笔从下侧连接于横笔而不横穿横笔,亦非端部相连)、
Figure C200710102878001116
(表示横笔从左侧连接于横笔而不横穿横笔,亦非端部相连)、
Figure C200710102878001117
(表示竖笔与并排设置的两横笔交叉)。
第十五组设定于O键上,其包括结合笔码口,表示两横笔和两竖笔端部相连接而形成“口”字形。
第十六组设定于P键上,其包括:结合笔码表示“口”字形笔码中任一竖笔长出;和撮合笔码
Figure C200710102878001119
表示四个斜笔相撮合,其中
Figure C200710102878001120
Figure C200710102878001121
为一长三短四个斜笔相撮合,
Figure C200710102878001122
表示四短斜笔相撮合,其中的虚线并不属于该笔码本身,而仅表示该字中的其他笔码。同样,附图中其他笔码的虚线也不包括在相应笔码中,而仅表示该汉字中的其他笔码。
第十七组设定于Q键上,其包括结合笔码
Figure C20071010287800121
表示“口”字形笔码中任一横笔长出。
第十八组设定于R键上,其包括结合笔码尸、
Figure C20071010287800122
表示将“口”形笔码中的一竖笔或横笔替换成斜笔,而该斜笔向外长出。
第十九组设定于S键上,其包括撮合笔码氵、
Figure C20071010287800123
表示任意三个斜笔相撮合。
第二十组设定于T键上,其包括结合笔码十,表示横笔与竖笔交叉。
第二十一组设定于U键上,其包括:单笔码一,表示横笔;和撮合笔码
Figure C20071010287800124
表示横笔和竖笔以圆弧连接。
第二十二组设定于V键上,其包括结合笔码日、其中的笔码日是由“口”形笔码及其内部的一横笔而形成的“日”字形笔码,
Figure C20071010287800126
是“日”形笔码中任一竖笔长出形成的笔码。
第二十三组设定于W键上,其包括:单笔码I,表示竖笔;和撮合笔码冖(表示横笔与左端的点相撮合)、
Figure C20071010287800127
(表示竖笔与其顶端的点相撮合)。这两个撮合笔码不允许与汉字中的其他线段形成连接,否则不形成该撮合笔码。
第二十四组设定于X键上,其包括结合笔码
Figure C20071010287800128
表示有横笔与相交叉的两斜笔相连接。
第二十五组设定于Y键上,其包括单笔码丿,表示斜笔,在此情况下,该笔码对于斜笔的倾斜方向、长短没有限制,从而该笔码可以表示撇、捺、点、提、斜钩、
Figure C20071010287800129
钩等。
第二十六组设定于Z键上,其包括结合笔码大,表示横笔与相连接的两斜笔交叉而形成“大”字形笔码,其中不交叉的斜笔可以是“捺”或“点”。
以上利用三种单笔码形成结合笔码或撮合笔码的方式仅是示例性的,在将汉字字形拆分成上述三个最小构字单元,即横笔、竖笔和斜笔的基础上,可以按照不同的连接、交叉或撮合的方式形成结合笔码或撮合笔码,从而这些单笔码、结合笔码和撮合笔码组成的基本码就可以实现对汉字进行拆分编码。
为了减少拆字取码中产生的重码率,可以对以上形成的基本码进行变化,而形成变换笔码,如图1中所示,变换笔码的主要变化形式包括:
a)笔码在汉字中的位置不同而产生的变化,例如,(U),表示“口”字形笔码将其他笔码包含在其内部,其中的虚线表示该字的其他笔码,而并非该笔码本身;(V),表示“口”形笔码位于其他笔码之上;
Figure C20071010287800133
(R),表示“日”形笔码位于其他笔码之下。上述以及下文中笔码后的括号内的字母表示该笔码所处键位。
b)取次码替代,其中又包括两种形式,即,表示该该次码的笔码不包括在该笔码之中的形式,例如,
Figure C20071010287800134
(J)、(J)(其中虚线表示的笔码不包括在该笔码中,而成游离笔码,此两码只允许其斜笔有连接);和表示该次码的笔码包括在该笔码中,例如,
Figure C20071010287800136
(L)、
Figure C20071010287800137
(M)、
Figure C20071010287800138
(I)。
c)原码延伸,例如,
Figure C20071010287800139
(C)、
Figure C200710102878001310
(C)、九(C)、(G)、
Figure C200710102878001312
(I)、
Figure C200710102878001313
(I)、卩(I)、广(L)、宀(W)、
Figure C200710102878001314
(M)、
Figure C200710102878001315
(M)、
Figure C200710102878001316
(T)、
Figure C200710102878001317
(U)和乙(U),其中,笔码卩的内部不允许有其他笔码。
d)组合影响,例如,
Figure C200710102878001318
(X)、(X),其中的下标表示该笔码在拆字时的编码顺序,即,该笔码只有被取为首码时才成为成立,所谓首码是指一个汉字的编码中第一码,即该二组合的头码(K)和“”(G)分别改取为X。如果组合钅没有处于一个汉字的首码位置,则该二组合的头码复取
Figure C200710102878001321
(K)和“”(G),次码取
Figure C200710102878001322
(R)。
e)连接影响,例如,(R)、
Figure C200710102878001324
(W)、
Figure C200710102878001325
(W)、
Figure C200710102878001326
(A)、
Figure C200710102878001327
(R)、(X)、
Figure C200710102878001329
(X)、
Figure C200710102878001330
(X)、(Y)、
Figure C200710102878001332
(Z)、
Figure C200710102878001333
(Z)、
Figure C200710102878001334
(Z)、(Y)、
Figure C200710102878001336
(Y)、
Figure C200710102878001337
(Y)、
Figure C200710102878001338
(R)、
Figure C200710102878001339
(R)、
Figure C200710102878001340
(R)、
Figure C200710102878001341
(U)(U)、
Figure C200710102878001343
(U)。其中,
Figure C200710102878001344
(Y)、
Figure C200710102878001345
(Y)、
Figure C200710102878001346
(Y)与
Figure C200710102878001347
(U)
Figure C200710102878001348
(U)、(U)之间的不同之处在于,前三个笔码上部连接于斜笔,后三个笔码上部连接于横笔,其优先于其他变换笔码。笔码表示交叉笔另有任意连接。笔码
Figure C200710102878001351
只有在被取为首码或者第二码时才成立。汉字中,笔码
Figure C200710102878001352
之下的线段允许与这些笔码的下端中部形成连接,其中笔码
Figure C200710102878001353
的二横笔之间不允许存在其他笔码。
笔码中设定若干个特定笔码是为了取码方便、简化结构并减少重码字。本示例中的特定笔码包括:
Figure C200710102878001354
(A)、示(C)、
Figure C200710102878001355
(I)、言(I)、月(M)、(P)、上(P)、
Figure C200710102878001356
(P)、目(Q)、罒(Q)、
Figure C200710102878001357
(Q)、
Figure C200710102878001358
(Q)、(R)、万2.3(R)、于(R)、
Figure C200710102878001360
(U)、
Figure C200710102878001361
(U)、王(W)、壬(W)、讠(W)、田(X)、彳(Y);其中,笔码中“工”两侧的点并不是笔码本身的组成部分,而仅表示其可与其他笔码端部相连接,而且其下侧的线段允许与该笔码的下端中部形成连接;同样,
Figure C20071010287800141
Figure C20071010287800142
侧部的点也仅表示该笔码只可以与其他笔码端部相连接,而不是笔码本身的组成部分。其中,笔码万2.3只有在取为第二码或第三码时才成立,并只允许其中横笔有连接。
除了以上的特别规定之外,笔码
Figure C20071010287800143
于、讠、彳、冖不允许与其所构成的汉字中的其他线段相连接,否则不形成此笔码。另外,笔码儿、九、七、言、广、上、万、乙、田、工可以单独形成汉字,但是对这些汉字取码时,并非取这些笔码表示,而应当对这些汉字进一步拆分取码。
利用上述结构笔码和单笔码对待输入汉字进行拆分,并根据从各个汉字中拆分出的结构的数量,将汉字分为单结构形式字、双结构形式字、多结构形式字以及无结构字,所述结构为所述汉字中由一个结构笔码构成的组织或者由相互连接或交叉的多个结构笔码构成的组织,其中撮合笔码也可以形成一个结构。单结构形式字包括例如“少”字,其中包括由结构笔码小构成的一个结构;又如“云”字,其中包括由结构笔码丆构成的一个结构。双结构形式字包括例如“吕”字,包括由结构笔码口构成的两个结构;“动”字由左右排列两个结构笔码(丆和力)构成两个结构。多结构形式字包括例如“曼”字,其由三个结构笔码(日、罒、又)构成三个结构;“漫”字由四个结构笔码(氵、日、罒、又)构成四个结构。无结构字包括,例如,“一”、“1”、“丶”以及“丿”等。
如果一个结构中存在多个结构笔码,它们就存在明码和暗码之分,明码和暗码是明结构笔码和暗结构笔码的简称。
所谓明码是在该结构中存在足够的线条而拆分出的结构笔码,其可以是结合笔码、撮合笔码、变换笔码或特定笔码。所谓暗码是先取完明码后剩余的线段(即,游离笔)与原明码中的线段交叉或连接而形成的结合笔码,或者是游离笔与同部位或相邻的独立笔码撮合成的撮合笔码,从而暗码只包括基本码,而不包括任何变换笔码或特定笔码。
为了拆字取码方便,除汉字中撇的下端和竖笔上端连接构成笔码
Figure C20071010287800145
(L)之外,可以将汉字中的撇的下端以及提和捺的上端视为不与横笔或竖笔相连接,例如:汉字“危”,可以将其中的笔码ク与视为相互分离而不彼此连接。又如,汉字“北”,可以将其中的单笔码/视作与笔码
Figure C20071010287800147
相互分离,此外,汉字中的点只与独立斜笔交叉或连接构成笔码外,其不再构成任何结构笔码。
对于汉字中的组织
Figure C20071010287800151
一旦这些组织与其他笔码组码,则将它们视为一斜笔。例如,将汉字“斤”中除了竖笔之外部分视作笔码。
对于包括“口”形的笔码,例如,口(O)或
Figure C20071010287800152
(U),其本身不与其他笔码进行组码,也不影响其他笔码组码,而其“口”形内部的笔码与外部的笔码如果相交叉,则该内部结构和外部结构可以形成组合(稍后将对组合进行说明)。例如,汉字“惠”,其包括结构笔码
Figure C20071010287800153
对于包括“口”形的笔码以及笔码其内部结构在取为2、3码时当作组合并按照逆序取码。例如,汉字“姻”,按次序取笔码
Figure C20071010287800156
大、口进行表述,其中的笔码大和口就是按照逆序选取的笔码。稍后将对取码次序进行详细说明。
对于通过将“口”形码或“日”形码中的一笔长出而形成的笔码,其中长出的一笔不与其他笔码组码,但是如果其与其他结构相结合则当作组合。例如,汉字“局”,取笔码尸、口和
Figure C20071010287800157
表示;又如,汉字“卧”,取笔码
Figure C20071010287800158
和ㄒ表示。
汉字中的组织
Figure C20071010287800159
其中的撮合是暗码,另外,诸如汉字“来”、“未”、“耒”中的“∧”是暗码。
笔码“口”、“日”“目”和“尸”在与笔码“上”结合时,其本身形成暗码。例如,汉字“战”,取笔码上、和口表示;又如“卓”,取笔码上、十和日表示。
本发明的取码原则在于取完结构笔码再取剩余的单笔码,每个汉字最多取三个笔码,作为该汉字的第一码、第二码和/或第三码来表述该汉字,然后输入表示该第一码、第二码和/或第三码的笔码对应的键,即可输入相应汉字。拆取交叉而成的结合笔码及撮合笔码时,均按照从上到下、从左到右和从外到内的顺序以包含线段更多者为先。下面按照汉字的结构详细说明拆字取码方法。
1.对于由三个或更多结构构成的多结构形式字
按照从左到右、从上到下、从外到内的顺序,于第一、第二结构中各取其头码作为该汉字的第一和第二码,第三笔码于末结构(最右下方的结构)中取其头码作为该汉字的第三码。例如,“做”字可以拆分为三个结构,即,亻、古、攵,对第一和第二结构亻、古分别取头码为亻和十,按H、T键,对末结构攵取头码为
Figure C20071010287800161
按X键,从而按HTX键输入“做”字;“新”字可以拆分为三个结构,即,
Figure C20071010287800162
于、斤,对第一和第二结构
Figure C20071010287800163
于分别取头码为亠
Figure C20071010287800164
和于,按E、R键,对末结构斤取头码为,按G键,从而按ERG键输入“新”字。对于繁体字“歡”,可以其拆分为五个结构,即,艹、口、口、隹、欠,其中第一、第二结构和末结构分别为艹、口和欠,对第一结构取头码艹(D),对第二结构取头码口(O),对末结构取头码(G),从而按DOG键输入该繁体字。
如果多结构汉字中的末结构是由撮合笔码构成,则采用逆撮合的方式(即,自右至左、由下至上)选取码,以包含线段更多者为先。例如,“添”字可以拆分为三个结构,即,氵、天、
Figure C20071010287800165
其中的末结构由撮合笔码构成,它采用逆撮合的方法取码
Figure C20071010287800166
(C),因此按SUC键输入该汉字。
2.对于由上下、左右或者内外结构构成的双结构形式字
按照从左到右、从上到下、从外到内的顺序,于每个结构中取其头码作为该汉字的第一和第二码,第三码回头取第一结构的次码,如果第一结构中的笔码已经取尽,则取第二结构的次码,如果两个结构均已取尽,则按照从上到下、从左到右和从外到内的顺序取剩余的单笔码作为该汉字的第三码,如果该汉字中也不存在其他单笔码,则利用两码即可确定相应的汉字。
例如,“各”字可以拆成两个结构,即,夂、口,对这两个结构分别取头码又(X)和口(O)作为该汉字的第一和第二码,第三码回头取第一结构的次码(G),该次码为第一结构中剩余的笔码与已被取码的部分形成的暗码,从而按XOG输入该汉字。
又如,“胡”字可以拆成两个结构,即,古、月,对这两个结构分别取头码为十(T)和月(M),第三码取第一结构的次码口(O),从而按TMO输入该汉字。
又例如,“劣”字可以拆成两个结构,即,小、
Figure C20071010287800167
对这两个结构分别取头码小(A)和
Figure C20071010287800168
(J),第三码回头按照从上到下、从左到右和从外到内的顺序取单笔码丿(Y),因此按AJY键输入该汉字。
3.对于单结构形式字,单结构形式字中包括:单笔单码单结构形式字,其由单个结构笔码和单个单笔码构成;和普通单结构形式字,其可以由单个结构笔码构成、由单个结构笔码和多个单笔码构成、由相互连接或交叉的多个结构笔码构成、或者由相互连接或交叉的多个结构笔码和一个或多个单笔码构成。
对于单笔单码单结构形式字,对于该汉字中所包括的两个笔码按照从上到下、从左到右和从外到内的顺序取码。
例如,“少”字为由结构笔码小(A)和单笔码丿(Y)构成的单笔单码单结构形式字,对这两个笔码按照从上到下的顺序取码,从而按AY键确定该汉字。
又如,“文”为由单笔码丶(Y)和结构笔码
Figure C20071010287800171
(X)构成的单笔单码单结构形式字,对这两个笔码按照从上到下的顺序取码,从而按YX确定该汉字。
如果一个汉字仅拆出单个笔码或者两笔码,为了输入该汉字,可以在键盘上设置一个确认键,当按下该单个笔码或两个笔码对应的键而确定待输入的汉字后,按一次确认键即可输入该汉字。该确认键也用于对由单码确定的汉字进行确认输入。
对于普通单结构形式字,则是取完结构笔码后依次从上到下、从左到右和从外到内的顺序取单笔码。
例如,“卞”字,先取结构笔码
Figure C20071010287800172
(N),然后取剩余的两单笔码丶(Y)和丶(Y),从而按NYY键输入该汉字。又如,“巴”字,先取结构笔码
Figure C20071010287800173
(P),然后依次取单笔码I(W)和一(U),从而按PWU即可输入该汉字。
又如,“为”字,先取结构笔码
Figure C20071010287800174
(J),然后取结构暗码
Figure C20071010287800175
(E),最后取单笔码丶(Y),从而按JEY键输入该汉字。
对于无结构字,则仅需要键入该汉字的笔码所对应的键即可输入该汉字,例如,“一”(U)、“丿”(Y)。
以上所述的头码和次码表示一个结构中取码的先后次序。在双结构形式字或多结构形式字中,如果一个结构中存在两个或更多结构笔码,则首选的笔码称为头码,如果需要,取完其他结构的笔码后回头从前一结构中选取的笔码称为次码。另外,在普通单结构形式字中也可能存在头码、次码以及第二次码。本发明对于一个结构中的头码和次码的取码次序为:先取明码,取尽明码后再取暗码。
如果一个结构中存在多个明码,则按照以下优先级取明码:
第一优先级明码为由单笔码交叉形成的结构笔码、包含“口”形笔码或“日”形笔码的基本码、前两者的变换笔码、特定笔码。例如,“子”字,先取交叉码十(T),再取笔码
Figure C20071010287800181
(L),从而按TL键加确认键就可输入该汉字。又如“秦”字,首先取第一结构
Figure C20071010287800182
中的头码,即交叉码
Figure C20071010287800183
(C),然后取第二结构禾中的头码,即交叉码
Figure C20071010287800184
(Y),最后回头取第一结构中的次码,即撮合暗码二(F),从而按CYF输入该汉字。
第二优先级明码为含有斜笔的中间连接笔码,不包括两斜笔中间连接。例如,“表”字,先取属于第一优先级的交叉码
Figure C20071010287800185
(N),然后取属于第二优先级的笔码丆(F),最后取属于第二优先级的笔码
Figure C20071010287800186
(H),从而按NFH即可输入该汉字。
第三优先级明码为除了上述笔码之外的其他明码,包括两斜笔中间连接。
在对相同优先级的明码取码时,按照从左到右、从上到下和从外到内的顺序进行。
如果一个结构中存在多个暗码,则按照从上到下、从左到右和从外到内的顺序先取由最多单笔码构成的笔码,如果构成结构笔码的单笔码数量相同,则先取结合笔码,后取撮合笔码。例如,“津”字,先取第一结构的笔码,该笔码为明码氵(S),然后取第二结构中的明码
Figure C20071010287800187
(M),最后取第二结构中的暗码
Figure C20071010287800188
(N),从而按SMN键即可输入该汉字。
另外,撮合暗码允许相隔一单笔码撮合,例如对“亦”字取码时,其下部
Figure C20071010287800189
可以视作一斜笔丿间隔在撮合笔码小(A)中,从而可以将该部分的笔码取为小(A),从而按FAY键即可输入“亦”字。
为了进一步降低重码率,可以在以上笔码的基础上形成多种组合,每个组合由至少一个结构笔码形成,可以分为部首组合和普通组合,其中的部首组合可以选取繁简体汉字中通常采用的部首或者其他结构,而普通组合可以选取繁简体汉字中较常出现的结构。图2示出了本发明所选取的组合的一个示例。每个组合在取码过程中可以视作一个结构,其本身的取码与各个汉字的取码方式相同,但是它们会影响取码次序,而并不影响笔码本身。一个组合中可以允许另有组合。另外,如有组合重叠时,依从上到下、从左到右和从外到内的顺序决定组合的先后,若处于字末则要“逆组”。例如,“凉”字中的组合“京”中另有组合
Figure C200710102878001810
故取码次序为“亠”、“小”和“口”。又如,“兢”字,左边“克”顺取组合“古”,右边“克”处于字末,从而逆取组合“兄”,故对“兢”字取码为“十”、“儿”和“口”。图2的组合表中的“享”字例外,其不设组合
Figure C200710102878001811
故以
Figure C20071010287800191
进行表示。如上文所述,除了图2的组合表中示出的之外,还可以设定“口”形笔码的内部结构和外部结构在相互交叉的情况下,视为组合。另外,与“口”形笔码长出的笔码相连接的结构也可以视为组合。
如果在拆字取码过程中考虑组合,则取码的先后次序为:明码→暗码→独立或游离的单笔码→不在首码位的部首组合的次码→在首码位的部首组合的次码。
例如,简体字“鲜”,其中包括两个部首组合,即,
Figure C20071010287800192
羊,该字的首码取部首组合
Figure C20071010287800193
中的笔码ク(G),第二码取部首组合羊中的笔码八(B),而第三码则取剩余的斜笔丿(Y),从而按GBY键即可输入该简体字。
然而,对于上述简体字所对应的繁体字“鮮”,其包括两个部首组合,即,魚、羊,该繁体字的首码和第二码与上述简体字相同,然而,该繁体字的第三码却不能在部首组合魚中选取,因为该部首组合是位于首码位的部首组合,其取码次序排在最后,只能该其他所有笔码均以取完,即无其他笔码可取的情况下进行选取。从而,该繁体字的第三码只能从不在首码位的部首组合羊中选取,即选取笔码
Figure C20071010287800194
(N),从而,按GBN键即可输入该繁体字。
又如,“钋”字,其包括部首组合钅和一个结构
Figure C20071010287800195
该汉字的首码和第二码分别取笔码(X)和
Figure C20071010287800196
(E),其第三码没有别的笔码可取,只能取部首组合钅中的次码
Figure C20071010287800197
(R),从而按XER键即可输入该汉字。又如,“轨”,其包括部首组合
Figure C20071010287800198
和一个结构九,该汉字的首码和第二码分别取笔码
Figure C20071010287800199
(C)和九(C),其第三码没有别的笔码可取,只能取部首组合
Figure C200710102878001910
中的次码扌(J),从而按CCJ键即可输入该汉字。
本发明也可以利用数字键进行汉字输入。以附图1所示的笔码为例,将各组笔码分别利用两位数字键来表示,例如第一组笔码用01表示,第二组用02表示,依次类推,第十组笔码用10表示,第二十六组用26表示。从而,通过按6次数字键、或者,按4次或2次数字键和1次确认键就可以输入一个汉字。以前面所举的“做”字为例,需按082024六个数字键就可以输入该汉字。上述编码中的首位0可以去除,从而仅需输入82024即可输入该汉字。
以上利用两位数字键表示一组笔码仅是示例性的,可以利用任何数字键或者数字键的组合来表示一组笔码。本发明也可以将所述笔码按照不同组别而设置在不同的字母键和数字键,以进行字母数字混合编码。同样,所述笔码也可以设置在其他非字母或数字的键位上。
由于本发明的各组笔码可以设置在键盘的任意键位上,从而本发明的输入法也可以作为密码来使用。当通信双方知道键盘上键位所表示的笔码组别时,接收方就可以根据对方发出的笔码编码来还原信息。
本发明的输入法在三种基本单笔码的基础上形成多组基本码,并且在基本码的基础上进行变化而形成变形码,从而本发明的笔码规律性强,不容易忘记。只需熟记基本码加上认识变形码就可以对任何汉字进行编码输入。
本发明输入法的拆字取码规则简单明了,不会出现编码重叠交叉的问题,初学者易学易用,而无需进行长时间的训练。
本发明的输入法最多需要三键即可输入一个汉字,从而,其输入速度快、操作方便,使得利用计算机写作、编辑更加容易。另外,可以对中文中的常用成语和固定短语进行压缩编码,只需键入成语或短语中每个汉字的第一码就可以输入整个成语或短语,这就进一步提高了汉字输入速度。
本发明可以根据重码汉字的使用频率,对这些汉字进行排列,从而在键入最多三个键后,使用频率最高的汉字将得以输入,而无需选字。如果希望输入该组重码汉字中使用频率较低的汉字,则仅需按确认键就可以按照使用频率从高到低的顺序对相关汉字进行选择。由于在常用字中每一组编码中重码汉字的数量不超过三个,从而在需要选字的情况下,仅需要按一到两次确认键即可输入相应汉字。从而,使用本发明的方法进行汉字输入,在7000个常用繁简体字中由5700个无需进行选字,从而可将选字率控制在1%左右。
按照本发明的输入法可以按照相同的拆字取码方法对简体和繁体进行输入,而无需任何形式繁简体转化,从而实现了贯通繁简体的效果。
尽管参照优选的实施例描述了本发明,但本发明并不限于此,本领域的普通技术人员在不脱离本发明的精神和范围的前提下,可以对本发明进行各种改进和变形。

Claims (8)

1.一种汉字笔码输入法,其特征在于,将每个汉字视作由至少一个线段构成,并将所述线段归为三种单笔码,即横笔、竖笔和斜笔,其中横笔表示汉字中的横,竖笔表示汉字中的竖和弯钩,斜笔表示汉字中非横非竖的线段,通过至少两个单笔码相互组合而形成多个结构笔码,所述结构笔码包括由至少两个单笔码相互连接或交叉形成的结合笔码和由至少两个单笔码相互撮合形成的撮合笔码,所述撮合是指各单笔码聚集在一起但不互相连接或交叉,该输入法包括步骤:
将所述单笔码、结合笔码和撮合笔码按照不同的分组编码在计算机键位上,
利用所述结构笔码和单笔码对待输入汉字进行拆分,并根据从各个汉字中拆分出的结构的数量,将汉字分为单结构形式字、双结构形式字、多结构形式字以及无结构字,所述结构为所述汉字中由一个结构笔码构成的组织或者由相互连接或交叉的多个结构笔码构成的组织;
从该汉字中所拆分出结构和剩余的单笔码中选取最多三个笔码;以及
键入所述最多三个笔码所对应的键,从而输入该汉字,
其中,
对所述多结构形式字进行输入的步骤包括:
按照从上到下、从左到右和从外到内的顺序将该多结构形式字中的第一结构、第二结构和末结构拆分出来,
依次将所述第一结构、第二结构和末结构中的头码作为该汉字的第一、第二和第三码,和
依次键入表示所述第一、第二和第三码的结构笔码所对应的键,从而输入该多结构形式字;
对所述双结构形式字进行输入的步骤包括:
按照从上到下、从左到右和从外到内的顺序确定该双结构形式字中的第一结构和第二结构,
依次将所述第一结构和第二结构的头码作为该汉字的第一和第二码,并且在该汉字中存在剩余的笔码的情况下,依次将所述第一结构或第二结构的次码或者该汉字中按照从上到下、从左到右和从外到内的顺序选取的剩余单笔码作为该汉字的第三码,和
依次键入表示所述第一和第二码的结构笔码所对应的键和/或表示所述第三码的结构笔码或单笔码所对应的键,从而输入该双结构形式字;
所述单结构形式字包括单笔单码单结构形式字和普通单结构形式字,所述单笔单码单结构形式字由单个结构笔码和单个单笔码构成,所述普通单结构形式字为除单笔单码单结构形式字之外的其他包含单个结构的字,
对所述单笔单码单结构形式字进行输入的步骤包括:
对该汉字中所包括的两个笔码按照从上到下、从左到右和从外到内的顺序取码,和
依次键入所述结构笔码和单笔码所对应的键,从而输入该单笔单码单结构形式字;
对所述普通单结构形式字进行输入的步骤包括:
将所述普通单结构形式字的结构中的头码作为第一码,并在该汉字中存在剩余的笔码的情况下,依次将所述结构中的次码、第二次码或者按照从上到下、从左到右和从外到内的顺序选取的该汉字中剩余的单笔码作为该汉字的第二码和/或第三码,和
依次键入表示所述第一、第二和/或第三码的结构笔码或单笔码所对应的键,从而输入该普通单结构形式字;以及
对于所述无结构字,则直接键入该无结构字中的笔码所对应的键即可输入该无结构字。
2.如权利要求1所述的汉字笔码输入法,其特征在于,所述单笔码、结合笔码和撮合笔码的具体形式及分组如下:
    单笔码  结合笔码             撮合笔码
1                                儿小
2                              八
3           
Figure C2007101028780003C2
4           
Figure C2007101028780003C3
艹                 匕
5           
Figure C2007101028780003C4
6           
Figure C2007101028780003C5
                 二
7           
Figure C2007101028780003C6
8          亻                    三
9          
Figure C2007101028780004C1
10         
Figure C2007101028780004C2
11         
Figure C2007101028780004C3
12         
Figure C2007101028780004C4
13         丄
Figure C2007101028780004C5
14         
Figure C2007101028780004C7
15         口
16         
Figure C2007101028780004C8
17         
18        尸
Figure C2007101028780004C10
19                                氵
Figure C2007101028780004C11
20        十
21  一                           
Figure C2007101028780004C12
22        日
Figure C2007101028780004C13
23 丨     冖
Figure C2007101028780004C14
24       
Figure C2007101028780004C15
25 丿
26        大
3.如权利要求2所述的汉字笔码输入法,其特征在于,所述结构笔码还包括变换笔码和特定笔码,以降低在对汉字进行拆分编码时出现的重码率,所述变换笔码是对基本码进行变形而形成的,所述基本码由单笔码、结合笔码和撮合笔码组成,所述特定笔码是对汉字中的一些结构固化而形成的,所述的变换笔码和特定笔码的具体形式及所对应的分组如下:
       变换笔码                      特定笔码
1      
Figure C2007101028780004C16
3      九                      示
4     #
Figure C2007101028780004C18
5     
Figure C2007101028780004C19
7     
Figure C2007101028780004C20
9     
Figure C2007101028780004C21
10    
12    广
Figure C2007101028780005C1
13    肀
Figure C2007101028780005C2
                    月
16                                上
Figure C2007101028780005C3
17                         目罒
Figure C2007101028780005C5
18    
Figure C2007101028780005C6
万2.3于
20    
Figure C2007101028780005C7
21    
Figure C2007101028780005C8
Figure C2007101028780005C9
22    
Figure C2007101028780005C10
23    宀
Figure C2007101028780005C11
                     王壬讠
24          田
25    
Figure C2007101028780005C13
             彳
26    太
Figure C2007101028780005C14
其中,各个组别的变换笔码和特定笔码与相同组别的基本码设置在相同的键位上。
4.如权利要求2或3所述的汉字笔码输入法,其特征在于,将所述各组笔码设置于计算机键盘的字母键、数字键、其他非字母数字键、或者这些键位的混合上。
5.如权利要求3所述的汉字笔码输入法,其特征在于,从由相互连接或交叉的多个结构笔码组成的结构中取头码和次码的取码次序为:先取明码,取尽明码后再取暗码,
其中,所述明码是在该结构中存在足够的线条而拆分出的结构笔码;所述暗码是先取完明码后剩余的线段与原明码中的线段交叉或连接而形成的结合笔码,或者是游离的单笔码与同部位或相邻的独立单笔码撮合成的撮合笔码。
6.如权利要求5所述的汉字笔码输入法,其特征在于,按照以下优先级对一个结构中所包括的多个明码进行取码:
第一优先级明码为:由单笔码交叉形成的结构笔码、包含“口”形或“日”形的结合笔码以及前两者的变换笔码或特定笔码;
第二优先级明码为:含有斜笔的中间连接结构笔码;
第三优先级明码为:除了上述笔码之外的其他明码,
相同优先级的明码按照从上到下、从左到右和从外到内的顺序选取。
7.如权利要求5所述的汉字笔码输入法,其特征在于,按照以下次序对一个结构中包括的多个暗码进行取码:
按照从上到下、从左到右和从外到内的顺序先取由数量最多的单笔码构成的结构笔码,如果构成所述结构笔码的单笔码数量相同,则先取结合笔码,后取撮合笔码。
8.如权利要求5所述的汉字笔码输入法,其特征在于,将汉字中常用的部首设定为部首组合,而将汉字中常见的结构设定为普通组合,在拆字取码过程中考虑部首组合时,所述取码次序为:明码、暗码、独立或游离的单笔码、不在首码位的部首组合的次码、在首码为的部首组合的次码。
CN200710102878A 2007-05-11 2007-05-11 汉字笔码输入法 Expired - Fee Related CN100594469C (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN200710102878A CN100594469C (zh) 2007-05-11 2007-05-11 汉字笔码输入法
HK09101532.4A HK1121555A1 (en) 2007-05-11 2009-02-18 Chinese character input method with stroke codes

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200710102878A CN100594469C (zh) 2007-05-11 2007-05-11 汉字笔码输入法

Publications (2)

Publication Number Publication Date
CN101303623A CN101303623A (zh) 2008-11-12
CN100594469C true CN100594469C (zh) 2010-03-17

Family

ID=40113543

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200710102878A Expired - Fee Related CN100594469C (zh) 2007-05-11 2007-05-11 汉字笔码输入法

Country Status (2)

Country Link
CN (1) CN100594469C (zh)
HK (1) HK1121555A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109101973B (zh) * 2018-08-06 2019-12-10 掌阅科技股份有限公司 文字识别方法、电子设备、存储介质

Also Published As

Publication number Publication date
HK1121555A1 (en) 2009-04-24
CN101303623A (zh) 2008-11-12

Similar Documents

Publication Publication Date Title
CN102023716A (zh) 26或者27或者29或者30字母键元的数字键中文输入法
CN102073386B (zh) 一种象形会意分类字根的汉字计算机输入法
CN100594469C (zh) 汉字笔码输入法
CN102799282A (zh) 笔画字根全息码汉字输入法
CN101086686A (zh) 一种数字键盘汉字输入法
CN101551706B (zh) 阴阳四角数字码汉字输入法及其键盘
CN100367162C (zh) 五型笔画编码输入法
CN100543656C (zh) 汉字输入法
CN102253726A (zh) 一种计算机汉字数字笔画的输入方法及键盘技术
CN1101569C (zh) 音形码汉字输入方法
CN105278697B (zh) 组合式双拼类主副码汉字、词语编码输入法及其键盘
CN101706687B (zh) 汉字“三边号码”输入法及其键盘
CN100517192C (zh) 固定字根数码汉字输入法
CN103135788B (zh) 一种汉字四象意形输入法
CN100367163C (zh) 五型音画编码输入法
CN100507815C (zh) 原生态形码汉字输入法
CN101086687A (zh) 一种首末码汉字输入方法
CN101359253B (zh) 计算机汉字结构笔顺数字和部首偏旁混合编码输入法
CN1125393C (zh) 利用计算机键盘汉字编码输入方法
CN101216740B (zh) 统一数字码部首汉字输入法
CN100424619C (zh) “三键行”计算机汉字输入法
CN1331025C (zh) 拼音四角笔码(形)汉字输入法及其键盘设计
CN100444090C (zh) 五体笔块码汉字输入方法
CN100373307C (zh) 汉字数码的国际交流软件
CN101236460B (zh) 一种通过计算机字母键盘输入汉字的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1121555

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1121555

Country of ref document: HK

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100317

Termination date: 20160511

CF01 Termination of patent right due to non-payment of annual fee