CN101359253A - 归一中文编码方法及其输入键盘 - Google Patents
归一中文编码方法及其输入键盘 Download PDFInfo
- Publication number
- CN101359253A CN101359253A CNA2007100354699A CN200710035469A CN101359253A CN 101359253 A CN101359253 A CN 101359253A CN A2007100354699 A CNA2007100354699 A CN A2007100354699A CN 200710035469 A CN200710035469 A CN 200710035469A CN 101359253 A CN101359253 A CN 101359253A
- Authority
- CN
- China
- Prior art keywords
- stroke
- word
- character
- chinese character
- chinese
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明涉及计算机汉字编码技术,具体是一种汉字结构笔顺数字和部首偏旁混合编码及其输入键盘。本发明根据汉字的五种字形结构,将汉字一分为二,定出汉字的第一部分。用一、二、三、四、五、六、七、八、九、○代表第一部分的笔划数,并选用41个常用的偏旁部首及其引申义字,对应放置在标准英文键盘的26个字母键上,作为键面字根,代表汉字的首码。其余编码是键面字根的,则用键面字根代表,否则用汉字的笔形代码,按照汉字的书写笔顺组成双数码,进行混合编码。方法简便,易学易记,从而提供了一种符合汉字自然规律,见字即能出码,输入速度快,重码率低,结构拆分及笔顺原则规范化的汉字编码方法。
Description
本发明涉及一种计算机汉字输入方法,具体是一种汉字结构笔顺数字和部首偏旁混合编码方法及其键盘。
汉字计算机输入法发展到今天,方法已逾数百种。虽然种类繁多,但目前尚无一种能为全民大众所接受的简单、易学易记、易于普及的方法,它仍然存在着输入速度快的就难学难记难拆分的弊端,如五笔字形;容易学的就重码率高,输入速度就慢,如拼音码。因此,现行的方法都很难普及推广,汉字计算机输入法至今仍是一个未能很好破解的难题。
本发明的目的,在于提供一种易学易记、符合汉字规律、见字即能出码,结构拆分及笔顺原则规范化,重码率低的归一中文编码方法及其键盘,较好地破解了汉字计算机输入法的难题。
本发明的技术方案如下:
本发明的归一中文编码方法及其键盘,发明内容包括:
1、利用含数字键、字母键和功能键的标准键盘,以字母键代表汉字的偏旁部首及其引申义字和代表汉字断开的第一部分笔画数目0、一、二、三、四、五、六、七、八、九数目字,它们统称为键面字根,同时还代表用阿拉伯数字1、2、3、4、5分别表示汉字的横、竖、撇、点、折按笔顺组成的双码。每个汉字输入时,最多取四个码元,其中如果断开的第一部分是键面字根,则作为该字的首码,第二部分最多取三个码元;如果第一部分不是键面字根,则第一部分需取两个码元,取所述第一部分的笔划数目字作首码,第一部分前面是键面字根则取键面字根,否则取第一部分的前面两个笔划组成的双码作为第二个码元,此时,该字的第二部分最多取二个码元。
2、进行汉字输入时,将汉字字形分为五类。
(1)包围结构:凡字中两笔以上的笔划被其它笔划两面以上包围,且被围笔划不与包围的笔划紧密粘连的结构。取包围部分作该字的第一部分。
(2)上下结构:凡字能上下断开的结构。其断开有以下原则:单笔不断(但能截然分开的横笔例外)、两笔开取、截取到横、是断非取、单笔不留、字大优先、不拆整体、撇捺相随、连“冖”取等。
(3)左右结构:凡字能左右断开的结构。其中若字的左边也是个完整字,则取其为该字的第一部分;字的左边若是一个整体结构的,取该整体为字的第一部分。
(4)镶嵌结构:两笔以上,形状相同的笔划对称镶嵌在同一部件内的结构。取被镶嵌部分作为该字的第一部分。
(5)独体字:无法断开的字叫独体字。
3、定首码:进行汉字输入时,首先将汉字按字形结构断开分成两部分,定出该字的首码,如果断开的第一部分是键面字根,则键面字根作为该字的首码。如果断开的第一部分不是键面字根,则以第一部分的笔划数数目字作为首码,用0、一、二、三、四、五、六、七、八、九中的一个表示即:
A、第一部分是几笔笔划,首码即为几。如军,第一部分是“冖”,二划,首码为二;如念,第一部分是“今”,四笔,首码为四。
B、第一部分笔划超过九笔,首码仍为九。如慰,第一部分为“尉”,11划,首码仍为九;如翻,第一部分为“番”,12划,首码仍为九。
C、无法断开的独体字,其首码定为0。
4、利用上述键盘输入汉字的笔形码时,笔顺规则除了现有的从上到下、从左到右、从外到内、先里头后封口、先中间后两边、先横后竖、先撇后捺等原则外,还包括新制定的以下原则。
①先折后竖、②先主后附、③下档横收、④下通竖收、⑤先里头后包围、⑥先点先横先写折、⑦后点后横后撇捺
5、每个汉字的输入方法是,先根据汉字拆分原则定出汉字的第一部分,如果第一部分是键面字根,则取该键面字根作为首码输入。如果第一部分不是键面字根,则第一部分需取两个码元,取所述第一部分的笔划数数目字作为首码,第一部分前面是键面字根,则取键面字根,如不是则取第一部分的前两个笔划组成的双码作为第二个码元。第二部分如果是键面字根,则依序取键面字根,否则依笔顺组成双码输入。如果取单笔后是键面字根,则单笔重取组成双码,再取键面字根,如果最后仅剩单笔,则重复笔划数字代码组成双码。第一部分是键面字根的,该字第二部分依序最多再取三个码元,第一部分不是键面字根的,则第二部分依序最多再取两个码元,当汉字输入中出现重码时,再以数字键选择完成汉字输入。
6、采用本发明进行汉字输入时,可利用计算机的标准键盘上的英文字母键,分别代表25个双码数键,每个字母键代表一个二位的数字键即:
11:T 12:R 13:E 14:W 15:Q
21:Y 22:U 23:I 24:O 25:P
31:G 32:F 33:D 34:S 35:A
41:H 42:J 43:K 44:L 45:M
51:N 52:B 53:V 54:C 55:X
7、本发明还可用于常用汉字词组的输入,每个词组均需输入四码,双数码键计为一码。其中:
(1)两字组:每字各取前两个码元。
(2)三字词:前两字各取其首码,后一字取该字的前两个码元。
(3)四字词:按顺序取每字的首码。
(4)多字词:只取第一、二、三字及最后一字的首码。
二、以下结合汉字编码示例分步详述本发明:
图1是笔形代码图。
图2是汉字部首偏旁及其引申义字和双数码与键盘对应设置关系的一种实施方案图。
图3是键面字根在标准键盘上对应分布的实际效果图。
采用本发明在计算机上输入汉字时:
1)、按字形结构将汉字断开分成两部分,第一部分是键面字根的,则用对应的字母键作首码。示例如下:
代表第一部分笔划数的数目字也可代表键面字根作首码。
2)、第一部分不是键面字根的,则用代表第一部分笔划数数目字作首码。第一部分需取两个码元:
a、用代表第一部分的笔划数数目字作首码:
b、第一部分第二个码元的取法:
①、取第一部分前面的键面字根作第二个码元。
②、取第一部分头两笔组成的双码数键。
3)、第一部分取码完成后,第二部分笔形码单笔重取的原则。
a、单笔入字根:若取单笔以后是字根:则单笔重取一次,进入字根,如:
b、余下单笔:笔形两码取足,余一笔下面无笔画,则余下单笔重取一次,有字根则取下部字根的头一笔。如:
4)、键面字根引申义字的输入:
a、键面字根引申义字代表的偏旁部首如下:
水(氵)、金(钅)、耳(阝卩)、人(亻)、手(扌)、心(忄)、犬(犭)、草(艹)、丝(纟幺)、言(讠)、之(辶)
b、键面字根的助记词:金木水火土,耳目人手心,犬月山王石,广(疒)口禾宀(穴)之,日女言丝草,五区键名知。
c、键面字根引申义字的输入:如手,偏旁“扌”的引申义字,击“0”键一键输入。代表第一部分笔画数的数目字,如“二”,也可看作汉字,击F键一键输入。处于第二个位置的偏旁“月”的引申义字月,击F键二次输入。同样的道理,代表部首“艹”的引申义字草,击“X”键一键输入,处于第二个位置的“山”,击“D”键二次输入。
同时,它们在作为词组输入时,引申义字所在的键击两次:如水果,水字所在键“E”键两次,果则取头两码,如水果=E、E、Z、25。如:妇女,“妇”取头两码,女击所在键“B”键两次,则妇女=女、51、B、B。如:女人,“女”击所在键“B”键二次,“人”击所在键“I”键两次,则女人=B、B、I、I。如二月,“二”击所在键“F”键两次,“月”击所在键“F”两次,则二月=F、F、F、F。
5)、重码处理:当输入的汉字出现重码时,相同一组汉字可显示在屏幕上,每个汉字的近旁同时显示出一个代表该汉字的数字,最后敲击代表欲输入汉字的数字键,即可完成对该汉字的输入。
6)、汉字输入和击键示范:
要输入某个汉字,先判定该字结构,然后按结构断开分成两部分,它有如下两种情况。
(1)、第一部分是键面字根的,则以其作首码,第二部分最多取三个码元。如:
艺,上下结构,第一部分为“艹”,第二部分为“乙”,单笔重取,艺艹、55。
(2)、如果第一部分不是键面字根,则第一部分取两个码元。取所述第一部分的笔划数数目字作首码。第一部分前面是键面字根,则取键面字根,否则取第一部分的前两个笔划组成的双数码作为第二个码元。第二部分最多取两个码元,如:
得,左右结构,第一部分为“彳”,不是键面字根,以“彳”的笔划数“三”作首码,第一部分“彳”的前面部分不是键面字根,则以第一部分“彳”的头两笔“丿”、“丿”,组成双数码33作为第二个码元,第二部分为取“日”、“一”、“一”,即得三、33、日、11。
爽,镶嵌结构,第一部分为“大”,不是键面字根,则以“大”的笔划数“三”作为首码,第一部分“大”的前面不是键面字根,则以第一部分“大”的头两笔“一”、“丿”组成双数码13作为第二个码元,第二部分为 即:爽三、13、34、34。
7)、常用词组输入方法示例。
(1)、两字词:
军队=二、45、阝、人 思想=五、25、九、木
我们=0、31、亻、42 祖国=四、45、三、25
(2)、三字词:
湖南省=氵、二、三、23 国务院=三、三、阝、宀
专利法=0、禾、氵、土 创造性=四、辶、忄、31
(3)、四字词:
五湖四海=五、氵、四、氵党纪国法=五、纟、三、氵
(4)、多字词:
中华人民共和国=0、四、人、三
三、关于汉字结构的归类、拆分断开、笔顺规则及示例
这一部分与本申请人已申请的01117593.1号中国专利的相应内容基本相同,只在一些细节上略有不同。
1、汉字字形结构的归类和拆分断开:
汉字字形结构共有8种,全包围、半包围、上下、上中下、左右、左中右、镶嵌、独体字等8种结构,现将它们合为以下五类。
(1)、上下结构:凡字能上下截然断开的结构叫上下结构,断开取上部分作该作字的第一部分。
a、单笔不取:字单笔不取,但能截然分开的横例外。如:良、天、千、我单笔不取,首码为0。即:z键
而豆、丽、亘其第一部分为“一”横,一画,首码均为“一”,即:G键。
b、两笔开取:两笔作为部首或两笔以上笔画可断。如
c、截取到横:对于横竖笔画相连的字以横笔及以上部分作为第一部分。如:
d、是断非取:是断开而不是取出字根作第一部分。如:
e、单笔不留:断开剩下单笔,粘连不留,算作独体字。如:
广、亡、严、亟等。
f、撇捺相随:断开横笔下有撇捺两笔,连同撇捺截取。如:
g、字大优先:上部是字,可按字断开,但优先取笔画多的字。如:
h、不拆整体:
I、连“冖”取:
(2)、左右结构:凡字能左右截然断开的结构,取左边部分作第一部分。
a、整体断开:左边是整体的,取整体作第一部分。
b、字断开:左边是字的,取字作第一部分。
(3)、包围结构:凡字中两笔以上笔画被其他笔画两面以上包围,且被包围笔划不与包围的笔划紧密粘连的结构叫包围结构。取包围部分作第一部分:
a、全包围:四面包围。
b、半包围:二面以上包围。
c、字包围:包围部分是字的。
其中另有单笔不围,如马寸鸟与叉勺等作独体字,但也有例外如:闩氕。还有笔划粘连不围,如:日月巨臣目田皿勿民等作独体字
(4)、镶嵌结构:两笔以上,形状相同的笔划对称镶嵌在同一部件上的结构。取被镶嵌部分作第一部分:
(5)、独体字:无法断开的字叫独体字,其首码定为0。
如:大=0 中=0 事=0 我=0
2、笔顺规则
汉字笔顺自古以来就是一个无法统一、规范的难题。由于汉字的笔顺规则只有:先横后竖、先撇后捺等七条,而先横后竖对于“上”、“非”等字的先竖又不能解释,致使汉字笔划书写无章可循。大家各凭爱好,使很多字出现了几种写法而又无法判定其对与错,缺乏规范化。如“出”字写法有: 出、 出、 出等,因此在小学教学中不得不允许几种写法,如车、皮、匠、五、肃等字也有同样问题,对汉字的教学带来很大的不便,也使得计算机的汉字输入和汉字检索缺乏对笔顺规则的规范化,不利于迅速对汉字进行编码。本发明结合汉字造字规律和现行约成俗定的正确写法,新制定了七条笔顺规则,加强了汉字书写的规范性。
(2)、先折后竖:折笔与竖和竖撇等笔划相交时,先写折笔。
(3)、先主后附:一个汉字或字的其中一个部分都有一个为主的笔划,称为主笔划,而其它的笔划是依附在主笔划之上,称为附笔划。主笔划先写,如:
(4)、下挡横收:竖笔底端被挡住,则封挡的笔划作为末笔,如:
(5)、下通竖收:竖笔或竖钩下面是通的,则竖笔或竖钩作为末笔。如:
中:口、中 串:吕、串
甲:日、甲 事:事
(6)、先点先横先写折。
a、凡点的位置在字的左上、正中的字,先写点划。
如:头、斗、为、主、永、良、义等字
b、长横与竖划或单笔折相交的字,先写长横。
如:十、丰、廿、甘、七、寸等字
c、折笔折的方向向左的字,先写折画。
如:刀、力、乃、及等字
(7)、后点后横后撇捺。
a、点的位置在字的右上、右下、左下的字,后写点划。
如:戈、书、甫、玉、刃、太等字。
b、长横与多笔划相交,中有折笔,横笔后写。
如:世、舟、母、册等字
c、凡在字或一个整笔形中,撇捺是最后两笔。
如:火、夹、爽、木、来、臾等字
本发明是完全按照汉字的自然组合规律,根据字形结构将汉字一分为二,定出第一部分。用一、二、三、四、五、六、七、八、九、0代表第一部分的笔划数数目字,选用41个常用的偏旁部首及其引申义字作为键面字根,定出汉字的首码。其余是键面字根的,用键面字根代表,否则用汉字的笔划依笔顺组成双数码。这样大大减轻了对键码的记忆负担,从而使汉字编码十分轻松,至此,汉字编码依据汉字的结构和笔顺这两个与生俱来的固有特点,才真正使汉字编码符合了汉字的自然规律,使汉字“万码奔腾”的局面,归于一码。
本发明在用于计算机汉字输入时,输入速度非常快,重码率很低,而且方法简单,易学易记、易于推广普及,不需要任何专业培训,即可上机操作,在电脑上输入汉字。同时,本发明还制定了汉字结构的拆分断开和笔顺的规则,解决了汉字以往在结构的拆分断开和笔顺规则方面无法统一的问题,便于计算机汉字输入的规范化。本发明符合汉字规律,见字即能出码,可广泛应用于汉字检索和计算机汉字输入。利用本发明可以制作汉卡,或通过软件手段构成一个汉字输入及处理系统。同时,也可用于查字典、词典,将汉字电脑输入和查字典融为一体。
Claims (5)
1、一种计算机汉字结构笔顺数字和部首偏旁混合编码输入法,包括如下步骤:
(1)、选择组成汉字的51个偏旁部首及其引申义字和代表首码部分笔划数目的0、一、二、三、四、五、六、七、八、九数目字作为汉字编码形码码元,并称之为键面字根,其与键盘的键位对应关系如下:
A(35)五、石 B(52)女 C(54)丝(纟、幺)
D(33)三、山 E(13)水(氵) F(32)二、月
G(31)一、犬(犭) H(41)六、广、疒 I(23)人(亻)
J(42)七、口 K(43)八、禾 L(44)九、宀、穴
M(45)之(辶) N(51)日 O(24)手(扌)
P(25)心(忄) Q(15)土、士 R(12)木
S(34)四、王 T(11)金(钅) U(22)目
V(53)言(讠) W(14)火 X(55)草(艹)
Y(21)耳(阝、卩) Z(0)的
并利用数字1、2、3、4、5分别表示汉字的笔划横、竖、撇、点、折组成双码作为编码码元。
(2)、在输入汉字时,按照汉字的五种结构,即包围结构、上下结构、左右结构、镶嵌结构和独体字结构,将汉字断开,分成两部分。如果第一部分是键面字根,则取该键面字根作为首码,如果第一部分不是键面字根,则第一部分需取两个码元,取所述第一部分的笔画数数目字作为首码,第一部分前面是键面字根,则取键面字根,如不是则取第一部分的前面两个笔画组成的双码作为第二个码元。第二部分如果是键面字根,则取该键面字根,否则依笔顺组成双码输入。如果取单笔后是键面字根,则单笔重复组成双码,再取键面字根。如果最后仅剩单笔划,则重复该笔划数字代码组成双码。
2、根据权利要求1所述的计算机汉字输入法,其特征是汉字按结构断开定出第一部分有以下原则:单笔不取、单笔不留、两笔开取、截取到横、是断非取、撇捺相随、字大优先、不拆整体、连“冖”取、整体断开、字断开等。
3、根据权利要求1所述的计算机汉字输入法,其特征是汉字按结构断开,如果第一部分不是键面字根,则其首码为第一部分的笔划数数目字,其法则是:根据第一部分笔划,首码用0和一、二、三、四、五、六、七、八、九数目字的一个表示。即:
A、第一部分有几笔笔划,首码即为几。如:军、留、形其首码分别为二、五、四。
B、第一部分笔划超过九笔,首码仍为九。如:慰、翻、其首码均为九。
C、无法断开的独体字,其首码定为0。
4、根据权利要求1所述的计算机汉字输入法,其特征是汉字按笔顺取码时,笔顺原则除了现有的从上到下,从左到右,从外到内,先里头后封口、先中间后两边、先横后竖、先撇后捺等原则外,还包括新制定的以下原则:
①先折后竖、②先主后附、③下档横收、④下通竖收、⑤先里头后包围、⑥先点先横先写折、⑦后点后横后撇捺。
5、根据权利要求1所述的计算机汉字输入法,其特征是输入汉字的词组的方法包括:
(1)、两字词:每字各取前两个码元。
(2)、三字词:前两字均各取其首码,后一字取该字的前两个码元。
(3)、四字词:按顺序取每字的首码。
(4)、多字词:只取第一、二、三字及最后一字的首码。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2007100354699A CN101359253B (zh) | 2007-07-30 | 2007-07-30 | 计算机汉字结构笔顺数字和部首偏旁混合编码输入法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2007100354699A CN101359253B (zh) | 2007-07-30 | 2007-07-30 | 计算机汉字结构笔顺数字和部首偏旁混合编码输入法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101359253A true CN101359253A (zh) | 2009-02-04 |
CN101359253B CN101359253B (zh) | 2011-06-22 |
Family
ID=40331713
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2007100354699A Expired - Fee Related CN101359253B (zh) | 2007-07-30 | 2007-07-30 | 计算机汉字结构笔顺数字和部首偏旁混合编码输入法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101359253B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102117120B (zh) * | 2009-12-31 | 2013-05-08 | 陈春 | 九笔汉字输入法及其字母与数字键盘 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1081004A (zh) * | 1993-05-15 | 1994-01-19 | 张善淼 | 汉字结构笔顺数字编码方法 |
CN1101568C (zh) * | 1994-04-19 | 2003-02-12 | 张善淼 | 计算机汉字输入方法及其键盘 |
CN1230726C (zh) * | 2001-04-25 | 2005-12-07 | 张善淼 | 数字码汉字计算机输入法 |
-
2007
- 2007-07-30 CN CN2007100354699A patent/CN101359253B/zh not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102117120B (zh) * | 2009-12-31 | 2013-05-08 | 陈春 | 九笔汉字输入法及其字母与数字键盘 |
Also Published As
Publication number | Publication date |
---|---|
CN101359253B (zh) | 2011-06-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102279650A (zh) | 简单规范输入法 | |
CN102799282A (zh) | 笔画字根全息码汉字输入法 | |
CN101359253A (zh) | 归一中文编码方法及其输入键盘 | |
CN100403240C (zh) | 计算机汉字编码输入方法 | |
CN105302330A (zh) | 组合式音笔类主副码汉字、词语编码输入法及其键盘 | |
CN101976123A (zh) | 汉字声韵输入方法及输入键盘 | |
CN102253726A (zh) | 一种计算机汉字数字笔画的输入方法及键盘技术 | |
CN100465862C (zh) | 一种首末码汉字输入方法 | |
CN1908870B (zh) | 单击与多键并击混合输入中英文的方法和键盘 | |
CN101271366A (zh) | 首尾双拼输入法及其键盘 | |
CN100573422C (zh) | 声码加笔画码数字键汉字输入法 | |
CN102043469A (zh) | 两笔型三维数码输入法及其键盘 | |
CN104536590B (zh) | 基于西夏文声韵字根输入法的嵌入式软键盘系统 | |
CN103207685A (zh) | T形汉字码输入法 | |
CN101901061B (zh) | 汉字序码输入方法 | |
CN105278697B (zh) | 组合式双拼类主副码汉字、词语编码输入法及其键盘 | |
CN1204487C (zh) | 根声码汉字输入法 | |
CN102073382A (zh) | 笔画主副部首输入法 | |
CN102375558A (zh) | 计算机汉字快码五笔输入法 | |
CN100428121C (zh) | 五加加汉字输入法 | |
Montgomery | The ancient origins of sign handshapes | |
CN101561717B (zh) | 将汉字笔划组合排列编码的汉字输入法 | |
CN101833378B (zh) | 一种改进的五笔输入法及其键盘 | |
CN100449462C (zh) | 中文杜码编码笔形输入法 | |
CN101093422A (zh) | 拼音尾巴码一体化汉字键盘输入系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20110622 Termination date: 20170730 |