CN1118084A - 形声码 - Google Patents
形声码 Download PDFInfo
- Publication number
- CN1118084A CN1118084A CN 94111133 CN94111133A CN1118084A CN 1118084 A CN1118084 A CN 1118084A CN 94111133 CN94111133 CN 94111133 CN 94111133 A CN94111133 A CN 94111133A CN 1118084 A CN1118084 A CN 1118084A
- Authority
- CN
- China
- Prior art keywords
- key
- word
- character
- stroke
- chinese
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明为一种用于电子计算机处理中文信息的汉字形声码编码方法。它用26个拼音字母键和5个笔划键表达全部汉字,单字输入的一字四键由汉字发音的声母、汉字的部首发音声母、去部首后剩余部分的发音声母或不能发音时的首笔所在最大发音部分的声母或末笔组成,并有一、二、三级简码,词组一键一字或多字,平均字词结合码长为2.5键,重码率低于千分之八。具有易学易会,记忆量少等特点。
Description
本发明涉及一种将中文输入电子计算机的汉字编码法。
在现有技术中,汉字编码方案已达数种,但真正为广大用户所方便掌握的却很少见。究其原因,是各种方案都有一套人为的复杂规则,如字根选取过多,记忆量大,有的甚至要对操作人员进行专门训练才能进行输入等等。因此,设计出一套易学好用编码方案,是很有必要的。
本发明的目的是,提供一种汉字形声编码法,具有简单易学、记忆量极小、重码率低的特点。
本发明的技术方案是,
(1)它的键位代码组成是:
[E,耳,二,阝,卩,已,
,彐,,
,,]
[H,户,火,禾,黑]
[K,丬,爿,框,,,凵,囗,口,]
[M,皿,木,马,门,米,目,毛,麦,矛]
[L,力,龙,老,六,耒,鹿,卤,立,
,]
[N,女,鸟,牛,]
[O 冫,氵,灬,丷,八,彡]
[P,片,皮]
[Q,气,青,七,犬,欠,其,犭,豸,
,且]
[R,人,亻,彳,,人,日]
[T,田,土,士,丆,丅]
[X,心,忄,,西,小,,西,乂,辛,〕
[Y,衣,礻,衤,月,,羽,言,牙,云,,羊,音,弋,
,由,酉]
[Z,舟,走,疋,,竹,,之,辶,,支,周,止,足,,爪,爫]
[(横)(提)]
[(竖)(左竖钩)]
[(撇)]
[(捺)(点)]
[(折)]
[V]万能学习键
以上每个方括号中内容表示位于一个键上的代码,其中首个西文字母同时表示相应的汉语拼音字母,园括号中的文字表示相应名称的笔划代码,V键为万能学习键;
(2)本发明一字四键组码规则是,
第一键汉字本身发音的声母,以A、E、O开头的无声母字则直接键入A、E、O,
第二键汉字去部首后剩余部分能发音的则键入其发音声母,不能发音的则键入其首笔所包括最大部分的声母,如无此,则键入其首笔,
第四键汉字末笔所包括最大发音部分的声母,如无此,则键入其末笔。
本发明上述编码规则可概括为,一字四键,发音,部首,去部首后首末笔所在最大字或首末笔。
本发明的设计原理。汉语中有些常用部首是不能发音的。本码唯一需记忆的为二十个不发音的部首(族),根据汉语俗称或象形将其定义在相应键上。可将这二十个不能发音的部首看成是可以读音的,其读音声母即为所在键名,如“宀”俗称“宝盖头”,定义在B键上,读“B”。该二十个部首根据汉语常识定义了十一个,即B键上的宝盖头和病字头、C键上的草字头、O键上的立刀旁、E键上的耳旁、K键上的框部、R键上的人旁、O键上的犬旁、Y键上的衣字旁、Z键上的竹字头和走字底,依象形定义了六个部首,即E键上的“彐”、W键上的“
”、X键上的“乂”、T键上的“丆”、F键上的“扌”、K键上的“丬”,其余依汉字在简化、演变过程略有的变形定义。
为了有效离散重码,对于第一码和第三码相同时的形声字,第三码(键)应按第二种情况进行首、末笔拆分,如要拆成一个笔划,一个字母时,则依旧回到第一种情况(第三键)处理。为进一步离散重码,还可设置第五键,定义为部首的首笔。例如,“强”字,去“弓”(G)后为“虽”(S),末笔所在最大字为“虫”(C),所以其输入码为OCSC;又如“搭”字去“扌”(F)后“荅”不能发音,首笔最大字“艹”(C),末笔最大字“合”(H),所以其输入码为OFCH;若首末笔无最大可发音部分则键入笔划即可,如“贸”(M)字去“贝”(B)部后首笔的撇所在“
”不能发音,故键入“撇”即可,其输入码为MB30(本发明中以代码1、2、3、4、5分别表示横、竖、撇、捺、折之笔划)。汉字“聘”的输入码则由PEV5组成。形声字如“袱”的编码为FVRO,因为该字去“衤”部后的“伏”与“袱”(F)读音相同,故进行首末笔拆分,由衤(Y),亻(R),犬(O)构成后三键。“神”字由礻(Y)、申(S)、丨(竖)组成后三键,故编码为SYS3,因为这时该字虽是形声字,如所述拆分后第三、四码有笔划,所以仍用第一种拆分法(第三键)。
本发明第一键输入汉字的读音声母即可,不必区分韵母,也不必区分Z、C、S、G与Zh、cH、sh。U键为生僻不发音部首的代码,位置在字头或字底;I键为生僻不发音字旁,位置在字左或字右。俗称水部的在O键上,共6个部首。本码中,土、士以及已、己、巳不区分,键入T、I即可。
本发明的编码举印例:
“同”的输入码是TRIR(冂、横、口),
“丛”的输入码是CTRR (横、人、人),“然”的输入码是R0YO(灬、
、犬),“相”的输入码是XWWI (木、目、横)“页”的输入码是YIBR(丆、贝、人)“贵”的输入码是GBZI(贝、中、横)。
在本编码方案中,汉字二、三、四、五、六、七、八、九、十发本字音;但二、三必须为独立结构时才可,而不能与任何笔划相连,如在“闫”字中方可。“一”在本码中键入“横”即可。
在本发明中。还应遵循以下的一般性规律,
(1)首末笔最大字不能重合,有重合时以末笔最大字优先;
(2)找部首的方法相同于《辞海》,先上下(左右),后中间,最后顺左上角找;
(3)任何笔划、字、部首,只能拆出,不能割断,仅有的一种例外情况是竖与横相交割断出现两个可发音字时(因为这是汉字为书写方便而将其连写的,如圭、男、果等);
(4)取部首应遵循不能破坏部首或部首旁字的完整性的原则;
(5)无论任何字,其去部首后末笔以国家标准笔顺最后一笔为其真实末笔。
(6)独体字以笔划为部首,但有的去部首后难以分析,可直接键入去部首后首末笔即可,即它的编码为,拼音+首笔+次笔+末笔。如“土”字的编码为T112(横、横、竖);“天”字的编码为TIOR(横、大、人),也可以是T114(横、横、捺)。一拼音三笔划为独体字特有编码。
(7)为了使操作者在知识有限的情况下输入汉字,设有以下几种容错码输入,
a、去部首后部分不会读(只考虑初中文化水平以上难字),分为首末笔最大字读音;
b、用万能键(V)代替不知编码部分;
c、对操作者有可能分析错误的字无重码就将其作为容错码;
d、对特别难分析的字,将头两码打正确,打入去部首后首末笔即可。
本发明为加快输入速度,设有一、二、三级简码,分述如下,
(1)二十六个高频一级键面字为一级简码。
(2)将汉字划分区,按两键组合(如DO、DH、SH等),前两键组合使用频率最高的字作为二级简码共23×22=506个,如“到”字使用频率高,取头两码OO即将其提出(要打四码也可,即OOZT);
(3)三级简码包括:
a、前三码已完全区分而不必打第四码的,加空格键“凵”
b、一个部首加一笔划成字的,依次键入字的读音声母、部首声母、笔画“凵”键组成四码。如只有二笔划、一笔划的字,例如“二”为Y11凵,“一”为Y1凵,“人”为Y34凵。如“引”、“亿”、“艺”、“礼”分别为YG2凵(引)、YC5凵(艺)等;
c、由b类推,由一部首加一笔划组成的独体字可用此三级简码。如“未”、“王”、“升”、“开”、“末”码为WN1,升码为SC3。类似独体字很多,如口、甘、世、大、井、义、来等。
d、用一、二、三级简码离散重码。本编码有少量重码存在,为了有效离散重码,做到高速盲打,还可用此一、二级简码进行离散。对于四码完全相同的字,将使用频率较高的作为简码,打二、三键即出字,排在首位。使用频率低的字必须打完四码才出字,排在首位,此时高频字作为重码排在第二位。另外,一、二级简码与后面重码时,不再拥有四码而只存在简码。如“昨”与“作”重码,但“作”使用频率高,作为键面一级字打入“Z凵”即可,而打入“ZRZ2”只能出现昨,无重码。
本发明超简形单字的输入。以所述五种笔划为主,最后加一声码的输入方式可输入任何汉字而不用换档,但有少量重码。输入汉字自然书写笔顺的第一、二、三、末笔,该字拼音声母,不足四笔的有几笔打几笔,打入字母自然结束。如“人”为34R,“未”为1124W。两个一笔字“一”、“乙”加空格键结束,笔划、拼音不清也可以用V键代替。
本发明的词组输入。利用本编码规则简单,符合人们读写习惯和打字习惯,重码率低,不用换档。词组输入包括:
(I)形声输入。二字词编码由首字首笔、首字拼音、末字首笔、末字拼音四码组成。“保证”编码为3B4Z,“错误”为3C4W,“拥有”为1Y1Y。三字词编码由首笔字首笔、首字拼音、次字拼音、末字拼音组成,如“公安局”为3CAJ,“共产党”为IGCO。
(2)全声输入。二字编码由首字拼音、首字部首、末字拼音、末字部首组成,实际为词组每字前两码,如“宝贝”为BBBK。三字词编码由首字拼音、次字拼音、末字拼音组成,如“公安局”为GAJ。第二种输入最后按大写键结束。
(3)四字及四字以上词的输入。其编码由首字拼音、次字拼音、第三字拼音、末字拼音、大写键(按该键)组成。如“实事求是”为ssqs[大](其中符号[大]表示大写键),“中华人民共和国”为ZHRG[大]。
(4)以O开头可打入五字及五字以上所有古诗名句、歇后语、词诗段,一字一键,如“白日依由尽”为UBRYSJ,打入第二句又以U开头,空格键结束。
本发明的随机自行词库区。在输入过程中可随机自行定义、扩展词库,定义区为U键后空白区(参见附图)自行编写1至4键的随机词库,如写传记时认为“毛泽东”、“中国社会科学院”要经常出现,则定义:“毛泽东”为UM,“中科院”为UZKY,按键即出字,自行定义编码,只要自己认为好记就行。
本发明非汉字符号输入。由于本编码的特殊性,可以输入非汉字字符,如在有必要输入“衤”旁,“氵”这些非汉字字符时,只需要键入其“一、二、三、末笔加空格键即可。例如“衤”为4524凵,“氵”为441凵,不足四笔时有几笔打几笔,再加空格键结束。
本发明的全形输入。对某些字如不知其发音则可以全形输入,具体方法为按国家标准笔顺打6码,即一、二、三、四、五、末(六)笔,五笔的加空格键,(四笔及其以下的字不予考虑,只需要按超简易形输入,最后拼音用V键模糊即可。
本发明输入码的其它功能区。以U、I还可以设置多个功能,如以开头,同自然码一样,可直接打金额大写数字,重量、年、月、日等。另外,还可以设立一个重码容错键,当一些极少用、极生僻、难用的字与一、二级字和少用字发生部突时,按下重码容错键后,以上字才会出现。这样既可以把字库扩大到整个汉字库,不至于有些极少用、极生僻字找不到,又不会影响正常的一、二级汉字的输入。
本发明的盲打联想输入。打入一个词组前字后,用一键打出下字,不必看屏挑选。如“事实”,打入“事”字后,可能的组合有“物(W)”、“实(S)”“件(I)”等,打入S键加[大],即输入。也可以打入下字的头两码加[大]字的头两码加[大]输入,即SB[大],以增加确定性。智能联想输入,当有重码时,如“阂”、“核”,当前面有“隔”等只能与“阂”组字的,则自动打入“阂”,前面有“审”、“准”等则只打入“核”,重码不报警。本发明中,输入码(如“首字拼音”等)中的“拼音”指的是其发音的声母。
由以上可知,本发明的编码方案有以下特点,
(1)简单易学,理论部分少,可做到半小时清楚原理,很快熟悉、掌握。
(2)大量运用汉语基本常识和汉字自身规律,少自行定义规则,记忆量小。
(3)见字识码,不因特殊字做特殊规定,重码率低(小于千分之八)。
(4)字、词输入符合中国人的读写习惯。
(5)适应现代电脑输入需要,能打入双字、多字词组、成语、约定俗语,并且可打入古文名句、诗词、名著段落,一字一键,不用换档,同时又能与单字系统自然区分开来,互不干涉。
(6)单字输入只要求操作者达到初中文化水平即可。超简易单字输入和字、词、成语的输入则只要是小学水平的人一看即会。
附图说明,附图为按照本发明编码方法筹建立的输入键盘面字符分布结构。
Claims (1)
1、一种用于电子计算机处理中文信息的汉字形声编码法,其特征是,
(1)它的键位代码组成是,
[A]
[E,耳,二,阝,卩,已,巳,
,彐,,]
[H,户,火,禾,黑]
[K,丬,爿,框,,,,凵,口,囗,]
[M,皿,木,马,门,米,目,毛,麦,矛]
[L,力,龙,老,六,耒,鹿,卤,立,
,]
[N,女,鸟,牛]
[O 冫,氵,灬,丷,ハ,彡,]
[P,片,皮]
[Q,气,青,七,犬,欠,其,犭,豸,
,且]
[R,人,亻,彳,,人,日]
[T,田,土,士,丆,丅]
[W,文,攵,夊,王,韦,丸,瓦,幺,
,糸,纟,]
[X,心,忄,,小,,西,西,辛,乂]
[Z,舟,走,疋,
,竹,,之,辶,廴,支,周,止,足,,爪,爫]
[U,
,耂,
,癶,六,元]
[(横)(提)]
[(竖)(左竖钩)]
[(撇)]
[(捺)(点)]
[(折)]
[V]万能学习键
以上每个方括号中内容表示位于一个键上的代码,其中首个西文字母同时表示相应的汉语拼音字母,园括号中文字表示相应名称的笔划代码,V键为万能学习键,
(2)本发明一字四键输入规则是,
第一键汉字本身发音的声母,以A、E、O、开头的无声母字则直接键入A、E、O,
第二键汉字的部首发音声母,
第三键汉字去部首后剩余部分能发音的则键入其发音字母,不能发音的键入其首笔所包括最大发音部分的声母,如无此,则键入其首笔,
第四键汉字末笔所包括最大发音部分的声母,如无此,则键入其末笔。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 94111133 CN1118084A (zh) | 1994-08-27 | 1994-08-27 | 形声码 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 94111133 CN1118084A (zh) | 1994-08-27 | 1994-08-27 | 形声码 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1118084A true CN1118084A (zh) | 1996-03-06 |
Family
ID=5035033
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 94111133 Pending CN1118084A (zh) | 1994-08-27 | 1994-08-27 | 形声码 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1118084A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103064525A (zh) * | 2011-08-12 | 2013-04-24 | 詹龙忠 | 一种用部首编码的检字法 |
-
1994
- 1994-08-27 CN CN 94111133 patent/CN1118084A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103064525A (zh) * | 2011-08-12 | 2013-04-24 | 詹龙忠 | 一种用部首编码的检字法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105938402A (zh) | 一种声形码汉字输入法及键盘 | |
CN1118084A (zh) | 形声码 | |
CN1147777C (zh) | 计算机汉字输入方法 | |
CN101093421A (zh) | 汉字的四笔层次形码及形音的数字编码输入方法 | |
CN1101569C (zh) | 音形码汉字输入方法 | |
CN1020386C (zh) | 结构笔画四位数编码法及键盘 | |
CN1028806C (zh) | 一种汉字计算机输入方法及其键盘 | |
CN1242314C (zh) | 现代汉语音文输入法 | |
CN1595340A (zh) | 通俗五笔字型法及其键盘 | |
CN1207648C (zh) | 五三码及其键盘 | |
CN1125393C (zh) | 利用计算机键盘汉字编码输入方法 | |
CN1089176C (zh) | 汉字正负数码输入法 | |
CN1123817C (zh) | 一种汉字输入法 | |
CN1079161C (zh) | 一种声形结合的计算机汉字输入方法 | |
CN1020136C (zh) | 经纬编码法及其汉字输入键盘 | |
CN1194397A (zh) | 一种汉字输入方法及其键盘设计 | |
CN1054693C (zh) | 一种动态部件二三拆分的计算机汉字输入方法 | |
CN1120406C (zh) | 计算机汉字部首输入方法 | |
CN1347024A (zh) | 拼音简化字繁体字通用的自然读成码输入法 | |
CN1119740C (zh) | 首尾特征码汉字计算机键盘输入法 | |
CN1037599A (zh) | 笔顺结构六笔拼形汉字编码通用方案 | |
CN1134726C (zh) | 拼音双形识别码计算机汉字输入方法 | |
CN1136493C (zh) | 一种汉字输入方法 | |
CN1151540A (zh) | 四合一码计算机汉字编码输入法 | |
CN1108552C (zh) | 拼音汉字完善汉字法(phf) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C01 | Deemed withdrawal of patent application (patent law 1993) | ||
WD01 | Invention patent application deemed withdrawn after publication |