CN1066131A - 汉字输入大众音型码方案 - Google Patents
汉字输入大众音型码方案 Download PDFInfo
- Publication number
- CN1066131A CN1066131A CN 91106400 CN91106400A CN1066131A CN 1066131 A CN1066131 A CN 1066131A CN 91106400 CN91106400 CN 91106400 CN 91106400 A CN91106400 A CN 91106400A CN 1066131 A CN1066131 A CN 1066131A
- Authority
- CN
- China
- Prior art keywords
- dian
- chinese
- pie
- code
- shu
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明的主要特点是:
一、浅显简洁。除键盘的26个字母外,只有汉字
的横(一)、竖(丨)、撇(丿)、捺(、)、折(乙)等五个笔画
有规律地组成的25个“笔画代码”;而韵母代码
“a*”、“e*”、“o*”、“i*”、“u*”和韵尾识别码“a、
e、g、r、n、i、o、u”的编码结合即为相应韵母的首、尾2
个字母,无需记忆。牢记“零韵尾”约定为“q”即可。
二、字、词编码的容量大、重码少、兼容性强。
三、字、词编码信息能用拼音头字母表音(或表音
且在一定程度上表形)。
Description
作者在原“电脑汉字输入五韵五笔码”(申请号:90108803X;申请日:90年10月29日)的《说明书》(修改稿)中,提出了三种编码方式:五韵五笔、五笔首尾和五笔快速。现将(修改稿)再略加改良,从原“五韵五笔”的编码码长为4位而统一改为5位,增大了单字的编码容量,从而解决了单字编码重码还偏高的不足,更名为“音型快速”,保留了原编码的简洁性和其它优点,它与原《说明书》(修改稿)的“五笔快速”合称为“汉字大众音型码”。
此方案汉语拼音字母对应键盘英文字母,把35个汉语拼音韵母划分为:“a*”、“e*”、“o*”“i*”和“u*”五大类作为“韵母代码”,结合用“a、e、g、r、n、i、o、u”作为韵母的“韵尾识别码”去表音(这样,能组成26个二键位的信息码去识别35个韵母);以汉字的五笔画有规律的组合来表型,并以《辞海》的“笔画查字表说明”作为汉字五种笔画的划分依据,汉字首二笔笔画及笔顺的确定亦以《辞海》的“笔画查字表”作为规范,尾二笔画的确定依照一般的书写习惯,同时考虑有利于识别为原则(例如,“钱”字末二笔画取“乙丿”);采用了先进的“五笔字型”字母区位码和标点的键盘设置。
6763个通用汉字的编码方法及其输入操作的实际作用过程:
用23个拼音声母(含Y、w)首先区分,次用5个韵母代码(“a*”、“e*”、“o*”“i*”和“u*”)去区分,再次用韵尾“a、e、g、r、n、i、o、u”去识别,再用25个汉字的首二笔码去区分,最后用25个汉字的尾二笔码去确认。即:
拼音头字母+(韵母代码+韵尾识别码)+汉字首二笔码+汉字尾二笔码。
这样,单字的编码最大容量约为:23*(26)*25*25=37万(个),给6763个单字的编码极少重码。
这样,双音节词汇编码容量约为:24的四次方=33万多(个)。若给3万3千个双音节的汉语词汇编码,其重码的可能性还很少(通过对4千个双音词的编码统计,其重码率约为1%);因为,一个词码已含有6个信息(2个音4个笔画笔顺),并且达到绝大部分不与单字重码-因单字第二码只用(“韵母代码”)仅有5个,而词汇的第二码是用(第二音节汉字的拼音声母)23个,而且韵母“a*、e*、i*、o*、u*”中“i”与“u”不作声母代码;“a*、e*、o*”独立为音节时汉字的声母才分别约定为“A、E、O”(见编码“说明”),又因为这类型的汉字仅仅占有极少数的比例,极大地降低了单字与词汇编码重码的概率。因此,从第二码开始绝大部分的字码与词码自然隔离,可实现输入方法的系列化、科学化。(见编码方式一)
可见其字、词兼容性之强,是其它编码方法难以获得的;这是“音型快速码”的优越性之一。
其编码的容量为:23的三次方=1万多(个),因为三音词第四码统一使用字母“O”而一般不会与其他单字、双音、四音节的词汇重码。
其编码的容量约为:23的四次方=28万个。
(双音词和四音节的编码容量33万,不含单字、三音词的编码容量)。
四音节的词汇编码方法可扩展到语句的编码,见编码规则。综上所述,方案有如下的主要特点:
一、浅显简洁。除键盘的26个字母外,只有汉字的横(一)、竖(丨)、撇(丿)、捺(丶)、折(乙)等五个笔画有规律地组成的25个“笔画代码”;而韵母代码“a*”、“e*”、“o*”、“i*”、“u*”和韵尾识别码“a、e、g、r、n、i、o、u”的编码结合即为相应韵母的首、尾2个字母,无需记忆。牢记“零韵尾”约定为“q”即可。
二、字、词编码的容量大、重码少、兼容性强;提供了一种建立大容量的双音词库之简易方法,从而能够实现中文输入技术的“以字为主,以词为辅”向“以词为主,以字为辅”方向发展。
三、字、词编码信息能用拼音头字母表音(或表音且在一定程度上表形)。提供了以表音为主的“音型快速”和以表型为主的“五笔快速”两种输入方式,同时取码方法系列化,输入方便简捷、灵活多样。取全码则字、词都可以实现快速盲打。
现行的编码方案各有其优点,亦必然会有其不足。“尺有所短,寸有所长”,“汉字大众音型码”亦然。如果说,五位码长比其它通行的四位码长编码是个不足的话;那么“大众音型码”的简洁性和其它优点,足以弥补它自身的缺点。
敬请评审员和专家们教正!!
三、说明
一、汉语拼音字母的编码采用“五笔字型”区位码。汉语拼音的23个声母(包括Y、W)与键盘的英文字母一一对应,zh、ch、sh分别与z、c、s合拼,排列在各个键位的左上角(好处有三:1、减少代码。2、减少字码与词码重码的机遇。3、南方人讲普通语,往往zh与z、ch与c、sh与s难分清发音,可方便输入操作)。“a*”、“e*”、“o*”等三类韵母独立为音节时,声母分别约定为:“A”、“E”、“O”等(可以解决拼音的输入拼写的等码长,并且利于词汇编码从字库中有规律地取码)。
二、韵母编码:将35个韵母区分为“a*”、“e*”、“o*”“i*”和“u*”五大类,作为韵母代码,对应排列在键盘A、E、O、I、U键的右上角;以“a”、“e”、“g”、“r”、“n”、“i”、“o”“u”和“零韵尾”(约定为“q”)作韵母的“韵尾识别码”,排列在对应键位的右下角。简言之,韵母的编码取韵母的首、尾2个字母,韵母为单字母的以“q”补充。这样,能组成26个二键位的信息码去识别35个韵母。(以上叙述虽然显得有点“繁锁”,但能使单字的编码信息更形象地表音,几乎能被认读)
①、“a*”代替(a、ai、ao、an、ang)等5个韵母;
②、“e*”代替(e、ei、en、eng)等4个韵母;
③、“o*”代替(o、ou、ong)等3个韵母;
④、“i*”代替i行10个韵母(i、ia、ie、iao、iou、ian、in、iang、ing、iong);
⑤、“u*”代替u行和ü行韵母(u、ua、uo、uai、uei、uan、uen、uang、ueng和ü、üe、üan、ün)等13韵母。
三、汉字五种笔画的划分:以《辞海》的“笔画查字表说明”作为汉字五种笔画的划分依据,依次分为横(一与 )、竖(丨)、撇(丿)、点(丶与 )、折(乙,包括笔型带钩或曲折的)。汉字首二笔笔画及笔顺的确定亦以《辞海》的“笔画查字表”作为规范,尾二笔画的确定依照一般的书写习惯,同时考虑有利于识别为原则(例如,“钱”字末二笔画取“乙丿”)。
四、汉字的首二笔画和尾二笔画的编码:一一、一丨、一丿、一丶、一乙;丨一、丨丨、丨丿、丨丶、丨乙;丿一、丿丨、丿丿、丿丶、丿乙;丶一、丶丨、丶丿、丶丶、丶乙;乙一、乙丨、乙丿、乙丶、乙乙。依次编入11、12、13、14、15;21、22、23、24、25;31、32、33、34、35;41、42、43、44、45;51、52、53、54、55区位(对应G、F、D、S、A、;H、J、K、L、M;T、R、E、W、Q;Y、U、I、O、P、;N、B、V、C、X键)。
五、字母“O”约定为三音词的第四码。空格键区位约定为“00”。
四、编 码 规 则
方式一 音型快速
一、单字的编码
单字编码公式:拼音头字母+韵母代码+韵尾识别码+汉字首二笔码+汉字尾二笔码。
音型快速码 字母码 区位码
例如,
shen 深:S e*n 丶丶 丿丶 SENOW 14 33 51 44 34
ru 入:R u*q 丿丶 丿丶 RUQWW 32 42 35 34 34
qian 浅:Q i*n 丶丶 乙丿 QINOV 35 43 51 44 53
chu 出:C u*q 乙丨 乙丨 CUQBB 54 42 35 52 52
yin 音:Y i*n 丶一 一一 YINYG 41 43 51 41 11
xing 型:X i*g 一一 丨一 XIGGH 55 43 11 11 21
zhi 直:Z i*q 一丨 一一 ZIQFG 66 43 35 12 11
guan 观:G u*n 乙丶 丿乙 GUNCQ 11 42 51 54 35
注:1、啊…(a)、埃…(ai)、安…(an)、肮…(ang)、凹…(ao);蛾…(e)、而…(ei);欧…(ou)等几种汉字的分别用(A+a*+韵尾识别码+汉字首二笔码+汉字尾二笔码),(E+e*+韵尾识别码+汉字首二笔码+汉字尾二笔码),(O+o*+韵尾识别码+汉字首二笔码+汉字尾二笔码)的方法编码。
2、不足四笔画的汉字笔画码作如下处理:
①一笔画的汉字只有“一”和“乙”2个,分别定义为:“Y i*q一一 一一”和“Y i*q乙乙 乙乙”。
②二笔画的汉字,既是首二笔码又看作是尾二笔码。
音型快速码 字母码 区位码
例如,儿:E e* r 丿乙 丿乙 EERQQ 33 33 32 35 35
刁:D i* o 乙一 乙一 DIQNN 13 43 44 51 51
③三笔画的汉字,中间的笔画既是首二笔码的第二笔画,又是尾二笔码的第一笔画。
音型快速码 字母码 区位码
例如,工:G o*g 一丨 丨一 GOGFH 11 44 11 12 21
久:j i*u 丿乙 乙丶 JIUQC 22 43 42 35 54
输入方法举例介绍:
取一码:(23个声母分别给对应的10个高频汉字编码)
例如,Q:显示 1:却 2:其 3:七 4:柒 5:千 6:起 7:前 8:区 9:钱 0:浅
G:显示 1:个 2:共 3:根 4:各 5:给 6:国 7:高 8:贵 9:过 0:刚
H:显示 1:和 3:号 3:很 4:好 5:河 6:会 7:华 8:何 9:贺 0:红
(第一个单字可用空格键输入)
取二码:例如,浅(Qian)
浅:Q i*(选择输入)
显示:1:期 2:欺 3:栖 4:戚 5:妻 6:七 7:凄 8:漆 9:柒...>>浅...
取三码:
浅:Q i*n(选择输入)
显示:1:牵 2:扦 3:钎 4:铅 5:千 6:迁 7:签 8:仟...>浅...
取四码:
浅:Q i*n 丶丶(无重码可用空格键输入,有则选择输入)
显示:1:前 2:潜 3:浅 4:歉
取五码:
浅:Q i*n 丶丶 乙丿(自动进入)
二、双音词的编码
音型快速码 字母码 区位码
中国:Z G 丨乙 丨乙 ZGMM 66 11 25 25 00
输入方法举例:如上例,人民
取二码:
人民:R M(选择输入)
显示:1:人民2:人们3:人名4:人命5:人马6:任免7:任命
取三码:
人民:R M 丿丶(无重码可用空格键输入,有则选择输入)
显示:1:人民2:人们3:人名4:人命5:人马
取四码:
人民 R M 丿丶 乙一(+空格键输入)
显示:1:人民
三、三音词的编码
音型快速码 字母码 区位码
大众化:DZHO 13 66 21 44 00
(取三键无重码可用空格键输入,有则可选择输入)
四、四音词的编码
音型快速码 字母码 区位码
突飞猛进:TFMJ 31 12 25 21 00
精益求精:JYQJ 22 41 35 22 00
(取三键无重码可用空格键输入,有则可选择输入)
五、五音节以上词、句的编码
采用“一、二、三、尾”头字母键+ 。
音型快速码 字母码 区位码
例如,
中华人民共和国:ZHRG 66 21 32 11 00
方式二 五笔快速
一、单字的编码
单字编码公式:汉字首二笔码+汉字尾二笔码+拼音头字母+韵母代码+韵尾识别码.
五笔快速码 字母码 区位码
例如,
shen 深:丶丶 丿丶 S e*n QWSEN 44 35 14 33 51
ru 入:丿丶 丿丶 R u*q WWRUQ 34 34 32 42 35
qian 浅:丶丶 乙丿 Q i*n OVQIN 44 53 35 43 51
chu 出:乙丨 乙丨 C u*q BBCUQ 52 52 54 42 35
yin 音:丶一 一一 Y i*n YGYIN 41 11 41 43 51
xing 型:一一 丨一 X i*g GHXIG 11 21 55 43 11
zhi 直:一丨 一一 Z i*q FGZIQ 12 11 66 43 35
guan 观:乙丶 丿乙 G u*n CQGUN 54 35 11 42 51
输入方法举例:如上例,浅
取一码:选择输入(23个声母分别给对应的10个高频汉字编码)
Q:显示 1:却 2:其 3:七 4:柒 5:千 6:起 7:前 8:区 9:钱 0:浅
取二码:
浅:丶丶 乙丿(选择输入)
显示:1:穿 2:减 3:溅 4:浅 5:馘……
取三码:
浅:丶丶 乙丿 Q(无重码可用空格键输入,有则选择输入)
显示:1:浅
取四码:
浅:丶丶 乙丿 Q i*(无重码可用空格键输入,有则选择输入)
显示:1:浅
取五码:
浅:丶丶 乙丿 Q i*n(自动进入)
二、双音词的编码
五笔快速码 字母码 区位码
取三码:例如,
人民:丿丶 丿丶 乙一(无重码可用空格键输入,有则选择输入)
显示:1:领导 2:人民
取四码:
人民:丿丶 丿丶 乙一 一乙(+空格键输入)
显示:1:人民
三、三音词的编码
三音词编码公式:第一音节汉字首二笔码+第二音节汉字首二笔码+第三音节汉字首二笔码+O+ 。
五笔快速码 字母码 区位码
(取三码而无重码可用空格键输入,有则可选择输入)
四、四音词的编码
四音词编码公式:第一音节汉字首二笔码+第二音节汉字首二笔码+第三音节汉字首二笔码+第四音节汉字首二笔码+ 。
五笔快速码 字母码 区位码
精益求精:丶丶 丶丶 一乙 丶丶 OOAO 44 44 15 44 00
(取三码而无重码可用空格键输入,有则选择输入)
五、五音节以上词、句的编码
附录:
原“电脑汉字输入五韵五笔码”
一、单字的编码
单字编码公式:拼音头字母+韵母代码+汉字首二笔码+汉字尾二笔码。
五韵五笔码 字母码 区位码
例如,
shen 深:S e* 丶丶 丿丶 SEOW 14 33 44 34
ru 入:R u* 丿丶 丿丶 RUWW 32 42 34 34
qian 浅:Q i* 丶丶 乙丿 QIOV 35 43 44 53
chu 出:C u* 乙丨 乙丨 CUBB 54 42 52 52
yin 音:Y i* 丶一 一一 YIYG 41 43 41 11
xing 型:X i* 一一 丨一 XIGH 55 43 11 21
zhi 直:Z i* 一丨 一一 ZIFG 66 43 12 11
guan 观:G u* 乙丶 丿乙 GUCQ 11 42 54 35
输入方法举例:
取一码:选择输入。(23个声母分别给对应的10个高频汉字编码)
例如,Q:显示 1:却 2:其 3:七 4:柒 5:千 6:起 7:前 8:区 9:钱 0:浅
G:显示 1:个 2:共 3:根 4:各 5:给 6:国 7:高 8:贵 9:过 0:刚
H:显示 1:和 3:号 3:很 4:好 5:河 6:会 7:华 8:何 9:贺 0:红
取二码:例如,浅(Qian)
浅:Q i*(选择输入)
显示:1:期 2:欺 3:栖 4:戚 5:妻 6:七 7:凄 8:漆 9:柒...>>浅...
取三码:
浅:Q i* 丶丶(无重码可用空格键输入,有则选择输入)
显示:1:凄 2:寝 3:漆 4:沏 5:汽 6:泣 7:洽 8:潜 9:浅...>...
取四码:
浅:Q i* 丶丶 乙丿(无重码则自动进入,有则选择输入)
显示:1:浅(此例自动进入,不再显示)
二、双音词的编码
双音词编码公式:第一音节汉字拼音头字母+第二音节汉字拼音头字母+第一音节汉字首二笔码+第二音节汉字首二笔码。
五韵五笔码 字母码 区位码
例如,人民:R M 丿丶 乙一 RMWN 32 25 34 51
中国:Z G 丨乙 丨乙 ZGMM 66 11 25 25
技术:J S 一乙 一丨 JSAF 25 14 15 12
输入方法举例:如,人民
取二码:
人民:R M(选择输入)
显示:1:人民2:人们3:人名4:人命5:人马6:任免7:任命
取三码:
人民:R M 丿丶(无重码用空格键输入,有则选择输入)
显示:1:人民2:人们3:人名4:人命5:人马
取四码:
人民:R M 丿丶乙一(自动进入)
三、三音词的编码
第一音节汉字拼音头字母+第二音节汉字拼音头字母+第三音节汉字拼音头字母+O(或空格键)。
五韵五笔码 字母码 区位码
例如,计算机:JSJO 22 14 22 44
新时代:XSDO 55 14 13 44
大众化:DZHO 13 66 21 44
四、四音词的编码
第一音节汉字拼音头字母+第二音节汉字拼音头字母+第三音节汉字拼音头字母+第四音节汉字拼音头字母。
五韵五笔码 字母码 区位码
例如,中华民族:ZHMZ 66 21 25 66
突飞猛进:TFMJ 31 12 25 21
精益求精:JYQJ 22 41 35 22
五、五音节以上词、句的编码
采用“一、二、三、尾”头字母键。
五韵五笔码 字母码 区位码
例如,
中华人民共和国:ZHRG 66 21 32 11
中国人民解放军:ZGRJ 66 11 32 22
中国科学院:ZGKY 66 11 23 41
Claims (1)
- 一种大众音型码输入方法,其特征在于:汉语拼音字母对应键盘英文字母,把35个汉语拼音韵母划分为:“a*”、“e*”、“o*”“i*”和“u*”五大类作为“韵母代码”,结合用“a、e、g、r、n、i、o、u”及“零韵尾”(约定为“q”)作为韵母的“韵尾识别码”及(简言之,韵母的编码取韵母的首、尾2个字母,韵母为单字母的以“q”补充)去表音;以汉字的五笔画有规律的组合来表型。把汉字的首二笔画和尾二笔画:一一、一丨、一丿、一丶、一乙;丨一、丨丨、丨丿、丨丶、丨乙;丿一、丿丨、丿丿、丿丶、丿乙;丶一、丶丨、丶丿、丶丶、丶乙;乙一、乙丨、乙丿、乙丶、乙乙。(依次对应编入G、F、D、S、A、;H、J、K、L、M;T、R、E、W、Q;Y、U、I、O、P、;N、B、V、C、X键)。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 91106400 CN1066131A (zh) | 1991-05-02 | 1991-05-02 | 汉字输入大众音型码方案 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 91106400 CN1066131A (zh) | 1991-05-02 | 1991-05-02 | 汉字输入大众音型码方案 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1066131A true CN1066131A (zh) | 1992-11-11 |
Family
ID=4907819
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 91106400 Pending CN1066131A (zh) | 1991-05-02 | 1991-05-02 | 汉字输入大众音型码方案 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1066131A (zh) |
-
1991
- 1991-05-02 CN CN 91106400 patent/CN1066131A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1113305C (zh) | 语言处理装置和方法 | |
CN1066133A (zh) | 智能五笔双拼汉字码方案 | |
CN101067780A (zh) | 智能设备的文字输入系统及方法 | |
CN1040276A (zh) | 简繁字根汉字输入技术及其键盘 | |
CN1066131A (zh) | 汉字输入大众音型码方案 | |
CN1399191A (zh) | 汉语语音识别词库的处理方法 | |
CN1123819C (zh) | 计算机汉字键位码输入方法 | |
CN1818837A (zh) | 规范应用汉语拼音方案的汉字输入法 | |
CN1374577A (zh) | 英文字母键盘和数字键盘通用汉字电脑输入法及其键盘 | |
CN1845053A (zh) | 手写拼式移动虚拟键盘认别拼音汉字英文输入技术 | |
CN1218217A (zh) | 一种计算机汉字编码和输入法 | |
CN1808351A (zh) | 声拼计算机汉字输入法 | |
CN1116334A (zh) | 林码汉字输入方法 | |
CN1673936A (zh) | 移动式电话设备8键位拼音双码汉字输入法 | |
CN1259615C (zh) | 字母键盘和数字键盘通用汉字输入法及其左半字形识别法 | |
CN1019527B (zh) | 字符的图元输入方法及其键盘 | |
CN1303504C (zh) | 计算机汉字字母文字化输入法 | |
CN1975640A (zh) | 规范应用汉语拼音方案的汉字输入法 | |
CN1309342A (zh) | 计算机汉字音形模糊输入法 | |
CN1120408C (zh) | 一种计算机结构声读汉字输入方法 | |
CN1397895A (zh) | 文字检索装置,文字检索方法及其程序 | |
CN1648827A (zh) | 笔画汉字输入法 | |
CN1713120A (zh) | 英文字根输入法 | |
CN1156744C (zh) | 元根码汉字输入方法 | |
CN1204482C (zh) | 三笔象形码输入法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C01 | Deemed withdrawal of patent application (patent law 1993) | ||
WD01 | Invention patent application deemed withdrawn after publication |