CN1078316A - 123汉字编码法及其键盘 - Google Patents
123汉字编码法及其键盘 Download PDFInfo
- Publication number
- CN1078316A CN1078316A CN 92114330 CN92114330A CN1078316A CN 1078316 A CN1078316 A CN 1078316A CN 92114330 CN92114330 CN 92114330 CN 92114330 A CN92114330 A CN 92114330A CN 1078316 A CN1078316 A CN 1078316A
- Authority
- CN
- China
- Prior art keywords
- code
- word
- initial consonant
- stroke
- coding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明涉及一种实用的汉字编码方法及其键
盘。本发明以三类编码元素——声母码、双笔画码和
单笔画码对字和词组进行编码,并设计了专用键盘。
本发明具有规则简捷明了、强制记忆量少、平均码长
较小、重码率较低等优点,因而既适合于专职使用,又
易于推广普及。
Description
本发明涉及一种实用的汉字编码方法及其键盘。
现有的汉字编码方法,从编码对象来分,有音码、形码和音形组合码三大类。音码的典型代表是简拼法与马庆勇先生的“一种汉字声、韵双拼编码的方法”(CN1049921A,以下简称马码),形码的典型代表是四角号码与王永民先生的五笔字型(以下简称王码);音形组合码的典型代表是杜冰蟾小姐的“汉字全息码”(CN1043016A,以下简称杜码),与肖水清先生的“无理序号数字编码法及其键盘”。(CN1050273A,以下简称肖码)。上述各种编码方法都各具特色,但也各有缺陷。简拼法与马码具有重码率高,不完全掌握汉语拼音者不易使用等缺点;四角号码的主要缺点在于码长较大、重码率较高;“王码”是目前最为著名的一种编码方法,其优点在于重码率极低,平均码长很小,因而便于高速盲打,尤其适合于专职打字人员使用;但其最大的不足在于编码规则很复杂、规则所需的强制记忆量很大,因而难于在一般学生和职员阶层推广。“杜码”和“肖码”保留了“五笔字型”的主要长处,并使其缺点的严重程度有所下降,但总的来说,编码规则较复杂、规则所需强制记忆量较大等问题仍成为“杜码”与“肖码”广泛推广的一大障碍。可见,上述几种较为流行的编码方法,如“王码”、“杜码”、“肖码”等,都具有高效性强、易学性弱之特点。易学性弱的根本原因则在于这些编码方法都没有摆脱把部首作为编码对象的常规思路。
本发明的目的在于提供一种兼顾高效性和易学性的实用汉字编码方法及其专用键盘。本编码方法以字音的声母部分和字形的有序笔画作为编码对象,亦属于音形组合码。
本发明的具体编码方法如下:
一、编码元素
编码原素分为声母码、双笔画码、单笔画码三种,均以英文字母表示。为了便于区别,在下文中,拼音的声母采用小写字母,编码元素采用大写字母。
二、声母码的取码规则
考虑到完全掌握汉语拼音并非易事,但大致了解拼音的声母则不难做到。声母码是由字音的声母部分确定的编码元素,具体的取码规则如下:
1、对于有声母的汉字,若声母只有一个字母,则取该声母为该字的声母码。
例如,“人”的声母码为R,“的”的声母码为D。
事实上,这类声母包括除zh、ch、sh以外的所有声母。
根据汉语拼音方案,i行和
行韵母,前面没有声母时,在声母位置写上y,并对韵母部分作适当处理;u行韵母,前面没有声母时,在声母位置写上w,并对韵母部分作适当处理。对于这些特殊情况,本发明视同有声母情况对待。
例如:“衣”的声母码为Y,“王”的声母码为W。
2、对于有声母的汉字,若该声母含有一个以上字母,则取该声母的第一个字母为该字的声母码。
例如,“之”的声母为zh,故其声母码为Z
“少”的声母为sh,故其声母码为S
事实上,这类声母只涉及zh、ch、sh三个。这一规则从根本上避免了许多人zh与z,sh与s,ch与c混淆不清的难题。
3、对于无声母的汉字,取字母V为该汉字的声母码。
例如,“安”、“儿”、“欧”等都无声母,故它们的声母码都为V。
取字母V为无声母字的声母码的原因有两条:首先,V不是拼音字母;其次,英语单词Vacant易使人联想到声母“空缺”。
由上述规则可知,声母码共有21个。
此外,考虑到某些地区的发音习惯,本发明允许把声母码L与R混同使用,请参见容错码部分。
三、笔画码的取码规则
1、汉字的基本笔画及其分类规则
根据对汉字笔画的常规认识,将汉字的基本笔画分为横、竖、撇、点、折五类,分别以“一”、“丨”、“丿”、“丶”、“乛”表示。须补充说明的笔画分类规则如下:
C、捺(丿),如“文”、“收”之末笔,均归入点类;
E、撇,当与点(或捺)相连而且基本对称时,归入点类,例如,“小”、“少”、“羊”、“业”、“学”、“共”中的撇,均应归入点类。又如“木”、“禾”、“米”(作部首时,分别为“木”、“禾”、“米”)的例数第二笔撇,也都应归入点类。
2、笔画顺序规则
根据一般的汉字书写习惯,规定如下笔画顺序规则。
A、先横后竖 例如,十:一→十
王:二→王
B、先撇后捺 例如,人:丿→人
木:
→木
C、从上到下 例如,合:人→亼→合
而:一→丆→而
D、从左到右 例如,作:亻→作
州:
→州
向:
→向
G、先中间后两边 例如,小:亅→
→小
H、(例外规则)先里后外 例如,过:寸→过
建:聿→建
3、双笔画码的取码规则
双笔画码是由顺序相连的前笔画与后笔画所确定的编码元素。五种基本笔画,两两组合共形成25种双笔画码,具体的取码规则如下:
上述规则并非随意设置,参见说明书附图所示之键盘,不难发现其规律性。下文所称首双笔画码,指字的第一、第二笔画所确定的双笔画码;次双笔画码指字的第三、第四笔画所确定的双笔画码;末双笔画码指字的倒数第二及最末笔画所确定的双笔画码。
4、单笔画码的取码规则
规定字母M为单笔画码,(可联想英语单词mono-stroke,意为“单笔画”)。在本发明中,单笔画码仅用于笔画数为一、三、五的字的末笔画的编码。
四、字的编码规则
字的编码规则与字的笔画数有关,具体规则如下:
1、一笔画字
编码=声母码+单笔画码
例如,一→y+一→YM
2、二笔画字
编码=声母码+双笔画码
例如,十→sh+一丨→SR
力→亅+乛丿→LK
3、三笔画码
编码=声母码+首双笔画码+末单笔画码
例如,小→x+乛丶+丶→XLM
才→ch+一乛+丿→CQM
4、四笔画字
编码=声母码+首双笔画码+末双笔画码
例如,王→w+一一+丨一→WTG
艺→y+一丨+丨乛→YRA
5、五笔画字
编码=声母码+首双笔画码+次双笔画码+末单笔画码
例如,示→sh+一一+乛丶+丶→STLM
付-f+丿丨+一乛+丶→FVQM
6、六及六以上笔画字
编码=声母码+首双笔画码+次双笔画码+末双笔画码
例如,吉→j+一丨+一丨+乛一→JRRH
项→x+一丨+一一+丿丶→XRTX
治→zh+丶丶+丶乛+乛一→ZOPH
群→q+乛一+一丿+一丨→QHER
五、词组的编码规则
词组的编码规则与词组的字数有关,具体规则如下:
1、二字词
编码=第一字的声母码+第二字的声母码+第一字的首双笔画码+第二字的首双笔画码
例外情况是,当词组中的某个字仅有一笔画时,取其单笔画码代替上式中该字的“首双笔画码”。
例如,一起→y+q+一+一丨→YQMR
人民→r+m+丿丶+乛一→RMXH
2、三字词
编码=第一字的声母码+第二字的声母码+第三字的声母码+第一字的首双笔画码。
例外情况里,当词组的第一字仅有一笔画时,取其单笔画码代替上式中的“第一字的首双笔画码”。
例如,科学家→k+x+j+丿一→KXJB
新产品→x+ch+p+丶一→XCPY
3、四及四以上字的词
编码=第一字的声母码+第二字的声母码+第三字的声母码+最末字的声母码
例如,实事求是→sh+sh+q+sh→SSQS
中国科学院→zh+g+k+y→ZGKY
有志者事竟成→y+zh+zh+ch→YZZC
六、简码的确定方法
对于使用频率高的字,本发明专门设置了简码,以降低字的平均码长,提高使用效率。简码的确定方法如下:
为了便于分析,设α、β、μ、δ都代表本发明任一编码元素。
1、首缀码的定义
(1)若αβμδ为某字的编码,则定义αβμδ、αβμ、αβ、α都为该编码的前缀码;
(2)若αβμ为某字的编码,则定义αβμ、αβ、α都为该编码的前缀码;
(3)若αβ为某字的编码,则定义αβ、α都为该编码的前缀码;
(4)若α为某字的编码,则定义α为该编码的前缀码。
2、简码的确定规则
对于所有编码中含有同一前缀码的字,若该前缀码未成为某字的编码,则确定该前缀码为其中使用频率最高的字的简码。具体规则如下:
(1)对于所有编码中含有前缀码αβμ的字,若αβμ未成为某字编码,则确定αβμ为其中使用频率最高的字的简码,并称这种简码为三级简码。
例如,在所有编码中含有SOU的字中,“沙”(编码为SOUI)的使用效率最高,(其它的字如“湿”-编码为SOUY,“汕”-编码为SOUJ),且SOU未成为某字的编码,故确定SOU为“沙”的三级简码。
(2)对于所有编码中含有前缀码αβ的字,若αβ未成某字的编码,则确定αβ为其中使用频率最高的字的简码,并称这种简码为二级简码。
例如。在所有编码中含有前缀码JR的字中,“机”(编码为JROZ)的使用频率最高,(其它的字,如“教”-编码为JREX,“警”-编码为JRDH),且JR未成为某字的编码,故确定JR为“机”的二级简码。
(3)对于所有编码中含有前缀码α的字,确定α为其中使用频率最高的字的简码,并称这种简码为一级简码。
例如,在所有编码中含有前缀码D的字中,“的”(编码为DVHL)的使用频率最高,(其它的字,如“大”-编码为DEM,“到”-编码为DQYA),故确定D为“的”的一级简码。
由上述规则可知,具有一级简码的字必有二级、三级简码,具有二级简码的字必有三级简码,反之就不一定成立。
七、容错码的说明
本发明考虑到有某些字或词组,其编码不易确定或容易有误,故允许存在少量的容错码,容错码的基本类型有以下两类:
1、声母容错码
考虑到某些地区的发音习惯,本发明允许,而且仅允许两个声母码混同使用,它们是L与R。显然,声母容错码的位置在编码的第一位。
例如“人”的编码为RX,其容错码为LX
“来”的编码为LWYO,其容错码为RWYO
“人民”的编码为RMXH,其容错码为LMXH
2、笔画容错码
考虑到某些字的笔画顺序难以确定,如“义”字,《辞海》确认其首笔为撇,而《汉字正字字典》确认其首笔为点。本发明根据一般书写习惯的笔顺来确定编码的笔画码部分,但也按某种易错的笔顺来确定容错码的笔画码部分,即笔画容错码。显然,笔画容错码的位置在编码的第二至第四位。
例如:义→y+丶丿+丶→YIM(编码)
→y+丿丶+丶→YXM(容错码)
王→w+一一+丨一→WTG(编码)
→w+一丨+一一→WRT(容错码)
义务:编码为YWIZ,容错码为YWXZ。
上述两类容错码组合在一起,便构成综合容错码,其数量极少。如,“轮”编码为LQRK,容错码为RQGK。可见综合容错码的容错位至少有两位,其中一位为编码的第一位,另外的容错位在编码的第二至四位。
八、重码的说明
所谓重码,是指这样一种编码,它所代表的字或词组的数量超过一个。本发明允许存在极少量的重码。
例如:编码YM所代表的字包括“一”和“乙”等。
编码SATT所代表的字包括“暑”、“曙”等。
本发明严格限制重码率,重码率在3%以内。
为了将本发明的汉字编码方法应用于键盘输入,本发明还设计了专用键盘,其特点是:将二十五种双笔画码和一种单笔画码有规律地分配在通用的英文键盘的英文字母部分,并增设了四个专用功能键。具体键盘设计请参见说明书附图。说明书附图仅给出通用英文键盘的一部分,在这一部分,本发明作了专门设计,共包括三十个键(即二十六个编码元素键和四个功能键)。
四个功能键为:辅助键、标点键、英汉键、汉英键,分别介绍如下:
1、辅助键:全称为辅助编码键,以“?”表示,当某个编码中的某一位难以确定或不愿确定时,可用辅助键代替,并通过屏幕菜单进行选择。若编码的连续若干位难于确定或不愿确定时,则用同样数量的辅助键代替。
例如:编码WXYZ,可通过输入WXY?、W?YZ、?XYZ、??YZ、W???等来选择。
辅助键的设置至少可以解决以下两个问题:
(1)不会读的字的编码:声母码用辅助键代替。例如“靓”不会念,可输入?TGZ。
(2)笔顺难于确定的字的编码:在笔画码部分的某位或某几位用辅助键代替。如,“义”笔顺搞不清,可输入Y?M。
2、标点键:全称为标点符号键,以“:”表示。考虑到一般英文键盘上的标点符号种类不多,不能完全满足汉语文章对标点符号的需要,故本发明设置专用的标点键。只要按下标点键,即可得到全部汉语标点符号的屏幕菜单。
3、英汉键:全称为英汉状态切换键,以“>”表示。其功能为实现从键盘输入的英文状态向本编码状态的切换。
4、汉英键:全称为汉英状态切换键,以“<”表示,其功能为实现从键盘输入的本编码状态向英文状态的切换。
还应指出,键盘输入的初始状态为英文状态,此后通过英汉键和汉英键进行状态的双向切换,而且在每种状态下,数字键和其它未标有特殊符号的键都可照常使用。
下面简要地谈谈本发明的名称问题,通过上述描述可以知道:一个典型的汉字(指六及六以上笔画的字),其编码为:一个声母码+双笔画码×3,其抽象表达式为:1+2×3,用最简捷的形式可缩写为“123”。故本发明称作“123汉字编码法及其键盘”,其中的“123”既反映本编码方法的实质性内容,又容易记忆、给人亲切感。本编码方法可以简称为“123码”。
本发明所提供的汉字编码方法在应用上具有以下特点:编码规则简捷明了,强制记忆量极少,重码率低于3%,实际使用时平均码长少于2.5个。与其它各种编码方法相比,本发明更好地考虑了上述指标的综合平衡,即更好地兼顾了编码方法的高效性与易学性,因而本发明既适合于专职使用,又易于推广普及。
本发明的应用领域至少包括两个方面:信息处理机器(如电子计算机、文字处理机等)的汉字输入,汉语字典及其它字典的汉字查字等。有理由相信,本发明将具有广阔的应用前景。
Claims (5)
1、一种汉字编码方法,以汉字的音和形的特性对字和词组进行编码,其特征在于:
(1)编码元素分为声母码、双笔画码和单笔画码三类,均以英文字母表示。
(2)声母码的取码规则如下:
A、对于有声母的字(包括声母位置为y和w的字),若该声母(或声母位置)只含有一个字母,则取该声母为该字的声母码;
B、对于有声母的字,若该声母含有一个以上字母,则取该声母的第一个字母为该字的声母码;
C、对于无声母的字,规定字母V为该字的声母码。
共有声母码21个。
(3)笔画码的取码规则如下:
A、双笔画码:由汉字的五种基本笔画-横、竖、撇、点、折两两组合,形成25种双笔画码,具体取码规则如下表:
B、单笔画码的取码规则如下:规定字母M为单笔画码。
(4)字的编码规则如下:
A、一笔画字:声母码+单笔画码
B、二笔画字:声母码+双笔画码
C、三笔画字:声母码+首双笔画码+末单笔画码
D、四笔画字:声母码+首双笔画码+末双笔画码
E、五笔画字:声母码+首双笔画码+次双笔画码+末单笔画码
F、六及六以上笔画字:声母码+首双笔画码+次双笔画码+末双笔画码
(5)词组的编码规则如下:
A、二字词:第一字的声母码+第二字的声母码+第一字的首双笔画码+第二字的首双笔画码
二字词编码时,若某个字为一笔画字,则以单笔画码代替上式中的该字的“首双笔画码”。
B、三字词:第一字的声母码+第二字的声母码+第三字的声母码+第一字的首双笔画码
三字词编码时,若第一字为一笔画字,则以单笔画码代替上式中的“第一字的首双笔画码”。
C、四及四以上字的词:第一字的声母码+第二字的声母码+第三字的声母码+最末字的声母码。
2、如权利要求1所述的编码方法,其特征在于字的简码的确定规则如下:
对于所有编码中含有同一前缀码的字,若该前缀码未成为某字的编码,则确定该前缀码为其中使用频率最高的字的简码。
3、如权利要求1所述的编码方法,其特征在于存在如下容错码:
(1)声母容错码:允许声母码L与R混同使用。
(2)笔画容错码:对于少量笔画顺序较准确定的字,允许按不同于正确笔顺的某种笔顺进行编码。
4、一种适用于权利要求1所述的汉字编码方法的专用键盘,其特征在于:将二十五种双笔画码和一种单笔画码有规律地分配在通用英文键盘的英文字母部分,并增设四个专用功能键。
5、如权利要求4所述的键盘,其特征在于所述的四个专用功能键分别为:
(1)辅助键:当某个字或词组的编码的某一位难以确定或不愿确定时,可用辅助键代替。
(2)标点键:标点键被使用后,将出现所有汉语标点符号的选择菜单。
(3)英汉键:其功能为实现从键盘输入的英文状态向本编码状态的切换。
(4)汉英键:其功能为实现从键盘输入的本编码状态向英文状态的切换。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 92114330 CN1078316A (zh) | 1992-12-03 | 1992-12-03 | 123汉字编码法及其键盘 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 92114330 CN1078316A (zh) | 1992-12-03 | 1992-12-03 | 123汉字编码法及其键盘 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1078316A true CN1078316A (zh) | 1993-11-10 |
Family
ID=4946891
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 92114330 Pending CN1078316A (zh) | 1992-12-03 | 1992-12-03 | 123汉字编码法及其键盘 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1078316A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102902364A (zh) * | 2011-07-25 | 2013-01-30 | 张仁平 | 零记忆双笔画输入法 |
-
1992
- 1992-12-03 CN CN 92114330 patent/CN1078316A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102902364A (zh) * | 2011-07-25 | 2013-01-30 | 张仁平 | 零记忆双笔画输入法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1023916C (zh) | 简繁五笔字根汉字输入系统 | |
CN101038508A (zh) | Gb拼音输入法 | |
CN1039132A (zh) | 音形笔画综合编码汉字高速输入法及所用键盘 | |
CN1078316A (zh) | 123汉字编码法及其键盘 | |
CN1648836A (zh) | 用于触摸屏输入的软键盘 | |
CN1103181A (zh) | 多键并击式高速汉字输入方法及键盘装置 | |
CN1059281C (zh) | 汉字声韵调三拼音形编码输入方法 | |
CN1052200A (zh) | 音形义字词兼容编码系列及键盘 | |
CN100342310C (zh) | 二分汉字编码小键盘输入及其显示方法 | |
CN1081004A (zh) | 汉字结构笔顺数字编码方法 | |
CN101055499A (zh) | 音形汉字输入法 | |
CN1118085A (zh) | 可用数字键盘输入的汉字输入系统及其键盘 | |
CN1257445C (zh) | 音义码汉字输入方法 | |
CN100338560C (zh) | 汉字笔画部件编码输入法及键盘 | |
CN1347023A (zh) | 二笔手写智能输入系统 | |
CN1256644C (zh) | 一种偏旁部首汉字输入方法 | |
CN1288185A (zh) | 音形字理码汉字输入方法 | |
CN1037043A (zh) | 计算机汉字输入方法 | |
CN1196989C (zh) | 汉字形体示意输入法及其键盘 | |
CN1162766C (zh) | 一种汉字音形编码输入方法 | |
CN1023917C (zh) | 汉语文字处理之方法 | |
CN1026829C (zh) | 中文头尾码输入法及其键盘装置 | |
CN1554994A (zh) | 与数字符号象形相关式手机汉字输入法及其键盘 | |
CN1056357A (zh) | 中文输入法 | |
CN1059508C (zh) | 中文电脑笔结编码输入法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C01 | Deemed withdrawal of patent application (patent law 1993) | ||
WD01 | Invention patent application deemed withdrawn after publication |