CN1343926A - 汉语字词全息编码计算机输入方法及键盘 - Google Patents

汉语字词全息编码计算机输入方法及键盘 Download PDF

Info

Publication number
CN1343926A
CN1343926A CN 01133203 CN01133203A CN1343926A CN 1343926 A CN1343926 A CN 1343926A CN 01133203 CN01133203 CN 01133203 CN 01133203 A CN01133203 A CN 01133203A CN 1343926 A CN1343926 A CN 1343926A
Authority
CN
China
Prior art keywords
code
sign indicating
key
indicating number
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 01133203
Other languages
English (en)
Other versions
CN1194287C (zh
Inventor
刘国桢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CNB011332034A priority Critical patent/CN1194287C/zh
Publication of CN1343926A publication Critical patent/CN1343926A/zh
Application granted granted Critical
Publication of CN1194287C publication Critical patent/CN1194287C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本发明汉语字词全息编码计算机输入方法及键盘,是一种利用汉字的声母和韵母组成音码,利用部件、笔画和笔形组成形码,进行全拼、双拼、形码和音形码不切换混合输入的编码系统。其优点是按《韵母表》定义键位输入音码;用13个数码作部件的代码输入形码;二者结合组成无重码输入的音形码。四种编码字符等长,自由兼容。编码方法科学,键盘设计合理,规则简明规范,操作简单快捷,是一种适合普及推广的汉语字词全息编码。

Description

汉语字词全息编码计算机输入方法及键盘
本发明汉语字词全息编码计算机输入方法及键盘属于数据处理装置,特别是一种汉字编码方法及其所用键盘,能以音码、形码、音形码三种方式,简便快速地把汉语字词输入计算机及其它类似设备,适用于打字、编排、索引、邮政编码、外文译码、条形码、电报交换码等多领域。编码规范,操作简单,成为一种可供专职和业余计算机操作者使用的多功能编码。
汉字编码主要有音码、形码、音形码三种。音码方法简单,但认读要求高,而且,全拼重码多,速度慢,双拼键位不规范,不好记,不利推广;形码没有认读要求,但部件(字根)量大,记忆难操作难,难于普及;音形码,未能兼二者之长,去二者之短,或规则繁难,或方法不规范,仍有很多不足。特别是在音码方案中,声码和韵码的键位设置,与《汉语拼音方案》中声母表和韵母表的形式不一致,不规范,难记忆,难操作;通用全拼码,最大码长为12,一个汉字多者要打6键(如“装”——ZHuang),一个词语多者要打12键,不但输入速度慢而且妨碍了与其它输入法的兼容性,若改为每个字符4位码,则有多方面的优越性。在形码方案中,只重视结构、部件、笔形的利用,而忽视了“笔画”这个区分度很高的因素。传统的笔画查字法和部首查字法都是通过“数笔画”来查字的,而在众多的汉字编码方案中,这个重要因素却没有得到充分利用。其实这是一种偏见,因为汉字的笔画很繁杂,少则一画,多则几十画,所以误认为无法用来编码。在音形码方案中,为了降低重码率而增加难度,牺牲了易学性,不利于普及推广。本人的四项发明专利:CN1064556A、CN1126854A、CN1161497A和CN1213795A,公开了四种编码方案,但在科学性、规范性、易学性上尚须进一步改进。特别是CN1213795A(授权公告号CN1054449C)方案,音码输入法只有双拼没有全拼,不利于初学者掌握;音码键位的设置没有与通用英文键盘键位完全一致,不利与用户掌握;音码与形码的兼容性,全拼与双拼的兼容性,还需要进一步提高。
本项发明的目的在于避免现有技术之不足,通过对CN1064556A、CN1126854A和CN1161497A和CN1213795A的进一步改进,充分利用汉字的所有基本因素----结构、部件、笔画、笔形、声母和韵母,以国家教委、语委、社科院及有关部门制定的各种标准为编码原则,对汉语字词进行音码、形码、音形码三方式兼容的全息输入,从而提供一种科学规范、简单实用、适合普及推广的汉字编码方法和键盘。
本发明的汉字编码方法,其特征在于音码是把《汉语拼音方案》中的声母表和韵母表直接定义在键盘上,按汉语拼音规则进行全拼或双拼输入,形码是把字的结构概括成2个形码,隐含在键盘上,把汉字的部件概括成13个数码,在键盘上对称的排列成两个区,按照结构和部件进行分区交叉输入;音形码是选取字词的部分音码和形码组成字符和词符,进行简码快速无重码输入。音码、形码、音形码三种输入法的字符和词符采用等长码,字符最多4键,词符4键或8键,三种方式兼容不同码,混打不换档,分别使用,各成一体,混合使用,形成一个完整的编码系统。
按以下规则进行编码和输入:
(一)音码输入法,包括全拼输入法和双拼输入法
(1)全拼输入法,包括4码输入法和8码输入法两种。单字的编码,4码输入法和8码输入法的取码方法相同,每个字符由1个声码+1至3个韵码组成,每字2至4键输入。词语的编码,4码输入时,每个词符由4个声码或韵码组成,每词3至4键输入;8码输入时,每个词符依次取该词所有字符的编码,最多不超过前8位编码,每词4至8键输入。
A、每个字符有1个声码,即声母码,取该字汉语拚音的声母,例:湖——Hu的声码是H。全部声码就是《汉语拼音方案》声母表中的声母,再加上Y和W,共计23个:B、P、M、F、D、T、N、L、G、K、H、J、Q、X、ZH、CH、SH、R、Z、C、S、Y、W。其中ZH、CH、SH分别用U、I、O作代码,一键输入,例:知——U(ZH)+i,识——O(SH)+i。所有声码都是一键输入,没有声母的加补充键V键,例:恶——e没有声母,补充V键,编码成为V+e。
B、每个字符有1至3个韵码,即韵母码,取该字汉语拼音的韵母,例:湖——Hu的韵码是u。全部韵码就是《汉语拚音方案》韵母表中的韵母,因为ueng不能与任何声母组合音节,所以舍去,共34个:a.o.e.ai.ei.ao.ou.an.en.ang.eng.ong.i.u.ü.ia.ie.iao.iou.ian.in.iang.ing.iong.ua.uo.uai.uei.uan.uen.uang.ue.üan.ün。韵母的每个字母为一码,一键输入,每个韵母有几个字母就打几键,例:a对应A键,an对应A键+N键,ian对应I键+A键+N键。韵母ang.eng.ong.iang.ing.iong.uang中的ng音素,省略n,用G作代码,一键输入,每个复韵母最多3键输入,例:ang对应A键+G键,uang对应U键+A键+G键,ong对应O键+G键,iong对应I键+O键+G键。例:情——Q+I+G,况——K+U+A+G。
C、词符取码规则,每个词符由该词取码字的声母码和韵母码组成,以《汉语拼音方案》为取码规则。4码输入时,根据每个词语的字数多少,分别选取4个声码或韵码:二字词取第一字声母+第二字声母+第二字韵母的前两个字母,例:科学——K+X+u+e;三字词取第一字声母+第二字声母+第三字声母+第三字韵母的第一个字母,例:科学家——K+X+J+i;四字词依次取四个字的声母声+声+声+声,例:社会科学——SH+H+K+X;五字以上的词按“一、二、三、末”字取4个声母,例:社会科学家——SH+H+K+J。8码输入时,依次取该词所有字符的前8位编码,例:科学——K+e+X+u+e(5码);科学家——K+e+X+u+e+J+i+a(8码);社会科学——SH+e+H+u+i+K+e+X(8码,ue略去);社会科学家——SH+e+H+u+i+K+e+X(8码,ue和Jia略去)。
D、输入编码时,按照汉语拼音规则,依次输入声码和韵码的字母,没有声母的音节加补充键V键。特殊韵母er自成音节时,编码是V+E+R。韵母ueng自成音节时,编码是W+E+G。4码输入时,每个声母最多1键,每个韵母最多3键;每个字符最多4键输入,例:状——U+U+A+G;每个词符最多4键输入,状况——U+K+U+A。8码输入时,码长为8,每个声母最多1键,每个韵母最多3键,每个字符最多4键输入,例:状——U+U+A+G;每个词符最多8键输入,例:状况——U+U+A+G+K+U+A+G。因为“ZH、CH、SH和ng”使用的代码都是一个字母,使全拼码的字符码长缩短为4,与双拼和形码的成为等长码,所以三者自由兼容,不用切换。高频字26个:去(Q)、我(W)、而(E)、人(R)、他(T)、有(Y)、这(U)、出(I)、是(O)、批(P)、安(A)、所(S)、的(D)、发(F)、个(G)、和(H)、就(J)、看(K)、了(L)、在(Z)、小(X)、从(C)、为(V)、不(B)、你(N)、没(M),一键输入,只打声码或代码。次高频字676个,两键输入,只打前两码,例:前——Q+I,用——Y+O。次高频字在与双拼兼容时,不能使用。
E、全拼输入法键盘,声码和韵码分别与英文键盘的26个字母键相对应。在23个声母中,只有ZH对应U键、CH对应I键、SH对应O键,其余20个声母完全与英文字母键相同。34个韵母:a.o.e.ai.ei.ao.ou.an.en.ang.eng.ong.i.u.ü.ia.ie.iao.iou.ian.in.iang.ing.iong.ua.uo.uai.uei.uan.uen.uang.ue.üan. ün,都是由a.o.e.i.u.ü.n.g这几个字母构成的,所以输入单韵母时,击其对应的英文字母键即可。对于复韵母的输入,韵母ang.eng.ong中的ng音素,省略字母n,只打G,一键输入。每个复韵母最多3键输入,例:ang对应A键+G键,uang对应U键+A键+G键;例:状况——U+U+A+G+K+U+A+G。声母补充键对应V键,例:激昂——J+I+V+A+G。因为“ZH、CH、SH和ng”使用的代码都是一个字母,使全拼码的字符码长缩短为4,与双拼和形码成为等长码,所以三者自然兼容,不用切换。另外,现在通用的全拼码,即12码输入法,也可以在本键盘上兼容输入,只需将ZH、CH、SH和ng改为两键输入即可,例:状况——Z+H+U+A+N+G+K+U+A+N+G。
(2)双拼输入法,包括4码输入法和8码输入法两种。4码输入时,每个字符由1个声码+1个韵码组成,每个词符由4个声码或韵码组成,字符两键输入,词符四键输入。8码输入时,词符的最大码长为8码。
A、每个字符有1个声码,即声母码,取该字汉语拚音的声母。全部声码就是《汉语拼音方案》声母表中的字母,再加上Y和W,共23个:B、P、M、F、D、T、N、L、G、K、H、J、Q、X、ZH、CH、SH、R、Z、C、S、Y、W。其中ZH、CH、SH分别用U、I、O作为代码,例:知——U(声码)+i(韵码),识——O+i。没有声母的加补充键V键。
B、每个字符有一个韵码,即韵母码,取该字汉语拼音的韵母。全部韵码就是《汉语拚音方案》韵母表中的韵母,因为ueng不能与任何声母组合音节,所以舍去,共34个:a.o.e.ai.ei.ao.ou.an.en.ang.eng.ong.i.u.ü.ia.ie.iao.iou.ian.in.iang.ing.iong.ua.uo.uai.uei.uan.uen.uang.ue.üan.ün。每个韵母对应一个英文字母键,一键输入,例:字——Z(Z键)+i(I键),典——D(D键)+ian(S键)。特殊韵码er用R键作代码,例:儿——V(零声母键)+er(R键)。
C、词符的取码规则,根据每个词语的字数多少,4码输入时,分别选取4个声码或韵码,二字词是声+韵+声+韵,例:科学——K+e+X+ue;三字词是声+声+声+韵,例:科学家——K+X+J+ia;四字词是声+声+声+声,例:社会科学——SH+H+K+X;五个字以上的词,按“一、二、三、末”字取4个声码,例:社会科学家——SH+H+K+J。8码输入时,将三字词的取码规则改为声+韵+声+韵+声+韵,例:科学家——K+e+X+ue+J+ia;四字词是声+韵+声+韵+声+韵+声+韵,例:社会科学——SH+e+H+ui+K+e+X+ue;五字以上的词按“一、二、三、末”字,取4个字的声码+韵码,例:社会科学家——SH+e+H+ui+K+e+J+ia。
D、输入编码时,按照《汉语拼音方案》规则取码,声码和韵码都是1键输入。单字输入时,每个汉字都打2键。4码输入时,每个词语都打4键;8码输入时,每个词语最多打8键。特殊韵母er自成音节时,编码是编码是V+er。韵母ueng自成音节时,,编码是w+eng。高频字26个:去(Q)、我(W)、而(E)、人(R)、他(T)、有(Y)、这(U)、出(I)、是(O)、批(P)、安(A)、所(S)、的(D)、发(F)、个(G)、和(H)、就(J)、看(K)、了(L)、在(Z)、小(X)、从(C)、为(V)、不(B)、你(N)、没(M),一键输入,只打声码或代码。双拼输入法与全拼输入法的高频字相同,可以共用一个词库。
E、双拼输入法键盘,声码和韵码分别与英文键盘26个字母键相对应。23个声码除ZH对应U键、CH对应I键、SH对应O键以外,其余声码均与键盘英文字母键相同。34个韵码分别与英文字母键相对应:Q(ou)、W(an)、E(e、ei)、R(en、er)、T(ang)、Y(eng)、U(u)、I(i)、O(o、uo)、P(ao)、A(a、ia)、S(ian)、D(ie)、F(ien)、G(iang)、H(ing)、J(iou)、K(ong、iong)、L(iao)、Z(ua、ü)、X(uan、uan)、C(uei、ue)、V(uen、uen)、B(uang)、N(uai)、M(ai),特殊韵码er对应R键。把声码和韵码重合排列在键盘上构成双拼输入法键盘:Q(Q、ou)、W(W、]an)、E(e、ei)、R(R、en、er)、T(T、ang)、Y(Y、eng)、U(ZH、u)、I、(CH、i)、O(SH、o、uo)、P(P、ao)、A(a、ia)、S(S、ian)、D(D、ie)、F(F、ien)、G(G、iang)、H(H、ing)、J(J、iou)、K(K、ong、iong)、L(L、iao)、Z(Z、ua、ü)、X(X、uan、üan)、C(C、uei、ue)、V(零声母、uen、üen)、B(B、uang)、N(N、uai)、M(M、ai)。
(3)音码输入法键盘,根据《普通话语音音节表》中声母和韵母的组合规律,综合调配全拼输入法和双拼输入法声码韵码的键位,使之在全拼和双拼兼容输入时不会发生音节混淆的基础上,设置成全拼输入法和双拼输入法公用的音码键盘:Q(Q、ou)、W(W、an)、E(e、ei)、R(R、en、er)、T(T、ang)、Y(Y、eng)、U(ZH、u)、I、(CH、i)、O(SH、o、uo)、P(P、ao)、A(a、ia)、S(S、ian)、D(D、ie)、F(F、ien)、G(G、iang、ng)、H(H、ing)、J(J、iou)、K(K、ong、iong)、L(L、iao)、Z(Z、ua、ü)、X(X、uan、üan)、C(C、uei、ue)、V(零声母、uen、üen)、B(B、uang)、N(N、uai)、M(M、ai)。在音码键盘上,全拼码和双拼码可以不用切换兼容输入,例:大米——(全拼4码)D+M+I,(双拼4码)D+A+M+I;例:广西壮族自治区——(全拼4码和双拼4码)G+X++U+Q,(全拼8码)G+U+A+G+X+I+U+U,(双拼8码)G+B+X+I+U+B+Q+U;全拼码和双拼码还可以混合输入,例:广西壮族自治区——(广西——全拼8码)G+U+A+G+X+I+(壮族——双拼4码)U+B+Z+U+(自治区——全拼4码)Z+U+Q+U。全拼和双拼的多种输入方式虽然是兼容混合输入,但是因为其编码各不相同,所以不会发生重码。
(二)形码输入法,包括4码输入法和8码输入法。4码输入时,每个字符由1个形码+4个数码组成,每个词符由1至4个形码+4个数码组成,每个字符或词符最多打4键;8码输入时,根据每条词语的字数多少,分别选取1至4个形码+8个数码组成词符。
A、每个字符有1个形码,即结构码,把所有汉字按结构分为两类,左右类和非左右类(包括独体、上下、包围类),共2个形码,例:胡——左右(左右结构),湖——左右(左右结构),葫——非左右(上下结构),困——非左右(包围),木——非左右(独体)。结构分类标准按小学《语文》的要求。形码只用来限定数码输入的分区,不用击键,所以是一种隐含码。每个字符有一个形码隐含码,每条词语的字数越多隐含码也越多,隐含码越多区分度越高,重码越少。
B、每个字符有4个数码,即笔画笔形码,例:湖——(左右)、3点、2横、3竖、4撇。就是用部件的笔画数+起笔笔形来定义部件,例:“木”共4画,起笔(第一笔)是横,编码就是4横。以此类推,十——2横,口——3竖,日——4竖,禾——5撇,米——6点。笔画数设定为2画、3画、4画三种,1画和5画以上(含5画)的部件都打2画。笔形设定为五种:横(包括“提”)、竖、撇、点(包括“捺”)、折(包括横折、竖折、撇折)。三种笔画数和五种笔形共组合成1 3个数码:2横、3横、4横、2竖、3竖、4竖、2撇、3撇、4撇、2点、3点、4点、折,对应所有部件。因为“折”起笔的部件较少,所以不计笔画数,两区共设两个折键,其中一个折键打竖折、撇折,另一个折键打横折,两区公用。编码时首先根据汉字的结构,对汉字进行拆分,拆分时以《新华字典》上的部首为基本部件,以《信息处理用GB1300.1字符集汉字部件规范》为拆分规则,拆分出来的部件要相对完整,或者是部首,或者是独立的字形,被拆的字结构上要有明显、直观的分界,凡是穿插连结在一起的都作为一个部件,不再拆分。例:大、木、未、本、米、耒、革、鹿、重——都是一个部件,不拆;例:寺——土、寸;侍——亻、土、寸;湖——氵、十、口、月;操——扌、口、口、口、木;然后根据汉字部件的多少分别取码。一部件字(独体字)按书写要求取笔画数+前四笔笔形构成四码,例:木——4横(第一笔)、4竖(第二笔)、4撇(第三笔)、4点(第四笔);二部件字的第一部件取一个数码,第二部件取三个数码,即取第二部件的前三笔笔形,例:呆——3竖(口)、4横、4竖、4撇;三部件字的前两个部件各取一个数码,第三部件取两个数码,即取第三部件的前两笔笔形,例:保——2撇(亻)、3竖、4横、4竖;四部件字按各部件的书写顺序各取一码,例:湖——3点(氵)、2横(十)、3竖(口)、4撇(月);超过四部件的字取第“一、二、三、末”部件各一码,例:操——3横、3竖、3竖、4横(末部件“木”);取不足四码的字可用A键和L键补充成四码,例:大——3横、3撇、3点、A;笔形的取码顺序按汉字书写顺序而定,汉字的书写顺序以《现代汉语通用字笔顺规范》(国家语委1997年4月7日制定)为准。如果使用GBK字库,可以加取1至2位数码,以克服重码。
C、词符的取码规则,根据每个词语的字数多少分别取码。4码输入时,二字词每个字取一个形码、两个数码,共6码,例:保持——(左右)、(亻—2撇)、(口—3竖)、(左右)、(扌—3横)、(土—3横);三字词每字取一个形码,前两个字各取一数码,第三字取两个数码,共7码,例:清洁工——(左右)、(氵—3点)、(左右)、(氵—3点)、(独体)、(工—3横)、(工—3竖);四字词每字取一个形码、一个数码,共8码,例:中国银行——(独体)、(中—4竖)、(包围)、(口—3竖)、(左右)、(钅—2撇)、(左右)、(彳—3撇);五字以上的词语按“一、二、三、末”字各取一个形码和一个数码,例:中国科学院——(独体)、(中—4竖)、(包围)、(口—3竖)、(左右)、(禾—2撇)、(左右)、(阝—横折)。取码方法与字符相同。8码输入时,二字词每个字取一个形码、四个数码,共10码,例:保持——(左右)、(亻—2撇)、(口—3竖)、(木—4横)、(木—4竖)、(左右)、(扌—3横)、(土—3横)、(寸—3横)、(寸—3竖);三字词每字取一个形码,前两字各取两个数码,第三字取四个数码,共11码,例:清洁工——(左右)、(氵—3点)、(青—2横)、(左右)、(氵—3点)、(土—3横)、(独体)、(工—3横)、(工—3竖)、(工—3横)、(补充键—A);四字词每个字各取一个形码和两个数码,共12码,例:中国银行——(独体)、(中—4竖)、(中—横折)、(包围)、(口—3竖)、(王—4横)、(左右)、(钅—2撇)、(艮—横折)、(左右)、(彳—3撇)、(一—2横);五字以上的词按“一、二、三、末”字各取一个形码和两个数码,共12码,例:中国科学院——(独体)、(中—4竖)、(中—横折)、(包围)、(口—3竖)、(王—4横)、(左右)、(禾—2撇)、(斗—4点)、(左右)、(阝—横折)、(宀—3点)。取码方法与字符相同。
D、输入编码时,将13个数码在26个英文键上对称地排列成左右两个区。两个形码与两个区相对应,左右结构对应左区,非左右结构对应右区。左右结构的字从左区开始输入数码,非左右结构的字从右区开始输入数码,每输入一个数码轮换一区,即交叉输入法。左区的折键输入竖折、撇折,右区的折键输入横折,两区公用。形码只用来限定输码的区位,不用击键,是一种隐含码。字词输入方法相同,4码输入时,最多打4键。例:木——(独体)、4横(右、Y键)、4竖(左、E键)、4撇(右、I键)、4点(左、Q键);林——(左右)、4横(左、R键)、4横(右、Y键)、4竖(左、E键)、4撇(右、I键);湖——(左右)、3点(左、A键)、2横(右、N键)、3竖(左、D键)、4撇(右、I键);大——(独体)、3横(右、H键)、3撇(左、S键)、3点(右、L键)、A键(左、补充键)。二字词每字取一个形码、两个数码,例:保持——(左右)、2撇(左、X键)、3竖(右、J键)、(左右)、3横(左、F键)、3横(右、H键);三字词每字取一个形码,前两字各取一数码,第三字取两个数码,例:清洁工——(左右)、3点(左、A键)、(左右)、3点(左、A键)、(独体)、3横(右、H键)、3竖(左、D键);四字词每字取一个形码、一个数码,例:中国银行——(独体)、4竖(右、U键)、(包围)、3竖(右、J键)、(左右)、2撇(左、X键)、(左右)、3撇(左、S键);五字以上的词按“一、二、三、末”字各取一个形码和一个数码,例:中国科学院——(独体)、4竖(右、U键)、(包围)、3竖(右、J键)、(左右)、2撇(左、X键)、(左右)、横折(G键)。8码输入时,最多打8键,例:保持——(左右)、2撇(X键)、3竖(J键)、4横(R键)、4竖(U键)、(左右)、3横(F键)、3横(H键)、3横(F键)、3竖(J键);三字词每字取一个形码,前两字各取两个数码,第三字取四个数码,例:科学院——(左右)、2撇(X键)、4点(O键)、(上下)、3点(L键)、2点(Z键)、(左右)、横折(G键)、3点(L键)、2横(V键)、3横(H键);四字词每个字各取一个形码和两个数码,例:中国银行——(独体)、4竖(U键)、横折(G键)、(包围)、3竖(J键)、4横(R键)、(左右)、2撇(X键)、横折(G键)、(左右)、3撇(S键)、2横(N键);五字以上的词按“一、二、三、末”字各取一个形码和两个数码,例:中国科学院——(独体)、4竖(U键)、横折(G键)、(包围)、3竖(J键)、4横(R键)、(左右)、2撇(X键)、4点(O键)、(左右)、横折(G键)、3点(L键)。高频字26个,一键输入,但形码高频字和音码高频字不能同时使用,如果二者兼容时,可将其一改为四键连击,例:去(H键+H键+H键+H键)或(Q键+Q键+Q键+Q键)。
E、形码输入法键盘,把26个英文字母键分为左右两个区,左区Q、W、E、R、T、A、S、D、F、Z、X、C、V13个字母键,右区Y、U、I、O、P、G、H、J、K、L、B、N、M13个字母键。把13个数码对称地排列在左右两区的字母键上,键盘左区的每一个字母键对应一个数码:Q(4点)、W(4撇)、E(4竖)、R(4横)、T(竖折、撇折)、A(3点、补充键)、S(3撇),D(3竖)、F(3横)、Z(2点)、X(2撇)、C(2竖)、V(2横);键盘右区的每一个字母键对应一个数码:Y(4横)、U(4竖)、I(4撇)、O(4点)、P(2点)、G(横折)、H(3横)、J(3竖)、K(3撇)、L(3点、补充键)、B(2撇)、N(2横)、M(2竖)。其中的T(竖折、撇折)键和G(横折)键是两区的公用键。A键为左区的数码补充键,L键为右区的数码补充键。两个形码与两个区相对应,左右结构对应左区,非左右结构对应右区。
(三)音形码输入法,是按照音码和形码的取码规则和输入方法,取字词的部分音码(一般使用双拼码)和形码组成字符和词符,进行简化输入。常用码的码长是4码或8码,4码输入时最多打4键,8码输入时最多打8键,专用码根据需要确定码长。
A、每个字符由1个声码+1个韵码+1形码+2个数码组成,例:湖——H、u、(左右)、3点、2横。声码、韵码、形码、数码的取码方法与双拼输入法和形码输入法相同,取码顺序可以颠倒,先取形码、数码,后取声码、韵码,例:湖——(左右)、3点、2横、H、u。如果使用G B K字库,或是8码输入时,可以增加取码长度,取4个数码,以克服重码,例:湖——H、u、(左右)、3点、2横、3竖、4撇。
B、每个词符根据需要确定码位,如常用词4位或8位,邮政编码6位,条形码10至13位。再根据码长选取音码和形码,取码方法与双拼输入法和形码输入法相同。8码输入时,擅长音码输入者以音码为基础码,形码为辅助码,二字词符为4个音码+4个数码,例:科学——K+e+X+ue+2撇+4点+3点+2点;三字词符为6个音码+2个数码,例:科学家——K+e+X+ue+J+ia+2撇+3点;四字词符为8个音码,例:社会科学——SH+e+H+ui+K+e+X+ue;五字以上的词按“一、二、三、末”字,取4个字的声码+韵码,例:社会科学家——SH+e+H+ui+K+e+J+ia。擅长形码输入者以形码为基础码,音码为辅助码,二字词符为4个数码+4个音码,例:科学——2撇+4点+3点+2点+K+e+X+ue;三字词符为6个数码+2个音码,例:科学家——2撇+4点+3点+2点+3点+2横+K+X;四字及多字词符为8个数码,例:中国银行——4竖+横折+3竖+4横+2撇+横折+3撇+2横,例:社会科学家——4点+3横+2撇+2横+2撇+4点+3点+2横。二者均可以作到无重码输入。三字词和四字词也可以全部采用4音+4形或4形+4音的组码形式,例:科学家——K+X+J+ia+2撇+3点+3点+2横;社会科学——4点+2撇+2撇+3点+SH+H+K+X。
C、单字输入,声码和韵码按照音码输入法的双拼规则取码和输入,数码按照形码规则取码,仍然采取分区交叉输入的方法。可以采取等长码输入,2音+2形或2形+2音,例:说——O+uo+2点+2点或2点+2点+O+uo;也可以采取不等长码输入,2音+3形或3形+2音,例:说——O+uo+2点+2点+3竖或2点+2点+3竖+O+uo。
D、词语输入,一般采取8码输入,前四码为基础码,后四码为辅助码,用来筛选重码,作到无重码输入。特殊词语可根据需要确定码位长短。声码、韵码按音码输入法输入,形码和数码按形码输入法输入。可以采取等长码输入,4音+4形或4形+4音,例:说明——O+uo+M+ing+2点+2点+4竖+4撇或2点+2点+4竖+4撇+O+uo+M+ing;也可以采取不等长码输入,2音+6形或6形+2音,例:说明——O+M+2点+2点+3竖+4竖+4撇+横折或2点+2点+3竖+4竖+4撇+横折+O+M。基础码是汉字的基本分类检索码,必须输入,而辅助码只用来筛选重码,不必全部输入,所以8码输入时,一般只需5——6键就可以作到无重码输入。
E、音形码输入法键盘,就是音码和形码在键盘上的综合排列。把全拼输入键盘、双拼输入键盘和形码输入键盘重合在一起,综合调配声码、韵码和数码的键位,使之在全拼、双拼、形码和音形码兼容输入时不会发生音节混淆的基础上,设置成全拼输入法、双拼输入法、形码输入法和音形码输入法公用的音形码键盘。声码、韵码和数码分别与26个英文字母键相对应:Q(Q、ou、4点)、W(W、an、4撇)、E(e、ei、4竖)、R(R、en、er、4横)、T(T、ang、竖折、撇折)、Y(Y、eng、4横)、U(ZH、u、4竖)、I(CH、i、4撇)、O(SH、o、uo、4点)、P(P、ao)A(a、ia、3点、补充键)、S(S、ian、3撇)、D(D、ie、3竖)、F(F、in、3横)、G(G、iang、ng、横折)、H(H、ing、3横)、J(J、iu、3竖)、K(K、ong、iong、3撇)、L(L、iao、3点、补充键)、Z(Z、ua、ü2点)、X(X、uan、üan、2撇)、C(C、uei、ue、2竖)、V、(零声母、uen、üen、2横)、B(B、uang、2撇)、N(N、uai、2横)、M(M、ai、2竖)。左右两区仍然与两个形码相对应。因为“ZH、CH、SH和ng”采用的代码都是一个字母,使全拼码的字符码长缩短为4,与双拼码和形码成为等长码,所以三者自然兼容,不用切换,例1:大米——(全拼4码)D+M+I,(双拼4码)D+A+M+I,(形码4码)3横+3撇+2点+2撇;例2:广西壮族自治区——(全拼4码和双拼4码)G+X++U+Q,(全拼8码)G+U+A+G+X+I+U+U,(双拼8码)G+B+X+I+U+B+Q+U,(形码4码)3点+2横+3点+2横,(形码8码)3点+3横+2横+2竖+3点+4横+2横+2撇。全拼码、双拼码、音码和音形码还可以混合输入,例:广西壮族自治区——(广西——全拼8码)G+U+A+G+X+I+(壮族——音形8码)U+B+Z+U+3点+3横+4点+2撇+(自治区——双拼8码)Z+I+U+I+Q+U。音码、形码和音形码的多种输入方式虽然是兼容混合输入,但是因为其编码各不相同,所以不会发生重码。
本发明的主要优点是:(1)编码方法简单。音码输入法,把汉字的声母和韵母作为编码,按《汉语拼音方案》输入汉字;形码输入法,把数百个部首概括为13个部件,不用背字根;把繁多的笔画简化为3种笔数,好认好记;把复杂的字形输入变成简单的数码输入,解决了字形编码的最大难题;音形码输入法,利用汉字的声母、韵母、结构、部件、笔画、笔形六个最基本的元素,使用人们最熟悉的规律,而组成的简单的汉字编码输入方法。科学实用,简单易学。(2)键盘设计合理。音码把《声母表》和《韵母表》定义在键盘上,规范好记;形码把复杂的部件简括为13个数码,双区键盘,对称排列,交叉输入,键频均衡,既快速省力,又能有效离散重码;音形码是两种方式组合、三种方式兼容的综合键盘,有效地解决了汉字输入中不会读、不会写、速度慢的困难(3)操作使用方便。音码、形码、音形码三方式兼容,混编不同码,混打不用换档,用户根据爱好,可以选用一种,也可以交互使用,分别使用各成一体,混合使用是一个完整的编码系统。(4)规则简明规范。结构划分、字形拆分、部件设定、笔形分类、声码和韵码的组合,所有规则均以国家教委、语委的明确规定以及《新华字典》、《现代汉语通用字笔顺规范》、《信息处理用GB13000.1字符集汉字部件规范》为依据,适合在学校或社会普及推广。(5)指标高用途广。本编码可兼容繁简汉字、词语15万条以上;初级码,平均码长2.7键,重码率1.6%;高级码,平均码长1.48键,可以作到无重码输入。本编码不仅可用于计算机输入排检汉字,也可用作邮政编码、条形码、外文译码、电报电话交换码等多领域,利用价值高,开发潜力大。(6)本发明已制成计算机软件,上机运行效果良好。经实际操作检验,三年级以上的小学生不用专培训,通过自己看说明书练习,就能在一周之内比较熟练的掌握操作技术。
附图1是音码输入法键盘,即全拼输入法和双拼输入法的综合键盘,汉字声码、韵码在键盘上的排列。
附图2是形码输入法键盘,汉字形码、数码在键盘上的分区排列。
附图3是音形码输入法键盘,即全拼输入法、双拼输入法和形码输入法的综合键盘,汉字声码、韵码、形码、数码在一个实施例英文键盘上的整体排列。
下面结合附图对本发明做进一步的说明:
一、本发明与其它编码的不同之处及优越性:
(1)音码输入法是把声母表和韵母表直接定义在键盘上,按《汉语拼音方案》进行编码和输入的规范汉字编码。用声母表中的21个声母再加上Y和W作声码(请见《声母表》),23个声码除ZH对应U键、CH对应I键、SH对应O键外,其余声码均与英文键相对应。用韵母表中的韵母(35个)作韵码,因为ueng不能与任何声母相拼,所以舍去,共34个韵码。根据34个韵码与声母的组合规律(请见《韵母表》),按照它们在《韵母表》中的排列形式直接定义在键盘上。左起第一行是基本韵母,排在键盘的上排;左起第二行是i行韵母,排在键盘的中排;左起第三四行是u行韵母和ü行韵母,排在键盘的下排。三类韵母的数目与三排键位的数目不完全相等,所以加以调整。i行韵母(不含i):ia.ie.iao.iou.ian.in.iang.ing.iong共有9个,与中排的9个键位数相等,所以排在中排。u行韵母(不含u,舍去ueng):ua.uo.uai.uei.uan.uen.uang共7个,与下排的7个键位数相等,所以排在下排。ü行韵母共有4个:ü、üe.üan、ün,而能与这4个ü行韵母相拼的声母,不能与ua、uan、uei、uen相拼,所以分别加以合并,ua与ü一个键位,uan与üan一个键位,uei与üe一个键位,uen与üen一个键位。
基本韵母:a.o.e.ai.ei.ao.ou.an.en.ang.eng.ong共12个,上排键位只有10个,而且为了保持i和u与英文键位的一致还占去两个键位,所以要调整4个键位。a的英文键在中排,将a调到中排,与ia合并,从《普通话语音音节表》中可以看出,能与ia相拼的声母有L、J、Q、X,虽然其中的L能与a相拼,但是L与ia相拼时,这个音节(Lia)只有一个汉字——俩,因此可以合并。iong只能与声母J、Q、X相拼,而ong不能与之相拼,所以把iong和ong放在一个键位上不会发生音节混淆。能与o相拼的声母是B、P、M、F,它们都不能与uo相拼,而且两个韵母发音相近,便于模糊拼读,所以把uo调到上排与o合并一个键位。把ai调到下排与uai相邻,便于记忆。e只能与声母D、T、N、L、G、K、H、ZH、CH、SH、R、Z、C、S相拼,其中能与ei相拼的有D、N、L、G、H、Z,并且这些音节字很少:Dei(得)1个字、Nei(内馁)2个字、Gei(给)1个字、Hei(黑嘿)2个字……实际发生音节混淆的共有11个字。也就是说按照《韵母表》的基本形式把韵母定义在键盘上,在国标汉字的范围内可能多出11个重码,但是按这样形式排列成的键盘,比其它形式的键盘确实具有多方面的优越性。首先,键盘形式与《韵母表》一致,更加规范。上排是基本韵母,中排是i行韵母,下排是u行和ü行韵母。其次,键位排列顺序更具规律性。单韵母(a、o、e、i、u)与英文键位一致,复韵母有序排列,横向序列是:a——an,e——en,g(ng)——ang、eng;纵向序列是:上排是基本韵母,中排+i(i行韵母),下排+u或ü(u行和ü行韵母)。第三,更有利于记忆和操作。按照“单韵母——基本韵母——i行韵母——u行和ü行韵母”的规律记忆。单韵母与英文键相同,很容易记忆。再用单韵母助记基本韵母,左边第一列有单韵母a键,第二列+n即复韵母an;第三列有单韵母e键,第四列+n即en键;第五列有G(ng的代码),a+ng即ang键,第六列是e+ng即eng键,这样就记下了大部分基本韵母。记下基本韵母后,中排+i即i行韵母,下排+u或ü就是u行韵母和ü行韵母。例:上排W键的韵母是an,中排S键就是ian,下排X就是uan和üan。操作时只要记住上排九个基本韵母,中排加i,下排加u或ü,即可记住全部韵母的键位。所以这种键位设置和键盘排布比其它方法更规范,更具科学性。
(2)形码输入法,一般形码方案都把具体的部件作为编码对象,然而汉字可分解成的部件不少于500个,这么多的部件不可能都容纳于26个标准键位上,只好压缩,例如五笔字型130个字根,郑码170个字根,表形码370多个部件等。这样的编码必然要求操作者背字根,背键盘,带来种种困难。本方案与之不同之处是,它不以具体部件为编码对象,而是用部件的笔画数和起笔笔形来定义它,其实也就是常用的笔画检字法,例:“艹”共3画,第一笔是横,就记作3横;“口”也是3画,第一笔是竖,就记作3竖;以此类推,氵——3点,日——4竖,禾——5撇,雨——8横,这种方法可使任何一个部件都有对应的编码,并且不用背,只要数笔画看笔形即可,而且繁体和简体部件不同码,例:饣(3撇)——食(9撇)。但是部件笔画数悬殊,少则一画,多则十几画,如果按自然笔画数设码,一是数码太多键位容不下,二是数笔画太慢影响速度。我经过对46980个字词的数码测算,发现三画和四画的数码占70%以上,1画2画和5画以上的占不到30%,由此可以设定3画和4画各设一个数码,1画2画和5画以上的部件共用一个数码2画,这样不但解决了码位的问题,而且解决了数笔画的困难,因为4画以下的部件好数,一看即可认清,超过了4画不用数,打2画即可。也就是只需识记3画和4画,其它不用管都是2画。
根据《新华字典》规定,笔形共分五种:横、竖、撇、点、折,五种笔形和三种笔画数共组合成13个笔画笔形码:2横、3横、4横、2竖、3竖、4竖、2撇,3撇、4撇、2点、3点、4点、折(因为“折”起笔的部件较少,所以不数笔画,只设一码)。这13个编码虽然可以容纳所有的部件,但是有的编码之下同部件字(同部首字)太多,如“扌”和“艹”都是3横,“氵”和“宀、辶、广”都是3点,在这些编码之下各有几百个字,必然出现重码多。如何离散重码呢?分析可知,“扌”和“氵”多出现在左右结构的字里,“艹”和“宀、辶、门”多出现在非左右结构的字里,而汉字有60%以上是左右结构的,所以如果把汉字分成左右结构和非左右结构两种类型,各用13个编码输入,必能降低重码率;而且13个编码恰好是26个英文键的一半,将其对称的划分成左右两个区,如图。左右结构的字使用左区的13个编码,非左右结构的字(包括独体、上下、包围结构)使用右区的13个编码,例:抚(扌——F键),芜(艹——H键);洛(氵——A),客、阁(宀、门——L),这样不仅笔画笔形相同的部件可以得到区分,而且同一个部件也可以不同码,例:木——Y,林——R,森——Y。因为双区键盘的每一区有一个结构码,每输入一个字,虽然打四键,但是实际是五码,通过选择字的结构区位,在键盘上还隐含着一个结构码;如果是输入词组则每一个词符隐含着二至四个结构码,二字词有两个形码,例:坚持——(右区)M、F、(左区)F、H;三字词有三个形码,例:清洁工——(左区)A、(左区)A、(右区)H、D;四字词有四个形码,中国银行——(右区)U、(右区)J、(左区)X、(左区)S。
按结构分区输入,可以有效的降低重码,但是如果左右结构的字符四码都打在左区,非左右结构的字符四码都打在右区,那么每输入一字必然是,左手击键右手停,右手击键左手停,方法不科学。改为分区交叉输入,即左右结构的字第一码在左区开始输入,第二码在右区,第三码在左区,第四码在右区;非左右结构的字与之相反,第一码从右区开始,每输一码,轮换一区,这样既不增加重码,又可双手交叉击键,不但省力而且速度快。
(3)音形码输入法,实际是音码输入法和形码输入法的统一,也是两者的互补和简化。因为音码输入法的长处在于《拼音方案》规范,简单易学,短处在于重码多,速度慢;形码输入法的长处在于重码少,速度快,短处在于编码方法规范性相对差,操作也不够简单。音、形联合组码,则可以扬长避短,成为一种快速高效码。如果是音形4码,每个字符取两个音码,两个数码,例:汗——H、an、(左右)、3点、3横;那么两个音码就是声母(H)和韵母(an),取码方法与拼音检字法相同;两个数码基本就是汉字的部首(氵——3点)和余下的部分字形(干——3横),取码方法与部首检字法相同。这样的一个字符编码,实际是人们最常用的拼音查字法和部首查字法的组合体,但是,包括的确是汉字的声母、韵母、结构、部件、笔画、笔形六个因素,当然对汉字的区分率是极高的,重码也就极少了,而这六个因素又是汉字最基本最简单的特征,非常容易掌握。如果是音形8码,每个词符取4个音码、4个形码,例:汉字——H、an、Z、i、(左右)、3点、横折、(上下)、3点、横折;或者先取4个形码后取4个音码。这样的词符,仍旧与字符一样包括了汉字的声母、韵母、结构、部件、笔画、笔形六最基本因素,对汉字的区分率是极高的,完全可以作到无重码输入,而且经过前面4个基础码的筛选已经重码很少,后面的4个辅助码很少使用。也就是说,虽然是8码无重码输入,实际只需打五六键,当然输入效率高。
二、本发明与前几次方案相比,主要改进之处及改进后产生的优越性:
(1)在原有双拼码的基础上兼容了全拼码。
双拼码比全拼码速度快,这是显而易见的,然而业余打字者使用全拼码的居多,因为全拼码与汉语拼音相同,又与英文字母键一致,好学易用。因此从普及的角度考虑,本方案在对通用全拼码改进的基础上,兼容了全拼码,它有三方面的好处,一可助学,为初学者提供一种最简单的输入方式,入门容易;二可助记,用全拼码作双拼码的过度码,在熟悉全拼码的基础上去掌握双拼码更容易,例:a、e、g、u、i、o几个全拼码单韵母与英文键相同,通过记忆这几个全拼韵母,然后“+n”或“+ng”,就可记住双拼码的复韵母。三可提高效率,音码的三种编码,全拼6码(装zhuang)——全拼4码(装uuag)——双拼2码(装ub),构成了三个层次:从形式上看是由长变短,从掌握上看是由易到难,从速度上看是由慢到快,循序渐进,逐步提高输入速度。
(2)“ng”代码的发明,使全拼码产生了质的飞跃。
现有通用的全拼码,字符是6码(每字6键),最大编码长度为12(每词12键)。这是因为汉字音节最长的是6个字母,例:幢——chuang。“最大编码长度为12”也只能容纳两个汉字,例:幢幢——chuangchuang。然而,6个字母的字符确很少,在“国标码”汉字范围内只有23个:zhuang——装撞庄壮桩状幢妆僮奘戆共11个,chuang——窗床闯疮创幢怆共7个,shuang——双霜爽孀泷共5个;仅占总数的千分之三。由6个字母的字符组成的双音节词(双音节词占词符70%以上)就更少了,本人找到的只有“幢幢”一个词。这就意味着百分之九十九以上的字词要打空格键,这不仅会造成存储空间浪费,输入速度降低,更主要的缺点是无法与其它输入法兼容。因为大部分输入法的最大编码长度都是4(如五笔码、表形码、郑码都是一个字或词组最多打4键),本人以前的编码长度也是4,所以就根本无法兼容。“ng”代码的发明,使全拼码的字符编码长度缩短为4,成为双拼码和形码的等长码,从根本上解决了全拼兼容的困难,实现了与其它输入法的自由兼容。这种改进不仅方法简单——只需记住4个代码“ZH、CH、SH用U、I、O代替、ng用G代替”,而且可以使输入速度大幅度提高,8码输入可提高速度25%以上,4码输入可提高速度40%以上,真正作到了增加速度不增加难度。
(3)等长编码,自由兼容,无重码输入。
因为音码、形码、音形码三者实现了编码等长,所以大大提高了其兼容性,组码灵活自由。它们既可作为一种编码单独使用,亦可与另外一种或几种编码兼容;既可4码兼容,亦可8码兼容。编码时组合方便,输入时方式灵活。例1:4码兼容时,降——(全拼)J+I+A+G,(双拼)J+G,(形码)G+K+F+T,(音形)J+G+G+K;例2:8码兼容时,广西壮族自治区——(全拼)G+U+A+G+X+I+U+U,(双拼)G+B+X+I+U+B+Q+U,(形码)3点+3横+2横+2竖+3点+4横+2横+2撇,(音形)G+X+U+Q+3点+2横+3点+2横。例3:4码或8码混合输入时,中国汽车工业联合会——(中国——全拼8码)U+O+G+G+U+O+(汽车——双拼4码)Q+I+I+E+(工业——形码4码)3横+3竖+2竖+2竖+(总公司——音形8码)Z+G+S+I+2点+2撇+横折+2横。音码、形码和音形码的多种输入方式虽然是兼容混合输入,但是因为其编码各不相同,所以不会发生重码。而这多种方式的兼容混合输入,为用户提供了充分的选择空间。擅长音码输入者以音码为主,以形码为辅;擅长形码输入者以形码为主,以音码为辅。使用音码输入时有不认识的字就加打一个形码,在使用形码时有不会写的字就打一个音码,在两种方法都熟练的时候就打音形码,基本上可做到无重码输入。这样不但为使用者提供了极大的方便,而且大大提高了输入速度。
(4)规范键位,优化键盘。
A、局部调整单韵母键位,使之与英文字母键完全一致。在前一项发明的音码键盘上,单韵母a、o、e、i、u的键位与英文字母键位不同,这对于熟悉英文键盘的用户很不利。本发明对此进行了调整,使单韵母的键位与英文字母键位相同,这就使全拼输入与汉语拼音保持了一致,同时有助于双拼输入的学习和掌握。这不仅对熟悉英文键盘的用户很有利,而且对于初学者识记键盘和掌握技术很方便。
B、整体排布音码键盘,使之更有规律性。在前一项发明的音码键盘上,全部韵码虽然是按《韵母表》的形式设置的,但未能兼顾英文键盘的英文键位排列形式。本发明不但完全按照《韵母表》中韵母的排列形式设置键位,而且充分考虑到汉字韵码与英文字母键的一致性。作到了英汉字母形式相同的键位排列也一致,英汉字母形式不同的尽量突出汉语拼音的规律性,键盘设置突出了三条线:横向基本韵母排列一条线“a和e——+n——+ng”;纵向全部韵码排列一条线“基本韵母——+i——+u或i”;整体键盘记忆一条线“单韵母——复韵母——双拼码”。
C、综合设置音形键盘,使之更具科学性规范性。本发明的键盘不论是局部调整还是整体设置,所有规则均以国家教委、语委的明确规定以及《汉语拼音方案》《普通话语音音节表》为依据,同时注意到与国际标准(英文键盘)的接轨,所以更加科学规范,适合在学校或社会普及推广。

Claims (1)

1、一种汉语字词全息编码的计算机输入方法及键盘,它是一种音码、形码、音形码兼容,混合输入的汉字编码,其特征在于音码是把《汉语拼音方案》中的声母表和韵母表直接定义在键盘上,按汉语拼音规则进行全拼或双拼输入,形码是把汉字的结构概括成2个形码,隐含在键盘上,把汉字的部件概括成13个数码,在键盘上对称地排列成两个区,按照结构和部件进行分区交叉输入,音形码是选取字词的部分音码和形码组成字符和词符,进行简码快速输入,音码、形码、音形码三种输入法的字符和词符采用等长码,字符最多4键,词符4键或8键,三种输入方法单独使用或混合输入,不用切换,按以下规则进行编码和输入:
(一)音码输入法,包括全拼输入法和双拼输入法,
(1)全拼输入法,包括4码输入法和8码输入法两种,单字的编码,4码输入法和8码输入法的取码方法相同,每个字符由1个声码+1至3个韵码组成,每字2至4键输入,词语的编码,4码输入时,每个词符由4个声码或韵码组成,每词3至4键输入,8码输入时,每个词符依次取该词所有字符的编码,最多不超过前8位编码,每词4至8键输入,
A、每个字符有1个声码,即声母码,取该字汉语拚音的声母,全部声码就是《汉语拼音方案》声母表中的声母,再加上Y和W,共23个:B、P、M、F、D、T、N、L、G、K、H、J、Q、X、ZH、CH、SH、R、Z、C、S、Y、W,没有声母的加补充键V键,ZH、CH、SH分别用U、I、O作代码,全部声码都是一键输入,
B、每个字符有1至3个韵码,即韵母码,取该字汉语拼音的韵母,全部韵码就是《汉语拚音方案》韵母表中的韵母,因为ueng不能与任何声母组合音节,所以舍去,共34个:a.o.e.ai.ei.ao.ou.an. en.ang.eng.ong.i.u.ü.ia.ie.iao.iou.ian.ien.iang.ing.iong.ua.uo.uai.uei.uan.uen.uang.ue.üan.üen,韵母的每个字母为一码,一键输入,每个韵母有几个字母就打几键:a对应A键、an对应A键+N键、ian对应I键+A键+N键,韵母ang.eng.ong.iang.ing.iong.uang中的ng音素,省略n,用G作代码,一键输入,每个复韵母最多3键输入:ang对应A键+G键、uang对应U键+A键+G键,ong对应O键+G键,iong对应I键+O键+G键,
C、词符取码规则,每个词符由该词取码字的声母码和韵母码组成,以《汉语拼音方案》为取码规则,4码输入时,根据每个词语的字数多少,分别选取4个声码或韵码,二字词取第一字声母+第二字声母+第二字韵母的前两个字母,三字词取第一字声母+第二字声母+第三字声母+第三字韵母的第一个字母,四字词依次取四个字的声母声+声+声+声,五字以上的词按“一、二、三、末”字取4个声母,8码输入时,依次取该词所有字符的前8位编码,
D、输入编码时,按照汉语拼音规则,依次输入声码和韵码的字母,没有声母的音节加补充键V键,特殊韵母er自成音节时,编码是V+e+r,韵母ueng自成音节时,编码是W+eng,4码输入时,每个声母最多1键,每个韵母最多3键,每个字符最多4键输入,每个词符最多4键输入,8码输入时,码长为8,每个声母最多1键,每个韵母最多3键,每个字符最多4键输入,每个词符最多8键输入,高频字26个:去(Q)、我(W)、而(E)、人(R)、他(T)、有(Y)、这(U)、出(I)、是(O)、批(P)、安(A)、所(S)、的(D)、发(F)、个(G)、和(H)、就(J)、看(K)、了(L)、在(Z)、小(X)、从(C)、为(V)、不(B)、你(N)、没(M),一键输入,只打声码或代码,次高频字676个,两键输入,只打前两码,
E、全拼输入法键盘,声码和韵码分别与英文键盘的26个字母键相对应,在23个声母中,只有ZH对应U键、CH对应I键、SH对应O键,其余20个声母完全与英文字母键相同,34个韵母:a.o.e.ai.ei.ao.ou.an.en.ang.eng.ong.i.u.ü.ia.ie.iao.iou.ian.in.iang.ing.iong. ua.uo.uai.uei.uan.uen.uang.ue.üan.ün,都是由a.o.e.i.u.ü.n.g这几个字母构成的,所以输入单韵母时,击其对应的英文字母键即可,对于复韵母的输入,韵母ang.eng.ong中的ng音素,省略字母n,只打G,一键输入,每个复韵母最多3键输入:ang对应A键+G键、uang对应U键+A键+G键,声母补充键对应V键,因为“ZH、CH、SH和ng”使用的代码都是一个字母,使全拼码的字符码长缩短为4,与双拼和形码成为等长码,所以三者自然兼容,不用切换,另外,现在通用的全拼码,即12码输入法,也可以在本键盘上兼容输入,只需将ZH、CH、SH和ng改为两键输入即可,
(2)双拼输入法,包括4码输入法和8码输入法两种,4码输入时,每个字由1个声码+1个韵码组成,每个词符由4个声码或韵码组成,字符两键输入,词符四键输入,8码输入时,词符的最大码长为8码,
A、每个字符有1个声码,即声母码,取该字汉语拚音的声母,全部声码就是《汉语拼音方案》声母表中的字母,再加上Y和W,共23个:B、P、M、F、D、T、N、L、G、K、H、J、Q、X、ZH、CH、SH、R、Z、C、S、Y、W,没有声母的加补充键V键,
B、每个字符有一个韵码,即韵母码,取该字汉语拼音的韵母,全部韵码就是《汉语拚音方案》韵母表中的韵母,因为ueng不能与任何声母组合音节,所以舍去,共34个:a.o.e.ai.ei.ao.ou.an.en.ang.eng.ong.i.u.ü.ia.ie.iao.iou.ian.in.iang.ing.iong.ua.uo.uai.uei.uan.uen.uang.ue.üan.ün,特殊韵码er用R键作代码,
C、词符的取码规则,根据每个词语的字数多少,4码输入时,分别选取4个声码或韵码,二字词是声+韵+声+韵,三字词是声+声+声+韵,四字词是声+声+声+声,五字以上的词按“一、二、三、末”字取4个声码,8码输入时,将三字词的取码规则改为声+韵+声+韵+声+韵,四字词是声+韵+声+韵+声+韵+声+韵,五字以上的词按“一、二、三、末”字,取4个字的声码+韵码,
D、输入编码时,按照《汉语拼音方案》规则取码,声码和韵码都是1键输入,单字输入时,每个汉字都打2键,4码输入时,每个词语都打4键,8码输入时,每个词语最多8码输入,特殊韵母er自成音节时,编码是V+er(R键),韵母ueng自成音节时,编码是W+eng,高频字26个:去(Q)、我(W)、而(E)、人(R)、他(T)、有(Y)、这(U)、出(I)、是(O)、批(P)、安(A)、所(S)、的(D)、发(F)、个(G)、和(H)、就(J)、看(K)、了(L)、在(Z)、小(X)、从(C)、为(V)、不(B)、你(N)、没(M),一键输入,只打声码或代码,双拼码与全拼码的高频字相同,可以共用一个词库,双拼码、全拼码和形码可以采用等长的4码或8码兼容输入,
E、双拼输入法键盘,声码和韵码分别英文键盘26个字母键相对应,23个声码除ZH对应U键、CH对应I键、SH对应O键以外,其余声码均与键盘英文字母键相同,34个韵码分别与英文字母键相对应:Q(ou)、W(an)、E(e、ei)、R(en、er)、T(ang)、Y(eng)、U(u)、I、(i)、O(o、uo)、P(ao)、A(a、ia)、S(ian)、D(ie)、F(ien)、G(iang)、H(ing)、J(iou)、K(ong、iong)、L(iao)、Z(ua、ü)、X(uan、üan)、C(uei、ue)、V(uen、üen)、B(uang)、N(uai)、M(ai),另外韵码er对应R键,把声码和韵码重合排列在键盘上构成双拼键盘:Q(Q、ou)、W(W、an)、E(e、ei)、R(R、en、er)、T(T、ang)、Y(Y、eng)、U(ZH、u)、I、(CH、i)、O(SH、o、uo)、P(P、ao)、A(a、ia)、S(S、ian)、D(D、ie)、F(F、ien)、G(G、ian)、H(H、ing)、J(J、iou)、K(K、ong、iong)、L(L、iao)、Z(Z、ua、ü)、X(X、uan、üan)、C(C、uei、ue)、V(零声母、uen、üen)、B(B、uang)、N(N、uai)、M(M、ai),
(3)音码输入法键盘,根据《普通话语音音节表》中声母和韵母的组合规律,综合调配全拼输入法和双拼输入法声码韵码的键位,使之在全拼和双拼兼容输入时不会发生音节混淆的基础上,设置成全拼输入法和双拼输入法公用的音码键盘:Q(Q、ou)、W(W、an)、E(e、ei)、R(R、en、er)、T(T、ang)、Y(Y、eng)、U(ZH、u)、I、(CH、i)、O(SH、o、uo)、P(P、ao)、A(a、ia)、S(S、ian)、D(D、ie)、F(F、ien)、G(G、iang、ng)、H(H、ing)、J(J、iou)、K(K、ong、iong)、L(L、iao)、Z(Z、ua、ü)、X(X、uan、üan)、C(C、uei、ue)、V(零声母、uen、üen)、B(B、uang)、N(N、uai)、M(M、ai),在音码键盘上,全拼码和双拼码可以不用切换输入,还可以混合输入,
(二)形码输入法,包括4码输入法和8码输入法,4码输入时,每个字符由1个形码+4个数码组成,每个词符由1至4个形码+4个数码组成,每个字符或词符最多打4键,8码输入时,根据每条词语的字数多少,分别选取1至4个形码+8个数码组成词符,
A、每个字符有1个形码,即结构码,把所有汉字按结构分为两类,左右类和非左右类,共2个形码,非左右类包括独体、上下、包围类,形码隐含在键盘上,只用来标明数码的区位,不用击键,
B、每个字符有4个数码,即笔画笔形码,用部件的笔画数+起笔笔形来定义部件,笔画数设定为2画、3画、4画三种,1画和5画以上的部件都打2画,笔形设定为横、竖、撇、点、折五种,其中横包括提,点包括捺,折包括横折、竖折、撇折,三种笔画和五种笔形共组成13个数码:2横、3横、4横、2竖、3竖、4竖、2撇、3撇、4撇、2点、3点、4点、折,因为折起笔的部件较少,所以不计笔画数,只设一键,编码时首先根据汉字的结构,以《新华字典》上的部首为基本部件,以《信息处理用GB1300.1字符集汉字部件规范》为拆分规则,对汉字进行拆分,然后根据每个字部件多少,分别取足四个数码,四部件字的每个部件各取一码,三部件字的前两个部件各取一码,第三个部件取两码,即加取第三部件的第二笔笔形,二部件字的第一部件取一码,第二部件取三码,即加取第二部件的第二笔笔形和第三笔笔形,一部件字取四码,即取前四笔笔形,取不足四码的可用A键和L键补充,超过四部件的字,按“一、二、三、末”部件各取一码,
C、词符的取码规则,根据每个词语的字数多少分别取码,4码输入时,二字词每个字取一个形码、两个数码,共6码,三字词每字取一个形码,前两字各取一个数码,第三字取两个数码,共7码,四字词每个字各取一个形码和一个数码,共8码,五字以上的词按“一、二、三、末”字各取一个形码和一个数码,共8码,取码方法与字符相同,8码输入时,二字词每个字取一个形码、四个数码,共10码,三字词每字取一个形码,前两字各取两个数码,第三字取四个数码,共11码,四字词每个字各取一个形码和两个数码,共12码,五字以上的词按“一、二、三、末”字各取一个形码和两个数码,共12码,取码方法与字符相同,
D、输入编码时,将13个数码在26个英文键上对称地排列成左右两个区,两个形码与两个区相对应,左右结构对应左区,非左右结构对应右区,左右结构的字从左区开始输入数码,非左右结构的字从右区开始输入数码,每输入一个数码轮换一区,即交叉输入法,两区共设两个折键,其中一个折键用来打横折,另一个用来打竖折和撇折,作为两区的公用键,A键和L键分别为左右两区的数码补充键,形码只用来限定数码的区位,不用击键,是一种隐含码,每个字有1个形码隐含码,每条词语的字数越多隐含码也越多,隐含码越多区分度越高,重码越少,字词输入方法相同,形码与双拼码或全拼码可以采用等长的4码或8码兼容输入,
E、形码输入法键盘,把26个英文字母键分为左右两个区,左区Q、W、E、R、T、A、S、D、F、Z、X、C、V13个字母键,右区Y、U、I、O、P、G、H、J、K、L、B、N、M13个字母键,把13个数码对称地排列在左右两区的字母键上,键盘左区的每一个字母键对应一个数码:Q(4点)、W(4撇)、E(4竖)、R(4横)、T(竖折、撇折)、A(3点、补充键)、S(3撇),D(3竖)、F(3横)、Z(2点)、X(2撇)、C(2竖)、V(2横),键盘右区的每一个字母键对应一个数码:Y(4横)、U(4竖)、I(4撇)、O(4点)、P(2点)、G(横折)、H(3横)、J(3竖)、K(3撇)、L(3点、补充键)、B(2撇)、N(2横)、M(2竖),其中的T键(竖折、撇折)和G键(横折)是两区的公用键,其中的A键和L键分别为左右两区的数码补充键,两个形码与两个区相对应,左右结构对应左区,非左右结构对应右区,
(三)音形码输入法,是按照音码和形码的取码规则和输入方法,取字词的部分音码和形码组成字符和词符,常用码的码长是4码或8码,4码输入时最多打4键,8码输入时最多打8键,专用码根据需要定码长,
A、每个字符由1个声码+1个韵码+1形码+2个数码组成,声码、韵码的取码方法与双拼输入法相同,形码、数码的取码方法与形码输入法相同,
B、每个词符根据需要确定码位,如常用词4位或8位,邮政编码6位,条形码10至13位,再根据码长选取音码和形码,取码方法与双拼输入法和形码输入法相同,8码输入时,擅长音码输入者以音码为基础码,以形码为辅助码,采取4音+4形的形式,擅长形码输入者以形码为基础码,以音码为辅助码,采取4形+4音的形式,
C、单字输入,两个声码和韵码按照音码输入法的双拼规则取码和输入,两个数码按照形码规则取码,仍然采取分区交叉输入的方法,
D、词语输入,一般采取8码输入,前四码为基础码,后四码为辅助码,用来筛选重码,作到无重码输入,特殊词语可根据需要确定码位长短,声码、韵码按音码输入法输入,形码和数码按形码输入法输入,
E、音形码输入法键盘,就是音码和形码在键盘上的综合排列,把全拼输入键盘、双拼输入键盘和形码输入键盘重合在一起,综合调配声码、韵码和数码的键位,使之在全拼、双拼、形码和音形码兼容输入时不会发生音节混淆的基础上,设置成全拼输入法、双拼输入法、形码输入法和音形码输入法公用的音形码键盘,声码、韵码和数码分别与26个英文字母键相对应:Q(Q、ou、4点)、W(W、an、4撇)、E(e、ei、4竖)、R(R、en、er、4横)、T(T、ang、竖折、撇折)、Y(Y、eng、4横)、U(ZH、u、4竖)、I(CH、i、4撇)、O(SH、o、uo、4点)、P(P、ao、2点)、A(a、ia、3点、补充键)、S(S、ian、3撇)、D(D、ie、3竖)、F(F、in、3横)、G(G、iang、ng横折)、H(H、ing、3横)、J(J、iu、3竖)、K(K、ong、iong、3撇)、L(L、iao、3点、补充键)、Z(Z、ua、ü2点)、X(X、ugn、üan、2撇)、C(C、uei、ue、2竖)、V、(零声母、uen、üen、2横)、B(B、uang、2撇)、N(N、uai、2横)、M(M、ai、2竖),左右两区仍然与两个形码相对应,另外,现在通用的全拼码,即12码输入法,也可以在本键盘上兼容输入,只需将ZH、CH、SH和ng改为两键输入即可。
CNB011332034A 2001-09-10 2001-09-10 汉语字词全息编码计算机输入方法及键盘 Expired - Fee Related CN1194287C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB011332034A CN1194287C (zh) 2001-09-10 2001-09-10 汉语字词全息编码计算机输入方法及键盘

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB011332034A CN1194287C (zh) 2001-09-10 2001-09-10 汉语字词全息编码计算机输入方法及键盘

Publications (2)

Publication Number Publication Date
CN1343926A true CN1343926A (zh) 2002-04-10
CN1194287C CN1194287C (zh) 2005-03-23

Family

ID=4671626

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB011332034A Expired - Fee Related CN1194287C (zh) 2001-09-10 2001-09-10 汉语字词全息编码计算机输入方法及键盘

Country Status (1)

Country Link
CN (1) CN1194287C (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100410853C (zh) * 2004-12-09 2008-08-13 朱广胜 一种汉字拼音输入方法
CN1952860B (zh) * 2006-11-15 2012-04-04 康佳集团股份有限公司 一种移动电话中实现双拼的中文输入方法
CN103105941A (zh) * 2011-10-18 2013-05-15 王道平 一种汉字输入方法
CN111324210A (zh) * 2018-12-13 2020-06-23 米环科技(长春)有限公司 一种应用于电子设备的键盘及键盘输入法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100410853C (zh) * 2004-12-09 2008-08-13 朱广胜 一种汉字拼音输入方法
CN1952860B (zh) * 2006-11-15 2012-04-04 康佳集团股份有限公司 一种移动电话中实现双拼的中文输入方法
CN103105941A (zh) * 2011-10-18 2013-05-15 王道平 一种汉字输入方法
CN111324210A (zh) * 2018-12-13 2020-06-23 米环科技(长春)有限公司 一种应用于电子设备的键盘及键盘输入法

Also Published As

Publication number Publication date
CN1194287C (zh) 2005-03-23

Similar Documents

Publication Publication Date Title
CN100552603C (zh) 汉语字词全息编码计算机手机输入方法及键盘
CN1194287C (zh) 汉语字词全息编码计算机输入方法及键盘
CN1022781C (zh) 一种汉字笔形编码的计算输入方法
CN103207684A (zh) 音素字母双拼输入法
CN1054449C (zh) 汉语字词全息编码计算机输入方法及键盘
CN1259698A (zh) 汉字双笔王码输入法
CN1196057C (zh) 一码二形数字编码汉字输入方法
CN1051798A (zh) 计算机汉字音形输入方法
CN1074147C (zh) 一种五码汉字输入法
CN1110739C (zh) 一种计算机汉字输入方法
CN100428121C (zh) 五加加汉字输入法
CN1022350C (zh) 汉字字母编码输入法
CN1115616C (zh) 计算机彝文字输入方法及其键盘
CN1207648C (zh) 五三码及其键盘
CN1013810B (zh) 中日西可选兼容智能键盘系统
CN1801053A (zh) 通俗五笔字根编码法及其键盘
CN1928789A (zh) 一种计算机汉字输入法
CN1188771C (zh) 一根形码汉字输入法
CN1388430A (zh) 现代汉语音文输入法
CN1024380C (zh) 高低笔号编码计算机输入法
CN1612095A (zh) 双拼输入法
CN1405660A (zh) 中文输入法
CN1167293A (zh) 汉字检索码-三码字形输入法及键盘
CN1107594A (zh) 一种计算机汉字输入方法
CN1059507C (zh) 定位部首码汉字输入方法及键盘

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20050323