CN1105463A - 汉字输入码的编码方法 - Google Patents

汉字输入码的编码方法 Download PDF

Info

Publication number
CN1105463A
CN1105463A CN 94111835 CN94111835A CN1105463A CN 1105463 A CN1105463 A CN 1105463A CN 94111835 CN94111835 CN 94111835 CN 94111835 A CN94111835 A CN 94111835A CN 1105463 A CN1105463 A CN 1105463A
Authority
CN
China
Prior art keywords
code
phonetic
sign indicating
indicating number
chinese
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 94111835
Other languages
English (en)
Inventor
邓仁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN 94111835 priority Critical patent/CN1105463A/zh
Publication of CN1105463A publication Critical patent/CN1105463A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本发明提供了一种汉字输入码的编码方法,其特 征是通过按特定的规范对汉字分解构件、取特征、编 码等方法将汉字固有的各种信息(字形、读音、书写顺 序、笔画、笔画排列次序)集中反映在音形混合输入码 中。编码方法涉及到的知识基本上都是小学语文教 学中已有的内容。本发明兼有输入性能好(操作方 便、输入快、重码少、可以盲打)和容易学会、易于普及 两方面的优点。适于专业操作人员及非专业操作人 员通用。

Description

本发明涉及汉字信息处理系统,特别是汉字输入码的编码方法。
现有的汉字输入码如王永民发明的《五笔字型码》须经专门的训练才能掌握使用而且须经常操作才能保持技能。对于不经常操作的非专业人员来说,使用该码有困难。其他输入性能好(操作方便、输入速度快、重码少、可以盲打)的汉字输入码也都有非专业操作人员不易掌握的缺憾。现今计算机的使用在各个领域迅速普及,需要使用汉字输入码的人日益增多,单纯依靠少数专业人员进行操作已远远不能满足需要。因此要求汉字输入码不仅要输入性能好而且要易于掌握(不须专门训练)、易于普及(普通人都能掌握)。但是现有的汉字输入码还不能圆满地满足这样的需求。有些汉字输入码容易学会、便于普及,但输入性能欠佳,例如音数码只要有汉语拼音知识即可学会使用,但重码多,输入速度慢。
本发明的目的在于提供一种不但输入性能好(操作方便、输入速度快、重码少、可以盲打)而且容易学会(不须专门训练、只要阅读使用说明书即可自己学会使用)、容易普及(一般人都容易学会使用)的汉字输入码的编码法。
本发明的目的可以通过以下措施达到:(1)限定将汉字分解成3个以下的构件而且每个构件必须仍是汉字或部首。(2)按逆序取码法则取每一构件中若干笔画为该构件字形特征(注:逆序取码法则定义为将汉字笔画归纳处理后大体上按笔画在汉字中出现的频率、由低到高依次排列,规定取同一构件中笔画表示该构件的字形特征时必须按上述原则排定的次序依次优先采取,因为上述笔画排列次序大体上恰与现代汉语教科书中汉字笔画名称表所列笔画次序相反,故命名为逆序取码法则),取每个构件的读音的第1个字母为该构件的语音特征,(3)规定1个字形特征称为1个字形码并与键盘上1个指定的键对应,1个语音特征称为1个语音码并与键盘上1个指定的键对应,字形码与语音码应对应不同的键,2至6个字形码和语音码混合编成1组输入码,可以代表1个汉字或1个词、1个词组,1组输入码内字形码的次序应按其所在构件的次序排列(构件的次序按书写顺序排列),同一构件中两个以上的字形码的次序按前文所述逆序取码法则排列,同样地1组输入码内语音码的次序亦应按其所在构件的次序排列,但是一组输入码中语音码和字形码的数目允许有多种不同的组成,并且语音码与字形码的序位也允许有多种不同的排列,(4)具有相同数目的语音码和字形码并且语音码(或字形码)的序位相同的输入码的集合定义为1个层,不同类型的汉字集(如字与词)应归纳到不同的层中。层这一概念是本发明首次提出的。使用它,不但可以将容纳空间扩大许多倍而且可以将不同的汉字集比较有秩序地控制在不同的层中。其用途是多方面的:可以有效地降低重码率、可以容纳规范码和非规范码(见下文),输入字和词间打时不必切换等。
前文已规定每个构件必须仍是汉字或部首并规定取构件读音的第1个字母为该构件的语音特征。若构件是现代汉字,其读音自然以国家语委颁布的标准读音为准。但若构件是部首,情形便有所不同,因为有一部分部首在现代汉语中是只有名称而无读音的,故补充规定可以参照现代汉语中部首的名称给部首以指定的读音。
规定指定部首读音应参照部首名称是因为大多数部首名称是人们熟知的,以便于记忆。但是有少数部首的名称是不为人熟知的(如厶、彡、髟)为便于记忆再补充规定可以将这类部首的读音一概指定为(O)。
鉴于有许多人读音不准确,为使用方便起见,补充规定语音码F与H兼容(意即按F键与按H键等效)、L与N兼容(意即按L键与按N键等效)。
本发明的汉字输入码包括规范码和非规范码,规范码的编制不但应遵守前述全部编码规定而且还应遵守一些附加规定如a、笔画部首不作为构件,b、凡能够分解成3构件的汉字均应分解成3构件处理,其输入码归属于相应的指定的层中,凡不能分解成3构件而能分解成2构件的汉字均应分解成2构件处理,其输入码归属于相应的指定的层中,凡不能分解的汉字均按单构件字处理,其输入码归属于相应的指定的层中,c、构件的笔画按国家语委颁布的标准正字表为准。非规范码定义为不完全遵守附加的规定(如前述a、b、c项规定)的汉字输入码。
规范码和非规范码的概念也是本发明首次提出的,其意义是什么呢?实际上以往的汉字输入码都是规范码,因为它们都是按一定的规范编制的。如果不符合规范就是错误的。只有非规范码才是本发明独具的。为什么要有非规范码呢?因为即使最基本的语文知识人们也往往没有完全正确掌握,或者由于操作者习惯或疏忽编错码,这是常见的情形。本发明引入了数倍于规范码的非规范码,将操作者容易出现的错误尽可能包容在内。这样,即使操作者编码不完全规范,只要在非规范码的范围内,仍可输入,只是重码率略高一点。
为了引入非规范码而不增加规范码的重码率,补充规定如果非规范码与规范码出现重码则保留规范码,取消非规范码。
本发明的汉字输入码可以适用于标准英文小键盘,也可以使用专门设计的键盘。语音码的键名与英文键盘上相应的英文字母键同名,字形码键名以经归纳处理后的笔划命名并在键盘上依前述规定次序排列。
本发明具有以下优点:
(1)容易学会、易于普及。容易学会的意思是指操作者只要具有小学毕业的文化水平,不须专门训练只要阅读使用说明书即可自行学会使用。由于本发明的编码方法所涉及到的构件、语音特征、字形特征均来自汉字和汉语拼音的基础知识,虽有一些人为的规定但所规定的内容均顺应人们所熟知的语文知识,自然容易记得;规定以构件读音的第1个字母为构件的语音特征并规定语音码F与H、L与N兼容所以并不要求操作者汉语拼音正确无误而只要求具有汉语拼音的基本知识;编码规则简单明了;引入大量非规范码,即使操作者编码不完全规范也能输入。综上所述可知本发明的编码法不但规则简明而且所须记忆的内容很少,主要是笔画的排列次序而这已按规定标明在键上了(实际上是提示)所以操作者只要读了使用说明书就可以明了编码方法,进行操作了。
因为容易学会而且对操作者文化水平要求不高自然容易普及。此外,本发明的汉字输入可以在现在普遍使用的标准英文小键盘上进行,也有利于本发明的普及推广。特别应提到的是由于本发明的内容与小学语文教学可以相容,所以本发明的普及推广工作可以容纳到小学语文教学中。这一特点如付之实施,将对我国计算机使用普及推广起到不可估量的作用。
(2)输入性能好。指操作方便、输入速度快、重码少、可以盲打,兹分别说明之:由前文所述可知本发明的汉字输入码不仅容易学会而且输入方便。需要补充的是由于本发明使用了分层输入,所以在字、词、词组间打时不必切换,十分方便。至于重码少特别是在如此容易学会而又对操作者输入操作要求如此宽松的条件之下仍能做到重码率很低的根源存在于本发明的深层构思之中。首先本发明的汉字输入码从形式上看是音、形结合码但实质上包涵了汉字、汉语语音全面的信息(字形、读音、书写顺序、笔画、笔画顺序[逆序])而且巧妙自然地利用了这些信息。唯其包涵信息多故而重码率低,唯其顺乎自然故而操作者需要掌握的基本上是小学已学会的知识,所以易学易用。特别是创造了逆序取码法则优先采取在汉字中出现频率较低的笔画为构件的字形特征,排他性极强而且按此法则即使取在汉字中出现频率较高的笔画为构件的字形特征时也说明该构件中不存在出现频率较低的笔画,排他性同样很强。以上是重码率低的首要原因,其次由于本发明提出并使用了层的概念,使容纳空间扩大了许多倍,并进一步将汉字较有秩序地归纳入不同的层中也有效地降低了重码率。因重码率低故可以盲打。输入速度也许是衡量输入性能优劣最重要的指标,因为它直接反映了输入性能的一个主要方面。但实际的输入速度并不完全取决于输入每字的击键次数,操作不方便、编码易失误,重码率高都在相当大的程度上影响实际的输入速度。本发明的汉字输入法输入每字的击键次数可以与现今实际应用较广的《五笔字型码》相同即输入每字击键4次。而且前文已说明本发明的汉字输入法操作方便、容许编码不完全规范、重码率低,可以盲打,因此本发明的实际输入速度是较快的。特别要指出的是鉴于汉文中有很多词和词组,所以在实际应用中字、词、词组间打将大大加快输入速度而本发明的特点之一就是进行上述间打时不必切换,这将十分有利于加快输入速度。
(3)由于本发明的汉字输入码容纳空间大并实行分层归纳,可以容纳众多的字、词、词组包括繁体字、异体字。
附表的说明如下:
表1是《笔画次序表》。
表2是《汉字部首读音、语音码表》。
表3是《输入码中语音码和字形码序位表》。
本发明将结合实施例做进一步详述。
本文所述之若干编码的规定可具体化如下:
(1)将汉字笔画归纳处理并按逆序取码法则,指定次序如表1。
(2)参照汉字部首名称规定部首读音如表2(名称不为人熟知者规定为<O>)。
(3)规定3构件字、2构件字、单构件字及双音词、3音词、多音词输入码的语音码和字形码的序位如表3。
作了上述具体化规定之后,并按本发明编码法之其他规定即可对字、词编码。
例字1:椅。
可分解为3构件:木、大、可。
由表3,3构件字输入码的语音码和字形码的序位为:
1123
按表1 形1为丿
按表2 音1为M 音2为D 音3为K
输入码为:M丿DK
如操作者出于习惯或疏忽将椅字分解成2构件:木、奇。
由表3,2构件字输入码的语音码和字形码的序位为
1122
按表1、表2输入码为  M丿Q亅
但因为分解时将本来可以分解成3构件的字分解成2构件处理不完全符合编码规定故所编的输入码为非规范码。
例字2:好。
分解为2构件:女、子。
按表3,2构件字输入码的语音码和字形码的序位为
1122
按表1、表2输入码为
NㄑZ亅
因为前文已规定N与L兼容故输入码也可编为LㄑZ亅
例字3:其。
属单构件字,按表3单构件字输入码的语音码和字形码的序位为:全字音 形123
按表1、表2输入码为Q丷丨丨
例4(双音词)南京
按表3,双音词输入码的语音码和字形码的序位为
1122
按表1、表2输入码为N亅G
例5(3音词)拖拉机
按表3,3音词输入码的语音码和字形码的序位为
123空格键(代码为凵)
按表1、表2输入码为TLJ凵
例6(多音词)中华人民共和国
按表3多音词输入码的语音码和字形码的序位为
123
按表1、表2输入码为ZHRG
Figure 941118355_IMG1
Figure 941118355_IMG2
Figure 941118355_IMG3
Figure 941118355_IMG4
Figure 941118355_IMG5
Figure 941118355_IMG6
Figure 941118355_IMG7
Figure 941118355_IMG8

Claims (6)

1、一种汉字输入码的音形混合编码法,其特征是:(1)限定将汉字分解为3个以下构件而且每个构件都必须仍是汉字或部首,(2)按逆序取码法则取每一构件中若干笔画为该构件的字形特征(注:逆序取码法则定义为将汉字笔画归纳处理后大体上按笔画在汉字中出现的频率、由低到高依次排列,规定取同一构件中笔画表示该构件的字型特征时必须按上述排定的次序依次优先采取),取每个构件读音的第1个字母为该构件的语音特征,(3)规定1个字形特征称为1个字形码并与键盘上1个指定的键对应、1个语音特征称为1个语音码并与键盘上1个指定的键对应,字形码与语音码使用不同的键,2至6个字形码和语音码混合编成一组输入码可以代表1个汉字或1个词或1个词组,一组输入码内字形码的次序应按其所在构件的次序排列(构件的次序按书写顺序排列),同一构件中两个以上字形码的次序则按前述逆序取码法则排列,同样地语音码的次序亦应按其所在构件的次序排列,但是一组输入码中语音码与字形码的数目允许有多种不同的组成,并且语音码与字形码的序位也允许有多种不同排列,(4)具有相同数目语音码和字形码并且语音码(或字形码)的序位相同的输入码的集合定义为层,不同类型的汉字集<如字与词>应归纳到不同的层中。
2、按权利要求1所述的汉字输入码的音形混合编码法,其特征是汉字的构件为部首时其读音应参照现代汉语中部首的名称给予指定的读音。
3、按权利要求2所述的汉字输入码的音形混合编码法,其特征是在指定部首的读音时对于一些名称不为人所熟知的部首(如厶、彡、髟)可以一概指定读<0>。
4、按权利要求1所述的汉字输入码的音形混合编码法,其特征是语音码F与H兼容(按F键与按H键等效)、L与N兼容(按L键与按N键等效)。
5、按权利要求1、2、3、4所述的汉字输入码的音形混合编码法,其特征是输入码包括规范码和非规范码,规范码的定义是不但符合前述编码规定而且还须符合一些附加的规定如a、笔画部首不作为构件,b、凡能够分解成3构件的汉字均应分解成3构件进行处理,其输入码归属于相应的指定的层中,凡不能分解成3构件而能够分解成2构件的汉字均应分解成2构件进行处理,其输入码归属于相应的指定的层中,凡不能分解的汉字均按单构件字进行处理,其输入码亦归属于相应的指定的层中,c、构件的笔画按国家语委颁布的标准正字表为准,非规范码定义为不完全符合上述a、b、c项附加规定的输入码。
6、按权利要求5所述的汉字输入码的音形混合编码法,其特征是当规范码与非规范码出现重码时,保留规范码,非规范码失效。
CN 94111835 1994-07-15 1994-07-15 汉字输入码的编码方法 Pending CN1105463A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 94111835 CN1105463A (zh) 1994-07-15 1994-07-15 汉字输入码的编码方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 94111835 CN1105463A (zh) 1994-07-15 1994-07-15 汉字输入码的编码方法

Publications (1)

Publication Number Publication Date
CN1105463A true CN1105463A (zh) 1995-07-19

Family

ID=5035665

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 94111835 Pending CN1105463A (zh) 1994-07-15 1994-07-15 汉字输入码的编码方法

Country Status (1)

Country Link
CN (1) CN1105463A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107193787A (zh) * 2017-04-14 2017-09-22 木仁 一种蒙古文字母变体形式的自适应方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107193787A (zh) * 2017-04-14 2017-09-22 木仁 一种蒙古文字母变体形式的自适应方法

Similar Documents

Publication Publication Date Title
CN85100837A (zh) 优化五笔字型编码法及其键盘
CN1119739C (zh) 五笔数码键盘汉字电脑输入法及其键盘
CN1645356A (zh) 多维汉语学习系统
CN1105463A (zh) 汉字输入码的编码方法
CN87100555A (zh) 双笔顺计算机汉字输入方案及其键盘
CN1384426A (zh) 电脑汉字典码输入方法
CN1035083C (zh) 面向词的中文文字处理输入装置
CN1072785A (zh) 无理序号数字综合编码法及其键盘
CN1034245C (zh) 缅文字型智能四码输入系统
CN1050915C (zh) 一种计算机汉字输入引导提示方法
CN1062667C (zh) 全拼形导码计算机汉字输入方法
CN1049418A (zh) 统一码计算机汉字键盘输入方法
CN1043381C (zh) 汉字四笔画数码输入法
CN1069420C (zh) 文字式音形汉字输入方法
CN1116336A (zh) 替调式汉语拼音汉字、词输入编码法及键盘
CN1110802A (zh) 智能拼音输入法
CN2476059Y (zh) 姜码输入法的键盘
CN1251925A (zh) 毕升计算机汉字输入法及其键盘
CN1332402A (zh) 字词句万能组合汉字输入法
CN1108553C (zh) 通用普及型音元形音汉字编码输入方法
CN1095502A (zh) 字元谱汉字编码法(炎黄码)及其键盘
CN1060277C (zh) 以句子为输入单位的计算机汉字编码输入方法
CN1160243A (zh) 字形笔顺码汉字输入系统及其键盘
CN1123425A (zh) 汉字形音四码编码方法及其键盘
CN1567158A (zh) 拼音笔画排序汉字输入键盘及其输入方法

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C01 Deemed withdrawal of patent application (patent law 1993)
WD01 Invention patent application deemed withdrawn after publication