CN1127382A

CN1127382A - 三码汉字输入方法

Info

Publication number: CN1127382A
Application number: CN 95104161
Authority: CN
Inventors: 王占江
Original assignee: Individual
Current assignee: Individual
Priority date: 1995-04-22
Filing date: 1995-04-22
Publication date: 1996-07-24

Abstract

一种三码汉字输入方法，将一个汉字的字形部分分解为字根、读音和笔划字元，每一字元对应键盘上的一个键，依次输入字元对应的键来实现汉字的输入。进行拆分时，依次优先分解字根、读音和笔划单元。不足三个，以该字拼音声母作为第三个码元。实施本发明的汉字输入方法及其键盘，简单易学，记忆量小；容易熟练，且可达到较高输入速度；由于键位的合理分布和采用音和形的交替输入，使输入过程变得有节奏性且不易感到疲劳。

Description

三码汉字输入方法

本发明涉及汉字计算机编码输入技术，更具体地说，涉及一种三码汉字输入方法。

汉字输入法的研究正朝着快速易学好用方向发展，但易学易记与快速输入常常是一对矛盾。为解决上述矛盾，已有多种汉字输入方法问世。如中国发明专利89106628公开了“一种汉字笔形编码输入方法”，将五种笔形的双笔形组合码按一定规律分配到键盘的30个键上，但是由于没有对高频双笔划组合进行处理，而可能使汉字编码在键盘上分布不均，从而增加码长度或使重码增加。中国发明专利91109879公开了“五笔二维编码法及键盘”，将汉字拆分成字根，以字根首笔和次笔来确定其在汉字字根总表中的位置，并辅以汉字读音来实现汉字的计算机输入，其特点是编码一致性好，但记忆量较大，在易学、好用、快速这三方面在相当程度上还是顾此失彼的。

本发明的目的在于提供一种三码汉字输入方法，这种三码汉字输入方法主要是对汉字的形进行编码，大多数汉字只需对其形有一定了解便可以输入，对少数汉字，配合其读音也可方便完成输入。

本发明的另一目的在于提供一种三码汉字输入方法，这种三码汉字输入方法只需要三个按键便可以完成其输入，且重码少、码短而输入速度快，易学好用。

常有“木子李、口天吴、白勺的、土也地”的说法，这说明汉字中的“字中有字”，即每个汉字中常常包含着其它汉字是常有的事，如“培”字中包含着“土、立、口”三个汉字，而这些字都有一个读音(即拼音)，这个读音又是为大多数人所熟识的，如果我们利用这种“字中字”结构及大家所熟识的拼音，可想而知，汉字输入将变得相当简单，如“培”字，我们取“土、立、口”这三个字每个字的声母合在一起构成“tlk”，于是，“tlk”便构成了“培”字的汉字编码。

当然，汉字不会都象“培”字那样构成，如“部”字中的“阝”，我们无法读出它的音，这样，我们就不能仅凭其读音得出“部”字的编码了。

但是，相信每个使用汉字的人对于汉字的笔划比拼音更为熟悉。如“阝”，它由两个笔划构成，首笔“勾”和次笔“竖”。

如果我们采用以下办法来得到“阝”的编码，相信大家不会觉得很难。先把汉字的笔划分成五类：横、竖、撇、捺、勾，再取键盘上标准指法控制的30个键，并将这30个键分成6个区(每个区占用5个键)，其中的五个区分配给横、竖、撇、捺、勾每种笔划一个区，剩下的一个区放单笔划，同时，把每个区的5个键再分配给这5种笔划，这样，我们去找“勾区里的竖”，找到的键就是“阝”的编码。这样找的好处是：不但很快可以找到所要的编码，而且实现了取码与指法的百分之百对应。

有了这一基础后，我们先把一个汉字分成若干个部分，再读每个部分的音或取它的形，这样就可以得到每一个字的编码。

剩下的问题是，是不是每一个字都可以按这种方法得到编码，这样做会有多少重码，还有什么特殊的问题，带着这些问题，通过对每个汉字的研究及对国标汉字库的拆分统计，并考查软件方面的可行性，得到了如下的三码汉字输入法。

为了实现本发明的目的，对汉字的形作如下约定：1)规定汉字的五种笔划为：横、竖、撇、捺、勾，按正常的书写规范一笔写成的为一个笔划，带拐弯的笔划全部算勾，点算捺；2)将每个汉字看成是若干个独立的部分构成，每个独立的部分称之为一个字元。具体地说，只要若干个笔划连接、交叉在一起，这些笔划就构成一个字元。形象地说，只要能与其它字元间“脱离”，就成一个字元。如“部”字，它分为“立、口、阝”三个字元。也就是说，本发明汉字输入方法的编码对象除了上述意义即字形意义上的字元，还可以是汉字的读音。

本发明的目的是这样实现的，构造一种三码汉字输入方法，通过将一个汉字分解为几个独立的部分，依次输入这几个独立的部分所对应的键来实现该汉字的输入，其特征在于所述字形的独立部分个数不超过3个，所述字形的独立部分包括字根字元、读音字元和笔划字元，所述字根字元由多个不可分解的笔划组合构成，所述读音字元是22组彼此互不相交的汉字组，分别对应于键盘上22个英文字母键，所述笔划字元由彼此互不相交的30个组构成，分别对应于键盘上a～z26个英文字母及；，./四个符号共30个键。

按照本发明提供的三码汉字输入方法，其特征在于，所述字根字元包括十个不可分解的笔划组合(月、艹、又、匕、十、钅、纟、木、日、冫)，分别对应所述键盘上’E、U、I、O、F、J、X、，、.、/’十个键。

按照本发明的提供的三码汉字输入方法，其特征在于，对输入汉字进行拆分时，字根字元优先，读音字元其次，最后是笔划字元。

按照本发明的三码汉字输入方法，其特征在于，所述读音字元是指对不可分解的单个汉字以其汉语拼音对其编码，它包括22个组：(凹）、(不本表半卜必巴八白丙币)、(串车才臣长厂斥册匆川重垂出承丞寸成叉尺丑)、(电丁刁刀大单弟当丹旦歹)、(而耳二儿)、(弗飞夫父丰凡乏方)、(干果弓瓜工更丐革甘龟戈个广)、(互火乎禾户)、(甲巾巨已斤柬击兼及久几九夹)、(口开)、(里六录隶力两来立了)、(目皿民面末麦米门免毛母马矛么灭）、(男内女乃农年牛鸟)、(片平)、(且曲七弃求犬丘千)、(人入刃)、(山史申尸肃事束世三上氏甩身生失手升)、(水少术勺书士)、(凸太兔土天)、(万五王未无乌勿丸卫文亡瓦我为)、(小西心象夕玄乡习下血)、(由央牙与尹已雨于羊丫业亚永用也予衣尤义玉夭)、(中文爪再专止州正之争舟朱乍子自主)，根据其读音分别对应于键盘上的英文字母键A、B、C、D、E、F、G、H、J、K、L、M、N、P、Q、R、S、T、W、X、Y、Z。

按照本发明的三码汉字输入方法，其特征在于，所述笔划字元由25个双笔划字元和5个单笔划字元共30个笔划字元，分别对应于键盘上30个键，该30个键位分为横、竖、撇、捺、勾5个双笔划区和1个单笔划零区共6个区，每个区分为横、竖、撇、捺、勾5个位，对双笔划根据首笔划确定区而次笔划确定区中的位，对单笔划，直接由笔划确定单笔划零区中的位。

按照本发明的提供的三码汉字输入方法，其特征在于，如果所述分解出的独立部分的个数等于或超过3，先后输入其中第1、第2和最后一个部分所对应的字元。

如“读”，取“讠”(第一字元)、“十”(第二字元)、“大”(最末字元)三个字元。

按照本发明的提供的三码汉字输入方法，其特征在于，如果所述分解出的独立部分的个数为2，则将该汉字的声母所对应的字母作为第三个码元输入。

如“汉”，取“氵”、“又”二个字元和“汉”字的声母“h”。

按照本发明提供的三码汉字输入方法，其特征在于，如果所述分解出的独立部分的个数为1即所输入汉字属于所述读音字元本身时，则依次输入该汉字的笔划字元、读音字元和末笔的零区笔划字元。

如“而”，取笔划字元“横里的撇”、读音字元“e”、末笔的零区字元“m”

实施本发明的三码汉字输入方法及其键盘，经过实验表明达到了如下指标：1)一般字重码率3％；2)难见字重码率4％；3)4600词重码率4.1％；4)普通文章平均击键次数2.2次。并且，采用本发明的汉字三码输入方法及其键盘，还具有以下优点：1)简单易学，无记忆负担；2)容易熟练，而且熟练后速度会很快；3)由于键位的合理分布和采用音和形的交替输入，使输入过程变得有节奏性且不易感到疲劳；4)由于字的输入固定在3码内完成，如果词的输入采用四码，很容易将词与字的输入分开。

结合附图和实施例，进一步说明本发明的目的、特点和效果，附图中：

图1是本发明三码汉字输入方法所用键盘的键面标示图。

本发明方法对所输入汉字进行分解编码，有以下形式的用于对汉字的形进行特征描述的字元：字根字元、读音字元和笔划字元。此外还包括在上述字形码长不足3键时使用的音码。1.字根字元

参见表1，可以看到这里的10个字元部分中的每一个是不可分解的，其中的每一个对应于键盘上的一个键位。该十个字元的出现频率较高，在实施时，可将该表内容显示在光屏上，以便于使用。表1：字根字元笔划组合月、艹、又、匕、十、钅、纟、木、日、冫对应键位 E U I O F J X ， . /2.读音字元

是不能再分解的单字，而直接输入所对应的英文字母，由于该不可分解的单字与键位的对应是利用该字的读音的首字母，故称之为读音字元，所以也特别有利于记忆。表2列出了读音字元及其编码。表2 读音字元字母汉字a 凹b 不本表半卜必巴八白丙币c 串车才臣长厂斥册匆川重垂出承丞寸成

叉尺丑d 电丁刁刀大单弟当丹旦歹e 而耳二儿f 弗飞夫父丰凡乏方g 干果弓瓜工更丐革甘龟戈个广h 互火乎禾户j 甲巾巨己斤柬击兼及久几九夹k 口开l 里六录隶力两来立了m 目皿民面末麦米门免毛母马矛么灭n 男内女乃农年牛鸟p 片平q 且曲七弃求犬丘千r 人入刃s 山史申尸肃事束世三上氏甩身生失手升

水少术勺书士t 凸太兔土天w 万五王未无乌勿丸卫文亡瓦我为x 小西心象夕玄乡习下血y 由央牙与尹已雨于羊丫业亚永用也予衣

尤义玉夭z 中丈爪再专止州正之争舟朱乍子自主3.笔划字元

笔划字元本身不是一个完整的汉字，如“部”字中的“阝”，它的码无法用读音表示，而只能以形来表达，这个形就是笔划字元。

笔划字元包括25个双笔划字元和5个单笔划字元共30个笔划字元，分别对应于键盘上30个键(QWERTYUIOPASDFGHJKL；ZXCVBNM，./)，该30个键位分为横(GFDSA)、竖(HJKL；)、撇(TREWQ)、捺(YUIOP)、勾(BVCXZ)5个双笔划区和1个单笔划零区(NM，./)共6个区，每个区(从中间到两边)分为横、竖、撇、捺、勾5个位。

如图1所述，将键盘上的30个键位分为六个区(即横、竖、撇、捺、勾、零区)，又将每个区标为五个位(即横、竖、撇、捺、勾位)，从字元的起笔去找相应的区(单笔划定为零区)，从字元的次笔(单笔划的次笔即首笔)去找相应的位(即到相应的区中依横、竖、撇、捺、勾的顺序找)，找到对应的键位即为该字元的形码，如“部”字中的“阝”，从第一笔“乙”先找到勾区，然后从第二笔“丨”中找到竖位，即找“勾里的竖”，对应的键位是“v”，“v”就是“阝”字元的形码。

在分解所要输入的汉字时，如果所述分解出的独立部分的个数等于或超过3，先后输入其中第1、第2和最后一个部分所对应的字元，在拆分字的过程中，字根字元优先、读音字元其次，最后是笔划字元。若读音字元出现重音字时，按A～Z顺序取较前的一个。

在分解所要输入的汉字时，如果所述分解出的独立部分的个数为2时，先输入第1和第2字形字元，再将该汉字的读音所对应的字母(音码)作为第三个码元输入。这里所说的音码，就是该字汉语拼音的首字母，即通常所说的声母。4.基本规则

本发明的三码汉字输入方法的基本规则是输入字的前二个字元和最后一个字元的码(读音字元或笔划字元的码，且前者优先，即有读音字元的情况下不可输入笔划字元)，然后敲空格键结束。不足三码补该字的声母，仍不足三码的补该字末笔划在零区中的对应键。如“部”字，输入“lkv”；“加”字，输入“lkj”；“失”字，输入“ts.”。5.重码的处理

本发明汉字输入属于定长编码，只有极少的汉字编码会超过3，本发明的一个实施系统是这样处理重码的。在敲击第3键时，若系统报长声响，则该字是重码，须强行选择；而如果此时系统报短声响，则可输入第四码(区分码)加以区分。区分码是：

如果未用过该字的读音，区分码即是该字的声母(该字的读音的首字母)；

如果已经用过该字的读音，区分码为该字末笔划在零区中的对应键。

如：“焚”和“禾”的输入码均是“，，h”，但它们可以通过区分码加以区分：“焚”的区分码为：“F”，因它的声母为“F”且未用过； “禾”字，因它的声母“H”已经用过，又因它的末笔是“丶”，“丶”在零区中对应“.”键，所以它的区分码为：“.”。6.字形独立部分的界定

1、相连但不交叉的两个部分如果有一个以上部分本身即是一个字时，要将其分开。如“去”字，虽然“土”和“厶”相连，但“土”本身已是一个完整的汉字，因此，要将“去”视作两字元构成；但要注意：交叉情况不可分。如“里”字，虽然日和土都有读音，但它们属交叉连接，故只能将“里”视为一字元而不是两字元。

注：与“口”相连者不分。如“别”分为“另、刂”两个字元，而不是分为“口、力、刂”三个字元，因“口”和“力”相连。7.关于单笔划的处理：

①单笔与前一个或后一个字元能组成一个音字元时，视其为一个字元，如“然”字中的“大”和“、”可以组成一个“犬”字，因此，这两部分只视作一个字元。但如果要输入该字本身，即“犬”字，就要将这两部分视作两个字元了。

②几个连续的分离的单笔划只作一个字元处理，如“气”中的“一”和“乙”视作一字元而不是两字元。

③“一”和“乙”取形而不读音。8.无法读音的字，例如“扌”，其音用“u”表示。9.下列字元规定不分体：贝，虫，彳，雨，疒，酉，辶10.下列字规定不作为字处理：廿，乇，缶，韦，奂，巳，臼，戋，艮，刍，幺，屯，酉，吏，禹，夷，壬，禺，甫。

在本发明的三码汉字输入法的一个最佳实施例的系统中，主要采用了以下技术手段：(1)在101键或其他键数的键盘上安排了30个键位并合理分布(根据指法分成6个区，每区5个键)，不但比常用的26个键位更能减低重码，而且由于重码的选择也采用这30个键而不用数字键，实现了汉字输入与标准指法的完全统一；(2)只规定了十个字根字元，并且始终显示在提示行内，无须记忆；(3)将汉字库分成两个部分：较常用的一般字与不太常用的难见字。规定以空格键作为一般字的结束键，以另一个其它键作为难见字的结束键，这样使得一般字与难见字的输入都很容易，同时由于一般字的重码率减低，相对提高了一般文字的动态输入速度；(4)二级简码作强行简码处理(即如果该字是二级简码，必须以简码输入，不得以全码输入)，并于提示行内预先显示。由于有预先提示，使得继续往下输入没有必要。这样，不但无需记忆就可以打出二级简码，同时，由于实行强制简码输入并予预先提示，不但提高了二级简码输入的准确性，而且减少了平均击键次数，输入速度便相应提高了；(5)不同于绝大汉字输入方法的四码输入，三码汉字输入方法采用三个码输入方式。虽然只用三码，90％的字不会产生重码，对于10％的重码字，又有7％可以通过区分码加以区分，所以只剩下3％的真正重码字，再加上词的输入，动态重码率可以控制在2％。

Claims

1.一种三码汉字输入方法，通过将一个汉字分解为几个独立的部分，依次输入这几个独立的部分所对应的键来实现该汉字的输入，其特征在于所述字形的独立部分个数不超过3个，所述字形的独立部分包括字根字元、读音字元和笔划字元，所述字根字元由多个不可分解的笔划组合构成，所述读音字元是22组彼此互不相交的汉字组，分别对应于键盘上22个英文字母键，所述笔划字元由彼此互不相交的30个组构成，分别对应于键盘上a～z26个英文字母及；，./四个符号共30个键。

2.根据权利要求1所述的三码汉字输入方法，其特征在于，所述字根字元包括十个不可分解的笔划组合(月、艹、又、匕、十、钅、纟、木、日、冫)，分别对应所述键盘上’E、U、I、O、F、J、X、，、.、/’十个键。

3.根据权利要求1所述的三码汉字输入方法，其特征在于，对输入汉字进行拆分时，字根字元优先，读音字元其次，最后是笔划字元。

4.根据权利要求1所述的三码汉字输入方法，其特征在于，所述读音字元是指对不可分解的单个汉字以其汉语拼音对其编码，它包括22个组：(凹)、(不本表半卜必巴八白丙币)、(串车才臣长厂斥册匆川重垂出承丞寸成叉尺丑)、(电丁刁刀大单弟当丹旦歹)、(而耳二儿)、(弗飞夫父丰凡乏方)、(干果弓瓜工更丐革甘龟戈个广)、(互火乎禾户)、(甲巾巨己斤柬击兼及久几九夹)、(口开)、(里六录隶力两来立了)、(目皿民面末麦米门免毛母马矛么灭)、(男内女乃农年牛鸟)、(片平)、(且曲七弃求犬丘千)、(人入刃)、(山史申尸肃事束世三上氏甩身生失手升)、(水少术勺书士)、(凸太兔土天)、(万五王未无乌勿丸卫文亡瓦我为)、(小西心象夕玄乡习下血）、(由央牙与尹已雨于羊丫业亚永用也予衣尤义玉夭)、(中文爪再专止州正之争舟朱乍子自主),根据其读音分别对应于键盘上的英文字母键A、B、C、D、E、F、G、H、J、K、L、M、N、P、Q、R、S、T、W、X、Y、Z。

5.根据权利要求1所述的三码汉字输入方法，其特征在于，所述笔划字元由25个双笔划字元和5个单笔划字元共30个笔划字元，分别对应于键盘上30个键，该30个键位分为横、竖、撇、捺、勾5个双笔划区和1个单笔划零区共6个区，每个区分为横、竖、撇、捺、勾5个位，对双笔划根据首笔划确定区而次笔划确定区中的位，对单笔划，直接由笔划确定单笔划零区中的位。

6.根据权利要求1所述的提供的三码汉字输入方法，其特征在于，如果所述分解出的独立部分的个数等于或超过3，先后输入其中第1、第2和最后一个部分所对应的字元。

7.根据权利要求1所述的提供的三码汉字输入方法，其特征在于，如果所述分解出的独立部分的个数为2，则将该汉字的声母所对应的字母作为第三个码元输入。

8.根据权利要求1所述的三码汉字输入方法，其特征在于，如果所述分解出的独立部分的个数为1即所输入汉字属于所述读音字元本身时，则依次输入该汉字的笔划字元、读音字元和末笔的零区笔划字元。