CN1328649C

CN1328649C - 汉字“三形联想”形码输入法

Info

Publication number: CN1328649C
Application number: CN02131465.9A
Authority: CN
Inventors: 林宗兴; 林宗藩
Original assignee: Individual
Current assignee: Lin Zongfan; Lin Zongxing
Priority date: 2002-10-16
Filing date: 2002-10-16
Publication date: 2007-07-25
Anticipated expiration: 2022-10-16
Also published as: CN1455316A; AU2003272866A1; WO2004036404A1

Abstract

本发明公开了一种汉字“三形联想”形码输入法，旨在提供一种重码率低，易学、难忘、快速的汉字输入方法。该方法选择300个形元按形以同族原则分成26族，通过音、形、意的联想，使各族形元与键盘上的26个英文字母建立对应关系，构成谐音能够声读的“形元”族。300个形元中的一部分可用于3000个最常用汉字的输入，一部分用于7000个常用汉字的输入。全部300个形元用于简化字和繁体字以及古汉字的输入。将汉字以基本字形元素为单位，按照三类九型结构的分类及取码方法，选取三个字形元素依次键入，同为字形元素时以大优先。本发明码长短，重码率低，可在伴读声下，从汉字中提取编码所需的形元，通过谐声指示击键，达到快易输入汉字的效果。

Description

汉字“三形联想”形码输入法

技术领域

本发明涉及一种文字处理方法，更具体的说，是涉及一种汉字输入方法。

背景技术

中文信息处理的现代化，是国民经济和社会信息化的基础。计算机键盘输入汉字效率的提高，是实现中文信息处理现代化的瓶颈。因为“效率就是生命”已是人们的共识。

当今虽有上千种计算机键盘输入汉字的编码，然而至今还没有一种编码能做到既好学又好用。也就是说好学的打不快。所谓好学的拼音码，重码多，难以盲打，同音字、生僻字、语音不统一等难题无法解决，效率难以提高。至于当前常用的形码，虽然能打的快，熟练者打字速度甚至超过英文，但既难学又易忘，学习效率很低。有人说就像学了一门“外语”。若不经常使用又会忘掉大半。因此这种形码，只能在专业打字员中使用。如果汉字计算机的编码不能普及使用，或使用效率低下，文件的起草与录排不能同步，即打字要转手，不能像英文那样，只要练练指法，稍加学习，多数人都会打字，也就不能说，汉字的计算机键盘输入，已经真正实现了现代化。

当今尚有许多“音形”、“形音”、“音数”并举，及数笔画的汉字编码。这些编码，虽然能好学些，或者能降低一些重码率，但其诸多缺陷，都难以从根本上提高效率。此外尚有声控和手写的输入方法。声控存在南腔北调难统一，说错了改也难等问题。手写输入汉字，由于笔画多，输入慢，计算机识别难，效率很低。因此，这些方法只能在特定条件下使用，难以普及推广，要想成为计算机输入汉字的主流，是很困难的事情。

综上所述，汉字编码虽然从无到有，在一定程度上，满足了中文信息处理现代化的需求，但从总体上讲仍效率低下，还远远不能满足日益增长的国民经济和社会信息化的需求。计算机键盘输入汉字编码方案，虽然有了量的积累，仅报请专利的就有1000多种，但汉字计算机编码方案，更需要有质的飞跃。汉字编码要做到：易学、难忘、快速三者兼有，才能达到要求。

发明内容

本发明是为了克服现有技术中的不足之处，提供一种重码率低，易学、难忘、快速的汉字输入方法。

本发明通过下述技术方案实现：

一种汉字“三形联想”形码输入法，包括下述步骤：

(1)选择字形元素作为编码的基本部件，按形以同族原则分成26族，并与键盘上的26个字母对应，其对应关系如表1所示；

(2)输入汉字；

所述汉字输入规则为：以基本字形元素为单位，按三类九型的取码点选取三个字形元素，依次键入即可完成一个汉字的输入；同为字形元素时以大优先，字形元素相连或相交时采用上下或左右断开公用笔画再取码的方法。

在输入汉字时，将汉字分为三类九型，根据取码点选取字形元素；所述三类为指单列类、双列类和三列类；所述九型及取码方法为：

“01型”为成字的字形元素，输入时在该成字字形元素后边补两个“W”识别码；

“02型”为上下可拆分成二个字形元素的字，其后补一个“L”或“R”为识别码，完成三码的输入；

“03型”为上下可拆分成三个及三个以上字形元素的字，按首、二、末三个字形元素依次键入；

“012型”为品字型，可拆分成上部和下部，取上部第一个字形元素、取下部第一个字形元素和最末一个字形元素；

“021型”为倒品型，可拆分成上部和下部，分别取上部两部分的第一个字形元素和下部最末一个字形元素；

“11型”为左右型，左右各取一个字形元素，在其后补一个“R”或“L”识别码完成输入；

“12型”为左右型，取左边一个字形元素，右边取首、末二个字形元素；

“21型”为左右型，取左边首、末二个字形元素，取右边一个字形元素；

“111型”为川字型，从左到右依次取首、二、末三个字形元素。

在输入常用汉字时，键盘上26个字母与字形元素的对应关系如表2所示；

输入汉字时，汉字拆分编码规则如下：相接的字形元素，分解拆分；字形元素相连或相交采用上下或左右断开公用笔画再取码的方法，能上下断开的不左右断开；框外字形元素足够时，框内字形元素不编码；字形元素足够时，角点不编码；字形元素不足时角点编入码；有边框时，向下脱框编码，先框外后框内；向上脱框编码，先框内后框外；左旁两字形元素以上的字，取左旁的首、末码和字的末码；带廴和辶旁的字从左起编码，不按笔顺；离散汉字结构的字，顺其自然拆分。

在既输入简体字，又输入繁体字或古汉字时的字形元素与键盘上26个字母的对应关系如表3所示。

本发明具有下述有益效果：

本编码根据六书造字(即象形、形声、会意、指事、假借和转注六种形式)的字理，采用先人造字历史形成的科学的方法，提取用于编码的字形元素简称“形元”，取码的方法采用音、形、意的联想设计的。汉字经过严格分类，每个字的取码点是固定的。只要按规则编码，任何一个汉字的编码都是唯一的。很少有似是而非的所谓容错码。它的逻辑性远远高于当今各种形码。其码长较短，字、词涵盖面大。而且，因取码与象形等六书的形、音、意紧密相连，使逻辑与形象完美结合。故学之有趣，不枯燥乏味。从而提高学习和使用效率，能达到事半功倍的效果。

具体实施方式

下面结合具体实施例对本发明作进一步说明。

本编码是根据六书造字的字理，取码的方法采用音、形、意的联想设计的。本编码从《汉字部件规范GF3001-1997》中选取210个部件，另加创新部件90个共300个，作为本编码的末级部件。并将其定义为“字形元素”(简称“形元”)，用以编制总数21003个海内外汉字的三个“形元”的编码。

将300个“形元”，按形以同族原则，分成26族的组合，通过音、形、意的联想，使各族形元与26个汉字拼音字母即键盘上的26个英文字母建立映射关系。即把英文字母当成汉字拼音字母，构成谐音能够声读的“形元”族。可在伴读声下，从汉字中提取编码所需的字形结构要素——字形元素。通过谐声指示击键，达到快易输入汉字的效果。

字形元素、各族的组成及与键盘上26个字母的对应关系参见表1、表2和表3。其中表1所示的字形元素用以输入3000个最常用简体字，可用于手机等需要简单输入方面的应用。表2用于输入7000个常用汉字，表3所示的字形元素增加了繁体字和古汉字中的字形元素，用于既输入简体字，又输入繁体字或古汉字的情况。表中用“口”表示的字，如“金”、“米”等字，在不作偏旁单独使用时要拆分。

为了在学习时容易记忆字形元素，在本输入法中增加了联想的方法，如表二中联想方法所示。

为了使汉字的拆分更合理，将汉字结构按照“三类九型”分类。汉字“三类九型”结构分类及取码规则如表4所示。表中的“点”表示汉字编码时提取形元的位置。

表4中：□表示单个形元；

表示任何纯单列

表示任何单列类

表示任何类型结构

(一)“三类九型”分类方法和字形识别码：

汉字结构非常复杂，一般形码只把汉字结构分为上下型、左右型和杂合型三种。因此使许多复杂结构的汉字，取码点难以确定，以致编码时无从下手。为了更加直观、快速地确定取码点，提高编码效率，本编码将汉字结构分为“三类九型”。

“三类”是指单列类、双列类和三列类。

“九型”内容如下：

“01型”为成字的“形元”，故在该成字“形元”后边，补两个识别码“WW”以完成输入。如“人”的编码为A，则人字的输入编码为AWW。

“02型”为上下可拆分成二“形元”(二码)的字。其后补“L”或“R”为识别码，以完成三码的输入。如“古”字拆分为十、口，则“古”字的输入码为SOL。

“03型”为上下可拆分成三个以及三个以上“形元”(三码)的字，如“亭”字，拆分成：亠、口、丁。它的编码为LOT。

“012型”为品字型，可拆分成上部和下部，取上部第一个字形元素、取下部第一个字形元素和最末一个字形元素；如“薪”字拆分为：艹、立、丁其编码为NLT。

“021型”为倒品型，可拆分成上部和下部，分别取上部两部分的第一个字形元素和下部最末一个字形元素；如“型”字拆分为：一、刂、土其编码为HZT。

“11型”为左右各一个“形元”(一码)的字。如“叮”字的拆分为：口、丁，补识别码“R”或“L”则其编码为OTR。

“12型”为左边一“形元”(一码)右边二“形元”(二码)的字如“胸”这的拆分为：月、勹、ㄩ则其编码为MPU。

“21型”为左边二“形元”(二码)右边一“形元”(一码)的字，如“趁”字的拆分为：土、人、彡则其编码为：TAP。

“111型”为川字型，从左到右取首、二、末三“形元”(三码)。如“潮”字的拆分为：氵、十、月则其编码为DSM。

(二)字形分类的特殊情况：

①多排列字如州、洲等，属三列类。按“111型”从左到右取首、二、末。则洲字拆分为：氵、丶、丨其编码为DDZ。

②全包型属单列类。按先框外，后框内脱框分型处理。如“回”字为“02型”。“国”字为“03型”。

③上三包、下三包、左上包、右上包的字属单列类。如：风、凶、厅、句等字按“02型”处理。如：同、病、虱等按“03型”处理。

④左三包、左下包的字属双列类。如：巨、达等按“11型”处理。如：医、过等按“12型”处理。如：趟、起等按“21型”处理。上述分类和处理方法。都是顺其自然，不用死记。

(三)“三形联想”单字编码原则

1.以形取码，按书写顺序，从左到右从上到下，先外后内(有廴和辶字旁的字例外)。

2.以基本“形元”为单位，按“三类九型”字形结构和取码点取码。

3.一般按首、二、末三个“形元”的顺序取码，最多只取三码。

4.单体结构拆分，要拆成码数少，笔画数多的“形元”(即成大优先)。

5.当单字“形元”不足三码时，补上字形识别码。

6.有些相交或相连的字，不成“形元”，采取“断开”拆分法，使之成为“形元”后来取码。

(四)汉字拆分编码规则及例字

1.相接的“形元”，可以分解拆分

2.“形元”相连、相交可以上下断开公用笔画(能上下断，不左右断)

3.形元相交，可以左右断开公用笔画

4.框外形元足够(包括角点)，框内形元不编码

5.形元足够角点不编码

6.形元不足角点编入码

7.向下脱框编码(包括向外、向右)先框外后框内

例字	拆分	编码	例字	拆分	编码
例字	拆分	编码	例字	拆分	编码	周	冂土口	MTO	匾	匚丶门	EDM
恩	囗大心	KYD	为	丶力丶	DUD	周	冂土口	MTO	匾	匚丶门	EDM
恩	囗大心	KYD	为	丶力丶	DUD	尚	小冂口	XMO	阚	门フ乂	DIC

8.上脱框编码，先框内后框外

9.左旁两形元以上的字，取左旁的首、末码和末码(“ 型”有例外)

上述“

形”即“川字形”的例外如：

10.带廴和辶旁的字从左起编码(不按笔顺)

11.离散汉字结构的拆分，要顺其自然

12.特殊规定：

儿、三种形元组合结构，不属双列类和三列类，而归属单列类。

(五)简码输入

为了提高输入速度，本编码将常用汉字(尽可能选高频使用汉字)，只取其前边一个或两个“形元”，再加一个数字键或空格键结束。作为该字的编码；以构成简码。卤本编码是三码的编码(三键结束)。故只设一、二级简码。

1.一级简码

本编码的一级简码分两个层次。第一层次是：每族可安捧1个高频字的首码加空格键，共26个简码。第二层次是：每族“形元”可以安排10个首码相同的高频使用汉字，各加一个数字键，共加10个数字键，作为l0个简码。本编码共26族。故可安排26×10＝260个。

一级简码共26+260＝286个，参见表5。

2.二级简码

二级简码是指编码时，只取单字的前两个”形元”的代码，再加一个空格键结束，并挑选使用频率较高的汉字，为二级简码。二十六族”形元”的代码，其前两码的组合共计有26×26＝676个二级简码(其中有9个空位)，参见表6。

3.一、二级简码均设计屏幕提示，无需记忆。专业人员稍加练习后，均可实现盲打。

(六)词汇编码规则

许多编码的方法的实践都证实，词汇编码输入都可以有效降低重码率，且显著缩短码长，从而大大提高输入速度和效率。本编码采用三码的词码输入，且以三字以上的词为主，速度和效率极高。

1.双字词的编码规则

本编码的双字词多用在“独词”。第一字按规则取二码，第二字取首码。

例如：

例词	拆分	编码
例词	拆分	编码	琵琶	王匕王	HJH
猞猁	犭人犭	CAC	琵琶	王匕王	HJH
猞猁	犭人犭	CAC	旮旯	九日日	UKK
傀儡	亻丿亻	APA	旮旯	九日日	UKK
傀儡	亻丿亻	APA	邋遢	辶ㄑ辶	WJW

2.三字词的编码规则

三字词的编码是取每字的首码。

例如：

例词	拆分	编码
例词	拆分	编码	共产党	艹立	NLX
联合国	耳人囗	HAK	共产党	艹立	NLX
联合国	耳人囗	HAK	操作员	扌亻口	QAO
办公室	丶八宀	DBG	操作员	扌亻口	QAO

3.多字词的编码规则

多字词的编码规则是取一、二、末字的首码。例如：

(七)繁体字和古汉字的编码：

为适应更广泛的要求和便于进行海内外交流，本编码除设计简化汉字系统外，还设计了繁体汉字和古汉字的编码系统。本编码共编制海内外汉字总数为21003个。繁体字与古汉字的编码规则与简化字相同，但分别增加一个规定的结束键(或转换键)

1.繁体字的编码

2.古汉字的编码

本编码采用分集设计，“正集”的编码只设三个字位(正字、副字、余字)，用于打常用汉字和通用汉字。“副集”的编码设5个字位，“余集”的编码设10个字位，供屏幕上选择。“副集”和“余集”用于打繁体字、古汉字和海外汉字。根据“国家语委”提供的汉字使用频率统计资料。正集汉字，使用率为93％、副字6.1％、余字0.85％。尚有0.05％的汉字，需在副集中查到。如果你要的是副字，继续打入键盘<2>或<9>即可更改为副字。如果你要的是余字，则需要借助“提示行”，出此情况的机率不到1％。故操作多次以后，会很快记住的。本编码简化汉字体系，常用汉字的重码率，在三码条件下仅5％左右。若使用一、二简码和以打词码为主，则接近无重码。繁体、古汉字体系则需借助提示行。

本编码的技术特点是：

1.本编码是以拼“形音”为特点的纯形码：

本编码是以形取码的，使用的代码是汉字拼音字母。即把汉字的笔画、偏旁、部首、规范部件和创新部件等字形结构要素，统称为字形元素(简称“形元”)。通过音、形、意的联想，把这些“形元”当成可以声读的汉字拼音字母。每个汉字的字形都只用三个汉字拼音字母为代码进行编码。这是一种有声有拼形。不但与拼音文字(如英文等)的键盘输入有异曲同工之效，而且更加快速简练。如：“江”字拆分成三“形元”为：氵、丅、一，其中“氵”(点Diǎn)联想为D，“丅”为T，“一”(横Héng)联想为H，故其编码为DTH。

用拼“形音”的方法输入汉字，是因为汉字的字形是表意的。南腔北调听不懂，但一写出字来(字形)就全懂了，就是这个道理，汉字不像西方拼音文字那样只是“记录语言的书写符号”(不懂字音的意思，就不认字)。汉字还是“记录人的思维、意识、观念的书写符号”。对于键盘输入也只有用汉字的字形才能准确表意。因为汉字的同音字太多，所以只有用拼形输入汉字，才能实现低重码率。本编码比一般形码更进一步的是：本编码不是单纯的机械拼形，而是拼“形音”，是建立在联想的基础这上，不存在死记硬背，是采用类似汉字拼音码的“简拼”的办法进行编码。但与拼音码有本质的不同，拼音码拼的是整个字的音，而本编码拼的是“形元”的音。

本编码虽然也具有“音”和“形”的特点，但与一般的音形码(或形音码)有本质的不同。一般音形码的音与形是分离的，即先拼字音，然后加字的首形或尾形，以减少重码率。这样的音形码由于音与形不同步，使用上存在思维不连贯，而且也摆脱不了与汉字拼音码同样的缺陷，即不认的字，或读音不准的字都无法输入，实践证明其输入效果不如单纯的形码。这也是至今常用形码虽难学但仍占领主要市场的根本原因。本编码的音与形是同步的、一体的。拼的就是“形元”的音，而不是整个字音。这种拼“形音”的特点，从本质上讲仍属于纯形码。拼“形音”虽然语言无法识别(听不懂)，但计算机能够准确无误地识别是什么字。因为电子计算机键盘打字，主要是依靠显示器屏幕上的字形传输信息和进行操作的。屏幕上出现的只能是字形，而不会是语音和字音。拼音文字也不例外。汉字是拼形文字，汉字的字形最能准确表意，这正好与电子计算机的操作特性相吻合。就是因为这种客观存在，决定了方块汉字在电子高科技时代的作用。键盘输入只要能定准字形，就能准确传输信息，而拼“形音”是最有效的定形手段。因此用拼“形音”定形的方块汉字，特别能适应电子高科技时代的需求。所以，以形为本的古老汉字的腾飞将在此一举！

拼“形音”实际上是在字表形态不变的条件下，使方块汉字变成“准拼音”的文字。这是多少代人的梦想，如今将要变成现实。这是在计算机条件下实现的梦想。这种易学的“准拼音”，在现代信息传输技术上，将胜过所有的拼音文字(如英文等)，也就是说它比拼音文字传输信息的效果还要好。在机械打字机时代，无法用拼音字母，拼成方块汉字。单个汉字又数量巨大，结构复杂。因此以形为本的汉字，就无能为力，一直落后了，一百多年。如今电脑打字，只要解决了易学性，输入孤立的“形元”就能转换成汉字。这使古老的汉字活力再现；使我们有可能用超越拼音文字的方法，赶在时代的最前沿！

我们认为：计算机键盘输入汉字，技术上的出路在于形码。而形码的出路是解决易学性和适当缩短码长，且保持较低的重码率。效仿先人“六书”造字的形、音、意联想，是解决易学、易记、难忘的最有效方法。这是方块汉字固有的特点和深刻内涵所决定的。

本编码是以音、形、意联想取码的。由于联想的作用，所以人的感官、思维与字形、代码、键位之间，可形成映射效应。因此，在键盘输入汉字时，不但能看打，还便于想打和听打。因此，它能满足多方面人员的需求。

联想是理解事物的纽带，它可以由此及彼，触类旁通。你见到“人”字，就会想到两脚站立的人形。你见到“日、月”两字，就会联想到天空的太阳和月亮。你看到“火”字，就会想到野地架起燃烧的篝火。你见到“雨”字，就会感到细雨纷纷。你见到“泪”字就会觉得眼睛(目)滴下的点点泪珠。这一切看来似乎都很原始，然而它又是非常现代与科学。因为电子计算机特别“青睐”这些神奇的汉字，能准确而又迅速地识别它。这说明它能很好地适应当代科技。正是高科技使古老的汉字，焕发了青春。只要我们采用的方法得当，键盘输入汉字的技术，在普及和提高方面胜出拼音文字(如英文等)，已是指日可待。

2.本编码非常易学易记，其键盘输入技术是先进的：

本编码共有“形元”三百个，数量虽多，但其中一部分用于繁体字，用于常用汉字的只有二百多个。真正频繁使用的也只有几十个。但由于采用形似同族的原则和音、形、意联想，因此都非常便于记忆。只要记住一个同族的代表及其代码，便可记下一串同族“形元”。一旦记住，都难以忘掉。只要稍懂汉字拼音，许多重点“形元”及其代码，都会永远记住，能做到过目不忘。例如使用频率最高的“形元”“一”横(Héng)、“丨”直(Zhí)、“丿”撇(Piě)、“”捺(Na)、“丶”点(Diǎn)。上述”形元”都只用它读音的第一个字母为代码。则“一”为H，“丨为Z，“丿”为P，“”为N，“丶”为D。而且(丶、冫、氵、灬、心)，都是D。(丿、

、彡、勹)都是P。又如“十”为S、“土”为T，“口”为O等等。这实际上就是“简拼”，只拼该“形元”读音的第一个拼音字母。正因为这种拼“形音”简单易学，所以只要稍懂汉字拼音，或因方言地区发音不太准者，都不难学习。如果已学会打汉字拼音码的，再学本编码，更是轻而易举的事。因此本编码的普及性是可以预见的。至于输入速度，因码长较短，重码率低，输入准确性高，适合于盲打。故其输入速度应该比任何一种键盘文字输入为高(包括中外文字)。此非戏言！做这种判断的理由是：当今常用形码，其熟练者的打字速度已超过英文(见于有关报导)，但本编码的打字速度，不是个别人的超出，而是许多入都会超出。这是本编码的技术特点和优势所决定的。只有这样，才能说：汉字的计算机键盘输入技术，已屹立于世界民族之林！

3.本编码采用“断开”拆分法

本编码对一部分字形相连、相交的汉字，采用断开拆分的方法，而不用“形元”“抽出”的拆分方法。这样就能在保持字形形态完整的条件下，达到直观，快易取码的目的。所谓“断开”，只是在汉字中，两“形元”交接处，设想出断开点，而字形的形态并没有改变。这对以形取码的直观性十分重要。由于本编码不采用“抽出”的拆分取码方法，因此避免了，被公认为形码的学习和使用难点，从而大大的提高了编码效率。

现将本编码的断开拆分(断)，与当今常用形码的抽出拆分(抽)的直观性比较如下：

上例，“断开”取码的直观性是显而易见的。直观性是打字速度的先决条件：只有看的准，定码快，才能迅速击键。“断开”取码，由于字形形态不变，不必抽象思维，为快速击键创造了有利的条件。须知，打字的快慢，不单取决于击键次数的多少，更重要的是，是否能够直观，快速地确定打什么码。

4.本编码采用三类九型的汉字分类和三点分散取码法

由于本编码采用三类九型的汉字分类，对较复杂的字形，采用的取码点比较分散，取码点不深入到字型内部，因此比较简单直观，易于判断取码点。同时取码点分散，使汉字各独立结构部分都能取到码，这必然会减少重码率。现将本编码的品字型(012型)、倒品型(021型)和左右型(21型)的汉字取码点与当今常用形码的例字比较如下：

从上例可见，从字型外部三点分散取码与深入字形内部的两点取码的直观性，有明显差异。三点分散取码，取码点是固定的，只要考虑取码点上是什么码就行。不要到字形内部去找。字形内部，由于“形元”的交叉连接，往往难以识别和确定。因此对较为复杂的字形，从字形外部三点分散定点取码，能达到直观、快速、准确的目的。写字和画画一样，必须把外围轮廓勾勒好，才能画得像。因此分散在外围定点取码是定准字型的重要方法。同时取码范围分散到各个角落，必然所取不同的“形元”的数量和差异也扩大了，当然重码率也就降低了。本编码能在三码条件下，实现低重码率即得益于此。由于采用“三类九型”分类和三点分散定点取码法，使越复杂的汉字，取码越加简单。这种化繁为简的方法，极大地提高了本编码的键盘输入效率。

5.本编码的字型识别非常简单，不用交叉识别

当今常用形码，末笔字型识别是学习难点之一。当单字不足四码时，需要用末笔的横、竖、撇、捺、折五种笔形和上下型、左右型、杂合型三种字型，进行交叉识别，共有十五种识别码。初学者要背复杂的识别码表。特别是三种字型分类；有的又很不明确；尤其杂合型的分类，给初学者的学习和判断造成困难。

本编码的单字，最多只用三码。当单字不足三码时，成字的“形元”加“WW”补足三码。如成字“形元”(01型)“人”字的代码为A，则“人”字的编码为AWW。上下型(02)型的两码字，不足三码则加“L”补足三码。如“古”字的前两码是SO，则“古”字的编码为SOL。左右型(11型)的单字不足三码时加“R”补足三码。如“汀”字的前两码为DT，则“汀”字的编码为DTR。只存在这三种情况：即成字型、上下型和左右型，不足三码的字。只用W、L、R三个字母(代码)为识别码。不存在交叉识别等复杂情况。单字的其他各型，均够三码，故不必再加识别码。因此，本编码的字型识别，非常好学、好记。用W、L、R三个字母的代码为字型识别码，是本编码的重要技术特征之一。

6.本编码的一、二级简码数量多，质量高，不需要记忆

本编码设一级简码286个(一码加空格键或数键)。二级简码660多个(两码加空格键)。一级简码都是高频字；而且几乎囊括当今形码和音码的一级简码。

本编码的一、二级简码在设计上，采用屏幕提示，不要死记硬背。专业人员稍加练习就能盲打。

7.本编码非常便于外国人学习和输入汉字

本编码也为外国人(特别是学英文的)学习和输入汉字打开方便之门。如：人、彐、フ、ㄇ、口、厂、丅、ㄩ等形似的“形元”，外国人会同样加以联想。“水”的编码为W，与英文WATER更是不谋而合。其他“形元”只要稍懂汉字，学习也不难。外国人和南方人说普通话，发音不准，往往都是在尾音上掌握不好。第一音一般是没有问题的。本编码拼“形音”，实际上只是“简拼”，只用第一字母，而且和拼音码一样，可直接利用计算机英文的键盘排布，做到洋为中用(不是一般形码机械地利用)。故学、用都不是很难的。因此本编码将有助于中外文化的交流。

综上所述，本编码因具有优越的技术性能，所以它既便于普及使用，又能满足专业人员录排的需要。因此，学生、教师、作家、记者、文秘人员等，都能很快学习和掌握。对方言地区也能普及推广。只要稍懂汉语拼音，老少皆宜，学习使用。

由于本编码用的是拼“形音”的取码法，与中小学语文的汉字拼音教育是相吻合的，所以它适合于中小学教育中普遍推广，这样就能做到：汉字计算机编码从娃娃抓起，能为计算机键盘输入汉字的普及和提高，为中文信息处理现代化，打下坚实的基础。

本编码的实用性还可以扩展到编制通用的字、词典和电子词典领域。用本编码查字典、词典，可以与查英文词典一样，而且更加方便快捷。因为码长较短(单字只用三个字母)，基本可以做到一步到位(即“对号入座”)。不像查汉语拼音字典时，经常会带出一连串同音字，有的甚至还要翻页，本编码的字典，基本是按偏旁、部首的方式编排的，形同和形近的字，编排在一块。这样就便于对比、学习、记忆和加深理解。它与传统的康熙字典的编排方式比较接近。但它又能以“拼形音”的方式查找，因此，用起来非常方便。这样，既保持了传统，又增加了科技含量。这与当今汉语拼音字典，为了拼音查找方便，而杂乱无章的编排，是完全不同的。这种模仿拼音文字，字典的编排，不是很科学的。是与汉字以形为本的特点相背离的。例如：行(háng)银行、行(xíng)行走、行(heng)道行、行(hàng)树行子，虽然是同形的字，但由于发音不同，就不能编排在一块(分在四处)。这就不便于对比、学习和记忆。这样的字还很多。用本编码编制字典，就能从根本上克服这个缺陷。

本编码包括简繁汉字、古今汉字和海内外汉字。这不但可以研究、挖掘我国古代浩瀚的文化宝库和进行古文字研究，还可以适应港澳台及华语地区和日益增长的国际信息化交流的需要，为世界各地使用汉字的国际友人和华侨、华人服务！

本编码的重要意义还在于，它是“全形码”，能在保存方块汉字的前提下，促进信息处理的现代化。既然方块汉字的内在规律已被充分揭示，已经释放出巨大的潜能，使古老的汉字，能够适应科技飞速发展新时代的需求。我们为什么不能把方块汉字千秋万代保存下来，并加以发扬光大呢？汉字有其自身发展规律的特殊性。汉字不应该全盘西化，也应该走中国式的发展道路。这就是说：汉字要适当简化，汉语、汉字要学用拼音，但汉字不应该，也没必要改成拉丁化的拼音文字。

尽管参照实施例对所公开的涉及一种汉字“三形联想”形码输入法进行了特别描述，本领域技术人员将能理解，在不偏离本发明的范围和精神的情况下，可以对它进行形式和细节的种种显而易见的修改。因此，以上描述的实施例是说明性的而不是限制性的，在不脱离本发明的精神和范围的情况下，所有的变化和修改都在本发明的范围之内。

表1

注：金.米等带□的独形字，不作偏旁时(单独使用)要拆分

表2

表3

注：金.米等带□形字，不作偏旁时(单独使用)要拆分

表4

一级简码列表表5

Q表

W进

E已

R后

T地

Y对

U也

I了

O品

p的

A他

S来

D主

F且

G家

H一

J以

K是

L部

Z电

X学

C在

V多

B年

N其

M同

二级简码列表表6

Claims

1.一种汉字“三形联想”形码输入法，其特征是，包括下述步骤：(1)选择字形元素作为编码的基本部件，按形以同族原则分成26族，并与键盘上的26个字母对应，其对应关系为：

A 人、亻、入、佳，

B 八、

丷、

、、钅

C 乂、犭、七、

车

D 丶、冫、氵、

灬、心、必、门

E 肀、尹、匚、弓、尸、区

F 目、且、罒、四、

皿

G 宀、冖、穴、ㄅ、骨

H 一、王、耳、酉、雨

I 、孑、廴、及、乙、了、ㄋ、卩、阝、马

J ㄥ、

纟、

乚、匕、

K 囗、日、田、曲

L 立、亠、讠

M 冂、

月、巾、贝

N 廿、甘、艹、廾、卄、

、母、

O 口、

P 丿、彡、勹、彳、豸、身、牜、禾、白、舟

Q 扌、中、

、丰、

R 厂、广、疒、

、石

S 十、

、木

T 土、士、

丁

U 山、臼、凵、九、力、

V 女、

、夕、鱼

W 水、氺、

乑、兆、

、辶

X 小、

火、米

Y 衤、礻、又、夊、大、丈、

Z 丨、亅、刂、虫

(2)输入汉字；

所述汉字输入规则为：以基本字形元素为单位，按三类九型的取码点选取三个字形元素，依次键入即可完成一个字的输入；同为字形元素时以大优先，字形元素相连或相交时采用上下或左右断开公用笔画再取码的方法。

2.根据权利要求1所述的汉字“三形联想”形码输入法，其特征是，在输入汉字时，将汉字分为三类九型，根据取码点选取字形元素；所述三类为指单列类、双列类和三列类；所述九型及取码方法为：

“021型”为倒品型，可拆分成上部和下部，分别取上部两部分的第一个字形元素和下部最末一个字形元素：

“12型”为左右型，取左边一个字形元素，右边取首、末二个字形元素的字；

“21型”为左右型，取左边首、末二个字形元素，取右边一个字形元素的字；

3.根据权利要求2所述的汉字“三形联想”形码输入法，其特征是，在输入常用汉字时，键盘上26个字母与字形元素的对应关系为：

A 人、亻、入、佳、

B 八、丷、

、、钅、

C 乂、犭、七、车、

D 丶、冫、氵、

灬、心、必、门、

E 彐、肀、尹、匚、弓、尸、区、

F 目、且、

罒、四、

皿、

G 宀、冖、穴、ㄅ、骨

H 一、王、耳、 、

酉、雨、

I

、孑、孓、廴、及、乙、

了、ㄋ、卩、阝、马、

J ㄥ、纟、

乚、匕、巛、巜、

ㄣ、爿、

K 囗、日、田、

曲、曰、

L 立、亠、讠、

M 冂、

月、巾、

贝、

N 廿、甘、艹、廾、卄、

母、

革、

O 口、凸、

P 丿、

彡、勹、彳、豸、身、牜、禾、白、舟

Q 扌、中、丰、

R 厂、广、

疒、

石

S 十、

木、

T 土、士、

丁、

U 山、臼、凵、九、力、

凹、

V 女、

、夕、

鱼、

W 水、氺、

乑、兆、

辶、

X 小、

火、米、

Y 衤、礻、又、夊、

大、丈、

Z 丨、亅、刂、、

虫、

4.根据权利要求1至3中的任一项所述的汉字“三形联想”形码输入法，其特征是，汉字拆分编码规则如下：相接的字形元素，分解拆分；字形元素相连或相交采用上下或左右断开公用笔画再取码的方法，能上下断开的不左右断开；框外字形元素足够时，框内字形元素不编码；字形元素足够时，角点不编码；字形元素不足时角点编入码；有边框时，向下脱框编码，先框外后框内；向上脱框编码，先框内后框外；左旁两字形元素以上的字，取左旁的首、末码和字的末码；带廴和辶旁的字从左起编码，不按笔顺；离散汉字结构的字，顺其自然拆分。

5.根据权利要求4所述的汉字“三形联想”形码输入法，其特征是，在既输入简体字，又输入繁体字或古汉字时的字形元素与键盘上26个字母的对应关系为：

A 人、亻、入、佳、食、金

B 八、丷、、、钅、癶、

C 乂、七、