CN1455316A - 汉字“三形联想”形码输入法 - Google Patents

汉字“三形联想”形码输入法 Download PDF

Info

Publication number
CN1455316A
CN1455316A CN 02131465 CN02131465A CN1455316A CN 1455316 A CN1455316 A CN 1455316A CN 02131465 CN02131465 CN 02131465 CN 02131465 A CN02131465 A CN 02131465A CN 1455316 A CN1455316 A CN 1455316A
Authority
CN
China
Prior art keywords
code
coding
shape
chinese character
font
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 02131465
Other languages
English (en)
Other versions
CN1328649C (zh
Inventor
林宗兴
林宗藩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lin Zongfan
Lin Zongxing
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN02131465.9A priority Critical patent/CN1328649C/zh
Priority to PCT/CN2003/000858 priority patent/WO2004036404A1/zh
Priority to AU2003272866A priority patent/AU2003272866A1/en
Publication of CN1455316A publication Critical patent/CN1455316A/zh
Application granted granted Critical
Publication of CN1328649C publication Critical patent/CN1328649C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/018Input/output arrangements for oriental characters

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)
  • Controls And Circuits For Display Device (AREA)

Abstract

一种拼“形音”的形码输入法。“普及型”用于输入6763个国标汉字。“专业型”用于打十万词码和21003汉字。常用汉字重码率5%左右。最常用1000字重码率3%左右。以打词码和一、二简码为主,接近无重码。本编码是用汉字拼音字母为代码的形码。是易学、难忘、快速三者兼有的汉字输入法。它虽为形码,但能进行“声读”编码。故适合在中小学普遍推广。它包括简、繁、古代和海内外汉字。因此,它既可以研究、挖掘我国古代浩瀚的文化宝库,又可以加强国内和国际的信息交流。它既便于广泛推广使用,又能满足专业人员高速度、高效率输入汉字的需求。它还设计了智能记忆和造词功能,它所具有的逻辑性,是当今国内形码所未见;其键盘输入速度可超过英文。

Description

汉字“三形联想”形码输入法
一、概论
(一)计算机键盘输入汉字的技术现状
当今虽有六百多种计算机键盘输入汉字的编码,申请了专利。然而至今还没有一种编码能做到既好学又好用。也就是说好学的打不快。所谓好学的拼音码,重码多,难以盲打,同音字、生僻字、语音不统一等难题无法解决,效率难以提高。至于当前常用的形码,虽然能打的快,熟练者打字速度甚至超过西文,但既难学又易忘,学习效率很低。有人说就像学了一门“外语”。若不经常使用又会忘掉大半。因此这种形码,只能在专业打字员中使用。如果汉字计算机的编码不能普及使用,或使用效率低下,文件的起草与录排不能同步,即打字要转手,不能像英文那样,只要练练指法,稍加学习,多数人都会打字,也就不能说,汉字的计算机键盘输入,已经真正实现了现代化。
当今尚有许多音形、音数并举,及数笔画的汉字编码。这些编码,虽然能好学些,或者能降低一些重码率,但其诸多缺陷,都难以从根本上提高效率。此外尚有声控和手写的输入方法。声控存在南腔北调难统一,说错了改也难等问题。手写汉字笔画多,输入慢,计算机准确识别难。本来效率就很低。因此,这些方法只能在特定条件下使用,难以普及推广,要想成为计算机输入汉字的主流,是很困难的事情。
综上所述,汉字编码虽然从无到有,且如雨后春笋、百花争艳,在一定程度上,满足了中文信息处理现代化的需求,但从总体上讲仍效率低下,还远远不能满足日益增长的国民经济和社会信息化的需求。计算机键盘输入汉字编码方案,虽然有了量的积累:仅报请专利的就有600多种,研究者何止成千上万。但汉字计算机编码方案,更需要有质的飞跃。汉字编码要做到:易学,难忘,快速三者兼有,就必须从深入研究古老的汉字入手,要从挖掘汉字的丰富内涵中寻求答案。
(二)、汉字“三形联想”编码的技术基础是先人的六书造字
汉字是世界上沿用至今、使用广泛的最古老文字。是中华民族的文化瑰宝,是我们祖先留下的巨大财富。是先人在与自然斗争和社会生活实践中逐步形成和发展起来的。汉字是经过逻辑渠道,演化而成的,是虽经数千年而颠扑不破的哲理性产物。
从汉代学者许慎的《説文解字》及至清代学者王筠的《説文釋例》,和当代许多学者的研究,都深刻指出:汉字是通过六书造字形成的。所谓“六书”即象形、形声、会意、指事、假借、转注六种形式。先人通过六书造字的方法,在汉字中注入丰富的信息,既有形的也有声的,更有推理和想象的。因此汉字就有象形字、形声字,还有会意和指事等字型。汉字的笔画、字根、偏旁、部首、及其构成组合中,都充满着形、音、意的信息。那种认为不彻底去掉方块汉字,就无法真正实现中文信息处理现代化的观点是片面的。我们为什么不能从先人造字的逻辑思维中得到启发,用现代科学的眼光和方法,对汉字加以综合、剖析、分类、筛选、归并,找出汉字中所固有的内在规律,从汉字中提取先人造字时注入的字形信息元素(注:本编码称“字形元素”),为中文信息处理现代化服务呢?这应该是返朴归真的好办法,是一条捷径。
本编码就是根据六书造字的字理,取码的方法采用音、形、意的联想设计的。因此本编码具有易学、难忘、快速的特点。而且集科学严谨性和趣味性于一体。所谓严谨性,就是汉字经过严格分类,每个字的取码点是固定的。只要按规则编码,任何一个汉字的编码都是唯一的(但包括少量的重码)。很少有似是而非的所谓容错码。所谓趣味性,是因取码与象形等六书的形、音、意紧密相连,使逻辑与形象完美结合。故学之有趣,不枯燥乏味。从而提高学习和使用效率,能达到事半功倍的效果。
(三)本编码的技术特点
1.本编码是以拼“形音”为特点的纯形码
本编码是以形取码的,但用的代码是汉字拼音字母。即把汉字的笔画、字根、偏旁、部首、即规范部件和创新部件等字形结构要素(统称为字形元素),通过音、形、意的联想,把这些字形元素当成可以声读的汉字拼音字母。每个汉字的字形,都只用三个汉字拼音字母为代码进行编码。这是一种有声的拼形。不但与拼音文字(如英文等)的键盘输入有异曲同工之效,而且更加快速简练。如:“江”字拆分成三形元为:氵、
Figure A0213146500051
一,其中“氵”(点Diǎn)联想为D,
Figure A0213146500052
为T,“一”(横Hèng)联想为H,故其编码为DTH。
用拼“形音”的方法输入汉字,是因为汉字的字形是表意的。南腔北调听不懂,但一写出字来(字形)就全懂了,就是这个道理。汉字不像西方拼音文字那样只是“记录语言的书写符号”(不懂字音的意思,就不认字)。汉字还是“记录人的思维,意识、观念的书写符号”。对于键盘输入也只有用汉字的字形才能准确表意。因为汉字的同音字太多,所以只有用拼形输入汉字,才能实现低重码率。本编码比一般形码更进一步的是:本编码不是单纯的机械拼形,而是拼“形音”。而且是建立在联想的基础之上,不存在死记硬背。而是采用类似汉字拼音码的“简拼”的办法进行编码。但与拼音码有本质的不同,拼音码拼的是整个字的音,而本编码拼的是字形元素(即字根等)的音。
本编码虽然也具有“音”和“形”的特点,但与一般的音形码(或形音码)有本质的不同。一般音形码的音与形是分离的,即先拼字音,然后加字的首形或尾形,以减少重码率。这样的音形码由于音与形的不同步,使用上存在思维不连贯,实践证明其输入效果不如单纯的形码。这也是至今常用形码仍占领主要市场的根本原因。本编码的音与形是同步的、一体的。拼的就是字形元素(字根等)的音,而不是整个字音。这种拼“形音”的特点,从本质上讲仍属于纯形码。拼“形音”虽然语言无法识别(听不懂),但计算机能够准确无误地识别是什么字。因为电子计算机键盘打字,主要是依靠显示器屏幕上的字形传输信息和进行操作的。屏幕上出现的只能是字形,而不会是语音和字音。拼音文字也不例外。汉字是拼形文字,汉字的字形最能准确表意,这正好与电子计算机的操作特性相吻合。就是因为这种客观存在,决定了方块汉字在电子高科技时代的作用。键盘输入只要能定准字形,就能准确传输信息,而拼“形音”是最有效的定形手段。因此用拼“形音”定形的方块汉字,特别能适应电子高科技时代的需求。所以,以形为本的古老汉字的腾飞将在此一举!
拼“形音”实际上是在字形形态不变的条件下,使方块汉字变成“准拼音”文字。这是多少代人的梦想,如今将要变成现实。这种“准拼音”汉字,在现代信息传输技术上,将胜过所有的拼音文字(如英文等),也就是说它比拼音文字传输信息的效果还要好。在机械打字机时代,无法用拼音字母,拼成方块汉字。单个汉字又数量巨大,结构复杂。因此以形为本的汉字,就无能为力,一直落后了,一百多年。如今电脑打字,输入孤立的形元(字根)就能转换成汉字。这使古老的汉字活力再现;使我们有可能用超越拼音文字的方法,赶在时代的最前沿!
本编码是以音、形、意联想取码的。由于联想的作用,所以人的感官、思维与字形、代码、键位之间,可形成映射效应。因此,在键盘输入汉字时,不但能看打,还便于想打和听打。因此,它能满足多方面人员的需求。
联想是理解事物的纽带,它可以由此及彼,触类旁通。你见到“人”字,就会想到两脚站立的人形。你见到“日、月”两字,就会联想到天空的太阳和月亮。你看到“火”字,就会想到野地架起燃烧的篝火。你见到“雨”字就会感到细雨纷纷。你见到“泪”字就会觉得眼睛(目)滴下的点点泪珠。这一切看来似乎都很原始,然而它又是非常的现代与科学。因为电子计算机特别“青睐”这些神奇的汉字,能准确而又迅速地识别它。这说明它能很好地适应当代科技。正是高科技使古老的汉字,焕发了青春。只要我们采用的方法得当,键盘输入汉字的技术,在普及和提高方面胜出拼音文字(如英文等),已是指日可待。
2.本编码非常易学易记,其键盘输入技术是先进的
本编码共有形元三百个,数量虽多,但其中一部分用于繁体字,用于常用汉字的只有二百多个。真正频繁使用的也只有几十个。但由于采用形似同族的原则和音、形、意联想;因此都非常便于记忆。只要记住一个同族的代表及其代码,便可记下一串同族形元。一旦记住,都难以忘掉。只要稍懂汉字拼音,许多重点形元极其代码,都会永远记住;能做到过目不忘。例如使用频率最高的形元;“一”横(hèng)
Figure A0213146500071
直(zhi)“丿”撇(piē)“”捺(nà)、“丶”点(diǎn)。上述形元都只用它读音的第一个字母为代码。则“一”为H, 为Z
Figure A0213146500073
为P、“”为N、“丶”为D。而且(丶、冫、氵、灬、心),都是D。(
Figure A0213146500076
)都是P。又如“十”为S、“土”为T、“口”为0等等。这实际上就是“简拼”,只拼该形元读音的第一个拼音字母。正因为这种拼“形音”简单易学、所以只要稍懂汉字拼音。或因方言地区发音不太准者,都不难学习。如果已学会打汉字拼音码的,再学本编码,更是轻而易举的事。因此本编码的普及性是可以预见的。至于输入速度,因码长较短,重码率低,输入准确性高,适合于盲打。故其输入速度应该比任何一种键盘文字输入为高。(包括中外文字)此非戏言!做这种判断的理由是:当今常用形码,其熟练者的打字速度已超过英文(见于有关报导)但本编码的打字速度,不是个别人的超出,而是许多人都会超出。这是本编码的技术特点和优势所决定的。只有这样,才能说:汉字的计算机键盘输入技术,已屹立于世界民族之林!
3.本编码采用“断开”拆分法,不用抽象的“抽出”拆分法
本编码对字形相连、相交的汉字,采用断开拆分的方法,而不用形元(字根)抽出的拆分方法。这样就能在保持字形形态完整的条件下,达到直观,快易取码的目的。所谓断开,只是在汉字中,两形元交接处,设想出断开点,而字形的形态并没有改变。这对以形取码的直观性十分重要。由于本编码不采用抽出的拆分取码方法;因此避免了,被公认为形码的学习和使用难点;汉字字根抽象的抽出拆分方法,从而大大地提高了编码效率。
现将本编码的断开拆分,与当今常用形码的抽出拆分的直观性比较如下:上例,断开取码的直观性是显而易见的。直观性是打字速度的先决条件;只有看的准,定码快,才能迅速击键。断开取码,由于字形形态不变,不必抽象思维,为快速击键创造了有利的条件。须知,打字的快慢,不单取决于击键次数的多少,更重要的是,是否能够直观,快速地确定打什么码。
4.本编码采用三类九型的汉字分类和三点分散取码法
由于本编码采用三类九型的汉字分类,对较复杂的字形,采用的取码点比较分散;取码点不深入到字型内部;因此比较简单直观,易于判断取码点。同时取码点分散,使汉字各独立结构部分都能取到码,这必然会减少重码率。现将本编码的品字型(012)型;倒品型(021)型和左右型(21)型的汉字取码点与当今常用形码的例字比较如下:
Figure A0213146500091
从上例可见,从字型外部三点分散取码与深入字形内部的两点取码的直观性,有明显差异。三点分散取码,取码点是固定的,只要考虑取码点上是什么码就行。不要到字形内部去找。字形内部,由于形元(字根)的交叉连接,往往难以识别和确定。因此对较为复杂的字形,从字形外部三点分散定点取码,能达到直观、快速、准确的目的。写字和画画一样,必须把外围轮廓勾勒好,才能画得像。因此分散在外围定点取码是定准字形的重要方法。同时取码范围分散到各个角落,必然所取不同的形元(字根)的数量和差异也扩大了,当然重码率也就降低了。本编码能在三码条件下,实现低重码率即得益于此。由于采用“三类九型”分类和三点分散定点取码法,使越复杂的汉字,取码越加简单。这种化繁为简的方法,极大地提高了本编码的键盘输入效率。
5.本编码的字型识别非常简单,不用交叉识别
当今常用形码,末笔字型识别是学习难点之一。当单字不足四码时,需要用末笔的横、竖、撇、捺、拆五种笔形和上下型、左右型、杂合型三种字型,进行交叉识别,共有十五种识别码。初学着要背复杂的识别码表。特别是三种字型分类;有的又很不明确;尤其杂合型的分类,给初学者的学习和判断造成困难。
本编码的单字,最多只用三码。当单字不足三码时,成字的形元加“WW”补足三码。如成字形元(01型)“人”字的代码为A,则“人”字的编码为AWW。上下型(02型)的两码字,不足三码则加“L”补足三码。如“古”字的前两码为SO,则“古”字的编码为SOL。左右型(11型)的单字不足三码时加“R”补足三码。如“汀”字的前两码为DT,则“汀”字的编码为DTR。只存在这三种情况:即成字型,上下型和左右型,不足三码的字。只用W、L、R三个字母(代码)为识别码。不存在交叉识别等复杂情况。单字的其他各型,均够三码,故不必再加识别码。因此,本编码的字型识别,非常好学、好记。用W、L、R三个字母的代码为字型识别码,是本编码的重要技术特征之一。
6.本编码,设计的词码有十几万,可比较自由地输入
当今一些形码,多是字码与词码同库。即打字、打词都只用四码。因为词库容量太小,字码与词码又互相干扰,词码数量难以扩大,少量有码的词,也只是汉字大词量的沧海一粟。因此多是有词无码,不靠强记少量有码的词,就无法输入。
汉字的特点是造词功能极强。随着时代的发展,新词会不断涌现,从长远看,词库容量太小,创新的词就难以容纳。这样的编码,就缺乏发展空间,是会逐渐落后于时代的。本编码设计的五码词有十多万个。若需要还可以增加。这是根据汉字的内涵与外延的长远发展目标考虑的。五码词虽然比四码词多了一码,但平均码长仍在2.5以下。不但还是快码,而它输入词码的范围和自由度,却大大地增加了。其总的效率也提高了。因为增加一码,词库容量可以扩大26倍。因此可以做到词码的比较自由地输入。
7.本编码的一、二级简码数量多,质量高,也能联想记忆
本编码设一级简码260个(一码加数键)。二级简码660多个。(两码加空格键)、一、二级简码都有联想效果,不完全是死记硬背。一级简码都是高频字;而且几乎囊括当今形码和音形码的一级简码。由于本编码是可以打词码为主的编码。简码只是起辅助作用。因此一、二级简码除收入高频字、常用字、重码字之外,还尽可能收入,不能或不易组词的单字,以便与词码输入密切配合。如介词:从、自、同、为等。连词:和、与、而、且、但、因、如等等。助词:的、地、所、得、了、着、过、吗、呢、啊、吧……这样有了一、二级简码,就可以加快输入速度。因为若以打五码的词码为主,打单字就必须用四键结束(包括空格键)。用简码打单字,最多只用三键(包括空格键)。这对满足专业人员的高速输入要求是十分必要的。
8.本编码非常便于外国人学习和输入汉字
本编码也为外国人(特别是学英文的)学习和输入汉字打开方便之门。如:人、
Figure A0213146500111
Figure A0213146500112
口、
Figure A0213146500116
凵等形似的形元,外国人会同样加以联想。“水”的编码为W,与英文的Water更是不谋而合。其他形元只要稍懂汉字,学习也不难。外国人和南方人说普通话,发音不准,往往都是在尾音上掌握不好。第一音一般是没有问题的。本编码拼“形音”,实际上只是“简拼”,只用第一字母,而且和拼音码一样,可直接利用计算机英文的键盘排布,做到洋为中用(不是一般形码机械地利用)。故学、用都不是很难的。因此本编码将有助于中外文化的交流。
(四)、汉字“三形联想”计算机编码的应用前景和深远意义
本编码因具有优越的技术性能,所以它既便于普及使用,又能满足专业人员录排的需要。因此,学生、教师、作家、记者、文秘人员等,都能很快学习和掌握。对方言地区也能普及推广。只要稍懂汉语拼音,老少皆宜、学习使用。
由于本编码用的是拼“形音”的取码法,与中小学语文的汉字拼音教育是相吻合的,所以它适合于在中小学教育中普遍推广;这样就能做到:汉字计算机编码从娃娃抓起,能为计算机键盘输入汉字的普及和提高,为中文信息处理现代化,打下坚实的基础。
本编码的实用性还可以扩展到编制通用的字、词典和电子词典领域。用本编码查字典、词典,可以与查英文词典一样,而且更加方便快捷。因为码长较短(单字只用三个字母),基本可以做到一步到位(即“对号入座”)。不像查汉语拼音字典时,经常会带出一连串同音字,有的甚至还要翻页,本编码的字典,基本是按偏旁、部首的方式编排的,形同和形近的字,编排在一块。这样就便于对比、学习、记忆和加深理解。它与传统的康熙字典的编排方式比较接近。但它又能以“拼形音”的方式查找;因此,用起来非常方便。这样,既保持了传统,又增加了科技含量。这与当今汉语拼音字典,为了拼音查找方便,而杂乱无章的编排,是完全不同的。这种模仿拼音文字,字典的编排,不是很科学的。是与汉字以形为本的特点相背离的。例如:行(háng)银行、行(xíng)行走、行(héng)道行、行(hàng)树行子,虽然是同形的字,但由于发音不同,就不能编在一块(分在四处)。这就不便于对比、学习和记忆。这样的字还很多。用本编码编制字典,就能从根本上克服这个缺陷。
本编码包括简繁汉字、古今汉字和海内外汉字。这不但可以研究、挖掘我国古代浩瀚的文化宝库和进行古文字研究,还可以适应港澳台及华语地区和日益增长的国际信息化交流的需要;为世界各地使用汉字的国际友人和华侨、华人服务!
本编码的重要意义还在于,它是“全形码”,能在保存方块汉字的前提下,促进信息处理的现代化。既然方块汉字的内在规律已被充分揭示,已经释放出巨大的潜能,使古老的汉字,已经能够适应科技飞速发展的新时代的需求。我们为什么不能把方块汉字千秋万代保存下来,并加以发扬光大呢?汉字有其自身发展的规律的特殊性。汉字不应该全盘西化,也应该走中国式的发展道路。这就是说:汉字要适当简化,汉语、汉字要学用拼音,但汉字不应该,也没必要改成拉丁化的拼音文字。
我们应该看到,长期的文字改革所取得的巨大成果。没有文字改革就没有好学好用的简化汉字。没有文字改革就没有能与计算机衔接的新的汉字拼音字母。没有文字改革运动,就没有全民推广普通话和学写汉字拼音。因此,没有文字改革,本编码就没有产生和推广应用的基础。从某种意义上说,本编码只是文字改革的延续和必然的产物。汉字拼音化改革,不但没有改革掉方块汉字。而正是这伟大的改革,才保存了古老的方块汉字,使其彪炳千秋!这个结果也许不同于初衷,也是善意的人们未曾想到的。
创造过灿烂文明的古老汉字,是先人智慧的结晶;蕴藏着无穷的宝藏。在科技飞速发展的新时代,古老的汉字又要焕发青春。汉字的密码一旦被解读,就能发挥无穷的威力。本编码进行的就是这种解密的尝试。随着人们对汉字研究的不断深入,使其成果应用于更广泛的领域,古老的汉字,必将走向世界文字之巅峰!
               二、三形联想汉字输入法内容
                        (一)简述
本编码从《(汉字部件规范GF3001-1997>》中选取210个部件,另加创新部件90个共300个,作为本编码的末级部件。并将其更名为“字形元素”(简称“形元”)用以编制总数21003个海内外汉字的三个形元的编码。取名为“三形联想”码。
将300个形元,按形似同族原则,分成26族的组合,通过音、形、意的联想,使各族形元与26个汉字拼音字母及键盘上的26个英文字母建立映射关系。(即把英文字母当成汉字拼音字母)构成谐音能够声读的形元族。可在伴读声下,从汉字中提取编码所需的字形结构要素——字形元素。通过谐音指示击键,达到快易输入汉字的效果。
本编码采用分集设计,“正集”的编码只设三个字位(正字、副字、余字),用于打常用汉字和通用汉字。“副集”的编码设5个字位;“余集”的编码设10个字位,供屏幕上选择。“副集”和“余集”用于打繁体字、古汉字和海外汉字。根据“国家语委”提供的汉字使用频率统计资料。正集汉字,使用率为93%、副字6.1%、余字0.85%。尚有0.05%的汉字,需在副集中查到。如果你要的是副字,继续打入键盘<2>或<9>即可更改为副字。如果你要的是余字,则需要借助“提示行”,出此情况的机率不到1%。故操作多次以后,会很快记住的。本编码简化汉字体系,常用汉字的重码率,在三码条件下仅5%左右。若使用一、二简码和以打词码为主,则接近无重码。繁体、古汉字体系则需借助提示行。
本编码的优势在于采用先人造字历史形成的科学的方法,提取用于编码的字形元素。和具有合理的字形分类及拆分规则。“形元表”和“三类九型”汉字结构分类,是核心内容。对照例字、例词、用心体验,就能掌握精髓。本编码还设计有智能记忆和造词功能。它的逻辑性远远高于当今各种形码。其码长较短,字、词涵盖面大,乃当前国内所罕见。
(二)汉字字形元素总表和简表(表一)
Figure A0213146500151
注:金.米等带
Figure A0213146500152
形字,不作偏旁时(单独使用)要拆分
汉字字形元素简表(表二)
Figure A0213146500161
注:金.米等带
Figure A0213146500162
的独形字,不作偏旁时(单独使用)要拆分
(三)汉字三类九型分类及图示
1.三类九型分类方法和字形识别码
汉字结构非常复杂,一般形码只把汉字结构分为上下型、左右型和杂合型三种。因此使许多复杂结构的汉字,取码点难以确定,以致编码时无从下手。为了更加直观、快速地确定取码点,提高编码效率,本编码将汉字结构分为“三类九型”
“01型”为成字的字形元素,故在该成字“形元”后边,补两个识别码“W W”以完成输入。如“人”的编码为A则人字的输入编码为A W W.
“02型”为上下可拆分成二形元(二码)的字。其后补“L”为识别码,以完成三码的输入。如“古”字拆分为十、口,则“古”字的输入码为SOL.。
“03型”为上下可拆分成首、二、末,三码的字,如“亭”字,拆分为:
Figure A0213146500171
口、丁。它的编码为LOT.
“021型”为品字型的字,上部取一码,下部取二码。如“薪”字拆分为:艹、立、丁其编码为NLT.
“021型”为倒品型的字,字的上部取二码,下部取一码。如“型”字拆分为:一、刂、土其编码为HZT。
“11型”为左右各一个形元(一码)的字。如“叮”字的拆分为:口、丁,补识别码R则其编码为OTR.。
“12型”为左边一形元(一码)右边二形元(二码)的字如“胸”字的拆分为:月、 凵则其编码为MPU。
“21型”为左边二形元(二码)右边取一个形元(一码)的字如“趁”字的拆分为:土、人、彡则其编码为:TAP。
“300型”为川字型,从左到右取首、二、末三码如“潮”字的拆分为:氵、十、月则其编码为DSM.
2.字形分类的特殊情况多排列字如州、洲等,按川字型从左到右取首、二、末。则洲字拆分为:氵、丶、丨其编码为DDZ.
全包型按先框外,后框内脱框分型处理。如“回”字为“02型”。“国”字为“03型”。“”字为“012型”。
上三包、下三包、左上包、右上包的字如:风、凶、厅、句等字按“02型”处理。同、病、虱等按“03型”处理。左三包、左下包的字如:巨、达等按“11型”处理。医、过等按“12型“处理。趟、起等按“21型”处理。上述分类和处理方法。都是顺其自然,不用死记。
3.汉字三类九型结构图示(见表三)
汉字结构“三类九型”图示(表三)
(四)三形联想单字编码原则
1.以形取码,按书写顺序,从左到右从上到下,先外后内(有廴和辶旁的字例外)。
2.以基本形元(字根)为单位,按“三类九型”字形结构和取码点取码。
3.一般按一、二、末三个形元的顺序取码,最多只取三码。(但“012”、“021”、“21”和“300”型的字有例外)
4.单体结构拆分,要拆成码数少,笔画数多的“形元”。(即成大优先)
5.当单字“形元”不足三码时,补上字形识别码。
(五)汉字拆分编码规则及例字
1.相接的形元,可以分解拆分
2.形元相连、相交可以上下断开公用笔画(能上下断,不左右断)
3.形元相交,可以左右断开公用笔画
Figure A0213146500211
4.框外形元足够(包括角点),框内形元不编码
Figure A0213146500212
5.形元足够角点不编码
6.形元不足角点编入码
Figure A0213146500214
7.向下脱框编码(包括向外向右)先框外后框内
8.向上脱框编码,先框内后框外
9.左旁两形元以上的字,取左旁的首、末码和末码(“300型”有例外)上述“300形”即“川字形”的例外如:
Figure A0213146500223
10.带廴和辶旁的字从左起编码(不按笔顺)
11.离散汉字结构的拆分,要顺其自然
Figure A0213146500225
12.特殊规定:
Figure A0213146500226
儿、
Figure A0213146500227
三种形元组合结构,不属双列类和三列类,而归属单列类。
(六)简码输入
为了提高输入速度,本编码将常用汉字(尽可能选高频使用汉字),只取其前边一个或两个形元,再加一个数键或空格键结束。作为该字的编码,以构成简码。因本编码是三码的编码(三键结束)。故只设一、二级简码。
1.一级简码
因本编码具有联想记忆功能,所以每族形元可以安排10个首码相同的高频率使用的汉字,各加一个数键,共加10个数键,作为10个简码。本编码共26族。故可安排26×10=260个。为了便于记忆,一级简码,尽可能编成顺口溜。兹列表如下(见表四):
2.二级简码
二级简码是指编码时,只取单字的前两个形元的代码,再加一个空格键结束,并挑选使用频率较高的汉字,为二级简码。二十六族形元的代码,其前两码的组合共计有26×26=676个二级简码。因本编码的形元都有联想作用。因此二级简码也比较好学好记。兹列表如下(见表五):一级简码列表(表四)二级简码列表(表五)
                 (七)词汇编码规则
许多编码的方法的实践都证实,词汇编码输入都可以有效降低重码率,且显著缩短码长,从而大大提高输入速度和效率。本编码采用五码词的基本条件是:单字输入才用三码。采用五码词后(五键结束)。打单字三码后必须用空格键共四键结束,其击键数与当今常用形码的四键结束是相同的。但相当于三级简码,故仍有优势。而且是字码与词码分开,互不干扰。五码词的词库空间极大:26×26×26×26×26≈1200万个。10万个词也仅占词库容量的0.83%(10/1200×100%=0.83%);因此还有很大的发展空间。对于当今常用形码,若采用打五码的词码,是有困难的。因为打五码词后,打单字就必须用五键(加空格)结束。这会严重影响打单字的效率;因此是不可取的。本编码的五码词,若与一、二级简码互相配合,对专业打字员来说,将会是得心应手的。
1.双字词的编码规则
双字词在汉字的词汇中占有很大比重。熟练掌握双字词的编码是提高汉字输入速度的重要环节。双字词的编码是由所含的两个汉字,第一字按规则取三码,第二字取二码组成:
例如:
Figure A0213146500261
(括号内W、R、L为字形识别码)
2.三字词的编码规则
三字词的编码是第一字按规则取三码,第二、第三字各取首码组成。
例如:
3.四字词的编码规则
四字词的编码规则是取前三字的首码和第四字的前两码组成。
4.五字词的编码规则
五字词的编码是由每个汉字的首码组成;共五码。
Figure A0213146500273
5.多字词编码规则
多字词是指构成词的单字数超过五个。多字词的编码是取第一至第四个单字的第一码和最末单字的首码构成。
Figure A0213146500274
(八)繁体字和古汉字的编码
为适应更广泛的需求和便于进行海内外交流,本编码除设计简化汉字系统外,还设计繁体汉字和古汉字的编码系统。本编码共编制海内外汉字总数为21003个。繁体字与古汉字的编码规则与简化汉字相同,但分别增加一个规定的结束键(或转换键)。
1.繁体字的编码
Figure A0213146500281
2.古汉字的编码
Figure A0213146500282
    (九)三形联想编码文本示例(附后)
                主要参考资料(一)説文釋例                     [清]王筠         撰(二)説文通訓定聲                 [清]朱駿聲       撰(三)汉语大词典                   罗竹风         主编(四)电脑打字普及教材             吴  越         编著(五)汉字哲学初探                 李敏生         编著(六)电脑打字实用教材             康东日         编著(七)大陆港澳台常用词对比词典     魏励 盛玉麒    主编
Figure A0213146500301
Figure A0213146500311

Claims (8)

  1. 本发明“三形联想”汉字形码输入法。其特征是通过对汉字,字形元素的精选和音、形、义的联想,按书写顺序、编码规则、字形分类和字形识别码等技术,确定三形元(三码)的,以汉字拼音字母为代码的,拼“形音”的编码。并确定相应的简码和词码。具体权利要求是:
    1.说明书中字形元素总表(表一)和简表(表二)是本发明要求保护内容。其中字形元素组合(26族)与汉字拼音26个字母(代码)的对应关系、族名和联想方法等是重点。
  2. 2.说明书中汉字三类九型分类和取码点(表三)是本发明要求保护内容。其中“21型”(左二右一)、“012型”(品字形)“021型”(倒品型)和“300型”(川字型)是重点。
  3. 3.根据权利要求1.2.所示,当汉字不足三码时,只用W、L、R三个代码为字形识别码(不论用在何种字形)是本发明的主要技术特征。
  4. 4.对交叉连接的字形,采用“断开”取码的拆分方法,是本发明的主要技术特征。
  5. 5.本编码一、二级简码在设计和编排上,具有拼音记忆,规律编码和趣味性等特点。
  6. 6.采用打五码的词码,能够实现以打词码为主,并能更加自由地输入汉字,是本编码的技术特点。
  7. 7.采用分集设计编码,即正集(包括:正字、副字、余字)副集和余集及所设字位数,是本编码的技术特点。
  8. 8.  本编码的各族形元组合数可作适量变更,视具体情况,每族形元可作1-3个调整。
CN02131465.9A 2002-10-16 2002-10-16 汉字“三形联想”形码输入法 Expired - Fee Related CN1328649C (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN02131465.9A CN1328649C (zh) 2002-10-16 2002-10-16 汉字“三形联想”形码输入法
PCT/CN2003/000858 WO2004036404A1 (en) 2002-10-16 2003-10-14 Pattern-code chinese character input method with “three patterns association”
AU2003272866A AU2003272866A1 (en) 2002-10-16 2003-10-14 Pattern-code chinese character input method with "three patterns association"

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN02131465.9A CN1328649C (zh) 2002-10-16 2002-10-16 汉字“三形联想”形码输入法

Publications (2)

Publication Number Publication Date
CN1455316A true CN1455316A (zh) 2003-11-12
CN1328649C CN1328649C (zh) 2007-07-25

Family

ID=29257509

Family Applications (1)

Application Number Title Priority Date Filing Date
CN02131465.9A Expired - Fee Related CN1328649C (zh) 2002-10-16 2002-10-16 汉字“三形联想”形码输入法

Country Status (3)

Country Link
CN (1) CN1328649C (zh)
AU (1) AU2003272866A1 (zh)
WO (1) WO2004036404A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103927022B (zh) * 2014-03-21 2017-07-28 江山 一种形拼音汉字输入方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01292564A (ja) * 1988-05-17 1989-11-24 Liu William 漢字ボシャミコード入力方法とその入力に使用するキーボード
CN1025135C (zh) * 1990-03-13 1994-06-22 蒋辅文 汉字元音码计算机输入方法及键盘
CN1031302C (zh) * 1993-05-31 1996-03-13 王伟 汉字部首分类编码输入方法
CN1110806A (zh) * 1994-04-25 1995-10-25 汤建民 智能五笔双拼码字—词链环式定位联想输入方法
CN1142073A (zh) * 1995-07-28 1997-02-05 毛良 汉字普及用形音码输入法及其键盘
CN1247336A (zh) * 1998-09-08 2000-03-15 张云衡 形声码
CN1269542A (zh) * 1999-04-05 2000-10-11 深圳市粤丝实业有限公司 联想汉字输入系统
CN1273383A (zh) * 2000-06-06 2000-11-15 王敦清 形音码的计算机汉字输入方法

Also Published As

Publication number Publication date
CN1328649C (zh) 2007-07-25
AU2003272866A1 (en) 2004-05-04
WO2004036404A1 (en) 2004-04-29

Similar Documents

Publication Publication Date Title
CN105938402A (zh) 一种声形码汉字输入法及键盘
CN103616960A (zh) 六元音字母双拼输入法
CN102053719A (zh) 华文汉字输入法
CN104820503A (zh) 集拼音和字形编码多种方式于一体的汉字输入系统
CN1455316A (zh) 汉字“三形联想”形码输入法
CN103207684A (zh) 音素字母双拼输入法
CN103777771B (zh) 易捷速录系列输入方法
CN87105564A (zh) 一种汉字输入方法及其输入键盘
CN1137432C (zh) 快易码汉字输入法
CN112328095B (zh) 基本不用数字键选字的四用音形码汉字输入法及输入平台
CN101813979B (zh) 汉字拼音文字码输入法
CN1204487C (zh) 根声码汉字输入法
CN107256092A (zh) 汉字数字形码快速输入法
CN1825254A (zh) 汉字输入法及其所用的计算机键盘
CN1162766C (zh) 一种汉字音形编码输入方法
CN1058342C (zh) 汉字编码的计算机输入方法
CN1220127C (zh) 双分汉字与双分输入法及合成字模
CN1088210C (zh) 六区五位汉语音节和汉字键盘输入方法
CN1056007C (zh) 一种以汉字音角特征为信息元的计算机汉字输入方法
CN1195263C (zh) 一种快易通汉字输入方法
CN104536590A (zh) 基于西夏文声韵字根输入法的嵌入式软键盘系统
CN1031301C (zh) 汉字偶体隐现键盘码及输入键盘
CN102902367A (zh) 多用字根编码检字和输入法
CN102609106A (zh) 作为电脑汉字的现汉字码三位一体输入法
CN1734404A (zh) 音码和识别音码、级库技术、笔码和数字笔码

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
ASS Succession or assignment of patent right

Owner name: LIN ZONGXING; LIN ZONGFAN

Free format text: FORMER OWNER: LIN ZONGYANG; LIN ZONGXING

Effective date: 20031119

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20031119

Applicant after: Lin Zongxing

Applicant after: Lin Zongfan

Applicant before: Lin Zongyang

Applicant before: Lin Zongxing

C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20070725

Termination date: 20091116