CN1213101A

CN1213101A - 一种简繁体汉字自动转换的编码输入方法

Info

Publication number: CN1213101A
Application number: CN 97106635
Authority: CN
Inventors: 吴宁
Original assignee: Individual
Current assignee: Individual
Priority date: 1997-09-30
Filing date: 1997-09-30
Publication date: 1999-04-07
Anticipated expiration: 2017-09-30
Also published as: CN1107896C

Abstract

本发明公开了一种简繁体汉字自动转换的编码输入方法,其特征为:将汉字分成单字和词组,将单字按基本笔画,常用偏旁,部首作为构字基根,将单字拆成构成基根的原则为取大、义先、直观、以序、并连、去繁、编码按从左到右、从上到下、从外到内、先中后边、先横后竖、先撇后捺的顺序进行天然三码输入;词组按双字词、三字词、四字词及多字词划分进行四码输入,本发明易学易用,为超容量的词库提供了得天独厚的空间优势,大大加快了输入进度,且重码率为零,能实现汉字简繁体的自由转换。

Description

一种简繁体汉字自动转换的编码输入方法

本发明涉及汉字编码的技术领域，具体地说是一种可进行简繁体汉字自动转换的编码输入法。

汉字输入技术的研究自70年代末至今已有一、二十年的历史，在这期间，国内外涌现了大量的汉字输入方法。到目前为止，仅国内登记在案的汉字输入方法就已达600多种，如果加上国外的研究，至少在一千种以上，但按照各汉字输入方法所依据的汉字属性的不同，大致可将它们分为形码、音码、音形码和序码四种类型，两大方案，即一类是面向广大专业者的快速型形码方案，一类是面向非专业者的普及型音形等方案。前者编码宜于盲打，但比较复杂，难以学习和掌握，典型的有五笔字型、郑码、全息码等；后者简单易学，效率不高，典型的有拼音、自然码、表形码等。“易学的打不快，打得快的不易学”，基本上反映了我国汉字输入技术的现状。

随着时代的发展，信息时代的到来，信息处理越来越大，加上人们生活工作节奏的加快，人们对汉字处理技术的要求必然也越来越高。在文字处理领域，作为形码输入法已成为汉字输入方法中最为常用和实用的方法，王码、全息码等，虽然各有优点但其编码的性质依然仅仅停留在传统生硬且繁杂的基本笔画和单一处理的取码基础上，而束缚于庞大的简码和狭小的字词库体系，更谈不上对语句的处理了，再加上重码率高，适用范围窄，尤其是至今为止国内还没有一种编码输入法，它能在天然三码的基础上实现简繁体汉字、词组与语句的自动识别转换。

本发明的目的在于提供一种简繁体汉字自动转换的编码输入方法，它能在天然三码的基础上同时实现简繁体汉字、词组的自动转换，且没有重码。

本发明的目的可以通过如下的措施来实现：一种简繁体汉字自动转换的编码输入方法，其特征在于：将汉字分成单字和词组，将单字按基本笔画，常用偏旁、部首作为构字基根，构字基根可分为非字及成字基根，将单字拆成构字基根的原则为取大、义先、直观、以序、并连、去繁，编码按从左到右、从上到下、从外到内、先中后边、先横后竖、先撇后捺的顺序进行三码输入，当取码不足三码或超过三码时需用自由、转换、替代、计算、推理、首尾、跳跃、省略规律进行天然三码输入；词组按双字词、三字词、四字词及多字词划分进行四码输入，双字词取各字的前两码，三字词取各字首码及末字次码，四字词取各字的首码，多字词取前三字及末字的首码。

本发明具有以下特点：

1、实现了汉字简繁体的自由转换，由于大陆与港台等地区的历史背景不同，我们无法去记忆成千上万个繁体字，同样港台人也无法记忆成千上万个简体字，这种我们使用繁体字有阻，港台人使用简化字有碍的局面得到了改变，为彼此间的文化交流架起了桥梁；

2、由于将单字按基本笔画、常用偏旁、部首作为构字基根，而构字基根及拆字原则大多为人们所熟悉，“八大规律”通俗易懂，因而易学，易记易用；

3、突破了现有的“照葫芦画瓢”的输入，使占汉字总数大半的四、五基根字能有效地转化为三码体系，缩短了码长，并妥善处理好了单字与词组间的矛盾，为超容量的词库提供了得天独厚的空间优势，词组条目可达12万余对，大大加快了输入的速度，且重码率为零。

4、开创了语句编码。本编码可以对各种和乎语法规则的复杂单句和复句及句群进行加工处理，使长期积累下来的语言学丰硕的研究成果结合在计算机科学中。将中文处理从整体上达到了更高和更加实用的水平。

下面进一步对本发明作详细的描述。

本发明将汉字分成单字和词组，将单字按基本笔画，常用偏旁、部首作为构字基根，构字基根为160个，具体如构字基根总表所列；构字基根可分为非字及成字基根，将单字拆成构字基根的原则为取大、义先、直观、以序、并连、去繁；取大为：在一个汉字的各种可能的拆法中，按每次拆出尽可能大的基根或以拆分出的基根数最少，如(下面汉字的拆分及相应键为-：身：自丿-KA 成：戊

-RJ义先指在以书写顺序为前提下，拆分出的基根要尊从该字体本身意义，如：

舌：千口--HB 关：丷天--UH直观即从汉字整体的结构出发，全面地进行观察、感官可以被直接接受的，如：

我：手戈--JR 州：小川--QE以序按汉字的书写顺序以次拆分，如：

在：亻土--IXH 义：丶乂--OX并连是指一个汉字基根与基根之间潜在某种天然的吻合关系，就用“衔接”法处理，如：爪：卜--NF 尽：尸氵--PS去繁指当复合基根明显优于基本根时，则舍小取大，如：考：土 --H5 东：七小--HQ一个编码方案如果在基根的设计数目上过分格式，必然导致在汉字的拆分编码中要反反复复地运用“丶一丨丿  乙二三十”等这些数笔画似的基根和其它类似的最小基根，因此在决定输入速度的词组拆分编码中变得更为繁杂、单调。一方面除进一步扩大了双眼在空间的移动所给大脑搜集整理信息带来难度，另一方面由于基根老是在这些基本笔画中徘徊不变，将直接造成重码率高居不下，以致词库越来越小，输入速度越来越慢，众多的科学实践已证明，基根的数量与字库词库的大小及重码率等在某种程度上成正比，本发明在实际操作中大胆地突破生硬的基本笔画的束缚，采用了多种灵活的方式进行拆分，在列出了160个构字基根的同时还列出了一、二级简码，详见简码表。

本发明以基根作为取码的最基本单位，以七种基本笔画作为取码的最小单位，就是说在没有合适的基根时，可以按笔画的方式取码；汉字分解成基本根和笔画后，按书写顺序排列先后，即从左到右、从上到下、从外到内、先中后旁、先横后竖、先撇后捺、先整后零；每个偏旁、每条词组按全码为中心；每个单字以三码为中心。

偏旁笔画输入编码歌诀：偏旁笔画不可免，挂号首笔次末含。单名缺席0上先，哪里需要哪里站。复名笔画巧拐弯，名称读写边转换。横折“J”来钩儿弯，对号入座把码填。

偏旁编码规则：在160个基根中，它们既不是键名汉字，也不是成字基根，它们是汉字形体中常常出现的组成部分，称为偏旁。其编码规则是：键名码+首笔码+次笔码十末笔码。空位用数字键“0”补充。这里的首、次、末笔码，均指按单笔画取码，其对应关系如下：

单笔画种类：点横竖撇捺弯拐

单笔画代码：V I I A A L J例如下面偏旁基根对应的编码：扌匚氵阝JIJI HILO VVIO BJIO笔画编码规则：键名码+首笔码+次笔码+末笔码。(1)单名称笔画在汉字形体中，按一定方向连续完成的一个线条，叫做笔画。单名称笔画虽然特殊，但有了上面的规则，同样容易编出。例如：丶一丨丿  /

VA00 I000 I002 AOOU A002 II00

(2)复名称笔画

复名称笔画就是把折类笔画进一步划分为“弯”和“拐”。由于折类笔画笔形变化多端，形态各异，在书法、各种排版中又经常使用，因此将其也纳入编码行列。其编码有别于单名称笔画，而是按照“键名码+读作法”进行编码的。

例如：乙读作：横折弯钩编码：KJLO

乚读作：竖弯钩编码：LLLO

亅读作：竖钩编码：JILO

し读作：竖提编码：LIIO

单字输入编码歌诀：

通用综合义优先，一二三码加空格，

依照笔顺取码元。字型代码不够添。

键名汉字挂号四，固定基根巧替换，

成字基根照外搬。简繁自由用户选。

键外汉字也简便，逻辑记忆形直观。

转化三根把码编。智能天然不虚传。

键名汉字的编码规则：各键位的一个特殊基根，叫键名字。如竹口衣等，共26个，它们的编码规则是挂号+“4”，即所在键连写四次的转化。

例如：衣--CCCC--C4

竹--AAAA-A4

成字基根的编码规则：在160个基根中，除了键名字外，还有不少本身就是一个汉字的基根，这样的基根按照键外汉字编码处理，即挂号+“拆分法”。

例如：文--拆分亠乂编码：AUX耳--拆分编码：BNE从--拆分人人编码：AXX

键外汉字的编码规则：大量的汉字属于这类汉字，因此掌握这类汉字的编码规则很重要。在给出编码规则之前，先讨论基根码的概念。每个汉字拆分出的基根分配在键盘上的某个字母键上，基根所在键位的英文字母即为该汉字的“基根码”。其编码规则为：首根+次根+末根。

(1)对于基根数少于三个。且不在二级编码范围中的键外汉字，以次取码，再加字型码或双写末尾码。

例如：旱--日干编码：MH2

矽--石：夕编码：NMM

(2)对于基根数多于三个时．除特殊情况外，在取码过程中，一定要结合八大规律灵活运用，使其转化成天然的三码。在通用码中三码的比重占到90％以上。

例如：犊--牛土头编码：ZHF《转换)

胰--月大弓编码：DZR(首尾)

膜--月艹卅编码：DIE(计算)

瑨--王山西(晋) 编码：EWE(推理)

(3)当一个汉字不在八大规律之中时，则取全码，这类汉字在本编码中极少。

例如：筵--丿止廴编码：AAFF

篌--亻

矢编码：AXMR

当取码不足三码或超过三码时需用自由、转换、替代、计算、首尾、跳跃、省略八大规律。

1、自由规律

指在二级编码中，将可拆分的基根自动转化成三级编码，而在三级编码中不再继续拆分保持独立不变的特殊基根。例如：从坐--人人土编码：XXH

座--广从土编码：FAH

坐：本来应该在二级编码中，照理说，它的编码应是两码，而它却不编成“AH”，而把“从”根又进一步拆分成“人人”两个基本根，进入了三级编码；

座：里面同样也含有“从”根。而在三级编码中，它却保持独立不变，作为了基本根处理。

这是通用码中的一个十分重要的概念。它适用于下面的每一个规律。哪些基根需要自动转化，请参照基根总表括号内。

2、转换规律

指把整字中的某些部位与一些常用基根形状相似或相近的，转换成该常用基根。例如：凶--山胸--拆分--月

山编码：DJW

用--月娜--拆分--女月阝编码：YDB

3、替代规律

指在意义上，运用基根或整字去代替与之相同或相近的汉字。

例如：米--谷榕--拆分--木宀米编码：TOK

度--瓩渡--拆分--氵瓦千编码：SYH

4、计算规律

指运用特意设置在数字键上的基根或其它约定俗成的基根进行加法运算的代入法。

例如：又--2 搡--拆分--扌6(2+2+2)木编码：J6T

日--24 膜--拆分--月艹卅《24+6) 编码：DIE

为了简便，一般在运用加法运算后，便不再转换，如上面的“J6T”中的数字6，就没有用“六-u”进行转换。

5、推理规律

指运用已知的条件去想象或逻辑推理与之有密切联系者。

例如：刖--足渝--拆分--氵刖--氵足编码：SAF光--电辉--拆分--光冖车--电冖车编码：VLR6、首尾规律指基根与基根之间相互交叉套叠，而从整体上采取的直接压缩。例如：夷--大弓姨--拆分--女大弓编码：YZR

弟--火弓递--拆分--火弓辶编码：QRF7、跳跃规律指基于已有的先例或条件而顺理成章的剪截。例如：制--拆分--

巾刂编码：AWN掣--拆分--

巾手编码：AWJ

征--拆分--彳一止编码：AIF

惩--拆分--彳一心编码：AIQ8、省略规律指基根与单笔画相距或相交而果断做出的强制删除。例如： --亻修--拆分--亻夂彡编码：XAW必--心蜜--拆分--宀心虫编码：OQG

①一个汉字中，两个基根同时转化通常转后不变前；如该字有繁体字，则同时不变。

例如：硕--拆分--石厂贝编码：NNP《没有繁体)

斋--拆分--文而编码：AS(有繁体字)

②转换规律在二级编码中如该字没有繁体字，通常不直接转换。

例如：那--拆分--阝

编码：JIB(没有繁体)

妊--拆分--女王编码：YE《有繁体字)

简码规剐：

主观上为了减少码长，提高输入速度而引入简码的说法。然而，一种方案简码的数量越高，它的记忆难度就越大，学习的时间也就越长……它所带来的并非是什么速度，它的背后严格地讲乃是一沉重的包袱。无论对于一个操作者，还是对于一个学习者来说，他永远不可能真正记下好几千个简码。因为它不是一种天然的编码，而完全始终依赖于机械的记忆。如果说字型码是变相的二级或三级编码的重码，那么简码就是变相记忆的字型码，它们二者在实质上并没有根本的区别。假如有人要把简码来当作一种创造，那是加倍的错误。一些编码，包括目前比较流行的几种编码，简码的数量几乎占了其编码集的2/3，而利用其简码计算出来的平均码长更失去了客观性与科学性，它们的平均码长仅仅只是个形式上的数据，并不是一个严肃的科学。它们的重码率同样如此。因此简码的数量也是衡量一种方案优劣的一个很重要的标准，完全可以说简码的数量越高，其方案的质量就越低。而目前几乎所有的编码都是以简码方式构成的体系，这也正是本编码与众家方案的又一显著的根本区别。在本编码中，编码不与简码鱼龙混杂，其情况如下：

(1)一级简码36个；

(2)二级“简”码1190个(其中含天然编码约占900个)。

具体如简码表，其输入方法是：分别键入一、二个字母，再补打一个空格键，即对于一、二级简码或编码的输入，分别需要击二、三个键。

繁体字与数字的输入规则：

繁体字的输入是紧紧与简体字的输入方法联系在一起的，它的自由转换是通过数字键与英文键来实现的。即对于一个繁体字的输入，只要将该字中的某一固定的基根转换成与之相互通用的基根或对应的数字键，就完成了该汉字繁体的输入法。(见基根总表)，其中二级编码或利用二级编码构成的简码的繁体字转换，采用字型码的方式。

由于数字键上设置了几个必要的基根作为一少部分汉字繁体转换的需要，因此它们有两种用途。

(1)当它们用作编码时直接键入；

(2)当它们用作数字时，则先按住该键，然后再击空格键。

词组编码规则：

在本发明中设计了词组输入法。词组或短语的编码方法与单字的取码统一，不加字或词的输入标记，无论词组长短取等长的四码，而且单字与词组可混合输入，见字打字，(包括繁体字)见词打词，(包括繁体词)无需切换。这种词组输入法使得输入速度成倍提高。由于全码主元空间占26⁴，加上虚无理论上10⁴的设计，总数达56万以上，而本码单字几乎为空白，因此词组或短语的容量相当之大。它的容量同《辞海》相比只有过之，而无不及，是目前容量唯一最大的方案。

编码歌诀：

词组编码无奇变，四字成语各取前，

以四为准照章办。恰好不少四码全。

双字词语各一二，多字词语首码三，

公平合理无怨言。依序加尾首根连。

三字联绵前两首，莫忘最后八要点，

后字续补两码串。定义规律贯全篇。

两字词编码规则：每字取其全码的前两码组成，共四码。

例如：学习--拆分--子冫编码：QPJU

努力--拆分--女又力力编码：YCYY

三字词语编码规则：前两个字各取第一码，最后一字取前两码，共四码。

例如：计算机--拆分--讠木几编码：OATN

电视机--拆分--电礻木几编码：VLTN

四字词编码规则：每个字各取全码的第一码，共四码。

例如：操作系统--拆分--扌亻丿纟编码：JXAC

中国人民--拆分--中囗人尸编码：ICXP

多字词编码规则：取第一、二、三字的第一码和最后一字的第一码，共四码。

例如：中国共产党--中囗共

编码：IVZQ

香港特别行政区--禾氵牛匚编码：LSZH

语句编码规则：

句子是由词或短语按照一定的语法规则构成的语言单位，有一定的语调，表达一个完整的意思。它能告诉某人一件事，询问别人一件事，要求他人做件事，或者表示自己的某种强烈感情。

从语气上句子分为陈述句、疑问句、祈使句、感叹句四种；从结构上，它可分为单句与复句两种。一般的单句(独语句和无主句除外)通常都有主语、谓语，有的还有宾语。主语、谓语和宾语是句子的主干，在主干的基础上还可以附加定语、状语和补语。这些成分有的由词充当，有的由短语充当。

由两个或两个以上的单句构成的句子就叫复句。构成复句的单句在意义上有一定的关联，并通过一定的结构方式组合起来。这些单句成为复句的组成部分以后，失去了原来的独立性，称为分句。复句的各分句的关系(或复句的类型)有并列、承接、递进、选择、转折、因果、假设、条件等，有的语法书籍中还列有目的、连锁、取舍、解说等。表达这些关系时，常常用关联词语作标志，但也有的只是意念上的联系，不一定用关联词语。

若干个单句或复句的组合，就形成了前后衔接连贯、表达一个明晰的中心意思的句群。不过句群中很少能够用成对的关联词语在两句中，往往是单用一个，且只用于后续句。它们之间的关系，可以借用复句中分句间的分类原则来分类：即并列句群、承接句群、递进句群、选择句群、转折句群、因果句群、条件句群、目的句群、解说句群等。

虽然文章里的句子总是各种各样的，但无论句子有多么长，结构有多么复杂，其构成的各种成分总是有规律可循的。对于语句的编码，既要遵从于语法规则，但又不能完全死搬语法结构。在本编码中，通过归纳整理，设计了语句取码的基本规则：

(一)取码歌诀：

单句首根主谓宾，各首追加主谓宾。

加状或补成分定，多重复句与句群，

关键字词复句型，基本规则步步营。

(二)取码规则：

(1)特殊句式取码规则：关键字的首根+主谓宾语的首根，共四码。

关键字包括：把字句、被字句、使字句、所字句。

例如：你们把教室打扫(干净)。编码：[JXJH

(这样的)问题是我们所能接受的。编码：[NWMJ

(2)一般单句取码规则：分别取主谓宾定语(或状语、补语)的首根，共四码。

它包括：连动句、兼语句、判断句、存现句、紧缩句、主谓句等。

例如：他到我家看电视。编码：XCJV

班主任希望我写入团申请书。编码：[EXJM

(3)复杂单句取码规则：分别取主谓宾定状补语的首根，共六码。

例如：(伟大的革命导师)马克思[第一次][彻底地]解释(清楚)(自然和社会的发展)规律。

编码：[ZPHXAS

(4)复句取码规则：类型关系的首根+各分句主谓宾语的首根。类型关系包括：并列、承接、递进、选择、转折、因果、假设、条件、取舍、解说等复句。

例如：因为(青年时期)他[坚持每天]锻炼身体，所以这使他[其后二十年中从未]得<过>病也[从未因]身体<不好>耽误工作。

编码：[VXPKXAUZBF

多重复句的一次取码最多不超过12个字母，也就是说最高限于二重复句，三个分句。而事实上，在多重复句中，用得最多的就是二重复句。如果分句中单句的主谓宾语等出现相同或几个时，通常保留最前面的一个。

(5)句群取码规则：先把它转化成若干个单句或复句的形式，然后再按规则，分次处理。

例如：①我爱秋天。编码：[JGLH

②我爱这个时代的秋天。编码：[JGLA

③我愿这大好秋色永驻人间。编码：[JNLX

上面这个并列关系的句群，既可以按单句取码规则，依次处理，又可以把②、③综合起来转化为因果关系的复句处理。

由于语句结构的特殊性与复杂性，它们的取码则规定为：分别在其编码前加“匚”键，作为标志，最后以空格键作结束，当编码中出现“匚”时，系统将默认进入语句处理功能。

多重复句和句群都是由许多句子组合而成的，它们的结构要比单句复杂得多，需要我们逐句进行分析，把握上下句的内容及其内在联系，搞清表情达意的脉络，这样才能准确地把握其复杂的内容和结构。

首先搞清楚这个复句(或句群)共有多少个分句，确定分句和分句之间在意念上的相互关系，找出各分句的主谓宾语(因为构成各个分句的单句本身可以进行句子成分分析)多重复句的各分句之间的语法关系，可以利用关联词语的配套使用或单独使用来查明分句的组合范围和分句的关系。

书面中，在分析多重复句(或句群)的结构关系时，常规的方法总是先分句，再分层，而事实上，层次是无形中存在东西，它的位置是固定的。不光人脑在书面中一时难以确定，电脑将更难以区分。如果把层次也纳入电脑的执行中，那么电脑操作复句时，将只能按层次的执行而去重新组合和排列句式的先后顺序，那时将只能变得一踏糊涂，人机“对话”反而成为空话。在这种情况下，只有二重复句的结构最具有稳定性。因此，为了简便和适应不同文化层次人员的需要，对于三重或三重以上的复句或句群，按“单句+复句”、“复句+单句”或“复句+复句”的形式，分次处理。这样不管什么样的复句或句群，依照上面的几种规则，都可以直接进入编码方式。下面附构字基根总表和简码表。

构字基根总表

简码表二级A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 1 2 3 4 5 6 7 8 9 0A 入各么算笔处丢竿升乃徨儿得刘舞衔佥役斋条冬备币迭务乌笄竺苛竹笫天乇徊千B 险哭叹阴吧卟呜吴喏陶听际阳陇阿兄啧叨哩呆叫呐吊队另吗哑嘆呵口号咬叱叭叶C 绦台丝巢纴巡艰纤弁衬缕

纨综允缅初繻予纠纳绸给劝牟红双衫衣布绞幻封参叉D 脸君县朦睛胪睢肝且豚脾甩

胧脘蓥荧股眺荣瞳由肽肋睦肛朋肜月星腌脒肘 E 玫吾表青非玷鸽玕弄琢珀现巴珑翠责毯荚顺玎翌玉瑞玢玏玛豊瑟毳王玙琦環寿瑯F 攻占云庸歧卡此庄止跑廆废桌跖踪贞应库频床头卤击廓底庆

遼足巧趴卢禀G 蚊蝇跓蛐蚝虹虫鞋蟆隽貌蚬

虮蛇貂蠕采蜡蛐靴劫焦

鸟

隼H 坞舌埃填圳走蚕圭氩场圻壶坦刊垸坝赤医坛士垃坊氙埻坻氧缸

坷土考碕老氛圯壈I 牙串专节莫正革著甘葡百劳草无苦赞忠茅落于其画雨艾功艺荆董苛茜亏萘

茴艽茛J 久扣勾争色逐携扦摸扔拍扎担勿訇包搅找捕打匀龟扫拖批拼扛盈掱寸岛挞扭扒勼勺K 身向

粗饪迫蚀饩丘饱粕饮

版馆皃谷

泉陵粒斥帛

娄饼坵粲

食龉皎皂粉

L 发否私祖耠祉稚秆丕秀祈礼裸冗福季秋军耘禧科番出欠委禚秣犂耗禾写悉秕罕祀

M 景名黝冒旺外暖里甲易飧晕多列晾昵炙残昙果暗遇映更昂兔申昌晶日晤曼死时旯早N 尴厄反面耳否厩矸砖确砍祟夙矶后页砂碱泵朵龙凡归风历厌矼风皮几幾

万龍磯尤O 宅高哀宜训定谁讦寞家记寂宴讥蠢字灾段永宁诸逼讻认讼奇讧

亨言语鬲它讨宄计P 败危铱钥

贴触赌财购铂孔赐则贮钡钡钱孩贿铲钠钢詹钕钇缸孖钐金铻锜钚导尻针Q 必赏丧慎州悼惟灶恒恟怕炊慢忧惊学心烧恸灯兴

当怆忪忆豇炎焱火焐尖炖忖伲懔R 辌知弘轴轇式鸢轿戒成轧盏划感负忒股辅戎弱刃刍骼威辘引弍轲戊戉轪轜辍轨戍S 济涡汉泪汪江淮汗漠烫泊浓汐氿浣漏霄没需霜萎雷渔海耍洋汧漠森水酒雩汇泗汜汁T 枚古权相栖朴椎杜本村柏札查机枯李灰杙博楂喜枋杉桧丐样杠林森木朽杕樞朳樨术U 收竞痛疖翊症准壮半疗姿辣章疣辩兑亦减冰米商兽帝窄妆状冮兰蘭辛

头北沧究凛V 放回鲹胃

园鸭畦团囫鲌稣电皈固启思候

困方鲂囵男鲜魟吭喦凹因囤

田W 阁问艮印目辿帷周曲寻帕慰岁岩同见灵崭录闲幛闸巾冈阍嵯岍丹闫凸屿

崕寻幈

X 俭仓仅伟仨乍仑仕年仍伯余侈介信侧俗代俩杀伴偎仙爻仂亿仝仁何人伍矢化付仇什Y 姓加奴卬妊边鸼奸媒奶嫂舰盘般姑媚乐娆颂毋为娘妇办婚妈舡

女姊姨氏

艉田Z 验卷骏差翔逆独犴奉狗猊秦春养驼骗恭券獾秦并狎猾朱马驮差驭

犬啎骑

硃犰狼

Claims

1．一种简繁体汉字自动转换的编码输入方法，其特征在于：将汉字分成单字和词组，将单字按基本笔画，常用偏旁、部首作为构字基根，构字基根可分为非字及成字基根，将单字拆成构字基根的原则为取大、义先、直观、以序、并连、去繁，编码按从左到右、从上到下、从外到内、先中后边、先横后竖、先撇后捺的顺序进行三码输入，当取码不足三码或超过三码时需用自由、转换、替代、计算、推理、首尾、跳跃、省略规律进行天然三码输入；词组按双字词、三字词、四字词及多字词划分进行四码输入，双字词取各字的前两码，三字词取各字首码及末字次码，四字词取各字的首码，多字词取前三字及末字的首码。

2．按权利要求1所述的一种简繁体汉字自动转换的编码输入方法，其特征在于：构字基根为160个，具体如构字基根总表所列。

3．按权利要求1或2所述的一种简繁体汉字自动转换的编码输入方法，其特征在于：将语句分成单句和复句，单句分别取主、谓、宾、定语或状语、补语的首根共四码，或采用关键字的首根加主、谓、宾语的首根共四码，或采用取主、谓、宾、定、状、补语的首根共六码，复句分别取类型关系的首根加各分句主、谓、宾语的首根；在其编码前输入“[”键，作为标志，最后以空格键结束。