CN1749929A - 三级码元输入法 - Google Patents

三级码元输入法 Download PDF

Info

Publication number
CN1749929A
CN1749929A CN 200510030418 CN200510030418A CN1749929A CN 1749929 A CN1749929 A CN 1749929A CN 200510030418 CN200510030418 CN 200510030418 CN 200510030418 A CN200510030418 A CN 200510030418A CN 1749929 A CN1749929 A CN 1749929A
Authority
CN
China
Prior art keywords
code
code element
character
characters
radicals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN 200510030418
Other languages
English (en)
Inventor
曹阿荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN 200510030418 priority Critical patent/CN1749929A/zh
Publication of CN1749929A publication Critical patent/CN1749929A/zh
Withdrawn legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

三级码元输入法属汉字信息处理技术领域,用于计算机、手机等信息工具的汉字输入和辞书检索,技术特征是按拆分层次将单字的码元分为一级码元、二级码元和三级码元,每字四码,按笔顺单独或混合使用一级、二级和三级码元进行编码,国标码6763个单字独码率高达92%以上,也适用繁体字输入。成字码元多用读音字母作代码、多数部首码元用同组成字码元或名称音字母作代码,多数一般码元和少数部首码元用其首部、末部所含的其它成字、部首码元和单笔的代码作代码,单笔码元用单笔代码(单笔输入另有专利申请),只要识字和掌握二十四个单笔编码就掌握了所有码元代码,无硬记基本码元及其代码的辛劳。该法简单高效规范,易学易记,既适用于专业输入人群,也适用有文化的所有人员,是可普及的汉字输入新方法。

Description

三级码元输入法
                          技术领域
本发明属汉字信息处理技术领域,主要用于计算机、手机等信息工具的汉字输入和辞书的查字检索等。
                          背景技术
目前计算机汉字输入的方法有几百种,方法可分为拼音码、拼形码、音形码和流水码四类。流水码是为汉字单字排队编码,如国标码等,虽然没有重码,但很难记忆,只能在特殊情况下使用,不日常应用。拼形码是根据单字的笔画和部件(码元)为单字编码,特点是独码率高,输入效率高,自计算机汉字输入技术应用以来,王码五笔在拼形码中独领风骚;因现有拼形码选定的码元多、规则多,故目前的拼形码比较难学难记,一般均要经过专门培训,适合专业输入人群。拼音码以汉语拼音为依据,全码输入,或经过适当变通,用两码输入,由于汉语拼音比较普及,用于输入无须重新学习,虽然重码多,但现成可用,特别是经过智能化处理,用于字组输入也有一定的效率,如智能ABC等,因此,用拼音码输入的人群是比较广泛的。音形码兼取形音要素,如自然码、钱码和两笔输入法等,有的音形码仍设有一百多到二百多的码元,有的音形码的代码超过二十六个英文字母,因此现有的音形码有形码之难,少音码之便,反映到使用中,用者相对比较少。目今计算机使用中汉字输入的瓶颈虽已穿越,但现在的情况是效率高的输入法难学难记难普及,普及使用的输入法又重码多、效率有限。手机汉字输入的实际使用方法较少,主要是汉语拼音的输入,或根据在手机按键上标明的笔画记号一笔一笔的输入,两种方法均重码多、效率低。因此探索入门容易,易学易记、简单高效的计算机和手机通用的汉字输入法仍是社会的迫切需要。
                          发明内容
本法将汉字的部件(码元)分为成字部件(码元)、部首部件(码元)、单笔部件(码元)和一般部件(码元)。
所谓的三级码元输入法,是根据不同单字的不同结构形式,按笔顺单独或混合使用一级码元、二级码元、三级码元对单字进行编码。用码元取码是本法的主码,用其它方法取码是本法的辅码。
本发明的技术特征是:将码元分成不含下级码元而只取一码的固定码元和含下级码元可以取一码或数码的可变码元;将直接组成单字的码元定为一级码元、将组成一级码元的码元定为二级码元、将组成二级码元的码元定为三级码元,按笔顺用一级码元对单字进行编码,如一级码元取码数不足的,将含有二级码元的一级码元改用二级码元对单字进行编码,取码数仍不足的,将含有三级码元的二级码元改用三级码元对单字进行编码;码元中的成字码元取其读音的首个字母作代码、个别取其它字母作代码;码元中的部首码元以列入《统一部首表》的码元为准,其中同组有成字的部首码元一般取其同组成字码元的代码作代码、个别同组有成字的部首码元取其同组成字码元读音的其它字母或部首名称音中的字母或其它的字母作代码,个别同组无成字的部首码元取名称音的首个字母或其它的字母作代码、多数同组无成字的部首码元取该码元首部或末部所含的下级成字码元或所含的下级其它部首码元或所含的单笔的代码作代码;码元中的一般码元取该码元首部或末部所含的下级成字码元或所含的下级部首码元或所含的单笔的代码或其它的字母作代码;码元中的单笔码元以单笔代码作代码;独体结构的单字取单笔码或按拆分后的码元取码,固定码元自作单字时,首码取该固定码元的码,再取单笔码或按拆分后的码元取码;双部结构的单字一般按前二后二均匀取码,因固定码元的原因在某个部分只能取一码的,在另一部分里取三码或按实际可能取码;多层次上下结构的单字按自然层次取码,不足四层的单字按散优于连、连优于交的原则在能取两码的层次取两码;多部结构的单字按部件的书写顺序取码,不足四码的单字按散优于连、连优于交的原则在能取两码的部件里取两码;因码元少取码不足四码的加该单字读音的字母作辅助码,仍不足四码时,再加该单字的结构代码作辅助码。
本法所称的单笔代码是指单笔输入法(专利申请号:200410049434.7)中的单笔编码。单笔输入法和本发明两个专利的发明人和申请人为同一人。
本法无基本码元的概念,无须硬记死背基本码元及其代码,单字拆分也无基本码元的局限。多数部件都是取码的码元,码元虽多但代码易记,主要掌握有音码元的读音或名称音以及有序的单笔编码,就能见字出码,识字越多的人使用越方便。本法也适用于繁体汉字的输入。演练证明,国标码的6763个单字和部首使用本法的独码率高达92%以上。本法的高效规范使之适用于办公室的专业输入人群,更因简单易记易学而适用于有一定文化水平的其他人员,尤其适用于有一定文化水平的中老年人,因此本法是可普及的汉字输入新方法。
                      单笔输入法简介
本法在使用中要大量使用单笔编码,为此先介绍单笔输入法。单笔输入法认为,组成汉字单字的五种笔画分横、竖、斜三种方向,折笔是横、竖、斜三种方向笔画的首尾连接,横、竖、斜的笔画之间有相近、相连、相交三种关系,根据笔画的三种方向和笔画间的三种关系定出五种笔画的二十四个代码如表一:
                     表一:单笔码元编码表
  独笔   连横   交横   连横折   连竖   交竖   连斜   交斜
  横笔   A   B   C   D   E
  竖笔   G   H   I   J   K
  斜笔   撇笔   L         M   N       O       P
  点捺笔   Q         R   S       T   U   V
  折笔   横起头   单笔和横笔部分无连交笔W   横笔部分有连交笔X
  竖斜起头                             全部Y
除表列代码外,单笔取码还有如下的规定:
1、关于撇笔取码的规定:撇尖贴近框形码元的取码L,撇尖贴近其它笔画视为与它笔相连。
2、关于点笔取码的规定:相邻成字、部首的点笔和单字、部件右上的点笔取码Q,相邻其它笔画的点笔视为与它笔相连。
3、一笔与多笔相连相交取码的规定:既有连笔又有交笔的按交笔取码,一笔与多笔相连或与多笔相交按连写的单笔作取码的参照,如均为连写或均不为连写的按斜、竖、横的顺序作取码的参照。单笔编码例举如下:
长=MCYT(丿一乚丶)    方=QDXN(丶一丿)   瓦=BYXT(一乚
Figure A20051003041800051
丶)
戈=EYPQ(一乚丿丶)    爿=YHDM(乚丨一丿)   毋=YXEM(乚一丿)
形=DELL(一一丿丿)    吸=KNXV(口丿ㄋ丶)   团=FCIO(囗一亅丿)
重=OCSB(丿一申一)    往=LROW(丿亻丶王)   恒=XARA(忄一日一)
沔=UDYX(氵丅乚)    弄=WEMI(王一丿丨)   芋=ABCI(艹一一亅)
                         具体实施方法
只要将个别未简化的高频部首如金、言、鳥、糹等繁体部首设为只取一码的固定码元,本法就能用于繁体汉字的编码和输入。只要根据电话按键的字母标记按相应的数字键,如:ABC/2、DEF/3、GHI/4、JKL/5等,本法就能用于手机等通信工具的汉字输入,无须另记数字代码。为叙述简明,以下主要以简体汉字和字母码作说明。
一、部件和码元
(一)、部件:部件是单字中另有音义或占据一定部位的若干笔画的组合或单笔,是组成单字的基本单元。单字中较大的部件一般还可拆分出较小的下级部件。
1、成字部件:单笔以上的能独立另成单字的部件为成字部件,单笔单字一和乙在其它单字中作独立部件时仍为单笔部件。成字部件如:
雷中的雨和田、崖中的山、厂和圭(土、土)、禁中的林(木、木)和示(二、小)、臆中的月、音(立、日)和心、榻中的木、日和羽(习、习)等。
2、部首部件:由有关部门发布的列入《统一部首表》的单笔以上的成字部首以外的部首本法称为部首部件,不在单字的部首位置但有与部首相同笔形的笔画组合本法也称为部首部件。为方便说明,本法还将《统一部首表》中同组有成字部首的部首部件称为甲类部首部件,同组无成字部首的部首部件称为乙类部首部件。
甲类部首部件如:饱中的饣/食、宽中的艹/草、陪中的阝/阜、彪中的虍/虎、筒中的/竹、汇中的氵/水、反中的/厂等。
乙类部首部件如:饱中的勹、宽中的宀、彪中的彡、筒中的冂、朝中的、弄中的廾、登中的癶等。
3、单笔部件:只有一个笔画的部件为单笔部件,独立的一和乙在其它单字作部件时不为成字部件。单笔部件如:
旦中的一、旧中的丨、自中的丿、犬中的丶、扎中的乚、艺中的乙、司中一。
4、一般部件:成字部件、部首部件和单笔部件外的所有部件均为一般部件,有些过去曾经普遍采用或现在有的辞书仍采用但未列入《统一部首表表》的部首也为一般部件。一般部件如:
春中的、青中的、豢中的、单中的
Figure A20051003041800055
惠中的
Figure A20051003041800056
仓中的等。
(二)、码元:单字中用于取码的部件或部件中用于取码的笔画称为码元。
本法用三种方法对码元进行分类:
1、根据码元能否拆分,将码元分为固定码元和可变码元。
(1)、固定码元:在单字取码中不拆分下级码元并且只取一码的码元是固定码元,固定码元包括单笔码元、两个笔画的成字码元和部首码元、两个连交笔画的一般码元以及少数由多笔组成但规定只取一码的成字码元和部首码元。
单笔固定码元如:一/A、丨亅/G、丿/L、丶/Q、乙/W、乚/Y等。
双笔固定码元如:八/B、、丷/B、丁丅/D、儿/E、又/I、几/J、九/J、力/L、了/L、勹/N、亻/R、冂/S、冖/S、廴/W或V、マ/W、凵/X、/X或Y、匚/Z等。
多笔固定码元如:艹/A、疒/B、辶虫/C、囗/F、广/G、火/H、钅/J、己已巳/J、口/K、木/M、女/N、扌/O、宀/Q、日曰/R、石/S、土士/T、氵/U、月/V、王/W、忄心/X、纟/Y、/Z。
单笔和双笔的固定码元还有很多,这些码元只要理解就能应用,无须专门记忆;但多笔二十八个固定码元须专门记忆,它们是有音码元、出现频率高,也容易记忆。
本法所称的固定码元是相对于可变码元而言的,它不同于其它形码中的码元(基本字根),其它形码中的码元是单字拆分和取码的唯一标准,而固定码元不是单字拆分和取码的唯一标准,可变码元也可以成为单字拆分标准和取码标准,因此单字中的固定码元可能取码,也可能包含在上级码元中而不被拆分和不被独立取码。
(2)、可变码元:固定码元外的码元是可变码元。可变码元的特征是可拆分出下级码元,在取码时可能取一码,也可能拆分后取二到三码。离散两笔组成的码元和其它两笔以上的码元都是可变码元。可变码元数量众多,不单独例举,详见以下说明。
2、根据单字拆分层次,将码元分成一级码元、二级码元和三级码元,例举如下:
仅:仅的一级码元是亻和又,不能再拆分。
总:总的一级码元是丷、口和心,不能再拆分。
亮:亮的一级码元是亠、口、冖和几,不能再拆分。
篡:篡的一级码元是、目、大和厶,不再拆分。
戴:戴的一级码元是、田和共,的二级码元是十和戈,不再拆分。
夷:夷的一级码元是大和弓,大和弓的二级码元是一、人和コ、
Figure A20051003041800061
不能再拆分。
役:役的一级码元是彳和殳,彳和殳的二级码元是丿、亻和几、又,不能再拆分。
撼:撼的一级码元是扌和感,感的二级码元是咸和心,咸的三级码元是戌和口。
感:感的一级码元是咸和心,咸的二级码元是戌和口,戌的三级码元是戊和一。
咸:咸的一级码元是戌和口,戌的二级码元是戊和一,戊的三级码元是戈和丿。
戈:戈的一级码元是
Figure A20051003041800062
和丶,不再拆分。
从以上例举中可以看到,拆分层次一是看单字的简繁,有的单字不能拆分,有的单字只能拆分到一级码元;二是看单字的码元情况,如有两个可变码元的,不须拆分出三级码元;三是同样的码元,在不同的单字中,会是拆分后的不同层次的码元。
3、根据码元是否含发音元素将码元分为有音码元和无音码元:有读音的码元或根据名称音取码的码元为有音码元,如成字码元、同组有成字的甲类部首码元和部分同组无成字但根据名称音取码的乙类部首码元是有音码元。有名称但不根据名称音取码的乙类部首码元、无名称的乙类部首码元、一般码元和单笔码元是无音码元。有音码元和无音码元均数量众多,不单独例举,详见以下说明。
有的部首的名称虽有一些比较通行的说法,但没有统一的标准,本法只采用了少量的部首名称。有音码元拆分后的下级码元会有无音码元,反之无音码元拆分后的下级码元也会有有音码元。
二、单字和部件的拆分
单字和部件拆分的目的是要拆分出单笔以上的能独立取码的下级部件(如单笔以上的成字部件和部首部件),如拆分不出更小的能独立取码的下级部件的单字或部首则不再拆分而直接按笔顺取单笔码,如:部首廾、犭、衤和单字氏、毋、牙、门、豕、及、瓦等都直接取码。许多单字和部件按取码要求要进行一到三次拆分,拆分的原则是:能大则大、散优于连、连优于交,先小后大和兼顾完整。
(一)、能大则大、散优于连、连优于交能大则大要求每次拆分出的部件尽可能的大,即每次拆分出的部件尽可能的少;散优于连要求优先在离散处拆分部件,连优于交要求最后在相交处拆分部件。按要求进行拆分的单字例举如下:
捌先拆分成扌和别、别再拆分成另和刂,另最后拆分成口和力。
警先拆分成敬和言、言再拆分成亠、二、口。
氮先拆分成气和炎、气和炎再分别拆分成、一、乁 和火、火。
瘢先拆分成疒和般、般再拆分成舟和殳、殳最后拆分成几和又。
獭先拆分成犭和赖、赖再拆分成束和负、负最后拆分成产和贝。
砦先拆分成此和石、此再拆分成止和匕、止最后拆分成上和丨。
兢先拆分成克和克、两个克均再拆分成十和兄,即拆分成十、兄、十、兄。
韶先拆分成音和召、音和召分别再拆分成立、日和刀、口。
虞先拆分虍户和吴、虍和吴分别再拆分成
Figure A20051003041800071
七和口、天。
蟹先拆分成解和虫、解再拆分成角和刀、牛。
襻先拆分成衤和攀、攀再拆分成樊和手。
(二)、先小后大  单字中即既可以与先写的笔画或部件组成码元,又可与后写的笔画或部件组成码元的两可笔画和部件,按与后写的笔画或部件组成码元的原则进行拆分。按先小后大原则进行拆分的单字或部件例举如下:
夫:一次拆分成一和大,不拆分成二和人;大可在二次再拆分成一和人。
耒:一次拆分成一和未,不拆分成二和木;未可在二次再拆分成一和木。
:一次拆分成一和夫,不拆分成二和大;夫可在二次再拆分成一和大。
串:一次拆分成口和中,不拆分成吕和丨;中可在二次再拆分成口和丨。
交:一次拆分成亠和父,不拆分成六和乂;父可在二次再拆分成八和乂。
查:一次拆分成木和旦,不拆分成杳和一;旦可在二次再拆分成日和一。
(三)、兼顾完整  尽可能地拆分成完整的成字码元和部首码元,因连交一单笔而成的新独体单字拆分时先拆出连交的单笔。按兼顾完整原则拆分的单字例举如下:
东:一次拆分成七和小,小可在二次再拆分成亅和八。
垂:一次拆分成千、廿、一和一。
重:一次拆分成丿、一、申、一和一。
更:一次拆分成一、日和乂。
失:一次拆分成丿和夫,夫在二次再拆分成一和大,大在三次再拆分成一和人。
产:一次拆分成立和丿,立在二次再拆分成亠和或亠、丷和一。
严:一次拆分成亚和丿,亚在二次再拆分成一和业,业在三次再拆分成‖和。
百:一次拆分成一和白,自在二次再拆分成丿和日。
再:一次拆分成一和冉,冉在二次再拆分成冂和土。
三、码元的取码
(一)、有音码元的取码
1、成字码元的取码:一般取该码元读音的首个字母为码,对读音首个字母为Y的码元一分为二,i行韵母前面没有声母的成字码元改取I,ü行韵母前面没有声母的成字码元改取V。个别码元如已、巳、曰、士按指定字母为码,因已、巳、曰、士同为成字部首,为减少取码过程中的识别,分别取其同组高频成字部首己、日和土的代码为码,即己已巳/J、日曰/R、土士/T。因汉字数量众多,而日常使用的汉字有限,除成字部首外,本法中成字码元以通用字和国标码内的汉字为限。成字码元取码如:
垒=SSST(厶厶厶土)    鹆=BRKN(八人口鸟)  赢=WKVF(亡口月凡)
辑=QSKE(七十口耳)    朝=SRSV(十日十月)  毁=JGJI(臼工几又)
璐=WKZG(王口止各)    翰=SZRV(十早人羽)  腐=GFNR(广付内人)
嗓=KISM(口又双木)    戴=SGTG(十戈田共)  曜=RXXZ(日习习隹)
2、有音部首码元的取码:在《统一部首表二》与成字部首列为同组的甲类部首码元一般取同组成字码元读音的首个字母作代码,如:钅/金J、亻/人R、忄/心X、刂/刀D、讠/言I、虍/虎H、爫/爪Z等;为减少重码,少数甲类部首码元取同组成字码元读音的其它字母或名称音作代码,如艹、扌和氵改取同组成字码元草、手、水读音的韵母作代码,艹/A、扌/O、氵/U,阝按左耳、右耳名称中耳的读音取码,阝/E;个别取其它指定字母作代码,如纟取其首笔斜折笔的单笔码,纟/Y。少数同组无成字码元的乙类部首码元如疒、牜、囗和亠等取其名称音的字母作代码,疒、牜、卩分别按名称病、牛和单耳耳的读音取码,疒/B、牜/N、卩/E,囗按名称方框中的方的读音取码,囗/F,亠按名称文字头中的文的读音取码,亠/W;个别取其它指定字母作代码,如冫,因提笔归入横笔,将冫与亠定为同码,冫/W。有音部首码元取码如:
藻=AUPM(草水品木)    蹈=KZZJ(口止爪臼)    瘸=BJNR(病加内人)
悦=XBKE(心八口儿)    餐=DIRL(歹又人良)    挽=ODKE(手刀口儿)
鄙=KSHE(口十回耳)    糕=BMIH(八木羊火)    谟=IARD(言草日大)
锲=JFDD(金丰刀大)    涸=UFSK(水方十口)    绰YBRS(纟卜日十)
信=RWEK(人文二口)    郭=WKZE(文口子耳)    溏=UGVK(水广聿口)
许多辞书现都附有《统一部首表》。《统一部首表》中的有音部首说明见表二:
                     表二:有音部首代码说明表
Figure A20051003041800081
为便于使用将表二简化为表三:
                     表三:有音部首码元代码表
Figure A20051003041800082
要特别说明的是,以上表列部首只有少数是固定码元,取码时须取表列代码;多数部首是可变码元,如它们在单字中只取一码时,取表列代码,但在很多情况下,作为可变的部首码元不是取一码,因此要在拆分后取两码乃至三码,并不是取表列代码。以下叙述的其它部首码元和一般码元很多也是这种情况。
(二)、无音码元的取码
1、同组无成字的乙类部首码元的取码:如彐、宀、冖、廾、彑、夂、巛、彡、等四十个左右的乙类部首码元不论其是否有名称,均是无音码元,这些码元取该码元首部或末部所含的下级成字码元或所含的下级其它部首码元或所含的单笔的代码作代码,当这些码元不处于单字末部时取码元的首部笔形作代码,当这些码元处于单字末部时取码元的末部笔形作代码。如码元的首部代码和末部的代码分别是成字十的代码S和成字早的代码Z,部首码元夂的首部代码和末部代码分别是单笔丿的代码N和成字又的代码I,部首码元彑的首部代码是单笔ㄥ的代码Y、部首宀的代码是首部单笔丶的代码Q、部首码元冖的代码是首笔单笔丶的代码S、部首廾的首部代码和末部代码分别是首笔一的代码E和末笔丨的代码I等。单笔编码见第二页表一。
2、框形码元的取码  乙类码元中的囗、冂、凵、匚和一般码元中的コ本法定名为框形码元,除囗称方框定码为囗/F外,称冂为上框,定码为冂/S,称凵为下框,定码为凵/X,称匚为左框,定码为匚/Z,称コ为右框,定码为コ/I。
3、多数一般码元的取码:除成字码元、部首码元和单笔码元外的码元为一般码元,如癶、、、、
Figure A20051003041800091
、、
Figure A20051003041800092
Figure A20051003041800093
Figure A20051003041800094
Figure A20051003041800095
等,多数一般码元的取码方法与无音部首码元相同,如一般码元
Figure A20051003041800096
的首部代码和末部代码分别是成字日的代码R和成字十的代码S、一般码元
Figure A20051003041800097
的代码是部首艹的代码A、一般码元的代码是部首丷的代码B、一般码元的代码是部首代码X,一般码元癶的代码是单笔フ代码W。无音部首码元、框形码元和一般码元的取码如:
蹬=KZWD(口止癶豆)   剿=YRMD(巛日木刂)   糟=BMAR(丷木
Figure A20051003041800098
日)
撑=OXKS(扌口手)   蠢=ERCC(日虫虫)   跣=KZME(口止
Figure A20051003041800099
儿)
锛=JDSI(钅大十廾)   冥=SRWB(冖日亠八)   窘=QBIK(宀八尹口)
厦=CDZI(厂一自夂)   落=AUNK(艹氵夂口)   彝=YMMI(彑米糸廾)
医=ZMDD(匚丿一大)   筒=ZSAK(冂一口)   碉=SSTK(石冂土口)
涵=ULWX(氵了冫凵)   罐=WXAZ(午凵艹隹)   臣=ZHIH(匚丨コ丨)
4、个别一般码元的取码方法  一般码元中的因与丷形近,将与丷定为同码,/B;一般码元中的丅因与丁形近,将丅与丁定为同码,丅/D。个别码元取码如:
巫=DRRB(丅人人一)   所=CICD(コ丅)    语=IDXK(讠丅口)
倍=RRBK(亻亠口)   端=RBSE(亠山而)    塑=BCVT(
Figure A200510030418000910
月土)
为便于使用,将部首码元中的有音码元、框形码元和一般码元中的个别码元的代码汇总为表四:
         表四:有音部首码元、框形码元和特别一般码元代码汇总表
Figure A200510030418000911
5、单笔码元的取码  单笔码元的取码方法和例举见第二、三页单笔输入法简介。
四、单字、部件和字组的取码
所有单字均取四码,部件最多取三码。代码按笔顺排列,单字和部件的首码取在首笔或首部,次码随后,末码取在末笔或末部。因部件码少于单字码,拆分层次也会减少,因此相同笔形的单字取码和成字部件取码两者会有不同。单字按码元取码不足四码的加该单字读音的字母作辅助码,一般取读音首字母,首字母为Y的分取丨和V,仍不足四码时,再加该单字的结构代码作辅助码:左右结构代码是P(平)、上下结构代码是Z(直)、包围结构代码是W(围)、其余结构代码是V(余),以下各例中斜体字母均为辅助码。部件取码包含在单字取码中,不单独例举。
(一)、独部结构单字和部件的取码  独笔单字、双笔单字、笔画和部件紧密连交而不形成左右、上下、内外形态的单字均为独体结构的单字。独体结构单字的上方、内部或右上加一个单点以及独体结构单字连交一个笔画形成的新单字的也是独体结构的单字。独体结构的单字按笔顺取单笔或按拆分后的码元(包括可变码元)取码。固定码元自作单字时,首码取固定码元的码,再按笔顺取单笔或按拆分后的码元取码,不足四码加读音辅助码和结构辅助码。独体结构单字取码例举如下:
1、独笔单字:一=AAIV  乙=WWIV
2、连交单字:于=BCIV  及=NXVJ  吏=EKIL  车=QSCV  世=ABYS  豕=DPYU
             民=IYEY  冉=STRV   重=OCSB  事=CKII  臼=OBWE  夷=EIYR
3、带点单字:卞=QBBB  主=QWZV   方=QDXN  夕=DQXV  凡=JQFV  勺=NQSV
             户=QIMH  戍=EMQQ   犬=ERQQ  术=MQSV  书=XXIQ  戈=EYPQ
4、连交单笔单字:      矢=MDER   生=MCSB  百=DLRB  用=VIIV  再=BSTZ
             丙=DSRB  乏=LSWU   互=BYXB  朱=MCMZ  亚=BGGB  戌=EMAQ
5、固定码元单字:      二=EAAE   几=JNXJ  九=JMXJ  八=BLQB  匕=BOYB
             王=WBTW  口=KSBK   曰=RFBV  土=TSBT  士=TSBS  女=NYPE
(二)、双部结构单字和部件的取码:有两个大部分且形成左右、上下、内外形态的单字结构为双部结构(上下结构专指仅两个自然层次的上下结构),其中先写的部分称前部,后写的部分称后部。在每一个大的结构部分里,可能只有一个部件,也可能有几个部件。双部结构单字一般按前二后二均匀取码,因固定码元原因在某个部分只能取一码的,在另一个部分里取三码或按实际可能取码。双部结构部件取两码的按前一后一均匀取码,取码码元可能相应变大。双部结构单字取码例举如下:
1、左二右二:鲜=DABS  解=DIDN  释=OMIS  轼=QSIG  豁=QFBK  弦=IYWI
2、上二下二:皆=BBLR  覆=BKCF  粱=URBM  骛=MPWA  躁=KZPM  酸=XASI
3、内二外二:屏=IMBK  武=AISH  威=GMAN  氲=MARM  趣=TBEI  戴=SGTG
4、左一右三:碟=SNYM  练=YQXB  嘻=KJBK  球=WCSQ  随=EEVC  桁=MLRC
5、上一下三:泵=SGWU  薇=ACSP  杰=MUUU  兔=DKEQ  宦=QZHH  筱=ZRGP
6、内一外三:间=TGWR  栽=SEMQ  氖=MAWN  戎=EEYQ  赴=TBRB
7、左三右一:鹲=ASAN  剞=DDKD  部=WBKE  朗=QXYV  叙=RBMI  卸=WBHE
8、上三下一:婴=SRBN  磐=ZJIS  梁=URQM  兜=BOIE  势=OJVL  丞=LWPA
9、内三外一:癍=BWWW  訇=NWEK  逼=AKTC  质=CSSR  圈=FBFY  幽=HIIX
10、左一右二:洁=UTKJ 设=IJIS  任=ROTR  况=WKEK  怀=XDBH  听=KCDT
11、上一下二:介=RLGJ 字=QLCZ  市=WSIS  员=KSRV  笛=ZFSD  芒=AWYM
12、内一外二:老=TMBL 者=TMRZ  尼=IMBN  忒=EXQT  发=YIQF  龙=EBQL
13、左二右一:鸭=FSNI 饥=DYJJ  秋=OMHQ  卦=TTBG  轧=QSYG  刘=WIDL
14、上二下一:忍=DQXR 委=OMNW  丝=YYAS  咒=KKJZ  华=RBSH  焚=MMHF
15、内二外一:这=WICZ 同=SAKT  国=FWQG  匠=ZCDJ  左=EDBZ  匈=NIXX
16、左一右一:什=RSSP 灯=HDDP  奴=NINP  扎=OYZP  肚=VTDP  叹=KITP
17、上一下一:支=SIZZ 旦=RADZ  只=KBZZ  圣=ITSZ  杏=MKXZ  六=WBLZ
18、内一外一:凶=IXXW 凤=JIFW  厄=CYEW  旭=JRXW  庄=QTZW  田=FSTW
(三)、多层次上下结构单字的取码:双部上下结构单字中如有一部也是上下结构的单字和多部上中下结构的单字都是多层次上下结构的单字,多层次上下结构的单字按自然层次取码,不足四层的的单字按散优于连、连优于交的原则在能取两码的层次里取两码。多层次上下结构单字取码例举如下:
宴=QRNI  会=RESH  会=RESK  摹=ARD   蒙=ASAS  篡=ZMDS  翼=VTAB
器=KKQK  囊=CSKU  羹=BWHM  兽=BTAK  命=RAKE  密=QBHX  宽=QASE
各种结构中个别单字因是多音字而有两个读音辅助码并使单字有两个码,如上例中的会;此外,个别单字会因部件是多音部件而有两个部件码并使单字有两个码。
(四)、其它各种多部结构单字的取码:其它各种多部结构的单字包括左中右结构的单字、先写中座后写左右的对称结构的单字和特殊结构的单字,多部结构单字按部件的书写顺序取码,不足四部的单字按散优于连、连优于交的原则在能取两码的部件里取两码。多部结构单字取码例举如下:
渊=ULMG  鼎=FEYX  承=LSWU  斑=WWIW  微=CSAP  衙=LRWC  辩=LEIX
雠=RWIZ  乖=OSHB  乘=OMHB  爽=DIII  畿=IIGT  巫=DRRB  噩=DKKB
在本法中,相同的可变码元在不同的单字中会有不同数量的码,从以上例举中可以看出,同一单字中的相同可变码元,也可能有数量不同的码,如婴中的贝、雠中的隹、辩中的辛等,前一个贝被拆分成三级码元后取码,后一个贝是作为二级码元取码,前一个隹和辛被拆分成二级码元后取码,而后一个隹和辛是作为一级码元取码,这种情况在其它单字中也会发生,如:矗中的直、淼中的水、掇中的双、侈中的夕等。
(五)、繁体单字的取码:繁体字的取码方法与简体字的取码方法相同。为减少重码,同简体字取码一样,须将如金、言、鳥、糹等个别繁体高频码元设定为固定码元,金/J、言/I、鳥/N、糹/Y。繁体字取码例举如下:
亂=ZWSY  剛=SBSD  國=FGKA  倫=RRAA  墊=TBWT  寜=QXMH  德=LRSX
廬=GHTM  戰=KREQ  攏=OLVS  歷=CHHZ  氣=NABM  燒=HTTW  爲=LULH
爾=BBJI  犖=HHSN  畝=WTDU  盧=BQTM  禦=CXEX  綫=YEQG  綴=YIIS
職=DIWG  耬=CWKN  華=ABAS  虧=HZAY  衝=LRCC  衝=LRZC  覬=SDME
議=IBWW  賀=LKMB  車=CRSC  選=JJGC  鏟=JLMS  鐵=JSKW  愛=ZSXI
門=XHXB  靈=VKKW  飛=WPPU  獻=HLDQ  騁=BHIY  鯠=DHMR  鷄=ZIDN
例中的衝,因部件重是多音部件从而有两个部件码并使单字有两个码。
(六)、单字的手机输入:单字手机输入无须另记数字代码,只要根据电话按键上的字母标记按相应的数字键,如:ABC/2、DEF/3、GHI/4、JKL/5等,本法就能用于手机等通信工具的汉字输入。手机单字输入例举如下:
一=AAIV=2248  及=NXVJ=6985  卞=QBBB=7222  鲜=DABS=3227  皆=BBLR=2257
屏=IMBK=4625  碟=SNYM=7696  洁=UTKJ=8855  鸭=RINI=7464  这=WICZ=9429
凶=IXXW=4999  宴=QRNI=7764  赢=WKVF=9583  水=GWPU=4978  雠=RWIZ=7949
(七)、字组的取码:字组中单字取两码或取一码。单字取两码的方法是:双部单字在每部取码,多部单字在前二部取码,独部单字取前两个单笔码或在拆分后取两码,因单字最多拆分一次,故所取码与单字前两码可能不同。单字取一码是取读音的码。字组取码的方法是:双字字组每字各取两码,三字字组首字取两码、后两字各取一码,四字字组每字各取一码,四字以上字组前三字和最后字各取一码。例举如下:
1、两字字组:科学=HDUS  技术=OZMQ  第一=ZGAA  专利=EYHD  国家=FVQS
             知识=SKIZ  产权=LMMI  生产=NBLM  输入=CVRP  编码=YBSM
2、三字字组:生产力=NBCL  计算机=ISSJ  专利局=EYLJ  输入法=CVRF
3、四字字组:科学技术=KXJS  知识产权=ZSCQ  专利申请=ZLSQ
4、多字字组:科学技术是第一生产力=KXJL  国家知识产权局=GJZJ

Claims (3)

1、一种以码元为主的编码汉字输入法,使用的是拼音字母键盘或标有字母的键盘,将完成的编码用按键向计算机或手机等信息工具输入;其技术特征是将汉字的码元分成不含下级码元而只能取一码的固定码元和含下级码元可以取一码或数码的可变码元,固定码元包括所有的单笔码元、双笔的成字码元、双笔的部首码元、双笔连交的一般码元以及艹、疒、辶、虫、囗、广、火、钅、己、已、巳、口、木、女、扌、宀、日、曰、石、土、士、氵、月、王、忄、心、纟、等二十八个多笔的成字码元和部首码元,可变码元包括所有双笔离散的一般码元和多笔的其它码元;在码元中,将直接组成单字的码元定为一级码元、将组成一级码元的码元定为二级码元、将组成二级码元的码元定为三级码元,按笔顺用一级码元对单字进行编码,如一级码元取码数不足的,将含有二级码元的一级码元改用二级码元进行编码,取码数仍不足的,将含有三级码元的二级码元改用三级码元进行编码;码元中的多数成字码元取其读音的首个字母作代码,对读音首个字母为Y的码元一分为二,分别对i行韵母前面没有声母的成字码元和ü行韵母前面没有声母的成字码元改取I和V,成字码元已、巳取字母J作代码,即已巳/J,成字码元曰取字母R作代码,即曰/R,成字码元士取字母T作代码,即士/T;码元中的部首码元以列入《统一部首表》的码元为准,其中同组有成字部首的部首码元多数取其同组的成字码元的代码作代码,部首码元艹、扌和氵分别取其同组成字码元读音中的韵母A、O、U作代码,即艹/A、扌/O、氵/U,部首码元阝取其名称音中的字母E作代码,即阝/E,部首码元纟取其首笔斜折笔代码Y作代码,即纟/Y,码元中的多数同组无成字的部首码元取该码元首部或末部所含的下级成字码元或所含的下级其它部首码元或所含的单笔的代码作代码,部首码元疒、卩、囗、牜和亠分别取其名称音中的字母B、E、F、N和W作代码,即疒/B、卩/E、囗/F、牜/N、亠/W,部首码元冫取字母W作代码,即冫/W,框形部首码元冂、凵、匚分别取字母S、X和Z作代码,即冂/S、凵/X、匚/Z;码元中的多数一般码元取该码元首部或末部所含的下级成字码元或所含的下级其它部首码元或所含的单笔的代码作代码,一般码元和丅分别取字母B、D作代码,即/B、丅/D,一般码元コ取字母I作代码,即コ/I;码元中的单笔码元以单笔代码作代码。
2、如权利要求1所述的码元代码,其特征在于根据单字的不同结构,按笔顺用四个代码对单字进行编码:独体结构的单字取单笔码或按拆分后的码元取码,固定码元自作单字时,首码取该固定码元的码,再取单笔码或按拆分后的码元取码;双部结构的单字一般按前(先写的部分)二后(后写的部分)二均匀取码,因固定码元的原因在某个部分只能取一码的,在另一部分里取三码或按实际可能取码;多层次上下结构的单字按自然层次取码,不足四层的单字按散优于连、连优于交的原则在能取两码的层次取两码;多部结构的单字按部件的书写顺序取码,不足四部的单字按散优于连、连优于交的原则在能取两码的部件取两码。
3、如权利要求1或2所述的码元代码和单字编码,其特征在于单字用码元取码不足四码时,加该单字读音的字母作辅助码,仍不足四码时,再加该单字的结构代码作辅助码,多数单字的读音辅助码是该字读音的首个字母,对读音首个字母为Y的单字一分为二,分别对i行韵母前面没有声母的单字和ü行韵母前面没有声母的单字改取I和V,单字左右结构的代码是P(平)、上下结构的代码是Z(直)、包围(内外)结构的代码是W(围)、其余结构的代码是V(余)。
CN 200510030418 2005-10-12 2005-10-12 三级码元输入法 Withdrawn CN1749929A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200510030418 CN1749929A (zh) 2005-10-12 2005-10-12 三级码元输入法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200510030418 CN1749929A (zh) 2005-10-12 2005-10-12 三级码元输入法

Publications (1)

Publication Number Publication Date
CN1749929A true CN1749929A (zh) 2006-03-22

Family

ID=36605403

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200510030418 Withdrawn CN1749929A (zh) 2005-10-12 2005-10-12 三级码元输入法

Country Status (1)

Country Link
CN (1) CN1749929A (zh)

Similar Documents

Publication Publication Date Title
CN1019424B (zh) 音形笔画综合编码汉字高速输入法及所用键盘
CN1749929A (zh) 三级码元输入法
CN1295588C (zh) 汉字输入方法
CN101051246A (zh) 一种计算机键盘形象码汉字编码输入法
CN1166997C (zh) 汉字免拆分快速输入法
CN1101568C (zh) 计算机汉字输入方法及其键盘
CN100342310C (zh) 二分汉字编码小键盘输入及其显示方法
CN1054447C (zh) 计算机汉字输入坐标码编码方法
CN1825255A (zh) 和码汉字形码输入法及其单手键盘
CN1086480C (zh) 计算机汉字音形意自然编码键盘输入法
CN1269008C (zh) 十二键汉字数字键盘及六维三段笔画部件码汉字输入法
CN1195260C (zh) 一种用数字键对汉字进行输入的方法
CN1111776C (zh) 音形码中文键盘及其输入法
CN1317630C (zh) 笔画汉字输入法
CN1310373A (zh) “33家庭中文字母”输入法及其装置
CN1467614A (zh) “三合一”汉字编码及键盘输入法
CN1841365A (zh) 段码中文输入法
CN1434371A (zh) 一种使用数字键盘的汉字输入方法
CN1841278A (zh) 双联码免拆高效汉字输入技术
CN1204482C (zh) 三笔象形码输入法
CN1079061A (zh) 计算机汉字部首代码输入法
CN100339807C (zh) 汉语通信码简易输入法
CN1655101A (zh) 整体拼形汉字输入法
CN1295589C (zh) 无根码汉字输入法
CN1975640A (zh) 规范应用汉语拼音方案的汉字输入法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C04 Withdrawal of patent application after publication (patent law 2001)
WW01 Invention patent application withdrawn after publication