CN1136493C - 一种汉字输入方法 - Google Patents

一种汉字输入方法 Download PDF

Info

Publication number
CN1136493C
CN1136493C CNB991026225A CN99102622A CN1136493C CN 1136493 C CN1136493 C CN 1136493C CN B991026225 A CNB991026225 A CN B991026225A CN 99102622 A CN99102622 A CN 99102622A CN 1136493 C CN1136493 C CN 1136493C
Authority
CN
China
Prior art keywords
word
root
code
sign indicating
indicating number
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB991026225A
Other languages
English (en)
Other versions
CN1229208A (zh
Inventor
赵明辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CNB991026225A priority Critical patent/CN1136493C/zh
Publication of CN1229208A publication Critical patent/CN1229208A/zh
Application granted granted Critical
Publication of CN1136493C publication Critical patent/CN1136493C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本发明涉及一种汉字拼形码输入方法,它利用汉字中根字的读音以及根旁名称或笔画读音,以声拼形来输入汉字,它有拆字到根字为止,独体字不拆分,码长相等,重码率为零的优点。

Description

一种汉字输入方法
本发明涉及汉字拼形码输入方法。
目前汉字编码方案千花竞放,但概括起来只有四类:拼形码、拼音码、音形码、序号码。其中拼形码方案占绝对多数,众多的拼形码方案基本上都是以形拼形,郁困在笔画、笔形、偏旁、部首、部件、结构类型等字形信息的圈子里,因此无论哪种构件编码,由于与键符都没有直观和有规律的对应关系,都需要人为规定,所以这些拼形码均需要专门学习、记忆,甚至专门训练,这大大限制了计算机汉字的普及应用。拼音编码只要学过汉语拼音几乎不用再学习,便可以输入,但由于输入速度慢,且遇到生字就无法输入,故也难以普及应用。
本发明的目的在于发明一种既容易学,又打得快的汉字输入方法。
本发明是这样实现的:将汉字分为四个层次,一是笔画,二是偏旁,三是根字,四是一般汉字;
一、笔画的取码见表1:
          汉字基本笔画及取码表    表1
表中取码为各笔画名称读音的声母;
二、无名旁取码见表2:
           无名旁取码表           表2
Figure C9910262200102
Figure C9910262200111
表2为无名旁取码表,大部分无名旁只需要取单码,这个单码就是无名旁的首笔画码,少数无名旁需要取双码,即首、末笔画码。
三、偏旁部首取码见表3
               偏旁部首取码表           表3
Figure C9910262200112
表4中前四个偏旁部首没有名称,它们是按形取码的,如“彐、 ”因形似字母“E”而取码,“”因形似古汉字“中”(音CAO)而取码,“ㄨ”则因酷似字母“X”而取码,这几个名旁应属于从无名旁向名旁过渡性质偏旁,它们与无名旁取码上的区别为首码不是笔画码,但后面的笔画码取码却似无名旁,具有不确定性。如“”偏旁,在取三码时,除首码外,再选取首、末笔画码,如需取四码,除首码外,再选取首、末前、末笔画码,所以,前三个偏旁部首只取两码,后面的码,酌情选取相应的笔画码,在绝大多数情况下,一般偏旁部首,只要有两码就够用了,接下来的27个偏旁部首按名称只取首码,后面是笔画码,按首、末前、末笔画的顺序依次排列,其中“宀”是取“盖”字声母代码,“ 刂”是取“刀”字声母为代码,“艹、廾”是取“草”字韵母中第一个字母为代码,“扌”是取“手”字韵母中第一个字母为代码,其余21个偏旁部首都是取各自名称第一个字的声母为代码,再往后的22个偏旁部首都是按规定取双码,后面的两码是首/末笔画码。其中前十个偏旁部首的首码是按各自名称的首字或次字声母取的,次码则是按各自的内含名旁取的。如:“歺”含“夕”,“虍”含“七”,“年"含“”,“
Figure C9910262200122
”含“刀”,“丬”含“冫”,“纟”含“一”,“氺”含“冫”,“
Figure C9910262200123
”含“厂”,“攵”含“乂”,“夂”含“又”,“丷”和“”是将各自的关联字音八(BA)、小(XO)倒过来,韵母在前、声母在后取的前两码,“彑””也是将其关联字音“互”声韵倒置取的前两码,“囗”介于偏旁部首与汉字之间,它是古字“国”,现一般称为方框,“囗”按“方”、“国”二字声母取前两码,“衤”俗称“布衣旁”,本方案取其名称前二字声母为首次码,“礻”和“罒”所对应的汉字都不是根字,故改换新名称,再各取前二字声母为首次码,余下的四个应属于名旁组了,“”由“丷”和“一”组合而成,“
Figure C9910262200125
”由“
Figure C9910262200126
”和“”组合而成,“
Figure C9910262200127
”由“冂”和“丶”组合而成,“ ”由“”和“丶”组合而成,故各分取两部分的首码依次排列而做为首次码,再往下,是按规定取三码的四个复部首,末码则取首笔画码,首码取各自名称的首字声母,次码则是在各部首内含多个名旁中选笔画多者,而不是按顺序,取次码后,再按偏旁的顺序取码,凡复部首取码均遵循这个原则,故“”部首的次码按“止”取码,最后的12个偏旁部首首码都是笔画码了,单笔画“丶”、“丿”、“丨”在取笔画读音声母为首码后,后三码均补字母“O”,三个钩笔画均取“G”为首码,后面再按各自名称另二字读音声母取码,本方案规定,凡偏旁首其名称冠以数字三、四的,其首码均按首笔画取码,后面是其它笔画码,只有“氵”是按其首笔画读音点(DIW)取韵母第一个字母为首码,也算是按首笔画取码,后面是其它笔画码,由于首笔画声母未用,所以首笔画声母为次码,这是“氵”取码较特殊之处,最后一个偏旁部首,“饣”取码特殊,这是因为在字符集拓展后,“食字旁”有四种形态“饣、食、飠、 ”,为了使这几个部首使用同一个首码,根据这几个部首的共同特点,首笔画相同,故取首笔画为首码。
本方案规定主部首(按书写顺序位于字首,且处于指定位置,并有规定高度或宽度的部首)取单码见表4:
            主部首取码表    表4
名称 形体 代码 名称 形体 代码
草字头   A 提手旁     扌     O
病字旁   B 食字旁     饣     P
虫字旁   C 犬字旁     犭     Q
石字旁   D 日字旁     日     R
山字旁   E 绞丝旁     纟     S
方字旁   F 士字旁     士     S
宝字盖   G 土字旁     十     T
火字旁   H 木字旁     木     U
三点水   I 月字旁     月     V
金字旁   J 王字旁     王     W
口字旁   K 心字旁     忄     X
立人旁   L 言字旁     讠     Y
目字旁   M 竹字头          Z
女字旁   N
副部首(位于字首,如果不是主部首,就是副部首)的取码,属于无名旁的按无名旁取码,属于偏旁部首的按偏旁部首取码,属于根字的按根字取码。
四、根字的取码方法有下面七种:(1)多声码既多音根字的取码见表5:
     多声码表        表5
  读音 形体 代码
BO      BU BOUB
CI      CE CIEC
DA      DAI DAAI
LE      LIO LEIO
ZUA     ZAO ZUAA
CA      ZA CZPD
CE      JV CJHS
LE      VE LVPD
MOU     SI MSZD
NIE     MIE NMZZ
ZO      CO ZCPH
DW  CW  SW DCSD
DW      SI DKSH
 CA     ZA   镸 CMZH
表中前五个多首根字是同声异韵根字,其取码方法是:共同声母为首码,两个韵母依次排列于后,够四码即将多余字母略去,不够四码末码仍为共同声母,接下来的六个多音根字是异声根字,取码方法为前后两字音的声母依次排列,后两码是首末笔画码,“单”字是将三个字音声母依次排列,末码为首笔画码,“石”字和“镸”字首码为前字音声母,次码为内含名旁声母(“石”含“口”名旁,故次码为“K”;“镸”含“厶”故次码为“M”),末前码为后字音声母,末码为首笔画码,可以看出,异声根字不取韵母码。
(2)本声码,即按根字本来读音所取的码见表6:
                本声码表         表6
从表中可以看出,本声根字取码方法非常简单,字音码在前、笔画码在后,补足四码即可,本声根字一般是独体字或无名旁字,表中前边57个根字首码为字音声母,次码为字音韵母,后面两码为首末笔画码,接下来的17个根字首码为字音声母,次码和末码为字音复韵母,末码为首笔画码,最后11个根字是单字母音节,首码为字音码,后面三码为首、末前、末笔画码,本声根字共85个,只要掌握了这些根字的读音,取码就不成问题,反之,不掌握根字的读音,从取码表中也可找出字音。
(3)、内声码见表7:
                 内声码表            表7 从表中可以看出:内声码取码方法也很简单,首码为其对应根字读音声母,次码为该根字内含名旁读音声母或名称读音声母,后面两码为该根字韵母,在对应根字为单韵母时,末码补首笔画码,前81个根字都是双字母音节,用首码(声母)和末前码(单韵母)可拼出该根字读音,因不足四码,末码补首笔画码,接下来的24个根字是复韵母音节,用首码(声母)与末前、末码(二码合成复韵母)可拼出该根字读音,最后的5个根字是单字母音节,故首码为字音,次码为内含名旁声母,末前、末码为首末笔画码,内声码表中根字右边的括号内,是该根字所含的名旁,次码是根据根字所含名旁而取的,内声根字中的名旁只取单码,这一点在取码中需要注意。
(4)、近声码(双向近声和单向近声码)见表8、表9:
           双向近声码表            表8
Figure C9910262200152
Figure C9910262200161
表8中前46组形近根字的取码特点是:其代码由双音组成,首末二码为本根字读音,中间二码为形近根字读音,每组两个形近根字的代码由相同的四个字母组成,只不过顺序不同。接下来的17组形近根字的共同特点是:横线左边为单韵母根字,横线右边为复韵母根字。故左边的根字只取声母码,后三码为形近根字读音;而右边的根字首码为本根字声母,次码和末前码为形近根字读音,末码为本根字复韵母中的第一个字母,如“见——贝”,“见”字代码为“JBEI”,首码为“见”字声母,后三码为形近根字“贝”读音;而“贝”取码为“BJWE”,首码为“贝”字声母,次码和末前码为形近根字“见”读音,末码为“贝”字复韵母“EI”中的第一个字母。“丐——丐”与“犬——太”取码规则相同,故不赘述,最后8组形近根字因各有一个根字是单字母音节,双音码凑不够四码时,就需要首笔画码补足,当本根字为单字母音节时,末码无韵母可取,故末码用首笔画码,当形近根字为单字母音节时,末前码无韵母可取,故末前码取首笔画码,“卬、予、聿”三个根字不用笔画码,是由于它们的形近根字都是复韵母根字。
        单向近声码表            表9
Figure C9910262200162
市(币) SZAI 世(廿) SNIW 勺(勹) SBPA
兀(儿) WERU 二(一) EIHR
在表9中,形体栏中左边的字为取码根字,括号内的根字或名旁是形近根字或形近名旁,是取码根字取码的根据,表中前38个取码根字取码方法与双向近声码相同,只是后12个近声根字取码方法有些不同,“幺”和“也”的形近根字都是多音根字,取码方法是首末码为取码根字读音,中间二码为多音根字的两个声母。最后10个取码根字的特别之处在于它们都是依据形近名旁取码的,其取码方法是:首末码为取码根字声韵母,形近名旁取单码做为次码,末前码为取码根字的首笔画码。
(5)、同声码见表10:
         同声码表           表10
 代码 形近根字 代码 形体 代码 形体 代码
 CAIU 才——寸 CUNA 北(匕) BEII 百(白) BBAI
 CUWW 串——丳 CWUW 庚(广) GEAG 义(乂) IIDD
 JEVE 孑——孓 JVEE 灰(火) HVOH 甬(用) OOZS
 LAIE 来——耒 LEIA 可(口) KEOU 上(丄) SSAS
 PANP 乓——乒 PNAP 眉(目) MEIU 下(丅) XXAH
 PIWW 片——爿 PWIW 丧(十) SAIS 友(又) YYUH
 REUR 人——入 RUER 声(士) SEIS
 SHIY 师——帅 SYIS 隶(冫) LIDL
 YHAE 亚——业 YEAY
 ZHEI 正——止 ZIEZ 严(亚) YPWA
同声码本应分别属于内声码或近声码,但由于情况特殊,取码方法也不同,所以把它们归为一类。
所谓同声码,是指在取内声码或近声码时,取码根字的声母与内含名旁或形近根字的声母相同,如“庚”字,其内含名旁“广”与“庚”字声母相同;又如“才”与“寸”互为形近根字,它们声母相同,这些取码根字叫同声根字,同声根字所取的码叫同声码。再如“百”字,与形近根字“白”不仅声母相同,韵母也相同,故“百”字叫做同音根字,“百字所取的码叫同音码。因同音码数量很少,故归入同声码表中。
表10中左栏为双向近同声码,中栏“严”字为单向近同声码,“严”字上边都是内同声码,右栏为同音码。
近同声码与内同声码取码规则相同:首码为共同声母,本韵母在前,内近声韵母在后,依次排列,够四码即略去多余字母,不够四码者,补上一个共同声母为末码。如“才——寸”互为形近根字,“才”字取码为“CAIU”,“寸”字取码为“CUNA”,前三码为取码字读音,末码为形近根字韵母,多余的一个字母略去。又如“声”字取码为“SEIS”,前两码是“声”字读音,末前码为内含“士”字韵母,因不够四码,再补一个共同声母,后两码倒着拼是内含“士”字读音。再如“隶”字取码“LIDL”,前两码为本字读音,后两码倒着读就是内含名旁“两点水”的前二字声母。
其中“师、亚、正、严”四个根字取码特殊,因这四个字既是同声根字,又是近声根字,又可算做内声根字,三重身份,其取码特殊之点在于次码为笔画码。这个笔画码不是首、末等笔画,而是这四个根字与其形近根字相区别的笔画码,前三字与形近根字的区别笔画为横,“严”字与“亚”字区别笔画为“撇”。这四个根字首码仍为共同声母,区别笔画码为次码;取码根字韵母和形近根字韵母按顺序为末前、末码。
右栏同音码取码规则为:前两码为共同声母,后面是共同韵母(只取一次),不够四码则补首笔画码。单字母音节“义”、“甬”二根字按音只能取前两码,后两码则补首、末笔画码。
(6)、特殊码见表11:
        特殊码表             表11
Figure C9910262200181
特殊码是根字按特殊规则所取的码,取特殊码的根字共有32个,其中有一般根字,但大多为特殊根字,有些特殊根字并不取特殊码,所以特殊码的判定主要看取码规则是否特殊,表11中前三个根字是一般根字,其中“衣”字为常用部首,前面已介绍过其取码,“木”字取码在主部首取码中也讲过,“木”字取码应属于本声码,只不过是声韵倒置,后两码是首末笔画码,“山”字按形取首码,再仿照近声码取形近根字“凵”的读音为次、末前码,末码取“山”字声母,将“山”字取码“EQWS”后两码倒着拼,正好是“山”字读音。
除去三个一般根字,其余取特殊码的都是特殊根字了,前20个特殊根字取码规则为:本字读音声母为首码,次码则是在多个名旁中选笔画多者,取其读音声母为次码。四笔画以上者仍按四画计算,几个相同名旁可以算做一个复名旁,笔画加在一起计算,笔画相同者按顺序选用。在特殊根字后的括号内是我们所选用的名旁或名旁组,取完前两码后,再按顺序取首末偏旁码(名旁与无名旁一样对待)。
接下来的六个特殊根字有一共同特点,就是首偏旁首码与整字读音声母相同。在这种情况下,首偏旁代码与整字声母合二为一,次码不再选名旁码,直接按顺序取偏旁码即可。不够四码,即取整字读音韵母,仍不够四码,再取首笔画码。如“和”字首码“H”代表整字声母和首偏旁代码,次码只能取“口”偏旁代码“K”了,不够四码,无偏旁码可取了,只好取整字韵母“E”,仍不够四码,再取首笔画码“P”,故“和”字取码为“HKEP”。
最后三个含复部首根字编码规则是:整字读音声母为首码,首笔画码为次码,复部首读音声母为末前码,末码为整字读音韵母,“殷”字为单字母音节,无韵母可取,末码则取末笔画码(因首笔画码已用过)。
(7)、变形码见表12:
       变形码表            表12
Figure C9910262200191
变形码是指变形根字所取的码,根字在参与组字时,由于所处位置的不同,常常发生一些变形。变形根字本来数量不小,但许多变形根字都是单笔画变形,且变形后笔画名称并不改变。我们说的笔画名称,是指五种基本笔画。如“子”字做为副部首时常变形为“孑”,“横”画变为“提”笔画,像这样不改变笔画名称的变形,一般并不做为变形字处理。类似的情况还有“点”画和“捺”画的互变,“竖钩”和“竖”画的互变等等,凡在笔画名称内的变形,仍按原根字取码。
五、一般汉字的取码。
(一)、几点说明:
1、根字与根旁。
一般汉字拆分后,拆出来的字则称为根字,拆出来的不成字的部分则称为根旁,根旁包括一些无名旁,偏旁部首,对于拆出的根字或根旁,在取码中一视同仁。
2、根顺。
根字和根旁都可以简称为根。它们在书写中的先后顺序称为根顺,在书写一般汉字时,不见得是写完一个根再写下一个根,例如“臧”字可分为“戈、爿、臣”三个根,而书写时,先写“戈”字的一横,接着就写变形根字“爿”,再写“臣”字,最后写“戈”字的后三个笔画。在判断根顺时,应按各根第一笔画的书写顺序为根顺。据此规定,“戈”字应为首根。
3、冗余偏旁和冗余根。
在汉字的偏旁系列中,并非每个偏旁均属必要信息。例如偏旁系列“口、囗、犬、口、囗”中,省略任何一个“口”时,我们都还可以认定这个字还是“器”字,因此对于认知“器”而言,任何一个角上的单个“口”都可以是冗余的。为了编码的需要,本方案规定:像“器、嚣”这样四个角上均为同一偏旁的右上角那个偏旁为冗余偏旁。对冗余偏旁不取码,如“器”取码为“KQKK”。
汉字接含根的多少,又可分为单根字,双根字、三根字、四根字和多根字,不用说,单根字就是根字,因本码最大码长为四码,故多根字中含有冗余根。象“器”字中的冗余偏旁也属于冗余根。
(二)、一般汉字的取码。
1、双根字的取码。
含主部首的双根字,主部首取单码作首码,其余三码由后根取。如“你”字,“亻”取“L”,“尔”字全码为“EXRP”,取主部首码“L”和“尔”字前三码,故“你”字取码“LEXR”。含副部首的双根字,先取两根的首码为整字的前两码,再取两根的次码为整字的后两码。如“财”字,取码为“BCJA”,“贝”字取码为“BJWE”,“才”即字取码为“CAIU”,“财"字的前两码为“贝”字和“才”字的首码,“财”字的后两码为“贝”字和“才”字的次码。
2、三根字的取码。
含主部首的三根字,三根各取首码后,再取末根的次码为整字的末码。如“蜢”字取码为“CZMX”,前三码为三个根的首码,末码是末根“皿”的次码。
含副部首的三根字,三根各取首码后,再取副部首的次码为整字的末码,如“联”字取码为“EATR”,前三码为“耳、并、天”三根的首码,末码为副部首“耳”的次码。
3、四根字的取码。
对于四根字,不必区分首根是主部首或副部首,依次序取各根的首码即可,如“醌”字取码为“YRBB”,为四个根“酉、日、比、匕、”的首码依次排列。又如:“瞟”字拆分为四个根“目、西、二、小”各取首码,“瞟”字取码为“MXEX”。
4、多根字的取码。
对于多根字,也不必区分首根是主部首还是副部首,只要对前二根和后二根依顺序取首码做为整字的编码,即“前二后二”。如“嚷”字拆分为“口、一、口、口、 刀六个根,中间的两个“口”根不取码,前后四个根各取首码,故“嚷”字取码为“KDHP”。又如:“微”字拆分为“彳、山、一、几、又”,中间的“一”根不取码,故“微”字取码为“CEJW”。多根字中间不取码的根称为冗余根。
(三)、需要拆开的常见根组合。
为了方便用户取码,这里将一些根组合的拆分讲一下。所谓根组合是指某些复笔组字结构,实际上是由两个根组合在一起的。因为本码对复笔交叉结构一律不拆分,故根组合仅指粘连在一起的两个根,在取码时应拆开分别取码。如:“
Figure C9910262200213
”应拆分为“丿”和“刀’’,“”应拆分为“小”和“丶”,“
Figure C9910262200214
”应拆分为“丿”和“口”,“
Figure C9910262200215
”应拆分为“丿”和“罒”,“
Figure C9910262200216
”应拆分为“口”和“ ”,“ ”应拆分为“干”和“”,“
Figure C9910262200218
”应拆分为“丷”和“丅”,“ ”应拆分为“一"和“
Figure C99102622002110
”,
Figure C99102622002111
应拆分为“
Figure C99102622002112
”和“丶”。这些根组合拆开后,只有“ ”是无名旁,其余都是名旁,给取码带来了方便。
本发明与现有技术相比具有下列优点:1)本发明使用26个英文字母作码,最长码长为4个,单字静态重码率在使用简码后降为零,实现了一字一码;2)本码对独体字不拆分,对交叉复笔结构不拆分,这符合语文教学规范,符合人们的拆字习惯,拆分到根字为止,容易学习和掌握;3)本发明虽为形码,但充分利用了根字字音,以声拼形,编码单元直接转换为键符,基本上丢掉了笔画,直接输入取码快捷,输入方便;4)本码可简称为文声码,用文之声来组字之形,就一般汉字而言可以做到见字识码,就根字而言,可以做到既见字识码,又可以见码识字;5)由于采用模糊拼音(见表13),所以会不会讲普通话都可以正确输入;6)本发明是汉字文化的继承和发扬,它更新或提出了一些概念,在构字基本单元上取得了突破;7)本发明适合于中小学的识字教育,适合于不同层次的用户,适合于全国统一使用。
        模糊拼音韵母表          表13
I u  v(u)
a ia ua
  o o(uo)
  e ie  ve(ue)
  ai y(uai)
  ei vi(uei)
  ao io(iao)
  ou iu(iou)
  w(an) iw(ian) uw(uan)  vw(uan)
  e(en) n(in) uen  vn(un)
  a(ang) a(iang) a(uang)
  e(eng) n(ing) ue(ueng)
  o(ong) o(iong)
下面对本发明进行详细说明。
据小字符集统计,本方案静态重码率约为2.1%,在使用简码后,不再有重码。
使用简码可以减少击键次数,提高输入速度,做到一字一码,不用屏幕选字,适合进行盲打。在本方案中,每个汉字的全码均为四个字母。在小字符集中有5100多汉字,除可按其全码输入外,还可以只取前边的1~3个码,再加空格键输入,也就是说,只取其全码最前边的1个、2个或3个码输入,这就是一、二、三级简码。
一级简码:爱(A)不(B)长(C)的(D)而(E)方(F)工(G)和(H)一(I)就(J)可(K)了(L)民(M)年(N)用(O)平(P)去(Q)人(R)是(S)同(T)木(U)为(V)我(W)下(X)有(Y)在(Z)
二级简码见表14:
          二级简码汉字表    表14
 A B C D   E F G H   I J K L   M N O P   Q R S T   N V W   X Y ZA蒴益逆节  萨曾苦萎  落芹并花  茅茹菝苹  获草药关  菘前美  苑英道B八百财分  北叛贮颖  登布够办  本丙痛被  表白包痹  襟背半  必袖还C才原行刺  承辅很德  尺车辑产  盛蚓虫彼  出得仄压  寸律成  急顺过D大死单列  奈卷硬砸  电确高刀  育鸱东段  歼碍奔学  碴硼冬  离紧达E联陶阵陈  际防限灵  二儿阿障  动耍峭陂  山阶神社  崧阴隆  示随耻F罾负团因  四罪飞弗  园非回署    囡      罢囚艳夫  困国放  风发置G宽共广应  更靠宏塞  完既或府  鬼度果察  干个家实  磨骨故  恭定造H匿秘稳利  称房秆秋    所积烂  私委火稠  租香乘南  互散医  区黄种I满衣源滴  岛游式淡  义染河滚  到浓消派  法以没深  漆津海  已变注J兼见斤交  几夹金巨  及钱含今  盏鸭角幡  击旭己钢  久钥九  错颊进K哎员虽型  啊咽哄呼  嘎开号别  看哪口形  器唱叶吐  呆味吃  响叹唯L来六立力  你傅便化  里决部使  们件倘任  次都修佳  新乐减  像他作M毛粉闭料  门眨眼面  马闸问米  闯数瞠    精间闹免  亲能母  闷他作N乃内娠嫡  那妨引妒  鸟嫌如娘  始奶农殷  姐肉牲特    女物  牺她好O描把扭报  当排按护  捣折搞拉  抬挪挡换  插担提党  揸削热  控抽通P饼饱蚀鬈  祭饭馆灸  后饥  髹  么妆  饪  然馒装周  馇胥饰  将系延Q猎七独切  且氤千氮  裘斯乱求  县妻  丘  欺欠其基  猹期气  犯素迁R昂歇时照  会曼舒灵  命暇  暗  晚  晃    睛从早晕  入日全  创显昨S少色导统  三失生师  丝级喜史  术世手绸  组朝上带  书水整  十题经T增坏军垮  坛天土堰  冠块坑境  埃  头坡  太界堤封  屯写略  思地场U模构村杰  标板根核  桓机朽栏  相枕档杉  棋检桔杜  林棚格  攀样枝V脱肥震服  月肤于雨  与建肮零  未脓肪禹  脚胆胜鱼  霜朋玉  危预违W弄处珊知  瑞万瑰舞  文现各理  每午琐玻  缺复戚备  五王斑  忽无这X乡心惭夕  先窥象恢  记快向习  血要小窗  情容性尘  杀懦教  多西选Y说页对养  业房谋亚  议讲右夜  着也育严  请论计由  又诡许  恶友难Z丈些重制  争之左正  直子足符  自妥中支  自再般等  专主政  怎笑截
三级简码有4400多个汉字,其表略。
六、词语编码:(1)两字词编码:每字取其全码的前两码,共4码组成一组词语编码。例如:“歌唱”编码为“KKKR”,“天气”取码为“TFQW”,“爱国”取码为“AZFV”。词语编码的前两码为首字编码的首次码,后两码为末字的首次码。如遇一级简码字(如爱字)参与组词时,要从其全码中取前两码。(2)三字词编码:前两字各取其首码,最后一字取它的首次码,依次序排列,共四码。例如:“计算机”取码为“YZUJ”,“爱国者”取码为“AFLR”,“接班人”取码为“OWRE”。词语编码的前两码为前两字的首码,后两码为最后一个字的首次码。当末字为一级简码字时,要从它的全码中取前两码。(3)四字词编码:每字各取首码,共四码组成一组词语编码。例如:“不约而同”编码为“BSET”,“高瞻远瞩”取码为“DMIM”,“后来居上”取码为“PLSS”。四字词编码为各字首码按顺序排列即可。(4)多字词语编码:取第一、二、三及最末一个汉字的首码,共四码组成一组词语编码。例如:“电子计算机”取码为“DZYU”,“算”字不取码。“爱国主义教育”取码为“AFZD”、“义”字与“教”字不取码。又如“创历史最高水平”取码为RCSP,“最高、水”三字不取码。
多字词语的取码规则可理解为“前三后一”。
词语编码均为等长四码,而且单字和词语可以混合输入,见字打字,见词打词,其间不用换档或其它附加操作。

Claims (7)

1、一种汉字输入方法,其特征在于:本发明是这样实现的:将汉字分为四个层次,一是笔画,二是偏旁部首,三是根字,四是一般汉字;
一、笔画的取码见表1:
          汉字基本笔画取码表          表1
Figure C9910262200021
表中取码为各笔画名称读音的声母;
二、偏旁部首的取码见表2:
表2中的偏旁部首大都取相对应汉字的声母(个别取韵母)为首码,次码一般为首笔画码。括号内的偏旁为各复部首的内含偏旁是取次码的依据。
三、本方案规定主部首(按书写顺序位于字首,且处于指定位置的部首)取单码见表3:主部首取码表                      表3   部首 取码   部首 取码   艹   A   虫   C   疒   B   石   D   纟   E   方   F   宀   G   火   H   氵   I   口   K   钅   J   目   M   亻   L   女   N   扌   O   日   R   饣   P   山   S   犭   Q      T   忄   X   木   U Y V      Z   王   W
副部首(位于字首,如果不是主部首,就是副部首)的取码,属于偏旁部首的按偏旁部首取码,属于根字的按根字取码。
四、根字可分为六种:
(1)多声根字的取码见表4:
        多声根字取码表    表4  读     音     形体     代码  BO     BU     卜     BOUB  CHI    CHE     尺     CIEC  DA     DAI     大     DAAI  LE     LIAO     了     LEOL  ZHUA   ZHAO     爪     ZUAA  CHANG  ZHANG     长     CZPD  CHE    JU     车     CJHS  LE     YUE     乐     LVPD  MOU    SI     厶     MSZD  NIE    MIE     乜     NMZZ  ZHONG  CHONG     重     ZCPH  DAN    CHAN  SHAN     单     DCSD  DAN    SHI     石     DSHH
 GE     JI     革     GJHS  SHU    ZHU     术     SZHB  FU     PU     甫     FPHD
表中前五个是异韵根字,取码方法为:共同声母为首码,两个韵母依次排列于后,够四码即将多余字母略去,不够四码末码仍为共同声母。
其余是异声根字,取码方法为前后两字音的声母依次排列,后两码是首末笔画码,“单”字是将三个字音声母依次排列,后面是首笔画码。
(2)本声根字取码见表5:
         本声根字取码表           表5
Figure C9910262200041
从表中可以看出,本声根字取码方法非常简单,字音码在前,笔画码在后,够四码即可。除单字母音节汉字以外,本表只列出各根字的字音码。
(3)、内声根字的取码见表6:
    内声根字取码表                表6
Figure C9910262200042
从表6中可以看出:内声根字取码方法也很简单,首码为根字声母,次码为该根字内含名旁(括号内的偏旁)代码,后面为根字韵母,不够四码则补笔画码。表中未列出笔画码,如将次码略去,剩下的也就是根字字音。
(4)、近声根字取码见表7:
             近声根字取码表        表7
表中两个根字为一组,它们互为形近根字,用一横线联接之,放在中间栏,取码栏在两边,左栏为横线左端根字的代码,右栏为横线右端根字的代码。首码为取码根字声母,次码为其形近根字声母,后面是取码根字韵母,不够四码则补笔画码。例如:“凹—凸”这一组形近根字,“凹”字取码“ATO”,次码“T”是“凸”字声母,“凸”字取码“TAU”次码“A”是“凹”字首字母,去掉次码,剩下的也就是取码根字字音。
还有15个不成组的近声根字,取码情况如下:本(木)BUE    斥(斤)CJI    (豕)CSU   弔(弓)DGO夬(大)JDVE   戋(戈)JGIW   丘(乓)QPU    曲(由)QYV卅(川)SCA    世(廿)SNI    士(土)STl    曰(日)VRE王(玉)WVA    也(乜)YNE    子(了)ZLI
括号前为取码根字,括号内为其形近根字,括号后面是取码根字所取的代码。
(5)、同声根字取码见表8:
同声根字取码表            表8
内声根字或近声根字在取码时,取码根字的声母如与内含名旁或形近根字的代码相同,该取码根字则称为同声根字。例如:“孑——孓”两个根字互为形近根字,且声母相同。又如:“北”字声母与其内含名旁“匕”声母相同。再如“百”字,与其内含名旁“白”声、韵皆同。
左、中两栏的同声根字取码规则为:首码为共同声母,后面是本韵母与另一韵母依次排列,不够四码再补一个共同声母。右栏的根字取码规则为:首次码均为共同声母,后面是韵母,不够四码补笔画码。
(6)、特殊根字取码见表9:
      特殊根字取码表     表9
左、中两栏特殊根字的取码规则为:根字声母为首码,次码则在根字内选笔画多的名旁(表中括号内),四画以上的名旁仍按匹画计数,后两码取其它偏旁码,不够四码补根字韵母。右栏上方的6个根字有一个共同特点,就是首部件码与该根字声母相同,在这种情况下,先取根字声母,接着从第二部件开始依次取码,不够四码回过头再取首部件码和根字韵母。
接下来的三个特殊根字都含有一个复部首,其取码规则为:根字声母为首码,再按顺序取无名旁和复部首码、末码为根字韵母。
最后三个根字其实应为一般根字,只是由于取码方法特殊,才规定为特殊根字。“衣”是一个常用部首,本方案将其命名为“衣布旁”与“衤”(布衣旁)遥相呼应,取“衣布”二字声母为其首,次码。“木”字是惟一一个取韵母为首码的根字。实际上,“木”字应算作本声根字,只不过声韵倒置。“豸”字本方案将其命名为“豸犬旁”,形义都与“犭”相近,故取“豸犬”二字声母为首、次码。
五、一般汉字的取码
除了450个根字以外,其余汉字均为一般汉字
(一)、几点说明
(1)、根字与根旁
一般汉字拆分后,拆出来的字称为根字,不成字的偏旁部首则称为根旁。
(2)、根顺
根字和根旁都可以简称为根,它们在书写中的顺序称为根顺,在判断根顺时,应按各根第一笔画的书写顺序为根顺。
(3)、冗余偏旁和冗余字根
在汉字的偏旁系列中,并非每个偏旁均属必要信息。本方案规定,象“器、嚣”这样四个角上均为同一偏旁的右上角那个偏旁为冗余偏旁,对冗余偏旁不取码。
汉字按含根的多少,又可分为单根字、双根字、三根字、四根字和多根字,不用说,单根字就是根字,多根字中含有冗余根。
(二)、一般汉字的取码
(1)、双根字的取码
含主部首的双根字,主部首取单码作首码,其余三码由后根取。如“你”字,“亻”取“L”,“尔”字全码为“EXRP”,取主部首码“L”和“尔”字前三码,故“你”字取码“LEXR”。含副部首的双根字,先取副部首的首码为整字的首码,再取后根的前两码为整字的中间两码。例如“财”字,根字“贝”取码为“BJEI”,根字“才”取码为“CAIH”,先取副部首“贝”的首码为“财”字的首码,再取后根“才”的首次码为“财”字的中间两码,最后取副部首“贝”的次码作为“财”字的末码,故“财”字取码为“BCAJ”。
(2)、三根字的取码
含主部首的三根字,三根各取首码后,再取末根的次码为整字的末码。如“蜢”字取码为“CZMX”,前三码为三个根的首码,末码是末根“皿”的次码。
含副部首的三根字,三根各取首码后,再取副部首的次码为整字的末码,如“最”字取码为“REYM”,前三码为“日、耳、又”三根的首码,末码为副部首“日”的次码。
(3)、四根字的取码。
对于四根字,不必区分首根是主部首或副部首,依次序取各根的首码即可,如“醌”字取码为“YRBB”,为四个根“酉、日、比、匕、”的首码依次排列。
(4)、多根字的取码。
对于多根字,也不必区分首根是主部首还是副部首,只要对前二根和后二根依顺序取首码做为整字的编码,即“前二后二”。如:“微”字拆分为“彳、山、一、几、攵”,中间的“一”根不取码,故“微”字取码为“CSJW”。
2、根据权利要求1所述的输入方法,其特征在于:一级简码共26个汉字。
3、根据权利要求1所述的输入方法,其特征在于:二级简码共667个汉字。
4、根据权利要求1所述的输入方法,两字词语的编码方法是每字取其全码的前两码,共四码。
5、根据权利要求1所述的输入方法,三字词编码是取前两字的首码,最后一个字取它的首、次码,共四码。
6、根据权利要求1所述的输入方法,四字词语编码方法是每字取首码,共四码。
7、根据权利要求1所述的输入方法:多字词语的编码方法是取第一、二、三及最末一字汉字的首码,共四码。
CNB991026225A 1999-03-16 1999-03-16 一种汉字输入方法 Expired - Fee Related CN1136493C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB991026225A CN1136493C (zh) 1999-03-16 1999-03-16 一种汉字输入方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB991026225A CN1136493C (zh) 1999-03-16 1999-03-16 一种汉字输入方法

Publications (2)

Publication Number Publication Date
CN1229208A CN1229208A (zh) 1999-09-22
CN1136493C true CN1136493C (zh) 2004-01-28

Family

ID=5270886

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB991026225A Expired - Fee Related CN1136493C (zh) 1999-03-16 1999-03-16 一种汉字输入方法

Country Status (1)

Country Link
CN (1) CN1136493C (zh)

Also Published As

Publication number Publication date
CN1229208A (zh) 1999-09-22

Similar Documents

Publication Publication Date Title
CN1027558C (zh) 五笔二维计算机汉字输入方法及其键盘
CN1262473A (zh) 小型数字键盘拼音汉字输入方法
CN1136493C (zh) 一种汉字输入方法
CN105824793A (zh) 将汉字转化为数字及拉丁字母的处理系统、方法和装置
CN101488044B (zh) 一种语音和单笔混合式计算机汉字输入法
CN101587381B (zh) 音形汉字无重码输入法
CN1116335A (zh) 一种利用笔写屏技术的汉字输入系统
CN102368177A (zh) 新汉字声韵输入方法及输入键盘
CN102043469A (zh) 两笔型三维数码输入法及其键盘
CN101706685A (zh) 一种汉字输入法
CN1044543A (zh) 鼠标虚盘汉字及多文种输入法
CN101364144B (zh) 一种计算机汉字输入方法
CN1089176C (zh) 汉字正负数码输入法
CN1057166C (zh) 一种汉字模糊音编码的输入方法
CN1067476C (zh) 九三码汉字输入方法及键盘
CN1412660A (zh) 汉字全规范笔顺编码法
CN1142479C (zh) 五双结构化笔型汉字的通用数字键盘输入方法
CN1108553C (zh) 通用普及型音元形音汉字编码输入方法
CN1207648C (zh) 五三码及其键盘
CN1158593C (zh) 汉字及多国文字的计算机双笔六笔画输入方法
CN1419179A (zh) 按笔顺输入的汉字输入法及其键盘
CN1042017A (zh) 结构笔画四位数编码法及键盘
CN1120406C (zh) 计算机汉字部首输入方法
CN1174349A (zh) 汉字二十九形字根码编码输入方法
CN113253853A (zh) 一种计算机和手机的汉字输入方法

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee