CN1260530A - 汉语形声字编码输入方法 - Google Patents
汉语形声字编码输入方法 Download PDFInfo
- Publication number
- CN1260530A CN1260530A CN 99122665 CN99122665A CN1260530A CN 1260530 A CN1260530 A CN 1260530A CN 99122665 CN99122665 CN 99122665 CN 99122665 A CN99122665 A CN 99122665A CN 1260530 A CN1260530 A CN 1260530A
- Authority
- CN
- China
- Prior art keywords
- chinese
- compound vowel
- tone
- chinese syllable
- code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明系一种汉语形声字编码输入方法,其单字编码由汉语拼音、声调、偏旁部首类三部分依次组成,此三部分码依据相应规则与键盘字母分别形成对应关系。本发明优点是突破了传统双拼模式,克服了编码重码问题;规律性较强、无需复杂的过程及记忆;它对码型进行了美化、音化、简化处理,因此可升华为代替现有汉字的文字功能。
Description
本发明是一种以汉字造字法中的形声字为原理,用键盘字母对汉语字词进行编码输入的汉语形声字编码输入方法。
至今为止,国内外已有很多种汉字编码键盘输入方法。这些编码大至可分为三类:一类以五笔字型为代表的形码,二类为音形结合码,三类为纯拼音码。已公开的一、二类码存在拆字难、记忆难、学习难等问题;三类拼音码存在重码问题。如中国发明专利申请公开说明书“文字式音形汉字输入方法”(公开号CN1148196A),涉及的是音形码,其缺点为①拼音部分处置没有摆脱传统的双拼模式,若音节所代汉字较多时,编码易出现重码;②声调字母没有编在码之内,而只是用于选重码,若用声调字母选重码后还存在重码,就得像纯拼音码用数字选码;③汉字必须有一步或多步的拆字,优选两个部件,取两个部件字音的首字母定“形”,因而存在拆字难,记非成字的“音”难,同时这个“形”并非汉字造字法中形声字中的“形”。
本发明的目的是:克服现有编码输入技术中存在的拆字难、记忆难、学习难,重码问题,提供一种码型美观、简单且具有易学性、快速性、正音性、正义性的汉语形声字的编码输入方法。
本发明的目的通过采用字母键盘结合编码规则和输入方法来实现的。其具体编码规则和输入方法是:
汉语形声字编码输入方法,其特征是:其单字编码由汉语拼音、声调、偏旁部首类三部分依次组成,汉语拼音取码必须满足以下规则:
(1)、用y、v、w分别表示声母zh、ch、sh,其它声母与键盘字母相同,
(2)、用与表示声母相同的21个键盘字母表示韵母,a、e、i、o、u五个字母直接做为韵母码或表示其它复韵母,以iu或w表示ü,
(3)、拼音码包括声韵相拼或零声母码,遇零声母时,一字母构成的韵母直接取码或用双字母取码,二字母构成的韵母直接取码或由该韵母的首字母加表示该韵母的字母结合取码,三、四字母构成的韵母由该韵母的首字母加表示该韵母的字母结合取码或该韵母的首字母与表示去掉首字母后的韵母字母相结合取码,
(4)、bo、po、mo、fo、de、te、ne、le、ge、ke、he、ji、qi、xi、zi、ci、si、zhi、chi、shi、ri中的韵母o、e、i可以省略,剩下的声母可以直接做为拼音码,
(5)、声母j、q、x与带有介母i的韵母相拼时,可以省略介母i,
(6)、韵母u、w与声母l或n相拼时,他们分别代表汉语拼音中的u和ü,与其它声母相拼时,韵母u、w都发相同的音,
拼音码中的声母、韵母及呼读音节和整体认读音节与键盘字母的对应关系如下:
键盘字母 | 声母 | 韵 母 | 呼读音节或整体认读音节 | |
主韵母 | 次韵母 | |||
a | a | ia | ||
b | b | un üen | in | bo |
c | c | ong iong | ci | |
d | d | eng | ing | de |
e | e | ie | ||
f | f | iou | u※ | fo |
g | g | uai iao | ge | |
h | h | uan üan | he |
i | i | |||
j | j | i | ji | |
k | k | ai üe | ke | |
l | l | ang | iang | le |
m | m | an | ian | mo |
n | n | en | in | ne |
o | o、uo | ie | ||
p | p | uang iang | po | |
q | q | ua ia | qi | |
r | r | ei | ri | |
s | s | ao | iao | si |
t | t | uei üe | te | |
u | u | ü | ||
v | ch | ua ian | chi | |
w | sh | ü | u | shi |
x | x | ou | iou | xi |
y | zh | i | zhi | |
z | z | ing | zi |
1°一个键盘字母所代表主韵母和次韵母,在与声母相拼同时出现时,该键盘字母仅代表主韵母,次韵母只能用另一个键盘字母替代。
2°上表中u※既代表u也代表去掉两点的ü。
(2)、声调码,用a、e、i、o分别表示阴、阳、上、去四声调,u为变调,前面接字母a、e、i时分别表示阴、阳、上三声,接其它字母为去声,
(3)偏旁部首类码,是将偏旁部首性质相同或相近的归为一类(没有含义的偏旁部首归为一类),偏旁部首类与键盘字母的对应关系如下:
全码构成规则是:拼音两个字码(声母一字码、韵母一字码,或韵母二字码)、声调一字码、偏旁部首类一字码,共四字码,
简码构成规则是:
(1)一级简码为26个拉丁字母加空格键,制作成声母(韵母)所对应的高频汉字;
(2)二级简码有二种情况:一种是声母配合韵母加空格键或双字母表示的韵母(零声母)加空格键,取其对应的高频字,同时考虑高频字所组词频率、组词能力,组词的顺序,二种是声调加偏旁部首类加空格键,此简码仅用于偏旁部首,取同类同声调中高频偏旁部首字,
(3)三级简码,有三种情况:一种是声、韵、调加空格键或双字母表示的韵母、调加空格键,取其相应的高频字,同时考虑高频字所组词的频率,组词的能力,组词顺序。二种是声、调、偏旁部首类加空格键,此简码字仅用于呼读音节或整体认读音节,取同声同调同偏旁部首类中的高频字。三种是单韵母、声调、偏旁部首加空格键,取同单韵母同调同偏旁部首类中的高频字。
组词规则为:
(1)二字词组编码取第一个字音加第二个汉字码;
(2)三字词组编码取一、二字音加三字的码;
(3)三字以上编码取一、二、三字码的首字母和最末一字码的首字母共四码成词。
组词编码要求为:取字音时
(1)单韵母a、e、u、i均分别用双字母aq、ef、uf、iy表示,
(2)呼读音节和整体认读音节不省略韵母,
(3)当码de、te、ne、le、me表示汉语拼音de、te、ne、le、me时用变调u,其它情况均不用变调u。
本发明优点是:
1、在声母、韵母码处理上,真正突破了传统的双拼模式,因此克服了编码出现重码的问题,可实现《新华字典》范围内一字一码。
2、在形码处理上,是根据汉字造字法,将表示汉字含义的偏旁部首归类而一步选择码,无需拆字、强行定义。
3、编码规律性较强,确定拼音、声调、偏旁部首类三个步骤即完成编码,无需过多、过复杂的过程及记忆。
4、本发明涉及的编码是经过字型美化、音化、简化处理得到的,因此它已具备了升华为可代替现有汉字的文字功能。
附图为本发明编码结构示意图。
下面结合有关实施例对本发明做进一步详述:
如图所示,编码的基本结构
中汉语拼音也称音节缀,汉语拼音加声调称声缀,声调加偏旁部首类称形缀。
1.1拼音码
(1)取消用于隔音用的被当成“声母”的W和Y,用Y、V、W分别表示双声母zb、ch、sh,实现声母单字母化。
(2)用与表示声母相同的21个字母表示韵母;a、e、i、o、u五个字母直接做为韵母或表示其它复韵母。换言之,所有韵母都用一个字母表示。用字母表示韵母采用如下法则和思想:
1°对所有韵母所代汉字个数进行排队。所代汉字多的用美观的字母表示,所代汉字少的用丑的字母表示,如含“an”的汉字较多就用m表示,含“ao”的汉字较多,就用S表示。经过反复实验,代替韵母的字母与声母相拼时,出现常用的且所表示汉字较多的码型美观。丑陋的,易出现错误的码型被回避掉。如“VW”、“vv”、“yq”、“zz”、“gj”等被回避掉。
2°拼音不兼容性。分别以“a、e、o、u”为头的韵母和分别以“i、ü”为头的韵母在与声母相拼时一般不同时出现。如“ong”和“iong”在与声母相拼时不同时出现,故用字母C同时代表“ong”和“iong”。
3°韵母所代汉字较少且不混淆的用一个字母表示。如用“b”表示un和ün及in。若ün和in同时出现,就规定b仅代表主韵母“ün”而不代表次韵母“in”,次韵母“in”用其它字母表示。
4°韵母所代汉字较多的,用多个字母分割表示。如由于在英文中“w”发“u”音,故用u、w、f三个字母同时代表汉语拼音中的韵母“u”。由于英语中“y”发“i”音,故用i、y、j三个字母同时代表拼音中的韵母“i”
(3)参考台湾注音字母第二式,将ü改为iu(汉语拼音中的iou不用iu表示)或用字母w代替。当ü与j、q、x拼时,仍然写成ju、qu、xu或jw、qw、xw。
(4)拼音码包括声韵相拼码或零声母码;遇到零声母时,
1°一个字母构成的韵母直接取码或用双字母表示取码,如a、e、i、u可直接做为码,也可用aq表示a、ef表示e、iy表示i、uf表示u的方式取码;
2°双字母构成的韵母直接取码,如an、ai、ei、er、ou、in等;或由该韵母首字母加表示该韵母的字母取码,如由于ao用s表示,ao可用as表示,由于ia可用q表示,所以ia可用iq表示。
3°三、四字母构成的韵母由该韵母首字母加表示该韵母的字母取码,如用l表示ang,零声母时,用al表示ang取码,eng用ed取码,ong用oc取码,yang用ip取码,wang用up取码。
或该韵母的首字母与去掉首字母后的韵母相结合取码,如拼音wan亦为uan,因m表示an,故um表示uan。再如拼音yuan亦为üan,也为iuan,因h表示uan,故jh表示yuan。
(5)汉语拼音bo、po、mo、fo、de、te、ne、le、ge、ke、he、ji、qi、xi、zi、ci、si、zhi、chi、shi、ri音节中的韵母o、e、i可以省略,剩下的声母可以直接做为拼音码。
(6)声母j、q、x与带有介母i的韵母相拼时,可以省略介母i。如jian,取码时可省略i,即jan亦即jm,也可以用V代替ian,码为jv。再如j ü即为jiu(iu不代表iou),省略介母i,码为ju,与汉语拼音吻合。
(7)韵母u、w与声母l或n相拼时,分别表示u和ü;与其它声母相拼时,韵母u、w相同。展开讲,lu代表汉语拼音中的lu,lw代表汉语拼音中的lü。nu、nw分别代表汉语拼音中的nu和n ü;除与声母l或n相拼外,韵母u、w,要么都是u,要么都是ü,如du、dw中的韵母u、w都代表拼音中的韵母u,qu、qw中的韵母u、w都代表拼音中的韵母ü。
(8)码de、te、ne、le、me不接声调字母或只接变调字母u时(见声调码)表示汉语拼音de、te、ne、le、me;后接除变调字母u的声调字母时,表示汉语拼音die、tie、nie、lie、mie。换言之,码de、te、ne、le、me既表示汉语拼音de、te、ne、le、me,又表示汉语拼音die、tie、nie、lie、mie。区别在于后面接不接声调字母或后面接什么样声调字母。
1.2拼音码中的声母、韵母及呼读音节和整体认读音节与输入键盘字母的对应关系如下:
表中u※既表示u,也表示去掉两点的ü。1.3 声调码
键盘字母 | 声母 | 韵 母 | 呼读音节或整体认读音节 | |
主韵母 | 次韵母 | |||
a | a | ia | ||
b | b | un üen | in | bo |
c | c | ong iong | ci | |
d | d | eng | ing | de |
e | e | ie | ||
f | f | iou | u※ | fo |
g | g | uai iao | ge | |
h | h | uan üan | he | |
i | i | |||
j | j | i | ji | |
k | k | ai üe | ke | |
l | l | ang | iang | le |
m | m | an | ian | mo |
n | n | en | in | ne |
o | o、uo | ie | ||
p | p | uang iang | po | |
q | q | ua ia | qi | |
r | r | ei | ri | |
s | s | ao | iao | si |
t | t | uei üe | te | |
u | u | ü | ||
v | ch | ua ian | chi | |
w | sh | ü | u | shi |
x | x | ou | iou | xi |
y | zh | i | zhi | |
z | z | ing | zi |
(1)用a、e、i、o分别表示阴(同时表示汉字的轻声)、阳、上、去四声调。如拼音bāo,因s表示ao,a表示一声,故bāo表示为bsa。cháng,因v表示ch,l表示ang,e表示二声,故cháng表示为vle。拼音děng,因d表示eng,i表示三声,故děng表示为ddi。拼音fèi,因r表示ei,o表示四声故fèi表示为fro。
(2)u为变调,前面接字母a、e、i时,分别表示阴、阳、上三声调,接其它字母为去声。如拼音gā,由于韵母“a”与表示一声字母相同,故可用变调u表示一声,故ga可表示为gau。拼音hé,由于韵母e与表示二声字母e相同,可用变调u表示二声,故hé可表示为heu。拼音jǐ,由于韵母i与表示三声字母i相同,故jǐ可表示为jiu。拼音kòng,因c表示ong,故拼音kong可表示为kc,因韵母“c”非a、o、e、i,“C”后若接变调u,u表示四声,故kòng有两种表示法即kco和kcu。
(3)变调u有三种功能。一是避免一个字母连续出现三次,二是增加标调的字母,三是侧重表示去声(因为四声汉字较多)。
(4)u存在二级变调,前接拼音码de、te、ne、le、me时,分别表示阳、去、轻、去、轻声。因汉语拼音de、te、ne、le、me的声调分别为阳、去、轻、去、轻,与e表示阳声不相同,故u在二声调里又可有其它声调。
如拼音lè,拼音le后加声调,必须用变调u,故lè表示为leu,此时的u不是二声而是四声。拼音tèyì,因yi就是i,也可表示iy,故码表示为teuiyo。拼音zěn me yàng,zen表示为zni,me表示为meu(u表示轻声),yàng表示为ilo,故此拼音可表示为znimeuilo。
1.4 偏旁部首类码。将偏旁部首性质相同或相近的归为一类(没有含义的偏旁部首归为一类),称之为偏旁部首类。根据《汉语大字典》所列的200个偏旁部首及周万春教授在《汉字部首例解》书中对偏旁部首的分类,将所有部首分为25类。
(2)在取偏旁部首类码时,采取如下原则和思想。
1°将每个偏旁部首所含汉字的频率相加,然后将一个类中所有偏旁部首的频率相加,就得出每一偏旁部首类的频率。高频率的类用美的字母代替,频率低的用差的字母代替。字母a象人说话时的嘴的形状,且言口类属高频,用a表示言口类。e象点人的心脏状,且心玉类属高频,用e表示心玉类。i象点人立正的形状,且人类属高频,用i表示人类。m象点窑洞的形状,且宫室洞穴类属高频,用m代表宫室洞穴类。o象人握拳时的形状,且属高频,用o表示手类。r象小草形状,就用r表示草禾。u象两座山峰中间河谷状,且高频,用u表示山石土类,c象海浪冲礁石状,用c表示雨水类。d象长颈鹿侧视状,用d表示动物毛兽类。s象铁丝弯曲状,且属高频,用s表示金属武器类。t象树木状,用t表示竹木类。v象人走的“z”字状,用v表示足类。w象火状,用w表示日火光类。z象点鹅状,用z表示动物羽禽类。
低频的偏旁部首类用准差的字母表示,如g表示病灾类,p表示虫类。q表示散集类,y表示色泽类。
字母特差的用于辅助类或什么也不表示。如用f代表草禾类r和木竹类t的辅助类。j字型较丑,不表示任何类。
2°设置辅助类。辅助类就是一个字母表示它的偏旁部首类外,还捎带表示与之相关的类。如l表示人的器官类,同时还捎带表示也可归为人的器官类的言口类。c表示雨水类外,还捎带表示生活在水中的鳞虫及介虫类。
3°每一个类的大小写字母都可表示偏旁部首,只是按汉字频率,小写字母优先,大写字母次之。
4°并非一个偏旁部首只能归为一个偏旁部首类,根据偏旁部首所代汉字的含义可归为两类。“面”表示脸时归人的器官类l,表示食品时归于食品类n。弓表示武器时,归金属武器类s,表示人的力气大小时归人的特征类b。
2.1汉字的全码。拼音为两个码(声母一字码、韵母一字码,或韵母二字码),声调一字码,偏旁部首类为一字码,共四字码。
(1)取码时遵守下列法则:
1°韵母用两个或三个字母表示时,拼音码就出现不同类型。如表示拼音jiao有两个码js和jg。表示拼音bi有三个码,bi、by、bj。表示拼音shi有四个码,wi、w、wy、wj等。这些表示同一个汉语拼音音节的拼音码,取码型的原则是码型美观的优先,否则为劣。表示jiao的两个码js和jg,因js比jg字型美观,所以js优先选择。但必须强调的是,用s表示iao前,必须考查一下主韵母ao出现不出现,若ao也出现,s只能代表ao而不能代表次韵母iao。再如表示拼音di的码为三种码型di、dy、dj。di最优选,dy次之,dj最差。
2°变调字母u和声调字母同时表示一个拼音的声调时,前面的拼音码与声调字母结合,码型美观的为优,否则为劣。
3°确定偏旁部首类码的法则。
①异体字和讹作字统归于正体字,接正体字的偏旁部首取类码。
②取形声字的形部取码;取会意、指事字中最能接近字意的部首取码;象形字是独体字,一般直接归类取码。
③转注、假借的汉字以现意归类取码。
④若组成汉字的所有部首均不能表达现意时,取最接近含义的其它部首归类取码。
⑤为了字型美观或防止编码混淆可以使用辅助偏旁部首类取码。
4°取偏旁部首码,先小写字母后大写字母或辅助字母。
5°同拼音音节同声调同偏旁部首类里,确定拼音码类型、声调字母、偏旁部首类的大小写字母的依据:
①《汉字频度统计》里所收集的5991个汉字中的常用汉字。出现次数大者,优先考虑,出现次数相同的,按汉字简化字的笔画数多少寻找,笔画少的优先考虑;若笔画数相同的,按一、丨、丿、丶、乙的顺序寻找。
②《汉字频度统计》以外,且被《新华字典》所收集的汉字。按汉字简化字的笔画数多少寻找,笔画数少的优先考虑,同笔画的按一、丨、丿、丶、乙顺序寻找。
③在偏旁部首类a、e、i、o、u中,由单声母或单韵母构成的拼音码不能使用。如拼音码b-、p-、a-、i-不能使用。
6°确定一个汉字全码还必须满足三个优化组合原则:
①一个字母不能连续出现三次;②字母组合基本符合拉丁字母组合规律;③字型美观,易书写。
例1如“徨(huáng)和遑(huáng)。它们的拼音码为“hp”,声调为一个码“e”,根据确定偏旁部首法则,都为足类,即V类,这两个字只能用偏旁部首类大小写字母加以区分,因“徨”出现8次,“遑”没有出现。故前者取小写字母v,后者取大写字母V,所以“徨”的码为hpev,“遑”的码为hpeV。
例2:揽(lǎn),声母为l,韵母an为m,三声为i,揽归手类,即o类,而且在《新华字典》范围内属o类仅揽一个字,故揽的码为lmio。
例3:“齐、芹、萁、蕲、芪、荠”属同声同调同类的六个字,音qí,表示qi的拼音码型有四类即qi、q、qy、qj。在汉字频度表里,齐出现2872次,芹出现187次,萁出现8次,蕲出现2次,芪和荠没有出现。故前四个高频分别分给四种拼音码,后两个用类字母大小写区分。因二声用e,草类用r,所以齐的码qer,(韵母i省去),芹的码为qier,萁的码为qyer,蕲的码为qjer,芪的码为qeR,荠的码为qieR。
例4:巍和崴,是同声同调同类,即拼音为wei,归为山石土类即u,拼音wei是零声母,w变u,即wei变为uei,“uei”是三个字母构成的韵母,有两种处理方法。一种是首字母u加代替“uei”字母t,即ut。另一种是首字母u加后面韵母ei的替代字母r即ur,因巍出现156次,崴出现4次,故将符合拼写规律的ur分给巍,另一个分给崴。因一声用a表示,故巍的码为urau,崴的码为utau。
例5:铟和殷,拼音相同即yin,类相同即归金属武器类s。拼音yin为零声母,yin即为in(in由两个字母表示即b和n,且都属次韵母,当用b表示时,前面的主韵母ün也同时出现,所以in不可能用b表示,若in用n替代时,前面的主韵母en不同时出现,故in在遇到零声母时只能用n表示),按规定in直接取码或首字母i与代替in的字母n相加即i+n=in,也是in本身,换言之in只有一个拼音码。表示声调一声只有a一个,因此仅能用部首类大小写字母区分。因铟出现一次,殷出现271次,故大写字母分给铟,小写字母分给荫。故铟的码为inaS,殷的码inas。
例6:范和梵。因“范”的繁体字为
,所以范和梵两个字归竹木类。拼音为fan即fm,声调为四声,可用o和变调u表示,部首类为t。因“范”6517次,梵出现11次,所以声调o分给“范”字,声调u分给“梵”字。故“范”的码为fmot,“梵”的码为fmut。
例7:“叻”,拼音为le,声调四声,部首类为a,因为在偏旁部首类a、e、i、o、u中不能使用单声母,所以le中的韵母e不能省略,汉语拼音le后加声调字母,只能用变调字母u表示四声。故“叻”的码为leua。
例8:
谍”,拼音为die,声调二声,部首类为a,因为ie可用e和o表示,且都属于次韵母。当用o表示ie时,其主韵母uo也出现,故ie不能用o表示。当用e表示ie时,其主韵母e也出现,严格说来,用e表示ie也不行。但其主韵母e处在呼读音节de之中,恰恰此时韵母e可以省略不写,这样其主韵母e就相当于没有出现,故ie可用e表示,但必须附加条件,那就是码de若要表示汉语拼音die时,声调只能用声调字母a、e、i、o表示,绝对不能使用变调字母“u”,因此若想用码de表示拼音die,声调二声只能用e,而不能使用变调“u”,所以“
和谍”两字的码只能用偏旁部首类的大小写字母区分。因没有出现,“谍”出现112次,故
的码为deeA“谍”的码为deea。
例9“停”,拼音为ting,声调二声,部首类为人类即i。表示ing可用d和z表示。若用“d”表示ing,其主韵母eng也出现,所以d不可能表示ing,若用“z”表示ing,由于处于主韵母,不需要做任何考虑,故此时仅能用z表示ing,所以拼音ting的码为tz,声调二声为e,所以“停”的码为tzei。
(2)汉字的全码情况说明。属于无需辨别的码,占整个码的80%以上。常用字的码基本上无需辨别。
(3)确定取码顺序:
①码型美观先选,码型丑陋后选;
②拼音码先选原始码,后选派生码;
③声调码先选基本码,后选变调码;
④偏旁部首码先选大小字母,后择辅助码。
2.2汉字的简码
(1)一级简码为26个拉丁字母加空格键,制作成声母(韵母)所对应的高频字。单韵母五个:a啊、e俄、i一、o喔、u无,单声母为呼读音节或整体认读音节中的高频字。b播、c次、d的、f佛、g个、h和、j级、k可、l了、m磨、n呢、p破、q起、r日、s思、t特、v持、w是、x席、y之、z子。
(2)二级简码有两种情况:一种是声母配合韵母加空格键或双字母表示的韵母(零声母)加空格键,取其对应的高频字,同时考虑高频字所组词的频率、组词能力、组词的顺序。
例1 二级简码hs(hao),在汉语拼音音节hao中,第一高频是“好”,第二高频是“号”,因“好”组词能力较差,而“号”的组词能力较强,故二级简码“hs”代表“号”。
例2 二级简码an,在汉语拼音音节an中,第一高频是“安”且组词能力较强,故二级简码“an”代表“安”。
例3:二级简码hd,在汉语拼音音节heng中,“横”出现3068次,“衡”出现2186次,这两个字的组词能力差不多,前者略强一些,但考查顺序“横”在词组中处于词首占80%以上,“衡”在词组中处于词尾占80%以上,根据取词尾强的优先的原则,二级简码分给了“衡”字。
二种是声调加偏旁部首类加空格键,此简码就象汉字中的象形字。仅用于偏旁部首,取同偏旁部首类同声调中的高频偏旁部首字。
如“山”的全码为“wmau”,在山石土类里,所有一声的偏旁部首,只有“山”最常用。故把前面的拼音码“wm”去掉,剩下的“au”定义为“山”的二级简码,故二级简码au代表山。
再如“男”是《(说文解字》中的偏旁部首。用二级简码eb代表男。
类似二级简码有aa日、ea言、ob立、ac川、od鹿、ae心、ee王、oe示、em门、om户、ak龟、ek鱼、ok贝、el牙、ol自、ah舟、oh力、io手、oo又、ar生、ir草、as金,es矛、os至、eu石、at支、et竹、ot木、ev足、ov去、aw申、ow月、ax巾、ex革、az飞、ez而、ay青、ey白、oy色。
(3)三级简码:有三种情况:一种是声、韵、调加空格键或双字母表示的韵母、调加空格键,取其相应的高频字,同时考虑高频字所组词的频率、组词能力,组词顺序。
如三级简码“dsa”,声母为d,韵母为s,声调为a。因在dāo中“刀”最常用且组词能力较强,故dsa代表汉字“刀”。
再如:三级简码“une”,复韵母为“un”,声调为e,因在汉语拼音wén中第一高频字为“文”,第二高频字为“闻”。因“文”已做为二级简码“un”故三级简码代表汉字“闻”。
例3三级简码dvo。拼音码dv中v为韵母“ian”,o为声调表四声。在汉语拼音diàn中,第一高频字为“电”,出现48461次,第二高频字是“垫”,出现1917次,第三高频的字是“店”,出现1338次。因“电”已做为二级简码的字,不考虑。比较“垫”和“店”两字,组词能力差不多,处在词组尾部都较多,但“店”所组的词都常用,故三级简码dvo代表“店”。
二种是声、调、偏旁部首类加空格键。此简化码仅用于呼读音节或整体认读音节,取同声同调同偏旁部首类中的高频字(偏旁部首a、e、i、o、u中不能使用此简码)。
例如三级简码gas,因在呼读音节ge中属于金属武器类s中有两个汉字,即“戈”和“割”。因“戈”出现592次,“割”出现2980次,故码“geas”中省略韵母“e”后,三级简码“gas”代表汉字“割”,全码“geas”代表汉字“戈”。
再如三级简码kom,在呼读音节ke中,属于宫室洞穴类m中仅一个汉字,即“客”,故把码“keos”中韵母“e”省略后,三级简码“kom”代表汉字“客”
三种是单韵母、调、偏旁部首类加空格键。此简码仅用单韵母a、e、i、o、u的编码中。
如三级简码ioh。码中的“i”为单韵母,o为声调,“h”表示交通及工具类。在汉语拼音yi中属于交通及工具类的有轶、勚。因轶出现6次,“勚”没有出现。故ioh分给汉字“轶”,“勚”的码为“iyoh”。
如三级简码uiv。码中的“u”为单韵母,i为声调,v表示足类。在汉语拼音wu中属足类仅“舞”字(舞字的所有部首均不能表示“舞”的含义,故借用“足”表示“舞”的含义),故三级简码uiv表示“舞”字。
3、组词编码方法
3.1规则
①二字词组编码规则,取第一个字音加第二个汉字码。
②三字词组偏码规则,取一二字音加第三个汉字码。
③三字以上编码规则,取一、二、三字码的首字母和最末一字码的首字母共四码取词。
3.2要求:取汉字字音时,
①单韵母a、e、u、i均分别用双字母aq、ef、uf、iy表示;
②呼读音节和整体认读音节不能省略韵母;
③当码de、te、ne、le、me表示汉语拼音de、te、ne、le、me时,仅用变调“u”,其它情况均不用变调“u”。
例1“开会”,“开”的音为kāi即kka,“会”为二级简码“ht”所以“开会”码为kkaht。
例2“一心”,“一”的音为yī即iya“心”为二级码“ae”所以“一心”的码为iyaae。
例3 “德育”“德”的汉语拼音为de,后面的声调只能用变调“u”表示,所以“德”的音表示为“deu”,“育”的码为“iuo”所以“德育”的码为“deuiuo”。
例4“喋血”。“喋”的汉语拼音为die,声调二声,若韵母ie后面接声调字母,后面的声调只能用“e”表示二声,绝对不能用变调表示,故喋的字音可表示为“dee”,汉字“血(xùe)”的码为“xt”,所以“喋血”码为“deeit”。
例5“路线”。“路”的汉语拼音为lù,可表示为luo“线”为二级简码“xm”,故“路线”的码为“luoxm”,因为“路”为二级简码“lu”,此时字音“luo”可用二级简码“lu”表示,故“路线”的码可表示为“luxm”。
例6“贡献”,“贡”的音为gòng即gco,“献”的码为xmod,所以“贡献”的码为“gcoxmod”。
例7人民警察的全码为“rnemb jdivae”,其简码为人的首字母为r,民的首字母为m,警的首字母为j,察的首字母为v,合并得简码rmjv。
例8“中华人民共和国”全码为ycahve rnemb gcoheego,简码为“yhrg”。
说明1、当二字词组的首字的汉字是二级简码时,且尾字的汉字不是零声母时,词组的首字的汉字字音可用二级简码表示。如“开会”的码为“kkaht”,因“开”为二级码kk,“会”为非零声母,所以“开会”码可为“kkht”。
说明2,三个字或三个以上字组成的词都可以用简码,一般情况下,简码词组与全码不出现重码问题。字、词全码的第三个字母为声调字母a、e、i、o、u,而三个字以上的词组简码的第三个字母一般非声调字母a、e、i、o、u。
说明3,声调字母a、e、i、o、u在全码输入中,起到辨认音节作用。计算机通过声调字母实现自动辨认汉字。
4、对不识字的查寻输入法。
若对一个汉字不认识的话,就无法用汉语形声字输入方法进行打字,必须创立一种补充取码打字。不识字的查寻打字方法如同新华字典的偏旁部首查字方法。
查找之前,先和查字典一样,把偏旁部首正确确定下来。
第一步,先数准偏旁部首的笔画个数。十画以上的(含十画)用零(o)表示。
第二步,把偏旁部首归类。
第三步,数去掉偏旁部首后的笔画数。十画以上的(含十画)分别用字母a、b、c...依次表示。
第四步,根据汉字去掉偏旁部首后的部分的末笔画的笔型。末笔是“一”的为1,“丨”的为2,“丿”为3、“丶”为4,“乙”为5。
通过上述四步,取四个码就可以查出不认识的汉字。
例如:“墀”,取偏旁部首“土”,第一步:“土”为3“土”归u类,“犀”为12画,用“c”表示,“犀”的末笔型为“丨”即2, 故“墀”的查寻码为“3uc2”。
例2,“鼻邕”,取偏旁部首“鼻”。“鼻”为14画用o表示,鼻归为人的器官类即1类。“邕”为10画用a表示。“邕”的末笔型为“乙”用5表示,用“鼻邕”的查找码为o1a5(o为零,不是字母o)
例3 郅”,取偏旁部首“阝”,“阝”为2画,“阝”归宫室洞穴类即m“至”为6画,“至”的末笔型为“丿”用3表示,即“郅”的查寻码为2m63。
例4 “囟”新华字典里取偏旁部首为“口”,“口”为3,归宫室洞穴类m,“x′”为3画,“x′”末笔型为“丶”用4表示,故“囟”查寻码为3m34。
例5“舀”的偏旁部首为“臼”,“臼”为6画,“臼”归交通工具类h“爫”为四画,“爫”的末笔型为“丿”即4,故“舀”的查导码为6h44。
例6“旌”,取偏旁部首为“方”、“方”为4画,“方”归丝衣类x,“”为7画,“”的末笔型为“一”即为1,故“旌”的查寻码为4x71。
从以上所述可知,在应用本发明进行汉语编码时,许多时候会遇到在多种选择下如何确定码的问题,下面提供的就是几个优选确定码的规则。
(1)优选码型规则:
1°一个拉丁字母。在书写拉丁字母的三线格中,处于中间格的字母最优选;同时处在上格与中格或下格与中格的字母次之;同时处在上、中、下格的字母再次之。
2°两个字母以上
①异同字母比相同字母优选;
②书写或辨认不易出错优选;
③字母少的优选;
④均处于中间格内优选,上格与中格或下格与中格次之,上、中、下再次之;上格或下格越少越优选。
例1:字母m、n、o、s等在中间格最优选,h、k、p、q等处于上格与中格或下格与中格次之,f三格都有再次之。
例2:异同au比相同aa,码baua比baaa优选。
例3:表示汉语拼音“chu”的码“vf”“比”“vw”优选,(因为vw书写易出错)
例4:表示汉语拼音的“ge”的码型“g”“比”“ge”优选。
例5:码型js与jg相比,前者在下格仅一个字母,所以js比jg优选。
(2)、确定多项拼音码规则:
1°声母实现单字母化,确定码时具有唯一性。
2°韵母:
①以“a、e、o、u(个别u两个字母代替)”为头的韵母用一个字母代替,具有唯一性;
②以i和ü为头的韵母大部分可分别用两个字母代替,次韵母优选,主韵母次之;
③韵母i用字母i、y、j代替,i优选、y次之、j再次之。u用字母u、w、f表示,u优选,w次之,f再次之。
3°声韵相拼时,韵母为2°中的②、③两款或零声母的韵母用多个字母表示时,按优选码型法则确定。
(3)、确定多项声调码规则
声调字母a、e、i、o与变调字母u同时表示汉语拼音的声调时,①结合拼音码,按优选码型法则确定声调,②声调o与变调u同时表示四声时,声调字母o优选。
(4)、确定偏旁部首类的大小写字母或辅助类规则
先小写字母后大写字母,再考虑偏旁部首辅助类。
五、同拼音音节同声调同偏旁部首类中避免重码规则:
1°若拼音有多项选择,先用拼音多项性予以解决;
2°若拼音单一性,声调可用变调字母“u”表示,就用声调多项选择解决之;
3°若拼音与声调均单一性,就用偏旁部首类的大小写字母或偏旁部首辅助类予以解决。
Claims (4)
1、汉语形声字编码输入方法,特征是:其单字编码由汉语拼音、声调、偏旁部首类三部分依次组成,
(1)、拼音取码的规则及拼音码中的声母、韵母及呼读音节和整体认读音节与键盘字母的对应关系如下:
键盘字母
声母
韵 母
呼读音节或整体认读音节
主韵母
次韵母
a
a
ia
b
b
un üen
in
bo
c
c
ong iong
ci
d
d
eng
ing
de
e
e
ie
f
f
iou
u※
fo
g
g
uai iao
ge
h
h
uan üan
he
i
i
j
j
i
ji
k
k
ai üe
ke
l
l
ang
iang
le
m
m
an
ian
mo
n
n
en
in
ne
o
o、uo
ie
p
p
uang iang
po
q
q
ua ia
qi
r
r
ei
ri
s
s
ao
iao
si
t
t
uei üe
te
u u ü
v
ch
ua ian
chi
w
sh
ü
u
shi
x
x
ou
iou
xi
y
zh
i
zhi
z
z
ing
zi
1°一个键盘字母所代表主韵母和次韵母,在与声母相拼同时出现时,该键盘字母仅代表主韵母,次韵母只能用另一个键盘字母替代,
2°上表中u※既代表u也代表去掉两点的ü,
(2)、声调码,用a、e、i、o分别表示阴、阳、上、去四声调,u为变调,前面接字母a、e、i时分别表示阴、阳、上三声,接其它字母为去声,
2、根据权利要求1所述输入方法,其特征是:全码构成规则是:由拼音两个字码(声母一字码、韵母一字码,或韵母二字码)、声调一字码、偏旁部首类一字码组成,共四字码。
3、根据权利要求1所述的输入方法,其特征是:简码构成规则是:
(1)一级简码为26个拉丁字母加空格键,制作成声母(韵母)所对应的高频汉字,
(2)二级简码有二种情况:一种是声母配合韵母加空格键或双字母表示的韵母(零声母)加空格键,取其对应的高频字,同时考虑高频字所组成的频率、组词能力、组词的顺序,二种是声调加偏旁部首类加空格键,此简码仅用于偏旁部首,取同类同声调中高频偏旁部首字,
(3)三级简码,有三种情况:一种是声、韵、调加空格键或双字母表示的韵母、调加空格键,取其相应的高频字,同时考虑高频字所组词的频率,组词的能力,组词顺序。二种是声、调、偏旁部首加空格键,此简码字仅用于呼读音节或整体认读音节,取同声同调同偏旁部首类中高频字,三种是单韵母、声调、偏旁部首加空格键。
4、根据权利要求1~3所述的输入法,其特征是:其组词规则为:
(1)二字词组编码取第一个字音加第二个汉字码,
(2)三字词组编码取一、二字音加三字的码,
(3)三字以上编码取一、二、三字码的首字母和最末一字码的首字母共四码成词,
组词编码要求为:
取字音时(1)单韵母a、e、u、i均分别用双字母aq、ef、uf、iy表示,
(2)呼读音节和整体认读音节不省略韵母,
(3)当码de、te、ne、le、me表示汉语拼音de、te、ne、le、me时用变调u,其它情况均不用变调u。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB991226658A CN1163815C (zh) | 1999-12-20 | 1999-12-20 | 汉语形声字输入方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNB991226658A CN1163815C (zh) | 1999-12-20 | 1999-12-20 | 汉语形声字输入方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1260530A true CN1260530A (zh) | 2000-07-19 |
CN1163815C CN1163815C (zh) | 2004-08-25 |
Family
ID=5282649
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB991226658A Expired - Fee Related CN1163815C (zh) | 1999-12-20 | 1999-12-20 | 汉语形声字输入方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN1163815C (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102810013A (zh) * | 2012-06-21 | 2012-12-05 | 周志农 | 一种拼音辅助编码及输入方法 |
CN109375785A (zh) * | 2018-08-20 | 2019-02-22 | 吴志光 | 一种创制拼音汉字的汉语简拼添尾快记法 |
CN113377215A (zh) * | 2021-06-25 | 2021-09-10 | 刘跃军 | 流连汉字输入方法 |
CN113900531A (zh) * | 2021-03-26 | 2022-01-07 | 刘跃军 | 换位、连击、声形及少选的汉字拼音输入方法 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102298449B (zh) * | 2011-08-21 | 2016-03-02 | Tcl集团股份有限公司 | 一种快速选字的拼音输入法 |
CN105045410B (zh) * | 2015-08-25 | 2019-02-12 | 任仰福 | 一种形式化拼音和汉字对应识别的方法 |
-
1999
- 1999-12-20 CN CNB991226658A patent/CN1163815C/zh not_active Expired - Fee Related
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102810013A (zh) * | 2012-06-21 | 2012-12-05 | 周志农 | 一种拼音辅助编码及输入方法 |
CN102810013B (zh) * | 2012-06-21 | 2016-05-18 | 周志农 | 一种拼音辅助编码及输入方法 |
CN109375785A (zh) * | 2018-08-20 | 2019-02-22 | 吴志光 | 一种创制拼音汉字的汉语简拼添尾快记法 |
CN113900531A (zh) * | 2021-03-26 | 2022-01-07 | 刘跃军 | 换位、连击、声形及少选的汉字拼音输入方法 |
CN113377215A (zh) * | 2021-06-25 | 2021-09-10 | 刘跃军 | 流连汉字输入方法 |
Also Published As
Publication number | Publication date |
---|---|
CN1163815C (zh) | 2004-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1648828A (zh) | 去多义性语音输入系统和方法 | |
CN101038508A (zh) | Gb拼音输入法 | |
CN1260530A (zh) | 汉语形声字编码输入方法 | |
CN1737739A (zh) | 基于英文键盘的藏文输入法 | |
CN1019424B (zh) | 音形笔画综合编码汉字高速输入法及所用键盘 | |
CN1171137C (zh) | 改进的hlv汉字拼音输入方法 | |
CN1515988A (zh) | 一类音形义汉字编码输入法 | |
CN1257445C (zh) | 音义码汉字输入方法 | |
CN1838044A (zh) | 中文拼音声调笔划组合输入法 | |
CN1123819C (zh) | 计算机汉字键位码输入方法 | |
CN1058342C (zh) | 汉字编码的计算机输入方法 | |
CN1081355C (zh) | 三音码计算机汉字输入方法及其键盘 | |
CN1246759C (zh) | 一种采用根素码的计算机汉字输入方法 | |
CN1156744C (zh) | 元根码汉字输入方法 | |
CN1114146C (zh) | 一种汉语语素编码计算机键盘输入法 | |
CN1584809A (zh) | 可做拼音汉字的汉字编码的输入法 | |
CN1173248C (zh) | 六字元结构字根无重码输入法 | |
CN1175722A (zh) | 计算机中文通用输入法 | |
CN1374577A (zh) | 英文字母键盘和数字键盘通用汉字电脑输入法及其键盘 | |
CN1031301C (zh) | 汉字偶体隐现键盘码及输入键盘 | |
CN1052314C (zh) | 一种汉字二维数码的计算机键盘输入方法 | |
CN1081773A (zh) | “多声递推联想”汉语词字编码 | |
CN1492303A (zh) | 二分汉字编码小键盘输入及其显示方法 | |
CN1655104A (zh) | 段码中文输入法 | |
CN1054445C (zh) | 一种计算机汉字编码输入方法及其键盘 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C19 | Lapse of patent right due to non-payment of the annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |