CN102609106B - 作为电脑汉字的现汉字码三位一体输入法 - Google Patents
作为电脑汉字的现汉字码三位一体输入法 Download PDFInfo
- Publication number
- CN102609106B CN102609106B CN201210015293.1A CN201210015293A CN102609106B CN 102609106 B CN102609106 B CN 102609106B CN 201210015293 A CN201210015293 A CN 201210015293A CN 102609106 B CN102609106 B CN 102609106B
- Authority
- CN
- China
- Prior art keywords
- code
- word
- word part
- chinese
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明公开了一种作为电脑汉字的现汉字码三位一体输入法,所述的现汉字码是将汉字转化为可用计算机标准键盘输入并能被计算机识别且显示的汉字的固定代码,该固定代码包括用26个英文字母作码名,并一一与计算机标准键盘的26个英文字母键名相对应,其特征在于所述的固定代码是由表示汉字读音的单、双拼音码和表示汉字意形的字件码所组成,并能以码串的形态或字码互换的形态精准地表示出汉字的读音和意形结构。与已有技术相比具有下列优点:一是可将汉字以码串的形态用英文字母来表示,从而形成汉字的固定代码,并能精准地表示出汉字的读音和字形结构,且能区分同音字;二是对汉字采用了符合中国文化传统和汉字文化的字件编码方法,为汉字的学习、汉语的应用提供帮助;三是没有重码;四是对认识的和不认识的汉字均可输入。
Description
技术领域:
本发明是一种可实现汉字在计算机平台上作为电脑语言文字使用的现汉字码三位一体输入法。
背景技术:
汉字,是中华民族的语言文字,承载着悠久的中华文化历史。但面对现代社会,特别是以计算机为代表的信息时代,汉字因其特殊的字形结构,不仅面临“汉字难学”、“汉字难查”的问题,而且在计算机平台的应用上,至今也仅只解决了其输入问题,因此,汉字现代化已成为理论界和学者讨论的热点,实现汉字易学、易查,又不丢失汉字文化,特别是能像英文那样可直接作为电脑语言文字使用的汉字现代化的现汉字码,是中华子孙的历史任务。
目前,汉字的输入方法,已有技术仅中国专利申请就有500多件,其编码涉及音码、形码或者它们的结合等多种形式。其中,最具代表性的是二十世纪八十年代出现的“王码-五笔”输入法。然而,所有这些汉字的输入方法,它们最根本的任务仅只在于解决汉字在计算机上的输入问题,而不能将汉字转化为可作为电脑语言使用的中国文字;同时,其采用的编码,特别是形码,割裂了中国汉字的文化传统,丢失了汉字文化,使其成为只能依靠死记硬背才能掌握的符号,不能实现“见字识码”、“见码识字”和“字码互识”与“字码互换”的功能,且对解决“汉字难学”和“汉字难查”的问题没有帮助。
发明内容:
本发明的目的在于克服已有技术的上述不足而提供一种可实现“见字识码”、“见码识字”和“字码互识”与“字码互换”功能的,又不丢失汉字文化,可作为汉字现代化的固定代码,特别是可作为电脑语言文字直接使用的汉字的现汉字码三位一体输入法。
本发明的目的是这样实现的,其技术方案为:一种作为电脑汉字的现汉字码三位一体输入法,所述的现汉字码是将汉字转化为可用计算机标准键盘输入并能被计算机识别且显示的汉字的固定代码,该固定代码包括用26个英文字母作码名,并一一与计算机标准键盘的26个英文字母键名相对应,其特征在于所述的固定代码是由表示汉字读音的单、双拼音码和表示汉字意形的字件码所组成,并能以码串的形态或字码互换的形态精准地表示出汉字的读音和意形结构,其方法如下:
a、汉字读音的取码:
(1)、汉字的单、双拼音定义:单拼就是在汉语拼音中用一个英文字母表示的韵母自成音节;双拼就是在汉语拼音中把由多字母组成的拼音一律简化为用两个英文字母表示的拼音音节;汉语拼音有21个声母,其中zh、sh和ch是由二个字母组成,为了简化为一个字母,分别用v代表zh,w代表sh,y代表ch;汉语拼音有35个韵母,除a、e、i、o和u共5个单韵母外,其余都是二个或多于二个字母的复韵母,为了能用一个字母来表示,一是单韵母o和复韵母uo同用字母o,二是引入1个前鼻音符号“\”、1个后鼻音符号“/”和1个零声母符号“-”这三个韵符及与声母可合用同一字母的声韵双用字母的概念;这样,根据汉语拼音(简称全拼)的发音规则,所述21个声母和35个韵母便能用26个英文字母中的单个字母或单个字母加韵符组成的韵符字母来表示,其拼写和读音如表一:
表一
(2)、拼写方法:根据汉语拼音的全拼规则,汉字的发音可分为声韵双拼音节和韵母自成单拼音节两种类型,前者,第一个字母对应于汉语拼音的声母的发音,称声位字母,第二个字母对应于汉语拼音的韵母的发音,称韵位字母,在声位是声母,在韵位是韵母,读音清楚,因此,便直接拼写双拼字母;后者,由于是单拼的韵母自成音节,在音节中没有声母,因此,为了能区分读音,对是单韵母的,则要重写字母,对是复韵母的,在全拼中是二字母的则直接拼写全拼字母,是三字母或以上的则要在字母前面加零声母符号“-”占位,从而表示其后的字母是韵母,按韵母发音,有鼻韵母符号“\”“/”的韵符鼻韵母则可直接成为单拼的韵母自成音节;
(3)、取码方法:按汉字的读音,直接取所述单、双拼音拼写方法中的字母或韵符字母作码名,所述的韵符字母,其韵符和字母必须当作一个整码看待,不能分割;
b、汉字的字件取码:
一、汉字的字件定义:字件是构成汉字字形的基本单元,它包括部首、字件字和字件笔画三种,任何一个汉字都可被拆分成字件单元,其中,部首是指国家在1983年颁布的《汉字统一部首(草案)》中所规定的201个部首,字件字是指汉字构成中可作字件的单字,字件笔画是指汉字构成中既不是部首,也不是字件字的单笔画或多笔画;
二、汉字的字件分类:字件可分为表意字件和表形字件两类,大部分能表示汉字字意的部首均归入表意字件,称表意部首,字件字、字件笔画和少部分无法表意或虽能表意但字数太少无法汇集成类的部首都归入表形字件;
三、汉字的字件取码:
(1)、表意字件的取码:表意字件仅涉及表意部首,这部分部首按构成汉字的数量、表意的方式和文化特征以及便于记忆的原则,又分为单意部首和类意部首;单意部首构成的汉字众多,表意较为确定,可单独成类;类意部首构成的汉字多少不等,表意比较复杂,按中国的文化传统,以名词为中心归纳为天时、地利、人和、动物和植物五个大类,其中地利分为地母、山石和金火三类,人和分为言心、衣料和门器三类,动物分为哺乳、非哺乳、肢体器官和行为状态感觉四类;每类确定一个与计算机标准键盘相对应的英文字母作码名;
(2)、表形字件的取码:表形字件的取码:由字件的首笔画和次笔画共同确定一个与计算机标准键盘相对应的英文字母作码名,首笔画有横、竖、撇、点和折五种,横包含提,竖包含竖钩,点包含捺,次笔画有直笔、空笔和曲折笔画三种,横、竖为直笔,没有次笔为空笔,撇、点和折为曲折笔;
(3)、26个英文字母作码名配置的字件如表二:
表二
四、字件的界定:字件是构成汉字的基本单元,界定字件是分解汉字的基础,其原则如下:
(1)、部首最先,字件字其次,字件笔画最后;
(2)、笔画多的部首可包括笔画少的部首、字件字或字件笔画,但包含后必须仍为部首;
(3)、字件字不能包含表意部首,但可包含表形部首、笔画少的字件字或字件笔画,但包含后必须仍为字件字;
(4)、字件笔画不能包含部首和字件字,但可包含笔画少的字件笔画,但包含后必须仍为字件笔画;
五、汉字的分解:就是将一个汉字拆分成字件单元,其分解原则如下:
(1)、按笔顺分解,依次排列;
(2)、第一个字件必须包含首笔或部首字的部首,称字首;
(3)、最后一个字件必须包含尾笔,称字尾,按汉字的结构分类,合体字、独体字和部首字,尾笔遵从笔顺的末笔,全包围结构的汉字,尾笔遵从被包围部分的末笔,半包围结构的汉字,按笔顺首笔在包围部分,尾笔则遵从被包围部分的末笔,首笔在被包围部分,尾笔则遵从包围部分的末笔;
(4)、独体字是由字件笔画组成,它的每个单笔画就是一个字件;
(5)、分解部首字时,要将部首作为第一字件,然后进一步分解,包含首笔的字件就成了第二字件,余者类推;部首字作键名时,码名就是部首的代码;
六、字件的取码:
(1)、字件码,就是字件归属的码名;
(2)、字件尾码,就是字件的末笔包含的部首、字件字或字件笔画归属的码名,分为:
1)、单义部首的尾码就是该部首的码名;
2)、类意部首的末笔如果被另一个表意部首所包含,尾码就是另一个部首的码名,否则就是自身的码名;
3)、表形部首和字件字的尾码就是字件末笔包含的部首、字件字和字件笔画归属的码名;
4)、字件笔画的尾码就是字件末笔画的码名;
C、汉字的组码:
一、组码的方法:
(1)、单、双拼音和字件组码;或
(2)、字件组码;
二、组码规则:
(1)、单、双拼音和字件组码:单或双拼音码+字首码+字尾码;
(2)、字件组码,根据构成汉字的字件数分为:
1)、四个字件及以上:字首码+第二字件码+第三字件码+字尾码;
2)、三个字件:字首码+第二字件码+第三字件码+第三字件尾码;
3)、二个字件:字首码+第二字件码+第二字件尾码+第一字件尾码;
三、编码输入方法:
(1)、认识的汉字,采用组码规则(1)编码,单拼汉字全码为三码,双拼汉字全码为四码,全码称标码,击完计算机键盘上对应的字母,则输入上屏,少于全码称简码,补空格键,则输入上屏(下同),多于四码为区别码,一个汉字一至五码输入:
1)、一个汉字只用单、双拼音码就能表示的,编码为一或二字母格式;
2)、一个汉字需要加上字首码才能表示的,编码为二或三字母格式;
3)、一个汉字还需加上字尾码才能表示的,编码为三或四字母格式;
4)、一个汉字在四字母格式还有重码的,就要加上由26个英文字母排序的序号字母,编码为五字母格式;
(2)、不认识的汉字和词组,采用组码规则(2)编码,标码为四码,少于四码为简码,多于四码为区别码,一个汉字一至五码输入:
1)、一个汉字只用字首码就能表示的,编码为一字母格式;
2)、一个汉字要用二个字件码才能表示的,编码为二字母格式;
3)、一个汉字要用三个字件码才能表示的,编码为三字母格式;
4)、一个汉字要用四个字件码才能表示的,编码为四字母格式;
5)、一个汉字在四字母格式还有重码的,就要加上由26个英文字母排序的序号字母,编码为五字母格式;
6)、二字词组,取第一个字的字首码和第二个字件码+第二个字的字首码+2;
7)、三字词组,取每个字的字首码+3;
8)、四字词组,取每个字的字首码+4;
9)、四字以上词组,取前三个字和最后一个字的字首码+字数;
d、汉字的三位一体输入法:
(1)、显示码串输入法,定义一个图标,如英字图标,表示其屏显形态,按组码规则(1)编码,汉字直接以码串的英文形态输入;或
(2)、显示汉字的单、双拼音输入法,定义一个图标,如拼字图标,汉字按组码规则(1)的编码方法输入;或
(3)、显示汉字的字件码输入法,定义一个图标,如件字图标,汉字按组码规则(2)的编码方法输入;
(4)、所述的输入方法,可以按图标循环切换输入和显示,且当切换至显示码串时,则显示汉字的单、双拼音输入法码串。
本发明推荐在计算机标准键盘上按字件码赋予的键名字如表三:
表三
本发明进一步推荐所述的输入方法,也可根据所述单、双拼音输入法编码,按表一所述排列序号来输入。从而为不具全键盘的通讯工具,如手机等输入汉字提供方便。
本发明与已有技术相比具有下列优点:一是可以将汉字以码串的形态用英文字母来表示,从而形成汉字的固定代码,且该固定代码能精准地表示出汉字的读音和字形结构,避免了汉语拼音不能区分同音字的缺陷,这样就为汉字在计算机领域的应用提供了可能,使其能成为像英文那样可作为电脑语言文字使用的中国文字,进而实现汉字的现代化;二是对汉字采用了符合中国文化传统和汉字文化的字件编码方法,使其在取码过程中,不但能了解汉字的字型结构,同时还能掌握字意和其在汉语中的词意,为汉字的学习、汉语的应用提供帮助,可成为一种从“娃娃”抓起学习汉字的方法,特别是能为非汉语国家的学习人群提供帮助,以解决“汉字难学”和“汉字难查”的问题;三是可以实现“见字识码”、“见码识字”和“字码互识”与“字码互换”的功能,进一步提升了学习的帮助性和使用的便利性;四是没有重码,提高了输入速度;五是对认识的和不认识的汉字均可输入,而使用方便。
具体实施方式:
本发明汉字的输入方法,对认识的汉字,采用单、双拼音码加字件码的编码方法输入,对不认识的汉字和词组采用字件码的编码方法输入,前者主要解决汉字现代化的问题,同时,提供一种快速的汉字输入方法,后者主要解决对不认识汉字和词组的输入问题,是对前者在汉字输入上的补充。具体方法如下:
一、单、双拼音码加字件码(简称字码)输入法:
(1)、单拼:
1)、标码:首码是韵符韵母字母,次码是字首码,最后是字尾码,为三字母格式,如“瓮”字,首码是韵符鼻韵母u/,次码是字首码w,最后是字尾码m,编码为u/wm,选取输入方法图标,单击计算机键盘上对应的u、/、w和m键,既可输入“瓮”字,又可只输入码串u/wm作“瓮”字的固定代码,且两者之间通过图标可循环切换输入和显示(下同),又如“寓”字,首码是韵符双用字母-v,次码是字首码y,最后是字尾码u,编码为-vyu.
2)、简码:一为韵母字母的一字母格式,如“啊”字的简码是a,“鹅”字的简码是e,“无”字的简码是u,“外”字的简明是-g,“湾”字的简码是-h,“要”字的简码是-j,“昂”字的简码是a/,“应”字的简码是i/;二为首码是韵符韵母字母,次码是字首码的二字母格式,如“迎”字,首码是韵符鼻韵母i/,次码是字首码w,简码为i/w,又如“委”字,首码是韵符双用字母-s,次码是字首码r,简码为-sr.简码字实则就是击完计算机键盘上对应的键后,则出现在屏显选择框的第一位,补空格键或序号键即可输入(下同)。
(2)、双拼:
1)、标码:首码是声母字母,次码是韵母字母,第三码是字首码,最后是字尾码,为四字母格式,如“铸”字,首码是声母v,次码是韵母u,第三码是字首码j,最后是字尾码s,编码为vujs,又如“胆”字,首码是声母d,次码是韵符鼻韵母a\,第三码是字首码g,最后是字尾码s,编码为da\gs.
2)、简码:为双拼字母或双拼字母加字首码的二字母或三字母格式,如“把”字,首码是声母b,次码是韵母a,简码为ba,“参”字,首码是声母c,次码是韵符鼻韵母a\,简码为ca\,其为二字母格式;又如“答”字,首码是声母d,次码是韵母a,第三码是字首码r,简码为dar,“哼”字,首码是声母h,次码是韵符鼻韵母e/,第三码是字首码b,简码为he/b,其为三字母格式。
(3)、五字母格式:在极个别的情况下使用五字母格式,如“籍”字的编码为jirg,“稽”字的编码也是jirg,在“稽”字的编码jirg之后加序号a,这样“稽”字的编码就变为五字母格式jirga,从而消除重码。
本发明在所述单、双拼音的定义中,单韵母o代表o和uo两个韵母。o和uo有一种互补关系,当声母b、p、m、f和o相拼时,o发o的音;当其他声母和o相拼时,o会自动发uo的音,决不混淆冲突。其输入方法可区分同音字,如:
仓ca/、伧ca/a、鸧ca/ao、沧ca/d、藏ca/e、苍ca/ep、舱ca/m;
操cb、嘈cbb、漕cbd、草cbe、槽cbf、cbi、艚cbm、螬cbo、糙cbr、曹cbs;
采cc、偲cca、菜cce、蔡cceq、材ccf、猜ccn、财cco、睬ccp、踩ccpf、彩ccpw、才ccs、裁ccsm;
策ce、侧cea、测ced、恻cek、厕cet、册cew;
发fa、伐faa、垡faah、法fad、砝fai、阀fam、筏far、罚fau、乏faw
二、字件码输入法:
(1)、标码汉字:为四字母格式,根据构成汉字的字件数分为:
1)、四字件字及以上:按笔顺依次取前三码和字尾码,如四字件字“畸”字,字件拆分为:字首为田,码名是h、第二字件为大,码名是t,第三字件为丁,码名是s,字尾为口,码名是b,编码为htsb,选中该输入方法图标,单击计算机键盘上对应的h、t、s和b键,即可输入“畸”字,当然,也可在屏显时击其序号输入,当选中“畸”字,切换输入法图标,则可显示“畸”字的单、双拼音输入法的编码码串jihs,又如五字件字“膛”字,字件拆分为:字首为月,码名是g、第二字件为码名是u,第三字件为冖,码名是y,字尾为土,码名是h,编码为guyh。
2)、三字件字:取码为字首码+第二字件码+第三字件码+第三字件尾码,如“诿”字,字件拆分为:字首为讠,码名是k,第二字件为禾,码名是r,第三字件为女,码名是h,第三字件“女”为类意部首,末笔未被包含,尾码则也是女的码名h,故“诿”的编码为krhh。又如“固”字,字件拆分为:字首为囗,码名是u,第二字件为十,码名是s,第三字件为口,码名是b,第三字件“口”为类意部首,末笔未被包含,尾码则也是口的码名b,故“固”的编码为usbb。
3)、二字件字:取码为字首码+第二字件码+第二字件尾码+第一字件尾码,如“圾”字,字件拆分为:字首为土,码名是h,第二字件为及,码名是w,第二字件“及”是独体字,末笔是捺,尾码属捺的码名x,第一字件“土”为类意部首,末笔未被包含,尾码则也是土的码名h,故“圾”字的编码为hwxh,又如“医”字,字件拆分为:字首为匸,码名是t,第二字件为矢,码名是m,第二字件“矢”是类意部首,末笔未被包含,尾码也是矢的码名m,第一字件“匸”为表形部首,独体结构,末笔是折,尾码是折的码名z,故“医”字的编码为tmmz.
(2)、简码汉字:为一、二或三字母格式:
1)、一字母格式:如“走”字,为部首字,字首是部首走,码名是Q,又如“八”字,字首是撇曲折,码名是w,这类字实则就是键名字。
2)、二或三字母格式:如“答”字,简码是ra,“把”字,简码是cz,又如“邀”字,简码是qxv,“会”字,简码是asz.
(3)、五码汉字或词组:
1)、五码汉字:如化amma、仑amma和佤amma三个单字的编码均为“amma”,于是在“仑”的编码后添加一个序号字母a,变为ammaa,在“佤”的编码后添加一个序号字母b变为ammab,这样便消除了重码,因此,第五码为区别码,它用由26个英文字母排序的序号字母为码,理论上讲,可以消除任何四个字母编码的重码,因为这样的重码不可能超过26个。
2)、词组:分三种情况:一是两个单字的词组,取第一个字的第一第二两个字件的码名,第二个字的字首码,再加字数2,如“历(tzv)程(rbih),编码为tzr2;二是三个单字的词语,取每个字的字首码,再加字数3,如“李(fhhf)瑞(iitu)环(ituh)”,编码为fii3;三是四个单字及以上的词语,取第一、第二、第三和最后一个单字的字首码,然后加词语的字数,就是多字词语的编码,如12字词语“建(zzx)设(kmmk)有(tggv)中国特色的社会主义(ywxy)”的编码为zkty12.
三、序号输入法:
即根据单、双拼音输入法编码,用表一所述数字序号代替字母来进行汉字的输入,如“寓”字,首码是韵符双用字母-v,“一”的序号是“00”,“v”的序号是“30”,次码是字首码y,“y”的序号是“33”,最后是字尾码u,“u”的序号是“27”,编码为-vyu,序号编码则为“00303327”,又如“参”字的编码为“ca\”,c的序号是05,a\的序号是02,序号编码为“0502”。
四、字件拆分详解:
(1)、字件的界定:
1)、字件的界定是按笔顺以部首最先、字件字其次、字件笔画最后的原则依次界定字件,如“拿”字应分解为“人”、“一”、“口”和“手”四个字件,而不能分解为“合”“手”两个字件;如“孬”字应分解为“不”、“女”和“子”三个字件,而不是“不”、“好”两个字件。
2)、笔画多的部首可包括笔画少的部首、字件字或字件笔画,但包含后必须仍为部首;如部首“邑”,不能分解为部首“口”和字件字“巴”,因多笔画的“邑”可包含少笔画的“口”和“巴”。
3)、字件字不能包含表意部首,但可包含表形部首、笔画少的字件字或字件笔画,但包含后必须仍为字件字,如“架”字,字首应分解为表形部首“力”,而不能分解为字件字“加”,因字件字“加”,不能包含表意部首“口”;又如“刚”字,应分解为“冈”和“刂”,因“冈”可包含表形部首“冂”,所述的字件字均是现用汉字的通用字。
4)、字件笔画不能包含部首和字件字,但可包含笔画少的字件笔画,但包含后必须仍为字件笔画;如“收”字,应分解为字件笔画“丩”和表形部首“攵”两个字件,而不是“乚”、“丨”和“攵”三个字件。
(2)、汉字的分解:
1)、按笔顺分解,依次排列;如“望”字,分解为字件字“亡”、表意部首“月”和表意部首“王”三个字件,又如“亡”字,分解为表形部首和字件笔画“乚”两个字件。
2)、第一个字件必须包含首笔或部首字的部首,称字首,如“曼”字的字首是“曰”,“国”字的字首是“囗”,又如“香”字,是部首字,字首则是“香”。
3)最后一个字件必须包含尾笔,称字尾,按汉字的结构分类,合体字、独体字和部首字,尾笔尊从笔顺的末笔,全包围结构的汉字,尾笔尊从被包围部分的末笔,半包围结构的汉字,按笔顺首笔在包围部分,尾笔则尊从被包围部分的末笔,首笔在被包围部分,尾笔则尊从包围部分的末笔;如“圆”字,是全包围结构字,首笔在包围部分“囗”,被包围部分“员”,分解成两个表意部首“口”和“贝”,末笔在“贝”,则尾笔尊从“贝”的末笔,字尾是“贝”,又如“匡”字,是半包围结构字,首笔在包围部分匸、尾笔则尊从被包围部分“王”的末笔,字尾则是“王”,再如“送”字,也是半包围结构字,首笔在被包围部分“关”,尾笔则尊从包围部分“辶”的末笔,字尾是“辶”。
4)、独体字是由字件笔画组成,它的每个单笔画就是一个字件;如“与”字,字件拆分为横曲折“一”、独立折“”和横直空“一”,所述横直空是指在横后面的次笔是直笔画或空笔画就叫横直空。
5)、分解部首字时,要将部首作为第一字件,然后进一步分解,包含首笔的字件就成了第二字件,余者类推,部首字就是作为部首的单字,如部首字“香”,字首是“香”码名为q,,原本第一字件的“禾”作第二字件,码名是r,原本第二字件的“日”作第三字件,码名是g,则部首字“香”的组码是qrg.
(3)、字件的尾码:
1)、单义部首的尾码就是该部首的码名;如单义部首“口”的码名是“b”,其尾码也是“b”,如“扣”字是由字件“扌”、“口”组成,字件组码是cbb;
2)、类意部首的末笔如果被另一个表意部首所包括,尾码就是另一个部首的码名,否则就是自身的码名;如类义部首“石”的末笔被另一个表意部首“口”所包含,“口”的码名“b”就是部首“石”的尾码,如“拓”字是由字件“扌”和“石”组成,“扌”的码名是c,“石”的码名是i,尾码是“口”的码名“b”,故“拓”字的组码是“cib”,又如类义部首“子”的末笔没有被另一个表义部首所包含,“子”的码名是“h”,故尾码也是“h”,如“季”字是由字件“禾”和“子”组成,其组码是rhh.
3)、表形部首和字件字的尾码是包含字件末笔的部首、字件字和字件笔画,如字件“页”是表形部首,码名是t,末笔被类义部首“贝”包含,“贝”的码名是o,故字件“页”的尾码是o,如“硕”字是由字件“石”和“页”组成,“石”的码名是i,则“硕”字的组码就是ito;又如字件“失”是字件字,码名为v,其尾码也是字件字“夫”,码名为s,故“失”的尾码是s,如“佚”字是由字件“亻”和“失”组成,单意部首“亻”的码名是a,尾码也是“亻”的码名a,则“佚”字的组码是avsa.
4)、字件笔画的尾码也是字件笔画;如单字“今”是由单意部首“人”码名为a和字件笔画“”码名为y组成,“”的尾码是笔画少的字件笔画“”,码名为z,故“今”字的组码是ayz.
五、直接使用现汉字码的文章举例:
(1)、Xkidchpaha\dziyziymaideqiiqkiiy现代化汉字字码的意义;
(2)、Xkidchpaha\dziyziymaiwigwiyxkiha\dziyxkidchpadeqguudi/ydcmaiherfumvuuha\dziypi\cinbjxi/sbjiiqkdeqgo/jvu.现代化汉字字码是实现汉字现代化的固定代码和辅助汉字拼音表形表意的工具。
Claims (3)
1.一种作为电脑汉字的现汉字码三位一体输入法,所述的现汉字码是将汉字转化为可用计算机标准键盘输入并能被计算机识别且显示的汉字的固定代码,该固定代码包括用26个英文字母作码名,并一一与计算机标准键盘的26个英文字母键名相对应,其特征在于所述的固定代码是由表示汉字读音的单、双拼音码和表示汉字意形的字件码所组成,并能以码串的形态或字码互换的形态精准地表示出汉字的读音和意形结构,其方法如下:
a、汉字读音的取码:
(1)、汉字的单、双拼音定义:单拼就是在汉语拼音中用一个英文字母表示的韵母自成音节;双拼就是在汉语拼音中把由多字母组成的拼音一律简化为用两个英文字母表示的拼音音节;汉语拼音有21个声母,其中zh、sh和ch是由二个字母组成,为了简化为一个字母,分别用v代表zh,w代表sh,y代表ch;汉语拼音有35个韵母,除a、e、i、o和u共5个单韵母外,其余都是二个或多于二个字母的复韵母,为了能用一个字母来表示,一是单韵母o和复韵母uo同用字母o,二是引入1个前鼻音符号“\”、1个后鼻音符号“/”和1个零声母符号“-”这三个韵符及与声母可合用同一字母的声韵双用字母的概念;这样,根据汉语拼音(简称全拼)的发音规则,所述21个声母和35个韵母便能用26个英文字母中的单个字母或单个字母加韵符组成的韵符字母来表示,其拼写和读音如表一:
表一
(2)、拼写方法:根据汉语拼音的全拼规则,汉字的发音可分为声韵双拼音节和韵母自成单拼音节两种类型,前者,第一个字母对应于汉语拼音的声母的发音,称声位字母,第二个字母对应于汉语拼音的韵母的发音,称韵位字母,在声位是声母,在韵位是韵母,读音清楚,因此,便直接拼写双拼字母;后者,由于是单拼的韵母自成音节,在音节中没有声母,因此,为了能区分读音,对是单韵母的,则要重写字母,对是复韵母的,在全拼中是二字母的则直接拼写全拼字母,是三字母或以上的则要在字母前面加零声母符号“-”占位,从而表示其后的字母是韵母,按韵母发音,有鼻韵母符号“\”“/”的韵符鼻韵母则可直接成为单拼的韵母自成音节;
(3)、取码方法:按汉字的读音,直接取所述单、双拼音拼写方法中的字母或韵符字母作码名,所述的韵符字母,其韵符和字母必须当作一个整码看待,不能分割;
b、汉字的字件取码:
一、汉字的字件定义:字件是构成汉字字形的基本单元,它包括部首、字件字和字件笔画三种,任何一个汉字都可被拆分成字件单元,其中,部首是指国家在1983年颁布的《汉字统一部首(草案)》中所规定的201个部首,字件字是指汉字构成中可作字件的单字,字件笔画是指汉字构成中既不是部首,也不是字件字的单笔画或多笔画;
二、汉字的字件分类:字件可分为表意字件和表形字件两类,大部分能表示汉字字意的部首均归入表意字件,称表意部首,字件字、字件笔画和少部分无法表意或虽能表意但字数太少无法汇集成类的部首都归入表形字件;
三、汉字的字件取码:
(1)、表意字件的取码:表意字件仅涉及表意部首,这部分部首按构成汉字的数量、表意的方式和文化特征以及便于记忆的原则,又分为单意部首和类意部首;单意部首构成的汉字众多,表意较为确定,可单独成类;类意部首构成的汉字多少不等,表意比较复杂,按中国的文化传统,以名词为中心归纳为天时、地利、人和、动物和植物五个大类,其中地利分为地母、山石和金火三类,人和分为言心、衣料和门器三类,动物分为哺乳、非哺乳、肢体器官和行为状态感觉四类;每类确定一个与计算机标准键盘相对应的英文字母作码名;
(2)、表形字件的取码:由字件的首笔画和次笔画共同确定一个与计算机标准键盘相对应的英文字母作码名,首笔画有横、竖、撇、点和折五种,横包含提,竖包含竖钩,点包含捺,次笔画有直笔、空笔和曲折笔画三种,横、竖为直笔,没有次笔为空笔,撇、点和折为曲折笔;
(3)、26个英文字母作码名配置的字件如表二:
表二
四、字件的界定:字件是构成汉字的基本单元,界定字件是分解汉字的基础,其原则如下:
(1)、部首最先,字件字其次,字件笔画最后;
(2)、笔画多的部首可包括笔画少的部首、字件字或字件笔画,但包含后必须仍为部首;
(3)、字件字不能包含表意部首,但可包含表形部首、笔画少的字件字或字件笔画,但包含后必须仍为字件字;
(4)、字件笔画不能包含部首和字件字,但可包含笔画少的字件笔画,但包含后必须仍为字件笔画;
五、汉字的分解:就是将一个汉字拆分成字件单元,其分解原则如下:
(1)、按笔顺分解,依次排列;
(2)、第一个字件必须包含首笔或部首字的部首,称字首;
(3)、最后一个字件必须包含尾笔,称字尾,按汉字的结构分类,合体字、独体字和部首字,尾笔遵从笔顺的末笔,全包围结构的汉字,尾笔遵从被包围部分的末笔,半包围结构的汉字,按笔顺首笔在包围部分,尾笔则遵从被包围部分的末笔,首笔在被包围部分,尾笔则遵从包围部分的末笔;
(4)、独体字是由字件笔画组成,它的每个单笔画就是一个字件;
(5)、分解部首字时,要将部首作为第一字件,然后进一步分解,包含首笔的字件就成了第二字件,余者类推;部首字作键名时,码名就是部首的代码;
六、字件的取码:
(1)、字件码,就是字件归属的码名;
(2)、字件尾码,就是字件的末笔包含的部首、字件字或字件笔画归属的码名,分为:
1)、单义部首的尾码就是该部首的码名;
2)、类意部首的末笔如果被另一个表意部首所包含,尾码就是另一个部首的码名,否则就是自身的码名;
3)、表形部首和字件字的尾码就是字件末笔包含的部首、字件字和字件笔画归属的码名;
4)、字件笔画的尾码就是字件末笔画的码名;
c、汉字的组码:
一、组码的方法:
(1)、单、双拼音和字件组码;或
(2)、字件组码;
二、组码规则:
(1)、单、双拼音和字件组码:单或双拼音码+字首码+字尾码;
(2)、字件组码,根据构成汉字的字件数分为:
1)、四个字件及以上:字首码+第二字件码+第三字件码+字尾码;
2)、三个字件:字首码+第二字件码+第三字件码+第三字件尾码;
3)、二个字件:字首码+第二字件码+第二字件尾码+第一字件尾码;
三、编码输入方法:
(1)、认识的汉字,采用组码规则(1)编码,单拼汉字全码为三码,双拼汉字全码为四码,全码称标码,击完计算机键盘上对应的字母,则输入上屏,少于全码称简码,补空格键,则输入上屏,下同,多于四码为区别码,一个汉字一至五码输入:
1)、一个汉字只用单、双拼音码就能表示的,编码为一或二字母格式;
2)、一个汉字需要加上字首码才能表示的,编码为二或三字母格式;
3)、一个汉字还需加上字尾码才能表示的,编码为三或四字母格式;
4)、一个汉字在四字母格式还有重码的,就要加上由26个英文字母排序的序号字母,编码为五字母格式;
(2)、不认识的汉字和词组,采用组码规则(2)编码,标码为四码,少于
四码为简码,多于四码为区别码,一个汉字一至五码输入:
1)、一个汉字只用字首码就能表示的,编码为一字母格式;
2)、一个汉字要用二个字件码才能表示的,编码为二字母格式;
3)、一个汉字要用三个字件码才能表示的,编码为三字母格式;
4)、一个汉字要用四个字件码才能表示的,编码为四字母格式;
5)、一个汉字在四字母格式还有重码的,就要加上由26个英文字母排序的序号字母,编码为五字母格式;
6)、二字词组,取第一个字的字首码和第二个字件码+第二个字的字首码+2;
7)、三字词组,取每个字的字首码+3;
8)、四字词组,取每个字的字首码+4;
9)、四字以上词组,取前三个字和最后一个字的字首码+字数;
d、汉字的三位一体输入法:
(1)、显示码串输入法,定义一个图标,表示其屏显形态,按组码规则(1)编码,汉字直接以码串的英文形态输入;或
(2)、显示汉字的单、双拼音输入法,定义一个图标,汉字按组码规则(1)的编码方法输入;或
(3)、显示汉字的字件码输入法,定义一个图标,汉字按组码规则(2)的编码方法输入;
(4)、所述的输入方法,可以按图标循环切换输入和显示,且当切换至显示码串时,则显示汉字的单、双拼音输入法码串。
2.根据权利要求1所述的现汉字码三位一体输入法,其特征在于所述的用26个英文字母作码名,并一一与计算机标准键盘26个英文字母键名相对应的键名字如表三:
表三
3.根据权利要求1所述的现汉字码三位一体输入法,其特征在于所述表一的排列序号也可用作所述单、双拼音的输入编码。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210015293.1A CN102609106B (zh) | 2012-01-16 | 2012-01-16 | 作为电脑汉字的现汉字码三位一体输入法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210015293.1A CN102609106B (zh) | 2012-01-16 | 2012-01-16 | 作为电脑汉字的现汉字码三位一体输入法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102609106A CN102609106A (zh) | 2012-07-25 |
CN102609106B true CN102609106B (zh) | 2015-11-25 |
Family
ID=46526543
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210015293.1A Expired - Fee Related CN102609106B (zh) | 2012-01-16 | 2012-01-16 | 作为电脑汉字的现汉字码三位一体输入法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102609106B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105045410B (zh) * | 2015-08-25 | 2019-02-12 | 任仰福 | 一种形式化拼音和汉字对应识别的方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1251437A (zh) * | 1999-11-05 | 2000-04-26 | 苏卫 | 三笔汉字输入法及其键盘 |
CN1525292A (zh) * | 2003-02-26 | 2004-09-01 | 唐显滇 | 计算机汉字九宫输入方法 |
CN101840271A (zh) * | 2010-04-18 | 2010-09-22 | 罗丰顺 | 纯声输入法 |
CN102221898A (zh) * | 2010-04-13 | 2011-10-19 | 刘汉龙 | 模糊三维拼音码汉字输入法 |
-
2012
- 2012-01-16 CN CN201210015293.1A patent/CN102609106B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1251437A (zh) * | 1999-11-05 | 2000-04-26 | 苏卫 | 三笔汉字输入法及其键盘 |
CN1525292A (zh) * | 2003-02-26 | 2004-09-01 | 唐显滇 | 计算机汉字九宫输入方法 |
CN102221898A (zh) * | 2010-04-13 | 2011-10-19 | 刘汉龙 | 模糊三维拼音码汉字输入法 |
CN101840271A (zh) * | 2010-04-18 | 2010-09-22 | 罗丰顺 | 纯声输入法 |
Also Published As
Publication number | Publication date |
---|---|
CN102609106A (zh) | 2012-07-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101089795B (zh) | 单击与并击输入中英文的方法和键盘 | |
CN111880667A (zh) | 音素同声近位常用汉字码输入法 | |
CN110096162B (zh) | 新型键位布局的键盘及应用于电子设备的多拼输入法 | |
CN103616960A (zh) | 六元音字母双拼输入法 | |
CN102053719B (zh) | 华文汉字输入法 | |
CN102609106B (zh) | 作为电脑汉字的现汉字码三位一体输入法 | |
CN103246354A (zh) | 以通用语文字编码表达汉字的输入法及其键盘 | |
TW201314498A (zh) | 嵌合字根式中文輸入法 | |
Voegelin et al. | Typological classification of systems with included, excluded and self-sufficient alphabets | |
CN106959764B (zh) | 一种有助于正确书写汉字的形码输入法 | |
CN105278697B (zh) | 组合式双拼类主副码汉字、词语编码输入法及其键盘 | |
CN104536590B (zh) | 基于西夏文声韵字根输入法的嵌入式软键盘系统 | |
CN101957662B (zh) | 带有汉字元素的计算机和手机汉字输入键盘及输入方法 | |
CN1022350C (zh) | 汉字字母编码输入法 | |
CN106325540A (zh) | 一种滇东北次方言苗文的简笔输入法及其应用 | |
CN1062361C (zh) | 音形派生键形码计算机汉字输入方法 | |
CN107357445B (zh) | 能够并读并写或与汉字合写辅助拼写字母的输入方法 | |
CN106708284A (zh) | 二十部件汉字码输入法 | |
CN105892703A (zh) | 首笔音素字母三拼输入法 | |
CN1056007C (zh) | 一种以汉字音角特征为信息元的计算机汉字输入方法 | |
CN105204657B (zh) | 组合式拼音类主副码汉字、词语编码输入法及其键盘 | |
CN1206582C (zh) | 汉字输入法 | |
CN104238765A (zh) | 中小学生键盘,标拼码输入法 | |
CN110442246A (zh) | 一种汉字部件输入法 | |
CN1108553C (zh) | 通用普及型音元形音汉字编码输入方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20151125 Termination date: 20170116 |