CN101825949B - 一种汉字部件拼音化的汉字输入方法 - Google Patents
一种汉字部件拼音化的汉字输入方法 Download PDFInfo
- Publication number
- CN101825949B CN101825949B CN 200910052622 CN200910052622A CN101825949B CN 101825949 B CN101825949 B CN 101825949B CN 200910052622 CN200910052622 CN 200910052622 CN 200910052622 A CN200910052622 A CN 200910052622A CN 101825949 B CN101825949 B CN 101825949B
- Authority
- CN
- China
- Prior art keywords
- chinese character
- component
- chinese
- key
- vowel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明公开了一种汉字部件拼音化的汉字输入方法,可以在不知道欲输入汉字的发音的情况下仍然能够准确输入该汉字,而且不会大幅增加汉字输入的码长。其技术方案为:方法包括:(1)将汉字按照书写顺序分解为汉字部件的有序序列,汉字部件分为基础部件和合成部件,合成部件是由若干个基础部件组成的;(2)顺序选取汉字部件的有序序列中的汉字部件,并确定每个汉字部件的读音;(3)依序输入选取的汉字部件的读音的拼音编码,从而输入汉字。本发明应用于汉字的输入。
Description
技术领域
本发明涉及一种基于计算机通用键盘的汉字输入方法,尤其涉及一种以形音结合为基础的汉字输入方法。
背景技术
目前的汉字输入方法或是以字音作为编码依据,如全拼输入、双拼输入等,或是以字形作为编码依据,如五笔输入、笔画输入等。
对于以字形为编码依据例如五笔输入的输入法而言,由于汉字的造字比较复杂,拆分出来的字根数量庞大,要将这么多的字根映射到计算机键盘上,往往一个按键上会设置多个字根。而且,字根与键位本身的关联度不高,这两个因素叠加,造成用户记忆上的困难。
对于以字音为编码依据例如全拼输入的输入法而言,由于要准确输入汉字需要先知道这个汉字的读音,用户对于不认识的生字就无能为力了。尤其是对于一些生僻字,多用于人们的姓名之中,例如“篪”,在不知道其发音的情况下,这个字根本无法通过字音为编码依据的输入法进行输入。
发明内容
本发明的目的在于解决上述问题,提供了一种汉字部件拼音化的汉字输入方法,可以在不知道欲输入汉字的发音的情况下仍然能够准确输入该汉字,而且不会大幅增加汉字输入的码长,从而使得汉字输入变得更为高效、规范和易用。
本发明的技术方案为:本发明提出了一种汉字部件拼音化的汉字输入方法,包括:
(1)将汉字按照书写顺序分解为汉字部件的有序序列,汉字部件分为基础部件和合成部件,合成部件是由若干个基础部件组成的;
(2)顺序选取汉字部件的有序序列中的汉字部件,并确定每个汉字部件的读音;
(3)依序输入选取的汉字部件的读音的拼音编码,从而输入汉字。
根据本发明的汉字部件拼音化的汉字输入方法的一实施例,在步骤(1)中,如果在汉字分解中的若干个相邻的基础部件可组合成一个合成部件且该合成部件是成字的合成部件,则以该合成部件而不是该若干个基础部件作为该汉字部件的有序序列的组成。
根据本发明的汉字部件拼音化的汉字输入方法的一实施例,在步骤(2)中,如果汉字部件的有序序列中存在至少四个汉字部件,则选取其中的第一汉字部件、第二汉字部件以及末尾汉字部件。
根据本发明的汉字部件拼音化的汉字输入方法的一实施例,在步骤(1)中,对汉字的分解遵循以下的三个原则的任意一个组合:
(1.a)对汉字进行汉字部件的拆分时,相离、相接可拆,交重不拆;
(1.b)字形符合理据时,进行有理据拆分,无法分析理据或字形与字源矛盾的,依字形进行无理据拆分;
(1.c)对于没有定义的汉字部件或者用户无法确定的汉字部件,以一特定符号表示。
根据本发明的汉字部件拼音化的汉字输入方法的一实施例,步骤(2)的确定汉字部件的读音进一步包括:
(2.a)对于所有的基础部件,按照各个基础部件的主形部件确定读音;或者
(2.b)对于主形部件的基础部件,按照该基础部件的主形部件确定读音,对于附形部件的基础部件,按照该基础部件的附形部件确定读音;
其中主形部件和附形部件在“信息处理用GB13000.1字符集汉字部件规范”内的《汉字基础部件表》中定义或依国家教育部2009年3月24日发布的《现代常用字部件及部件名称规范》予以定义。
根据本发明的汉字部件拼音化的汉字输入方法的一实施例,步骤(3)中的汉字部件的读音的拼音编码方式包括以下三种拼音编码方式的任意一种,组成汉字的部件有序序列的拼音编码组合是以下三种拼音编码方式的任意一种组合:
全拼拼音编码;
元拼拼音编码:基于元拼拼音编码的部件输入包括:(1)如果有声母,则输入部件的声母,声母由单字母声母和双字母声母组成,其中单字母声母包括b、p、m、f、d、t、n、l、g、k、h、j、q、x、z、c、s、r、y、w,双字母声母包括zh、ch、sh,其中单字母声母通过键入对应的英文字母键来输入,双字母声母通过键入两个对应的英文字母键输入或者从A、E、I、O、U、V键中任选三个键代表三个双字母声母,输入代表双字母声母的单个英文字母键;(2)如果有辅韵母,则输入部件的辅韵母,辅韵母是i、u、ü,其中辅韵母i通过键入英文字母I键输入,辅韵母u通过键入英文字母U键输入,辅韵母ü通过键入英文字母V键输入;(3)输入部件的元韵母,元韵母由单字母元韵母和多字母元韵母组成,其中单字母元韵母由a、e、i、o、u、ü组成,多字母元韵母由ai、an、ang、ao、ei、en、eng、ong、ou组成,其中,单字母元韵母a、e、i、o、u通过键入对应的英文字母键输入,单字母元韵母ü通过键入V键输入,多字母元韵母通过从B、P、M、F、D、T、N、L、G、K、H、J、Q、X、Z、C、S、R、Y、W以及“;”键中选择9个键来分别输入;
元拼拼音扩展编码:基于元拼拼音扩展编码的部件输入包括:(1)如果有声母,则输入部件的声母,声母由单字母声母和双字母声母组成,其中单字母声母包括b、p、m、f、d、t、n、l、g、k、h、j、q、x、z、c、s、r、y、w,双字母声母包括zh、ch、sh,其中单字母声母通过键入对应的英文字母键来输入,双字母声母从A、E、I、O、U、V键中任选三个键代表三个双字母声母,输入代表双字母声母的单个英文字母键;(2)输入部件的韵母,韵母包括单字母元韵母、多字母元韵母和复合韵母,单字母元韵母由a、e、i、o、u、ü组成,多字母元韵母由ai、an、ang、ao、ei、en、eng、ong、ou组成,复合韵母由er、ia、ie、iao、iou、ian、in、iang、ing、iong、ua、uo、uai、uei、uan、uen、uang、üe组成,其中,单字母元韵母a、e、i、o、u通过键入对应的英文字母键输入,单字母元韵母ü通过键入V键输入,多字母元韵母ai、an、ang、ao、ei、en、eng、ong、ou各自通过键入S、D、F、G、H、J、K、L、M键中的一个不同的按键来输入,复合韵母ia、in、iang、er、ie、iao、iou、ian、ing、uen、üe各自通过键入Q、W、R、T、Y、P、Z、X、C、B、N键中的一个不同的按键来输入,复合韵母iong通过键入表示多字母元韵母ong的键来输入,复合韵母uo通过键入O键来输入,复合韵母ui通过键入V键来输入,复合韵母ua通过键入表示复合韵母ia的键来输入,复合韵母uai通过键入表示复合韵母in的键来输入,复合韵母uang通过键入表示iang的键来输入,复合韵母uan通过键入表示er的键来输入。
根据本发明的汉字部件拼音化的汉字输入方法的一实施例,汉字部件、基础部件、合成部件在《信息处理用GB13000.1字符集汉字部件规范》中定义。
根据本发明的汉字部件拼音化的汉字输入方法的一实施例,对于步骤(2)中的汉字部件的读音的确定,如果汉字部件是成字的部件,依其汉字的发音,如果汉字部件是不成字的部件,根据预先设定的读音确定。
本发明还提出了一种汉字部件拼音化的汉字输入方法,该方法包括:
(1)确定汉字所归属的部首;
(2)确定汉字的读音以及部首的读音;
(3)依序输入汉字的读音的拼音编码以及部首的读音的拼音编码,从而输入汉字。
根据本发明的汉字部件拼音化的汉字输入方法的一实施例,步骤(2)中确定部首的读音,进一步包括:
(2.a)对于所有的部首,都以其主部首确定读音;
(2.b)对于是主部首的部首,以其主部首确定读音,对于是附形部首的部首,以其附形部首确定读音;
其中主部首和附形部首在《汉字部首表》(GF0011---2009)中定义;
对于汉字部首的读音的确定,如果汉字部首是成字的部首,依其汉字的发音,如果汉字部首是不成字的部首,根据预先设定的读音确定。
根据本发明的汉字部件拼音化的汉字输入方法的一实施例,步骤(3)中汉字的拼音编码以及部首的拼音编码,进一步包括:
(3.a)全拼拼音编码;
(3.b)元拼拼音编码:基于元拼拼音编码的汉字或部首输入包括:(1)如果有声母,则输入汉字或部首的声母,声母由单字母声母和双字母声母组成,其中单字母声母包括b、p、m、f、d、t、n、l、g、k、h、j、q、x、z、c、s、r、y、w,双字母声母包括zh、ch、sh,其中单字母声母通过键入对应的英文字母键来输入,双字母声母通过键入两个对应的英文字母键输入或者从A、E、I、O、U、V键中任选三个键代表三个双字母声母,输入代表双字母声母的单个英文字母键;(2)如果有辅韵母,则输入汉字或部首的辅韵母,辅韵母是i、u、ü,其中辅韵母i通过键入英文字母I键输入,辅韵母u通过键入英文字母U键输入,辅韵母ü通过键入英文字母V键输入;(3)输入汉字或部首的元韵母,元韵母由单字母元韵母和多字母元韵母组成,其中单字母元韵母由a、e、i、o、u、ü组成,多字母元韵母由ai、an、ang、ao、ei、en、eng、ong、ou组成,其中,单字母元韵母a、e、i、o、u通过键入对应的英文字母键输入,单字母元韵母ü通过键入V键输入,多字母元韵母通过从B、P、M、F、D、T、N、L、G、K、H、J、Q、X、Z、C、S、R、Y、W以及“;”键中选择9个键来分别输入;
(3.c)元拼拼音扩展编码:基于元拼拼音扩展编码的汉字或部首输入包括:(1)如果有声母,则输入汉字或部首的声母,声母由单字母声母和双字母声母组成,其中单字母声母包括b、p、m、f、d、t、n、l、g、k、h、j、q、x、z、c、s、r、y、w,双字母声母包括zh、ch、sh,其中单字母声母通过键入对应的英文字母键来输入,双字母声母通过从A、E、I、O、U、V键中任选三个键代表三个双字母声母,输入代表双字母声母的单个英文字母键;(2)输入汉字或部首的韵母,韵母包括单字母元韵母、多字母元韵母和复合韵母,单字母元韵母由a、e、i、o、u、ü组成,多字母元韵母由ai、an、ang、ao、ei、en、eng、ong、ou组成,复合韵母由er、ia、ie、iao、iou、ian、in、iang、in g、iong、ua、uo、uai、uei、uan、uen、uang、üe组成,其中,单字母元韵母a、e、i、o、u通过键入对应的英文字母键输入,单字母元韵母ü通过键入V键输入,多字母元韵母ai、an、ang、ao、ei、en、eng、ong、ou各自通过键入S、D、F、G、H、J、K、L、M键中的一个不同的按键来输入,复合韵母ia、in、iang、er、ie、iao、iou、ian、ing、uen、üe各自通过键入Q、W、R、T、Y、P、Z、X、C、B、N键中的一个不同的按键来输入,复合韵母iong通过键入表示多字母元韵母ong的键来输入,复合韵母uo通过键入O键来输入,复合韵母ui通过键入V键来输入,复合韵母ua通过键入表示复合韵母ia的键来输入,复合韵母uai通过键入表示复合韵母in的键来输入,复合韵母uang通过键入表示iang的键来输入,复合韵母uan通过键入表示er的键来输入。
本发明对比现有技术有如下的有益效果:本发明的技术方案是将汉字按照书写顺序分解为汉字部件的有序序列,然后选取序列中的汉字部件,确定这些汉字部件的读音,通过输入这些汉字部件的读音的拼音编码(例如全拼拼音编码、元拼拼音编码或者元拼扩展拼音编码等)来输入汉字。对比现有技术的仅以字音为编码依据的汉字输入方法,本发明可以输入那些不知其发音的汉字。对比现有技术的仅以字形为编码依据的汉字输入方法,本发明无需记忆大量的字根与键位的映射关系,使得输入变得简单有效。
附图说明
图1是本发明的汉字部件拼音化的汉字输入方法的第一实施例的流程图。
图2是本发明的元拼拼音输入的实施例的流程图。
图3是本发明的元拼拼音扩展输入的实施例的流程图。
图4A和4B是本发明的元拼拼音扩展输入的实施例的键盘示意图。
图5是本发明的汉字部件拼音化的汉字输入方法的第二实施例的流程图。
具体实施方式
下面结合附图和实施例对本发明做进一步的描述。
在描述实施例之前,先介绍关于本发明的一些名词解释和技术背景。
本发明所涉概念与术语依据《信息处理用GB13000.1字符集汉字部件规范》(GF3001-1997)中定义如下:
笔画:构成楷书汉字字形的最小连笔单位,如横(一)竖(丨)撇(丿)点(丶)折(乛)等。
笔顺:汉字书写时笔画的次序和方向。
汉字部件:由笔画组成的具有组配汉字功能的构字单位,如“氵、亻、木、礻、口”等。
成字部件和非成字部件:可以独立成字的汉字部件称为成字部件,如“另、吉、可”中的“口”;不能独立成字的汉字部件称为非成字部件,如“疾、病、疟”中的“疒”。
基础部件和合成部件:最小的不再拆分的汉字部件称为基础部件,处于汉字结构的最底层,如“江”中的“氵”、“工”;有两个以上基础部件组成的汉字部件称为合成部件,如“想”中的“相”是合成部件,由“木”和“目”的两个基础部件组合而成。
部首部件和非部首部件:部首部件简称部首,部首是可以成批构字的一部分汉字部件,字典中该部首排在该批汉字的开头,作为查字的依据,如“十”、“厂”、“匚”、“卜”等。本发明涉及的汉字部首符合国家教育部和国家语言文字工作委员会2009年1月12日联合发布的《汉字部首表》(GF0011-2009)规范。不作为部首的汉字部件称为非部首部件,如“夬”、“七”、“廿”等。
主部首:有不同写法的部首中具有代表性的书写形式。
附形部首:附属于主部首的书写形式,有繁体(如門、馬)、变形(如刂、氵)和从属(如曰、已、歺)三种。
主形部件:《汉字基础部件表》(GF3001-1997)中各组第一个部件为主形部件,该部件选自同组部件,具有代表和称说本组部件的作用。
附形部件:《汉字基础部件表》(GF3001-1997)各组主形部件之后所列的相关部件为附形部件。附形部件包括与主形部件同源,仅在书写上略有差异的部件,也包括与主形部件形体近似的部件。
本发明遵循的国家标准规范有:《汉语拼音方案》、《汉字部首表》(GF0011-2009)、《信息处理用GB13000.1字符集汉字部件规范》(GF3001-1997)、《GB13000.1字符集汉字部首归部规范》(GF0012-2009)、《现代常用字部件及部件名称规范》(教育部与国家语委2009年3月24日联合发布)。
汉字是由笔画部件组成的方块文字,人们常说“弓长张、文刀刘、言午许、木子李”,更有古人诗句:“此木为柴山山出,因火成烟夕夕多”等等,表明人们对部件组成汉字结构的朴素认识。汉字结构与字形表现为汉字部件,汉字是由汉字部件有序序列组成的集合。
通过对汉字部件的深入研究和数理统计分析,发现汉字部件很多本身就是汉字,有一些是现代已不用的古字。如《汉字部首表》201个主部首、100个附形部首共301个部首中,成字部首195个,占比65%;《信息处理用GB13000.1字符集汉字部件规范》560个基础部件中成字基础部件比例超过50%;《现代常用字部件及部件名称规范》中成字主形部件305个,占全部514个部件的59%,占该规范441组部件的69%。结论是:可以通过定义非成字基础部件的读音音节,然后按读音的汉语拼音进行拼音化编码;对成字基础部件当然就按成字读音进行拼音化编码;任何成字的汉字部件都按成字读音进行拼音化编码。
汉字部件拼音化的汉字输入方法的第一实施例
图1示出了本发明的汉字部件拼音化的汉字输入方法的第一实施例的流程。请参见图1,下面是对方法流程的详细描述。
步骤S10:将汉字按照书写顺序分解为汉字部件的有序序列。
汉字部件分为基础部件和合成部件,合成部件是由若干个基础部件组成的。
如果在汉字分解中的若干个基础部件可组成一个合成部件而且这个合成部件是成字的合成部件,则以这个合成部件而不是这若干个基础部件作为这个汉字的汉字部件的有序序列的组成。比如,对于“想”,由于基础部件“木”和“目”组成合成部件“相”,而且“相”是成字的合成部件,则“想”的汉字部件的有序序列是(“相”、“心”),而不是(“木”、“目”、“心”)。
对于汉字的分解,还需遵循以下三个原则的任意一种组合:
(a)对汉字进行汉字部件的拆分时,相离、相接可拆,交重不拆(可拆成笔画)。例子如下:明-拆分为“日”、“月”(相离),名-拆分为“夕”、“口”(相接),串-不可拆分为“中”、“中”(交重),东-不可拆分为“七”、“小”(交重)。
(b)字形符合理据时,进行有理据拆分,无法分析理据或字形与字源矛盾的,依字形进行无理据拆分。根据字源或参考字源,从汉字的部件组合中分析出的造字意图,称为结构理据。如,“旦”的理据是像太阳(日)从地平线(一)升起,“架”的理据是从“木”、“加”声。理据、形与源涉及汉字学的基本知识,在此不详加描述。
(c)对于没有定义的汉字部件或者用户无法确定的汉字部件,以一特定符号表示,例如以字符“?”表示,也可称为万用部件。
步骤S12:选取汉字部件的有序序列中的汉字部件,并确定每个汉字部件的读音。
选取是依照书写顺序来选取的,如果一个汉字的有序序列中的汉字部件少于4个,则选取全部的汉字部件,如果汉字部件大于等于4个,则选取其中的第一个汉字部件、第二个汉字部件以及最后一个汉字部件。
对于汉字部件的读音的确定,是以这样的方式来确定的:对于所有的基础部件,按照各个基础部件的主形部件来确定读音。或者是,对于主形部件的基础部件,按照该基础部件的主形部件确定读音;对于附形部件的基础部件,按照该基础部件的附形部件确定读音。
从是不是成字的汉字部件的角度来考虑,对于成字的汉字部件,依其成字的读音,如果不是成字的汉字部件,依《现代常用字部件及部件名称规范》及预先设定的定义确定读音,即:a、读古音。如“宀”读“mian”,“辶”读“chuo”等;b、按笔画部件读音。如“丨”读“shu”等;c、按俗称定义部件读音。如“纟”,俗称“绞丝旁”,读“si”或定义为“js”;d、按部位或典型例字定义部件读音。如“口”,读“围”等。对于非成字的汉字基础部件的读音的预设,请参见说明书中的《非成字基础部件读音定义表》。《非成字基础部件读音定义表》中的序号和组号就是“信息处理用GB13000.1字符集汉字部件规范”内的《汉字基础部件表》中的序号和组号。
步骤S14:依序输入选取的汉字部件的读音的拼音编码,从而输入汉字。
汉字部件的读音的拼音编码方式包括以下三种拼音编码方式的任意一种:
(一)全拼拼音编码,即按照《汉语拼音方案》编码逐一输入的方式。
(二)元拼拼音编码,申请人在2007年8月13日申请现已获得中国专利局授予发明专利权的、发明名称为“一种元拼拼音汉字输入方法”、申请号为“200710044815.X”的中国发明专利已经揭示了这种元拼拼音编码。图2示出了这种基于元拼拼音编码的输入方法的流程,请参见图2,这种汉字(在本实施例中可以是针对部件的输入)输入包括以下步骤:(1)如果有声母,则输入汉字(或部件)的声母,声母由单字母声母和双字母声母组成,其中单字母声母包括b、p、m、f、d、t、n、l、g、k、h、j、q、x、z、c、s、r、y、w,双字母声母包括zh、ch、sh,其中单字母声母通过键入对应的英文字母键来输入,双字母声母通过键入两个对应的英文字母键输入或者从A、E、I、O、U、V键中任选三个键代表三个双字母声母,输入代表双字母声母的单个英文字母键;(2)如果有辅韵母,则输入汉字(或部件)的辅韵母,辅韵母是i、u、ü,其中辅韵母i通过键入英文字母I键输入,辅韵母u通过键入英文字母U键输入,辅韵母ü通过键入英文字母V键输入;(3)输入汉字的元韵母,元韵母由单字母元韵母和多字母元韵母组成,其中单字母元韵母由a、e、i、o、u、ü组成,多字母元韵母由ai、an、ang、ao、ei、en、eng、ong、ou组成,其中,单字母元韵母a、e、i、o、u通过键入对应的英文字母键输入,单字母元韵母ü通过键入V键输入,多字母元韵母通过从B、P、M、F、D、T、N、L、G、K、H、J、Q、X、Z、C、S、R、Y、W以及“;”键中选择9个键来分别输入。
(三)元拼拼音扩展编码,申请人提交的发明名称为“一种汉字元拼拼音扩展输入方法”的中国发明专利申请揭示了这种元拼拼音扩展编码的技术方案。图3示出了这种基于元拼拼音扩展编码的汉字(在本实施例中可以是针对部件的输入)输入方法的流程。请参见图3,方法包括:(1)如果有声母,则输入汉字(或部件)的声母,声母由单字母声母和双字母声母组成,其中单字母声母包括b、p、m、f、d、t、n、l、g、k、h、j、q、x、z、c、s、r、y、w,双字母声母包括zh、ch、sh,其中单字母声母通过键入对应的英文字母键来输入,双字母声母通过从A、E、I、O、U、V键中任选三个键代表三个双字母声母,输入代表双字母声母的单个英文字母键;(2)输入汉字(或部件)的韵母,其中韵母包括单字母元韵母、多字母元韵母和复合韵母,单字母元韵母由a、e、i、o、u、ü组成,多字母元韵母由ai、an、ang、ao、ei、en、eng、ong、ou组成,复合韵母由er、ia、ie、iao、iou、ian、in、iang、ing、iong、ua、uo、uai、uei、uan、uen、uang、üe组成,其中,单字母元韵母a、e、i、o、u通过键入对应的英文字母键输入,单字母元韵母ü通过键入V键输入,多字母元韵母ai、an、ang、ao、ei、en、eng、ong、ou各自通过键入S、D、F、G、H、J、K、L、M键中的一个不同的按键来输入,复合韵母ia、in、iang、er、ie、iao、iou、ian、ing、uen、üe各自通过键入Q、W、R、T、Y、P、Z、X、C、B、N键中的一个不同的按键来输入,复合韵母iong通过键入表示多字母元韵母ong的键来输入,复合韵母uo通过键入O键来输入,复合韵母ui通过键入V键来输入,复合韵母ua通过键入表示复合韵母ia的键来输入,复合韵母uai通过键入表示复合韵母in的键来输入,复合韵母uang通过键入表示iang的键来输入,复合韵母uan通过键入表示er的键来输入。图4A和4B分别示出了两种元拼拼音扩展输入的键盘设置。
汉字部件拼音化的汉字输入方法的第二实施例
图5示出了本发明的汉字部件拼音化的汉字输入方法的第二实施例的流程。请参见图5,下面是对本实施例的方法流程的详细描述。
步骤S20:确定汉字所归属的部首。
步骤S22:确定汉字的读音以及部首的读音。
对于部首读音的确定,遵循以下方式:对于所有的部首,都以其主部首来确定读音。或者是对是主部首的部首,以其主部首确定读音,对于是附形部首的部首,以其附形部首确定读音。
成字部首的读音编码按成字拼音确定。非成字部首依《现代常用字部件及部件名称规范》及预先设置的定义来确定,即:a、读古音。如“宀”读“mian”,“辶”读“chuo”等;b、按笔画部件读音。如“丨”读“shu”等;c、按俗称定义部件读音。如“纟”,俗称“绞丝旁”,读“si”或定义为“js”;d、按部位或典型例字定义部件读音。如“口”,读“围”等。非成字部首读音定义见说明书中的《非成字部首读音定义表》。《非成字部首读音定义表》中的每一个部首前方的序号就是《汉字部首表》中的序号。
步骤S24:依序输入汉字的读音的拼音编码以及部首的读音的拼音编码,从而输入汉字。
汉字及汉字部首的读音的拼音编码方式包括以下三种拼音编码方式的任意一种:全拼拼音编码、元拼拼音编码、元拼拼音扩展编码。这些拼音编码均在第一实施例中详细描述,在此不再赘述。
非成字基础部件读音定义表
序号 组号 部件 例字 部件拼音1 部件拼音2
2 2 一 旦 heng yi
4 3 (丷) 兑 ba
6 4 (ホ) 亲 mu
10 5 () 冒 ri
16 8 艹 草 cao
17 9 亻 仁 ren
18 10 氵 河 shui san
24 12 灬 然 huo biao
26 13 (钅) 银 jin
29 16 纟 红 mi si
31 16 (糸) 紫 mi si
35 17 (攵) 攻 pu wen
36 17 (夂) 冬 zhi dong
48 21 亠 亩 tou
55 24 扌 提 shou ti
58 27 宀 宝 mian bao
59 28 丶 主 dian zhu
60 29 丿 么 pie
62 30 (讠) 论 yan
63 31 冖 军 mi jun
66 34 冂 同 jiong tong
71 37 厶 私 si
74 39 勹 包 bao
79 42 阝 阳都 fu yi
85 46 (衤) 补 yi
87 47 忄 快 xin shu
92 51 辶 进 chuo zou
96 55 口 国 wei guo
99 57 刂 别 dao
105 59 (罒) 罗 si wang
110 64 乂 义 yi cha
118 70 (礻) 祖 shi ci
128 75 () 仓 jie ji
129 75 () 改 ji
135 78 彡 彩 san shan
139 80 疒 病 ne bing
146 84 冫 冰 bing
149 85 (尢) 尤 you
151 87 犭 狗 quan
156 90 凵 凶 kan qian
163 96 廾 弄 gong
166 98 乛 买 zhe
168 99 彳 很 chi
177 105 (氺) 泰 shui
181 107 虍 虎 hu
190 111 (巛) 巡 chuan guai
192 111 (巜) 粼 chuan guai
195 113 匚 区 fang xi
196 113 () 匚 fang xi
200 114 (肀) 肃 yu su
206 115 (覀) 要 xi yao
212 119 彐 雪 ji
222 123 (戉) 越 wu yue
226 127 屮 艸 cao che
235 132 丨 旧 shu gun
236 132 (亅) 寕 shu gun
241 134 (镸) 肆 zhang chang
246 139 卩 节 jie
251 141 () 扁 ce bian
256 145 其 qi
266 152 风 ji feng
268 154 廿 度 nian
269 155 寒 gou han
283 167 廴 建 yin ting
286 168 (毌) 贯 wu guan
289 170 () 拜 shou
293 173 癶 登 bo deng
296 176 丬 将 jiang zhuang
297 176 (爿) 牀 jiang pan
320 195 () 桺 liu
323 196 采 番 bian
338 206 司 zhe
347 212 彑 彖 ji zhu
356 219 豸 豹 zhi chai
358 221 阜 fu dui
359 222 旡 既 wu ji
368 230 帀 両 liang
384 246 丌 鼻 ji bi
387 249 官 guan
400 261 冘 沈 yin shen
404 264 囬 hui
405 265 夬 决 guai jue
422 279 鹵 lu
425 282 黽 縄 meng min
430 286 華 hua
445 295 彧 jian yu
448 297 朿 刺 ci
452 301 ス 劲 jing
463 312 丩 收 jiu
474 320 市 沛 fu
502 342 姊 zi
506 346 戢 嶯 ji
518 357 丏 沔 mian
519 358 那 na
527 365 丱 聯 guan
非成字部首读音定义表
一画
1 一 heng
2 丨 shu
【2】(亅) shu
3 丿 pie
4 丶 dian
5 乛 zhe
二画
8 匚 fang
【22】(刂) dao
10 冂 jiong
【12】(亻) ren
【10】() jiong
13 勹 bao
17 亠 tou
18 冫 bing
【11】(丷) ba
19 冖 mi
【166】(讠) yan
20 凵 kan
21 卩 jie
【175】(阝左)fu
【159】(阝右)yi
25 厶 si
26 廴 yin
【21】() jie
三画
【80】(扌) shou
30 艹 cao
32 廾 gong
34 尢 you
38 口 wei
41 彳 chi
42 彡 shan
【66】(犭) quan
44 夂 zhi
【185】(饣) shi
45 丬 jiang
【77】(氵) shui
【98】(忄) xin
48 宀 mian
49 辶 chuo
50 彐 ji
55 屮 che
【55】() che
【50】(彑) ji
【148】(纟) si
60 巛 chuan
四画
【68】() che
【62】(旡) ji
74 攴 pu
【75】() ri
【74】(攵) pu
92 殳 shu
【95】(灬) huo
【100】(礻) shi
【145】(肀) yu
【45】(爿) pan
五画
【77】(氺) shui
107罒 wang
【176】(钅) jin
115 疒 ne
【142】(衤) yi
118 疋 shu
120 癶 bo
六画
【126】(两) xi
126 覀 xi
130 虍 hu
【143】() yang
【30】(艸) cao
148 糸 mi
七画
【83】(镸) zhang
【49】(辵) chuo
161 采 bian
163 豸 zhi
八画
173 黾 meng
十画
188 髟 biao
189 鬲 ge
【173】 (黽) meng
上述实施例是提供给本领域普通技术人员来实现或使用本发明的,本领域普通技术人员可在不脱离本发明的发明思想的情况下,对上述实施例做出种种修改或变化,因而本发明的保护范围并不被上述实施例所限,而应该是符合权利要求书提到的创新性特征的最大范围。
Claims (9)
1.一种汉字部件拼音化的汉字输入方法,包括:
(1)将汉字按照书写顺序分解为汉字部件的有序序列,汉字部件分为基础部件和合成部件,合成部件是由若干个基础部件组成的;
(2)顺序选取汉字部件的有序序列中的汉字部件,并确定每个汉字部件的读音;
(3)依序输入选取的汉字部件的读音的拼音编码,从而输入汉字,其中,步骤(3)中的汉字部件的读音的拼音编码方式是元拼拼音扩展编码:
基于元拼拼音扩展编码的部件输入包括:(1)如果有声母,则输入部件的声母,声母由单字母声母和双字母声母组成,其中单字母声母包括b、p、m、f、d、t、n、l、g、k、h、j、q、x、z、c、s、r、y、w,双字母声母包括zh、ch、sh,其中单字母声母通过键入对应的英文字母键来输入,双字母声母从A、E、I、O、U、V键中任选三个键代表三个双字母声母,输入代表双字母声母的单个英文字母键;(2)输入部件的韵母,韵母包括单字母元韵母、多字母元韵母和复合韵母,单字母元韵母由a、e、i、o、u、ü组成,多字母元韵母由ai、an、ang、ao、ei、en、eng、ong、ou组成,复合韵母由er、ia、ie、iao、iou、ian、in、iang、ing、iong、ua、uo、uai、uei、uan、uen、uang、üe组成,其中,单字母元韵母a、e、i、o、u通过键入对应的英文字母键输入,单字母元韵母ü通过键入V键输入,多字母元韵母ai、an、ang、ao、ei、en、eng、ong、ou各自通过键入S、D、F、G、H、J、K、L、M键中的一个不同的按键来输入,复合韵母ia、in、iang、er、ie、iao、iou、ian、ing、uen、üe各自通过键入Q、W、R、T、Y、P、Z、X、C、B、N键中的一个不同的按键来输入,复合韵母iong通过键入表示多字母元韵母ong的键来输入,复合韵母uo通过键入O键来输入,复合韵母ui通过键入V键来输入,复合韵母ua通过键入表示复合韵母ia的键来输入,复合韵母uai通过键入表示复合韵母in的键来输入,复合韵母uang通过键入表示iang的键来输入,复合韵母uan通过键入表示er的键来输入。
2.根据权利要求1所述的汉字部件拼音化的汉字输入方法,其特征在于,在步骤(1)中,如果在汉字分解中的若干个相邻的基础部件可组合成一个合成部件且该合成部件是成字的合成部件,则以该合成部件而不是该若干个基础部件作为该汉字部件的有序序列的组成。
3.根据权利要求1所述的汉字部件拼音化的汉字输入方法,其特征在于,在步骤(2)中,如果汉字部件的有序序列中存在至少四个汉字部件,则选取其中的第一汉字部件、第二汉字部件以及末尾汉字部件。
4.根据权利要求1所述的汉字部件拼音化的汉字输入方法,其特征在于,在步骤(1)中,对汉字的分解遵循以下的三个原则的任意一个组合:
(1.a)对汉字进行汉字部件的拆分时,相离、相接可拆,交重不拆;
(1.b)字形符合理据时,进行有理据拆分,无法分析理据或字形与字源矛盾的,依字形进行无理据拆分;
(1.c)对于没有定义的汉字部件或者用户无法确定的汉字部件,以一特定符号表示。
5.根据权利要求1所述的汉字部件拼音化的汉字输入方法,其特征在于,步骤(2)的确定汉字部件的读音进一步包括:
(2.a)对于所有的基础部件,按照各个基础部件的主形部件确定读音;或者
(2.b)对于主形部件的基础部件,按照该基础部件的主形部件确定读音,对于附形部件的基础部件,按照该基础部件的附形部件确定读音;
其中主形部件和附形部件在《信息处理用GB13000.1字符集汉字部件规范》内的《汉字基础部件表》中定义或依国家教育部2009年3月24日发布的《现代常用字部件及部件名称规范》予以定义。
6.根据权利要求1~5中任一项所述的汉字部件拼音化的汉字输入方法,其特征在于,汉字部件、基础部件、合成部件在《信息处理用GB13000.1字符集汉字部件规范》中定义。
7.根据权利要求1~5中任一项所述的汉字部件拼音化的汉字输入方法,其特征在于,对于步骤(2)中的汉字部件的读音的确定,如果汉字部件是成字的部件,依其汉字的发音,如果汉字部件是不成字的部件,根据预先设定的读音确定。
8.一种汉字部件拼音化的汉字输入方法,该方法包括:
(1)确定汉字所归属的部首;
(2)确定汉字的读音以及部首的读音;
(3)依序输入汉字的读音的拼音编码以及部首的读音的拼音编码,从而输入汉字,其中步骤(3)中汉字的拼音编码以及部首的拼音编码,进一步包括:
元拼拼音扩展编码:基于元拼拼音扩展编码的汉字或部首输入包括:(1)如果有声母,则输入汉字或部首的声母,声母由单字母声母和双字母声母组成,其中单字母声母包括b、p、m、f、d、t、n、l、g、k、h、j、q、x、z、c、s、r、y、w,双字母声母包括zh、ch、sh,其中单字母声母通过键入对应的英文字母键来输入,双字母声母通过从A、E、I、O、U、V键中任选三个键代表三个双字母声母,输入代表双字母声母的单个英文字母键;(2)输入汉字或部首的韵母,韵母包括单字母元韵母、多字母元韵母和复合韵母,单字母元韵母由a、e、i、o、u、ü组成,多字母元韵母由ai、an、ang、ao、ei、en、eng、ong、ou组成,复合韵母由er、ia、ie、iao、iou、ian、in、iang、ing、iong、ua、uo、uai、uei、uan、uen、uang、üe组成,其中,单字母元韵母a、e、i、o、u通过键入对应的英文字母键输入,单字母元韵母ü通过键入V键输入,多字母元韵母ai、an、ang、ao、ei、en、eng、ong、ou各自通过键入S、D、F、G、H、J、K、L、M键中的一个不同的按键来输入,复合韵母ia、in、iang、er、ie、iao、iou、ian、ing、uen、üe各自通过键入Q、W、R、T、Y、P、Z、X、C、B、N键中的一个不同的按键来输入,复合韵母iong通过键入表示多字母元韵母ong的键来输入,复合韵母uo通过键入O键来输入,复合韵母ui通过键入V键来输入,复合韵母ua通过键入表示复合韵母ia的键来输入,复合韵母uai通过键入表示复合韵母in的键来输入,复合韵母uang通过键入表示iang的键来输入,复合韵母uan通过键入表示er的键来输入。
9.根据权利要求8的汉字部件拼音化的汉字输入方法,其特征在于,步骤(2)中确定部首的读音,进一步包括:
(2.a)对于所有的部首,都以其主部首确定读音;
(2.b)对于是主部首的部首,以其主部首确定读音,对于是附形部首的部首,以其附形部首确定读音;
其中主部首和附形部首在《汉字部首表GF0011---2009》中定义;
对于汉字部首的读音的确定,如果汉字部首是成字的部首,依其汉字的发音,如果汉字部首是不成字的部首,根据预先设定的读音确定。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200910052622 CN101825949B (zh) | 2009-06-05 | 2009-06-05 | 一种汉字部件拼音化的汉字输入方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 200910052622 CN101825949B (zh) | 2009-06-05 | 2009-06-05 | 一种汉字部件拼音化的汉字输入方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101825949A CN101825949A (zh) | 2010-09-08 |
CN101825949B true CN101825949B (zh) | 2013-06-19 |
Family
ID=42689893
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 200910052622 Expired - Fee Related CN101825949B (zh) | 2009-06-05 | 2009-06-05 | 一种汉字部件拼音化的汉字输入方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101825949B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102945087B (zh) * | 2012-12-07 | 2015-10-21 | 张连军 | 一种汉字音形编码输入方法及其键盘布局 |
CN104978045B (zh) * | 2015-05-27 | 2019-07-05 | 腾讯科技(深圳)有限公司 | 一种汉字输入方法及装置 |
CN109254670B (zh) * | 2018-08-28 | 2023-05-16 | 深圳市有钱科技有限公司 | 汉字输入方法、存储介质及计算机设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1132369A (zh) * | 1995-12-20 | 1996-10-02 | 邓世强 | 音形码汉字输入方法及其键盘 |
CN1152740A (zh) * | 1996-02-14 | 1997-06-25 | 汪争平 | 一种汉字编码方法及其键盘 |
CN101135938A (zh) * | 2007-09-13 | 2008-03-05 | 王林 | 一种汉字元拼双音输入方法 |
-
2009
- 2009-06-05 CN CN 200910052622 patent/CN101825949B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1132369A (zh) * | 1995-12-20 | 1996-10-02 | 邓世强 | 音形码汉字输入方法及其键盘 |
CN1152740A (zh) * | 1996-02-14 | 1997-06-25 | 汪争平 | 一种汉字编码方法及其键盘 |
CN101135938A (zh) * | 2007-09-13 | 2008-03-05 | 王林 | 一种汉字元拼双音输入方法 |
Also Published As
Publication number | Publication date |
---|---|
CN101825949A (zh) | 2010-09-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101089795B (zh) | 单击与并击输入中英文的方法和键盘 | |
CN101825949B (zh) | 一种汉字部件拼音化的汉字输入方法 | |
CN102253728B (zh) | 一种声韵双拼汉字输入法及其虚拟键盘 | |
TW201314498A (zh) | 嵌合字根式中文輸入法 | |
CN104020859A (zh) | 计算机双文速录方法 | |
CN101135938A (zh) | 一种汉字元拼双音输入方法 | |
CN101625598A (zh) | 一种符合文字理据的汉字编码及键盘输入技术 | |
CN104238765B (zh) | 中小学生键盘,标拼码输入法 | |
CN103207685A (zh) | T形汉字码输入法 | |
CN1028386C (zh) | 电脑汉字象形编码输入计算机的方法 | |
CN102346565A (zh) | 8键27字母键元及五或六笔画的中文输入法 | |
CN101470535A (zh) | 优化汉字码输入法 | |
CN101344820A (zh) | 一种计算机汉字输入方法及其键盘 | |
CN102402300B (zh) | 7键30字母键元及五或六笔画的中文输入法 | |
CN102331851A (zh) | 9键26字母键元及五或六笔画的中文输入法 | |
CN103600595A (zh) | 首尾四笔查字法 | |
White | The Brahmayāmalatantra or Picumata, vol. II: The Religious Observances and Sexual Rituals of the Tantric Practitioner: Chapters 3, 21, and 45. A Critical Edition and Annotated Translation | |
CN102331853B (zh) | 8键30字母键元及五或六笔画的中文输入法 | |
CN106407185A (zh) | 中文汉字自动标注拼音的系统及方法 | |
Zang | Writing media, script styles and literary forms: Reasons behind the development of the writing system during the Wei, Jin and Southern and Northern dynasties and its significance | |
CN1641551B (zh) | 辨义拼音汉字输入法 | |
CN102193649B (zh) | 易码输入法 | |
CN105389017A (zh) | 带声调的汉语拼音四声输入及书写印刷法 | |
CN104951094A (zh) | 一种汉字音形五模式高效输入方法 | |
CN101706681B (zh) | 一种汉字形码输入法及键盘 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20130619 Termination date: 20200605 |
|
CF01 | Termination of patent right due to non-payment of annual fee |