CN104679473A - 一种利用汉语数码语音输入计算机指令的方法及装置 - Google Patents
一种利用汉语数码语音输入计算机指令的方法及装置 Download PDFInfo
- Publication number
- CN104679473A CN104679473A CN201510128119.1A CN201510128119A CN104679473A CN 104679473 A CN104679473 A CN 104679473A CN 201510128119 A CN201510128119 A CN 201510128119A CN 104679473 A CN104679473 A CN 104679473A
- Authority
- CN
- China
- Prior art keywords
- chinese
- instruction
- digital
- pronunciation
- letters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
本发明公布一种利用汉语数码语音输入计算机指令的方法及装置,主要用于各种工业设备、交通设备、军事设备的精准语音操控,也用于各种智能手机、平板电脑、家用电器和可穿戴设备的语音操控。其核心技术是通过汉字拼形技术,将计算机不易准确识别的汉语语音指令转换为计算机能够准确识别的数码语音指令。其最大优势在于提供了一套统一、规范、完备、高效、易用的汉语数码控制语言,满足了工业设备、交通设备、军事设备对声控指令准确性、实时性、简短性、抗噪性和极端性的苛刻要求。
Description
1技术领域
本发明公开一种利用汉语数码语音输入计算机指令的方法及装置,主要用于工业设备、交通设备、军事设备(以下统称重要设备)的精准语音操控,也用于各种智能手机、平板电脑、家用电器和可穿戴设备的语音操控,属于信息通信技术领域。
2背景技术
对重要设备进行精准语音控制,需要满足下列要求:
第一,准确性。重要设备的语音控制指令识别精准度必须达到100%,不允许出现任何误操作。
第二,实时性。重要设备的语音控制指令必须实时发出,不允许出现任何延迟操作。
第三,简短性。重要设备的语音控制指令必须简短明确,不允许出现任何含糊冗长指令。
第四,抗噪性。重要设备的语音控制指令必须发音洪亮清晰,与环境噪音有着显著区别。
第五,极端性。重要设备的语音控制指令必须适应各种极端环境条件(如网络中断、人员负伤等)。
基于下列原因,汉语语音(指包括汉语拼音全部音节)控制技术无法满足上述要求,因而难以应用在重要设备上。
第一,汉语语音识别无论如何努力都做不到100%的识别率,这无疑是汉语语音技术应用于工业、交通、军事领域的一个最大痛点。
第二,汉语语音控制需要选择、确定、重复等复杂的步骤与操作,还要用手动方式发出语音指令起始信号和结束信号,这些都难以符合实时性要求。
第三,汉语同音字词多,识别率低,虽然通过一段话语来与重要设备进行交流能够大幅度提高识别率,却不符合简短性要求。
第四,汉语各个音节的识别率并不完全相同,一些单音节(如“a”“yi”“wu”)在噪声环境中识别率很低,不符合抗噪性要求。
第五,目前,在线汉语语音识别率已经达到很高的精准度,但在单机交互情景中,还达不到类似精准度,不符合极端性要求。
满足上述精准语音控制要求的充分必要条件是:
第一,必须最大限度地减少语音数量。语音数量愈多,识别难度就愈大,识别精准度就愈低,反之亦然。
第二,必须增加各个语音之间的区分度。各个语音之间的区分度愈高,识别精准度就愈高,反之亦然。
第三,必须采用统一、规范的语音控制指令格式,这样才能被计算机准确地识别,并且无需用手动方式发出语音指令起始信号和结束信号,让声控系统随时处于“待命”状态。
第四,必须彻底消除同音语音指令,即两个语音指令的发音不能相同或相近,否则容易引起误操作。
第五,必须能够校验语音指令的正确性,即通过增加一位用于校验的语音,让声控系统能够自动验证语音指令的正确性。
本发明人所研发的汉语数码语音指令系统,通过将汉语语音指令转换为数码语音指令,并对部分汉语数码读音所进行的修订,制定包括拼形规则、数码规则、语音规则、替代规则、校验规则、组合规则、导引规则在内的一整套汉语数码语音指令输入规则,使之满足了上述重要设备对语音控制的要求及其充分必要条件。
3发明内容
3.1将汉语语音指令转换为数码语音指令
将汉语语音指令转换为数码语音指令,依据的是基于《汉字拼形方案所形成的汉字拼形技术,这一技术的核心内容是将汉字看做是由八个汉字字母构成的。
将汉语语音指令转换为数码语音指令是分四步完成的:
第一步:从构成计算机指令的汉字中提取特征汉字字母,组成汉字字母指令,将汉字字符指令转换为汉字字母指令;
第二步:将汉字字母表示为数码,将汉字字母指令转换为汉字数码指令;
第三步:对汉字数码指令进行替换、校验、组合、导引,生成具有不同功能、应用于不同场合的汉字数码指令。
第四步:读出汉字数码指令,生成汉语数码语音指令。
汉语数码语音只有10个,而汉语语音则有1100多个(含四声),前者不足后者的百分之一。
汉字拼形技术提供了这样一种简单实用的转换方法,将由3000多个常用字组合而成的汉字字符指令转换为由8个数码组合而成的汉字数码指令,将由1100多个汉语语音组合而成的汉语语音指令转换为仅由10个汉语数码语音组合而成的汉语数码语音指令,而且这些汉字字符指令、汉字数码指令和汉语数码语音指令之间存在着一一对应关系。
附图4~附图6为《智能手机常用汉字数码指令表》,其中每个汉字字符指令与汉字数码指令之间都是一一对应的。
通过这一转换,即使采用通用算法,即利用汉语语音识别软件去识别汉语数码语音,其识别精准度也会大幅提升;若是采用专用算法,汉语数码语音的识别精准度要远远超过汉语语音的识别精准度。
本发明与发明人已申请国家发明专利的《一种利用汉字拼形手势输入计算机指令的方法》(申请号为201410214836.1)和已获得国家发明专利的《汉字数字化输入法》(专利号为ZL03155247.1),都是基于同一《汉字拼形方案》。所不同的是,前两者定义了八个汉字字母,用于输入计算机指令,本发明是利用汉语数码语音来输入计算机指令,另一个发明则是利用汉字拼形手势来输入计算机指令,后者定义了九个汉字字母,用于在数字键盘上输入常用汉字及其词语。
3.2本发明定义的汉字字母
本发明总共定义了八种汉字字母,其中一画字母有“一画横”“一画竖”“一画撇”“一画捺”,两画字母有“两画横”“两画竖”“两画撇”“两画捺”。
八种汉字字母的定义如下:
将以横结尾的单个笔画定义为“一画横”;
将以竖结尾的单个笔画定义为“一画竖”;
将以撇结尾的单个笔画定义为“一画撇”;
将以捺结尾的单个笔画定义为“一画捺”;
将以横结尾的两个笔画定义为“两画横”;
将以竖结尾的两个笔画定义为“两画竖”;
将以撇结尾的两个笔画定义为“两画撇”;
将以捺结尾的两个笔画定义为“两画捺”。
按照国家语言文字规范的要求,将提归为横,将点归为捺。所以,本说明书所述的横还包括提(),捺还包括点,其中点又分为撇点()和捺点(丶)。
“一画横”包括横(一)、横钩(乛)、横折();
“一画竖”包括竖(丨)、竖钩(亅)、竖折();
“一画撇”包括撇(丿)、撇钩()、撇折();
“一画捺”包括捺()、捺钩()、捺折();
“两画横”包括横横、竖横、撇横、捺横;
“两画竖”包括横竖、竖竖、撇竖、捺竖;
“两画撇”包括横撇、竖撇、撇撇、捺撇;
“两画捺”包括横捺、竖捺、撇捺、捺捺。
3.3本发明定义的汉字数码
本发明将八种汉字字母分别表示为八个数码,从而将汉字字母转换为汉字数码,其表示方法如下:
将汉字字母“一画横”表示为数码“1”;
将汉字字母“一画竖”表示为数码“2”;
将汉字字母“一画撇”表示为数码“3”;
将汉字字母“一画捺”表示为数码“4”;
将汉字字母“两画横”表示为数码“5”;
将汉字字母“两画竖”表示为数码“6”;
将汉字字母“两画撇”表示为数码“7”;
将汉字字母“两画捺”表示为数码“8”。
根据上述规则制作的《汉字字母表》见附图1。
3.4本发明定义的汉语数码读音
3.4.1对部分汉语数码读音进行修订的原因
原因之一是数码“1”(yi)“2”(er)“5”(wu)都是纯元音语音(即只包含元音的语音),这些数码在连续发音时几乎很难从声音波形上看出其中每个字音的分界点,明显加大了汉语数码连续语音的识别难度;
原因之二是数码“0”(ling)“1”(yi)“4”(si)“5”(wu)“6”(liu)“7”(qi)“9”(jiu)的韵母,由于发音部位和发音方法的限制,嘴部张不大,在发音上无法发出响亮的声音,造成话筒的频率响应对这几个数码的增益比较低,识别准确率普遍不高;
原因之三是数码“2”(er)和“8”(ba)、“1”(yi)和“7”(qi)、“6”(liu)和“9”(jiu)、“3”(san)和“4”(si)的读音很容易混淆,导致汉语数码语音识别率大幅下降。
3.4.2对部分汉语数码读音进行修订的方法
方法之一是每个汉语数码读音中只能包含“a”系列韵母(如“a”“ai”“an”“ang”“ao”)、“o”系列韵母(如“o”“ong”“ou”)和“e”系列韵母(如“e”“ei”“en”“eng”“er”),以确保每个汉语数码读音清晰响亮。
方法之二是每个汉语数码读音中所包含的声母和韵母要尽量不相同,以确保汉语数码读音之间具有很高的区分度。
3.4.3对部分汉语数码读音进行修改的途径
途径之一是吸收军队、航空领域对汉语数码读音的改进成果,即将数码“1”的读音从“yi”改为“yao”,将数码“2”的读音从“er”改为“liang”,将数码“7”的读音从“qi”改为“guai”,将数码“9”的读音从“jiu”改为“gou”,将数码“0”的读音从“ling”改为“dong”;
途径之二是保留符合上述条件的数码“3”和“8”的读音;
途径之三是改进其余数码的读音,即将数码“4”的读音从“si”改为“feng”,将数码“5”的读音从“wu”改为“wo”,将数码“6”的读音从“liu”改为“xue”。
3.4.4对部分汉语数码读音进行修改的结果
将数码“1”的汉语读音定义为“yao”,汉字注音为“幺”;
将数码“2”的汉语读音定义为“liang”,汉字注音为“两”;
保留数码“3”原来的汉语读音“san”,汉字注音为“三”;
将数码“4”的汉语读音定义为“feng”,汉字注音为“风”;
将数码“5”的汉语读音定义为“wo”,汉字注音为“沃”;
将数码“6”的汉语读音定义为“xue”,汉字注音为“雪”;
将数码“7”的汉语读音定义为“guai”,汉字注音为“拐”;
保留数码“8”原来的汉语读音“ba”,汉字注音为“八”;
将数码“9”的汉语读音定义为“gou”,汉字注音为“勾”;
将数码“0”的汉语读音定义为“dong”,汉字注音为“洞”。
根据上述规则制作的《新汉语数码读音与汉字注音对照表》见附图2。
3.5本发明定义的拼形规则
从计算机指令中,依次提取每个汉字的特征汉字字母,组成汉字字母指令,其特征汉字字母为每个汉字的第一个汉字字母。
若计算机指令是由两个汉字构成的,则提取这两个汉字的第一个汉字字母,由所提取的两个汉字字母组成汉字字母指令。
若计算机指令是由三个汉字构成的,则提取这三个汉字的第一个汉字字母,由所提取的三个汉字字母组成汉字字母指令。
若计算机指令是由四个汉字构成的,则提取这四个汉字的第一个汉字字母,由所提取的四个汉字字母组成汉字字母指令,以此类推。
3.6本发明定义的数码规则
将汉字字母指令中的每个汉字字母,按照本说明书3.3节所定义的汉字字母与数码之间的对应关系,替换成相对应的数码,则生成汉字数码指令。
3.7本发明定义的语音规则
将汉字数码指令中的每个汉字数码,按照本说明书3.4节所定义的汉语数码读音读出来,则生成数码语音指令。
3.8本发明定义的替代规则
将数码语音“9”(读作“勾”)作为“替代符号”。当数码语音指令中连续出现相同数码语音(以下统称相同数码语音群)时,在每两个相同数码语音之中,使用替代符号“9”来替代后一个数码语音。
当数码语音指令连续出现两个或者三个相同的数码语音时,应使用替代符号“9”来替代相同数码语音群中第二个数码语音。
当数码语音指令连续出现四个或者五个相同数码语音时,应使用替代符号“9”来替代相同数码语音群中第二个和第四个数码语音。
之所以要使用数码语音“9”作为替代符号,将相同的数码语音分隔开来,使得数码语音指令中每个数码语音都不连续出现,是由于连续出现的相同数码语音之间的分界点不够明显,容易受到环境噪声干扰而造成识别错误。
3.9本发明定义的校验规则
在数码语音指令末尾,增加一位校验数码语音作为校验符号,该校验符号定义为数码语音指令中其他各个数码相加所得的个位数。
在对数码语音指令进行识别时,系统要对这些数码进行运算验证。若其中任何一个数码识别错误,都会导致运算验证失败,从而保证了对数码语音指令的精准识别,避免了误操作的发生。
增加了数码语音校验符号的数码语音指令,称之为精准数码语音指令,应用于要求不允许发生任何语音识别错误、否则会造成灾难性后果的重要设备控制。
3.10本发明定义的组合规则
将若干个数码语音指令组合在一起,作为一条计算机指令语句一次性输入。由于这条计算机指令语句中包含有若干个数码语音指令,故称之为数码语音指令群。
将数码语音“0”(读作“洞”)定义为“分隔符号”。在数码语音指令群的每两个数码语音指令之间,应插入分隔符号“0”。
若构成数码语音指令群的各个数码语音指令之间是相互独立的,那么,一次性输入数码语音指令群后,计算机会依次完成各项指令操作。
若构成数码语音指令群的各个数码语音指令之间是相互关联的,后面数码语音指令则是对前面数码语音指令的细化、补充、说明及参数设置,那么,一次性输入数码语音指令群后,计算机会完成更复杂的操控。
3.11本发明定义的导引规则
将数码语音“0”(读作“洞”)定义为“导引符号”,添加在数码语音指令前后端,分别表示数码语音指令的开头和结尾。
将数码语音“00”(读作“洞洞”)定义为“导引符号”,添加在数码语音指令群前后端,分别表示数码语音指令群的开头和结尾。
由于环境噪声会干扰语音控制系统对用户发布语音指令的起始点和结束点的准确判别。所以,在噪声环境中,需要设置“导引符号”,以便及时准确地向语音控制系统发出数码语音指令的起始信号和结束信号。
3.12本发明设计的数码语音指令输入装置
本发明设计的数码语音指令输入装置包括数码语音指令接收单元、数码语音指令识别单元和汉字数码指令传送单元。
数码语音指令接收单元用于接收用户发出的数码语音指令或数码语音指令群。
数码语音指令识别单元用于将数码语音指令转换为汉字数码指令,或将数码语音指令群转换为汉字数码指令群。
汉字数码指令传送单元用于将汉字数码指令或汉字数码指令群传送给相应的控制系统。
根据上述规则制作的《数码语音指令输入装置示意图》见附图3。
4附图说明
为了更清楚地说明本实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可根据这些附图获得其他的附图。
附图1为《汉字字母表》;
附图2为《新汉语数码读音与汉字注音对照表》;
附图3为《数码语音指令输入装置示意图》;
附图4为《智能手机常用汉字数码指令表(一)》;
附图5为《智能手机常用汉字数码指令表(二)》;
附图6为《智能手机常用汉字数码指令表(三)》;
5具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚地、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部实施例。基于本发明的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
【实施例1】输入“关机”的数码语音指令
分析:
“关”字的第一个汉字字母是点撇,属于“两画撇”,其数码为“7”,汉语读音为“guai”,汉字注音为“拐”;
“机”字的第一个汉字字母是横竖,属于“两画竖”,其数码为“6”,汉语读音为“xue”,汉字注音为“雪”。
结论:
“关机”的汉字数码指令为“76”,数码语音指令为“guai xue”,汉字注音为“拐雪”。
因此,读出“拐雪”即输入“关机”的数码语音指令。
【实施例2】输入“斗地主”的数码语音指令
分析:
“斗”字的第一个汉字字母是点点,属于“两画捺”,其数码为“8”,汉语读音为“ba”,汉字注音为“八”;
“地”字的第一个汉字字母是横竖,属于“两画竖”,其数码为“6”,汉语读音为“xue”,汉字注音为“雪”;
“主”字的第一个汉字字母是点横,属于“两画横”,其数码为“5”,汉语读音为“wo”,汉字注音为“沃”。
结论:
“斗地主”的汉字数码指令为“865”,数码语音指令为“ba xue wo”,汉字注音为“八雪沃”。
因此,读出“八雪沃”即输入“斗地主”的数码语音指令。
【实施例3】输入“频道列表”的数码语音指令
分析:
“频”字的第一个汉字字母是竖横,属于“两画横”,其数码为“5”,汉语读音为“wo”,汉字注音为“沃”;
“道”字的第一个汉字字母是点撇,属于“两画撇”,其数码为“7”,汉语读音为“guai”,汉字注音为“拐”;
“列”字的第一个汉字字母是横撇,属于“两画撇”,其数码为“7”,汉语读音为“guai”,汉字注音为“拐”;
“表”字的第一个汉字字母是横横,属于“两画横”,其数码为“5”,汉语读音为“wo”,汉字注音为“沃”。
结论:
“频道列表”的汉字数码指令为“5775”,数码语音指令为“wo guai guaixue”,汉字注音为“沃拐拐雪”。
由于连续出现两个相同发音“guai guai”,故按照上述替换规则,需要使用替换符号“gou”来替换第二个“guai”。由此得出“频道列表”的数码语音指令为“wo guai gou xue”,汉字注音为“沃拐勾雪”。
因此,读出“沃拐勾雪”即输入“频道列表”的数码语音指令。
【实施例4】输入“开火”的精准数码语音指令
分析:
“开”字的第一个汉字字母是横横,属于“两画横”,其数码为“5”,汉语读音为“wo”,汉字注音为“沃”;
“火”字的第一个汉字字母是点撇,属于两画撇,其数码为“7”,汉语读音为“guai”,汉字注音为“拐”;
“开”字的第一个汉字字母数码和“火”的第一个汉字字母数码相加之和为“12”,将个位数“2”作为校验数码,其汉语读音为“liang”,汉字注音为“两”。
结论:
“开火”的精准汉字数码指令为“572”,精准数码语音指令为“wo guailiang”,汉字注音为“沃拐两”。
因此,读出“沃拐两”即输入“开火”的精准数码语音指令。
【实施例5】输入“天气预报”和“北京”组合而成的数码语音指令群,以查询北京市的天气情况。
分析:
“天”字的第一个汉字字母是横横,属于“两画横”,其数码为“5”,汉语读音为“wo”,汉字注音为“沃”;
“气”字的第一个汉字字母是撇横,属于“两画横”,其数码为“5”,汉语读音为“wo”,汉字注音为“沃”;
“预”字的第一个汉字字母是撇折,属于“一画撇”,其数码为“3”,汉语读音为“san”,汉字注音为“三”;
“报”字的第一个汉字字母是横,属于“一画横”,其数码为“1”,汉语读音为“yao”,汉字注音为“幺”;
“北”字第一个汉字字母是竖横,属于“两画横”,其数码为“5”,汉语读音为“wo”,汉字注音为“沃”;
“京”字的第一个汉字字母是点横,属于“两画横”,其数码为“5”,汉语读音为“wo”,汉字注音为“沃”。
结论:
“天气预报”的汉字数码指令为“5531”,将连续出现的第二个数码“5”用替换符号“9”来替换,则调整后“天气预报”的汉字数码指令为“5931”,汉语数码语音指令为“wo gou san yao”,汉字注音为“沃勾三幺”。
“北京”的汉字数码指令为“55”,将连续出现的第二个数码“5”用替换符号“9”来替换,则调整后“北京”的汉字数码指令为“59”,数码语音指令为“wo go”,汉字注音为“沃勾”。
由“天气预报”和“北京”组合而成的汉字数码指令为“5931059”,数码语音指令为“wo gou san yao dong wo gou”,汉字注音为“沃勾三幺洞沃勾”,其中的数码“0”为分隔符号。
因此,读出“沃勾三幺洞沃勾”,即输入“天气预报”和“北京”组合而成的数码语音指令群。
【实施例6】在噪声环境中输入“开启振动”的数码语音指令
分析:
“开”字的第一个汉字字母是横横,属于“两画横”,其数码为“5”,汉语读音为“wo”,汉字注音为“沃”;
“启”字的第一个汉字字母是点,属于“一画捺”,其数码为“4”,汉语读音为“feng”,汉字注音为“风”;
“振”字的第一个汉字字母是横,属于“一画横”,其数码为“1”,汉语读音为“yao”,汉字注音为“幺”;
“动”字的第一个汉字字母是横横,属于“两画横”,其数码为“5”,汉语读音为“wo”,汉字注音为“沃”。
结论:
在静音环境中,“开启振动”的汉字数码指令为“5415”,数码语音指令为“wo feng yao wo”,汉字注音为“沃风幺沃”。
在噪声环境中,“开启振动”的汉字数码指令为“054150”,数码语音指令为“dong wo feng yao wo dong”,汉字注音为“洞沃风幺沃洞”,其中的数码“0”为导引符号。
因此,读出“洞沃风幺沃洞”,即在噪音环境中输入“开启振动”的数码语音指令。
本领域普通技术人员可以理解并实现上述实施例中的全部或部分流程,是可以通过计算机程序指令相关硬件来完成的,所述的程序可存储于计算机可读存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read--only Memory,ROM)或随机存储记忆体(Random Access Memory,RAM)。
以上所披露的仅为本发明的典型实施例而已,当然不能以此来限定本发明之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依照本发明权利要求所作的同等变化,仍属于本发明所涵盖的内容。
Claims (10)
1.一种利用汉语数码语音输入计算机指令的方法,其特征在于,该方法是由拼形规则、数码规则、读音规则、输入规则所构成的,还包括:
按照拼形规则,依次从构成计算机指令的汉字中提取特征汉字字母组成汉字字母指令,将汉字字符指令转换为汉字字母指令;
按照数码规则,用数码来表示汉字字母,将汉字字母指令转换为汉字数码指令;
按照读音规则,依次读出汉字数码指令中各个数码,生成数码语音指令;
按照输入规则,对数码语音指令进行替换、校验、组合、导引,生成具有不同功能、应用于不同场合的数码语音指令。
2.如权利要求1所述的汉字字母有“一画横”“一画竖”“一画撇”“一画捺”“两画横”“两画竖”“两画撇”“两画捺”八种,其特征在于:
将以横结尾的单个笔画定义为“一画横”,包括横(一)、横钩(乛)、横折();
将以竖结尾的单个笔画定义为“一画竖”,包括竖(丨)、竖钩(亅)、竖折();
将以撇结尾的单个笔画定义为“一画撇”,包括撇(丿)、撇钩()、撇折();
将以捺结尾的单个笔画定义为“一画捺”,包括捺()、捺钩()、捺折();
将以横结尾的两个笔画定义为“两画横”,包括横横、竖横、撇横、捺横;
将以竖结尾的两个笔画定义为“两画竖”,包括横竖、竖竖、撇竖、捺竖;
将以撇结尾的两个笔画定义为“两画撇”,包括横撇、竖撇、撇撇、捺撇;
将以捺结尾的两个笔画定义为“两画捺”,包括横捺、竖捺、撇捺、捺捺。
在上述表述中,横还包括提(),捺还包括点,其中点又包括撇点(丶)和捺点(丶)。
3.如权利要求1所述的拼形规则,其特征在于,依次从构成计算机指令的汉字中提取特征汉字字母组成汉字字母指令,其特征汉字字母为每个汉字的第一个汉字字母。
4.如权利要求1所述的数码规则,其特征在于,将八个汉字字母分别表示为八个数码,还包括:
将汉字字母“一画横”表示为数码“1”;
将汉字字母“一画竖”表示为数码“2”;
将汉字字母“一画撇”表示为数码“3”;
将汉字字母“一画捺”表示为数码“4”;
将汉字字母“两画横”表示为数码“5”;
将汉字字母“两画竖”表示为数码“6”;
将汉字字母“两画撇”表示为数码“7”;
将汉字字母“两画捺”表示为数码“8”。
5.如权利要求1所述的读音规则,其特征在于,对部分汉语数码读音进行修订,形成新的汉语数码读音,还包括:
将数码“1”的汉语读音定义为“yao”,汉字注音为“幺”;
将数码“2”的汉语读音定义为“1iang”,汉字注音为“两”;
保留数码“3”原来的汉语读音“san”,汉字注音为“三”;
将数码“4”的汉语读音定义为“feng”,汉字注音为“风”;
将数码“5”的汉语读音定义为“wo”,汉字注音为“沃”;
将数码“6”的汉语读音定义为“xue”,汉字注音为“雪”;
将数码“7”的汉语读音定义为“guai”,汉字注音为“拐”;
保留数码“8”原来的汉语读音“ba”,汉字注音为“八”;
将数码“9”的汉语读音定义为“gou”,汉字注音为“勾”;
将数码“0”的汉语读音定义为“dong”,汉字注音为“洞”。
6.如权利要求1所述的输入规则包括替换规则,其特征在于,当数码语音指令中连续出现相同的数码语音时,在每两个相同的数码语音之中,使用数码语音“9”作为替换符号来替换后一个数码语音。
7.如权利要求1所述的输入规则还包括校验规则,其特征在于,在数码语音指令末尾增加一位数码语音作为校验符号,该校验符号定义为数码语音指令中其他各个数码相加所得的个位数。
8.如权利要求1所述的输入规则还包括组合规则,其特征在于,将若干个数码语音指令组合在一起构成一个数码语音指令群,在每两个数码语音指令之间,插入数码语音“0”作为分隔符号。
9.如权利要求1所述的输入规则还包括导引规则,其特征在于,将数码语音“0”添加在数码语音指令前后端作为导引符号,分别标示数码语音指令的开头和结尾;或将数码语音“00”添加在数码语音指令群前后端作为导引符号,分别标示数码语音指令群的开头和结尾。
10.一种利用汉语数码语音输入计算机指令的装置,其特征在于,该装置是由数码语音指令接收单元、数码语音指令识别单元和汉字数码指令传送单元组成的,还包括:
数码语音指令接收单元用于接收用户发出的数码语音指令;
数码语音指令识别单元用于将数码语音指令转换为汉字数码指令;
汉字数码指令传送单元用于将汉字数码指令传送给相应的控制系统。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510128119.1A CN104679473A (zh) | 2015-03-24 | 2015-03-24 | 一种利用汉语数码语音输入计算机指令的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510128119.1A CN104679473A (zh) | 2015-03-24 | 2015-03-24 | 一种利用汉语数码语音输入计算机指令的方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104679473A true CN104679473A (zh) | 2015-06-03 |
Family
ID=53314598
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510128119.1A Pending CN104679473A (zh) | 2015-03-24 | 2015-03-24 | 一种利用汉语数码语音输入计算机指令的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104679473A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1300977A (zh) * | 2001-02-15 | 2001-06-27 | 王永民 | 五笔数码语音汉字输入法及其输入装置 |
CN1420421A (zh) * | 2001-11-20 | 2003-05-28 | 邵跃波 | 精确语音输入法 |
CN1493964A (zh) * | 2003-02-11 | 2004-05-05 | 林 钟 | 汉字数字化输入法 |
CN101236457A (zh) * | 2007-06-15 | 2008-08-06 | 胡世曦 | 音划中文输入法 |
CN103970288A (zh) * | 2014-05-21 | 2014-08-06 | 钟林 | 一种利用汉字拼形手势输入计算机指令的方法 |
-
2015
- 2015-03-24 CN CN201510128119.1A patent/CN104679473A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1300977A (zh) * | 2001-02-15 | 2001-06-27 | 王永民 | 五笔数码语音汉字输入法及其输入装置 |
CN1420421A (zh) * | 2001-11-20 | 2003-05-28 | 邵跃波 | 精确语音输入法 |
CN1493964A (zh) * | 2003-02-11 | 2004-05-05 | 林 钟 | 汉字数字化输入法 |
CN101236457A (zh) * | 2007-06-15 | 2008-08-06 | 胡世曦 | 音划中文输入法 |
CN103970288A (zh) * | 2014-05-21 | 2014-08-06 | 钟林 | 一种利用汉字拼形手势输入计算机指令的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10923119B2 (en) | Speech data processing method and apparatus, device and storage medium | |
CN105869446B (zh) | 一种电子阅读装置和语音阅读加载方法 | |
US9361282B2 (en) | Method and device for user interface | |
CN106331893B (zh) | 实时字幕显示方法及系统 | |
CN107134279A (zh) | 一种语音唤醒方法、装置、终端和存储介质 | |
CN101030368B (zh) | 在保持情感的同时跨通道进行通信的方法和系统 | |
CN108447471A (zh) | 语音识别方法及语音识别装置 | |
US20160078135A1 (en) | Query selection method and system | |
CN103106061A (zh) | 语音输入方法和装置 | |
CN103400576B (zh) | 基于用户行为日志的语音模型更新方法及装置 | |
CN110930980B (zh) | 一种中英文混合语音的声学识别方法及系统 | |
WO2021218028A1 (zh) | 基于人工智能的面试内容精炼方法、装置、设备及介质 | |
JP2013068952A (ja) | 音声認識結果の統合 | |
CN103077714A (zh) | 信息的识别方法和装置 | |
CN109992765A (zh) | 文本纠错方法及装置、存储介质和电子设备 | |
JP2019533212A (ja) | 音声放送方法及び装置 | |
CN103678269A (zh) | 一种信息处理方法和装置 | |
CN103956167A (zh) | 一种基于Web的可视化手语翻译方法及设备 | |
CN105374248B (zh) | 一种纠正读音的方法、装置和系统 | |
CN110970018A (zh) | 语音识别方法和装置 | |
CN104866308A (zh) | 一种场景图像的生成方法及装置 | |
Prahallad et al. | The blizzard challenge 2013–indian language task | |
CN107993651A (zh) | 一种语音识别方法、装置、电子设备及存储介质 | |
CN110032736A (zh) | 一种文本分析方法、装置及存储介质 | |
CN113053388A (zh) | 语音交互方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20150603 |
|
WD01 | Invention patent application deemed withdrawn after publication |