CN102063282A - 汉语语音输入系统及方法 - Google Patents

汉语语音输入系统及方法 Download PDF

Info

Publication number
CN102063282A
CN102063282A CN2009102018155A CN200910201815A CN102063282A CN 102063282 A CN102063282 A CN 102063282A CN 2009102018155 A CN2009102018155 A CN 2009102018155A CN 200910201815 A CN200910201815 A CN 200910201815A CN 102063282 A CN102063282 A CN 102063282A
Authority
CN
China
Prior art keywords
initial
chinese
final
sequence
confidence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2009102018155A
Other languages
English (en)
Other versions
CN102063282B (zh
Inventor
黄伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Shangxiang Network Technology Co ltd
Original Assignee
Shanda Computer Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanda Computer Shanghai Co Ltd filed Critical Shanda Computer Shanghai Co Ltd
Priority to CN200910201815.5A priority Critical patent/CN102063282B/zh
Publication of CN102063282A publication Critical patent/CN102063282A/zh
Application granted granted Critical
Publication of CN102063282B publication Critical patent/CN102063282B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

本发明公开了一种汉语语音输入系统,语音识别控制器同语音采集及输入电路、声母韵母识别模块、拼音识别模块、显示器分别相连;语音识别控制器根据语音采集及输入电路输入的语音信号以及声母韵母识别模块,得到一个声母韵母序列;语音识别控制器根据拼音识别模块,以及所述得到的一个声母韵母序列,输出一个或多个候选汉字序列到显示器,然后根据用户输入的选择信息输出其中的一个候选汉字序列。本发明还公开了一种汉语语音输入方法。本发明的汉语语音输入系统及方法识别率高。

Description

汉语语音输入系统及方法
技术领域
本发明涉及语音识别技术,特别涉及一种汉语语音输入系统及方法。
背景技术
随着电子技术的发展,目前个人手持式设备不断向功能丰富与体积小巧的方向发展,小巧的机身中往往集成了众多的办公、娱乐及互联网应用。丰富的功能往往需要更加丰富、便捷的交互方式,而受体积、便携式电源等物理条件的限制,设备上无法预留足够的资源为交互所需的物理设备所用,这样就对人机交互的方式提出了更高的要求——如何在有限的硬件设备资源的前提下,尽可能为用户提供方便、快捷以及功能丰富的交互方式,就成了决定一个手持式产品生命力的重要特征。
目前手持式设备上的输入方式,多是通过键盘(Keypad)或触摸屏(Touch screen)。为了给用户提供交互方式,往往需要通过为某种操作预留特定的输入键的方式来进行用户与设备之间的交互。对于一些复杂的操作,在设备上无法预留过多的输入键,只能通过复用某些操作键以及组合一些操作键的方式来实现,或者通过复杂的菜单分级的策略,用户往往要进行多次菜单操作才能实现所需的功能。这些输入方式,一来容易引起误操作,二则实现的功能依然有限,无法满足用户的实际需求。
另外,对于某些特殊设备,如目前市场上刚刚出现的电子墨水屏幕,尽管其对用户的眼睛提供了最佳防护,但是受目前技术水平的限制,刷新率较低,对用户的输入反馈很慢(延迟约1秒)。例如当用户需要通过键盘输入一个“黄”字时,需要进行5次操作“huang”,累计延时将在6秒以上,这样的速度显然是无法满足用户实际需求的。
与传统的通过键盘以及触摸屏输入方式不同,语音输入作为一种最自然的交互方式,无需占用额外的硬件及尺寸方面的资源,只通过一个简单的麦克风,即可实现动态扩展的虚拟界面,完成多达上万种输入操作。这样,对于一款手持式设备上的所有操作,都可以通过语音输入来实现,无需对某种功能指定特殊的键,因而在不增加设备外观尺寸的前提下,能最大程度的丰富手持式设备的交互乐趣。而且这种交互直接在后台进行,避免了由于图形界面的延迟对用户体验方面造成的不利影响。
语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。语音识别是一门交叉学科,所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场,已经进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等诸多领域。
语音输入系统,包括语音采集及输入电路、模式库、声学模式匹配规则、语音识别控制器,语音识别控制器根据声学模式匹配规则(如某种距离测度、专家知识(如构词规则、语法规则、语义规则等),计算输入语音信号特征与模式库中的模式之间的相似度,判断出输入语音的语意信息。
常规的汉语语音输入系统,是使用完全的语音识别,是以带调拼音为单位,直接根据汉字的发音识别出具体汉字或汉语语句,即将输入的语音直接同模式库中的模式进行匹配,匹配通过后直接将模式库中的该模式对应的汉字及汉语语句作为输入语音的汉语语意信息输出,由于以带调拼音为单位可供利用的自然语言信息较少,汉语识别准确率比较低,只能实现一些特定口令的识别。
发明内容
本发明要解决的技术问题是提供一种汉语语音输入系统及方法,汉语文字识别的准确率高。
为解决上述技术问题,本发明的汉语语音输入系统,包括语音采集及输入电路、声母韵母识别模块、拼音识别模块、语音识别控制器、显示器;
所述语音识别控制器同语音采集及输入电路、声母韵母识别模块、拼音识别模块、显示器分别相连;
所述声母韵母识别模块用于声母韵母识别,所述语音识别控制器根据语音采集及输入电路输入的语音信号以及声母韵母识别模块,得到一个声母韵母序列;
所述拼音识别模块用于汉字拼音识别,所述语音识别控制器根据拼音识别模块,以及所述得到的一个声母韵母序列,输出M个候选汉字序列到显示器,M为正整数,然后根据用户输入的选择信息输出其中的一个候选汉字序列。
所述声母韵母识别模块,可以包括汉语拼音声母韵母模式库、声学模式匹配单元,所述汉语拼音声母韵母模式库用于设置各声母韵母的模式,所述声学模式匹配单元用于将语音信号同各声母韵母的模式进行声学匹配配置信度打分,所述语音识别控制器根据所述声学模式匹配单元对所述语音采集及输入电路输入的语音信号和汉语拼音声母韵母模式库中的汉语拼音声母及韵母的模式进行匹配,分别给出语音信号对应的声母韵母序列中各声母的声学匹配置信度得分和各韵母的声学匹配置信度得分,得到声母声学匹配置信度及韵母声学匹配置信度综合得分排序最高的一个声母韵母序列,所述语音识别控制器根据拼音识别模块,以及所述声母声学匹配置信度及韵母声学匹配置信度综合得分排序最高的一个声母韵母序列,输出M个候选汉字序列到显示器。
所述声母韵母识别模块,可以包括汉语拼音声母韵母模式库、声学模式匹配单元、汉字拼音声母韵母组合单元,所述汉语拼音声母韵母模式库用于设置各声母韵母的模式,所述声学模式匹配单元用于将语音信号同各声母韵母的模式进行声学匹配配置信度打分,所述汉字拼音声母韵母组合单元用于对声母韵母序列中的声母韵母进行声母韵母组合打分,所述语音识别控制器根据所述声学模式匹配单元对所述语音采集及输入电路输入的语音信号和汉语拼音声母韵母模式库中的汉语拼音声母及韵母的模式进行匹配,分别给出语音信号对应的声母韵母序列中各声母的声学匹配置信度得分和各韵母的声学匹配置信度得分,得到声母声学匹配置信度及韵母声学匹配置信度综合得分排序最高的N个声母韵母序列,N为正整数;然后所述语音识别控制器根据所述汉字拼音声母韵母组合单元对所述N个声母韵母序列中的各声母韵母进行声母韵母组合打分,并根据声母声学匹配置信度及韵母声学匹配置信度综合得分、声母韵母组合得分得到所述N个声母韵母序列的声学声韵得分,得到声学声韵得分最高的一个声母韵母序列,然后所述语音识别控制器根据拼音识别模块,以及所述声学声韵得分最高的一个声母韵母序列,输出M个候选汉字序列到显示器。
所述声母韵母识别模块,还可以包括韵母识别置信度修正单元,所述韵母识别置信度修正单元用于将声母韵母序列中的声学匹配置信度得分低于设定值的韵母去除,所述语音识别控制器根据所述韵母识别置信度修正单元,将所述声学声韵得分最高的一个声母韵母序列中的声学匹配置信度得分低于设定值的韵母去除,得到经过韵母识别置信度修正的一个声母韵母序列,然后所述语音识别控制器根据所述拼音识别模块及所述经过韵母识别置信度修正的一个声母韵母序列,输出M个候选汉字序列到显示器。
所述拼音识别模块,可以包括汉语字词库、汉字拼音单元,所述汉语字词库用于设置各汉语字词,所述汉字拼音单元用于将声母韵母序列识别为汉语字词库中的汉语字词序列,所述语音识别控制器根据所述汉字拼音单元及汉语字词库将所述得到的一个声母韵母序列识别为M个候选汉字序列输出到显示器。
所述拼音识别模块,可以包括汉语字词库、汉字拼音单元、汉语文法单元,所述汉语字词库用于设置各汉语字词,所述汉字拼音单元用于将声母韵母序列识别为汉语字词库中的汉语字词序列,所述汉语文法单元用于对汉字序列进行汉语文法选择,所述语音识别控制器根据所述汉字拼音单元及汉语字词库将所述得到的一个声母韵母序列识别为L个候选汉字序列,然后所述语音识别控制器根据所述汉语文法单元对所述L个汉字序列进行汉语文法选择,输出M个候选汉字序列到显示器,L为大于等于M的正整数。
为解决上述技术问题,本发明的汉语语音输入方法,包括以下步骤:
一.利用语音采集及输入电路采集并输入语音信号到语音识别控制器;
二.语音识别控制器根据语音信号及声母韵母识别规则得到一个声母韵母序列;
三.语音识别控制器根据所述得到的一个声母韵母序列及汉字拼音识别规则,输出M个候选汉子序列到显示器,M为正整数;
四.用户输入选择信息;
五.语音识别控制器根据用户输入选择信息输出一个候选汉字序列。
所述声母韵母识别规则,可以包括汉语拼音声母韵母模式库、声学模式匹配规则,所述语音识别控制器根据所述声学模式匹配规则对所述语音采集及输入电路输入的语音信号和汉语拼音声母韵母模式库中的汉语拼音声母及韵母的模式进行匹配,分别给出语音信号对应的声母韵母序列中各声母的声学匹配置信度得分和各韵母的声学匹配置信度得分,得到声母声学匹配置信度及韵母声学匹配置信度综合得分排序最高的一个声母韵母序列,所述语音识别控制器根据拼音识别模块设置的汉字拼音识别规则,以及所述声母声学匹配置信度及韵母声学匹配置信度综合得分排序最高的一个声母韵母序列,输出M个候选汉字序列到显示器。
所述声母韵母识别规则,可以包括汉语拼音声母韵母模式库、声学模式匹配规则、汉字拼音声母韵母组合规则,所述语音识别控制器根据所述声学模式匹配规则对所述语音采集及输入电路输入的语音信号和汉语拼音声母韵母模式库中的汉语拼音声母及韵母的模式进行匹配,分别给出语音信号对应的声母韵母序列中各声母的声学匹配置信度得分和各韵母的声学匹配置信度得分,得到声母声学匹配置信度及韵母声学匹配置信度综合得分排序最高的N个声母韵母序列,N为正整数;然后所述语音识别控制器根据所述汉字拼音声母韵母组合规则对所述N个声母韵母序列中的各声母韵母进行声母韵母组合打分,并根据声母声学匹配置信度及韵母声学匹配置信度综合得分、声母韵母组合得分得到所述N个声母韵母序列的声学声韵得分,得到声学声韵得分最高的一个声母韵母序列,然后所述语音识别控制器根据拼音识别模块设置的汉字拼音识别规则,以及所述声学声韵得分最高的一个声母韵母序列,输出M个候选汉字序列到显示器。
所述声母韵母识别规则,还可以包括韵母识别置信度修正规则,所述语音识别控制器根据所述韵母识别置信度修正规则,将所述声学声韵得分最高的一个声母韵母序列中的声学匹配置信度得分低于设定值的韵母去除,得到经过韵母识别置信度修正的一个声母韵母序列,然后所述语音识别控制器根据所述拼音识别模块中的汉字拼音规则将所述经过韵母识别置信度修正的一个声母韵母序列,输出M个候选汉字序列到显示器。
本发明的汉语语音输入系统及方法,不是使用完全的语音识别直接进行汉字识别,而是设计了声韵识别,语音声学识别进行到声、韵母这个层次,由于声母、韵母是较带调拼音更小的汉语声学元素,包含有更多的可供利用的自然语言信息,可用于对识别结果进行修正,所以能得到更高的汉语语音识别率。
附图说明
下面结合附图和具体实施方式对本发明作进一步的详细说明。
图1是本发明的汉语语音输入系统一实施方式示意图;
图2是本发明的汉语语音输入方法一实施方式示意图。
具体实施方式
本发明的汉语语音输入系统一实施方式如图1所示,包括语音采集及输入电路、声母韵母识别模块、拼音识别模块、语音识别控制器、显示器;
所述语音识别控制器同语音采集及输入电路、声母韵母识别模块、拼音识别模块、显示器分别相连。
所述声母韵母识别模块设置有声母韵母识别规则,用于声母韵母识别,所述语音识别控制器根据语音采集及输入电路输入的语音信号以及声母韵母识别模块设置的声母韵母识别规则,得到一个声母韵母序列;
所述声母韵母识别模块,包括汉语拼音声母韵母模式库、声学模式匹配单元、汉字拼音声母韵母组合单元、韵母识别置信度修正单元,所述汉语拼音声母韵母模式库用于设置各声母(b,p,m,f,d,t,n,l,g,h,j,q,x,zh,ch,sh,r,z,c,s,y,w)韵母(a,o,e,i,u,v,ai,ei,ao,ou,an,en,ang,eng,ong,ia,ie,iao,iou,ian,i n,iang,ing,iong,ua,uo,uai,uei,uan,uen,uang,ueng,ve,van,vn)的模式,所述声学模式匹配单元设置语音信号同所述汉语拼音声母韵母模式进行声学匹配的声学模式匹配规则,用于将语音信号同各声母韵母的模式进行声学匹配配置信度打分,所述汉字拼音声母韵母组合单元设置汉字拼音声母韵母组合规则,用于对声母韵母序列中的声母韵母进行声母韵母组合打分,所述韵母识别置信度修正单元设置根据韵母的声学匹配置信度对汉字拼音的声母韵母组合进行修正的韵母识别置信度修正规则,用于将声母韵母序列中的声学匹配置信度得分低于设定值的韵母去除;所述语音识别控制器根据所述声学模式匹配单元声学模式匹配规则对所述语音采集及输入电路输入的语音信号和汉语拼音声母韵母模式库中的汉语拼音声母及韵母的模式进行匹配,分别给出语音信号对应的声母韵母序列中各声母的声学匹配置信度得分和各韵母的声学匹配置信度得分,得到声母声学匹配置信度及韵母声学匹配置信度综合得分排序最高的N个声母韵母序列,N为正整数;然后所述语音识别控制器根据所述汉字拼音声母韵母组合单元汉字拼音声母韵母组合规则对所述N个声母韵母序列中的各声母韵母进行声母韵母组合打分,并根据声母声学匹配置信度及韵母声学匹配置信度综合得分、声母韵母组合得分得到所述N个声母韵母序列的声学声韵得分,得到声学声韵得分最高的一个声母韵母序列;然后语音识别控制器根据所述韵母识别置信度修正单元韵母识别置信度修正规则,将所述声学声韵得分最高的一个声母韵母序列中的声学匹配置信度得分低于设定值的韵母去除,得到经过韵母识别置信度修正的一个声母韵母序列。
所述拼音识别模块设置有汉字拼音识别规则,用于汉字拼音识别,所述语音识别控制器根据拼音识别模块设置的汉字拼音识别规则,以及所述得到的一个声母韵母序列,输出M个候选汉字序列到显示器,M为正整数,然后根据用户输入的选择信息输出其中的一个候选汉字序列;
所述拼音识别模块,包括汉语字词库、汉字拼音单元、汉语文法单元,所述汉语字词库用于设置各汉语字词,所述汉字拼音单元设置建立声母韵母序列同汉语字词库中的字词的对应关系的汉字拼音规则,用于将声母韵母序列识别为汉语字词库中的汉语字词序列,所述汉语文法单元设置汉语文法规则,用于对汉字序列进行汉语文法选择,,所述语音识别控制器根据汉字拼音单元汉字拼音规则、汉语字词库及所述得到的一个声母韵母序列识别为L个候选汉字序列,然后所述语音识别控制器根据汉语文法单元汉语文法规则对所述L个汉字序列进行汉语文法选择,输出M个候选汉字序列到显示器,L为大于等于M的正整数。
本发明的汉语语音输入方法一实施方式如图2所示,包括以下步骤:
一.利用语音采集及输入电路采集并输入语音信号到语音识别控制器;
二.语音识别控制器根据语音信号及声母韵母识别规则得到一个声母韵母序列;
三.语音识别控制器根据所述一个声母韵母序列及汉字拼音识别规则,输出M个候选汉子序列到显示器,M为正整数;
四.用户输入选择信息;
五.语音识别控制器根据用户输入选择信息输出一个候选汉字序列。
一实施例如下。
用户对麦克风说“我爱北京天安门”,语音采集及输入电路输出语音信号到语音识别控制器,语音识别控制器根据声学模式匹配规则对所述语音采集及输入电路输入的语音信号和汉语拼音声母韵母模式库中的汉语拼音声母韵母模式进行匹配,分别给出语音信号对应的声母韵母序列中各声母的声学匹配置信度得分和各韵母的声学匹配置信度得分,得到声母声学匹配置信度及韵母声学匹配置信度综合得分排序最高的三个声母韵母序列,依声母声学匹配置信度及韵母声学匹配置信度综合得分排序依次是:
1.“u e ai b ei j ing t ian an m eng”,
各声母韵母对应的声学匹配置信度得分为:
9,7,9,9,7,8,7,7,9,8,8,7,
声母声学匹配置信度及韵母声学匹配置信度综合得分为95分;
2.“w e ai b ei j ing t ian an m eng”,
各声母韵母对应的声学匹配置信度得分为:
9,7,9,9,7,8,7,7,9,8,8,7,
声母声学匹配置信度及韵母声学匹配置信度综合得分为95分;
3.“w e ai b ei j ing t ian ang m eng”;
各声母韵母对应的声学匹配置信度得分为:
9,7,9,9,7,8,7,7,9,7,8,7,
声母声学匹配置信度及韵母声学匹配置信度综合得分为94分;
然后所述语音识别控制器根据所述汉字拼音声母韵母组合规则对所述三个声母韵母序列中的各声母韵母进行声母韵母组合打分,并根据声母声学匹配置信度及韵母声学匹配置信度综合得分、声母韵母组合得分得到所述三个声母韵母序列的声学声韵得分,取出声学声韵得分最高的一个声母韵母序列,所述三个声母韵母序列依声学声韵得分排序依次是:
1.“w e ai b ei j ing t ian an m eng”,
各声母韵母对应的声学匹配置信度得分为:
9,7,9,9,7,8,7,7,9,8,8,7,
声母声学匹配置信度及韵母声学匹配置信度综合得分为95分;
声母韵母组合得分为:
10,10,9,10,10,10,10,10,9,9,10,10,
声母韵母序列的声学声韵得分为212分;
2.“w e ai b ei j ing t ian ang m eng”;
各声母韵母对应的声学匹配置信度得分为:
9,7,9,9,7,8,7,7,9,7,8,7,
声母声学匹配置信度及韵母声学匹配置信度综合得分为94分;
声母韵母组合得分为:
10,10,9,10,10,10,10,10,9,9,10,10,
声母韵母序列的声学声韵得分为211分;
3.“u e ai b ei j ing t ian an m eng”,
各声母韵母对应的声学匹配置信度得分为:
9,7,9,9,7,8,7,7,9,8,8,7,
声母声学匹配置信度及韵母声学匹配置信度综合得分为95分;
声母韵母组合得分为:
0,9,9,10,10,10,10,10,9,9,10,10,
声母韵母序列的声学声韵得分为201分;
然后所述语音识别控制器根据所述韵母识别置信度修正规则,将所述声学声韵得分最高的一个声母韵母序列中的声学匹配置信度得分低于设定值的韵母去除;
1.“w e ai b ei j ing t ian an m eng”,
各声母韵母对应的声学匹配置信度得分为:
9,7,9,9,7,8,7,7,9,8,8,7,
将声学匹配置信度得分低于8的韵母去除,得到一个经过韵母识别置信度修正的声母韵母序列:
“w ai b j t ian an m”,
然后,所述语音识别控制器根据所述拼音识别模块中的汉字拼音规则将所述经过韵母识别置信度修正的声母韵母序列“w ai b j t ianan m”识别为多个汉字序列:“我爱北京天安门”、“我矮背景天安门”、“沃哀倍经田按们”、“外北京天安门”、……;然后所述语音识别控制器根据所述汉语文法规则对所述多个汉字序列进行汉语文法选择,输出多个候选汉字序列到显示器:1.“我爱北京天安门”,2.“外北京天安门”,3.“我矮背景天安门”;根据用户输入的选择信息选择1,所述语音识别控制器根据用户输入的选择信息输出汉字序列“我爱北京天安门”。
本发明的汉语语音输入系统及方法,不是使用完全的语音识别直接进行汉字识别,而是设计了声韵识别,语音声学识别进行到声、韵母这个层次,由于声母、韵母是较带调拼音更小的汉语声学元素,包含有更多的可供利用的自然语言信息,可用于对识别结果进行修正,所以能得到更高的汉语语音识别率。可以利用汉字拼音的声母韵母组合规则对经声母、韵母识别得到的声母韵母序列进行修正,得到最符合声学和汉字拼音的声母韵母组合则的一个声母韵母序列,并可进一步根据韵母识别置信度修正规则对声母韵母序列进行修正,将声母韵母序列中声学匹配置信度低的韵母去除得到韵母识别置信度修正的一个声母韵母序列,利用该修正后的一个声母韵母序列进行汉语语音识别能更加准确。
本发明的汉语语音输入系统及方法,可以应用于手持式设备上,实现了在外形尺寸受限的手持式设备上的语音输入法,完善并丰富在手持式设备上的交互方式,改变目前在手持式设备上传统的交互方式。

Claims (10)

1.一种汉语语音输入系统,其特征在于,包括语音采集及输入电路、声母韵母识别模块、拼音识别模块、语音识别控制器、显示器;
所述语音识别控制器同语音采集及输入电路、声母韵母识别模块、拼音识别模块、显示器分别相连;
所述声母韵母识别模块用于声母韵母识别,所述语音识别控制器根据语音采集及输入电路输入的语音信号以及声母韵母识别模块,得到一个声母韵母序列;
所述拼音识别模块用于汉字拼音识别,所述语音识别控制器根据拼音识别模块,以及所述得到的一个声母韵母序列,输出M个候选汉字序列到显示器,M为正整数,然后根据用户输入的选择信息输出其中的一个候选汉字序列。
2.根据权利要求1所述的汉语语音输入系统,其特征在于,所述声母韵母识别模块,包括汉语拼音声母韵母模式库、声学模式匹配单元,所述汉语拼音声母韵母模式库用于设置各声母韵母的模式,所述声学模式匹配单元用于将语音信号同各声母韵母的模式进行声学匹配配置信度打分,所述语音识别控制器根据所述声学模式匹配单元对所述语音采集及输入电路输入的语音信号和汉语拼音声母韵母模式库中的汉语拼音声母及韵母的模式进行匹配,分别给出语音信号对应的声母韵母序列中各声母的声学匹配置信度得分和各韵母的声学匹配置信度得分,得到声母声学匹配置信度及韵母声学匹配置信度综合得分排序最高的一个声母韵母序列,所述语音识别控制器根据拼音识别模块,以及所述声母声学匹配置信度及韵母声学匹配置信度综合得分排序最高的一个声母韵母序列,输出M个候选汉字序列到显示器。
3.根据权利要求1所述的汉语语音输入系统,其特征在于,所述声母韵母识别模块,包括汉语拼音声母韵母模式库、声学模式匹配单元、汉字拼音声母韵母组合单元,所述汉语拼音声母韵母模式库用于设置各声母韵母的模式,所述声学模式匹配单元用于将语音信号同各声母韵母的模式进行声学匹配配置信度打分,所述汉字拼音声母韵母组合单元用于对声母韵母序列中的声母韵母进行声母韵母组合打分,所述语音识别控制器根据所述声学模式匹配单元对所述语音采集及输入电路输入的语音信号和汉语拼音声母韵母模式库中的汉语拼音声母及韵母的模式进行匹配,分别给出语音信号对应的声母韵母序列中各声母的声学匹配置信度得分和各韵母的声学匹配置信度得分,得到声母声学匹配置信度及韵母声学匹配置信度综合得分排序最高的N个声母韵母序列,N为正整数;然后所述语音识别控制器根据所述汉字拼音声母韵母组合单元对所述N个声母韵母序列中的各声母韵母进行声母韵母组合打分,并根据声母声学匹配置信度及韵母声学匹配置信度综合得分、声母韵母组合得分得到所述N个声母韵母序列的声学声韵得分,得到声学声韵得分最高的一个声母韵母序列,然后所述语音识别控制器根据拼音识别模块,以及所述声学声韵得分最高的一个声母韵母序列,输出M个候选汉字序列到显示器。
4.根据权利要求3所述的汉语语音输入系统,其特征在于,所述声母韵母识别模块,还包括韵母识别置信度修正单元,所述韵母识别置信度修正单元用于将声母韵母序列中的声学匹配置信度得分低于设定值的韵母去除,所述语音识别控制器根据所述韵母识别置信度修正单元,将所述声学声韵得分最高的一个声母韵母序列中的声学匹配置信度得分低于设定值的韵母去除,得到经过韵母识别置信度修正的一个声母韵母序列,然后所述语音识别控制器根据所述拼音识别模块及所述经过韵母识别置信度修正的一个声母韵母序列,输出M个候选汉字序列到显示器。
5.根据权利要求1至4任一项所述的汉语语音输入系统,其特征在于,所述拼音识别模块,包括汉语字词库、汉字拼音单元,所述汉语字词库用于设置各汉语字词,所述汉字拼音单元用于将声母韵母序列识别为汉语字词库中的汉语字词序列,所述语音识别控制器根据所述汉字拼音单元及汉语字词库将所述得到的一个声母韵母序列识别为M个候选汉字序列输出到显示器。
6.根据权利要求1至4任一项所述的汉语语音输入系统,其特征在于,所述拼音识别模块,包括汉语字词库、汉字拼音单元、汉语文法单元,所述汉语字词库用于设置各汉语字词,所述汉字拼音单元用于将声母韵母序列识别为汉语字词库中的汉语字词序列,所述汉语文法单元用于对汉字序列进行汉语文法选择,所述语音识别控制器根据所述汉字拼音单元及汉语字词库将所述得到的一个声母韵母序列识别为L个候选汉字序列,然后所述语音识别控制器根据所述汉语文法单元对所述L个汉字序列进行汉语文法选择,输出M个候选汉字序列到显示器,L为大于等于M的正整数。
7.一种汉语语音输入方法,其特征在于,包括以下步骤:
一.利用语音采集及输入电路采集并输入语音信号到语音识别控制器;
二.语音识别控制器根据语音信号及声母韵母识别规则得到一个声母韵母序列;
三.语音识别控制器根据所述得到的一个声母韵母序列及汉字拼音识别规则,输出M个候选汉子序列到显示器,M为正整数;
四.用户输入选择信息;
五.语音识别控制器根据用户输入选择信息输出一个候选汉字序列。
8.根据权利要求7所述的汉语语音输入方法,其特征在于,所述声母韵母识别规则,包括汉语拼音声母韵母模式库、声学模式匹配规则,所述语音识别控制器根据所述声学模式匹配规则对所述语音采集及输入电路输入的语音信号和汉语拼音声母韵母模式库中的汉语拼音声母及韵母的模式进行匹配,分别给出语音信号对应的声母韵母序列中各声母的声学匹配置信度得分和各韵母的声学匹配置信度得分,得到声母声学匹配置信度及韵母声学匹配置信度综合得分排序最高的一个声母韵母序列,所述语音识别控制器根据拼音识别模块设置的汉字拼音识别规则,以及所述声母声学匹配置信度及韵母声学匹配置信度综合得分排序最高的一个声母韵母序列,输出M个候选汉字序列到显示器。
9.根据权利要求7所述的汉语语音输入方法,其特征在于,所述声母韵母识别规则,包括汉语拼音声母韵母模式库、声学模式匹配规则、汉字拼音声母韵母组合规则,所述语音识别控制器根据所述声学模式匹配规则对所述语音采集及输入电路输入的语音信号和汉语拼音声母韵母模式库中的汉语拼音声母及韵母的模式进行匹配,分别给出语音信号对应的声母韵母序列中各声母的声学匹配置信度得分和各韵母的声学匹配置信度得分,得到声母声学匹配置信度及韵母声学匹配置信度综合得分排序最高的N个声母韵母序列,N为正整数;然后所述语音识别控制器根据所述汉字拼音声母韵母组合规则对所述N个声母韵母序列中的各声母韵母进行声母韵母组合打分,并根据声母声学匹配置信度及韵母声学匹配置信度综合得分、声母韵母组合得分得到所述N个声母韵母序列的声学声韵得分,得到声学声韵得分最高的一个声母韵母序列,然后所述语音识别控制器根据拼音识别模块设置的汉字拼音识别规则,以及所述声学声韵得分最高的一个声母韵母序列,输出M个候选汉字序列到显示器。
10.根据权利要求9所述的汉语语音输入方法,其特征在于,所述声母韵母识别规则,还包括韵母识别置信度修正规则,所述语音识别控制器根据所述韵母识别置信度修正规则,将所述声学声韵得分最高的一个声母韵母序列中的声学匹配置信度得分低于设定值的韵母去除,得到经过韵母识别置信度修正的一个声母韵母序列,然后所述语音识别控制器根据所述拼音识别模块中的汉字拼音规则将所述经过韵母识别置信度修正的一个声母韵母序列,输出M个候选汉字序列到显示器。
CN200910201815.5A 2009-11-18 2009-11-18 汉语语音输入系统及方法 Active CN102063282B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200910201815.5A CN102063282B (zh) 2009-11-18 2009-11-18 汉语语音输入系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910201815.5A CN102063282B (zh) 2009-11-18 2009-11-18 汉语语音输入系统及方法

Publications (2)

Publication Number Publication Date
CN102063282A true CN102063282A (zh) 2011-05-18
CN102063282B CN102063282B (zh) 2014-08-13

Family

ID=43998574

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910201815.5A Active CN102063282B (zh) 2009-11-18 2009-11-18 汉语语音输入系统及方法

Country Status (1)

Country Link
CN (1) CN102063282B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103455301A (zh) * 2013-08-31 2013-12-18 武文 一种语音输入法
CN103745722A (zh) * 2014-02-10 2014-04-23 上海金牌软件开发有限公司 一种语音交互智能家居系统及语音交互方法
CN106601259A (zh) * 2016-12-13 2017-04-26 北京奇虎科技有限公司 一种基于声纹搜索的信息推荐方法及装置
CN107016994A (zh) * 2016-01-27 2017-08-04 阿里巴巴集团控股有限公司 语音识别的方法及装置
CN110189744A (zh) * 2019-04-09 2019-08-30 阿里巴巴集团控股有限公司 文本处理的方法、装置和电子设备
CN110245331A (zh) * 2018-03-09 2019-09-17 中兴通讯股份有限公司 一种语句转换方法、装置、服务器及计算机存储介质
CN112988955A (zh) * 2019-12-02 2021-06-18 卢文祥 多语语音识别及主题语意分析方法与装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1114438A (zh) * 1994-06-30 1996-01-03 王骏发 计算机汉语词汇语音输入方法
JP3530591B2 (ja) * 1994-09-14 2004-05-24 キヤノン株式会社 音声認識装置及びこれを用いた情報処理装置とそれらの方法
CN1499484A (zh) * 2002-11-06 2004-05-26 北京天朗语音科技有限公司 汉语连续语音识别系统

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103455301A (zh) * 2013-08-31 2013-12-18 武文 一种语音输入法
CN103745722A (zh) * 2014-02-10 2014-04-23 上海金牌软件开发有限公司 一种语音交互智能家居系统及语音交互方法
CN103745722B (zh) * 2014-02-10 2017-02-08 上海金牌软件开发有限公司 一种语音交互智能家居系统及语音交互方法
CN107016994A (zh) * 2016-01-27 2017-08-04 阿里巴巴集团控股有限公司 语音识别的方法及装置
CN107016994B (zh) * 2016-01-27 2020-05-08 阿里巴巴集团控股有限公司 语音识别的方法及装置
CN106601259A (zh) * 2016-12-13 2017-04-26 北京奇虎科技有限公司 一种基于声纹搜索的信息推荐方法及装置
CN110245331A (zh) * 2018-03-09 2019-09-17 中兴通讯股份有限公司 一种语句转换方法、装置、服务器及计算机存储介质
CN110189744A (zh) * 2019-04-09 2019-08-30 阿里巴巴集团控股有限公司 文本处理的方法、装置和电子设备
CN112988955A (zh) * 2019-12-02 2021-06-18 卢文祥 多语语音识别及主题语意分析方法与装置
CN112988955B (zh) * 2019-12-02 2024-03-15 卢文祥 多语语音识别及主题语意分析方法与装置

Also Published As

Publication number Publication date
CN102063282B (zh) 2014-08-13

Similar Documents

Publication Publication Date Title
CN110444191B (zh) 一种韵律层级标注的方法、模型训练的方法及装置
CN110288077B (zh) 一种基于人工智能的合成说话表情的方法和相关装置
CN102063282B (zh) 汉语语音输入系统及方法
CN110473523A (zh) 一种语音识别方法、装置、存储介质及终端
CN101923858B (zh) 一种实时同步互译语音终端
CN104166462A (zh) 一种文字的输入方法和系统
CN109523989A (zh) 语音合成方法、语音合成装置、存储介质及电子设备
CN107680585B (zh) 一种中文分词方法、中文分词装置和终端
WO2020098269A1 (zh) 一种语音合成方法及语音合成装置
CN107122160A (zh) 用于语音输入控制指令的显示方法、装置和终端
CN108257593B (zh) 一种语音识别方法、装置、电子设备及存储介质
CN106910503A (zh) 用于智能终端显示用户操控指令的方法、装置和智能终端
CN105404621A (zh) 一种用于盲人读取汉字的方法及系统
CN104765455A (zh) 基于敲击振动的人机交互系统
CN112309365A (zh) 语音合成模型的训练方法、装置、存储介质以及电子设备
Panda Automated speech recognition system in advancement of human-computer interaction
CN109256116A (zh) 通过语音识别键盘功能的方法、系统、设备及存储介质
CN102970618A (zh) 基于音节识别的视频点播方法
CN101169684A (zh) 一种远距离多通道人机交互装置及其交互方法
CN101577115A (zh) 语音输入系统及其方法
CN103455530A (zh) 随身携带式创建个性化语音对应文本文字数据库的装置
Kaplan Computers/software: Words into action: I: Spoken advice can be recognized and converted to standard digital commands
CN112489634A (zh) 语言的声学模型训练方法、装置、电子设备及计算机介质
CN111968646A (zh) 一种语音识别方法及装置
CN104035551A (zh) 一种输入方法及电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: SHANGHAI GUOKE ELECTRONIC CO., LTD.

Free format text: FORMER OWNER: SHANDA NETWORKING CO., LTD.

Effective date: 20140310

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 201203 PUDONG NEW AREA, SHANGHAI TO: 201210 PUDONG NEW AREA, SHANGHAI

TA01 Transfer of patent application right

Effective date of registration: 20140310

Address after: 201210 No. 958, Lane 60, Huaxia Middle Road, Pudong New Area, Shanghai

Applicant after: Ouroboros Medical, Inc.

Address before: Shanghai city Pudong New Area 201203 GuoShouJing Road No. 356

Applicant before: SHANDA COMPUTER (SHANGHAI) Co.,Ltd.

C14 Grant of patent or utility model
GR01 Patent grant
CP03 Change of name, title or address

Address after: 200120 China (Shanghai) free trade zone 356 GuoShouJing Road No. 3, room 127

Patentee after: SHANGHAI GEAK ELECTRONICS Co.,Ltd.

Address before: 201210 No. 958, Lane 60, Huaxia Middle Road, Pudong New Area, Shanghai

Patentee before: Ouroboros Medical, Inc.

CP03 Change of name, title or address
TR01 Transfer of patent right

Effective date of registration: 20180404

Address after: 201306 room N2025, building No. 2, Xincheng Road, mud town, Shanghai, Pudong New Area, China, 24

Patentee after: SHANGHAI LIANSHANG NETWORK TECHNOLOGY Co.,Ltd.

Address before: Chinese (Shanghai) free trade zone 356 GuoShouJing Road No. 3, room 127

Patentee before: SHANGHAI GEAK ELECTRONICS Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20211223

Address after: 200131 Zone E, 9th floor, No.1 Lane 666, zhangheng Road, China (Shanghai) pilot Free Trade Zone, Pudong New Area, Shanghai

Patentee after: Shanghai Shangxiang Network Technology Co.,Ltd.

Address before: 201306 N2025 room 24, 2 New Town Road, mud town, Pudong New Area, Shanghai

Patentee before: SHANGHAI LIANSHANG NETWORK TECHNOLOGY Co.,Ltd.