CN106469555A - 一种语音识别方法及终端 - Google Patents
一种语音识别方法及终端 Download PDFInfo
- Publication number
- CN106469555A CN106469555A CN201610809262.1A CN201610809262A CN106469555A CN 106469555 A CN106469555 A CN 106469555A CN 201610809262 A CN201610809262 A CN 201610809262A CN 106469555 A CN106469555 A CN 106469555A
- Authority
- CN
- China
- Prior art keywords
- voice
- messagings
- signal
- mike
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 230000000052 comparative effect Effects 0.000 claims abstract description 21
- 238000001914 filtration Methods 0.000 claims description 17
- 238000003860 storage Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000005611 electricity Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 241000209140 Triticum Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000010349 pulsation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephone Function (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明实施例提供了一种语音识别方法及终端,该方法包括:通过至少两个麦克风分别采集语音信号,至少两个麦克风采集的语音信号源为同一语音信号源,至少两个麦克风中每个麦克风的识别成功率相等;通过每个麦克风分别识别采集的语音信号,以获得至少两个语音信息;比较至少两个语音信息;当比较结果为至少两个语音信息相同时,确定语音信息为目标语音信息。实施本发明实施例,可以提高语音识别的准确率。
Description
技术领域
本发明涉及语音识别技术领域,具体涉及一种语音识别方法及终端。
背景技术
随着电子技术的不断发展,语音交互已成为一种重要的人机交互方式。在语音交互方式中,为了进行人机交互,终端需要识别采集的语音信号。目前,终端一般采用单个麦克风采集及识别语音信号。在上述方式中,直接将这个麦克风识别得到的信号作为最终的信号,由于对识别得到的信号未进行验证,无法确定识别得到的信号是否准确,以致降低了语音识别的准确率。
发明内容
本发明实施例提供一种语音识别方法及终端,可以提高语音识别的准确率。
本发明实施例第一方面提供一种语音识别方法,包括:
通过至少两个麦克风分别采集语音信号,所述至少两个麦克风采集的语音信号源为同一语音信号源,所述至少两个麦克风中每个麦克风的识别成功率相等;
通过每个所述麦克风分别识别采集的语音信号,以获得至少两个语音信息;
比较所述至少两个语音信息;
当比较结果为所述至少两个语音信息相同时,确定所述语音信息为目标语音信息。
本发明实施例第二方面提供一种终端,包括:
采集单元,用于通过至少两个麦克风分别采集语音信号,所述至少两个麦克风采集的语音信号源为同一语音信号源,所述至少两个麦克风中每个麦克风的识别成功率相等;
识别单元,用于通过每个所述麦克风分别识别所述采集单元采集的语音信号,以获得至少两个语音信息;
比较单元,用于比较所述识别单元获得的至少两个语音信息;
确定单元,用于当所述比较单元的比较结果为所述至少两个语音信息相同时,确定所述语音信息为目标语音信息。
本发明实施例中,通过至少两个麦克风分别采集语音信号,至少两个麦克风采集的语音信号源为同一语音信号源,至少两个麦克风中每个麦克风的识别成功率相等,通过每个麦克风分别识别采集的语音信号,以获得至少两个语音信息,比较至少两个语音信息,当比较结果为至少两个语音信息相同时,确定语音信息为目标语音信息,可见,当多个麦克风的识别结果相同时,才将识别得到的语音信息作为最终的语音信息,且由于多个麦克风同时识别错误的概率较小,因此,可以提高语音识别的准确率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种语音识别方法的流程示意图;
图2是本发明实施例提供的另一种语音识别方法的流程示意图;
图3是本发明实施例提供的一种终端的结构示意图;
图4是本发明实施例提供的另一种终端的结构示意图;
图5是本发明实施例提供的又一种终端的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种语音识别方法及终端,可以提高语音识别的准确率。以下分别进行详细说明。
请参阅图1,图1是本发明实施例提供的一种语音识别方法的流程示意图。其中,该语音识别方法是从设置有多个麦克风的终端的角度来描述的。如图1所示,该语音识别方法可以包括以下步骤。
101、通过至少两个麦克风采集语音信号。
本实施例中,至少两个麦克风采集的语音信号源为同一语音信号源,同一语音信号源是说明语音信号来自同样的外界发声源,即所有的麦克风对同一语音信号源进行采集。至少两个麦克风中每个麦克风的识别成功率相等,例如,当用三个麦克风A、B、C同时进行语音识别时,麦克风A、麦克风B和麦克风C单独进行语音识别的语音识别成功率相等,如均为90%。
102、通过每个麦克风分别识别采集的语音信号,以获得至少两个语音信息。
本实施例中,通过至少两个麦克风采集语音信号是为了从语音信号中获得语音信号的语音信息,语音信号的语音信息是用于标识语音信号,包括语音信号的幅度、相位和频率等信息。至少两个语音信息是通过至少两个麦克风中每个麦克风识别一个得到的,例如,当用三个麦克风A、B、C进行语音识别时,麦克风A、麦克风B和麦克风C分别对各自采集到的来自于同一语音信号源的语音信号进行识别,对应得到三个语音信息a、b和c。进行语音识别的麦克风的数量与得到的语音信息的数量相同。
103、比较至少两个语音信息。
本实施例中,通过至少两个麦克风采集语音信号获得至少两个语音信息之后,将比较至少两个语音信息,即判断至少两个语音信息是否相同,至少两个语音信息对比时,可以将识别的语音信息两两分别对比,也可以是其他对比方式,最终任两个语音信息均实现一次对比。
本实施例中,进行比较时语音信号的幅度、相位和频率等信息完全相同时,才认为所对比的语音信息为相同的语音信息。如判断语音信息a和语音信息b是否相同时,对比a和b的幅度、相位和频率信息,当对比结果为幅度、相位和频率完全相同,判定语音信息a和语音信息b是相同的;当对比结果中幅度、相位和频率任一个或多个不相同,判定语音信息a和语音信息b是不同的。判断多于两个语音信息相同与否时,根据两两对比结果判定两两语音信息是否相同,若出现任一组对比结果判定为不相同的语音信息,则判定至少两个语音信息是不同的,如判断三个语音信息a、b和c相同与否时,可分别按照上面的方法对比语音信息a和b、a和c、b和c是否相同,若三组对比均判定为相同,则可判定三个语音信息a、b和c是相同的,若任一组或多组对比判定为不同,则判定三个语音信息a、b和c不同。
104、当至少两个语音信息相同时,确定至少两个语音信息为目标语音信息。
本实施例中,当比较结果为至少两个语音信息相同时,判定至少两个麦克风采集到的语音信息是准确的,确定该语音信息为目标语言信息。
105、当至少两个语音信息不同时,计算至少两个语音信息不同的概率。
本实施例中,当比较结果为至少两个语音信息不同时,即判定至少两个麦克风采集到的语音信息存在错误,计算至少两个语音信息不同的概率。采用的至少两个麦克风性能基本相当,可以认定,至少两个麦克风中每个麦克风单独进行语音识别时,识别成功率基本相等,若设此识别成功率为x,x为大于0且小于1的实数,则识别识别率为1-x,以三个麦克风A、B和C进行语音识别为例,在一次识别中三者同时识别成功的概率为
M1=x3
在一次识别中三个麦克风全部识别错误的概率为
N1=(1-x)3
在一次识别中至少两个语音信息相同的概率为
L1=M1+N1=x3+(1-x)3
在一次识别中至少两个语音信息不同的概率为
T1=1-M1-N1=1-x3-(1-x)3
如果至少两个语音信息不同时返回再识别,那么,第n(n为大于0的自然数)次识别时,至少两个语音信息不同的概率为
Tn=[1-x3-(1-x)3]n
当用y(y为大于0的自然数)个麦克风同时进行语音识别时,第n次识别时至少两个语音信息不同的概率为
Tn=[1-xy-(1-x)y]n
根据上式计算至少两个语音信息不同的概率。
106、当至少两个语音信息不同的概率小于或等于预设值时,将至少两个语音信息中相同且数量最多的语音信息确定为目标语音信息。
本实施例中,当至少两个语音信息不同的概率小于预设值时,说明这一情况发生概率很小,不再进行重新识别,将至少两个语音信息中相同且数量最多的语音信息确定为目标语音信息。经过n次再识别之后,进入n+1次再识别的概率是非常低的,即多次的再识别之后,系统已经基本不可能再次进入再识别可能,因为当发生的事情概率降低至足够小时,此小概率事件将很难再发生。
当用y个麦克风同时进行语音识别时,第n次识别时至少两个语音信息不同的概率小于或等于预设值时,不再无限制的重复识别,而是将至少两个语音信息中相同且数量最多的语音信息确定为目标语音信息。此处预设值可根据需要设定,预设值设定越小,至少两个语音信息不同时,识别次数越多。例如,三个语音识别成功率均为90%的麦克风同时进行语音识别时,设定预设值为0.5%,在第四次语音信息不同时计算得到概率为0.53%,若第五次进行语音识别得到的语音信息仍不相同,此时概率为0.14%,小于预设值0.5%,此时不再返回重新进行语音识别,而是从三个麦克风采集到的语音信息中选择相同且数量最多的语音信息,作为目标语音信息。
用三个麦克风同时进行语音识别时,系统最终的识别成功率约为
系统最终的识别错误率约为
因此,我们可以得到,用有y个麦克风的智能终端设备,系统识别成功率约为
识别错误率约为
例如,某一终端用两个麦克风实现语音识别,每个麦克风单独进行语音识别时,识别成功率为90%,则计算可得,语音识别系统的识别成功率M=98.78%,识别错误率N=1.22%。综合识别成功率与用单个性能相当的麦克风进行识别时相比,提升将近9个百分点。用三个麦克风实现语音识别,每个麦克风单独进行语音识别时,识别成功率为90%,则计算可得,语音识别系统的识别成功率M=99.86%,识别错误率N=0.14%,综合识别成功率与用单个性能相当的麦克风进行识别时相比,提升多于9个百分点。可见,多个麦克风同时进行语音识别可显著提高语音识别系统的识别成功率,且使用麦克风越多,识别成功率越高。
在图1所描述的语音识别方法中,通过至少两个麦克风分别采集语音信号,至少两个麦克风采集的语音信号源为同一语音信号源,至少两个麦克风中每个麦克风的识别成功率相等,通过每个麦克风分别识别采集的语音信号,以获得至少两个语音信息,比较至少两个语音信息,当比较结果为至少两个语音信息相同时,确定语音信息为目标语音信息,可见,当多个麦克风的识别结果相同时,才将识别得到的语音信息作为最终的语音信息,且由于多个麦克风同时识别错误的概率较小,因此,可以提高语音识别的准确率。
请参阅图2,图2是本发明实施例提供的另一种语音识别方法的流程示意图。其中,该语音识别方法是从设置有多个麦克风的终端的角度来描述的。如图2所示,该语音识别方法可以包括以下步骤。
201、通过至少两个麦克风采集语音信号。
本实施例中,至少两个麦克风采集的语音信号源为同一语音信号源,同一语音信号源是说明语音信号来自同样的外界发声源,即所有的麦克风对同一语音信号源进行采集。至少两个麦克风中每个麦克风的识别成功率相等,例如,当用三个麦克风A、B、C同时进行语音识别时,麦克风A、麦克风B和麦克风C单独进行语音识别的语音识别成功率相等,如均为90%。
202、采集噪声信号。
本实施例中,智能终端自身运行的噪音和周围的环境噪音较大时,麦克风进行语音识别易出现错误,导致语音识别的错误率高。噪声的来源一般有环境噪声、设备噪声和电气噪声。环境噪声一般指外界环境中的声音,设备噪声指麦克风、声卡等硬件产生的噪声,电气噪声有直流电中包含的交流声,三极管和集成电路中的无规则电子运动产生的噪声,供给麦克风电源的电压波动(偏置电压)引起的电子噪音,内部材质电阻(热噪讯),外部射频发射器的干扰等。因此,在进行语音识别之前,首先采集噪声信号为后面滤出噪声信号做准备。
203、滤除每个语音信号中的噪声信号,以获得至少两个滤除噪声后的语音信号。
本实施例中,对于噪声的滤出,可通过软件滤波和硬件滤波两种发法实现。硬件滤波主要是通过电容电阻来组合起来滤波,软件滤波是通过软件来识别有用信号和干扰信号,并通过软件设计来滤出干扰信号。
204、通过每个所述麦克风分别识别滤除噪声后的语音信号,以获得至少两个语音信息。
本实施例中,终端通过至少两个麦克风采集滤除噪声后的语音信号是为了从滤除噪声后的语音信号中获得语音信号的语音信息,语音信号的语音信息是用于标识语音信号,包括滤除噪声后的语音信号的幅度、相位和频率等信息。至少两个语音信息是通过至少两个麦克风中每个麦克风识别一个滤除噪声后的语音信号得到的,例如,当用三个麦克风A、B、C进行语音识别时,麦克风A、麦克风B和麦克风C分别对各自采集到的来自于同一语音信号源的滤除噪声后的语音信号进行识别,对应得到三个语音信息a、b和c。进行语音识别的麦克风的数量与得到的语音信息的数量相同。
205、比较至少两个语音信息。
本实施例中,通过至少两个麦克风采集语音信号获得至少两个语音信息之后,将比较至少两个语音信息,即判断至少两个语音信息是否相同,至少两个语音信息对比时,可以将识别的语音信息两两分别对比,也可以是其他对比方式,最终任两个语音信息均实现一次对比。
本实施例中,进行比较时语音信号的幅度、相位和频率等信息完全相同时,才认为所对比的语音信息为相同的语音信息。如判断语音信息a和语音信息b是否相同时,对比a和b的幅度、相位和频率信息,当对比结果为幅度、相位和频率完全相同,判定语音信息a和语音信息b是相同的;当对比结果中幅度、相位和频率任一个或多个不相同,判定语音信息a和语音信息b是不同的。判断多于两个语音信息相同与否时,根据两两对比结果判定两两语音信息是否相同,若出现任一组对比结果判定为是不相同的语音信息,则判定至少两个语音信息是不同的,如判断三个语音信息a、b和c相同与否时,可分别按照上面的方法对比语音信息a和b、a和c、b和c是否相同,若三组对比均判定为相同,则可判定三个语音信息a、b和c是相同的,若任一组或多组对比判定为不同,则判定三个语音信息a、b和c不同。
206、当至少两个语音信息相同时,确定至少两个语音信息为目标语音信息。
本实施例中,当比较结果为至少两个语音信息相同时,判定至少两个麦克风采集到的语音信息是准确的,确定该语音信息为目标语言信息。
207、当至少两个语音信息不同时,计算至少两个语音信息不同的概率。
本实施例中,当比较结果为至少两个语音信息不同时,即判定至少两个麦克风采集到的语音信息存在错误,计算至少两个语音信息不同的概率。采用的至少两个麦克风性能基本相当,可以认定,至少两个麦克风中每个麦克风单独进行语音识别时,识别成功率基本相等,若设此识别成功率为x(0<x<1,x为实数),则识别识别率为1-x,以三个麦克风A、B和C进行语音识别为例,在一次识别中三者同时识别成功的概率为
M1=x3
在一次识别中三个麦克风全部识别错误的概率为
N1=(1-x)3
在一次识别中至少两个语音信息相同的概率为
L1=M1+N1=x3+(1-x)3
在一次识别中至少两个语音信息不同的概率为
T1=1-M1-N1=1-x3-(1-x)3
如果至少两个语音信息不同时返回再识别,那么,第n(n为大于0的自然数)次识别时至少两个语音信息不同的概率为
Tn=[1-x3-(1-x)3]n
当用y(y为大于0的自然数)个麦克风同时进行语音识别时,第n次识别时至少两个语音信息不同的概率为
Tn=[1-xy-(1-x)y]n
根据上式计算至少两个语音信息不同的概率。
208、判断至少两个语音信息不同的概率是否小于或等于预设值,当至少两个语音信息不同的概率小于或等于预设值时,执行步骤209,当至少两个语音信息不同的概率大于预设值时,执行步骤204,即返回重新识别语音信号。
本实施例中,每次识别得到至少两个语音信息不同时,计算此时识别得到至少两个语音信息不同的概率,并与预设值进行比较,预设值可根据实际需要进行设置。
本实施例中,当至少两个语音信息不同的概率大于预设值时,仍然需要返回识别步骤204,每个麦克风分别对滤除噪声后的语音信号重新识别,以重新获得至少两个语音信息,并继续对新获得的至少两个语音信息执行步骤205。
209、将至少两个语音信息中相同且数量最多的语音信息确定为目标语音信息。
本实施例中,当至少两个语音信息不同的概率小于预设值时,说明这一情况发生概率很小,不再进行重新识别,将至少两个语音信息中相同且数量最多的语音信息确定为目标语音信息。经过n次再识别之后,进入n+1次再识别的概率是非常低的,即多次的再识别之后,系统已经基本不可能再次进入再识别可能,因为当发生的事情概率降低至足够小时,此小概率事件将很难再发生。
当用y个麦克风同时进行语音识别时,第n次识别时至少两个语音信息不同的概率小于或等于预设值时,不再无限制的重复识别,而是从每次所有麦克风识别的所有语音信息中选取相同数量最多的语音信息,并确定为目标语音信息。此处预设值可根据需要设定。例如三个语音识别成功率均为90%的麦克风同时进行语音识别时,设定预设值为0.5%,在第四次语音信息不同时计算得到概率为0.53%,若第五次进行语音识别得到的语音信息仍不相同,此时概率为0.14%,小于预设值0.5%,此时不再返回重新进行语音识别,而是从统计五次识别过程中三个麦克风采集到的所有语音信息中选择相同数量最多的语音信息,作为目标语音信息。
用三个麦克风同时进行语音识别时,系统最终的识别成功率约为
系统最终的识别错误率约为
因此,我们可以得到,用有y个麦克风的智能终端设备,系统识别成功率约为
识别错误率约为
例如,某一终端用两个麦克风实现语音识别,每个麦克风单独进行语音识别时,识别成功率为90%,则计算可得,语音识别系统的识别成功率M=98.78%,识别错误率N=1.22%。综合识别成功率提升将近9个百分点。用三个麦克风实现语音识别,每个麦克风单独进行语音识别时,识别成功率为90%,则计算可得,语音识别系统的识别成功率M=99.86%,识别错误率N=0.14%。综合识别成功率提升多于9个百分点。可见,多个麦克风同时进行语音识别可显著提高语音识别系统的识别成功率,且使用麦克风越多,识别成功率越高。
在图2所描述的语音识别方法中,通过至少两个麦克风分别采集语音信号,至少两个麦克风采集的语音信号源为同一语音信号源,至少两个麦克风中每个麦克风的识别成功率相等,通过每个麦克风分别识别采集的语音信号,以获得至少两个语音信息,比较至少两个语音信息,当比较结果为至少两个语音信息相同时,确定语音信息为目标语音信息,可见,当多个麦克风的识别结果相同时,才将识别得到的语音信息作为最终的语音信息,且由于多个麦克风同时识别错误的概率较小,因此,可以提高语音识别的准确率。
请参阅图3,图3是本发明实施例提供的一种终端的结构示意图。其中,该终端设置有至少两个麦克风。如图3所示,该终端可以包括:
采集单元301,用于通过至少两个麦克风分别采集语音信号,至少两个麦克风采集的语音信号源为同一语音信号源,至少两个麦克风中每个麦克风的识别成功率相等;
识别单元302,用于通过每个麦克风分别识别采集单元301采集的语音信号,以获得至少两个语音信息;
比较单元303,用于比较识别单元302获得的至少两个语音信息;
确定单元304,用于当比较单元303的比较结果为至少两个语音信息相同时,确定识别单元302获得的至少两个语音信息为目标语音信息。
在图3所描述的终端中,通过至少两个麦克风分别采集语音信号,至少两个麦克风采集的语音信号源为同一语音信号源,至少两个麦克风中每个麦克风的识别成功率相等,通过每个麦克风分别识别采集的语音信号,以获得至少两个语音信息,比较至少两个语音信息,当比较结果为至少两个语音信息相同时,确定语音信息为目标语音信息,可见,由于多个麦克风同时识别错误的概率较小,可以将多个麦克风的识别结果相同时的信号作为最终信号,以便提高语音识别的准确率。
请参阅图4,图4是本发明实施例提供的另一种终端的结构示意图。其中,图4所示的终端是由图3所示的终端优化得到的,其中,该终端还可以包括:
计算单元305,用于当比较单元303的比较结果为至少两个语音信息不同时,计算至少两个语音信息不同的概率;
确定单元304,还用于当计算单元305计算的概率小于或等于预设值时,从至少两个语音信息中选取相同数量最多的语音信息,将选取的语音信息确定为目标语音信息。
作为一种可能的实施方式,该终端还可以包括:
返回单元306,用于当计算单元305计算的概率大于预设值时,通过每个麦克风分别再次识别采集的语音信号,以获得至少两个语音信息。
作为一种可能的实施方式,采集单元301,还用于采集语音信号源的噪声信号;
该终端还可以包括:
去噪单元307,用于滤除每个采集单元301采集的语音信号中的噪声信号,以获得至少两个滤除噪声后的语音信号;
识别单元302,具体用于通过每个麦克风分别识别去噪单元307滤除噪声后的语音信号,以获得至少两个语音信息。
作为一种可能的实施方式,该终端还可以包括:
比较单元303,具体用于比较至少两个语音信息的幅度、相位和频率,当至少两个语音信息的幅度、相位和频率均相同时,确定至少两个语音信息相同。
在图4所描述的终端中,通过至少两个麦克风分别采集语音信号,至少两个麦克风采集的语音信号源为同一语音信号源,至少两个麦克风中每个麦克风的识别成功率相等,通过每个麦克风分别识别采集的语音信号,以获得至少两个语音信息,比较至少两个语音信息,当比较结果为至少两个语音信息相同时,确定语音信息为目标语音信息,可见,由于多个麦克风同时识别错误的概率较小,可以将多个麦克风的识别结果相同时的信号作为最终信号,以便提高语音识别的准确率。
请参阅图5,图5是本发明实施例提供的又一种终端的结构示意图。其中,该终端设置有至少两个麦克风。如图5所示,该终端可以包括:至少一个处理器501,可以是CPU,存储器502,多麦克风语音采集装置503以及至少一个通信总线504。存储器502可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。可选地,存储器502还可以是至少一个位于远离前述处理器501的存储装置。其中:
通信总线504,用于实现这些组件之间的连接通信;
多麦克风语音采集装置503,用于采集语音信号;
多麦克风语音采集装置503,还用于识别采集的语音信号,以获得至少两个语音信息,并发送给处理器501;
存储器502中存储有一组程序代码,处理器501用于调用存储器502中存储的程序代码执行以下操作:
比较至少两个语音信息;
当比较结果为至少两个语音信息相同时,确定语音信息为目标语音信息。
作为一种可能的实施方式,处理器501还用于调用存储器502中存储的程序代码执行以下操作:
当比较结果为至少两个语音信息不同时,计算至少两个语音信息不同的概率;
当概率小于或等于预设值时,从至少两个语音信息中选取相同数量最多的语音信息,将选取的语音信息确定为目标语音信息。
作为一种可能的实施方式,处理器501还用于调用存储器502中存储的程序代码执行以下操作:
当概率大于预设值时,通过每个麦克风分别再次识别采集的语音信号,以获得至少两个语音信息。
作为一种可能的实施方式,多麦克风语音采集装置还用于执行以下操作:
采集噪声信号;
终端还可以包括,噪声滤除装置,用于滤除每个语音信号中的噪声信号,以获得至少两个滤除噪声后的语音信号;
通过每个麦克风分别识别滤除噪声后的语音信号,以获得至少两个语音信息。
作为一种可能的实施方式,处理器501还用于调用存储器502中存储的程序代码执行以下操作:
比较至少两个语音信息的幅度、相位和频率,当至少两个语音信息的幅度、相位和频率均相同时,确定至少两个语音信息相同。
其中,步骤101、102、201、202、204可由终端中多麦克风语音采集装置503来执行,步骤103-106、205-209可由终端中的处理器501和存储器502来执行,终端中可以包含噪声滤除装置,实现步骤203,步骤203也可由终端中的处理器501和存储器502来执行。
其中,采集单元301和识别单元302可以由终端中的多麦克风语音采集装置503来实现,比较单元303、确定单元304、计算单元305和返回单元306可以由终端中的处理器501和存储器502来实现,去噪单元307可以由终端中的处理器501和存储器502来实现,也可以由终端另外包含的噪声滤除装置来实现。
在图5所描述的终端中,通过至少两个麦克风分别采集语音信号,至少两个麦克风采集的语音信号源为同一语音信号源,至少两个麦克风中每个麦克风的识别成功率相等,通过每个麦克风分别识别采集的语音信号,以获得至少两个语音信息,比较至少两个语音信息,当比较结果为至少两个语音信息相同时,确定语音信息为目标语音信息,可见,由于多个麦克风同时识别错误的概率较小,可以将多个麦克风的识别结果相同时的信号作为最终信号,以便提高语音识别的准确率。
本发明实施例的单元,可以以通用集成电路(如中央处理器CPU),或以专用集成电路(ASIC)来实现。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的终端和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的终端和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本发明实施例终端中的单元可以根据实际需要进行合并、划分和删减。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上对本发明实施例提供的语音识别方法及终端进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种语音识别方法,其特征在于,包括:
通过至少两个麦克风分别采集语音信号,所述至少两个麦克风采集的语音信号源为同一语音信号源,所述至少两个麦克风中每个麦克风的识别成功率相等;
通过每个所述麦克风分别识别采集的语音信号,以获得至少两个语音信息;
比较所述至少两个语音信息;
当比较结果为所述至少两个语音信息相同时,确定所述语音信息为目标语音信息。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当比较结果为所述至少两个语音信息不同时,计算所述至少两个语音信息不同的概率;
当所述概率小于或等于预设值时,将所述至少两个语音信息中相同且数量最多的语音信息确定为目标语音信息。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
当所述概率大于预设值时,通过每个所述麦克风分别再次识别采集的语音信号,以获得至少两个语音信息。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述方法还包括:
采集噪声信号;
滤除每个所述语音信号中的所述噪声信号,以获得至少两个滤除噪声后的语音信号;
所述通过每个所述麦克风分别识别采集的语音信号,以获得至少两个语音信息包括:
通过每个所述麦克风分别识别滤除噪声后的语音信号,以获得至少两个语音信息。
5.根据权利要求1-3任一项所述的方法,其特征在于,所述比较所述至少两个语音信息包括:
比较所述至少两个语音信息的幅度、相位和频率,当所述至少两个语音信息的幅度、相位和频率均相同时,确定所述至少两个语音信息相同。
6.一种终端,其特征在于,包括:
采集单元,用于通过至少两个麦克风分别采集语音信号,所述至少两个麦克风采集的语音信号源为同一语音信号源,所述至少两个麦克风中每个麦克风的识别成功率相等;
识别单元,用于通过每个所述麦克风分别识别所述采集单元采集的语音信号,以获得至少两个语音信息;
比较单元,用于比较所述识别单元获得的至少两个语音信息;
确定单元,用于当所述比较单元的比较结果为所述至少两个语音信息相同时,确定所述语音信息为目标语音信息。
7.根据权利要求6所述的终端,其特征在于,所述终端还包括:
计算单元,用于当所述比较单元的比较结果为所述至少两个语音信息不同时,计算所述至少两个语音信息不同的概率;
所述确定单元,还用于当所述计算单元计算的所述概率小于或等于预设值时,将所述识别单元获得的至少两个语音信息中相同且数量最多的语音信息确定为目标语音信息。
8.根据权利要求7所述的终端,其特征在于,所述终端还包括:
返回单元,用于当所述计算单元计算的所述概率大于预设值时,通过每个所述麦克风分别再次识别采集的语音信号,以获得至少两个语音信息。
9.根据权利要求6-8任一项所述的终端,其特征在于,所述采集单元,还用于采集所述语音信号源的噪声信号;
所述终端还包括:
去噪单元,用于滤除每个所述采集单元采集的所述语音信号中的所述噪声信号,以获得至少两个滤除噪声后的语音信号;
所述识别单元,具体用于通过每个所述麦克风分别识别滤除噪声后的语音信号,以获得至少两个语音信息。
10.根据权利要求6-8任一项所述的终端,其特征在于,所述比较单元,具体用于比较所述至少两个语音信息的幅度、相位和频率,当所述至少两个语音信息的幅度、相位和频率均相同时,确定所述至少两个语音信息相同。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610809262.1A CN106469555B (zh) | 2016-09-08 | 2016-09-08 | 一种语音识别方法及终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610809262.1A CN106469555B (zh) | 2016-09-08 | 2016-09-08 | 一种语音识别方法及终端 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106469555A true CN106469555A (zh) | 2017-03-01 |
CN106469555B CN106469555B (zh) | 2021-01-19 |
Family
ID=58230457
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610809262.1A Active CN106469555B (zh) | 2016-09-08 | 2016-09-08 | 一种语音识别方法及终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106469555B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107135443A (zh) * | 2017-03-29 | 2017-09-05 | 联想(北京)有限公司 | 一种信号处理方法及电子设备 |
CN107220021A (zh) * | 2017-05-16 | 2017-09-29 | 北京小鸟看看科技有限公司 | 语音输入识别方法、装置及头戴式设备 |
CN107424611A (zh) * | 2017-07-07 | 2017-12-01 | 歌尔科技有限公司 | 语音交互方法及装置 |
CN107993666A (zh) * | 2017-12-19 | 2018-05-04 | 北京华夏电通科技有限公司 | 语音识别方法、装置、计算机设备及可读存储介质 |
CN111601201A (zh) * | 2020-04-28 | 2020-08-28 | 深圳市友杰智新科技有限公司 | 回声消除方法、装置、计算机设备和存储介质 |
CN113259736A (zh) * | 2021-05-08 | 2021-08-13 | 深圳市康意数码科技有限公司 | 一种语音控制电视机的方法及电视机 |
CN114333886A (zh) * | 2021-12-22 | 2022-04-12 | 深圳市锐尔觅移动通信有限公司 | 音频处理方法、装置、电子设备及存储介质 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1648995A (zh) * | 2004-10-12 | 2005-08-03 | 上海大学 | 基于盲信号分离的语音增强装置 |
CN1837846A (zh) * | 2005-03-23 | 2006-09-27 | 株式会社东芝 | 用于处理声音信号的装置和方法 |
CN101192411A (zh) * | 2007-12-27 | 2008-06-04 | 北京中星微电子有限公司 | 大距离麦克风阵列噪声消除的方法和噪声消除系统 |
CN101610360A (zh) * | 2008-06-19 | 2009-12-23 | 鸿富锦精密工业(深圳)有限公司 | 自动追踪声源的摄像装置 |
CN202313418U (zh) * | 2011-11-16 | 2012-07-11 | 黎旭 | 连续呼吸音心音监测仪 |
CN103219012A (zh) * | 2013-04-23 | 2013-07-24 | 中国人民解放军总后勤部军需装备研究所 | 一种基于声源距离的双麦克风噪声消除方法及装置 |
CN103428607A (zh) * | 2012-05-25 | 2013-12-04 | 华为技术有限公司 | 一种音频信号播放系统及电子设备 |
CN103888580A (zh) * | 2014-03-31 | 2014-06-25 | 宇龙计算机通信科技(深圳)有限公司 | 一种终端录音过程中降噪处理方法及终端 |
CN105261359A (zh) * | 2015-12-01 | 2016-01-20 | 南京师范大学 | 手机麦克风的消噪系统和消噪方法 |
CN205028652U (zh) * | 2015-05-04 | 2016-02-10 | 钰太芯微电子科技(上海)有限公司 | 视频摄录系统中降低马达振动噪声的系统 |
CN105551491A (zh) * | 2016-02-15 | 2016-05-04 | 海信集团有限公司 | 语音识别方法和设备 |
-
2016
- 2016-09-08 CN CN201610809262.1A patent/CN106469555B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1648995A (zh) * | 2004-10-12 | 2005-08-03 | 上海大学 | 基于盲信号分离的语音增强装置 |
CN1837846A (zh) * | 2005-03-23 | 2006-09-27 | 株式会社东芝 | 用于处理声音信号的装置和方法 |
CN101192411A (zh) * | 2007-12-27 | 2008-06-04 | 北京中星微电子有限公司 | 大距离麦克风阵列噪声消除的方法和噪声消除系统 |
CN101610360A (zh) * | 2008-06-19 | 2009-12-23 | 鸿富锦精密工业(深圳)有限公司 | 自动追踪声源的摄像装置 |
CN202313418U (zh) * | 2011-11-16 | 2012-07-11 | 黎旭 | 连续呼吸音心音监测仪 |
CN103428607A (zh) * | 2012-05-25 | 2013-12-04 | 华为技术有限公司 | 一种音频信号播放系统及电子设备 |
CN103219012A (zh) * | 2013-04-23 | 2013-07-24 | 中国人民解放军总后勤部军需装备研究所 | 一种基于声源距离的双麦克风噪声消除方法及装置 |
CN103888580A (zh) * | 2014-03-31 | 2014-06-25 | 宇龙计算机通信科技(深圳)有限公司 | 一种终端录音过程中降噪处理方法及终端 |
CN205028652U (zh) * | 2015-05-04 | 2016-02-10 | 钰太芯微电子科技(上海)有限公司 | 视频摄录系统中降低马达振动噪声的系统 |
CN105261359A (zh) * | 2015-12-01 | 2016-01-20 | 南京师范大学 | 手机麦克风的消噪系统和消噪方法 |
CN105551491A (zh) * | 2016-02-15 | 2016-05-04 | 海信集团有限公司 | 语音识别方法和设备 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107135443A (zh) * | 2017-03-29 | 2017-09-05 | 联想(北京)有限公司 | 一种信号处理方法及电子设备 |
CN107135443B (zh) * | 2017-03-29 | 2020-06-23 | 联想(北京)有限公司 | 一种信号处理方法及电子设备 |
US10755705B2 (en) | 2017-03-29 | 2020-08-25 | Lenovo (Beijing) Co., Ltd. | Method and electronic device for processing voice data |
CN107220021A (zh) * | 2017-05-16 | 2017-09-29 | 北京小鸟看看科技有限公司 | 语音输入识别方法、装置及头戴式设备 |
CN107424611A (zh) * | 2017-07-07 | 2017-12-01 | 歌尔科技有限公司 | 语音交互方法及装置 |
CN107424611B (zh) * | 2017-07-07 | 2021-10-15 | 歌尔科技有限公司 | 语音交互方法及装置 |
CN107993666A (zh) * | 2017-12-19 | 2018-05-04 | 北京华夏电通科技有限公司 | 语音识别方法、装置、计算机设备及可读存储介质 |
CN111601201A (zh) * | 2020-04-28 | 2020-08-28 | 深圳市友杰智新科技有限公司 | 回声消除方法、装置、计算机设备和存储介质 |
CN113259736A (zh) * | 2021-05-08 | 2021-08-13 | 深圳市康意数码科技有限公司 | 一种语音控制电视机的方法及电视机 |
CN114333886A (zh) * | 2021-12-22 | 2022-04-12 | 深圳市锐尔觅移动通信有限公司 | 音频处理方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN106469555B (zh) | 2021-01-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106469555A (zh) | 一种语音识别方法及终端 | |
CN102629305B (zh) | 一种面向snp数据的特征选择方法 | |
CN111428231A (zh) | 基于用户行为的安全处理方法、装置及设备 | |
CN102073684B (zh) | 搜索日志的挖掘方法、时效性需求识别的方法及对应装置 | |
CN104347068A (zh) | 音频信号处理装置和方法以及监控系统 | |
CN110879881B (zh) | 基于特征组分层和半监督随机森林的鼠标轨迹识别方法 | |
CN104316861B (zh) | 集成电路硬件木马检测方法及系统 | |
CN103617435A (zh) | 一种主动学习图像分类方法和系统 | |
CN105827603A (zh) | 未明协议特征库建立方法、未明报文分类方法及相关装置 | |
CN106650446A (zh) | 基于系统调用的恶意程序行为识别方法和系统 | |
CN104462979A (zh) | 一种应用程序的自动化动态检测方法及装置 | |
WO2014057501A1 (en) | Real-time traffic detection | |
CN103136219A (zh) | 一种基于时效性的需求挖掘方法和装置 | |
CN103136212B (zh) | 一种类别新词的挖掘方法及装置 | |
CN105654046A (zh) | 心电信号身份识别方法及装置 | |
CN106019108A (zh) | 闪络检测电路及方法 | |
CN107843779B (zh) | 一种基于模糊聚类的电力系统故障录波分类分析方法和系统 | |
CN118014373A (zh) | 一种基于数据质量监测的风险识别模型及其构建方法 | |
CN107133643A (zh) | 基于多特征融合及特征选择的乐音信号分类方法 | |
CN106682058A (zh) | 应用程序的筛选方法、装置和系统 | |
CN103645935A (zh) | 一种国产环境下jvm参数调整装置和方法 | |
CN105956553A (zh) | 一种解锁方法及移动终端 | |
CN112422546A (zh) | 一种基于变邻域算法和模糊聚类的网络异常检测方法 | |
CN111241187A (zh) | 一种大数据挖掘系统 | |
CN111209158A (zh) | 服务器集群的挖矿监控方法及集群监控系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20210127 Address after: 518057 Desai Science and Technology Building, 9789 Shennan Avenue, Yuehai Street, Nanshan District, Shenzhen City, Guangdong Province, 17th Floor (15th Floor of Natural Floor) 1702-1703 Patentee after: Shenzhen Microphone Holdings Co.,Ltd. Address before: 518040 21 floor, east block, Times Technology Building, 7028 Shennan Road, Futian District, Shenzhen, Guangdong. Patentee before: DONGGUAN GOLDEX COMMUNICATION TECHNOLOGY Co.,Ltd. |