CN109817209B - 一种基于双麦克风阵列的智能语音交互系统 - Google Patents

一种基于双麦克风阵列的智能语音交互系统 Download PDF

Info

Publication number
CN109817209B
CN109817209B CN201910038519.1A CN201910038519A CN109817209B CN 109817209 B CN109817209 B CN 109817209B CN 201910038519 A CN201910038519 A CN 201910038519A CN 109817209 B CN109817209 B CN 109817209B
Authority
CN
China
Prior art keywords
voice
module
signals
sound
microphone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910038519.1A
Other languages
English (en)
Other versions
CN109817209A (zh
Inventor
王艳芬
杨汉丹
王广新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Youjie Zhixin Technology Co ltd
Original Assignee
Shenzhen Youjie Zhixin Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Youjie Zhixin Technology Co ltd filed Critical Shenzhen Youjie Zhixin Technology Co ltd
Priority to CN201910038519.1A priority Critical patent/CN109817209B/zh
Publication of CN109817209A publication Critical patent/CN109817209A/zh
Application granted granted Critical
Publication of CN109817209B publication Critical patent/CN109817209B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明公开了一种基于双麦克风阵列的智能语音交互系统,包括声音采集模块、第一声音检测模块、第二声音检测模块、关键词语音识别模块、单通道降噪模块、延时估计模块、双麦语音增强模块;回声消除模块消除声音采集模块拾取扬声器播放出来的自噪声;输入包含两路信号,一路是声音采集模块拾取到的近端语音,另外一路是参考信号,为从云端获取并被扬声器播放的音频数据;只有满足第一声音检测模块和第二声音检测模块都检测到有声音的时候,才会被打开执行。本发明的计算量较小,对处理芯片的计算能力较低,因此能够在一些低廉的处理芯片上实施,大大降低了实现成本,所要求的麦克风个数极少,几何结构简单,更加有利于产品的外观设计。

Description

一种基于双麦克风阵列的智能语音交互系统
技术领域
本发明涉及智能语音交互技术领域,具体涉及一种基于双麦克风阵列的智能语音交互系统,主要应用于家居家电、穿戴设备等便携式产品中。
背景技术
随着人工智能的兴起,基于麦克风阵列远场拾音的智能语音交互技术也逐步成为了当前热门的技术之一。《基于圆形麦克风阵列的智能交互方法及系统》申请号:CN201510246315.9该方案包括:通过圆形麦克风阵列接收用户语音信号;对所述语音信号进行去噪处理,得到去噪后的语音信号;对去噪后的不同波束方向的语音信号进行预识别,并选择识别得分最高的语音信号的波束方向作为目标说话人方向,后续对在所述目标说话人方向上去噪后的语音信号进行语音识别,得到语音识别结果;根据所述语音识别结果执行操作。利用本发明,可以有效提高麦克风阵列波束输出的语音信号的信噪比,进而提高语音识别效果,使人机交互更智能。
现有的基于麦克风阵列的语音交互技术,大多是采用4麦、6麦、以及6+1等阵列方案,这类技术虽然能较好的实现远场的语音交互要求,但对设备的计算能力也有较高要求,制作实现的成本也较高。
发明内容
有鉴于此,本发明的目的在于仅采用2麦,尽可能的实现一定距离的远程拾音,满足对语音交互距离在3米内的用户需求,同时降低计算量和实现低成本,提出一种基于双麦克风阵列的智能语音交互系统。
本发明通过以下技术手段解决上述问题:
一种基于双麦克风阵列的智能语音交互系统,包括:
声音采集模块,用户拾取声音信号;
第一声音检测模块,用于对拾取的声音信号进行语音检测,当检测到有语音时,将信号送入下一模块;否则,将数据丢弃;
第二声音检测模块,用于对云端获取并被扬声器播放的音频数据进行语音检测,当检测到有语音时,将信号送入下一模块;否则,将数据丢弃;
回声消除模块,用于消除声音采集模块拾取扬声器播放出来的自噪声;输入包含两路信号,一路是声音采集模块拾取到的近端语音,另外一路是参考信号,参考信号为从云端获取并被扬声器播放的音频数据;只有满足第一声音检测模块和第二声音检测模块都检测到有声音的时候,才会被打开执行,否则处于直通状态;
关键词语音识别模块,用于接收从回声消除模块中流入的数据,进行关键词语音识别,根据识别结果控制单通道降噪模块和双麦语音增强模块的开关;
单通道降噪模块,用于当关键词语音识别模块识别到关键词后将被打开,接收第一声音检测模块中的输出,进行降噪处理;
延时估计模块,用于接收单通道降噪模块的输出信号,进行计算得到一个时延值,输入至双麦语音增强模块;
双麦语音增强模块,用于当关键词语音识别模块中检测识别到关键词后,将被打开,接收第一声音检测模块中的数据,进行语音增强处理,处理之后的数据将会被传送到云端;
云端,用于接收到本地传送的数据,进行对应的处理,返回本地处理结果,本地接收到处理结果后,通过扬声器播放出来,告知用户;
扬声器,用于播放云端处理后的音频数据。
进一步地,所述声音采集模块为双麦克风。
进一步地,第一声音检测模块和第二声音检测模块的语音检测处理包括如下步骤:
首先对数字音频信号进行分帧处理,计算每一帧的短时能量和短时过零率两个特征;根据这两个特征,利用双门限判决法估计得到语音检测结果;
Figure BDA0001946709640000031
Figure BDA0001946709640000032
Figure BDA0001946709640000033
进一步地,回声消除模块的回声消除处理包括如下步骤:
回声消除算法采用步长因子可变的NLMS算法,计算公式如下:
Figure BDA0001946709640000034
其中,x(n)是参考端信号(ref),矢量形式可写成:
x(n)=[x(n),x(n-1),........x(n-M+1)]T
其中η是修正的步长常量,0<η<2,δ为一个较小的整数,一般取0.0001;w(n)是自适应滤波器系数,用于估计回声路径,y(n)是系统输出,d(n)是近端信号(near),它包含了目标语音,以及由扬声器播放出来的干扰语音和环境噪声;e(n)是误差信号,它也是回声消除算法得到的最终输出结果。
进一步地,关键词语音识别模块的关键词语音识别是通过大量的语料,利用深度神经网络CNN网络训练生成的一个分类器。
进一步地,单通道降噪模块的降噪处理包括如下步骤:
采用谱减进行降噪处理,包括噪声分量估计和谱减降噪处理两部分;其中噪声的估计需要结合语音检测的结果进行处理;若当前帧判决为非语音帧时,则利用当前帧数据进行噪声估计更新,否则噪声分量值不变;若当前帧判决为语音帧时,则分别对两路数字信号的当前帧进行降噪处理;该步骤中用到的计算公式如下:
D(k,w)=D(k-1,w)*coef+(1-coef)*|X(k,w)|2 (4)----------------噪声估计更新
Figure BDA0001946709640000041
公式(4)为噪声估计更新公式,公式(5)为降噪处理公式;式中X(k,w)为当前帧信号进行短时傅立叶变化的频域表示,k表示为帧序号,w表示为频率分量;D(k,w)为当前帧估计得到的噪声功率,coef、α、β为平滑系数。
进一步地,延时估计模块的延时估计包括如下步骤:
延时估计采用基于广义互相关函数的估计算法;首先对输入的两路信号进行短时傅立叶变换,在频域计算两路信号的互相关值;为了抑制噪声和混响干扰,加入加权因子φ(w);其中
Figure BDA0001946709640000042
X2 *(w)为X2(w)的共轭;对加权后的互相关值进行傅立叶逆变换,检测峰值的位置,进而得到两路信号的延时值。
进一步地,双麦语音增强模块的双麦语音增强包括如下步骤:
首先对信号进行数据对齐,即进行相应的延时处理;对齐后的两路信号可表示为:
yi(m)=xi(m)+ni(m) (6)
其中i小标表示信号通道编号;
对两路输入信号y1(m),y2(m)经过一个加窗处理并且取FFT变化之后变换到了频域上,处理之后的信号是Y1(w,k),Y2(w,k);其中w表示角频率,k表示帧序号;
接下来,计算两路信号的自相关功率谱和互相关功率谱;计算公式如下:
Figure BDA0001946709640000043
Figure BDA0001946709640000044
其中,Xi(w,k),Yi(w,k),Ni(w,k)分别表示xi(m),yi(m),ni(m)的傅里叶变化;对计算得到的自相关功率谱和互相关功率谱做平滑处理,λ为平滑系数:
Figure BDA0001946709640000051
Figure BDA0001946709640000052
计算最后的增益系数:
Figure BDA0001946709640000053
与现有技术相比,本发明的有益效果至少包括:
本发明的计算量较小,对处理芯片的计算能力较低,因此能够在一些低廉的处理芯片上实施,大大降低了实现成本,能够满足3米范围内的语音交互需求。系统所要求的麦克风个数极少,几何结构简单,更加有利于产品的外观设计。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明基于双麦克风阵列的智能语音交互系统的结构示意图;
图2为本发明延迟估计模块的算法结构示意图;
图3为本发明双麦阵列语音增强模块的算法结构示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面将结合附图和具体的实施例对本发明的技术方案进行详细说明。需要指出的是,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例
本发明的结构示意图如1所示,实线表示音频数字流,虚线表示控制信息或其他变量。实线矩形表示算法模块,虚线矩形表示需要满足某些条件才会被执行的模块。主要步骤包括:
1、声音采集模块1(mic),麦克风拾取声音信号;
2、第一声音检测模块2(Voice Activity Detection VAD)对拾取的声音信号进行语音检测,当检测到有语音时,将信号送入下一模块。否则,将数据丢弃。
3、回声消除模块3(Acoustic Echo Cancellation AEC),主要用于消除mic拾取扬声器播放出来的自噪声。AEC的输入包含两路信号,一路是麦克风拾取到的近端语音(near),另外一路是参考信号(ref),这里取系统从云端获取并被扬声器播放的音频数据。只有满足第一声音检测模块2、和第二声音检测模块8中的VAD都检测到有声音的时候,AEC才会被打开执行,否则AEC是处于直通状态,即数据从near端流入,不经任何处理,直接被模块输出。
4、关键词语音识别模块4(keyword spotting KWS),接收从回声消除模块3中流入的数据,进行关键词语音识别,根据识别结果控制单通道降噪模块5、双麦语音增强模块7的开关。
5、单通道降噪模块5,当关键词语音识别模块4识别到关键词后,单通道降噪模块5将被打开,接收第一声音检测模块2中的输出,进行降噪处理。
6、延时估计模块6,这里采用的是基于广义互相关的方法(GCC),该模块将会计算得到一个时延值;
7、双麦语音增强模块7,当关键词语音识别模块4中检测识别到关键词后,该模块将被打开,接收第一声音检测模块2中的数据,进行语音增强处理,处理之后的数据将会被传送到云端。
8、云端,接收到本地传送的数据,进行对应的处理,返回本地处理结果,本地接收到处理结果后,通过扬声器9播放出来,告知用户。
一、VAD语音检测处理
首先对数字音频信号进行分帧处理,计算每一帧的短时能量和短时过零率两个特征。根据这两个特征,利用双门限判决法估计得到语音检测结果。
Figure BDA0001946709640000071
Figure BDA0001946709640000072
Figure BDA0001946709640000073
二、AEC处理
回声消除算法采用步长因子可变的NLMS算法,计算公式如下:
Figure BDA0001946709640000074
其中,x(n)是参考端信号(ref),矢量形式可写成:
x(n)=[x(n),x(n-1),........x(n-M+1)]T
其中η是修正的步长常量,0<η<2,δ为一个较小的整数,一般取0.0001。w(n)是自适应滤波器系数,用于估计回声路径,y(n)是系统输出,d(n)是近端信号(near),它包含了目标语音,以及由扬声器播放出来的干扰语音和环境噪声。e(n)是误差信号,它也是回声消除算法得到的最终输出结果。
三、关键词语音识别
关键词语音识别是通过大量的语料,利用深度神经网络CNN网络训练生成的一个分类器。
四、降噪处理
这里采用谱减进行降噪处理,主要包括噪声分量估计和谱减降噪处理两部分。其中噪声的估计需要结合语音检测的结果进行处理。若当前帧判决为非语音帧时,则利用当前帧数据进行噪声估计更新,否则噪声分量值不变。若当前帧判决为语音帧时,则分别对两路数字信号的当前帧进行降噪处理。该步骤中用到的计算公式如下:
D(k,w)=D(k-1,w)*coef+(1-coef)*|X(k,w)|2 (4)----------------噪声估计更新
Figure BDA0001946709640000081
公式(4)为噪声估计更新公式,公式(5)为降噪处理公式。式中X(k,w)为当前帧信号进行短时傅立叶变化的频域表示,k表示为帧序号,w表示为频率分量。D(k,w)为当前帧估计得到的噪声功率,coef、α、β为平滑系数。
五、GCC延时估计
延时估计采用基于广义互相关函数的估计算法。算法框图如图2所示,首先对输入的两路信号进行短时傅立叶变换,在频域计算两路信号的互相关值。为了抑制噪声和混响干扰,加入加权因子φ(w)。其中
Figure BDA0001946709640000082
X2 *(w)为X2(w)的共轭。对加权后的互相关值进行傅立叶逆变换,检测峰值的位置,进而得到两路信号的延时值。
六、双麦语音增强
双麦语音增强算法模块的框图如图3。首先对信号进行数据对齐,即进行相应的延时处理。对齐后的两路信号可表示为:
yi(m)=xi(m)+ni(m) (6)
其中i小标表示信号通道编号。
对两路输入信号y1(m),y2(m)经过一个加窗处理并且取FFT变化之后变换到了频域上,处理之后的信号是Y1(w,k),Y2(w,k)。其中w表示角频率,k表示帧序号。
接下来,计算两路信号的自相关功率谱和互相关功率谱。计算公式如下:
Figure BDA0001946709640000083
Figure BDA0001946709640000084
其中,Xi(w,k),Yi(w,k),Ni(w,k)分别表示xi(m),yi(m),ni(m)的傅里叶变化。对计算得到的自相关功率谱和互相关功率谱做平滑处理,λ为平滑系数:
Figure BDA0001946709640000091
Figure BDA0001946709640000092
计算最后的增益系数:
Figure BDA0001946709640000093
本发明的计算量较小,对处理芯片的计算能力较低,因此能够在一些低廉的处理芯片上实施,大大降低了实现成本,能够满足3米范围内的语音交互需求。系统所要求的麦克风个数极少,几何结构简单,更加有利于产品的外观设计。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (6)

1.一种基于双麦克风阵列的智能语音交互系统,其特征在于,包括:
声音采集模块,用户拾取声音信号,声音采集模块为双麦克风;
第一声音检测模块,用于对拾取的声音信号进行语音检测,当检测到有语音时,将信号送入下一模块;否则,将数据丢弃;
第二声音检测模块,用于对云端获取并被扬声器播放的音频数据进行语音检测,当检测到有语音时,将信号送入下一模块;否则,将数据丢弃;
回声消除模块,用于消除声音采集模块拾取扬声器播放出来的自噪声;输入包含两路信号,一路是声音采集模块拾取到的近端语音,另外一路是参考信号,参考信号为从云端获取并被扬声器播放的音频数据;只有满足第一声音检测模块和第二声音检测模块都检测到有声音的时候,才会被打开执行,否则处于直通状态;
关键词语音识别模块,用于接收从回声消除模块中流入的数据,进行关键词语音识别,根据识别结果控制单通道降噪模块和双麦语音增强模块的开关;
单通道降噪模块,用于当关键词语音识别模块识别到关键词后将被打开,接收第一声音检测模块中的输出,进行降噪处理;
延时估计模块,用于接收单通道降噪模块的输出信号,进行计算得到一个时延值,输入至双麦语音增强模块;
双麦语音增强模块,用于当关键词语音识别模块中检测识别到关键词后,将被打开,接收第一声音检测模块中的数据,进行语音增强处理,处理之后的数据将会被传送到云端;
云端,用于接收到本地传送的数据,进行对应的处理,返回本地处理结果,本地接收到处理结果后,通过扬声器播放出来,告知用户;
扬声器,用于播放云端处理后的音频数据;
双麦语音增强模块的双麦语音增强包括如下步骤:
首先对信号进行数据对齐,即进行相应的延时处理;对齐后的两路信号可表示为:
yi(m)=xi(m)+ni(m) (6)
其中i小标表示信号通道编号;
对两路输入信号y1(m),y2(m)经过一个加窗处理并且取FFT变化之后变换到了频域上,处理之后的信号是Y1(w,k),Y2(w,k);其中w表示角频率,k表示帧序号;
接下来,计算两路信号的自相关功率谱和互相关功率谱;计算公式如下:
Figure FDA0002587153840000027
Figure FDA0002587153840000026
其中,Xi(w,k),Yi(w,k),Ni(w,k)分别表示xi(m),yi(m),ni(m)的傅里叶变化;对计算得到的自相关功率谱和互相关功率谱做平滑处理,λ为平滑系数:
Figure FDA0002587153840000024
Figure FDA0002587153840000025
计算最后的增益系数:
Figure FDA0002587153840000021
2.根据权利要求1所述的基于双麦克风阵列的智能语音交互系统,其特征在于,第一声音检测模块和第二声音检测模块的语音检测处理包括如下步骤:
首先对数字音频信号进行分帧处理,计算每一帧的短时能量和短时过零率两个特征;根据这两个特征,利用双门限判决法估计得到语音检测结果;
Figure FDA0002587153840000022
Figure FDA0002587153840000023
Figure FDA0002587153840000031
3.根据权利要求1所述的基于双麦克风阵列的智能语音交互系统,其特征在于,回声消除模块的回声消除处理包括如下步骤:
回声消除算法采用步长因子可变的NLMS算法,计算公式如下:
Figure FDA0002587153840000032
其中,x(n)是参考端信号(ref),矢量形式可写成:
x(n)=[x(n),x(n-1),........x(n-M+1)]T
其中η是修正的步长常量,0<η<2,δ为一个较小的整数,一般取0.0001;w(n)是自适应滤波器系数,用于估计回声路径,y(n)是系统输出,d(n)是近端信号(near),它包含了目标语音,以及由扬声器播放出来的干扰语音和环境噪声;e(n)是误差信号,它也是回声消除算法得到的最终输出结果。
4.根据权利要求1所述的基于双麦克风阵列的智能语音交互系统,其特征在于,关键词语音识别模块的关键词语音识别是通过大量的语料,利用深度神经网络CNN网络训练生成的一个分类器。
5.根据权利要求1所述的基于双麦克风阵列的智能语音交互系统,其特征在于,单通道降噪模块的降噪处理包括如下步骤:
采用谱减进行降噪处理,包括噪声分量估计和谱减降噪处理两部分;其中噪声的估计需要结合语音检测的结果进行处理;若当前帧判决为非语音帧时,则利用当前帧数据进行噪声估计更新,否则噪声分量值不变;若当前帧判决为语音帧时,则分别对两路数字信号的当前帧进行降噪处理;该步骤中用到的计算公式如下:
D(k,w)=D(k-1,w)*coef+(1-coef)*|X(k,w)|2 (4)
Figure FDA0002587153840000033
公式(4)为噪声估计更新公式,公式(5)为降噪处理公式;式中X(k,w)为当前帧信号进行短时傅立叶变化的频域表示,k表示为帧序号,w表示为频率分量;D(k,w)为当前帧估计得到的噪声功率,coef、α、β为平滑系数。
6.根据权利要求1所述的基于双麦克风阵列的智能语音交互系统,其特征在于,延时估计模块的延时估计包括如下步骤:
延时估计采用基于广义互相关函数的估计算法;首先对输入的两路信号进行短时傅立叶变换,在频域计算两路信号的互相关值;为了抑制噪声和混响干扰,加入加权因子φ(w);其中
Figure FDA0002587153840000041
X2 *(w)为X2(w)的共轭;对加权后的互相关值进行傅立叶逆变换,检测峰值的位置,进而得到两路信号的延时值。
CN201910038519.1A 2019-01-16 2019-01-16 一种基于双麦克风阵列的智能语音交互系统 Active CN109817209B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910038519.1A CN109817209B (zh) 2019-01-16 2019-01-16 一种基于双麦克风阵列的智能语音交互系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910038519.1A CN109817209B (zh) 2019-01-16 2019-01-16 一种基于双麦克风阵列的智能语音交互系统

Publications (2)

Publication Number Publication Date
CN109817209A CN109817209A (zh) 2019-05-28
CN109817209B true CN109817209B (zh) 2020-09-25

Family

ID=66604370

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910038519.1A Active CN109817209B (zh) 2019-01-16 2019-01-16 一种基于双麦克风阵列的智能语音交互系统

Country Status (1)

Country Link
CN (1) CN109817209B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111048106B (zh) * 2020-03-12 2020-06-16 深圳市友杰智新科技有限公司 基于双麦克风的拾音方法、装置和计算机设备
CN111445918B (zh) * 2020-03-23 2020-12-15 深圳市友杰智新科技有限公司 降低智能语音设备误唤醒的方法、装置和计算机设备
CN111429884B (zh) * 2020-03-31 2023-03-28 佛山科学技术学院 一种语音识别率分析系统
CN111710345A (zh) * 2020-07-15 2020-09-25 长沙联远电子科技有限公司 一种可动态调整功耗的语音降噪系统
CN112017682B (zh) * 2020-09-18 2023-05-23 中科极限元(杭州)智能科技股份有限公司 一种单通道语音同时降噪和去混响系统
CN113099338A (zh) * 2021-03-08 2021-07-09 头领科技(昆山)有限公司 一种智能控制的音频芯片及无线降噪耳机
CN113223554A (zh) * 2021-03-15 2021-08-06 百度在线网络技术(北京)有限公司 一种风噪检测方法、装置、设备和存储介质
CN113838472A (zh) * 2021-08-24 2021-12-24 盛景智能科技(嘉兴)有限公司 一种语音降噪方法及装置
CN113689875B (zh) * 2021-08-25 2024-02-06 湖南芯海聆半导体有限公司 一种面向数字助听器的双麦克风语音增强方法和装置
CN113823315B (zh) * 2021-09-30 2024-02-13 深圳万兴软件有限公司 降风噪方法、装置、双麦克风设备及存储介质
CN115132220B (zh) * 2022-08-25 2023-02-28 深圳市友杰智新科技有限公司 抑制电视噪声的双麦唤醒的方法、装置、设备及存储介质
CN115831145B (zh) * 2023-02-16 2023-06-27 之江实验室 一种双麦克风语音增强方法和系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102509552A (zh) * 2011-10-21 2012-06-20 浙江大学 一种基于联合抑制的麦克风阵列语音增强方法
CN104751853A (zh) * 2013-12-31 2015-07-01 联芯科技有限公司 双麦克风噪声抑制方法及系统

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103811013B (zh) * 2012-11-07 2017-05-03 中国移动通信集团公司 噪声抑制方法、装置、电子设备和通信处理方法
US20140270241A1 (en) * 2013-03-15 2014-09-18 CSR Technology, Inc Method, apparatus, and manufacture for two-microphone array speech enhancement for an automotive environment
CN105551498A (zh) * 2015-10-28 2016-05-04 东莞酷派软件技术有限公司 一种语音识别的方法及装置
CN107103904B (zh) * 2017-04-12 2020-06-09 奇瑞汽车股份有限公司 一种应用于车载语音识别的双麦克风降噪系统及降噪方法
CN108877827B (zh) * 2017-05-15 2021-04-20 福州瑞芯微电子股份有限公司 一种语音增强交互方法及系统、存储介质及电子设备
CN107464564B (zh) * 2017-08-21 2023-05-26 腾讯科技(深圳)有限公司 语音交互方法、装置及设备
CN107845388B (zh) * 2017-12-25 2021-06-01 青岛海信移动通信技术股份有限公司 语音识别方法及装置
CN108198551A (zh) * 2018-01-15 2018-06-22 深圳前海黑鲸科技有限公司 回声消除延时的处理方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102509552A (zh) * 2011-10-21 2012-06-20 浙江大学 一种基于联合抑制的麦克风阵列语音增强方法
CN104751853A (zh) * 2013-12-31 2015-07-01 联芯科技有限公司 双麦克风噪声抑制方法及系统

Also Published As

Publication number Publication date
CN109817209A (zh) 2019-05-28

Similar Documents

Publication Publication Date Title
CN109817209B (zh) 一种基于双麦克风阵列的智能语音交互系统
US10546593B2 (en) Deep learning driven multi-channel filtering for speech enhancement
US10403299B2 (en) Multi-channel speech signal enhancement for robust voice trigger detection and automatic speech recognition
US7386135B2 (en) Cardioid beam with a desired null based acoustic devices, systems and methods
Parchami et al. Recent developments in speech enhancement in the short-time Fourier transform domain
CN106663445B (zh) 声音处理装置、声音处理方法及程序
CN106875938B (zh) 一种改进的非线性自适应语音端点检测方法
US11404073B1 (en) Methods for detecting double-talk
CN108447496B (zh) 一种基于麦克风阵列的语音增强方法及装置
US11373667B2 (en) Real-time single-channel speech enhancement in noisy and time-varying environments
JPWO2010052749A1 (ja) 雑音抑圧装置
US10937418B1 (en) Echo cancellation by acoustic playback estimation
CN105702262A (zh) 一种头戴式双麦克风语音增强方法
US9406293B2 (en) Apparatuses and methods to detect and obtain desired audio
US9659574B2 (en) Signal noise attenuation
EP2774147A1 (en) Audio signal noise attenuation
CN113132519B (zh) 电子设备、电子设备的语音识别方法及存储介质
Nakatani et al. Reduction of Highly Nonstationary Ambient Noise by Integrating Spectral and Locational Characteristics of Speech and Noise for Robust ASR.
Prasad et al. Two microphone technique to improve the speech intelligibility under noisy environment
Kothapally et al. Monaural Speech Dereverberation using Deformable Convolutional Networks
Ayrapetian et al. Asynchronous acoustic echo cancellation over wireless channels
CN116320947B (zh) 一种应用于助听器的频域双通道语音增强方法
CN114333884B (zh) 一种基于麦克风阵列结合唤醒词进行的语音降噪方法
CN117014761B (zh) 交互式脑控耳机控制方法及装置、脑控耳机、存储介质
CN111462771B (zh) 一种啸叫处理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant