CN108877828B - 语音增强方法/系统、计算机可读存储介质及电子设备 - Google Patents

语音增强方法/系统、计算机可读存储介质及电子设备 Download PDF

Info

Publication number
CN108877828B
CN108877828B CN201710346918.5A CN201710346918A CN108877828B CN 108877828 B CN108877828 B CN 108877828B CN 201710346918 A CN201710346918 A CN 201710346918A CN 108877828 B CN108877828 B CN 108877828B
Authority
CN
China
Prior art keywords
frequency
gain
low
output signal
super
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710346918.5A
Other languages
English (en)
Other versions
CN108877828A (zh
Inventor
张益萍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rockchip Electronics Co Ltd
Original Assignee
Fuzhou Rockchip Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuzhou Rockchip Electronics Co Ltd filed Critical Fuzhou Rockchip Electronics Co Ltd
Priority to CN201710346918.5A priority Critical patent/CN108877828B/zh
Publication of CN108877828A publication Critical patent/CN108877828A/zh
Application granted granted Critical
Publication of CN108877828B publication Critical patent/CN108877828B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明提供一种语音增强方法/系统、计算机可读存储介质及电子设备,语音增强方法包括:对麦克风阵列的输入信号进行短时傅里叶变换形成频域输入信号;生成一优化的超增益波束形成器,以通过超增益波束形成器处理频域输入信号,以形成超增益波束处理输出信号;对超增益波束处理输出信号进行低频白噪声增益修正,以确定低频白噪声增益修正结果是超增益波束处理输出信号,还是延迟相加波束处理输出信号;对低频白噪声增益修正结果进行低频降噪补偿,以输出低频降噪补偿后的频域信号。本发明可以控制白噪声放大的问题,且在一定程度上增强了低频降干扰能力。不仅如此,采用本发明后,对角加载因子的选择范围缩小,且鲁棒性增强,有利于实际应用。

Description

语音增强方法/系统、计算机可读存储介质及电子设备
技术领域
本发明属于音频处理技术领域,涉及一种增强方法和系统,特别是涉及一种语音增强方法/系统、计算机可读存储介质及电子设备。
背景技术
传统的单麦克风技术提供的信息仅限于时/频信息,因此其降噪性能并不理想。而麦克风阵列可以提供空域和时/频信息,能够更好的解决该问题。
麦克风阵列信号处理的一个核心技术是波束形成技术,即将麦克风阵列的接收信号通过一定的加权,使阵列方向图在期望信号方向的增益最大,而系统总的输出功率最小,从而完成空域滤波。
根据实现方式不同,现有的波束形成技术可以分为固定波束形成技术和自适应波束形成技术。固定波束形成技术一般都与接收到的数据有关,并且其滤波器系数不随时间的变化而变化,或者说滤波器所形成的波束是固定不变的。自适应的波束形成技术相对于固定波束形成技术而言,其自适应特性表现在滤波系数是随着输入信号统计特性的变化而变化的。
延时相加波束形成和超增益波束形成是较为常用的固定波束形成方法。其中,延时相加波束形成不能抑制任何方向入射的低频噪声源。与其它方法相比,经过超增益波束形成处理,阵列的阵增益达到最大,即麦克风阵列获得最大的指向性。但超增益波束形成存在白噪声放大的问题,尤其是低频段。
但在实际应用中,常用的方法是通过在归一化自相关矩阵的主对角线元素上增加一个很小的常数(称对角加载因子),来实现增加白噪声增益约束的目的。但是,控制白噪声增益和保持降干扰能力两者是矛盾的,因此增加白噪声增益约束必然导致超增益波束形成的降干扰能力下降。且该常数因子取值范围是从零到无穷,因此该因子很难选择,不利于实际应用。
因此,如何提供一种语音增强方法/系统、计算机可读存储介质及电子设备,以解决现有技术是通过在归一化自相关矩阵的主对角线元素上增加一个对角加载因子,来实现增加白噪声增益约束的目的,但是控制白噪声增益和保持降干扰能力两者相互矛盾,增加白噪声增益约束必然导致超增益波束形成的降干扰能力下降;且对角加载因子取值范围是从零到无穷,由于该因子很难选择,不利于实际应用等缺陷,实以成为本领域技术人员亟待解决的技术问题。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种语音增强方法/系统、计算机可读存储介质及电子设备,用于解决现有技术中是通过在归一化自相关矩阵的主对角线元素上增加一个对角加载因子,来实现增加白噪声增益约束的目的,但是控制白噪声增益和保持降干扰能力两者相互矛盾,增加白噪声增益约束必然导致超增益波束形成的降干扰能力下降;且对角加载因子取值范围是从零到无穷,由于该因子很难选择,不利于实际应用的问题。
为实现上述目的及其他相关目的,本发明一方面提供一种语音增强方法,应用于电子设备,在所述电子设备内设置麦克风阵列;所述语音增强方法包括以下步骤:步骤一,对所述麦克风阵列的输入信号进行短时傅里叶变换形成频域输入信号;步骤二,在保证所述麦克风阵列在期望方向上信号不失真的约束条件下,生成一优化的超增益波束形成器,以通过所述超增益波束形成器处理所述频域输入信号,以形成超增益波束处理输出信号;步骤三,在预存的延迟相加波束形成器对所述频域输入信号的处理,而形成的延迟相加波束处理输出信号的基础上,对所述超增益波束处理输出信号进行低频白噪声增益修正,以确定低频白噪声增益修正结果是所述超增益波束处理输出信号,还是所述延迟相加波束处理输出信号;步骤四,对所述低频白噪声增益修正结果进行低频降噪补偿,以输出低频降噪补偿后的频域信号。
于本发明的一实施例中,所述步骤二中生成超增益波束形成器的步骤包括:根据麦克风阵列的几何结构,构造各向同性噪声的归一化自相关矩阵;在所述归一化自相关矩阵中加入对角加载因子,以通过所述对角加载因子控制白噪声增益;在保证所述麦克风阵列在期望方向信号不失真的约束条件下,根据最小化的输出功率,以生成优化的超增益波束形成器。
于本发明的一实施例中,保证所述麦克风阵列在期望方向上信号不失真的约束条件是指未加入所述对角加载因子的超增益波束形成器的共轭转置与麦克风阵列在期望方向上的响应向量的点乘等于1。
于本发明的一实施例中,所述步骤三包括:从所述超增益波束处理输出信号和所述延迟相加波束处理输出信号中选出频率低于预设低频限的各频点;计算从所述超增益波束处理输出信号选出的频点的频点能量,和从所述延迟相加波束处理输出信号选出的频点的频点能量;将从所述超增益波束处理输出信号选出的频点的频点能量与从所述延迟相加波束处理输出信号选出的频点的频点能量进行比较,若所述超增益波束处理输出信号选出的频点的频点能量大于从所述延迟相加波束处理输出信号选出的频点的频点能量,则判定该频点处为非相干噪声占主体,确定低频白噪声增益修正结果为所述延迟相加波束处理输出信号;若所述超增益波束处理输出信号选出的频点的频点能量小于等于从所述延迟相加波束处理输出信号选出的频点的频点能量,则判定该频点处为语音干扰占主体,确定低频白噪声增益修正结果为所述超增益波束处理输出信号。
于本发明的一实施例中,所述步骤四包括:统计所述低频白噪声增益修正结果中高频段内的能量,及延迟相加波束处理输出信号中高频段内的能量,并将两者进行能量比较;若所述低频白噪声增益修正结果中高频段内的能量大于等于延迟相加波束处理输出信号中高频段内的能量,则表示无需进行低频降噪补偿,直接输出低频白噪声增益修正结果;若所述低频白噪声增益修正结果中高频段内的能量小于延迟相加波束处理输出信号中高频段内的能量,则继续进行低频降噪补偿,以输出低频降噪补偿后的频域信号。
于本发明的一实施例中,对所述低频白噪声增益修正结果进行低频降噪补偿的步骤包括:统计所述频域输入信号中高频内的能量;从所述超增益波束处理输出信号选出干扰性能下降一性能阈值的频率点,以作为低频降噪补偿的最高频率点;计算中高频综合降噪因子和中高频降干扰因子;根据所述中高频综合降噪因子和中高频降干扰因子,计算低频降噪补偿增益;基于所述低频降噪补偿增益,对所述超增益波束处理输出信号中的不同频点进行补偿增益计算,以获取各频点的补偿增益;根据所获取的各频点的补偿增益处理所述低频白噪声增益修正结果,以获取低频降噪补偿后频域信号,予以输出。
本发明另一发明提供一种语音增强系统,应用于电子设备,在所述电子设备内设置麦克风阵列;所述语音增强系统包括:傅里叶变换模块,用于对所述麦克风阵列的输入信号进行短时傅里叶变换形成频域输入信号;处理模块,用于在保证所述麦克风阵列在期望方向上信号不失真的约束条件下,生成一优化的超增益波束形成器,以通过所述超增益波束形成器处理所述频域输入信号,以形成超增益波束处理输出信号;修正模块,用于在预存的延迟相加波束形成器对所述频域输入信号的处理,而形成的延迟相加波束处理输出信号的基础上,对所述超增益波束处理输出信号进行低频白噪声增益修正,通过预存的延迟相加波束形成器处理所述频域输入信号,以形成延迟相加波束处理输出信号,以确定低频白噪声增益修正结果是所述超增益波束处理输出信号,还是所述延迟相加波束处理输出信号;补偿模块,用于对所述低频白噪声增益修正结果进行低频降噪补偿,以输出低频降噪补偿后的频域信号。
于本发明的一实施例中,所述处理模块用于根据麦克风阵列的几何结构,构造各向同性噪声的归一化自相关矩阵;在所述归一化自相关矩阵中加入对角加载因子,以通过所述对角加载因子控制白噪声增益;在保证所述麦克风阵列在期望方向信号不失真的约束条件下,根据最小化的输出功率,以生成优化的超增益波束形成器。
于本发明的一实施例中,所述修改模块用于从所述超增益波束处理输出信号和所述延迟相加波束处理输出信号中选出频率低于预设低频限的各频点;计算从所述超增益波束处理输出信号选出的频点的频点能量,和从所述延迟相加波束处理输出信号选出的频点的频点能量;将从所述超增益波束处理输出信号选出的频点的频点能量与从所述延迟相加波束处理输出信号选出的频点的频点能量进行比较,若所述超增益波束处理输出信号选出的频点的频点能量大于从所述延迟相加波束处理输出信号选出的频点的频点能量,则判定该频点处为非相干噪声占主体,确定低频白噪声增益修正结果为所述延迟相加波束处理输出信号;若所述超增益波束处理输出信号选出的频点的频点能量小于等于从所述延迟相加波束处理输出信号选出的频点的频点能量,则判定该频点处为语音干扰占主体,确定低频白噪声增益修正结果为所述超增益波束处理输出信号。
于本发明的一实施例中,所述补偿模块用于统计所述低频白噪声增益修正结果中高频段内的能量,及延迟相加波束处理输出信号中高频段内的能量,并将两者进行能量比较;若所述低频白噪声增益修正结果中高频段内的能量大于等于延迟相加波束处理输出信号中高频段内的能量,则表示无需进行低频降噪补偿,直接输出低频白噪声增益修正结果;若所述低频白噪声增益修正结果中高频段内的能量小于延迟相加波束处理输出信号中高频段内的能量,则继续进行低频降噪补偿,以输出低频降噪补偿后的频域信号。
本发明另一方面还提供一种计算机可读存储介质,其上存储有计算机程序,程序被处理器执行时实现所述语音增强方法,
本发明另一方面又提供一种电子设备,所述电子设备包括:处理器及存储器;所述存储器用于存储计算机程序,所述处理器用于执行所述存储器存储的计算机程序,以使所述终端执行所述语音增强方法。
如上所述,本发明的语音增强方法/系统、计算机可读存储介质及电子设备,具有以下有益效果:
本发明所述的语音增强方法/系统、计算机可读存储介质及电子设备提出了超增益波束形成的修正算法,结合超增益波束形成方法和延迟相加波束形成方法的语音增强特性,根据两种波束形成方法的输出进行判断,给出综合的波束形成结果。并对输出结果的低频段进行再次噪声抑制。这样可以控制白噪声放大的问题,且在一定程度上增强了低频降干扰能力。不仅如此,采用本发明后,对角加载因子的选择范围缩小,且鲁棒性增强,有利于实际应用。
附图说明
图1显示为本发明的语音增强方法于一实施例中的流程示意图。
图2显示为本发明的语音增强方法中步骤S2的流程示意图。
图3显示为本发明的语音增强方法中步骤S3的流程示意图。
图4A显示为本发明的语音增强方法中步骤S4的流程示意图。
图4B显示为本发明的步骤S43的流程示意图。
图5显示为本发明的语音增强系统于一实施例中的原理结构示意图。
图6显示为本发明的电子设备于一实施例中的原理结构示意图。
元件标号说明
5 语音增强系统
51 傅里叶变换模块
52 处理模块
53 修正模块
54 补偿模块
6 电子设备
61 处理器
62 存储器
63 收发器
64 通信接口
65 系统总线
S1~S4 步骤
S21~S23 步骤
S31~S35 步骤
S41~S44 步骤
S441~S445 步骤
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
实施例一
本实施例提供一种语音增强方法,其特征在于,应用于电子设备,在所述电子设备内设置麦克风阵列;所述语音增强方法包括以下步骤:
步骤一,对所述麦克风阵列的输入信号进行短时傅里叶变换形成频域输入信号;
步骤二,在保证所述麦克风阵列在期望方向上信号不失真的约束条件下,生成一优化的超增益波束形成器,以通过所述超增益波束形成器处理所述频域输入信号,以形成超增益波束处理输出信号;
步骤三,在预存的延迟相加波束形成器对所述频域输入信号的处理,而形成的延迟相加波束处理输出信号的基础上,对所述超增益波束处理输出信号进行低频白噪声增益修正,以确定低频白噪声增益修正结果是所述超增益波束处理输出信号,还是所述延迟相加波束处理输出信号;
步骤四,对所述低频白噪声增益修正结果进行低频降噪补偿,以输出低频降噪补偿后的频域信号。
以下将结合图示对本实施例所提供的语音增强方法进行详细描述。本实施例所提供的语音增强方法应用于一电子设备上,在所述电子设备内设置有1行M列的麦克风阵列(1,2,…,n,…,m,…,M)。其中,第n个麦克风与第m个麦克风之间的间距为Lnm。请参阅图1,显示为语音增强方法于一实施例中的流程示意图。如图1所示,所述语音增强方法具体包括以下几个步骤:
S1,对所述麦克风阵列的输入信号进行短时傅里叶变换形成频域输入信号X(k)。
S2,在保证所述麦克风阵列在期望方向上信号不失真的约束条件下,生成一优化的超增益波束形成器,以通过所述超增益波束形成器处理所述频域输入信号,以形成超增益波束处理输出信号。请参阅图2,显示为步骤S2的具体流程示意图。如图2所示,所述步骤S2具体包括以下几个步骤:
S21,根据麦克风阵列的几何结构,构造各向同性噪声的归一化自相关矩阵。在本实施例中,所述归一化自相关矩阵ΓVV(ω)中第(n,m)个元素可表示为:
Figure BDA0001295724300000061
其中,ω为角频率,ω=2πf,f为时间频率,τnm为两麦克风间最大时延,
Figure BDA0001295724300000071
c为声音传播速度,n,m为麦克风个数序号。
S22,在所述归一化自相关矩阵中加入对角加载因子,以通过所述对角加载因子控制白噪声增益。在本实施例中,所述对角加载因子为μ,将对角加载因子为μ加入到归一化自相关矩阵ΓVV(ω)中,即ΓVV(ω)+μI,I为单位矩阵。
S23,在保证所述麦克风阵列在期望方向信号不失真的约束条件下,根据最小化的输出功率,以生成优化的超增益波束形成器WS。在本实施例中,所述保证所述麦克风阵列在期望方向上信号不失真的约束条件是指未加入所述对角加载因子μ的超增益波束形成器W的共轭转置与麦克风阵列在期望方向上的响应向量的点乘等于1,即WHd=1。
具体过程为:
求解未加入所述对角加载因子μ的超增益波束形成器W。
Figure BDA0001295724300000072
推知未加入所述对角加载因子μ的超增益波束形成器W
Figure BDA0001295724300000073
其中,WH为未加入所述对角加载因子μ的超增益波束形成器W的共轭转置,d为麦克风阵列在期望方向上的响应向量,dH是d的共轭转置。其中,假设麦克风阵列为均匀线性麦克风阵列,相邻间距为L0,声源以平面波的形式传播,其入射方位与麦克风阵列成θ角度。则麦克风阵列在期望方向上的响应向量d
Figure BDA0001295724300000074
其中,τ0为相邻麦克风的最大时延,
Figure BDA0001295724300000075
是虚实单位。
根据所述未加入所述对角加载因子μ的超增益波束形成器W,获取到优化的超增益波束形成器WS为公式(5)所示:
Figure BDA0001295724300000076
在本实施例中,增加对角加载因子μ,可使低频白噪声增益增大,缓减白噪声放大问题。但是同时超增益波束形成的降干扰能力下降。当对角加载因子μ增大到一定值时,超增益波束降噪能力在整个频段内都急剧下降。因此该参数很难选择。本实施例中,对优化的超增益波束形成器处理结果进行低频修正。则在选择对角加载因子时,应避免超增益波束形成器的降干扰能力在整个频段内下降,允许低频存在负白噪声增益。由于进行了低频白噪声增益修正,因此即使低频白噪声较高时,也不会对其进行放大。而当噪声较低时,设计的超增益波束形成器仍保持较好的抗干扰能力。
S3,在预存的延迟相加波束形成器对所述频域输入信号的处理,而形成的延迟相加波束处理输出信号的基础上,对所述超增益波束处理输出信号进行低频白噪声增益修正,以确定低频白噪声增益修正结果是所述超增益波束处理输出信号,还是所述延迟相加波束处理输出信号。在本实施例中,延迟相加波束处理输出信号为YD(k),超增益波束处理输出信号YS(k)。
在本实施例中,预存的延迟相加波束形成算法不会产生白噪声放大,且在整个频带内降低白噪的能力要高于超增益波束形成算法。而超增益波束形成算法在整个频带内降干扰能力要高于延迟相加波束形成算法。
请参阅图3,显示为步骤S3具体包括以下几个步骤:
S31,从所述超增益波束处理输出信号和所述延迟相加波束处理输出信号中选出频率低于预设低频限fth的各频点。在本实施例中,所述预设低频限fth小于所述优化的超增益波束形成器白噪声增益为0dB的频点对应的频率。
S32,计算从所述超增益波束处理输出信号YS(k)选出的频点的频点能量PS(k),和从所述延迟相加波束处理输出信号YD(k)选出的频点的频点能量PD(k)。
其中,PS(k)=|YS(k)|2,PD(k)=|YD(k)|2,k为频率索引。
S33,将从所述超增益波束处理输出信号选出的频点的频点能量PS(k)与从所述延迟相加波束处理输出信号选出的频点的频点能量PD(k)进行比较,即判断所述超增益波束处理输出信号选出的频点的频点能量PS(k)小于等于从所述延迟相加波束处理输出信号选出的频点的频点能量PD(k),若所述超增益波束处理输出信号选出的频点的频点能量PS(k)大于从所述延迟相加波束处理输出信号选出的频点的频点能量PD(k),则执行步骤S34,即判定该频点处为非相干噪声占主体,确定低频白噪声增益修正结果YSM(k)为所述延迟相加波束处理输出信号YD(k);若所述超增益波束处理输出信号选出的频点的频点能量PS(k)小于等于从所述延迟相加波束处理输出信号选出的频点的频点能量PD(k),则执行步骤S35,即判定该频点处为语音干扰占主体,确定低频白噪声增益修正结果YSM(k)为所述超增益波束处理输出信号YS(k)。
S4,对所述低频白噪声增益修正结果进行低频降噪补偿,以输出低频降噪补偿后的频域信号。请参阅图4A,显示为步骤S4的流程示意图。如图4A所示,所述步骤S4具体包括以下几个步骤:
S41,统计所述低频白噪声增益修正结果中高频段内的能量PSM,band(k),及延迟相加波束处理输出信号中高频段内的能量PD,band(k),并将两者进行能量比较。中高频段内为(fth,3400Hz)。
在本实施例中,
Figure BDA0001295724300000091
k1,kh分别是fth和3400Hz之间所对应的频率索引。
S42,判断所述低频白噪声增益修正结果中高频段内的能量是否PSM,band(k)小于延迟相加波束处理输出信号中高频段内的能量PD,band(k)。
S43,若所述低频白噪声增益修正结果中高频段内的能量PSM,band(k)大于等于延迟相加波束处理输出信号中高频段内的能量PD,band(k),则表示无需进行低频降噪补偿(即判断所述麦克风阵列中输入信号无干扰或干扰很小),直接输出低频白噪声增益修正结果YSM(k)。
S44,若所述低频白噪声增益修正结果中高频段内的能量PSM,band(k)小于延迟相加波束处理输出信号中高频段内的能量PD,band(k),则进行低频降噪补偿,以输出低频降噪补偿后的频域信号。请参阅图4B,显示为步骤S43的流程示意图。如图4B所示,所述步骤S44具体包括以下几个步骤:
S441,统计所述频域输入信号中高频内的能量。在本实施例中,所述频域输入信号中高频内的能量PX,band
S442,从所述超增益波束处理输出信号选出干扰性能下降一性能阈值(于本实施例中,性能阈值为2dB)的频率点flow,以作为低频降噪补偿的最高频率点。频率点flow对应频率索引为klow
S443,计算中高频综合降噪因子factor_x和中高频降干扰因子factor_s。
所述中高频综合降噪因子factor_x的计算公式如下:
Figure BDA0001295724300000092
所述中高频降干扰因子factor_s的计算公式如下:
factor_s=(1-((PD,band(k)-PSM,band(k)/PX,band(k))1/2)2 公式(7)
S444,根据所述中高频综合降噪因子和中高频降干扰因子,计算低频降噪补偿增益G。
G=1-(factor_x+factor_s)/2(G≤1) 公式(8)
S445,基于所述低频降噪补偿增益,对所述超增益波束处理输出信号中的不同频点进行补偿增益计算,以获取各频点的补偿增益G(k)。
在本实施例中,各频点的补偿增益G(k)=G·(1-k/klow),k≤klow
根据所获取的各频点的补偿增益G(k)处理所述低频白噪声增益修正结果,以获取低频降噪补偿后频域信号,予以输出。
通过G(k)处理低频白噪声增益修正结果YSM(k)的计算公式如下:
Y(k)=(1-G(k))·YSM(k),k≤klow 公式(9)
本实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述的语音增强方法。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过计算机程序相关的硬件来完成。前述的计算机程序可以存储于一计算机可读存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
本实施例所述的语音增强方法及计算机可读存储介质提出了超增益波束形成的修正算法,结合超增益波束形成方法和延迟相加波束形成方法的语音增强特性,根据两种波束形成方法的输出进行判断,给出综合的波束形成结果。并对输出结果的低频段进行再次噪声抑制。这样可以控制白噪声放大的问题,且在一定程度上增强了低频降干扰能力。不仅如此,采用本发明后,对角加载因子的选择范围缩小,且鲁棒性增强,有利于实际应用。
实施例二
本实施例提供一种语音增强系统,应用于电子设备,在所述电子设备内设置麦克风阵列;所述语音增强系统包括:
傅里叶变换模块,用于对所述麦克风阵列的输入信号进行短时傅里叶变换形成频域输入信号;
处理模块,用于在保证所述麦克风阵列在期望方向上信号不失真的约束条件下,生成一优化的超增益波束形成器,以通过所述超增益波束形成器处理所述频域输入信号,以形成超增益波束处理输出信号;
修正模块,用于在预存的延迟相加波束形成器对所述频域输入信号的处理,而形成的延迟相加波束处理输出信号的基础上,对所述超增益波束处理输出信号进行低频白噪声增益修正,通过预存的延迟相加波束形成器处理所述频域输入信号,以形成延迟相加波束处理输出信号,以确定低频白噪声增益修正结果是所述超增益波束处理输出信号,还是所述延迟相加波束处理输出信号;
补偿模块,用于对所述低频白噪声增益修正结果进行低频降噪补偿,以输出低频降噪补偿后的频域信号。
以下将集合图示对本实施例所提供的语音增强系统进行详细说明。需要说明的是,应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如,x模块可以为单独设立的处理元件,也可以集成在上述装置的某一个芯片中实现,此外,也可以以程序代码的形式存储于上述装置的存储器中,由上述装置的某一个处理元件调用并执行以上x模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里所述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
例如,以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(ApplicationSpecificIntegratedCircuit,简称ASIC),或,一个或多个微处理器(digitalsingnalprocessor,简称DSP),或,一个或者多个现场可编程门阵列(FieldProgrammableGateArray,简称FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(CentralProcessingUnit,简称CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,简称SOC)的形式实现。
请参阅图5,显示为语音增强系统于一实施例中的原理结构示意图。如图5所示,所述语音增强系统5包括:傅里叶变换模块51、处理模块52、修正模块53、及补偿模块54。
所述傅里叶变换模块51用于对所述麦克风阵列的输入信号进行短时傅里叶变换形成频域输入信号。
与所述傅里叶变换模块51连接的处理模块52用于在保证所述麦克风阵列在期望方向上信号不失真的约束条件下,生成一优化的超增益波束形成器,以通过所述超增益波束形成器处理所述频域输入信号,以形成超增益波束处理输出信号。
具体地,所述处理模块52用于:
根据麦克风阵列的几何结构,构造各向同性噪声的归一化自相关矩阵。在本实施例中,所述归一化自相关矩阵ΓVV(ω)中第(n,m)个元素可表示为
Figure BDA0001295724300000121
其中,ω为角频率,ω=2πf,f为时间频率,τnm为两麦克风间最大时延,
Figure BDA0001295724300000122
c为声音传播速度,n,m为麦克风个数序号。
在所述归一化自相关矩阵中加入对角加载因子,以通过所述对角加载因子控制白噪声增益。在本实施例中,所述对角加载因子为μ,将对角加载因子为μ加入到归一化自相关矩阵ΓVV(ω)中,即ΓVV(ω)+μI,I为单位矩阵。
在保证所述麦克风阵列在期望方向信号不失真的约束条件下,根据最小化的输出功率,以生成优化的超增益波束形成器WS。在本实施例中,所述保证所述麦克风阵列在期望方向上信号不失真的约束条件是指未加入所述对角加载因子μ的超增益波束形成器W的共轭转置与麦克风阵列在期望方向上的响应向量的点乘等于1,即WHd=1。
所述处理模块求解优化的超增益波束形成器WS过程为:求解未加入所述对角加载因子μ的超增益波束形成器W。根据
Figure BDA0001295724300000123
推知未加入所述对角加载因子μ的超增益波束形成器W,
Figure BDA0001295724300000124
其中,WH为未加入所述对角加载因子μ的超增益波束形成器W的共轭转置,d为麦克风阵列在期望方向上的响应向量,dH是d的共轭转置。其中,假设麦克风阵列为均匀线性麦克风阵列,相邻间距为L0,声源以平面波的形式传播,其入射方位与麦克风阵列成θ角度。则麦克风阵列在期望方向上的响应向量d,
Figure BDA0001295724300000125
其中,τ0为相邻麦克风的最大时延,
Figure BDA0001295724300000126
是虚实单位。根据所述未加入所述对角加载因子μ的超增益波束形成器W,获取到优化的超增益波束形成器WS
Figure BDA0001295724300000127
在本实施例中,所述处理模块52增加对角加载因子μ,可使低频白噪声增益增大,缓减白噪声放大问题。但是同时超增益波束形成的降干扰能力下降。当对角加载因子μ增大到一定值时,超增益波束降噪能力在整个频段内都急剧下降。因此该参数很难选择。本实施例中,对优化的超增益波束形成器处理结果进行低频修正。则在选择对角加载因子时,应避免超增益波束形成器的降干扰能力在整个频段内下降,允许低频存在负白噪声增益。由于进行了低频白噪声增益修正,因此即使低频白噪声较高时,也不会对其进行放大。而当噪声较低时,设计的超增益波束形成器仍保持较好的抗干扰能力。
与所述傅里叶模块51和处理模块52连接的修改模块53用于在预存的延迟相加波束形成器对所述频域输入信号的处理,而形成的延迟相加波束处理输出信号的基础上,对所述超增益波束处理输出信号进行低频白噪声增益修正,以确定低频白噪声增益修正结果是所述超增益波束处理输出信号,还是所述延迟相加波束处理输出信号。在本实施例中,延迟相加波束处理输出信号为YD(k),超增益波束处理输出信号YS(k)。
在本实施例中,预存的延迟相加波束形成算法不会产生白噪声放大,且在整个频带内降低白噪的能力要高于超增益波束形成算法。而超增益波束形成算法在整个频带内降干扰能力要高于延迟相加波束形成算法。
具体地,所述修改模块53用于从所述超增益波束处理输出信号和所述延迟相加波束处理输出信号中选出频率低于预设低频限fth的各频点。在本实施例中,所述预设低频限fth小于所述优化的超增益波束形成器白噪声增益为0dB的频点对应的频率。
计算从所述超增益波束处理输出信号YS(k)选出的频点的频点能量PS(k),和从所述延迟相加波束处理输出信号YD(k)选出的频点的频点能量PD(k)。其中,PS(k)=|YS(k)|2,PD(k)=|YD(k)|2,k为频率索引。
将从所述超增益波束处理输出信号选出的频点的频点能量PS(k)与从所述延迟相加波束处理输出信号选出的频点的频点能量PD(k)进行比较,若所述超增益波束处理输出信号选出的频点的频点能量PS(k)大于从所述延迟相加波束处理输出信号选出的频点的频点能量PD(k),则判定该频点处为非相干噪声占主体,确定低频白噪声增益修正结果YSM(k)为所述延迟相加波束处理输出信号YD(k);若所述超增益波束处理输出信号选出的频点的频点能量PS(k)小于等于从所述延迟相加波束处理输出信号选出的频点的频点能量PD(k),则判定该频点处为语音干扰占主体,确定低频白噪声增益修正结果YSM(k)为所述超增益波束处理输出信号YS(k)。
与所述处理模块52和修改模块53连接的补偿模块54用于对所述低频白噪声增益修正结果进行低频降噪补偿,以输出低频降噪补偿后的频域信号。
具体地,所述补偿模块54用于统计所述低频白噪声增益修正结果中高频段内的能量PSM,band(k),及延迟相加波束处理输出信号中高频段内的能量PD,band(k),并将两者进行能量比较。中高频段内为(fth,3400Hz)。在本实施例中,
Figure BDA0001295724300000131
k1,kh分别是fth和3400Hz之间所对应的频率索引。
若所述低频白噪声增益修正结果中高频段内的能量PSM,band(k)大于等于延迟相加波束处理输出信号中高频段内的能量PD,band(k),则表示无需进行低频降噪补偿(即判断所述麦克风阵列中输入信号无干扰或干扰很小),所述补偿模块54直接输出低频白噪声增益修正结果YSM(k)。
若所述低频白噪声增益修正结果中高频段内的能量PSM,band(k)小于延迟相加波束处理输出信号中高频段内的能量PD,band(k),则继续进行低频降噪补偿,以输出低频降噪补偿后的频域信号。所述补偿模块54进行低频降噪补偿的过程包括:
统计所述频域输入信号中高频内的能量。
在本实施例中,所述频域输入信号中高频内的能量PX,band。从所述超增益波束处理输出信号选出干扰性能下降一性能阈值(于本实施例中,性能阈值为2dB)的频率点flow,以作为低频降噪补偿的最高频率点。频率点flow对应频率索引为klow。计算中高频综合降噪因子factor_x和中高频降干扰因子factor_s。所述中高频综合降噪因子factor_x的计算公式为:
Figure BDA0001295724300000141
所述中高频降干扰因子factor_s的计算公式为:
factor_s=(1-((PD,band(k)-PSM,band(k)/PX,band(k))1/2)2
根据所述中高频综合降噪因子和中高频降干扰因子,计算低频降噪补偿增益G。低频降噪补偿增益G的计算公式为:
G=1-(factor_x+factor_s)/2(G≤1)
基于所述低频降噪补偿增益,对所述超增益波束处理输出信号中的不同频点进行补偿增益计算,以获取各频点的补偿增益G(k)。
在本实施例中,各频点的补偿增益G(k)=G·(1-k/klow),k≤klow
根据所获取的各频点的补偿增益G(k)处理所述低频白噪声增益修正结果,以获取低频降噪补偿后频域信号,予以输出。通过G(k)处理低频白噪声增益修正结果YSM(k)的计算公式为:Y(k)=(1-G(k))·YSM(k),k≤klow
需要说明的是,应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如,x模块可以为单独设立的处理元件,也可以集成在上述装置的某一个芯片中实现,此外,也可以以程序代码的形式存储于上述装置的存储器中,由上述装置的某一个处理元件调用并执行以上x模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里所述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
例如,以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(ApplicationSpecificIntegratedCircuit,简称ASIC),或,一个或多个微处理器(digitalsingnalprocessor,简称DSP),或,一个或者多个现场可编程门阵列(FieldProgrammableGateArray,简称FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(CentralProcessingUnit,简称CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,简称SOC)的形式实现。
实施例三
本实施例提供一种电子设备6,请参阅图6,显示为电子设备于电子设备于一实施例中的原理结构示意图。如图6所示,本实例提供的电子设备6,包括:处理器61、存储器62、收发器63、通信接口64和系统总线65;存储器和通信接口通过系统总线与处理器和收发器连接并完成相互间的通信,存储器用于存储计算机程序,通信接口用于和其他设备进行通信,处理器和收发器用于运行计算机程序,使电子设备6执行如实施例一所提供的语音增强方法的各个步骤。
上述提到的系统总线可以是外设部件互连标准(PeripheralPomponentInterconnect,简称PCI)总线或扩展工业标准结构(ExtendedIndustryStandardArchitecture,简称EISA)总线等。该系统总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。通信接口用于实现数据库访问装置与其他设备(例如客户端、读写库和只读库)之间的通信。存储器可能包含随机存取存储器(RandomAccessMemory,简称RAM),也可能还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。
上述的处理器可以是通用处理器,包括中央处理器(CentralProcessingUnit,简称CPU)、网络处理器(NetworkProcessor,简称NP)等;还可以是数字信号处理器(DigitalSignalProcessing,简称DSP)、专用集成电路(ApplicationSpecificIntegratedCircuit,简称ASIC)、现场可编程门阵列(Field-ProgrammableGateArray,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
综上所述,本发明所述的语音增强方法/系统、计算机可读存储介质及电子设备提出了超增益波束形成的修正算法,结合超增益波束形成方法和延迟相加波束形成方法的语音增强特性,根据两种波束形成方法的输出进行判断,给出综合的波束形成结果。并对输出结果的低频段进行再次噪声抑制。这样可以控制白噪声放大的问题,且在一定程度上增强了低频降干扰能力。不仅如此,采用本发明后,对角加载因子的选择范围缩小,且鲁棒性增强,有利于实际应用。所以,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

Claims (8)

1.一种语音增强方法,其特征在于,应用于电子设备,在所述电子设备内设置麦克风阵列;所述语音增强方法包括以下步骤:
步骤一,对所述麦克风阵列的输入信号进行短时傅里叶变换形成频域输入信号;
步骤二,在保证所述麦克风阵列在期望方向上信号不失真的约束条件下,生成一优化的超增益波束形成器,以通过所述超增益波束形成器处理所述频域输入信号,以形成超增益波束处理输出信号;
步骤三,在预存的延迟相加波束形成器对所述频域输入信号的处理,而形成的延迟相加波束处理输出信号的基础上,对所述超增益波束处理输出信号进行低频白噪声增益修正,以确定低频白噪声增益修正结果是所述超增益波束处理输出信号,还是所述延迟相加波束处理输出信号;所述步骤三包括:从所述超增益波束处理输出信号和所述延迟相加波束处理输出信号中选出频率低于预设低频限的各频点;计算从所述超增益波束处理输出信号选出的频点的频点能量,和从所述延迟相加波束处理输出信号选出的频点的频点能量;将从所述超增益波束处理输出信号选出的频点的频点能量与从所述延迟相加波束处理输出信号选出的频点的频点能量进行比较,若所述超增益波束处理输出信号选出的频点的频点能量大于从所述延迟相加波束处理输出信号选出的频点的频点能量,则判定该频点处为非相干噪声占主体,确定低频白噪声增益修正结果为所述延迟相加波束处理输出信号;若所述超增益波束处理输出信号选出的频点的频点能量小于等于从所述延迟相加波束处理输出信号选出的频点的频点能量,则判定该频点处为语音干扰占主体,确定低频白噪声增益修正结果为所述超增益波束处理输出信号;
步骤四,对所述低频白噪声增益修正结果进行低频降噪补偿,以输出低频降噪补偿后的频域信号;所述步骤四包括:统计所述低频白噪声增益修正结果中高频段内的能量,及延迟相加波束处理输出信号中高频段内的能量,并将两者进行能量比较;若所述低频白噪声增益修正结果中高频段内的能量大于等于延迟相加波束处理输出信号中高频段内的能量,则表示无需进行低频降噪补偿,直接输出低频白噪声增益修正结果;若所述低频白噪声增益修正结果中高频段内的能量小于延迟相加波束处理输出信号中高频段内的能量,则继续进行低频降噪补偿,以输出低频降噪补偿后的频域信号。
2.根据权利要求1所述的语音增强方法,其特征在于:所述步骤二中生成超增益波束形成器的步骤包括:
根据麦克风阵列的几何结构,构造各向同性噪声的归一化自相关矩阵;
在所述归一化自相关矩阵中加入对角加载因子,以通过所述对角加载因子控制白噪声增益;
在保证所述麦克风阵列在期望方向信号不失真的约束条件下,根据最小化的输出功率,以生成优化的超增益波束形成器。
3.根据权利要求2所述的语音增强方法,其特征在于:保证所述麦克风阵列在期望方向上信号不失真的约束条件是指未加入所述对角加载因子的超增益波束形成器的共轭转置与麦克风阵列在期望方向上的响应向量的点乘等于1。
4.根据权利要求1所述的语音增强方法,其特征在于:对所述低频白噪声增益修正结果进行低频降噪补偿的步骤包括:
统计所述频域输入信号中高频内的能量;
从所述超增益波束处理输出信号选出干扰性能下降一性能阈值的频率点,以作为低频降噪补偿的最高频率点;
计算中高频综合降噪因子和中高频降干扰因子;
根据所述中高频综合降噪因子和中高频降干扰因子,计算低频降噪补偿增益;
基于所述低频降噪补偿增益,对所述超增益波束处理输出信号中的不同频点进行补偿增益计算,以获取各频点的补偿增益;
根据所获取的各频点的补偿增益处理所述低频白噪声增益修正结果,以获取低频降噪补偿后频域信号,予以输出。
5.一种语音增强系统,其特征在于,应用于电子设备,在所述电子设备内设置麦克风阵列;所述语音增强系统包括:
傅里叶变换模块,用于对所述麦克风阵列的输入信号进行短时傅里叶变换形成频域输入信号;
处理模块,用于在保证所述麦克风阵列在期望方向上信号不失真的约束条件下,生成一优化的超增益波束形成器,以通过所述超增益波束形成器处理所述频域输入信号,以形成超增益波束处理输出信号;
修正模块,用于在预存的延迟相加波束形成器对所述频域输入信号的处理,而形成的延迟相加波束处理输出信号的基础上,对所述超增益波束处理输出信号进行低频白噪声增益修正,通过预存的延迟相加波束形成器处理所述频域输入信号,以形成延迟相加波束处理输出信号,以确定低频白噪声增益修正结果是所述超增益波束处理输出信号,还是所述延迟相加波束处理输出信号;其中,所述修正模块从所述超增益波束处理输出信号和所述延迟相加波束处理输出信号中选出频率低于预设低频限的各频点;计算从所述超增益波束处理输出信号选出的频点的频点能量,和从所述延迟相加波束处理输出信号选出的频点的频点能量;将从所述超增益波束处理输出信号选出的频点的频点能量与从所述延迟相加波束处理输出信号选出的频点的频点能量进行比较,若所述超增益波束处理输出信号选出的频点的频点能量大于从所述延迟相加波束处理输出信号选出的频点的频点能量,则判定该频点处为非相干噪声占主体,确定低频白噪声增益修正结果为所述延迟相加波束处理输出信号;若所述超增益波束处理输出信号选出的频点的频点能量小于等于从所述延迟相加波束处理输出信号选出的频点的频点能量,则判定该频点处为语音干扰占主体,确定低频白噪声增益修正结果为所述超增益波束处理输出信号;
补偿模块,用于对所述低频白噪声增益修正结果进行低频降噪补偿,以输出低频降噪补偿后的频域信号;所述补偿模块统计所述低频白噪声增益修正结果中高频段内的能量,及延迟相加波束处理输出信号中高频段内的能量,并将两者进行能量比较;若所述低频白噪声增益修正结果中高频段内的能量大于等于延迟相加波束处理输出信号中高频段内的能量,则表示无需进行低频降噪补偿,直接输出低频白噪声增益修正结果;若所述低频白噪声增益修正结果中高频段内的能量小于延迟相加波束处理输出信号中高频段内的能量,则继续进行低频降噪补偿,以输出低频降噪补偿后的频域信号。
6.根据权利要求5所述的语音增强系统,其特征在于:所述处理模块用于根据麦克风阵列的几何结构,构造各向同性噪声的归一化自相关矩阵;在所述归一化自相关矩阵中加入对角加载因子,以通过所述对角加载因子控制白噪声增益;在保证所述麦克风阵列在期望方向信号不失真的约束条件下,根据最小化的输出功率,以生成优化的超增益波束形成器。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,程序被处理器执行时实现权利要求1至4中任一项所述语音增强方法。
8.一种电子设备,其特征在于,所述电子设备包括:处理器及存储器;
所述存储器用于存储计算机程序,所述处理器用于执行所述存储器存储的计算机程序,以使所述电子设备执行如权利要求1至4中任一项所述语音增强方法。
CN201710346918.5A 2017-05-16 2017-05-16 语音增强方法/系统、计算机可读存储介质及电子设备 Active CN108877828B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710346918.5A CN108877828B (zh) 2017-05-16 2017-05-16 语音增强方法/系统、计算机可读存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710346918.5A CN108877828B (zh) 2017-05-16 2017-05-16 语音增强方法/系统、计算机可读存储介质及电子设备

Publications (2)

Publication Number Publication Date
CN108877828A CN108877828A (zh) 2018-11-23
CN108877828B true CN108877828B (zh) 2020-12-08

Family

ID=64320875

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710346918.5A Active CN108877828B (zh) 2017-05-16 2017-05-16 语音增强方法/系统、计算机可读存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN108877828B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109635759B (zh) * 2018-12-18 2020-10-09 北京嘉楠捷思信息技术有限公司 一种信号处理方法、装置及计算机可读存储介质
CN112151058B (zh) * 2019-06-28 2023-09-15 大众问问(北京)信息科技有限公司 一种声音信号的处理方法、装置及设备
CN111341340A (zh) * 2020-02-28 2020-06-26 重庆邮电大学 基于相干性和能量比的鲁棒gsc方法
CN113838472A (zh) * 2021-08-24 2021-12-24 盛景智能科技(嘉兴)有限公司 一种语音降噪方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002003754A1 (en) * 2000-07-03 2002-01-10 Nanyang Technological University Microphone array system
CN101447190A (zh) * 2008-06-25 2009-06-03 北京大学深圳研究生院 基于嵌套子阵列的后置滤波与谱减法联合语音增强方法
US8705781B2 (en) * 2011-11-04 2014-04-22 Cochlear Limited Optimal spatial filtering in the presence of wind in a hearing prosthesis
CN105590631A (zh) * 2014-11-14 2016-05-18 中兴通讯股份有限公司 信号处理的方法及装置
CN105976822A (zh) * 2016-07-12 2016-09-28 西北工业大学 基于参数化超增益波束形成器的音频信号提取方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002003754A1 (en) * 2000-07-03 2002-01-10 Nanyang Technological University Microphone array system
CN101447190A (zh) * 2008-06-25 2009-06-03 北京大学深圳研究生院 基于嵌套子阵列的后置滤波与谱减法联合语音增强方法
US8705781B2 (en) * 2011-11-04 2014-04-22 Cochlear Limited Optimal spatial filtering in the presence of wind in a hearing prosthesis
CN105590631A (zh) * 2014-11-14 2016-05-18 中兴通讯股份有限公司 信号处理的方法及装置
CN105976822A (zh) * 2016-07-12 2016-09-28 西北工业大学 基于参数化超增益波束形成器的音频信号提取方法及装置

Also Published As

Publication number Publication date
CN108877828A (zh) 2018-11-23

Similar Documents

Publication Publication Date Title
CN108877828B (zh) 语音增强方法/系统、计算机可读存储介质及电子设备
US9143856B2 (en) Apparatus and method for spatially selective sound acquisition by acoustic triangulation
CN109102822B (zh) 一种基于固定波束形成的滤波方法及装置
JP2021500634A (ja) マイク・アレイに基づく対象音声取得方法及び装置
CN105355210B (zh) 用于远场语音识别的预处理方法和装置
CN107223345B (zh) 用于波束成形滤波器的fir滤波器系数计算
CN109616136B (zh) 一种自适应波束形成方法、装置及系统
US8494179B2 (en) Mixer with adaptive post-filtering
US8855326B2 (en) Microphone system and method of operating the same
US20130142356A1 (en) Near-field null and beamforming
CN108766456B (zh) 一种语音处理方法及装置
US10622004B1 (en) Acoustic echo cancellation using loudspeaker position
CN110660404B (zh) 基于零陷滤波预处理的语音通信和交互应用系统、方法
US10636434B1 (en) Joint spatial echo and noise suppression with adaptive suppression criteria
CN112735461B (zh) 拾音方法以及相关装置、设备
JPWO2007123052A1 (ja) 適応アレイ制御装置、方法、プログラム、及び適応アレイ処理装置、方法、プログラム
US11483646B1 (en) Beamforming using filter coefficients corresponding to virtual microphones
Pan et al. Design of directivity patterns with a unique null of maximum multiplicity
Sugiyama et al. A directional noise suppressor with a specified beamwidth
Zhang et al. Selective frequency invariant uniform circular broadband beamformer
US20230319469A1 (en) Suppressing Spatial Noise in Multi-Microphone Devices
JP6640703B2 (ja) 電子装置、方法及びプログラム
Yamamoto et al. Spherical microphone array post-filtering for reverberation suppression using isotropic beamformings
CN112581974B (zh) 波束设计方法、装置、设备及存储介质
Patel et al. On the design of optimal linear microphone array geometries

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 350003 building 18, No.89, software Avenue, Gulou District, Fuzhou City, Fujian Province

Patentee after: Ruixin Microelectronics Co.,Ltd.

Address before: 350003 building 18, No.89, software Avenue, Gulou District, Fuzhou City, Fujian Province

Patentee before: FUZHOU ROCKCHIP ELECTRONICS Co.,Ltd.