CN115175063A - 啸叫抑制方法、装置、音响及扩音系统 - Google Patents

啸叫抑制方法、装置、音响及扩音系统 Download PDF

Info

Publication number
CN115175063A
CN115175063A CN202210772248.4A CN202210772248A CN115175063A CN 115175063 A CN115175063 A CN 115175063A CN 202210772248 A CN202210772248 A CN 202210772248A CN 115175063 A CN115175063 A CN 115175063A
Authority
CN
China
Prior art keywords
signal
audio
filter coefficient
processing
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210772248.4A
Other languages
English (en)
Inventor
尹悦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Eswin Computing Technology Co Ltd
Original Assignee
Beijing Eswin Computing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Eswin Computing Technology Co Ltd filed Critical Beijing Eswin Computing Technology Co Ltd
Priority to CN202210772248.4A priority Critical patent/CN115175063A/zh
Publication of CN115175063A publication Critical patent/CN115175063A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/02Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本申请实施例提供了一种啸叫抑制方法、装置、音响及扩音系统,涉及数字信号处理技术领域。该方法包括:对扩音系统中的音频信号进行预处理,将音频信号转换到频域;基于频域自适应滤波器的滤波器系数,对转换后的音频信号进行逐帧逐频点处理,得到相应的输出信号,同时以当前帧信号中的远端音频信号作为参考信号更新滤波器系数,供下一帧信号处理使用;将得到的所有输出信号转换到时域,得到目标音频。本申请实施例中,由于滤波器系数更新时的参考信号为远端信号,因此,不仅降低滤波器输入信号与参考信号的相关性,且能对反馈信号有效抑制。

Description

啸叫抑制方法、装置、音响及扩音系统
技术领域
本申请涉及数字信号处理技术领域,具体而言,本申请涉及一种啸叫抑制方法、装置、音响及扩音系统。
背景技术
在扩音系统中,麦克风采集的信号被传输到扬声器中进行放大播出,而扬声器播放的音频信号会被麦克风再次拾取,扬声器与麦克风间音频信号的传输、反馈构成声学环路。在传输过程中,当音量较大时,声音的反馈环路形成正反馈,即声学环路增益大于1。声音在不断的反馈中被一步步放大,产生了刺耳的啸叫声,严重影响用户的听觉体验。
目前,针对扩音系统中的啸叫抑制方法包括:移频移相法、陷波抑制法、自适应反馈抑制法等方法。其中,移频移相法,在声音处理过程中,通过实时改变声音的频率或者相位,破坏正反馈发生需要的相位特性。陷波抑制法,针对发生啸叫的频率点,通过陷波器强行压低该频率点的声学环路增益,但均是改变了声音信号或系统的频率响应,对声音造成了一定失真。
自适应反馈抑制方法,采用一个自适应滤波器追踪反馈通路,并将其作用抵消,可以有效预防啸叫的产生。但由于输入信号与参考信号相关性较高,自适应滤波器估计存在偏差。解决估计偏差的方法通常有两种,一种是去相关技术,另一种是使用固定系数滤波器。然而,前者需要增加运算开销,后者在声场环境细微变化时性能明显下降。
发明内容
本申请实施例提供了一种啸叫抑制方法、装置、音响及扩音系统,旨在解决现有技术中的至少一个技术问题。
根据本申请实施例的第一方面,提供了一种啸叫抑制方法,该方法包括:
对扩音系统中的音频信号进行预处理,将所述音频信号转换到频域;
基于频域自适应滤波器的滤波器系数,对转换后的音频信号进行逐帧逐频点处理,得到相应的输出信号,同时以当前帧信号中的远端音频信号作为参考信号更新滤波器系数,以供下一帧信号处理使用;
将得到的所有输出信号转换到时域,得到目标音频。
在一个可能的实现方式中,在对任一频点的初始帧信号进行处理之前,所述方法还包括:
确定所述扩音系统中扬声器到麦克风通路的传输函数对应的初始滤波器系数;
对任一频点的初始帧信号进行处理的过程包括:
基于所述初始滤波器系数,对所述初始帧信号进行处理,得到相应的输出信号,同时更新所述初始滤波器系数;
其中,所述初始帧基于所述频域自适应滤波器的数量确定。
在又一个可能的实现方式中,针对任一频点的非初始帧信号进行处理的过程包括:
基于上一帧信号处理后更新得到的滤波器系数,对当前帧信号进行处理,得到相应的输出信号,同时更新所述滤波器系数。
在另一个可能的实现方式中,所述扩音系统中的音频信号包括远端音频信号和麦克风采集的音频信号,对任一频点的每帧信号进行处理,得到相应的输出信号的过程包括:
基于当前帧信号和相应的滤波器系数,以及上一帧输出信号,确定当前帧信号中麦克风采集的音频信号的残差信号;
对所述残差信号进行本地扩音处理,得到相应的输出信号。
在另一个可能的实现方式中,所述以当前帧信号中的远端音频信号作为参考信号更新滤波器系数的过程,包括:
基于预设更新步长、所述当前帧信号和相应的滤波器系数、残差信号,以及所述当前帧信号中的远端音频信号,确定新的滤波器系数并对所述当前帧信号对应的滤波器系数进行更新。
在另一个可能的实现方式中,所述确定残差信号的过程,包括:
若所述当前帧信号的回声抑制量大于或者等于预设阈值,拷贝所述当前帧信号对应的滤波器系数,并基于所述当前帧信号和相应的滤波器系数以及上一帧输出信号,确定所述残差信号;
若所述回声抑制量小于所述预设阈值,基于上一次拷贝的滤波器系数、所述当前帧信号和相应的滤波器系数以及上一帧输出信号,确定所述残差信号;
其中,所述回声抑制量基于输出信号与麦克风采集的音频信号的功率比确定。
在另一个可能的实现方式中,若所述预处理为短时傅里叶变换,所述将得到的所有输出信号转换到时域,得到目标音频,包括:
将得到的所有输出信号进行短时傅里叶逆变换回到时域,得到目标音频。
根据本申请实施例的第二方面,提供了一种啸叫抑制装置,该装置包括:本地扩音系统、加法器、频域自适应滤波器和短时傅里叶变换模块及逆变换模块,其中,所述频域自适应滤波器的输入端连接扬声器,所述频域自适应滤波器的输出端与所述加法器的输入端连接,所述加法器的输出端与所述本地扩音系统的输入端连接,所述本地扩音系统的输出端连接所述扬声器;
所述短时傅里叶变换模块用于对麦克风采集的音频信号进行预处理,将所述音频信号转换到频域;
所述频域自适应滤波器用于对转换后的音频信号进行回声抑制和啸叫抑制处理后输出至所述加法器;
所述加法器用于将转换后的音频信号和所述频域自适应滤波器输出的信号相减后输出至所述本地扩音系统;
所述本地扩音系统对接收到的信号进行本地扩音处理后传输至所述短时傅里叶逆变换模块;
所述短时傅里叶逆变换模块用于将接收到的信号转换到时域,得到目标音频传输至扬声器播放。
根据本申请实施例的第三方面,提供了一种音响,包括:扬声器及上述第二方面实施例所述的啸叫抑制装置,其中,
所述扬声器与所述啸叫抑制装置中频域自适应滤波器的输入端连接,所述频域自适应滤波器的输出端与所述啸叫抑制装置中加法器的输入端连接,所述加法器的输出端与所述啸叫抑制装置中本地扩音系统的输入端连接,所述本地扩音系统的输出端连接所述扬声器。
根据本申请实施例的第四方面,提供了一种扩音系统,包括:麦克风、扬声器以及上述第二方面实施例所述的啸叫抑制装置,所述啸叫抑制装置设置在所述麦克风与所述扬声器之间,所述啸叫抑制装置用于接收所述麦克风采集的音频信号,并将生成的目标音频输出至所述扬声器进行播放。
本申请实施例提供的技术方案带来的有益效果是:
基于频域自适应滤波器的滤波器系数,对频域的音频信号进行逐帧逐频点处理,得到相应的输出信号的同时以当前帧信号中的远端音频信号作为参考信号更新滤波器系数供下一帧信号处理使用,由于啸叫抑制复用了回声消除采用的滤波器结构,而且滤波器系数更新时的参考信号为远端信号,因此,不仅降低滤波器输入信号与参考信号的相关性,且能对反馈信号有效抑制。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍。
图1为相关技术中信号的传输过程示意图;
图2为本申请实施例提供的一种啸叫抑制方法对应的信号传输过程示意图;
图3为本申请实施例提供的一种啸叫抑制方法的流程示意图。
图标:10-扬声器;20-麦克风;30-本地扩音系统;40-加法器;50-频域自适应滤波器。
具体实施方式
下面结合本申请中的附图描述本申请的实施例。应理解,下面结合附图所阐述的实施方式,是用于解释本申请实施例的技术方案的示例性描述,对本申请实施例的技术方案不构成限制。
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
当扩音系统采用麦克风拾音时,麦克风采集的声音信号传至扬声器进行放大播放,而扬声器播放的声音信号又经过空间传输再次被麦克风采集,由于麦克风的拾音区域与扬声器的播放区域不可能完全形成声音隔离,因此扬声器播放的声音很容易通过空间传至麦克风中而导致反馈啸叫。图1示出了扩音系统中信号的传输过程,x为近端语音信号,也即真实的说话声音,u为扬声器最终播放的音频信号,k为经过传递函数H作用的反馈信号,也即扬声器播放的音频信号在经空间传输后再次被麦克风采集到的音频信号,y为麦克风采集的声音信号,G为本地扩音系统,可以看出,在麦克风与扬声器间形成声学反馈环路,当环路进入正反馈时,信号在不断的反馈中被逐步放大,最终产生啸叫。
自适应反馈抑制方法采用一个自适应滤波器追踪反馈通路,并将其作用抵消,可以有效预防啸叫的产生。但由于输入信号与参考信号相关性较高,自适应滤波器估计存在偏差。常用方法是加入去相关技术降低滤波器输入与参考信号的相关性。去相关的方法包括注入噪声法、增加延时法、增加非线性处理、预滤波等,但是,预滤波方法需要额外加入系数估计和逆滤波电路,增加运算开销而其他几种对抑制增益提升较弱。
降低自适应滤波器估计偏差的更简单的一种方法是在初始状态时使用一段白噪声估计声反馈通路,完成对滤波器的设定后,实时使用时固定滤波器系数不变。但当声场环境发生细微变化时,比如房间开窗、人员走动等,固定滤波器方法的性能出现较明显下降。
针对现有技术中存在的上述技术问题,本申请实施例提供了一种啸叫抑制方法、装置、音响及扩音系统。
下面通过对几个示例性实施方式的描述,对本申请实施例的技术方案以及本申请的技术方案产生的技术效果进行说明。需要指出的是,下述实施方式之间可以相互参考、借鉴或结合,对于不同实施方式中相同的术语、相似的特征以及相似的实施步骤等,不再重复描述。
图2示出了本申请实施例提供第一种啸叫抑制方法的信号传输过程示意图。n,k分别表示时间和频点。其中,X(n,k)表示近端语音信号,Y(n,k)表示麦克风采集的音频信号,U(n,k)表示本地扩音信号,F(n,k)表示远端音频信号,E(n,k)表示用于自适应滤波器更新计算的残差信号。扬声器到麦克风的反馈通路的传输函数对应的滤波器系数用H(n,k)表示,频域自适应滤波器的滤波器系数用HEst(n,k)表示,G(n,k)表示本地扩音系统处理,包括自动增益控制、信号放大、功率放大等。
具体而言,在该实施例中,包括以下几个步骤:
步骤1:可以基于调试音频,估计得到扩音系统中扬声器到麦克风通路的传输函数对应的初始滤波器系数。
步骤2:根据该初始滤波器系数初始化频域自适应滤波器。该频域自适应滤波器的滤波器系数从0开始更新。
步骤3:将麦克风采集的音频信号经过短时傅里叶变换,转换至频域,在频域进行逐频点逐帧处理。
步骤4:处理过程中,将信号向量化表示,具体的,假设频点数为K、滤波器个数为M,则麦克风采集的音频信号中频点k的第n帧对应的向量为:
Figure BDA0003724649640000061
同理,可得向量形式的X(n,k)、F(n,k)、U(n,k)。
滤波器系数的向量形式为:
Figure BDA0003724649640000071
同理,可得向量形式的H(n,k)。
麦克风的输入信号可以表示为:
Y(n,k)=X(n,k)+HH(n,k)[F(n,k)+U(n-1,k)]
其中,HH(n,k)表示H(n,k)的共轭转置,Y(n,k)和F(n,k)是已知量,其他为未知量。
残差信号可以表示为:
Figure BDA0003724649640000072
也就是说,对一帧麦克风采集的音频信号进行回声抑制、啸叫抑制处理后可以得到相应的残差信号。即:一帧麦克风采集的音频信号的残差信号等于该帧音频信号与回声消除量及啸叫消除量的差值。
基于最小均方差(Minimum Mean Square Error,MMSE)方法,使|E(n,k)|2的期望最小化,得到HEst(n,k)的更新公式。
但是,如果对上式直接应用MMSE准则,由于参考信号F(n,k)+U(n,k)与滤波器输出E(n,k)具有较大的相关性,会导致滤波器存在估计偏差。因此,本申请将上式改为:
Figure BDA0003724649640000073
根据MMSE准则,可得自适应滤波器的更新公式为:
Figure BDA0003724649640000074
其中上标*表示共轭,
Figure BDA0003724649640000075
为远端信号的功率谱。γ为更新步长,一般采用变步长的方式进行更新,具体可参照相关技术,在此不再赘述。
实际应用场景包括以下三种情况:
(1)远端音频信号不为0,本地扩音不打开。此时G(n,k)=0、U(n,k)=0,使用上式进行HEst(n,k)的更新,进行回声消除。其中,残差信号为:
Figure BDA0003724649640000081
(2)当远端音频信号为0,本地扩音打开时。使用上式更新HEst(n,k)进行啸叫抑制,置HCopy(n,k)=0,以避免环境变化时固定系数无法追踪H(n,k)的变化。其中,残差信号为:
Figure BDA0003724649640000082
(3)远端音频信号不为0,本地扩音打开,此时HEst(n,k)使用上式持续更新。其中,HCopy(n,k)为HEst(n,k)的拷贝,当HEst(n,k)更新且满足一定条件(比如回声抑制量大于某个阈值)时,进行拷贝。
采用上述更新公式,理论上滤波器估计偏差为0。具体证明过程如下:
Figure BDA0003724649640000083
其中,E{|E(n,k)|2}表示求|E(n,k)|2的期望。
令:
X′(n,k)=[X(n,k)+HH(n,k)U(n-1,k)]
则:
Figure BDA0003724649640000084
其中,
Figure BDA0003724649640000085
为自相关矩阵的逆矩阵,rX,F为互相关向量。一般假设X(n,k)、U(n,k)与远端信号F(n,k)的相关性分别为0,可知滤波器系数HEst(n,k)与实际反馈通路对应的滤波器系数H(n,k)不存在偏差。
最后,扩音系统的输出信号为:
U(n,k)=G(n,k)E(n,k)
步骤5:将步骤4中得到的输出信号U(n,k)进行转换回到时域,得到目标音频。
本申请实施例提出的方案,通过初始状态估计反馈通路结合自适应滤波器实时追踪,既提升音频处理系统的稳定性,又能适应声场环境的变化。啸叫抑制复用回声消除采用的滤波器结构,滤波器系数更新时参考信号为远端信号F(n,k),滤波时参考信号为远端信号F(n,k)和近端语音的回声U(n-1,k),因此,一方面大大降低滤波器输入与参考信号的相关性,另一方面对反馈信号有效抑制。
图3为本申请实施例提供的一种啸叫抑制方法的流程示意图。如图3所示的方法包括:
S101、对扩音系统中的音频信号进行预处理,将音频信号转换到频域。
S102、基于频域自适应滤波器的滤波器系数,对转换后的音频信号进行逐帧逐频点处理,得到相应的输出信号,同时以当前帧信号中的远端音频信号作为参考信号更新滤波器系数,以供下一帧信号处理使用。
S103、将得到的所有输出信号转换到时域,得到目标音频。
在该实施例中,S101中预处理为短时傅里叶变换(Short Time FourierTransform,STFT),则S101的具体实现过程是:对音频信号进行分帧,一般10~30ms为一帧,一般设50%的重叠率。选择一个时域窗函数(比如汉宁窗),移动窗函数,对时域音频信号加窗,之后进行快速傅里叶变换,将时域信号转换到频域。
相应的,S103中可以将得到的所有输出信号进行短时傅里叶逆变换(InverseShort Time Fourier Transform,ISTFT)回到时域,得到目标音频。具体的,对输出信号进行快速傅里叶逆变换之后对每帧信号乘以窗函数,再重叠相加得到目标音频。
显然,采用本申请实施例的上述方法,基于频域自适应滤波器的滤波器系数,对频域的音频信号进行逐帧逐频点处理,得到相应的输出信号的同时更新滤波器系数供下一帧信号处理使用,由于啸叫抑制复用了回声消除采用的滤波器结构,而且滤波器系数更新时的参考信号为远端信号,因此,不仅降低滤波器输入信号与参考信号的相关性,且能对反馈信号有效抑制。
本申请实施例中提供了一种可能的实现方式,在S102中对任一频点的初始帧信号进行处理之前,还可以包括:
S100(附图中未示出)、确定扩音系统中扬声器到麦克风通路的传输函数对应的初始滤波器系数。
S102中对任一频点的初始帧信号进行处理的过程具体可以包括:基于初始滤波器系数,对初始帧信号进行处理,得到相应的输出信号,同时更新初始滤波器系数。其中,初始帧基于频域自适应滤波器的数量确定。
具体的,在该实施例中,可以基于调试音频,估计得到扩音系统中扬声器到麦克风通路的传输函数对应的初始滤波器系数,估计方法可以采用离线滤波器系数计算方式,为了描述的简洁,具体的计算过程在此不再赘述。
本申请实施例中,所采用的自适应滤波器为频域分块滤波器,包括一组滤波器,可以基于该组滤波器的数量确定初始帧,例如:该组滤波器包括10个,则任一频点的初始帧为第10帧。针对第10帧信号进行处理时,需要用到第1~10帧信号。在对第10帧信号处理得到相应的输出信号的同时,需要对初始滤波器的系数进行更新得到第一滤波器系数,以便供第11帧信号处理使用。类似的,针对第11帧信号进行处理时,需要用到第2~11帧信号。在对第11帧信号处理得到相应的输出信号的同时,需要对第一滤波器的系数进行更新,以便供第12帧信号处理使用,如此逐帧逐频点处理音频信号。
需要说的是,在该实施例中,在处理每一帧信号是参考该帧信号之前的M帧信号,可以使得回声、啸叫的消除更干净,即啸叫抑制效果更好。其中,M为大于1的整数,是滤波器结构中滤波器的数量。
上述实施例中,通过初始状态估计反馈通路结合自适应滤波器实时追踪,既提升音频处理系统的稳定性,又能适应声场环境的变化。
本申请实施例中提供了一种可能的实现方式,S102中针对任一频点的非初始帧信号进行处理的过程包括:基于上一帧信号处理后更新得到的滤波器系数,对当前帧信号进行处理,得到相应的输出信号,同时更新滤波器系数。
在该实施例中,若当前帧信号为某一频点的第20帧信号,则基于该频点的第19帧信号处理后更新得到的滤波器系数,对第20帧信号进行处理,得到相应的输出信号,同时更新该滤波器系数,以便处理第21帧信号时使用。
在上述实施例中,扩音系统中的音频信号包括远端音频信号和麦克风采集的音频信号,则S102中对任一频点的每帧信号进行处理,得到相应的输出信号的过程包括:
对一帧麦克风采集的音频信号进行回声抑制、啸叫抑制处理,及本地扩音处理,得到相应的输出信号。
具体的,在该实施例中,对一帧麦克风采集的音频信号进行回声抑制、啸叫抑制处理后可以得到相应的残差信号。对残差信号进行本地扩音处理,可以得到相应的输出信号。
具体可以基于当前帧信号和相应的滤波器系数,以及上一帧输出信号,确定当前帧信号中麦克风采集的音频信号的残差信号。例如:针对频点k的第n帧信号,可以根据以下公式确定相应的残差信号:
Figure BDA0003724649640000111
U(n,k)=G(n,k)E(n,k)其中,Y(n,k)表示麦克风采集的音频信号中的频点k的第n帧,F(n,k)表示频点k的第n帧远端音频信号,HEst(n,k)为频点k的第n帧信号对应的滤波器系数,U(n-1,k)表示频点k的第n-1帧信号处理后的输出信号。
需要说明的是,在该实施例中,在计算残差信号的过程中,若n=1,则U=0,即处理第1帧输入信号时,扬声器还没有输出信号。
在确定出残差信号的基础上,可以根据以下公式确定相应的输出信号:
U(n,k)=G(n,k)E(n,k)
其中,G(n,k)表示对频点k的第n帧残差信号E(n,k)进行本地扩音系统处理,包括自动增益控制、信号放大、功率放大等,U(n,k)表示频点k的第n帧信号处理后的输出信号。
本申请实施例中提供了一种可能的实现方式,S102中以当前帧信号中的远端音频信号作为参考信号更新滤波器系数的过程,具体可以包括:
基于预设更新步长、当前帧信号和相应的滤波器系数、残差信号,以及当前帧信号中的远端音频信号,确定新的滤波器系数并对当前帧信号对应的滤波器系数进行更新。
具体的,在该实施例中,可以根据以下公式更新滤波器系数:
Figure BDA0003724649640000121
其中,E*(n,k)表示频点k的第n帧信号的残差信号E(n,k)的共轭向量,
Figure BDA0003724649640000122
为远端音频信号的功率谱,γ为更新步长,F(n,k)表示频点k的第n帧远端音频信号,HEst(n,k)为频点k的第n帧信号对应的滤波器系数,HEst(n+1,k)为频点k的第n+1帧信号对应的滤波器系数。
需要说明的是,在该实施例中,可以基于最小均方差(Minimum Mean SquareError,MMSE)方法,使下述确定残差信号的公式确定的|E(n,k)|2的期望最小化,得到上述更新滤波器系数的公式。
在本申请的一些可实现的实施例方案中,确定残差信号的过程,包括:
若当前帧信号的回声抑制量大于或者等于预设阈值,拷贝当前帧信号对应的滤波器系数,并基于当前帧信号和相应的滤波器系数以及上一帧输出信号,确定残差信号。
若回声抑制量小于预设阈值,基于上一次拷贝的滤波器系数、当前帧信号和相应的滤波器系数以及上一帧输出信号确定残差信号。
其中,回声抑制量基于输出信号与麦克风采集的音频信号的功率比确定
具体的,在该实施例中,可以根据以下公式确定残差信号:
Figure BDA0003724649640000123
其中,
Figure BDA0003724649640000124
表示频点k的第n帧信号的回声抑制量,若该回声抑制量大于或者等于预设阈值,则将
Figure BDA0003724649640000125
拷贝得到的
Figure BDA0003724649640000126
其中,U(n-1,k)表示频点k的第n-1帧信号处理后的输出信号,Y(n,k)表示麦克风采集的音频信号中的频点k的第n帧。
若频点k的第n帧信号的回声抑制量小于预设阈值,则上述公式中的
Figure BDA0003724649640000127
采用上一次拷贝的值。需要说明的是,上一次拷贝的值是指第n-i帧信号的回声抑制量大于或者等于预设阈值时,拷贝的滤波器系数,其中,i=1、2、3、……n-1。
需要说明的是,在该实施例中,频点k的第n帧信号的回声抑制量可以基于频点k的第n帧信号之前的多帧信号对应的输出信号与多帧麦克风采集的音频信号的功率比确定。例如:第10帧信号的回声抑制量可以基于第1~9帧信号对应的输出信号与麦克风采集的第1~9帧信号的功率比。假设,该实施例中采用的频域自适应滤波器结构中的滤波器的数量为10,则第1~9帧信号并未采用本申请实施例中的方法进行处理,可以采用相关技术进行处理得到相应的输出信号。
再如:第15帧信号的回声抑制量可以基于第6~14帧信号对应的输出信号与麦克风采集的第6~14帧信号的功率比。假设,该实施例中采用的频域自适应滤波器结构中的滤波器的数量为10,则第6~9帧信号并未采用本申请实施例中的方法进行处理,可以采用相关技术进行处理得到相应的输出信号,第10~14帧信号则可以采用本申请实施例中的方法进行处理得到相应的输出信号。
综上,本申请实施例提供的啸叫抑制方法,通过初始状态估计反馈通路结合自适应滤波器实时追踪,既提升音频处理系统的稳定性,又能适应声场环境的变化。啸叫抑制复用回声消除采用的滤波器结构,滤波器系数更新时参考信号为远端信号,滤波时参考信号为远端信号与近端语音的回声,因此,一方面大大降低滤波器输入与参考信号的相关性,另一方面对反馈信号有效抑制。
本申请实施例还提供了一种啸叫抑制装置,包括:本地扩音系统、加法器、频域自适应滤波器和短时傅里叶变换模块及逆变换模块。其中,频域自适应滤波器的输入端连接扬声器,频域自适应滤波器的输出端与加法器的输入端连接,加法器的输出端与本地扩音系统的输入端连接,本地扩音系统的输出端连接扬声器。
短时傅里叶变换模块用于对麦克风采集的音频信号进行预处理,将音频信号转换到频域。频域自适应滤波器用于对转换后的音频信号进行回声抑制和啸叫抑制处理后输出至加法器。加法器用于将转换后的音频信号和频域自适应滤波器输出的信号相减后输出至本地扩音系统。本地扩音系统对接收的信号进行本地扩音处理后传输至短时傅里叶逆变换模块。短时傅里叶逆变换模块用于将接收到的信号转换到时域,得到目标音频以驱动扬声器播放。
本申请实施例提供了一种音响,包括:扬声器以及上述实施例中所提供的啸叫抑制装置。扬声器与啸叫抑制装置中频域自适应滤波器的输入端连接,频域自适应滤波器的输出端与啸叫抑制装置中加法器的输入端连接,加法器的输出端与啸叫抑制装置中本地扩音系统的输入端连接,本地扩音系统的输出端连接扬声器。
麦克风采集的音频信号传入音响的方式可以包括无线、有线方式,例如,本实施例中的音响可以为蓝牙音响,通过蓝牙方式与麦克风进行音频信号的数据传输,也可以通过WiFi或其他局域网接入方式与麦克风连接,当麦克风采集到音频信号后,传入至音响中的啸叫抑制装置,啸叫抑制装置在对音频信号进行啸叫分析后,将音频信号与生成的参考信号送入扬声器中播放。
本申请实施例提供了一种扩音系统,包括:麦克风、扬声器以及上述实施例中所提供的啸叫抑制装置,啸叫抑制装置设置在麦克风与扬声器之间,啸叫抑制装置用于接收麦克风采集的音频信号,并将生成的目标音频输出至扬声器进行播放。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
以上仅是本申请部分实施场景的可选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请的方案技术构思的前提下,采用基于本申请技术思想的其他类似实施手段,同样属于本申请实施例的保护范畴。

Claims (10)

1.一种啸叫抑制方法,其特征在于,包括:
对扩音系统中的音频信号进行预处理,将所述音频信号转换到频域;
基于频域自适应滤波器的滤波器系数,对转换后的音频信号进行逐帧逐频点处理,得到相应的输出信号,同时以当前帧信号中的远端音频信号作为参考信号更新滤波器系数,以供下一帧信号处理使用;
将得到的所有输出信号转换到时域,得到目标音频。
2.根据权利要求1所述的方法,其特征在于,在对任一频点的初始帧信号进行处理之前,所述方法还包括:
确定所述扩音系统中扬声器到麦克风通路的传输函数对应的初始滤波器系数;
对任一频点的初始帧信号进行处理的过程包括:
基于所述初始滤波器系数,对所述初始帧信号进行处理,得到相应的输出信号,同时更新所述初始滤波器系数;
其中,所述初始帧基于所述频域自适应滤波器的数量确定。
3.根据权利要求2所述的方法,其特征在于,针对任一频点的非初始帧信号进行处理的过程包括:
基于上一帧信号处理后更新得到的滤波器系数,对当前帧信号进行处理,得到相应的输出信号,同时更新所述滤波器系数。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述扩音系统中的音频信号包括远端音频信号和麦克风采集的音频信号,对任一频点的每帧信号进行处理,得到相应的输出信号的过程包括:
基于当前帧信号和相应的滤波器系数,以及上一帧输出信号,确定当前帧信号中麦克风采集的音频信号的残差信号;
对所述残差信号进行本地扩音处理,得到相应的输出信号。
5.根据权利要求4所述的方法,其特征在于,所述以当前帧信号中的远端音频信号作为参考信号更新滤波器系数的过程,包括:
基于预设更新步长、所述当前帧信号和相应的滤波器系数、残差信号,以及所述当前帧信号中的远端音频信号,确定新的滤波器系数并对所述当前帧信号对应的滤波器系数进行更新。
6.根据权利要求4所述的方法,其特征在于,所述确定残差信号的过程,包括:
若所述当前帧信号的回声抑制量大于或者等于预设阈值,拷贝所述当前帧信号对应的滤波器系数,并基于所述当前帧信号和相应的滤波器系数以及上一帧输出信号,确定所述残差信号;
若所述回声抑制量小于所述预设阈值,基于上一次拷贝的滤波器系数、所述当前帧信号和相应的滤波器系数以及上一帧输出信号,确定所述残差信号;
其中,所述回声抑制量基于输出信号与麦克风采集的音频信号的功率比确定。
7.根据权利要求1-3中任一项所述的方法,其特征在于,若所述预处理为短时傅里叶变换,所述将得到的所有输出信号转换到时域,得到目标音频,包括:
将得到的所有输出信号进行短时傅里叶逆变换回到时域,得到目标音频。
8.一种啸叫抑制装置,其特征在于,包括:本地扩音系统、加法器、频域自适应滤波器和短时傅里叶变换模块及逆变换模块,其中,所述频域自适应滤波器的输入端连接扬声器,所述频域自适应滤波器的输出端与所述加法器的输入端连接,所述加法器的输出端与所述本地扩音系统的输入端连接,所述本地扩音系统的输出端连接所述扬声器;
所述短时傅里叶变换模块用于对麦克风采集的音频信号进行预处理,将所述音频信号转换到频域;
所述频域自适应滤波器用于对转换后的音频信号进行回声抑制和啸叫抑制处理后输出至所述加法器;
所述加法器用于将转换后的音频信号和所述频域自适应滤波器输出的信号相减后输出至所述本地扩音系统;
所述本地扩音系统对接收到的信号进行本地扩音处理后传输至所述短时傅里叶逆变换模块;
所述短时傅里叶逆变换模块用于将接收到的信号转换到时域,得到目标音频传输至扬声器播放。
9.一种音响,其特征在于,包括:扬声器,以及如权利要求8所述的啸叫抑制装置,其中,
所述扬声器与所述啸叫抑制装置中频域自适应滤波器的输入端连接,所述频域自适应滤波器的输出端与所述啸叫抑制装置中加法器的输入端连接,所述加法器的输出端与所述啸叫抑制装置中本地扩音系统的输入端连接,所述本地扩音系统的输出端连接所述扬声器。
10.一种扩音系统,其特征在于,包括:麦克风、扬声器以及如权利要求8所述的啸叫抑制装置,所述啸叫抑制装置设置在所述麦克风与所述扬声器之间,所述啸叫抑制装置用于接收所述麦克风采集的音频信号,并将信号处理得到的目标音频输出至所述扬声器进行播放。
CN202210772248.4A 2022-06-30 2022-06-30 啸叫抑制方法、装置、音响及扩音系统 Pending CN115175063A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210772248.4A CN115175063A (zh) 2022-06-30 2022-06-30 啸叫抑制方法、装置、音响及扩音系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210772248.4A CN115175063A (zh) 2022-06-30 2022-06-30 啸叫抑制方法、装置、音响及扩音系统

Publications (1)

Publication Number Publication Date
CN115175063A true CN115175063A (zh) 2022-10-11

Family

ID=83488692

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210772248.4A Pending CN115175063A (zh) 2022-06-30 2022-06-30 啸叫抑制方法、装置、音响及扩音系统

Country Status (1)

Country Link
CN (1) CN115175063A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115835092A (zh) * 2023-02-15 2023-03-21 南昌航天广信科技有限责任公司 一种音频扩音反馈抑制方法、系统、计算机及存储介质
CN117040487A (zh) * 2023-10-08 2023-11-10 武汉海微科技有限公司 音频信号处理的滤波方法、装置、设备及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115835092A (zh) * 2023-02-15 2023-03-21 南昌航天广信科技有限责任公司 一种音频扩音反馈抑制方法、系统、计算机及存储介质
CN117040487A (zh) * 2023-10-08 2023-11-10 武汉海微科技有限公司 音频信号处理的滤波方法、装置、设备及存储介质
CN117040487B (zh) * 2023-10-08 2024-01-02 武汉海微科技有限公司 音频信号处理的滤波方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
Zhang et al. Deep learning for acoustic echo cancellation in noisy and double-talk scenarios
US11315587B2 (en) Signal processor for signal enhancement and associated methods
CN108141502B (zh) 降低声学系统中的声学反馈的方法及音频信号处理设备
US20190222691A1 (en) Data driven echo cancellation and suppression
US20130129101A1 (en) Multichannel acoustic echo reduction
CN115175063A (zh) 啸叫抑制方法、装置、音响及扩音系统
US11373667B2 (en) Real-time single-channel speech enhancement in noisy and time-varying environments
US9343073B1 (en) Robust noise suppression system in adverse echo conditions
WO2006040734A1 (en) Echo cancellation
CN111213359B (zh) 回声消除器和用于回声消除器的方法
CN115278465A (zh) 啸叫抑制方法、装置、音响及扩音系统
JP2004349806A (ja) 多チャネル音響エコー消去方法、その装置、そのプログラム及びその記録媒体
JP3507020B2 (ja) 反響抑圧方法、反響抑圧装置及び反響抑圧プログラム記憶媒体
EP3348074A1 (en) Nonlinear acoustic echo cancellation based on transducer impedance
CN112863532A (zh) 回音抑制装置、回音抑制方法以及存储介质
Schrammen et al. Efficient nonlinear acoustic echo cancellation by dual-stage multi-channel Kalman filtering
CN104768114A (zh) 反馈抑制
JP2003188776A (ja) 音響エコー消去方法、装置及び音響エコー消去プログラム
JP2003309493A (ja) 反響低減方法、反響低減装置、反響低減プログラム
JP3673727B2 (ja) 反響消去方法、その装置、そのプログラム及びその記録媒体
CN104754465B (zh) 一种自适应信号增强方法和系统
JP4041770B2 (ja) 音響エコー消去方法、その装置、プログラム及びその記録媒体
JP2003250193A (ja) 反響消去方法、この方法を実施する装置、プログラムおよびその記録媒体
CN113194385B (zh) 基于步长控制的子带自适应反馈消除方法及系统
CN115620737A (zh) 语音信号处理装置、方法、电子设备和扩音系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination