CN116682407A - 实时啸叫检测和自适应抑制的方法、系统和计算机介质 - Google Patents

实时啸叫检测和自适应抑制的方法、系统和计算机介质 Download PDF

Info

Publication number
CN116682407A
CN116682407A CN202310638686.6A CN202310638686A CN116682407A CN 116682407 A CN116682407 A CN 116682407A CN 202310638686 A CN202310638686 A CN 202310638686A CN 116682407 A CN116682407 A CN 116682407A
Authority
CN
China
Prior art keywords
howling
detection
audio signal
real
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310638686.6A
Other languages
English (en)
Inventor
何小学
黄正
周毅亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jingyin Nuclear Technology Xiamen Co ltd
Original Assignee
Jingyin Nuclear Technology Xiamen Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jingyin Nuclear Technology Xiamen Co ltd filed Critical Jingyin Nuclear Technology Xiamen Co ltd
Priority to CN202310638686.6A priority Critical patent/CN116682407A/zh
Publication of CN116682407A publication Critical patent/CN116682407A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/175Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound
    • G10K11/178Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase
    • G10K11/1781Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions
    • G10K11/17813Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions characterised by the analysis of the acoustic paths, e.g. estimating, calibrating or testing of transfer functions or cross-terms
    • G10K11/17819Methods or devices for protecting against, or for damping, noise or other acoustic waves in general using interference effects; Masking sound by electro-acoustically regenerating the original acoustic waves in anti-phase characterised by the analysis of input or output signals, e.g. frequency range, modes, transfer functions characterised by the analysis of the acoustic paths, e.g. estimating, calibrating or testing of transfer functions or cross-terms between the output signals and the reference signals, e.g. to prevent howling
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/45Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of analysis window
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明提供一种实时啸叫检测和自适应抑制的方法、系统和计算机介质,本发明先获取实时的初始音频信号,对所述初始音频信号进行处理得到音频数据;采用多种频域检测方法对所述音频数据进行检测;根据所有检测结果进行对比判断得到啸叫结果;当啸叫结果为发生啸叫时,使用自适应滤波器对所述初始音频信号进行滤波处理以抑制啸叫。本发明综合多种频域检测方法对啸叫是否产生进行判断并且识别啸叫中心频率,进而使用自适应滤波器对输出音频进行动态调节,实现在不破坏音质的情况下进行啸叫抑制。

Description

实时啸叫检测和自适应抑制的方法、系统和计算机介质
技术领域
本发明涉及数字音频处理的技术领域,特别是涉及一种实时啸叫检测和自适应抑制的方法、系统和计算机介质。
背景技术
在实时通讯和实时扩音系统中,啸叫从产生到放大的时间短,并且对音质影响巨大。传统的啸叫检测方法通常使用特征提取和分类算法来检测啸叫,即使用信号处理技术对音频信号进行分析,然后使用分类算法来确定是否存在啸叫声;啸叫也会使用移频移相方法通过修改输入信号来抑制啸叫声,通常需要对输入信号进行频谱分析,并修改频率与啸叫声相同的分量来抑制啸叫声。然而,传统方法无论在检测和抑制方面都存在准确率不高、鲁棒性差的缺点,从而导致音频质量的下降。
随着技术的发展,现有使用陷波器进行啸叫抑制,主要有两种:
(1)使用多个固定频率带的类似多段滤波的陷波器组,其很难自适应调节多个滤波器的系数、会对音质产生破坏;
(2)使用单个陷波器,其啸叫频率的检测准确性差、滤波器系数的调节难。
目前在实时的扩音系统且存在循环反馈的声信号处理系统中,一个循环反馈系统中存在输入信号x(t),增益G,和输出信号y(t)。在将反馈信号重新拾取后叠加到输入信号上的过程中,某些传递路径会产生不断增大的反馈信号进而发生啸叫。如何在保护音质的情况下迅速识别并消除被麦克风循环拾音以及增益扩音造成的啸叫问题亟需解决。
应该注意,上面对技术背景的介绍只是为了方便对本申请的技术方案进行清楚、完整的说明,并方便本领域技术人员的理解而阐述的。不能仅仅因为这些方案在本申请的背景技术部分进行了阐述而认为上述技术方案为本领域技术人员所公知。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种实时啸叫检测和自适应抑制的方法、系统和计算机介质,用于解决现有技术中消除啸叫时会损坏音质的问题。
为实现上述目的及其他相关目的,本发明提供一种实时啸叫检测方法,至少包括:
获取实时的初始音频信号,对所述初始音频信号进行处理得到音频数据;
采用多种频域检测方法对所述音频数据进行检测;
根据所有检测结果进行对比判断得到啸叫结果。
优选地,对所述初始音频信号进行处理得到音频数据包括:
(1)对所述初始音频信号进行加窗处理得到分段音频信号;
(2)对所述分段音频信号进行傅里叶变换得到音频数据。
优选地,所述多种频域检测方法包括峰值/均值功率比、峰值/阈值功率比、峰值/临近值功率比和峰值/谐波峰值比。
优选地,所述啸叫结果包括发生啸叫和未发生啸叫;
当所有检测结果不存在交集时,啸叫结果为未发生啸叫;
当所有检测结果存在交集时,啸叫结果为发生啸叫,并将发生啸叫的交集值作为啸叫中心频率。
为实现上述目的及其他相关目的,本发明提供一种实时啸叫自适应抑制方法,至少包括:
当实时啸叫检测方法的啸叫结果为发生啸叫时,使用自适应滤波器对所述初始音频信号进行滤波处理以抑制啸叫;
其中,所述自适应滤波器是二阶IIR型的自适应陷波器。
优选地,所述自适应滤波器为:
式中,b为动态系数,ω0是角中心频率。
优选地,使用自适应滤波器对所述初始音频信号进行滤波以抑制啸叫的过程为:
当所述啸叫结果为发生啸叫时,自适应滤波器读取当前输入信号和输出信号以调节所述自适应滤波器的动态系数;
基于调节后的所述自适应滤波器的动态系数更新所述自适应滤波器;
根据更新后的所述自适应滤波器对所述初始音频信号进行滤波以抑制所述初始音频信号中的啸叫。
为实现上述目的及其他相关目的,本发明提供一种实时啸叫检测并抑制的系统,包括输入模块、检测模块、抑制模块和输出模块;
所述输入模块接收初始音频信号,并对所述初始音频信号进行处理后输出时域音频信号和音频数据;
所述检测模块的输入端连接所述输入模块的第一输出端;用于对所述音频数据进行啸叫检测并得到啸叫结果;
所述抑制模块的第一输入端连接所述输入模块的第二输出端;所述抑制模块的第二输入端连接所述检测模块的输出端;所述抑制模块包括自适应滤波器,所述自适应滤波器是二阶IIR型的自适应陷波器,所述自适应滤波器根据所述啸叫结果对所述时域音频信号进行处理得到最终音频信号;
所述输出模块的输入端连接所述抑制模块的输出端,所述输出模块将所述最终音频信号输出。
优选地,所述检测模块包括多个检测单元和分析单元;
每个检测单元采用一种频域检测方法对所述音频数据进行检测,并输出检测结果;
所述分析单元对所有检测结果进行对比判断得到啸叫结果并输出。
优选地,所述检测模块包括四个检测单元,分别采用峰值/均值功率比、峰值/阈值功率比、峰值/临近值功率比和峰值/谐波峰值比的计算方式对所述音频数据进行检测。
优选地,根据所述啸叫结果对所述时域音频信号进行处理得到最终音频信号包括:
若啸叫结果为未发生啸叫,将所述时域音频信号作为最终音频信号;
若啸叫结果为发生啸叫,则使用自适应滤波器进行滤波,并在啸叫抑制后作为最终音频信号。
为实现上述目的及其他相关目的,本发明提供一种计算机可读存储介质,所述计算机可读存储介质上存储有数据处理程序,所述数据处理程序被处理器执行时实现上述的实时啸叫检测方法的步骤。
为实现上述目的及其他相关目的,本发明提供一种计算机可读存储介质,所述计算机可读存储介质上存储有数据处理程序,所述数据处理程序被处理器执行时实现上述的实时啸叫自适应抑制方法的步骤。
如上所述,本发明的实时啸叫检测和自适应抑制的方法、系统和计算机介质,具有以下
有益效果:
本发明获取实时的初始音频信号,对所述初始音频信号进行处理得到音频数据;采用多种频域检测方法对所述音频数据进行检测;根据所有检测结果进行对比判断得到啸叫结果;当啸叫结果为发生啸叫时,使用自适应滤波器对所述初始音频信号进行滤波处理以抑制啸叫。本发明综合多种频域检测方法对啸叫是否产生进行判断并且识别啸叫中心频率,进而使用自适应陷波器对输出音频进行动态调节,实现在不破坏音质的情况下进行啸叫抑制。
附图说明
图1显示为本发明实时啸叫检测方法的流程示意图。
图2显示为本发明实施例中自适应滤波器的第一频率响应调节波形示意图。
图3显示为本发明实施例中自适应滤波器的第二频率响应调节波形示意图。
图4显示为本发明实施例中自适应滤波器的第三频率响应调节波形示意图。
图5显示为本发明实施例中自适应滤波器的第四频率响应调节波形示意图。
图6显示为本发明实施例中实时音频信号的啸叫抑制前后效果对比示意图。
图7显示为本发明一种实时啸叫检测并抑制的系统的结构示意图。
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。
请参阅图1-7。需要说明的是,本实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
啸叫信号一般是具有某一单一频率特征的,并且在产生啸叫的初期就具有明显的频域特征;因此,本发明对音频进行实时啸叫频点检测以迅速、准确的识别发生啸叫,然后使用设计的自适应陷波器对特定频点进行处理从而实现啸叫抑制的目的。基于该技术构思,本发明提出一种实时啸叫检测和自适应抑制的方法、系统和计算机介质。
检测方法实施例:
如图1所示为本发明实时啸叫检测方法的流程示意图,现结合图1对本发明实时啸叫检测方法进行详细的介绍。本发明的实时啸叫检测方法至少包括以下步骤:
S1,获取实时的初始音频信号,对所述初始音频信号进行处理得到音频数据;
本发明的初始音频信号为时域信号。具体的,对所述初始音频信号进行处理得到音频数据包括:
(1)对所述初始音频信号进行加窗处理得到分段音频信号;
(2)对所述分段音频信号进行傅里叶变换得到音频数据。
本发明中,对初始音频信号进行加窗处理具体采用汉宁窗函数(Hanningwindow),汉宁窗的频域时间上是由三个矩形窗经相互平移叠加而成,可以看作是3个矩形时间窗的频谱之和,能够消去高频干扰和漏能,使频谱幅值精度大大提高。在本发明实施例中,叠加区域为30%。
由于加窗处理过程中信号窗口之间的边缘存在不连续性,可能导致频谱泄露,也会使识别的频率结果不准确。先对初始音频信号进行加窗处理是为了在频域中获得更好的分辨率,同时,避免在时域中出现频谱泄露。
S2,采用多种频域检测方法对所述音频数据进行检测;
本发明中,多种频域检测方法包括峰值/均值功率比、峰值/阈值功率比、峰值/临近值功率比和峰值/谐波峰值比。
其中,峰值/均值比PAPR的计算方式为:
式中,是当前方法对应的啸叫频率的功率,/>是当前帧平均功率。
本发明中峰值/均值比的频域检测方法考虑到一般产生啸叫的频率点功率远大于其他频率点的功率,故先计算出整个频谱的平均功率,然后计算每个频率点功率与平均功率之比。将比值大于预设阈值的频点,记为候选的啸叫中心频率,也即当前的检测方法的检测结果。
其中,峰值/阈值比PTPR的计算方式为:
式中,是当前方法对应的啸叫频率的功率值,MP0是设定的功率阈值。
本发明中峰值/阈值比的频域检测方法,考虑到实际啸叫的功率远大于正常播放的音频功率,故设定一个阈值,只有功率超过阈值的频率点,才会进行啸叫检测,减少无意义的检测,提高检测判断效率。
其中,峰值/临近值比PNPR的计算方式为:
式中,是当前方法对应的啸叫频率的功率值,/>是啸叫频率两侧临近频率的功率值。
本发明中峰值/临近值比的频域检测方法,一般需要寻找功率谱的峰值点,记为候选的啸叫中心频率,还可以选取左右各M个相邻频率点进行比较,当前频率的功率比临近值都高时,记为候选的啸叫中心频率。
其中,峰值/谐波峰值比PHPR的计算方式为:
式中,是当前方法对应的啸叫频率的功率值,/>是第m次谐振频率的功率值。
本发明考虑到语音谱有谐波峰,而啸叫频率是不含谐波峰,因此,根据一个峰值点的谐波频率功率是不是也很大,来判断该峰值是否为候选的啸叫中心频率。
本发明根据每种频域检测方法及其对应阈值对所述音频数据进行检测得到对应检测结果。
在本发明实施例中,峰值/均值比PAPR的阈值为T1=5dB,检测结果为[500 1000]Hz;峰值/阈值比PTPR的阈值为T2=5dB,检测结果为[600 1000]Hz;峰值/临近值比PNPR的阈值为T3=3dB,检测结果为1000Hz;峰值/谐波峰值比PHPR的阈值为T4=3dB,检测结果为1000Hz。
S3,根据所有检测结果进行对比判断得到啸叫结果。
所述啸叫结果包括发生啸叫和未发生啸叫。
当所有检测结果不存在交集时,啸叫结果为未发生啸叫;
当所有检测结果存在交集时,啸叫结果为发生啸叫,并将发生啸叫的交集值作为啸叫中心频率。
对于本发明实施例来讲,峰值/均值比PAPR的检测结果为[500 1000]Hz;峰值/阈值比PTPR的检测结果为[600 1000]Hz;峰值/临近值比PNPR的检测结果为1000Hz;峰值/谐波峰值比PHPR的检测结果为1000Hz;四个检测结果的交集为1000Hz,那么,检测识别得到啸叫频率为1000Hz。
本发明实施例中仅给出了每种频域方法的一个结果,作为其他实施方式,还可以通过多帧音频信号获得一种频域检测方法下的多帧检测结果。
本发明通过取各个频域检测方法的检测结果交集(一种频域检测方法的至少一个检测结果)进行对比判断来增加检测啸叫结果的准确性。
抑制方法实施例:
实时的初始音频信号被检测出发生啸叫后进行抑制的方法为:
使用自适应滤波器对所述初始音频信号进行滤波以抑制啸叫;其中,所述自适应滤波器是二阶IIR型的自适应陷波器。
自适应滤波器H(z)为:
式中,b为动态系数,ω0是角中心频率。
本发明的啸叫中心频率f0与角中心频率ω0的关系为:f0=2πω0;动态系数b可动态调节减益程度,具体的,根据当前输入信号和输出信号得到动态系数b的值,其中,输入信号为当前输入的初始音频信号的幅值,输出信号为啸叫抑制处理后输出的音频信号的幅值;由于当前输入信号和输出信号会发生变化,因此,动态系数b会不断变化,也就会得到不同响应曲线的滤波器。
本发明根据所述啸叫中心频率和当前输入信号、输出信号能够动态调节自适应滤波器的频率响应H(z)。使用自适应滤波器对所述初始音频信号进行滤波以抑制啸叫的过程为:
当所述啸叫结果为发生啸叫时,自适应滤波器读取当前输入信号和输出信号以调节所述自适应滤波器的动态系数;
基于调节后的所述自适应滤波器的动态系数更新所述自适应滤波器;
根据更新后的所述自适应滤波器对所述初始音频信号进行滤波以抑制所述初始音频信号中的啸叫。
具体的示例性描述,当啸叫结果为发生啸叫时,首先会产生一个如图2所示的自适应滤波器的第一频率响应调节波形示意图,具有较强的减益程度和较强的陷波范围
自适应滤波器同时读取当前输入信号和输出信号以增大所述自适应滤波器的动态系数;
如果啸叫仍然继续增大(表现为输出信号的幅值继续增加),自适应滤波器再读取当前输入信号和输出信号以增大自适应滤波器的动态系数,使得减益更强、减益范围更宽即如图3所示的自适应滤波器的第二频率响应调节波形示意图;
如果啸叫被抑制(表现为输出信号的幅值减小),那么自适应滤波器再读取当前输入信号和输出信号以减小自适应滤波器的动态系数,使得减益变弱、减益范围变窄即如图4所示的自适应滤波器的第三频率响应调节波形示意图或图5所示的自适应滤波器的第四频率响应调节波形示意图;
本发明在不同设备的中均可以达到有效的啸叫抑,如图6所示为一种设备的实时音频信号的啸叫抑制前后效果对比示意图。
本发明根据输入信号、输出信号的特征动态调整自适应滤波器的减益和陷波范围。当啸叫初期频点得到压制后,自适应陷波器逐渐减小减益值和减益范围,达到抑制啸叫的同时保护音质不被破坏。采用本发明的自适应滤波器能够在啸叫发生时快速抑制,然后当抑制成功后快速恢复原有音质。
系统实施例:
本发明还提供一种实时啸叫检测并抑制的系统如图7所示,所述系统包括输入模块、检测模块、抑制模块和输出模块;
所述输入模块接收初始音频信号,并对所述初始音频信号进行处理后输出时域音频信号和音频数据;
所述检测模块的输入端连接所述输入模块的第一输出端;用于对所述音频数据进行啸叫检测并得到啸叫结果;
所述抑制模块的第一输入端连接所述输入模块的第二输出端;所述抑制模块的第二输入端连接所述检测模块的输出端;所述抑制模块包括自适应滤波器,所述自适应滤波器根据所述啸叫结果对所述时域音频信号进行处理得到最终音频信号;
所述输出模块的输入端连接所述抑制模块的输出端,所述输出模块将所述最终音频信号输出。
本发明的输入模块对接收的初始音频信号进行信号分帧处理和傅里叶变换处理,将对初始音频信号只进行分帧处理后的第一分帧信号(即时域音频信号)通过输入模块的第一输出端输出;将对初始音频信号先后进行分帧处理和傅里叶变换处理的第二分帧信号(即音频数据)通过输入模块的第二输出端输出。
本发明输入模块对初始音频信号进行分帧处理,即对输入的时域信号,首先分为两路分帧信号,一路作为啸叫检测的输入信号,另一路作为啸叫抑制的输入信号。
本发明的检测模块包括多个检测单元和分析单元;
每个检测单元采用一种频域检测方法对所述音频数据进行检测,并输出检测结果;
所述分析单元对所有检测结果进行对比判断得到啸叫结果并输出。
在本发明实施例中,检测模块包括四个检测单元,分别采用峰值/均值功率比、峰值/阈值功率比、峰值/临近值功率比和峰值/谐波峰值比的计算方式对所述音频数据进行检测。其中,峰值/均值功率比、峰值/阈值功率比、峰值/临近值功率比和峰值/谐波峰值比的计算方式已在实时啸叫检测方法实施例中详细介绍,此处不再赘述。
分析单元输出的啸叫结果包括发生啸叫和未发生啸叫。
当分析单元判断所有检测结果不存在交集时,啸叫结果为未发生啸叫;
当分析单元判断所有检测结果存在交集时,啸叫结果为发生啸叫,并将发生啸叫的交集值作为啸叫中心频率。
本发明的抑制模块包括自适应滤波器,自适应滤波器为:
自适应滤波器H(z)为:
式中,b为动态系数,ω0是角中心频率。本发明的啸叫中心频率f0与角中心频率ω0的关系为:f0=2πω0
具体的,根据啸叫结果对时域音频信号进行处理得到最终音频信号:
若啸叫结果为未发生啸叫,将所述时域音频信号作为最终音频信号;
若啸叫结果为发生啸叫,则使用自适应滤波器进行滤波,并在啸叫抑制后作为最终音频信号。
本发明首先进行实时啸叫中心频率检测,随后使用设计的自适应滤波器对于啸叫中心频率进行针对的啸叫抑制,并且实时调整自适应滤波器使得输出音频达到保证音质的情况实现有效的啸叫抑制效果。
计算机介质实施例一:
本发明的计算机可读存储介质上存储有数据处理程序,所述数据处理程序被处理器执行时实现实时啸叫检测方法的步骤。
其中,实时啸叫检测方法已在检测方法实施例中详细介绍,此处为了避免重复不再进行详细赘述。
计算机介质实施例二:
本发明的计算机可读存储介质上存储有数据处理程序,所述数据处理程序被处理器执行时实现实时啸叫自适应抑制方法的步骤。
其中,实时自适应抑制方法已在抑制方法实施例中详细介绍,此处为了避免重复不再进行详细赘述。
综上所述,本发明采用多种频域检测方联合判断单个啸叫中心频率,且自适应滤波器可以调节频率响应,能够在啸叫增大时减益程度和陷波范围大、在啸叫小时减益程度和陷波范围小;因此,可以在不破坏音质的情况下快速消除啸叫,即啸叫抑制和音质保留可以得兼;本发明能够广泛的用于实时语音通讯,扩音系统以及音乐演出等多种情景。所以,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

Claims (13)

1.一种实时啸叫检测方法,其特征在于,至少包括:
获取实时的初始音频信号,对所述初始音频信号进行处理得到音频数据;
采用多种频域检测方法对所述音频数据进行检测;
根据所有检测结果进行对比判断得到啸叫结果。
2.根据权利要求1所述的实时啸叫检测方法,其特征在于,对所述初始音频信号进行处理得到音频数据包括:
(1)对所述初始音频信号进行加窗处理得到分段音频信号;
(2)对所述分段音频信号进行傅里叶变换得到音频数据。
3.根据权利要求1所述的实时啸叫检测方法,其特征在于,所述多种频域检测方法包括峰值/均值功率比、峰值/阈值功率比、峰值/临近值功率比和峰值/谐波峰值比。
4.根据权利要求1所述的实时啸叫检测方法,其特征在于,所述啸叫结果包括发生啸叫和未发生啸叫;
当所有检测结果不存在交集时,啸叫结果为未发生啸叫;
当所有检测结果存在交集时,啸叫结果为发生啸叫,并将发生啸叫的交集值作为啸叫中心频率。
5.一种实时啸叫自适应抑制方法,其特征在于,至少包括:
当权利要求1-4任一项所述的实时啸叫检测方法的啸叫结果为发生啸叫时,使用自适应滤波器对所述初始音频信号进行滤波处理以抑制啸叫;
其中,所述自适应滤波器是二阶IIR型的自适应陷波器。
6.根据权利要求5所述的实时啸叫自适应抑制方法,其特征在于,所述自适应滤波器为:
式中,b为动态系数,ω0是角中心频率。
7.根据权利要求6所述的实时啸叫自适应抑制方法,其特征在于,使用自适应滤波器对所述初始音频信号进行滤波以抑制啸叫的过程为:
当所述啸叫结果为发生啸叫时,自适应滤波器读取当前输入信号和输出信号以调节所述自适应滤波器的动态系数;
基于调节后的所述自适应滤波器的动态系数更新所述自适应滤波器;
根据更新后的所述自适应滤波器对所述初始音频信号进行滤波以抑制所述初始音频信号中的啸叫。
8.一种实时啸叫检测并抑制的系统,其特征在于,包括输入模块、检测模块、抑制模块和输出模块;
所述输入模块接收初始音频信号,并对所述初始音频信号进行处理后输出时域音频信号和音频数据;
所述检测模块的输入端连接所述输入模块的第一输出端;用于对所述音频数据进行啸叫检测并得到啸叫结果;
所述抑制模块的第一输入端连接所述输入模块的第二输出端;所述抑制模块的第二输入端连接所述检测模块的输出端;所述抑制模块包括自适应滤波器,所述自适应滤波器是二阶IIR型的自适应陷波器,所述自适应滤波器根据所述啸叫结果对所述时域音频信号进行处理得到最终音频信号;
所述输出模块的输入端连接所述抑制模块的输出端,所述输出模块将所述最终音频信号输出。
9.根据权利要求8所述的实时啸叫检测并抑制的系统,其特征在于,所述检测模块包括多个检测单元和分析单元;
每个检测单元采用一种频域检测方法对所述音频数据进行检测并输出检测结果;
所述分析单元对所有检测结果进行对比判断得到啸叫结果并输出。
10.根据权利要求9所述的实时啸叫检测并抑制的系统,其特征在于,所述检测模块包括四个检测单元,分别采用峰值/均值功率比、峰值/阈值功率比、峰值/临近值功率比和峰值/谐波峰值比的计算方式对所述音频数据进行检测。
11.根据权利要求10所述的实时啸叫检测并抑制的系统,其特征在于,根据所述啸叫结果对所述时域音频信号进行处理得到最终音频信号包括:
若啸叫结果为未发生啸叫,将所述时域音频信号作为最终音频信号;
若啸叫结果为发生啸叫,则使用自适应滤波器进行滤波,并在啸叫抑制后作为最终音频信号。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有数据处理程序,所述数据处理程序被处理器执行时实现权利要求1-4任一项所述的实时啸叫检测方法的步骤。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有数据处理程序,所述数据处理程序被处理器执行时实现权利要求5-7任一项所述的实时啸叫自适应抑制方法的步骤。
CN202310638686.6A 2023-05-31 2023-05-31 实时啸叫检测和自适应抑制的方法、系统和计算机介质 Pending CN116682407A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310638686.6A CN116682407A (zh) 2023-05-31 2023-05-31 实时啸叫检测和自适应抑制的方法、系统和计算机介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310638686.6A CN116682407A (zh) 2023-05-31 2023-05-31 实时啸叫检测和自适应抑制的方法、系统和计算机介质

Publications (1)

Publication Number Publication Date
CN116682407A true CN116682407A (zh) 2023-09-01

Family

ID=87780385

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310638686.6A Pending CN116682407A (zh) 2023-05-31 2023-05-31 实时啸叫检测和自适应抑制的方法、系统和计算机介质

Country Status (1)

Country Link
CN (1) CN116682407A (zh)

Similar Documents

Publication Publication Date Title
CN111583949A (zh) 啸叫抑制的方法、装置和设备
US8010355B2 (en) Low complexity noise reduction method
US8983833B2 (en) Method and apparatus for masking wind noise
CN103475980B (zh) 一种自适应声反馈消除方法
CN110120225A (zh) 一种基于gru网络的结构的音频降噪系统及方法
JP2004187283A (ja) マイクロホン装置および再生装置
CN110211602B (zh) 智能语音增强通信方法及装置
CN110213694B (zh) 一种音频设备及其啸叫的处理方法、计算机存储介质
CN110677796B (zh) 一种音频信号处理方法及助听器
US20110268288A1 (en) Noise gate, sound collection device, and noise removing method
CN111768796A (zh) 一种声学回波消除与去混响方法及装置
CN112037816B (zh) 语音信号频域频率的校正、啸叫检测、抑制方法及装置
EP2232704A1 (en) Noise suppression method and apparatus
US10380989B1 (en) Methods and apparatus for processing stereophonic audio content
US20210065670A1 (en) Wind noise mitigation systems and methods
KR20200128687A (ko) 하울링 억제 방법, 장치 및 전자 설비
US10438606B2 (en) Pop noise control
CN110503973B (zh) 音频信号瞬态噪音抑制方法、系统以及存储介质
CN110808059A (zh) 一种基于谱减法和小波变换的语音降噪方法
CN111798864B (zh) 一种回声消除方法、装置、电子设备及存储介质
JP3973929B2 (ja) ハウリング検出装置
CN103929704B (zh) 一种基于变换域的自适应声反馈消除的方法和系统
US5398286A (en) System for enhancing an analog signal
JP3558954B2 (ja) 適応ノッチフィルタを利用したハウリング抑制装置
CN116682407A (zh) 实时啸叫检测和自适应抑制的方法、系统和计算机介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination