CN110213694A - 一种音频设备及其啸叫的处理方法、计算机存储介质 - Google Patents

一种音频设备及其啸叫的处理方法、计算机存储介质 Download PDF

Info

Publication number
CN110213694A
CN110213694A CN201910305863.2A CN201910305863A CN110213694A CN 110213694 A CN110213694 A CN 110213694A CN 201910305863 A CN201910305863 A CN 201910305863A CN 110213694 A CN110213694 A CN 110213694A
Authority
CN
China
Prior art keywords
frequency point
filtering parameter
target
candidate
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910305863.2A
Other languages
English (en)
Other versions
CN110213694B (zh
Inventor
黄景标
林聚财
陈烈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Dahua Technology Co Ltd
Original Assignee
Zhejiang Dahua Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Dahua Technology Co Ltd filed Critical Zhejiang Dahua Technology Co Ltd
Priority to CN201910305863.2A priority Critical patent/CN110213694B/zh
Publication of CN110213694A publication Critical patent/CN110213694A/zh
Application granted granted Critical
Publication of CN110213694B publication Critical patent/CN110213694B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/03Synergistic effects of band splitting and sub-band processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本申请公开了一种音频设备及其啸叫的处理方法、计算机存储介质,该啸叫的处理方法包括:确定待检测音频帧在频域空间内的特征频率点;判断当前音频帧和之前相邻时序的第一设定数量个音频帧中,目标频率点被确定为特征频率点的的次数是否大于第二设定数量次;若是,则确定目标频率点为啸叫音频点。通过上述方式,能够精确的确定出啸叫音频点,降低虚警的概率。

Description

一种音频设备及其啸叫的处理方法、计算机存储介质
技术领域
本申请涉及音视频处理技术领域,特别是涉及一种音频设备及其啸叫的处理方法、计算机存储介质。
背景技术
当使用扩音设备进行扩音放大时,经常会有刺耳的单频噪声出现,该噪声严重影响用户对于扩音系统的使用,并且会使人感到不安。该现象的产生主要是因为设备所处的环境具有声反射条件,当原始的声音经过环境的边界产生反射声会再次被麦克风拾取,从而使反射声进入音响等扩音设备中进行放大。当反射声与原始声音的相位相同时,两个声音的能量就会叠加加强,而加强后的声音通过扩音设备从环境中放出又会由于环境的反射作用再次进入到扩音设备中,不断循环,最终就会产生经常能听到的啸叫声。
这种啸叫不仅会覆盖设备所放出的有效声音,而且还让人难以忍受。并且啸叫的产生经常会导致设备失灵,最终降低设备的使用寿命。
发明内容
为解决上述问题,本申请提供了一种音频设备及其啸叫的处理方法、计算机存储介质,能够精确的确定出啸叫音频点,降低虚警的概率。
本申请采用的一个技术方案是:提供一种啸叫的处理方法,该处理方法包括:确定待检测音频帧在频域空间内的特征频率点;判断当前音频帧和之前相邻时序的第一设定数量个音频帧中,目标频率点被确定为特征频率点的的次数是否大于第二设定数量次;若是,则确定目标频率点为啸叫音频点。
其中,确定待检测音频帧在频域空间内的特征频率点的步骤,包括:确定待检测音频帧在频域空间内的候选频率点;确定候选频率点的权重;根据候选频率点的功率值和对应的权重,计算候选频率点的特征值;判断候选频率点的特征值是否满足设定要求;若满足,则将候选频率点确定为特征频率点。
其中,确定待检测音频帧在频域空间内的候选频率点的步骤,包括:获取待检测音频帧的极大值频率点;将极大值频率点按照功率值的大小进行排序;从极大值频率点中选择功率值较大的预设数量个频率点作为候选频率点。
其中,确定候选频率点的权重的步骤,包括:确定候选频率点和相邻的第三设定数量个频率点;确定候选频率点和第三设定数量个频率点对应的功率值的离散程序;根据离散程序确定候选频率点的权重。
其中,该方法还包括:将全频段划分为多个子频段;分别确定每个子频段对应的子频段阈值;判断候选频率点的特征值是否满足设定要求的步骤,包括:判断候选频率点的特征值是否大于候选频率点所在子频段对应的子频段阈值。
其中,该方法还包括:将全频段划分为多个子频段;分别确定每个子频段对应的功率平均值;判断候选频率点的特征值是否满足设定要求的步骤,包括:判断候选频率点的特征值与所在子频段对应的功率平均值的比值,是否大于设定比例阈值。
其中,确定待检测音频帧在频域空间内的特征频率点的步骤之前,还包括:获取待检测音频信号;对待检测音频信号进行分帧处理,得到多个待检测音频帧;将待检测音频帧从时域空间转化到频域空间。
其中,该方法还包括:确定目标频率点为啸叫音频点的步骤之后,还包括:判断已有滤波参数集合中是否存在与目标频率点的频率值对应的目标滤波参数;若有,则采用目标滤波参数对目标频率点进行抑制处理;若没有,则根据设定的滤波参数添加规则,在滤波器参数集合中添加目标滤波参数,并采用目标滤波参数对目标频率点进行抑制处理。
其中,滤波参数集合存储于存储器中;根据设定的滤波参数添加规则,在滤波器参数集合中添加目标滤波参数的步骤,包括:判断存储器中的滤波参数的存储数量是否达到最大值;若是,则删除滤波参数集合中,功率值最小的频率点对应的滤波参数,并根据设定的滤波参数添加规则,在滤波器参数集中添加对应的滤波参数。
其中,根据设定的滤波参数添加规则,在滤波器参数集合中添加目标滤波参数的步骤之后,还包括:判断目标频率点在当前音频帧中的功率值与目标频率点在之前的设定数量个音频帧中的功率值,是否呈递增趋势;若呈递增趋势,则判断目标滤波参数中的增益系数是否为最大值;若否,则增加增益系数。
其中,判断目标滤波参数中的增益系数是否为最大值的步骤之后,还包括:若是,则判断滤波参数集合中是否存在目标滤波参数;若存在,则删除频率点;若不存在,则将目标滤波参数进行重置。
本申请采用的另一个技术方案是:提供一种音频设备,该音频设备包括处理器以及存储器,其中,存储器用于存储程序数据,处理器用于执行程序数据以执行如上述的处理方法。
本申请采用的另一个技术方案是:提供一种计算机存储介质,该计算机存储介质用于存储程序数据,程序数据在被处理器执行时,实现如上述的处理方法。
本申请实施例提供的啸叫的处理方法包括:确定待检测音频帧在频域空间内的特征频率点;判断当前音频帧和之前相邻时序的第一设定数量个音频帧中,目标频率点被确定为特征频率点的的次数是否大于第二设定数量次;若是,则确定目标频率点为啸叫音频点。通过上述方式,本实施例不仅判断当前音频帧的啸叫情况,还通过多个音频帧的啸叫情况精确的确定出啸叫音频点,能够降低虚警的概率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。其中:
图1是本申请实施例提供的啸叫的处理方法的流程示意图;
图2是本申请实施例提供的特征频率点的确定方法的流程示意图;
图3是本申请实施例提供的确定候选频率点的信号示意图;
图4是图3中区域40的局部放大图;
图5是本申请实施例提供的啸叫的处理方法的另一流程示意图;
图6是本申请实施例提供的音频设备的结构示意图;
图7是本申请实施例提供的计算机存储介质的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。可以理解的是,此处所描述的具体实施例仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部结构。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
参阅图1,图1是本申请实施例提供的啸叫的处理方法的流程示意图,该方法包括:
步骤11:确定待检测音频帧在频域空间内的特征频率点。
可选地,在步骤11之前,还可以包括:获取待检测音频信号;对待检测音频信号进行分帧处理,得到多个待检测音频帧;将待检测音频帧从时域空间转化到频域空间。
具体地,这里可以采用傅里叶变换将时域信号转化为频域信号。频域是描述信号在频率方面特性时用到的一种坐标系,频域图显示了在一个频率范围内每个给定频带内的信号量。在本实施例的音频信号中,表示了一个频点的信号功率。
其中,这里的特征频率点是指估计会产生啸叫的频率点。
如图2所示,图2是本申请实施例提供的特征频率点的确定方法的流程示意图,该方法包括:
步骤111:确定待检测音频帧在频域空间内的候选频率点。
这里的候选频率点是指初步选定的估计会产生啸叫的频率点。
在一可选的实施例中,确定候选频率点可以具体采用以下的方法:获取待检测音频帧的极大值频率点;将极大值频率点按照功率值的大小进行排序;从极大值频率点中选择功率值较大的预设数量个频率点作为候选频率点。
如图3所示,图3是本申请实施例提供的确定候选频率点的信号示意图。
在获取待检测音频帧的多个极大值频率点后,将极大值频率点按照功率值的大小进行排序;从极大值频率点中选择功率值较大的预设数量个频率点作为候选频率点。例如,这里的预设数量为3个,那么,从多个极大值频率点中选择的候选频率点分别为f1、f2和f3三个频率点,设三个频率点分别对应的功率值为W1、W2和W3,可以从图3中看出,W2>W3>W1。
步骤112:确定候选频率点的权重。
可选地,步骤112可以采用以下的方法来实现:确定候选频率点和相邻的第三设定数量个频率点;确定候选频率点和第三设定数量个频率点对应的功率值的离散程序;根据离散程序确定候选频率点的权重。
如图4所示,图4是图3中区域40的局部放大图。
例如,选取的频率点为f2之前相邻的f21和f22,以及f2之后相邻的f23和f24,共计5个频率点,然后确定该5个频率点对应的功率值的离散程序。
可选地,这里的离散程序可以采用方差、或标准差的方式来进行计算,即计算5个频率点对应的功率值的方差。
可选地,在根据方差确定权重时,可以采用sigmoid函数。Sigmoid函数也称为S型生长曲线。由于其单增以及反函数单增等性质,Sigmoid函数常被用作神经网络的阈值函数,将变量映射到0-1之间。因此,这里可以采用Sigmoid函数来确认权重。
步骤113:根据候选频率点的功率值和对应的权重,计算候选频率点的特征值。
例如,f21、f22、f2、f23、f24这5个频率点对应的功率值分别为W21、W22、W2、W23、W24,对应的权重分别为q1、q2、q3、q4、q5(q1+q2+q3+q4+q5=1),那么候选频率点f2的特征值为:W21*q1+W22*q2+W2*q3+W23*q4+W24*q5。
步骤114:判断候选频率点的特征值是否满足设定要求。
可选地,步骤114主要是通过判断候选频率点的特征值是否大于设定的阈值来判断其是否满足要求。
其中,该阈值是可以根据频域上的频率分辨率来确定的,若频率分辨率越高,则给定的范围可以随之增大。
可选地,这里可以采用以下两种方式来判断候选频率点是否满足设定要求。
在一种实施例中,将全频段划分为多个子频段;分别确定每个子频段对应的子频段阈值;判断候选频率点的特征值是否大于该候选频率点所在子频段对应的子频段阈值。
在另一种实施例中,将全频段划分为多个子频段;分别确定每个子频段对应的功率平均值;判断候选频率点的特征值与所在子频段对应的功率平均值的比值,是否大于设定比例阈值。
在步骤114的判断结果为是时,执行步骤115。
步骤115:将候选频率点确定为特征频率点。
这里的特征频率点是指估计产生啸叫的频率点。
步骤12:判断当前音频帧和之前相邻时序的第一设定数量个音频帧中,目标频率点被确定为特征频率点的的次数是否大于第二设定数量次。
这里以图3中的f2频率点进行说明。
由于在当前音频帧中,f2频率点被确定为特征频率点,那么这里要判断在之前的多个帧中,f2频率点是否也被确定为特征频率点。
可选地,以第一设定数量为10个,第二设定数量为5个为例,在按照时序的第1-10音频帧中,第10帧为当前音频帧,那么本步骤中需要判断第1-10个音频帧中f2频率点被确定为特征频率点的帧数是否大于或等于5个。
在步骤12的判断结果为是时,执行步骤13。
步骤13:确定目标频率点为啸叫音频点。
本实施提供的啸叫的处理方法包括:确定待检测音频帧在频域空间内的特征频率点;判断当前音频帧和之前相邻时序的第一设定数量个音频帧中,目标频率点被确定为特征频率点的的次数是否大于第二设定数量次;若是,则确定目标频率点为啸叫音频点。通过上述方式,本实施例不仅判断当前音频帧的啸叫情况,还通过多个音频帧的啸叫情况精确的确定出啸叫音频点,能够降低虚警的概率。
参阅图5,图5是本申请实施例提供的啸叫的处理方法的另一流程示意图,该方法包括:
步骤51:判断已有滤波参数集合中是否存在与目标频率点的频率值对应的目标滤波参数。
若有,则执行步骤52,若没有,则执行步骤53。
可选地,可以在音频设备的存储器中存储对应不同频率点的滤波参数,其中可以包括啸叫点频率、啸叫点功率值、啸叫点在频域中的位置、相对应的滤波参数、滤波增益系数。
步骤52:采用目标滤波参数对目标频率点进行抑制处理。
步骤53:根据设定的滤波参数添加规则,在滤波器参数集合中添加目标滤波参数,并采用目标滤波参数对目标频率点进行抑制处理。
可选地,步骤53可以具体包括:判断存储器中的滤波参数的存储数量是否达到最大值;若是,则删除滤波参数集合中,功率值最小的频率点对应的滤波参数,并根据设定的滤波参数添加规则,在滤波器参数集中添加对应的滤波参数。
可选地,步骤53之后还可以包括:判断目标频率点在当前音频帧中的功率值与目标频率点在之前的设定数量个音频帧中的功率值,是否呈递增趋势;若呈递增趋势,则判断目标滤波参数中的增益系数是否为最大值;若否,则增加增益系数。
可选地,步骤53之后还可以包括:判断滤波参数集合中是否存在目标滤波参数;若存在,则删除频率点;若不存在,则将目标滤波参数进行重置。
本实施例提供的啸叫处理方法考虑到在现实情况下啸叫会随着时间不停的增大,在设计滤波器进行啸叫抑制中引入了啸叫抑制增益随啸叫能量的增大而自适应变化的功能来准确并高效的处理啸叫。
下面通过两个啸叫的检测和啸叫的抑制两个过程对上述的实施例进行介绍。
啸叫检测:
1、将待检测的音频信号进行分帧,加窗,并通过傅里叶变换来得到信号帧在频域的表现形式,并在频域空间中得到最初始候选频率点;该频率点的选择可以是基于信号帧在频域中的极大值点排序得到的。
2、确定初始候选频点两侧选取频率点的数值,若候选频点位于频域的边界,则在同一侧取单侧两倍的数值,计算初始候选频点的方差,并将其映射到sigmoid函数上得到各个频点的权重,计算每个初始候选频点的功率值并将其与之对应的权重相乘。
3、设定阈值,该阈值主要是用于判定二次候选啸叫点是否在当前帧及前m帧中出现的次数的最少次数。先将二次候选啸叫频点值进行缓存,再统计当前帧到前m帧中出现的次数;当统计的次数大于所设定的阈值则判定该频率点为啸叫点。
啸叫抑制:
1、设置一定的缓冲区域用来存储确定啸叫点的相关参数,如啸叫点频率,啸叫点处的幅度,啸叫点在频域中的位置,以及该啸叫点的陷波器参数,啸叫点处的陷波增益。
2、对确定的啸叫点进行陷波器参数设置之前,先比对该啸叫点是否存在于缓存区中,若是存在,则直接调用已存在的陷波器的相关参数;若不存在,则判断当前陷波器组的个数是否已经用完,若已用完,则删除陷波器组中啸叫点幅度最低的那个陷波器,将新的啸叫点参数导入,若没有用完,则开辟新的空间供新陷波器使用。
3、计算导入啸叫点的当前帧幅值与前一帧幅值的差值和前一帧幅值与前两帧幅值的差值;判断该两个差值,是否为正值。
如果是正值,则判断该陷波器是否达到最大增益。
若达到最大增益,则判断该调用的陷波器是否是已存在的陷波器,若是,则抹去该啸叫点,若不是,将该陷波器增益重置,用来抑制新的啸叫。
若未达到最大增益,增加该陷波器的陷波增益。
如果不是正值,则抹去该啸叫点。
4、啸叫点频率及设置后的增益导入到陷波器设计模块,设计相应的陷波器参数
5、啸叫点相关参数以压栈的方式导入到存储器中。
参阅图6,图6是本申请实施例提供的音频设备的结构示意图,该音频设备60包括处理器61以及与该处理器61耦接的存储器62、麦克风63和扬声器64。可选地,该音频设备60可以是扩音设备。
其中,该麦克风63用于获取音频信号,扬声器64用于发出音频信号。
其中,该存储器62中存储有程序数据,处理器61用于执行该程序数据以实现以下的方法步骤:
确定待检测音频帧在频域空间内的特征频率点;判断当前音频帧和之前相邻时序的第一设定数量个音频帧中,目标频率点被确定为特征频率点的的次数是否大于第二设定数量次;若是,则确定目标频率点为啸叫点。
可选的,处理器61还用于执行该程序数据以实现以下的方法步骤:确定待检测音频帧在频域空间内的候选频率点;确定候选频率点的权重;根据候选频率点的功率值和对应的权重,计算候选频率点的特征值;判断候选频率点的特征值是否满足设定要求;若满足,则将候选频率点确定为特征频率点。
可选的,处理器61还用于执行该程序数据以实现以下的方法步骤:获取待检测音频帧的极大值频率点;将极大值频率点按照功率值的大小进行排序;从极大值频率点中选择功率值较大的预设数量个频率点作为候选频率点。
可选的,处理器61还用于执行该程序数据以实现以下的方法步骤:确定候选频率点和相邻的第三设定数量个频率点;确定候选频率点和第三设定数量个频率点对应的功率值的离散程序;根据离散程序确定候选频率点的权重。
可选的,处理器61还用于执行该程序数据以实现以下的方法步骤:将全频段划分为多个子频段;分别确定每个子频段对应的子频段阈值;判断候选频率点的特征值是否满足设定要求的步骤,包括:判断候选频率点的特征值是否大于候选频率点所在子频段对应的子频段阈值。
可选的,处理器61还用于执行该程序数据以实现以下的方法步骤:将全频段划分为多个子频段;分别确定每个子频段对应的功率平均值;判断候选频率点的特征值是否满足设定要求的步骤,包括:判断候选频率点的特征值与所在子频段对应的功率平均值的比值,是否大于设定比例阈值。
可选的,处理器61还用于执行该程序数据以实现以下的方法步骤:获取待检测音频信号;对待检测音频信号进行分帧处理,得到多个待检测音频帧;将待检测音频帧从时域空间转化到频域空间。
可选的,处理器61还用于执行该程序数据以实现以下的方法步骤:判断已有滤波参数集合中是否存在与目标频率点的频率值对应的目标滤波参数;若有,则采用目标滤波参数对目标频率点进行抑制处理;若没有,则根据设定的滤波参数添加规则,在滤波器参数集合中添加目标滤波参数,并采用目标滤波参数对目标频率点进行抑制处理。
可选的,处理器61还用于执行该程序数据以实现以下的方法步骤:判断存储器中的滤波参数的存储数量是否达到最大值;若是,则删除滤波参数集合中,功率值最小的频率点对应的滤波参数,并根据设定的滤波参数添加规则,在滤波器参数集中添加对应的滤波参数。
可选的,处理器61还用于执行该程序数据以实现以下的方法步骤:判断目标频率点在当前音频帧中的功率值与目标频率点在之前的设定数量个音频帧中的功率值,是否呈递增趋势;若呈递增趋势,则判断目标滤波参数中的增益系数是否为最大值;若否,则增加增益系数。
参阅图7,图7是本申请实施例提供的计算机存储介质的结构示意图,该计算机存储介质70用于存储程序数据71,程序数据71在被处理器执行时,实现如下的方法步骤:
确定待检测音频帧在频域空间内的特征频率点;判断当前音频帧和之前相邻时序的第一设定数量个音频帧中,目标频率点被确定为特征频率点的的次数是否大于第二设定数量次;若是,则确定目标频率点为啸叫点。
该程序数据71在被处理器执行时,还用实现如下的方法步骤:判断已有滤波参数集合中是否存在与目标频率点的频率值对应的目标滤波参数;若有,则采用目标滤波参数对目标频率点进行抑制处理;若没有,则根据设定的滤波参数添加规则,在滤波器参数集合中添加目标滤波参数,并采用目标滤波参数对目标频率点进行抑制处理。
在本申请所提供的几个实施方式中,应该理解到,所揭露的方法以及设备,可以通过其它的方式实现。例如,以上所描述的设备实施方式仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
另外,在本申请各个实施方式中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
本申请的实施例以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施方式所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本申请的实施方式,并非因此限制本申请的专利范围,凡是根据本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (13)

1.一种啸叫的处理方法,其特征在于,包括:
确定待检测音频帧在频域空间内的特征频率点;
判断当前音频帧和之前相邻时序的第一设定数量个音频帧中,目标频率点被确定为所述特征频率点的的次数是否大于第二设定数量次;
若是,则确定所述目标频率点为啸叫音频点。
2.根据权利要求1所述的处理方法,其特征在于,
所述确定待检测音频帧在频域空间内的特征频率点的步骤,包括:
确定待检测音频帧在频域空间内的候选频率点;
确定所述候选频率点的权重;
根据所述候选频率点的功率值和对应的权重,计算所述候选频率点的特征值;
判断所述候选频率点的特征值是否满足设定要求;
若满足,则将所述候选频率点确定为所述特征频率点。
3.根据权利要求2所述的处理方法,其特征在于,
所述确定待检测音频帧在频域空间内的候选频率点的步骤,包括:
获取所述待检测音频帧的极大值频率点;
将所述极大值频率点按照功率值的大小进行排序;
从所述极大值频率点中选择功率值较大的预设数量个频率点作为所述候选频率点。
4.根据权利要求2所述的处理方法,其特征在于,
所述确定所述候选频率点的权重的步骤,包括:
确定所述候选频率点和相邻的第三设定数量个频率点;
确定所述候选频率点和所述第三设定数量个频率点对应的功率值的离散程序;
根据所述离散程序确定所述候选频率点的权重。
5.根据权利要求2所述的处理方法,其特征在于,
所述方法还包括:
将全频段划分为多个子频段;
分别确定每个子频段对应的子频段阈值;
所述判断所述候选频率点的特征值是否满足设定要求的步骤,包括:
判断所述候选频率点的特征值是否大于所述候选频率点所在子频段对应的子频段阈值。
6.根据权利要求2所述的处理方法,其特征在于,
所述方法还包括:
将全频段划分为多个子频段;
分别确定每个子频段对应的功率平均值;
所述判断所述候选频率点的特征值是否满足设定要求的步骤,包括:
判断所述候选频率点的特征值与所在子频段对应的功率平均值的比值,是否大于设定比例阈值。
7.根据权利要求1所述的处理方法,其特征在于,
所述确定待检测音频帧在频域空间内的特征频率点的步骤之前,还包括:
获取待检测音频信号;
对所述待检测音频信号进行分帧处理,得到多个待检测音频帧;
将所述待检测音频帧从时域空间转化到频域空间。
8.根据权利要求1所述的处理方法,其特征在于,包括:
所述确定所述目标频率点为啸叫音频点的步骤之后,还包括:
判断已有滤波参数集合中是否存在与所述目标频率点的频率值对应的目标滤波参数;
若有,则采用所述目标滤波参数对所述目标频率点进行抑制处理;
若没有,则根据设定的滤波参数添加规则,在所述滤波器参数集合中添加所述目标滤波参数,并采用所述目标滤波参数对所述目标频率点进行抑制处理。
9.根据权利要求8所述的处理方法,其特征在于,
所述滤波参数集合存储于存储器中;
所述根据设定的滤波参数添加规则,在所述滤波器参数集合中添加所述目标滤波参数的步骤,包括:
判断所述存储器中的滤波参数的存储数量是否达到最大值;
若是,则删除所述滤波参数集合中,功率值最小的频率点对应的滤波参数,并根据设定的滤波参数添加规则,在所述滤波器参数集中添加对应的滤波参数。
10.根据权利要求8所述的处理方法,其特征在于,
所述根据设定的滤波参数添加规则,在所述滤波器参数集合中添加所述目标滤波参数的步骤之后,还包括:
判断所述目标频率点在当前音频帧中的功率值与所述目标频率点在之前的设定数量个音频帧中的功率值,是否呈递增趋势;
若呈递增趋势,则判断所述目标滤波参数中的增益系数是否为最大值;
若否,则增加所述增益系数。
11.根据权利要求10所述的处理方法,其特征在于,
所述判断所述目标滤波参数中的增益系数是否为最大值的步骤之后,还包括:
若是,则判断所述滤波参数集合中是否存在所述目标滤波参数;
若存在,则删除所述频率点;
若不存在,则将所述目标滤波参数进行重置。
12.一种音频设备,其特征在于,包括处理器以及存储器,其中,所述存储器用于存储程序数据,所述处理器用于执行所述程序数据以执行如权利要求1-11任一项所述的处理方法。
13.一种计算机存储介质,其特征在于,所述计算机存储介质用于存储程序数据,所述程序数据在被处理器执行时,实现如权利要求1-11任一项所述的处理方法。
CN201910305863.2A 2019-04-16 2019-04-16 一种音频设备及其啸叫的处理方法、计算机存储介质 Active CN110213694B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910305863.2A CN110213694B (zh) 2019-04-16 2019-04-16 一种音频设备及其啸叫的处理方法、计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910305863.2A CN110213694B (zh) 2019-04-16 2019-04-16 一种音频设备及其啸叫的处理方法、计算机存储介质

Publications (2)

Publication Number Publication Date
CN110213694A true CN110213694A (zh) 2019-09-06
CN110213694B CN110213694B (zh) 2020-12-04

Family

ID=67786151

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910305863.2A Active CN110213694B (zh) 2019-04-16 2019-04-16 一种音频设备及其啸叫的处理方法、计算机存储介质

Country Status (1)

Country Link
CN (1) CN110213694B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110536215A (zh) * 2019-09-09 2019-12-03 普联技术有限公司 音频信号处理的方法、装置、计算设置及存储介质
CN112349295A (zh) * 2020-10-20 2021-02-09 浙江大华技术股份有限公司 啸叫检测方法及装置
CN113316074A (zh) * 2021-05-11 2021-08-27 紫光展锐(重庆)科技有限公司 一种啸叫检测方法、装置及电子设备
WO2022068440A1 (zh) * 2020-09-30 2022-04-07 腾讯科技(深圳)有限公司 啸叫抑制方法、装置、计算机设备和存储介质
CN114510362A (zh) * 2022-02-18 2022-05-17 歌尔股份有限公司 数据缓存处理方法、装置、设备以及存储介质
CN117641218A (zh) * 2024-01-25 2024-03-01 北京中电慧声科技有限公司 一种啸叫检测和抑制方法、系统及介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07143034A (ja) * 1993-11-19 1995-06-02 Matsushita Electric Ind Co Ltd ハウリング抑制装置
CN105895115A (zh) * 2016-04-01 2016-08-24 北京小米移动软件有限公司 啸叫的判定方法及装置
CN106303878A (zh) * 2015-05-22 2017-01-04 成都鼎桥通信技术有限公司 一种啸叫检测和抑制方法
CN107257528A (zh) * 2017-06-14 2017-10-17 山东浪潮云服务信息科技有限公司 一种基于加权谱熵的啸叫检测方法
CN107645696A (zh) * 2016-07-20 2018-01-30 腾讯科技(深圳)有限公司 一种啸叫检测方法和装置
CN109218917A (zh) * 2018-11-12 2019-01-15 中通天鸿(北京)通信科技股份有限公司 一种实时通信系统中的自动声反馈监测与消除方法
CN109218957A (zh) * 2018-10-23 2019-01-15 北京达佳互联信息技术有限公司 啸叫检测方法、装置、电子设备及存储介质
CN109461455A (zh) * 2018-11-30 2019-03-12 维沃移动通信(深圳)有限公司 一种消除啸叫的系统及方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07143034A (ja) * 1993-11-19 1995-06-02 Matsushita Electric Ind Co Ltd ハウリング抑制装置
CN106303878A (zh) * 2015-05-22 2017-01-04 成都鼎桥通信技术有限公司 一种啸叫检测和抑制方法
CN105895115A (zh) * 2016-04-01 2016-08-24 北京小米移动软件有限公司 啸叫的判定方法及装置
CN107645696A (zh) * 2016-07-20 2018-01-30 腾讯科技(深圳)有限公司 一种啸叫检测方法和装置
CN107257528A (zh) * 2017-06-14 2017-10-17 山东浪潮云服务信息科技有限公司 一种基于加权谱熵的啸叫检测方法
CN109218957A (zh) * 2018-10-23 2019-01-15 北京达佳互联信息技术有限公司 啸叫检测方法、装置、电子设备及存储介质
CN109218917A (zh) * 2018-11-12 2019-01-15 中通天鸿(北京)通信科技股份有限公司 一种实时通信系统中的自动声反馈监测与消除方法
CN109461455A (zh) * 2018-11-30 2019-03-12 维沃移动通信(深圳)有限公司 一种消除啸叫的系统及方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110536215A (zh) * 2019-09-09 2019-12-03 普联技术有限公司 音频信号处理的方法、装置、计算设置及存储介质
WO2022068440A1 (zh) * 2020-09-30 2022-04-07 腾讯科技(深圳)有限公司 啸叫抑制方法、装置、计算机设备和存储介质
CN112349295A (zh) * 2020-10-20 2021-02-09 浙江大华技术股份有限公司 啸叫检测方法及装置
CN112349295B (zh) * 2020-10-20 2023-03-31 浙江大华技术股份有限公司 啸叫检测方法及装置
CN113316074A (zh) * 2021-05-11 2021-08-27 紫光展锐(重庆)科技有限公司 一种啸叫检测方法、装置及电子设备
CN113316074B (zh) * 2021-05-11 2022-07-05 紫光展锐(重庆)科技有限公司 一种啸叫检测方法、装置及电子设备
CN114510362A (zh) * 2022-02-18 2022-05-17 歌尔股份有限公司 数据缓存处理方法、装置、设备以及存储介质
CN117641218A (zh) * 2024-01-25 2024-03-01 北京中电慧声科技有限公司 一种啸叫检测和抑制方法、系统及介质
CN117641218B (zh) * 2024-01-25 2024-04-12 北京中电慧声科技有限公司 一种啸叫检测和抑制方法、系统及介质

Also Published As

Publication number Publication date
CN110213694B (zh) 2020-12-04

Similar Documents

Publication Publication Date Title
CN110213694A (zh) 一种音频设备及其啸叫的处理方法、计算机存储介质
CN103632666B (zh) 语音识别方法、语音识别设备和电子设备
CN110459234B (zh) 用于车载的语音识别方法及系统
US9269367B2 (en) Processing audio signals during a communication event
US7295972B2 (en) Method and apparatus for blind source separation using two sensors
CN104637489B (zh) 声音信号处理的方法和装置
CN109599124A (zh) 一种音频数据处理方法、装置及存储介质
JP4496186B2 (ja) 音源分離装置、音源分離プログラム及び音源分離方法
CN110265020B (zh) 语音唤醒方法、装置及电子设备、存储介质
EP2023342A1 (en) Noise reduction with integrated tonal noise reduction
CN110261816B (zh) 语音波达方向估计方法及装置
US11011182B2 (en) Audio processing system for speech enhancement
JP2012527003A (ja) 雑音の多い環境で動作するハンドフリー電話デバイスなどの音声処理システムに関して2つ以上のマイクロフォンの1つを選択するための方法
JP6065028B2 (ja) 収音装置、プログラム及び方法
CN112185408B (zh) 音频降噪方法、装置、电子设备以及存储介质
CN111081233B (zh) 一种音频处理方法及电子设备
CN109859769A (zh) 一种掩码估计方法及装置
JP7028307B2 (ja) ハウリング抑圧装置、その方法、およびプログラム
CN110364175A (zh) 语音增强方法及系统、通话设备
CN111028855A (zh) 回声抑制方法、装置、设备及存储介质
CN112259117B (zh) 一种目标声源锁定和提取的方法
CN109246548A (zh) 爆破噪声控制
CN111599366A (zh) 一种车载多音区语音处理的方法和相关装置
CN109587248B (zh) 用户识别方法、装置、服务器及存储介质
CN115171703B (zh) 分布式语音唤醒方法和装置、存储介质及电子装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant