CN113724725B - 一种蓝牙音频啸叫检测抑制方法、装置、介质及蓝牙设备 - Google Patents

一种蓝牙音频啸叫检测抑制方法、装置、介质及蓝牙设备 Download PDF

Info

Publication number
CN113724725B
CN113724725B CN202111296702.5A CN202111296702A CN113724725B CN 113724725 B CN113724725 B CN 113724725B CN 202111296702 A CN202111296702 A CN 202111296702A CN 113724725 B CN113724725 B CN 113724725B
Authority
CN
China
Prior art keywords
spectral
audio
current frame
howling
spectral coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111296702.5A
Other languages
English (en)
Other versions
CN113724725A (zh
Inventor
李强
朱勇
王尧
叶东翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Barrot Wireless Co Ltd
Original Assignee
Barrot Wireless Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Barrot Wireless Co Ltd filed Critical Barrot Wireless Co Ltd
Priority to CN202111296702.5A priority Critical patent/CN113724725B/zh
Publication of CN113724725A publication Critical patent/CN113724725A/zh
Application granted granted Critical
Publication of CN113724725B publication Critical patent/CN113724725B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech

Abstract

本申请公开了一种蓝牙音频啸叫检测抑制方法、装置、介质及蓝牙设备,属于音频编解码技术领域。包括,利用蓝牙音频编码和/或解码过程中经离散余弦变换得到的当前帧音频谱系数中每一个谱系数,及与其相邻的两个谱系数,计算得到每一个谱系数相应的伪谱系数;利用当前帧音频谱系数相应的所有伪谱系数,计算子带能量熵得到当前帧音频谱系数的伪谱谱熵;以及,利用当前帧音频谱系数的伪谱谱熵以及预设的谱熵门限值判断当前帧音频谱系数是否包含啸叫。本申请可以避免现有技术中检测啸叫所需的时频变换,节约运算量,减少系统时延。

Description

一种蓝牙音频啸叫检测抑制方法、装置、介质及蓝牙设备
技术领域
本发明涉及音频编解码技术领域,尤其涉及一种蓝牙音频啸叫检测抑制方法、装置、介质及蓝牙设备。
背景技术
目前主流的蓝牙音频编码器中,“子带编码技术(SBC)”是使用最为广泛,是所有的蓝牙音频设备必须支持的,但音质一般;“高级音频编码技术(AAC-LC)” 音质较好且应用较为广泛,很多主流的手机都支持,但是其内存占用较大,且运算复杂度高,很多蓝牙设备都基于嵌入式平台,电池容量有限,处理器运算能力较差且内存有限;“高通蓝牙音频编码技术(aptX系列)”和“索尼蓝牙音频编码技术(LDAC)”,音质较好但是码率很高,且其分别为高通和索尼独有技术,较为封闭。基于上述原因,蓝牙国际联盟联合众多厂商推出了LC3,其具有较低延迟、较高音质和编码增益以及在蓝牙领域无专利费得优点,受到广大厂商的关注。
蓝牙音频有很多典型的应用场景,譬如说基于蓝牙的卡拉OK、基于蓝牙的无线麦克风/音箱等,从数据流的角度,可以抽象为图1所示,可以看出,此图中存在从扬声器到麦克风的反馈路径(如虚线箭头所示),此闭环状态使得当系统在增益增大到一定状态时有可能趋于不稳定,产生自激振荡发生啸叫,为了检测以便于进一步避免啸叫,现有技术中,可以在音频处理的路径上插入一个模块,譬如在音频编码器之前或音频解码器之后插入,用来检测啸叫的产生。现有方案中基于频域的方法检测较为准确使用广泛,但其需要完成时频变换,再基于频域得到的特征来检测啸叫,运算量较大。
发明内容
针对现有技术存在的问题,本申请主要提供一种蓝牙音频啸叫检测抑制方法、装置、介质及蓝牙设备,直接计算编解码过程中的音频谱系数的相应的伪谱系数进一步计算伪谱谱熵,利用伪谱谱熵判断每一帧音频谱系数是否包含啸叫,避免现有技术中的时频转换过程。
为了实现上述目的,本申请采用的另一个技术方案是:提供一种蓝牙音频啸叫检测抑制方法,其包括:利用蓝牙音频编码和/或解码过程中经离散余弦变换得到的当前帧音频谱系数中每一个谱系数,及与其相邻的两个谱系数,计算得到每一个谱系数相应的伪谱系数;利用当前帧音频谱系数相应的所有伪谱系数,计算子带能量熵得到当前帧音频谱系数的伪谱谱熵;以及,利用当前帧音频谱系数的伪谱谱熵以及预设的谱熵门限值判断当前帧音频谱系数是否包含啸叫,其中,伪谱系数与正弦波的频率具有对应关系。
本申请采用的另一个技术方案是:提供一种蓝牙音频啸叫检测抑制装置,其包括,伪谱系数计算模块,用于利用蓝牙音频编码和/或解码过程中经离散余弦变换得到的当前帧音频谱系数中每一个谱系数,及与其相邻的两个谱系数,计算得到每一个谱系数相应的伪谱系数;伪谱谱熵计算模块,用于利用当前帧音频谱系数相应的所有伪谱系数,计算子带能量熵得到当前帧音频谱系数的伪谱谱熵;以及,啸叫判断模块,用于利用当前帧音频谱系数的伪谱谱熵以及预设的谱熵门限值判断当前帧音频谱系数是否包含啸叫,其中,伪谱系数与正弦波的频率具有对应关系。
本申请采用的另一个技术方案是:提供一种蓝牙设备,其包括编码器以及解码器,编码器和/或解码器设置有上述的蓝牙音频啸叫检测抑制装置。
本申请采用的另一个技术方案是:提供一种计算机可读存储介质,其存储有计算机指令,该计算机指令被操作以执行第一种方案中的一种蓝牙音频啸叫检测抑制方法。
本申请的技术方案可以达到的有益效果是:提供一种蓝牙音频啸叫检测抑制方法、装置、介质及蓝牙设备,在蓝牙音频编码或者解码过程中,利用中间的音频谱系数计算相应的伪谱系数进一步计算伪谱谱熵,并利用伪谱谱熵判断每一帧音频谱系数是否包含啸叫,能够在保证检测准确性高的前提下,避免现有技术中检测啸叫所需的时频变换,节约运算量,减少系统时延。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是蓝牙音频啸叫发生过程示意图;
图2是本申请一种蓝牙音频啸叫检测抑制方法的一个具体实施方式流程示意图;
图3是同一段含有啸叫的语音信号的伪谱熵图和普通谱熵图的对比图;
图4是本申请一种蓝牙音频啸叫检测抑制方法的一个具体实施例的流程示意图;
图5是本申请一种蓝牙音频啸叫检测抑制装置的一个具体实施方式的示意图;
图6是本申请一种蓝牙音频啸叫检测抑制装置的一个具体实施例示意图;
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
下面结合附图对本申请的较佳实施例进行详细阐述,以使本申请的优点和特征能更易于被本领域技术人员理解,从而对本申请的保护范围做出更为清楚明确的界定。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
为了检测以便于进一步避免啸叫,现有技术中,可以在音频处理的路径上插入一个模块,譬如在音频编码器之前或音频解码器之后插入,用来检测啸叫的产生进而避免啸叫。现有方案中基于频域的方法检测较为准确使用广泛,但其需要完成时频变换,再基于频域得到的特征来检测啸叫,运算量较大,运算复杂度特别高。
本申请通过在蓝牙音频的发射路径上,利用音频编码器或者解码器在编解码过程中得到的已有离散余弦变换谱系数,计算得到伪谱和伪谱谱熵,判断是否有啸叫产生,并对啸叫频点对应的谱系数进行衰减,算法简单,检测准确性高,抑制有效性好,较大的节省了算力。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
图2示出了本申请一种蓝牙音频啸叫检测抑制方法的一个具体实施方式。
在图2示出的本申请蓝牙音频啸叫检测抑制方法包括:过程S201,利用蓝牙音频编码和/或解码过程中经离散余弦变换得到的当前帧音频谱系数中每一个谱系数,及与其相邻的两个谱系数,计算得到每一个谱系数相应的伪谱系数;过程S202,利用当前帧音频谱系数相应的所有伪谱系数,计算子带能量熵得到当前帧音频谱系数的伪谱谱熵;以及,过程S203,利用当前帧音频谱系数的伪谱谱熵以及预设的谱熵门限值判断当前帧音频谱系数是否包含啸叫。
能够在蓝牙音频编码或者解码过程中,利用中间的音频谱系数计算相应的伪谱系数进一步计算伪谱谱熵,并利用伪谱谱熵判断每一帧音频谱系数是否包含啸叫,能够在保证检测准确性高的前提下,避免现有技术中检测啸叫所需的时频变换,节约运算量,减少系统时延。
图2的过程S201表示的利用蓝牙音频编码和/或解码过程中经离散余弦变换得到的当前帧音频谱系数中每一个谱系数,及与其相邻的两个谱系数,计算得到每一个谱系数相应的伪谱系数的过程,能够便于利用伪谱系数计算伪谱谱熵,进而便于根据伪谱谱熵检测判断啸叫。
通常在发生啸叫时会产生正弦波震荡,所以当音频帧中包含正弦波时,需要估算此正弦波对应的音频谱系数的频率。现有技术利用离散傅里叶变换得到的谱系数,其谱系数与正弦波的频率有较为准确的对应关系,所以通常通过幅度谱可以较为准确的确定啸叫的频点,而离散余弦变换得到的谱系数,其谱系数与正弦波的频率有误差,所以在用于啸叫的检测前需要预处理,即伪谱计算,得到的伪谱系数与正弦波的频率具有对应关系。
在本申请的一个具体实施例中,上述与每一个谱系数相邻的两个谱系数为每一个谱系数的后两个谱系数。
在本申请的一个具体实施例中,上述与每一个谱系数相邻的两个谱系数为每一个谱系数的前一个谱系数和后一谱系数;其中,对于第一谱系数,其前一谱系数值取0。
在本申请的一个具体实例中,上述伪谱计算的过程具体为: 在进行LC3编码的过程中如图4所示,利用经低延迟改进型离散余弦变换得到的音频谱系数:
Figure 558560DEST_PATH_IMAGE001
Figure 475700DEST_PATH_IMAGE002
其中
Figure 442388DEST_PATH_IMAGE003
是输入的时域音频pcm信号,X(k)是经过离散余弦变换的频域谱系数。
计算当前帧音频谱系数中每一个谱系数相应的伪谱系数。
Figure 509701DEST_PATH_IMAGE004
在本申请的一个具体实施例中,在进行LC3解码的过程中,利用经算术与残差解码、噪声填充、全局增益、和时域噪声整形步骤之后得到的音频谱系数进行伪谱计算。
在本申请的一个具体实施例中,在利用AAC蓝牙音频设备进行编解码时,利用离散余弦变换得到的音频谱系数进行伪谱计算。
图2的过程S202表示的利用当前帧音频谱系数相应的所有伪谱系数,计算子带能量熵得到当前帧音频谱系数的伪谱谱熵,能够便于根据当前帧音频谱系数的谱熵以及预设的谱熵门限值判断音频谱系数中是否包含啸叫。
利用伪谱谱熵判断语音频谱系数中是否包含啸叫,相比原音频谱系数更具优势。
含有同一段语音音频信号,当音频信号中包含啸叫时,伪谱熵的变化相比普通熵(利用原频谱系数计算的音频帧的能量熵)的变化更加明显,如图3所示。图3中最上方是原始的PCM波形;其次是对应的频域语谱图,其中下部区域的横线表示的是啸叫能量,颜色越亮表示能量越强;频域语谱图下方是对应的伪谱熵示意图;最下方的是普通熵示意图。图3中椭圆表示的区域左侧是啸叫刚开始发生,能量还不是很强,椭圆区域从左往右啸叫的能量越来越强。可以看出,在伪谱熵示意图中,当啸叫能量较强时(椭圆表示的区域),伪谱谱熵都是非常小的值,很容易区分出啸叫能量较大的区域;而在普通熵示意图中,当啸叫能量较强时,普通熵较大,不易区分出啸叫能量较大区域。
在本申请的一个具体实施例中,上述用当前帧音频谱系数相应的所有伪谱系数,计算子带能量熵得到当前帧音频谱系数的伪谱谱熵具体为:
a)子带划分:将每一帧音频信号得到的全部谱系数划分为均匀的子带,举例来说,当配置为采样率16kHz、帧长10ms时,每帧音频的离散余弦变换输出160个谱系数,可以划分为16个子带,每个子带拥有10个谱系数:
i.伪谱系数为:
Figure 776603DEST_PATH_IMAGE005
ii.第1个子带的谱系数为:
Figure 536749DEST_PATH_IMAGE006
iii.第2个子带的谱系数为:
Figure 803782DEST_PATH_IMAGE007
iv.第16个子带的谱系数为:
Figure 189633DEST_PATH_IMAGE008
在具体实施过程中,也可以使用其他划分的方式,本发明并不限制,譬如可以划分为10个子带,每个子带16个谱系数,原则就是划分的子带方式计算出的谱熵,易于区分啸叫信号和普通的音频信号。
b)计算每一个子带的能量:
Figure 858512DEST_PATH_IMAGE009
c)计算子带总能量:
Figure 789559DEST_PATH_IMAGE010
d)计算每一个子带的能量概率
Figure 730839DEST_PATH_IMAGE011
For k = 1 to SUBBAND_NUM
e)计算伪谱谱熵;
Figure 467850DEST_PATH_IMAGE012
图2的过程S203表示的利用当前帧音频谱系数的伪谱谱熵以及预设的谱熵门限值判断当前帧音频谱系数是否包含啸叫过程,能够避免现有技术中,基于频域判断啸叫时,通常使用的离散傅里叶变换将时域信号转换到频域运算复杂度特别高的方法,本发明利用编码器中已有的时频变换,较大的节省了算力。
在本申请的一个具体实施例中,上述利用当前帧音频谱系数的伪谱谱熵以及预设的谱熵门限值判断当前帧音频谱系数是否包含啸叫过程进一步包括,若当前帧音频谱系数的伪谱谱熵小于预设的谱熵门限值,则将当前帧音频谱系数判断为包含啸叫,即当前帧音频谱系数对应的音频发生啸叫。若当前帧音频谱系数的伪谱谱熵不小于预设的谱熵门限值,将当前帧音频谱系数判断为不包含啸叫,如图4所示。
在本申请的一个具体实施例中,上述利用当前帧音频谱系数的伪谱谱熵以及预设的谱熵门限值判断当前帧音频谱系数是否包含啸叫过程进一步包括,利用当前帧音频谱系数的伪谱谱熵以及当前帧音频谱系数的前连续第一预定帧音频谱系数的伪谱谱熵判断当前帧音频谱系数是否包含啸叫。
在本申请的一个具体实例中,若当前帧音频谱系数的前连续第一预定帧音频谱系数的伪谱谱熵小于预设的谱熵门限值,则将当前帧音频谱系数判断为包含啸叫;若当前帧音频谱系数的前连续第一预定帧音频谱系数的伪谱谱熵不小于预设的谱熵门限值,则将当前帧音频谱系数判断为不包含啸叫。
优选的,上述预设的谱熵门限值取值0.05-1。
可选的,上述第一预定帧音频谱系数选择3-5帧音频谱系数。
在本申请的一个具体实施例中,上述利用当前帧音频谱系数的伪谱谱熵以及预设的谱熵门限值判断当前帧音频谱系数是否包含啸叫过程进一步包括,若当前帧音频谱系数的伪谱谱熵小于谱熵门限值,则利用当前帧的啸叫频点能量值以及预设的能量门限值判断当前帧音频谱系数是否包含啸叫,如图4所示,其中,当前帧的啸叫频点能量值为与所述啸叫相关的谱系数的能量值。
在本申请的一个具体实例中,上述利用当前帧音频谱系数的伪谱谱熵小于谱熵门限值,则利用当前帧的啸叫频点能量值以及预设的能量门限值判断当前帧音频谱系数是否包含啸叫的过程包括,若当前帧的啸叫频点能量值大于能量门限值,则将当前帧音频谱系数判断为包含啸叫;若当前帧的啸叫频点能量值不大于能量门限值,则将当前帧音频谱系数判断为不包含啸叫。
在本申请的一个具体实例中,当前帧的啸叫频点能量值,为当前帧音频谱系数相应的所有伪谱系数中的最大值的能量值,及与最大值相邻的两个谱系数的能量值之和。
具体的,上述当前帧的啸叫频点能量值计算过程为:
a)搜索伪谱系数中的最大值,其对应的索引是
Figure 928919DEST_PATH_IMAGE013
,所述伪谱系数是:Xpseudo(0),Xpseudo(1),……Xpseudo(159)。
b)计算啸叫频点能量值:
Figure 545714DEST_PATH_IMAGE014
上述能量门限值的取值与子带划分的方式有关,优选的,取3e6。
在本申请的一个具体实施例中,上述利用当前帧音频谱系数的伪谱谱熵小于谱熵门限值,则利用当前帧的啸叫频点能量值以及预设的能量门限值判断当前帧音频谱系数是否包含啸叫的过程包括,若啸叫频点能量值大于能量门限值,则根据当前帧音频谱系数的前连续第二预定帧音频谱系数的能量值是否持续增长判断当前帧音频谱系数是否包含啸叫;如图4所示,其中,若当前帧音频谱系数的前连续第二预定帧音频谱系数的能量值持续增长,则将当前帧音频谱系数判断为包含啸叫,否则,将当前帧音频谱系数判断为不包含啸叫。
可选的,上述第二预定帧音频谱系数选择3-5帧音频谱系数。
在本申请的一个具体实施例中,本申请的蓝牙音频啸叫检测抑制方法还包括,若当前帧音频谱系数包含啸叫,则对啸叫相关的谱系数进行衰减,如图4示出的具体实例所示。
在本申请的一个具体实例中,上述对啸叫相关的谱系数包括,啸叫频点对应的谱系数即
Figure 787339DEST_PATH_IMAGE015
,以及相邻的谱系数即
Figure 146DEST_PATH_IMAGE016
Figure 830568DEST_PATH_IMAGE017
在本申请的一个具体实例中,可以以
Figure 165734DEST_PATH_IMAGE015
为中心,进行更大范围的衰减。
在本申请的一个具体实例中,可以对啸叫相关的谱系数进行相同幅度的衰减,可选的,每次衰减3dB或更多,也可以衰减到0。
可选的,在进行衰减时,对中间的谱系数进行较大幅度的衰减,对两边的谱系数进行较小幅度的衰减。
本申请既可以用于蓝牙发射端,也可以用于蓝牙接收端,还可以用于蓝牙收发一体装置(如蓝牙收发器);在蓝牙发射端和蓝牙接收端可以单独使用,也可以同时使用;既可以用于低功耗蓝牙音频,也可以用于经典蓝牙(配合LC3);充分利用音频编解码器已有的信息,辅以少量的计算,复杂度低,与传统的频域检测与抑制相比,省略了非常消耗资源的时频转换;没有时频变换,节省了传统时频变换编解码引入的固有延时,提升了用户体验。
图5示出了本申请一种蓝牙音频啸叫检测抑制装置。
在图5示出的蓝牙音频啸叫检测抑制装置中,包括,伪谱系数计算模块501,用于利用蓝牙音频编码和/或解码过程中经离散余弦变换得到的当前帧音频谱系数中每一个谱系数,及与其相邻的两个谱系数,计算得到每一个谱系数相应的伪谱系数;伪谱谱熵计算模块502,用于利用当前帧音频谱系数相应的所有伪谱系数,计算子带能量熵得到当前帧音频谱系数的伪谱谱熵;以及,啸叫判断模块503,用于利用当前帧音频谱系数的伪谱谱熵以及预设的谱熵门限值判断当前帧音频谱系数是否包含啸叫,其中,伪谱系数与正弦波的频率具有对应关系。
能够在蓝牙音频编码或者解码过程中,利用中间的音频谱系数计算相应的伪谱系数进一步计算伪谱谱熵,并利用伪谱谱熵判断每一帧音频谱系数是否包含啸叫,能够在保证检测准确性高的前提下,避免现有技术中检测啸叫所需的时频变换,节约运算量,减少系统时延。
在本申请的一个具体实施例中,上述啸叫判断模块503能够,若当前帧音频谱系数的伪谱谱熵小于预设的谱熵门限值,则将当前帧音频谱系数判断为包含啸叫,即当前帧音频谱系数对应的音频发生啸叫。若当前帧音频谱系数的伪谱谱熵不小于预设的谱熵门限值,将当前帧音频谱系数判断为不包含啸叫。
在本申请的一个具体实施例中,上述啸叫判断模块503能够用于执行下列步骤,若当前帧音频谱系数的前连续第一预定帧音频谱系数的伪谱谱熵小于预设的谱熵门限值,则将当前帧音频谱系数判断为包含啸叫;若当前帧音频谱系数的前连续第一预定帧音频谱系数的伪谱谱熵不小于预设的谱熵门限值,则将当前帧音频谱系数判断为不包含啸叫。
在本申请的一个具体实施例中,上述啸叫判断模块503能够用于执行下列步骤,若当前帧音频谱系数的伪谱谱熵小于谱熵门限值,则利用当前帧的啸叫频点能量值以及预设的能量门限值判断当前帧音频谱系数是否包含啸叫,其中,所述当前帧的啸叫频点能量值为与所述啸叫相关的谱系数的能量值。
在本申请的一个具体实施例中,上述啸叫判断模块503能够用于执行下列步骤,若当前帧的啸叫频点能量值大于能量门限值,则将当前帧音频谱系数判断为包含啸叫;若当前帧的啸叫频点能量值不大于能量门限值,则将当前帧音频谱系数判断为不包含啸叫。
在本申请的一个具体实施例中,上述啸叫判断模块503能够用于执行下列步骤,若啸叫频点能量值大于能量门限值,则根据当前帧音频谱系数的前连续第二预定帧音频谱系数的能量值是否持续增长判断当前帧音频谱系数是否包含啸叫;其中,若当前帧音频谱系数的前连续第二预定帧音频谱系数的能量值持续增长,则将当前帧音频谱系数判断为包含啸叫,否则,将当前帧音频谱系数判断为不包含啸叫。
在本申请的一个具体实施例中,如图6的啸叫抑制模块604所示,本申请的蓝牙音频啸叫检测抑制装置还包括啸叫抑制模块604,用于若当前帧音频谱系数包含啸叫,则对啸叫相关的谱系数进行衰减。
在本申请的一个具体实施例中,上述对啸叫相关的谱系数包括,啸叫频点对应的谱系数即
Figure 832339DEST_PATH_IMAGE015
,以及相邻的谱系数即
Figure 911153DEST_PATH_IMAGE016
Figure 613659DEST_PATH_IMAGE017
;或者
Figure 385306DEST_PATH_IMAGE015
,以及相邻更多的谱系数。
在本申请的一个具体实施例中,本申请提供的蓝牙音频啸叫检测抑制装置可用于执行上述任一实施例描述的蓝牙音频啸叫检测抑制方法。
在本申请的一个具体实施例中,本申请一种蓝牙音频啸叫检测抑制装置中各功能模块可直接在硬件中、在由处理器执行的软件模块中或在两者的组合中。
软件模块可驻留在RAM存储器、快闪存储器、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可装卸盘、CD-ROM或此项技术中已知的任何其它形式的存储介质中。示范性存储介质耦合到处理器,使得处理器可从存储介质读取信息和向存储介质写入信息。
处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application Specific Integrated Circuit,简称:ASIC)、现场可编程门阵列(英文:Field Programmable Gate Array,简称:FPGA)或其它可编程逻辑装置、离散门或晶体管逻辑、离散硬件组件或其任何组合等。通用处理器可以是微处理器,但在替代方案中,处理器可以是任何常规处理器、控制器、微控制器或状态机。处理器还可实施为计算装置的组合,例如DSP与微处理器的组合、多个微处理器、结合DSP核心的一个或一个以上微处理器或任何其它此类配置。在替代方案中,存储介质可与处理器成一体式。处理器和存储介质可驻留在ASIC中。ASIC可驻留在用户终端中。在替代方案中,处理器和存储介质可作为离散组件驻留在用户终端中。
本申请的一个具体实施方式中,一种蓝牙设备,包括编码器以及解码器编码器和/或解码器设置有上述任一实施例描述的蓝牙音频啸叫检测抑制装置。
在本申请的另一个具体实施方式中,一种计算机可读存储介质,其存储有计算机指令,计算机指令被操作以执行上述方案中的蓝牙音频啸叫检测抑制方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上仅为本申请的实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (10)

1.一种蓝牙音频啸叫检测抑制方法,其特征在于,包括,
利用蓝牙音频编码和/或解码过程中经离散余弦变换得到的当前帧音频谱系数中每一个谱系数,以及与其相邻的两个谱系数,计算得到所述每一个谱系数相应的伪谱系数;
利用所述当前帧音频谱系数相应的所有所述伪谱系数,计算子带能量熵得到所述当前帧音频谱系数的伪谱谱熵;以及
利用所述当前帧音频谱系数的所述伪谱谱熵以及预设的谱熵门限值判断所述当前帧音频谱系数是否包含啸叫;
其中,所述伪谱系数与正弦波的频率具有对应关系,所述与其相邻的两个谱系数包括其前一个谱系数和其后一个谱系数。
2.根据权利要求1所述的蓝牙音频啸叫检测抑制方法,其特征在于,所述利用所述当前帧音频谱系数的所述伪谱谱熵以及预设的谱熵门限值判断所述当前帧音频谱系数是否包含啸叫的过程进一步包括,
利用所述当前帧音频谱系数的所述伪谱谱熵以及所述当前帧音频谱系数的前连续第一预定帧音频谱系数的所述伪谱谱熵判断所述当前帧音频谱系数是否包含所述啸叫。
3.根据权利要求1所述的蓝牙音频啸叫检测抑制方法,其特征在于,所述利用所述当前帧音频谱系数的所述伪谱谱熵以及预设的谱熵门限值判断所述当前帧音频谱系数是否包含啸叫的过程,进一步包括,
若所述当前帧音频谱系数的所述伪谱谱熵不小于所述谱熵门限值,则将所述当前帧音频谱系数判断为不包含所述啸叫;
若所述当前帧音频谱系数的所述伪谱谱熵小于所述谱熵门限值,则利用当前帧的啸叫频点能量值以及预设的能量门限值判断所述当前帧音频谱系数是否包含所述啸叫;
其中,所述当前帧的啸叫频点能量值为与所述啸叫相关的谱系数的能量值。
4.根据权利要求2所述的蓝牙音频啸叫检测抑制方法,其特征在于,所述利用当前帧的啸叫频点能量值以及预设的能量门限值判断所述当前帧音频谱系数是否包含所述啸叫的过程包括,
若所述当前帧的啸叫频点能量值不大于所述能量门限值,则将所述当前帧音频谱系数判断为不包含所述啸叫;
若所述啸叫频点能量值大于所述能量门限值,则根据所述当前帧音频谱系数的前连续第二预定帧音频谱系数的能量值是否持续增长判断所述当前帧音频谱系数是否包含所述啸叫;
其中,若所述当前帧音频谱系数的前连续第二预定帧音频谱系数的能量值持续增长,则将所述当前帧音频谱系数判断为包含所述啸叫,否则,将所述当前帧音频谱系数判断为不包含啸叫。
5.根据权利要求3所述的蓝牙音频啸叫检测抑制方法,其特征在于,
所述当前帧的啸叫频点能量值,为所述当前帧音频谱系数相应的所有所述伪谱系数中的最大值的能量值,及与所述最大值相邻的两个谱系数的能量值之和。
6.根据权利要求1所述蓝牙音频啸叫检测抑制方法,其特征在于,还包括,
若所述当前帧音频谱系数包含所述啸叫,则对所述啸叫相关的谱系数进行衰减。
7.一种蓝牙音频啸叫检测抑制装置,其特征在于,包括,
伪谱系数计算模块,用于利用蓝牙音频编码和/或解码过程中经离散余弦变换得到的当前帧音频谱系数中每一个谱系数,及与其相邻的两个谱系数,计算得到所述每一个谱系数相应的伪谱系数;
伪谱谱熵计算模块,用于利用所述当前帧音频谱系数相应的所有所述伪谱系数,计算子带能量熵得到所述当前帧音频谱系数的伪谱谱熵;以及
啸叫判断模块,用于利用所述当前帧音频谱系数的所述伪谱谱熵以及预设的谱熵门限值判断所述当前帧音频谱系数是否包含啸叫;
所述伪谱系数与正弦波的频率具有对应关系,所述与其相邻的两个谱系数包括其前一个谱系数和其后一个谱系数。
8.根据权利要求7所述的蓝牙音频啸叫检测抑制装置,其特征在于,还包括,
啸叫抑制模块,用于若所述当前帧音频谱系数包含所述啸叫,则对所述啸叫相关的谱系数进行衰减。
9.一种蓝牙设备,包括编码器以及解码器,其特征在于,
所述编码器和/或所述解码器设置有如权利要求7所述的蓝牙音频啸叫检测抑制装置。
10.一种计算机可读存储介质,其存储计算机指令,其特征在于,所述计算机指令被操作以执行权利要求1-6中任一项所述的蓝牙音频啸叫检测抑制方法。
CN202111296702.5A 2021-11-04 2021-11-04 一种蓝牙音频啸叫检测抑制方法、装置、介质及蓝牙设备 Active CN113724725B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111296702.5A CN113724725B (zh) 2021-11-04 2021-11-04 一种蓝牙音频啸叫检测抑制方法、装置、介质及蓝牙设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111296702.5A CN113724725B (zh) 2021-11-04 2021-11-04 一种蓝牙音频啸叫检测抑制方法、装置、介质及蓝牙设备

Publications (2)

Publication Number Publication Date
CN113724725A CN113724725A (zh) 2021-11-30
CN113724725B true CN113724725B (zh) 2022-01-18

Family

ID=78686667

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111296702.5A Active CN113724725B (zh) 2021-11-04 2021-11-04 一种蓝牙音频啸叫检测抑制方法、装置、介质及蓝牙设备

Country Status (1)

Country Link
CN (1) CN113724725B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113870885B (zh) * 2021-12-02 2022-02-22 北京百瑞互联技术有限公司 蓝牙音频啸叫检测和抑制方法、装置、介质及设备
CN113905310B (zh) * 2021-12-09 2022-03-01 北京百瑞互联技术有限公司 一种蓝牙音频的啸叫检测和抑制方法、装置及介质
CN113921023B (zh) * 2021-12-14 2022-04-08 北京百瑞互联技术有限公司 一种蓝牙音频啸叫抑制方法、装置、介质及蓝牙设备
CN114067814B (zh) * 2022-01-18 2022-04-12 北京百瑞互联技术有限公司 基于蓝牙音频接收器的啸叫检测和抑制方法及装置
CN114420148B (zh) * 2022-03-30 2022-06-14 北京百瑞互联技术有限公司 啸叫检测和抑制方法、装置、介质及设备
CN114582371B (zh) * 2022-04-29 2022-07-08 北京百瑞互联技术有限公司 基于谱平坦度的啸叫检测及抑制方法、系统、介质及设备
CN114582374B (zh) * 2022-04-29 2022-07-05 北京百瑞互联技术有限公司 一种双音多频检测方法、系统、介质及设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1465044A (zh) * 2001-06-15 2003-12-31 索尼公司 声信号编码方法和设备、解码方法和设备及记录介质
WO2011125430A1 (ja) * 2010-03-31 2011-10-13 ソニー株式会社 復号装置および復号方法、符号化装置および符号化方法、並びにプログラム
CN103886863A (zh) * 2012-12-20 2014-06-25 杜比实验室特许公司 音频处理设备及音频处理方法
CN105516876A (zh) * 2015-12-09 2016-04-20 天津大学 一种基于谱熵的啸叫检测方法
CN107257528A (zh) * 2017-06-14 2017-10-17 山东浪潮云服务信息科技有限公司 一种基于加权谱熵的啸叫检测方法
CN112116924A (zh) * 2019-06-21 2020-12-22 株式会社日立制作所 异常音检测系统、伪音生成系统及伪音生成方法
CN112272338A (zh) * 2020-10-28 2021-01-26 重庆百瑞互联电子技术有限公司 一种无线麦克风设备及k歌方法
CN112992160A (zh) * 2021-05-08 2021-06-18 北京百瑞互联技术有限公司 一种音频错误隐藏方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070084002A (ko) * 2004-11-05 2007-08-24 마츠시타 덴끼 산교 가부시키가이샤 스케일러블 복호화 장치 및 스케일러블 부호화 장치
CN107645696B (zh) * 2016-07-20 2019-04-19 腾讯科技(深圳)有限公司 一种啸叫检测方法和装置
EP3358857B1 (en) * 2016-11-04 2020-04-15 Dolby Laboratories Licensing Corporation Intrinsically safe audio system management for conference rooms
CN113766073B (zh) * 2017-09-29 2024-04-16 杜比实验室特许公司 会议系统中的啸叫检测
CN111402911B (zh) * 2019-12-23 2023-01-31 佛山慧明电子科技有限公司 一种啸叫检测与抑制方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1465044A (zh) * 2001-06-15 2003-12-31 索尼公司 声信号编码方法和设备、解码方法和设备及记录介质
WO2011125430A1 (ja) * 2010-03-31 2011-10-13 ソニー株式会社 復号装置および復号方法、符号化装置および符号化方法、並びにプログラム
CN103886863A (zh) * 2012-12-20 2014-06-25 杜比实验室特许公司 音频处理设备及音频处理方法
CN105516876A (zh) * 2015-12-09 2016-04-20 天津大学 一种基于谱熵的啸叫检测方法
CN107257528A (zh) * 2017-06-14 2017-10-17 山东浪潮云服务信息科技有限公司 一种基于加权谱熵的啸叫检测方法
CN112116924A (zh) * 2019-06-21 2020-12-22 株式会社日立制作所 异常音检测系统、伪音生成系统及伪音生成方法
CN112272338A (zh) * 2020-10-28 2021-01-26 重庆百瑞互联电子技术有限公司 一种无线麦克风设备及k歌方法
CN112992160A (zh) * 2021-05-08 2021-06-18 北京百瑞互联技术有限公司 一种音频错误隐藏方法及装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Assessment of Upwind/Symmetric WENO Schemes for Direct Numerical Simulation of Screech Tone in Supersonic;Li, H;《Journal of Scientific Computing》;20210210;1-39 *
Identification of vehicle suspension shock absorber squeak and rattle noise based on wavelet packet transforms and a genetic algorithm-support vector machine;Huang, H. B;《Applied Acoustics》;20161231;137-148 *
基于 EEMD-Fast ICA-STFT 的车用起动电机噪声源识别;龚承启;《噪声与振动控制》;20171031;92-96 *
基于预估-反馈联合处理的射频噪声干扰抑制算法;王国宏;《航空学报》;20171220;192-203 *

Also Published As

Publication number Publication date
CN113724725A (zh) 2021-11-30

Similar Documents

Publication Publication Date Title
CN113724725B (zh) 一种蓝牙音频啸叫检测抑制方法、装置、介质及蓝牙设备
US11289113B2 (en) Linear prediction residual energy tilt-based audio signal classification method and apparatus
US11538484B2 (en) Inter-channel encoding and decoding of multiple high-band audio signals
CN103117067B (zh) 一种低信噪比下语音端点检测方法
US9520144B2 (en) Determining a harmonicity measure for voice processing
US9741350B2 (en) Systems and methods of performing gain control
CN113870885B (zh) 蓝牙音频啸叫检测和抑制方法、装置、介质及设备
US20140019125A1 (en) Low band bandwidth extended
CN103295582A (zh) 噪声抑制方法及其系统
CN113921023B (zh) 一种蓝牙音频啸叫抑制方法、装置、介质及蓝牙设备
CN113823277A (zh) 基于深度学习的关键词识别方法、系统、介质及设备
CN112509556B (zh) 一种语音唤醒方法及装置
CN114582371B (zh) 基于谱平坦度的啸叫检测及抑制方法、系统、介质及设备
US10950251B2 (en) Coding of harmonic signals in transform-based audio codecs
Vicente-Peña et al. Band-pass filtering of the time sequences of spectral parameters for robust wireless speech recognition
CN114566174B (zh) 一种优化语音编码的方法、装置、系统、介质及设备
CN114067814B (zh) 基于蓝牙音频接收器的啸叫检测和抑制方法及装置
CN113905310B (zh) 一种蓝牙音频的啸叫检测和抑制方法、装置及介质
CN116884423A (zh) 混响检测与抑制方法、系统、介质及设备
CN116741201A (zh) 音频接收端的啸叫检测方法、系统、解码方法及解码器
CN115083429A (zh) 语音降噪的模型训练方法、语音降噪方法、装置及介质
CN113205826A (zh) 一种lc3音频噪声消除方法、装置及存储介质
CN116805999A (zh) 音频发射端的啸叫检测方法、系统、编码方法及编码器
Liang et al. An lp spectrum modification method for noisy speech based on linear extrapolation
CN102968997A (zh) 用于宽带语音解码中噪声增强后处理的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: A1009, floor 9, block a, No. 9, Shangdi Third Street, Haidian District, Beijing 100085

Patentee after: Beijing Bairui Internet Technology Co.,Ltd.

Address before: A1009, floor 9, block a, No. 9, Shangdi Third Street, Haidian District, Beijing 100085

Patentee before: BARROT WIRELESS Co.,Ltd.