CN113205826B - 一种lc3音频噪声消除方法、装置及存储介质 - Google Patents

一种lc3音频噪声消除方法、装置及存储介质 Download PDF

Info

Publication number
CN113205826B
CN113205826B CN202110513969.9A CN202110513969A CN113205826B CN 113205826 B CN113205826 B CN 113205826B CN 202110513969 A CN202110513969 A CN 202110513969A CN 113205826 B CN113205826 B CN 113205826B
Authority
CN
China
Prior art keywords
current frame
audio
noise
entropy
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110513969.9A
Other languages
English (en)
Other versions
CN113205826A (zh
Inventor
李强
王尧
叶东翔
朱勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Barrot Wireless Co Ltd
Original Assignee
Barrot Wireless Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Barrot Wireless Co Ltd filed Critical Barrot Wireless Co Ltd
Priority to CN202110513969.9A priority Critical patent/CN113205826B/zh
Publication of CN113205826A publication Critical patent/CN113205826A/zh
Application granted granted Critical
Publication of CN113205826B publication Critical patent/CN113205826B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Abstract

本发明公开了一种LC3音频噪声消除方法、装置及存储介质,属于音频编解码技术领域。本发明主要包括,根据LC3音频编码和/或解码过程中的当前帧音频谱系数的能量熵判断当前帧否含有冲击噪声;若当前帧含有冲击噪声,则对当前帧进行噪声消除后,进行标准LC3编码过程和/或标准LC3解码过程,若当前帧不含有冲击噪声,则对当前帧进行标准LC3编码过程和/或标准LC3解码过程。本发明通过在编码或解码过程中,利用已有谱系数对LC3音频的冲击噪声进行检测,并进行消除,不仅减少冲击噪声消除的复杂度,而且节省了存储空间,还提高了冲击噪声的消除精度。

Description

一种LC3音频噪声消除方法、装置及存储介质
技术领域
本发明涉及音频编解码技术领域,尤其涉及一种LC3音频噪声消除方法、装置及存储介质。
背景技术
LC3蓝牙技术主要面向低功耗蓝牙,也可以用于经典蓝牙,其具有较低延迟、较高音质和编码增益以及在蓝牙领域无专利费得优点,受到广大厂商的关注。在音频媒体中,冲击噪声很常见,这种噪声通常被称为click noise(喀哒声),如图1所示。有很多原因导致冲击噪声,譬如磁带或CD盘片的表面有划伤,这种音频即使转录成数字PCM或者某种音频格式,如mp3、AAC等,噪声仍然存在。
传统的检测与消除click noise的方法主要基于时域处理,譬如中值滤波和基于自回归模型的方法等。这些方法虽然有效,但它们对于参数的设置比较依赖于经验,而且算法复杂度较高,实时性差,一般应用于非实时系统中。在一个包含LC3编码或解码的系统中如果要实现消噪功能,需在编码前或解码后进行噪声消除,结构虽然简单,其缺点也很明显,噪声消除的过程增加了系统的延迟,并且其复杂度对于整个系统的算力提出了较高的需求,不符合LC3以较低的复杂度实现较高的音质的初衷。
发明内容
针对现有技术存在的问题,本申请主要提供一种LC3音频噪声消除方法、装置及存储介质,通过在频域对LC3音频的冲击噪声进行检测和消除,减少冲击噪声检测与消除的复杂度,节省了存储空间并且提高了消除冲击噪声的精度。
为了实现上述目的,本申请采用的一个技术方案是:提供一种LC3音频噪声消除方法,其包括:
根据LC3音频编码和/或解码过程中的当前帧音频谱系数的能量熵,判断当前帧是否含有冲击噪声;若当前帧含有冲击噪声,则对当前帧进行噪声消除后,进行标准LC3编码过程和/或标准LC3解码过程,若当前帧不含有冲击噪声,则对当前帧进行标准LC3编码过程和/或标准LC3解码过程。
本申请采用的另一个技术方案是:提供一种LC3音频噪声消除装置,其包括:
噪声检测模块,用于根据LC3音频编码或者和/或解码过程中的当前帧音频谱系数的能量熵判断当前帧是否含有冲击噪声;噪声消除模块,用于若当前帧含有冲击噪声,则对当前帧进行噪声消除后,进行标准LC3编码过程或者和/或标准LC3解码过程;若当前帧不含有冲击噪声,则对当前帧进行标准LC3编码过程或者和/或标准LC3解码过程。
本申请采用的另一个技术方案是:提供一种计算机可读存储介质,其存储有计算机指令,该计算机指令被操作以执行第一种方案中的LC3音频噪声检测与消除方法。
本申请的技术方案可以达到的有益效果是:提供一种LC3音频噪声消除方法、装置及存储介质,通过在编码和/或解码过程中,利用已有谱系数对LC3音频的冲击噪声进行检测,并进行消除,不仅减少冲击噪声检测与消除的复杂度,而且节省了存储空间,还提高了冲击噪声的消除精度。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是带冲击噪声的音频示意图;
图2是现有技术中增加噪声消除模块进行冲击噪声消除过程示意图;
图 3是本申请一种LC3音频噪声消除方法的一个具体实施方式的流程示意图;
图4是本申请一种LC3音频噪声消除方法的一个具体实施例流程示意图;
图5是本申请一种LC3音频噪声消除方法的一个具体实施例的中值滤波示意图;
图6是本申请一种LC3音频噪声消除装置的一个具体实施方式示意图;
图7是本申请一种LC3音频噪声消除装置的一个具体实施例示意图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
下面结合附图对本申请的较佳实施例进行详细阐述,以使本申请的优点和特征能更易于被本领域技术人员理解,从而对本申请的保护范围做出更为清楚明确的界定。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
传统的消除click noise的方法主要基于时域处理,譬如中值滤波和基于自回归模型的方法等。比如在一个包含LC3编码或解码的系统中如果要实现消噪功能,需在编码前或解码后加上噪声消除模块进行噪声消除,如图2所示,结构虽然简单,其缺点也很明显,噪声消除的过程增加了系统的延迟,并且其复杂度对于整个系统的算力提出了较高的需求,不符合LC3以较低的复杂度实现较高的音质的初衷。
本发明基于LC3编码器和LC3解码器检测并消除click noise,充分利用LC3中已有的模块,在编码端和/或解码端利用LC3已有的谱系数来检测click noise,与时域检测方法相比,复杂度低,精度更高,并且节省了存储空间。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
图3示出了本申请一种LC3音频噪声消除方法的一个具体实施方式。
在图3示出的音频噪声消除方法主要包括过程S301,根据LC3音频编码和/或解码过程中的当前帧音频谱系数的能量熵判断当前帧是否含有冲击噪声,以及过程S302若所述当前帧含有所述冲击噪声,则对所述当前帧进行噪声消除后,进行标准LC3编码过程和/或标准LC3解码过程;若所述当前帧不含有所述冲击噪声,则对所述当前帧进行标准LC3编码过程和/或标准LC3解码过程。
本申请通过在频域利用已有谱系数对LC3音频的冲击噪声进行检测,并进行消除,不仅减少冲击噪声消除的复杂度,而且节省了存储空间,还提高了冲击噪声的消除精度。
过程S301表示的根据LC3音频编码和/或解码过程中的当前帧音频谱系数的能量熵判断当前帧是否含有冲击噪声的过程,能够充分利用LC3中已有的模块,在编码端和/或解码端利用LC3已有的谱系数来检测冲击噪声以便于后续进一步进行冲击噪声的消除。
在本申请的一个具体实施例中,上述LC3音频编码过程中的当前帧音频谱系数包括,LC3音频编码至完成低延迟改进型离散余弦变换之后,变换域噪声整形之前的当前帧音频谱系数。
LC3编码器在进行音频编码的过程中,通过低延迟改进型离散余弦变换步骤将音频PCM从时域转换到频域,并在这一步骤进行了编码过程中当前帧频谱数据能量的计算,根据此时的频谱数据能量计算检测冲击噪声并进一步消除,能够大大节约冲击噪声消除过程产生运算量。
在本申请的一个具体实施例中,上述LC3音频解码过程中的当前帧音频谱系数包括,LC3音频解码至完成变换域噪声整形解码之后,包括算术与残差解码、噪声填充、全局增益、时域噪声整形解码和变换域噪声整形解码步骤,低延迟改进型离散余弦反变换之前的当前帧音频谱系数。
LC3解码器在进行音频解码的过程中,通过对低延迟改进型离散余弦变换步骤之前的频谱系数,检测并消除噪声,能够大大节约能够大大节约冲击噪声消除过程产生运算量。
在本申请的一个具体实施例中,上述根据LC3音频编码和/或解码过程中的当前帧音频谱系数的能量熵判断当前帧是否含有冲击噪声的过程包括,根据当前帧音频谱系数的高频段子带能量对当前帧中是否含有冲击噪声进行判断。
基于语音和音乐的特性,能量主要集中的低频段和中频段,而对于包含clicknoise的音频数据,其能量分布在所有的频段,即低频段、中频段和高频段,对音频帧进行简单分类:
第一种:类静音,此时所有频段的子带能量都接近0或者等于0,为了便于描述,类静音主要包含静音信号(即输入音频数据帧全部数据为0),和虽然不是静音信号但是音频数据的幅值(频域或时域)都很小,人耳一般听不见。
第二种:类静音 + click noise,此时所有频段的子带能量分布比较均匀;
第三种:语音或音乐,此时能量主要集中在低频段和中频段,高频段也可能包含少许的能量。
第四种:语音或音乐 + click noise此时,低频段和中频段的能量是语音/音乐和click noise的和,而高频段主要是click noise的能量。
本实施例选择根据高频段子带能量进行冲击噪声的检测判断,能够有效避免在低频段、中频段的语音或音乐能量的干扰。
在本申请的一个具体实例中,LC3音频编解码器的采样率为48kHz,帧长为10ms,将其频谱系数根据频率进行划分:低频段(0~5kHz)、中频段(5kHz ~ 10kHz)和高频段(10kHz~ 20kHz),根据高频段(10kHz ~ 20kHz)子带能量对当前帧频谱系数中是否含有冲击噪声进行判断。
对于其他采样率可以采用类似的划分策略,也可以取得类似的效果。
优选的,将高频段(10kHz ~ 20kHz)进一步分成200个子频带,则每个子频带的能量为:
Figure 612401DEST_PATH_IMAGE001
在本申请的其他实施例中,为了节省计算量,也可以将上述200个子频带划分成其他数量的子频带,譬如100个、50个、250个等,只要每个子频带包含的谱系数数量均匀即可。
在本申请的一个具体实施例中,上述根据LC3音频编码和/或解码过程中的当前帧音频谱系数的能量熵判断当前帧是否含有冲击噪声的过程包括,计算当前帧音频谱系数的高频能量熵和高频谱熵能量积,并根据当前帧音频谱系数的高频能量熵和高频谱熵能量积判断当前帧是否含有冲击噪声。
在本申请的一个具体实施例中,上述根据当前帧音频谱系数的高频能量熵和高频谱熵能量积判断当前帧是否含有冲击噪声的过程包括,根据当前帧音频谱系数的高频能量熵以及预设的高频能量熵门限值,初步判断当前帧是否含有冲击噪声,若初步判断显示前帧音频谱系数含有冲击噪声,则根据当前帧音频谱系数的高频谱熵能量积以及预设的高频谱熵能量积门限值进一步判断当前帧是否含有冲击噪声,若进一步判断结果显示当前帧含有冲击噪声,则对当前帧进行噪声消除后,进行标准LC3编码过程和/或标准LC3解码过程。
在本申请的一个具体实施例中,上述根据当前帧音频谱系数的高频能量熵以及预设的高频能量熵门限值,初步判断当前帧是否含有冲击噪声的过程包括,对当前帧音频谱系数的高频能量熵以及预设的高频能量熵门限值进行比较,若当前帧音频谱系数的高频能量熵大于预设的高频能量熵门限值,则将当前帧初步判断为含有冲击噪声。
在本申请的一个具体实施例中,上述根据当前帧音频谱系数的高频谱熵能量积以及预设的高频谱熵能量积门限值进一步判断当前帧是否含有冲击噪声的过程包括,对当前帧音频谱系数的高频谱熵能量积以及预设的高频谱熵能量积门限值进行比较,若当前帧音频谱系数的高频谱熵能量积大于预设的高频谱熵能量积门限值,则将当前帧进一步判断为含有冲击噪声。
在本申请的一个具体实例中,上述根据当前帧音频谱系数的高频能量熵以及预设的高频能量熵门限值,初步判断当前帧是否含有冲击噪声的过程包括,
以10ms帧长、48kHz采样率为例,其原理也适合7.5ms帧长和其他采样率。
1)根据LC3标准对输入的10ms帧长的音频数据完成LD-MDCT计算(即低延迟改进型离散余弦变换);
当前帧的音频数据
Figure 7611DEST_PATH_IMAGE002
,n = 0,1,2,…,
Figure 759666DEST_PATH_IMAGE003
Figure 769079DEST_PATH_IMAGE004
上述公式中,基于LC3标准规范,
Figure 973795DEST_PATH_IMAGE003
是400,Z是200,
Figure 172696DEST_PATH_IMAGE005
是低延迟MDCT窗,X(k)是当前帧时域音频数据
Figure 28525DEST_PATH_IMAGE002
对应的频域谱系数。
2)计算高频子带总能量
Figure 21889DEST_PATH_IMAGE006
3)计算高频子带能量概率
subband_energy_probability(k)=subband_energy(k) / subband_energy_total
4)计算高频能量熵
Figure 713901DEST_PATH_IMAGE007
5)初步判断当前帧是否含有click noise:
如果subband_energy_entropy >预设的高频能量熵门限值,例如 1.9,则说明当前帧可能含有click noise。
其中1.9是高频能量熵的门限经验值,由典型含有click noise的音频信号计算得到。
在本具体实例中,上述根据当前帧音频谱系数的高频谱熵能量积以及预设的高频谱熵能量积门限值进一步判断当前帧是否含有冲击噪声的过程包括,
6)基于上,在可能含有click noise的帧中,计算高频段的谱熵能量积:
energy_entropy_product = subband_energy_total * subband_energy_entropy
如果energy_entropy_product > 预设的高频谱熵能量积门限值,例如20,则说明当前帧含有click noise,这样可以避免上一步筛选的误差。
其中20是高频谱熵能量积门限的经验值,由典型含有click noise的音频信号计算得到。
上述高频能量熵门限值以及高频谱熵能量积门限值,在不同的配置和计算方法会有不同的取值,但其原理和方法相同,此处不再赘述。
通过计算当前帧音频谱系数的高频能量熵以及高频谱熵能量积,并与相应门限经验值进行比较,就能够准确地检测出LC3音频中含有冲击噪声的音频帧,再针对其进行消除,能够大大提高冲击噪声的消除精度。
过程S302表示的若当前帧含有冲击噪声,则对当前帧进行噪声消除后,进行标准LC3编码过程和/或标准LC3解码过程,若当前帧不含有冲击噪声,则对当前帧音频谱系数进行标准LC3编码过程和/或标准LC3解码过程,能够在利用LC3已有的谱系数来检测冲击噪声的基础上进行噪声消除,减少冲击噪声消除的复杂度,而且节省了存储空间,还提高了冲击噪声的消除精度。
在本申请的一个具体实施例中,上述对当前帧音频谱系数进行噪声消除的过程包括,如图4的过程S402所示,若所述LC3音频编码过程中的所述当前帧含有所述冲击噪声,则对当前帧的PCM信号进行中值滤波。
中值滤波广泛应用于图像和音频去噪中,此处简述如下:对于如下给定的信号,假定长度n为奇数:
x_s(0), x_s(1), x_s(2), …, x_s(n-1) ,对上述信号排序并输出中间的结果,即为中值滤波的结果,如图5所示。
在本申请的一个具体实施例中,上述对当前帧进行噪声消除的过程包括,如图4的过程S403所示,若LC3音频解码过程中的当前帧含有冲击噪声,则根据当前帧音频谱系数的上一帧音频谱系数重建当前帧音频谱系数。优选的,当所述当前帧的上一帧能够检测到有效基音时,则基于所述当前帧的上一帧的基音用基音波形重复重建得到所述当前帧补偿信号。当当前帧的上一帧未检测到有效基音时,基于所述当前帧的上一帧的音频谱系数重建得到当前帧音频谱系数。
在本申请的一个具体实施例中,上述对当前帧进行噪声消除后,进行标准LC3编码过程和/或标准LC3解码过程包括,若初步判断显示当前帧不含冲击噪声,则对当前帧音频谱系数进行标准LC3编码过程和/或标准LC3解码过程。
在本申请的一个具体实施例中,上述对当前帧进行噪声消除后,进行标准LC3编码过程和/或标准LC3解码过程包括,若进一步判断结果显示当前帧不含有冲击噪声,则对当前帧音频谱系数进行标准LC3编码过程和/或标准LC3解码过程。
图6示出了本申请一种LC3音频混合装置的一个具体实施方式。
在图6示出的音频噪声消除装置包括噪声检测模块601,用于根据LC3音频编码和/或解码过程中的当前帧音频谱系数的能量熵判断当前帧是否含有冲击噪声;以及,噪声消除模块602,用于若当前帧含有冲击噪声,则对当前帧进行噪声消除后,进行标准LC3编码过程和/或标准LC3解码过程;若当前帧不含有冲击噪声,则对当前帧进行标准LC3编码过程和/或标准LC3解码过程。
本申请装置通过在频域利用已有谱系数对LC3音频的冲击噪声进行检测,并进行消除,不仅减少冲击噪声消除的复杂度,而且节省了存储空间,还提高了冲击噪声的消除精度。
噪声检测模块601,能够充分利用LC3中已有的模块,在编码端和/或解码端利用LC3已有的谱系数来检测冲击噪声,以便于后续进一步进行冲击噪声的消除。
在本申请的一个具体实施例中,上述LC3音频编码过程中的当前帧音频谱系数的能量熵包括,LC3音频编码至完成低延迟改进型离散余弦变换之后,变换域噪声整形之前的当前帧音频谱系数。
LC3编码器在进行音频编码的过程中,通过低延迟改进型离散余弦变换步骤将音频PCM从时域转换到频域,并在这一步骤进行了编码过程中当前帧频谱数据能量的计算,根据此时的频谱数据能量计算检测冲击噪声并进一步消除,能够大大节约冲击噪声消除过程产生运算量。
在本申请的一个具体实施例中,上述LC3音频解码过程中的当前帧音频谱系数的能量熵包括,LC3音频解码至完成变换域噪声整形解码之后,低延迟改进型离散余弦反变换之前的当前帧音频谱系数。
LC3解码器在进行音频解码的过程中,通过低延迟改进型离散余弦变换步骤之前的频谱系数,检测并消除噪声,,能够大大节约能够大大节约冲击噪声消除过程产生运算量。
在本申请的一个具体实施例中,上述噪声检测模块601能够根据当前帧音频谱系数的高频段子带能量对当前帧频谱系数中是否含有冲击噪声进行判断。基于语音和音乐的特性,能量主要集中的低频段和中频段,而对于包含click noise的音频数据,其能量分布在所有的频段,即低频段、中频段和高频段本实施例选择根据高频段子带能量进行冲击噪声的检测判断,能够有效避免在低频段、中频段的语音或音乐能量的干扰。
在本申请的一个具体实施例中,上述噪声检测模块601能够计算当前帧音频谱系数的高频能量熵和高频谱熵能量积,并根据当前帧音频谱系数的高频能量熵和高频谱熵能量积判断当前帧是否含有冲击噪声。
在本申请的一个具体实施例中,上述噪声检测模块601能够根据当前帧音频谱系数的高频能量熵以及预设的高频能量熵门限值,初步判断当前帧是否含有冲击噪声,若初步判断显示前帧音频谱系数含有冲击噪声,则根据当前帧音频谱系数的高频谱熵能量积以及预设的高频谱熵能量积门限值进一步判断当前帧是否含有冲击噪声,若进一步判断结果显示当前帧含有冲击噪声,则对当前帧进行噪声消除后,进行标准LC3编码过程和/或标准LC3解码过程。
在本申请的一个具体实例中,上述根据当前帧音频谱系数的高频能量熵以及预设的高频能量熵门限值,初步判断当前帧是否含有冲击噪声的过程包括,对当前帧音频谱系数的高频能量熵以及预设的高频能量熵门限值进行比较,若当前帧音频谱系数的高频能量熵大于预设的高频能量熵门限值,则将当前帧初步判断为含有冲击噪声。
在本申请的一个具体实例中,上述根据当前帧音频谱系数的高频谱熵能量积以及预设的高频谱熵能量积门限值进一步判断当前帧是否含有冲击噪声的过程包括,对当前帧音频谱系数的高频谱熵能量积以及预设的高频谱熵能量积门限值进行比较,若当前帧音频谱系数的高频谱熵能量积大于预设的高频谱熵能量积门限值,则将当前帧进一步判断为含有冲击噪声。
噪声消除模块602,能够在利用LC3已有的谱系数来检测冲击噪声的基础上进行噪声消除,减少冲击噪声消除的复杂度,而且节省了存储空间,还提高了冲击噪声的消除精度。
在本申请的一个具体实施例中,噪声消除模块602包括滤波消噪模块如图7的模块702所示,能够在所述LC3音频编码过程中的所述当前帧含有所述冲击噪声时,对当前帧PCM信号进行中值滤波。
在本申请的一个具体实施例中,噪声消除模块602包括重建消噪模块如图7的模块702所示,能够在LC3音频解码过程中的当前帧含有冲击噪声时,根据当前音频谱系数的上一帧音频谱系数重建当前帧音频谱系数。优选的,当所述当前帧音频谱系数的上一帧能够检测到有效基音时,基于所述当前帧音频谱系数的上一帧的基音用基音波形重复重建得到当前帧补偿信号;当所述当前帧音频谱系数的上一帧未检测到有效所述基音时,基于所述当前帧的上一帧的谱系数重建得到当前帧音频谱系数。
在本申请的一个具体实施例中,噪声消除模块602能够在初步判断显示当前帧不含冲击噪声时,对当前帧进行标准LC3编码过程和/或标准LC3解码过程。
在本申请的一个具体实施例中,噪声消除模块602能够在进一步判断结果显示当前帧不含有冲击噪声时,对当前帧进行标准LC3编码过程和/或标准LC3解码过程。
在本申请的一个具体实施例中,本申请一种LC3音频噪声消除装置中各功能模块可直接在硬件中、在由处理器执行的软件模块中或在两者的组合中。
软件模块可驻留在RAM存储器、快闪存储器、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可装卸盘、CD-ROM或此项技术中已知的任何其它形式的存储介质中。示范性存储介质耦合到处理器,使得处理器可从存储介质读取信息和向存储介质写入信息。
处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application Specific Integrated Circuit,简称:ASIC)、现场可编程门阵列(英文:Field Programmable Gate Array,简称:FPGA)或其它可编程逻辑装置、离散门或晶体管逻辑、离散硬件组件或其任何组合等。通用处理器可以是微处理器,但在替代方案中,处理器可以是任何常规处理器、控制器、微控制器或状态机。处理器还可实施为计算装置的组合,例如DSP与微处理器的组合、多个微处理器、结合DSP核心的一个或一个以上微处理器或任何其它此类配置。在替代方案中,存储介质可与处理器成一体式。处理器和存储介质可驻留在ASIC中。ASIC可驻留在用户终端中。在替代方案中,处理器和存储介质可作为离散组件驻留在用户终端中。
在本申请的另一个具体实施方式中,一种计算机可读存储介质,其存储有计算机指令,计算机指令被操作以执行上述方案中的LC3音频噪声消除方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
以上仅为本申请的实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (7)

1.一种LC3音频噪声消除方法,其特征在于,包括,
根据LC3音频编码和/或解码过程中的当前帧音频谱系数的能量熵,判断当前帧是否含有冲击噪声;
若所述当前帧含有所述冲击噪声,则对所述当前帧进行噪声消除后,进行标准LC3编码过程和/或标准LC3解码过程,若所述当前帧不含有所述冲击噪声,则对所述当前帧进行标准LC3编码过程和/或标准LC3解码过程;
其中,所述根据LC3音频编码和/或解码过程中的当前帧音频谱系数的能量熵,判断所述当前帧是否含有冲击噪声的过程包括,
计算所述当前帧音频谱系数的高频能量熵和高频谱熵能量积,并根据所述当前帧音频谱系数的高频能量熵和高频谱熵能量积判断所述当前帧是否含有冲击噪声;
所述若所述当前帧含有所述冲击噪声,则对所述当前帧进行噪声消除的过程包括,
若所述LC3音频编码过程中的所述当前帧含有所述冲击噪声,则对所述当前帧进行中值滤波;和/或,
若所述LC3音频解码过程中的所述当前帧含有所述冲击噪声,则根据所述当前帧音频谱系数的上一帧音频谱系数重建所述当前帧音频谱系数。
2.根据权利要求1所述的LC3音频噪声消除方法,其特征在于,
所述LC3音频编码过程中的当前帧音频谱系数包括,所述LC3音频编码至完成低延迟改进型离散余弦变换之后,变换域噪声整形之前的所述当前帧音频谱系数;
所述LC3音频解码过程中的当前帧音频谱系数包括,所述LC3音频解码至完成变换域噪声整形解码之后,低延迟改进型离散余弦反变换之前的所述当前帧音频谱系数。
3.根据权利要求1所述的LC3音频噪声消除方法,其特征在于,
所述根据所述当前帧音频谱系数的高频能量熵和高频谱熵能量积判断所述当前帧是否含有冲击噪声的过程包括,
根据所述当前帧音频谱系数的所述高频能量熵以及预设的高频能量熵门限值,初步判断所述当前帧是否含有所述冲击噪声;
若初步判断显示所述当前帧含有所述冲击噪声,则根据所述当前帧音频谱系数的所述高频谱熵能量积以及预设的高频谱熵能量积门限值进一步判断所述当前帧是否含有所述冲击噪声。
4.根据权利要求3所述的LC3音频噪声消除方法,其特征在于,所述根据所述当前帧音频谱系数的所述高频能量熵以及预设的高频能量熵门限值,初步判断所述当前帧是否含有所述冲击噪声的过程包括,
对所述当前帧音频谱系数的所述高频能量熵以及预设的高频能量熵门限值进行比较,若所述当前帧音频谱系数的所述高频能量熵大于预设的所述高频能量熵门限值,则将当前帧初步判断为含有所述冲击噪声。
5.根据权利要求3所述的LC3音频噪声消除方法,其特征在于,所述根据所述当前帧音频谱系数的所述高频谱熵能量积以及预设的高频谱熵能量积门限值进一步判断所述当前帧是否含有所述冲击噪声的过程包括,
对所述当前帧音频谱系数的所述高频谱熵能量积以及预设的高频谱熵能量积门限值进行比较,若所述当前帧音频谱系数的所述高频谱熵能量积大于预设的所述高频谱熵能量积门限值,则将所述当前帧进一步判断为含有所述冲击噪声。
6.一种LC3音频噪声消除装置,其特征在于,包括,
噪声检测模块,用于根据LC3音频编码和/或解码过程中的当前帧音频谱系数的能量熵判断当前帧是否含有冲击噪声;
噪声消除模块,用于若所述当前帧含有所述冲击噪声,则对所述当前帧进行噪声消除后,进行标准LC3编码过程和/或标准LC3解码过程;若所述当前帧不含有所述冲击噪声,则对所述当前帧进行标准LC3编码过程和/或标准LC3解码过程;
其中,所述噪声检测模块还用于,计算所述当前帧音频谱系数的高频能量熵和高频谱熵能量积,并根据所述当前帧音频谱系数的高频能量熵和高频谱熵能量积判断所述当前帧是否含有冲击噪声;
所述噪声消除模块进一步包括:
滤波消噪模块,用于若所述LC3音频编码过程中的所述当前帧含有所述冲击噪声,则对所述当前帧的PCM信号进行中值滤波;以及,
重建消噪模块,用于若所述LC3音频解码过程中的所述当前帧含有所述冲击噪声,则根据所述当前帧音频谱系数的上一帧音频谱系数重建所述当前帧音频谱系数。
7.一种计算机可读存储介质,其存储计算机指令,其特征在于,所述计算机指令被操作以执行权利要求1-5中任一项所述的LC3音频噪声消除方法。
CN202110513969.9A 2021-05-12 2021-05-12 一种lc3音频噪声消除方法、装置及存储介质 Active CN113205826B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110513969.9A CN113205826B (zh) 2021-05-12 2021-05-12 一种lc3音频噪声消除方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110513969.9A CN113205826B (zh) 2021-05-12 2021-05-12 一种lc3音频噪声消除方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN113205826A CN113205826A (zh) 2021-08-03
CN113205826B true CN113205826B (zh) 2022-06-07

Family

ID=77031045

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110513969.9A Active CN113205826B (zh) 2021-05-12 2021-05-12 一种lc3音频噪声消除方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN113205826B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104157295A (zh) * 2014-08-22 2014-11-19 中国科学院上海高等研究院 用于检测及抑制瞬态噪声的方法
CN110689905A (zh) * 2019-09-06 2020-01-14 西安合谱声学科技有限公司 一种用于视频会议系统的语音活动检测系统
CN112233688A (zh) * 2020-09-24 2021-01-15 北京声智科技有限公司 音频降噪方法、装置、设备及介质
CN112599140A (zh) * 2020-12-23 2021-04-02 北京百瑞互联技术有限公司 一种优化语音编码速率和运算量的方法、装置及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0919672D0 (en) * 2009-11-10 2009-12-23 Skype Ltd Noise suppression
US10049678B2 (en) * 2014-10-06 2018-08-14 Synaptics Incorporated System and method for suppressing transient noise in a multichannel system

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104157295A (zh) * 2014-08-22 2014-11-19 中国科学院上海高等研究院 用于检测及抑制瞬态噪声的方法
CN110689905A (zh) * 2019-09-06 2020-01-14 西安合谱声学科技有限公司 一种用于视频会议系统的语音活动检测系统
CN112233688A (zh) * 2020-09-24 2021-01-15 北京声智科技有限公司 音频降噪方法、装置、设备及介质
CN112599140A (zh) * 2020-12-23 2021-04-02 北京百瑞互联技术有限公司 一种优化语音编码速率和运算量的方法、装置及存储介质

Also Published As

Publication number Publication date
CN113205826A (zh) 2021-08-03

Similar Documents

Publication Publication Date Title
US11694711B2 (en) Post-processing gains for signal enhancement
CN107481725B (zh) 时域帧错误隐藏设备和时域帧错误隐藏方法
CN108806703B (zh) 用于隐藏帧错误的方法和设备
KR102110212B1 (ko) 오디오 프레임 손실 은폐를 제어하기 위한 방법 및 장치
EP3852104B1 (en) Systems, methods, apparatus, and computer-readable media for dynamic bit allocation
Tan et al. Multi-band summary correlogram-based pitch detection for noisy speech
CN107112022B (zh) 用于时域数据包丢失隐藏的方法
CN101968781B (zh) 在音频编码过程中根据mdct数据进行视窗类型判定的方法
CN103117067B (zh) 一种低信噪比下语音端点检测方法
Tsilfidis et al. Automatic speech recognition performance in different room acoustic environments with and without dereverberation preprocessing
EP2606487A2 (en) Systems, methods, apparatus, and computer-readable media for noise injection
CN113724725A (zh) 一种蓝牙音频啸叫检测抑制方法、装置、介质及蓝牙设备
CN102117618A (zh) 一种消除音乐噪声的方法、装置及系统
US20140019125A1 (en) Low band bandwidth extended
CN112735449A (zh) 优化频域噪声整形的音频编码方法及装置
CN106030704B (zh) 用于对音频信号进行编码/解码的方法和设备
CN115867964A (zh) 用于对多声道输入信号内的空间背景噪声进行编码和/或解码的方法和设备
CN113205826B (zh) 一种lc3音频噪声消除方法、装置及存储介质
US20140211965A1 (en) Audio bandwidth dependent noise suppression
US10332527B2 (en) Method and apparatus for encoding and decoding audio signal
CN114566174B (zh) 一种优化语音编码的方法、装置、系统、介质及设备
US20190272837A1 (en) Coding of harmonic signals in transform-based audio codecs
CN107358959B (zh) 多声道信号的编码方法和编码器
Zhang et al. AVS-M audio: algorithm and implementation
CN113539277B (zh) 一种保护听力的蓝牙音频解码方法、装置、介质及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: A1009, floor 9, block a, No. 9, Shangdi Third Street, Haidian District, Beijing 100085

Patentee after: Beijing Bairui Internet Technology Co.,Ltd.

Address before: 7-1-1, building C, 7 / F, building 2-1, No.2, Shangdi Information Road, Haidian District, Beijing 100085

Patentee before: BARROT WIRELESS Co.,Ltd.