CN111145767B - 解码器及用于产生和处理编码频比特流的系统 - Google Patents

解码器及用于产生和处理编码频比特流的系统 Download PDF

Info

Publication number
CN111145767B
CN111145767B CN202010005379.0A CN202010005379A CN111145767B CN 111145767 B CN111145767 B CN 111145767B CN 202010005379 A CN202010005379 A CN 202010005379A CN 111145767 B CN111145767 B CN 111145767B
Authority
CN
China
Prior art keywords
signal
noise
decoder
decoded
bitstream
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010005379.0A
Other languages
English (en)
Other versions
CN111145767A (zh
Inventor
纪尧姆·福奇斯
安东尼·隆巴尔多
埃曼努埃尔·拉维利
斯特凡·多赫拉
耶雷米·勒科米特
马丁·迪茨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority to CN202010005379.0A priority Critical patent/CN111145767B/zh
Publication of CN111145767A publication Critical patent/CN111145767A/zh
Application granted granted Critical
Publication of CN111145767B publication Critical patent/CN111145767B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding

Abstract

本发明提供一种解码器及用于产生和处理编码频比特流的系统。该解码器,被配置用于对编码音频比特流进行处理,其中所述解码器包括:比特流解码器,被配置为自该比特流(BS)推导出解码音频信号(DS),其中解码音频信号(DS)包含至少一个解码帧;噪声估算装置,被配置为产生包含解码音频信号(DS)中噪声(N)的水平及/或频谱形状估算的噪声估算信号(NE);舒缓噪声产生装置,被配置为自噪声估算信号(NE)推导出舒缓噪声信号(CN);以及组合器,被配置为组合解码音频信号(DS)的解码帧以及该舒缓噪声信号(CN)以便得到音频输出信号(OS),以这种方式,所述音频输出信号(OS)中的所述解码帧包括人造噪声。

Description

解码器及用于产生和处理编码频比特流的系统
本申请为国际申请日为2013年12月19日、国际申请号为PCT/EP2013/077527、发明名称为“用以在低比特率下模型化背景噪声的舒缓噪声添加技术”的中国国家阶段申请的分案申请,该中国国家阶段申请的进入国家阶段日为2015年8月21日、申请号为201380073660.6、发明名称为“用以在低比特率下模型化背景噪声的舒缓噪声添加技术”。
技术领域
本发明涉及音频信号处理,并且,尤其是涉及带噪语音编码以及音频信号舒缓噪声添加技术。
背景技术
舒缓噪声产生器一般被使用于音频信号的不连续发送(DTX),尤其是包含语音的音频信号。在这样的模式中,音频信号首先通过声音活动检测器(VAD)被分类成有效帧以及无效帧。一VAD实例可被发现于[1]。依据VAD结果,仅有效语音频帧被编码且以标称比特率被发送。在长暂停期间,其中仅背景噪声呈现,比特率降低或零值化且背景噪声系列片段式且参数式被编码。平均比特率接着显着地减低。该噪声在无效帧期间在解码器侧端由一舒缓噪声产生器(CNG)产生。例如,语音编码器AMR-WB[2]及ITU G.718[1]具有进行于DTX模式的可能性。
低比特率语音及尤其是带噪语音编码是易于有失真。语音编码器通常以一语音产生模式为基础,其不适于背景噪声存在情况。因此,编码效率下降且被解码音频信号质量减低。此外,当处理带噪语音时,某些语音编码特性可能变动。事实上在低比特率,编码参数的粗糙量化产生一些随着时间推移的波动,当在静态背景噪声编码语音时该波动在感知上会恼人。
噪声减低是用于提高语音的可懂度及改善背景噪声存在的通讯之一习知技术。其同时也被采用于语音编码。例如,G.718编码器使用噪声减低技术推导一些编码参数,诸如语音音调。其同时也具有编码增强信号以取代原始信号之可能性。比较于被解码信号中噪声水平该语音接着更具主导地位。然而,它通常听起来更恶化或不自然,因噪声降低可能扭曲语音分量而引起除了编码失真外之可听音乐式噪声失真。
发明内容
本发明目的是提供音频信号处理的改进概念。
一方面,本发明提供了一种解码器,其被配置用于处理编码音频比特流,其中该解码器包括:
比特流解码器,被配置为自该比特流推导出解码音频信号,其中该解码音频信号包含至少一个解码帧;
噪声估算装置,被配置为产生包含解码音频信号中噪声的水平及/或频谱形状估算的噪声估算信号;
舒缓噪声产生装置,被配置为自该噪声估算信号推导出舒缓噪声信号;以及
组合器,被配置为组合该解码音频信号的解码帧以及舒缓噪声信号以得到音频输出信号。
比特流解码器可以是装置或计算机程序,其能够解码音频比特流,该音频比特流是包含音频信息数字数据流。解码处理产生一数字解码音频信号,其被馈送至A/D转换器以产生模拟音频信号,其接着被馈送至扩音器,以便产生一可听见的信号。
解码音频信号被分割成为所谓之帧,其中这些帧各包含关于某些时间区间的音频信息。这样的帧可以分类成为有效帧以及无效帧,其中一有效帧是包含音频信息的有用分量(例如,语音或音乐)的帧,而无效帧是不包含音频信息的任何有用分量的帧。无效帧通常发生在暂停期间,其中没有呈现有诸如音乐或语音的有用分量。因此,无效帧通常包含单一背景噪声。
在音频信号的不连续发送(DTX)中,仅通过解码比特流获得解码音频信号的有效帧,因在无效帧期间该编码器不在比特流之内发送音频信号。
在音频信号的非不连续发送(非DTX)中,通过解码比特流得到有效帧以及无效帧。
通过比特流解码器解码比特流得到的帧称为被解码帧。
噪声估算装置被配置为产生一噪声估算信号,噪声估算信号包含解码音频信号中噪声的水平及/或频谱形状的估算。进一步地,舒缓噪声产生装置被配置为自噪声估算信号推导出舒缓噪声信号。该噪声估算信号可以是一信号,其包含以参数形式含于解码音频信号中关于噪声特性的信息。舒缓噪声信号是人造音频信号,其对应于含于该解码音频信号的噪声。这些特点允许该舒缓噪声听起来类似于实际背景噪声而不需要关于背景噪声的任何侧信息于比特流。
组合器被配置为组合解码音频信号的解码帧以及舒缓噪声信号以便得到音频输出信号。因而,音频输出信号包括解码帧,其包含人造噪声。解码帧中的人造噪声允许屏蔽音频输出信号的失真,尤其是当该比特流以低比特率被发送时。其平缓通常察觉的浮动并且同时屏蔽主要的编码失真。
相对于先前技术,本发明应用添加人造舒缓噪声至被解码帧的原理。本发明概念可以被应用于DTX及非DTX模式两者。
本发明提供一种强化以低比特率被编码并且被发送的带噪语音质量的方法。以低比特率,带噪语音,亦即,被记录有背景噪声的语音,的编码通常不如干净语音编码一般有效率。解码合成通常易于失真。两种不同类的来源,噪声以及语音,无法通过依赖单一来源模式的编码机制有效地被编码。本发明提供在解码器侧端用以模式化并且合成背景噪声的概念并且只需要非常少或没有侧信息。这通过在解码器侧端估算背景噪声的水平及频谱形状、以及通过人造产生一舒缓噪声而实现。所产生噪声与解码音频信号组合并且允许屏蔽编码失真。
进一步地,该概念可与被应用在编码器侧的噪声减低机制结合。噪声减低提高信噪比(SNR)水平,并且改进依序音频编码的性能。解码音频信号中噪声缺失的量接着通过在解码器侧的舒缓噪声补偿。但是,其通常听起来更恶化或较不自然,因噪声减低可能扭曲音频分量并且导致除了编码失真之外的可听见音乐式噪声失真。本发明的一个论点是通过在解码器侧添加舒缓噪声而屏蔽这些不悦失真。当使用一噪声减低机制时,舒缓噪声的添加不降低SNR。此外,舒缓噪声抵消一般噪声减低技术的大部份恼人音乐式噪声。
在本发明的优选实施方式中,该解码帧是一有效帧。这特点将舒缓噪声添加原理扩展至解码有效帧。
在本发明的优选实施方式中优选实施例,被码帧是一有效帧。这特点将舒缓噪声添加原理扩展至解码无效帧。
在本发明的优选实施方式中优选实施例,该噪声估算装置包括:频谱分析装置,被配置为产生包含该解码音频信号中噪声的水平及/或频谱形状的分析信号;以及噪声估算产生装置,被配置为基于分析信号产生该噪声估算信号。
在本发明的优选实施方式中优选实施例,该舒缓噪声产生装置包括:噪声产生器,被配置为基于噪声估算信号产生频域舒缓噪声信号;以及频谱合成器,被配置为基于频域舒缓噪声信号产生该舒缓噪声信号。
在本发明的优选实施方式中优选实施例,该解码器包括:切换装置,被配置为交替地切换该解码器至第一操作模式或至第二操作模式,其中在该第一操作模式中该舒缓噪声信号被馈送至该组合器,而在该第二操作模式中该舒缓噪声信号不被馈送至该组合器。这些特点允许在不需要的情况下停止使用人造舒缓噪声。
在本发明的优选实施方式中优选实施例,该解码器包括被配置为自动地控制该切换装置的控制装置,其中该控制装置包括:噪声检测器,被配置为取决于解码音频信号的信噪比而控制该切换装置,其中在低信噪比情况之下该解码器被切换至该第一操作模式并且在高信噪比情况之下该解码器被切换至该第二操作模式。通过这些特点,舒缓噪声只在带噪语音情景中被触发,即,不是在干净语音或干净音乐情况下。为了在低信噪比情况以及高信噪比情况之间区别,对于信噪比的阈值可以被界定及被使用。
在本发明的优选实施方式中优选实施例,该控制装置包括:侧信息接收器,被配置以接收含于比特流的对应于解码音频信号的信噪比的侧信息,并且被配置以产生噪声检测信号,其中该噪声检测器取决于噪声检测信号而控制该切换装置。这些特点允许以通过产生和/或处理所接收比特流的外部装置完成的信号分析为基础而控制切换装置。该外部装置可以是产生比特流的编码器。
在本发明的优选实施方式中优选实施例,对应于该解码音频信号的信噪比的侧信息由该比特流中至少一个专用位所构成。专用位大体上是一种包含限定信息的单独的或与其他的专用位一起的位。此处,该专用位可以指示,信噪比是预定阈值之上还是之下。
在本发明的优选实施方式中优选实施例,该控制装置包括:有用信号能量估算器,被配置为确定解码音频信号的有用信号的能量、噪声能量估算器,被配置为确定该解码音频信号的噪声的能量、以及信噪比估算器,被配置为基于该有用信号的能量并且基于该噪声的能量而确定该解码音频信号的信噪比,其中该切换装置取决于利用控制装置所决定的信噪比而被切换。在此情况下,比特流中是不需侧信息。因有用信号能量通常超出解码信号的噪声能量,包含有用信号能量以及噪声能量的解码音频信号总能量,给予解码音频信号的有用信号能量的粗略估算。因此,该信噪比可以利用解码音频信号总能量除以解码信号噪声能量的近似量来计算。
在本发明的优选实施方式中优选实施例,该比特流包含有效帧以及无效帧,其中该控制装置被配置为确定在有效帧期间该解码音频信号的有用信号的能量并且确定在无效帧期间该解码音频信号的噪声的能量。藉由这点,估算信噪比的高精确度可以容易地实现。
在本发明的优选实施方式中优选实施例,该比特流包含有效帧以及无效帧,其中该解码器包括:侧信息接收器,被配置为基于该比特流中指示当前帧有效或无效的侧信息而在有效帧以及无效帧之间区别。藉由这特点,有效帧或无效帧可以分别地被辨识而不需计算力。
在本发明的优选实施方式中优选实施例,指示当前帧有效或无效的侧信息由该比特流BS中至少一个专用位所构成。
在本发明的优选实施方式中优选实施例,该控制装置被配置为基于分析信号确定该解码音频信号的有用信号的能量。在此情况中,通常为了噪声估计的目的必须计算的分析信号,因而复杂性可以被减低。
在本发明的优选实施方式中优选实施例,该控制装置被配置未基于噪声估算信号确定解码音频信号的噪声的能量。在此一实施例,通常为了生成舒缓噪声的目的必须计算的分析估计信号,可以再使用,因而复杂性可以进一步被减低。
在本发明的优选实施方式中优选实施例,该舒缓噪声产生装置被配置为基于目标舒缓噪声水平产生该舒缓噪声信号。所添加舒缓噪声水平应该受限制以维持可懂度以及质量。这可以通过调整使用指示预定目标噪声水平的目标噪声信号的舒缓噪声实现。
在本发明的优选实施方式中优选实施例,目标舒缓噪声水平信号取决于该比特流调整。一般,解码音频信号展示比原始输入信号高的信噪比,尤其是在编码失真最严重的低比特率的情况下。语音编码噪声水平的该衰减是来自来源模式实例,其预期具有语音作为输入。否则,该来源模式编码是完全不适当并且将不能够重现非语音分量的整体能量。因此,该目标舒缓噪声水平信号可以取决于比特率而被调整以粗略地补偿通过编码程序固有地引入的噪声衰减。
在本发明的优选实施方式中优选实施例,该目标舒缓噪声水平信号取决于通过被应用于该比特流的噪声减低方法所导致的噪声衰减水平而被调整。通过这些特点,可以补偿由编码器中的噪声减低模块导致的噪声衰减。
在本发明的优选实施方式中优选实施例,随机噪声w(k)的频域舒缓噪声信号的能量,对于各频带k,取决于该目标舒缓噪声水平信号,其指示一目标舒缓噪声水平gtar,而被调整为其中/>指示在频带k的解码音频信号的噪声的能量估算,如通过噪声估算产生装置所传送。藉由这些特点,输出信号的可懂度及质量可以被增强。
在本发明的优选实施方式中优选实施例,其中,该解码器包含另外的比特流解码器,其中该比特流解码器以及该另一比特流解码器是不同的类型的,其中该解码器包含切换器,该切换器被配置为馈送来自该比特流解码器的解码信号或来自该另一比特流解码器的解码信号至该噪声估算装置以及至该组合器。因当使用比特流解码器时以及当使用另一比特流解码器时舒缓噪声添加完成,当在比特流解码器及另一比特流解码器之间切换时转移失真可以最小化。例如,比特流解码器可以是代数码书激励线性预测(ACELP)比特流解码器,因而另一比特流解码器可以是基于变换编码(TCX)比特流解码器。
本发明进一步地提供一种音频信号处理编码器,其被配置为产生音频比特流,其中,该编码器包括:
比特流编码器,被配置为产生对应于音频输入信号的编码音频信号并且自该编码音频信号推导出该比特流;
信号分析器,具有信噪比估算器,所述信噪比估算器被配置为基于通过有用信号能量估算器确定的音频输入信号的有用信号的能量以及基于通过噪声能量估算器确定的该音频输入信号的噪声的能量而确定该音频输入信号的信噪比;
噪声减低装置,被配置为产生噪声减低音频信号;以及
切换装置,被配置为取决于所确定的该音频输入信号的信噪比,而馈送音频输入信号或噪声减低音频信号至该比特流编码器以用于编码相应的信号,其中该比特流编码器被配置为在比特流内发送一侧信息,该侧信息指示音频输入信号还是该噪声减低音频信号被编码。
比特流编码器可以是能够编码音频信号的装置或计算机程序,该音频信号是包含音频信息的数字数据信号。该编码处理产生数字比特流,其可在数字数据链路之上被发送至在远处位置的解码器。
音频输入信号被比特流编码器直接地编码。该比特流编码器可以是语音编码器或在语音编码器ACELP及一基于变换的音频编码器TCX之间切换的低延迟机构。该比特流编码器负责编码音频输入信号并且产生解码音频信号需要的比特流。平行地,输入信号由称为信号分析器的任意模块分析。优选实施例在优选实施方式中,该信号分析与在G.718中所使用的相同。其由频谱分析装置,随后接着噪声估算产生装置组成。原始信号和估算噪声两者的频谱输入于噪声减低模块。该噪声减低技术在频域衰减背景噪声水平。减少数量由目标衰减水平给定。增强的时间域信号(噪声减低音频信号)在频谱合成之后产生。使用该信号以导出一些特点,类似语调稳定性,其接着由VAD利用以在有效及无效帧之间区别。该分类结果可进一步地被编码器模块使用。优选实施例在优选实施例中,使用特定编码模式以处理无效帧。以这方式,解码器可自比特流导出VAD标志记而不需要专用位。
为避免无噪声情况(干净语音或干净音乐)中不必要的失真,噪声减低仅被应用于带噪语音情况且此外被忽略。在带噪及无噪声信号之间的区分通过估算噪声和有用信号(语音或音乐)的长期能量实现。该长期能量通过一阶自回归过滤输入帧能量(在有效帧期间)或使用噪声估算模块输出(在无效帧期间)被计算。可以以此方式计算信噪比估算,信噪比估算被限定为语音或音乐长期能量对于噪声长期能量的比率。如果信噪比是在预定阈值之下,则该帧被考虑为带噪语音否则其被分类为干净语音。因比特流编码器被配置为在比特流之内发送指示音频输入信号还是噪声减低音频信号被编码的侧信息,该解码器可以自动地调整目标舒缓噪声水平信号至编码器操作模式。
本发明优选实施例中,在有效帧期间,仅长期语音/音乐能量估算被更新。在无效帧期间,仅噪声能量估算被更新。
本发明进一步地提供一种系统,其包括音频信号处理解码器和音频信号处理编码器,其中该解码器是根据所要求的发明所设计的和/或该编码器是根据所要求的发明所设计。
在另一方面,本发明提供了一种解码一音频比特流的方法,其中该方法包括:
自该比特流推导出解码音频信号,其中该解码音频信号包括至少一个被解码帧;
产生包含该被解码音频信号中噪声的水平及/或频谱形状的估算的噪声估算信号;
自该噪声估算信号推导出舒缓噪声信号;以及
组合该解码音频信号的解码帧以及该舒缓噪声信号以得到音频输出信号。
本发明进一步地提供一种用以产生音频比特流的音频信号编码方法,其中该方法包括:
基于所确定的音频输入信号的有用信号的能量以及基于所确定的音频输入信号的噪声的能量确定该音频输入信号的信噪比;
产生噪声减低音频信号;
产生对应于该音频输入信号的编码音频信号,其中,取决于所确定的该音频输入信号的信噪比,该音频输入信号或该噪声减低音频信号被编码;
自该编码音频信号推导出该比特流;以及
在该比特流之内发送指示该音频输入信号还是该噪声减低音频信号被编码的侧信息。
本发明进一步地提供一种根据上述方法产生的比特流。所要求的比特流包含指示该音频输入信号还是该噪声减低音频信号被编码的侧信息。
又一方面,本发明提供一种计算机程序,当在计算机或一处理器上运行时,执行本发明的方法。
具体实施方式
优选实施例是根据本发明的解码器的第一实施方式。解码器被配置用于处理编码音频比特流BS,其中该解码包括:
比特流解码器,被配置为自该比特流BS推导出解码音频信号DS,其中该解码音频信号DS包括至少一个解码帧;
噪声估算装置,被配置为产生包含解码音频信号DS中噪声N的水平和/或频谱形状估算的噪声估算信号NE;
舒缓噪声产生装置,被配置为自该噪声估算信号NE推导出舒缓噪声信号CN;以及
组合器,被配置为组合该解码音频信号DS的解码帧以及该舒缓噪声信号CN以得到音频输出信号OS。
比特流解码器可以是能够解码一音频比特流BS的装置或计算机程序,音频比特流BS是包含音频信息的数字数据流。该解码处理产生数字解码音频信号DS,其可以被馈送至A/D转换器以产生模拟音频信号,其接着被馈送至扩音器,以便产生可听见的信号。
解码音频信号DS包括所谓的帧,其中这些帧各包含涉及某些时间的音频信息。这样的帧可以被分类成为有效帧及无效帧,其中有效帧是包含音频信息的有用分量WS同时也被称为有用信号WS(例如,语音或音乐)的帧,而无效帧是不包含音频信息的任何有用分量的帧。无效帧通常发生在暂停期间,其中没有呈现有用诸如音乐或语音的有用分量。因此,无效帧通常包含单一背景噪声N。
噪声估算装置被配置为产生包含该解码音频信号DS中噪声的水平及/或频谱形状估算的噪声估算信号NE。进一步地,舒缓噪声产生装置被配置为自该噪声估算信号NE推导出舒缓噪声信号CN。噪声估算信号NE可以是包含关于以参数形式含于解码音频信号DS中噪声N的特性信息的信号。该舒缓噪声信号CN是人造音频信号,其对应于含在解码音频信号DS中的噪声N。这些特点允许舒缓噪声CN听起来类似于实际背景噪声N而不需要比特流BS中有关于背景噪声N的任何侧信息。
组合器被配置为组合该解码音频信号DS的解码帧以及该舒缓噪声信号CN以得到音频输出信号OS。因而音频输出信号OS包含解码帧,其包含人造噪声CN。解码帧中的人造噪声CN允许屏蔽音频输出信号OS的失真,尤其是当比特流BS以低比特率被发送时。
与先前技术相比,本发明应用添加人造舒缓噪声至解码帧的原理。本发明概念可以以DTX及非DTX两种模式应用。
本发明提供一种强化以低比特率被编码并且被发送的带噪语音质量的方法。以低比特率,带噪语音,亦即,被记录有背景噪声N的语音,的编码通常不如干净语音WS编码一般有效率。解码合成通常易于失真。两种不同类的来源,噪声N以及语音WS,无法通过依赖单一来源模式的编码机构有效地被编码。本发明提供在解码器侧用以模式化并且合成背景噪声N的概念并且只需要非常少或没有侧信息。这通过在解码器侧估算背景噪声N的水平及频谱形状,以及通过人造产生一舒缓噪声CN而实现。所产生的噪声CN与被解码音频信号DS组合并且允许屏蔽在解码帧期间的编码失真。
进一步地,该概念可与被应用于编码器侧的噪声减低机构结合。噪声减低提高信噪比(SNR)水平,并且改进依序音频编码的性能。解码音频信号DS中噪声缺失的量接着通过解码器侧的舒缓噪声CN得以补偿。但是,其通常听起来更恶化或较不自然,因噪声减低可能扭曲音频分量并且导致除了编码失真之外的可听见音乐式噪声失真。本发明的一根方面是通过在解码器侧添加舒缓噪声CN而屏蔽这些不悦失真。当使用一噪声减低机构时,舒缓噪声的添加不降低SNR。此外,舒缓噪声抵消一般噪声减低技术的大部份恼人音乐式噪声。
优选实施例在本发明的优选实施方式中,解码帧是有效帧。该特点将舒缓噪声添加原理扩展至解码有效帧。
在本发明的优选实施方式中优选实施例,解码帧是有效帧。这特点将舒缓噪声添加原理扩展至解码无效帧。
在本发明的优选实施方式中优选实施例,该噪声估算装置包括:频谱分析装置,被配置为产生包含该解码音频信号DS中噪声的水平及/或频谱形状的分析信号;以及噪声估算产生装置,被配置为基于该分析信号AS产生该噪声估算信号NE。
在本发明的优选实施方式中优选实施例,该舒缓噪声产生装置包括:噪声产生器,被配置为基于噪声估算信号NE产生频域舒缓噪声信号FD;以及频谱合成器,被配置为基于频域舒缓噪声信号FD产生舒缓噪声信号CN。
在本发明的优选实施方式中优选实施例,该解码器包括:切换装置,被配置为交替地切换解码器至第一操作模式或至第二操作模式,其中在该第一操作模式中该舒缓噪声信号CN被馈送至该组合器,而在该第二操作模式中该舒缓噪声信号CN不被馈送至该组合器。这些特点允许在不需要的情况下停止使用人造舒缓噪声CN。
在本发明的优选实施方式中优选实施例,该解码器包括:控制装置,被配置以自动地控制切换装置,其中该控制装置包括:噪声检测器,被配置为取决于解码音频信号DS的信噪比而控制该切换装置,其中在低信噪比情况下,该解码器被切换至该第一操作模式并且在高信噪比情况下该解码器被切换至该第二操作模式。通过这些特点,舒缓噪声CN的使用只在带噪语音情况下被触发,亦即,不是在干净语音或干净音乐的情况下。为了在低信噪比情况以及高信噪比情况之间加以区别,可以限定及使用信噪比的阈值。
在本发明的优选实施方式中优选实施例,控制装置包括:侧信息接收器,被配置为接收包含于比特流BS内的对应于解码音频信号DS的信噪比的侧信息,并且被配置为产生噪声检测信号ND,其中噪声检测器取决于该噪声检测信号ND而切换装置。这些特点允许基于通过产生及/或处理所接收比特流BS的外部装置完成的信号分析而控制切换装置。该外部装置尤其可以是产生比特流BS的编码器。
在本发明的优选实施方式中优选实施例,对应于解码音频信号DS的信噪比的侧信息由比特流BS中至少一个专用位所构成。专用位大体上是包含限定信息的单独的或与其他的专用位一起的位。此处,该专用位指示,信噪比是在一预定阈值之上还是之下。
在本发明的优选实施方式中优选实施例,舒缓噪声产生装置被配置为基于目标舒缓噪声水平信号TNL产生该舒缓噪声信号CN。所添加舒缓噪声CN水平应该受限制以维持可懂度以及质量。这可以通过调整使用指示一预定目标噪声水平的目标噪声信号TNL的舒缓噪声CN实现。
在本发明的优选实施方式中优选实施例,该目标舒缓噪声水平信号TNL取决于比特流BS的比特率而被调整。一般,解码音频信号DS展示比原始输入信号较高的信噪比,尤其是在编码失真最严重的低比特率的情况下。该语音编码种噪声水平的衰减是来自来源模式实例,其预期使语音作为输入。否则,该来源模式编码是完全不适当并且将不能够重现非语音分量的整体能量。因此,该目标舒缓噪声水平信号TNL可以取决于比特率而被调整以粗略地补偿由编码程序固有地引入的噪声衰减。
在本发明的优选实施方式中优选实施例,该目标舒缓噪声水平信号TNL取决于由被应用于比特流BS的噪声减低方法所导致的噪声衰减水平而被调整。通过这些特点,由编码器中的噪声减低模块导致的噪声衰减可以得以补偿。
在本发明的优选实施方式中优选实施例,随机噪声w(k)的频域舒缓噪声信号(FD)的能量Ew(k),对于各频带k,取决于该目标舒缓噪声水平信号TNL,其指示一目标舒缓噪声水平gtar,而被调整为 其中/>指示在频带k的解码音频信号DS的噪声N的能量估算,如通过噪声估算产生装置所传送。通过这些特点,输出信号OS的可懂度及质量可以被增强。
根据本发明的解码器的第二实施方式。解码器的第二实施方式以第一实施方式的解码器为基础。下面说明中仅讨论和说明与第一实施方式的不同之处。
在本发明的优选实施方式中优选实施例,该控制装置包括:有用信号能量估算器,被配置为确定该被解码音频信号DS的有用信号WS的能量;噪声能量估算器,被配置为确定该被解码音频信号DS的噪声N的能量;以及信噪比估算器,被配置为基于有用信号WS的能量并且基于该噪声N的能量而确定该被解码音频信号DS的信噪比,其中该切换装置取决于由控制装置所确定的信噪比而被切换。在此情况下,比特流中不需关于信噪比的侧信息。因此,第一实施例的侧信息接收器也不是必需的。
在本发明的优选实施方式中优选实施例,该比特流BS包含有效帧以及无效帧,其中控制装置被配置为确定在有效帧期间该解码音频信号DS的有用信号WS的能量并且确定在无效帧期间该解码音频信号DS的噪声N的能量。藉由这点,估算信噪比的高精确度可以容易地实现。
在本发明的优选实施方式中优选实施例,该比特流BS包含有效帧以及无效帧,其中该解码器包括:侧信息接收器,被配置为基于比特流(BS)中指示当前帧有效或无效的侧信息而在有效帧和无效帧之间加以区别。通过该特点,有效帧或无效帧可以分别地被辨识而不需计算力。
在本发明的优选实施方式中优选实施例,侧信息接收器可以被配置为控制切换器,其交替地馈送有用信号能量估算器的输出信号OW或噪声能量估算器的输出信号ON至信噪比估算器,其中有用信号能量估算器的输出信号OW在有效帧期间被馈送至信噪比估算器并且其中噪声能量估算器的输出信号ON在无效帧期间被馈送至信噪比估算器。通过这些特点,信噪比可以以容易且精确的方式计算。
在本发明的优选实施方式中优选实施例,控制装置被配置为基于分析信号AS确定该解码音频信号的有用信号的能量。在此情况下,通常为了噪声估计的目的必须计算的分析信号AS,可被再使用,因而复杂性可以被减低。
在本发明的优选实施方式中优选实施例,该控制装置被配置围基于该噪声估算信号NE确定该解码音频信号DS的噪声N。在此一实施方式中,通常为了产生舒缓噪声的目的而必须计算的噪声估算信号NE,可被再使用,因而复杂性可以进一步被减低。
在本发明的优选实施方式中优选实施例,解码器包括进一步的比特流解码器(未在图中示出),其中比特流解码器以及另一比特流解码器是不同的类型的,其中解码器包括切换器(未被展示于图中),该切换器被配置为馈送来自比特流解码器的解码信号DS或来自该另一比特流解码器的解码信号至该噪声估算装置以及至该组合器。因当使用比特流解码器时以及当使用另一比特流解码器时舒缓噪声添加完成,当在比特流解码器及另一比特流解码器之间切换时转移失真可以最小化。例如,比特流解码器可以是代数码书激励线性预测(ACELP)比特流解码器,因而另一比特流解码器可以是一基于变换编码(TCX)比特流解码器。
本发明解码器在以上描述中舒缓噪声添加是盲目地在频域完成。为了具有类似于实际背景噪声N的舒缓噪声CN,噪声估算装置被使用于解码器以确定背景噪声的水平及频谱形状N,而不需要任何侧信息。
舒缓噪声产生装置只在带噪语音的情况下被触发,亦即,不是在干净语音或干净音乐情况下。区别可以基于编码器中进行的检测。在此情况中,该确定应该使用专用位发送。优选实施例在优选实施方式中,相比之下,噪声估算产生装置被应用,其相似于被使用于编码器中的噪声估算装置。其包含通过取决于VAD决定而分别地调适噪声N能量或有诸如语音及/或音乐的用信号WS能量的长期估算而估算长期信噪比。后者可以直接地自ACELP及TCX模式的索引而导出。实际上,当信号是无效语音/音乐帧时,亦即,仅具背景噪声的帧,TCX及ACELP可分别地以所谓的TCX-NA及ACELP-NA特定模式进行。所有的其他ACELP及TCX模式关联于有效帧。因此,可避免比特流中专用VAD位的存在。
所添加舒缓噪声水平应该受限制以维持可懂度以及质量。该舒缓噪声因此被调整以达到一预定目标噪声水平。如果gtar指示在舒缓噪声添加之后的目标噪声放大水平,对于各频率k的随机噪声w(k)的能量EW被调整为
其中指示在频带k呈现于解码音频输出的噪声能量估算,如通过噪声估算模块所传送。
一般,解码音频信号DS示出比原始输入信号高的信噪比,尤其是在其中编码甚至最严重的低比特率。语音编码中噪声水平的衰减是来自来源模式实例,其预期具有语音作为输入。否则,该来源模式编码是完全不适当并且将不能够重现非语音分量的整体能量。因此,对于使用示出编码器的本发明第一方面,目标舒缓噪声水平gtar可以取决于比特率而被调整以粗略地补偿由编码程序固有地引入的噪声衰减。
对于使用编码器的本发明的第二方面,目标舒缓噪声水平gtar,此外地,说明由编码器中噪声减低模块导致的噪声衰减。
进一步地,本文描述的舒缓噪声添加通过在所有帧上均匀地添加舒缓噪声而允许平缓一个编码型(例如)至另一个(例如,TCX)之间的转移失真。
根据先前技术的编码器,其可被使用以结合于上述的解码器。
音频输入信号IS被比特流编码器直接地编码。该比特流编码器可以是语音编码器或在语音编码器ACELP及一基于变换的音频编码器TCX之间切换的低延迟机构。该比特流编码器包括用以编码信号IS的信号编码器及用以产生在解码器产生被解码信号DS需要的比特流BS的位流产生器。平行地,输入信号IS通过称为信号分析器的任何模块分析,其包括噪声估算装置。优选实施例在优选实施方式中,该噪声估算装置与G.718中所使用的相同。其由频谱分析装置,随后接着噪声估算产生装置组成。原始信号IS的频谱SI及估算噪声的频谱NI被输入到噪声减低模块。该噪声减低模块衰减增强频域信号FS中的背景噪声水平。减少量由目标衰减水平信号TAS给定。增强的时间域信号(噪声减低音频信号)TS在频谱合成装置的频谱合成之后产生。该信号TS被使用以导出一些特点,类似语调稳定性,其接着被信号活动检测器采用以在有效及无效帧之间加以区别。该分类结果可进一步地被编码器模块使用。优选实施例在优选实施方式中,特定编码模式被用以处理无效帧。以这方式,解码器可自比特流导出信号活动标志志(VAD标志志)而不需要专用位。
根据本发明编码器的第一实施方式中的编码器以上文的编码器为基础。
第一实施方式的编码器被配置用于产生音频比特流BS,其中,编码器包括:
比特流编码器,被配置为产生对应于音频输入信号IS的编码音频信号ES并且自该编码音频信号ES推导出该比特流BS;
信号分析器,具有信噪比估算器,该信噪比估算器被配置为基于由有用信号能量估算器确定的该音频输入信号IS的有用信号WS的能量以及基于由噪声能量估算器确定的音频输入信号IS的噪声N的能量确定该音频输入信号IS的信噪比;
噪声减低装置,被配置为产生噪声减低音频信号TS;以及
切换装置,被配置为取决于所确定的该音频输入信号IS的信噪比,而馈送音频输入信号IS或噪声减低音频信号TS至比特流编码器以供用于编码相应的信号IS,TS,其中比特流编码器被配置为在该比特流BS内发送指示音频输入信号IS还是噪声减低音频信号TS被编码的侧信息NF。
比特流编码器可以是能够编码音频信号的装置或计算机程序,该音频信号是包含音频信息的数字数据信号。该编码处理产生数字比特流,其可在数字数据链路上被发送至在远处位置的解码器。
本发明一实施例的编码器部份相比于先前技术的编码器的主要差异在于,这次其编码噪声减低输出,亦即,增强信号TS。为避免无噪声情况(干净语音或干净音乐)中不必要的失真,噪声减低仅被应用于带噪语音情况且此外被旁通。在带噪及无噪声信号之间的区分通过利用有用信号能量估算器估算有用信号WS(语音或音乐)的长期能量及通过利用噪声能量估算器估算噪声N的长期能量实现。为此目的有用信号能量估算器接收通过频谱分析装置提供的频谱SI信号作为输入信号IS。进一步地,噪声能量估算器接收通过噪声估算产生装置提供的噪声估算信号NI作为输入信号IS。在有效帧期间,仅长期语音/音乐能量估算WE被更新。在无效帧期间,仅噪声能量估算NE被更新。该长期能量通过一阶自回归过滤输入帧能量(在有效帧期间)或使用噪声估算模块输出(在无效帧期间)被计算。以此方式信噪比信号RS可通过信噪比估算器计算,其包含语音或音乐WS长期能量对于噪声N长期能量的比率。该信噪比信号RS被馈送至噪声检测器,其决定当前帧是否包含一带噪音频信号或一干净音频信号,如果信噪比RS是在预定阈值之下,则该帧被考虑为带噪语音否则其被分类为干净语音。
分类结果被输出为噪声标志信号NF,其用以控制切换器。进一步地,该噪声标志信号NF被馈送至比特流编码器。比特流编码器被配置为以噪声标志信号NF为基础在比特流之内产生并发送侧信息,其指示音频输入信号IS还是噪声减低音频信号TS被编码。通过解码这标志,解码器可以自动地调整目标噪声水平而不必将被解码信号DS分类为带噪或干净。
根据本发明编码器的第二实施例的编码器是以被示于第一实施例的编码器为基础。下面,说明另外的特点。在第一实施例的编码器中,信号分析器包含信号活动检测器,其接收对于输入信号IS及噪声估算信号NI的频谱信号SI。信号活动检测器被配置为以这二组信号为基础以在有效帧及无效帧之间区别。信号活动检测器产生信号活动信号SA,其一个方面为了调适比特流BS至信号活动而被发送至比特流编码器,另一方面被用以切换切换器,切换器被配置以交互地馈送有用信号能量信号WE或噪声能量信号EN至信噪比估算器。
根据本发明比特流BS的帧格式FFFF的帧包含具有多个位位于自0至n位置的信号向量SV。在位置n+1的位放置活动标志AF,其指示该帧是有效帧还是无效帧。进一步地,位置n+2的位是噪声标志NF,其指示帧包含一带噪信号或一团队信号。位置n+3被设置的位是填充位PB。
在本发明优选实施例中,指示当前帧有效或无效的侧信息由该比特流(BS)中至少一个专用位所构成。
概要而言,本发明的一方面,原始信号被编码且在被添加至一人造地产生舒缓噪声CN之前在解码器被解码。舒缓噪声产生装置需要没有或非常小数量的侧信息。在第一实施例中,舒缓噪声产生装置不需要侧信息且所有的处理程序盲目地完成。在优选实施例中,舒缓噪声产生装置需要自比特流BS回复VAD信息(有效及无效帧分类结果),其可先前已经呈现于比特流且被使用于其他的用途。在第三实施例中,舒缓噪声产生装置需要来自编码器的在干净及带噪语音之间加以区分的带噪语音标志。同时也可想象任何类参数式被编码信息,其可助以驱动舒缓噪声产生装置。
在本发明的另一方面中,噪声减低首先被应用至原始信号IS,增强信号TS被传送至比特流编码器,被编码,并且被发送。在解码端,人造产生的舒缓噪声CN接着被添加至解码(增强)信号DS。在编码器被使用于噪声减低的目标衰减水平是与在解码器的CNG模块共享的静态数值。因此,目标衰减水平不需要被明确地发送。
虽然一些方面已按照设备背景进行了描述,应清楚,这些方面同时也代表对应方法的描述,其中区块或装置对应于方法步骤或方法步骤特点。类似地,依方法步骤背景描述的方面同时也代表一对应的区块或项目或对应设备的特点的描述。一些或所有的方法步骤可以通过(或利用)硬设备执行,其类似于例如,微处理机,可编程序计算机或电子电路。在一些实施方式中,某一个或多个最重要方法步骤可以通过此设备执行。
取决于某些制作需要,本发明实施方式可以以硬件或软件被制作。该制作可使用非瞬时储存媒体被进行,例如数字储存部媒体,例如软盘、DVD、蓝光、CD、ROM、PROM、EPROM、EEPROM或闪存,其具有电子式可读取控制信号储存于其上,其配合(或是能够配合)于可编程序计算机系统以至于该分别的方法被进行。因此,该数字储存媒体可以是计算机可读取。
根据本发明的一些实施方式包含具有电子式可读取控制信号的数据携载器,其是能够配合于可编程序计算机系统,以至于此处描述的这些方法被执行。
通常,本发明实施方式可被制作如具有程序代码的计算机程序产品,当该计算机程序产品在计算机中执行时,该程序代码可操作以执行这些方法中的一种。该程序代码,例如,可以是储存于机器可读携载器上。
其他的实施方式包含计算机程序,其用以进行此处说明的这些方法中的一个,其储存在机器可读取携载器上。
换言之,本发明方法的实施方式,因此,是计算机程序,其具有程序代码用以当该计算机程序在计算机内运行时,执行本文描述的这些方法中的一种。
本发明方法的进一步的实施方式,因此,是数据携载器(或数字储存部媒体,或计算机可读取媒体),其包括,被记录于其上,用以进行本文描述的这些方法中的一种的计算机程序。该数据携载器、该数字储存媒体或该被记录媒体是一般有形体的及/或非瞬时的。
本发明方法的进一步的实施方式,因此,是数据流或信号序列,其代表用以进行此处说明的这些方法中的一种的计算机程序。该数据流或该信号序列,例如,可以是配置为经由数据通讯连接,例如,经由因特网,而被传送。
进一步的实施方式包括处理构件,例如,计算机或可编程序逻辑设备,其被配置以便,或适用于,执行本文中描述的这些方法中的一种。
进一步的实施方式包括计算机,其使计算机程序安装在其上而用以执行本文中描述的这些方法中的一种。
根据本发明的进一步的实施方式包含设备或系统,其被配置为将(例如,电子式或光学式)用以执行本文中描述的这些方法中的一种的计算机程序传送至接收器。该接收器,例如,可以是计算机、移动装置、内存装置或其类似者。该设备或系统,例如,可包含用以传送该计算机程序至该接收器的文件服务器。
一些实施例中,可编程序逻辑设备(例如,一场式可程控门阵列)可以被使用以执行本文中描述的这些方法中的一些或所有的功能。在一些实施方式中,场式可程控门阵列可以配合于微处理机以便执行本文中描述的这些方法中的一种。通常,这些方法最好是利用任何硬件设备执行。
在上面被说明实施方式仅用于说明本发明的原理。应理解,本文描述的配置和细节的修改和变化对于本领域的其他技术人员应是明显的。因此,本发明是仅受限于待决专利权利要求的范畴而非本文实施方式的描述和说明所呈现的特定细节。
参考标号:
BS 经编码的音频比特流
DS 经解码的音频信号
NE 噪声估计信号
N 噪声
CN 舒缓噪声信号
OS 音频输出信号
AS 分析信号
FD 频域舒缓噪声信号
ND 噪声检测信号
TNL 目标舒缓噪声水平
IS 输入信号
ES 编码信号
OW 有用信号能量估算器的输出信号
ON 噪声能量估计其的输出信号
SI 输入信号的频谱
NI 输入信号的噪声估计信号
TAS 目标衰减信号
FS 增强频域信号
TS 噪声减低音频信号
AD 检测器信号
WE 有用信号能量信号
EN 噪声能量信号
RS 信噪比信号
NF 噪声标志
SA 信号活动信号
FF 帧格式
SV 信号向量
AF 活动标志
NF 噪声标志信息
PB 填充位。
参考文件:
[1]Reconmmendation ITU-T G.718:“Frame error robust narrow-band andwideband embedded variable bit-rate coding of speech and audio from 8-32kbit/s”
[2]3GPP TS 26.190“Adaptive Multi-Rate wideband speech transcoding”3GPP Technical Specification.

Claims (23)

1.一种解码器,被配置用于处理编码音频比特流(BS),其中,所述解码器包括:
比特流解码器,被配置为自该比特流(BS)推导出解码音频信号(DS),其中,所述解码音频信号(DS)包括至少一个解码帧;
噪声估算装置,被配置为产生包含所述解码音频信号(DS)中噪声(N)的水平和/或频谱形状估算的噪声估算信号(NE);
舒缓噪声产生装置,被配置为自所述噪声估算信号(NE)推导出舒缓噪声信号(CN);以及
组合器,被配置为组合所述解码音频信号(DS)的所述解码帧以及所述舒缓噪声信号(CN)以得到音频输出信号(OS),以这种方式,所述音频输出信号(OS)中的所述解码帧包括人造噪声。
2.根据前述权利要求所述的解码器,其中,所述解码帧是有效帧。
3.根据权利要求1所述的解码器,其中,所述解码帧是无效帧。
4.根据权利要求1所述的解码器,其中,所述噪声估算装置包括:频谱分析装置,被配置为产生包含所述解码音频信号(DS)中噪声(N)的水平及/或频谱形状的分析信号(AS);以及噪声估算产生装置,被配置为基于所述分析信号(AS)而产生所述噪声估算信号(NE)。
5.根据权利要求1所述的解码器,其中,所述舒缓噪声产生装置包括:噪声产生器,被配置为基于所述噪声估算信号(NE)产生频域舒缓噪声信号(FD);以及,频谱合成器,被配置为基于所述频域舒缓噪声信号(FD)产生所述舒缓噪声信号(CN)。
6.根据权利要求1所述的解码器,其中,所述解码器包括:切换装置,被配置以交替地切换所述解码器至第一操作模式或至第二操作模式,其中在所述第一操作模式中所述舒缓噪声信号(CN)被馈送至所述组合器,而在所述第二操作模式中所述舒缓噪声信号(CN)不被馈送至所述组合器。
7.根据权利要求6所述的解码器,其中,所述解码器包括:控制装置,被配置为自动地控制所述切换装置,其中,所述控制装置包括:噪声检测器,被配置为取决于所述解码音频信号(DS)的信噪比控制所述切换装置,其中,在低信噪比情况下,所述解码器被切换至所述第一操作模式,并且在高信噪比情况下被切换至所述第二操作模式。
8.根据权利要求7所述的解码器,其中,所述控制装置包括:侧信息接收器,被配置为接收包含于所述比特流(BS)的对应于所述解码音频信号(DS)的信噪比的侧信息,并且被配置为产生噪声检测信号(ND),其中,所述噪声检测器取决于所述噪声检测信号(ND)切换所述切换装置。
9.根据权利要求8所述的解码器,其中,对应于所述解码音频信号(DS)的信噪比的所述侧信息由所述比特流(BS)中至少一个专用位所构成。
10.根据权利要求7所述的解码器,其中,所述控制装置包括:有用信号能量估算器,被配置为确定所述解码音频信号(DS)的有用信号(WS)的能量;噪声能量估算器,被配置为确定所述解码音频信号(DS)的噪声(N)的能量;以及,信噪比估算器,被配置为基于有用信号(WS)的能量并且基于所述噪声(N)的能量确定所述解码音频信号(DS)的信噪比,其中,所述切换装置取决于通过控制装置确定的信噪比而被切换。
11.根据权利要求7所述的解码器,其中,所述比特流包括有效帧以及无效帧,其中,所述控制装置被配置为确定在有效帧期间所述解码音频信号(DS)的有用信号(WS)的能量并且确定在无效帧期间所述解码音频信号(DS)的噪声(N)的能量。
12.根据权利要求1所述的解码器,其中,所述比特流包括有效帧和无效帧,其中,所述解码器包括:侧信息接收器,被配置为基于所述比特流(BS)中指示当前帧有效还是无效的侧信息而在有效帧以及无效帧之间加以区别。
13.根据权利要求1所述的解码器,其中,指示当前帧是有效还是无效的侧信息由所述比特流(BS)中至少一个专用位所构成。
14.根据权利要求7所述的解码器,其中,所述噪声估计装置包括:频谱分析装置,被配置为产生包含所述解码音频信号(DS)中噪声(N)的水平及/或频谱形状的分析信号(AS);以及噪声估算产生装置,被配置为基于所述分析信号(AS)而产生所述噪声估算信号(NE),其中,所述控制装置被配置为基于所述分析信号(AS)确定所述解码音频信号(DS)的有用信号(WS)的能量。
15.根据权利要求7所述的解码器,其中,所述控制装置被配置为基于所述噪声估算信号(NE)确定所述解码音频信号(DS)的噪声(N)的能量。
16.根据权利要求1所述的解码器,其中,所述舒缓噪声产生装置被配置为基于目标舒缓噪声水平信号(TNL)产生舒缓噪声信号(CN)。
17.根据权利要求16所述的解码器,其中,所述目标舒缓噪声水平信号(TNL)取决于所述比特流(BS)的比特率而被调整。
18.根据权利要求16所述的解码器,其中,所述目标舒缓噪声水平信号(TNL)取决于通过被应用于所述比特流(BS)的噪声减低方法所导致的噪声衰减水平而被调整。
19.根据权利要求16所述的解码器,其中,频域舒缓噪声信号(FD)的频带k的能量EW(k),对于各频带k,取决于所述目标舒缓噪声水平信号(TNL),其指示目标舒缓噪声水平gtar,而被调整为 其中/>指示在频带k的解码音频信号(DS)的噪声(N)的能量估算,其中,在所述频带k的所述解码音频信号(DS)的噪声(N)的能量估算通过噪声估算产生装置所传送。
20.根据权利要求1所述的解码器,其中,所述解码器包括另一比特流解码器,其中,所述比特流解码器和所述另一比特流解码器是不同类型的,其中,所述解码器包括切换器,所述切换器被配置为馈送来自所述比特流解码器的解码信号(DS)或来自所述另一比特流解码器的解码信号至所述噪声估算装置以及至所述组合器。
21.一种用于产生和处理编码频比特流(BS)的系统,所述系统包括解码器和编码器,其中,所述解码器是根据权利要求2至20中任一项设计的和其中,所述编码器被配置为产生所述编码频比特流(BS),其中,所述编码器包括:
比特流编码器,被配置为产生对应于音频输入信号(IS)的编码音频信号(ES)并且自所述编码音频信号(ES)推导出比特流(BS);
信号分析器,具有信噪比估算器,所述信噪比估算器被配置为基于由有用信号能量估算器确定的所述音频输入信号(IS)的有用信号的能量以及基于由噪声能量估算器确定的所述音频输入信号(IS)的噪声的能量确定所述音频输入信号(IS)的信噪比;
噪声减低装置,被配置为产生噪声减低音频信号(TS);以及
切换装置,被配置为取决于所确定的所述音频输入信号(IS)的信噪比,而馈送所述音频输入信号(IS)或噪声减低音频信号(TS)至所述比特流编码器以供用于编码相应的信号(IS,TS),其中,所述比特流编码器被配置为在所述比特流(BS)之内发送侧信息(NF),所述侧信息指示所述音频输入信号(IS)还是所述噪声减低音频信号(TS)被编码。
22.一种解码音频比特流(BS)的方法,其中,所述方法包括:
自所述比特流(BS)推导出解码音频信号(DS),其中所述解码音频信号(DS)包括至少一个解码帧;
产生包含所述解码音频信号(DS)中噪声(N)的水平和/或频谱形状的估算的噪声估算信号(NE);
自所述噪声估算信号(NE)推导出舒缓噪声信号(CN);以及
组合所述解码音频信号(DS)的所述解码帧以及所述舒缓噪声信号(CN)以得到音频输出信号(OS),以这种方式,所述音频输出信号(OS)中的所述解码帧包括人造噪声。
23.一种计算机可读存储介质,存储有计算机程序,当在计算机或处理器上运行时,用于执行权利要求22所述的方法。
CN202010005379.0A 2012-12-21 2013-12-19 解码器及用于产生和处理编码频比特流的系统 Active CN111145767B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010005379.0A CN111145767B (zh) 2012-12-21 2013-12-19 解码器及用于产生和处理编码频比特流的系统

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201261740883P 2012-12-21 2012-12-21
US61/740,883 2012-12-21
CN202010005379.0A CN111145767B (zh) 2012-12-21 2013-12-19 解码器及用于产生和处理编码频比特流的系统
CN201380073660.6A CN105210148B (zh) 2012-12-21 2013-12-19 用以在低比特率下模型化背景噪声的舒缓噪声添加技术
PCT/EP2013/077527 WO2014096280A1 (en) 2012-12-21 2013-12-19 Comfort noise addition for modeling background noise at low bit-rates

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201380073660.6A Division CN105210148B (zh) 2012-12-21 2013-12-19 用以在低比特率下模型化背景噪声的舒缓噪声添加技术

Publications (2)

Publication Number Publication Date
CN111145767A CN111145767A (zh) 2020-05-12
CN111145767B true CN111145767B (zh) 2023-07-25

Family

ID=49883094

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201380073660.6A Active CN105210148B (zh) 2012-12-21 2013-12-19 用以在低比特率下模型化背景噪声的舒缓噪声添加技术
CN202010005379.0A Active CN111145767B (zh) 2012-12-21 2013-12-19 解码器及用于产生和处理编码频比特流的系统

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201380073660.6A Active CN105210148B (zh) 2012-12-21 2013-12-19 用以在低比特率下模型化背景噪声的舒缓噪声添加技术

Country Status (20)

Country Link
US (3) US10147432B2 (zh)
EP (1) EP2936486B1 (zh)
JP (3) JP6335190B2 (zh)
KR (2) KR102167541B1 (zh)
CN (2) CN105210148B (zh)
AR (1) AR094279A1 (zh)
AU (1) AU2013366552B2 (zh)
BR (1) BR112015014217B1 (zh)
CA (2) CA2895391C (zh)
ES (1) ES2688021T3 (zh)
HK (1) HK1217244A1 (zh)
MX (1) MX366279B (zh)
MY (1) MY178710A (zh)
PL (1) PL2936486T3 (zh)
PT (1) PT2936486T (zh)
RU (1) RU2633107C2 (zh)
SG (1) SG11201504899XA (zh)
TW (1) TWI553629B (zh)
WO (1) WO2014096280A1 (zh)
ZA (1) ZA201505191B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2895391C (en) * 2012-12-21 2019-08-06 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Comfort noise addition for modeling background noise at low bit-rates
EP2980801A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals
EP2980790A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for comfort noise generation mode selection
US10958695B2 (en) * 2016-06-21 2021-03-23 Google Llc Methods, systems, and media for recommending content based on network conditions
CN108012148B (zh) * 2018-01-16 2023-12-22 吉林省广播电视研究所(吉林省新闻出版广电局科技信息中心) 广播电视音频质量实时监测并自动切换的装置及方法
WO2020212390A1 (en) * 2019-04-15 2020-10-22 Dolby International Ab Dialogue enhancement in audio codec
US11146607B1 (en) * 2019-05-31 2021-10-12 Dialpad, Inc. Smart noise cancellation
CA3145047A1 (en) * 2019-07-08 2021-01-14 Voiceage Corporation Method and system for coding metadata in audio streams and for efficient bitrate allocation to audio streams coding
GB2596138A (en) * 2020-06-19 2021-12-22 Nokia Technologies Oy Decoder spatial comfort noise generation for discontinuous transmission operation
EP4330963A1 (en) * 2021-04-29 2024-03-06 VoiceAge Corporation Method and device for multi-channel comfort noise injection in a decoded sound signal
US11915698B1 (en) * 2021-09-29 2024-02-27 Amazon Technologies, Inc. Sound source localization

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6167375A (en) * 1997-03-17 2000-12-26 Kabushiki Kaisha Toshiba Method for encoding and decoding a speech signal including background noise
JP2003522964A (ja) * 1998-05-11 2003-07-29 コネクサント システムズ, インコーポレイテッド 背景ノイズが共存する符号化音声の品質を向上させるためのシステムおよび方法
EP1509903A1 (en) * 2002-05-31 2005-03-02 Voiceage Corporation Method and device for efficient frame erasure concealment in linear predictive based speech codecs
CN101366077A (zh) * 2005-08-31 2009-02-11 摩托罗拉公司 在语音通信系统中产生舒适噪声的方法和设备
WO2009000073A8 (en) * 2007-06-22 2009-03-26 Voiceage Corp Method and device for sound activity detection and sound signal classification
WO2011042464A1 (en) * 2009-10-08 2011-04-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-mode audio signal decoder, multi-mode audio signal encoder, methods and computer program using a linear-prediction-coding based noise shaping
WO2012110482A2 (en) * 2011-02-14 2012-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise generation in audio codecs
CN102667927A (zh) * 2009-10-19 2012-09-12 瑞典爱立信有限公司 语音活动检测的方法和背景估计器
CN102884574A (zh) * 2009-10-20 2013-01-16 弗兰霍菲尔运输应用研究公司 音频信号编码器、音频信号解码器、使用混迭抵消来将音频信号编码或解码的方法

Family Cites Families (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5537509A (en) 1990-12-06 1996-07-16 Hughes Electronics Comfort noise generation for digital communication systems
DE69233794D1 (de) * 1991-06-11 2010-09-23 Qualcomm Inc Vocoder mit veränderlicher Bitrate
US5630016A (en) 1992-05-28 1997-05-13 Hughes Electronics Comfort noise generation for digital communication systems
US5657422A (en) * 1994-01-28 1997-08-12 Lucent Technologies Inc. Voice activity detection driven noise remediator
FI101439B (fi) 1995-04-13 1998-06-15 Nokia Telecommunications Oy Transkooderi, jossa on tandem-koodauksen esto
EP0756267A1 (en) 1995-07-24 1997-01-29 International Business Machines Corporation Method and system for silence removal in voice communication
JP3252782B2 (ja) * 1998-01-13 2002-02-04 日本電気株式会社 モデム信号対応音声符号化復号化装置
US6424938B1 (en) * 1998-11-23 2002-07-23 Telefonaktiebolaget L M Ericsson Complex signal activity detection for improved speech/noise classification of an audio signal
RU2237296C2 (ru) 1998-11-23 2004-09-27 Телефонактиеболагет Лм Эрикссон (Пабл) Кодирование речи с функцией изменения комфортного шума для повышения точности воспроизведения
US8583427B2 (en) * 1999-11-18 2013-11-12 Broadcom Corporation Voice and data exchange over a packet based network with voice detection
US20070110042A1 (en) 1999-12-09 2007-05-17 Henry Li Voice and data exchange over a packet based network
JP2001318694A (ja) * 2000-05-10 2001-11-16 Toshiba Corp 信号処理装置、信号処理方法および記録媒体
US6873604B1 (en) 2000-07-31 2005-03-29 Cisco Technology, Inc. Method and apparatus for transitioning comfort noise in an IP-based telephony system
US6615169B1 (en) 2000-10-18 2003-09-02 Nokia Corporation High frequency enhancement layer coding in wideband speech codec
US6807525B1 (en) 2000-10-31 2004-10-19 Telogy Networks, Inc. SID frame detection with human auditory perception compensation
WO2002054744A1 (en) * 2000-12-29 2002-07-11 Nokia Corporation Audio signal quality enhancement in a digital network
US20030120484A1 (en) * 2001-06-12 2003-06-26 David Wong Method and system for generating colored comfort noise in the absence of silence insertion description packets
CA2392640A1 (en) * 2002-07-05 2004-01-05 Voiceage Corporation A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems
JP4089347B2 (ja) * 2002-08-21 2008-05-28 沖電気工業株式会社 音声復号装置
RU2331933C2 (ru) 2002-10-11 2008-08-20 Нокиа Корпорейшн Способы и устройства управляемого источником широкополосного кодирования речи с переменной скоростью в битах
JP4311541B2 (ja) * 2003-10-06 2009-08-12 アルパイン株式会社 オーディオ信号圧縮装置
GB0326263D0 (en) * 2003-11-11 2003-12-17 Nokia Corp Speech codecs
CA2454296A1 (en) 2003-12-29 2005-06-29 Nokia Corporation Method and device for speech enhancement in the presence of background noise
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
US7649988B2 (en) 2004-06-15 2010-01-19 Acoustic Technologies, Inc. Comfort noise generator using modified Doblinger noise estimate
US7454010B1 (en) 2004-11-03 2008-11-18 Acoustic Technologies, Inc. Noise reduction and comfort noise gain control using bark band weiner filter and linear attenuation
JP4551817B2 (ja) * 2005-05-20 2010-09-29 Okiセミコンダクタ株式会社 ノイズレベル推定方法及びその装置
ES2629727T3 (es) 2005-06-18 2017-08-14 Nokia Technologies Oy Sistema y método para la transmisión adaptativa de parámetros de ruido de confort durante la transmisión de habla discontinua
CN101263554B (zh) * 2005-07-22 2011-12-28 法国电信公司 在比特率分级和带宽分级的音频解码中的比特率切换方法
US20070064681A1 (en) * 2005-09-22 2007-03-22 Motorola, Inc. Method and system for monitoring a data channel for discontinuous transmission activity
US9185487B2 (en) 2006-01-30 2015-11-10 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction
US8744844B2 (en) * 2007-07-06 2014-06-03 Audience, Inc. System and method for adaptive intelligent noise suppression
US8032370B2 (en) * 2006-05-09 2011-10-04 Nokia Corporation Method, apparatus, system and software product for adaptation of voice activity detection parameters based on the quality of the coding modes
US8000960B2 (en) * 2006-08-15 2011-08-16 Broadcom Corporation Packet loss concealment for sub-band predictive coding based on extrapolation of sub-band audio waveforms
CN101149921B (zh) * 2006-09-21 2011-08-10 展讯通信(上海)有限公司 一种静音检测方法和装置
US9966085B2 (en) * 2006-12-30 2018-05-08 Google Technology Holdings LLC Method and noise suppression circuit incorporating a plurality of noise suppression techniques
JP5198477B2 (ja) * 2007-03-05 2013-05-15 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 定常的な背景雑音の平滑化を制御するための方法及び装置
US8090588B2 (en) * 2007-08-31 2012-01-03 Nokia Corporation System and method for providing AMR-WB DTX synchronization
US8139777B2 (en) 2007-10-31 2012-03-20 Qnx Software Systems Co. System for comfort noise injection
JP5323091B2 (ja) * 2008-01-04 2013-10-23 インターデイジタル パテント ホールディングス インコーポレイテッド 進化した無線システムにおいて回線交換音声アプリケーションのデータレートを制御する方法
US8600740B2 (en) 2008-01-28 2013-12-03 Qualcomm Incorporated Systems, methods and apparatus for context descriptor transmission
DE102008009719A1 (de) 2008-02-19 2009-08-20 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen
US20090222268A1 (en) 2008-03-03 2009-09-03 Qnx Software Systems (Wavemakers), Inc. Speech synthesis system having artificial excitation signal
CN101483495B (zh) * 2008-03-20 2012-02-15 华为技术有限公司 一种背景噪声生成方法以及噪声处理装置
CN101335000B (zh) 2008-03-26 2010-04-21 华为技术有限公司 编码的方法及装置
ES2613693T3 (es) * 2008-05-09 2017-05-25 Nokia Technologies Oy Aparato de audio
PT2410521T (pt) * 2008-07-11 2018-01-09 Fraunhofer Ges Forschung Codificador de sinal de áudio, método para gerar um sinal de áudio e programa de computador
EP2144230A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
CA2739736C (en) 2008-10-08 2015-12-01 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-resolution switched audio encoding/decoding scheme
CA2763793C (en) 2009-06-23 2017-05-09 Voiceage Corporation Forward time-domain aliasing cancellation with application in weighted or original signal domain
JP2013508773A (ja) * 2009-10-19 2013-03-07 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 音声エンコーダの方法およびボイス活動検出器
CN102063905A (zh) * 2009-11-13 2011-05-18 数维科技(北京)有限公司 一种用于音频解码的盲噪声填充方法及其装置
US20110234200A1 (en) * 2010-03-24 2011-09-29 Kishan Shenoi Adaptive slip double buffer
PL2633521T3 (pl) * 2010-10-25 2019-01-31 Voiceage Corporation Kodowanie zwykłych sygnałów audio przy małych przepływnościach bitowych i małym opóźnieniu
EP3726530A1 (en) * 2010-12-24 2020-10-21 Huawei Technologies Co., Ltd. Method and apparatus for adaptively detecting a voice activity in an input audio signal
CN102136271B (zh) * 2011-02-09 2012-07-04 华为技术有限公司 舒适噪声生成器、方法及回声抵消装置
US20120237048A1 (en) * 2011-03-14 2012-09-20 Continental Automotive Systems, Inc. Apparatus and method for echo suppression
EP2709103B1 (en) * 2011-06-09 2015-10-07 Panasonic Intellectual Property Corporation of America Voice coding device, voice decoding device, voice coding method and voice decoding method
WO2014035328A1 (en) * 2012-08-31 2014-03-06 Telefonaktiebolaget L M Ericsson (Publ) Method and device for voice activity detection
RU2650025C2 (ru) * 2012-12-21 2018-04-06 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Генерирование комфортного шума с высоким спектрально-временным разрешением при прерывистой передаче аудиосигналов
CA2895391C (en) * 2012-12-21 2019-08-06 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Comfort noise addition for modeling background noise at low bit-rates
US9106196B2 (en) * 2013-06-20 2015-08-11 2236008 Ontario Inc. Sound field spatial stabilizer with echo spectral coherence compensation

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6167375A (en) * 1997-03-17 2000-12-26 Kabushiki Kaisha Toshiba Method for encoding and decoding a speech signal including background noise
JP2003522964A (ja) * 1998-05-11 2003-07-29 コネクサント システムズ, インコーポレイテッド 背景ノイズが共存する符号化音声の品質を向上させるためのシステムおよび方法
EP1509903A1 (en) * 2002-05-31 2005-03-02 Voiceage Corporation Method and device for efficient frame erasure concealment in linear predictive based speech codecs
CN101366077A (zh) * 2005-08-31 2009-02-11 摩托罗拉公司 在语音通信系统中产生舒适噪声的方法和设备
WO2009000073A8 (en) * 2007-06-22 2009-03-26 Voiceage Corp Method and device for sound activity detection and sound signal classification
WO2011042464A1 (en) * 2009-10-08 2011-04-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-mode audio signal decoder, multi-mode audio signal encoder, methods and computer program using a linear-prediction-coding based noise shaping
CN102667927A (zh) * 2009-10-19 2012-09-12 瑞典爱立信有限公司 语音活动检测的方法和背景估计器
CN102884574A (zh) * 2009-10-20 2013-01-16 弗兰霍菲尔运输应用研究公司 音频信号编码器、音频信号解码器、使用混迭抵消来将音频信号编码或解码的方法
WO2012110482A2 (en) * 2011-02-14 2012-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise generation in audio codecs

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Robust signal/noise discrimination for wideband speech and audio coding;M.Jelinek;《Proceeding Meeting the Challenges of the New Millennium》;20001231;全文 *
音频信息隐藏关键技术的研究;黄昊;《中国博士论文全文数据库》;20090615(第6期);全文 *

Also Published As

Publication number Publication date
BR112015014217B1 (pt) 2021-11-03
JP7297803B2 (ja) 2023-06-26
RU2633107C2 (ru) 2017-10-11
AU2013366552A1 (en) 2015-07-16
US20200013417A1 (en) 2020-01-09
MX2015007854A (es) 2016-02-05
SG11201504899XA (en) 2015-07-30
AU2013366552B2 (en) 2017-03-02
CA2895391A1 (en) 2014-06-26
JP2021092816A (ja) 2021-06-17
ZA201505191B (en) 2016-07-27
KR102167541B1 (ko) 2020-10-19
US10789963B2 (en) 2020-09-29
KR101692659B1 (ko) 2017-01-03
HK1217244A1 (zh) 2016-12-30
AR094279A1 (es) 2015-07-22
WO2014096280A1 (en) 2014-06-26
PL2936486T3 (pl) 2018-12-31
JP2018084834A (ja) 2018-05-31
TWI553629B (zh) 2016-10-11
US20150364144A1 (en) 2015-12-17
BR112015014217A2 (pt) 2018-06-26
EP2936486B1 (en) 2018-07-18
US10147432B2 (en) 2018-12-04
MY178710A (en) 2020-10-20
JP6335190B2 (ja) 2018-05-30
CN105210148A (zh) 2015-12-30
MX366279B (es) 2019-07-03
CA2948015C (en) 2018-03-20
KR20170001751A (ko) 2017-01-04
CA2895391C (en) 2019-08-06
CA2948015A1 (en) 2014-06-26
ES2688021T3 (es) 2018-10-30
PT2936486T (pt) 2018-10-19
CN105210148B (zh) 2020-06-30
JP6849619B2 (ja) 2021-03-24
US20180342253A1 (en) 2018-11-29
TW201432671A (zh) 2014-08-16
RU2015129782A (ru) 2017-01-27
US10339941B2 (en) 2019-07-02
CN111145767A (zh) 2020-05-12
KR20150107751A (ko) 2015-09-23
EP2936486A1 (en) 2015-10-28
JP2016500453A (ja) 2016-01-12

Similar Documents

Publication Publication Date Title
CN111145767B (zh) 解码器及用于产生和处理编码频比特流的系统
US10276176B2 (en) Audio decoder and method for providing a decoded audio information using an error concealment modifying a time domain excitation signal
US10269365B2 (en) Noise filling without side information for CELP-like coders
US10672411B2 (en) Method for adaptively encoding an audio signal in dependence on noise information for higher encoding accuracy
US20040167772A1 (en) Speech coding and decoding in a voice communication system

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant