CN113140224B - 用于舒适噪声生成模式选择的装置和方法 - Google Patents
用于舒适噪声生成模式选择的装置和方法 Download PDFInfo
- Publication number
- CN113140224B CN113140224B CN202110274103.7A CN202110274103A CN113140224B CN 113140224 B CN113140224 B CN 113140224B CN 202110274103 A CN202110274103 A CN 202110274103A CN 113140224 B CN113140224 B CN 113140224B
- Authority
- CN
- China
- Prior art keywords
- comfort noise
- noise generation
- generation mode
- frequency
- audio information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 44
- 230000007774 longterm Effects 0.000 claims description 31
- 238000004590 computer program Methods 0.000 claims description 12
- 230000005284 excitation Effects 0.000 description 19
- 230000005540 biological transmission Effects 0.000 description 6
- 238000007493 shaping process Methods 0.000 description 4
- 230000002194 synthesizing effect Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
提供了一种用于对音频信息进行编码的装置。所述用于对音频信息进行编码的装置包括:选择器(110),用于根据音频输入信号的背景噪声特性,从两个或更多个舒适噪声生成模式中选择舒适噪声生成模式;以及编码单元(120),用于对所述音频信息进行编码,其中所述音频信息包括指示所选的舒适噪声生成模式的模式信息。
Description
本申请是申请日为2015年7月16日、申请号为201580040583.3的中国发明专利申请“用于舒适噪声生成模式选择的装置和方法”的分案申请。
技术领域
本发明涉及音频信号编码、处理和解码,特别地涉及一种用于舒适噪声生成模式选择的装置和方法。
背景技术
通信语音和音频编解码器(例如AMR-WB,G.718)通常包括不连续传输(DTX)机制和舒适噪声生成(CNG)算法。DTX/CNG操作被用于通过在非活动信号时段期间模拟背景噪声来降低传输率。
CNG可以例如以若干方式来实现。
最常用的方法,如在AMR-WB(ITU-T G.722.2附录A)和G.718(ITU-T G.718第6.12和7.12节)的编解码器中采用的方法,基于激励+线性预测(LP)模型。首先生成随机激励信号,然后通过增益进行缩放,最后使用LP逆滤波器进行合成,从而产生时域CNG信号。被传输的两个主要参数是激励能量和LP系数(通常使用LSF或ISF表示)。这种方法在本文中称为LP-CNG。
另一种方法是最近提出的并描述在例如专利申请WO2014/096279“Generation ofa comfort noise with high spectro-temporal resolution in discontinuoustransmission of audio signals”中,该方法基于背景噪声的频域(FD)表示。在频域上产生(例如FFT,MDCT,QMF)随机噪声,然后使用背景噪声的FD表示进行塑形,最后从频域转换到时域,从而产生时域CNG信号。被传输的两个主要参数是全局增益和一组频带噪声电平。这种方法在本文中称为FD-CNG。
发明内容
本发明的目的是提供用于舒适噪声生成的改善构思。本发明的目的通过根据权利要求1所述的装置、根据权利要求10所述的装置、根据权利要求13所述的系统、根据权利要求14所述的方法、根据权利要求15所述的方法、根据权利要求16所述的计算机程序来解决。
提供了一种用于对音频信息进行编码的装置。所述用于对音频信息进行编码的装置包括:选择器,用于根据音频输入信号的背景噪声特性,从两个或更多个舒适噪声生成模式中选择舒适噪声生成模式;以及,编码单元,用于对所述音频信息进行编码,其中所述音频信息包括指示所选的舒适噪声生成模式的模式信息。
特别地,实施例基于以下发现:FD-CNG对于高度倾斜的背景噪声信号(例如,汽车噪声)给出较好的质量;而LP-CNG对于频谱上较平坦的背景噪声信号(办公室噪音)给出较好的质量。
为了从DTX/CNG系统获得最佳可能质量,根据实施例,两种CNG方法都被使用,并且根据背景噪声特性来选择其中之一。
实施例提供了选择器,其决定应当使用哪种CNG模式,如LP-CNG或FD-CNG。
根据实施例,该选择器可以例如被配置为:将音频输入信号的背景噪声的倾斜确定为背景噪声特性。选择器可以例如被配置为:根据所确定的倾斜,从两个或更多个舒适噪声生成模式中选择所述舒适噪声生成模式。
在实施例中,所述装置可以例如还包括噪声估计器,其用于针对多个频带中的每个频带估计背景噪声的每频带估计。选择器可以例如被配置为根据所述多个频带的估计的背景噪声来确定倾斜。
根据实施例,噪声估计器可以例如被配置为:通过估计多个频带中的每个频带的背景噪声的能量来估计背景噪声的每频带估计。
在实施例中,噪声估计器可以例如被配置为:根据多个频带中的第一组中的每个频带的背景噪声的每频带估计,确定指示所述多个频带中的第一组的第一背景噪声能量的低频背景噪声值。
而且,在这样的实施例中,噪声估计器可以例如被配置为:根据多个频带中的第二组中的每个频带的背景噪声的每频带估计,确定指示所述多个频带中的第二组的第二背景噪声能量的高频背景噪声值。所述第一组中的至少一个频带可以例如具有比所述第二组中的至少一个频带的中心频率低的中心频率。在特定实施例中,第一组的每个频带可以例如具有比第二组的每个频带的中心频率低的中心频率。
此外,选择器可以例如被配置为:根据低频背景噪声值和高频背景噪声值来确定倾斜。
根据实施例,噪声估计器可以例如被配置为按照下式确定所述低频背景噪声值L:
其中i表示第一组频带中的第i个频带,11表示所述多个频带中的第一频带,I2表示所述多个频带中的第二频带,以及N[i]表示第i个频带的背景噪声能量的能量估计。
在实施例中,噪声估计器可以例如被配置为按照下式确定所述高频背景噪声值H:
其中i表示第二组频带中的第i个频带,I3表示所述多个频带中的第三频带,I4表示所述多个频带中的第四频带,以及N[i]表示第i个频带的背景噪声能量的能量估计。
根据实施例,选择器可以例如被配置为:
按照公式或者
按照公式或者
按照公式T=L-H,或者
按照公式T=H-L,
根据所述低频背景噪声值L和所述高频背景噪声值H来确定倾斜T。
在实施例中,选择器可以例如被配置为将倾斜确定为当前短期倾斜值。而且,选择器可以例如被配置为根据当前短期倾斜值和先前的长期倾斜值来确定当前长期倾斜值。此外,选择器可以例如被配置为根据当前长期倾斜值选择两个或更多个舒适噪声生成模式之一。
根据实施例,选择器可以例如被配置为按照下述公式确定当前长期倾斜值TcLT:
TcLT=αTpLT+(1-α)T,
其中,T是当前短期倾斜值,TpLT是所述先前的长期倾斜值,以及α是实数,且0<α<1。
在实施例中,所述两个或更多个舒适噪声生成模式中的第一个可以例如是频域舒适噪声生成模式。而且,所述两个或更多个舒适噪声生成模式中的第二个可以例如是线性预测域舒适噪声生成模式。此外,选择器可以例如被配置为:如果先前选择的生成模式(由选择器先前选择的)是线性预测域舒适噪声生成模式并且当前长期倾斜值大于第一阈值,则选择频域舒适噪声生成模式。而且,选择器可以例如被配置为:如果先前选择的生成模式(由选择器先前选择的)是频域舒适噪声生成模式并且当前长期倾斜值小于第二阈值,则选择线性预测域舒适噪声生成模式。
而且,提供了一种用于基于接收的编码音频信息生成音频输出信号的装置。所述装置包括:解码单元,用于对编码音频信息进行解码以获得在所述编码音频信息内编码的模式信息,其中所述模式信息指示两个或更多个舒适噪声生成模式中的所指示的舒适噪声生成模式。而且,所述装置包括:信号处理器,用于通过根据所指示的舒适噪声生成模式生成舒适噪声来生成所述音频输出信号。
根据实施例,所述两个或更多个舒适噪声生成模式中的第一个可以例如是频域舒适噪声生成模式。信号处理器可以例如被配置为:如果所指示的舒适噪声生成模式是频域舒适噪声生成模式,则在频域中生成舒适噪声,并且对在频域中生成的所述舒适噪声进行频率到时间的转换。例如,在特定实施例中,信号处理器可以例如被配置为:如果所指示的舒适噪声生成模式是频域舒适噪声生成模式,则通过在频域中生成随机噪声,对频域中的所述随机噪声进行塑形以获得塑形后的噪声,以及将塑形后的噪声从频域转换到时域,来生成舒适噪声。
在实施例中,所述两个或更多个舒适噪声生成模式中的第二个可以例如是线性预测域舒适噪声生成模式。信号处理器可以例如被配置为:如果所指示的舒适噪声生成模式是线性预测域舒适噪声生成模式,则通过使用线性预测滤波器来生成所述舒适噪声。例如,在特定实施例中,信号处理器可以例如被配置为:如果所指示的舒适噪声生成模式是线性预测域舒适噪声生成模式,则通过生成随机激励信号,对所述随机激励信号进行缩放以获得缩放后的激励信号,以及使用LP逆滤波器合成缩放后的激励信号,来生成舒适噪声。
此外,提供了一种系统。所述系统包括:根据上述实施例之一的用于对音频信息进行编码的装置,根据上述实施例之一的用于基于接收的编码音频信息生成音频输出信号的装置。所述用于对音频信息进行编码的装置的选择器被配置为:根据音频输入信号的背景噪声特性从两个或更多个舒适噪声生成模式中选择舒适噪声生成模式。所述用于对音频信息进行编码的装置的编码单元被配置为:对所述音频信息进行编码以获得编码音频信息,其中所述音频信息包括将所选的舒适噪声生成模式指示为所指示的舒适噪声生成模式的模式信息。而且,所述用于生成音频输出信号的装置的解码单元被配置为接收所述编码音频信息,并且还被配置为对所述编码音频信息进行解码以获得在所述编码音频信息内编码的模式信息。所述用于生成音频输出信号的装置的信号处理器被配置为:通过根据所指示的舒适噪声生成模式生成舒适噪声来生成所述音频输出信号。
而且,提供了一种用于对音频信息进行编码的方法。所述方法包括:
-根据音频输入信号的背景噪声特性从两个或更多个舒适噪声生成模式中选择舒适噪声生成模式;以及
-对所述音频信息进行编码,其中所述音频信息包括指示所选的舒适噪声生成模式的模式信息。
此外,提供了一种用于基于接收的编码音频信息生成音频输出信号的方法。所述方法包括:
-对所述编码音频信息进行解码以获得在所述编码音频信息内编码的模式信息,其中所述模式信息指示两个或更多个舒适噪声生成模式中的所指示的舒适噪声生成模式,以及
-通过根据所指示的舒适噪声生成模式生成舒适噪声来生成所述音频输出信号。
而且,提供了一种用于当在计算机或信号处理器上执行时实现上述方法的计算机程序。
因此,在一些实施例中,所提出的选择器可以例如主要基于背景噪声的倾斜。例如,如果背景噪声的倾斜为高,则选择FD-CNG,否则选择LP-CNG。
背景噪声倾斜和滞后的平滑版本可被例如用于避免经常从一种模式切换到另一种模式。
背景噪声的倾斜可以例如使用低频背景噪声能量和高频背景噪声能量的比来估计。
背景噪声能量可以例如使用噪声估计器在频域中估计。
附图说明
在下文中,将参考附图更详细地描述本发明的实施例,在附图中:
图1示出了根据实施例的用于对音频信息进行编码的装置,
图2示出了根据另一实施例的用于对音频信息进行编码的装置,
图3示出了根据实施例的用于选择舒适噪声生成模式的逐步方法,
图4示出了根据实施例的用于基于接收的编码音频信息生成音频输出信号的装置,以及
图5示出了根据实施例的系统。
具体实施方式
图1示出了根据实施例的用于对音频信息进行编码的装置。
用于对音频信息进行编码的装置包括:选择器110,用于根据音频输入信号的背景噪声特性从两个或更多个舒适噪声生成模式中选择舒适噪声生成模式。
而且,该装置包括:编码单元120,用于对音频信息进行编码,其中,音频信息包括指示所选的舒适噪声生成模式的模式信息。
例如,所述两个或更多个舒适噪声生成模式中的第一个可以例如是频域舒适噪声生成模式。以及/或者,例如,所述两个或更多个生成模式中的第二个可以例如是线性预测域舒适噪声生成模式。
例如,如果在解码器侧接收到编码音频信息,其中在编码音频信息内编码的模式信息指示所选的舒适噪声生成模式是频域舒适噪声生成模式,则解码器侧的信号处理器可以例如通过下述方式来生成舒适噪声:在频域中生成随机噪声,对频域中的所述随机噪声进行塑形以获得塑形后的噪声,以及将塑形后的噪声从频域转换到时域。
然而,如果例如在编码音频信息内编码的模式信息指示所选的舒适噪声生成模式是线性预测域舒适噪声生成模式,则解码器侧的信号处理器可以例如通过下述方式来生成舒适噪声:生成随机激励信号,对所述随机激励信号进行缩放以获得缩放后的激励信号,以及使用LP逆滤波器合成缩放后的激励信号。
在编码音频信息内,不仅可以编码关于舒适噪声生成模式的信息,还可以编码附加信息。例如,频带特定的增益因子也可被编码,例如,其中针对每个频带编码一个增益因子。或者,例如,一个或多个LP滤波器系数或LSF系数或ISF系数可被编码在编码音频信息内。被编码在编码音频信息内的关于所选的舒适噪声生成模式的信息和附加信息于是可被传输给解码器侧,例如在SID帧(SID=静音插入描述符)内传输。
关于所选的舒适噪声生成模式的信息可被显式地编码或隐式地编码。
当对所选的舒适噪声生成模式进行显式编码时,可以例如使用一个或多个比特来指示所选的舒适噪声生成模式是两个或更多个舒适噪声生成模式中的哪一个。在这样的实施例中,于是所述一个或多个比特是编码的模式信息。
然而,在其他实施例中,所选的舒适噪声生成模式被隐式地编码在音频信息内。例如,在上述示例中,频带特定的增益因子和一个或多个LP(或LSF或ISF)可以例如具有不同的数据格式,或者可以例如具有不同的比特长度。例如,如果频带特定的增益因子被编码在音频信息内,这可以例如指示频域舒适噪声生成模式是所选的舒适噪声生成模式。然而,如果一个或多个LP(或LSF或ISF)系数被编码在音频信息内,这可以例如指示线性预测域舒适噪声生成模式是所选的舒适噪声生成模式。当使用这种隐式编码时,频带特定的增益因子或一个或多个LP(或LSF或ISF)系数于是表示被编码在编码音频信号内的模式信息,其中该模式信息指示所选的舒适噪声生成模式。
根据实施例,选择器110可以例如被配置为将音频输入信号的背景噪声的倾斜确定为背景噪声特性。选择器110可以例如被配置为:根据所确定的倾斜从两个或更多个舒适噪声生成模式中选择所述舒适噪声生成模式。
例如,可以利用低频背景噪声值和高频背景噪声值,并且可以例如根据低频背景噪声值和高频背景噪声值来计算背景噪声的倾斜。
图2示出了根据另一实施例的用于对音频信息进行编码的装置。图2的装置还包括:噪声估计器105,用于估计多个频带中的每个频带的背景噪声的每频带估计。选择器110可以例如被配置为根据多个频带的估计的背景噪声来确定倾斜。
根据实施例,噪声估计器105可以例如被配置为:通过估计多个频带中的每个频带的背景噪声的能量来估计背景噪声的每频带估计。
在实施例中,噪声估计器105可以例如被配置为:根据多个频带中的第一组中的每个频带的背景噪声的每频带估计,确定指示所述多个频带中的第一组的第一背景噪声能量的低频背景噪声值。
而且,噪声估计器105可以例如被配置为:根据多个频带中的第二组中的每个频带的背景噪声的每频带估计,确定指示所述多个频带中的第二组的第二背景噪声能量的高频背景噪声值。所述第一组中的至少一个频带可以例如具有比所述第二组中的至少一个频带的中心频率低的中心频率。在特定实施例中,第一组的每个频带可以例如具有比第二组的每个频带的中心频率低的中心频率。
此外,选择器110可以例如被配置为:根据低频背景噪声值和高频背景噪声值来确定倾斜。
根据实施例,噪声估计器105可以例如被配置为按照下式确定所述低频背景噪声值L:
其中i表示第一组频带中的第i个频带,I1表示所述多个频带中的第一频带,I2表示所述多个频带中的第二频带,以及N[i]表示第i个频带的背景噪声能量的能量估计。
类似地,在实施例中,噪声估计器105可以例如被配置为按照下式确定所述高频背景噪声值H:
其中i表示第二组频带中的第i个频带,I3表示所述多个频带中的第三频带,I4表示所述多个频带中的第四频带,以及N[i]表示第i个频带的背景噪声能量的能量估计。
根据实施例,选择器110可以例如被配置为:
按照公式或者
按照公式或者
按照公式T=L-H,或者
按照公式T=H-L,
根据所述低频背景噪声值L和所述高频背景噪声值H来确定倾斜T。
例如,当L和H在对数域中表示时,可以采用减法公式之一(T=L-H或T=H-L)。
在实施例中,选择器110可以例如被配置为:将倾斜确定为当前短期倾斜值。而且,选择器110可以例如被配置为根据当前短期倾斜值和先前的长期倾斜值来确定当前长期倾斜值。此外,选择器110可以例如被配置为根据当前长期倾斜值选择两个或更多个舒适噪声生成模式之一。
根据实施例,选择器110可以例如被配置为按照下述公式确定当前长期倾斜值TcLT:
TcLT=αTpLT+(1-α)T,
其中,T是当前短期倾斜值,TpLT是所述先前的长期倾斜值,以及α是实数,且0<α<1。
在实施例中,所述两个或更多个舒适噪声生成模式中的第一个可以例如是频域舒适噪声生成模式FD_CNG。而且,所述两个或更多个舒适噪声生成模式中的第二个可以例如是线性预测域舒适噪声生成模式LP_CNG。此外,选择器110可以例如被配置为:如果先前选择的生成模式cng_mode_prev(由选择器110先前选择的)是线性预测域舒适噪声生成模式LP_CNG并且当前长期倾斜值大于第一阈值thr1,则选择频域舒适噪声生成模式FD_CNG。而且,选择器110可以例如被配置为:如果先前选择的生成模式cng_mode_prev(由选择器110先前选择的)是频域舒适噪声生成模式FD_CNG并且当前长期倾斜值小于第二阈值thr2,则选择线性预测域舒适噪声生成模式FD_CNG。
在一些实施例中,第一阈值等于第二阈值。然而,在另一些实施例中,第一阈值不等于第二阈值。
图4示出了根据实施例的基于接收的编码音频信息生成音频输出信号的装置。
该装置包括:解码单元210,用于对编码音频信息进行解码以获得在编码音频信息内编码的模式信息。该模式信息指示两个或更多个舒适噪声生成模式中的所指示的舒适噪声生成模式。
而且,该装置包括:信号处理器220,用于通过根据所指示的舒适噪声生成模式生成舒适噪声来生成音频输出信号。
根据实施例,两个或更多个舒适噪声生成模式中的第一个可以例如是频域舒适噪声生成模式。信号处理器220可以例如被配置为:如果所指示的舒适噪声生成模式是频域舒适噪声生成模式,则在频域中生成舒适噪声,并且对在频域中生成的所述舒适噪声进行频率到时间的转换。例如,在特定实施例中,信号处理器可以例如被配置为:如果所指示的舒适噪声生成模式是频域舒适噪声生成模式,则通过在频域中生成随机噪声,对频域中的所述随机噪声进行塑形以获得塑形后的噪声,以及将塑形后的噪声从频域转换到时域,来生成舒适噪声。
例如,可以采用WO 2014/096279 A1中描述的概念。
例如,可以应用随机生成器来通过生成一个或多个随机序列以在FFT域和/或QMF(FFT=快速傅立叶变换;QMF=正交镜像滤波器)域中激励每个单独的频谱带。随机噪声的塑形可以例如通过分别计算每个频带中的随机序列的幅度来进行,使得所生成的舒适噪声的频谱类似于例如在比特流中存在的实际背景噪声的频谱,所述比特流包括例如音频输入信号。于是,例如,所计算的幅度可以例如被应用于随机序列,例如通过将随机序列与所计算的每个频带中的幅度相乘。然后,可采用将塑形后的噪声从频域转换到时域。
在实施例中,两个或更多个舒适噪声生成模式中的第二个可以例如是线性预测域舒适噪声生成模式。信号处理器220可以例如被配置为:如果所指示的舒适噪声生成模式是线性预测域舒适噪声生成模式,则通过使用线性预测滤波器来生成所述舒适噪声。例如,在特定实施例中,信号处理器可以例如被配置为:如果所指示的舒适噪声生成模式是线性预测域舒适噪声生成模式,则通过生成随机激励信号,对所述随机激励信号进行缩放以获得缩放后的激励信号,以及使用LP逆滤波器合成缩放后的激励信号,来生成舒适噪声。
例如,可以采用如G.722.2(参见ITU-T G.722.2附录A)和/或如G.718(参见ITU-TG.718第6.12和7.12节)中描述的舒适噪声生成。通过缩放随机激励信号以获得缩放后的激励信号以及使用LP逆滤波器合成缩放后的激励信号实现的这种随机激励域的舒适噪声生成对于本领域技术人员而言是公知的。
图5示出了根据实施例的系统。该系统包括:根据上述实施例之一的用于对音频信息进行编码的装置100;以及,根据上述实施例之一的用于基于接收的编码音频信息生成音频输出信号的装置200。
用于对音频信息进行编码的装置100的选择器110被配置为:根据音频输入信号的背景噪声特性从两个或更多个舒适噪声生成模式中选择舒适噪声生成模式。用于对音频信息进行编码的装置100的编码单元120被配置为:对音频信息进行编码以获得编码音频信息,其中所述音频信息包括将所选的舒适噪声生成模式指示为所指示的舒适噪声生成模式的模式信息。
而且,用于生成音频输出信号的装置200的解码单元210被配置为接收编码音频信息,并且还被配置为对编码音频信息进行解码以获得在编码音频信息内编码的模式信息。用于生成音频输出信号的装置200的信号处理器220被配置为:通过根据所指示的舒适噪声生成模式生成舒适噪声来生成音频输出信号。
图3示出了根据实施例的用于选择舒适噪声生成模式的逐步方法。
在步骤310中,使用噪声估计器来估计频域中的背景噪声能量。这通常按照每个频带的基础上执行,从而产生每频带的能量估计N[i],其中0≤i<N并且N是频带数目(如N=20)。
可以使用产生背景噪声能量的每频带估计的任何噪声估计器。一个示例是在G.718(ITU-T G.718第6.7节)中使用的噪声估计器。
在步骤320中,使用下式计算低频中的背景噪声能量:
其中I1和I2可取决于信号带宽,例如对于NB,I1=1,I2=9,以及对于WB,I1=0,I2=10。
L可被视为上述的低频背景噪声值。
在步骤330中,使用下式计算高频中的背景噪声能量:
其中,I3和I4可取决于信号带宽,例如对于NB,I3=16,I4=17以及对于WB,I3=19,I4=20。
H可被视为上述的高频背景噪声值。
步骤320和330可以例如随后执行或彼此独立地执行。
在步骤340中,使用下式计算背景噪声倾斜
一些实施例可以例如根据步骤350继续进行。在步骤350中,对背景噪声倾斜进行平滑,从而产生背景噪声倾斜的长期版本TLT=αTLT+(1-α)T
其中α例如是0.9。在该递归等式中,等号左侧的TLT是上文提到的当前长期倾斜值TcLT,而等号右侧的TLT是上文提到的先前的长期倾斜值TpLT。
在步骤360中,使用下述具有滞后的分类器最终选择CNG模式:
If(cng_mode_prev==LP_CNG andTLT>thr1)then cng_mode=FD_CNG
If(cng_mode_prev==FD_CNG andTLT<thr2)then cng_mode=LP_CNG
其中,thr1和thr2可取决于带宽,例如,对于NB,thr1=9,thr2=2,以及对于WB thr1=45,thr2=10。
cng_mode是选择器110(当前)选择的舒适噪声生成模式。
cng_mode_prev是先前选择的(舒适噪声)生成模式,其是选择器110先前已经选择的。
当没有满足步骤360中的上述条件中的任何一个时会发生什么将取决于实现。在一个实施例中,例如,如果没有满足步骤360中的两个条件中的任何一个,则CNG模式可以保持与原来相同,使得
cng_mode=cng_mode_prev。
其他实施例可以实现其他选择策略。
在图3的实施例中,thr1不等于thr2,然而在另一些实施例中,thr1等于thr2。
可以通过以下实施例进一步实现本发明,这些实施例可以与本文描述和要求保护的任何示例和实施例相组合:
1.一种用于对音频信息进行编码的装置,包括:
选择器(110),用于根据音频输入信号的背景噪声特性,从两个或更多个舒适噪声生成模式中选择舒适噪声生成模式;以及
编码单元(120),用于对所述音频信息进行编码,其中所述音频信息包括指示所选的舒适噪声生成模式的模式信息,
其中所述两个或更多个舒适噪声生成模式中的第一个是频域舒适噪声生成模式,并且所述频域舒适噪声生成模式指示:应在频域中生成所述舒适噪声,并且在频域中生成的所述舒适噪声应被执行频率到时间的转换。
2.根据实施例1所述的装置,
其中所述选择器(110)被配置为:将所述音频输入信号的背景噪声的倾斜确定为所述背景噪声特性;以及
其中所述选择器(110)被配置为:根据所确定的倾斜从两个或更多个舒适噪声生成模式中选择所述舒适噪声生成模式。
3.根据实施例2所述的装置,
其中,所述装置还包括:噪声估计器(105),用于针对多个频带中的每个频带估计所述背景噪声的每频带估计;以及
其中,所述选择器(110)被配置为根据所述多个频带的估计的背景噪声来确定所述倾斜。
4.根据实施例3所述的装置,
其中,所述噪声估计器(105)被配置为:根据所述多个频带中的第一组中的每个频带的背景噪声的每频带估计,确定指示所述多个频带中的第一组的第一背景噪声能量的低频背景噪声值,
其中所述噪声估计器(105)被配置为:根据所述多个频带中的第二组中的每个频带的背景噪声的每频带估计,确定指示所述多个频带中的第二组的第二背景噪声能量的高频背景噪声值,其中所述第一组中的至少一个频带具有的中心频率比所述第二组中的至少一个频带的中心频率低,以及
其中所述选择器(110)被配置为:根据所述低频背景噪声值和所述高频背景噪声值来确定所述倾斜。
5.根据实施例4所述的装置,
其中所述噪声估计器(105)被配置为按照下式确定所述低频背景噪声值L:
其中i表示第一组频带中的第i个频带,I1表示所述多个频带中的第一频带,I2表示所述多个频带中的第二频带,以及N[i]表示第i个频带的背景噪声能量的能量估计,
其中所述噪声估计器(105)被配置为按照下式确定所述高频背景噪声值H:
其中i表示第二组频带中的第i个频带,I3表示所述多个频带中的第三频带,I4表示所述多个频带中的第四频带,以及N[i]表示第i个频带的背景噪声能量的能量估计。
6.根据实施例4所述的装置,
其中,所述选择器(110)被配置为:
按照公式或者
按照公式或者
按照公式T=L-H,或者
按照公式T=H-L,
根据所述低频背景噪声值L和所述高频背景噪声值H来确定倾斜T。
7.根据实施例2所述的装置,
其中,所述选择器(110)被配置为将所述倾斜确定为当前短期倾斜值(T),
其中,所述选择器(110)被配置为根据当前短期倾斜值和先前的长期倾斜值来确定当前长期倾斜值,
其中,所述选择器(110)被配置为根据当前长期倾斜值选择两个或更多个舒适噪声生成模式之一。
8.根据实施例7所述的装置,
其中,所述选择器(110)被配置为按照下述公式确定当前长期倾斜值TcLT:
TcLT=αTpLT+(1-α)T,
其中
T是当前短期倾斜值,
TpLT是所述先前的长期倾斜值,以及
α是实数,且0<α<1。
9.根据实施例7所述的装置,
其中所述两个或更多个舒适噪声生成模式中的第一个是频域舒适噪声生成模式,
其中,所述两个或更多个舒适噪声生成模式中的第二个是线性预测域舒适噪声生成模式,
其中,所述选择器(110)被配置为:如果先前选择的生成模式是线性预测域舒适噪声生成模式并且当前长期倾斜值大于第一阈值,则选择频域舒适噪声生成模式,其中所述先前选择的生成模式是由所述选择器(110)先前选择的,以及
其中所述选择器(110)被配置为:如果先前选择的生成模式是频域舒适噪声生成模式并且当前长期倾斜值小于第二阈值,则选择线性预测域舒适噪声生成模式,其中所述先前选择的生成模式是由所述选择器(110)先前选择的。
10.一种用于基于接收的编码音频信息生成音频输出信号的装置,包括:
解码单元(210),用于对编码音频信息进行解码以获得在所述编码音频信息内编码的模式信息,其中所述模式信息指示两个或更多个舒适噪声生成模式中的所指示的舒适噪声生成模式;以及
信号处理器(220),用于通过根据所指示的舒适噪声生成模式生成舒适噪声来生成所述音频输出信号,
其中所述两个或更多个舒适噪声生成模式中的第一个是频域舒适噪声生成模式,以及
其中所述信号处理器被配置为:如果所指示的舒适噪声生成模式是频域舒适噪声生成模式,则在频域中生成舒适噪声,并且对在频域中生成的所述舒适噪声进行频率到时间的转换。
11.根据实施例10所述的装置,
其中所述两个或更多个舒适噪声生成模式中的第二个是线性预测域舒适噪声生成模式,以及
其中所述信号处理器(220)被配置为:如果所指示的舒适噪声生成模式是线性预测域舒适噪声生成模式,则通过使用线性预测滤波器来生成所述舒适噪声。
12.一种系统,包括:
根据实施例1至9之一所述的用于对音频信息进行编码的装置(100),
根据实施例10或11所述的用于基于接收的编码音频信息生成音频输出信号的装置(200),
其中根据实施例1至9之一所述的装置(100)的选择器(110)被配置为:根据音频输入信号的背景噪声特性从两个或更多个舒适噪声生成模式中选择舒适噪声生成模式,
其中根据实施例1至9之一所述的装置(100)的编码单元(120)被配置为:对所述音频信息进行编码以获得编码音频信息,其中所述音频信息包括将所选的舒适噪声生成模式指示为所指示的舒适噪声生成模式的模式信息,
其中,根据实施例10或11所述的装置(200)的解码单元(210)被配置为接收所述编码音频信息,并且还被配置为对所述编码音频信息进行解码以获得在所述编码音频信息内编码的模式信息,以及
其中,根据实施例10或11所述的装置(200)的信号处理器(220)被配置为:通过根据所指示的舒适噪声生成模式生成舒适噪声来生成所述音频输出信号。
13.一种用于对音频信息进行编码的方法,包括:
根据音频输入信号的背景噪声特性从两个或更多个舒适噪声生成模式中选择舒适噪声生成模式;以及
对所述音频信息进行编码,其中所述音频信息包括指示所选的舒适噪声生成模式的模式信息,
其中所述两个或更多个舒适噪声生成模式中的第一个是频域舒适噪声生成模式,并且所述频域舒适噪声生成模式指示:应在频域中生成所述舒适噪声,并且在频域中生成的所述舒适噪声应被执行频率到时间的转换。
14.一种用于基于接收的编码音频信息生成音频输出信号的方法,包括:
对所述编码音频信息进行解码以获得在所述编码音频信息内编码的模式信息,其中所述模式信息指示两个或更多个舒适噪声生成模式中的所指示的舒适噪声生成模式,以及
通过根据所指示的舒适噪声生成模式生成舒适噪声来生成所述音频输出信号,
其中所述两个或更多个舒适噪声生成模式中的第一个是频域舒适噪声生成模式,以及
其中所述信号处理器被配置为:如果所指示的舒适噪声生成模式是频域舒适噪声生成模式,则在频域中生成舒适噪声,并且对在频域中生成的所述舒适噪声进行频率到时间的转换。
15.一种计算机可读介质,存储有用于当在计算机或信号处理器上执行时实现根据实施例13或14所述的方法的计算机程序。
虽然已经在装置的上下文中描述了一些方面,但是将清楚的是,这些方面还表示对相应方法的描述,其中,框或设备对应于方法步骤或方法步骤的特征。类似地,在方法步骤的上下文中描述的方案也表示对相应块或项或者相应装置的特征的描述。
新颖的解构信号可以存储在数字存储介质上,或者可以在诸如无线传输介质或有线传输介质(例如,互联网)等的传输介质上传输。
取决于某些实现要求,可以在硬件中或在软件中实现本发明的实施例。可以使用其上存储有电子可读控制信号的数字存储介质(例如,软盘、DVD、CD、ROM、PROM、EPROM、EEPROM或闪存)来执行该实现,该电子可读控制信号与可编程计算机系统协作(或者能够与之协作)从而执行相应方法。
根据本发明的一些实施例包括具有电子可读控制信号的非瞬时数据载体,该电子可读控制信号能够与可编程计算机系统协作从而执行本文所述的方法之一。
通常,本发明的实施例可以实现为具有程序代码的计算机程序产品,程序代码可操作以在计算机程序产品在计算机上运行时执行方法之一。程序代码可以例如存储在机器可读载体上。
其他实施例包括存储在机器可读载体上的计算机程序,该计算机程序用于执行本文所述的方法之一。
换言之,本发明方法的实施例因此是具有程序代码的计算机程序,该程序代码用于在计算机程序在计算机上运行时执行本文所述的方法之一。
因此,本发明方法的另一实施例是其上记录有计算机程序的数据载体(或者数字存储介质或计算机可读介质),该计算机程序用于执行本文所述的方法之一。
因此,本发明方法的另一实施例是表示计算机程序的数据流或信号序列,所述计算机程序用于执行本文所述的方法之一。数据流或信号序列可以例如被配置为经由数据通信连接(例如,经由互联网)传送。
另一实施例包括处理装置,例如,计算机或可编程逻辑器件,所述处理装置被配置为或适于执行本文所述的方法之一。
另一实施例包括其上安装有计算机程序的计算机,该计算机程序用于执行本文所述的方法之一。
在一些实施例中,可编程逻辑器件(例如,现场可编程门阵列)可以用于执行本文所述的方法的功能中的一些或全部。在一些实施例中,现场可编程门阵列可以与微处理器协作以执行本文所述的方法之一。通常,方法优选地由任意硬件装置来执行。
上述实施例对于本发明的原理仅是说明性的。应当理解的是:本文所述的布置和细节的修改和变形对于本领域其他技术人员将是显而易见的。因此,旨在仅由所附专利权利要求的范围来限制而不是由借助对本文的实施例的描述和解释所给出的具体细节来限制。
Claims (15)
1.一种用于对音频信息进行编码的装置,包括:
选择器(110),用于根据音频输入信号的背景噪声特性,从两个或更多个舒适噪声生成模式中选择舒适噪声生成模式;以及
编码单元(120),用于对所述音频信息进行编码,其中所述音频信息包括指示所选的舒适噪声生成模式的模式信息,
其中所述两个或更多个舒适噪声生成模式中的第一个是频域舒适噪声生成模式。
2.根据权利要求1所述的装置,
其中所述选择器(110)被配置为:将所述音频输入信号的背景噪声的倾斜确定为所述背景噪声特性;以及
其中所述选择器(110)被配置为:根据所确定的倾斜从两个或更多个舒适噪声生成模式中选择所述舒适噪声生成模式。
3.根据权利要求2所述的装置,
其中,所述装置还包括:噪声估计器(105),用于针对多个频带中的每个频带估计所述背景噪声的每频带估计;以及
其中,所述选择器(110)被配置为根据所述多个频带的估计的背景噪声来确定所述倾斜。
4.根据权利要求3所述的装置,
其中,所述噪声估计器(105)被配置为:根据所述多个频带中的第一组中的每个频带的背景噪声的每频带估计,确定指示所述多个频带中的第一组的第一背景噪声能量的低频背景噪声值,
其中所述噪声估计器(105)被配置为:根据所述多个频带中的第二组中的每个频带的背景噪声的每频带估计,确定指示所述多个频带中的第二组的第二背景噪声能量的高频背景噪声值,其中所述第一组中的至少一个频带具有的中心频率比所述第二组中的至少一个频带的中心频率低,以及
其中所述选择器(110)被配置为:根据所述低频背景噪声值和所述高频背景噪声值来确定所述倾斜。
5.根据权利要求4所述的装置,
其中所述噪声估计器(105)被配置为按照下式确定所述低频背景噪声值L:
其中i表示第一组频带中的第i个频带,I1表示所述多个频带中的第一频带,I2表示所述多个频带中的第二频带,以及N[i]表示第i个频带的背景噪声能量的能量估计,
其中所述噪声估计器(105)被配置为按照下式确定所述高频背景噪声值H:
其中i表示第二组频带中的第i个频带,I3表示所述多个频带中的第三频带,I4表示所述多个频带中的第四频带,以及N[i]表示第i个频带的背景噪声能量的能量估计。
6.根据权利要求4所述的装置,
其中,所述选择器(110)被配置为:
按照公式或者
按照公式或者
按照公式T=L–H,或者
按照公式T=H–L,
根据所述低频背景噪声值L和所述高频背景噪声值H来确定倾斜T。
7.根据权利要求2所述的装置,
其中,所述选择器(110)被配置为将所述倾斜确定为当前短期倾斜值(T),
其中,所述选择器(110)被配置为根据当前短期倾斜值和先前的长期倾斜值来确定当前长期倾斜值,
其中,所述选择器(110)被配置为根据当前长期倾斜值选择两个或更多个舒适噪声生成模式之一。
8.根据权利要求7所述的装置,
其中,所述选择器(110)被配置为按照下述公式确定当前长期倾斜值TcLT:
TcLT=αTpLT+(1–α)T,
其中
T是当前短期倾斜值,
TpLT是所述先前的长期倾斜值,以及
α是实数,且0<α<1。
9.根据权利要求7所述的装置,
其中所述两个或更多个舒适噪声生成模式中的第一个是频域舒适噪声生成模式,
其中,所述两个或更多个舒适噪声生成模式中的第二个是线性预测域舒适噪声生成模式,
其中,所述选择器(110)被配置为:如果先前选择的生成模式是线性预测域舒适噪声生成模式并且当前长期倾斜值大于第一阈值,则选择频域舒适噪声生成模式,其中所述先前选择的生成模式是由所述选择器(110)先前选择的,以及
其中所述选择器(110)被配置为:如果先前选择的生成模式是频域舒适噪声生成模式并且当前长期倾斜值小于第二阈值,则选择线性预测域舒适噪声生成模式,其中所述先前选择的生成模式是由所述选择器(110)先前选择的。
10.一种用于基于接收的编码音频信息生成音频输出信号的装置,包括:
解码单元(210),用于对编码音频信息进行解码以获得在所述编码音频信息内编码的模式信息,其中所述模式信息指示两个或更多个舒适噪声生成模式中的所指示的舒适噪声生成模式;以及
信号处理器(220),用于通过根据所指示的舒适噪声生成模式生成舒适噪声来生成所述音频输出信号,
其中所述两个或更多个舒适噪声生成模式中的第一个是频域舒适噪声生成模式。
11.根据权利要求10所述的装置,
其中所述两个或更多个舒适噪声生成模式中的第二个是线性预测域舒适噪声生成模式,以及
其中所述信号处理器(220)被配置为:如果所指示的舒适噪声生成模式是线性预测域舒适噪声生成模式,则通过使用线性预测滤波器来生成所述舒适噪声。
12.一种系统,包括:
根据权利要求1至9之一所述的用于对音频信息进行编码的装置(100),
根据权利要求10或11所述的用于基于接收的编码音频信息生成音频输出信号的装置(200),
其中根据权利要求1至9之一所述的装置(100)的选择器(110)被配置为:根据音频输入信号的背景噪声特性从两个或更多个舒适噪声生成模式中选择舒适噪声生成模式,
其中根据权利要求1至9之一所述的装置(100)的编码单元(120)被配置为:对所述音频信息进行编码以获得编码音频信息,其中所述音频信息包括将所选的舒适噪声生成模式指示为所指示的舒适噪声生成模式的模式信息,
其中,根据权利要求10或11所述的装置(200)的解码单元(210)被配置为接收所述编码音频信息,并且还被配置为对所述编码音频信息进行解码以获得在所述编码音频信息内编码的模式信息,以及
其中,根据权利要求10或11所述的装置(200)的信号处理器(220)被配置为:通过根据所指示的舒适噪声生成模式生成舒适噪声来生成所述音频输出信号。
13.一种用于对音频信息进行编码的方法,包括:
根据音频输入信号的背景噪声特性从两个或更多个舒适噪声生成模式中选择舒适噪声生成模式;以及
对所述音频信息进行编码,其中所述音频信息包括指示所选的舒适噪声生成模式的模式信息,
其中所述两个或更多个舒适噪声生成模式中的第一个是频域舒适噪声生成模式。
14.一种用于基于接收的编码音频信息生成音频输出信号的方法,包括:
对所述编码音频信息进行解码以获得在所述编码音频信息内编码的模式信息,其中所述模式信息指示两个或更多个舒适噪声生成模式中的所指示的舒适噪声生成模式,以及
通过根据所指示的舒适噪声生成模式生成舒适噪声来生成所述音频输出信号,
其中所述两个或更多个舒适噪声生成模式中的第一个是频域舒适噪声生成模式。
15.一种计算机可读介质,存储有用于当在计算机或信号处理器上执行时实现根据权利要求13或14所述的方法的计算机程序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110274103.7A CN113140224B (zh) | 2014-07-28 | 2015-07-16 | 用于舒适噪声生成模式选择的装置和方法 |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP14178782.0A EP2980790A1 (en) | 2014-07-28 | 2014-07-28 | Apparatus and method for comfort noise generation mode selection |
EP14178782.0 | 2014-07-28 | ||
CN202110274103.7A CN113140224B (zh) | 2014-07-28 | 2015-07-16 | 用于舒适噪声生成模式选择的装置和方法 |
PCT/EP2015/066323 WO2016016013A1 (en) | 2014-07-28 | 2015-07-16 | Apparatus and method for comfort noise generation mode selection |
CN201580040583.3A CN106663436B (zh) | 2014-07-28 | 2015-07-16 | 用于舒适噪声生成模式选择的装置和方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580040583.3A Division CN106663436B (zh) | 2014-07-28 | 2015-07-16 | 用于舒适噪声生成模式选择的装置和方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113140224A CN113140224A (zh) | 2021-07-20 |
CN113140224B true CN113140224B (zh) | 2024-02-27 |
Family
ID=51224868
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110274103.7A Active CN113140224B (zh) | 2014-07-28 | 2015-07-16 | 用于舒适噪声生成模式选择的装置和方法 |
CN201580040583.3A Active CN106663436B (zh) | 2014-07-28 | 2015-07-16 | 用于舒适噪声生成模式选择的装置和方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580040583.3A Active CN106663436B (zh) | 2014-07-28 | 2015-07-16 | 用于舒适噪声生成模式选择的装置和方法 |
Country Status (18)
Country | Link |
---|---|
US (3) | US10089993B2 (zh) |
EP (3) | EP2980790A1 (zh) |
JP (3) | JP6494740B2 (zh) |
KR (1) | KR102008488B1 (zh) |
CN (2) | CN113140224B (zh) |
AR (1) | AR101342A1 (zh) |
AU (1) | AU2015295679B2 (zh) |
CA (1) | CA2955757C (zh) |
ES (1) | ES2802373T3 (zh) |
MX (1) | MX360556B (zh) |
MY (1) | MY181456A (zh) |
PL (1) | PL3175447T3 (zh) |
PT (1) | PT3175447T (zh) |
RU (1) | RU2696466C2 (zh) |
SG (1) | SG11201700688RA (zh) |
TW (1) | TWI587287B (zh) |
WO (1) | WO2016016013A1 (zh) |
ZA (1) | ZA201701285B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6424942B1 (en) * | 1998-10-26 | 2002-07-23 | Telefonaktiebolaget Lm Ericsson (Publ) | Methods and arrangements in a telecommunications system |
CN1470052A (zh) * | 2000-10-18 | 2004-01-21 | ��˹��ŵ�� | 宽带语音编解码器中的高频增强层编码 |
JP2004078235A (ja) * | 2003-09-11 | 2004-03-11 | Nec Corp | 複数レートで動作する無音声符号化を含む音声符号化・復号装置 |
US6782361B1 (en) * | 1999-06-18 | 2004-08-24 | Mcgill University | Method and apparatus for providing background acoustic noise during a discontinued/reduced rate transmission mode of a voice transmission system |
WO2008148321A1 (fr) * | 2007-06-05 | 2008-12-11 | Huawei Technologies Co., Ltd. | Appareil de codage et de décodage et procédé de traitement du bruit de fond et dispositif de communication utilisant cet appareil |
CN101430880A (zh) * | 2007-11-07 | 2009-05-13 | 华为技术有限公司 | 一种背景噪声的编解码方法和装置 |
JP2010518453A (ja) * | 2007-02-14 | 2010-05-27 | マインドスピード テクノロジーズ インコーポレイテッド | エンベデッド無音及び背景雑音圧縮 |
CN102136271A (zh) * | 2011-02-09 | 2011-07-27 | 华为技术有限公司 | 舒适噪声生成器、方法及回声抵消装置 |
CN103548078A (zh) * | 2011-02-14 | 2014-01-29 | 弗兰霍菲尔运输应用研究公司 | 支持时域及频域编码模式的音频编解码器 |
US8767974B1 (en) * | 2005-06-15 | 2014-07-01 | Hewlett-Packard Development Company, L.P. | System and method for generating comfort noise |
Family Cites Families (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3989897A (en) * | 1974-10-25 | 1976-11-02 | Carver R W | Method and apparatus for reducing noise content in audio signals |
FI110826B (fi) * | 1995-06-08 | 2003-03-31 | Nokia Corp | Akustisen kaiun poisto digitaalisessa matkaviestinjärjestelmässä |
EP0856185B1 (en) | 1995-10-20 | 2003-08-13 | America Online, Inc. | Repetitive sound compression system |
US5794199A (en) * | 1996-01-29 | 1998-08-11 | Texas Instruments Incorporated | Method and system for improved discontinuous speech transmission |
US5903819A (en) * | 1996-03-13 | 1999-05-11 | Ericsson Inc. | Noise suppressor circuit and associated method for suppressing periodic interference component portions of a communication signal |
US5960389A (en) * | 1996-11-15 | 1999-09-28 | Nokia Mobile Phones Limited | Methods for generating comfort noise during discontinuous transmission |
US6163608A (en) * | 1998-01-09 | 2000-12-19 | Ericsson Inc. | Methods and apparatus for providing comfort noise in communications systems |
JP2003501925A (ja) * | 1999-06-07 | 2003-01-14 | エリクソン インコーポレイテッド | パラメトリックノイズモデル統計値を用いたコンフォートノイズの生成方法及び装置 |
US6510409B1 (en) * | 2000-01-18 | 2003-01-21 | Conexant Systems, Inc. | Intelligent discontinuous transmission and comfort noise generation scheme for pulse code modulation speech coders |
US6662155B2 (en) * | 2000-11-27 | 2003-12-09 | Nokia Corporation | Method and system for comfort noise generation in speech communication |
US20030120484A1 (en) * | 2001-06-12 | 2003-06-26 | David Wong | Method and system for generating colored comfort noise in the absence of silence insertion description packets |
US20030093270A1 (en) * | 2001-11-13 | 2003-05-15 | Domer Steven M. | Comfort noise including recorded noise |
US6832195B2 (en) * | 2002-07-03 | 2004-12-14 | Sony Ericsson Mobile Communications Ab | System and method for robustly detecting voice and DTX modes |
CN1703736A (zh) * | 2002-10-11 | 2005-11-30 | 诺基亚有限公司 | 用于源控制可变比特率宽带语音编码的方法和装置 |
WO2006136901A2 (en) * | 2005-06-18 | 2006-12-28 | Nokia Corporation | System and method for adaptive transmission of comfort noise parameters during discontinuous speech transmission |
US7610197B2 (en) * | 2005-08-31 | 2009-10-27 | Motorola, Inc. | Method and apparatus for comfort noise generation in speech communication systems |
US8032370B2 (en) * | 2006-05-09 | 2011-10-04 | Nokia Corporation | Method, apparatus, system and software product for adaptation of voice activity detection parameters based on the quality of the coding modes |
CN101087319B (zh) * | 2006-06-05 | 2012-01-04 | 华为技术有限公司 | 一种发送和接收背景噪声的方法和装置及静音压缩系统 |
CN101246688B (zh) * | 2007-02-14 | 2011-01-12 | 华为技术有限公司 | 一种对背景噪声信号进行编解码的方法、系统和装置 |
US20080208575A1 (en) * | 2007-02-27 | 2008-08-28 | Nokia Corporation | Split-band encoding and decoding of an audio signal |
CN101743586B (zh) * | 2007-06-11 | 2012-10-17 | 弗劳恩霍夫应用研究促进协会 | 音频编码器、编码方法、解码器、解码方法 |
CN101394225B (zh) * | 2007-09-17 | 2013-06-05 | 华为技术有限公司 | 一种话音传输的方法和装置 |
CN101335003B (zh) * | 2007-09-28 | 2010-07-07 | 华为技术有限公司 | 噪声生成装置、及方法 |
US8139777B2 (en) * | 2007-10-31 | 2012-03-20 | Qnx Software Systems Co. | System for comfort noise injection |
DE102008009720A1 (de) * | 2008-02-19 | 2009-08-20 | Siemens Enterprise Communications Gmbh & Co. Kg | Verfahren und Mittel zur Dekodierung von Hintergrundrauschinformationen |
DE102008009719A1 (de) * | 2008-02-19 | 2009-08-20 | Siemens Enterprise Communications Gmbh & Co. Kg | Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen |
CN101483495B (zh) * | 2008-03-20 | 2012-02-15 | 华为技术有限公司 | 一种背景噪声生成方法以及噪声处理装置 |
PL2676264T3 (pl) | 2011-02-14 | 2015-06-30 | Fraunhofer Ges Forschung | Koder audio estymujący szum tła podczas faz aktywnych |
KR101551046B1 (ko) | 2011-02-14 | 2015-09-07 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 저-지연 통합 스피치 및 오디오 코딩에서 에러 은닉을 위한 장치 및 방법 |
EP3373296A1 (en) * | 2011-02-14 | 2018-09-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Noise generation in audio codecs |
US20120237048A1 (en) * | 2011-03-14 | 2012-09-20 | Continental Automotive Systems, Inc. | Apparatus and method for echo suppression |
CN102903364B (zh) * | 2011-07-29 | 2017-04-12 | 中兴通讯股份有限公司 | 一种进行语音自适应非连续传输的方法及装置 |
CN103093756B (zh) * | 2011-11-01 | 2015-08-12 | 联芯科技有限公司 | 舒适噪声生成方法及舒适噪声生成器 |
CN103137133B (zh) * | 2011-11-29 | 2017-06-06 | 南京中兴软件有限责任公司 | 非激活音信号参数估计方法及舒适噪声产生方法及系统 |
CA2894625C (en) | 2012-12-21 | 2017-11-07 | Anthony LOMBARD | Generation of a comfort noise with high spectro-temporal resolution in discontinuous transmission of audio signals |
MY178710A (en) * | 2012-12-21 | 2020-10-20 | Fraunhofer Ges Forschung | Comfort noise addition for modeling background noise at low bit-rates |
CN103680509B (zh) * | 2013-12-16 | 2016-04-06 | 重庆邮电大学 | 一种语音信号非连续传输及背景噪声生成方法 |
-
2014
- 2014-07-28 EP EP14178782.0A patent/EP2980790A1/en not_active Withdrawn
-
2015
- 2015-07-16 RU RU2017105449A patent/RU2696466C2/ru active
- 2015-07-16 KR KR1020177005524A patent/KR102008488B1/ko active IP Right Grant
- 2015-07-16 SG SG11201700688RA patent/SG11201700688RA/en unknown
- 2015-07-16 CA CA2955757A patent/CA2955757C/en active Active
- 2015-07-16 WO PCT/EP2015/066323 patent/WO2016016013A1/en active Application Filing
- 2015-07-16 MX MX2017001237A patent/MX360556B/es active IP Right Grant
- 2015-07-16 ES ES15738365T patent/ES2802373T3/es active Active
- 2015-07-16 MY MYPI2017000134A patent/MY181456A/en unknown
- 2015-07-16 EP EP20172529.8A patent/EP3706120A1/en active Pending
- 2015-07-16 EP EP15738365.4A patent/EP3175447B1/en active Active
- 2015-07-16 CN CN202110274103.7A patent/CN113140224B/zh active Active
- 2015-07-16 AU AU2015295679A patent/AU2015295679B2/en active Active
- 2015-07-16 JP JP2017504787A patent/JP6494740B2/ja active Active
- 2015-07-16 PL PL15738365T patent/PL3175447T3/pl unknown
- 2015-07-16 PT PT157383654T patent/PT3175447T/pt unknown
- 2015-07-16 CN CN201580040583.3A patent/CN106663436B/zh active Active
- 2015-07-22 TW TW104123733A patent/TWI587287B/zh active
- 2015-07-28 AR ARP150102396A patent/AR101342A1/es active IP Right Grant
-
2017
- 2017-01-27 US US15/417,228 patent/US10089993B2/en active Active
- 2017-02-21 ZA ZA2017/01285A patent/ZA201701285B/en unknown
-
2018
- 2018-09-25 US US16/141,115 patent/US11250864B2/en active Active
-
2019
- 2019-03-05 JP JP2019039146A patent/JP6859379B2/ja active Active
-
2021
- 2021-03-25 JP JP2021051567A patent/JP7258936B2/ja active Active
-
2022
- 2022-01-04 US US17/568,498 patent/US12009000B2/en active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6424942B1 (en) * | 1998-10-26 | 2002-07-23 | Telefonaktiebolaget Lm Ericsson (Publ) | Methods and arrangements in a telecommunications system |
US6782361B1 (en) * | 1999-06-18 | 2004-08-24 | Mcgill University | Method and apparatus for providing background acoustic noise during a discontinued/reduced rate transmission mode of a voice transmission system |
CN1470052A (zh) * | 2000-10-18 | 2004-01-21 | ��˹��ŵ�� | 宽带语音编解码器中的高频增强层编码 |
JP2004078235A (ja) * | 2003-09-11 | 2004-03-11 | Nec Corp | 複数レートで動作する無音声符号化を含む音声符号化・復号装置 |
US8767974B1 (en) * | 2005-06-15 | 2014-07-01 | Hewlett-Packard Development Company, L.P. | System and method for generating comfort noise |
JP2010518453A (ja) * | 2007-02-14 | 2010-05-27 | マインドスピード テクノロジーズ インコーポレイテッド | エンベデッド無音及び背景雑音圧縮 |
WO2008148321A1 (fr) * | 2007-06-05 | 2008-12-11 | Huawei Technologies Co., Ltd. | Appareil de codage et de décodage et procédé de traitement du bruit de fond et dispositif de communication utilisant cet appareil |
CN101430880A (zh) * | 2007-11-07 | 2009-05-13 | 华为技术有限公司 | 一种背景噪声的编解码方法和装置 |
CN102136271A (zh) * | 2011-02-09 | 2011-07-27 | 华为技术有限公司 | 舒适噪声生成器、方法及回声抵消装置 |
CN103548078A (zh) * | 2011-02-14 | 2014-01-29 | 弗兰霍菲尔运输应用研究公司 | 支持时域及频域编码模式的音频编解码器 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102834862B (zh) | 用于包括通用音频和语音帧的音频信号的编码器 | |
US20210166704A1 (en) | Generation of Comfort Noise | |
RU2676870C1 (ru) | Декодер для формирования аудиосигнала с улучшенной частотной характеристикой, способ декодирования, кодер для формирования кодированного сигнала и способ кодирования с использованием компактной дополнительной информации для выбора | |
CN104299614B (zh) | 解码方法和解码装置 | |
CN113140224B (zh) | 用于舒适噪声生成模式选择的装置和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |