CN111587456B - 时域噪声整形 - Google Patents
时域噪声整形 Download PDFInfo
- Publication number
- CN111587456B CN111587456B CN201880086260.1A CN201880086260A CN111587456B CN 111587456 B CN111587456 B CN 111587456B CN 201880086260 A CN201880086260 A CN 201880086260A CN 111587456 B CN111587456 B CN 111587456B
- Authority
- CN
- China
- Prior art keywords
- filter
- filtering
- tns
- impulse response
- controller
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007493 shaping process Methods 0.000 title claims abstract description 22
- 238000001914 filtration Methods 0.000 claims abstract description 112
- 230000004044 response Effects 0.000 claims abstract description 103
- 238000000034 method Methods 0.000 claims abstract description 64
- 230000002123 temporal effect Effects 0.000 claims abstract description 17
- 230000007423 decrease Effects 0.000 claims description 11
- 230000005236 sound signal Effects 0.000 claims description 9
- 238000012886 linear function Methods 0.000 claims description 5
- 238000002646 transcutaneous electrical nerve stimulation Methods 0.000 claims 1
- 238000001228 spectrum Methods 0.000 description 16
- 238000004590 computer program Methods 0.000 description 9
- 238000013139 quantization Methods 0.000 description 9
- 230000009467 reduction Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 5
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 2
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 2
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 2
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 2
- 238000005311 autocorrelation function Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000000593 degrading effect Effects 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000006735 deficit Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0224—Processing in the time domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Picture Signal Circuits (AREA)
- Error Detection And Correction (AREA)
- Noise Elimination (AREA)
Abstract
存在用于执行时域噪声整形的所论述方法和装置。一种装置可包括:时域噪声整形TNS工具(11),其用于对包括多个帧的信息信号执行线性预测LP滤波(S33,S35,S36);以及控制器(12),其被配置为控制所述TNS工具(11),使得所述TNS工具(11)利用以下执行LP滤波:第一滤波器(14a),其脉冲响应具有较高能量(S36);以及第二滤波器(15a),其脉冲响应具有低于所述第一滤波器的能量(S35),其中所述第二滤波器并非恒等滤波器,其中所述控制器(12)被配置为基于帧量度在利用所述第一滤波器(14a)进行滤波(S36)与利用所述第二滤波器(15a)进行滤波(S35)之间进行选择(S34)。
Description
技术领域
本文中的示例涉及编码和解码装置,特别涉及用于执行时域噪声整形(TNS)的编码和解码装置。
背景技术
以下现有技术文献属于现有技术:
[1]Herre,Jürgen,and James D.Johnston.“Enhancing the performance ofperceptual audio coders by using temporal noise shaping(TNS).(通过使用时域噪声整形(TNS)增强感知音频编码器的性能。)”Audio Engineering Society Convention101.Audio Engineering Society,1996(101音频工程学会会议,音频工程学会,1996年)。
[2]Herre,Jurgen,and James D.Johnston.“Continuously signal-adaptivefilterbank for high-quality perceptual audio coding.(用于高质量感知音频编码的连续信号自适应性滤波器组。)”Applications of Signal Processing to Audio andAcoustics,1997.1997IEEE ASSP Workshop on.IEEE,1997(信号处理对音频和声学的应用,1997年,IEEE的1997IEEE ASSP工作组,1997年)。
[3]Herre,Jürgen.“Temporal noise shaping,quantization and codingmethods in perceptual audio coding:A tutorial introduction.(在感知音频编码中的时域噪声整形、量化和编码方法:教程介绍。)”Audio Engineering SocietyConference:17th International Conference:High-Quality Audio Coding.AudioEngineering Society,1999(音频工程学会会议:第17届国际会议:高质量音频编码。音频工程学会,1999年)。
[4]Herre,Juergen Heinrich.“Perceptual noise shaping in the timedomain via LPC prediction in the frequency domain.(经由频域中的LPC预测的时域中的感知噪声整形。)”美国专利第5,781,888号,1998年7月14日。
[5]Herre,Juergen Heinrich.“Enhanced joint stereo coding method usingtemporal envelope shaping.(使用时间包络整形的增强型联合立体声编码方法。)”美国专利第5,812,971号,1998年9月22日。
[6]3GPP TS 26.403;General audio codec audio processing functions;Enhanced aacPlus general audio codec;Encoder specification;Advanced AudioCoding(AAC)part(通用音频编解码器音频处理功能;增强型aacPlus通用音频编解码器;编码器规格;高级音频编码(AAC)部分)。
[7]ISO/IEC 14496-3:2001;Information technology–Coding of audio-visualobjects–Part3:Audio(信息技术-音频视觉对象的编码-部分3:音频)。
[8]3GPP TS 26.445;Codec for Enhanced Voice Services(EVS);Detailedalgorithmic description(用于增强型语音服务(Enhanced Voice Service,EVS)的编解码器;详细算法描述)。
时域噪声整形(TNS)是在90年代开发的用于基于变换的音频编码器的工具(会议论文[1至3]和专利[4至5])。此后,其已集成于诸如MPEG-2AAC、MPEG-4AAC、3GPP E-AAC-Plus、MPEG-D USAC、3GPP EVS、MPEG-H 3D音频的主要的音频编码标准中。
TNS可简要地描述如下。在编码器侧且在量化之前,在频域(FD)中使用线性预测LP对信号进行滤波,以便使信号在时域中平坦。在解码器侧且在反量化之后,在频域中使用逆预测滤波器对信号反向滤波,以便在时域中对量化噪声进行整形,使得其被信号遮蔽。
TNS有效地减少含有诸如响板的尖锐攻击的信号上所谓的预回声伪影(pre-echoartefact)。其对含有诸如语音的类似脉冲的信号的伪静止系列亦有帮助。
TNS通常用于以相对较高的比特率操作的音频编码器中。当用于以低比特率操作的音频编码器中时,TNS有时可引入伪影,从而使音频编码器的质量降级。这些伪影类似咔嗒声或类似噪声且出现在具有语音信号或音调音乐信号的大多数情形中。
本文件中的示例准许抑制或减少TNS的损害,维持其优点。
以下若干示例准许获得用于低比特率音频编码的改良TNS。
发明内容
根据示例,提供一种编码器装置,包括:
时域噪声整形TNS工具,用于对包括多个帧的信息信号执行线性预测LP滤波;以及
控制器,被配置为控制所述TNS工具,使得所述TNS工具通过以下执行LP滤波:
第一滤波器,其脉冲响应具有较高能量;以及
第二滤波器,其脉冲响应具有低于所述第一滤波器的所述脉冲响应的能量,其中所述第二滤波器并非恒等滤波器,
其中所述控制器被配置为基于帧量度在利用所述第一滤波器进行滤波与利用所述第二滤波器进行滤波之间进行选择。
已注意到,可以去除有问题帧上的伪影,同时最少地影响其他帧。
并不是简单地开启/关闭TNS操作,而是代之以可以维持TNS工具的优点,同时减少其损害。因此,通过简单地在必要时减少滤波而非避免滤波,实现了基于反馈的智能型实时控制。
根据示例,所述控制器被进一步配置为:
修改所述第一滤波器以获得所述第二滤波器,在所述第二滤波器中,所述滤波器的脉冲响应能量减小。
因此,可在必要时建立具有减小的脉冲响应能量的第二滤波器。
根据示例,所述控制器被进一步配置为:
将至少一个调整因子应用于所述第一滤波器以获得所述第二滤波器。
通过智能地修改第一滤波器,可产生不可能通过简单地执行开启/关闭TNS的操作实现的滤波状态。获得完全滤波与不滤波之间的至少一个中间状态。若在必要时调用此中间状态,则此中间状态准许减少TNS的缺点,维持其正特性。
根据示例,所述控制器被进一步配置为:
至少基于所述帧量度,定义所述至少一个调整因子。
根据示例,所述控制器被进一步配置为:
基于用于在执行TNS滤波与不执行TNS滤波之间进行选择的TNS滤波确定阈值,定义所述至少一个调整因子。
根据示例,所述控制器被进一步配置为:
使用所述帧量度的线性函数定义所述至少一个调整因子,所述线性函数设为所述帧量度的增加与所述调整因子和/或所述滤波器的脉冲响应能量的增加相对应。
因此,有可能针对不同量度来定义不同的调整因子,以获得最适合于每个帧的滤波器参数。
根据示例,所述控制器被进一步配置为将所述调整因子定义为
其中thresh是所述TNS滤波确定阈值,thresh2是所述滤波类型确定阈值,frameMetrics是一帧量度且γ_min是一固定值。
由所述TNS引起的伪影出现在其中预测增益处于特定区间中的帧中,所述特定区间在此处定义为高于所述TNS滤波确定阈值thresh但小于所述滤波确定阈值thresh2的值的集合。在量度是预测增益的某些情形下,thresh=1.5且thresh2=2,由TNS引起的伪影倾向于在1.5与2之间发生。因此,若干示例准许通过针对1.5<predGain<2减少滤波来克服这些损害。
根据示例,所述控制器被进一步配置为通过应用下式来修改所述第一滤波器的参数以获得所述第二滤波器的参数:
aw(k)=γka(k),k=0,…,K
其中a(k)是所述第一滤波器的参数,γ是所述调整因子使得0<γ<1,aw(k)是所述第二滤波器的参数,且K是所述第一滤波器的阶数。
这是用于获得所述第二滤波器的参数使得脉冲响应能量相对于所述第一滤波器的脉冲响应能量而减小的容易但是有效的技术。
根据示例,所述控制器被进一步配置为从预测增益、所述信息信号的能量和/或预测误差中的至少一个,获得所述帧量度。
这些量度准许容易且可靠地将需要通过所述第二滤波器进行滤波的帧与需要通过所述第一滤波器进行滤波的帧区分开。
根据示例,所述帧量度包括预测增益,所述预测增益如下计算
其中energy是与所述信息信号的能量相关联的项,且predError是与预测误差相关联的项。
根据示例,所述控制器被配置为使得:
至少对于预测增益的减小和/或所述信息信号的能量的减小,所述第二滤波器的脉冲响应能量减小,和/或至少对于所述预测误差的增加,所述第二滤波器的脉冲响应能量减小。
根据示例,所述控制器被配置为:
将所述帧量度与滤波类型确定阈值(例如,thresh2)进行比较,以在所述帧量度小于所述滤波类型确定阈值时利用所述第一滤波器执行滤波。
因此,易于自动地确定使用所述第一滤波器或使用所述第二滤波器对所述信号进行滤波。
根据示例,所述控制器被配置为:
基于所述帧量度,在执行滤波与不执行滤波之间进行选择。
因此,亦有可能在不适当时完全避免TNS滤波。
在示例中,相同量度可使用两次(通过执行与两个不同阈值的比较):用于在所述第一滤波器与所述第二滤波器之间作出决定,以及用于决定是否进行滤波。
根据示例,所述控制器被配置为:
将所述帧量度与TNS滤波确定阈值进行比较,以在所述帧量度小于所述TNS滤波确定阈值时选择避免TNS滤波。
根据示例,所述装置可进一步包括:
位流编写器,用于利用通过所述TNS获得的反射系数或所述反射系数的经量化版本来准备位流。
这些数据可被存储和/或传输至例如解码器。
根据示例,提供一种系统,其包括编码器侧和解码器侧,其中所述编码器侧包括如上文和/或下文的编码器装置。
根据示例,提供一种用于对包括多个帧的信息信号执行时域噪声整形TNS滤波的方法,所述方法包括:
对于每个帧,基于帧量度,在利用第一滤波器进行滤波与利用第二滤波器进行滤波之间进行选择,所述第一滤波器的脉冲响应具有较高能量,所述第二滤波器的脉冲响应具有低于所述第一滤波器的所述脉冲响应的能量,其中所述第二滤波器并非恒等滤波器;
使用根据在所述第一滤波器与所述第二滤波器之间作出的所述选择的所述滤波,对所述帧进行滤波。
根据示例,提供一种存储指令的非暂时性存储设备,所述指令在由处理器执行时使所述处理器执行上文和/或下文的方法的步骤中的至少一些和/或实施如上文或下文的系统和/或如上文和/或下文的装置。
附图说明
图1示出根据示例的编码器装置。
图2示出根据示例的解码器装置。
图3示出根据示例的方法。
图3A示出根据示例的技术。
图3B和图3C示出根据示例的方法。
图4示出根据示例的方法。
图5示出根据示例的编码器装置。
图6示出根据示例的解码器装置。
图7和图8示出根据示例的编码器装置。
图8(1)至图8(3)示出根据示例的信号演进。
具体实施方式
图1示出编码器装置10。编码器装置10可用于处理(以及传输和/或存储)信息信号,诸如音频信号。信息信号可被划分为一连串的时间帧。各帧可例如在频域FD中表示。所述FD表示可以是一连串的频格(bin),每一频格处于特定频率。所述FD表示可以是频谱。
编码器装置10尤其可包括用于对FD信息信号13(Xs(n))执行TNS滤波的时域噪声整形TNS工具11。编码器装置10尤其可包括TNS控制器12。TNS控制器12可被配置为控制TNS工具11,使得TNS工具11使用至少一个较高脉冲响应能量线性预测(LP)滤波(例如,对于一些帧)和使用至少一个较高脉冲响应能量LP滤波(例如,对于一些其他帧)执行滤波。TNS控制器12被配置为基于与帧相关联的量度(帧量度)执行较高脉冲响应能量LP滤波与较低脉冲响应能量LP滤波之间的选择。第一滤波器的脉冲响应的能量高于第二滤波器的脉冲响应的能量。
FD信息信号13(Xs(n))可例如从经修改的离散余弦变换MDCT工具(或例如,经修改的离散正弦变换MDST)获得,该MDCT工具已将帧的表示从时域TD变换至频域FD。
TNS工具11可例如使用一组线性预测(LP)滤波器参数14(a(k))来处理信号,所述参数可以是第一滤波器14a的参数。TNS工具11也可包括参数14'(aw(k)),所述参数可以是第二滤波器15a(第二滤波器15a可具有与第一滤波器14a的脉冲响应相比具有较低能量的脉冲响应)的参数。参数14'可理解为参数14的经加权版本,且第二滤波器15a可理解为从第一滤波器14a得出。参数尤其可包括以下参数(或其经量化版本)中的一或多个:LP编码LPC系数、反射系数RC、系数rci(k)或其经量化版本rcq(k)、反正弦反射系数ASRC、对数面积比LAR、线谱对LSP、和/或线谱频率LS、或其他种类的此类参数。在示例中,有可能使用滤波器系数的任何表示。
TNS工具11的输出可以是FD信息信号13(Xs(n))的经滤波版本15(Xf(n))。
TNS工具11的另一输出可以是一组输出参数16,诸如反射系数rci(k)(或其经量化版本rcq(k))。
在部件11和12下游,位流编码器可将输出15和16编码到可被传输的(例如,以无线方式,例如使用诸如蓝牙的协议)和/或可被存储的(例如,在大容量存储单元中)的位流中。
TNS滤波提供通常不同于零的反射系数。TNS滤波提供通常不同于输入的输出。
图2示出可使用TNS工具11的输出(或其经处理版本)的解码器装置20。解码器装置20尤其可包括TNS解码器21和TNS解码器控制器22。部件21和22可协作以获得合成输出23举例而言,可向TNS解码器21输入如由解码器装置20获得的信息信号的经解码表示25(或其经处理版本/>)。TNS解码器21可在输入(如输入26)中获得反射系数rci(k)(或其经量化版本rcq(k))。反射系数rci(k)或rcq(k)可以是由编码器装置10在输出16处提供的反射系数rci(k)或rcq(k)的经解码版本。
如图1中所示出,TNS控制器12尤其可基于帧量度17(例如,预测增益或predGain)而控制TNS工具11。举例而言,TNS控制器12可通过在至少较高脉冲响应能量LP滤波和/或较低脉冲响应能量LP滤波之间和/或在滤波与不滤波之间进行选择来执行滤波。除较高脉冲响应能量LP滤波和较低脉冲响应能量LP滤波以外,根据示例,至少一个中间脉冲响应能量LP滤波是可能的。
图1中的参考数字17'是指从TNS控制器12提供至TNS工具14的信息、命令和/或控制数据。举例而言,可将基于量度17的决定(例如,“使用第一滤波器”或“使用第二滤波器”)提供至TNS工具14。也可将关于滤波器的设置提供至TNS工具14。举例而言,可将调整因子(γ)提供至TNS滤波器以便修改第一滤波器14a来获得第二滤波器15a。
量度17可以是例如与帧中的信号的能量相关联的量度(例如,该量度可设为能量愈高,量度愈高)。该量度可以是例如与预测误差相关联的量度(例如,该量度可设为预测误差愈高,量度愈低)。该量度可以是例如与预测误差与信号能量之间的关系相关联的值(例如,该量度可设为能量与预测误差之间的比值愈高,量度愈高)。该量度可以是例如当前帧的预测增益或与当前帧的预测增益相关联或成比例的值(诸如,预测增益愈高,量度愈高)。帧量度(17)可与信号的时间包络的平坦度相关联。
已注意到,仅(或至少主要)在预测增益低时出现由TNS引起的伪影。因此,当预测增益高时,由TNS引起的问题不会出现(或不太容易出现)且有可能执行完全TNS(例如,较高脉冲响应能量LP)。当预测增益极低时,优选的是完全不执行TNS(不滤波)。当预测增益是中等时,优选的是通过使用较低脉冲响应能量线性预测滤波(例如,通过对LP系数或其他滤波参数和/或反射系数进行加权,和/或使用脉冲响应具有较低能量的滤波器)来减小TNS的影响。较高脉冲响应能量LP滤波与较低脉冲响应能量LP滤波彼此不同之处在于,较高脉冲响应能量LP滤波被定义为与较低脉冲响应能量LP滤波相比导致较高的脉冲响应能量。滤波器一般特征在于脉冲响应能量,且因此可以利用滤波器的脉冲响应能量来标识滤波器。较高脉冲响应能量LP滤波意味着使用与较低脉冲响应能量LP滤波中使用的滤波器相比脉冲响应具有较高能量的滤波器。
因此,根据当前示例,可通过以下步骤计算TNS操作:
当量度(例如,预测增益)高(例如,超过滤波类型确定阈值)时,执行高脉冲响应能量LP滤波;
当量度(例如,预测增益)中等(例如,在TNS滤波确定阈值与滤波类型确定阈值之间)时,执行低脉冲响应能量LP滤波;以及
当量度(例如,预测增益)低(例如,低于TNS滤波确定阈值)时,不执行TNS滤波。
可例如使用具有高脉冲响应能量的第一滤波器来获得高脉冲响应能量LP滤波。可例如使用具有较低脉冲响应能量的第二滤波器来获得低脉冲响应能量LP滤波。第一和第二滤波器可以是线性非时变(LTI)滤波器。
在示例中,可使用滤波器参数a(k)(14)描述第一滤波器。在示例中,第二滤波器可以是第一滤波器的修改版本(例如,如由TNS控制器12获得)。可通过按比例减小第一滤波器的滤波器参数(例如,使用参数使γ或γk使得0<γ<1,其中k是自然数使得k≤K,K是第一滤波器的阶数),获得第二滤波器(较低脉冲响应能量滤波器)。
因此,在示例中,当获得滤波器参数时且基于量度,确定较低脉冲响应能量滤波是必要的,可修改(例如,按比例缩小)第一滤波器的滤波器参数以获得待用于较低脉冲选择能量滤波器的第二滤波器的滤波器参数。
图3示出可在编码器装置10处实施的方法30。
在步骤S31处,获得帧量度(例如,预测增益17)。
在步骤S32处,检查帧量度17是否高于TNS滤波确定阈值或第一阈值(在一些示例中,其可以是1.5)。量度的示例可以是预测增益。
若在S32处检验到帧量度17小于第一阈值(thresh),则在S33处不执行滤波操作(可认为使用恒等滤波器,恒等滤波器是输出与输入相同的滤波器)。举例而言,Xf(n)=Xs(n)(TNS工具11的输出15与输入13相同),和/或反射系数rci(k)(和/或其经量化版本rc0(k))也设定为0。因此,解码器装置20的操作(和输出)将不受TNS工具11影响。因此,在S33处,可以既不使用第一滤波器,也不使用第二滤波器。
若在S32处检验到帧量度17大于TNS滤波确定阈值或第一阈值(thresh),则可在步骤S34处通过将所述帧量度与滤波类型确定阈值或第二阈值(thresh2,其可大于第一阈值,且例如是2)进行比较来执行第二检查。
若在S34处检验到帧量度17小于滤波类型确定阈值或第二阈值(thresh2),则在S35处执行较低脉冲响应能量LP滤波(例如,使用具有较低脉冲响应能量的第二滤波器,该第二滤波器并非恒定滤波器)。
若在S34处检验到帧量度17大于滤波类型确定阈值或第二阈值(thresh2),则在S36处执行较高脉冲响应能量LP滤波(例如,使用响应能量高于较低能量滤波器的第一滤波器)。
可针对后续帧重复方法30。
在示例中,较低脉冲响应能量LP滤波(S35)可与较高脉冲响应能量LP滤波(S36)的不同之处在于,可例如用不同值对滤波器参数14(a(k))进行加权(例如,较高脉冲响应能量LP滤波可基于单位权重(unitary weight)且较低脉冲响应能量LP滤波可基于小于1的权重)。在示例中,较低脉冲响应能量LP滤波可与较高脉冲响应能量LP滤波的不同之处在于,与由通过执行较高脉冲响应能量LP滤波获得的反射系数所引起的减小相比,通过执行较低脉冲响应能量LP滤波获得的反射系数16可引起较高的脉冲响应能量减小。
因此,当在步骤S36处执行较高脉冲响应能量滤波时,基于滤波器参数14(a(k))来使用第一滤波器(所述滤波器参数14(a(k))因此是第一滤波器参数)。当在步骤S35处执行较低脉冲响应能量滤波时,使用第二滤波器。可通过修改第一滤波器的参数(例如,通过用小于1的权重进行加权)来获得第二滤波器。
在其他示例中,步骤S31至S32至S34的顺序可以不同:例如,S34可在S32之前。在一些示例中,步骤S32和/或S34中的一个可以是可选的。
在示例中,第一和/或第二阈值中的至少一个可以是固定的(例如,存储于存储元件中)。
在示例中,可通过减小滤波器的脉冲响应来获得较低脉冲响应滤波,该减小是通过调整LP滤波器参数(例如,LPC系数或其他滤波参数)和/或反射系数或用以获得反射系数的中间值而实现的。举例而言,可将小于1的系数(权重)应用于LP滤波器参数(例如,LPC系数或其他滤波参数)和/或反射系数或用以获得反射系数的中间值。
在示例中,调整(和/或脉冲响应能量的减小)可以是(或依据)
其中thresh2是滤波类型确定阈值(且例如可以是2),thresh是TNS滤波确定阈值(且可以是1.5),γmin是常数(例如,在0.7与0.95之间的值,诸如在0.8与0.9之间的值,诸如0.85)。γ值可用于按比例调整LPC系数(或其他滤波参数)和/或反射系数。frameMetrics是帧量度。
在一个示例中,该公式可以是
其中thresh2是滤波类型确定阈值(且例如可以是2),thresh是TNS滤波确定阈值(且可以是1.5),γmin是常数(例如,在0.7与0.95之间的值,诸如在0.8与0.9之间的值,诸如0.85)。γ值可用于按比例调整LPC系数(或其他滤波参数)和/或反射系数。举例而言,predGain可以是预测增益。
从所述公式可见,小于thresh2但接近它(例如,1.999)的frameMetrics(或predGain)将引起脉冲响应能量的减小变弱(例如,)。因此,较低脉冲响应能量LP滤波可以是多个不同的较低脉冲响应能量LP滤波中的一个,每个所述较低脉冲响应能量LP滤波的特征在于不同的调整参数γ,例如根据帧量度的值。
在较低脉冲响应能量LP滤波的示例中,量度的不同值可引起不同调整。举例而言,较高预测增益可与较高较高γ值、以及相对于拳头滤波器的脉冲响应能量的较低减小相关联。γ可被视为依赖于predGain的线性函数。predGain的增加将引起γ的增加,这又将缩减脉冲响应能量的减小。若predGain减小,则γ也减小,且脉冲响应能量也将相应地减小。
因此,可用不同方式对同一信号的后续帧进行滤波:
可使用第一滤波器(较高脉冲响应能量滤波)对一些帧进行滤波,其中保持滤波器参数(14);
可使用第二滤波器(较低脉冲响应能量滤波)对一些其他帧进行滤波,其中修改第一滤波器以获得具有较低脉冲响应能量的第二滤波器(例如,修改滤波器参数14),从而相对于第一滤波器减小脉冲响应能量;
也可使用第二滤波器(较低脉冲响应能量滤波)对一些其他帧进行滤波,但使用不同调整(作为帧量度的不同值的后果)。
因此,对于各帧,可定义特定的第一滤波器(例如,基于滤波器参数),而可通过修改第一滤波器的滤波器参数来开发第二滤波器。
图3A示出控制器12和TNS区块11协作以执行TNS滤波操作的示例。
可获得帧量度(例如,预测增益)17,且将其与TNS滤波确定阈值18a进行比较(例如,在比较器10a处)。若帧量度17大于TNS滤波确定阈值18a(thresh),则准许(例如,通过选择器11a)将帧量度17与滤波类型确定阈值18b进行比较(例如,在比较器12a处)。若帧量度17大于滤波类型确定阈值18b,则启动脉冲响应具有较高能量(例如,γ=1)的第一滤波器14a。若帧量度17小于滤波类型确定阈值18b,则启动脉冲响应具有较低能量(例如,γ<1)的第二滤波器15a(元件12b指示由比较器12a输出的二进制值的非)。脉冲响应具有较高能量的第一滤波器14a可执行具有较高脉冲响应能量的滤波S36,且脉冲响应具有较低能量的第二滤波器15a可执行具有较低脉冲响应能量的滤波S35。
图3B和图3C示出用于分别使用第一滤波器14a和第二滤波器15a的方法36和35(例如,分别用于步骤S36和S35)。
方法36可包括获得滤波器参数14的步骤S36a。方法36可包括使用第一滤波器14a的参数执行滤波(例如,S36)的步骤S36b。步骤S35b可仅在确定(例如,在步骤S34处)帧量度超过滤波类型确定阈值时执行(例如,在步骤S35处)。
方法35可包括获得第一滤波器14a的滤波器参数14的步骤S35a。方法35可包括定义调整因子γ(例如,通过使用阈值thresh和thresh2中的至少一个以及帧量度)的步骤S35b。方法35可包括修改第一滤波器14a以获得相对于第一滤波器14a具有较低脉冲响应能量的第二滤波器15a的步骤35c。特别地,可通过将调整因子γ(例如,如在S35b处获得)应用于第一滤波器14a的参数14来修改第一滤波器14a,以获得第二滤波器的参数。方法35可包括步骤S35d,在步骤S35d中执行利用第二滤波器进行的滤波(例如,在方法30的S35处)。可在确定(例如,在步骤S34处)帧量度小于滤波类型确定阈值时执行步骤S35a、S35b和S35c(例如,在步骤S35处)。
图4示出可形成单个方法40的方法40'(编码器侧)和方法40”(解码器侧)。方法40'和40”可具有的一些联系在于,根据方法40'操作的解码器可将位流(例如,以无线方式,例如使用蓝牙)传输至根据方法40”操作的解码器。
下文论述方法40的步骤(如序列a)-b)-c)-d)-1)-2)-3)-e-f))指示,以及通过序列S41'至S49'指示)。
a)步骤S41':可例如处理MDCT(或MDST)频谱(FD值)的自相关,
其中K是LP滤波器阶数(例如,K=8)。此处,c(n)可以是输入至TNS工具11的FD值。举例而言,c(n)可指与具有索引n的频率相关联的频格。
b)步骤S42':可对自相关加滞后窗(lag windowing):
r(k)=r(k)w(k),k=0,…,K
加滞后窗函数的示例可以是例如:
其中α是窗参数(例如,α=0.011)。
c)步骤S43':可使用例如莱文森-德宾(Levinson-Durbin)递归程序估计LP滤波器系数,诸如:
e(0)=r(0)
a0(0)=1
对于k=1至K,执行
ak(k)=rc(k)
ak(0)=1
对于n=1至k-1,执行
ak(n)=ak-1(n)+rc(k)ak-1(k-n)
e(k)=(1-rc(k)2)e(k-1)
其中a(k)=aK(k),k=0,…,K是估计的LPC系数(或其他滤波参数),rc(k),k=1,…,K是对应的反射系数且e=e(K)是预测误差。
d)步骤S44':在当前帧中开启/关闭TNS滤波的决定(步骤S44'或S32)可基于例如帧量度,诸如预测增益:
若predGain>thresh,则开启TNS滤波
其中,预测增益通过下式计算
且thresh是阈值(例如,thresh=1.5)。
1)步骤S45':加权因子γ可通过下式获得(例如,在步骤S45'处)
其中thresh2是第二阈值(例如,thresh2=2)且γmin是最小加权因子(例如,γmin=0.85)。thresh2可以是例如滤波类型确定阈值。
当γ=1时,使用第一滤波器14a。当0γ<1时,使用第二滤波器15a(例如,在步骤S35b处)。
2)步骤S46':可使用因子γ对LPC系数(或其他滤波参数)进行加权(例如,在步骤S46'处):
aw(k)=γka(k),k=0,…,K
γk是取幂(例如,γ2=γ*γ)。
3)步骤S47':可使用例如以下程序将经加权的LPC系数(或其他滤波参数)转换成反射系数(步骤S47'):
aK(k)=aw(k),k=0,…,K
对于k=K至1,执行
rc(k)=ak(k)
e=(1-rc(k)2)
对于n=1至k-1,执行
a)e)步骤S48':若开启TNS(例如,作为在S32处的确定的结果),则可使用例如纯量均匀量化在反正弦域中量化反射系数(步骤S48'):
rcq(k)=sin(Δrci(k))
其中Δ是单位宽度(例如,)且round(.)是舍位至最近整数函数。
rci(k)是量化器输出指数,该指数随后使用例如算术编码进行编码。
rcq(k)是经量化的反射系数。
f)步骤S49':若TNS开启,则使用经量化的反射系数和格型滤波器结构对MDCT(或MDST)频谱进行滤波(步骤S49')
s0(nstart-1)=s1(nstart-1)=…=sK-1(nstart-1)=0
对于n=nstart至nstop,执行
t0(n)=s0(n)=c(n)
对于k=1至K,执行
tk(n)=tk-1(n)+rcq(k)sk-1(n-1)
sk(n)=rcq(k)tk-1(n)+sk-1(n-1)
cf(n)=tK(n)
可将位流传输至解码器。位流可连同信息信号(例如,音频信号)的FD表示一起,还包括控制数据,诸如通过执行上文所描述的TNS操作(TNS分析)获得的反射系数。
方法40”(解码器侧)可包括步骤g)(S41”)和h)(S42”),其中若TNS开启,则对经量化的反射系数进行解码,且对经量化的MDCT(或MDST)频谱进行反向滤波。可使用以下程序:
s0(nstart-1)=s1(nstart-1)=…=sK-1(nstart-1)=0
对于n=nstart至nstop,执行
tK(n)=c(n)
对于k=K至1,执行
tk-1(n)=tk(n)-rcq(k)sk-1(n-1)
sk(n)=rcq(k)tk-1(m)+sk-1(n-1)
cf(n)=s0(n)=t0(n)
编码器装置50(其可具体实现编码器装置10和/或执行方法30和40'的操作中的至少一些)的示例在图5中示出。
编码器装置50可包括用于编码输入信号(其可以是例如音频信号)的多个工具。举例而言,MDCT工具51可将信息信号的TD表示变换成FD表示。频谱噪声整形器SNS工具52可执行例如噪声整形分析(例如,频谱噪声整形SNS分析),且获取LPC系数或其他滤波参数(例如,a(k),14)。TNS工具11可如上所述且可由控制器12控制。TNS工具11可执行滤波操作(例如,根据方法30或40')且输出信息信号的经滤波版本和反射系数的版本两者。量化器工具53可执行由TNS工具11输出的数据的量化。算术编码器54可提供例如熵编码。噪声级别工具55'也可用于估计信号的噪声级别。位流编写器55可产生与输入信号相关联的可被传输(例如,以无线方式,例如使用蓝牙)和/或存储的位流。
也可使用带宽检测器58'(其可检测输入信号的带宽)。其可提供关于信号的有源频谱(active spectrum)的信息。在一些示例中,此信息也可用以控制编码工具。
编码器装置50还可包括长期后滤波工具57,可将输入信号的TD表示输入该工具57,例如已通过降采样器工具56降采样后的TD表示。
解码器装置60(其可具体实现解码器装置20和/或执行方法40”的操作中的至少一些)的示例在图6中示出。
解码器装置60可包括读取器61,读取器61可读取位流(例如,如由装置50准备的)。解码器装置60可包括算术残余解码器61a,其可利用FD中的例如由解码器提供的数字表示(经恢复的频谱)执行例如熵解码、残余解码和/或算术解码。举例而言,解码器装置60可包括噪声填充工具62和全局增益工具63。解码器装置60可包括TNS解码器21和TNS解码器控制器22。举例而言,装置60可包括SNS解码器工具65。解码器装置60可包括逆MDCT(或MDST)工具65'以将信息信号的数字表示从FD变换至TD。长期后滤波可通过LTPF工具66在TD中执行。带宽信息68可从带宽检测器58'获得,并且例如应用于一些工具(例如,62和21)。
此处提供以上装置的操作的示例。
时域噪声整形(TNS)可由工具11使用以控制各变换窗内的量化噪声的时间形状。
在示例中,若TNS在当前帧中是有效的,则可每MDCT频谱(或MDST频谱或其他频谱或其他FD表示)应用多达两个滤波器。可以应用多个滤波器和/或在特定频率范围上执行TNS滤波。在一些示例中,这仅是可选的。
在下表中给出用于每种配置的滤波器数目以及每一滤波器的开始和停止频率:
可例如从带宽检测器58'发信号通知诸如开始和终止频率的信息。
其中NB是窄频带,WB是宽频带,SSWB是半超宽频带,SWB是超宽频带,且FB是全宽频带。
下文描述TNS编码步骤。首先,分析可估计用于每一TNS滤波器的反射系数的集合。随后,可量化这些反射系数。且最后,可使用经量化的反射系数对MDCT频谱(或MDST频谱或其他频谱或其他FD表示)进行滤波。
针对每个TNS滤波器f,重复下文所描述的完整TNS分析,其中f=0..num_tns_filters-1(num_tns_filters由上表提供)。
对于每个k=0..8,可如下计算经正规化的自相关函数(例如,在步骤S41'处)
其中
且
对于s=0..2
其中sub_start(f,s)和sub_stop(f,s)在上表中给出。
可使用例如下式对经正规化的自相关函数加滞后窗(例如,在S42'处):
对于k=0..8
上文所描述的莱文森-德宾递归可用以(例如,在步骤S43'处)获得LPC系数或其他滤波参数a(k),k=0..8和/或预测误差e。
在当前帧中开启/关闭TNS滤波器f的决定是基于预测增益的:
若predGain>thresh,则开启TNS滤波器f
其中例如thresh=1.5且预测增益例如如下获得
仅在开启TNS滤波器f的情况下(例如,若步骤S32具有结果“是”),执行下文所描述的额外步骤。
加权因子γ通过下式计算
其中thresh2=2,γmin=0.85且
可使用因子γ对LPC系数或其他滤波参数加权(例如,在步骤S46'处)
aw(k)=δka(k)对于k=0..8
可使用例如以下算法将经加权的LPC系数或其他滤波参数转换(例如,在步骤S47'处)成反射系数:
aK(k)=aw(k),k=0,…,K
对于k=K至1,执行
rc(k)=ak(k)
e=(1-rc(k)2)
对于n=1至k-1,执行
其中rc(k,f)=rc(k)是用于TNS滤波器f的最终估计反射系数。
若关闭TNS滤波器f(例如,在步骤S32的检查时的结果“否”」),则反射系数可简单地设定为0:rc(k,f)=0,k=0..8。
现在论述量化处理,例如,如在步骤S48'处执行的。
对于每一TNS滤波器f,可例如使用纯量均匀量化在反正弦域中量化所获得的反射系数
对于k=0..8
且
rcq(k,f)=sin[Δ(rci(k,f)-8)]对于k=0..8
其中且nint(.)是例如舍位至最近整数函数。
rci(k,f)可以是量化器输出指数,且rcq(k,f)可以是经量化的反射系数。
可使用以下方法计算经量化的反射系数的阶数
k=7
当k≥0且rcq(k,f)=0时,执行
k=k-1
rcorder(f)=k+1
可随后如下计算当前帧中由TNS消耗的位的总数目
其中
且
tab_nbits_TNS_order和tab_nbits_TNS_coef的值可在表中提供。
可使用以下过程对MDCT(或MDST)频谱Xs(n)(图1中的输入15)进行滤波:
s0(start_freq(0)-1)=s1(start_freq(0)-1)=…=s7(start_freq(0)-1)=0
对于f=0至num_tns_filters-1,执行
对于n=start_freq(f)至stop_freq(f)-1,执行
t0(n)=s0(n)=Xs(n)
对于k=0至7,执行
tk+1(n)=tk(n)+rcq(k)sk(n-1)
sk+1(n)=rcq(k)tk(n)+sk(n-1)
Xf(n)=t8(n)
其中Xf(n)是经TNS滤波的MDCT(或MDST)频谱(图1中的输出15)。
参考在解码器(例如,20、60)处执行的操作,可针对每一TNS滤波器f使用下式获得经量化的反射系数
rcq(k,f)=sin[Δ(rci(k,f)-8)]k=0..8
其中rcq(k,f)是量化器输出指数。
随后,可使用以下算法对如提供至TNS解码器21的MDCT(或MDST)频谱(例如,如从全局增益工具63获得)进行滤波
s0(start_freq(0)-1)=s1(start_freq(0)-1)=…=s7(start_freq(0)-1)=0
对于f=0至num_tns_filters-1,执行
对于n=start_freq(f)至stop_freq(f)-1,执行
对于k=7至0,执行
tk(n)=tk+1(n)-rcq(k)sk(n-1)
sk+1(n)=rcq(k)tk(n)+sk(n-1)
其中是TNS解码器的输出。
关于本发明的论述
如上文所解释,TNS可有时引入伪影,使音频编码器的质量降级。这些伪影类似咔嗒声或类似噪声且出现在具有语音信号或音调音乐信号的大多数情形中。
已观察到,由TNS产生的伪影仅在预测增益predGain低且接近阈值thresh的帧中出现。
人们可想到增加阈值将易于解决该问题。但对于大多数帧,实际上即使在预测增益低时开启TNS仍是有益的。
本发明提出的解决方案是在预测增益低时保持相同的阈值但调整TNS滤波器,以便减小脉冲响应能量。
存在实施此调整(其在一些情形可被称作“衰减”,例如在通过例如减小LP滤波器参数来获得脉冲响应能量的减小时)的许多方式。本发明可选择使用加权,其可以是例如加权
aw(k)=γka(k),k=0,…,K
其中a(k)是在编码器步骤c)中计算出的LP滤波器参数(例如,LPC系数),且aw(k)是经加权的LP滤波器参数。依据预测增益产生调整(加权)因子γ,使得针对较低预测增益而应用脉冲响应能量的较高减小(γ<1))且使得针对较高预测增益,例如不存在脉冲响应能量的减小(γ=1)。
所提出的解决方案经证实在移除有问题的帧上的所有伪影时极其有效,同时最少地影响其他帧。
现在可参看图8(1)至图8(3)。这些图示出音频信号的帧(连续线)和对应TNS预测滤波器的频率响应(虚线)。
图8(1):响板信号(castanets signal)
图8(2):调音管信号
图8(3):语音信号
预测增益与信号的时间包络的平坦度有关(参见例如参考文献[2]的章节3或参考文献[3]的章节1.2)。
低预测增益暗示倾向平坦的时间包络,而高预测增益暗示极不平坦的时间包络。
图8(1)示出极低预测增益(predGain=1.0)的情形。其对应于非常静止的音频信号的情形,具有平坦时间包络。在此情形下,predGain=1<thresh(例如,thresh=1.5):不执行滤波(S33)。
图8(2)示出极高预测增益(12.3)的情形。其对应于强烈且尖锐攻击的情形,具有高度不平坦的时间包络。在此情形下,predGain=12.3>thresh2(threh2=2):在S36处执行较高脉冲响应能量滤波。
图8(3)示出在thresh与thresh2之间的预测增益的情形,例如在1.5至2.0的范围中(高于第一阈值,小于第二阈值)。其对应于略微不平坦的时间包络的情形。在此情形下,thresh<predGain<thresh2:使用具有较低脉冲响应能量的第二滤波器15a在S35处执行较低脉冲响应能量滤波。
其他示例
图7示出装置110,其可实施编码装置10或50和/或执行方法30和/或40'的至少一些步骤。装置110可包括处理器111和存储指令的非暂时性存储单元112,所述指令在由处理器111执行时可使处理器111执行TNS滤波和/或分析。装置110可包括输入单元116,其可获得输入信息信号(例如,音频信号)。处理器111可因此执行TNS处理。
图8示出可实施解码器装置20或60和/或执行方法40'的装置120。装置120可包括处理器121和存储指令的非暂时性存储单元122,所述指令在由处理器121执行时可使处理器121尤其执行TNS合成操作。装置120可包括输入单元126,其可获得在FD中的信息信号(例如,音频信号)的经解码表示。处理器121可因此执行处理程序以获得例如在TD中的信息信号的经解码表示。可使用输出单元127将此经解码表示提供至外部单元。举例而言,输出单元127可包括通信单元以与外部设备(例如,使用无线通信,诸如蓝牙)和/或外部存储空间通信。处理器121可将音频信号的经解码表示保存在本地存储空间128中。
在示例中,系统110与120可为相同设备。
取决于某些实施要求,示例可以硬件实施。可使用数字存储媒体执行该实施,例如软盘、数字多功能光盘(DVD)、蓝光光盘、紧密光盘(CD)、只读存储器(ROM)、可规划只读存储器(PROM)、可抹除和可规划只读存储器(EPROM)、电可抹除可规划只读存储器(EEPROM)或闪存,其上存储有电子可读控制信号,其与可规划计算机系统协作(或能够协作)使得执行各别方法。因此,数字存储媒体可为计算机可读的。
一般而言,示例可实施为具有程序指令的计算机程序产品,当计算机程序产品在计算机上执行时,程序指令操作性地用于执行所述方法中的一个。程序指令可例如存储于机器可读媒体上。
其他示例包括用于执行本文中所描述的方法中的一个、存储于机器可读载体上的计算机程序。换言之,方法的示例因此是计算机程序,其具有用于在计算机程序执行于计算机上时执行本文中所描述的方法中的一个的程序指令。
方法的另一示例因此是数据载体媒体(或数字存储媒体,或计算机可读媒体),其包括、上面记录用于执行本文中所描述的方法中的一个的计算机程序。数据载体媒体、数字存储媒体或记录媒体是有形和/或非暂时性的,而非无形和暂时性的信号。
另一示例包括处理单元,例如计算机或可编程逻辑器件,其执行本文中所描述的方法中的一个。
另一示例包括计算机,该计算机具有安装于其上的用于执行本文中所描述的方法中的一个的计算机程序。
另一示例包括将用于执行本文中所描述的方法中的一个的计算机程序传送(例如,以电子方式或以光学方式)至接收器的装置或系统。举例而言,接收器可以是计算机、行动设备、内存设备或其类似者。举例而言,装置或系统可包括用于将计算机程序传送至接收器的文件服务器。
在一些示例中,可编程逻辑器件(例如,场可编程门阵列)可用以执行本文中所描述的方法的功能性中的一些或全部。在一些示例中,场可编程门阵列可与微处理器协作,以便执行本文中所描述的方法中的一个。一般而言,所述方法可由任何适当的硬装置执行。
上述示例说明上文所论述的原理。应理解,本文中所描述的配置和细节的修改和变化将为显而易见的。因此,其意欲由所附专利权利要求的范围限制,而非由藉助于本文中示例的描述和解释所呈现的特定细节限制。
Claims (22)
1.一种编码器装置(10,50,110),包括:
时域噪声整形TNS工具(11),用于对包括多个帧的信息信号(13)执行线性预测LP滤波(S33,S35,S36);以及
控制器(12),被配置为控制所述TNS工具(11),使得所述TNS工具(11)利用以下执行LP滤波:
第一滤波器(14a),其脉冲响应具有较高能量(S36);以及
第二滤波器(15a),其脉冲响应具有较低能量(S35),其中所述第二滤波器(15a)并非恒等滤波器,
其中所述控制器(12)被配置为基于帧量度(17)在利用所述第一滤波器(14a)进行滤波(S36)与利用所述第二滤波器(15a)进行滤波(S35)之间进行选择(S34),
其中所述控制器(12)被进一步配置为:修改所述第一滤波器(14a)以获得所述第二滤波器(15a),在所述第二滤波器(15a)中,所述滤波器的脉冲响应能量减小。
2.如权利要求1所述的编码器装置,其中所述控制器(12)被进一步配置为:
将调整因子应用(S45’)于所述第一滤波器(14a)以获得所述第二滤波器(15a)。
3.如权利要求2所述的编码器装置,被配置为通过使用调整因子修改所述第一滤波器(14a)的参数(14)的振幅来修改所述第一滤波器(14a)以获得所述第二滤波器(15a)。
4.如权利要求2所述的编码器装置,其中所述控制器(12)被进一步配置为:
基于用于在利用所述第一滤波器(14a)进行滤波(S36)与利用所述第二滤波器(15a)进行滤波(S35)之间进行选择(S32)的滤波类型确定阈值(18b),定义(S45’)所述调整因子。
5.如权利要求2所述的编码器装置,其中所述控制器(12)被进一步配置为:
基于至少所述帧量度(17),定义(S45’)所述调整因子。
6.如权利要求2所述的编码器装置,其中所述控制器(12)被进一步配置为:
基于用于在执行TNS滤波(S34,S35)与不执行TNS滤波(S33)之间进行选择(S32)的TNS滤波确定阈值(18b),定义(S45’)所述调整因子。
7.如权利要求2所述的编码器装置,其中所述控制器(12)被进一步配置为:
使用所述帧量度(17)的线性函数定义(S45’)所述调整因子,所述线性函数设为所述帧量度的增加与所述调整因子和/或所述滤波器的脉冲响应能量的增加相对应。
8.如权利要求2所述的编码器装置,被配置为将所述调整因子定义为
其中thresh是所述TNS滤波确定阈值(18a),thresh2是滤波类型确定阈值(18b),frameMetrics是帧量度(17),且γmin是固定值。
9.如权利要求2所述的编码器装置,被配置为通过应用下式来修改所述第一滤波器(14a)的参数(14)以获得所述第二滤波器(15a)的参数:
aw(k)=γka(k),k=0,…,K
其中a(k)是所述第一滤波器(14a)的参数(14),γ是所述调整因子使得0<γ<1,aw(k)是所述第二滤波器(15a)的所述参数,且K是所述第一滤波器(14a)的阶数。
10.如权利要求1所述的编码器装置,其中所述控制器(12)被进一步配置为:
从预测增益、所述信息信号的能量和/或预测误差中的至少一个,获得所述帧量度(17)。
11.如权利要求1所述的编码器装置,其中所述帧量度包括预测增益,所述预测增益如下计算
其中energy是与所述信息信号的能量相关联的项,且predError是与预测误差相关联的项。
12.如权利要求1所述的编码器装置,其中所述控制器被配置以使得:
至少对于预测增益的减小和/或所述信息信号的能量的减小,所述第二滤波器的脉冲响应能量减小,和/或至少对于预测误差的增加,所述第二滤波器的脉冲响应能量减小。
13.如权利要求1所述的编码器装置,其中所述控制器(12)被进一步配置为:
将所述帧量度(17)与滤波类型确定阈值(18b)进行比较(S34),以在所述帧量度(17)小于所述滤波类型确定阈值(18b)时利用所述第一滤波器(15a)执行滤波(S36)。
14.如权利要求1所述的编码器装置,其中所述控制器(12)被进一步配置为:
基于所述帧量度(17),在执行滤波(S35,S36)与不执行滤波(S33)之间进行选择(S32,S44’)。
15.如权利要求14所述的编码器装置,其中所述控制器(12)被进一步配置为:
将所述帧量度(17)与TNS滤波确定阈值(18a)进行比较(S32,S44’),以在所述帧量度(17)小于所述TNS滤波确定阈值(18a)时选择避免TNS滤波(S33)。
16.如权利要求1所述的编码器装置,进一步包括:
位流编写器,用于利用通过所述TNS工具(11)获得的反射系数(16)或所述反射系数(16)的经量化版本来准备位流。
17.如权利要求1所述的编码器装置,所述第一滤波器(14a)的滤波参数(14)是在LP编码LPC系数和/或所述滤波器系数的任何其他表示之间选择的。
18.如权利要求1所述的编码器装置,其中所述信息信号是音频信号。
19.如权利要求1所述的编码器装置,其中所述控制器(12)被进一步配置为修改所述第一滤波器(14a)以获得所述第二滤波器(15a),在所述第二滤波器(15a)中,所述滤波器的脉冲响应能量减小。
20.如权利要求1所述的编码器装置,其中所述帧量度(17)与所述信号的时间包络的平坦度相关联。
21.一种用于对包括多个帧的信息信号执行时域噪声整形TNS滤波的方法(30,40’),所述方法(30,40’)包括:
对于每个帧,基于帧量度,在利用第一滤波器(14a)进行滤波与利用第二滤波器(15a)进行滤波之间进行选择(S34),所述第二滤波器(15a)的脉冲响应具有较低能量,其中所述第二滤波器(15a)并非恒等滤波器;
使用根据在利用所述第一滤波器(14a)进行滤波与利用所述第二滤波器(15a)进行滤波之间选择的滤波进行的滤波,对所述帧进行滤波;以及
修改所述第一滤波器(14a)以获得所述第二滤波器(15a),在所述第二滤波器(15a)中,所述滤波器的脉冲响应能量减小。
22.一种存储指令的非暂时性存储设备,所述指令在由处理器(111,121)执行时使所述处理器执行权利要求21所述的方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP17201094.4 | 2017-11-10 | ||
EP17201094.4A EP3483880A1 (en) | 2017-11-10 | 2017-11-10 | Temporal noise shaping |
PCT/EP2018/080339 WO2019091978A1 (en) | 2017-11-10 | 2018-11-06 | Temporal noise shaping |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111587456A CN111587456A (zh) | 2020-08-25 |
CN111587456B true CN111587456B (zh) | 2023-08-04 |
Family
ID=60301908
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880086260.1A Active CN111587456B (zh) | 2017-11-10 | 2018-11-06 | 时域噪声整形 |
Country Status (18)
Country | Link |
---|---|
US (1) | US11127408B2 (zh) |
EP (2) | EP3483880A1 (zh) |
JP (1) | JP6990306B2 (zh) |
KR (1) | KR102428419B1 (zh) |
CN (1) | CN111587456B (zh) |
AR (1) | AR113480A1 (zh) |
AU (1) | AU2018363699B2 (zh) |
BR (1) | BR112020009104A2 (zh) |
CA (1) | CA3081781C (zh) |
ES (1) | ES2905911T3 (zh) |
MX (1) | MX2020004789A (zh) |
PL (1) | PL3707712T3 (zh) |
PT (1) | PT3707712T (zh) |
RU (1) | RU2740074C1 (zh) |
SG (1) | SG11202004204UA (zh) |
TW (1) | TWI701658B (zh) |
WO (1) | WO2019091978A1 (zh) |
ZA (1) | ZA202002520B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6642146B2 (ja) | 2015-03-31 | 2020-02-05 | 日立金属株式会社 | 窒化珪素系セラミックス集合基板及びその製造方法 |
CN113643713B (zh) * | 2021-10-13 | 2021-12-24 | 北京百瑞互联技术有限公司 | 一种蓝牙音频编码方法、装置及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1926608A (zh) * | 2004-03-01 | 2007-03-07 | 弗兰霍菲尔运输应用研究公司 | 多声道信号处理设备和方法 |
US7548790B1 (en) * | 2000-03-29 | 2009-06-16 | At&T Intellectual Property Ii, L.P. | Effective deployment of temporal noise shaping (TNS) filters |
CN104025189A (zh) * | 2011-10-27 | 2014-09-03 | Lg电子株式会社 | 编码语音信号的方法、解码语音信号的方法,及使用其的装置 |
CN105190749A (zh) * | 2013-01-29 | 2015-12-23 | 弗劳恩霍夫应用研究促进协会 | 噪声填充技术 |
Family Cites Families (147)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3639753A1 (de) | 1986-11-21 | 1988-06-01 | Inst Rundfunktechnik Gmbh | Verfahren zum uebertragen digitalisierter tonsignale |
US5012517A (en) | 1989-04-18 | 1991-04-30 | Pacific Communication Science, Inc. | Adaptive transform coder having long term predictor |
US5233660A (en) | 1991-09-10 | 1993-08-03 | At&T Bell Laboratories | Method and apparatus for low-delay celp speech coding and decoding |
JPH05281996A (ja) | 1992-03-31 | 1993-10-29 | Sony Corp | ピッチ抽出装置 |
IT1270438B (it) | 1993-06-10 | 1997-05-05 | Sip | Procedimento e dispositivo per la determinazione del periodo del tono fondamentale e la classificazione del segnale vocale in codificatori numerici della voce |
US5581653A (en) | 1993-08-31 | 1996-12-03 | Dolby Laboratories Licensing Corporation | Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder |
JP3402748B2 (ja) | 1994-05-23 | 2003-05-06 | 三洋電機株式会社 | 音声信号のピッチ周期抽出装置 |
DE69619284T3 (de) | 1995-03-13 | 2006-04-27 | Matsushita Electric Industrial Co., Ltd., Kadoma | Vorrichtung zur Erweiterung der Sprachbandbreite |
US5781888A (en) | 1996-01-16 | 1998-07-14 | Lucent Technologies Inc. | Perceptual noise shaping in the time domain via LPC prediction in the frequency domain |
WO1997027578A1 (en) | 1996-01-26 | 1997-07-31 | Motorola Inc. | Very low bit rate time domain speech analyzer for voice messaging |
US5812971A (en) * | 1996-03-22 | 1998-09-22 | Lucent Technologies Inc. | Enhanced joint stereo coding method using temporal envelope shaping |
JPH1091194A (ja) | 1996-09-18 | 1998-04-10 | Sony Corp | 音声復号化方法及び装置 |
US6570991B1 (en) | 1996-12-18 | 2003-05-27 | Interval Research Corporation | Multi-feature speech/music discrimination system |
KR100261253B1 (ko) | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치 |
GB2326572A (en) | 1997-06-19 | 1998-12-23 | Softsound Limited | Low bit rate audio coder and decoder |
AU9404098A (en) | 1997-09-23 | 1999-04-12 | Voxware, Inc. | Scalable and embedded codec for speech and audio signals |
US6507814B1 (en) | 1998-08-24 | 2003-01-14 | Conexant Systems, Inc. | Pitch determination using speech classification and prior pitch estimation |
US7272556B1 (en) | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
US6735561B1 (en) * | 2000-03-29 | 2004-05-11 | At&T Corp. | Effective deployment of temporal noise shaping (TNS) filters |
US7395209B1 (en) | 2000-05-12 | 2008-07-01 | Cirrus Logic, Inc. | Fixed point audio decoding system and method |
US7020605B2 (en) * | 2000-09-15 | 2006-03-28 | Mindspeed Technologies, Inc. | Speech coding system with time-domain noise attenuation |
US7353168B2 (en) | 2001-10-03 | 2008-04-01 | Broadcom Corporation | Method and apparatus to eliminate discontinuities in adaptively filtered signals |
US6785645B2 (en) | 2001-11-29 | 2004-08-31 | Microsoft Corporation | Real-time speech and music classifier |
US20030187663A1 (en) * | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
US7447631B2 (en) | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
US7433824B2 (en) | 2002-09-04 | 2008-10-07 | Microsoft Corporation | Entropy coding by adapting coding between level and run-length/level modes |
JP4287637B2 (ja) | 2002-10-17 | 2009-07-01 | パナソニック株式会社 | 音声符号化装置、音声符号化方法及びプログラム |
ATE339759T1 (de) | 2003-02-11 | 2006-10-15 | Koninkl Philips Electronics Nv | Audiocodierung |
KR20030031936A (ko) | 2003-02-13 | 2003-04-23 | 배명진 | 피치변경법을 이용한 단일 음성 다중 목소리 합성기 |
KR101063562B1 (ko) | 2003-06-17 | 2011-09-07 | 파나소닉 주식회사 | 수신 장치, 전송 장치 및 송신 시스템 |
ES2354427T3 (es) | 2003-06-30 | 2011-03-14 | Koninklijke Philips Electronics N.V. | Mejora de la calidad de audio decodificado mediante la adición de ruido. |
WO2005027096A1 (en) | 2003-09-15 | 2005-03-24 | Zakrytoe Aktsionernoe Obschestvo Intel | Method and apparatus for encoding audio |
US7009533B1 (en) | 2004-02-13 | 2006-03-07 | Samplify Systems Llc | Adaptive compression and decompression of bandlimited signals |
EP1914722B1 (en) | 2004-03-01 | 2009-04-29 | Dolby Laboratories Licensing Corporation | Multichannel audio decoding |
DE102004009949B4 (de) | 2004-03-01 | 2006-03-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Ermitteln eines Schätzwertes |
WO2005086138A1 (ja) | 2004-03-05 | 2005-09-15 | Matsushita Electric Industrial Co., Ltd. | エラー隠蔽装置およびエラー隠蔽方法 |
AU2006232364B2 (en) | 2005-04-01 | 2010-11-25 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband speech coding |
US7539612B2 (en) | 2005-07-15 | 2009-05-26 | Microsoft Corporation | Coding and decoding scale factor information |
US7546240B2 (en) | 2005-07-15 | 2009-06-09 | Microsoft Corporation | Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition |
KR100888474B1 (ko) | 2005-11-21 | 2009-03-12 | 삼성전자주식회사 | 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법 |
US7805297B2 (en) | 2005-11-23 | 2010-09-28 | Broadcom Corporation | Classification-based frame loss concealment for audio signals |
WO2007070007A1 (en) | 2005-12-14 | 2007-06-21 | Matsushita Electric Industrial Co., Ltd. | A method and system for extracting audio features from an encoded bitstream for audio classification |
US8255207B2 (en) | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
WO2007102782A2 (en) | 2006-03-07 | 2007-09-13 | Telefonaktiebolaget Lm Ericsson (Publ) | Methods and arrangements for audio coding and decoding |
US8150065B2 (en) | 2006-05-25 | 2012-04-03 | Audience, Inc. | System and method for processing an audio signal |
WO2007138511A1 (en) | 2006-05-30 | 2007-12-06 | Koninklijke Philips Electronics N.V. | Linear predictive coding of an audio signal |
US8015000B2 (en) | 2006-08-03 | 2011-09-06 | Broadcom Corporation | Classification-based frame loss concealment for audio signals |
ATE496365T1 (de) * | 2006-08-15 | 2011-02-15 | Dolby Lab Licensing Corp | Arbiträre formung einer temporären rauschhüllkurve ohne nebeninformation |
FR2905510B1 (fr) | 2006-09-01 | 2009-04-10 | Voxler Soc Par Actions Simplif | Procede d'analyse en temps reel de la voix pour le controle en temps reel d'un organe numerique et dispositif associe |
CN101140759B (zh) | 2006-09-08 | 2010-05-12 | 华为技术有限公司 | 语音或音频信号的带宽扩展方法及系统 |
DE102006049154B4 (de) | 2006-10-18 | 2009-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodierung eines Informationssignals |
KR101292771B1 (ko) | 2006-11-24 | 2013-08-16 | 삼성전자주식회사 | 오디오 신호의 오류은폐방법 및 장치 |
EP2099026A4 (en) | 2006-12-13 | 2011-02-23 | Panasonic Corp | POST-FILTER AND FILTERING METHOD |
FR2912249A1 (fr) | 2007-02-02 | 2008-08-08 | France Telecom | Codage/decodage perfectionnes de signaux audionumeriques. |
JP4871894B2 (ja) | 2007-03-02 | 2012-02-08 | パナソニック株式会社 | 符号化装置、復号装置、符号化方法および復号方法 |
EP2015293A1 (en) | 2007-06-14 | 2009-01-14 | Deutsche Thomson OHG | Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain |
JP5618826B2 (ja) | 2007-06-14 | 2014-11-05 | ヴォイスエイジ・コーポレーション | Itu.t勧告g.711と相互運用可能なpcmコーデックにおいてフレーム消失を補償する装置および方法 |
JP4928366B2 (ja) | 2007-06-25 | 2012-05-09 | 日本電信電話株式会社 | ピッチ探索装置、パケット消失補償装置、それらの方法、プログラム及びその記録媒体 |
JP4572218B2 (ja) | 2007-06-27 | 2010-11-04 | 日本電信電話株式会社 | 音楽区間検出方法、音楽区間検出装置、音楽区間検出プログラム及び記録媒体 |
US20110116542A1 (en) | 2007-08-24 | 2011-05-19 | France Telecom | Symbol plane encoding/decoding with dynamic calculation of probability tables |
EP2186087B1 (en) | 2007-08-27 | 2011-11-30 | Telefonaktiebolaget L M Ericsson (PUBL) | Improved transform coding of speech and audio signals |
CN100524462C (zh) | 2007-09-15 | 2009-08-05 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
KR101290622B1 (ko) | 2007-11-02 | 2013-07-29 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 오디오 복호화 방법 및 장치 |
WO2009066869A1 (en) * | 2007-11-21 | 2009-05-28 | Electronics And Telecommunications Research Institute | Frequency band determining method for quantization noise shaping and transient noise shaping method using the same |
US9659568B2 (en) | 2007-12-31 | 2017-05-23 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
CN101981616A (zh) * | 2008-04-04 | 2011-02-23 | 松下电器产业株式会社 | 立体声信号变换装置、立体声信号逆变换装置及其方法 |
WO2009150290A1 (en) | 2008-06-13 | 2009-12-17 | Nokia Corporation | Method and apparatus for error concealment of encoded audio data |
BRPI0910784B1 (pt) | 2008-07-11 | 2022-02-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. | Codificador e decodificador de áudio para estruturas de codificação de sinais de áudio amostrados |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
EP2144231A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
PL2346029T3 (pl) | 2008-07-11 | 2013-11-29 | Fraunhofer Ges Forschung | Koder sygnału audio, sposób kodowania sygnału audio i odpowiadający mu program komputerowy |
US8577673B2 (en) | 2008-09-15 | 2013-11-05 | Huawei Technologies Co., Ltd. | CELP post-processing for music signals |
MX2011003824A (es) | 2008-10-08 | 2011-05-02 | Fraunhofer Ges Forschung | Esquema de codificacion/decodificacion de audio conmutado de resolucion multiple. |
GB2466673B (en) | 2009-01-06 | 2012-11-07 | Skype | Quantization |
BRPI1005300B1 (pt) | 2009-01-28 | 2021-06-29 | Fraunhofer - Gesellschaft Zur Forderung Der Angewandten Ten Forschung E.V. | Codificador de áudio, decodificador de áudio, informações de áudio codificado e métodos para codificar e decodificar um sinal de áudio com base em uma informação de áudio codificado e em uma informação de áudio de entrada. |
JP4945586B2 (ja) | 2009-02-02 | 2012-06-06 | 株式会社東芝 | 信号帯域拡張装置 |
JP4932917B2 (ja) * | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
FR2944664A1 (fr) | 2009-04-21 | 2010-10-22 | Thomson Licensing | Dispositif et procede de traitement d'images |
US8352252B2 (en) | 2009-06-04 | 2013-01-08 | Qualcomm Incorporated | Systems and methods for preventing the loss of information within a speech frame |
US8428938B2 (en) | 2009-06-04 | 2013-04-23 | Qualcomm Incorporated | Systems and methods for reconstructing an erased speech frame |
KR20100136890A (ko) | 2009-06-19 | 2010-12-29 | 삼성전자주식회사 | 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법 |
CN101958119B (zh) | 2009-07-16 | 2012-02-29 | 中兴通讯股份有限公司 | 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法 |
WO2011042464A1 (en) * | 2009-10-08 | 2011-04-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-mode audio signal decoder, multi-mode audio signal encoder, methods and computer program using a linear-prediction-coding based noise shaping |
WO2011044700A1 (en) * | 2009-10-15 | 2011-04-21 | Voiceage Corporation | Simultaneous time-domain and frequency-domain noise shaping for tdac transforms |
PL2473995T3 (pl) | 2009-10-20 | 2015-06-30 | Fraunhofer Ges Forschung | Koder sygnału audio, dekoder sygnału audio, sposób dostarczania zakodowanej reprezentacji treści audio, sposób dostarczania dekodowanej reprezentacji treści audio oraz program komputerowy do wykorzystania w zastosowaniach z małym opóźnieniem |
TWI451403B (zh) | 2009-10-20 | 2014-09-01 | Fraunhofer Ges Forschung | 音訊編碼器、音訊解碼器、用以將音訊資訊編碼之方法、用以將音訊資訊解碼之方法及使用區域從屬算術編碼對映規則之電腦程式 |
US8207875B2 (en) | 2009-10-28 | 2012-06-26 | Motorola Mobility, Inc. | Encoder that optimizes bit allocation for information sub-parts |
US7978101B2 (en) | 2009-10-28 | 2011-07-12 | Motorola Mobility, Inc. | Encoder and decoder using arithmetic stage to compress code space that is not fully utilized |
US9020812B2 (en) | 2009-11-24 | 2015-04-28 | Lg Electronics Inc. | Audio signal processing method and device |
EP2524371B1 (en) | 2010-01-12 | 2016-12-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using a hash table describing both significant state values and interval boundaries |
US20110196673A1 (en) | 2010-02-11 | 2011-08-11 | Qualcomm Incorporated | Concealing lost packets in a sub-band coding decoder |
EP2375409A1 (en) | 2010-04-09 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
FR2961980A1 (fr) * | 2010-06-24 | 2011-12-30 | France Telecom | Controle d'une boucle de retroaction de mise en forme de bruit dans un codeur de signal audionumerique |
KR101696632B1 (ko) | 2010-07-02 | 2017-01-16 | 돌비 인터네셔널 에이비 | 선택적인 베이스 포스트 필터 |
EP2596494B1 (en) | 2010-07-20 | 2020-08-05 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Audio decoder, audio decoding method and computer program |
US8738385B2 (en) | 2010-10-20 | 2014-05-27 | Broadcom Corporation | Pitch-based pre-filtering and post-filtering for compression of audio signals |
EP2676266B1 (en) | 2011-02-14 | 2015-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Linear prediction based coding scheme using spectral domain noise shaping |
US9270807B2 (en) | 2011-02-23 | 2016-02-23 | Digimarc Corporation | Audio localization using audio signal encoding and recognition |
KR101767175B1 (ko) | 2011-03-18 | 2017-08-10 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 코딩에서의 프레임 요소 길이 전송 |
MX2013012301A (es) | 2011-04-21 | 2013-12-06 | Samsung Electronics Co Ltd | Aparato para cuantificar coeficientes de codificacion predictiva lineal, aparato de codificacion de sonido, aparato para decuantificar coeficientes de codificacion predictiva lineal, aparato de decodificacion de sonido y dispositivo electronico para los mismos. |
WO2012152764A1 (en) * | 2011-05-09 | 2012-11-15 | Dolby International Ab | Method and encoder for processing a digital stereo audio signal |
FR2977439A1 (fr) | 2011-06-28 | 2013-01-04 | France Telecom | Fenetres de ponderation en codage/decodage par transformee avec recouvrement, optimisees en retard. |
FR2977969A1 (fr) | 2011-07-12 | 2013-01-18 | France Telecom | Adaptation de fenetres de ponderation d'analyse ou de synthese pour un codage ou decodage par transformee |
MY157163A (en) | 2012-01-20 | 2016-05-13 | Fraunhofer Ges Forschung | Apparatus and method for audio encoding and decoding employing sinusoidal substitution |
WO2013149672A1 (en) | 2012-04-05 | 2013-10-10 | Huawei Technologies Co., Ltd. | Method for determining an encoding parameter for a multi-channel audio signal and multi-channel audio encoder |
US9305567B2 (en) | 2012-04-23 | 2016-04-05 | Qualcomm Incorporated | Systems and methods for audio signal processing |
US9558750B2 (en) | 2012-06-08 | 2017-01-31 | Samsung Electronics Co., Ltd. | Method and apparatus for concealing frame error and method and apparatus for audio decoding |
GB201210373D0 (en) | 2012-06-12 | 2012-07-25 | Meridian Audio Ltd | Doubly compatible lossless audio sandwidth extension |
FR2992766A1 (fr) * | 2012-06-29 | 2014-01-03 | France Telecom | Attenuation efficace de pre-echos dans un signal audionumerique |
CN102779526B (zh) | 2012-08-07 | 2014-04-16 | 无锡成电科大科技发展有限公司 | 语音信号中基音提取及修正方法 |
US9406307B2 (en) | 2012-08-19 | 2016-08-02 | The Regents Of The University Of California | Method and apparatus for polyphonic audio signal prediction in coding and networking systems |
US9293146B2 (en) | 2012-09-04 | 2016-03-22 | Apple Inc. | Intensity stereo coding in advanced audio coding |
US9280975B2 (en) | 2012-09-24 | 2016-03-08 | Samsung Electronics Co., Ltd. | Frame error concealment method and apparatus, and audio decoding method and apparatus |
US9401153B2 (en) | 2012-10-15 | 2016-07-26 | Digimarc Corporation | Multi-mode audio recognition and auxiliary data encoding and decoding |
FR3001593A1 (fr) | 2013-01-31 | 2014-08-01 | France Telecom | Correction perfectionnee de perte de trame au decodage d'un signal. |
MX2021000353A (es) | 2013-02-05 | 2023-02-24 | Ericsson Telefon Ab L M | Método y aparato para controlar ocultación de pérdida de trama de audio. |
TWI530941B (zh) | 2013-04-03 | 2016-04-21 | 杜比實驗室特許公司 | 用於基於物件音頻之互動成像的方法與系統 |
AU2014283389B2 (en) | 2013-06-21 | 2017-10-05 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for improved concealment of the adaptive codebook in ACELP-like concealment employing improved pulse resynchronization |
EP2830055A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Context-based entropy coding of sample values of a spectral envelope |
EP2830064A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection |
BR112016008117B1 (pt) | 2013-10-18 | 2021-12-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificação de coeficientes espectrais de um espectro de um sinal de áudio |
US9906858B2 (en) | 2013-10-22 | 2018-02-27 | Bongiovi Acoustics Llc | System and method for digital signal processing |
SG10201609186UA (en) | 2013-10-31 | 2016-12-29 | Fraunhofer Ges Forschung | Audio Decoder And Method For Providing A Decoded Audio Information Using An Error Concealment Modifying A Time Domain Excitation Signal |
CN105706166B (zh) | 2013-10-31 | 2020-07-14 | 弗劳恩霍夫应用研究促进协会 | 对比特流进行解码的音频解码器设备和方法 |
CA2928882C (en) | 2013-11-13 | 2018-08-14 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Encoder for encoding an audio signal, audio transmission system and method for determining correction values |
GB2524333A (en) | 2014-03-21 | 2015-09-23 | Nokia Technologies Oy | Audio signal payload |
US9396733B2 (en) | 2014-05-06 | 2016-07-19 | University Of Macau | Reversible audio data hiding |
NO2780522T3 (zh) | 2014-05-15 | 2018-06-09 | ||
EP2963648A1 (en) | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio processor and method for processing an audio signal using vertical phase correction |
US9685166B2 (en) | 2014-07-26 | 2017-06-20 | Huawei Technologies Co., Ltd. | Classification between time-domain coding and frequency domain coding |
EP2980798A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Harmonicity-dependent controlling of a harmonic filter tool |
EP2980799A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an audio signal using a harmonic post-filter |
EP2980796A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for processing an audio signal, audio decoder, and audio encoder |
EP2988300A1 (en) | 2014-08-18 | 2016-02-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Switching of sampling rates at audio processing devices |
CN104269173B (zh) * | 2014-09-30 | 2018-03-13 | 武汉大学深圳研究院 | 切换模式的音频带宽扩展装置与方法 |
EP3067886A1 (en) | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
US9886963B2 (en) | 2015-04-05 | 2018-02-06 | Qualcomm Incorporated | Encoder selection |
JP6422813B2 (ja) | 2015-04-13 | 2018-11-14 | 日本電信電話株式会社 | 符号化装置、復号装置、これらの方法及びプログラム |
US9978400B2 (en) | 2015-06-11 | 2018-05-22 | Zte Corporation | Method and apparatus for frame loss concealment in transform domain |
US10847170B2 (en) | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
US9837089B2 (en) | 2015-06-18 | 2017-12-05 | Qualcomm Incorporated | High-band signal generation |
KR20170000933A (ko) | 2015-06-25 | 2017-01-04 | 한국전기연구원 | 시간 지연 추정을 이용한 풍력 터빈의 피치 제어 시스템 |
US9830921B2 (en) | 2015-08-17 | 2017-11-28 | Qualcomm Incorporated | High-band target signal control |
US9978381B2 (en) | 2016-02-12 | 2018-05-22 | Qualcomm Incorporated | Encoding of multiple audio signals |
US10283143B2 (en) | 2016-04-08 | 2019-05-07 | Friday Harbor Llc | Estimating pitch of harmonic signals |
CN107945809B (zh) | 2017-05-02 | 2021-11-09 | 大连民族大学 | 一种复调音乐多音高估计方法 |
-
2017
- 2017-11-10 EP EP17201094.4A patent/EP3483880A1/en not_active Withdrawn
-
2018
- 2018-11-06 SG SG11202004204UA patent/SG11202004204UA/en unknown
- 2018-11-06 CN CN201880086260.1A patent/CN111587456B/zh active Active
- 2018-11-06 KR KR1020207015836A patent/KR102428419B1/ko active IP Right Grant
- 2018-11-06 AU AU2018363699A patent/AU2018363699B2/en active Active
- 2018-11-06 JP JP2020524877A patent/JP6990306B2/ja active Active
- 2018-11-06 CA CA3081781A patent/CA3081781C/en active Active
- 2018-11-06 PT PT187966759T patent/PT3707712T/pt unknown
- 2018-11-06 PL PL18796675T patent/PL3707712T3/pl unknown
- 2018-11-06 ES ES18796675T patent/ES2905911T3/es active Active
- 2018-11-06 WO PCT/EP2018/080339 patent/WO2019091978A1/en unknown
- 2018-11-06 MX MX2020004789A patent/MX2020004789A/es unknown
- 2018-11-06 EP EP18796675.9A patent/EP3707712B1/en active Active
- 2018-11-06 BR BR112020009104-9A patent/BR112020009104A2/pt unknown
- 2018-11-06 RU RU2020118948A patent/RU2740074C1/ru active
- 2018-11-07 TW TW107139531A patent/TWI701658B/zh active
- 2018-11-09 AR ARP180103272A patent/AR113480A1/es active IP Right Grant
-
2020
- 2020-05-07 US US16/868,954 patent/US11127408B2/en active Active
- 2020-05-07 ZA ZA2020/02520A patent/ZA202002520B/en unknown
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7548790B1 (en) * | 2000-03-29 | 2009-06-16 | At&T Intellectual Property Ii, L.P. | Effective deployment of temporal noise shaping (TNS) filters |
CN1926608A (zh) * | 2004-03-01 | 2007-03-07 | 弗兰霍菲尔运输应用研究公司 | 多声道信号处理设备和方法 |
CN104025189A (zh) * | 2011-10-27 | 2014-09-03 | Lg电子株式会社 | 编码语音信号的方法、解码语音信号的方法,及使用其的装置 |
CN105190749A (zh) * | 2013-01-29 | 2015-12-23 | 弗劳恩霍夫应用研究促进协会 | 噪声填充技术 |
Non-Patent Citations (1)
Title |
---|
"26445-010_s00_s04".《3GPP tsg_sa\WG4_CODEC》.2014, * |
Also Published As
Publication number | Publication date |
---|---|
AR113480A1 (es) | 2020-05-06 |
US11127408B2 (en) | 2021-09-21 |
CN111587456A (zh) | 2020-08-25 |
CA3081781A1 (en) | 2019-05-16 |
US20200265850A1 (en) | 2020-08-20 |
JP6990306B2 (ja) | 2022-01-12 |
EP3707712A1 (en) | 2020-09-16 |
PL3707712T3 (pl) | 2022-03-28 |
TW201923754A (zh) | 2019-06-16 |
BR112020009104A2 (pt) | 2020-10-20 |
TWI701658B (zh) | 2020-08-11 |
WO2019091978A1 (en) | 2019-05-16 |
MX2020004789A (es) | 2020-08-13 |
EP3707712B1 (en) | 2021-12-01 |
RU2740074C1 (ru) | 2021-01-11 |
KR20200090793A (ko) | 2020-07-29 |
AU2018363699A1 (en) | 2020-05-21 |
PT3707712T (pt) | 2022-02-15 |
ZA202002520B (en) | 2021-10-27 |
CA3081781C (en) | 2022-10-04 |
KR102428419B1 (ko) | 2022-08-02 |
JP2021502597A (ja) | 2021-01-28 |
EP3483880A1 (en) | 2019-05-15 |
SG11202004204UA (en) | 2020-06-29 |
ES2905911T3 (es) | 2022-04-12 |
AU2018363699B2 (en) | 2020-11-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2608878C1 (ru) | Регулировка уровня во временной области для декодирования или кодирования аудиосигналов | |
CN105264597B (zh) | 感知转换音频编码中的噪声填充 | |
US11616954B2 (en) | Signal encoding method and apparatus and signal decoding method and apparatus | |
US10692513B2 (en) | Low-frequency emphasis for LPC-based coding in frequency domain | |
KR102299193B1 (ko) | 상부 주파수 대역에서 검출된 피크 스펙트럼 영역을 고려하여 오디오 신호를 부호화하는 오디오 인코더, 오디오 신호를 부호화하는 방법, 및 컴퓨터 프로그램 | |
US20170223356A1 (en) | Signal encoding method and apparatus and signal decoding method and apparatus | |
EP3046104B1 (en) | Signal encoding method and signal decoding method | |
CN111587456B (zh) | 时域噪声整形 | |
CN111344784B (zh) | 控制编码器和/或解码器中的带宽 | |
US9640191B2 (en) | Apparatus and method for processing an encoded signal and encoder and method for generating an encoded signal | |
CN117751405A (zh) | 用于去除不期望的听觉粗糙度的装置和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |