CN101432610A - 使用有损编码的数据流和无损扩展数据流对源信号进行无损编码的方法以及设备 - Google Patents

使用有损编码的数据流和无损扩展数据流对源信号进行无损编码的方法以及设备 Download PDF

Info

Publication number
CN101432610A
CN101432610A CNA2007800156126A CN200780015612A CN101432610A CN 101432610 A CN101432610 A CN 101432610A CN A2007800156126 A CNA2007800156126 A CN A2007800156126A CN 200780015612 A CN200780015612 A CN 200780015612A CN 101432610 A CN101432610 A CN 101432610A
Authority
CN
China
Prior art keywords
signal
coding
data
decoding
lossless
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007800156126A
Other languages
English (en)
Other versions
CN101432610B (zh
Inventor
约翰尼斯·伯姆
彼得·杰克斯
弗洛里安·凯勒
奥利弗·乌伯特
斯文·科登
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of CN101432610A publication Critical patent/CN101432610A/zh
Application granted granted Critical
Publication of CN101432610B publication Critical patent/CN101432610B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

在基于有损的无损编码中,PCM音频信号通过有损编码器(41)至有损解码器(42)。有损编码器提供有损比特流。对PCM信号与有损解码器输出之间的差信号(SDiff)进行无损编码(52),提供扩展比特流。本发明通过扩展便于提高有损感知音频编码/解码,其中所述扩展通过增强的去相关,能够在数学上精确再现原始波形,并且本发明提供了附加数据以在解码器处重建中间质量音频信号。无损扩展能够用于将广泛使用的mp3编码/解码扩展为无损编码/解码和高质量mp3编码/解码。

Description

使用有损编码的数据流和无损扩展数据流对源信号进行无损编码的方法以及设备
技术领域
本发明涉及使用有损编码(encode)的数据流和无损扩展数据流对源信号进行无损编码的方法以及设备,其中所述有损编码的数据流和无损扩展数据流一起形成所述源信号的无损编码的数据流。通过能够在数学上精确(无损)再现原始音频信号波形的扩展数据增强了有损感知音频编码(coding)数据。
背景技术
在图1中描述了无损音频编码的基本原理。数字PCM音频信号采样并不互相独立。信号去相关11用于在熵编码12之前减小该依赖性。该过程需要是可逆的,以能够恢复原始信号。现有的去相关技术使用线性预测滤波(还称作线性预测编码LPC)、整数滤波器组(integerfilter-bank)以及基于有损的方式。
在图2和图3中描述了基于有损的无损编码的基本原理。在图2中的编码部分(左侧),PCM音频输入信号SPCM通过有损编码器21至有损解码器22,并且作为有损比特流至解码部分(右侧)的有损解码器25。有损编码和解码用于对信号进行去相关。在减法器23中将解码器22的输出信号从输入信号SPCM去除,并且得到的差信号通过有损编码器24,作为扩展比特流到达无损解码器27。26将解码器25和27的输出信号组合,以重新得到原始信号SPCM。在EP-B-0756386和US-B-6498811中针对音频编码公开了该基本原理,还在P.Craven,M.Gerzon,“Lossless Coding for Audio Discs”,J.Audio Eng.Soc.,Vol.44,No.9,September1996中以及在J.Koller,Th.Sporer,K.H.Brandenburg,“Robust Coding of High Quality Audio Signals”,AES 103rd Convention,Preprint 4621,August 1997中论述了该基本原理。
在图3中的有损编码器中,PCM音频输入信号SPCM通过分析滤波器组31以及子带(sub-band)采样的量化32至编码和比特流打包(packing)33。由接收信号SPCM并从分析滤波器组31接收相应信息的感知模型计算器34来控制量化。
在解码器侧,解码的有损比特流进入用于对比特流解包的装置35,然后进入用于对子带采样进行解码的装置36以及合成滤波器组37,输出解码后的有损PCM信号SDec
在标准ISO/IEC 11172-3(MPEG-1 Audio)中详细描述了针对有损编码和解码的示例。
因为有损编码器生成在频域中与掩蔽(masking)阈值成比例的误差信号SDiff,所以未很好地将信号去相关,从而信号对于熵编码而言是次最佳的。因此,以下公开关注对误差信号SDiff的特殊处理。一般的方法是将LPC去相关方案的变体应用到误差信号SDiff:WO-A-9953677、US-A-20040044520、WO-A-2005098823。在EP-A-0905918中,利用反馈环路将误差信号SDiff的幅度用于有损编码器部分的量化步骤,以控制在有损编码器中的量化从而产生对误差信号SDiff的更好的去相关。
发明内容
在为无损编码提供无损编码扩展时,期望以可缩放的(scalable)的方式使该过程变得容易。
本发明将要解决的问题是,以可缩放的方式为有损编码/解码提供一种改进的无损编码/解码扩展,例如,有损编码/解码是基于mp3(MPEG-1 Audio Layer 3)的。利用权利要求1中公开的编码方法以及权利要求3和5中的解码方法解决了该问题。分别在权利要求2、4和6中公开了使用这些方法的设备。
本发明利用能够在数学上精确再现(也就是无损编码/解码)原始波形的扩展,便于增强有损感知音频编码/解码。基于有损的无损编码通过将频谱去相关嵌入有损编码器-解码器中并嵌入附加时间LPC去相关,使用增强的去相关,其中不需要传输LPC滤波器参数。
有利地,本发明的无损扩展可用于将广泛使用的mp3编码/解码扩展为无损编码/解码。
有利地,本发明的编码方法适合使用有损编码的数据流和无损扩展数据流对源信号进行无损编码,所述有损编码的数据流和无损扩展数据流一起形成所述源信号的无损编码的数据流,所述方法包括步骤:
- 对所述源信号进行有损编码,其中所述有损编码提供所述有损编码的数据流以及频谱白化数据;
- 对所述有损编码的数据进行相应的有损解码,从而重建标准解码的信号,以及使用所述频谱白化数据,根据所述标准解码的信号来构造高质量解码的信号;
- 形成所述源信号与所述高质量解码的信号之间的差信号,以及对所述差信号进行无损编码;
- 将所述编码的差信号与所述频谱白化数据一起进行打包,以形成所述无损扩展数据流。
原理上,本发明的编码设备适于使用有损编码的数据流和无损扩展数据流对源信号进行无损编码,所述有损编码的数据流和无损扩展数据流一起形成所述源信号的无损编码的数据流,所述设备包括:
- 适于对所述源信号进行有损编码的装置,其中所述有损编码提供所述有损编码的数据流以及频谱白化数据;
- 适于对所述有损编码的数据进行相应的有损解码,从而重建标准解码的信号以及使用所述频谱白化数据根据所述标准解码的信号来构造高质量解码的信号的装置;
- 适于形成所述源信号与所述高质量解码的信号之间的差信号、以及适于对所述差信号进行无损编码、以及适于对所述差信号进行无损编码与所述频谱白化数据一起进行打包以形成所述无损扩展数据流的装置。
原理上,本发明的编码方法适于对无损编码的源信号数据流进行解码,所述数据流是从有损编码的数据流和无损扩展数据流得到的,所述有损编码的数据流和无损扩展数据流一起形成所述源信号的无损编码的数据流,
其中对所述源信号进行了有损编码,所述有损编码提供所述有损编码的数据流以及频谱白化数据,
其中对所述有损编码的数据进行了相应的有损解码,从而重建标准解码的信号,以及使用所述频谱白化数据,根据所述标准解码的信号构造了高质量解码的信号,
其中形成了所述源信号与所述高质量解码的信号之间的差信号,以及对所述差信号进行了无损编码,
其中将所述无损编码的差信号与所述频谱白化数据一起进行打包以形成所述无损扩展数据流,
所述方法包括步骤:
- 对所述无损扩展数据流进行解包,以及对所述无损编码的差信号进行解码,以提供所述差信号和所述频谱白化数据;
- 对所述有损编码的数据流进行有损解码,从而重建所述标准解码的信号,以及使用所述频谱白化数据,根据所述标准解码的信号来重建所述高质量解码的信号;
- 根据所述解码的无损编码的差信号以及根据所述高质量解码的信号,形成重建的源信号。
原理上,本发明的编码设备适于对无损编码的源信号数据流进行解码,所述数据流是从有损编码的数据流和无损扩展数据流得到的,所述有损编码的数据流和无损扩展数据流一起形成所述源信号的无损编码的数据流,
其中对所述源信号进行了有损编码,所述有损编码提供了所述有损编码的数据流以及频谱白化数据,
其中对所述有损编码的数据进行了相应的有损解码,从而重建了标准解码的信号,以及使用所述频谱白化数据,根据所述标准解码的信号构造了高质量解码的信号,
其中形成了所述源信号与所述高质量解码的信号之间的差信号,以及对所述差信号进行了无损编码,
其中将所述无损编码的差信号与所述频谱白化数据一起进行打包以形成所述无损扩展数据流,
所述设备包括:
- 适于对所述无损扩展数据流进行解包以及适于对所述无损编码的差信号进行解码以提供所述差信号和所述频谱白化数据的装置;
- 适于对所述有损编码的数据流进行有损解码,从而重建所述标准解码的信号,以及使用所述频谱白化数据,根据所述标准解码的信号来重建所述高质量解码的信号的装置;
- 适于根据所述解码的无损编码差信号以及根据所述高质量解码的信号来形成重建的源信号的装置。
原理上,另一种本发明解码方法适于对无损编码的源信号数据流进行解码,所述数据流是从有损编码的数据流和无损扩展数据流得到的,所述有损编码的数据流和无损扩展数据流一起形成所述源信号的无损编码的数据流,
其中对所述源信号进行了有损编码,所述有损编码提供了所述有损编码的数据流以及频谱白化数据,
其中对所述有损编码的数据进行了相应的有损解码,从而重建了标准解码的信号,以及使用所述频谱白化数据,根据所述标准解码的信号构造了高质量解码的信号,
其中形成了所述源信号与所述高质量解码的信号之间的差信号,以及对所述差信号进行了无损编码,
其中将所述无损编码的差信号与所述频谱白化数据一起进行打包以形成所述无损扩展数据流,
所述方法包括步骤:
- 对所述无损扩展数据流进行解包以提供所述频谱白化数据;
- 对所述有损编码的数据流进行有损解码,从而重建所述标准解码的信号,以及使用所述频谱白化数据,根据所述标准解码的信号来重建所述高质量解码的信号。
原理上,另一种本发明解码设备适于对无损编码的源信号数据流进行解码,所述数据流是从有损编码的数据流和无损扩展数据流得到的,所述有损编码的数据流和无损扩展数据流一起形成所述源信号的无损编码的数据流,
其中对所述源信号进行了有损编码,所述有损编码提供了所述有损编码的数据流以及频谱白化数据,
其中对所述有损编码的数据进行了相应的有损解码,从而重建了标准解码的信号,以及使用所述频谱白化数据,根据所述标准解码的信号构造了高质量解码的信号,
其中形成了所述源信号与所述高质量解码的信号之间的差信号,以及对所述差信号进行了无损编码,
其中将所述无损编码的差信号与所述频谱白化数据一起进行打包以形成所述无损扩展数据流,
所述设备包括:
- 适于对所述无损扩展数据流进行解包以提供所述频谱白化数据的装置;
- 适于对所述有损编码的数据流进行有损解码,从而重建所述标准解码的信号,以及使用所述频谱白化数据,根据所述标准解码的信号来重建所述高质量解码的信号的装置。
在各个从属权利要求中公开了本发明的有利附加实施例。
附图说明
参考附图描述了本发明的示例实施例,附图中:
图1示出了无损耗音频信号压缩的现有原理;
图2示出了现有的、基于有损的无损编码器和解码器的方框图;
图3示出了有损编码器和有损解码器的现有原理操作;
图4示出了本发明的、基于有损的无损编码的方框图;
图5示出了本发明的、基于有损的无损解码的方框图;
图6示出了图4中的有损编码器的更详细的方框图;
图7示出了示例信号:
a)在有损编码器子带域中的离散信号频谱,
b)感知控制量化后的误差信号,
c)白化后的误差信号,
d)频谱噪声整形以适配给定的LPC滤波器信号;
图8示出了图5中的有损解码器的更详细的方框图;
图9示出了图4中的无损编码器和打包器的更详细的方框图;
图10示出了LPC去相关器;
图11示出了图5中的无损解包器和解码器的更详细的方框图;
图12示出了扩展文件结构;
图13示出了比特流格式化。
具体实施方式
本发明通过使用改进的有损编码器(如图4所示的编码器41)解决了基于有损的无损编码的次最佳去相关的问题。除了根据原始输入信号SPCM生成适应的(compliant)有损比特流411以外,该编码器还产生特殊的频谱白化数据,除了其它信息以外,将所述频谱白化数据作为辅助信息412发送至相应的改进的有损解码器42并发送至输出无损扩展比特流的无损编码器和打包器45。在图6中更详细地示出了有损编码器41。按照结合图6和图7所解释的,形成频谱白化数据。在改进的有损解码器42中,对有损比特流44进行解码并且恢复输入信号当前帧的频谱,由此将来自信号412的频谱白化数据添加到频谱中。此后,在解码器42中应用合成滤波器组,在减法器44中通过从输入信号SPCM减去相应解码器42输出的信号S’Dec来计算时域误差信号SDiff,其中已经利用缓冲器43对所述输入信号SPCM进行了相应的延迟,以对编码器41和解码器42中所需要的处理时间进行补偿。现在误差信号SDiff具有白(也就是平坦(flat))频率功率谱,这等同于具有高去相关性,从而适于高效的熵编码。将信号SDiff馈送至无损编码器和打包器45,其中所述无损编码器和打包器45包含熵编码器,并且在所述无损编码器和打包器45的无损扩展流451输出中包括从编码器41提供的有损编码器辅助信息数据412以及从解码器42提供的有损解码器辅助信息数据421。
为了提高无损编码效率,改进的有损编码器41能够减少付给(infavour of)放置在无损编码器和打包器45内的附加LPC滤波器的白化数据的量(从而降低相关的比特率)。使用有损比特流元素(如在优选实施例中解码器42中的缩放因子(scale factor)或块频谱(blockspectrum))来确定LPC滤波器系数,仅需要传输很少量的附加数据以便能够在解码器侧计算滤波器系数。
在图5中的基于有损的无损解码中,在改进的有损解码器51中对有损比特流411进行解码,有损解码器51输出(已知的)有损解码和编码的输出信号SDec(例如可以表示为有损模式1的解码的mp3信号)。
例如,在接收无损扩展流451时,可以在无损解包器和解码器52中执行匹配有损比特流411的一致性(consistency)检验以及允许针对不同模式进行解码的许可检验。不同模式可以是有损模式1、有损模式2以及有损模式3。
如果不仅仅以模式1操作,则在装置52中对接收的频谱白化信号进行解包并且(在其它信息中)作为辅助信息521发送至有损解码器51,在所述有损解码器51中将频谱白化数据添加到恢复的频谱中,并且应用合成滤波器组以创建输出信号S’Dec。在有损模式2中,S’Dec是输出信号。这是在感知质量方面优于信号SDec的有损信号,在以下描述中称作“中间质量”。不一定要对无损编码的差信号SDiff进行解码。
在无损模式3中,在装置52中对无损扩展流451进一步进行解包并且在其中应用熵解码,如果在无损扩展比特流451中相应地表示了的情况下可以应用可选的LPC合成。在优选实施例中,使用来自有损比特流411的数据元素的相应信息项(如在有损解码器51的子带域中的缩放因子或有关有损耗系数块的频谱)以及在无损扩展流451内传输的可选的帮助信息项,来确定LPC合成滤波器系数。在装置52中恢复误差信号SDiff并且所述SDiff与信号S’Dec同步。在加法器中组合误差信号SDiff与信号S’Dec,以便重新获得对原始信号SPCM的数学上无损的重建。
在对信号S’Dec的计算方面,有损解码器51如在编码部分中的有损解码器42一样进行操作。解码部分中的信号S’Dec与编码部分中的信号S’Dec数学上相同,而且解码部分中的信号SDiff与编码部分中的SDiff数学上相同。
有利地,能够使用整数运算将有损解码器实现51和42以及装置52和装置54中的可选LPC元件实现为平台无关的。
结合图6更详细地解释图4的有损编码器41。结合图8更详细地解释图5的有损解码器51。通过将图4中的有损编码器41与有损解码器42组合,简化是可行的。
有损编码器
有损编码器41包括:均接收原始输入信号SPCM的分析滤波器组61和感知模型计算器64。滤波器组61的输出信号传递至减法器65的第一输入,通过第一量化装置62传递至第一减法器65的第二输入、以及传递至提供有损比特流411的比特流打包装置63。分析滤波器组61将信号SPCM转换到子带域中。
在图7a中描述了信号611的频谱的示例,示出了与频率f相对的频谱的幅度A。
根据由计算器64提供的感知模型的控制,在第一量化器62中将信号611量化。通过从原始子带采样611中减去量化后的子带采样621来计算误差信号651。通常该误差信号的幅度与在感知模型中确定的掩蔽阈值成比例。对照信号611,在图7b中描述了示例误差信号651。
在第二量化装置66中将误差信号651量化,使得在由第二减法器68和适配控制器67形成的适配控制环内计算另外的误差信号681,其中,如图7c中与信号611和651一起描述的,另外的误差信号681是信号651与第二量化器66的输出信号之差,并且接近白频谱。第二量化器66的输出信号表示频谱白化数据661,被作为辅助信息412的一部分发送至有损解码器42以及发送至无损编码器和打包器45。适配控制67控制第二量化器66,并且关注于为信号661找到正确的量化和正确的比特率。如果比特率超过了预定的阈值并且从而未将误差频谱681估计为“白色的”,则在辅助信息412内发送逃逸(escape)信号671,指示无损编码器和打包器45应该使用附加LPC去相关。适配控制67针对量化器66设置最佳量化步长,以产生平坦噪声基底(flat noise floor),参见图7c中的信号681。该控制可以包括对信号651的功率分析。迭代过程是不必要的。
适配控制67的第二任务是观测对熵编码后的信号661的比特率的估计。随后在步骤(step)或阶段(stage)93中对信号661进行熵编码。熵编码后的信号661的比特率是对“无损”比特流451的总体速率的主要贡献。如果该比特率估计超过了阈值,则发送在时域使用附加LPC去相关的逃逸信号671。
在另一实施例中,适配控制67可以将信号661最优化,使得信号681不再是白色的(也就是适配控制67在频率bin轴上使用不同的量化步长)。然后形成噪声基底681以匹配在不同LPC滤波器的字典中的给定LPC去相关器滤波器的特性。然后适配控制过程变成迭代的,以最低成本找到对信号681的最接近匹配(也就是共有比特率)。在图7d中描述了该实施例。
有损解码器
在图8中示出的有损解码器42接收有损比特流441,在比特流解包器81中将所述有损比特流411解包,并在子带采样解码器82中解码(如果适用则包括逆向量化器缩放因子处理),以产生与图6中的有损编码器中的信号621相同的子带采样信号821。在合成滤波器组83中将信号821变换回时域,其中所述合成滤波器组83在所有情况下恢复信号SDec的一组数据值。在组合器84中将(解包之后从无损扩展流中接收到的)频谱白化数据661添加到信号821中以形成信号841,所述信号841在子带域中具有与图6和图7c中的信号681的量化误差相同的量化误差。合成滤波器组85将信号841变换回时域,并且在所有情况下恢复信号S’Dec的一组数据值。因为通常输出信号SDec或S’Dec,所以可以使用分别与信号821或信号841相连接的单个合成滤波器。
应该使用特殊整数运算操作,以平台无关的方式实现有损解码器。在编码或解码侧的无损解码器内将给定的比特流解码为信号S’Dec需要在诸如基于ARM的、基于英特尔奔腾的、或基于DSP的平台之类的每个平台上生成数字上相同的结果。
缓冲器和同步
有损编码和解码包括在图4的信号SPCM与S’Dec之间的延迟。当在流实时应用中操作无损编码器时,有损编码器知道该延迟并且将对缓冲器43中的先入先出(First-In First-Out)缓冲进行控制,以在图4的减法器44处保证采样精确的(也就是同步的)操作。
当针对文件至文件操作来操作无损编码器时(例如将PCM音频文件转换为无损编码的文件),可以通过使用如US-B-6903664中描述的同步装置来替换缓冲器43。
在优选实施例中,有损编码器将会把指示编码延迟和原始文件长度的信息项插入到前一个或两个音频帧的有损比特流的辅助数据部分中,并插入到无损扩展的第一帧中。有损耗解码器42和51将读取该信息并且跳过由延迟信息指示的前面的编码的(零)采样。
无损编码器和打包器
在图9中更详细地示出了图4的无损编码器和打包器45。在常规操作期间将误差信号SDiff高度去相关,并且可以在熵编码器93中对所述误差信号SDiff熵编码,对于该编码而言优选实施例使用Golomb-Rice编码。还使用不同熵编码方法(例如Huffman编码)在编码器93中对(来自总线412的)特殊的白化数据661进行熵编码。打包器94使用熵编码后的数据931以及附加信息项412(如来自有损编码器41的逃逸信号671)来形成基于帧的比特流,并且输出无损扩展流451。如果具有逃逸信号671的有损编码器41指示出,则可以在LPC去相关器91中使用线性预测来将误差信号SDiff进一步去相关,在图10中更详细地示出了LPC去解码器91。LPC去解码器91从总线421接收帮助信息。由开关92来执行根据(来自总线412的)逃逸信号671的切换。
LPC去解码器
在图10中的LPC去解码器中,在减法器101中从输入信号SDiff中减去通过预测器102的版本。将减法器的输出信号馈送至开关92。预测器102使用通过滤波器确定器(determinator)103计算的滤波器,所述滤波器的滤波器系数是从来自总线421的帮助信息信号得到的。
滤波器确定器103能够按照以下进行操作:
模式1
将解码器的缩放因子作为信号421传输至滤波器确定器103。使用这些缩放因子si对以下变换域中的残余的频谱功率进行估计:See(i)=2-3/8si,其中i=0,...,Nband-1,(bin的数目),其中逐级的功率估计可以是平滑的。
复制这些频谱功率值以形成偶数序列S’ee(i),其中i=0,...,Nband-1,...,2Nband-1。执行该步骤以产生实值逆FFT序列。
此后,由iFFT(S’ee(i))来计算自相关。可以使用Levison-Durbin确定LPC系数。
该过程还可用于无损解码器中。如果在有损编码器比特流411内未传输更高频谱的相关部分,则将该缺失信息631从有损编码器中的步骤/阶段63发送至打包器94以进行传输,并从解包器111发送至滤波器确定器103。
模式2
利用适配控制器67从LPS滤波器系数组的字典中选择一组LPC滤波器系数。然后信号631变成针对所选组系数的字典索引,并且被传递至打包器94以进行传输。
辅助信息
辅助信息总线412和421将数据从有损编码器41传送至有损解码器42并从两者任一传送至无损编码器和打包器45,这些总线包括以下数据元素:
- (经由总线412从编码器41发送至解码器42以及至编码器/打包器45的)编码后的频谱白化数据661;
- (经由总线412从编码器41发送至编码器/打包器45的)指示附加LPC去相关的(也就是指示LPC去相关以及LPC合成是有效的)逃逸信号671;
- (经由总线421从解码器42分别发送至编码器/打包器45或94的)帮助信息信号,也就是用于LPC滤波器确定的缩放因子;
- 从有损编码器41发送至编码器打包器45/94的、用于针对高频带传输缺失的缩放因子的帮助信息631,或一组预定义的LPC滤波器系数的索引;
- 针对文件至文件应用,还有(经由总线421从编码器41发送至编码器42以及发送至编码器/打包器45的)有损编码器延迟值和/或原始文件长度值。
基于有损的无损解码
如结合图2已经描述的,使用有损解码器25和无损解码器27来实施解码,其中将所述有损解码器25和无损解码器27的输出信号组合以重新获得原始输入信号采样SPCM。有利地,能够以不同的模式来实施解码。
模式1
解码器能够对任何适应的(compliant)有损比特流411进行解码而不出现无损扩展流451,并且提供信号SDec。在出现无损扩展流451而未提供使用另一模式的许可的情况下,该模式也有效。优选地,解码器将检验无损扩展流,以匹配其权限数据库中的许可ID。
模式2
在检查无损扩展流数据时,解码器中的许可检验也可以启动中间质量模式。有损解码器仅对白化数据661进行使用和解包,以提供信号S’Dec
模式3
肯定的许可检验结果之后可以开始无损模式解码,并且输出信号SPCM
在图8中更详细地描述了相应的有损解码器51。在来自有损解包器和解码器52的辅助信息内告知了操作模式。基本上,针对有损解码器42所描述的相同细节同样适用。编码后的有损比特流411进入用于对比特流进行解包的装置81,跟随其后的是用于对子带采样进行解码的装置82以及合成滤波器组83,合成滤波器组83输出解码后的有损PCM信号SDec。在加法器84中将来自装置82的输出信号与相应的频谱白化数据661组合。组合后的信号841进入第二合成滤波器组85,第二合成滤波器组85输出解码后的有损PCM信号S’Dec
无损解包器和解码器
图11更详细地示出了无损解包器和解码器52。无损解包器111接收解析后并且解包后的无损扩展流451。
将控制信息路由至操作控制器115,在所述操作控制器115中,在文件至文件应用的情况下,能够执行一致性检验以识别关于有损比特流411的完整性。作为选项,从无损扩展流451中提取参考指纹(例如CRC数据)并且对有损比特流411的特定数据块计算当前指纹。如果这两个指纹相同,则继续进行正常操作。可以作为下一步骤执行许可检验,以识别允许的操作模式。从外部数据库接收的相应信息项1151用于与接收的比特流的许可标识符相比较。确定当前模式,并且相应的信号1152用于利用辅助信息通道521将有关信息发送至有损解码器51。在具体实施例中,还可以使用用于对加密后的无损扩展流进行解密的装置。
在解包之后,在熵解码器112中对音频扩展信号数据1111进行熵解码。例如,在解码器112中,对熵编码后的频谱白化数据项进行相应的熵解码。将解码后的白化数据661发送至有损解码器51,将差信号数据SDiff发送至组合器或求和单元53。如果由解包器111和操作控制器115在比特流451中识别出应用附加LPC合成的逃逸信息,所述控制器将使用信号1153将开关113切换至LPC合成路径。使用帮助信息1141计算LPC合成滤波器114的系数,其中所述帮助信息1141是从解包器111提供的,或可以根据有损比特流缩放因子或根据解码器子带信号841以及在无损扩展比特流451中传输的附加信息(如未在有损比特流441中传输的缺失的缩放因子或高频带的频谱功率信息,或指向一组预定义的LPC系数的索引值)来确定所述帮助信息1141。
辅助信息
在有损解码器51与无损解包器和解码器52之间交换的辅助信息521包括以下信息和数据元素:
- (发送至解码器52的)模式指示符信号1152;
- (发送至解码器52的)频谱白化数据661;
- (发送至无损解包器和解码器52的)来自有损解码器42以确定LPC滤波器系数的帮助信息;
- (发送至解码器52的)针对文件至文件应用的有损编码器延迟值和/或原始文件长度值。
无损扩展比特流
可以作为头数据元素在无损扩展比特流中提供以下数据元素:
- 明确识别相应有损比特流的指纹。对于2个文件应用而言尤其需要该元素,对于容器(一个文件)和流应用而言可以忽略该元素;
- 模式指示符和相应的DRM信息;
- 同步信息(有损编码延迟、原始文件长度、文件结束指示符);
- 原始信号的PCM字长(16、20或24比特);
- 提示点(cue point)信息,所述提示点信息能够在(可变比特率的)流内部更快地对无损数据帧进行寻址,包括恒定帧间隔指针和帧间隔长度指示符的表格。
在文件至文件应用中,仅需要在无损比特流的开始处提供一次这些信息项。在流应用中,需要每隔N个帧发送除提示点数据之外的其它信息项。
无损扩展比特流的帧数据元素是:
- 使得针对有损比特流能够进行帧同步操作的帧边界指示符;
- 编码的频谱误差(也就是白化)数据;
- 指示使用附加LPC合成的逃逸信息,以及LPC帮助信息;
- 编码的时间误差信号数据。
在图12中示出了无损扩展流文件格式。文件头提供辅助信息以开始解码过程。头数据自后,布置了包括用于重建中间质量音频信号以及用于重建无损质量音频信号的数据在内的可用长度的数据帧。
文件头数据:
- 头ID;
- 头长度;
- 指纹(例如CRC32数据);
- 模式指示信息块;
- 辅助信息:编解码器延迟、原始文件长度、PCM字长、采样速率;
- 提示点表格数据块:块长度值、帧中的间隔信息、表格条目的数目、指针表格。
帧数据:
- 同步字(可选的)以及帧长度;
- 编码的频谱误差(也就是白化)数据:块长度、编码的数据。这是编码为中间质量(模式2)所需要的数据。在该数据出现的情况下,在模式2下进行操作的解码器将跳过其余帧数据;
- LPC帮助信息:块长度值、LPC模式指示符、编码的数据;
- 编码的时间误差信号:块长度值、编码的数据。
比特流格式和权限管理
参见图13,可以针对不同的存储或流应用来格式化有损比特流411和无损扩展流451。将基于有损的无损编码131的输出信号411和451馈送至比特流格式化器(formatter)132。得到的输出信号1322可以是单个的流或文件,或可以包含2个流或2个文件。可以通过为格式化器132提供相应的权限管理数据1321来应用权限管理处理。
在解码侧,可以使用相应的比特流去格式化器。

Claims (15)

1、一种使用有损编码的数据流(411)和无损扩展数据流(451)对源信号(SPCM)进行无损编码的方法,所述有损编码的数据流(411)和无损扩展数据流(451)一起形成所述源信号的无损编码的数据流(1322),其特征在于以下步骤:
-对所述源信号进行有损编码(41),其中所述有损编码提供所述有损编码的数据流(411)以及频谱白化数据(661);
-对所述有损编码的数据进行相应的有损解码(42),从而重建标准解码的信号(SDec),以及使用所述频谱白化数据,根据所述标准解码的信号来构造高质量解码的信号(S’Dec);
-形成(43,44)所述源信号(SPCM)与所述高质量解码的信号(S’Dec)之间的差信号(SDiff),以及对所述差信号进行无损编码(45);
-将所述编码的差信号与所述频谱白化数据(661)一起进行打包,以形成所述无损扩展数据流(451)。
2、一种使用有损编码的数据流(411)和无损扩展数据流(451)对源信号(SPCM)进行无损编码的设备,所述有损编码的数据流(411)和无损扩展数据流(451)一起形成所述源信号的无损编码的数据流(1322),所述设备包括:
-适于对所述源信号进行有损编码的装置(41),其中所述有损编码提供所述有损编码的数据流(441)以及频谱白化数据(661);
-适于对所述有损编码的数据进行相应的有损解码,从而重建标准解码的信号(SDec),以及使用所述频谱白化数据,根据所述标准解码的信号来构造高质量解码的信号(S’Dec)的装置(42);
-适于形成所述源信号(SPCM)与所述高质量解码的信号(S’Dec)之间的差信号(SDiff),对所述差信号进行无损编码,并将所述编码的差信号与所述频谱白化数据(661)一起进行打包以形成所述无损扩展数据流(451)的装置(43,44,45)。
3、一种对无损编码的源信号(SPCM)数据流进行解码的方法,所述数据流是从有损编码的数据流(411)和无损扩展数据流(451)得到的,所述有损编码的数据流(411)和无损扩展数据流(451)一起形成所述源信号的无损编码的数据流(1322),
其中对所述源信号进行了有损编码(41),所述有损编码提供所述有损编码的数据流(411)以及频谱白化数据(661),
其中对所述有损编码的数据进行了相应的有损解码(42),从而重建标准解码的信号(SDec),以及使用所述频谱白化数据,根据所述标准解码的信号构造了高质量解码的信号(S’Dec),
其中形成了(43,44)所述源信号(SPCM)与所述高质量解码的信号(S’Dec)之间的差信号(SDiff),以及对所述差信号进行了无损编码(45),
其中将所述无损编码的差信号与所述频谱白化数据(661)一起进行打包以形成所述无损扩展数据流(451),
所述方法包括步骤:
-对所述无损扩展数据流(451)进行解包(52)以及对所述无损编码的差信号进行解码(52),以提供所述差信号(SDiff)和所述频谱白化数据(661);
-对所述有损编码的数据流(411)进行有损解码(51),从而重建所述标准解码的信号(SDec),以及使用所述频谱白化数据,根据所述标准解码的信号来重建(51)所述高质量解码的信号(S’Dec);
-根据所述解码的无损编码的差信号(SDiff)以及根据所述高质量解码的信号(S’Dec),形成(53)重建的源信号(SPCM)。
4、一种对无损编码的源信号(SPCM)数据流进行解码的设备,所述数据流是从有损编码的数据流(411)和无损扩展数据流(451)得到的,所述有损编码的数据流(411)和无损扩展数据流(451)一起形成所述源信号的无损编码的数据流(1322),
其中对所述源信号进行了有损编码(41),所述有损编码提供所述有损编码的数据流(411)以及频谱白化数据(661),
其中对所述有损编码的数据进行了相应的有损解码(42),从而重建了标准解码的信号(SDec),以及使用所述频谱白化数据,根据所述标准解码的信号构造了高质量解码的信号(S’Dec),
其中形成了(43,44)所述源信号(SPCM)与所述高质量解码的信号(S’Dec)之间的差信号(SDiff),以及对所述差信号进行了无损编码(45),
其中将所述无损编码的差信号与所述频谱白化数据(661)一起进行打包以形成所述无损扩展数据流(451),
所述设备包括:
-适于对所述无损扩展数据流(451)进行解包并对所述无损编码的差信号进行解码,以提供所述差信号(SDiff)和所述频谱白化数据(661)的装置(52);
-适于对所述有损编码的数据流(411)进行有损解码(51),从而重建所述标准解码的信号(SDec),以及使用所述频谱白化数据,根据所述标准解码的信号来重建(51)所述高质量解码的信号(S’Dec)的装置(51);
-适于根据所述解码的无损编码的差信号(SDiff)以及根据所述高质量解码的信号(S’Dec)来形成重建的源信号(SPCM)的装置(53)。
5、一种对无损编码的源信号(SPCM)数据流进行解码的方法,所述数据流是从有损编码的数据流(411)和无损扩展数据流(451)得到的,所述有损编码的数据流(411)和无损扩展数据流(451)一起形成所述源信号的无损编码的数据流(1322),
其中对所述源信号进行了有损编码(41),所述有损编码提供了所述有损编码的数据流(411)以及频谱白化数据(661),
其中对所述有损编码的数据进行了相应的有损解码(42),从而重建了标准解码的信号(SDec),以及使用所述频谱白化数据,根据所述标准解码的信号构造了高质量解码的信号(S’Dec),
其中形成了(43,44)所述源信号(SPCM)与所述高质量解码的信号(S’Dec)之间的差信号(SDiff),以及对所述差信号进行了无损编码(45),
其中将所述无损编码的差信号与所述频谱白化数据(661)一起进行打包以形成所述无损扩展数据流(451),
所述方法包括步骤:
-对所述无损扩展数据流(451)进行解包(52)以提供所述频谱白化数据(661);
-对所述有损编码的数据流(411)进行有损解码(51),从而重建所述标准解码的信号(SDec),以及使用所述频谱白化数据,根据所述标准解码的信号来重建(51)所述高质量解码的信号(S’Dec)。
6、一种对无损编码的源信号(SPCM)数据流进行解码的设备,所述数据流是从有损编码的数据流(411)和无损扩展数据流(451)得到的,所述有损编码的数据流(411)和无损扩展数据流(451)一起形成所述源信号的无损编码的数据流(1322),
其中对所述源信号进行了有损编码(41),所述有损编码提供了所述有损编码的数据流(411)以及频谱白化数据(661),
其中对所述有损编码的数据进行了相应的有损解码(42),从而重建了标准解码的信号(SDec),以及使用所述频谱白化数据,根据所述标准解码的信号构造了高质量解码的信号(S’Dec),
其中形成了(43,44)所述源信号(SPCM)与所述高质量解码的信号(S’Dec)之间的差信号(SDiff),以及对所述差信号进行了无损编码(45),
其中将所述无损编码的差信号与所述频谱白化数据(661)一起进行打包以形成所述无损扩展数据流(451),
所述设备包括:
-适于对所述无损扩展数据流(451)进行解包以提供所述频谱白化数据(661)的装置(52);
-适于对所述有损编码的数据流(411)进行有损解码(51),从而重建所述标准解码的信号(SDec),以及使用所述频谱白化数据,根据所述标准解码的信号来重建(51)所述高质量解码的信号(S’Dec)的装置(51)。
7、根据权利要求1、3和5之一的方法,或根据权利要求2、4和6之一的设备,其中,所述频谱白化数据(661)是通过以下方式产生的:
-在分析滤波器组(61)中对所述源信号(SPCM)进行处理,并将所述分析滤波器组(61)的输出信号量化(62),形成分析滤波器组的输出信号(611)与量化输出信号(621)之间的差信号(651),其中所述量化是由感知模型计算器(64)来控制的;
-将所述差信号(651)量化(66),控制(67)该进一步的量化,使得所述进一步的量化的输入与输出之间的差信号(681)接近白频谱,从而所述进一步的量化的输出信号形成所述频谱白化数据(661)。
8、根据权利要求7的方法或设备,其中:
-所述进一步的量化(66)是由适配控制器(67)控制的,所述适配控制器(67)对所述频谱白化数据(661)的当前比特率进行检验,如果所述当前比特率超过预定的阈值,则设置逃逸信号(671);
-对所述差信号(SDiff)的所述无损编码使用熵编码器(93),在设置了逃逸信号的情况下所述熵编码器(93)的输入信号通过LPC去相关器,以及相应地
对所述无损编码的差信号的所述无损解码使用熵解码器(112),在编码处设置了所述逃逸信号的情况下所述熵解码器(112)的输出信号通过LPC合成(114)。
9、根据权利要求1、3、5、7和8之一的方法,或根据权利要求2、4以及6至8之一的设备,其中,分别在编码处对所述频谱白化数据(661)进行熵编码(93),以及分别在解码处对所述频谱白化数据(661)进行熵解码(112)。
10、根据权利要求8或9的方法或设备,其中,所述LPC去相关器和所述LPC合成是LPC滤波器,使用诸如所述有损比特流(411)的子带域中的缩放因子和/或有关系数块的频谱之类的信息项和/或帮助信息项来确定所述LPC滤波器的滤波器系数。
11、根据权利要求1、3、5以及7至10之一的方法,或根据权利要求2、4以及6至10之一的设备,其中,所述无损扩展数据流(451)包括:
-编码的频谱白化数据(661);
-指示LPC去相关是有效的逃逸信号(671);
-帮助信息信号;
-对于文件至文件应用的有损编码器延迟值和/或原始文件长度值。
12、一种无损扩展比特流(451),包括:
-熵编码的差信号(SDiff)数据;
-编码的频谱白化数据(661);
-指示LPC去相关是有效的逃逸信号(671);
-帮助信息信号;
-对于文件至文件应用的有损编码器延迟值和/或原始文件长度值,
其中数据目和信号利于执行根据权利要求3或5的方法。
13、一种无损编码的比特流(1322),包括:有损编码的信号数据(441),例如mp3数据,以及在权利要求2中限定的数据项和信号以及可选值。
14、一种存储介质,例如光盘上的存储介质,包括或存储或在其上记录有:根据权利要求1以及7至11之一的方法编码的数字视频信号。
15、一种存储介质,例如光盘上的存储介质,包括或存储或在其上记录有:根据权利要求12或13的比特流。
CN2007800156126A 2006-05-05 2007-04-18 使用有损编码的数据流和无损扩展数据流对源信号进行无损编码的方法以及设备 Expired - Fee Related CN101432610B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP06113576A EP1852848A1 (en) 2006-05-05 2006-05-05 Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream
EP06113576.0 2006-05-05
PCT/EP2007/053783 WO2007128661A1 (en) 2006-05-05 2007-04-18 Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream

Publications (2)

Publication Number Publication Date
CN101432610A true CN101432610A (zh) 2009-05-13
CN101432610B CN101432610B (zh) 2011-11-23

Family

ID=36694486

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007800156126A Expired - Fee Related CN101432610B (zh) 2006-05-05 2007-04-18 使用有损编码的数据流和无损扩展数据流对源信号进行无损编码的方法以及设备

Country Status (9)

Country Link
US (1) US8428941B2 (zh)
EP (2) EP1852848A1 (zh)
JP (1) JP5135330B2 (zh)
KR (1) KR101404335B1 (zh)
CN (1) CN101432610B (zh)
AT (1) ATE459868T1 (zh)
BR (1) BRPI0711190B1 (zh)
DE (1) DE602007005119D1 (zh)
WO (1) WO2007128661A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105845145A (zh) * 2010-12-03 2016-08-10 杜比实验室特许公司 用于处理媒体数据的方法和媒体处理系统
CN107210753A (zh) * 2014-12-27 2017-09-26 阿斯卡瓦公司 通过从驻留在内容关联滤筛中的基本数据单元导出数据的数据的无损简化
CN109887515A (zh) * 2019-01-29 2019-06-14 北京市商汤科技开发有限公司 音频处理方法及装置、电子设备和存储介质
CN111179963A (zh) * 2013-07-22 2020-05-19 弗劳恩霍夫应用研究促进协会 用自适应频谱铺片选择的音频信号解码和编码设备及方法
WO2024169532A1 (zh) * 2023-02-17 2024-08-22 华为技术有限公司 有损编解码器和无损编解码器之间的切换方法和装置

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1881485A1 (en) * 2006-07-18 2008-01-23 Deutsche Thomson-Brandt Gmbh Audio bitstream data structure arrangement of a lossy encoded signal together with lossless encoded extension data for said signal
CN101615395B (zh) 2008-12-31 2011-01-12 华为技术有限公司 信号编码、解码方法及装置、系统
US8457976B2 (en) 2009-01-30 2013-06-04 Qnx Software Systems Limited Sub-band processing complexity reduction
EP2355094B1 (en) * 2010-01-29 2017-04-12 2236008 Ontario Inc. Sub-band processing complexity reduction
EP2395505A1 (en) * 2010-06-11 2011-12-14 Thomson Licensing Method and apparatus for searching in a layered hierarchical bit stream followed by replay, said bit stream including a base layer and at least one enhancement layer
CA2827249C (en) 2011-02-14 2016-08-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
AU2012217156B2 (en) 2011-02-14 2015-03-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Linear prediction based coding scheme using spectral domain noise shaping
EP3239978B1 (en) 2011-02-14 2018-12-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoding and decoding of pulse positions of tracks of an audio signal
MX2013009304A (es) * 2011-02-14 2013-10-03 Fraunhofer Ges Forschung Aparato y metodo para codificar una porcion de una señal de audio utilizando deteccion de un transiente y resultado de calidad.
GB201210373D0 (en) * 2012-06-12 2012-07-25 Meridian Audio Ltd Doubly compatible lossless audio sandwidth extension
US9711150B2 (en) 2012-08-22 2017-07-18 Electronics And Telecommunications Research Institute Audio encoding apparatus and method, and audio decoding apparatus and method
EP2770642B1 (en) * 2013-02-26 2022-10-05 Tata Consultancy Services Limited Systems and methods for data archival
US10431242B1 (en) * 2017-11-02 2019-10-01 Gopro, Inc. Systems and methods for identifying speech based on spectral features
BR112020011026A2 (pt) 2017-11-17 2020-11-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. aparelho e método para codificar ou decodificar parâmetros de codificação de áudio direcional com o uso de quantização e codificação de entropia
CN115472171A (zh) * 2021-06-11 2022-12-13 华为技术有限公司 编解码方法、装置、设备、存储介质及计算机程序

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0799531B1 (en) 1994-12-20 2000-03-22 Dolby Laboratories Licensing Corporation Method and apparatus for applying waveform prediction to subbands of a perceptual coding system
DE19742201C1 (de) * 1997-09-24 1999-02-04 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Codieren von Audiosignalen
JPH11109996A (ja) 1997-10-06 1999-04-23 Victor Co Of Japan Ltd 音声符号化装置、音声符号化方法及び音声符号化情報の記録された光記録媒体並びに音声復号装置
JP4267084B2 (ja) 1998-04-09 2009-05-27 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 伝送システムの損失のない符号化/復号化
EP1186100A2 (en) 2000-01-07 2002-03-13 Koninklijke Philips Electronics N.V. Generating coefficients for a prediction filter in an encoder
SE0004163D0 (sv) * 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
US6675148B2 (en) 2001-01-05 2004-01-06 Digital Voice Systems, Inc. Lossless audio coder
JP3636094B2 (ja) * 2001-05-07 2005-04-06 ソニー株式会社 信号符号化装置及び方法、並びに信号復号装置及び方法
KR100908114B1 (ko) 2002-03-09 2009-07-16 삼성전자주식회사 스케일러블 무손실 오디오 부호화/복호화 장치 및 그 방법
US7275036B2 (en) 2002-04-18 2007-09-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a time-discrete audio signal to obtain coded audio data and for decoding coded audio data
US7536305B2 (en) 2002-09-04 2009-05-19 Microsoft Corporation Mixed lossless audio compression
KR100467326B1 (ko) * 2002-12-09 2005-01-24 학교법인연세대학교 추가 비트 할당 기법을 이용한 음성 부호화 및 복호화를위한 송수신기
DE102004007184B3 (de) 2004-02-13 2005-09-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren und Vorrichtung zum Quantisieren eines Informationssignals
US7392195B2 (en) 2004-03-25 2008-06-24 Dts, Inc. Lossless multi-channel audio codec
US20060015329A1 (en) 2004-07-19 2006-01-19 Chu Wai C Apparatus and method for audio coding
SG161223A1 (en) * 2005-04-01 2010-05-27 Qualcomm Inc Method and apparatus for vector quantizing of a spectral envelope representation
KR100818268B1 (ko) 2005-04-14 2008-04-02 삼성전자주식회사 오디오 데이터 부호화 및 복호화 장치와 방법
EP1949369B1 (en) 2005-10-12 2012-09-26 Samsung Electronics Co., Ltd. Method and apparatus for encoding/decoding audio data and extension data
US7835904B2 (en) 2006-03-03 2010-11-16 Microsoft Corp. Perceptual, scalable audio compression
US20080243518A1 (en) 2006-11-16 2008-10-02 Alexey Oraevsky System And Method For Compressing And Reconstructing Audio Files
KR101379263B1 (ko) 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
ES2663269T3 (es) 2007-06-11 2018-04-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador de audio para codificar una señal de audio que tiene una porción similar a un impulso y una porción estacionaria

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105845145A (zh) * 2010-12-03 2016-08-10 杜比实验室特许公司 用于处理媒体数据的方法和媒体处理系统
CN111179963A (zh) * 2013-07-22 2020-05-19 弗劳恩霍夫应用研究促进协会 用自适应频谱铺片选择的音频信号解码和编码设备及方法
US11922956B2 (en) 2013-07-22 2024-03-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding or decoding an audio signal with intelligent gap filling in the spectral domain
US11996106B2 (en) 2013-07-22 2024-05-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
CN107210753A (zh) * 2014-12-27 2017-09-26 阿斯卡瓦公司 通过从驻留在内容关联滤筛中的基本数据单元导出数据的数据的无损简化
CN107210753B (zh) * 2014-12-27 2021-03-09 阿斯卡瓦公司 通过从驻留在内容关联滤筛中的基本数据单元导出数据的数据的无损简化
CN109887515A (zh) * 2019-01-29 2019-06-14 北京市商汤科技开发有限公司 音频处理方法及装置、电子设备和存储介质
CN109887515B (zh) * 2019-01-29 2021-07-09 北京市商汤科技开发有限公司 音频处理方法及装置、电子设备和存储介质
WO2024169532A1 (zh) * 2023-02-17 2024-08-22 华为技术有限公司 有损编解码器和无损编解码器之间的切换方法和装置

Also Published As

Publication number Publication date
EP2016383B1 (en) 2010-03-03
EP2016383A1 (en) 2009-01-21
JP2009536363A (ja) 2009-10-08
JP5135330B2 (ja) 2013-02-06
US20090164226A1 (en) 2009-06-25
ATE459868T1 (de) 2010-03-15
WO2007128661A1 (en) 2007-11-15
US8428941B2 (en) 2013-04-23
BRPI0711190A2 (pt) 2011-08-23
BRPI0711190B1 (pt) 2018-01-30
EP1852848A1 (en) 2007-11-07
KR20090007395A (ko) 2009-01-16
DE602007005119D1 (de) 2010-04-15
KR101404335B1 (ko) 2014-06-09
CN101432610B (zh) 2011-11-23

Similar Documents

Publication Publication Date Title
CN101432610B (zh) 使用有损编码的数据流和无损扩展数据流对源信号进行无损编码的方法以及设备
KR101664434B1 (ko) 오디오 신호의 부호화 및 복호화 방법 및 그 장치
KR100818268B1 (ko) 오디오 데이터 부호화 및 복호화 장치와 방법
TWI498881B (zh) 使用適應性混成轉換之多聲道音訊編碼位元串流的改良解碼技術
KR101139172B1 (ko) 스케일러블 음성 및 오디오 코덱들에서 양자화된 mdct 스펙트럼에 대한 코드북 인덱스들의 인코딩/디코딩을 위한 기술
US7876966B2 (en) Switching between coding schemes
CN101490748B (zh) 使用有损编码数据流和无损扩展数据流对源信号进行无损编码的方法和设备
CN102150202B (zh) 对音频/语音信号进行编码和解码的方法和设备
US7774205B2 (en) Coding of sparse digital media spectral data
CN101484937B (zh) 使用缓冲器调节对已预测编码的数据进行解码
WO2006000842A1 (en) Multichannel audio extension
WO2002103685A1 (fr) Appareil et procede de codage, appareil et procede de decodage et programme
CN101432802A (zh) 使用有损编码的数据流和无损扩展数据流对源信号进行无损编码的方法以及设备
KR20100007738A (ko) 음성/오디오 통합 신호의 부호화/복호화 장치
KR20100089772A (ko) 오디오 신호의 부호화 및 복호화 방법 및 그 장치
KR102702697B1 (ko) 오디오 신호의 고주파 재구성을 위한 하모닉 트랜스포저의 하위호환형 통합
CN101615393A (zh) 对语音和/或非语音音频输入信号编码或解码的方法和设备
JP2010506207A (ja) エンコード方法、デコード方法、エンコーダ、デコーダ、及びコンピュータプログラム製品
KR101387808B1 (ko) 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치
CA2765523A1 (en) Coding method, decoding method, and device and recording medium using the methods
KR102546098B1 (ko) 블록 기반의 오디오 부호화/복호화 장치 및 그 방법
KR20080092823A (ko) 부호화/복호화 장치 및 방법
CN102568489B (zh) 编码器
KR101455648B1 (ko) 상호 운용성을 지원하는 오디오/스피치 신호의부호화/복호화 방법 및 시스템

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20170522

Address after: Amsterdam, The Netherlands

Patentee after: DOLBY INTERNATIONAL AB

Address before: French Boulogne - Bilang Kurt

Patentee before: THOMSON LICENSING

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20180628

Address after: No. 18, Wu Sha seashore road, Changan Town, Dongguan, Guangdong

Patentee after: GUANGDONG OPPO MOBILE TELECOMMUNICATIONS Corp.,Ltd.

Address before: Amsterdam, The Netherlands

Patentee before: Dolby International AB

TR01 Transfer of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20111123

CF01 Termination of patent right due to non-payment of annual fee