CN101238510A - 处理音频信号的装置和方法 - Google Patents

处理音频信号的装置和方法 Download PDF

Info

Publication number
CN101238510A
CN101238510A CNA2006800289829A CN200680028982A CN101238510A CN 101238510 A CN101238510 A CN 101238510A CN A2006800289829 A CNA2006800289829 A CN A2006800289829A CN 200680028982 A CN200680028982 A CN 200680028982A CN 101238510 A CN101238510 A CN 101238510A
Authority
CN
China
Prior art keywords
piece
code
sub
code parameter
entropy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2006800289829A
Other languages
English (en)
Inventor
T·利伯成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from PCT/KR2005/002292 external-priority patent/WO2007011080A1/en
Priority claimed from PCT/KR2005/002290 external-priority patent/WO2007011078A1/en
Priority claimed from PCT/KR2005/002291 external-priority patent/WO2007011079A1/en
Priority claimed from PCT/KR2005/002306 external-priority patent/WO2007011083A1/en
Priority claimed from PCT/KR2005/002308 external-priority patent/WO2007011085A1/en
Priority claimed from PCT/KR2005/002307 external-priority patent/WO2007011084A1/en
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of CN101238510A publication Critical patent/CN101238510A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10546Audio or video recording specifically adapted for audio data

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

在一个实施方式中,一个音频数据块被分割成N个子块,并确定多个代码参数s(0)、s(1)、…s(N-1)。利用由多个代码参数定义的多个熵代码对N个子块进行熵编码,并发送代码参数。可通过直接发送表示第一子块的代码参数的s(0)并发送差s(i)-s(i-1)来发送代码参数,其中i=1,….N-1,s(i)表示第一子块后的第i子块的代码参数。

Description

处理音频信号的装置和方法
发明背景
本发明涉及一种处理音频信号的方法,尤其涉及一种编码和解码音频信号的方法和装置。
过去曾经以不同方法实现了音频信号的存储和重放。例如,音乐和语音业已通过留声技术(例如唱盘播放机)、磁技术(例如卡式磁带)和数字技术(例如光盘)来记录和保存。随着音频存储技术的发展,需要克服许多难题来优化音频信号的质量和可存储性。
为了音乐信号的存档和宽带传输,无损重建成为比借助诸如MP3或AAC等在MPEG标准中定义的感性编码高效率压缩更为重要的特征。
虽然DVD音频和超级CD音频包括专利无损压缩方案,但是在内容持有者和广播公司当中需要一种开放和综合性的压缩方案。响应于这种需要,一种新的无损编码方案已经成为MPEG-4音频标准的延伸。无损音频编码法由于原始信号的完美重建而实现了没有任何质量损失的数字音频数据压缩。
发明内容
本发明涉及处理音频信号的方法。
在一个实施方式中,一个音频数据块被分割成N个子块,并确定多个代码参数s(0)、s(1)、...s(N-1)。利用由多个代码参数定义的多个熵代码对N个子块进行熵编码,并发送代码参数。可通过直接发送表示第一子块的代码参数的s(0)并发送差s(i)-s(i-1)来发送代码参数,其中i=1,....N-1,s(i)表示第一子块后的第i子块的代码参数。
在一个实施方式中,发送代码参数还包括在发送前利用所选择的熵代码对差s(i)-s(i-1)进行编码。
在另一个实施方式中,接收包括被分割成N个子块的一个音频数据块的音频信号。通过以下步骤分别生成多个代码参数s(0)、s(1)、...、s(N-1):从音频信号中检测s(0),其中s(0)表示第一子块的代码参数;并从音频信号中检测差s(i)-s(i-1),i=1,....N-1,其中s(i)表示第一子块后的每一子块的代码参数。利用s(0)和检测的差计算s(i),i=1,....N-1。利用分别由所生成的代码参数定义的多个熵代码来解码所述N个子块。
本发明还涉及编码音频信号的方法和装置,并涉及解码音频信号的方法和装置。
附图说明
包括于此以提供对本发明的进一步理解、并被结合在本申请中且构成其一部分的附图示出本发明的实施方式,其与说明书一起可用来解释本发明的原理。
在附图中:
图1是根据本发明一个实施方式的编码器的示例图。
图2是根据本发明一个实施方式的解码器的示例图。
图3是根据本发明一个实施方式的压缩的M-声道文件的比特流结构的示例图。
图4是根据本发明一个实施方式的分级块切换方法的概念图的示例图。
图5是块切换示例及相应的块切换信息代码的示例图。
图6是根据本发明实施方式的多个声道的块切换方法的示例图。
具体实施方式
下面将详细参考本发明的较佳实施方式,其具体示例图示于附图中。只要有可能,即在所有附图中使用相同的附图标记表示相同或相似的部件。
在对本发明进行叙述之前,应当指出的是本发明中揭示的大多数术语对应于本领域内公知的一般术语,但部分术语是由申请人根据需要选择的,并且将在本发明下文的描述中予以揭示。因此,由申请人定义的术语优选基于它们在本发明中的含义来理解。
在无损音频编码方法中,由于编码进程必须是可以完美逆转而不会有信息损失的,因此编码器和解码器两者的若干部件必须以确定性的方式来实现。
编码解码器结构
图1是根据本发明的编码器1的示例图。
分割部件100将输入的音频数据分割成若干帧。在一个帧之中,每个声道还可进一步被细分成若干个音频采样块以做进一步处理。缓冲器110存储由分割部件100分割后的块和/或帧采样。
系数估算部件120针对每个块估算最佳的一组系数值。系数的数量,即预测器的阶数也可以适应性地做出选择。系数估算部件120针对数字音频数据块计算一组部分自相关系数(parcor)值。部分自相关系数值指示预测器系数的部分自相关系数表示。量化部件130将该组部分自相关系数值量化。
第一熵编码部件140通过从部分自相关系数值减去一个偏移值来计算出部分自相关系数残差值,并使用由熵参数所定义的熵代码对部分自相关系数的残差值进行编码,其中偏移值和熵参数选自最佳表。最优表是基于数字音频数据块的采样率从多个表中选择的。这多个表是分别对多个采样率范围预定义的以实现为了传输而进行的数字音频数据的最优压缩。
系数转换部件150将量化了的部分自相关系数转换成线性预测编码(LPC)系数。预测器160使用线性预测编码系数从存储在缓冲器110中的之前的原始采样估算当前预测值。减法器170使用存储在缓冲器110中的数字音频数据的原始值和在预测器160中估算出的预测值计算数字音频数据块的预测残差。
第二熵编码部件180使用不同的熵代码编码预测残差并生成代码索引。所选代码的索引将作为辅助信息发送。第二熵编码部件180可使用具有不同复杂度的两种可供选择的编码技术之一对预测残差进行编码。一种编码技术是公知的Golomb-Rice编码(在下文中简称为Rice代码)法而另一种是公知的分块Gilbert-Moore代码(在下文中简称为BGMC)法。Rice代码复杂度低但仍然是高效率的。BGMC算术编码方案以比Rice代码复杂度稍高为代价提供更好的压缩。
最后,多路复用部件190将编码的预测残差、代码索引、编码的部分自相关系数残差值和其它附加信息进行多路复用形成压缩的比特流。
编码器1还提供循环冗余校验(CRC)校验和,它主要是供解码器验证解码的数据。在编码器方面,CRC可用来确保压缩的数据是能够进行无损解码的。
其它编码选项包括灵活块切换方案、随机存取和联合声道编码。编码器1可使用这些选项提供若干具有不同复杂度的压缩等级。将联合声道编码用于利用立体声或多声道信号的各声道之间的相关性。这可通过在能够比原始信道之一更高效率地编码两个声道之间的差异的片段(segments)中编码这种差异来实现。这些编码选项将在对根据本发明的示例性解码器进行说明之后更为详细地予以说明。
图2是根据本发明的解码器2的示例图。更具体地,图2示出由于不必执行任何适应性调整因而复杂度显著低于编码器的无损音频信号解码器。
多路分解部件200接收音频信号并将经编码的数字音频数据块的预测残差、代码索引、经编码的部分自相关系数残差值和其它附加信息多路分解。第一熵解码部件210使用由熵参数定义的熵代码对部分自相关系数残差值进行解码并通过将偏移值加至经解码的部分自相关系数残差值来计算出一组部分自相关系数值;其中的偏移值和熵参数选自一个表,该表是由解码器基于数字音频数据块的采样率从多个表中选择的。第二熵解码部件220使用代码索引对经多路分解编码的预测残差进行解码。系数转换部件230将熵解码的部分自相关系数值转换成LPC系数。预测器240使用LPC系数估算数字音频数据块的预测残差。加法器250将经解码的预测残差加至估算的预测残差以获得数字音频数据的原始块。组装部件260将经解码的块数据组装成帧数据。
因此,解码器2将经编码的预测残差和部分自相关系数残差值解码,将部分自相关系数残差值转换成LPC系数,并应用反向预测滤波器来计算无损重建信号。解码器2的计算工作量取决于由编码器1选择的预测阶数。在大多数情形下,实时解码即使在低端系统中也是可能的。
图3是根据本发明的包括多个声道(例如M个声道)的压缩音频信号的比特流结构的示例图。
比特流由至少一个包括多个声道(例如M个声道)的音频帧构成。比特流配置句法(见下面的表6)中的“channels”字段指示声道数。每个声道利用根据本发明的块切换方案细分成多个块,这将在后面详细说明。每个细分的块具有不同的大小并包括根据图1的编码法的编码数据。例如,一个细分块内的编码数据包含代码索引、预测阶数K、预测器系数和编码的残差值。如果在声道对之间使用联合编码法,则这两个声道的块分割是等同的,而且这些块以交织方式存储。比特流配置句法(表6)中的“js_stereo”字段指示联合立体声(声道差)是开启的还是关闭的,而frame_data句法(见下面的表7)中的“js_switch”字段指示是否选择联合立体声(声道差)。否则,每个声道的块分割是独立的。
下面将参照附图及其后的句法详细地说明前面提到的块切换、随机存取、预测和熵编码选项。
块切换
本发明的一个方面涉及在使用实际编码方案之前将每个声道细分成多个块。在下文中,根据本发明的块分割(或细分)方法将被称为“块切换方法”。
分级块切换
图4是根据本发明的分级块切换方法的概念图的示例图。例如,图4示出将一个声道按分级方式细分成32个块的方法。当在单个帧中提供多个声道时,每个声道被细分(或分割)成最多达32个块,并且每个声道的细分块配置成一个帧。
因此,根据本发明的块切换方法由图1所示的分割部件100执行。此外,如上所述,预测和熵编码在细分的块单元上执行。
一般而言,传统的音频无损编码(ALS)包括相对简单的块切换机制。每一个N个采样的声道或者使用一个全长块(NB=N)进行编码,或者使用四个长度为NB=N/4的块(例如1∶4切换)进行编码,其中同一块分割法适用于所有声道。在某些情形下,该方案会具有某些局限性。例如,尽管只有1∶1或1∶4切换是能用的,但其他切换法(例如1∶2、1∶8及其组合)在某些情形下却效率更高。
另外在传统ALS中,对所有声道以等同的方式执行切换,虽然不同声道或许会从不同的切换法受益(如果声道并不相关时则尤为如此)。
因此,根据本发明实施方式的块切换方法提供相对灵活的块切换方案,其中一个帧的每个声道可按分级方式被细分成多个块。例如,图4示出能以分级方式细分成最多达32个块的声道。在根据所给出的实施方式的声道内,NB=N、N/2、N/4、N/8、N/16和N/32的块的任意组合是可能的,只要每个块是通过对双倍长度的上级块进行细分产生的即可。例如,如图4中的例子所示,分割成N/4+N/4+N/2是可能的,而分割成N/4+N/2+N/4是不行的(例如在下面描述的在图5(e)和图5中示出的块切换示例)。换言之,声道被分成多个块从而使每个块的长度等于N/(mi)中的一个值,其中i=1,2,……p,N是声道的长度,m是大于或等于2的一个整数,而p表示在细分分级结构中的级数。
因此,在本发明的实施方式中,比特流包括指示块切换等级的信息以及指示块切换结果的信息。
这里,与块切换相关的信息被包含在解码过程中使用的句法中,这将在下面进行描述。
例如,作出设定以使块切换处理后生成的最小块大小为NB=N/32。
然而,这种设定仅仅是为简化本发明说明的一个示例。因此,根据本发明的设定不限于这一种设定。
更具体地,当最小块大小为NB=N/32时,这表示块切换处理已按分级方式进行了5次,故将其称为5级块切换。或者,当最小块大小为NB=N/16时,这表示块切换处理已按分级方式进行了4次,故将其称为4级块切换。类似地,当最小块大小为NB=N/8时,这表示块切换处理已按分级方式进行了3次,故将其称为3级块切换。而当最小块大小为NB=N/4时,这表示块切换处理已按分级方式进行了2次,故将其称为2级块切换。当最小块大小为NB=N/2时,这表示块切换处理已按分级方式进行了1次,故将其称为1级块切换。最后,当最小块大小为NB=N时,这表示未执行分级块切换处理,故将其称为0级块切换。
在本发明的实施方式中,指示块切换等级的信息被称为第一块切换信息。例如,第一块切换信息可由表6中所示的句法中一个2比特字段“block_switching”表示,这将在后面的过程中予以说明。更具体地,“block_switching=00”表示0级,“block_switching=01”表示1级至3级中的任何一个,“block_switching=10”表示4级,而“block_switching=11”表示5级。
另外,指示根据上述块切换等级对每个等级所执行的块切换结果的信息在这些实施方式中被称为第二块切换信息。
在本发明中,第二块切换信息可由″bs_info″字段表示,该字段在表7所示的句法内以8比特、16比特和32比特中的任何一个表示。更具体地,如果″block_switching=01″(表示1级至3级中的任何一级),则″bs_info″由8比特表示。如果″lock_switching=10″(表示4级),则″s_info″由16比特表示。换言之,最多达4级的块切换结果可用16比特指示。此外,如果″block_switching=11″(表示5级),则″bs_info″用32比特表示。换言之,最多达5级的块切换结果可用32比特指示。最后,如果″lock_switching=00″(表示未进行块切换),则不发送″bs_info″。这表示一个声道配置成一个块。
分配给第二块切换信息的总比特数是基于第一块切换信息的等级值确定的。这可能会导致最终比特率降低。在下面的表1中简要描述了第一块切换信息和第二块切换信息之间的关系。
表1:块切换等级
最大等级数 最大NB “bs_info”字节数
0(“block_switching=00”) N 0
1(“block_switching=01”) N/2 1(=8比特)
2(“block_switching=01”) N/4 1(=8比特)
3(“block_switching=01”) N/8 1(=8比特)
4(“block_switching=10”) N/16  2(=16比特)
5(“block_switching=11”) N/32  4(=32比特)
下面将详细描述配置(或映射)第二块切换信息(bs_info)内每个比特的方法的一个实施方式。
bs_info字段根据上述实施方式可包括最多达4个字节。关于1级至5级的比特映射可以是[(0)1223333 44444444 55555555 555555555]。可保留第一比特以指示是独立块切换还是同步块切换,这将在后面的独立/同步块切换一节中更为详细地描述。图5(a)-5(f)示出可发生3级块切换的一个声道的不同块切换示例。因此,在这些示例中,最小块长度为NB=N/8,且bs_info由一个字节构成。
从最大块长度NB=N开始,如果块被进一步细分,则bs_info的比特被置位。例如,在图5(a)中,根本不存在细分,因此“bs_info”为(0)000 0000。在图5(b)中,帧被细分((0)1...)而长度为N/2的第二块被进一步分((0)101...)成两个长度N/4的块;因此″bs_info″为(0)1010 0000。在图5(c)中,帧被细分((0)1...),且只有长度为N/2的第一块被进一步分((0)110...)成为两个长度为N/4的块;因此″bs_info″为(0)1100 0000。在图5(d)中,帧被细分((0)1...),长度为N/2的第一块和第二块被进一步分((0)111...)成长度为N/4的两个块,并且只有长度为N/4的第二块被进一步分((0)11101...)成长度为N/8的两个块;因此″bs_info″为(0)111 0100。
如上所述,图5(e)和5(f)中的示例表示不被允许的块切换的情形,这是因为图5(e)中的N/2块和图5(f)中的第一个N/4块不可能是通过细分前一级的块来获得的。
独立/同步块切换
图6(a)-6(c)是根据本发明实施方式的块切换的示例图。
更具体地,图6(a)示出未对声道1、2和3执行块切换的示例。图6(b)示出的是其中两个声道(声道1和2)配置成一个声道对、且在声道1和声道2中同步地执行块切换的示例。
在本例中还应用了交织处理。图6(c)示出的是其中两个声道(声道1和2)配置成一个声道对、且独立地对声道1和声道2执行块切换的示例。在本发明中,“声道对”指两个任意的音频声道。关于哪些声道组成声道对的决定可由编码器自动做出或由用户人工做出。(例如,L和S声道,Ls和Rs声道)。
在独立块切换中,尽管在所有声道中每个声道的长度可以是相同的,但可对每个声道个别地执行块切换。即,如图6(c)所示,各声道可以不同方式分成块。如果一个声道对的两个声道彼此相关并且使用差分编码,则该声道对的两个声道可被同步地进行块切换。
在同步块切换中,各声道以相同方式进行块切换(即分成块)。图6(b)示出这样的一个示例,并进一步示出这些块是可以被交织的。如果声道对的两个声道彼此不相关,则差分编码并无益处,因而不需要对声道同步地进行块切换。相反,独立地切换声道可能更合适。此外,根据本发明的另一实施方式,所描述的独立或同步块切换方法可应用于声道数大于或等于3的多声道组。例如,如果该多声道组的所有声道彼此相关,则可以同步切换多声道组的所有声道。另一方面,如果多声道组的所有声道彼此不相关,则可以独立地切换多声道组的每个声道。
此外,″bs_info″字段被用作指示块切换结果的信息。另外,″bs_info″字段还被用作指示对配置成声道对的每个声道是独立地执行了块切换还是同步地执行了块切换的信息。在这种情况下,如上所述,可使用“bs_info”字段中的特定比特(例如第一比特)。
例如,如果声道对的两个声道彼此独立,则″bs_info″字段的第一比特被置为1。另一方面,如果声道对的两个声道彼此同步,则″bs_info″字段的第一比特被置为0。
下面将详细描述图6(a)、6(b)和6(c)。
参照图6(a),由于没有一个声道执行了块切换,因此不生成有关的“bs_info”。
参照图6(b),声道1和2构成一个声道对,其中两个声道彼此同步且同步执行了块切换。例如,在图6(b)中,声道1和声道2两者都被分割成长度为N/4的块,两者都具有相同的bs_info“bs_info=(0)101 0000”。因此,可针对每个声道对发送一个bs_info,这导致比特率下降。
此外,如果声道对是同步的,则声道对中的每个块会被要求彼此交织。这种交织是有益的(或有利的)。例如,一个声道对内的一个声道的块(例如图6(b)中的块1.2)对两个声道的之前的块(例如图6(b)中的块1.1和2.1)都有依赖关系,因此这些之前的块应当在当前块之前就已可用。
参照图6(c),声道1和2配置成一个声道对。然而,在本例中,块切换是独立执行的。更具体地,声道1被分割成大小(或长度)达N/4的块,并且bs_info是“bs_info=(1)101 0000”。声道2被分割成大小达N/2的块,并且bs_info是″bs_info=(1)100 0000″。在图6(c)所示例子中,在每个声道间独立地进行块切换,因此并不执行块之间的交织处理。换言之,对于独立地进行了块切换的声道,声道数据可单独编排。
联合声道编码
联合声道编码——也被称为联合立体声——可利用立体声信号的两个声道之间或多声道信号的任何两个声道之间的相关性。尽管独立地处理两个声道x1(n)和x2(n)更为直接,但利用声道之间相关性的简单方法是对差分信号进行编码:
d(n)=x2(n)-x1(n)
而不是对x1(n)或x2(n)进行编码。可通过对个体信号加以比较,根据哪两个信号能被最高效率地编码,在每个块中的x1(n)、x2(n)和d(n)之间进行切换。这种用切换的差分编码实现的预测在两个声道彼此非常相似的情形中是有利的。在多声道素材的情形中,可由编码器重新编排声道以指派合适的声道对。
除了简单的差分编码,无损音频编解码器还支持更为复杂的利用多声道信号的任意声道之间的声道间冗余的方案。
随机存取
本发明涉及音频无损编码并能够支持随机存取。随机存取意味着对经编码的音频信号任意部分的快速存取而无需浪费地对之前的各部分进行解码。这对采用压缩数据的查找、编辑或流送的应用是一个重要特征。为了实现随机存取,在随机存取单元内,编码器需要插入一个能在无需解码之前各帧的情况下进行解码的帧。插入的帧被称为“随机存取帧”。在此类随机存取帧中,没有任何来自之前各帧的采样可供用于预测。
下面将详细描述根据本发明的用于实现随机存取的信息。参照配置句法(表6所示),与随机存取有关的信息作为配置信息发送。例如,“random_access”字段被用作指示是否允许随机存取的信息,它可用8比特表示。此外,如果允许随机存取,则该8比特“random_access”字段指定配置成一个随机存取单元的帧数。例如,当“random_access=0000 0000”时,不支持随机存取。换言之,当“random_access>0”时,则支持随机存取。更具体地,当“random_access=0000 0001”时,这指示配置成随机存取单元的帧数为1。这表示在所有的帧单元中均允许随机存取。此外,当“random access=1111 1111”,这指示配置成随机存取单元的帧数为255。因此,“random_access”信息对应于当前随机存取单元内的随机存取帧与下一随机存取单元中的随机存取帧之间的距离。在本发明中,所述距离用帧数表达。
一个32比特的“ra_unit_size”字段被包含在比特流中并且被发送。在本发明中,“ra_unit_size”字段指示以字节计的随机存取单元的大小,因此指示以字节计的从当前随机存取帧到下一随机存取帧的距离。因此,″ra_unit_size″字段或者包含在配置句法(表_6)中或者包含在帧数据句法(表7)中。配置句法(表6)还可包括指示“ra_unit_size”信息在比特流中的存储位置的信息。该信息被表示为2比特的“ra_flag”字段。更具体地,例如,当“ra_flag=00”时,这表示“ra_unit_size”信息未存储在比特流中。当“ra_flag=01”时,这表示“ra_unit_size”信息被存储在比特流内的帧数据句法(表7)中。
此外,当“ra_flag=10”时,“ra_unit_size”信息被存储在比特流的配置句法(表6)。如果“ra_unit_size”信息被包含在配置句法中,则这表示“ra_unit_size”信息只在比特流上发送一次并且被同等地应用于所有随机存取单元。或者,如果“ra_unit_size”信息包含帧数据句法中,则这表示当前随机存取单元内的随机存取帧和下一随机存取单元内的随机存取帧内之间的距离。因此,针对比特流中的每一个随机存取单元发送″ra_unit_size″信息。
因此,配置句法(表6)内的“random_access”字段也可被称为第一通用信息。另外,“ra_flag”字段也可被称为第二通用信息。在本发明的这个方面中,音频信号包括配置信息和多个随机存取单元,每个随机存取单元含有一个或多个音频数据帧,所述音频数据帧中的一个是随机存取帧,其中所述配置信息包括指示诸帧中的两相邻随机存取帧之间的距离的第一通用信息、以及指示每个随机存取单元的随机存取单元大小信息被存储在哪里的第二通用信息。随机存取单元大小信息指示以字节计两相邻随机存取帧之间的距离。
或者,在本发明的这个方面,一种解码音频信号的方法包括:接收具有配置信息和多个随机存取单元的音频信号,每个随机存取单元含有一个或多个音频数据帧,所述音频数据帧中的一个是随机存取帧;从配置信息读取第一通用信息,所述第一通用信息指示诸帧中两相邻随机存取帧之间的距离;以及从配置信息读取第二通用信息,所述第二通用信息指示每个随机存取单元的随机存取大小信息被存储在哪里,而随机存取单元大小信息指示以字节计两相邻随机存取帧之间的距离。然后解码器可存取随机存取单元到小信息,并使用该信息以及第一和第二通用信息来进行音频信号中的音频数据的随机存取。
声道配置
如图3所示,音频信号包括根据本发明的多声道信息。例如,每个声道可按与音频扬声器的位置一一对应的关系来映射。配置句法(下面的表6)包括声道配置信息,它被表示为16比特的“chan_config_info”字段和16比特的“channels”字段。“chan_config_info”字段包括将声道映射到扬声器位置的信息,而16比特的“channels”字段包括指示声道总数的信息。例如,当“channels”字段等于“0”时,这表示声道对应于单声道。当“channels”字段等于“1”时,这表示这个声道对应于立体声声道中的一个。另外,当“channels”字段等于或大于“2”时,这表示这个声道对应于多声道中的一个。
下面的表2示出配置成“chan_config_info”字段的每个比特以及与之对应的各个声道的示例。更具体地,当所发送的比特流中存在相应声道时,“chan_config_info”字段内的相应比特被置为“1”。或者,当所发送的比特流中不存在相应声道时,“chan_config_info”字段内的相应比特被置为“0”。本发明还包括指示配置句法(表6)内是否存在“chan_config_info”的信息。该信息被表示为1比特的“chan_config”标志。更具体地,“chan_config=0”指示“chan_config_info”字段不存在。而″chan_config=1指示″chan_config_info″字段存在。因此,当“chan_config=0”时,这表示“chan_config_info”字段不是在配置句法(表6)内新定义的。
表2:声道配置
扬声器位置 缩写 chan_config_info中的比特位置
L 1
R 2
左后 Lr 3
右后 Rr 4
左侧 Ls 5
右侧 Rs 6
中心 C 7
中后/环绕 S 8
低频效果 LFE 9
左声道缩减混音 Lo 10
右声道扩展混音 Ro 11
单声道缩减混音 M 12
(保留) 13-16
此外,声道配置可使得相关的声道在音频数据或音频信号的结构中不邻接。因此,重新安排声道数据有利于使相关声道邻接。重新安排声道的方式可在配置信息(表6)的chan_pos字段中指示。此外,配置信息(表6)可包括指示chan_pos字段的声道重新安排信息是否存在的chan_sort字段。基于读取以上讨论的各声道信息,解码器处理音频信号使得正确的声道被发送到正确的扬声器。
帧长度
如图3所示,根据本发明的音频信号包括多个声道或多声道。因此,当执行编码时,关于配置成一帧的多声道的数目的信息以及关于每个声道的采样数的信息被插入到比特流中并被发送。参照配置句法(表6),32比特的“samples”字段被用作指示配置成每个声道的音频数据采样总数的信息。
此外,16比特的“frame_length”(帧长度)字段被用作指示相应帧内每个声道的采样数的信息。
此外,“frame_length”字段的16比特值是由编码器所使用的值确定的,并且被称为用户定义值。换言之,用户定义值不是固定值,而是在编码过程中任意确定的值。例如,该值可由编码过程的使用者来设置。
因此,在解码过程中,当通过图2所示的多路分解部件200接收到比特流时,应当首先获取每个声道的帧数。
该值是根据下面所示的算法得到的。
frames=samples/frame_length;
  rest=samples%frame_length;
  if(rest)
  {
    frames++;
    frlen_last=rest;
   }
   else
      frlen_last=frame_length;
更具体地,每个声道的帧总数是通过将经由比特流发送的“samples”字段确定的每个声道的采样总数除以由“frame_length”字段确定的每个声道的一个帧内的采样数来计算得到的。
例如,当由“samples”字段确定的采样总数恰好是由“frame_length”字段确定的每个帧内的采样数的倍数时,则该倍数值成为帧总数。
然而,如果由“samples”字段确定的采样总数并非恰好是由“frame_length”字段确定的采样数的倍数,而是存在余数(或残数),则总帧数比倍数值增加“1”。此外,最末帧的采样数(frlen_last)被确定为该余数(或残数)。这表示仅最末帧的采样数与其之前的帧不同。
通过如上所述地在编码器和解码器之间定义一套标准化的规则,编码器就可自由地确定并发送每个声道的采样总数(“samples”字段)以及每个声道的一个帧内的采样数(“frame_length”字段)。此外,解码器可通过对所发送信息上使用上述算法而精确地确定要用于解码的每个声道的帧数。
线性预测
在本发明中,应用线性预测以实现无损音频编码。图1所示的预测器160包括至少一个或多个滤波器系数以从之前的采样值预测当前的采样值。
随后,第二熵编码部件180对与预测值和原始值之差相对应的残差值执行熵编码。
另外,应用于预测器160的每个块的预测器系数值是作为最优值从系数估算部件120选择的。此外,预测器系数值由第一熵编码部件140进行熵编码处理。由第一熵编码部件140和第二熵编码部件180编码的数据作为比特流的一部分由多路复用部件190插入且随后被发送。
下面将详细描述根据本发明的执行线性预测的方法。
用FIR滤波器进行的预测
线性预测在许多应用场合中被用于实现语音和音频信号处理。在下文中,基于有限冲激响应(FIR)滤波器描述预测器160的示例性操作。然而,本例明显不是对本发明范围的限制。
时间离散信号x(n)的当前采样可根据之前的采样x(n-k)大致地预测出。预测由以下方程式给出。
x ^ ( n ) = Σ k = 1 K h k * x ( n - k )
其中K是预测器的阶数。如果预测的采样接近于原始采样,则如下所示的残差:
e ( n ) = x ( n ) - x ^ ( n )
比x(n)本身的变化更小,因此能更高效率地编码e(n)。
从输入采样的片段估算预测器系数然后再对该片段进行滤波处理的程序被称为前向自适应。在这种情况下,应当发送这些系数。另一方面,如果是从之前已处理的片段或采样(例如从残差)估算系数,则称为后向自适应。后向适应程序的优点在于不需要发送系数,因为估算系数所需的数据对于解码器也是可用的。
10阶左右的前向自适应预测方法被广泛地用于语音编码,并且可同样适用于无损音频编码。大多数前向自适应无损预测方案的最大阶数仍然相当小,例如K=32。一个例外是超级音频CD专用的1比特无损编解码器,它使用高达128的预测阶数。
另一方面,具有几百个系数的后向自适应FIR滤波器通用于许多领域,例如声道均衡和回波抵消。这些系统大多数是基于LMS算法或其变型的,这些算法也被推荐用于无损音频编码。并非必须要将预测器系数作为辅助信息发送,因此它们的数目对数据速率不产生影响,这类具有高阶数的基于LMS的编码方案在实践中是可行的。然而,后向自适应的编解码器的缺点在于:必须在编码器和解码器两者中作出自适应,这使解码器明显比前向自适应情况下的解码器更为复杂。
前向自适应预测
作为本发明的示例性实施方式,前向自适应预测将作为一个示例在本文的描述中给出。在前向自适应线性预测中,一般使用自相关方法或协方差方法由系数估算部件120估算每个块的最优预测器系数hk(在残差方差最小化的意义上)。使用传统的Levinson-Durbin算法的自相关方法的额外优点是提供了一种迭代式自适应调整预测器阶数的简单方法。
此外,该算法本身也计算相应的部分自相关系数。
前向自适应预测的另一方面是确定合适的预测阶数。阶数增大使预测误差的方差减小,这导致残差的比特率Re变小。另一方面,预测器系数的比特率Rc随着要被发送的系数的数目而提高。因此,任务是找到使总比特率最小化的最优阶数。这可通过关于预测阶数K使下面的等式最小化来表达:
Rtotal(K)=Re(K)+Rc(K),
K是预测阶数。由于预测增益随阶数升高而单调上升,因此Rc随着K值而下降。另一方面,由于要发送的系数的数目增加,因此Rc随K值单调上升。
搜索最优阶数可由系数估算部件120高效率地执行,所述系数估算部件120用递归方式确定阶数递增的所有预测器。
对于每个阶数,计算完整的一组预测器系数。另外,可推导出相应残差的方差σe 2,从而得到残差的预期比特率的估算值。在每次迭代过程中——即针对每个预测阶数——在确定各系数的比特率的同时还可确定总比特率。
最优阶数在总比特率不再减小的点找到。
尽管从上述方程式可以清楚知道系数比特率对总比特率有直接的影响,但是,Rc缓慢的增长也使得Rtotal的最小值移至较高的阶数(其中Re同样较小),这可产生更好的压缩。因此,预测器系数的高效率但仍准确的量化在实现最大压缩中发挥着重要作用。
预测阶数
在本发明中,确定了预测阶数K,预测阶数K决定用于进行线性预测的预测器系数的数目。预测阶数K也是由系数估算部件120予以确定。在本发明中,关于所确定的预测阶数的信息被包含在比特流中并随后被发送。
配置句法(表6)包括与预测阶数K有关的信息。例如,1比特至10比特的“max_order”字段对应于指示最大阶数值的信息。1比特至10比特的“max_order”字段的最大值是K=1023(例如10比特)。作为与预测阶数K有关的另一信息,配置句法(表6)包括1比特的“adapt_order”字段,它指示每个块是否存在最优阶数。例如,当“adapt_order=1”时,应当给每个块提供最优阶数。在block_data句法(表8)中,最优阶数作为1比特至10比特的“opt_order”字段提供。此外,当“adapt_order=0”时,则不对每个块提供单独的最优阶数。在这种情况下,“max_order”字段即成为应用于所有块的最终阶数。
最优阶数(opt_order)是基于max_order字段值和相应块的大小(NB)确定的。更具体地,例如当max_order被确定为Kmax=10并且″adapt_order=1″时,则可考虑相应块的大小确定每个块的opt_order。在某些情况下,大于max_order(Kmax=10)的opt_order值是可能的。
特别地,本发明涉及较高的预测阶数。根据本发明的实施方式,在没有分级块切换的情形中,在长块长度和短块长度之间可能是4倍的关系(例如4096与1024或8192与2048)。另一方面,在采用了分级块切换的实施方式中,这个因数可以提高(例如高达32),以使范围更大(例如从16384下至512或甚至在高采样率下从32768至1024)。
在执行了分级块切换的实施方式中,为了更好地使用非常长的块,可采用更高的最大预测阶数。最大阶数可以是Kmax=1023。在这些实施方式中,Kmax可由块长度NB界定,例如Kmax<NB/8(例如当NB=2048时,Kmax=255)。因此,使用Kmax=1023需要至少NB=8192的块长度。在这些实施方式中,配置句法(表6)中的“max_order”字段可高达10比特而block_data句法(表8)中的“opt_order”字段同样可高达10比特。具体块中的实际比特数可取决于一个块所允许的最大阶数。如果块是短块,则本地预测阶数可小于全局预测阶数。
在本发明中,本地预测阶数是通过考虑相应块长度NB确定的,而全局预测阶数是通过配置句法中的“max_order”Kmax确定的。例如,如果Kmax=1023,但NB=2048,则由于本地预测阶数为255,因此“opt_order”字段被确定为8比特(而不是10比特)。
更具体地,可基于下面的方程式确定opt_order:
opt_order=min(全局预测阶数,本地预测阶数);
另外,全局和本地预测阶数可通过下面的方程式确定:
全局预测阶数=ceil(log2(最大预测阶数+1))
本地预测阶数=max(ceil(log2((Nb>>3)-1)),1)。
在这些实施方式中,预测了来自一个声道的细分块的数据采样。使用之前块的最末K个采样来预测当前块的第一采样。K值是基于从上述方程式推导出的opt_order确定的。
如果当前块是声道的第一个块,则不使用来自之前块的采样。在这种情形中,采用的是渐进阶数预测。例如,假设相应块的opt_order值为K=5,则该块中的第一采样不执行预测。块的第二采样使用该块的第一采样执行预测(如同K=1),该块的第三采样使用该块的第一采样和第二采样执行预测(如同K=2)等。因此,从第六采样开始以及对于这之后的采样,根据K=5的opt_order执行预测。如上所述,预测阶数从K=1渐进地增加至K=5。
当在随机存取帧中使用时,上述渐进阶数型预测是非常有利的。由于随机存取帧对应于随机存取单元的基准帧,因此随机存取帧不是通过使用之前的帧采样执行预测。即,这种渐进预测技术在随机存取帧的开头处就可应用。
预测器系数的量化
上述预测器系数在图1的量化部件130中量化。由于即便很小的量化误差也会导致大大偏离最优预测滤波器所需的频谱特性,因此预测系数hk的直接量化对发送而言不是非常高效率的。为此,预测器系数的量化是基于可由系数估算部件120计算得到的部分自相关(反射)系数rk。例如,如上所述,系数估算部件120是使用传统Levinson-Durbin算法处理的。
头两个部分自相关系数(相应地为γ1和γ2)通过使用下面的函数被量化:
Figure S2006800289829D00191
Figure S2006800289829D00201
而其余系数是使用简单的7比特的均匀量化器量化的:
Figure S2006800289829D00202
在所有情况下,所得量化值αk被约束在范围[-64,63]内。
熵编码
如图1所示,在本发明中应用了两种类型的熵编码。更具体地,第一熵编码部件140被用于编码上述预测器系数。另外,第二熵编码部件180被用来编码上述音频原始采样和音频残差采样。在下文中,将详细说明这两种类型的熵编码。
预测器系数的第一熵编码
相关技术的Rice代码被用作根据本发明的第一熵编码方法。例如,量化系数ak的发送是通过生成残差值执行的:
δk=ak-offsetk
这些残差值进而是通过使用第一熵编码部件140——例如用Rice代码方法来编码的。该过程中使用的Rice代码的相应偏移和参数可从以下表3、4和5所示的诸组中的一个以全局方式进行选择。表索引(即2比特的“coef_table”)在配置句法(表6)中指出。如果“coef_table=11”,则这表示未应用熵编码,并且量化的系数各自以7比特发送。在这种情形中,偏移始终是-64以获得被约束于[0,127]的无符号值δk=ak+64。相反,如果“coeff_table=00”,则选择下面的表3,而如果“coeff_table=01”,则选择下面的表4。
最后,如果“coeff_table=10”,则选择表5。当在图2的解码器中接收到这些经量化的系数时,第一熵解码部件220通过使用将残差值δk与偏移结合以生成部分自相关系数ak的量化索引的过程来重建预测器系数:
ak=δk+offsetk
其后,通过使用下面的方程式执行头两个系数(γ1和γ2)的重建:
Figure S2006800289829D00211
Figure S2006800289829D00212
其中2Q表示重构的系数的整数表示所需的恒量(Q=20)比例因数,而Γ(.)是根据经验确定的映射表(未示出,因为映射表会根据实现而变化)。
因此,是根据采样频率提供用于进行第一熵编码的这三种类型的系数表。例如,采样频率可被分成48kHz、96kHz和192kHz。这里,三个表3、4、5中的每一个分别提供给每种采样频率。
可对整个文件选择三个不同的表中的一个,而不是使用单个表。一般应当根据采样率来选择表。对于44.1kHz的素材,本发明的申请人推荐使用48kHz表。然而,一般而言,也可按其它准则来选择表。
表3:编码量化系数(48kHz)使用的Rice代码参数。
 系数# 偏移  Rice参数
 1 -52  4
 2 -29  5
 3 -31  4
 4 19  4
 5 -16  4
 6 12  3
 7 -7  3
 8 9  3
 9 -5  3
 10 6  3
 11 -4  3
 12 3  3
 13 -3  2
 14 3  2
 15 -2  2
 16 3  2
  17   -1   2
  18   2   2
  19   -1   2
  20   2   2
  2k-1,k>10   0   2
  2k,k>10   1   2
表4:编码量化系数(96kHz)使用的Rice代码参数
 系数# 偏移  Rice参数
 1 -58  3
 2 -42  4
 3 -46  4
 4 37  5
 5 -36  4
 6 29  4
 7 -29  4
8 25 4
 9 -23  4
 10 20  4
 11 -17  4
 12 16  4
 13 -12  4
 14 12  3
 15 -10  4
 16 7  3
 17 -4  4
 18 3  3
 19 -1  3
 20  1  3
 2k-1,k>10  0  2
 2k,k>10  1  2
表5:编码量化系数(192kHz)使用的Rice代码参数
 系数#  偏移  Rice参数
 1  -59  3
 2  -45  5
 3  -50  4
 4  38  4
 5  -39  4
 6  32  4
 7  -30  4
 8  25  3
 9  -23  3
 10  20  3
 11  -20  3
 12  16  3
 13  -13  3
 14  10  3
 15  -7  3
 16  3  3
 17  0  3
 18  -1  3
 19  2  3
 20  -1  2
 2k-1,k>10  0  2
 2k,k>10  1  2
残差的第二熵编码
本发明包含应用于图1的第二熵编码部件180的编码方法的两种不同的模式,这将在下面予以详细说明。
在简单模式中,使用Rice代码对残差值e(n)进行熵编码。对于每个块,或者可使用同一Rice代码编码所有的值,或者可将块进一步分成四个部分,每个部分用一不同的Rice代码编码。如图1所示,发送所应用的代码的索引。由于存在不同的方法确定给定的一组数据的最优Rice代码,因此由编码器根据残差的统计结果选择合适的代码,并且以下示出的代码字的生成仅仅是几种可能的Rice编码实现中的一种。
Rice代码有参数s≥0定义。对于给定的s值,每个代码字由p比特前缀和s比特子代码组成。前缀是利用p-1个“1”比特和一个“0”比特作为信号传输的,且p取决于经编码的值。对于信号值x和s>0,可如下计算p-1(“÷”在以下的方程式中表示没有余数的整数除法):
Figure S2006800289829D00241
使用修正的计算式:
Figure S2006800289829D00242
对于s>0,如下计算子代码:
并且用于第i子块。对于s=0,没有子代码,而仅有前缀,因此前缀和代码字是相同的。
下面表A和表B示出在s=4时Rice代码的示例。表C示出在s=0时特殊的Rice代码。
表A-s=4时的Rice代码。xxxx比特包含4比特子代码s[i]。
 P  前缀  代码字
-8...+7  1  0  0xxxx
-16...-9;+8...+15  2  10  10xxxx
-24...-17;+16...+23  3  110  110xxxx
-32...-25;+24...+31  4  1110  1110xxxx
-40...-33;+32...+39  5  11110  11110xxxx
表B-s=4时对于前三个前缀的Rice代码的子代码。
值(p=1) 值(p=2) 值(p=3) 子代码(xxxx)
 -8  -16  -24  0111
 -7  -15  -23  0110
 -6  -14  -22  0101
 -5  -13  -21  0100
 -4  -12  -20  0011
 -3  -11  -19  0010
 -2  -10  -18  0001
 -1  -9  -17  0000
 0  8  16  1000
 1  9  17  1001
 2  10  18  1010
 3  11  19  1011
 4  12  20  1100
 5  13  21  1101
 6  14  22  1110
 7  15  23  1111
表C-s=0时的“特殊的”Rice代码。前缀和代码字是相同的。
 P  前缀  代码字
0  1  0  0
-1  2  10  10
+1  3  110  110
-2  4 1110  1110
+2  5  11110  11110
或者,编码器可利用BGMC模式使用更为复杂和高效率的编码方案。在BGMC模式中,残差的编码是通过将分布划分成两个类别实现的。这两种类型包括属于分布的中心区域|e(n)|<emax的残差,以及属于其尾部的残差。尾部的残差仅仅是被重新居中(re-centered)  (即对于e(n)>emax,提供et(n)=e(n)-emax)并使用如上所述的Rice代码编码。然而,为了编码处于分布中心的残差,BGMC首先将残差分成LSB和MSB分量,随后BGMC使用块Gilbert_Moore(算术)代码编码MSB。最后,BGMC使用直接固定长度代码发送LSB。可以对参数emax和直接发送的LSB的数目加以选择,使它们仅些微地影响这种方案的编码效率,同时使编码的复杂度明显降低。<0}
根据本发明的配置句法(表6)和block_data句法(表8)包括与Rice代码和BGMC代码的编码有关的信息。
现在对这种信息进行详细说明。
配置句法(表6)首先包括一个1比特的″bgmc_mode″字段。例如,“bgmc_mode=0”表示Rice代码,“bgmc_mode=1”表示BGMC代码。配置句法(表6)还包括一个1比特的“sb_part”字段。″sb_part″字段对应于与将块分割成子块并对经分割的子块进行编码的方法有关的信息。这里,“sb_part”的意义根据“bgmc_mode”字段的值而改变。
例如,当“bgmc_mode=0”时,即当应用Rice代码时,“sb_part=0”表示该块并不被分割成子块。而,″sb_part=1″表示以1∶4子块分割比分割该块。或者,“sb part=1”表示以1∶4子块分割比分割块。或者,当″bgmc_mode=1″时,即当采用BGMC代码时,″sb_part=0″表示以1∶4子块分割比分割该块。或者,″sb_part=1″表示以1∶2∶4∶8子块分割比分割该块。
与包含在配置句法(表6)中的信息相对应的每个块的block_data句法(表8)包括0比特至2比特的可变“ec_sub”字段。更具体地,″ec_sub″字段指示存在于实际相应块中的子块的数目。这里,“ec_sub”字段的意义根据配置句法(表6)内的“bgmc_mode”字段+“sb_part”字段的值而变化。
例如,“bgmc_mode+sb_part=0”表示Rice代码并不配置该子块。这里,“ec_sub”字段是个0比特字段,这表示不包含任何信息。
除此之外,“bgmc_mode+sb_part=1”表示使用了Rice代码或BGMC代码来以1∶4的比率将该块分割成若干子块。这里,只有1比特被指派给“ec_sub”字段。例如,“ec_sub=0”指示一个子块(即该块没有分割成多个子块),而“ec_sub=1”指示配置了4个子块。
此外,“bgmc_mode+sb_part=2”表示使用了BGMC代码来以1∶2∶4∶8的比率将该块分割成若干子块。这里,2比特被指派给“ec_sub”字段。例如,“ec_sub=00”指示一个子块(即该块没有分割成多个子块),而“ec_sub=01”指示2个子块。另外,“ec_sub=10”指示4个子块,而“ec_sub=11”指示8个子块。
如上所述定义在每个块内的子块使用差分编码方法由第二熵编码部件180进行编码。下面描述使用Rice代码的一个示例。对于残差值的每个块,或者可使用同一Rice代码编码所有值,或者如果在配置句法中“sb_part”字段被置位,则该块可被分割成四个子块,每个经编码的子块具有一不同的Rice代码。在后一种情况下,块数据句法(表8)中的“ec_sub”字段指示是使用一个块还是四个块。
尽管第一子块的参数s[i=0]或者用4比特(分辨率≤16比特)或者用5比特(分辨率>16比特)直接发送,但仅发送下列参数s[i>0]的差(s[i]-s[i-1])。
这些差还使用适当选择的Rice代码再行编码。在这种情况下,差使用的Rice代码参数具有值“0”。或者,所选择的熵代码可以是具有代码参数值为2的BMGC代码。
将会明白,解码器读取bgmc_mode、sb_part和ec_sub信息以处理并解码所接收的音频信号。例如,接收包括被分割成N个子块的一块音频数据的音频信号,并读取该信息。使用该信息,分别生成多个代码参数s(0)、s(1)、...、S(N-1)。即,代码参数的生成包括从音频信号中检测S(0),从音频信号中检测差s(i)-s(i-1)(i=1、...N-1),并利用s(0)和所检测的差计算s(i)(i=1、...N-1)。然后可利用由所生成的代码参数定义的熵代码来解码N个子块。
句法
根据本发明的实施方式,包含在音频比特流中的各种信息的句法示出于下表中。表6示出音频无损编码的配置句法。这种配置句法可形成周期性地置于比特流中的头部,可形成每个帧的帧头等。表7示出一种帧-数据句法,而表8示出一种块-数据句法。
表6:配置句法
句法   比特
ALSSpecificConfig(){samp_freq;samples;channels;file_type;resolution;floating;msb_first;frame_length;random_access;ra_flag;adapt_order;coef_able;long_term_prediction;max_order;block_switching;bgmc_mode;sb_part; 3232163311168212110211
  joint_stereo;mc_coding;chan_config;chan_sort;crc_enabled;RLSLMS(reserved)if(chan_config){chan_confi_info;}if(chan_sort){for(c=0;c<channels;c++)chan_pos[c];}header_size;trailer_size;orig_header[];orig_trailer[];if(crc_enabled){crc;}if((ra_flag==2)&&(random_access>0)){for(f=0;f<(samples-1/frame_lenth)+1;f++)    {ra_unit_size}   11111161681616header_size*8trailer_size*83232
    }}
表7:Frame_data(帧_数据)句法
句法  比特
frame_data(){if((ra_flag==1)&&(frame_id%random_access==0)){ra_unit_size}if(mc_coding&&joint_stereo){js_switch;byte_align;}if(!mc_coding‖js_switch){for(c=0;c<channels;C++){if(block_switching){bs_info;}if(independent_bs){for(b=0;b<blocks;b++){block_data(c);}}else{for(b=0;b<blocks;b++){block_data(c); 3218,16,32
       block_data(c+1);}C++;}}else{if(block_switching){bs_info;}for(b=0;b<blocks;b++){for(c=0;c<channels;C++){block_data(c);channel_data(c);}}}if(floating){num_bytes_diff_float;diff_float_data();}} 8,16,3232
表8:Block_Data(块-数据)句法
句法 比特
block_data(){block_type;if(block_type==0){ 1
    const_block;js_block;(reserved)if(const_block==1){{if(resolution==8){const_val;}else if(resolution==16){const_val;}else if(resolution==24){eonst_val;}else{const_val;}}}else{js_block;if((bgmc_mode==o)&&(sb_part==0){sub_blocks=1;}else if((bgm_mode==1)&&(sb_part==1){ec_sub;sub_blocks=1<<ec_sub;}   115816243212
    else{ec_sub;sub_blocks=(ec_sub==1)?4∶1;}if(bgm_mode==0){for(k=0;k<sub_blocks;k++){s[k];}}else{for(k=0;k<sub_blocks;k++){s[k],sx[k];}}sub_length=block_length/sub_blocks;shift_lsbs;if(shift_lsbs==1){shift pos;}if(!RLSLMS){if(adapt_order==1){opt_order;}for(p=0;p<opt_order;p++)quant_cof[p];}} 1变化变化141...10变化
压缩结果
下面,将无损音频编解码器与用于无损音频压缩的最流行的程序进行比较:开放源编解码器FLAC和Monkey氏音频(MAC3.97)。这里,开放式源代码编解码器FLAC使用前向自适应预测,而Monkey氏音频(MAC3.97)是作为压缩方面的当前技术发展水平的算法使用的后向自适应编解码器。这两种编解码器均在有提供最大压缩的选项(即flac-8和mac-c4000)的情况下运行。编码器的结果是针对中等压缩等级(其预测阶数限制于K_60)以及最大压缩等级(K_1023)来确定的,两者均具有500ms的随机存取。测试是在有1024MB内存的1.7GHz奔腾-M系统上进行的。测试包括采样率为48、96和192kHz、分辨率为16和24比特的将近1GB的立体声波形数据。
压缩率
下面,压缩率被定义为:
C = CompressedFileSize OriginalFileSize * 100 %
其中越小的值指示越好的压缩。所检查的音频格式的结果示于表9(FLAC编解码器不支持192kHz的素材)。
表9:不同音频格式(kHz/比特)的平均压缩率比较
格式  FLAC  MAC  ALS中值  ALS最大值
48/16  48.6  45.3  45.5  44.7
48/24  68.4  63.2  63.3  62.7
96/24  56.7  48.1  46.5  46.2
192/24  -  39.1  37.7  37.6
合计  -  48.9  48.3  47.8
这些结果显示,最高等级的ALS在所有格式上性能都胜过FLAC和Monkey氏音频,但对于高清晰度素材(即,96kHz/24比特及以上)尤甚。
即使在中间等级,ALS也提供最好的总压缩性。
复杂度
不同编解码器的复杂度强烈地取决于实际实现,尤其是编码器的实现。如上所述,本发明的音频信号编码器仍在发展之中。因此,我们将我们的分析限于解码器——简单的C语言代码实现而不作进一步的优化。压缩的数据由当前最佳的编码器实现生成。图10中示出了对在不同复杂度等级上编码的各种音频格式进行实时解码所用的平均CPU负荷。即使是对于最大复杂度,解码器的CPU负荷也只在20-25%左右,这进而表示基于文件的解码比实时解码快至少4-5倍。
表10:根据音频格式(kHz/比特)和ALS编码器复杂度的平均CPU负荷(在1.7GHz奔腾-M上的百分比)
格式  ALS低  ALS中  ALS最大
48/16  1.6  4.9  18.7
48/24  1.8  5.8  19.6
96/24  3.6  12.0  23.8
192/24  6.7  22.8  26.7
编解码器被设计成可提供大范围的复杂度等级。尽管最大等级以最慢编码和解码速度为代价实现最高压缩,但较快的中间等级仅些微地降低压缩性,解码的复杂度却显著地低于最大等级(即对于48kHz速材将近5%的CPU负荷)。使用低复杂度等级(即K_15,Rice编码)相比中间等级仅使压缩性降低1-1.5%,但解码器复杂度进一步降低3倍(即对于48kHz的素材而言低于2%的CPU负荷)。因而,音频数据甚至可以在计算能力很低的硬件上完成解码。
尽管编码器复杂度既会因较高的最大阶数也会因更复杂的块切换算法而增加(根据实施方式)而增大,但解码器会受到较高平均预测阶数的影响。
前面的实施方式(例如分级块切换)和优点仅为示例性的,不应被解释为是对所附权利要求书的限制。本领域技术人员会明白,上述原理可应用于其它装置和方法。许多选择、修改和变化对本领域内技术人员而言是显而易见的。
工业应用性
本领域内技术人员可以理解,可对本发明作出各种修改和变化而不脱离本发明的精神或范围。例如,本发明的诸方面和实施方式很容易在如有损音频信号编解码器等的另一种音频信号编解码器中采用。因此,本发明旨在涵盖本发明的所有这些修改和变化。

Claims (11)

1.一种编码音频信号的方法,所述方法包括:
将一个音频数据块分割成N个子块;
确定多个代码参数s(0)、s(1)、...s(N-1);
利用由所述多个代码参数定义的多个熵代码对所述N个子块进行熵编码;以及
发送所述代码参数,所述发送步骤包括:
直接发送表示所述第一子块的代码参数的s(0);以及
发送差s(i)-s(i-1),i=1,....N-1,s(i)表示所述第一子块后的第i子块的代码参数。
2.如权利要求1所述的方法,其特征在于,所述发送步骤还包括:
在发送前利用所选择的熵代码对所述差s(i)-s(i-1)进行编码。
3.如权利要求2所述的方法,其特征在于,所述选择的熵代码是由具有值为0的代码参数定义的Rice代码。
4.如权利要2所述的方法,其特征在于,所述选择的熵代码是由具有值为2的代码参数定义的Block Gilbert Moore代码(BGMC)。
5.如权利要求1所述的方法,其特征在于,所述熵代码是Rice代码,而所述代码参数是Rice代码参数。
6.如权利要求1所述的方法,其特征在于,所述熵代码是BGMC代码,而所述代码参数是BGMC代码参数。
7.一种解码音频信号的方法,所述方法包括:
接收包括被分割成N个子块的一个音频数据块的所述音频信号;
分别生成多个代码参数s(0)、s(1)、...、s(N-1),所述生成步骤包括:
从所述音频信号中检测s(0),所述s(0)表示所述第一子块的代码参数;
从所述音频信号中检测差s(i)-s(i-1),i=1,....N-1,s(i)表示所述第一子块后的每一子块的代码参数;以及
利用所述s(0)和所检测的差计算s(i),i=1,....N-1;以及
利用分别由所生成的代码参数定义的多个熵代码对所述N个子块进行解码。
8.如权利要求7所述的方法,其特征在于,所述熵代码是Rice代码,而所述代码参数是Rice代码参数。
9.如权利要求7所述的方法,其特征在于,所述熵代码是BGMC代码,而所述代码参数是BGMC代码参数。
10.一种用于处理音频信号的装置,包括:
编码器,所述编码器被配置成将一个音频数据块分割成N个子块,确定多个代码参数s(0)、s(1)、...s(N-1),利用由所述多个代码参数定义的多个熵代码对所述N个子块进行熵编码,以及发送所述代码参数;以及
所述编码器被配置成通过直接发送表示所述第一子块的代码参数的s(0),并发送差s(i)-s(i-1)来发送所述代码参数,其中i=1,....N-1,所述s(i)表示所述第一子块后的第i子块的代码参数。
11.一种用于处理音频信号的装置,包括:
解码器,所述解码器被配置成接收包括被分割成N个子块的一个音频数据块的所述音频信号,并分别生成多个代码参数s(0)、s(1)、...、s(N-1);
所述解码器被配置成通过从所述音频信号中检测s(0),从所述音频信号中检测差s(i)-s(i-1),i=1,....N-1,并利用所述s(0)和所述检测的差计算s(i),i=1,....N-1,所述s(0)表示所述第一子块的代码参数,而所述s(i)表示所述第一子块后的每一子块的代码参数;以及
所述解码器被配置成利用分别由所述生成的代码参数定义的多个熵代码解码所述N个子块。
CNA2006800289829A 2005-07-11 2006-07-10 处理音频信号的装置和方法 Pending CN101238510A (zh)

Applications Claiming Priority (17)

Application Number Priority Date Filing Date Title
US69755105P 2005-07-11 2005-07-11
US60/697,551 2005-07-11
KRPCT/KR2005/002290 2005-07-16
PCT/KR2005/002292 WO2007011080A1 (en) 2005-07-16 2005-07-16 Apparatus and method of encoding and decoding audio signal
PCT/KR2005/002290 WO2007011078A1 (en) 2005-07-16 2005-07-16 Apparatus and method of encoding and decoding audio signal
PCT/KR2005/002291 WO2007011079A1 (en) 2005-07-16 2005-07-16 Apparatus and method of encoding and decoding audio signal
KRPCT/KR2005/002291 2005-07-16
KRPCT/KR2005/002292 2005-07-16
KRPCT/KR2005/002308 2005-07-18
PCT/KR2005/002306 WO2007011083A1 (en) 2005-07-18 2005-07-18 Apparatus and method of encoding and decoding audio signal
KRPCT/KR2005/002307 2005-07-18
KRPCT/KR2005/002306 2005-07-18
PCT/KR2005/002308 WO2007011085A1 (en) 2005-07-18 2005-07-18 Apparatus and method of encoding and decoding audio signal
PCT/KR2005/002307 WO2007011084A1 (en) 2005-07-18 2005-07-18 Apparatus and method of encoding and decoding audio signal
US70057005P 2005-07-19 2005-07-19
US60/700,570 2005-07-19
PCT/KR2006/002690 WO2007008012A2 (en) 2005-07-11 2006-07-10 Apparatus and method of processing an audio signal

Publications (1)

Publication Number Publication Date
CN101238510A true CN101238510A (zh) 2008-08-06

Family

ID=37637332

Family Applications (14)

Application Number Title Priority Date Filing Date
CN2006800252699A Expired - Fee Related CN101218630B (zh) 2005-07-11 2006-07-10 处理音频信号的装置和方法
CNA2006800289829A Pending CN101238510A (zh) 2005-07-11 2006-07-10 处理音频信号的装置和方法
CNA2006800305111A Pending CN101243494A (zh) 2005-07-11 2006-07-10 编码和解码音频信号的装置和方法
CN2006800251380A Expired - Fee Related CN101218628B (zh) 2005-07-11 2006-07-10 编码和解码音频信号的装置和方法
CNA200680024866XA Pending CN101218852A (zh) 2005-07-11 2006-07-10 处理音频信号的装置和方法
CNA2006800251376A Pending CN101218631A (zh) 2005-07-11 2006-07-10 处理音频信号的装置和方法
CN2006800294070A Expired - Fee Related CN101243496B (zh) 2005-07-11 2006-07-10 处理音频信号的装置和方法
CNA2006800251395A Pending CN101218629A (zh) 2005-07-11 2006-07-10 处理音频信号的装置和方法
CNA2006800305499A Pending CN101243495A (zh) 2005-07-11 2006-07-10 编码和解码音频信号的装置和方法
CNA2006800294174A Pending CN101243489A (zh) 2005-07-11 2006-07-10 编码和解码音频信号的装置和方法
CNA200680028892XA Pending CN101238509A (zh) 2005-07-11 2006-07-10 处理音频信号的装置和方法
CNA2006800305412A Pending CN101243497A (zh) 2005-07-11 2006-07-10 编码和解码音频信号的装置和方法
CNA2006800304797A Pending CN101243493A (zh) 2005-07-11 2006-07-10 编码和解码音频信号的装置和方法
CNA2006800304693A Pending CN101243492A (zh) 2005-07-11 2006-07-10 编码和解码音频信号的装置和方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN2006800252699A Expired - Fee Related CN101218630B (zh) 2005-07-11 2006-07-10 处理音频信号的装置和方法

Family Applications After (12)

Application Number Title Priority Date Filing Date
CNA2006800305111A Pending CN101243494A (zh) 2005-07-11 2006-07-10 编码和解码音频信号的装置和方法
CN2006800251380A Expired - Fee Related CN101218628B (zh) 2005-07-11 2006-07-10 编码和解码音频信号的装置和方法
CNA200680024866XA Pending CN101218852A (zh) 2005-07-11 2006-07-10 处理音频信号的装置和方法
CNA2006800251376A Pending CN101218631A (zh) 2005-07-11 2006-07-10 处理音频信号的装置和方法
CN2006800294070A Expired - Fee Related CN101243496B (zh) 2005-07-11 2006-07-10 处理音频信号的装置和方法
CNA2006800251395A Pending CN101218629A (zh) 2005-07-11 2006-07-10 处理音频信号的装置和方法
CNA2006800305499A Pending CN101243495A (zh) 2005-07-11 2006-07-10 编码和解码音频信号的装置和方法
CNA2006800294174A Pending CN101243489A (zh) 2005-07-11 2006-07-10 编码和解码音频信号的装置和方法
CNA200680028892XA Pending CN101238509A (zh) 2005-07-11 2006-07-10 处理音频信号的装置和方法
CNA2006800305412A Pending CN101243497A (zh) 2005-07-11 2006-07-10 编码和解码音频信号的装置和方法
CNA2006800304797A Pending CN101243493A (zh) 2005-07-11 2006-07-10 编码和解码音频信号的装置和方法
CNA2006800304693A Pending CN101243492A (zh) 2005-07-11 2006-07-10 编码和解码音频信号的装置和方法

Country Status (5)

Country Link
US (36) US7966190B2 (zh)
EP (14) EP1913583A4 (zh)
JP (14) JP2009500693A (zh)
CN (14) CN101218630B (zh)
WO (14) WO2007008013A2 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104769671B (zh) * 2013-07-22 2017-09-26 弗劳恩霍夫应用研究促进协会 用于使用时域噪声/修补整形对编码音频信号进行编码和解码的设备及方法
CN111341330A (zh) * 2020-02-10 2020-06-26 科大讯飞股份有限公司 音频编解码方法、存取方法及其相关设备及存储装置
US12112765B2 (en) 2015-03-09 2024-10-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal

Families Citing this family (75)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7182738B2 (en) 2003-04-23 2007-02-27 Marctec, Llc Patient monitoring apparatus and method for orthosis and other devices
JP2007526687A (ja) * 2004-02-19 2007-09-13 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 可変ブロック長信号の復号化スキーム
US7930184B2 (en) * 2004-08-04 2011-04-19 Dts, Inc. Multi-channel audio coding/decoding of random access points and transients
JP4850827B2 (ja) * 2005-04-28 2012-01-11 パナソニック株式会社 音声符号化装置および音声符号化方法
JP4948401B2 (ja) * 2005-05-31 2012-06-06 パナソニック株式会社 スケーラブル符号化装置およびスケーラブル符号化方法
US7966190B2 (en) * 2005-07-11 2011-06-21 Lg Electronics Inc. Apparatus and method for processing an audio signal using linear prediction
KR100891688B1 (ko) * 2005-10-26 2009-04-03 엘지전자 주식회사 멀티채널 오디오 신호의 부호화 및 복호화 방법과 그 장치
JP4193865B2 (ja) * 2006-04-27 2008-12-10 ソニー株式会社 デジタル信号切換え装置及びその切換え方法
JP4769665B2 (ja) * 2006-08-29 2011-09-07 パナソニック株式会社 音楽再生装置および音楽再生端末
US9053753B2 (en) * 2006-11-09 2015-06-09 Broadcom Corporation Method and system for a flexible multiplexer and mixer
US20080114478A1 (en) * 2006-11-09 2008-05-15 David Wu Method and System for Multi-Channel PCM Audio Grouping in Hardware
US8521540B2 (en) * 2007-08-17 2013-08-27 Qualcomm Incorporated Encoding and/or decoding digital signals using a permutation value
KR101385956B1 (ko) * 2007-08-31 2014-04-17 삼성전자주식회사 미디어 신호 인코딩/디코딩 방법 및 장치
JP2011507013A (ja) * 2007-12-06 2011-03-03 エルジー エレクトロニクス インコーポレイティド オーディオ信号処理方法及び装置
US8972247B2 (en) * 2007-12-26 2015-03-03 Marvell World Trade Ltd. Selection of speech encoding scheme in wireless communication terminals
KR101230479B1 (ko) * 2008-03-10 2013-02-06 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 트랜지언트 이벤트를 갖는 오디오 신호를 조작하기 위한 장치 및 방법
US20090268678A1 (en) * 2008-04-24 2009-10-29 Fujitsu Limited Method and apparatus for automatic gain control in a mobile orthogonal frequency division multiple access (ofdma) network
MY160260A (en) 2008-07-11 2017-02-28 Fraunhofer Ges Forschung Audio encoder and audio decoder
EP2144231A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme with common preprocessing
JP5253518B2 (ja) * 2008-12-22 2013-07-31 日本電信電話株式会社 符号化方法、復号方法、それらの装置、プログラム及び記録媒体
US8576910B2 (en) * 2009-01-23 2013-11-05 Nippon Telegraph And Telephone Corporation Parameter selection method, parameter selection apparatus, program, and recording medium
KR101622950B1 (ko) * 2009-01-28 2016-05-23 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 그 장치
AR075199A1 (es) 2009-01-28 2011-03-16 Fraunhofer Ges Forschung Codificador de audio decodificador de audio informacion de audio codificada metodos para la codificacion y decodificacion de una senal de audio y programa de computadora
CN101609680B (zh) * 2009-06-01 2012-01-04 华为技术有限公司 压缩编码和解码的方法、编码器和解码器以及编码装置
US8918325B2 (en) * 2009-06-01 2014-12-23 Mitsubishi Electric Corporation Signal processing device for processing stereo signals
US8700410B2 (en) * 2009-06-18 2014-04-15 Texas Instruments Incorporated Method and system for lossless value-location encoding
TWI413110B (zh) * 2009-10-06 2013-10-21 Dolby Int Ab 以選擇性通道解碼的有效多通道信號處理
US8207875B2 (en) 2009-10-28 2012-06-26 Motorola Mobility, Inc. Encoder that optimizes bit allocation for information sub-parts
EP2573766B1 (en) * 2010-07-05 2015-03-18 Nippon Telegraph And Telephone Corporation Encoding method, decoding method, encoding device, decoding device, program, and recording medium
CN102959872A (zh) * 2010-07-05 2013-03-06 日本电信电话株式会社 编码方法、解码方法、装置、程序及记录介质
BR122021003884B1 (pt) 2010-08-12 2021-11-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. Reamostrar sinais de saída de codecs de áudio com base em qmf
AU2011311659B2 (en) * 2010-10-06 2015-07-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing an audio signal and for providing a higher temporal granularity for a combined unified speech and audio codec (USAC)
US8842842B2 (en) * 2011-02-01 2014-09-23 Apple Inc. Detection of audio channel configuration
KR101742136B1 (ko) * 2011-03-18 2017-05-31 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 콘텐츠를 표현하는 비트스트림의 프레임들 내의 프레임 요소 배치
CN102761735B (zh) * 2011-04-25 2014-12-24 中国科学院微电子研究所 编码方法及装置、图像压缩方法及系统
CN102810314B (zh) * 2011-06-02 2014-05-07 华为终端有限公司 音频编码方法及装置、音频解码方法及装置、编解码系统
CN102368385B (zh) * 2011-09-07 2013-08-14 中科开元信息技术(北京)有限公司 后向块自适应Golomb-Rice编解码方法及装置
EP2856776B1 (en) * 2012-05-29 2019-03-27 Nokia Technologies Oy Stereo audio signal encoder
EP2875510A4 (en) * 2012-07-19 2016-04-13 Nokia Technologies Oy STEREO AUDIO SIGNAL ENCODER
US10346784B1 (en) 2012-07-27 2019-07-09 Google Llc Near-term delivery system performance simulation
KR102049602B1 (ko) * 2012-11-20 2019-11-27 한국전자통신연구원 멀티미디어 데이터 생성 장치 및 방법, 멀티미디어 데이터 재생 장치 및 방법
US10178489B2 (en) * 2013-02-08 2019-01-08 Qualcomm Incorporated Signaling audio rendering information in a bitstream
WO2014195190A1 (en) * 2013-06-05 2014-12-11 Thomson Licensing Method for encoding audio signals, apparatus for encoding audio signals, method for decoding audio signals and apparatus for decoding audio signals
EP2830058A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Frequency-domain audio coding supporting transform length switching
EP2830335A3 (en) 2013-07-22 2015-02-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method, and computer program for mapping first and second input channels to at least one output channel
EP2838086A1 (en) 2013-07-22 2015-02-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. In an reduction of comb filter artifacts in multi-channel downmix with adaptive phase alignment
US10075266B2 (en) * 2013-10-09 2018-09-11 Qualcomm Incorporated Data transmission scheme with unequal code block sizes
EP2866227A1 (en) 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
KR101832368B1 (ko) * 2014-01-24 2018-02-26 니폰 덴신 덴와 가부시끼가이샤 선형 예측 분석 장치, 방법, 프로그램 및 기록 매체
EP3098812B1 (en) * 2014-01-24 2018-10-10 Nippon Telegraph and Telephone Corporation Linear predictive analysis apparatus, method, program and recording medium
CN106409300B (zh) * 2014-03-19 2019-12-24 华为技术有限公司 用于信号处理的方法和装置
WO2015200498A1 (en) * 2014-06-24 2015-12-30 Hotel Trader LLC Reservation exchange server system
KR101821533B1 (ko) * 2014-08-07 2018-03-08 원 미디어, 엘엘씨 유연한 직교 주파수 분할 멀티플렉싱 물리 전송 데이터 프레임의 동적 구성 방법
EP3178187A1 (en) 2014-08-07 2017-06-14 Coherent Logix, Incorporated Multi-partition radio frames
CN105632503B (zh) * 2014-10-28 2019-09-03 南宁富桂精密工业有限公司 信息隐藏方法及系统
CN104392725A (zh) * 2014-12-02 2015-03-04 中科开元信息技术(北京)有限公司 多声道无损音频混合编解码方法及装置
CN106033671B (zh) 2015-03-09 2020-11-06 华为技术有限公司 确定声道间时间差参数的方法和装置
US10500739B2 (en) * 2015-11-13 2019-12-10 Ethicon Llc Robotic surgical system
CN106131550B (zh) * 2016-07-25 2020-02-14 合一网络技术(北京)有限公司 播放多媒体文件的方法及装置
CN107221334B (zh) * 2016-11-01 2020-12-29 武汉大学深圳研究院 一种音频带宽扩展的方法及扩展装置
EP3324406A1 (en) 2016-11-17 2018-05-23 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for decomposing an audio signal using a variable threshold
EP3324407A1 (en) * 2016-11-17 2018-05-23 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for decomposing an audio signal using a ratio as a separation characteristic
EP3382700A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using a transient location detection
CN114898761A (zh) 2017-08-10 2022-08-12 华为技术有限公司 立体声信号编解码方法及装置
CN109389984B (zh) * 2017-08-10 2021-09-14 华为技术有限公司 时域立体声编解码方法和相关产品
CN109859766B (zh) * 2017-11-30 2021-08-20 华为技术有限公司 音频编解码方法和相关产品
CN112400280A (zh) * 2018-06-25 2021-02-23 索尼半导体解决方案公司 信息处理装置、信息处理系统、程序和信息处理方法
CN112352277B (zh) * 2018-07-03 2024-05-31 松下电器(美国)知识产权公司 编码装置及编码方法
PH12019000380A1 (en) * 2018-12-17 2020-09-28 Nokia Technologies Oy An apparatus, a method and a computer program for video coding and decoding
WO2020164751A1 (en) * 2019-02-13 2020-08-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder and decoding method for lc3 concealment including full frame loss concealment and partial frame loss concealment
TW202102010A (zh) 2019-05-24 2021-01-01 瑞典商赫爾桑茲股份有限公司 用於無損資料壓縮和解壓縮的方法、裝置、和電腦程式產品
US11271678B2 (en) * 2020-01-21 2022-03-08 Realtek Semiconductor Corp. Encoding method, related transmitter apparatus and related receiver apparatus for wireless local area network
US12058470B2 (en) 2020-08-25 2024-08-06 Nahum Nir Video compression and streaming
US11769478B1 (en) 2021-07-15 2023-09-26 Dialog Semiconductor B.V. Digital signal processing system
US11997317B2 (en) * 2021-09-29 2024-05-28 Tencent America LLC Techniques for constraint flag signaling for range extension with persistent rice adaptation

Family Cites Families (141)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US251330A (en) * 1881-12-20 Dust-collector for flour-mills
US254281A (en) * 1882-02-28 Corn-sheller
US138157A (en) * 1873-04-22 Improvement in breech-loading fire-arms
US152557A (en) * 1874-06-30 Improvement in devices for coiling wire
US80829A (en) * 1868-08-11 Patkick lennox
US117044A (en) * 1871-07-18 Improvement in ladies work-stands
US115051A (en) * 1871-05-23 Improvement in the manufacture of glucose sirups -and sugars
US216262A (en) * 1879-06-10 Improvement in thill-coupling jacks
US78687A (en) * 1868-06-09 Daniel e
US37461A (en) * 1863-01-20 Improved car for carrying petroleum
US2006A (en) * 1841-03-16 Clamp for crimping leather
US76333A (en) * 1868-04-07 To all whom it may concern
US13405A (en) * 1855-08-07 Self-adjusting tongue-ihon
US149322A (en) * 1874-04-07 Improvement in parasol-handles
US63368A (en) * 1867-04-02 davids
US247035A (en) * 1881-09-13 Drill-chuck
US75153A (en) * 1868-03-03 Egbert d
US125933A (en) * 1872-04-23 Improvement in compounds for the cure of colic and botts in horses
US4110571A (en) * 1977-11-25 1978-08-29 Jimmy's Radio & Television Corporation Test unit for stereophonic speaker systems
US4922537A (en) 1987-06-02 1990-05-01 Frederiksen & Shu Laboratories, Inc. Method and apparatus employing audio frequency offset extraction and floating-point conversion for digitally encoding and decoding high-fidelity audio signals
US5243686A (en) * 1988-12-09 1993-09-07 Oki Electric Industry Co., Ltd. Multi-stage linear predictive analysis method for feature extraction from acoustic signals
FR2646978B1 (fr) 1989-05-11 1991-08-23 France Etat Procede et installation a codage de signaux sonores
NL9000338A (nl) 1989-06-02 1991-01-02 Koninkl Philips Electronics Nv Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting.
US5166686A (en) * 1989-06-30 1992-11-24 Nec Corporation Variable length block coding with changing characteristics of input samples
JPH03224130A (ja) 1990-01-30 1991-10-03 Konica Corp ディスク状磁気記録媒体
CN1062963C (zh) 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
US5283780A (en) 1990-10-18 1994-02-01 Stanford Telecommunications, Inc. Digital audio broadcasting system
US5165686A (en) * 1990-12-18 1992-11-24 Morgan Edward H Wooden baseball bat
SG49883A1 (en) 1991-01-08 1998-06-15 Dolby Lab Licensing Corp Encoder/decoder for multidimensional sound fields
US5751773A (en) * 1992-03-12 1998-05-12 Ntp Incorporated System for wireless serial transmission of encoded information
US5495552A (en) 1992-04-20 1996-02-27 Mitsubishi Denki Kabushiki Kaisha Methods of efficiently recording an audio signal in semiconductor memory
US5828784A (en) 1992-07-13 1998-10-27 Hitachi Denshi Kabushiki Kaisha Data coding method and apparatus using a plurality of blocks of different length
US6161122A (en) 1992-12-10 2000-12-12 Hawkes; Calvert T. Method and apparatus for interactively providing information at multiple sites
KR100287494B1 (ko) 1993-06-30 2001-04-16 이데이 노부유끼 디지탈신호의부호화방법및장치,복호화방법및장치와부호화시킨신호의기록매체
JP3125543B2 (ja) 1993-11-29 2001-01-22 ソニー株式会社 信号符号化方法及び装置、信号復号化方法及び装置、並びに記録媒体
JP3175446B2 (ja) 1993-11-29 2001-06-11 ソニー株式会社 情報圧縮方法及び装置、圧縮情報伸張方法及び装置、圧縮情報記録/伝送装置、圧縮情報再生装置、圧縮情報受信装置、並びに記録媒体
DE4401227C2 (de) * 1994-01-18 1999-03-18 Ernst Peter Prof Dr M Strecker In den Körper eines Patienten perkutan implantierbare Endoprothese
JPH0831096A (ja) 1994-07-12 1996-02-02 Matsushita Electric Ind Co Ltd オーディオデータ符号化記録装置及びオーディオデータ復号再生装置
US6549666B1 (en) 1994-09-21 2003-04-15 Ricoh Company, Ltd Reversible embedded wavelet system implementation
US5751903A (en) 1994-12-19 1998-05-12 Hughes Electronics Low rate multi-mode CELP codec that encodes line SPECTRAL frequencies utilizing an offset
KR100254090B1 (ko) * 1995-02-16 2000-04-15 니시무로 타이죠 기록 매체 재생 장치
US5956674A (en) 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
JP3705305B2 (ja) * 1996-05-16 2005-10-12 カシオ計算機株式会社 音声記憶再生装置
JP3364825B2 (ja) 1996-05-29 2003-01-08 三菱電機株式会社 音声符号化装置および音声符号化復号化装置
US6154549A (en) 1996-06-18 2000-11-28 Extreme Audio Reality, Inc. Method and apparatus for providing sound in a spatial environment
GB2318029B (en) 1996-10-01 2000-11-08 Nokia Mobile Phones Ltd Audio coding method and apparatus
JP3987582B2 (ja) * 1996-11-11 2007-10-10 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ライスエンコーダ/デコーダを用いるデータ圧縮/拡張
TW447193B (en) 1996-12-09 2001-07-21 Matsushita Electric Ind Co Ltd Signal processing device
EP1359755B1 (en) 1996-12-20 2005-11-09 Koninklijke Philips Electronics N.V. A coded information signal
TW395142B (en) 1997-05-15 2000-06-21 Matsushita Electric Ind Co Ltd Compressed code decoding device and audio decoding device
US6124895A (en) * 1997-10-17 2000-09-26 Dolby Laboratories Licensing Corporation Frame-based audio coding with video/audio data synchronization by dynamic audio frame alignment
US6069947A (en) 1997-12-16 2000-05-30 Nortel Networks Corporation Communication system architecture and operating protocol therefor
JP3802219B2 (ja) 1998-02-18 2006-07-26 富士通株式会社 音声符号化装置
US6831914B1 (en) * 1998-03-27 2004-12-14 Verizon Services Corp. Services control point selection in an advanced intelligent network
WO1999053479A1 (en) 1998-04-15 1999-10-21 Sgs-Thomson Microelectronics Asia Pacific (Pte) Ltd. Fast frame optimisation in an audio encoder
US6298900B1 (en) * 1998-07-06 2001-10-09 Ford Global Technologies, Inc. Method of integrating wear plates into a spray formed rapid tool
US6480822B2 (en) 1998-08-24 2002-11-12 Conexant Systems, Inc. Low complexity random codebook structure
WO2000021199A1 (fr) 1998-10-06 2000-04-13 Matsushita Electric Industrial Co., Ltd. Procede et dispositif de codage a compression sans perte, et procede et dispositif de decodage a compression sans perte
JP4610680B2 (ja) 1998-11-02 2011-01-12 ソニー株式会社 信号処理装置および方法、記録装置、再生装置、記録再生装置、ならびに、映像信号記録再生装置
US6816491B1 (en) 1998-11-04 2004-11-09 Hitachi, Ltd. Multiplexed audio data decoding apparatus and receiver apparatus
US6300888B1 (en) * 1998-12-14 2001-10-09 Microsoft Corporation Entrophy code mode switching for frequency-domain audio coding
US6628714B1 (en) 1998-12-18 2003-09-30 Zenith Electronics Corporation Down converting MPEG encoded high definition sequences to lower resolution with reduced memory in decoder loop
US6276608B1 (en) * 1998-12-29 2001-08-21 Daimlerchrysler Ag Data storage and communication system
CA2323014C (en) 1999-01-07 2008-07-22 Koninklijke Philips Electronics N.V. Efficient coding of side information in a lossless encoder
US6226608B1 (en) 1999-01-28 2001-05-01 Dolby Laboratories Licensing Corporation Data framing for adaptive-block-length coding system
US7051351B2 (en) * 1999-03-08 2006-05-23 Microsoft Corporation System and method of inserting advertisements into an information retrieval system display
US6658382B1 (en) 1999-03-23 2003-12-02 Nippon Telegraph And Telephone Corporation Audio signal coding and decoding methods and apparatus and recording media with programs therefor
EP1054575A3 (en) 1999-05-17 2002-09-18 Bose Corporation Directional decoding
US6691082B1 (en) 1999-08-03 2004-02-10 Lucent Technologies Inc Method and system for sub-band hybrid coding
JP3762579B2 (ja) 1999-08-05 2006-04-05 株式会社リコー デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
US6678332B1 (en) * 2000-01-04 2004-01-13 Emc Corporation Seamless splicing of encoded MPEG video and audio
US7096481B1 (en) * 2000-01-04 2006-08-22 Emc Corporation Preparation of metadata for splicing of encoded MPEG video and audio
US6810502B2 (en) 2000-01-28 2004-10-26 Conexant Systems, Inc. Iteractive decoder employing multiple external code error checks to lower the error floor
US6675748B2 (en) * 2000-02-11 2004-01-13 Westport Research Inc. Method and apparatus for fuel injection into an internal combustion engine
US7266501B2 (en) 2000-03-02 2007-09-04 Akiba Electronics Institute Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
WO2001070946A2 (en) * 2000-03-21 2001-09-27 Neugenesis Corporation Methods for in vivo diversification of single genes
US6448890B1 (en) * 2000-05-01 2002-09-10 Breed Automotive Technology, Inc. Air bag system with biomechanical gray zones
SE522261C2 (sv) 2000-05-10 2004-01-27 Global Ip Sound Ab Kodning och avkodning av en digital signal
WO2001097476A2 (en) 2000-06-12 2001-12-20 Time Domain Corporation A method for specifying non-temporal pulse characteristics
JP4538908B2 (ja) 2000-06-14 2010-09-08 ソニー株式会社 データ変換装置及び方法
US6609947B1 (en) * 2000-08-30 2003-08-26 Micron Technology, Inc. Planarizing machines and control systems for mechanical and/or chemical-mechanical planarization of micro electronic substrates
US20020049586A1 (en) 2000-09-11 2002-04-25 Kousuke Nishio Audio encoder, audio decoder, and broadcasting system
US6775254B1 (en) 2000-11-09 2004-08-10 Qualcomm Incorporated Method and apparatus for multiplexing high-speed packet data transmission with voice/data transmission
SE0004163D0 (sv) * 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
JP3639212B2 (ja) * 2000-12-11 2005-04-20 株式会社オプトウエア 光情報記録方法
US6675148B2 (en) 2001-01-05 2004-01-06 Digital Voice Systems, Inc. Lossless audio coder
AU2001276588A1 (en) 2001-01-11 2002-07-24 K. P. P. Kalyan Chakravarthy Adaptive-block-length audio coder
US6871043B2 (en) * 2001-02-02 2005-03-22 Ecollege.Com Variable types of sensory interaction for an on-line educational system
EP1391121B1 (en) * 2001-03-23 2012-08-15 Nokia Corporation Variable length coding
JP4867076B2 (ja) 2001-03-28 2012-02-01 日本電気株式会社 音声合成用圧縮素片作成装置、音声規則合成装置及びそれらに用いる方法
FI118067B (fi) 2001-05-04 2007-06-15 Nokia Corp Menetelmä audiosignaalin pakkauksen purkamisessa, pakkauksen purkulaite, ja elektroniikkalaite
JP3601473B2 (ja) 2001-05-11 2004-12-15 ヤマハ株式会社 ディジタルオーディオ圧縮回路および伸長回路
KR100922391B1 (ko) 2001-08-03 2009-10-19 코닌클리케 필립스 일렉트로닉스 엔.브이. A/v 데이터의 스트리밍 보호
GB2379977B (en) * 2001-09-25 2005-04-06 Kidde Plc High sensitivity particle detection
US20030078687A1 (en) 2001-10-15 2003-04-24 Du Breuil Thomas Lemaigre Method and system for automatically configuring an audio environment
DE20117292U1 (de) * 2001-10-22 2002-01-17 Reitter & Schefenacker GmbH & Co. KG, 73730 Esslingen Innenleuchte für Fahrzeuge, vorzugsweise für Kraftfahrzeuge
EP1308931A1 (de) 2001-10-23 2003-05-07 Deutsche Thomson-Brandt Gmbh Decodierung eines codierten digitalen Audio-Signals welches in Header enthaltende Rahmen angeordnet ist
US7085401B2 (en) 2001-10-31 2006-08-01 Infowrap Systems Ltd. Automatic object extraction
SE521600C2 (sv) 2001-12-04 2003-11-18 Global Ip Sound Ab Lågbittaktskodek
US20030018172A1 (en) * 2001-12-06 2003-01-23 Genentech, Inc. Secreted transmembrane polypeptides and nucleic acids encoding the same
US6934677B2 (en) * 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US6690307B2 (en) * 2002-01-22 2004-02-10 Nokia Corporation Adaptive variable length coding of digital video
CN1311426C (zh) 2002-04-10 2007-04-18 皇家飞利浦电子股份有限公司 立体声信号的编码、解码方法和装置及其传输设备
DE60326782D1 (de) 2002-04-22 2009-04-30 Koninkl Philips Electronics Nv Dekodiervorrichtung mit Dekorreliereinheit
AU2003226596A1 (en) 2002-04-26 2003-11-10 Nokia Corporation Adaptive method and system for mapping parameter values to codeword indexes
JP4296753B2 (ja) 2002-05-20 2009-07-15 ソニー株式会社 音響信号符号化方法及び装置、音響信号復号方法及び装置、並びにプログラム及び記録媒体
US6691028B2 (en) * 2002-06-07 2004-02-10 Motorola, Inc. Server-based navigation system and method of operating same
US20040015259A1 (en) * 2002-07-18 2004-01-22 A-Po Tsai NC machining program having easily selectable modes
US6807732B2 (en) 2002-07-24 2004-10-26 Agilent Technologies, Inc. Methods for modifying inner-layer circuit features of printed circuit boards
JP4055122B2 (ja) 2002-07-24 2008-03-05 日本ビクター株式会社 音響信号符号化方法及び音響信号符号化装置
JP2004072345A (ja) 2002-08-05 2004-03-04 Pioneer Electronic Corp 情報記録媒体、情報記録装置及び方法、情報再生装置及び方法、情報記録再生装置及び方法、コンピュータプログラム、並びにデータ構造
JP4022111B2 (ja) 2002-08-23 2007-12-12 株式会社エヌ・ティ・ティ・ドコモ 信号符号化装置及び信号符号化方法
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
CN1703736A (zh) * 2002-10-11 2005-11-30 诺基亚有限公司 用于源控制可变比特率宽带语音编码的方法和装置
US20040076333A1 (en) * 2002-10-22 2004-04-22 Huipin Zhang Adaptive interpolation filter system for motion compensated predictive video coding
CN100471072C (zh) 2002-11-21 2009-03-18 日本电信电话株式会社 数字信号处理方法
EP1427252A1 (en) * 2002-12-02 2004-06-09 Deutsche Thomson-Brandt Gmbh Method and apparatus for processing audio signals from a bitstream
WO2004053919A2 (en) * 2002-12-11 2004-06-24 Koninklijke Philips Electronics N.V. X-ray source for generating monochromatic x-rays
US7440810B2 (en) 2002-12-13 2008-10-21 Dell Products L.P. Multi-channel media applications support with channel-to-connector mapping
DE60230436D1 (de) * 2002-12-23 2009-01-29 Alcatel Lucent Überlastkontrolle in einem optischen Netzwerk mit Burstschaltung
KR101049751B1 (ko) 2003-02-11 2011-07-19 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
US20040177044A1 (en) * 2003-03-03 2004-09-09 General Instrument Corporation Processing of copy control information for digital rights management
US7792194B2 (en) * 2003-04-10 2010-09-07 Lefan Zhong MPEG artifacts post-processed filtering architecture
US7742926B2 (en) * 2003-04-18 2010-06-22 Realnetworks, Inc. Digital audio signal compression method and apparatus
HUP0301368A3 (en) * 2003-05-20 2005-09-28 Amt Advanced Multimedia Techno Method and equipment for compressing motion picture data
US7383180B2 (en) * 2003-07-18 2008-06-03 Microsoft Corporation Constant bitrate media encoding techniques
SE0302161D0 (sv) * 2003-08-04 2003-08-01 Akzo Nobel Nv Process for the manufacture of a bitumen-aggregate mix suitable for road pavement
US7640157B2 (en) 2003-09-26 2009-12-29 Ittiam Systems (P) Ltd. Systems and methods for low bit rate audio coders
WO2005039200A2 (en) * 2003-10-13 2005-04-28 Realnetworks, Inc. Compact signal coding method and apparatus
US7725310B2 (en) 2003-10-13 2010-05-25 Koninklijke Philips Electronics N.V. Audio encoding
KR20050044085A (ko) * 2003-11-07 2005-05-12 삼성전자주식회사 집적회로 소자의 세정액 및 그 세정액을 이용한 세정방법
US7292902B2 (en) * 2003-11-12 2007-11-06 Dolby Laboratories Licensing Corporation Frame-based audio transmission/storage with overlap to facilitate smooth crossfading
JP4765289B2 (ja) 2003-12-10 2011-09-07 ソニー株式会社 音響システムにおけるスピーカ装置の配置関係検出方法、音響システム、サーバ装置およびスピーカ装置
SE527670C2 (sv) 2003-12-19 2006-05-09 Ericsson Telefon Ab L M Naturtrogenhetsoptimerad kodning med variabel ramlängd
US7809579B2 (en) * 2003-12-19 2010-10-05 Telefonaktiebolaget Lm Ericsson (Publ) Fidelity-optimized variable frame length encoding
US7272567B2 (en) 2004-03-25 2007-09-18 Zoran Fejzo Scalable lossless audio codec and authoring tool
KR100773539B1 (ko) 2004-07-14 2007-11-05 삼성전자주식회사 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치
US7233174B2 (en) * 2004-07-19 2007-06-19 Texas Instruments Incorporated Dual polarity, high input voltage swing comparator using MOS input transistors
WO2006091139A1 (en) 2005-02-23 2006-08-31 Telefonaktiebolaget Lm Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
US7966190B2 (en) * 2005-07-11 2011-06-21 Lg Electronics Inc. Apparatus and method for processing an audio signal using linear prediction
US7299902B2 (en) * 2005-10-21 2007-11-27 Jim Thorpe Wheel chock for tandem wheeled vehicles

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11257505B2 (en) 2013-07-22 2022-02-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework
US10134404B2 (en) 2013-07-22 2018-11-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework
US10847167B2 (en) 2013-07-22 2020-11-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework
US10984805B2 (en) 2013-07-22 2021-04-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
US10276183B2 (en) 2013-07-22 2019-04-30 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding or encoding an audio signal using energy information values for a reconstruction band
US10311892B2 (en) 2013-07-22 2019-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding or decoding audio signal with intelligent gap filling in the spectral domain
US10332531B2 (en) 2013-07-22 2019-06-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding or encoding an audio signal using energy information values for a reconstruction band
US10332539B2 (en) 2013-07-22 2019-06-25 Fraunhofer-Gesellscheaft zur Foerderung der angewanften Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
US10347274B2 (en) 2013-07-22 2019-07-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
US10515652B2 (en) 2013-07-22 2019-12-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
US10573334B2 (en) 2013-07-22 2020-02-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding or decoding an audio signal with intelligent gap filling in the spectral domain
US10593345B2 (en) 2013-07-22 2020-03-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus for decoding an encoded audio signal with frequency tile adaption
US11996106B2 (en) 2013-07-22 2024-05-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
US10002621B2 (en) 2013-07-22 2018-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
US10147430B2 (en) 2013-07-22 2018-12-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
US11049506B2 (en) 2013-07-22 2021-06-29 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
US11222643B2 (en) 2013-07-22 2022-01-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus for decoding an encoded audio signal with frequency tile adaption
US11250862B2 (en) 2013-07-22 2022-02-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding or encoding an audio signal using energy information values for a reconstruction band
CN104769671B (zh) * 2013-07-22 2017-09-26 弗劳恩霍夫应用研究促进协会 用于使用时域噪声/修补整形对编码音频信号进行编码和解码的设备及方法
US11289104B2 (en) 2013-07-22 2022-03-29 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding or decoding an audio signal with intelligent gap filling in the spectral domain
US11735192B2 (en) 2013-07-22 2023-08-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework
US11769513B2 (en) 2013-07-22 2023-09-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding or encoding an audio signal using energy information values for a reconstruction band
US11769512B2 (en) 2013-07-22 2023-09-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
US11922956B2 (en) 2013-07-22 2024-03-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding or decoding an audio signal with intelligent gap filling in the spectral domain
US12112765B2 (en) 2015-03-09 2024-10-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
CN111341330A (zh) * 2020-02-10 2020-06-26 科大讯飞股份有限公司 音频编解码方法、存取方法及其相关设备及存储装置

Also Published As

Publication number Publication date
JP2009500693A (ja) 2009-01-08
US8121836B2 (en) 2012-02-21
WO2007007999A2 (en) 2007-01-18
WO2007008000A2 (en) 2007-01-18
US8180631B2 (en) 2012-05-15
CN101243494A (zh) 2008-08-13
US20070010995A1 (en) 2007-01-11
US20090055198A1 (en) 2009-02-26
CN101218631A (zh) 2008-07-09
EP1913580A2 (en) 2008-04-23
US8108219B2 (en) 2012-01-31
WO2007008000A3 (en) 2007-04-05
US20090037183A1 (en) 2009-02-05
US7987008B2 (en) 2011-07-26
US20090030702A1 (en) 2009-01-29
US8326132B2 (en) 2012-12-04
EP1911020A4 (en) 2010-12-29
US20090048850A1 (en) 2009-02-19
JP2009500681A (ja) 2009-01-08
US7991012B2 (en) 2011-08-02
WO2007008012A2 (en) 2007-01-18
US8055507B2 (en) 2011-11-08
US8010372B2 (en) 2011-08-30
CN101243496A (zh) 2008-08-13
US20070011000A1 (en) 2007-01-11
US20090037182A1 (en) 2009-02-05
US8255227B2 (en) 2012-08-28
US20090037184A1 (en) 2009-02-05
US8155152B2 (en) 2012-04-10
US20070008193A1 (en) 2007-01-11
EP1913587A4 (en) 2010-10-27
EP1913584A2 (en) 2008-04-23
WO2007008002A2 (en) 2007-01-18
US8050915B2 (en) 2011-11-01
US8032368B2 (en) 2011-10-04
US20090106032A1 (en) 2009-04-23
US7991272B2 (en) 2011-08-02
CN101243496B (zh) 2011-12-07
WO2007008009A1 (en) 2007-01-18
US8149878B2 (en) 2012-04-03
WO2007008011A2 (en) 2007-01-18
US20070014297A1 (en) 2007-01-18
EP1913588A4 (en) 2011-02-16
US20070009105A1 (en) 2007-01-11
US8417100B2 (en) 2013-04-09
EP1908058A2 (en) 2008-04-09
US20070009227A1 (en) 2007-01-11
US8275476B2 (en) 2012-09-25
US20090037181A1 (en) 2009-02-05
US20070009032A1 (en) 2007-01-11
WO2007008001A2 (en) 2007-01-18
US8032386B2 (en) 2011-10-04
EP1913794A4 (en) 2010-12-29
EP1913589A2 (en) 2008-04-23
EP1913582A4 (en) 2010-12-29
US20070010996A1 (en) 2007-01-11
US7987009B2 (en) 2011-07-26
CN101218628A (zh) 2008-07-09
JP2009500683A (ja) 2009-01-08
JP2009500692A (ja) 2009-01-08
US8554568B2 (en) 2013-10-08
EP1913579A2 (en) 2008-04-23
EP1913581A2 (en) 2008-04-23
WO2007008004A3 (en) 2007-03-15
US20090037009A1 (en) 2009-02-05
US8046092B2 (en) 2011-10-25
JP2009500685A (ja) 2009-01-08
US20090037187A1 (en) 2009-02-05
EP1911021A4 (en) 2010-06-30
WO2007008001A3 (en) 2007-03-22
CN101218630A (zh) 2008-07-09
EP1913588A2 (en) 2008-04-23
CN101243492A (zh) 2008-08-13
WO2007008003A2 (en) 2007-01-18
JP2009510810A (ja) 2009-03-12
US8065158B2 (en) 2011-11-22
US8149877B2 (en) 2012-04-03
US20090030675A1 (en) 2009-01-29
JP2009500689A (ja) 2009-01-08
US20070009031A1 (en) 2007-01-11
EP1913583A4 (en) 2010-06-30
EP1913794A1 (en) 2008-04-23
EP1913585A4 (en) 2010-12-29
CN101243495A (zh) 2008-08-13
US20090030701A1 (en) 2009-01-29
WO2007008007A1 (en) 2007-01-18
CN101243497A (zh) 2008-08-13
CN101243493A (zh) 2008-08-13
WO2007008003A3 (en) 2007-03-15
WO2007008002A3 (en) 2007-03-15
JP2009500688A (ja) 2009-01-08
US20090037191A1 (en) 2009-02-05
EP1913580A4 (en) 2011-01-05
US20090048851A1 (en) 2009-02-19
US20090037190A1 (en) 2009-02-05
US7411528B2 (en) 2008-08-12
EP1913587A1 (en) 2008-04-23
EP1911021A2 (en) 2008-04-16
EP1911020A2 (en) 2008-04-16
US20090037188A1 (en) 2009-02-05
CN101218628B (zh) 2011-11-09
US8510119B2 (en) 2013-08-13
US20090030703A1 (en) 2009-01-29
US20070009033A1 (en) 2007-01-11
US7962332B2 (en) 2011-06-14
WO2007008004A2 (en) 2007-01-18
EP1913579A4 (en) 2010-12-29
WO2007008013A2 (en) 2007-01-18
US20090037185A1 (en) 2009-02-05
US7966190B2 (en) 2011-06-21
EP1913584A4 (en) 2011-02-23
US20070011004A1 (en) 2007-01-11
JP2009500686A (ja) 2009-01-08
JP2009500684A (ja) 2009-01-08
CN101218629A (zh) 2008-07-09
CN101238509A (zh) 2008-08-06
US20070011013A1 (en) 2007-01-11
US8510120B2 (en) 2013-08-13
EP1908058A4 (en) 2010-10-27
EP1913582A2 (en) 2008-04-23
US7830921B2 (en) 2010-11-09
JP2009500690A (ja) 2009-01-08
US20070009233A1 (en) 2007-01-11
WO2007008005A1 (en) 2007-01-18
EP1913585A1 (en) 2008-04-23
EP1913581A4 (en) 2011-02-09
WO2007008010A1 (en) 2007-01-18
JP2009500691A (ja) 2009-01-08
US20090037186A1 (en) 2009-02-05
WO2007008011A3 (en) 2007-03-15
WO2007008012A3 (en) 2007-03-08
WO2007008008A2 (en) 2007-01-18
US20090037192A1 (en) 2009-02-05
US8155144B2 (en) 2012-04-10
US7835917B2 (en) 2010-11-16
CN101218852A (zh) 2008-07-09
JP2009500687A (ja) 2009-01-08
WO2007008013A3 (en) 2007-03-22
US20090030700A1 (en) 2009-01-29
EP1913583A1 (en) 2008-04-23
WO2007007999A3 (en) 2007-03-22
US20070011215A1 (en) 2007-01-11
US7930177B2 (en) 2011-04-19
US8155153B2 (en) 2012-04-10
US7996216B2 (en) 2011-08-09
US8032240B2 (en) 2011-10-04
US7949014B2 (en) 2011-05-24
US8149876B2 (en) 2012-04-03
CN101243489A (zh) 2008-08-13
JP2009500682A (ja) 2009-01-08
WO2007008008A3 (en) 2007-03-15
EP1913589A4 (en) 2010-12-29
CN101218630B (zh) 2013-07-17
US20090037167A1 (en) 2009-02-05

Similar Documents

Publication Publication Date Title
CN101218628B (zh) 编码和解码音频信号的装置和方法
KR100936498B1 (ko) 스테레오 호환성의 멀티채널 오디오 코딩
CN101809653A (zh) 用于处理音频信号的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20080806