CN1813286B - 音频编码方法、音频编码器以及数字介质编码方法 - Google Patents
音频编码方法、音频编码器以及数字介质编码方法 Download PDFInfo
- Publication number
- CN1813286B CN1813286B CN2004800032596A CN200480003259A CN1813286B CN 1813286 B CN1813286 B CN 1813286B CN 2004800032596 A CN2004800032596 A CN 2004800032596A CN 200480003259 A CN200480003259 A CN 200480003259A CN 1813286 B CN1813286 B CN 1813286B
- Authority
- CN
- China
- Prior art keywords
- sub
- band
- audio
- shape
- coding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 36
- 238000001228 spectrum Methods 0.000 claims abstract description 85
- 239000013598 vector Substances 0.000 claims abstract description 39
- 230000003595 spectral effect Effects 0.000 claims abstract description 22
- 230000005236 sound signal Effects 0.000 claims description 7
- 238000000926 separation method Methods 0.000 claims 1
- 238000013139 quantization Methods 0.000 description 17
- 230000035807 sensation Effects 0.000 description 15
- 238000005516 engineering process Methods 0.000 description 11
- 238000007493 shaping process Methods 0.000 description 11
- 230000009471 action Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 8
- 238000011002 quantification Methods 0.000 description 8
- FUYLLJCBCKRIAL-UHFFFAOYSA-N 4-methylumbelliferone sulfate Chemical compound C1=C(OS(O)(=O)=O)C=CC2=C1OC(=O)C=C2C FUYLLJCBCKRIAL-UHFFFAOYSA-N 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 230000008859 change Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 230000001953 sensory effect Effects 0.000 description 4
- 238000004611 spectroscopical analysis Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000000875 corresponding effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 210000004744 fore-foot Anatomy 0.000 description 2
- 210000003128 head Anatomy 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 230000036962 time dependent Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 241000669244 Unaspis euonymi Species 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001914 calming effect Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 210000000959 ear middle Anatomy 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000002650 habitual effect Effects 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 238000013442 quality metrics Methods 0.000 description 1
- 230000007115 recruitment Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/035—Scalar quantisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Lubricants (AREA)
Abstract
传统的音频编码器可通过编码比全部光谱系数少的系数来保持编码比特率,这可产生重建中的模糊低通声音。使用广义感觉相似性的音频编码器通过编码表示为已编码光谱的经缩放版本的被略去光谱系数的感觉相似版本来改进质量。被略去的光谱系数被分成众多子波段。子波段被编码为两个参数:可表示波段中能量的比例参数;以及可表示波段形状的形状参数。该形状参数可以是指向已编码光谱一部分的运动向量、固定编码簿中光谱形状的索引、或随机噪音向量的形式。因而该编码有效地表示了在解码时要复制的光谱的相似成形部分的经缩放版本。
Description
技术领域
本发明一般涉及基于广义感觉相似性编码和解码的数字介质(例如音频、视频、静态图像等)。
背景技术
音频编码使用开发人类听觉的各种感觉模型的编码技术。例如,强音调附近的许多较弱音调被屏蔽从而它们不必进行编码。在传统的感觉音频编码中,这被开发为不同频率数据的适应性量化。重要的感觉频率数据被分配给更多比特从而有较细量化,反之亦然。参见例如Painter T.和SpaniasA.在Proceedings of the IEEE(IEEE学报)88卷第4期2000年4月第451-515页的“Perceptual Coding of Digital Audio”(“数字音频的感觉编码”)。
然而,感觉编码可具有更广泛意义。例如,光谱的某些部分可用适当成形的噪音来编码。参见Schelz D.在Journal of the AES(AES期刊)44卷第7/8期1996年7月/8月第593-598页的“Improving Audio Codecs by Noise Substitution”(“通过噪音置换改进音频编解码器”)。当采取该方法时,经编码信号不以呈现原来的准确或近准确版本为目标。相反,目标是使它与原来版本相比听起来相似并愉悦。
所有这些感觉效果可被用来减少编码音频信号所需的比特率。这是因为某些频率成分并不需要像在原来信号中一样地准确呈现,而可用某些给予与原来相同感觉效果的东西来编码或替换。
发明内容
在此所述的数字介质(例如音频、视频、静态图像等)编码/解码技术利用某些频率成分可使用成形噪音、或其它频率成分的成形版本、或两者的组合来在感觉上良好或部分呈现。更具体地,某些频率波段可在感觉上被良好呈现为已被编码的其它波段的成形版本。即使实际光谱可能偏离该综合版本,它仍然是可被用来不降低质量而大大降低音频信号编码的比特率的感觉良好呈现。
大多数音频编解码器使用诸如修正离散余弦变换(MDCT)或调制重叠转换(MLT)的子波段变换或重叠正交变换来使用光谱分解,这些变换将音频信号从时间-域表示转换成光谱系数块或集。然后这些光谱系数被编码并发送给解码器。这些光谱系数的值的编码构成在音频编解码器中使用的大部分比特率。在低比特率中,音频系统可被设计成粗略地编码所有系数从而导致低质量重建,或编码较少的系数从而导致消声或低通发声信号。在此所述的音频编码/解码技术在实行后者时
(即当音频编解码器选择编码通常较低但不因反向兼容而必须的一些系数时)可被用来改进音频质量。
仅当编码一些系数时,编解码器产生重建中的模糊低通声音。为了改进该质量,所述编码/解码技术花费总比特率的较少百分比来添加遗漏光谱系数的感觉愉悦版本,从而产生更丰富的声音。这不是通过真正编码遗漏系数,而是通过将它们在感觉上呈现为已编码的缩放版本来实现。在一示例中,使用MLT分解(诸如微软Windows媒体音频(WMA))的编解码器进行最高达带宽的某个百分比的编码。然后该编码/解码技术版本将剩下的系数分成若干波段(诸如每个通常由64或128个光谱系数组成的子波段)。对于每一个这些波段,该编码/解码技术版本使用两个参数来编码该波段:表示波段中总能量的比例因子,以及呈现波段内光谱形状的形状系数。该比例因子参数可以就是波段内系数的rms(均方根)值。形状参数可以是仅通过从已被编码光谱的相似部分复制到光谱的标准化版本进行编码的一运动向量。在某些情形中,形状参数可相反指定一标准化随机噪音向量或仅是来自某些其它固定编码簿的向量。从光谱的另一部分复制一部分在音频中是有用的,因为通常在许多音调信号中有在光谱中重复的谐波成分。噪音或某些其它固定编码簿的使用允许对未被光谱的任何已编码部分良好呈现的那些成分的低比特率编码。该编码技术基本上是这些波段的增益-形状向量量化编码,其中该向量是光谱系数的频率波段,而编码簿可从先前编码的光谱中取得并可包括其它固定向量或随机噪音向量。此外,如果光谱的该复制部分被添加到同一部分的传统编码,则该添加是一残余编码。如果信号的传统编码给出易于用一些比特编码的基本表示(例如光谱基底的编码),且剩下的用新算法编码,则这会是有用的。
因此所述编码/解码技术在现存音频编解码器上改进。特别地,这些技术允许在给定质量上比特率的降低或固定比特率上质量的改进。这些技术可被用来以各种模式(例如连续的比特率或可变的比特率,单通或多通)改进音频编解码器。
参阅以下参照附图进行的对各实施例的详细描述,本发明的特征和优点将变得显而易见。
附图说明
图1和2是本编码技术可结合其中的音频编码器和解码器的框图。
图3是可结合到图1一般音频编码器的使用广义感觉相似性实现有效音频编码的基带编码器和扩展波段编码器的框图。
图4是使用图3扩展波段编码器中的广义感觉相似性来用有效音频编码对波段进行编码的流程图。
图5是可被结合到图2一般音频解码器的基带解码器和经扩展波段解码器的框图。
图6是使用图5经扩展波段解码器中的广义感觉相似性来用有效音频编码对波段进行解码的流程图。
图7是用于实现图1音频编码器/解码器的适当计算环境的框图。
具体实施方式
以下详细描述集中于根据本发明使用广义感觉相似性对数字媒体光谱数据进行数字媒体编码/解码的数字媒体编码器/解码器实施例。更具体地,以下描述详述这些编码/解码技术在音频中的应用。它们还可应用于其它数字媒体类型(例如视频、静止图像等)的编码/解码。在其对音频的应用中,该音频编码/解码使用成形噪音、或其它频率成分的成形版本、或两者的组合来呈现某些频率成分。更具体地,某些频率波段被呈现为已被编码的其它波段的成形版本。这允许给定质量上比特率的降低或固定比特率上质量的改进。
1.通用音频编码器和解码器
图1和2是通用音频编码器(100)和通用音频解码器(200)的框图,其中可结合在此所述的使用广义感觉相似性进行音频光谱数据的音频编码/解码的技术。所示编码器和解码器内模块之间的关系指示编码器和解码器中的主要信息流;其它关系为简便起见未示出。取决于所需压缩的类型和实现,编码器或解码器的模块可被添加、略去、分成多个模块、与其它模块组合、和/或用相似模块替换。在可选实施例中,带有不同模块和/或其它模块配置的编码器或解码器度量感觉音频质量。
其中可结合广义感觉相似性音频光谱数据编码/解码的音频编码器/解码器的更多细节在以下美国专利申请中描述:申请号为10/020,708于2001年12月14日提交的美国专利申请;申请号为10/016,918于2001年12月14日提交的美国专利申请;申请号为10/017,702于2001年12月14日提交的美国专利申请;申请号为10/017,861于2001年12月14日提交的美国专利申请;以及申请号为10/017,694于2001年12月14日提交的美国专利申请,这些申请的揭示通过引入包括在此。
A.通用音频编码器
通用音频编码器(100)包括频率转换器(110)、多通道转换器(120)、感觉建模器(130)、加权器(140)、量化器(150)、熵编码器(160)、速率/质量控制器(170)、以及比特流多路传输器[“MUX”](180)。
编码器(100)接收诸如表格1所示格式的输入音频样本(105)的时间序列。对于多通道输入(例如立体声模式),编码器(100)独立处理各通道,并遵从多通道转换器(120)对联合编码通道工作。编码器(100)压缩音频样本(105)以及由编码器(100)的各个模块产生的多路传输信息以输出诸如Windows媒体音频[“WMA”]或高级流格式[“ASF”]的格式的比特流(195)。或者,编码器(100)用其它输入和/或输出格式工作。
频率转换器(110)接收音频样本(105)并将它们转换成频率域内的数据。频率转换器(110)将音频样本(105)分成可具有可变尺寸以允许可变瞬时清晰度的多个块。小的块允许在输入音频样本(105)中较短但活动的转换片断上有较多的时间细节保留,但牺牲了一些频率清晰度。相反,大的块具有较佳频率清晰度但较差的时间清晰度,且常常允许在较长和较不活动的片断上有更大的压缩效率。块可重叠以减少否则会通过后来的量化而引入的各块之间的感觉中断。频率转换器(110)将频率系数数据的块输出到多通道转换器(120)并将诸如块尺寸的辅助信息输出到MUX(180)。频率转换器(110)将频率系数数据和辅助信息都输出到感觉建模器(130)。
频率转换器(110)将音频输入样本的帧分成具有时间可变尺寸的重叠子帧块,并将时间变化MLT应用于子帧块。可能的子帧尺寸包括128、256、512、1024、2048和4096个样本。MLT像由时间视窗函数调制的DCT一样操作,其中该视窗函数是随时间变化的并依赖于子帧尺寸序列。MLT将样本x[n],0≤n≤子帧_尺寸的给定重叠块转换成频率系数X[k],0≤k<子帧_尺寸/2的块。频率转换器(110)还可将对后来帧复杂性的估算输出到速率/增加量控制器(170)。可选实施例使用MLT的其它变体。在其它可选实施例中,频率转换器(110)应用DCT、FFT、或其它类型的已调制或未经调制、重叠或未重叠频率变换,或使用子波段或小波编码。
对于多通道音频数据,由频率转换器(110)产生的频率系数数据的多个通道常常是相互关联的。为使用该相互关联,多通道转换器(120)可将多个原始的独立编码通道转换成联合编码通道。例如,如果输入是立体声模式,多通道转换器(120)可将左右通道转换成和通道以及差动通道。
或者,多通道转换器(120)可在作为独立编码通道的左右通道中传递。更一般地,对于一个以上的众多输入通道,多通道转换器(120)在原始的独立编码通道中作未经改变地传递,或将原始通道转换成联合编码通道。使用独立或联合编码通道的判定可被预先确定,或者该判定可在编码期间逐块地或在其它基础上适应性地作出。多通道转换器(120)产生给MUX(180)的指示所使用通道转换模式的辅助信息。
感觉建模器(130)对人类听觉系统的属性建模以对给定比特流改进重建音频信号的质量。感觉建模器(130)计算频率系数可变尺寸块的激励模式。首先,感觉建模器(130)使该块的尺寸和幅度比例标准化。这使能随后的时间模糊并建立用于质量度量的一致比例。可任选地,感觉建模器(130)在某些频率衰减系数以建模外/中耳传输函数。感觉建模器(130)计算块中系数的能量并累加25个关键波段的能量。或者,感觉建模器(130)使用另外数量的关键波段(例如55或109)。关键波段的频率范围是实现相关的,且许多选项是众所周知的。例如参见ITU-R BS1387或本文提及的参考文献。感觉建模器(130)处理导致同时和时间屏蔽的波段能量。在可选实施例中,感觉建模器(130)根据诸如在TU-R BS 1387中描述或提及的不同听觉模型来处理音频数据。
加权器(140)基于从感觉建模器(130)接收的激励模型产生加权因子(或称为量化矩阵),并将该加权因子应用于从多通道转换器(120)接收的数据。加权因子包括用于音频数据中多个量化波段的每一个的权重。量化波段在数量或位置上可与在编码器(100)其它地方使用的关键波段相同或不同。加权因子指示噪音在量化波段上传播的比例,其目标是通过将更多噪音置入较难听到的波段来最小化噪音的可听度,反之亦然。加权因子在量化波段的幅度和数量上可逐块地不同。在一实现中,量化波段的数量根据块的尺寸变化;较小的块比较大的块具有较少的量化波段。例如,具有128个系数的块具有13个量化波段,具有256个系数的块具有15个量化波段,而高达25个量化波段则用于具有2048个系数的块。加权器(140)产生一个加权因子集用于独立或联合编码通道中多通道音频数据的每个通道,或产生用于联合编码通道的一个单独的加权因子集。在可选实施例中,加权器(140)从不同于激励模式或除激励模式之外的信息产生加权因子。
加权器(140)将系数数据的加权块输出到量化器(150),并将诸如加权因子集的辅助信息输出到MUX(180)。加权器(140)还可将加权因子输出到速率/质量控制器(140)或编码器(100)中的其它模块。加权因子集可被压缩用于更有效的表示。如果加权因子是有损压缩的,则重建的加权因子通常被用来加权系数数据块。如果块的一个波段中的音频信息因某些原因(例如噪音替换或波段截断)被完全消除,则编码器(100)能够进一步改进该块的量化矩阵的压缩。
量化器(150)量化加权器(140)的输出,从而产生给熵编码器(160)的量化系数数据以及给MUX(180)的包括量化步骤尺寸的辅助信息。量化引入了信息的不可逆损失,但还使编码器(100)与速率/质量控制器(170)一起能调节输出比特流(195)的比特率。在图1中,量化器(150)是适应性的、统一的标量量化器。量化器(150)将相同的量化步骤尺寸应用于某个频率系数,但量化步骤尺寸本身从一次到下次叠代可变化以影响熵编码器(160)输出的比特率。在可选实施例中,量化器是非统一量化器、向量量化器、和/或非适应性量化器。
熵编码器(160)无损地压缩从量化器(150)接收的经量化系数数据。例如,熵编码器(160)使用多级游程编码、可变-到-可变长度编码、游程编码、Hoffman编码、字典编码、算法编码、LZ编码、以上组合、或某些其它熵编码技术。
速率/质量控制器(170)与量化器(150)一起工作以调节编码器(100)输出的比特率和质量。速率/质量控制器(170)从编码器(100)的其它模块接收信息。在一实现中,速率/质量控制器(170)从频率转换器(110)接收对将来复杂度的估算、采样率、块尺寸信息、来自感觉建模器(130)的原始音频数据的激励模式、来自加权器(140)的加权因子、某些形式(例如经量化的、重建的、或编码的)的经量化音频信息块、以及来自MUX(180)的缓冲器状态信息。速率/质量控制器(170)可包括逆量化器、逆加权器、逆多通道转换器、以及可能熵编码器和其它模块来按量化形式重建音频数据。
速率/质量控制器(170)处理信息来确定给定当前条件下所需的量化步骤尺寸,并向量化器(150)输出量化步骤尺寸。然后速率/质量控制器(170)按用量化步骤尺寸量化的来度量经重建音频数据块的质量,如下所述。使用已度量的质量以及比特率信息,速率/质量控制器(170)调整量化步骤尺寸,其目标为满足即时和长期的比特率和质量约束。在可选实施例中,速率/质量控制器(170)用不同或附加信息工作,或应用不同技术来调节质量和比特率。
结合速率/质量控制器(170),编码器(100)可将噪音替代、波段截断、和/或多通道重新组成矩阵(rematrixing)应用于音频数据块。在低比特率和中比特率时,音频编码器(100)可使用噪音替代来传送某些波段中的信息。在波段截断中,如果块的经度量质量指示较差质量,则编码器(100)可在某些(通常较高频率)波段中完全消除这些系数以改进剩下波段中的整体质量。在多通道重新组成矩阵中,对于低比特率、联合编码通道中的多通道音频数据,编码器(100)可抑制某些通道(例如差动通道)中的信息以改进剩下通道(例如和通道)的质量。
MUX(180)多路传输从音频编码器(100)的其它模块接收的辅助信息,以及从熵编码器(160)接收的经熵编码的数据。MUX(180)以WMA或音频解码器识别的另一格式输出信息。
MUX(180)包括存储由编码器(100)将要输出的比特流(195)的虚拟缓冲器。该虚拟缓冲器存储音频信息的预定时段(例如用于流动音频的5秒)以便平息因音频中的复杂性改变而引起的比特率短期波动。然后虚拟缓冲器以相对恒定的比特率输出数据。缓冲器当前的充盈度、缓冲器充盈度的改变率、以及缓冲器的其它特征可由速率/质量控制器(170)使用来调节质量和比特率。
B.通用音频解码器
参照图2,通用音频解码器(200)包括比特流多路信号分离器[“DEMUX”](210)、熵解码器(220)、逆量化器(230)、噪音发生器(240)、逆加权器(250)、逆多通道转换器(260)、以及逆频率转换器(270)。解码器(200)比编码器(100)简单是因为解码器(200)不包括用于速率/质量控制的模块。
解码器(200)接收WMA或另一格式的经压缩音频数据的比特流(205)。该比特流(205)包括解码器(200)据其重建音频样本(295)的经熵编码数据以及辅助信息。对于具有多通道的音频数据,解码器(200)独立处理每个通道,然后在逆多通道转换器(260)之前可对联合编码通道工作。
DEMUX(210)解析比特流(205)中的信息并将信息发送给解码器(200)的模块。DEMUX(210)包括一个或多个缓冲器以补偿因音频复杂性、网络抖动、和/或其它因素的波动而引起的比特率的短期变化。
熵编码器(220)无损地解压缩从DEMUX(210)接收的熵编码,从而产生经量化的频率系数数据。熵解码器(220)通常应用在编码器中使用的熵编码技术的逆。
逆量化器(230)从DEMUX(210)接收量化步骤尺寸并从熵解码器(220)接收经量化的频率系数数据。逆量化器(230)将量化步骤尺寸应用于经量化的频率系数数据以部分地重建该频率系数数据。在可选实施例中,逆量化器应用在编码器中使用的某些其它量化技术的逆。
噪音发生器(240)从DEMUX(210)接收对数据块中哪些波段被噪音以及噪音形式的任何参数替代的指示。噪音发生器(240)产生用于被指示波段的模式,并将该信息传递给逆加权器(250)。
逆加权器(250)从DEMUX(210)接收加权因子,从噪音发生器(240)接收用于任何噪音替代波段的模式、并从逆量化器(230)接收部分重建的频率系数数据。必要时,逆加权器(250)解压缩加权因子。逆加权器(250)将加权因子应用于未经噪音替代的波段的部分经重建的频率系数数据。然后逆加权器(250)添加从噪音发生器(240)接收的噪音模式。
逆多通道转换器(260)从逆加权器(250)接收已重建的系数数据,并从DEMUX(210)接收通道转换模式信息。如果多通道数据在独立编码的通道内,则逆多通道转换器(260)将其沿通道传递。如果多通道数据是联合编码通道,则逆多通道转换器(260)把该数据转换成独立编码数据。如果需要,解码器(200)可在此时度量经重建的频率系数数据的质量。
逆频率转换器(270)接收由多通道转换器(260)输出的频率系数数据以及来自DEMUX(210)的诸如块尺寸的辅助信息。逆频率转换器(270)应用在编码器中使用的频率转换的逆,并输出经重建音频样本(295)的块。
2.使用广义感觉相似性编码/解码
图3示出使用以广义感觉相似性编码的音频编码器(300)的一个示例,该音频编码器可被结合到图1和2的通用音频编码器(100)和解码器(200)的整体音频编码/解码过程中。在该实现中,音频编码器(300)使用子波段变换或诸如MDCT或MLT的重叠正交变换在变换(320)执行一光谱分解,以产生用于音频信号每个输入块的一个光谱系数集。众所周知,音频编码器编码这些光谱系数用于向解码器发送输出比特流。这些光谱系数的值的编码构成在音频编码解码器中使用的大部分比特率。在较低比特率上,音频编码器(300)选择使用基带编码器340来编码较少的光谱系数(即可在从频率转换器(110)输出的光谱系数带宽的百分比内编码的一些系数),诸如光谱的较低或基带部分。基带编码器340使用一众所周知编码语法来编码这些基带光谱系数,如上对通用音频编码器所述。这一般会导致经重建音频发声被消声或低通过滤。
音频编码器(300)通过使用广义感觉相似性编码略去的光谱系数来避免消声或低通效应。在用基带编码器340的编码中被略去的这些光谱系数(在此称为“经扩展的波段光谱系数”)被经扩展波段编码器350编码为成形噪音、或其它频率成分的成形版本、或两者的组合。更具体地,经扩展波段的光谱系数被分成众多被编码为成形噪音或其它频率成分的成形版本的子波段(例如通常为64或128个光谱系数)。这添加了遗漏光谱系数的感觉愉悦版本以给出更丰富的声音。即使实际光谱可偏离因该编码所导致的综合版本,该经扩展波段编码提供了与原来相似的感觉效果。
在某些实现中,基带的宽度(即使用基带编码器340编码的基带光谱系数的数量)以及经扩展波段的尺寸或数量可被改变。这样,使用可扩展波段编码器(350)编码的基带宽度和经扩展波段的数量可被编码成输出流(195)。
进行音频编码器(300)中基带光谱系数和经扩展波段系数之间比特流的划分是为了确保基于基带编码器的编码语法与现存解码器反向兼容,从而现存解码器可解码基带经编码部分而略去已扩展部分。结果是只有较新的解码器才具有呈现经扩展波段的编码比特流所覆盖的全部光谱的能力,而较旧的解码器只能呈现编码器选择用现存语法编码的那部分。频率界限可以是灵活和随时间变化的。它可以由编码器基于信号特征判定并被显式发送给解码器,或者它可以是经解码光谱的函数,所以无需发送它。因为现存解码器仅能解码使用现存(基带)编解码器编码的那部分,这意味着光谱的较低部分用现存编解码器编码而较高部分则以使用广义感觉相似性的经扩展波段来编码。
在无需这种反向兼容的其它实现中,编码器可完全基于信号特征和编码成本在常规基带编码和经扩展波段(广义感觉相似性方法)之间自由选择而无需考虑频率位置。例如,尽管在自然信号中极不可能,但最好还是用常规编解码器来编码较高频率而用经扩展的编解码器来编码较低部分。
图4是示出由图3的经扩展波段编码器(350)执行音频编码过程(400)以编码经扩展的波段光谱系数的流程图。在该音频编码过程中(400),经扩展的波段编码器(350)将经扩展的波段光谱系数分成一些子波段。在一典型实现中,这些子波段一般每个包括64或128个光谱系数。或者,可使用其它尺寸的子波段(例如16、32或其它数量的光谱系数)。子波段可以是离散的或重叠的(使用开窗术)。对于重叠的子波段,编码更多的波段。例如,如果128个光谱系数不得不使用具有尺寸为64的子波段的经扩展波段编码器来编码,我们可使用两个离散波段来编码这些系数,其中系数0-63为一子波段而64-127为另一子波段。或者我们可使用有50%重叠的三个重叠波段,其中0-63为一波段,32-95为另一波段,而64-127为第三波段。
对于这些子波段的每一个,经扩展波段编码器(350)使用两个参数编码该波段。一个参数(“比例参数”)是在波段中表示全部能量的比例因子。另一参数(“形状参数”,通常以运动向量形式)被用来表示波段内光谱的形状。
如图4流程图所示,经扩展波段编码器(350)对经扩展波段的某个子波段执行过程(400)。首先(在420),经扩展波段编码器(350)计算比例因子。在一实现中,比例因子仅是当前子波段内系数的rms(均方根)值。这通过取所有系数的平均平方值的平方根获得。该平均平方值通过取该子波段中所有系数的平方值的和,再除以系数的数量获得。
然后该经扩展波段编码器(350)确定形状参数。该形状参数常常是指示从已被编码的光谱部分(即用基带编码器编码的基带光谱系数的一部分)复制到光谱的标准化版本上的运动向量。在某些情形中,形状系数可相反指定一标准化随机噪音向量或仅为从来自固定编码簿的光谱形状的向量。从光谱的另一部分复制该形状在音频中是有用的,因为通常在许多音调信号中有许多在光谱中重复的谐波成分。噪音或某些其它固定编码簿的使用允许未在光谱的经基带编码部分中良好呈现的那些成分的低比特率编码。因此,过程(400)提供一种基本上是这些波段的增益形状向量量化编码的编码方法,其中该向量是光谱系数的频率波段,而编码簿取自先前编码器的光谱并也可包括其它固定向量或随机噪音向量。那是由经扩展波段编码器编码的表示为a*X的每个子波段,其中‘a’是比例参数而‘X’是由形状参数表示的向量,并可以是先前经编码光谱系数的标准化版本,来自固定编码簿的向量或随机噪音向量。此外,如果光谱的被复制部分被添加到同一部分的传统编码中,则该添加是剩余编码。如果信号的传统编码给出便于用一些比特编码的基本表示(例如光谱基底的编码),且剩余用新算法编码,则这会是有用的。
更具体地,在动作(430),经扩展波段编码器(350)在具有类似于经扩展波段的当前子波段的形状的基带光谱系数中搜索相同波段的基带光谱系数。该经扩展波段编码器使用与基带每个部分的标准化版本的最小均方比较来确定基带的哪个部分与当前子波段最相似。例如,考虑一情形,其中有由变换(320)从输入块生成的256个光谱系数,经扩展波段的子波段在宽度上每个都有16个光谱系数,而基带编码器将前128个光谱系数(编号为0-127)编码为基带。然后,搜索执行每个经扩展波段中的16个标准化光谱系数与从系数位置0开始直到111的基带(即在此情形中总共有在基带中编码的112个不同的可能光谱形状)的每16个光谱系数部分的标准化版本之间的最小均方比较。具有最低的最小均方值的基带部分被视为在形状上与当前经扩展波段最接近(最相似)。在动作(432),经扩展波段编码器检查基带光谱系数中的最相似波段在形状上是否与当前经扩展波段足够接近(即最小均方值低于预选阈值)。如果是,则经扩展波段编码器在动作(434)确定指向基带光谱系数的最相近匹配波段的运动向量。该运动向量可以是基带中的开始系数位置(例如在该示例中的0-111)。其它方法(诸如检查音调对无音调)也可被用来查看基带光谱系数中的最相似波段在形状上是否与当前经扩展波段足够接近。
如果未发现基带的足够相似部分,则经扩展波段编码器查看光谱形状的固定编码簿来表示当前的子波段。经扩展波段编码器在该固定编码簿中搜索与当前子波段形状相似的波段形状。如果发现,则经扩展波段编码器使用其在编码簿中的索引作为动作(444)上的形状参数。否则,在动作(450),经扩展波段编码器确定将当前子波段的形状表示为标准化的随机噪音向量。
在可选实现中,设置在搜索基带中最佳光谱形状之前经扩展的波段编码器可判定光谱系数是否就可使用噪音来表示。这样,即使在基带中找到一足够接近的光谱形状,经扩展波段编码器将仍然使用随机噪音编码该部分。这在与对应于基带中位置发送运动向量相比较时,可导致较少比特。
在动作(460),经扩展波段编码器使用预测编码、量化和/或熵编码来编码比例和形状参数(即在本实现中的比例因子和运动向量)。例如,在一实现中,比例参数基于紧靠前的经扩展子波段被预测编码(经扩展波段的子波段的比例因子通常在值上是相似的,从而连续子波段通常具有其值相近的比例因子)。换言之,用于经扩展波段的第一子波段的比例因子的全值被编码。随后子波段按其实际值和其预测值的差值被编码(即预测值为前面子波段的比例因子)。对于多通道音频,每个通道中经扩展波段的第一子波段按其全值被编码,且随后的子波段的比例因子从通道中先前子波段的比例因子预测。在可选实现中,比例参数还可在通道上从一个以上其它子波段、从基带光谱、或从先前的音频输入块等预测。
经扩展波段编码器还使用统一或非统一量化来量化比例参数。在一实现中,使用比例参数的非统一量化,其中比例因子的对数被统一量化到128bin。最后的经量化值使用Huffman编码进行熵编码。
对于形状参数,经扩展波段编码器还使用预测编码(可从前面的子波段对比例参数预测)、量化为64bin、以及熵编码(例如用Huffman编码)。
在某些实现中,经扩展波段的子波段在尺寸上可变。在这样的情形中,经扩展波段编码器还编码经扩展波段的配置。
更具体地,在一示例实现中,经扩展波段编码器编码比例和形状参数,如以下代码表格中列出的伪代码所示:
代码表格
for each tile in audio scream
for each channel in tile that may need to be coded{e.g.
subwcoofet may not need to be coded}
I bit to ind:catc if channel is coded or not.
H bits to spccify qoantozed version of version of starting position of
extended bard
′D_confiq′bits to specity coding of band configoration.
for each sub-band to be coded using extended band coder
{
′n_scale′bits for variable length code to specify scale
parameter lenergy in band).
′n_shape′bits for variable length code to specify shape
parameter.
在以上代码列表中,指定波段配置(即波段的数量及其尺寸)的编码取决于要使用经扩展波段编码器编码的光谱系数的数量。使用经扩展波段编码器编码的系数数量可使用经扩展波段的开始位置和光谱系数的总量来发现(使用经扩展波段编码器编码的光谱系数的数量=光谱系数的总量一开始位置)。然后波段配置被编码为所允许的所有可能配置列表的索引。该索引使用具有n_config=log2(配置数量)比特的固定长度代码来编码。所允许的配置是要使用该方法编码的光谱系数数量的函数。例如,如果要编码128个系数,缺省配置为尺寸64的2个波段。其它配置是可能的,例如如下表所列:
用于128个光谱系数的波段配置的列表
0:128
1:64 64
2:64 32 32
3:32 32 64
4:32 32 32 32
因而,在该示例中,有5个可能的波段配置。在这种配置中,用于这些系数的缺省配置被选为具有‘n’个波段。然后,如果允许每个波段划分或合并(仅一层),则有5(n/2)种可能配置,其需要(n/2)log2(5)个比特编码。在其它实现中,可变长度编码可被用来编码该配置。
如上所述,比例因子使用预测编码来编码,其中预测可从来自同一通道内先前波段、来自同一区域先前通道、或来自先前经解码区域的的先前经编码比例因子中获取。对于一给定实现,对预测的选择可通过查看哪个先前波段(在同一经扩展波段、通道或区域(输入块)中)提供最高相互关系来作出。在一实现示例中,波段被如下预测编码:
假设区域中比例因子为[i][j],其中i=通道索引,j=波段索引。
对于i==0&&j==0(第一通道,第一波段),无预测。
对于i!=0&&j==0(其它通道,第一波段),预测为x[0][0](第一通道,第一波段)。
对于i!=0&&j!=0(其它通道,其它波段),预测为x[i][j-1](同一通道,前一波段)。
在以上代码表格中,“形状参数”是指定先前光谱系数位置的运动向量、或来自固定代码簿的向量、或噪音。该先前光谱系数可来自同一通道内、或来自先前通道、或来自先前区域。该形状参数使用预测编码,其中预测从同一通道内的先前波段、或同一区域内的先前通道、或先前区域的先前位置获取。
图5示出用于由音频编码器(300)产生的比特流的音频解码器(500)。在该解码器中,经编码比特流(205)由比特流多路信号分离器(210)(例如基于经编码基带宽度和经扩展波段配置)分离成基带编码流和经扩展波段编码流,它们在基带解码器(540)和经扩展基带解码器(550)中解码。该基带解码器(540)使用基带编解码器的常规解码来解码基带光谱系数。经经扩展波段解码器(550)解码经扩展波段编码流,包括复制由形状参数的运动向量指向的基带光谱系数的一部分,并由比例参数的缩放因子缩放。基带和经扩展波段光谱系数被组合成由逆变换580转换来重建音频信号的单个光谱。
图6示出在图5的经经扩展波段解码器(550)中使用的解码过程(600)。对于经扩展波段编码流中经扩展波段的某个经编码子波段(动作(610)),经经扩展波段解码器解码比例因子(动作(620))和运动向量(动作(630))。然后经经扩展波段解码器复制基带子波段、固定编码簿向量、或由运动向量(形状参数)标识的随机噪音向量。经经扩展波段解码器按照缩放因子缩放被复制的光谱波段以产生经扩展波段的当前子波段的光谱系数。
3.计算环境
图7示出各说明性实施例可在其中实现的适当计算环境(700)。该计算环境(700)并非旨在提出对本发明的使用范围或功能的任何限制因为本发明可在不同通用或专用计算环境中实现。
参照图7,计算环境(700)包括至少一个处理单元(710)和存储器(720)。在图7中,最基本配置(730)被包括在虚线内。处理单元(710)执行计算机可执行指令,并可以是真实或虚拟处理器。在多处理系统中,多个处理单元执行计算机可执行指令以增加处理能力。存储器720可以是易失性的(例如寄存器、高速缓存器RAM)、非易失性的(诸如ROM、EEPROM、闪存等等)、或两者的某些组合。存储器(720)存储实现音频编码器的软件(780)。
计算环境可具有附加特征。例如,计算环境(700)包括存储器(740)、一个或多个输入装置(750)、一个或多个输出装置(760)、以及一个或多个通信连接(770)。诸如总线、控制器或网络的相互连接机制(未示出)使计算机环境(700)的组件相互连接。通常,操作系统软件(未示出)在计算环境(700)中执行的其它软件,提供操作环境并协调计算环境(700)组件的动作。
存储器(740)可以是可移动和/或不可移动的,并包括磁盘、磁带或磁盒、CD-ROM、CD-RW、DVD、或可用来存储信息并可在计算环境(700)内访问的任何其它介质。存储器(740)存储实现音频编码器的软件(780)的指令。
输入装置(750)可以是诸如键盘、鼠标、笔或跟踪球、语音输入装置、扫描仪、或另一向计算环境(700)提供输入的装置。对于音频,输入装置(750)可以是接受模拟或数字形式音频输入的声卡或类似装置。输出装置(760)可以是显示器、打印机、扬声器、或另一提供来自计算环境(700)的输出的装置。
通信连接770使能经通信介质与另一计算实体的通信。通信介质传送诸如计算机可执行指令、经压缩音频或视频信息、或已调制数据信号的信息。已调制数据信号是具有以这种把信息编码到信号中的方式来设置或改变的一个或多个特征的信号。作为示例,而非限制,通信介质包括用电子、光学、RF、红外、声学和其它载体的有线或无线技术。
本发明可在计算机可读介质的一般上下文中描述。计算机可读介质是可在计算环境内访问的任何可用介质。作为示例,而非限制,对于计算环境(700),计算机可读介质包括存储器(720)、存储器(740)、通信介质、以及以上任意组合。
本发明可在计算机可执行指令的一般上下文中描述,诸如包括在程序模块中并在目标真实或虚拟处理器上的计算环境中执行的指令。通常,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、库、对象、类、组件、数据结构等。程序模块的功能在各实施例中可按需在程序模块之间组合或划分。程序模块的计算机可执行指令可在本地或分布式计算环境内执行。
为了呈现,详细说明使用像“确定”、“获取”、“调整”和“应用”的术语来描述计算环境中的计算机操作。这些术语是由计算机这些的操作的高级抽象,且不应与人类执行的动作相混淆。对应于这些术语的实际计算机操作依赖于实现而改变。
由于许多可能实施例都可应用本发明原理,故我们要求可能属于所附权利要求及其等效实体的范围和精神内的所有这类实施例作为我们的发明。
Claims (12)
1.一种音频编码方法,包括:
将输入音频信号块变换成一光谱系数集;
将这些光谱系数分成多个子波段;
在输出比特流中编码所述多个子波段中的至少一个子波段的光谱系数的值;
对于多个其它子波段中的至少一个子波段,将所述输出比特流中该其它子波段编码为被编码成光谱系数值的所述多个子波段中的所述至少一个子波段的一部分的形状的经缩放版本;
对于多个其它子波段中的每一个:
执行一搜索以确定被编码为光谱系数的所述多个子波段中的所述至少一个子波段的多个部分中的哪一个部分在形状上更相似于相应的其它子波段;
确定所确定的部分是否在形状上与所述相应的其它子波段足够相似;
如果是,则将所述相应的其它子波段编码为所确定的部分的形状的经缩放版本;以及
否则,将所述相应的其它子波段编码为固定编码簿中形状的或随机噪音向量的经缩放版本。
2.如权利要求1所述的音频编码方法,其特征在于,对其它子波段编码包括:使用一比例参数和一形状参数来编码所述其它子波段,其中所述形状参数指示出被编码为光谱系数值的所述多个子波段中的所述至少一个子波段的所述一部分,所述比例参数是缩放所指示出的部分的缩放因子。
3.如权利要求2所述的音频编码方法,其特征在于,所述缩放因子表示所述其它子波段的总能量。
4.如权利要求2所述的音频编码方法,其特征在于,所述缩放因子是所述其它子波段内系数的均方根值。
5.如权利要求2所述的音频编码方法,其特征在于,所述形状参数是一运动向量。
6.如权利要求1所述的音频编码方法,其特征在于,执行搜索包括执行与所述多个部分中的每一个部分的标准化版本的最小均方比较。
7.如权利要求1所述的音频编码方法,其特征在于,所述否则编码所述相应的其它子波段包括:
在固定编码簿中表示的形状中执行对在形状上更相似于所述相应的其它子波段的形状的搜索;
如果在固定编码簿中找到这样的相似形状,则将所述相应的其它子波段编码为固定编码簿中这样的相似形状的经缩放版本;以及
否则,将所述相应的其它子波段编码为随机噪音向量的经缩放版本。
8.一种音频编码器,其特征在于,包括:
一变换装置,用于将输入音频信号块变换成一光谱系数集;
一基本编码器,用于在输出比特流中编码所述集的这些光谱系数的基带部分的光谱系数值;以及
一广义感觉相似性编码器,用于将所述集的其它光谱系数的至少一个其它子波段编码为所述基带部分的子部分的经缩放形状,其中,所述广义感觉相似性编码器还包括:
一装置,用于对多个其它子波段的每一个子波段执行一搜索,以确定被编码为光谱系数的所述至少一个子波段的多个部分中的哪一个部分在形状上更相似于相应的其它子波段;
一装置,用于确定所确定的部分是否在形状上与所述相应的其它子波段足够相似;
一装置,用于如果所确定的部分在形状上与所述相应的其它子波段足够相似,则将所述相应的其它子波段编码为所确定的部分的形状的经缩放版本;
一装置,用于如果所确定的部分在形状上与所述相应的其它子波段并不足够相似,则将所述相应的其它子波段编码为固定编码簿中形状的或随机噪音向量的经缩放版本。
9.如权利要求8所述的音频编码器,其特征在于,所述广义感觉相似性编码器产生所述其它子波段的编码,使用一缩放因子参数和一运动向量参数来表示所述子部分的经缩放形状。
10.如权利要求9所述的音频编码器,其特征在于,所述缩放因子参数表示所述其它子波段的总能量。
11.如权利要求9所述的音频编码器,其特征在于,所述缩放因子是所述其它子波段内系数的均方根值。
12.一种数字介质编码方法,其特征在于,包括:
将输入信号块变换成一光谱系数集;
将这些光谱系数分成多个分离或重叠的子波段;
通过一选定的编码过程编码每个子波段,所述编码过程在给定比特率、缓冲器尺寸、以及编码器复杂度约束集时在广义感觉意义上最好地表示所述子波段,其中所述编码过程从以下编码过程中选择:
使用基带编解码器来编码所述子波段;
将所述子波段表示为已编码光谱的一部分的经适当缩放版本;
将所述子波段表示为来自固定编码簿的向量的经适当缩放版本;以及
将所述子波段表示为随机噪音的经适当缩放版本。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US53904604P | 2004-01-23 | 2004-01-23 | |
US60/539,046 | 2004-01-23 | ||
US10/882,801 US7460990B2 (en) | 2004-01-23 | 2004-06-29 | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
US10/882,801 | 2004-06-29 | ||
PCT/US2004/024935 WO2005076260A1 (en) | 2004-01-23 | 2004-07-29 | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1813286A CN1813286A (zh) | 2006-08-02 |
CN1813286B true CN1813286B (zh) | 2010-11-24 |
Family
ID=34798916
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2004800032596A Active CN1813286B (zh) | 2004-01-23 | 2004-07-29 | 音频编码方法、音频编码器以及数字介质编码方法 |
Country Status (8)
Country | Link |
---|---|
US (2) | US7460990B2 (zh) |
EP (1) | EP1730725B1 (zh) |
JP (4) | JP4745986B2 (zh) |
KR (3) | KR101130355B1 (zh) |
CN (1) | CN1813286B (zh) |
AT (1) | ATE451684T1 (zh) |
DE (1) | DE602004024591D1 (zh) |
WO (1) | WO2005076260A1 (zh) |
Families Citing this family (82)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7460993B2 (en) * | 2001-12-14 | 2008-12-02 | Microsoft Corporation | Adaptive window-size selection in transform coding |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US6934677B2 (en) | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
ES2334934T3 (es) * | 2002-09-04 | 2010-03-17 | Microsoft Corporation | Codificacion de entropia por adaptacion de codificacion entre modalidades de nivel y de longitud de sucesion y nivel. |
US7809579B2 (en) * | 2003-12-19 | 2010-10-05 | Telefonaktiebolaget Lm Ericsson (Publ) | Fidelity-optimized variable frame length encoding |
US7460990B2 (en) | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
US7983835B2 (en) | 2004-11-03 | 2011-07-19 | Lagassey Paul J | Modular intelligent transportation system |
TWI231656B (en) * | 2004-04-08 | 2005-04-21 | Univ Nat Chiao Tung | Fast bit allocation algorithm for audio coding |
TWI275074B (en) * | 2004-04-12 | 2007-03-01 | Vivotek Inc | Method for analyzing energy consistency to process data |
US20050232497A1 (en) * | 2004-04-15 | 2005-10-20 | Microsoft Corporation | High-fidelity transcoding |
JP4168976B2 (ja) * | 2004-05-28 | 2008-10-22 | ソニー株式会社 | オーディオ信号符号化装置及び方法 |
EP1769491B1 (en) * | 2004-07-14 | 2009-09-30 | Koninklijke Philips Electronics N.V. | Audio channel conversion |
KR100657916B1 (ko) * | 2004-12-01 | 2006-12-14 | 삼성전자주식회사 | 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법 |
US9626973B2 (en) * | 2005-02-23 | 2017-04-18 | Telefonaktiebolaget L M Ericsson (Publ) | Adaptive bit allocation for multi-channel audio encoding |
EP1851866B1 (en) * | 2005-02-23 | 2011-08-17 | Telefonaktiebolaget LM Ericsson (publ) | Adaptive bit allocation for multi-channel audio encoding |
US7630882B2 (en) * | 2005-07-15 | 2009-12-08 | Microsoft Corporation | Frequency segmentation to obtain bands for efficient coding of digital media |
US7546240B2 (en) * | 2005-07-15 | 2009-06-09 | Microsoft Corporation | Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition |
KR100803205B1 (ko) | 2005-07-15 | 2008-02-14 | 삼성전자주식회사 | 저비트율 오디오 신호 부호화/복호화 방법 및 장치 |
US7562021B2 (en) * | 2005-07-15 | 2009-07-14 | Microsoft Corporation | Modification of codewords in dictionary used for efficient coding of digital media spectral data |
US7953605B2 (en) * | 2005-10-07 | 2011-05-31 | Deepen Sinha | Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension |
US20070118361A1 (en) * | 2005-10-07 | 2007-05-24 | Deepen Sinha | Window apparatus and method |
US7831434B2 (en) * | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
US7953604B2 (en) * | 2006-01-20 | 2011-05-31 | Microsoft Corporation | Shape and scale parameters for extended-band frequency coding |
US8190425B2 (en) * | 2006-01-20 | 2012-05-29 | Microsoft Corporation | Complex cross-correlation parameters for multi-channel audio |
US7966175B2 (en) | 2006-10-18 | 2011-06-21 | Polycom, Inc. | Fast lattice vector quantization |
US7953595B2 (en) | 2006-10-18 | 2011-05-31 | Polycom, Inc. | Dual-transform coding of audio signals |
US20080243518A1 (en) * | 2006-11-16 | 2008-10-02 | Alexey Oraevsky | System And Method For Compressing And Reconstructing Audio Files |
WO2008072670A1 (ja) * | 2006-12-13 | 2008-06-19 | Panasonic Corporation | 符号化装置、復号装置、およびこれらの方法 |
US20100049512A1 (en) * | 2006-12-15 | 2010-02-25 | Panasonic Corporation | Encoding device and encoding method |
JP4871894B2 (ja) * | 2007-03-02 | 2012-02-08 | パナソニック株式会社 | 符号化装置、復号装置、符号化方法および復号方法 |
US7761290B2 (en) | 2007-06-15 | 2010-07-20 | Microsoft Corporation | Flexible frequency and time partitioning in perceptual transform coding of audio |
US8046214B2 (en) | 2007-06-22 | 2011-10-25 | Microsoft Corporation | Low complexity decoder for complex transform coding of multi-channel sound |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
KR101403340B1 (ko) * | 2007-08-02 | 2014-06-09 | 삼성전자주식회사 | 변환 부호화 방법 및 장치 |
US8116936B2 (en) * | 2007-09-25 | 2012-02-14 | General Electric Company | Method and system for efficient data collection and storage |
US8249883B2 (en) | 2007-10-26 | 2012-08-21 | Microsoft Corporation | Channel extension coding for multi-channel source |
US8457958B2 (en) * | 2007-11-09 | 2013-06-04 | Microsoft Corporation | Audio transcoder using encoder-generated side information to transcode to target bit-rate |
US8688441B2 (en) * | 2007-11-29 | 2014-04-01 | Motorola Mobility Llc | Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content |
US8433582B2 (en) * | 2008-02-01 | 2013-04-30 | Motorola Mobility Llc | Method and apparatus for estimating high-band energy in a bandwidth extension system |
US20090201983A1 (en) * | 2008-02-07 | 2009-08-13 | Motorola, Inc. | Method and apparatus for estimating high-band energy in a bandwidth extension system |
US8190440B2 (en) * | 2008-02-29 | 2012-05-29 | Broadcom Corporation | Sub-band codec with native voice activity detection |
US20110035214A1 (en) * | 2008-04-09 | 2011-02-10 | Panasonic Corporation | Encoding device and encoding method |
US8179974B2 (en) | 2008-05-02 | 2012-05-15 | Microsoft Corporation | Multi-level representation of reordered transform coefficients |
US8447591B2 (en) * | 2008-05-30 | 2013-05-21 | Microsoft Corporation | Factorization of overlapping tranforms into two block transforms |
US8666733B2 (en) * | 2008-06-26 | 2014-03-04 | Japan Science And Technology Agency | Audio signal compression and decoding using band division and polynomial approximation |
KR101223835B1 (ko) * | 2008-07-11 | 2013-01-17 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 신호 합성기 및 오디오 신호 인코더 |
US8463412B2 (en) * | 2008-08-21 | 2013-06-11 | Motorola Mobility Llc | Method and apparatus to facilitate determining signal bounding frequencies |
US8406307B2 (en) | 2008-08-22 | 2013-03-26 | Microsoft Corporation | Entropy coding/decoding of hierarchically organized data |
US8396114B2 (en) * | 2009-01-29 | 2013-03-12 | Microsoft Corporation | Multiple bit rate video encoding using variable bit rate and dynamic resolution for adaptive video streaming |
US8311115B2 (en) * | 2009-01-29 | 2012-11-13 | Microsoft Corporation | Video encoding using previously calculated motion information |
US8463599B2 (en) * | 2009-02-04 | 2013-06-11 | Motorola Mobility Llc | Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder |
US20100225473A1 (en) * | 2009-03-05 | 2010-09-09 | Searete Llc, A Limited Liability Corporation Of The State Of Delaware | Postural information system and method |
WO2010111841A1 (zh) * | 2009-04-03 | 2010-10-07 | 华为技术有限公司 | 频域脉冲解码的预测方法和预测装置及解码器 |
US8270473B2 (en) * | 2009-06-12 | 2012-09-18 | Microsoft Corporation | Motion based dynamic resolution multiple bit rate video encoding |
US8700410B2 (en) * | 2009-06-18 | 2014-04-15 | Texas Instruments Incorporated | Method and system for lossless value-location encoding |
KR20110001130A (ko) * | 2009-06-29 | 2011-01-06 | 삼성전자주식회사 | 가중 선형 예측 변환을 이용한 오디오 신호 부호화 및 복호화 장치 및 그 방법 |
WO2011058752A1 (ja) * | 2009-11-12 | 2011-05-19 | パナソニック株式会社 | 符号化装置、復号装置およびこれらの方法 |
WO2011058758A1 (ja) * | 2009-11-13 | 2011-05-19 | パナソニック株式会社 | 符号化装置、復号装置およびこれらの方法 |
JP5507971B2 (ja) | 2009-11-16 | 2014-05-28 | アイシン精機株式会社 | 衝撃吸収具及び車両用バンパ装置 |
US8705616B2 (en) | 2010-06-11 | 2014-04-22 | Microsoft Corporation | Parallel multiple bitrate video encoding to reduce latency and dependences between groups of pictures |
JP5331249B2 (ja) * | 2010-07-05 | 2013-10-30 | 日本電信電話株式会社 | 符号化方法、復号方法、装置、プログラムおよび記録媒体 |
KR101850724B1 (ko) * | 2010-08-24 | 2018-04-23 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
ES2933477T3 (es) | 2010-09-16 | 2023-02-09 | Dolby Int Ab | Transposición armónica basada en bloque de subbanda mejorado de producto cruzado |
US8924200B2 (en) * | 2010-10-15 | 2014-12-30 | Motorola Mobility Llc | Audio signal bandwidth extension in CELP-based speech coder |
JP5719941B2 (ja) * | 2011-02-09 | 2015-05-20 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | オーディオ信号の効率的なエンコーディング/デコーディング |
EP2707874A4 (en) | 2011-05-13 | 2014-12-03 | Samsung Electronics Co Ltd | BIT ASSIGNMENT AND AUDIO CODING AND DECODING |
US9591318B2 (en) * | 2011-09-16 | 2017-03-07 | Microsoft Technology Licensing, Llc | Multi-layer encoding and decoding |
PL397008A1 (pl) * | 2011-11-17 | 2013-05-27 | Politechnika Poznanska | Sposób kodowania obrazu |
US11089343B2 (en) | 2012-01-11 | 2021-08-10 | Microsoft Technology Licensing, Llc | Capability advertisement, configuration and control for video coding and decoding |
WO2013147709A1 (en) * | 2012-03-28 | 2013-10-03 | Agency For Science, Technology And Research | Method for transmitting a digital signal, method for receiving a digital signal, transmission arrangement and communication device |
EP2830059A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Noise filling energy adjustment |
EP2830055A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Context-based entropy coding of sample values of a spectral envelope |
TWI579831B (zh) * | 2013-09-12 | 2017-04-21 | 杜比國際公司 | 用於參數量化的方法、用於量化的參數之解量化方法及其電腦可讀取的媒體、音頻編碼器、音頻解碼器及音頻系統 |
GB2545434B (en) * | 2015-12-15 | 2020-01-08 | Sonic Data Ltd | Improved method, apparatus and system for embedding data within a data stream |
US10146500B2 (en) | 2016-08-31 | 2018-12-04 | Dts, Inc. | Transform-based audio codec and method with subband energy smoothing |
JP6650536B2 (ja) | 2016-12-27 | 2020-02-19 | 三井化学株式会社 | マウスピース |
EP3382700A1 (en) | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for post-processing an audio signal using a transient location detection |
EP3382701A1 (en) | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for post-processing an audio signal using prediction based shaping |
ES2930374T3 (es) | 2017-11-17 | 2022-12-09 | Fraunhofer Ges Forschung | Aparato y método para codificar o decodificar parámetros de codificación de audio direccional utilizando diferentes resoluciones de tiempo/frecuencia |
US10950251B2 (en) | 2018-03-05 | 2021-03-16 | Dts, Inc. | Coding of harmonic signals in transform-based audio codecs |
US10586546B2 (en) | 2018-04-26 | 2020-03-10 | Qualcomm Incorporated | Inversely enumerated pyramid vector quantizers for efficient rate adaptation in audio coding |
US10573331B2 (en) * | 2018-05-01 | 2020-02-25 | Qualcomm Incorporated | Cooperative pyramid vector quantizers for scalable audio coding |
Family Cites Families (240)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3240380A (en) * | 1957-08-07 | 1966-03-15 | Mueller Co | Line stopping and valve inserting apparatus and method |
US3684838A (en) | 1968-06-26 | 1972-08-15 | Kahn Res Lab | Single channel audio signal transmission system |
US4251688A (en) * | 1979-01-15 | 1981-02-17 | Ana Maria Furner | Audio-digital processing system for demultiplexing stereophonic/quadriphonic input audio signals into 4-to-72 output audio signals |
DE3171990D1 (en) | 1981-04-30 | 1985-10-03 | Ibm | Speech coding methods and apparatus for carrying out the method |
JPS5921039B2 (ja) | 1981-11-04 | 1984-05-17 | 日本電信電話株式会社 | 適応予測符号化方式 |
CA1253255A (en) | 1983-05-16 | 1989-04-25 | Nec Corporation | System for simultaneously coding and decoding a plurality of signals |
GB8421498D0 (en) | 1984-08-24 | 1984-09-26 | British Telecomm | Frequency domain speech coding |
US4609686A (en) | 1985-04-19 | 1986-09-02 | The Standard Oil Company | 100 percent solids epoxy, nitrile coating compositions and method of making same |
US4776014A (en) | 1986-09-02 | 1988-10-04 | General Electric Company | Method for pitch-aligned high-frequency regeneration in RELP vocoders |
GB2205465B (en) | 1987-05-13 | 1991-09-04 | Ricoh Kk | Image transmission system |
US4922537A (en) * | 1987-06-02 | 1990-05-01 | Frederiksen & Shu Laboratories, Inc. | Method and apparatus employing audio frequency offset extraction and floating-point conversion for digitally encoding and decoding high-fidelity audio signals |
US4907276A (en) * | 1988-04-05 | 1990-03-06 | The Dsp Group (Israel) Ltd. | Fast search method for vector quantizer communication and pattern recognition systems |
US5222189A (en) * | 1989-01-27 | 1993-06-22 | Dolby Laboratories Licensing Corporation | Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio |
US5752225A (en) * | 1989-01-27 | 1998-05-12 | Dolby Laboratories Licensing Corporation | Method and apparatus for split-band encoding and split-band decoding of audio information using adaptive bit allocation to adjacent subbands |
US5479562A (en) | 1989-01-27 | 1995-12-26 | Dolby Laboratories Licensing Corporation | Method and apparatus for encoding and decoding audio information |
US5142656A (en) | 1989-01-27 | 1992-08-25 | Dolby Laboratories Licensing Corporation | Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio |
US5357594A (en) | 1989-01-27 | 1994-10-18 | Dolby Laboratories Licensing Corporation | Encoding and decoding using specially designed pairs of analysis and synthesis windows |
DE69032624T2 (de) | 1989-01-27 | 1999-03-25 | Dolby Lab Licensing Corp | Formatierung eines kodierten Signals für Kodierer und Dekodierer eines Audiosystems hoher Qualität |
US5297236A (en) * | 1989-01-27 | 1994-03-22 | Dolby Laboratories Licensing Corporation | Low computational-complexity digital filter bank for encoder, decoder, and encoder/decoder |
EP0386418B1 (de) * | 1989-03-06 | 1994-12-21 | Robert Bosch Gmbh | Verfahren zur Datenreduktion bei digitalen Tonsignalen und zur genäherten Rückgewinnung der digitalen Tonsignale |
US5539829A (en) | 1989-06-02 | 1996-07-23 | U.S. Philips Corporation | Subband coded digital transmission system using some composite signals |
US5115240A (en) * | 1989-09-26 | 1992-05-19 | Sony Corporation | Method and apparatus for encoding voice signals divided into a plurality of frequency bands |
JP2921879B2 (ja) | 1989-09-29 | 1999-07-19 | 株式会社東芝 | 画像データ処理装置 |
US5185800A (en) * | 1989-10-13 | 1993-02-09 | Centre National D'etudes Des Telecommunications | Bit allocation device for transformed digital audio broadcasting signals with adaptive quantization based on psychoauditive criterion |
US5040217A (en) | 1989-10-18 | 1991-08-13 | At&T Bell Laboratories | Perceptual coding of audio signals |
JP2560873B2 (ja) * | 1990-02-28 | 1996-12-04 | 日本ビクター株式会社 | 直交変換符号化復号化方法 |
CN1062963C (zh) * | 1990-04-12 | 2001-03-07 | 多尔拜实验特许公司 | 用于产生高质量声音信号的解码器和编码器 |
US5388181A (en) * | 1990-05-29 | 1995-02-07 | Anderson; David J. | Digital audio compression system |
JP3033156B2 (ja) | 1990-08-24 | 2000-04-17 | ソニー株式会社 | ディジタル信号符号化装置 |
SG47586A1 (en) * | 1990-12-21 | 1998-04-17 | British Telecomm | Speech coding |
ATE138238T1 (de) * | 1991-01-08 | 1996-06-15 | Dolby Lab Licensing Corp | Kodierer/dekodierer für mehrdimensionale schallfelder |
US5274740A (en) | 1991-01-08 | 1993-12-28 | Dolby Laboratories Licensing Corporation | Decoder for variable number of channel presentation of multidimensional sound fields |
US5559900A (en) | 1991-03-12 | 1996-09-24 | Lucent Technologies Inc. | Compression of signals for perceptual quality by selecting frequency bands having relatively high energy |
US5870497A (en) * | 1991-03-15 | 1999-02-09 | C-Cube Microsystems | Decoder for compressed video signals |
AU1996292A (en) | 1991-05-17 | 1992-12-30 | Analytic Sciences Corporation, The | Continuous-tone image compression |
GB2257606B (en) * | 1991-06-28 | 1995-01-18 | Sony Corp | Recording and/or reproducing apparatuses and signal processing methods for compressed data |
US5487086A (en) * | 1991-09-13 | 1996-01-23 | Comsat Corporation | Transform vector quantization for adaptive predictive coding |
JP3141450B2 (ja) | 1991-09-30 | 2001-03-05 | ソニー株式会社 | オーディオ信号処理方法 |
EP0551705A3 (en) | 1992-01-15 | 1993-08-18 | Ericsson Ge Mobile Communications Inc. | Method for subbandcoding using synthetic filler signals for non transmitted subbands |
US5369724A (en) | 1992-01-17 | 1994-11-29 | Massachusetts Institute Of Technology | Method and apparatus for encoding, decoding and compression of audio-type data using reference coefficients located within a band of coefficients |
US5285498A (en) * | 1992-03-02 | 1994-02-08 | At&T Bell Laboratories | Method and apparatus for coding audio signals based on perceptual model |
EP0559348A3 (en) * | 1992-03-02 | 1993-11-03 | AT&T Corp. | Rate control loop processor for perceptual encoder/decoder |
FR2688371B1 (fr) * | 1992-03-03 | 1997-05-23 | France Telecom | Procede et systeme de spatialisation artificielle de signaux audio-numeriques. |
DE4209544A1 (de) | 1992-03-24 | 1993-09-30 | Inst Rundfunktechnik Gmbh | Verfahren zum Übertragen oder Speichern digitalisierter, mehrkanaliger Tonsignale |
US5295203A (en) * | 1992-03-26 | 1994-03-15 | General Instrument Corporation | Method and apparatus for vector coding of video transform coefficients |
JP2693893B2 (ja) | 1992-03-30 | 1997-12-24 | 松下電器産業株式会社 | ステレオ音声符号化方法 |
JP2779886B2 (ja) * | 1992-10-05 | 1998-07-23 | 日本電信電話株式会社 | 広帯域音声信号復元方法 |
JP3343965B2 (ja) | 1992-10-31 | 2002-11-11 | ソニー株式会社 | 音声符号化方法及び復号化方法 |
JP3343962B2 (ja) | 1992-11-11 | 2002-11-11 | ソニー株式会社 | 高能率符号化方法及び装置 |
US5455888A (en) | 1992-12-04 | 1995-10-03 | Northern Telecom Limited | Speech bandwidth extension method and apparatus |
JP3186307B2 (ja) | 1993-03-09 | 2001-07-11 | ソニー株式会社 | 圧縮データ記録装置及び方法 |
ES2165370T3 (es) * | 1993-06-22 | 2002-03-16 | Thomson Brandt Gmbh | Metodo para obtener una matriz decodificadora multicanal. |
TW272341B (zh) | 1993-07-16 | 1996-03-11 | Sony Co Ltd | |
US5623577A (en) * | 1993-07-16 | 1997-04-22 | Dolby Laboratories Licensing Corporation | Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions |
US5632003A (en) * | 1993-07-16 | 1997-05-20 | Dolby Laboratories Licensing Corporation | Computationally efficient adaptive bit allocation for coding method and apparatus |
US5581653A (en) | 1993-08-31 | 1996-12-03 | Dolby Laboratories Licensing Corporation | Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder |
US5737720A (en) * | 1993-10-26 | 1998-04-07 | Sony Corporation | Low bit rate multichannel audio coding methods and apparatus using non-linear adaptive bit allocation |
US5684920A (en) | 1994-03-17 | 1997-11-04 | Nippon Telegraph And Telephone | Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein |
DE4409368A1 (de) | 1994-03-18 | 1995-09-21 | Fraunhofer Ges Forschung | Verfahren zum Codieren mehrerer Audiosignale |
JP3277677B2 (ja) | 1994-04-01 | 2002-04-22 | ソニー株式会社 | 信号符号化方法及び装置、信号記録媒体、信号伝送方法、並びに信号復号化方法及び装置 |
US5574824A (en) | 1994-04-11 | 1996-11-12 | The United States Of America As Represented By The Secretary Of The Air Force | Analysis/synthesis-based microphone array speech enhancer with variable signal distortion |
JP3362534B2 (ja) * | 1994-11-18 | 2003-01-07 | ヤマハ株式会社 | ベクトル量子化による符号化復号方式 |
US5635930A (en) | 1994-10-03 | 1997-06-03 | Sony Corporation | Information encoding method and apparatus, information decoding method and apparatus and recording medium |
AU697176B2 (en) | 1994-11-04 | 1998-10-01 | Koninklijke Philips Electronics N.V. | Encoding and decoding of a wideband digital information signal |
US5654702A (en) | 1994-12-16 | 1997-08-05 | National Semiconductor Corp. | Syntax-based arithmetic coding for low bit rate videophone |
US5629780A (en) * | 1994-12-19 | 1997-05-13 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | Image data compression having minimum perceptual error |
JP3189614B2 (ja) * | 1995-03-13 | 2001-07-16 | 松下電器産業株式会社 | 音声帯域拡大装置 |
JP2956548B2 (ja) * | 1995-10-05 | 1999-10-04 | 松下電器産業株式会社 | 音声帯域拡大装置 |
US6041295A (en) * | 1995-04-10 | 2000-03-21 | Corporate Computer Systems | Comparing CODEC input/output to adjust psycho-acoustic parameters |
US6940840B2 (en) | 1995-06-30 | 2005-09-06 | Interdigital Technology Corporation | Apparatus for adaptive reverse power control for spread-spectrum communications |
ZA965340B (en) * | 1995-06-30 | 1997-01-27 | Interdigital Tech Corp | Code division multiple access (cdma) communication system |
US5790759A (en) | 1995-09-19 | 1998-08-04 | Lucent Technologies Inc. | Perceptual noise masking measure based on synthesis filter frequency response |
US5960390A (en) | 1995-10-05 | 1999-09-28 | Sony Corporation | Coding method for using multi channel audio signals |
DE19549621B4 (de) | 1995-10-06 | 2004-07-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung zum Codieren von Audiosignalen |
US5819215A (en) * | 1995-10-13 | 1998-10-06 | Dobson; Kurt | Method and apparatus for wavelet based data compression having adaptive bit rate control for compression of digital audio or other sensory data |
US5777678A (en) | 1995-10-26 | 1998-07-07 | Sony Corporation | Predictive sub-band video coding and decoding using motion compensation |
US5956674A (en) | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
US5686964A (en) | 1995-12-04 | 1997-11-11 | Tabatabai; Ali | Bit rate control mechanism for digital image and video data compression |
WO1997029549A1 (fr) | 1996-02-08 | 1997-08-14 | Matsushita Electric Industrial Co., Ltd. | Codeur, decodeur, codeur-decodeur et support d'enregistrement de signal audio large bande |
US5852806A (en) | 1996-03-19 | 1998-12-22 | Lucent Technologies Inc. | Switched filterbank for use in audio signal coding |
US5682152A (en) | 1996-03-19 | 1997-10-28 | Johnson-Grace Company | Data compression using adaptive bit allocation and hybrid lossless entropy encoding |
US5812971A (en) | 1996-03-22 | 1998-09-22 | Lucent Technologies Inc. | Enhanced joint stereo coding method using temporal envelope shaping |
SE506341C2 (sv) | 1996-04-10 | 1997-12-08 | Ericsson Telefon Ab L M | Metod och anordning för rekonstruktion av en mottagen talsignal |
US5822370A (en) | 1996-04-16 | 1998-10-13 | Aura Systems, Inc. | Compression/decompression for preservation of high fidelity speech quality at low bandwidth |
DE19628293C1 (de) | 1996-07-12 | 1997-12-11 | Fraunhofer Ges Forschung | Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion |
DE19628292B4 (de) | 1996-07-12 | 2007-08-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren zum Codieren und Decodieren von Stereoaudiospektralwerten |
US6697491B1 (en) | 1996-07-19 | 2004-02-24 | Harman International Industries, Incorporated | 5-2-5 matrix encoder and decoder system |
US5870480A (en) * | 1996-07-19 | 1999-02-09 | Lexicon | Multichannel active matrix encoder and decoder with maximum lateral separation |
US5969750A (en) | 1996-09-04 | 1999-10-19 | Winbcnd Electronics Corporation | Moving picture camera with universal serial bus interface |
US5745275A (en) * | 1996-10-15 | 1998-04-28 | Lucent Technologies Inc. | Multi-channel stabilization of a multi-channel transmitter through correlation feedback |
SG54379A1 (en) * | 1996-10-24 | 1998-11-16 | Sgs Thomson Microelectronics A | Audio decoder with an adaptive frequency domain downmixer |
US5886276A (en) * | 1997-01-16 | 1999-03-23 | The Board Of Trustees Of The Leland Stanford Junior University | System and method for multiresolution scalable audio signal encoding |
FI970266A (fi) * | 1997-01-22 | 1998-07-23 | Nokia Telecommunications Oy | Menetelmä solukkoradiojärjestelmän ohjauskanavien kantaman pidentämiseksi ja solukkoradiojärjestelmä |
EP1397006B1 (en) | 1997-02-08 | 2009-07-22 | Panasonic Corporation | Quantization matrix for still and moving picture coding |
US20010017941A1 (en) | 1997-03-14 | 2001-08-30 | Navin Chaddha | Method and apparatus for table-based compression with embedded coding |
KR100265112B1 (ko) | 1997-03-31 | 2000-10-02 | 윤종용 | 디브이디 디스크와 디브이디 디스크를 재생하는 장치 및 방법 |
US6064954A (en) * | 1997-04-03 | 2000-05-16 | International Business Machines Corp. | Digital audio signal coding |
JP3887827B2 (ja) | 1997-04-10 | 2007-02-28 | ソニー株式会社 | 符号化方法及び装置、復号化方法及び装置、並びに記録媒体 |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
DE19730129C2 (de) | 1997-07-14 | 2002-03-07 | Fraunhofer Ges Forschung | Verfahren zum Signalisieren einer Rauschsubstitution beim Codieren eines Audiosignals |
DE19730130C2 (de) | 1997-07-14 | 2002-02-28 | Fraunhofer Ges Forschung | Verfahren zum Codieren eines Audiosignals |
US5890125A (en) * | 1997-07-16 | 1999-03-30 | Dolby Laboratories Licensing Corporation | Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method |
WO1999014983A1 (en) * | 1997-09-16 | 1999-03-25 | Lake Dsp Pty. Limited | Utilisation of filtering effects in stereo headphone devices to enhance spatialization of source around a listener |
JPH11122120A (ja) * | 1997-10-17 | 1999-04-30 | Sony Corp | 符号化方法及び装置、並びに復号化方法及び装置 |
US6959220B1 (en) | 1997-11-07 | 2005-10-25 | Microsoft Corporation | Digital audio signal filtering mechanism and method |
US6253185B1 (en) | 1998-02-25 | 2001-06-26 | Lucent Technologies Inc. | Multiple description transform coding of audio using optimal transforms of arbitrary dimension |
US6249614B1 (en) | 1998-03-06 | 2001-06-19 | Alaris, Inc. | Video compression and decompression using dynamic quantization and/or encoding |
US6353807B1 (en) * | 1998-05-15 | 2002-03-05 | Sony Corporation | Information coding method and apparatus, code transform method and apparatus, code transform control method and apparatus, information recording method and apparatus, and program providing medium |
US6029126A (en) | 1998-06-30 | 2000-02-22 | Microsoft Corporation | Scalable audio coder and decoder |
US6115689A (en) | 1998-05-27 | 2000-09-05 | Microsoft Corporation | Scalable audio coder and decoder |
JP3998330B2 (ja) * | 1998-06-08 | 2007-10-24 | 沖電気工業株式会社 | 符号化装置 |
US6266003B1 (en) | 1998-08-28 | 2001-07-24 | Sigma Audio Research Limited | Method and apparatus for signal processing for time-scale and/or pitch modification of audio signals |
DE19840835C2 (de) | 1998-09-07 | 2003-01-09 | Fraunhofer Ges Forschung | Vorrichtung und Verfahren zum Entropiecodieren von Informationswörtern und Vorrichtung und Verfahren zum Decodieren von Entropie-codierten Informationswörtern |
US7272556B1 (en) * | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
SE519552C2 (sv) | 1998-09-30 | 2003-03-11 | Ericsson Telefon Ab L M | Flerkanalig signalkodning och -avkodning |
CA2252170A1 (en) | 1998-10-27 | 2000-04-27 | Bruno Bessette | A method and device for high quality coding of wideband speech and audio signals |
SE9903553D0 (sv) * | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
US6498865B1 (en) | 1999-02-11 | 2002-12-24 | Packetvideo Corp,. | Method and device for control and compatible delivery of digitally compressed visual data in a heterogeneous communication network |
US6778709B1 (en) | 1999-03-12 | 2004-08-17 | Hewlett-Packard Development Company, L.P. | Embedded block coding with optimized truncation |
CA2859333A1 (en) * | 1999-04-07 | 2000-10-12 | Dolby Laboratories Licensing Corporation | Matrix improvements to lossless encoding and decoding |
US6952774B1 (en) * | 1999-05-22 | 2005-10-04 | Microsoft Corporation | Audio watermarking with dual watermarks |
US6370502B1 (en) * | 1999-05-27 | 2002-04-09 | America Online, Inc. | Method and system for reduction of quantization-induced block-discontinuities and general purpose audio codec |
US6226616B1 (en) | 1999-06-21 | 2001-05-01 | Digital Theater Systems, Inc. | Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility |
US6658162B1 (en) | 1999-06-26 | 2003-12-02 | Sharp Laboratories Of America | Image coding method using visual optimization |
US6604070B1 (en) * | 1999-09-22 | 2003-08-05 | Conexant Systems, Inc. | System of encoding and decoding speech signals |
US6418405B1 (en) | 1999-09-30 | 2002-07-09 | Motorola, Inc. | Method and apparatus for dynamic segmentation of a low bit rate digital voice message |
US6496798B1 (en) | 1999-09-30 | 2002-12-17 | Motorola, Inc. | Method and apparatus for encoding and decoding frames of voice model parameters into a low bit rate digital voice message |
US6836761B1 (en) | 1999-10-21 | 2004-12-28 | Yamaha Corporation | Voice converter for assimilation by frame synthesis with temporal alignment |
FI19992351A (fi) | 1999-10-29 | 2001-04-30 | Nokia Mobile Phones Ltd | Puheentunnistus |
US7096240B1 (en) | 1999-10-30 | 2006-08-22 | Stmicroelectronics Asia Pacific Pte Ltd. | Channel coupling for an AC-3 encoder |
US6738074B2 (en) * | 1999-12-29 | 2004-05-18 | Texas Instruments Incorporated | Image compression system and method |
US6499010B1 (en) | 2000-01-04 | 2002-12-24 | Agere Systems Inc. | Perceptual audio coder bit allocation scheme providing improved perceptual quality consistency |
US6704711B2 (en) * | 2000-01-28 | 2004-03-09 | Telefonaktiebolaget Lm Ericsson (Publ) | System and method for modifying speech signals |
US6434190B1 (en) | 2000-02-10 | 2002-08-13 | Texas Instruments Incorporated | Generalized precoder for the upstream voiceband modem channel |
AU2001262748A1 (en) | 2000-06-14 | 2001-12-24 | Kabushiki Kaisha Kenwood | Frequency interpolating device and frequency interpolating method |
JP3538122B2 (ja) * | 2000-06-14 | 2004-06-14 | 株式会社ケンウッド | 周波数補間装置、周波数補間方法及び記録媒体 |
US6601032B1 (en) | 2000-06-14 | 2003-07-29 | Intervideo, Inc. | Fast code length search method for MPEG audio encoding |
JP3576942B2 (ja) | 2000-08-29 | 2004-10-13 | 株式会社ケンウッド | 周波数補間システム、周波数補間装置、周波数補間方法及び記録媒体 |
EP1175030B1 (en) | 2000-07-07 | 2008-02-20 | Nokia Siemens Networks Oy | Method and system for multichannel perceptual audio coding using the cascaded discrete cosine transform or modified discrete cosine transform |
US6771723B1 (en) | 2000-07-14 | 2004-08-03 | Dennis W. Davis | Normalized parametric adaptive matched filter receiver |
JP3576936B2 (ja) * | 2000-07-21 | 2004-10-13 | 株式会社ケンウッド | 周波数補間装置、周波数補間方法及び記録媒体 |
DE10041512B4 (de) * | 2000-08-24 | 2005-05-04 | Infineon Technologies Ag | Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen |
US6760698B2 (en) | 2000-09-15 | 2004-07-06 | Mindspeed Technologies Inc. | System for coding speech information using an adaptive codebook with enhanced variable resolution scheme |
US7003467B1 (en) * | 2000-10-06 | 2006-02-21 | Digital Theater Systems, Inc. | Method of decoding two-channel matrix encoded audio to reconstruct multichannel audio |
JP3881836B2 (ja) * | 2000-10-24 | 2007-02-14 | 株式会社ケンウッド | 周波数補間装置、周波数補間方法及び記録媒体 |
SE0004187D0 (sv) * | 2000-11-15 | 2000-11-15 | Coding Technologies Sweden Ab | Enhancing the performance of coding systems that use high frequency reconstruction methods |
US6463408B1 (en) | 2000-11-22 | 2002-10-08 | Ericsson, Inc. | Systems and methods for improving power spectral estimation of speech signals |
US7177808B2 (en) * | 2000-11-29 | 2007-02-13 | The United States Of America As Represented By The Secretary Of The Air Force | Method for improving speaker identification by determining usable speech |
JP3887531B2 (ja) * | 2000-12-07 | 2007-02-28 | 株式会社ケンウッド | 信号補間装置、信号補間方法及び記録媒体 |
KR100433516B1 (ko) * | 2000-12-08 | 2004-05-31 | 삼성전자주식회사 | 트랜스코딩 방법 |
WO2002052896A2 (en) * | 2000-12-22 | 2002-07-04 | Koninklijke Philips Electronics N.V. | Multi-channel audio converter |
US7062445B2 (en) | 2001-01-26 | 2006-06-13 | Microsoft Corporation | Quantization loop with heuristic approach |
JP3468464B2 (ja) | 2001-02-01 | 2003-11-17 | 理化学研究所 | 形状と物性を統合したボリュームデータ生成方法 |
EP1231793A1 (en) * | 2001-02-09 | 2002-08-14 | STMicroelectronics S.r.l. | A process for changing the syntax, resolution and bitrate of MPEG bitstreams, a system and a computer program product therefor |
GB0103245D0 (en) | 2001-02-09 | 2001-03-28 | Radioscape Ltd | Method of inserting additional data into a compressed signal |
GB0108080D0 (en) | 2001-03-30 | 2001-05-23 | Univ Bath | Audio compression |
SE522553C2 (sv) * | 2001-04-23 | 2004-02-17 | Ericsson Telefon Ab L M | Bandbreddsutsträckning av akustiska signaler |
CN1312662C (zh) | 2001-05-10 | 2007-04-25 | 杜比实验室特许公司 | 通过降低前噪声改善音频编码系统的瞬时性能的方法 |
JP4506039B2 (ja) | 2001-06-15 | 2010-07-21 | ソニー株式会社 | 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム |
US7174135B2 (en) * | 2001-06-28 | 2007-02-06 | Koninklijke Philips Electronics N. V. | Wideband signal transmission system |
WO2003003345A1 (fr) * | 2001-06-29 | 2003-01-09 | Kabushiki Kaisha Kenwood | Dispositif et procede d'interpolation des composantes de frequence d'un signal |
JP3984468B2 (ja) | 2001-12-14 | 2007-10-03 | 松下電器産業株式会社 | 符号化装置、復号化装置及び符号化方法 |
JP3926726B2 (ja) * | 2001-11-14 | 2007-06-06 | 松下電器産業株式会社 | 符号化装置および復号化装置 |
EP1444688B1 (en) | 2001-11-14 | 2006-08-16 | Matsushita Electric Industrial Co., Ltd. | Encoding device and decoding device |
WO2003044775A1 (en) | 2001-11-23 | 2003-05-30 | Koninklijke Philips Electronics N.V. | Perceptual noise substitution |
US7460993B2 (en) | 2001-12-14 | 2008-12-02 | Microsoft Corporation | Adaptive window-size selection in transform coding |
US6934677B2 (en) | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US7027982B2 (en) | 2001-12-14 | 2006-04-11 | Microsoft Corporation | Quality and rate control strategy for digital audio |
US7146313B2 (en) | 2001-12-14 | 2006-12-05 | Microsoft Corporation | Techniques for measurement of perceptual audio quality |
US7240001B2 (en) | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
JP4272897B2 (ja) | 2002-01-30 | 2009-06-03 | パナソニック株式会社 | 符号化装置、復号化装置およびその方法 |
US7110941B2 (en) | 2002-03-28 | 2006-09-19 | Microsoft Corporation | System and method for embedded audio coding with implicit auditory masking |
US7310598B1 (en) | 2002-04-12 | 2007-12-18 | University Of Central Florida Research Foundation, Inc. | Energy based split vector quantizer employing signal representation in multiple transform domains |
US7158539B2 (en) | 2002-04-16 | 2007-01-02 | Microsoft Corporation | Error resilient windows media audio coding |
JP2003316394A (ja) | 2002-04-23 | 2003-11-07 | Nec Corp | 音声復号システム、及び、音声復号方法、並びに、音声復号プログラム |
US7447631B2 (en) | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
US7072726B2 (en) | 2002-06-19 | 2006-07-04 | Microsoft Corporation | Converting M channels of digital audio data into N channels of digital audio data |
US7308232B2 (en) | 2002-06-21 | 2007-12-11 | Lucent Technologies Inc. | Method and apparatus for estimating a channel based on channel statistics |
BRPI0305434B1 (pt) | 2002-07-12 | 2017-06-27 | Koninklijke Philips Electronics N.V. | Methods and arrangements for encoding and decoding a multichannel audio signal, and multichannel audio coded signal |
US7542896B2 (en) | 2002-07-16 | 2009-06-02 | Koninklijke Philips Electronics N.V. | Audio coding/decoding with spatial parameters and non-uniform segmentation for transients |
US7043423B2 (en) * | 2002-07-16 | 2006-05-09 | Dolby Laboratories Licensing Corporation | Low bit-rate audio coding systems and methods that use expanding quantizers with arithmetic coding |
WO2004013841A1 (en) | 2002-08-01 | 2004-02-12 | Matsushita Electric Industrial Co., Ltd. | Audio decoding apparatus and audio decoding method based on spectral band repliction |
US7146315B2 (en) | 2002-08-30 | 2006-12-05 | Siemens Corporate Research, Inc. | Multichannel voice detection in adverse environments |
US7299190B2 (en) * | 2002-09-04 | 2007-11-20 | Microsoft Corporation | Quantization and inverse quantization for audio |
US7502743B2 (en) * | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
JP3646939B1 (ja) | 2002-09-19 | 2005-05-11 | 松下電器産業株式会社 | オーディオ復号装置およびオーディオ復号方法 |
US20060106597A1 (en) * | 2002-09-24 | 2006-05-18 | Yaakov Stein | System and method for low bit-rate compression of combined speech and music |
US7330812B2 (en) * | 2002-10-04 | 2008-02-12 | National Research Council Of Canada | Method and apparatus for transmitting an audio stream having additional payload in a hidden sub-channel |
US7243064B2 (en) * | 2002-11-14 | 2007-07-10 | Verizon Business Global Llc | Signal processing of multi-channel data |
JP2004198485A (ja) | 2002-12-16 | 2004-07-15 | Victor Co Of Japan Ltd | 音響符号化信号復号化装置及び音響符号化信号復号化プログラム |
KR100908117B1 (ko) | 2002-12-16 | 2009-07-16 | 삼성전자주식회사 | 비트율 조절가능한 오디오 부호화 방법, 복호화 방법,부호화 장치 및 복호화 장치 |
US6965859B2 (en) | 2003-02-28 | 2005-11-15 | Xvd Corporation | Method and apparatus for audio compression |
SG135920A1 (en) | 2003-03-07 | 2007-10-29 | St Microelectronics Asia | Device and process for use in encoding audio data |
PL1618763T3 (pl) * | 2003-04-17 | 2007-07-31 | Koninl Philips Electronics Nv | Synteza sygnału audio |
WO2004098105A1 (en) | 2003-04-30 | 2004-11-11 | Nokia Corporation | Support of a multichannel audio extension |
US7318035B2 (en) * | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
US7548852B2 (en) | 2003-06-30 | 2009-06-16 | Koninklijke Philips Electronics N.V. | Quality of decoded audio by adding noise |
WO2005031704A1 (en) * | 2003-09-29 | 2005-04-07 | Koninklijke Philips Electronics N.V. | Encoding audio signals |
US7447317B2 (en) * | 2003-10-02 | 2008-11-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V | Compatible multi-channel coding/decoding by weighting the downmix channel |
ATE471557T1 (de) * | 2003-10-23 | 2010-07-15 | Panasonic Corp | Spektrum-codierungseinrichtung, spektrum- decodierungseinrichtung, übertragungseinrichtung für akustische signale, empfangseinrichtung für akustische signale und verfahren dafür |
US7519538B2 (en) * | 2003-10-30 | 2009-04-14 | Koninklijke Philips Electronics N.V. | Audio signal encoding or decoding |
US7809579B2 (en) | 2003-12-19 | 2010-10-05 | Telefonaktiebolaget Lm Ericsson (Publ) | Fidelity-optimized variable frame length encoding |
US7394903B2 (en) | 2004-01-20 | 2008-07-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal |
US7460990B2 (en) | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
EP2065885B1 (en) | 2004-03-01 | 2010-07-28 | Dolby Laboratories Licensing Corporation | Multichannel audio decoding |
US7805313B2 (en) | 2004-03-04 | 2010-09-28 | Agere Systems Inc. | Frequency-based coding of channels in parametric multi-channel coding systems |
BRPI0509113B8 (pt) | 2004-04-05 | 2018-10-30 | Koninklijke Philips Nv | codificador de multicanal, método para codificar sinais de entrada, conteúdo de dados codificados, portador de dados, e, decodificador operável para decodificar dados de saída codificados |
FI119533B (fi) | 2004-04-15 | 2008-12-15 | Nokia Corp | Audiosignaalien koodaus |
SE0400997D0 (sv) | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Efficient coding of multi-channel audio |
EP1749296B1 (en) | 2004-05-28 | 2010-07-14 | Nokia Corporation | Multichannel audio extension |
KR100634506B1 (ko) * | 2004-06-25 | 2006-10-16 | 삼성전자주식회사 | 저비트율 부호화/복호화 방법 및 장치 |
US7352858B2 (en) | 2004-06-30 | 2008-04-01 | Microsoft Corporation | Multi-channel echo cancellation with round robin regularization |
KR100773539B1 (ko) * | 2004-07-14 | 2007-11-05 | 삼성전자주식회사 | 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치 |
US20060025991A1 (en) * | 2004-07-23 | 2006-02-02 | Lg Electronics Inc. | Voice coding apparatus and method using PLP in mobile communications terminal |
CN101010725A (zh) | 2004-08-26 | 2007-08-01 | 松下电器产业株式会社 | 多信道信号编码装置以及多信道信号解码装置 |
US7630902B2 (en) * | 2004-09-17 | 2009-12-08 | Digital Rise Technology Co., Ltd. | Apparatus and methods for digital audio coding using codebook application ranges |
ATE429698T1 (de) * | 2004-09-17 | 2009-05-15 | Harman Becker Automotive Sys | Bandbreitenerweiterung von bandbegrenzten tonsignalen |
SE0402652D0 (sv) | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Methods for improved performance of prediction based multi- channel reconstruction |
US7508863B2 (en) | 2004-12-13 | 2009-03-24 | Alcatel-Lucent Usa Inc. | Method of processing multi-path signals |
US20060259303A1 (en) | 2005-05-12 | 2006-11-16 | Raimo Bakis | Systems and methods for pitch smoothing for text-to-speech synthesis |
US7548853B2 (en) * | 2005-06-17 | 2009-06-16 | Shmunk Dmitry V | Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding |
US7562021B2 (en) | 2005-07-15 | 2009-07-14 | Microsoft Corporation | Modification of codewords in dictionary used for efficient coding of digital media spectral data |
US7684981B2 (en) * | 2005-07-15 | 2010-03-23 | Microsoft Corporation | Prediction of spectral coefficients in waveform coding and decoding |
US7693709B2 (en) * | 2005-07-15 | 2010-04-06 | Microsoft Corporation | Reordering coefficients for waveform coding or decoding |
US7630882B2 (en) | 2005-07-15 | 2009-12-08 | Microsoft Corporation | Frequency segmentation to obtain bands for efficient coding of digital media |
US7539612B2 (en) * | 2005-07-15 | 2009-05-26 | Microsoft Corporation | Coding and decoding scale factor information |
WO2007043808A1 (en) * | 2005-10-12 | 2007-04-19 | Samsung Electronics Co., Ltd. | Method and apparatus for processing/transmitting bit-stream, and method and apparatus for receiving/processing bit-stream |
US20070094035A1 (en) * | 2005-10-21 | 2007-04-26 | Nokia Corporation | Audio coding |
US20070168197A1 (en) | 2006-01-18 | 2007-07-19 | Nokia Corporation | Audio coding |
US7953604B2 (en) | 2006-01-20 | 2011-05-31 | Microsoft Corporation | Shape and scale parameters for extended-band frequency coding |
US8190425B2 (en) | 2006-01-20 | 2012-05-29 | Microsoft Corporation | Complex cross-correlation parameters for multi-channel audio |
US7831434B2 (en) | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
DE602006002381D1 (de) * | 2006-04-24 | 2008-10-02 | Nero Ag | Erweiterte vorrichtung zur kodierung digitaler audiodaten |
US8379868B2 (en) | 2006-05-17 | 2013-02-19 | Creative Technology Ltd | Spatial audio coding based on universal spatial cues |
US8135047B2 (en) * | 2006-07-31 | 2012-03-13 | Qualcomm Incorporated | Systems and methods for including an identifier with a packet associated with a speech signal |
US7774205B2 (en) | 2007-06-15 | 2010-08-10 | Microsoft Corporation | Coding of sparse digital media spectral data |
US7761290B2 (en) | 2007-06-15 | 2010-07-20 | Microsoft Corporation | Flexible frequency and time partitioning in perceptual transform coding of audio |
US8046214B2 (en) | 2007-06-22 | 2011-10-25 | Microsoft Corporation | Low complexity decoder for complex transform coding of multi-channel sound |
US7885819B2 (en) * | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
US8249883B2 (en) * | 2007-10-26 | 2012-08-21 | Microsoft Corporation | Channel extension coding for multi-channel source |
-
2004
- 2004-06-29 US US10/882,801 patent/US7460990B2/en active Active
- 2004-07-29 KR KR1020117007873A patent/KR101130355B1/ko active IP Right Grant
- 2004-07-29 WO PCT/US2004/024935 patent/WO2005076260A1/en not_active Application Discontinuation
- 2004-07-29 JP JP2006551037A patent/JP4745986B2/ja active Active
- 2004-07-29 DE DE602004024591T patent/DE602004024591D1/de active Active
- 2004-07-29 AT AT04779866T patent/ATE451684T1/de not_active IP Right Cessation
- 2004-07-29 KR KR1020117018144A patent/KR101251813B1/ko active IP Right Grant
- 2004-07-29 EP EP04779866A patent/EP1730725B1/en active Active
- 2004-07-29 CN CN2004800032596A patent/CN1813286B/zh active Active
- 2004-07-29 KR KR1020057011786A patent/KR101083572B1/ko active IP Right Grant
-
2008
- 2008-11-26 US US12/324,689 patent/US8645127B2/en active Active
-
2011
- 2011-03-22 JP JP2011063064A patent/JP2011186479A/ja not_active Withdrawn
-
2014
- 2014-07-16 JP JP2014145907A patent/JP2014240963A/ja not_active Ceased
-
2016
- 2016-09-02 JP JP2016171531A patent/JP6262820B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2011186479A (ja) | 2011-09-22 |
KR20110093953A (ko) | 2011-08-18 |
CN1813286A (zh) | 2006-08-02 |
JP2014240963A (ja) | 2014-12-25 |
US8645127B2 (en) | 2014-02-04 |
KR101130355B1 (ko) | 2012-03-27 |
US20050165611A1 (en) | 2005-07-28 |
EP1730725A4 (en) | 2007-05-30 |
KR20060121655A (ko) | 2006-11-29 |
JP2017037311A (ja) | 2017-02-16 |
US7460990B2 (en) | 2008-12-02 |
ATE451684T1 (de) | 2009-12-15 |
US20090083046A1 (en) | 2009-03-26 |
KR101083572B1 (ko) | 2011-11-14 |
JP6262820B2 (ja) | 2018-01-17 |
KR101251813B1 (ko) | 2013-04-09 |
DE602004024591D1 (de) | 2010-01-21 |
WO2005076260A1 (en) | 2005-08-18 |
KR20110042137A (ko) | 2011-04-22 |
EP1730725A1 (en) | 2006-12-13 |
JP2007532934A (ja) | 2007-11-15 |
JP4745986B2 (ja) | 2011-08-10 |
EP1730725B1 (en) | 2009-12-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1813286B (zh) | 音频编码方法、音频编码器以及数字介质编码方法 | |
CN101223582B (zh) | 一种音频编码方法、音频解码方法及音频编码器 | |
CN101223570B (zh) | 获得用于数字媒体的高效编码的频带的频率分段 | |
CN103065637B (zh) | 音频编码器和解码器 | |
CN101484937B (zh) | 使用缓冲器调节对已预测编码的数据进行解码 | |
KR101238239B1 (ko) | 인코더 | |
CN102047564B (zh) | 将重叠变换因式分解成两个块变换 | |
CN101371296B (zh) | 用于编码和解码信号的设备和方法 | |
CN101496098A (zh) | 用于以与音频信号相关联的帧修改窗口的系统及方法 | |
WO2015146860A1 (ja) | 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム | |
JPWO2005064594A1 (ja) | 音声・楽音符号化装置及び音声・楽音符号化方法 | |
KR101387808B1 (ko) | 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치 | |
US20120123788A1 (en) | Coding method, decoding method, and device and program using the methods | |
CN101308657A (zh) | 一种基于先进音频编码器的码流合成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
ASS | Succession or assignment of patent right |
Owner name: MICROSOFT TECHNOLOGY LICENSING LLC Free format text: FORMER OWNER: MICROSOFT CORP. Effective date: 20150421 |
|
C41 | Transfer of patent application or patent right or utility model | ||
TR01 | Transfer of patent right |
Effective date of registration: 20150421 Address after: Washington State Patentee after: Micro soft technique license Co., Ltd Address before: Washington State Patentee before: Microsoft Corp. |