CN1813286B - 音频编码方法、音频编码器以及数字介质编码方法 - Google Patents

音频编码方法、音频编码器以及数字介质编码方法 Download PDF

Info

Publication number
CN1813286B
CN1813286B CN2004800032596A CN200480003259A CN1813286B CN 1813286 B CN1813286 B CN 1813286B CN 2004800032596 A CN2004800032596 A CN 2004800032596A CN 200480003259 A CN200480003259 A CN 200480003259A CN 1813286 B CN1813286 B CN 1813286B
Authority
CN
China
Prior art keywords
sub
band
audio
shape
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2004800032596A
Other languages
English (en)
Other versions
CN1813286A (zh
Inventor
S·梅罗特拉
W·-G·陈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Technology Licensing LLC
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN1813286A publication Critical patent/CN1813286A/zh
Application granted granted Critical
Publication of CN1813286B publication Critical patent/CN1813286B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/035Scalar quantisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Lubricants (AREA)

Abstract

传统的音频编码器可通过编码比全部光谱系数少的系数来保持编码比特率,这可产生重建中的模糊低通声音。使用广义感觉相似性的音频编码器通过编码表示为已编码光谱的经缩放版本的被略去光谱系数的感觉相似版本来改进质量。被略去的光谱系数被分成众多子波段。子波段被编码为两个参数:可表示波段中能量的比例参数;以及可表示波段形状的形状参数。该形状参数可以是指向已编码光谱一部分的运动向量、固定编码簿中光谱形状的索引、或随机噪音向量的形式。因而该编码有效地表示了在解码时要复制的光谱的相似成形部分的经缩放版本。

Description

音频编码方法、音频编码器以及数字介质编码方法
技术领域
本发明一般涉及基于广义感觉相似性编码和解码的数字介质(例如音频、视频、静态图像等)。
背景技术
音频编码使用开发人类听觉的各种感觉模型的编码技术。例如,强音调附近的许多较弱音调被屏蔽从而它们不必进行编码。在传统的感觉音频编码中,这被开发为不同频率数据的适应性量化。重要的感觉频率数据被分配给更多比特从而有较细量化,反之亦然。参见例如Painter T.和SpaniasA.在Proceedings of the IEEE(IEEE学报)88卷第4期2000年4月第451-515页的“Perceptual Coding of Digital Audio”(“数字音频的感觉编码”)。
然而,感觉编码可具有更广泛意义。例如,光谱的某些部分可用适当成形的噪音来编码。参见Schelz D.在Journal of the AES(AES期刊)44卷第7/8期1996年7月/8月第593-598页的“Improving Audio Codecs by Noise Substitution”(“通过噪音置换改进音频编解码器”)。当采取该方法时,经编码信号不以呈现原来的准确或近准确版本为目标。相反,目标是使它与原来版本相比听起来相似并愉悦。
所有这些感觉效果可被用来减少编码音频信号所需的比特率。这是因为某些频率成分并不需要像在原来信号中一样地准确呈现,而可用某些给予与原来相同感觉效果的东西来编码或替换。
发明内容
在此所述的数字介质(例如音频、视频、静态图像等)编码/解码技术利用某些频率成分可使用成形噪音、或其它频率成分的成形版本、或两者的组合来在感觉上良好或部分呈现。更具体地,某些频率波段可在感觉上被良好呈现为已被编码的其它波段的成形版本。即使实际光谱可能偏离该综合版本,它仍然是可被用来不降低质量而大大降低音频信号编码的比特率的感觉良好呈现。
大多数音频编解码器使用诸如修正离散余弦变换(MDCT)或调制重叠转换(MLT)的子波段变换或重叠正交变换来使用光谱分解,这些变换将音频信号从时间-域表示转换成光谱系数块或集。然后这些光谱系数被编码并发送给解码器。这些光谱系数的值的编码构成在音频编解码器中使用的大部分比特率。在低比特率中,音频系统可被设计成粗略地编码所有系数从而导致低质量重建,或编码较少的系数从而导致消声或低通发声信号。在此所述的音频编码/解码技术在实行后者时
(即当音频编解码器选择编码通常较低但不因反向兼容而必须的一些系数时)可被用来改进音频质量。
仅当编码一些系数时,编解码器产生重建中的模糊低通声音。为了改进该质量,所述编码/解码技术花费总比特率的较少百分比来添加遗漏光谱系数的感觉愉悦版本,从而产生更丰富的声音。这不是通过真正编码遗漏系数,而是通过将它们在感觉上呈现为已编码的缩放版本来实现。在一示例中,使用MLT分解(诸如微软Windows媒体音频(WMA))的编解码器进行最高达带宽的某个百分比的编码。然后该编码/解码技术版本将剩下的系数分成若干波段(诸如每个通常由64或128个光谱系数组成的子波段)。对于每一个这些波段,该编码/解码技术版本使用两个参数来编码该波段:表示波段中总能量的比例因子,以及呈现波段内光谱形状的形状系数。该比例因子参数可以就是波段内系数的rms(均方根)值。形状参数可以是仅通过从已被编码光谱的相似部分复制到光谱的标准化版本进行编码的一运动向量。在某些情形中,形状参数可相反指定一标准化随机噪音向量或仅是来自某些其它固定编码簿的向量。从光谱的另一部分复制一部分在音频中是有用的,因为通常在许多音调信号中有在光谱中重复的谐波成分。噪音或某些其它固定编码簿的使用允许对未被光谱的任何已编码部分良好呈现的那些成分的低比特率编码。该编码技术基本上是这些波段的增益-形状向量量化编码,其中该向量是光谱系数的频率波段,而编码簿可从先前编码的光谱中取得并可包括其它固定向量或随机噪音向量。此外,如果光谱的该复制部分被添加到同一部分的传统编码,则该添加是一残余编码。如果信号的传统编码给出易于用一些比特编码的基本表示(例如光谱基底的编码),且剩下的用新算法编码,则这会是有用的。
因此所述编码/解码技术在现存音频编解码器上改进。特别地,这些技术允许在给定质量上比特率的降低或固定比特率上质量的改进。这些技术可被用来以各种模式(例如连续的比特率或可变的比特率,单通或多通)改进音频编解码器。
参阅以下参照附图进行的对各实施例的详细描述,本发明的特征和优点将变得显而易见。
附图说明
图1和2是本编码技术可结合其中的音频编码器和解码器的框图。
图3是可结合到图1一般音频编码器的使用广义感觉相似性实现有效音频编码的基带编码器和扩展波段编码器的框图。
图4是使用图3扩展波段编码器中的广义感觉相似性来用有效音频编码对波段进行编码的流程图。
图5是可被结合到图2一般音频解码器的基带解码器和经扩展波段解码器的框图。
图6是使用图5经扩展波段解码器中的广义感觉相似性来用有效音频编码对波段进行解码的流程图。
图7是用于实现图1音频编码器/解码器的适当计算环境的框图。
具体实施方式
以下详细描述集中于根据本发明使用广义感觉相似性对数字媒体光谱数据进行数字媒体编码/解码的数字媒体编码器/解码器实施例。更具体地,以下描述详述这些编码/解码技术在音频中的应用。它们还可应用于其它数字媒体类型(例如视频、静止图像等)的编码/解码。在其对音频的应用中,该音频编码/解码使用成形噪音、或其它频率成分的成形版本、或两者的组合来呈现某些频率成分。更具体地,某些频率波段被呈现为已被编码的其它波段的成形版本。这允许给定质量上比特率的降低或固定比特率上质量的改进。
1.通用音频编码器和解码器
图1和2是通用音频编码器(100)和通用音频解码器(200)的框图,其中可结合在此所述的使用广义感觉相似性进行音频光谱数据的音频编码/解码的技术。所示编码器和解码器内模块之间的关系指示编码器和解码器中的主要信息流;其它关系为简便起见未示出。取决于所需压缩的类型和实现,编码器或解码器的模块可被添加、略去、分成多个模块、与其它模块组合、和/或用相似模块替换。在可选实施例中,带有不同模块和/或其它模块配置的编码器或解码器度量感觉音频质量。
其中可结合广义感觉相似性音频光谱数据编码/解码的音频编码器/解码器的更多细节在以下美国专利申请中描述:申请号为10/020,708于2001年12月14日提交的美国专利申请;申请号为10/016,918于2001年12月14日提交的美国专利申请;申请号为10/017,702于2001年12月14日提交的美国专利申请;申请号为10/017,861于2001年12月14日提交的美国专利申请;以及申请号为10/017,694于2001年12月14日提交的美国专利申请,这些申请的揭示通过引入包括在此。
A.通用音频编码器
通用音频编码器(100)包括频率转换器(110)、多通道转换器(120)、感觉建模器(130)、加权器(140)、量化器(150)、熵编码器(160)、速率/质量控制器(170)、以及比特流多路传输器[“MUX”](180)。
编码器(100)接收诸如表格1所示格式的输入音频样本(105)的时间序列。对于多通道输入(例如立体声模式),编码器(100)独立处理各通道,并遵从多通道转换器(120)对联合编码通道工作。编码器(100)压缩音频样本(105)以及由编码器(100)的各个模块产生的多路传输信息以输出诸如Windows媒体音频[“WMA”]或高级流格式[“ASF”]的格式的比特流(195)。或者,编码器(100)用其它输入和/或输出格式工作。
频率转换器(110)接收音频样本(105)并将它们转换成频率域内的数据。频率转换器(110)将音频样本(105)分成可具有可变尺寸以允许可变瞬时清晰度的多个块。小的块允许在输入音频样本(105)中较短但活动的转换片断上有较多的时间细节保留,但牺牲了一些频率清晰度。相反,大的块具有较佳频率清晰度但较差的时间清晰度,且常常允许在较长和较不活动的片断上有更大的压缩效率。块可重叠以减少否则会通过后来的量化而引入的各块之间的感觉中断。频率转换器(110)将频率系数数据的块输出到多通道转换器(120)并将诸如块尺寸的辅助信息输出到MUX(180)。频率转换器(110)将频率系数数据和辅助信息都输出到感觉建模器(130)。
频率转换器(110)将音频输入样本的帧分成具有时间可变尺寸的重叠子帧块,并将时间变化MLT应用于子帧块。可能的子帧尺寸包括128、256、512、1024、2048和4096个样本。MLT像由时间视窗函数调制的DCT一样操作,其中该视窗函数是随时间变化的并依赖于子帧尺寸序列。MLT将样本x[n],0≤n≤子帧_尺寸的给定重叠块转换成频率系数X[k],0≤k<子帧_尺寸/2的块。频率转换器(110)还可将对后来帧复杂性的估算输出到速率/增加量控制器(170)。可选实施例使用MLT的其它变体。在其它可选实施例中,频率转换器(110)应用DCT、FFT、或其它类型的已调制或未经调制、重叠或未重叠频率变换,或使用子波段或小波编码。
对于多通道音频数据,由频率转换器(110)产生的频率系数数据的多个通道常常是相互关联的。为使用该相互关联,多通道转换器(120)可将多个原始的独立编码通道转换成联合编码通道。例如,如果输入是立体声模式,多通道转换器(120)可将左右通道转换成和通道以及差动通道。
X Sum [ k ] = X Left [ k ] + X Right [ k ] 2 - - - ( 1 )
X Diff [ k ] = X Left [ k ] - X Right [ k ] 2 - - - ( 2 )
或者,多通道转换器(120)可在作为独立编码通道的左右通道中传递。更一般地,对于一个以上的众多输入通道,多通道转换器(120)在原始的独立编码通道中作未经改变地传递,或将原始通道转换成联合编码通道。使用独立或联合编码通道的判定可被预先确定,或者该判定可在编码期间逐块地或在其它基础上适应性地作出。多通道转换器(120)产生给MUX(180)的指示所使用通道转换模式的辅助信息。
感觉建模器(130)对人类听觉系统的属性建模以对给定比特流改进重建音频信号的质量。感觉建模器(130)计算频率系数可变尺寸块的激励模式。首先,感觉建模器(130)使该块的尺寸和幅度比例标准化。这使能随后的时间模糊并建立用于质量度量的一致比例。可任选地,感觉建模器(130)在某些频率衰减系数以建模外/中耳传输函数。感觉建模器(130)计算块中系数的能量并累加25个关键波段的能量。或者,感觉建模器(130)使用另外数量的关键波段(例如55或109)。关键波段的频率范围是实现相关的,且许多选项是众所周知的。例如参见ITU-R BS1387或本文提及的参考文献。感觉建模器(130)处理导致同时和时间屏蔽的波段能量。在可选实施例中,感觉建模器(130)根据诸如在TU-R BS 1387中描述或提及的不同听觉模型来处理音频数据。
加权器(140)基于从感觉建模器(130)接收的激励模型产生加权因子(或称为量化矩阵),并将该加权因子应用于从多通道转换器(120)接收的数据。加权因子包括用于音频数据中多个量化波段的每一个的权重。量化波段在数量或位置上可与在编码器(100)其它地方使用的关键波段相同或不同。加权因子指示噪音在量化波段上传播的比例,其目标是通过将更多噪音置入较难听到的波段来最小化噪音的可听度,反之亦然。加权因子在量化波段的幅度和数量上可逐块地不同。在一实现中,量化波段的数量根据块的尺寸变化;较小的块比较大的块具有较少的量化波段。例如,具有128个系数的块具有13个量化波段,具有256个系数的块具有15个量化波段,而高达25个量化波段则用于具有2048个系数的块。加权器(140)产生一个加权因子集用于独立或联合编码通道中多通道音频数据的每个通道,或产生用于联合编码通道的一个单独的加权因子集。在可选实施例中,加权器(140)从不同于激励模式或除激励模式之外的信息产生加权因子。
加权器(140)将系数数据的加权块输出到量化器(150),并将诸如加权因子集的辅助信息输出到MUX(180)。加权器(140)还可将加权因子输出到速率/质量控制器(140)或编码器(100)中的其它模块。加权因子集可被压缩用于更有效的表示。如果加权因子是有损压缩的,则重建的加权因子通常被用来加权系数数据块。如果块的一个波段中的音频信息因某些原因(例如噪音替换或波段截断)被完全消除,则编码器(100)能够进一步改进该块的量化矩阵的压缩。
量化器(150)量化加权器(140)的输出,从而产生给熵编码器(160)的量化系数数据以及给MUX(180)的包括量化步骤尺寸的辅助信息。量化引入了信息的不可逆损失,但还使编码器(100)与速率/质量控制器(170)一起能调节输出比特流(195)的比特率。在图1中,量化器(150)是适应性的、统一的标量量化器。量化器(150)将相同的量化步骤尺寸应用于某个频率系数,但量化步骤尺寸本身从一次到下次叠代可变化以影响熵编码器(160)输出的比特率。在可选实施例中,量化器是非统一量化器、向量量化器、和/或非适应性量化器。
熵编码器(160)无损地压缩从量化器(150)接收的经量化系数数据。例如,熵编码器(160)使用多级游程编码、可变-到-可变长度编码、游程编码、Hoffman编码、字典编码、算法编码、LZ编码、以上组合、或某些其它熵编码技术。
速率/质量控制器(170)与量化器(150)一起工作以调节编码器(100)输出的比特率和质量。速率/质量控制器(170)从编码器(100)的其它模块接收信息。在一实现中,速率/质量控制器(170)从频率转换器(110)接收对将来复杂度的估算、采样率、块尺寸信息、来自感觉建模器(130)的原始音频数据的激励模式、来自加权器(140)的加权因子、某些形式(例如经量化的、重建的、或编码的)的经量化音频信息块、以及来自MUX(180)的缓冲器状态信息。速率/质量控制器(170)可包括逆量化器、逆加权器、逆多通道转换器、以及可能熵编码器和其它模块来按量化形式重建音频数据。
速率/质量控制器(170)处理信息来确定给定当前条件下所需的量化步骤尺寸,并向量化器(150)输出量化步骤尺寸。然后速率/质量控制器(170)按用量化步骤尺寸量化的来度量经重建音频数据块的质量,如下所述。使用已度量的质量以及比特率信息,速率/质量控制器(170)调整量化步骤尺寸,其目标为满足即时和长期的比特率和质量约束。在可选实施例中,速率/质量控制器(170)用不同或附加信息工作,或应用不同技术来调节质量和比特率。
结合速率/质量控制器(170),编码器(100)可将噪音替代、波段截断、和/或多通道重新组成矩阵(rematrixing)应用于音频数据块。在低比特率和中比特率时,音频编码器(100)可使用噪音替代来传送某些波段中的信息。在波段截断中,如果块的经度量质量指示较差质量,则编码器(100)可在某些(通常较高频率)波段中完全消除这些系数以改进剩下波段中的整体质量。在多通道重新组成矩阵中,对于低比特率、联合编码通道中的多通道音频数据,编码器(100)可抑制某些通道(例如差动通道)中的信息以改进剩下通道(例如和通道)的质量。
MUX(180)多路传输从音频编码器(100)的其它模块接收的辅助信息,以及从熵编码器(160)接收的经熵编码的数据。MUX(180)以WMA或音频解码器识别的另一格式输出信息。
MUX(180)包括存储由编码器(100)将要输出的比特流(195)的虚拟缓冲器。该虚拟缓冲器存储音频信息的预定时段(例如用于流动音频的5秒)以便平息因音频中的复杂性改变而引起的比特率短期波动。然后虚拟缓冲器以相对恒定的比特率输出数据。缓冲器当前的充盈度、缓冲器充盈度的改变率、以及缓冲器的其它特征可由速率/质量控制器(170)使用来调节质量和比特率。
B.通用音频解码器
参照图2,通用音频解码器(200)包括比特流多路信号分离器[“DEMUX”](210)、熵解码器(220)、逆量化器(230)、噪音发生器(240)、逆加权器(250)、逆多通道转换器(260)、以及逆频率转换器(270)。解码器(200)比编码器(100)简单是因为解码器(200)不包括用于速率/质量控制的模块。
解码器(200)接收WMA或另一格式的经压缩音频数据的比特流(205)。该比特流(205)包括解码器(200)据其重建音频样本(295)的经熵编码数据以及辅助信息。对于具有多通道的音频数据,解码器(200)独立处理每个通道,然后在逆多通道转换器(260)之前可对联合编码通道工作。
DEMUX(210)解析比特流(205)中的信息并将信息发送给解码器(200)的模块。DEMUX(210)包括一个或多个缓冲器以补偿因音频复杂性、网络抖动、和/或其它因素的波动而引起的比特率的短期变化。
熵编码器(220)无损地解压缩从DEMUX(210)接收的熵编码,从而产生经量化的频率系数数据。熵解码器(220)通常应用在编码器中使用的熵编码技术的逆。
逆量化器(230)从DEMUX(210)接收量化步骤尺寸并从熵解码器(220)接收经量化的频率系数数据。逆量化器(230)将量化步骤尺寸应用于经量化的频率系数数据以部分地重建该频率系数数据。在可选实施例中,逆量化器应用在编码器中使用的某些其它量化技术的逆。
噪音发生器(240)从DEMUX(210)接收对数据块中哪些波段被噪音以及噪音形式的任何参数替代的指示。噪音发生器(240)产生用于被指示波段的模式,并将该信息传递给逆加权器(250)。
逆加权器(250)从DEMUX(210)接收加权因子,从噪音发生器(240)接收用于任何噪音替代波段的模式、并从逆量化器(230)接收部分重建的频率系数数据。必要时,逆加权器(250)解压缩加权因子。逆加权器(250)将加权因子应用于未经噪音替代的波段的部分经重建的频率系数数据。然后逆加权器(250)添加从噪音发生器(240)接收的噪音模式。
逆多通道转换器(260)从逆加权器(250)接收已重建的系数数据,并从DEMUX(210)接收通道转换模式信息。如果多通道数据在独立编码的通道内,则逆多通道转换器(260)将其沿通道传递。如果多通道数据是联合编码通道,则逆多通道转换器(260)把该数据转换成独立编码数据。如果需要,解码器(200)可在此时度量经重建的频率系数数据的质量。
逆频率转换器(270)接收由多通道转换器(260)输出的频率系数数据以及来自DEMUX(210)的诸如块尺寸的辅助信息。逆频率转换器(270)应用在编码器中使用的频率转换的逆,并输出经重建音频样本(295)的块。
2.使用广义感觉相似性编码/解码
图3示出使用以广义感觉相似性编码的音频编码器(300)的一个示例,该音频编码器可被结合到图1和2的通用音频编码器(100)和解码器(200)的整体音频编码/解码过程中。在该实现中,音频编码器(300)使用子波段变换或诸如MDCT或MLT的重叠正交变换在变换(320)执行一光谱分解,以产生用于音频信号每个输入块的一个光谱系数集。众所周知,音频编码器编码这些光谱系数用于向解码器发送输出比特流。这些光谱系数的值的编码构成在音频编码解码器中使用的大部分比特率。在较低比特率上,音频编码器(300)选择使用基带编码器340来编码较少的光谱系数(即可在从频率转换器(110)输出的光谱系数带宽的百分比内编码的一些系数),诸如光谱的较低或基带部分。基带编码器340使用一众所周知编码语法来编码这些基带光谱系数,如上对通用音频编码器所述。这一般会导致经重建音频发声被消声或低通过滤。
音频编码器(300)通过使用广义感觉相似性编码略去的光谱系数来避免消声或低通效应。在用基带编码器340的编码中被略去的这些光谱系数(在此称为“经扩展的波段光谱系数”)被经扩展波段编码器350编码为成形噪音、或其它频率成分的成形版本、或两者的组合。更具体地,经扩展波段的光谱系数被分成众多被编码为成形噪音或其它频率成分的成形版本的子波段(例如通常为64或128个光谱系数)。这添加了遗漏光谱系数的感觉愉悦版本以给出更丰富的声音。即使实际光谱可偏离因该编码所导致的综合版本,该经扩展波段编码提供了与原来相似的感觉效果。
在某些实现中,基带的宽度(即使用基带编码器340编码的基带光谱系数的数量)以及经扩展波段的尺寸或数量可被改变。这样,使用可扩展波段编码器(350)编码的基带宽度和经扩展波段的数量可被编码成输出流(195)。
进行音频编码器(300)中基带光谱系数和经扩展波段系数之间比特流的划分是为了确保基于基带编码器的编码语法与现存解码器反向兼容,从而现存解码器可解码基带经编码部分而略去已扩展部分。结果是只有较新的解码器才具有呈现经扩展波段的编码比特流所覆盖的全部光谱的能力,而较旧的解码器只能呈现编码器选择用现存语法编码的那部分。频率界限可以是灵活和随时间变化的。它可以由编码器基于信号特征判定并被显式发送给解码器,或者它可以是经解码光谱的函数,所以无需发送它。因为现存解码器仅能解码使用现存(基带)编解码器编码的那部分,这意味着光谱的较低部分用现存编解码器编码而较高部分则以使用广义感觉相似性的经扩展波段来编码。
在无需这种反向兼容的其它实现中,编码器可完全基于信号特征和编码成本在常规基带编码和经扩展波段(广义感觉相似性方法)之间自由选择而无需考虑频率位置。例如,尽管在自然信号中极不可能,但最好还是用常规编解码器来编码较高频率而用经扩展的编解码器来编码较低部分。
图4是示出由图3的经扩展波段编码器(350)执行音频编码过程(400)以编码经扩展的波段光谱系数的流程图。在该音频编码过程中(400),经扩展的波段编码器(350)将经扩展的波段光谱系数分成一些子波段。在一典型实现中,这些子波段一般每个包括64或128个光谱系数。或者,可使用其它尺寸的子波段(例如16、32或其它数量的光谱系数)。子波段可以是离散的或重叠的(使用开窗术)。对于重叠的子波段,编码更多的波段。例如,如果128个光谱系数不得不使用具有尺寸为64的子波段的经扩展波段编码器来编码,我们可使用两个离散波段来编码这些系数,其中系数0-63为一子波段而64-127为另一子波段。或者我们可使用有50%重叠的三个重叠波段,其中0-63为一波段,32-95为另一波段,而64-127为第三波段。
对于这些子波段的每一个,经扩展波段编码器(350)使用两个参数编码该波段。一个参数(“比例参数”)是在波段中表示全部能量的比例因子。另一参数(“形状参数”,通常以运动向量形式)被用来表示波段内光谱的形状。
如图4流程图所示,经扩展波段编码器(350)对经扩展波段的某个子波段执行过程(400)。首先(在420),经扩展波段编码器(350)计算比例因子。在一实现中,比例因子仅是当前子波段内系数的rms(均方根)值。这通过取所有系数的平均平方值的平方根获得。该平均平方值通过取该子波段中所有系数的平方值的和,再除以系数的数量获得。
然后该经扩展波段编码器(350)确定形状参数。该形状参数常常是指示从已被编码的光谱部分(即用基带编码器编码的基带光谱系数的一部分)复制到光谱的标准化版本上的运动向量。在某些情形中,形状系数可相反指定一标准化随机噪音向量或仅为从来自固定编码簿的光谱形状的向量。从光谱的另一部分复制该形状在音频中是有用的,因为通常在许多音调信号中有许多在光谱中重复的谐波成分。噪音或某些其它固定编码簿的使用允许未在光谱的经基带编码部分中良好呈现的那些成分的低比特率编码。因此,过程(400)提供一种基本上是这些波段的增益形状向量量化编码的编码方法,其中该向量是光谱系数的频率波段,而编码簿取自先前编码器的光谱并也可包括其它固定向量或随机噪音向量。那是由经扩展波段编码器编码的表示为a*X的每个子波段,其中‘a’是比例参数而‘X’是由形状参数表示的向量,并可以是先前经编码光谱系数的标准化版本,来自固定编码簿的向量或随机噪音向量。此外,如果光谱的被复制部分被添加到同一部分的传统编码中,则该添加是剩余编码。如果信号的传统编码给出便于用一些比特编码的基本表示(例如光谱基底的编码),且剩余用新算法编码,则这会是有用的。
更具体地,在动作(430),经扩展波段编码器(350)在具有类似于经扩展波段的当前子波段的形状的基带光谱系数中搜索相同波段的基带光谱系数。该经扩展波段编码器使用与基带每个部分的标准化版本的最小均方比较来确定基带的哪个部分与当前子波段最相似。例如,考虑一情形,其中有由变换(320)从输入块生成的256个光谱系数,经扩展波段的子波段在宽度上每个都有16个光谱系数,而基带编码器将前128个光谱系数(编号为0-127)编码为基带。然后,搜索执行每个经扩展波段中的16个标准化光谱系数与从系数位置0开始直到111的基带(即在此情形中总共有在基带中编码的112个不同的可能光谱形状)的每16个光谱系数部分的标准化版本之间的最小均方比较。具有最低的最小均方值的基带部分被视为在形状上与当前经扩展波段最接近(最相似)。在动作(432),经扩展波段编码器检查基带光谱系数中的最相似波段在形状上是否与当前经扩展波段足够接近(即最小均方值低于预选阈值)。如果是,则经扩展波段编码器在动作(434)确定指向基带光谱系数的最相近匹配波段的运动向量。该运动向量可以是基带中的开始系数位置(例如在该示例中的0-111)。其它方法(诸如检查音调对无音调)也可被用来查看基带光谱系数中的最相似波段在形状上是否与当前经扩展波段足够接近。
如果未发现基带的足够相似部分,则经扩展波段编码器查看光谱形状的固定编码簿来表示当前的子波段。经扩展波段编码器在该固定编码簿中搜索与当前子波段形状相似的波段形状。如果发现,则经扩展波段编码器使用其在编码簿中的索引作为动作(444)上的形状参数。否则,在动作(450),经扩展波段编码器确定将当前子波段的形状表示为标准化的随机噪音向量。
在可选实现中,设置在搜索基带中最佳光谱形状之前经扩展的波段编码器可判定光谱系数是否就可使用噪音来表示。这样,即使在基带中找到一足够接近的光谱形状,经扩展波段编码器将仍然使用随机噪音编码该部分。这在与对应于基带中位置发送运动向量相比较时,可导致较少比特。
在动作(460),经扩展波段编码器使用预测编码、量化和/或熵编码来编码比例和形状参数(即在本实现中的比例因子和运动向量)。例如,在一实现中,比例参数基于紧靠前的经扩展子波段被预测编码(经扩展波段的子波段的比例因子通常在值上是相似的,从而连续子波段通常具有其值相近的比例因子)。换言之,用于经扩展波段的第一子波段的比例因子的全值被编码。随后子波段按其实际值和其预测值的差值被编码(即预测值为前面子波段的比例因子)。对于多通道音频,每个通道中经扩展波段的第一子波段按其全值被编码,且随后的子波段的比例因子从通道中先前子波段的比例因子预测。在可选实现中,比例参数还可在通道上从一个以上其它子波段、从基带光谱、或从先前的音频输入块等预测。
经扩展波段编码器还使用统一或非统一量化来量化比例参数。在一实现中,使用比例参数的非统一量化,其中比例因子的对数被统一量化到128bin。最后的经量化值使用Huffman编码进行熵编码。
对于形状参数,经扩展波段编码器还使用预测编码(可从前面的子波段对比例参数预测)、量化为64bin、以及熵编码(例如用Huffman编码)。
在某些实现中,经扩展波段的子波段在尺寸上可变。在这样的情形中,经扩展波段编码器还编码经扩展波段的配置。
更具体地,在一示例实现中,经扩展波段编码器编码比例和形状参数,如以下代码表格中列出的伪代码所示:
代码表格
for each tile in audio scream
    for each channel in tile that may need to be coded{e.g.
subwcoofet may not need to be coded}
    I bit to ind:catc if channel is coded or not.
    H bits to spccify qoantozed version of version of starting position of
extended bard
    ′D_confiq′bits to specity coding of band configoration.
    for each sub-band to be coded using extended band coder
    {
        ′n_scale′bits for variable length code to specify scale
parameter lenergy in band).
        ′n_shape′bits for variable length code to specify shape
parameter.
在以上代码列表中,指定波段配置(即波段的数量及其尺寸)的编码取决于要使用经扩展波段编码器编码的光谱系数的数量。使用经扩展波段编码器编码的系数数量可使用经扩展波段的开始位置和光谱系数的总量来发现(使用经扩展波段编码器编码的光谱系数的数量=光谱系数的总量一开始位置)。然后波段配置被编码为所允许的所有可能配置列表的索引。该索引使用具有n_config=log2(配置数量)比特的固定长度代码来编码。所允许的配置是要使用该方法编码的光谱系数数量的函数。例如,如果要编码128个系数,缺省配置为尺寸64的2个波段。其它配置是可能的,例如如下表所列:
用于128个光谱系数的波段配置的列表
0:128
1:64       64
2:64       32 32
3:32       32 64
4:32 32    32 32
因而,在该示例中,有5个可能的波段配置。在这种配置中,用于这些系数的缺省配置被选为具有‘n’个波段。然后,如果允许每个波段划分或合并(仅一层),则有5(n/2)种可能配置,其需要(n/2)log2(5)个比特编码。在其它实现中,可变长度编码可被用来编码该配置。
如上所述,比例因子使用预测编码来编码,其中预测可从来自同一通道内先前波段、来自同一区域先前通道、或来自先前经解码区域的的先前经编码比例因子中获取。对于一给定实现,对预测的选择可通过查看哪个先前波段(在同一经扩展波段、通道或区域(输入块)中)提供最高相互关系来作出。在一实现示例中,波段被如下预测编码:
假设区域中比例因子为[i][j],其中i=通道索引,j=波段索引。
对于i==0&&j==0(第一通道,第一波段),无预测。
对于i!=0&&j==0(其它通道,第一波段),预测为x[0][0](第一通道,第一波段)。
对于i!=0&&j!=0(其它通道,其它波段),预测为x[i][j-1](同一通道,前一波段)。
在以上代码表格中,“形状参数”是指定先前光谱系数位置的运动向量、或来自固定代码簿的向量、或噪音。该先前光谱系数可来自同一通道内、或来自先前通道、或来自先前区域。该形状参数使用预测编码,其中预测从同一通道内的先前波段、或同一区域内的先前通道、或先前区域的先前位置获取。
图5示出用于由音频编码器(300)产生的比特流的音频解码器(500)。在该解码器中,经编码比特流(205)由比特流多路信号分离器(210)(例如基于经编码基带宽度和经扩展波段配置)分离成基带编码流和经扩展波段编码流,它们在基带解码器(540)和经扩展基带解码器(550)中解码。该基带解码器(540)使用基带编解码器的常规解码来解码基带光谱系数。经经扩展波段解码器(550)解码经扩展波段编码流,包括复制由形状参数的运动向量指向的基带光谱系数的一部分,并由比例参数的缩放因子缩放。基带和经扩展波段光谱系数被组合成由逆变换580转换来重建音频信号的单个光谱。
图6示出在图5的经经扩展波段解码器(550)中使用的解码过程(600)。对于经扩展波段编码流中经扩展波段的某个经编码子波段(动作(610)),经经扩展波段解码器解码比例因子(动作(620))和运动向量(动作(630))。然后经经扩展波段解码器复制基带子波段、固定编码簿向量、或由运动向量(形状参数)标识的随机噪音向量。经经扩展波段解码器按照缩放因子缩放被复制的光谱波段以产生经扩展波段的当前子波段的光谱系数。
3.计算环境
图7示出各说明性实施例可在其中实现的适当计算环境(700)。该计算环境(700)并非旨在提出对本发明的使用范围或功能的任何限制因为本发明可在不同通用或专用计算环境中实现。
参照图7,计算环境(700)包括至少一个处理单元(710)和存储器(720)。在图7中,最基本配置(730)被包括在虚线内。处理单元(710)执行计算机可执行指令,并可以是真实或虚拟处理器。在多处理系统中,多个处理单元执行计算机可执行指令以增加处理能力。存储器720可以是易失性的(例如寄存器、高速缓存器RAM)、非易失性的(诸如ROM、EEPROM、闪存等等)、或两者的某些组合。存储器(720)存储实现音频编码器的软件(780)。
计算环境可具有附加特征。例如,计算环境(700)包括存储器(740)、一个或多个输入装置(750)、一个或多个输出装置(760)、以及一个或多个通信连接(770)。诸如总线、控制器或网络的相互连接机制(未示出)使计算机环境(700)的组件相互连接。通常,操作系统软件(未示出)在计算环境(700)中执行的其它软件,提供操作环境并协调计算环境(700)组件的动作。
存储器(740)可以是可移动和/或不可移动的,并包括磁盘、磁带或磁盒、CD-ROM、CD-RW、DVD、或可用来存储信息并可在计算环境(700)内访问的任何其它介质。存储器(740)存储实现音频编码器的软件(780)的指令。
输入装置(750)可以是诸如键盘、鼠标、笔或跟踪球、语音输入装置、扫描仪、或另一向计算环境(700)提供输入的装置。对于音频,输入装置(750)可以是接受模拟或数字形式音频输入的声卡或类似装置。输出装置(760)可以是显示器、打印机、扬声器、或另一提供来自计算环境(700)的输出的装置。
通信连接770使能经通信介质与另一计算实体的通信。通信介质传送诸如计算机可执行指令、经压缩音频或视频信息、或已调制数据信号的信息。已调制数据信号是具有以这种把信息编码到信号中的方式来设置或改变的一个或多个特征的信号。作为示例,而非限制,通信介质包括用电子、光学、RF、红外、声学和其它载体的有线或无线技术。
本发明可在计算机可读介质的一般上下文中描述。计算机可读介质是可在计算环境内访问的任何可用介质。作为示例,而非限制,对于计算环境(700),计算机可读介质包括存储器(720)、存储器(740)、通信介质、以及以上任意组合。
本发明可在计算机可执行指令的一般上下文中描述,诸如包括在程序模块中并在目标真实或虚拟处理器上的计算环境中执行的指令。通常,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、库、对象、类、组件、数据结构等。程序模块的功能在各实施例中可按需在程序模块之间组合或划分。程序模块的计算机可执行指令可在本地或分布式计算环境内执行。
为了呈现,详细说明使用像“确定”、“获取”、“调整”和“应用”的术语来描述计算环境中的计算机操作。这些术语是由计算机这些的操作的高级抽象,且不应与人类执行的动作相混淆。对应于这些术语的实际计算机操作依赖于实现而改变。
由于许多可能实施例都可应用本发明原理,故我们要求可能属于所附权利要求及其等效实体的范围和精神内的所有这类实施例作为我们的发明。

Claims (12)

1.一种音频编码方法,包括:
将输入音频信号块变换成一光谱系数集;
将这些光谱系数分成多个子波段;
在输出比特流中编码所述多个子波段中的至少一个子波段的光谱系数的值;
对于多个其它子波段中的至少一个子波段,将所述输出比特流中该其它子波段编码为被编码成光谱系数值的所述多个子波段中的所述至少一个子波段的一部分的形状的经缩放版本;
对于多个其它子波段中的每一个:
执行一搜索以确定被编码为光谱系数的所述多个子波段中的所述至少一个子波段的多个部分中的哪一个部分在形状上更相似于相应的其它子波段;
确定所确定的部分是否在形状上与所述相应的其它子波段足够相似;
如果是,则将所述相应的其它子波段编码为所确定的部分的形状的经缩放版本;以及
否则,将所述相应的其它子波段编码为固定编码簿中形状的或随机噪音向量的经缩放版本。
2.如权利要求1所述的音频编码方法,其特征在于,对其它子波段编码包括:使用一比例参数和一形状参数来编码所述其它子波段,其中所述形状参数指示出被编码为光谱系数值的所述多个子波段中的所述至少一个子波段的所述一部分,所述比例参数是缩放所指示出的部分的缩放因子。
3.如权利要求2所述的音频编码方法,其特征在于,所述缩放因子表示所述其它子波段的总能量。
4.如权利要求2所述的音频编码方法,其特征在于,所述缩放因子是所述其它子波段内系数的均方根值。
5.如权利要求2所述的音频编码方法,其特征在于,所述形状参数是一运动向量。
6.如权利要求1所述的音频编码方法,其特征在于,执行搜索包括执行与所述多个部分中的每一个部分的标准化版本的最小均方比较。
7.如权利要求1所述的音频编码方法,其特征在于,所述否则编码所述相应的其它子波段包括:
在固定编码簿中表示的形状中执行对在形状上更相似于所述相应的其它子波段的形状的搜索;
如果在固定编码簿中找到这样的相似形状,则将所述相应的其它子波段编码为固定编码簿中这样的相似形状的经缩放版本;以及
否则,将所述相应的其它子波段编码为随机噪音向量的经缩放版本。
8.一种音频编码器,其特征在于,包括:
一变换装置,用于将输入音频信号块变换成一光谱系数集;
一基本编码器,用于在输出比特流中编码所述集的这些光谱系数的基带部分的光谱系数值;以及
一广义感觉相似性编码器,用于将所述集的其它光谱系数的至少一个其它子波段编码为所述基带部分的子部分的经缩放形状,其中,所述广义感觉相似性编码器还包括:
一装置,用于对多个其它子波段的每一个子波段执行一搜索,以确定被编码为光谱系数的所述至少一个子波段的多个部分中的哪一个部分在形状上更相似于相应的其它子波段;
一装置,用于确定所确定的部分是否在形状上与所述相应的其它子波段足够相似;
一装置,用于如果所确定的部分在形状上与所述相应的其它子波段足够相似,则将所述相应的其它子波段编码为所确定的部分的形状的经缩放版本;
一装置,用于如果所确定的部分在形状上与所述相应的其它子波段并不足够相似,则将所述相应的其它子波段编码为固定编码簿中形状的或随机噪音向量的经缩放版本。
9.如权利要求8所述的音频编码器,其特征在于,所述广义感觉相似性编码器产生所述其它子波段的编码,使用一缩放因子参数和一运动向量参数来表示所述子部分的经缩放形状。
10.如权利要求9所述的音频编码器,其特征在于,所述缩放因子参数表示所述其它子波段的总能量。
11.如权利要求9所述的音频编码器,其特征在于,所述缩放因子是所述其它子波段内系数的均方根值。
12.一种数字介质编码方法,其特征在于,包括:
将输入信号块变换成一光谱系数集;
将这些光谱系数分成多个分离或重叠的子波段;
通过一选定的编码过程编码每个子波段,所述编码过程在给定比特率、缓冲器尺寸、以及编码器复杂度约束集时在广义感觉意义上最好地表示所述子波段,其中所述编码过程从以下编码过程中选择:
使用基带编解码器来编码所述子波段;
将所述子波段表示为已编码光谱的一部分的经适当缩放版本;
将所述子波段表示为来自固定编码簿的向量的经适当缩放版本;以及
将所述子波段表示为随机噪音的经适当缩放版本。
CN2004800032596A 2004-01-23 2004-07-29 音频编码方法、音频编码器以及数字介质编码方法 Active CN1813286B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US53904604P 2004-01-23 2004-01-23
US60/539,046 2004-01-23
US10/882,801 US7460990B2 (en) 2004-01-23 2004-06-29 Efficient coding of digital media spectral data using wide-sense perceptual similarity
US10/882,801 2004-06-29
PCT/US2004/024935 WO2005076260A1 (en) 2004-01-23 2004-07-29 Efficient coding of digital media spectral data using wide-sense perceptual similarity

Publications (2)

Publication Number Publication Date
CN1813286A CN1813286A (zh) 2006-08-02
CN1813286B true CN1813286B (zh) 2010-11-24

Family

ID=34798916

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2004800032596A Active CN1813286B (zh) 2004-01-23 2004-07-29 音频编码方法、音频编码器以及数字介质编码方法

Country Status (8)

Country Link
US (2) US7460990B2 (zh)
EP (1) EP1730725B1 (zh)
JP (4) JP4745986B2 (zh)
KR (3) KR101130355B1 (zh)
CN (1) CN1813286B (zh)
AT (1) ATE451684T1 (zh)
DE (1) DE602004024591D1 (zh)
WO (1) WO2005076260A1 (zh)

Families Citing this family (82)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7460993B2 (en) * 2001-12-14 2008-12-02 Microsoft Corporation Adaptive window-size selection in transform coding
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
ES2334934T3 (es) * 2002-09-04 2010-03-17 Microsoft Corporation Codificacion de entropia por adaptacion de codificacion entre modalidades de nivel y de longitud de sucesion y nivel.
US7809579B2 (en) * 2003-12-19 2010-10-05 Telefonaktiebolaget Lm Ericsson (Publ) Fidelity-optimized variable frame length encoding
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
US7983835B2 (en) 2004-11-03 2011-07-19 Lagassey Paul J Modular intelligent transportation system
TWI231656B (en) * 2004-04-08 2005-04-21 Univ Nat Chiao Tung Fast bit allocation algorithm for audio coding
TWI275074B (en) * 2004-04-12 2007-03-01 Vivotek Inc Method for analyzing energy consistency to process data
US20050232497A1 (en) * 2004-04-15 2005-10-20 Microsoft Corporation High-fidelity transcoding
JP4168976B2 (ja) * 2004-05-28 2008-10-22 ソニー株式会社 オーディオ信号符号化装置及び方法
EP1769491B1 (en) * 2004-07-14 2009-09-30 Koninklijke Philips Electronics N.V. Audio channel conversion
KR100657916B1 (ko) * 2004-12-01 2006-12-14 삼성전자주식회사 주파수 대역간의 유사도를 이용한 오디오 신호 처리 장치및 방법
US9626973B2 (en) * 2005-02-23 2017-04-18 Telefonaktiebolaget L M Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
EP1851866B1 (en) * 2005-02-23 2011-08-17 Telefonaktiebolaget LM Ericsson (publ) Adaptive bit allocation for multi-channel audio encoding
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7546240B2 (en) * 2005-07-15 2009-06-09 Microsoft Corporation Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition
KR100803205B1 (ko) 2005-07-15 2008-02-14 삼성전자주식회사 저비트율 오디오 신호 부호화/복호화 방법 및 장치
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7953605B2 (en) * 2005-10-07 2011-05-31 Deepen Sinha Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension
US20070118361A1 (en) * 2005-10-07 2007-05-24 Deepen Sinha Window apparatus and method
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7966175B2 (en) 2006-10-18 2011-06-21 Polycom, Inc. Fast lattice vector quantization
US7953595B2 (en) 2006-10-18 2011-05-31 Polycom, Inc. Dual-transform coding of audio signals
US20080243518A1 (en) * 2006-11-16 2008-10-02 Alexey Oraevsky System And Method For Compressing And Reconstructing Audio Files
WO2008072670A1 (ja) * 2006-12-13 2008-06-19 Panasonic Corporation 符号化装置、復号装置、およびこれらの方法
US20100049512A1 (en) * 2006-12-15 2010-02-25 Panasonic Corporation Encoding device and encoding method
JP4871894B2 (ja) * 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
KR101403340B1 (ko) * 2007-08-02 2014-06-09 삼성전자주식회사 변환 부호화 방법 및 장치
US8116936B2 (en) * 2007-09-25 2012-02-14 General Electric Company Method and system for efficient data collection and storage
US8249883B2 (en) 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
US8457958B2 (en) * 2007-11-09 2013-06-04 Microsoft Corporation Audio transcoder using encoder-generated side information to transcode to target bit-rate
US8688441B2 (en) * 2007-11-29 2014-04-01 Motorola Mobility Llc Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content
US8433582B2 (en) * 2008-02-01 2013-04-30 Motorola Mobility Llc Method and apparatus for estimating high-band energy in a bandwidth extension system
US20090201983A1 (en) * 2008-02-07 2009-08-13 Motorola, Inc. Method and apparatus for estimating high-band energy in a bandwidth extension system
US8190440B2 (en) * 2008-02-29 2012-05-29 Broadcom Corporation Sub-band codec with native voice activity detection
US20110035214A1 (en) * 2008-04-09 2011-02-10 Panasonic Corporation Encoding device and encoding method
US8179974B2 (en) 2008-05-02 2012-05-15 Microsoft Corporation Multi-level representation of reordered transform coefficients
US8447591B2 (en) * 2008-05-30 2013-05-21 Microsoft Corporation Factorization of overlapping tranforms into two block transforms
US8666733B2 (en) * 2008-06-26 2014-03-04 Japan Science And Technology Agency Audio signal compression and decoding using band division and polynomial approximation
KR101223835B1 (ko) * 2008-07-11 2013-01-17 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 신호 합성기 및 오디오 신호 인코더
US8463412B2 (en) * 2008-08-21 2013-06-11 Motorola Mobility Llc Method and apparatus to facilitate determining signal bounding frequencies
US8406307B2 (en) 2008-08-22 2013-03-26 Microsoft Corporation Entropy coding/decoding of hierarchically organized data
US8396114B2 (en) * 2009-01-29 2013-03-12 Microsoft Corporation Multiple bit rate video encoding using variable bit rate and dynamic resolution for adaptive video streaming
US8311115B2 (en) * 2009-01-29 2012-11-13 Microsoft Corporation Video encoding using previously calculated motion information
US8463599B2 (en) * 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
US20100225473A1 (en) * 2009-03-05 2010-09-09 Searete Llc, A Limited Liability Corporation Of The State Of Delaware Postural information system and method
WO2010111841A1 (zh) * 2009-04-03 2010-10-07 华为技术有限公司 频域脉冲解码的预测方法和预测装置及解码器
US8270473B2 (en) * 2009-06-12 2012-09-18 Microsoft Corporation Motion based dynamic resolution multiple bit rate video encoding
US8700410B2 (en) * 2009-06-18 2014-04-15 Texas Instruments Incorporated Method and system for lossless value-location encoding
KR20110001130A (ko) * 2009-06-29 2011-01-06 삼성전자주식회사 가중 선형 예측 변환을 이용한 오디오 신호 부호화 및 복호화 장치 및 그 방법
WO2011058752A1 (ja) * 2009-11-12 2011-05-19 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
WO2011058758A1 (ja) * 2009-11-13 2011-05-19 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
JP5507971B2 (ja) 2009-11-16 2014-05-28 アイシン精機株式会社 衝撃吸収具及び車両用バンパ装置
US8705616B2 (en) 2010-06-11 2014-04-22 Microsoft Corporation Parallel multiple bitrate video encoding to reduce latency and dependences between groups of pictures
JP5331249B2 (ja) * 2010-07-05 2013-10-30 日本電信電話株式会社 符号化方法、復号方法、装置、プログラムおよび記録媒体
KR101850724B1 (ko) * 2010-08-24 2018-04-23 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
ES2933477T3 (es) 2010-09-16 2023-02-09 Dolby Int Ab Transposición armónica basada en bloque de subbanda mejorado de producto cruzado
US8924200B2 (en) * 2010-10-15 2014-12-30 Motorola Mobility Llc Audio signal bandwidth extension in CELP-based speech coder
JP5719941B2 (ja) * 2011-02-09 2015-05-20 テレフオンアクチーボラゲット エル エム エリクソン(パブル) オーディオ信号の効率的なエンコーディング/デコーディング
EP2707874A4 (en) 2011-05-13 2014-12-03 Samsung Electronics Co Ltd BIT ASSIGNMENT AND AUDIO CODING AND DECODING
US9591318B2 (en) * 2011-09-16 2017-03-07 Microsoft Technology Licensing, Llc Multi-layer encoding and decoding
PL397008A1 (pl) * 2011-11-17 2013-05-27 Politechnika Poznanska Sposób kodowania obrazu
US11089343B2 (en) 2012-01-11 2021-08-10 Microsoft Technology Licensing, Llc Capability advertisement, configuration and control for video coding and decoding
WO2013147709A1 (en) * 2012-03-28 2013-10-03 Agency For Science, Technology And Research Method for transmitting a digital signal, method for receiving a digital signal, transmission arrangement and communication device
EP2830059A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise filling energy adjustment
EP2830055A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Context-based entropy coding of sample values of a spectral envelope
TWI579831B (zh) * 2013-09-12 2017-04-21 杜比國際公司 用於參數量化的方法、用於量化的參數之解量化方法及其電腦可讀取的媒體、音頻編碼器、音頻解碼器及音頻系統
GB2545434B (en) * 2015-12-15 2020-01-08 Sonic Data Ltd Improved method, apparatus and system for embedding data within a data stream
US10146500B2 (en) 2016-08-31 2018-12-04 Dts, Inc. Transform-based audio codec and method with subband energy smoothing
JP6650536B2 (ja) 2016-12-27 2020-02-19 三井化学株式会社 マウスピース
EP3382700A1 (en) 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using a transient location detection
EP3382701A1 (en) 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using prediction based shaping
ES2930374T3 (es) 2017-11-17 2022-12-09 Fraunhofer Ges Forschung Aparato y método para codificar o decodificar parámetros de codificación de audio direccional utilizando diferentes resoluciones de tiempo/frecuencia
US10950251B2 (en) 2018-03-05 2021-03-16 Dts, Inc. Coding of harmonic signals in transform-based audio codecs
US10586546B2 (en) 2018-04-26 2020-03-10 Qualcomm Incorporated Inversely enumerated pyramid vector quantizers for efficient rate adaptation in audio coding
US10573331B2 (en) * 2018-05-01 2020-02-25 Qualcomm Incorporated Cooperative pyramid vector quantizers for scalable audio coding

Family Cites Families (240)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3240380A (en) * 1957-08-07 1966-03-15 Mueller Co Line stopping and valve inserting apparatus and method
US3684838A (en) 1968-06-26 1972-08-15 Kahn Res Lab Single channel audio signal transmission system
US4251688A (en) * 1979-01-15 1981-02-17 Ana Maria Furner Audio-digital processing system for demultiplexing stereophonic/quadriphonic input audio signals into 4-to-72 output audio signals
DE3171990D1 (en) 1981-04-30 1985-10-03 Ibm Speech coding methods and apparatus for carrying out the method
JPS5921039B2 (ja) 1981-11-04 1984-05-17 日本電信電話株式会社 適応予測符号化方式
CA1253255A (en) 1983-05-16 1989-04-25 Nec Corporation System for simultaneously coding and decoding a plurality of signals
GB8421498D0 (en) 1984-08-24 1984-09-26 British Telecomm Frequency domain speech coding
US4609686A (en) 1985-04-19 1986-09-02 The Standard Oil Company 100 percent solids epoxy, nitrile coating compositions and method of making same
US4776014A (en) 1986-09-02 1988-10-04 General Electric Company Method for pitch-aligned high-frequency regeneration in RELP vocoders
GB2205465B (en) 1987-05-13 1991-09-04 Ricoh Kk Image transmission system
US4922537A (en) * 1987-06-02 1990-05-01 Frederiksen & Shu Laboratories, Inc. Method and apparatus employing audio frequency offset extraction and floating-point conversion for digitally encoding and decoding high-fidelity audio signals
US4907276A (en) * 1988-04-05 1990-03-06 The Dsp Group (Israel) Ltd. Fast search method for vector quantizer communication and pattern recognition systems
US5222189A (en) * 1989-01-27 1993-06-22 Dolby Laboratories Licensing Corporation Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio
US5752225A (en) * 1989-01-27 1998-05-12 Dolby Laboratories Licensing Corporation Method and apparatus for split-band encoding and split-band decoding of audio information using adaptive bit allocation to adjacent subbands
US5479562A (en) 1989-01-27 1995-12-26 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding audio information
US5142656A (en) 1989-01-27 1992-08-25 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5357594A (en) 1989-01-27 1994-10-18 Dolby Laboratories Licensing Corporation Encoding and decoding using specially designed pairs of analysis and synthesis windows
DE69032624T2 (de) 1989-01-27 1999-03-25 Dolby Lab Licensing Corp Formatierung eines kodierten Signals für Kodierer und Dekodierer eines Audiosystems hoher Qualität
US5297236A (en) * 1989-01-27 1994-03-22 Dolby Laboratories Licensing Corporation Low computational-complexity digital filter bank for encoder, decoder, and encoder/decoder
EP0386418B1 (de) * 1989-03-06 1994-12-21 Robert Bosch Gmbh Verfahren zur Datenreduktion bei digitalen Tonsignalen und zur genäherten Rückgewinnung der digitalen Tonsignale
US5539829A (en) 1989-06-02 1996-07-23 U.S. Philips Corporation Subband coded digital transmission system using some composite signals
US5115240A (en) * 1989-09-26 1992-05-19 Sony Corporation Method and apparatus for encoding voice signals divided into a plurality of frequency bands
JP2921879B2 (ja) 1989-09-29 1999-07-19 株式会社東芝 画像データ処理装置
US5185800A (en) * 1989-10-13 1993-02-09 Centre National D'etudes Des Telecommunications Bit allocation device for transformed digital audio broadcasting signals with adaptive quantization based on psychoauditive criterion
US5040217A (en) 1989-10-18 1991-08-13 At&T Bell Laboratories Perceptual coding of audio signals
JP2560873B2 (ja) * 1990-02-28 1996-12-04 日本ビクター株式会社 直交変換符号化復号化方法
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
US5388181A (en) * 1990-05-29 1995-02-07 Anderson; David J. Digital audio compression system
JP3033156B2 (ja) 1990-08-24 2000-04-17 ソニー株式会社 ディジタル信号符号化装置
SG47586A1 (en) * 1990-12-21 1998-04-17 British Telecomm Speech coding
ATE138238T1 (de) * 1991-01-08 1996-06-15 Dolby Lab Licensing Corp Kodierer/dekodierer für mehrdimensionale schallfelder
US5274740A (en) 1991-01-08 1993-12-28 Dolby Laboratories Licensing Corporation Decoder for variable number of channel presentation of multidimensional sound fields
US5559900A (en) 1991-03-12 1996-09-24 Lucent Technologies Inc. Compression of signals for perceptual quality by selecting frequency bands having relatively high energy
US5870497A (en) * 1991-03-15 1999-02-09 C-Cube Microsystems Decoder for compressed video signals
AU1996292A (en) 1991-05-17 1992-12-30 Analytic Sciences Corporation, The Continuous-tone image compression
GB2257606B (en) * 1991-06-28 1995-01-18 Sony Corp Recording and/or reproducing apparatuses and signal processing methods for compressed data
US5487086A (en) * 1991-09-13 1996-01-23 Comsat Corporation Transform vector quantization for adaptive predictive coding
JP3141450B2 (ja) 1991-09-30 2001-03-05 ソニー株式会社 オーディオ信号処理方法
EP0551705A3 (en) 1992-01-15 1993-08-18 Ericsson Ge Mobile Communications Inc. Method for subbandcoding using synthetic filler signals for non transmitted subbands
US5369724A (en) 1992-01-17 1994-11-29 Massachusetts Institute Of Technology Method and apparatus for encoding, decoding and compression of audio-type data using reference coefficients located within a band of coefficients
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
EP0559348A3 (en) * 1992-03-02 1993-11-03 AT&T Corp. Rate control loop processor for perceptual encoder/decoder
FR2688371B1 (fr) * 1992-03-03 1997-05-23 France Telecom Procede et systeme de spatialisation artificielle de signaux audio-numeriques.
DE4209544A1 (de) 1992-03-24 1993-09-30 Inst Rundfunktechnik Gmbh Verfahren zum Übertragen oder Speichern digitalisierter, mehrkanaliger Tonsignale
US5295203A (en) * 1992-03-26 1994-03-15 General Instrument Corporation Method and apparatus for vector coding of video transform coefficients
JP2693893B2 (ja) 1992-03-30 1997-12-24 松下電器産業株式会社 ステレオ音声符号化方法
JP2779886B2 (ja) * 1992-10-05 1998-07-23 日本電信電話株式会社 広帯域音声信号復元方法
JP3343965B2 (ja) 1992-10-31 2002-11-11 ソニー株式会社 音声符号化方法及び復号化方法
JP3343962B2 (ja) 1992-11-11 2002-11-11 ソニー株式会社 高能率符号化方法及び装置
US5455888A (en) 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
JP3186307B2 (ja) 1993-03-09 2001-07-11 ソニー株式会社 圧縮データ記録装置及び方法
ES2165370T3 (es) * 1993-06-22 2002-03-16 Thomson Brandt Gmbh Metodo para obtener una matriz decodificadora multicanal.
TW272341B (zh) 1993-07-16 1996-03-11 Sony Co Ltd
US5623577A (en) * 1993-07-16 1997-04-22 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions
US5632003A (en) * 1993-07-16 1997-05-20 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for coding method and apparatus
US5581653A (en) 1993-08-31 1996-12-03 Dolby Laboratories Licensing Corporation Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder
US5737720A (en) * 1993-10-26 1998-04-07 Sony Corporation Low bit rate multichannel audio coding methods and apparatus using non-linear adaptive bit allocation
US5684920A (en) 1994-03-17 1997-11-04 Nippon Telegraph And Telephone Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein
DE4409368A1 (de) 1994-03-18 1995-09-21 Fraunhofer Ges Forschung Verfahren zum Codieren mehrerer Audiosignale
JP3277677B2 (ja) 1994-04-01 2002-04-22 ソニー株式会社 信号符号化方法及び装置、信号記録媒体、信号伝送方法、並びに信号復号化方法及び装置
US5574824A (en) 1994-04-11 1996-11-12 The United States Of America As Represented By The Secretary Of The Air Force Analysis/synthesis-based microphone array speech enhancer with variable signal distortion
JP3362534B2 (ja) * 1994-11-18 2003-01-07 ヤマハ株式会社 ベクトル量子化による符号化復号方式
US5635930A (en) 1994-10-03 1997-06-03 Sony Corporation Information encoding method and apparatus, information decoding method and apparatus and recording medium
AU697176B2 (en) 1994-11-04 1998-10-01 Koninklijke Philips Electronics N.V. Encoding and decoding of a wideband digital information signal
US5654702A (en) 1994-12-16 1997-08-05 National Semiconductor Corp. Syntax-based arithmetic coding for low bit rate videophone
US5629780A (en) * 1994-12-19 1997-05-13 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Image data compression having minimum perceptual error
JP3189614B2 (ja) * 1995-03-13 2001-07-16 松下電器産業株式会社 音声帯域拡大装置
JP2956548B2 (ja) * 1995-10-05 1999-10-04 松下電器産業株式会社 音声帯域拡大装置
US6041295A (en) * 1995-04-10 2000-03-21 Corporate Computer Systems Comparing CODEC input/output to adjust psycho-acoustic parameters
US6940840B2 (en) 1995-06-30 2005-09-06 Interdigital Technology Corporation Apparatus for adaptive reverse power control for spread-spectrum communications
ZA965340B (en) * 1995-06-30 1997-01-27 Interdigital Tech Corp Code division multiple access (cdma) communication system
US5790759A (en) 1995-09-19 1998-08-04 Lucent Technologies Inc. Perceptual noise masking measure based on synthesis filter frequency response
US5960390A (en) 1995-10-05 1999-09-28 Sony Corporation Coding method for using multi channel audio signals
DE19549621B4 (de) 1995-10-06 2004-07-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung zum Codieren von Audiosignalen
US5819215A (en) * 1995-10-13 1998-10-06 Dobson; Kurt Method and apparatus for wavelet based data compression having adaptive bit rate control for compression of digital audio or other sensory data
US5777678A (en) 1995-10-26 1998-07-07 Sony Corporation Predictive sub-band video coding and decoding using motion compensation
US5956674A (en) 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5686964A (en) 1995-12-04 1997-11-11 Tabatabai; Ali Bit rate control mechanism for digital image and video data compression
WO1997029549A1 (fr) 1996-02-08 1997-08-14 Matsushita Electric Industrial Co., Ltd. Codeur, decodeur, codeur-decodeur et support d'enregistrement de signal audio large bande
US5852806A (en) 1996-03-19 1998-12-22 Lucent Technologies Inc. Switched filterbank for use in audio signal coding
US5682152A (en) 1996-03-19 1997-10-28 Johnson-Grace Company Data compression using adaptive bit allocation and hybrid lossless entropy encoding
US5812971A (en) 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
SE506341C2 (sv) 1996-04-10 1997-12-08 Ericsson Telefon Ab L M Metod och anordning för rekonstruktion av en mottagen talsignal
US5822370A (en) 1996-04-16 1998-10-13 Aura Systems, Inc. Compression/decompression for preservation of high fidelity speech quality at low bandwidth
DE19628293C1 (de) 1996-07-12 1997-12-11 Fraunhofer Ges Forschung Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion
DE19628292B4 (de) 1996-07-12 2007-08-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zum Codieren und Decodieren von Stereoaudiospektralwerten
US6697491B1 (en) 1996-07-19 2004-02-24 Harman International Industries, Incorporated 5-2-5 matrix encoder and decoder system
US5870480A (en) * 1996-07-19 1999-02-09 Lexicon Multichannel active matrix encoder and decoder with maximum lateral separation
US5969750A (en) 1996-09-04 1999-10-19 Winbcnd Electronics Corporation Moving picture camera with universal serial bus interface
US5745275A (en) * 1996-10-15 1998-04-28 Lucent Technologies Inc. Multi-channel stabilization of a multi-channel transmitter through correlation feedback
SG54379A1 (en) * 1996-10-24 1998-11-16 Sgs Thomson Microelectronics A Audio decoder with an adaptive frequency domain downmixer
US5886276A (en) * 1997-01-16 1999-03-23 The Board Of Trustees Of The Leland Stanford Junior University System and method for multiresolution scalable audio signal encoding
FI970266A (fi) * 1997-01-22 1998-07-23 Nokia Telecommunications Oy Menetelmä solukkoradiojärjestelmän ohjauskanavien kantaman pidentämiseksi ja solukkoradiojärjestelmä
EP1397006B1 (en) 1997-02-08 2009-07-22 Panasonic Corporation Quantization matrix for still and moving picture coding
US20010017941A1 (en) 1997-03-14 2001-08-30 Navin Chaddha Method and apparatus for table-based compression with embedded coding
KR100265112B1 (ko) 1997-03-31 2000-10-02 윤종용 디브이디 디스크와 디브이디 디스크를 재생하는 장치 및 방법
US6064954A (en) * 1997-04-03 2000-05-16 International Business Machines Corp. Digital audio signal coding
JP3887827B2 (ja) 1997-04-10 2007-02-28 ソニー株式会社 符号化方法及び装置、復号化方法及び装置、並びに記録媒体
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
DE19730129C2 (de) 1997-07-14 2002-03-07 Fraunhofer Ges Forschung Verfahren zum Signalisieren einer Rauschsubstitution beim Codieren eines Audiosignals
DE19730130C2 (de) 1997-07-14 2002-02-28 Fraunhofer Ges Forschung Verfahren zum Codieren eines Audiosignals
US5890125A (en) * 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
WO1999014983A1 (en) * 1997-09-16 1999-03-25 Lake Dsp Pty. Limited Utilisation of filtering effects in stereo headphone devices to enhance spatialization of source around a listener
JPH11122120A (ja) * 1997-10-17 1999-04-30 Sony Corp 符号化方法及び装置、並びに復号化方法及び装置
US6959220B1 (en) 1997-11-07 2005-10-25 Microsoft Corporation Digital audio signal filtering mechanism and method
US6253185B1 (en) 1998-02-25 2001-06-26 Lucent Technologies Inc. Multiple description transform coding of audio using optimal transforms of arbitrary dimension
US6249614B1 (en) 1998-03-06 2001-06-19 Alaris, Inc. Video compression and decompression using dynamic quantization and/or encoding
US6353807B1 (en) * 1998-05-15 2002-03-05 Sony Corporation Information coding method and apparatus, code transform method and apparatus, code transform control method and apparatus, information recording method and apparatus, and program providing medium
US6029126A (en) 1998-06-30 2000-02-22 Microsoft Corporation Scalable audio coder and decoder
US6115689A (en) 1998-05-27 2000-09-05 Microsoft Corporation Scalable audio coder and decoder
JP3998330B2 (ja) * 1998-06-08 2007-10-24 沖電気工業株式会社 符号化装置
US6266003B1 (en) 1998-08-28 2001-07-24 Sigma Audio Research Limited Method and apparatus for signal processing for time-scale and/or pitch modification of audio signals
DE19840835C2 (de) 1998-09-07 2003-01-09 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Entropiecodieren von Informationswörtern und Vorrichtung und Verfahren zum Decodieren von Entropie-codierten Informationswörtern
US7272556B1 (en) * 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
SE519552C2 (sv) 1998-09-30 2003-03-11 Ericsson Telefon Ab L M Flerkanalig signalkodning och -avkodning
CA2252170A1 (en) 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6498865B1 (en) 1999-02-11 2002-12-24 Packetvideo Corp,. Method and device for control and compatible delivery of digitally compressed visual data in a heterogeneous communication network
US6778709B1 (en) 1999-03-12 2004-08-17 Hewlett-Packard Development Company, L.P. Embedded block coding with optimized truncation
CA2859333A1 (en) * 1999-04-07 2000-10-12 Dolby Laboratories Licensing Corporation Matrix improvements to lossless encoding and decoding
US6952774B1 (en) * 1999-05-22 2005-10-04 Microsoft Corporation Audio watermarking with dual watermarks
US6370502B1 (en) * 1999-05-27 2002-04-09 America Online, Inc. Method and system for reduction of quantization-induced block-discontinuities and general purpose audio codec
US6226616B1 (en) 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
US6658162B1 (en) 1999-06-26 2003-12-02 Sharp Laboratories Of America Image coding method using visual optimization
US6604070B1 (en) * 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
US6418405B1 (en) 1999-09-30 2002-07-09 Motorola, Inc. Method and apparatus for dynamic segmentation of a low bit rate digital voice message
US6496798B1 (en) 1999-09-30 2002-12-17 Motorola, Inc. Method and apparatus for encoding and decoding frames of voice model parameters into a low bit rate digital voice message
US6836761B1 (en) 1999-10-21 2004-12-28 Yamaha Corporation Voice converter for assimilation by frame synthesis with temporal alignment
FI19992351A (fi) 1999-10-29 2001-04-30 Nokia Mobile Phones Ltd Puheentunnistus
US7096240B1 (en) 1999-10-30 2006-08-22 Stmicroelectronics Asia Pacific Pte Ltd. Channel coupling for an AC-3 encoder
US6738074B2 (en) * 1999-12-29 2004-05-18 Texas Instruments Incorporated Image compression system and method
US6499010B1 (en) 2000-01-04 2002-12-24 Agere Systems Inc. Perceptual audio coder bit allocation scheme providing improved perceptual quality consistency
US6704711B2 (en) * 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
US6434190B1 (en) 2000-02-10 2002-08-13 Texas Instruments Incorporated Generalized precoder for the upstream voiceband modem channel
AU2001262748A1 (en) 2000-06-14 2001-12-24 Kabushiki Kaisha Kenwood Frequency interpolating device and frequency interpolating method
JP3538122B2 (ja) * 2000-06-14 2004-06-14 株式会社ケンウッド 周波数補間装置、周波数補間方法及び記録媒体
US6601032B1 (en) 2000-06-14 2003-07-29 Intervideo, Inc. Fast code length search method for MPEG audio encoding
JP3576942B2 (ja) 2000-08-29 2004-10-13 株式会社ケンウッド 周波数補間システム、周波数補間装置、周波数補間方法及び記録媒体
EP1175030B1 (en) 2000-07-07 2008-02-20 Nokia Siemens Networks Oy Method and system for multichannel perceptual audio coding using the cascaded discrete cosine transform or modified discrete cosine transform
US6771723B1 (en) 2000-07-14 2004-08-03 Dennis W. Davis Normalized parametric adaptive matched filter receiver
JP3576936B2 (ja) * 2000-07-21 2004-10-13 株式会社ケンウッド 周波数補間装置、周波数補間方法及び記録媒体
DE10041512B4 (de) * 2000-08-24 2005-05-04 Infineon Technologies Ag Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
US6760698B2 (en) 2000-09-15 2004-07-06 Mindspeed Technologies Inc. System for coding speech information using an adaptive codebook with enhanced variable resolution scheme
US7003467B1 (en) * 2000-10-06 2006-02-21 Digital Theater Systems, Inc. Method of decoding two-channel matrix encoded audio to reconstruct multichannel audio
JP3881836B2 (ja) * 2000-10-24 2007-02-14 株式会社ケンウッド 周波数補間装置、周波数補間方法及び記録媒体
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
US6463408B1 (en) 2000-11-22 2002-10-08 Ericsson, Inc. Systems and methods for improving power spectral estimation of speech signals
US7177808B2 (en) * 2000-11-29 2007-02-13 The United States Of America As Represented By The Secretary Of The Air Force Method for improving speaker identification by determining usable speech
JP3887531B2 (ja) * 2000-12-07 2007-02-28 株式会社ケンウッド 信号補間装置、信号補間方法及び記録媒体
KR100433516B1 (ko) * 2000-12-08 2004-05-31 삼성전자주식회사 트랜스코딩 방법
WO2002052896A2 (en) * 2000-12-22 2002-07-04 Koninklijke Philips Electronics N.V. Multi-channel audio converter
US7062445B2 (en) 2001-01-26 2006-06-13 Microsoft Corporation Quantization loop with heuristic approach
JP3468464B2 (ja) 2001-02-01 2003-11-17 理化学研究所 形状と物性を統合したボリュームデータ生成方法
EP1231793A1 (en) * 2001-02-09 2002-08-14 STMicroelectronics S.r.l. A process for changing the syntax, resolution and bitrate of MPEG bitstreams, a system and a computer program product therefor
GB0103245D0 (en) 2001-02-09 2001-03-28 Radioscape Ltd Method of inserting additional data into a compressed signal
GB0108080D0 (en) 2001-03-30 2001-05-23 Univ Bath Audio compression
SE522553C2 (sv) * 2001-04-23 2004-02-17 Ericsson Telefon Ab L M Bandbreddsutsträckning av akustiska signaler
CN1312662C (zh) 2001-05-10 2007-04-25 杜比实验室特许公司 通过降低前噪声改善音频编码系统的瞬时性能的方法
JP4506039B2 (ja) 2001-06-15 2010-07-21 ソニー株式会社 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム
US7174135B2 (en) * 2001-06-28 2007-02-06 Koninklijke Philips Electronics N. V. Wideband signal transmission system
WO2003003345A1 (fr) * 2001-06-29 2003-01-09 Kabushiki Kaisha Kenwood Dispositif et procede d'interpolation des composantes de frequence d'un signal
JP3984468B2 (ja) 2001-12-14 2007-10-03 松下電器産業株式会社 符号化装置、復号化装置及び符号化方法
JP3926726B2 (ja) * 2001-11-14 2007-06-06 松下電器産業株式会社 符号化装置および復号化装置
EP1444688B1 (en) 2001-11-14 2006-08-16 Matsushita Electric Industrial Co., Ltd. Encoding device and decoding device
WO2003044775A1 (en) 2001-11-23 2003-05-30 Koninklijke Philips Electronics N.V. Perceptual noise substitution
US7460993B2 (en) 2001-12-14 2008-12-02 Microsoft Corporation Adaptive window-size selection in transform coding
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7027982B2 (en) 2001-12-14 2006-04-11 Microsoft Corporation Quality and rate control strategy for digital audio
US7146313B2 (en) 2001-12-14 2006-12-05 Microsoft Corporation Techniques for measurement of perceptual audio quality
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
JP4272897B2 (ja) 2002-01-30 2009-06-03 パナソニック株式会社 符号化装置、復号化装置およびその方法
US7110941B2 (en) 2002-03-28 2006-09-19 Microsoft Corporation System and method for embedded audio coding with implicit auditory masking
US7310598B1 (en) 2002-04-12 2007-12-18 University Of Central Florida Research Foundation, Inc. Energy based split vector quantizer employing signal representation in multiple transform domains
US7158539B2 (en) 2002-04-16 2007-01-02 Microsoft Corporation Error resilient windows media audio coding
JP2003316394A (ja) 2002-04-23 2003-11-07 Nec Corp 音声復号システム、及び、音声復号方法、並びに、音声復号プログラム
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
US7072726B2 (en) 2002-06-19 2006-07-04 Microsoft Corporation Converting M channels of digital audio data into N channels of digital audio data
US7308232B2 (en) 2002-06-21 2007-12-11 Lucent Technologies Inc. Method and apparatus for estimating a channel based on channel statistics
BRPI0305434B1 (pt) 2002-07-12 2017-06-27 Koninklijke Philips Electronics N.V. Methods and arrangements for encoding and decoding a multichannel audio signal, and multichannel audio coded signal
US7542896B2 (en) 2002-07-16 2009-06-02 Koninklijke Philips Electronics N.V. Audio coding/decoding with spatial parameters and non-uniform segmentation for transients
US7043423B2 (en) * 2002-07-16 2006-05-09 Dolby Laboratories Licensing Corporation Low bit-rate audio coding systems and methods that use expanding quantizers with arithmetic coding
WO2004013841A1 (en) 2002-08-01 2004-02-12 Matsushita Electric Industrial Co., Ltd. Audio decoding apparatus and audio decoding method based on spectral band repliction
US7146315B2 (en) 2002-08-30 2006-12-05 Siemens Corporate Research, Inc. Multichannel voice detection in adverse environments
US7299190B2 (en) * 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
JP3646939B1 (ja) 2002-09-19 2005-05-11 松下電器産業株式会社 オーディオ復号装置およびオーディオ復号方法
US20060106597A1 (en) * 2002-09-24 2006-05-18 Yaakov Stein System and method for low bit-rate compression of combined speech and music
US7330812B2 (en) * 2002-10-04 2008-02-12 National Research Council Of Canada Method and apparatus for transmitting an audio stream having additional payload in a hidden sub-channel
US7243064B2 (en) * 2002-11-14 2007-07-10 Verizon Business Global Llc Signal processing of multi-channel data
JP2004198485A (ja) 2002-12-16 2004-07-15 Victor Co Of Japan Ltd 音響符号化信号復号化装置及び音響符号化信号復号化プログラム
KR100908117B1 (ko) 2002-12-16 2009-07-16 삼성전자주식회사 비트율 조절가능한 오디오 부호화 방법, 복호화 방법,부호화 장치 및 복호화 장치
US6965859B2 (en) 2003-02-28 2005-11-15 Xvd Corporation Method and apparatus for audio compression
SG135920A1 (en) 2003-03-07 2007-10-29 St Microelectronics Asia Device and process for use in encoding audio data
PL1618763T3 (pl) * 2003-04-17 2007-07-31 Koninl Philips Electronics Nv Synteza sygnału audio
WO2004098105A1 (en) 2003-04-30 2004-11-11 Nokia Corporation Support of a multichannel audio extension
US7318035B2 (en) * 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
US7548852B2 (en) 2003-06-30 2009-06-16 Koninklijke Philips Electronics N.V. Quality of decoded audio by adding noise
WO2005031704A1 (en) * 2003-09-29 2005-04-07 Koninklijke Philips Electronics N.V. Encoding audio signals
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
ATE471557T1 (de) * 2003-10-23 2010-07-15 Panasonic Corp Spektrum-codierungseinrichtung, spektrum- decodierungseinrichtung, übertragungseinrichtung für akustische signale, empfangseinrichtung für akustische signale und verfahren dafür
US7519538B2 (en) * 2003-10-30 2009-04-14 Koninklijke Philips Electronics N.V. Audio signal encoding or decoding
US7809579B2 (en) 2003-12-19 2010-10-05 Telefonaktiebolaget Lm Ericsson (Publ) Fidelity-optimized variable frame length encoding
US7394903B2 (en) 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
EP2065885B1 (en) 2004-03-01 2010-07-28 Dolby Laboratories Licensing Corporation Multichannel audio decoding
US7805313B2 (en) 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
BRPI0509113B8 (pt) 2004-04-05 2018-10-30 Koninklijke Philips Nv codificador de multicanal, método para codificar sinais de entrada, conteúdo de dados codificados, portador de dados, e, decodificador operável para decodificar dados de saída codificados
FI119533B (fi) 2004-04-15 2008-12-15 Nokia Corp Audiosignaalien koodaus
SE0400997D0 (sv) 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Efficient coding of multi-channel audio
EP1749296B1 (en) 2004-05-28 2010-07-14 Nokia Corporation Multichannel audio extension
KR100634506B1 (ko) * 2004-06-25 2006-10-16 삼성전자주식회사 저비트율 부호화/복호화 방법 및 장치
US7352858B2 (en) 2004-06-30 2008-04-01 Microsoft Corporation Multi-channel echo cancellation with round robin regularization
KR100773539B1 (ko) * 2004-07-14 2007-11-05 삼성전자주식회사 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치
US20060025991A1 (en) * 2004-07-23 2006-02-02 Lg Electronics Inc. Voice coding apparatus and method using PLP in mobile communications terminal
CN101010725A (zh) 2004-08-26 2007-08-01 松下电器产业株式会社 多信道信号编码装置以及多信道信号解码装置
US7630902B2 (en) * 2004-09-17 2009-12-08 Digital Rise Technology Co., Ltd. Apparatus and methods for digital audio coding using codebook application ranges
ATE429698T1 (de) * 2004-09-17 2009-05-15 Harman Becker Automotive Sys Bandbreitenerweiterung von bandbegrenzten tonsignalen
SE0402652D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
US7508863B2 (en) 2004-12-13 2009-03-24 Alcatel-Lucent Usa Inc. Method of processing multi-path signals
US20060259303A1 (en) 2005-05-12 2006-11-16 Raimo Bakis Systems and methods for pitch smoothing for text-to-speech synthesis
US7548853B2 (en) * 2005-06-17 2009-06-16 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
US7562021B2 (en) 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7684981B2 (en) * 2005-07-15 2010-03-23 Microsoft Corporation Prediction of spectral coefficients in waveform coding and decoding
US7693709B2 (en) * 2005-07-15 2010-04-06 Microsoft Corporation Reordering coefficients for waveform coding or decoding
US7630882B2 (en) 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7539612B2 (en) * 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
WO2007043808A1 (en) * 2005-10-12 2007-04-19 Samsung Electronics Co., Ltd. Method and apparatus for processing/transmitting bit-stream, and method and apparatus for receiving/processing bit-stream
US20070094035A1 (en) * 2005-10-21 2007-04-26 Nokia Corporation Audio coding
US20070168197A1 (en) 2006-01-18 2007-07-19 Nokia Corporation Audio coding
US7953604B2 (en) 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US8190425B2 (en) 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7831434B2 (en) 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
DE602006002381D1 (de) * 2006-04-24 2008-10-02 Nero Ag Erweiterte vorrichtung zur kodierung digitaler audiodaten
US8379868B2 (en) 2006-05-17 2013-02-19 Creative Technology Ltd Spatial audio coding based on universal spatial cues
US8135047B2 (en) * 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
US7774205B2 (en) 2007-06-15 2010-08-10 Microsoft Corporation Coding of sparse digital media spectral data
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8249883B2 (en) * 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source

Also Published As

Publication number Publication date
JP2011186479A (ja) 2011-09-22
KR20110093953A (ko) 2011-08-18
CN1813286A (zh) 2006-08-02
JP2014240963A (ja) 2014-12-25
US8645127B2 (en) 2014-02-04
KR101130355B1 (ko) 2012-03-27
US20050165611A1 (en) 2005-07-28
EP1730725A4 (en) 2007-05-30
KR20060121655A (ko) 2006-11-29
JP2017037311A (ja) 2017-02-16
US7460990B2 (en) 2008-12-02
ATE451684T1 (de) 2009-12-15
US20090083046A1 (en) 2009-03-26
KR101083572B1 (ko) 2011-11-14
JP6262820B2 (ja) 2018-01-17
KR101251813B1 (ko) 2013-04-09
DE602004024591D1 (de) 2010-01-21
WO2005076260A1 (en) 2005-08-18
KR20110042137A (ko) 2011-04-22
EP1730725A1 (en) 2006-12-13
JP2007532934A (ja) 2007-11-15
JP4745986B2 (ja) 2011-08-10
EP1730725B1 (en) 2009-12-09

Similar Documents

Publication Publication Date Title
CN1813286B (zh) 音频编码方法、音频编码器以及数字介质编码方法
CN101223582B (zh) 一种音频编码方法、音频解码方法及音频编码器
CN101223570B (zh) 获得用于数字媒体的高效编码的频带的频率分段
CN103065637B (zh) 音频编码器和解码器
CN101484937B (zh) 使用缓冲器调节对已预测编码的数据进行解码
KR101238239B1 (ko) 인코더
CN102047564B (zh) 将重叠变换因式分解成两个块变换
CN101371296B (zh) 用于编码和解码信号的设备和方法
CN101496098A (zh) 用于以与音频信号相关联的帧修改窗口的系统及方法
WO2015146860A1 (ja) 音声復号装置、音声符号化装置、音声復号方法、音声符号化方法、音声復号プログラム、および音声符号化プログラム
JPWO2005064594A1 (ja) 音声・楽音符号化装置及び音声・楽音符号化方法
KR101387808B1 (ko) 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치
US20120123788A1 (en) Coding method, decoding method, and device and program using the methods
CN101308657A (zh) 一种基于先进音频编码器的码流合成方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: MICROSOFT TECHNOLOGY LICENSING LLC

Free format text: FORMER OWNER: MICROSOFT CORP.

Effective date: 20150421

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20150421

Address after: Washington State

Patentee after: Micro soft technique license Co., Ltd

Address before: Washington State

Patentee before: Microsoft Corp.