CN101836252A - 用于在音频代码化系统中生成增强层的方法和装置 - Google Patents

用于在音频代码化系统中生成增强层的方法和装置 Download PDF

Info

Publication number
CN101836252A
CN101836252A CN200880113244A CN200880113244A CN101836252A CN 101836252 A CN101836252 A CN 101836252A CN 200880113244 A CN200880113244 A CN 200880113244A CN 200880113244 A CN200880113244 A CN 200880113244A CN 101836252 A CN101836252 A CN 101836252A
Authority
CN
China
Prior art keywords
sound signal
encode
signal
yield value
encode sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200880113244A
Other languages
English (en)
Other versions
CN101836252B (zh
Inventor
詹姆斯·P·阿什利
乔纳森·A·吉布斯
乌达·米塔尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google Technology Holdings LLC
Original Assignee
Motorola Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Motorola Inc filed Critical Motorola Inc
Publication of CN101836252A publication Critical patent/CN101836252A/zh
Application granted granted Critical
Publication of CN101836252B publication Critical patent/CN101836252B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

在操作期间,待代码化的输入信号被接收并被代码化以产生代码化音频信号。随后利用多个增益值对代码化音频信号进行调节以产生多个调节代码化音频信号,每个调节代码化音频信号具有关联的增益值,以及,确定输入信号和多个调节代码化音频信号中的每个调节代码化音频信号之间存在的多个误差值。随后选择与调节代码化音频信号关联的增益值,该增益值导致输入信号和调节代码化音频信号之间存在的低的误差值。最后,将低误差值与增益值一起发射,作为对代码化音频信号的增强层的一部分。

Description

用于在音频代码化系统中生成增强层的方法和装置
技术领域
本发明总体上涉及通信系统,并且更具体地,涉及在该通信系统中对语音和音频信号进行代码化。
背景技术
数字语音和音频信号的压缩是公知的。通常需要压缩以通过通信信道高效地发射信号,或者将压缩信号存储在诸如固态存储器设备或计算机硬盘之类的数字媒体设备上。尽管存在许多的压缩(或“代码化”)技术,但是对于数字语音代码化而言已经非常普遍的一种技术被称为码激励线性预测(CELP),其是“分析合成”代码化算法系列中的一种算法。分析合成通常意指如下代码化过程,通过该代码化过程使用数字模型的多个参数对一组候选信号进行合成,将这些候选信号与输入信号比较并进行失真分析。随后将产生最低失真的一组参数发射或存储,并且该组参数最终用于重建原始输入信号的估值。CELP是使用一个或多个码本的特定的分析合成方法,每个码本基本上包括响应于码本索引从码本检索的多组码向量。
在现代的CELP代码化器中,在以相当低的数据速率来维持高质量的语音和音频再现方面,存在问题。这对于未非常良好地配合CELP语音模型的音乐或其他普通音频信号而言尤其如此。在该情况中,模型失配可能引起严重劣化的音频质量,其对于使用该方法的设备的终端用户而言是不可接受的。因此,需要改进低比特速率下的CELP类型语音代码化器的性能,特别是针对音乐和其他非语音类型的输入。
附图说明
图1是现有技术的嵌入语音/音频压缩系统的框图。
图2是图1的现有技术的增强层编码器的更加详细的示例。
图3是图1的现有技术的增强层编码器的更加详细的示例。
图4是增强层编码器和解码器的框图。
图5是多层嵌入代码化系统的框图。
图6是层4编码器和解码器的框图。
图7是示出图4和图6的编码器的操作的流程图。
具体实施方式
为了解决上述需要,此处描述了一种用于在音频代码化系统中生成增强层的方法和装置。在操作期间,接收待代码化的输入信号并将其代码化以产生代码化音频信号。随后利用多个增益值对代码化音频信号进行调节以产生多个调节代码化音频信号,每个调节代码化音频信号具有关联的增益值,以及,确定在输入信号和多个调节代码化音频信号中的每个调节代码化音频信号之间存在的多个误差值。随后选择与调节代码化音频信号关联的一增益值,该增益值导致输入信号和调节代码化音频信号之间存在的低的误差值。最后,一起发射低误差值与增益值,作为针对代码化音频信号的增强层的一部分。
图1中示出了现有技术的嵌入语音/音频压缩系统。首先由核心层编码器102处理输入音频s(n),出于这些目的,该核心层编码器102可以是CELP类型的语音代码化算法。经编码的比特流被发射到信道110,并且被输入到本地核心层解码器104,在本地核心层解码器104生成重建的核心音频信号sc(n)。随后使用增强层编码器106对基于信号s(n)和sc(n)的某种比较的另外的信息代码化,并且增强层编码器106可选地可以使用来自核心层解码器104的参数。如核心层解码器104中的,核心层解码器114将核心层比特流参数转换为核心层音频信号
Figure GPA00001113737200021
随后增强层解码器116使用来自信道110的增强层比特流和信号
Figure GPA00001113737200022
以产生增强的音频输出信号
该嵌入代码化系统的主要优点在于,特定信道110可以不能恒定地支持与高质量音频代码化算法关联的带宽要求。然而,当增强层比特流被丢失或破坏时,嵌入代码化器允许从信道110接收部分比特流(例如,仅核心层比特流)以仅产生例如核心输出音频。然而,存在嵌入和非嵌入代码化器之间的质量折衷,还存在不同的嵌入代码化最优化目标之间的质量折衷。即,更高质量的增强层代码化可以帮助实现核心层和增强层之间的更好的平衡,并且还减少关于更好的传输特性(例如,减少的拥塞)的整体数据速率,这可以导致关于增强层的较低的分组错误率。
图2中给出了现有技术的增强层编码器106的更详细的示例。这里,误差信号生成器202包括经加权的差信号,误差信号编码器204将该差信号变换到MDCT(修改的离散余弦变换)域用于处理。误差信号E被给出为:
E=MDCT{W(s-sc)}                (1)
其中W是基于来自核心层解码器104的LP(线性预测)滤波系数A(z)的感知加权矩阵,s是来自输入音频信号s(n)的样本的向量(即,帧),并且sc是来自核心层解码器104的样本的相应向量。ITU-T建议G.729.1中描述了示例性MDCT过程。随后由误差信号编码器204处理误差信号E以产生码字iE,随后iE被发射到信道110。对于该示例,重要的是应注意到,误差信号编码器106被呈现为仅具有一个误差信号E并且输出一个关联的码字iE。其原因将在后面变得明显。
增强层解码器116随后从信道110接收经编码的比特流并且适当地对该比特流解复用以产生码字iE。误差信号解码器212使用码字iE重建增强层误差信号,随后
Figure GPA00001113737200032
与如下核心层输出音频信号
Figure GPA00001113737200033
(n)组合,以产生增强音频输出信号
s ^ = s c + W - 1 MDCT - 1 { E ^ } - - - ( 2 )
其中MDCT-1是逆MDCT(包括重叠相加),并且W-1是逆感知加权矩阵。
图3中示出了增强层编码器的另一示例。这里,误差信号生成器302生成误差信号E牵涉其中执行对核心层音频信号sc(n)的某种修改的自适应预调节。该过程导致生成某个数量的比特,其在增强层编码器106中被示为码字is
此外,增强层编码器106示出了被输入到误差信号编码器304的输入音频信号s(n)和经变换的核心层输出音频Sc。这些信号被用于构建用于增强层误差信号E的改进的代码化的心理声学模型。随后由MUX308使码字is和iE复用,并且随后将其发送到信道110用于随后由增强层解码器116解码。经代码化的比特流由解复用器310接收,其将该比特流分为分量is和iE。随后误差信号解码器312使用码字iE重建增强层误差信号
Figure GPA00001113737200041
。信号组合器314使用调节比特is以某种方式调节信号
Figure GPA00001113737200042
,并且随后将结果与增强层误差信号组合以产生增强的音频输出信号
Figure GPA00001113737200044
图4中给出了本发明的第一实施例。该图示出了增强层编码器406通过调节单元401接收核心层输出信号sc(n)。使用一组预定的增益{g}产生多个经调节的核心层输出信号{S},其中gj和Sj是各个组的第j个候选者。在调节单元401中,第一示例将(MDCT域)中的信号sc(n)处理为:
Sj=Gj×MDCT{Wsc};0≤j<M        (3)
其中W可以是某个感知加权矩阵,sc是来自核心层解码器104的样本的向量,MDCT是本领域中公知的操作,并且Gj可以是通过利用增益向量候选者gj而形成的增益矩阵,并且其中M是增益向量候选者的数量。尽管存在许多可能性,但在第一实施例中,Gj使用向量gj作为对角线并且在其他位置使用0(即,对角矩阵)。例如,Gj可以是带状矩阵,或者甚至可以是与单位矩阵I相乘的简单的纯量。可替选地,将信号Sj留在时域中可能具有某种优点,或者可能存在如下情况,在所述情况中将音频变换到诸如离散傅立叶变换(DFT)域的不同的域是有利的。许多该变换在本领域中是公知的。在这些情况中,调节单元可以基于各向量域输出适当的Sj
但是在任何情况中,对核心层输出音频进行调节的主要原因在于补偿可能引起输入信号和核心层编解码器之间的显著差异的模型失配(或者某些其他代码化缺陷)。例如,如果输入音频信号主要是音乐信号并且核心层编解码器基于语音模型,则核心层输出可能包含严重失真的信号特性,在该情况中,出于声音质量的角度,有利的是,借助于一个或更多个增强层,在应用信号的补充代码化之前,有选择地减小该信号分量的能量。
随后经增益调节的核心层音频候选向量Sj和输入音频s(n)可以用作针对误差信号生成器402的输入。在本发明的优选实施例中,输入音频信号s(n)被转换为向量S,使得S和Sj相应地对准。即,表示s(n)的向量s与sc在时间(相位)上对准,并且可以应用相应的操作,从而在优选实施例中:
Ej=MDCT{Ws}-Sj;0≤j<M。            (4)
该表达式产生了多个误差信号向量Ej,其表示输入音频和MDCT频谱域中的经增益调节的核心层输出音频之间的加权差。在其中考虑不同的域的其他实施例中,可以基于各个处理域修改上述表达式。
根据本发明的第一实施例,随后使用增益选择器404估计多个误差信号向量Ej以产生最优误差向量E*、最优增益参数g*,并且随后,产生相应的增益索引ig。增益选择器404可以使用多种方法确定最优参数E*和g*,这可能牵涉闭环方法(例如,失真度量的最小化)、开环方法(例如,启发式分类、模型性能估计等)或者这两种方法的组合。在优选实施例中,可以使用偏置失真度量,在下面将其作为原始音频信号向量S和复合重建信号向量之间的偏置能量差而给出:
j * = arg min 0 &le; j < M { &beta; j &CenterDot; | | S - ( S j + E ^ j ) | | 2 } - - - ( 5 )
其中可以是误差信号向量Ej的量化估值,并且βj可以是用于对选择感知最优增益误差索引j*的判决进行补充的偏置项。在题为“APPARATUS AND METHOD FOR LOW COMPLEXITYCOMBINATORIAL CODING OF SIGNALS”的美国专利申请号No.11/531122中给出了用于信号向量的向量量化的示例性方法,尽管许多其他方法是可能的。认识到Ej=S-Sj,式(5)可被重写为:
j * = arg min 0 &le; j < M { &beta; j &CenterDot; | | E j - E ^ j | | 2 } - - - ( 6 )
在该表达式中,项
Figure GPA00001113737200062
表示未量化的和量化的误差信号之间的差的能量。为了清楚起见,该量可被称为“残余能量”,并且可被进一步用于估计其中选择最优增益参数g*的“增益选择标准”。式(6)中给出了一个该增益选择标准,尽管许多其他增益选择标准也是可能的。
对于偏置项βj的需要可以源于如下情况,其中式(3)和(4)中的误差加权函数W可能未充分地产生向量
Figure GPA00001113737200063
上的可相等地感知的失真。例如,尽管误差加权函数W可用于尝试将误差频谱“白化”到某种程度,但是由于人耳对失真的感知,对低频加上更大的权重可能具有某种优点。作为低频中的增加的误差加权的结果,增强层可以对高频信号进行欠建模(under-modeled)。在这些情况中,使失真度量朝向不会使Sj的高频分量衰减的gj值偏置可能是直接有益的,从而使高频的欠建模不会导致最终重建音频信号中的讨厌的或不自然的听觉人工产物。一个该示例将是未出声语音信号的情况。在该情况中,输入音频通常由类似中高频噪声的信号构成,该信号是因来自人嘴的空气湍流而产生的。情况可能是,核心层编码器未直接对该类型的波形进行代码化,而是可以使用噪声模型来生成相似的听觉音频信号。这可以导致输入音频和核心层输出音频信号之间的通常低的相关。然而,在该实施例中,误差信号向量Ej基于输入音频和核心层音频输出信号之间的差。由于这些信号可能不是非常良好地相关的,因此误差信号Ej的能量不一定低于输入信号或核心层输出音频。在该情况中,式(6)中的误差的最小化可能导致增益调节过于激进,这可能导致潜在的可听到的人工产物。
在另一情况中,偏置因子βj可以基于输入音频和/或核心层输出音频信号的其他信号特性。例如,信号频谱的峰均比可以给出该信号的谐波内容的指示。诸如语音和某些类型的音乐的信号可以具有高的谐波内容并且因此具有高的峰均比。然而,通过语音编解码器处理的音乐信号可能由于代码化模型失配而导致差的质量,并且结果,较之输入信号频谱,核心层输出信号频谱可能具有减小的峰均比。在该情况中,有利的是,减小最小化过程中的偏置量以便于允许将核心层输出音频增益调节至较低的能量,由此允许增强层代码化对复合输出音频具有更显著的效果。相反地,某些类型的语音或音乐输入信号可能呈现较低的峰均比,在该情况中,信号可被感知为更嘈杂的,并且因此可以受益于通过增加误差偏置而进行核心层输出音频的较小的调节。用于生成关于βj的偏置因子的函数示例被给出为:
Figure GPA00001113737200071
其中λ可以是某个阈值,并且关于向量的峰均比φy可被给出为:
&phi; y = max { | y k 1 k 2 | } 1 k 2 - k 1 + 1 &Sigma; k = k 1 k 2 | y ( k ) | - - - ( 8 )
并且其中
Figure GPA00001113737200073
是使的y(k)的向量子集。
一旦从式(6)确定最优增益索引j*,则生成关联的码字ig并且将最优误差向量E*发送到误差信号编码器410,其中E*被代码化为适用于与其他码字复用(通过MUX 408)的形式并且被发射以备相应的解码器使用。在优选实施例中,误差信号编码器408使用因子脉冲代码化(FPC)。出于处理复杂性的观点,由于与向量E*的代码化关联的枚举过程与用于生成的向量生成过程无关,因此该方法是有利的。
增强层解码器416反转这些过程以产生增强音频输出。更具体地,解码器416接收ig和iE,iE被发送到误差信号解码器412,其中从码字得到最优误差向量E*。最优误差向量E*被传递到信号组合器414,其中按照式(2)修改接收到的
Figure GPA00001113737200077
以产生
Figure GPA00001113737200078
本发明的第二实施例牵涉如图5所示的多层嵌入代码化系统。这里,可以看到,对于该示例给出了五个嵌入层。层1和2均可以基于语音编解码器,而层3、4和5可以是MDCT增强层。因此,编码器502和503可以利用语音编解码器产生和输出经编码的输入信号s(n)。编码器510、512和514包括增强层编码器,每个增强层编码器输出对经编码的信号的不同的增强。与前面的实施例相似,关于层3(编码器510)的误差信号向量可被给出为:
E3=S-S2,                    (9)
其中S=MDCT{Ws}是经加权变换的输入信号,并且S2=MDCT{Ws2}是从层1/2解码器506生成的经加权变换的信号。在该实施例中,层3可以是低速率量化层,并且因此,可以存在相对少的比特用于对相应的量化误差信号
Figure GPA00001113737200081
进行代码化。为了在这些约束下提供好的质量,仅E3中的系数的一部分可被量化。待代码化的系数的位置可以是固定的或者可以是可变的,但是如果允许变化,则可能需要向解码器发送另外的信息以标识这些位置。如果,例如,代码化位置的范围开始于ks并且结束于ke,其中0≤ks<ke<N,则量化误差信号向量
Figure GPA00001113737200082
可以仅包含该范围中的非零值,并且在该范围外部的位置包含0。取决于所使用的代码化方法,该位置和范围信息也可以是隐性的。例如,在音频代码化中公知的是,频带可被认为在感知上是重要的,并且信号向量的代码化可以集中在这些频率上。在这些环境中,代码化范围可以是可变的,并且可以不跨越一组连续的频率。但是在任何速率下,一旦该信号被量化,则复合代码化输出频谱可被构建为:
S 3 = E ^ 3 + S 2 , - - - ( 10 )
随后将其用作针对层4编码器512的输入。
层4编码器512与前面的实施例的增强层编码器406相似。使用增益向量候选者gj,可将相应的误差向量描述为:
E4(j)=S-GjS3,            (11)
其中Gj可以是将向量gj用作对角线元的增益矩阵。然而,在当前实施例中,增益向量gj可以按如下方式与量化误差信号向量相关。由于量化误差信号向量可能限于例如开始于向量位置ks并且结束于向量位置ke的频率范围,因此假定层3输出信号S3在该范围中被公平准确地代码化。因此,根据本发明,基于层3误差信号向量ks和ke的代码化位置对增益向量gj进行调整。更具体地,为了保持这些位置处的信号完整性,相应的单独增益元素可被设定为常量值α。即:
Figure GPA00001113737200093
其中通常0≤γj(k)≤1并且gj(k)是第j个候选向量的第k个位置的增益。在优选实施例中,常量值是1(α=1),然而许多值也是可能的。此外,频率范围可以跨越多个开始和结束位置。即,式(12)可被分割为具有变化增益的不连续的范围,这些增益基于误差信号
Figure GPA00001113737200094
的某个函数,并且式(12)可被更一般地写为:
Figure GPA00001113737200095
对于该示例,当先前量化的误差信号中的相应位置非零时,使用固定增益α生成gj(k),并且当中的相应位置是0时,使用增益函数γj(k)。一个可能的增益函数可被定义为:
Figure GPA00001113737200098
其中Δ是步长尺寸(例如,Δ≈2.2dB),α是常量,M是候选者数量(例如,M=4,这可以仅使用2个比特表示),并且kl和kh分别是低频和高频截止频率,在这些截止频率处可发生增益减小。参数kl和kh的引入在其中仅需要某个频率范围上的调节的系统中是有利的。例如,在给定实施例中,高频可能未被核心层充分建模,因此高频带中的能量可能固有地低于输入音频信号中的能量。在该情况中,由于作为结果,整体误差能量可能增加,因此对该区域的信号中的层3输出进行调节可能具有小的益处或者没有益处。
总而言之,多个增益向量候选者gj基于先前代码化的信号向量的代码化元素的某个函数,在该情况中是
Figure GPA00001113737200099
。这可以概括地表达为:
g j ( k ) = f ( k , E ^ 3 ) . - - - ( 15 )
在图5的右手侧示出了相应的解码器操作。当经代码化的比特流的各层(i1~i5)被接收到时,在核心层(层1)解码器上方的增强层的层级上建立较高质量的输出信号。即,对于该特定实施例,由于最初的两个层包括时域语音模型代码化(例如,CELP)并且剩余的三个层包括变换域代码化(例如,MDCT),因此根据下式生成系统的最后输出
Figure GPA00001113737200102
s ^ ( n ) = s ^ 1 ( n ) ; s ^ 2 ( n ) = s ^ 1 ( n ) + e ^ 2 ( n ) ; s ^ 3 ( n ) = W - 1 MDCT - 1 { S ^ 2 + E ^ 3 } ; S ^ 4 ( n ) = W - 1 MDCT - 1 { G j &CenterDot; ( S ^ 2 + E ^ 3 ) + E ^ 4 } ; s ^ 5 ( n ) = W - 1 MDCT - 1 { G j &CenterDot; ( S ^ 2 + E ^ 3 ) + E ^ 4 + E ^ 5 } ; , - - - ( 16 )
其中
Figure GPA00001113737200104
是层2时域增强层信号,并且
Figure GPA00001113737200105
是对应于层2音频输出
Figure GPA00001113737200106
的加权MDCT向量。在该表达中,可以从所接收的连续的比特流层中的最高级别来确定整体输出信号。在该实施例中,假设低级别层具有被适当地从信道接收到的更高的概率,因此码字集合{i1}、{i1 i2}、{i1 i2 i3}等确定式(16)中的增强层解码的适当的级别。
图6是示出层4编码器512和解码器522的框图。图6中示出的编码器和解码器与图4中示出的相似,不同之处在于调节单元601和618使用的增益值是分别经由频率选择性增益生成器603和616得到的。在操作期间,从层3编码器输出层3音频输出S3并且其由调节单元601接收。此外,从层3编码器510输出层3误差向量
Figure GPA00001113737200107
并且其由频率选择性增益生成器603接收。如所讨论的,由于量化误差信号向量可以限于一频率范围,因此基于例如,如式12中所示的位置ks和ke,或者式13中的更一般的表达,来调整增益向量gj
从调节单元601输出经调节的音频Sj并且其由误差信号生成器602接收。如上文讨论的,误差信号生成器602接收输入音频信号S并确定关于调节单元601利用的每个调节向量的误差值Ej。这些误差向量与基于最优增益值g*确定误差向量和特定误差E*时使用的增益值一起被传递到增益选择器电路604。从增益选择器604输出表示最优增益g*的码字(ig),并且其与最优误差向量E*一起被传递到编码器610,在编码器610中确定并输出码字iE。ig和iE被输出到复用器608并且经由信道110被发射到层4解码器522。
在层4解码器522的操作期间,接收并解复用ig和iE。增益码字ig和层3误差向量
Figure GPA00001113737200111
被用作针对频率选择性增益生成器616的输入以根据相应的编码器512的方法产生增益向量g*。随后在调节单元618中将增益向量g*应用于层3重建音频向量
Figure GPA00001113737200112
,调节单元618的输出随后与层4增强层误差向量E*组合,以产生层4重建音频输出
Figure GPA00001113737200113
,该层4增强层误差向量E*是通过码字iE的解码从误差信号解码器612获得的。
图7是示出根据本发明的第一和第二实施例的编码器的操作的流程图。如上文讨论的,这两个实施例均利用增强层,该增强层利用多个调节值对经编码的音频进行调节并且随后选择导致最低误差的调节值。然而,在本发明的第二实施例中,利用频率选择性增益生成器603来生成增益值。
该逻辑流程开始于步骤701,其中核心层编码器接收待代码化的输入信号并且对输入信号进行代码化以产生代码化音频信号。增强层编码器406接收代码化音频信号(sc(n))并且调节单元401利用多个增益值对代码化音频信号进行调节以产生多个调节代码化音频信号,每个调节代码化音频信号具有关联的增益值(步骤703)。在步骤705中,误差信号生成器402确定输入信号和多个调节代码化音频信号中的每个调节代码化音频信号之间存在的多个误差值。随后增益选择器404从多个增益值中选择增益值(步骤707)。如上文讨论的,增益值(g*)与导致输入信号和调节代码化音频信号之间存在的低的误差值(E*)的调节代码化音频信号关联。最后,在步骤709中,发射机418将低的误差值(E*)和增益值(g*)一起发射,作为对代码化音频信号的增强层的一部分。如本领域的普通技术人员将认识到的,在发射之前E*和g*均被适当编码。
如上文讨论的,在接收机侧,将与增强层一起接收代码化音频信号。增强层是对代码化音频信号的增强,包括增益值(g*)和与该增益值关联的误差信号(E*)。
尽管已经参照特定实施例具体地示出和描述了本发明,但是本领域的技术人员将理解,在不偏离本发明的精神和范围的前提下,可以对其进行形式和细节上的多种变更。例如,尽管通过在电信系统中的信道上发射和接收,描述了上述技术,但是这些技术可以等同地应用于使用信号压缩系统的系统,用于减少诸如固态存储器设备或计算机硬盘的数字媒体设备上的存储要求的目的。这些变更应在所附权利要求的范围内。
权利要求书(按照条约第19条的修改)
1.一种用于音频编码器对信号进行嵌入代码化的方法,包括以下步骤:
所述音频编码器接收待代码化的输入信号;
所述音频编码器对所述输入信号进行代码化,以产生重建音频信号;
所述音频编码器利用多个增益值对所述重建音频信号进行调节,以产生多个调节重建音频信号,每个调节重建音频信号具有关联的增益值;
所述音频编码器基于所述输入信号和所述多个调节重建音频信号中的每个调节重建音频信号来确定多个误差值;
所述音频编码器基于所述多个误差值,从所述多个增益值中选择增益值;以及
所述音频编码器将所述增益值作为对代码化音频信号的增强层的一部分来发射或存储。
2.如权利要求1所述的方法,其中,所述多个增益值包括频率选择性增益值。
3.如权利要求1所述的方法,其中,所述多个增益值是先前编码的信号层的函数。
4.一种用于音频解码器接收代码化音频信号和对所述代码化音频信号的增强的方法,所述方法包括以下步骤:
所述音频解码器接收所述代码化音频信号;以及
所述音频解码器接收对所述代码化音频信号的增强,其中,对所述代码化音频信号的增强包括增益值和与所述增益值关联的误差信号,其中,所述增益值是由发射机从多个增益值中选择的,其中,所述增益值与调节重建音频信号关联,导致在音频信号和所述调节重建音频信号之间存在特定的误差值;以及
所述音频解码器基于所述增益值和所述误差值来增强所述代码化音频信号。
5.如权利要求4所述的方法,其中,所述增益值包括频率选择性增益值。
6.如权利要求5所述的方法,其中,所述频率选择性增益值是
Figure FPA00001113736700021
其中通常0≤γj(k)≤1并且gj(k)是第j个候选向量的第k个位置的增益。
7.一种装置,包括:
编码器,所述编码器接收待代码化的输入信号并且对所述输入信号进行代码化以产生重建音频信号;
调节单元,所述调节单元利用多个增益值对所述重建音频信号进行调节,以产生多个调节重建音频信号,每个调节重建音频信号具有关联的增益值;
误差信号生成器,所述误差信号生成器确定在所述输入信号和所述多个调节重建音频信号中的每个调节重建音频信号之间存在的多个误差值;
增益选择器,所述增益选择器从所述多个增益值中选择增益值,其中,基于在所述输入信号和所述调节重建音频信号之间存在的多个误差值来选择所述增益值;以及
发射机,所述发射机将所选择的增益值作为对代码化音频信号的增强层的一部分来发射。
8.如权利要求7所述的装置,其中,所述多个增益值包括频率选择性增益值。
9.如权利要求8所述的装置,其中,所述频率选择性增益值
Figure FPA00001113736700031
其中通常0≤γj(k)≤1并且gj(k)是第j个候选向量的第k个位置的增益。
10.一种装置,包括:
解码器,所述解码器接收代码化音频信号;以及
增强层解码器,所述增强层解码器接收对所述代码化音频信号的增强并且产生增强音频信号,其中,对所述代码化音频信号的增强包括增益值和与所述增益值关联的误差信号,其中,由编码器从多个增益值中选择所述增益值,其中,所述增益值与调节重建音频信号关联,导致在输入音频信号和所述调节重建音频信号之间存在特定的误差值。
11.一种装置,包括:
解码器,解码器接收码字以产生重建音频信号;以及
增强层解码器,所述增强层解码器接收关于对所述代码化音频信号的增强的码字并且输出增强重建音频信号,其中,对所述重建音频信号的增强包括频率选择性增益值和与所述增益值关联的误差信号,其中,所述频率选择性增益值是基于所述重建音频信号。
12.一种用于解码器对多层编码音频信号解码的方法,所述方法包括以下步骤:
所述解码器从第一信号解码器接收第一重建音频向量
Figure FPA00001113736700032
所述解码器从第一增强层解码器接收第一频域误差向量
所述解码器基于至少所述第一频域误差向量来生成频率选择性增益向量g*
所述解码器利用所述频率选择性增益向量对所述第一重建音频信号进行调节,以产生调节重建音频信号;
所述解码器接收码字iE,用于输入到第二增强层解码器,以产生第二增强层误差向量E*;以及
所述解码器将所述调节重建音频信号与所述第二增强层误差向量组合,以产生解码的多层音频信号输出
Figure FPA00001113736700041
13.如权利要求12所述的方法,其中,所述频域包括MDCT域。
14.如权利要求12所述的方法,其中生成频率选择性增益向量的步骤进一步包括:
接收增益码字ig;以及
基于所述增益码字和所述第一频域误差向量来生成所述频率选择性增益向量。
15.如权利要求12所述的方法,其中所述频率选择性增益向量包括gj(k),其中gj(k)是第j个候选向量的第k个频率分量的增益。

Claims (10)

1.一种用于信号的嵌入代码化的方法,包括以下步骤:
接收待代码化的输入信号;
对所述输入信号进行代码化,以产生代码化音频信号;
利用多个增益值对所述代码化音频信号进行调节以产生多个调节代码化音频信号,每个调节代码化音频信号具有关联的增益值;
基于所述输入信号和所述多个调节代码化音频信号中的每个调节代码化音频信号来确定多个误差值;
从所述多个增益值中选择增益值;以及
将所述增益值作为对所述代码化音频信号的增强层的一部分来发射或存储。
2.如权利要求1所述的方法,其中,所述多个增益值包括频率选择性增益值。
3.如权利要求1所述的方法,其中,所述多个增益值是先前编码的信号层的函数。
4.一种用于接收代码化音频信号和对所述代码化音频信号的增强的方法,所述方法包括以下步骤:
接收所述代码化音频信号;以及
接收对所述代码化音频信号的增强,其中,对所述代码化音频信号的增强包括增益值和与所述增益值关联的误差信号,其中,所述增益值是由发射机从多个增益值中选择的,其中,所述增益值与调节代码化音频信号关联,导致在音频信号和所述调节代码化音频信号之间存在特定的误差值;以及
基于所述增益值和所述误差值来增强所述代码化音频信号。
5.如权利要求4所述的方法,其中,所述增益值包括频率选择性增益值。
6.如权利要求5所述的方法,其中,所述频率选择性增益值是
Figure FPA00001113737100021
其中通常0≤γj(k)≤1并且gj(k)是第j个候选向量的第k个位置的增益。
7.一种装置,包括:
编码器,所述编码器接收待代码化的输入信号并且对所述输入信号进行代码化以产生代码化音频信号;
调节单元,所述调节单元利用多个增益值对所述代码化音频信号进行调节,以产生多个调节代码化音频信号,每个调节代码化音频信号具有关联的增益值;
误差信号生成器,所述误差信号生成器确定在所述输入信号和所述多个调节代码化音频信号中的每个调节代码化音频信号之间存在的多个误差值;
增益选择器,所述增益选择器从所述多个增益值中选择增益值,其中,基于在所述输入信号和所述调节代码化音频信号之间存在的所述误差值来选择所述增益值;以及
发射机,所述发射机将低的误差值以及所述增益值作为对所述代码化音频信号的增强层的一部分来发射。
8.一种装置,包括:
解码器,所述解码器接收代码化音频信号;以及
增强层解码器,所述增强层解码器接收对所述代码化音频信号的增强并且产生增强音频信号,其中,对所述代码化音频信号的增强包括增益值和与所述增益值关联的误差信号,其中,由发射机从多个增益值中选择所述增益值,其中,所述增益值与调节代码化音频信号关联,导致在音频信号和所述调节代码化音频信号之间存在特定的误差值。
9.一种装置,包括:
解码器,所述解码器接收码字以产生代码化音频信号;以及
增强层解码器,所述增强层解码器接收关于对所述代码化音频信号的增强的码字并且输出增强代码化音频信号,其中,对所述代码化音频信号的增强包括频率选择性增益值和与所述增益值关联的误差信号,其中,所述频率选择性增益值是基于所述代码化音频信号。
10.一种用于对多层编码音频信号解码的方法,所述方法包括以下步骤:
从第一信号解码器接收第一重建音频向量
Figure FPA00001113737100031
从第一增强层解码器接收第一频域误差向量
Figure FPA00001113737100032
基于至少所述第一频域误差向量来生成频率选择性增益向量g*
利用所述频率选择性增益向量对所述第一重建音频信号进行调节,以产生调节重建音频信号;
接收码字iE,用于输入到第二增强层解码器,以产生第二增强层误差向量E*;以及
将所述调节重建音频信号与所述第二增强层误差向量组合,以产生解码的多层音频信号输出
Figure FPA00001113737100033
CN200880113244.3A 2007-10-25 2008-09-25 用于在音频代码化系统中生成增强层的方法和装置 Active CN101836252B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US98256607P 2007-10-25 2007-10-25
US60/982,566 2007-10-25
US12/187,423 US8209190B2 (en) 2007-10-25 2008-08-07 Method and apparatus for generating an enhancement layer within an audio coding system
US12/187,423 2008-08-07
PCT/US2008/077693 WO2009055192A1 (en) 2007-10-25 2008-09-25 Method and apparatus for generating an enhancement layer within an audio coding system

Publications (2)

Publication Number Publication Date
CN101836252A true CN101836252A (zh) 2010-09-15
CN101836252B CN101836252B (zh) 2016-06-15

Family

ID=39930381

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200880113244.3A Active CN101836252B (zh) 2007-10-25 2008-09-25 用于在音频代码化系统中生成增强层的方法和装置

Country Status (8)

Country Link
US (1) US8209190B2 (zh)
EP (1) EP2206112A1 (zh)
KR (1) KR101125429B1 (zh)
CN (1) CN101836252B (zh)
BR (1) BRPI0817800A8 (zh)
MX (1) MX2010004479A (zh)
RU (1) RU2469422C2 (zh)
WO (1) WO2009055192A1 (zh)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080059154A1 (en) * 2006-09-01 2008-03-06 Nokia Corporation Encoding an audio signal
US7461106B2 (en) 2006-09-12 2008-12-02 Motorola, Inc. Apparatus and method for low complexity combinatorial coding of signals
US8576096B2 (en) * 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
US8515767B2 (en) * 2007-11-04 2013-08-20 Qualcomm Incorporated Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs
US20090234642A1 (en) * 2008-03-13 2009-09-17 Motorola, Inc. Method and Apparatus for Low Complexity Combinatorial Coding of Signals
US7889103B2 (en) * 2008-03-13 2011-02-15 Motorola Mobility, Inc. Method and apparatus for low complexity combinatorial coding of signals
US8639519B2 (en) 2008-04-09 2014-01-28 Motorola Mobility Llc Method and apparatus for selective signal coding based on core encoder performance
US8140342B2 (en) * 2008-12-29 2012-03-20 Motorola Mobility, Inc. Selective scaling mask computation based on peak detection
US8219408B2 (en) * 2008-12-29 2012-07-10 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8175888B2 (en) * 2008-12-29 2012-05-08 Motorola Mobility, Inc. Enhanced layered gain factor balancing within a multiple-channel audio coding system
US8200496B2 (en) * 2008-12-29 2012-06-12 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
EP2249333B1 (en) * 2009-05-06 2014-08-27 Nuance Communications, Inc. Method and apparatus for estimating a fundamental frequency of a speech signal
FR2947944A1 (fr) * 2009-07-07 2011-01-14 France Telecom Codage/decodage perfectionne de signaux audionumeriques
US8149144B2 (en) * 2009-12-31 2012-04-03 Motorola Mobility, Inc. Hybrid arithmetic-combinatorial encoder
US8442837B2 (en) * 2009-12-31 2013-05-14 Motorola Mobility Llc Embedded speech and audio coding using a switchable model core
US8280729B2 (en) * 2010-01-22 2012-10-02 Research In Motion Limited System and method for encoding and decoding pulse indices
US8423355B2 (en) * 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
US8428936B2 (en) * 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
EP2375410B1 (en) 2010-03-29 2017-11-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. A spatial audio processor and a method for providing spatial parameters based on an acoustic input signal
WO2011155144A1 (ja) 2010-06-11 2011-12-15 パナソニック株式会社 復号装置、符号化装置及びこれらの方法
KR20130108281A (ko) 2010-09-10 2013-10-02 파나소닉 주식회사 부호화 장치 및 부호화 방법
EP2733699B1 (en) * 2011-10-07 2017-09-06 Panasonic Intellectual Property Corporation of America Scalable audio encoding device and scalable audio encoding method
CN103178888B (zh) * 2011-12-23 2016-03-30 华为技术有限公司 一种反馈信道状态信息的方法及装置
US9129600B2 (en) 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
JP6082126B2 (ja) * 2013-01-29 2017-02-15 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. 音声信号を合成するための装置及び方法、デコーダ、エンコーダ、システム及びコンピュータプログラム
EP2951825B1 (en) * 2013-01-29 2021-11-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a frequency enhanced signal using temporal smoothing of subbands
MX368572B (es) * 2014-05-15 2019-10-08 Ericsson Telefon Ab L M Clasificacion y codificacion de señal de audio.
JP7167335B2 (ja) * 2018-10-29 2022-11-08 ドルビー・インターナショナル・アーベー 生成モデルを用いたレート品質スケーラブル符号化のための方法及び装置
US11823688B2 (en) * 2021-07-30 2023-11-21 Electronics And Telecommunications Research Institute Audio signal encoding and decoding method, and encoder and decoder performing the methods

Family Cites Families (80)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4560977A (en) * 1982-06-11 1985-12-24 Mitsubishi Denki Kabushiki Kaisha Vector quantizer
US4670851A (en) * 1984-01-09 1987-06-02 Mitsubishi Denki Kabushiki Kaisha Vector quantizer
US4727354A (en) * 1987-01-07 1988-02-23 Unisys Corporation System for selecting best fit vector code in vector quantization encoding
JP2527351B2 (ja) * 1987-02-25 1996-08-21 富士写真フイルム株式会社 画像デ―タの圧縮方法
US5067152A (en) * 1989-01-30 1991-11-19 Information Technologies Research, Inc. Method and apparatus for vector quantization
EP0419752B1 (en) * 1989-09-25 1995-05-10 Rai Radiotelevisione Italiana System for encoding and transmitting video signals comprising motion vectors
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
WO1993018505A1 (en) * 1992-03-02 1993-09-16 The Walt Disney Company Voice transformation system
US5268855A (en) * 1992-09-14 1993-12-07 Hewlett-Packard Company Common format for encoding both single and double precision floating point numbers
GB9512284D0 (en) * 1995-06-16 1995-08-16 Nokia Mobile Phones Ltd Speech Synthesiser
IT1281001B1 (it) * 1995-10-27 1998-02-11 Cselt Centro Studi Lab Telecom Procedimento e apparecchiatura per codificare, manipolare e decodificare segnali audio.
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5974435A (en) * 1997-08-28 1999-10-26 Malleable Technologies, Inc. Reconfigurable arithmetic datapath
US6263312B1 (en) * 1997-10-03 2001-07-17 Alaris, Inc. Audio compression and decompression employing subband decomposition of residual signal and distortion reduction
EP0932141B1 (en) 1998-01-22 2005-08-24 Deutsche Telekom AG Method for signal controlled switching between different audio coding schemes
US6253185B1 (en) * 1998-02-25 2001-06-26 Lucent Technologies Inc. Multiple description transform coding of audio using optimal transforms of arbitrary dimension
US6904174B1 (en) * 1998-12-11 2005-06-07 Intel Corporation Simplified predictive video encoder
US6480822B2 (en) * 1998-08-24 2002-11-12 Conexant Systems, Inc. Low complexity random codebook structure
US6704705B1 (en) * 1998-09-04 2004-03-09 Nortel Networks Limited Perceptual audio coding
RU2137179C1 (ru) 1998-09-11 1999-09-10 Вербовецкий Александр Александрович Оптический цифровой страничный умножитель с плавающей точкой
US6453287B1 (en) * 1999-02-04 2002-09-17 Georgia-Tech Research Corporation Apparatus and quality enhancement algorithm for mixed excitation linear predictive (MELP) and other speech coders
US6691092B1 (en) * 1999-04-05 2004-02-10 Hughes Electronics Corporation Voicing measure as an estimate of signal periodicity for a frequency domain interpolative speech codec system
AU4072400A (en) * 1999-04-05 2000-10-23 Hughes Electronics Corporation A voicing measure as an estimate of signal periodicity for frequency domain interpolative speech codec system
IL129752A (en) * 1999-05-04 2003-01-12 Eci Telecom Ltd Telecommunication method and system for using same
US6236960B1 (en) * 1999-08-06 2001-05-22 Motorola, Inc. Factorial packing method and apparatus for information coding
US6504877B1 (en) * 1999-12-14 2003-01-07 Agere Systems Inc. Successively refinable Trellis-Based Scalar Vector quantizers
JP4149637B2 (ja) * 2000-05-25 2008-09-10 株式会社東芝 半導体装置
US6304196B1 (en) * 2000-10-19 2001-10-16 Integrated Device Technology, Inc. Disparity and transition density control system and method
AUPR105000A0 (en) * 2000-10-27 2000-11-23 Canon Kabushiki Kaisha Method for generating and detecting marks
JP3404024B2 (ja) * 2001-02-27 2003-05-06 三菱電機株式会社 音声符号化方法および音声符号化装置
JP3636094B2 (ja) * 2001-05-07 2005-04-06 ソニー株式会社 信号符号化装置及び方法、並びに信号復号装置及び方法
JP4506039B2 (ja) * 2001-06-15 2010-07-21 ソニー株式会社 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム
US6658383B2 (en) * 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
US6950794B1 (en) * 2001-11-20 2005-09-27 Cirrus Logic, Inc. Feedforward prediction of scalefactors based on allowable distortion for noise shaping in psychoacoustic-based compression
US6662154B2 (en) * 2001-12-12 2003-12-09 Motorola, Inc. Method and system for information signal coding using combinatorial and huffman codes
US6947886B2 (en) 2002-02-21 2005-09-20 The Regents Of The University Of California Scalable compression of audio and other signals
DE60214599T2 (de) * 2002-03-12 2007-09-13 Nokia Corp. Skalierbare audiokodierung
EP1489599B1 (en) * 2002-04-26 2016-05-11 Panasonic Intellectual Property Corporation of America Coding device and decoding device
JP3881943B2 (ja) 2002-09-06 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
WO2004082288A1 (en) * 2003-03-11 2004-09-23 Nokia Corporation Switching between coding schemes
EP1619664B1 (en) 2003-04-30 2012-01-25 Panasonic Corporation Speech coding apparatus, speech decoding apparatus and methods thereof
JP2005005844A (ja) * 2003-06-10 2005-01-06 Hitachi Ltd 計算装置及び符号化処理プログラム
JP4123109B2 (ja) * 2003-08-29 2008-07-23 日本ビクター株式会社 変調装置及び変調方法並びに復調装置及び復調方法
SE527670C2 (sv) 2003-12-19 2006-05-09 Ericsson Telefon Ab L M Naturtrogenhetsoptimerad kodning med variabel ramlängd
CN1677493A (zh) * 2004-04-01 2005-10-05 北京宫羽数字技术有限责任公司 一种增强音频编解码装置及方法
EP3561810B1 (en) * 2004-04-05 2023-03-29 Koninklijke Philips N.V. Method of encoding left and right audio input signals, corresponding encoder, decoder and computer program product
US20060022374A1 (en) * 2004-07-28 2006-02-02 Sun Turn Industrial Co., Ltd. Processing method for making column-shaped foam
US6975253B1 (en) * 2004-08-06 2005-12-13 Analog Devices, Inc. System and method for static Huffman decoding
US7161507B2 (en) * 2004-08-20 2007-01-09 1St Works Corporation Fast, practically optimal entropy coding
US20060047522A1 (en) * 2004-08-26 2006-03-02 Nokia Corporation Method, apparatus and computer program to provide predictor adaptation for advanced audio coding (AAC) system
JP4771674B2 (ja) * 2004-09-02 2011-09-14 パナソニック株式会社 音声符号化装置、音声復号化装置及びこれらの方法
EP1793373A4 (en) * 2004-09-17 2008-10-01 Matsushita Electric Ind Co Ltd AUDIO CODING APPARATUS, AUDIO DECODING APPARATUS, COMMUNICATION APPARATUS, AND AUDIO CODING METHOD
WO2006070751A1 (ja) 2004-12-27 2006-07-06 Matsushita Electric Industrial Co., Ltd. 音声符号化装置および音声符号化方法
US20060190246A1 (en) * 2005-02-23 2006-08-24 Via Telecom Co., Ltd. Transcoding method for switching between selectable mode voice encoder and an enhanced variable rate CODEC
US7840411B2 (en) * 2005-03-30 2010-11-23 Koninklijke Philips Electronics N.V. Audio encoding and decoding
US7885809B2 (en) * 2005-04-20 2011-02-08 Ntt Docomo, Inc. Quantization of speech and audio coding parameters using partial information on atypical subsequences
FR2888699A1 (fr) * 2005-07-13 2007-01-19 France Telecom Dispositif de codage/decodage hierachique
ATE490454T1 (de) * 2005-07-22 2010-12-15 France Telecom Verfahren zum umschalten der raten- und bandbreitenskalierbaren audiodecodierungsrate
US7814297B2 (en) 2005-07-26 2010-10-12 Arm Limited Algebraic single instruction multiple data processing
CN101253557B (zh) 2005-08-31 2012-06-20 松下电器产业株式会社 立体声编码装置及立体声编码方法
US8069035B2 (en) * 2005-10-14 2011-11-29 Panasonic Corporation Scalable encoding apparatus, scalable decoding apparatus, and methods of them
US8086452B2 (en) 2005-11-30 2011-12-27 Panasonic Corporation Scalable coding apparatus and scalable coding method
EP1989706B1 (fr) * 2006-02-14 2011-10-26 France Telecom Dispositif de ponderation perceptuelle en codage/decodage audio
US20070239294A1 (en) * 2006-03-29 2007-10-11 Andrea Brueckner Hearing instrument having audio feedback capability
US7230550B1 (en) * 2006-05-16 2007-06-12 Motorola, Inc. Low-complexity bit-robust method and system for combining codewords to form a single codeword
US7414549B1 (en) * 2006-08-04 2008-08-19 The Texas A&M University System Wyner-Ziv coding based on TCQ and LDPC codes
US7461106B2 (en) * 2006-09-12 2008-12-02 Motorola, Inc. Apparatus and method for low complexity combinatorial coding of signals
WO2008062990A1 (en) * 2006-11-21 2008-05-29 Samsung Electronics Co., Ltd. Method, medium, and system scalably encoding/decoding audio/speech
US7761290B2 (en) * 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8576096B2 (en) * 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
US7889103B2 (en) * 2008-03-13 2011-02-15 Motorola Mobility, Inc. Method and apparatus for low complexity combinatorial coding of signals
US20090234642A1 (en) * 2008-03-13 2009-09-17 Motorola, Inc. Method and Apparatus for Low Complexity Combinatorial Coding of Signals
US8639519B2 (en) * 2008-04-09 2014-01-28 Motorola Mobility Llc Method and apparatus for selective signal coding based on core encoder performance
EP2311034B1 (en) 2008-07-11 2015-11-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder for encoding frames of sampled audio signals
US20100088090A1 (en) * 2008-10-08 2010-04-08 Motorola, Inc. Arithmetic encoding for celp speech encoders
US8140342B2 (en) * 2008-12-29 2012-03-20 Motorola Mobility, Inc. Selective scaling mask computation based on peak detection
US8175888B2 (en) * 2008-12-29 2012-05-08 Motorola Mobility, Inc. Enhanced layered gain factor balancing within a multiple-channel audio coding system
US8219408B2 (en) * 2008-12-29 2012-07-10 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8200496B2 (en) * 2008-12-29 2012-06-12 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal

Also Published As

Publication number Publication date
CN101836252B (zh) 2016-06-15
US20090112607A1 (en) 2009-04-30
EP2206112A1 (en) 2010-07-14
RU2010120878A (ru) 2011-11-27
BRPI0817800A2 (pt) 2015-03-24
RU2469422C2 (ru) 2012-12-10
KR101125429B1 (ko) 2012-03-28
US8209190B2 (en) 2012-06-26
MX2010004479A (es) 2010-05-03
BRPI0817800A8 (pt) 2015-11-03
WO2009055192A1 (en) 2009-04-30
KR20100063127A (ko) 2010-06-10

Similar Documents

Publication Publication Date Title
CN101836252B (zh) 用于在音频代码化系统中生成增强层的方法和装置
US20210110836A1 (en) Adaptive transition frequency between noise fill and bandwidth extension
US8639519B2 (en) Method and apparatus for selective signal coding based on core encoder performance
US8219408B2 (en) Audio signal decoder and method for producing a scaled reconstructed audio signal
US8175888B2 (en) Enhanced layered gain factor balancing within a multiple-channel audio coding system
US8630864B2 (en) Method for switching rate and bandwidth scalable audio decoding rate
US8200496B2 (en) Audio signal decoder and method for producing a scaled reconstructed audio signal
JP5285162B2 (ja) ピーク検出に基づいた選択型スケーリングマスク演算

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: MOTOROLA MOBILE CO., LTD.

Free format text: FORMER OWNER: MOTOROLA INC.

Effective date: 20110107

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20110107

Address after: Illinois State

Applicant after: MOTOROLA MOBILITY, Inc.

Address before: Illinois State

Applicant before: Motorola, Inc.

C41 Transfer of patent application or patent right or utility model
CB02 Change of applicant information

Address after: Illinois State

Applicant after: MOTOROLA MOBILITY LLC

Address before: Illinois State

Applicant before: MOTOROLA MOBILITY, Inc.

COR Change of bibliographic data
TA01 Transfer of patent application right

Effective date of registration: 20160401

Address after: California, USA

Applicant after: Google Technology Holdings LLC

Address before: Illinois State

Applicant before: MOTOROLA MOBILITY LLC

C14 Grant of patent or utility model
GR01 Patent grant