CN102047325A - 基于核心编码器性能进行选择性信号代码化的方法和装置 - Google Patents
基于核心编码器性能进行选择性信号代码化的方法和装置 Download PDFInfo
- Publication number
- CN102047325A CN102047325A CN2009801125660A CN200980112566A CN102047325A CN 102047325 A CN102047325 A CN 102047325A CN 2009801125660 A CN2009801125660 A CN 2009801125660A CN 200980112566 A CN200980112566 A CN 200980112566A CN 102047325 A CN102047325 A CN 102047325A
- Authority
- CN
- China
- Prior art keywords
- signal
- enhancement layer
- energy
- reconstruction
- core layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
Abstract
在选择性信号编码器中,首先使用核心层编码器对输入信号进行编码(1004),以产生核心层编码信号。对核心层编码信号进行解码(1006),以产生重构信号并生成误差信号(1008)作为重构信号与误差信号之间的差。将重构信号与输入信号相比较(1010)。根据比较选择两个或更多增强层编码器中的一个(1014、1016),并将其用来对误差信号进行编码。将核心层编码信号、增强层编码信号、和选择指示符输出(1018)到信道(例如以便传输或存储)。
Description
背景技术
在包括因特网在内的通信信道上的文本、图像、声音和语言信号的传输正在得以快速发展,例如,能够提供容纳诸如文本、图像和音乐等各种类型的信息的多媒体服务器。包括语音和音乐信号的多媒体信号在传输时要求宽的带宽。因此,为了发送包括文本、图像和音频的多媒体数据,非常期望的是将数据压缩。
数字语音和音频信号的压缩是众所周知的。常常要求压缩以在通信信道上高效地发送信号,或者将压缩信号存储在数字媒体设备上,例如,存储在固态存储器设备或计算机硬盘。
数据压缩的基本原理是冗余数据的消除。可以通过消除冗余的暂时的信息,例如消除在何处声音被重复、可预测或在感觉上冗余的消息,来压缩数据。这将人对高频率的不敏感性考虑在内。
通常,压缩导致在信号退化,越高的压缩率导致越大的退化。当以所获得的子流形成用于某个目标解码器的另一有效比特流;并且该子流表示具有低于完整原始比特流的、但是考虑到较低的剩余数据量而言仍然是高的重构质量的源内容的方式来去除比特流的部分时,将该比特流称为可调节的。不提供此性质的比特流被称为单层比特流。可调节性的常见模式是时间、空间、和质量可调节性。可调节性允许在有限带宽信道上调整压缩信号以获得最佳性能。
可以以提供包括基层和至少一个增强层的多个编码层并将各层构造成具有不同分辨力的方式来实现可调节性。
虽然许多编码方案是通用的,但某些编码方案并入了信号的模型。通常,当模型表示信号正在被编码时,能实现更好的信号压缩。因此,已知的是基于信号类型的分类来选择编码方案。例如,可以以不同于音乐信号的方式对声音信号进行建模和编码。然而,信号分类通常是个难题。
已知代码激励线性预测(CELP)是用于数字语音代码化的仍然非常流行的压缩(或“代码化”)技术的示例,其为“合成分析(analysis-by-synthesis)”代码化算法族中的一个。合成分析一般指的是如下的代码化过程,通过该代码化过程,使用数字模型的多个参数来将被与输入信号相比较并被进行失真分析的候选信号集合进行合成。然后,发送或存储提供最低失真的参数集合,并最终用来对原始输入信号的估计进行重构。CELP是使用一个或多个码本的特定的合成分析法,所述一个或者多个密码本本质上均包括响应于码本索引从码本检索到的代码矢量集合。
在现代CELP编码器中,存在以合理的低数据速率来保持高质量语音和音频再现方面的问题。对于不能够非常好地适配CELP语音模型的音乐或其它一般音频信号而言,情况尤其如此。在这种情况下,模型失配能够引起严重降低的音频质量,这对于采用此类方法的设备的最终用户而言可能是不可接受的。
附图说明
附图用于进一步示出各种实施例并说明全部依照本发明的各种原理和优点,在所述附图中,相同的附图标记在所有分离视图中自始至终指示相同或功能上类似的元件,且所述附图连同以下详细说明一起并入本说明并构成本说明书的一部分。
图1是现有技术的代码化系统和解码系统的方框图。
图2是依照本发明的某些实施例的代码化系统和解码系统的方框图。
图3是依照本发明的某些实施例的用于选择代码化系统的流程图。
图4-6是示出在输入语音信号时的依照本发明的某些实施例的比较器/选择器中的示例性信号的一系列图表。
图7-9是示出在输入音乐信号时的依照本发明的某些实施例的比较器/选择器中的示例性信号的一系列图表。
图10是依照本发明的某些实施例的用于选择性信号编码的方法的流程图。
本领域的技术人员将认识到图中的元件是为了简单和明了而示出的,且不一定按比例绘制。例如,可以将图中的某些元件的尺寸相对于其它元件放大,以帮助改善对本发明的实施例的理解。
具体实施方式
在详细描述依照本发明的实施例之前,应注意到实施例主要在于与基于模型适配的选择性信号代码化有关的方法步骤和装置组件的组合。因此,已经在附图中用惯用符号适当地表示了该装置组件和方法步骤,附图仅仅示出与理解本发明的实施例相关的那些细节,以免由于对于从本文说明中获益的本领域技术人员来说显而易见的细节使本公开含糊难懂。
在本文献中,诸如第一和第二、上和下等关系术语仅仅被使用用于将一个实体或动作与另一实体或动作区别开,而不一定要求或暗示此类实体或动作之间的任何实际此类关系或顺序。本文所使用的术语“包括”或其任何其它变体意图涵盖非排他性包括,使得包括一系列要素的过程、方法、物件、或装置不仅包括那些要素,而且可以包括未明确列出或为此类过程、方法、物件、或装置所固有的其它要素。在没有更多限制的情况下,术语“包括”之后的元素不排除包括该元素的过程、方法、物件、或装置中的额外的相同元素的存在。
应认识到本文所述的本发明的实施例可以包括一个或多个传统处理器和唯一存储的程序指令,所述唯一存储的程序指令控制所述一个或多个处理器与某些非处理器电路相结合地实现本文所述的基于模型适配的选择性信号代码化的某些、大多数、或全部功能。可选地,可以由不具有存储程序指令的状态机来实现某些或全部功能,或者可以在一个或多个专用集成电路(ASIC)中实现某些或者全部功能,在所述集成电路中,每个功能或某些功能的一些组合被实现为定制逻辑。当然,可以使用两种方法的组合。因此,本文已描述了用于这些功能的方法和装置。此外,可以预期的是,本领域的技术人员虽然可能进行了由于例如可用时间、当前技术和经济方面的考虑所激发的重大努力和许多设计选择,但当其受到本文所公开的构思和原理的教导时,将容易地能够以最少的实验来生成此类软件指令、程序和IC。
图1是现有技术的嵌入式代码化和解码系统100的方框图。在图1中,原始信号s(n)102被输入到编码系统的核心层编码器104中。核心层编码器104对信号120进行编码并产生核心层编码信号106。另外,原始信号102被输入到编码系统的增强层编码器108。增强层编码器108还接收第一重构信号sc(n)110作为输入。通过经由第一核心层解码器112传递核心层编码信号106来产生第一重构信号110。增强层编码器108用来基于信号s(n)(102)和sc(n)(110)的某些比较来对附加信息进行代码化,并可以可选地使用来自核心层编码器104的参数。在一个实施例中,增强层编码器108对作为重构信号110与输入信号102之间的差的误差信号进行编码。增强层编码器108产生增强层编码信号114。核心层编码信号106和增强层编码信号114两者都被传递到信道116。该信道表示诸如通信信道和/或存储介质等的介质。
在通过信道之后,通过经由第二核心层解码器120传递接收到的核心层编码信号106′来产生第二重构信号118。第二核心层解码器120执行与第一核心层解码器112相同的功能。如果增强层编码信号114也通过信道116并被作为信号114′被接收,则可以将其传递至增强层解码器122。增强层解码器122还接收第二重构信号118作为输入,并产生第三重构信号124作为输出。第三重构信号124比第二重构信号118更紧密地与原始信号102匹配。
增强层编码信号114包括使得信号102能够比第二重构信号118更准确地被重构的附加信息。也就是说,其为增强型重构。
此类嵌入式代码化系统的一个优点是特定信道116可能无法始终如一地支持与高质量音频代码化算法相关联的带宽要求。然而,嵌入式代码器允许从信道116接收部分比特流(例如,仅接收核心层比特流),以在增强层比特流丢失或损坏时仅产生例如核心输出音频。然而,在嵌入式与非嵌入式编码器的质量之间、以及在不同嵌入式代码化最优化目标之间存在权衡。也就是说,较高质量的增强层代码化可以帮助实现核心和增强层之间的更好平衡,并且还降低总数据速率,用于更好的传输特性(例如,减少的拥挤),这可以导致用于增强层的较低分组出错率。
虽然许多编码方案是通用的,但某些编码方案并入了信号的模型。通常,当模型表示信号正在被编码时,能实现更好的信号压缩。因此,已知的是基于信号类型的分类来选择编码方案。例如,可以以不同于音乐信号的方式对语音信号进行建模和编码。然而,信号分类通常是个难题。
图2是依照本发明的某些实施例的代码化和解码系统200的方框图。参照图2,原始信号102被输入到编码系统的核心层编码器104。原始信号102可以是语音/音频信号或另一种信号。核心层编码器104对信号120进行编码并产生核心层编码信号106。通过经由第一核心层解码器112传递核心层编码信号106来产生第一重构信号110。在比较器/选择器模块202中比较原始信号102和第一重构信号110。比较器/选择器模块202将原始信号102与第一重构信号110相比较,并基于该比较产生对要使用的增强层编码器206中的一个进行选择的选择信号204。虽然在图中仅示出两个增强层编码器,但应认识到可以使用多个增强层编码器。比较器/选择器模块模块202可以选择最可能生成最好重构信号的增强层编码器。
虽然核心层解码器112被视为用于接收被相应地发送到信道116的核心层编码信号106,但元件104和106之间的物理连接可以允许更高效的实现,使得公共处理元件和/或状态可以被共享,并因此不要求重新生成或复制。
每个增强层编码器206接收原始信号102和第一重构信号作为输入(或诸如由这些信道导出的差信号等信号),并且选定的编码器产生增强层编码信号208。在一个实施例中,增强层编码器206对作为重构信号110与输入信号102之间的差的误差信号进行编码。增强层编码信号208包含基于信号s(n)(102)和sc(n)(110)的比较的附加信息。可选地,其可以使用来自核心层解码器104的参数。核心层编码信号106、增强层编码信号208和选择信号204都被传递到信道116。该信道表示诸如通信信道和/或存储介质等的介质。
在通过信道之后,通过经由第二核心层解码器120传递接收到的核心层编码信号106′来产生第二重构信号118。第二核心层解码器120执行与第一核心层解码器112相同的功能。如果增强层编码信号208也通过信道116并被作为信号208′接收,则可以将其传递至增强层解码器210。增强层解码器210还接收第二重构信号118和作为输入的接收到的选择信号204’,并产生第三重构信号212作为输出。增强层解码器210的操作取决于接收到的选择信号204′。第三重构信号212比第二重构信号118更紧密地与原始信号102匹配。
增强层编码信号208包括附加信息,因此,第三重构信号212比第二重构信号118更准确地与信号102匹配。
图3是依照本发明的某些实施例的用于选择代码化系统的方法的流程图。特别地,图3描述本发明的实施例中的比较器/选择器模块的操作。在起始框302之后,根据需要将输入信号(图2中的102)和重构信号(图2中的110)变换到选定的信号域。可以在没有变换的情况下使用时域信号,或者在方框304处,可以将信号变换到谱域,例如,诸如频域、改进离散余弦变换(MDCT)域、或小波域,并且还可以通过其它可选元素进行处理,诸如信号的某些频率或时间特性的感知加权。已变换(或时域)输入信号被表示为用于谱分量k的S(k),并且已变换(或时域)重构信号被表示为用于谱分量k的Sc(k)。对于选定的分量集合(其可以是所有或仅仅某些分量)中的每个分量k而言,将重构信号中的所有分量Sc(k)的能量E_tot与比原始输入信号的相应分量S(k)大(例如,以某个因数)的那些分量中的能量E_err相比较。
虽然输入和重构信号分量可能在振幅方面相差悬殊,但重构信号分量的振幅的显著增大可指示建模不良的输入信号。因此,可以用给定增强层代码化方法来补偿较低振幅的重构信号分量,而较高振幅(即,建模不良)的重构信号分量可能更好地适合于替换增强层代码化方法。一种此类替换增强层代码化方法可能涉及在增强层代码化之前减少重构信号的某些分量的能量,使得由于核心层信号模型失配而产生的可听噪声或失真减小。
再次参照图3,在方框306处对分量的环路进行初始化,其中,对分量k进行初始化,并将能量度量E_tot和E_err初始化为零。在判定框308处,进行检查以确定重构信号的分量的绝对值是否显著大于输入信号的相应分量。如果其明显较大,如来自判定框308的正分支所描绘的,则在方框310处将该分量添加到误差能量E_err,并且流程继续至方框312。在方框312处,将重构信号的分量添加到总能量值E_tot。在判定框314处,增加分量值并进行检查,以确定是否所有分量已被处理。如果不是,如来自判定框314的负分支所描绘的,则流程返回方框308。否则,如来自判定框316的正分支所描绘的,环路完成并在判定框316处比较总的累积能量。如果误差能量E_err以总误差E_tot低得多,如来自判定框316的负分支所描绘的,则在方框318处选择类型1增强层。否则,如来自判定框316的正分支所描绘的,在方框320处选择类型2增强层。输入信号的此块的处理在方框322处终止。
对本领域的技术人员显而易见的是可以使用信号能量的其它度量,诸如提高到某个功率的分量的绝对值。例如,可以将分量Sc(k)的能量估计为|Sc(k)|P,并可以将分量S(k)的能量估计为|Sc(k)|P,其中,P是大于零的数。
对于本领域的技术人员来说显而易见的是可以将误差能量E_err与输入信号中的总能量而不是重构信号中的总能量相比较。
可以在编程处理器上实现编码器。下面给出与图3相对应的示例性代码列表。在图中,分别用E_tot和E_err来表示变量energy_tot和energy_err。
Thresh1=0.49;
Thresh2=0.264;
energy_tot=0;
energy_err=0;
for(k=kStart;k<kMax;k++)
{
if(Thresh1*abs(Sc[k])>abs(S[k])){
energy_err+=abs(Sc[k]);
}
energy_tot+=abs(Sc[k]);
}
if(energy_err<Thresh2*energy_tot)
type=1;
else
type=2;
在本示例中,阈值Thresh1和Thresh2分别被设置在0.49和0.264。可以根据所使用的增强层编码器的类型以及根据使用哪个变换域来使用其它值。
可以添加滞后级,因此,只有当特定数目的信号块是相同类型时才改变增强层类型。例如,如果正在使用编码器类型1,则将不选择类型2,除非两个连续块指示类型2的使用。
图4-6是示出用于语音信号的示例性结果的一系列图表。图4中的图表402示出重构信号的能量E_tot。在20毫秒帧中计算能量,因此,该图表示出10秒间隔内的信号能量的变化。图5中的图表502示出误差能量E_err与相同时间段内的总能量E_tot的比。阈值Thresh2被示为虚线504。在其中所述比超过阈值的帧中的语音信号未被代码器很好地建模。然而,对于大部分帧而言,未超过阈值。图6中的图表602示出相同时间段内的选择或判定信号。在本示例中,值0指示选择了类型1增强层代码器,且值1指示选择了类型2增强层代码器。在其中所述比高于阈值的隔离帧被忽视,并且该选择只有在两个连续帧指示相同选择时才改变。因此,例如,即使所述比超过阈值,也选择类型1增强层编码器用于帧141。
图7-9示出音乐信号的相应的一系列图表。图7中的图表702示出输入信号的能量E_tot。再次地,在20毫秒帧中计算能量,因此,该图表示出10秒间隔内的输入能量变化。图8中的图表示出误差能量E_err与相同时间段内的总能量E_tot的比。阈值Thresh2被示为虚线504。在其中所述比超过阈值的帧中的音乐信号未被代码器很好地建模。大多数帧情况如此,因为核心代码器是为语音信号而设计的。图9中的图表902示出相同时间段内的选择或判定信号。再次地,值0指示选择了类型1增强层编码器且值1指示选择了类型2增强层编码器。因此,大多数时间选择类型2增强层编码器。然而,在其中核心编码器碰巧适用于音乐的帧中,选择类型1增强层编码器。
在对语音信号的22,803个帧的测试中,仅在227个帧、亦即仅1%的时间中选择类型2增强层编码器.在对音乐的29,644个帧的测试中,在16,145个帧、亦即54%的时间中选择类型2增强层编码器。在其它帧中,核心编码器碰巧适用于音乐并选择了用于语音的增强层编码器。因此,比较器/选择器不是语音/音乐分类器。这与设法将输入信号分类为语音或音乐并随后相应地选择代码化方案的在先方案相反。这里的方法是根据核心层编码器的性能来选择增强层编码器。
图10是示出依照本发明的某些实施例的嵌入式代码器的操作的流程图。该流程图示出用来对信号数据的一个帧进行编码的方法。基于信号的时间特性来选择帧的长度。例如,可以将20ms的帧用于语音信号。在图10中的起始框1002之后,使用核心层编码器在方框1004处对输入信号进行编码,以产生核心层编码信号。在方框1006处,对核心层编码信号进行解码,以产生重构信号。在本实施例中,在方框1008处生成误差信号作为重构信号与输入信号之间的差。在方框1010处将重构信号与输入信号相比较,并在判定框1012处确定重构信号是否是用于输入信号的良好匹配。如果匹配良好,如来自判定框1012的正分支所描绘的,则在方框1014处使用类型1增强层编码器来对误差信号进行编码。如果匹配不好,如来自判定框1012的负分支所描绘的,则在方框1016处使用类型2增强层编码器来对误差信号进行编码。在方框1018处,将核心层编码信号、增强层编码信号、和选择指示符输出到信道(例如以便传输或存储)。帧的处理在方框1020处终止。
在本实施例中,增强层编码器可对误差信号进行响应,然而,在替换实施例中,增强层编码器可对输入信号和可选地对来自核心层编码器和/或核心层解码器的一个或多个信号进行响应。在另一实施例中,使用替换误差信号,诸如输入信号和重构信号之间的加权差。例如,可以在形成误差信号之前使重构信号的某些频率衰减。可以将结果得到的误差信号称为加权误差信号。
在替换实施例中,核心层编码器和解码器还可以包括其它增强层,并且本发明比较器可以接收作为重构信号的之前的增强层中的一个的输出作为输入。另外,可以存在在上述增强层之后的增强层,其可以是或可以不是根据比较的结果而被切换。例如,嵌入式代码化系统可以包括五个层。核心层(L1)和第二层(L2)可以产生重构信号Sc(k)。然后,可以使用重构信号Sc(k)和输入信号S(k)来选择第三和四层(L3、L4)中的增强层编码方法。最后,第五层(L5)可以仅包括单个增强层编码方法。
编码器可以根据重构信号和输入信号之间的比较在两个或更多增强层编码器之间进行选择。
可以例如在编程处理器、可重配置处理器或专用集成电路上实现编码器和解码器。
在前述说明书中,已描述了本发明的特定实施例。然而,本领域的技术人员应认识到在不脱离如以下权利要求所阐述的本发明的范围的情况下可以进行各种修改和变更。因此,应将本说明书和附图视为说明性而不是限制性的,并且所有此类修改意图被包括在本发明的范围内。然而,不应将所述益处、优点、问题的解决方案、以及可促使任何益处、优点、或解决方案发生或变得更加明显的任何要素理解为任何或全部权利要求的关键、必要、或本质特征或要素。仅仅由包括在本申请待决期间进行的任何修改的随附权利要求和发布的那些权利要求的所有等价物来定义本发明。
Claims (20)
1.一种用于对输入信号进行代码化的方法,所述方法包括:
使用核心层编码器对输入信号进行编码,以产生核心层编码信号;
对所述核心层编码信号进行解码,以产生重构信号;
将所述重构信号与所述输入信号相比较;
根据所述重构信号和所述输入信号之间的比较,从多个增强层编码器中选择增强层编码器;以及
使用选定的增强层编码器来生成增强层编码信号,所述增强层编码信号取决于所述输入信号。
2.如权利要求1所述的方法,进一步包括:
将误差信号生成为所述重构信号与所述输入信号之间的差,
其中,生成所述增强层编码信号的步骤包括:对所述误差信号进行编码。
3.如权利要求1所述的方法,其中,所述误差信号包括所述重构信号与所述输入信号之间的加权差。
4.如权利要求1所述的方法,其中,将所述重构信号与所述输入信号相比较的步骤包括:
估计所述重构信号的分量中的能量E_tot;
估计包含误差的所述重构信号的分量中的能量E_err;以及
将所述能量E_tot与所述能量E_err相比较。
5.如权利要求4所述的方法,还包括:
变换所述重构信号,以产生所述重构信号的分量,
其中,从由傅立叶变换、改进离散余弦变换(MDCT)和小波变换组成的变换组中选择所述变换。
6.如权利要求4所述的方法,其中,估计包含误差的所述重构信号的分量中的能量E_err的步骤包括:
对所述输入信号的分量S(k)与所述重构信号的分量Sc(k)的比S(k)/Sc(k)超过阈值的所述重构信号的那些分量Sc(k)的能量求和。
7.如权利要求4所述的方法,进一步包括:
变换所述重构信号,以产生所述重构信号的分量;以及
变换所述输入信号,以产生所述输入信号的分量,
其中,从由傅立叶变换、改进离散余弦变换(MDCT)和小波变换组成的变换组中选择所述变换。
8.如权利要求6所述的方法,其中,分量Sc(k)的所述能量被估计为|Sc(k)|P,并且其中,分量S(k)的所述能量被估计为|Sc(k)|P,其中,P是大于零的数。
9.如权利要求10所述的方法,其中,将所述能量E_tot与所述能量E_err相比较的步骤包括:
将能量的比E_err/E_tot与阈值相比较。
10.如权利要求1所述的方法,其中,所述输入信号包括音频信号,并且其中,所述核心层编码包括语音编码器。
11.如权利要求1所述的方法,进一步包括:将所述核心层编码信号、所述增强层编码信号和所述选定的增强层编码器的指示符输出到信道。
12.一种选择性信号编码器,包括:
核心层编码器,所述核心层编码器接收要编码的输入信号并产生核心层编码信号;
核心层解码器,所述核心层解码器接收所述核心层编码信号作为输入,并产生重构信号;
多个增强层编码器,所述多个增强层编码器中的每个可选择地用于对误差信号进行编码,以产生增强层编码信号,所述误差信号包括所述输入信号和所述重构信号之间的差;以及
比较器/选择器模块,所述比较器/选择器模块根据所述输入信号和核心层编码信号的比较来选择所述多个增强层编码器中的增强层编码器,
其中,所述输入信号被编码为所述核心层编码信号、所述增强层编码信号和选定的增强层编码器的指示符。
13.如权利要求12所述的选择性信号编码器,其中,所述核心层编码器包括语音编码器。
14.如权利要求12所述的选择性信号编码器,其中,所述比较器/选择器模块:
估计所述重构信号的分量中的能量E_tot;
估计包含误差的所述重构信号的分量中的能量E_err;以及
将所述能量E_tot与所述能量E_err相比较。
15.如权利要求14所述的选择性信号编码器,其中,所述比较器/选择器模块通过对所述输入信号的分量S(k)与所述重构信号的分量Sc(k)的比S(k)/Sc(k)超过阈值的所述重构信号的那些分量Sc(k)求和来估计包含误差的所述重构信号的分量中的能量E_err。
16.如权利要求14所述的选择性信号编码器,其中,所述比较器/选择器模块通过将能量的比E_err/E_tot与阈值相比较来将所述能量E_tot与所述能量E_err相比较。
17.如权利要求14所述的选择性信号编码器,其中,经由从由傅立叶变换、改进离散余弦变换(MDCT)和小波变换组成的变换组中选择的变换来计算所述重构信号的分量和所述输入信号的分量。
18.一种用于对初始信号进行解码的选择性信号解码器,所述初始信号被编码为核心层编码信号、增强层编码信号和选定增强层编码器的指示符,所述解码器包括:
核心层解码器,所述核心层解码器接收所述核心层编码信号作为输入并产生第一重构信号;以及
增强层解码器,所述增强层解码器由所述选定增强层编码器的指示符来控制,所述增强层解码器对所述增强层编码信号进行解码,以产生第二重构信号。
19.如权利要求18所述的选择性信号解码器,其中,所述第二重构信号包括误差信号,并且其中,所述初始信号被恢复为所述重构信号和所述误差信号的和。
20.如权利要求18所述的选择性信号解码器,其中,所述增强层解码器响应于所述第一重构信号第二和所述增强层编码信号,并且其中,所述第二重构信号是所述初始信号的估计。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/099,842 US8639519B2 (en) | 2008-04-09 | 2008-04-09 | Method and apparatus for selective signal coding based on core encoder performance |
US12/099,842 | 2008-04-09 | ||
PCT/US2009/039984 WO2009126759A1 (en) | 2008-04-09 | 2009-04-09 | Method and apparatus for selective signal coding based on core encoder performance |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102047325A true CN102047325A (zh) | 2011-05-04 |
Family
ID=40909774
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2009801125660A Pending CN102047325A (zh) | 2008-04-09 | 2009-04-09 | 基于核心编码器性能进行选择性信号代码化的方法和装置 |
Country Status (9)
Country | Link |
---|---|
US (1) | US8639519B2 (zh) |
EP (1) | EP2272063B1 (zh) |
KR (1) | KR101317530B1 (zh) |
CN (1) | CN102047325A (zh) |
BR (1) | BRPI0909487A8 (zh) |
ES (1) | ES2396481T3 (zh) |
MX (1) | MX2010011111A (zh) |
RU (1) | RU2504026C2 (zh) |
WO (1) | WO2009126759A1 (zh) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7461106B2 (en) * | 2006-09-12 | 2008-12-02 | Motorola, Inc. | Apparatus and method for low complexity combinatorial coding of signals |
US8576096B2 (en) * | 2007-10-11 | 2013-11-05 | Motorola Mobility Llc | Apparatus and method for low complexity combinatorial coding of signals |
US8209190B2 (en) * | 2007-10-25 | 2012-06-26 | Motorola Mobility, Inc. | Method and apparatus for generating an enhancement layer within an audio coding system |
US7889103B2 (en) * | 2008-03-13 | 2011-02-15 | Motorola Mobility, Inc. | Method and apparatus for low complexity combinatorial coding of signals |
US20090234642A1 (en) * | 2008-03-13 | 2009-09-17 | Motorola, Inc. | Method and Apparatus for Low Complexity Combinatorial Coding of Signals |
US8200496B2 (en) * | 2008-12-29 | 2012-06-12 | Motorola Mobility, Inc. | Audio signal decoder and method for producing a scaled reconstructed audio signal |
US8219408B2 (en) * | 2008-12-29 | 2012-07-10 | Motorola Mobility, Inc. | Audio signal decoder and method for producing a scaled reconstructed audio signal |
US8140342B2 (en) * | 2008-12-29 | 2012-03-20 | Motorola Mobility, Inc. | Selective scaling mask computation based on peak detection |
US8175888B2 (en) * | 2008-12-29 | 2012-05-08 | Motorola Mobility, Inc. | Enhanced layered gain factor balancing within a multiple-channel audio coding system |
CN101771417B (zh) * | 2008-12-30 | 2012-04-18 | 华为技术有限公司 | 信号编码、解码方法及装置、系统 |
CN102239518B (zh) * | 2009-03-27 | 2012-11-21 | 华为技术有限公司 | 编码和解码方法及装置 |
US8149144B2 (en) * | 2009-12-31 | 2012-04-03 | Motorola Mobility, Inc. | Hybrid arithmetic-combinatorial encoder |
US8442837B2 (en) | 2009-12-31 | 2013-05-14 | Motorola Mobility Llc | Embedded speech and audio coding using a switchable model core |
US8428936B2 (en) * | 2010-03-05 | 2013-04-23 | Motorola Mobility Llc | Decoder for audio signal including generic audio and speech frames |
US8423355B2 (en) * | 2010-03-05 | 2013-04-16 | Motorola Mobility Llc | Encoder for audio signal including generic audio and speech frames |
CN101964188B (zh) * | 2010-04-09 | 2012-09-05 | 华为技术有限公司 | 语音信号编码、解码方法、装置及编解码系统 |
US9037456B2 (en) * | 2011-07-26 | 2015-05-19 | Google Technology Holdings LLC | Method and apparatus for audio coding and decoding |
US9129600B2 (en) * | 2012-09-26 | 2015-09-08 | Google Technology Holdings LLC | Method and apparatus for encoding an audio signal |
US11146803B2 (en) * | 2013-03-11 | 2021-10-12 | Dolby Laboratories Licensing Corporation | Distribution of multi-format high dynamic range video using layered coding |
US9953660B2 (en) * | 2014-08-19 | 2018-04-24 | Nuance Communications, Inc. | System and method for reducing tandeming effects in a communication system |
CN112639968A (zh) * | 2018-08-30 | 2021-04-09 | 杜比国际公司 | 用于控制对经低比特率编码的音频的增强的方法和装置 |
Family Cites Families (84)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4560977A (en) | 1982-06-11 | 1985-12-24 | Mitsubishi Denki Kabushiki Kaisha | Vector quantizer |
US4670851A (en) | 1984-01-09 | 1987-06-02 | Mitsubishi Denki Kabushiki Kaisha | Vector quantizer |
US4727354A (en) | 1987-01-07 | 1988-02-23 | Unisys Corporation | System for selecting best fit vector code in vector quantization encoding |
JP2527351B2 (ja) | 1987-02-25 | 1996-08-21 | 富士写真フイルム株式会社 | 画像デ―タの圧縮方法 |
US5067152A (en) | 1989-01-30 | 1991-11-19 | Information Technologies Research, Inc. | Method and apparatus for vector quantization |
DE68922610T2 (de) | 1989-09-25 | 1996-02-22 | Rai Radiotelevisione Italiana | Umfassendes System zur Codierung und Übertragung von Videosignalen mit Bewegungsvektoren. |
CN1062963C (zh) | 1990-04-12 | 2001-03-07 | 多尔拜实验特许公司 | 用于产生高质量声音信号的解码器和编码器 |
WO1993018505A1 (en) | 1992-03-02 | 1993-09-16 | The Walt Disney Company | Voice transformation system |
IT1281001B1 (it) * | 1995-10-27 | 1998-02-11 | Cselt Centro Studi Lab Telecom | Procedimento e apparecchiatura per codificare, manipolare e decodificare segnali audio. |
US5956674A (en) | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
US6263312B1 (en) | 1997-10-03 | 2001-07-17 | Alaris, Inc. | Audio compression and decompression employing subband decomposition of residual signal and distortion reduction |
ES2247741T3 (es) | 1998-01-22 | 2006-03-01 | Deutsche Telekom Ag | Metodo para conmutacion controlada por señales entre esquemas de codificacion de audio. |
US6253185B1 (en) | 1998-02-25 | 2001-06-26 | Lucent Technologies Inc. | Multiple description transform coding of audio using optimal transforms of arbitrary dimension |
US6904174B1 (en) | 1998-12-11 | 2005-06-07 | Intel Corporation | Simplified predictive video encoder |
US6480822B2 (en) | 1998-08-24 | 2002-11-12 | Conexant Systems, Inc. | Low complexity random codebook structure |
JP4249821B2 (ja) | 1998-08-31 | 2009-04-08 | 富士通株式会社 | ディジタルオーディオ再生装置 |
CA2246532A1 (en) | 1998-09-04 | 2000-03-04 | Northern Telecom Limited | Perceptual audio coding |
US6453287B1 (en) | 1999-02-04 | 2002-09-17 | Georgia-Tech Research Corporation | Apparatus and quality enhancement algorithm for mixed excitation linear predictive (MELP) and other speech coders |
US6691092B1 (en) | 1999-04-05 | 2004-02-10 | Hughes Electronics Corporation | Voicing measure as an estimate of signal periodicity for a frequency domain interpolative speech codec system |
AU4201100A (en) | 1999-04-05 | 2000-10-23 | Hughes Electronics Corporation | Spectral phase modeling of the prototype waveform components for a frequency domain interpolative speech codec system |
US6236960B1 (en) | 1999-08-06 | 2001-05-22 | Motorola, Inc. | Factorial packing method and apparatus for information coding |
US6504877B1 (en) | 1999-12-14 | 2003-01-07 | Agere Systems Inc. | Successively refinable Trellis-Based Scalar Vector quantizers |
JP4149637B2 (ja) | 2000-05-25 | 2008-09-10 | 株式会社東芝 | 半導体装置 |
US6304196B1 (en) | 2000-10-19 | 2001-10-16 | Integrated Device Technology, Inc. | Disparity and transition density control system and method |
AUPR105000A0 (en) | 2000-10-27 | 2000-11-23 | Canon Kabushiki Kaisha | Method for generating and detecting marks |
JP3404024B2 (ja) | 2001-02-27 | 2003-05-06 | 三菱電機株式会社 | 音声符号化方法および音声符号化装置 |
JP3636094B2 (ja) | 2001-05-07 | 2005-04-06 | ソニー株式会社 | 信号符号化装置及び方法、並びに信号復号装置及び方法 |
JP4506039B2 (ja) | 2001-06-15 | 2010-07-21 | ソニー株式会社 | 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム |
US6658383B2 (en) | 2001-06-26 | 2003-12-02 | Microsoft Corporation | Method for coding speech and music signals |
US6662154B2 (en) | 2001-12-12 | 2003-12-09 | Motorola, Inc. | Method and system for information signal coding using combinatorial and huffman codes |
AU2003213149A1 (en) | 2002-02-21 | 2003-09-09 | The Regents Of The University Of California | Scalable compression of audio and other signals |
CN1266673C (zh) * | 2002-03-12 | 2006-07-26 | 诺基亚有限公司 | 可伸缩音频编码的有效改进 |
JP3881943B2 (ja) * | 2002-09-06 | 2007-02-14 | 松下電器産業株式会社 | 音響符号化装置及び音響符号化方法 |
FR2852172A1 (fr) * | 2003-03-04 | 2004-09-10 | France Telecom | Procede et dispositif de reconstruction spectrale d'un signal audio |
WO2004082288A1 (en) * | 2003-03-11 | 2004-09-23 | Nokia Corporation | Switching between coding schemes |
KR101000345B1 (ko) | 2003-04-30 | 2010-12-13 | 파나소닉 주식회사 | 음성 부호화 장치, 음성 복호화 장치 및 그 방법 |
JP2005005844A (ja) | 2003-06-10 | 2005-01-06 | Hitachi Ltd | 計算装置及び符号化処理プログラム |
JP4123109B2 (ja) | 2003-08-29 | 2008-07-23 | 日本ビクター株式会社 | 変調装置及び変調方法並びに復調装置及び復調方法 |
SE527670C2 (sv) | 2003-12-19 | 2006-05-09 | Ericsson Telefon Ab L M | Naturtrogenhetsoptimerad kodning med variabel ramlängd |
KR100629997B1 (ko) * | 2004-02-26 | 2006-09-27 | 엘지전자 주식회사 | 오디오 신호의 인코딩 방법 |
MXPA06011396A (es) * | 2004-04-05 | 2006-12-20 | Koninkl Philips Electronics Nv | Metodos de codificacion y decodificacion de senales estereofonicas y aparatos que utilizan los mismos. |
US7596486B2 (en) * | 2004-05-19 | 2009-09-29 | Nokia Corporation | Encoding an audio signal using different audio coder modes |
US20060022374A1 (en) | 2004-07-28 | 2006-02-02 | Sun Turn Industrial Co., Ltd. | Processing method for making column-shaped foam |
US6975253B1 (en) | 2004-08-06 | 2005-12-13 | Analog Devices, Inc. | System and method for static Huffman decoding |
US7161507B2 (en) | 2004-08-20 | 2007-01-09 | 1St Works Corporation | Fast, practically optimal entropy coding |
US20060047522A1 (en) | 2004-08-26 | 2006-03-02 | Nokia Corporation | Method, apparatus and computer program to provide predictor adaptation for advanced audio coding (AAC) system |
JP4771674B2 (ja) * | 2004-09-02 | 2011-09-14 | パナソニック株式会社 | 音声符号化装置、音声復号化装置及びこれらの方法 |
WO2006070751A1 (ja) | 2004-12-27 | 2006-07-06 | Matsushita Electric Industrial Co., Ltd. | 音声符号化装置および音声符号化方法 |
US20060190246A1 (en) * | 2005-02-23 | 2006-08-24 | Via Telecom Co., Ltd. | Transcoding method for switching between selectable mode voice encoder and an enhanced variable rate CODEC |
JP4846712B2 (ja) * | 2005-03-14 | 2011-12-28 | パナソニック株式会社 | スケーラブル復号化装置およびスケーラブル復号化方法 |
KR100707186B1 (ko) * | 2005-03-24 | 2007-04-13 | 삼성전자주식회사 | 오디오 부호화 및 복호화 장치와 그 방법 및 기록 매체 |
BRPI0608756B1 (pt) * | 2005-03-30 | 2019-06-04 | Koninklijke Philips N. V. | Codificador e decodificador de áudio de multicanais, método para codificar e decodificar um sinal de áudio de n canais, sinal de áudio de multicanais codificado para um sinal de áudio de n canais e sistema de transmissão |
US7885809B2 (en) | 2005-04-20 | 2011-02-08 | Ntt Docomo, Inc. | Quantization of speech and audio coding parameters using partial information on atypical subsequences |
DE602006011600D1 (de) * | 2005-04-28 | 2010-02-25 | Panasonic Corp | Audiocodierungseinrichtung und audiocodierungsverfahren |
US7831421B2 (en) | 2005-05-31 | 2010-11-09 | Microsoft Corporation | Robust decoder |
US8315863B2 (en) * | 2005-06-17 | 2012-11-20 | Panasonic Corporation | Post filter, decoder, and post filtering method |
FR2888699A1 (fr) * | 2005-07-13 | 2007-01-19 | France Telecom | Dispositif de codage/decodage hierachique |
ES2356492T3 (es) * | 2005-07-22 | 2011-04-08 | France Telecom | Método de conmutación de tasa de transmisión en decodificación de audio escalable en tasa de transmisión y ancho de banda. |
CN101253557B (zh) | 2005-08-31 | 2012-06-20 | 松下电器产业株式会社 | 立体声编码装置及立体声编码方法 |
US8069035B2 (en) * | 2005-10-14 | 2011-11-29 | Panasonic Corporation | Scalable encoding apparatus, scalable decoding apparatus, and methods of them |
EP1959431B1 (en) | 2005-11-30 | 2010-06-23 | Panasonic Corporation | Scalable coding apparatus and scalable coding method |
EP1989706B1 (fr) | 2006-02-14 | 2011-10-26 | France Telecom | Dispositif de ponderation perceptuelle en codage/decodage audio |
WO2007105586A1 (ja) * | 2006-03-10 | 2007-09-20 | Matsushita Electric Industrial Co., Ltd. | 符号化装置および符号化方法 |
US20070239294A1 (en) | 2006-03-29 | 2007-10-11 | Andrea Brueckner | Hearing instrument having audio feedback capability |
US7230550B1 (en) | 2006-05-16 | 2007-06-12 | Motorola, Inc. | Low-complexity bit-robust method and system for combining codewords to form a single codeword |
US7414549B1 (en) | 2006-08-04 | 2008-08-19 | The Texas A&M University System | Wyner-Ziv coding based on TCQ and LDPC codes |
US7461106B2 (en) | 2006-09-12 | 2008-12-02 | Motorola, Inc. | Apparatus and method for low complexity combinatorial coding of signals |
US8285555B2 (en) * | 2006-11-21 | 2012-10-09 | Samsung Electronics Co., Ltd. | Method, medium, and system scalably encoding/decoding audio/speech |
MX2008012439A (es) | 2006-11-24 | 2008-10-10 | Lg Electronics Inc | Metodo de codificacion y decodificacion de señal de audio basada en objetos y aparato para lo mismo. |
US8060363B2 (en) * | 2007-02-13 | 2011-11-15 | Nokia Corporation | Audio signal encoding |
BRPI0807703B1 (pt) * | 2007-02-26 | 2020-09-24 | Dolby Laboratories Licensing Corporation | Método para aperfeiçoar a fala em áudio de entretenimento e meio de armazenamento não-transitório legível por computador |
US7761290B2 (en) | 2007-06-15 | 2010-07-20 | Microsoft Corporation | Flexible frequency and time partitioning in perceptual transform coding of audio |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
US8576096B2 (en) | 2007-10-11 | 2013-11-05 | Motorola Mobility Llc | Apparatus and method for low complexity combinatorial coding of signals |
US8209190B2 (en) | 2007-10-25 | 2012-06-26 | Motorola Mobility, Inc. | Method and apparatus for generating an enhancement layer within an audio coding system |
US20090234642A1 (en) | 2008-03-13 | 2009-09-17 | Motorola, Inc. | Method and Apparatus for Low Complexity Combinatorial Coding of Signals |
US7889103B2 (en) | 2008-03-13 | 2011-02-15 | Motorola Mobility, Inc. | Method and apparatus for low complexity combinatorial coding of signals |
BR122021009252B1 (pt) | 2008-07-11 | 2022-03-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. | Codificador e decodificador de áudio para estruturas de codificação de sinais de áudio amostrados |
US20100088090A1 (en) | 2008-10-08 | 2010-04-08 | Motorola, Inc. | Arithmetic encoding for celp speech encoders |
US8219408B2 (en) | 2008-12-29 | 2012-07-10 | Motorola Mobility, Inc. | Audio signal decoder and method for producing a scaled reconstructed audio signal |
US8175888B2 (en) | 2008-12-29 | 2012-05-08 | Motorola Mobility, Inc. | Enhanced layered gain factor balancing within a multiple-channel audio coding system |
US8140342B2 (en) | 2008-12-29 | 2012-03-20 | Motorola Mobility, Inc. | Selective scaling mask computation based on peak detection |
US8200496B2 (en) | 2008-12-29 | 2012-06-12 | Motorola Mobility, Inc. | Audio signal decoder and method for producing a scaled reconstructed audio signal |
US8442837B2 (en) | 2009-12-31 | 2013-05-14 | Motorola Mobility Llc | Embedded speech and audio coding using a switchable model core |
-
2008
- 2008-04-09 US US12/099,842 patent/US8639519B2/en active Active
-
2009
- 2009-04-09 RU RU2010145274/08A patent/RU2504026C2/ru active
- 2009-04-09 KR KR1020107025140A patent/KR101317530B1/ko active IP Right Grant
- 2009-04-09 CN CN2009801125660A patent/CN102047325A/zh active Pending
- 2009-04-09 MX MX2010011111A patent/MX2010011111A/es active IP Right Grant
- 2009-04-09 ES ES09730909T patent/ES2396481T3/es active Active
- 2009-04-09 EP EP09730909A patent/EP2272063B1/en active Active
- 2009-04-09 BR BRPI0909487A patent/BRPI0909487A8/pt not_active IP Right Cessation
- 2009-04-09 WO PCT/US2009/039984 patent/WO2009126759A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
KR101317530B1 (ko) | 2013-10-15 |
MX2010011111A (es) | 2011-02-23 |
WO2009126759A1 (en) | 2009-10-15 |
RU2010145274A (ru) | 2012-05-20 |
US8639519B2 (en) | 2014-01-28 |
BRPI0909487A2 (pt) | 2017-10-17 |
EP2272063A1 (en) | 2011-01-12 |
EP2272063B1 (en) | 2012-11-28 |
US20090259477A1 (en) | 2009-10-15 |
BRPI0909487A8 (pt) | 2018-04-03 |
ES2396481T3 (es) | 2013-02-21 |
RU2504026C2 (ru) | 2014-01-10 |
KR20110002088A (ko) | 2011-01-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102047325A (zh) | 基于核心编码器性能进行选择性信号代码化的方法和装置 | |
KR100936498B1 (ko) | 스테레오 호환성의 멀티채널 오디오 코딩 | |
CN101218628B (zh) | 编码和解码音频信号的装置和方法 | |
KR100955361B1 (ko) | 적응 잔류 오디오 코딩 | |
KR101180202B1 (ko) | 다중채널 오디오 코딩 시스템 내에 인핸스먼트 레이어를 생성하기 위한 방법 및 장치 | |
US8442837B2 (en) | Embedded speech and audio coding using a switchable model core | |
CN101939782B (zh) | 噪声填充与带宽扩展之间的自适应过渡频率 | |
CA2697830C (en) | A method and an apparatus for processing a signal | |
CN102119414B (zh) | 用于在超帧中量化和逆量化线性预测系数滤波器的设备和方法 | |
US9734837B2 (en) | Method, medium, and system scalably encoding/decoding audio/speech | |
CN101836252A (zh) | 用于在音频代码化系统中生成增强层的方法和装置 | |
US20080077412A1 (en) | Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding | |
KR101387808B1 (ko) | 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치 | |
US20120123788A1 (en) | Coding method, decoding method, and device and program using the methods | |
Rumsey | Improving Low Bit-Rate Coding | |
Moreno | Variable frame size for vector quantization and application to speech coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20110504 |