CN101836250B

CN101836250B - 用于处理信号的方法及装置

Info

Publication number: CN101836250B
Application number: CN200880112671XA
Authority: CN
Inventors: 吴贤午; 郑亮源
Original assignee: LG Electronics Inc
Current assignee: LG Electronics Inc
Priority date: 2007-11-21
Filing date: 2008-11-21
Publication date: 2012-11-28
Anticipated expiration: 2028-11-21
Also published as: EP2218068A1; EP2210253A4; AU2008326957B2; WO2009066959A1; US8583445B2; JP2011504249A; MX2010002629A; WO2009066960A1; KR101221918B1; RU2449387C2; EP2218068A4; CA2705968A1; CN101868821A; KR20100095585A; US20100274557A1; US20100305956A1; RU2010125251A; AU2008326957A1; KR20100085018A; RU2010125221A

Abstract

公开了一种处理信号的方法。本发明包括接收第一信号和第二信号的至少一个，获得模式信息和指示第一信号是否被修改的修改标记信息，如果按照模式信息确定为音频编码方案，则通过所述音频编码方案解码所述第一信号，如果基于所述修改标记信息所述第一信号被修改，则通过将修改重建信息应用于所述第一信号来重建所述第一信号，基于扩展信息确定对应于所述第一信号的部分区域的扩展基础信号，以及使用所述扩展基础信号和所述扩展信息产生具有通过重建高频区域信号扩展的带宽的扩展下混信号。按照本发明的信号处理方法和装置，在通过第一编码方案解码第一信号之后，在执行编码时使用用于重建在时域中修改的所述第一信号的修改重建信息来调整所述第一信号。因此，能够提供编码效率提高的信号。

Description

用于处理信号的方法及装置

技术领域

本发明特别地适用于按照信号特征通过适宜的方案编码或者解码信号。

背景技术

通常，语音编码器能够以低于12kps的低比特率编码语音信号，而音频编码器能够以高于48kbp的高比特率提供高质量的音频信号。

发明内容

技术问题

但是，常规的音频编码器在处理语音信号方面是低效的。并且，常规的语音编码器不适用于处理音频信号。

技术解决方案

因此，本发明涉及一种用于处理信号的装置及其方法，其基本上消除了由于相关技术的限制和缺点而导致的一个或多个的问题。

本发明的一个目的是提供一种用于处理信号的装置及其方法，通过该装置及其方法可以使用确定编码方案的模式信息和在第一信号的时域上调整间隔的修改重建信息，按照声源的特征有效地处理信号。

本发明的另一个目的提供一种用于处理信号的装置及其方法，通过该装置及其方法可以按照声源的特征以以下的方式有效地处理信号，即，使用带宽扩展技术以各种方式确定用于重建由编码器侧去除的高频区域的扩展基础信号。

有益效果

因此，本发明提供以下的效果或者优点。

首先，在用于处理信号的装置及其方法中，在第一信号通过第一编码方案编码之前，第一信号的时域的时间间隔的大小被修改。然后通过第一编码方案编码第一信号。因此，本发明能够按照声源的特征提高编码效率。

其次，在用于处理信号的装置及其方法中，按照信号的特征将对应于下混信号的部分频率区域的信号用作用于带宽扩展的扩展基础信号。因此，本发明能够重建具有各种带宽的下混信号的高频区域。

附图说明

该伴随的附图被包括以提供对本发明进一步的理解，并且被结合进和构成本说明书的一部分，其图示本发明的实施例，并且与该说明书一起起到解释本发明原理的作用。

在附图中：

图1是按照本发明的一个实施例用于编码信号的装置的示意图；

图2是按照本发明的一个实施例的带宽扩展编码单元的示意图；

图3是在图2中所示的带宽扩展编码单元中用于编码信号的方法的流程图；

图4是按照本发明另一个实施例在图1中所示的信号编码装置的部分示意图；

图5是在图2中所示的信号编码装置中用于编码信号的方法的流程图；

图6是按照本发明的另一个实施例用于解码信号的装置的示意图；

图7是按照本发明另一个实施例在第一编码方案解码单元和第一信号修正单元中用于信号流的示意图；

图8是按照图7用于信号解码方法的流程图；

图9A至9G是按照本发明另一个实施例用于处理修改的信号的方法的示意图；

图10A和图10B是在应用在图9中示出的信号处理方法前后测量存在或者不存在预回声出现的图形；

图11是按照本发明的另一个实施例的带宽扩展信号解码单元的示意图；

图12是在图11中所示的带宽扩展信号解码单元中用于信号解码方法的流程图；

图13A至13D是按照本发明另一个实施例用于产生带宽扩展信号的方法的示意图；

图14A至14D是按照本发明再一实施例用于产生多信道信号的方法的示意图；和

图15是按照本发明又一实施例用于产生多信道信号的方法的示意图。

具体实施方式

本发明的附加的特点和优点将在随后的描述中阐述，并且从该描述中在某种程度上将是清晰可见的，或者可以通过本发明的实践习得。通过尤其在著述的说明书及其权利要求以及所附的附图中指出的结构，可以实现和获得本发明的目的和其他的优点。

为了实现这些和其他的优点，以及按照本发明的目的，如在此处实施和广泛地描述的，按照本发明的处理信号的方法，包括：接收从由第一信号和第二信号组成的组中选择的至少一个，获得模式信息和指示第一信号是否被修改的修改标记信息，如果按照模式信息确定为音频编码方案，则通过音频编码方案解码第一信号，如果基于修改标记信息第一信号被修改，则通过将修改重建信息应用到第一信号来重建第一信号，基于扩展信息确定对应于第一信号的部分区域的扩展基础信号，以及使用扩展基础信号和扩展信息产生具有通过重建高频区域信号扩展的带宽的扩展下混信号。

按照本发明，音频编码方案可以包括在频域中基于时频变换的编码方案，以及语音编码方案是基于线性预测编码方案的编码方案。

按照本发明，音频编码方案可以包括将第一信号重建到时域，并且将该修改重建信息应用到第一信号。

按照本发明，修改标记信息可以指示第一信号在时域是否被修改。

为了进一步实现这些和其他的优点，以及按照本发明的目的，一种处理信号的方法，包括：接收扩展信息和从由音频编码方案解码的第一信号和由语音编码方案解码的第二信号组成的组中选择的至少一个下混信号，确定对应于下混信号的部分区域的扩展基础信号，以及使用扩展基础信号和扩展信息产生具有通过重建高频区域信号扩展的带宽的扩展下混信号。

按照本发明，高频区域信号的带宽可以不等于扩展基础信号的带宽。

按照本发明，扩展信息可以包括从由应用到下混信号的滤波器的范围扩展基础信号的开始频率和扩展基础信号的结束频率组成的组中选择的至少一个。

按照本发明，该扩展基础信号可以包括对应于下混信号的部分频率区域的信号。

按照本发明，使用扩展信息确定扩展基础区域可以基于带宽扩展标记信息来执行，所述带宽扩展标记信息指示是否使用扩展信息重建下混信号的高频区域信号。

为了进一步实现这些和其他的优点，以及按照本发明的目的，一种用于处理信号的装置，包括：信号接收单元，接收扩展信息和从由音频编码方案解码的第一信号和由语音编码方案解码的第二信号组成的组中选择的至少一个下混信号；扩展基础区域确定单元，确定在下混信号中的扩展基础信号；以及高频区域信号重建单元，使用扩展基础信号和扩展信息产生具有通过重建高频区域信号扩展的带宽的扩展下混信号。

应该明白，上文的概述和下面的详细说明是示范性和说明性的，并且意欲提供权利要求所述的对本发明的进一步的说明。

现在将详细地参考本发明的优选实施例，在伴随的附图中图示其例子。首先，在本说明书和权利要求书中使用的术语或者用词不被解释为局限于常规的或者字典含义，并且应该被解释为基于发明人能够恰当地定义该术语的概念以最好的方式描述发明人的发明的原则，匹配本发明的技术思想的含义和概念。在本公开中公开的实施例和在伴随的附图中所示的结构仅是一个优选实施例，并且不表示本发明的所有技术思想。因此，应该理解，本发明覆盖对本发明的修改和变化，只要这些修改和变化落入在提交本申请的时间点上所附的权利要求书及其等效的范围之内。

首先，应该理解，在本发明中，概念“编码”包括编码和解码两者。

其次，在本公开中，“信息”是通常包括值、参数、系数、要素等的术语，并且有时可以将其含义理解为不同的，本发明不限于此。在本公开中将立体声信号作为信号的例子，本发明的例子不限于此。例如，在本公开中的信号可以包括具有至少三个或更多的信道的多信道信号。

在本公开中，第一信号指示由第一编码方案编码的信号，并且第二信号指示由第二编码方案编码的信号。第一信号可以包括音频信号，并且第二信号可以包括语音信号，本发明不限于此。另外，在以下的说明中描述的第一编码方案用于具有音频编码方案相同的含义，并且第二编码方案用于具有语音编码方案相同的含义。

图1示出按照本发明实施例的信号编码装置100。参考图1，信号编码装置100包括多信道编码单元110、带宽扩展信号编码单元120、信号修改单元130、第一编码方案编码单元140、第二编码方案编码单元150和多路复用单元160。

多信道编码单元110接收具有多个信道(在下文中缩写为多信道)的信号输入。多信道编码单元110通过对输入的多信道信号下混产生下混信号，并且也产生对应于多信道信号的空间信息。该空间信息可以包括信道水平差信息(CLD)、信道预测系数(CPC)、信道间相关信息(ICC)、下混增益信息(DMG)等。

带宽扩展信号编码单元120接收下混信号的输入，去除对应于高频的区域，并且然后仅编码对应于低频区域的信号。带宽扩展信号编码单元120产生对应于去除的高频区域的扩展信息，使其包括在空间信息中，并且然后传送包括在空间信息中的扩展信息。稍后将参考图2和图3描述这个过程的细节。

基于信号的特征确定是否通过第一编码方案或者第二编码方案编码输入信号。并且，产生确定编码方案的模式信息(在该图中未示出)。在这种情况下，第一编码方案可以对应于音频编码方案(音频信号方案)。音频编码方案可以包括使用MDCT(修改的离散余弦变换)的方案，本发明不限于此。第二编码方案可以对应于语音编码方案。语音编码方案可以遵循AMR-WB(自适应多速率宽带)标准，本发明不限于此。并且，该模式信息可以包括指示由第一编码方案执行编码的第一模式，和指示由第二编码方案执行编码的第二模式。

信号修改单元130接收确定要由第一编码方案编码的信号的输入，在按照第一编码方案编码信号之前，基于信号的特征(例如，信号大小、段长等)产生修改重建信息，并且然后应用该修改重建信息来修改相应的信号。稍后将参考图4和图5描述这个过程的细节。

第一编码方案编码单元140按照第一编码方案编码由信号修改单元130修改的信号。由第一编码方案编码单元140产生的信号称作第一信号。第一信号可以包括音频信号或者可以进一步包括少许语音信号。并且，第一编码方案编码单元140可以包括频域编码单元。

第二编码方案编码单元150基于该信号的特征按照第二编码方案编码信号。由第二编码方案编码单元150产生的信号称作第二信号。第二信号可以包括语音信号或者可以进一步包括少许音频信号。第二编码方案编码单元150可以进一步使用线性预测编码(LPC)方案。在输入信号在时间轴上具有高的冗余度情况下，可以通过用于从过去信号预测当前信号的线性预测来模拟。在这种情况下，可以通过采用线性预测编码方案提高编码效率。另外，第二编码方案编码单元150可以包括时域编码单元。

多路复用单元160使用包括编码的模式信息、修改重建信息和扩展信息的空间信息产生比特流来传送第一信号和第二信号。在这种情况下，可以将模式信息表示为标记信息。另外，进一步包括修改标记信息以指示信号是否已经被信号修改单元130修改。

图2示出按照本发明一个实施例的带宽扩展编码单元120，并且图3是在带宽扩展编码单元120中用于编码信号的方法的流程图。

参考图2，带宽扩展编码单元120包括高频区域去除单元121、扩展信息产生单元122和空间信息插入单元123。

高频区域去除单元121接收由多信道编码单元110产生的下混信号和空间信息。在这种情况下，下混信号可以包括在频域中的信号，并且可以包括低频信号和高频信号。高频区域去除单元121产生去除的下混信号和包括高频区域的开始和结束频率的重建信息，其中，去除的下混信号是通过从下混信号(在下文中，“下混信号”指示具有由高频区域去除单元121去除高频信号的低频信号的下混信号)的频率信号中去除高频区域的高频信号产生的。

能够基于输入信号的特征确定重建信息。高频信号的开始频率是对应于输入信号的整个带宽一半的频率。相反地，重建信息能够按照输入信号的特征将开始频率确定为等于或高于整个带宽的一半的频率，或者等于或者低于整个带宽的一半的频率。例如，如果将下混信号的整个带宽信号用于多信道编码的下混信号比通过使用带宽扩展技术去除高频区域的编码更有效的情形，重建信息能够使用开始频率指示位于带宽的端部的频率。能够使用信号大小、在编码的情况下使用的段长和信源类型的至少一个确定重建信息，本发明不限于此。

扩展信息产生单元122使用下混信号和空间信息产生确定扩展基础信号的扩展信息(其将用于解码)。扩展基础信号是用于重建在编码时被高频区域去除单元121去除的下混合信号的高频信号的下混合信号的频率信号。并且，扩展基础信号可以包括低频信号或者低频信号的部分信号。

扩展信息可以匹配由高频区域去除单元121剩余的下混信号的信息，本发明不限于此。例如，扩展信息可以包括对应于下混信号的部分信号的信息。在扩展信息是对应于下混信号的部分信号的信息的情况下，扩展信息可以包括扩展基础信号的开始频率和扩展基础信号的结束频率。并且，扩展信息能够进一步包括应用于下混信号的频率信号的滤波器范围。

空间信息插入单元123产生空间信息，所述空间信息以由高频区域去除单元121产生的重建信息和由扩展信息产生单元122产生的扩展信息被插入在由多信道编码单元110产生的空间信息中的方式配置。

参考图3，首先，从输入信号中产生下混信号和空间信息[S310]。去除下混信号的高频区域，并且产生重建[S320]。如在先前的描述中提及的，该重建信息可以使用信号大小、在编码的情况下使用的段长和声源类型的至少一个确定。并且，该重建信息指示去除的信号的开始和结束频率。

随后，基于输入信号的特征使用下混信号和空间信息产生用于确定供解码使用的扩展基础信号的扩展信息[S330]。扩展信息可以是对应于下混信号的部分信号的信息。扩展信息可以包括扩展基础信号的开始频率和扩展基础信号的结束频率，并且能够进一步包括应用于下混信号的频率信号的滤波器范围。并且，能够将重建信息和扩展信息插入在空间信息中[S340]。

按照本发明一个实施例的信号编码装置100可变地确定被带宽扩展编码单元120去除的下混信号的高频区域信号，从而能够按照输入信号的特征更有效地执行编码。按照本发明一个实施例的信号编码装置100产生和传送扩展信息，从而能够可变地使用低频信号以重建高频区域信号。

图4是按照本发明另一个实施例在图1中所示的信号编码装置的部分示意图，和图5是按照本发明另一个实施例用于编码信号的方法的流程图。

参考图4，按照指示输入信号的编码方案的模式信息，确定是否通过第一编码方案或者第二编码方案编码输入信号。如果确定第二编码方案，则第二编码方案编码单元420与信号编码装置100的第二编码方案编码单元150相同。其细节将省略。

如果按照模式信息输入信号被确定是由第一编码方案编码，则信号修改单元410基于输入信号的特征修改该信号。该特征可以包括信号的大小、在编码时分段的段长等。例如，由于由第一编码方案编码单元使用的MDCT的变换单元的大小与用于语音信号编码的分段大小不同，所以可以显著地降低在编码时的效率。如果是这样，通过修改段的大小或者由第一编码方案编码单元430应用的窗口的大小，信号修改单元410能够提高第一编码方案编码单元430的编码效率。为了修改段的大小或者应用的窗口的大小，能够调整在时域中的时间单位间隔。在这种情况下，能够产生用于产生修改信号所需的信息作为修改重建信息。另外，信号修改单元410能够产生指示信号是否被修改的修改标记信息。

如果确定第一编码方案，则第一编码方案编码单元430与信号编码装置100的第一信号编码方案编码单元140相同，并且多路复用单元440与信号编码装置的多路复用单元160相同。因此，其细节在以下的描述中省略。

参考图5，基于输入信号的特征确定模式。然后产生指示所确定的模式的模式信息[S510]。在这种情况下，该模式信息可以指示遵循第一编码方案的第一模式，或者遵循第二编码方案的第二模式。随后，确定模式信息是否指示第一模式[S520]。

如果模式信息指示第一模式，则基于输入信号的特征确定是否修改输入信号[S530]。如在先前的描述中提及的，为了确定是否修改，能够考虑输入信号的大小、用于编码分段的段长等。例如，如果由第一编码方案编码单元使用的窗口的大小与用于输入信号编码的段的大小不同或者产生预回声，则该输入信号被修改，并然后由第一编码方案编码。因此，解决了预回声，或者能够更加有效地编码输入信号。

如果输入信号的修改被确定，则在输入信号由第一编码方案编码之前，通过应用修改重建信息修改该信号。然后能够产生指示该信号是否被修改的修改标记信息[S540]。在这种情况下，该修改重建信息可以通过第一编码方案调整应用到编码中的窗口的长度。修改重建信息可以应用到在时域中。修改重建信息可以是用于调整输入信号的大小的增益值。在这种情况下，可以基于线性预测域系数(LPC)确定该增益值。

通过将修改重建信息应用到其中而修改的信号由第一编码方案编码[S550]。如在先前的描述中提及的，由第一编码方案编码的信号可以是第一信号。并且，第一信号可以包括音频信号或者可以进一步包括少许音频信号。

同时，在第一模式确定步骤S520中没有确定为第一模式的信号不经过修改信号的步骤，而是由第二编码方案编码[S535]。编码的信号可以是第二信号。并且，第二信号可以包括语音信号或者可以进一步包括少许语音信号。

图6示出用于解码信号的装置600。参考图6，信号解码装置600包括接收单元610、信息获得单元620、第一编码方案解码单元630、第一信号修正单元640、第二编码方案解码单元650、带宽扩展解码单元660和多信道解码单元670。

接收单元610能够接收由信号编码装置100编码的所有信号。接收单元610能够接收第一和第二信号的至少一个。接收单元610能够进一步接收模式信息、修改标记信息、扩展信息、下混信号和空间信息的至少一个。

信息获得单元620能够从接收单元610获得用于确定编码方案的模式信息、指示第一信号是否被修改的修改标记信息和扩展信息。

第一编码方案解码单元630通过第一编码方案解码信号。第一编码方案解码单元630能够通过使用修改重建信息修改信号来解码信号。由第一编码方案解码单元630解码的信号可以是第一信号。在这种情况下，第一信号能够包括音频信号或者可以进一步包括少许语音信号。第一编码方案解码单元630是音频编码方案解码单元，并且能够包括频域解码单元。并且，第一编码方案解码单元630能够使用MDCT。

只有在编码时基于修改标记信息修改第一信号时，第一信号修改单元640才修改第一信号。第一信号修改单元640能够使用修改重建信息以应用于第一信号。稍后将参考图7和图8解释此过程的细节。

第二编码方案解码单元650通过第二编码方案解码信号。由第二编码方案解码单元650解码的信号可以是第二信号。在这种情况下，第二信号可以包括语音信号或者可以进一步包括少许音频信号。第二编码方案解码单元650可以是语音编码方案解码单元。第二编码方案解码单元650可以包括时域解码单元，其能够进一步使用线性预测编码(LPC)方案。

带宽扩展解码单元660接收由第一编码方案解码单元630解码的信号的至少一个下混信号，和由第二编码方案解码单元650解码的信号，并且然后能够重建对应于在编码时去除的高频区域的信号。稍后将参考图11至13解释此过程的细节。

多信道解码单元670接收具有重建的高频区域的下混信号和空间信息，并且然后通过将空间信息应用于下混信号解码具有多信道的信号。

图7是按照本发明另一个实施例在第一编码方案解码单元和第一信号修正单元中用于信号流程的示意图，和图8是按照图7用于信号解码方法的流程图。

首先，参考图7，将模式信息和修改标记信息输入到第一编码方案解码单元730。修改标记信息指示第一信号在编码时是否被修改。尤其是，修改标记信息指示第一信号是否在时域或者频域被修改。如果基于修改标记信息确定第一信号没有被修改，则第一信号由第一编码方案解码单元730按照第一编码方案解码，并且然后输出无需输入到第一信号修改单元740。如在先前的描述中提及的，第一编码方案解码单元730按照音频编码方案解码。

如果基于修改标记信息确定第一信号被修改，则输入的第一信号在产生修改重建信息的同时由第一编码方案解码。在该修改重建信息从编码器传送的情况下，能够从比特流中提取修改重建信息。相反地，如果未从编码器传送修改重建信息，则有可能基于第一信号的特征由第一编码方案解码单元730产生修改重建信息。可以为第一信号提供修改重建信息以在按照第一编码方案编码时在时域中调整时间单位间隔。可以提供修改重建信息以调整应用到第一信号的窗口的长度。修改重建信息可以是在时域中应用的信息。另外，修改重建信息可以是用于调整输入信号大小的增益值。在这种情况下，可以基于线性预测域系数(LPC)确定该增益值。

第一信号修改单元740接收修改重建信息和第一信号，并且然后能够在时域中通过重建第一信号的修改的时间单位间隔解码原始信号。

参考图8，首先，获得模式信息和修改标记信息[S810]。如果该模式信息指示第一模式，则通过第一编码方案解码第一信号[S820]。随后，获得指示第一信号是否被修改的修改标记信息[S830]。如果该修改标记信息被设置为1[在步骤S830中，“是”]，则第一信号通过应用修改重建信息被修改[S840]。如在先前的描述中提及的，修改重建信息可以是用于在第一信号的时域中调整时间单位间隔的值，用于调整第一信号的大小的增益值，或者用于调整应用于第一信号的窗口长度的值。

相反地，如果修改标记信息未被设置为1[在步骤S830中，“否”]，则第一信号可以原样输出无需修正[S840]。

因此，在按照本发明的信号解码装置和方法中，当编码由第一编码方案解码的第一信号时，如果在时域中的时间单位间隔被修改，则该修改的第一信号可以被重建为在使用修改重建信息修改之前的信号。因此，可以按照信号的特征有效地执行解码。

同时，如果第一信号由第一编码方案编码单元使用具有比该信号的长度更长的窗口以在转换间隔中变换，则能够在频域中通过位分配控制噪声。另一方面，由于在时域中噪声均匀分布在窗口内，如果具有低能级的信号位于前端位置，则噪声比信号相对高，由此产生用户听到该噪声的预回声效果。

因此，按照本发明的另一个实施例，提出了类似相关领域的频域，在时域中调整噪声(噪声整形)的方法以解决该预回声问题。

图9示出按照本发明另一个实施例处理第一信号的方法。图9A至9D示出按照本发明另一个实施例编码第一信号的方法。图9E至9G示出对应于编码方法的解码方法。

在图9A中，输入信号x(t)被分成用于在时域中处理的信号单元X。参考图9A，可以将输入信号x(t)分割为四个子块。对应于子块的信号可以分别地包括分段信号X0、X1、X2和X3。参考图9B，能够确定在时域中用于调整子块的每个分段信号大小的修改重建信息W(w0，w1，w2，w3)。该修改重建信息可以是每分段信号确定的时域中的增益值。在这种情况下，该增益值可以是实际上应用于该分段信号，或者以与应用于分段信号的值相反形式配置的值。如果应用于分段信号的增益值变得越大，则使用更多的位执行量化。因此，可以产生较小的量化噪声。

参考图9C，能够通过将修改重建信息(w0，w1，w2，w3)应用于分段信号(X0，X1，X2，X3)产生修改信号X′。图9D示出通过使用转换为频域的修改信号，从使用相关领域的频域掩码特征执行感知编码中获得的量化噪声Qt。图9D图示的，该量化噪声可以是在整个时域中具有均匀分布的能量的信号。另外，优选地，在频域中用于位分配的声学模型操作使用分段信号X代替修改信号X′。

在传送给解码器侧的第一信号已经在频域中重建之后，如果重建的信号是倒置的，则能够获得将量化噪声Qt包括在调整信号X′[在图中未示出]中的传送信号。

图9E示出应用于传送信号的修改重建信息V。该修改重建信息V可以是与应用于块信号的增益值倒置的值(1/w0，1/w1，1/w2，1/w3)。

图9F示出从将修改重建信息V应用于传送信号获得的重建信号Y。重建信号V可以是在编码器侧中具有与修改信号X′相同形状的信号。但是，当调整按照修改重建信息编码的量化噪声Qt时，如图9G所示，能够获得在时域调整的调整量化噪声Qr。

因此，按照本发明的另一个实施例，确定应用于在时域中信号的修改重建信息，并且然后可以使用该修改重建信息确定每个块的临时的位分配信息。另外，通过在具有很小信号能级的区域中降低量化噪声的能级，能够防止预回声效果。

图10A和图10B是在应用图9A至9G中示出的信号处理方法前后测量预回声出现的图形。

参考图10A，由于在常规的信号处理器中在时域中噪声均匀分布在整个频带上，如果在信号的前面部分存在具有很小能级的信号，则出现预回声效果使得用户能够听到前面部分的噪声。

在图10B中示出，如果在时域中使用修改重建信息调整量化噪声，则在存在具有很小能级的信号的区域中，量化噪声的能级被调整去降低。因此，可以解决预回声效果的问题。

图11是按照本发明另一个实施例的带宽扩展信号解码单元的示意图。

参考图11，带宽扩展信号解码单元110包括信号接收单元1110、扩展基础区域确定单元1120、高频区域重建单元1130和带宽扩展单元1140。

信号接收单元1110接收由第一编码方案解码的第一信号和由第二编码方案解码的第二信号的至少一个下混信号和扩展信息。输入给信号接收单元1110的下混信号包括以高频区域由编码器侧去除的方式由原始信号的流频率区域的信号配置的信号。

扩展基础区域确定单元1120能够基于由信号接收单元1110接收的扩展信息确定下混信号的扩展基础信号。在这种情况下，该下混信号可以是出现在频域中的信号，并且该扩展基础信号可以是在频域中位于下混信号的部分频率区域中的信号。扩展信息用于确定该扩展基础信号，并且可以包括扩展基础信号的开始和结束频率，或者用于滤除下混信号的部分的滤波器的范围。

高频区域重建单元1130从信号接收单元1110接收下混信号和扩展信息，以及从扩展基础区域确定单元1120接收扩展基础信号。该扩展基础信号能够使用扩展信息重建由编码器侧去除的下混信号的高频区域信号。在这种情况下，能够进一步使用接收的重建信息。高频区域信号可以是不包括在下混信号中，而是包括在原始信号中的信号。当重建高频区域信号时，能够产生带宽被扩展的扩展下混信号。

该高频区域信号可以不是下混信号的整数倍数。并且，高频区域信号的带宽可以不与扩展基础信号的带宽相同。

在按照本发明一个实施例的信号处理装置和方法中，不使用具有由编码器侧去除的高频区域的整个下混信号，而是对应于下混信号的部分频率区域的信号作为扩展基础信号，虽然重建的高频区域不是下混信号的整数倍数，但其能够使用带宽扩展技术。

高频区域重建单元1130可以进一步包括时间扩展的下混信号产生单元和频率信号扩展单元。该时间扩展的下混信号产生单元能够通过将扩展信息应用于扩展基础信号将下混信号扩展到时域。并且，该频率信号扩展单元能够通过递减时间扩展的下混信号的采样数目(抽取)在下混信号的频域中扩展信号。

因此，按照本发明另一个实施例的带宽扩展解码单元1100进一步包括时间扩展的下混信号产生单元和频率信号产生单元，其能够按照修改重建信息调整带宽扩展的范围。

如果高频区域重建单元1130不包括低频区域信号，而是包括重建的高频区域信号，则带宽扩展单元1140产生扩展下混信号，其中带宽被以带宽扩展单元1140将下混信号和高频区域信号合成在一起的方式扩展。在这种情况下，该高频区域信号可能不对应于下混信号的整数倍数。因此，按照本发明一个实施例的带宽扩展技术可用于上采样为不在倍数关系中的信号。

图12是按照本发明另一个实施例在带宽扩展信号解码单元中用于信号解码方法的流程图。

参考图12，接收下混信号和扩展信息[S1210]。在这种情况下，下混信号可以是在频域中的信号，或者仅包括低频区域信号的信号，高频区域信号从由编码器侧产生的下混信号中去除。并且，扩展信息可以包括应用于下混信号的滤波器范围、扩展基础信号的开始频率和扩展基础信号的结束频率的至少一个。

随后，使用下混信号和扩展信息确定扩展基础信号[S1220]。在这种情况下，扩展基础信号可以是对应于下混信号的部分频率区域的信号。并且，扩展基础信号的确定可以基于指示是否使用扩展信息重建下混信号的高频区域信号的带宽扩展标记信息执行。尤其是，只有在带宽扩展标记信息被设置为1的时候，才能够确定扩展基础信号。

使用扩展基础信号和扩展信息重建高频区域信号[S1230]。在这种情况下，该高频区域信号可以包括不包括在从编码器侧传送的下混信号中而是包括在输入给编码器的原始信号中的信号。如在先前的描述中提及的，由于扩展基础信号是不对应于整个下混信号，而是对应于下混信号的部分频率区域的信号，因此高频区域信号可以是不为下混信号整数倍数的信号。

随后，通过将下混信号和重建的高频区域信号合成在一起，产生具有扩展带宽的扩展下混信号[S1240]。

如果该扩展基础信号不是基于带宽扩展标记信息确定的，即，如果带宽扩展标记信息被设置为0，则使用下混信号和重建信息产生高频区域信号[S1245]。并且，扩展下混信号是通过将下混信号和高频区域信号组合在一起产生的[S1240]。在这种情况下，扩展下混信号可以是具有总计达到下混信号整数倍数带宽的信号，尤其是，下混信号的两倍。另外，可以在高频区域信号的重建同时地产生扩展下混信号，而不是分别地执行[S1240]。

图13A至13D是按照本发明另一个实施例用于产生带宽扩展信号的方法的示意图，其中“Fc”指示扩展基础信号的结束频率。图13A示出按照常规方法的带宽扩展处理方法。

参考图13A，在编码时，整个频带除以2，扩展基础信号(对应于整个频率的1/2的低频区域的信号)通过由第一或者第二编码方案编码来传送，并且对应于总计达到整个信号的1/2的频率区域的扩展信号通过使用扩展信息编码来传送。

在解码时，通过使用由第一或者第二编码方案解码的扩展基础信号和扩展信息以与编码相反的方式解码扩展信号来重建整个信号。

参考图13B，扩展基础信号通过选择对应于整个频带的1/4的信号编码。使用扩展基础信号将对应于整个频带的2/4至3/4区域的信号(扩展信号1)编码为扩展信息。并且，使用扩展基础信号将对应于整个频带的4/4区域的信号(再扩展信号)编码为扩展信息。

因此，在执行解码时，扩展基础信号通过第一或者第二编码方案解码，并且然后使用扩展基础信号和扩展信息重建扩展信号1。随后，使用扩展信息和扩展信号1，重建对应于下混信号的高频区域的再扩展信号。因此，在执行带宽扩展编码时仅使用对应于整个频率区域的1/4的信号作为扩展基础信号能够提高压缩比。

参考图13C，使用对应于整个频率区域的1/4的扩展基础信号将分别对应于2/4、3/4和4/4区域的扩展信号1、扩展信号2和扩展信号3编码为扩展信息。在解码时，使用扩展基础信号和扩展信息顺序地解码扩展信号1、扩展信号2和扩展信号3。

在按照本发明另一个实施例的带宽扩展方法中，如图13C所示，扩展基础信号、扩展信号1、扩展信号2和扩展信号3可以具有相同的带宽，本发明不限于此。例如，这些信号可以具有彼此不同的带宽。并且，能够通过设置扩展基础信号的比例因子以频率区域被修正很大或者很小的方式解码扩展信号1、扩展信号2和扩展信号3。

图13D示出按照本发明另一个实施例的信号解码方法。

参考图13D，作为扩展基础信号，其能够选择通过第一或者第二编码方案解码的信号的部分信号(Fb至Fc区域的一个)。因此，其能够重建高频区域，该高频区域不对应于使用扩展基础信号编码的下混信号的整数倍数。

图14A至14D是按照本发明再一个实施例用于产生多信道信号的方法的示意图。在这种情况下，通过带宽扩展获得的信号被定义为扩展信号、扩展信号1或者扩展信号2，并且通过经由多信道解码器等信道扩展获得的信号称作立体声信号。

参考图14A，扩展基础信号通过带宽扩展重建下混信号的高频区域信号[步骤1]。随后，通过信道扩展从重建的下混信号中解码立体声信号[步骤2]。

在图14B中图示，通过信道扩展从扩展基础信号中产生立体声信号[步骤1]。随后，通过基于立体声信号扩展带宽，重建整个频率区域的立体声信号[步骤2和步骤3]。这适合于在整个下混信号的低频区域中具有更多信息和声音图像的信号。

参考图14C，立体声信号以类似于以前的方法的方式通过信道扩展从扩展基础信号中产生[步骤1]。随后，为了通过扩展带宽重建整个频率区域的立体声信号，使用扩展基础信号解码扩展信号1和扩展信号2[步骤2和步骤3]。由于扩展基础信号是具有该信号核心特征的信号，优选地，从扩展基础信号中解码扩展信号2。尤其是，其适合于在立体声信号的左和右信道信号之间具有高度相关的信号的解码。例如，适合于语音信号的解码。

参考图14D，通过信道扩展从扩展基础信号中解码立体声信号[步骤1]。然后通过带宽扩展从扩展基础信号解码扩展信号1[步骤2]。随后，使用扩展基础信号、扩展信号1和立体声信号，重建扩展信号2[步骤3-1至3-3]。因此，能够编码更多的有机立体声信号。

图15是按照本发明另一个实施例用于产生多信道信号的方法的示意图。

参考图15，按照本发明产生多信道信号的方法包括使用基础信号重建单声信号、单声扩展信号、立体声信号和立体声扩展信号的方法。在这种情况下，基础信号可以包括残留信号。

本发明应用的解码/编码方法可以作为计算机可读的代码在程序记录介质中实现。并且，具有本发明数据结构的多媒体数据可以存储在计算机可读的记录介质中。计算机可读的记录介质包括各种存储设备，由计算机系统可读的数据存储在该存储设备中。计算机可读的介质例如包括ROM、RAM、CD-ROM、磁带、软性磁盘、光数据存储设备等，并且还包括载波型实施(例如，经由因特网的传输)。并且，由编码方法产生的比特流存储在计算机可读的记录介质中，或者可以经由有线/无线通信网络传送。

虽然在此处已经参考优选实施例描述和图示了本发明，但对于那些本领域技术人员来说显而易见，在不脱离本发明的精神和范围的情况下，可以在其中进行各种修改和变化。因此，本发明意欲覆盖落入所附的权利要求和其等效范围之内的本发明的改进和变化。

工业实用性

因此，本发明适用于信号的编码和解码。

Claims

1.一种处理音频信号的方法，包括：

接收第一信号和第二信号的至少一个；

获得模式信息和修改标记信息，所述模式信息用于确定编码方案，所述修改标记信息指示所述第一信号是否被修改；

如果所述模式信息指示音频编码方案，则通过所述音频编码方案解码所述第一信号；

如果所述修改标记信息指示所述第一信号被修改，则基于修改重建信息通过修改应用于所述第一信号的窗口的大小来重建所述第一信号；

基于扩展信息确定对应于所述第一信号的部分区域的扩展基础信号；和

使用所述扩展基础信号和所述扩展信息产生具有通过重建高频区域信号而扩展的带宽的扩展下混信号，

其中，通过在时域中扩展所述扩展基础信号以生成时间扩展的扩展基础信号并且通过抽取所述时间扩展的扩展基础信号来重建所述高频区域信号。

2.根据权利要求1的方法，其中，所述音频编码方案包括在频域中使用时间-频率变换的编码方案。

3.根据权利要求2的方法，其中，所述音频编码方案包括将所述第一信号重建到时域，并且其中将所述修改重建信息应用于所述第一信号。

4.根据权利要求1的方法，其中，所述修改标记信息指示第一信号在时域中是否被修改。

5.根据权利要求1的方法，其中，所述高频区域信号的带宽与所述扩展基础信号的带宽不相同。

6.根据权利要求1的方法，其中，所述扩展信息包括应用于所述下混信号的滤波器范围、所述扩展基础信号的开始频率和所述扩展基础信号的结束频率的至少一个。

7.根据权利要求1的方法，其中，所述修改重建信息包括所述第一信号的增益值调整水平。

8.根据权利要求7的方法，其中，基于线性预测域系数确定所述增益值。

9.一种用于处理音频信号的装置，包括：

接收单元，接收第一信号和第二信号的至少一个；

信息获得单元，获得用于确定编码方案的模式信息和指示所述第一信号是否被修改的修改标记信息；

音频编码方案解码单元，如果所述模式信息指示音频编码方案，则通过音频编码方案解码所述第一信号；

第一信号修改单元，如果所述修改标记信息指示所述第一信号被修改，则基于修改重建信息通过修改应用于所述第一信号的窗口的大小来修改所述第一信号；

扩展基础区域确定单元，基于扩展信息在所述下混信号中确定扩展基础信号；和

高频区域信号重建单元，使用所述扩展基础信号和所述扩展信息产生具有通过重建高频区域信号而扩展的带宽的扩展下混信号，

10.根据权利要求9的装置，其中，所述音频编码方案包括在频域中使用时间-频率变换的编码方案。

11.根据权利要求9的装置，其中，所述音频编码方案解码单元包括将所述第一信号重建到时域的时域重建单元。

12.根据权利要求11的装置，其中，所述第一信号修改单元将所述修改重建信息应用到从所述时域重建单元输入的所述第一信号。

13.根据权利要求9的装置，其中，所述扩展基础区域确定单元将在所述下混信号中位于部分频率区域中的信号确定为扩展基础信号。