CN101361275A - 处理音频信号的方法和装置 - Google Patents

处理音频信号的方法和装置 Download PDF

Info

Publication number
CN101361275A
CN101361275A CNA2007800014873A CN200780001487A CN101361275A CN 101361275 A CN101361275 A CN 101361275A CN A2007800014873 A CNA2007800014873 A CN A2007800014873A CN 200780001487 A CN200780001487 A CN 200780001487A CN 101361275 A CN101361275 A CN 101361275A
Authority
CN
China
Prior art keywords
signal
spread signal
decoding
information
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007800014873A
Other languages
English (en)
Other versions
CN101361275B (zh
Inventor
房熙锡
金东秀
林宰显
吴贤午
郑亮源
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020070013364A external-priority patent/KR20070087494A/ko
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Priority claimed from PCT/KR2007/000865 external-priority patent/WO2007097549A1/en
Publication of CN101361275A publication Critical patent/CN101361275A/zh
Application granted granted Critical
Publication of CN101361275B publication Critical patent/CN101361275B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

一种处理音频信号的方法,包括以下步骤:从接收的比特流中提取用于生成音频信号的辅助信号和包括在所述辅助信号中的扩展信号;检查所述比特流的级别;根据所述比特流的级别选择性地解码所述扩展信号;以及利用辅助信号生成音频信号。因此,在通过本发明处理音频信号的情形中,可减少对应的运算负荷以实现高效率处理并提高声音质量。

Description

处理音频信号的方法和装置
技术领域
本发明涉及处理音频信号的方法和装置。尽管本发明适用于范围宽泛的应用,但它特别适用于处理残差信号。
背景技术
一般而言,音频信号包括声道缩减混音信号和辅助数据信号。且辅助数据信号可包括空间信息信号和扩展信号。在这种情形中,“扩展信号”是指在通过对声道缩减混音信号进行声道扩展处理来生成多声道信号时使得信号能够接近原始信号而重构所需的附加信号。例如,扩展信号可包括残差信号。“残差信号”是指与原始信号和经译码的信号之间的差相对应的信号。在多声道音频译码时,残差信号可用于以下的情况。例如,残差信号可用于艺术声道缩减混音信号的补偿或解码时的特定声道补偿。且,残差信号还可用于这两种补偿。所以,能够利用残差信号将输入的音频信号重构成更接近原始信号的信号,以提高声音质量。
发明内容
技术问题
然而,如果解码器在扩展信号上无条件地进行解码,则尽管根据解码器的类型可提高声音质量,但复杂性上升且运算负荷增加。
此外,因为音频信号的头部信息一般是不可变的,所以头部信息仅被插入比特流一次。但是在头部信息仅被插入比特流一次的情形中,如果音频信号需要从随机时间点解码用于广播或VOD,则由于没有头部信息而不能解码数据帧信息。
技术方案
因此,本发明涉及一种基本上消除了一个或多个由于有关技术的局限和缺点引起的问题的处理音频信号的方法和装置。
本发明的一个目的是提供一种用于处理音频信号的方法和装置,藉之音频信号的处理效率通过跳过扩展信号的解码而提高。
本发明的另一个目的是提供一种用于处理音频信号的方法和装置,藉之扩展信号的解码利用该扩展信号的长度信息而被跳过。
本发明的另一个目的是提供一种用于处理音频信号的方法和装置,藉之用于广播的音频信号可从随机时间点再现。
本发明的又一个目的是提供一种用于处理音频信号的方法和装置,藉之音频信号根据级别信息来处理。
有益效果
本发明具有以下的效果或优点。
首先,在进行解码的情形中,本发明选择性地解码扩展信号以实现更有效率的解码。在对扩展信号进行解码的情形中,本发明能够提高音频信号的声音质量。在不对扩展信号进行解码的情形中,本发明可降低复杂度。此外,即使对扩展信号进行解码,本发明也能通过仅解码预定的低频部分来提高声音质量且同样减少运算负荷。另外,在将音频信号用于广播等的情形中,本发明能够以识别音频信号内存在还是不存在头部信息的方式,从随机时间点处理音频信号。
附图简述
包括于此以提供对本发明的进一步理解、并被结合在本申请中且构成其一部分的附图示出本发明的实施方式,其与说明书一起可用来解释本发明的原理。
附图中:
图1是根据本发明的一个实施例的音频信号编码装置和音频信号解码装置的框图;
图2是根据本发明的一个实施例的扩展信号解码单元90的示意性框图;
图3和图4是根据本发明的一个实施例的用于解释扩展信号长度信息的固定比特分配的图;
图5和图6是根据本发明的一个实施例的用于解释取决于长度类型的扩展信号长度信息的可变比特分配的图;
图7和图8是根据本发明的一个实施例用于解释取决于扩展信号真实长度的扩展信号长度信息的适应性比特分配的图;
图9是根据本发明的一个实施例用声道缩减混音信号、辅助信号和扩展信号配置音频信号的比特流结构的图;
图10是根据本发明的一个实施例用包括扩展信号在内的辅助信号和声道缩减混音信号配置音频信号的比特流结构的图;
图11是根据本发明的一个实施例用声道缩减混音信号或辅助信号的配置立音频信号的比特流结构的图;
图12是根据本发明的一个实施例用声道缩减混音信号和辅助信号配置音频信号的广播流结构的图;
图13是根据本发明的一个实施例在将音频信号用于广播等的情形中,按照指示头部是否被包括在辅助信号中的识别信息来使用扩展信号的长度信息处理扩展信号的方法的流程图;以及
图14是根据本发明的一个实施例按照比特流的级别使用扩展信号的长度信息选择性地解码扩展信号的方法的流程图。
本发明的最佳实施方式
本发明的其它特征和优点将在以下的描述中阐述,并且部分地将从描述中显而易见,或者可从本发明的实践中获知。本发明的目的和其它优点可由书面说明书及其权利要求书和附图中具体指出的结构来实现并获得。
为了实现这些和其它优点且根据本发明的目的,如具体表达并广泛描述的,一种根据本发明的处理音频信号的方法包括以下步骤:从接收的比特流中提取用于生成音频信号的辅助信号和包括在该辅助信号中的扩展信号;读取该扩展信号的长度信息;基于该长度信息跳过扩展信号的解码或不使用解码的结果;以及利用辅助信号生成音频信号。
为了进一步实现这些和其它优点且根据本发明的目的,一种处理音频信号的方法包括以下步骤:获取指示用于生成音频信号的辅助信号的位置和包括在该辅助信号中的扩展信号的位置的同步信息;基于该同步信息跳过扩展信号的解码或不使用解码的结果;以及利用该辅助信号生成音频信号。
为了进一步实现这些和其它优点且根据本发明的目的,一种处理音频信号的装置包括:信号提取单元,其从接收的比特流中提取用于生成音频信号的辅助信号和包括在该辅助信号中的扩展信号;扩展信号长度读取单元,其读取所述扩展信号的长度信息;选择性解码单元,其基于该长度信息跳过扩展信号的解码或不使用解码的结果;以及声道扩展混音单元,其利用辅助信号生成音频信号。
为了进一步实现这些和其它优点且根据本发明的目的,一种处理音频信号的装置包括:同步信息获取单元,其获取指示用于生成音频信号的辅助信号的位置和包括在该辅助信号中的扩展信号的位置的同步信息;选择性解码单元,其基于该同步信息跳过扩展信号的解码或不使用解码的结果;以及声道扩展混音单元,其利用该辅助信号生成音频信号。
应理解,以上的一般描述和以下的详细描述是示例性和说明性的,并且旨在提供对如权利要求所述的本发明的进一步解释。
本发明的实施方式
下面将详细参考本发明的较佳实施方式,其具体示例图示于附图中。
图1是根据本发明的一个实施例的音频信号编码装置和音频信号解码装置的的框图。
参考图1,编码装置包括声道缩减混音单元10、声道缩减混音信号编码单元20、辅助信号编码单元30、扩展信号编码单元40和多路复用单元50。
在多源音频信号X1、X2……Xn被输入到声道缩减混音单元10的情形中,声道缩减混音单元10通过对该多源信号进行声道缩减混音处理来生成声道缩减混音信号。声道缩减混音信号包括单声道信号、立体声信号和多源音频信号。“源”包括声道,且为了方便起见被描述为声道。在本发明的说明书中,解释是参考单声道或立体声声道缩减混音信号进行的。然而,本发明不限于单声道或立体声声道缩减混音信号。编码装置能够选择性地且直接地使用从外部提供的艺术声道缩减混音信号。在声道缩减混音过程中,可由多声道音频信号生成辅助信号,且还可生成对应于附加信息的扩展信号。在这种情形中,辅助信号可包括空间信息信号和扩展信号。所生成的声道缩减混音信号、辅助信号和扩展信号分别通过声道缩减混音信号编码单元20、辅助信号编码单元30和扩展信号编码单元40编码,然后传送到多路复用单元50。
在本发明中,“空间信息”是指编码装置将通过对多声道信号进行声道缩减混音处理所生成的声道缩减混音信号传输到解码装置时所必需、也是解码装置通过对声道缩减混音信号进行声道扩展混音生成多声道信号时所必需的信息。空间信息包括空间参数。空间参数包括指示声道之间能量差的CLD(声道电平差)、指示声道之间相关性的ICC(声道间相干性)、在由两声道生成三声道时使用的CPC(声道预测系数)等。而“扩展信号”是指在通过解码装置对声道缩减混音信号进行声道扩展混音来生成多声道信号时使信号能够重构得更接近原始信号所必需的附加信息。例如,附加信息包括残差信号、艺术声道缩减混音残差信号、艺术树状扩展信号等。在这种情形中,残差信号指示对应于原始信号和经编码的信号之间的差的信号。在以下的描述中,假设残差信号包括一般残差信号或用于艺术声道缩减混音信号补偿的艺术声道缩减混音残差信号。
在本发明中,声道缩减混音信号编码单元20或声道缩减混音信号解码单元70是指编码或解码不包括辅助信号的音频信号的编解码器。在本发明中,将声道缩减混音音频信号视为不包括辅助信号的音频信号的一个例子。并且,声道缩减混音信号编码单元20或声道缩减混音信号解码单元70可包括MP3、AC-3、DTS或AAC。如果对音频信号进行编解码功能,则声道缩减混音信号编码单元20或声道缩减混音信号解码单元70可包括未来开发的编解码器以及以前已经开发的编解码器。
多路复用单元50可通过多路复用声道缩减混音信号、辅助信号和扩展信号来生成比特流,然后将所生成的比特流传输到解码装置。在这种情形中,声道缩减混音信号和辅助信号两者都可以以比特流格式传输到解码装置。或者,辅助信号和声道缩减混音信号可分别以独立比特流格式传输到解码装置。将在图9至11中解释比特流的细节。
在因为音频信号从随机时间点开始被解码而不是像用于广播的比特流一样从开始被解码,故而不能使用先前传输的头部信息的情形中,就能够使用插入于音频信号中的另一个头部信息来解码音频信号。在传输音频信号期间丢失头部信息的情形中,解码应从接收信号的任意时间点开始。所以,头部信息可被插入音频信号至少一次。如果头部信息仅在音频信号的前部存在一次,则对于在随机时间点接收音频信号的情形,由于缺少头部信息而不能执行解码。在这种情形中,可根据预定格式(例如,时间间隔、空间间隔等)引入头部信息。可插入指示比特流中是否存在头部信息的识别信息。且,音频信号可根据识别信息选择性地包括头部。例如,辅助信号可根据头部识别信息选择性地引入头部。将在图9至12中解释比特流结构的细节。
解码装置包括多路分解单元60、声道缩减混音信号解码单元70、辅助信号解码单元80、扩展信号解码单元90以及声道扩展混音单元100。
多路分解单元60接收比特流,然后从所接收的比特流中分离出经编码的声道缩减混音信号、经编码的辅助信号以及经编码的扩展信号。声道缩减混音信号解码单元70对经编码的声道缩减混音信号进行解码。且辅助信号解码单元80对经编码的辅助信号进行解码。
同时,扩展信号可包括在辅助信号中。需要高效率地解码扩展信号,以便高效率地生成多声道音频信号。所以,扩展信号解码单元90能够选择性地解码经编码的扩展信号。具体地,经编码的扩展信号可以被解码,或者经编码的扩展信号的解码可以被跳过。有时,如果扩展信号的解码处理被跳过,则经编码的信号可以被重构得更接近原始信号,且译码效率得以提高。
例如,如果解码装置的级别(level)低于比特流,则解码装置不能解码所接收的扩展信号。所以,扩展信号的解码可以被跳过。即使因为解码装置的级别高于比特流,扩展信号的解码是可用的,扩展信号的解码也能通过从音频信号获取的另一个信息而被跳过。在这种情形中,例如,这另一个信息可包括指示是否执行扩展信号的解码的信息。这将在后面参考图14详细解释。
例如,为了省略扩展信号的解码,可从比特流中读取扩展信号的长度信息,且可利用该长度信息跳过扩展信号的解码。或者,可利用指示扩展信号的位置的同步信息跳过扩展信号的解码。这将在后面参考图2详细解释。
可按各种方式定义扩展信号的长度信息。例如,可分配固定比特,或者可根据预定长度信息类型分配可变比特,或者在读取扩展信号的长度的同时可适应性地分配适合于真实扩展信号的长度的比特。在图3和图4中解释固定比特分配的细节。在图5和图6中解释可变比特的细节。且在图7和图8中解释适应性比特分配的细节。
扩展信号的长度信息可位于辅助数据区内。在这种情形中,辅助数据区指示一个存在将声道缩减混音信号重构成原始信号所需的附加信息的区域。例如,可将空间信息信号或扩展信号作为辅助数据的一个例子。所以,扩展信号的长度信息可位于辅助信号或辅助信号的扩展区中。
具体地,扩展信号的长度信息位于辅助信号的头部扩展区、辅助信号的帧数据扩展区或辅助信号的头部扩展区和帧数据扩展区两个区中。这将在稍后参考图9至11详细解释。
图2是根据本发明的一个实施例的扩展信号解码单元90的示意性框图。
参考图2,扩展信号解码单元90包括扩展信号类型信息获取单元91、扩展信号长度读取单元92和选择性解码单元93。且,选择性解码单元93包括级别解码单元94、扩展信号信息获取单元95以及扩展信号信息跳过单元96。扩展信号解码单元90从多路分解单元60接收扩展信号的比特流,然后输出经解码的扩展信号。有时,扩展信号解码单元90可能不输出扩展信号,或可通过对扩展信号比特流完整地补零输出扩展信号。对于不输出扩展信号的情形,可使用跳过扩展信号的解码的方法。扩展信号类型获取单元91从比特流获取指示扩展信号的类型的信息。例如,指示扩展信号的类型的信息可包括残差信号、艺术声道缩减混音残差信号、艺术树状扩展信号等。在本发明中,残差信号是一般残差信号和用于补偿艺术声道缩减混音信号的艺术声道缩减混音残差信号的通用术语。残差信号可用于补偿多声道音频信号中的艺术声道缩减混音信号或解码时的特定声道补偿。任选地,还可使用这两种情形。如果扩展信号的类型由扩展信号类型信息确定,则扩展信号长度读取单元92读取由扩展信号的类型信息确定的扩展信号的长度。不管是否进行扩展信号的解码这都可实现。一旦读取了扩展信号的长度,选择性解码单元93就选择性地对扩展信号进行解码。这可由级别确定单元94确定。具体地,级别确定单元94通过将比特流的级别与解码装置的级别相比较来选择是否执行扩展信号的解码。例如,如果解码装置的级别等于或高于比特流的级别,则解码装置经由扩展信号信息获取单元95获取关于扩展信号的信息,然后解码该信息以输出扩展信号。所输出的扩展信号被传输至声道扩展混音单元100,以便在重构原始信号或生成音频信号时使用。然而,如果解码装置的级别低于比特流的级别,则可经由扩展信号跳过单元96跳过扩展信号的解码。在这种情形中,可基于由扩展信号长度读取单元92读取的长度信息来跳过扩展信号的解码。因此,在使用扩展信号的情形中,可实现更接近原始信号的重构,以提高声音质量。如果必要的话,可通过省略扩展信号的解码来减小解码装置的运算量。
作为在扩展信号信息跳过单元96中省略扩展信号的解码的方法的一个例子,在使用扩展信号的长度信息的情形中,扩展信号的比特或字节长度信息可插入数据中。且,解码可通过跳过与从长度信息获取的值一样多的扩展信号的比特字段而继续进行。将参考图3至8解释限定扩展信号的长度信息的方法。
作为省略扩展信号的解码的方法的另一个例子,可基于指示扩展信号的位置的同步信息跳过扩展信号的解码。例如,可在扩展信号结束的点插入具有预定比特的同步字。解码装置继续搜索残差信号的比特字段,直到找到扩展信号的同步字。一旦找到同步字,解码装置就停止搜索过程,然后继续进行解码。具体地,可跳过扩展信号的解码直到找到扩展信号的同步字。作为根据选择的进行解码的方法的另一个例子,在进行扩展信号的解码的情形中,可在对扩展信号做语法分析后进行解码。当进行扩展信号的解码时,扩展信号的同步字可被读取但可能不可用。
图3和图4是根据本发明的一个实施例用于解释关于扩展信号的长度信息的固定比特分配的图。
扩展信号的长度信息可由比特或字节单位来定义。如果长度信息由字节单元确定,则表示扩展信号被分配了字节。图3示出以最简单的方式定义关于扩展信号的长度信息的方法。且,图4示意性地示出图3所示的方法。定义了用于指示扩展信号的长度信息的句法要素,并将预定比特分配给句法要素。例如,“bsResidualSignalLength”被定义为句法要素,且分配16比特作为固定比特。然而,该方法可能消耗相当大量的比特。所以,图5、图6、图7和图8中示出的方法解释如下。
图5和图6是根据本发明的一个实施例用于解释取决于长度类型可变地分配扩展信号的长度信息的比特的图。
图5示出为定义有多少比特要用于“bsResidualSignalLength”而多定义一个句法要素的方法,以进一步减少比特消耗。而图6示意性地示出图5所示的方法。例如,“bsResidualSignalLengthtype”被新定义为长度类型。如果“bsResidualSignalLengthtype”的值是0,则将4比特分配给“bsResidualSignalLength”。如果“bsResidualSignalLengthtype”的值是1,则将8比特分配给“bsResidualSignalLength”。如果“bsResidualSignalLengthtype”的值是2,则将12比特分配给“bsResidualSignalLength”。如果“bsResidualSignalLengthtype”的值是3,则将16比特分配给“bsResidualSignalLength”。在这种情形中,所分配的比特是示例性的。所以,可以分配与以上定义的比特不同的比特。为了比以上方法更多地减少比特消耗,提供了图7和图8中所示的方法。
图7和图8是根据本发明的一个实施例用于解释取决于扩展信号的真实长度的适应性地分配扩展信号的长度信息的比特的图。
如果输入扩展信号,则可读取扩展信号的长度信息值直到最初确定的值。如果长度信息值等于预定值,则可附加地读取直到另外确定的值。如果长度信息值等于另一个预定值,则可附加地读取直到另一个另外确定的值。在这种情形中,如果长度信息值不是该另一个预定值,则对应的值按原样输出作为长度信息值。因此,根据真实数据长度适应性地读取扩展信号的长度信息,由此可最大程度地减少比特消耗。下面解释图7和图8中所示的例子。
在图7中,以残差信号作为扩展信号的一个例子。如果输入残差信号,则4比特的残差信号长度被读取。如果长度信息值(bsResidualSignalLength)是24-1(=15),则再读取8比特作为bsResidualSignalLength1的值。如果长度信息值(bsResidualSignalLength)是(24-1)+(28-1)(=15+255),则再读取12比特作为bsResidualSignalLength2的值。以相同的方式,如果长度信息值(bsResidualSignalLength)是(24-1)+(28-1)+(212-1)(=15+255+4095),则再读取16比特作为bsResidualSignalLength3的值。
图8示意性地示出扩展信号的长度信息的适应性比特分配的另一个例子。
在图8中,如果输入扩展信号,则优先读取4比特。如果由读取长度信息得到的值小于4比特,则对应的值成为长度信息。然而,如果由读取长度信息得到的值大于4比特,则另外再读取8比特。如果另外读取的值小于8比特,总的读取长度信息值对应于12(=4+8)。然而,如果另外读取的值大于8比特,则再另外读取16比特。这将被详细解释如下。首先,如果输入长度信息,则读取4比特。真实长度信息值的范围是0~14。如果长度信息值变为24-1(=15),则另外再次读取扩展信号。在这种情形中,可附加地读取扩展信号直到28-2(=254)。然而,如果长度信息值对应于小于24-1(=15)的值,则读取的值0~(24-2)(=14)按原样输出。一旦长度信息值变为(24-1)+(28-1),则另外再次读取扩展信号。在这种情形中,可附加地读取扩展信号直到(216-1)。然而,如果长度信息值对应于小于216-1的值,则读取的值0~(216-1)(=14)按原样输出。在这种情形中,如上所述,分配的比特是用于解释的示例。所以也可分配与上述定义的比特不同的其它比特。
同时扩展信号的长度信息可以是扩展信号头部的长度信息或扩展信号帧数据的长度信息。所以,扩展信号的长度信息可位于头部区和/或帧数据区中。将参考图9至12解释用于此的比特流结构。
图9和图10示出本发明的实施例,其中示出了用声道缩减混音信号、辅助信号和扩展信号配置音频信号的比特流结构。
音频信号包括声道缩减混音信号和辅助信号。作为辅助信号的一个例子,可以举空间信息信号为例。声道缩减混音信号和辅助信号各自以帧为单位传输。辅助信号可包括头部信息和数据信息,或者可仅包括数据信息。因此,在配置一个音频信号的文件/通用流结构中,头部信息在前,随后是数据信息。例如,在用声道缩减混音信号和辅助信号配置音频信号的文件/通用流结构的情形中,声道缩减混音信号头部和辅助信号头部可作为头部信息存在于前部。并且,声道缩减混音信号数据和辅助信号数据可配置一个帧,作为前部之后的数据信息。在这种情形中,通过定义辅助数据的扩展区,可定位扩展信号。扩展信号可被包括在辅助信号中或可被用作独立信号。图9示出扩展信号被用作独立信号的情形,而图10示出扩展信号位于辅助信号的扩展区中的情形。所以,在存在扩展信号的情形中,在文件/通用流结构中,扩展信号的头部可作为头部信息存在于前部,声道缩减混音头部和空间信息头部也一样。在前部之后,作为数据信息,还可以包括扩展信号数据,以及声道缩减混音信号数据和辅助信号数据,用于配置一个帧。因为扩展信号可被选择性地解码,所以它可位于帧的最后部分,或可连续地存在于辅助信号之后。图3至8中解释的长度信息可存在于扩展信号的头部区中和/或扩展信号的数据区中。在这种情形中,存在于头部区(扩展信号头部)中的长度信息指示扩展信号头部的长度信息,而存在于数据区(扩展信号数据)中的长度信息指示扩展信号数据的长度信息。因此,从比特流读取存在于每一个区中的长度信息,且解码装置可基于长度信息跳过扩展信号的解码。
图11是根据本发明的一个实施例用声道缩减混音信号或辅助信号配置独立音频信号的比特流结构的图。
音频信号包括声道缩减混音信号和辅助信号。可采用空间信息信号作为辅助信号的一个例子。声道缩减混音信号和辅助信号可分别作为独立信号传输。在这种情形中,声道缩减混音信号具有这样的结构:作为头部信息的声道缩减混音信号头部(声道缩减混音信号头部
Figure A20078000148700141
)位于前部,且作为数据信息的声道缩减混音信号数据(声道缩减混音信号数据①、②、③……
Figure A20078000148700142
)在声道缩减混音信号头部之后。同样,辅助信号具有这样的结构:作为头部信息的辅助信号头部(辅助信号头部
Figure A20078000148700143
)位于前部,且作为数据信息的辅助信号数据(辅助信号数据①、②……
Figure A20078000148700144
)在辅助信号头部之后。因为扩展信号可被包括在辅助信号内,所以可提供一种扩展信号在辅助信号之后的结构。所以,扩展信号头部
Figure A20078000148700145
在辅助信号头部
Figure A20078000148700146
之后,扩展信号数据①在辅助信号数据①之后。同样,扩展信号数据②在辅助信号数据②之后。在这种情形中,扩展信号的长度信息可被包括在扩展信号头部
Figure A20078000148700147
、扩展信号数据①和/或扩展信号数据②……以及
Figure A20078000148700148
中的每一个之中。
同时,与文件/通用流结构不同,在因为是从随机时间点解码音频信号而不是从开始解码而不能使用先前传输头部信息的情形中,可以使用包括在音频信号中的另一个头部信息来解码。在使用用于广播等的音频信号或在传输音频信号期间丢失了头部信息的情形中,解码应当从接收信号的任何时刻开始。所以,可通过定义指示是否存在头部的识别信息来提高译码效率。以下将参考图12解释用于广播的流结构。
图12是根据本发明的一个实施例用声道缩减混音信号和辅助信号配置音频信号的广播流结构的图。
在广播流的情形中,如果头部信息仅在音频信号的前部存在一次,则在任意时间点接收音频信号的情形中,由于缺少头部信息而不能执行解码。所以,可将头部信息插入音频信号至少一次。在这种情形中,可根据预定格式(例如,时间间隔、空间间隔等)引入头部信息。具体地,可将头部信息插入到每一个帧中,以固定间隔周期性地插入每一个帧中,或以随机隔间非周期性地插入每一个帧中。或者,可根据固定时间间隔(例如,2秒)插入头部信息一次。
配置一个音频信号的广播流结构具有这样的结构:头部信息在数据信息之间至少被插入一次。例如,在配置一个音频信号的广播流结构的情形中,声道缩减混音信号在前,且辅助信号在该声道缩减混音信号之后。用于区分声道缩减混音信号和辅助信号的同步信息可位于辅助信号的前部。并且,可定位(locate)指示关于辅助信号的头部信息是否存在的识别信息。例如,如果头部识别信息是0,则下一个读取的帧仅具有数据帧而没有头部信息。如果头部识别信息是1,则下一个读取的帧具有头部信息和数据帧。这可适用于辅助信号或扩展信号。这些头部信息可与最初已被传输的头部信息相同或可以是可变的。在头部信息可变的情形中,新的头部信息被解码,且在新的头部信息之后传输的数据信息于是根据经解码的新的头部信息来解码。在头部识别信息是0的情形中,传输的帧仅具有数据帧而没有头部信息。在这种情形中,为了处理数据帧,可使用先前传输的头部信息。例如,如果在图12中头部识别信息是1,则可存在辅助信号头部①和扩展信号头部①。然而,如果由于头部识别信息被设定为0,下一个输入的帧不具有头部信息,则可使用先前传输的扩展信号头部①的信息来处理扩展信号数据③。
图13是根据本发明的一个实施例在将音频信号用于广播等的情形中,按照指示头部是否被包括在辅助信号中的识别信息来基于扩展信号的长度信息处理扩展信号的方法的流程图。
参考图13,从所接收的比特流中提取用于生成音频信号的辅助信号和包括在该辅助信号中的扩展信号(1301)。扩展信号可被包括在辅助信号中。提取指示头部是否被包括在辅助信号中的识别信息(1303)。例如,如果头部识别信息是1,则它指示辅助信号头部被包括在辅助信号中。如果头部识别信息是0,则它指示辅助信号头部没有被包括在辅助信号中。在扩展信号被包括在辅助信号中的情形中,如果头部识别信息是1,则它指示扩展信号头部被包括在扩展信号中。如果头部识别信息是0,则它指示扩展信号头部没有被包括在扩展信号中。根据头部识别信息判定头部是否被包括在辅助信号中(1305)。如果头部被包括在辅助信号中,则从头部提取长度信息(1307)。并且,可基于长度信息跳过扩展信号的解码(1309)。在这种情形中,头部在使每一个辅助信号和/或每一个扩展信号得到解释中发挥着作用。例如,头部信息可包括关于残差信号的信息、关于残差信号的长度的信息、指示残差信号的位置的同步信息、采样频率、帧长度、参数频带的号码、树状配置信息、量化模式信息、ICC(声道间电平差)、参数平滑信息、防止剪裁(clip-prevention)的增益信息、与信息相关联的QMF(正交镜像滤波器)等。此外,如果根据头部识别信息,头部没有被包括在辅助信号中,则可基于先前提取的关于头部的长度信息跳过扩展信号的解码(1311)。
图14是根据本发明的一个实施例基于扩展信号的长度信息选择性地解码扩展信号的方法的流程图。
轮廓文件(profile)意味着译码过程中的算法技术要素是标准化的。具体地,轮廓文件是解码比特流所必需的一组技术要素,并对应于一类子标准。级别(level)限定所支持的轮廓文件中规定的技术要素的范围。具体地,级别在限定解码装置的能力和比特流的复杂性方面发挥着作用。在本发明中,级别信息可包括轮廓文件和级别的定义。扩展信号的解码方法可根据比特流的级别信息和解码装置的级别信息而改变。例如,即使在传输的音频信号中存在扩展信号,作为判定级别信息的结果,可以执行或可以不执行扩展信号的解码。此外,尽管执行解码,可仅使用预定的低频部分。此外,在扩展信号的解码中可以跳过多达扩展信号的长度信息,以便不执行扩展信号的解码。或者,尽管扩展信号被完全读取,也不能执行解码。此外,读取一部分扩展信号,仅对读取部分进行解码,且不能对扩展信号的其余部分进行。或者,可完全地读取扩展信号,解码一部分扩展信号,而不解码其余扩展信号。
例如,参考图14,从所接收的比特流中提取用于生成音频信号的辅助信号和包括在该辅助信号中的扩展信号(1410)。并且,可提取关于扩展信号的信息。在这种情形中,关于扩展信号的信息可包括指示扩展信号的数据类型的扩展数据类型信息。例如,扩展数据类型信息包括残差译码数据、艺术声道缩减混音残差译码数据、艺术树状扩展数据等。所以,判定扩展信号的类型,并能从音频信号的扩展区读取扩展信号的长度信息(1420)。随后,判定比特流的级别。这可参考以下的信息来判定。例如,如果扩展信号的类型是残差译码数据,则比特流的级别信息可包括输出声道数、采样率、残差信号的带宽等。所以,如果以上解释的级别信息被输入,则它们与关于解码装置的级别信息进行比较以判定扩展信号是否将被解码(1430)。在这种情形中,解码装置的级别可预先设定。一般而言,解码装置的级别应等于或大于音频信号。这是因为,解码装置应当能够完整地解码传输的音频信号。然而,在对解码装置进行限制的情形中(例如,在解码装置的级别小于音频信号的情形中),解码有时是可能的。然而,相应的质量可能劣化。例如,如果解码装置的级别低于音频信号,则解码装置不能解码音频信号。然而,在某些情形中,音频信号可基于解码装置的级别而被解码。
在判定解码装置的级别低于比特流的级别的情形中,可基于扩展信号的长度信息跳过扩展信号的解码(1440)。另一方面,在解码装置的级别等于或高于比特流的级别的情形中,可执行扩展信号的解码(1460)。然而,尽管扩展信号的解码被执行,解码也可仅在扩展信号的预定低频部分上执行(1450)。例如,存在这样的情形:由于解码装置是低功率解码器,如果扩展信号被完全解码,效率将降级,或者,由于解码装置不能解码整个扩展信息,可使用扩展信号的预定低频部分。并且,仅在比特流的级别或解码装置的级别满足指定条件时,这是可能的。
工业实用性
因此,编码和解码信号的各种环境可能普遍存在,且可存在根据各种环境条件处理信号的各种方法。在本发明中,将处理音频信号的方法作为一个例子,这不会限制本发明的范围。在这种情形中,信号包括音频信号和/或视频信号。尽管已参考本发明的较佳实施例描述并说明了本发明,但本领域内技术人员可以理解,可对本发明作出各种修改和变化而不脱离本发明的精神或范围。因此,本发明旨在涵盖所附权利要求书及其等价技术方案的范围内的本发明的所有这些修改和变化。

Claims (9)

1.一种用于处理音频信号的方法,其包括以下步骤:
从接收的比特流中提取用于生成音频信号的辅助信号和包括在所述辅助信号中的扩展信号;
检查所述比特流的级别;
根据所述比特流的级别选择性地解码所述扩展信号;以及
利用所述辅助信号生成音频信号。
2.如权利要求1所述的方法,其特征在于,在检查所述比特流的级别的步骤中,使用所述音频信号的输出声道的数目、采样率、以及关于所述扩展信号的带宽的信息。
3.如权利要求1所述的方法,其特征在于,在所述解码步骤中,如果所述比特流的级别高于解码器的级别,则根据所述解码器的级别选择性地解码所述扩展信号。
4.如权利要求1至3中的任一项所述的方法,其特征在于,所述扩展信号是残差信号。
5.如权利要求1所述的方法,其特征在于,还包括读取所述扩展信号的长度信息的步骤,其中基于所述长度信息跳过关于所述扩展信号的所述扩展信号的解码,或不使用所述解码的结果。
6.如权利要求5所述的方法,其特征在于,根据所述扩展信号的长度向所述扩展信号的长度信息分配适应性比特。
7.如权利要求1所述的方法,其特征在于,在所述解码步骤中,根据解码器的级别解码所述扩展信号的预定的低频部分。
8.如权利要求1所述的方法,其特征在于,还包括获取指示所述扩展信号的位置的同步信息,其中利用所述同步信息跳过所述扩展信号的解码。
9.一种用于处理音频信号的装置,包括:
信号提取单元,其从接收的比特流中提取用于生成音频信号的辅助信号和包括在所述辅助信号中的扩展信号;
级别判定单元,其检查所述比特流的级别;
选择性解码单元,其根据所述比特流的级别选择性地解码所述扩展信号;以及
声道扩展混音单元,其利用所述辅助信号生成音频信号。
CN200780001487.3A 2006-02-23 2007-02-16 处理音频信号的方法和装置 Active CN101361275B (zh)

Applications Claiming Priority (10)

Application Number Priority Date Filing Date Title
US77577506P 2006-02-23 2006-02-23
US60/775,775 2006-02-23
US79190706P 2006-04-14 2006-04-14
US60/791,907 2006-04-14
US80382506P 2006-06-02 2006-06-02
US60/803,825 2006-06-02
KR1020070013364A KR20070087494A (ko) 2006-02-23 2007-02-08 멀티 채널 오디오 신호의 디코딩 방법 및 장치
KR10-2007-0013364 2007-02-08
KR1020070013364 2007-02-08
PCT/KR2007/000865 WO2007097549A1 (en) 2006-02-23 2007-02-16 Method and apparatus for processing an audio signal

Publications (2)

Publication Number Publication Date
CN101361275A true CN101361275A (zh) 2009-02-04
CN101361275B CN101361275B (zh) 2013-04-03

Family

ID=40332840

Family Applications (4)

Application Number Title Priority Date Filing Date
CN200780001487.3A Active CN101361275B (zh) 2006-02-23 2007-02-16 处理音频信号的方法和装置
CN200780001528.9A Active CN101361277B (zh) 2006-02-23 2007-02-16 处理音频信号的方法和装置
CN2007800014801A Active CN101361274B (zh) 2006-02-23 2007-02-16 处理音频信号的方法和装置
CN200780001517.0A Active CN101361276B (zh) 2006-02-23 2007-02-16 处理音频信号的方法和装置

Family Applications After (3)

Application Number Title Priority Date Filing Date
CN200780001528.9A Active CN101361277B (zh) 2006-02-23 2007-02-16 处理音频信号的方法和装置
CN2007800014801A Active CN101361274B (zh) 2006-02-23 2007-02-16 处理音频信号的方法和装置
CN200780001517.0A Active CN101361276B (zh) 2006-02-23 2007-02-16 处理音频信号的方法和装置

Country Status (1)

Country Link
CN (4) CN101361275B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108206976A (zh) * 2018-01-12 2018-06-26 合肥灵犀智能科技有限公司 选择性播放声音信号的方法和用户终端
CN110065651A (zh) * 2019-04-19 2019-07-30 中国航空无线电电子研究所 一种音频辅助检查操作方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210142393A (ko) * 2020-05-18 2021-11-25 엘지전자 주식회사 영상표시장치 및 그의 동작방법

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1511313A (zh) * 2001-11-14 2004-07-07 ���µ�����ҵ��ʽ���� 编码装置、解码装置及其系统

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5166685A (en) * 1990-09-04 1992-11-24 Motorola, Inc. Automatic selection of external multiplexer channels by an A/D converter integrated circuit
US5703584A (en) * 1994-08-22 1997-12-30 Adaptec, Inc. Analog data acquisition system
US5668924A (en) * 1995-01-18 1997-09-16 Olympus Optical Co. Ltd. Digital sound recording and reproduction device using a coding technique to compress data for reduction of memory requirements
JPH11282496A (ja) * 1998-03-30 1999-10-15 Matsushita Electric Ind Co Ltd 復号装置
US6973130B1 (en) * 2000-04-25 2005-12-06 Wee Susie J Compressed video signal including information for independently coded regions
EP1315148A1 (en) * 2001-11-17 2003-05-28 Deutsche Thomson-Brandt Gmbh Determination of the presence of ancillary data in an audio bitstream
JP4404180B2 (ja) * 2002-04-25 2010-01-27 ソニー株式会社 データ配信システム、データ処理装置及びデータ処理方法、並びにコンピュータ・プログラム
KR100773539B1 (ko) * 2004-07-14 2007-11-05 삼성전자주식회사 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1511313A (zh) * 2001-11-14 2004-07-07 ���µ�����ҵ��ʽ���� 编码装置、解码装置及其系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108206976A (zh) * 2018-01-12 2018-06-26 合肥灵犀智能科技有限公司 选择性播放声音信号的方法和用户终端
CN108206976B (zh) * 2018-01-12 2020-06-23 和君纵达数据科技有限公司 选择性播放声音信号的方法和用户终端
CN110065651A (zh) * 2019-04-19 2019-07-30 中国航空无线电电子研究所 一种音频辅助检查操作方法
CN110065651B (zh) * 2019-04-19 2022-05-06 中国航空无线电电子研究所 一种音频辅助检查操作方法

Also Published As

Publication number Publication date
CN101361277B (zh) 2013-07-31
CN101361274B (zh) 2012-07-18
CN101361275B (zh) 2013-04-03
CN101361276A (zh) 2009-02-04
CN101361276B (zh) 2015-02-18
CN101361277A (zh) 2009-02-04
CN101361274A (zh) 2009-02-04

Similar Documents

Publication Publication Date Title
EP1987595B1 (en) Method and apparatus for processing an audio signal
CN101253554B (zh) 解码音频信号的方法和装置
CN101361277B (zh) 处理音频信号的方法和装置
RU2404507C2 (ru) Способ и устройство для обработки звукового сигнала
WO2007097552A1 (en) Method and apparatus for processing an audio signal
CN101361114A (zh) 用于处理媒体信号的装置及其方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant