CN101317216A - 信号处理方法和装置 - Google Patents
信号处理方法和装置 Download PDFInfo
- Publication number
- CN101317216A CN101317216A CNA2006800449264A CN200680044926A CN101317216A CN 101317216 A CN101317216 A CN 101317216A CN A2006800449264 A CNA2006800449264 A CN A2006800449264A CN 200680044926 A CN200680044926 A CN 200680044926A CN 101317216 A CN101317216 A CN 101317216A
- Authority
- CN
- China
- Prior art keywords
- data
- coding
- information
- value
- entropy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
本发明公开了能够实现具有高传输效率的数据压缩和恢复的信号处理方法和装置。利用相关性来执行数据编码和熵编码,并使用分组来提高编码效率。根据本发明的信号处理方法,所述方法包括以下步骤:对从互联网协议网络上接收到的信号进行解封装,从已解封装的信号获取对应于多个数据的导频基准值和对应于所述导频基准值的导频差值,以及利用所述导频基准值和所述导频差值获取所述数据。
Description
技术领域
本发明涉及信号处理方法和装置,更具体地说,涉及能够实现具有高传输效率的信号压缩或恢复的编码方法和装置。
背景技术
至今为止,已经提出了与信号压缩和恢复有关的各种技术,并且这些技术通常应用于包括音频信号和视频信号的各种数据。在提高图像质量和声音质量以及增加压缩率的同时也发展了信号压缩和恢复技术。为了适应各种通信环境,一直在进行提高传输效率的努力。
通常,通过诸如缆线的专用装置从内容提供商向最终用户提供了包括音频信号、视频信号和附加信息的媒体内容。
近来,由于互联网的利用已经显著增加,并且对基于互联网协议(IP)的服务的要求也在提高,也在不断开展对提供基于IP的服务的工作。此外,由于互联网与电视的结合,数字融合技术也得到了迅速的发展。
然而,由于没有提出过对基于IP的服务中的数据进行处理的方法,在提供针对利用基于IP的网络对数据进行高效编码、对编码数据进行发送以及对发送数据进行解码的服务的过程中,会引起很多问题。
发明内容
技术问题
被构思以解决所述问题的本发明的一个目的在于提供一种能够优化信号传输效率的信号处理方法和装置。
被构思以解决所述问题的本发明的另一个目的在于提供一种用于高效地处理基于互联网协议(IP)的服务中的数据的方法和装置。
被构思以解决所述问题的本发明的另一个目的在于在基于IP的服务中通过网络向内容用户供应各种内容。
被构思以解决所述问题的本发明的另一目的在于提供一种用于高效地编码数据的方法和装置。
被构思以解决所述问题的本发明的另一目的在于提供一种能够最大化在音频恢复中使用的控制数据的传输效率的用于对数据进行编码和解码的方法和装置。
被构思以解决所述问题的本发明的另一目的在于提供一种包括编码数据的介质。
被构思以解决所述问题的本发明的另一目的在于提供一种用于高效传送编码数据的数据结构。
被构思以解决所述问题的本发明的另一目的在于提供一种包括所述解码装置的系统。
技术方案
为实现这些及其他优点,并且与本发明的目的一致,如所具体化的和宽泛描述的,提供一种信号处理方法,所述方法包括:对从互联网协议网络上接收到的信号进行解封装(decapsulating);从已解封装的信号获取对应于多个数据的导频基准值和对应于所述导频基准值的导频差值;以及利用所述导频基准值和所述导频差值获取所述数据。所述方法还可包括对所述导频基准值和所述导频差值中的至少一个进行解码。并且,所述数据即为参数,并且其中,所述方法还可包括利用所获取的参数重构音频信号。
在本发明的另一方面中,提供了一种信号处理装置,所述装置包括:对从互联网协议网络上接收到的信号进行解封装的管理器;从已解封装的信号获取对应于多个数据的导频基准值和对应于所述导频基准值的导频差值的值获取部;和利用所述导频基准值和所述导频差值来获取所述数据的数据获取部。
在本发明的另一方面中,提供了一种信号处理方法,所述方法包括:利用对应于多个数据的导频基准值和所述数据生成导频差值;和将所生成的导频差值进行封装并在互联网协议网络上进行传送。
在本发明的另一方面中,提供了一种信号处理装置,所述装置包括:利用对应于多个数据的导频基准值和所述数据生成导频差值的值生成部;和将所生成的导频差值进行封装并在互联网协议网络上进行传送的管理器。
附图说明
图1是解释根据本发明的互联网协议电视(IPTV)数据处理领域的图;
图2是根据本发明的数据处理装置中的编码装置的实施方式的框图;
图3是根据本发明的用于处理数据的数据包结构的实施方式的图;
图4是根据本发明的数据处理装置中的解码装置的实施方式的框图;
图5和图6是根据本发明的系统的框图;
图7和图8是解释根据本发明的PBC编码的图;
图9是解释根据本发明的DIFF编码的类型的图;
图10到12是应用了DIFF编码方案的示例的图;
图13是解释根据本发明的对至少三个编码方案中的一个进行选择时的关系的框图;
图14是解释根据现有技术的对至少三个编码方案中的一个进行选择时的关系的框图;
图15和图16分别是根据本发明的数据编码选择方案的流程图;
图17是解释根据本发明的内部分组的图;
图18是解释根据本发明的外部分组的图;
图19是解释根据本发明的多重分组的图;
图20和图21分别是解释根据本发明的其他实施方式的混合分组的图;
图22是根据本发明的一维和二维熵表的示例图;
图23是根据本发明的二维熵编码的两种方法的示例图;
图24是根据本发明的针对PBC编码结果的熵编码方案的图;
图25是根据本发明的针对DIFF编码结果的熵编码方案的图;
图26是解释根据本发明的选择熵表的方法的图;
图27是根据本发明的数据结构的层级图;
图28是根据本发明的一个实施方式的音频压缩和恢复装置的框图;
图29是根据本发明的一个实施方式的空间信息编码部的详细框图;以及
图30是根据本发明的一个实施方式的空间信息解码部的详细框图。
具体实施方式
现在详细参考本发明的优选实施方式,其示例用所述附图加以例示。
选择当前在全球使用的通用术语作为本发明中所使用的术语。并且,还有申请人针对特定情况而自主选择的术语,对于这些术语,将在对本发明的优选实施方式的说明中详细解释其具体含义。因此,本发明不应当从这些术语的字面上来理解,而应当根据这些术语的含义理解。
在本发明中,“编码”的含义包括编码过程和解码过程。然而,对于本领域技术人员显然的是,具体的编码过程仅适用于编码或解码过程,这将在后面的相应部分的描述中加以区别。并且,“编码”也可称为“编解码”。
本发明涉及到在网络上传送数据的服务。具体地说,基于互联网协议(IP)的服务是指利用互联网络提供的服务。例如,当互联网广播商在互联网络上提供服务时,服务用户通过电视等接收该互联网广播商提供的服务。例如,基于IP的服务包括互联网协议电视(此后称为“IPTV”)、ADSL TV、宽带广播和即时点播(iCOD)。
本发明将在基于IP的服务的IPTV的基础上进行描述,但不限于IPTV。本发明适用于所有的用于在网络上传送数据的基于IP的服务。IPTV与普通的缆线广播或卫星广播的类似之处在于提供了包括视频信号、音频信号和附加信息的媒体内容,但是与普通的缆线广播或卫星广播的不同之处在于IPTV具有双向性。
图1是解释根据本发明的互联网协议电视(IPTV)数据处理领域的图。
对于IPTV服务中的数据传送可能需要各个领域中的多个参与方之间的协作。例如,使用特定的IPTV基础设施来播送通常在广播或缆线网络上传播的直播电视等。此外,可以利用卫星或其他装置在内容提供商1100和服务提供商2之间传送诸如视频内容的数据。服务提供商2可以利用至少一个能够将IPTV内容传送到提供有移动设备和用于显示该IPTV内容的设备的家庭网络的传送网络。IPTV基础设施可以基于IP技术提供直播广播电视服务以及附加性能。
参考图1,IPTV领域可以包括四个领域,这四个领域包括内容提供商1、服务提供商2、网络提供商3和消费者4。然而,对于提供IPTV服务而言并不总是需要这四个领域,并且,如果需要的话,例如可以从内容提供商1通过网络提供商3向消费者4提供IPTV服务。
内容提供商1是具有内容资源或用于售卖内容的许可的实体。尽管提供给消费者的IPTV服务的始发源是服务提供商2,但用于权利管理和保护的直接逻辑信息流设置在内容提供商1和消费者4之间。内容提供商1用来向服务提供商2提供内容,并可以包括缆线提供商、无线电提供商、电信提供商、陆地广播提供商和卫星广播提供商。
服务提供商2可以收集来自至少一个内容提供商1的各种内容并将收集到的内容通过或者不通过网络提供商3提供给消费者4。例如,服务提供商2可以接收所述内容的有效载荷,将该有效载荷转换成适于IP环境并将该转换的有效载荷发送给消费者4。
作为将有效载荷转换成适于IP环境的例子,服务提供商2能够利用RTP报头、UDP报头和IP报头对所述有效载荷进行封装。当内容提供商1将内容通过网络提供商3提供给消费者4时,内容提供商1能够将有效载荷转换成适合IP环境并发送该转换的有效载荷。
服务提供商2可以是虚拟的提供商,因为服务提供商2在应用和内容信息流中可以是不必要的。
网络提供商3用来通过网络将服务提供商2连接到消费者4。例如,网络提供商3可以通过IP网络将服务提供商2连接到消费者4,或者不通过服务提供商2就将内容提供商1连接到消费者4。网络提供商3的传送系统可以包括利用了各种网络技术的接入网、核心或骨干网。
消费者4是通过网络提供商3接收包括来自服务提供商2或内容提供商1的内容的信号并消费IPTV服务的领域。当消费者1440通过IP网络接收到信号时,消费者4对接收到的信号进行解封装,并对解封装的信号进行解码以生成视频信号和音频信号,然后通过电视机显示视频信号和音频信号。消费者4可以是电视机、机顶盒、个人计算机(PC)或移动设备。
因为根据本发明的IPTV具有双向性,所以当消费者4的用户通过网络上的用户接口将关于期望内容的信息传送给服务提供商2和/或内容提供商1时,服务提供商2和/或内容提供商1可以检查用户期望的内容能否发送,并将该内容发送给消费者4。
图2是根据本发明的数据处理装置中的编码装置的实施方式的框图。
参考图2,编码装置包括:用于对内容的视频信号进行编码的视频编码器21,用于对内容的音频信号进行编码的音频编码器22,用于对所编码的音频信号、所编码的视频信号和/或诸如其他文本数据的附加信息进行复用的复用器23。编码装置还可包括用于接收来自复用器23的分包传输流并将其转换成适于网络环境的第一管理器24和第二管理器25。视频编码器21和音频编码器22可以使用各种编码方法。后面将参考图5等详细描述编码方法。
用于实时传送互联网广播多媒体内容的通信协议可以包括实时传输协议(RTP)和RTP控制协议(RTCP),RTP是用于实时发送/接收数据的传输层通信协议,而RTCP则是与RTP一起操作的控制通信协议。此时,RTP可以用作用户数据报协议(UDP)的上层通信协议。第一管理器24执行RTP封装以将RTP报头添加到从复用器23接收到的分包传输流的有效载荷,执行UDP封装以将UDP报头添加到该有效载荷,并将所封装的信号发送给第二管理器25。第二管理器25对从第一管理器24接收到的信号执行IP封装,以便利用IP网络发送媒体内容。即,由第二管理器25执行的IP封装是指将IP报头添加到包括有效载荷、RTP报头和UDP报头的信号上的步骤。或者,第一管理器24可以执行RTP封装,第二管理器25可以执行UDP封装和IP封装。
因为本发明的IPTV服务具有双向性,所以编码装置可以接收从用户发送的信号并发送用户期望的媒体内容。例如,第二管理器25可以接收从IP网络上的消费者发送的信号并对接收到的信号执行IP解封装,并且第一管理器24可以对该信号执行UDP解封装和RTP解封装,对用户期望的媒体内容执行封装并发送该封装的信号。或者,第二管理器25可以执行IP解封装和UDP解封装,第一管理器24可以执行RTP解封装。
第一管理器24和第二管理器25可以接收所述内容的至少一个有效载荷,并对所接收到的有效载荷执行封装,以使其适于网络环境。例如,如果第一管理器24是网关,而第二管理器25是IP封装部,则第一管理器24可以通过缆线、地面波或卫星接收所述有效载荷,并针对接收到的有效载荷执行RTP封装和UDP封装,而第二管理器25可以针对该有效载荷执行IP封装并将媒体数据发送给IP网络上的消费者。
将图2与图1相比较,内容提供商1可以包括视频编码器21、音频编码器22、复用器23、第一管理器24和第二管理器25。此时,服务提供商2可以是虚拟提供商。或者,内容提供商1可以包括视频编码器21、音频编码器22和复用器23,并且服务提供商2可以包括第一管理器24和第二管理器25。此时,服务提供商2不能是虚拟提供商。
图3是根据本发明的用于处理数据的数据包结构的实施方式的图。具体地说,尽管作为该数据包结构的一个例子将描述RTP数据包结构,但本发明适用于除RTP数据包以外的其他用于处理数据的数据包。
互联网广播可以利用诸如RTP或RTCP的实时传输协议以便实时传送媒体内容。RTP/RTCP是能够实时地在互联网络上可靠传送多媒体或广播内容的协议实例。RTP在UDP下执行并执行多重传输,但不包括传输控制功能、连接设置功能和频带保留功能。RTP能够通过单播或多播通道发送诸如交互式视频或音频的端对端实时数据。
参考图3(a),RTP数据包包括有效载荷、RTP报头、UDP报头和作为IP报头指示区的IP报头。
RTP报头包括:“Ver”字段,其为版本指示区;“pad”字段,其为指示是否执行了填充(padding)的区;“x”字段,其为扩展报头区;“cc”字段,其为参与源标识符(CSRC)的系数指示区;“M”字段,其为标记区;“PT”字段,其为有效载荷类型指示区;“序号”字段,其为数据包序号指示区;“时间戳”字段,其为数据包的有效时间指示区;“SSRC”字段,其为同步源标识符指示区;以及“CSRC”字段,其为参与源标识符指示区。
图3(b)示出UDP报头的实施方式。UDP是发送方单方地发送数据的通信协议,而不必在互联网上交换信息时用信号通知,已经发送或接收信号。即,UDP是发送方单方地发送数据而该发送方不与接收方联系的协议,并被称为无连接协议。
UDP报头包括指示用于生成具体消息的应用程序的地址的“源端口地址”字段、指示用于接收具体消息的应用程序的地址的“目的地端口地址”字段、指示用户数据报的总长度的“总长度”字段和用于差错检测的“校验和”字段。
图3(c)示出IP报头的实施方式。在本发明中,IP数据包形式的数据包被称为数据报。IP报头包括指示IP报头版本号的“VER”字段、指示IP报头长度的“HLEN”字段、指示向根据已定义规则处理消息的IP协议设备的输入的“服务类型”字段、指示包括协议报头的数据包的长度的“总长度”字段、用于分段以在重新组合片段时识别片段的“标识”字段、指示是否可以对数据报进行分段的“标志”字段、作为指示分段时原始数据报中的偏移的指针的“分段偏移”字段、指示数据包在网络上保持多长时间的“存活时间”字段、指示用于传送数据包的传输协议是否是TCP、UDP或ICMP的“协议”字段、用于检查报头的完整性以确定不存在数据包的剩余部分的“报头校验和”字段、指示数据报的始发源的互联网地址的“源地址”字段、指示数据报的最终目的地的互联网地址的“目的地地址”字段、和用于IP数据报的附加功能的“选项”字段。
图4是根据本发明的数据处理装置中的解码装置的实施方式的框图。具体地说,解码装置被设置为对应于图1中所示的编码装置,并可对编码装置编码的信号进行解码以生成音频信号、视频信号和附加信息。
参考图4,编码装置包括:用于对接收信号进行解复用的解复用器43,用于对内容的视频信号进行解码的视频解码器44,和用于对内容的音频信号进行解码的音频解码器45。解码装置还可包括用于从比特流生成分包传输流以适应网络环境的第三管理器41和第四管理器42。解码装置还可包括用于在物理层和数据链路层在网络上发送/接收数据包的网络接口。
第三管理器41处理从网络上的源接收到的信号并将数据包发送到目的地。作为特定的协议管理器,第三管理器41可以执行用于区分至少一个数据包的功能。例如,第三管理器41在IP层对在IP网络上接收的信号执行IP解封装,并将解封装的信号发送给第四管理器42,或者对所接收的信号执行IP解封装和UDP解封装并将解封装的信号发送给第四管理器42。例如,第三管理器41可以是IP管理器。
第四管理器42处理从第三管理器41接收到的信号。
当第三管理器41仅执行IP解封装时,第四管理器42执行UDP解封装和RTP解封装,而当第三管理器41执行IP解封装和UDP解封装时,第四管理器42执行RTP解封装,这样分包传输流就能够发送到解复用器43。例如,第四管理器42可以是RTP/RTCP管理器,其能够利用RTCP反馈网络接收质量。
第三管理器41和/或第四管理器42能够通过用户接口接收包括用户期望的内容信息的命令,并将该命令发送给内容提供商和/或服务提供商。因此,互联网广播服务能够提供双向服务。
解复用器43接收来自第四管理器42的分包传输流,并把接收到的流解复用成编码视频信号和编码音频信号。视频解码器44对编码视频信号进行解码以生成视频信号,音频解码器45对编码音频信号进行解码以生成音频信号。接收方能够显示发送方利用视频信号、音频信号和附加信息而发送的媒体内容。视频解码器44和音频解码器45可以使用各种解码方法。后面将参考图5等详细描述对信号的解码方法。
此后,将描述根据本发明的编码方法。
在这种情况下,注意到在这种情况下所描述的编码方法可应用于以上描述的基于IP的服务。例如,下面描述的MPEG环绕声可应用于音频编码器、音频解码器和编码方法。
在本发明中,对信号进行编码的步骤将通过被划分的数据编码和熵编码来进行解释。然而,在数据编码和熵编码之间存在相关性,这将在后面详细解释。
在本发明中,将解释各种对数据进行分组以高效地执行数据编码和熵编码的方法。分组方法具有与具体数据或熵编码方案无关的独立有效的技术思想。
在本发明中,具有空间信息的音频编码方案(例如TSO/IEC 23003,MPEG环绕声)将被作为采用数据编码和熵编码的具体示例来进行解释。
图5和图6是根据本发明的系统的图。图5示出编码装置1,图6示出解码装置2。
参考图5,根据本发明的编码装置1包括数据分组部10、第一数据编码部20、第二数据编码部31、第三数据编码部32、熵编码部40和比特流复用部50中的至少一个。
可选的是,第二和第三数据编码部31和32能够集成为一个数据编码部30。例如,由熵编码部40对第二和第三数据编码部31和32编码的数据执行可变长度编码。在下面详细解释以上单元。
数据分组部10绑定通过规定单元输入的信号以增强数据处理效率。
例如,数据分组部10根据数据类型区分数据。
并且,数据编码部20、31和32中的一个对区分的数据进行编码。为了提高数据处理效率,数据分组部10将一些数据区分成至少一个组。并且,数据编码部20、31和32中的一个对分组的数据进行编码。此外,将在后面参考图13到17详细解释根据本发明的分组方法(其中包括数据分组部10的操作)。
数据编码部20、31和32中的每一个根据相应编码方案对输入数据进行编码。数据编码部20、31和32中的每一个采用PCM(脉冲编码调制)方案和差分编码方案中的至少一个。具体地说,例如,第一数据编码部20采用PCM方案,第二数据编码部31采用利用导频基准值的第一差分编码方案,而第三数据编码部32采用利用与相邻数据的差的第二差分编码方案。
此后,为解释方便,把第一差分编码方案称为“基于导频的编码(PBC)”,而把第二差分编码方案称为“差分编码(DIFF)”。并且,将参考图3到图8详细解释数据编码部20、31和32的操作。
同时,熵编码部40参考熵表41根据数据的统计特征执行可变长度编码。并且,将在后面参考图18到图22详细解释熵编码部40的操作。
比特流复用部50把编码数据排列和/或转换成对应于传送规范,然后以比特流形式传送经排列/转换的数据。然而,如果应用本发明的特定系统不使用比特流复用部50,对本领域的技术人员明显的是能够配置该系统而无需比特流复用部50。
同时,解码装置2被配置成对应于上面解释的编码装置1。
例如,参考图2,比特流解复用部60接收输入的比特流,并根据预设的格式对包括在所接收的比特流中的各种信息进行解译和分类。
熵解码部70利用熵表71将数据恢复成熵编码前的原始数据。这样,明显的是,熵表71与图1中所示的编码装置1的先前的熵表41进行同样的配置。
第一数据解码部80、第二数据解码部91和第三数据解码部92分别对应于前述第一到第三数据编码部20、31和32执行解码。
具体地说,如果第二和第三数据解码部91和92执行差分编码,就能够把交迭的解码过程综合成在一个解码过程内进行处理。
数据重构部95将数据解码部80、91和92解码的数据恢复或重构成数据编码之前的原始数据。某些情况下,解码数据能够被恢复成转换或修改原始数据所产生的数据。
另外,本发明为了高效执行数据编码一起使用至少两种编码方案,并要提供利用两种编码方案之间的相关性的高效编码方案。
并且,本发明要提供用于高效执行数据编码的各种数据分组方案。
此外,本发明要提供包括本发明的特征的数据结构。
在将本发明的技术构思应用于各种系统时,对于本领域的技术人员明显的是各种附加配置应如图5和图6中所示的单元一样使用。例如,需要执行数据量化或需要控制器来控制上述过程。
[数据编码]
下面详细解释可应用为本发明的数据编码方案的PCM(脉冲编码调制)、PBC(基于导频的编码)和DIFF(差分编码)。此外,随后也将解释数据编码方案的高效选择和纠正。
1.PCM(脉冲编码调制)
PCM是将模拟信号转换成数字信号的编码方案。PCM以预设的间隔对模拟信号进行采样,然后对相应的结果进行量化。
PCM在编码效率上可能是不利的,但能够有效用于不适合于将要在后面解释的PBC或DIFF编码方案的数据。
在本发明中,在执行数据编码时,与PBC或DIFF编码方案一起使用PCM,这将在后面参考图9到12进行描述。
2.PBC(基于导频的编码)
2-1.PBC的概念
PBC是在区分的数据组内确定具体的基准并利用作为编码目标的数据和该确定的基准之间的关系的编码方案。
作为应用PBC的基准的值可以被定义为“基准值”、“导频”、“导频基准值”或“导频值”。此后,为解释方便,将其称为“导频基准值”。
并且,导频基准值与组内的数据之间的差值可以定义为“差”或“导频差”。
此外,作为应用PBC的单位的数据组是指具有由前述数据分组部10应用的具体分组方案的最终组。数据组能够以各种方式执行,这将在后面详细解释。
在本发明中,以上述方式分组以具有具体含义的数据被定义为将要进行解释的“参数”。这只是为了便于解释并且可以以不同术语替换。
根据本发明的PBC过程包括至少如下的两个步骤。
首先,选择对应于多个参数的导频基准值。这样,参考成为PBC目标的参数来确定导频基准值。
例如,导频基准值被设置为根据成为PBC目标的参数的平均值选择的值、成为该目标的参数的平均值的近似值、对应于成为目标的参数的中间水平的中间值和成为目标的参数中使用频率最高的值。并且,导频基准值也可以被设置为预设的默认值。此外,导频值能够由在预设的表中的选择来决定。
或者,在本发明中,临时导频基准值被设置为由多种不同导频基准值选择方法中的至少两种所选择的导频基准值,针对每种情况计算编码效率,然后将对应于具有最佳编码效率的情况的临时导频基准值选择为最终导频基准值。
当平均值是P时,该平均值的近似值为Ceil[P]或Floor[P]。在这种情况下,Ceil[x]是不超过“x”的是最大整数,而Floor[x]是超过“x”的最小整数。
然而,也可以不参考成为PBC目标的参数而选择任意固定的默认值。
又例如,如前面的描述中所提及的,在已经任意并且多次选择了几个可选为导频的值之后,可将表现出最佳编码效率的值选择为最优导频。
其次,求出所选择的导频与组内的参数之间的差值。例如,通过从成为PBC目标的参数值减去导频基准值来计算出差值。这将随后参考图6和图8进行解释。
图7和图8是解释根据本发明的PBC编码的框图。
例如,假设在一个组内存在多个参数(例如10个参数),并分别具有以下参数值:X[n]=11,12,9,12,10,8,12,9,10,9。
如果选择PBC方案来对该组中的参数进行编码,导频基准值应当在第一位置中选择。在本例中,可以看到导频基准值被设置为图8中的“10”。
如前面的描述中所提及的,能够通过各种选择导频差值的方法来选择导频基准值。
根据公式1来计算PBC的差值。
[公式1]
d[n]=x[n]-P,其中n=0,1,...,9。
在这种情况下,“P”表示导频基准值(=10),并且x[n]是数据编码的目标参数。
根据公式1的PBC的结果对应于d[n]=1,2,-1,2,0,-2,2,-1,0,-1。即,PBC编码的结果包括选择的导频基准值和计算出的d[n]。并且,这些值成为后面将解释的熵编码的目标。此外,如果目标参数值的偏差总体是小的,则PBC更为有效。
2-2.PBC目标
PBC编码的目标并不是规定成一个。可以通过PBC对各种信号的数字数据进行编码。例如,它可应用于后面将解释的音频编码。在本发明中,作为PBC编码的目标,详细解释与音频数据一起处理的附加控制数据。
除了音频的下混合(downmixed)信号之外还要传送控制数据,然后使用该控制数据来重构所述音频。在下面的描述中,把控制数据定义为“空间信息或空间参数”。
空间信息包括各种类型的空间参数,例如信道电平差(此后缩写为CLD)、信道间相干性(此后缩写为ICC)、信道预测系数(此后缩写为CPC)等。
具体地说,CLD是指示两个不同信道之间的能量差的参数。例如,CLD具有范围在15和+15之间的值。ICC是指示两个不同信道之间的相关性的参数。例如,ICC具有范围在0和7之间的值。而CPC是指示用于根据两个信道生成三个信道的预测系数的参数。例如,CPC具有范围在20和30之间的值。
作为PBC编码的目标,可以包括用于调整信号增益的增益值,例如ADG(判决下混合增益)。
并且,应用于下混合音频信号的判决信道变换盒的ATD(判决树数据)可以成为PBC编码目标。具体地说,ADG是与CLD、ICC或CPC相区别开的参数。即,ADG对应于用于调整音频增益以与从音频信号的信道中提取的诸如CLD、ICC、CPC等的空间信息不同的参数。然而,对于使用的示例,可以以与前述CLD相同的方式处理ADG或ATD以提升音频编码的效率。
作为PBC编码的另一目标,可以考虑部分参数。在本发明中,“部分参数”指参数的一部分。
例如,假设具体参数表示为n比特,该n比特被分成至少两个部分。并且,可以分别将这两部分定义为第一部分参数和第二部分参数。在试图执行PBC编码的时候,可以求出第一部分参数值和导频基准值之间的差值。然而,不包括在差分计算中的第二部分参数应当作为单独的值来传送。
更具体地说,例如,在n比特指示参数值的时候,最低有效位(LSB)被定义为第二部分参数,而用剩余的(n-1)个高位构造的参数值可以被定义为第一部分参数。在这种情况下,可以仅针对第一部分参数执行PBC。这是因为,由于用(n-1)个高位构成的第一部分参数值之间的小偏差而提高了编码效率。
不包括在差分计算中的第二部分参数被单独传送,然后在通过解码部重构最终参数时考虑该第二部分参数。或者,代替单独传送第二部分参数,也可以通过预定的方案获取第二部分参数。
利用部分参数的特性的PBC编码被严格地根据目标参数的特性来使用。
例如,如前面的描述中所提及的,第一部分参数之间的偏差应该较小。如果偏差较大,就不必利用该部分参数。它甚至会降低编码效率。
根据实验结果,前述空间信息的CPC参数适于PBC方案的应用。然而,将CPC参数应用于粗量化方案不是优选的。如果量化方案是粗的,第一部分参数之间的偏差就会增大。
此外,利用部分参数的数据编码适用于DIFF方案和PBC方案。
在将该部分参数概念应用于CPC参数的情况下,对用于重构的信号处理方法和装置解释如下。
例如,根据本发明的利用部分参数处理信号的方法包括以下步骤:利用对应于第一部分参数的基准值和对应于该基准值的差值获取第一部分参数;和利用第一部分参数和第二部分参数来确定参数。
在这种情况下,基准值是导频基准值或者差基准值。并且,第一部分参数包括该参数的部分比特,而第二部分参数包括该参数的其余比特。此外,第二部分参数包括该参数的最低有效位。
该信号处理方法还包括利用所确定的参数重构音频信号的步骤。
该参数是包括CLD、ICC、CPC和ADG中的至少一个的空间信息。
如果该参数是CPC并且如果该参数的量化比例不是粗糙的,就能够获得第二部分参数。
并且,通过两倍该部分参数来确定最终参数,并将该乘法结果加到第二部分参数。
根据本发明的利用部分参数来处理信号的装置包括:利用对应于第一部分参数的基准值和对应于该基准值的差值获取第一部分参数的第一参数获取部;和利用第一部分参数和第二部分参数来确定参数的参数确定部。
该信号处理装置还包括通过接收第二部分参数来获取第二部分参数的第二参数获取部。
并且,第一参数获取部、参数确定部和第二部分参数获取部包括在前述数据解码部91或92之内。
根据本发明的利用部分参数来处理信号的方法包括以下步骤:将参数分成第一部分参数和第二部分参数;和利用对应于第一部分参数的基准值和第一部分参数来生成差值。
并且,该信号处理方法还包括传送所述差值和第二部分参数的步骤。
根据本发明的利用部分参数来处理信号的装置包括:将参数分成第一部分参数和第二部分参数的参数分割部,和利用对应于第一部分参数的基准值和第一部分参数生成差值的差值生成部。
并且,该信号处理装置还包括传送所述差值和第二部分参数的参数输出部。
此外,参数分割部和差值生成部包括在前述数据编码部31或32之内。
2-3.PBC条件
在本发明的PBC编码选择单独导频基准值然后使该选择的导频基准值包括在比特流中的情况下,很可能的使得该PBC编码的传输效率变得比后面将要解释的DIFF编码方案的传输效率更低。
因此,本发明是要提供一种用于执行PBC编码的最优条件。
如果一组内实验上成为数据目标的数据编码数量为至少三个或更高,则可应用PBC编码。这对应于考虑数据编码效率的结果。这意味着如果在一组内仅存在两个数据,DIFF或PCM编码比PBC编码更有效率。
尽管PBC编码适用于至少三个或更多的数据,优选的是将PBC编码应用于一组内存在至少5个数据的情况。换句话说,PBC编码最有效适用的情形是成为数据编码目标的数据为至少5个并且该至少5个数据之间的偏差较小的情形。并且,适于执行PBC编码的数据的最小数量将根据系统和编码环境来决定。
针对各个数据频带给出成为数据编码目标的数据。这将通过后面将要解释的分组处理来解释。因此,例如,本发明提出对于在后面将要解释的MPEG音频环绕声编码中应用PBC编码要求至少5个数据频带。
此后,对利用用于执行PBC的条件的信号处理方法和装置解释如下。
在根据本发明的一个实施方式的信号处理方法中,如果获取了对应于导频基准值的数据的数量并且如果该数据频带的数量满足预设的条件,则获取导频基准值和对应于该导频基准值的导频差值。随后,利用导频基准值和导频差值来获取数据。具体地说,利用包括该数据的数据频带的数量获取该数据的数量。
在根据本发明的另一个实施方式的信号处理方法中,利用数据数量确定多个数据编码方案中的一个,并根据所确定的数据编码方案对所述数据进行解码。多个所述数据编码方案至少包括导频编码方案。如果所述数据数量满足预设的条件,则将所述数据编码方案确定为导频编码方案。
并且,数据解码过程包括以下步骤:获取对应于多个数据的导频基准值和对应于所述导频基准值的导频差值;和利用所述导频基准值和所述导频差值获取所述数据。
此外,在该信号处理方法中,所述数据为参数。并且,利用所述参数来恢复音频信号。在该信号处理方法中,接收对应于所述参数的数量的标识信息,并利用所接收到的标识信息来生成所述参数的数量。通过考虑所述数据的数量,分层级提取指示多个数据编码方案的标识信息。
在提取所述标识信息的步骤中,提取指示第一数据编码方案的第一标识信息,然后利用第一标识信息和所述数据的数量提取指示第二数据编码方案的第二标识信息。在这种情况下,第一标识信息指示是否为DIFF编码方案。并且,第二标识信息指示是否为导频编码方案或PCM分组方案。
在根据本发明的另一个实施方式的信号处理方法中,如果多个数据的数量满足预设的条件,则利用对应于多个数据的导频基准值和所述数据来生成导频差值。然后传送所生成的导频差值。在该信号处理方法中,传送所述导频基准值。
在根据本发明的又一个实施方式的信号处理方法中,根据多个数据的数量确定数据编码方案。然后根据所确定的数据编码方案对所述数据进行编码。在这种情况下,多个所述数据编码方案至少包括导频编码方案。如果所述数据的数量满足预设的条件,则将所述数据编码方案确定为导频编码方案。
根据本发明的一个实施方式的信号处理装置包括:数量获取部,其获取对应于导频基准值的数据的数量;值获取部,如果所述数据的数量满足预设的条件,则所述值获取部获取所述导频基准值和对应于所述导频基准值的导频差值;以及数据获取部,其利用所述导频基准值和所述导频差值获取所述数据。在这种情况下,所述数量获取部、所述值获取部和所述数据获取部包括在前述数据解码部91或92之内。
根据本发明的另一个实施方式的信号处理装置包括根据多个数据的数量确定多个数据编码方案中的一个的方案确定部和根据所确定的数据编码方案对所述数据进行解码的解码部。在这种情况下,多个所述数据编码方案至少包括导频编码方案。
根据本发明的又一个实施方式的信号处理装置包括在多个数据的数量满足预设条件的情况下利用对应于所述多个数据的导频基准值和所述数据生成导频差值的值生成部,和传送所生成的导频差值的输出部。在这种情况下,所述值生成部包括在前述数据编码部31或32之内。
根据本发明的另一个实施方式的信号处理装置包括根据多个数据的数量确定数据编码方案的方案确定部和根据所确定的数据编码方案对所述数据进行编码的编码部。在这种情况下,多个所述数据编码方案至少包括导频编码方案。
2-4.PBC信号处理方法
对根据本发明的利用PBC编码特征的信号处理方法和装置解释如下。
在根据本发明的一个实施方式的信号处理方法中,获取对应于多个数据的导频基准值和对应于该导频基准值的导频差值。随后,利用所述导频基准值和所述导频差值获取数据。并且,所述方法还可包括对所述导频差值和所述导频基准值中的至少一个进行解码的步骤。在这种情况下,应用了PBC的数据为参数。并且,所述方法还可包括利用所获取的参数重构音频信号的步骤。
根据本发明的一个实施方式的信号处理装置包括:对应于多个数据的导频基准值和对应于所述导频基准值的导频差值,和利用所述导频基准值和所述导频差值获取所述数据的数据获取部。在这种情况下,所述值获取部和所述数据获取部包括在前述数据编码部91或92之内。
根据本发明的另一个实施方式的信号处理方法包括以下步骤:利用对应于多个数据的导频基准值和所述数据生成导频差值;和输出所生成的导频差值。
根据本发明的另一个实施方式的信号处理装置包括:利用对应于多个数据的导频基准值和所述数据生成导频差值的值生成部,和输出所生成的导频差值的输出部。
根据本发明的又一个实施方式的信号处理方法包括以下步骤:获取对应于多个增益的导频基准值和对应于所述导频基准值的导频差值;和利用所述导频基准值和所述导频差值获取所述增益。并且,所述方法还可包括对所述导频差值和所述导频基准值中的至少一个进行解码的步骤。此外,所述方法还可包括利用所获取的增益重构音频信号的步骤。
在这种情况下,导频基准值可以是多个所述增益的平均值、多个所述增益的平均中间值、多个所述增益中的最频用值、设为默认的值或从表中提取的一个值。并且,所述方法还可包括在对多个所述增益中的每一个设置所述导频基准值之后选择具有最高编码效率的增益作为最终导频基准值的步骤。
根据本发明的又一个实施方式的信号处理装置包括:获取对应于多个增益的导频基准值和对应于所述导频基准值的导频差值的值获取部,和利用所述导频基准值和所述导频差值获取所述增益的增益获取部。
根据本发明的又一个实施方式的信号处理方法包括以下步骤:利用对应于多个增益的导频基准值和所述增益生成导频差值;和输出所生成的导频差值。
并且,根据本发明的又一个实施方式的信号处理装置包括:利用对应于多个增益的导频基准值和所述增益生成导频差值的值计算部,和输出所生成的导频差值的输出部。
3.DIFF(差分编码)
DIFF编码是利用在被区分开的数据组内存在的多个数据之间的关系的编码方案,其可称为“差分编码”。在这种情况下,作为应用DIFF时的单元的数据组是指由前述数据分组部10应用了具体分组方案的最终组。在本发明中,把以上述方式分组的具有具体含义的数据定义为将要进行解释的参数。并且,这与针对PBC所解释的相同。
具体地说,DIFF编码方案是利用在同一组内存在的参数之间的差值,更具体地说是相邻参数之间的差值的编码方案。
DIFF编码方案的类型和详细应用示例将参考图5到图8详细解释如下。
3-1.DIFF类型
图9是解释根据本发明的DIFF编码的类型的图。根据从相邻参数求出差值的方向来区分DIFF编码。
例如,DIFF编码类型可以分为:频率方向上的DIFF(此后缩写为“DIFF 或“DF”)和时间方向上的(此后缩写为TIME”或“DT”)。
参考图9,组1指示在频率轴上计算差值的DIFF(DF),而组2或组3在时间轴上计算差值。
从图9可见,根据时间轴的求差值的方向再区分在时间轴上计算差值的DIFF(DT)。
例如,应用于组2的DIFF(DT)对应于求当前时刻的参数值和先前时刻的参数值(例如组1)之间的差值的方案。这被称为后向时间DIFF(DT)(此后缩写为“DT-BACKWARD”)。
例如,应用于组3的DIFF(DT)对应于求当前时刻的参数值和下一时刻的参数值(例如组4)之间的差值的方案。这被称为前向时间DIFF(DT)(此后缩写为“DT-FORWARD”)。
因此,如图9中所示,组1为DIFF(DF)编码方案,组2为DIFF(DT-BACKWARD)编码方案,而组3为DIFF(DT-FORWARD)编码方案。然而,没有确定组4的编码方案。
在本发明中,尽管频率轴上的DIFF被规定为仅一种编码方案(例如DIFF(DF)),也可以通过将其区分为“DIFF(DF-TOP)”和“DIFF(DF-BOTTOM)”来作出多个定义。
3-2.DIFF应用示例
图6到8是应用了DIFF编码方案的示例图。
在图10中,为了便于解释,采用图9中所示的组1和组2作为例子。组1遵循DIFF(DF)编码方案,并且其参数值为x[n]=11,12,9,12,10,8,12,9,10,9。组2遵循DIFF(DT-BACKWARD)编码方案,且其参数值为y[n]=10,13,8,11,10,7,14,8,10,8。
图11示出计算组1的差值的结果。由于组1是通过DIFF(DF)编码方案编码的,所以通过公式2计算差值。公式2意指在频率轴上求与前一参数的差值。
[公式2]
d[0]=x[0]
d[n]=x[n]x[n-1],其中n=1,2,...,9。
具体地说,通过公式2得到的组1的DIFF(DF)结果为d[n]=-11,1,-3,3,-2,-2,4,-3,1,-1。
图12示出计算组2的差值的结果。由于组2是通过DIFF(DF-BACKWARD)编码方案编码的,所以通过公式3计算差值。公式3意指在时间轴上求与前一参数的差值。
[公式3]
d[n]=y[n]x[n],其中n=1,2,...,9。
具体地说,通过公式3得到的组2的DIFF(DF-BACKWARD)结果为d[n]=-1,1,-1,-1,0,0,1,2,-1,0,-1。
4.选择数据编码方案
本发明的特征在于通过混合各种数据编码方案来压缩或重构数据。因此,在对具体组进行编码时,需要从至少三个或更多个数据编码方案中选择一个编码方案。并且,针对所选择的编码方案的标识信息应当通过比特流传送给解码部。
对根据本发明的选择数据编码方案的方法以及利用该方法的编码方法和装置解释如下。
根据本发明的一个实施方式的信号处理方法包括以下步骤:获取数据编码标识信息,和根据由数据编码标识信息指示的数据编码方案对数据进行数据解码。
在这种情况下,所述数据编码方案至少包括PBC编码方案。并且,PBC编码方案利用对应于多个数据的导频基准值和导频差值对数据进行解码。并且,利用所述数据和所述导频基准值生成导频差值。
所述数据编码方案还包括DIFF编码方案。DIFF编码方案对应于DIFF-DF方案和DIFF-DT方案中的一个。并且,DIFF-DT编码方案对应于前向时间DIFF-DT(FORWARD)方案和后向时间DIFF-DT(BACKWARD)方案中的一个。
该信号处理方法还包括以下步骤:获取熵编码标识信息,和利用由熵编码标识信息表示的熵编码方案对数据进行熵解码。
在数据解码步骤中,通过数据编码方案对进行过熵解码的数据进行数据解码。
并且,该信号处理方法还包括利用所述数据作为参数对音频信号进行解码的步骤。
根据本发明的一个实施方式的信号处理装置包括:获取数据编码标识信息的标识信息获取部,和根据由数据编码标识信息指示的数据编码方案对数据进行数据解码的解码部。
在这种情况下,所述数据编码方案至少包括PBC编码方案。并且,PBC编码方案利用对应于多个数据的导频基准值和导频差值对数据进行解码。并且,利用所述数据和所述导频基准值生成导频差值。
根据本发明的另一个实施方式的信号处理方法包括以下步骤:根据数据编码方案对数据进行数据编码,和生成发送指示数据编码方案的数据编码标识信息。
在这种情况下,所述数据编码方案至少包括PBC编码方案。PBC编码方案利用对应于多个数据的导频基准值和导频差值对数据进行编码。并且,利用所述数据和所述导频基准值生成导频差值。
根据本发明的另一个实施方式的信号处理装置包括:根据数据编码方案对数据进行数据编码的编码部,和生成发送指示数据编码方案的数据编码标识信息的输出部。
在这种情况下,所述数据编码方案至少包括PBC编码方案。PBC编码方案利用对应于多个数据的导频基准值和导频差值对数据进行编码。并且,利用所述数据和所述导频基准值生成导频差值。
对根据本发明的选择数据编码方案的方法和通过最优传送效率传送编码选择标识信息的方法解释如下。
4-1.考虑使用频率的数据编码标识方法
图13是解释对根据本发明的至少三个编码方案中的一个进行选择时的关系的框图。
参考图13,假设存在第一到第三数据编码部53、52和51,第一数据编码部53的使用频率最低,而第三数据编码部51的使用频率最高。
为解释方便,参照总数“100”,假设第一数据编码部53的使用频率为“10”,第二数据编码部52的使用频率为“30”,而第三数据编码部51的使用频率为“60”。具体地说,对于100个数据组,可以看成是将PCM方案应用10次,将PBC方案应用30次,而将DIFF方案应用60次。
基于上述假设,按以下方式计算出标识三种类型的编码方案的标识信息需要的比特数。
例如,根据图13,由于使用1比特第一信息,使用100比特作为标识全部100组的编码方案的第一信息。由于具有最高使用频率的第三数据编码部51是通过这100比特标识的,其余的1比特第二信息能够仅利用40比特来区分第一数据编码部53和第二数据编码部52。
因此,根据“第一信息(100比特)+第二信息(40比特)”的结果,针对总的100个数据组选择每组的编码类型的标识信息需要总共140比特。
图14是解释根据现有技术的对至少三个编码方案中的一个进行选择时的关系的框图。
类似图13,为解释方便,以总共“100”作为参考,假设第一数据编码部53的使用频率为“10”,第二数据编码部52的使用频率为“30”,而第三数据编码部51的使用频率为“60”。
在图14中,按以下方式计算出标识三种编码方案的标识信息需要的比特数。
首先,根据图14,由于使用1比特第一信息,所以使用100比特作为标识全部100组的编码方案的第一信息。
具有最低使用频率的第一数据编码部53是通过这100比特优先标识的。因此,其余的1比特第二信息还需要总共90比特来区分第二数据编码部52和第三数据编码部51。
因此,根据“第一信息(100比特)+第二信息(90比特)”的结果,针对总的100个数据组选择每组的编码类型的标识信息需要总共190比特。
比较图13中所示的情形和图14中所示的情形,可以看出图13中示出的数据编码选择标识信息在传输效率上更有优势。
即,当存在至少三个或更多个数据编码方案时,本发明的特征在于利用不同的标识信息而不是通过相同的标识信息来区分在使用频率上彼此相似的两种编码方案类型
例如,当将图14中所示的第一数据编码部51和第二数据编码部52归类为相同的标识信息时,数据传输比特增加从而降低传输效率。
当存在至少三种数据编码类型时,本发明特征在于通过第一信息区分具有最高使用频率的数据编码方案。因此,通过第二信息区分剩下的具有较低使用频率的两种编码方案。
图15和图16分别是根据本发明的数据编码选择方案的流程图。
在图15中,假设DIFF编码是具有最高使用频率的数据编码方案。在图16中,假设PBC编码是具有最高使用频率的数据编码方案。
参考图15,检查是否存在具有最低使用频率的PCM编码(S10)。如前述描述中所提到的,该检查通过用于标识的第一信息执行。
作为检查的结果,如果是PCM编码,则检查是否是PBC编码(S20)。这通过用于标识的第二信息执行。
如果DIFF编码的使用频率为总共100次中的60次,则根据“第一信息(100比特)+第二信息(40比特)”的结果,针对相同的100个数据组用于每组的编码类型选择的标识信息需要总共140比特。
参考图16,类似于图15,检查是否存在具有最低使用频率的PCM编码(S30)。如前述描述中所提到的,该检查通过用于标识的第一信息执行。
作为检查的结果,如果是PCM编码,则检查是否是DIFF编码(S40)。这通过用于标识的第二信息执行。
如果DIFF编码的使用频率为总共100次中的80次,则根据“第一信息(100比特)+第二信息(20比特)”的结果,针对相同的100个数据组用于每组的编码类型选择的标识信息需要总共120比特。
对根据本发明的标识多个数据编码方案的方法以及利用该方法的信号处理方法和装置解释如下。
根据本发明的一个实施方式的信号处理方法包括以下步骤:提取分层级指示多个数据编码方案的标识信息,和根据对应于该标识信息的数据编码方案对数据进行解码。
在这种情况下,从不同的层提取指示包括在多个数据编码方案中的PBC编码方案和DIFF编码方案的标识信息。
在解码步骤中,利用对应于多个数据的基准值和利用该数据生成的差值根据数据编码方案获取数据。在这种情况下,基准值是导频基准值或者差基准值。
根据本发明的另一个实施方式的信号处理方法包括以下步骤:分层级地提取指示至少三个或更多个数据编码方案的标识信息。在这种情况下,从不同的层提取具有指示标识信息的高使用频率的两种编码方案的标识信息。
根据本发明的另一个实施方式的信号处理方法包括以下步骤:根据指示数据编码方案的标识信息的使用频率分层级地提取标识信息,和根据对应于该标识信息的数据解码方案对数据进行解码。
在这种情况下,以分层级地提取第一标识信息和第二标识信息的方式提取标识信息。第一标识信息指示是否为第一数据编码方案,且第二标识信息指示是否为第二数据编码方案。
第一标识信息指示是否为DIFF编码方案。并且,第二标识信息指示是否为导频编码方案或PCM分组方案。
第一数据编码方案可以是PCM编码方案。并且,第二数据编码方案可以是PBC编码方案或DIFF编码方案。
所述数据为参数,并且该信号处理方法还包括利用所述参数重构音频信号的步骤。
根据本发明的一个实施方式的信号处理装置包括:分层级地提取区分多种数据编码方案的标识信息的标识符提取部(例如,图17中的“710”),和根据对应于该标识信息的数据编码方案对数据进行解码的解码部。
根据本发明的再一个实施方式的信号处理方法包括以下步骤:根据数据编码方案对数据进行编码,和生成区分用于对数据进行编码的在使用频率上彼此不同的数据编码方案的标识信息。
在这种情况下,标识信息将PCM编码方案和PBC编码方案彼此区分开来。具体地说,标识信息将PCM编码方案和DIFF编码方案彼此区分开来。
并且,根据本发明的又一个实施方式的信号处理装置包括:根据数据编码方案对数据进行编码的编码部,和生成区分用于对数据进行编码的在使用频率上彼此不同的数据编码方案的标识信息的标识信息生成部(例如,图15中的“400”)。
4-2.数据间编码(Inter-Data-Coding)关系
首先,在本发明的PCM、PBC和DIFF之间存在相互独立和/或依赖的关系。例如,可以针对成为数据编码目标的各组自由选择三种编码类型中的一种。因此,总体数据编码带来组合利用三种编码方案类型的结果。然而,通过考虑这三种编码方案类型的使用频率,首次选择具有最优使用频率的DIFF编码方案和其余两个编码方案(例如PCM和PBC)中的一个。随后,其次选择PCM和PBC中的一个。然而,如前述描述中所提到的,这要考虑标识信息的传输效率而不归因于实质的编码方案的类似性。
在编码方案的类似性方面,PBC和DIFF在计算差值方面彼此类似。因此,PBC和DIFF的编码过程彼此显著地交迭。具体地说,在解码中从差值重构原始参数的步骤被定义为“delta解码”,并能够设计成在同一步骤中处理。
在执行PBC或DIFF编码的过程中,可能存在偏离其范围的参数。在这种情况下,需要通过独立的PCM来编码并传送相应的参数。
[分组]
1.分组的概念
本发明提出了通过将规定数据捆绑在一起来处理数据以提高编码效率的“分组”。具体地说,在PBC编码的情况下,由于通过组单元选择导频基准值,所以分组过程需要先于执行PBC编码一步完成。以相同方式将分组应用于DIFF编码。并且,根据本发明的某些分组方案也可应用于熵编码,这将在后面相应的描述部分解释。
根据分组的执行方法,本发明的分组类型可分为“外部分组”和“内部分组”。
或者,根据分组目标,本发明的分组类型可分为“域分组”、“数据分组”和“信道分组”。
或者,根据分组执行顺序,本发明的分组类型可分为“第一分组”、“第二分组”和“第三分组”。
或者,根据分组执行数量,本发明的分组类型可分为“单个分组”和“多重分组”。
然而,上述分组分类是为了便于传递本发明的概念而作出的,这并不是对其使用的术语进行限制。
根据本发明的分组以各种分组方案在使用中彼此交迭或者彼此组合使用的方式来完成。
在下面的描述中,对根据本发明的分组通过区分为内部分组和外部分组来进行解释。随后,将会解释各种分组类型共存的多重分组。并且,将会解释域分组和数据分组的概念。
2.内部分组
内部分组意味着分组的执行是在内部实现的。如果总体执行内部分组,则将先前的组在内部重新分组以生成新的组或划分的组。
图17是解释根据本发明的内部分组的图。
参考图17,例如,根据本发明的内部分组以频域单元(此后称为“频带”)来执行。因此,有时候内部分组方案可以对应于一类域分组。
如果采样数据通过特定滤波器,例如QMF(正交镜像滤波器),则会生成多个子频带。在子频带模式中,执行第一频率分组以生成可称为参数频带的第一组频带。第一频率分组能够通过将子频带不规则地捆绑在一起来生成参数频带。因此,能够不等地配置参数频带的大小。然而,根据编码目的,可以等值地配置参数频带。并且,生成子频带的步骤可以分类为一类分组。
随后,对生成的参数频带执行第二频率分组以生成可称为数据频带的第二组频带。第二频率分组能够通过利用统一的数统一参数频带来生成数据频带。
根据分组完成后编码的目的,能够以对应于第一组频带的参数频带单元或对应于第二组频带的数据频带单元执行编码。
例如,在应用前述PBC编码时,能够通过将分组的参数频带当成一组或将分组的数据频带当成一组来选择导频基准值(一类组基准值)。利用所选择的导频基准值执行PBC,并且PBC的具体操作与前述说明中解释的相同。
又例如,在应用前述DIFF编码时,可以通过将分组的参数频带当成一组来确定组基准值,然后计算差值。或者,也可以通过将分组的数据频带当成一组来确定组基准值并计算差值。并且,DIFF的详细操作与前述说明中解释的相同。
如果将第一和/或频率分组应用到实际编码中,需要传送相应的信息,这将在后面参考图27来解释。
3.外部分组
外部分组意味着分组的执行是在外部实现的情形。如果总体执行外部分组,则将先前的组在外部重新分组以生成新的组或组合的组。
图18是解释根据本发明的外部分组的图。
例如参考图18,根据本发明的外部分组以时域单元(此后称为“时隙”)来执行。因此,有时候外部分组方案可以对应于一类域分组。
对包括采样数据的帧执行第一时间分组以生成第一组时隙。图18例示了生成8个时隙。第一时间分组也有将帧等大小地分成时隙的意思。
选择由第一时间分组生成的时隙中的至少一个。图18示出了选择时隙1、4、5和8的情形。根据编码方案,可以在选择步骤中选择全部的时隙。
然后将所选择的时隙1、4、5和8重排成时隙1、2、3和4中。然而,根据编码的目的,可以部分重排所选择的时隙1、4、5和8。在这种情况下,由于从所述重排中排除的时隙被从最终的组信息中排除了,所以它们也被从PBC或DIFF编码目标中排除了。
对所选择的时隙执行第二时间分组以配置在最终的时间轴上一起处理的组。
例如,时隙1和2或时隙3和4可以配置成一组,这称为时隙对。又例如,时隙1、2和3可以配置成一组,这称为时隙三元组。并且,可以存在不与其他时隙配置成一组的单个时隙。
当把第一和第二时间分组应用到实际编码中时,需要传送相应的信息。这将在后面参考图27来解释。
4.多重分组
多重分组是指一种通过将内部分组、外部分组和各种其他分组混合在一起生成最终组的分组方案。如前述描述中所提到的,根据本发明的单个分组方案可通过彼此叠加或者彼此组合来应用。并且,多重分组被用作提高各种编码方案的效率的方案。
4-1.混合内部分组和外部分组
图19是解释根据本发明的多重分组的图,其中混合了内部分组和外部分组。
参考图19,在已在频域中完成了内部分组后生成最终分组的频带64。并且,在已在时域中完成了外部分组后生成最终时隙61、62和63。
把分组完成后的一个单独时隙称为数据集。在图19中,参考标号61a,61b,62a,62b和63分别指示数据集。
具体地说,两个数据集61a和61b或另两个数据集62a和62b可以通过外部分组配置成对。该数据集对被称为“数据对”。
在多重分组完成后,执行PBC或DIFF编码应用。
例如,在执行PBC编码的情况下,针对最终完成的数据对61或62或者没有配置成数据对的各数据集63选择导频基准值P1、P2或P3。然后利用所选择的导频基准值执行PBC编码。
例如,在执行DIFF编码的情况下,针对数据集61a,61b,62a,62b和63中的每一个确定DIFF编码类型。如前述描述中所提到的,应当针对每个数据集确定DIFF方向并将DIFF方向确定为“DIFF-DF”和“DIFF-DT”中的一个。根据确定的DIFF编码方案执行DIFF编码的过程与前述说明中所提到的相同。
为了通过在多重分组中执行外部分组来配置数据对,应当对配置成所述数据对的数据集中的每一个执行等同的内部分组。
例如,配置成数据对的数据集61a和61b中的每一个都具有相同的数据频带号。并且,配置成数据对的数据集62a和62b中的每一个都具有相同的数据频带号。然而,属于不同数据对的数据集例如61a和62a可以分别在数据频带号上彼此不同,也没有问题。这意味着针对每个数据对可以应用不同的内部分组。
当配置数据对时,可以通过内部分组执行第一分组,通过外部分组执行第二分组。
例如,在第二分组之后的数据频带号对应于第一分组后的数据频带的规定乘积。这是因为配置成数据对的每个数据集都具有相同的数据频带号。
4-2.混合内部分组和内部分组
图20和图21分别是解释根据本发明的另一实施方式的混合分组的图。具体地说,图20和图21集中示出了内部分组的混合。因此,显然在图20或图21中执行或可以执行外部分组。
例如,图20示出当完成第二频率分组之后生成数据频带时再次执行内部分组的情况。具体地说,由第二频率分组生成的数据频带被分成低频带和高频带。在特定编码的情况下,需要分开使用低频带或高频带。具体地说,将低频带和高频带分开使用的情况称为“双模“。
因此,在双模情况下,通过将最终生成的低频带或高频带作为一组来执行数据编码。例如,针对低频带和高频带分别生成导频基准值P1和P2,然后在相应的频带内执行PBC编码。
双模可根据每个信道的特性来应用。因此,这称为“信道分组”。并且,双模也可以根据数据类型进行不同的应用。
例如,图21示出当完成前述第二频率分组之后生成数据频带时再次执行内部分组的情况。即,由第二频率分组生成的数据频带被分成低频带和高频带。在特定编码的情况下,仅使用低频带,而需要放弃高频带。具体地说,对仅仅使用的低频带进行分组的情况称为“低频信道(LFE)模式”。
在低频信道模式中,通过将最终生成的低频带作为一组来执行数据编码。
例如,针对低频带生成导频基准值P1,然后在相应的低频带内执行PBC编码。然而,通过对选择的低频带执行内部分组也可生成新的数据频带。这就要对低频带进行集中分组来表示。
并且,低频信道(LFE)模式根据低频信道特性来应用,并可称为“信道分组”。
5.域分组和数据分组
可以根据分组的目标把分组分类为域分组和数据分组。
域分组是指把具体的域(例如频域或时域)分组成域单元的方案。并且,可以通过前述内部分组和/或外部分组来执行域分组。
并且,数据分组是指对数据本身进行分组的方案。可以通过前述内部分组和/或外部分组来执行数据分组。
在数据分组的具体情况下,分组可以被执行以能够用于熵编码。例如,将数据分组用于对图19所示的最终完成的分组状态中的真实数据进行熵编码。即,以将在频率方向和时间方向中的一个上彼此相邻的两个数据捆绑在一起的方式处理数据。
然而,当以上述方式执行数据分组时,在最后的组中的数据被部分地重新分组。因此,PBC或DIFF编码不只应用于被数据分组的组(例如两个数据)。此外,将在后面解释对应于数据分组的熵编码方案。
6.利用分组的信号处理方法
6-1.至少利用内部分组的信号处理方法
对根据本发明的利用前述分组方案的信号处理方法和装置解释如下。
根据本发明的一个实施方式的信号处理方法包括以下步骤:获取对应于通过第一分组和针对该第一分组的内部分组而包括在一组中的多个数据的组基准值和对应于该组基准值的差值;和利用所述组基准值和所述差值获取所述数据。
本发明的特征在于,通过第一分组进行分组的数据的数量大于通过内部分组进行分组的数据的数量。在这种情况下,组基准值可以是导频基准值或者差基准值。
根据本发明的一个实施方式的方法还包括以下步骤:对组基准值和差值中的至少一个进行解码。在这种情况下,按组来确定导频基准值。
并且,分别提前设定通过内部分组而包括在内部组中的数据的编号。在这种情况下,包括在内部组中的数据的编号彼此不同。
在频域上对数据执行第一分组和内部分组。在这种情况下,频域可以对应于混合域、参数频带域、数据频带域和信道域中的一个。
并且,本发明的特征在于,通过第一分组产生的第一组包括通过内部分组产生的多个内部组。
本发明的频域通过频带来区分。频带通过内部分组变成子频带。子频带通过内部分组变成参数频带。参数频带通过内部分组变成数据频带。在这种情况下,参数频带的数量可限于最大28。并且,参数频带按2、5或10分成一个数据频带。
根据本发明的一个实施方式的信号处理装置包括:获取对应于通过第一分组和针对该第一分组的内部分组而包括在一组中的多个数据的组基准值和对应于该组基准值的差值的值获取部,和利用所述组基准值和所述差值获取所述数据的数据获取部。
根据本发明的另一个实施方式的信号处理方法包括以下步骤:利用对应于通过第一分组和针对该第一分组的内部分组而包括在一组中的多个数据的组基准值和所述数据生成差值,和传送生成的差值。
并且,根据本发明的另一个实施方式的信号处理装置包括:利用对应于通过第一分组和针对该第一分组的内部分组而包括在一组中的多个数据的组基准值和所述数据生成差值的值生成部,和传送生成的差值的输出部。
6-2.利用多重分组的信号处理方法
对根据本发明的利用前述分组方案的信号处理方法和装置解释如下。
根据本发明的一个实施方式的信号处理方法包括以下步骤:获取对应于通过分组包括在一组中的多个数据的组基准值和对应于该组基准值的差值,和利用所述组基准值和所述差值获取所述数据。
在这种情况下,基准值可以是导频基准值或者差基准值中的一个。
并且,分组可以对应于外部分组和外部分组中的一个。
此外,分组可以对应于域分组和数据分组中的一个。
对域组执行数据分组。并且,包括在域分组中的时域包括时隙域、参数集域和数据集域中的至少一个。
包括在域分组中的频域可以包括采样域、子频带域、混合域、参数频带域、数据频带域和信道域中的至少一个。
一个差基准值将根据包括在组中的多个数据来设定。并且,确定分组数量、分组范围和是否存在分组中的至少一个。
根据本发明的一个实施方式的信号处理装置包括:获取对应于通过分组而包括在一组中的多个数据的组基准值和对应于该组基准值的差值的值获取部,和利用所述组基准值和所述差值获取所述数据的数据获取部。
根据本发明的另一个实施方式的信号处理方法包括以下步骤:利用对应于通过分组而包括在一组中的多个数据的组基准值和所述数据生成差值,和传送生成的差值。
根据本发明的另一个实施方式的信号处理装置包括:利用对应于通过分组而包括在一组中的多个数据的组基准值和所述数据生成差值的值生成部,和传送生成的差值的输出部。
根据本发明的另一个实施方式的信号处理方法包括以下步骤:获取对应于通过包括第一分组和第二分组的分组而包括在一组中的多个数据的组基准值和对应于该组基准值的第一差值,和利用所述组基准值和所述第一差值获取所述数据。
在这种情况下,组基准值可以包括导频基准值或差基准值。
所述方法还包括对组基准值和第一差值中的至少一个进行解码的步骤。并且,按组来确定第一导频基准值。
所述方法还包括以下步骤:获取对应于多个第一导频基准值的第二导频基准值和对应于所述第二导频基准值的第二差值,和利用所述第二导频基准值和所述第二差值获取所述第一导频基准值。
在这种情况下,第二分组可以包括针对第一分组的外部或内部分组。
在时域和频域中的至少一个上对数据执行分组。具体地说,所述分组是在时域和频域中的至少一个上进行分组的域分组。
时域可以包括时隙域、参数集域或数据集域。
频域可以包括采样域、子频带域、混合域、参数频带域、数据频带域或信道域。并且,被分组的数据为索引或参数。
利用由通过第一分组而包括在一组中的索引指示的熵表对第一差值进行熵解码。并且,利用组基准值和经熵解码的第一差值获取所述数据。
利用由通过第一分组包括在一组中的索引指示的熵表对第一差值和组基准值进行熵解码。并且,利用经熵解码的组基准值和经熵解码的第一差值获取所述数据。
根据本发明的另一个实施方式的信号处理装置包括:获取对应于通过包括第一分组和第二分组的分组而包括在一组中的多个数据的组基准值和对应于该组基准值的差值的值获取部,和利用所述组基准值和所述差值获取所述数据的数据获取部。
根据本发明的另一个实施方式的信号处理方法包括以下步骤:利用对应于通过包括第一分组和第二分组的分组而包括在一组中的多个数据的组基准值和所述数据生成差值,和传送生成的差值。
根据本发明的另一个实施方式的信号处理装置包括:利用对应于通过包括第一分组和第二分组的分组而包括在一组中的多个数据的组基准值和所述数据生成差值的值生成部,和传送生成的差值的输出部。
根据本发明的一个实施方式的信号处理方法包括以下步骤:获取对应于通过第一分组和针对该第一分组的外部分组而包括在一组中的多个数据的组基准值和对应于该组基准值的差值,和利用所述组基准值和所述差值获取所述数据。
在这种情况下,对应于通过第一分组所分组的多个数据的第一数据数量小于对应于通过外部分组所分组的多个数据的第二数据数量。并且,在第一数据数量和第二数据数量之间存在倍数关系。
组基准值可以包括导频基准值或者差基准值。
所述方法还包括对组基准值和差值中的至少一个进行解码的步骤。
按组来对导频基准值进行解码。
在时域和频域中的至少一个上对数据执行分组。时域可以包括时隙域、参数集域或数据集域。并且,频域可以包括采样域、子频带域、混合域、参数频带域、数据频带域或信道域。
所述方法还包括利用所获取的数据作为参数重构音频信号的步骤。并且,外部分组可以包括配对参数。
根据本发明的另一个实施方式的信号处理装置包括:获取对应于通过第一分组和针对该第一分组的外部分组而包括在一组中的多个数据的组基准值和对应于该组基准值的差值的值获取部,和利用所述组基准值和所述差值获取所述数据的数据获取部。
根据本发明的另一个实施方式的信号处理方法包括以下步骤:利用对应于通过第一分组和针对该第一分组的外部分组而包括在一组中的多个数据的组基准值和所述数据生成差值,和传送生成的差值。
并且,根据本发明的另一个实施方式的信号处理装置包括:利用对应于通过第一分组和针对该第一分组的外部分组而包括在一组中的多个数据的组基准值和所述数据生成差值的值生成部,和传送生成的差值的输出部。
6-3.至少利用数据分组的信号处理方法
对根据本发明的利用前述分组方案的信号处理方法和装置解释如下。
根据本发明的一个实施方式的信号处理方法包括以下步骤:获取对应于通过数据分组和针对该数据分组的内部分组而包括在一组中的多个数据的组基准值和对应于该组基准值的差值,和利用所述组基准值和所述差值获取所述数据。
在这种情况下,包括在内部分组中的数据的数量小于包括在内部分组中的数据的数量。并且,所述数据对应于参数。
对多个经数据分组的数据整体执行内部分组。在这种情况下,可以按照参数频带执行内部分组。
可以对多个经数据分组的数据部分执行内部分组。在这种情况下,可以按照多个经数据分组的数据中的每一个的信道执行内部分组。
组基准值可以包括导频基准值或者差基准值。
所述方法还可包括对组基准值和差值中的至少一个进行解码的步骤。在这种情况下,按组来确定导频基准值。
在频域上对数据执行数据分组和内部分组。
频域可以包括采样域、子频带域、混合域、参数频带域、数据频带域和信道域中的一个。在获取数据时,使用数据分组和内部分组中的至少一个的分组信息。
分组信息包括各组的位置、各组的数量、是否按组来应用组基准值、组基准值的数量、组基准值的编解码方案和是否获取组基准值中的至少一个。
根据本发明的一个实施方式的信号处理装置包括:获取对应于通过数据分组和针对该数据分组的内部分组而包括在一组中的多个数据的组基准值和对应于该组基准值的差值的值获取部,和利用所述组基准值和所述差值获取所述数据的数据获取部。
根据本发明的另一个实施方式的信号处理方法包括以下步骤:利用对应于通过数据分组和针对该数据分组的内部分组而包括在一组中的多个数据的组基准值和所述数据生成差值,和传送生成的差值。
并且,根据本发明的另一个实施方式的信号处理装置包括:利用对应于通过数据分组和针对该数据分组的内部分组而包括在一组中的多个数据的组基准值和所述数据生成差值的值生成部,和传送生成的差值的输出部。
[熵编码]
1.熵编码的概念
根据本发明的熵编码是指对数据编码的结果执行可变长度编码的过程。
通常,熵编码以统计方式处理具体数据的出现概率。例如,以向在概率上具有高出现频率的数据分配较少的比特而向在概率上具有低出现频率的数据分配较多的比特的方式在整体上提高传输效率。
并且,本发明是要提出一种高效的熵编码方法,它不同于普通的熵编码,与PBC编码和DIFF编码相互联系。
1-1.熵表
首先,需要针对熵编码的预定熵表。熵表被定义为码簿。并且,编码部和解码部使用同一表。
本发明提出一种熵编码方法和一种独特的熵表以有效处理各种类型的数据编码结果。
1-2.熵编码类型(1D/2D)
本发明的熵编码分类为两种类型。一种是通过一个熵表得出一个索引(索引1),而另一种是通过一个熵表得出两个相邻的索引(索引1和索引2)。前者称为“1D(一维)熵编码”,而后者称为“2D(二维)熵编码”。
图22是根据本发明的1D和2D熵表的示例图。参考图22,本发明的熵表基本上包括索引字段、长度字段和码字字段。
例如,如果通过前述的数据编码计算具体数据(例如导频基准值、差值等),对应的数据(对应于“索引”)具有通过熵表指定的码字。码字变成比特流然后被传送到解码部。
已经接收该码字的熵解码部确定已经用于对应的数据的熵表,然后得出利用该对应的码字的索引值和在所确定的表中配置该码字的比特长度。在这种情况下,本发明将码字表示为十六进制。
略去通过1D或2D熵编码得出的索引值的正号(+)或负号(-)。因此,需要在1D或2D熵编码完成后分配符号。
在本发明中,根据1D或2D对符号进行不同的分配。
例如,在1D熵编码的情况下,如果对应的索引不是“0”,分配并传送独立的1-比特符号比特(例如“bsSign”)。
在2D熵编码的情况下,由于连续地提取两个索引,以对该两个被提取的索引之间的关系进行编程的方式来确定是否要分配符号。在这种情况下,该程序使用这两个被提取的索引的相加的值、这两个被提取的索引之间的差值和相应的熵表内最大绝对值(lav)。与在简单的2D情形下分配给每个索引的符号位的情况相比,这可以减小传输比特的数量。
逐个导出索引的1D熵表可用于所有的数据编码结果。然而,每次导出两个索引的2D熵表则受限用于具体的情况。
例如,如果数据编码不是通过前述分组过程的一对,则2D熵表具有部分受限的应用。并且,2D熵表的使用对作为PBC编码的结果计算出的导频基准值是受限制的。
因此,如前述说明中所提到的,本发明的熵编码的特征在于以熵编码与数据编码结果相互联系的方式使用最高效的熵编码方案。这在下面详细解释。
1-3.2D方法(时间配对/频率配对)
图23是根据本发明的二维熵编码的两种方法的示例图。2D熵编码是用于导出彼此相邻的两个索引的过程。因此,2D熵编码可以根据两个相邻的索引的方向来区分。
例如,两个索引在频率方向上彼此相邻的情况称为“2D频率配对(此后缩写为“2D-FP”)。而两个索引在时间方向上彼此相邻的情况称为“2D时间配对(此后缩写为2D-TP)。”
参考图23,2D-FP和2D-TP能够分别配置独立的索引表。编码器需要根据数据解码的结果确定最高效的熵编码方案。
在后面的说明中解释高效地确定与数据编码相互联系的熵编码的方法。
1-4.熵编码信号处理方法
对根据本发明的利用熵编码处理信号的方法解释如下。
在根据本发明的一个实施方式的信号处理方法中,获取对应于多个数据的基准值和对应于该基准值的差值。随后,对差值进行熵解码。然后利用基准值和经熵解码的差值获取所述数据。
本方法还包括对基准值进行熵解码的步骤。并且,本方法还可包括利用经熵解码的基准值和经熵解码的差值获取数据的步骤。
本方法还可包括获取熵编码标识信息的步骤。并且,根据由熵编码标识信息指示的熵编码方案执行熵编码。
在这种情况下,熵编码方案是1D编码方案和多维编码方案(例如2D编码方案)中的一种。并且,多维编码方案是频率对(FP)编码方案和时间对(TP)编码方案中的一种。
基准值可以包括导频基准值和差基准值中的一种。
并且,该信号处理方法还可包括利用所述数据作为参数重构音频信号的步骤。
根据本发明的一个实施方式的信号处理装置包括:获取对应于多个数据的基准值和对应于所述基准值的差值的值获取部,对该差值进行熵解码的熵解码部,和利用所述基准值和所述经熵解码的差值获取所述数据的数据获取部。
在这种情况下,所述值获取部包括在前述比特流解复用部60中,并且所述数据获取部包括在前述数据解码部91或92之内。
根据本发明的另一个实施方式的信号处理方法包括以下步骤:利用对应于多个数据的基准值和所述数据生成差值,对所生成的差值进行熵编码,和输出经熵编码的差值。
在这情况下,对基准值进行熵编码。传送经熵编码的基准值。
本方法还包括生成用于熵编码的熵编码方案。并且,传送所生成的熵编码方案。
根据本发明的另一个实施方式的信号处理装置包括利用对应于多个数据的基准值和所述数据生成差值的值生成部,对所生成的差值进行熵编码的熵编码部,和输出经熵编码的差值的输出部。
在这种情况下,所述值生成部包括在前述数据编码部31或32之内。并且,所述输出部包括在前述比特流复用部50内。
根据本发明的另一个实施方式的信号处理方法包括以下步骤:获取对应于多个数据编码方案的数据,利用数据编码方案专有的熵表标识符针对包括在所述数据中的导频基准值和导频差值中的至少一个确定熵表,和利用所述熵表对所述导频基准值和所述导频差值中的至少一个进行熵解码。
在这种情况下,熵表标识符是导频编码方案、频率差分编码方案和时间差分编码方案中的一个专有的。
并且,熵表标识符是导频基准值和导频差值中的每一个专有的。
熵表专有于熵表标识符并包括导频表、频率差分表和时间差分表中的一个。
或者,熵表不专有于熵表标识符,而可以共享频率差分表和时间差分表中的一个。
对应于导频基准值的熵表能够使用频率差分表。在这种情况下,通过1D熵编码方案对导频基准值进行熵解码。
熵编码方案包括1D熵编码方案和2D熵编码方案。具体地说,2D熵编码方案包括频率对(2D-FP)编码方案和时间对(2D-TP)编码方案。
并且,本方法可以利用数据作为参数重构音频信号。
根据本发明的另一个实施方式的信号处理装置包括:获取对应于多个数据的导频基准值和对应于所述导频基准值的导频差值的值获取部,和对该导频差值进行熵解码的熵解码部。并且,所述装置还包括利用所述导频基准值和所述经熵解码的导频差值获取所述数据的数据获取部。
根据本发明的另一个实施方式的信号处理方法包括以下步骤:利用对应于多个数据的导频基准值和所述数据生成导频差值,对所生成的导频差值进行熵编码,和输出经熵编码的导频差值。
在这种情况下,用于熵编码的表可以包括导频专用表。
本方法还包括对导频基准值进行熵编码的步骤。并且,传送经熵编码的导频基准值。
本方法还包括生成用于熵编码的熵编码方案。并且,传送所生成的熵编码方案。
根据本发明的另一个实施方式的信号处理装置包括利用对应于多个数据的导频基准值和所述数据生成导频差值的值生成部,对所生成的导频差值进行熵编码的熵编码部,和传送经熵编码的导频差值的输出部。
2.与数据编码的关系
如前述说明中提到的,本发明提出三种数据编码方案。然而,不对根据PCM方案的数据执行熵编码。在下面的说明中解释PBC编码与熵编码之间的关系以及DIF编码与熵编码之间的关系。
2-1.PBC编码和熵编码
图24是根据本发明针对PBC编码结果的熵编码方案的图。
如前述说明中提到的,在PBC编码完成后,计算一个导频基准值和多个差值。并且,所有的导频基准值和差值都变成熵编码的目标。
例如,根据前述分组方法,确定将要应用PBC编码的组。在图24中,为便于解释,以时间轴上的对的情况和时间轴上的非对的情况作为例子。对在PBC编码完成之后的熵编码解释如下。
首先,解释对非对执行PBC编码的情形83。对成为熵编码目标的一个导频基准值执行1D熵编码,并可以对其余的差值执行1D熵编码或2D-FP熵编码。
具体地,由于在非对的情况下存在一个组用于时间轴上的一个数据集,不能执行2D-TP熵编码。即使执行2D-FP,在已经导出索引对之后也应该对不能配置成对的最后频带81a中的参数值执行1D熵编码。一旦确定了按照数据进行的熵编码方案,就利用相应的熵表生成码字。
由于本发明涉及到例如针对一个组生成一个导频基准值的情况,应当执行1D熵编码。然而,在本发明的另一实施方式中,如果从一组生成至少两个导频基准值,则可以对连续的导频基准值执行2D熵编码。
其次,随后解释对执行PBC编码的情形84。
对成为熵编码目标的一个导频基准值执行1D熵编码,并可以对其余的差值执行1D熵编码、2D-FP熵编码或2D-TP熵编码。
具体地,由于在对的情况下存在一个组用于时间轴上彼此相邻的两个数据集,可以执行2D-TP熵编码。即使执行2D-FP,在已经导出索引对之后也应该对不能配置成对的最后频带81b或81c中的参数值执行1D熵编码。然而,如在图24中可以确认的,在应用2D-TP熵编码的情况下,不存在不能配置成对的最后频带。
2-2.DIFF编码和熵编码
图25是根据本发明针对DIFF编码结果的熵编码方案的图。
如前述说明中提到的,在DIFF编码完成后,计算一个导频基准值和多个差值。并且,所有的导频基准值和差值都变成熵编码的目标。然而,在DIFF-DT的情况下,基准值可以不存在。
例如,根据前述分组方法,确定将要应用DIFF编码的组。在图25中,为便于解释,以时间轴上的对的情况和时间轴上的非对的情况作为例子。并且,图25示出了作为数据编码单元的数据集根据DIFF编码方向被区分为时间轴方向上的DIFF-DT和频率轴方向上的DIFF-DF的情况。
对在DIFF编码完成之后的熵编码解释如下。
首先,解释对非对执行DIFF编码的情形。在非对的情况下,一个数据集存在于时间轴上。并且,该数据集根据DIFF编码方向可以成为DIFF-DF或DIFF-DT。
例如,如果非对的一个数据集是DIFF-DF(85),则基准值成为第一频带82a中的参数值。针对该基准值执行1D熵编码,而对剩余的差值可以执行1D熵编码或2D-FP熵编码。
即,在DIFF-DF及非对的情况下,一个数据集的一组存在于时间轴上。因此,不能执行2D-TP熵编码。即使执行2D-FP,在已经导出索引对之后,也应该对不能配置成对的最后参数频带83a中的参数值执行1D熵编码。一旦针对各数据对编码方案进行解码,就利用相应的熵表生成码字。
例如,如果非对的一个数据集是DIFF-DT(86),由于在相应的数据集中不存在基准值,所以不执行“第一频带”处理。因此,可以对差值执行1D熵编码或2D-FP熵编码。
在DIFF-DT及非对的情况下,要求差值的数据集可以是未能配置成数据对的相邻数据集或另一音频帧中的数据集。
即,在DIFF-DT及非对的情况下(86),在时间轴上存在一个数据集的一组。因此,不能执行2D-TP熵编码。即使执行2D-FP,在已经导出索引对之后,也应该对未能配置成对的最后参数频带中的参数值执行1D熵编码。然而,例如图25只是示出不存在未能配置成对的最后频带的情况。
一旦针对各数据对编码方案进行解码,就利用相应的熵表生成码字。
其次,解释对成对执行DIFF编码的情形。当对成对执行数据编码时,两个数据集在时间轴上配置成一组。并且,该组中的每个数据集可以根据DIFF编码方向成为DIFF-DF或DIFF-DT。因此,它可以分类为配置成对的两个数据集都是DIFF-DF的情形(87)、配置成对的两个数据集都是DIFF-DT的情形,以及配置成对的两个数据分别具有不同的编码方向(例如DIFF-DF/DT或DIFF-DT/DF)的情形(88)。
例如,当配置成对的两个数据集都是DIFF-DT(即,DIFF-DF/DF)时(87),如果每个数据集是非配对的并且是DIFF-DF,如果全部可用的熵编码方案都可执行的话。
例如,在相应的数据集中的每个基准值成为第一频带82b或82c中的参数值并且对该基准值执行1D熵编码。并且,可以对剩余的差值执行1D熵编码或2D-FP熵编码。
即使在相应的数据集内执行2D-FP,在已经导出索引对之后,也应该对未能配置成对的最后频带83b或83c中的参数值执行1D熵编码。由于两个数据集配置成对,可以执行2D-TP熵编码。在这种情况下,顺序对从不包括相应数据集内的第一频带82b或82c的下一频带到最后频带范围的频带执行2D-TP熵编码。
如果执行2D-TP熵编码,则不生成未能配置成对的最后频带。
一旦确定各数据的熵编码方案,就利用相应的熵表生成码字。
例如,当配置成对的两个数据集都是DIFF-DT(即,DIFF-DT/DT)时(89),由于在相应的数据集中不存在基准值,不执行第一频带处理。并且,可以对每个数据集中的所有差值执行1D熵编码或2D-FP熵编码。
即使在相应的数据集内执行2D-FP,在已经导出索引对之后,也应该对未能配置成对的最后频带中的参数值执行1D熵编码。然而,图25示出了不存在未能配置成对的最后频带的情况。
由于两个数据集配置成一对,2D-TP熵编码是可执行的。在这种情况下,按顺序对相应数据集内的第一频带到最后频带范围内的频带执行2D-TP熵编码。
如果执行2D-TP熵编码,则不生成未能配置成对的最后频带。
一旦确定了各数据的熵编码方案,就利用相应的熵表生成码字。
例如,可以存在配置成对的两个数据分别具有不同的编码方向(即,DIFF-DF/DT或DIFF-DT/DF)的情形(88)。图25示出DIFF-DF/DT的示例。在这种情况下,基本对每个数据集都能够执行所有根据相应的编码类型的可应用的熵编码方案。
例如,在配置成对的两个数据集的DIFF-DF数据集中,对在具有相应数据集(DIFF-DF)中的基准值的第一频带82d内的参数值执行1D熵编码。并且,可以对剩余的差值执行1D熵编码或2D-FP熵编码。
即使在相应的数据集(DIFF-DF)内执行2D-FP,在已经导出索引对之后,也应该对未能配置成对的最后频带83d中的参数值执行1D熵编码。
例如,在配置成对的两个数据集的DIFF-DT数据集中,由于不存在基准值,所以不执行第一频带处理。并且,可以对相应数据集(DIFF-DT)中的所有差值执行1D熵编码或2D-FP熵编码。
即使在相应的数据集(DIFF-DT)内执行2D-FP,在已经导出索引对之后,也应该对未能配置成对的最后频带中的参数值执行1D熵编码。然而,图25示出未能配置成对的最后频带不存在的情况。
由于配置成对的两个数据集分别具有彼此不同的编码方向,所以2D-TP熵编码是可执行的。在这种情况下,按顺序对从不包括第一频带(包括第一频带82d)的下一频带到最后频带范围内的频带执行2D-TP熵编码。
如果执行2D-TP熵编码,则不生成未能配置成对的最后频带。
一旦确定了各数据的熵编码方案,就利用相应的熵表来生成码字。
2-3.熵编码和分组
如前述说明中提到的,针对2D-FP或2D-TP熵编码的情况,利用一个码字来提取两个索引。因此,这意味着针对熵编码执行分组方案。并且,这可以称为“时间分组”或“频率分组”。
例如,编码部在频率或时间方向上对在数据编码步骤中提取的两个索引进行分组。
随后,编码部利用熵表选择表示这两个分组的索引的一个码字,然后通过把所选择的码字包括于比特流中来传送它。
解码部接收由对包括于所述比特流中的两个索引进行分组而得到的的一个码字,然后利用所应用的熵表提取两个索引值。
2-4.利用数据编码和熵编码之间的关系的信号处理方法
对利用PBC编码与熵编码之间的关系和DIFF编码与熵编码之间的关系的根据本发明的信号处理方法的特征解释如下。
根据本发明的一个实施方式的信号处理方法包括以下步骤:获取差分信息,根据包括时间分组和频率分组的熵编码方案对所述差分信息进行熵编码,以及根据包括导频差分、时间差分和频率差分的数据解码方案对所述差分信息进行数据解码。并且,数据编码和熵编码之间的详细关系与前述说明相同。
根据本发明的另一个实施方式的信号处理方法包括以下步骤:获取数字信号,根据熵编码方案对所述数字信号进行熵解码,以及根据至少包括导频编码方案的多个数据编码方案中的一个对经熵解码的数字信号进行数据解码。在这种情况下,可以根据数据编码方案确定熵编码方案。
根据本发明的另一个实施方式的信号处理装置包括:获取数字信号的信号获取部,根据熵编码方案对所述数字信号进行熵解码的熵解码部,以及根据至少包括导频编码方案的多个数据编码方案中的一个对经熵解码的数字信号进行数据解码的数据解码部。
根据本发明的又一个实施方式的信号处理方法包括以下步骤:通过数据编码方案对数字信号进行数据编码,通过熵编码方案对经数据编码的数字信号进行熵编码,以及传送经熵编码的数字信号。在这种情况下,可以根据数据编码方案确定熵编码方案。
并且,根据本发明的又一个实施方式的信号处理装置包括:通过数据编码方案对数字信号进行数据编码的数据编码部,和通过熵编码方案对经数据编码的数字信号进行熵编码的熵编码部。并且,所述装置还可包括传送经熵编码的数字信号的输出部。
3.选择熵表
根据数据编码方案和成为熵编码目标的数据类型来自动确定用于熵编码的熵表。
例如,如果数据类型是CLD参数并且如果熵编码目标是导频基准值,设有表名“hcodPilot_CLD”的1D熵表用于熵编码。
例如,如果数据类型是CPC参数,如果数据编码是DIFF-DF,并且如果熵编码目标是第一频带值,则设有表名“hcodFirstband_CPC”的1D熵表用于熵编码。
例如,如果数据类型是ICC参数,如果数据编码方案是PBC,并且如果通过2D-TP执行熵编码,则设有表名“hcod2D_ICC_PC_TP_LL”的2D-PC/TP熵表用于熵编码。在这种情况下,在2D表名内的“LL”指示该表内的最大绝对值(此后缩写为“LAV”)。并且,将在后面解释最大绝对值(LAV)。
例如,如果数据类型是ICC参数,如果数据编码方案是DIF-DF,并且如果通过2D-FP执行熵编码,则设有表名“hcod2D_ICC_DF_FP_LL”的2D-FP熵表用于熵编码。
即,确定利用多个熵表中的哪一个来执行熵编码是非常重要的。并且,优选的是独立配置适于成为各熵目标的各数据的特性的熵表。
然而,可以共享使用针对具有彼此类似的属性的数据的熵表。作为代表示例,如果数据类型是“ADG”或“ATD”,可以应用CLD熵表。并且,可以对PBC编码的导频基准值应用“第一频带”熵表。
对利用最大绝对值(LAV)选择熵表的方法详细解释如下。
3-1.熵表的最大绝对值(LAV)
图26是解释根据本发明的选择熵表的方法的图。
图26中的(a)示出了多个熵表,并且图26中的(b)示出了用于选择这些熵表的表。
如前述说明中提到的,存在根据数据编码和数据类型的多个熵表。
例如,熵表可包括适用于数据类型为“xxx”情形下的熵表(例如表1到4)、适用于数据类型为“yyy”情形下的熵表(例如表5到8)、PBC专用熵表(例如表k到k+1)、转义(escape)熵表(例如表n-2~n-1)以及LAV索引熵表(例如表n)。
具体地说,尽管优选的是通过向能在相应数据中出现的每个索引设置码字来配置表,但如果这样的话,该表的大小会显著增加。并且,不便于管理不必需的或者几乎不出现的索引。在2D熵表的情形下,由于出现太多,这些问题带来更大的不便性。为解决这些问题,使用了最大绝对值(LAV)。
例如,如果对于具体数据类型(例如,CLD)的索引值的范围在“-X~+X”(X=15)之间,则在该范围内选择至少一个概率上具有高出现频率的LAV并将其配置成独立的表。
例如,在配置CLD熵表时,可以提供“LAV=3”的表、“LAV=5”的表、“LAV=7”的表或“LAV=9”的表。
例如,在图26的(a)中,可以将表-191a设置为“LAV=3”的CLD表,将表-291b设置为“LAV=5”的CLD表,将表-391c设置为“LAV=7”的CLD表,而将表-491d设置为“LAV=9”的CLD表。
偏离LAV表中的LAV范围的索引由转义熵表(例如表n-2~n-1)处理。
例如,在利用“LAV=7”的CLD表91c执行编码时,如果出现偏离最大值“7”的索引(例如8、9、...、15),则通过转义熵表(例如表n-2~n-1)单独处理相应的索引。
同样的,可以以CLD表相同的方式针对另一数据类型(例如ICC、CPC等)设定LAV表。然而,因为每个数据类型的范围不同,所以针对每个数据的LAV具有不同的值。
例如,在配置ICC熵表时,例如,可以提供“LAV=1”的表、“LAV=3”的表、“LAV=5”的表和“LAV=7”的表。在配置CPC熵表时,例如,可以提供“LAV=3”的表、“LAV=6”的表、“LAV=9”的表和“LAV=12”的表。
3-2.用于LAV索引的熵表
本发明应用LAV索引来选择利用LAV的熵表。
即,通过LAV索引区分如图26的(b)中所示的每个数据类型的LAV值。
具体地说,为选择最终使用的熵表,确认每个相应数据类型的LAV索引,然后确认对应于该LAV索引的LAV。最终确认的LAV值对应于前述熵表名的配置中的“LL”。
例如,如果数据类型是CLD参数,如果数据编码方案是DIFF-DF,如果通过2D-FP执行熵编码,并且如果“LAV=3”,则将具有表名“hcod2D_CLD_DF_FP_03”的熵表用于熵编码。
在确认每种数据类型的LAV索引时,本发明的特征在于针对LAV索引单独地使用熵表。这意味着将LAV索引本身作为熵编码的目标来处理。
例如,将图26的(a)中的表-n用作LAV索引熵表91e。这表示为表1
表1
LavIdx | 比特长度 | 码字[十六进制/二进制] |
0 | 1 | 0x0(0b) |
1 | 2 | 0x2(10b) |
2 | 3 | 0x6(110b) |
3 | 3 | 0x7(111b) |
该表意味着LAV索引值本身就使用频率而言在统计上是不同的。
例如,由于“LAV索引=0”具有最高的使用频率,对它分配一比特。并且,向具有次最高使用频率的“LAV索引=1”分配两比特。最后,向具有低使用频率的“LAV=2或3”分配三比特。
在不使用LAV索引熵表91e的情况下,每次使用LAV熵表时,应当传送2-比特标识信息来区分四种类型的LAV索引。
然而,如果使用本发明的LAV索引熵表91e,例如对具有至少60%使用频率的“LAV索引=0”的情形传送1-比特码字就足够了。因此,本发明能够提供比现有技术的方法更高的传输效率。
在这种情况下,将表1中的LAV索引熵表91e应用于四种类型的LAV索引的情形。并且,显然如果存在更多的LAV索引,则可以更加提高传输效率。
3-3.利用熵表选择的信号处理方法
对利用前述熵表选择的信号处理方法和装置解释如下。
根据本发明的一个实施方式的信号处理方法包括以下步骤:获取索引信息,对所述索引信息进行熵解码,以及标识对应于经熵解码的索引信息的内容。
在这种情况下,所述索引信息是用于具有概率的使用频率特性的索引的信息。
如前述说明中提到的,利用索引专用熵表91e对索引信息进行熵解码。
所述内容根据数据类型进行分类并用于数据解码。并且,所述内容可以成为分组信息。
所述分组信息是用于对多个数据进行分组的信息。
并且,熵表的索引是包括在所述熵表中的索引中的最大绝对值(LAV)。
此外,熵表用于对参数执行2D熵解码。
根据本发明的一个实施方式的信号处理装置包括:获取索引信息的信息获取部,对所述索引信息进行熵解码的解码部,和标识对应于经熵解码的索引信息的内容的标识部。
根据本发明的另一个实施方式的信号处理方法包括以下步骤:生成用于标识内容的索引信息,对所述索引信息进行熵编码,以及传送经熵编码的索引信息。
根据本发明的一个实施方式的信号处理装置包括:生成用于标识内容的索引信息的信息生成部,对所述索引信息进行熵编码的编码部,和传送经熵编码的索引信息的信息输出部。
根据本发明的另一个实施方式的信号处理方法包括以下步骤:获取差值和索引信息,对所述索引信息进行熵解码,标识对应于经熵解码的索引信息的熵表,以及利用所标识的熵表对所述差值进行熵解码。
随后,利用对应于多个数据的基准值和经解码的差值获取所述数据。在这种情况下,基准值可以包括导频基准值或者差基准值。
利用索引专用熵表对索引信息进行熵解码。并且,根据多个数据中的每个的类型对熵表进行分类。
所述数据为参数,并且该方法还包括利用所述参数重构音频信号的步骤。
在对所述差值进行熵解码的情况下,利用熵表对差值执行2D熵解码。
此外,本方法还包括以下步骤:获取基准值,和利用基准值专用的熵表对所述基准值进行熵解码。
根据本发明的另一个实施方式的信号处理装置包括:获取差值和索引信息的输入部,对所述索引信息进行熵解码的索引解码部,标识对应于经熵解码的索引信息的熵表的表标识部,和利用所标识的熵表对所述差值进行熵解码的数据解码部。
所述装置还包括:利用对应于多个数据的基准值和所述经解码的差值获取数据的数据获取部。
根据本发明的又一个实施方式的信号处理方法包括以下步骤:利用对应于多个数据的基准值和所述数据生成差值,利用熵表对所述差值进行熵编码,以及生成用于标识所述熵表的索引信息。
并且,本方法还包括以下步骤:对所述索引信息进行熵编码,以及传送经熵编码的索引信息和所述差值。
并且,根据本发明的另一个实施方式的信号处理装置包括:利用对应于多个数据的基准值和所述数据生成差值的值生成部,利用熵表对所述差值进行熵编码的值编码部,生成用于标识熵表的索引信息的信息生成部,和对所述索引信息进行熵编码的索引编码部。并且,本装置还包括传送经熵编码的索引信息和所述差值的信息输出部。
[数据结构]
对根据本发明包括与前述数据编码、分组和熵编码相关联的各种信息的数据结构解释如下。
图27是根据本发明的数据结构的层级图。
参考图27,根据本发明的数据结构包括报头100和多个帧101和102。对低帧101和102共同应用的配置信息包括在报头100中。并且,该配置信息包括用于前述分组的分组信息。
例如,分组信息包括第一时间分组信息100a、第一频率分组信息100b和信道分组信息100c。
此外,报头100内的配置信息称为“主配置信息”,而记录在帧中的信息部分称为“有效载荷”。
具体地说,在后面的说明中解释例如将本发明的数据结构应用于音频空间信息的情形。
首先,报头100内的第一时间分组信息100a成为标示一帧内的多个时隙的“bsFrameLength”字段。
第一频率分组信息100b成为标示一帧内的多个参数频带的“bsFreqRes”字段。
信道分组信息100c是指“OttmodeLFE-bsOttBands”字段和“bsTttDualmode-bsTttBandsLow”字段。“OttmodeLFE-bsOttBands”字段是标示应用于LFE信道的多个参数频带的信息。并且,“bsTttDualmode-bsTttBandsLow”字段是标示具有低频带和高频带的双模式内的低频带的多个参数频带的信息。然而,“bsTttDualmode-bsTttBandsLow”字段可以不归类为信道分组信息而归类为频率分组信息。
帧101和102中的每一个包括对帧内的全部组共同应用的帧信息(Frame Info)101a和多个组101b及101c。
帧信息101a包括时间选择信息103a、第二时间分组信息103b和第二频率分组信息103c。此外,帧信息101a称为应用于每个帧的“子配置信息”。
在后面的说明中详细地解释例如将本发明的数据结构应用于音频空间信息的情形。
帧信息101a中的时间选择信息103a包括“bsNumParamset”字段、“bsParamslot”字段和“bsDataMode”字段。
“bsNumParamset”字段是指示整个帧内存在的多个参数集的信息。
并且,“bsParamslot”字段是标示参数集所在的时隙位置的信息。
此外,“bsDataMode”字段是标示各参数集的编码和解码处理方法的信息。
例如,在特定参数集的“bsDataMode=0”(例如默认模式)的情况下,解码部以默认值替代相应的参数集。
在特定参数集的“bsDataMode=1”(例如,先前模式)的情况下,解码部保持先前参数集的解码值。
在特定参数集的“bsDataMode=2”(例如,内插模式)的情况下,”解码部通过参数集之间的内插计算相应的参数集。
最后,在特定参数集的“bsDataMode=3(例如读取模式)”的情况下,是指传送用于相应参数集的编码数据。因此,帧内的多个组101b和101c是配置有当“bsDataMode=3”(例如,读取模式)时被传送的数据的组。因此,编码部根据每个组中的编码类型信息对数据进行解码。
对根据本发明的一个实施方式的利用“bsDataMode”字段的信号处理方法和装置详细解释如下。
根据本发明的一个实施方式的利用“bsDataMode”字段的信号处理方法包括以下步骤:获取模式信息,根据所述模式信息指示的数据属性获取对应于多个数据的导频基准值和对应于所述导频基准值的导频差值,以及利用所述导频基准值和所述导频差值获取所述数据。
在这种情况下,所述数据为参数,并且该方法还包括利用所述参数重构音频信号的步骤。
如果模式信息指示读取模式,则获取导频差值。
所述模式信息还包括默认模式、先前模式和内插模式中的至少一个。
并且,按照组频带获取导频差值。
此外,所述信号处理方法利用第一参数(例如,dataset)来标识多个读取模式并利用第二参数(例如,setidx)来获取基于第一变量的导频差值。
根据本发明的一个实施方式的利用“bsDataMode”字段的信号处理装置包括:获取模式信息的信息获取部,根据所述模式信息指示的数据属性获取对应于多个数据的导频基准值和对应于所述导频基准值的导频差值的值获取部,和利用所述导频基准值和所述导频差值获取所述数据的数据获取部。
并且,所述信息获取部、值获取部和数据获取部设置在前述数据解码部91或92中。
根据本发明的另一个实施方式的利用“bsDataMode”字段的信号处理方法包括以下步骤:生成指示数据属性的模式信息,利用对应于多个数据的导频基准值和所述数据生成导频差值,以及传送所生成的差值。并且,本方法还包括对所生成的差值进行编码的步骤。
根据本发明的另一个实施方式的利用“bsDataMode”字段的信号处理装置包括:生成指示数据属性的模式信息的信息生成部,利用对应于多个数据的导频基准值和所述数据生成导频差值的值生成部,和传送所生成的差值的输出部。并且,所述值生成部设置在前述数据编码部31或32之内。
帧信息101a内的第二时间分组信息103b包括“bsDatapair”字段。“bsDatapair”字段是指明是否存在“bsDataMode=3”标示的数据集之间的对的信息。具体地说,通过“bsDatapair”字段将两个数据集分成一组。
帧信息101a内的第二频率分组信息包括“bsFreqResStride”字段。“bsFreqResStride”字段是要对被“bsFreqRes”字段不利地第一分组为第一频率分组信息100b的参数进行第二分组的信息。即,通过捆绑相当于“bsFreqResStride”字段标示的跨距的参数生成数据频带。因此,按照数据频带给出参数值。
组101b和101c中的每一个都包括数据编码类型信息104a、熵编码类型信息104b、码字104c和侧数据(side data)104d。
对例如将本发明的数据结构应用于音频空间信息的情形详细解释如下。
首先,组101b和101c中的每一个中的数据编码类型信息104a包括“bsPCMCoding”字段、“bsPilotCoding”字段、“bsDiffType”字段和“bdDifftimeDirection”字段。
“bsPCMCoding”字段是标识相应的组的数据编码是PCM方案还是DIFF方案的信息。
只有当“bsPCMCoding”字段标示PCM方案时,才由“bsPilotCoding”字段标示PBC方案的存在与否。
“bsDifftype”字段是标示当应用DIFF方案时的编码方向的信息。并且,“bsDiffType”字段标示“DF:DIFF-FREQ”或“DT:DIFF-TIME”。
并且,“bsDiffTimeDirection”字段是标示当“bsDiffType”字段为“DT”时时间轴上的编码方向是“FORWARD”还是“BACKWARD”的信息。
每个组101b和101c中的熵编码类型信息104b包括“bsCodingScheme”和“bsPairing”字段。
“bsCodingScheme”字段是标示熵编码是1D 还是2D的信息。
并且,“bsPairing”字段是当“bsCodingScheme”字段标示“2D”时标示提取两个索引的方向是频率方向(FP:频率配对)还是时间方向(TP:时间配对)的信息。
每个组101b和101c中的码字104c包括“bsCodeW”字段。并且,“bsCodeW”字段标示应用于熵编码的表上的码字。因此,大部分前述数据成为熵编码的目标。在这种情况下,它们由“bsCodeW”字段传送。例如,通过“bsCodeW”字段传送成为熵编码目标的PBC编码的导频基准值和LAV索引值。
每个组101b和101c中的侧数据104d包括“bsLsb”字段和“bsSign”字段。具体地说,侧数据104d包括被熵编码成不由“bsCodeW”字段以及“bsLsb”字段和“bsSign字段传送的其他数据。
“bsLsb“字段是应用于前述部分参数的字段并且只有在数据类型是“CPC”且在非粗量化时才传送的侧信息。
并且,“bsSign”字段是标示当应用1D熵编码时提取的索引的符号的信息。
此外,由PCM方案传送的数据包括在侧数据104d中。
对根据本发明的信号处理数据结构的特征解释如下。
首先,根据本发明的信号处理数据结构包括:具有包括至少每帧的导频编码信息的数据编码和熵编码信息中的至少一个的有效载荷部,以及具有所述有效载荷部的主配置信息的报头部。
主配置信息包括具有整个帧的时间信息的第一时间信息部和具有整个帧的频率信息的第一频率信息。
并且,所述主配置信息还包括具有对每帧包括多个数据的随机组进行内部分组的信息的第一内部分组信息部。
所述帧包括:具有数据编码信息和熵编码信息中的至少一个的第一数据部,以及具有用于所述第一数据部的子配置信息的帧信息部。
子配置信息包括具有整个组的时间信息的第二时间信息部。并且,子配置信息还包括具有用于对每组包括多个数据的随机组进行外部分组的信息的外部分组信息部。此外,所述子配置信息还包括具有对包括多个数据的随机组进行内部分组的信息的第二内部分组信息部。
最后,所述组包括具有用于数据编码方案的信息的数据编码信息、具有用于熵编码方案的信息的熵编码信息、对应于多个数据的基准值和具有利用所述基准值和所述数据生成的差值的第二数据部。
[针对对音频编码的应用(MPEG环绕声)]
对本发明的前述概念和特征进行统一的例子解释如下。
图28是根据本发明的一个实施方式的音频压缩和恢复装置的框图。
参考图28,根据本发明的一个实施方式的音频压缩和恢复装置包括音频压缩部105-400和音频恢复部500-800。
音频压缩部105-400包括下混合部105、核心编码部200、空间信息编码部300和复用部400。
并且,下混合部105包括信道下混合部110和空间信息生成部120。
在下混合部105中,信道混合部110的输入是N个多信道(X1、X2、......、XN)的音频信号和所述音频信号。
信道下混合部110输出下混合到数量比输入信道的数量少的信道中的信号。
下混合部105的输出被下混合至一个或两个信道、根据单独的下混合命令的特定数量个信道,或者根据系统实现而预设的特定数量个信道。
核心编码部200对信道下混合部110的输出即经下混合的音频信号执行核心编码。在这种情况下,核心编码以利用诸如离散转换方案等的各种转换方案压缩输出的方式来实现。
空间信息生成部120从多信道音频信号中提取空间信息。空间信息生成部120然后将提取的空间信息传送给空间信息编码部300。
空间信息编码部300对输入的空间信息执行数据编码和熵编码。空间信息编码部300执行PCM、PBC和DIFF中的至少一个。在某些情况下,空间信息编码部300还执行熵编码。空间信息解码部700执行的解码方案可以根据空间信息编码部300使用哪种数据编码方案来确定。并且,将在后面参考图29详细解释空间信息编码部300。
核心编码部200的输出和空间信息编码部300的输出被输入到复用部400。
复用部400将这两个输入复用为比特流,然后将该比特流传送到音频恢复部500到800。
音频恢复部500到800包括解复用部500、核心解码部600、空间信息解码部700和多信道生成部800。
解复用部500将接收到的比特流解复用成音频部和空间信息部。在这种情况下,音频部是压缩音频信号,而空间信息部是压缩空间信息。
核心解码部600接收来自解复用部500的压缩音频信号。核心解码部600通过对该压缩音频信号进行解码生成下混合音频信号。
空间信息解码部700接收来自解复用部500的压缩空间信息。空间信息解码部700通过对该压缩空间信息进行解码生成空间信息。
在这样做的时候,从接收的比特流中提取指示包括在图27中所示的数据结构中的各种分组信息和编码信息的标识信息。根据标识信息从至少一个或更多解码方案中选择具体解码方案。并且,根据所选择的解码方案通过对空间信息进行解码生成空间信息。在这种情况下,通过空间信息解码部700执行的解码方案可以根据空间信息编码部300使用哪种数据编码方案来确定。并且,将在后面参考图30详细解释空间信息解码部700。
多信道生成部800接收核心编码部600的输出和空间信息解码部160的输出。多信道生成部800根据接收到的这两个输出生成N个多信道Y1、Y2、......、YN的音频信号。
同时,音频压缩部105-400向音频恢复部500-800提供指示空间信息编码部300使用哪种数据编码方案的标识符。为准备上面解释的情形,音频恢复部500-800包括对标识信息进行解析的装置。
因此,空间信息解码部700根据音频压缩部105-400提供的标识信息确定解码方案。优选地,对空间信息解码部700设置了用于对指示编码方案的标识信息进行解析的装置。
图29是根据本发明的一个实施方式的空间信息编码部的详细框图,其中空间信息称为空间参数。
参考图29,根据本发明的一个实施方式的编码部包括PCM编码部310、DIFF(差分编码)部320和霍夫曼编码部330。霍夫曼编码部330对应于执行前述熵编码的一个实施方式。
PCM编码部310包括分组PCM编码部311和PCB部312。分组PCM编码部311对空间参数进行PCM编码。在某些情况下,分组PCM编码部311能够通过分组部对空间参数进行PCM编码。并且,PBC部312对空间参数执行前述PBC。
DIFF部320对空间参数执行前述DIFF。
具体地说,在本发明中,分组PCM编码部311、PBC部312和DIFF部320中的一个选择性地针对空间参数的编码进行操作。并且,其控制装置没有在图中单独示出。
由PBC部312执行的PBC已经在前述的说明中详细解释,因此在下面的说明中省略对它的解释。
对于PBC的另一个示例,对空间参数执行一次PBC。并且,还对第一PBC的结果执行N次(N>1)PBC。具体地说,对导频值或作为执行第一PBC的结果的差值执行至少一次PBC。在某些情况下,优选的是从第二PBC开始对仅除导频值外的差值执行PBC。
DIFF部320包括对空间参数执行DIFF_FREQ的DIFF_FREQ编码部321和对空间参数执行DIFF_TIME的DIFF_TIME编码部322和323。
在DIFF部320中,从包括DIFF_FREQ编码部321和DIFF_TIME编码部322和323的组中选择的一个来执行对输入的空间参数的处理。
在这种情况下,DIFF_TIME编码部被分类为对空间参数执行DIFF_TIME_FORWARD的DIFF_TIME_FORWARD部322和对空间参数执行DIFF_TIME_BACKWARD的DIFF_TIME_BACKWARD部323。
在DIFF_TIME编码部322和323中,DIFF_TIME_FORWARD部322和DIFF_TIME_BACKWARD部323中选择出的一个对输入的空间参数执行数据编码处理。此外,由DIFF部320的内部部件321、322和323的每一个执行的DIFF编码已经在前述的说明中详细解释,其解释在下面的说明中省略。
霍夫曼编码部330对PBC部312的输出和DIFF部320的输出中的至少一个执行霍夫曼编码。
霍夫曼编码部330包括逐个处理要进行编码和传输的数据的一维霍夫曼编码部(此后缩写为HUFF_1D部)331和以两个组合数据为单位处理要进行编码和传输的数据的二维霍夫曼编码部(此后缩写为HUFF_2D部)332和333。
在霍夫曼编码部330中的HUFF_1D部331和HUFF_2D部332和333中的选择的一个对输入执行霍夫曼编码处理。
在这种情况下,HUFF_2D部332和333被分类为对基于频率捆绑在一起的数据对执行霍夫曼编码的频率对二维霍夫曼编码部(此后缩写为HUFF_2D_FREQ_PAIR部)332和对基于时间捆绑在一起的数据对执行霍夫曼编码的时间对二维霍夫曼编码部(此后缩写为HUFF_2D_TIME_PAIR部)333。
在HUFF_2D部332和333中,HUFF_2D_FREQ_PAIR部332和HUFF_2D_TIME_PAIR部333中的选择的一个对输入执行霍夫曼编码处理。
由霍夫曼编码部330的内部部件331、332和333中的每一个执行的霍夫曼编码将在下面的说明中详细解释。
此后,将霍夫曼编码部330的输出与要被传送的分组PCM编码部311的输出复用。
在根据本发明的空间信息编码部中,把根据数据编码和熵编码生成的各种类型的标识信息插入到传输比特流中。并且,把传输比特流传送给图30中所示的空间信息解码部。
图30是根据本发明的一个实施方式的空间信息解码部的详细框图。
参考图30,空间信息解码部接收包括空间信息的传输比特流,然后通过对接收的传输比特流进行解码生成空间信息。
空间信息解码部700包括标识符提取部(标志解析部)710、PCM解码部720、霍夫曼解码部730和差分解码部740。
空间信息解码部的标识符解析部710从传输比特流中提取各种标识符,然后对提取的标识符进行解析。这意味着提取在图27的前述说明中提到的各种类型的信息。
空间信息解码部能够利用标识符解析部710的输出获知哪种类型的编码方案用于空间参数,然后确定对应于识别出的编码方案的解码方案。此外,标识符解析部710的执行也可以由前述的解复用部500来执行。
PCM解码部720包括分组PCM解码部721和基于导频的解码部722。
分组PCM解码部721通过对传输比特流执行PCM解码生成空间参数。在某些情况下,分组PCM解码部721通过对传输比特流执行解码生成分组的空间参数。
基于导频的解码部722通过对霍夫曼解码部730的输出执行基于导频的解码生成空间参数。这对应于霍夫曼解码部730的输出中包括导频值的情形。对于单独的例子,基于导频的解码部722能够包括导频提取部(未在图中示出)以直接从传输比特流中提取导频值。因此,利用由导频提取部提取的导频值和霍夫曼解码部730的输出的差值生成空间参数值。
霍夫曼解码部730对传输比特流执行霍夫曼解码。霍夫曼解码部730包括通过对传输比特流执行一维霍夫曼解码逐个输出数据值的一维霍夫曼解码部(此后缩写为HUFF_1D解码部)731和通过对传输比特流执行二维霍夫曼解码各输出一对数据值的二维霍夫曼解码部(此后缩写为HUFF_2D解码部)732和733。
标识符解析部710从传输比特流中提取指示霍夫曼解码方案指示为HUFF_1D还是HUFF_2D的标识符(例如,“bsCodingScheme”),然后通过对提取的标识符进行解析识别出所用的霍夫曼编码方案。因此,对应于每种情形的HUFF_1D或者HUFF_2D解码被确定为霍夫曼解码方案。
HUFF_1D解码部731执行HUFF_1D解码,HUFF_2D解码部732和733中的每一个执行HUFF_2D解码。
在传输比特流中霍夫曼编码方案是HUFF_2D的情况下,标识符解析部710还提取指示HUFF_2D方案是HUFF_2D_FREQ_PAIR还是HUFF_2D_TIME_PAIR的标识符(例如,“bsParsing”),然后对提取的标识符进行解析。因此,标识符解析部710能够识别出配置成一对的两个数据是基于频率还是时间捆绑在一起的。并且,对应于各自情况的频率对二维霍夫曼解码(此后缩写为HUFF_2D_FREQ_PAIR解码)和时间对二维霍夫曼解码(此后缩写为HUFF_2D_TIME_PAIR解码)中的一个被确定为霍夫曼解码方案。
在HUFF_2D解码部732和733中,HUFF_2D_FREQ_PAIR部732执行HUFF_2D_FREQ_PAIR解码,而HUFF_2D_TIME_PAIR部733执行HUFF_2D_FREQ_TIME解码。
霍夫曼解码部730的输出基于标识符解析部710的输出被传送给基于导频的解码部722或差分解码部740。
差分解码部740通过对霍夫曼解码部730的输出执行差分解码生成空间参数值。
标识符解析部710从传输比特流中提取指示DIFF方案是DIF还是的标识符(例如,“bsDiffType”),然后通过对提取的标识符进行解析识别出所使用的DIFF方案。因此,对应于各自的情况的DIFF_FREQ解码和DIFF_TIME解码中的一个被确定为差分解码方案。DIFF_FREQ解码部741执行DIFF_FREQ解码,而DIFF_TIME解码部742和743中的每一个都执行DIF_TIME解码。
在DIFF方案是DIFF_TIME的情况下,标识符解析部710还从传输比特流中提取指示DIFF_TIME是DIFF_TIME_FORWARD还是DIFF_TIME_BACKWARD的标识符(例如,“bsDiffTimeDirection”),然后对提取的标识符进行解析。
因此,能够识别出霍夫曼解码部730的输出是当前数据与前一数据之间的差值还是当前数据与下一数据之间的差值。对应于各自的情况的DIFF_TIME_FORWARD解码和DIFF_TIME_BACKWARD解码中的一个被确定为DIFF_TIME方案。
在DIFF_TIME解码部742和743中,DIFF_TIME_FORWARD部742执行DIFF_TIME_FORWARD解码,而DIFF_TIME_BACKWARD部743执行DIFF_TIME_BACKWARD解码。
对在空间信息解码部中基于标识符解析部710的输出确定霍夫曼解码方案和数据解码方案的过程解释如下。
例如,标识符解析部710读取指示在对空间参数进行编码时使用的是PCM和DIFF中的哪一个的第一标识符(例如,“bsPCMCoding”)。
如果第一标识符对应于指示PCM的值,标识符解析部710再读取指示对空间参数进行编码使用的是PCM和PBC中的哪一个的第二标识符(例如,“bsPilotCoding”)。
如果第二标识符对应于指示PBC的值,空间信息解码部执行对应于PBC的解码。
如果第二标识符对应于指示PCM的值,空间信息解码部执行对应于PCM的解码。
另一方面,如果第一标识符对应于指示DIFF的值,空间信息解码部执行对应于DIFF的解码处理。
在这种情况下,将表1中的LAV索引熵表91e应用于四种类型的LAV索引的情形。并且,显然如果存在更多的LAV索引,可以更加提高传输效率。
3-3.利用熵表选择的信号处理方法
对利用前述熵表选择的信号处理方法和装置解释如下。
根据本发明的一个实施方式的信号处理方法包括以下步骤:获取索引信息,对所述索引信息进行熵解码,以及标识对应于经熵解码的索引信息的内容。
在这种情况下,所述索引信息是用于具有概率的使用频率特性的索引的信息。
如前述说明中提到的,利用索引专用熵表91e对索引信息进行熵解码。
所述内容根据数据类型进行分类并用于数据解码。并且,所述内容可以成为分组信息。
所述分组信息是用于对多个数据进行分组的信息。
并且,熵表的索引是包括在所述熵表中的索引中的最大绝对值(LAV)。
此外,熵表用于对参数执行2D熵解码。
根据本发明的一个实施方式的信号处理装置包括:获取索引信息的信息获取部,对所述索引信息进行熵解码的解码部,和标识对应于经熵解码的索引信息的内容的标识部。
根据本发明的另一个实施方式的信号处理方法包括以下步骤:生成用于标识内容的索引信息,对所述索引信息进行熵解码,以及传送经熵解码的索引信息。
根据本发明的另一个实施方式的信号处理装置包括:生成用于标识内容的索引信息的信息生成部,对所述索引信息进行熵解码的解码部,和传送经熵解码的索引信息的信息输出部。
根据本发明的另一个实施方式的信号处理方法包括以下步骤:获取差值和索引信息,对所述索引信息进行熵解码,标识对应于经熵解码的索引信息的熵表,以及利用所标识的熵表对所述差值进行熵解码。
随后,利用对应于多个数据的基准值和经解码的差值来获取所述数据。在这种情况下,基准值可以包括导频基准值或者差基准值。
利用索引专用熵表对索引信息进行熵解码。并且,根据多个数据中的每一个的类型对熵表进行分类。
所述数据为参数,并且该方法还包括利用所述参数重构音频信号的步骤。
在对所述差值进行熵解码的情况下,利用熵表对差值执行2D熵解码。
此外,本方法还包括获取基准值和利用基准值专用的熵表对所述基准值进行熵解码的步骤。
根据本发明的另一个实施方式的信号处理装置包括:获取差值和索引信息的输入部,对所述索引信息进行熵解码的索引解码部,标识对应于经熵解码的索引信息的熵表的表标识部,和利用所标识的熵表对所述差值进行熵解码的数据解码部。
所述装置还包括:利用对应于多个数据的基准值和所述经解码的差值获取数据的数据获取部。
根据本发明的又一个实施方式的信号处理方法包括以下步骤:利用对应于多个数据的基准值和所述数据生成差值,利用熵表对所述差值进行熵编码,以及生成用于标识所述熵表的索引信息。
并且,本方法还包括以下步骤:对所述索引信息进行熵解码,和传送经熵解码的索引信息和所述差值。
并且,根据本发明的另一个实施方式的信号处理装置包括:利用对应于多个数据的基准值和所述数据生成差值的值生成部,利用熵表对所述差值进行熵编码的值编码部,生成用于标识熵表的索引信息的信息生成部,和对所述索引信息进行熵编码的索引编码部。并且,所述装置还包括传送经熵解码的索引信息和所述差值的信息输出部。
[数据结构]
对根据本发明包括与前述数据编码、分组和熵编码相关联的各种信息的数据结构解释如下。
图27是根据本发明的数据结构的层级图。
参考图27,根据本发明的数据结构包括报头100和多个帧101和102。对低帧101和102共同应用的配置信息通常包括在报头100中。并且,该配置信息包括用于前述分组的分组信息。
例如,分组信息包括第一时间分组信息100a、第一频率分组信息100b和信道分组信息100c。
此外,报头100内的配置信息称为“主配置信息”,而记录在帧中的信息部分称为“有效载荷”。
具体地说,在后面的说明中解释例如将本发明的数据结构应用于音频空间信息的情形。
首先,报头100内的第一时间分组信息100a成为标示一帧内的多个时隙的“bsFrameLength”字段。
第一频率分组信息100b成为标示一帧内的多个参数频带的“bsFreqRes”字段。
信道分组信息100c是指“OttmodeLFE-bsOttBands”字段和“bsTttDualmode-bsTttBandsLow”字段。“OttmodeLFE-bsOttBands”字段是标示应用于LFE信道的多个参数频带的信息。并且,“bsTttDualmode-bsTttBandsLow”字段是标示具有低频带和高频带的双模式内的多个低频带的参数频带的信息。而且,“bsTttDualmode-bsTttBandsLow”字段可以不归类为信道分组信息而归类为频率分组信息。
帧101和102中的每一个包括对帧内的全部组共同应用的帧信息(Frame Info)101a和多个组101b及101c。
帧信息101a包括时间选择信息103a、第二时间分组信息103b和第二频率分组信息103c。此外,帧信息101a称为应用于每个帧的“子配置信息”。
在后面的说明中详细解释例如将本发明的数据结构应用于音频空间信息的情形。
帧信息101a中的时间选择信息103a包括“bsNumParamset”字段、“bsParamslot”字段和“bsDataMode”字段。
“bsNumParamset”字段是指示整个帧内存在的多个参数集的信息。
并且,“bsParamslot”字段是标示参数集所在的时隙位置的信息。
此外,“bsDataMode”字段是标示各参数集的编码和解码处理方法的信息。
例如,针对特定参数集的“bsDataMode=0”(例如默认模式)的情况,解码部以默认值替代相应的参数集。
针对特定参数集的“bsDataMode=1”(例如,先前模式)的情况,解码部保持先前参数集的解码值。
针对特定参数集的“bsDataMode=2”(例如,内插模式)的情况,解码部通过参数集之间的内插计算相应的参数集。
最后,针对特定参数集的“bsDataMode=3”(例如,读取模式)的情况,意指传送用于相应参数集的编码数据。因此,在帧内的多个组101b和101c是配置有当“bsDataMode=3”(例如,读取模式)时被传送的数据的组。因此,编码部根据每个组中的编码类型信息对数据进行解码。
对根据本发明的一个实施方式的利用“bsDataMode”字段的信号处理方法和装置详细解释如下。
根据本发明的一个实施方式的利用“bsDataMode”字段的信号处理方法包括以下步骤:获取模式信息,根据所述模式信息指示的数据属性获取对应于多个数据的导频基准值和对应于所述导频基准值的导频差值,以及利用所述导频基准值和所述导频差值获取所述数据。
这里,所述数据为参数,并且该方法还包括利用所述参数重构音频信号的步骤。
如果模式信息指示读取模式,则获取导频差值。
所述模式信息还包括默认模式、先前模式和内插模式中的至少一个。
并且,按组频带获取导频差值。
此外,所述信号处理方法利用第一参数(例如,dataset)来标识多个读取模式,并利用第二参数(例如,setidx)来获取基于第一变量的导频差值。
根据本发明的一个实施方式的利用“bsDataMode”字段的信号处理装置包括:获取模式信息的信息获取部,根据所述模式信息指示的数据属性获取对应于多个数据的导频基准值和对应于所述导频基准值的导频差值的值获取部,和利用所述导频基准值和所述导频差值获取所述数据的数据获取部。
并且,所述信息获取部、值获取部和数据获取部设置在前述数据解码部91或92中。
根据本发明的另一个实施方式的利用“bsDataMode”字段的信号处理方法包括以下步骤:生成指示数据属性的模式信息,利用对应于多个数据的导频基准值和所述数据生成导频差值,以及传送所生成的差值。并且,本方法还包括对所生成的差值进行编码的步骤。
根据本发明的另一个实施方式的利用“bsDataMode”字段的信号处理装置包括:生成指示数据属性的模式信息的信息生成部,利用对应于多个数据的导频基准值和所述数据生成导频差值的值生成部,和传送所生成的差值的输出部。并且,所述值生成部设置在前述数据编码部31或32之内。
帧信息101a内包括的第二时间分组信息103b包括“bsDatapair”字段。“bsDatapair”字段是标示是否存在“bsDataMode=3”标示的数据集之间的对的信息。具体地说,通过“bsDatapair”字段将两个数据集分成一组。
帧信息101a内的第二频率分组信息包括“bsFreqResStride”字段。“bsFreqResStride”字段是要对被“bsFreqRes”字段不利地第一分组为第一频率分组信息100b的参数进行第二分组的信息。即,通过捆绑相当于“bsFreqResStride”字段标示的跨距的参数生成数据频带。因此,按数据频带给出参数值。
组101b和101c中的每一个都包括数据编码类型信息104a、熵编码类型信息104b、码字104c和侧数据(side data)104d。
对例如将本发明的数据结构应用于音频空间信息的情形详细解释如下。
首先,组101b和101c中的每一个中的数据编码类型信息104a包括“bsPCMCoding”字段、“bsPilotCoding”字段、“bsDiffType”字段和“bdDifftimeDirection”字段。
“bsPCMCoding”字段是标识相应的组的数据编码是PCM方案还是DIFF方案的信息。
只有当“bsPCMCoding”字段标示PCM方案时,才由“bsPilotCoding”字段标示PBC方案的存在与否。
“bsDifftype字段是标示当应用DIFF方案时的编码方向的信息。并且,“bsDiffType”字段标示“DF:DIFF-FREQ”或“DT:DIFF-TIME。”
并且,“bsDiffTimeDirection”字段是标示当“bsDiffType”字段为“DT”时时间轴上的编码方向是“FORWARD”还是“BACKWARD”的信息。
每个组101b和101c中的熵编码类型信息104b包括“bsCodingScheme”字段和“bsPairing”字段。
“bsCodingScheme”字段是标示熵编码是1D还是2D的信息。
并且,“bsPairing”字段是当“bsCodingScheme”字段标示“2D”时标示提取两个索引的方向是频率方向(FP:频率配对)还是时间方向(TP:时间配对)的信息。
每个组101b和101c中的码字104c包括“bsCodeW”字段。并且,“bsCodeW”字段标示应用于熵编码的表上的码字。因此,大部分前述数据成为熵编码的目标。在这种情况下,它们由“bsCodeW”字段传送。例如,通过“bsCodeW”字段传送成为熵编码的目标的PBC编码的导频基准值和LAV索引值。
每个组101b和101c中的侧数据104d包括“bsLsb”字段和“bsSign”字段。具体地说,侧数据104d包括被熵编码成不由“bsCodeW”字段以及“bsLsb”字段和“bsSign”字段传送的其他数据。
“bsLsb”字段是应用于前述部分参数的字段并且是只有在数据类型是“CPC”且在非粗量化时才传送的侧信息。
并且,“bsSign”字段是标示当应用1D熵编码时提取的索引的符号的信息。
此外,由PCM方案传送的数据包括在侧数据104d中。
对根据本发明的信息处理数据结构的特征解释如下。
首先,根据本发明的信号处理数据结构包括:具有包括至少每帧的导频编码信息和熵编码信息中的至少一个的有效载荷部,以及具有用于所述有效载荷部的主配置信息的报头部。
主配置信息包括具有整个帧的时间信息的第一时间信息部和具有整个帧的频率信息的第一频率信息。
并且,所述主配置信息还包括具有对每帧包括多个数据的随机组进行内部分组的信息的第一内部分组信息部。
所述帧包括:具有数据编码信息和熵编码信息中的至少一个的第一数据部,以及具有用于所述第一数据部的子配置信息的帧信息部。
子配置信息包括具有整个组的时间信息的第二时间信息部。并且,子配置信息还包括具有用于对每组包括多个数据的随机组进行外部分组的信息的外部分组信息部。此外,所述子配置信息还包括具有对包括多个数据的随机组进行内部分组的信息的第二内部分组信息部。
最后,所述组包括具有用于数据编码方案的信息的数据编码信息、具有用于熵编码方案的信息的熵编码信息、对应于多个数据的基准值,和具有利用所述基准值和所述数据生成的差值的第二数据部。
[针对音频编码的应用(MPEG环绕声)]
对本发明的前述概念和特征进行统一的例子解释如下。
图28是根据本发明的一个实施方式的音频压缩和恢复装置的框图。
参考图28,根据本发明的一个实施方式的音频压缩和恢复装置包括音频压缩部105-400和音频恢复部500-800。
音频压缩部105-400包括下混合部105、核心编码部200、空间信息编码部300和复用部400。
并且,下混合部105包括信息下混合部110和空间信息生成部120。
在下混合部105中,信道混合部110的输入是N个多信道(X1、X2、......、XN)的音频信号和所述音频信号。
信道下混合部110输出下混合到数量比输入的信道数量少的信道中的信号。
下混合部105的输出被下混合至一个或两个信道、根据单独的下混合命令的特定数量个信道,或者根据系统实现而预设的特定数量个信道。
核心编码部200对信道下混合部110的输出即经下混合的音频信号执行核心编码。在这种情况下,核心编码以利用诸如离散变换方案等的各种变换方案压缩输出的方式来实现。
空间信息生成部120从多信道音频信号中提取空间信息。空间信息生成部120然后将提取的空间信息传送给空间信息编码部300。
空间信息编码部300对输入的空间信息执行数据编码和熵编码。空间信息编码部300执行PCM、PBC和DIFF中的至少一个。在某些情况下,空间信息编码部300还执行熵编码。通过空间信息解码部700执行的解码方案可以根据空间信息编码部300使用哪种数据编码方案来确定。并且,将在后面参考图29详细解释空间信息编码部300。
核心编码部200的输出和空间信息编码部300的输出被输入到复用部400。
复用部400将这两个输入复用为比特流,然后将该比特流传送到音频恢复部500到800。
音频恢复部500到800包括解复用部500、核心解码部600、空间信息解码部700和多信道生成部800。
解复用部500把接收到的比特流解复用成音频部和空间信息部。在这种情况下,音频部是压缩音频信号,而空间信息部是压缩空间信息。
核心解码部600接收来自解复用部500的压缩音频信号。核心解码部600通过对该压缩音频信号进行解码生成下混合音频信号。
空间信息解码部700接收来自解复用部500的压缩空间信息。空间信息解码部700通过对该压缩空间信息进行解码生成空间信息。
在这样做的时候,从接收的比特流中提取指示包括在图27中所示的数据结构中的各种分组信息和编码信息的标识信息。根据标识信息从至少一个或更多解码方案中选择具体解码方案。并且,通过根据所选择的解码方案对空间信息进行解码生成空间信息。在这种情况下,通过空间信息解码部700执行的解码方案可以根据空间信息编码部300使用哪种数据编码方案来确定。并且,将在后面参考图30详细解释空间信息解码部700。
多信道生成部800接收核心编码部600的输出和空间信息解码部160的输出。多信道生成部800根据接收到的这两个输出生成N个多信道Y1、Y2、......、YN的音频信号。
同时,音频压缩部105-400向音频恢复部500-800提供指示空间信息编码部300使用哪种数据编码方案的标识符。为准备上面解释的情形,音频恢复部500-800包括对标识信息进行解析的装置。
因此,空间信息解码部700根据音频压缩部105-400提供的标识信息确定解码方案。优选的是,对空间信息解码部700设置了用于对指示编码方案的标识信息进行解析的装置。
图29是根据本发明的一个实施方式的空间信息编码部的详细框图,其中空间信息称为空间参数。
参考图29,根据本发明的一个实施方式的编码部包括PCM编码部310、DIFF(差分编码)部320和霍夫曼编码部330。霍夫曼编码部330对应于执行前述熵编码的一个实施方式。
PCM编码部310包括分组PCM编码部311和PCB部312。分组PCM编码部311对空间参数进行PCM编码。在某些情况下,分组PCM编码部311能够通过分组部对空间参数进行PCM编码。并且,PBC部312对空间参数执行前述PBC。
DIFF部320对空间参数执行前述DIFF。
具体地说,在本发明中,分组PCM编码部311、PBC部312和DIFF部320中的一个选择性地针对空间参数的编码进行操作。并且,其控制装置没有在图中单独示出。
由PBC部312执行的PBC已经在前述的说明中详细解释,因此在下面的说明中省略对它的解释。
对于PBC的另一个示例,对空间参数执行一次PBC。并且,还可以对第一PBC的结果执行N次(N>1PBC)。具体地说,对导频值或作为执行第一PBC的结果的差值执行至少一次PBC。在某些情况下,优选的是从第二PBC开始对仅除导频值外的差值执行PBC。
DIFF部320包括对空间参数执行DIFF_FREQ的DIFF_FREQ编码部321和对空间参数执行DIFF_TIME的DIFF_TIME编码322部和323。
在DIFF部320中,从包括DIFF_FREQ编码部321和编码部322和323的组中选择的一个执行对输入的空间参数的处理。
在这种情况下,DIFF_TIME编码部被分类为对空间参数执行DIFF_TIME_FORWARD的DIFF_TIME_FORWARD部322和对空间参数执行DIFF_TIME_BACKWARD的DIFF_TIME_BACKWARD部323。
在DIFF_TIME编码部322和323中,DIFF_TIME_FORWARD部322和DIFF_TIME_BACKWARD部323中选择出的一个对输入的空间参数执行数据编码处理。此外,由DIFF部320的每个内部部件321、322和323的每一个执行的DIFF编码已经在前述的说明中详细解释,在下面的说明中省略对它的解释。
霍夫曼编码部330对PBC部312的输出和DIFF部320的输出中的至少一个执行霍夫曼编码。
霍夫曼编码部330包括逐个处理要进行编码和传输的数据的1维霍夫曼编码部(此后缩写为HUFF_1D部)331处理和以两个组合数据为单位处理要进行编码和传输的数据的2维霍夫曼编码部(此后缩写为HUFF_2D部)332和333。
在霍夫曼编码部330中的HUFF_1D部331和HUFF_2D部332和333中选择的一个对输入执行霍夫曼编码处理。
在这种情况下,HUFF_2D部332和333被分类为对基于频率捆绑在一起的数据对执行霍夫曼编码的频率对2维霍夫曼编码部(此后缩写为HUFF_2D_FREQ_PAIR部)332和对基于时间捆绑在一起的数据对执行霍夫曼编码的时间对维霍夫曼编码部(此后缩写为HUFF_2D_TIME_PAIR部)333。
在HUFF_2D部332和333中,在HUFF_2D_FREQ_PAIR部332和HUFF_2D_TIME_PAIR部333中选择的一个对输入执行霍夫曼编码处理。
由霍夫曼编码部330的内部部件331、332和333中的每一个执行的霍夫曼编码将在下面的说明中详细解释。
此后,把霍夫曼编码部330的输出与要被传送的分组PCM编码部311的输出复用。
在根据本发明的空间信息编码部中,把根据数据编码和熵编码生成的各种类型的标识信息插入到传输比特流中。并且,传输比特流被传送给图30中所示的空间信息解码部。
图30是根据本发明的一个实施方式的空间信息解码部的详细框图。
参考图30,空间信息解码部接收包括空间信息的传输比特流,然后通过对接收的传输比特流进行解码生成空间信息。
空间信息解码部700包括标识符提取部(标志解析部)710、PCM解码部720、霍夫曼解码部730和差分解码部740。
空间信息解码部的标识符解析部710从传输比特流提取各种标识符,然后对提取的标识符进行解析。这意味着提取了在图27的前述说明中提到的各种类型的信息。
空间信息解码能够利用标识符解析部710的输出获知哪种类型的编码方案用于空间参数,然后确定对应于识别出的编码方案的解码方案。此外,标识符解析部710的执行也可以由前述的解复用部500来执行。
PCM解码部720包括分组PCM解码部721和基于导频的解码部722。
分组PCM解码部721通过对传输比特流执行PCM解码生成空间参数。在某些情况下,分组PCM解码部721通过对传输比特流执行解码生成分组部的空间参数。
基于导频的解码部722通过对霍夫曼解码部730的输出执行基于导频的解码生成空间参数。这对应于霍夫曼解码部730的输出中包括导频值的情形。对于单独的例子,基于导频的解码部722能够包括导频提取部(未在图中示出)以直接从传输比特流中提取导频值。因此,利用由导频提取部提取的导频值和霍夫曼解码部730的输出的差值来生成空间参数值。
霍夫曼解码部730对传输比特流执行霍夫曼解码。霍夫曼解码部730包括通过对传输比特流执行一维霍夫曼解码逐个输出数据值的一维霍夫曼解码部(此后缩写为HUFF_1D解码部)731和通过对传输比特流执行二维霍夫曼解码各输出一对数据值的二维霍夫曼解码部(此后缩写为HUFF_2D解码部)732和733。
标识符解析部710从传输比特流中提取指示霍夫曼解码方案指示为HUFF_1D还是HUFF_2D的标识符(例如,“bsCodingScheme”),然后通过对提取的标识符进行解析识别出所用的霍夫曼编码方案。因此,对应于每种情形的HUFF_1D或者HUFF_2D解码被确定为霍夫曼解码方案。
HUFF_1D解码部731执行HUFF_1D解码,HUFF_2D解码部732和733中的每一个执行HUFF_2D解码。
在传输比特流中霍夫曼编码方案是HUFF_2D的情况下,标识符解析部710还提取指示HUFF_2D方案是HUFF_2D_FREQ_PAIR还是HUFF_2D_TIME_PAIR的标识符(例如,“bsParsing”),然后对提取的标识符进行解析。因此,标识符解析部710能够识别出配置成一对的两个数据是基于频率还是时间捆绑在一起的。并且,对应于各自情况的频率对二维霍夫曼解码(此后缩写为HUFF_2D_FREQ_PAIR解码)和时间对二维霍夫曼解码(此后缩写为HUFF_2D_TIME_PAIR解码)中的一个被确定为霍夫曼解码方案。
在HUFF_2D解码部732和733中,HUFF_2D_FREQ_PAIR部732执行HUFF_2D_FREQ_PAIR解码,而HUFF_2D_FREQ_PAIR部733执行HUFF_2D_FREQ_PAIR解码。
基于标识符解析部710的输出把霍夫曼解码部730的输出传送给基于导频的解码部722或差分解码部740。
差分解码部740通过对霍夫曼解码部730的输出执行差分解码生成空间参数值。
标识符解析部710从传输比特流中提取指示DIFF方案是DIF还是DIF_TIME的标识符(例如,“bsDiffType”),然后通过对提取的标识符进行解析识别出所使用的DIFF方案。因此,对应于各自情况的DIFF_FREQ解码和DIFF_TIME解码中的一个被确定为差分解码方案。DIFF_FREQ解码部741执行DIFF_FREQ解码,而DIFF_TIME解码部742和743中的每一个都执行DIF_TIME解码。
在DIFF方案是DIFF_TIME的情况下,标识符解析部710还从传输比特流中提取指示DIFF_TIME是DIFF_TIME_FORWARD还是DIFF_TIME_BACKWARD的标识符(例如,“bsDiffTimeDirection”),然后对提取的标识符进行解析。
因此,能够识别出霍夫曼解码部730的输出是当前数据与前一数据之间的差值还是当前数据与下一数据之间的差值。对应于各自情况的DIFF_TIME_FORWARD解码和DIFF_TIME_BACKWARD解码中的一个被确定为DIFF_TIME方案。
在DIFF_TIME解码部742和743中,DIFF_TIME_FORWARD部742执行DIFF_TIME_FORWARD解码,而DIFF_TIME_BACKWARD部743执行DIFF_TIME_BACKWARD解码。
对在空间信息解码部中基于标识符解析部710的输出确定霍夫曼解码方案和数据解码方案的过程解释如下。
例如,标识符解析部710读取指示在对空间参数进行编码时使用的是PCM和DIFF中的哪一个的第一标识符(例如,“bsPCMCoding”)。
如果第一标识符对应于指示PCM的值,则标识符解析部710再读取指示对空间参数进行编码使用的是PCM和PBC中的哪一个的第二标识符(例如,“bsPilotCoding”)。
如果第二标识符对应于指示PBC的值,则空间信息解码部执行对应于PBC的解码。
如果第二标识符对应于指示PCM的值,则空间信息解码部执行对应于PCM的解码。
另一方面,如果第一标识符对应于指示DIFF的值,则空间信息解码部执行对应于DIFF的解码处理。
工作应用性
本领域的技术人员应当清楚,本发明的优选实施方式只是示例性的,并且在不脱离本发明的精神或范围的情况下可以对本发明的实施方式进行各种改进、变型、替换或添加。例如,根据本发明的分组、数据编码和熵编码可应用于各种应用和产品。此外,可以提供用于存储具有本发明的至少一个特征的数据的介质。
Claims (10)
1、一种信号处理方法,该方法包括以下步骤:
对从互联网协议网络上接收到的信号进行解封装;
从已解封装的信号获取对应于多个数据的导频基准值和对应于所述导频基准值的导频差值;以及
利用所述导频基准值和所述导频差值来获取所述数据。
2、根据权利要求1的方法,其中,所述方法还包括对所述导频基准值和所述导频差值中的至少一个进行解码的步骤。
3、根据权利要求1的方法,其中,所述数据为参数,并且所述方法还包括利用所获取的参数来重构音频信号的步骤。
4、根据权利要求3的方法,其中,所述参数包括信道电平差、信道间相干性和判决下混合增益中的至少一个。
5、根据权利要求1的方法,其中,所述导频基准值是所述多个数据的平均值、中间值、最频用值和默认值中的一个。
6、根据权利要求1的方法,其中,所述导频基准值是从表中提取的一个值。
7、根据权利要求1的方法,所述方法还包括在已对所述多个数据中的每一个设置了所述导频基准值之后选择具有最高编码效率的数据作为最终导频基准值的步骤。
8、一种信号处理装置,该装置包括:
对从互联网协议网络上接收到的信号进行解封装的管理器;
从已解封装的信号获取对应于多个数据的导频基准值和对应于所述导频基准值的导频差值的值获取部;以及
利用所述导频基准值和所述导频差值获取所述数据的数据获取部。
9、一种信号处理方法,该方法包括以下步骤:
利用对应于多个数据的导频基准值和所述数据来生成导频差值;和
将所生成的导频差值进行封装并通过互联网协议网络进行传送。
10、一种信号处理装置,该装置包括:
利用对应于多个数据的导频基准值和所述数据来生成导频差值的值生成部;和
将所生成的导频差值进行封装并通过互联网协议网络进行传送的管理器。
Applications Claiming Priority (18)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US72363105P | 2005-10-05 | 2005-10-05 | |
US60/723,631 | 2005-10-05 | ||
US60/725,654 | 2005-10-13 | ||
US60/726,228 | 2005-10-14 | ||
US60/729,713 | 2005-10-25 | ||
US60/730,393 | 2005-10-27 | ||
US60/730,394 | 2005-10-27 | ||
US60/737,760 | 2005-11-18 | ||
US60/752,911 | 2005-12-23 | ||
US60/753,408 | 2005-12-27 | ||
US60/758,238 | 2006-01-12 | ||
US60/758,231 | 2006-01-12 | ||
KR1020060004050 | 2006-01-13 | ||
KR1020060004049 | 2006-01-13 | ||
KR1020060030651 | 2006-04-04 | ||
KR1020060079836 | 2006-08-23 | ||
KR1020060079837 | 2006-08-23 | ||
KR1020060079838 | 2006-08-23 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101317216A true CN101317216A (zh) | 2008-12-03 |
Family
ID=40014917
Family Applications (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2006800372614A Pending CN101283401A (zh) | 2005-10-05 | 2006-10-04 | 信号处理的方法和装置以及编码和解码方法及其装置 |
CNA200680044918XA Pending CN101317215A (zh) | 2005-10-05 | 2006-10-04 | 信号处理方法和装置 |
CNA2006800449071A Pending CN101317214A (zh) | 2005-10-05 | 2006-10-04 | 信号处理方法和装置 |
CNA2006800449264A Pending CN101317216A (zh) | 2005-10-05 | 2006-10-04 | 信号处理方法和装置 |
Family Applications Before (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2006800372614A Pending CN101283401A (zh) | 2005-10-05 | 2006-10-04 | 信号处理的方法和装置以及编码和解码方法及其装置 |
CNA200680044918XA Pending CN101317215A (zh) | 2005-10-05 | 2006-10-04 | 信号处理方法和装置 |
CNA2006800449071A Pending CN101317214A (zh) | 2005-10-05 | 2006-10-04 | 信号处理方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (4) | CN101283401A (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3022919B1 (en) * | 2013-07-15 | 2021-05-05 | GE Video Compression, LLC | Layer characteristic signaling in multi-layered coding |
CN114040028B (zh) * | 2021-10-29 | 2023-11-24 | 深圳智慧林网络科技有限公司 | 一种基于三种模式的数据压缩方法和数据解压方法 |
CN114040172B (zh) * | 2021-11-22 | 2024-04-12 | 富盛科技股份有限公司 | 一种基于视频监控系统的车辆卡口数据融合传输方法及系统 |
-
2006
- 2006-10-04 CN CNA2006800372614A patent/CN101283401A/zh active Pending
- 2006-10-04 CN CNA200680044918XA patent/CN101317215A/zh active Pending
- 2006-10-04 CN CNA2006800449071A patent/CN101317214A/zh active Pending
- 2006-10-04 CN CNA2006800449264A patent/CN101317216A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
CN101317215A (zh) | 2008-12-03 |
CN101283401A (zh) | 2008-10-08 |
CN101317214A (zh) | 2008-12-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101356480B1 (ko) | 신호 처리 방법 및 장치 | |
CN100435506C (zh) | 音频数据编码转换发送方法以及编码转换接收方法、设备和系统 | |
CN105981318B (zh) | 广播信号发送装置、广播信号接收装置、广播信号发送方法和广播信号接收方法 | |
KR101835340B1 (ko) | 방송 신호 송신 장치, 방송 신호 수신 장치, 방송 신호 송신 방법, 및 방송 신호 수신 방법 | |
CN101288115A (zh) | 用于处理信号的方法和装置 | |
MX2008000122A (es) | Metodo y aparato para codificar y descodificar una senal de audio. | |
CN105765943B (zh) | 发送广播信号的装置、接收广播信号的装置、发送广播信号的方法和接收广播信号的方法 | |
CN106464944B (zh) | 广播信号发送设备、广播信号接收设备、广播信号发送方法以及广播信号接收方法 | |
CN107534798A (zh) | 广播信号发送设备、广播信号接收设备、广播信号发送方法和广播信号接收方法 | |
US20200177515A1 (en) | Apparatus for transmitting broadcast signal, apparatus for receiving broadcast signal, method for transmitting broadcast signal and method for receiving broadcast signal | |
Roumy et al. | Universal lossless coding with random user access: the cost of interactivity | |
EP2039155A1 (en) | Method for transforming terrestrial dmb contents and gateway employing the same | |
CN101317216A (zh) | 信号处理方法和装置 | |
CN1578457B (zh) | 个人视频加密系统和方法 | |
Moran et al. | An overview of the tactical secure voice cryptographic interoperability specification | |
KR102131835B1 (ko) | 방송 신호 송수신 장치 및 방법 | |
JP2015139008A (ja) | 暗号化装置、復号装置、暗号化プログラム、および復号プログラム | |
KR101453846B1 (ko) | 멀티 트랜스코딩 미디어 시스템 | |
KR20070041398A (ko) | 신호 처리 방법 및 신호 처리 장치 | |
KR20090000391A (ko) | 멀티 채널 오디오 신호의 부호화/복호화 방법 및 장치,그를 이용한 인터넷 프로토콜 디스플레이 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20081203 |