CN101361122B - 处理媒体信号的装置及其方法 - Google Patents

处理媒体信号的装置及其方法 Download PDF

Info

Publication number
CN101361122B
CN101361122B CN2007800016012A CN200780001601A CN101361122B CN 101361122 B CN101361122 B CN 101361122B CN 2007800016012 A CN2007800016012 A CN 2007800016012A CN 200780001601 A CN200780001601 A CN 200780001601A CN 101361122 B CN101361122 B CN 101361122B
Authority
CN
China
Prior art keywords
sound channel
signal
information
channel
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2007800016012A
Other languages
English (en)
Other versions
CN101361122A (zh
Inventor
吴贤午
房熙锡
金东秀
林宰显
郑亮源
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of CN101361122A publication Critical patent/CN101361122A/zh
Application granted granted Critical
Publication of CN101361122B publication Critical patent/CN101361122B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Stereophonic System (AREA)

Abstract

本发明公开了一种处理媒体信号的方法及其装置。根据本发明的媒体信号解码方法包括:检测将被生成的多声道中的具备有效值的声道,及由缩减混音信号和空间信息信号生成所述检测到的具备有效值的声道。因此,本发明检测将由传送到的媒体信号生成的声道中的哪个声道是被设置为虚拟值,并且省略用于生成设置为虚拟值的声道的解码,所以能减少解码操作量。

Description

处理媒体信号的装置及其方法
技术领域
本发明涉及媒体信号处理,具体而言,涉及一种处理媒体信号的方法及其装置。
背景技术
一般而言,对于媒体信号的情形,编码器是把多声道信号压缩至单声或立体声形态的缩减混音信号,而不是压缩每个多声道信号。然后,编码器把所压缩的缩减混音信号及空间信息或延伸数据(extension data)传输到解码器,或把它们存储在存储介质中。然后,解码器利用上述被压缩的缩减混音信号和空间信息,重建原始的多声道。
编码器和解码器基本上能压缩和重建的声道数是预先设定的。在N-M-N型的声道配置中,假设前一‘N’是指将被编码器传送的声道数,而‘M’则指被压缩的缩减混音信号数,而后一‘N’指将被解码器重建的声道数,那么,基本上编码器和解码器提供5-1-5声道配置,5-2-5声道配置,7-2-7声道配置,和7-5-7声道配置等。
在声道数小于编码器所支持的声道配置的情况下,声道先被映射为编码器所支持的声道结构,然后被编码。具体地,在输入到编码器的声道少于该编码器所支持声道的情形下,假设数量为可被编码器压缩的声道数和输入到编码器的声道数的差值的声道具有虚拟值,并基于上述假设执行编码。在这种情况下,编码器生成在解码器重建上述带虚拟值声道时所需的空间信息,并且把上述生成的空间信息传送到解码器。
发明内容
发明目的
本发明的一个目的是提供一种媒体信号处理方法和装置,通过利用上述方法和装置,在编码器想要传送的声道少于基本可压缩声道的情况下,不需传送重建声道所需的部分空间信息。
本发明的另一目的是提供一种媒体信号处理方法和装置,通过利用上述方法和装置,用于生成设置为虚拟值的声道的解码可被省略。
技术方案
本发明中,在编码器想要传送的声道少于基本可压缩声道的情况下,基本可压缩的声道数中减去将被传送的声道数所得到的声道数的声道值被设置为虚拟值,并且不传送重建具备虚拟值的声道所需的空间信息。
本发明中,解码器检测在将由传送到的媒体信号生成的声道中的哪个声道被设置为虚拟值,并且省略用于生成设置为虚拟值的声道的解码。
有益效果
如上文所述,根据本发明,当编码器传送比基本可压缩声道少的声道时,只生成并传送具备有效值声道所需的空间信息,因此,本发明能够防止不必要的比特传输。
根据本发明,解码器检测在将由传送到的媒体信号生成的声道中的哪个声道是有效的,然后只执行用于生成有效声道的解码。因此,本发明能够减少用于生成无效声道的解码操作量。
附图说明
图1是根据本发明一个实施例的由编码器传送到解码器的媒体信号的结构示意图。
图2是根据本发明一个实施例的包含编码器和解码器的媒体设备的框图。
图3是根据本发明一个实施例的缩减混音单元的框图。
图4是声道生成单元的框图。
图5是在解码器中判定有效声道的方法的框图。
具体实施方式
为了实现这些和其他的优点并根据本发明的目的,如同具体实施和广泛描述的,根据本发明的解码音频信号的方法包括:从将生成的多声道中检测具备有效值的声道,并由缩减混音信号和空间信息信号生成上述检测到的具备有效值的声道。
为了进一步实现这些和其他的优点并根据本发明的目的,根据本发明的解码音频信号的方法包括:从所接收的比特流中获取缩减混音了第一多声道音频信号和空间信息的缩减混音信号,由空间信息生成被修改的空间信息,和通过利用被修改的空间信息生成第二多声道。
为了进一步实现这些和其他的优点并根据本发明的目的,根据本发明的编码音频信号的方法包括:接收数量小于N值的声道,把数量为N值和接收到的声道数的差值的声道的值设置为虚拟值;对包含了具备虚拟值的声道的N个声道进行缩减混音。
为了进一步实现这些和其他的优点并根据本发明的目的,根据本发明的解码音频信号的装置包括:提取单元,用于提取缩减混音信号和空间信息信号;声道生成单元,其从将由空间信息信号中生成的多声道中检测具备有效值的声道,该声道生成单元还通过利用缩减混音信号和空间信息信号来生成上述检测到的具备有效值的声道。
为了进一步实现这些和其他的优点并根据本发明的目的,根据本发明的编码音频信号的装置包括:声道值设置单元,用于接收数量小于N的声道,该声道值设置单元把数量为N值和接收到的声道数的差值的声道的值设置为虚拟值;空间信息提取单元,用于生成空间信息信号,该空间信息信号包括表明N个声道中哪个对应于所接收到的声道的有效声道标志信息;和缩减混音单元,用于对包含了具备虚拟值的声道的N个声道进行缩减混音。
具体实施方式
下面详细参照本发明的较佳实施例,其实例示出于附图中。本发明涉及一种解码媒体信号的方法和装置。在这里,媒体信号包括音频信号或视频信号。
图1是根据本发明一个实施例的由编码器传送到解码器的媒体信号的结构示意图。
参照图1,媒体信号包括缩减混音信号101和空间信息信号103。缩减混音信号101是通过缩减混音多声道媒体信号而生成的信号。缩减混音信号101可由包含在编码器中的缩减混音单元(图中未示出)或人工方式生成。媒体信号以按帧排列的ES基本流(Elementary Stream)的形式存在。缩减混音信号101和空间信息信号103可分别以单独的ES形式传送到解码器。可选地,如图1所示,缩减混音信号101和空间信息信号103也可以被结合在一个ES形式中被传送到解码器。
当缩减混音多声道媒体信号时,提取空间信息信号103。空间信息信号103将被解码器用来从被压缩的缩减混音信号101中重建原始的多声道媒体信号。
编码器可以通过对输入其中的所有多声道媒体信号进行缩减混音以生成空间信息信号103。然而,如果输入到编码器的声道数少于编码器所支持的声道数的话,假设相应于编码器所支持的声道数量中减去输入声道数的结果数的声道具备虚拟值。而且,用于具备虚拟值的声道的空间信息信号103将不生成。即使生成了用于具备虚拟值的声道的空间信息信号103,其也不会被传送到解码器。此外,编码器能以简单的方式通过使用默认值或极端值,来表示用于具备虚拟值的声道的空间信息。
空间信息信号103可以包括空间参数,有效声道标志信息,树结构信息等。上述空间参数是表示多声道信号间关系的信息。空间参数包括:表示媒体信号之间的能量差的CLD(声道能级差),表示媒体信号间相似性或关联性的ICC(声道间相干),和表示利用不同信号预测媒体信号值的系数的CPC(声道预测系数)等。
在输入声道数少于该编码器的声道配置的声道数时,空间信息信号103包括表示输入到编码器的声道是具备有效值的声道,还是具备虚拟值的声道的信息,上述具备虚拟值的声道是为了支持编码器的基本配置而产生的。下文中,表示输入编码器的声道具有有效值而非虚拟值的信息被命名为有效声道标志信息。该有效声道标志信息可以被包含在空间信息信号103的头部105或空间帧107中。空间信息信号(103)是在缩减混音声道信号的过程中根据确定的树结构提取的信息。这里,确定的树结构是指解码器和编码器间达成协议的树结构。空间信息信号103可以包括树结构信息,树结构信息是表示树结构类型的信息。根据树结构类型,可以改变多声道的声道数量,每一声道的缩减混音顺序(per channel downmixsequence)等。
通过复用被编码的缩减混音信号101和空间信息信号103,编码器生成比特流类型的媒体信号,然后把生成的信号传送到解码器。
图2是根据本发明一个实施例的包含编码器和解码器的媒体设备的框图。
参照图2,媒体设备包括编码器和解码器。编码器包括缩减混音单元202,空间信息提取单元203,缩减混音信号编码单元205,空间信息编码单元207和复用单元209。而解码器则包括去复用单元211,缩减混音信号解码单元213,空间信息解码单元215,和声道生成单元217。
编码器的缩减混音单元202通过对多声道媒体信号201进行缩减混音生成两个或一个缩减混音信号,然后把生成的信号发送到缩减混音信号编码单元205。缩减混音信号编码单元205通过对该缩减混音信号进行编码而生成被编码的缩减混音信号,并把该被编码的缩减混音信号发送到复用单元209。
空间信号提取单元203通过从该多声道媒体信号201中提取空间参数以生成空间信息信号103。
编码器还可包括声道值设置单元(图中未示出),其设置在缩减混音单元202之前。声道值设置单元设置数量为编码器所支持的声道数减去输入声道数的声道的声道值为虚拟值。因为解码器不需要重建设置为虚拟值的声道,所以编码器不必为设置了虚拟值的声道生成空间信息。可选地,解码器能简单地把设置了虚拟值的声道的空间信息表示为默认值,极端值等。
空间信息提取单元为具备有效值的声道生成空间信息信号103,然后把该信号发送到空间信息编码单元207。这里,如同上文所述,空间信息信号103可以包括指示符,空间参数,声道配置标识符,被修改的空间信息信号类型等。
空间信息编码单元207通过编码空间信息信号103生成被编码的空间信息信号103,然后把生成的信号发送到复用单元209。
然后,通过对从缩减混音信号编码单元205接收到的被编码的缩减混音信号和从空间信息信号编码单元207接收到的被编码的空间信息信号103进行复用,复用单元209生成比特流类型的媒体信号210,然后把生成的信号发送到解码器。
其间,解码器接收从编码器传送来的比特流类型的媒体信号210或提取预先存储的媒体信号210。
包含在解码器中的去复用单元211把比特流类型的媒体信号210解析为被编码的缩减混音信号和被编码的空间信息信号,然后把被编码的缩减混音信号传送到缩减混音信号解码单元213,并把被编码的空间信息信号传送到空间信息解码单元215。
缩减混音信号解码单元213生成被解码的缩减混音信号,然后把生成的被解码的缩减混音信号发送到声道生成单元217。并且,空间信息解码单元215解码空间信息信号,并把被解码的空间信息信号发送到声道生成单元217。
解码单元可以包括被修改的空间信息信号生成单元(图中未示)。被修改的空间信息信号生成单元通过修改空间信息信号103,来生成被修改的空间信息信号。被修改的空间信息信号是指通过修改空间信息信号而新生成的空间信息信号。可以通过部分包含空间信息信号或组合空间信息信号来生成被修改的空间信息信号。被修改的空间信息信号生成单元能够利用树结构(tree structure)信息和输出声道信息等信息来生成被修改的空间信息信号。输出声道信息是指连接到解码器上的扬声器的信息,其可以包括输出声道数量,每一输出声道的位置信息等。输出声道信息可由制造商提前输入到解码器中或也可以由用户输入到解码器中。
解码器通过树结构信息识别由编码器缩减混音的原始多声道的数目,也识别将会生成的声道数目。解码器判断缩减混音的原始声道数是否等于将会生成的声道数目。下文中,编码器缩减混音的原始声道被称为第一多声道,而由解码器生成的声道则被称为第二多声道。如果由编码器缩减混音的第一多声道数不同于将被生成的第二多声道数,或者即使上述两声道数是相同的,但如果第一多声道和第二多声道中的具备有效值的声道数不同时,解码器可使用被修改的空间信息信号生成单元来修改空间信息信号。可利用与第二多声道的有效值的关联关系来生成被修改的空间信息信号。
解码器可通过对上述提到的空间参数CLD,ICC,CPC,IPD等进行组合来生成被修改的空间信息信号。具体来讲,如果第一多声道数小于第二多声道数,解码器可通过对传送到的空间参数进行组合,以生成数量小于第一多声道数的声道。例如,由编码器缩减混音5.1声道而生成的缩减混音信号能够被解码器扩展混音为2声道信号。解码器可以通过利用部分传送到的空间参数来生成被修改的空间参数。例如,缩减混音5.1声道而生成的缩减混音信号,通过利用部分被传送的参数,被扩展混音生成数量小于5.1声道的声道数的声道,因此解码器能够利用被修改的空间信息信号和缩减混音信号来生成第二多声道,上述第二多声道数和第一多声道数不相同。
声道生成单元217通过利用被解码的缩减混音信号和被解码的空间信息信号来重建多声道媒体信号219。解码器能判定由传送来的媒体信号210生成的多声道信号219中哪个是有效声道,而哪个是具备虚拟值的声道。解码器利用空间信息信号103判定有效声道的方法将在下文中通过参照图3至图5详细说明。解码器从利用空间信息信号103生成的多声道信号219中检测有效声道,然后可以只执行用于生成具备有效值的声道的解码。也就是说,解码器能够避免执行用于生成具备虚拟值的声道的解码。
下文将描述对数量小于解码器和编码器所支持的声道数的声道进行压缩,传送和重建的方法,其中,参照图3说明编码预处理和编码过程,参照图4和图5说明解码过程。
1.编码预处理
如果能被编码器和解码器基本压缩和重建的声道数量为N,输入的多声道媒体信号201包括的声道数可大于或小于N。如果输入的媒体信号201的声道数大于N,那么编码器和解码器可以有效地扩展声道结构,压缩并重建输入声道。如果媒体信号201的声道数小于N,对应于输入媒体信号201的声道数和N的差值的数量的声道值被设置为虚拟值。只有包括有效声道和具备虚拟值的声道的N声道配置被建立后,才能执行编码和解码。在这里,对应于输入媒体信号201的声道数和N的差值的数量的声道值可被设置为0。
将参照下文来说明编码预处理过程。图3是根据本发明一个实施例的缩减混音单元202的框图。
参照图3,编码器的缩减混音单元202包括第一到第五缩减混音单元。图中,编码器具备5.1声道结构。5.1声道结构包括前中置声道C,左前声道LF,右前声道RF,左环绕声道LS,右环绕声道RS,和低音(woofer)声道LFE(低频增强,low frequency enhancement)。在编码器具有5.1声道结构的情形下,声道数小于5.1声道的媒体信号应在编码之前先被映射到5.1声道结构。然后可以利用诸如5-1-5,5-2-5等树结构对媒体信号进行编码。按照图3,因为施加到编码器上的媒体信号201具有两个声道LF和RF,所以应该假定剩余的未使用声道,即,声道C,LFE,LS和RS具有虚拟值0。编码器对包括具有虚拟值的声道的6个声道执行编码。
2.编码
缩减混音单元202根据输入的多声道生成缩减混音信号。缩减混音单元202利用OTT(一至二)或TTT(二至三)盒,使得二声道变为单声道,或把三声道变为两声道。OTT或TTT盒是解码器利用缩减混音信号和空间信息重建原始的多声道时使用的假想盒。具体而言,接收自编码器的媒体信号先被去复用单元211解析为被编码的缩减混音信号101和被编码的空间信息信号103,被解码,然后发送到声道生成单元217。基于被解码的缩减混音信号101和被解码的空间信息信号103,通过利用OTT或TTT盒,声道生成单元217从一个输入信号输出两个信号或从两个输入信号输出三个信号以重建原始的多声道。解码媒体信号的装置的声道生成单元217中应用OTT或TTT盒,为之相对应地,编码媒体信号的装置的缩减混音单元202也使用OTT或TTT盒把输入的多声道缩减混音为一或两个信号。下文中,编码媒体信号的装置所使用的OTT或TTT盒被称作序数(ordinal-number)缩减混音单元,而被媒体信号解码器所使用的OTT或TTT盒则称作序数扩展混音单元。当输入声道经过缩减混音单元202时,空间信息提取单元203提取代表输入声道间关系的空间参数。为了方便说明,图3中,CLD表示为缩减混音单元提取的空间参数的例子,其并不表示对将提取的空间参数附加了限制。
下面将描述编码器传送用于有效声道或用于无效声道的空间参数值的方法。
2.1生成空间信息信号的方法。
2.1.1把空间参数值设置为最大或最小值的方法。
图3中,编码器输入所有的六个声道,该六个声道中包括经编码预处理后的具备虚拟值的声道。输入声道被施加到第三至第五缩减混音单元。第四和第五缩减混音单元把信号输入第二缩减混音单元,然后第二和第三缩减混音单元把信号输入到第一缩减混音单元。因为输入到第三和第五缩减混音单元的声道是为0值的虚拟声道,第三和第五缩减混音单元就不需要提取表示虚拟声道间关系的空间参数信息。第四缩减混音单元提取表示两声道LF和RF间关系的空间参数CLD4,第二缩减混音单元提取表示第四和第五缩减混音单元输出的信号间关系的空间参数CLD2,而第一缩减混音单元则提取表示第二和第三缩减混音单元输出的信号间关系的空间参数CLD1。由第一缩减混音单元提取的空间参数CLD1或由第二缩减混音单元提取的空间参数CLD2可以是在CLD值范围内的最大或最小值。具体而言,由第二缩减混音单元提取的空间参数CLD2是指由第四缩减混音单元输出的信号和由第五缩减混音单元输出的信号间的能量差异。第四缩减混音单元缩减混音后的信号具备有效值,而第五缩减混音单元缩减混音的信号则为0值。因此,能量(或等级)只依赖于从第四缩减混音单元输出的信号。假定CLD值的范围是在最大值150和最小值-150之间,那么按照被第四缩减混音单元缩减混音的信号,CLD2的值就会变为最大值150。同样地,按照第二缩减混音单元缩减混音的信号,CLD1的值也变为150。当缩减混音单元202缩减混音多声道时,空间信息提取单元203提取空间参数,然后利用提取到的空间参数生成空间信息信号103。通过把所有的提取的空间参数CLD1至CLD5的值包含在空间信息信号103中的方式,编码单元能把所有提取的空间参数CLD1至CLD5的值发送到解码单元。这里,因为能量只朝向两个信号中的其中一个信号,根据CLD1或CLD2等于150的事实,解码器能检测出多声道信号219中的哪一声道具有有效值。
空间信息信号103中包含了表示每一缩减混音单元提取的空间参数值是否等于先前参数值,是否等于差值,预先设定值,或新读入值的信息,按照上述方式,编码器把空间信息信号103发送到解码器。这里,如同前文所述,编码器使得上述表示空间参数值为新读入值的信息包含在空间信息信号103中,然后传送所有的空间参数值到解码器。这种情况下,发送用于生成无效声道的非必须的空间参数,会导致比特浪费。从而,为了能使空间信息信号103的比特尺寸(bit size)最小化,编码器可利用下述方法。
2.1.2把空间参数值设置为默认值的方法
通过发送表示空间参数值等于预先设定的默认值的信息的方式,编码器能省略对非必要的空间参数的发送。在这种情况下,通过把提取的空间参数值表示为默认值,编码器能避免通过以传送空间参数值的方式向解码器发送缩减混音具备虚拟值的声道时所提取的不必要的空间参数值。例如,在编码器和解码器设定CLD值为最大值150的情形为默认值1,而CLD值为0的情形设定为默认值0的情况下,通过传输表示CLD1和CLD2的值为默认值和该默认值为1的比特,而不是传送表示图3中的CLD1和CLD2的150的值的比特的话,编码器能减少空间信息信号103的比特尺寸。
2.1.3传送有效声道标志信息的方法
编码器可以通过只传送有效声道的空间参数来减少空间信息信号的比特尺寸。图3中,编码器可以只传送包含具备有效值的声道LF和RF所生成的参数CLD4的空间信息信号103,而不需把CLD3或CLD5包含在空间信息信号103中。在这种情况下,因为被应用到第三扩展混音单元(图中未示出)和第五扩展混音单元(图中未示出)的空间参数没有在编码器传送来的空间信息信号103中被找到,所以解码器判断其空间参数值无效。然后,解码器能够判断第三扩展混音单元和第五扩展混音单元的输出声道值为0。因此,在编码器传送只包含部分空间参数的空间信息信号103的情况下,为了使得解码器判定哪些为有效声道,编码器生成有效声道标志信息,并使生成的信息包含在空间信息信号103中,并把其传送到解码器。
有效声道标志信息是用于表示输入到编码器的声道是具备有效值的声道而不是具备虚拟值的声道的信息。对于生成有效声道标志信息的方法而言,可以考虑根据每一声道顺序来表示声道是否为有效声道的方法,或每一扩展混音单元是否生成相应于每一缩减混音单元的有效声道的方法。为了对应用的声道少于可压缩和可重建声道的情况做准备,编码器和解码器能相互约定一声道配置以用于输入声道小于编码器装置所支持的声道的情况,并且编码器把声道的声道配置通知给解码器。
下面参照图3来说明根据声道顺序来表示每一声道是否为有效声道的方法。按5-1-51声道配置的输入声道从上面包括:左前声道LF,右前声道RF,前中置声道C,低音声道LFE,左环绕声道LS和右环绕声道RS。因为声道LF或RF是有效声道,所以表示为1。因为剩余声道为虚拟声道,所以表示为0。因此,由上面可于声道顺序生成6位有效声道标志信息,比如110000。在表示每一扩展混音或缩减混音单元是否有效的方法中,按照第一到第五缩减混音单元的次序,编码器可以把使用缩减混音单元的情形表示为1,或把不使用缩减混音单元的情形表示为0。图3中,因为只有第四缩减混音单元被用来缩减混音两个声道LF和RF,通过利用5位节表示是否使用每一缩减混音单元,可以生成有效声道标志信息。编码器可传送声道配置标识符作为有效声道标志信息。下面结合表1说明按照编码器和解码器间根据声道组合预先确定声道配置的方法。
               [表1]
  声道配置标识符   输入及输出声道配置
  0(000)   单声
  1(001)   2(LF,RF)
  2(010)   3(LF,RF,C)
  3(011)   3.1(LF,RF,C,LFE)
  4(100)   4(LF,RF,LS,RS)
  5(101)   4.1(LF,RF,LS,RS)
  6(110)   5(LF,RF,C,LS,RS)
  7(111)   5.1
例如,对于5.1声道结构而言,5.1声道下的声道组合具有如表1所示的声道配置。编码器和解码器相互约定类似于表1所示的声道配置,根据输入声道数生成声道配置标识符,然后把该标识符传送到解码器。参照图3,因为应用到编码器的输入声道数为2,编码器可以通过传送声道配置标识符1(001)给解码器,来通知解码器有效声道是声道LF和RF。编码器可通过把有效声道标志信息包括在空间信息信号103的头部105或空间帧107中,把有效声道标志信息传送给解码器。如同前文所述,编码器有效地生成空间信息信号103,把该信号和缩减混音信号101一起传送到解码器或者与缩减混音信号101分开传送。
3.解码
3.1判断是否存在有效声道的方法
解码器通过利用从编码器传送的缩减混音信号101和空间信息信号103,或先前存储的缩减混音信号101和空间信息信号103,来重建输入到编码器的原始多声道媒体信号219。解码器从空间信息信号103中提取空间参数,然后把提取的空间参数应用到每一扩展混音单元以重建原始声道。解码器从空间信息信号103中提取用于表示被修改的空间信息信号类型的信息,然后由空间信息信号103来生成所识别类型的被修改的空间信息信号。被修改的空间信息的类型包括部分空间信息信号或扩展的空间信息信号。部分空间信息信号包括一部分空间参数,而扩展的空间信息则通过利用延展的空间信息信号和空间信息信号来生成的。如果空间信息信号103中包含用于识别被修改的空间信息信号类型的信号,解码器通过利用包含在空间信息信号103中的该信号修改空间信息信号103,以生成被修改的空间信息信号。然后利用被修改的空间信息信号以解码缩减混音信号。如果被修改的空间信息信号的类型是部分空间信息信号,解码器检测到小于解码器所支持的声道被重建。也就是说,解码器检测到具备虚拟值的声道可能被重建。解码器可以利用由编码器传送的空间信息信号103,来判断将被重建的声道中的哪个声道具备有效值。解码器从空间信息信号103中提取将被应用到各扩展混音单元的空间参数值,然后利用提取的空间参数值判断哪个将被重建的声道为有效声道。可选地,解码器也可以利用从空间信息信号103中提取的有效声道标志信息或声道配置标识符来判断将被重建的声道是否为有效声道。
参照图4,对5-1-51声道配置的解码器重建有效声道的方法进行说明。并且参照图5,来对5-1-52声道配置的解码器重建有效声道的方法进行说明。
图4是解码器的声道生成单元217的框图,该声道生成单元通过接收来自编码器的媒体信号来重建声道LF和RF,上述编码器包含缩减混音单元202。
参照图4,解码器从空间信息信号103中提取空间参数值,然后通过把提取的空间参数值应用到第一至第五扩展混音单元以重建原始信号。
对于每一空间帧107,解码器读取用于扩展混音单元的信息。该用于扩展混音单元的信息包括应用到每一扩展混音单元的空间参数值信息。空间参数值可以是默认值,等于先前参数值的值,内插值,或从空间信息信号103中新提取的编码值,如果该空间参数值是从空间信息信号103中提取的编码值的话,解码器提取空间参数值,解码该提取值,并且把解码后的值应用到每一扩展混音单元。
在图3中的编码器通过把缩减混音中提取的空间参数值CLD1至CLD5包含在空间信息信号103中,并把其传送到解码器的情况下,基于应用到第一扩展混音单元的CLD1和应用到第二扩展混音单元的CLD2为150的事实,解码器可以检测到第一和第二扩展混音单元令所有能量按照图中所示的箭头方向进行传输。
通过从空间信息信号103中提取的空间参数CLD4,然后把提取的CLD4应用到第四扩展混音单元,解码器可重建声道LF和RF。
基于能量不向第三扩展混音单元和第五扩展混音单元传输的事实,解码器能判断从第三至第五扩展混音单元输出的C,LFE,LS和RS声道的值为0。也就是说,通过利用应用到上级扩展混音单元的空间参数值,解码器可以判定从下级扩展混音单元的输出声道为0。因此,根据应用到上级扩展混音单元的空间参数值,可能就不需要应用到下级扩展混音单元的空间参数值。
如果编码器把空间参数值表示为默认值,并把其传送到解码器,解码器按照默认值把空间参数值应用到每一扩展混音单元,而不需重新读入空间参数值。图3中,因为CLD1和CLD2等于150,编码器就把其表示为默认值1,然后把其传送到解码器。图4中,解码器能够利用默认值1来检测到CLD1和CLD2等于150。通过利用把CLD1和CLD2值分别应用到第一和第二扩展混音单元,解码器检测到所有的能量都趋向上级方向,然后就能判定出具备有效值的特定声道和具备虚拟值的特定声道。
解码器能够利用空间信息信号103中包含的有效声道标志信息或声道配置标识符来判定特定的有效声道。
解码器可以利用按照每一声道顺序来用于表示该声道是否为有效声道的有效声道标志信息,或者也可以利用每一扩展混音单元是否生成有效声道的表示方法。图4中,根据按照各声道顺序表示特定声道的信息等于110000的事实,解码器可以检测到只有声道LF和RF是有效声道,而其他四个声道则为0值。而且,通过利用按照扩展混音单元的次序来表示信号是否被生成的有效声道标志信息00010,可以判断只有第四扩展混音单元被激活生成有效声道,而其它的扩展混音单元则没有生成有效声道,从而解码器能够判断有效声道为声道LF和RF。而且,因声道配置标识符等于1(001),基于这一点,解码器可以判断声道LF和RF是有效声道。
图5是在按5-1-52声道配置的解码器中判断有效声道的方法的框图。
参照图5,解码器从空间信息信号103中提取空间参数值,然后把该空间参数值应用到每一扩展混音单元。如果所提取的值为默认值的话,解码器使用对应于该默认值的空间参数值,并把使用值应用到每一扩展混音单元。
解码器可以利用提取的CLD1等于150或提取的CLD1的默认值等于1的事实,来判断从第一扩展混音单元输出的信号仅仅是趋向于向上的方向。解码器可以基于CLD2等于0或默认值等于0的事实来判定第二扩展混音单元的输出信号被分成两个信号。而且,解码器可以基于CLD4或CLD5等于150的事实,检测第四扩展混音单元的输出信号和第五扩展混音单元的输出信号是仅仅趋向于向上方向的。因此,解码器可以判断LF和RF声道是有效声道。如前文所述,通过利用包含在空间信息信号103中的有效声道标志信息,解码器可以判断哪个声道为有效声道。图5中,如果按照每一输出声道顺序表示的有效声道标志信息等于101000的话,解码器可以判定第一输出声道LF和第三输出声道RF为有效声道。如果按照每一输出扩展混音单元顺序表示的有效声道标志信息等于01000的话,基于检测到第二扩展混音单元生成有效声道,解码器可以判定LF和RF为有效声道。在声道配置标识符为1的情况下,通过利用上述声道配置标识符,解码器能够判定输出声道中的LF和RF声道是有效声道。
3.2省略对非有效声道进行解码的方法
在收到声道数小于原始声道配置的声道数的信号时,解码器能够根据原始声道配置执行解码,但在这样的情形下,解码器就会重建具备无效值的虚拟声道。如前文所述,对于被已判定为无效的声道,解码器省略一系列的解码过程,也就是说,使用去关联器生成非相关信号的过程,综合滤波器组(synthesisfilterbank)的过程,矩阵运算过程,系数生成过程等都可被省略。
3.3显示有效声道
解码器可以向用户或后处理设备显示多声道信号219中包含的声道是有效声道或是具备虚拟值的声道。解码器可以在重建多声道媒体信号219之前,利用上述方法来判断哪个声道为有效声道。上述内容并没有对本发明作出限制。可选地,解码器通过解码媒体信号210重建多声道媒体信号219,决定重建声道中的哪个是有效声道,然后对外显示上述结果。通过利用解码器输出的多声道媒体信号中的由解码器指明的有效声道,后处理设备能够根据用户的选择或后处理,比如声场表示等来执行缩减混音。

Claims (6)

1.一种用于编码音频信号的方法,包括:
将M个声道信号分配给N个声道,其中所述M个声道信号的声道数目小于所述N个声道的声道数目;
把所述N声道当中具备虚拟值的声道的能量级设置为0;以及
从具有N个声道的多声道音频信号生成缩减混音信号和空间信息。
2.根据权利要求1所述的方法,其中,与具备虚拟值的声道相关的空间信息在空间信息的范围内具有最大值或最小值。
3.根据权利要求1所述的方法,其中,与具备虚拟值的声道相关的空间信息具有默认值。
4.根据权利要求1所述的方法,其中,具备虚拟值的声道是利用包含在所述空间信息中的有效声道标志信息确定的。
5.根据权利要求4所述的方法,其中,所述有效声道标志信息包括表示将被生成的声道是否具备有效值的标识符、表示是否利用扩展混音单元通过把一个信号转换为两个信号或把两个信号转换为三个信号以从所述缩减混音信号生成多声道的信息、或表示所述具备有效值的声道的配置信息的信息。
6.一种用于编码音频信号的装置,包括:
声道值设置单元,用于将M个声道信号分配给N个声道并将所述N个声道当中未分配的声道的能量级设置为0,其中所述M个声道信号的声道数目小于所述N个声道的声道数目;
空间信息生成单元,用于从具有N个声道的音频信号生成空间信息信号;和
缩减混音单元,用于对所述的具有N个声道的音频信号进行缩减混音。
CN2007800016012A 2006-04-03 2007-04-02 处理媒体信号的装置及其方法 Active CN101361122B (zh)

Applications Claiming Priority (12)

Application Number Priority Date Filing Date Title
US78809206P 2006-04-03 2006-04-03
US60/788,092 2006-04-03
US78987406P 2006-04-07 2006-04-07
US60/789,874 2006-04-07
US79143206P 2006-04-13 2006-04-13
US60/791,432 2006-04-13
US83239006P 2006-07-21 2006-07-21
US60/832,390 2006-07-21
KR20060078300 2006-08-18
KR1020060078300 2006-08-18
KR10-2006-0078300 2006-08-18
PCT/KR2007/001602 WO2007114624A1 (en) 2006-04-03 2007-04-02 Apparatus for processing media signal and method thereof

Publications (2)

Publication Number Publication Date
CN101361122A CN101361122A (zh) 2009-02-04
CN101361122B true CN101361122B (zh) 2012-12-19

Family

ID=38563855

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007800016012A Active CN101361122B (zh) 2006-04-03 2007-04-02 处理媒体信号的装置及其方法

Country Status (5)

Country Link
EP (1) EP2002425B1 (zh)
JP (1) JP5113151B2 (zh)
KR (3) KR100904435B1 (zh)
CN (1) CN101361122B (zh)
WO (1) WO2007114624A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011027494A1 (ja) 2009-09-01 2011-03-10 パナソニック株式会社 デジタル放送送信装置、デジタル放送受信装置およびデジタル放送送受信システム
KR101218801B1 (ko) * 2009-12-21 2013-01-18 주식회사 인코렙 미디어 편집 장치, 미디어 편집 서비스 제공 방법, 및 이에 사용되는 웹서버
KR102381216B1 (ko) 2013-10-21 2022-04-08 돌비 인터네셔널 에이비 오디오 신호들의 파라메트릭 재구성
EP2866475A1 (en) * 2013-10-23 2015-04-29 Thomson Licensing Method for and apparatus for decoding an audio soundfield representation for audio playback using 2D setups

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5524054A (en) * 1993-06-22 1996-06-04 Deutsche Thomson-Brandt Gmbh Method for generating a multi-channel audio decoder matrix
CN1278996A (zh) * 1997-09-05 2001-01-03 雷克西康公司 5-2-5矩阵编码器和解码器系统
CN1669359A (zh) * 2002-07-12 2005-09-14 皇家飞利浦电子股份有限公司 音频编码

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3362476B2 (ja) * 1993-10-22 2003-01-07 ソニー株式会社 高能率符号化装置及びインタフェース装置
JPH11282496A (ja) * 1998-03-30 1999-10-15 Matsushita Electric Ind Co Ltd 復号装置
JP2000244431A (ja) * 1999-02-23 2000-09-08 Victor Co Of Japan Ltd 音声符号化装置
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
WO2005081229A1 (ja) * 2004-02-25 2005-09-01 Matsushita Electric Industrial Co., Ltd. オーディオエンコーダ及びオーディオデコーダ
RU2418385C2 (ru) * 2005-07-14 2011-05-10 Конинклейке Филипс Электроникс Н.В. Кодирование и декодирование звука

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5524054A (en) * 1993-06-22 1996-06-04 Deutsche Thomson-Brandt Gmbh Method for generating a multi-channel audio decoder matrix
CN1278996A (zh) * 1997-09-05 2001-01-03 雷克西康公司 5-2-5矩阵编码器和解码器系统
CN1669359A (zh) * 2002-07-12 2005-09-14 皇家飞利浦电子股份有限公司 音频编码

Also Published As

Publication number Publication date
JP5113151B2 (ja) 2013-01-09
WO2007114624A1 (en) 2007-10-11
KR100904435B1 (ko) 2009-06-24
KR20080037078A (ko) 2008-04-29
JP2009532735A (ja) 2009-09-10
EP2002425A4 (en) 2014-06-25
KR20070099456A (ko) 2007-10-09
EP2002425B1 (en) 2016-06-22
CN101361122A (zh) 2009-02-04
KR20080086549A (ko) 2008-09-25
EP2002425A1 (en) 2008-12-17

Similar Documents

Publication Publication Date Title
KR100904438B1 (ko) 오디오 신호의 처리 방법 및 장치
JP4601669B2 (ja) マルチチャネル信号またはパラメータデータセットを生成する装置および方法
JP5442995B2 (ja) マルチチャンネルオーディオ信号のエンコーディング/デコーディングシステム、記録媒体及び方法
US7797163B2 (en) Apparatus for processing media signal and method thereof
CN101297353B (zh) 编码和解码多声道音频信号的方法及其装置
CN101292428B (zh) 用于编码/解码的方法和装置
KR100880643B1 (ko) 오디오 신호의 디코딩 방법 및 장치
CN101361122B (zh) 处理媒体信号的装置及其方法
KR20070003544A (ko) 아비트러리다운믹스게인을 이용한 클리핑복원
KR20060122734A (ko) 공간 정보의 전송방법을 선택할 수 있는 오디오 신호의부호화-복호화방법
CN101800048A (zh) 基于dra编码器的多声道数字音频编码方法及其编码系统
CN101361114B (zh) 用于处理媒体信号的装置及其方法
CN101361275A (zh) 处理音频信号的方法和装置
CN102623040A (zh) 数据合成播放系统及数据合成播放方法
KR20070108313A (ko) 오디오 신호의 인코딩/디코딩 방법 및 장치
CN101930738A (zh) 多声道音频信号译码方法与装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant