CN1783728B - 通过使用空间信息来处理多声道音频信号的方法 - Google Patents

通过使用空间信息来处理多声道音频信号的方法 Download PDF

Info

Publication number
CN1783728B
CN1783728B CN2005101239025A CN200510123902A CN1783728B CN 1783728 B CN1783728 B CN 1783728B CN 2005101239025 A CN2005101239025 A CN 2005101239025A CN 200510123902 A CN200510123902 A CN 200510123902A CN 1783728 B CN1783728 B CN 1783728B
Authority
CN
China
Prior art keywords
signal
channel audio
audio signal
side information
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2005101239025A
Other languages
English (en)
Other versions
CN1783728A (zh
Inventor
金重会
高祥铁
李时和
吴殷美
苗磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Priority to CN201210008276.5A priority Critical patent/CN102568486B/zh
Publication of CN1783728A publication Critical patent/CN1783728A/zh
Application granted granted Critical
Publication of CN1783728B publication Critical patent/CN1783728B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]

Abstract

一种使用空间信息处理多声道音频信号的设备和方法。该设备包括:主编码单元,通过将空间信息应用于多声道音频信号中包括的环绕分量来将多声道音频信号下混合,使用多声道音频信号或下混合结果的立体声信号来产生边信息,对立体声信号和边信息编码,并将编码的结果作为编码信号发送;和主解码单元,接收编码信号,使用接收的编码信号对立体声信号和边信息解码,使用解码的边信息将解码的立体声信号上混合,并恢复多声道音频信号。

Description

通过使用空间信息来处理多声道音频信号的方法
本申请要求于2004年12月1日在韩国知识产权局提交的第2004-099741号韩国专利申请的利益,该申请公开于此以资参考。
技术领域
本发明涉及使用运动图像专家组(MPEG)标准等来进行的信号处理,更具体地讲,涉及一种通过使用空间信息来处理多声道音频信号的设备和方法。
背景技术
在处理音频信号的传统方法和设备中,当恢复多声道音频信号时采用仅使用技术心理声学编码(binaural cue coding,BCC)来恢复环绕(surround)分量的空间音频编码(SAC)。SAC公开于论文“低比特率的高质量参数空间音频编码(High-quality Parametric Spatial Audio Coding at Low Bitrates)”,116thAESconvention,Preprint,p.6072,BCC公开于论文“应用于立体声和多声道音频压缩的技术心理声学编码(Binaural Cue Coding Applied to Stereo andMulti-Channel Audio compression)”,112thAES convention,Preprint,p.5574。
在以上使用SAC的传统方法中,当立体声信号被下混合时,环绕分量消失。换句话说,下混合的立体声信号不包括环绕分量。因此,由于具有大量数据的边信息应该被发送以便当恢复多声道音频信号时恢复环绕分量,所以传统方法具有信道传输效率低的缺点。另外,由于消失的环绕分量被恢复,所以恢复的多声道音频信号的声音质量降低。
发明内容
本发明的一方面提供一种使用空间信息处理多声道音频信号的设备,该设备用于使用空间信息在多声道音频信号中包括的环绕分量的恢复期间对多声道音频信号编码,并对多声道音频信号解码。
本发明的一方面还提供一种使用空间信息处理多声道音频信号的方法,该方法使用空间信息在多声道音频信号中包括的环绕分量的恢复期间对多声道音频信号编码,并对多声道音频信号解码。
根据本发明的一方面,提供了一种使用空间信息处理多声道音频信号的设备和方法,该设备包括:主编码单元,通过将空间信息应用于多声道音频信号中包括的环绕分量来将多声道音频信号下混合,使用多声道音频信号或下混合结果的立体声信号来产生边信息,对立体声信号和边信息编码以产生编码的结果,并将编码的结果作为编码信号发送;和主解码单元,接收编码信号,使用接收的编码信号对立体声信号和边信息解码,使用解码的边信息将解码的立体声信号上混合,并恢复多声道音频信号。
根据本发明的另一方面,提供了一种在用于处理多声道音频信号的设备中执行的使用空间信息来处理多声道音频信号的方法,该设备具有对多声道音频信号编码的主编码单元和对多声道音频信号解码的主解码单元,该方法包括:通过将空间信息应用于多声道音频信号中包括的环绕分量来将多声道音频信号下混合,使用多声道音频信号或下混合结果的立体声信号来产生边信息,对立体声信号和边信息编码以产生编码的结果,并将编码的结果作为编码信号发送给主解码单元;和接收从主编码单元发送的编码信号,使用接收的编码信号对立体声信号和边信息解码,使用解码的边信息将解码的立体声信号上混合,并恢复多声道音频信号。
根据本发明的另一方面,提供了一种增加压缩效率的方法,包括:通过将空间信息应用于环绕分量来将包括环绕分量的多声道音频信号下混合,使用多声道音频信号或下混合结果的立体声信号来产生边信息,对立体声信号和边信息编码以产生编码的结果,并发送编码的结果;和接收编码结果,对接收的编码信号的立体声信号和边信息解码,使用解码的边信息将解码的立体声信号上混合以便恢复多声道音频信号。
根据本发明的另一方面,提供了一种多声道音频信号处理系统,包括:编码单元,通过将空间信息应用于环绕分量来将包括环绕分量的多声道音频信号下混合,使用多声道音频信号或下混合结果的立体声信号来产生边信息,对立体声信号和边信息编码以产生编码的信号;和解码单元,接收编码的信号,对接收的编码的信号解码以获得立体声信号和边信息,使用解码的边信息将解码的立体声信号上混合以产生环绕分量。
在下面的描述中将部分地阐明本发明另外的方面和/或优点,通过描述,其会变得更加清楚,或者通过实施本发明可以了解。
附图说明
通过下面结合附图进行的详细描述,本发明的这些和/或其他方面和优点将会变得清楚和更易于理解,其中:
图1是根据本发明实施例的用于处理多声道音频信号的设备的方框图;
图2是示出根据本发明实施例的用于处理多声道音频信号的方法的流程图;
图3是图1中示出的主编码单元的例子的方框图;
图4是示出图2中示出的操作20的例子的流程图;
图5表示可由本发明实施例处理的多声道音频信号;
图6是图3中示出的下混合器的例子的方框图;
图7是图1中示出的主解码单元的例子的方框图;
图8是图2中示出的操作22的例子的流程图;
图9是图7中示出的上混合器的例子的方框图;
图10是图3中示出的边信息产生器的例子的方框图;
图11是图9中示出的运算单元的例子的方框图;和
图12是图9中示出的运算单元的另一例子的方框图。
具体实施方式
现在对本发明实施例进行详细的描述,其示例表示在附图中,其中,相同的标号始终表示相同部件。下面通过参照附图对实施例进行描述以解释本发明。
图1是根据本发明实施例的用于处理多声道音频信号的设备的方框图。图1的设备包括主编码单元10和主解码单元12。
图2是示出根据本发明实施例的用于处理多声道音频信号的方法的流程图。图2的方法包括对多声道音频信号编码(操作20)和对编码的多声道音频信号解码(操作22)。
参照图1和图2,在操作20中,图1的主编码单元10通过将空间信息应用于通过输入端IN1输入的多声道音频信号中包括的环绕分量来将多声道音频信号下混合,使用立体声信号或多声道音频信号来产生边信息,对所述立体声信号和边信息编码,并将编码的结果作为编码信号发送给主解码单元12。所述立体声信号指的是将多声道音频信号下混合的结果。空间信息公开于“头部相关传输函数(HRTF)介绍(Introduction to Head-Related TransferFunctions(HRTF))”,Representations of HRTF in Time,Frequency,andSpace,107thAES convention,Preprint,p.50。
在操作20之后,在操作22中,主解码单元12接收从主编码单元10发送的编码信号,使用接收的编码信号对立体声信号和边信息解码,使用解码的边信息将解码的立体声信号上混合,恢复多声道音频信号,并通过输出端OUT1输出恢复的多声道音频信号。
以下,将参照附图来描述用于处理多声道音频信号的设备的各种示例性构造和用于处理多声道音频信号的方法各种示例性操作。
图3是图1中示出的主编码单元10的例子10A的方框图。主编码单元10A包括下混合器30、子编码器32、边信息产生器34、边信息编码器36和位打包单元38。
图4是示出图2中示出的操作20的例子20A的流程图。操作20A包括使用空间信息将多声道音频信号下混合(操作50),对立体声信号编码,产生边信息,对边信息编码(各自为操作52、54、和56),并将编码的结果进行位打包(操作58)。
参照图3和图4,在操作50中,图3的下混合器30通过将空间信息应用于通过输入端IN2输入的多声道音频信号中包括的环绕分量来将多声道音频信号下混合,如方程1中所示,并将下混合的结果作为立体声信号输出给子编码器32。
L m R m = W Σ i = 1 N f F i 0 F i 1 + Σ j = 1 N s [ H j ] S j 0 S j 1 - - - ( 1 )
其中,Lm和Rm分别是作为下混合的结果而获得的立体声信号的左分量和右分量,W可作为加权值而被预先确定和改变,Fi0和Fi1是通过输入端IN2输入的多声道音频信号中所包括的分量之中的非环绕分量,Si0和Si1是多声道音频信号中所包括的分量之中的环绕分量,Nf是非环绕分量中包括的声道的数量,Ns是环绕分量中包括的声道的数量,Fi0和Si0中的‘0’是左(L)[或右(R)]分量,Fi1和Si1中的‘1’是右(R)[或左(L)]分量,Hi是指示空间信息的空间滤波器的传递函数。
图5表示多声道音频信号。非环绕分量60、62和64以及环绕分量66和68包括在该多声道音频信号中。这里,标号69表示听者。
如在图5中所示,假设:多声道音频信号的非环绕分量60、62和64由包括左(L)声道60、右(R)声道64和中央(C)声道62的前分量组成,并且多声道音频信号中所包括的环绕分量由右环绕(RS)声道66和左环绕(LS)声道68组成。在这种情况下,方程1可简化为如方程2所示。
L m R m = W { L R + C C } + H 1 H 2 H 3 H 4 LS RS - - - ( 2 )
其中, L R + C C 是多声道音频信号中所包括的非环绕分量60、62和64, LS RS 是多声道音频信号中所包括的环绕分量66和68, H 1 H 2 H 3 H 4 是空间信息Hj
图6是图3中示出的下混合器30的例子30A的方框图。下混合器30A包括第一乘法器70和第二乘法器72以及合成器74。
参照图3、4和6,下混合器30A的第一乘法器70将通过输入端IN3输入的加权值与通过输入端IN4输入的多声道音频信号中所包括的非环绕分量相乘,并将相乘的结果输出给合成器74。在这种情况下,第二乘法器72将通过输入端IN4输入的多声道音频信号中所包括的环绕分量与空间信息相乘,并将相乘的结果输出给合成器74。合成器74合成由第一乘法器70和第二乘法器72乘出的结果,并通过输出端IN3将合成的结果作为立体声信号输出。
在操作50之后,在操作52中,子编码器32对从下混合器30输入的立体声信号编码,并将编码的立体声信号输出给位打包单元38。例如,子编码器32能够以MP3[或MPEG-1层3或MPEG-2层3]、MPEG4-高级音频编码(AAC)或MPEG4-比特分片算术编码(BSAC)格式将立体声信号编码。
在操作52之后,在操作54中,边信息产生器34使用从下混合器30输入的立体声信号或通过输入端IN2输入的多声道音频信号来从自位打包单元38输入的编码信号产生边信息,并将产生的边信息输出给边信息编码器36。稍后将详细描述边信息产生器34的实施例和在边信息产生器34中执行的边信息的产生。
在操作54之后,在操作56中,边信息编码器36对由边信息产生器34产生的边信息编码,并将编码的边信息输出给位打包单元38。为此,边信息编码器36能够量化由边信息产生器34产生的边信息,压缩量化的结果,并将压缩的结果作为编码的边信息输出给位打包单元38。
另一方面,与图4中不同,可当执行操作54和56时同时执行操作52,或者可在执行操作54和56之后执行操作52。
在操作58中,位打包单元38将由边信息编码器36编码的边信息和由子编码器32编码的立体声信号进行位打包,通过输出端OUT2将位打包的结果作为编码信号发送给主解码器12,并将位打包的结果输出给边信息产生器34。例如,位打包单元38顺序地重复执行下述操作:存储编码的边信息和编码的立体声信号,输出存储的编码的边信息;然后输出编码的立体声信号。换句话说,位打包单元38将编码的边信息与编码的立体声信号复用,并将复用的结果作为编码信号输出。
图7是图1中示出的主解码单元12的例子12A的方框图。主解码单元12A包括位解包单元90、子解码器92、边信息解码器94和上混合器96。
图8是示出图2中示出的操作22的例子22A的流程图。操作22A包括:对编码信号进行位解包(操作110)以及对位解包的立体声信号和位解包的边信息解码和使用边信息来将立体声信号上混合(各自为操作112和114)。
参照图3、7和8,在操作110中,图7的位解包单元90通过输入端IN5输入具有从主编码单元10发送的比特流形式的编码信号,接收该编码信号,对接收的编码信号进行位解包,将位解包的边信息输出给边信息解码器94,并将位解包的立体声信号输出给子解码器92。换句话说,位解包单元90对由图3的位打包单元38位打包的结果进行位解包。
在操作110之后,在操作112中,子解码器92对位解包的立体声信号解码并将解码的结果输出给上混合器96,边信息解码器94对位解包的边信息解码并将解码的结果输出给上混合器96。如上所述,当边信息编码器36量化边信息并压缩量化的结果时,边信息解码器94恢复边信息,将恢复的结果逆量化,并将逆量化的结果作为解码的边信息输出给上混合器96。
在操作112之后,在操作114中,上混合器96使用由边信息解码器94解码的边信息来混合由子解码器92解码的立体声信号,并通过输出端OUT4将上混合的结果作为恢复的多声道音频信号输出。
图9是图7中示出的上混合器96勺例子96A勺方框图。上混合器96A包括第三乘法器130和第四乘法器134、非环绕分量恢复单元132以及运算单元136。
参照图3、7和9,图9的第三乘法器130将通过输入端IN6从子解码器92输入的解码的立体声信号与逆空间信息G相乘,并将相乘的结果输出给运算单元136。这里,所述逆空间信息G是如方程3中所示的空间信息的逆矩阵,并且可根据再现由主解码单元12恢复的多声道音频信号的环绕而改变或者预先确定。
G=H-1                                                   (3)
非环绕分量恢复单元132从通过输入端IN6自子解码器92输入的解码的立体声信号产生非环绕分量,并将产生的非环绕分量输出给第四乘法器134。例如,当图3的下混合器30如方程2中所示将多声道音频信号下混合时,非环绕分量恢复单元132能够使用方程4来产生非环绕分量。
L ′ = L m ′
R ′ = R m ′
C ′ = L m ′ + R m ′ 2 - - - ( 4 )
其中,L′是由非环绕分量恢复单元132产生的非环绕分量之中的左(声道)分量;R′是由非环绕分量恢复单元132产生的非环绕分量之中的右(声道)分量;C′是由非环绕分量恢复单元132产生的非环绕分量之中的中央(声道)分量;Lm′是由图7的子解码器92解码的立体声信号中所包括的左(声道)分量;Rm′是所述立体声信号中所包括的右(声道)分量。
第四乘法器134将从非环绕分量恢复单元132输入的非环绕分量与逆空间信息G和加权值W相乘,并将相乘的结果输出给操作单元136。这里,图9的上混合器96A可不包括非环绕分量恢复单元132。在这种情况下,来自解码的立体声信号的不包括环绕分量的非环绕分量通过输入端IN7从外部直接输入至上混合器96A的第四乘法器134。
操作单元136使用第三乘法器130和第四乘法器134乘出的结果以及通过输入端IN8从边信息解码器94输入的解码的边信息来恢复多声道音频信号,并通过输出端OUT4输出恢复的多声道音频信号。
图10是图3中示出的边信息产生器34的例子34A的方框图。边信息产生器34A包括环绕分量恢复单元150和比率产生器152。
环绕分量恢复单元150从通过输入端IN9自位打包单元38输入的编码信号恢复环绕分量,并将恢复的环绕分量输出给比率产生器152。
为此,例如,如图10中所示,环绕分量恢复单元150被显示为可选地包括位解包单元160、子解码器162、边信息解码器164、和上混合器166。这里,位解包单元160、子解码器162、边信息解码器164和上混合器166执行与图7的位解包单元90、子解码器92、边信息解码器94和上混合器96相同的功能,因此,将省略对其的详细描述。
根据本发明的实施例,比率产生器152产生从环绕分量恢复单元150输出的恢复的环绕分量与通过输入端IN10输入的多声道音频信号的比率,并通过输出端OUT5将产生的比率作为边信息输出给边信息解码器36。例如,当图3中示出的下混合器30如先前描述的方程2中所示将多声道音频信号下混合时,比率产生器152可使用方程5来产生边信息。
SI = { LS ′ LS , RS ′ RS } - - - ( 5 )
其中,SI是由比率产生器152产生的边信息,LS'是由环绕分量恢复单元150恢复的,例如从上混合器166输出的,多声道音频信号中所包括的环绕分量之中的左分量,RS'是从上混合器166输出的恢复的多声道音频信号中所包括的环绕分量之中的右分量。
如方程5中所示由比率产生器152产生的边信息的比率可以是功率比或者是功率比和相位比二者。例如,比率产生器152可使用方程6或7来产生边信息。
SI = { | LS ′ | | LS | , | RS ′ | | RS | } - - - ( 6 )
其中,|LS'|是LS'的功率,|LS|是LS的功率,|RS'|是RS'的功率,|RS|是RS的功率。
SI = { | LS ′ | ∠ LS ′ | LS | ∠ LS , | RS ′ | ∠ RS ′ | RS | ∠ RS } - - - ( 7 )
其中,∠LS'是LS'的相位,∠LS是LS的相位,∠RS'是RS'的相位,∠RS是RS的相位。
另一方面,比率产生器152产生从环绕分量恢复单元150输出的恢复的环绕分量与通过输入端IN10从下混合器30输入的立体声信号的比率,并通过输出端OUT5将产生的比率作为边信息输出给边信息解码器36。例如,当图3中示出的下混合器30如方程2中所示将多声道音频信号下混合时,比率产生器152可使用方程8来产生边信息。
SI = { LS ′ L m , RS ′ R m } - - - ( 8 )
如方程8中所示由比率产生器152产生的边信息的比率可以是功率比或者是功率比和相位比二者。例如,比率产生器152可如方程9或10所示来产生边信息。
SI = { | LS ′ | | L m | , | RS ′ | | R m | } - - - ( 9 )
其中,|Lm|是Lm的功率,|Rm|是Rm的功率。
SI = { | LS ′ | ∠ LS ′ | L m | ∠ L m , | RS ′ | ∠ RS ′ | R m | ∠ R m } - - - ( 10 )
其中,∠Lm是Lm的相位,∠Rm是Rm的相位。
如上所述,当比率产生器152如方程10中所示通过使用恢复的环绕分量和多声道音频信号的比率来产生边信息时,现在将描述图9的运算单元136的结构和操作。
图11是图9中示出的运算单元136的例子136A的方框图。运算单元136A包括第一减法器170和第五乘法器172。
参照图3和图9-11,第一减法器170将通过输入端IN11输入的由图9的第三乘法器130乘出的结果减去通过输入端IN12输入的由第四乘法器134乘出的结果,并将相减的结果输出给第五乘法器172。在这种情况下,第五乘法器172将从第一减法器170输入的相减的结果乘以通过输入端IN13输入的由边信息解码器94解码的边信息,并通过输出端OUT6将相乘的结果作为恢复的多声道音频信号输出。
例如,当图3的下混合器30如方程2所示将多声道音频信号下混合时,从第五乘法器172输出的恢复的多声道音频信号的环绕分量可表示为方程11。
LS ′ ′ ′ RS ′ ′ ′ = SI ′ LS ′ ′ RS ′ ′ - - - ( 11 )
其中, LS ′ ′ ′ RS ′ ′ ′ 是从第五乘法器172输出的恢复的多声道音频信号的环绕分量,SI'是解码的边信息, LS ′ ′ RS ′ ′ 是从第一减法器170输出的相减的结果并且可表示为方程12。
LS ′ ′ RS ′ ′ = G L m ′ R m ′ - GW { L ′ R ′ + ′ ′ C ′ } - - - ( 12 )
其中, L m ′ R m ′ 是通过输入端IN6从子解码器92输入至第三乘法器130的解码的立体声信号。
当图10的比率产生器152通过使用恢复的环绕分量和从下混合器30输入的立体声信号的比率来产生边信息时,现在将描述图9的运算单元136的结构和操作。
图12是图9中示出的运算单元136的例子136B的方框图。运算单元136B包括第六乘法器190和第二减法器192。
参照图3、9、10和12,第六乘法器190将通过输入端IN14输入的由第三乘法器130乘出的结果乘以通过输入端IN15输入的由边信息解码器94解码的边信息,并将相乘的结果输出给第二减法器192。第二减法器192将由第六乘法器190乘出的结果减去通过输入端IN16输入的由第四乘法器134乘出的结果,并通过输出端OUT7将相减的结果作为恢复的多声道音频信号输出。
例如,当图3的下混合器30如方程2所示将多声道音频信号下混合时,恢复的多声道音频信号的环绕分量,即从第二减法器192输出的相减结果可表示为方程13。
LS ′ ′ ′ RS ′ ′ ′ = G × SI ′ × L m ′ R m ′ - G × W × LS ′ ′ RS ′ ′ - - - ( 13 )
其中, LS ′ ′ ′ RS ′ ′ ′ 是从第二减法器192输出的恢复的多声道音频信号的环绕分量, G × SI ′ × L m ′ R m ′ 是由第六乘法器190乘出的结果, G × W × LS ′ ′ RS ′ ′ 是由第四乘法器134乘出的结果, LS ′ ′ RS ′ ′ 与方程12中的 LS ′ ′ RS ′ ′ 相同。
在根据本发明上述实施例的使用空间信息处理多声道音频信号的设备和方法中,在使用恢复的立体声信号恢复非环绕分量之后,使用恢复的非环绕分量恢复环绕分量。因此,当恢复多声道音频信号时,可防止在一起恢复环绕分量和非环绕分量时发生串扰。
在根据本发明上述实施例的使用空间信息处理多声道音频信号的设备和方法中,由于空间信息包括在下混合的立体声信号中并且边信息基于用户的感知特性,例如使用功率比和相位比,而被产生,所以仅使用少量边信息就能够将多声道音频信号上混合,从主编码单元10向主解码单元12发送的边信息的数据量能够减少,信道的压缩效率,即传输效率,能够被最大化,由于与传统的空间音频编码(SAC)不同,环绕分量包括在立体声信号中,所以通过恢复的多声道音频信号仅使用立体声扬声器就能够获得多声道效果,从而提供真实的音质,传统的技术心理声学编码(BCC)可被取代,由于音频信号通过使用在考虑到多声道音频系统中扬声器的位置的情况下有效表达的逆空间信息来被解码,所以可提供最优音质并可防止发生串扰。
虽然已表示和描述了本发明的一些实施例,但本发明并不限于所描述的实施例。相反,本领域技术人员应该理解,在不脱离由权利要求及其等同物限定其范围的本发明的原理和精神的情况下,可以对这些实施例进行修改。

Claims (4)

1.一种在用于处理多声道音频信号的设备中执行的使用空间信息来处理多声道音频信号的方法,该设备具有对多声道音频信号编码的主编码单元和对多声道音频信号解码的主解码单元,该方法包括:
通过将空间信息应用于多声道音频信号中包括的环绕分量来将多声道音频信号下混合,使用多声道音频信号或下混合结果的立体声信号来产生边信息,对立体声信号和边信息编码以产生编码的结果,并将编码的结果作为编码信号发送给主解码单元;和
接收从主编码单元发送的编码信号,从接收的编码信号对立体声信号和与包括声道间的功率比的空间信息相应的边信息解码,使用解码的边信息和逆头部相关传输函数信息将解码的立体声信号上混合,并恢复多声道音频信号。
2.如权利要求1所述的方法,其中,下混合的步骤包括:
通过将空间信息应用于多声道音频信号的环绕分量来将多声道音频信号下混合,并确定下混合的结果作为立体声信号;
对立体声信号编码;
使用立体声信号或多声道音频信号从编码信号产生边信息;
对边信息编码;和
对编码的边信息和编码的立体声信号进行位打包并将位打包的结果作为编码信号发送给主解码单元。
3.如权利要求2所述的方法,其中,接收的步骤包括:
接收编码信号,对接收的编码信号进行位解包,并获得位解包的边信息和位解包的立体声信号;
对位解包的立体声信号解码并对位解包的边信息解码;和
使用解码的边信息将解码的立体声信号上混合,并确定上混合的结果作为恢复的多声道音频信号。
4.一种增加压缩效率的方法,包括:
通过将空间信息应用于环绕分量来将包括环绕分量的多声道音频信号下混合,使用多声道音频信号或下混合结果的立体声信号来产生边信息,对立体声信号和边信息编码以产生编码的结果,并发送编码的结果;和
接收编码的结果,从接收的编码的结果对立体声信号和与包括声道间的功率比的空间信息相应的边信息解码,使用解码的边信息和逆头部相关传输函数信息将解码的立体声信号上混合以便恢复多声道音频信号。
CN2005101239025A 2004-12-01 2005-11-22 通过使用空间信息来处理多声道音频信号的方法 Active CN1783728B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210008276.5A CN102568486B (zh) 2004-12-01 2005-11-22 通过使用空间信息来处理多声道音频信号的设备和方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR1020040099741 2004-12-01
KR10-2004-0099741 2004-12-01
KR1020040099741A KR100682904B1 (ko) 2004-12-01 2004-12-01 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법

Related Child Applications (2)

Application Number Title Priority Date Filing Date
CN201210008276.5A Division CN102568486B (zh) 2004-12-01 2005-11-22 通过使用空间信息来处理多声道音频信号的设备和方法
CN201210014602.3A Division CN102568487B (zh) 2004-12-01 2005-11-22 通过使用空间信息来处理多声道音频信号的设备和方法

Publications (2)

Publication Number Publication Date
CN1783728A CN1783728A (zh) 2006-06-07
CN1783728B true CN1783728B (zh) 2012-03-21

Family

ID=35788801

Family Applications (3)

Application Number Title Priority Date Filing Date
CN2005101239025A Active CN1783728B (zh) 2004-12-01 2005-11-22 通过使用空间信息来处理多声道音频信号的方法
CN201210008276.5A Active CN102568486B (zh) 2004-12-01 2005-11-22 通过使用空间信息来处理多声道音频信号的设备和方法
CN201210014602.3A Active CN102568487B (zh) 2004-12-01 2005-11-22 通过使用空间信息来处理多声道音频信号的设备和方法

Family Applications After (2)

Application Number Title Priority Date Filing Date
CN201210008276.5A Active CN102568486B (zh) 2004-12-01 2005-11-22 通过使用空间信息来处理多声道音频信号的设备和方法
CN201210014602.3A Active CN102568487B (zh) 2004-12-01 2005-11-22 通过使用空间信息来处理多声道音频信号的设备和方法

Country Status (5)

Country Link
US (4) US7961889B2 (zh)
EP (2) EP1667111A1 (zh)
JP (3) JP4921781B2 (zh)
KR (1) KR100682904B1 (zh)
CN (3) CN1783728B (zh)

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006126843A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding audio signal
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
WO2007013775A1 (en) * 2005-07-29 2007-02-01 Lg Electronics Inc. Mehtod for generating encoded audio signal and method for processing audio signal
JP5113049B2 (ja) * 2005-07-29 2013-01-09 エルジー エレクトロニクス インコーポレイティド 符号化されたオーディオ信号の生成方法及びオーディオ信号の処理方法
EP1932147A4 (en) * 2005-08-30 2011-03-30 Lg Electronics Inc AUDIO SIGNAL DECODING METHOD
US20080255857A1 (en) 2005-09-14 2008-10-16 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
WO2007080212A1 (en) * 2006-01-09 2007-07-19 Nokia Corporation Controlling the decoding of binaural audio signals
EP1974346B1 (en) * 2006-01-19 2013-10-02 LG Electronics, Inc. Method and apparatus for processing a media signal
US8160258B2 (en) * 2006-02-07 2012-04-17 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
DE602007004451D1 (de) * 2006-02-21 2010-03-11 Koninkl Philips Electronics Nv Audiokodierung und audiodekodierung
ATE527833T1 (de) 2006-05-04 2011-10-15 Lg Electronics Inc Verbesserung von stereo-audiosignalen mittels neuabmischung
US8027479B2 (en) 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
JP5238706B2 (ja) 2006-09-29 2013-07-17 エルジー エレクトロニクス インコーポレイティド オブジェクトベースオーディオ信号のエンコーディング/デコーディング方法及びその装置
CN101479787B (zh) * 2006-09-29 2012-12-26 Lg电子株式会社 用于编码和解码基于对象的音频信号的方法和装置
JP5232791B2 (ja) 2006-10-12 2013-07-10 エルジー エレクトロニクス インコーポレイティド ミックス信号処理装置及びその方法
JP5023662B2 (ja) 2006-11-06 2012-09-12 ソニー株式会社 信号処理システム、信号送信装置、信号受信装置およびプログラム
JP4838361B2 (ja) 2006-11-15 2011-12-14 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及びその装置
WO2008069584A2 (en) 2006-12-07 2008-06-12 Lg Electronics Inc. A method and an apparatus for decoding an audio signal
WO2008069597A1 (en) 2006-12-07 2008-06-12 Lg Electronics Inc. A method and an apparatus for processing an audio signal
EP2097895A4 (en) * 2006-12-27 2013-11-13 Korea Electronics Telecomm DEVICE AND METHOD FOR ENCODING AND DECODING MULTI-OBJECT AUDIO SIGNAL WITH DIFFERENT CHANNELS WITH INFORMATION BIT RATE CONVERSION
US8634577B2 (en) * 2007-01-10 2014-01-21 Koninklijke Philips N.V. Audio decoder
JP2010518460A (ja) * 2007-02-13 2010-05-27 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
CN103299363B (zh) * 2007-06-08 2015-07-08 Lg电子株式会社 用于处理音频信号的方法和装置
RU2473139C2 (ru) * 2007-10-16 2013-01-20 Панасоник Корпорэйшн Устройство объединения потоков, модуль и способ декодирования
MX2010004220A (es) * 2007-10-17 2010-06-11 Fraunhofer Ges Forschung Codificacion de audio usando mezcla descendente.
US20100228554A1 (en) * 2007-10-22 2010-09-09 Electronics And Telecommunications Research Institute Multi-object audio encoding and decoding method and apparatus thereof
KR101505831B1 (ko) * 2007-10-30 2015-03-26 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 방법 및 장치
KR100971700B1 (ko) 2007-11-07 2010-07-22 한국전자통신연구원 공간큐 기반의 바이노럴 스테레오 합성 장치 및 그 방법과,그를 이용한 바이노럴 스테레오 복호화 장치
WO2009068085A1 (en) * 2007-11-27 2009-06-04 Nokia Corporation An encoder
KR101227932B1 (ko) * 2011-01-14 2013-01-30 전자부품연구원 다채널 멀티트랙 오디오 시스템 및 오디오 처리 방법
KR20140037118A (ko) * 2011-06-07 2014-03-26 삼성전자주식회사 오디오 신호 처리방법, 오디오 부호화장치, 오디오 복호화장치, 및 이를 채용하는 단말기
KR20130093798A (ko) * 2012-01-02 2013-08-23 한국전자통신연구원 다채널 신호 부호화 및 복호화 장치 및 방법
EP2803066A1 (en) * 2012-01-11 2014-11-19 Dolby Laboratories Licensing Corporation Simultaneous broadcaster -mixed and receiver -mixed supplementary audio services
KR102131810B1 (ko) * 2012-07-19 2020-07-08 돌비 인터네셔널 에이비 다채널 오디오 신호들의 렌더링을 향상시키기 위한 방법 및 디바이스
EP2717261A1 (en) 2012-10-05 2014-04-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for backward compatible multi-resolution spatial-audio-object-coding
EP3044784B1 (en) 2013-09-12 2017-08-30 Dolby International AB Coding of multichannel audio content
CN103700372B (zh) * 2013-12-30 2016-10-05 北京大学 一种基于正交解相关技术的参数立体声编码、解码方法
JP6732739B2 (ja) * 2014-10-01 2020-07-29 ドルビー・インターナショナル・アーベー オーディオ・エンコーダおよびデコーダ
EP3067885A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
CN105405445B (zh) * 2015-12-10 2019-03-22 北京大学 一种基于声道间传递函数的参数立体声编码、解码方法
EP3182406B1 (en) * 2015-12-16 2020-04-01 Harman Becker Automotive Systems GmbH Sound reproduction with active noise control in a helmet
CN106774930A (zh) * 2016-12-30 2017-05-31 中兴通讯股份有限公司 一种数据处理方法、装置及采集设备
WO2022164229A1 (ko) * 2021-01-27 2022-08-04 삼성전자 주식회사 오디오 처리 장치 및 방법

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1223064A (zh) * 1996-04-30 1999-07-14 Srs实验室公司 用于环绕声环境的音频增强系统

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5046098A (en) * 1985-03-07 1991-09-03 Dolby Laboratories Licensing Corporation Variable matrix decoder with three output channels
US4799260A (en) * 1985-03-07 1989-01-17 Dolby Laboratories Licensing Corporation Variable matrix decoder
JPH0479599A (ja) * 1990-07-19 1992-03-12 Victor Co Of Japan Ltd 定位可変音響信号記録再生装置
JPH04137900A (ja) * 1990-09-27 1992-05-12 Pioneer Electron Corp 信号処理装置及び音響再生装置
US5291557A (en) * 1992-10-13 1994-03-01 Dolby Laboratories Licensing Corporation Adaptive rematrixing of matrixed audio signals
EP0631458B1 (en) 1993-06-22 2001-11-07 Deutsche Thomson-Brandt Gmbh Method for obtaining a multi-channel decoder matrix
US5771295A (en) 1995-12-26 1998-06-23 Rocktron Corporation 5-2-5 matrix system
US6697491B1 (en) 1996-07-19 2004-02-24 Harman International Industries, Incorporated 5-2-5 matrix encoder and decoder system
KR100206333B1 (ko) * 1996-10-08 1999-07-01 윤종용 두개의 스피커를 이용한 멀티채널 오디오 재생장치및 방법
WO1999014983A1 (en) * 1997-09-16 1999-03-25 Lake Dsp Pty. Limited Utilisation of filtering effects in stereo headphone devices to enhance spatialization of source around a listener
MY149792A (en) * 1999-04-07 2013-10-14 Dolby Lab Licensing Corp Matrix improvements to lossless encoding and decoding
US6463414B1 (en) * 1999-04-12 2002-10-08 Conexant Systems, Inc. Conference bridge processing of speech in a packet network environment
FI113147B (fi) * 2000-09-29 2004-02-27 Nokia Corp Menetelmä ja signaalinkäsittelylaite stereosignaalien muuntamiseksi kuulokekuuntelua varten
JP2002291100A (ja) * 2001-03-27 2002-10-04 Victor Co Of Japan Ltd オーディオ信号再生方法、及びパッケージメディア
US6996239B2 (en) * 2001-05-03 2006-02-07 Harman International Industries, Inc. System for transitioning from stereo to simulated surround sound
US20030035553A1 (en) 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US7006636B2 (en) * 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US6990210B2 (en) * 2001-11-28 2006-01-24 C-Media Electronics, Inc. System for headphone-like rear channel speaker and the method of the same
KR100978018B1 (ko) 2002-04-22 2010-08-25 코닌클리케 필립스 일렉트로닉스 엔.브이. 공간 오디오의 파라메터적 표현
US8498422B2 (en) * 2002-04-22 2013-07-30 Koninklijke Philips N.V. Parametric multi-channel audio representation
CN1650528B (zh) * 2002-05-03 2013-05-22 哈曼国际工业有限公司 多信道下混频设备
AU2003281128A1 (en) 2002-07-16 2004-02-02 Koninklijke Philips Electronics N.V. Audio coding
CN100349207C (zh) * 2003-01-14 2007-11-14 北京阜国数字技术有限公司 高频耦合的伪小波5声道音频编/解码方法
WO2004072956A1 (en) * 2003-02-11 2004-08-26 Koninklijke Philips Electronics N.V. Audio coding
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US7391870B2 (en) * 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
WO2006008697A1 (en) * 2004-07-14 2006-01-26 Koninklijke Philips Electronics N.V. Audio channel conversion
KR101215868B1 (ko) * 2004-11-30 2012-12-31 에이저 시스템즈 엘엘시 오디오 채널들을 인코딩 및 디코딩하는 방법, 및 오디오 채널들을 인코딩 및 디코딩하는 장치
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1223064A (zh) * 1996-04-30 1999-07-14 Srs实验室公司 用于环绕声环境的音频增强系统

Also Published As

Publication number Publication date
US9552820B2 (en) 2017-01-24
JP5643180B2 (ja) 2014-12-17
KR20060060927A (ko) 2006-06-07
US9232334B2 (en) 2016-01-05
CN102568487B (zh) 2014-09-17
US7961889B2 (en) 2011-06-14
US8824690B2 (en) 2014-09-02
EP1667111A1 (en) 2006-06-07
JP6039516B2 (ja) 2016-12-07
JP2012070428A (ja) 2012-04-05
JP2013251919A (ja) 2013-12-12
US20110224993A1 (en) 2011-09-15
KR100682904B1 (ko) 2007-02-15
CN102568487A (zh) 2012-07-11
US20160099002A1 (en) 2016-04-07
JP4921781B2 (ja) 2012-04-25
CN102568486B (zh) 2016-01-13
CN1783728A (zh) 2006-06-07
US20060116886A1 (en) 2006-06-01
JP2006166447A (ja) 2006-06-22
CN102568486A (zh) 2012-07-11
EP2911151A1 (en) 2015-08-26
US20150131799A1 (en) 2015-05-14

Similar Documents

Publication Publication Date Title
CN1783728B (zh) 通过使用空间信息来处理多声道音频信号的方法
CN1973320B (zh) 立体声编码和解码的方法及其设备
JP3193921B2 (ja) 複数のオーディオ信号を符号化する方法
CN1985303B (zh) 产生多通道输出信号的装置和方法
CN102595303A (zh) 代码转换设备和方法以及用于解码多对象音频信号的方法
CN101578654B (zh) 用于恢复多通道音频信号的设备和方法
CN1938760A (zh) 多通道编码器
CN101010985A (zh) 立体声信号生成装置及立体声信号生成方法
RU2007139918A (ru) Кодирование многоканального аудио
CN102122509A (zh) 多信道解码器和多信道解码方法
CN101432610A (zh) 使用有损编码的数据流和无损扩展数据流对源信号进行无损编码的方法以及设备
CN105580073A (zh) 音频解码器、音频编码器、用于基于已编码表示提供至少四个音频声道信号的方法、用于基于至少四个音频声道信号提供已编码表示的方法、及使用带宽扩展的计算机程序
CN105580391A (zh) 渲染器控制的空间升混
CN101185119B (zh) 解码音频信号的方法和装置
RU2008137596A (ru) Кодирование и декодирование аудио
CN101754086B (zh) 一种基于音源位置线索的多频道音频的解码装置和其方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant