CN103559884B - 多声道信号的编码/解码装置及方法 - Google Patents
多声道信号的编码/解码装置及方法 Download PDFInfo
- Publication number
- CN103559884B CN103559884B CN201310465155.8A CN201310465155A CN103559884B CN 103559884 B CN103559884 B CN 103559884B CN 201310465155 A CN201310465155 A CN 201310465155A CN 103559884 B CN103559884 B CN 103559884B
- Authority
- CN
- China
- Prior art keywords
- parameter
- signal
- opd
- phase
- decoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000000605 extraction Methods 0.000 abstract description 23
- 230000008569 process Effects 0.000 abstract description 4
- 238000013139 quantization Methods 0.000 description 29
- 239000000284 extract Substances 0.000 description 16
- 230000008859 change Effects 0.000 description 15
- 230000006866 deterioration Effects 0.000 description 15
- 238000011002 quantification Methods 0.000 description 14
- 238000011084 recovery Methods 0.000 description 14
- 230000005540 biological transmission Effects 0.000 description 11
- 238000001914 filtration Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000003252 repetitive effect Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000005284 excitation Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000010363 phase shift Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
Abstract
公开了一种多声道信号的编码/解码装置。多声道信号的编码装置考虑多声道信号的特性而处理对于构成多声道信号的多个声道之间的相位信息的相位参数。利用处理的相位参数和从多声道信号提取的单声道信号来产生对于多声道信号的编码的比特流。
Description
本申请是申请日为2010年3月18日、申请号为201080022031.7、发明名称为“多声道信号的编码/解码装置及方法”的发明专利申请的分案申请。
技术领域
本发明的实施例涉及一种多声道信号的编码/解码装置及方法,更详细地讲,涉及利用相位信息的多声道信号的编码/解码装置及方法。
背景技术
用于编码立体声信号的方法包括参数立体声(PS:Parametricstereo)技术。参数立体声技术对输入的立体声信号进行下混频(downmixing)来产生单声道信号,提取表示对于立体声信号的附加信号(sideinformation)的立体声参数,通过对产生的单声道信号和提取的立体声参数进行编码来对立体声信号进行编码。
此时,所利用的立体声参数包括:表示包括在立体声信号中的至少两个声道信号的基于能量等级的强度差的声道间强度差(IID:Inter-channelIntensityDifference)或声道等级差(CLD:channelleveldifferences);表示包括在立体声信号中的至少两个声道信号的基于波形相似性的两个声道信号之间的相关度的声道间相关度或声道间关联度(ICC:Inter-channelCoherence或Inter-channelCoherence);表示包括在立体声信号中的至少两个声道之间的相位差的声道间相位差(IPD:Inter-channelPhaseDifference);表示包括在立体声信号中的至少两个声道信号的相位差以单声道信号为基准如何在两个声道之间分布的总体相位差(OPD:OverallPhaseDifference)。
发明内容
技术方案
根据本发明的一实施例的一种多声道信号的编码装置包括:参数提取单元,提取表示构成多声道信号的多个声道之间的特性关系的多个参数;参数修正单元,修正所述多个参数中的关于所述多个声道之间的相位信息的相位参数;参数编码单元,对包括所述修正的相位参数的所述多个参数进行编码;单声道信号编码单元,对下混频所述多声道信号得到的单声道信号进行编码;以及比特流产生单元,利用所述编码的多个参数和所述编码的单声道信号来产生对于所述多声道信号的编码的比特流。
此时,所述多个参数包括声道等级差(CLD:ChannelLevelDifference),CLD为所述多个声道之间的能量差参数,当所述CLD为0且所述IPD为180°时,所述参数修正单元将所述IPD修正为0°。
另外,根据本发明的另一实施例的多声道信号的编码装置包括:参数提取单元,提取表示构成多声道信号的多个声道之间的特性关系的多个参数;以及参数编码单元,确定是否对所述多个参数中的关于所述多个声道之间的相位信息的相位参数进行编码,当确定对所述相位参数编码时对包括所述相位参数的所述多个参数进行编码。
另外,根据本发明的另一实施例的多声道信号的编码装置包括:参数提取单元,提取表示构成多声道信号的多个声道之间的特性关系的多个参数;参数编码单元,量化所述多个参数,对量化的多个参数进行编码;单声道信号编码单元,对下混频所述多声道信号得到的单声道信号进行编码;以及比特流产生单元,利用所述编码的多个参数和所述编码的单声道信号来产生对于所述多声道信号的编码的比特流,其中,所述参数编码单元基于包括于所述多声道信号中的多个帧之间的相位信息的连续性确定所述相位参数的量化等级。
另外,根据本发明的一实施例的多声道信号的解码装置包括:单声道信号解码单元,从多声道信号的编码的比特流恢复作为所述多声道信号的下混频信号的单声道信号;参数解码单元,从所述比特流恢复表示构成所述多声道信号的多个声道之间的特性关系的多个参数;参数估计单元,利用所述恢复的多个参数来估计关于所述恢复的单声道信号与所述多声道信号之间的相位差得参数(OPD);参数修正单元,修正所述估计的OPD;以及上混频单元,利用所述恢复的至少一个参数和所述修正的OPD来上混频所述单声道信号。
此时,所述多个参数包括CLD和IPD,所述参数修正单元基于所述CLD和IPD可修正所述OPD。
另外,提供一种解码装置,包括:修正作为多声道信号的下混频信号的单声道信号和关于多声道信号之间的相位差的参数的参数修正单元;以及利用修正的关于相位差的参数上混频所述单声道信号的上混频单元。
另外,提供一种编码装置,包括:参数提取单元,提取表示构成多对声道信号的多个声道之间的特性关系的多个参数;参数修正单元,修正多个参数中的关于多个声道之间的相位信息的相位参数;下混频单元,通过修正的相位参数对多声道信号进行下混频,从而产生单声道信号;以及比特流产生单元,编码除修正的相位参数之外的所述多个参数和所述产生的单声道信号来产生比特流。
技术效果
根据本发明的一实施例的多声道信号的编码/解码装置及方法能够减少数据传送所必需的数据的量。
根据本发明的一实施例的多声道信号的编码/解码装置及方法能够提供提高音质的多声道音频信号。
附图说明
图1是示出根据本发明的一实施例的多声道信号的编码装置的详细构成的框图。
图2是用于说明包括在立体声信号中的连续帧的相位参数变化的概念图。
图3是示出根据本发明的一实施例的多声道信号的解码装置的详细构成的框图。
图4是示出根据本发明的一实施例的多声道信号的编码方法的流程图的图。
图5是示出根据本发明的一实施例的多声道信号的解码方法的流程图的图。
图6是利用OPD估计和CLD补偿对立体声信号进行下混频来产生单声道信号的一个示例。
图7是示出改变OPD值的相位的一个示例的图。
图8是示出根据本发明的另一实施例的多声道信号的编码方法的流程图的图。
图9是示出根据本发明的另一实施例的多声道信号的解码方法的流程图的图。
具体实施方式
以下,参照附图来详细说明根据本发明的实施例。但是,本发明不被实施例限制或限定。各个附图示出的相同的标号表示相同的部件。
图1是示出根据本发明的一实施例的多声道信号的编码装置的详细构成的框图。
根据本发明的一实施例的多声道信号的编码装置100包括参数提取单元110、参数编码单元120、下混频单元130、单声道编码单元140和比特流产生单元150。这里,根据本发明的一实施例,多声道信号的编码装置100还可包括参数修正单元160。以下,按各个构成要素详细描述其功能。
这里,多声道信号表示多个声道的信号,在本说明书中将包括在多声道信号中的多个声道中的每一个称作声道信号。
另外,以下,为了便于说明,假设输入到多声道信号的编码装置100的多声道信号为包括左声道信号和右声道信号的立体声信号。但是,本发明所属的技术领域的普通技术人员应该理解,根据本发明的一实施例的多声道信号的编码装置100不限于立体声信号的编码,还可用于多声道信号的编码。
参数提取单元110提取表示构成立体声信号的左声道信号和右声道信号之间的特性关系的多个参数。所述多个参数可包括前述的CLD、ICC、IPD、OPD等。这里,IPD和OPD为关于左声道信号与右声道信号之间的相位信息的相位参数的一个示例。
参数编码单元120对提取的多个参数进行编码。
此时,可从其它参数估计出OPD,所以根据本发明的一实施例,参数编码单元120可仅对提取的多个参数中的CLD、ICC和IPD进行编码,而对于OPD有可能不进行编码。即,多声道信号的编码装置100不会对OPD进行编码并传送,从而可减少传送的比特流的比特量。对于OPD的估计的更加详细说明,可参照关于图3的多声道信号的解码装置300的说明。
另外,为了减少分配给多个参数的编码的比特量,参数编码单元120可对提取的多个参数进行量化,并对量化的多个参数进行编码。如果参数编码单元120仅对多个参数中的CLD、ICC和IPD进行编码,则参数编码单元120可仅量化CLD、ICC和IPD,并对量化的CLD、ICC和IPD进行编码。
下混频单元130对立体声信号进行下混频来输出单声道信号。
下混频(Down-Mixing)指的是从两个声道以上的立体声信号产生一个声道的单声道信号,通过下混频可减少编码过程中产生的比特流的比特量。此时,单声道信号可以是代表立体声信号的信号。换言之,多声道信号的编码装置100不分别编码包括在立体声信号中的左声道信号和右声道信号,而是作为代表仅编码单声道信号并传送。
例如,可通过左声道信号和右声道信号的平均值来计算单声道信号的大小,可通过左声道信号和右声道信号的相位的平均值来计算单声道信号的相位。
单声道信号编码单元140对从下混频单元130输出的单声道信号进行编码。
作为一个示例,当立体声信号为语音(voice)信号时,单声道信号编码单元120可以以代码激励线性预测(CELP:CodeExcitedLinearPrediction)方式对单声道信号进行编码。
另外,作为另一示例,当立体声信号为音乐(music)信号时,单声道信号编码单元120可使用与现有的MPEG-2/4AAC或mp3类似的方法对单声道信号进行编码。
比特流产生单元150利用编码的多个参数和编码的单声道信号产生对于立体声信号的编码的比特流。
如上所述,为了减少传送的比特量,多声道信号的编码装置100从立体声信号提取单声道信号和多个参数,对提取的单声道信号和提取的多个参数进行编码并传送。另外,对于上述情况,为了进一步减少用于传送多个参数的比特量,多声道信号的编码装置100仅对多个参数中的除OPD之外的CLD、ICC和IPD进行编码并传送。
但是,这种情况不是立体声信号本身被编码和传送,所以当再现立体声信号时,可发生音质的劣化。因此,需要最小化音质的劣化的同时能够减少传送的比特量的方案。以下,描述用于减少音质的劣化的多声道信号的编码装置100的操作的实施例。图1中的虚线箭头用于说明根据本发明的另一实施例的多声道信号的编码装置100。稍后详细说明根据本发明的另一实施例的多声道信号的编码装置100。
修正表示左声道信号与右声道信号之间的相位信息的相位参数
如上所述,当多声道信号的编码装置100仅对多个参数中的CLD、ICC和IPD进行编码并传送到解码端时,解码端可利用CLD和IPD来估计OPD。此时,如果估计的OPD在连续的帧中急剧变化,则可能发生不期望的噪声。以下,参照图2来详细说明根据相位参数的变化而发生噪声的概念。
图2是用于说明包括在立体声信号中的连续帧的相位参数变化的概念图。
图2的(a)示出相位参数(IPD和OPD)和左声道信号、右声道信号和单声道信号间的关系。这里,“L”表示频域中的左声道信号,“R”表示频域中的右声道信号,“M”表示下混频的单声道信号。此时,可通过下面的数学式1和2来算出IPD和OPD。
[数学式1]
IPD=∠(L·R*)
这里,L·R表示左声道信号和右声道信号的点积(dotproduct),IPD表示左声道信号与右声道信号形成的角度,*表示复共轭(complexconjugate)。
[数学式2]
OPD=∠(L·M*)
这里,L·M表示左声道信号和单声道信号的点积(dotproduct),OPD表示左声道信号与单声道信号形成的角度,*表示复共轭(complexconjugate)。
图2的(b)示出相位参数(IPD和OPD)在连续的帧中急剧变化的示例。
图2的(b)中,“Frame”表示当前帧,“Frame-1”表示当前帧的1个帧之前的帧(以下,称作“先前帧”)。
如图2的(b)所示,当在先前帧与当前帧之间,IPD在180°附近变化时,IPD以左声道信号为基准从180°到-180°变化得大,由此,OPD以左声道信号为基准从90°至-90°急剧变化。由于这种IPD和OPD的急剧变化,在再现立体声信号时会发生不期望的噪声。因此,为了减少再现立体声信号时发生的噪声以及提高立体声信号的音质,应修改关于左声道信号与右声道信号之间的相位信息的相位参数。
为此,多声道信号的编码装置100通过修正参数提取单元110所提取的相位参数来调整连续的帧中的相位参数的变化程度,从而减少再现立体声信号时发生的噪声。此时,参数修正可在多声道信号的编码装置100所包括的参数修正单元160中执行。
作为一个示例,当CLD为0,IPD为180°时,参数修正单元160可将IPD修正为0°。换言之,当左声道信号与右声道信号之间没有能量差,左声道信号与右声道信号间的角度为180°时,将IPD强制设置为0°。
即,当如图2的(b)所示,IPD在180°附近连续变化时,多声道信号的编码装置100在IPD为180°的时间点上将IPD修正为0°,对修正的IPD进行编码并传送到解码端。此时,在解码端估计的OPD不会从90°变化到-90°,而是以90°,0°,-90°的顺序阶段性地变化,所以能够防止立体声信号的解码阶段中发生的相位信息的急剧变化。
相位参数的选择性编码
如上所述,为了减少分配给多个参数的编码的比特量,多声道信号的编码装置100可对提取的多个参数(尤其,相位参数)进行量化,对量化的多个参数进行编码并传送到解码端。
但是,如果当包括在立体声信号中的连续的帧中的相位信号连续变化(即,相位参数的变化程度小)时,若在解码端利用相位参数对立体声信号恢复和再现,则相位参数的量化及由此引起的不连续的相位值,可导致发生音质的劣化。
因此,根据本发明的一实施例的多声道信号的编码装置100可基于包括在立体声信号中的多个帧之间的相位信息的变化程度(连续性)确定是否对相位参数进行编码。即,当判断为包括在立体声信号中的多个帧之间的相位信息连续时,不对相位信息进行编码;当判断为相位信息不连续时,可对相位信息进行编码。此时,可在参数编码单元120执行是否编码相位参数的确定。
此时,根据本发明的实施例,参数编码单元120可利用当前帧的相位信息值、当前帧的一个帧之前的帧的相位信息值和当前帧的两个帧之前的帧的相位信息值判断相位信息的连续性。即,参数编码单元110可利用第n帧的相位信息值、第n-1帧的相位信息值和第n-2帧的相位信息值来判断第n帧的相位信息的连续性。
作为一个示例,参数编码单元120计算作为当前帧的一个帧之前的帧的相位信息值的2倍的值与所述当前帧的两个帧之前的帧的相位信息值之间的差的第一相位差值,计算作为当前帧的相位信息值与所述第一相位差值间的第二相位差值,当所述第二相位差值大于预设置的值时,判断为相位信息不连续(即,判断为相位信息不是缓慢变化),从而确定对相位参数进行编码。这可如以下的数学式3表示。
[数学式3]
PhaseError[band]=Phase[band]-(2·phasePrev[band]-PhasePrev2[band])
这里,Phase[]表示当前帧的相位信息值,PhasePrev[]表示当前帧的一个帧之前的帧的相位信息值,PhasePrev2[]表示当前帧的两个帧之前的帧的相位信息值,PhaseError[]表示第二相位差值,band表示应用相位信息的频带。
因此,当PhaseError[band]大于预设置的值时,参数编码单元120确定对相位信息进行编码;当PhaseError[band]小于或等于预设置的值时,参数编码单元120确定不对相位信息进行编码。
另外,根据本发明的另一实施例,参数编码单元120可利用一个帧之前的帧的相位信息值与当前帧的相位信息值之间的差来判断相位信息是否连续,并基于此确定是否对相位参数进行编码。
作为一个示例,参数编码单元如以下的数学式4所示地计算当前帧的相位信息与一个帧之前的帧的相位信息值之间的差,计算其斜率,从而可判断相位信息是否连续。
[数学式4]
Slope[band]=Phase[band]-PhasePrev[band]
这里,Slope[]表示当前帧的相位信息值与1个帧之前的帧的相位信息值之间的差,band表示应用相位信息的频带。
当Slope[band]以大于预定斜率地变化时,量化引起的相位信息的不连续性可导致噪声的发生,所以当Slope[band]的斜率大于预设置的值时,参数编码单元120确定不对相位信息进行编码;当Slope[band]的斜率小于或等于预设置的值时,参数编码单元120确定对相位信息进行编码。
在上述的数学式3和数学式4的计算中,参数编码单元120考虑相位信息以360°为基准连续(Wrappingproperty)变化来计算第一相位差值、第二相位差值和当前帧与一个帧之前的帧的相位差值。例如,当相位差值为370°时,参数编码单元120考虑360°的周期而将相位差值计算为+10°。
作为另一示例,参数编码单元120可通过组合PhaseError[band]和Slope[band]来确定是否对相位信息进行编码。
根据本发明的另一实施例,参数编码单元120可组合PhaseError[band]和Slope[band]来确定是否对相位信息进行编码。
此外,除相位信息的连续性之外,参数编码单元120可基于参数提取单元110提取的ICC值确定是否对相位参数(更准确地讲,包括在相位参数中的IPD)进行编码。
参数提取单元110可利用IPD来提取ICC,也可不利用IPD来提取ICC,但是如果不利用IPD提取的ICC与利用IPD提取的ICC之间的差大于预设置的值,则在立体声信号的解码阶段可解释为IPD具有比ICC更重要的意义;相反,如果不利用IPD提取的ICC与利用IPD提取的ICC之间的差小于预设置的值,则可解释为ICC具有比IPD更重要的意义。
因此,根据本发明的一实施例,当考虑IPD而提取的ICC与不考虑IPD而提取的ICC之间的差大于预设置的值时,参数编码单元120可确定对IPD进行编码。
此时,多声道信号的编码装置100对IPD和考虑IPD的ICC进行编码并传送到解码端,但是在解码端,利用IPD和考虑IPD的ICC来恢复立体声信号,从而可恢复接近原始声音的立体声信号。
即,在恢复立体声信号时,在解码端调整与利用ICC恢复的单声道信号的正交矢量分量对应的解相关(decorrelate)的信号与恢复的单声道信号之间的混频程度。因此,当在解码端,利用考虑IPD的ICC来恢复立体声信号时,防止因相位信息差导致的解相关的信号与恢复的单声道信号过度混频,从而可恢复接近原始声音的立体声信号。
作为一个示例,参数提取单元120可根据以下的数学式5来提取考虑IPD的ICC。
[数学式5]
即,通过补偿相位信息来计算左声道信号与右声道信号之间的相关性,仅利用所计算的相关性的实数值就能够算出考虑IPD的ICC。
作为另一示例,参数提取单元120可根据以下数学式提取考虑IPD的ICC。
[数学式6]
这里,Q表示量化,Q-1表示逆量化。
即,当在解码端利用根据数学式6提取的ICC来恢复立体声信号时,可补偿如上所述的由于相位参数的量化而可能发生的误差。
作为另一示例,参数提取单元120可根据以下数学式7提取考虑IPD的ICC。
[数学式7]
相位参数的量化方式的选择性变更
如上所述,多声道信号的编码装置100可对量化的相位参数进行编码并传送到解码端。因此,当相位参数不是选择性地,而是全部被编码并传送到解码端时,为了防止量化的相位参数引起的音质的劣化,多声道信号的编码装置100可选择性地变更量化方式。
换言之,当即使相位信息的变化程度小(即,相位信息连续地变化),相位信息仍以宽的间隔被量化时,则不连续的相位值可导致在解码端再现的立体声信号的音质发生劣化,所以根据本发明的一实施例的多声道信号的编码装置100可基于相位信息的连续性确定相位参数的量化类型(Type)。此时,可在参数编码单元120执行量化类型的确定。
即,当判断为相位信息不连续时,参数编码单元120可根据第一量化类型量化相位参数;当判断为相位信息连续时,参数编码单元120可根据第二量化类型量化相位参数。
此时,根据第一量化类型的量化等级的数量与根据第二量化类型的量化等级的数量可以不同。
另外,根据第一量化类型的量化等级的代表值(即,在量化等级中量化的值)与根据第二量化类型的量化等级的代表值可互不相同。
因此,对于上述情况,根据第一量化类型的量化误差(quantizationerror)与根据第二量化类型的量化误差可以不同。这里,量化误差表示量化的值与没有被量化的值之间的差值。
作为一个示例,当相位信息连续时,参数编码单元120以相比相位信息不连续时更细密的间隔对相位参数进行量化,从而可最小化在解码端发生的立体声信号的音质劣化。此时,第一量化类型的量化等级的数量少于第二量化类型的量化等级的数量。
对于上述情况,可基于数学式3至数学式4确定相位信息是否连续。
当参数编码单元120选择性地应用量化类型来对相位参数进行编码时,比特流产生单元150可进一步利用确定的量化类型信息来产生比特流。此时,接收比特流的解码端可参照量化类型信息来执行逆量化。当多声道信号的编码装置100没有将相位信息传送到解码端时,比特流产生单元150不会将量化类型信息包括在比特流,接收到不包括量化类型信息的比特流的解码端可不参照量化类型信息而执行逆量化。对于解码端执行的逆量化的更详细的说明,可参照图3的多声道信号的解码装置300的说明。
以下的[表1]和[表2]表示第一量化类型的量化等级的数量为8个,第二量化类型的量化等级的数量为16个时量化角度信息。
[表1]
索引 | 角度 |
0 | 0 |
1 | 45 |
2 | 90 |
3 | 135 |
4 | 180 |
5 | 225 |
6 | 270 |
7 | 315 |
[表2]
索引 | 角度 |
0 | 0 |
1 | 22.5 |
2 | 45 |
3 | 67.5 |
4 | 90 |
5 | 112.5 |
6 | 135 |
7 | 157.5 |
8 | 180 |
9 | 202.5 |
10 | 225 |
11 | 247.5 |
12 | 270 |
13 | 292.5 |
14 | 315 |
15 | 337.5 |
上面,说明了用于减少传送的比特流的比特量以及减少降低音质的劣化的多声道信号的编码装置100的操作的实施例。以下,参照图3来详细说明根据本发明的实施例的多声道信号解码装置。
图3是示出根据本发明的一实施例的多声道信号的解码装置的详细构成的框图。
根据本发明的一实施例的多声道信号的解码装置300包括单声道解码单元310、参数解码单元320、参数估计单元330、上混频单元340和参数修正单元350。以下,按各个构成要素详细描述其功能。
以下,为了便于说明,假设输入到多声道信号的解码装置300的比特流为立体声信号的编码的比特流。
另外,假设输入的比特流是以编码的单声道信号和编码的多个参数解复用的比特流。
单声道信号解码单元310从立体声信号的编码的比特流恢复作为所述多声道信号的下混频的信号的单声道信号。具体地讲,当单声道信号在时域被编码时,单声道信号解码单元310可在时域对编码的单声道信号进行解码;当单声道信号在频域被编码时,单声道信号解码单元310可在频域对编码的单声道信号进行解码。
参数解码单元320从立体声信号的编码的比特流恢复表示构成所述多声道信号的多个声道之间的特性关系的多个参数。此时,多个参数可包括CLD、ICC和IPD,但不包括OPD。
参数估计单元330利用恢复的多个参数来估计OPD。
以下,详细说明估计OPD的参数估计单元330的操作。这里,本发明所属的技术领域的普通技术人员应该明白,下面描述的数学式仅为本发明的一实施例,可对下面描述的数学式进行变更。
首先,参数估计单元330根据以数学式8利用CLD来获得第一中间变量c。
[数学式8]
这里,b表示频带的索引。与数学式8相同,可通过以10的指数的形态表现将特定频带的IID值除以值20来算出第一中间变量c。此时,可利用第一中间变量c,如数学式9和数学式10一样地算出第二中间变量c1和第三中间变量c2。
[数学式9]
[数学式10]
即,可通过第二中间变量c1的值乘以c的值来算出第三中间变量c2。
然后,参数估计单元330利用恢复的单声道信号以及通过数学式9算出的第二中间变量c1和通过数学式10算出的第三中间变量c2来算出第一右声道信号和第一左声道信号。可如以下的数学式11和数学式12表示第一右声道信号和第一左声道信号。
[数学式11]
这里,n表示时隙索引,k表示参数带索引。第一右声道信号可由第二中间变量c1与恢复的单声道信号M的乘积来表示。
[数学式12]
第一左声道信号可由第三中间变量c2与恢复的单声道信号M的乘积来表示。
此时,当将IPD设为时,可利用第一右声道信号和第一左声道信号如以下的数学式13表示第一单声道信号
[数学式13]
另外,利用数学式10至13可如以下的数学式14一样地算出基于时隙和参数带的第四中间变量p。
[数学式14]
这里,第四中间变量p为将第一左声道信号、第一右声道信号和第一单声道信号的大小的和除以2的值。此时,当将OPD的值设为时,可如以下的数学式15算出OPD。
[数学式15]
另外,当将与OPD与IPD之差相当的值设为时,可如以下的数学式16算出
[数学式16]
在数学式15中算出的作为OPD的值的为解码的单声道信号与将被上混频的左声道信号之间的相位差,作为在数学式16中算出的值的表示解码的单声道信号与将被上混频的右声道信号之间的相位差。
如此,参数估计单元330从利用表示立体声信号的声道之间的大小差的IID恢复的单声道信号来产生针对左声道信号的第一左声道信号和针对右声道信号的第一右声道信号,利用表示立体声信号的声道之间的相位差的IPD来从第一左声道信号和第一右声道信号产生第一单声道信号,可利用产生的第一左声道信号、第一右声道信号和第一单声道信号来估计表示恢复的单声道信号与立体声信号的相位差的OPD的值。
上混频单元340利用恢复的至少一个参数和估计的OPD来对单声道信号进行上混频。
上混频是指从一个声道的单声道信号产生两个声道以上的立体声信号,对应于下混频。以下,说明利用CLD、ICC、IPD和OPD来对单声道信号进行上混频的上混频单元340的具体动作。
首先,当ICC的值为ρ时,上混频单元340利用第二中间变量c1和第三中间变量c2如以下的数学式17和18算出第一相位α+β和第二相位α-β
[数学式17]
[数学式18]
然后,当恢复的单声道信号为M,解相关的信号为D时,上混频单元340利用通过数学式18和数学式19算出的第一相位和第二相位、第二中间变量c1和第三中间变量c2和在数学式15中算出的作为OPD的值的作为数学式16算出的值的来如以下的数学式19和数学式20一样地算出上混频的左声道信号和右声道信号。
[数学式19]
[数学式20]
如此,根据本发明的实施例的多声道信号的解码装置300利用传送的参数来估计OPD,并可利用估计的OPD参数和传送的其它参数来恢复立体声信号。
但是,当如所述对于图2的说明一样,利用传送的参数估计的OPD在连续的帧中急剧变化时,有可能发生噪声,从而使音质劣化,因此当在编码端对于相位参数不进行修正而传送相位参数时,应该在多声道信号的解码装置300中对相位参数进行修正,从而减少噪声。
为此,根据本发明的一实施例的多声道信号的解码装置300修正估计的OPD,利用修正的OPD和恢复的多个参数来恢复立体声信号。
如果恢复的多个参数包括CLD和IPD,则根据本发明的一实施例的多声道信号的解码装置300可基于CLD和IPD来修正OPD。此时,由参数修正单元350执行参数的修正。
作为一个示例,当恢复的IPD为180°时,参数修正单元350可将估计的OPD修正为0°。
作为另一示例,当恢复的IPD不是180°时,参数修正单元350可利用上述CLD来修正估计的OPD,但是,此时,估计的OPD可对应于恢复的OPD与0°之间的值或恢复的OPD与-180°之间的值中的一个。
换言之,当恢复的IPD在180°附近变更时,估计的OPD可从90°附近急剧变更到-90°附近,因此参数修正单元330为了防止这种OPD的急剧变化,当IPD为180°时,参数修正单元330将OPD设置为0°;当IPD为180附近的值时,参数修正单元330可将OPD设置为90°与0°之间的值或-90°与0°之间的值中的一个值,例如,设置为67.5°或-67.5°。由此,OPD不从90°变换到-90°,而是以67.5°,0°,-67.5°的顺序阶段性地变化,从而可防止相位信息的急剧变化。
可根据以下的数学式21来执行上述的OPD的修正。
[数学式21]
如果IPD=180°&CLD=0,OPD=0°
则
其中,
另外,根据本发明的另一实施例,参数修正单元350可通过对估计的OPD进行滤波(filtering)来修正OPD,从而减少估计的OPD的变化量。
作为一个示例,参数修正单元350可利用无限脉冲响应(IIR:InfiniteImpulseResponse)滤波器来修正估计的OPD。
另外,参数修正单元350可基于以下的数学22对估计的OPD进行滤波。
[数学式22]
φ′frame,band=α·φframe,band+(1-α)·φframe-1,band
这里,φframe,band表示当前帧中的关于包括在特定频带中的信号的相位信息,φframe-1,band表示当前帧的一个帧之前的帧中的关于包括在特定频带中的信号的相位信息,α表示大于0且小于1的任意实数,φ′frame,band表示当前帧中的包括在特定频带中的信号的经滤波的相位信息。
即,参数修正单元360将第一加权值(a)分配给φframe,band,将第二加权值((1-α))分配给φframe-1,band,将分配加权值的φframe,band和分配加权值的φframe-1,band相加来修正OPD,从而减小OPD的变化量。
另外,对于上述的情况,可在编码端确定是否对估计的OPD应用滤波。在编码端将关于执行滤波的信息包括在比特流中传送到多声道信号的解码装置300,参数修正单元350可根据所述关于执行滤波的信息确定是否执行滤波。
如上述对于图1的说明,编码端可基于相位信息的连续性选择量化类型,根据选择的量化类型产生包括量化的相位参数和量化类型信息的比特流。
如果当根据本发明的一实施例的多声道信号的解码装置300接收包括量化的相位参数和量化类型信息的比特流,参数恢复单元320从比特流恢复量化的相位参数(以下称作第一相位参数)和量化类型信息,并可基于恢复的量化类型信息对第一相位信息进行逆量化来算出第二相位参数。
此时,上混频单元340可利用第二相位参数和除第二相位参数之外的剩余参数来对单声道信号进行上混频。
由此,多声道信号的解码装置300可减少相位参数的量化由此引起的不连续性的相位值导致的音质的劣化。
图4是示出根据本发明的一实施例的多声道信号的编码方法的流程图。
参照图4,根据本发明的一实施例的多声道信号的编码方法由图1所示的多声道信号的编码装置100所处理的步骤构成。因此,即使是以下省略的内容,关于图1所示的多声道信号的编码装置100上述的内容也适用于根据本发明的一实施例的多声道信号的编码方法。
首先,在步骤S410,提取表示构成多声道信号的多个声道之间的特性信息的多个参数。
在步骤S420,修正多个参数中的关于多个声道之间的相位信息的相位信息。
根据本发明的一实施例,相位参数可包括IPD。
另外,根据本发明的一实施例,多个参数包括CLD,当CLD为0°,IPD为180°时,在步骤S410,将IPD修正为0°。
在步骤S430,对包括修正的相位参数的多个参数进行编码。
在步骤S440,对下混频多声道信号的单声道信号进行编码。
在步骤S450,利用编码的多个参数和编码的单声道信号来产生关于多个声道信号的编码的比特流。
图5是示出根据本发明的一实施例的多声道信号的解码方法的流程图的图。
参照图5,根据本发明的一实施例的多声道信号的解码方法由在图3所示的多声道信号的解码装置300中所处理的步骤构成。因此,即使是以下省略的内容,关于图3所示的多声道信号的解码装置300上述的内容也适用于根据本发明的一实施例的多声道信号的解码方法。
首先,在步骤S510,从多声道信号的编码的比特流恢复作为多声道信号的下混频信号的单声道信号。
在步骤S520,从比特流恢复表示构成多声道信号的多个声道之间的特性关系的多个参数。
在步骤S530,利用恢复的多个参数来估计OPD。
在步骤S540,修正估计的OPD。
根据本发明的一实施例,多个参数包括CLD和IPD,在步骤540中,可基于CLD和IPD修正OPD。
此时,当IPD为180°时,在步骤S540,可将OPD修正为0°。另外,当IPD不是180°时,在步骤S540,可利用CLD来修正OPD,修正的OPD可对应于所述恢复的OPD与0°之间的值或所述恢复的OPD与-180°之间的值中的一个。
另外,根据本发明的实施例,通过对在步骤S540估计的OPD进行滤波来修正OPD,从而减少估计的OPD的变化量。此时,在步骤S540,可利用IIR滤波器来对估计的OPD进行滤波。
在步骤S550,利用恢复的至少一个参数和修正的OPD来对单声道信号进行上混频。
再次参照图1,上述的根据本发明的另一实施例的多声道信号的编码装置100可仅包括图1中的参数提取单元110、下混频单元130、比特流产生单元150和参数修正单元160。
这里,多声道信号也表示多个声道的信号,在本说明书中,将包括在多声道信号中的多个声道分别称作声道信号。
另外,为了便于说明,假设输入到多声道信号的编码装置100的多声道信号为包括左声道信号和右声道信号的立体声信号。但是,本发明所属的技术领域的普通技术人员应该理解,根据本发明的另一实施例的多声道信号的编码装置100不限于立体声信号的编码,还可用于多声道信号的编码。
参数提取单元110提取表示构成立体声信号的左声道信号和右声道信号之间的特性关系的多个参数。所述多个参数可包括上述的CLD、ICC、IPD、OPD等。这里,IPD为关于左声道信号与右声道信号之间的相位信息的相位参数的一个示例,另外,OPD为稍后描述的关于单声道信号与左声道信号或单声道信号与右声道信号之间的相位信息的相位参数的一个示例。
参数修正单元160修正所述多个参数中的关于所述多个声道之间的相位信息的相位参数。此时,所述多个参数可包括所述多个声道之间的能量差参数(CLD:ChannelLevelDiffere),参数修正单元160可通过将CLD补偿(offst)添加到CLD的值来修正稍后描述的关于单声道信号与所述多个声道之间的相位差的参数(OPD:OverallPhaseDiffer)。
例如,在上述的数学式21中,对可根据CLD的值确定的第二中间变量c1或第三中间变量c2的值乘以CLD的补偿的值,从而可修正OPD。通过这种CLD补偿的添加,可确定作为立体声信号的下混频信号的单声道信号的相位。即,仅在计算OPD时,增加左声道信号或右声道信号的大小。这种示例可表示为如下的数学式23。图6是利用OPD估计和CLD补偿,对立体声信号下混频来产生单声道信号的示例。即,在虚线框600中示出了增加左声道信号的大小而产生的单声道信号的示例。在此,稍后将详细说明单声道信号的产生。
此时,即使添加CLD,IPD也总能够维持,相位轨迹的斜率可根据CLD补偿的值来决定。因此,可利用CLD补偿来消除相位不连续性,可以不失真地恢复下混频结果。此时,在解码时,也通过添加CLD补偿来对下混频的单声道信号进行上混频,从而可消除相位不连续性。稍后将详细说明解码。
作为这种CLD补偿的值的一个示例,以表示最大差的180°的IPD为基准,相邻的帧之间的差可被设置为小于相位量化间隙(phasequantizationbin)。在粗量化(coarsequantization)中,为了使相邻帧之间的差小于45°的相位量化间隙,当假设CLD的值为1时,CLD补偿可具有2的平方根的值。另外,在细量化中,为了使相邻帧之间的差小于22.5°的相位量化间隙,当假设CLD的值为1时,CDL补偿可具有1.8477的值。可利用数学式23,如同以下的数学式24和数学式25分别表示这种示例。
[数学式23]
[数学式24]
[数学式25]
这里,opdipd=180°可具有0的值。
另外,作为另一示例,参数修正单元160可通过修正出现相位不连续性的瞬间的OPD的值来改变相位,从而消除相位不连续性。此时,在当前帧的1个帧之前帧的OPD值与当前帧的OPD至之间的差大于等于预设置的值时,参数修正单元160可修正当前OPD的值。例如,在当前帧的1个帧之前帧的OPD值与当前帧的OPD值之差大于等于90°时,参数修正单元160可将OPD的值修正180°,从而可消除相位不连续性。图7是示出改变OPD值的相位的一个示例的图。此时,在第一曲线710和第二曲线720中,x轴表示时间,y轴表示相位值。即,如第二曲线720所示,在出现OPD的相位不连续性的瞬间,将OPD的值修正180°,从而可消除相位不连续性。第一箭头721和第二箭头721表示如下的情况,即,通过将OPD的值修正180°来改变OPD的值,从而消除相位不连续性。此时,为了将OPD的值修正180°,可将180°(π)相加到OPD的值或从OPD的值减去180°(π)。可如同以下的数学式26表示这种OPD的值的修正。
[数学式26]
opdn=mod(opdn+π,2π)
其中,n:帧索引
下混频单元130利用修正的相位参数对所述多声道信号进行下混频,从而产生单声道信号。即,如同图1的从参数修正单元160连接到下混频单元130的虚线箭头,修正的相位参数可被传送至下混频单元130,下混频单元130可通过由参数修正单元160传送的相位参数对多声道信号进行下混频,从而产生单声道信号。这里,下混频表示从两个声道以上的立体声信号产生一个声道单声道信号,通过缩混来减少编码过程产生的比特流的比特量。此时,单声道可以是代表立体声信号的信号。换言之,多声道信号的编码装置100不分别编码包括在立体声信号中的左声道信号和右声道信号,可代表性地仅编码单声道信号并传送。例如,可由左声道信号和右声道信号的大小的平均值来算出单声道信号的大小,可由左声道信号和右声道信号的相位的平均值来算出单声道信号的相位。此时,由于参数被参数修正单元160修正,所以左声道信号和右声道信号的大小或左声道信号和右声道信号的相位可被改变,随着这种大小或相位变得不同,单声道信号的大小和相位也可能变化。另外,作为另一示例,下混频单元130可基于IPD和OPD分别将左声道信号和右声道信号的相位相移之后,以两个声道信号之和来表示。此时,为了调整单声道信号的大小,可使用基于CLD,ICC的增益(gain)值。可如数学式27一样地表示这种示例。此时,如同图1的从参数提取单元110连接到下混频单元130的虚线箭头,下混频单元130可从参数提取单元110接收IPD、CLD和ICC。即,IPD、CLD和ICC可包括在由参数提取单元110提取的多个参数中。
[数学式27]
m=g·(L·e-jOPD+R·e-j(OPD-IPD))
其中,
比特流产生单元150对除所述修正的相位参数之外的所述多个参数和所述产生的单声道信号进行编码,从而产生比特流。此时,作为一个示例,当立体声信号为语音(voice)信号时,可以以代码激励线性预测(CELP:CodeExcitedLinearPrediction)方式对单声道信号进行编码。另外,作为另一示例,当立体声信号为音乐(music)信号时,可使用与现有的MPEG-2/4AAC或mp3类似的方法对单声道信号进行编码。
此时,修正的相位参数可包括作为关于单声道信号图多个声道间的相位差的参数的OPD。由于可从其它参数提取OPD,所以根据本发明的另一实施例,比特流产生单元150可仅对提取的多个参数中的CLD、ICC和IPD进行编码,而不对OPD进行编码。即,根据本发明的另一实施例的多声道信号的编码装置100不会对OPD进行编码和传送,从而可减少传送的比特流的比特量。对于OPD的估计的更加详细说明可参照关于图3的多声道信号的解码装置300的说明。
此外,为了减少分配给多个参数的编码的比特量,比特流产生单元150可对提取的多个参数进行量化,对量化的多个参数进行编码。如果,当比特流产生单元150仅对多个参数中的CLD、ICC和IPD编码时,比特流产生单元150可仅对CLD、ICC和IPD进行量化,并对量化的CLD、ICC和IPD进行编码。
如上所述,为了减少传送的比特量,多声道信号的编码装置100从立体声信号提取单声道信号和多个参数,对提取的单声道信号和多个参数进行编码并传送。此外,对于上述的情况,为了进一步减少用于多个参数的传送的比特量,多声道信号的编码装置100可仅对多个参数中的除OPD之外的CLD、ICC和IPD进行编码并传送。此时,由于不是立体声信号本身被编码和传送,所以立体声信号的再现时,可发生音质的劣化。因此,在计算OPD时,增加CLD补偿或修正OPD来产生单声道信号,从而减少比特量的同时消除相位不连续性,因此可最小化音质的劣化。
再次参照图3,根据本发明的另一实施例的多声道信号的解码装置300可仅包括上混频单元340和参数修正单元350。以下,按各构成要素详细描述其功能。
参数修正单元350修正关于作为多声道信号的下混频信号的单声道信号与多声道信号之间的相位差的参数。这里,关于相位差的参数可包括通过表示构成多声道信号的多个声道之间的特性关系的多个参数估计的OPD。此时,多个参数可包括所述多个声道之间的能量差参数(CLD:ChannelLevelDiffere),参数修正单元350可通过将CLD补偿(offset)添加到CLD的值来修正估计的OPD。
此外,多声道信号可包括多个帧,在当前帧的一个帧之前的帧的估计的OPD值与当前帧的估计的OPD值之差大于等于预设置的值时,参数修正单元350可修正当前帧的估计的OPD值。例如,预设置的值可包括90°,此时,在当前帧的一个帧之前的帧的估计的OPD值与当前帧的估计的OPD值之差大于等于90°时,参数修正单元350可将当前帧的OPD值修正180°。
由于详细描述了通过添加CLD补偿或相邻帧之间的OPD值之差来修正OPD的方法,所以省略重复的说明。
上混频单元340利用关于修正的相位差的参数来对单声道信号进行上混频。即,上混频单元340通过利用修正的OPD对单声道信号上混频,来消除相位不连续性,从而可最小化音质的劣化。由于已详细说明了上混频单声道信号的方法,所以将省略重复的说明。
此时,可通过由图1说明的多声道信号的编码装置100从比特流接收多声道信号,根据另一实施例的多声道信号的解码装置300可从这种比特流恢复单声道信号和多个参数。此时,如前所述,可通过多个参数估计关于相位差的参数OPD。如此,为了从比特流获得单声道信号并估计OPD,多声道信号的解码装置300还可包括从多声道信号的编码的比特流恢复单声道信号的单声道信号解码单元310、从比特流恢复表示构成多声道信号的多个声道之间的特性关系的多个参数的参数解码单元320和利用恢复的多个参数估计作为所述的关于相位差的参数的整体相位差(OPD:OverallPhaseDifference)的参数估计单元330。
图8是示出根据本发明的另一实施例的多声道信号的编码方法的流程图。可由前述的根据本发明的另一实施例的多声道编码装置100执行根据本实施例的多声道信号的编码方法。在图8中,通过说明由多声道信号的编码装置100执行各个步骤的过程来说明多声道信号的编码方法。
这里,多声道信号表示多个声道的信号,在本说明书中,包括在多声道信号中的多个声道分别被称作声道信号。
此外,为了便于说明,假设输入到多声道信号的编码装置100的多声道信号为包括左声道信号和右声道信号的立体声信号。但是,本发明所属的技术领域的普通技术人员应该理解,根据本发明的另一实施例的多声道信号的编码装置100不限于立体声信号的编码,还可用于多声道信号的编码。
在步骤810,多声道信号的编码装置100提取表示构成立体声信号的左声道信号与右声道信号之间的特性关系的多个参数。多个参数可包括上述的CLD、ICC、IPD、OPD等。这里,IPD是关于左声道信号与右声道信号之间的相位信息的相位参数的一个示例。另外,OPD是稍后描述的单声道信号与左声道信号或单声道信号右声道信号之间的相位信息的相位参数的一个示例。
在步骤820,多声道信号的编码装置100修正所述多个参数中的关于所述多个声道之间的相位信息的相位参数。此时,所述多个参数可包括所述多个声道之间的能量差参数(CLD:ChannelLevelDiffere),多声道信号的编码装置100可通过将CLD补偿(offset)添加到CLD的值来修正稍后描述的关于单声道信号与所述多个声道之间的相位差的参数(OPD:OverallPhaseDiffer)。
例如,在上述的数学式21中,对可根据CLD的值确定的第二中间变量c1或第三中间变量c2的值乘以CLD的补偿的值,从而可修正OPD。通过增加这种CLD补偿,可确定作为立体声信号的下混频信号的单声道信号的相位。即,仅在计算OPD时,增加左声道信号或右声道信号的大小。这种示例可表示为数学式23。对于利用OPD估计和CLD补偿对立体声信号下混频来产生单声道信号的方法,可参照通过图6的说明。此时,稍后将更加详细说明单声道信号的产生。
此时,即使添加CLD,IPD也总能够维持,相位轨迹的斜率可根据CLD补偿的值来决定。因此,可利用CLD补偿来消除相位不连续性,可以不失真地恢复下混频结果。此时,在解码时,通过添加CLD补偿来对下混频的单声道信号进行上混频,从而可消除相位不连续性。稍后将详细说明解码方法。
作为这种CLD补偿的值的一个示例,以表示最大差的180°的IPD为基准,相邻的帧之间的差可被设置为小于相位量化间隙(phasequantizationbin)。在粗量化(coarsequantization)中,为了使相邻帧之间的差小于45°的相位量化间隙,当假设CLD的值为1时,CLD补偿可具有2的平方根的值。另外,在细量化中,为了使相邻帧之间的差小于22.5°的相位量化间隙,当假设CLD的值为1时,CDL补偿可具有1.8477的值。如同以下的数学式24和数学式25分别表示这种示例。
另外,作为另一示例,多声道信号的编码装置100可通过修正出现相位不连续性的瞬间的OPD的值来改变相位,从而消除相位不连续性。此时,在当前帧的1个帧之前帧的OPD值与当前帧的OPD至之间的差大于等于预设置的值时,参数修正单元160可修正当前OPD的值。例如,在当前帧的1个帧之前帧的OPD值与当前帧的OPD值之差大于等于90°时,参数修正单元160可将OPD的值修正180°,从而可消除相位不连续性。改变相位的示例可参照上述图7的说明和上述数学式26。
在步骤830,多声道信号的编码装置100通过修正的相位参数对所述多声道信号进行下混频,从而产生单声道信号。这里,下混频(Down-mixing)表示从两个声道以上的立体声信号产生一个声道单声道信号,通过缩混来减少编码过程产生的比特流的比特量。此时,单声道信号可以是代表立体声信号的信号。换言之,多声道信号的编码装置100不分别编码包括在立体声信号中的左声道信号和右声道信号,可代表性地仅编码单声道信号并传送。例如,可由左声道信号和右声道信号的大小的平均值来算出单声道信号的大小,可由左声道信号和右声道信号的相位的平均值来算出单声道信号的相位。此时,由于参数被多声道信号的编码装置100修正,所以左声道信号和右声道信号的大小或左声道信号和右声道信号的相位可被改变,随着这种大小或相位的改变,单声道信号的大小和相位也变化。另外,作为另一示例,多声道信号的编码装置100可基于IPD和OPD分别将左声道信号和右声道信号的相位相移之后,以两个声道信号之和来表示。此时,为了调整单声道信号的大小,可使用基于CLD,ICC的增益(gain)值。可如同数学式27表示这种示例。
在步骤840,多声道信号的编码装置100对除所述修正的相位参数之外的所述多个参数和所述产生的单声道信号进行编码,从而产生比特流。此时,作为一个示例,当立体声信号为语音(voice)信号时,可以以代码激励线性预测(CELP:CodeExcitedLinearPrediction)方式对单声道信号进行编码。另外,作为另一示例,当立体声信号为音乐(music)信号时,可使用与现有的MPEG-2/4AAC或mp3类似的方法对单声道信号进行编码。
此时,修正的相位参数可包括作为关于单声道信号和多个声道间的相位差的参数的OPD。由于可从其它参数提取OPD,所以根据本发明的另一实施例,多声道信号的编码装置100可仅对提取的多个参数中的CLD、ICC和IPD进行编码,而不对OPD进行编码。即,根据本发明的另一实施例的多声道信号的编码装置100不会对OPD进行编码和传送,从而可减少传送的比特流的比特量。对于OPD的估计的更加详细说明可参照关于图3的多声道信号的解码装置300的说明。
此外,为了减少分配给多个参数的编码的比特量,多声道信号的编码装置100可对提取的多个参数进行量化,对量化的多个参数进行编码。如果,当多声道信号的编码装置100仅对多个参数中的CLD、ICC和IPD编码时,声道信号的编码装置100可仅对CLD、ICC和IPD进行量化,并对量化的CLD、ICC和IPD进行编码。
如上所述,为了减少传送的比特量,多声道信号的编码装置100从立体声信号提取单声道信号和多个参数,并对提取的单声道信号和多个参数进行编码并传送。此外,对于上述的情况,为了进一步减少用于多个参数的传送的比特量,多声道信号的编码装置100可仅对多个参数中的除OPD之外的CLD、ICC和IPD进行编码并传送。此时,由于不是立体声信号本身被编码和传送,所以立体声信号的再现时,可发生音质的劣化。因此,在计算OPD时,增加CLD补偿或修正OPD来产生单声道信号,从而减少比特量的同时消除相位不连续性,因此可最小化音质的劣化。
图9是示出根据本发明的另一实施例的多声道信号的解码方法的流程图。可由根据本发明的另一实施例的多声道解码装置300执行根据本实施例的多声道信号的编码方法。在图9中,通过说明由多声道信号的解码装置300执行各个步骤的过程来说明多声道信号的解码方法。
在步骤910,多声道信号的解码装置300修正关于作为多声道信号的下混频信号的单声道信号与多声道信号之间的相位差的参数。这里,关于相位差的参数可包括通过表示构成多声道信号的多个声道之间的特性关系的多个参数而估计的OPD。此时,多个参数可包括所述多个声道之间的能量差参数(CLD:ChannelLevelDifferences),多声道信号的解码装置300可通过将CLD补偿(offst)添加到CLD的值来修正估计的OPD。
此外,多声道信号可包括多个帧,在当前帧的一个帧之前的帧的估计的OPD值与当前帧的估计的OPD值之差大于等于预设置的值时,参数修正单元350可修正当前帧的估计的OPD值。例如,预设置的值可包括90°,此时,在当前帧的一个帧之前的帧的估计的OPD值与当前帧的估计的OPD值之差大于等于90°时,多声道信号的解码装置300可将当前帧的OPD值修正180°。
由于详细描述了通过添加CLD补偿或相邻帧之间的OPD值之差来修正OPD的方法,所以省略重复的说明。
多声道信号的解码装置300利用关于修正的相位差的参数来对单声道信号进行上混频。即,多声道信号的解码装置300通过利用修正的OPD对单声道信号上混频,消除相位不连续性,从而可最小化音质的劣化。由于已详细说明了上混频单声道信号的方法,所以将省略重复的说明。
此时,可通过由图1说明的根据本发明的另一实施例的多声道信号的编码装置100从比特流接收多声道信号,根据另一实施例的多声道信号的解码装置300可从这种比特流恢复单声道信号和多个参数。此时,如前所述,可通过多个参数提取关于相位差的参数OPD。如此,为了从比特流获得单声道信号并估计OPD,多声道信号的解码装置300还可包括从多声道信号的编码的比特流恢复单声道信号步骤(未图示)、从比特流恢复表示构成多声道信号的多个声道之间的特性关系的多个参数的步骤(未图示)和利用恢复的多个参数估计作为所述的关于相位差的参数的整体相位差(OPD:OverallPhaseDifference)的步骤(未图示)。
如此,根据本发明的实施例,可减少数据传送所必需的数据的量,可提供提高音质的多声道音频信号。
另外,根据本发明的一个实施例实现为可由各种计算机手段执行的程序命令形态,从而可记录到计算机可读记录介质。计算机可读记录介质可包括程序命令、数据文件、数据结构或其组合。记录到所述解释的程序命令可以是为本发明单独设计或构成的,或者计算机软件领域技术人员公知而可使用的。计算机可读记录介质的示例包括诸如硬盘、软盘和磁盘的磁介质(magneticmedia),诸如CD-ROM、DVD的光记录介质(opticalmedia)、诸如磁光盘(flopticaldisk)的磁光介质和只读存储器(ROM)、随机存取存储器(RAM)闪存,程序命令的示例包括诸如由编译器产生的机械代码和通过解释器而能够被计算机使用的高级语言代码。上述的硬件装置可被构成为为了执行根据本发明的一实施例的操作而以一个以上的软件模块进行操作,反之亦然。
如上所述,在本发明中,通过诸如具体的构成要素等特定事项和限定的实施例的和附图来进行了说明,其仅为了有助于更全面地理解本发明而提供,但是在本发明所属的技术领域的技术人员应该理解,可从这些记载进行各种修改和变形。因此,本发明的思想不应局限于所说明的实施例,权利要求和与该权利要求的等同或可进行等同变形的所有内容均属于本发明思想的范围。
Claims (11)
1.一种从下混频的单声道信号产生立体声信号的解码装置,包括:
单声道信号解码单元,从比特流解码所述下混频的单声道信号;
参数解码单元,从所述比特流解码表示声道之间的特性关系的参数;
参数修正单元,通过使用解码的参数,来估计表示左信号和右信号中的一个信号与所述下混频的单声道信号之间的相位差的参数,其中,如果两个声道的相位异相且两个声道的等级相同,则OPD被估计为零;
上混频单元,利用估计的参数和解码的参数,来上混频所述下混频的单声道信号。
2.根据权利要求1所述的解码装置,其中,估计的参数包括整体相位差OPD,解码的参数包括声道等级差CLD和声道间相位差IPD,并且如果IPD为180°且CLD为0,则OPD被估计为零。
3.根据权利要求1所述的解码装置,其中,估计的参数包括整体相位差OPD,解码的参数包括声道等级差CLD和声道间相位差IPD,并且如果两个声道的相位非异相或两个声道的等级不相同,则使用应用到三角函数的IPD估计OPD。
4.根据权利要求1所述的解码装置,其中,估计的参数包括整体相位差OPD,解码的参数包括声道等级差CLD和声道间相位差IPD,并且基于当前帧的相位信息和先前帧的相位信息之间的线性插值获得估计的参数。
5.根据权利要求1所述的解码装置,其中,所述解码的参数包括声道之间的能量差CLD,
所述参数修正单元通过将CLD补偿offset加到所述CLD的值来修正所述估计的OPD。
6.根据权利要求1所述的解码装置,其中,
在当前帧的一个帧之前的先前帧的估计的OPD值与所述当前帧的估计的OPD值之差大于等于预设置的值时,所述参数修正单元修正所述当前帧的估计的OPD值。
7.根据权利要求6所述的解码装置,其中,所述预设置的值包括90°,
当所述差大于等于90°时,所述参数修正单元将OPD值修正180°。
8.一种从以比特流接收的下混频的单声道信号产生立体声信号的解码方法,包括如下步骤:
从比特流解码所述下混频的单声道信号;
从所述比特流解码表示声道之间的特性关系的参数;
通过使用解码的参数,来估计表示左信号和右信号中的一个信号与所述下混频的单声道信号之间的相位差的参数,其中,如果两个声道的相位异相且两个声道的等级相同,则OPD被估计为零;
利用估计的参数和解码的参数,来上混频所述下混频的单声道信号。
9.根据权利要求8所述的解码方法,其中,估计的参数包括整体相位差OPD,解码的参数包括声道等级差CLD和声道间相位差IPD,并且估计参数的步骤中,如果IPD为180°且CLD为0,则OPD被估计为零。
10.根据权利要求8所述的解码方法,其中,估计的参数包括整体相位差OPD,解码的参数包括声道等级差CLD和声道间相位差IPD,并且如果两个声道的相位非异相或两个声道的等级不相同,则使用应用到三角函数的IPD估计OPD。
11.根据权利要求8所述的方法,其中,估计参数的步骤中,基于当前帧的相位信息和先前帧的相位信息之间的线性插值获得估计的参数。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2009-0023158 | 2009-03-18 | ||
KR20090023158 | 2009-03-18 | ||
CN2010800220317A CN102428513B (zh) | 2009-03-18 | 2010-03-18 | 多声道信号的编码/解码装置及方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010800220317A Division CN102428513B (zh) | 2009-03-18 | 2010-03-18 | 多声道信号的编码/解码装置及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103559884A CN103559884A (zh) | 2014-02-05 |
CN103559884B true CN103559884B (zh) | 2016-06-22 |
Family
ID=42738402
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310465155.8A Active CN103559884B (zh) | 2009-03-18 | 2010-03-18 | 多声道信号的编码/解码装置及方法 |
CN2010800220317A Active CN102428513B (zh) | 2009-03-18 | 2010-03-18 | 多声道信号的编码/解码装置及方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010800220317A Active CN102428513B (zh) | 2009-03-18 | 2010-03-18 | 多声道信号的编码/解码装置及方法 |
Country Status (5)
Country | Link |
---|---|
US (4) | US8666752B2 (zh) |
EP (1) | EP2410515B1 (zh) |
KR (2) | KR101650055B1 (zh) |
CN (2) | CN103559884B (zh) |
WO (1) | WO2010107269A2 (zh) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101453732B1 (ko) * | 2007-04-16 | 2014-10-24 | 삼성전자주식회사 | 스테레오 신호 및 멀티 채널 신호 부호화 및 복호화 방법및 장치 |
US8666752B2 (en) | 2009-03-18 | 2014-03-04 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding and decoding multi-channel signal |
WO2011039668A1 (en) * | 2009-09-29 | 2011-04-07 | Koninklijke Philips Electronics N.V. | Apparatus for mixing a digital audio |
KR20110116079A (ko) * | 2010-04-17 | 2011-10-25 | 삼성전자주식회사 | 멀티 채널 신호의 부호화/복호화 장치 및 방법 |
CN103262159B (zh) * | 2010-10-05 | 2016-06-08 | 华为技术有限公司 | 用于对多声道音频信号进行编码/解码的方法和装置 |
JP6051621B2 (ja) * | 2012-06-29 | 2016-12-27 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用コンピュータプログラム、及びオーディオ復号装置 |
KR20140016780A (ko) * | 2012-07-31 | 2014-02-10 | 인텔렉추얼디스커버리 주식회사 | 오디오 신호 처리 방법 및 장치 |
SG10201709574WA (en) | 2012-12-04 | 2018-01-30 | Samsung Electronics Co Ltd | Audio providing apparatus and audio providing method |
EP2838086A1 (en) * | 2013-07-22 | 2015-02-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | In an reduction of comb filter artifacts in multi-channel downmix with adaptive phase alignment |
EP3044783B1 (en) | 2013-09-12 | 2017-07-19 | Dolby International AB | Audio coding |
EP3061089B1 (en) | 2013-10-21 | 2018-01-17 | Dolby International AB | Parametric reconstruction of audio signals |
CN104240712B (zh) * | 2014-09-30 | 2018-02-02 | 武汉大学深圳研究院 | 一种三维音频多声道分组聚类编码方法及系统 |
CN104347077B (zh) * | 2014-10-23 | 2018-01-16 | 清华大学 | 一种立体声编解码方法 |
WO2016142002A1 (en) * | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
DK3353779T3 (da) | 2015-09-25 | 2020-08-10 | Voiceage Corp | Fremgangsmåde og system til kodning af et stereolydssignal ved at anvende kodningsparametre for en primær kanal til at kode en sekundær kanal |
CN107452387B (zh) * | 2016-05-31 | 2019-11-12 | 华为技术有限公司 | 一种声道间相位差参数的提取方法及装置 |
CN107731238B (zh) | 2016-08-10 | 2021-07-16 | 华为技术有限公司 | 多声道信号的编码方法和编码器 |
CN108182947B (zh) * | 2016-12-08 | 2020-12-15 | 武汉斗鱼网络科技有限公司 | 一种声道混合处理方法及装置 |
US10366695B2 (en) * | 2017-01-19 | 2019-07-30 | Qualcomm Incorporated | Inter-channel phase difference parameter modification |
US10224045B2 (en) * | 2017-05-11 | 2019-03-05 | Qualcomm Incorporated | Stereo parameters for stereo decoding |
CN108877815B (zh) * | 2017-05-16 | 2021-02-23 | 华为技术有限公司 | 一种立体声信号处理方法及装置 |
CN109215668B (zh) | 2017-06-30 | 2021-01-05 | 华为技术有限公司 | 一种声道间相位差参数的编码方法及装置 |
CN109859766B (zh) | 2017-11-30 | 2021-08-20 | 华为技术有限公司 | 音频编解码方法和相关产品 |
Family Cites Families (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5463424A (en) * | 1993-08-03 | 1995-10-31 | Dolby Laboratories Licensing Corporation | Multi-channel transmitter/receiver system providing matrix-decoding compatible signals |
US6181394B1 (en) * | 1999-01-22 | 2001-01-30 | White Electronic Designs, Corp. | Super bright low reflection liquid crystal display |
CA2427315C (en) * | 2001-08-31 | 2008-10-14 | Samsung Electronics Co., Ltd. | Apparatus and method for transmitting and receiving forward channel quality information in a mobile communication system |
AU2002307884A1 (en) * | 2002-04-22 | 2003-11-03 | Nokia Corporation | Method and device for obtaining parameters for parametric speech coding of frames |
AU2003216686A1 (en) * | 2002-04-22 | 2003-11-03 | Koninklijke Philips Electronics N.V. | Parametric multi-channel audio representation |
WO2004072956A1 (en) * | 2003-02-11 | 2004-08-26 | Koninklijke Philips Electronics N.V. | Audio coding |
ATE430360T1 (de) * | 2004-03-01 | 2009-05-15 | Dolby Lab Licensing Corp | Mehrkanalige audiodekodierung |
KR100561869B1 (ko) * | 2004-03-10 | 2006-03-17 | 삼성전자주식회사 | 무손실 오디오 부호화/복호화 방법 및 장치 |
CA2572805C (en) | 2004-07-02 | 2013-08-13 | Matsushita Electric Industrial Co., Ltd. | Audio signal decoding device and audio signal encoding device |
US8046217B2 (en) * | 2004-08-27 | 2011-10-25 | Panasonic Corporation | Geometric calculation of absolute phases for parametric stereo decoding |
WO2006022190A1 (ja) * | 2004-08-27 | 2006-03-02 | Matsushita Electric Industrial Co., Ltd. | オーディオエンコーダ |
SE0402650D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Improved parametric stereo compatible coding of spatial audio |
DE602005017660D1 (de) * | 2004-12-28 | 2009-12-24 | Panasonic Corp | Audiokodierungsvorrichtung und audiokodierungsmethode |
WO2007043388A1 (ja) * | 2005-10-07 | 2007-04-19 | Matsushita Electric Industrial Co., Ltd. | 音響信号処理装置および音響信号処理方法 |
EP1994796A1 (en) * | 2006-03-15 | 2008-11-26 | Dolby Laboratories Licensing Corporation | Binaural rendering using subband filters |
US8379868B2 (en) * | 2006-05-17 | 2013-02-19 | Creative Technology Ltd | Spatial audio coding based on universal spatial cues |
US8326609B2 (en) * | 2006-06-29 | 2012-12-04 | Lg Electronics Inc. | Method and apparatus for an audio signal processing |
MX2008012251A (es) * | 2006-09-29 | 2008-10-07 | Lg Electronics Inc | Metodos y aparatos para codificar y descodificar señales de audio basadas en objeto. |
CA2669091C (en) * | 2006-11-15 | 2014-07-08 | Lg Electronics Inc. | A method and an apparatus for decoding an audio signal |
FR2911020B1 (fr) | 2006-12-28 | 2009-05-01 | Actimagine Soc Par Actions Sim | Procede et dispositif de codage audio |
KR101049143B1 (ko) * | 2007-02-14 | 2011-07-15 | 엘지전자 주식회사 | 오브젝트 기반의 오디오 신호의 부호화/복호화 장치 및 방법 |
WO2008120933A1 (en) | 2007-03-30 | 2008-10-09 | Electronics And Telecommunications Research Institute | Apparatus and method for coding and decoding multi object audio signal with multi channel |
KR101453732B1 (ko) * | 2007-04-16 | 2014-10-24 | 삼성전자주식회사 | 스테레오 신호 및 멀티 채널 신호 부호화 및 복호화 방법및 장치 |
KR101505831B1 (ko) * | 2007-10-30 | 2015-03-26 | 삼성전자주식회사 | 멀티 채널 신호의 부호화/복호화 방법 및 장치 |
WO2010036059A2 (en) | 2008-09-25 | 2010-04-01 | Lg Electronics Inc. | A method and an apparatus for processing a signal |
KR101600352B1 (ko) * | 2008-10-30 | 2016-03-07 | 삼성전자주식회사 | 멀티 채널 신호의 부호화/복호화 장치 및 방법 |
US8666752B2 (en) * | 2009-03-18 | 2014-03-04 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding and decoding multi-channel signal |
KR101356972B1 (ko) * | 2009-04-08 | 2014-02-05 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 위상값 평활화를 이용하여 다운믹스 오디오 신호를 업믹스하는 장치, 방법 및 컴퓨터 프로그램 |
KR101710113B1 (ko) * | 2009-10-23 | 2017-02-27 | 삼성전자주식회사 | 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법 |
US9112591B2 (en) * | 2010-04-16 | 2015-08-18 | Samsung Electronics Co., Ltd. | Apparatus for encoding/decoding multichannel signal and method thereof |
-
2010
- 2010-03-17 US US12/659,696 patent/US8666752B2/en active Active
- 2010-03-18 EP EP10753719.3A patent/EP2410515B1/en active Active
- 2010-03-18 KR KR1020100024481A patent/KR101650055B1/ko active IP Right Grant
- 2010-03-18 WO PCT/KR2010/001698 patent/WO2010107269A2/ko active Application Filing
- 2010-03-18 US US13/257,229 patent/US8537913B2/en active Active
- 2010-03-18 CN CN201310465155.8A patent/CN103559884B/zh active Active
- 2010-03-18 CN CN2010800220317A patent/CN102428513B/zh active Active
-
2012
- 2012-05-04 US US13/464,509 patent/US8767850B2/en active Active
-
2014
- 2014-03-03 US US14/195,045 patent/US9384740B2/en active Active
-
2016
- 2016-08-16 KR KR1020160103757A patent/KR101747307B1/ko active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
KR101650055B1 (ko) | 2016-08-23 |
CN103559884A (zh) | 2014-02-05 |
WO2010107269A2 (ko) | 2010-09-23 |
KR20160102364A (ko) | 2016-08-30 |
EP2410515B1 (en) | 2018-07-18 |
US20140177849A1 (en) | 2014-06-26 |
US8767850B2 (en) | 2014-07-01 |
KR20100105496A (ko) | 2010-09-29 |
US8666752B2 (en) | 2014-03-04 |
US20100241436A1 (en) | 2010-09-23 |
EP2410515A4 (en) | 2013-11-27 |
CN102428513A (zh) | 2012-04-25 |
EP2410515A2 (en) | 2012-01-25 |
US9384740B2 (en) | 2016-07-05 |
US20120221343A1 (en) | 2012-08-30 |
CN102428513B (zh) | 2013-11-06 |
US20120069921A1 (en) | 2012-03-22 |
KR101747307B1 (ko) | 2017-06-14 |
US8537913B2 (en) | 2013-09-17 |
WO2010107269A3 (ko) | 2010-12-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103559884B (zh) | 多声道信号的编码/解码装置及方法 | |
CN102834863B (zh) | 用于包括通用音频和语音帧的音频信号的解码器 | |
CN103119647B (zh) | 基于改进型离散余弦变换的复数预测立体声编码 | |
US8065136B2 (en) | Multi-channel encoder | |
CN102292767B (zh) | 立体声音响信号编码装置、立体声音响信号解码装置及它们的编解码方法 | |
CN100559465C (zh) | 保真度优化的可变帧长编码 | |
CN1947172B (zh) | 方法、装置、编码器设备、解码器设备以及音频系统 | |
CN102483921B (zh) | 用于对多声道音频信号进行编码和解码的方法和设备 | |
JP5154538B2 (ja) | オーディオ復号 | |
US8861738B2 (en) | Method, medium, and system encoding/decoding multi-channel signal | |
CN102292772B (zh) | 多声道信号的编码/解码装置和方法 | |
CN103460283A (zh) | 确定多信道音频信号的编码参数的方法及多信道音频编码器 | |
CN101297352A (zh) | 用于编码和解码音频信号的装置及其方法 | |
CN101673545B (zh) | 一种编解码方法及装置 | |
DK3201918T3 (en) | DECODING PROCEDURE AND DECODS FOR DIALOGUE IMPROVEMENT | |
US8824577B2 (en) | Apparatus and method for encoding and decoding multichannel signal | |
US20110051938A1 (en) | Method and apparatus for encoding and decoding stereo audio | |
CN105393304A (zh) | 用于音频编码和解码的方法、对应的计算机可读介质以及对应的音频编码器和解码器 | |
US8781134B2 (en) | Method and apparatus for encoding and decoding stereo audio | |
US8744089B2 (en) | Method and apparatus for encoding and decoding stereo audio | |
CN104205211A (zh) | 多声道音频编码器以及用于对多声道音频信号进行编码的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |