CN102157150B - 立体声解码方法及装置 - Google Patents

立体声解码方法及装置 Download PDF

Info

Publication number
CN102157150B
CN102157150B CN2010101114321A CN201010111432A CN102157150B CN 102157150 B CN102157150 B CN 102157150B CN 2010101114321 A CN2010101114321 A CN 2010101114321A CN 201010111432 A CN201010111432 A CN 201010111432A CN 102157150 B CN102157150 B CN 102157150B
Authority
CN
China
Prior art keywords
sound channel
frequency
region signal
signal
channel signals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2010101114321A
Other languages
English (en)
Other versions
CN102157150A (zh
Inventor
吴文海
苗磊
郎玥
张琦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN2010101114321A priority Critical patent/CN102157150B/zh
Priority to PCT/CN2010/079413 priority patent/WO2011097916A1/zh
Publication of CN102157150A publication Critical patent/CN102157150A/zh
Priority to US13/437,552 priority patent/US9443524B2/en
Application granted granted Critical
Publication of CN102157150B publication Critical patent/CN102157150B/zh
Priority to US15/210,644 priority patent/US9584944B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/005Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo five- or more-channel type, e.g. virtual surround
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)
  • Stereo-Broadcasting Methods (AREA)

Abstract

本发明实施例涉及一种立体声解码方法及装置,其中方法包括:从接收到的码流中解码恢复出单声道信号;从所述接收到的码流中解码恢复出两声道信号间的电平差、群延时和群相位;根据所述两声道信号间的电平差、群延时和群相位,对所述单声道信号进行处理得到第一声道信号和第二声道信号。本发明实施例提供的立体声解码方法及装置根据单声道信号、ILD、群延时和群相位,得到第一声道信号和第二声道信号,不仅参考ILD,还参考了群延时和群相位,这样得到的第一声道信号和第二声道信号的立体声声场效果较优。

Description

立体声解码方法及装置
技术领域
本发明实施例涉及通信技术领域,尤其涉及一种立体声解码方法及装置。 
背景技术
目前立体声编码方法主要包括强度立体声、BCC(Binaual Cure Coding)和PS(Parametric-Stereo coding)等编码方法,在中高码率的通信场景下,通常的编码方法是提取两声道(如左右声道)信号间的电平差(InterChannel Level Difference,简称:ILD)(也可简称:CLD)和两声道信号间的相位差(InterChannel Phase Difference,简称:IPD),在某些情况下也可以提取两声道互相关参数以及其中一声道与下混信号的相位差参数,将这些参数作为边信息进行编码并发送到解码端,以恢复立体声信号。然而在低码率的通信场景下,不能同时传输ILD和IPD,优先需要传输的是ILD,将该ILD进行编码并发送到解码端,以恢复立体声信号。 
根据以上立体声编码方法,对应的立体声解码方法即为:从码流中提取单声道比特信号,解码后得到单声道信号,将单声道信号进行时频变换得到单声道频域信号;在中高码率的通信场景下,从码流中提取ILD和IPD,根据单声道频域信号以及ILD和IPD,得到左声道频域信号和右声道频域信号;在低码率的通信场景下,从码流中提取ILD,根据单声道频域信号以及ILD,得到左声道频域信号和右声道频域信号;将左声道频域信号和右声道频域信号分别进行频时变换得到左声道信号和右声道信号。 
上述低码率通信场景的立体声解码方法达到声场效果所参考的参数仅为ILD,也就是说,该解码方法得到的信号仅包含两声道信号间的能量大小信息,导致得到的左声道信号和右声道信号的立体声声场效果较差。 
发明内容
本发明实施例提供了一种立体声解码方法及装置,使解码得到的第一声道信号和第二声道信号的立体声声场效果较优。 
本发明实施例提供的立体声解码方法,包括: 
从接收到的码流中解码恢复出单声道信号; 
从所述接收到的码流中解码恢复出两声道信号间的电平差、群延时和群相位; 
根据所述两声道信号间的电平差、群延时和群相位,对所述单声道信号进行处理得到第一声道信号和第二声道信号;其中,所述根据所述两声道信号间的电平差、群延时和群相位,对所述单声道信号进行处理得到第一声道信号和第二声道信号包括: 
将所述单声道信号进行时频变换处理,得到单声道频域信号; 
根据所述群延时和群相位,得出两声道信号间的相位差估计值; 
根据所述两声道信号间的电平差和所述两声道信号间的相位差估计值,对所述单声道频域信号进行处理得到第一声道频域信号和第二声道频域信号; 
将所述第一声道频域信号和第二声道频域信号分别进行频时变换处理,得到所述第一声道信号和第二声道信号。 
本发明实施例提供的立体声解码装置,包括: 
信号解码模块,用于从接收到的码流中解码恢复出单声道信号; 
参数解码模块,用于从所述接收到的码流中解码恢复出两声道信号间的电平差、群延时和群相位; 
信号获取模块,用于根据所述两声道信号间的电平差、群延时和群相位,对所述单声道信号进行处理得到第一声道信号和第二声道信号; 
其中,所述信号获取模块包括: 
第一处理子模块,用于将所述单声道信号进行时频变换处理,得到单声道频域信号; 
第一相位差获取子模块,用于根据所述群延时和群相位,得出两声道信号间的相位差估计值; 
第一频域信号获取子模块,用于根据所述两声道信号间的电平差和所述两声道信号间的相位差估计值,对所述单声道频域信号进行处理得到第一声道频域信号和第二声道频域信号; 
第一信号获取子模块,用于将所述第一声道频域信号和第二声道频域信号分别进行频时变换处理,得到所述第一声道信号和第二声道信号。 
本发明实施例提供的立体声解码方法及装置适用于低码率的通信场景,其中接收到的码流中包括编码的单声道信号,并且至少包括编码的ILD、群延时和群相位,群延时和群相位所占用的带宽资源较少,用两个全局的相位和相似信息来增强声场效果,达到在较小的码率下,提升声场效果;本发明 实施例提供的立体声解码方法及装置根据单声道信号、ILD、群延时和群相位,得到第一声道信号和第二声道信号,不仅参考ILD,还参考了群延时和群相位,也就是说,本发明实施例得到的信号不仅包含两声道信号间的能量大小信息,还包含两声道信号间的全局时间延时信息和全局波形相似性信息,这样得到的第一声道信号和第二声道信号的立体声声场效果较优。 
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。 
图1为本发明实施例一提供的立体声解码方法的流程图; 
图2为本发明实施例二提供的立体声解码方法的流程图; 
图3为本发明实施例三提供的立体声解码方法的流程图; 
图4为本发明实施例四提供的立体声解码方法的流程图; 
图5为本发明实施例五提供的立体声解码方法的流程图; 
图6为本发明实施例六提供的立体声解码装置的结构示意图; 
图7为本发明实施例七提供的立体声解码装置的结构示意图; 
图8为本发明实施例八提供的立体声解码装置的结构示意图; 
图9为本发明实施例九提供的立体声解码装置的结构示意图; 
图10为本发明实施例十提供的立体声解码装置的结构示意图。 
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。 
图1为本发明实施例一提供的立体声解码方法的流程图。如图1所示,本实施例包括如下步骤: 
步骤100、从接收到的码流中解码恢复出单声道信号; 
步骤101、从接收到的码流中解码恢复出ILD、群延时(group delay)和群相位(group phase) 
步骤101、从接收到的码流中解码恢复出ILD、群延时(group delay)和群相位(group phase); 
其中,群延时表示两声道信号间包络的时间延时的全局方位信息,群相位表示两声道信号在时间对齐后的波形相似性的全局信息。 
步骤102、根据ILD、群延时和群相位,对单声道信号进行处理得到第一声道信号和第二声道信号。 
本实施例提供的立体声解码方法适用于低码率的通信场景,其中接收到的码流中包括编码的单声道信号,并且至少包括编码的ILD、群延时和群相位,群延时和群相位所占用的带宽资源较少,用两个全局的相位和相似信息来增强声场效果,达到在较小的码率下,提升声场效果;本实施例提供的立体声解码方法根据单声道信号、ILD、群延时和群相位,得到第一声道信号和第二声道信号,通过参考ILD使得得到的信号包含两声道信号间的能量大小信息,通过参考群延时和群相位使得得到的信号包含两声道信号间的全局时间延时信息和全局波形相似性信息,进而使得得到的第一声道信号和第二声道信号的立体声声场效果较优。 
本发明实施例可以适用于低码率的通信场景。具体地,在上述实施例一的基础上,步骤102可以包括:将单声道信号进行时频变换处理,得到单声道频域信号;根据群延时和群相位,得出IPD估计值;根据ILD和IPD估计值,对单声道频域信号进行处理得到第一声道频域信号和第二声道频域信号;将第一声道频域信号和第二声道频域信号分别进行频时变换处理,得到第一声道信号和第二声道信号。下面通过实施例二和实施三对该技术方案进行进一步说明。 
图2为本发明实施例二提供的立体声解码方法的流程图。本实施例中,第一声道为左声道,第二声道为右声道,如图2所示,本实施例包括如下步骤: 
步骤200、从接收到的码流中解码恢复出单声道信号。 
具体地,从码流中提取单声道比特信号,经过单声道信号(Mono)解码器将单声道比特信号进行解码恢复出单声道信号,该单声道信号也称为下混 信号。 
步骤201、从接收到的码流中解码恢复出ILD、群延时和群相位。 
其中群延时表示为dg′,群相位表示为θg′。一个正弦信号sin(wt),经过群相位后为sin(wt-Q)。在sin(wt-Q)=sin(w(t-Q/w))中,Q/w就是群相位(group phase)。群延时(group delay)称为包络时延,信号传输时,总相移随角频率而变化的速度,亦即相位一频率特性曲线的斜率。对于一般的传输系统,传输函数可以写成:H(jw)=A(w)-B(w),其中,A(w)为幅度一频率特性,B(w)为相位一频率特性:B(w)对w的一次导数,t(w)=dB(w)/dw即为传输系统的群延时。 
步骤202、将单声道信号进行时频变换处理,得到单声道频域信号。 
将该单声道信号进行时频变换处理,得到单声道频域信号。单声道频域信号表示为M′(k)。 
步骤203、根据群延时和群相位,得出IPD估计值。 
从码流中解码恢复出群延时dg′和群相位θg′,采用如下公式(1.1)估计出IPD估计值: 
IPD ′ ( k ) = - 2 π d g ′ * k N + θ g ′ - - - ( 1.1 )
将频域信号分成若干个频带,设将频域信号分成M个频带,k为频率点索引,b为频带索引,N为时频变换的长度,其中k=0,...,N-1,b=0,...,M-1。公式(1.1)中,IPD′(k)为索引为k的频率点的IPD估计值。 
步骤204、根据ILD,对单声道频域信号的能量进行处理,得到左声道频域信号的能量和右声道频域信号的能量。 
具体地,采用如下公式(1.2)和(1.3)得到左声道频域信号的能量|X′1(k)|和右声道频域信号的能量|X′2(k)|: 
| X ′ 1 ( k ) | = | M ′ ( k ) | * c ( b ) 1 + c ( b ) - - - ( 1.2 )
| X ′ 2 ( k ) | = | M ′ ( k ) | * 1 1 + c ( b ) - - - ( 1.3 )
其中,c(b)=10ILD′(b)/10,ILD′(b)为索引为b的频带的ILD,|M′(k)|为单声道频域信号的能量。 
步骤205、根据ILD和IPD估计值,对单声道频域信号的相位进行处理,得到左声道频域信号的相位和右声道频域信号的相位。 
具体地,采用如下公式(1.4)和(1.5)得到左声道频域信号的相位∠X′1(k)和右声道频域信号的相位∠X′2(k): 
∠ X ′ 1 ( k ) = ∠ M ′ ( k ) + 1 1 + c ( b ) IPD ′ ( k ) - - - ( 1.4 )
∠ X ′ 2 ( k ) = ∠ M ′ ( k ) - c ( b ) 1 + c ( b ) IPD ′ ( k ) - - - ( 1 . 5 )
其中,∠M′(k)为单声道频域信号的相位。 
本步骤采用由群延时dg′和群相位θg′得到的IPD′(k)代替IPD来计算得到左右声道频域信号的相位。 
步骤206、根据左声道频域信号的能量和右声道频域信号的能量,以及左声道频域信号的相位和右声道频域信号的相位,得到左声道频域信号和右声道频域信号。 
具体地,采用如下公式(1.6)和(1.7)得到左声道频域信号X1′(k)和右声道频域信号X2′(k): 
X1′(k)=|X1′(k)|*ej∠X1′(k)           (1.6) 
X 2 ′ ( k ) = | X 2 ′ ( k ) | * e j ∠ X 2 ′ ( k ) - - - ( 1.7 )
步骤207、将左声道频域信号和右声道频域信号分别进行频时变换处理,得到左声道输出信号和右声道输出信号。 
本实施例提供的立体声解码方法适用于低码率的通信场景,其中接收到的码流包括编码的单声道信号,并且至少包括编码的ILD、群延时和群相位,群延时和群相位所占用的带宽资源较少,不会影响码率;本实施例提供的立 体声解码方法根据ILD,通过对单声道频域信号的能量进行处理,得到左右声道信号的能量,根据由群延时和群相位得出的IPD估计值和ILD,通过对单声道频域信号的能量进行处理,得到左右声道信号的相位,使得得到的信号不仅包含两声道信号间的能量大小信息,还包含两声道信号间的时间延时信息和波形相似性信息,进而使得得到的左声道信号和右声道信号的立体声声场效果较优。 
图3为本发明实施例三提供的立体声解码方法的流程图。本实施例中,第一声道为左声道,第二声道为右声道,如图3所示,本实施例包括如下步骤: 
步骤300、从接收到的码流中解码恢复出单声道信号。 
具体地,从码流中提取单声道比特信号,经过单声道信号(Mono)解码器将单声道比特信号进行解码恢复出单声道信号,该单声道信号也称为下混信号。 
步骤301、从接收到的码流中解码恢复出ILD、群延时和群相位。 
其中群延时表示为dg′,群相位表示为θg′。 
步骤302、将单声道信号进行时频变换处理,得到单声道频域信号。 
将该单声道信号进行时频变换处理,得到单声道频域信号。单声道频域信号表示为M′(k)。 
步骤303、根据群延时和群相位,得出IPD估计值。 
从码流中解码恢复出群延时dg′和群相位θg′,采用如下公式(2.1)估计出IPD估计值: 
IPD ′ ( k ) = - 2 π d g ′ * k N + θ g ′ - - - ( 2 . 1 )
将频域信号分成若干个频带,设将频域信号分成M个频带,k为频率点索引,b为频带索引,N为时频变换的长度,其中k=0,...,N-1,b=0,...,M-1。公式(2.1)中,IPD′(k)为索引为k的频率点的IPD估计值。 
步骤304、根据ILD,对单声道频域信号的能量进行处理,得到左声道频域信号的能量和右声道频域信号的能量。 
具体地,采用如下公式(2.2)和(2.3)得到左声道频域信号的能量|X′1(k)|和右声道频域信号的能量|X′2(k)|: 
| X ′ 1 ( k ) | = | M ′ ( k ) | * c ( b ) 1 + c ( b ) - - - ( 2 . 2 )
| X ′ 2 ( k ) | = | M ′ ( k ) | * 1 1 + c ( b ) - - - ( 2 . 3 )
其中,c(b)=10ILD′(b)/10,ILD′(b)为索引为b的频带的ILD,|M′(k)|为单声道频域信号的能量。 
步骤305、当群延时为0时,根据IPD估计值,对单声道频域信号的相位进行处理,得到左声道频域信号的相位和右声道频域信号的相位;当群延时不为0时,根据ILD和IPD估计值,对单声道频域信号的相位进行处理,得到左声道频域信号的相位和右声道频域信号的相位。 
具体地,当dg′=0时,采用如下公式(2.4)和(2.5)得到左声道频域信号的相位∠X′1(k)和右声道频域信号的相位∠X′2(k): 
∠X′1(k)=∠M′(k)                    (2.4) 
∠X′2(k)=∠M′(k)-IPD′(k)           (2.5) 
其中,∠M′(k)为单声道频域信号的相位。 
在dg′=0的情况下,左声道保持单声道频域信号的相位,而右声道的相位是单声道频域信号的相位与由群延时dg′和群相位θg′得到的IPD′(k)的差。 
当dg′≠0时,采用如下公式(2.6)和(2.7)得到左声道频域信号的相位∠X′1(k)和右声道频域信号的相位∠X′2(k): 
∠ X ′ 1 ( k ) = ∠ M ′ ( k ) + 1 1 + c ( b ) IPD ′ ( k ) - - - ( 2 . 6 )
∠ X ′ 2 ( k ) = ∠ M ′ ( k ) - c ( b ) 1 + c ( b ) IPD ′ ( k ) - - - ( 2.7 )
在dg′≠0的情况下,采用由群延时dg′和群相位θg′得到的IPD′(k)代替IPD来计算得到左右声道频域信号的相位。 
步骤306、根据左声道频域信号的能量和右声道频域信号的能量,以及左声道频域信号的相位和右声道频域信号的相位,得到左声道频域信号和右声道频域信号。 
具体地,采用如下公式(2.8)和(2.9)得到左声道频域信号X1′(k)和右声道频域信号X2′(k): 
X1′(k)=|X1′(k)|*ej∠X1′(k)             (2.8) 
X 2 ′ ( k ) = | X 2 ′ ( k ) | * e j ∠ X 2 ′ ( k ) - - - ( 2.9 )
步骤307、将左声道频域信号和右声道频域信号分别进行频时变换处理,得到左声道输出信号和右声道输出信号。 
本实施例提供的立体声解码方法适用于低码率的通信场景,其中接收到的码流包括编码的单声道信号,并且至少包括编码的ILD、群延时和群相位,群延时和群相位所占用的带宽资源较少,不会影响码率;本实施例提供的立体声解码方法根据ILD,通过对单声道频域信号的能量进行处理,得到左右声道信号的能量,当群延时为0时,根据由群延时和群相位得出的IPD估计值,通过对单声道频域信号的能量进行处理,得到左右声道信号的相位,当群延时不为0时,根据由群延时和群相位得出的IPD估计值和ILD,通过对单声道频域信号的能量进行处理,得到左右声道信号的相位,使得得到的信号不仅包含两声道信号间的能量大小信息,还包含两声道信号间的时间延时信息和波形相似性信息,进而使得得到的左声道信号和右声道信号的立体声声场效果较优。 
本发明实施例也可以适用于中高码率的通信场景。具体地,在上述实施例一的基础上,步骤101中还包括从接收到的码流中解码恢复出IPD的差分值,步骤102也可以具体为根据ILD、IPD的差分值、群延时和群相位,对 单声道信号进行处理得到第一声道信号和第二声道信号。 
具体地,步骤103可以包括:将单声道信号进行时频变换处理,得到单声道频域信号;根据群延时和群相位,得出IPD估计值;根据IPD估计值和IPD的差分值,得到IPD;根据ILD和IPD,对单声道频域信号进行处理得到第一声道频域信号和第二声道频域信号;将第一声道频域信号和第二声道频域信号分别进行频时变换处理,得到第一声道信号和第二声道信号。下面通过实施例四和实施例五对该技术方案进行进一步说明。 
图4为本发明实施例四提供的立体声解码方法的流程图。本实施例中,第一声道为左声道,第二声道为右声道,如图4所示,本实施例包括如下步骤: 
步骤400、从接收到的码流中解码恢复出单声道信号。 
具体地,从码流中提取单声道比特信号,经过单声道信号(Mono)解码器将单声道比特信号进行解码恢复出单声道信号,该单声道信号也称为下混信号。 
步骤401、从接收到的码流中解码恢复出ILD、IPD的差分值、群延时和群相位。 
其中群延时表示为dg′,群相位表示为θg′。 
步骤402、将单声道信号进行时频变换处理,得到单声道频域信号。 
将该单声道信号进行时频变换处理,得到单声道频域信号。单声道频域信号表示为M′(k)。 
步骤403、根据群延时和群相位,得出IPD估计值。 
从码流中解码恢复出群延时dg′和群相位θg′,采用如下公式(3.1)估计出IPD估计值: 
IPD ′ ( k ) ‾ = - 2 π d g ′ * k N + θ g ′ - - - ( 3 . 1 )
将频域信号分成若干个频带,设将频域信号分成M个频带,k为频率点 索引,b为频带索引,N为时频变换的长度,其中k=0,...,N-1,b=0,...,M-1。公式(3.1)中,IPD′(k)为索引为k的频率点的IPD估计值。 
步骤404、根据IPD的差分值和IPD估计值,得到IPD。 
从码流中解码恢复出IPD的差分值IPDdiff′(k),将IPDdiff′(k)与IPD估计值 IPD′(k)相加得到IPD,用IPD′(k)表示,参见公式(3.2): 
IPD′(k)=IPDdiff′(k)+IPD′(k)               (3.2) 
步骤405、根据ILD,对单声道频域信号的能量进行处理,得到左声道频域信号的能量和右声道频域信号的能量。 
具体地,采用如下公式(3.3)和(3.4)得到左声道频域信号的能量|X′1(k)|和右声道频域信号的能量|X′2(k)|: 
| X ′ 1 ( k ) | = | M ′ ( k ) | * c ( b ) 1 + c ( b ) - - - ( 3.3 )
| X ′ 2 ( k ) | = | M ′ ( k ) | * 1 1 + c ( b ) - - - ( 3.4 )
其中,c(b)=10ILD′(b)/10,ILD′(b)为索引为b的频带的ILD,|M′(k)|为单声道频域信号的能量。 
步骤406、根据ILD和IPD,对单声道频域信号的相位进行处理,得到左声道频域信号的相位和右声道频域信号的相位。 
具体地,采用如下公式(3.5)和(3.6)得到左声道频域信号的相位∠X′1(k)和右声道频域信号的相位∠X′2(k): 
∠ X ′ 1 ( k ) = ∠ M ′ ( k ) + 1 1 + c ( b ) IPD ′ ( k ) - - - ( 3.5 )
∠ X ′ 2 ( k ) = ∠ M ′ ( k ) - c ( b ) 1 + c ( b ) IPD ′ ( k ) - - - ( 3.6 )
其中,∠M′(k)为单声道频域信号的相位。 
本步骤采用由IPD的差分值和IPD估计值得到的IPD计算得到左右声道频域信号的相位。 
步骤407、根据左声道频域信号的能量和右声道频域信号的能量,以及左声道频域信号的相位和右声道频域信号的相位,得到左声道频域信号和右声道频域信号。 
具体地,采用如下公式(3.7)和(3.8)得到左声道频域信号X1′(k)和右声道频域信号X2′(k): 
X1′(k)=|X1′(k)|*ej∠X1′(k)                  (3.7) 
X 2 ′ ( k ) = | X 2 ′ ( k ) | * e j ∠ X 2 ′ ( k ) - - - ( 3.8 )
步骤408、将左声道频域信号和右声道频域信号分别进行频时变换处理,得到左声道输出信号和右声道输出信号。 
本实施例提供的立体声解码方法适用于中高码率的通信场景,其中接收到的码流包括编码的单声道信号,并且包括编码的ILD、IPD的差分值、群延时和群相位,群延时和群相位所占用的带宽资源较少,不会影响码率;本实施例提供的立体声解码方法根据ILD,通过对单声道频域信号的能量进行处理,得到左右声道信号的能量,采用根据由群延时和群相位得出的IPD估计值和IPD的差分值得到的IPD计算得到左右声道频域信号的相位,使得得到的信号不仅包含两声道信号间的能量大小信息,还包含两声道信号间的时间延时信息和波形相似性信息,进而使得得到的左声道信号和右声道信号的立体声声场效果较优。 
图5为本发明实施例五提供的立体声解码方法的流程图。本实施例中,第一声道为左声道,第二声道为右声道,如图5所示,本实施例包括如下步骤: 
步骤500、从接收到的码流中解码恢复出单声道信号。 
具体地,从码流中提取单声道比特信号,经过单声道信号(Mono)解码器将单声道比特信号进行解码恢复出单声道信号,该单声道信号也称为下混信号。 
步骤501、从接收到的码流中解码恢复出ILD、IPD的差分值、群延时和 群相位。 
其中群延时表示为dg′,群相位表示为θg′。 
步骤502、将单声道信号进行时频变换处理,得到单声道频域信号。 
将该单声道信号进行时频变换处理,得到单声道频域信号。单声道频域信号表示为M′(k)。 
步骤503、根据群延时和群相位,得出IPD估计值。 
从码流中解码恢复出群延时dg′和群相位θg′,采用如下公式(4.1)估计出IPD估计值: 
IPD ′ ( k ) ‾ = - 2 π d g ′ * k N + θ g ′ - - - ( 4 . 1 )
将频域信号分成若干个频带,设将频域信号分成M个频带,k为频率点索引,b为频带索引,N为时频变换的长度,其中k=0,...,N-1,b=0,...,M-1。公式(4.1)中,IPD′(k)为索引为k的频率点的IPD估计值。 
步骤504、根据IPD的差分值和IPD估计值,得到IPD。 
从码流中解码恢复出IPD的差分值IPDdiff′(k),将IPDdiff′(k)与IPD估计值 IPD′(k)相加得到IPD,用IPD′(k)表示,参见公式(4.2): 
IPD′(k)=IPDdiff′(k)+IPD′(k)                   (4.2) 
步骤505、根据ILD,对单声道频域信号的能量进行处理,得到左声道频域信号的能量和右声道频域信号的能量。 
具体地,采用如下公式(4.3)和(4.4)得到左声道频域信号的能量|X′1(k)|和右声道频域信号的能量|X′2(k)|: 
| X ′ 1 ( k ) | = | M ′ ( k ) | * c ( b ) 1 + c ( b ) - - - ( 4 . 3 )
| X ′ 2 ( k ) | = | M ′ ( k ) | * 1 1 + c ( b ) - - - ( 4.4 )
其中,c(b)=10ILD′(b)/10,ILD′(b)为索引为b的频带的ILD,|M′(k)|为单声道频域信号的能量。 
步骤506、当群延时为0时,根据ILD、IPD和群相位,对单声道频域信号的相位进行处理,得到左声道频域信号的相位和右声道频域信号的相位;当群延时不为0时,根据ILD和IPD,对单声道频域信号的相位进行处理,得到左声道频域信号的相位和右声道频域信号的相位。 
具体地,当dg′=0时,采用如下公式(4.5)和(4.6)得到左声道频域信号的相位∠X′1(k)和右声道频域信号的相位∠X′2(k): 
∠ X 1 ′ ( k ) = ∠ M ′ ( k ) + 1 1 + c ( b ) ( IPD ′ ( k ) - θ ′ g ) - - - ( 4.5 )
∠ X 2 ′ ( k ) = ∠ M ′ ( k ) + 1 1 + c ( b ) ( IPD ′ ( k ) - θ ′ g ) - IPD ′ ( k ) - - - ( 4.6 )
其中,∠M′(k)为单声道频域信号的相位。IPD′(k)-θ′g的取值范围也为(-pi,pi]。 
当dg′≠0时,采用如下公式(4.7)和(4.8)得到左声道频域信号的相位∠X′1(k)和右声道频域信号的相位∠X′2(k): 
∠ X ′ 1 ( k ) = ∠ M ′ ( k ) + 1 1 + c ( b ) IPD ′ ( k ) - - - ( 4.7 )
∠ X ′ 2 ( k ) = ∠ M ′ ( k ) - c ( b ) 1 + c ( b ) IPD ′ ( k ) - - - ( 4.8 )
在dg′≠0的情况下,采用由IPD的差分值和IPD估计值得到的IPD计算得到左右声道频域信号的相位。 
步骤507、根据左声道频域信号的能量和右声道频域信号的能量,以及左声道频域信号的相位和右声道频域信号的相位,得到左声道频域信号和右声道频域信号。 
具体地,采用如下公式(4.9)和(4.10)得到左声道频域信号X1′(k)和右声道频域信号X2′(k): 
X1′(k)=|X1′(k)|*ej∠X1′(k)                    (4.9) 
X 2 ′ ( k ) = | X 2 ′ ( k ) | * e j ∠ X 2 ′ ( k ) - - - ( 4.10 )
步骤508、将左声道频域信号和右声道频域信号分别进行频时变换处理,得到左声道输出信号和右声道输出信号。 
本实施例提供的立体声解码方法适用于中高码率的通信场景,其中接收到的码流包括编码的单声道信号,并且包括编码的ILD、IPD的差分值、群延时和群相位,群延时和群相位所占用的带宽资源较少,不会影响码率;本实施例提供的立体声解码方法根据ILD,通过对单声道频域信号的能量进行处理,得到左右声道信号的能量,当群延时为0时,根据ILD、IPD以及群相位计算得到左右声道频域信号的相位,当群延时不为0时,根据ILD、IPD计算得到左右声道频域信号的相位,其中IPD是根据由群延时和群相位得出的IPD估计值和IPD的差分值得到的,使得得到的信号不仅包含两声道信号间的能量大小信息,还包含两声道信号间的时间延时信息和波形相似性信息,进而使得得到的左声道信号和右声道信号的立体声声场效果较优。 
图6为本发明实施例六提供的立体声解码装置的结构示意图。如图6所示,本实施例具体包括:信号解码模块11、参数解码模块12和信号获取模块13,其中: 
信号解码模块11用于从接收到的码流中解码恢复出单声道信号; 
参数解码模块12用于从接收到的码流中解码恢复出ILD、群延时和群相位; 
信号获取模块13用于根据ILD、群延时和群相位,对单声道信号进行处理得到第一声道信号和第二声道信号。 
具体地,信号解码模块11从码流中提取单声道比特信号,将单声道比特信号进行解码恢复出单声道信号;参数解码模块12从码流中解码恢复出ILD、群延时和群相位;信号获取模块13根据ILD、群延时和群相位,对单声道信号进行处理得到第一声道信号和第二声道信号。 
本实施例提供的立体声解码装置适用于低码率的通信场景,其中接收到的码流中包括编码的单声道信号,并且包括编码的ILD、群延时和群相位, 群延时和群相位所占用的带宽资源较少,不会影响码率;本实施例提供的立体声解码装置根据单声道信号、ILD、群延时和群相位,得到第一声道信号和第二声道信号,通过参考ILD使得得到的信号包含两声道信号间的能量大小信息,通过参考群延时和群相位使得得到的信号包含两声道信号间的时间延时信息和波形相似性信息,进而使得得到的第一声道信号和第二声道信号的立体声声场效果较优。 
图7为本发明实施例七提供的立体声解码装置的结构示意图。如图7所示,本实施例在上述实施例六的基础上,信号获取模块13进一步包括:第一处理子模块14、第一相位差获取子模块15、第一频域信号获取子模块16和第一信号获取子模块17,其中: 
第一处理子模块14用于将单声道信号进行时频变换处理,得到单声道频域信号; 
第一相位差获取子模块15用于根据群延时和群相位,得出IPD估计值; 
第一频域信号获取子模块16用于根据ILD和IPD估计值,对单声道频域信号进行处理得到第一声道频域信号和第二声道频域信号; 
第一信号获取子模块17用于将第一声道频域信号和第二声道频域信号分别进行频时变换处理,得到第一声道信号和第二声道信号。 
具体地,第一处理子模块14将单声道信号进行时频变换处理,得到单声道频域信号;第一相位差获取子模块15可以采用上述公式(1.1)估计出IPD估计值;第一频域信号获取子模块16根据ILD和IPD估计值,对单声道频域信号进行处理得到第一声道频域信号和第二声道频域信号;第一信号获取子模块17将第一声道频域信号和第二声道频域信号分别进行频时变换处理,得到第一声道信号和第二声道信号。 
进一步的,上述第一频域信号获取子模块16可以包括第一能量获取单元18和第一相位获取单元19,其中: 
第一能量获取单元18用于根据ILD,对单声道频域信号的能量进行处理, 得到第一声道频域信号的能量和第二声道频域信号的能量; 
第一相位获取单元19用于根据ILD和IPD估计值,对单声道频域信号的相位进行处理,得到第一声道频域信号的相位和第二声道频域信号的相位。 
具体地,第一能量获取单元18可以采用上述公式(1.2)和(1.3)得到第一声道频域信号的能量|X′1(k)|和第二声道频域信号的能量|X′2(k)|;第一相位获取单元19可以采用上述公式(1.4)和(1.5)得到第一声道频域信号的相位∠X′1(k)和第二声道频域信号的相位∠X′2(k)。 
图8为本发明实施例八提供的立体声解码装置的结构示意图。如图8所示,本实施例与上述实施例七的区别在于,第一频域信号获取子模块16包括第二能量获取单元20和第二相位获取单元21。 
第二能量获取单元20用于根据ILD,对单声道频域信号的能量进行处理,得到第一声道频域信号的能量和第二声道频域信号的能量; 
第二相位获取单元21用于当群延时为0时,根据IPD估计值,对单声道频域信号的相位进行处理,得到第一声道频域信号的相位和第二声道频域信号的相位;当群延时不为0时,根据ILD和IPD估计值,对单声道频域信号的相位进行处理,得到第一声道频域信号的相位和第二声道频域信号的相位。 
具体地,第二能量获取单元20可以采用上述公式(2.2)和(2.3)得到第一声道频域信号的能量|X′1(k)|和第二声道频域信号的能量|X′2(k)|;第二相位获取单元21可以采用上述公式(2.4)和(2.5),或者(2.6)和(2.7)得到第一声道频域信号的相位∠X′1(k)和第二声道频域信号的相位∠X′2(k)。 
上述图7或图8所提供的立体声解码装置适用于低码率的通信场景,其中接收到的码流中包括编码的单声道信号,并且包括编码的ILD、群延时和群相位,群延时和群相位所占用的带宽资源较少,不会影响码率;图7或图8提供的立体声解码装置根据单声道信号、ILD、群延时和群相位,得到第一声道信号和第二声道信号,通过参考ILD使得得到的信号包含两声道信号间的能量大小信息,通过参考群延时和群相位使得得到的信号包含两声道信号 间的时间延时信息和波形相似性信息,进而使得得到的第一声道信号和第二声道信号的立体声声场效果较优。 
图9为本发明实施例九提供的立体声解码装置的结构示意图。如图9所示,本实施例在上述实施例六的基础上,参数解码模块12还用于从接收到的码流中解码恢复出IPD的差分值;信号获取模块13具体用于根据ILD、IPD的差分值、群延时和群相位,对单声道信号进行处理得到第一声道信号和第二声道信号。 
进一步的,信号获取模块13可以包括: 
第二处理子模块22用于将单声道信号进行时频变换处理,得到单声道频域信号; 
第二相位差获取子模块23用于根据群延时和群相位,得出IPD估计值; 
第三相位差获取子模块24用于根据IPD估计值和IPD的差分值,得到IPD; 
第二频域信号获取子模块25用于根据ILD和IPD,对单声道频域信号进行处理得到第一声道频域信号和第二声道频域信号; 
第二信号获取子模块26用于将第一声道频域信号和第二声道频域信号分别进行频时变换处理,得到第一声道信号和第二声道信号。 
具体地,第二处理子模块22将该单声道信号进行时频变换处理,得到单声道频域信号;第二相位差获取子模块23可以采用上述公式(3.1)估计出IPD估计值;第三相位差获取子模块24可以将IPD的差分值IPDdiff′(k)与IPD估计值IPD′(k)相加得到IPD;第二频域信号获取子模块25根据ILD和IPD,对单声道频域信号进行处理得到第一声道频域信号和第二声道频域信号;第二信号获取子模块26将第一声道频域信号和第二声道频域信号分别进行频时变换处理,得到第一声道信号和第二声道信号。 
进一步的,上述第二频域信号获取子模块25可以包括:第三能量获取单元27和第三相位获取单元28,其中: 
第三能量获取单元27用于根据ILD,对单声道频域信号的能量进行处理,得到第一声道频域信号的能量和第二声道频域信号的能量; 
第三相位获取单元28用于根据ILD和IPD,对单声道频域信号的相位进行处理,得到第一声道频域信号的相位和第二声道频域信号的相位。 
具体地,第三能量获取单元27可以采用上述公式(3.3)和(3.4)得到第一声道频域信号的能量|X′1(k)|和第二声道频域信号的能量|X′2(k)|;第三相位获取单元28可以采用上述公式(3.5)和(3.6)得到左声道频域信号的相位∠X′1(k)和右声道频域信号的相位∠X′2(k)。 
图10为本发明实施例十提供的立体声解码装置的结构示意图。如图10所示,本实施例与上述实施例九的区别在于,第二频域信号获取子模块25包括第四能量获取单元29和第四相位获取单元30,其中: 
第四能量获取单元29用于根据ILD,对单声道频域信号的能量进行处理,得到第一声道频域信号的能量和第二声道频域信号的能量; 
第四相位获取单元30用于当群延时为0时,根据ILD、IPD和群相位,对单声道频域信号的相位进行处理,得到第一声道频域信号的相位和第二声道频域信号的相位;当群延时不为0时,根据ILD和IPD,对单声道频域信号的相位进行处理,得到第一声道频域信号的相位和第二声道频域信号的相位。 
具体地,第四能量获取单元29可以采用上述公式(4.3)和(4.4)得到第一声道频域信号的能量|X′1(k)|和第二声道频域信号的能量|X′2(k)|;第四相位获取单元30可以采用上述公式(4.5)和(4.6),或者(4.7)和(4.8)得到第一声道频域信号的相位∠X′1(k)和第二声道频域信号的相位∠X′2(k)。 
上述图9或图10所提供的立体声解码装置适用于中高码率的通信场景,其中接收到的码流包括编码的单声道信号,并且包括编码的ILD、IPD的差分值、群延时和群相位,群延时和群相位所占用的带宽资源较少,不会影响码率;图9或图10提供的立体声解码方法根据单声道信号、ILD、IPD的差 分值、群延时和群相位,得到左声道信号和右声道信号,通过参考ILD使得得到的信号包含两声道信号间的能量大小信息,通过参考群延时和群相位使得得到的信号包含两声道信号间的时间延时信息和波形相似性信息,进而使得得到的左声道信号和右声道信号的立体声声场效果较优。 
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤,而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。 
最后应说明的是:以上实施例仅用以说明本发明实施例的技术方案,而非对其限制;尽管参照前述实施例对本发明实施例进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例各实施例技术方案的精神和范围。 

Claims (14)

1.一种立体声解码方法,其特征在于包括:
从接收到的码流中解码恢复出单声道信号;
从所述接收到的码流中解码恢复出两声道信号间的电平差、群延时和群相位;
根据所述两声道信号间的电平差、群延时和群相位,对所述单声道信号进行处理得到第一声道信号和第二声道信号;
其中,所述根据所述两声道信号间的电平差、群延时和群相位,对所述单声道信号进行处理得到第一声道信号和第二声道信号包括:
将所述单声道信号进行时频变换处理,得到单声道频域信号;
根据所述群延时和群相位,得出两声道信号间的相位差估计值;
根据所述两声道信号间的电平差和所述两声道信号间的相位差估计值,对所述单声道频域信号进行处理得到第一声道频域信号和第二声道频域信号;
将所述第一声道频域信号和第二声道频域信号分别进行频时变换处理,得到所述第一声道信号和第二声道信号。
2.根据权利要求1所述的立体声解码方法,其特征在于,所述根据所述两声道信号间的电平差和所述两声道信号间的相位差估计值,对所述单声道频域信号进行处理得到第一声道频域信号和第二声道频域信号包括:
根据所述两声道信号间的电平差,对所述单声道频域信号的能量进行处理,得到第一声道频域信号的能量和第二声道频域信号的能量;
根据所述两声道信号间的电平差和所述两声道信号间的相位差估计值,对所述单声道频域信号的相位进行处理,得到第一声道频域信号的相位和第二声道频域信号的相位。
3.根据权利要求1所述的立体声解码方法,其特征在于,所述根据所述两声道信号间的电平差和所述两声道信号间的相位差估计值,对所述单声道频域信号进行处理得到第一声道频域信号和第二声道频域信号包括:
根据所述两声道信号间的电平差,对所述单声道频域信号的能量进行处理,得到第一声道频域信号的能量和第二声道频域信号的能量;
当所述群延时为0时,根据所述两声道信号间的相位差估计值,对所述单声道频域信号的相位进行处理,得到第一声道频域信号的相位和第二声道频域信号的相位;当所述群延时不为0时,根据所述两声道信号间的电平差和所述两声道信号间的相位差估计值,对所述单声道频域信号的相位进行处理,得到第一声道频域信号的相位和第二声道频域信号的相位。
4.根据权利要求1所述的立体声解码方法,其特征在于还包括:从所述接收到的码流中解码恢复出两声道信号间的相位差的差分值;
所述根据所述两声道信号间的电平差、群延时和群相位,对所述单声道信号进行处理得到第一声道信号和第二声道信号包括:根据所述两声道信号间的电平差、两声道信号间的相位差的差分值、群延时和群相位,对所述单声道信号进行处理得到第一声道信号和第二声道信号。
5.根据权利要求4所述的立体声解码方法,其特征在于,所述根据所述两声道信号间的电平差、两声道信号间的相位差的差分值、群延时和群相位,对所述单声道信号进行处理得到第一声道信号和第二声道信号包括:
将所述单声道信号进行时频变换处理,得到单声道频域信号;
根据所述群延时和群相位,得出两声道信号间的相位差估计值;
根据所述两声道信号间的相位差估计值和所述两声道信号间的相位差的差分值,得到两声道信号间的相位差;
根据所述两声道信号间的电平差和所述两声道信号间的相位差,对所述单声道频域信号进行处理得到第一声道频域信号和第二声道频域信号;
将所述第一声道频域信号和第二声道频域信号分别进行频时变换处理,得到所述第一声道信号和第二声道信号。
6.根据权利要求5所述的立体声解码方法,其特征在于,所述根据所述两声道信号间的电平差和所述两声道信号间的相位差,对所述单声道频域信号进行处理得到第一声道频域信号和第二声道频域信号包括:
根据所述两声道信号间的电平差,对所述单声道频域信号的能量进行处理,得到第一声道频域信号的能量和第二声道频域信号的能量;
根据所述两声道信号间的电平差和所述两声道信号间的相位差,对所述单声道频域信号的相位进行处理,得到第一声道频域信号的相位和第二声道频域信号的相位。
7.根据权利要求5所述的立体声解码方法,其特征在于,所述根据所述两声道信号间的电平差和所述两声道信号间的相位差,对所述单声道频域信号进行处理得到第一声道频域信号和第二声道频域信号包括:
根据所述两声道信号间的电平差,对所述单声道频域信号的能量进行处理,得到第一声道频域信号的能量和第二声道频域信号的能量;
当所述群延时为0时,根据所述两声道信号间的电平差、所述两声道信号间的相位差和群相位,对所述单声道频域信号的相位进行处理,得到第一声道频域信号的相位和第二声道频域信号的相位;当所述群延时不为0时,根据所述两声道信号间的电平差和所述两声道信号间的相位差,对所述单声道频域信号的相位进行处理,得到第一声道频域信号的相位和第二声道频域信号的相位。
8.一种立体声解码装置,其特征在于包括:
信号解码模块,用于从接收到的码流中解码恢复出单声道信号;
参数解码模块,用于从所述接收到的码流中解码恢复出两声道信号间的电平差、群延时和群相位;
信号获取模块,用于根据所述两声道信号间的电平差、群延时和群相位,对所述单声道信号进行处理得到第一声道信号和第二声道信号;
其中,所述信号获取模块包括:
第一处理子模块,用于将所述单声道信号进行时频变换处理,得到单声道频域信号;
第一相位差获取子模块,用于根据所述群延时和群相位,得出两声道信号间的相位差估计值;
第一频域信号获取子模块,用于根据所述两声道信号间的电平差和所述两声道信号间的相位差估计值,对所述单声道频域信号进行处理得到第一声道频域信号和第二声道频域信号;
第一信号获取子模块,用于将所述第一声道频域信号和第二声道频域信号分别进行频时变换处理,得到所述第一声道信号和第二声道信号。
9.根据权利要求8所述的立体声解码装置,其特征在于,所述第一频域信号获取子模块包括:
第一能量获取单元,用于根据所述两声道信号间的电平差,对所述单声道频域信号的能量进行处理,得到第一声道频域信号的能量和第二声道频域信号的能量;
第一相位获取单元,用于根据所述两声道信号间的电平差和所述两声道信号间的相位差估计值,对所述单声道频域信号的相位进行处理,得到第一声道频域信号的相位和第二声道频域信号的相位。
10.根据权利要求8所述的立体声解码装置,其特征在于,第一频域信号获取子模块包括:
第二能量获取单元,用于根据所述两声道信号间的电平差,对所述单声道频域信号的能量进行处理,得到第一声道频域信号的能量和第二声道频域信号的能量;
第二相位获取单元,用于当所述群延时为0时,根据所述两声道信号间的相位差估计值,对所述单声道频域信号的相位进行处理,得到第一声道频域信号的相位和第二声道频域信号的相位;当所述群延时不为0时,根据所述两声道信号间的电平差和所述两声道信号间的相位差估计值,对所述单声道频域信号的相位进行处理,得到第一声道频域信号的相位和第二声道频域信号的相位。
11.根据权利要求8所述的立体声解码装置,其特征在于,所述参数解码模块还用于从所述接收到的码流中解码恢复出两声道信号间的相位差的差分值;
所述信号获取模块具体用于根据所述两声道信号间的电平差、两声道信号间的相位差的差分值、群延时和群相位,对所述单声道信号进行处理得到第一声道信号和第二声道信号。
12.根据权利要求11所述的立体声解码装置,其特征在于,所述信号获取模块包括:
第二处理子模块,用于将所述单声道信号进行时频变换处理,得到单声道频域信号;
第二相位差获取子模块,用于根据所述群延时和群相位,得出两声道信号间的相位差估计值;
第三相位差获取子模块,用于根据所述两声道信号间的相位差估计值和所述两声道信号间的相位差的差分值,得到两声道信号间的相位差;
第二频域信号获取子模块,用于根据所述两声道信号间的电平差和所述两声道信号间的相位差,对所述单声道频域信号进行处理得到第一声道频域信号和第二声道频域信号;
第二信号获取子模块,用于将所述第一声道频域信号和第二声道频域信号分别进行频时变换处理,得到所述第一声道信号和第二声道信号。
13.根据权利要求12所述的立体声解码装置,其特征在于,所述第二频域信号获取子模块包括:
第三能量获取单元,用于根据所述两声道信号间的电平差,对所述单声道频域信号的能量进行处理,得到第一声道频域信号的能量和第二声道频域信号的能量;
第三相位获取单元,用于根据所述两声道信号间的电平差和所述两声道信号间的相位差,对所述单声道频域信号的相位进行处理,得到第一声道频域信号的相位和第二声道频域信号的相位。
14.根据权利要求12所述的立体声解码装置,其特征在于,所述第二频域信号获取子模块包括:
第四能量获取单元,用于根据所述两声道信号间的电平差,对所述单声道频域信号的能量进行处理,得到第一声道频域信号的能量和第二声道频域信号的能量;
第四相位获取单元,用于当所述群延时为0时,根据所述两声道信号间的电平差、所述两声道信号间的相位差和群相位,对所述单声道频域信号的相位进行处理,得到第一声道频域信号的相位和第二声道频域信号的相位;当所述群延时不为0时,根据所述两声道信号间的电平差和所述两声道信号间的相位差,对所述单声道频域信号的相位进行处理,得到第一声道频域信号的相位和第二声道频域信号的相位。
CN2010101114321A 2010-02-12 2010-02-12 立体声解码方法及装置 Active CN102157150B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN2010101114321A CN102157150B (zh) 2010-02-12 2010-02-12 立体声解码方法及装置
PCT/CN2010/079413 WO2011097916A1 (zh) 2010-02-12 2010-12-03 立体声解码方法及装置
US13/437,552 US9443524B2 (en) 2010-02-12 2012-04-02 Stereo decoding method and apparatus
US15/210,644 US9584944B2 (en) 2010-02-12 2016-07-14 Stereo decoding method and apparatus using group delay and group phase parameters

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010101114321A CN102157150B (zh) 2010-02-12 2010-02-12 立体声解码方法及装置

Publications (2)

Publication Number Publication Date
CN102157150A CN102157150A (zh) 2011-08-17
CN102157150B true CN102157150B (zh) 2012-08-08

Family

ID=44367219

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010101114321A Active CN102157150B (zh) 2010-02-12 2010-02-12 立体声解码方法及装置

Country Status (3)

Country Link
US (2) US9443524B2 (zh)
CN (1) CN102157150B (zh)
WO (1) WO2011097916A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2395504B1 (en) * 2009-02-13 2013-09-18 Huawei Technologies Co., Ltd. Stereo encoding method and apparatus
CN102157152B (zh) * 2010-02-12 2014-04-30 华为技术有限公司 立体声编码的方法、装置
CN102446507B (zh) * 2011-09-27 2013-04-17 华为技术有限公司 一种下混信号生成、还原的方法和装置
CN104967965B (zh) * 2015-06-29 2017-06-30 北京芝视界科技有限公司 一种音频播放控制方法及系统
CN106973355B (zh) * 2016-01-14 2019-07-02 腾讯科技(深圳)有限公司 环绕立体声实现方法和装置
US9820073B1 (en) 2017-05-10 2017-11-14 Tls Corp. Extracting a common signal from multiple audio signals
CN108877815B (zh) 2017-05-16 2021-02-23 华为技术有限公司 一种立体声信号处理方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1669358A (zh) * 2002-07-16 2005-09-14 皇家飞利浦电子股份有限公司 音频编码
CN101313355A (zh) * 2005-09-27 2008-11-26 Lg电子株式会社 编码/解码多声道音频信号的方法和装置
CN101390443A (zh) * 2006-02-21 2009-03-18 皇家飞利浦电子股份有限公司 音频编码和解码
WO2009084920A1 (en) * 2008-01-01 2009-07-09 Lg Electronics Inc. A method and an apparatus for processing a signal

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2610428B2 (ja) * 1987-04-22 1997-05-14 日本ビクター株式会社 2チヤンネル立体再生音場調整装置
WO2004072956A1 (en) 2003-02-11 2004-08-26 Koninklijke Philips Electronics N.V. Audio coding
TWI393121B (zh) * 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
DE602005017660D1 (de) 2004-12-28 2009-12-24 Panasonic Corp Audiokodierungsvorrichtung und audiokodierungsmethode

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1669358A (zh) * 2002-07-16 2005-09-14 皇家飞利浦电子股份有限公司 音频编码
CN101313355A (zh) * 2005-09-27 2008-11-26 Lg电子株式会社 编码/解码多声道音频信号的方法和装置
CN101390443A (zh) * 2006-02-21 2009-03-18 皇家飞利浦电子股份有限公司 音频编码和解码
WO2009084920A1 (en) * 2008-01-01 2009-07-09 Lg Electronics Inc. A method and an apparatus for processing a signal

Also Published As

Publication number Publication date
US20120189127A1 (en) 2012-07-26
US9584944B2 (en) 2017-02-28
US20160323687A1 (en) 2016-11-03
CN102157150A (zh) 2011-08-17
WO2011097916A1 (zh) 2011-08-18
US9443524B2 (en) 2016-09-13

Similar Documents

Publication Publication Date Title
CN102157150B (zh) 立体声解码方法及装置
CN1947172B (zh) 方法、装置、编码器设备、解码器设备以及音频系统
CN101484935B (zh) 用于编码和解码基于对象的音频信号的方法和装置
CN102157152B (zh) 立体声编码的方法、装置
CN101406074B (zh) 解码器及相应方法、双耳解码器、包括该解码器的接收机或音频播放器及相应方法
CN102122508B (zh) 方法、装置、编码器设备、译码器设备和音频系统
CN101930741B (zh) 对多声道音频信号进行编码/解码的系统和方法
CN102157149B (zh) 立体声信号下混方法、编解码装置和编解码系统
CN102148035B (zh) 使用复值滤波器组的音频信号的编码和解码
CN102122509A (zh) 多信道解码器和多信道解码方法
CN102682773B (zh) 多对象音频解码设备
CN105074818A (zh) 用于参数化多声道编码的方法
CN103559884A (zh) 多声道信号的编码/解码装置及方法
CN101542597A (zh) 用于编码和解码基于对象的音频信号的方法和装置
CN101410890A (zh) 减小数目的声道解码
CN104112450A (zh) 音频编码器,音频解码器,编码与解码音频信号的方法及音频设备
EP1991985A1 (en) Method, medium, and system generating a stereo signal
CN101292428A (zh) 用于编码/解码的方法和装置
CN103221997A (zh) 水印生成器、水印解码器、基于离散值数据提供加水印信号的方法和根据加水印信号提供离散值数据的方法
CN101361121B (zh) 处理媒体信号的方法和装置
RU2119259C1 (ru) Способ сокращения числа данных при передаче и/или накоплении цифровых сигналов, поступающих из нескольких взаимосвязанных каналов
CN102915738B (zh) 用于对多声道音频信号进行缩混的方法和设备
CN102254561A (zh) 一种基于空间线索的音频信息隐写方法
CN103403801B (zh) 参数多通道编码器和解码器
CN103366748A (zh) 立体声编码的方法、装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant