CN102157150B

CN102157150B - 立体声解码方法及装置

Info

Publication number: CN102157150B
Application number: CN2010101114321A
Authority: CN
Inventors: 吴文海; 苗磊; 郎玥; 张琦
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2010-02-12
Filing date: 2010-02-12
Publication date: 2012-08-08
Anticipated expiration: 2030-02-12
Also published as: US20120189127A1; US9584944B2; US20160323687A1; CN102157150A; WO2011097916A1; US9443524B2

Abstract

本发明实施例涉及一种立体声解码方法及装置，其中方法包括：从接收到的码流中解码恢复出单声道信号；从所述接收到的码流中解码恢复出两声道信号间的电平差、群延时和群相位；根据所述两声道信号间的电平差、群延时和群相位，对所述单声道信号进行处理得到第一声道信号和第二声道信号。本发明实施例提供的立体声解码方法及装置根据单声道信号、ILD、群延时和群相位，得到第一声道信号和第二声道信号，不仅参考ILD，还参考了群延时和群相位，这样得到的第一声道信号和第二声道信号的立体声声场效果较优。

Description

立体声解码方法及装置

技术领域

本发明实施例涉及通信技术领域，尤其涉及一种立体声解码方法及装置。

背景技术

目前立体声编码方法主要包括强度立体声、BCC(Binaual Cure Coding)和PS(Parametric-Stereo coding)等编码方法，在中高码率的通信场景下，通常的编码方法是提取两声道(如左右声道)信号间的电平差(InterChannel Level Difference，简称：ILD)(也可简称：CLD)和两声道信号间的相位差(InterChannel Phase Difference，简称：IPD)，在某些情况下也可以提取两声道互相关参数以及其中一声道与下混信号的相位差参数，将这些参数作为边信息进行编码并发送到解码端，以恢复立体声信号。然而在低码率的通信场景下，不能同时传输ILD和IPD，优先需要传输的是ILD，将该ILD进行编码并发送到解码端，以恢复立体声信号。

根据以上立体声编码方法，对应的立体声解码方法即为：从码流中提取单声道比特信号，解码后得到单声道信号，将单声道信号进行时频变换得到单声道频域信号；在中高码率的通信场景下，从码流中提取ILD和IPD，根据单声道频域信号以及ILD和IPD，得到左声道频域信号和右声道频域信号；在低码率的通信场景下，从码流中提取ILD，根据单声道频域信号以及ILD，得到左声道频域信号和右声道频域信号；将左声道频域信号和右声道频域信号分别进行频时变换得到左声道信号和右声道信号。

上述低码率通信场景的立体声解码方法达到声场效果所参考的参数仅为ILD，也就是说，该解码方法得到的信号仅包含两声道信号间的能量大小信息，导致得到的左声道信号和右声道信号的立体声声场效果较差。

发明内容

本发明实施例提供了一种立体声解码方法及装置，使解码得到的第一声道信号和第二声道信号的立体声声场效果较优。

本发明实施例提供的立体声解码方法，包括：

从接收到的码流中解码恢复出单声道信号；

从所述接收到的码流中解码恢复出两声道信号间的电平差、群延时和群相位；

根据所述两声道信号间的电平差、群延时和群相位，对所述单声道信号进行处理得到第一声道信号和第二声道信号；其中，所述根据所述两声道信号间的电平差、群延时和群相位，对所述单声道信号进行处理得到第一声道信号和第二声道信号包括：

将所述单声道信号进行时频变换处理，得到单声道频域信号；

根据所述群延时和群相位，得出两声道信号间的相位差估计值；

根据所述两声道信号间的电平差和所述两声道信号间的相位差估计值，对所述单声道频域信号进行处理得到第一声道频域信号和第二声道频域信号；

将所述第一声道频域信号和第二声道频域信号分别进行频时变换处理，得到所述第一声道信号和第二声道信号。

本发明实施例提供的立体声解码装置，包括：

信号解码模块，用于从接收到的码流中解码恢复出单声道信号；

参数解码模块，用于从所述接收到的码流中解码恢复出两声道信号间的电平差、群延时和群相位；

信号获取模块，用于根据所述两声道信号间的电平差、群延时和群相位，对所述单声道信号进行处理得到第一声道信号和第二声道信号；

其中，所述信号获取模块包括：

第一处理子模块，用于将所述单声道信号进行时频变换处理，得到单声道频域信号；

第一相位差获取子模块，用于根据所述群延时和群相位，得出两声道信号间的相位差估计值；

第一频域信号获取子模块，用于根据所述两声道信号间的电平差和所述两声道信号间的相位差估计值，对所述单声道频域信号进行处理得到第一声道频域信号和第二声道频域信号；

第一信号获取子模块，用于将所述第一声道频域信号和第二声道频域信号分别进行频时变换处理，得到所述第一声道信号和第二声道信号。

本发明实施例提供的立体声解码方法及装置适用于低码率的通信场景，其中接收到的码流中包括编码的单声道信号，并且至少包括编码的ILD、群延时和群相位，群延时和群相位所占用的带宽资源较少，用两个全局的相位和相似信息来增强声场效果，达到在较小的码率下，提升声场效果；本发明实施例提供的立体声解码方法及装置根据单声道信号、ILD、群延时和群相位，得到第一声道信号和第二声道信号，不仅参考ILD，还参考了群延时和群相位，也就是说，本发明实施例得到的信号不仅包含两声道信号间的能量大小信息，还包含两声道信号间的全局时间延时信息和全局波形相似性信息，这样得到的第一声道信号和第二声道信号的立体声声场效果较优。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例一提供的立体声解码方法的流程图；

图2为本发明实施例二提供的立体声解码方法的流程图；

图3为本发明实施例三提供的立体声解码方法的流程图；

图4为本发明实施例四提供的立体声解码方法的流程图；

图5为本发明实施例五提供的立体声解码方法的流程图；

图6为本发明实施例六提供的立体声解码装置的结构示意图；

图7为本发明实施例七提供的立体声解码装置的结构示意图；

图8为本发明实施例八提供的立体声解码装置的结构示意图；

图9为本发明实施例九提供的立体声解码装置的结构示意图；

图10为本发明实施例十提供的立体声解码装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1为本发明实施例一提供的立体声解码方法的流程图。如图1所示，本实施例包括如下步骤：

步骤100、从接收到的码流中解码恢复出单声道信号；

步骤101、从接收到的码流中解码恢复出ILD、群延时(group delay)和群相位(group phase)

步骤101、从接收到的码流中解码恢复出ILD、群延时(group delay)和群相位(group phase)；

其中，群延时表示两声道信号间包络的时间延时的全局方位信息，群相位表示两声道信号在时间对齐后的波形相似性的全局信息。

步骤102、根据ILD、群延时和群相位，对单声道信号进行处理得到第一声道信号和第二声道信号。

本实施例提供的立体声解码方法适用于低码率的通信场景，其中接收到的码流中包括编码的单声道信号，并且至少包括编码的ILD、群延时和群相位，群延时和群相位所占用的带宽资源较少，用两个全局的相位和相似信息来增强声场效果，达到在较小的码率下，提升声场效果；本实施例提供的立体声解码方法根据单声道信号、ILD、群延时和群相位，得到第一声道信号和第二声道信号，通过参考ILD使得得到的信号包含两声道信号间的能量大小信息，通过参考群延时和群相位使得得到的信号包含两声道信号间的全局时间延时信息和全局波形相似性信息，进而使得得到的第一声道信号和第二声道信号的立体声声场效果较优。

本发明实施例可以适用于低码率的通信场景。具体地，在上述实施例一的基础上，步骤102可以包括：将单声道信号进行时频变换处理，得到单声道频域信号；根据群延时和群相位，得出IPD估计值；根据ILD和IPD估计值，对单声道频域信号进行处理得到第一声道频域信号和第二声道频域信号；将第一声道频域信号和第二声道频域信号分别进行频时变换处理，得到第一声道信号和第二声道信号。下面通过实施例二和实施三对该技术方案进行进一步说明。

图2为本发明实施例二提供的立体声解码方法的流程图。本实施例中，第一声道为左声道，第二声道为右声道，如图2所示，本实施例包括如下步骤：

步骤200、从接收到的码流中解码恢复出单声道信号。

具体地，从码流中提取单声道比特信号，经过单声道信号(Mono)解码器将单声道比特信号进行解码恢复出单声道信号，该单声道信号也称为下混信号。

步骤201、从接收到的码流中解码恢复出ILD、群延时和群相位。

其中群延时表示为d_g′，群相位表示为θ_g′。一个正弦信号sin(wt)，经过群相位后为sin(wt-Q)。在sin(wt-Q)＝sin(w(t-Q/w))中，Q/w就是群相位(group phase)。群延时(group delay)称为包络时延，信号传输时，总相移随角频率而变化的速度，亦即相位一频率特性曲线的斜率。对于一般的传输系统，传输函数可以写成：H(jw)＝A(w)-B(w)，其中，A(w)为幅度一频率特性，B(w)为相位一频率特性：B(w)对w的一次导数，t(w)＝dB(w)/dw即为传输系统的群延时。

步骤202、将单声道信号进行时频变换处理，得到单声道频域信号。

将该单声道信号进行时频变换处理，得到单声道频域信号。单声道频域信号表示为M′(k)。

步骤203、根据群延时和群相位，得出IPD估计值。

从码流中解码恢复出群延时d_g′和群相位θ_g′，采用如下公式(1.1)估计出IPD估计值：

{IPD}^{'} (k) = \frac{- 2 π {d_{g}}^{'} * k}{N} + {θ_{g}}^{'} - - - (1.1)

将频域信号分成若干个频带，设将频域信号分成M个频带，k为频率点索引，b为频带索引，N为时频变换的长度，其中k＝0，...，N-1，b＝0，...，M-1。公式(1.1)中，IPD′(k)为索引为k的频率点的IPD估计值。

步骤204、根据ILD，对单声道频域信号的能量进行处理，得到左声道频域信号的能量和右声道频域信号的能量。

具体地，采用如下公式(1.2)和(1.3)得到左声道频域信号的能量|X′₁(k)|和右声道频域信号的能量|X′₂(k)|：

| {X^{'}}_{1} (k) | = | M^{'} (k) | * \frac{c (b)}{1 + c (b)} - - - (1.2)

| {X^{'}}_{2} (k) | = | M^{'} (k) | * \frac{1}{1 + c (b)} - - - (1.3)

其中，c(b)＝10^ILD′(b)/10，ILD′(b)为索引为b的频带的ILD，|M′(k)|为单声道频域信号的能量。

步骤205、根据ILD和IPD估计值，对单声道频域信号的相位进行处理，得到左声道频域信号的相位和右声道频域信号的相位。

具体地，采用如下公式(1.4)和(1.5)得到左声道频域信号的相位∠X′₁(k)和右声道频域信号的相位∠X′₂(k)：

{&angle; X^{'}}_{1} (k) = &angle; M^{'} (k) + \frac{1}{1 + c (b)} {IPD}^{'} (k) - - - (1.4)

{&angle; X}^{'}_{2} (k) = &angle; M^{'} (k) - \frac{c (b)}{1 + c (b)} {IPD}^{'} (k) - - - (1.5)

其中，∠M′(k)为单声道频域信号的相位。

本步骤采用由群延时d_g′和群相位θ_g′得到的IPD′(k)代替IPD来计算得到左右声道频域信号的相位。

步骤206、根据左声道频域信号的能量和右声道频域信号的能量，以及左声道频域信号的相位和右声道频域信号的相位，得到左声道频域信号和右声道频域信号。

具体地，采用如下公式(1.6)和(1.7)得到左声道频域信号X₁′(k)和右声道频域信号X₂′(k)：

X₁′(k)＝|X₁′(k)|*e^j∠X1′(k) (1.6)

{X_{2}}^{'} (k) = | {X_{2}}^{'} (k) | * e^{j &angle; {X_{2}}^{'} (k)} - - - (1.7)

步骤207、将左声道频域信号和右声道频域信号分别进行频时变换处理，得到左声道输出信号和右声道输出信号。

本实施例提供的立体声解码方法适用于低码率的通信场景，其中接收到的码流包括编码的单声道信号，并且至少包括编码的ILD、群延时和群相位，群延时和群相位所占用的带宽资源较少，不会影响码率；本实施例提供的立体声解码方法根据ILD，通过对单声道频域信号的能量进行处理，得到左右声道信号的能量，根据由群延时和群相位得出的IPD估计值和ILD，通过对单声道频域信号的能量进行处理，得到左右声道信号的相位，使得得到的信号不仅包含两声道信号间的能量大小信息，还包含两声道信号间的时间延时信息和波形相似性信息，进而使得得到的左声道信号和右声道信号的立体声声场效果较优。

图3为本发明实施例三提供的立体声解码方法的流程图。本实施例中，第一声道为左声道，第二声道为右声道，如图3所示，本实施例包括如下步骤：

步骤300、从接收到的码流中解码恢复出单声道信号。

步骤301、从接收到的码流中解码恢复出ILD、群延时和群相位。

其中群延时表示为d_g′，群相位表示为θ_g′。

步骤302、将单声道信号进行时频变换处理，得到单声道频域信号。

步骤303、根据群延时和群相位，得出IPD估计值。

从码流中解码恢复出群延时d_g′和群相位θ_g′，采用如下公式(2.1)估计出IPD估计值：

{IPD}^{'} (k) = \frac{- 2 π {d_{g}}^{'} * k}{N} + {θ_{g}}^{'} - - - (2.1)

将频域信号分成若干个频带，设将频域信号分成M个频带，k为频率点索引，b为频带索引，N为时频变换的长度，其中k＝0，...，N-1，b＝0，...，M-1。公式(2.1)中，IPD′(k)为索引为k的频率点的IPD估计值。

步骤304、根据ILD，对单声道频域信号的能量进行处理，得到左声道频域信号的能量和右声道频域信号的能量。

具体地，采用如下公式(2.2)和(2.3)得到左声道频域信号的能量|X′₁(k)|和右声道频域信号的能量|X′₂(k)|：

| {X^{'}}_{1} (k) | = | M^{'} (k) | * \frac{c (b)}{1 + c (b)} - - - (2.2)

| {X^{'}}_{2} (k) | = | M^{'} (k) | * \frac{1}{1 + c (b)} - - - (2.3)

步骤305、当群延时为0时，根据IPD估计值，对单声道频域信号的相位进行处理，得到左声道频域信号的相位和右声道频域信号的相位；当群延时不为0时，根据ILD和IPD估计值，对单声道频域信号的相位进行处理，得到左声道频域信号的相位和右声道频域信号的相位。

具体地，当d_g′＝0时，采用如下公式(2.4)和(2.5)得到左声道频域信号的相位∠X′₁(k)和右声道频域信号的相位∠X′₂(k)：

∠X′₁(k)＝∠M′(k) (2.4)

∠X′₂(k)＝∠M′(k)-IPD′(k) (2.5)

其中，∠M′(k)为单声道频域信号的相位。

在d_g′＝0的情况下，左声道保持单声道频域信号的相位，而右声道的相位是单声道频域信号的相位与由群延时d_g′和群相位θ_g′得到的IPD′(k)的差。

当d_g′≠0时，采用如下公式(2.6)和(2.7)得到左声道频域信号的相位∠X′₁(k)和右声道频域信号的相位∠X′₂(k)：

{&angle; X^{'}}_{1} (k) = &angle; M^{'} (k) + \frac{1}{1 + c (b)} {IPD}^{'} (k) - - - (2.6)

{&angle; X}^{'}_{2} (k) = &angle; M^{'} (k) - \frac{c (b)}{1 + c (b)} {IPD}^{'} (k) - - - (2.7)

在d_g′≠0的情况下，采用由群延时d_g′和群相位θ_g′得到的IPD′(k)代替IPD来计算得到左右声道频域信号的相位。

步骤306、根据左声道频域信号的能量和右声道频域信号的能量，以及左声道频域信号的相位和右声道频域信号的相位，得到左声道频域信号和右声道频域信号。

具体地，采用如下公式(2.8)和(2.9)得到左声道频域信号X₁′(k)和右声道频域信号X₂′(k)：

X₁′(k)＝|X₁′(k)|*e^j∠X1′(k) (2.8)

{X_{2}}^{'} (k) = | {X_{2}}^{'} (k) | * e^{j &angle; {X_{2}}^{'} (k)} - - - (2.9)

步骤307、将左声道频域信号和右声道频域信号分别进行频时变换处理，得到左声道输出信号和右声道输出信号。

本实施例提供的立体声解码方法适用于低码率的通信场景，其中接收到的码流包括编码的单声道信号，并且至少包括编码的ILD、群延时和群相位，群延时和群相位所占用的带宽资源较少，不会影响码率；本实施例提供的立体声解码方法根据ILD，通过对单声道频域信号的能量进行处理，得到左右声道信号的能量，当群延时为0时，根据由群延时和群相位得出的IPD估计值，通过对单声道频域信号的能量进行处理，得到左右声道信号的相位，当群延时不为0时，根据由群延时和群相位得出的IPD估计值和ILD，通过对单声道频域信号的能量进行处理，得到左右声道信号的相位，使得得到的信号不仅包含两声道信号间的能量大小信息，还包含两声道信号间的时间延时信息和波形相似性信息，进而使得得到的左声道信号和右声道信号的立体声声场效果较优。

本发明实施例也可以适用于中高码率的通信场景。具体地，在上述实施例一的基础上，步骤101中还包括从接收到的码流中解码恢复出IPD的差分值，步骤102也可以具体为根据ILD、IPD的差分值、群延时和群相位，对单声道信号进行处理得到第一声道信号和第二声道信号。

具体地，步骤103可以包括：将单声道信号进行时频变换处理，得到单声道频域信号；根据群延时和群相位，得出IPD估计值；根据IPD估计值和IPD的差分值，得到IPD；根据ILD和IPD，对单声道频域信号进行处理得到第一声道频域信号和第二声道频域信号；将第一声道频域信号和第二声道频域信号分别进行频时变换处理，得到第一声道信号和第二声道信号。下面通过实施例四和实施例五对该技术方案进行进一步说明。

图4为本发明实施例四提供的立体声解码方法的流程图。本实施例中，第一声道为左声道，第二声道为右声道，如图4所示，本实施例包括如下步骤：

步骤400、从接收到的码流中解码恢复出单声道信号。

步骤401、从接收到的码流中解码恢复出ILD、IPD的差分值、群延时和群相位。

其中群延时表示为d_g′，群相位表示为θ_g′。

步骤402、将单声道信号进行时频变换处理，得到单声道频域信号。

步骤403、根据群延时和群相位，得出IPD估计值。

从码流中解码恢复出群延时d_g′和群相位θ_g′，采用如下公式(3.1)估计出IPD估计值：

\overset{&OverBar;}{{IPD}^{'} (k)} = \frac{- 2 π {d_{g}}^{'} * k}{N} + {θ_{g}}^{'} - - - (3.1)

将频域信号分成若干个频带，设将频域信号分成M个频带，k为频率点索引，b为频带索引，N为时频变换的长度，其中k＝0，...，N-1，b＝0，...，M-1。公式(3.1)中，IPD′(k)为索引为k的频率点的IPD估计值。

步骤404、根据IPD的差分值和IPD估计值，得到IPD。

从码流中解码恢复出IPD的差分值IPD_diff′(k)，将IPD_diff′(k)与IPD估计值 IPD′(k)相加得到IPD，用IPD′(k)表示，参见公式(3.2)：

IPD′(k)＝IPD_diff′(k)+IPD′(k) (3.2)

步骤405、根据ILD，对单声道频域信号的能量进行处理，得到左声道频域信号的能量和右声道频域信号的能量。

具体地，采用如下公式(3.3)和(3.4)得到左声道频域信号的能量|X′₁(k)|和右声道频域信号的能量|X′₂(k)|：

| {X^{'}}_{1} (k) | = | M^{'} (k) | * \frac{c (b)}{1 + c (b)} - - - (3.3)

| {X^{'}}_{2} (k) | = | M^{'} (k) | * \frac{1}{1 + c (b)} - - - (3.4)

步骤406、根据ILD和IPD，对单声道频域信号的相位进行处理，得到左声道频域信号的相位和右声道频域信号的相位。

具体地，采用如下公式(3.5)和(3.6)得到左声道频域信号的相位∠X′₁(k)和右声道频域信号的相位∠X′₂(k)：

{&angle; X^{'}}_{1} (k) = &angle; M^{'} (k) + \frac{1}{1 + c (b)} {IPD}^{'} (k) - - - (3.5)

{&angle; X}^{'}_{2} (k) = &angle; M^{'} (k) - \frac{c (b)}{1 + c (b)} {IPD}^{'} (k) - - - (3.6)

其中，∠M′(k)为单声道频域信号的相位。

本步骤采用由IPD的差分值和IPD估计值得到的IPD计算得到左右声道频域信号的相位。

步骤407、根据左声道频域信号的能量和右声道频域信号的能量，以及左声道频域信号的相位和右声道频域信号的相位，得到左声道频域信号和右声道频域信号。

具体地，采用如下公式(3.7)和(3.8)得到左声道频域信号X₁′(k)和右声道频域信号X₂′(k)：

X₁′(k)＝|X₁′(k)|*e^j∠X1′(k) (3.7)

{X_{2}}^{'} (k) = | {X_{2}}^{'} (k) | * e^{j &angle; {X_{2}}^{'} (k)} - - - (3.8)

步骤408、将左声道频域信号和右声道频域信号分别进行频时变换处理，得到左声道输出信号和右声道输出信号。

本实施例提供的立体声解码方法适用于中高码率的通信场景，其中接收到的码流包括编码的单声道信号，并且包括编码的ILD、IPD的差分值、群延时和群相位，群延时和群相位所占用的带宽资源较少，不会影响码率；本实施例提供的立体声解码方法根据ILD，通过对单声道频域信号的能量进行处理，得到左右声道信号的能量，采用根据由群延时和群相位得出的IPD估计值和IPD的差分值得到的IPD计算得到左右声道频域信号的相位，使得得到的信号不仅包含两声道信号间的能量大小信息，还包含两声道信号间的时间延时信息和波形相似性信息，进而使得得到的左声道信号和右声道信号的立体声声场效果较优。

图5为本发明实施例五提供的立体声解码方法的流程图。本实施例中，第一声道为左声道，第二声道为右声道，如图5所示，本实施例包括如下步骤：

步骤500、从接收到的码流中解码恢复出单声道信号。

步骤501、从接收到的码流中解码恢复出ILD、IPD的差分值、群延时和群相位。

其中群延时表示为d_g′，群相位表示为θ_g′。

步骤502、将单声道信号进行时频变换处理，得到单声道频域信号。

步骤503、根据群延时和群相位，得出IPD估计值。

从码流中解码恢复出群延时d_g′和群相位θ_g′，采用如下公式(4.1)估计出IPD估计值：

\overset{&OverBar;}{{IPD}^{'} (k)} = \frac{- 2 π {d_{g}}^{'} * k}{N} + {θ_{g}}^{'} - - - (4.1)

将频域信号分成若干个频带，设将频域信号分成M个频带，k为频率点索引，b为频带索引，N为时频变换的长度，其中k＝0，...，N-1，b＝0，...，M-1。公式(4.1)中，IPD′(k)为索引为k的频率点的IPD估计值。

步骤504、根据IPD的差分值和IPD估计值，得到IPD。

从码流中解码恢复出IPD的差分值IPD_diff′(k)，将IPD_diff′(k)与IPD估计值 IPD′(k)相加得到IPD，用IPD′(k)表示，参见公式(4.2)：

IPD′(k)＝IPD_diff′(k)+IPD′(k) (4.2)

步骤505、根据ILD，对单声道频域信号的能量进行处理，得到左声道频域信号的能量和右声道频域信号的能量。

具体地，采用如下公式(4.3)和(4.4)得到左声道频域信号的能量|X′₁(k)|和右声道频域信号的能量|X′₂(k)|：

| {X^{'}}_{1} (k) | = | M^{'} (k) | * \frac{c (b)}{1 + c (b)} - - - (4.3)

| {X^{'}}_{2} (k) | = | M^{'} (k) | * \frac{1}{1 + c (b)} - - - (4.4)

步骤506、当群延时为0时，根据ILD、IPD和群相位，对单声道频域信号的相位进行处理，得到左声道频域信号的相位和右声道频域信号的相位；当群延时不为0时，根据ILD和IPD，对单声道频域信号的相位进行处理，得到左声道频域信号的相位和右声道频域信号的相位。

具体地，当d_g′＝0时，采用如下公式(4.5)和(4.6)得到左声道频域信号的相位∠X′₁(k)和右声道频域信号的相位∠X′₂(k)：

&angle; X_{1}^{'} (k) = &angle; M^{'} (k) + \frac{1}{1 + c (b)} ({IPD}^{'} (k) - {θ^{'}}_{g}) - - - (4.5)

&angle; X_{2}^{'} (k) = &angle; M^{'} (k) + \frac{1}{1 + c (b)} ({IPD}^{'} (k) - {θ^{'}}_{g}) - {IPD}^{'} (k) - - - (4.6)

其中，∠M′(k)为单声道频域信号的相位。IPD′(k)-θ′_g的取值范围也为(-pi，pi]。

当d_g′≠0时，采用如下公式(4.7)和(4.8)得到左声道频域信号的相位∠X′₁(k)和右声道频域信号的相位∠X′₂(k)：

{&angle; X^{'}}_{1} (k) = &angle; M^{'} (k) + \frac{1}{1 + c (b)} {IPD}^{'} (k) - - - (4.7)

{&angle; X}^{'}_{2} (k) = &angle; M^{'} (k) - \frac{c (b)}{1 + c (b)} {IPD}^{'} (k) - - - (4.8)

在d_g′≠0的情况下，采用由IPD的差分值和IPD估计值得到的IPD计算得到左右声道频域信号的相位。

步骤507、根据左声道频域信号的能量和右声道频域信号的能量，以及左声道频域信号的相位和右声道频域信号的相位，得到左声道频域信号和右声道频域信号。

具体地，采用如下公式(4.9)和(4.10)得到左声道频域信号X₁′(k)和右声道频域信号X₂′(k)：

X₁′(k)＝|X₁′(k)|*e^j∠X1′(k) (4.9)

{X_{2}}^{'} (k) = | {X_{2}}^{'} (k) | * e^{j &angle; {X_{2}}^{'} (k)} - - - (4.10)

步骤508、将左声道频域信号和右声道频域信号分别进行频时变换处理，得到左声道输出信号和右声道输出信号。

本实施例提供的立体声解码方法适用于中高码率的通信场景，其中接收到的码流包括编码的单声道信号，并且包括编码的ILD、IPD的差分值、群延时和群相位，群延时和群相位所占用的带宽资源较少，不会影响码率；本实施例提供的立体声解码方法根据ILD，通过对单声道频域信号的能量进行处理，得到左右声道信号的能量，当群延时为0时，根据ILD、IPD以及群相位计算得到左右声道频域信号的相位，当群延时不为0时，根据ILD、IPD计算得到左右声道频域信号的相位，其中IPD是根据由群延时和群相位得出的IPD估计值和IPD的差分值得到的，使得得到的信号不仅包含两声道信号间的能量大小信息，还包含两声道信号间的时间延时信息和波形相似性信息，进而使得得到的左声道信号和右声道信号的立体声声场效果较优。

图6为本发明实施例六提供的立体声解码装置的结构示意图。如图6所示，本实施例具体包括：信号解码模块11、参数解码模块12和信号获取模块13，其中：

信号解码模块11用于从接收到的码流中解码恢复出单声道信号；

参数解码模块12用于从接收到的码流中解码恢复出ILD、群延时和群相位；

信号获取模块13用于根据ILD、群延时和群相位，对单声道信号进行处理得到第一声道信号和第二声道信号。

具体地，信号解码模块11从码流中提取单声道比特信号，将单声道比特信号进行解码恢复出单声道信号；参数解码模块12从码流中解码恢复出ILD、群延时和群相位；信号获取模块13根据ILD、群延时和群相位，对单声道信号进行处理得到第一声道信号和第二声道信号。

本实施例提供的立体声解码装置适用于低码率的通信场景，其中接收到的码流中包括编码的单声道信号，并且包括编码的ILD、群延时和群相位，群延时和群相位所占用的带宽资源较少，不会影响码率；本实施例提供的立体声解码装置根据单声道信号、ILD、群延时和群相位，得到第一声道信号和第二声道信号，通过参考ILD使得得到的信号包含两声道信号间的能量大小信息，通过参考群延时和群相位使得得到的信号包含两声道信号间的时间延时信息和波形相似性信息，进而使得得到的第一声道信号和第二声道信号的立体声声场效果较优。

图7为本发明实施例七提供的立体声解码装置的结构示意图。如图7所示，本实施例在上述实施例六的基础上，信号获取模块13进一步包括：第一处理子模块14、第一相位差获取子模块15、第一频域信号获取子模块16和第一信号获取子模块17，其中：

第一处理子模块14用于将单声道信号进行时频变换处理，得到单声道频域信号；

第一相位差获取子模块15用于根据群延时和群相位，得出IPD估计值；

第一频域信号获取子模块16用于根据ILD和IPD估计值，对单声道频域信号进行处理得到第一声道频域信号和第二声道频域信号；

第一信号获取子模块17用于将第一声道频域信号和第二声道频域信号分别进行频时变换处理，得到第一声道信号和第二声道信号。

具体地，第一处理子模块14将单声道信号进行时频变换处理，得到单声道频域信号；第一相位差获取子模块15可以采用上述公式(1.1)估计出IPD估计值；第一频域信号获取子模块16根据ILD和IPD估计值，对单声道频域信号进行处理得到第一声道频域信号和第二声道频域信号；第一信号获取子模块17将第一声道频域信号和第二声道频域信号分别进行频时变换处理，得到第一声道信号和第二声道信号。

进一步的，上述第一频域信号获取子模块16可以包括第一能量获取单元18和第一相位获取单元19，其中：

第一能量获取单元18用于根据ILD，对单声道频域信号的能量进行处理，得到第一声道频域信号的能量和第二声道频域信号的能量；

第一相位获取单元19用于根据ILD和IPD估计值，对单声道频域信号的相位进行处理，得到第一声道频域信号的相位和第二声道频域信号的相位。

具体地，第一能量获取单元18可以采用上述公式(1.2)和(1.3)得到第一声道频域信号的能量|X′₁(k)|和第二声道频域信号的能量|X′₂(k)|；第一相位获取单元19可以采用上述公式(1.4)和(1.5)得到第一声道频域信号的相位∠X′₁(k)和第二声道频域信号的相位∠X′₂(k)。

图8为本发明实施例八提供的立体声解码装置的结构示意图。如图8所示，本实施例与上述实施例七的区别在于，第一频域信号获取子模块16包括第二能量获取单元20和第二相位获取单元21。

第二能量获取单元20用于根据ILD，对单声道频域信号的能量进行处理，得到第一声道频域信号的能量和第二声道频域信号的能量；

第二相位获取单元21用于当群延时为0时，根据IPD估计值，对单声道频域信号的相位进行处理，得到第一声道频域信号的相位和第二声道频域信号的相位；当群延时不为0时，根据ILD和IPD估计值，对单声道频域信号的相位进行处理，得到第一声道频域信号的相位和第二声道频域信号的相位。

具体地，第二能量获取单元20可以采用上述公式(2.2)和(2.3)得到第一声道频域信号的能量|X′₁(k)|和第二声道频域信号的能量|X′₂(k)|；第二相位获取单元21可以采用上述公式(2.4)和(2.5)，或者(2.6)和(2.7)得到第一声道频域信号的相位∠X′₁(k)和第二声道频域信号的相位∠X′₂(k)。

上述图7或图8所提供的立体声解码装置适用于低码率的通信场景，其中接收到的码流中包括编码的单声道信号，并且包括编码的ILD、群延时和群相位，群延时和群相位所占用的带宽资源较少，不会影响码率；图7或图8提供的立体声解码装置根据单声道信号、ILD、群延时和群相位，得到第一声道信号和第二声道信号，通过参考ILD使得得到的信号包含两声道信号间的能量大小信息，通过参考群延时和群相位使得得到的信号包含两声道信号间的时间延时信息和波形相似性信息，进而使得得到的第一声道信号和第二声道信号的立体声声场效果较优。

图9为本发明实施例九提供的立体声解码装置的结构示意图。如图9所示，本实施例在上述实施例六的基础上，参数解码模块12还用于从接收到的码流中解码恢复出IPD的差分值；信号获取模块13具体用于根据ILD、IPD的差分值、群延时和群相位，对单声道信号进行处理得到第一声道信号和第二声道信号。

进一步的，信号获取模块13可以包括：

第二处理子模块22用于将单声道信号进行时频变换处理，得到单声道频域信号；

第二相位差获取子模块23用于根据群延时和群相位，得出IPD估计值；

第三相位差获取子模块24用于根据IPD估计值和IPD的差分值，得到IPD；

第二频域信号获取子模块25用于根据ILD和IPD，对单声道频域信号进行处理得到第一声道频域信号和第二声道频域信号；

第二信号获取子模块26用于将第一声道频域信号和第二声道频域信号分别进行频时变换处理，得到第一声道信号和第二声道信号。

具体地，第二处理子模块22将该单声道信号进行时频变换处理，得到单声道频域信号；第二相位差获取子模块23可以采用上述公式(3.1)估计出IPD估计值；第三相位差获取子模块24可以将IPD的差分值IPD_diff′(k)与IPD估计值IPD′(k)相加得到IPD；第二频域信号获取子模块25根据ILD和IPD，对单声道频域信号进行处理得到第一声道频域信号和第二声道频域信号；第二信号获取子模块26将第一声道频域信号和第二声道频域信号分别进行频时变换处理，得到第一声道信号和第二声道信号。

进一步的，上述第二频域信号获取子模块25可以包括：第三能量获取单元27和第三相位获取单元28，其中：

第三能量获取单元27用于根据ILD，对单声道频域信号的能量进行处理，得到第一声道频域信号的能量和第二声道频域信号的能量；

第三相位获取单元28用于根据ILD和IPD，对单声道频域信号的相位进行处理，得到第一声道频域信号的相位和第二声道频域信号的相位。

具体地，第三能量获取单元27可以采用上述公式(3.3)和(3.4)得到第一声道频域信号的能量|X′₁(k)|和第二声道频域信号的能量|X′₂(k)|；第三相位获取单元28可以采用上述公式(3.5)和(3.6)得到左声道频域信号的相位∠X′₁(k)和右声道频域信号的相位∠X′₂(k)。

图10为本发明实施例十提供的立体声解码装置的结构示意图。如图10所示，本实施例与上述实施例九的区别在于，第二频域信号获取子模块25包括第四能量获取单元29和第四相位获取单元30，其中：

第四能量获取单元29用于根据ILD，对单声道频域信号的能量进行处理，得到第一声道频域信号的能量和第二声道频域信号的能量；

第四相位获取单元30用于当群延时为0时，根据ILD、IPD和群相位，对单声道频域信号的相位进行处理，得到第一声道频域信号的相位和第二声道频域信号的相位；当群延时不为0时，根据ILD和IPD，对单声道频域信号的相位进行处理，得到第一声道频域信号的相位和第二声道频域信号的相位。

具体地，第四能量获取单元29可以采用上述公式(4.3)和(4.4)得到第一声道频域信号的能量|X′₁(k)|和第二声道频域信号的能量|X′₂(k)|；第四相位获取单元30可以采用上述公式(4.5)和(4.6)，或者(4.7)和(4.8)得到第一声道频域信号的相位∠X′₁(k)和第二声道频域信号的相位∠X′₂(k)。

上述图9或图10所提供的立体声解码装置适用于中高码率的通信场景，其中接收到的码流包括编码的单声道信号，并且包括编码的ILD、IPD的差分值、群延时和群相位，群延时和群相位所占用的带宽资源较少，不会影响码率；图9或图10提供的立体声解码方法根据单声道信号、ILD、IPD的差分值、群延时和群相位，得到左声道信号和右声道信号，通过参考ILD使得得到的信号包含两声道信号间的能量大小信息，通过参考群延时和群相位使得得到的信号包含两声道信号间的时间延时信息和波形相似性信息，进而使得得到的左声道信号和右声道信号的立体声声场效果较优。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤，而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上实施例仅用以说明本发明实施例的技术方案，而非对其限制；尽管参照前述实施例对本发明实施例进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明实施例各实施例技术方案的精神和范围。

Claims

1.一种立体声解码方法，其特征在于包括：

从接收到的码流中解码恢复出单声道信号；

根据所述两声道信号间的电平差、群延时和群相位，对所述单声道信号进行处理得到第一声道信号和第二声道信号；

其中，所述根据所述两声道信号间的电平差、群延时和群相位，对所述单声道信号进行处理得到第一声道信号和第二声道信号包括：

2.根据权利要求1所述的立体声解码方法，其特征在于，所述根据所述两声道信号间的电平差和所述两声道信号间的相位差估计值，对所述单声道频域信号进行处理得到第一声道频域信号和第二声道频域信号包括：

根据所述两声道信号间的电平差，对所述单声道频域信号的能量进行处理，得到第一声道频域信号的能量和第二声道频域信号的能量；

根据所述两声道信号间的电平差和所述两声道信号间的相位差估计值，对所述单声道频域信号的相位进行处理，得到第一声道频域信号的相位和第二声道频域信号的相位。

3.根据权利要求1所述的立体声解码方法，其特征在于，所述根据所述两声道信号间的电平差和所述两声道信号间的相位差估计值，对所述单声道频域信号进行处理得到第一声道频域信号和第二声道频域信号包括：

当所述群延时为0时，根据所述两声道信号间的相位差估计值，对所述单声道频域信号的相位进行处理，得到第一声道频域信号的相位和第二声道频域信号的相位；当所述群延时不为0时，根据所述两声道信号间的电平差和所述两声道信号间的相位差估计值，对所述单声道频域信号的相位进行处理，得到第一声道频域信号的相位和第二声道频域信号的相位。

4.根据权利要求1所述的立体声解码方法，其特征在于还包括：从所述接收到的码流中解码恢复出两声道信号间的相位差的差分值；

所述根据所述两声道信号间的电平差、群延时和群相位，对所述单声道信号进行处理得到第一声道信号和第二声道信号包括：根据所述两声道信号间的电平差、两声道信号间的相位差的差分值、群延时和群相位，对所述单声道信号进行处理得到第一声道信号和第二声道信号。

5.根据权利要求4所述的立体声解码方法，其特征在于，所述根据所述两声道信号间的电平差、两声道信号间的相位差的差分值、群延时和群相位，对所述单声道信号进行处理得到第一声道信号和第二声道信号包括：

根据所述两声道信号间的相位差估计值和所述两声道信号间的相位差的差分值，得到两声道信号间的相位差；

根据所述两声道信号间的电平差和所述两声道信号间的相位差，对所述单声道频域信号进行处理得到第一声道频域信号和第二声道频域信号；

6.根据权利要求5所述的立体声解码方法，其特征在于，所述根据所述两声道信号间的电平差和所述两声道信号间的相位差，对所述单声道频域信号进行处理得到第一声道频域信号和第二声道频域信号包括：

根据所述两声道信号间的电平差和所述两声道信号间的相位差，对所述单声道频域信号的相位进行处理，得到第一声道频域信号的相位和第二声道频域信号的相位。

7.根据权利要求5所述的立体声解码方法，其特征在于，所述根据所述两声道信号间的电平差和所述两声道信号间的相位差，对所述单声道频域信号进行处理得到第一声道频域信号和第二声道频域信号包括：

当所述群延时为0时，根据所述两声道信号间的电平差、所述两声道信号间的相位差和群相位，对所述单声道频域信号的相位进行处理，得到第一声道频域信号的相位和第二声道频域信号的相位；当所述群延时不为0时，根据所述两声道信号间的电平差和所述两声道信号间的相位差，对所述单声道频域信号的相位进行处理，得到第一声道频域信号的相位和第二声道频域信号的相位。

8.一种立体声解码装置，其特征在于包括：

其中，所述信号获取模块包括：

9.根据权利要求8所述的立体声解码装置，其特征在于，所述第一频域信号获取子模块包括：

第一能量获取单元，用于根据所述两声道信号间的电平差，对所述单声道频域信号的能量进行处理，得到第一声道频域信号的能量和第二声道频域信号的能量；

第一相位获取单元，用于根据所述两声道信号间的电平差和所述两声道信号间的相位差估计值，对所述单声道频域信号的相位进行处理，得到第一声道频域信号的相位和第二声道频域信号的相位。

10.根据权利要求8所述的立体声解码装置，其特征在于，第一频域信号获取子模块包括：

第二能量获取单元，用于根据所述两声道信号间的电平差，对所述单声道频域信号的能量进行处理，得到第一声道频域信号的能量和第二声道频域信号的能量；

第二相位获取单元，用于当所述群延时为0时，根据所述两声道信号间的相位差估计值，对所述单声道频域信号的相位进行处理，得到第一声道频域信号的相位和第二声道频域信号的相位；当所述群延时不为0时，根据所述两声道信号间的电平差和所述两声道信号间的相位差估计值，对所述单声道频域信号的相位进行处理，得到第一声道频域信号的相位和第二声道频域信号的相位。

11.根据权利要求8所述的立体声解码装置，其特征在于，所述参数解码模块还用于从所述接收到的码流中解码恢复出两声道信号间的相位差的差分值；

所述信号获取模块具体用于根据所述两声道信号间的电平差、两声道信号间的相位差的差分值、群延时和群相位，对所述单声道信号进行处理得到第一声道信号和第二声道信号。

12.根据权利要求11所述的立体声解码装置，其特征在于，所述信号获取模块包括：

第二处理子模块，用于将所述单声道信号进行时频变换处理，得到单声道频域信号；

第二相位差获取子模块，用于根据所述群延时和群相位，得出两声道信号间的相位差估计值；

第三相位差获取子模块，用于根据所述两声道信号间的相位差估计值和所述两声道信号间的相位差的差分值，得到两声道信号间的相位差；

第二频域信号获取子模块，用于根据所述两声道信号间的电平差和所述两声道信号间的相位差，对所述单声道频域信号进行处理得到第一声道频域信号和第二声道频域信号；

第二信号获取子模块，用于将所述第一声道频域信号和第二声道频域信号分别进行频时变换处理，得到所述第一声道信号和第二声道信号。

13.根据权利要求12所述的立体声解码装置，其特征在于，所述第二频域信号获取子模块包括：

第三能量获取单元，用于根据所述两声道信号间的电平差，对所述单声道频域信号的能量进行处理，得到第一声道频域信号的能量和第二声道频域信号的能量；

第三相位获取单元，用于根据所述两声道信号间的电平差和所述两声道信号间的相位差，对所述单声道频域信号的相位进行处理，得到第一声道频域信号的相位和第二声道频域信号的相位。

14.根据权利要求12所述的立体声解码装置，其特征在于，所述第二频域信号获取子模块包括：

第四能量获取单元，用于根据所述两声道信号间的电平差，对所述单声道频域信号的能量进行处理，得到第一声道频域信号的能量和第二声道频域信号的能量；

第四相位获取单元，用于当所述群延时为0时，根据所述两声道信号间的电平差、所述两声道信号间的相位差和群相位，对所述单声道频域信号的相位进行处理，得到第一声道频域信号的相位和第二声道频域信号的相位；当所述群延时不为0时，根据所述两声道信号间的电平差和所述两声道信号间的相位差，对所述单声道频域信号的相位进行处理，得到第一声道频域信号的相位和第二声道频域信号的相位。