WO2015007075A1

WO2015007075A1 - 一种声道间电平差处理方法及装置

Info

Publication number: WO2015007075A1
Application number: PCT/CN2014/070131
Authority: WO
Inventors: 张兴涛; 苗磊
Original assignee: 华为技术有限公司
Priority date: 2013-07-16
Filing date: 2014-01-04
Publication date: 2015-01-22
Also published as: BR112015030201A2; EP2977984A4; KR101730362B1; CN104299615B; US20160055856A1; US10002615B2; KR20150140802A; EP2977984A1; EP2977984B1; JP6106336B2; JP2016522451A; CN104299615A

Abstract

一种声道间电平差处理方法及装置，涉及立体音频技术领域，适用于进行声道间电平差处理时采用，可以在信号变化迅速或者丢包情况下保证解码后的立体声音频质量，并且实现立体声音频信号的低比特率传输。通过接收立体声音频信号，并逐帧解析所述立体声音频信号，获得所述立体声音频信号的每一帧中每个子帧的各个子带的ICLD（101）；计算所述立体声音频信号的任一帧中每个子帧的ICLD的绝对值之和（102）；当所述任一帧中任两个子帧的ICLD的绝对值之和的差的绝对值都小于预设阈值时，采用第一加权方式计算所述任一帧中每个子带的ICLD加权值（103）；否则，采用第二加权方式计算所述任一帧中每个子带的ICLD加权值（104）。

Description

一种声道间电平差处理方法及装置

本申请要求于 2013 年 7 月 16 日提交中国专利局、申请号为 201310298100.2 , 发明名称为 "一种声道间电平差处理方法及装置" 的中国专利申请优先权，上述专利的全部内容通过引用结合在本申请中。技术领域本发明涉及立体音频技术领域，尤其涉及一种声道间电平差处理方法及装置。

背景技术随着生活质量的提高，人们对高质量音频的需求不断增大。相对于单声道音频，立体声音频能够提高信息的清晰度和可懂度，因而备受人们青睐。

现有技术对立体声音频进行处理时，首先对输入的立体声音频信号进行解析，获得携带立体声音频信号的帧中各子带声道间电平差（ Inter-Channe l Leve l Difference , ICLD )值，然后将获得的 ICLD值与前几帧获得的 ICLD值进行比较，当 ICLD值与前几帧获得的 ICLD值变化较大时，则该帧携带的立体声音频信号为暂态 Trans ient , 否则该帧携带的立体声音频信号为常态 Norma 1。对 Trans ient分为 2帧进行传输，即分别传输奇数子带与偶数子带的 ICLD。对于 Norma l分为 4帧进行传输，即每帧传输 1/4子带的 ICLD。其中，为了保证比特数目的一致, 进一步对 Norma l进行 ref inement处理。

然而，采用现有技术对立体声音频进行处理时，由于携带立体声音频的帧长较长，当处理 10ms的立体声音频时，如果 Norma l分 4帧进行处理，相当于每 40ms (4*10ms)进行 ICLD更新，则导致在信号变化迅速或者丟包情况下无法保证解码后的立体声音频质量，另外，如果逐帧传输 ICLD, 将无法实现立体声音频信号的低比特率传输。

发明内容本发明的实施例提供一种声道间电平差处理方法及装置，可以在信号变化迅速或者丟包情况下保证解码后的立体声音频质量，并且实现立体声音频信号的低比特率传输。

第一方面，本发明实施例提供一种声道间电平差处理方法，包括：接收立体声音频信号，并逐帧解析所述立体声音频信号，获得所述立体声音频信号的每一帧中每个子帧的各个子带的声道间电平差 ICLD, 所述每一帧中包括至少两个子帧；

根据获得的所述立体声音频信号的每一帧中每个子帧的各个子带的 ICLD, 计算所述立体声音频信号的任一帧中每个子帧的 ICLD的绝对值之和；

当所述任一帧中任两个子帧的 ICLD的绝对值之和的差的绝对值都小于预设阔值时，采用第一加权方式计算所述任一帧中每个子带的 ICLD加权值；

当所述任一帧中任两个子帧的 ICLD的绝对值之和的差的绝对值不小于预设阔值时，采用第二加权方式计算所述任一帧中每个子带的 ICLD加权值。

在第一种可能的实现方式中，结合第一方面，所述采用第一加权方式计算所述任一帧中每个子带的 ICLD加权值，包括：

根据所述任一帧中包括的子帧数量，计算第 i个子帧中第 b个子带的第一加权因子，所述 i表示所述任一帧中包括的任一个子帧， 0 2 , 所述 b表示所述第 i个子帧中任一个子带， 0 12;

根据所述第一加权因子以及所述任一帧中所述第 i个子帧中所述第 b个子带的 ICLD, 计算所述任一帧中所述第 b个子带的 ICLD加权值。

在第二种可能的实现方式中，结合第一方面中第一种可能的实现方式，所述根据所述任一帧中包括的子帧数量，计算第 i个子帧中第 b个子带的第一加权因子，包括：

根据 fa_Cl(i,b) = l / L计算第 i个子帧中的第 b个子带的第一加权因子，其中，所述 f_aCl(i,b)表示第 i个子帧中的第 b个子带的所述第一加权因子。在第三种可能的实现方式中，结合第一方面中第二种可能的实现方式，所述根据所述第一加权因子以及所述任一帧中所述第 i个子帧中所述第 b个子带的 ICLD, 计算所述任一帧中所述第 b个子带的 ICLD加权值，包括： level(b)=yfa_Cl(i, b)*level(i, b)

根据 i=i 计算所述任一帧中所述第 b个子带的 ICLD加权值，其中，所述 level(b)表示所述任一帧中第 b 个子带的 ICLD 加权值，所述 level(i，b)表示第 i个子帧的第 b个子带的 ICLD。

在第四种可能的实现方式中，结合第一方面，所述采用第二加权方式计算所述任一帧中每个子带的 ICLD加权值，包括：

根据计算的所述立体声音频信号的所述任一帧中每个子帧的 ICLD的绝对值之和，或者根据所述任一帧中的第 i个子帧中第 b个子带的 ICLD, 计算所述第 i个子帧中第 b个子带的第二加权因子，所述 i表示所述任一帧中包括的任一个子帧， 0 2 , 所述 b表示所述第 i个子帧中任一个子带， 0 12;

根据所述第二加权因子以及所述任一帧中所述第 i个子帧中所述第 b个子带的 ICLD, 计算所述任一帧中所述第 b个子带的 ICLD加权值。

在第五种可能的实现方式中，结合第一方面中第四种可能的实现方式，根据计算的所述立体声音频信号的所述任一帧中每个子帧的 ICLD的绝对值之和，计算所述第 i个子帧中第 b个子带的第二加权因子，包括：

L

fac₂ (i,b) = sum(i) / Vsum(j)

根据计算所述第 i个子帧中所述第 b个子带的第二加权因子，其中，所述 fac₂(i,b)为第 i个子帧中第 b个子带的第二加权因子，所述 sum(i)表示所述第 i个子帧中每个子带的 ICLD的绝对值之和，所述 _sum(j)表示所述第 j个子帧中每个子带的 ICLD的绝对值之和，所述 j为所述任一帧中包括任一个子帧， 0 < j L。

在第六种可能的实现方式中，结合第一方面中第五种可能的实现方式，所述根据所述任一帧中的第 i个子帧中第 b个子带的 ICLD, 计算所述第 i个子帧中第 b个子带的第二加权因子，包括： fac₂(i,b) = |level(i,b)| / V |level(j,b)|

根据计算所述第 i个子帧中所述第 b个子带的第二加权因子，其中，所述 l_evel(i，b)表示第 i个子帧的第 b个子带的 ICLD, 所述 l_eVel(j，b)表示第 j个子帧的第 b个子带的 ICLD。

在第七种可能的实现方式中，结合第一方面中第六种可能的实现方式，所述根据所述任一帧中的第 i个子帧中第 b个子带的 ICLD, 计算所述第 i个子帧中第 b个子带的第二加权因子，包括：

根据

计算所述第个子帧中所述第 b个子带的第二加权因子，其中，所述 M表示相邻的子带的数量，所述 z表示相邻子带和当前子带的索引号的差值。

在第八种可能的实现方式中，结合第一方面中第四种可能的实现方式，或者第五种可能的实现方式，或者第六中可能的实现方式，或者第七种可能的实现方式，所述根据所述第二加权因子以及所述任一帧中所述第 i 个子帧中所述第 b个子带的 ICLD, 计算所述任一帧中所述第 b个子带的 ICLD加权值，包括： level(b)=yfac₂(i, b)*level(i, b)

根据 i=i 计算所述任一帧中所述第 b个子带的 ICLD加权值，其中，所述 l_evel(b)表示所述任一帧中第 b 个子带的 ICLD 加权值，所述 fac₂(i,b)为所述第 i个子帧中所述第 b个子带的第二加权因子，所述 l_evel(i， b)表示第 i个子帧的第 b个子带的 ICLD。

第二方面，本发明实施例提供一种声道间电平差处理装置，包括：接收单元，用于接收立体声音频信号；

解析单元，用于根据所述接收单元接收的所述立体声音频信息，逐帧解析所述立体声音频信号，获得所述立体声音频信号的每一帧中每个子帧的各个子带的声道间电平差 ICLD, 所述每一帧中包括至少两个子帧；计算单元，用于根据所述解析单元解析获得的所述立体声音频信号的每一帧中每个子帧的各个子带的 ICLD, 计算所述立体声音频信号的任一帧中每个子帧的 ICLD的绝对值之和；

第一加权处理单元，用于当所述任一帧中任两个子帧的 ICLD的绝对值之和的差的绝对值都小于预设阔值时，采用第一加权方式计算所述任一帧中每个子带的 ICLD加权值；

第二加权处理单元，用于当所述任一帧中任两个子帧的 ICLD的绝对值之和的差的绝对值不小于预设阔值时，采用第二加权方式计算所述任一帧中每个子带的 ICLD加权值。

在第一种可能的实现方式中，结合第二方面，所述第一加权处理单元，包括：

第一计算模块，用于根据所述任一帧中包括的子帧数量，计算第 i 个子帧中第 b个子带的第一加权因子，所述 i表示所述任一帧中包括的任一个子帧， 0 2 , 所述 b表示所述第 i个子帧中任一个子带，0 12;

第二计算模块，用于根据所述第一加权因子以及所述任一帧中所述第 i 个子帧中所述第 b个子带的 ICLD,计算所述任一帧中所述第 b个子带的 ICLD加权值。

在第二种可能的实现方式中，结合第二方面中第一种可能的实现方式，所述第一计算模块，用于：

根据 fa_Cl(i,b) = l/ L计算第 i个子帧中的第 b个子带的第一加权因子，其中，所述 f_aCl(i,b)表示第 i个子帧中的第 b个子带的所述第一加权因子。

在第三种可能的实现方式中，结合第二方面中第二种可能的实现方式，所述第二计算模块，用于： level(b)=yfa_Cl(i, b)*level(i, b)

根据 w 计算所述任一帧中所述第 b个子带的 ICLD加权值，其中，所述 level(b)表示所述任一帧中第 b 个子带的 ICLD 加权值，所述 l_eVel(i，b)表示第 i个子帧的第 b个子带的 ICLD。

在第四种可能的实现方式中，结合第二方面，所述第二加权处理单元，包括：

第三计算模块，用于根据计算的所述立体声音频信号的所述任一帧中每个子帧的 ICLD的绝对值之和，计算所述第 i个子帧中第 b个子带的第二加权因子，所述 i表示所述任一帧中包括的任一个子帧， 0 2 , 所述 b表示所述第 i个子帧中任一个子带， 0 12; 或者，第四计算模块，用于根据所述任一帧中的第 i个子帧中第 b个子带的 ICLD, 计算所述第 i个子帧中第 b个子带的第二加权因子；

第五计算模块，用于根据所述第二加权因子以及所述任一帧中所述第 i 个子帧中所述第 b个子带的 ICLD,计算所述任一帧中所述第 b个子带的 ICLD加权值。

在第五种可能的实现方式中，结合第二方面中第四种可能的实现方式，所述第三计算模块，用于：

L

fac₂ (i,b) = sum(i) / Vsum(j)

在第六种可能的实现方式中，结合第二方面中第五种可能的实现方式，所述第四计算模块，用于： fac₂(i,b) = |level(i,b)| /V |level(j,b)|

根据计算所述第 i个子帧中所述第 b个子带的第二加权因子，其中，所述 l_evel(i，b)表示第 i个子帧的第 b个子带的 ICLD, 所述 l_eVelG，b)表示第 j个子帧的第 b个子带的 ICLD。

在第七种可能的实现方式中，结合第二方面中第六种可能的实现方式，所述第四计算模块，用于：

根据

计算所述第 i 个子帧中所述第 b个子带的第二加权因子，其中，所述 M表示相邻的子带的数量，所述 z表示相邻子带和当前子带的索引号的差值。

在第八种可能的实现方式中，结合第二方面中第四种可能的实现方式，或者第五种可能的实现方式，或者第六中可能的实现方式，或者第七种可能的实现方式，所述第五计算模块，用于：

level(b)=y fac₂(i, b) *level(i, b)

根据 i=i 计算所述任一帧中所述第 b个子带的 ICLD加权值，其中，所述 level(b)表示所述任一帧中第 b个子带的 ICLD加权值，所述 fac₂(i,b)为所述第 i个子帧中所述第 b个子带的第二加权因子，所述 level(i，b)表示第 i个子帧的第 b个子带的 ICLD。

本发明实施例提供一种声道间电平差处理方法，通过计接收立体声音频信号，并逐帧解析所述立体声音频信号，获得所述立体声音频信号的每一帧中每个子帧的各个子带的声道间电平差 ICLD, 所述每一帧中包括至少两个子帧；根据获得的所述立体声音频信号的每一帧中每个子帧的各个子带的 ICLD, 计算所述立体声音频信号的任一帧中每个子帧的 ICLD的绝对值之和；当所述任一帧中任两个子帧的 ICLD的绝对值之和的差的绝对值都小于预设阔值时，采用第一加权方式计算所述任一帧中每个子带的 ICLD加权值；当所述任一帧中任两个子帧的 ICLD的绝对值之和的差的绝对值不小于预设阔值时，采用第二加权方式计算所述任一帧中每个子带的 ICLD加权值。与现有技术中由于携带立体声音频的帧长较长，当处理 10ms的立体声音频时，如果 Norma l分 4帧进行处理，相当于每 40ms (4*10ms)进行 ICLD更新，则导致在信号变化迅速或者丟包情况下无法保证解码后的立体声音频质量，另外，如果逐帧传输 ICLD, 将无法实现立体声音频信号的低比特率传输相比，本发明通过子帧间的相关性，对任一个子帧的 ICLD 看出，在信号变化迅速或者丟包情况下保证解码后的立体声音频质量，并且实现立体声音频信号的低比特率传输。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图 1为本发明一个实施例提供的一种声道间电平差处理方法的流程图；图 1为本发明另一个实施例提供的一种声道间电平差处理方法的流程图；图 3为本发明另一个实施例提供的一种声道间电平差处理方法的流程图；图 4为本发明另一个实施例提供的另一种声道间电平差处理方法的流程图；图 5为本发明一个实施例提供的一种声道间电平差处理装置的框图；图 6为本发明一个实施例提供的另一种声道间电平差处理装置的框图；图 7为本发明另一个实施例提供的另一种声道间电平差处理装置的框图。具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例提供一种声道间电平差处理方法，该方法应用于处理立体声音频的编码端，如图 1所示，该方法包括：

步骤 101 , 接收立体声音频信号，并逐帧解析所述立体声音频信号，获得所述立体声音频信号的每一帧中每个子帧的各个子带的声道间电平差 ICLD, 所述每一帧中包括至少两个子帧。

立体声音频信号可以由许多帧构成。在本步骤中，每一帧进一步可以分为多个子帧，每一个子帧可以分为多个子带。其中，需要说明的是，在实际应用中，每一帧中包括的子帧数量为偶数个，并且每一帧中可以包括至少两个子帧，例如，一帧中包括 2个子帧，或者一帧中包括 4个子帧，或者一帧中包括 6个子帧等等。每一个子帧中包括至少 12个子带。

ICLD用于分辨立体声源的水平方向角度，描述了声道间的强度差别，该参数将影响整个频谱的频率成分。进一步可选的， ICLD为两个输入声道信号的功率比，例如，第 b个子带的 ICLD值为：

level(b) = 101og₁₀

, 其中， XL(P)、 X_R(P)分别为左右声道的频域系数，

P 为频点值， level (b)的计算范围为 A^^ p Ab , , A_b分别表示不同频率对应的频点值， b表示所述第 i个子帧中任一个子带， 0 12。需要说明的是，所述 Κ表示为了近似模拟人耳的听觉特性，可把具有相同频率分辨率的频谱系数根据临界频带理论划分为 Κ 个不相重叠的子带。

步骤 102 ,根据获得的所述立体声音频信号的每一帧中每个子帧的各个子带的 ICLD, 计算所述立体声音频信号的任一帧中每个子帧的 ICLD的绝对值之和。

K

sum(i)=V level(b)

可选的，根据 ^ 计算立体声音频信号的任一帧中每个子帧的 ICLD的绝对值之和，其中，所述 i表示任一帧中包括的任一个子帧， 0 2。

步骤 103, 当所述任一帧中任两个子帧的 ICLD的绝对值之和的差的绝对值都小于预设阔值时，采用第一加权方式计算所述任一帧中每个子带的 ICLD加权值。可选的，预设阔值为根据实际经验获得的阔值。

当 I s丽（i) - s丽（j) I < TH时，则判定所述任两个子帧的 ICLD相接近，则采用第一加权方式计算所述任一帧中每个子带的 ICLD加权值。其中， sum (i)、8画（」) 分别表示所述第 i个子帧、第 j个子帧的 ICLD的绝对值之和，所述 j表示所述任一帧中包括的任一个子帧， 0 < j L，所述 L为所述任一帧中包括的子帧数量，并且 L > 2。

可选的，本步骤包括：根据所述任一帧中包括的子帧数量，计算第 i 个子帧中第 b个子带的第一加权因子；

进一步可选的，所述根据所述任一帧中包括的子帧数量，计算第 i 个子帧中第 b个子带的第一加权因子，包括：

根据 fa_Cl(i,b) = l/ L计算第 i个子帧中的第 b个子带的第一加权因子，其中，所述 fa_Cl(i,b)表示第 i个子帧中的第 b个子带的所述第一加权因子。

进一步可选的，所述根据所述第一加权因子以及所述任一帧中所述第 i 个子帧中所述第 b个子带的 ICLD,计算所述任一帧中所述第 b个子带的 ICLD加权值，包括： level(b)=yfa_Cl(i, b)*level(i, b)

步骤 104 , 当所述任一帧中任两个子帧的 ICLD的绝对值之和的差的绝对值不小于预设阔值时，采用第二加权方式计算所述任一帧中每个子带的 ICLD加权值。

在本步骤中，当 | s丽（i) _sum (j) I > TH 时，则判定所述任两个子帧的 ICLD 相差较大，则采用第二加权方式计算所述任一个子帧中每个子带的 ICLD加权值。需要说明的是，任一帧中包括的任两个子帧的 ICLD的绝对值之和的差的绝对值不小于预设阔值可以理解为：所有的差的绝对值都大于等于预设阔值，或者部分差的绝对值小于预设阔值，并且其余差的绝对值大于等于预设阔值。可选的，本步骤包括：根据计算的所述立体声音频信号的所述任一帧中每个子帧的 ICLD的绝对值之和，或者根据所述任一帧中的第 i个子帧中第 b个子带的 ICLD, 计算所述第 i个子帧中第 b个子带的第二加权因子，所述 i表示所述任一帧中包括的任一个子帧， 0 2 , 所述 b表示所述第 i个子帧中任一个子带， 0 12;

进一步可选的，根据计算的所述立体声音频信号的所述任一帧中每个子帧的 ICLD的绝对值之和，计算所述第 i个子帧中第 b个子带的第二加权因子，包括：

L

fac₂ (i,b) = sum(i) / Vsum(j)

进一步可选的，所述根据所述任一帧中的第 i个子帧中第 b个子带的 ICLD, 计算所述第 i个子帧中第 b个子带的第二加权因子，包括： fac₂(i,b) = |level(i,b)| / V |level(j,b)|

进一步可选的，所述根据所述任一帧中的第 i个子帧中第 b个子带的 ICLD, 计算所述第 i个子帧中第 b个子带的第二加权因子，包括： fac₂(i,b)=

根据

计算所述第个子帧中所述第 b个子带的第二加权因子，其中，所述 M表示相邻的子带的数量，所述 z表示相邻子带和当前子带的索引号的差值。需要说明的是，一个子帧可以分为 K个子带，例如子带 1、子带 2……子带 K , 这里， 1、 2…… K即为子带的索引号。 " L」" 为向下取整， " I I " 为向上取整。进一步可选的，所述根据所述第二加权因子以及所述任一帧中所述第 i 个子帧中所述第 b个子带的 ICLD,计算所述任一帧中所述第 b个子带的 ICLD加权值，包括： level(b)=yfac₂(i, b)*level(i, b)

根据 i=i 计算所述任一帧中所述第 b个子带的 ICLD加权值，其中，所述 level(b)表示所述任一帧中第 b 个子带的 ICLD 加权值，所述 fac₂(i,b)为所述第 i个子帧中所述第 b个子带的第二加权因子，所述 level(i，b)表示第 i个子帧的第 b个子带的 ICLD。

进一步可选的，在本步骤之后，对获得的 ICLD加权值进行量化处理。可选的，这里量化处理为根据预设码本与 ICLD加权值进行比较，获取与 ICLD加权值最接近的预设码本中的值。例如， ICLD加权值为 1. 4 , 预设码本中包括 0、 2 等值，则对 ICLD加权值进行量化处理后获得的值为 2。

进一步可选的，为了保证立体声音频的解码后的质量的前提下，减少比特的传输，在进行量化处理时，可以计算当前 ICLD加权值与前一 ICLD加权值的差值，将计算得到的差值进行量化处理。例如，一个子帧分为 15个子带，将第 1个子带的 ICLD加权值直接进行量化处理，对第 1个子带的 ICLD加权值进行量化处理时，首先计算第 2个子带的 ICLD加权值与第 1个子带的 ICLD加权值的差值，然后将计算得到的差值进行量化处理，从而获得第 2个子带的 ICLD加权值的量化结果，可以根据计算第 2个子带的 ICLD加权值的量化结果的方法依次计算其他子带的 ICLD加权值的量化结果。

本发明实施例提供一种声道间电平差处理方法，通过根据获得的所述立体声音频信号的每一帧中每个子帧的各个子带的 ICLD, 计算所述立体声音频信号的任一帧中每个子帧的 ICLD的绝对值之和；当所述任一帧中任两个子帧的 ICLD 的绝对值之和的差的绝对值都小于预设阔值时，采用第一加权方式计算所述任一帧中每个子带的 ICLD加权值；当所述任一帧中任两个子帧的 ICLD的绝对值之和的差的绝对值不小于预设阔值时，采用第二加权方式计算所述任一帧中每个子带的 ICLD加权值。与现有技术中由于携带立体声音频的帧长较长，当处理 10ms的立体声音频时，如果 Norma l分 4帧进行处理，相当于每 40ms (4*10ms) 进行 ICLD更新，则导致在信号变化迅速或者丟包情况下无法保证解码后的立体声音频质量，另外，如果逐帧传输 ICLD, 将无法实现立体声音频信号的低比特率传输相比，本发明通过子帧间的相关性，对任一帧的子帧的 I CLD进行加权处理，使得可以在信号变化迅速或者丟包情况下保证解码后的立体声音频质量，并且实现立体声音频信号的低比特率传输。本发明实施例提供一种声道间电平差处理方法。本实施例中以一帧包括两个子帧进行详细描述，例如，一帧包括第一子帧与第二子帧，如图 2 所示，该方法包括：

步骤 201 , 接收立体声音频信号，并逐帧解析所述立体声音频信号，获得所述立体声音频信号的每一帧中每个子帧的各个子带的声道间电平差 I CLD。

在本实施例中，每一帧中包括两个子帧。即接收立体声音频信号，并逐帧解析所述立体声音频信号，可以获得立体声音频信号的每一帧中第一子帧和第二子帧的各个子带的声道间电平差 ICLD。

可选的，逐帧解析立体声音频信号，获取每一帧中每个子帧中的各个子带的 ICLD的具体处理方式可以参考附图 1中步骤 101中的描述，在此不再——赘述。

步骤 202 ,根据获得的所述立体声音频信号的每一帧中每个子帧的各个子带的 ICLD, 计算所述立体声音频信号的任一帧中第一子帧和第二子帧的声道间电平差 ICLD的绝对值之和。

K

sum(l)=V level(b)

可选的，根据 ^ 计算立体声音频信号的任一帧中第一个子帧的

ICLD的绝对值之和，其中，所述 b表示所述第 1个子帧中任一个子带， 012。

可选的，根据计算 sum (1)的方法计算 sum (2), 在此不再——赘述。

步骤 203, 判断所述第一子帧的 ICLD的绝对值之和与所述第二子帧的 ICLD 的绝对值之和的差的绝对值是否都、于预设阔值。

可选的，根据 I sum (1)- sum (2) I < TH判断所述第一子帧的 ICLD的绝对值之和与第二子帧的 ICLD的绝对值之和的差的绝对值是否都小于预设阔值。其中， TH为预设阔值，预设阔值可以根据实际经验进行设定。

步骤 204,当所述第一子帧的 ICLD的绝对值之和与所述第二子帧的 ICLD的绝对值之和的差的绝对值都小于预设阔值时，采用第一加权方式计算所述任一帧中每个子带的 ICLD加权值。

当 |sum(l)_sum(2) I <TH时，表明第一子帧与第二子帧的 ICLD相接近，则可以采用第一加权方式计算所述任一帧中每个子带的 ICLD加权值。

可选的，本步骤包括：根据所述任一帧中包括的子帧数量，计算第 i 个子帧中第 b个子带的第一加权因子，所述 i表示所述任一帧中包括的任一个子帧， 02, 所述 b表示所述第 i个子帧中任一个子带，0 12;

进一步可选的，根据所述任一帧中包括的子帧数量，计算第 i个子帧中第 b 个子带的第一加权因子，包括：

根据 fa_Cl(i,b) = l/L计算第 i个子帧的第 b个子带的第一加权因子，其中，所述 fa_Cl(i,b)表示第 i个子帧中的第 b个子带的所述第一加权因子， 0<1) 1，所述1 表示任一个子帧中包括的子带数量， K > 12 , 所述 i表示所述任一帧中包括的任一个子帧， 0 2。

在本步骤中， L为 2 , 则任一帧中第一个子帧或者第二个子帧的第一加权因子为 fac^iW ^/ I^OJ。

进一步可选的，根据所述第一加权因子以及所述任一帧中所述第 i 个子帧中所述第 b个子带的 ICLD, 计算所述任一帧中所述第 b个子带的 ICLD加权值，包括： level(b)=yfa_Cl(i, b)*level(i, b)

根据 i=i 计算任一帧中第 b个子带的 ICLD加权值，其中，所述 level(b)表示所述任一帧中第 b个子带的 ICLD加权值， 0 12 , 所述 i表示所述任一帧中包括的任一个子帧， 0 < i L, 所述 l_evel(i，b)表示第 i个子帧的第 b个子带的 ICLD。

在本步骤中， L=2 ,任一帧的 ICLD加权值为： level(b)=[level(l， b)+level(2, b)] *0.5。步骤 205 , 当所述任一帧中任两个子帧的 ICLD的绝对值之和的差的绝对值不小于预设阔值时，采用第二加权方式计算所述任一帧中每个子带的 ICLD加权值。

当 I s丽（1) - s丽（2) I > TH时，表明第一子帧与第二子帧的 ICLD相差较大，则可以采用第二加权方式计算所述任一帧中每个子带的 I CLD加权值。

可选的，采用第二加权方式计算所述任一帧中每个子带的 ICLD加权值，可以采用以下三种方式进行计算：方式一，整帧加权处理；方式二，基于当前子带的逐子带加权处理；方式三，基于相邻 M个子带的逐子带加权处理。

可选的，采用方式一进行加权处理时，本步骤包括：

根据计算的所述立体声音频信号的所述任一帧中第一子帧或者第二子帧的 ICLD的绝对值之和，计算第一子帧或者第二子帧中第 b个子带的第二加权因子；根据所述第二加权因子以及所述任一帧中包括的第一子帧或者第二子帧的第 b个子带的 ICLD, 计算任一帧中第 b个子带的 ICLD加权值。

可选的，根据计算的所述立体声音频信号的所述任一帧中第一子帧或者第二子帧的 ICLD的绝对值之和，计算第一子帧或者第二子帧中第 b个子带的第二加权因子，包括：

L

fac₂ (i,b) = sum(i) / Vsum(j)

具体的，在本步骤中， i =1或 2 , fac₂ = sum(l) I [sum(l)+sum(2)]。

进一步可选的，根据所述第二加权因子以及所述任一帧中包括的第一子帧或者第二子帧的第 b个子带的 ICLD , 计算任一帧中第 b个子带的 ICLD加权值，包括： level(b)=y fac₂(i, b) *level(i, b)

根据 i=i 计算所述任一帧中所述第 b个子带的 ICLD加权值，其中，所述 level(b)表示所述任一帧中第 b 个子带的 ICLD 加权值，所述 fac₂(i,b)为所述第 i个子帧中所述第 b个子带的第二加权因子，所述 l_evel(i，b)表示第 i个子帧的第 b个子带的 ICLD。

具体的，在本步骤中，任一帧的第 b 个子带的 ICLD 加权值为： level(b)=fac₂ *level(l, b)+(l-fac₂) *level(2, b)。

可选的，采用方式二进行加权处理时，本步骤包括：

根据所述计算的立体声音频的任一帧中包括的第一子帧或者第二子帧中的第 b个子带的 ICLD,计算第一子帧或者第二子帧中第 b个子带的第二加权因子；根据所述第二加权因子以及所述任一帧中包括的第一子帧或者第二子帧的第 b个子带的 ICLD, 计算任一帧中第 b个子带的 ICLD加权值。

进一步可选的，根据所述计算的立体声音频的任一帧中包括的第一子帧或者第二子帧中的第 b个子带的 ICLD , 计算第一子帧或者第二子帧中第 b个子带的第二加权因子，包括： fac₂(i,b) = |level(i,b)| / V |level(j,b)|

根据 w 计算所述任一帧中第 b个子带的 ICLD 加权值，其中，所述 level(b)表示所述任一帧中第 b个子带的 ICLD加权值， 012, 所述 fac₂(i,b)为第 i个子帧中第 b个子带的第二加权因子， 0< i L, 所述 l_evel(i，b)表示第 i个子帧的第 b个子带的 ICLD。

具体的，在本步骤中， L=2, 则任一帧的第 b 个子带的 ICLD 加权值为： level(b)=faq (b)*level(i b)+(l-fap (b))*le^^2,b)。可选的，采用方式三进行加权处理时，本步骤包括：

进一步可选的，根据所述计算的立体声音频的任一帧中包括的第一子帧或者第二子帧中的第 b个子带的 ICLD, 计算第一子帧或者第二子帧中第 b个子带的第二加权因子，包括：

根据

计算所述第一子帧或者第二子帧中第 b个子带的第二加权因子，其中，所述 M表示所述任一帧中的任一个子帧中相邻的子带的数量。其中，所述表示相邻子带与当前子带的索引号的差值。需要说明的是，一个子帧可以分为 κ个子带，例如子带 1、子带 2……子带 K, 这里， 1、 2…… K即为子带的索引号。

具体的，骤中，当基于相邻 2子带的 ICLD得到加权因子为：

|level(l, b)| + |level(l, b - 1)| + |level(2, b)| + |level(2, b 在本步骤中，当基于相邻 3子带的 ICLD得到加权因子为:

|level(l,b)|

b

evel ')| + |level(2，b)|

需要说明的是，当需要计算基于相邻 4个或者 5个等其他个数子带的 ICLD 的加权因子时，可以参照上述基于 M个子带的 ICLD的加权因子的通用计算公式进行计算，在此不再——具体举例说明。

可选的，根据所述第二加权因子以及所述任一帧中包括的第一子帧或者第二子帧的第 b个子带的 ICLD, 计算第一子帧或者第二子帧中第 b个子带的 ICLD 加权值，与采用方式二计算任一帧中第 b个子带的 ICLD加权值的方法相同， L=2 , 即任一帧的中第 b 个子带的 ICLD 加权值为： level(b)=fac₂(b) * level(l, b)+(l-fac₂(b)) * level(2, b)。

步骤 206 , 对获得的 ICLD加权值进行量化处理。

可选的，这里量化处理为根据预设码本与 ICLD加权值进行比较，获取与 ICLD 加权值最接近的预设码本中的值。例如， ICLD加权值为 1. 4 ,预设码本中包括 0、 2等值，则对 ICLD加权值进行量化处理后获得的值为 2。

下面以一帧包括四个子帧进行详细描述，如图 3所示，该方法包括：步骤 301 , 接收立体声音频信号，并逐帧解析所述立体声音频信号，获得所述立体声音频信号的每一帧中每个子帧的各个子带的声道间电平差 ICLD。

可选的，所述每一帧中包括四个子帧。可选的，逐帧解析立体声音频信号，获取每一帧中每个子帧中的各个子带的 ICLD的具体处理方式可以参考附图 1中步骤 101中的描述，在此不再——赘述。

步骤 302 ,根据获得的所述立体声音频信号的每一帧中每个子帧的各个子带的 ICLD, 计算所述立体声音频信号的任一帧中每个子帧的 ICLD的绝对值之和。

sum(i)=V level(b)

ICLD的绝对值之和，其中，所述 b表示所述第 1个子帧中任一个子带， 0 < b

K，所述 Κ表示任一个子帧中包括的子带数量， Κ > 12 , 所述 i表示任一帧中包括的任一个子帧，在本实施例中， Q < i 4。

步骤 303 , 判断所述任一帧中任两个子帧的 ICLD的绝对值之和的差的绝对值是否都小于预设阔值。

可选的，根据 I s丽（i) -sum (j) I < TH判断所述任一帧中第 i个子帧与第 j个子帧的 ICLD的绝对值之和的差的绝对值是否都小于预设阔值。其中， TH为预设阔值，预设阈值可以根据实际经验进行设定。

步骤 304 , 当所述任一帧中任两个子帧的 ICLD的绝对值之和的差的绝对值都小于预设阔值时，采用第一加权方式计算所述任一帧中每个子带的 ICLD加权值。当 I sum (i) -sum (j) I < TH时，表明第 i个子帧与第 j个子帧的 ICLD相接近，则可以采用第一加权方式计算所述任一帧中每个子带的 I CLD加权值。

可选的，本步骤包括：

根据所述任一帧中包括的子帧数量，计算第 i个子帧中第 b个子带的第一加权因子，所述 i表示所述任一帧中包括的任一个子帧， 02, 所述 b表示所述第 i个子帧中任一个子带， 012;

根据 fa_Cl(i,b) = l/L计算第 i个子帧中的第 b个子带的第一加权因子，其中，所述 fa_Cl(i,b)表示第 i个子帧中的第 b个子带的所述第一加权因子， 012, 所述 i表示所述任一帧中包括的任一个子帧， 02。

在本步骤中， L=4, 则第一加权因子为 fa_Cl(i,b) = l/L=0.25。

根据 i=i 计算任一帧中第 b个子带的 ICLD加权值，其中，所述 level(b)表示所述任两个子帧中第 b个子带的 ICLD加权值， 0 12, 所述 i表示所述任一帧中包括的任一个子帧， 0<i L, 所述 l_evel(i，b)表示第 i个子帧的第 b个子带的 ICLD。

4

level(b)=0.25*yievel(i, b) 在本步骤中，任一帧的第 b个子带的 ICLD加权值为： w 。步骤 305, 当所述任一帧中任两个子帧的 ICLD的绝对值之和的差的绝对值不小于预设阔值时，采用第二加权方式计算所述任一帧中每个子带的 ICLD加权值。

当 I sum (i) -sum (j) I > TH时，表明第 i个子帧与第 j个子帧的 ICLD相差较大，则可以采用第二加权方式计算所述任一帧中每个子带的 ICLD加权值。需要说明的是，任一帧中包括的任两个子帧的 ICLD的绝对值之和的差的绝对值不小于预设阔值可以理解为：所有的差的绝对值都大于等于预设阔值，或者部分差的绝对值小于预设阔值，并且其余差的绝对值大于等于预设阔值。例如， I sum (1) -sum (2) I > TH , I sum (1) -sum (3) I > TH , I sum (1) -sum (4) I > TH , I sum (2) -sum (3) I > TH, I sum (2) -sum (3) I > TH, I sum (3) -sum (4) I > TH; 或者， I sum (1) -sum (2) I > TH , I sum (1) -sum (3) I > TH , I sum (1) -sum (4) I < TH , I sum (2) -sum (3) I < TH, I sum (2) -sum (3) I < TH, I sum (3) -sum (4) I < TH时，可以采用第二加权方式计算所述任一帧中任一个子带的 ICLD加权值。

可选的，采用方式一进行加权处理时，本步骤包括：

根据计算的所述立体声音频信号的所述任一帧中每个子帧的 ICLD的绝对值之和，计算所述第 i个子帧中第 b个子带的第二加权因子，所述 i表示所述任一帧中包括的任一个子帧， 0 2 , 所述 b表示所述第 i个子帧中任一个子带， 0 12;

可选的，根据计算的所述立体声音频信号的所述任一帧中每个子帧的 ICLD 的绝对值之和，计算所述第 i个子帧中第 b个子带的第二加权因子，包括：

L

fac₂ (i,b) = sum(i) / Vsum(j)

根据计算所述第 i个子帧中所述第 b个子带的第二加权因子，其中，所述 fac₂(i,b)为第 i个子帧中第 b个子带的第二加权因子，所述 sum(i)表示所述第 i个子巾贞中每个子带的 ICLD的绝对值之和 , 所述 sum(j)表示所述第 j个子帧中每个子带的 ICLD的绝对值之和，所述 j为所述任一帧中包括任一个子帧， 0 < j L。

进一步可选的，在本步骤中， L=4, 计算第 i个子帧中第 b个子带的的第二

4

fac₂(i, b) = sum(i) I ^sum(j)

力口权因子： j=i 。进一步可选的，根据所述第二加权因子以及所述任一帧中所述第 i 个子帧中所述第 b个子带的 ICLD, 计算所述任一帧中所述第 b个子带的 ICLD加权值，包括： level(b)=yfac₂(i, b)*level(i, b)

根据 w 计算所述任一帧中所述第 b个子带的 ICLD加权值，其中，所述 level(b)表示所述任一帧中第 b 个子带的 ICLD 加权值，所述 fac₂(i,b)为所述第 i个子帧中所述第 b个子带的第二加权因子，所述 level(i，b)表示第 i个子帧的第 b个子带的 ICLD。

进一步可选的，在本步骤中， L=4, 计算任一帧中第 b个子带的 ICLD加权值： level(b)=^ fac₂ (i, b) * level(i, b)。

可选的，采用方式二进行加权处理时，本步骤包括：

根据所述任一帧中的第 i个子帧中第 b个子带的 ICLD, 计算所述第 i个子帧中第 b个子带的第二加权因子；

进一步可选的，根据所述任一帧中的第 i个子帧中第 b个子带的 ICLD, 计算所述第 i个子帧中第 b个子带的第二加权因子，包括： fac₂(i,b) = |level(i,b)| /V |level(j,b)|

根据 ^ 计算所述第 i个子帧中第 b个子带的第二加权因子，其中，所述^{1 evel}(i，^b)表示第 i个子帧的第 b个子带的 ICLD,所述 l_evel(j，b) 表示第 j个子帧的第 b个子带的 ICLD。

进一步可选的，在本步骤中， L=4, 计算第 i个子帧中第 b个子带的第二加 fac₂(i,b) = |level(i,b)| /^|level(j,b)|

权因子：。可选的，根据所述第二加权因子以及所述任一帧中所述第 i 个子帧中所述第 b个子带的 ICLD, 计算所述任一帧中所述第 b个子带的 ICLD加权值，包括： level(b)=yfac₂(i, b)*level(i, b)

根据 i=i 计算所述任一帧中第 b个子带的 ICLD加权值，其中，所述 level(b)表示所述任一帧中第 b个子带的 ICLD加权值， 0 12 , 所述 fac₂(i,b)为第 i个子帧中第 b个子带的第二加权因子， 0 < i L, 所述 level(i，b)表示第 i个子帧的第 b个子带的 ICLD。

进一步可选的，在本步骤中，计算任一帧中第 b个子带的 ICLD加权值： level(b)=∑fac₂(i, b)*level(i, b) 可选的，采用方式三进行加权处理时，本步骤包括：

进一步可选的，根据所述任一帧中的第 i个子帧中第 b个子带的 ICLD, 计算所述第 i个子帧中第 b个子带的第二加权因子，包括：

根据

计算所述第

个子帧中第 b个子带的第二加权因子，其中，所述 M表示所述任一帧中的任一个子帧中相邻的子带的数量，所述 z表示相邻子带和当前子带的索引号的差值。需要说明的是，一个子帧可以分为 K个子带，例如子带 1、子带 2……子带 K, 这里， 1、 2…… K即为子带的索引号。

进一步可选的，在本步骤中，基于相邻 1子带的 ICLD计算第 i个子帧中第 b个子带的第二加权因子：

进一步可选的，在本步骤中，基于相邻 3子带的 ICLD计算第 i个子帧中第 b个子带的第二加权因子：

level(i,b)|

fac₂(i,b)=

需要说明的是，当需要计算基于相邻 4个或者 5个等其他个数子带的 ICLD 的加权因子时，可以参照上述基于 M个子带的 ICLD的加权因子的通用计算公式进行计算，在此不再——具体举例说明。根据所述第二加权因子以及所述任一帧中所述第 i个子帧中所述第 b个子带的 ICLD, 计算所述任一帧中所述第 b个子带的 ICLD加权值

可选的，根据所述第二加权因子以及所述任一帧中所述第 i 个子帧中所述第 b个子带的 ICLD, 计算所述任一帧中所述第 b个子带的 ICLD加权值，与采用方式二计算任一帧中第 b个子带的 ICLD加权值的方法相同，即任一帧的第 b个 level(b)=yfac₂(i, b)*level(i, b)

子带的 CLD加权值为： i=i 。步骤 306, 对获得的 ICLD加权值进行量化处理。可选的，这里量化处理为根据预设码本与 ICLD加权值进行比较，获取与 ICLD 加权值最接近的预设码本中的值。例如， ICLD加权值为 1. 4 ,预设码本中包括 0、 2等值，则对 ICLD加权值进行量化处理后获得的值为 2。

进一步可选的，为了保证立体声音频的解码后的质量的前提下，减少比特的传输，在进行量化处理时，可以计算当前 ICLD加权值与前一 ICLD加权值的差，将计算得到的差进行量化处理。例如，一个子帧分为 15个子带，将第 1个子带的 ICLD加权值直接进行量化处理，对第 2个子带的 ICLD加权值进行量化处理时，首先计算第 2个子带的 ICLD加权值与第 1个子带的 ICLD加权值的差值，然后将计算得到的差值进行量化处理，从而获得第 2个子带的 ICLD加权值的量化结果，可以根据计算第 2个子带的 ICLD加权值的量化结果的方法依次计算其他子带的 ICLD加权值的量化结果。

需要说明的是，当一帧立体声音频信号分为 2个子帧，一个子帧分为 12个子带时，在立体声音频信号传输过程中没有丟包时，现有技术获得的分段信噪比（segmenta l s igna l-to-noi se rat io, SSNR ) 为 3. 63dB, 而采用本发明实施例提供的方法后，获得的 SSNR为 3. 73dB。需要说明的是， SSNR值越大，说明编解码处理音频越接近原始音频，即效果越好。因此，本发明实施例提供的方法较现有技术提升 0. ldB以上。而在立体声音频信号传输过程中存在丟包时，现有技术获得的 SSNR 为 3. 59dB, 而采用本发明实施例提供的方法后，获得的 SSNR为 3. 72dB, 测试结果与没有丟包情况下获得的测试结果相近。

本发明实施例提供一种声道间电平差处理方法，通过基于子帧间相关性，对任一个子帧的 ICLD进行加权处理，并对 ICLD加权值进行量化处理，使得能够有效降低编码比特率，且在信号变化迅速及丟包情况下能够保证解码立体声音频质量，达到了预想效果。

本发明实施例提供一种声道间电平差处理方法，如图 4 所示，在立体声音频解码端，接收输入的量化处理后的立体声音频比特流，解析此比特流获得 K ( K > 12 )个子带的 ICLD, 将各个子带的 ICLD值依次对应地作为当前各个子帧的各个子带的 ICLD, 从而获得解码后的立体声音频信号。

例如，解析接收到的比特流后获得的子带 1的 ICLD为 A, 子带 2的 ICLD为 B, 子带 3的 ICLD为 C等，当前帧分为 L个子帧，则每个子帧的子带 1的 ICLD 为 A, 子带 2的 ICLD为 B, 子带 3的 ICLD为 C等。

本发明实施例提供的一种声道间电平差处理方法，将接收到的量化处理后的立体声音频比特流进行解码后，可以获得较高质量的立体声音频，并且实现了立体声音频信号的低比特率传输。本发明实施例提供一种声道间电平差处理装置，该装置可以为处理立体声音频的编码端，如图 5所示，该装置包括：接收单元 501 , 解析单元 502 , 计算单元 503 , 第一加权处理单元 504 , 第二加权处理单元 505;

接收单元 501 , 用于接收立体声音频信号；

解析单元 502 , 用于根据所述接收单元 501接收的所述立体声音频信息，逐帧解析所述立体声音频信号，获得所述立体声音频信号的每一帧中每个子帧的各个子带的声道间电平差 ICLD, 所述每一帧中包括至少两个子帧；

ICLD用于分辨立体声源的水平方向角度，描述了声道间的强度差别，该参数将影响整个频谱的频率成分。

计算单元 503 ,用于根据所述解析单元 502解析获得的所述立体声音频信号的每一帧中每个子帧的各个子带的 ICLD , 计算所述立体声音频信号的任一帧中每个子帧的 ICLD的绝对值之和；

第一加权处理单元 504 , 用于当所述任一帧中任两个子帧的 ICLD的绝对值之和的差的绝对值都小于预设阔值时，采用第一加权方式计算所述任一帧中每个子带的 ICLD加权值；

第二加权处理单元 505 , 用于当所述任一帧中任两个子帧的 ICLD的绝对值之和的差的绝对值不小于预设阔值时，采用第二加权方式计算所述任一帧中每个子带的 ICLD加权值。需要说明的是，任一帧中包括的任两个子帧的 ICLD的绝对值之和的差的绝对值不小于预设阔值可以理解为：所有的差的绝对值都大于等于预设阔值，或者部分差的绝对值小于预设阔值，并且其余差的绝对值大于等于预设阔值。

进一步可选的，在计算单元 503根据所述解析单元解析获得的所述立体声音频信号的每一帧中每个子帧的各个子带的 ICLD, 计算所述立体声音频信号的任一帧中每个子帧的 ICLD 的绝对值之和之后，当所述任一帧中任两个子帧的 ICLD的绝对值之和的差的绝对值都小于预设阔值时，第一加权处理单元 504采用第一加权方式计算所述任一帧中每个子带的 ICLD加权值之前，或者，当所述任一帧中任两个子帧的 ICLD的绝对值之和的差的绝对值不小于预设阔值时，第二加权处理单元 505采用第二加权方式计算所述任一帧中每个子带的 ICLD加权值之前，可以先判断所述任一帧中任两个子帧的 ICLD的绝对值之和的差的绝对值是否都小于预设阔值。

进一步可选的，如图 6所示，所述第一加权处理单元 504 , 包括：第一计算模块 5041 , 第二计算模块 5042。

第一计算模块 5041 , 用于根据所述任一帧中包括的子帧数量，计算第 i个子帧中第 b个子带的第一加权因子，所述 i表示所述任一帧中包括的任一个子帧， 0 2 , 所述 b表示所述第 i个子帧中任一个子带， 0 12;

所述第一计算模块 5041用于：

根据 fa_Cl(i,b) = l / L计算第 i个子帧中的第 b个子带的第一加权因子，其中，所述 fa_Cl(i,b)表示第 i个子帧中的第 b个子带的所述第一加权因子。

第二计算模块 5042 , 用于根据所述第一加权因子以及所述任一帧中所述第 i个子帧中所述第 b个子带的 ICLD, 计算所述任一帧中所述第 b个子带的 ICLD 加权值。

所述第二计算模块 5042 , 用于： level(b)=yfa_Cl(i, b)*level(i, b)

根据 i=i 计算所述任一帧中所述第 b个子带的 ICLD加权值，其中，所述 level(b)表示所述任一帧中第 b 个子带的 ICLD 加权值，所述 l_eVel(i，b)表示第 i个子帧的第 b个子带的 ICLD。

进一步可选的，所述第二加权处理单元 505, 包括：第三计算模块 5051, 第四计算模块 5052, 第五计算模块 5053。

第三计算模块 5051, 用于根据计算的所述立体声音频信号的所述任一帧中每个子帧的 ICLD的绝对值之和，计算所述第 i个子帧中第 b个子带的第二加权因子，所述 i表示所述任一帧中包括的任一个子帧， 02, 所述 b表示所述第 i个子帧中任一个子带， 0<b<K, 所述 K表示任一个子帧中包括的子带数量， K>12; 或者，第四计算模块 5052, 用于根据所述任一帧中的第 i个子帧中第 b个子带的 ICLD, 计算所述第 i个子帧中第 b个子带的第二加权因子；

第五计算模块 5053, 用于根据所述第二加权因子以及所述任一帧中所述第 i个子帧中所述第 b个子带的 ICLD, 计算所述任一帧中所述第 b个子带的 ICLD 加权值。

进一步可选的，采用整帧加权处理方式计算所述第 i个子帧中第 b个子带的第二加权因子时，所述第三计算模块 5051, 用于：

L

fac₂ (i,b) = sum(i) / Vsum(j)

根据计算所述第 i个子帧中所述第 b个子带的第二加权因子，其中，所述 fac₂(i,b)为第 i个子帧中第 b个子带的第二加权因子，所述 sum(i)表示所述第 i个子帧中每个子带的 ICLD的绝对值之和，所述 _sum(j)表示所述第 j个子帧中每个子带的 ICLD的绝对值之和，所述 j为所述任一帧中包括任一个子帧， 0<j L。

进一步可选的，采用基于当前子带的 ICLD进行逐子带加权处理方式，计算所述第 i个子帧中第 b个子带的第二加权因子时，所述第四计算模块 5052, 用于： fac₂(i,b) = |level(i,b)| /V |level(j,b)|

进一步可选的，采用基于相邻 M子带的 ICLD进行逐子带加权处理方式，计算所述第 i个子帧中第 b个子带的第二加因子权时，所述第四计算模块 5052 , 用于：

根据

计算所述第 i

个子帧中所述第 b个子带的第二加权因子，其中，所述 M表示相邻的子带的数量，所述 z表示相邻子带和当前子带的索引号的差值。需要说明的是，一个子帧可以分为 K个子带，例如子带 1、子带 2……子带 K, 这里， 1、 2…… K即为子带的索引号。

进一步可选的，所述第五计算模块 5053 , 用于： level(b)=yfac₂(i, b)*level(i, b)

根据 i=i 计算所述任一帧中所述第 b个子带的 ICLD加权值，其中，所述 level(b)表示所述任一帧中第 b 个子带的 ICLD 加权值，所述 fac₂(i,b)为所述第 i个子帧中所述第 b个子带的第二加权因子，所述 l_evel(i， b)表示第 i个子帧的第 b个子带的 ICLD。

需要说明的是，附图 5或附图 6所示装置中，其各个模块的具体实施过程以及各个模块之间的信息交互等内容，由于与本发明方法实施例基于同一发明构思，可以参见方法实施例，在此不——赘述。

本发明实施例提供一种声道间电平差处理装置，通过基于子帧间相关性，对任一个子帧的 ICLD进行加权处理，并对 ICLD加权值进行量化处理，使得能够有效降低编码比特率，且在信号变化迅速及丟包情况下能够保证解码立体声音频质量，达到了预想效果。

本发明实施例提供一种声道间电平差处理装置，该装置可以为处理立体声音频的编码端，如图 7所示，该装置包括：接收器 701 ,存储器 702 ,处理器 703. 接收器 701 , 用于接收立体声音频信号；

存储器 702 , 用于存储包括程序的信息；

处理器 703, 与接收器 701、存储器 702连接，用于控制所述程序的执行，具体包括：根据接收的所述立体声音频信息，逐帧解析所述立体声音频信号，获得所述立体声音频信号的每一帧中每个子帧的各个子带的声道间电平差 ICLD, 所述每一帧中包括至少两个子帧；以及根据所述解析单元解析获得的所述立体声音频信号的每一帧中每个子帧的各个子带的 ICLD, 计算所述立体声音频信号的任一帧中每个子帧的 ICLD的绝对值之和；以及当所述任一帧中任两个子帧的 ICLD的绝对值之和的差的绝对值都小于预设阔值时，采用第一加权方式计算所述任一帧中每个子带的 ICLD加权值；当所述任一帧中任两个子帧的 ICLD 的绝对值之和的差的绝对值不小于预设阔值时，采用第二加权方式计算所述任一帧中每个子带的 ICLD加权值。

需要说明的是，任一帧中任两个子帧的 ICLD的绝对值之和的差的绝对值不小于预设阔值可以理解为：所有的差的绝对值都大于等于预设阔值，或者部分差的绝对值小于预设阔值，并且其余差的绝对值大于等于预设阔值。可选的，立体声音频信号可以由许多帧构成。在本步骤中，每一帧可以分为多个子帧，每一个子帧可以分为多个子带。其中，需要说明的是，在实际应用中，每一帧中包括的子帧数量为偶数个，并且每一帧中可以包括至少两个子帧，例如，一帧中包括 2个子帧，或者一帧中包括 4个子帧，或者一帧中包括 6 个子帧等等。每一个子帧中包括至少 12个子带。

进一步可选的，所述处理器 703还用于计算所述立体声音频信号的任一帧中每个子帧的 ICLD 的绝对值之和之后，并且在当所述任一帧中任两个子帧的 ICLD的绝对值之和的差的绝对值都小于预设阔值时，采用第一加权方式计算所述任一帧中每个子带的 ICLD加权值之前，或者，在当所述任一帧中任两个子帧的 ICLD的绝对值之和的差的绝对值不小于预设阔值时，采用第二加权方式计算所述任一帧中每个子带的 ICLD加权值之前，用于判断所述任一帧中任两个子帧的 ICLD的绝对值之和的差的绝对值是否都小于预设阔值。

进一步可选的，所述处理器 703 采用第一加权方式计算所述任一帧中每个子带的 ICLD加权值时，用于根据所述任一帧中包括的子帧数量，计算第 i个子帧中第 b个子带的第一加权因子，所述 i表示所述任一帧中包括的任一个子帧， 0 2 , 所述 b表示所述第 i个子帧中任一个子带，0 12; 以及根据所述第一加权因子以及所述任一帧中所述第 i个子帧中所述第 b个子带的 ICLD, 计算所述任一帧中所述第 b个子带的 ICLD加权值。

进一步可选的，所述处理器 703根据所述任一帧中包括的子帧数量，计算第 i个子帧中第 b个子带的第一加权因子时，具体用于：根据 fa_Cl(i,b) = l / L计算第 i个子帧中的第 b个子带的第一加权因子，其中，所述 f_aCl(i,b)表示第 i个子帧中的第 b个子带的所述第一加权因子。

进一步可选的，所述处理器 703根据所述第一加权因子以及所述任一帧中所述第 i个子帧中所述第 b个子带的 ICLD, 计算所述任一帧中所述第 b个子带的 I CLD加权值时，具体用于： level(b)=yfa_Cl(i, b)*level(i, b)

进一步可选的，所述处理器 703 采用第二加权方式计算所述任一帧中每个子带的 ICLD加权值时，用于根据计算的所述立体声音频信号的所述任一帧中每个子帧的 ICLD的绝对值之和，计算所述第 i个子帧中第 b个子带的第二加权因子，所述 i表示所述任一帧中包括的任一个子帧， 0 2 , 所述 b表示所述第 i个子帧中任一个子带， 0 12; 或者，根据所述任一帧中的第 i个子帧中第 b个子带的 ICLD, 计算所述第 i个子帧中第 b个子带的第二加权因子；以及根据所述第二加权因子以及所述任一帧中所述第 i 个子帧中所述第 b个子带的 ICLD,计算所述任一帧中所述第 b个子带的 ICLD加权值。

进一步可选的，所述处理器 703根据计算的所述立体声音频信号的所述任一帧中每个子帧的 ICLD的绝对值之和，计算所述第 i个子帧中第 b个子带的第二加权因子时，用于

L

fac₂ (i,b) = sum(i) / Vsum(j)

进一步可选的，所述处理器 703根据所述任一帧中的第 i个子帧中第 b个子带的 ICLD, 计算所述第 i个子帧中第 b个子带的第二加权因子时，用于： fac₂(i,b) = |level(i,b)| / V |level(j,b)|

根据计算所述第 i个子帧中所述第 b个子带的第二加权因子，其中，所述 l_evel(i，b)表示第 i个子帧的第 b个子带的 ICLD, 所述 l_eVel(j，b)表示第 j个子帧的第 b个子带的 ICLD。进一步可选的，所述处理器 703根据所述任一帧中的第 i个子帧中第 b个子带的 ICLD, 计算所述第 i个子帧中第 b个子带的第二加权因子时，用于：

根据

计算所述第个子帧中所述第 b个子带的第二加权因子，其中，所述 M表示相邻的子带的数量，所述表示相邻子带和当前子带的索引号的差值。需要说明的是，一个子帧可以分为 K个子带，例如子带 1、子带 2……子带 K, 这里， 1、 2…… K即为子带的索引号。

进一步可选的，所述处理器 703根据所述第二加权因子以及所述任一帧中所述第 i个子帧中所述第 b个子带的 ICLD, 计算所述任一帧中所述第 b个子带的 ICLD加权值时，用于：

level(b)=y fac₂(i, b) *level(i, b)

需要说明的是，附图 7 所示装置中，其各个模块的具体实施过程以及各个模块之间的信息交互等内容，由于与本发明方法实施例基于同一发明构思，可以参见方法实施例，在此不——赘述。

可见，本发明实施例提供一种声道间电平差处理装置，通过基于子帧间相关性，对任一个子帧的 ICLD进行加权处理，并对 ICLD加权值进行量化处理，使得能够有效降低编码比特率，且在信号变化迅速及丟包情况下能够保证解码立体声音频质量，达到了预想效果。

需说明的是，以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网絡单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，所属领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件的方式来实现，当然也可以通过专用硬件包括专用集成电路、专用 CPU、专用存储器、专用元器件等来实现，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在可读取的存储介质中，如计算机的软盘， U盘、移动硬盘、只读存储器（ROM, Read-Only Memory ), 随机存取存储器 ( RAM, Random Acces s Memory ), 磁碟或者光盘等，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网絡设备等）执行本发明各个实施例所述的方法。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置和系统实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

Claims

权利要求

1、一种声道间电平差处理方法，其特征在于，包括：

接收立体声音频信号，并逐帧解析所述立体声音频信号，获得所述立体声音频信号的每一帧中每个子帧的各个子带的声道间电平差 ICLD, 所述每一帧中包括至少两个子帧；

2、根据权利要求 1所述的方法，其特征在于，所述采用第一加权方式计算所述任一帧中每个子带的 ICLD加权值，包括：

3、根据权利要求 2所述的方法，其特征在于，所述根据所述任一帧中包括的子帧数量，计算第 i个子帧中第 b个子带的第一加权因子，包括：

根据 fa_Cl(i,b) = l / L计算第 i个子帧中的第 b个子带的第一加权因子，其中，所述 f_aCl(i,b)表示第 i个子帧中的第 b个子带的所述第一加权因子。

4、根据权利要求 3所述的方法，其特征在于，所述根据所述第一加权因子以及所述任一帧中所述第 i个子帧中所述第 b个子带的 ICLD, 计算所述任一帧中所述第 b个子带的 ICLD加权值，包括： level(b)=yfa_Cl(i, b)*level(i, b)

5、根据权利要求 1所述的方法，其特征在于，所述采用第二加权方式计算所述任一帧中每个子带的 ICLD加权值，包括：

根据计算的所述立体声音频信号的所述任一帧中每个子帧的 ICLD的绝对值之和，或者根据所述任一帧中的第 i个子帧中第 b个子带的 ICLD, 计算所述第 i个子帧中第 b个子带的第二加权因子，所述 i表示所述任一帧中包括的任一个子帧， 0 2 , 所述 b表示所述第 i个子帧中任一个子带， 0 12;

6、根据权利要求 5所述的方法，其特征在于，根据计算的所述立体声音频信号的所述任一帧中每个子帧的 ICLD的绝对值之和，计算所述第 i个子帧中第 b个子带的第二加权因子，包括：

L

fac₂ (i,b) = sum(i) / Vsum(j)

7、根据权利要求 6所述的方法，其特征在于，所述根据所述任一帧中的第 i个子帧中第 b个子带的 ICLD, 计算所述第 i个子帧中第 b个子带的第二加权因子，包括： fac₂(i,b) = |level(i,b)| /V |level(j,b)|

8、根据权利要求 7所述的方法，其特征在于，所述根据所述任一帧中的第 i个子帧中第 b个子带的 ICLD, 计算所述第 i个子帧中第 b个子带的第二加权因子，包括：

根据

计算所述第

个子帧中所述第 b个子带的第二加权因子，其中，所述 M表示相邻的子带的数量，所述 Z表示相邻子带和当前子带的索引号的差值。

9、根据权利要求 5-8中任一项所述的方法，其特征在于，所述根据所述第二加权因子以及所述任一帧中所述第 i个子帧中所述第 b个子带的 ICLD, 计算所述任一帧中所述第 b个子带的 ICLD加权值，包括： level(b)=yfac₂(i, b)*level(i, b)

10、一种声道间电平差处理装置，其特征在于，包括：

接收单元，用于接收立体声音频信号；

解析单元，用于根据所述接收单元接收的所述立体声音频信息，逐帧解析所述立体声音频信号，获得所述立体声音频信号的每一帧中每个子帧的各个子带的声道间电平差 ICLD, 所述每一帧中包括至少两个子帧；

计算单元，用于根据所述解析单元解析获得的所述立体声音频信号的每一帧中每个子帧的各个子带的 ICLD, 计算所述立体声音频信号的任一帧中每个子帧的 ICLD的绝对值之和；

11、根据权利要求 10所述的装置，其特征在于，所述第一加权处理单元，包括：

12、根据权利要求 11所述的装置，其特征在于，所述第一计算模块，用于：根据 fa_Cl(i,b) = l/ L计算第 i个子帧中的第 b个子带的第一加权因子，其中，所述 fa_Cl(i,b)表示第 i个子帧中的第 b个子带的所述第一加权因子。

13、根据权利要求 12所述的装置，其特征在于，所述第二计算模块，用于： level(b)=yfa_Cl(i, b)*level(i, b)

14、根据权利要求 10所述的装置，其特征在于，所述第二加权处理单元，包括：

15、根据权利要求 14所述的装置，其特征在于，所述第三计算模块，用于：

L

fac₂ (i,b) = sum(i) / Vsum(j)

16、根据权利要求 15所述的装置，其特征在于，所述第四计算模块，用于： fac₂(i,b) = |level(i,b)| /V |level(j,b)|

17、根据权利要求 16所述的装置，其特征在于，所述第四计算模块，用于： fac₂(i,b)=

根据

计算所述第

18、根据权利要求 14-17 中任一项所述的装置，其特征在于，所述第五计算模块，用于：

level(b)=yfac₂(i, b) *level(i, b)

根据 w 计算所述任一帧中所述第 b个子带的 ICLD加权值，其中，所述 l_evd(b)表示所述任一帧中第 b个子带的 ICLD加权值，所述 f_a (i,b:为所述第 i 个子帧中所述第 b 个子带的第二加权因子，所述 level(j b表示第 i个子帧的第 b个子带的 ICLD。