WO2023097686A1

WO2023097686A1 - 一种立体声音频信号处理方法及设备/存储介质/装置

Info

Publication number: WO2023097686A1
Application number: PCT/CN2021/135514
Authority: WO
Inventors: 高硕�
Original assignee: 北京小米移动软件有限公司
Priority date: 2021-12-03
Filing date: 2021-12-03
Publication date: 2023-06-08
Also published as: CN114365509B; EP4443911A1; WO2023097686A9; CN114365509A

Abstract

本公开提出一种立体声音频信号处理方法及设备/存储介质/装置，属于通信技术领域。该方法包括：确定所述立体声音频信号当前帧的初始第一阈值Thresh0 1和初始第二阈值Thresh0 2，其中Thresh0 1∈(-1，0)，Thresh0 2∈(0，1)；确定偏移值Delta；基于所述立体声音频信号前一帧的去相关处理方式、所述偏移值Delta、所述当前帧的初始第一阈值Thresh0 1、所述当前帧的初始第二阈值Thresh0 2，确定所述立体声音频信号当前帧对应的第一阈值Thresh1和第二阈值Thresh2；基于所述当前帧对应的第一阈值Thresh1和第二阈值Thresh2对所述当前帧进行去相关处理。本公开的方法可以提高编码压缩率。

Description

一种立体声音频信号处理方法及设备/存储介质/装置

技术领域

本公开涉及通信技术领域，尤其涉及一种立体声音频信号处理方法及设备/存储介质/装置。

背景技术

由于无损编码可以满足高质量音频回放和无损存储的需求，因此得到广泛应用。通常在对立体声音频信号进行无损编码时，需要先对立体声音频信号进行去相关处理，以提高编码压缩率。

相关技术中，去相关处理的主要方式为：设置阈值，并计算立体声音频信号当前帧左声道信号和右声道信号的相关性系数，基于该相关性系数与阈值的大小关系确定当前帧左声道信号和右声道信号的相关性，并基于所确定出的相关性采取最优的去相关处理方式对当前帧进行去相关处理。

但是，相关技术中，立体声音频信号的每一帧对应的阈值是固定的，无法自适应更新，则会影响不同帧的相关性确定的准确性，进而针对每一帧无法准确选择出最优的去相关处理方式，导致无法提升编码压缩率。

发明内容

本公开提出的一种立体声音频信号处理方法及设备/存储介质/装置，以解决相关技术中的去相关处理方法编码压缩率较低的技术问题。

本公开一方面实施例提出的立体声音频信号处理方法，应用于编码设备，包括：

确定所述立体声音频信号当前帧的初始第一阈值Thresh0 ₁和初始第二阈值Thresh0 ₂，其中Thresh0 ₁∈(-1，0)，Thresh0 ₂∈(0，1)；

确定偏移值Delta；

基于所述立体声音频信号前一帧的去相关处理方式、所述偏移值Delta、所述当前帧的初始第一阈值Thresh0 ₁、所述当前帧的初始第二阈值Thresh0 ₂，确定所述立体声音频信号当前帧对应的第一阈值Thresh1和第二阈值Thresh2；

基于所述当前帧对应的第一阈值Thresh1和第二阈值Thresh2对所述当前帧进行去相关处理。

本公开又一方面实施例提出的立体声音频信号处理装置，包括：

确定模块，用于确定所述立体声音频信号当前帧的初始第一阈值Thresh0 ₁和初始第二阈值Thresh0 ₂，其中Thresh0 ₁∈(-1，0)，Thresh0 ₂∈(0，1)；

确定模块，用于确定偏移值Delta；

确定模块，用于基于所述立体声音频信号前一帧的去相关处理方式、所述偏移值Delta、所述当前帧的初始第一阈值Thresh0 ₁、所述当前帧的初始第二阈值Thresh0 ₂，确定所述立体声音频信号当前帧对应的第一阈值Thresh1和第二阈值Thresh2；

处理模块，用于基于所述当前帧对应的第一阈值Thresh1和第二阈值Thresh2对所述当前帧进行去相关处理。

本公开又一方面实施例提出的一种通信装置，所述装置包括处理器和存储器，所述存储器中存储有计算机程序，所述处理器执行所述存储器中存储的计算机程序，以使所述装置执行如上另一方面实施例提出的方法。

本公开又一方面实施例提出的通信装置，包括：处理器和接口电路；

所述接口电路，用于接收代码指令并传输至所述处理器；

所述处理器，用于运行所述代码指令以执行如另一方面实施例提出的方法。

本公开又一方面实施例提出的计算机可读存储介质，用于存储有指令，当所述指令被执行时，使如另一方面实施例提出的方法被实现。

综上所述，在本公开实施例提供的立体声音频信号处理方法及设备/存储介质/装置之中，会先确定立体声音频信号当前帧的初始第一阈值Thresh0 ₁和初始第二阈值Thresh0 ₂，其中Thresh0 ₁∈(-1，0)，Thresh0 ₂∈(0，1)；之后，会确定偏移值Delta；以及，会基于立体声音频信号前一帧的去相关处理方式、偏移值Delta、当前帧的初始第一阈值Thresh0 ₁、当前帧的初始第二阈值Thresh0 ₂，确定立体声音频信号当前帧对应的第一阈值Thresh1和第二阈值Thresh2；以便后续可以基于当前帧对应的第一阈值Thresh1和第二阈值Thresh2对当前帧进行去相关处理。由此可知，本公开实施例中，会基于前一帧的去相关处理方式来对当前帧对应的第一阈值Thresh1和第二阈值Thresh2进行实时自适应更新，从而可以确保每一帧的相关性确定的准确性，进而可以基于每一帧的相关性准确选择出最优的去相关处理方式，提升了编码压缩率。

附图说明

本公开上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1a为本公开实施例所提供的一种立体声音频信号处理方法的流程示意图；

图1b为本公开实施例所提供的一种基于去相关处理后的信号得到编码码流的流程框图；

图2为本公开实施例所提供的一种立体声音频信号处理方法的流程示意图；

图3为本公开实施例所提供的一种立体声音频信号处理方法的流程示意图；

图4为本公开实施例所提供的一种立体声音频信号处理方法的流程示意图；

图5为本公开实施例所提供的一种立体声音频信号处理方法的流程示意图；

图6为本公开实施例所提供的一种立体声音频信号处理方法的流程示意图；

图7为本公开实施例所提供的一种立体声音频信号处理方法的流程示意图；

图8为本公开实施例所提供的一种立体声音频信号处理装置的结构示意图；

图9是本公开一个实施例所提供的一种用户设备的框图；

图10为本公开一个实施例所提供的一种网络侧设备的框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开实施例相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开实施例的一些方面相一致的装置和方法的例子。

在本公开实施例使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本公开实施例。在本公开实施例和所附权利要求书中所使用的单数形式的“一种”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本公开实施例可能采用术语第一、第二、第三等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本公开实施例范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。取决于语境，如在此所使用的词语“如果”及“若”可以被解释成为“在……时”或“当……时”或“响应于确定”。

下面参考附图对本公开实施例所提供的立体声音频信号处理方法、装置、编码设备、解码设备及存储介质进行详细描述。

图1a为本公开实施例所提供的一种立体声音频信号处理方法的流程示意图，该方法由编码设备执行，如图1a所示，该立体声音频信号处理方法可以包括以下步骤：

步骤101、确定立体声音频信号当前帧的初始第一阈值Thresh0 ₁和初始第二阈值Thresh0 ₂。

在本公开的一个实施例之中，该当前帧可以为立体声音频信号中除第一帧之外的任一帧。

以及，在本公开的一个实施例之中，上述初始第一阈值Thresh0 ₁和初始第二阈值Thresh0 ₂可以是预先设定的，其中，初始第一阈值Thresh0 ₁∈(-1，0)，初始第二阈值Thresh0 ₂∈(0，1)。

进一步地，在本公开的一个实施例之中，该初始第一阈值Thresh0 ₁的绝对值和初始第二阈值Thresh0 ₂的绝对值可以相同。在本公开的另一个实施例之中，该初始第一阈值Thresh0 ₁的绝对值和初始第二阈值Thresh0 ₂的绝对值可以不同。示例的，在本公开的一个实施例之中，初始第一阈值Thresh0 ₁的绝对值和初始第二阈值Thresh0 ₂的绝对值可以均为0.47，即：初始第一阈值Thresh0 ₁＝-0.47、初始第二阈值Thresh0 ₂＝0.47。可以理解的是，上述数值可以应用到本公开任意的实施例中，并且该数值仅仅作为示例示出，本公开对此不作限定。

此外，需要说明的是，在本公开的一个实施例之中，立体声音频信号的每一帧对应的初始第一阈值Thresh0 ₁是相同的，立体声音频信号的每一帧对应的初始第二阈值Thresh0 ₂是相同的。

步骤102、确定偏移值Delta。

其中，在本公开的一个实施例之中，所确定出的偏移值Delta具体作用为：利用该偏移值Delta对当前帧的初始第一阈值Thresh0 ₁和初始第二阈值Thresh0 ₂进行更新以得到当前帧对应的第一阈值Thresh1和第二阈值Thresh2。由此，在本公开的一个实施例之中，该偏移值Delta可以包括有偏移值Delta1和偏移值Delta2，其中，该偏移值Delta1可以用于对当前帧的初始第一阈值Thresh0 ₁进行更新，该偏移值Delta2可以用于对当前帧的初始第二阈值Thresh0 ₂进行更新。

以及，在本公开的一个实施例之中，确定偏移值Delta1的方法可以包括：使得Delta1∈(0，|Thresh0 ₁|)，确定偏移值Delta2的方法可以包括：使得Delta2∈(0，|Thresh0 ₂|)。并且，在本公开的一个实施例之中，偏移值Delta1与偏移值Delta2可以相同。在本公开的另一个实施例之中，偏移值Delta1与偏移值Delta2可以不同。示例的，在本公开的一个实施例中，偏移值Delta1和Delta2可以为0.05。可以理解的是，上述数值可以应用到本公开任意的实施例中，并且该数值仅仅作为示例示出，本公开对此不作限定。

步骤103、基于立体声音频信号前一帧的去相关处理方式、偏移值Delta、当前帧的初始第一阈值Thresh0 ₁、当前帧的初始第二阈值Thresh0 ₂，确定立体声音频信号当前帧对应的第一阈值Thresh1和第二阈值Thresh2。

其中，在本公开的一个实施例之中，前一帧的去处理方式不同时，确定立体声音频信号当前帧对应的第一阈值Thresh1和第二阈值Thresh2的方式也会有所不同。关于该部分的详细介绍具体会在后续实施例描述。

以及，在本公开的一个实施例之中，上述的前一帧的去相关处理方式可以基于前一帧对应的标志位来确定，其中，每一帧的标志位用于指示每一帧的去相关处理方式。示例的，在本公开的一个实施例之中，响应于前一帧的标志位置0，则确定前一帧的去相关处理方式为：第一去相关处理方式；响应于前一帧的标志位置1，则确定前一帧的去相关处理方式为：第二去相关处理方式；响应于前一帧的标志位置2，则确定前一帧的去相关处理方式为：未进行去相关处理。其中，关于第一去相关处理方式、第二去相关处理方式、未进行去相关处理的详细介绍会在后续实施例进行描述。

步骤104、基于当前帧对应的第一阈值Thresh1和第二阈值Thresh2对当前帧进行去相关处理。

在本公开的一个实施例之中，该当前帧对应的第一阈值Thresh1具体可以用于确定当前帧为偏反相信号或不相关信号，该第二阈值Thresh2具体可以用于确定当前帧为偏正相信号或不相关信号。

以及，在本公开的一个实施例之中，基于当前帧对应的第一阈值Thresh1和第二阈值Thresh2对当前帧进行去相关处理的方法可以包括：

步骤1、基于当前帧对应的第一阈值Thresh1和第二阈值Thresh2确定当前帧的相关性，其中，该相关性包括偏反相信号、偏正相信号以及不相关信号。

具体的，在本公开的一个实施例之中，响应于当前帧左声道信号和右声道信号的互相关系数小于当前帧对应的第一阈值Thresh1，确定当前帧为偏反相信号，响应于当前帧左声道信号和右声道信号的互相关系数大于当前帧对应的第二阈值Thresh2，确定当前帧为偏正相信号，响应于当前帧左声道信号和右声道信号的互相关系数大于等于当前帧对应的第一阈值Thresh1且小于等于当前帧对应的第二阈值Thresh2，确定当前帧为不相关信号。

步骤2、基于当前帧的相关性选择最优的去相关处理方式对当前帧进行去相关处理以得到去相关处理后的信号。

进一步地，在本公开的一个实施例之中，对当前帧进行去相关处理得到去相关处理后的信号后，可以基于去相关处理后的信号得到编码码流。其中，在本公开的一个实施例之中，图1b为本公开实施例所提供的一种基于去相关处理后的信号得到编码码流的流程框图，如图1b所示，基于去相关处理后的信号得到编码码流的方法可以为：

对去相关处理后的信号采用整型提升小波分解进行分带得到各子带信号，对去相关处理后的信号进行LPC(Linear Prediction Coefficient，线性预测系数)参数计算和量化以得到量化LPC参数，再利用线性预测器基于量化LPC参数对各子带信号进行预测，生成预测残差信号，利用预处理器对预测残差信号进行归一化处理，产生归一化输出信号、LSB(Least Significant Bit，最低有效位)信号以及信号符号位。利用熵编码器对各子带信号对应的归一化输出信号进行熵编码，生成编码位流，再对编码位流、LSB信号、信号符号位，量化LPC参数以及小波边信息进行码流复用得到编码码流。

综上所述，在本公开实施例提供的立体声音频信号处理方法之中，会先确定立体声音频信号当前帧的初始第一阈值Thresh0 ₁和初始第二阈值Thresh0 ₂，其中Thresh0 ₁∈(-1，0)，Thresh0 ₂∈(0，1)；之后，会确定偏移值Delta；以及，会基于立体声音频信号前一帧的去相关处理方式、偏移值Delta、当前帧的初始第一阈值Thresh0 ₁、当前帧的初始第二阈值Thresh0 ₂，确定立体声音频信号当前帧对应的第一阈值Thresh1和第二阈值Thresh2；以便后续可以基于当前帧对应的第一阈值Thresh1和第二阈值Thresh2对当前帧进行去相关处理。由此可知，本公开实施例中，会基于前一帧的去相关处理方式来对当前帧对应的第一阈值Thresh1和第二阈值Thresh2进行实时自适应更新，从而可以确保每一帧的相关性确定的准确性，进而可以基于每一帧的相关性准确选择出最优的去相关处理方式，提升了编码压缩率。

图2为本公开实施例所提供的一种立体声音频信号处理方法的流程示意图，该方法由编码设备执行，如图2所示，该立体声音频信号处理方法可以包括以下步骤：

步骤201、确定立体声音频信号当前帧的初始第一阈值Thresh0 ₁和初始第二阈值Thresh0 ₂。

步骤202、确定偏移值Delta。

其中，关于步骤201-202的相关介绍可以参考上述实施例描述，本公开实施例在此不做赘述。

步骤203、响应于立体声音频信号前一帧的去相关处理方式为：采用第一去相关处理方式进行去相关处理，基于公式一确定当前帧对应的第一阈值Thresh1和第二阈值Thresh2。

在本公开的一个实施例之中，公式一为：

Thresh1和Thresh2分别为当前帧的第一阈值、第二阈值，Thresh0 ₁和Thresh0 ₂分别为当前帧的第一初始阈值、当前帧的第二初始阈值，Delta为偏移值，且Delta∈(0，|Thresh0 ₁|)(也即是，本实施例中偏移值具体为上述实施例中的用于对当前帧的初始第一阈值Thresh0 ₁进行更新的偏移值Delta1)。

以下，对采用上述公式一确定当前帧对应的第一阈值Thresh1和第二阈值Thresh2的原理进行详细解释：

其中，在本公开的一个实施例之中，该第一去相关处理方式具体可以是用于对偏反相信号进行去相关处理的方式。以及，在本公开的一个实施例之中，确定是否利用第一去相关处理方式对前一帧进行去相关处理的流程主要为：先判断前一帧是否为偏反相信号，当前一帧为偏反相信号时，则利用第一去相关处理方式对前一帧进行去相关处理，否则，不利用第一去相关处理方式对前一帧进行去相关处理。

进一步地，在本公开的一个实施例之中，上述判断前一帧是否为偏反相信号的流程主要为：先计算前一帧左声道信号和右声道信号的第一互相关系数，第一互相关系数小于前一帧对应的第一阈值Thresh2 ₁时，则判断该前一帧为偏反相信号，需要对信号进行第一去相关处理。

但是，需要说明的是，在本公开的一个实施例之中，仅基于前一帧对应的第一阈值Thresh2 ₁判断前一帧是否为偏反相信号进而判断是否需要进行第一去相关处理时，可能会由于前一帧对应的第一阈值Thresh2 ₁的设置不准而出现“判断不准确”的现象，使得经过第一去相关处理后的信号的相关性反而比第一去相关处理前的信号的相关性更强，导致信号没有达到去相关的目的。因此，在确定出第一互相关系数小于前一帧对应的第一阈值Thresh2 ₁的基础上，还需要进一步判断第一互相关系数是否小于第二互相关系数，其中，该第二互相关系数为采用第一去相关处理方式对前一帧信号进行第一去相关处理获得的去相关处理后的信号的互相关系数。

以及，在本公开的一个实施例之中，第一互相关系数小于第二互相关系数时，说明“基于前一帧对应的第一阈值Thresh2 ₁判断前一帧为是否要进行第一去相关处理的判断结果是准确的”，换言之，说明前一帧对应的第一阈值Thresh2 ₁设置准确，基于该第一阈值Thresh2 ₁识别出的偏反相信号经过第一去相关处理后能够达到去相关的目的，但是该第一阈值Thresh2 ₁有可能仍然没有达到是否需要进行去相关处理的阈值临界点，也就是说，该第一阈值Thresh2 ₁仍然存在增大的空间，使得增大后的阈值识别出的偏反相信号经过第一去相关处理后，第一互相关系数仍然小于第二互相关系数，也即去相关处理仍然能达到目的。

在此基础上，还需要说明的是，在本公开的一个实施例之中，若前一帧的去相关处理方式为：采用第一去相关处理方式进行去相关处理，说明前一帧为偏反相信号，并且前一帧的第一阈值Thresh2 ₁仍然存在增大的空间，并且由于该前一帧对应的第一阈值Thresh2 ₁是基于初始第一阈值Thresh0 ₁确定的，则可以得出，该初始第一阈值Thresh0 ₁也存在增大的空间。此时当前帧可以基于偏移值Delta对该初始第一阈值Thresh0 ₁进行更新得到当前帧对应的第一阈值Thresh1，即：使得Thresh1＝Thresh0 ₁+Delta，通过第一阈值Thresh1对当前帧信号进行去相关处理，使得去相关处理结果更优。

进一步地，在本公开的一个实施例之中，前一帧的去相关处理方式为：采用第一去相关处理方式进行去相关处理时，说明该前一帧为偏反相信号。基于此，由于前一帧对应的第二阈值Thresh2 ₂并非用于判定前一帧是否为偏反相信号的，而是用于判断前一帧是否为不相关信号或偏正相信号的，因此，无需对初始第二阈值Thresh0 ₂进行更新，直接将初始第二阈值Thresh0 ₂确定为当前帧对应的第二阈值Thresh2即可，即：使得Thresh2＝Thresh0 ₂。

此外，需要说明的是，上述的第一去相关处理方式可以包括第一和差下混处理。

具体的，在本公开的一个实施例之中，该第一和差下混处理可以包括：

基于公式六对前一帧左声道信号和右声道信号进行处理以得到主声道信号和次声道信号；公式六为：

其中，Mid(n)为前一帧主声道信号，Sid(n)为前一帧次声道信号，L(n)为前一帧左声道信号，R(n)为前一帧右声道信号。

以及，在本公开的一个实施例之中，上述的第一互相关系数的确定方法可以包括：

基于公式八确定前一帧左声道信号和右声道信号的第一互相关系数；公式八为：

η _(LR)为前一帧左声道信号和右声道信号的互相关系数，L(n)为前一帧左声道信号第n个样点，

为前一帧左声道信号所有样点的平均值，R(n)为前一帧右声道信号第n个样点，

为前一帧右声道信号所有样点的平均值，N为前一帧左声道信号或者右声道信号样点总数，即为前一帧帧长。

以及，在本公开的一个实施例之中，上述的第二互相关系数的确定方法可以包括：

基于公式九确定第二互相关系数；公式九为：

η _(MS)为第二互相关系数或第三互相关系数，Mid(n)为去相关处理后的信号中主声道信号第n个样点，

为去相关处理后的信号中主声道信号所有样点的平均值，Sid(n)为去相关处理后的信号中次声道信号第n个样点，

为去相关处理后的信号中次声道信号所有样点的平均值，N为前一帧左声道信号或者右声道信号样点总数，即为前一帧帧长。

步骤204、基于当前帧对应的第一阈值Thresh1和第二阈值Thresh2对当前帧进行去相关处理。

其中，关于步骤204的相关介绍可以参考上述实施例描述，本公开实施例在此不做赘述。

图3为本公开实施例所提供的一种立体声音频信号处理方法的流程示意图，该方法由编码设备执行，如图3所示，该立体声音频信号处理方法可以包括以下步骤：

步骤301、确定立体声音频信号当前帧的初始第一阈值Thresh0 ₁和初始第二阈值Thresh0 ₂。

步骤302、确定偏移值Delta。

其中，关于步骤301-302的相关介绍可以参考上述实施例描述，本公开实施例在此不做赘述。

步骤303、响应于立体声音频信号前一帧的去相关处理方式为：采用第二去相关处理方式进行去相关处理，基于公式二确定当前帧对应的第一阈值Thresh1和第二阈值Thresh2。

在本公开的一个实施例之中，公式二为：

Thresh1和Thresh2分别为当前帧的第一阈值、第二阈值，Thresh0 ₁和Thresh0 ₂分别为当前帧的第一初始阈值、当前帧的第二初始阈值，Delta为偏移值，且Delta∈(0，|Thresh0 ₂|)(也即是，本实施例中偏移值具体为上述实施例中的用于对当前帧的初始第二阈值Thresh0 ₂进行更新的偏移值Delta2)。

以下，对采用上述公式二确定当前帧对应的第一阈值Thresh1和第二阈值Thresh2的原理进行详细解释：

其中，在本公开的一个实施例之中，该第二去相关处理方式具体可以是用于对偏正相信号进行去相关处理的方式。以及，在本公开的一个实施例之中，确定是否利用第二去相关处理方式对前一帧进行去相关处理的流程主要为：先判断前一帧是否为偏正相信号，当前一帧为偏正相信号时，则利用第二去相关处理方式对前一帧进行去相关处理，否则，不利用第二去相关处理方式对前一帧进行去相关处理。

进一步地，在本公开的一个实施例之中，上述判断前一帧是否为偏正相信号的流程主要为：先计算前一帧左声道信号和右声道信号的第一互相关系数，第一互相关系数大于前一帧对应的第二阈值Thresh2 ₂时，则判断该前一帧为偏正相信号，需要对信号进行第二去相关处理。

但是，需要说明的是，在本公开的一个实施例之中，仅基于前一帧对应的第二阈值Thresh2 ₂判断前一帧是否为偏正相信号进而判断是否需要进行第二去相关处理时，会由于前一帧对应的第二阈值Thresh2 ₂的设置不准而出现“判断不准确”的现象，使得经过第二去相关处理后的信号的相关性反而比第二去相关处理前的信号的相关性更强，导致信号没有达到去相关的目的。因此，在确定出第一互相关系数大于前一帧对应的第二阈值Thresh2 ₂的基础上，还需要进一步判断第一互相关系数是否大于第三互相关系数，其中，该第三互相关系数为采用第二去相关处理方式对前一帧信号进行第二去相关处理获得的去相关处理后的信号的互相关系数。

以及，在本公开的一个实施例之中，第一互相关系数大于第三互相关系数时，说明“基于前一帧对应的第二阈值Thresh2 ₂判断前一帧是否要进行第二去相关处理的判断结果是准确的”，换言之，说明前一帧对应的第二阈值Thresh2 ₂设置准确，基于该第二阈值Thresh2 ₂识别出的偏正相信号经过第二去相关处理后能够达到去相关的目的，但是该第二阈值Thresh2 ₂有可能仍然没有达到是否需要进行去相关处理的阈值临界点，也就是说，该第二阈值Thresh2 ₂仍然存在减小的空间，使得减小后的阈值识别出的偏正相信号经过第二去相关处理后，第一互相关系数仍然大于第三互相关系数，也即去相关处理仍然能达到目的。

在此基础上，还需要说明的是，在本公开的一个实施例之中，若前一帧的去相关处理方式为：采用第二去相关处理方式进行去相关处理，说明前一帧为偏正相信号，并且前一帧的第二阈值Thresh2 ₂仍然存在减小的空间，并且由于该前一帧对应的第二阈值Thresh2 ₂是基于初始第二阈值Thresh0 ₂确定的，则可以得出，该初始第二阈值Thresh0 ₂也存在减小的空间。此时当前帧可以基于偏移值Delta对该初始第二阈值Thresh0 ₂进行更新得到当前帧对应的第二阈值Thresh2，即：使得Thresh2＝Thresh0 ₂-Delta，通过第二阈值Thresh2对当前帧信号进行去相关处理，使得去相关处理结果更优。

进一步地，在本公开的一个实施例之中，前一帧的去相关处理方式为：采用第二去相关处理方式进行去相关处理时，说明该前一帧为偏正相信号。基于此，由于前一帧对应的第一阈值Thresh2 ₁并非用于判定前一帧是否为偏正相信号的，而是用于判断前一帧是否为不相关信号或偏反相信号的，因此，无需对初始第一阈值Thresh0 ₁进行更新，直接将初始第一阈值Thresh0 ₁确定为当前帧对应的第一阈值Thresh1即可，即：使得Thresh1＝Thresh0 ₁。

此外，需要说明的是，上述的第二去相关处理方式可以包括第二和差下混处理。

具体的，在本公开的一个实施例之中，该第二和差下混处理可以包括：

基于公式七对前一帧左声道信号和右声道信号进行处理以得到主声道信号和次声道信号；公式七为：

以及，关于上述的第一互相关系数的确定方法可以参考上述实施例描述，本公开实施例在此不做赘述。

基于公式九确定第三互相关系数；公式九为：

步骤304、基于当前帧对应的第一阈值Thresh1和第二阈值Thresh2对当前帧进行去相关处理。

其中，关于步骤304的相关介绍可以参考上述实施例描述，本公开实施例在此不做赘述。

图4为本公开实施例所提供的一种立体声音频信号处理方法的流程示意图，该方法由编码设备执行，如图4所示，该立体声音频信号处理方法可以包括以下步骤：

步骤401、确定立体声音频信号当前帧的初始第一阈值Thresh0 ₁和初始第二阈值Thresh0 ₂。

步骤402、确定偏移值Delta。

其中，关于步骤401-402的相关介绍可以参考上述实施例描述，本公开实施例在此不做赘述。

步骤403、响应于立体声音频信号前一帧的去相关处理方式为：未进行去相关处理，同时未进行去相关处理的缘由为：前一帧左声道信号和右声道信号的第一互相关系数大于等于前一帧对应的第一阈值Thresh2 ₁且小于等于前一帧对应的第二阈值Thresh2 ₂，基于公式三确定当前帧对应的第一阈值Thresh1和第二阈值Thresh2。

在本公开的一个实施例之中，公式三为：

Thresh1和Thresh2分别为当前帧的第一阈值、第二阈值，Thresh0 ₁和Thresh0 ₂分别为所述当前帧的第一初始阈值、所述当前帧的第二初始阈值。

其中，在本公开的一个实施例之中，响应于前一帧左声道信号和右声道信号的第一互相关系数大于等于前一帧对应的第一阈值Thresh2 ₁且小于等于前一帧对应的第二阈值Thresh2 ₂，则说明前一帧为不相关信号，此时可以无需对当前帧的第一初始阈值Thresh0 ₁和当前帧的第二初始阈值Thresh0 ₂进行更新。

步骤404、基于当前帧对应的第一阈值Thresh1和第二阈值Thresh2对当前帧进行去相关处理。

其中，关于步骤404的相关介绍可以参考上述实施例描述，本公开实施例在此不做赘述。

图5为本公开实施例所提供的一种立体声音频信号处理方法的流程示意图，该方法由编码设备执行，如图5所示，该立体声音频信号处理方法可以包括以下步骤：

步骤501、确定立体声音频信号当前帧的初始第一阈值Thresh0 ₁和初始第二阈值Thresh0 ₂。

步骤502、确定偏移值Delta。

其中，关于步骤501-502的相关介绍可以参考上述实施例描述，本公开实施例在此不做赘述。

步骤503、响应于立体声音频信号前一帧的去相关处理方式为：未进行去相关处理，同时未进行去相关处理的缘由为：前一帧左声道信号和右声道信号的第一互相关系数小于前一帧对应的第一阈值Thresh2 ₁，且第一互相关系数大于等于第二互相关系数，基于公式四确定当前帧对应的第一阈值Thresh1和第二阈值Thresh2。

其中，在本公开的一个实施例之中，公式四为：

以及，在本公开的一个实施例之中，第二互相关系数为采用第一去相关处理方式对前一帧信号进行第一去相关处理获得的去相关处理后的信号的互相关系数。

以下，对采用上述公式四确定当前帧对应的第一阈值Thresh1和第二阈值Thresh2的原理进行详细解释：第一互相关系数大于等于第二互相关系数时，则说明该前一帧没有进行去相关处理，也即是，说明“基于前一帧对应的第一阈值Thresh2 ₁判断前一帧是偏反相信号从而进行第一去相关处理的判断结果是不准确的”，换言之，说明前一帧对应的第一阈值Thresh2 ₁取值不准确，基于该第一阈值Thresh2 ₁识别出的信号经过第一去相关处理后不能达到去相关的目的，认为该第一阈值Thresh2 ₁大于是否需要进行去相关处理的阈值临界点，也就是说，该第一阈值Thresh2 ₁需要减小，使得减小后的阈值识别出的偏反相信号经过第一去相关处理后，第一互相关系数小于第二互相关系数，也即使得去相关处理能达到目的。

其中，在本公开的一个实施例之中，基于前述描述可知，若前一帧左声道信号和右声道信号的第一互相关系数小于前一帧对应的第一阈值Thresh2 ₁，且第一互相关系数大于等于第二互相关系数，则说明认为该第一阈值Thresh2 ₁大于是否需要进行去相关处理的阈值临界点，并且由于该前一帧对应的第一阈值Thresh2 ₁是基于初始第一阈值Thresh0 ₁确定的，则可以得出，该初始第一阈值Thresh0 ₁可能也大于是否需要进行去相关处理的阈值临界点。此时可以基于偏移值Delta对该初始第一阈值Thresh0 ₁进行更新得到当前帧对应的第一阈值Thresh1，即：使得Thresh1＝Thresh0 ₁-Delta，通过第一阈值Thresh1对当前帧信号进行去相关处理，使得去相关处理结果更优。

进一步地，在本公开的一个实施例之中，由于“前一帧左声道信号和右声道信号的第一互相关系数小于前一帧对应的第一阈值Thresh2 ₁，且第一互相关系数大于等于第二互相关系数”说明的是“基于前一帧对应的第一阈值Thresh2 ₁判断前一帧为偏反相信号的判断结果是不准确的”。基于此，由于前一帧对应的第二阈值Thresh2 ₂并非用于判定前一帧是否为偏反相信号的，而是用于判断前一帧是否为不相关信号或偏正相信号的，因此，无需对初始第二阈值Thresh0 ₂进行更新，直接将初始第二阈值Thresh0 ₂确定为当前帧对应的第二阈值Thresh2即可，即：使得Thresh2＝Thresh0 ₂。

此外，关于上述的第一去相关处理方式、第一互相关系数、第二互相关系数的相关介绍可以参考上述实施例描述，本公开实施例在此不做赘述

步骤504、基于当前帧对应的第一阈值Thresh1和第二阈值Thresh2对当前帧进行去相关处理。

其中，关于步骤504的相关介绍可以参考上述实施例描述，本公开实施例在此不做赘述。

图6为本公开实施例所提供的一种立体声音频信号处理方法的流程示意图，该方法由编码设备执行，如图6所示，该立体声音频信号处理方法可以包括以下步骤：

步骤601、确定立体声音频信号当前帧的初始第一阈值Thresh0 ₁和初始第二阈值Thresh0 ₂。

步骤602、确定偏移值Delta。

其中，关于步骤601-602的相关介绍可以参考上述实施例描述，本公开实施例在此不做赘述。

步骤603、响应于立体声音频信号前一帧的去相关处理方式为：未进行去相关处理，同时未进行去相关处理的缘由为：前一帧左声道信号和右声道信号的第一互相关系数大于前一帧对应的第二阈值Thresh2 ₂，且第一互相关系数小于等于第三互相关系数，基于公式五确定当前帧对应的第一阈值Thresh1和第二阈值Thresh2。

其中，在本公开的一个实施例之中，公式五为：

以及，在本公开的一个实施例之中，第三互相关系数为采用第二去相关处理方式对前一帧信号进行第二去相关处理获得的去相关处理后的信号的互相关系数。

以下，对采用上述公式五确定当前帧对应的第一阈值Thresh1和第二阈值Thresh2的原理进行详细解释：若第一互相关系数小于等于第三互相关系数时，则说明该前一帧没有进行去相关处理，也即是，说明“基于前一帧对应的第二阈值Thresh2 ₂判断前一帧是偏正相信号从而进行第二去相关处理的判断结果是不准确的”，换言之，说明前一帧对应的第二阈值Thresh2 ₂取值不准确，基于该第二阈值Thresh2 ₂识别出的信号经过第二去相关处理后不能达到去相关的目的，认为该第二阈值Thresh2 ₁小于是否需要进行去相关处理的阈值临界点，也就是说，该第二阈值Thresh2 ₂需要增大，使得增大后的阈值识别出的偏正相信号经过第二去相关处理后，第一互相关系数大于第三互相关系数，也即使得去相关处理能达到目的。

其中，在本公开的一个实施例之中，基于前述描述可知，若前一帧左声道信号和右声道信号的第一互相关系数大于前一帧对应的第二阈值Thresh2 ₂，且第一互相关系数小于等于第三互相关系数，则说明认为该第二阈值Thresh2 ₂小于是否需要进行去相关处理的阈值临界点，并且由于该前一帧对应的第二阈值Thresh2 ₂是基于初始第二阈值Thresh0 ₂确定的，则可以得出，该初始第二阈值Thresh0 ₂可能也小于是否需要进行去相关处理的阈值临界点。此时可以基于偏移值Delta对该初始第二阈值Thresh0 ₂进行更新得到当前帧对应的第二阈值Thresh2，即：使得Thresh2＝Thresh0 ₂+Delta，通过第二阈值Thresh2对当前帧信号进行去相关处理，使得去相关处理结果更优。

进一步地，在本公开的一个实施例之中，由于“前一帧左声道信号和右声道信号的第一互相关系数大于前一帧对应的第二阈值Thresh2 ₂，且第一互相关系数小于等于第三互相关系数”说明的是“基于前一帧对应的第二阈值Thresh2 ₂判断前一帧为偏正相信号的判断结果是不准确的”。基于此，由于前一帧对应的第一阈值Thresh2 ₁并非用于判定前一帧是否为偏正相信号的，而是用于判断前一帧是否为不相关信号或偏反相信号的，因此，无需对初始第一阈值Thresh2 ₁进行更新，直接将初始第一阈值Thresh2 ₁确定为当前帧对应的第一阈值Thresh1即可，即：使得Thresh1＝Thresh0 ₁。

此外，关于上述的第二去相关处理方式、第一互相关系数、第三互相关系数的相关介绍可以参考上述实施例描述，本公开实施例在此不做赘述

步骤604、基于当前帧对应的第一阈值Thresh1和第二阈值Thresh2对当前帧进行去相关处理。

其中，关于步骤604的相关介绍可以参考上述实施例描述，本公开实施例在此不做赘述。

图7为本公开实施例所提供的一种立体声音频信号处理方法的流程示意图，该方法由编码设备执行，如图7所示，该立体声音频信号处理方法可以包括以下步骤：

步骤701、确定立体声音频信号第一帧的初始第一阈值Thresh0 ₁和初始第二阈值Thresh0 ₂。

步骤702、基于公式十确定第一帧对应的第一阈值Thresh3 ₁和第二阈值Thresh3 ₂。

其中，在本公开的一个实施例之中，公式十为：

Thresh3 ₁和Thresh3 ₂分别为所述第一帧的第一阈值、所述第一帧的第二阈值，Thresh0 ₁和Thresh0 ₂分别为所述第一帧的第一初始阈值、所述第一帧的第二初始阈值。

步骤703、确定立体声音频信号当前帧的初始第一阈值Thresh0 ₁和初始第二阈值Thresh0 ₂，其中 Thresh0 ₁∈(-1，0)，Thresh0 ₂∈(0，1)。

步骤704、确定偏移值Delta。

步骤705、基于立体声音频信号前一帧的去相关处理方式、偏移值Delta、当前帧的初始第一阈值Thresh0 ₁、当前帧的初始第二阈值Thresh0 ₂，确定立体声音频信号当前帧对应的第一阈值Thresh1和第二阈值Thresh2。

步骤706、基于当前帧对应的第一阈值Thresh1和第二阈值Thresh2对当前帧进行去相关处理。

图8为本公开实施例所提供的一种立体声音频信号处理装置的结构示意图，如图8所示，装置800可以包括：

确定模块801，用于确定所述立体声音频信号当前帧的初始第一阈值Thresh0 ₁和初始第二阈值Thresh0 ₂，其中Thresh0 ₁∈(-1，0)，Thresh0 ₂∈(0，1)；

确定模块802，用于确定偏移值Delta；

确定模块803，用于基于所述立体声音频信号前一帧的去相关处理方式、所述偏移值Delta、所述当前帧的初始第一阈值Thresh0 ₁、所述当前帧的初始第二阈值Thresh0 ₂，确定所述立体声音频信号当前帧对应的第一阈值Thresh1和第二阈值Thresh2；

处理模块804，用于基于所述当前帧对应的第一阈值Thresh1和第二阈值Thresh2对所述当前帧进行去相关处理。

综上所述，在本公开实施例提供的立体声音频信号处理装置之中，会先确定立体声音频信号当前帧的初始第一阈值Thresh0 ₁和初始第二阈值Thresh0 ₂，其中Thresh0 ₁∈(-1，0)，Thresh0 ₂∈(0，1)；之后，会确定偏移值Delta；以及，会基于立体声音频信号前一帧的去相关处理方式、偏移值Delta、当前帧的初始第一阈值Thresh0 ₁、当前帧的初始第二阈值Thresh0 ₂，确定立体声音频信号当前帧对应的第一阈值Thresh1和第二阈值Thresh2；以便后续可以基于当前帧对应的第一阈值Thresh1和第二阈值Thresh2对当前帧进行去相关处理。由此可知，本公开实施例中，会基于前一帧的去相关处理方式来对当前帧对应的第一阈值Thresh1和第二阈值Thresh2进行实时自适应更新，从而可以确保每一帧的相关性确定的准确性，进而可以基于每一帧的相关性准确选择出最优的去相关处理方式，提升了编码压缩率。

可选的，在本公开的一个实施例之中，基于所述立体声音频信号前一帧的去相关处理方式、所述偏移值Delta、所述当前帧的初始第一阈值Thresh0 ₁、所述当前帧的初始第二阈值Thresh0 ₂，确定所述立体声音频信号当前帧对应的第一阈值Thresh1和第二阈值Thresh2，包括：

响应于所述立体声音频信号前一帧的去相关处理方式为：采用第一去相关处理方式进行去相关处理，基于公式一确定所述当前帧对应的第一阈值Thresh1和第二阈值Thresh2，所述公式一为：

其中，Thresh1和Thresh2分别为所述当前帧的第一阈值、第二阈值，Thresh0 ₁和Thresh0 ₂分别为所述当前帧的第一初始阈值、所述当前帧的第二初始阈值，Delta为所述偏移值，且Delta∈(0，|Thresh0 ₁|)。

可选的，在本公开的一个实施例之中，所述确定模块803，还用于：

响应于所述立体声音频信号前一帧的去相关处理方式为：采用第二去相关处理方式进行去相关处理，基于公式二确定所述当前帧对应的第一阈值Thresh1和第二阈值Thresh2，所述公式二为：

其中，Thresh1和Thresh2分别为所述当前帧的第一阈值、第二阈值，Thresh0 ₁和Thresh0 ₂分别为所述当前帧的第一初始阈值、所述当前帧的第二初始阈值，Delta为所述偏移值，且Delta∈(0，|Thresh0 ₂|)。

响应于所述立体声音频信号前一帧的去相关处理方式为：未进行去相关处理，同时未进行去相关处理的缘由为：所述前一帧左声道信号和右声道信号的第一互相关系数大于等于所述前一帧对应的第一阈值Thresh2 ₁且小于等于所述前一帧对应的第二阈值Thresh2 ₂，基于公式三确定所述当前帧对应的第一阈值Thresh1和第二阈值Thresh2，所述公式三为：

其中，Thresh1和Thresh2分别为所述当前帧的第一阈值、第二阈值，Thresh0 ₁和Thresh0 ₂分别为所述当前帧的第一初始阈值、所述当前帧的第二初始阈值。

响应于所述立体声音频信号前一帧的去相关处理方式为：未进行去相关处理，同时未进行去相关处理的缘由为：所述前一帧左声道信号和右声道信号的第一互相关系数小于所述前一帧对应的第一阈值Thresh2 ₁，且所述第一互相关系数大于等于第二互相关系数，其中，所述第二互相关系数为采用第一去相关处理方式对前一帧信号进行第一去相关处理获得的去相关处理后的信号的互相关系数，基于公式四确定所述当前帧对应的第一阈值Thresh1和第二阈值Thresh2，所述公式四为：

响应于所述立体声音频信号前一帧的去相关处理方式为：未进行去相关处理，同时未进行去相关处理的缘由为：所述前一帧左声道信号和右声道信号的第一互相关系数大于所述前一帧对应的第二阈值Thresh2 ₂，且所述第一互相关系数小于等于第三互相关系数，其中，所述第三互相关系数为采用第二去相关处理方式对前一帧信号进行第二去相关处理获得的去相关处理后的信号的互相关系数，基于公式五确定所述当前帧对应的第一阈值Thresh1和第二阈值Thresh2，所述公式五为：

可选的，在本公开的一个实施例之中，所述第一去相关处理方式包括第一和差下混处理。

可选的，在本公开的一个实施例之中，所述第一和差下混处理包括：

基于公式六对所述前一帧左声道信号和右声道信号进行处理以得到主声道信号和次声道信号；所述公式六为：

可选的，在本公开的一个实施例之中，所述第二去相关处理方式包括第二和差下混处理。

可选的，在本公开的一个实施例之中，所述第二和差下混处理包括：

基于公式七对所述前一帧左声道信号和右声道信号进行处理以得到主声道信号和次声道信号；所述公式七为：

可选的，在本公开的一个实施例之中，所述装置还用于：

基于公式八确定所述前一帧左声道信号和右声道信号的第一互相关系数；所述公式八为：

可选的，在本公开的一个实施例之中，所述去相关处理后的信号包括主声道信号和次声道信号；

所述装置，还用于：

基于公式九确定第二互相关系数和第三互相关系数；所述公式九为：

可选的，在本公开的一个实施例之中，所述装置还用于：

确定所述立体声音频信号第一帧的初始第一阈值Thresh0 ₁和初始第二阈值Thresh0 ₂；

基于公式十确定所述第一帧对应的第一阈值Thresh3 ₁和第二阈值Thresh3 ₂，所述公式十为：

其中，Thresh3 ₁和Thresh3 ₂分别为所述第一帧的第一阈值、所述第一帧的第二阈值，Thresh0 ₁和Thresh0 ₂分别为所述第一帧的第一初始阈值、所述第一帧的第二初始阈值。

图9是本公开一个实施例所提供的一种用户设备UE900的框图。例如，UE900可以是移动电话，计算机，数字广播终端设备，消息收发设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等。

参照图9，UE900可以包括以下至少一个组件：处理组件902，存储器904，电源组件906，多媒体组件908，音频组件910，输入/输出(I/O)的接口912，传感器组件913，以及通信组件916。

处理组件902通常控制UE900的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理组件902可以包括至少一个处理器920来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件902可以包括至少一个模块，便于处理组件902和其他组件之间的交互。例如，处理组件902可以包括多媒体模块，以方便多媒体组件908和处理组件902之间的交互。

存储器904被配置为存储各种类型的数据以支持在UE900的操作。这些数据的示例包括用于在UE900上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器904可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

电源组件906为UE900的各种组件提供电力。电源组件906可以包括电源管理系统，至少一个电源，及其他与为UE900生成、管理和分配电力相关联的组件。

多媒体组件908包括在所述UE900和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括至少一个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的唤醒时间和压力。在一些实施例中，多媒体组件908包括一个前置摄像头和/或后置摄像头。当UE900处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件910被配置为输出和/或输入音频信号。例如，音频组件910包括一个麦克风(MIC)，当UE900处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器904或经由通信组件916发送。在一些实施例中，音频组件910还包括一个扬声器，用于输出音频信号。

I/O接口912为处理组件902和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件913包括至少一个传感器，用于为UE900提供各个方面的状态评估。例如，传感器组件913可以检测到设备900的打开/关闭状态，组件的相对定位，例如所述组件为UE900的显示器和小键盘，传感器组件913还可以检测UE900或UE900一个组件的位置改变，用户与UE900接触的存在或不存在，UE900方位或加速/减速和UE900的温度变化。传感器组件913可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件913还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件913还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件916被配置为便于UE900和其他设备之间有线或无线方式的通信。UE900可以接入基于通信标准的无线网络，如WiFi，2G或3G，或它们的组合。在一个示例性实施例中，通信组件916经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信组件916还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，UE900可以被至少一个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

图10是本公开实施例所提供的一种网络侧设备1000的框图。例如，网络侧设备1000可以被提供为一网络侧设备。参照图10，网络侧设备1000包括处理组件1011，其进一步包括至少一个处理器，以及由存储器1032所代表的存储器资源，用于存储可由处理组件1022的执行的指令，例如应用程序。存储器1032中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外，处理组件1010被配置为执行指令，以执行上述方法前述应用在所述网络侧设备的任意方法，例如，如图1所示方法。

网络侧设备1000还可以包括一个电源组件1026被配置为执行网络侧设备1000的电源管理，一个有线或无线网络接口1050被配置为将网络侧设备1000连接到网络，和一个输入输出(I/O)接口1058。网络侧设备1000可以操作基于存储在存储器1032的操作系统，例如Windows Server TM，Mac OS XTM，Unix TM,Linux TM，Free BSDTM或类似。

上述本公开提供的实施例中，分别从网络侧设备、UE的角度对本公开实施例提供的方法进行了介绍。为了实现上述本公开实施例提供的方法中的各功能，网络侧设备和UE可以包括硬件结构、软件模块，以硬件结构、软件模块、或硬件结构加软件模块的形式来实现上述各功能。上述各功能中的某个功能可以以硬件结构、软件模块、或者硬件结构加软件模块的方式来执行。

本公开实施例提供的一种通信装置。通信装置可包括收发模块和处理模块。收发模块可包括发送模块和/或接收模块，发送模块用于实现发送功能，接收模块用于实现接收功能，收发模块可以实现发送功能和/或接收功能。

通信装置可以是终端设备(如前述方法实施例中的终端设备)，也可以是终端设备中的装置，还可以是能够与终端设备匹配使用的装置。或者，通信装置可以是网络设备，也可以是网络设备中的装置，还可以是能够与网络设备匹配使用的装置。

本公开实施例提供的另一种通信装置。通信装置可以是网络设备，也可以是终端设备(如前述方法实施例中的终端设备)，也可以是支持网络设备实现上述方法的芯片、芯片系统、或处理器等，还可以是支持终端设备实现上述方法的芯片、芯片系统、或处理器等。该装置可用于实现上述方法实施例中描述的方法，具体可以参见上述方法实施例中的说明。

通信装置可以包括一个或多个处理器。处理器可以是通用处理器或者专用处理器等。例如可以是基带处理器或中央处理器。基带处理器可以用于对通信协议以及通信数据进行处理，中央处理器可以用于对通信装置(如，网络侧设备、基带芯片，终端设备、终端设备芯片，DU或CU等)进行控制，执行计算机程序，处理计算机程序的数据。

可选的，通信装置中还可以包括一个或多个存储器，其上可以存有计算机程序，处理器执行所述计算机程序，以使得通信装置执行上述方法实施例中描述的方法。可选的，所述存储器中还可以存储有数据。通信装置和存储器可以单独设置，也可以集成在一起。

可选的，通信装置还可以包括收发器、天线。收发器可以称为收发单元、收发机、或收发电路等，用于实现收发功能。收发器可以包括接收器和发送器，接收器可以称为接收机或接收电路等，用于实现接收功能；发送器可以称为发送机或发送电路等，用于实现发送功能。

可选的，通信装置中还可以包括一个或多个接口电路。接口电路用于接收代码指令并传输至处理器。处理器运行所述代码指令以使通信装置执行上述方法实施例中描述的方法。

通信装置为终端设备(如前述方法实施例中的终端设备)：处理器用于执行图1-图4a任一所示的方法。

通信装置为网络设备：收发器用于执行图5-图7任一所示的方法。

在一种实现方式中，处理器中可以包括用于实现接收和发送功能的收发器。例如该收发器可以是收发电路，或者是接口，或者是接口电路。用于实现接收和发送功能的收发电路、接口或接口电路可以是分开的，也可以集成在一起。上述收发电路、接口或接口电路可以用于代码/数据的读写，或者，上述收发电路、接口或接口电路可以用于信号的传输或传递。

在一种实现方式中，处理器可以存有计算机程序，计算机程序在处理器上运行，可使得通信装置执行上述方法实施例中描述的方法。计算机程序可能固化在处理器中，该种情况下，处理器可能由硬件实现。

在一种实现方式中，通信装置可以包括电路，所述电路可以实现前述方法实施例中发送或接收或者通信的功能。本公开中描述的处理器和收发器可实现在集成电路(integrated circuit，IC)、模拟IC、射频集成电路RFIC、混合信号IC、专用集成电路(application specific integrated circuit，ASIC)、印刷电路板(printed circuit board，PCB)、电子设备等上。该处理器和收发器也可以用各种IC工艺技术来制造，例如互补金属氧化物半导体(complementary metal oxide semiconductor，CMOS)、N型金属氧化物半导体(nMetal-oxide-semiconductor，NMOS)、P型金属氧化物半导体(positive channel metal oxide semiconductor，PMOS)、双极结型晶体管(bipolar junction transistor，BJT)、双极CMOS(BiCMOS)、硅锗(SiGe)、砷化镓(Gas)等。

以上实施例描述中的通信装置可以是网络设备或者终端设备(如前述方法实施例中的终端设备)，但本公开中描述的通信装置的范围并不限于此，而且通信装置的结构可以不受的限制。通信装置可以是独立的设备或者可以是较大设备的一部分。例如所述通信装置可以是：

(1)独立的集成电路IC，或芯片，或，芯片系统或子系统；

(2)具有一个或多个IC的集合，可选的，该IC集合也可以包括用于存储数据，计算机程序的存储部件；

(3)ASIC，例如调制解调器(Modem)；

(4)可嵌入在其他设备内的模块；

(5)接收机、终端设备、智能终端设备、蜂窝电话、无线设备、手持机、移动单元、车载设备、网络设备、云设备、人工智能设备等等；

(6)其他等等。

对于通信装置可以是芯片或芯片系统的情况，芯片包括处理器和接口。其中，处理器的数量可以是一个或多个，接口的数量可以是多个。

可选的，芯片还包括存储器，存储器用于存储必要的计算机程序和数据。

本领域技术人员还可以了解到本公开实施例列出的各种说明性逻辑块(illustrative logical block)和步骤(step)可以通过电子硬件、电脑软件，或两者的结合进行实现。这样的功能是通过硬件还是软件来实现取决于特定的应用和整个系统的设计要求。本领域技术人员可以对于每种特定的应用，可以使用各种方法实现所述的功能，但这种实现不应被理解为超出本公开实施例保护的范围。

本公开实施例还提供一种确定侧链路时长的系统，该系统包括前述实施例中作为终端设备(如前述方法实施例中的第一终端设备)的通信装置和作为网络设备的通信装置，或者，该系统包括前述实施例中作为终端设备(如前述方法实施例中的第一终端设备)的通信装置和作为网络设备的通信装置。

本公开还提供一种可读存储介质，其上存储有指令，该指令被计算机执行时实现上述任一方法实施例的功能。

本公开还提供一种计算机程序产品，该计算机程序产品被计算机执行时实现上述任一方法实施例的功能。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机程序。在计算机上加载和执行所述计算机程序时，全部或部分地产生按照本公开实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机程序可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机程序可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriber line，DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如，软盘、硬盘、磁带)、光介质(例如，高密度数字视频光盘(digital video disc，DVD))、或者半导体介质(例如，固态硬盘(solid state disk，SSD))等。

本领域普通技术人员可以理解：本公开中涉及的第一、第二等各种数字编号仅为描述方便进行的区分，并不用来限制本公开实施例的范围，也表示先后顺序。

本公开中的至少一个还可以描述为一个或多个，多个可以是两个、三个、四个或者更多个，本公开不做限制。在本公开实施例中，对于一种技术特征，通过“第一”、“第二”、“第三”、“A”、“B”、“C”和“D”等区分该种技术特征中的技术特征，该“第一”、“第二”、“第三”、“A”、“B”、“C”和“D”描述的技术特征间无先后顺序或者大小顺序。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本发明的其它实施方案。本公开旨在涵盖本发明的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

一种立体声音频信号处理方法，其特征在于，应用于编码设备，包括：

确定所述立体声音频信号当前帧的初始第一阈值Thresh0 ₁和初始第二阈值Thresh0 ₂，其中Thresh0 ₁∈(-1，0)，Thresh0 ₂∈(0，1)；

确定偏移值Delta；

基于所述立体声音频信号前一帧的去相关处理方式、所述偏移值Delta、所述当前帧的初始第一阈值Thresh0 ₁、所述当前帧的初始第二阈值Thresh0 ₂，确定所述立体声音频信号当前帧对应的第一阈值Thresh1和第二阈值Thresh2；

基于所述当前帧对应的第一阈值Thresh1和第二阈值Thresh2对所述当前帧进行去相关处理。
如权利要求1所述的方法，其特征在于，基于所述立体声音频信号前一帧的去相关处理方式、所述偏移值Delta、所述当前帧的初始第一阈值Thresh0 ₁、所述当前帧的初始第二阈值Thresh0 ₂，确定所述立体声音频信号当前帧对应的第一阈值Thresh1和第二阈值Thresh2，包括：

响应于所述立体声音频信号前一帧的去相关处理方式为：采用第一去相关处理方式进行去相关处理，基于公式一确定所述当前帧对应的第一阈值Thresh1和第二阈值Thresh2，所述公式一为：

其中，Thresh1和Thresh2分别为所述当前帧的第一阈值、第二阈值，Thresh0 ₁和Thresh0 ₂分别为所述当前帧的第一初始阈值、所述当前帧的第二初始阈值，Delta为所述偏移值，且Delta∈(0，|Thresh0 ₁|)。
如权利要求1所述的方法，其特征在于，基于所述立体声音频信号前一帧的去相关处理方式、所述偏移值Delta、所述当前帧的初始第一阈值Thresh0 ₁、所述当前帧的初始第二阈值Thresh0 ₂，确定所述立体声音频信号当前帧对应的第一阈值Thresh1和第二阈值Thresh2，包括：

响应于所述立体声音频信号前一帧的去相关处理方式为：采用第二去相关处理方式进行去相关处理，基于公式二确定所述当前帧对应的第一阈值Thresh1和第二阈值Thresh2，所述公式二为：

其中，Thresh1和Thresh2分别为所述当前帧的第一阈值、第二阈值，Thresh0 ₁和Thresh0 ₂分别为所述当前帧的第一初始阈值、所述当前帧的第二初始阈值，Delta为所述偏移值，且Delta∈(0，|Thresh0 ₂|)。
如权利要求1所述的方法，其特征在于，基于所述立体声音频信号前一帧的去相关处理方式、所述偏移值Delta、所述当前帧的初始第一阈值Thresh0 ₁、所述当前帧的初始第二阈值Thresh0 ₂，确定所述立体声音频信号当前帧对应的第一阈值Thresh1和第二阈值Thresh2，包括：

响应于所述立体声音频信号前一帧的去相关处理方式为：未进行去相关处理，同时未进行去相关处理的缘由为：所述前一帧左声道信号和右声道信号的第一互相关系数大于等于所述前一帧对应的第一阈值Thresh2 ₁且小于等于所述前一帧对应的第二阈值Thresh2 ₂，基于公式三确定所述当前帧对应的第一阈值Thresh1和第二阈值Thresh2，所述公式三为：

其中，Thresh1和Thresh2分别为所述当前帧的第一阈值、第二阈值，Thresh0 ₁和Thresh0 ₂分别为所述当前帧的第一初始阈值、所述当前帧的第二初始阈值。
如权利要求1所述的方法，其特征在于，基于所述立体声音频信号前一帧的去相关处理方式、所述偏移值Delta、所述当前帧的初始第一阈值Thresh0 ₁、所述当前帧的初始第二阈值Thresh0 ₂，确定所述立体声音频信号当前帧对应的第一阈值Thresh1和第二阈值Thresh2，包括：

响应于所述立体声音频信号前一帧的去相关处理方式为：未进行去相关处理，同时未进行去相关处理的缘由为：所述前一帧左声道信号和右声道信号的第一互相关系数小于所述前一帧对应的第一阈值Thresh2 ₁，且所述第一互相关系数大于等于第二互相关系数，其中，所述第二互相关系数为采用第一去相关处理方式对前一帧信号进行第一去相关处理获得的去相关处理后的信号的互相关系数，基于公式四确定所述当前帧对应的第一阈值Thresh1和第二阈值Thresh2，所述公式四为：

其中，Thresh1和Thresh2分别为所述当前帧的第一阈值、第二阈值，Thresh0 ₁和Thresh0 ₂分别为所述当前帧的第一初始阈值、所述当前帧的第二初始阈值，Delta为所述偏移值，且Delta∈(0，|Thresh0 ₁|)。
如权利要求1所述的方法，其特征在于，基于所述立体声音频信号前一帧的去相关处理方式、所述偏移值Delta、所述当前帧的初始第一阈值Thresh0 ₁、所述当前帧的初始第二阈值Thresh0 ₂，确定所述立体声音频信号当前帧对应的第一阈值Thresh1和第二阈值Thresh2，包括：

响应于所述立体声音频信号前一帧的去相关处理方式为：未进行去相关处理，同时未进行去相关处理的缘由为：所述前一帧左声道信号和右声道信号的第一互相关系数大于所述前一帧对应的第二阈值Thresh2 ₂，且所述第一互相关系数小于等于第三互相关系数，其中，所述第三互相关系数为采用第二去相关处理方式对前一帧信号进行第二去相关处理获得的去相关处理后的信号的互相关系数，基于公式五确定所述当前帧对应的第一阈值Thresh1和第二阈值Thresh2，所述公式五为：

其中，Thresh1和Thresh2分别为所述当前帧的第一阈值、第二阈值，Thresh0 ₁和Thresh0 ₂分别为所述当前帧的第一初始阈值、所述当前帧的第二初始阈值，Delta为所述偏移值，且Delta∈(0，|Thresh0 ₂|)。
如权利要求2或5所述的方法，其特征在于，所述第一去相关处理方式包括第一和差下混处理。
如权利要求7所述的方法，其特征在于，所述第一和差下混处理包括：

基于公式六对所述前一帧左声道信号和右声道信号进行处理以得到主声道信号和次声道信号；所述公式六为：

其中，Mid(n)为前一帧主声道信号，Sid(n)为前一帧次声道信号，L(n)为前一帧左声道信号，R(n)为前一帧右声道信号。
如权利要求3或6所述的方法，其特征在于，所述第二去相关处理方式包括第二和差下混处理。
如权利要求9所述的方法，其特征在于，所述第二和差下混处理包括：

基于公式七对所述前一帧左声道信号和右声道信号进行处理以得到主声道信号和次声道信号；所述公式七为：

其中，Mid(n)为前一帧主声道信号，Sid(n)为前一帧次声道信号，L(n)为前一帧左声道信号，R(n)为前一帧右声道信号。
如权利要求4-6任一所述的方法，其特征在于，所述第一互相关系数的确定方法，包括：

基于公式八确定所述前一帧左声道信号和右声道信号的第一互相关系数；所述公式八为：

η _(LR)为前一帧左声道信号和右声道信号的互相关系数，L(n)为前一帧左声道信号第n个样点，
为前一帧左声道信号所有样点的平均值，R(n)为前一帧右声道信号第n个样点，
为前一帧右声道信号所有样点的平均值，N为前一帧左声道信号或者右声道信号样点总数，即为前一帧帧长。
如权利要求5或6任一所述的方法，其特征在于，所述去相关处理后的信号包括主声道信号和次声道信号；

计算所述去相关处理后的信号的第二互相关系数和第三互相关系数，包括：

基于公式九确定第二互相关系数和第三互相关系数；所述公式九为：

η _(MS)为第二互相关系数或第三互相关系数，Mid(n)为去相关处理后的信号中主声道信号第n个样点，
为去相关处理后的信号中主声道信号所有样点的平均值，Sid(n)为去相关处理后的信号中次声道信号第n个样点，
为去相关处理后的信号中次声道信号所有样点的平均值，N为前一帧左声道信号或者右声道信号样点总数，即为前一帧帧长。
如权利要求1所述的方法，其特征在于，所述方法还包括：

确定所述立体声音频信号第一帧的初始第一阈值Thresh0 ₁和初始第二阈值Thresh0 ₂；

基于公式十确定所述第一帧对应的第一阈值Thresh3 ₁和第二阈值Thresh3 ₂，所述公式十为：

其中，Thresh3 ₁和Thresh3 ₂分别为所述第一帧的第一阈值、所述第一帧的第二阈值，Thresh0 ₁和Thresh0 ₂分别为所述第一帧的第一初始阈值、所述第一帧的第二初始阈值。
一种立体声音频信号处理装置，其特征在于，包括：

确定模块，用于确定所述立体声音频信号当前帧的初始第一阈值Thresh0 ₁和初始第二阈值Thresh0 ₂，其中Thresh0 ₁∈(-1，0)，Thresh0 ₂∈(0，1)；

确定模块，用于确定偏移值Delta；

确定模块，用于基于所述立体声音频信号前一帧的去相关处理方式、所述偏移值Delta、所述当前帧的初始第一阈值Thresh0 ₁、所述当前帧的初始第二阈值Thresh0 ₂，确定所述立体声音频信号当前帧对应的第一阈值Thresh1和第二阈值Thresh2；

处理模块，用于基于所述当前帧对应的第一阈值Thresh1和第二阈值Thresh2对所述当前帧进行去相关处理。
一种通信装置，其特征在于，所述装置包括处理器和存储器，所述存储器中存储有计算机程序，所述处理器执行所述存储器中存储的计算机程序，以使所述装置执行如权利要求1至13中任一项所述的方法。
一种通信装置，其特征在于，包括：处理器和接口电路；

所述接口电路，用于接收代码指令并传输至所述处理器；

所述处理器，用于运行所述代码指令以执行如权利要求1至13中任一项所述的方法。
一种计算机可读存储介质，用于存储有指令，当所述指令被执行时，使如权利要求1至13中任一项所述的方法被实现。