WO2024099233A1

WO2024099233A1 - 一种音频数据的编码方法、解码方法及装置

Info

Publication number: WO2024099233A1
Application number: PCT/CN2023/129685
Authority: WO
Inventors: 伍子谦; 张德军; 蒋佳为; 王鹤; 林坤鹏; 肖益剑; 丁飘; 宋慎义
Original assignee: 抖音视界有限公司
Priority date: 2022-11-07
Filing date: 2023-11-03
Publication date: 2024-05-16
Also published as: CN118038879A

Abstract

一种音频数据的处理方法及装置，涉及数据处理技术领域。方法包括：确定第一音频帧的编码模式（S101）；判断第一音频帧的编码模式与第二音频帧的编码模式是否相同（S102）；若不相同，且第一音频帧的编码模式为多描述编码，则根据第一数据、第二数据以及第一延迟，生成第三数据（S103）；若不相同，且第一音频帧的编码模式为单描述编码，则根据第四数据、第五数据以及第二延迟，生成第六数据（S105）；根据第一音频帧的编码模式对目标数据进行编码，以获取第一音频帧的编码数据。用于在编码模式切换的情况下，提升解码音频质量。

Description

一种音频数据的编码方法、解码方法及装置

相关申请的交叉引用

本申请是以申请号为202211387602.8，申请日为2022年11月7日的中国申请为基础，并主张其优先权，该中国申请的公开内容在此作为整体引入本申请中。

技术领域

本公开涉及数据处理技术领域，尤其涉及一种音频数据的编码方法、解码方法及装置。

背景技术

在VOIP(Voice over Internet Protocol，基于IP的语音传输)通话中，为了提高音频信号质量，编码端会根据实时网络情况调整编码模式，例如在多描述编码(Multiple Description Coding，MDC)模式和单描述编码(Single Description Coding，SDC)模式之间切换。

由于多描述编码MDC模式和单描述编码SDC模式使用不同编码算法，因此，在延时、采样率等参数上可能不一致，这导致在切换编码模式的情况下解码音频数据时可能出现音频不连续和/或有杂音的问题。

发明内容

有鉴于此，本公开实施例提供了一种音频数据的编码方法、解码方法处理方法及装置，用于在编码模式切换的情况下，提升音频信号的质量。

为了实现上述目的，本公开实施例提供技术方案如下：

第一方面，本公开的实施例提供了一种音频数据的编码方法，包括：

确定第一音频帧的编码模式；

判断所述第一音频帧的编码模式与第二音频帧的编码模式是否相同；所述第二音频帧为所述第一音频帧的前一个音频帧；

若不相同，且所述第一音频帧的编码模式为多描述编码，则根据第一数据、第二数据以及第一延迟，生成第三数据；所述第一数据为对所述第一音频帧的原始音频数据进行分频得到的低频数据，所述第二数据为对所述第二音频帧的原始音频数据进行分频得到的低频数据，所述第一延迟为所述多描述编码的编码延迟；

对所述第三数据进行多描述编码，以获取所述第一音频帧的编码数据。

作为本申请实施例一种可选的实施方式，所述方法还包括：

若所述第一音频帧的编码模式与第二音频帧的编码模式不相同，且所述第一音频帧的编码模式为单描述编码，则根据第四数据、第五数据以及第二延迟，生成第六数据；所述第四数据为所述第一音频帧的原始音频数据，所述第五数据为所述第二音频帧的原始音频数据，所述第二延迟为所述单描述编码的编码延迟；

对所述第六数据进行单描述编码，以获取所述第一音频帧的编码数据。

作为本申请实施例一种可选的实施方式，所述根据第一数据、第二数据以及第一延迟，生成第三数据，包括：

从所述第二数据的尾端截取长度为所述第一延迟的样点，以获取第七数据；

将所述第七数据拼接于所述第一数据的首端，以获取第八数据；

从所述第八数据的尾端删除长度为所述第一延迟的样点，以获取所述第三数据。

作为本申请实施例一种可选的实施方式，所述根据第四数据、第五数据以及第二延迟，生成第六数据，包括：

从所述第五数据的尾端截取长度为所述第二延迟的样点，以获取第九数据；

将所述第九数据拼接于所述第四数据的首端，以获取第十数据；

从所述第十数据的尾端删除长度为所述第二延迟的样点，以获取所述第六数据。

作为本申请实施例一种可选的实施方式，所述确定第一音频帧的编码模式，包括：

基于编码模式持续时长和所述第一音频帧的信号类型确定是否满足编码模式切换条件；所述编码模式持续时长为当前编码模式连续编码的音频帧的播放时长；

若否，则将所述第二音频帧的编码模式确定为所述第一音频帧的编码模式；

若是，则根据音频编码数据传输网络的网络参数确定所述第一音频帧的编码模式。

作为本申请实施例一种可选的实施方式，所述基于编码模式持续时长和所述第一音频帧的信号类型，确定是否满足编码模式切换条件，包括：

判断所述编码模式持续时长是否大于阈值时长；

判断所述第一音频帧为语音音频帧的概率是否小于阈值概率；

若所述编码模式持续时长大于所述阈值时长，且所述第一音频帧为语音音频帧的概率小于所述阈值概率，则确定满足所述编码模式切换条件；

若所述编码模式持续时长小于或等于所述阈值时长和/或所述第一音频帧为语音音频帧的概率大于或等于所述阈值概率，则确定不满足所述编码模式切换条件。

作为本申请实施例一种可选的实施方式，所述根据音频编码数据传输网络的网络参数确定所述第一音频帧的编码模式，包括：

根据所述网络参数确定所述音频编码数据传输网络的丢包率；

判断所述丢包率是否大于或等于阈值丢包率；

若是，则确定所述第一音频帧的编码模式为多描述编码；

若否，则确定所述第一音频帧的编码模式为单描述编码。

第二方面，本公开的实施例提供了一种音频数据的解码方法，包括：

根据第一音频帧的编码数据确定第一音频帧的编码模式；

根据所述编码模式对所述第一音频帧的编码数据进行解码，获取解码数据；

若不相同，且所述第一音频帧的编码模式为多描述编码，则基于所述第二音频帧生成丢包补偿数据；

根据所述第二音频帧的延迟数据和所述丢包补偿数据对所述解码数据进行平滑处理，以获取所述第一音频帧的播放数据。

作为本申请实施例一种可选的实施方式，所述方法还包括：

若所述第一音频帧的编码模式与第二音频帧的编码模式不相同，且所述第一音频帧的编码模式为单描述编码，则基于所述第二音频帧生成丢包补偿数据；

根据所述丢包补偿数据对所述解码数据进行平滑处理，以获取所述解码数据对应的平滑结果；

根据所述丢包补偿数据和延迟样点数量对所述平滑结果进行延迟处理，以获取所述第一音频帧的播放数据；所述延迟样点数量为多描述编码的延迟样点数量。

作为本申请实施例一种可选的实施方式，所述根据所述丢包补偿数据对所述解码数据进行平滑处理，以获取所述解码数据对应的平滑结果，包括：

将所述解码数据中的第一样点序列替换为所述丢包补偿数据中的第二样点序列，以获取第一替换结果；所述第一样点序列为所述解码数据的前第一数量个样点组成的样点序列，所述第一数量为第一预设数量与所述延迟样点数量的差值；所述第二样点序列为所述丢包补偿数据中索引值为所述延迟样点数量至所述第一预设数量的样点组成的样点序列；

基于第一窗函数对所述第一替换结果中的第三样点序列和所述丢包补偿数据中的第四样点序列进行加窗叠加，以获取所述解码数据对应的平滑结果，所述第三样点序列为所述第一替换结果中索引值为所述第一数量至所述第一数量与第二预设数量的和的样点组成的样点序列；所述第四样点序列为所述丢包补偿数据中索引值为所述第一预设数量至所述第一预设数量与第二预设数量的和的样点组成的样点序列。

作为本申请实施例一种可选的实施方式，所述根据所述丢包补偿数据和延迟样点数量对所述平滑结果进行延迟处理，以获取所述第一音频帧的播放数据，包括：

获取第五样点序列，所述第五样点序列为所述丢包补偿数据的前所述延迟样点数量个样点组成的样点序列；

将所述第五样点序列拼接于所述平滑结果之前，以获取第一拼接结果；

删除所述第一拼接结果中的第六样点序列，以获取所述第一音频帧的播放数据，所述第六样点序列为所述第一拼接结果的后所述延迟样点数量个样点组成的样点序列。

作为本申请实施例一种可选的实施方式，所述根据所述第二音频帧的延迟数据和所述丢包补偿数据对所述解码数据进行平滑处理，以获取所述第一音频帧的播放数据，包括：

将所述解码数据中的第七样点序列替换为所述延迟数据，以获取第二替换结果；所述第七样点序列为所述解码数据中的前所述延迟样点数量个样点组成的样点序列；

基于第二窗函数对所述第二替换结果中的第八样点序列和所述丢包补偿数据中的第九样点序列进行加窗叠加，以获取所述第一音频帧的播放数据，所述第八样点序列为所述第二替换结果中索引值为所述延迟样点数量至所述延迟样点数量与第三预设数量的和的样点组成的样点序列；所述第九样点序列为所述丢包补偿数据的前所述第三预设数量个样点组成的样点序列。

作为本申请实施例一种可选的实施方式，所述方法还包括：

若所述第一音频帧的编码模式与第二音频帧的编码模式相同，且所述第一音频帧的编码模式为单描述编码，则根据所述第二音频帧的延迟数据和所述延迟样点数量对所述解码数据进行延迟处理，以获取所述第一音频帧的播放数据。

作为本申请实施例一种可选的实施方式，所述根据所述第二音频帧的延迟数据和所述延迟样点数量对所述解码数据进行延迟处理，以获取所述第一音频帧的播放数据，包括：

将所述延迟数据拼接于所述解码数据之前，以获取第二拼接结果；

删除所述第二拼接结果中的第十样点序列，以获取所述第一音频帧的播放数据，所述第十样点序列为所述第二拼接结果的后所述延迟样点数量个样点组成的样点序列。

第三方面，本公开实施例提供一种音频数据的编码装置，包括：

确定单元，用于确定第一音频帧的编码模式；

判断单元，用于判断所述第一音频帧的编码模式与第二音频帧的编码模式是否相同；所述第二音频帧为所述第一音频帧的前一个音频帧；

生成单元，用于在所述第一音频帧的编码模式与第二音频帧的编码模式不相同且所述第一音频帧的编码模式为多描述编码的情况下，根据第一数据、第二数据以及第一延迟，生成第三数据；所述第一数据为对所述第一音频帧的原始音频数据进行分频得到的低频数据，所述第二数据为对所述第二音频帧的原始音频数据进行分频得到的低频数据，所述第一延迟为所述多描述编码的编码延迟；

编码单元，用于对所述第三数据进行多描述编码，以获取所述第一音频帧的编码数据。

作为本申请实施例一种可选的实施方式，所述生成单元还用于在所述第一音频帧的编码模式与第二音频帧的编码模式不相同，且所述第一音频帧的编码模式为单描述编码的情况下，根据第四数据、第五数据以及第二延迟，生成第六数据；所述第四数据为所述第一音频帧的原始音频数据，所述第五数据为所述第二音频帧的原始音频数据，所述第二延迟为所述单描述编码的编码延迟；

所述编码单元还用于对所述第六数据进行单描述编码，以获取所述第一音频帧的编码数据。

作为本申请实施例一种可选的实施方式，所述生成单元具体用于：从所述第二数据的尾端截取长度为所述第一延迟的样点，以获取第七数据；将所述第七数据拼接于所述第一数据的首端，以获取第八数据；从所述第八数据的尾端删除长度为所述第一延迟的样点，以获取所述第三数据。

作为本申请实施例一种可选的实施方式，所述生成单元具体用于：从所述第五数据的尾端截取长度为所述第二延迟的样点，以获取第九数据；将所述第九数据拼接于所述第四数据的首端，以获取第十数据；从所述第十数据的尾端删除长度为所述第二延迟的样点，以获取所述第六数据。

作为本申请实施例一种可选的实施方式，所述确定单元具体用于：基于编码模式持续时长和所述第一音频帧的信号类型确定是否满足编码模式切换条件；所述编码模式持续时长为当前编码模式连续编码的音频帧的播放时长；若否，则将所述第二音频帧的编码模式确定为所述第一音频帧的编码模式；若是，则根据音频编码数据传输网络的网络参数确定所述第一音频帧的编码模式。

作为本申请实施例一种可选的实施方式，所述确定单元具体用于：判断所述编码模式持续时长是否大于阈值时长；判断所述第一音频帧为语音音频帧的概率是否小于阈值概率；若所述编码模式持续时长大于所述阈值时长，且所述第一音频帧为语音音频帧的概率小于所述阈值概率，则确定满足所述编码模式切换条件；若所述编码模式持续时长小于或等于所述阈值时长和/或所述第一音频帧为语音音频帧的概率大于或等于所述阈值概率，则确定不满足所述编码模式切换条件。

作为本申请实施例一种可选的实施方式，所述确定单元具体用于：根据所述网络参数确定所述音频编码数据传输网络的丢包率；判断所述丢包率是否大于或等于阈值丢包率；若是，则确定所述第一音频帧的编码模式为多描述编码；若否，则确定所述第一音频帧的编码模式为单描述编码。

第四方面，本公开实施例提供一种音频数据的解码装置，包括：

确定单元，用于根据第一音频帧的编码数据确定第一音频帧的编码模式；

解码单元，用于根据所述编码模式对所述第一音频帧的编码数据进行解码，获取解码数据；

处理单元，用于在所述第一音频帧的编码模式与第二音频帧的编码模式不相同且所述第一音频帧的编码模式为多描述编码的情况下，基于所述第二音频帧生成丢包补偿数据；以及根据所述第二音频帧的延迟数据和所述丢包补偿数据对所述解码数据进行平滑处理，以获取所述第一音频帧的播放数据。

作为本公开实施例一种可选的实施方式，所述处理单元还用于：在所述第一音频帧的编码模式与第二音频帧的编码模式不相同，且所述第一音频帧的编码模式为单描述编码的情况下，基于所述第二音频帧生成丢包补偿数据；根据所述丢包补偿数据对所述解码数据进行平滑处理，以获取所述解码数据对应的平滑结果；根据所述丢包补偿数据和延迟样点数量对所述平滑结果进行延迟处理，以获取所述第一音频帧的播放数据；所述延迟样点数量为多描述编码的延迟样点数量。

作为本申请实施例一种可选的实施方式，所述处理单元具体用于：将所述解码数据中的第一样点序列替换为所述丢包补偿数据中的第二样点序列，以获取第一替换结果；所述第一样点序列为所述解码数据的前第一数量个样点组成的样点序列，所述第一数量为第一预设数量与所述延迟样点数量的差值；所述第二样点序列为所述丢包补偿数据中索引值为所述延迟样点数量至所述第一预设数量的样点组成的样点序列；基于第一窗函数对所述第一替换结果中的第三样点序列和所述丢包补偿数据中的第四样点序列进行加窗叠加，以获取所述解码数据对应的平滑结果，所述第三样点序列为所述第一替换结果中索引值为所述第一数量至所述第一数量与第二预设数量的和的样点组成的样点序列；所述第四样点序列为所述丢包补偿数据中索引值为所述第一预设数量至所述第一预设数量与第二预设数量的和的样点组成的样点序列。

作为本申请实施例一种可选的实施方式，所述处理单元具体用于：获取第五样点序列，所述第五样点序列为所述丢包补偿数据的前所述延迟样点数量个样点组成的样点序列；将所述第五样点序列拼接于所述平滑结果之前，以获取第一拼接结果；删除所述第一拼接结果中的第六样点序列，以获取所述第一音频帧的播放数据，所述第六样点序列为所述第一拼接结果的后所述延迟样点数量个样点组成的样点序列。

作为本申请实施例一种可选的实施方式，所述处理单元具体用于：将所述解码数据中的第七样点序列替换为所述延迟数据，以获取第二替换结果；所述第七样点序列为所述解码数据中的前所述延迟样点数量个样点组成的样点序列；基于第二窗函数对所述第二替换结果中的第八样点序列和所述丢包补偿数据中的第九样点序列进行加窗叠加，以获取所述第一音频帧的播放数据，所述第八样点序列为所述第二替换结果中索引值为所述延迟样点数量至所述延迟样点数量与第三预设数量的和的样点组成的样点序列；所述第九样点序列为所述丢包补偿数据的前所述第三预设数量个样点组成的样点序列。

作为本申请实施例一种可选的实施方式，所述处理单元还用于在所述第一音频帧的编码模式与第二音频帧的编码模式相同，且所述第一音频帧的编码模式为单描述编码的情况下，根据所述第二音频帧的延迟数据和所述延迟样点数量对所述解码数据进行延迟处理，以获取所述第一音频帧的播放数据。

作为本申请实施例一种可选的实施方式，所述处理单元具体用于：将所述延迟数据拼接于所述解码数据之前，以获取第二拼接结果；删除所述第二拼接结果中的第十样点序列，以获取所述第一音频帧的播放数据，所述第十样点序列为所述第二拼接结果的后所述延迟样点数量个样点组成的样点序列。

第五方面，本公开实施例提供一种电子设备，包括：存储器和处理器，所述存储器用于存储计算机程序；所述处理器用于在执行计算机程序时，使得所述电子设备实现上述任一实施方式所述的音频数据的编码方法或音频数据的解码方法。

第六方面，本公开实施例提供一种计算机可读存储介质，当所述计算机程序被计算设备执行时，使得所述计算设备实现上述任一实施方式所述的音频数据的编码方法或音频数据的解码方法。

第七方面，本公开实施例提供一种计算机程序产品，当所述计算机程序产品在计算机上运行时，使得所述计算机实现上述任一实施方式所述的音频数据的编码方法或音频数据的解码方法。

本公开实施例提供的音频数据的编码方法、解码方法通过以下步骤生成目标数据：确定第一音频帧的编码模式；判断所述第一音频帧的编码模式与第二音频帧的编码模式是否相同；若不相同，且所述第一音频帧的编码模式为多描述编码，则根据第一数据、第二数据以及第一延迟，生成目标数据。由于本公开实施例提供的音频数据的编码方法在所述第一音频帧的编码模式与所述第二音频帧的编码模式不相同，且所述第一音频帧的编码模式为多描述编码时，会根据第二音频帧的原始音频数据进行分频得到的低频数据和多描述编码的编码延迟对第一音频帧的原始音频数据进行分频得到的低频数据进行处理，然后再对处理得到的第三数据进行编码，因此本申请实施例可以在变化模式由单描述编码切换为多描述编码时，避免出现音频不连续以及有杂音的问题，进而提升音频信号的质量。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

为了更清楚地说明本公开实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要调用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本公开实施例提供的音频数据的编码方法的步骤流程图之一；

图2为本公开实施例提供的音频数据的编码方法的示意图之一；

图3为本公开实施例提供的音频数据的编码方法的示意图之二；

图4为本公开实施例提供的音频数据的编码方法的步骤流程图之二；

图5为本公开实施例提供的音频数据的编码方法的步骤流程图之三；

图6为本公开实施例提供的音频数据的解码方法的步骤流程图之一；

图7为本公开实施例提供的音频数据的解码方法的步骤流程图之二；

图8为本公开实施例提供的音频数据的解码方法的示意图之一；

图9为本公开实施例提供的音频数据的解码方法的示意图之二；

图10为本公开实施例提供的音频数据的解码方法的示意图之三；

图11为本公开实施例提供的音频数据的解码方法的示意图之四；

图12为本公开实施例提供的音频数据的解码方法的示意图之五；

图13为本公开实施例提供的音频数据的解码方法的步骤流程图之三；

图14为本公开实施例提供的音频数据的解码方法的示意图之六；

图15为本公开实施例提供的音频数据的编码装置结构示意图；

图16为本公开实施例提供的音频数据的解码装置结构示意图；

图17为本公开实施例提供的电子设备的硬件结构示意图。

具体实施方式

为了能够更清楚地理解本公开的上述目的、特征和优点，下面将对本公开的方案进行进一步描述。需要说明的是，在不冲突的情况下，本公开的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本公开，但本公开还可以采用其他不同于在此描述的方式来实施；显然，说明书中的实施例只是本公开的一部分实施例，而不是全部的实施例。

在本公开实施例中，“示例性的”或者“例如”等词用于表示作例子、例证或说明。本公开实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言，调用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。此外，在本公开实施例的描述中，除非另有说明，“多个”的含义是指两个或两个以上。

本公开实施例提供了一种音频数据的编码方法，参照图1所示，该音频数据的编码方法包括以下步骤：

S101、确定第一音频帧的编码模式。

本公开实施例中，音频帧的编码方式为单描述编码(Single Description Coding，SDC)和多描述编码(Multiple Description Coding，MDC)。

S102、判断所述第一音频帧的编码模式与第二音频帧的编码模式是否相同。

其中，所述第二音频帧为所述第一音频帧的前一个音频帧。

在上步骤S102中，若所述第一音频帧的编码模式与第二音频帧的编码模式不同，且所述第一音频帧的编码模式为多描述编码，则执行如下步骤S103和S104：

S103、根据第一数据、第二数据以及第一延迟，生成第三数据。

其中，所述第一数据为对所述第一音频帧的原始音频数据进行分频得到的低频数据，所述第二数据为对所述第二音频帧的原始音频数据进行分频得到的低频数据，所述第一延迟为所述多描述编码的编码延迟。

在一些实施例中，若当前音频帧的编码模式为多描述编码，则将当前音频帧的原始数据写入延迟缓存(delay_buffer)中，而若当前音频帧的编码模式为单描述编码，则将对当前音频帧的原始数据进行分频得到的低频数据写入指定缓存中，以便在需要获取第二数据时，直接从所述延迟缓存中读取对前一个音频帧的原始音频数据进行分频得到的低频数据。

S104、对所述第三数据进行多描述编码，以获取所述第一音频帧的编码数据。

在上步骤S102中，若所述第一音频帧的编码模式与第二音频帧的编码模式不同，且所述第一音频帧的编码模式为单描述编码，则执行如下步骤S105和S106：

S105、则根据第四数据、第五数据以及第二延迟，生成第六数据。

其中，所述第四数据为所述第一音频帧的原始音频数据，所述第五数据为所述第二音频帧的原始音频数据。所述第二延迟为所述单描述编码的编码延迟。

S106、对所述第六数据进行单描述编码，以获取所述第一音频帧的编码数据。

作为上述实施例的细化与扩展，本公开实施例提供了一种音频数据的编码方法，参照图2所示，该音频数据的编码方法包括以下步骤：

S201、确定第一音频帧的编码模式。

即，确定当前音频帧的编码模式。

S202、判断所述第一音频帧的编码模式与第二音频帧的编码模式是否相同。

其中，所述第二音频帧为所述第一音频帧的前一个音频帧。

即，判断当前音频帧的编码模式与前一个音频帧的编码模式是否相同。

在上述S202中，若所述第一音频帧的编码模式与第二音频帧的编码模式不相同，且所述第一音频帧的编码模式为多描述编码，则执行如下S203至S206：

S203、从所述第二数据的尾端截取长度为所述第一延迟的样点，以获取第七数据。

S204、将所述第五数据拼接于所述第一数据的首端，以获取第八数据。

S205、从所述第八数据的尾端删除长度为所述第一延迟的样点，以获取所述第三数据。

S206、对所述第三数据进行多描述编码，以获取所述第一音频帧的编码数据。

当所述第一音频帧的编码模式与第二音频帧的编码模式不相同且所述第一音频帧的编码模式为多描述编码时，即当前音频帧的编码模式为多描述编码，上一帧音频帧的编码模式为单描述编码时，参照图4所示，图3中第一延迟长度为delay_8kHZ，延迟缓存(delay_buffer)中缓存的数据为对第二音频帧的原始数据进行分频得到的低频数据(第二数据31)，多描述编码时编码器的输入为对第一音频帧进行分频得到的低频数据(第一数据32)。上步骤S203至S205的数据处理过程包括：首先从所述第二数据31的尾端截取长度为所述delay_8kHZ的样点，以获取第七数据311，其次将所述第七数据311拼接于所述第一数据32的首端，以获取第八数据33，最后从所述第八数据33的尾端删除长度为delay_8kHZ的样点，以获取所述第三数据34。如图3所示，第三数据34由两部分组成，一部分为第七数据311，另一部分为将第一数据32尾端删除长度为delay_8kHZ的样点后第一数据32剩余的数据。

在上述S202中，若所述第一音频帧的编码模式与第二音频帧的编码模式不相同，且所述第一音频帧的编码模式为多描述编码，则执行如下S207至S210：

S207、从所述第五数据的尾端截取长度为所述第二延迟的样点，以获取第九数据。

S208、将所述第九数据拼接于所述第四数据的首端，以获取第十数据。

S209、从所述第十数据的尾端删除长度为所述第二延迟的样点，以获取所述第六数据。

S210、对所述第六数据进行单描述编码，以获取所述第一音频帧的编码数据。

当所述第一音频帧的编码模式与第二音频帧的编码模式不相同且所述第一音频帧的编码模式为单描述编码时，即当前音频帧的编码模式为单描述编码，上一帧音频帧的编码模式为多描述编码时，参照图4所示，图4中第一延迟长度为delay_16kHZ，延迟缓存(delay_buffer)中缓存的数据为对第二音频帧的原始音频数据(第五数据41)，单描述编码时输出编码器的输入为第一音频帧的原始音频数据(第四数据42)。上述步骤S207至S209的数据处理过程包括：首先从所述第五数据41的尾端截取长度为所述delay_16kHZ的样点，以获取第九数据411，其次将所述第九数据411拼接于所述第四数据42的首端，以获取第十数据43，最后从所述第十数据43的尾端删除长度为delay_16kHZ的样点，以获取所述第六数据44。如图4所示，第六数据44由两部分组成，一部分为第九数据411，另一部分为将第四数据42尾端删除长度为delay_16kHZ的样点后第四数据42剩余的数据。

作为上述实施例的细化与扩展，本公开实施例提供了一种音频数据的处理方法，参照图5，该音频数据的处理方法包括：

S501、基于编码模式持续时长和所述第一音频帧的信号类型确定是否满足编码模式切换条件。

其中，所述编码模式持续时长为当前编码模式连续编码的音频帧的播放时长。

在一些实施例中，基于编码模式持续时长和所述第一音频帧的信号类型确定是否满足编码模式切换条件的实现方式可以包括如下步骤a至步骤d：

步骤a、判断所述编码模式持续时长是否大于阈值时长。

本申请实施例对阈值时长不做限定，示例性的，阈值时长可以为2s。

在上述步骤a中，若所述编码模式持续时长小于或等于阈值时长，则执行如下步骤b。

步骤b、确定不满足编码模式切换条件。

在上述步骤a中，若所述编码模式持续时长大于阈值时长，则执行如下步骤c至e：

步骤c、判断所述第一音频帧为语音音频帧的概率是否小于阈值概率。

在上述步骤c中，若所述第一音频帧为语音音频帧的概率小于所述阈值概率，则执行如下步骤d：

步骤d、确定满足所述编码模式切换条件。

在上述步骤c中，若所述第一音频帧为语音音频帧的概率大于或等于所述阈值概率，则执行如下步骤e：

步骤e：确定不满足所述编码模式切换条件。

即，述编码模式持续时长小于或等于所述阈值时长和/或所述第一音频帧为语音音频帧的概率大于或等于所述阈值概率，则确定不满足所述编码模式切换条件。

在上述步骤S501中，若不满足所述编码模式切换条件，则执行如下步骤S502：

S502、将所述第二音频帧的编码模式确定为所述第一音频帧的编码模式。

即，沿用前音频帧的编码模式进行编码。

在上述步骤S501中，若满足所述编码模式切换条件，则执行如下步骤S503：

S503、根据音频编码数据传输网络的网络参数确定所述第一音频帧的编码模式。

在一些实施例中，上步骤S503(根据音频编码数据传输网络的网络参数确定所述第一音频帧的编码模式)的实现方式步骤如下步骤1至步骤3：

步骤1、根据所述网络参数确定所述音频编码数据传输网络的丢包率。

本申请实施例中的丢包率(Packet Loss Rate)是指数据包传输过程中所丢失数据包数量占全部发送的数据包的比率。

步骤2、判断所述丢包率是否大于或等于阈值丢包率。

本申请实施例对阈值丢包率不做限定，示例性的，阈值丢包率可以为5％。

在上步骤2中，若所述丢包率大于或等于所述阈值丢包率，则执行如下步骤3，而若所述丢包率小于所述阈值丢包率，则执行如下步骤4：

步骤3、确定所述第一音频帧的编码模式为多描述编码。

步骤4、确定所述第一音频帧的编码模式为单描述编码。

S504、判断所述第一音频帧的编码模式与第二音频帧的编码模式是否相同。

在上述S504中，所述第一音频帧的编码模式与第二音频帧的编码模式不相同且所述第一音频帧的编码模式为多描述编码，则执行如下S505至S508：

S505、从所述第二数据的尾端截取长度为所述第一延迟的样点，以获取第七数据。

其中，所述第二数据为对所述第二音频帧的原始音频数据进行分频得到的低频数据，所述第一延迟为所述多描述编码的编码延迟。

S506、将所述第七数据拼接于所述第一数据的首端，以获取第八数据。

其中，所述第一数据为对所述第一音频帧的原始音频数据进行分频得到的低频数据。

S507、从所述第八数据的尾端删除长度为所述第一延迟的样点，以获取所述第三数据。

S508、对所述第三数据进行多描述编码，以获取所述第一音频帧的编码数据。

在上述S504中，若所述第一音频帧的编码模式与第二音频帧的编码模式不相同且所述第一音频帧的编码模式为单描述编码，则执行如下S509至S512：

S509、从所述第五数据的尾端截取长度为所述第二延迟的样点，以获取第九数据。

S510、将所述第九数据拼接于所述第四数据的首端，以获取第十数据。

S511、从所述第十数据的尾端删除长度为所述第二延迟的样点，以获取所述第四数据。

S512、对所述第六数据进行单描述编码，以获取所述第一音频帧的编码数据。

在上述S504中，若所述第一音频帧的编码模式与第二音频帧的编码模式相同且所述第一音频帧的编码模式为多描述编码，则对于对所述第一音频帧的原始音频数据进行分频得到的低频数据进行多描述编码，以获取所述第一音频帧的编码数据，在上述S504中，若所述第一音频帧的编码模式与第二音频帧的编码模式相同且所述第一音频帧的编码模式为单描述编码，对所述第一音频帧的原始音频数据进行单描述编码，以获取所述第一音频帧的编码数据。

本公开实施例提供了一种音频数据的解码方法，参照图6，该音频数据的解码方法包括：

S601、根据第一音频帧的编码数据确定第一音频帧的编码模式。

S602、根据所述编码模式对所述第一音频帧的编码数据进行解码，获取解码数据。

S603、判断所述第一音频帧的编码模式与第二音频帧的编码模式是否相同。

其中，所述第二音频帧为所述第一音频帧的前一个音频帧。

在上述S603中，所述第一音频帧的编码模式与第二音频帧的编码模式不相同，且所述第一音频帧的编码模式为单描述编码，执行如下S604至S606：

S604、基于所述第二音频帧生成丢包补偿数据。

所述丢包补偿数据为基于丢包补偿机制(Packet Loss Concealment，PLC)得到的数据，丢包补偿机制是媒体引擎用来解决网络丢包问题的。当媒体引擎在接收一系列媒体流数据包时，并不能保证所有的包都被接收到。如果有数据包丢失，且此时前向纠错(Forward Error Correction，FEC)机制又没有使用，丢包补偿机制就会起作用。丢包补偿机制并不是标准一致，它允许媒体引擎和编解码器根据自身情况加以实现和扩展。

本申请实施例中的丢包补偿数据可以为长度为10ms的数据。

S605、根据所述丢包补偿数据对所述解码数据进行平滑处理，以获取所述解码数据对应的平滑结果。

S606、根据所述丢包补偿数据和延迟样点数量对所述平滑结果进行延迟处理，以获取所述第一音频帧的播放数据。

其中，所述延迟样点数量为多描述编码的延迟样点数量。

在本公开实施例中，由于MDC算法本身有qmf_order-1个样点数的延时，因此当第一音频帧的编码方式为MDC时，可以设置解码后输出音频延时为0，而当第一音频帧的编码方式为SDC时，为了对齐与MDC算法延时，需要设置解码后输出音频延时为qmf_order-1，对齐两种算法的延时可以通过以下公式实现：

在上述S603中，所述第一音频帧的编码模式与第二音频帧的编码模式不相同，且所述第一音频帧的编码模式为多描述编码，执行如下S607和S608：

S607、基于所述第二音频帧生成丢包补偿数据。

S608、根据所述第二音频帧的延迟数据和所述丢包补偿数据对所述解码数据进行平滑处理，以获取所述第一音频帧的播放数据。

在上述实施例在对第一音频数据的数据包进行解码时，首先根据第一音频帧的编码数据确定第一音频帧的编码模式，然后根据所述编码模式对所述第一音频帧的编码数据进行解码，获取解码数据，再判断所述第一音频帧的编码模式与第二音频帧的编码模式是否相同，若编码模式不相同且所述第一音频帧的编码模式为单描述编码，基于所述第二音频帧生成丢包补偿数据，再根据所述丢包补偿数据对所述解码数据进行平滑处理，以获取所述解码数据对应的平滑结果。根据所述丢包补偿数据和延迟样点数量对所述平滑结果进行延迟处理，以获取所述第一音频帧的播放数据；若编码模式不相同且所述第一音频帧的编码模式为多描述编码，基于所述第二音频帧生成丢包补偿数据，再根据所述第二音频帧的延迟数据和所述丢包补偿数据对所述解码数据进行平滑处理，以获取所述第一音频帧的播放数据。本公开实施例提供的音频数据的解码方法当所述第一音频帧的编码模式与所述第二音频帧的编码模式不相同且第一音频帧的编码模式为单描述编码时，会基于第二音频帧生成丢包补偿数据，进而对解码数据进行平滑处理，得到第一音频帧的播放数据；当所述第一音频帧的编码模式与所述第二音频帧的编码模式不相同且第一音频帧的编码模式为多描述编码时，会基于第二音频帧生成丢包补偿数据，再结合所述第二音频帧的延迟数据获取所述第一音频帧的播放数据，因此本申请实施例可以在第一音频帧的编码模式与第二音频帧的编码模式不相同时，根据当前音频帧编码模式类型对编码数据进行处理，进而避免出现音频不连续以及有杂音的问题，进而提升音频信号的质量。

作为上述实施例的细化与扩展，本公开实施例提供了一种音频数据的解码方法，参照图7所示，该音频数据的解码方法包括以下步骤：

S701、根据第一音频帧的编码数据确定第一音频帧的编码模式。

S702、根据所述编码模式对所述第一音频帧的编码数据进行解码，获取解码数据。

S703、判断所述第一音频帧的编码模式与第二音频帧的编码模式是否相同。

其中，所述第二音频帧为所述第一音频帧的前一个音频帧。

在上述S703中，若所述第一音频帧的编码模式与第二音频帧的编码模式相同，且所述第一音频帧的编码模式为单描述编码，则执行如下S704至S706：

S704、将所述解码数据中的第一样点序列替换为所述丢包补偿数据中的第二样点序列，以获取第一替换结果。

其中，所述第一样点序列为所述解码数据的前第一数量个样点组成的样点序列，所述第一数量为第一预设数量与所述延迟样点数量的差值；所述第二样点序列为所述丢包补偿数据中索引值为所述延迟样点数量至所述第一预设数量的样点组成的样点序列。

在一些实施例中，若当前音频帧的编码模式为多描述编码，则将当前音频帧的原始数据写入过渡缓存(transition_buffer)中，而若当前音频帧的编码模式为单描述编码，则将对当前音频帧的原始数据进行分频得到的低频数据写入指定缓存中，以便在需要获取第二数据时，直接从所述延迟缓存中读取对前一个音频帧的原始音频数据进行分频得到的低频数据。所述解码数据将存储在脉冲编码调制缓存(pcm_buffer)中，所述第一替换结果将写入脉冲编码调制缓存中原解码数据的存储位置，下述S707中获取的第二替换结果也同样会写入到脉冲编码调制缓存中原解码数据的存储位置。

在本实施例中，所述解码数据存储在脉冲编码调制缓存中，解码数据中的第一样点序列为脉冲编码调制缓存前F5-Fd样点序列。丢包补偿数据中的第二样点序列为丢包补偿数据中索引值为Fd至F5的样点序列，获取第一替换结果可以通过以下公式实现：
pcm_buffe(i-Fd)＝transition_buffer(i)
i＝Fd，……，F5-1

在本实施例中，参照图8，所述延迟样点数量为Fd、第一预设数量为F5。图8中过渡缓存中存储的为基于第二音频帧生成丢包补偿数据(丢包补偿数据81)，过渡缓存中索引值为所述延迟样点数量至第一预设数量的样点组成的样点序列为第二样点序列811，存储在脉冲编码调制缓存中的为根据编码模式对第一音频帧的编码数据进行解码得到的解码数据(解码数据82)，脉冲编码调制缓存中的前第一数量个样点组成的样点序列(第一样点序列821)。则上步骤S704即为：将解码数据82中的第一样点序列821替换为丢包补偿数据81中的第二样点序列811，以获取第一替换结果83。

S705、基于第一窗函数对所述第一替换结果中的第三样点序列和所述丢包补偿数据中的第四样点序列进行加窗叠加，以获取所述解码数据对应的平滑结果。

其中，所述第三样点序列为所述第一替换结果中索引值为所述第一数量至所述第一数量与第二预设数量的和的样点组成的样点序列；所述第四样点序列为所述丢包补偿数据中索引值为所述第一预设数量至所述第一预设数量与第二预设数量的和的样点组成的样点序列。

窗函数：傅里叶变换只能对有限长度的时域数据进行变换，因此，需要对时域信号进行信号截断。即使是周期信号，如果截断的时间长度不是周期的整数倍(周期截断)，那么，截取后的信号将会存在泄漏。为了将这个泄漏误差减少到最小程度，我们需要使用加权函数，也叫窗函数。加窗主要是为了使时域信号似乎更好地满足傅里叶处理的周期性要求，减少泄漏。本实施例中根据切换类型进行平滑，使用加窗平滑的方式进行过渡平滑。

在本实施例中，所述第三样点序列为脉冲编码调制缓存中索引值从F5-Fd至F5-Fd+F2.5的样点序列。所述第四样点序列为过渡缓存中索引值从F5-Fd至F5-Fd+F2.5的样点序列，获取平滑结果可以通过以下公式实现：
pcm_buffe(i+F5-Fd)
＝w(i)*pcm(i+F5-Fd)+(1-w(i))
*transition_buffer(i+F5)
i＝0，1，……F2.5-1

其中，w(i)为窗函数的表达式，平滑方法为将对应部分与过渡缓存中索引为F5到F5+F2.5的样点进行加窗叠加达到平滑过渡的目的。

在上述图8所示实施例的基础上，参照图9所示，所述第二预设数量F2.5。在上述S704的基础上，过渡缓存中的索引值为所述第一预设数量至所述第一预设数量与第二预设数量的和的样点组成的样点序列为第四样点序列812，脉冲编码调制缓存中的第一替换结果83中索引值为第一数量至第一数量与第二预设数量的和的样点组成的样点序列为第三样点序列831。将所述第一替换结果83中的第三样点序列831和所述丢包补偿数据81中的第四样点序列812进行加窗叠加，得到所述解码数据对应的平滑结果91，平滑结果91。

S706、获取第五样点序列。

其中，所述第五样点序列为所述丢包补偿数据的前所述延迟样点数量个样点组成的样点序列。

在本实施例中，所述第五样点序列为过渡缓存中前Fd个样点序列序列。获取第五样点序列可以通过以下公式实现：
delay_buffer(i)＝transition_buffer(i)
i＝0，1，……Fd-1

S707、将所述第五样点序列拼接于所述平滑结果之前，以获取第一拼接结果。

S708、删除所述第一拼接结果中的第六样点序列，以获取所述第一音频帧的播放数据。

其中，所述第六样点序列为所述第一拼接结果的后所述延迟样点数量个样点组成的样点序列。

在上述图9所示实施例的基础上，参照图10所示，丢包补偿数据的前所述延迟样点数量个样点组成的样点序列为第五样点序列101，首先，将第五样点序列101拼接至平滑结果91之前，得到第一拼接结果102，第一拼接结果102后所述延迟样点数量个样点组成的样点序列为第六样点序列103，然后将第一拼接结果102中的第六样点序列103删除，得到所述第一音频帧的播放数据104，第一音频帧的播放数据104由第五样点序列101、第二样点序列811以及将第一拼接结果102尾端删除第六样点序列的剩余部分。

在上述S703中，若所述第一音频帧的编码模式与第二音频帧的编码模式相同，且所述第一音频帧的编码模式为多描述编码，则执行如下S709和S710：

S709、将所述解码数据中的第七样点序列替换为所述延迟数据，以获取第二替换结果。

其中，所述第七样点序列为所述解码数据中的前所述延迟样点数量个样点组成的样点序列，获取第二替换结果可以通过以下公式实现：
pcm_buffer(i)＝delay_buffer(i)
i＝0，1，……qmf_order-2

在本实施例中，参照图11所示，图中在脉冲编码调制缓存中的为根据编码模式对第一音频帧的编码数据进行解码得到的解码数据(解码数据112)，脉冲编码调制缓存中的前qmf_order-1的样点序列为第七样点序列1121，延迟缓存中的前qmf_order-1样点序列为延迟数据111，将所述解码数据112中的第七样点序列1121替换为所述延迟数据111，得到第二替换结果113，第二替换结果113由延迟数据111以及解码数据112中尾端的剩余部分。

S710、基于第二窗函数对所述第二替换结果中的第八样点序列和所述丢包补偿数据中的第九样点序列进行加窗叠加。

其中，所述第八样点序列为所述第二替换结果中索引值为所述延迟样点数量至所述延迟样点数量与第三预设数量的和的样点组成的样点序列；所述第九样点序列为所述丢包补偿数据的前所述第三预设数量个样点组成的样点序列，上述步骤基于第二窗函数对所述第二替换结果中的第八样点序列和所述丢包补偿数据中的第九样点序列进行加窗叠加可以通过以下公式实现：
pcm_buffe(i+qmf_order-1)
＝(i)*pcm(i+qmf_order-1)+(1-(i))
*transition_buffer(i)，i＝0，1，……F2.5-1

在本实施例中，在上述图11所示的实施例基础上，参照图12所示，过渡缓存中的前第三预设数量个样点组成的样点序列为第九样点序列1211，脉冲编码调制缓存中的第二替换结果113中索引值为所述延迟样点数量至所述延迟样点数量与第三预设数量的和的样点组成的样点序列为第八样点序列1031，丢包补偿数据121中的第九样点序列1211与第八样点序列1031进行加窗叠加得到的结果122，加窗叠加得到的结果122由延迟数据102、第九样点序列1211和第八样点序列1031加窗叠加得到的平滑结果1221，以及第二替换结果104中尾端剩余的部分组成。

作为上述实施例的细化与扩展，本公开实施例提供了一种音频数据的处理方法，参照图13所示，该音频数据的处理方法包括以下步骤：

S1301、根据第一音频帧的编码数据确定第一音频帧的编码模式。

S1302、根据所述编码模式对所述第一音频帧的编码数据进行解码，获取解码数据。

S1303、判断所述第一音频帧的编码模式与第二音频帧的编码模式是否相同。

在上述S1303中，所述第一音频帧的编码模式与第二音频帧的编码模式相同，则执行如下步骤a和步骤b：

步骤a、将所述延迟数据拼接于所述解码数据之前，以获取第二拼接结果。

步骤b、删除所述第二拼接结果中的第十样点序列，以获取所述第一音频帧的播放数据。

其中，所述第十样点序列为所述第二拼接结果的后所述延迟样点数量个样点组成的样点序列。

在一些实施例中，上述步骤a与步骤b可参照图14，所述延迟数据1411为延迟缓存中前qmf_order-1样点序列，将所述延迟数据1411拼接于所述解码数据142之前，获取第二拼接结果143。第二拼接结果143的后所述延迟样点数量个样点组成的样点序列为第十样点序列1431，然后删除第二拼接结果143中的第十样点序列1431，以获取所述第一音频帧的播放数据144，第一音频帧的播放数据144由延迟数据1411以及解码数据142中尾端剩余的部分。

在上述S1303中，所述第一音频帧的编码模式与第二音频帧的编码模式不相同，且所述第一音频帧的编码模式为单描述编码则执行如下S1304至S1306：

S1304、基于所述第二音频帧生成丢包补偿数据。

S1305、将所述解码数据中的第一样点序列替换为所述丢包补偿数据中的第二样点序列，以获取第一替换结果。

S1306、基于第一窗函数对所述第一替换结果中的第三样点序列和所述丢包补偿数据中的第四样点序列进行加窗叠加，以获取所述解码数据对应的平滑结果。

在上述S1303中，所述第一音频帧的编码模式与第二音频帧的编码模式不相同，且所述第一音频帧的编码模式为多描述编码则,则执行如下S1307至S1313：

S1307、获取第五样点序列。

S1308、将所述第五样点序列拼接于所述平滑结果之前，以获取第一拼接结果。

S1309、删除所述第一拼接结果中的第六样点序列，以获取所述第一音频帧的播放数据。

S1310、若所述第一音频帧的编码模式为多描述编码，则基于所述第二音频帧生成丢包补偿数据。

S1311、将所述解码数据中的第七样点序列替换为所述延迟数据，以获取第二替换结果。

S1312、基于第二窗函数对所述第二替换结果中的第八样点序列和所述丢包补偿数据中的第九样点序列进行加窗叠加，以获取所述第一音频帧的播放数据。

其中，所述第八样点序列为所述第二替换结果中索引值为所述延迟样点数量至所述延迟样点数量与第三预设数量的和的样点组成的样点序列；所述第九样点序列为所述丢包补偿数据的前所述第三预设数量个样点组成的样点序列。

S1313、根据所述丢包补偿数据和延迟样点数量对所述平滑结果进行延迟处理，以获取所述第一音频帧的播放数据。

基于同一发明构思，作为对上述方法的实现，本公开实施例还提供了一种音频数据的编码装置、解码装置，该实施例与前述方法实施例对应，为便于阅读，本实施例不再对前述方法实施例中的细节内容进行逐一赘述，但应当明确，本实施例中的音频数据的处理设备能够对应实现前述方法实施例中的全部内容。

本公开实施例提供了一种音频数据的编码装置，图15为该音频数据的处理装置的结构示意图，参照图15所示，该音频数据的处理设备1500包括：

确定单元1501，用于确定第一音频帧的编码模式；

判断单元1502，用于判断所述第一音频帧的编码模式与第二音频帧的编码模式是否相同；所述第二音频帧为所述第一音频帧的前一个音频帧；

生成单元1503，用于当所述第一音频帧的编码模式与第二音频帧的编码模式不相同且所述第一音频帧的编码模式为多描述编码时，则根据第一数据、第二数据以及第一延迟，生成目标数据；所述第一数据为对所述第一音频帧的原始音频数据进行分频得到的低频数据，所述第二数据为对所述第二音频帧的原始音频数据进行分频得到的低频数据，所述第一延迟为所述多描述编码的编码延迟；

所述生成单元1503还用于当所述第一音频帧的编码模式与第二音频帧的编码模式不相同且所述第一音频帧的编码模式为单描述编码，则根据第四数据、第五数据以及第二延迟，生成第六数据；所述第四数据为所述第一音频帧的原始音频数据，所述第五数据为所述第二音频帧的原始音频数据，所述第二延迟为所述单描述编码的编码延迟；

编码单元1504，用于根据所述第一音频帧的编码模式对所述目标数据进行编码，以获取所述第一音频帧的编码数据。

作为本公开实施例一种可选的实施方式，所述生成单元1503具体用于：从所述第二数据的尾端截取长度为所述第一延迟的样点，以获取第五数据；将所述第五数据拼接于所述第一数据的首端，以获取第六数据；从所述第六数据的尾端删除长度为所述第一延迟的样点，以获取所述目标数据。

作为本公开实施例一种可选的实施方式，所述生成单元1503具体用于：从所述第五数据的尾端截取长度为所述第二延迟的样点，以获取第七数据；将所述第七数据拼接于所述第四数据的首端，以获取第八数据；从所述第八数据的尾端删除长度为所述第二延迟的样点，以获取所述目标数据。

作为本公开实施例一种可选的实施方式，所述确定单元1501具体用于：基于编码模式持续时长和所述第一音频帧的信号类型确定是否满足编码模式切换条件；所述编码模式持续时长为当前编码模式连续编码的音频帧的播放时长；若否，则将所述第二音频帧的编码模式确定为所述第一音频帧的编码模式；若是，则根据音频编码数据传输网络的网络参数确定所述第一音频帧的编码模式。

作为本公开实施例一种可选的实施方式，所述确定单元1501具体用于：判断所述编码模式持续时长是否大于阈值时长；判断所述第一音频帧为语音音频帧的概率是否小于阈值概率；若所述编码模式持续时长大于所述阈值时长，且所述第一音频帧为语音音频帧的概率小于所述阈值概率，则确定满足所述编码模式切换条件；若所述编码模式持续时长小于或等于所述阈值时长和/或所述第一音频帧为语音音频帧的概率大于或等于所述阈值概率，则确定不满足所述编码模式切换条件。

作为本公开实施例一种可选的实施方式，所述确定单元1501具体用于：根据所述网络参数确定所述音频编码数据传输网络的丢包率；判断所述丢包率是否大于或等于阈值丢包率；若是，则确定所述第一音频帧的编码模式为多描述编码；若否，则确定所述第一音频帧的编码模式为单描述编码。

本公开实施例提供了一种音频数据的解码装置，图16为该音频数据的解码装置的结构示意图，参照图16所示，该音频数据的解码装置1600包括：

确定单元1601，用于根据第一音频帧的编码数据确定第一音频帧的编码模式；

解码单元1602，用于根据所述编码模式对所述第一音频帧的编码数据进行解码，获取解码数据；

判断单元1603，用于判断所述第一音频帧的编码模式与第二音频帧的编码模式是否相同；所述第二音频帧为所述第一音频帧的前一个音频帧；

处理单元1604，用于当所述第一音频帧的编码模式与第二音频帧的编码模式不相同且所述第一音频帧的编码模式为单描述编码，则基于所述第二音频帧生成丢包补偿数据，根据所述丢包补偿数据对所述解码数据进行平滑处理，以获取所述解码数据对应的平滑结果；根据所述丢包补偿数据和延迟样点数量对所述平滑结果进行延迟处理，以获取所述第一音频帧的播放数据；所述延迟样点数量为多描述编码的延迟样点数量；

所述处理单元1604还用于当所述第一音频帧的编码模式与第二音频帧的编码模式不相同且所述第一音频帧的编码模式为多描述编码，则基于所述第二音频帧生成丢包补偿数据，根据所述第二音频帧的延迟数据和所述丢包补偿数据对所述解码数据进行平滑处理，以获取所述第一音频帧的播放数据。

作为本公开实施例一种可选的实施方式，所述处理单元1604具体用于：将所述解码数据中的第一样点序列替换为所述丢包补偿数据中的第二样点序列，以获取第一替换结果；所述第一样点序列为所述解码数据的前第一数量个样点组成的样点序列，所述第一数量为第一预设数量与所述延迟样点数量的差值；所述第二样点序列为所述丢包补偿数据中索引值为所述延迟样点数量至所述第一预设数量的样点组成的样点序列；基于第一窗函数对所述第一替换结果中的第三样点序列和所述丢包补偿数据中的第四样点序列进行加窗叠加，以获取所述解码数据对应的平滑结果，所述第三样点序列为所述第一替换结果中索引值为所述第一数量至所述第一数量与第二预设数量的和的样点组成的样点序列；所述第四样点序列为所述丢包补偿数据中索引值为所述第一预设数量至所述第一预设数量与第二预设数量的和的样点组成的样点序列。

作为本公开实施例一种可选的实施方式，所述处理单元1604具体用于：获取第五样点序列，所述第五样点序列为所述丢包补偿数据的前所述延迟样点数量个样点组成的样点序列；将所述第五样点序列拼接于所述平滑结果之前，以获取第一拼接结果；删除所述第一拼接结果中的第六样点序列，以获取所述第一音频帧的播放数据，所述第六样点序列为所述第一拼接结果的后所述延迟样点数量个样点组成的样点序列。

作为本公开实施例一种可选的实施方式，所述处理单元1604具体用于：将所述解码数据中的第七样点序列替换为所述延迟数据，以获取第二替换结果；所述第七样点序列为所述解码数据中的前所述延迟样点数量个样点组成的样点序列；基于第二窗函数对所述第二替换结果中的第八样点序列和所述丢包补偿数据中的第九样点序列进行加窗叠加，以获取所述第一音频帧的播放数据，所述第八样点序列为所述第二替换结果中索引值为所述延迟样点数量至所述延迟样点数量与第三预设数量的和的样点组成的样点序列；所述第九样点序列为所述丢包补偿数据的前所述第三预设数量个样点组成的样点序列。

作为本公开实施例一种可选的实施方式，所述处理单元1604具体用于若所述第一音频帧的编码模式与第二音频帧的编码模式相同，且所述第一音频帧的编码模式为单描述编码，则根据所述第二音频帧的延迟数据和所述延迟样点数量对所述解码数据进行延迟处理，以获取所述第一音频帧的播放数据。

作为本公开实施例一种可选的实施方式，所述处理单元1604具体用于：将所述延迟数据拼接于所述解码数据之前，以获取第二拼接结果；删除所述第二拼接结果中的第十样点序列，以获取所述第一音频帧的播放数据，所述第十样点序列为所述第二拼接结果的后所述延迟样点数量个样点组成的样点序列。

本实施例提供的音频数据的处理设备可以执行上述方法实施例提供的音频数据的处理方法，其实现原理与技术效果类似，此处不再赘述。

基于同一发明构思，本公开实施例还提供了一种电子设备。图17为本公开实施例提供的电子设备的结构示意图，如图17所示，本实施例提供的电子设备包括：存储器1701和处理器1702，所述存储器1701用于存储计算机程序；所述处理器1702用于在执行计算机程序时执行上述实施例提供的音频数据的处理方法。

基于同一发明构思，本公开实施例还提供了一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，当计算机程序被处理器执行时，使得所述计算设备实现上述实施例提供的音频数据的处理方法。

基于同一发明构思，本公开实施例还提供了一种计算机程序产品，当所述计算机程序产品在计算机上运行时，使得所述计算设备实现上述实施例提供的音频数据的处理方法。

本领域技术人员应明白，本公开的实施例可提供为方法、系统、或计算机程序产品。因此，本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质上实施的计算机程序产品的形式。

处理器可以是中央渲染单元103(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动存储介质。存储介质可以由任何方法或技术来实现信息存储，信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。根据本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

最后应说明的是：以上各实施例仅用以说明本公开的技术方案，而非对其限制；尽管参照前述各实施例对本公开进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本公开各实施例技术方案的范围。

Claims

一种音频数据的编码方法，包括：

确定第一音频帧的编码模式；

判断所述第一音频帧的编码模式与第二音频帧的编码模式是否相同；所述第二音频帧为所述第一音频帧的前一个音频帧；

若不相同，且所述第一音频帧的编码模式为多描述编码，则根据第一数据、第二数据以及第一延迟，生成第三数据；所述第一数据为对所述第一音频帧的原始音频数据进行分频得到的低频数据，所述第二数据为对所述第二音频帧的原始音频数据进行分频得到的低频数据，所述第一延迟为所述多描述编码的编码延迟；

对所述第三数据进行多描述编码，以获取所述第一音频帧的编码数据。
根据权利要求1所述的方法，所述方法还包括：

若所述第一音频帧的编码模式与第二音频帧的编码模式不相同，且所述第一音频帧的编码模式为单描述编码，则根据第四数据、第五数据以及第二延迟，生成第六数据；所述第四数据为所述第一音频帧的原始音频数据，所述第五数据为所述第二音频帧的原始音频数据，所述第二延迟为所述单描述编码的编码延迟；

对所述第六数据进行单描述编码，以获取所述第一音频帧的编码数据。
根据权利要求1所述的方法，所述根据第一数据、第二数据以及第一延迟，生成第三数据，包括：

从所述第二数据的尾端截取长度为所述第一延迟的样点，以获取第七数据；

将所述第七数据拼接于所述第一数据的首端，以获取第八数据；

从所述第八数据的尾端删除长度为所述第一延迟的样点，以获取所述第三数据。
根据权利要求2所述的方法，所述根据第四数据、第五数据以及第二延迟，生成第六数据，包括：

从所述第五数据的尾端截取长度为所述第二延迟的样点，以获取第九数据；

将所述第九数据拼接于所述第四数据的首端，以获取第十数据；

从所述第十数据的尾端删除长度为所述第二延迟的样点，以获取所述第六数据。
根据权利要求1-4任一项所述的方法，所述确定第一音频帧的编码模式，包括：

基于编码模式持续时长和所述第一音频帧的信号类型确定是否满足编码模式切换条件；所述编码模式持续时长为当前编码模式连续编码的音频帧的播放时长；

若否，则将所述第二音频帧的编码模式确定为所述第一音频帧的编码模式；

若是，则根据音频编码数据传输网络的网络参数确定所述第一音频帧的编码模式。
根据权利要求5所述的方法，所述基于编码模式持续时长和所述第一音频帧的信号类型，确定是否满足编码模式切换条件，包括：

判断所述编码模式持续时长是否大于阈值时长；

判断所述第一音频帧为语音音频帧的概率是否小于阈值概率；

若所述编码模式持续时长大于所述阈值时长，且所述第一音频帧为语音音频帧的概率小于所述阈值概率，则确定满足所述编码模式切换条件；

若所述编码模式持续时长小于或等于所述阈值时长和/或所述第一音频帧为语音音频帧的概率大于或等于所述阈值概率，则确定不满足所述编码模式切换条件。
根据权利要求5所述的方法，所述根据音频编码数据传输网络的网络参数确定所述第一音频帧的编码模式，包括：

根据所述网络参数确定所述音频编码数据传输网络的丢包率；

判断所述丢包率是否大于或等于阈值丢包率；

若是，则确定所述第一音频帧的编码模式为多描述编码；

若否，则确定所述第一音频帧的编码模式为单描述编码。
一种音频数据的解码方法，包括：

根据第一音频帧的编码数据确定第一音频帧的编码模式；

根据所述编码模式对所述第一音频帧的编码数据进行解码，获取解码数据；

判断所述第一音频帧的编码模式与第二音频帧的编码模式是否相同；所述第二音频帧为所述第一音频帧的前一个音频帧；

若不相同，且所述第一音频帧的编码模式为多描述编码，则基于所述第二音频帧生成丢包补偿数据；

根据所述第二音频帧的延迟数据和所述丢包补偿数据对所述解码数据进行平滑处理，以获取所述第一音频帧的播放数据。
根据权利要求8所述的方法，所述方法还包括：

若所述第一音频帧的编码模式与第二音频帧的编码模式不相同，且所述第一音频帧的编码模式为单描述编码，则基于所述第二音频帧生成丢包补偿数据；

根据所述丢包补偿数据对所述解码数据进行平滑处理，以获取所述解码数据对应的平滑结果；

根据所述丢包补偿数据和延迟样点数量对所述平滑结果进行延迟处理，以获取所述第一音频帧的播放数据；所述延迟样点数量为多描述编码的延迟样点数量。
根据权利要求9所述的方法，所述根据所述丢包补偿数据对所述解码数据进行平滑处理，以获取所述解码数据对应的平滑结果，包括：

将所述解码数据中的第一样点序列替换为所述丢包补偿数据中的第二样点序列，以获取第一替换结果；所述第一样点序列为所述解码数据的前第一数量个样点组成的样点序列，所述第一数量为第一预设数量与所述延迟样点数量的差值；所述第二样点序列为所述丢包补偿数据中索引值为所述延迟样点数量至所述第一预设数量的样点组成的样点序列；

基于第一窗函数对所述第一替换结果中的第三样点序列和所述丢包补偿数据中的第四样点序列进行加窗叠加，以获取所述解码数据对应的平滑结果，所述第三样点序列为所述第一替换结果中索引值为所述第一数量至所述第一数量与第二预设数量的和的样点组成的样点序列；所述第四样点序列为所述丢包补偿数据中索引值为所述第一预设数量至所述第一预设数量与第二预设数量的和的样点组成的样点序列。
根据权利要求9所述的方法，所述根据所述丢包补偿数据和延迟样点数量对所述平滑结果进行延迟处理，以获取所述第一音频帧的播放数据，包括：

获取第五样点序列，所述第五样点序列为所述丢包补偿数据的前所述延迟样点数量个样点组成的样点序列；

将所述第五样点序列拼接于所述平滑结果之前，以获取第一拼接结果；

删除所述第一拼接结果中的第六样点序列，以获取所述第一音频帧的播放数据，所述第六样点序列为所述第一拼接结果的后所述延迟样点数量个样点组成的样点序列。
根据权利要求9所述的方法，所述根据所述第二音频帧的延迟数据和所述丢包补偿数据对所述解码数据进行平滑处理，以获取所述第一音频帧的播放数据，包括：

将所述解码数据中的第七样点序列替换为所述延迟数据，以获取第二替换结果；所述第七样点序列为所述解码数据中的前所述延迟样点数量个样点组成的样点序列；

基于第二窗函数对所述第二替换结果中的第八样点序列和所述丢包补偿数据中的第九样点序列进行加窗叠加，以获取所述第一音频帧的播放数据，所述第八样点序列为所述第二替换结果中索引值为所述延迟样点数量至所述延迟样点数量与第三预设数量的和的样点组成的样点序列；所述第九样点序列为所述丢包补偿数据的前所述第三预设数量个样点组成的样点序列。
根据权利要求8-12任一项所述的方法，所述方法还包括：

若所述第一音频帧的编码模式与第二音频帧的编码模式相同，且所述第一音频帧的编码模式为单描述编码，则根据所述第二音频帧的延迟数据和所述延迟样点数量对所述解码数据进行延迟处理，以获取所述第一音频帧的播放数据。
根据权利要求13所述的方法，所述根据所述第二音频帧的延迟数据和所述延迟样点数量对所述解码数据进行延迟处理，以获取所述第一音频帧的播放数据，包括：

将所述延迟数据拼接于所述解码数据之前，以获取第二拼接结果；

删除所述第二拼接结果中的第十样点序列，以获取所述第一音频帧的播放数据，所述第十样点序列为所述第二拼接结果的后所述延迟样点数量个样点组成的样点序列。
一种音频数据的编码装置，包括：

确定单元，用于确定第一音频帧的编码模式；

判断单元，用于判断所述第一音频帧的编码模式与第二音频帧的编码模式是否相同；所述第二音频帧为所述第一音频帧的前一个音频帧；

生成单元，用于在所述第一音频帧的编码模式与第二音频帧的编码模式不相同且所述第一音频帧的编码模式为多描述编码的情况下，根据第一数据、第二数据以及第一延迟，生成第三数据；所述第一数据为对所述第一音频帧的原始音频数据进行分频得到的低频数据，所述第二数据为对所述第二音频帧的原始音频数据进行分频得到的低频数据，所述第一延迟为所述多描述编码的编码延迟；

编码单元，用于对所述第三数据进行多描述编码，以获取所述第一音频帧的编码数据。
一种音频数据的解码装置，包括：

确定单元，用于根据第一音频帧的编码数据确定第一音频帧的编码模式；

解码单元，用于根据所述编码模式对所述第一音频帧的编码数据进行解码，获取解码数据；

判断单元，用于判断所述第一音频帧的编码模式与第二音频帧的编码模式是否相同；所述第二音频帧为所述第一音频帧的前一个音频帧；

处理单元，用于在所述第一音频帧的编码模式与第二音频帧的编码模式不相同且所述第一音频帧的编码模式为多描述编码的情况下，基于所述第二音频帧生成丢包补偿数据；以及根据所述第二音频帧的延迟数据和所述丢包补偿数据对所述解码数据进行平滑处理，以获取所述第一音频帧的播放数据。
一种电子设备，包括：存储器和处理器，所述存储器用于存储计算机程序；所述处理器用于在执行计算机程序时，使得所述电子设备实现权利要求1-7任一项所述的音频数据的编码方法或权利要求8-14任一项所述的音频数据的解码方法。
一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，当所述计算机程序被计算设备执行时，使得所述计算设备实现权利要求1-7任一项所述的音频数据的编码方法或权利要求8-14任一项所述的音频数据的解码方法。
一种计算机程序产品，所述计算机程序产品包括计算机程序，所述计算机程序被处理器执行时实现权利要求1-7任一项所述的音频数据的编码方法或权利要求8-14任一项所述的音频数据的解码方法。