CN115662448B

CN115662448B - 音频数据编码格式转换的方法及装置

Info

Publication number: CN115662448B
Application number: CN202211268426.6A
Authority: CN
Inventors: 廖国波
Original assignee: Shenzhen Super Times Software Co ltd
Current assignee: Shenzhen Super Times Software Co ltd
Priority date: 2022-10-17
Filing date: 2022-10-17
Publication date: 2023-10-20
Anticipated expiration: 2042-10-17
Also published as: CN115662448A

Abstract

本发明公开了一种音频数据编码格式转换的方法及装置，包括：若接收到的待播放音频数据为无法识别的编码格式，获取待播放音频数据的回程链路路径以及压缩率；根据待播放音频数据的压缩率，生成最小化量化噪声矩阵；根据回程链路路径向运营商的电信网络结构的中间层请求下发用于对待播放音频数据解码的目标解码器，并基于运营商的电信网络结构的中间层下发的目标解码器，根据最小化量化噪声矩阵，将对应音频帧带最小化量化噪声解码得到待编码音频帧序列；根据待编码音频帧序列中的音频帧的熵确定线性变换的差分表示，根据目标编码器和线性变换的差分表示对待编码音频帧序列进行编码，得到目标编码格式音频数据。避免音频数据丢帧，提高了音质。

Description

音频数据编码格式转换的方法及装置

技术领域

本发明涉及电通信技术领域，具体为一种音频数据编码格式转换的方法及装置。

背景技术

在音频播放的场景中，通常需要将不同编码格式的音频数据转换为当前设备能够识别的格式，通常是将不可识别的编码格式的音频数据进行解码处理，得到对应的PCM(Pulse Code Modulation，脉冲编码调制)格式的原始音频数据，进而将原始音频数据进行编码，获得当前设备能够识别的编码格式的音频数据，虽然减少了音频数据编码格式转换的工作量，缩短了音频数据编码格式的转换周期，提高了音频数据编码格式转换的效率，但是导致音频数据存在丢帧，导致音质存在缺损。

发明内容

针对现有技术中音频数据存在丢帧，导致音质存在缺损的技术问题，本发明提供了一种音频数据编码格式转换的方法及装置。

为实现以上目的，本发明通过以下技术方案予以实现：

本发明实施例第一方面，提供一种音频数据编码格式转换的方法，所述方法包括：

在确定接收到的待播放音频数据为无法识别的编码格式的情况下，获取所述待播放音频数据的回程链路路径以及压缩率，所述回程链路路径用于表征所述待播放音频数据在运营商的电信网络结构的中间层的回程传输链接地址；

根据所述待播放音频数据的压缩率，生成针对所述待播放音频数据的进行解码的最小化量化噪声矩阵；

根据所述回程链路路径向所述运营商的电信网络结构的中间层请求下发用于对所述待播放音频数据解码的目标解码器，并基于所述运营商的电信网络结构的中间层下发的所述目标解码器，根据所述最小化量化噪声矩阵，将所述待播放音频数据中对应的音频帧进行带最小化量化噪声解码，得到待编码音频帧序列；

根据所述待编码音频帧序列中的音频帧的熵，确定线性变换的差分表示，并基于能够识别的编码方式对应的目标编码器，根据线性变换的差分表示对所述待编码音频帧序列进行编码，得到目标编码格式音频数据。

优选地，所述基于所述运营商的电信网络结构的中间层下发的所述目标解码器，根据所述最小化量化噪声矩阵，将所述待播放音频数据中对应的音频帧进行带最小化量化噪声解码，得到待编码音频帧的步骤，包括：

按照预设矩阵列数，将所述待播放音频数据按照音频帧顺序逐帧进行排列，构建得到音频数据矩阵，并求取所述音频数据矩阵对应的雅可比矩阵；

根据所述音频数据矩阵对应的雅可比矩阵表征的所述待播放音频数据在音频帧间的最优线性逼近，预测音频帧间的相似性检查结果；

基于所述运营商的电信网络结构的中间层下发的所述目标解码器，根据所述最小化量化噪声矩阵以及所述音频帧间的相似性检查结果，将所述待播放音频数据中对应的音频帧进行带最小化量化噪声解码，得到待编码音频帧。

优选地，所述基于所述运营商的电信网络结构的中间层下发的所述目标解码器，根据所述最小化量化噪声矩阵以及所述音频帧间的相似性检查结果，将所述待播放音频数据中对应的音频帧进行带最小化量化噪声解码，得到待编码音频帧的步骤，包括：

根据所述音频帧间的相似性检查结果表征的相邻音频帧之间的相似度，得到相似度序列；

根据所述最小化量化噪声矩阵的行列数，将所述相似度序列构建成与所述最小化量化噪声矩阵同型的共生相似度矩阵，其中，不够的行列用0补充；

计算所述最小化量化噪声矩阵与所述共生相似度矩阵的哈达玛积，得到针对所述待播放音频数据对应的目标解码矩阵；

基于所述运营商的电信网络结构的中间层下发的所述目标解码器，根据所述目标解码矩阵，对所述待播放音频数据中对应的音频帧进行解码，得到待编码音频帧。

优选地，所述根据所述待播放音频数据的压缩率，生成针对所述待播放音频数据的进行解码的最小化量化噪声矩阵的步骤，包括：

根据所述待播放音频数据的压缩率，确定压缩功率值，并根据所述压缩功率值确定解码过程中的补偿功率值；

假设噪声补偿数据服从高斯分布，则根据所述补偿功率值得到噪声期望值；

计算所述噪声期望值的平均值和方差，并将各所述噪声期望值代入正态分布公式，得到噪声序列，并根据所述噪声序列生成针对所述待播放音频数据的进行解码的最小化量化噪声矩阵。

优选地，所述基于能够识别的编码方式对应的目标编码器，根据线性变换的差分表示对所述待编码音频帧序列进行编码，得到目标编码格式音频数据的步骤，包括：

根据线性变换的差分表示，确定所述待编码音频帧序列中相邻音频帧在帧间编码后的第一数据量，以及所述相邻音频帧分别进行帧内编码后的第二数据量；

针对任意音频帧，若对应的所有所述第一数据量均大于等于对应的所述第二数据量，基于能够识别的编码方式对应的目标编码器，对该音频帧进行帧内编码，或者，若对应的任一所述第一数据量小于应的所述第二数据量，基于能够识别的编码方式对应的目标编码器，将该音频帧与相邻的音频帧进行帧间编码，得到目标编码格式音频数据。

优选地，所述针对任意音频帧，若对应的所有所述第一数据量均大于等于对应的所述第二数据量，基于能够识别的编码方式对应的目标编码器，对该音频帧进行帧内编码，或者，若对应的任一所述第一数据量小于应的所述第二数据量，基于能够识别的编码方式对应的目标编码器，将该音频帧与相邻的音频帧进行帧间编码，得到目标编码格式音频数据的步骤，包括：

针对任意音频帧，按照逐帧进行编码的原则，确定该音频帧与相邻的上一音频帧对应的帧间编码后的第一数据量是否大于等于对该音频帧和所述相邻的上一音频帧分别进行帧内编码后的第二数据量，其中，第二数据量是该音频帧帧内编码后的数据量与所述相邻的上一音频帧帧内编码后的数据量之和；

若确定该音频帧与相邻的上一音频帧对应的帧间编码后的第一数据量大于等于对该音频帧和所述相邻的上一音频帧分别进行帧内编码后的第二数据量，则确定该音频帧与相邻的下一音频帧对应的帧间编码后的第一数据量是否大于等于对该音频帧和所述相邻的下一音频帧分别进行帧内编码后的第二数据量；

若确定该音频帧与相邻的下一音频帧对应的帧间编码后的第一数据量大于等于对该音频帧和所述相邻的下一音频帧分别进行帧内编码后的第二数据量，则基于能够识别的编码方式对应的目标编码器，对该音频帧进行帧内编码；

若确定该音频帧与相邻的上一音频帧对应的帧间编码后的第一数据量小于对该音频帧和所述相邻的上一音频帧分别进行帧内编码后的第二数据量，基于能够识别的编码方式对应的目标编码器，将该音频帧与相邻的音频帧进行帧间编码，得到目标编码格式音频数据。

本发明实施例第二方面，提供一种音频数据编码格式转换的装置，所述装置包括：

获取模块，被配置为在确定接收到的待播放音频数据为无法识别的编码格式的情况下，获取所述待播放音频数据的回程链路路径以及压缩率，所述回程链路路径用于表征所述待播放音频数据在运营商的电信网络结构的中间层的回程传输链接地址；

生成模块，被配置为根据所述待播放音频数据的压缩率，生成针对所述待播放音频数据的进行解码的最小化量化噪声矩阵；

解码模块，被配置为根据所述回程链路路径向所述运营商的电信网络结构的中间层请求下发用于对所述待播放音频数据解码的目标解码器，并基于所述运营商的电信网络结构的中间层下发的所述目标解码器，根据所述最小化量化噪声矩阵，将所述待播放音频数据中对应的音频帧进行带最小化量化噪声解码，得到待编码音频帧序列；

编码模块，被配置为根据所述待编码音频帧序列中的音频帧的熵，确定线性变换的差分表示，并基于能够识别的编码方式对应的目标编码器，根据线性变换的差分表示对所述待编码音频帧序列进行编码，得到目标编码格式音频数据。

优选地，所述解码模块，包括：

构建子模块，被配置为按照预设矩阵列数，将所述待播放音频数据按照音频帧顺序逐帧进行排列，构建得到音频数据矩阵，并求取所述音频数据矩阵对应的雅可比矩阵；

预测子模块，被配置为根据所述音频数据矩阵对应的雅可比矩阵表征的所述待播放音频数据在音频帧间的最优线性逼近，预测音频帧间的相似性检查结果；

解码子模块，被配置为基于所述运营商的电信网络结构的中间层下发的所述目标解码器，根据所述最小化量化噪声矩阵以及所述音频帧间的相似性检查结果，将所述待播放音频数据中对应的音频帧进行带最小化量化噪声解码，得到待编码音频帧序列。

优选地，所述解码子模块，被配置为：

优选地，所述生成模块，被配置为：

优选地，所述编码模块，被配置为：

有益效果：

1、本发明提供了音频数据编码格式转换的方法及装置。与现有技术相比具备以下有益效果：

2、通过上述方案根据压缩率确定的最小化量化噪声矩阵可以降低压缩过程中对音质的损坏，并且播放待播放音频数据的设备由于不具备相应的解码器，无法进行解码后重新编码，所以可以从运营商的电信网络结构的中间层请求下发，避免解码器不准确造成的音频损坏。此外，根据待编码音频帧序列中的音频帧的熵确定线性变换的差分表示，进而根据线性变换的差分表示对待编码音频帧序列进行编码，可以保留相邻音频帧之间的特征，提供了目标编码格式音频数据的音质。

附图说明

图1是根据一示例性实施例示出的一种音频数据编码格式转换的方法的流程图。

图2是根据一示例性实施例示出的一种实现图1中步骤S13的方法的流程图。

图3是根据一示例性实施例示出的一种实现图2中步骤S133的方法的流程图。

图4是根据一示例性实施例示出的一种实现图1中步骤S12的方法的流程图。

图5是根据一示例性实施例示出的一种音频数据编码格式转换的装置的结构图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1，图1是根据一示例性实施例示出的一种音频数据编码格式转换的方法的流程图，本发明提供的音频数据编码格式转换的方法可以应用于中转终端设备，中转终端设备连接于运营商的电信网络结构的中间层与用户设备之间，也可以直接应用于用户设备，所述方法包括以下步骤。

步骤S11，在确定接收到的待播放音频数据为无法识别的编码格式的情况下，获取待播放音频数据的回程链路路径以及压缩率，回程链路路径用于表征待播放音频数据在运营商的电信网络结构的中间层的回程传输链接地址。

本公开实施例中，运营商的电信网络结构的中间层中存储有每一中编码格式对应的解码器。

步骤S12，根据待播放音频数据的压缩率，生成针对待播放音频数据的进行解码的最小化量化噪声矩阵。

步骤S13，根据回程链路路径向运营商的电信网络结构的中间层请求下发用于对待播放音频数据解码的目标解码器，并基于运营商的电信网络结构的中间层下发的目标解码器，根据最小化量化噪声矩阵，将待播放音频数据中对应的音频帧进行带最小化量化噪声解码，得到待编码音频帧序列。

其中，解码器可以使用线性预测系数对音频帧进行带最小化量化噪声解码，并根据AC信号对带最小化量化噪声解码后的音频帧进行混叠去除，并对去除混叠后得到的音频数据进行加窗处理，得到备用音频数据，进而将备用音频数据的音频帧依次排列，得到待编码音频帧序列。

步骤S14，根据待编码音频帧序列中的音频帧的熵，确定线性变换的差分表示，并基于能够识别的编码方式对应的目标编码器，根据线性变换的差分表示对待编码音频帧序列进行编码，得到目标编码格式音频数据。

上述技术方案根据压缩率确定的最小化量化噪声矩阵可以降低压缩过程中对音质的损坏，并且播放待播放音频数据的设备由于不具备相应的解码器，无法进行解码后重新编码，所以可以从运营商的电信网络结构的中间层请求下发，避免解码器不准确造成的音频损坏。此外，根据待编码音频帧序列中的音频帧的熵确定线性变换的差分表示，进而根据线性变换的差分表示对待编码音频帧序列进行编码，可以保留相邻音频帧之间的特征，提供了目标编码格式音频数据的音质。

在其中一种实施方式中，参见图2所示，在步骤S13中，基于运营商的电信网络结构的中间层下发的目标解码器，根据最小化量化噪声矩阵，将待播放音频数据中对应的音频帧进行带最小化量化噪声解码，得到待编码音频帧的步骤，包括：

在步骤S131中，按照预设矩阵列数，将待播放音频数据按照音频帧顺序逐帧进行排列，构建得到音频数据矩阵，并求取音频数据矩阵对应的雅可比矩阵。

在步骤S132中，根据音频数据矩阵对应的雅可比矩阵表征的待播放音频数据在音频帧间的最优线性逼近，预测音频帧间的相似性检查结果。

在步骤S133中，基于运营商的电信网络结构的中间层下发的目标解码器，根据最小化量化噪声矩阵以及音频帧间的相似性检查结果，将待播放音频数据中对应的音频帧进行带最小化量化噪声解码，得到待编码音频帧。

在其中一种实施方式中，参见图3所示，在步骤S133中，基于运营商的电信网络结构的中间层下发的目标解码器，根据最小化量化噪声矩阵以及音频帧间的相似性检查结果，将待播放音频数据中对应的音频帧进行带最小化量化噪声解码，得到待编码音频帧的步骤，包括：

在步骤S1331中，根据音频帧间的相似性检查结果表征的相邻音频帧之间的相似度，得到相似度序列。

在步骤S1332中，根据最小化量化噪声矩阵的行列数，将相似度序列构建成与最小化量化噪声矩阵同型的共生相似度矩阵，其中，不够的行列用0补充。

在步骤S1333中，计算最小化量化噪声矩阵与共生相似度矩阵的哈达玛积，得到针对待播放音频数据对应的目标解码矩阵。

在步骤S1334中，基于运营商的电信网络结构的中间层下发的目标解码器，根据目标解码矩阵，对待播放音频数据中对应的音频帧进行解码，得到待编码音频帧。

在其中一种实施方式中，参见图4所示，在步骤S12中，根据待播放音频数据的压缩率，生成针对待播放音频数据的进行解码的最小化量化噪声矩阵的步骤，包括：

在步骤S121中，根据待播放音频数据的压缩率，确定压缩功率值，并根据压缩功率值确定解码过程中的补偿功率值。

在步骤S122中，假设噪声补偿数据服从高斯分布，则根据补偿功率值得到噪声期望值。

在步骤S123中，计算噪声期望值的平均值和方差，并将各噪声期望值代入正态分布公式，得到噪声序列，并根据噪声序列生成针对待播放音频数据的进行解码的最小化量化噪声矩阵。

在其中一种实施方式中，在步骤S14中，基于能够识别的编码方式对应的目标编码器，根据线性变换的差分表示对待编码音频帧序列进行编码，得到目标编码格式音频数据的步骤，包括：

根据线性变换的差分表示，确定待编码音频帧序列中相邻音频帧在帧间编码后的第一数据量，以及相邻音频帧分别进行帧内编码后的第二数据量。

针对任意音频帧，若对应的所有第一数据量均大于等于对应的第二数据量，基于能够识别的编码方式对应的目标编码器，对该音频帧进行帧内编码，或者，若对应的任一第一数据量小于应的第二数据量，基于能够识别的编码方式对应的目标编码器，将该音频帧与相邻的音频帧进行帧间编码，得到目标编码格式音频数据。

在其中一种实施方式中，针对任意音频帧，若对应的所有第一数据量均大于等于对应的第二数据量，基于能够识别的编码方式对应的目标编码器，对该音频帧进行帧内编码，或者，若对应的任一第一数据量小于应的第二数据量，基于能够识别的编码方式对应的目标编码器，将该音频帧与相邻的音频帧进行帧间编码，得到目标编码格式音频数据的步骤，包括：

针对任意音频帧，按照逐帧进行编码的原则，确定该音频帧与相邻的上一音频帧对应的帧间编码后的第一数据量是否大于等于对该音频帧和相邻的上一音频帧分别进行帧内编码后的第二数据量，其中，第二数据量是该音频帧帧内编码后的数据量与相邻的上一音频帧帧内编码后的数据量之和。

若确定该音频帧与相邻的上一音频帧对应的帧间编码后的第一数据量大于等于对该音频帧和相邻的上一音频帧分别进行帧内编码后的第二数据量，则确定该音频帧与相邻的下一音频帧对应的帧间编码后的第一数据量是否大于等于对该音频帧和相邻的下一音频帧分别进行帧内编码后的第二数据量。

若确定该音频帧与相邻的下一音频帧对应的帧间编码后的第一数据量大于等于对该音频帧和相邻的下一音频帧分别进行帧内编码后的第二数据量，则基于能够识别的编码方式对应的目标编码器，对该音频帧进行帧内编码。

若确定该音频帧与相邻的上一音频帧对应的帧间编码后的第一数据量小于对该音频帧和相邻的上一音频帧分别进行帧内编码后的第二数据量，基于能够识别的编码方式对应的目标编码器，将该音频帧与相邻的音频帧进行帧间编码，得到目标编码格式音频数据。

本发明实施例还提供一种音频数据编码格式转换的装置，参见图5所示，所述装置500包括：

获取模块510，被配置为在确定接收到的待播放音频数据为无法识别的编码格式的情况下，获取所述待播放音频数据的回程链路路径以及压缩率，所述回程链路路径用于表征所述待播放音频数据在运营商的电信网络结构的中间层的回程传输链接地址；

生成模块520，被配置为根据所述待播放音频数据的压缩率，生成针对所述待播放音频数据的进行解码的最小化量化噪声矩阵；

解码模块530，被配置为根据所述回程链路路径向所述运营商的电信网络结构的中间层请求下发用于对所述待播放音频数据解码的目标解码器，并基于所述运营商的电信网络结构的中间层下发的所述目标解码器，根据所述最小化量化噪声矩阵，将所述待播放音频数据中对应的音频帧进行带最小化量化噪声解码，得到待编码音频帧序列；

编码模块540，被配置为根据所述待编码音频帧序列中的音频帧的熵，确定线性变换的差分表示，并基于能够识别的编码方式对应的目标编码器，根据线性变换的差分表示对所述待编码音频帧序列进行编码，得到目标编码格式音频数据。

上述装置根据压缩率确定的最小化量化噪声矩阵可以降低压缩过程中对音质的损坏，并且播放待播放音频数据的设备由于不具备相应的解码器，无法进行解码后重新编码，所以可以从运营商的电信网络结构的中间层请求下发，避免解码器不准确造成的音频损坏。此外，根据待编码音频帧序列中的音频帧的熵确定线性变换的差分表示，进而根据线性变换的差分表示对待编码音频帧序列进行编码，可以保留相邻音频帧之间的特征，提供了目标编码格式音频数据的音质。

优选地，所述解码模块530，包括：

优选地，所述解码子模块，被配置为：

优选地，所述生成模块520，被配置为：

优选地，所述编码模块540，被配置为：

以上述依据本申请的理想实施例为启示，通过上述的说明内容，相关工作人员完全可以在不偏离本项申请技术思想的范围内，进行多样的变更以及修改。本项申请的技术性范围并不局限于说明书上的内容，必须要根据权利要求范围来确定其技术性范围。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。

Claims

1.一种音频数据编码格式转换的方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述基于所述运营商的电信网络结构的中间层下发的所述目标解码器，根据所述最小化量化噪声矩阵，将所述待播放音频数据中对应的音频帧进行带最小化量化噪声解码，得到待编码音频帧的步骤，包括：

3.根据权利要求2所述的方法，其特征在于，所述基于所述运营商的电信网络结构的中间层下发的所述目标解码器，根据所述最小化量化噪声矩阵以及所述音频帧间的相似性检查结果，将所述待播放音频数据中对应的音频帧进行带最小化量化噪声解码，得到待编码音频帧的步骤，包括：

4.根据权利要求1所述的方法，其特征在于，所述根据所述待播放音频数据的压缩率，生成针对所述待播放音频数据的进行解码的最小化量化噪声矩阵的步骤，包括：

5.根据权利要求1-4中任一项所述的方法，其特征在于，所述基于能够识别的编码方式对应的目标编码器，根据线性变换的差分表示对所述待编码音频帧序列进行编码，得到目标编码格式音频数据的步骤，包括：

6.根据权利要求5所述的方法，其特征在于，所述针对任意音频帧，若对应的所有所述第一数据量均大于等于对应的所述第二数据量，基于能够识别的编码方式对应的目标编码器，对该音频帧进行帧内编码，或者，若对应的任一所述第一数据量小于应的所述第二数据量，基于能够识别的编码方式对应的目标编码器，将该音频帧与相邻的音频帧进行帧间编码，得到目标编码格式音频数据的步骤，包括：

7.一种音频数据编码格式转换的装置，其特征在于，所述装置包括：

8.根据权利要求7所述的装置，其特征在于，所述解码模块，包括：

9.根据权利要求8所述的装置，其特征在于，所述解码子模块，被配置为：

10.根据权利要求7所述的装置，其特征在于，所述生成模块，被配置为：