CN115662448B - 音频数据编码格式转换的方法及装置 - Google Patents
音频数据编码格式转换的方法及装置 Download PDFInfo
- Publication number
- CN115662448B CN115662448B CN202211268426.6A CN202211268426A CN115662448B CN 115662448 B CN115662448 B CN 115662448B CN 202211268426 A CN202211268426 A CN 202211268426A CN 115662448 B CN115662448 B CN 115662448B
- Authority
- CN
- China
- Prior art keywords
- audio
- frame
- data
- played
- audio data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明公开了一种音频数据编码格式转换的方法及装置,包括:若接收到的待播放音频数据为无法识别的编码格式,获取待播放音频数据的回程链路路径以及压缩率;根据待播放音频数据的压缩率,生成最小化量化噪声矩阵;根据回程链路路径向运营商的电信网络结构的中间层请求下发用于对待播放音频数据解码的目标解码器,并基于运营商的电信网络结构的中间层下发的目标解码器,根据最小化量化噪声矩阵,将对应音频帧带最小化量化噪声解码得到待编码音频帧序列;根据待编码音频帧序列中的音频帧的熵确定线性变换的差分表示,根据目标编码器和线性变换的差分表示对待编码音频帧序列进行编码,得到目标编码格式音频数据。避免音频数据丢帧,提高了音质。
Description
技术领域
本发明涉及电通信技术领域,具体为一种音频数据编码格式转换的方法及装置。
背景技术
在音频播放的场景中,通常需要将不同编码格式的音频数据转换为当前设备能够识别的格式,通常是将不可识别的编码格式的音频数据进行解码处理,得到对应的PCM(Pulse Code Modulation,脉冲编码调制)格式的原始音频数据,进而将原始音频数据进行编码,获得当前设备能够识别的编码格式的音频数据,虽然减少了音频数据编码格式转换的工作量,缩短了音频数据编码格式的转换周期,提高了音频数据编码格式转换的效率,但是导致音频数据存在丢帧,导致音质存在缺损。
发明内容
针对现有技术中音频数据存在丢帧,导致音质存在缺损的技术问题,本发明提供了一种音频数据编码格式转换的方法及装置。
为实现以上目的,本发明通过以下技术方案予以实现:
本发明实施例第一方面,提供一种音频数据编码格式转换的方法,所述方法包括:
在确定接收到的待播放音频数据为无法识别的编码格式的情况下,获取所述待播放音频数据的回程链路路径以及压缩率,所述回程链路路径用于表征所述待播放音频数据在运营商的电信网络结构的中间层的回程传输链接地址;
根据所述待播放音频数据的压缩率,生成针对所述待播放音频数据的进行解码的最小化量化噪声矩阵;
根据所述回程链路路径向所述运营商的电信网络结构的中间层请求下发用于对所述待播放音频数据解码的目标解码器,并基于所述运营商的电信网络结构的中间层下发的所述目标解码器,根据所述最小化量化噪声矩阵,将所述待播放音频数据中对应的音频帧进行带最小化量化噪声解码,得到待编码音频帧序列;
根据所述待编码音频帧序列中的音频帧的熵,确定线性变换的差分表示,并基于能够识别的编码方式对应的目标编码器,根据线性变换的差分表示对所述待编码音频帧序列进行编码,得到目标编码格式音频数据。
优选地,所述基于所述运营商的电信网络结构的中间层下发的所述目标解码器,根据所述最小化量化噪声矩阵,将所述待播放音频数据中对应的音频帧进行带最小化量化噪声解码,得到待编码音频帧的步骤,包括:
按照预设矩阵列数,将所述待播放音频数据按照音频帧顺序逐帧进行排列,构建得到音频数据矩阵,并求取所述音频数据矩阵对应的雅可比矩阵;
根据所述音频数据矩阵对应的雅可比矩阵表征的所述待播放音频数据在音频帧间的最优线性逼近,预测音频帧间的相似性检查结果;
基于所述运营商的电信网络结构的中间层下发的所述目标解码器,根据所述最小化量化噪声矩阵以及所述音频帧间的相似性检查结果,将所述待播放音频数据中对应的音频帧进行带最小化量化噪声解码,得到待编码音频帧。
优选地,所述基于所述运营商的电信网络结构的中间层下发的所述目标解码器,根据所述最小化量化噪声矩阵以及所述音频帧间的相似性检查结果,将所述待播放音频数据中对应的音频帧进行带最小化量化噪声解码,得到待编码音频帧的步骤,包括:
根据所述音频帧间的相似性检查结果表征的相邻音频帧之间的相似度,得到相似度序列;
根据所述最小化量化噪声矩阵的行列数,将所述相似度序列构建成与所述最小化量化噪声矩阵同型的共生相似度矩阵,其中,不够的行列用0补充;
计算所述最小化量化噪声矩阵与所述共生相似度矩阵的哈达玛积,得到针对所述待播放音频数据对应的目标解码矩阵;
基于所述运营商的电信网络结构的中间层下发的所述目标解码器,根据所述目标解码矩阵,对所述待播放音频数据中对应的音频帧进行解码,得到待编码音频帧。
优选地,所述根据所述待播放音频数据的压缩率,生成针对所述待播放音频数据的进行解码的最小化量化噪声矩阵的步骤,包括:
根据所述待播放音频数据的压缩率,确定压缩功率值,并根据所述压缩功率值确定解码过程中的补偿功率值;
假设噪声补偿数据服从高斯分布,则根据所述补偿功率值得到噪声期望值;
计算所述噪声期望值的平均值和方差,并将各所述噪声期望值代入正态分布公式,得到噪声序列,并根据所述噪声序列生成针对所述待播放音频数据的进行解码的最小化量化噪声矩阵。
优选地,所述基于能够识别的编码方式对应的目标编码器,根据线性变换的差分表示对所述待编码音频帧序列进行编码,得到目标编码格式音频数据的步骤,包括:
根据线性变换的差分表示,确定所述待编码音频帧序列中相邻音频帧在帧间编码后的第一数据量,以及所述相邻音频帧分别进行帧内编码后的第二数据量;
针对任意音频帧,若对应的所有所述第一数据量均大于等于对应的所述第二数据量,基于能够识别的编码方式对应的目标编码器,对该音频帧进行帧内编码,或者,若对应的任一所述第一数据量小于应的所述第二数据量,基于能够识别的编码方式对应的目标编码器,将该音频帧与相邻的音频帧进行帧间编码,得到目标编码格式音频数据。
优选地,所述针对任意音频帧,若对应的所有所述第一数据量均大于等于对应的所述第二数据量,基于能够识别的编码方式对应的目标编码器,对该音频帧进行帧内编码,或者,若对应的任一所述第一数据量小于应的所述第二数据量,基于能够识别的编码方式对应的目标编码器,将该音频帧与相邻的音频帧进行帧间编码,得到目标编码格式音频数据的步骤,包括:
针对任意音频帧,按照逐帧进行编码的原则,确定该音频帧与相邻的上一音频帧对应的帧间编码后的第一数据量是否大于等于对该音频帧和所述相邻的上一音频帧分别进行帧内编码后的第二数据量,其中,第二数据量是该音频帧帧内编码后的数据量与所述相邻的上一音频帧帧内编码后的数据量之和;
若确定该音频帧与相邻的上一音频帧对应的帧间编码后的第一数据量大于等于对该音频帧和所述相邻的上一音频帧分别进行帧内编码后的第二数据量,则确定该音频帧与相邻的下一音频帧对应的帧间编码后的第一数据量是否大于等于对该音频帧和所述相邻的下一音频帧分别进行帧内编码后的第二数据量;
若确定该音频帧与相邻的下一音频帧对应的帧间编码后的第一数据量大于等于对该音频帧和所述相邻的下一音频帧分别进行帧内编码后的第二数据量,则基于能够识别的编码方式对应的目标编码器,对该音频帧进行帧内编码;
若确定该音频帧与相邻的上一音频帧对应的帧间编码后的第一数据量小于对该音频帧和所述相邻的上一音频帧分别进行帧内编码后的第二数据量,基于能够识别的编码方式对应的目标编码器,将该音频帧与相邻的音频帧进行帧间编码,得到目标编码格式音频数据。
本发明实施例第二方面,提供一种音频数据编码格式转换的装置,所述装置包括:
获取模块,被配置为在确定接收到的待播放音频数据为无法识别的编码格式的情况下,获取所述待播放音频数据的回程链路路径以及压缩率,所述回程链路路径用于表征所述待播放音频数据在运营商的电信网络结构的中间层的回程传输链接地址;
生成模块,被配置为根据所述待播放音频数据的压缩率,生成针对所述待播放音频数据的进行解码的最小化量化噪声矩阵;
解码模块,被配置为根据所述回程链路路径向所述运营商的电信网络结构的中间层请求下发用于对所述待播放音频数据解码的目标解码器,并基于所述运营商的电信网络结构的中间层下发的所述目标解码器,根据所述最小化量化噪声矩阵,将所述待播放音频数据中对应的音频帧进行带最小化量化噪声解码,得到待编码音频帧序列;
编码模块,被配置为根据所述待编码音频帧序列中的音频帧的熵,确定线性变换的差分表示,并基于能够识别的编码方式对应的目标编码器,根据线性变换的差分表示对所述待编码音频帧序列进行编码,得到目标编码格式音频数据。
优选地,所述解码模块,包括:
构建子模块,被配置为按照预设矩阵列数,将所述待播放音频数据按照音频帧顺序逐帧进行排列,构建得到音频数据矩阵,并求取所述音频数据矩阵对应的雅可比矩阵;
预测子模块,被配置为根据所述音频数据矩阵对应的雅可比矩阵表征的所述待播放音频数据在音频帧间的最优线性逼近,预测音频帧间的相似性检查结果;
解码子模块,被配置为基于所述运营商的电信网络结构的中间层下发的所述目标解码器,根据所述最小化量化噪声矩阵以及所述音频帧间的相似性检查结果,将所述待播放音频数据中对应的音频帧进行带最小化量化噪声解码,得到待编码音频帧序列。
优选地,所述解码子模块,被配置为:
根据所述音频帧间的相似性检查结果表征的相邻音频帧之间的相似度,得到相似度序列;
根据所述最小化量化噪声矩阵的行列数,将所述相似度序列构建成与所述最小化量化噪声矩阵同型的共生相似度矩阵,其中,不够的行列用0补充;
计算所述最小化量化噪声矩阵与所述共生相似度矩阵的哈达玛积,得到针对所述待播放音频数据对应的目标解码矩阵;
基于所述运营商的电信网络结构的中间层下发的所述目标解码器,根据所述目标解码矩阵,对所述待播放音频数据中对应的音频帧进行解码,得到待编码音频帧。
优选地,所述生成模块,被配置为:
根据所述待播放音频数据的压缩率,确定压缩功率值,并根据所述压缩功率值确定解码过程中的补偿功率值;
假设噪声补偿数据服从高斯分布,则根据所述补偿功率值得到噪声期望值;
计算所述噪声期望值的平均值和方差,并将各所述噪声期望值代入正态分布公式,得到噪声序列,并根据所述噪声序列生成针对所述待播放音频数据的进行解码的最小化量化噪声矩阵。
优选地,所述编码模块,被配置为:
根据线性变换的差分表示,确定所述待编码音频帧序列中相邻音频帧在帧间编码后的第一数据量,以及所述相邻音频帧分别进行帧内编码后的第二数据量;
针对任意音频帧,若对应的所有所述第一数据量均大于等于对应的所述第二数据量,基于能够识别的编码方式对应的目标编码器,对该音频帧进行帧内编码,或者,若对应的任一所述第一数据量小于应的所述第二数据量,基于能够识别的编码方式对应的目标编码器,将该音频帧与相邻的音频帧进行帧间编码,得到目标编码格式音频数据。
优选地,所述编码模块,被配置为:
针对任意音频帧,按照逐帧进行编码的原则,确定该音频帧与相邻的上一音频帧对应的帧间编码后的第一数据量是否大于等于对该音频帧和所述相邻的上一音频帧分别进行帧内编码后的第二数据量,其中,第二数据量是该音频帧帧内编码后的数据量与所述相邻的上一音频帧帧内编码后的数据量之和;
若确定该音频帧与相邻的上一音频帧对应的帧间编码后的第一数据量大于等于对该音频帧和所述相邻的上一音频帧分别进行帧内编码后的第二数据量,则确定该音频帧与相邻的下一音频帧对应的帧间编码后的第一数据量是否大于等于对该音频帧和所述相邻的下一音频帧分别进行帧内编码后的第二数据量;
若确定该音频帧与相邻的下一音频帧对应的帧间编码后的第一数据量大于等于对该音频帧和所述相邻的下一音频帧分别进行帧内编码后的第二数据量,则基于能够识别的编码方式对应的目标编码器,对该音频帧进行帧内编码;
若确定该音频帧与相邻的上一音频帧对应的帧间编码后的第一数据量小于对该音频帧和所述相邻的上一音频帧分别进行帧内编码后的第二数据量,基于能够识别的编码方式对应的目标编码器,将该音频帧与相邻的音频帧进行帧间编码,得到目标编码格式音频数据。
有益效果:
1、本发明提供了音频数据编码格式转换的方法及装置。与现有技术相比具备以下有益效果:
2、通过上述方案根据压缩率确定的最小化量化噪声矩阵可以降低压缩过程中对音质的损坏,并且播放待播放音频数据的设备由于不具备相应的解码器,无法进行解码后重新编码,所以可以从运营商的电信网络结构的中间层请求下发,避免解码器不准确造成的音频损坏。此外,根据待编码音频帧序列中的音频帧的熵确定线性变换的差分表示,进而根据线性变换的差分表示对待编码音频帧序列进行编码,可以保留相邻音频帧之间的特征,提供了目标编码格式音频数据的音质。
附图说明
图1是根据一示例性实施例示出的一种音频数据编码格式转换的方法的流程图。
图2是根据一示例性实施例示出的一种实现图1中步骤S13的方法的流程图。
图3是根据一示例性实施例示出的一种实现图2中步骤S133的方法的流程图。
图4是根据一示例性实施例示出的一种实现图1中步骤S12的方法的流程图。
图5是根据一示例性实施例示出的一种音频数据编码格式转换的装置的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,图1是根据一示例性实施例示出的一种音频数据编码格式转换的方法的流程图,本发明提供的音频数据编码格式转换的方法可以应用于中转终端设备,中转终端设备连接于运营商的电信网络结构的中间层与用户设备之间,也可以直接应用于用户设备,所述方法包括以下步骤。
步骤S11,在确定接收到的待播放音频数据为无法识别的编码格式的情况下,获取待播放音频数据的回程链路路径以及压缩率,回程链路路径用于表征待播放音频数据在运营商的电信网络结构的中间层的回程传输链接地址。
本公开实施例中,运营商的电信网络结构的中间层中存储有每一中编码格式对应的解码器。
步骤S12,根据待播放音频数据的压缩率,生成针对待播放音频数据的进行解码的最小化量化噪声矩阵。
步骤S13,根据回程链路路径向运营商的电信网络结构的中间层请求下发用于对待播放音频数据解码的目标解码器,并基于运营商的电信网络结构的中间层下发的目标解码器,根据最小化量化噪声矩阵,将待播放音频数据中对应的音频帧进行带最小化量化噪声解码,得到待编码音频帧序列。
其中,解码器可以使用线性预测系数对音频帧进行带最小化量化噪声解码,并根据AC信号对带最小化量化噪声解码后的音频帧进行混叠去除,并对去除混叠后得到的音频数据进行加窗处理,得到备用音频数据,进而将备用音频数据的音频帧依次排列,得到待编码音频帧序列。
步骤S14,根据待编码音频帧序列中的音频帧的熵,确定线性变换的差分表示,并基于能够识别的编码方式对应的目标编码器,根据线性变换的差分表示对待编码音频帧序列进行编码,得到目标编码格式音频数据。
上述技术方案根据压缩率确定的最小化量化噪声矩阵可以降低压缩过程中对音质的损坏,并且播放待播放音频数据的设备由于不具备相应的解码器,无法进行解码后重新编码,所以可以从运营商的电信网络结构的中间层请求下发,避免解码器不准确造成的音频损坏。此外,根据待编码音频帧序列中的音频帧的熵确定线性变换的差分表示,进而根据线性变换的差分表示对待编码音频帧序列进行编码,可以保留相邻音频帧之间的特征,提供了目标编码格式音频数据的音质。
在其中一种实施方式中,参见图2所示,在步骤S13中,基于运营商的电信网络结构的中间层下发的目标解码器,根据最小化量化噪声矩阵,将待播放音频数据中对应的音频帧进行带最小化量化噪声解码,得到待编码音频帧的步骤,包括:
在步骤S131中,按照预设矩阵列数,将待播放音频数据按照音频帧顺序逐帧进行排列,构建得到音频数据矩阵,并求取音频数据矩阵对应的雅可比矩阵。
在步骤S132中,根据音频数据矩阵对应的雅可比矩阵表征的待播放音频数据在音频帧间的最优线性逼近,预测音频帧间的相似性检查结果。
在步骤S133中,基于运营商的电信网络结构的中间层下发的目标解码器,根据最小化量化噪声矩阵以及音频帧间的相似性检查结果,将待播放音频数据中对应的音频帧进行带最小化量化噪声解码,得到待编码音频帧。
在其中一种实施方式中,参见图3所示,在步骤S133中,基于运营商的电信网络结构的中间层下发的目标解码器,根据最小化量化噪声矩阵以及音频帧间的相似性检查结果,将待播放音频数据中对应的音频帧进行带最小化量化噪声解码,得到待编码音频帧的步骤,包括:
在步骤S1331中,根据音频帧间的相似性检查结果表征的相邻音频帧之间的相似度,得到相似度序列。
在步骤S1332中,根据最小化量化噪声矩阵的行列数,将相似度序列构建成与最小化量化噪声矩阵同型的共生相似度矩阵,其中,不够的行列用0补充。
在步骤S1333中,计算最小化量化噪声矩阵与共生相似度矩阵的哈达玛积,得到针对待播放音频数据对应的目标解码矩阵。
在步骤S1334中,基于运营商的电信网络结构的中间层下发的目标解码器,根据目标解码矩阵,对待播放音频数据中对应的音频帧进行解码,得到待编码音频帧。
在其中一种实施方式中,参见图4所示,在步骤S12中,根据待播放音频数据的压缩率,生成针对待播放音频数据的进行解码的最小化量化噪声矩阵的步骤,包括:
在步骤S121中,根据待播放音频数据的压缩率,确定压缩功率值,并根据压缩功率值确定解码过程中的补偿功率值。
在步骤S122中,假设噪声补偿数据服从高斯分布,则根据补偿功率值得到噪声期望值。
在步骤S123中,计算噪声期望值的平均值和方差,并将各噪声期望值代入正态分布公式,得到噪声序列,并根据噪声序列生成针对待播放音频数据的进行解码的最小化量化噪声矩阵。
在其中一种实施方式中,在步骤S14中,基于能够识别的编码方式对应的目标编码器,根据线性变换的差分表示对待编码音频帧序列进行编码,得到目标编码格式音频数据的步骤,包括:
根据线性变换的差分表示,确定待编码音频帧序列中相邻音频帧在帧间编码后的第一数据量,以及相邻音频帧分别进行帧内编码后的第二数据量。
针对任意音频帧,若对应的所有第一数据量均大于等于对应的第二数据量,基于能够识别的编码方式对应的目标编码器,对该音频帧进行帧内编码,或者,若对应的任一第一数据量小于应的第二数据量,基于能够识别的编码方式对应的目标编码器,将该音频帧与相邻的音频帧进行帧间编码,得到目标编码格式音频数据。
在其中一种实施方式中,针对任意音频帧,若对应的所有第一数据量均大于等于对应的第二数据量,基于能够识别的编码方式对应的目标编码器,对该音频帧进行帧内编码,或者,若对应的任一第一数据量小于应的第二数据量,基于能够识别的编码方式对应的目标编码器,将该音频帧与相邻的音频帧进行帧间编码,得到目标编码格式音频数据的步骤,包括:
针对任意音频帧,按照逐帧进行编码的原则,确定该音频帧与相邻的上一音频帧对应的帧间编码后的第一数据量是否大于等于对该音频帧和相邻的上一音频帧分别进行帧内编码后的第二数据量,其中,第二数据量是该音频帧帧内编码后的数据量与相邻的上一音频帧帧内编码后的数据量之和。
若确定该音频帧与相邻的上一音频帧对应的帧间编码后的第一数据量大于等于对该音频帧和相邻的上一音频帧分别进行帧内编码后的第二数据量,则确定该音频帧与相邻的下一音频帧对应的帧间编码后的第一数据量是否大于等于对该音频帧和相邻的下一音频帧分别进行帧内编码后的第二数据量。
若确定该音频帧与相邻的下一音频帧对应的帧间编码后的第一数据量大于等于对该音频帧和相邻的下一音频帧分别进行帧内编码后的第二数据量,则基于能够识别的编码方式对应的目标编码器,对该音频帧进行帧内编码。
若确定该音频帧与相邻的上一音频帧对应的帧间编码后的第一数据量小于对该音频帧和相邻的上一音频帧分别进行帧内编码后的第二数据量,基于能够识别的编码方式对应的目标编码器,将该音频帧与相邻的音频帧进行帧间编码,得到目标编码格式音频数据。
本发明实施例还提供一种音频数据编码格式转换的装置,参见图5所示,所述装置500包括:
获取模块510,被配置为在确定接收到的待播放音频数据为无法识别的编码格式的情况下,获取所述待播放音频数据的回程链路路径以及压缩率,所述回程链路路径用于表征所述待播放音频数据在运营商的电信网络结构的中间层的回程传输链接地址;
生成模块520,被配置为根据所述待播放音频数据的压缩率,生成针对所述待播放音频数据的进行解码的最小化量化噪声矩阵;
解码模块530,被配置为根据所述回程链路路径向所述运营商的电信网络结构的中间层请求下发用于对所述待播放音频数据解码的目标解码器,并基于所述运营商的电信网络结构的中间层下发的所述目标解码器,根据所述最小化量化噪声矩阵,将所述待播放音频数据中对应的音频帧进行带最小化量化噪声解码,得到待编码音频帧序列;
编码模块540,被配置为根据所述待编码音频帧序列中的音频帧的熵,确定线性变换的差分表示,并基于能够识别的编码方式对应的目标编码器,根据线性变换的差分表示对所述待编码音频帧序列进行编码,得到目标编码格式音频数据。
上述装置根据压缩率确定的最小化量化噪声矩阵可以降低压缩过程中对音质的损坏,并且播放待播放音频数据的设备由于不具备相应的解码器,无法进行解码后重新编码,所以可以从运营商的电信网络结构的中间层请求下发,避免解码器不准确造成的音频损坏。此外,根据待编码音频帧序列中的音频帧的熵确定线性变换的差分表示,进而根据线性变换的差分表示对待编码音频帧序列进行编码,可以保留相邻音频帧之间的特征,提供了目标编码格式音频数据的音质。
优选地,所述解码模块530,包括:
构建子模块,被配置为按照预设矩阵列数,将所述待播放音频数据按照音频帧顺序逐帧进行排列,构建得到音频数据矩阵,并求取所述音频数据矩阵对应的雅可比矩阵;
预测子模块,被配置为根据所述音频数据矩阵对应的雅可比矩阵表征的所述待播放音频数据在音频帧间的最优线性逼近,预测音频帧间的相似性检查结果;
解码子模块,被配置为基于所述运营商的电信网络结构的中间层下发的所述目标解码器,根据所述最小化量化噪声矩阵以及所述音频帧间的相似性检查结果,将所述待播放音频数据中对应的音频帧进行带最小化量化噪声解码,得到待编码音频帧序列。
优选地,所述解码子模块,被配置为:
根据所述音频帧间的相似性检查结果表征的相邻音频帧之间的相似度,得到相似度序列;
根据所述最小化量化噪声矩阵的行列数,将所述相似度序列构建成与所述最小化量化噪声矩阵同型的共生相似度矩阵,其中,不够的行列用0补充;
计算所述最小化量化噪声矩阵与所述共生相似度矩阵的哈达玛积,得到针对所述待播放音频数据对应的目标解码矩阵;
基于所述运营商的电信网络结构的中间层下发的所述目标解码器,根据所述目标解码矩阵,对所述待播放音频数据中对应的音频帧进行解码,得到待编码音频帧。
优选地,所述生成模块520,被配置为:
根据所述待播放音频数据的压缩率,确定压缩功率值,并根据所述压缩功率值确定解码过程中的补偿功率值;
假设噪声补偿数据服从高斯分布,则根据所述补偿功率值得到噪声期望值;
计算所述噪声期望值的平均值和方差,并将各所述噪声期望值代入正态分布公式,得到噪声序列,并根据所述噪声序列生成针对所述待播放音频数据的进行解码的最小化量化噪声矩阵。
优选地,所述编码模块540,被配置为:
根据线性变换的差分表示,确定所述待编码音频帧序列中相邻音频帧在帧间编码后的第一数据量,以及所述相邻音频帧分别进行帧内编码后的第二数据量;
针对任意音频帧,若对应的所有所述第一数据量均大于等于对应的所述第二数据量,基于能够识别的编码方式对应的目标编码器,对该音频帧进行帧内编码,或者,若对应的任一所述第一数据量小于应的所述第二数据量,基于能够识别的编码方式对应的目标编码器,将该音频帧与相邻的音频帧进行帧间编码,得到目标编码格式音频数据。
优选地,所述编码模块540,被配置为:
针对任意音频帧,按照逐帧进行编码的原则,确定该音频帧与相邻的上一音频帧对应的帧间编码后的第一数据量是否大于等于对该音频帧和所述相邻的上一音频帧分别进行帧内编码后的第二数据量,其中,第二数据量是该音频帧帧内编码后的数据量与所述相邻的上一音频帧帧内编码后的数据量之和;
若确定该音频帧与相邻的上一音频帧对应的帧间编码后的第一数据量大于等于对该音频帧和所述相邻的上一音频帧分别进行帧内编码后的第二数据量,则确定该音频帧与相邻的下一音频帧对应的帧间编码后的第一数据量是否大于等于对该音频帧和所述相邻的下一音频帧分别进行帧内编码后的第二数据量;
若确定该音频帧与相邻的下一音频帧对应的帧间编码后的第一数据量大于等于对该音频帧和所述相邻的下一音频帧分别进行帧内编码后的第二数据量,则基于能够识别的编码方式对应的目标编码器,对该音频帧进行帧内编码;
若确定该音频帧与相邻的上一音频帧对应的帧间编码后的第一数据量小于对该音频帧和所述相邻的上一音频帧分别进行帧内编码后的第二数据量,基于能够识别的编码方式对应的目标编码器,将该音频帧与相邻的音频帧进行帧间编码,得到目标编码格式音频数据。
以上述依据本申请的理想实施例为启示,通过上述的说明内容,相关工作人员完全可以在不偏离本项申请技术思想的范围内,进行多样的变更以及修改。本项申请的技术性范围并不局限于说明书上的内容,必须要根据权利要求范围来确定其技术性范围。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (10)
1.一种音频数据编码格式转换的方法,其特征在于,所述方法包括:
在确定接收到的待播放音频数据为无法识别的编码格式的情况下,获取所述待播放音频数据的回程链路路径以及压缩率,所述回程链路路径用于表征所述待播放音频数据在运营商的电信网络结构的中间层的回程传输链接地址;
根据所述待播放音频数据的压缩率,生成针对所述待播放音频数据的进行解码的最小化量化噪声矩阵;
根据所述回程链路路径向所述运营商的电信网络结构的中间层请求下发用于对所述待播放音频数据解码的目标解码器,并基于所述运营商的电信网络结构的中间层下发的所述目标解码器,根据所述最小化量化噪声矩阵,将所述待播放音频数据中对应的音频帧进行带最小化量化噪声解码,得到待编码音频帧序列;
根据所述待编码音频帧序列中的音频帧的熵,确定线性变换的差分表示,并基于能够识别的编码方式对应的目标编码器,根据线性变换的差分表示对所述待编码音频帧序列进行编码,得到目标编码格式音频数据。
2.根据权利要求1所述的方法,其特征在于,所述基于所述运营商的电信网络结构的中间层下发的所述目标解码器,根据所述最小化量化噪声矩阵,将所述待播放音频数据中对应的音频帧进行带最小化量化噪声解码,得到待编码音频帧的步骤,包括:
按照预设矩阵列数,将所述待播放音频数据按照音频帧顺序逐帧进行排列,构建得到音频数据矩阵,并求取所述音频数据矩阵对应的雅可比矩阵;
根据所述音频数据矩阵对应的雅可比矩阵表征的所述待播放音频数据在音频帧间的最优线性逼近,预测音频帧间的相似性检查结果;
基于所述运营商的电信网络结构的中间层下发的所述目标解码器,根据所述最小化量化噪声矩阵以及所述音频帧间的相似性检查结果,将所述待播放音频数据中对应的音频帧进行带最小化量化噪声解码,得到待编码音频帧。
3.根据权利要求2所述的方法,其特征在于,所述基于所述运营商的电信网络结构的中间层下发的所述目标解码器,根据所述最小化量化噪声矩阵以及所述音频帧间的相似性检查结果,将所述待播放音频数据中对应的音频帧进行带最小化量化噪声解码,得到待编码音频帧的步骤,包括:
根据所述音频帧间的相似性检查结果表征的相邻音频帧之间的相似度,得到相似度序列;
根据所述最小化量化噪声矩阵的行列数,将所述相似度序列构建成与所述最小化量化噪声矩阵同型的共生相似度矩阵,其中,不够的行列用0补充;
计算所述最小化量化噪声矩阵与所述共生相似度矩阵的哈达玛积,得到针对所述待播放音频数据对应的目标解码矩阵;
基于所述运营商的电信网络结构的中间层下发的所述目标解码器,根据所述目标解码矩阵,对所述待播放音频数据中对应的音频帧进行解码,得到待编码音频帧。
4.根据权利要求1所述的方法,其特征在于,所述根据所述待播放音频数据的压缩率,生成针对所述待播放音频数据的进行解码的最小化量化噪声矩阵的步骤,包括:
根据所述待播放音频数据的压缩率,确定压缩功率值,并根据所述压缩功率值确定解码过程中的补偿功率值;
假设噪声补偿数据服从高斯分布,则根据所述补偿功率值得到噪声期望值;
计算所述噪声期望值的平均值和方差,并将各所述噪声期望值代入正态分布公式,得到噪声序列,并根据所述噪声序列生成针对所述待播放音频数据的进行解码的最小化量化噪声矩阵。
5.根据权利要求1-4中任一项所述的方法,其特征在于,所述基于能够识别的编码方式对应的目标编码器,根据线性变换的差分表示对所述待编码音频帧序列进行编码,得到目标编码格式音频数据的步骤,包括:
根据线性变换的差分表示,确定所述待编码音频帧序列中相邻音频帧在帧间编码后的第一数据量,以及所述相邻音频帧分别进行帧内编码后的第二数据量;
针对任意音频帧,若对应的所有所述第一数据量均大于等于对应的所述第二数据量,基于能够识别的编码方式对应的目标编码器,对该音频帧进行帧内编码,或者,若对应的任一所述第一数据量小于应的所述第二数据量,基于能够识别的编码方式对应的目标编码器,将该音频帧与相邻的音频帧进行帧间编码,得到目标编码格式音频数据。
6.根据权利要求5所述的方法,其特征在于,所述针对任意音频帧,若对应的所有所述第一数据量均大于等于对应的所述第二数据量,基于能够识别的编码方式对应的目标编码器,对该音频帧进行帧内编码,或者,若对应的任一所述第一数据量小于应的所述第二数据量,基于能够识别的编码方式对应的目标编码器,将该音频帧与相邻的音频帧进行帧间编码,得到目标编码格式音频数据的步骤,包括:
针对任意音频帧,按照逐帧进行编码的原则,确定该音频帧与相邻的上一音频帧对应的帧间编码后的第一数据量是否大于等于对该音频帧和所述相邻的上一音频帧分别进行帧内编码后的第二数据量,其中,第二数据量是该音频帧帧内编码后的数据量与所述相邻的上一音频帧帧内编码后的数据量之和;
若确定该音频帧与相邻的上一音频帧对应的帧间编码后的第一数据量大于等于对该音频帧和所述相邻的上一音频帧分别进行帧内编码后的第二数据量,则确定该音频帧与相邻的下一音频帧对应的帧间编码后的第一数据量是否大于等于对该音频帧和所述相邻的下一音频帧分别进行帧内编码后的第二数据量;
若确定该音频帧与相邻的下一音频帧对应的帧间编码后的第一数据量大于等于对该音频帧和所述相邻的下一音频帧分别进行帧内编码后的第二数据量,则基于能够识别的编码方式对应的目标编码器,对该音频帧进行帧内编码;
若确定该音频帧与相邻的上一音频帧对应的帧间编码后的第一数据量小于对该音频帧和所述相邻的上一音频帧分别进行帧内编码后的第二数据量,基于能够识别的编码方式对应的目标编码器,将该音频帧与相邻的音频帧进行帧间编码,得到目标编码格式音频数据。
7.一种音频数据编码格式转换的装置,其特征在于,所述装置包括:
获取模块,被配置为在确定接收到的待播放音频数据为无法识别的编码格式的情况下,获取所述待播放音频数据的回程链路路径以及压缩率,所述回程链路路径用于表征所述待播放音频数据在运营商的电信网络结构的中间层的回程传输链接地址;
生成模块,被配置为根据所述待播放音频数据的压缩率,生成针对所述待播放音频数据的进行解码的最小化量化噪声矩阵;
解码模块,被配置为根据所述回程链路路径向所述运营商的电信网络结构的中间层请求下发用于对所述待播放音频数据解码的目标解码器,并基于所述运营商的电信网络结构的中间层下发的所述目标解码器,根据所述最小化量化噪声矩阵,将所述待播放音频数据中对应的音频帧进行带最小化量化噪声解码,得到待编码音频帧序列;
编码模块,被配置为根据所述待编码音频帧序列中的音频帧的熵,确定线性变换的差分表示,并基于能够识别的编码方式对应的目标编码器,根据线性变换的差分表示对所述待编码音频帧序列进行编码,得到目标编码格式音频数据。
8.根据权利要求7所述的装置,其特征在于,所述解码模块,包括:
构建子模块,被配置为按照预设矩阵列数,将所述待播放音频数据按照音频帧顺序逐帧进行排列,构建得到音频数据矩阵,并求取所述音频数据矩阵对应的雅可比矩阵;
预测子模块,被配置为根据所述音频数据矩阵对应的雅可比矩阵表征的所述待播放音频数据在音频帧间的最优线性逼近,预测音频帧间的相似性检查结果;
解码子模块,被配置为基于所述运营商的电信网络结构的中间层下发的所述目标解码器,根据所述最小化量化噪声矩阵以及所述音频帧间的相似性检查结果,将所述待播放音频数据中对应的音频帧进行带最小化量化噪声解码,得到待编码音频帧序列。
9.根据权利要求8所述的装置,其特征在于,所述解码子模块,被配置为:
根据所述音频帧间的相似性检查结果表征的相邻音频帧之间的相似度,得到相似度序列;
根据所述最小化量化噪声矩阵的行列数,将所述相似度序列构建成与所述最小化量化噪声矩阵同型的共生相似度矩阵,其中,不够的行列用0补充;
计算所述最小化量化噪声矩阵与所述共生相似度矩阵的哈达玛积,得到针对所述待播放音频数据对应的目标解码矩阵;
基于所述运营商的电信网络结构的中间层下发的所述目标解码器,根据所述目标解码矩阵,对所述待播放音频数据中对应的音频帧进行解码,得到待编码音频帧。
10.根据权利要求7所述的装置,其特征在于,所述生成模块,被配置为:
根据所述待播放音频数据的压缩率,确定压缩功率值,并根据所述压缩功率值确定解码过程中的补偿功率值;
假设噪声补偿数据服从高斯分布,则根据所述补偿功率值得到噪声期望值;
计算所述噪声期望值的平均值和方差,并将各所述噪声期望值代入正态分布公式,得到噪声序列,并根据所述噪声序列生成针对所述待播放音频数据的进行解码的最小化量化噪声矩阵。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211268426.6A CN115662448B (zh) | 2022-10-17 | 2022-10-17 | 音频数据编码格式转换的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211268426.6A CN115662448B (zh) | 2022-10-17 | 2022-10-17 | 音频数据编码格式转换的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115662448A CN115662448A (zh) | 2023-01-31 |
CN115662448B true CN115662448B (zh) | 2023-10-20 |
Family
ID=84988404
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211268426.6A Active CN115662448B (zh) | 2022-10-17 | 2022-10-17 | 音频数据编码格式转换的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115662448B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103905834A (zh) * | 2014-03-13 | 2014-07-02 | 深圳创维-Rgb电子有限公司 | 音频数据编码格式转换的方法及装置 |
WO2014124377A2 (en) * | 2013-02-11 | 2014-08-14 | Dolby Laboratories Licensing Corporation | Audio bitstreams with supplementary data and encoding and decoding of such bitstreams |
EP2887350A1 (en) * | 2013-12-19 | 2015-06-24 | Dolby Laboratories Licensing Corporation | Adaptive quantization noise filtering of decoded audio data |
CN106023999A (zh) * | 2016-07-11 | 2016-10-12 | 武汉大学 | 用于提高三维音频空间参数压缩率的编解码方法及系统 |
CN108809921A (zh) * | 2017-07-31 | 2018-11-13 | 北京视联动力国际信息技术有限公司 | 一种音频处理方法、视联网服务器和视联网终端 |
CN109524015A (zh) * | 2017-09-18 | 2019-03-26 | 杭州海康威视数字技术股份有限公司 | 音频编码方法、解码方法、装置及音频编解码系统 |
WO2019070597A1 (en) * | 2017-10-05 | 2019-04-11 | Qualcomm Incorporated | DECODING AUDIO SIGNALS |
CN109660813A (zh) * | 2017-10-12 | 2019-04-19 | 上海富瀚微电子股份有限公司 | 一种量化噪声线性拟合方法、编码装置及编码方法 |
CN115050378A (zh) * | 2022-05-19 | 2022-09-13 | 腾讯科技(深圳)有限公司 | 音频编解码方法及相关产品 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11295750B2 (en) * | 2018-09-27 | 2022-04-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for noise shaping using subspace projections for low-rate coding of speech and audio |
-
2022
- 2022-10-17 CN CN202211268426.6A patent/CN115662448B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014124377A2 (en) * | 2013-02-11 | 2014-08-14 | Dolby Laboratories Licensing Corporation | Audio bitstreams with supplementary data and encoding and decoding of such bitstreams |
EP2887350A1 (en) * | 2013-12-19 | 2015-06-24 | Dolby Laboratories Licensing Corporation | Adaptive quantization noise filtering of decoded audio data |
CN103905834A (zh) * | 2014-03-13 | 2014-07-02 | 深圳创维-Rgb电子有限公司 | 音频数据编码格式转换的方法及装置 |
CN106023999A (zh) * | 2016-07-11 | 2016-10-12 | 武汉大学 | 用于提高三维音频空间参数压缩率的编解码方法及系统 |
CN108809921A (zh) * | 2017-07-31 | 2018-11-13 | 北京视联动力国际信息技术有限公司 | 一种音频处理方法、视联网服务器和视联网终端 |
CN109524015A (zh) * | 2017-09-18 | 2019-03-26 | 杭州海康威视数字技术股份有限公司 | 音频编码方法、解码方法、装置及音频编解码系统 |
WO2019070597A1 (en) * | 2017-10-05 | 2019-04-11 | Qualcomm Incorporated | DECODING AUDIO SIGNALS |
CN109660813A (zh) * | 2017-10-12 | 2019-04-19 | 上海富瀚微电子股份有限公司 | 一种量化噪声线性拟合方法、编码装置及编码方法 |
CN115050378A (zh) * | 2022-05-19 | 2022-09-13 | 腾讯科技(深圳)有限公司 | 音频编解码方法及相关产品 |
Non-Patent Citations (2)
Title |
---|
一种视频编码改进算法的研究与实现;梁俊芳;;机械工程与自动化(第02期);92-94 * |
音频信号高维矢量编码算法研究;杨超;《现代电子技术》;第42卷(第15期);43-46 * |
Also Published As
Publication number | Publication date |
---|---|
CN115662448A (zh) | 2023-01-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3926399B2 (ja) | オーディオ信号コーディング中にノイズ置換を信号で知らせる方法 | |
JP3135062B2 (ja) | 画像復号化方法 | |
US7289951B1 (en) | Method for improving the coding efficiency of an audio signal | |
US5649052A (en) | Adaptive digital audio encoding system | |
CA2450246A1 (en) | Moving picture coding/decoding method and device using multiple reference frames for motion estimation | |
US20050243930A1 (en) | Video encoding method and apparatus | |
JP4267084B2 (ja) | 伝送システムの損失のない符号化/復号化 | |
JPH08275165A (ja) | ビデオ信号符号化方法及び装置 | |
CN1240048C (zh) | 音频编码 | |
RU2719334C1 (ru) | Способ кодирования видео с предсказанием движения, устройство кодирования видео с предсказанием движения, программа кодирования видео с предсказанием движения, способ декодирования видео с предсказанием движения, устройство декодирования видео с предсказанием движения и программа декодирования видео с предсказанием движения | |
CN115662448B (zh) | 音频数据编码格式转换的方法及装置 | |
KR20090095011A (ko) | 영상의 부호화, 복호화 방법 및 장치 | |
JP3248215B2 (ja) | 音声符号化装置 | |
CN101606193B (zh) | 音频编码和解码装置和方法 | |
CN103634608B (zh) | 一种高性能视频编码无损模式的残差变换方法 | |
JP4359949B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
JPH09172643A (ja) | 階層符号化装置 | |
CN104104391B (zh) | 编码方法以及编码装置 | |
JP3348759B2 (ja) | 変換符号化方法および変換復号化方法 | |
JP2982637B2 (ja) | スペクトルパラメータを用いた音声信号伝送システムおよびそれに用いられる音声パラメータ符号化装置および復号化装置 | |
JPS6337724A (ja) | 符号化伝送装置 | |
JPH03163979A (ja) | 映像符号化多重伝送方式 | |
JP2527353B2 (ja) | ベクトル量子化による画像デ―タの圧縮装置 | |
JPH01205200A (ja) | 音声符号化方式 | |
JPH1049200A (ja) | 音声情報圧縮蓄積方法及び装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |