CN113207058A

CN113207058A - 一种音频信号的传输处理方法

Info

Publication number: CN113207058A
Application number: CN202110490065.9A
Authority: CN
Inventors: 李建新; 李三红; 李军利
Original assignee: Individual
Current assignee: Enping Aoda Electronic Technology Co ltd
Priority date: 2021-05-06
Filing date: 2021-05-06
Publication date: 2021-08-03
Anticipated expiration: 2041-05-06
Also published as: CN113207058B

Abstract

本发明公开了一种音频信号的传输处理方法。能够在检测到音频输出终端从所处的第一音频交互状态切换为第二音频交互状态时，确定差异化音频交互状态信息，从而对第一混响音频交互状态模型进行更新，得到第二混响音频交互状态模型，进一步确定第二音频交互状态中所述音频输出终端的全局待传输音频信号特征。如此设计，能够对混响音频交互状态模型的更新，并基于更新后的模型确定音频输出终端在不同音频交互状态下的全局待传输音频信号特征，这样能够将不同的音频交互状态考虑在内，从而确保全局待传输音频信号特征能够携带音频信号的显著特征，避免在对音频信号进行传输时一些显著特征的缺失，这样可以实现无损传输。

Description

一种音频信号的传输处理方法

技术领域

本公开涉及音频信号传输技术领域，特别涉及一种音频信号的传输处理方法。

背景技术

随着科技的发展，智能电子设备的功能越来越完善。现目前，绝大部分的智能电子设备支持音频传输，从而方便日常办公和业务生活。在通信网络不断优化的信息时代，许多数据信息需要通过通信网络进行远程传输，这样可能导致音频信号在传输过程中出现一些问题。比如，在采用相关技术对音频信号进行传输时，可能出现音频信号的一些显著特征的缺失，从而难以实现无损传输。

发明内容

为改善相关技术中存在的技术问题，本公开提供了一种音频信号的传输处理方法。

本发明提供了一种音频信号的传输处理方法，所述方法包括：

若检测到音频输出终端从所处的第一音频交互状态切换为第二音频交互状态，则基于第一音频交互状态信息和第二音频交互状态信息，确定差异化音频交互状态信息；其中，所述差异化音频交互状态信息用于指示所述第二音频交互状态相对于所述第一音频交互状态的音频交互状态变化情况，所述第一音频交互状态信息包括所述音频输出终端对应的第一音频交互状态特征，所述第二音频交互状态信息包括所述音频输出终端对应的第二音频交互状态特征；

基于所述差异化音频交互状态信息，对第一混响音频交互状态模型进行更新，得到第二混响音频交互状态模型，所述第一混响音频交互状态用于在噪声场景中表征所述第一音频交互状态，所述第二混响音频交互状态模型用于在噪声场景中表征所述第二音频交互状态；

基于所述第二音频交互状态特征和所述第二混响音频交互状态模型，确定所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征。

在一种可替换的实施方式中，所述基于第一音频交互状态信息和第二音频交互状态信息，确定差异化音频交互状态信息，包括：

基于所述第二音频交互状态信息，确定第二噪声干扰信息，所述第二噪声干扰信息用于指示所述第二音频交互状态在噪声场景的音质损耗集合；

确定所述第二噪声干扰信息与第一噪声干扰信息之间的差异化分析结果，得到差异化噪声干扰信息，所述第一噪声干扰信息用于指示所述第一音频交互状态在噪声场景的音质损耗集合；

将所述差异化噪声干扰信息确定为所述差异化音频交互状态信息。

在一种可替换的实施方式中，所述基于所述差异化音频交互状态信息，对第一混响音频交互状态模型进行更新，得到第二混响音频交互状态模型，包括：

对所述差异化音频交互状态信息进行数字化，得到数字化后的差异化音频交互状态信息；

基于所述数字化后的差异化音频交互状态信息，对所述第一混响音频交互状态模型进行更新，得到所述第二混响音频交互状态模型；

所述差异化音频交互状态信息为差异化噪声干扰信息，所述差异化噪声干扰信息是指第二噪声干扰信息与第一噪声干扰信息之间的差异化分析结果，所述第一噪声干扰信息用于指示所述第一音频交互状态在噪声场景的音质损耗集合，所述第二噪声干扰信息用于指示所述第二音频交互状态在噪声场景的音质损耗集合；

所述对所述差异化音频交互状态信息进行数字化，得到数字化后的差异化音频交互状态信息，包括：对所述差异化噪声干扰信息进行数字化，得到数字化后的差异化噪声干扰信息；

所述基于所述数字化后的差异化音频交互状态信息，对所述第一混响音频交互状态模型进行更新，得到所述第二混响音频交互状态模型，包括：将所述数字化后的差异化噪声干扰信息与所述第一混响音频交互状态模型进行加权，得到所述第二混响音频交互状态模型。

在一种可替换的实施方式中，所述基于所述第二音频交互状态特征和所述第二混响音频交互状态模型，确定所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征，包括：

获取所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型；

基于所述差异化音频交互状态信息和音质评价参数，确定第一局部特征与参考音频交互状态之间的第二声纹特征映射模型，所述第一局部特征是指所述第二音频交互状态特征中与变化音频交互状态对应的部分特征，所述变化音频交互状态是指所述第二音频交互状态相对于所述第一音频交互状态发生变化的部分音频交互状态；

基于所述第一声纹特征映射模型和所述第二声纹特征映射模型，将所述第二音频交互状态特征映射到所述第二混响音频交互状态模型中，得到所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征；

所述基于所述第一声纹特征映射模型和所述第二声纹特征映射模型，将所述第二音频交互状态特征映射到所述第二混响音频交互状态模型中，包括：

基于所述第一声纹特征映射模型，将所述第二音频交互状态特征中的第二局部特征映射到所述第二混响音频交互状态模型中，所述第二局部特征是指所述第二音频交互状态特征中与未变化音频交互状态对应的部分特征，所述未变化音频交互状态是指所述第二音频交互状态相对于所述第一音频交互状态未发生变化的部分音频交互状态；

基于所述第二声纹特征映射模型，将所述第二音频交互状态特征中的所述第一局部特征映射到所述第二混响音频交互状态模型中；

所述基于第一音频交互状态信息和第二音频交互状态信息，确定差异化音频交互状态信息之前，还包括：

获取所述音频输出终端所处的第一音频交互状态对应的所述第一音频交互状态信息；

基于所述第一音频交互状态信息，构建所述第一混响音频交互状态模型；基于所述第一音频交互状态信息和音质评价参数，确定所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型；

所述基于所述第一音频交互状态信息和音质评价参数，确定所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型之后，还包括：

基于所述第一声纹特征映射模型，将所述第一音频交互状态特征映射到所述第一混响音频交互状态模型中，得到所述第一音频交互状态中所述音频输出终端的全局待传输音频信号特征。

本发明还提供了一种音频信号的传输处理装置，所述装置包括：

状态信息确定模块，用于若检测到音频输出终端从所处的第一音频交互状态切换为第二音频交互状态，则基于第一音频交互状态信息和第二音频交互状态信息，确定差异化音频交互状态信息；其中，所述差异化音频交互状态信息用于指示所述第二音频交互状态相对于所述第一音频交互状态的音频交互状态变化情况，所述第一音频交互状态信息包括所述音频输出终端对应的第一音频交互状态特征，所述第二音频交互状态信息包括所述音频输出终端对应的第二音频交互状态特征；

状态模型更新模块，用于基于所述差异化音频交互状态信息，对第一混响音频交互状态模型进行更新，得到第二混响音频交互状态模型，所述第一混响音频交互状态用于在噪声场景中表征所述第一音频交互状态，所述第二混响音频交互状态模型用于在噪声场景中表征所述第二音频交互状态；

音频信号特征确定模块，用于基于所述第二音频交互状态特征和所述第二混响音频交互状态模型，确定所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征。

在一种可替换的实施方式中，所述状态信息确定模块，包括：

在一种可替换的实施方式中，所述状态模型更新模块，包括：

在一种可替换的实施方式中，所述音频信号特征确定模块，包括：

本发明还提供了一种计算机设备，包括互相之间通信的处理器和存储器，所述处理器用于从所述存储器中调取计算机程序，并通过运行所述计算机程序实现上述所述的方法。

本发明还提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序在运行时实现上述所述的方法。

本公开的实施例提供的技术方案可以包括以下有益效果。

本公开提供了一种音频信号的传输处理方法。能够在检测到音频输出终端从所处的第一音频交互状态切换为第二音频交互状态时，基于第一音频交互状态信息和第二音频交互状态信息确定差异化音频交互状态信息，从而对第一混响音频交互状态模型进行更新，得到第二混响音频交互状态模型，进一步基于第二音频交互状态特征和第二混响音频交互状态模型，确定第二音频交互状态中所述音频输出终端的全局待传输音频信号特征。如此设计，能够对混响音频交互状态模型的更新，并基于更新后的模型确定音频输出终端在不同音频交互状态下的全局待传输音频信号特征，这样能够将不同的音频交互状态考虑在内，从而确保全局待传输音频信号特征能够携带音频信号的显著特征，避免在对音频信号进行传输时一些显著特征的缺失，这样可以实现无损传输。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并于说明书一起用于解释本发明的原理。

图1是本发明实施例提供的一种音频信号的传输处理方法的流程图。

图2是本发明实施例提供的一种音频信号的传输处理装置框图。

图3是本发明实施例提供的一种计算机设备的硬件结构示意图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。

请结合参阅图1，提供了一种音频信号的传输处理方法的流程示意图，具体执行以下步骤S110-步骤S130所描述的内容。

步骤S110，若检测到音频输出终端从所处的第一音频交互状态切换为第二音频交互状态，则基于第一音频交互状态信息和第二音频交互状态信息，确定差异化音频交互状态信息。

在本实施例中，所述差异化音频交互状态信息用于指示所述第二音频交互状态相对于所述第一音频交互状态的音频交互状态变化情况，所述第一音频交互状态信息包括所述音频输出终端对应的第一音频交互状态特征，所述第二音频交互状态信息包括所述音频输出终端对应的第二音频交互状态特征。

可以理解，所述基于第一音频交互状态信息和第二音频交互状态信息，确定差异化音频交互状态信息，可以具体包括：基于所述第二音频交互状态信息，确定第二噪声干扰信息，所述第二噪声干扰信息用于指示所述第二音频交互状态在噪声场景的音质损耗集合；确定所述第二噪声干扰信息与第一噪声干扰信息之间的差异化分析结果，得到差异化噪声干扰信息，所述第一噪声干扰信息用于指示所述第一音频交互状态在噪声场景的音质损耗集合；将所述差异化噪声干扰信息确定为所述差异化音频交互状态信息。

其中，所述基于第一音频交互状态信息和第二音频交互状态信息，确定差异化音频交互状态信息之前，还可以具体包括：获取所述音频输出终端所处的第一音频交互状态对应的所述第一音频交互状态信息；基于所述第一音频交互状态信息，构建所述第一混响音频交互状态模型；基于所述第一音频交互状态信息和音质评价参数，确定所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型。

其中，所述基于所述第一音频交互状态信息和音质评价参数，确定所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型之后，还可以具体包括：基于所述第一声纹特征映射模型，将所述第一音频交互状态特征映射到所述第一混响音频交互状态模型中，得到所述第一音频交互状态中所述音频输出终端的全局待传输音频信号特征。

步骤S120，基于所述差异化音频交互状态信息，对第一混响音频交互状态模型进行更新，得到第二混响音频交互状态模型，所述第一混响音频交互状态用于在噪声场景中表征所述第一音频交互状态，所述第二混响音频交互状态模型用于在噪声场景中表征所述第二音频交互状态。

进一步地，所述基于所述差异化音频交互状态信息，对第一混响音频交互状态模型进行更新，得到第二混响音频交互状态模型，具体包括：对所述差异化音频交互状态信息进行数字化，得到数字化后的差异化音频交互状态信息；基于所述数字化后的差异化音频交互状态信息，对所述第一混响音频交互状态模型进行更新，得到所述第二混响音频交互状态模型；所述差异化音频交互状态信息为差异化噪声干扰信息，所述差异化噪声干扰信息是指第二噪声干扰信息与第一噪声干扰信息之间的差异化分析结果，所述第一噪声干扰信息用于指示所述第一音频交互状态在噪声场景的音质损耗集合，所述第二噪声干扰信息用于指示所述第二音频交互状态在噪声场景的音质损耗集合；在上述实施例的基础上，所述对所述差异化音频交互状态信息进行数字化，得到数字化后的差异化音频交互状态信息，包括：对所述差异化噪声干扰信息进行数字化，得到数字化后的差异化噪声干扰信息；所述基于所述数字化后的差异化音频交互状态信息，对所述第一混响音频交互状态模型进行更新，得到所述第二混响音频交互状态模型，包括：将所述数字化后的差异化噪声干扰信息与所述第一混响音频交互状态模型进行加权，得到所述第二混响音频交互状态模型。

步骤S130，基于所述第二音频交互状态特征和所述第二混响音频交互状态模型，确定所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征。

其中，所述基于所述第二音频交互状态特征和所述第二混响音频交互状态模型，确定所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征，还可以具体包括：获取所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型；基于所述差异化音频交互状态信息和音质评价参数，确定第一局部特征与参考音频交互状态之间的第二声纹特征映射模型，所述第一局部特征是指所述第二音频交互状态特征中与变化音频交互状态对应的部分特征，所述变化音频交互状态是指所述第二音频交互状态相对于所述第一音频交互状态发生变化的部分音频交互状态；基于所述第一声纹特征映射模型和所述第二声纹特征映射模型，将所述第二音频交互状态特征映射到所述第二混响音频交互状态模型中，得到所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征。进一步地，所述基于所述第一声纹特征映射模型和所述第二声纹特征映射模型，将所述第二音频交互状态特征映射到所述第二混响音频交互状态模型中，包括：基于所述第一声纹特征映射模型，将所述第二音频交互状态特征中的第二局部特征映射到所述第二混响音频交互状态模型中，所述第二局部特征是指所述第二音频交互状态特征中与未变化音频交互状态对应的部分特征，所述未变化音频交互状态是指所述第二音频交互状态相对于所述第一音频交互状态未发生变化的部分音频交互状态；基于所述第二声纹特征映射模型，将所述第二音频交互状态特征中的所述第一局部特征映射到所述第二混响音频交互状态模型中；

在执行上述步骤S110-步骤S130所描述的方法时可以达到如下有益技术效果：能够在检测到音频输出终端从所处的第一音频交互状态切换为第二音频交互状态时，基于第一音频交互状态信息和第二音频交互状态信息确定差异化音频交互状态信息，从而对第一混响音频交互状态模型进行更新，得到第二混响音频交互状态模型，进一步基于第二音频交互状态特征和第二混响音频交互状态模型，确定第二音频交互状态中所述音频输出终端的全局待传输音频信号特征。如此设计，能够对混响音频交互状态模型的更新，并基于更新后的模型确定音频输出终端在不同音频交互状态下的全局待传输音频信号特征，这样能够将不同的音频交互状态考虑在内，从而确保全局待传输音频信号特征能够携带音频信号的显著特征，避免在对音频信号进行传输时一些显著特征的缺失，这样可以实现无损传输。

在上述基础上，请结合图2，本发明还提供了一种音频信号的传输处理装置200，应用于与用户终端以及多个医疗终端通信的数据传输服务器，所述装置包括以下功能模块。

状态信息确定模块210，用于若检测到音频输出终端从所处的第一音频交互状态切换为第二音频交互状态，则基于第一音频交互状态信息和第二音频交互状态信息，确定差异化音频交互状态信息；其中，所述差异化音频交互状态信息用于指示所述第二音频交互状态相对于所述第一音频交互状态的音频交互状态变化情况，所述第一音频交互状态信息包括所述音频输出终端对应的第一音频交互状态特征，所述第二音频交互状态信息包括所述音频输出终端对应的第二音频交互状态特征；

状态模型更新模块220，用于基于所述差异化音频交互状态信息，对第一混响音频交互状态模型进行更新，得到第二混响音频交互状态模型，所述第一混响音频交互状态用于在噪声场景中表征所述第一音频交互状态，所述第二混响音频交互状态模型用于在噪声场景中表征所述第二音频交互状态；

音频信号特征确定模块230，用于基于所述第二音频交互状态特征和所述第二混响音频交互状态模型，确定所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征。

其中，所述状态信息确定模块210，包括：

其中，所述状态模型更新模块220，包括：

其中，所述音频信号特征确定模块230，包括：

在上述基础上，请结合参阅图3，提供了一种计算机设备110，包括处理器111以及与所述处理器111连接的存储器112和总线113；其中，所述处理器111和所述存储器112通过所述总线113完成相互间的通信；所述处理器111用于调用所述存储器112中的程序指令，以执行上述的方法。

进一步地，还提供了一种可读存储介质，其上存储有程序，该程序被处理器执行时实现上述的方法。

应当理解的是，本发明并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围执行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims

1.一种音频信号的传输处理方法，其特征在于，所述方法包括：

2.如权利要求1所述的方法，其特征在于，所述基于第一音频交互状态信息和第二音频交互状态信息，确定差异化音频交互状态信息，包括：

3.如权利要求1所述的方法，其特征在于，所述基于所述差异化音频交互状态信息，对第一混响音频交互状态模型进行更新，得到第二混响音频交互状态模型，包括：

4.如权利要求1所述的方法，其特征在于，所述基于所述第二音频交互状态特征和所述第二混响音频交互状态模型，确定所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征，包括：