CN113207058A - 一种音频信号的传输处理方法 - Google Patents

一种音频信号的传输处理方法 Download PDF

Info

Publication number
CN113207058A
CN113207058A CN202110490065.9A CN202110490065A CN113207058A CN 113207058 A CN113207058 A CN 113207058A CN 202110490065 A CN202110490065 A CN 202110490065A CN 113207058 A CN113207058 A CN 113207058A
Authority
CN
China
Prior art keywords
interaction state
audio interaction
audio
feature
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110490065.9A
Other languages
English (en)
Other versions
CN113207058B (zh
Inventor
李建新
李三红
李军利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Enping Aoda Electronic Technology Co ltd
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202110490065.9A priority Critical patent/CN113207058B/zh
Publication of CN113207058A publication Critical patent/CN113207058A/zh
Application granted granted Critical
Publication of CN113207058B publication Critical patent/CN113207058B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明公开了一种音频信号的传输处理方法。能够在检测到音频输出终端从所处的第一音频交互状态切换为第二音频交互状态时,确定差异化音频交互状态信息,从而对第一混响音频交互状态模型进行更新,得到第二混响音频交互状态模型,进一步确定第二音频交互状态中所述音频输出终端的全局待传输音频信号特征。如此设计,能够对混响音频交互状态模型的更新,并基于更新后的模型确定音频输出终端在不同音频交互状态下的全局待传输音频信号特征,这样能够将不同的音频交互状态考虑在内,从而确保全局待传输音频信号特征能够携带音频信号的显著特征,避免在对音频信号进行传输时一些显著特征的缺失,这样可以实现无损传输。

Description

一种音频信号的传输处理方法
技术领域
本公开涉及音频信号传输技术领域,特别涉及一种音频信号的传输处理方法。
背景技术
随着科技的发展,智能电子设备的功能越来越完善。现目前,绝大部分的智能电子设备支持音频传输,从而方便日常办公和业务生活。在通信网络不断优化的信息时代,许多数据信息需要通过通信网络进行远程传输,这样可能导致音频信号在传输过程中出现一些问题。比如,在采用相关技术对音频信号进行传输时,可能出现音频信号的一些显著特征的缺失,从而难以实现无损传输。
发明内容
为改善相关技术中存在的技术问题,本公开提供了一种音频信号的传输处理方法。
本发明提供了一种音频信号的传输处理方法,所述方法包括:
若检测到音频输出终端从所处的第一音频交互状态切换为第二音频交互状态,则基于第一音频交互状态信息和第二音频交互状态信息,确定差异化音频交互状态信息;其中,所述差异化音频交互状态信息用于指示所述第二音频交互状态相对于所述第一音频交互状态的音频交互状态变化情况,所述第一音频交互状态信息包括所述音频输出终端对应的第一音频交互状态特征,所述第二音频交互状态信息包括所述音频输出终端对应的第二音频交互状态特征;
基于所述差异化音频交互状态信息,对第一混响音频交互状态模型进行更新,得到第二混响音频交互状态模型,所述第一混响音频交互状态用于在噪声场景中表征所述第一音频交互状态,所述第二混响音频交互状态模型用于在噪声场景中表征所述第二音频交互状态;
基于所述第二音频交互状态特征和所述第二混响音频交互状态模型,确定所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征。
在一种可替换的实施方式中,所述基于第一音频交互状态信息和第二音频交互状态信息,确定差异化音频交互状态信息,包括:
基于所述第二音频交互状态信息,确定第二噪声干扰信息,所述第二噪声干扰信息用于指示所述第二音频交互状态在噪声场景的音质损耗集合;
确定所述第二噪声干扰信息与第一噪声干扰信息之间的差异化分析结果,得到差异化噪声干扰信息,所述第一噪声干扰信息用于指示所述第一音频交互状态在噪声场景的音质损耗集合;
将所述差异化噪声干扰信息确定为所述差异化音频交互状态信息。
在一种可替换的实施方式中,所述基于所述差异化音频交互状态信息,对第一混响音频交互状态模型进行更新,得到第二混响音频交互状态模型,包括:
对所述差异化音频交互状态信息进行数字化,得到数字化后的差异化音频交互状态信息;
基于所述数字化后的差异化音频交互状态信息,对所述第一混响音频交互状态模型进行更新,得到所述第二混响音频交互状态模型;
所述差异化音频交互状态信息为差异化噪声干扰信息,所述差异化噪声干扰信息是指第二噪声干扰信息与第一噪声干扰信息之间的差异化分析结果,所述第一噪声干扰信息用于指示所述第一音频交互状态在噪声场景的音质损耗集合,所述第二噪声干扰信息用于指示所述第二音频交互状态在噪声场景的音质损耗集合;
所述对所述差异化音频交互状态信息进行数字化,得到数字化后的差异化音频交互状态信息,包括:对所述差异化噪声干扰信息进行数字化,得到数字化后的差异化噪声干扰信息;
所述基于所述数字化后的差异化音频交互状态信息,对所述第一混响音频交互状态模型进行更新,得到所述第二混响音频交互状态模型,包括:将所述数字化后的差异化噪声干扰信息与所述第一混响音频交互状态模型进行加权,得到所述第二混响音频交互状态模型。
在一种可替换的实施方式中,所述基于所述第二音频交互状态特征和所述第二混响音频交互状态模型,确定所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征,包括:
获取所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型;
基于所述差异化音频交互状态信息和音质评价参数,确定第一局部特征与参考音频交互状态之间的第二声纹特征映射模型,所述第一局部特征是指所述第二音频交互状态特征中与变化音频交互状态对应的部分特征,所述变化音频交互状态是指所述第二音频交互状态相对于所述第一音频交互状态发生变化的部分音频交互状态;
基于所述第一声纹特征映射模型和所述第二声纹特征映射模型,将所述第二音频交互状态特征映射到所述第二混响音频交互状态模型中,得到所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征;
所述基于所述第一声纹特征映射模型和所述第二声纹特征映射模型,将所述第二音频交互状态特征映射到所述第二混响音频交互状态模型中,包括:
基于所述第一声纹特征映射模型,将所述第二音频交互状态特征中的第二局部特征映射到所述第二混响音频交互状态模型中,所述第二局部特征是指所述第二音频交互状态特征中与未变化音频交互状态对应的部分特征,所述未变化音频交互状态是指所述第二音频交互状态相对于所述第一音频交互状态未发生变化的部分音频交互状态;
基于所述第二声纹特征映射模型,将所述第二音频交互状态特征中的所述第一局部特征映射到所述第二混响音频交互状态模型中;
所述基于第一音频交互状态信息和第二音频交互状态信息,确定差异化音频交互状态信息之前,还包括:
获取所述音频输出终端所处的第一音频交互状态对应的所述第一音频交互状态信息;
基于所述第一音频交互状态信息,构建所述第一混响音频交互状态模型;基于所述第一音频交互状态信息和音质评价参数,确定所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型;
所述基于所述第一音频交互状态信息和音质评价参数,确定所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型之后,还包括:
基于所述第一声纹特征映射模型,将所述第一音频交互状态特征映射到所述第一混响音频交互状态模型中,得到所述第一音频交互状态中所述音频输出终端的全局待传输音频信号特征。
本发明还提供了一种音频信号的传输处理装置,所述装置包括:
状态信息确定模块,用于若检测到音频输出终端从所处的第一音频交互状态切换为第二音频交互状态,则基于第一音频交互状态信息和第二音频交互状态信息,确定差异化音频交互状态信息;其中,所述差异化音频交互状态信息用于指示所述第二音频交互状态相对于所述第一音频交互状态的音频交互状态变化情况,所述第一音频交互状态信息包括所述音频输出终端对应的第一音频交互状态特征,所述第二音频交互状态信息包括所述音频输出终端对应的第二音频交互状态特征;
状态模型更新模块,用于基于所述差异化音频交互状态信息,对第一混响音频交互状态模型进行更新,得到第二混响音频交互状态模型,所述第一混响音频交互状态用于在噪声场景中表征所述第一音频交互状态,所述第二混响音频交互状态模型用于在噪声场景中表征所述第二音频交互状态;
音频信号特征确定模块,用于基于所述第二音频交互状态特征和所述第二混响音频交互状态模型,确定所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征。
在一种可替换的实施方式中,所述状态信息确定模块,包括:
基于所述第二音频交互状态信息,确定第二噪声干扰信息,所述第二噪声干扰信息用于指示所述第二音频交互状态在噪声场景的音质损耗集合;
确定所述第二噪声干扰信息与第一噪声干扰信息之间的差异化分析结果,得到差异化噪声干扰信息,所述第一噪声干扰信息用于指示所述第一音频交互状态在噪声场景的音质损耗集合;
将所述差异化噪声干扰信息确定为所述差异化音频交互状态信息。
在一种可替换的实施方式中,所述状态模型更新模块,包括:
对所述差异化音频交互状态信息进行数字化,得到数字化后的差异化音频交互状态信息;
基于所述数字化后的差异化音频交互状态信息,对所述第一混响音频交互状态模型进行更新,得到所述第二混响音频交互状态模型;
所述差异化音频交互状态信息为差异化噪声干扰信息,所述差异化噪声干扰信息是指第二噪声干扰信息与第一噪声干扰信息之间的差异化分析结果,所述第一噪声干扰信息用于指示所述第一音频交互状态在噪声场景的音质损耗集合,所述第二噪声干扰信息用于指示所述第二音频交互状态在噪声场景的音质损耗集合;
所述对所述差异化音频交互状态信息进行数字化,得到数字化后的差异化音频交互状态信息,包括:对所述差异化噪声干扰信息进行数字化,得到数字化后的差异化噪声干扰信息;
所述基于所述数字化后的差异化音频交互状态信息,对所述第一混响音频交互状态模型进行更新,得到所述第二混响音频交互状态模型,包括:将所述数字化后的差异化噪声干扰信息与所述第一混响音频交互状态模型进行加权,得到所述第二混响音频交互状态模型。
在一种可替换的实施方式中,所述音频信号特征确定模块,包括:
获取所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型;
基于所述差异化音频交互状态信息和音质评价参数,确定第一局部特征与参考音频交互状态之间的第二声纹特征映射模型,所述第一局部特征是指所述第二音频交互状态特征中与变化音频交互状态对应的部分特征,所述变化音频交互状态是指所述第二音频交互状态相对于所述第一音频交互状态发生变化的部分音频交互状态;
基于所述第一声纹特征映射模型和所述第二声纹特征映射模型,将所述第二音频交互状态特征映射到所述第二混响音频交互状态模型中,得到所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征;
所述基于所述第一声纹特征映射模型和所述第二声纹特征映射模型,将所述第二音频交互状态特征映射到所述第二混响音频交互状态模型中,包括:
基于所述第一声纹特征映射模型,将所述第二音频交互状态特征中的第二局部特征映射到所述第二混响音频交互状态模型中,所述第二局部特征是指所述第二音频交互状态特征中与未变化音频交互状态对应的部分特征,所述未变化音频交互状态是指所述第二音频交互状态相对于所述第一音频交互状态未发生变化的部分音频交互状态;
基于所述第二声纹特征映射模型,将所述第二音频交互状态特征中的所述第一局部特征映射到所述第二混响音频交互状态模型中;
所述基于第一音频交互状态信息和第二音频交互状态信息,确定差异化音频交互状态信息之前,还包括:
获取所述音频输出终端所处的第一音频交互状态对应的所述第一音频交互状态信息;
基于所述第一音频交互状态信息,构建所述第一混响音频交互状态模型;基于所述第一音频交互状态信息和音质评价参数,确定所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型;
所述基于所述第一音频交互状态信息和音质评价参数,确定所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型之后,还包括:
基于所述第一声纹特征映射模型,将所述第一音频交互状态特征映射到所述第一混响音频交互状态模型中,得到所述第一音频交互状态中所述音频输出终端的全局待传输音频信号特征。
本发明还提供了一种计算机设备,包括互相之间通信的处理器和存储器,所述处理器用于从所述存储器中调取计算机程序,并通过运行所述计算机程序实现上述所述的方法。
本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在运行时实现上述所述的方法。
本公开的实施例提供的技术方案可以包括以下有益效果。
本公开提供了一种音频信号的传输处理方法。能够在检测到音频输出终端从所处的第一音频交互状态切换为第二音频交互状态时,基于第一音频交互状态信息和第二音频交互状态信息确定差异化音频交互状态信息,从而对第一混响音频交互状态模型进行更新,得到第二混响音频交互状态模型,进一步基于第二音频交互状态特征和第二混响音频交互状态模型,确定第二音频交互状态中所述音频输出终端的全局待传输音频信号特征。如此设计,能够对混响音频交互状态模型的更新,并基于更新后的模型确定音频输出终端在不同音频交互状态下的全局待传输音频信号特征,这样能够将不同的音频交互状态考虑在内,从而确保全局待传输音频信号特征能够携带音频信号的显著特征,避免在对音频信号进行传输时一些显著特征的缺失,这样可以实现无损传输。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并于说明书一起用于解释本发明的原理。
图1是本发明实施例提供的一种音频信号的传输处理方法的流程图。
图2是本发明实施例提供的一种音频信号的传输处理装置框图。
图3是本发明实施例提供的一种计算机设备的硬件结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
请结合参阅图1,提供了一种音频信号的传输处理方法的流程示意图,具体执行以下步骤S110-步骤S130所描述的内容。
步骤S110,若检测到音频输出终端从所处的第一音频交互状态切换为第二音频交互状态,则基于第一音频交互状态信息和第二音频交互状态信息,确定差异化音频交互状态信息。
在本实施例中,所述差异化音频交互状态信息用于指示所述第二音频交互状态相对于所述第一音频交互状态的音频交互状态变化情况,所述第一音频交互状态信息包括所述音频输出终端对应的第一音频交互状态特征,所述第二音频交互状态信息包括所述音频输出终端对应的第二音频交互状态特征。
可以理解,所述基于第一音频交互状态信息和第二音频交互状态信息,确定差异化音频交互状态信息,可以具体包括:基于所述第二音频交互状态信息,确定第二噪声干扰信息,所述第二噪声干扰信息用于指示所述第二音频交互状态在噪声场景的音质损耗集合;确定所述第二噪声干扰信息与第一噪声干扰信息之间的差异化分析结果,得到差异化噪声干扰信息,所述第一噪声干扰信息用于指示所述第一音频交互状态在噪声场景的音质损耗集合;将所述差异化噪声干扰信息确定为所述差异化音频交互状态信息。
其中,所述基于第一音频交互状态信息和第二音频交互状态信息,确定差异化音频交互状态信息之前,还可以具体包括:获取所述音频输出终端所处的第一音频交互状态对应的所述第一音频交互状态信息;基于所述第一音频交互状态信息,构建所述第一混响音频交互状态模型;基于所述第一音频交互状态信息和音质评价参数,确定所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型。
其中,所述基于所述第一音频交互状态信息和音质评价参数,确定所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型之后,还可以具体包括:基于所述第一声纹特征映射模型,将所述第一音频交互状态特征映射到所述第一混响音频交互状态模型中,得到所述第一音频交互状态中所述音频输出终端的全局待传输音频信号特征。
步骤S120,基于所述差异化音频交互状态信息,对第一混响音频交互状态模型进行更新,得到第二混响音频交互状态模型,所述第一混响音频交互状态用于在噪声场景中表征所述第一音频交互状态,所述第二混响音频交互状态模型用于在噪声场景中表征所述第二音频交互状态。
进一步地,所述基于所述差异化音频交互状态信息,对第一混响音频交互状态模型进行更新,得到第二混响音频交互状态模型,具体包括:对所述差异化音频交互状态信息进行数字化,得到数字化后的差异化音频交互状态信息;基于所述数字化后的差异化音频交互状态信息,对所述第一混响音频交互状态模型进行更新,得到所述第二混响音频交互状态模型;所述差异化音频交互状态信息为差异化噪声干扰信息,所述差异化噪声干扰信息是指第二噪声干扰信息与第一噪声干扰信息之间的差异化分析结果,所述第一噪声干扰信息用于指示所述第一音频交互状态在噪声场景的音质损耗集合,所述第二噪声干扰信息用于指示所述第二音频交互状态在噪声场景的音质损耗集合;在上述实施例的基础上,所述对所述差异化音频交互状态信息进行数字化,得到数字化后的差异化音频交互状态信息,包括:对所述差异化噪声干扰信息进行数字化,得到数字化后的差异化噪声干扰信息;所述基于所述数字化后的差异化音频交互状态信息,对所述第一混响音频交互状态模型进行更新,得到所述第二混响音频交互状态模型,包括:将所述数字化后的差异化噪声干扰信息与所述第一混响音频交互状态模型进行加权,得到所述第二混响音频交互状态模型。
步骤S130,基于所述第二音频交互状态特征和所述第二混响音频交互状态模型,确定所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征。
其中,所述基于所述第二音频交互状态特征和所述第二混响音频交互状态模型,确定所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征,还可以具体包括:获取所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型;基于所述差异化音频交互状态信息和音质评价参数,确定第一局部特征与参考音频交互状态之间的第二声纹特征映射模型,所述第一局部特征是指所述第二音频交互状态特征中与变化音频交互状态对应的部分特征,所述变化音频交互状态是指所述第二音频交互状态相对于所述第一音频交互状态发生变化的部分音频交互状态;基于所述第一声纹特征映射模型和所述第二声纹特征映射模型,将所述第二音频交互状态特征映射到所述第二混响音频交互状态模型中,得到所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征。进一步地,所述基于所述第一声纹特征映射模型和所述第二声纹特征映射模型,将所述第二音频交互状态特征映射到所述第二混响音频交互状态模型中,包括:基于所述第一声纹特征映射模型,将所述第二音频交互状态特征中的第二局部特征映射到所述第二混响音频交互状态模型中,所述第二局部特征是指所述第二音频交互状态特征中与未变化音频交互状态对应的部分特征,所述未变化音频交互状态是指所述第二音频交互状态相对于所述第一音频交互状态未发生变化的部分音频交互状态;基于所述第二声纹特征映射模型,将所述第二音频交互状态特征中的所述第一局部特征映射到所述第二混响音频交互状态模型中;
在执行上述步骤S110-步骤S130所描述的方法时可以达到如下有益技术效果:能够在检测到音频输出终端从所处的第一音频交互状态切换为第二音频交互状态时,基于第一音频交互状态信息和第二音频交互状态信息确定差异化音频交互状态信息,从而对第一混响音频交互状态模型进行更新,得到第二混响音频交互状态模型,进一步基于第二音频交互状态特征和第二混响音频交互状态模型,确定第二音频交互状态中所述音频输出终端的全局待传输音频信号特征。如此设计,能够对混响音频交互状态模型的更新,并基于更新后的模型确定音频输出终端在不同音频交互状态下的全局待传输音频信号特征,这样能够将不同的音频交互状态考虑在内,从而确保全局待传输音频信号特征能够携带音频信号的显著特征,避免在对音频信号进行传输时一些显著特征的缺失,这样可以实现无损传输。
在上述基础上,请结合图2,本发明还提供了一种音频信号的传输处理装置200,应用于与用户终端以及多个医疗终端通信的数据传输服务器,所述装置包括以下功能模块。
状态信息确定模块210,用于若检测到音频输出终端从所处的第一音频交互状态切换为第二音频交互状态,则基于第一音频交互状态信息和第二音频交互状态信息,确定差异化音频交互状态信息;其中,所述差异化音频交互状态信息用于指示所述第二音频交互状态相对于所述第一音频交互状态的音频交互状态变化情况,所述第一音频交互状态信息包括所述音频输出终端对应的第一音频交互状态特征,所述第二音频交互状态信息包括所述音频输出终端对应的第二音频交互状态特征;
状态模型更新模块220,用于基于所述差异化音频交互状态信息,对第一混响音频交互状态模型进行更新,得到第二混响音频交互状态模型,所述第一混响音频交互状态用于在噪声场景中表征所述第一音频交互状态,所述第二混响音频交互状态模型用于在噪声场景中表征所述第二音频交互状态;
音频信号特征确定模块230,用于基于所述第二音频交互状态特征和所述第二混响音频交互状态模型,确定所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征。
其中,所述状态信息确定模块210,包括:
基于所述第二音频交互状态信息,确定第二噪声干扰信息,所述第二噪声干扰信息用于指示所述第二音频交互状态在噪声场景的音质损耗集合;
确定所述第二噪声干扰信息与第一噪声干扰信息之间的差异化分析结果,得到差异化噪声干扰信息,所述第一噪声干扰信息用于指示所述第一音频交互状态在噪声场景的音质损耗集合;
将所述差异化噪声干扰信息确定为所述差异化音频交互状态信息。
其中,所述状态模型更新模块220,包括:
对所述差异化音频交互状态信息进行数字化,得到数字化后的差异化音频交互状态信息;
基于所述数字化后的差异化音频交互状态信息,对所述第一混响音频交互状态模型进行更新,得到所述第二混响音频交互状态模型;
所述差异化音频交互状态信息为差异化噪声干扰信息,所述差异化噪声干扰信息是指第二噪声干扰信息与第一噪声干扰信息之间的差异化分析结果,所述第一噪声干扰信息用于指示所述第一音频交互状态在噪声场景的音质损耗集合,所述第二噪声干扰信息用于指示所述第二音频交互状态在噪声场景的音质损耗集合;
所述对所述差异化音频交互状态信息进行数字化,得到数字化后的差异化音频交互状态信息,包括:对所述差异化噪声干扰信息进行数字化,得到数字化后的差异化噪声干扰信息;
所述基于所述数字化后的差异化音频交互状态信息,对所述第一混响音频交互状态模型进行更新,得到所述第二混响音频交互状态模型,包括:将所述数字化后的差异化噪声干扰信息与所述第一混响音频交互状态模型进行加权,得到所述第二混响音频交互状态模型。
其中,所述音频信号特征确定模块230,包括:
获取所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型;
基于所述差异化音频交互状态信息和音质评价参数,确定第一局部特征与参考音频交互状态之间的第二声纹特征映射模型,所述第一局部特征是指所述第二音频交互状态特征中与变化音频交互状态对应的部分特征,所述变化音频交互状态是指所述第二音频交互状态相对于所述第一音频交互状态发生变化的部分音频交互状态;
基于所述第一声纹特征映射模型和所述第二声纹特征映射模型,将所述第二音频交互状态特征映射到所述第二混响音频交互状态模型中,得到所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征;
所述基于所述第一声纹特征映射模型和所述第二声纹特征映射模型,将所述第二音频交互状态特征映射到所述第二混响音频交互状态模型中,包括:
基于所述第一声纹特征映射模型,将所述第二音频交互状态特征中的第二局部特征映射到所述第二混响音频交互状态模型中,所述第二局部特征是指所述第二音频交互状态特征中与未变化音频交互状态对应的部分特征,所述未变化音频交互状态是指所述第二音频交互状态相对于所述第一音频交互状态未发生变化的部分音频交互状态;
基于所述第二声纹特征映射模型,将所述第二音频交互状态特征中的所述第一局部特征映射到所述第二混响音频交互状态模型中;
所述基于第一音频交互状态信息和第二音频交互状态信息,确定差异化音频交互状态信息之前,还包括:
获取所述音频输出终端所处的第一音频交互状态对应的所述第一音频交互状态信息;
基于所述第一音频交互状态信息,构建所述第一混响音频交互状态模型;基于所述第一音频交互状态信息和音质评价参数,确定所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型;
所述基于所述第一音频交互状态信息和音质评价参数,确定所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型之后,还包括:
基于所述第一声纹特征映射模型,将所述第一音频交互状态特征映射到所述第一混响音频交互状态模型中,得到所述第一音频交互状态中所述音频输出终端的全局待传输音频信号特征。
在上述基础上,请结合参阅图3,提供了一种计算机设备110,包括处理器111以及与所述处理器111连接的存储器112和总线113;其中,所述处理器111和所述存储器112通过所述总线113完成相互间的通信;所述处理器111用于调用所述存储器112中的程序指令,以执行上述的方法。
进一步地,还提供了一种可读存储介质,其上存储有程序,该程序被处理器执行时实现上述的方法。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围执行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (4)

1.一种音频信号的传输处理方法,其特征在于,所述方法包括:
若检测到音频输出终端从所处的第一音频交互状态切换为第二音频交互状态,则基于第一音频交互状态信息和第二音频交互状态信息,确定差异化音频交互状态信息;其中,所述差异化音频交互状态信息用于指示所述第二音频交互状态相对于所述第一音频交互状态的音频交互状态变化情况,所述第一音频交互状态信息包括所述音频输出终端对应的第一音频交互状态特征,所述第二音频交互状态信息包括所述音频输出终端对应的第二音频交互状态特征;
基于所述差异化音频交互状态信息,对第一混响音频交互状态模型进行更新,得到第二混响音频交互状态模型,所述第一混响音频交互状态用于在噪声场景中表征所述第一音频交互状态,所述第二混响音频交互状态模型用于在噪声场景中表征所述第二音频交互状态;
基于所述第二音频交互状态特征和所述第二混响音频交互状态模型,确定所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征。
2.如权利要求1所述的方法,其特征在于,所述基于第一音频交互状态信息和第二音频交互状态信息,确定差异化音频交互状态信息,包括:
基于所述第二音频交互状态信息,确定第二噪声干扰信息,所述第二噪声干扰信息用于指示所述第二音频交互状态在噪声场景的音质损耗集合;
确定所述第二噪声干扰信息与第一噪声干扰信息之间的差异化分析结果,得到差异化噪声干扰信息,所述第一噪声干扰信息用于指示所述第一音频交互状态在噪声场景的音质损耗集合;
将所述差异化噪声干扰信息确定为所述差异化音频交互状态信息。
3.如权利要求1所述的方法,其特征在于,所述基于所述差异化音频交互状态信息,对第一混响音频交互状态模型进行更新,得到第二混响音频交互状态模型,包括:
对所述差异化音频交互状态信息进行数字化,得到数字化后的差异化音频交互状态信息;
基于所述数字化后的差异化音频交互状态信息,对所述第一混响音频交互状态模型进行更新,得到所述第二混响音频交互状态模型;
所述差异化音频交互状态信息为差异化噪声干扰信息,所述差异化噪声干扰信息是指第二噪声干扰信息与第一噪声干扰信息之间的差异化分析结果,所述第一噪声干扰信息用于指示所述第一音频交互状态在噪声场景的音质损耗集合,所述第二噪声干扰信息用于指示所述第二音频交互状态在噪声场景的音质损耗集合;
所述对所述差异化音频交互状态信息进行数字化,得到数字化后的差异化音频交互状态信息,包括:对所述差异化噪声干扰信息进行数字化,得到数字化后的差异化噪声干扰信息;
所述基于所述数字化后的差异化音频交互状态信息,对所述第一混响音频交互状态模型进行更新,得到所述第二混响音频交互状态模型,包括:将所述数字化后的差异化噪声干扰信息与所述第一混响音频交互状态模型进行加权,得到所述第二混响音频交互状态模型。
4.如权利要求1所述的方法,其特征在于,所述基于所述第二音频交互状态特征和所述第二混响音频交互状态模型,确定所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征,包括:
获取所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型;
基于所述差异化音频交互状态信息和音质评价参数,确定第一局部特征与参考音频交互状态之间的第二声纹特征映射模型,所述第一局部特征是指所述第二音频交互状态特征中与变化音频交互状态对应的部分特征,所述变化音频交互状态是指所述第二音频交互状态相对于所述第一音频交互状态发生变化的部分音频交互状态;
基于所述第一声纹特征映射模型和所述第二声纹特征映射模型,将所述第二音频交互状态特征映射到所述第二混响音频交互状态模型中,得到所述第二音频交互状态中所述音频输出终端的全局待传输音频信号特征;
所述基于所述第一声纹特征映射模型和所述第二声纹特征映射模型,将所述第二音频交互状态特征映射到所述第二混响音频交互状态模型中,包括:
基于所述第一声纹特征映射模型,将所述第二音频交互状态特征中的第二局部特征映射到所述第二混响音频交互状态模型中,所述第二局部特征是指所述第二音频交互状态特征中与未变化音频交互状态对应的部分特征,所述未变化音频交互状态是指所述第二音频交互状态相对于所述第一音频交互状态未发生变化的部分音频交互状态;
基于所述第二声纹特征映射模型,将所述第二音频交互状态特征中的所述第一局部特征映射到所述第二混响音频交互状态模型中;
所述基于第一音频交互状态信息和第二音频交互状态信息,确定差异化音频交互状态信息之前,还包括:
获取所述音频输出终端所处的第一音频交互状态对应的所述第一音频交互状态信息;
基于所述第一音频交互状态信息,构建所述第一混响音频交互状态模型;基于所述第一音频交互状态信息和音质评价参数,确定所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型;
所述基于所述第一音频交互状态信息和音质评价参数,确定所述第一音频交互状态特征与参考音频交互状态之间的第一声纹特征映射模型之后,还包括:
基于所述第一声纹特征映射模型,将所述第一音频交互状态特征映射到所述第一混响音频交互状态模型中,得到所述第一音频交互状态中所述音频输出终端的全局待传输音频信号特征。
CN202110490065.9A 2021-05-06 2021-05-06 一种音频信号的传输处理方法 Active CN113207058B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110490065.9A CN113207058B (zh) 2021-05-06 2021-05-06 一种音频信号的传输处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110490065.9A CN113207058B (zh) 2021-05-06 2021-05-06 一种音频信号的传输处理方法

Publications (2)

Publication Number Publication Date
CN113207058A true CN113207058A (zh) 2021-08-03
CN113207058B CN113207058B (zh) 2023-04-28

Family

ID=77029964

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110490065.9A Active CN113207058B (zh) 2021-05-06 2021-05-06 一种音频信号的传输处理方法

Country Status (1)

Country Link
CN (1) CN113207058B (zh)

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070081657A1 (en) * 2005-07-26 2007-04-12 Turner R B Methods and apparatus for enhancing ringback tone quality during telephone communications
US7533346B2 (en) * 2002-01-09 2009-05-12 Dolby Laboratories Licensing Corporation Interactive spatalized audiovisual system
JP2010011272A (ja) * 2008-06-30 2010-01-14 Yamaha Corp 音響エコーキャンセラ
JP2014115316A (ja) * 2012-12-06 2014-06-26 Fujitsu Ltd オーディオ信号符号化装置および方法、オーディオ信号伝送システムおよび方法、オーディオ信号復号装置
US9111542B1 (en) * 2012-03-26 2015-08-18 Amazon Technologies, Inc. Audio signal transmission techniques
US20160086619A1 (en) * 2014-09-24 2016-03-24 Oleg POGORELIK Audio system with noise interference mitigation
US20180167747A1 (en) * 2016-12-13 2018-06-14 Oticon A/S Method of reducing noise in an audio processing device
CN109660911A (zh) * 2018-11-27 2019-04-19 Oppo广东移动通信有限公司 录音音效处理方法、装置、移动终端及存储介质
US20190341047A1 (en) * 2018-09-10 2019-11-07 Baidu Online Network Technology (Beijing) Co., Ltd. Voice Interaction Method, Device and Storage Medium
CN209994549U (zh) * 2019-08-16 2020-01-24 深圳市技湛科技有限公司 音频互动主机及音频互动设备
WO2020108614A1 (zh) * 2018-11-30 2020-06-04 腾讯科技(深圳)有限公司 音频识别方法、定位目标音频的方法、装置和设备
CN111462744A (zh) * 2020-04-02 2020-07-28 深圳创维-Rgb电子有限公司 一种语音交互方法、装置、电子设备及存储介质
US20200265859A1 (en) * 2019-02-15 2020-08-20 Crestron Electronics, Inc. Adaptive beamforming microphone metadata transmission to coordinate acoustic echo cancellation in an audio conferencing sytem
CN111756764A (zh) * 2020-05-11 2020-10-09 深圳市魅鸟科技有限公司 基于WiFi的音频信号交互方法及其系统
WO2020221865A1 (de) * 2019-05-02 2020-11-05 Raschpichler Johannes Verfahren, computerprogrammprodukt, system und vorrichtung zum modifizieren von akustischen interaktionssignalen, die von mindestens einem interaktionspartner erzeugt werden, hinsichtlich eines interaktionsziels

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7533346B2 (en) * 2002-01-09 2009-05-12 Dolby Laboratories Licensing Corporation Interactive spatalized audiovisual system
US20070081657A1 (en) * 2005-07-26 2007-04-12 Turner R B Methods and apparatus for enhancing ringback tone quality during telephone communications
JP2010011272A (ja) * 2008-06-30 2010-01-14 Yamaha Corp 音響エコーキャンセラ
US9111542B1 (en) * 2012-03-26 2015-08-18 Amazon Technologies, Inc. Audio signal transmission techniques
JP2014115316A (ja) * 2012-12-06 2014-06-26 Fujitsu Ltd オーディオ信号符号化装置および方法、オーディオ信号伝送システムおよび方法、オーディオ信号復号装置
US20160086619A1 (en) * 2014-09-24 2016-03-24 Oleg POGORELIK Audio system with noise interference mitigation
US20180167747A1 (en) * 2016-12-13 2018-06-14 Oticon A/S Method of reducing noise in an audio processing device
CN108235181A (zh) * 2016-12-13 2018-06-29 奥迪康有限公司 在音频处理装置中降噪的方法
US20190341047A1 (en) * 2018-09-10 2019-11-07 Baidu Online Network Technology (Beijing) Co., Ltd. Voice Interaction Method, Device and Storage Medium
CN109660911A (zh) * 2018-11-27 2019-04-19 Oppo广东移动通信有限公司 录音音效处理方法、装置、移动终端及存储介质
WO2020108614A1 (zh) * 2018-11-30 2020-06-04 腾讯科技(深圳)有限公司 音频识别方法、定位目标音频的方法、装置和设备
US20200265859A1 (en) * 2019-02-15 2020-08-20 Crestron Electronics, Inc. Adaptive beamforming microphone metadata transmission to coordinate acoustic echo cancellation in an audio conferencing sytem
WO2020221865A1 (de) * 2019-05-02 2020-11-05 Raschpichler Johannes Verfahren, computerprogrammprodukt, system und vorrichtung zum modifizieren von akustischen interaktionssignalen, die von mindestens einem interaktionspartner erzeugt werden, hinsichtlich eines interaktionsziels
CN209994549U (zh) * 2019-08-16 2020-01-24 深圳市技湛科技有限公司 音频互动主机及音频互动设备
CN111462744A (zh) * 2020-04-02 2020-07-28 深圳创维-Rgb电子有限公司 一种语音交互方法、装置、电子设备及存储介质
CN111756764A (zh) * 2020-05-11 2020-10-09 深圳市魅鸟科技有限公司 基于WiFi的音频信号交互方法及其系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
由延军等: "综合海洋战场环境分布交互仿真系统研究", 《系统仿真学报》 *

Also Published As

Publication number Publication date
CN113207058B (zh) 2023-04-28

Similar Documents

Publication Publication Date Title
US11276414B2 (en) Method and device for processing audio signal using audio filter having non-linear characteristics to prevent receipt of echo signal
CN108076226A (zh) 一种通话质量调整的方法、移动终端及存储介质
CN111798852A (zh) 语音唤醒识别性能测试方法、装置、系统及终端设备
CN113241085B (zh) 回声消除方法、装置、设备及可读存储介质
CN101436404A (zh) 可会话的类生物装置及其会话方法
CN112309414B (zh) 基于音频编解码的主动降噪方法、耳机及电子设备
KR102512614B1 (ko) 오디오 개선을 지원하는 전자 장치 및 이를 위한 방법
CN108335701A (zh) 一种进行声音降噪的方法及设备
CN111863011A (zh) 音频处理方法及电子设备
US10388301B2 (en) Method for processing audio signal and electronic device for supporting the same
JP2022088528A (ja) 車載通話方法、装置、電子機器、コンピュータ可読記憶媒体及びコンピュータプログラム
CN109089190A (zh) 阻抗曲线确定方法、装置、存储介质及终端设备
CN113207058B (zh) 一种音频信号的传输处理方法
CN112863545A (zh) 性能测试方法、装置、电子设备及计算机可读存储介质
CN115662409B (zh) 一种语音识别方法、装置、设备及存储介质
CN113225574B (zh) 信号处理方法及装置
CN113808566B (zh) 振动噪音处理方法、装置、电子设备及存储介质
CN115116458A (zh) 语音数据转换方法、装置、计算机设备及存储介质
CN115022771A (zh) 音量调节方法、装置、计算机设备及可读存储介质
CN103916433A (zh) 一种卡拉ok数据处理方法、装置、物联网服务平台及终端
CN114501286A (zh) 蓝牙连接测试方法及装置
CN106297812A (zh) 一种数据处理方法及终端
CN112163532A (zh) 电力系统的振荡模式识别方法及装置
CN110085231A (zh) 基于usb端口的多mic语音助理模块
CN109379685A (zh) Hac实现方法、装置、移动终端及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20230411

Address after: No. 16 Fei'e East Road, Pingshi Development Zone, Enping City, Jiangmen City, Guangdong Province, 529400 (Business premises: Building 1 and 3, B3, Zone 2, Enping Industrial Transfer Park, Enping City)

Applicant after: ENPING AODA ELECTRONIC TECHNOLOGY Co.,Ltd.

Address before: No. 237, Beijing Road, Guandu District, Kunming, Yunnan 650000

Applicant before: Li Jianxin

GR01 Patent grant
GR01 Patent grant