CN117351993B

CN117351993B - 一种基于音频分发的音频传输质量评价方法及系统

Info

Publication number: CN117351993B
Application number: CN202311644880.1A
Authority: CN
Inventors: 许忠; 张碧强; 吴东亮; 方利勇; 陈艳辉; 石晖; 陈哲
Original assignee: Fiontu Intelligent Shenzhen Technology Group Co ltd
Current assignee: Fiontu Intelligent Shenzhen Technology Group Co ltd
Priority date: 2023-12-04
Filing date: 2023-12-04
Publication date: 2024-02-13
Anticipated expiration: 2043-12-04
Also published as: CN117351993A

Abstract

本发明公开了一种基于音频分发的音频传输质量评价方法及系统，通过将用户音频数据进行环境声音频分析与人声音频分析，得到环境音频数据与人声音频数据；基于所述环境音频数据与人声音频数据进行用户行为特征的周期性变化分析，得到行为特征数据；基于时间维度，获取实时环境音频数据进行数据序列化并基于LSTM预测模型进行音频特征分析与预测，结果预测音频数据；基于结果预测音频数据与行为特征数据进行基于音频传输方案分析与降噪音频分析，得到音频传输方案。通过本发明，能够基于用户行为特征，在音频数据的处理中，实现动态调整音频处理方案的目的，从而提高音频数据的传输效率与降噪处理的质量，实现音频数据的科学评价分析，提高用户体验。

Description

一种基于音频分发的音频传输质量评价方法及系统

技术领域

本发明涉及音频分析领域，更具体的，涉及一种基于音频分发的音频传输质量评价方法及系统。

背景技术

随着音频数据处理的快速发展，如何有效地分析和处理这些数据成为了一个重要的问题。在音频分析领域，现有的方法往往只关注音频本身的特征，而忽略了用户特征和行为对于音频分析的影响，且缺少动态分析用户音频数据处理与科学评价分析音频数据的技术方案，因此，本发明提出一种基于音频分发的音频传输质量评价方法，以解决现有技术的不足。

发明内容

本发明克服了现有技术的缺陷，提出了一种基于音频分发的音频传输质量评价方法及系统。

本发明第一方面提供了一种基于音频分发的音频传输质量评价方法，包括：

在一个预设时间段内，基于预设用户终端，获取用户音频数据；

将所述用户音频数据进行环境声音频分析与人声音频分析，得到环境音频数据与人声音频数据；

基于所述环境音频数据与人声音频数据进行用户行为特征的周期性变化分析，得到行为特征数据；

基于时间维度，获取实时环境音频数据进行数据序列化并基于LSTM预测模型进行音频特征分析与预测，结果预测音频数据；

基于结果预测音频数据与行为特征数据进行基于音频传输方案分析与降噪音频分析，得到音频传输方案。

本方案中，所述在一个预设时间段内，基于预设用户终端，获取用户音频数据，具体为：

基于一个预设时间段，划分为多个分析周期；

在一个预设时间段内，获取第一音频数据；

基于所述多个分析周期，将用户音频数据进行数据划分，形成多个用户音频数据。

本方案中，所述将所述用户音频数据进行环境声音频分析与人声音频分析，得到环境音频数据与人声音频数据，具体为：

从系统数据库中获取用户历史人声音频数据；

基于所述用户历史人声音频数据进行基于频率、振幅、音频波形的特征提取，得到音频对比特征数据；

分析所有用户音频数据并进行人声与环境声分离，结合音频对比特征数据进行特征相似性分析，并得到分离后的环境音频数据与人声音频数据。

本方案中，所述基于所述环境音频数据与人声音频数据进行用户行为特征的周期性变化分析，得到行为特征数据，具体为：

基于每个分析周期的人声音频数据进行人声音频质量评估，得到音频质量信息；

基于每个分析周期的人声音频数据进行用户通话行为分析，得到通话时长与通话时间段信息；

基于所述通话时长、通话时间段信息、音频质量信息，生成用户行为特征数据。

本方案中，所述基于所述环境音频数据与人声音频数据进行用户行为特征的周期性变化分析，得到行为特征数据，还包括：

获取每个分析周期的环境音频数据；

基于所述环境音频数据进行基于频率、振幅、音频波形的特征提取，得到环境音频特征数据；

基于所述环境音频特征数据进行周期性的变化分析，变化分析维度包括频率、振幅、波形的特征变化，得到周期性变化特征信息。

本方案中，所述基于时间维度，获取实时环境音频数据进行数据序列化并基于LSTM预测模型进行音频特征分析与预测，生成结果预测音频数据，之前包括：

构建基于LSTM的预测模型；

从系统数据库中获取预设数据量的用户历史环境音频数据；

将所述用户历史环境音频数据进行数据清洗、去重、标准化预处理；

将所述用户历史环境音频数据按照预设比例与时间顺序划分训练集和测试集；

将所述训练集和测试集导入所述预测模型进行模型训练，直至模型的预测准确率达到预设值。

本方案中，所述基于时间维度，获取实时环境音频数据进行数据序列化并基于LSTM预测模型进行音频特征分析与预测，生成结果预测音频数据，具体为：

根据当前时间段，分析出当前在一个预设时间段内的所属分析周期，并标记为当前分析周期；

获取当前分析周期与前N个分析周期的对应环境音频数据，并将所述的对应环境音频数据标记为实时环境音频数据；

基于时间维度，将所述实时环境音频数据进行音频特征提取与特征数据序列化，得到环境音频序列化数据；

将所述环境音频序列化数据导入预测模型，进行下一个分析周期的音频数据预测，得到序列化格式的音频预测数据；

将所述音频预测数据进行数据分段，并判断是否符合周期性变化特征信息，将符合周期性变化特征信息的预测数据进行提取，得到结果预测音频数据。

本方案中，所述基于结果预测音频数据与行为特征数据进行基于音频传输方案分析与降噪音频分析，得到音频传输方案，具体为：

获取预设实时音频压缩算法信息；

将所述结果预测音频数据作为测试压缩数据，根据预设实时音频压缩算法信息进行多种压缩算法的测试，得到多个测试音频数据；

基于所述多个测试音频数据进行音频质量评估，得到音频质量评价结果，并将质量最优的测试数据所对应的音频压缩算法作为下一分析周期的传输压缩算法；

基于反相技术将预测音频数据进行降噪分析，得到降噪特征数据；

基于降噪特征数据与用户行为特征数据动态生成下一分析周期的音频降噪方案；

基于所述传输压缩算法与音频降噪方案进行方案整合，形成音频传输方案；

基于音频传输方案，对预设用户终端进行音频数据的实时分发与传输。

本发明第二方面还提供了一种基于音频分发的音频传输质量评价系统，该系统包括：存储器、处理器，所述存储器中包括基于音频分发的音频传输质量评价程序，所述基于音频分发的音频传输质量评价程序被所述处理器执行时实现如下步骤：

本发明第三方面还提供一种计算机可读存储介质，所述计算机可读存储介质中包括基于音频分发的音频传输质量评价程序，所述基于音频分发的音频传输质量评价程序被处理器执行时，实现如上述任一项所述的基于音频分发的音频传输质量评价方法的步骤。

附图说明

图1示出了本发明一种基于音频分发的音频传输质量评价方法的流程图；

图2示出了本发明用户音频数据获取流程图；

图3示出了本发明环境音频数据获取流程图；

图4示出了本发明一种基于音频分发的音频传输质量评价系统的框图。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点，下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是，在不冲突的情况下，本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是，本发明还可以采用其他不同于在此描述的其他方式来实施，因此，本发明的保护范围并不受下面公开的具体实施例的限制。

图1示出了本发明一种基于音频分发的音频传输质量评价方法的流程图。

如图1所示，本发明第一方面提供了一种基于音频分发的音频传输质量评价方法，包括：

S102，在一个预设时间段内，基于预设用户终端，获取用户音频数据；

S104，将所述用户音频数据进行环境声音频分析与人声音频分析，得到环境音频数据与人声音频数据；

S106，基于所述环境音频数据与人声音频数据进行用户行为特征的周期性变化分析，得到行为特征数据；

S108，基于时间维度，获取实时环境音频数据进行数据序列化并基于LSTM预测模型进行音频特征分析与预测，结果预测音频数据；

S110，基于结果预测音频数据与行为特征数据进行基于音频传输方案分析与降噪音频分析，得到音频传输方案。

需要说明的是，所述LSTM即长短期记忆网络，是一种时间递归神经网络，适合于处理和预测时间序列数据。

图2示出了本发明用户音频数据获取流程图。

根据本发明实施例，所述在一个预设时间段内，基于预设用户终端，获取用户音频数据，具体为：

S202，基于一个预设时间段，划分为多个分析周期；

S204，在一个预设时间段内，获取第一音频数据；

S206，基于所述多个分析周期，将用户音频数据进行数据划分，形成多个用户音频数据。

需要说明的是，所述预设用户终端包括用户音频使用终端与数据处理终端，且数据处理终端与用户音频使用终端可通过优先或无线方式进行连接，所述用户音频使用终端一般为耳机，所述数据处理终端一般为移动终端或计算机终端。所述第一音频数据为在一个预设时间段得到的总音频数据，包括用户使用音频设备的通话音频、环境音频、用户媒体音频数据等。

图3示出了本发明环境音频数据获取流程图。

根据本发明实施例，所述将所述用户音频数据进行环境声音频分析与人声音频分析，得到环境音频数据与人声音频数据，具体为：

S302，从系统数据库中获取用户历史人声音频数据；

S304，基于所述用户历史人声音频数据进行基于频率、振幅、音频波形的特征提取，得到音频对比特征数据；

S306，分析所有用户音频数据并进行人声与环境声分离，结合音频对比特征数据进行特征相似性分析，并得到分离后的环境音频数据与人声音频数据。

需要说明的是，每个分析周期均有对应环境音频数据与人声音频数据。后续通过周期性分析用户的行为特征。

根据本发明实施例，所述基于所述环境音频数据与人声音频数据进行用户行为特征的周期性变化分析，得到行为特征数据，具体为：

需要说明的是，所述人声音频数据即每个周期的分析得到的人声音频数据，即代表了用户在使用音频设备时的通话数据，通过人声音频数据，基于时间维度能够分析出用户的通话时间、时长、与音频通话质量等信息。另外，所述用户行为特征数据包括不同使用周期下的音频质量信息，通过音频质量信息，在后续进行行为特征分析与方案分析时，能够针对不同的使用周期进行在方案中进行针对性音频数据调控，例如降噪调控，从而提高用户体验。

根据本发明实施例，所述基于所述环境音频数据与人声音频数据进行用户行为特征的周期性变化分析，得到行为特征数据，还包括：

获取每个分析周期的环境音频数据；

需要说明的是，本发明实施例中，所述一个预设时间段可以为一天，或一周，具体为用户的一个使用周期决定。例如，在一周内，用户使用音频设备的频率为周六日全天与周一到周五的某个固定时间段，则预设时间段可以设置为一周，分析周期可以为一天。通过周期性分析音频数据，能够从数据角度获知其环境音频的变化特征与涉及人声音频时的使用行为特征。在一个固定用户的使用音频设备过程中，由于手使用习惯与人为特定，一般其使用环境会呈现一定的规律变化，进一步能够反映在其音频特征的变化上。如，某一用户固定于某一时间段进行户外运动，其音频设备采集的户外音频环境特征将呈一定的周期性变化。

根据本发明实施例，所述基于时间维度，获取实时环境音频数据进行数据序列化并基于LSTM预测模型进行音频特征分析与预测，生成结果预测音频数据，之前包括：

构建基于LSTM的预测模型；

从系统数据库中获取预设数据量的用户历史环境音频数据；

根据本发明实施例，所述基于时间维度，获取实时环境音频数据进行数据序列化并基于LSTM预测模型进行音频特征分析与预测，生成结果预测音频数据，具体为：

需要说明的是，所述得到的音频预测数据中，为一个较大预设数据量的预测数据，通过后续的周期性变化特征信息进行较佳预测数据的筛选。

根据本发明实施例，所述基于结果预测音频数据与行为特征数据进行基于音频传输方案分析与降噪音频分析，得到音频传输方案，具体为：

获取预设实时音频压缩算法信息；

需要说明的是，所述音频传输方案实时压缩算法的选择方案与周期性降噪方案。所述预设实时音频压缩算法信息包括多种压缩算法，如MP3、AAC、OGG等，不同压缩算法在实时音频传输的数据传输效果存在差异。在本发明中，通过对用户特征分析与周期性环境音频分析与音频数据与预测，并基于预测数据进行传输测试，并最终形成较佳的压缩算法的选择与降噪方案，能够实现动态更正用户传输方案，使用户在不同的使用周期下保持最佳体验，并提升音频传输系统的稳定性与传输效率。所述音频质量评价结果为通过分析音频质量、音频压缩后数据大小与音频传输延迟得到的，为一种综合评价数据，通过该数据能够综合评价一种预设算法对当前结果预测音频数据的数据传输效果。

根据本发明实施例，还包括：

设定一个预设时间段内包括N个分析周期；

获取N个分析周期对应的用户行为特征数据；

基于所述用户行为特征数据进行设备音频需求分析，得到周期性人声音频传输需求信息；

基于所述周期性人声音频传输需求信息，结合用户行为特征数据、传输压缩算法，生成人声音频增强方案。

需要说明的是，所述人声增强需求信息包括人声增强需求时间段与增强算法选择。在本发明中，通过周期性用户行为特征数据，能够得到用户在使用音频设备时，有人声音频处理需求的时间，并基于该时间段，进一步分析出对于人声音频进行音频增强的需求方案（即人声音频增强方案），该方案包括预设的增强时间段，对人声增强后数据传输的压缩算法选择等信息。所述人声音频增强方案适用于下一分析周期的人声音频处理过程。

N为预定值。

本发明第二方面还提供了一种基于音频分发的音频传输质量评价系统4，该系统包括：存储器41、处理器42，所述存储器中包括基于音频分发的音频传输质量评价程序，所述基于音频分发的音频传输质量评价程序被所述处理器执行时实现如下步骤：

基于一个预设时间段，划分为多个分析周期；

在一个预设时间段内，获取第一音频数据；

从系统数据库中获取用户历史人声音频数据；

获取每个分析周期的环境音频数据；

构建基于LSTM的预测模型；

从系统数据库中获取预设数据量的用户历史环境音频数据；

获取预设实时音频压缩算法信息；

需要说明的是，所述音频传输方案实时压缩算法的选择方案与周期性降噪方案。所述预设实时音频压缩算法信息包括多种压缩算法，如MP3、AAC、OGG等，不同压缩算法在实时音频传输的数据传输效果存在差异。在本发明中，通过对用户特征分析与周期性环境音频分析与音频数据与预测，并基于预测数据进行传输测试，并最终形成较佳的压缩算法的选择与降噪方案，能够实现动态更正用户传输方案，使用户在不同的使用周期下保持最佳体验，并提升音频传输系统的稳定性与传输效率。

根据本发明实施例，还包括：

设定一个预设时间段内包括N个分析周期；

获取N个分析周期对应的用户行为特征数据；

在本申请所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，如：多个单元或组件可以结合，或可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口，设备或单元的间接耦合或通信连接，可以是电性的、机械的或其它形式的。

上述作为分离部件说明的单元可以是、或也可以不是物理上分开的，作为单元显示的部件可以是、或也可以不是物理单元；既可以位于一个地方，也可以分布到多个网络单元上；可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外，在本发明各实施例中的各功能单元可以全部集成在一个处理单元中，也可以是各单元分别单独作为一个单元，也可以两个或两个以上单元集成在一个单元中；上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：移动存储设备、只读存储器（ROM，Read-Only Memory）、随机存取存储器（RAM，Random Access Memory）、磁碟或者光盘等各种可以存储程序代码的介质。

或者，本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机、服务器、或者网络设备等）执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括：移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种基于音频分发的音频传输质量评价方法，其特征在于，包括：

基于结果预测音频数据与行为特征数据进行基于音频传输方案分析与降噪音频分析，得到音频传输方案；

其中，所述基于所述环境音频数据与人声音频数据进行用户行为特征的周期性变化分析，得到行为特征数据，具体为：

基于所述通话时长、通话时间段信息、音频质量信息，生成用户行为特征数据；

其中，所述基于所述环境音频数据与人声音频数据进行用户行为特征的周期性变化分析，得到行为特征数据，还包括：

获取每个分析周期的环境音频数据；

基于所述环境音频特征数据进行周期性的变化分析，变化分析维度包括频率、振幅、波形的特征变化，得到周期性变化特征信息；

其中，所述基于时间维度，获取实时环境音频数据进行数据序列化并基于LSTM预测模型进行音频特征分析与预测，生成结果预测音频数据，具体为：

将所述音频预测数据进行数据分段，并判断是否符合周期性变化特征信息，将符合周期性变化特征信息的预测数据进行提取，得到结果预测音频数据；

其中，所述基于结果预测音频数据与行为特征数据进行基于音频传输方案分析与降噪音频分析，得到音频传输方案，具体为：

获取预设实时音频压缩算法信息；

2.根据权利要求1所述的一种基于音频分发的音频传输质量评价方法，其特征在于，所述在一个预设时间段内，基于预设用户终端，获取用户音频数据，具体为：

基于一个预设时间段，划分为多个分析周期；

在一个预设时间段内，获取第一音频数据；

3.根据权利要求1所述的一种基于音频分发的音频传输质量评价方法，其特征在于，所述将所述用户音频数据进行环境声音频分析与人声音频分析，得到环境音频数据与人声音频数据，具体为：

从系统数据库中获取用户历史人声音频数据；

4.根据权利要求3所述的一种基于音频分发的音频传输质量评价方法，其特征在于，所述基于时间维度，获取实时环境音频数据进行数据序列化并基于LSTM预测模型进行音频特征分析与预测，生成结果预测音频数据，之前包括：

构建基于LSTM的预测模型；

从系统数据库中获取预设数据量的用户历史环境音频数据；

5.一种基于音频分发的音频传输质量评价系统，其特征在于，该系统包括：存储器、处理器，所述存储器中包括基于音频分发的音频传输质量评价程序，所述基于音频分发的音频传输质量评价程序被所述处理器执行时实现如下步骤：

获取每个分析周期的环境音频数据；

获取预设实时音频压缩算法信息；

6.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中包括基于音频分发的音频传输质量评价程序，所述基于音频分发的音频传输质量评价程序被处理器执行时，实现如权利要求1至4中任一项所述的基于音频分发的音频传输质量评价方法的步骤。