CN112562737A

CN112562737A - 一种音频处理质量的评价方法、装置、介质及电子设备

Info

Publication number: CN112562737A
Application number: CN202110207811.9A
Authority: CN
Inventors: 张海朋
Original assignee: Beijing Yingke Cheese Network Technology Co ltd
Current assignee: Beijing Yingke Cheese Network Technology Co ltd
Priority date: 2021-02-25
Filing date: 2021-02-25
Publication date: 2021-03-26
Anticipated expiration: 2041-02-25
Also published as: CN112562737B

Abstract

本申请实施例公开了一种音频处理质量的评价方法、装置、介质及电子设备。该方法包括：获取所述电子设备中音频处理流程的目标阶段；获取所述目标阶段的输入接口输入的待处理音频数据，并采用预先设置的标准音频数据替换所述待处理音频数据；获取所述目标阶段的输出接口输出的处理结果数据；将所述标准音频数据和所述处理结果数据输入至评价模型，以得到所述目标阶段的音频处理质量评价结果。本发明实施例所提供的技术方案，可以通过对音频处理的个别阶段实现音频的标准化输入，以对处理结果进行统一标准的量化评价，从而实现音频处理评价的客观性。

Description

一种音频处理质量的评价方法、装置、介质及电子设备

技术领域

本申请实施例涉及音频处理技术领域，尤其涉及一种音频处理质量的评价方法、装置、介质及电子设备。

背景技术

随着互联网技术的快速发展，直播平台的使用已经融入广大用户的生活。在直播平台提供的直播间中，主播可以录制音视频信息并上传，同一直播间的观众可以实时看到音视频信息，从而可以实现主播与观众之间的自安息分享。在直播平台中，实时音频部分既是基础也是核心技术，音频数据处理以及呈现质量关系到用户直观使用体验。音频数据处理指令在音频处理、音频编解码、网络传输等主要环节都会受到影响，也就需要准确客观的去量化这些因素影响。为客观衡量、评估、对比不同方案优劣，需要一套有效的测评方法，以便对不同音频处理方案进行质量评估，辅助找到最优的音频处理方案，最大的提高用户体验。

现有技术中，由于音频数据依赖于用户设备以及用户所处环境，在不同条件下产生数据会有很大差异，导致质量评估系统输入源千差万别，这也是通常评估方法特别是全参考类算法无法很好应用于实际工程实践的最大障碍，一般采用加大样本数、人工粗分类后计算整体质量值来规避。虽然整体上能反应实际情况和监控质量变化，但费时费力无法准确回溯对比过程。

发明内容

本申请实施例提供一种音频处理质量的评价方法、装置、介质及电子设备，可以通过对音频处理的个别阶段实现音频的标准化输入，以对处理结果进行统一标准的量化评价，从而实现音频处理评价的客观性。

第一方面，本申请实施例提供了一种音频处理质量的评价方法，所述音频处理质量的评价方法由测试组件执行，所述测试组件配置于音频处理的电子设备中，所述方法包括：

获取所述电子设备中音频处理流程的目标阶段；

获取所述目标阶段的输入接口输入的待处理音频数据，并采用预先设置的标准音频数据替换所述待处理音频数据；

获取所述目标阶段的输出接口输出的处理结果数据；

将所述标准音频数据和所述处理结果数据输入至评价模型，以得到所述目标阶段的音频处理质量评价结果。

进一步的，获取所述目标阶段的输入接口输入的待处理音频数据，并采用预先设置的标准音频数据替换所述待处理音频数据，包括：

采用Tweak插件拦截所述目标阶段的输入接口输入的待处理音频数据，并将预先设置的标准音频数据替换所述待处理音频数据；

获取所述目标阶段的输出接口输出的处理结果数据，包括：

Tweak插件拦截所述目标阶段的输出接口输出的所述目标阶段对所述标准音频数据的处理结果数据。

进一步的，所述Tweak插件还用于存储所述处理结果数据。

进一步的，将所述标准音频数据和所述处理结果数据输入至评价模型，以得到所述目标阶段的音频处理质量评价结果，包括：

将所述标准音频数据和所述处理结果数据输入至PESQ音频质量评价模型，以得到所述PESQ音频质量评价模型对所述目标阶段的音频处理质量评价结果。

进一步的，所述目标阶段包括采集到音频数据之后的音频前处理阶段，以及音频前处理阶段之后的音频编码阶段。

进一步的，若所述目标阶段为音频编码阶段，则在获取所述目标阶段的输出接口输出的处理结果数据之后，所述方法还包括：

采用预设解码规则对音频编码阶段输出接口输出的处理结果数据进行解码处理，以得到待评价音频编码结果数据；

相应的，将所述标准音频数据和所述处理结果数据输入至评价模型，以得到所述目标阶段的音频处理质量评价结果，包括：

将所述标准音频数据和所述待评价音频编码结果数据输入至评价模型，以得到所述目标阶段的音频处理质量评价结果。

进一步的，所述音频处理流程为直播应用当中的音频的处理流程。

第二方面，本申请实施例提供了一种音频处理质量的评价装置，所述音频处理质量的评价装置配置于测试组件中，所述测试组件配置于音频处理的电子设备中，所述方法包括：

目标阶段确定模块，用于获取所述电子设备中音频处理流程的目标阶段；

输入替换模块，用于获取所述目标阶段的输入接口输入的待处理音频数据，并采用预先设置的标准音频数据替换所述待处理音频数据；

处理结果数据获取模块，用于获取所述目标阶段的输出接口输出的处理结果数据；

音频处理质量评价模块，用于将所述标准音频数据和所述处理结果数据输入至评价模型，以得到所述目标阶段的音频处理质量评价结果。

第三方面，本申请实施例提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本申请实施例第一方面和第二方面所述的音频处理质量的评价方法。

第四方面，本申请实施例提供了一种电子设备，该电子设备包括存储器，处理器及存储在存储器上并可在处理器运行的计算机程序，所述处理器执行所述计算机程序时实现如本申请实施例第一方面和第二方面所述的音频处理质量的评价方法。

本申请实施例所提供的技术方案，获取所述电子设备中音频处理流程的目标阶段；获取所述目标阶段的输入接口输入的待处理音频数据，并采用预先设置的标准音频数据替换所述待处理音频数据；获取所述目标阶段的输出接口输出的处理结果数据；将所述标准音频数据和所述处理结果数据输入至评价模型，以得到所述目标阶段的音频处理质量评价结果。本申请实施例所提供的技术方案，可以通过对音频处理的个别阶段实现音频的标准化输入，以对处理结果进行统一标准的量化评价，从而实现音频处理评价的客观性。

附图说明

图1是本申请实施例提供的音频处理质量的评价方法的流程图；

图2是本申请实施例提供的针对前处理阶段的流程示意图；

图3是本申请实施例提供的针对音频编码阶段的流程示意图；

图4是本申请实施例提供的音频处理质量的评价装置的结构示意图；

图5是本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本申请，而非对本申请的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本申请相关的部分而非全部结构。

在更加详细地讨论示例性实施例之前应当提到的是，一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理，但是其中的许多步骤可以被并行地、并发地或者同时实施。此外，各步骤的顺序可以被重新安排。当其操作完成时所述处理可以被终止，但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。

图1是本申请实施例提供的音频处理质量的评价方法的流程图，本实施例可适用于直播平台的音频处理情况，该方法可以由本申请实施例所提供的音频处理质量的评价装置执行，该装置可以由软件和/或硬件的方式来实现，并可集成于运行此系统的电子设备中。

如图1所示，所述音频处理质量的评价方法包括：

S110、获取所述电子设备中音频处理流程的目标阶段。

其中，所述音频处理质量的评价方法由测试组件执行，所述测试组件配置于音频处理的电子设备中

测试组件可以是由软件来实现测试功能的组件，还可以包括硬件部分，例如该测试组件拥有自己独立的微处理器等。音频处理的电子设备，可以是安装有直播软件的移动终端，还可以是为直播平台提供服务的服务器。

本方案中，可选的，所述音频处理流程为直播应用当中的音频的处理流程。

音频处理流程可以包括采集、前处理、编码以及编码后数据发送至服务器等阶段。而在直播平台的音频处理中，影响音频质量的过程主要集中在前处理和编码两个过程。所以对直播中音频处理方案优劣的评测主要集中在音频前处理阶段和音频编码阶段。

本方案中，可选的，所述目标阶段包括采集到音频数据之后的音频前处理阶段，以及音频前处理阶段之后的音频编码阶段。

音频前处理，可以是声音没有进入传输、没有存储之前的处理。声音前处理目的，就是让声音的存储、传输效率更高，识别率更好。例如回声消除、降噪、声音活动检测等等。音频编码主要是完成对声音信息的压缩。声音信号数字化后，信息量比模拟传输状态大很多，不能像模拟电视声音那样直接传输；因而需要对声音多一道压缩编码工序，即为音频编码。通过将音频前处理阶段和音频编码阶段作为目标阶段，可以极大程度的覆盖音频处理过程，对音频处理质量的评价能够更好的在实际工程中应用。

S120、获取所述目标阶段的输入接口输入的待处理音频数据，并采用预先设置的标准音频数据替换所述待处理音频数据。

其中，目标阶段可以是音频前处理阶段或者音频编码阶段，可以在音频处理流程中预先设置拦截器进行拦截，从而在输入接口获取待处理音频数据。其中，待处理音频数据可以是实际直播内容录制过程中的音频数据。

其中，标准音频数据可以是预先录制并存储的，用于替换待处理音频数据的。标准音频数据可以是在一个特定的环境中进行录制的，可以因为环境的已知，或者预先对标准音频数据的分析，确定标准音频数据中存在哪些需要处理的成分。

S130、获取所述目标阶段的输出接口输出的处理结果数据。

本方案中，可以在目标阶段的输出接口处，获取目标阶段对标准音频数据的处理结果数据，从而可以将其与标准音频数据进行对比，来确定该阶段的处理过程是否能够满足音频处理的条件。

S140、将所述标准音频数据和所述处理结果数据输入至评价模型，以得到所述目标阶段的音频处理质量评价结果。

本方案中，可以将标准音频数据和所述处理结果数据输入至评价模型，得到音频处理质量评价结果。可以理解的，该评价模型可以用于对目标阶段的处理是否满足预估的处理条件进行评价，通过将输入数据替换为标准音频数据，可以针对不同的处理方式进行统一的量化分析，从而可以确定哪一种处理才是更加准确的。

本方案中，也可以在输出的评价结果中，对不同的处理进行不同的评分，例如降噪60分，声音活动检测80分，等等。通过这样的设置，可以对多种处理方式按照不同的维度进行区分评分，从而明确哪一种处理方式更适用于哪一种场景。

在上述各技术方案的基础上，可选的，获取所述目标阶段的输入接口输入的待处理音频数据，并采用预先设置的标准音频数据替换所述待处理音频数据，包括：

获取所述目标阶段的输出接口输出的处理结果数据，包括：

图2是本申请实施例提供的针对前处理阶段的流程示意图，如图2所示，利用Tweak插件拦截设备原始音频数据输入，使用提前准备好的标准音频文件代替作为音频前处理过程的输入，以保证原始输入音频的统一性。

本方案中，可选的，所述Tweak插件还用于存储所述处理结果数据。

同时利用Tweak插件拦截编码器输入接口，将前处理模块加工后的数据导出并存储，然后将标准音频文件和经过音频前处理后的音频文件导入PESQ质量评估模块计算得分。

本方案中，将所述标准音频数据和所述处理结果数据输入至评价模型，以得到所述目标阶段的音频处理质量评价结果，包括：

PESQ 是电信语音质量广泛使用的增强感知测量。它由OPTICOM有限公司获得许可,是ITU-T建议P.862的基础。PSEQ工具是用来计算语音样本的MOS-LQO（Mean OpinionScore – Listening Quality Objective）值，PESQ把在信号传输通过设备时提取的输出信号与参照信号进行比较计算出差异值。一般情况下，输出信号和参照信号的差异性越大，计算出的MOS参数值就越低。

在上述各技术方案的基础上，可选的，若所述目标阶段为音频编码阶段，则在获取所述目标阶段的输出接口输出的处理结果数据之后，所述方法还包括：

音频编码技术分为三种：波形编码、参数编码和混合编码。一般来说，波形编码的话音质量高，但编码率也很高；参数编码的编码率很低，产生的合成语音的音质不高；混合编码使用参数编码技术和波形编码技术，编码率和音质介于它们之间。

图3是本申请实施例提供的针对音频编码阶段的流程示意图，如图3所示，在音频编码过程中，利用Tweak插件拦截原始编码输入数据，用标准音频文件代替输入编码过程，同时在用Tweak插件拦截编码完成后的输出数据并导出，用统一的方式去解码，然后把输入的标准音频文件和解码后的音频文件一起导入跟音频前处理一样的PESQ音频质量评估模块，得到评估分值。

本方案提供一种音频处理质量评估方法，有效的对不同的音频处理方案进行质量评估，以提高用户体验。

图4是本申请实施例提供的音频处理质量的评价装置的结构示意图，所述音频处理质量的评价装置配置于测试组件中，所述测试组件配置于音频处理的电子设备中，如图4所示，该装置可以包括：

目标阶段确定模块410，用于获取所述电子设备中音频处理流程的目标阶段；

输入替换模块420，用于获取所述目标阶段的输入接口输入的待处理音频数据，并采用预先设置的标准音频数据替换所述待处理音频数据；

处理结果数据获取模块430，用于获取所述目标阶段的输出接口输出的处理结果数据；

音频处理质量评价模块440，用于将所述标准音频数据和所述处理结果数据输入至评价模型，以得到所述目标阶段的音频处理质量评价结果。

本发明实施例所提供的一种音频处理质量的评价装置可执行本发明实施例所提供的一种音频处理质量的评价方法，具备执行一种音频处理质量的评价方法相应的功能模块和有益效果。

本申请实施例还提供一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时用于执行一种音频处理质量的评价方法，该方法包括：

获取所述电子设备中音频处理流程的目标阶段；

获取所述目标阶段的输出接口输出的处理结果数据；

存储介质是指任何的各种类型的存储器电子设备或存储电子设备。术语“存储介质”旨在包括：安装介质，例如CD-ROM、软盘或磁带装置；计算机系统存储器或随机存取存储器，诸如DRAM、DDR RAM、SRAM、EDO RAM，兰巴斯(Rambus)RAM等；非易失性存储器，诸如闪存、磁介质(例如硬盘或光存储)；寄存器或其它相似类型的存储器元件等。存储介质可以还包括其它类型的存储器或其组合。另外，存储介质可以位于程序在其中被执行的计算机系统中，或者可以位于不同的第二计算机系统中，第二计算机系统通过网络(诸如因特网)连接到计算机系统。第二计算机系统可以提供程序指令给计算机用于执行。术语“存储介质”可以包括可以驻留在不同未知中(例如在通过网络连接的不同计算机系统中)的两个或更多存储介质。存储介质可以存储可由一个或多个处理器执行的程序指令(例如具体实现为计算机程序)。

当然，本申请实施例所提供的一种包含计算机可执行指令的存储介质，其计算机可执行指令不限于如上所述的音频处理质量的评价方法操作，还可以执行本申请任意实施例所提供的音频处理质量的评价方法中的相关操作。

本申请实施例提供了一种电子设备，该电子设备中可集成本申请实施例提供的音频处理质量的评价装置，该电子设备可以是配置于系统内的，也可以是执行系统内的部分或者全部功能的设备。图5是本申请实施例提供的一种电子设备的结构示意图。如图5所示，本实施例提供了一种电子设备500，其包括：一个或多个处理器520；存储装置510，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器520执行，使得所述一个或多个处理器520实现本申请实施例所提供的音频处理质量的评价方法，该方法包括：

获取所述电子设备中音频处理流程的目标阶段；

获取所述目标阶段的输出接口输出的处理结果数据；

当然，本领域技术人员可以理解，处理器520还实现本申请任意实施例所提供的音频处理质量的评价方法的技术方案。

图5显示的电子设备500仅仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。

如图5所示，该电子设备500包括处理器520、存储装置510、输入装置530和输出装置540；电子设备中处理器520的数量可以是一个或多个，图5中以一个处理器520为例；电子设备中的处理器520、存储装置510、输入装置530和输出装置540可以通过总线或其他方式连接，图5中以通过总线550连接为例。

存储装置510作为一种计算机可读存储介质，可用于存储软件程序、计算机可执行程序以及模块单元，如本申请实施例中的音频处理质量的评价方法对应的程序指令。

存储装置510可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序；存储数据区可存储根据终端的使用所创建的数据等。此外，存储装置510可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中，存储装置510可进一步包括相对于处理器520远程设置的存储器，这些远程存储器可以通过网络连接。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

输入装置530可用于接收输入的数字、字符信息或语音信息，以及产生与电子设备的用户设置以及功能控制有关的键信号输入。输出装置540可包括显示屏、扬声器等电子设备。

本申请实施例提供的电子设备，可以通过对音频处理的个别阶段实现音频的标准化输入，以对处理结果进行统一标准的量化评价，从而实现音频处理评价的客观性。

上述实施例中提供的音频处理质量的评价装置、介质及电子设备可执行本申请任意实施例所提供的音频处理质量的评价方法，具备执行该方法相应的功能模块和有益效果。未在上述实施例中详尽描述的技术细节，可参见本申请任意实施例所提供的音频处理质量的评价方法。

注意，上述仅为本申请的较佳实施例及所运用技术原理。本领域技术人员会理解，本申请不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本申请的保护范围。因此，虽然通过以上实施例对本申请进行了较为详细的说明，但是本申请不仅仅限于以上实施例，在不脱离本申请构思的情况下，还可以包括更多其他等效实施例，而本申请的范围由所附的权利要求范围决定。

Claims

1.一种音频处理质量的评价方法，其特征在于，所述音频处理质量的评价方法由测试组件执行，所述测试组件配置于音频处理的电子设备中，所述方法包括：

获取所述电子设备中音频处理流程的目标阶段；

获取所述目标阶段的输出接口输出的处理结果数据；

2.根据权利要求1所述的方法，其特征在于，获取所述目标阶段的输入接口输入的待处理音频数据，并采用预先设置的标准音频数据替换所述待处理音频数据，包括：

获取所述目标阶段的输出接口输出的处理结果数据，包括：

3.根据权利要求2所述的方法，其特征在于，所述Tweak插件还用于存储所述处理结果数据。

4.根据权利要求1所述的方法，其特征在于，将所述标准音频数据和所述处理结果数据输入至评价模型，以得到所述目标阶段的音频处理质量评价结果，包括：

5.根据权利要求1所述的方法，其特征在于，所述目标阶段包括采集到音频数据之后的音频前处理阶段，以及音频前处理阶段之后的音频编码阶段。

6.根据权利要求5所述的方法，其特征在于，若所述目标阶段为音频编码阶段，则在获取所述目标阶段的输出接口输出的处理结果数据之后，所述方法还包括：

7.根据权利要求1所述的方法，其特征在于，所述音频处理流程为直播应用当中的音频的处理流程。

8.一种音频处理质量的评价装置，其特征在于，所述音频处理质量的评价装置配置于测试组件中，所述测试组件配置于音频处理的电子设备中，所述装置包括：

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-7中任一项所述的音频处理质量的评价方法。

10.一种电子设备，包括存储器，处理器及存储在存储器上并可在处理器运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1-7中任一项所述的音频处理质量的评价方法。