CN108364661B

CN108364661B - 可视化语音性能评估方法、装置、计算机设备及存储介质

Info

Publication number: CN108364661B
Application number: CN201711346946.3A
Authority: CN
Inventors: 不公告发明人
Original assignee: Haier Uplus Intelligent Technology Beijing Co Ltd
Current assignee: Qingdao Haier Technology Co Ltd; Haier Smart Home Co Ltd
Priority date: 2017-12-15
Filing date: 2017-12-15
Publication date: 2020-11-24
Anticipated expiration: 2037-12-15
Also published as: CN108364661A

Abstract

本发明提供了一种可视化语音性能评估方法、装置、计算机设备及存储介质，其中，方法包括以下步骤：确定语谱图中的局部评估区域，并获取局部评估区域的参数值；确定选取的评估指标，并获取评估指标的计算公式；根据局部评估区域中的参数值和计算公式，计算评估指标的评估值，并将评估值在语谱图中进行显示。利用本发明的技术方案，可以在可视化的语谱图中进行局部评估区域的选择，得到局部评估区域的精确语音质量，给用户提供了一种直观、灵活、便利的语音质量评估方式。

Description

可视化语音性能评估方法、装置、计算机设备及存储介质

技术领域

本发明涉及信号处理领域，特别涉及一种可视化语音性能评估方法、装置、计算机设备及存储介质。

背景技术

信号处理技术是智能家居领域、通信领域非常重要的技术，而经过信号处理后的语音信号质量评估也是一个非常重要的课题，以往有一些语音质量评估的指标，如PESQ(Perceptual evaluation of speech quality，主观语音质量评估)、降噪量等都是固定的全局指标，且不具有直观性，这会使得指标的使用者无法对重点的局部语音区域进行较精确且直观的语音质量评估。

发明内容

为了解决现有技术中缺少对重点的局部语音区域进行较精确且直观的语音质量评估的问题，本发明提供了一种可视化语音性能评估方法、装置、计算机设备及存储介质。

本发明提供的可视化语音性能评估方法，包括以下步骤：

确定语谱图中的局部评估区域，并获取局部评估区域的参数值；

确定选取的评估指标，并获取评估指标的计算公式；

根据局部评估区域中的参数值和计算公式，计算评估指标的评估值，并将评估值在语谱图中进行显示。

可选的，在本发明的可视化语音性能评估方法中，确定语谱图中的局部评估区域包括：

当语谱图的数量为一个时，接收在语谱图中选取的局部评估区域；

当语谱图的数量为多个时，接收在第一个语谱图中选取的第一局部评估区域；根据第一局部评估区域的位置，遍历剩余的所有语谱图，从剩余的所有语谱图中分别选取与第一局部评估区域的位置相同的区域，第一局部评估区域和与第一局部评估区域的位置相同的区域共同构成局部评估区域。

可选的，在本发明的可视化语音性能评估方法中，在确定语谱图中的局部评估区域之前，还包括：根据输入信号得到语谱图。

可选的，在本发明的可视化语音性能评估方法中，根据输入信号得到语谱图信息，包括：

对输入信号进行分帧处理、加窗处理及FFT变换，得到输入信号中每帧信号的FFT变换系数；

根据输入信号中每帧信号的FFT变换系数，得到与输入信号对应的语谱图。

本发明还提供了一种可视化语音性能评估装置，包括：评估区域确定模块、评估指标确定模块及评估结果显示模块；

评估区域确定模块，用于确定语谱图中的局部评估区域，并获取局部评估区域的参数值；

评估指标确定模块，用于确定选取的评估指标，并获取评估指标的计算公式；

评估结果显示模块，用于根据局部评估区域中的参数值和计算公式，计算评估指标的评估值，并将评估值在语谱图中进行显示。

可选的，在本发明可视化语音性能评估装置中，评估区域确定模块具体用于：

可选的，在本发明可视化语音性能评估装置中，还包括语谱图构建模块；

语谱图构建模块，用于在确定语谱图中的局部评估区域之前，根据输入信号得到语谱图。

可选的，在本发明可视化语音性能评估装置中，语谱图构建模块具体用于：

本发明还提供了一种计算机可读存储介质，存储介质上存储有计算机程序，程序被处理器执行时实现上述方法的步骤。

本发明还提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行程序时实现上述方法的步骤。

本发明的有益效果如下：

本发明实施例提供的可视化语音性能评估方法、装置、计算机设备及存储介质，可以在可视化语谱图中进行局部评估区域的选择，得到局部评估区域的精确语音质量，给用户提供了一种直观、灵活、便利的语音质量评估方式。

附图说明

图1为本发明方法实施例中可视化语音性能评估方法的流程示意图；

图2为本发明装置实施例中可视化语音性能评估装置的结构示意图；

图3为本发明实例1中可视化语音性能评估方法的流程示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

为了解决现有技术中缺少对重点的局部语音区域进行较精确且直观的语音质量评估的问题，本发明提供了一种可视化语音性能评估方法、设备及计算机可读存储介质，以下结合附图对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不限定本发明。

根据本发明的方法实施例，提供了一种可视化语音性能评估方法，图1为本发明方法实施例中可视化语音性能评估方法的流程示意图，如图1所示，本发明方法实施例的可视化语音性能评估方法，包括以下步骤：

S101：确定语谱图中的局部评估区域，并获取局部评估区域的参数值。

语谱图用来表示输入语音信号的时频域信息，能够给人以非常直观的显示，其中横轴表示时间，纵轴表示频率，颜色表示能量。

在本发明方法实施例中，局部评估区域的位置不局限，可以选定整个语谱图中的任意位置。

可选的，确定语谱图中的局部评估区域包括：

当语谱图的数量为多个时，接收在第一个语谱图中选取的第一局部评估区域；根据第一局部评估区域的位置，遍历剩余的所有语谱图，从剩余的所有语谱图中分别选取与第一局部评估区域的位置相同的区域，第一局部评估区域和与第一局部评估区域的位置相同的区域共同构成局部评估区域。即采用本发明方法实施例的技术方案，可对多组语音(多个语谱图)同时进行比较。

可选的，确定语谱图中的局部评估区域包括：当局部评估区域的数量为多个时，分别确定语谱图中的多个局部评估区域。即在本发明方法实施例中，局部评估区域的数量不局限，可以选定整个语谱图中的多个局部评估区域。

可选的，局部评估区域中的参数值包括：局部评估区域内每帧信号的FFT变换系数。

S102：确定选取的评估指标，并获取评估指标的计算公式。

在本发明方法实施例中，可选评估指标不做限定，可以为LSD(logspectraldistance，对数谱距离)、降噪量等各种语音评估指标，还可以根据需求自定义评估指标及计算公式。

S103：根据局部评估区域中的参数值和计算公式，计算评估指标的评估值，并将评估值在语谱图中进行显示。

进一步，在本发明方法实施例的可视化语音性能评估方法中，还包括：当评估指标的数量为多个时，将每一个评估指标的名称及对应的评估值在语谱图中进行显示。

进一步的，在本发明方法实施例的可视化语音性能评估方法中，在确定语谱图中的局部评估区域之前，还包括：根据输入信号得到语谱图。

可选的，根据输入信号得到语谱图信息，包括：

可选的，在对输入信号进行分帧处理之前，还包括：

将输入信号以预设的参考信号为标准进行对齐，以消除输入信号的延迟。

本发明方法实施例提供的可视化语音性能评估方法，不局限于任何一种评估指标，不局限于具体的评估位置，可以在可视化语谱图中进行局部评估区域的选择，得到局部评估区域的精确语音质量，给用户提供了一种直观、灵活、便利的语音质量评估方式。

根据本发明的装置实施例，提供了一种可视化语音性能评估装置，图2为本发明装置实施例中可视化语音性能评估装置的结构示意图，如图2所示，本发明装置实施例的可视化语音性能评估装置包括：评估区域确定模块20、评估指标确定模块22及评估结果显示模块24，以下对各模块进行具体的描述。

评估区域确定模块20，用于确定语谱图中的局部评估区域，并获取局部评估区域的参数值。

可选的，在本发明装置实施例可视化语音性能评估装置中，评估区域确定模块20具体用于：

当语谱图的数量为多个时，接收在第一个语谱图中选取的第一局部评估区域；根据第一局部评估区域的位置，遍历剩余的所有语谱图，从剩余的所有语谱图中分别选取与第一局部评估区域的位置相同的区域，第一局部评估区域和与第一局部评估区域的位置相同的区域共同构成局部评估区域。即采用本发明装置实施例的技术方案，可对多组语音(多个语谱图)同时进行比较。

可选的，在本发明装置实施例可视化语音性能评估装置中，评估区域确定模块20具体用于：当局部评估区域的数量为多个时，分别确定语谱图中的多个局部评估区域。即在本发明装置实施例中，局部评估区域的数量不局限，可以选定整个语谱图中的多个局部评估区域。

评估指标确定模块22，用于确定选取的评估指标，并获取评估指标的计算公式。

在本发明装置实施例中，可选评估指标不做限定，可以为LSD(logspectraldistance，对数谱距离)、降噪量等各种语音评估指标，还可以根据需求自定义评估指标及计算公式。

评估结果显示模块24，用于根据局部评估区域中的参数值和计算公式，计算评估指标的评估值，并将评估值在语谱图中进行显示。

进一步，在本发明装置实施例的可视化语音性能评估装置中，评估结果显示模块24具体用于：当评估指标的数量为多个时，将每一个评估指标的名称及对应的评估值在语谱图中进行显示。

进一步的，在本发明装置实施例可视化语音性能评估装置中，还包括语谱图构建模块；

可选的，在本发明装置实施例可视化语音性能评估装置中，语谱图构建模块具体用于：

可选的，在本发明装置实施例可视化语音性能评估装置中，语谱图构建模块具体用于：在对输入信号进行分帧处理之前，将输入信号以预设的参考信号为标准进行对齐，以消除输入信号的延迟。

本发明装置实施例提供的可视化语音性能评估装置，不局限于任何一种评估指标，不局限于具体的评估位置，可以在可视化语谱图中进行局部评估区域的选择，得到局部评估区域的精确语音质量，给用户提供了一种直观、灵活、便利的语音质量评估方式。

本发明还提供了一种计算机设备，包括：存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行程序时实现如下步骤：

步骤11：确定语谱图中的局部评估区域，并获取局部评估区域的参数值。

可选的，确定语谱图中的局部评估区域包括：

当语谱图的数量为多个时，接收在第一个语谱图中选取的第一局部评估区域；根据第一局部评估区域的位置，遍历剩余的所有语谱图，从剩余的所有语谱图中分别选取与第一局部评估区域的位置相同的区域，第一局部评估区域和与第一局部评估区域的位置相同的区域共同构成局部评估区域。即采用本发明方法实施例的技术方案，可以跨窗口选定局部评估区域，当第一个语谱图中的第一局部评估区域变动时，剩余的所有语谱图中个局部评估区域也随之变动。

可选的，确定语谱图中的局部评估区域包括：当局部评估区域的数量为多个时，分别确定语谱图中的多个局部评估区域。

步骤12：确定选取的评估指标，并获取评估指标的计算公式。

步骤13：根据局部评估区域中的参数值和计算公式，计算评估指标的评估值，并将评估值在语谱图中进行显示。

进一步，处理器执行程序时实现如下步骤：当评估指标的数量为多个时，将每一个评估指标的名称及对应的评估值在语谱图中进行显示。

进一步的，处理器执行程序时实现如下步骤：在确定语谱图中的局部评估区域之前，根据输入信号得到语谱图。

可选的，根据输入信号得到语谱图信息，包括：

可选的，在对输入信号进行分帧处理之前，还包括：将输入信号以预设的参考信号为标准进行对齐，以消除输入信号的延迟。

本发明实施例提供的计算机设备，不局限于任何一种评估指标，不局限于具体的评估位置，可以在可视化语谱图中进行局部评估区域的选择，得到局部评估区域的精确语音质量，给用户提供了一种直观、灵活、便利的语音质量评估方式。

本发明还提供了一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，程序被处理器执行时实现如下步骤：

步骤21：确定语谱图中的局部评估区域，并获取局部评估区域的参数值。

可选的，确定语谱图中的局部评估区域包括：

步骤22：确定选取的评估指标，并获取评估指标的计算公式。

步骤23：根据局部评估区域中的参数值和计算公式，计算评估指标的评估值，并将评估值在语谱图中进行显示。

进一步，程序被处理器执行时实现如下步骤：当评估指标的数量为多个时，将每一个评估指标的名称及对应的评估值在语谱图中进行显示。

进一步的程序被处理器执行时实现如下步骤：在确定语谱图中的局部评估区域之前，根据输入信号得到语谱图。

可选的，根据输入信号得到语谱图信息，包括：

可选的，在对输入信号进行分帧处理之前，还包括：

本发明实施例提供的计算机可读存储介质，不局限于任何一种评估指标，不局限于具体的评估位置，可以在可视化语谱图中进行局部评估区域的选择，得到局部评估区域的精确语音质量，给用户提供了一种直观、灵活、便利的语音质量评估方式。

为了更加详细的说明本发明实施例，给出实例1。

图3为本发明实例1中可视化语音性能评估方法的流程示意图。如图3所示，本发明实例1中可视化语音性能评估方法包括以下步骤：

(1)信号对齐：首先将所有输入信号以参考信号(图3中的原始纯净参考语音)为标准进行对齐，其中对齐方法可以是用户输入所有输入信号的延迟，根据延迟信息，调整所有输入语音信号，使其与参考信号对齐。

(2)FFT变换：对所有输入信号进行分帧、加窗、FFT变换等操作，得到所有信号、所有语音帧的FFT变换系数，从而可以得到整个语谱图信息。

(3)语谱图：用户可在显示的语谱图上选型一个或多个语音性能局部评估区域，并将所选局部评估区域的区域信息传输给核心处理模块。

(4)评估指标库：用户可在评估指标库中选择所需的评估指标，并获取获取评估指标的计算公式。用户还可以在评估指标库中自定义添加评估指标及其计算公式。

(5)核心处理模块：根据局部评估区域中的参数值(局部评估区域内每帧信号的FFT变换系数)和计算公式，计算评估指标的评估值。

(6)评估结果显示：将核心处理模块得到的全部结果，在语谱图上显示出来。

本发明实例1基于语谱图来显示结果给使用者提供了一种非常直观的语音质量评估方式。本发明实例1提供的可视化语音性能评估方法不局限于任何一种评估指标，并且可以选定多个局部评估区域同时进行评估，可对多组语音性能同时做比较，对多组语音性能的评估提供了更加直观、便捷的方式。

以上仅为本发明的实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的权利要求范围之内。

Claims

1.一种可视化语音性能评估方法，其特征在于，包括：

确定语谱图中的局部评估区域，并获取所述局部评估区域的参数值；

确定选取的评估指标，并获取所述评估指标的计算公式；

根据所述局部评估区域中的参数值和所述计算公式，计算所述评估指标的评估值，并将所述评估值在所述语谱图中进行显示；

所述确定语谱图中的局部评估区域包括：

当所述语谱图的数量为多个时，接收在第一个语谱图中选取的第一局部评估区域；根据所述第一局部评估区域的位置，遍历剩余的所有语谱图，从所述剩余的所有语谱图中分别选取与所述第一局部评估区域的位置相同的区域，所述第一局部评估区域和所述与所述第一局部评估区域的位置相同的区域共同构成所述局部评估区域。

2.如权利要求1所述的可视化语音性能评估方法，其特征在于，所述确定语谱图中的局部评估区域还包括：

当所述语谱图的数量为一个时，接收在所述语谱图中选取的局部评估区域。

3.如权利要求1或2所述的可视化语音性能评估方法，其特征在于，在确定语谱图中的局部评估区域之前，还包括：根据输入信号得到语谱图。

4.如权利要求3所述的可视化语音性能评估方法，其特征在于，所述根据输入信号得到语谱图信息，包括：

对所述输入信号进行分帧处理、加窗处理及FFT变换，得到所述输入信号中每帧信号的FFT变换系数；

根据所述输入信号中每帧信号的FFT变换系数，得到与所述输入信号对应的语谱图。

5.一种可视化语音性能评估装置，其特征在于，包括：评估区域确定模块、评估指标确定模块及评估结果显示模块；

所述评估区域确定模块，用于确定语谱图中的局部评估区域，并获取所述局部评估区域的参数值；

所述评估指标确定模块，用于确定选取的评估指标，并获取所述评估指标的计算公式；

所述评估结果显示模块，用于根据所述局部评估区域中的参数值和所述计算公式，计算所述评估指标的评估值，并将所述评估值在所述语谱图中进行显示；

所述评估区域确定模块具体用于：

6.如权利要求5所述的可视化语音性能评估装置，其特征在于，所述评估区域确定模块具体还用于：

7.如权利要求5或6所述的可视化语音性能评估装置，其特征在于，还包括语谱图构建模块；

所述语谱图构建模块，用于在确定语谱图中的局部评估区域之前，根据输入信号得到语谱图。

8.如权利要求7所述的可视化语音性能评估装置，其特征在于，所述语谱图构建模块具体用于：

9.一种计算机可读存储介质，所述存储介质上存储有计算机程序，所述程序被处理器执行时实现权利要求1至4中任意一项所述方法的步骤。

10.一种计算机设备，其特征在于，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序时实现权利要求1至4中任意一项所述方法的步骤。