CN110782874B

CN110782874B - 一种语音库管理方法、语音识别测试方法和装置

Info

Publication number: CN110782874B
Application number: CN201911072335.3A
Authority: CN
Inventors: 袁龙刚; 荣霞芳; 陈洁宇
Original assignee: Sichuan Hongmei Intelligent Technology Co Ltd
Current assignee: Sichuan Hongmei Intelligent Technology Co Ltd
Priority date: 2019-11-05
Filing date: 2019-11-05
Publication date: 2022-08-16
Anticipated expiration: 2039-11-05
Also published as: CN110782874A

Abstract

本发明提供了一种语音库管理方法、语音识别测试方法和装置，该语音库管理方法包括：为语音库构建至少两种语音词条集合，并为每一种语音词条集合确定存储位置，每一种语音词条集合包括至少两个检测员所录制的具有相同测试词的语音词条文件；将待存储语音词条文件存储到一个语音词条集合，以使待存储语音词条文件所包含的测试词与所存储到的语音词条集合中的其他语音词条文件所包含的测试词一致。本发明提供的方案能够有效地提高语音识别测试效率。

Description

一种语音库管理方法、语音识别测试方法和装置

技术领域

本发明涉及计算机技术领域，特别涉及一种语音库管理方法、语音识别测试方法和装置。

背景技术

随着智能家居的逐渐普及，声纹识别等技术也在逐步渗透到家电的智能化当中，只需语音即可控制家中的电器设备。在语音智能产品生产过程中，需要经过大量的语音测试，以保证语音智能产品具有比较好的语音识别性能。为此，需要反复地对语音设备进行激活词、识别词的识别测试。目前主要通过人工测试的方式测试语音设备，即需要人工操作语音播放文件，然后统计语音设备对语音播放文件的识别情况，导致测试效率较低。

发明内容

本发明实施例提供了一种语音库管理方法、语音识别测试方法和装置，能够有效地提高语音识别测试效率。

第一方面，本发明实施例提供了一种语音库管理方法，该语音库管理方法包括：

为语音库构建至少两种语音词条集合，并为每一种语音词条集合确定存储位置，所述每一种语音词条集合包括至少两个检测员所录制的具有相同测试词的语音词条文件；

将待存储语音词条文件存储到一个语音词条集合，以使所述待存储语音词条文件所包含的测试词与所存储到的语音词条集合中的其他语音词条文件所包含的测试词一致。

优选地，

每一条所述语音词条文件的文件名包括有测试词和检测员特征标识；

所述将待存储语音词条文件存储到一个语音词条集合，包括：

在接收到外部发送的待存储语音词条文件时，识别出所述待存储语音词条文件的文件名所包含的测试词；

根据所述待存储语音词条文件的文件名所包含的测试词，为所述待存储语音词条文件选定存储到的语音词条集合。

第二方面，本发明实施例提供一种语音识别测试方法，包括：

构建配置文件，其中所述配置文件包括有语音词条集合项和与所述语音词条集合项相对应的使能项；

将语音库中的每一种语音词条集合的特征标识配置到所述语音词条集合项；

为每一种语音词条集合所对应的使能项设置对应的标识符，所述标识符表征执行或不执行；

从表征执行的标识符所对应的语音词条集合中，随机选取语音词条文件；

按照所述语音词条集合项中语音词条集合的特征标识的排序，顺序播放从所述语音词条集合选出的所述语音词条文件。

优选地，上述语音识别测试方法，进一步包括：设置循环次数；

按照所述循环次数，播放选出的所述语音词条文件。

优选地，所述按照所述循环次数，播放选出的所述语音词条文件，包括：

当从表征执行的标识符所对应的语音词条集合中，随机选取出的语音词条文件的个数为一个时，按照所述循环次数，循环播放选出的所述语音词条文件。

优选地，上述语音识别测试方法，进一步包括：

当表征执行的标识符所对应的语音词条集合中包括的语音词条文件的个数不小于所述循环次数时，控制随机选取出的语音词条文件的个数等于所述循环次数；

当表征执行的标识符所对应的语音词条集合中包括的语音词条文件的个数小于所述循环次数时，选取出所有语音词条文件，并随机复制选出的所述语音词条文件，使语音词条文件的个数等于所述循环次数；

播放选出的所有语音词条文件。

第三方面，本发明实施例提供一种语音库管理装置，包括：构建单元和存储单元，其中，

所述构建单元，用于为语音库构建至少两种语音词条集合，并为每一种语音词条集合确定存储位置，所述每一种语音词条集合包括至少两个检测员所录制的具有相同测试词的语音词条文件；

所述存储单元，用于将待存储语音词条文件存储到所述构建单元构建出的一个语音词条集合，以使所述待存储语音词条文件所包含的测试词与所存储到的语音词条集合中的其他语音词条文件所包含的测试词一致。

优选地，

所述存储单元，用于在接收到外部发送的待存储语音词条文件时，识别出所述待存储语音词条文件的文件名所包含的测试词；根据所述待存储语音词条文件的文件名所包含的测试词，为所述待存储语音词条文件选定存储到的语音词条集合。

第四方面，本发明实施例提供一种语音识别测试装置，包括：配置单元、语音测试处理单元，其中，

所述配置单元，用于构建配置文件，其中所述配置文件包括有语音词条集合项和与所述语音词条集合项相对应的使能项；将语音库中的每一种语音词条集合的特征标识配置到所述语音词条集合项；为每一种语音词条集合所对应的使能项设置对应的标识符，所述标识符表征执行或不执行；

所述语音测试处理单元，用于从表征执行的标识符所对应的语音词条集合中，随机选取语音词条文件；按照所述语音词条集合项中语音词条集合的特征标识的排序，顺序播放从所述语音词条集合选出的所述语音词条文件。

优选地，

所述配置单元，进一步用于设置循环次数；

所述语音测试处理单元，用于按照所述循环次数，播放选出的所述语音词条文件。

优选地，

所述语音测试处理单元，用于当从表征执行的标识符所对应的语音词条集合中，随机选取出的语音词条文件的个数为一个时，按照所述循环次数，循环播放选出的所述语音词条文件。

优选地，

所述语音测试处理单元，进一步用于当表征执行的标识符所对应的语音词条集合中包括的语音词条文件的个数不小于所述循环次数时，控制随机选取出的语音词条文件的个数等于所述循环次数；当表征执行的标识符所对应的语音词条集合中包括的语音词条文件的个数小于所述循环次数时，选取出所有语音词条文件，并随机复制选出的所述语音词条文件，使语音词条文件的个数等于所述循环次数；播放选出的所有语音词条文件。

本发明实施例提供了一种语音库管理方法、语音识别测试方法和装置，该语音库管理方法通过为语音库构建至少两种语音词条集合，并为每一种语音词条集合确定存储位置，每一种语音词条集合包括至少两个检测员所录制的具有相同测试词的语音词条文件；将待存储语音词条文件存储到一个语音词条集合，以使待存储语音词条文件所包含的测试词与所存储到的语音词条集合中的其他语音词条文件所包含的测试词一致，在进行语音识别测试时，则可直接从语音库中的语音词条集合中选取语音词条进行测试。一般在语音识别测试需要选择测试词，由于语音库是按照测试词构建出的语音词条集合，很容易从语音库查找出所需要的测试词所对应的语音词条，因此，通过从语音库中选取语音词条进行测试播放，能够有效地提高语音识别测试效率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一实施例提供的一种测试环境的结构图；

图2是本发明另一实施例提供的一种语音库管理方法的流程图；

图3是本发明一实施例提供的一种语音库的结构示意图；

图4是本发明一实施例提供的一种语音识别测试方法的流程图；

图5是本发明一实施例提供的一种语音库管理装置的结构示意图；

图6是本发明一实施例提供的一种语音识别测试装置的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例，基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例所实用的测试环境可如图1所示，该测试环境模拟了家庭客厅的布局规格，该测试环境包含：待测语音设备101、装载有本发明实施例提供的语音库管理装置和语音识别测试装置的终端102、均衡器103、仿真嘴104、分贝仪105等。测试原理简要概括为：终端102通过语音识别测试装置播放语音库管理装置管理的语音库中的语音词条，通过语音识别测试装置的串口打印测试信息，根据打印的结果，统计出语音声纹识别的在不同测试环境下的激活率、识别率、误激活率、方位识别率等。其中，待测语音设备101可以为任意具有语音识别功能的电器比如冰箱、空调等，终端102可以为个人计算机、手机、pad等。仿真嘴104与终端102连接，用于模仿人嘴播放语音词条，分贝仪105，与与终端102连接，用于调节语音词条的播放分贝；均衡器103，与终端102连接，用于调节语音词条的播放音频。待测语音设备101用于打印出执行结果。另外，在该测试环境中还可包括其他家电如电视机、录音设备等，以更真实的模仿具有语音识别功能的加电的真实使用环境。

如图2所示，本发明实施例提供了一种语音库管理方法，该语音库管理方法具体可包括：

步骤201：为语音库构建至少两种语音词条集合，并为每一种语音词条集合确定存储位置，每一种语音词条集合包括至少两个检测员所录制的具有相同测试词的语音词条文件；

步骤202：将待存储语音词条文件存储到一个语音词条集合，以使待存储语音词条文件所包含的测试词与所存储到的语音词条集合中的其他语音词条文件所包含的测试词一致。

在图2所示的实施例中，通过为语音库构建至少两种语音词条集合，并为每一种语音词条集合确定存储位置，每一种语音词条集合包括至少两个检测员所录制的具有相同测试词的语音词条文件；将待存储语音词条文件存储到一个语音词条集合，以使待存储语音词条文件所包含的测试词与所存储到的语音词条集合中的其他语音词条文件所包含的测试词一致，在进行语音识别测试时，则可直接从语音库中的语音词条集合中选取语音词条进行测试。一般在语音识别测试需要选择测试词，由于语音库是按照测试词构建出的语音词条集合，很容易从语音库查找出所需要的测试词所对应的语音词条，因此，通过从语音库中选取语音词条进行测试播放，能够有效地提高语音识别测试效率。

其中，语音库的结构可如图3所示，按照测试词构建语音词条集合，即将不同检测员录制的相同的语音词条分配在同一个语音词条集合中，在每一个语音词条集合中，每一条语音词条按照检测员标识加语音词条标识命名，该语音词条标识可以为具有的测试词如激活词、识别词等。

按照本发明实施例提供的语音库管理方法，如果新增一条语音词条信息，该新增的语音词条信息不属于任意一个语音词条集合，则只需要在语音库中新增一个该语音词条对应的语音词条集合即可，其他不相干的语音词条集合不必进行修改；上述语音词条集合可以以文件夹的形式存在。

在本发明一个实施例中，为了能够方便测试过程中对语音词条的查找，每一条语音词条文件的文件名包括有测试词和检测员特征标识；将待存储语音词条文件存储到一个语音词条集合，包括：在接收到外部发送的待存储语音词条文件时，识别出待存储语音词条文件的文件名所包含的测试词；根据待存储语音词条文件的文件名所包含的测试词，为待存储语音词条文件选定存储到的语音词条集合。

如图4所示，本发明实施例提供一种语音识别测试方法，该语音识别测试方法具体包括如下步骤：

步骤401：构建配置文件，其中配置文件包括有语音词条集合项和与语音词条集合项相对应的使能项；

步骤402：将语音库中的每一种语音词条集合的特征标识配置到语音词条集合项；

步骤403：为每一种语音词条集合所对应的使能项设置对应的标识符，标识符表征执行或不执行；

步骤404：从表征执行的标识符所对应的语音词条集合中，随机选取语音词条文件；

步骤405：按照语音词条集合项中语音词条集合的特征标识的排序，顺序播放从语音词条集合选出的语音词条文件。

在上述步骤403中，标识符可以是预先配置好的值，比如1表征执行，0表征不执行，使能项与语音词条集合项可如下表1所示。在表1所示的配置文件中具有使能项，可以有效管理该行语音词条是否播放执行。标志位为1时执行该行的语音词条(即在语音库中查询并播放)，标志位为0时跳过不执行该行的语音词条。这样测试人员在配置文件时只需为使能项赋值即可，配置文件的复用性得到很大的提高，该配置文件可以为excel表格形式。因此，本发明实施例提供的测试方法只在开始测试前导入EXCEL表格形式的语音识别配置文件并进行一次读取，在语音播放的过程中只要在缓存数组中进行相关的语音词条执行即可。

表1

使能项(不执行“0”，执行“1”)	语音词条集合项
		1	语音词条集合1
0	语音词条集合2
		1	语音词条集合3
1	语音词条集合4
		1	语音词条集合5
…	…
		1	语音词条集合99
0	语音词条集合100

在本发明一个实施例中，为了能够使测试结果更加准确，上述语音识别测试方法可进一步包括：设置循环次数；按照循环次数，播放选出的语音词条文件。

该按照循环次数，播放选出的语音词条文件的具体应用场景可以包括下述两种：

场景一：

每一次循环均播放一次选出的所有的语音词条文件，比如，选出的语音词条文件包括：语音词条1、语音词条3、语音词条4、语音词条20、语音词条25、语音词条50等，则每一次循环顺次播放语音词条1、语音词条3、语音词条4、语音词条20、语音词条25、语音词条50等。

场景二：

选出的每一条语音词条作为当前语音词条，按照循环次数播放完当前语音词条后播放下一条语音词条。比如，选出的语音词条文件包括：语音词条1、语音词条3、语音词条4、语音词条20、语音词条25、语音词条50等，则按照循环次数循环播放语音词条1后，按照循环次数循环播放语音词条3，并依此类推，直至播放完成。

在本发明一个实施例中，选择语音词条文件的方式可以有两种，该两种选择方式与循环次数相关。

第一种选择语音词条文件的方式：

从表征执行的标识符所对应的语音词条集合中，随机选取出的一个语音词条文件，则该选出的语音词条文件的播放方式可以选择上述两种循环播放场景中的任意一种进行播放。

第二种选择语音词条文件的方式：

当表征执行的标识符所对应的语音词条集合中包括的语音词条文件的个数不小于所述循环次数时，控制随机选取出的语音词条文件的个数等于所述循环次数；即从每一种语音词条集合中，选择出与循环次数相等的语音词条的个数。在语音词条集合中语音词条的个数小于循环次数时，选取出所有语音词条文件，并随机复制选出的所述语音词条文件，使语音词条文件的个数等于所述循环次数。比如设置循环次数为3次，则从语音词条1集合中选出语音词条1-1、语音词条1-2、语音词条1-3，从语音词条3集合中选出语音词条3-1、语音词条3-2、语音词条3-3，从语音词条4集合(只有一个语音词条4)中选出语音词条4，并复制出语音词条4’以及语音词条4”。则在播放的过程中，可按照语音词条1-1、语音词条3-1、语音词条4、语音词条1-2、语音词条3-2、语音词条4’、语音词条1-3、语音词条3-3、语音词条4”的顺序进行播放，还可按照语音词条1-1、语音词条1-2、语音词条1-3、语音词条3-1、语音词条3-2、语音词条3-3、语音词条4、语音词条4’以及语音词条4”的顺序进行播放。

本发明实施例提供的测试方法中，语音播放流程不需要设置测试人数，每次播放的语音文件都是从该语音词条文件夹中的N位测试人员的语音文件随机产生，这种混合语音播放方式更加符合实际测试场景，测试结果的可靠性更高。

如图5所示，本发明一实施例提供一种语音库管理装置，包括：构建单元501和存储单元502，其中，

构建单元501，用于为语音库构建至少两种语音词条集合，并为每一种语音词条集合确定存储位置，每一种语音词条集合包括至少两个检测员所录制的具有相同测试词的语音词条文件；

存储单元502，用于将待存储语音词条文件存储到构建单元501构建出的一个语音词条集合，以使待存储语音词条文件所包含的测试词与所存储到的语音词条集合中的其他语音词条文件所包含的测试词一致。

在本发明另一实施例中，每一条语音词条文件的文件名包括有测试词和检测员特征标识；

存储单元502，用于在接收到外部发送的待存储语音词条文件时，识别出待存储语音词条文件的文件名所包含的测试词；根据待存储语音词条文件的文件名所包含的测试词，为待存储语音词条文件选定存储到的语音词条集合。

如图6所示，本发明实施例提供一种语音识别测试装置，该语音识别测试装置包括：配置单元601和语音测试处理单元602，其中，

配置单元601，用于构建配置文件，其中配置文件包括有语音词条集合项和与语音词条集合项相对应的使能项；将语音库中的每一种语音词条集合的特征标识配置到所述语音词条集合项；为每一种语音词条集合所对应的使能项设置对应的标识符，标识符表征执行或不执行；

语音测试处理单元602，用于从表征执行的标识符所对应的语音词条集合中，随机选取语音词条文件；按照语音词条集合项中语音词条集合的特征标识的排序，顺序播放从语音词条集合选出的语音词条文件。

在本发明另一实施例中，配置单元601，进一步用于设置循环次数；

语音测试处理单元602，用于按照循环次数，播放选出的语音词条文件。

在本发明一个实施例中，语音测试处理单元602，用于当从表征执行的标识符所对应的语音词条集合中，随机选取出的语音词条文件的个数为一个时，按照循环次数，循环播放选出的语音词条文件。

在本发明一个实施例中，语音测试处理单元602，进一步用于当表征执行的标识符所对应的语音词条集合中包括的语音词条文件的个数不小于循环次数时，控制随机选取出的语音词条文件的个数等于所述循环次数；当表征执行的标识符所对应的语音词条集合中包括的语音词条文件的个数小于所述循环次数时，选取出所有语音词条文件，并随机复制选出的所述语音词条文件，使语音词条文件的个数等于所述循环次数；播放选出的所有语音词条文件。

本发明实施例提供了一种可读介质，包括执行指令，当存储控制器的处理器执行所述执行指令时，所述存储控制器执行本发明实施例提供的任意语音库管理方法。

本发明实施例提供了一种可读介质，包括执行指令，当存储控制器的处理器执行所述执行指令时，所述存储控制器执行本发明实施例提供的任意语音识别测试方法。

本发明各个实施例至少具有如下有益效果：

1、在本发明实施例中，通过为语音库构建至少两种语音词条集合，并为每一种语音词条集合确定存储位置，每一种语音词条集合包括至少两个检测员所录制的具有相同测试词的语音词条文件；将待存储语音词条文件存储到一个语音词条集合，以使待存储语音词条文件所包含的测试词与所存储到的语音词条集合中的其他语音词条文件所包含的测试词一致，在进行语音识别测试时，则可直接从语音库中的语音词条集合中选取语音词条进行测试。一般在语音识别测试需要选择测试词，由于语音库是按照测试词构建出的语音词条集合，很容易从语音库查找出所需要的测试词所对应的语音词条，因此，通过从语音库中选取语音词条进行测试播放，能够有效地提高语音识别测试效率。

2、在本发明实施例中，如果新增一条语音词条信息，该新增的语音词条信息不属于任意一个语音词条集合，则只需要在语音库中新增一个该语音词条对应的语音词条集合即可，其他不相干的语音词条集合不必进行修改，使语音库配置更佳灵活和方便。

3、在本发明实施例中，为每一种语音词条集合所对应的使能项设置对应的标识符，标识符表征执行或不执行，标识符可以是预先配置好的值，使能项可以有效管理该行语音词条是否播放执行。这样测试人员在配置文件时只需为使能项赋值即可，配置文件的复用性得到很大的提高。

需要说明的是，在本文中，诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个······”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同因素。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储在计算机可读取的存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质中。

最后需要说明的是：以上所述仅为本发明的较佳实施例，仅用于说明本发明的技术方案，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

Claims

1.一种语音识别测试方法，其特征在于，包括语音库管理和语音识别测试，在语音识别测试时，从语音库中的语音词条集合中选取语音词条进行测试；

所述语音库管理，包括：

将待存储语音词条文件存储到一个语音词条集合，以使所述待存储语音词条文件所包含的测试词与所存储到的语音词条集合中的其他语音词条文件所包含的测试词一致；

当新增的语音词条信息不属于任意一个语音词条集合时，在语音库中新增一个该语音词条对应的语音词条集合；

所述语音识别测试，包括：

按照所述语音词条集合项中语音词条集合的特征标识的排序，顺序播放从所述语音词条集合选出的所述语音词条文件；

进一步包括：设置循环次数；

按照所述循环次数，播放选出的所述语音词条文件；

其中，选择语音词条文件的方式，包括：

当表征执行的标识符所对应的语音词条集合中包括的语音词条文件的个数不小于所述循环次数时，从每一种语音词条集合中，选择出与循环次数相等的语音词条文件的个数；

当表征执行的标识符所对应的语音词条集合中包括的语音词条文件的个数小于所述循环次数时，选取出所有语音词条文件，并随机复制选出的所述语音词条文件，使语音词条文件的个数等于所述循环次数。

2.根据权利要求1所述的方法，其特征在于，

3.一种终端，包括：语音库管理装置和语音识别测试装置，终端通过语音识别测试装置播放语音库管理装置管理的语音库中的语音词条；

所述语音库管理装置，包括：构建单元和存储单元，其中，

所述存储单元，用于将待存储语音词条文件存储到所述构建单元构建出的一个语音词条集合，以使所述待存储语音词条文件所包含的测试词与所存储到的语音词条集合中的其他语音词条文件所包含的测试词一致；

所述语音识别测试装置，包括：配置单元、语音测试处理单元，其中，

所述语音测试处理单元，用于从表征执行的标识符所对应的语音词条集合中，随机选取语音词条文件；按照所述语音词条集合项中语音词条集合的特征标识的排序，顺序播放从所述语音词条集合选出的所述语音词条文件；

所述配置单元，进一步用于设置循环次数；

所述语音测试处理单元，用于按照所述循环次数，播放选出的所述语音词条文件；

其中，选择语音词条文件的方式，包括：

4.根据权利要求3所述的终端，其特征在于，所述语音库管理装置中的每一条所述语音词条文件的文件名包括有测试词和检测员特征标识；