CN112863545A

CN112863545A - 性能测试方法、装置、电子设备及计算机可读存储介质

Info

Publication number: CN112863545A
Application number: CN202110044101.9A
Authority: CN
Inventors: 陈世强
Original assignee: Beijing ByteDance Network Technology Co Ltd
Current assignee: Beijing ByteDance Network Technology Co Ltd
Priority date: 2021-01-13
Filing date: 2021-01-13
Publication date: 2021-05-28
Anticipated expiration: 2041-01-13
Also published as: CN112863545B

Abstract

本公开提供了一种性能测试方法、装置、电子设备及计算机可读存储介质，涉及语音处理技术领域。该方法包括：获取预先构建的通用唤醒指令集、针对回声消除的外部唤醒测试指令集和/或针对回声消除的自唤醒测试指令集；为智能语音交互设备分别播放所述通用唤醒指令集、外部唤醒测试指令集及自唤醒测试指令集，并分别监控所述智能语音交互设备针对所述外部唤醒测试指令集、外部唤醒测试指令集及自唤醒测试指令集的唤醒情况，最后分别统计针对所述通用唤醒指令集的通用唤醒率、统计针对所述外部唤醒测试指令集的外部唤醒率及统计针对所述自唤醒测试指令集的自唤醒次数。本公开可以获取智能语音交互设备的多维度唤醒指标。

Description

性能测试方法、装置、电子设备及计算机可读存储介质

技术领域

本公开涉及语音处理技术领域，具体而言，本公开涉及一种智能语音交互设备的性能测试方法、装置、电子设备及计算机可读存储介质。

背景技术

目前，随着智能技术的快速发展，智能语音交互设备走进了千家万户。

在语音唤醒领域，不同厂商针对各自的产品，制定了形形色色的唤醒词，以方便用户与智能语音交互设备进行交互。现有技术通常采用唤醒率和误唤醒次数等评价指标来评估智能语音交互设备的语音唤醒算法。但是现有技术的对智能语音交互设备包括的语音唤醒算法的测试比较粗略，测试结果不够可靠和准确，因此也不能进一步地改进算法以提高算法的精准性。

发明内容

本公开提供了一种智能语音交互设备的性能测试的方法、装置、电子设备及计算机可读存储介质，可以解决获取智能语音交互设备的唤醒指标不够全面的问题。技术方案如下：

第一方面，提供了一种智能语音交互设备的性能测试方法，该方法包括：

获取预先构建的通用唤醒指令集，为智能语音交互设备播放通用唤醒指令集，监控智能语音交互设备针对通用唤醒指令集的唤醒情况，统计针对通用唤醒指令集的通用唤醒率；

获取预先构建的针对回声消除的外部唤醒测试指令集和/或针对回声消除的自唤醒测试指令集；其中，外部唤醒测试指令集用于测试智能语音交互设备的设备播报对外部唤醒的影响；自唤醒测试指令集用于测试智能语音交互设备的设备播报包含唤醒词的语音时唤醒自身的次数；

当获取到外部唤醒测试指令集时，为智能语音交互设备播放外部唤醒测试指令集，监控智能语音交互设备针对外部唤醒测试指令集的唤醒情况，统计针对外部唤醒测试指令集的外部唤醒率；和/或，

当获取到自唤醒测试指令集时，为智能语音交互设备播放自唤醒测试指令集，监控智能语音交互设备针对自唤醒测试指令集的唤醒情况，统计针对自唤醒测试指令集的自唤醒次数。

第二方面，提供了一种智能语音交互设备的性能测试装置，该装置包括：

第一统计模块，用于获取预先构建的通用唤醒指令集，为智能语音交互设备播放通用唤醒指令集，监控智能语音交互设备针对通用唤醒指令集的唤醒情况，统计针对通用唤醒指令集的通用唤醒率；

获取模块，用于获取预先构建的针对回声消除的外部唤醒测试指令集和/或针对回声消除的自唤醒测试指令集；其中，外部唤醒测试指令集用于测试智能语音交互设备的设备播报对外部唤醒的影响；自唤醒测试指令集用于测试智能语音交互设备的设备播报包含唤醒词的语音时唤醒自身的次数；

第二统计模块，用于当获取到外部唤醒测试指令集时，为智能语音交互设备播放外部唤醒测试指令集，监控智能语音交互设备针对外部唤醒测试指令集的唤醒情况，统计针对外部唤醒测试指令集的外部唤醒率；和/或，

用于当获取到自唤醒测试指令集时，为智能语音交互设备播放自唤醒测试指令集，监控智能语音交互设备针对自唤醒测试指令集的唤醒情况，统计针对自唤醒测试指令集的自唤醒次数。

第三方面，提供了一种电子设备，该电子设备包括：

一个或多个处理器；

存储器；

一个或多个应用程序，其中一个或多个应用程序被存储在存储器中并被配置为由一个或多个处理器执行，一个或多个程序配置用于执行如本公开的第一方面所示的智能语音交互设备的性能测试方法对应的操作。

第四方面，提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现本公开第一方面所示的智能语音交互设备的性能测试方法。

本公开提供的技术方案带来的有益效果是：

本公开在对智能语音交互设备进行性能测试的过程中，通过获取预先构建的通用唤醒指令集、针对回声消除的外部唤醒测试指令集和/或针对回声消除的自唤醒测试指令集，在为智能语音交互设备播报这些测试指令集时，监控智能语音交互设备的唤醒情况，最后根据指令集的不同，统计不同角度下的唤醒指标，通过增加回声消除播报话术指令集和回声消除自唤醒指令集评估回声消除播报话术及回声消除自唤醒指令对唤醒算法效果的影响，使得针对语音唤醒算法的评测较为精细，提高对语音唤醒算法评测的可靠性和准确性。

附图说明

结合附图并参考以下具体实施方式，本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中，相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的，原件和元素不一定按照比例绘制。

图1为本公开实施例提供的一种性能测试方法的流程示意图；

图2为本公开实施例提供的一种性能测试的整体流程示意图；

图3为本公开实施例提供的另一种性能测试方法的流程示意图；

图4为本公开实施例提供的又一种性能测试方法的流程示意图；

图5为本公开实施例提供的一种性能测试装置的结构示意图；

图6为本公开实施例提供的一种电子设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例，然而应当理解的是，本公开可以通过各种形式来实现，而且不应该被解释为限于这里阐述的实施例，相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是，本公开的附图及实施例仅用于示例性作用，并非用于限制本公开的保护范围。

应当理解，本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行，和/或并行执行。此外，方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。

本文使用的术语“包括”及其变形是开放性包括，即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”；术语“另一实施例”表示“至少一个另外的实施例”；术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。

需要注意，本公开中提及的“第一”、“第二”等概念仅用于对装置、模块或单元进行区分，并非用于限定这些装置、模块或单元一定为不同的装置、模块或单元，也并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。

需要注意，本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的，本领域技术人员应当理解，除非在上下文另有明确指出，否则应该理解为“一个或多个”。

本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的，而并不是用于对这些消息或信息的范围进行限制。

为使本公开的目的、技术方案和优点更加清楚，下面将结合附图对本公开实施方式作进一步地详细描述。

本公开提供的性能测试方法、装置、电子设备和计算机可读存储介质，旨在解决现有技术的如上技术问题。

下面以具体地实施例对本公开的技术方案以及本公开的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图，对本公开的实施例进行描述。

本公开实施例中提供了一种智能语音交互设备的性能测试方法，该方法应用于测试设备，如图1所示，该方法包括：

步骤S101：获取预先构建的通用唤醒指令集，为智能语音交互设备播放通用唤醒测试指令集，监控智能语音交互设备针对通用唤醒测试指令集的唤醒情况，统计针对通用唤醒测试指令集的通用唤醒率。

其中，测试设备可以是移动终端、服务器等；智能语音交互设备可以是移动终端、服务器、智能电视、智能汽车、智能家居等。

测试设备与待测试的智能语音交互设备之间可以进行语音交互。并且，测试设备不仅可以为待测试的智能语音交互设备播报测试指令集，还可以生成控制指令控制智能语音交互设备播报测试指令集。

在本公开的一个实施例中，可以基于获取的预先构建的通用唤醒测试指令集，获取智能语义设备的通用唤醒率指标。其中，通用唤醒测试指令集可以是对预设发音人的唤醒语音指令按照性别、年龄、地域、语速中的至少一项进行分类组合构建的。

示例性的，可以预先设置对发音人的性别为男或女，发音人的年龄为0岁到100岁范围中的某个年龄，发音人的地域为南方或北方，发音人的语速为快速、中速或慢速，对发音人的性别、发音人的年龄、发音人的地域和发音人的语速进行分类组合。然后分类录制唤醒语音指令，并分类构建保存，得到通用唤醒测试指令集。

在获取预先构建的通用唤醒测试指令集之后，可以为智能语音交互设备播放该通用唤醒测试指令集，监控智能语音交互设备针对该通用唤醒测试指令集的唤醒情况，比如监控智能语音交互设备成功唤醒与否，然后统计预设时间段(比如1小时)内成功唤醒与未成功唤醒的次数，计算智能语音交互设备在预设时间段内的成功唤醒率，并将该成功唤醒率作为针对通用唤醒测试指令集的通用唤醒率。并且，通用唤醒率越高，表明智能语音交互设备中内置的唤醒算法较为有效。

在本公开的一个实施例中，测试设备为智能语音交互设备播放通用唤醒测试指令集，包括：

根据预设发音人的性别、年龄、地域、语速中的至少一项，从通用唤醒测试指令集中选择匹配的测试语音指令进行播放。

可以理解的是，测试设备在为智能语音交互设备播放通用唤醒测试指令集时，可以根据选择的分类类别从通用唤醒测试指令集中选取匹配的测试语音指令进行播放，然后监控智能语音交互设备针对当前播放的测试语音指令的唤醒情况，最后基于该通用唤醒测试指令集统计智能语音交互设备的通用唤醒率。

步骤S102：获取预先构建的针对回声消除的外部唤醒测试指令集和/或针对回声消除的自唤醒测试指令集；其中，外部唤醒测试指令集用于测试智能语音交互设备的设备播报对外部唤醒的影响；自唤醒测试指令集用于测试智能语音交互设备的设备播报包含唤醒词的语音时唤醒自身的次数。

可以理解的是，在传统的针对智能语音交互设备的性能测试中，普遍忽略了智能语音交互设备自身播报的唤醒指令集对智能语音交互设备唤醒情况的影响，因此可以获取与智能语音交互设备自身播报唤醒指令集相关的测试指令集，即预先构建的外部唤醒测试指令集及自唤醒测试指令集，对智能语音交互设备进行测试。

需要说明的是，本公开实施例中的智能语音交互设备具备抗干扰能力，即智能语音交互设备可以针对自身播报的唤醒指令集进行回声消除，在针对智能语音交互设备的性能测试过程中，外部唤醒测试指令集用于测试智能语音交互设备的设备播报对外部唤醒的影响；自唤醒测试指令集用于测试智能语音交互设备的设备播报包含唤醒词的语音时唤醒自身的次数，因此可以统计外部唤醒率与自唤醒次数这两个测试指标，并且这两个测试指标可以反映智能语音交互设备的回声消除效果。

步骤S103：当获取到外部唤醒测试指令集时，为智能语音交互设备播放外部唤醒测试指令集，监控智能语音交互设备针对外部唤醒测试指令集的唤醒情况，统计针对外部唤醒测试指令集的外部唤醒率；和/或，

可以理解的是，当获取到外部唤醒测试指令集，智能语音交互设备及测试设备播放外部唤醒测试指令集，智能语音交互设备可以对自身播报的测试指令集进行回声消除，然后测试设备监控智能语音交互设备针对外部唤醒测试指令集的唤醒情况，比如监控智能语音交互设备成功唤醒与否，然后统计预设时间段(比如1小时)内成功唤醒与未成功唤醒的次数，计算智能语音交互设备在预设时间段内的成功唤醒率，并将该成功唤醒率作为针对外部唤醒测试指令集的外部唤醒率。并且，外部唤醒率越高，表明智能语音交互设备对自身播报的测试指令集的回声消除效果越好。

可以理解的是，当获取到自唤醒测试指令集，智能语音交互设备播放自唤醒测试指令集，智能语音交互设备可以对自身播报的自唤醒测试指令集进行回声消除，然后测试设备监控智能语音交互设备针对自唤醒测试指令集的唤醒情况，比如监控智能语音交互设备成功唤醒与否，然后统计预设时间段(比如1小时)内成功唤醒的次数，作为针对自唤醒测试指令集的自唤醒次数。并且，自唤醒次数越少，表明智能语音交互设备对自身播报的测试指令集的回声消除效果越好。

在本公开的一个实施例中，针对智能语音交互设备的性能测试方法还包括：

(1)根据选定的目标噪声场景类型，调用与目标噪声场景类型对应的加噪处理方法，对通用唤醒测试指令集中被选定的语音指令进行加噪处理得到携带噪声的测试语音指令，其中，目标噪声场景类型包括安静场景或噪声场景。

(2)监控智能语音交互设备针对携带噪声的测试语音指令的唤醒情况，统计不同目标噪声场景下针对携带噪声的测试语音指令的分类唤醒率。

可以理解的是，根据具体场景对通用唤醒指令集中的指令进行加噪处理得到加噪后的指令，基于加噪后的指令进行播放。这样使得指令更贴合实际应用场景，使得测试结果更可靠，覆盖面更广，其中，可以由测试人员指定具体场景，进而基于具体场景的噪声参数对通用唤醒测试指令集进行加噪处理，然后测试设备监控智能语音交互设备针对每一具体场景下加噪处理后的测试指令集的唤醒情况，比如在安静和/或噪声场景下监控智能语音交互设备成功唤醒与否，然后统计预设时间段(比如1小时)内每一场景下成功唤醒的唤醒率，作为每一具体场景下针对携带噪声的测试语音指令的分类唤醒率。

(1)根据选定的目标应用场景类型，采集在目标应用场景下预设时间段内的环境音频指令。

(2)监控智能语音交互设备针对环境音频指令的唤醒情况，统计不同目标应用场景下预设时间段内针对环境音频指令的误唤醒次数。

可以理解的是，在对智能语音交互设备进行性能测试的过程中，为了全面地评价智能语音交互设备中内置的语音唤醒算法的效果，还可以统计误唤醒次数这一测试指标。

具体的，可以根据选定的目标应用场景，比如当前测试场景，采集当前测试场景中的环境音频指令，比如谈话声音，往来人流、车流声等

根据具体场景对通用唤醒指令集中的指令进行加噪处理得到加噪后的指令，基于加噪后的指令进行播放。这样使得指令更贴合实际应用场景，使得测试结果更可靠，覆盖面更广，其中，可以由测试人员指定具体场景，进而基于具体场景的噪声参数对通用唤醒测试指令集进行加噪处理，然后测试设备监控智能语音交互设备针对每一具体场景下加噪处理后的测试指令集的唤醒情况，比如在安静和/或噪声场景下监控智能语音交互设备成功唤醒与否，然后统计预设时间段(比如1小时)内每一场景下成功唤醒的唤醒率，作为每一具体场景下针对携带噪声的测试语音指令的分类唤醒率。

为了更好地理解本公开实施例，图2为本公开实施例提供的一种性能测试的整体流程示意图。

具体的，可以获取预先构建的通用唤醒指令集，通过对通用唤醒指令集进行自动化执行与统计，比如包括控制唤醒指令的播放、监控设备状态、基于唤醒标志采集和对采集的数据，即唤醒情况进行汇总统计，得到智能语音交互设备的通用唤醒率。

可以对安静/噪声场景进行定义，并且利用与场景对应的加噪处理方式对通用唤醒指令集进行加噪处理，使得处理后的指令集更加符合真实情况，然后通过对加噪后的指令集进行自动化执行与统计，比如包括控制唤醒指令的播放、监控设备状态、基于唤醒标志采集和对采集的数据，即唤醒情况进行汇总统计，得到智能语音交互设备在不同场景下的分类唤醒率。

可以对落地场景环境音频采集，并对采集的到音频指令集进行自动化执行与统计，比如包括控制唤醒指令的播放、监控设备状态、基于唤醒标志采集和对采集的数据，即唤醒情况进行汇总统计，得到智能语音交互设备针对于音频指令集在预设时间段内的误唤醒次数。

可以对回声消除的话术指令集和/或回声消除的自唤醒指令集进行梳理，然后对回声消除的话术指令集和/或回声消除的自唤醒指令集进行自动化执行与统计，在对回声消除的话术指令集进行自动化执行与统计时，控制唤醒指令的播放、监控设备状态、基于唤醒标志采集和对采集的数据，即唤醒情况进行汇总统计，获取话术指令集对应的外部唤醒率，用以评估回声消除话术播报对唤醒算法效果的影响；在对回声消除的自唤醒指令集进行自动化执行与统计时，控制唤醒指令的播放、监控设备状态、基于唤醒标志采集和对采集的数据，即唤醒情况进行汇总统计，获取自唤醒指令集对应的自唤醒次数，用以评估回声消除播报自唤醒指令对算法效果的影响。

在本公开的一个实施例中，如图3所示，外部唤醒测试指令集包括通用话术指令集和通用唤醒测试指令集，通用话术指令集包括智能语音设备播放频率超过预设播放阈值的语音指令；当获取到外部唤醒测试指令集时，为智能语音交互设备播放外部唤醒测试指令集，监控智能语音交互设备针对外部唤醒测试指令集的唤醒情况，统计针对外部唤醒测试指令集的外部唤醒率，包括：

步骤S301：基于确定的目标噪声场景类型，在通过第一自动化控制指令控制智能语音交互设备播放不同音量下的通用话术指令集时，为智能语音交互设备播放通用唤醒测试指令集；其中，智能语音交互设备对接收到的通用话术指令集中的指令进行回声消除操作。

其中，智能语音交互设备接收的语音指令包括智能语音交互设备自身播放的语音指令与测试设备播报的语音指令的叠加指令。可以理解的是，在语音唤醒过程中，除了常见的环境噪声会影响智能语音交互设备的唤醒率，语音交互设备自己播放的语音指令也会影响其唤醒率。针对这种情况，可以采用回声消除(Acoustic Echo Cancellation，AEC)技术对语音交互设备自身播报的播放的语音指令进行消除，这样语音交互设备可以接收外部唤醒语音指令，以达到准确唤醒。

在本公开的一个实施例中，外部唤醒测试指令集包括通用话术指令集和通用唤醒测试指令集，通用话术指令集包括智能语音交互设备播放频率超过预设播放阈值的语音指令，比如“屏幕已经调到最亮”、“你如果不知道怎么问我，可以说进入神灯宝典”和“请把作业放到台灯的正下方”等指令。

其中，通用话术指令集存储于语音交互设备的存储介质中，通用唤醒测试指令集存储于测试设备的存储介质中。语音交互设备与测试设备之间不仅可以进行语音交互，测试设备还可以生成控制指令，控制语音交互设备播放语音指令，或者调整语音交互设备的播放音量。

示例性的，可以在测试过程中基于确定的安静场景和/或噪声场景设置安静/家居/音乐背景环境，然后使用第一自动化控制指令依次调整语音交互设备的音量为10、20、...100，并控制语音交互设备播放通用话术集中的语音指令，然后运行测试设备播放基于通用唤醒测试指令集中语音指令，即可得到不同场景、不同音量划分下的叠加指令。

步骤S302：监控智能语音交互设备在当前场景当前音量下针对通用话术指令集和通用唤醒测试指令集的第一唤醒情况。

步骤S303：根据第一唤醒情况，统计不同场景和音量阈值划分下针对通用话术指令集和通用唤醒测试指令集的外部唤醒率。

持续监控语音交互设备的设备状态，其中，语音交互设备中的麦克风阵列会收入语音交互设备播报的通用话术集中语音指令与测试设备播报的通用唤醒测试指令集中的语音指令，此时，通用话术集中语音指令相对于通用唤醒测试指令集中的语音指令为干扰指令。此时语音交互设备中的语音唤醒判断(keyword spotting，KWS)将会受到干扰，可以利用回声消除技术消除语音交互设备播报的通用话术集中的语音指令。然后，语音交互设备可以对进行回声消除后的语音指令进行识别处理，具体的，语音交互设备接收到的语音指令进行唤醒词的判断，当语音指令中不包括唤醒词时，唤醒不成功；当语音指令中包括唤醒词时，语音唤醒设备根据唤醒词中包括的唤醒指令做出相应的唤醒动作，唤醒成功。

然后统计预设时间段(比如1小时)内成功唤醒与未成功唤醒的次数，计算智能语音交互设备在预设时间段内的成功唤醒率，并将该成功唤醒率作为针对外部唤醒测试指令集的外部唤醒率。并且，外部唤醒率越高，表明智能语音交互设备对自身播报的测试指令集的回声消除效果越好。

此外，还可以针对设置的不同场景、不同音量阈值划分的情况获取不同场景、不同音量阈值下划分下的外部唤醒率，使得获取的外部唤醒率更加全面。通过数据对比可以快速分析出各个因子对唤醒效果的影响，能够有效提高针对语音唤醒算法测试的可靠性和准确性。

在本公开的一个实施例中，如图4所示，当获取到自唤醒测试指令集时，为智能语音交互设备播放自唤醒测试指令集，监控智能语音交互设备针对自唤醒测试指令集的唤醒情况，统计针对自唤醒测试指令集的自唤醒次数，包括：

步骤S401：基于确定的目标噪声场景类型，通过第二自动化控制指令控制智能语音交互设备播放不同音量下的自唤醒测试指令集；其中，智能语音交互设备对接收到的自唤醒测试指令集中的指令进行回声消除操作。

在语音唤醒过程中，语音交互设备有时会自行播放语音指令导致语音交互设备被唤醒，这种现象称为语音交互设备的自唤醒，这种情况显示不利于语音交互设备的使用。针对这种情况，也可以采用回声消除技术对语音交互设备播放的语音指令进行消除，以防止出现自唤醒现象，这样可以减少对语音交互设备的损害。

在本公开的一个实施例中，自唤醒测试指令集包括包含唤醒指令的语音指令，比如“以后想要唤醒我，直接喊大力大力就可以了”、“大力没有看清楚”和“这道题难倒大力了，我以后会努力学习的”，这些指令中的“大力大力”和“大力”属于唤醒词的一部分。

其中，自唤醒测试指令集集存储于语音交互设备的存储介质中，测试可以生成控制指令，控制语音交互设备播放语音指令，或者调整语音交互设备的播放音量。

示例性的，可以在测试过程中基于确定的安静场景和/或噪声场景设置安静/家居/音乐背景环境，然后使用第二自动化控制指令依次调整语音交互设备的音量为10、20、...100，比如每个音量阈值下播放基于含自唤醒测试指令集的语音指令，即可得到不同场景、不同音量划分下的自唤醒语音指令。

步骤S402：监控智能语音交互设备在当前场景当前音量下针对自唤醒测试指令集的第二唤醒情况。

步骤S403：根据第二唤醒情况，统计不同场景和音量阈值划分下预设时间段内针对自唤醒测试指令集的自唤醒次数。

持续监控语音交互设备的设备状态，其中，语音交互设备的扬声器保持工作状态，播放基于自唤醒测试指令集中的语音指令，语音交互设备的麦克风阵列会收入该语音指令，此时语音交互设备中的语音唤醒判断容易受干扰，误以为此时的语音指令为唤醒信号，会出现语音交互设备播报唤醒自身的现象，可以回声消除技术过滤该语音指令。然后，语音交互设备可以对进行回声消除后的语音指令进行识别处理，具体的，语音交互设备接收到的语音指令进行唤醒词的判断，当语音指令中不包括唤醒词时，唤醒不成功；当语音指令中包括唤醒词时，语音唤醒设备根据唤醒词中包括的唤醒指令做出相应的唤醒动作，唤醒成功。

然后统计预设时间段(比如1小时)内成功唤醒的次数，作为针对自唤醒测试指令集的自唤醒次数。并且，自唤醒次数越少，表明智能语音交互设备对自身播报的测试指令集的回声消除效果越好。

此外，还可以针对设置的不同场景、不同音量阈值划分的情况获取不同场景、不同音量阈值下划分下的自唤醒次数，使得获取的自唤醒次数更加全面。通过数据对比可以快速分析出各个因子对唤醒效果的影响，能够有效提高针对语音唤醒算法评测的可靠性和准确性。

在本公开的一个实施例中，在对智能语音交互设备进行性能测试后，还包括：

根据智能语音交互设备的各种唤醒指标，调整应用在智能语音交互设备中的语音唤醒算法的参数，以更新语音唤醒算法。

可以理解的是，在获取智能语音交互设备的各种唤醒指标，比如获取通用唤醒率、分类唤醒率、误唤醒次数、外部唤醒率及自唤醒率等之后，可以调整应用在智能语音交互设备中的语音唤醒算法的参数，以更新语音唤醒算法，比如通过改进回声消除技术、提高声源定位，或者去混响技术改进语音唤醒算法，使得更新后的语音唤醒算法可以提高智能语音交互设备的唤醒效果。

基于同样的发明构思，本公开实施例提供了一种评测装置，如图5所示，该评测装置50可以包括：第一统计模块501、获取模块502以及第二统计模块503，其中，

第一统计模块501，用于获取预先构建的通用唤醒指令集，为智能语音交互设备播放通用唤醒测试指令集，监控智能语音交互设备针对通用唤醒测试指令集的唤醒情况，统计针对通用唤醒测试指令集的通用唤醒率。

获取模块502，用于获取预先构建的针对回声消除的外部唤醒测试指令集和/或针对回声消除的自唤醒测试指令集；其中，外部唤醒测试指令集用于测试智能语音交互设备的设备播报对外部唤醒的影响；自唤醒测试指令集用于测试智能语音交互设备的设备播报包含唤醒词的语音时唤醒自身的次数。

第二统计模块503，用于当获取到外部唤醒测试指令集时，为智能语音交互设备播放外部唤醒测试指令集，监控智能语音交互设备针对外部唤醒测试指令集的唤醒情况，统计针对外部唤醒测试指令集的外部唤醒率；和/或，

本实施例的性能测试装置可执行本公开上述实施例所示的性能测试方法，其实现原理相类似，此处不再赘述。

下面参考图6，其示出了适于用来实现本公开实施例的电子设备400的结构示意图。本公开实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图6示出的电子设备仅仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。

电子设备包括：存储器以及处理器，其中，这里的处理器可以称为下文所述的处理装置401，存储器可以包括下文中的只读存储器(ROM)402、随机访问存储器(RAM)403以及存储装置408中的至少一项，具体如下所示：

如图6所示，电子设备400可以包括处理装置(例如中央处理器、图形处理器等)401，其可以根据存储在只读存储器(ROM)402中的程序或者从存储装置408加载到随机访问存储器(RAM)403中的程序而执行各种适当的动作和处理。在RAM 403中，还存储有电子设备400操作所需的各种程序和数据。处理装置401、ROM 402以及RAM 403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。

通常，以下装置可以连接至I/O接口405：包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置406；包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置407；包括例如磁带、硬盘等的存储装置408；以及通信装置409。通信装置409可以允许电子设备400与其他设备进行无线或有线通信以交换数据。虽然图6示出了具有各种装置的电子设备400，但是应理解的是，并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。

特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在非暂态计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信装置409从网络上被下载和安装，或者从存储装置408被安装，或者从ROM 402被安装。在该计算机程序被处理装置401执行时，执行本公开实施例的方法中限定的上述功能。

需要说明的是，本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中，计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：电线、光缆、RF(射频)等等，或者上述的任意合适的组合。

在一些实施方式中，客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol，超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信，并且可以与任意形式或介质的数字数据通信(例如，通信网络)互连。通信网络的示例包括局域网(“LAN”)，广域网(“WAN”)，网际网(例如，互联网)以及端对端网络(例如，ad hoc端对端网络)，以及任何当前已知或未来研发的网络。

上述计算机可读介质可以是上述电子设备中所包含的；也可以是单独存在，而未装配入该电子设备中。

上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该电子设备执行时，使得该电子设备：

获取预先构建的通用唤醒测试指令集，为智能语音交互设备播放通用唤醒测试指令集，监控智能语音交互设备针对通用唤醒测试指令集的唤醒情况，统计针对通用唤醒测试指令集的通用唤醒率；

可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码，上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

附图中的流程图和框图，图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本公开实施例中所涉及到的模块或单元可以通过软件的方式实现，也可以通过硬件的方式来实现。其中，模块或单元的名称在某种情况下并不构成对该单元本身的限定。

本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如，非限制性地，可以使用的示范类型的硬件逻辑部件包括：现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)等等。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

根据本公开的一个或多个实施例，提供了一种智能语音交互设备的性能测试方法，包括：

在本公开的一个实施例中，为智能语音交互设备播放通用唤醒测试指令集，包括：

在本公开的一个实施例中，智能语音交互设备的性能测试方法还包括：

根据选定的目标噪声场景类型，调用与目标噪声场景类型对应的加噪处理方法，对通用唤醒测试指令集中被选定的语音指令进行加噪处理得到携带噪声的测试语音指令，其中，目标噪声场景类型包括安静场景或噪声场景；

监控智能语音交互设备针对携带噪声的测试语音指令的唤醒情况，统计不同目标噪声场景下针对携带噪声的测试语音指令的分类唤醒率。

根据选定的目标应用场景类型，采集在目标应用场景下预设时间段内的环境音频指令；

监控智能语音交互设备针对环境音频指令的唤醒情况，统计不同目标应用场景下预设时间段内针对环境音频指令的误唤醒次数。

在本公开的一个实施例中，外部唤醒测试指令集包括通用话术指令集和通用唤醒测试指令集，通用话术指令集包括智能语音设备播放频率超过预设播放阈值的语音指令；当获取到外部唤醒测试指令集时，为智能语音交互设备播放外部唤醒测试指令集，监控智能语音交互设备针对外部唤醒测试指令集的唤醒情况，统计针对外部唤醒测试指令集的外部唤醒率，包括：

基于确定的目标噪声场景类型，在通过第一自动化控制指令控制智能语音交互设备播放不同音量下的通用话术指令集时，为智能语音交互设备播放通用唤醒测试指令集；其中，智能语音交互设备对接收到的通用话术指令集中的指令进行回声消除操作；

监控智能语音交互设备在当前场景当前音量下针对通用话术指令集和通用唤醒测试指令集的第一唤醒情况；

根据第一唤醒情况，统计不同场景和音量阈值划分下针对通用话术指令集和通用唤醒测试指令集的外部唤醒率。

在本公开的一个实施例中，当获取到自唤醒测试指令集时，为智能语音交互设备播放自唤醒测试指令集，监控智能语音交互设备针对自唤醒测试指令集的唤醒情况，统计针对自唤醒测试指令集的自唤醒次数，包括：

基于确定的目标噪声场景类型，通过第二自动化控制指令控制智能语音交互设备播放不同音量下的自唤醒测试指令集；其中，智能语音交互设备对接收到的自唤醒测试指令集中的指令进行回声消除操作；

监控智能语音交互设备在当前场景当前音量下针对自唤醒测试指令集的第二唤醒情况；

根据第二唤醒情况，统计不同场景和音量阈值划分下预设时间段内针对自唤醒测试指令集的自唤醒次数。

根据本公开的一个或多个实施例，提供了一种智能语音交互设备的性能测试装置，包括：

第一统计模块，用于获取预先构建的通用唤醒测试指令集，为智能语音交互设备播放通用唤醒测试指令集，监控智能语音交互设备针对通用唤醒测试指令集的唤醒情况，统计针对通用唤醒测试指令集的通用唤醒率；

第一播放子模块，用于根据预设发音人的性别、年龄、地域、语速中的至少一项，从通用唤醒测试指令集中选择匹配的测试语音指令进行播放。

在本公开的一个实施例中，智能语音交互设备的性能测试装置还包括：

加噪模块，用于根据选定的目标噪声场景类型，调用与目标噪声场景类型对应的加噪处理方法，对通用唤醒测试指令集中被选定的语音指令进行加噪处理得到携带噪声的测试语音指令，其中，目标噪声场景类型包括安静场景或噪声场景；

第三统计模块，用于监控智能语音交互设备针对携带噪声的测试语音指令的唤醒情况，统计不同目标噪声场景下针对携带噪声的测试语音指令的分类唤醒率。

采集模块，用于根据选定的目标应用场景类型，采集在目标应用场景下预设时间段内的环境音频指令；

第四统计模块，用于监控智能语音交互设备针对环境音频指令的唤醒情况，统计不同目标应用场景下预设时间段内针对环境音频指令的误唤醒次数。

在本公开的一个实施例中，外部唤醒测试指令集包括通用话术指令集和通用唤醒测试指令集，通用话术指令集包括智能语音设备播放频率超过预设播放阈值的语音指令；第一统计模块，包括：

第二播放子模块，用于基于确定的目标噪声场景类型，在通过第一自动化控制指令控制智能语音交互设备播放不同音量下的通用话术指令集时，为智能语音交互设备播放通用唤醒测试指令集；其中，智能语音交互设备对接收到的通用话术指令集中的指令进行回声消除操作；

第一监控子模块，用于监控智能语音交互设备在当前场景当前音量下针对通用话术指令集和通用唤醒测试指令集的第一唤醒情况；

第一统计子模块，用于根据第一唤醒情况，统计不同场景和音量阈值划分下针对通用话术指令集和通用唤醒测试指令集的外部唤醒率。

在本公开的一个实施例中，第一统计模块，包括：

第三播放子模块，用于基于确定的目标噪声场景类型，通过第二自动化控制指令控制智能语音交互设备播放不同音量下的自唤醒测试指令集；其中，智能语音交互设备对接收到的自唤醒测试指令集中的指令进行回声消除操作；

第二监控子模块，用于监控智能语音交互设备在当前场景当前音量下针对自唤醒测试指令集的第二唤醒情况；

第二统计子模块，用于根据第二唤醒情况，统计不同场景和音量阈值划分下预设时间段内针对自唤醒测试指令集的自唤醒次数。

更新模块，用于根据智能语音交互设备的各种唤醒指标，调整应用在智能语音交互设备中的语音唤醒算法的参数，以更新语音唤醒算法。

根据本公开的一个或多个实施例，提供了一种电子设备，包括：

一个或多个处理器；

存储器；

一个或多个应用程序，其中一个或多个应用程序被存储在存储器中并被配置为由一个或多个处理器执行，一个或多个程序配置用于执行上述性能测试方法。

根据本公开的一个或多个实施例，提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述性能测试方法。

以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本公开中所涉及的公开范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述公开构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

此外，虽然采用特定次序描绘了各操作，但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下，多任务和并行处理可能是有利的。同样地，虽然在上面论述中包含了若干具体实现细节，但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地，在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。

尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题，但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反，上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims

1.一种智能语音交互设备的性能测试方法，其特征在于，包括：

获取预先构建的通用唤醒测试指令集，为智能语音交互设备播放所述通用唤醒测试指令集，监控所述智能语音交互设备针对所述通用唤醒测试指令集的唤醒情况，统计针对所述通用唤醒测试指令集的通用唤醒率；

获取预先构建的针对回声消除的外部唤醒测试指令集和/或针对回声消除的自唤醒测试指令集；其中，所述外部唤醒测试指令集用于测试所述智能语音交互设备的设备播报对外部唤醒的影响；所述自唤醒测试指令集用于测试所述智能语音交互设备的设备播报包含唤醒词的语音时唤醒自身的次数；

当获取到所述外部唤醒测试指令集时，为所述智能语音交互设备播放所述外部唤醒测试指令集，监控所述智能语音交互设备针对所述外部唤醒测试指令集的唤醒情况，统计针对所述外部唤醒测试指令集的外部唤醒率；和/或，

当获取到所述自唤醒测试指令集时，为所述智能语音交互设备播放所述自唤醒测试指令集，监控所述智能语音交互设备针对所述自唤醒测试指令集的唤醒情况，统计针对所述自唤醒测试指令集的自唤醒次数。

2.根据权利要求1所述的方法，其特征在于，所述为智能语音交互设备播放所述通用唤醒测试指令集，包括：

根据预设发音人的性别、年龄、地域、语速中的至少一项，从所述通用唤醒测试指令集中选择匹配的测试语音指令进行播放。

3.根据权利要求1所述的方法，其特征在于，所述方法还包括：

根据选定的目标噪声场景类型，调用与所述目标噪声场景类型对应的加噪处理方法，对所述通用唤醒测试指令集中被选定的语音指令进行加噪处理得到携带噪声的测试语音指令，其中，所述目标噪声场景类型包括安静场景或噪声场景；

监控所述智能语音交互设备针对所述携带噪声的测试语音指令的唤醒情况，统计不同目标噪声场景下针对所述携带噪声的测试语音指令的分类唤醒率。

4.根据权利要求1所述的方法，其特征在于，所述方法还包括：

根据选定的目标应用场景类型，采集在所述目标应用场景下预设时间段内的环境音频指令；

监控所述智能语音交互设备针对所述环境音频指令的唤醒情况，统计不同目标应用场景下预设时间段内针对所述环境音频指令的误唤醒次数。

5.根据权利要求1所述的方法，其特征在于，所述外部唤醒测试指令集包括通用话术指令集和所述通用唤醒测试指令集，所述通用话术指令集包括所述智能语音设备播放频率超过预设播放阈值的语音指令；

所述当获取到所述外部唤醒测试指令集时，为所述智能语音交互设备播放所述外部唤醒测试指令集，监控所述智能语音交互设备针对所述外部唤醒测试指令集的唤醒情况，统计针对所述外部唤醒测试指令集的外部唤醒率，包括：

基于确定的目标噪声场景类型，在通过第一自动化控制指令控制所述智能语音交互设备播放不同音量下的通用话术指令集时，为所述智能语音交互设备播放所述通用唤醒测试指令集；其中，所述智能语音交互设备对接收到的所述通用话术指令集中的指令进行回声消除操作；

监控所述智能语音交互设备在当前场景当前音量下针对所述通用话术指令集和所述通用唤醒测试指令集的第一唤醒情况；

根据所述第一唤醒情况，统计不同场景和音量阈值划分下针对所述通用话术指令集和所述通用唤醒测试指令集的外部唤醒率。

6.根据权利要求1所述的方法，其特征在于，所述当获取到所述自唤醒测试指令集时，为所述智能语音交互设备播放所述自唤醒测试指令集，监控所述智能语音交互设备针对所述自唤醒测试指令集的唤醒情况，统计针对所述自唤醒测试指令集的自唤醒次数，包括：

基于确定的目标噪声场景类型，通过第二自动化控制指令控制所述智能语音交互设备播放不同音量下的自唤醒测试指令集；其中，所述智能语音交互设备对接收到的所述自唤醒测试指令集中的指令进行回声消除操作；

监控所述智能语音交互设备在当前场景当前音量下针对所述自唤醒测试指令集的第二唤醒情况；

根据所述第二唤醒情况，统计不同场景和音量阈值划分下所述预设时间段内针对所述自唤醒测试指令集的自唤醒次数。

7.根据权利要求1-6任一项所述的方法，其特征在于，所述方法还包括：

根据智能语音交互设备的各种唤醒指标，调整应用在所述智能语音交互设备中的语音唤醒算法的参数，以更新所述语音唤醒算法。

8.一种智能语音交互设备的性能测试装置，其特征在于，包括：

第一统计模块，用于获取预先构建的通用唤醒测试指令集，为智能语音交互设备播放所述通用唤醒测试指令集，监控所述智能语音交互设备针对所述通用唤醒测试指令集的唤醒情况，统计针对所述通用唤醒测试指令集的通用唤醒率；

获取模块，用于获取预先构建的针对回声消除的外部唤醒测试指令集和/或针对回声消除的自唤醒测试指令集；其中，所述外部唤醒测试指令集用于测试所述智能语音交互设备的设备播报对外部唤醒的影响；所述自唤醒测试指令集用于测试所述智能语音交互设备的设备播报包含唤醒词的语音时唤醒自身的次数；

第二统计模块，用于当获取到所述外部唤醒测试指令集时，为所述智能语音交互设备播放所述外部唤醒测试指令集，监控所述智能语音交互设备针对所述外部唤醒测试指令集的唤醒情况，统计针对所述外部唤醒测试指令集的外部唤醒率；和/或，

用于当获取到所述自唤醒测试指令集时，为所述智能语音交互设备播放所述自唤醒测试指令集，监控所述智能语音交互设备针对所述自唤醒测试指令集的唤醒情况，统计针对所述自唤醒测试指令集的自唤醒次数。

9.一种电子设备，其特征在于，其包括：

一个或多个处理器；

存储器；

一个或多个应用程序，其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行，所述一个或多个程序配置用于：执行根据权利要求1～7任一项所述的性能测试方法。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1-7任一项所述的性能测试方法。