CN114822501B

CN114822501B - 智能设备语音识别及语义识别的自动化测试方法及系统

Info

Publication number: CN114822501B
Application number: CN202210403240.0A
Authority: CN
Inventors: 卢俊; 陈峰峰; 徐凯
Original assignee: Sichuan Hongmei Intelligent Technology Co Ltd
Current assignee: Sichuan Hongmei Intelligent Technology Co Ltd
Priority date: 2022-04-18
Filing date: 2022-04-18
Publication date: 2023-07-25
Anticipated expiration: 2042-04-18
Also published as: CN114822501A

Abstract

本发明公开了一种智能设备语音识别及语义识别的自动化测试方法，包括：人工编写表达式；将所述表达式进行解析组装为词条文本；将所述词条文本转换为音频文件；利用所述音频文件对待测试的智能设备进行测试并记录测试结果；本发明还公开了一种智能设备语音识别及语义识别的自动化测试系统，本发明省去了前期测试音频制作，更具广泛性和灵活性。

Description

智能设备语音识别及语义识别的自动化测试方法及系统

技术领域

本发明涉及计算机和人工智能技术领域，特别是一种智能设备语音识别及语义识别的自动化测试方法及系统。

背景技术

随着智能家电的迅猛发展，其中基于语音交互方式的智能家电对语音指令的要求越来越趋于简单、直接、日常化，以便用户在未经任何指令训练的情况下，也能通过日常习惯用语，快速掌握操控设备。针对上述原因，智能家电设备语音模型需要面向的指令对象呈几何增长。

传统的语音测试方法如图1所示，先确定需要满足语音功能的词条集，然后将词条集通过语音的方式输出到待测试的语音设备，最后记录识别结果的。语音输出的方式又分为人工现场朗读和预录制人工朗读播放。

人工现场朗读，该方式弊端明显，对人喉咙及时间消耗巨大，采样范围极小，多在少量词条集的场景使用。

预录制人工朗读播放，一般采用男女1：1比例数人，朗读词条集的命令词条，经过录音工序和后期制作、分类归档形成语音库。测试时使用自动化语音测试软件播放。该方式存在以下弊端：1提前录制语料，增加测试准备工作；2录制语料人员采样数量限制，很难形成广泛的口音样本；3语料录制后相对固定，某个词发生变化，这个命令全部作废；4语料命令数量有限，仅能选取部分命令作为录制语料。

面对智能家居对语音命令范围爆炸性增长的这种形势，传统语音测试方法愈发显得力不从心了。

发明内容

为解决现有技术中存在的问题，本发明的目的是提供一种智能设备语音识别及语义识别的自动化测试方法及系统，本发明省去了前期测试音频制作，更具广泛性和灵活性。

为实现上述目的，本发明采用的技术方案是：一种智能设备语音识别及语义识别的自动化测试方法，包括以下步骤：

步骤S10、人工编写表达式；

步骤S20、将所述表达式进行解析组装为词条文本；

步骤S30、将所述词条文本转换为音频文件；

步骤S40、利用所述音频文件对待测试的智能设备进行测试并记录测试结果。

作为本发明的进一步改进，所述步骤S10具体包括以下步骤：

步骤S11、测试人员或需求方对需要语音测试的智能设备给出原始意图功能点；

步骤S12、原始意图按表达语序习惯组装出不同的表达方式；

步骤S13、表达方式确认后，在所述表达方式中适当位置添加修饰词，形成原始表达式；

步骤S14、对所述原始表达式各个成分进行词汇扩展，得到最终表达式；

步骤S15、将所有功能点均转化为步骤S14中的最终表达式并保存。

作为本发明的进一步改进，所述最终表达式包括必备成分词汇。

作为本发明的进一步改进，所述最终表达式还包括可选成分词汇和/或范围集合名。

作为本发明的进一步改进，所述必备成分词汇、可选成分词汇和范围集合名均置于不同的符号内，且扩展后的词汇之间通过符号进行连接。

作为本发明的进一步改进，步骤S13中，在表达式中添加的修饰词包括智能设备的位置归属和目标程度。

作为本发明的进一步改进，所述步骤S20具体包括以下步骤：

步骤S21、测试软件依次读取所述最终表达式，根据最终表达式中的符号进行解析分组；

步骤S22、根据测试要求，设置遍历组合的程度，组装出原始词条；

步骤S23、将原始词条中的范围集合名进行随机等价替换，其他符号去除，从而生成最终词条文本。

作为本发明的进一步改进，所述步骤S30包括以下步骤：

步骤S31、在一定范围内，随机选择音色、语速、音调、音量的转化参数；

步骤S32、所述词条文本和转化参数通过文字转化语音的接口服务或软件生成音频文件。

作为本发明的进一步改进，所述步骤S40包括以下步骤：

步骤S41、将所述音频文件通过均衡器和人工嘴播放出来；

步骤S42、待测试的智能设备收到人工嘴播放出来的音频，产生语音识别结果字符串和语义处理字符串，收集产生的相应日志；

步骤S43、将命令本身与收集结果进行比对，做出结果初步判断，并记录使用的词条文本及转化参数。

本发明还提供一种智能设备语音识别及语义识别的自动化测试系统，用于实现如上所述的智能设备语音识别及语义识别的自动化测试方法，包括待测试的智能设备、人工嘴、均衡器和安装了测试软件的电脑，所述人工嘴以及均衡器和电脑之间通过数据线连接，待测试的智能设备和电脑之间通过数据线连接；所述测试软件用于表达式录入、语句解析组合、音频转化、音频播放、日志收集和结果记录。

本发明的有益效果是：

1、本发明省去了前期测试音频制作：只需要收集所有可能用到的词汇和语序，写为对应的语义表达式，即可大量生成该意图对应的不同说法的音频；

2、本发明使测试的音频样本更具广泛性：随着文字转语音技术平台的扩展升级，音频的采样范围可以无限扩充，音质参数更加多样化；

3、本发明使语料的变更更加灵活：当词条范围中某个词发现变化，只需要到这个词所在分类中的修改即可，马上全新生成新的语料；

4、本发明使语料更加贴近多变的实际使用语境：各个单词的随机组合，符合未经任何指令训练的不同个体的使用习惯。词与词之间组合发音的随机性，对待测设备语音识别能力能更无差别暴露。

附图说明

图1为传统语音测试流程图；

图2为本发明实施例的系统架构图；

图3为本发明实施例的流程框图。

具体实施方式

下面结合附图对本发明的实施例进行详细说明。

实施例

如图2所示，图2为本实施例智能设备语音识别及语义识别的自动化测试系统的系统架构图，包括待测语音设备、人工嘴、均衡器、安装了测试软件的电脑，所述测试软件包括表达式录入、语句解析组合、音频转化、音频播放、日志收集、结果记录。人工嘴和电脑之间通过数据线连接，待测设备和电脑之间通过数据线连接。

如图3所示，图3为本实施例智能设备语音识别及语义识别的自动化测试方法的流程图，本实施例以“空调设置温度”为例说明，包括：

一、人工编写表达式：

符号说明：()必备成分，【】可为选成分，##范围集合名，|可选其一。

测试人员或需求方对需要语音测试的设备给出原始意图功能点：空调设置温度。

2、原始意图按表达语序习惯可以组装出几种表达方式：(设置)(空调)(温度)，(空调)(设置)(温度)，(空调)(温度)(设置)。

3、在表达方式确认后，对所诉表达式中适当位置添加修饰，如房间位置归属，目标程度等，形成原始表达式，如：

(设置)【位置归属】(空调)【目标】(#空调温度范围#)【单位】

4、对所属原始表达式各个成分进行词汇扩展(可嵌套)，得到最终表达式：

(调节|调整|设置|设定|更改|修改|升高|提高|增加|降低|减小|减少)【#房间#|#房间#的】((空调|#空调昵称#)【的温度|温度】)【到|为|成|至】(#空调温度范围#)【度|摄氏度】

将所有功能点转化为类似上述的最终表达式，保存到电脑文件中，供软件读取使用。

二、程序解析组装：

1、测试软件依次读取上述文件中的表达式，程序根据表达式中的符号进行解析分组：

(调节|调整|设置|设定|更改|修改|升|升高|提高|增加|降|降低|减小|减少),【#房间#|#房间#的】,((空调|#空调昵称#),【的温度|温度】),【到|为|成|至】,(#空调温度范围#),【度|摄氏度】

2、根据测试要求，可设置遍历组合的程度，如每个必备成分词汇至少出现一次+其他成分随机组合，也可设置所有成分完全遍历组合。组装出原始词条，如：

(调节)【#房间#】((空调)【】)【为】(#空调温度范围#)【度】

3、将原始词条中的##范围集合名进行随机等价替换，其他符号去除，从而生成最终词条文本：

调节厨房空调为25度

三、词条转音频：

1、在一定范围内，随机选择音色、语速、音调、音量的转化参数；

2、词条文本和转化参数，通过文字转化语音的接口服务或软件生成音频文件，存放测试电脑本地。

四、测试与记录：

1、将上一步生成的音频文件，通过均衡器和人工嘴播放出来；

2、待测语音空调收到人工嘴播放出来的音频，产生语音识别结果字符串和语义处理字符串，收集产生的相应日志；

3、将命令本身与收集结果进行比对，做出结果初步判断，并记录使用的词条及参数。以便后续人工复核，对语音识别和语义处理效果差的记录进行分析，开发人员以此作为修改依据。

以上所述实施例仅表达了本发明的具体实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。

Claims

1.一种智能设备语音识别及语义识别的自动化测试方法，其特征在于，包括以下步骤：

步骤S10、人工编写表达式；

所述步骤S10具体包括以下步骤：

步骤S12、原始意图按表达语序习惯组装出不同的表达方式；

步骤S15、将所有功能点均转化为步骤S14中的最终表达式并保存；

步骤S20、将所述表达式进行解析组装为词条文本；

所述步骤S20具体包括以下步骤：

步骤S23、将原始词条中的范围集合名进行随机等价替换，其他符号去除，从而生成最终词条文本；

步骤S30、将所述词条文本转换为音频文件；

2.根据权利要求1所述的智能设备语音识别及语义识别的自动化测试方法，其特征在于，所述最终表达式包括必备成分词汇。

3.根据权利要求2所述的智能设备语音识别及语义识别的自动化测试方法，其特征在于，所述最终表达式还包括可选成分词汇和/或范围集合名。

4.根据权利要求3所述的智能设备语音识别及语义识别的自动化测试方法，其特征在于，所述必备成分词汇、可选成分词汇和范围集合名均置于不同的符号内，且扩展后的词汇之间通过符号进行连接。

5.根据权利要求1-4任一项所述的智能设备语音识别及语义识别的自动化测试方法，其特征在于，步骤S13中，在表达式中添加的修饰词包括智能设备的位置归属和目标程度。

6.根据权利要求1所述的智能设备语音识别及语义识别的自动化测试方法，其特征在于，所述步骤S30包括以下步骤：

7.根据权利要求6所述的智能设备语音识别及语义识别的自动化测试方法，其特征在于，所述步骤S40包括以下步骤：

步骤S41、将所述音频文件通过均衡器和人工嘴播放出来；

8.一种智能设备语音识别及语义识别的自动化测试系统，其特征在于，用于实现如权利要求7所述的智能设备语音识别及语义识别的自动化测试方法，包括待测试的智能设备、人工嘴、均衡器和安装了测试软件的电脑，所述人工嘴以及均衡器和电脑之间通过数据线连接，待测试的智能设备和电脑之间通过数据线连接；所述测试软件用于表达式录入、语句解析组合、音频转化、音频播放、日志收集和结果记录。