CN114822501B - 智能设备语音识别及语义识别的自动化测试方法及系统 - Google Patents

智能设备语音识别及语义识别的自动化测试方法及系统 Download PDF

Info

Publication number
CN114822501B
CN114822501B CN202210403240.0A CN202210403240A CN114822501B CN 114822501 B CN114822501 B CN 114822501B CN 202210403240 A CN202210403240 A CN 202210403240A CN 114822501 B CN114822501 B CN 114822501B
Authority
CN
China
Prior art keywords
expression
recognition
intelligent equipment
test
vocabulary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210403240.0A
Other languages
English (en)
Other versions
CN114822501A (zh
Inventor
卢俊
陈峰峰
徐凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Hongmei Intelligent Technology Co Ltd
Original Assignee
Sichuan Hongmei Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Hongmei Intelligent Technology Co Ltd filed Critical Sichuan Hongmei Intelligent Technology Co Ltd
Priority to CN202210403240.0A priority Critical patent/CN114822501B/zh
Publication of CN114822501A publication Critical patent/CN114822501A/zh
Application granted granted Critical
Publication of CN114822501B publication Critical patent/CN114822501B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/01Assessment or evaluation of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种智能设备语音识别及语义识别的自动化测试方法,包括:人工编写表达式;将所述表达式进行解析组装为词条文本;将所述词条文本转换为音频文件;利用所述音频文件对待测试的智能设备进行测试并记录测试结果;本发明还公开了一种智能设备语音识别及语义识别的自动化测试系统,本发明省去了前期测试音频制作,更具广泛性和灵活性。

Description

智能设备语音识别及语义识别的自动化测试方法及系统
技术领域
本发明涉及计算机和人工智能技术领域,特别是一种智能设备语音识别及语义识别的自动化测试方法及系统。
背景技术
随着智能家电的迅猛发展,其中基于语音交互方式的智能家电对语音指令的要求越来越趋于简单、直接、日常化,以便用户在未经任何指令训练的情况下,也能通过日常习惯用语,快速掌握操控设备。针对上述原因,智能家电设备语音模型需要面向的指令对象呈几何增长。
传统的语音测试方法如图1所示,先确定需要满足语音功能的词条集,然后将词条集通过语音的方式输出到待测试的语音设备,最后记录识别结果的。语音输出的方式又分为人工现场朗读和预录制人工朗读播放。
人工现场朗读,该方式弊端明显,对人喉咙及时间消耗巨大,采样范围极小,多在少量词条集的场景使用。
预录制人工朗读播放,一般采用男女1:1比例数人,朗读词条集的命令词条,经过录音工序和后期制作、分类归档形成语音库。测试时使用自动化语音测试软件播放。该方式存在以下弊端:1提前录制语料,增加测试准备工作;2录制语料人员采样数量限制,很难形成广泛的口音样本;3语料录制后相对固定,某个词发生变化,这个命令全部作废;4语料命令数量有限,仅能选取部分命令作为录制语料。
面对智能家居对语音命令范围爆炸性增长的这种形势,传统语音测试方法愈发显得力不从心了。
发明内容
为解决现有技术中存在的问题,本发明的目的是提供一种智能设备语音识别及语义识别的自动化测试方法及系统,本发明省去了前期测试音频制作,更具广泛性和灵活性。
为实现上述目的,本发明采用的技术方案是:一种智能设备语音识别及语义识别的自动化测试方法,包括以下步骤:
步骤S10、人工编写表达式;
步骤S20、将所述表达式进行解析组装为词条文本;
步骤S30、将所述词条文本转换为音频文件;
步骤S40、利用所述音频文件对待测试的智能设备进行测试并记录测试结果。
作为本发明的进一步改进,所述步骤S10具体包括以下步骤:
步骤S11、测试人员或需求方对需要语音测试的智能设备给出原始意图功能点;
步骤S12、原始意图按表达语序习惯组装出不同的表达方式;
步骤S13、表达方式确认后,在所述表达方式中适当位置添加修饰词,形成原始表达式;
步骤S14、对所述原始表达式各个成分进行词汇扩展,得到最终表达式;
步骤S15、将所有功能点均转化为步骤S14中的最终表达式并保存。
作为本发明的进一步改进,所述最终表达式包括必备成分词汇。
作为本发明的进一步改进,所述最终表达式还包括可选成分词汇和/或范围集合名。
作为本发明的进一步改进,所述必备成分词汇、可选成分词汇和范围集合名均置于不同的符号内,且扩展后的词汇之间通过符号进行连接。
作为本发明的进一步改进,步骤S13中,在表达式中添加的修饰词包括智能设备的位置归属和目标程度。
作为本发明的进一步改进,所述步骤S20具体包括以下步骤:
步骤S21、测试软件依次读取所述最终表达式,根据最终表达式中的符号进行解析分组;
步骤S22、根据测试要求,设置遍历组合的程度,组装出原始词条;
步骤S23、将原始词条中的范围集合名进行随机等价替换,其他符号去除,从而生成最终词条文本。
作为本发明的进一步改进,所述步骤S30包括以下步骤:
步骤S31、在一定范围内,随机选择音色、语速、音调、音量的转化参数;
步骤S32、所述词条文本和转化参数通过文字转化语音的接口服务或软件生成音频文件。
作为本发明的进一步改进,所述步骤S40包括以下步骤:
步骤S41、将所述音频文件通过均衡器和人工嘴播放出来;
步骤S42、待测试的智能设备收到人工嘴播放出来的音频,产生语音识别结果字符串和语义处理字符串,收集产生的相应日志;
步骤S43、将命令本身与收集结果进行比对,做出结果初步判断,并记录使用的词条文本及转化参数。
本发明还提供一种智能设备语音识别及语义识别的自动化测试系统,用于实现如上所述的智能设备语音识别及语义识别的自动化测试方法,包括待测试的智能设备、人工嘴、均衡器和安装了测试软件的电脑,所述人工嘴以及均衡器和电脑之间通过数据线连接,待测试的智能设备和电脑之间通过数据线连接;所述测试软件用于表达式录入、语句解析组合、音频转化、音频播放、日志收集和结果记录。
本发明的有益效果是:
1、本发明省去了前期测试音频制作:只需要收集所有可能用到的词汇和语序,写为对应的语义表达式,即可大量生成该意图对应的不同说法的音频;
2、本发明使测试的音频样本更具广泛性:随着文字转语音技术平台的扩展升级,音频的采样范围可以无限扩充,音质参数更加多样化;
3、本发明使语料的变更更加灵活:当词条范围中某个词发现变化,只需要到这个词所在分类中的修改即可,马上全新生成新的语料;
4、本发明使语料更加贴近多变的实际使用语境:各个单词的随机组合,符合未经任何指令训练的不同个体的使用习惯。词与词之间组合发音的随机性,对待测设备语音识别能力能更无差别暴露。
附图说明
图1为传统语音测试流程图;
图2为本发明实施例的系统架构图;
图3为本发明实施例的流程框图。
具体实施方式
下面结合附图对本发明的实施例进行详细说明。
实施例
如图2所示,图2为本实施例智能设备语音识别及语义识别的自动化测试系统的系统架构图,包括待测语音设备、人工嘴、均衡器、安装了测试软件的电脑,所述测试软件包括表达式录入、语句解析组合、音频转化、音频播放、日志收集、结果记录。人工嘴和电脑之间通过数据线连接,待测设备和电脑之间通过数据线连接。
如图3所示,图3为本实施例智能设备语音识别及语义识别的自动化测试方法的流程图,本实施例以“空调设置温度”为例说明,包括:
一、人工编写表达式:
符号说明:()必备成分,【】可为选成分,##范围集合名,|可选其一。
测试人员或需求方对需要语音测试的设备给出原始意图功能点:空调设置温度。
2、原始意图按表达语序习惯可以组装出几种表达方式:(设置)(空调)(温度),(空调)(设置)(温度),(空调)(温度)(设置)。
3、在表达方式确认后,对所诉表达式中适当位置添加修饰,如房间位置归属,目标程度等,形成原始表达式,如:
(设置)【位置归属】(空调)【目标】(#空调温度范围#)【单位】
4、对所属原始表达式各个成分进行词汇扩展(可嵌套),得到最终表达式:
(调节|调整|设置|设定|更改|修改|升高|提高|增加|降低|减小|减少)【#房间#|#房间#的】((空调|#空调昵称#)【的温度|温度】)【到|为|成|至】(#空调温度范围#)【度|摄氏度】
将所有功能点转化为类似上述的最终表达式,保存到电脑文件中,供软件读取使用。
二、程序解析组装:
1、测试软件依次读取上述文件中的表达式,程序根据表达式中的符号进行解析分组:
(调节|调整|设置|设定|更改|修改|升|升高|提高|增加|降|降低|减小|减少),【#房间#|#房间#的】,((空调|#空调昵称#),【的温度|温度】),【到|为|成|至】,(#空调温度范围#),【度|摄氏度】
2、根据测试要求,可设置遍历组合的程度,如每个必备成分词汇至少出现一次+其他成分随机组合,也可设置所有成分完全遍历组合。组装出原始词条,如:
(调节)【#房间#】((空调)【】)【为】(#空调温度范围#)【度】
3、将原始词条中的##范围集合名进行随机等价替换,其他符号去除,从而生成最终词条文本:
调节厨房空调为25度
三、词条转音频:
1、在一定范围内,随机选择音色、语速、音调、音量的转化参数;
2、词条文本和转化参数,通过文字转化语音的接口服务或软件生成音频文件,存放测试电脑本地。
四、测试与记录:
1、将上一步生成的音频文件,通过均衡器和人工嘴播放出来;
2、待测语音空调收到人工嘴播放出来的音频,产生语音识别结果字符串和语义处理字符串,收集产生的相应日志;
3、将命令本身与收集结果进行比对,做出结果初步判断,并记录使用的词条及参数。以便后续人工复核,对语音识别和语义处理效果差的记录进行分析,开发人员以此作为修改依据。
以上所述实施例仅表达了本发明的具体实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。

Claims (8)

1.一种智能设备语音识别及语义识别的自动化测试方法,其特征在于,包括以下步骤:
步骤S10、人工编写表达式;
所述步骤S10具体包括以下步骤:
步骤S11、测试人员或需求方对需要语音测试的智能设备给出原始意图功能点;
步骤S12、原始意图按表达语序习惯组装出不同的表达方式;
步骤S13、表达方式确认后,在所述表达方式中适当位置添加修饰词,形成原始表达式;
步骤S14、对所述原始表达式各个成分进行词汇扩展,得到最终表达式;
步骤S15、将所有功能点均转化为步骤S14中的最终表达式并保存;
步骤S20、将所述表达式进行解析组装为词条文本;
所述步骤S20具体包括以下步骤:
步骤S21、测试软件依次读取所述最终表达式,根据最终表达式中的符号进行解析分组;
步骤S22、根据测试要求,设置遍历组合的程度,组装出原始词条;
步骤S23、将原始词条中的范围集合名进行随机等价替换,其他符号去除,从而生成最终词条文本;
步骤S30、将所述词条文本转换为音频文件;
步骤S40、利用所述音频文件对待测试的智能设备进行测试并记录测试结果。
2.根据权利要求1所述的智能设备语音识别及语义识别的自动化测试方法,其特征在于,所述最终表达式包括必备成分词汇。
3.根据权利要求2所述的智能设备语音识别及语义识别的自动化测试方法,其特征在于,所述最终表达式还包括可选成分词汇和/或范围集合名。
4.根据权利要求3所述的智能设备语音识别及语义识别的自动化测试方法,其特征在于,所述必备成分词汇、可选成分词汇和范围集合名均置于不同的符号内,且扩展后的词汇之间通过符号进行连接。
5.根据权利要求1-4任一项所述的智能设备语音识别及语义识别的自动化测试方法,其特征在于,步骤S13中,在表达式中添加的修饰词包括智能设备的位置归属和目标程度。
6.根据权利要求1所述的智能设备语音识别及语义识别的自动化测试方法,其特征在于,所述步骤S30包括以下步骤:
步骤S31、在一定范围内,随机选择音色、语速、音调、音量的转化参数;
步骤S32、所述词条文本和转化参数通过文字转化语音的接口服务或软件生成音频文件。
7.根据权利要求6所述的智能设备语音识别及语义识别的自动化测试方法,其特征在于,所述步骤S40包括以下步骤:
步骤S41、将所述音频文件通过均衡器和人工嘴播放出来;
步骤S42、待测试的智能设备收到人工嘴播放出来的音频,产生语音识别结果字符串和语义处理字符串,收集产生的相应日志;
步骤S43、将命令本身与收集结果进行比对,做出结果初步判断,并记录使用的词条文本及转化参数。
8.一种智能设备语音识别及语义识别的自动化测试系统,其特征在于,用于实现如权利要求7所述的智能设备语音识别及语义识别的自动化测试方法,包括待测试的智能设备、人工嘴、均衡器和安装了测试软件的电脑,所述人工嘴以及均衡器和电脑之间通过数据线连接,待测试的智能设备和电脑之间通过数据线连接;所述测试软件用于表达式录入、语句解析组合、音频转化、音频播放、日志收集和结果记录。
CN202210403240.0A 2022-04-18 2022-04-18 智能设备语音识别及语义识别的自动化测试方法及系统 Active CN114822501B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210403240.0A CN114822501B (zh) 2022-04-18 2022-04-18 智能设备语音识别及语义识别的自动化测试方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210403240.0A CN114822501B (zh) 2022-04-18 2022-04-18 智能设备语音识别及语义识别的自动化测试方法及系统

Publications (2)

Publication Number Publication Date
CN114822501A CN114822501A (zh) 2022-07-29
CN114822501B true CN114822501B (zh) 2023-07-25

Family

ID=82536428

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210403240.0A Active CN114822501B (zh) 2022-04-18 2022-04-18 智能设备语音识别及语义识别的自动化测试方法及系统

Country Status (1)

Country Link
CN (1) CN114822501B (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002016558A (ja) * 2000-06-29 2002-01-18 Yamatake Building Systems Co Ltd 音声情報送信機能確認システム
DE10060587A1 (de) * 2000-12-06 2002-06-13 Philips Corp Intellectual Pty Verfahren und System zur automatischen Aktionssteuerrung bei Vorträgen
KR20100009754A (ko) * 2008-07-21 2010-01-29 금하연 인터넷을 이용한 한자 학습프로그램
JP2015045689A (ja) * 2013-08-27 2015-03-12 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 音声認識システムについての音声認識結果を評価する方法、並びに、そのコンピュータ及びコンピュータ・プログラム
WO2016015375A1 (zh) * 2014-07-31 2016-02-04 北京升哲科技有限公司 在非连接状态下获取传感数据的传感器、智能设备及方法
CN106548772A (zh) * 2017-01-16 2017-03-29 上海智臻智能网络科技股份有限公司 语音识别测试系统及方法
JP2018025717A (ja) * 2016-08-12 2018-02-15 日本電信電話株式会社 音声認識精度推定装置、音声認識精度推定方法及び音声認識精度推定プログラム
CN108900690A (zh) * 2018-07-12 2018-11-27 四川虹美智能科技有限公司 一种语音留言收发系统及方法
CN110136694A (zh) * 2018-02-09 2019-08-16 上海鑫蓝海自动化科技有限公司 一种语音识别处理设备的测试装置
CN110335628A (zh) * 2019-06-28 2019-10-15 百度在线网络技术(北京)有限公司 智能设备的语音测试方法、装置及电子设备
CN111179908A (zh) * 2020-01-03 2020-05-19 苏宁智能终端有限公司 智能语音设备的测试方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102005030965B4 (de) * 2005-06-30 2007-07-19 Daimlerchrysler Ag Erweiterung des dynamischen Vokabulars eines Spracherkennungssystems um weitere Voiceenrollments

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002016558A (ja) * 2000-06-29 2002-01-18 Yamatake Building Systems Co Ltd 音声情報送信機能確認システム
DE10060587A1 (de) * 2000-12-06 2002-06-13 Philips Corp Intellectual Pty Verfahren und System zur automatischen Aktionssteuerrung bei Vorträgen
KR20100009754A (ko) * 2008-07-21 2010-01-29 금하연 인터넷을 이용한 한자 학습프로그램
JP2015045689A (ja) * 2013-08-27 2015-03-12 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 音声認識システムについての音声認識結果を評価する方法、並びに、そのコンピュータ及びコンピュータ・プログラム
WO2016015375A1 (zh) * 2014-07-31 2016-02-04 北京升哲科技有限公司 在非连接状态下获取传感数据的传感器、智能设备及方法
JP2018025717A (ja) * 2016-08-12 2018-02-15 日本電信電話株式会社 音声認識精度推定装置、音声認識精度推定方法及び音声認識精度推定プログラム
CN106548772A (zh) * 2017-01-16 2017-03-29 上海智臻智能网络科技股份有限公司 语音识别测试系统及方法
CN110136694A (zh) * 2018-02-09 2019-08-16 上海鑫蓝海自动化科技有限公司 一种语音识别处理设备的测试装置
CN108900690A (zh) * 2018-07-12 2018-11-27 四川虹美智能科技有限公司 一种语音留言收发系统及方法
CN110335628A (zh) * 2019-06-28 2019-10-15 百度在线网络技术(北京)有限公司 智能设备的语音测试方法、装置及电子设备
CN111179908A (zh) * 2020-01-03 2020-05-19 苏宁智能终端有限公司 智能语音设备的测试方法及系统

Also Published As

Publication number Publication date
CN114822501A (zh) 2022-07-29

Similar Documents

Publication Publication Date Title
US20200286396A1 (en) Following teaching system having voice evaluation function
CN110166816B (zh) 用于人工智能教育的基于语音识别的视频编辑方法和系统
CN107516509B (zh) 用于新闻播报语音合成的语音库构建方法及系统
CN105159870A (zh) 一种精准完成连续自然语音文本化的处理系统及方法
CN105245917A (zh) 一种多媒体语音字幕生成的系统和方法
EA004352B1 (ru) Система и способ автоматизированной записи речи с использованием двух экземпляров преобразования речи и автоматизированной коррекции
CN111145719B (zh) 将中英混合及语气标签化的数据标注方法及装置
Schuppler et al. GRASS: the Graz corpus of Read And Spontaneous Speech.
CN108847215A (zh) 基于用户音色进行语音合成的方法及装置
CN110740275B (zh) 一种非线性编辑系统
CN106328146A (zh) 一种视频的字幕生成方法及装置
WO2019019406A1 (zh) 一种用于更新教学录播数据的装置
CN110211592A (zh) 智能语音数据处理装置及方法
CN107240394A (zh) 一种动态自适应语音分析技术以用于人机口语考试的方法及系统
CN116092472A (zh) 一种语音合成方法和合成系统
CN111724769A (zh) 一种智能家居语音识别模型的生产方法
Płaza et al. Call transcription methodology for contact center systems
CN110503941A (zh) 语言能力评测方法、装置、系统、计算机设备及存储介质
CN114822501B (zh) 智能设备语音识别及语义识别的自动化测试方法及系统
JP2014134640A (ja) 文字起こし装置およびプログラム
CN110889787A (zh) 一种音乐教学辅助系统
CN116129868A (zh) 一种结构化画本的生成方法和生成系统
CN111785236A (zh) 一种基于动机提取模型与神经网络的自动作曲方法
Tu et al. Establishment of Chinese Speech Emotion Database of Broadcasting
CN116935853A (zh) 机器同声传译系统、方法、测试方法、装置及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant