CN110136694A - 一种语音识别处理设备的测试装置 - Google Patents

一种语音识别处理设备的测试装置 Download PDF

Info

Publication number
CN110136694A
CN110136694A CN201810133457.8A CN201810133457A CN110136694A CN 110136694 A CN110136694 A CN 110136694A CN 201810133457 A CN201810133457 A CN 201810133457A CN 110136694 A CN110136694 A CN 110136694A
Authority
CN
China
Prior art keywords
module
voice
processing equipment
recognition processing
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810133457.8A
Other languages
English (en)
Inventor
杨常泉
李响
黄波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai New Blue Ocean Automation Technology Co Ltd
Original Assignee
Shanghai New Blue Ocean Automation Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai New Blue Ocean Automation Technology Co Ltd filed Critical Shanghai New Blue Ocean Automation Technology Co Ltd
Priority to CN201810133457.8A priority Critical patent/CN110136694A/zh
Publication of CN110136694A publication Critical patent/CN110136694A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/01Assessment or evaluation of speech recognition systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Testing Electric Properties And Detecting Electric Faults (AREA)

Abstract

本发明公开了一种语音识别处理设备的测试装置,包括供电单元、信息处理单元、控制单元和显示单元,所述供电单元与信息处理单元和控制单元电连接,所述控制单元与信息处理单元和显示单元均连接,所述控制单元还与待测试的语音识别处理设备连接,所述信息处理单元包括语音存储模块、语音输出模块、信号接收模块、信号识别模块和比对模块,所述语音存储模块与语音输出模块连接,所述信号接收模块和信号识别模块连接,所述比对模块与信号识别模块和语音存储模块连接,所述语音输出模块、信号接收模块均与待测试的语音识别处理设备连接。通过上述技术方案,能在测试集的规模比较大的情况下快速的输出测试集,不需要再进行人工录制,测试效率高。

Description

一种语音识别处理设备的测试装置
技术领域
本发明涉及测试设备领域,尤其涉及一种语音识别处理设备的测试装置。
背景技术
语音识别(Automatic speech recognition,ASR)是从语音波形中识别出对应的文字内容的技术,是人工智能领域的重要技术之一,并且已经广泛的应用于工业制造、家电、汽车电子设备、医疗、智能家居等行业中。目前,语音识别技术己应用于各场景,例如,导航系统中利用语音识别技术识别用户的语音输入命令;搜索引擎或电商平台中利用语音识别技术识别用户语音输入的搜索关键字;利用语音识别技术识别用户输入的语音以实现机器人对话等等场景,语音识别技术还应用于智能电视的语音输入系统,智能手机的语音输入和识别系统等等。针对任一应用场景开发的语音识别系统在上线使用前,均需要对该语音识别系统进行性能测试,也就是对语音识别系统的识别准确率进行测试,从而根据性能测试情况确定当前语音识别系统是否达到上线使用标准,并可根据识别准确率对语音识别系统进行适当的改进。
目前,语音识别处理设备的测试装置对语音识别系统的性能进行测试时,需要将用户可能发出的语音命令让具有不同音色的男人、女人、小孩等来读,录制成测试集,将该人工录制的测试集输入待测试的语音识别系统中,以确定待测试的语音识别系统的识别准确率。该语音识别系统的性能测试方法在测试集规模比较小的情况下,能够快速完成。但是,当人工录制测试集的规模比较大的情况下,则耗时耗力,很难快速得到满足要求的测试集,从而影响语音识别系统的测试效率,无法满足语音识别系统快速测试的需求。
发明内容
鉴于目前语音识别处理设备的测试装置存在的上述不足,本发明提供一种语音识别处理设备的测试装置,能在测试集的规模比较大的情况下快速的输出测试集,不需要再进行人工录制,测试效率高。
为达到上述目的,本发明的实施例采用如下技术方案:
一种语音识别处理设备的测试装置,包括供电单元、信息处理单元、控制单元和显示单元,所述供电单元与信息处理单元和控制单元电连接,所述控制单元与信息处理单元和显示单元均连接,所述控制单元还与待测试的语音识别处理设备连接,所述信息处理单元包括语音存储模块、语音输出模块、信号接收模块、信号识别模块和比对模块,所述语音存储模块与语音输出模块连接,所述信号接收模块和信号识别模块连接,所述比对模块与信号识别模块和语音存储模块连接,所述语音输出模块、信号接收模块均与待测试的语音识别处理设备连接,供电电源用来将公用电源的电压转换成与信息处理单元和控制单元相适应的电压,控制单元用来对信息处理单元,显示单元和待测试的语音识别处理设备进行管理和控制,信息处理单元用来和待测试的语音识别设备进行音频信号的传输,并对待测试的语音识别设备反馈的识别结果进行处理,显示单元用来显示经信息处理单元处理的对待测试的语音识别设备的测试结果和待测试的语音识别设备的运行状态参数。信息处理单元的语音存储模块存储有含多个参数的海量的语音素材,这些参数包括声库参数、环境特征参数和关键字参数,声库参数是指初始的语音信号中的性别、年龄,音色、语速和语调等参数,环境特征参数实质初始的语音信号中的语音背景参数,如噪声、混响、听感的远近等参数,关键字参数是指初始的语音信号中的表达具体信息内容的参数,如初始的语音信号是要对一个商品进行搜索,则关键字参数则是指初始的语音信号中的商品名称,型号等,即声库参数是指谁来读初始语音信号的参数,环境特征参数是指在哪读初始语音信号的参数,关键字参数是指初始语音信号读什么的参数,在控制单元的协同作用下,各参数的语音素材按要求进行组合成初始的语音信号,例如,待测试的语音识别处理设备是用于汽车的中控导航系统,那我们选用的环境参数是存储在语音存储模块中的小轿车行驶时的车厢内的声音,客车行驶时车厢内的声音,选用的关键字参数则是地点名称、小区名称,道路名称等表达地点的词语,选用的声库参数则是3-80岁的男性、女性,老人、小孩和带有方言特征的男性、女性,老人、小孩,初始的语音信号是这些参数组合后的语音信号,即在环境参数播放的情况下,声库参数读出关键字参数形成的语音信号,语音输出模块将上述形成的初始语音信号传输给语音识别设备,信号接收模块对待测试的语音识别处理设备的相应时间和反馈时间进行记录和接收,并传输给信号识别模块,信号识别模块识别后会将识别的结果、相应时间、和待测试的语音识别处理设备的运行参数等传输给显示单元进行显示,同时也会把识别结果传输给比对模块与初始语音信号进行比对,将比对结果输出给控制模块,控制模块发出指令使显示单元显示比对结果,上述语音存储装置中存储的海量语音素材可以在控制单元的作用下自助的转化成符合要求的大规模测试集,可以满足工业制造、家电、汽车电子设备、医疗、智能家居等多个行业的语音识别和处理设备测试的需要,不需要再进行人工录制,且可以不间断的测试,测试效率高。
优选的,所述供电单元设有第一电压转换模块,所述第一电压转换模块与语音存储模块、语音输出模块、信号接收模块、信号识别模块和比对模块,以及控制单元均连接,供电单元将外部电源的电压转换成两种规格,一种规格与控制单元需要的电压相适应,另一种规格与控制单元需要的电压相适应。
优选的,所述控制单元包括控制模块和第二电压转换模块,所述控制模块与语音存储模块、信号识别模块和比对模块,以及显示单元均连接,所述第二电压转换模块与待测试的语音识别处理设备和显示单元均连接,控制模块用来管理和控制语音存储模块、信号识别模块和比对模块,以及显示单元,使其能按照设定的程序运行,并监控他们的运行状态,如果运行的程序出现错误,则可以及时发现和处理,第二电压转换模块用来将第一电压转换模块输入的电源的电压转换成与待测试的语音识别处理设备和显示单元相适应的单元,并为其供电。
优选的,所述显示单元包括显示器模块和功能面板模块,所述显示器模块和功能面板模块均与控制单元连接,显示器模块用来使操作人员对识别的各个结果和待测试的语音识别处理设备的运行状态的参数进行观测,功能面板用来显示测试的语音识别处理设备的运行状态的参数,如电压、电流等。
优选的,所述信息处理单元语还包括语音识别模块,所述语音识别模块与语音存储模块连接,语音识别模块用来让操作者用语音输入测试指令,即操作者说出标准的语音对欲合成的初始语音信号进行定义,如将环境参数选为行驶的汽车车厢内的声音。
优选的,所述语音输出模块设有无线通信装置或者信号线接口,用来传递初始的语音信号。
优选的,所述无线通信装置设为蓝牙装置。
优选的,所述信号接收模块设有无线通信装置或者信号线接口,用来传递经待测试的语音识别处理设备识别和处理后的音频信号。
优选的,所述信号线接口为USB接口。
本发明实施的优点:本发明提供一种语音识别处理设备的测试装置,包括供电单元、信息处理单元、控制单元和显示单元,所述供电单元与信息处理单元和控制单元电连接,所述控制单元与信息处理单元和显示单元均连接,所述控制单元还与待测试的语音识别处理设备连接,所述信息处理单元包括语音存储模块、语音输出模块、信号接收模块、信号识别模块和比对模块,所述语音存储模块与语音输出模块连接,所述信号接收模块和信号识别模块连接,所述比对模块与信号识别模块和语音存储模块连接,所述语音输出模块、信号接收模块均与待测试的语音识别处理设备连接,通过上述技术方案,能在测试集的规模比较大的情况下快速的输出测试集,可以满足工业制造、家电、汽车电子设备、医疗、智能家居等多个行业的语音识别和处理设备测试的需要,不需要再进行人工录制,测试效率高。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明所述的一种语音识别处理设备的测试装置的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,一种语音识别处理设备的测试装置,包括供电单元1、信息处理单元2、控制单元3和显示单元4,所述供电单元1与信息处理单元2和控制单元3电连接,所述控制单元3与信息处理单元2和显示单元4均连接,所述控制单元3还与待测试的语音识别处理设备连接,所述信息处理单元2包括语音存储模块21、语音输出模块22、信号接收模块23、信号识别模块24和比对模块25,所述语音存储模块21与语音输出模块22连接,所述信号接收模块23和信号识别模块24连接,所述比对模块25与信号识别模块24和语音存储模块21连接,所述语音输出模块22、信号接收模块23均与待测试的语音识别处理设备连接,供电电源用来将公用电源的电压转换成与信息处理单元2和控制单元3相适应的电压,控制单元3用来对信息处理单元2,显示单元4和待测试的语音识别处理设备进行管理和控制,信息处理单元2用来和待测试的语音识别设备进行音频信号的传输,并对待测试的语音识别设备反馈的识别结果进行处理,显示单元4用来显示经信息处理单元2处理的对待测试的语音识别设备的测试结果和待测试的语音识别设备的运行状态参数。信息处理单元2的语音存储模块21存储有含多个参数的海量的语音素材,这些参数包括声库参数、环境特征参数和关键字参数,声库参数是指初始的语音信号中的性别、年龄,音色、语速和语调等参数,环境特征参数实质初始的语音信号中的语音背景参数,如噪声、混响、听感的远近等参数,关键字参数是指初始的语音信号中的表达具体信息内容的参数,如初始的语音信号是要对一个商品进行搜索,则关键字参数则是指初始的语音信号中的商品名称,型号等,即声库参数是指谁来读初始语音信号的参数,环境特征参数是指在哪读初始语音信号的参数,关键字参数是指初始语音信号读什么的参数,在控制单元3的协同作用下,各参数的语音素材按要求进行组合成初始的语音信号,例如,待测试的语音识别处理设备是用于汽车的中控导航系统,那我们选用的环境参数是存储在语音存储模块21中的小轿车行驶时的车厢内的声音,客车行驶时车厢内的声音,选用的关键字参数则是地点名称、小区名称,道路名称等表达地点的词语,选用的声库参数则是3-80岁的男性、女性,老人、小孩和带有方言特征的男性、女性,老人、小孩,初始的语音信号是这些参数组合后的语音信号,即在环境参数播放的情况下,声库参数读出关键字参数形成的语音信号,语音输出模块22将上述形成的初始语音信号传输给语音识别设备,信号接收模块23对待测试的语音识别处理设备的相应时间和反馈时间进行记录和接收,并传输给信号识别模块24,信号识别模块24识别后会将识别的结果、相应时间、和待测试的语音识别处理设备的运行参数等传输给显示单元4进行显示,同时也会把识别结果传输给比对模块25与初始语音信号进行比对,将比对结果输出给控制模块,控制模块发出指令使显示单元4显示比对结果,上述语音存储装置中存储的海量语音素材可以在控制单元3的作用下自助的转化成符合要求的大规模测试集,不需要再进行人工录制,且可以不间断的测试,测试效率高。
所述供电单元1设有第一电压转换模块,所述第一电压转换模块与语音存储模块21、语音输出模块22、信号接收模块23、信号识别模块24和比对模块25,以及控制单元3均连接,供电单元1将外部电源的电压转换成两种规格,一种规格与控制单元3需要的电压相适应,另一种规格与控制单元3需要的电压相适应。
所述控制单元3包括控制模块31和第二电压转换模块32,所述控制模块31与语音存储模块21、信号识别模块24和比对模块25,以及显示单元4均连接,所述第二电压转换模块32与待测试的语音识别处理设备和显示单元4均连接,控制模块31用来管理和控制语音存储模块21、信号识别模块24和比对模块25,以及显示单元4,使其能按照设定的程序运行,并监控他们的运行状态,如果运行的程序出现错误,则可以及时发现和处理,第二电压转换模块32用来将第一电压转换模块输入的电源的电压转换成与待测试的语音识别处理设备和显示单元4相适应的单元,并为其供电。
所述显示单元4包括显示器模块41和功能面板模块42,所述显示器模块41和功能面板模块42均与控制单元3连接,显示器模块41用来使操作人员对识别的各个结果和待测试的语音识别处理设备的运行状态的参数进行观测,功能面板用来显示测试的语音识别处理设备的运行状态的参数,如电压、电流等。
所述信息处理单元2语还包括语音识别模块,所述语音识别模块与语音存储模块21连接,语音识别模块用来让操作者用语音输入测试指令,即操作者说出标准的语音对欲合成的初始语音信号进行定义,如将环境参数选为行驶的汽车车厢内的声音。
所述语音输出模块22设有无线通信装置或者信号线接口,用来传递初始的语音信号。
所述无线通信装置设为蓝牙装置。
所述信号接收模块23设有无线通信装置或者信号线接口,用来传递经待测试的语音识别处理设备识别和处理后的音频信号。
所述信号线接口为USB接口。
本发明实施的优点:本发明提供一种语音识别处理设备的测试装置,包括供电单元、信息处理单元、控制单元和显示单元,所述供电单元与信息处理单元和控制单元电连接,所述控制单元与信息处理单元和显示单元均连接,所述控制单元还与待测试的语音识别处理设备连接,所述信息处理单元包括语音存储模块、语音输出模块、信号接收模块、信号识别模块和比对模块,所述语音存储模块与语音输出模块连接,所述信号接收模块和信号识别模块连接,所述比对模块与信号识别模块和语音存储模块连接,所述语音输出模块、信号接收模块均与待测试的语音识别处理设备连接,通过上述技术方案,能在测试集的规模比较大的情况下快速的输出测试集,可以满足工业制造、家电、汽车电子设备、医疗、智能家居等多个行业的语音识别和处理设备测试的需要,不需要再进行人工录制,测试效率高。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本领域技术的技术人员在本发明公开的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (9)

1.一种语音识别处理设备的测试装置,其特征在于,包括供电单元、信息处理单元、控制单元和显示单元,所述供电单元与信息处理单元和控制单元电连接,所述控制单元与信息处理单元和显示单元均连接,所述控制单元还与待测试的语音识别处理设备连接,所述信息处理单元包括语音存储模块、语音输出模块、信号接收模块、信号识别模块和比对模块,所述语音存储模块与语音输出模块连接,所述信号接收模块和信号识别模块连接,所述比对模块与信号识别模块和语音存储模块连接,所述语音输出模块、信号接收模块均与待测试的语音识别处理设备连接。
2.根据权利要求1所述的语音识别处理设备的测试装置,其特征在于,所述供电单元设有第一电压转换模块,所述第一电压转换模块与语音存储模块、语音输出模块、信号接收模块、信号识别模块和比对模块,以及控制单元均连接。
3.根据权利要求1所述的语音识别处理设备的测试装置,其特征在于,所述控制单元包括控制模块和第二电压转换模块,所述控制模块与语音存储模块、信号识别模块和比对模块,以及显示单元均连接,所述第二电压转换模块与待测试的语音识别处理设备和显示单元均连接。
4.根据权利要求1所述的语音识别处理设备的测试装置,其特征在于,所述显示单元包括显示器模块和功能面板模块,所述显示器模块和功能面板模块均与控制单元连接。
5.根据权利要求1-4之一所述的语音识别处理设备的测试装置,其特征在于,所述信息处理单元语还包括语音识别模块,所述语音识别模块与语音存储模块连接。
6.根据权利要求1所述的语音识别处理设备的测试装置,其特征在于,所述语音输出模块设有无线通信装置或者信号线接口。
7.根据权利要求6所述的语音识别处理设备的测试装置,其特征在于,所述无线通信装置设为蓝牙装置。
8.根据权利要求1所述的语音识别处理设备的测试装置,其特征在于,所述信号接收模块设有无线通信装置或者信号线接口。
9.根据权利要求8所述的语音识别处理设备的测试装置,其特征在于,所述信号线接口为USB接口。
CN201810133457.8A 2018-02-09 2018-02-09 一种语音识别处理设备的测试装置 Pending CN110136694A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810133457.8A CN110136694A (zh) 2018-02-09 2018-02-09 一种语音识别处理设备的测试装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810133457.8A CN110136694A (zh) 2018-02-09 2018-02-09 一种语音识别处理设备的测试装置

Publications (1)

Publication Number Publication Date
CN110136694A true CN110136694A (zh) 2019-08-16

Family

ID=67567757

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810133457.8A Pending CN110136694A (zh) 2018-02-09 2018-02-09 一种语音识别处理设备的测试装置

Country Status (1)

Country Link
CN (1) CN110136694A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110767240A (zh) * 2019-10-31 2020-02-07 广东美的制冷设备有限公司 儿童口音识别的设备控制方法、设备、存储介质及装置
CN111739512A (zh) * 2020-06-18 2020-10-02 中汽院智能网联科技有限公司 一种基于实车的语音唤醒率测试方法、系统、设备及介质
CN112383451A (zh) * 2020-11-30 2021-02-19 天津链数科技有限公司 一种基于语音交互的智能家电智能化水平测试系统及方法
CN114822501A (zh) * 2022-04-18 2022-07-29 四川虹美智能科技有限公司 智能设备语音识别及语义识别的自动化测试方法及系统

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110767240A (zh) * 2019-10-31 2020-02-07 广东美的制冷设备有限公司 儿童口音识别的设备控制方法、设备、存储介质及装置
CN110767240B (zh) * 2019-10-31 2021-12-03 广东美的制冷设备有限公司 儿童口音识别的设备控制方法、设备、存储介质及装置
CN111739512A (zh) * 2020-06-18 2020-10-02 中汽院智能网联科技有限公司 一种基于实车的语音唤醒率测试方法、系统、设备及介质
CN112383451A (zh) * 2020-11-30 2021-02-19 天津链数科技有限公司 一种基于语音交互的智能家电智能化水平测试系统及方法
CN112383451B (zh) * 2020-11-30 2022-12-16 天津链数科技有限公司 一种基于语音交互的智能家电智能化水平测试系统及方法
CN114822501A (zh) * 2022-04-18 2022-07-29 四川虹美智能科技有限公司 智能设备语音识别及语义识别的自动化测试方法及系统
CN114822501B (zh) * 2022-04-18 2023-07-25 四川虹美智能科技有限公司 智能设备语音识别及语义识别的自动化测试方法及系统

Similar Documents

Publication Publication Date Title
CN110136694A (zh) 一种语音识别处理设备的测试装置
CN112785016B (zh) 基于机器学习的新能源汽车保养维护与故障监测诊断方法
CN110853618B (zh) 一种语种识别的方法、模型训练的方法、装置及设备
CN107516510A (zh) 一种智能设备自动化语音测试方法及装置
CN103971680B (zh) 一种语音识别的方法、装置
US9024739B2 (en) Horn input to in-vehicle devices and systems
CN208271559U (zh) 一种语音识别处理设备的测试装置
DE112018006101T5 (de) Dynamische Anmeldung einer benutzerdefinierten Aufweck-Schlüsselphrase für ein sprachfähiges Computersystem
CN111933108B (zh) 一种智能网联终端智能语音交互系统自动化测试方法
CN104123938A (zh) 语音控制系统、电子装置及语音控制方法
CN107554456A (zh) 车载语音控制系统及其控制方法
CN111261151B (zh) 一种语音处理方法、装置、电子设备及存储介质
CN110348002A (zh) 实现语音请求的系统和方法
CN210489237U (zh) 一种车载智能终端语音控制系统
CN106847291A (zh) 一种本地和云端相结合的语音识别系统及方法
CN110838285A (zh) 终端语音测试的系统、方法及装置
CN109376363A (zh) 一种基于耳机的实时语音翻译方法及装置
CN106328133A (zh) 一种语音应答响应装置
CN108492819A (zh) 语言练习方法、装置、智能车载终端及存储介质
CN109147764A (zh) 语音交互方法、装置、设备及计算机可读介质
CN108091323A (zh) 用于自语音中识别情感的方法与装置
CN110428835A (zh) 一种语音设备的调节方法、装置、存储介质及语音设备
CN107371075A (zh) 麦克风
CN107566896A (zh) 多媒体信息推荐方法及装置、存储介质、终端
DE112015006999T5 (de) Fahrzeugspracherkennung umfassend eine tragbare Vorrichtung

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination