CN113362806A - 智能音响的评测方法、系统、存储介质及其计算机设备 - Google Patents
智能音响的评测方法、系统、存储介质及其计算机设备 Download PDFInfo
- Publication number
- CN113362806A CN113362806A CN202010136427.XA CN202010136427A CN113362806A CN 113362806 A CN113362806 A CN 113362806A CN 202010136427 A CN202010136427 A CN 202010136427A CN 113362806 A CN113362806 A CN 113362806A
- Authority
- CN
- China
- Prior art keywords
- tested
- intelligent sound
- information
- text
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 77
- 238000012545 processing Methods 0.000 claims abstract description 57
- 238000000034 method Methods 0.000 claims abstract description 37
- 238000004590 computer program Methods 0.000 claims abstract description 20
- 238000006243 chemical reaction Methods 0.000 claims abstract description 15
- 238000005516 engineering process Methods 0.000 claims abstract description 15
- 230000007246 mechanism Effects 0.000 claims description 13
- 238000012544 monitoring process Methods 0.000 claims description 10
- 230000008859 change Effects 0.000 claims description 6
- 238000012360 testing method Methods 0.000 description 20
- 230000006870 function Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/01—Assessment or evaluation of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R29/00—Monitoring arrangements; Testing arrangements
- H04R29/001—Monitoring arrangements; Testing arrangements for loudspeakers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Signal Processing (AREA)
- Telephone Function (AREA)
Abstract
本发明适用于智能音响评测技术领域,提供了一种智能音响的评测方法,包括:根据音频转化技术以将待测文本转化为对应的待测音频文件;向待测的智能音响依序播放所述待测音频文件,以在所述智能音响对应的应用程序上生成对话处理信息;自动抓取并存储所述应用程序上的所述对话处理信息的文本信息;根据全部的所述待测音频文件和对应的所述文本信息以生成评测结果报告。还提供了一种智能音响的评测系统、用于存储执行所述方法的计算机程序的存储介质以及实现所述方法的计算机设备。借此,本发明能够自动化实现对智能音响的评测,提高了智能音箱评测效率。
Description
技术领域
本发明涉及智能音响评测技术领域,尤其涉及一种智能音响的评测方法、系统、存储介质及其计算机设备。
背景技术
在对目前市场上已有的智能音箱设备(小度、小爱等)进行智能音箱的对话系统评测工作中,获取智能音箱所识别的用户指令信息和获取音箱反馈给用户的答案信息,是对智能音箱语音识别效果好坏评测的关键步骤。目前现有的方案可以通过人工方法对问答进行结果记录或者借助智能音箱所对应的app
(Application,应用程序)上显示人工记录结果,该过程机械重复,但是目前这些方法都需要大量人工进行参与,效率低下。当需要进行大量对话结果评测时,则需要耗费大量人工时间去获取结果。
中国专利CN110062321A公开了一种智能音响的测试方法,包括:向智能音响测试工装发送测试指令;所述测试指令中包括至少一个测试项目;接收所述智能音响测试工装响应所述测试指令后返回的测试数据;根据所述测试数据确定出所述测试指令所包含的各测试项目的测试结果。该方法通过测试指令对智能音响的内部硬件功能进行自动测试,而未能对智能音响的对话交互系统进行有效的自动测试,即现有技术还未能给出如何实现智能音响设备进行对话系统评测的自动测试。
综上可知,现有的方法在实际使用上,存在着较多的问题,所以有必要加以改进。
发明内容
针对上述的缺陷,本发明的目的在于提供一种智能音响的评测方法,系统、存储介质及其计算机设备,能够自动化实现对智能音响的评测,提高了智能音箱评测效率。
为了实现上述目的,本发明提供一种智能音响的评测方法,包括步骤:
根据音频转化技术以将待测文本转化为对应的待测音频文件;
向待测的智能音响依序播放所述待测音频文件,以在所述智能音响对应的应用程序上生成对话处理信息;
自动抓取并存储所述应用程序上的所述对话处理信息的文本信息;
根据全部的所述待测音频文件和对应的所述文本信息以生成评测结果报告。
根据所述的智能音响的评测方法,所述向待测的智能音响依序播放所述待测音频文件,以在所述智能音响对应的应用程序上生成对话处理信息的步骤进一步包括:
向待测的所述智能音响逐一自动播放所述待测音频文件的语音信息;
所述智能音响接收并识别所述语音信息,以在对应的所述应用程序上生成并显示出所述语音信息的所述对话处理信息;其中,所述对话处理信息包括所述智能音响音频识别后的第一对话信息和所述智能音响反馈的第二对话信息。
优选的是,所述向待测的智能音响依序播放所述待测音频文件,以在所述智能音响对应的应用程序上生成对话处理信息的步骤之前包括:
标识每一所述待测音频文件的文件名;
所述根据全部的所述待测音频文件和对应的所述文本信息以生成评测结果报告的步骤包括:
根据所述文本信息和对应的所述文件名以生成一评测结果。
所述根据全部的所述待测音频文件和对应的所述文本信息以生成评测结果报告的步骤进一步包括:
汇总全部的所述文件名所对应的所述评测结果,以生成所述评测结果报告。
所述根据音频转化技术以将待测文本转化为对应的待测音频文件的步骤之前包括:
录入文本格式的至少一条待测信息并对应存储为至少一所述待测文本。
所述自动抓取并存储所述应用程序上的所述对话处理信息的文本信息的步骤包括:
自动截取所述应用程序显示的屏幕图像,识别并存储所述屏幕图像上的所述对话处理信息的所述文本信息。
更好的是,所述自动抓取并存储所述应用程序上的所述对话处理信息的文本信息的步骤进一步包括:
实时监测所述应用程序的页面信息;
根据所述页面信息的动态变化,以自动截取所述页面信息的所述屏幕图像;
识别出所述屏幕图像上的对话文本,将所述对话文本存储生成所述文本信息。
进一步的是,所述向待测的智能音响依序播放所述待测音频文件,以在所述智能音响对应的应用程序上生成对话处理信息的步骤之前包括:
根据待测的所述智能音响的呼叫机制向所述智能音响播放语音唤醒信息,以激活唤醒所述智能音响。
所述根据音频转化技术以将待测文本转化为对应的待测音频文件的步骤进一步包括:
根据待测的所述智能音响的呼叫机制,将对应的所述语音唤醒信息合并入所述待测音频文件的前序。
还提供了一种智能音响的评测系统,包括有:
文本转音频单元,用于根据音频转化技术以将待测文本转化为对应的待测音频文件;
音频播放单元,用于向待测的智能音响依序播放所述待测音频文件,以在所述智能音响对应的应用程序上生成对话处理信息;
对话结果抓取单元,用于自动抓取并存储所述应用程序上的所述对话处理信息的文本信息;
结果生成单元,用于根据全部的所述待测音频文件和对应的所述文本信息以生成评测结果报告。
根据所述的智能音响的评测系统,所述音频播放单元具体用于向待测的所述智能音响逐一自动播放所述待测音频文件的语音信息;
所述智能音响接收并识别所述语音信息,以在对应的所述应用程序上生成并显示出所述语音信息的所述对话处理信息;其中,所述对话处理信息包括所述智能音响音频识别后的第一对话信息和所述智能音响反馈的第二对话信息。
优选的是,还包括有文件名标识单元;
所述文件名标识单元用于标识每一所述待测音频文件的文件名;
所述结果生成单元具体用于根据所述文本信息和对应的所述文件名以生成一评测结果。
所述结果生成单元具体还用于汇总全部的所述文件名所对应的所述评测结果,以生成所述评测结果报告。
还包括有文本录入单元,所述文本录入单元用于录入文本格式的至少一条待测信息并对应存储为至少一所述待测文本。
所述对话结果抓取单元用于自动截取所述应用程序显示的屏幕图像,识别并存储所述屏幕图像上的所述对话处理信息的所述文本信息。
更好的是,所述对话结果抓取单元包括有:
监测子单元,用于实时监测所述应用程序的页面信息;
截取子单元,用于根据所述页面信息的动态变化,以自动截取所述页面信息的所述屏幕图像;
识别子单元,用于识别出所述屏幕图像上的对话文本,将所述对话文本存储生成所述文本信息。
进一步的是,所述音频播放单元还用于根据待测的所述智能音响的呼叫机制向所述智能音响播放语音唤醒信息,以激活唤醒所述智能音响。
所述文本转音频单元还用于根据待测的所述智能音响的呼叫机制,将对应的所述语音唤醒信息合并入所述待测音频文件的前序。
另外,还提供了一种存储介质和计算机设备,所述存储介质用于存储一种用于执行上述智能音响的评测方法的计算机程序。
所述计算机设备包括存储介质、处理器以及存储在所述存储介质上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的智能音响的评测方法。
本发明所述智能音响的评测方法包括:根据音频转化技术以将待测文本转化为对应的待测音频文件;向待测的智能音响依序播放所述待测音频文件,以在所述智能音响对应的应用程序上生成对话处理信息;自动抓取并存储所述应用程序上的所述对话处理信息的文本信息;根据全部的所述待测音频文件和对应的所述文本信息以生成评测结果报告。还提供了一种智能音响的评测系统、用于存储执行所述方法的计算机程序的存储介质以及实现所述方法的计算机设备。借此,本发明能够自动化实现对智能音响的评测,提高了智能音箱评测效率。
附图说明
图1为本发明优选实施例采用的所述智能音响的评测方法的步骤流程图;
图2为本发明优选实施例所述智能音响的评测系统的结构框图;
图3为本发明优选实施例所述智能音响的评测系统的具体结构示意框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
需要说明的,本说明书中针对“一个实施例”、“实施例”、“示例实施例”等的引用,指的是描述的该实施例可包括特定的特征、结构或特性,但是不是每个实施例必须包含这些特定特征、结构或特性。此外,这样的表述并非指的是同一个实施例。进一步,在结合实施例描述特定的特征、结构或特性时,不管有没有明确的描述,已经表明将这样的特征、结构或特性结合到其它实施例中是在本领域技术人员的知识范围内的。
此外,在说明书及后续的权利要求当中使用了某些词汇来指称特定组件或部件,所属领域中具有通常知识者应可理解,制造商可以用不同的名词或术语来称呼同一个组件或部件。本说明书及后续的权利要求并不以名称的差异来作为区分组件或部件的方式,而是以组件或部件在功能上的差异来作为区分的准则。在通篇说明书及后续的权利要求书中所提及的“包括”和“包含”为一开放式的用语,故应解释成“包含但不限定于”。以外,“连接”一词在此系包含任何直接及间接的电性连接手段。间接的电性连接手段包括通过其它装置进行连接。
图2示出本发明优选实施例所述智能音响的评测系统100,包括有文本转音频单元10、音频播放单元20、对话结果抓取单元30以及结果生成单元40;其中,所述文本转音频单元10用于根据音频转化技术以将待测文本转化为对应的待测音频文件;音频播放单元20用于向待测的智能音响依序播放所述待测音频文件,以在所述智能音响对应的应用程序上生成对话处理信息;对话结果抓取单元30用于自动抓取并存储所述应用程序上的所述对话处理信息的文本信息;所述结果生成单元40用于根据全部的所述待测音频文件和对应的所述文本信息以生成评测结果报告。所述对话结果抓取单元30可以是搭载有相应程序的智能终端,如手机或平板电脑等,通过在手机或平板电脑上安装有对应待测的智能音响的软件APP,如小爱同学等,直接在手机或平板电脑终端上自动抓取该软件APP上生成的所述对话处理信息,对所述对话处理信息的自动抓取可以采用图像识别技术手段来实现;提取出来的所述对话处理信息将结合对应的待测音频文件来对智能音响进行评测。
音频播放单元20具体用于向待测的智能音响逐一自动播放所述待测音频文件的语音信息;所述智能音响接收并识别所述语音信息,以在对应的应用程序上生成并显示出所述语音信息的对话处理信息;其中,所述对话处理信息包括所述智能音响音频识别后的第一对话信息和所述智能音响反馈的第二对话信息。例如第一对话信息是“今天天气怎样?”,第二对话信息智能音响反馈的回答,可以是“今天晴或多云”等;再根据收集的反馈回答来评测该智能音响的对话系统。
在其他实施例中,还包括有文件名标识单元;所述文件名标识单元用于标识每一所述待测音频文件的文件名;结果生成单元40具体用于根据所述文本信息和对应的文件名以生成一评测结果。进一步的,所述结果生成单元40具体还用于汇总全部的所述文件名所对应的评测结果,以生成所述评测结果报告。
更好的是,还包括有文本录入单元,所述文本录入单元用于录入文本格式的至少一条待测信息并对应存储为至少一所述待测文本。
所述对话结果抓取单元30用于自动截取所述应用程序显示的屏幕图像,识别并存储所述屏幕图像上的所述对话处理信息的所述文本信息。
参见图3,对话结果抓取单元30包括有监测子单元301、截取子单元302以及识别子单元303;其中:
监测子单元301用于实时监测所述应用程序的页面信息;截取子单元302用于根据所述页面信息的动态变化,以自动截取所述页面信息的所述屏幕图像;识别子单元303用于识别出所述屏幕图像上的对话文本,将所述对话文本存储生成所述文本信息。
进一步的,音频播放单元20还用于根据待测的所述智能音响的呼叫机制向所述智能音响播放语音唤醒信息,以激活唤醒所述智能音响。例如“小爱同学”音响的呼叫机制是对音响说出“小爱同学”,因此该语言唤醒信息为“小爱同学”,则音频播放单元20在进行播放待测音频文件前通过,播放“小爱同学”来唤醒智能音响的对话系统,从而开始评测。
所述文本转音频单元10还用于根据待测的所述智能音响的呼叫机制,将对应的所述语音唤醒信息合并入所述待测音频文件的前序。例如将“小爱同学”的音频合并入所述待测音频文件的前序,使得音频播放单元20在逐一播放待测音频文件时,会播放前序的语音唤醒信息,来激活智能音响的对话系统,从而进入音响的智能对话模式,以便于进行播放待测音频文件的待测文本对话评测。
图1示出本发明优选实施例采用的智能音响的评测方法的步骤流程图,包括步骤S101、步骤S102、步骤S103以及步骤S104;其中:
S101:根据音频转化技术以将待测文本转化为对应的待测音频文件。其中,待测文本表示需要对待测的智能音响进行语音交流的文本信息,例如对智能音响提问、对话或传达命令等,具体可以是:“今天天气如何?、今天路况如何?”等信息,通过音频转化技术,即文本转音频技术手段将对应的待测文本转换为待测音频文件并存储备用。
优选的是,步骤S101之前包括:
录入文本格式的至少一条待测信息并对应存储为至少一所述待测文本。将需要提问或者对话的待测信息以文本格式录入并存储为对应的待测文本;优选的是,若干个所述待测文本可存储在一个.txt格式(文本文档)内用于后续的音频转换;通过音频转化技术获得的待测音频文件可以是.wav格式(波形声音文件),当然也可以是其他的视频播放文件格式。
S102:向待测的智能音响依序播放所述待测音频文件,以在所述智能音响对应的应用程序上生成对话处理信息。有序性地将步骤S101存储的待测音频文件向智能音响进行播放,该智能音响上电开机并靠近于播放音源,以接收相应的待测音频文件,并根据其自身信息处理作出相应的反馈,具体在对应智能音响的应用程序上,例如小爱智能音响,则在小爱音响的APP上生成相应的对话处理信息。
所述步骤S102进一步包括:
向待测的所述智能音响逐一自动播放所述待测音频文件的语音信息。优选将待测音频文件根据相应的程序执行自动播放,可以是在上一条待测音频文件使得智能音响触发所述对话处理信息并被抓取后,依序继续播放下一条待测音频文件,待测音频文件在功放模块中进行播放,不再需要人工地对智能音响进行提问,可避免因人工产生的言语误差而导致评测的干扰。
所述智能音响接收并识别所述语音信息,以在对应的应用程序上生成并显示出所述语音信息的所述对话处理信息;其中,所述对话处理信息包括所述智能音响音频识别后的第一对话信息和所述智能音响反馈的第二对话信息。例如,第一对话信息可以是智能音响识别出来的:“今天会下雨吗?”,第二对话信息则相应地回答:“今天将会是晴天”等;通过对若干的所述对话处理信息的提取,后续进行信息整理以评测对应的智能音响的性能。
S103:自动抓取并存储所述应用程序上的所述对话处理信息的文本信息。
本实施例的所述步骤S103包括:自动截取所述应用程序显示的屏幕图像,识别并存储所述屏幕图像上的所述对话处理信息的所述文本信息。
优选的是,所述步骤S103进一步包括:
实时监测所述应用程序的页面信息;
根据所述页面信息的动态变化,以自动截取所述页面信息的所述屏幕图像;
识别出所述屏幕图像上的对话文本,将所述对话文本存储生成所述文本信息。
该应用程序是指智能音响搭载在智能终端上的应用程序,该应用程序设有显示对话信息的聊天页面,智能音响接收到的语音信息通过识别后会被呈现在该聊天页面上作为第一对话信息,智能音响反馈的信息也会被呈现在该聊天页面上作为第二对话信息;通过对该应用程序的页面信息进行动态监测,即可实时获取到该智能音响接收并识别的语音信息和反馈的信息,若待测文本是:“今天天气如何?”则该智能音响识别并呈现在该聊天页面的第一对话信息应该是相同的“今天天气如何?”;通过截取到该聊天页面的屏幕图像再进行识别,来获取到相应的对话文本,以生成用于评测的文本信息;而相应的识别技术可为现有的图像识别技术。
S104:根据全部的所述待测音频文件和对应的所述文本信息以生成评测结果报告。通过在生成该对话处理信息的应用程序对话记录页面上自动抓取其对话处理信息,根据其待测文本以及在智能音响上触发的对话处理信息的文本信息来生成评测结果报告,故该方法能够自动化实现对智能音响的评测,提高了智能音箱评测效率。
其他实施例中,步骤S102之前包括:标识每一所述待测音频文件的文件名;每一个待测音频文件都用一个独一无二的文件名作为标识。
步骤S104包括:根据所述文本信息和对应的所述文件名以生成一评测结果。将通过文字提取出来的所述对话处理信息的文本信息与其对应的所述文字名存储为一条评测结果,即一条待测音频文件的处理完成,进而继续播放下一条待测音频文件,直至获取全部的待测音频文件的评测结果。
更好的是,所述步骤S104进一步包括:汇总全部的所述文件名所对应的所述评测结果,以生成所述评测结果报告。将全部的评测结果存储获得的评测结果报告的文件,即为用于评测该智能音响的评测结果报告。
进一步的是,步骤S102之前包括:
根据待测的所述智能音响的呼叫机制向所述智能音响播放语音唤醒信息,以激活唤醒所述智能音响。
步骤S104进一步包括:
根据待测的所述智能音响的呼叫机制,将对应的所述语音唤醒信息合并入所述待测音频文件的前序。
所述方法的具体操作步骤如下:
1、准备要测试的内容,将其内容以文本形式进行保存以获得所述待测文本;若干条测试内容的文本可以集中存放在一个.txt格式的文本文档中。
2、通过运行程序的文本转音频单元10,将每条所述待测文本转换为单独的待测音频文件,文件的格式为.wav格式。
3、在用于实现该方法的计算机中准备python(Head First Python,计算机程序设计语言)环境,以安装python第三方模块的自动化框架。
4、将测试手机连接到运行程序的上述计算机上,并进行测试环境的准备(安装一个已有的第三方的辅助工具,是用于计算机与手机相互通信的中间件,通过编写代码向该模块发送指令,然后该工具在手机上进行操作);之后在手机上安装待评测音箱所对应的app,如小度音箱、小爱音箱等。
5、准备待评测的智能音箱,开机,并将智能音箱进行联网后放置在运行程序的计算机旁边,准备接收计算机的音频播放单元20发出的待测音频文件的语音信息。
6、打开手机终端上待评测音箱对应的app(步骤4下载的app),进入对话记录页面(用于生成所述对话处理信息的页面)。
7、执行测试程序,开始进行自动测试,该过程中,程序将使用音频播放单元20读取步骤2中的音频文件,文件名记录单元记录该音频文件的文件名,向待测的智能音箱发送音频信息,音箱得到信息后,在步骤5的手机上对应的步骤6中的app上会显示识别的音频内容(第一对话信息)和音箱所给出的处理结果信息(第二对话信息),该程序的对话结果抓取单元30会自动获取手机屏幕上的内容,然后结果生成单元40将对应的文件名、发送给音箱的音频识别后的结果以及音箱反馈的信息作为一条结果保存在文件,直到全部待测音频文件播放完毕,形成评测结果报告。
本发明还提供一种存储介质,用于存储如图1所述智能音响的评测方法的计算机程序。例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本申请的方法和/或技术方案。而调用本申请的方法的程序指令,可能被存储在固定的或可移动的存储介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输和/或被存储在根据程序指令运行的计算机设备的存储介质中。在此,根据本申请的一个实施例包括如图2~图3所示智能音响的评测系统的计算机设备,所述计算机设备优选包括用于存储计算机程序的存储介质和用于执行计算机程序的处理器,其中,当该计算机程序被该处理器执行时,触发该计算机设备执行基于前述多个实施例中的方法和/或技术方案。
需要注意的是,本申请可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本申请的软件程序可以通过处理器执行以实现上文步骤或功能。同样地,本申请的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本申请的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
根据本发明的方法可以作为计算机实现方法在计算机上实现、或者在专用硬件中实现、或以两者的组合的方式实现。用于根据本发明的方法的可执行代码或其部分可以存储在计算机程序产品上。计算机程序产品的示例包括存储器设备、光学存储设备、集成电路、服务器、在线软件等。优选地,计算机程序产品包括存储在计算机可读介质上以便当所述程序产品在计算机上执行时执行根据本发明的方法的非临时程序代码部件。
在优选实施例中,计算机程序包括适合于当计算机程序在计算机上运行时执行根据本发明的方法的所有步骤的计算机程序代码部件。优选地,在计算机可读介质上体现计算机程序。
综上所述,本发明所述智能音响的评测方法及其系统使用了自动化技术和计算机程序设计语言实现程序控制,通过使用计算机程序设计语言脚本对终端设备进行自动化操作。实现了程序控制向播放音频,将人工记录音箱识别的问题和结果实现为自动抓取音箱app上所显示的结果,从而为后续人工整理结果数据实现为自动化结果整理。
当然,本发明还可有其它多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。
Claims (20)
1.一种智能音响的评测方法,其特征在于,包括步骤:
根据音频转化技术以将待测文本转化为对应的待测音频文件;
向待测的智能音响依序播放所述待测音频文件,以在所述智能音响对应的应用程序上生成对话处理信息;
自动抓取并存储所述应用程序上的所述对话处理信息的文本信息;
根据全部的所述待测音频文件和对应的所述文本信息以生成评测结果报告。
2.根据权利要求1所述的智能音响的评测方法,其特征在于,所述向待测的智能音响依序播放所述待测音频文件,以在所述智能音响对应的应用程序上生成对话处理信息的步骤进一步包括:
向待测的所述智能音响逐一自动播放所述待测音频文件的语音信息;
所述智能音响接收并识别所述语音信息,以在对应的所述应用程序上生成并显示出所述语音信息的所述对话处理信息;其中,所述对话处理信息包括所述智能音响音频识别后的第一对话信息和所述智能音响反馈的第二对话信息。
3.根据权利要求2所述的智能音响的评测方法,其特征在于,所述向待测的智能音响依序播放所述待测音频文件,以在所述智能音响对应的应用程序上生成对话处理信息的步骤之前包括:
标识每一所述待测音频文件的文件名;
所述根据全部的所述待测音频文件和对应的所述文本信息以生成评测结果报告的步骤包括:
根据所述文本信息和对应的所述文件名以生成一评测结果。
4.根据权利要求3所述的智能音响的评测方法,其特征在于,所述根据全部的所述待测音频文件和对应的所述文本信息以生成评测结果报告的步骤进一步包括:
汇总全部的所述文件名所对应的所述评测结果,以生成所述评测结果报告。
5.根据权利要求3所述的智能音响的评测方法,其特征在于,所述根据音频转化技术以将待测文本转化为对应的待测音频文件的步骤之前包括:
录入文本格式的至少一条待测信息并对应存储为至少一所述待测文本。
6.根据权利要求1所述的智能音响的评测方法,其特征在于,所述自动抓取并存储所述应用程序上的所述对话处理信息的文本信息的步骤包括:
自动截取所述应用程序显示的屏幕图像,识别并存储所述屏幕图像上的所述对话处理信息的所述文本信息。
7.根据权利要求6所述的智能音响的评测方法,其特征在于,所述自动抓取并存储所述应用程序上的所述对话处理信息的文本信息的步骤进一步包括:
实时监测所述应用程序的页面信息;
根据所述页面信息的动态变化,以自动截取所述页面信息的所述屏幕图像;
识别出所述屏幕图像上的对话文本,将所述对话文本存储生成所述文本信息。
8.根据权利要求1所述的智能音响的评测方法,其特征在于,所述向待测的智能音响依序播放所述待测音频文件,以在所述智能音响对应的应用程序上生成对话处理信息的步骤之前包括:
根据待测的所述智能音响的呼叫机制向所述智能音响播放语音唤醒信息,以激活唤醒所述智能音响。
9.根据权利要求8所述的智能音响的评测方法,其特征在于,所述根据音频转化技术以将待测文本转化为对应的待测音频文件的步骤进一步包括:
根据待测的所述智能音响的呼叫机制,将对应的所述语音唤醒信息合并入所述待测音频文件的前序。
10.一种智能音响的评测系统,其特征在于,包括有:
文本转音频单元,用于根据音频转化技术以将待测文本转化为对应的待测音频文件;
音频播放单元,用于向待测的智能音响依序播放所述待测音频文件,以在所述智能音响对应的应用程序上生成对话处理信息;
对话结果抓取单元,用于自动抓取并存储所述应用程序上的所述对话处理信息的文本信息;
结果生成单元,用于根据全部的所述待测音频文件和对应的所述文本信息以生成评测结果报告。
11.根据权利要求10所述的智能音响的评测系统,其特征在于,所述音频播放单元具体用于向待测的所述智能音响逐一自动播放所述待测音频文件的语音信息;
所述智能音响接收并识别所述语音信息,以在对应的所述应用程序上生成并显示出所述语音信息的所述对话处理信息;其中,所述对话处理信息包括所述智能音响音频识别后的第一对话信息和所述智能音响反馈的第二对话信息。
12.根据权利要求11所述的智能音响的评测系统,其特征在于,还包括有文件名标识单元;
所述文件名标识单元用于标识每一所述待测音频文件的文件名;
所述结果生成单元具体用于根据所述文本信息和对应的所述文件名以生成一评测结果。
13.根据权利要求12所述的智能音响的评测系统,其特征在于,所述结果生成单元具体还用于汇总全部的所述文件名所对应的所述评测结果,以生成所述评测结果报告。
14.根据权利要求12所述的智能音响的评测系统,其特征在于,还包括有文本录入单元,所述文本录入单元用于录入文本格式的至少一条待测信息并对应存储为至少一所述待测文本。
15.根据权利要求10所述的智能音响的评测系统,其特征在于,所述对话结果抓取单元用于自动截取所述应用程序显示的屏幕图像,识别并存储所述屏幕图像上的所述对话处理信息的所述文本信息。
16.根据权利要求15所述的智能音响的评测系统,其特征在于,所述对话结果抓取单元包括有:
监测子单元,用于实时监测所述应用程序的页面信息;
截取子单元,用于根据所述页面信息的动态变化,以自动截取所述页面信息的所述屏幕图像;
识别子单元,用于识别出所述屏幕图像上的对话文本,将所述对话文本存储生成所述文本信息。
17.根据权利要求10所述的智能音响的评测系统,其特征在于,所述音频播放单元还用于根据待测的所述智能音响的呼叫机制向所述智能音响播放语音唤醒信息,以激活唤醒所述智能音响。
18.根据权利要求17所述的智能音响的评测系统,其特征在于,所述文本转音频单元还用于根据待测的所述智能音响的呼叫机制,将对应的所述语音唤醒信息合并入所述待测音频文件的前序。
19.一种存储介质,其特征在于,用于存储一种用于执行权利要求1~9中任意一种智能音响的评测方法的计算机程序。
20.一种计算机设备,包括存储介质、处理器以及存储在所述存储介质上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1~9任一项所述的智能音响的评测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010136427.XA CN113362806A (zh) | 2020-03-02 | 2020-03-02 | 智能音响的评测方法、系统、存储介质及其计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010136427.XA CN113362806A (zh) | 2020-03-02 | 2020-03-02 | 智能音响的评测方法、系统、存储介质及其计算机设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113362806A true CN113362806A (zh) | 2021-09-07 |
Family
ID=77523284
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010136427.XA Pending CN113362806A (zh) | 2020-03-02 | 2020-03-02 | 智能音响的评测方法、系统、存储介质及其计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113362806A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114125684A (zh) * | 2021-12-02 | 2022-03-01 | 云知声智能科技股份有限公司 | 智能音箱测试方法、装置、电子设备和存储介质 |
CN114120969A (zh) * | 2022-01-29 | 2022-03-01 | 中国电子技术标准化研究院 | 智能终端的语音识别功能测试方法、系统、电子设备 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108322791A (zh) * | 2018-02-09 | 2018-07-24 | 咪咕数字传媒有限公司 | 一种语音评测方法及装置 |
CN108564966A (zh) * | 2018-02-02 | 2018-09-21 | 安克创新科技股份有限公司 | 语音测试的方法及其设备、具有存储功能的装置 |
CN108597494A (zh) * | 2018-03-07 | 2018-09-28 | 珠海格力电器股份有限公司 | 语音测试方法及装置 |
CN108806666A (zh) * | 2018-05-28 | 2018-11-13 | 成都昊铭科技有限公司 | 无需接口的语音识别测试装置、系统及方法 |
CN109243425A (zh) * | 2018-08-13 | 2019-01-18 | 百度在线网络技术(北京)有限公司 | 语音识别测试方法、装置、系统、计算机设备及存储介质 |
CN109979427A (zh) * | 2017-12-28 | 2019-07-05 | 东莞迪芬尼电声科技有限公司 | 检测音响的系统和方法 |
CN110085210A (zh) * | 2019-03-15 | 2019-08-02 | 平安科技(深圳)有限公司 | 交互信息测试方法、装置、计算机设备及存储介质 |
CN110211567A (zh) * | 2019-05-13 | 2019-09-06 | 中国信息通信研究院 | 语音识别终端测评系统及方法 |
US20190371322A1 (en) * | 2018-05-31 | 2019-12-05 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method, apparatus and system for testing intelligent voice device |
CN110689903A (zh) * | 2019-09-24 | 2020-01-14 | 百度在线网络技术(北京)有限公司 | 智能音箱的评测方法、装置、设备和介质 |
-
2020
- 2020-03-02 CN CN202010136427.XA patent/CN113362806A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109979427A (zh) * | 2017-12-28 | 2019-07-05 | 东莞迪芬尼电声科技有限公司 | 检测音响的系统和方法 |
CN108564966A (zh) * | 2018-02-02 | 2018-09-21 | 安克创新科技股份有限公司 | 语音测试的方法及其设备、具有存储功能的装置 |
CN108322791A (zh) * | 2018-02-09 | 2018-07-24 | 咪咕数字传媒有限公司 | 一种语音评测方法及装置 |
CN108597494A (zh) * | 2018-03-07 | 2018-09-28 | 珠海格力电器股份有限公司 | 语音测试方法及装置 |
CN108806666A (zh) * | 2018-05-28 | 2018-11-13 | 成都昊铭科技有限公司 | 无需接口的语音识别测试装置、系统及方法 |
US20190371322A1 (en) * | 2018-05-31 | 2019-12-05 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method, apparatus and system for testing intelligent voice device |
CN109243425A (zh) * | 2018-08-13 | 2019-01-18 | 百度在线网络技术(北京)有限公司 | 语音识别测试方法、装置、系统、计算机设备及存储介质 |
CN110085210A (zh) * | 2019-03-15 | 2019-08-02 | 平安科技(深圳)有限公司 | 交互信息测试方法、装置、计算机设备及存储介质 |
CN110211567A (zh) * | 2019-05-13 | 2019-09-06 | 中国信息通信研究院 | 语音识别终端测评系统及方法 |
CN110689903A (zh) * | 2019-09-24 | 2020-01-14 | 百度在线网络技术(北京)有限公司 | 智能音箱的评测方法、装置、设备和介质 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114125684A (zh) * | 2021-12-02 | 2022-03-01 | 云知声智能科技股份有限公司 | 智能音箱测试方法、装置、电子设备和存储介质 |
CN114125684B (zh) * | 2021-12-02 | 2024-02-27 | 云知声智能科技股份有限公司 | 智能音箱测试方法、装置、电子设备和存储介质 |
CN114120969A (zh) * | 2022-01-29 | 2022-03-01 | 中国电子技术标准化研究院 | 智能终端的语音识别功能测试方法、系统、电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109309751B (zh) | 语音记录方法、电子设备及存储介质 | |
CN110517689B (zh) | 一种语音数据处理方法、装置及存储介质 | |
CN111933108B (zh) | 一种智能网联终端智能语音交互系统自动化测试方法 | |
CN107147618A (zh) | 一种用户注册方法、装置及电子设备 | |
CN113163272B (zh) | 视频剪辑方法、计算机设备及存储介质 | |
CN110381221B (zh) | 呼叫处理方法、装置、系统、设备和计算机存储介质 | |
CN110032355B (zh) | 语音播放方法、装置、终端设备及计算机存储介质 | |
CN109326305B (zh) | 一种批量测试语音识别和文本合成的方法和测试系统 | |
CN110992955A (zh) | 一种智能设备的语音操作方法、装置、设备及存储介质 | |
CN108694947A (zh) | 语音控制方法、装置、存储介质及电子设备 | |
CN113362806A (zh) | 智能音响的评测方法、系统、存储介质及其计算机设备 | |
CN111540370A (zh) | 音频处理方法、装置、计算机设备及计算机可读存储介质 | |
CN113345439B (zh) | 字幕生成方法、装置、电子设备和存储介质 | |
CN111563182A (zh) | 语音会议记录存储处理方法、装置 | |
CN109065019B (zh) | 一种面向智能机器人的故事数据处理方法及系统 | |
CN113783771A (zh) | 一种基于微信的ai虚拟人交互方法和系统 | |
CN110706704A (zh) | 用于生成语音交互原型的方法、装置和计算机设备 | |
CN114999457A (zh) | 语音系统的测试方法、装置、存储介质及电子设备 | |
CN111161710A (zh) | 同声传译方法、装置、电子设备及存储介质 | |
CN113630309B (zh) | 机器人会话系统、方法、装置、计算机设备和存储介质 | |
CN111970295B (zh) | 基于多终端的通话事务管理方法及装置 | |
EP4276827A1 (en) | Speech similarity determination method, device and program product | |
CN112565913B (zh) | 视频通话方法、装置和电子设备 | |
CN111523343B (zh) | 阅读互动方法、装置、设备、服务器及存储介质 | |
CN113689855A (zh) | 一种会议记录生成系统、方法、装置、存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210907 |
|
RJ01 | Rejection of invention patent application after publication |