CN114120969A

CN114120969A - 智能终端的语音识别功能测试方法、系统、电子设备

Info

Publication number: CN114120969A
Application number: CN202210110090.4A
Authority: CN
Inventors: 邢广鑫; 孙齐锋; 董桂官; 朱正元; 谭晓悦; 刘鑫楠; 阮向远; 周阳翔
Original assignee: China Electronics Standardization Institute
Current assignee: China Electronics Standardization Institute
Priority date: 2022-01-29
Filing date: 2022-01-29
Publication date: 2022-03-01

Abstract

本发明提供一种智能终端的语音识别功能测试方法、系统、电子设备，所述方法包括：形成包含多条测试信息的测试指令库；对于每条测试信息，将测试信息以语音形式向待测试的智能终端播放；收集智能终端的反馈信息；将反馈信息文本化后形成的第一文本与测试信息所对应的第二文本进行比较，判断智能终端的语音识别功能是否正常。通过黑盒测试理念将智能设备比作黑盒子，从而不需要参与智能设备的内部，更加便捷，能够适配多种智能电视、智能音箱等智能电器，操作简便。

Description

智能终端的语音识别功能测试方法、系统、电子设备

技术领域

本发明涉及智能设备测试技术领域，尤其涉及一种智能终端的语音识别功能测试方法、系统、电子设备。

背景技术

智能电视，是基于Internet应用技术，具备开放式操作系统与芯片，拥有开放式应用平台，可实现双向人机交互功能，集影音、娱乐、数据等多种功能于一体，以满足用户多样化和个性化需求的电视产品。智能音箱是一个音箱升级的产物，它具备人机通过对话进行交互的能力，简便用户操作。其目的都是为了带给用户更便捷的体验，目前已经成为潮流趋势，因为智能电视和智能音箱的不断增加，针对第三方测试智能电视、音箱的需求也在不断增大，采用人工对于智能语音进行测试，繁琐需要消耗大量的人力，并且响应时间无法准确记录等。目前的智能电视、音箱的语音测试是硬件对接的方式，对于外部测试来说不够友好。

发明内容

本发明的目的是提供一种智能终端的语音识别功能测试方法、系统、电子设备，部分实施例能够用以解决现有技术中外部测试来说不够友好的缺陷，实现在不涉及内部的条件下能够对智能电视、音箱的语音反馈进行测试，更加方便灵活，减少人工的参与减少人员的负担，同时还要能够进行准确的结果记录。

本发明提供的一种智能终端的语音识别功能测试方法，所述方法包括：

形成包含多条测试信息的测试指令库；

对于每条测试信息，将测试信息以语音形式向待测试的智能终端播放；

收集智能终端的反馈信息；

将反馈信息文本化后形成的第一文本与测试信息所对应的第二文本进行比较，以判断智能终端的语音识别功能是否正常。

根据本发明提供的一种智能终端的语音识别功能测试方法，所述智能终端为智能电视。

根据本发明提供的一种智能终端的语音识别功能测试方法，所述收集智能终端的反馈信息，包括：

采集智能电视的视频图像；

在视频图像上设置识别区域，将识别区域内的视频图像作为反馈信息。

根据本发明提供的一种智能终端的语音识别功能测试方法，所述将反馈信息文本化后形成的第一文本与测试信息的第二文本进行比较，包括：

对视频图像的图像帧进行光学字符识别，获取对应的识别文本；

比较识别文本和第二文本，形成相似度值，将识别文本作为第一文本；

若在后的图像帧的相似度值超过在先的图像帧的相似度值，将在后的图像帧获取的识别文本替换在先的图像帧的识别文本，作为第一文本；

若在后的、连续的、达到预定数量的图像帧的相似度值，不超过在先的图像帧的相似度值，停止对视频图像的图像帧进行光学字符识别，将在先的图像帧的识别文本作为第一文本。

根据本发明提供的一种智能终端的语音识别功能测试方法，所述对视频图像的图像帧进行光学字符识别，还包括：

对图像帧中的背景进行滤除；

对滤除后的图像帧进行光学字符识别。

根据本发明提供的一种智能终端的语音识别功能测试方法，所述智能终端为智能音箱。

采集智能音箱的反馈声音形成音频文件。

根据本发明提供的一种智能终端的语音识别功能测试方法，所述采集智能音箱的反馈声音形成音频文件包括：

将采集到的反馈声音进行录制；

循环判断反馈声音的分贝大小，若分贝大小一直超过预定阈值且录制时间未超过第一预定时间，则持续录制；若录制时间超过第一预定时间或者第二预定时间内的分贝大小持续小于预定阈值，则跳出循环，结束录制形成音频文件。

根据本发明提供的一种智能终端的语音识别功能测试方法，所述将测试信息以语音形式向待测试的智能终端播放，包括：

判断测试信息为文本还是音频，若为文本，则将文本转化为音频后向待测试的智能终端播放；若为音频，则直接向待测试的智能终端播放。

根据本发明提供的一种智能终端的语音识别功能测试方法，所述语音形式包括：男声、女声、普通话、方言。

根据本发明提供的一种智能终端的语音识别功能测试方法，所述将反馈信息文本化后形成的第一文本与测试信息所对应的第二文本进行比较，以判断智能终端的语音识别功能是否正常，之后还包括：

将第一文本、第二文本存入数据库中；

将数据库显示至核验操作界面。

本发明还提供的一种智能终端的语音识别功能测试系统，所述系统包括：

播放模块，所述播放模块将测试信息以语音形式向待测试的智能终端播放；

收集模块，所述手机模块收集智能终端的反馈信息；

判断模块，所述判断模块将反馈信息文本化后形成的第一文本与测试信息所对应的第二文本进行比较，以判断智能终端的语音识别功能是否正常。

根据本发明提供的一种智能终端的语音识别功能测试系统，所述收集模块包括：

视频收集单元，所述视频收集单元通过对准智能电视的摄像机采集智能电视的视频图像，在视频图像上设置识别区域，将识别区域内的视频图像作为反馈信息。

音频收集单元，所述音频收集单元通过朝向智能音箱的麦克风将采集到的反馈声音进行录制，循环判断反馈声音的分贝大小，若分贝大小一直超过预定阈值且录制时间未超过第一预定时间，则持续录制；若录制时间超过第一预定时间或者第二预定时间内的分贝大小持续小于预定阈值，则跳出循环，结束录制形成音频文件。

本发明还提供的一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一项所述智能终端的语音识别功能测试方法的步骤。

本发明还提供的一种非暂态计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如上述任一项所述智能终端的语音识别功能测试方法的步骤。

本发明还提供的一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上述任一项所述智能终端的语音识别功能测试方法的步骤。

本发明提供的智能终端的语音识别功能测试方法、系统、电子设备，通过黑盒测试理念将智能设备比作黑盒子，从而不需要参与智能设备的内部，更加便捷，能够适配多种智能电视、智能音箱等智能电器，操作简便。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明提供的智能终端的语音识别功能测试方法的流程示意图；

图2为本发明提供的自动化进行智能电视语音测试的流程图；

图3为本发明提供的智能电视测试部分的结构示意图；

图4为本发明提供的自动化进行智能音箱语音测试的流程图；

图5为本发明提供的智能音箱测试部分的结构示意图；

图6为本发明提供的智能终端的语音识别功能测试系统的结构示意图；

图7为本发明提供的电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

下面结合附图，通过具体的实施例及其应用场景对本申请实施例提供的智能终端的语音识别功能测试方法进行详细地说明。

图1为本发明提供的智能终端的语音识别功能测试方法的流程示意图，如图1所示，本发明提供的一种智能终端的语音识别功能测试方法，方法包括：

步骤100、形成包含多条测试信息的测试指令库；

步骤200、对于每条测试信息，将测试信息以语音形式向待测试的智能终端播放；

可选地，测试信息中包含唤醒词，唤醒词的意思是让智能终端能够切换到语音识别状态。

步骤300、收集智能终端的反馈信息；

可选地，智能终端在收到测试信息的指令后，进行一系列的反馈，包括收到指令后通过执行预定的操作，形成反馈信息，反馈信息可能是图像形式的，也可能是声音形式的；

步骤400、将反馈信息文本化后形成的第一文本与测试信息所对应的第二文本进行比较，以判断智能终端的语音识别功能是否正常；

可选地，反馈信息通过文字光学识别或者语音处理形成第一文本，而第二文本，即智能设备在接收测试信息后应该有的正常反馈所能形成的文本信息，对应于唤醒词，第二文本可以是响应词，通过将实际接收的反馈信息和正常反馈形成的文本信息进行比对，判定智能终端的语音识别功能是否正常；

可选地，方法的判断集成设置在前端计算机中；

可选地，测试信息仅为一个测试集合中的一条信息，需要循环执行测试集合中的所有测试信息，获取对应的比较结果，并存储于数据库中。

本实施例通过黑盒测试理念将智能设备比作黑盒子，从而不需要参与智能设备的内部，更加便捷，能够适配多种智能电视、智能音箱等智能电器，操作简便。

进一步地，另一实施例中，本实施例提供一种智能终端的语音识别功能测试方法，智能终端为智能电视，收集智能终端的反馈信息，包括：

采集智能电视的视频图像；

可选地，采用摄像头对准智能电视的屏幕区域采集视频图像形成视频流；

在视频图像上设置识别区域，将识别区域内的视频图像作为反馈信息；

可选地，调用外置摄像头设置识别区域，通过框选，选择摄像机文字识别区域。

本实施例公布了智能设备为智能电视时采集电视图像作为反馈信息，并通过识别区域的设置，减少后续的数据处理量。

进一步地，另一实施例中，本实施例提供一种智能终端的语音识别功能测试方法，将反馈信息文本化后形成的第一文本与测试信息的第二文本进行比较，包括：

可选地，按照帧数，顺序地对视频的图像帧进行OCR识别；

可选地，图像帧是组成视频的最小单位；

可选地，OCR （Optical Character Recognition，光学字符识别）是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程；

可选地，每个图像帧都与第二文本按照同一算法形成相似度值；

若在后的、连续的、达到预定数量的图像帧的相似度值，不超过在先的图像帧的相似度值，停止对视频图像的图像帧进行光学字符识别，将在先的图像帧的识别文本作为第一文本；

可选地，目的是取出电视图像中与第二文本相似度最高的反馈结果。

本实施例公布了与对视频进行图像识别，并抽取相似度最高的图像帧的识别结果作为反馈信息所对应的第一文本。

进一步地，另一实施例中，本实施例提供一种智能终端的语音识别功能测试方法，对视频图像的图像帧进行光学字符识别，还包括：

对图像帧中的背景进行滤除；

可选地，通过去除电视图像背景，减少在OCR识别前的干扰因素；

对滤除后的图像帧进行光学字符识别。

本实施例通过自动对结果文字的筛选过滤，能够最大限度的过滤掉电视的干扰文字，更加准确保证结果的准确性，最大的程度的减小干扰，保证结果的唯一性准确性。

进一步地，另一实施例中，本实施例提供一种智能终端的语音识别功能测试方法，智能终端为智能音箱，收集智能终端的反馈信息，包括：采集智能音箱的反馈声音形成音频文件，优选地，采集智能音箱的反馈声音形成音频文件包括：

将采集到的反馈声音进行录制；

循环判断反馈声音的分贝大小，若分贝大小一直超过预定阈值且录制时间未超过第一预定时间，则持续录制；若录制时间超过第一预定时间或者第二预定时间内的分贝大小持续小于预定阈值，则跳出循环，结束录制形成音频文件；

可选地，预定阈值为30分贝，第一预定时间为10s，第二预定时间为3s。

本实施例公布了具体的采集智能音箱反馈的采集条件，减少噪音的干扰，提高整体系统的处理效率。

进一步地，另一实施例中，本实施例提供一种智能终端的语音识别功能测试方法，将测试信息以语音形式向待测试的智能终端播放，包括：

判断测试信息为文本还是音频，若为文本，则将文本转化为音频后向待测试的智能终端播放；若为音频，则直接向待测试的智能终端播放；

可选地，测试信息为文本时，采用讯飞在线转换为语音；

可选地，判断测试信息为文本还是音频的单元集成在前端计算机中。

本实施例通过语音转换实现对两种不同类型的测试信息兼容处理。

进一步地，另一实施例中，本实施例提供一种智能终端的语音识别功能测试方法，将测试信息以语音形式向待测试的智能终端播放，包括：以男声或者女声，同时以普通话或者方言的形式将测试信息形成的语音向待测试的智能终端播放。

由于实际应用中，不同场景下，智能设备需要能接收不同的发声个人的声音并将之识别，因此需要设置丰富的测试条件，保证智能设备的识别能力；

可选地，前端计算机中能进一步设置测试语音指令，包括，测试循环次数、摄像机延迟校准、发声音、测试名称、声音大小等条件。

本实施例通过模拟不同的发声场景来实现对智能设备的多角度的测试，灵活的方案配置，可以支持男声、女声、方言等的发言，更加进一步丰富测试案例，可以更加灵活的配置测试文本，实现更加多的案例测试。

进一步地，另一实施例中，本实施例提供一种智能终端的语音识别功能测试方法，将反馈信息文本化后形成的第一文本与测试信息所对应的第二文本进行比较，以判断智能终端的语音识别功能是否正常，之后还包括：

将第一文本、第二文本存入数据库中；

可选地，抽取最接近的图像帧保存入数据库中；

可选地，所述数据库采用EXCEL对应的数据库，EXCEL具体为Microsoft Excel，是Microsoft为使用Windows和Apple Macintosh操作系统的电脑编写的一款电子表格软件。

将数据库显示至核验操作界面；

可选地，能够在核验操作界面完成对数据库的修改和确认；

可选地，在核验操作界面可以对执行结果进行查看，通过对比图像跟识别结果比较自动测试流程是否准确，对不准确的进行标记，操作完成后点击保存，自动更新结果文档识别是否准确。

本实施例通过核验的功能新增，能够更加准确的核对测试的准确性，对测试结果进行更加准确的修改，进一步自动化测试系统，操作管理方便，自动化测试流程以及结果保存，不需要专人进行测试结果保存操作，减少操作人员负担。

进一步地，另一实施例中，图2为本发明提供的自动化进行智能电视语音测试的流程图，如图2所示，智能电视测试的使用方法，包括以下步骤：

在指令集管理界面，导入或是写入测试文本或是导入音频文件；

在脚本集管理界面对测试指令、发声人、声音大小、测试类型、响应词等条件进行设置；

再在电视测试界面将文字转化为音频播放；

通过外置摄像头对电视机的反馈进行采集；

对采集到的视频采用OCR法进行文字识别；

将判断的相似度最高的结果进行保存，若是下一帧的文字相似度大于前一帧则继续循环，假设文本相似度小于前十帧的相似度，则跳出循环，认定该条测试结果为电视机反馈结果，再由结果处理模块进行保存展示等操作；

人工可以根据保存的结果，与保存的图片进行对比来判断识别结果是否准确，同时进行界面标记对测试不正确的结果进行标记。

图3为本发明提供的智能电视测试部分的结构示意图，如图3所示，对应测试方法测试系统包括：语音转化模块、视频采集模块、文字识别模块、图像保存模块、数据处理模块。

视频流信息来自外置摄像头采集的智能电视视频，通过视频采集模块将视频拆分成每帧图片，再通过文字识别对图片框内的文字进行识别检测，循环对比测试文本找出相似度最高的文本，将十条对比结果放到列表内，相似度大的自动替换列表内的值，当十条相似度都小于前面那条，识别结束，通过结果处理模块将结果保存，继续判断，进行下一次识别，重复上面步骤。循环测试结束后在结果处理模块可以选择人工核验，对结果准确性进行标记，同时更新保存结果。

本实施例公布了一种具体的智能电视的测试系统的使用方法和对应的测试系统。

进一步地，另一实施例中，图4为本发明提供的自动化进行智能音箱语音测试的流程图，如图4所示，智能音箱测试的使用方法，包括以下步骤：

对测试指令等条件进行设置；

将文字转化为音频播放；

通过麦克风对音箱的反馈声音进行采集；

将采集到的音频进行录制，循环判断声音分贝大小，假设分贝一直超过30分贝且时间没录制超过10秒则一直录制，超过十秒或者3秒内的音频都小于30分贝则跳出循环结束录制；

将录制的音频通过语音转换模块转换成文本文字；

将返回的结果通过结果处理模块进行保存并展示。

图5为本发明提供的智能音箱测试部分的结构示意图，如图5所示，对应测试方法测试系统包括：语音转化模块，音频采集、音频处理模块，数据处理模块，界面展示模块。

音箱测试通过语音转化模块将测试文本转换成音频，通过电脑扬声器或是外置音箱播放出来，再通过电脑麦克风录制识别，将智能音箱反馈的声音采集为音频文件，再通过语音转化模块转化成文本，再通过结果处理模块对测试结果记录，展示在前端界面。

本实施例公布了一种具体的智能音箱的测试系统的使用方法，需要说明的是，本申请公布的技术方案中用来测试智能音箱的设置同样适用于用来测试智能电视在声音方面的反馈，即，将智能电视视作智能音箱，来完成对其语音反馈方面功能的测试。

下面对本发明提供的智能终端的语音识别功能测试系统进行描述，下文描述的智能终端的语音识别功能测试系统与上文描述的智能终端的语音识别功能测试方法可相互对应参照。

图6为本发明提供的智能终端的语音识别功能测试系统的结构示意图，如图6所示，本发明还提供的一种智能终端的语音识别功能测试系统，系统包括：

编辑模块，编辑模块形成包含多条测试信息的测试指令库；

播放模块，播放模块对于每条测试信息，将测试信息以语音形式向待测试的智能终端播放；

收集模块，手机模块收集智能终端的反馈信息；

判断模块，判断模块将反馈信息文本化后形成的第一文本与测试信息所对应的第二文本进行比较，以判断智能终端的语音识别功能是否正常。

进一步地，另一实施例中，本实施例提供一种智能终端的语音识别功能测试系统，收集模块包括：

视频收集单元，视频收集单元通过对准智能电视的摄像机采集智能电视的视频图像，在视频图像上设置识别区域，将识别区域内的视频图像作为反馈信息。

本实施例通过摄像机来收集电视的视频图像，不需要在智能电视和测试系统之间通过硬件接口连接，从而达到黑盒测试的目的。

音频收集单元，音频收集单元通过朝向智能音箱的麦克风将采集到的反馈声音进行录制，循环判断反馈声音的分贝大小，若分贝大小一直超过预定阈值且录制时间未超过第一预定时间，则持续录制；若录制时间超过第一预定时间或者第二预定时间内的分贝大小持续小于预定阈值，则跳出循环，结束录制形成音频文件。

本实施例通过麦克风来收集音箱的反馈声音，不需要在智能音箱和测试系统之间通过硬件接口连接，从而达到黑盒测试的目的。

另一实施例中，本实施例提供一种智能电视的语音识别功能测试系统，系统包括：前后端交互界面、语音转化模块、图像采集模块、图像识别模块、图像保存模块、数据处理模块、数据库管理模块、EXCEL处理模块；前后端交互界面能够调整编辑语音测试指令和供用户进行处理结果的校验，语音转化模块能够将输入系统的文本转化为音频从而对智能电视播放，图像采集模块通过外置摄像头采集智能电视的视频图像，图像识别模块调用OCR算法对视频图像进行文字识别，图像保存模块将匹配到的文本图片保存到文件夹中，数据处理模块将处理结果保存到数据库内，EXCEL处理模块将结果保存到相应的EXCEL文件中。

本实施例能够提升智能电视的自动化测试程度，具备灵活配置、智能识别、检验文字的功能，能够快速识别判断响应，同时支持对智能电视的测试结果进行人工检验，快速调整测试结果。

图7为本发明提供的一种电子设备的实体结构示意图，如图7所示，该电子设备可以包括：处理器（processor）810、通信接口（Communications Interface）820、存储器（memory）830和通信总线840，其中，处理器810，通信接口820，存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储器830中的逻辑指令，以执行智能终端的语音识别功能测试方法，该方法包括：

形成包含多条测试信息的测试指令库；

收集智能终端的反馈信息；

将反馈信息文本化后形成的第一文本与测试信息所对应的第二文本进行比较，判断智能终端的语音识别功能是否正常。

此外，上述的存储器830中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器（ROM，Read-Only Memory）、随机存取存储器（RAM，Random Access Memory）、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面，本发明还提供一种计算机程序产品，所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，计算机能够执行上述各方法所提供的智能终端的语音识别功能测试方法，该方法包括：

形成包含多条测试信息的测试指令库；

收集智能终端的反馈信息；

又一方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各提供的智能终端的语音识别功能测试方法，该方法包括：

形成包含多条测试信息的测试指令库；

收集智能终端的反馈信息；

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种智能终端的语音识别功能测试方法，其特征在于，所述方法包括：

形成包含多条测试信息的测试指令库；

收集智能终端的反馈信息；

2.根据权利要求1所述的智能终端的语音识别功能测试方法，其特征在于，所述智能终端为智能电视，所述收集智能终端的反馈信息，包括：

采集智能电视的视频图像；

3.根据权利要求2所述的智能终端的语音识别功能测试方法，其特征在于，所述将反馈信息文本化后形成的第一文本与测试信息的第二文本进行比较，包括：

4.根据权利要求3所述的智能终端的语音识别功能测试方法，其特征在于，所述对视频图像的图像帧进行光学字符识别，还包括：

滤除图像帧中的背景；

对滤除后的图像帧进行光学字符识别。

5.根据权利要求1所述的智能终端的语音识别功能测试方法，其特征在于，所述智能终端为智能音箱，所述收集智能终端的反馈信息，包括：

采集智能音箱的反馈声音形成音频文件，作为反馈信息。

6.根据权利要求5所述的智能终端的语音识别功能测试方法，其特征在于，所述采集智能音箱的反馈声音形成音频文件包括：

将采集到的反馈声音进行录制；

循环判断反馈声音的分贝大小，若分贝大小超过预定阈值且录制时间未超过第一预定时间，则持续录制；若录制时间超过第一预定时间或者第二预定时间内的分贝大小持续小于预定阈值，则跳出循环，结束录制形成音频文件。

7.根据权利要求1所述的智能终端的语音识别功能测试方法，其特征在于，所述将测试信息以语音形式向待测试的智能终端播放，包括：

8.根据权利要求1所述的智能终端的语音识别功能测试方法，其特征在于，所述将测试信息以语音形式向待测试的智能终端播放，包括：以男声或者女声，同时以普通话或者方言的形式将测试信息形成的语音向待测试的智能终端播放。

9.根据权利要求1所述的智能终端的语音识别功能测试方法，其特征在于，所述将反馈信息文本化后形成的第一文本与测试信息所对应的第二文本进行比较，以判断智能终端的语音识别功能是否正常，之后还包括：

将第一文本、第二文本存入数据库中；

将数据库显示至核验操作界面。

10.一种智能终端的语音识别功能测试系统，其特征在于，所述系统包括：

编辑模块，所述编辑模块形成包含多条测试信息的测试指令库；

播放模块，所述播放模块对于每条测试信息，将测试信息以语音形式向待测试的智能终端播放；

收集模块，所述收集模块收集智能终端的反馈信息；

判断模块，所述判断模块将反馈信息文本化后形成的第一文本与测试信息所对应的第二文本进行比较，判断智能终端的语音识别功能是否正常。

11.根据权利要求10所述的智能终端的语音识别功能测试系统，其特征在于，所述收集模块包括：

12.根据权利要求11所述的智能终端的语音识别功能测试系统，其特征在于，所述收集模块包括：

13.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1-9中任一项所述智能终端的语音识别功能测试方法的步骤。

14.一种非暂态计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-9中任一项所述智能终端的语音识别功能测试方法的步骤。