WO2018157840A1

WO2018157840A1 - 语音识别测试方法及测试终端、计算设备及存储介质

Info

Publication number: WO2018157840A1
Application number: PCT/CN2018/077784
Authority: WO
Inventors: 单永生; 张驰; 王亚军
Original assignee: 广东神马搜索科技有限公司
Priority date: 2017-03-01
Filing date: 2018-03-01
Publication date: 2018-09-07
Also published as: CN108538296A

Abstract

提供语音识别测试方法及测试终端，语音识别测试方法包括：测试终端将测试终端播放的待测试音频文件产生的语音数据通过音频传导线传输给客户终端（S101）；客户终端将接收到的语音数据进行编码，并将编码后的语音数据发送给语音识别服务器进行语音识别（S102）；语音识别服务器将语音数据进行识别，并将语音识别结果发送给客户终端（S103）；测试终端从客户终端中获取语音识别结果（S104）；测试终端将语音识别结果与预存的待测试音频文件对应的标准结果进行比对得到测试结果（S105）；由此可以自动化语音识别测试以提高语音识别测试的效率。

Description

语音识别测试方法及测试终端、计算设备及存储介质

技术领域

本发明涉及语音识别领域，具体而言，涉及一种语音识别测试方法及测试终端、计算设备及存储介质。

背景技术

随着信息技术的不断发展和进步，信息搜索方式已经不再拘泥于文字搜索等常规搜索方式，越来越多的软件产品提供了代替手工输入关键字搜索的语音搜索方式。提供语音搜索的软件产品，在销售或者上市之前都需要进行语音识别测试，以保证语音搜索的效率。现有的语音识别测试方式，大多需要人工录入语音来测试识别准确率。这种人工测试准确率的方式有比较大的弊端。例如，两次相同的语音内容的测试之间的测试用例(如，输入语音)不能保证完全相同，导致测试结果参考性不高。此外，影响语音识别准确率的因素有很多，比如：语速，语调等都可能对最终的识别结果带来影响。另外，人工测试的语音词条相对比较少，而且费时费力。

发明内容

有鉴于此，本发明实施例的目的在于提供一种语音识别测试方法及测试终端。

根据本发明的第一方面，提供了一种语音识别测试方法，应用于语音识别测试系统，该系统包括测试终端、客户终端以及语音识别服务器，所述测试终端通过音频传导线与所述客户终端电性连接，所述客户终端通过网络与所述语音识别服务器通信连接，该方法包括：

所述测试终端将测试终端播放的待测试音频文件产生的语音数据通过所述音频传导线传输给所述客户终端；

所述客户终端将接收到的所述语音数据进行编码，并将编码后的语音数据发送给所述语音识别服务器进行语音识别；

所述语音识别服务器将所述语音数据进行识别，并将语音识别结果发送给所述客户终端；

所述测试终端从所述客户终端中获取所述语音识别结果；以及

所述测试终端将所述语音识别结果与预存的所述待测试音频文件对应的标准结果进行比对得到测试结果。

根据本发明的第二方面，还提供了一种测试终端，所述测试终端通过音频传导线与客户终端电性连接，所述客户终端与一语音识别服务器通信连接，所述测试终端包括：

存储器；

处理器；

安装/存储于所述存储器并由所述处理器执行的语音识别测试装置；

所述语音识别测试装置包括：

语音数据传输模块，用于将测试终端播放的待测试音频文件产生的语音数据通过音频传导线传输给所述客户终端，使所述客户终端将所述语音数据进行编码并发送给所述语音识别服务器，所述语音识别服务器将语音识别结果发送给所述客户终端；

识别结果获取模块，用于从所述客户终端中获取所述语音识别结果；

测试结果生成模块，用于将所述语音识别结果与预存的所述待测试音频文件对应的标准结果进行比对得到测试结果。

根据本发明的第三方面，还提供了一种语音识别测试方法，该方法应用于测试终端，所述测试终端通过音频传导线与客户终端电性连接，所述客户终端与一语音识别服务器通信连接；所述方法包括：

将测试终端播放的待测试音频文件产生的语音数据通过音频传导线传输给所述客户终端；使所述客户终端将所述语音数据进行编码并发送给所述语音识别服务器，所述语音识别服务器将语音识别结果发送给所述客户终端；

从所述客户终端中获取所述语音识别结果；

将所述语音识别结果与预存的所述待测试音频文件对应的标准结果进行比对得到测试结果。

根据本发明的第四方面，还提供了一种计算设备，包括：处理器；以及存储器，其上存储有可执行代码，当所述可执行代码被所述处理器执行时，使所述处理器执行本发明如上第一方面和第三方面所述的方法。

根据本发明的第五方面，还提供了一种非暂时性机器可读存储介质，其上存储有可执行代码，当所述可执行代码被电子设备的处理器执行时，使所述处理器执行本发明如上第一方面和第三方面所述的方法。

与现有技术相比，本发明的语音识别测试方法及测试终端，通过直接用测试终端模拟用户输入语音通过音频传导线向客户终端传输语音数据，客户终端将接收到的语音数据发送给语音识别服务器，实现自动化的语音搜索的测试。另外，语音数据通过音频传导线传输给所述客户终端，最真实地模拟用户使用场景，同时可以避免噪声等外界因素的干扰导致的测试准确率不可靠的问题，也极大地提高了测试效率。

为使本发明的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为根据本发明一个实施例的语音识别测试系统的示意图。

图2为根据本发明一个实施例的测试终端的方框示意图。

图3为根据本发明一个实施例的语音识别测试装置的功能模块示意图。

图4为根据本发明一个实施例的语音识别测试方法的流程图。

图5为根据本发明另一个实施例的语音识别测试方法的流程图。

具体实施方式

下面将结合本发明实施例中附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施例。基于本发明的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。同时，在本发明的描述中，术语“第一”、“第二”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

图1为根据本发明一个实施例的语音识别测试系统的示意图。

如图1所示，本发明的语音识别测试系统可以包括：测试终端100、客户终端200及语音识别服务器300。所述测试终端100及客户终端200可以是个人电脑(personal computer，PC)、平板电脑、智能手机、个人数字助理(personal digital assistant，PDA)等。在一个优选实施例中，所述测试终端100可以是一个用于测试客户终端200的语音识别功能的PC机，所述客户终端200为安装有语音识别软件(如搜索软件、浏览器、即时通信软件等)的手机、平板电脑等移动终端。所述语音识别服务器300通过网络与一个或多个客户终端200进行通信连接，以进行数据通信或交互。所述语音识别服务器300可以包括但不限于是网络语音识别服务器、数据库语音识别服务器等。

图2为根据本发明一个实施例的测试终端的方框示意图。

如图2所示，本发明的测试终端100可以包括语音识别测试装置110、存储器111、存储控制器112、处理器113、外设接口114、输入输出单元115、音频单元116及显示单元117。

所述存储器111、存储控制器112、处理器113、外设接口114、输入输出单元115、音频单元116及显示单元117等各元件相互之间直接或间接地电性连接，以实现数据的传输或交互。例如，这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述语音识别测试装置110包括至少一个可以软件或固件(firmware)的形式存储于所述存储器111中或固化在所述测试终端的操作系统(operating system，OS)中的软件功能模块。所述处理器113用于执行存储器中存储的可执行模块，例如所述语音识别测试装置110包括的软件功能模块或计算机程序。

其中，所述存储器111可以是，但不限于，随机存取存储器(Random Access Memory，RAM)，只读存储器(Read Only Memory，ROM)，可编程只读存储器(Programmable Read-Only Memory，PROM)，可擦除只读存储器(Erasable Programmable Read-Only Memory，EPROM)，电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory，EEPROM)等。其中，存储器111用于存储程序，所述处理器113在接收到执行指令后，执行所述程序，本发明实施例任一实施例揭示的流过程定义的测试终端100所执行的方法可以应用于处理器113中，或者由处理器113实现。

所述处理器113可能是一种集成电路芯片，具有信号的处理能力。上述的处理器113可以是通用处理器，包括中央处理器(Central Processing Unit，简称CPU)、网络处理器(Network Processor，简称NP)等；还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述外设接口114将各种输入/输出装置耦合至处理器113以及存储器111。在一些实施例中，外设接口114，处理器113以及存储控制器112可以在单个芯片中实现。在其他一些实例中，他们可以分别由独立的芯片实现。

所述输入输出单元115用于提供给用户输入数据。所述输入输出单元115可以是，但不限于，鼠标和键盘等。

所述音频单元116向用户提供音频接口，其可包括一个或多个麦克风、一个或者多个扬声器以及音频电路。

所述显示单元117在测试终端200与用户之间提供一个交互界面(例如用户操作界面)或用于显示图像数据给用户参考。在本实施例中，所述显示单元117可以是液晶显示器或触控显示器。若为触控显示器，其可为支持单点和多点触控操作的电容式触控屏或电阻式触控屏等。支持单点和多点触控操作是指触控显示器能感应到来自该触控显示器上一个或多个位置处同时产生的触控操作，并将该感应到的触控操作交由处理器进行计算和处理。

图3为根据本发明一个实施例的语音识别测试装置的功能模块示意图。如图3所示，所述语音识别测试装置110包括：语音数据传输模块1101、识别结果获取模块1102、测试结果生成模块1103、识别结果判断模块1104及数据删除模块1105。其中，所述测试结果生成模块1103具体包括：正确字数计算单元11031及准确率计算单元11032。

以下将结合语音识别测试方法的两个实施例中的描述对上述语音识别测试装置110包括的各功能模块进行详细描述。

图4为根据本发明一个实施例的应用于图1所示的语音识别测试系统的语音识别测试方法的流程图。下面将对图4所示的具体流程进行详细阐述。

参见图4，在步骤S101，所述测试终端100将测试终端100播放的待测试音频文件产生的语音数据通过音频传导线传输给所述客户终端200。一较佳实施例中，所述步骤S101所描述的过程可由所述语音数据传输模块1101执行并实现。

本实施例中，所述测试终端100可通过音频传导线与所述客户终端200电性连接。例如，所述测试终端100可通过音频传导线连接到客户终端200的麦克风。在测试开始时，可通过所述测试终端100播放待测试音频文件，然后产生语音数据。接着，所述测试终端100将播放所述待测试音频文件产生的语音数据通过所述音频传导线传输给所述客户终端200。

在步骤S102，所述客户终端200将接收到的所述语音数据进行编码，并将编码后的语音数据发送给所述语音识别服务器300进行语音识别。所述步骤S102可由客户终端200安装的具有语音识别功能的待测试应用程序执行，该待测试应用程序将接收到的语音数据进行编码后可直接发送给语音识别服务器300进行语音识别，以对该待测试应用程序的语音识别功能进行自动化的语音识别。

在步骤S103，所述语音识别服务器300将所述语音数据进行识别，并将语音识别结果发送给所述客户终端200。本实施例中，所述语音识别服务器300识别所述语音数据的识别结果可以是对应的字符串。例如，所述语音数据为中文语音，则所述语音识别结果为中文文字组成的字符串。再例如，所述语音数据为英文语音，则所述语音识别结果为英文单词或字母组成的英文字符串。

进一步地，所述客户终端200可将接收到的所述语音识别结果生成结果日志，并将所述结果日志存储至系统日志缓存区。在一个实例中，所述客户终端200可使用android.util.Log，将最终结果以日志的形式打印到系统日志缓存区。

在步骤S104，所述测试终端100从所述客户终端200中获取所述语音识别结果。一较佳实施例中，所述步骤S104所描述的过程由所述识别结果获取模块1102执行并实现。

例如，所述测试终端100可以直接从所述客户终端200的系统日志缓存区获取所述语音识别结果。

在步骤S105，所述测试终端100将所述语音识别结果与预存的所述待测试音频文件对应的标准结果进行比对得到测试结果。一较佳实施例中，所述步骤S105所描述的过程可由所述测试结果生成模块1103执行并实现。

本实施例中，所述对应的标准结果可以是所述待测试音频文件对应的人工标注的字符串，通过人工的方式根据待测试音频文件的内容得到所述标准结果并记录在所述测试终端100中。在一个实例中，测试人员在使用所述测试终端100进行语音识别测试之前，先将多个所述待测试音频文件存储在存储器111中，并将所述待测试音频文件对应的人工标注的字符串(标准结果)与所述待测试音频文件关联存储。例如，可以通过将所述语音识别结果与所述人工标注的字符串进行对比，比较所述语音识别结果与所述人工标注的字符串的相似程度。所述测试结果则可为所述语音识别结果与所述人工标注的字符串的相同率。

在一种实施方式中，所述步骤S105具体包括：

将所述语音识别结果与所述待测试音频文件对应的标准结果进行比对，得到所述语音识别结果中识别正确的字符数量。一较佳实施例中，该步骤所描述的过程可由所述正确字数计算单元11031执行并实现。例如，所述待测试音频文件对应的标准结果可为“我今天九点上班”，而所述语音识别结果为“我今天就近上班”，则所述识别正确的字符数量为五个。

根据所述识别正确的字符数量及所述标准结果包括的字符数量计算得到对所述待测试音频文件的语音识别准确率。一较佳实施例中，该步骤所描述的过程可由所述准确率计算单元11032执行并实现。以上述实施例为例，所述待测试音频文件对应的标准结果可为“我今天九点上班”，而所述语音识别结果为“我今天就近上班”，则所述识别正确的字符数量为五个。而所述待测试音频文件对应的标准结果为七个字，则所述语音识别准确率为七分之五。

进一步地，所述测试终端100可连续向所述客户终端200发送多组不同的待测试音频文件，步骤S105具体还可包括以下步骤：

计算对多个待测试音频文件进行语音识别的总正确字符数量。一较佳实施例中，该步骤所描述的过程可由所述正确字数计算单元11031执行并实现。

根据所述总正确字符数量及所述多个待测试音频文件分别对应的标准结果包含的字符数量的总和计算得到所述多个待测试音频文件的语音识别总准确率。该步骤所描述的过程可由所述准确率计算单元11032执行并实现。

进一步地，所述测试结果可包括：一条语音测试结果的识别正确的字符数、一条待测试音频文件产生的语音数据中的总字数、多组语音测试结果的总正确字符数、所述待测试音频文件产生的语音数据中的总字数、单条语音测试结果错误率、多组语音测试结果的总错误率。在一个实例中，以ai表示第i条语音测试结果的正确字符数，以bi表示第i条待测试音频文件产生的语音数据中的总字数，以m表示多组语音测试结果的总正确字符数，以n表示所述待测试音频文件产生的语音数据中的总字数，以wi表示第i条语音测试结果错误率，以wt表示多组语音测试结果的总错误率。以上述表示，则所述测试结果的计算公式可以为：

(bi-ai)/bi＝wi；

((b1+b2+b3+…+bn)–(a1+a2+a3+…+an))/(b1+b2+b3+…+bn)＝wt；

其中n为用于一次测试的所述待测试音频文件产生的语音数据的组数。

根据上述实施例提供的语音识别测试方法，通过直接用测试终端100模拟用户输入语音向客户终端200传输语音数据，客户终端200将接收到的语音数据发送给语音识别服务器，实现自动化的语音搜索的测试。另外，语音数据通过音频传导线传输给所述客户终端200，最真实地模拟用户使用场景，避免噪声等外界因素的干扰，可提高自动化语音识别测试的准确率及效率。

进一步地，所述测试终端100还可判断所述语音识别结果是否满足预设条件，以及当所述语音识别结果不满足预设条件时，触发所述测试终端100再次播放所述语音识别结果对应的待测试音频文件，以将产生的语音数据通过音频传导线传输给所述客户终端200，对该待测试音频文件进行再次测试。例如，所述预设条件可以是所述语音识别结果对应的字符数量超过三个字符。

基于上述步骤，所述测试终端100在判断所述待测试音频文件在测试预设次数(例如三次)后的语音识别结果仍不满足所述预设条件后，可删除所述待测试音频文件。所述预设条件可以是：所述语音识别结果中包括字符长度超过预设字符长度。如此，通过将语音识别结果不满足所述预设条件对应的待测试音频文件删除，可以排除一些非正常待测试音频文件导致的测试结果，有助于提高测试效率，避免一些无用的测试，节省测试资源。一较佳实施例中，上述步骤所描述的过程由所述数据删除模块1105执行并实现。

进一步地，所述测试终端100还可以将所述测试结果发送给预设的通信账号对应的通信终端。例如，所述通信账号可以是测试人员对应的通信账号，以方便测试人员实时查看测试结果。

图5为根据本发明一个实施例的应用于图2所示的测试终端100的语音识别测试方法的流程图。本实施例与上述实施例类似，其不同之处在于，本实施例是基于测试终端100对语音识别测试方法进行说明。关于本实施例的其它细节可进一步地参考上述的方法实施例。如图5所示，本实施例中的方法包括以下步骤：

在步骤S201，将测试终端100播放的待测试音频文件产生的语音数据通过音频传导线传输给所述客户终端200，使所述客户终端200将所述语音数据进行编码并发送给所述语音识别服务器300，所述语音识别服务器300将语音识别结果发送给所述客户终端200。

一较佳实施例中，所述步骤S201所描述的过程由所述语音数据传输模块1101执行并实现。

在步骤S202，从所述客户终端200中获取所述语音识别结果。

一较佳实施例中，所述步骤S202所描述的过程由所述识别结果获取模块1102执行并实现。

在步骤S203，将所述语音识别结果与预存的所述待测试音频文件对应的标准结果进行比对得到测试结果。

一较佳实施例中，所述步骤S203所描述的过程由所述测试结果生成模块1103执行并实现。

进一步地，所述测试终端100还可判断所述语音识别结果是否满足预设条件，以及当所述语音识别结果不满足预设条件时，触发所述测试终端100再次播放所述语音识别结果对应的待测试音频文件，以将产生的语音数据通过音频传导线传输给所述客户终端200，对该待测试音频文件进行再次测试。例如，所述预设条件可以是所述语音识别结果对应的字符数量超过三个字符。一较佳实施例中，上述步骤所描述的过程由所述识别结果判断模块1104执行并实现。

在一种实施方式中，步骤S203具体可包括：将所述语音识别结果与所述待测试音频文件对应的标准结果进行比对，得到所述语音识别结果中识别正确的字符数量。一较佳实施例中，上述步骤所描述的过程由所述正确字数计算单元11031执行并实现。根据所述识别正确的字符数量及所述标准结果包括的字符数量计算得到对所述待测试音频文件的语音识别准确率。上述步骤所描述的过程由所述准确率计算单元11032执行并实现。

进一步地，步骤S203具体可包括：所述将所述语音识别结果与所述待测试音频文件对应的标准结果进行比对，得到所述语音识别结果中识别正确的字符数量的步骤包括：计算对多个待测试音频文件进行语音识别的总正确字符数量。一较佳实施例中，上述步骤所描述的过程由所述正确字数计算单元11031执行并实现。所述根据所述识别正确的字符数量及所述标准结果包括的字符数量计算得到对所述待测试音频文件的语音识别准确率的步骤包括：根据所述总正确字符数量及所述多个待测试音频文件分别对应的标准结果包含的字符数量的总和计算得到所述多个待测试音频文件的语音识别总准确率。上述步骤所描述的过程由所述准确率计算单元11032 执行并实现。

根据上述实施例提供的语音识别测试方法，通过直接用测试终端100模拟用户输入语音向客户终端200传输语音数据，客户终端200将接收到的语音数据发送给语音识别服务器，实现自动化的语音搜索的测试。另外，语音数据通过音频传导线传输给所述客户终端200，最真实地模拟用户使用场景，提高自动化语音识别测试的准确率及效率。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现方式中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

因此，本发明的上述技术构思可以被实施为一种非暂时性机器可读存储介质，其上存储有可执行代码。当该可执行代码被电子设备的处理器执行时，使该处理器执行上文所述的方法。

另一方面，本发明的上述技术构思还可以被实施为一种计算设备，该计算设备包括处理器及存储器。该存储器上存储有可执行代码。当该可执行代码被该处理器执行时，使该处理器执行上文所述的方法。

另外，在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以两个或两个以上模块集成形成一个独立的部分。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，语音识别服务器300，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

Claims

一种语音识别测试方法，其特征在于，应用于语音识别测试系统，该系统包括测试终端、客户终端以及语音识别服务器，所述测试终端通过音频传导线与所述客户终端电性连接，所述客户终端通过网络与所述语音识别服务器通信连接，该方法包括：

所述测试终端将测试终端播放的待测试音频文件产生的语音数据通过所述音频传导线传输给所述客户终端；

所述客户终端将接收到的所述语音数据进行编码，并将编码后的语音数据发送给所述语音识别服务器进行语音识别；

所述语音识别服务器将所述语音数据进行识别，并将语音识别结果发送给所述客户终端；

所述测试终端从所述客户终端中获取所述语音识别结果；以及

所述测试终端将所述语音识别结果与预存的所述待测试音频文件对应的标准结果进行比对得到测试结果。
如权利要求1所述的语音识别测试方法，其特征在于，该方法还包括：

所述测试终端判断所述语音识别结果是否满足预设条件，

在所述语音识别结果不满足预设条件的情况下，再次播放所述语音识别结果对应的待测试音频文件，以将产生的语音数据通过音频传导线传输给所述客户终端，对该待测试音频文件进行再次测试。
如权利要求2所述的语音识别测试方法，其特征在于，该方法还包括：

所述测试终端在判断所述待测试音频文件在测试预设次数后的语音识别结果仍不满足所述预设条件后，删除所述待测试音频文件。
如权利要求1所述的语音识别测试方法，其特征在于，所述测试终端将所述语音识别结果与预存的所述待测试音频文件对应的标准结果进行比对得到测试结果的步骤具体包括：

将所述语音识别结果与所述待测试音频文件对应的标准结果进行比对，得到所述语音识别结果中识别正确的字符数量；以及

根据所述识别正确的字符数量及所述标准结果包括的字符数量，计算得到对所述待测试音频文件的语音识别准确率。
如权利要求4所述的语音识别测试方法，其特征在于，所述测试终端将所述语音识别结果与预存的所述待测试音频文件对应的标准结果进行比对得到测试结果的步骤具体包括：

计算对多个待测试音频文件进行语音识别的总正确字符数量；以及

根据所述总正确字符数量及所述多个待测试音频文件分别对应的标准结果包含的字符数量的总和，计算得到所述多个待测试音频文件的语音识别总准确率。
如权利要求1所述的语音识别测试方法，其特征在于，该方法还包括：

所述客户终端将所述语音识别结果生成结果日志，并将所述结果日志存储至系统日志缓存区；以及

所述测试终端从所述客户终端的系统日志缓存区获取所述语音识别结果。
如权利要求1-6中任意一项所述的语音识别测试方法，其特征在于，该方法还包括：

所述测试终端将所述测试结果发送给预设的通信账号对应的通信终端。
一种测试终端，所述测试终端通过音频传导线与客户终端电性连接，所述客户终端与一语音识别服务器通信连接，其特征在于，所述测试终端包括：

存储器；

处理器；

安装/存储于所述存储器并由所述处理器执行的语音识别测试装置；

所述语音识别测试装置包括：

语音数据传输模块，用于将测试终端播放的待测试音频文件产生的语音数据通过音频传导线传输给所述客户终端，使所述客户终端将所述语音数据进行编码并发送给所述语音识别服务器，由所述语音识别服务器进行语音识别后将语音识别结果发送给所述客户终端；

识别结果获取模块，用于从所述客户终端中获取所述语音识别结果；

测试结果生成模块，用于将所述语音识别结果与预存的所述待测试音频文件对应的标准结果进行比对得到测试结果。
如权利要求8所述的测试终端，其特征在于，所述测试终端还包括：

识别结果判断模块，用于判断所述语音识别结果是否满足预设条件，

在所述语音识别结果不满足预设条件的情况下，触发所述测试终端再次播放所述语音识别结果对应的待测试音频文件，以将产生的语音数据通过音频传导线传输给所述客户终端，对该待测试音频文件进行再次测试。
如权利要求9所述的测试终端，其特征在于，所述测试终端还包括：

数据删除模块，用于在所述待测试音频文件在测试预设次数后的语音识别结果仍不满足所述预设条件后，删除所述待测试音频文件。
如权利要求8所述的测试终端，其特征在于，所述测试结果生成模块包括：

正确字数计算单元，用于将所述语音识别结果与所述待测试音频文件对应的标准结果进行比对，得到所述语音识别结果中识别正确的字符数量；以及

准确率计算单元，用于根据所述识别正确的字符数量及所述标准结果包括的字符数量计算得到对所述待测试音频文件的语音识别准确率。
如权利要求11所述的测试终端，其特征在于，所述正确字数计算单元，还用于计算对多个待测试音频文件进行语音识别的总正确字符数量；

所述准确率计算单元，还用于根据所述总正确字符数量及所述多个待测试音频文件分别对应的标准结果包含的字符数量的总和计算得到所述多个待测试音频文件的语音识别总准确率。
一种语音识别测试方法，应用于测试终端，其特征在于，所述测试终端通过音频传导线与客户终端电性连接，所述客户终端与一语音识别服务器通信连接，所述方法包括：

将所述测试终端播放的待测试音频文件产生的语音数据通过音频传导线传输给所述客户终端，使所述客户终端将所述语音数据进行编码并发送给所述语音识别服务器，由所述语音识别服务器进行语音识别后将语音识别结果发送给所述客户终端；

从所述客户终端中获取所述语音识别结果；

将所述语音识别结果与预存的与所述待测试音频文件对应的标准结果进行比对得到测试结果。
如权利要求13所述的语音识别测试方法，其特征在于，该方法还包括：

判断所述语音识别结果是否满足预设条件，

在所述语音识别结果不满足预设条件时，触发所述测试终端再次播放所述语音识别结果对应的待测试音频文件，以将产生的语音数据通过音频传导线传输给所述客户终端，对该待测试音频文件进行再次测试。
如权利要求14所述的语音识别测试方法，其特征在于，该方法还包括：

在所述待测试音频文件在测试预设次数后的语音识别结果仍不满足所述预设条件后，删除所述待测试音频文件。
如权利要求14所述的语音识别测试方法，其特征在于，所述将所述语音识别结果与预存的所述待测试音频文件对应的标准结果进行比对得到测试结果的步骤包括：

将所述语音识别结果与所述待测试音频文件对应的标准结果进行比对，得到所述语音识别结果中识别正确的字符数量；以及

根据所述识别正确的字符数量及所述标准结果包括的字符数量计算得到对所述待测试音频文件的语音识别准确率。
如权利要求16所述的语音识别测试方法，其特征在于，

所述将所述语音识别结果与所述待测试音频文件对应的标准结果进行比对，得到所述语音识别结果中识别正确的字符数量的步骤包括：计算对多个待测试音频文件进行语音识别的总正确字符数量；

所述根据所述正确字符数量及所述标准结果包括的字符数量计算得到对所述待测试音频文件的语音识别准确率的步骤包括：根据所述总正确字符数量及所述多个待测试音频文件分别对应的标准结果包含的字符数量的总和计算得到所述多个待测试音频文件的语音识别总准确率。
一种计算设备，包括：

处理器；以及

存储器，其上存储有可执行代码，当所述可执行代码被所述处理器执行时，使所述处理器执行如权利要求1-8、13-17中任何一项所述的方法。
一种非暂时性机器可读存储介质，其上存储有可执行代码，当所述可执行代码被电子设备的处理器执行时，使所述处理器执行如权利要求1-8、13-17中任一项所述的方法。