CN110706708A

CN110706708A - 语音识别方法、装置及系统

Info

Publication number: CN110706708A
Application number: CN201911206965.5A
Authority: CN
Inventors: 杨海波; 刘耀
Original assignee: Shanghai Mxchip Information Technology Co Ltd
Current assignee: Shanghai Mxchip Information Technology Co Ltd
Priority date: 2019-11-29
Filing date: 2019-11-29
Publication date: 2020-01-17

Abstract

本发明公开了一种语音识别方法、装置及系统。该方法包括：获取待识别的语音指令，并将语音指令上传至服务器；基于服务器返回的与语音指令对应的识别结果对目标对象进行操控，其中，识别结果用于确定与语音指令对应的待执行串口控制指令的待执行指令索引。本发明解决了相关技术中所提供的在物联网应用的语音识别方式会造成实际产品的软件和硬件成本较高、而且难以适用于处理能力有限的处理器的技术问题。

Description

语音识别方法、装置及系统

技术领域

本发明涉及计算机领域，具体而言，涉及一种语音识别方法、装置及系统。

背景技术

语音识别技术(Automatic Speech Recognition，简称为ASR)是一种将用户的语音自动转换为计算机能够识别的字符的技术。语音拨号、语音邮件、语音输入以及语音操控等以语音识别为基础的人际交互模式日益普及。

随着物联网和语音识别技术的飞速发展，语音识别技术配合物联网的多项应用不断应运而生，通过语音实现人与物，物与物之间的信息传输，极大地提高了信息输入和信息交换效率。

然而，相关技术中所提供的语音识别方式通常需要具备较优的语音识别训练模型以及配套的语音识别算法，由此对处理器的处理效率要求较高，进而导致具有语音识别功能的实际产品的软件和硬件成本较高。特别是针对一些处理能力有限的处理器，会受到处理器效率的限制而难以直接应用于物理网嵌入式设备的语音操控。

针对上述的问题，目前尚未提出有效的解决方案。

发明内容

本发明至少部分实施例提供了一种语音识别方法、装置及系统，以至少解决相关技术中所提供的在物联网应用的语音识别方式会造成实际产品的软件和硬件成本较高、而且难以适用于处理能力有限的处理器的技术问题。

根据本发明其中一实施例，提供了一种语音识别方法，包括：

获取待识别的语音指令，并将语音指令上传至服务器；基于服务器返回的与语音指令对应的识别结果对目标对象进行操控，其中，识别结果用于确定与语音指令对应的待执行串口控制指令的待执行指令索引。

可选地，在获取语音指令之前，还包括：经由串口线接收来自于目标对象的控制指令集，其中，控制指令集包括：多个指令索引以及与每个指令索引分别对应的串口控制指令；将控制指令集和通用控制模组中与控制指令集对应子模组的身份信息注册至服务器。

可选地，基于识别结果对目标对象进行操控包括：接收服务器返回的识别结果，其中，识别结果包括：待执行指令索引，识别结果是由服务器将语音指令转化为对应的文本指令后得到的结果，待执行指令索引用于确定待执行串口控制指令；将待执行指令索引发送至目标对象，以使目标对象按照待执行指令索引执行与待执行串口控制指令对应的动作。

可选地，通用控制模组中集成有多个子模组，其中，多个子模组中的每个子模组分别用于控制不同种类的目标对象。

根据本发明其中一实施例，还提供了另一种语音识别方法，包括：

接收来自于通用控制模组的待识别的语音指令；获取与语音指令对应的识别结果；向通用控制模组返回识别结果，以使通用控制模组对目标对象进行操控，其中，识别结果用于确定与语音指令对应的待执行串口控制指令的待执行指令索引。

可选地，在获取识别结果之前，还包括：接收来自于通用控制模组的控制指令集和通用控制模组中与控制指令集对应子模组的身份信息，其中，控制指令集包括：多个指令索引以及与每个指令索引分别对应的串口控制指令；对控制指令集和身份信息执行注册操作。

可选地，获取识别结果包括：将语音指令转化为对应的文本指令，其中，文本指令包括：待执行串口控制指令；从控制指令集中获取与待执行串口控制指令对应的待执行指令索引，得到识别结果。

根据本发明其中一实施例，还提供了一种语音识别装置，包括：

获取模块，用于获取待识别的语音指令，并将语音指令上传至服务器；处理模块，用于基于服务器返回的与语音指令对应的识别结果对目标对象进行操控，其中，识别结果用于确定与语音指令对应的待执行串口控制指令的待执行指令索引。

可选地，上述装置还包括：接收模块，用于经由串口线接收来自于目标对象的控制指令集，其中，控制指令集包括：多个指令索引以及与每个指令索引分别对应的串口控制指令；注册模块，用于将控制指令集和通用控制模组中与控制指令集对应子模组的身份信息注册至服务器。

可选地，处理模块包括：接收单元，用于接收服务器返回的识别结果，其中，识别结果包括：待执行指令索引，识别结果是由服务器将语音指令转化为对应的文本指令后得到的结果，待执行指令索引用于确定待执行串口控制指令；处理单元，用于将待执行指令索引发送至目标对象，以使目标对象按照待执行指令索引执行与待执行串口控制指令对应的动作。

根据本发明其中一实施例，还提供了另一种语音识别装置，包括：

第一接收模块，用于接收来自于通用控制模组的待识别的语音指令；获取模块，用于获取与语音指令对应的识别结果；反馈模块，用于向通用控制模组返回识别结果，以使通用控制模组对目标对象进行操控，其中，识别结果用于确定与语音指令对应的待执行串口控制指令的待执行指令索引。

可选地，上述装置还包括：第二接收模块，用于接收来自于通用控制模组的控制指令集和通用控制模组中与控制指令集对应子模组的身份信息，其中，控制指令集包括：多个指令索引以及与每个指令索引分别对应的串口控制指令；注册模块，用于对控制指令集和身份信息执行注册操作。

可选地，获取模块包括：转化单元，用于将语音指令转化为对应的文本指令，其中，文本指令包括：待执行串口控制指令；获取单元，用于从控制指令集中获取与待执行串口控制指令对应的待执行指令索引，得到识别结果。

根据本发明其中一实施例，还提供了一种语音识别系统，包括通用控制模组和服务器，通用控制模组中包括上述任一项中的语音识别装置，服务器中包括上述任一项中的另一种语音识别装置。

在本发明至少部分实施例中，采用获取待识别的语音指令并将语音指令上传至服务器的方式，通过服务器返回的与语音指令对应的识别结果对目标对象进行操控，该识别结果用于确定与语音指令对应的待执行串口控制指令的待执行指令索引，达到了采用经过简化的串口控制指令及其配套的指令索引来替代复杂的语音识别训练模型以及配套的语音识别算法的目的，从而实现了降低在物联网应用的语音识别方式中的软件和硬件成本，简化语音识别过程、特别适用于处理能力有限的处理器的技术效果，进而解决了相关技术中所提供的在物联网应用的语音识别方式会造成实际产品的软件和硬件成本较高、而且难以适用于处理能力有限的处理器的技术问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是根据本发明其中一实施例的语音识别系统的结构示意图；

图2是根据本发明其中一实施例的语音识别方法的流程图；

图3是根据本发明其中一实施例的另一种语音识别方法的流程图；

图4是根据本发明其中一实施例的语音识别装置的结构框图；

图5是根据本发明其中一可选实施例的语音识别装置的结构框图；

图6是根据本发明其中一实施例的另一种语音识别装置的结构框图；

图7是根据本发明其中一可选实施例的另一种语音识别装置的结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

根据本发明其中一实施例，提供了一种语音识别方法的实施例，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

该方法实施例可以在语音识别系统中执行。图1是根据本发明其中一实施例的语音识别系统的结构示意图，如图1所示，语音识别系统包括通用控制模组和服务器。目标对象可以包括但不限于：智能玩具车辆、智能玩具飞机、智能玩具狗等物联网嵌入式设备。

通用控制模组可以包括一个或多个处理器(处理器可以包括但不限于中央处理器(CPU)、数字信号处理(DSP)芯片、微处理器(MCU)或可编程逻辑器件(FPGA)等的处理装置)和用于存储数据的存储器。可选地，上述通用控制模组还可以包括用于通信功能的传输设备、输入输出设备以及显示设备。本领域普通技术人员可以理解，上述结构描述仅为示意，其并不对上述通用控制模组的结构造成限定。例如，通用控制模组还可包括比上述结构描述更多或者更少的组件，或者具有与上述结构描述不同的配置。

存储器可用于存储计算机程序，例如，应用软件的软件程序以及模块，如本发明实施例中的语音识别方法对应的计算机程序，处理器通过运行存储在存储器内的计算机程序，从而执行各种功能应用以及数据处理，即实现上述的语音识别方法。存储器可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器可进一步包括相对于处理器远程设置的存储器，这些远程存储器可以通过网络连接至通用控制模组。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输设备用于经由一个网络接收或者发送数据。上述的网络具体实例可包括通用控制模组的通信供应商提供的无线网络。在一个实例中，传输设备包括一个网络适配器(Network Interface Controller，简称为NIC)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输设备可以为射频(Radio Frequency，简称为RF)模块，其用于通过无线方式与互联网进行通讯。在一个实例中，传输设备可以为无线保真(Wi-Fi)模块，其用于通过无线方式与服务器进行通讯。

在本实施例中提供了一种运行于上述通用控制模组的语音识别方法，图2是根据本发明其中一实施例的语音识别方法的流程图，如图2所示，该方法包括如下步骤：

步骤S22，获取待识别的语音指令，并将语音指令上传至服务器；

步骤S24，基于服务器返回的与语音指令对应的识别结果对目标对象进行操控，其中，识别结果用于确定与语音指令对应的待执行串口控制指令的待执行指令索引。

通过上述步骤，可以采用获取待识别的语音指令并将语音指令上传至服务器的方式，通过服务器返回的与语音指令对应的识别结果对目标对象进行操控，该识别结果用于确定与语音指令对应的待执行串口控制指令的待执行指令索引，达到了采用经过简化的串口控制指令及其配套的指令索引来替代复杂的语音识别训练模型以及配套的语音识别算法的目的，从而实现了降低在物联网应用的语音识别方式中的软件和硬件成本，简化语音识别过程、特别适用于处理能力有限的处理器的技术效果，进而解决了相关技术中所提供的在物联网应用的语音识别方式会造成实际产品的软件和硬件成本较高、而且难以适用于处理能力有限的处理器的技术问题。

串口控制指令(即AT+指令)是采用基于ASCII码的命令行。

格式说明：

<>表示必须包含的部分；

[]表示可选的部分。

具体命令格式如下：

AT+<CMD>[op][para-1,para-2,para-3,......]\r；

AT+表示命令消息前缀；

CMD表示指令字符串；

[op]表示指令操作符，其可以包括但不限于：

"＝"表示参数设置或者查询指定参数；

"？"表示查询系统参数；

"无"表示执行指令；

"＝？"表示查询用户设置的参数；

[para-n]表示设置的参数值或者指定查询的参数；

\r表示回车结束符，ASCII码为0x0d。

可选地，通用控制模组中集成有多个子模组。多个子模组中的每个子模组分别用于控制不同种类的目标对象。因此，每个子模组均具有唯一的身份信息，服务器可以根据每个子模组的身份信息便可以确定该子模组所需控制的目标对象。例如：针对智能玩具车辆可以在通用控制模组中设置子模组1，那么服务器便可以根据子模组1的身份信息来确定该子模组所需控制的目标对象为智能玩具车辆。针对智能玩具飞机可以在通用控制模组中设置子模组2，那么服务器便可以根据子模组2的身份信息来确定该子模组所需控制的目标对象为智能玩具飞机。针对智能玩具狗可以在通用控制模组中设置子模组3，那么服务器便可以根据子模组3的身份信息来确定该子模组所需控制的目标对象为智能玩具狗。

可选地，在步骤S22，获取语音指令之前，还可以包括以下执行步骤：

步骤S20，经由串口线接收来自于目标对象的控制指令集，其中，控制指令集包括：多个指令索引以及与每个指令索引分别对应的串口控制指令；

步骤S21，将控制指令集和通用控制模组中与控制指令集对应子模组的身份信息注册至服务器。

上述目标对象并不需要参与语音识别操作，而只需在目标对象上设置串口，并通过串口线与通用控制模组相连接。然后，目标对象可以向通用控制模组中与目标对象集对应子模组(例如：针对智能玩具车辆可以在通用控制模组中设置子模组1)发送控制指令集。该控制指令集包括：多个指令索引以及与每个指令索引分别对应的串口控制指令。例如：智能玩具车辆可以向通用控制模组中设置的子模组1发送控制指令集，其可以包括但不限于：指令索引1对应的串口控制指令为控制智能玩具车辆执行前进动作，指令索引2对应的串口控制指令为控制智能玩具车辆执行后退动作，指令索引3对应的串口控制指令为控制智能玩具车辆执行转弯动作，指令索引4对应的串口控制指令为控制智能玩具车辆执行刹车动作。然后，通用控制模组可以将控制指令集和通用控制模组中与控制指令集对应子模组的身份信息注册至服务器。例如：通用控制模组可以将智能玩具车辆发送的控制指令集和子模组1的身份信息注册至服务器。

可选地，在步骤S24中，基于识别结果对目标对象进行操控可以包括以下执行步骤：

步骤S241，接收服务器返回的识别结果，其中，识别结果包括：待执行指令索引，识别结果是由服务器将语音指令转化为对应的文本指令后得到的结果，待执行指令索引用于确定待执行串口控制指令；

步骤S242，将待执行指令索引发送至目标对象，以使目标对象按照待执行指令索引执行与待执行串口控制指令对应的动作。

通用控制模组在接收到用户发出的语音指令之后，会将语音指令发送至服务器。其次，服务器可以将语音指令转化为对应的文本指令，并根据发送语音指令的子模组的身份信息获取与身份信息对应的控制指令集。然后，服务器通过对文本指令进行解析，确定待执行串口控制指令，进而从控制指令集中获取到与确定待执行串口控制指令对应的待执行指令索引。最后，服务器经由通用控制模组将待执行指令索引发送至目标对象，以使目标对象按照待执行指令索引执行与待执行串口控制指令对应的动作。

例如：通用控制模组在接收到用户发出的类似“车辆直行”的语音指令之后，会将语音指令发送至服务器。其次，服务器可以将语音指令转化为对应的文本指令，并根据发送语音指令的子模组的身份信息获取与身份信息(例如：针对智能玩具车辆可以在通用控制模组中设置子模组1)对应的控制指令集。然后，服务器通过对文本指令进行解析，确定待执行串口控制指令(即“车辆直行”)，进而从控制指令集中获取到与确定待执行串口控制指令对应的待执行指令索引(即指令索引1对应的串口控制指令为控制智能玩具车辆执行前进动作)。最后，服务器经由通用控制模组将待执行指令索引(即指令索引1)发送至目标对象，以使目标对象按照待执行指令索引执行与待执行串口控制指令对应的动作(即控制智能玩具车辆执行前进动作)。

在本实施例中还提供了另一种运行于上述服务器的语音识别方法，图3是根据本发明其中一实施例的另一种语音识别方法的流程图，如图3所示，该方法包括如下步骤：

步骤S32，接收来自于通用控制模组的待识别的语音指令；

步骤S34，获取与语音指令对应的识别结果；

步骤S36，向通用控制模组返回识别结果，以使通用控制模组对目标对象进行操控，其中，识别结果用于确定与语音指令对应的待执行串口控制指令的待执行指令索引。

可选地，在步骤S34，获取识别结果之前，还可以包括以下执行步骤：

步骤S30，接收来自于通用控制模组的控制指令集和通用控制模组中与控制指令集对应子模组的身份信息，其中，控制指令集包括：多个指令索引以及与每个指令索引分别对应的串口控制指令；

步骤S31，对控制指令集和身份信息执行注册操作。

可选地，在步骤S34中，获取识别结果可以包括以下执行步骤：

步骤S341，将语音指令转化为对应的文本指令，其中，文本指令包括：待执行串口控制指令；

步骤S342，从控制指令集中获取与待执行串口控制指令对应的待执行指令索引，得到识别结果。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

在本实施例中还提供了一种语音识别装置，该装置用于实现上述实施例及优选实施方式，已经进行过说明的不再赘述。如以下所使用的，术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。

图4是根据本发明其中一实施例的语音识别装置的结构框图，如图4所示，该装置包括：获取模块10，用于获取待识别的语音指令，并将语音指令上传至服务器；处理模块20，用于基于服务器返回的与语音指令对应的识别结果对目标对象进行操控，其中，识别结果用于确定与语音指令对应的待执行串口控制指令的待执行指令索引。

可选地，可选地，图5是根据本发明其中一可选实施例的语音识别装置的结构框图，如图5所示，该装置除包括图4所示的所有模块外，上述装置还包括：接收模块30，用于经由串口线接收来自于目标对象的控制指令集，其中，控制指令集包括：多个指令索引以及与每个指令索引分别对应的串口控制指令；注册模块40，用于将控制指令集和通用控制模组中与控制指令集对应子模组的身份信息注册至服务器。

可选地，处理模块20包括：接收单元(图中未示出)，用于接收服务器返回的识别结果，其中，识别结果包括：待执行指令索引，识别结果是由服务器将语音指令转化为对应的文本指令后得到的结果，待执行指令索引用于确定待执行串口控制指令；处理单元(图中未示出)，用于将待执行指令索引发送至目标对象，以使目标对象按照待执行指令索引执行与待执行串口控制指令对应的动作。

在本实施例中还提供了另一种语音识别装置，该装置用于实现上述实施例及优选实施方式，已经进行过说明的不再赘述。如以下所使用的，术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。

图6是根据本发明其中一实施例的另一种语音识别装置的结构框图，如图6所示，该装置包括：第一接收模块50，用于接收来自于通用控制模组的待识别的语音指令；获取模块60，用于获取与语音指令对应的识别结果；反馈模块70，用于向通用控制模组返回识别结果，以使通用控制模组对目标对象进行操控，其中，识别结果用于确定与语音指令对应的待执行串口控制指令的待执行指令索引。

可选地，可选地，可选地，图7是根据本发明其中一可选实施例的另一种语音识别装置的结构框图，如图7所示，该装置除包括图6所示的所有模块外，上述装置还包括：第二接收模块80，用于接收来自于通用控制模组的控制指令集和通用控制模组中与控制指令集对应子模组的身份信息，其中，控制指令集包括：多个指令索引以及与每个指令索引分别对应的串口控制指令；注册模块90，用于对控制指令集和身份信息执行注册操作。

可选地，获取模块60包括：转化单元(图中未示出)，用于将语音指令转化为对应的文本指令，其中，文本指令包括：待执行串口控制指令；获取单元(图中未示出)，用于从控制指令集中获取与待执行串口控制指令对应的待执行指令索引，得到识别结果。

需要说明的是，上述各个模块是可以通过软件或硬件来实现的，对于后者，可以通过以下方式实现，但不限于此：上述模块均位于同一处理器中；或者，上述各个模块以任意组合的形式分别位于不同的处理器中。

本发明的实施例还提供了一种存储介质，该存储介质中存储有计算机程序，其中，该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

可选地，在本实施例中，上述存储介质可以被设置为存储用于执行以下步骤的计算机程序：

S1，获取待识别的语音指令，并将语音指令上传至服务器；

S2，基于服务器返回的与语音指令对应的识别结果对目标对象进行操控，其中，识别结果用于确定与语音指令对应的待执行串口控制指令的待执行指令索引。

可选地，在本实施例中，上述存储介质还可以被设置为存储用于执行以下步骤的计算机程序：

S1，接收来自于通用控制模组的待识别的语音指令；

S2，获取与语音指令对应的识别结果；

S3，向通用控制模组返回识别结果，以使通用控制模组对目标对象进行操控，其中，识别结果用于确定与语音指令对应的待执行串口控制指令的待执行指令索引。

可选地，在本实施例中，上述存储介质可以包括但不限于：U盘、只读存储器(Read-Only Memory，简称为ROM)、随机存取存储器(Random Access Memory，简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。

本发明的实施例还提供了一种电子装置，包括存储器和处理器，该存储器中存储有计算机程序，该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。

可选地，上述电子装置还可以包括传输设备以及输入输出设备，其中，该传输设备和上述处理器连接，该输入输出设备和上述处理器连接。

可选地，在本实施例中，上述处理器可以被设置为通过计算机程序执行以下步骤：

S1，获取待识别的语音指令，并将语音指令上传至服务器；

可选地，在本实施例中，上述处理器还可以被设置为通过计算机程序执行以下步骤：

S1，接收来自于通用控制模组的待识别的语音指令；

S2，获取与语音指令对应的识别结果；

可选地，本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例，本实施例在此不再赘述。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

在本发明的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的技术内容，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，可以为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种语音识别方法，其特征在于，包括：

获取待识别的语音指令，并将所述语音指令上传至服务器；

基于所述服务器返回的与所述语音指令对应的识别结果对目标对象进行操控，其中，所述识别结果用于确定与所述语音指令对应的待执行串口控制指令的待执行指令索引。

2.根据权利要求1所述的方法，其特征在于，在获取所述语音指令之前，还包括：

经由串口线接收来自于所述目标对象的控制指令集，其中，所述控制指令集包括：多个指令索引以及与每个指令索引分别对应的串口控制指令；

将所述控制指令集和通用控制模组中与所述控制指令集对应子模组的身份信息注册至所述服务器。

3.根据权利要求1或2所述的方法，其特征在于，基于所述识别结果对所述目标对象进行操控包括：

接收所述服务器返回的所述识别结果，其中，所述识别结果包括：所述待执行指令索引，所述识别结果是由所述服务器将所述语音指令转化为对应的文本指令后得到的结果，所述待执行指令索引用于确定所述待执行串口控制指令；

将所述待执行指令索引发送至所述目标对象，以使所述目标对象按照所述待执行指令索引执行与所述待执行串口控制指令对应的动作。

4.根据权利要求2所述的方法，其特征在于，所述通用控制模组中集成有多个子模组，其中，所述多个子模组中的每个子模组分别用于控制不同种类的目标对象。

5.一种语音识别方法，其特征在于，包括：

接收来自于通用控制模组的待识别的语音指令；

获取与所述语音指令对应的识别结果；

向所述通用控制模组返回所述识别结果，以使所述通用控制模组对目标对象进行操控，其中，所述识别结果用于确定与所述语音指令对应的待执行串口控制指令的待执行指令索引。

6.根据权利要求5所述的方法，其特征在于，在获取所述识别结果之前，还包括：

接收来自于所述通用控制模组的控制指令集和通用控制模组中与所述控制指令集对应子模组的身份信息，其中，所述控制指令集包括：多个指令索引以及与每个指令索引分别对应的串口控制指令；

对所述控制指令集和所述身份信息执行注册操作。

7.根据权利要求5或6所述的方法，其特征在于，获取所述识别结果包括：

将所述语音指令转化为对应的文本指令，其中，所述文本指令包括：所述待执行串口控制指令；

从控制指令集中获取与所述待执行串口控制指令对应的所述待执行指令索引，得到所述识别结果。

8.一种语音识别装置，其特征在于，包括：

获取模块，用于获取待识别的语音指令，并将所述语音指令上传至服务器；

处理模块，用于基于所述服务器返回的与所述语音指令对应的识别结果对目标对象进行操控，其中，所述识别结果用于确定与所述语音指令对应的待执行串口控制指令的待执行指令索引。

9.根据权利要求8所述的装置，其特征在于，所述装置还包括：

接收模块，用于经由串口线接收来自于所述目标对象的控制指令集，其中，所述控制指令集包括：多个指令索引以及与每个指令索引分别对应的串口控制指令；

注册模块，用于将所述控制指令集和通用控制模组中与所述控制指令集对应子模组的身份信息注册至所述服务器。

10.根据权利要求8或9所述的装置，其特征在于，所述处理模块包括：

接收单元，用于接收所述服务器返回的所述识别结果，其中，所述识别结果包括：所述待执行指令索引，所述识别结果是由所述服务器将所述语音指令转化为对应的文本指令后得到的结果，所述待执行指令索引用于确定所述待执行串口控制指令；

处理单元，用于将所述待执行指令索引发送至所述目标对象，以使所述目标对象按照所述待执行指令索引执行与所述待执行串口控制指令对应的动作。

11.根据权利要求9所述的装置，其特征在于，所述通用控制模组中集成有多个子模组，其中，所述多个子模组中的每个子模组分别用于控制不同种类的目标对象。

12.一种语音识别装置，其特征在于，包括：

第一接收模块，用于接收来自于通用控制模组的待识别的语音指令；

获取模块，用于获取与所述语音指令对应的识别结果；

反馈模块，用于向所述通用控制模组返回所述识别结果，以使所述通用控制模组对目标对象进行操控，其中，所述识别结果用于确定与所述语音指令对应的待执行串口控制指令的待执行指令索引。

13.根据权利要求12所述的装置，其特征在于，所述装置还包括：

第二接收模块，用于接收来自于所述通用控制模组的控制指令集和通用控制模组中与所述控制指令集对应子模组的身份信息，其中，所述控制指令集包括：多个指令索引以及与每个指令索引分别对应的串口控制指令；

注册模块，用于对所述控制指令集和所述身份信息执行注册操作。

14.根据权利要求12或13所述的装置，其特征在于，所述获取模块包括：

转化单元，用于将所述语音指令转化为对应的文本指令，其中，所述文本指令包括：所述待执行串口控制指令；

获取单元，用于从控制指令集中获取与所述待执行串口控制指令对应的所述待执行指令索引，得到所述识别结果。

15.一种语音识别系统，其特征在于，包括通用控制模组和服务器，所述通用控制模组中包括所述权利要求8至11任一项中所述的语音识别装置，所述服务器中包括所述权利要求12至14任一项中所述的语音识别装置。