WO2020133764A1

WO2020133764A1 - 语音遥控方法、系统、受控装置及计算机可读存储介质

Info

Publication number: WO2020133764A1
Application number: PCT/CN2019/079991
Authority: WO
Inventors: 伍以文; 许辉福; 袁建强
Original assignee: 深圳创维－Rgb电子有限公司
Priority date: 2018-12-25
Filing date: 2019-03-28
Publication date: 2020-07-02
Also published as: CN109637534A

Abstract

一种语音遥控方法、系统、受控装置及计算机可读存储介质，方法包括：接收遥控终端发送的第一音频数据(S100)，第一音频数据由遥控终端根据获取到的用户语音遥控指令处理得到；根据预设规则对第一音频数据进行处理，得到第二音频数据(S200)；发送第二音频数据至云服务器(S300)；接收云服务器下发的控制命令文本，解析控制命令文本得到控制命令，执行控制命令(S400)，控制命令文本由云服务器根据第二音频数据处理得到。通过语音控制指令遥控受控装置，解决了传统机械遥控操作复杂、响应速度慢的问题。

Description

语音遥控方法、系统、受控装置及计算机可读存储介质

本申请要求于2018年12月25日提交中国专利局、申请号为201811599357.0、发明名称为“语音遥控方法、系统、受控装置及计算机可读存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及智能遥控技术领域，尤其涉及一种语音遥控方法、系统、受控装置及计算机可读存储介质。

背景技术

目前，大多数消费电子设备在使用时，是由用户操作机械遥控器进行控制的，如用户在观看电视时，需要手动操作遥控器进行搜台、音量调节、节目切换、打开/关闭应用、电视图像/声音参数调节等；然而，用户往往需要多次点击遥控器来打开多级菜单，在节目列表中一个个查找要观看的节目或是查找需要调节参数的按钮，查找操作十分繁琐，给用户的使用带来较大不便，通过机械遥控器调节音量等参数也不能满足实时响应的要求。

发明内容

本申请的主要目的在于提供一种语音遥控方法、系统、受控装置及计算机可读存储介质，旨在通过语音控制指令遥控受控装置，解决了传统机械遥控操作复杂、响应速度慢的问题。

为实现上述目的，本申请提供一种语音遥控方法，应用于受控装置，所述语音遥控方法包括以下步骤：

接收遥控终端发送的第一音频数据，所述第一音频数据由所述遥控终端根据获取到的用户语音遥控指令处理得到；

根据预设规则对所述第一音频数据进行处理，得到第二音频数据；

发送所述第二音频数据至云服务器；

接收所述云服务器下发的控制命令文本，解析所述控制命令文本得到控制命令，执行所述控制命令；所述控制命令文本由所述云服务器根据所述第二音频数据处理得到。

可选地，所述发送所述第二音频数据至云服务器的步骤之前还包括：

创建Socket连接并向云服务器发送连接请求；

接收所述云服务器针对所述连接请求的响应，与所述云服务器建立Socket连接。

可选地，所述根据预设规则对所述第一音频数据进行处理，得到第二音频数据的步骤包括：

获取预设的音频优化标准；

基于获取到的音频优化标准对所述第一音频数据进行优化，将优化后的第一音频数据作为第二音频数据。

可选地，所述接收遥控终端发送的第一音频数据的步骤之前还包括：

检测是否接收到预设的写入指令；

若是，则进入步骤：接收遥控终端发送的第一音频数据。

检测是否接收到预设的读取指令；

若是，则进入步骤：发送所述第二音频数据至云服务器。

可选地，所述接收遥控终端发送的第一音频数据的步骤包括：

响应于遥控终端发送的蓝牙配对请求，与所述遥控终端建立蓝牙连接；

基于所述蓝牙连接，接收所述遥控终端发送的第一音频数据。

此外，本申请还提供一种语音遥控系统，所述语音遥控系统包括遥控终端、受控装置及云服务器；

所述遥控终端，用于基于预设条件，获取用户语音遥控指令，还用于对所述语音遥控指令进行模数转换处理，得到第一音频数据，并发送所述第一音频数据至所述受控装置；

所述受控装置，用于在接收到所述遥控终端发送的所述第一音频数据后，根据预设规则对所述第一音频数据进行处理，得到第二音频数据，并发送所述第二音频数据至所述云服务器；

所述云服务器，用于在接收到所述第二音频数据后，根据预设的识别规则，识别所述第二音频数据并生成控制命令文本，发送所述控制命令文本至所述受控装置；

所述受控装置，还用于接收所述云服务器下发的所述控制命令文本，解析所述控制命令文本得到控制命令，执行所述控制命令。

可选地，所述遥控终端包括：

接收单元，用于接收用户输入的开始录制指令或停止录制指令，并将接收到的所述开始录制指令或所述停止录制指令发送至：

录音单元，用于在接收到所述开始录制指令后，检测用户语音遥控指令并对检测到的语音遥控指令进行录制，所述录音单元还用于在接收到所述停止录制指令后，停止所述录制动作，并保存录制的用户语音遥控指令；

处理单元，用于对所述语音遥控指令进行模数转换处理，得到第一音频数据；

发送单元，用于发送所述第一音频数据至所述受控装置。

此外，为实现上述目的，本申请还提供一种受控装置，所述受控装置包括：

接收模块，用于接收遥控终端发送的第一音频数据，所述第一音频数据由所述遥控终端根据获取到的用户语音遥控指令处理得到；

处理模块，用于根据预设规则对所述第一音频数据进行处理，得到第二音频数据；

上传模块，用于发送所述第二音频数据至云服务器；

执行模块，用于接收所述云服务器下发的控制命令文本，解析所述控制命令文本得到控制命令，执行所述控制命令；所述控制命令文本由所述云服务器根据所述第二音频数据处理得到。

此外，为实现上述目的，本申请还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有语音遥控计算机可读指令，所述语音遥控计算机可读指令被处理器执行时实现如下步骤：

发送所述第二音频数据至云服务器；

本申请接收遥控终端发送的第一音频数据，所述第一音频数据由所述遥控终端根据获取到的用户语音遥控指令处理得到；根据预设规则对所述第一音频数据进行处理，得到第二音频数据；发送所述第二音频数据至云服务器；

接收所述云服务器下发的控制命令文本，解析所述控制命令文本得到控制命令，执行所述控制命令；所述控制命令文本由所述云服务器根据所述第二音频数据处理得到；由此，有效解决了用户使用传统机械遥控器时，需要多次点击遥控器来打开多级菜单，在节目列表中一个个查找要观看的节目或是查找需要调节参数的按钮，查找操作繁琐，调节响应也不能满足实时响应的要求的问题，采用本申请语音遥控方法，受控装置基于用户的语音遥控指令直接执行操作，从而大大提升了用户的操作便捷性，满足调节操作的实时响应需求。

附图说明

图1是本申请实施例方案涉及的硬件运行环境的结构示意图；

图2为本申请语音遥控方法第一实施例的流程示意图；

图3为本申请语音遥控方法第二实施例的流程示意图；

图4为本申请语音遥控方法第三实施例的流程示意图；

图5为本申请语音遥控方法第四实施例的流程示意图；

图6为本申请语音遥控方法第五实施例的流程示意图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

如图1所示，图1是本申请实施例方案涉及的硬件运行环境的结构示意图。

需要说明的是，图1即可为语音遥控设备的硬件运行环境的结构示意图。本申请实施例语音遥控设备可以是PC，便携计算机等终端设备。

如图1所示，该语音遥控设备可以包括：处理器1001，例如CPU，网络接口1004，用户接口1003，存储器1005，通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏（Display）、输入单元比如键盘（Keyboard），可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口（如WI-FI接口）。存储器1005可以是高速RAM存储器，也可以是稳定的存储器（non-volatile memory），例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解，图1中示出的语音遥控设备结构并不构成对语音遥控设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及语音遥控程序。其中，操作系统是管理和控制语音遥控设备硬件和软件资源的程序，支持语音遥控程序以及其它软件或程序的运行。

在图1所示的语音遥控设备中，用户接口1003主要用于与各个终端进行数据通信；网络接口1004主要用于连接后台服务器，与后台服务器进行数据通信；而处理器1001可以用于调用存储器1005中存储的语音遥控程序，并执行以下操作：

发送所述第二音频数据至云服务器；

基于上述的结构，提出本申请语音遥控方法的各个实施例。

参照图2，图2为本申请语音遥控方法第一实施例的流程示意图。

本申请实施例提供的语音遥控方法的实施例，需要说明的是，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

本申请实施例语音遥控方法应用于受控装置，本申请实施例受控装置可以是智能电视、数字电视的机顶盒等终端设备，在此不做具体限制。

本实施例语音遥控方法包括：

步骤S100，接收遥控终端发送的第一音频数据；其中，所述第一音频数据由所述遥控终端根据获取到的用户语音遥控指令处理得到；

目前，大多数消费电子设备在使用时，是由用户通过机械遥控器进行控制的，如用户在观看电视时，需要手动操作遥控器进行搜台、音量调节、节目切换、信号源切换、打开/关闭应用、开关机、电视图像/声音参数调节等；但是，用户往往需要多次点击遥控器来打开多级菜单，在节目列表中一个个查找要观看的节目或是查找需要调节参数的按钮，查找操作十分繁琐，给用户的使用带来较大不便，调节响应也不能满足实时响应的要求。

本实施例中，作为一种实施方式，遥控终端内置麦克风输入模块，麦克风输入模块获取到用户语音遥控指令后，通过遥控终端内置的MCU（Microcontroller Uni，微控制单元）对获取到的用户语音遥控指令进行处理，该语音遥控指令为模拟信号，处理操作可以是识别关键字，提取语音指令主干，对提取到的语音指令主干进行采样、PDM（Pulse Density Modulation；脉冲密度调制）调制、MCU编码等，由此将模拟化的语音遥控指令转换为数字信号形成DMA（Direct Memory Access，直接内存存取）数据，即得到第一音频数据，并将得到的第一音频数据发送至受控装置。

本实施例受控装置接收遥控终端发送的第一音频数据，作为一种实施方式，遥控终端与受控装置建立无线连接，如蓝牙连接，基于双方建立的无线连接，遥控终端传输第一音频数据至受控装置。

步骤S200，根据预设规则对所述第一音频数据进行处理，得到第二音频数据；

具体地，受控装置接收到遥控终端发送的第一音频数据后，对第一音频数据进行处理，作为一种实施方式，可以是对第一音频数据通过Alsa（Advanced Linux Sound Architecture，高级Linux声音架构）降噪生成PCM文件，再将生成的PCM文件即所述第二音频数据上传至云服务器，所述第二音频数据为处理后的录音文件流。

步骤S300，发送所述第二音频数据至云服务器；

本实施例中，作为一种实施方式，采用websocket机制实现第二音频数据的上传，受控装置通过创建Socket连接套接字向云服务器发出传输文件请求，云服务器接收到受控装置处理后的录音文件流即所述第二音频数据后，由文本识别引擎服务器识别所述第二音频数据，根据识别结果生成文本识别流即控制命令文本，并将生成的识别命令文本发送至受控装置。

需要说明的是，本实施例采用的websocket机制，可以避免受控装置通过HTTP请求向云端发送数据时，由于HTTP客户端需要和服务器端同步即等待，而造成的网络开销较大，受控装置的数据传输会面临很多问题，比如在网络不稳定的情况下，如果保证数据的传输没有问题，如何保证数据不被重复发送，连接断开后如何进行重连等问题，本实施例受控装置及云服务器基于websocket机制建立连接，很好的避免了上述HTTP传输下存在的问题。

步骤S400，接收所述云服务器下发的控制命令文本，解析所述控制命令文本得到控制命令，执行所述控制命令；其中，所述控制命令文本由所述云服务器根据所述第二音频数据处理得到。

进一步地，受控装置接收到云服务器端的控制命令文本后，解析控制命令文本得到控制指令，并执行控制指令，以受控装置是智能电视为例，如得到的控制指令为调节音量的command解析结果，受控装置接收到该command文本后调用TV系统API执行调节音量的操作，类似还有开关机Power On/Off，静音Mute, 切台Change channel，打开应用Open YouTube等。

本实施例中，由于控制命令文本包含字符串和数值，本实施例控制命令文本采用JSON(JavaScript Object Notation, JS 对象简谱) 格式表达，可以理解的是，在其它实施例中，控制命令文本还可以是其它的表达形式，在此不做具体限制。

本申请通过接收遥控终端发送的第一音频数据，所述第一音频数据由所述遥控终端根据获取到的用户语音遥控指令处理得到；根据预设规则对所述第一音频数据进行处理，得到第二音频数据；发送所述第二音频数据至云服务器；接收所述云服务器下发的控制命令文本，解析所述控制命令文本得到控制命令，执行所述控制命令；所述控制命令文本由所述云服务器根据所述第二音频数据处理得到；由此，通过遥控终端对用户语音遥控指令进行采样编码，或者以其它数据处理方法进行数字化处理形成DMA数据即第一音频数据，再将第一音频数据通过建立的无线连接传输到受控装置，受控装置对第一音频数据进行再次处理，如通过Alsa降噪处理生成pcm文件即第二音频数据，受控装置再将第二音频数据通过websocket机制上传到云端服务器，由云端服务器对第二音频数据进行文本识别，将识别得到的控制命令文本发送给控制装置，控制命令文本可以是JSON格式，最后受控装置对接收到的JSON文本进行解析并执行对应的动作，有效解决了用户使用传统机械遥控器时，需要多次点击遥控器来打开多级菜单，在节目列表中一个个查找要观看的节目或是查找需要调节参数的按钮，查找操作十分繁琐，调节响应也不能满足实时响应的要求的问题，采用本申请语音遥控方法，受控装置基于用户的语音遥控指令直接执行操作，从而大大提升了用户的操作便捷性，尤其是老年用户和行动不便用户的操作便捷性，也满足调节操作的实时响应需求。

进一步地，提出本申请语音遥控方法第二实施例。

参照图3，图3为本申请语音遥控方法第二实施例的流程示意图，基于上述语音遥控方法第一实施例，本实施例中，步骤S300，发送所述第二音频数据至云服务器的步骤之前还包括：

步骤S201，创建Socket连接并向云服务器发送连接请求；

步骤S202，接收所述云服务器针对所述连接请求的响应，与所述云服务器建立Socket连接。

基于HTTP协议的数据发送，其缺陷是HTTP客户端需要和服务器端同步即等待，这对设备来说需要的网络开销较大，智能设备的数据传输会面临很多问题，比如在网络不稳定的情况下，如果保证数据的传输没有问题，如何保证数据不被重复发送，连接断开后如何进行重连，HTTP无法解决这类问题。

本实施例中，采用websocket机制实现录音文件即第二音频数据的上传，受控装置通过创建Socket连接套接字向云服务器发出传输文件请求，云服务器接收录音文件并识别成文本，其具体过程为，受控装置创建Socket连接向云服务器发送请求，云服务器建立服务端Socket监听请求，受控装置与云服务器连接建立；受控装置发送录音文件流即第二音频数据至云服务器，云服务器接收到录音文件流后，由文本识别引擎服务器将录音文件流识别成文本，形成文本识别流即控制命令文本，云服务器发送文本识别流至受控装置，受控装置接收所述云服务器下发的控制命令文本，解析所述控制命令文本得到控制命令，执行所述控制命令，Socket连接关闭释放资源。

本实施例采用websocket机制，可以避免受控装置通过HTTP请求向云端发送数据时，由于HTTP客户端需要和服务器端同步即等待，而造成的网络开销较大，受控装置的数据传输会面临很多问题，比如在网络不稳定的情况下，如果保证数据的传输没有问题，如何保证数据不被重复发送，连接断开后如何进行重连等问题，本实施例受控装置及云服务器基于websocket机制建立连接，很好的避免了上述HTTP传输下存在的问题。

进一步地，提出本申请语音遥控方法第三实施例。

参照图4，图4为本申请语音遥控方法第三实施例的流程示意图，基于上述语音遥控方法第二实施例，本实施例中，步骤S200，根据预设规则对所述第一音频数据进行处理，得到第二音频数据的步骤包括：

步骤S210，获取预设的音频优化标准；

步骤S220，基于获取到的音频优化标准对所述第一音频数据进行优化，将优化后的第一音频数据作为第二音频数据。

本实施例中，受控装置接收到遥控终端发送的DMA数据即第一音频数据后，受控装置的主芯片端对第一音频数据进行处理，作为一种实施方式，遥控终端内置的麦克风输入模块采集用户语音遥控指令的同时，一并采集当前场景的环境噪音参数，即第一音频数据中包括数字化的用户语音遥控指令及当前场景的环境噪音参数，受控装置接收到第一音频数据后，根据第一音频数据中包括的当前环境的环境噪音参数调取预置的与所述环境噪音参数匹配的反相噪音信号，对当前环境的环境噪音参数进行抵消，实现第一音频数据的降噪处理，将降噪后的第一音频数据作为第二音频数据上传至云服务器；可以理解的是，在其它实施例中，音频优化标准可以具有其它的实施方式，不局限于本实施例所述的实现方式。

本实施例通过接收遥控终端发送的第一音频数据，获取预设的音频优化标准，基于获取到的音频优化标准对所述第一音频数据进行优化，将优化后的第一音频数据作为第二音频数据，创建Socket连接并向云服务器发送连接请求，接收所述云服务器针对所述连接请求的响应，与所述云服务器建立Socket连接，发送所述第二音频数据至云服务器，接收所述云服务器下发的控制命令文本，解析所述控制命令文本得到控制命令，执行所述控制命令；由此，在提升用户操作便捷性、满足调节操作的实时响应需求的同时，提升了语音控制命令识别的准确性，确保语音控制的有效性。

进一步地，提出本申请语音遥控方法第四实施例。

参照图5，图5为本申请语音遥控方法第四实施例的流程示意图，基于上述语音遥控方法第三实施例，本实施例中，步骤S100，接收遥控终端发送的第一音频数据的步骤之前还包括：

步骤S101，检测是否接收到预设的写入指令；

若是，则进入步骤S100，接收遥控终端发送的第一音频数据。

进一步地，本实施例中，步骤S300，发送所述第二音频数据至云服务器的步骤之前还包括：

步骤S301，检测是否接收到预设的读取指令；

若是，则进入步骤S300，发送所述第二音频数据至云服务器。

本实施例中，受控装置采用Alsa（Advanced Linux Sound Architecture，高级Linux声音架构）音频驱动，Alsa支持蓝牙声音设备，Alsa的读取和写入操作由用户设置函数调用写入和读取指令去触发，本实施例受控装置检测到收到预设的写入指令后，接收遥控终端发送的第一音频数据；检测到收到预设的读取指令后，发送所述第二音频数据至云服务器。

进一步地，提出本申请语音遥控方法第五实施例。

参照图6，图6为本申请语音遥控方法第五实施例的流程示意图，基于上述语音遥控方法第一实施例，本实施例中，步骤S100，接收遥控终端发送的第一音频数据的步骤包括：

步骤S110，响应于遥控终端发送的蓝牙配对请求，与所述遥控终端建立蓝牙连接；

步骤S120，基于所述蓝牙连接，接收所述遥控终端发送的第一音频数据。

本实施例中，作为一种实施方式，遥控终端内置第一蓝牙模块，受控装置内置第二蓝牙模块，第一蓝牙模块通过搜索、扫描、配对与第二蓝牙模块建立无线连接，基于建立的蓝牙连接，遥控终端将原始音频数据队列蓝牙传输至受控装置，即遥控终端发送第一音频数据至所述受控装置。

需要说明的是，在其它实施例中，遥控终端与受控装置之间的无线连接不限于蓝牙连接，还可以是其它的无线连接方式，本实施例不做具体限制。

此外，本申请实施例还提出一种语音遥控系统，所述语音遥控系统包括遥控终端、受控装置及云服务器；

优选地，所述遥控终端包括：

发送单元，用于发送所述第一音频数据至所述受控装置。

本实施例中，作为一种实施方式，遥控终端具有一个实体语音键或触控语音键来触发用户语音遥控指令的捕捉，用户需要录制语音遥控指令时，按下语音键开始录制，释放该语音键停止录制，从而只采集相关数据，避免了遥控终端持持续监听环境语音命令带来的不必要的识别压力和传输带宽压力，提升了语音遥控指令控制的准确性。

本实施例提出的语音遥控系统各个组件运行时实现如上所述的语音遥控方法的步骤，在此不再赘述。

此外，本申请实施例还提出一种受控装置，所述受控装置包括：

上传模块，用于发送所述第二音频数据至云服务器；

优选地，所述装置还包括：

创建模块，用于创建Socket连接并向云服务器发送连接请求；

连接模块，用于接收所述云服务器针对所述连接请求的响应，与所述云服务器建立Socket连接。

优选地，所述处理模块包括：

获取单元，用于获取预设的音频优化标准；

优化单元，用于基于获取到的音频优化标准对所述第一音频数据进行优化，将优化后的第一音频数据作为第二音频数据。

优选地，所述装置还包括：

第一检测模块，用于检测是否接收到预设的写入指令；

所述接收模块，还用于在所述第一检测模块的检测结果为“是”时，接收遥控终端发送的第一音频数据。

优选地，所述装置还包括：

第二检测模块，用于检测是否接收到预设的读取指令；

所述上传模块，还用于在所述第二检测模块的检测结果为“是”时，发送所述第二音频数据至云服务器。

优选地，所述接收模块包括：

配对单元，用于响应于遥控终端发送的蓝牙配对请求，与所述遥控终端建立蓝牙连接；

音频获取单元，用于基于所述蓝牙连接，接收所述遥控终端发送的第一音频数据。

本实施例提出的语音遥控装置各个模块运行时实现如上所述的语音遥控方法的步骤，在此不再赘述。

此外，本申请实施例还提出一种计算机可读存储介质，所述计算机可读存储介质可以为非易失性可读存储介质，所述存储介质上存储有语音遥控计算机可读指令，所述语音遥控计算机可读指令被处理器执行时实现如下步骤：

发送所述第二音频数据至云服务器；

进一步地，所述发送所述第二音频数据至云服务器的步骤之前，所述语音遥控计算机可读指令被处理器执行时实现如下步骤：

创建Socket连接并向云服务器发送连接请求；接收所述云服务器针对所述连接请求的响应，与所述云服务器建立Socket连接。

进一步地，所述根据预设规则对所述第一音频数据进行处理，得到第二音频数据的步骤包括：

获取预设的音频优化标准；

进一步地，所述接收遥控终端发送的第一音频数据的步骤之前，所述语音遥控计算机可读指令被处理器执行时实现如下步骤：

检测是否接收到预设的写入指令；

若是，则进入步骤：接收遥控终端发送的第一音频数据。

检测是否接收到预设的读取指令；

若是，则进入步骤：发送所述第二音频数据至云服务器。

进一步地，所述接收遥控终端发送的第一音频数据的步骤包括：

其中，在所述处理器上运行的语音遥控计算机可读指令被执行时所实现的方法可参照本申请语音遥控方法各个实施例，此处不再赘述。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质（如ROM/RAM、磁碟、光盘）中，包括若干指令用以使得一台终端设备（可以是手机，计算机，服务器，空调器，或者网络设备等）执行本申请各个实施例所述的方法。

以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

一种语音遥控方法，其中，应用于受控装置，所述语音遥控方法包括以下步骤：

接收遥控终端发送的第一音频数据，所述第一音频数据由所述遥控终端根据获取到的用户语音遥控指令处理得到；

根据预设规则对所述第一音频数据进行处理，得到第二音频数据；

发送所述第二音频数据至云服务器；

接收所述云服务器下发的控制命令文本，解析所述控制命令文本得到控制命令，执行所述控制命令；所述控制命令文本由所述云服务器根据所述第二音频数据处理得到。
如权利要求1所述的语音遥控方法，其中，所述发送所述第二音频数据至云服务器的步骤之前还包括：

创建Socket连接并向云服务器发送连接请求；

接收所述云服务器针对所述连接请求的响应，与所述云服务器建立Socket连接。
如权利要求2所述的语音遥控方法，其中，所述根据预设规则对所述第一音频数据进行处理，得到第二音频数据的步骤包括：

获取预设的音频优化标准；

基于获取到的音频优化标准对所述第一音频数据进行优化，将优化后的第一音频数据作为第二音频数据。
如权利要求1所述的语音遥控方法，其中，所述接收遥控终端发送的第一音频数据的步骤之前还包括：

检测是否接收到预设的写入指令；

若是，则进入步骤：接收遥控终端发送的第一音频数据。
如权利要求4所述的语音遥控方法，其特征在于，所述发送所述第二音频数据至云服务器的步骤之前还包括：

检测是否接收到预设的读取指令；

若是，则进入步骤：发送所述第二音频数据至云服务器。
如权利要求1所述的语音遥控方法，其中，所述接收遥控终端发送的第一音频数据的步骤包括：

响应于遥控终端发送的蓝牙配对请求，与所述遥控终端建立蓝牙连接；

基于所述蓝牙连接，接收所述遥控终端发送的第一音频数据。
一种语音遥控系统，其中，所述语音遥控系统包括遥控终端、受控装置及云服务器；

所述遥控终端，用于基于预设条件，获取用户语音遥控指令，还用于对所述语音遥控指令进行模数转换处理，得到第一音频数据，并发送所述第一音频数据至所述受控装置；

所述受控装置，用于在接收到所述遥控终端发送的所述第一音频数据后，根据预设规则对所述第一音频数据进行处理，得到第二音频数据，并发送所述第二音频数据至所述云服务器；

所述云服务器，用于在接收到所述第二音频数据后，根据预设的识别规则，识别所述第二音频数据并生成控制命令文本，发送所述控制命令文本至所述受控装置；

所述受控装置，还用于接收所述云服务器下发的所述控制命令文本，解析所述控制命令文本得到控制命令，执行所述控制命令。
如权利要求7所述的语音遥控系统，其中，所述遥控终端包括：

接收单元，用于接收用户输入的开始录制指令或停止录制指令，并将接收到的所述开始录制指令或所述停止录制指令发送至：

录音单元，用于在接收到所述开始录制指令后，检测用户语音遥控指令并对检测到的语音遥控指令进行录制，所述录音单元还用于在接收到所述停止录制指令后，停止所述录制动作，并保存录制的用户语音遥控指令；

处理单元，用于对所述语音遥控指令进行模数转换处理，得到第一音频数据；

发送单元，用于发送所述第一音频数据至所述受控装置。
一种受控装置，其中，所述受控装置包括：

接收模块，用于接收遥控终端发送的第一音频数据，所述第一音频数据由所述遥控终端根据获取到的用户语音遥控指令处理得到；

处理模块，用于根据预设规则对所述第一音频数据进行处理，得到第二音频数据；

上传模块，用于发送所述第二音频数据至云服务器；

执行模块，用于接收所述云服务器下发的控制命令文本，解析所述控制命令文本得到控制命令，执行所述控制命令；所述控制命令文本由所述云服务器根据所述第二音频数据处理得到。
如权利要求9所述的受控装置，其中，所述装置还包括：

创建模块，用于创建Socket连接并向云服务器发送连接请求；

连接模块，用于接收所述云服务器针对所述连接请求的响应，与所述云服务器建立Socket连接。
如权利要求10所述的受控装置，其中，所述处理模块包括：

获取单元，用于获取预设的音频优化标准；

优化单元，用于基于获取到的音频优化标准对所述第一音频数据进行优化，将优化后的第一音频数据作为第二音频数据。
如权利要求9所述的受控装置，其中，所述装置还包括：

第一检测模块，用于检测是否接收到预设的写入指令；

所述接收模块，还用于在所述第一检测模块的检测结果为“是”时，接收遥控终端发送的第一音频数据。
如权利要求12所述的受控装置，其中，所述装置还包括：

第二检测模块，用于检测是否接收到预设的读取指令；

所述上传模块，还用于在所述第二检测模块的检测结果为“是”时，发送所述第二音频数据至云服务器。
如权利要求9所述的受控装置，其中，所述接收模块包括：

配对单元，用于响应于遥控终端发送的蓝牙配对请求，与所述遥控终端建立蓝牙连接；

音频获取单元，用于基于所述蓝牙连接，接收所述遥控终端发送的第一音频数据。
一种计算机可读存储介质，其中，所述计算机可读存储介质上存储有语音遥控计算机可读指令，所述语音遥控计算机可读指令被处理器执行时实现如下步骤：

接收遥控终端发送的第一音频数据，所述第一音频数据由所述遥控终端根据获取到的用户语音遥控指令处理得到；

根据预设规则对所述第一音频数据进行处理，得到第二音频数据；

发送所述第二音频数据至云服务器；

接收所述云服务器下发的控制命令文本，解析所述控制命令文本得到控制命令，执行所述控制命令；所述控制命令文本由所述云服务器根据所述第二音频数据处理得到。