CN114387966A - 智能设备的控制方法、装置、电子设备及存储介质 - Google Patents

智能设备的控制方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN114387966A
CN114387966A CN202111592203.0A CN202111592203A CN114387966A CN 114387966 A CN114387966 A CN 114387966A CN 202111592203 A CN202111592203 A CN 202111592203A CN 114387966 A CN114387966 A CN 114387966A
Authority
CN
China
Prior art keywords
intelligent
equipment
controlled
control
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111592203.0A
Other languages
English (en)
Inventor
王子
刘健军
李保水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Gree Electric Appliances Inc of Zhuhai
Original Assignee
Gree Electric Appliances Inc of Zhuhai
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gree Electric Appliances Inc of Zhuhai filed Critical Gree Electric Appliances Inc of Zhuhai
Priority to CN202111592203.0A priority Critical patent/CN114387966A/zh
Publication of CN114387966A publication Critical patent/CN114387966A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Abstract

本发明实施例提供了一种智能设备的控制方法、装置、电子设备及存储介质,所述方法包括:检测所述中控设备与服务器之间的通信链路,以及获取当前场景的语音数据;若所述中控设备与所述服务器之间的所述通信链路异常,则从所述中控设备本地查找所述当前场景的离线语音识别引擎;利用所述离线语音识别引擎对所述语音数据进行语音识别,以确定待控制的智能设备和控制意图;查找与所述控制意图对应的所述待控制的智能设备的控制指令,利用所述控制指令控制所述待控制的智能设备。如此基于本地语音识别实现网络差或者网络不稳定的情况下智能设备的控制。

Description

智能设备的控制方法、装置、电子设备及存储介质
技术领域
本发明实施例涉及语音识别技术领域,尤其涉及一种智能设备的控制方法、装置、电子设备及存储介质。
背景技术
目前智能家居的生态环境,多采用一个中控设备以及多个智能设备(例如空调、风扇等智能设备)的方式,可以通过中控设备控制多个智能设备。其中,至少需要保证中控设备连接服务器。
相关技术中,当用户语音控制智能设备(例如空调、风扇等智能设备)时,可以通过中控设备将采集的语音数据发送至服务器,由服务器生成相应的控制指令,进而语音控制智能设备(例如空调、风扇等智能设备)。
然而,在复杂的网络环境中,有可能出现网络差或者网络不稳定的情况,导致中控设备和服务器断开连接或者连接不稳定,或者智能设备和服务器断开连接或者连接不稳定,从而无法实现智能设备的控制。
发明内容
为了解决上述在复杂的网络环境中,有可能出现网络差或者网络不稳定的情况,导致中控设备和服务器断开连接或者连接不稳定,或者智能设备和服务器断开连接或者连接不稳定,从而无法实现智能设备的控制的技术问题,本发明实施例提供了一种智能设备的控制方法、装置、电子设备及存储介质。
在本发明实施例的第一方面,首先提供了一种智能设备的控制方法,应用于中控设备,所述方法包括:
检测所述中控设备与服务器之间的通信链路,以及获取当前场景的语音数据;
若所述中控设备与所述服务器之间的所述通信链路异常,则从所述中控设备本地查找所述当前场景的离线语音识别引擎;
利用所述离线语音识别引擎对所述语音数据进行语音识别,以确定待控制的智能设备和控制意图;
查找与所述控制意图对应的所述待控制的智能设备的控制指令,利用所述控制指令控制所述待控制的智能设备。
在一个可选的实施方式中,在执行所述方法之前,还包括:
接收服务器推送的离线语音识别引擎、控制指令集以及设备信息集,所述控制指令集中包括至少一个控制指令,所述设备信息集中包括至少一条设备信息;
其中,由所述服务器根据预设设备列表中的设备类型,确定所述设备类型的智能设备的控制指令,组成所述控制指令集,根据所述预设设备列表中的设备信息,组成所述设备信息集;
由所述服务器根据控制智能设备的第一语音数据、所述第一语音数据对应的标签文本,智能设备标识的第二语音数据、所述第二语音数据对应的标签文本,对离线语音识别初始引擎进行训练得到离线语音识别引擎。
在一个可选的实施方式中,所述查找与所述控制意图对应的所述待控制的智能设备的控制指令,包括:
确定所述待控制的智能设备的设备类型,从所述控制指令集中查找与所述控制意图对应的所述设备类型的控制指令;
所述设备信息包括MAC地址,所述利用所述控制指令控制所述待控制的智能设备,包括:
从所述设备信息集中查找所述待控制的智能设备的所述MAC地址,根据所述MAC地址,建立所述中控设备与所述待控制的智能设备的通信链路;
将所述控制指令发送至所述待控制的智能设备,以使所述待控制的智能设备执行所述控制指令对应的操作。
在一个可选的实施方式中,所述方法还包括:
若利用所述离线语音识别引擎对所述语音数据进行语音识别失败,则确定无法识别智能设备,并向终端发送语音识别失败的消息,其中,无法识别的智能终端包括当前场景新增的智能设备;以及,
以使所述终端将无法识别的智能终端添加至服务器中的预设设备列表,并由所述终端通知所述服务器更新离线语音识别引擎、控制指令集以及设备信息集,推送至所述中控设备。
在一个可选的实施方式中,所述方法还包括:
若所述中控设备与所述服务器之间的所述通信链路正常,将所述语音数据发送至所述服务器,以使所述服务器执行以下步骤:
从所述服务器本地查找所述当前场景的线上语音识别引擎,其中,所述线上语音识别引擎与所述离线语音识别引擎一致或不同;
利用所述线上语音识别引擎对所述语音数据进行语音识别,以确定待控制的智能设备和控制意图;
查找与所述控制意图对应的所述待控制的智能设备的控制指令,利用所述控制指令控制所述待控制的智能设备。
在一个可选的实施方式中,所述从所述服务器本地查找所述当前场景的线上语音识别引擎,包括:
获取所述中控设备的位置信息,根据所述位置信息确定所述当前场景,从所述服务器本地查找所述当前场景的线上语音识别引擎。
在一个可选的实施方式中,所述查找与所述控制意图对应的所述待控制的智能设备的控制指令,包括:
确定所述待控制的智能设备的设备类型,从控制指令集中查找与所述控制意图对应的所述设备类型的控制指令;
所述利用所述控制指令控制所述待控制的智能设备,包括:
从设备信息集中查找所述待控制的智能设备的MAC地址,根据所述MAC地址,建立所述服务器与所述待控制的智能设备的通信链路;
将所述控制指令发送至所述待控制的智能设备,以使所述待控制的智能设备执行所述控制指令对应的操作。
在一个可选的实施方式中,所述从所述中控设备本地查找所述当前场景的离线语音识别引擎,包括:
获取预设语音数据集,将所述语音数据与目标语音数据进行匹配,其中,所述目标语音数据包括预设语音数据集中的任一语音数据;
若所述语音数据与所述目标语音数据匹配,则查找所述目标语音数据对应的目标对象;
从所述中控设备本地查找所述当前场景的所述目标对象对应的离线语音识别引擎。
在一个可选的实施方式中,所述方法还包括:
若所述语音数据与所述目标语音数据未匹配,从所述中控设备本地查找所述当前场景的标准离线语音识别引擎;
利用所述标准离线语音识别引擎对所述语音数据进行语音识别,以确定待控制的智能设备和控制意图;
查找与所述控制意图对应的所述待控制的智能设备的控制指令,利用所述控制指令控制所述待控制的智能设备。
在本发明实施例的第二方面,提供了一种智能设备的控制装置,应用于中控设备,所述装置包括:
数据获取模块,用于检测所述中控设备与服务器之间的通信链路,以及获取当前场景的语音数据;
引擎查找模块,用于若所述中控设备与所述服务器之间的所述通信链路异常,则从所述中控设备本地查找所述当前场景的离线语音识别引擎;
语音识别模块,用于利用所述离线语音识别引擎对所述语音数据进行语音识别,以确定待控制的智能设备和控制意图;
设备控制模块,用于查找与所述控制意图对应的所述待控制的智能设备的控制指令,利用所述控制指令控制所述待控制的智能设备。
在本发明实施例的第三方面,还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述第一方面中所述的智能设备的控制方法。
在本发明实施例的第四方面,还提供了一种存储介质,所述存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述第一方面中所述的智能设备的控制方法。
在本发明实施例的第五方面,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述第一方面中所述的智能设备的控制方法。
本发明实施例提供的技术方案,检测中控设备与服务器之间的通信链路,以及获取当前场景的语音数据,若中控设备与服务器之间的通信链路异常,则从中控设备本地查找当前场景的离线语音识别引擎,利用离线语音识别引擎对语音数据进行语音识别,以确定待控制的智能设备和控制意图,查找与控制意图对应的待控制的智能设备的控制指令,利用控制指令控制待控制的智能设备。通过检测中控设备与服务器之间的通信链路,若中控设备与服务器之间的通信链路异常,则从中控设备本地查找当前场景的离线语音识别引擎,利用离线语音识别引擎对语音数据进行语音识别,以确定待控制的智能设备和控制意图,查找与控制意图对应的待控制的智能设备的控制指令,利用控制指令控制待控制的智能设备,如此基于本地语音识别实现网络差或者网络不稳定的情况下智能设备的控制。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中示出的一种智能设备的控制系统的架构示意图;
图2为本发明实施例中示出的一种智能设备的控制方法的实施流程示意图;
图3为本发明实施例中示出的另一种智能设备的控制方法的实施流程示意图;
图4为本发明实施例中示出的另一种智能设备的控制方法的实施流程示意图;
图5为本发明实施例中示出的另一种智能设备的控制方法的实施流程示意图
图6为本发明实施例中示出的一种智能设备的控制装置的结构示意图;
图7为本发明实施例中示出的一种电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
如图1所示,为本发明实施例提供的一种智能设备的控制系统的架构示意图,该系统中包括终端、服务器、中控设备以及多个智能设备,其中终端与服务器连接,服务器与中控设备连接,服务器与多个智能设备连接,中控设备与多个智能设备连接。这里终端可以与中控设备进行连接,图1未示出。
基于如图1所示的智能设备的控制系统,如图2所示,为本发明实施例提供的一种智能设备的控制方法的实施流程示意图,该方法应用于中控设备,具体可以包括以下步骤:
S201,检测所述中控设备与服务器之间的通信链路,以及获取当前场景的语音数据。
在本发明实施例中,对于中控设备,检测中控设备与服务器之间的通信链路,以便于确定中控设备与服务器之间的通信质量,从而根据通信质量选择相应的智能设备的控制方式,即基于本地语音识别的智能设备控制或基于服务器语音识别的智能设备控制。
此外,在本发明实施例中,对于中控设备,除了检测中控设备与服务器之间的通信链路之外,还可以获取当前场景的语音数据,这里的语音数据为当前场景内用户发出的语音数据。例如,对于中控设备,一方面检测中控设备与服务器之间的通信链路,另一方面获取当前家庭内的语音数据。
S202,若所述中控设备与所述服务器之间的所述通信链路异常,则从所述中控设备本地查找所述当前场景的离线语音识别引擎。
在本发明实施例中,对于中控设备,如果检测到中控设备与服务器之间的所述通信链路异常,则只能选择基于本地语音识别的智能设备控制,从而从中控设备本地查找当前场景的离线语音识别引擎。
例如,在本发明实施例中,对于中控设备,如果检测到中控设备与服务器之间的所述通信链路异常,则只能选择基于本地语音识别的智能设备控制,从而从中控设备本地查找当前家庭的离线语音识别引擎。
S203,利用所述离线语音识别引擎对所述语音数据进行语音识别,以确定待控制的智能设备和控制意图。
在本发明实施例中,对于中控设备,利用离线语音识别引擎对语音数据进行语音识别,以确定待控制的智能设备和控制意图。其中,利用离线语音识别引擎对语音数据进行语音识别,可以识别出该语音数据对应的文本,根据这个文本可以确定待控制的智能设备和控制意图。
例如,在本发明实施例中,对于中控设备,利用离线语音识别引擎对语音数据进行语音识别,可以识别出该语音数据对应的文本,假设这个文本是“打开小青”,根据这个文本可以确定待控制的智能设备“小青”(这里“小青”是智能设备除湿机的别名),以及控制意图(打开“小青”)。
S204,查找与所述控制意图对应的所述待控制的智能设备的控制指令,利用所述控制指令控制所述待控制的智能设备。
在本发明实施例中,对于不同的智能设备,其控制指令存在差异。因此,对于中控设备,可以查找与控制意图对应的待控制的智能设备的控制指令,利用该控制指令控制待控制的智能设备。其中,对于中控设备,可以将该控制指令发送至待控制的智能设备,如此待控制的智能设备可以接收该控制指令,并依此执行相应的操作。如此基于本地语音识别实现网络差或者网络不稳定的情况下智能设备的控制。
例如,在本发明实施例中,对于不同的智能设备,以控制意图打开智能设备为例,不同的智能设备的打开指令存在差异,即智能设备与打开指令一一对应,如下表1所示。因此对于中控设备,可以查找与控制意图(打开“小青”)对应的待控制的智能设备“小青”(这里“小青”是智能设备除湿机的别名)的打开指令a,将打开指令a发送至待控制的智能设备“小青”,如此待控制的智能设备“小青”可以执行相应的打开操作。
Figure BDA0003430195790000081
表1
通过上述对本发明实施例提供的技术方案的描述,检测中控设备与服务器之间的通信链路,以及获取当前场景的语音数据,若中控设备与服务器之间的通信链路异常,则从中控设备本地查找当前场景的离线语音识别引擎,利用离线语音识别引擎对语音数据进行语音识别,以确定待控制的智能设备和控制意图,查找与控制意图对应的待控制的智能设备的控制指令,利用控制指令控制待控制的智能设备。
通过检测中控设备与服务器之间的通信链路,若中控设备与服务器之间的通信链路异常,则从中控设备本地查找当前场景的离线语音识别引擎,利用离线语音识别引擎对语音数据进行语音识别,以确定待控制的智能设备和控制意图,查找与控制意图对应的待控制的智能设备的控制指令,利用控制指令控制待控制的智能设备,如此基于本地语音识别实现网络差或者网络不稳定的情况下智能设备的控制。
在本发明实施例中,如图1所示,对于终端,可以将多个智能设备进行网络配置。根据实际情况的需要,终端可以查询、增加、删除、修改服务器维护的当前场景的预设设备列表,例如终端可以查询、增加、删除、修改服务器维护的当前家庭的预设设备列表。
查询:从服务器查询维护的当前场景的预设设备列表,并将预设设备列表中内容在终端进行显示,例如从服务器查询维护的当前家庭的预设设备列表,并将预设设备列表中内容在终端进行显示。
增加:向服务器维护的当前场景的预设设备列表中添加新的智能设备名称、设备类型、设备MAC地址等内容,例如向服务器维护的当前家庭的预设设备列表中添加新的智能设备名称、设备类型、设备MAC地址等内容。
删除:向服务器维护的当前场景的预设设备列表中删除指定的智能设备的相关内容,例如,向服务器维护的当前家庭的预设设备列表中删除指定的智能设备的智能设备名称、设备类型、设备MAC地址等相关内容。
修改:向服务器维护的当前场景的预设设备列表中修改指定的智能设备的设备名称,例如,向服务器维护的当前家庭的预设设备列表中修改指定的智能设备的设备名称。
服务器维护的当前场景的预设设备列表中存在内容变化时,根据全新的当前场景的预设设备列表,生成离线语音识别引擎、控制指令集以及设备信息集。
具体的,对于服务器,根据控制智能设备的第一语音数据、第一语音数据对应的标签文本,智能设备标识的第二语音数据、第二语音数据对应的标签文本,对离线语音识别初始引擎进行训练得到离线语音识别引擎。
例如,对于服务器,根据控制智能设备的第一语音数据、第一语音数据对应的标签文本,智能设备名称的第二语音数据、第二语音数据对应的标签文本,对离线语音识别初始引擎进行训练得到离线语音识别引擎。
需要说明的是,这里加入智能设备名称的第二语音数据、第二语音数据对应的标签文本,由此可以生成专属识别特定智能设备语音控制的识别引擎,本发明实施例对此不做限定。
其中,控制智能设备的第一语音数据、第一语音数据对应的标签文本,由预设设备列表中的设备类型(例如电风扇、除湿机等)确定,不同设备类型的智能设备有专属的语音数据以及对应的标签文本。
智能设备名称的第二语音数据、第二语音数据对应的标签文本,由预设设备列表中对应的智能设备名称(例如“小青”,这里是别名)确定(智能设备名称由终端在添加智能设备是自定义)。
需要说明的是,识别引擎的训练过程主要是输入语音数据、输出识别文本及测评分数,通过对比输出的识别文本和对应标签文本的差异,反馈引擎重新优化直到输出的识别文本接近实际的实际语音标签文本。
此外,对于服务器,根据预设设备列表中的设备类型,确定设备类型的智能设备的控制指令,组成控制指令集,不同设备类型的智能设备具有专属的控制指令。根据预设设备列表中的设备信息,组成设备信息集,这里设备信息主要包括MAC地址。
如此,对于服务器,可以得到全新的离线语音识别引擎、控制指令集以及设备信息集,并向中控设备推送离线语音识别引擎、控制指令集以及设备信息集。基于此,如图3所示,为本发明实施例提供的另一种智能设备的控制方法的实施流程示意图,该方法应用于中控设备,具体可以包括以下步骤:
S301,接收服务器推送的离线语音识别引擎、控制指令集以及设备信息集,所述控制指令集中包括至少一个控制指令,所述设备信息集中包括至少一条设备信息。
在本发明实施例中,对于服务器,对离线语音识别引擎、控制指令集以及设备信息集进行更新,得到全新的离线语音识别引擎、控制指令集以及设备信息集之后,向中控设备进行推送。
如此对于中控设备,可以接收服务器推送的离线语音识别引擎、控制指令集以及设备信息集。其中,控制指令集中包括至少一个控制指令,设备信息集中包括至少一条设备信息。
S302,检测所述中控设备与服务器之间的通信链路,以及获取当前场景的语音数据。
在本发明实施例中,本步骤与上述步骤S201类似,本发明实施例在此不再一一赘述。
S303,若所述中控设备与所述服务器之间的所述通信链路异常,则从所述中控设备本地查找所述当前场景的离线语音识别引擎。
在本发明实施例中,本步骤与上述步骤S202类似,本发明实施例在此不再一一赘述。
S304,利用所述离线语音识别引擎对所述语音数据进行语音识别,以确定待控制的智能设备和控制意图。
在本发明实施例中,本步骤与上述步骤S203类似,本发明实施例在此不再一一赘述。
S305,确定所述待控制的智能设备的设备类型,从所述控制指令集中查找与所述控制意图对应的所述设备类型的控制指令。
在本发明实施例中,对于不同设备类型的智能设备,其具有专属的控制指令,因此对于中控设备,可以确定待控制的智能设备的设备类型,从控制指令集中查找与控制意图对应的设备类型的控制指令。
例如,在本发明实施例中,对于中控设备,确定待控制的智能设备的设备类型,例如设备类型是电风扇,则从控制指令集中查找与控制意图对应的设备类型(电风扇)的控制指令。
S306,从所述设备信息集中查找所述待控制的智能设备的所述MAC地址,根据所述MAC地址,建立所述中控设备与所述待控制的智能设备的通信链路。
S307,将所述控制指令发送至所述待控制的智能设备,以使所述待控制的智能设备执行所述控制指令对应的操作。
在本发明实施例中,设备信息这里通常指的是智能设备的MAC地址,对于中控设备,则从设备信息集中查找待控制的智能设备的MAC地址,根据MAC地址,建立中控设备与待控制的智能设备的通信链路,如此在局域网中,实现中控设备与待控制的智能设备之间的通信,便于控制待控制的智能设备。
自此,对于中控设备,可以将控制指令发送至待控制的智能设备,以使待控制的智能设备执行控制指令对应的操作。如此基于本地语音识别实现网络差或者网络不稳定的情况下智能设备的控制。需要说明的是,对于中控设备以及智能设备位于当前场景,例如中控设备以及智能设备位于当前家庭。
此外,在本发明实施例中,如果用户想要语音控制的智能设备为当前场景新增的智能设备,则中控设备本地无法识别该智能设备,无法本地识别相应的语音数据,如此导致语音识别失败。
例如,当前家庭内存在名字为“小明”的电风扇、“小智”的空调,中控设备无法本地识别另一个不在家庭内的“小青”的除湿机,无法本地识别“打开小青”的语音数据,如此导致语音识别失败。
基于此,若利用离线语音识别引擎对语音数据进行语音识别失败,则确定无法识别智能设备,并向终端发送语音识别失败的消息,其中,无法识别的智能终端包括当前场景新增的智能设备。
以及,以使终端将无法识别的智能终端添加至服务器中的预设设备列表,并由终端通知服务器更新离线语音识别引擎、控制指令集以及设备信息集,推送至中控设备。
通过检测中控设备与服务器之间的通信链路,若中控设备与服务器之间的通信链路异常,则从中控设备本地查找当前场景的离线语音识别引擎,利用离线语音识别引擎对语音数据进行语音识别,以确定待控制的智能设备和控制意图,查找与控制意图对应的待控制的智能设备的控制指令,利用控制指令控制待控制的智能设备,如此基于本地语音识别实现网络差或者网络不稳定的情况下智能设备的控制。
如图4所示,为本发明实施例提供的另一种智能设备的控制方法的实施流程示意图,该方法应用于中控设备,具体可以包括以下步骤:
S401,若所述中控设备与所述服务器之间的所述通信链路正常,中控设备将所述语音数据发送至所述服务器。
在本发明实施例中,对于中控设备,如果检测到中控设备与服务器之间的通信链路正常,则可以选择基于服务器语音识别的智能设备控制,从而中控设备将语音数据发送至服务器。
其中,在本发明实施例中,对于中控设备,如果检测到中控设备与服务器之间的通信链路正常,则可以确定当前场景的智能设备的设备数量,如果设备数量超过预设阈值,则将语音数据发送至服务器。
如果设备数量未超过预设阈值,则说明当前场景的智能设备较少,中控设备足可以应对,此时可以选择基于本地语音识别的智能设备控制,如此可以减轻服务器的压力,且不影响智能设备的语音控制。
此外,在本发明实施例中,对于中控设备,如果检测到中控设备与服务器之间的通信链路正常,还可以确定服务器的吞吐量,如果吞吐量较少,则将则将语音数据发送至服务器。
如果吞吐量较大,则说明书服务器处理忙碌状态,属于高负荷运动状态,此时可以选择基于本地语音识别的智能设备控制,如此可以减轻服务器的压力,且不影响智能设备的语音控制。
S402,服务器从所述服务器本地查找所述当前场景的线上语音识别引擎,其中,所述线上语音识别引擎与所述离线语音识别引擎一致或不同。
在本发明实施例中,对于服务器,在接收到语音数据之后,可以从服务器本地查找当前场景的线上语音识别引擎,这里线上语音识别引擎与离线语音识别引擎一致或不同。
其中,在本发明实施例中,对于服务器,可以获取中控设备的位置信息,根据位置信息确定当前场景,从服务器本地查找当前场景的线上语音识别引擎。
例如,在本发明实施例,对于服务器,可以获取中控设备的位置信息,根据位置信息确定当前家庭A,这里家庭与中控设备的位置信息一一对应,从而可以从服务器本地查找当前家庭的线上语音识别引擎。
S403,服务器利用所述线上语音识别引擎对所述语音数据进行语音识别,以确定待控制的智能设备和控制意图。
在本发明实施例中,对于服务器,利用线上语音识别引擎对语音数据进行语音识别,以确定待控制的智能设备和控制意图。其中,利用线上语音识别引擎对语音数据进行语音识别,可以识别出该语音数据对应的文本,根据这个文本可以确定待控制的智能设备和控制意图。
例如,在本发明实施例中,对于服务器,利用线上语音识别引擎对语音数据进行语音识别,可以识别出该语音数据对应的文本,假设这个文本是“打开小青”,根据这个文本可以确定待控制的智能设备“小青”(这里“小青”是智能设备除湿机的别名),以及控制意图(打开“小青”)。
S404,服务器查找与所述控制意图对应的所述待控制的智能设备的控制指令,利用所述控制指令控制所述待控制的智能设备。
在本发明实施例中,对于不同设备类型的智能设备,其具有专属的控制指令,因此对于服务器,可以确定待控制的智能设备的设备类型,从控制指令集中查找与控制意图对应的设备类型的控制指令。
例如,在本发明实施例中,对于服务器,确定待控制的智能设备的设备类型,例如设备类型是电风扇,则从控制指令集中查找与控制意图对应的设备类型(电风扇)的控制指令。
在本发明实施例中,设备信息这里通常指的是MAC地址,对于服务器,则从设备信息集中查找待控制的智能设备的MAC地址,根据MAC地址,建立服务器与待控制的智能设备的通信链路,实现服务器与待控制的智能设备之间的通信。
自此,对于服务器,可以将控制指令发送至待控制的智能设备,以使待控制的智能设备执行控制指令对应的操作。如此基于服务器语音识别的智能设备控制,实现智能设备的语音控制。
此外,在本发明实施例中,如果用户想要语音控制的智能设备为当前场景新增的智能设备,则服务器本地无法识别该智能设备,无法本地识别相应的语音数据。
例如,当前家庭内存在名字为“小明”的电风扇、“小智”的空调,服务器无法本地识别另一个不在家庭内的“小青”的除湿机,无法本地识别“打开小青”的语音数据。
基于此,若利用线上语音识别引擎对语音数据进行语音识别失败,则确定无法识别智能设备,并向终端发送语音识别失败的消息,其中,无法识别的智能终端包括当前场景新增的智能设备。
以及,以使终端将无法识别的智能终端添加至服务器中的预设设备列表,并且服务器在预设设备列表存在内容更新之后,更新离线语音识别引擎、控制指令集以及设备信息集,推送至中控设备。
通过检测中控设备与服务器之间的通信链路,若中控设备与服务器之间的通信链路正常,将语音数据发送至服务器,服务器从服务器本地查找当前场景的线上语音识别引擎,利用线上语音识别引擎对语音数据进行语音识别,以确定待控制的智能设备和控制意图,查找与控制意图对应的待控制的智能设备的控制指令,利用控制指令控制待控制的智能设备,如此基于服务器语音识别实现智能设备的控制。
如图5所示,为本发明实施例提供的另一种智能设备的控制方法的实施流程示意图,该方法应用于中控设备,具体可以包括以下步骤:
S501,检测所述中控设备与服务器之间的通信链路,以及获取当前场景的语音数据。
在本发明实施例中,本步骤与上述步骤S201类似,本发明实施例在此不再一一赘述。
S502,若所述中控设备与所述服务器之间的所述通信链路异常,则获取预设语音数据集,将所述语音数据与目标语音数据进行匹配,其中,所述目标语音数据包括预设语音数据集中的任一语音数据。
在本发明实施例中,对于中控设备,如果检测到中控设备与服务器之间的通信链路异常,则此时可以获取预设语音数据集,将语音数据与目标语音数据进行匹配,其中,目标语音数据包括预设语音数据集中的任一语音数据。
S503,若所述语音数据与所述目标语音数据匹配,则查找所述目标语音数据对应的目标对象。
在本发明实施例中,对于中控设备,如果语音数据与目标语音数据匹配,则查找目标语音数据对应的目标对象。例如,如果语音数据与目标语音数据匹配,则查找目标语音数据对应的用户A。
S504,从所述中控设备本地查找所述当前场景的所述目标对象对应的离线语音识别引擎。
在本发明实施例中,考虑到不同对象的声色不同,则相应的语音数据存在差异,因此对于当前场景的不同对象,例如对于当前家庭的不同用户,分别预先训练得到用户各自对应的离线语音识别引擎,如此可以提高语音识别的成功率。
基于此,在本发明实施例,对于中控设备,可以从中控设备本地查找当前场景的目标对象(即目标用户)对应的离线语音识别引擎。例如,对于中控设备,从中控设备本地查找当前家庭的用户A对应的离线语音识别引擎。
S505,利用所述离线语音识别引擎对所述语音数据进行语音识别,以确定待控制的智能设备和控制意图。
在本发明实施例中,本步骤与上述步骤S203类似,本发明实施例在此不再一一赘述。
S506,查找与所述控制意图对应的所述待控制的智能设备的控制指令,利用所述控制指令控制所述待控制的智能设备。
在本发明实施例中,本步骤与上述步骤S204类似,本发明实施例在此不再一一赘述。
此外,在本发明实施例中,若语音数据与目标语音数据未匹配,从中控设备本地查找当前场景的标准离线语音识别引擎,利用标准离线语音识别引擎对语音数据进行语音识别,以确定待控制的智能设备和控制意图,查找与控制意图对应的待控制的智能设备的控制指令,利用控制指令控制待控制的智能设备。
例如,在本发明实施例中,若语音数据与目标语音数据未匹配,说明发出语音数据的用户为访客,此时可以从中控设备本地查找当前家庭的标准离线语音识别引擎,利用标准离线语音识别引擎对语音数据进行语音识别,以确定待控制的智能设备和控制意图,确定待控制的智能设备的设备类型,查找与控制意图对应的设备类型的控制指令,利用控制指令控制待控制的智能设备。
通过检测中控设备与服务器之间的通信链路,若中控设备与服务器之间的通信链路异常,获取预设语音数据集,将语音数据与目标语音数据进行匹配,若语音数据与目标语音数据匹配,则查找目标语音数据对应的目标对象,从中控设备本地查找当前场景的目标对象对应的离线语音识别引擎,利用离线语音识别引擎对语音数据进行语音识别,以确定待控制的智能设备和控制意图,查找与控制意图对应的待控制的智能设备的控制指令,利用控制指令控制待控制的智能设备。如此不同对象有专属的离线语音识别引擎,从而利用离线语音识别引擎进行语音识别,语音控制智能设备,可以基于本地语音识别实现网络差或者网络不稳定的情况下智能设备的控制。
与上述方法实施例相对应,本发明实施例还提供了一种智能设备的控制装置,如图6所示,该装置可以包括:数据获取模块610、引擎查找模块620、语音识别模块630、设备控制模块640。
数据获取模块610,用于检测所述中控设备与服务器之间的通信链路,以及获取当前场景的语音数据;
引擎查找模块620,用于若所述中控设备与所述服务器之间的所述通信链路异常,则从所述中控设备本地查找所述当前场景的离线语音识别引擎;
语音识别模块630,用于利用所述离线语音识别引擎对所述语音数据进行语音识别,以确定待控制的智能设备和控制意图;
设备控制模块640,用于查找与所述控制意图对应的所述待控制的智能设备的控制指令,利用所述控制指令控制所述待控制的智能设备。
本发明实施例还提供了一种电子设备,如图7所示,包括处理器71、通信接口72、存储器73和通信总线74,其中,处理器71,通信接口72,存储器73通过通信总线74完成相互间的通信,
存储器73,用于存放计算机程序;
处理器71,用于执行存储器73上所存放的程序时,实现如下步骤:
检测所述中控设备与服务器之间的通信链路,以及获取当前场景的语音数据;若所述中控设备与所述服务器之间的所述通信链路异常,则从所述中控设备本地查找所述当前场景的离线语音识别引擎;利用所述离线语音识别引擎对所述语音数据进行语音识别,以确定待控制的智能设备和控制意图;查找与所述控制意图对应的所述待控制的智能设备的控制指令,利用所述控制指令控制所述待控制的智能设备。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种存储介质,该存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的智能设备的控制方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的智能设备的控制方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在存储介质中,或者从一个存储介质向另一个存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (12)

1.一种智能设备的控制方法,其特征在于,应用于中控设备,所述方法包括:
检测所述中控设备与服务器之间的通信链路,以及获取当前场景的语音数据;
若所述中控设备与所述服务器之间的所述通信链路异常,则从所述中控设备本地查找所述当前场景的离线语音识别引擎;
利用所述离线语音识别引擎对所述语音数据进行语音识别,以确定待控制的智能设备和控制意图;
查找与所述控制意图对应的所述待控制的智能设备的控制指令,利用所述控制指令控制所述待控制的智能设备。
2.根据权利要求1所述的方法,其特征在于,在执行所述方法之前,还包括:
接收服务器推送的离线语音识别引擎、控制指令集以及设备信息集,所述控制指令集中包括至少一个控制指令,所述设备信息集中包括至少一条设备信息;
其中,由所述服务器根据预设设备列表中的设备类型,确定所述设备类型的智能设备的控制指令,组成所述控制指令集,根据所述预设设备列表中的设备信息,组成所述设备信息集;
由所述服务器根据控制智能设备的第一语音数据、所述第一语音数据对应的标签文本,智能设备标识的第二语音数据、所述第二语音数据对应的标签文本,对离线语音识别初始引擎进行训练得到离线语音识别引擎。
3.根据权利要求2所述的方法,其特征在于,所述查找与所述控制意图对应的所述待控制的智能设备的控制指令,包括:
确定所述待控制的智能设备的设备类型,从所述控制指令集中查找与所述控制意图对应的所述设备类型的控制指令;
所述设备信息包括MAC地址,所述利用所述控制指令控制所述待控制的智能设备,包括:
从所述设备信息集中查找所述待控制的智能设备的所述MAC地址,根据所述MAC地址,建立所述中控设备与所述待控制的智能设备的通信链路;
将所述控制指令发送至所述待控制的智能设备,以使所述待控制的智能设备执行所述控制指令对应的操作。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若利用所述离线语音识别引擎对所述语音数据进行语音识别失败,则确定无法识别智能设备,并向终端发送语音识别失败的消息,其中,无法识别的智能终端包括当前场景新增的智能设备;以及,
以使所述终端将无法识别的智能终端添加至服务器中的预设设备列表,并由所述终端通知所述服务器更新离线语音识别引擎、控制指令集以及设备信息集,推送至所述中控设备。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若所述中控设备与所述服务器之间的所述通信链路正常,将所述语音数据发送至所述服务器,以使所述服务器执行以下步骤:
从所述服务器本地查找所述当前场景的线上语音识别引擎,其中,所述线上语音识别引擎与所述离线语音识别引擎一致或不同;
利用所述线上语音识别引擎对所述语音数据进行语音识别,以确定待控制的智能设备和控制意图;
查找与所述控制意图对应的所述待控制的智能设备的控制指令,利用所述控制指令控制所述待控制的智能设备。
6.根据权利要求5所述的方法,其特征在于,所述从所述服务器本地查找所述当前场景的线上语音识别引擎,包括:
获取所述中控设备的位置信息,根据所述位置信息确定所述当前场景,从所述服务器本地查找所述当前场景的线上语音识别引擎。
7.根据权利要求5所述的方法,其特征在于,所述查找与所述控制意图对应的所述待控制的智能设备的控制指令,包括:
确定所述待控制的智能设备的设备类型,从控制指令集中查找与所述控制意图对应的所述设备类型的控制指令;
所述利用所述控制指令控制所述待控制的智能设备,包括:
从设备信息集中查找所述待控制的智能设备的MAC地址,根据所述MAC地址,建立所述服务器与所述待控制的智能设备的通信链路;
将所述控制指令发送至所述待控制的智能设备,以使所述待控制的智能设备执行所述控制指令对应的操作。
8.根据权利要求1所述的方法,其特征在于,所述从所述中控设备本地查找所述当前场景的离线语音识别引擎,包括:
获取预设语音数据集,将所述语音数据与目标语音数据进行匹配,其中,所述目标语音数据包括预设语音数据集中的任一语音数据;
若所述语音数据与所述目标语音数据匹配,则查找所述目标语音数据对应的目标对象;
从所述中控设备本地查找所述当前场景的所述目标对象对应的离线语音识别引擎。
9.根据权利要求8所述的方法,其特征在于,所述方法还包括:
若所述语音数据与所述目标语音数据未匹配,从所述中控设备本地查找所述当前场景的标准离线语音识别引擎;
利用所述标准离线语音识别引擎对所述语音数据进行语音识别,以确定待控制的智能设备和控制意图;
查找与所述控制意图对应的所述待控制的智能设备的控制指令,利用所述控制指令控制所述待控制的智能设备。
10.一种智能设备的控制装置,其特征在于,应用于中控设备,所述装置包括:
数据获取模块,用于检测所述中控设备与服务器之间的通信链路,以及获取当前场景的语音数据;
引擎查找模块,用于若所述中控设备与所述服务器之间的所述通信链路异常,则从所述中控设备本地查找所述当前场景的离线语音识别引擎;
语音识别模块,用于利用所述离线语音识别引擎对所述语音数据进行语音识别,以确定待控制的智能设备和控制意图;
设备控制模块,用于查找与所述控制意图对应的所述待控制的智能设备的控制指令,利用所述控制指令控制所述待控制的智能设备。
11.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1至9中任一项所述的方法步骤。
12.一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至9中任一项所述的方法。
CN202111592203.0A 2021-12-23 2021-12-23 智能设备的控制方法、装置、电子设备及存储介质 Pending CN114387966A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111592203.0A CN114387966A (zh) 2021-12-23 2021-12-23 智能设备的控制方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111592203.0A CN114387966A (zh) 2021-12-23 2021-12-23 智能设备的控制方法、装置、电子设备及存储介质

Publications (1)

Publication Number Publication Date
CN114387966A true CN114387966A (zh) 2022-04-22

Family

ID=81198560

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111592203.0A Pending CN114387966A (zh) 2021-12-23 2021-12-23 智能设备的控制方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN114387966A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114882883A (zh) * 2022-05-31 2022-08-09 四川虹美智能科技有限公司 智能设备控制方法、装置及系统
CN115440210A (zh) * 2022-04-27 2022-12-06 北京罗克维尔斯科技有限公司 语音控制方法、装置、设备及介质
CN115472156A (zh) * 2022-09-05 2022-12-13 Oppo广东移动通信有限公司 语音控制方法、装置、存储介质及电子设备

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115440210A (zh) * 2022-04-27 2022-12-06 北京罗克维尔斯科技有限公司 语音控制方法、装置、设备及介质
CN114882883A (zh) * 2022-05-31 2022-08-09 四川虹美智能科技有限公司 智能设备控制方法、装置及系统
CN114882883B (zh) * 2022-05-31 2023-07-25 合肥长虹美菱生活电器有限公司 智能设备控制方法、装置及系统
CN115472156A (zh) * 2022-09-05 2022-12-13 Oppo广东移动通信有限公司 语音控制方法、装置、存储介质及电子设备

Similar Documents

Publication Publication Date Title
CN114387966A (zh) 智能设备的控制方法、装置、电子设备及存储介质
US11417331B2 (en) Method and device for controlling terminal, and computer readable storage medium
US9798533B2 (en) Transferring operating environment of registered network to unregistered network
EP2854378A1 (en) Method, device and network equipment for acquiring feature information
US11310066B2 (en) Method and apparatus for pushing information
CN108428450B (zh) 一种操作指令处理方法及装置
JP6670916B1 (ja) 情報処理装置、情報処理方法
CN107832035B (zh) 一种智能终端的语音输入方法
CN108376129A (zh) 一种纠错方法及装置
US20230114265A1 (en) Method and system for filtering content
CN113364853A (zh) 一种业务服务系统、业务请求方法及网关设备
CN112541787B (zh) 广告推荐方法、系统、存储介质及电子设备
US9424344B2 (en) Method and apparatus for natural language search for variables
CN110334271A (zh) 一种搜索结果优化方法、系统、电子设备及存储介质
US20180137859A1 (en) Method and apparatus for information search using voice recognition
JP6900996B2 (ja) 会話支援装置、会話支援方法、及びプログラム
CN111858966B (zh) 知识图谱的更新方法、装置、终端设备及可读存储介质
CN106776812B (zh) 更新关键字的方法及装置
CN111602412B (zh) 设备选择装置、数据集选择装置、设备选择方法和存储介质
CN109976828B (zh) 一种配置文件的方法及装置
CN113064966B (zh) 用于故障定位的方法、系统及装置
CN113220949B (zh) 一种隐私数据识别系统的构建方法及装置
CN112489644B (zh) 用于电子设备的语音识别方法及装置
EP4053713A1 (en) Question and answer method and apparatus based on knowledge graph
WO2021159668A1 (zh) 机器人对话方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination