CN117334196A

CN117334196A - 控制方法、装置、设备及存储介质

Info

Publication number: CN117334196A
Application number: CN202311403990.9A
Authority: CN
Inventors: 周凌翔; 贾巨涛; 张鹏; 李立辉; 崔为之
Original assignee: Gree Electric Appliances Inc of Zhuhai; Zhuhai Lianyun Technology Co Ltd
Current assignee: Gree Electric Appliances Inc of Zhuhai; Zhuhai Lianyun Technology Co Ltd
Priority date: 2023-10-26
Filing date: 2023-10-26
Publication date: 2024-01-02

Abstract

本申请提供的一种控制方法、装置、设备及存储介质，通过获取用户的意图信息、区域内的设备信息、环境信息和回复语格式；将所述意图信息、所述设备信息、所述环境信息和所述回复语格式输入至大语言模型中确定目标设备的控制指令和回复语格式对应的回复语；基于所述目标设备的控制指令控制对应的目标设备工作，并输出所述回复语，能够帮助用户确定合适的控制指令，且能够实现对设备进行更高效地控制。

Description

控制方法、装置、设备及存储介质

技术领域

本申请涉及设备的控制技术领域，特别地涉及一种控制方法、装置、设备及存储介质。

背景技术

智能家居语音服务总是被诟病不够智能、没法理解人的潜在意图，使用时要说比较直白的控制指令才能控制设备执行动作。且一般智能家居语音系统的能力只支持一次控制一个或一类设备，比如打开全部灯，而没法通过一次指令将多设备多个动作执行，比如说室内空气质量差，需要打开空调新风、打开排气扇、打开空气净化器，目前的智能语音服务需要一个一个指令去操作“打开空调新风”、“打开空气净化器”、“打开排气扇”，即现有的语音控制较为低效；另一个问题是用户本身对室内的的一些参数没法具体判断给出合适的家电指令，比如说感觉家里很闷，用户并不知道家里确切的pm2.5、甲醛、一氧化碳等参数，不知道如何设置控制参数。

发明内容

针对上述问题，本申请提供一种控制方法、装置、设备及存储介质，能够实现对设备进行更高效地控制，且能够帮助用户确定合适的控制指令。

本申请实施例提供一种控制方法，包括：

获取用户的意图信息、区域内的设备信息、环境信息和回复语格式；

将所述意图信息、所述设备信息、所述环境信息和所述回复语格式输入至大语言模型中确定目标设备的控制指令和回复语格式对应的回复语；

基于所述目标设备的控制指令控制对应的目标设备工作，并输出所述回复语。

在一些实施例中，所述获取用户的意图信息、区域内的设备信息、环境信息和回复语格式，包括：

获取用户的语音信息；

对所述语音信息进行识别，得到所述意图信息。

在一些实施例中，所述将所述意图信息、所述设备信息、所述环境信息和所述回复语格式输入至大语言模型中确定目标设备的控制指令和回复语格式对应的回复语，包括：

将所述意图信息、所述设备信息、所述环境信息和回复语格式输入至对应的模板中生成输入文本信息；

将所述输入文本信息输入至大语言模型中确定目标设备的控制指令和回复语格式对应的回复语。

在一些实施例中，所述基于所述目标设备的控制指令控制对应的目标设备工作，包括：

将所述目标设备的控制指令发送给物联网控制设备，以使物联网控制设备对各个目标设备进行控制。

在一些实施例中，所述方法还包括：

将所述意图信息输入至神经网络模型中，确定是否获取到目标设备的控制指令；

在获取到所述目标设备的控制指令的情况下，基于所述目标设备的控制指令控制所述目标设备运行；

在没有获取到目标设备的控制指令的情况下，调用大语言模型，以将所述意图信息、所述设备信息、所述环境信息和所述回复语格式输入至大语言模型中确定目标设备的控制指令和回复语格式对应的回复语，其中，所述神经网络模型能够用于识别第一难度的控制指令，所述大语言模型能够用于识别第二难度的控制指令，所述第一难度小于所述第二难度。

在一些实施例中，所述设备信息包括：设备列表及设备列表中各个设备的状态，所述环境信息包括：温湿度信息、空气信息，所述回复语格式包括：json格式。

本申请实施例提供一种控制装置，包括：

获取模块，用于获取用户的意图信息、区域内的设备信息、环境信息和回复语格式；

确定模块，用于将所述意图信息、所述设备信息、所述环境信息和所述回复语格式输入至大语言模型中确定目标设备的控制指令和回复语格式对应的回复语；

控制模块，用于基于所述目标设备的控制指令控制对应的目标设备工作，并输出所述回复语。

再一些实施例中，所述获取用户的意图信息、区域内的设备信息、环境信息和回复语格式，包括：

获取用户的语音信息；

对所述语音信息进行识别，得到所述意图信息。

本申请实施例提供一种电子设备，包括存储器和处理器，所述存储器上存储有计算机程序，该计算机程序被所述处理器执行时，执行如上述任意一项所述控制方法。

本申请实施例提供一种计算机可读存储介质，该计算机可读存储介质存储的计算机程序，能够被一个或多个处理器执行，能够用来实现上述所述控制方法。

附图说明

在下文中将基于实施例并参考附图来对本申请进行更详细的描述。

图1为本申请实施例提供的一种控制方法的实现流程示意图；

图2为本申请实施例提供的一种环境信息的模板的示意图；

图3为本申请实施例提供的一种设备信息的模板示意图；

图4为本申请实施例提供的一种意图信息的模板的示意图；

图5为本申请实施例提供的一种确定目标设备的控制指令和回复语格式对应的回复语的示意图；

图6为本申请实施例提供的一种当前语音智能家居系统在处理语音指令时的流程示意图；

图7为本申请实施例提供的电子设备的组成结构示意图。

在附图中，相同的部件使用相同的附图表记，附图并未按照实际的比例绘制。

具体实施方式

为了使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请作进一步地详细描述，所描述的实施例不应视为对本申请的限制，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本申请保护的范围。

在以下的描述中，涉及到“一些实施例”，其描述了所有可能实施例的子集，但是可以理解，“一些实施例”可以是所有可能实施例的相同子集或不同子集，并且可以在不冲突的情况下相互结合。

如果申请文件中出现“第一\第二\第三”的类似描述则增加以下的说明，在以下的描述中，所涉及的术语“第一\第二\第三”仅仅是是区别类似的对象，不代表针对对象的特定排序，可以理解地，“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序，以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的，不是旨在限制本申请。

基于相关技术中存在的问题，本申请实施例提供一种控制方法，所述方法的执行主体可以是电子设备，所述电子设备可以是移动终端、计算机、智能家居设备、智能穿戴设备等。在一些实施例中，所述电子设备可以是移动终端、计算机、智能家居设备、智能穿戴设备的控制器。

本申请实施例提供的控制方法所实现的功能可以通过电子设备的处理器调用程序代码来实现，其中，程序代码可以保存在计算机存储介质中。

本申请实施例提供一种控制方法，图1为本申请实施例提供的一种控制方法的实现流程示意图，如图1所示，包括：

步骤S101，获取用户的意图信息、区域内的设备信息、环境信息和回复语格式。

本申请实施例中，意图信息可以是以文本的形式输入，也可以以语音的形式输入，例如，以文本的形式输入意图信息是：有点闷，所述区域可以为预设区域，所述预设区域可以为用户的家中对应的区域，所述设备信息可以包括：设备列表和设备列表中各个设备的工作状态，所述环境信息可以包括：温湿度信息、空气信息等。所述回复语格式可以是json格式。

本申请实施例中，设备列表中的设备可以为加入用户家中的局域网中的所有设备。通过获取区域内设备的列表信息，可以使电子设备知道家中有哪些设备。所述设备的工作状态可以包括：设备是否工作及设备的工作模式等。所述温湿度信息可以包括：温度信息、湿度信息，所述空气信息可以包括：空气中成分的含量，例如：PM2.5含量、甲醛含量等。

本申请实施例中，电子设备可以和输入设备通信连接，通过输入设备来获取用户的意图信息，所述输入设备可以为键盘、语音输入设备等。语音输入设备可以是麦克风，电子设备可以和语音输入设备通信连接，通过语音输入设备来采集用户的语音信息，然后将语音信息输入到识别模型中进行识别，从而得到用户的意图信息。

本申请实施例中，电子设备可以和网关设备通信连接，通过网关设备来获取加入网络中的所有设备的设备信息。

在一些实施例中，电子设备也可以直接和各个设备通信连接，直接从各个设备获取设备的设备信息。

本申请实施例中，电子设备可以和环境信息采集模块通信连接，通过环境信息采集模块来获取环境信息，所述环境信息采集模块可以包括：传感器、设备上的传感器，所述传感器可以包括：温湿度传感器，空气信息传感器。

本申请实施例中，电子设备可以和输入设备通信连接，通过输入设备来输入回复语格式，所述输入设备可以包括：键盘、鼠标、语音输入设备等。

步骤S102，将所述意图信息、所述设备信息、所述环境信息和所述回复语格式输入至大语言模型中确定目标设备的控制指令和回复语格式对应的回复语。

本申请实施例中，大语言模型能够识别较为复杂的指令，复杂的指令可以包括：多设备指令。

本申请实施例中，目标设备可以为多个，控制指令可以包括：控制参数，所述回复语与生成目标设备的控制指令相关。

本申请实施例中，步骤S102可以通过以下步骤实现：

步骤S1021，将所述意图信息、所述设备信息、所述环境信息和回复语格式输入至对应的模板中生成输入文本信息；

本申请实施例中，可以设置各个信息的模板，在获取到意图信息、所述设备信息、所述环境信息和回复语格式后，则可以基于对应的模板来生成文本。

示例性地，图2为本申请实施例提供的一种环境信息的模板的示意图，如图2所示，可以将环境信息编排入该模板中。

示例性地，图3为本申请实施例提供的一种设备信息的模板示意图，如图3所示，可以将环境信息编排入环境信息的模板中。

示例性地，图4为本申请实施例提供的一种意图信息的模板的示意图，如图4所示，可以将意图信息编排入意图信息的模板中。

本申请实施例中，可以通过各个信息生成模板，从而生成输入文本信息。

步骤S1022，将所述输入文本信息输入至大语言模型中确定目标设备的控制指令和回复语格式对应的回复语。

本申请实施例中，由于大语言模型的输入和输出都是文本，因此，可以将所述意图信息、所述设备信息、所述环境信息和回复语格式输入至对应的模板中生成输入文本信息。

本申请实施例中，在文本信息输入后，大语言模型则会输出目标设备的控制指令和回复语格式对应的回复语。

示例性地，用户的意图信息为：有点闷，输出的回复语可以为：当前室内温度和湿度过高，已为您打开空调、除湿机和风扇，清凉马上就到。

图5为本申请实施例提供的一种确定目标设备的控制指令和回复语格式对应的回复语的示意图，如图5所示，目标设备可以用mac地址来表示。在控制指令中包括：各个设备的控制参数，控制参数可以包括：工作模式。

步骤S103，基于所述目标设备的控制指令控制对应的目标设备工作，并输出所述回复语。

本申请实施例中，可以将各个目标设备的控制指令发送给对应的目标设备，从而完成目标设备的控制。

在一些实施例中，电子设备可以将目标设备的控制指令发送给物联网控制设备，以使物联网控制设备对各个目标设备进行控制。物联网控制设备获取到目标设备的控制指令后，则可以控制各个目标设备执行。

本申请实施例中，可以通过文本的形式来输出回复语。电子设备可以和显示设备通信连接，通过显示设备来显示回复语。

在一些实施例中，也可以对回复语进行识别转换，将回复语转换为语音形式来，并通过播放设备来播放回复语。

承接上面的示例，目标设备的控制指令包括：打开空调新风、打开空气净化器、打开排气扇，此时电子设备可以自动发送指令，让空调、空气净化器和排气扇自动运行。相较于相关技术中采用语音控制的方式，能够提高控制效率。

本申请提供的一种控制方法，通过获取用户的意图信息、区域内的设备信息、环境信息和回复语格式；将所述意图信息、所述设备信息、所述环境信息和所述回复语格式输入至大语言模型中确定目标设备的控制指令和回复语格式对应的回复语；基于所述目标设备的控制指令控制对应的目标设备工作，并输出所述回复语，能够帮助用户确定合适的控制指令，且能够实现对设备进行更高效地控制。

基于前述的各个实施例，本申请实施例再提供一种控制方法，所述方法包括：

步骤S201，获取用户的意图信息、区域内的设备信息、环境信息和回复语格式。

本申请实施例中，所述设备信息包括：设备列表及设备列表中各个设备的状态，所述环境信息包括：温湿度信息、空气信息，所述回复语格式包括：json格式。

步骤S202，将所述意图信息输入至神经网络模型中，确定是否获取到目标设备的控制指令。

本申请实施例中，神经网络模型可以为较小的语言识别模型。所述神经网络模型能够用于识别第一难度的控制指令，所述第一难度的控制指令可以为单设备的指令。

本申请实施例中，由于大语言模型在使用时，需要产生一定的费用，因此，为了节省费用，在进行识别时，先用神经网络模型来进行识别。所述神经网络模型可以为用户自己训练的，例如，用户通过样本数据集来训练得到的。

本申请实施例中，如果神经网络模型中输出了目标设备的控制指令，则确定获取到目标设备的控制指令，如果神经网络模型中没有输出目标设备的控制指令，则确定没有获取到目标设备的控制指令。此时的目标设备可以为一个设备。

步骤S203，在获取到所述目标设备的控制指令的情况下，基于所述目标设备的控制指令控制所述目标设备运行。

本申请实施例中，电子设备可以将控制指令发送给目标设备，从而实现对目标设备的控制。

步骤S204，在没有获取到目标设备的控制指令的情况下，调用大语言模型。

本申请实施例中，如果没有获取到目标设备的控制指令，则神经网络模型并不能识别，有可能该指令为多设备的控制指令。因此，可以调用大语音识别模型。

本申请实施例中，所述大语言模型能够用于识别第二难度的控制指令，所述第一难度小于所述第二难度。

示例性地，多设备指令则为第二难度的控制指令。

步骤S205，将所述意图信息、所述设备信息、所述环境信息和所述回复语格式输入至大语言模型中确定目标设备的控制指令和回复语格式对应的回复语。

本申请实施例中，可以将将所述意图信息、所述设备信息、所述环境信息和回复语格式输入至对应的模板中生成输入文本信息；将所述输入文本信息输入至大语言模型中确定目标设备的控制指令和回复语格式对应的回复语。

步骤S206，基于所述目标设备的控制指令控制对应的目标设备工作，并输出所述回复语。

本申请实施例中，将所述目标设备的控制指令发送给物联网控制设备，以使物联网控制设备对各个目标设备进行控制。

基于前述的各个实施例，本申请实施例在提供一种控制方法，通过结合大语言模型LLM，将更详尽的环境信息、设备信息、生成指令格式、结合用户的请求话术(同上述实施中的意图信息)共同输入，让LLM来判断该给哪些设备下发哪些具体操作指令，比目前的智能家居语音更高效(一次控制所有目标设备)，且更智能(更能下发让人舒适的控制指令)。

本申请实施例中，提示词prompt是引导LLM给出合适回复的重点，智能家居相关提示词包含三个重要输入和两个重要输出。三个输入为：用户输入，这是智能家居交互的基础，表达用户直接或隐性意图；家中设备列表和对应状态，这部分让大模型知道家里有哪些设备，并且通过判断当前设备状态(处于什么模式)，让大模型判断给出每个设备合适操作；家中的环境状态，通过设备本身的传感器(空调里的温湿度传感器、净化器的甲醛、PM2.5传感器等)，或者独立的传感器，通过IoT联网上报状态，实时的家中环境状态数值，给到大模型，辅助判断最佳的设备操作指令，因为智能家居很大的一个任务是改善室内环境让用户舒适。

因为LLM是文本生成式模型，即输入和输出都是文本，不能直接被智能家居使用，故需要编排输入输出内容的prompt，约束LLM生成的东西可以被智能家居系统识别并使用。当前语音智能家居系统在处理语音指令时的步骤如图6所示，包括：a.在获取用户输入的语音转文本后，b.可以处理简单的指令，c.将指令变成操作指令下发给设备，d.并将生成的回复语播报给用户。

而本申请实施例中，LLM部分的接入，可以在b与c之间，也可以直接替代b。由于LLM一般反应时间较小模型长很多，且调用一般也会产生费用，故本文的方法是将LLM接入到b和c之间，将小模型无法处理的指令，转交由LLM部分处理，LLM部分的输入就像前文提到的，需要用户输入、设备列表和各自状态，家中环境信息，以及回复语格式，并将它们编排输入。对于LLM输出的内容，也就是控制指令和回复语，因为控制指令是在输入阶段就规定好了，所以直接交给现有的IoT控制服务进行设备控制，回复语则播报回复给用户。

基于前述的实施例，本申请实施例提供一种控制装置，该装置包括的各模块、以及各模块包括的各单元，可以通过计算机设备中的处理器来实现；当然也可通过具体的逻辑电路实现；在实施的过程中，处理器可以为中央处理器(CPU，Central Processing Unit)、微处理器(MPU，Microprocessor Unit)、数字信号处理器(DSP，Digital SignalProcessing)或现场可编程门阵列(FPGA，Field Programmable Gate Array)等。

本申请实施例提供一种控制装置，包括：

获取用户的语音信息；

对所述语音信息进行识别，得到所述意图信息。

在一些实施例中，控制装置还用于：

需要说明的是，本申请实施例中，如果以软件功能模块的形式实现上述的控制方法，并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read OnlyMemory)、磁碟或者光盘等各种可以存储程序代码的介质。这样，本申请实施例不限制于任何特定的硬件和软件结合。

相应地，本申请实施例提供一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现上述实施例中提供的控制方法中的步骤。

本申请实施例提供一种电子设备；图7为本申请实施例提供的电子设备的组成结构示意图，如图7所示，所述电子设备500包括：一个处理器501、至少一个通信总线502、用户接口503、至少一个外部通信接口504、存储器505。其中，通信总线502配置为实现这些组件之间的连接通信。其中，用户接口503可以包括控制屏，外部通信接口504可以包括标准的有线接口和无线接口。所述处理器501配置为执行存储器中存储的控制方法的程序，以实现以上述实施例提供的控制方法中的步骤。

这里需要指出的是：以上存储介质和设备实施例的描述，与上述方法实施例的描述是类似的，具有同方法实施例相似的有益效果。对于本申请存储介质和设备实施例中未披露的技术细节，请参照本申请方法实施例的描述而理解。

应理解，说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。因此，在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外，这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解，在本申请的各种实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

在本申请所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，如：多个单元或组件可以结合，或可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所控制或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口，设备或单元的间接耦合或通信连接，可以是电性的、机械的或其它形式的。

上述作为分离部件说明的单元可以是、或也可以不是物理上分开的，作为单元控制的部件可以是、或也可以不是物理单元；既可以位于一个地方，也可以分布到多个网络单元上；可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外，在本申请各实施例中的各功能单元可以全部集成在一个处理单元中，也可以是各单元分别单独作为一个单元，也可以两个或两个以上单元集成在一个单元中；上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：移动存储设备、只读存储器(ROM，Read Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

或者，本申请上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台控制器执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括：移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本申请的实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种控制方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述获取用户的意图信息、区域内的设备信息、环境信息和回复语格式，包括：

获取用户的语音信息；

对所述语音信息进行识别，得到所述意图信息。

3.根据权利要求1所述的方法，其特征在于，所述将所述意图信息、所述设备信息、所述环境信息和所述回复语格式输入至大语言模型中确定目标设备的控制指令和回复语格式对应的回复语，包括：

4.根据权利要求1所述的方法，其特征在于，所述基于所述目标设备的控制指令控制对应的目标设备工作，包括：

5.根据权利要求1所述的方法，其特征在于，所述方法还包括：

6.根据权利要求1至5所述的方法，其特征在于，所述设备信息包括：设备列表及设备列表中各个设备的状态，所述环境信息包括：温湿度信息、空气信息，所述回复语格式包括：json格式。

7.一种控制装置，其特征在于，包括：

8.根据权利要求7所述的装置，其特征在于，所述获取用户的意图信息、区域内的设备信息、环境信息和回复语格式，包括：

获取用户的语音信息；

对所述语音信息进行识别，得到所述意图信息。

9.一种电子设备，其特征在于，包括存储器和处理器，所述存储器上存储有计算机程序，该计算机程序被所述处理器执行时，执行如权利要求1至6任意一项所述控制方法。

10.一种存储介质，其特征在于，该存储介质存储的计算机程序，能够被一个或多个处理器执行，能够用来实现如权利要求1至6任意一项所述控制方法。