WO2019218820A1

WO2019218820A1 - 控制对象的确定方法及装置、存储介质、电子装置

Info

Publication number: WO2019218820A1
Application number: PCT/CN2019/082348
Authority: WO
Inventors: 温海娇; 陈虹; 牛国扬; 董修岗
Original assignee: 中兴通讯股份有限公司
Priority date: 2018-05-14
Filing date: 2019-04-12
Publication date: 2019-11-21
Also published as: EP3796110A1; US20210160130A1; EP3796110A4; CN108646580A

Abstract

本公开提供了一种控制对象的确定方法及装置、存储介质、电子装置，其中，该方法包括：在第一设备上获取第一控制指令和待控制的对象的状态信息，其中，第一设备与待控制的对象之间建立有通信连接；根据状态信息从待控制的对象中确定第一控制指令所请求控制的目标对象。通过本公开，解决了相关技术中确定目标对象的步骤过于繁琐的技术问题。

Description

控制对象的确定方法及装置、存储介质、电子装置

技术领域

本公开涉及通信领域，具体而言，涉及一种控制对象的确定方法及装置、存储介质、电子装置。

背景技术

相关技术中，各种智能交互设备呈爆炸式增长，如京东的叮咚音箱，亚马逊echo、以及智能机顶盒等。其中，语义理解是目前智能交互设备的重点和难点之一，主要表现在多维场景扩充，上下文理解层次。

针对多维场景扩充，相关技术主要根据业务定制方式，来不断扩充场景解析器。该方案对话管理机制由场景决定，当有新的场景接入，需要重新定制一套管理机制，实现流程复杂，无法快速扩展。另外，场景识别仅从浅层次了解当前消息所在的领域，并不能够深层次了解用户真正的意图。

相关技术中，已有的解决方案仅仅适用于纯语音/文本的智能交互设备，人工智能技术还没有达到真正应用自如的状态。

这样当前解决方案若以语义理解系统的对话管理模块处理，会造成场景之间切换错误或者无法理解的情况。比如，用户先按开关,打开卧室的灯，紧接着用户说“太暗了”，事实上用户是想调亮灯光，但是智能中控是无法正确理解该指令的。

针对相关技术中存在的上述问题，目前尚未发现有效的解决方案。

发明内容

本公开实施例提供了一种控制对象的确定方法及装置、存储介质、电子装置。

根据本公开的一个实施例，提供了一种控制对象的确定方法，包括：在第一设备上获取第一控制指令和待控制的对象的状态信息，其中，所述第一设备与所述待控制的对象之间建立有通信连接；根据所述状态信息从所述待控制的对象中确定所述第一控制指令所请求控制的目标对象。

根据本公开的另一个实施例，提供了一种控制对象的确定装置，包括：获取模块，设置为在第一设备上获取第一控制指令和待控制的对象的状态信息，其中，所述第一设备与所述待控制的对象之间建立有通信连接；确定模块，设置为根据所述状态信息从所述待控制的对象中确定所述第一控制指令所请求控制的目标对象。

根据本公开的又一个实施例，还提供了一种存储介质，所述存储介质中存储有计算机程序，其中，所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

根据本公开的又一个实施例，还提供了一种电子装置，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。

通过本公开，获取待控制的对象的状态信息，并根据待控制的对象的状态信息来确定第一控制指令所请求控制的目标对象，解决了相关技术中确定目标对象的步骤过于繁琐的技术问题，减少了中控与用户的交互次数，提高了中控的智能性，提高了用户体验。

附图说明

此处所说明的附图用来提供对本公开的进一步理解，构成本申请的一部分，本公开的示意性实施例及其说明用于解释本公开，并不构成对本公开的不当限定。在附图中：

图1是本公开实施例的网络构架图；

图2是根据本公开实施例的控制对象的确定方法的流程图；

图3是根据本公开实施例的控制对象的确定装置的结构框图；

图4是本公开实施例的整体系统架构图；

图5是本公开实施例的深度语义理解模块流程图；

图6是本公开实施例的记忆模块用户历史数据存储示意图；

图7是本公开实施例的领域识别模型框架图；

图8是本公开实施例的意图识别模型框架图；

图9是实例1中家庭服务机器人框架图；

图10是实例1家庭服务机器人流程图；

图11是实例2智能机顶盒框架图；

图12是实例2智能机顶盒流程图；

图13是实例3智能会控框架图；

图14是实例3智能会控流程图；

图15是实例4智能车载框架图；

图16是实例4智能车载流程图。

具体实施方式

下文中将参考附图并结合实施例来详细说明本公开。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。

实施例1

本申请实施例可以运行于图1所示的网络架构上，图1是本公开实施例的网络构架图，如图1所示，该网络架构包括：中控、以及中控控制的对象，其中，中控根据控制指令控制各个对象。

在本实施例中提供了一种运行于上述网络架构的控制对象的确定方法，图2是根据本公开实施例的控制对象的确定方法的流程图，如图2所示，该流程包括如下步骤：

步骤S202，在第一设备上获取第一控制指令和待控制的对象的状态信息，其中，第一设备与待控制的对象之间建立有通信连接；

步骤S204，根据状态信息从待控制的对象中确定第一控制指令所请求控制的目标对象。

通过上述步骤，获取待控制的对象的状态信息，并根据待控制的对象的状态信息来确定第一控制指令所请求控制的目标对象，解决了相关技术中确定目标对象的步骤过于繁琐的技术问题，减少了中控与用户的交互次数，提高了中控的智能性，提高了用户体验。

可选地，上述步骤的执行主体，即，上述的第一设备可以为中控(控制单元)，如音箱、手机、机顶盒，机器人，车载设备，智能管家等，但不限于此。当然也可以不在第一设备上获取第一控制指令和待控制的对象的状态信息，即直接获取第一控制指令和待控制的对象的状态信息，此时，执行主体不是第一设备，而是与第一设备连接的通信设备，如第一设备的控制设备等。

在一个实施方式中，根据状态信息从待控制的对象中确定第一控制指令所请求控制的目标对象包括：

解析待控制的对象的状态信息，根据预定对应关系从待控制的对象中确定目标对象，其中，预定对应关系用于描述状态信息与目标对象的对应关系。如第一对象的状态信息为开启状态或待机状态，则为目标对象，第二对象的状态信息为关闭状态，则为非目标对象，第三对象的状态信息为前台显示状态，则为目标对象，第四对象的状态信息为后台运行状态，则为非目标对象。

可选的，根据预定对应关系从待控制的对象中确定目标对象包括以下示例：

示例1：将开关状态为开启的待控制的对象确定为目标对象；

示例2：将开启时间距离当前时间最短的待控制的对象确定为目标对象；开启时间距离当前时间最短可以理解为用户刚刚操作开启的对象。在其他的示例中，也可以将用户使用频率大于预定值(或者最高)的对象确定为目标对象，或者将在预定时间内工作状态发生变化(如应用程序在3S前从后台运行切换为前台显示状态)的对象确定为目标对象。

其中，状态信息包括以下至少之一：开关状态，开启时间，使用频率等。

S11，根据第一控制指令确定待控制的对象的指定状态信息；

S12，将状态信息与指定状态信息匹配的待控制的对象确定为目标对象。如第一控制指令为“打开”，则待控制的对象的指定状态信息为关闭状态，因为用户不可能将已经开启的对象再开启一遍，如第一控制指令为“调高音量”，则待控制的对象的指定状态信息为当前音量低于预定阈值的状态，等等。

可选的，将状态信息与指定状态信息匹配的待控制的对象确定为目标对象包括：将工作状态与指定状态信息的相似度高于预设阈值的待控制的对象确定为目标对象，其中，状态信息包括工作状态。也可以是将工作状态与指定状态信息的相似度低于预设阈值的待控制的对象确定为目标对象。

可选的，在根据状态信息从待控制的对象中确定第一控制指令所请求控制的目标对象之后，方法还包括：

在从待控制的对象中确定出目标对象的情况下，通过第一设备向目标对象发送第二控制指令，其中，第二控制指令用于指示目标对象执行第一控制指令所请求的操作；在从待控制的对象中未确定出目标对象的情况下，通过第一设备返回用于确认第一控制指令的反馈信息。

在本实施例中，从第一设备获取第一控制指令包括以下获取方式：

通过第一设备采集到语音信息，其中，语音信息中携带有特征信息；根据特征信息生成第一控制指令；

从第一设备接收到文本消息，其中，文本消息中携带有特征信息；根据特征信息生成第一控制指令；

从第一设备接收到遥控指令；根据遥控指令生成第一控制指令；

从第一设备接收控制手势，从控制手势中提取特征信息；根据特征信息生成第一控制指令。

在本实施例中，在第一设备上获取第一控制指令之后，还可以识别第一控制指令，进而根据第一控制指令来确定目标对象，可以与根据状态信息确定目标对象同时使用，包括选择其中一个来确定目标对象，或者在使用其中一种确定方式确定的目标对象较多时，使用另一种确定方式进一步缩小目标对象的范围，根据第一控制指令来确定目标对象包括：

S21，识别第一控制指令，确定第一控制指令的控制领域；

S22，将所属领域与控制领域相同的待控制的对象，确定为目标对象；

可选的，识别第一控制指令包括以下之一：使用第一设备预设的数据模型识别第一控制指令，其中，数据模型包括多个领域的数据库；通过网络服务器在线识别第一控制指令。在使用第一设备预设的数据模型识别第一控制指令之前，还可以通过神经网络训练数据模型，在训练数据模型时，需要将领域和状态信息作为其中的标签向量输入到数据模型中。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本公开的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本公开各个实施例所述的方法。

实施例2

在本实施例中还提供了一种控制对象的确定装置，该装置用于实现上述实施例及优选实施方式，已经进行过说明的不再赘述。如以下所使用的，术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。

图3是根据本公开实施例的控制对象的确定装置的结构框图，如图3所示，该装置包括：

获取模块30，设置为在第一设备上获取第一控制指令和待控制的对象的状态信息，其中，第一设备与待控制的对象之间建立有通信连接；

确定模块32，设置为根据状态信息从待控制的对象中确定第一控制指令所请求控制的目标对象。

可选的，确定模块包括：第一确定单元，设置为解析待控制的对象的状态信息，根据预定对应关系从待控制的对象中确定目标对象，其中，预定对应关系用于描述状态信息与目标对象的对应关系。

可选的，确定模块包括：第二确定单元，设置为根据第一控制指令确定待控制的对象的指定状态信息；第三确定单元，设置为将状态信息与指定状态信息匹配的待控制的对象确定为目标对象。

可选的，本实施例的装置还包括：发送模块，设置为在确定模块根据状态信息从待控制的对象中确定第一控制指令所请求控制的目标对象之后，在从待控制的对象中确定出目标对象的情况下，通过第一设备向目标对象发送第二控制指令，其中，第二控制指令用于指示目标对象执行第一控制指令所请求的操作。

需要说明的是，上述各个模块是可以通过软件或硬件来实现的，对于后者，可以通过以下方式实现，但不限于此：上述模块均位于同一处理器中；或者，上述各个模块以任意组合的形式分别位于不同的处理器中。

实施例3

本实施例用于结合不同场景中的实例对本申请的方案进行详细解释和说明：

本实施例提供了一种多场景协同交互智能语义理解系统，该系统适合多种场景，可以嵌入智能音箱、智能手机、智能机顶盒等各种语音/文本交互设备中。涉及自然语言处理、语义分析与理解、人工智能等领域。本实施例提供的一种多设备(场景)协同交互的语义理解系统，可以应用于智能家居、智能手机、智能车载等各种智能设备交互系统。语义理解系统可以接收语音、文本输入信息，并实时接收不定数量智能设备场景状态消息，最终通过语义理解平台将多种信息融合，多轮交互深层次了解用户意图，将用户操控指令转化为智能设备调度执行的服务指令。

本实施例包括四大模块：预处理模块，深层语义理解模块，结果反馈模块以及数据模型管理模块。

预处理模块：对消息进行预处理，包括文本纠错、拼音转汉字，中文数字转化等。

深层语义理解模块，由三个子模块组成，分别是领域识别模块，意图识别模块，信息抽取模块。

领域识别模块:结合设备状态初步识别用户消息所在的领域，结果可以是单个或者多个领域。

意图识别模块：初步确定用户意图，包括动作意图比如“听”，“看”，“打开”，也包括特定领域意图，比如天气咨询包括“一般查询”和“焦点查询”。

信息抽取模块：当用户消息所在领域和意图明确时，进行信息抽取，包括日期、地点、歌手、演员等，深层次了解用户意图。

结果反馈模块，由两个子模块组成，分别是交互模块、指令生成模块。

交互模块：当用户消息所在领域和意图不清楚时，主动引导交互确定用户意图。

指令生成模块：指令类消息使用json串返回用户要执行的操作

数据模型管理模块：设置为维护预处理模块和深层语义理解模块需要的算法库、规则库以及数据库等。

图4是本公开实施例的整体系统架构图，如图4所示，语义理解平台主要采集语音/文本消息以及不定数量的设备状态。该系统主要由语义理解系统和数据模型两大部分。其中语义理解系统包含三个模块，分别是预处理模块、深度语义理解模块以结果反馈模块。其中预处理模块的目的在于使得用户消息文本更加标准化，为后续深度语义理解模块做准备。结果反馈模块用于相应用户消息。深度语义理解模块是该系统的核心功能模块。

深度语义理解模块为一套通用的场景语义理解框架，支持多维场景扩充。新的场景扩充只需要维护相应的语料库，无需重新定义新的框架。

较业界已有的解决方案，该套系统更加智能化，人性化，减少系统维护成本的同时，可应用于各种智能交互设备。

图5是本公开实施例的深度语义理解模块流程图，如图5所示，该模块为一套通用的场景语义理解框架，新的场景扩充只需要维护相应的语料库，无需重新定义新的框架，使得系统更加智能化。此外，该模块提供设备场景状态消息接收功能能够，可用于多交互方式并存的智能设备，更好的实现上下文理解，故为本公开的核心模块之一。

该系统可以用于其中多设备控制系统，比如智能家居，领域即各个设备，意图即控制各个设备动作；也可以是单设备多场景的控制系统，比如智能机顶盒，设备只有一个电视机，场景有相册、影视、音乐等，领域即电视机相关的场景，意图为控制各个场景的动作。

语料准备主要包括三部分领域库、设备库以及领域词库。其中领域库由多个子库组成，以智能机顶盒为例，领域库包含音乐库、影视库、相册库。

音乐库：我想听音乐、来首歌、……

影视库：看电影、想看战争片、……

相册库：打开相册、幻灯片、……

设备库主要是指语义理解系统涉及的设备状态，以智能机顶盒为例：

电视机：音乐、影视、相册……

音乐：听，打开，关闭，快进……

相册：打开、关闭、放大……

影视：看、搜索……

以智能家居为例

灯：打开、关闭……

空调：打开、关闭、制冷、制热、除湿……

领域词库主要用于信息抽取，比如家庭设备所在的位置，影视名称等特殊领域词汇，具体格式如下：

Devide_location：主卧、客厅、厨房……

Music_name：欢乐颂，童年，漂洋过海来看你……

Video_name：欢乐颂，最好的我们，急诊科医生……

下面对图5的各个子模块进行详细描述：

模块201：json消息采集模块，主要包括语音/文本消息，以及设备状态消息，具体格式如下所示：

其中"zxvca_text"为文本消息或者语音识别后的消息内容，"zxvca_device"是设备状态，为数组形式，可以根据真实设备个数进行调整。

模块202：记忆模块为本专利保护的核心模块之一，主要存储用户历史消息数据，形成网状结构，具体存储格式如图6所示，图6是本公开实施例的记忆模块用户历史数据存储示意图，内容包括语音/文本消息、当前消息所在领域、意图、消息时间等内容。后续可以根据记忆模块根据用户习惯，进行大数据分析、挖掘推理，确定用户真正意图，减少交互次数，使系统更加智能化。同时可以根据大部分用户的数据推测新用户的意图。如用户A和用户B在说“欢乐颂”通过交互判断用户是想听音乐，当用户C也说“欢乐颂”，可以直接推测用户C想听欢乐颂这首歌而不是听音乐。该模块同样可以用于推荐系统、用户画像分析等其他产品业务中。

模块203：领域识别模块为本专利保护的核心模块之一。领域识别框架如图7所示，图7是本公开实施例的领域识别模型框架图。

采用多个二分类算法RANN实现。分离线训练和在线使用两部分。领域分类模型框架如图6所示，其中网络结构的参数集合即为领域模型。该模型框架支持领域即设备场景的不断扩充，避免新增语料时反复基于大数据训练模型，减少训练时间成本。该算法主要包括以下五个部分，下面结合智能机顶盒应用场景详细说明。

设备有电视机编号为1，场景状态为音乐、影视、相册编号分别为1 00、0 1 0、0 0 1。用户消息“来首歌”，设备状态“电视机相册”。

输入层：用户消息文本，诸多设备状态。

向量化：主要包含两部分句子向量化和设备状态向量化。

句子向量化即用户消息分词，全部词的word2vec求和得到句子向量。设备状态向量化由设备编号向量和场景状态向量两部分组成，则当前的设备场景状态为：1 0 0 1。

隐藏层：b _h＝f(W _ihx _t+W _h'hb _h-1)+b，其中f为激活函数，W _ih为输入层与隐藏层的权重，W _h'h为隐藏层之前的权重。隐藏层作为深度学习的黑盒，主要关注的是激活函数、隐藏层神经元个数以及隐藏层层数，这些参数可以根据具体应用场景进行调整，没有统一标准。

输出层：对隐藏层的输出结果进行使用多个逻辑回归函数，得到N组二元向量，其中位置0代表不属于该领域，位置1代表属于该领域。该场景下输出层由3个逻辑回归模型组成，分别为L1(是否为音乐)、L2(是否为影视)、L3(是否为相册)。最终输出层的结果为3组二元向量，分别为0.1 0.9、0.8 0.2、0.9 0.1。

标签标准化：将输出层的N个二元向量转化为N元向量，提取每个二元向量最大值所在的位置。当前场景的最终输出值为1 0 0，即该消息属于音乐领域。

下面重点介绍领域模型的离线训练语料及在线使用方式：

离线训练：训练语料格式为设备状态+文本+标签，中间可以用“|”分开，如下所示：

电视机影视|来首歌|1 0 0

电视机音乐|欢乐颂|1 0 0

电视机影视|欢乐颂|0 1 0

电视机相册|欢乐颂|1 1 0

电视机影视|打开音乐|1 0 0

电视机音乐|打开相册|0 0 1

电视机音乐|看个电影|0 1 0

其中，其中标签长度为领域个数，位置1代表“音乐”，位置2代表“影视”，位置3代表“相册”。

在线使用：用户消息分词后，通过多二分类模型结果来判断该消息属于哪些领域，结果可以是单个或者多个，事例如下：

单领域结果

用户消息“来一首欢乐颂”设备状态“电视机音乐”模型得到标签为1 0 0，即该消息属于音乐领域。

多领域结果

用户消息“欢乐颂”设备状态“电视机相册”模型得到标签为1 1 0，即该消息同时属于音乐领域、影视领域。

模块204：意图识别模块为本专利保护的核心模块之一。意图相对领域比较稳定，固本专利采取多分类算法实现。将设备库中的意图转化为多个标签，采用多分类算法RANN实现该功能，分离线训练和在线使用两部分。意图识别模型框架如图8所示，图8是本公开实施例的意图识别模型框架图，其中网络结构的参数集合即为意图模型。与领域识别模型类似，只是将输出层改为softMax函数，将模型架构修改为多分类模型。该算法主要包括以下四个部分，下面结合智能机顶盒应用场景详细说明。

设备有电视机编号为1，场景状态为音乐、影视、相册编号分别为1 00、0 1 0、0 0 1。考虑到有些问句不涉及动作，即无意图，故这里假设智能机顶盒存在以下意图：打开，看，听，其他(无意图)。1 0 0 0代表“打开”，0 1 0 0代表“看”，0 0 1 0代表“听”，0 0 1 0代表“其他”。用户消息“来首歌”，设备状态“电视机相册”。

输入层：用户消息文本，诸多设备状态。

向量化：主要包含两部分句子向量化和设备状态向量化。

输出层：对隐藏层的输出结果进行softmax归一化，

其中W _hk为隐藏层和输出层的权重。该场景下输出层为4元向量，最大值对应的位置即当前用户的真正意图。模型结果为0.02 0.05 0.9 0.03，即意图为“听”。

下面重点介绍意图模型的离线训练语料及在线使用方式：

离线训练：训练语料格式为设备状态+文本+标签，中间可以用“|”分开，具体事例如下所示：

电视机影视|你好|0 0 0 1

电视机影视|听音乐|0 0 1 0

电视机音乐|打开相册|1 0 0 0

电视机相册|看刘德华的电影|0 1 0 0

训练模型得到意图识别模型。其中1 0 0 0代表“打开”，0 1 0 0

代表“看”，0 0 1 0代表“听”，0 0 1 0代表“其他”

在线使用：用户消息分词后，加载多分类模型，即可得到预测结果。事例如下：

用户消息“来首刘德华的歌”，设备状态“电视机相册”，模型结果为0.02 0.05 0.9 0.03，即意图为“听”。

模块205：领域意图是否明确模块为本专利保护的核心模块之一，主要设置为判断流程是否需要进入交互状态，准确判断用户意图的同时，为其增加类人交互机制。这块主要判断多领域、无意图或者领域意图均缺失的问题。

多领域问题，比如用户说“搜一下欢乐颂”，领域识别结果为“音乐”或者“影视”。由于意图不清晰，所以要和用户交互确定用户想要表达的意思。

无意图问题，比如用户说“欢乐颂”，意图识别结果为“其他”，即无意图。这个时候可以与用户交互“您想播放欢乐颂还是查找欢乐颂视频资源”。

领域意图缺失问题，比如用户说“你好”，领域意图均缺失，这个时候可以与用户交互“我可以帮您浏览照片，看电影，听音乐”。

交互内容会和指令解析结果一并以json消息返回，在具体业务应用中，可以灵活选择是否交互。

模块206：信息抽取模块为该套语义理解的必要模块。通用知识，主要包括日期、地点、人名等。采用业界经典算法LSTM+CRF的序列标签算法实现。领域知识，比如歌手、演员、影视出产地、音乐风格等，需要提供相应的领域词库，采用索引匹配方式。

模块207：输出模块，生成具有语义的json指令消息，为本专利的核心模块，便于日志抓包采集信息。消息格式如下所示：

其中"zxvca_text"为文本消息或者语音识别后的消息内容，"zxvca_result"是领域意图识别结果，为数组形式，包含领域、意图以及该领域对应的分数，"zxvca_info"是信息抽取结果，为数组形式，包含人名、时间、地点等，可根据产品需求自行扩充其他需要抽取的内容。

本公开以家庭服务机器人、智能机顶盒、智能会控、智能车载为特例提供多种实施方式与步骤。

实例1

家庭服务机器人参考图9和图10，图9是实例1中家庭服务机器人框架图，图10是实例1家庭服务机器人流程图。

该实施例主要说明以下应用场景：多设备多场景不在交互中，指令解析结果需要交互。

家庭服务机器人场景设定为灯、空调、窗帘等。家庭智能中控采集用户消息以及家庭设备状态消息。这里操作包括但不限于语音指令、遥控器指令、智能终端触屏操作、手势指令等。

图9中数据流1A和1B，智能中控分别采集用户消息和设备状态消息。

3)图9中数据流2，语义理解平台接收用户消息以及家庭设备状态消息，如：

4)不在交互中，根据图10模块702进行领域识别，结果为“灯”或者“电视机”；根据图10模块703进行意图识别，结果为“调亮”。

5)根据图10模块704判断多领域意图不明确，需要交互确认用户意图。生成交互内容：“您要调亮灯光还是电视机屏幕呢？”

6)图9数据流3语音理解平台发送指令消息到家庭智能中控，消息内容如下所示：

7)图9数据流4智能中控根据需求选择交互或者直接分发指令到相应的设备，对设备进行操作。

实例2

智能机顶盒参考图11和图12，图11是实例2智能机顶盒框架图，图12是实例2智能机顶盒流程图。

该实施例主要说明以下应用场景：单设备多场景不在交互中，指令解析结果需需要交互。

智能机顶盒场景设定为影视、音乐、相册等。智能机顶盒采集用户消息以及电视机界面状态消息。这里操作包括但不限于语音指令、遥控器指令、智能终端触屏操作、手势指令等。

2)图11中数据流1A和1B，智能机顶盒分别采集用户消息和设备状态消息。

3)图11数据流2，语义理解平台接收用户消息以及家庭设备状态消息。进行上下文理解。如：

4)不在交互中，根据图12模块902进行领域识别，结果为“音乐”或者“影视”；根据图12模块903进行意图识别，结果为“搜索”。

5)根据图12模块904判断多领域意图不明确，需要交互确认用户意图。生成交互内容：“您想看影视节目还是听音乐？”

6)图11数据流3，语音理解平台发送指令消息到智能机顶盒，消息内容如下所示：

7)图11数据流4，智能机顶盒根据需求选择交互或者直接发送指令到电视机，对电视机进行操作。

实例3

智能会控参考图13和图14，图13是实例3智能会控框架图，图14是实例3智能会控流程图。

该实施例主要说明以下应用场景：多设备多场景不在交互中，指令解析结果无需交互。

智能会控场景设定为指令操作、故障诊断。智能会控终端采集用户消息。这里操作包括但不限于语音指令、遥控器指令、智能终端触屏操作、手势指令等。

2)图13中数据流1A和1B，智能会控终端分别采集用户消息和设备状态消息。

3)图13中数据流2，语义理解平台接收用户消息以及电视会议设备状态消息。进行上下文理解如：

4)不在交互中，根据图14模块1102进行领域识别，结果为“麦克风”；根据图14模块1103进行意图识别，结果为“加音”。

5)根据图14模块1104判断领域意图明确。根据图14模块1105进行信息抽取，无内容。

6)图13数据流3，语音理解平台发送指令消息到智能会控终端，消息格式如下所示：

7)图13数据流4，智能会控终端分发指令到相应的设备，对设备进行操作。

实例4

智能车载参考图15和图16，图15是实例4智能车载框架图，图16是实例4智能车载流程图。

该实施例主要说明以下应用场景：多设备多场景在交互中，指令解析结果无需交互。

智能车载场景设定为打电话、听音乐、导航等。智能车载采集用户消息。这里操作包括但不限于语音指令、遥控器指令、智能终端触屏操作、手势指令等。

2)图15中数据流1A和1B，智能车载分别采集用户消息和设备状态消息。

3)图15中数据流2，语义理解平台接收用户消息以及车载状态消息，如：

4)交互中，根据图16模块1302提取记忆中的领域和意图，结果为领域“电话”，意图“打”。

5)根据图16模块1303判断领域意图明确，根据图16模块1304进行信息抽取，结果为：人名“张三”。

6)图15的数据流3，语音理解平台发送指令消息到智能车载，消息格式如下所示：

7)图15的数据流4，智能车载分发指令到相应的设备，对设备进行操作。

实施例4

本公开的实施例还提供了一种存储介质，该存储介质中存储有计算机程序，其中，该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

可选地，在本实施例中，上述存储介质可以被设置为存储用于执行以下步骤的计算机程序：

S1，在第一设备上获取第一控制指令和待控制的对象的状态信息，其中，第一设备与待控制的对象之间建立有通信连接；

S2，根据状态信息从待控制的对象中确定第一控制指令所请求控制的目标对象。

可选地，在本实施例中，上述存储介质可以包括但不限于：U盘、只读存储器(Read-Only Memory，简称为ROM)、随机存取存储器(Random Access Memory，简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。

本公开的实施例还提供了一种电子装置，包括存储器和处理器，该存储器中存储有计算机程序，该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。

可选地，上述电子装置还可以包括传输设备以及输入输出设备，其中，该传输设备和上述处理器连接，该输入输出设备和上述处理器连接。

可选地，在本实施例中，上述处理器可以被设置为通过计算机程序执行以下步骤：

可选地，本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例，本实施例在此不再赘述。

显然，本领域的技术人员应该明白，上述的本公开的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本公开不限制于任何特定的硬件和软件结合。

以上所述仅为本公开的优选实施例而已，并不用于限制本公开，对于本领域的技术人员来说，本公开可以有各种更改和变化。凡在本公开的原则之内，所作的任何修改、等同替换、改进等，均应包含在本公开的保护范围之内。

工业实用性

如上所述，本发明实施例提供的一种控制对象的确定方法及装置、存储介质、电子装置具有以下有益效果：解决了相关技术中确定目标对象的步骤过于繁琐的技术问题，减少了中控与用户的交互次数，提高了中控的智能性，提高了用户体验。

Claims

一种控制对象的确定方法，包括：

在第一设备上获取第一控制指令和待控制的对象的状态信息，其中，所述第一设备与所述待控制的对象之间建立有通信连接；

根据所述状态信息从所述待控制的对象中确定所述第一控制指令所请求控制的目标对象。
根据权利要求1所述的方法，其中，根据所述状态信息从所述待控制的对象中确定所述第一控制指令所请求控制的目标对象包括：

解析所述待控制的对象的状态信息，根据预定对应关系从所述待控制的对象中确定所述目标对象，其中，所述预定对应关系用于描述状态信息与目标对象的对应关系。
根据权利要求2所述的方法，其中，根据预定对应关系从所述待控制的对象中确定所述目标对象包括以下之一：

将开关状态为开启的待控制的对象确定为所述目标对象；

将开启时间距离当前时间最短的待控制的对象确定为所述目标对象；

其中，所述状态信息包括以下至少之一：开关状态，开启时间。
根据权利要求1所述的方法，其中，根据所述状态信息从所述待控制的对象中确定所述第一控制指令所请求控制的目标对象包括：

根据所述第一控制指令确定待控制的对象的指定状态信息；

将状态信息与所述指定状态信息匹配的待控制的对象确定为所述目标对象。
根据权利要求4所述的方法，其中，将状态信息与所述指定状态信息匹配的待控制的对象确定为所述目标对象包括：

将工作状态与所述指定状态信息的相似度高于预设阈值的待控制的对象确定为所述目标对象，其中，所述状态信息包括所述工作状态。
根据权利要求1所述的方法，其中，在根据所述状态信息从所述待控制的对象中确定所述第一控制指令所请求控制的目标对象之后，所述方法还包括：

在从所述待控制的对象中确定出所述目标对象的情况下，通过所述第一设备向所述目标对象发送第二控制指令，其中，所述第二控制指令用于指示所述目标对象执行所述第一控制指令所请求的操作。
根据权利要求1所述的方法，其中，在根据所述状态信息从所述待控制的对象中确定所述第一控制指令所请求控制的目标对象之后，所述方法还包括：

在从所述待控制的对象中未确定出所述目标对象的情况下，通过所述第一设备返回用于确认所述第一控制指令的反馈信息。
根据权利要求1所述的方法，其中，从第一设备获取第一控制指令包括以下至少之一：

通过所述第一设备采集到语音信息，其中，所述语音信息中携带有特征信息；根据所述特征信息生成所述第一控制指令；

从所述第一设备接收到文本消息，其中，所述文本消息中携带有特征信息；根据所述特征信息生成所述第一控制指令；

从所述第一设备接收到遥控指令；根据所述遥控指令生成所述第一控制指令；

从所述第一设备接收控制手势，从所述控制手势中提取特征信息；根据所述特征信息生成所述第一控制指令。
根据权利要求1所述的方法，其中，在第一设备上获取第一控制指令之后，所述方法还包括：

识别所述第一控制指令，确定所述第一控制指令的控制领域；

将所属领域与所述控制领域相同的待控制的对象，确定为所述目标对象。
根据权利要求9所述的方法，其中，识别所述第一控制指令包括以下之一：

使用所述第一设备预设的数据模型识别所述第一控制指令，其中，所述数据模型包括多个领域的数据库；

通过网络服务器在线识别所述第一控制指令。
一种控制对象的确定装置，包括：

获取模块，设置为在第一设备上获取第一控制指令和待控制的对象的状态信息，其中，所述第一设备与所述待控制的对象之间建立有通信连接；

确定模块，设置为根据所述状态信息从所述待控制的对象中确定所述第一控制指令所请求控制的目标对象。
根据权利要求11所述的装置，其中，所述确定模块包括：

第一确定单元，设置为解析所述待控制的对象的状态信息，根据预定对应关系从所述待控制的对象中确定所述目标对象，其中，所述预定对应关系用于描述状态信息与目标对象的对应关系。
根据权利要求11所述的装置，其中，所述确定模块包括：

第二确定单元，设置为根据所述第一控制指令确定待控制的对象的指定状态信息；

第三确定单元，设置为将状态信息与所述指定状态信息匹配的待控制的对象确定为所述目标对象。
根据权利要求11所述的装置，其中，所述装置还包括：

发送模块，设置为在所述确定模块根据所述状态信息从所述待控制的对象中确定所述第一控制指令所请求控制的目标对象之后，在从所述待控制的对象中确定出所述目标对象的情况下，通过所述第一设备向所述目标对象发送第二控制指令，其中，所述第二控制指令用于指示所述目标对象执行所述第一控制指令所请求的操作。
一种存储介质，所述存储介质中存储有计算机程序，其中，所述计算机程序被设置为运行时执行所述权利要求1至10任一项中所述的方法。
一种电子装置，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器被设置为运行所述计算机程序以执行所述权利要求1至10任一项中所述的方法。