CN115242569A - 智能家居中的人机交互方法和服务器 - Google Patents

智能家居中的人机交互方法和服务器 Download PDF

Info

Publication number
CN115242569A
CN115242569A CN202110439017.7A CN202110439017A CN115242569A CN 115242569 A CN115242569 A CN 115242569A CN 202110439017 A CN202110439017 A CN 202110439017A CN 115242569 A CN115242569 A CN 115242569A
Authority
CN
China
Prior art keywords
target
information
target object
current picture
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110439017.7A
Other languages
English (en)
Other versions
CN115242569B (zh
Inventor
蒋鹏民
王彦芳
杜兆臣
王月岭
高雪松
陈维强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hisense Group Holding Co Ltd
Original Assignee
Hisense Group Holding Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hisense Group Holding Co Ltd filed Critical Hisense Group Holding Co Ltd
Priority to CN202110439017.7A priority Critical patent/CN115242569B/zh
Publication of CN115242569A publication Critical patent/CN115242569A/zh
Application granted granted Critical
Publication of CN115242569B publication Critical patent/CN115242569B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/2803Home automation networks
    • H04L12/2816Controlling appliance services of a home automation network by calling their functionalities
    • H04L12/282Controlling appliance services of a home automation network by calling their functionalities based on user interaction within the home
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Automation & Control Theory (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本公开提供了智能家居中的人机交互方法和服务器,包括:将与用户请求相对应的文本信息进行意图识别,得到目标意图;所述目标意图包括目标对象、目标事件和目标时间;并,通过所述目标事件确定目标语音信息;在所述目标时间到达后,将获取的当前图片信息进行人脸识别,确定所述目标对象所在的空间,以在所述目标对象所在的空间播放所述目标语音信息。由此,对用户请求进行意图识别,得到目标意图,然后通过目标意图中的目标事件确定出目标语音信息,在到达目标意图中的目标时间后,确定出目标意图中的目标对象所在的空间,并在所在的空间定向播放目标语音信息,提高人机交互效率。

Description

智能家居中的人机交互方法和服务器
技术领域
本申请涉及人机交互技术领域,特别涉及一种智能家居中的人机交互方法和服务器。
背景技术
最初的智能家居中的人机交互是通过手机APP(应用程序,appliacation)进行的。但是,由于用户在家里用手机来打开空调、灯光实际上是很麻烦的。甚至还不如直接起身用手来操控。所以很快进入到第二阶段的智能家居交互,就是语音控制智能家居。直接通过语言进行控制。
现有技术中,不论是通过APP控制,还是通过语音进行控制,都会出现智能家居在指定的空间中,不论该空间中是否存在目标对象,智能家居都会根据命令完成指定操作。由此,会导致人机交互的效率较低。
发明内容
本申请的目的是提供一种智能家居中的人机交互方法和服务器,用于实现定向人机交互,以此来提高人机交互的效率。
根据示例性的实施方式中的一个方面,提供一种智能家居中的人机交互方法,所述方法包括:
将与用户请求相对应的文本信息进行意图识别,得到目标意图;所述目标意图包括目标对象、目标事件和目标时间;并,
通过所述目标事件确定目标语音信息;
在所述目标时间到达后,将获取的各空间内的当前图片信息进行身份识别,确定所述目标对象所在的空间,以在所述目标对象所在的空间播放所述目标语音信息。
本实施例产生的有益效果:本实施例通过对用户请求进行意图识别,得到目标意图,然后通过目标意图中的目标事件确定出目标语音信息,在到达目标意图中的目标时间后,确定出目标意图中的目标对象所在的空间,然后在目标对象所在的空间播放所述目标语音信息。由此,本公开实现了人机的定向交互,提高了人机交互效率。
在一些示例性的实施方式中,所述在所述目标时间到达后,对获取的各空间内的当前图片信息进行身份识别,确定所述目标对象所在的空间,包括:
针对任一获取的当前图片信息,对所述当前图片信息进行身份识别,确定所述当前图片信息中人脸的身份信息;
将所述目标对象的身份信息和所述当前图片信息中人脸的身份信息进行比对;
若所述目标对象的身份信息和所述当前图片信息中人脸的身份信息相同,则将所述当前图片信息对应的空间确定为所述目标对象所在的空间。
本实施例产生的有益效果:本实施例通过对各空间采集的当前图片信息进行人脸识别来确定出当前图片信息中的人脸的身份信息,并将识别出的人脸的身份信息和目标对象的身份信息进行比对,以此来确定出目标对象所在的空间,使得确定出结果更加准确。
在一些示例性的实施方式中,通过以下方式确定出所述目标对象的身份信息:
若所述文本信息包括目标对象的身份信息,则根据所述文本信息确定出所述目标对象的身份信息;或
若所述文本信息不包括所述目标对象的身份信息,则通过所述文本信息、所述用户的身份信息和家庭关系图谱确定出所述目标对象的身份信息。
本实施例产生的有益效果:本实施例可通过两种方式确定出目标对象的身份信息,以此可根据不同的实际情况确定出目标对象的身份信息,提高处理效率。
在一些示例性的实施方式中,通过以下方式确定出所述用户的身份信息:
若所述用户请求为语音信息,则对所述语音信息进行声纹识别,得到所述用户的身份信息;或
获取所述用户的当前图片信息,并对所述当前图片信息进行身份识别,得到所述用户的身份信息。
本实施例产生的有益效果:本实施例通过声纹识别或人脸识别的方式来确定出用户的身份信息,使得可在不同的情况下确定出用户的身份信息,提高处理效率。
在一些示例性的实施方式中,通过所述目标事件确定目标语音信息,包括:
通过预设的家庭关系图谱,确定所述用户和所述目标对象之间的家庭关系;
根据所述家庭关系和所述目标事件,得到所述目标语音信息。
本实施例产生的有益效果:通过预设的家庭关系图谱得到用户和目标对象之间的家庭关系来确定出目标语音信息,保证目标语音信息中的称呼值准确无误的。
在一个实施例中,所述根据所述家庭关系和所述目标事件,得到所述目标语音信息,包括:
基于所述家庭关系确定所述用户对所述目标对象的称呼;
利用所述用户对所述目标对象的称呼和所述目标事件,确定所述目标语音信息。
本实施例产生的有益效果:通过家庭关系确定出用户对目标对象的称呼,并根据称呼和目标事件确定目标语义信息,由此,本实施例中的目标语音信息包含对目标对象的称呼,以此更加人性化,提高用户体验。
根据示例性的实施方式中的另一方面,提供一种电子设备,所述电子设备包括存储器和处理器:
所述存储器,被配置为存储获取的各空间内的图片信息;
所述处理器,与所述存储器相连接,被配置为:
将与用户请求相对应的文本信息进行意图识别,得到目标意图;所述目标意图包括目标对象、目标事件和目标时间;并,
通过所述目标事件确定目标语音信息;
在所述目标时间到达后,将获取的各空间内的当前图片信息进行身份识别,确定所述目标对象所在的空间,以在所述目标对象所在的空间播放所述目标语音信息。
在一些示例性的实施方式中,所述处理器在执行在所述目标时间到达后,将获取的各空间内的当前图片信息进行身份识别,确定所述目标对象所在的空间,具体被配置为:
针对任一获取的当前图片信息,对所述当前图片信息进行身份识别,确定所述当前图片信息中人脸的身份信息;
将所述目标对象的身份信息和所述当前图片信息中人脸的身份信息进行比对;
若所述目标对象的身份信息和所述当前图片信息中人脸的身份信息相同,则将所述当前图片信息对应的空间确定为所述目标对象所在的空间。
在一些示例性的实施方式中,所述处理器,还被配置为:
通过以下方式确定出所述目标对象的身份信息:
若所述文本信息包括目标对象的身份信息,则根据所述文本信息确定出所述目标对象的身份信息;或
若所述文本信息不包括所述目标对象的身份信息,则通过所述文本信息、所述用户的身份信息和家庭关系图谱确定出所述目标对象的身份信息。
在一些示例性的实施方式中,所述处理器,还被配置为:
通过以下方式确定出所述用户的身份信息:
若所述用户请求为语音信息,则对所述语音信息进行声纹识别,得到所述用户的身份信息;或
获取所述用户的当前图片信息,并对所述当前图片信息进行身份识别,得到所述用户的身份信息。
在一些示例性的实施方式中,所述处理器在执行通过所述目标事件确定目标语音信息,具体被配置为:
通过预设的家庭关系图谱,确定所述用户和所述目标对象之间的家庭关系;
根据所述家庭关系和所述目标事件,得到所述目标语音信息。
在一些示例性的实施方式中,所述处理器在执行所述根据所述家庭关系和所述目标事件,得到所述目标语音信息,具体被配置为:
基于所述家庭关系确定所述用户对所述目标对象的称呼;
利用所述用户对所述目标对象的称呼和所述目标事件,确定所述目标语音信息。
本申请如上所述的智能家居中的人机交互方法,通过对用户请求进行意图识别,得到目标意图,然后通过目标意图中的目标事件确定出目标语音信息,在到达目标意图中的目标时间后,确定出目标意图中的目标对象所在的空间,然后在目标对象所在的空间对应的播放所述目标语音信息。由此,实现了定向的人机交互,提高了人机交互效率。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明申请实施例的技术方案,下面将对申请实施例中所需要使用的附图作简单地介绍,显而易见地,下面所介绍的附图仅仅是申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1A为根据本申请一个实施例的应用场景示意图之一;
图1B为根据本申请一个实施例的应用场景示意图之二;
图2为根据本申请一个实施例的智能家居中的人机交互方法的流程示意图之一;
图3为根据本申请一个实施例的智能家居中的人机交互方法中的家庭关系图谱示意图;
图4为根据本申请一个实施例的智能家居中的人机交互方法中的具体应用场景示意图之一;
图5为根据本申请一个实施例的智能家居中的人机交互方法的流程示意图之三;
图6为根据本申请一个实施例的智能家居中的人机交互方法的应用场景示意图之四;
图7为根据本申请一个实施例的智能家居中的人机交互的装置示意图;
图8为根据本申请一个实施例的服务器的结构示意图。
具体实施方式
为使申请实施例的目的、技术方案和优点更加清楚,下面将结合申请实施例中的附图,对申请实施例中的技术方案进行清楚、完整地描述。其中,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
并且,在本申请实施例的描述中,除非另有说明,″/″表示或的意思,例如,A/B可以表示A或B;文本中的″和/或″仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况,另外,在本申请实施例的描述中,″多个″是指两个或多于两个。
以下,术语″第一″、″第二″、″第三″、″第四″仅用于描述目的,而不能理解为暗示或暗示相对重要性或者隐合指明所指示的技术特征的数量。由此,限定有″第一″、″第二″、″第三″、″第四″的特征可以明示或者隐合地包括一个或者更多个该特征,在本申请实施例的描述中,除非另有说明,″多个″的含义是两个或两个以上。
现有技术中,不论是通过APP控制,还是通过语音进行控制,都会出现智能家居在指定的空间中,不论该空间中是否存在目标对象,智能家居都会根据命令完成指定操作。由此,会导致人机交互的效率较低。
有鉴于此,本申请提出了一种智能家居中的人机交互方法,通过对用户请求进行意图识别,得到目标意图,然后通过目标意图中的目标事件确定出目标语音信息,在到达目标意图中的目标时间后,确定出目标意图中的目标对象所在的空间,然后在目标对象所在的空间播放所述目标语音信息。由此,本公开实现了人机的定向交互,提高了人机交互效率。本公开提出一种智能家居中的人机交互方法和服务器。下面结合附图,对本公开进行详细的说明。并且以本公开中的电子设备为服务器为例对方案进行详细的介绍。
如图1A所示,为本公开智能家居中的人机交互方法的应用场景示意图之一,该应用场景中包括质感器1A10、服务器1A20和播放设备1A30,图1A中是以三个质感器1A10和三个播放设备1A30为例,实际上不限制质感器1A10和播放设别1A30的数量。其中,三个质感器1A10和三个播放设备1A30分别为不同房间的质感器和播放设备,且播放设备可为单独的播放设备,也可为与质感器合为一体的播放设备,本应用场景中以播放设备为单独的播放设备为例进行说明。
在一种可能的应用场景中,用户A通过房间1中的质感器1A10将用户请求发送至服务器,该用户请求为语音用户请求,服务器1A20接收到该语音用户请求后,将该语音用户请求转换为文本信息,并对该文本信息进行相应的意图识别,得到目标意图。所述目标意图包括目标对象、目标事件和目标时间。服务器1A20通过所述目标事件确定目标语音信息。并在所述目标时间到达后,服务器1A20将获取到的各质感器1A10采集各空间(房间1、房间2和房间3)内的当前图片信息进行身份识别,确定所述目标对象所在的空间。最后通过所述目标对象所在的空间对应的播放设备1A30播放所述目标语音信息。
如图1B所示,为本公开智能家居中的人机交互方法的应用场景示意图之二,该应用场景中包括质感器1B10、服务器1B20和播放设备1B30,图1B中是以三个质感器1B10和三个播放设备1B30为例,实际上不限制质感器1B10的数量。本应用场景中的播放设备1B30是与质感器合为一体的播放设备。
在一种可能的应用场景中,用户A通过房间1中的质感器1B10将用户请求发送至服务器,该用户请求为语音用户请求,服务器1B20接收到该语音用户请求后,将该语音用户请求转换为文本信息,并对该文本信息进行相应的意图识别,得到目标意图。所述目标意图包括目标对象、目标事件和目标时间。服务器1B20通过所述目标事件确定目标语音信息。并在所述目标时间到达后,服务器1B20将获取到的各质感器1B10采集各空间(房间1、房间2和房间3)内的当前图片信息进行身份识别,确定所述目标对象所在的空间。最后通过所述目标对象所在的空间对应的播放设备1B30播放所述目标语音信息。
下面,对本公开中智能家居中的人机交互方法进行详细的介绍,如图2所示,为本公智能家居中的人机交互方法的流程示意图,可包括以下步骤:
步骤201:将与用户请求相对应的文本信息进行意图识别,得到目标意图;所述目标意图包括但不限于目标对象、目标事件和目标时间;
其中,需要说明的是:
(1)可通过意图识别算法来对文本信息进行意图识别,得到目标意图。
(2)用户请求可为语音请求,也可以是文本请求。若是语音请求,则可将语音信息转化为文本信息。语音请求可通过质感器或播放设备进行输入。文本请求可通过智能终端等进行输入。
(3)若用户请求中不包含目标对象,则将所有在家的家庭成员确定为目标对象。若用户请求中不包含目标时间,则将当前时间确定为目标时间。
步骤202:通过所述目标事件确定目标语音信息;
在一个实施例中,可通过以下方式确定所述目标语音信息:通过预设的家庭关系图谱,确定所述用户和所述目标对象之间的家庭关系;根据所述家庭关系和所述目标事件,得到所述目标语音信息。可具体实施为:基于所述家庭关系确定所述用户对所述目标对象的称呼;利用所述用户对所述目标对象的称呼和所述目标事件,确定所述目标语音信息。
在构建家庭关系图谱之前,需要先进行人员信息注册。分别采集每个家庭成员的图像并打上标签,其中标签可为″爷爷″、″奶奶″、″爸爸″、″妈妈″等。然后可根据人员的注册信息和对应的标签构建家庭关系图谱。构建的家庭关系图谱不仅包含家庭中各成员的属性(姓名、年龄、性别和爱好等),各家庭成员之间的家庭关系。最终构建好的家庭关系图谱可如图3所示。
例如,通过图3中的家庭关系图谱,确定出用户与所述目标对象的家庭关系为所述目标对象为所述用户的儿子,则确定出用户对所述目标对象的称呼为儿子,若目标事件为过来吃饭,则确定出的目标语音信息为:″儿子,过来吃饭″。
步骤203:在所述目标时间到达后,将获取的各空间内的当前图片信息进行身份识别,确定所述目标对象所在的空间,以在所述目标对象所在的空间播放所述目标语音信息。
其中,可通过质感器来采集各空间内的当前图片信息。且可通过目标对象所在的空间中的播放设备来播放所述目标语音信息。播放设备可为单独的播放设备,也可为质感器合为一体的播放设备,本公开在此并不进行限定。
另外,本实施例中的身份识别可通过预设的人脸识别算法来进行。
在一个实施例中,步骤203可具体实施为:针对任一获取的当前图片信息,对所述当前图片信息进行身份识别,确定所述当前图片信息中人脸的身份信息;将所述目标对象的身份信息和所述当前图片信息中人脸的身份信息进行比对;若所述目标对象的身份信息和所述当前图片信息中人脸的身份信息相同,则将所述当前图片信息对应的空间确定为所述目标对象所在的空间。
其中,当前图片信息所对应的空间可为采集该当前图片信息的质感器所在的空间。
例如,以目标对象的身份信息为儿子,如图4所示,以妈妈在厨房、儿子在卧室、爸爸在客厅、爷爷在书房为例进行说明:
服务器获取到客厅中的质感器采集的当前图片信息,并对该当前图片信息进行身份识别,得到客厅中的当前图片信息中人脸的身份信息为爸爸。服务器对获取到的厨房中质感器采集的当前图片信息进行身份识别,得到对应的身份信息为妈妈。服务器对获取到的卧室中质感器采集的当前图片信息进行身份识别,得到对应的身份信息为儿子。服务器对获取到的书房中质感器采集的当前图片信息进行身份识别,得到对应的身份信息为爷爷。将目标对象的身份信息和当前各图片信息中人脸的身份信息进行比对,确定出目标对象儿子所在的空间为卧室。
在一个实施例中,可通过以下两种方式确定出所述目标对象的身份信息:
方式一:若所述文本信息包括目标对象的身份信息,则根据所述文本信息确定出所述目标对象的身份信息。
例如,以目标对象为小明,若文本信息为″小明,过来吃饭了″则可直接通过该文本信息确定出目标对象为小明。
方式二:若所述文本信息不包括所述目标对象的身份信息,则通过所述文本信息、所述用户的身份信息和家庭关系图谱确定出所述目标对象的身份信息。
例如,以目标对象为小明。若文本信息为″儿子,过来吃饭了″。此时并不能直接通过文本信息确定出目标对象是谁。则可通过所述文本信息、所述用户的身份信息和家庭关系图谱确定出所述目标对象的身份信息。若用户的身份信息为小红。则通过查找家庭关系图谱确定出小红的儿子是小明。则可确定出目标对象为小明。
在一个实施例中,通过以下三种方式确定出所述用户的身份信息:
方式一:若所述用户请求为语音信息,则对所述语音信息进行声纹识别,得到所述用户的身份信息。
其中,进行声纹识别的前提是对家庭中各成员都进行声纹注册,其中,声纹注册的流程为:首先,用户通过播放设备或质感器的应用程序,点击声纹注册(或者直接语音说″我要注册声纹″)。然后用户对着播放设备或质感器说指定词语。播放设备或质感器接收到用户的音频后将该音频上传到服务器。服务器对该音频进行声纹注册。若该声纹注册成功,应用程序会显示″声纹注册成功(或者播放设备或质感器播报注册成功)″并让用户选择(或说出)自己的标签(例如,爸爸、哥哥等)。
声纹注册完成后,当服务器接收到用户的请求为语音信息时,则可直接对该语音信息进行声纹识别,得到所述用户的身份信息。
方式二:若所述用户请求为语音信息,则获取所述用户的当前图片信息,并对所述当前图片信息进行身份识别,得到所述用户的身份信息。
例如,用户通过厨房中的质感器或播放设备发送的语音信息,则服务器可通过厨房中的质感器获取所述用户的图片信息,并对所述图片信息进行身份识别,得到所述用户的身份信息。
方式三:若所述用户请求为文本信息,则获取所述用户的当前图片信息,并对所述当前图片信息进行身份识别,得到所述用户的身份信息。
例如,用户在厨房中通过终端设备(手机等)发送文本信息,服务器通过终端设备的定位功能确定出用户所在的空间为厨房,则通过厨房中的质感器获取所述用户的图片信息,并对所述图片信息进行身份识别,得到所述用户的身份信息。
由此,通过对用户请求进行意图识别,得到目标意图,然后通过目标意图中的目标事件确定出目标语音信息,在到达目标意图中的目标时间后,确定出目标意图中的目标对象所在的空间,然后在目标对象所在的空播放所述目标语音信息。由此,通过意图识别得到目标对象,并在目标对象所在的空间进行定向播放目标语音,实现了定向人机交互。以此,提高了人机交互的效率。
为了进一步了解本公开提供的技术方案,下面结合图5对公开中的智能家居中的人机交互方法进行详细说明,可包括以下步骤:
步骤501:将与用户请求相对应的文本信息进行意图识别,得到目标意图;所述目标意图包括目标对象、目标事件和目标时间;
步骤502:通过预设的家庭关系图谱,确定所述用户和所述目标对象之间的家庭关系;
步骤503:根据所述家庭关系和所述目标事件,得到目标语音信息;
步骤504:在所述目标时间到达后,针对任一获取的当前图片信息,对所述当前图片信息进行身份识别,确定所述当前图片信息中人脸的身份信息;
步骤505:将所述目标对象的身份信息和所述当前图片信息中人脸的身份信息进行比对;
步骤506:若所述目标对象的身份信息和所述当前图片信息中人脸的身份信息相同,则将所述当前图片信息对应的空间确定为所述目标对象所在的空间,以在所述目标对象所在的空间播放所述目标语音信息。
下面,结合具体的应用场景对本公开的智能家居中的人机交换方法进行详细的说明,其中,场景一和场景二中的播放设备与质感器是一体的设备,场景三和场景四中的播放设备是单独的播放设备。
场景一:儿子在卧室睡觉,爷爷在书房看新闻,爸爸在客厅看电视,妈妈在厨房刚做完饭,准备叫家人过来吃饭。其中,该场景具体的流程如下:
如图4所示,妈妈对着厨房的智感器说:″饭做好了,过来吃饭吧″。服务器通过质感器接收到用户的语音信息,并将所述语音信息转换为文本信息。然后对该文本信息进行意图识别,得到目标意图。其中,该目标意图中的目标对象为:爸爸、爷爷和儿子。目标时间为:当前时间。目标事件为:过来吃饭。然后通过目标事件确定目标语音信息,针对爸爸的目标语音信息为:老公,过来吃饭。针对爷爷的目标语音信息为:公公,过来吃饭。针对儿子的目标语音信息为:儿子,过来吃饭。由于目标时间为当前时间,所以确定出目标语音信息后,则对获取到的各质感器采集各空间内的当前图片信息进行身份识别,确定出爸爸、爷爷和儿子分别所在的空间,然后在卧室播放目标语音信息:″儿子,过来吃饭″。在客厅播放目标语音信息:″老公,过来吃饭″。在书房播放目标语音信息:″公公,过来吃饭″。
场景二:儿子在卧室睡觉,爷爷在书房看新闻,爸爸在客厅看电视,妈妈在厨房刚做完饭,想要儿子帮忙端一下饭菜。该场景具体的流程如下:
如图4所示。妈妈对着厨房的智感器说:″儿子,过来端一下饭菜″。服务器通过质感器接收到用户的语音信息,并将所述语音信息转换为文本信息。然后对该文本信息进行意图识别,得到目标意图。其中,该目标意图中的目标对象为:儿子。目标时间为:当前时间。目标事件为:过来端一下饭菜。然后通过目标事件确定目标语音信息,确定出的目标语音信息为:儿子,过来端一下饭菜。由于目标时间为当前时间,所以确定出目标语音信息后,则对获取到的各质感器采集各空间内的当前图片信息进行身份识别,确定出儿子分别所在的空间,然后在卧室通过播放设备播放目标语音信息:″儿子,过来端一下饭菜″。
场景三:儿子在卧室睡觉,爸爸在书房工作,妈妈在客厅看电视。爸爸在书房,爸爸想要订今天下午三点去开会的提醒。该场景的具体流程为:
如图6所示,爸爸通过书房中的播放设备或质感器发送用户请求,即帮我订今天下午三点去开会的提醒。服务器通过播放设备接收到用户请求,对该用户的语音信息进行声纹识别,得到用户的身份信息为爸爸。并将该语音信息转换为文本信息,对该文本信息进行意图识别,得到目标对象为:爸爸。目标时间为:今天下午三点。目标事件为:提醒开会。确定出目标语音信息为:″爸爸,听到提醒后请记得开会″。当到下午三点后,服务器将对获取到的各质感器采集各空间内的当前图片信息进行身份识别,确定出爸爸所在的空间为书房。则在书房的播放设备中播放目标语音:″爸爸,听到提醒后请记得开会″。
场景四:儿子在卧室睡觉,爸爸在书房工作,妈妈在客厅看电视。妈妈想到今天周六,要设置提醒儿子上午十点要去学习。基于该场景的具体实现过程:
如图6所示,妈妈可通过对客厅中的播放设备或质感器发送语音信息,质感器或播放设备接收到语音信息后,将该语音信息发送至服务器中,服务器接收到该语音信息,对该语音信息进行声纹识别,确定出用户的身份信息为″妈妈″。然后服务器将该语音信息转换为文本信息。并对该文本信息进行意图识别,得到目标对象:儿子,目标时间:今天上午十点。目标事件:提醒学习。根据该目标事件得到目标语音信息:″儿子,听到妈妈的提醒后去学习哦″。当到达十点后,服务器对获取到的各质感器采集各空间内的当前图片信息进行身份识别,得到儿子所在的空间为客厅,则通过客厅中的播放设备播放目标语音信息:″儿子,听到妈妈的提醒后去学习哦″。
基于相同的构思,如图7所示,本申请还提供了一种智能家居中的人机交互装置700,该包括目标意图确定模块710、目标语音信息确定模块720和目标对象所在空间确定730。
目标意图确定模块710,用于将与用户请求相对应的文本信息进行意图识别,得到目标意图;所述目标意图包括目标对象、目标事件和目标时间;
目标语音信息确定模块720,用于通过所述目标事件确定目标语音信息;
目标对象所在空间确定模块730,用于在所述目标时间到达后,将获取的各空间内的当前图片信息进行身份识别,确定所述目标对象所在的空间,以在所述目标对象所在的空间播放所述目标语音信息。
在一个实施例中,目标对象所在空间确定模块730,具体用于:
针对任一获取的当前图片信息,对所述当前图片信息进行身份识别,确定所述当前图片信息中人脸的身份信息;
将所述目标对象的身份信息和所述当前图片信息中人脸的身份信息进行比对;
若所述目标对象的身份信息和所述当前图片信息中人脸的身份信息相同,则将所述当前图片信息对应的空间确定为所述目标对象所在的空间。
在一个实施例中,所述装置还包括:
目标对象身份信息确定模块740,用于通过以下方式确定出所述目标对象的身份信息:
若所述文本信息包括目标对象的身份信息,则根据所述文本信息确定出所述目标对象的身份信息;或
若所述文本信息不包括所述目标对象的身份信息,则通过所述文本信息、所述用户的身份信息和家庭关系图谱确定出所述目标对象的身份信息。
在一个实施例中,所述装置还包括:
用户身份信息确定模块750,用于通过以下方式确定出所述用户的身份信息:
若所述用户请求为语音信息,则对所述语音信息进行声纹识别,得到所述用户的身份信息;或
获取所述用户的当前图片信息,并对所述当前图片信息进行人脸识别,得到所述用户的身份信息。
在一个实施例中,所述目标语音信息确定模块720,具体包括:
家庭关系确定单元721,用于通过预设的家庭关系图谱,确定所述用户和所述目标对象之间的家庭关系;
目标语音信息确定单元722,用于根据所述家庭关系和所述目标事件,得到所述目标语音信息。
在一个实施例中,所述目标语音信息确定单元722,具体用于:
基于所述家庭关系确定所述用户对所述目标对象的称呼;
利用所述用户对所述目标对象的称呼和所述目标事件,确定所述目标语音信息。
在介绍了本公开示例性实施方式的一种智能家居中的人机交互方法和服务器之后,接下来,介绍根据本公开的另一示例性实施方式的服务器。
所属技术领域的技术人员能够理解,本公开的各个方面可以实现为系统、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为″电路″、″模块″或″系统″。
在一些可能的实施方式中,根据本公开的服务器可以至少包括至少一个处理器、以及至少一个计算机存储介质。其中,计算机存储介质存储有程序代码,当程序代码被处理器执行时,使得处理器执行本说明书上述描述的根据本公开各种示例性实施方式的智能家居中的人机交互方法中的步骤。例如,处理器可以执行如图2中所示的步骤201-203。
下面参照图8来描述根据本公开的这种实施方式的电子设备800。图8显示的电子设备800仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图8所示,电子设备800以通用电子设备的形式表现。电子设备800的组件可以包括但不限于:上述至少一个处理器801、上述至少一个计算机存储介质802、连接不同系统组件(包括计算机存储介质802和处理器801)的总线803。
总线803表示几类总线结构中的一种或多种,包括计算机存储介质总线或者计算机存储介质控制器、外围总线、处理器或者使用多种总线结构中的任意总线结构的局域总线。
计算机存储介质802可以包括易失性计算机存储介质形式的可读介质,例如随机存取计算机存储介质(RAM)821和/或高速缓存存储介质822,还可以进一步包括只读计算机存储介质(ROM)823。
计算机存储介质802还可以包括具有一组(至少一个)程序模块824的程序/实用工具825,这样的程序模块824包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
电子设备800也可以与一个或多个外部设备804(例如键盘、指向设备等)通信,还可与一个或者多个使得用户能与电子设备800交互的设备通信,和/或与使得该电子设备800能与一个或多个其它电子设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口805进行。并且,电子设备800还可以通过网络适配器806与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器806通过总线803与用于电子设备800的其它模块通信。应当理解,尽管图中未示出,可以结合电子设备800使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
在一些可能的实施方式中,本公开提供的一种智能家居中的人机交互方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在计算机设备上运行时,程序代码用于使计算机设备执行本说明书上述描述的根据本公开各种示例性实施方式的智能家居中的人机交互方法中的步骤。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取计算机存储介质(RAM)、只读计算机存储介质(ROM)、可擦式可编程只读计算机存储介质(EPROM或闪存)、光纤、便携式紧凑盘只读计算机存储介质(CD-ROM)、光计算机存储介质件、磁计算机存储介质件、或者上述的任意合适的组合。
本公开的实施方式的智能家居中的人机交互的程序产品可以采用便携式紧凑盘只读计算机存储介质(CD-ROM)并包括程序代码,并可以在电子设备上运行。然而,本公开的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开操作的程序代码,程序设计语言包括面向对象的程序设计语言一诸如Java、C++等,还包括常规的过程式程序设计语言一诸如″C″语言或类似的程序设计语言。程序代码可以完全地在用户电子设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户电子设备上部分在远程电子设备上执行、或者完全在远程电子设备或服务器上执行。在涉及远程电子设备的情形中,远程电子设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)一连接到用户电子设备,或者,可以连接到外部电子设备(例如利用因特网服务提供商来通过因特网连接)。
应当注意,尽管在上文详细描述中提及了装置的若干模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块的特征和功能可以在一个模块中具体化。反之,上文描述的一个模块的特征和功能可以进一步划分为由多个模块来具体化。
此外,尽管在附图中以特定顺序描述了本公开方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
本领域内的技术人员应明白,本公开的实施例可提供为方法、系统、或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘计算机存储介质、CD-ROM、光学计算机存储介质等)上实施的计算机程序产品的形式。
本公开是参照根据本公开的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读计算机存储介质中,使得存储在该计算机可读计算机存储介质中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本公开进行各种改动和变型而不脱离本公开的精神和范围。这样,倘若本公开的这些修改和变型属于本公开权利要求及其等同技术的范围之内,则本公开也意图包含这些改动和变型在内。

Claims (10)

1.一种智能家居中的人机交互方法,其特征在于,所述方法包括:
将与用户请求相对应的文本信息进行意图识别,得到目标意图;所述目标意图包括目标对象、目标事件和目标时间;并,
通过所述目标事件确定目标语音信息;
在所述目标时间到达后,将获取的各空间内的当前图片信息进行身份识别,确定所述目标对象所在的空间,以在所述目标对象所在的空间播放所述目标语音信息。
2.根据权利要求1所述的方法,其特征在于,所述在所述目标时间到达后,将获取的各空间内的当前图片信息进行身份识别,确定所述目标对象所在的空间,包括:
针对任一获取的当前图片信息,对所述当前图片信息进行身份识别,确定所述当前图片信息中人脸的身份信息;
将所述目标对象的身份信息和所述当前图片信息中人脸的身份信息进行比对;
若所述目标对象的身份信息和所述当前图片信息中人脸的身份信息相同,则将所述当前图片信息对应的空间确定为所述目标对象所在的空间。
3.根据权利要求2所述的方法,其特征在于,通过以下方式确定出所述目标对象的身份信息:
若所述文本信息包括目标对象的身份信息,则根据所述文本信息确定出所述目标对象的身份信息;或
若所述文本信息不包括所述目标对象的身份信息,则通过所述文本信息、所述用户的身份信息和家庭关系图谱确定出所述目标对象的身份信息。
4.根据权利要求3所述的方法,其特征在于,通过以下方式确定出所述用户的身份信息:
若所述用户请求为语音信息,则对所述语音信息进行声纹识别,得到所述用户的身份信息;或
获取所述用户的当前图片信息,并对所述当前图片信息进行身份识别,得到所述用户的身份信息。
5.根据权利要求3所述的方法,其特征在于,通过所述目标事件确定目标语音信息,包括:
通过预设的家庭关系图谱,确定所述用户和所述目标对象之间的家庭关系;
根据所述家庭关系和所述目标事件,得到所述目标语音信息。
6.根据权利要求5所述的方法,其特征在于,所述根据所述家庭关系和所述目标事件,得到所述目标语音信息,包括:
基于所述家庭关系确定所述用户对所述目标对象的称呼;
利用所述用户对所述目标对象的称呼和所述目标事件,确定所述目标语音信息。
7.一种电子设备,其特征在于,所述电子设备包括存储器和处理器:
所述存储器,被配置为存储获取的各空间内的图片信息;
所述处理器,与所述存储器相连接,被配置为:
将与用户请求相对应的文本信息进行意图识别,得到目标意图;所述目标意图包括目标对象、目标事件和目标时间;并,
通过所述目标事件确定目标语音信息;
在所述目标时间到达后,将获取的各空间内的当前图片信息进行身份识别,确定所述目标对象所在的空间,以在所述目标对象所在的空间播放所述目标语音信息。
8.根据权利要求7所述的电子设备,其特征在于,所述处理器在执行在所述目标时间到达后,将获取的各空间内的当前图片信息进行身份识别,确定所述目标对象所在的空间,具体被配置为:
针对任一获取的当前图片信息,对所述当前图片信息进行身份识别,确定所述当前图片信息中人脸的身份信息;
将所述目标对象的身份信息和所述当前图片信息中人脸的身份信息进行比对;
若所述目标对象的身份信息和所述当前图片信息中人脸的身份信息相同,则将所述当前图片信息对应的空间确定为所述目标对象所在的空间。
9.根据权利要求8所述的电子设备,其特征在于,所述处理器,还被配置为:
通过以下方式确定出所述目标对象的身份信息:
若所述文本信息包括目标对象的身份信息,则根据所述文本信息确定出所述目标对象的身份信息;或
若所述文本信息不包括所述目标对象的身份信息,则通过所述文本信息、所述用户的身份信息和家庭关系图谱确定出所述目标对象的身份信息。
10.根据权利要求9所述的电子设备,其特征在于,所述处理器,还被配置为:
通过以下方式确定出所述用户的身份信息:
若所述用户请求为语音信息,则对所述语音信息进行声纹识别,得到所述用户的身份信息;或
获取所述用户的当前图片信息,并对所述当前图片信息进行身份识别,得到所述用户的身份信息。
CN202110439017.7A 2021-04-23 2021-04-23 智能家居中的人机交互方法和服务器 Active CN115242569B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110439017.7A CN115242569B (zh) 2021-04-23 2021-04-23 智能家居中的人机交互方法和服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110439017.7A CN115242569B (zh) 2021-04-23 2021-04-23 智能家居中的人机交互方法和服务器

Publications (2)

Publication Number Publication Date
CN115242569A true CN115242569A (zh) 2022-10-25
CN115242569B CN115242569B (zh) 2023-12-05

Family

ID=83665735

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110439017.7A Active CN115242569B (zh) 2021-04-23 2021-04-23 智能家居中的人机交互方法和服务器

Country Status (1)

Country Link
CN (1) CN115242569B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140289323A1 (en) * 2011-10-14 2014-09-25 Cyber Ai Entertainment Inc. Knowledge-information-processing server system having image recognition system
CN106741396A (zh) * 2016-12-28 2017-05-31 北京拜克洛克科技有限公司 一种智能单车及智能单车控制系统
CN109165620A (zh) * 2018-09-04 2019-01-08 张晓飞 一种电动车的检测方法、系统及终端设备
CN109508687A (zh) * 2018-11-26 2019-03-22 北京猎户星空科技有限公司 人机交互控制方法、装置、存储介质和智能设备
CN110516083A (zh) * 2019-08-30 2019-11-29 京东方科技集团股份有限公司 相册管理方法、存储介质及电子设备
CN110794964A (zh) * 2019-10-22 2020-02-14 深圳追一科技有限公司 虚拟机器人的交互方法、装置、电子设备及存储介质
CN110795532A (zh) * 2019-10-18 2020-02-14 珠海格力电器股份有限公司 一种语音信息的处理方法、装置、智能终端以及存储介质
CN111416758A (zh) * 2020-03-27 2020-07-14 海信集团有限公司 智慧家居实时对讲系统及方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140289323A1 (en) * 2011-10-14 2014-09-25 Cyber Ai Entertainment Inc. Knowledge-information-processing server system having image recognition system
CN106741396A (zh) * 2016-12-28 2017-05-31 北京拜克洛克科技有限公司 一种智能单车及智能单车控制系统
CN109165620A (zh) * 2018-09-04 2019-01-08 张晓飞 一种电动车的检测方法、系统及终端设备
CN109508687A (zh) * 2018-11-26 2019-03-22 北京猎户星空科技有限公司 人机交互控制方法、装置、存储介质和智能设备
CN110516083A (zh) * 2019-08-30 2019-11-29 京东方科技集团股份有限公司 相册管理方法、存储介质及电子设备
CN110795532A (zh) * 2019-10-18 2020-02-14 珠海格力电器股份有限公司 一种语音信息的处理方法、装置、智能终端以及存储介质
CN110794964A (zh) * 2019-10-22 2020-02-14 深圳追一科技有限公司 虚拟机器人的交互方法、装置、电子设备及存储介质
CN111416758A (zh) * 2020-03-27 2020-07-14 海信集团有限公司 智慧家居实时对讲系统及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
3GPP: ""DRAFT_Work_plan_3gpp_131211"", 3GPP TSG_SA\\TSG_SA *
邹嘉程: "基于语音交互及人脸识别的服务机器人研究与实现", 中国优秀硕士学位论文全文数据库 *

Also Published As

Publication number Publication date
CN115242569B (zh) 2023-12-05

Similar Documents

Publication Publication Date Title
CN109377987B (zh) 智能语音设备间的交互方法、装置、设备及存储介质
CN107370649B (zh) 家电控制方法、系统、控制终端、及存储介质
CN111447123B (zh) 一种智慧家居的配置方法、装置、电子设备及介质
CN109658932B (zh) 一种设备控制方法、装置、设备及介质
EP3300074B1 (en) Information processing apparatus
US10930277B2 (en) Configuration of voice controlled assistant
CN1938757B (zh) 用于驱动多个应用的方法和对话管理系统
CN110310657B (zh) 一种音频数据处理方法及装置
JP2017009867A (ja) 制御装置、その方法及びプログラム
WO2020135334A1 (zh) 电视应用主题切换方法、电视、可读存储介质及设备
CN110738994A (zh) 一种智能家居的控制方法、装置、机器人及系统
CN110277092A (zh) 一种语音播报方法、装置、电子设备及可读存储介质
CN111710339A (zh) 一种基于数据可视化展示技术的语音识别交互系统及方法
CN111183488A (zh) 医疗查询应答设备
CN106251871A (zh) 一种语音控制音乐本地播放装置
US20210065708A1 (en) Information processing apparatus, information processing system, information processing method, and program
US12101429B2 (en) Method for service decision distribution among multiple terminal devices and system
CN109597996A (zh) 一种语义解析方法、装置、设备和介质
CN115242569B (zh) 智能家居中的人机交互方法和服务器
CN111931046A (zh) 一种信息智能推荐方法、装置及计算机设备
CN109658924B (zh) 会话消息处理方法、装置及智能设备
CN112309387A (zh) 用于处理信息的方法和装置
CN110196900A (zh) 用于终端的交互方法和装置
CN113314115B (zh) 终端设备的语音处理方法、终端设备及可读存储介质
WO2023040109A1 (zh) 智能语音提示方法、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant