CN107808145B - 基于多模态智能机器人的交互身份鉴别与跟踪方法及系统 - Google Patents

基于多模态智能机器人的交互身份鉴别与跟踪方法及系统 Download PDF

Info

Publication number
CN107808145B
CN107808145B CN201711110949.7A CN201711110949A CN107808145B CN 107808145 B CN107808145 B CN 107808145B CN 201711110949 A CN201711110949 A CN 201711110949A CN 107808145 B CN107808145 B CN 107808145B
Authority
CN
China
Prior art keywords
interactive
identity
modal
information
face
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711110949.7A
Other languages
English (en)
Other versions
CN107808145A (zh
Inventor
刘扬
李佩琛
邵阳雪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Henan University
Original Assignee
Henan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Henan University filed Critical Henan University
Priority to CN201711110949.7A priority Critical patent/CN107808145B/zh
Publication of CN107808145A publication Critical patent/CN107808145A/zh
Application granted granted Critical
Publication of CN107808145B publication Critical patent/CN107808145B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/166Detection; Localisation; Normalisation using acquisition arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/31User authentication
    • G06F21/32User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/18Artificial neural networks; Connectionist approaches
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/22Interactive procedures; Man-machine interfaces

Abstract

本发明属于智能机器人领域,具体涉及用于智能对话机器人的多模态的鉴别和跟踪交互者身份的方法,尤其涉及基于多模态智能机器人的交互身份鉴别与跟踪方法及系统。基于多模态智能机器人的交互身份鉴别与跟踪方法,包括:采集交互对象的多通道信息;采用深度神经网络提取激活特征,构成多通道交互信息的多模态特征;采用跨模态概率认知的集成学习,对人脸图像特征和声纹特征进行身份鉴别;对由跨模态属性鉴别出的交互者身份进行注册和跟踪。基于多模态智能机器人的交互身份鉴别与跟踪系统,包括:多通道信息采集模块;多模态特征提取模块;跨模态身份鉴别模块;交互对象注册跟踪模块。本发明可解决单模态信息缺失,无法识别和跟踪交互身份问题。

Description

基于多模态智能机器人的交互身份鉴别与跟踪方法及系统
技术领域
本发明属于智能机器人领域,具体涉及用于智能对话机器人的多模态的鉴别和跟踪交互者身份的方法,尤其涉及基于多模态智能机器人的交互身份鉴别与跟踪方法及系统。
背景技术
随着计算机技术和人工智能的发展,智能机器人的研究已经逐步走到众多的服务领域。人机交互是智能对话机器人研究的重要技术问题,用户在与对话机器进行交互时,只有智能对话机器人识别和记忆参与交互的对话者信息,才能有效地理解对话或交互含义。同时交互参与者的历史信息记录了用户的兴趣等信息,交互者的上下文信息也为智能机器人进一步决策提供参考。
现有的智能机器人的人机对话技术一般不考虑交互者的身份信息和上下文信息,非常不利于人机的后续对话进行。现有智能机器人的交互身份识别一般采用单模态进行,当对应模态信息缺失时,无法有效地实时跟踪交互者身份信息。
发明内容
本发明的目的是为了解决智能机器人的多模态身份识别问题,提供对话智能机器人的多模态的鉴别和跟踪交互者身份的方法及系统,可解决单模态信息缺失,无法识别和跟踪交互身份问题。
为了实现上述目的,本发明采用以下技术方案:
一种基于多模态智能机器人的交互身份鉴别与跟踪方法,包括以下步骤:
步骤1:采集交互对象的多通道信息;
步骤2:采用深度神经网络提取激活特征,构成多通道交互信息的多模态特征;
步骤3:采用跨模态概率认知的集成学习,对人脸图像特征和声纹特征进行身份鉴别;
步骤4:对由跨模态属性鉴别出的交互者身份进行注册和跟踪。
优选地,所述步骤1包括以下步骤:
步骤11:采集交互者的声纹和语音信息;
步骤12:采集交互者的人脸RGB图像和肢体信息;
步骤13:采集交互者的人脸红外图像;
步骤14:采集交互者的人脸深度图像和肢体动作。
优选地,所述步骤2包括以下步骤:
步骤21:对语音信息做短时傅立叶变换生成声谱图,利用声纹深度信念网络提取声谱图的激活特征构造语音的声纹特征;
步骤22:对采集的人脸RGB图像、人脸红外图像和人脸深度图像进行配准,构成复合人脸图像,采用人脸深度卷积网络提取复合人脸的图像特征。
优选地,所述步骤3包括以下步骤:
步骤31:提取时间和空间上下文;
步骤32:检索与输入多模态属性特征相似的交互身份知识图谱;
步骤33:在交互身份的时间和空间上下文及知识图谱先验下,采用概率认知集成声纹和人脸图像特征,实现交互者的跨模态身份鉴别。
优选地,所述步骤4包括以下步骤:
步骤41:检查交互历史记录是否有当前交互者的身份信息,如无注册信息则新添加交互者记录,同时更新交互者身份的时间和空间上下文,并同步更新交互身份与多模态属性特征的知识图谱信息;
步骤42:跟踪交互者身份信息和交互意图,根据交互身份和交互意图,执行交互任务。
基于多模态智能机器人的交互身份鉴别与跟踪系统,包括:
多通道信息采集模块,用于采集交互对象的多通道信息;
多模态特征提取模块,用于采用深度神经网络提取激活特征,构成多通道交互信息的多模态特征;
跨模态身份鉴别模块,用于采用跨模态概率认知的集成学习,对人脸图像特征和声纹特征进行身份鉴别;
交互对象注册跟踪模块,用于对由跨模态属性鉴别出的交互者身份进行注册和跟踪。
优选地,所述多通道信息采集模块包括:
第一采集模块,用于采集交互者的声纹和语音信息;
第二采集模块,用于采集交互者的人脸RGB图像和肢体信息;
第三采集模块,用于采集交互者的人脸红外图像;
第四采集模块,用于采集交互者的人脸深度图像和肢体动作。
优选地,所述多模态特征提取模块包括:
第一特征提取模块,用于对语音信息做短时傅立叶变换生成声谱图,利用声纹深度信念网络提取声谱图的激活特征构造语音的声纹特征;
第二特征提取模块,用于对采集的人脸RGB图像、人脸红外图像和人脸深度图像进行配准,构成复合人脸图像,采用人脸深度卷积网络提取复合人脸的图像特征。
优选地,所述跨模态身份鉴别模块包括:
上下文提取模块,用于提取时间和空间上下文;
知识图谱检索模块,用于检索与输入多模态属性特征相似的交互身份知识图谱;
跨模态身份鉴别模块,用于在交互身份的时间和空间上下文及知识图谱先验下,采用概率认知集成声纹和人脸图像特征,实现交互者的跨模态身份鉴别。
优选地,所述交互对象注册跟踪模块包括:
注册模块,用于检查交互历史记录是否有当前交互者的身份信息,如无注册信息则新添加交互者记录,同时更新交互者身份的时间和空间上下文,并同步更新交互身份与多模态属性特征的知识图谱信息;
跟踪模块,用于跟踪交互者身份信息和交互意图,根据交互身份和交互意图,执行交互任务。
与现有技术相比,本发明具有的有益效果:
1.本发明采用多模态信息实现跨模态身份识别,可解决单模态信息缺失,无法识别和跟踪交互身份问题。
2.本发明利用交互身份知识图谱信息和交互者的身份信息,可提升智能机器人对交互身份识别精度和效率。
3.本发明可有效利用交互历史信息和上下文信息,便于智能机器人理解交互者目的和意图。
附图说明
图1为本发明基于多模态智能机器人的交互身份鉴别与跟踪方法的基本流程示意图之一。
图2为本发明基于多模态智能机器人的交互身份鉴别与跟踪方法的基本流程示意图之二。
图3为本发明基于多模态智能机器人的交互身份鉴别与跟踪系统的结构示意图之一。
图4为本发明基于多模态智能机器人的交互身份鉴别与跟踪系统的结构示意图之二。
具体实施方式
下面结合附图和具体的实施例对本发明做进一步的解释说明:
实施例一:
如图1所示,本发明的一种基于多模态智能机器人的交互身份鉴别与跟踪方法,包括以下步骤:
步骤S101:采集交互对象的多通道信息;
步骤S102:采用深度神经网络提取激活特征,构成多通道交互信息的多模态特征;
步骤S103:采用跨模态概率认知的集成学习,对人脸图像特征和声纹特征进行身份鉴别;
步骤S104:对由跨模态属性鉴别出的交互者身份进行注册和跟踪。
实施例二:
如图2所示,本发明的另一种基于多模态智能机器人的交互身份鉴别与跟踪方法,包括以下步骤:
步骤S201:采集交互对象的多通道信息MI,包括:
作为一种可实施方式,智能机器人为智能对话机器人,包括:麦克风阵列、双目摄像头、红外摄像头及深度传感器;
步骤S2011:通过智能对话机器人的麦克风阵列,采集交互者的声纹和语音信息VA,为识别交互身份和理解交互意图收集信息;
步骤S2012:通过智能对话机器人的双目摄像头,采集交互者的人脸RGB图像FV和肢体信息,为鉴别交互身份和理解交互意图收集信息,其中人脸RGB图像FV包括左右两幅人脸RGB图像FvL和FvR;
步骤S2013:通过智能对话机器人的红外摄像头,采集交互者的人脸红外图像FI,为对交互者做活体检测收集信息;
步骤S2014:通过智能对话机器人的深度传感器,采集交互者的人脸深度图像FD和肢体动作,为进一步识别交互身份和理解交互意图收集信息;
上述步骤S2011、S2012、S2013及S2014,产生交互对象的交互者的四元组多通道信息MI<VA,FV,FI,FD>。
步骤S202:采用深度神经网络提取激活特征构成多通道交互信息的多模态特征MF,所述深度神经网络包括:声纹深度信念网络DBNv和人脸深度卷积网络DCNf,交互对象的多模态特征矩阵MF的提取,由以下步骤实现:
步骤S2021:对语音信息VA做短时傅立叶变换生成声谱图VF,利用声纹深度信念网络DBNv提取声谱图的激活特征,构造交互者语音的声纹特征FS;
步骤S2022:对采集的左右两幅人脸RGB图像FvL和FvR、一幅人脸深度图像FD和一幅人脸红外图像FI进行配准,构成复合人脸图像,由于一个摄像头采集的RGB图像包括红、绿、蓝3个通道,故本发明构成8通道的复合人脸图像CF<FvLr,FvLg,FvLb,FvRr,FvRg,FvRb,FD,FI>,其中,FvLr、FvLg、FvLb分别为通过智能对话机器人的左目摄像头红、绿、蓝三个通道获取的RGB图像,FvRr、FvRg、FvRb分别为通过智能对话机器人的右目摄像头红、绿、蓝三个通道获取的RGB图像,FD为人脸深度图像,FI为人脸红外图像;采用人脸深度卷积网络DCNf,提取复合人脸图像的激活特征,构造交互者复合的人脸图像特征FF。
步骤S2021及S2022提取的交互者的语音声纹特征FS和复合的人脸图像特征FF构成多模态特征矩阵MF<FF,FS>。
步骤S202可看成利用深度神经网络DNN(DCNf,DCNv),对多通道输入MI<VA,FV,FI,FD>的一个非线性映射,即:
DNN(DCNf,DCNv):MI<VA,FV,FI,FD>→MF<FF,FS>。
步骤S203:采用跨模态概率认知的集成学习,根据人脸图像特征FF和声纹特征FS鉴别参与交互的身份ID,对多模态特征矩阵MF<FF,FS>进行身份鉴别,包括以下步骤:
步骤S2031:提取和当前时间最近的时间上下文、及和当前空间相邻的位置的空间上下文CTS<CTid,CSid>,为鉴别交互身份提供上下文判断依据,其中CTid是和当前时间最近的时间上下文,CSid是和当前空间相邻的位置的空间上下文,和当前时间最近的时间上下文、及和当前空间相邻的位置的空间上下文CTS<CTid,CSid>简称为时空上下文CTS;
步骤S2032:检索与输入多模态属性特征MF相似的关联概率Po最高的交互身份知识图谱KG<MF,ID,PS>,为鉴别交互身份提供属性特征判断依据;
步骤S2033:根据交互者多模态特征矩阵MF<FF,FS>,在交互身份的时空上下文CTS和知识图谱KG先验下,构成交互身份类型判定条件TC<MF,KG,CTS>,采用概率认知集成和推断交互者的身份IDi。由交互者的先验概率P(IDi),根据贝叶斯学习规则,交互对象的身份IDi为:
Figure BDA0001465275090000051
其中i是被识别出的当前交互用户身份编号,j是所有其他曾参与的交互用户身份编号,n是参与系统交互用户的总数。
步骤S204:对由跨模态属性鉴别出的交互者身份ID进行注册和跟踪,为智能机器人进一步采取对话的策略提供决策依据,包括:
步骤S2041:检查交互历史记录是否有当前交互者的身份信息IDi,如无注册信息则新添加交互者记录,同时更新交互者身份的时间和空间上下文CTS<CTid,CSid>;在知识图谱信息KG中,并同步更新交互身份与多模态属性特征的概率置信度信息,即三元组信息KGi<MFi,IDi,PSi>,其中IDi是当前更新的交互用户身份编号,MFi是第i个交互用户的多模态属性特征,PSi是第i个交互用户的概率置信度信息;
步骤S2042:跟踪交互者身份信息IDi和交互意图,根据交互身份IDi和交互意图,执行指定交互任务T。
实施例三:
如图3所示,本发明的一种基于多模态智能机器人的交互身份鉴别与跟踪系统,包括:
多通道信息采集模块301,用于采集交互对象的多通道信息;
多模态特征提取模块302,用于采用深度神经网络提取激活特征,构成多通道交互信息的多模态特征;
跨模态身份鉴别模块303,用于采用跨模态概率认知的集成学习,对人脸图像特征和声纹特征进行身份鉴别;
交互对象注册跟踪模块304,用于对由跨模态属性鉴别出的交互者身份进行注册和跟踪。
实施例四:
如图4所示,本发明的另一种基于多模态智能机器人的交互身份鉴别与跟踪系统,包括:
多通道信息采集模块401,用于采集交互对象的多通道信息;
多模态特征提取模块402,用于采用深度神经网络提取激活特征构成多通道交互信息的多模态特征;
跨模态身份鉴别模块403,用于采用跨模态概率认知的集成学习对人脸图像特征和声纹特征进行身份鉴别;
交互对象注册跟踪模块404,用于对由跨模态属性鉴别出的交互者身份进行注册和跟踪。
所述多通道信息采集模块401包括:
第一采集模块4011,用于采集交互者的声纹和语音信息;
第二采集模块4012,用于采集交互者的人脸RGB图像和肢体信息;
第三采集模块4013,用于采集交互者的人脸红外图像;
第四采集模块4014,用于采集交互者的人脸深度图像和肢体动作。
所述多模态特征提取模块402包括:
第一特征提取模块4021,用于对语音信息做短时傅立叶变换生成声谱图,利用声纹深度信念网络提取声谱图的激活特征构造语音的声纹特征;
第二特征提取模块4022,用于对采集的人脸RGB图像、人脸红外图像和人脸深度图像进行配准,构成复合人脸图像,采用人脸深度卷积网络提取复合人脸的图像特征。
所述跨模态身份鉴别模块403包括:
上下文提取模块4031,用于提取时间和空间上下文;
知识图谱检索模块4032,用于检索与输入多模态属性特征相似的交互身份知识图谱;
跨模态身份鉴别模块4033,用于在交互身份的时间和空间上下文及知识图谱先验下,采用概率认知集成声纹和人脸图像特征,实现交互者的跨模态身份鉴别。
所述交互对象注册跟踪模块404包括:
注册模块4041,用于检查交互历史记录是否有当前交互者的身份信息,如无注册信息则新添加交互者记录,同时更新交互者身份的时间和空间上下文,并同步更新交互身份与多模态属性特征的知识图谱信息;
跟踪模块4042,用于跟踪交互者身份信息和交互意图,根据交互身份和交互意图,执行交互任务。
以上所示仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (6)

1.一种基于多模态智能机器人的交互身份鉴别与跟踪方法,其特征在于,包括以下步骤:
步骤1:采集交互对象的多通道信息,包括:采集交互者的声纹和语音信息;采集交互者的人脸RGB图像和肢体信息;采集交互者的人脸红外图像;采集交互者的人脸深度图像和肢体动作;
步骤2:采用深度神经网络提取激活特征,构成多通道交互信息的多模态特征,包括:
步骤21:对语音信息做短时傅立叶变换生成声谱图,利用声纹深度信念网络提取声谱图的激活特征构造语音的声纹特征;
步骤22:对采集的人脸RGB图像、人脸红外图像和人脸深度图像进行配准,构成复合人脸图像,采用人脸深度卷积网络提取复合人脸的图像特征;
步骤3:采用跨模态概率认知的集成学习,对人脸图像特征和声纹特征进行身份鉴别;
步骤4:对由跨模态属性鉴别出的交互者身份进行注册和跟踪。
2.根据权利要求1所述的基于多模态智能机器人的交互身份鉴别与跟踪方法,其特征在于,所述步骤3包括以下步骤:
步骤31:提取时间和空间上下文;
步骤32:检索与输入多模态属性特征相似的交互身份知识图谱;
步骤33:在交互身份的时间和空间上下文及知识图谱先验下,采用概率认知集成声纹和人脸图像特征,实现交互者的跨模态身份鉴别。
3.根据权利要求1所述的基于多模态智能机器人的交互身份鉴别与跟踪方法,其特征在于,所述步骤4包括以下步骤:
步骤41:检查交互历史记录是否有当前交互者的身份信息,如无注册信息则新添加交互者记录,同时更新交互者身份的时间和空间上下文,并同步更新交互身份与多模态属性特征的知识图谱信息;
步骤42:跟踪交互者身份信息和交互意图,根据交互身份和交互意图,执行交互任务。
4.一种基于多模态智能机器人的交互身份鉴别与跟踪系统,其特征在于,包括:
多通道信息采集模块,用于采集交互对象的多通道信息,包括:
第一采集模块,用于采集交互者的声纹和语音信息;
第二采集模块,用于采集交互者的人脸RGB图像和肢体信息;
第三采集模块,用于采集交互者的人脸红外图像;
第四采集模块,用于采集交互者的人脸深度图像和肢体动作;多模态特征提取模块,用于采用深度神经网络提取激活特征,构成多通道交互信息的多模态特征,包括:
第一特征提取模块,用于对语音信息做短时傅立叶变换生成声谱图,利用声纹深度信念网络提取声谱图的激活特征构造语音的声纹特征;
第二特征提取模块,用于对采集的人脸RGB图像、人脸红外图像和人脸深度图像进行配准,构成复合人脸图像,采用人脸深度卷积网络提取复合人脸的图像特征;
跨模态身份鉴别模块,用于采用跨模态概率认知的集成学习,对人脸图像特征和声纹特征进行身份鉴别;
交互对象注册跟踪模块,用于对由跨模态属性鉴别出的交互者身份进行注册和跟踪。
5.根据权利要求4所述的基于多模态智能机器人的交互身份鉴别与跟踪系统,其特征在于,所述跨模态身份鉴别模块包括:
上下文提取模块,用于提取时间和空间上下文;
知识图谱检索模块,用于检索与输入多模态属性特征相似的交互身份知识图谱;
跨模态身份鉴别模块,用于在交互身份的时间和空间上下文及知识图谱先验下,采用概率认知集成声纹和人脸图像特征,实现交互者的跨模态身份鉴别。
6.根据权利要求4所述的基于多模态智能机器人的交互身份鉴别与跟踪系统,其特征在于,所述交互对象注册跟踪模块包括:
注册模块,用于检查交互历史记录是否有当前交互者的身份信息,如无注册信息则新添加交互者记录,同时更新交互者身份的时间和空间上下文,并同步更新交互身份与多模态属性特征的知识图谱信息;
跟踪模块,用于跟踪交互者身份信息和交互意图,根据交互身份和交互意图,执行交互任务。
CN201711110949.7A 2017-11-13 2017-11-13 基于多模态智能机器人的交互身份鉴别与跟踪方法及系统 Active CN107808145B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711110949.7A CN107808145B (zh) 2017-11-13 2017-11-13 基于多模态智能机器人的交互身份鉴别与跟踪方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711110949.7A CN107808145B (zh) 2017-11-13 2017-11-13 基于多模态智能机器人的交互身份鉴别与跟踪方法及系统

Publications (2)

Publication Number Publication Date
CN107808145A CN107808145A (zh) 2018-03-16
CN107808145B true CN107808145B (zh) 2021-03-30

Family

ID=61583796

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711110949.7A Active CN107808145B (zh) 2017-11-13 2017-11-13 基于多模态智能机器人的交互身份鉴别与跟踪方法及系统

Country Status (1)

Country Link
CN (1) CN107808145B (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108986825A (zh) * 2018-07-02 2018-12-11 北京百度网讯科技有限公司 基于语音交互的上下文获取方法及设备
CN108920639B (zh) * 2018-07-02 2022-01-18 北京百度网讯科技有限公司 基于语音交互的上下文获取方法及设备
CN109101871A (zh) * 2018-08-07 2018-12-28 北京华捷艾米科技有限公司 一种基于深度和近红外信息的活体检测装置、检测方法及其应用
CN111681517B (zh) * 2018-09-21 2021-10-26 河南大学 心理学用实验装置
CN111104833A (zh) * 2018-10-29 2020-05-05 北京三快在线科技有限公司 用于活体检验的方法和装置,存储介质和电子设备
CN109333539B (zh) * 2018-11-27 2021-06-29 深圳深度教育股份公司 机器人及其控制方法、装置和存储介质
CN109697233B (zh) * 2018-12-03 2023-06-20 中电科大数据研究院有限公司 一种知识图谱体系搭建方法
CN110377782B (zh) * 2019-07-12 2022-03-08 腾讯音乐娱乐科技(深圳)有限公司 音频检索方法、装置和存储介质
CN110580516B (zh) * 2019-08-21 2021-11-09 厦门无常师教育科技有限公司 一种基于智能机器人的交互方法及装置
US11899765B2 (en) 2019-12-23 2024-02-13 Dts Inc. Dual-factor identification system and method with adaptive enrollment
CN112530438B (zh) * 2020-11-27 2023-04-07 贵州电网有限责任公司 一种基于知识图谱辅助声纹识别的身份认证方法
CN112328999B (zh) * 2021-01-05 2021-04-06 北京远鉴信息技术有限公司 双录质检方法、装置、服务器及存储介质
CN113408690A (zh) * 2021-07-01 2021-09-17 之江实验室 基于多模态知识图谱的机器人个性化情感互动装置及方法
CN113658254B (zh) * 2021-07-28 2022-08-02 深圳市神州云海智能科技有限公司 一种处理多模态数据的方法及装置、机器人

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106127156A (zh) * 2016-06-27 2016-11-16 上海元趣信息技术有限公司 基于声纹和人脸识别的机器人交互方法
CN106462384A (zh) * 2016-06-29 2017-02-22 深圳狗尾草智能科技有限公司 基于多模态的智能机器人交互方法和智能机器人
CN107340859A (zh) * 2017-06-14 2017-11-10 北京光年无限科技有限公司 多模态虚拟机器人的多模态交互方法和系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007219190A (ja) * 2006-02-17 2007-08-30 Murata Mach Ltd 音声認識装置と認識方法及びそのプログラム
JP6693111B2 (ja) * 2015-12-14 2020-05-13 カシオ計算機株式会社 対話装置、ロボット、対話方法及びプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106127156A (zh) * 2016-06-27 2016-11-16 上海元趣信息技术有限公司 基于声纹和人脸识别的机器人交互方法
CN106462384A (zh) * 2016-06-29 2017-02-22 深圳狗尾草智能科技有限公司 基于多模态的智能机器人交互方法和智能机器人
CN107340859A (zh) * 2017-06-14 2017-11-10 北京光年无限科技有限公司 多模态虚拟机器人的多模态交互方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于多模态融合和时空上下文语义的跨媒体检索模型的研究;刘扬 等;《计算机应用》;20090430;第29卷(第4期);第1183-1186页 *

Also Published As

Publication number Publication date
CN107808145A (zh) 2018-03-16

Similar Documents

Publication Publication Date Title
CN107808145B (zh) 基于多模态智能机器人的交互身份鉴别与跟踪方法及系统
CN109658928B (zh) 一种家庭服务机器人云端多模态对话方法、装置及系统
CN111091824A (zh) 一种语音匹配方法及相关设备
CN107918771B (zh) 人物识别方法和佩戴式人物识别系统
CN111488433A (zh) 一种适用于银行的提升现场体验感的人工智能交互系统
CN107515900B (zh) 智能机器人及其事件备忘系统和方法
Acien et al. Smartphone sensors for modeling human-computer interaction: General outlook and research datasets for user authentication
CN111159387B (zh) 基于多维度报警信息文本相似度分析的推荐方法
CN101483652A (zh) 生物特征识别系统
KR20100001928A (ko) 감정인식에 기반한 서비스 장치 및 방법
CN112801054B (zh) 人脸识别模型的处理方法、人脸识别方法及装置
CN110866234B (zh) 一种基于多生物特征的身份验证系统
CN110363081A (zh) 人脸识别方法、装置、设备及计算机可读存储介质
CN107491729B (zh) 基于余弦相似度激活的卷积神经网络的手写数字识别方法
WO2021159902A1 (zh) 年龄识别方法、装置、设备及计算机可读存储介质
CN112818316B (zh) 基于声纹的身份识别及应用方法、装置与设备
CN109558805A (zh) 基于多层深度特征的人体行为识别方法
Kumar et al. A novel method for visually impaired using object recognition
CN107622300B (zh) 多模态虚拟机器人的认知决策方法和系统
KR101420189B1 (ko) 연령 및 성별을 이용한 사용자 인식 장치 및 방법
US20230136553A1 (en) Context-aided identification
CN111797849A (zh) 用户活动识别方法、装置、存储介质及电子设备
CN110413106A (zh) 一种基于语音和手势的增强现实输入方法及系统
Amroun et al. Best feature for CNN classification of human activity using IOT network
Melnyk et al. Towards computer assisted international sign language recognition system: a systematic survey

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant