CN105630142A - 一种发布和传递识别信息的方法和装置及信息识别系统 - Google Patents

一种发布和传递识别信息的方法和装置及信息识别系统 Download PDF

Info

Publication number
CN105630142A
CN105630142A CN201410623925.1A CN201410623925A CN105630142A CN 105630142 A CN105630142 A CN 105630142A CN 201410623925 A CN201410623925 A CN 201410623925A CN 105630142 A CN105630142 A CN 105630142A
Authority
CN
China
Prior art keywords
equipment
coordinate
identified object
coordinate system
identification information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410623925.1A
Other languages
English (en)
Inventor
刘海军
罗圣美
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201410623925.1A priority Critical patent/CN105630142A/zh
Priority to PCT/CN2015/093896 priority patent/WO2016070827A1/zh
Publication of CN105630142A publication Critical patent/CN105630142A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer

Abstract

本发明公开了一种<b>发布和传递识别信息的方法和装置</b>及信息识别系统,包括:第一设备发布识别信息;所述识别信息至少包括:被识别对象在第一坐标系中的坐标、第一坐标系信息。通过本发明的方案,第一设备发布被识别对象的识别信息,共享了被识别对象的识别信息,从而其他设备通过接收发布的识别信息,就能够对被识别对象进行识别,而无论被识别对象是否在其捕获范围内。

Description

一种发布和传递识别信息的方法和装置及信息识别系统
技术领域
本发明涉及计算机视觉技术,尤指一种发布和传递识别信息的方法和装置及信息识别系统。
背景技术
数字多媒体和网络的发展,丰富了人们日常生活中的娱乐体验。目前的技术让人们在家里能够观看高清电视,电视节目的来源可能来自数字光盘、有线电视、互联网等等,能够体验立体声、5.1声道、7.1声道乃至更逼真的声音效果,而且人们还能够使用平板电脑(PAD)、移动终端来实现这些体验,人们还能够通过网络在不同的设备之间转移数字内容的播放,以及通过遥控器、手势控制一个设备的播放,例如,采用手势控制切换上一频道、下一频道等等。
传统的对多个设备的控制方法是分别使用设备各自的遥控器对设备进行控制,而这些遥控器往往是互不通用的,遥控器大多不具备网络功能,例如传统的电视机、音响等。也有一些支持网络的遥控器,例如在具有计算和网络能力的设备(如移动终端,PAD等)上加载支持互通协议的软件,来控制另一设备。
随着技术的发展,多个设备之间的内容播放共享、转移需求越来越多,上述控制方法显得不够方便,例如,人们需要在一堆遥控器中挑选出与设备对应的遥控器,并且随着设备的变化需要不断的更换遥控器,或者以简单的手势来控制单一的设备。用户在对不同设备进行控制时往往需要学习使用不同的遥控器的操作方式。用户可能更希望使用更简单、更自然的操作方式来控制在较小范围内的更多设备。
手势控制是当前比较新颖的一种控制方法,即在一台设备上的摄像头监视手势动作并进行分析识别,并转化成对该设备的控制;或者用户使用可穿戴设备,通过在手上、手臂上以及身体上穿戴类似指环、手表、背心等设备来识别用户动作,从而实现对设备的控制。现有技术和一些产品能够让用户使用手势来操控设备。例如,通过在电视机上增加一个摄像头,采集、识别用户的手势,然后按照预先定义的手势与操控命令之间的对应关系,从而达到通过手势操控电视机的效果,目前已经实现的操控包括更换频道、改变音量等。
当前市场上以及实验室研究的手势识别设备均各自配置有摄像头,使用时往往需要向手势识别设备输入一个“启动指示”,例如特定的手势,或其它控制指令。当家庭、办公场景里手势识别设备较多时,例如家庭中电视、机顶盒、播放器、空调、音响等都支持手势识别,用户同时操控这些设备时,经常切换“启动指示”,这种体验并不友好,或者“启动手势”后,由于手势识别设备之间对自己的位置信息、识别出的其他设备的位置信息、识别出的手势并不发布、共享,只是各自处理识别出的手势指令,因此,手势识别设备之间容易造成识别指令输入的混淆。
目前已经能够实现设备之间的互相发现和控制,例如,现有的通用即插即用(UPnP)技术规定了设备之间如何发送、接收网络消息来实现发现和控制,该技术以网络地址及数字编码作为设备的标识,是一种机器标识,最终的控制需要用户根据设备的机器标识进行选择再操作。
已经在研究中的技术:一种手势识别装置,能够识别设备包括其位置、通讯标识参数,并发布识别的手势信息;使用手势操控时,受控装置发布能够处理的手势:手势编号、手势文字描述信息和数字图形信息。
虽然有了上述的设备、技术,但受摄像头位置(角度、高度等)、性能等限制,不易同时识别一个空间中的所有手势或设备,而现有的识别设备并不能将自身识别的信息共享给其他设备。
发明内容
为了解决上述问题,本发明提出了一种发布和传递识别信息的方法和装置及信息识别系统,能够共享识别信息。
为了达到上述目的,本发明提出了一种发布识别信息的方法,包括:
第一设备发布识别信息;所述识别信息至少包括:被识别对象在第一坐标系中的坐标、第一坐标系信息。
优选地,该方法还包括:
所述第一设备捕获图像,根据捕获的图像识别所述被识别对象获得所述识别信息。
优选地,所述被识别对象在第一坐标系中的坐标为所述被识别对象上的一个或一个以上点在第一坐标系中的坐标。
优选地,所述识别信息还包括:
所述被识别对象与所述第一设备的距离,和/或所述被识别对象的网络地址或通讯端口,和/或被识别对象标识,和/或第一设备标识。
优选地,第二设备作为所述识别对象,所述第二设备在第一坐标系中的坐标是所述识别对象在第一坐标系中的坐标。
优选地,所述第一设备以广播、或多播、或单播、或响应查询请求的方式发布所述识别信息。
本发明还提出了一种传递识别信息的方法,包括:
第二设备接收识别信息;所述识别信息至少包括:被识别对象在第一坐标系中的坐标、第一坐标系信息。
优选地,该方法还包括:
所述第二设备根据所述识别信息计算所述被识别对象在第二坐标系中的坐标。
优选地,所述第二设备根据识别信息计算被识别对象在第二坐标系中的坐标包括:
所述第二设备根据所述第二设备在第一坐标系中的坐标和所述第二设备在第二坐标系中的坐标计算转换矩阵,根据所述转换矩阵和识别信息计算所述被识别对象在第二坐标系中的坐标。
优选地,所述识别信息还包括:
所述被识别对象上的一个或一个以上点在第一坐标系中的坐标、和/或所述被识别对象的网络地址或通讯端口、和/或被识别对象标识、和/或第一设备标识。
优选地,该方法还包括:
所述第二设备根据计算的或接收到的所述被识别对象在第二坐标系中的坐标、网络地址或通讯端口,与所述被识别对象通讯。
本发明还提出了一种发布识别信息的装置,至少包括:
第一网络单元,用于发布识别信息;所述识别信息至少包括:被识别对象在第一坐标系中的坐标、第一坐标系信息。
优选地,还包括:
第一视觉识别单元,用于捕获图像,根据捕获的图像识别所述被识别对象,获得所述识别信息。
优选地,所述第一网络单元还用于:
以广播、或多播、或单播、或响应查询请求的方式发布所述识别信息。
本发明还提出了一种传递识别信息的装置,至少包括:
第二网络单元,用于接收识别信息;所述识别信息至少包括:被识别对象在第一坐标系中的坐标、所述第一坐标系信息。
优选地,还包括:
第二视觉识别单元,用于根据识别信息计算所述被识别对象在第二坐标系中的坐标。
优选地,所述视觉识别单元具体用于:
根据所述第二设备在第一坐标系中的坐标和第二设备在第二坐标系中的坐标计算转换矩阵,根据所述转换矩阵和识别信息计算所述被识别对象在第二坐标系中的坐标。
优选地,还包括:
存储模块,保存所述被识别对象上的一个或一个以上点在第一坐标系中的坐标、和/或所述被识别对象的网络地址或通讯端口、和/或被识别对象标识、和/或第一设备标识。
本发明还提出了一种信息识别系统,至少包括:
第一设备,用于发布识别信息;所述识别信息至少包括:被识别对象在第一坐标系中的坐标、第一坐标系信息;
第二设备,用于接收识别信息。
优选地,所述第一设备还用于:
捕获图像,根据捕获的图像识别所述被识别对象获得所述识别信息。
优选地,所述第一设备还用于:以广播、或多播、或单播、或响应查询请求的方式发布所述识别信息。
优选地,所述第二设备还用于:
根据所述识别信息计算被识别对象在第二坐标系中的坐标。
优选地,所述第二设备还用于:
根据所述识别信息中的第二设备在第一坐标系中的坐标和第二设备在第二坐标系中的坐标计算转换矩阵,根据所述转换矩阵和识别信息计算所述被识别对象在第二坐标系中的坐标。
优选地,所述第二设备还用于:
保存所述被识别对象上的一个或一个以上点在第一坐标系中的坐标、和/或所述被识别对象的网络地址或通讯端口、和/或被识别对象标识、和/或第一设备标识。
与现有技术相比,本发明包括:第一设备发布识别信息;识别信息至少包括:被识别对象在第一坐标系中的坐标、第一坐标系信息。通过本发明的方案,第一设备发布被识别对象的识别信息,共享了被识别对象的识别信息,从而其他设备通过接收发布的识别信息,就能够对被识别对象进行识别,而无论被识别对象是否在其捕获范围内。
附图说明
下面对本发明实施例中的附图进行说明,实施例中的附图是用于对本发明的进一步理解,与说明书一起用于解释本发明,并不构成对本发明保护范围的限制。
图1为本发明的发布识别信息的方法的流程图;
图2为本发明的传递识别信息的方法的流程图;
图3为本发明的发布识别信息的装置的结构组成示意图;
图4为本发明的传递识别信息的装置的结构组成示意图;
图5为本发明的信息识别系统的结构组成示意图;
图6是本发明的装置场景示意图;
图7为本发明的装置单元示意图;
图8为本发明的方法的流程图;
图9为本发明的消息交互示意图。
具体实施方式
为了便于本领域技术人员的理解,下面结合附图对本发明作进一步的描述,并不能用来限制本发明的保护范围。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的各种方式可以相互组合。
参见图1,本发明提出了一种发布识别信息的方法,包括:
步骤100、第一设备发布获得的识别信息。
本步骤中,第一设备可以以广播、或多播、或单播、或响应查询请求的方式发布识别信息。
本步骤中,识别信息至少包括被识别对象在第一坐标系中的坐标和第一坐标系信息。其中,第一坐标系信息是指第一坐标系的坐标描述信息,例如是直角坐标系统或极坐标系统、坐标原点、距离比例(比例尺)、位于/或指示坐标原点的设备等等。
其中,被识别对象可以是第二设备,被识别对象在第一坐标系中的坐标可以是第二设备在第一坐标系中的坐标。
其中,被识别对象在第一坐标系中的坐标可以是被识别对象上的一个或一个以上点(如中心点)在第一坐标系中的坐标;第二设备在第一坐标系中的坐标可以是第二设备上的一个或一个以上点(如中心点)在第一坐标系中的坐标。
其中,被识别对象或第二设备在第一坐标系中的坐标可以采用深度摄像头获得,具体实现属于本领域技术人员的公知常识,并不用于限定本发明的保护范围,这里不再赘述。
其中,识别信息还可以包括以下一个或多个:
被识别对象与第一设备的距离、和/或被识别对象的网络地址或通讯端口、和/或被识别对象标识、和/或第一设备标识。
其中,第一坐标系的坐标原点可以是第一设备,也可以是空间中的其他点。
其中,被识别对象标识可以是被识别对象的视觉识别特征,视觉识别特征可以是条形码标签、二维码标签、文字标签、商标标识等。
其中,被识别对象可以是电视机、播放机、存储服务器、电脑、音响、音箱、投影仪、机顶盒、汽车、机床、轮船等中的一个或多个。
本步骤中,第一设备可以通过广播或多播的方式向第二设备发送识别信息。具体的,可以采用现有的通用即插即用(UPnP)技术、或多播域名系统(mDNS)、或基于域名系统的服务发现(DNS-SD)技术来发送识别信息,具体的发送技术并不用于限定本发明的保护范围,这里不再赘述。
其中,第一设备获得被识别对象的网络地址或通讯端口可以是被识别对象发送给第一设备的。
本发明的方法中,第一设备发布被识别对象的识别信息,共享了被识别对象的识别信息,从而其他设备通过接收发布的识别信息,就能够对被识别对象进行识别,而无论被识别对象是否在其捕获范围内。
该方法之前还包括:
步骤101、第一设备捕获图像,根据捕获的图像识别被识别对象获得识别信息。
本步骤具体包括:第一设备识别被识别对象获得识别信息,或接收到查询请求。
本步骤中,第一设备识别被识别对象获得识别信息包括:
第一设备收集被识别对象的视觉识别特征,根据收集的视觉识别特征对被识别对象进行识别获得识别信息。
其中,第一设备收集被识别对象的视觉识别特征包括:
第一设备可以接收来自被识别对象的广播或多播消息;其中,广播或多播消息中包括被识别设备的视觉识别特征;或,
第一设备向被识别对象发送查询广播或多播消息,并接收来自被识别对象的响应消息;其中,响应消息中包括被识别设备的视觉识别特征。
其中,根据收集的视觉识别特征对待识别对象进行识别获得识别信息包括:
通过深度摄像头采集视觉范围内的图像或视频片段,在采集到的图像或视频片段中对收集的视觉识别特征进行匹配得到被识别对象在第一坐标系中的坐标。
当第一设备接收到来自第二设备的查询请求时,该方法还包括:
步骤102、第一设备向第二设备发送已识别的所有对象的识别信息。
本步骤中,第一设备可以通过广播、多播或单播的方式向第二设备发送识别信息。
参见图2,本发明提出了一种接收或传递识别信息的方法,包括:
步骤200、第二设备接收识别信息。
本步骤中,识别信息包括:被识别对象在第一坐标系中的坐标、和/或第二设备在第一坐标系中的坐标、和/或第一坐标系信息。其中,第一坐标系的坐标原点可以是第一设备,也可以是空间中的其他点。
本步骤中,识别信息还可以包括以下的一个或多个:
被识别对象上一个或一个以上点(例如,一个或一个以上切平面上、或轮廓上的一个或一个以上点)在第一坐标系中的坐标、被识别对象的网络地址或通讯端口、被识别对象标识、第一设备标识。
该方法之前还包括:
步骤201、第二设备发送查询请求。
该方法还包括:
步骤202、第二设备根据识别信息计算被识别对象在第二坐标系中的坐标。
本步骤中,第二设备根据第二设备在第一坐标系中的坐标和第二设备在第二坐标系中的坐标计算转换矩阵,根据计算得到的转换矩阵和识别信息(如其中的被识别对象在第一坐标系中的坐标)计算被识别对象在第二坐标系中的坐标。
其中,转换矩阵为第二设备在第二坐标系中的坐标向量和第二设备在第一坐标系中的坐标向量的逆向量的乘积。
被识别对象在第二坐标系中的坐标为被识别对象在第一坐标系中的坐标和转换矩阵的乘积。
步骤203、第二设备保存识别信息中的被识别对象标识和计算得到的被识别对象在第二坐标系中的坐标。
本步骤中,第二设备还可以保存以下的一个或多个:
被识别对象上一个或一个以上点(例如,一个或一个以上切平面上、或轮廓上的一个或一个以上点)在第一坐标系中的坐标、被识别对象的网络地址或通讯端口。
该方法还包括:
第二设备根据计算的或接收到的被识别对象在第二坐标系中的坐标、被识别对象的网络地址或通信端口,与被识别对象通讯。
参见图3,本发明还提出了一种发布识别信息的装置,至少包括:
第一网络单元,用于发布识别信息;识别信息至少包括:被识别对象在第一坐标系中的坐标、第一坐标系信息。
本发明的装置中,还包括:
第一视觉识别单元,用于捕获图像,根据捕获的图像识别被识别对象,获得识别信息。
本发明的装置中,第一网络单元还用于:
以广播、或多播、或单播、或响应查询请求的方式发布所述识别信息。
参见图4,本发明还提出了一种接收或传递识别信息的装置,至少包括:
第二网络单元,用于接收来自第一设备的识别信息;识别信息至少包括:被识别对象在第一坐标系中的坐标、第一坐标系信息。
本发明的装置中,第二网络单元还用于:发送查询请求。
本发明的装置还包括:
第二视觉识别单元,用于根据识别信息计算被识别对象在第二坐标系中的坐标。
本发明的装置中,视觉识别单元具体用于:
根据第二设备在第一坐标系中的坐标和第二设备在第二坐标系中的坐标计算转换矩阵,根据计算得到的转换矩阵和识别信息(如其中的被识别对象在第一坐标系中的坐标)计算被识别对象在第二坐标系中的坐标。
本发明的装置中,还包括:
存储模块,用于保存以下的一个或多个:
被识别对象的切平面上、或轮廓上的一个或一个以上点在第一坐标系中的坐标、被识别对象的网络地址或通讯端口、被识别对象标识、第一设备标识。
参见图5,本发明还提出了一种信息识别系统,至少包括:
第一设备,用于发布识别信息;识别信息至少包括:被识别对象在第一坐标系中的坐标、坐标描述信息;
第二设备,用于接收识别信息。
本发明的信息识别系统中,第一设备还用于:
捕获图像,根据捕获的图像识别被识别对象获得识别信息。
本发明的信息识别系统中,第一设备还用于:以广播、或多播、或单播、或响应查询请求的方式发布识别信息。
本发明的信息识别系统中,第二设备还用于:
根据识别信息计算被识别对象在第二坐标系中的坐标。
本发明的信息识别系统中,第二设备还用于:
根据识别信息中的第二设备在第一坐标系中的坐标和第二设备在第二坐标系中的坐标计算转换矩阵,根据计算得到的转换矩阵和识别信息(如其中的被识别对象在第一坐标系中的坐标)计算被识别对象在第二坐标系中的坐标。
本发明的信息识别系统中,第二设备还用于:保存以下的一个或多个:
被识别对象的切平面上、或轮廓上的一个或一个以上点在第一坐标系中的坐标、被识别对象的网络地址或通讯端口、被识别对象标识、第一设备标识。
为了清楚起见,本发明的具体实施例中没有示出和描述设备的所有的常规特征。当然,应当理解,在任何实际设备的研制中,必需做出特定实现方式的决定以便实现研制者的特定目标,例如符合与应用及业务相关的约束,这些特定的目标随着不同的实现方式而变化,并且随着不同的研制者而变化。而且,应当理解,这种研制工作是复杂和耗时的,但是尽管如此,对于受到本发明公开内容启发的普通技术人员而言所进行的技术工作是常规的。
根据这里描述的主题,能够利用各种类型的操作系统、计算平台、计算机程序、和/或通用机器来制造、操作和/或执行各种部件、系统、装置、处理步骤和/或数据结构。此外,本领域的普通技术人员将会明白,也可以利用不太通用的装置,而不脱离这里公开的发明构思的范围和精神实质。其中,所包含的方法由计算机、装置或机器执行,并且该方法可以被存储为机器可读的指令,它们可以存储在确定的介质上,例如计算机存储装置,包括但不限于ROM(只读存贮器、FLASH存储器、转移装置等)、磁存储介质(例如,磁带、磁盘驱动器等)、光学存储介质(例如,CD-ROM、DVD-ROM、纸卡、纸带等)以及其他熟知类型的程序存储器。此外,应当认识到,该方法可以利用软件工具的选择由人类操作者执行,而不需要人或创造性的判断。
图6是本发明的装置场景示意图,示意了各装置及其相互关系。
在图6中,有三个设备,分别是2个手势与设备识别装置(A、B)和一个电视机TV。其中,手势与设备识别装置A也就是本发明所说的第二设备,手势与设备识别装置B也就是本发明所说的第一设备,电视机TV也就是本发明所说的被识别对象。手势与设备识别装置又称(计算机)视觉识别设备,实现了计算机视觉与图像处理技术,在这一实施例中,手势与设备识别装配有摄像头,能够识别手势、识别和发现设备;电视机TV支持手势控制,但没有摄像头用于识别手势,这是仅为说明上的方便,事实上手势与设备识别装置A可以与电视TV装配在一起,成为一个复合功能的设备。
在空间位置上,电视机TV位于手势与设备识别装置B的视觉范围内即手势与装备识别装置B能够捕获到电视机TV的图像。另一手势与设备识别装置A的视觉范围则不能捕获电视机TV。手势与设备识别装置A、B互相位于对方的视觉范围内、能够互相捕获对方的图像。
三个设备上都有网络接口,例如支持IEEE802.11b/g/n,或者支持IEEE802.3,从而可以连接到IP网络。各个设备内包含有一控制模块,能控制与其它设备发送、接收消息,以及处理操控指令、或转交操控指令。
这种设备(即具有网络接口的设备)在网络上的互相发现、连接、发送与接收消息能力,可以使用现有的通用即插即用(UPnP)技术实现,也可以使用多播域名系统(mDNS)和基于域名系统的服务发现(DNS-SD)技术实现,这一类技术用在IP网络中,以单播、多播查询方式,按照预先定义的报文格式响应查询、提供功能调用。例如,UPnP技术规定了媒体显示设备(如TV)、服务器(如DVD播放器、家庭存储服务器)如何响应查询、提供哪些调用功能。
手势识别控制装置A、B包含有一个具有图像、视频采集能力的摄像头,以及红外测距模块。作为一种实施方式,该手势识别控制装置A或B内部包括图像识别单元、数据存储单元、控制单元、网络服务单元。
在本实施例中,所有手势识别控制装置可以识别其视觉范围内的设备,实现方法是摄像头、测距模块在其三维空间内旋转采集图像,在采集的图像中分析查找预定义的标签图形并进行分析,这里,预定义的标签可以预先存储在视觉识别与发现控制装置中的图像、图形,也可以是接收到的来自被发现、被识别设备发送的图像、图形。手势识别控制装置的图像识别单元对图像进行分析后,识别出图像中有若干标识,对标识分别进行识别并存储识别出的信息,然后对标签所在的设备进行距离测量,和标识信息一起存储。
另一实施例是,视觉识别与发现控制装置接收到来自电视机TV、DVD播放机和家庭存储服务器等设备发来的特征图像如各角度的设备照片数据等,然后把设备照片数据从捕获的全景图像中检索出来,测量、记录设备的位置。这一实施例可以使用成熟的计算机视觉技术中的特征检测与匹配等技术。
在这一实施例中,电视机TV开机时,以多播方式发送报文,报文中包括:
本装置(即电视机TV)网络地址、惟一标识;
支持的手势编号,例如1表示5指张开,2表示两个指头,10表示拳头,20表示摇动手臂,等等;
手势对应的控制含义,例如1表示开机,10表示开机,等等;
作为另一实施例,2个手势与设备识别装置(A、B)和一个电视机TV的三维坐标表示为:
在A坐标系中:手势与设备识别装置A=A(0,0,0),手势与设备识别装置B=B(b1,b2,b3)。当然这里也可以选取另外的空间一点作为坐标原点(0,0,0)。
在B坐标系中:手势与设备识别装置B=B(0,0,0),手势与设备识别装置A=A(a1,a2,a3),电视机TV=T(t1,t2,t3)。当然这里也可以选取另外的空间一点作为坐标原点(0,0,0)。
这里的坐标点,可以是设备平面中心点,或者规定为设备上如切平面上、轮廓上的其它某一点。
图7是本发明的装置单元示意图。
这一实施例中包括视觉识别设备A(即第二设备)、视觉识别设备B(即第一设备),接收设备T(即被识别对象)为被发现、被识别设备,视觉识别设备B能够发现、识别设备T。
设备T由网络单元、视觉标识、视觉识别响应单元组成。
其中,网络单元的功能如图6的实施例中所述,包含有网络接口,在网络上的互相发现、连接能力,以及能与其它设备发送、接收消息。
视觉标识用于以视觉方式表示本设备,至少可以使用贴在外表的标识或设备本身照片、图片、商标标识、视频片断表示,已有本发明人的在前申请给出了相关技术。这些照片或图形图像或视频片断可以作为设备T发给装置B消息中的数据。
视觉识别响应单元是一内部的协调控制单元,包括接收网络单元的消息进行分析,根据消息请求指示视觉响应单元做出响应,在响应消息中添加视觉标识数据、视觉特征描述数据,及根据消息请求指示网络单元响应请求消息;这里视觉特征描述数据可以是视觉标识相关的信号特征包括规律的描述。作为实施例,网络消息可以采用现有的UPnP协议,根据协议在规定字段、扩展字段中填写数据。
视觉识别设备A、B即视觉手势与设备识别装置,由视觉数据采集单元、存储单元、网络单元、视觉识别单元组成。
网络单元的功能包含有网络接口,支持在网络上的互相发现、连接能力,以及能与其它设备发送、接收消息。
视觉识别设备A、B的视觉数据采集单元与设备T的视觉标识单元,是相对应的单元,即T的视觉标识单元提供T的视觉特征如图像、发出视觉/光学信号,设备A、B的视觉单元负责识别视觉标识单元提供的视觉特征,并按预定义的特征进行匹配识别,以确定识别结果。
视觉识别单元是一内部的计算单元,完成视觉相关的计算,包括图像识别、空间坐标确定与对象空间位置坐标计算等等。
存储单元存储识别出的设备信息,包括象设备T这样的设备标识、网络地址、空间位置、视觉特征数据等,其中空间位置可以是设备T相对设备B为空间坐标原点的几何参数,如三维空间坐标、或向量坐标等。这些存储的数据可以供设备内的其它单元使用,也可以提供给其它设备使用。作为实施例之一,存储单元可以提供设备T的位置数据给设备A使用。
总的来说,设备B发布识别信息,识别信息至少包括坐标系信息和被识别对象如设备T的坐标参数。其中,被识别对象的坐标参数可以是被识别对象在坐标系信息中所描述的坐标系中的坐标。
设备B通过捕获图像,识别被识别对象T,确定坐标系;这里坐标系可以是图像中的一个点。识别出的关于设备T的信息,还可以包括对象轮廓(如三点/四点/五点、多点坐标),或者是距离信息(例如被识别设备到中心点坐标或到坐标原点之间的距离),或者是设备B本身的坐标,其它信息包括识别对象即设备T的标识、或网络地址、或通讯端口。在这里,被识别对象就是设备T,识别信息包括其坐标。
设备B发布识别信息,可以通过广播、多播、单播、查询-响应的方式
作为设备A,因为位置原因无法捕获设备T的信息,但可以从设备B接收其发布的识别信息,接收的信息里包括了坐标系信息和被识别对象T的坐标参数、被识别对象的标识、或网络地址、或通讯端口。
如前述实施例,设备B使用B坐标系发布了:手势与设备识别装置B=B(0,0,0),电视机TV=T(t1,t2,t3)。设备A在A坐标系测量到了手势与设备识别装置B=B(b1,b2,b3)并接收到了T在B坐标系中的坐标。则可以通过坐标变换矩阵得知T在A坐标系中的坐标:
设XA=MYB,其中X为A坐标系中任一点,Y为B坐标系中任一点,M为三维变换矩阵,有
(b1,b2,b3)=M(a1,a2,a3),从而M=(b1,b2,b3)×(a1,a2,a3)-1
所以TV在A坐标系中的位置为:
TA=MT
这样,手势与设备识别装置A虽然捕获不到TV,但能够根据捕获的手势位置信息,结合已知的TA,从而能够判断出手势与TA的空间关系。
使用接收到的识别信息,设备A可以继续(计算机视觉)识别,根据识别的手势结果、被识别对象T的坐标、网络地址或通讯端口,与被识别对象T通讯,即向被识别对象T发送手势识别结果信息、或控制命令等。
图8是本发明的方法流程图。
这一实施例所描述的流程图,参照了图6实施例中的设备A、B,及图7实施例中的A、B。这一实施例描述了装置工作的流程图,这里的视觉识别设备1、2可参照图6、图7中的A、B。
步骤800、视觉识别设备1采集数据,识别设备及其位置。
设备1通过摄像头捕获视觉范围内的图像,并对图像中的设备进行识别,最终得到设备位置、网络参数等信息。具体采集、识别、计算以及信息详细数据可以参考前面所有实施例。
步骤801、视觉识别设备发布数据更新通知。
设备1通过广播、或多播、或单播、或响应查询请求等方式,发布有关被识别设备的更新通知。
步骤802、视觉识别设备2发出数据查询通知。
或者与步骤801类似,设备2主动发出查询请求。这一步骤与步骤801没有先后关系,也可以只使用其中之一。
步骤803、视觉识别设备1响应视觉识别设备2,响应消息中包含已识别设备及其位置信息。
视觉识别设备1向视觉识别设备2发送已识别设备的相关信息,包括:坐标系,被识别对象如设备T的坐标参数,还可以包括设备2在坐标系中坐标,被识别对象的对象轮廓(如三点/四点/五点、多点坐标),或者是距离信息(例如被识别设备到中心点坐标或到坐标原点之间的距离),其它信息包括识别对象即设备T的标识、或网络地址、或通讯端口。
步骤804、视觉识别设备2与已识别设备交互。
虽然被识别设备T不在视觉识别设备2的视觉内,但是有了视觉识别设备1提供的信息,当用户在视觉识别设备2视觉范围内做出手势时,视觉识别设备2就能够判断出用户手势所想要操控的设备,就能够把识别出的手势信息或命令发送给被识别设备T。而这时候用户的手势即使不在视觉识别设备1的视觉范围内,也不影响用户操作。甚至可以安装视觉识别设备1专门作为识别目标设备之用,视觉识别设备2用作识别手势、控制目标设备之用。
图9是本发明的消息交互示意图。
在这一流程图中,视觉识别设备2接收到了视觉识别设备1发出的目标被识别设备的有关消息。
具体来说,这一功能的处理流程为
步骤900、视觉识别设备1识别目标设备。
这一消息的实现见图1、图2、图6、图8所述的实施例中。在这一步骤,视觉识别设备对目标设备的识别既包括通过使用深度摄像头或多个摄像头捕获被识别设备图像或视频片断,进而识别、计算得出被识别设备的空间位置信息如坐标数据、设备之间的距离数据,也包括通过网络消息获得被识别设备的网络地址、通讯端口、被识别设备(唯一)标识、业务能力等信息。
完成这一步骤之后,视觉识别设备1还可以进行如下的行为(即图9中所示的ACTION步骤):保存识别出的信息,关联识别信息与各设备的关系等等。
步骤901、视觉识别设备1发布被识别设备的设备数据。
这一消息的实现见图1、图2、图6、图8所述的实施例中。这里的发布也是使用网络消息,包括以广播、或多播、或单播的方式,其中单播可以采用订阅-发布的方式,例如视觉识别设备1向事先接受了视觉识别设备2的订阅设备数据更新请求的视觉识别设备2发送消息,报告被识别设备的设备数据。
步骤902、视觉识别设备2向视觉识别设备1发送查询设备数据请求。
这一步可以和第二步选择其一使用,顺序上并不要求先后关系。视觉识别设备2发送查询请求也可以采用广播、或多播、或单播的方式。图中示意了点对点单播查询的情景。视觉识别设备1收到请求后,还可以被触发再次识别功能,重新对被识别设备进行识别、计算,也可以发送已经保存了的已经识别了设备信息。
步骤903、视觉识别设备1向视觉识别设备2发送设备数据作为对第三步消息的响应。
这一步骤也是通过网络消息进行,消息内容可以是步骤900中指出的任何信息或者其中的信息组合、或者全部信息。
步骤904、视觉识别设备2向被识别设备发送设备控制命令。
当用户在视觉识别设备2视觉范围内做出手势时,视觉识别设备2就能够判断出用户手势所想要操控的设备,进而把识别出的手势信息或命令发送给被识别设备T。视觉识别设备2能够判断出用户手势所想要操控的设备,除了是由于采集到了用户手势并进行分析识别,还因为视觉识别设备2收到了被识别设备的空间位置信息,从而能够判断用户手势与被识别设备之间的位置关系、得出用户操控的意向。
步骤905、被识别设备向视觉识别设备2发出设备执行结果响应。
这一步作为可选步骤,当目标设备完成设备2的指令时,可以发送响应消息。响应消息可以包括操控成功、操控失败、不识别的操控指令、不支持的操控方式、操控结果数据等等。
上述步骤900-903和904-905可以作为两个独立的程序,分别运行,例如,设备被识别后,如果用户没有进行手势操控或视觉识别设备未采集到手势图像/视频片断,则相当于只发生了步骤900-903,不会发生步骤904-905。
上述实施例中,电视机、播放机、存储服务器被作为被操控设备,而本发明并不限定于被操控设备是象实施例中提到的这样设备,电脑、音响、音箱、投影仪、机顶盒等等都可以作为被操控设备,甚至工业上其它设备如汽车、机床、轮船等等都可以由视觉识别与发现控制装置来操控。
上述实施例中,视觉识别与发现控制装置的摄像头可以是各种规格,例如可以是固定焦距或变焦距的,旋转空间可以是上下左右各个角度的,或只支持左右角度,只需要配置的一摄像头,具有实施例中描述的各种能力。测距单元可以使用激光红外线测距,也可以用其它波段的光测量,可以使用3摄像头计算测距,也可以使用更多摄像头用加权调整等方法计算测距。
上述流程,是实现本发明的实施例,并不是限定只能用实施例来实现,也不是用来限定具体流程执行的方法,本发明还可以用类似的方式实现,比如表示单元的名字、各种消息的类型等,那不过是命名形式、具体的报文内容等有所不同。
上述实施例,网络相关的,可适用于基于IEEE802.3、IEEE802.11b/g/n、POWELINE、CABLE、PSTN、3GPP(3rdGenerationPartnershipProject,第三代合作伙伴计划)网络、3GPP2网络等通讯网络所支持的IP网络,各装置的操作系统可适用于UNIX类操作系统、WINDOWS类操作系统、ANDROID类操作系统、IOS操作系统,对消费者接口可适用于JAVA语言接口等。
需要说明的是,以上所述的实施例仅是为了便于本领域的技术人员理解而已,并不用于限制本发明的保护范围,在不脱离本发明的发明构思的前提下,本领域技术人员对本发明所做出的任何显而易见的替换和改进等均在本发明的保护范围之内。

Claims (24)

1.一种发布识别信息的方法,其特征在于,包括:
第一设备发布识别信息;所述识别信息至少包括:被识别对象在第一坐标系中的坐标、第一坐标系信息。
2.根据权利要求1所述的方法,其特征在于,该方法还包括:
所述第一设备捕获图像,根据捕获的图像识别所述被识别对象获得所述识别信息。
3.根据权利要求1或2所述的方法,其特征在于,所述被识别对象在第一坐标系中的坐标为所述被识别对象上的一个或一个以上点在第一坐标系中的坐标。
4.根据权利要求1所述的方法,其特征在于,所述识别信息还包括:
所述被识别对象与所述第一设备的距离,和/或所述被识别对象的网络地址或通讯端口,和/或被识别对象标识,和/或第一设备标识。
5.根据权利要求1所述的方法,其特征在于,第二设备作为所述识别对象,所述第二设备在第一坐标系中的坐标是所述识别对象在第一坐标系中的坐标。
6.根据权利要求1~5任意一项所述的方法,其特征在于,所述第一设备以广播、或多播、或单播、或响应查询请求的方式发布所述识别信息。
7.一种传递识别信息的方法,其特征在于,包括:
第二设备接收识别信息;所述识别信息至少包括:被识别对象在第一坐标系中的坐标、第一坐标系信息。
8.根据权利要求7所述的方法,其特征在于,该方法还包括:
所述第二设备根据所述识别信息计算所述被识别对象在第二坐标系中的坐标。
9.根据权利要求8所述的方法,其特征在于,所述第二设备根据识别信息计算被识别对象在第二坐标系中的坐标包括:
所述第二设备根据所述第二设备在第一坐标系中的坐标和所述第二设备在第二坐标系中的坐标计算转换矩阵,根据所述转换矩阵和识别信息计算所述被识别对象在第二坐标系中的坐标。
10.根据权利要求7或8所述的方法,其特征在于,所述识别信息还包括:
所述被识别对象上的一个或一个以上点在第一坐标系中的坐标、和/或所述被识别对象的网络地址或通讯端口、和/或被识别对象标识、和/或第一设备标识。
11.根据权利要求10所述的方法,其特征在于,该方法还包括:
所述第二设备根据计算的或接收到的所述被识别对象在第二坐标系中的坐标、网络地址或通讯端口,与所述被识别对象通讯。
12.一种发布识别信息的装置,其特征在于,至少包括:
第一网络单元,用于发布识别信息;所述识别信息至少包括:被识别对象在第一坐标系中的坐标、第一坐标系信息。
13.根据权利要求12所述的装置,其特征在于,还包括:
第一视觉识别单元,用于捕获图像,根据捕获的图像识别所述被识别对象,获得所述识别信息。
14.根据权利要求12所述的装置,其特征在于,所述第一网络单元还用于:
以广播、或多播、或单播、或响应查询请求的方式发布所述识别信息。
15.一种传递识别信息的装置,其特征在于,至少包括:
第二网络单元,用于接收识别信息;所述识别信息至少包括:被识别对象在第一坐标系中的坐标、所述第一坐标系信息。
16.根据权利要求15所述的装置,其特征在于,还包括:
第二视觉识别单元,用于根据识别信息计算所述被识别对象在第二坐标系中的坐标。
17.根据权利要求16所述的装置,其特征在于,所述视觉识别单元具体用于:
根据所述第二设备在第一坐标系中的坐标和第二设备在第二坐标系中的坐标计算转换矩阵,根据所述转换矩阵和识别信息计算所述被识别对象在第二坐标系中的坐标。
18.根据权利要求15或16所述的装置,其特征在于,还包括:
存储模块,保存所述被识别对象上的一个或一个以上点在第一坐标系中的坐标、和/或所述被识别对象的网络地址或通讯端口、和/或被识别对象标识、和/或第一设备标识。
19.一种信息识别系统,其特征在于,至少包括:
第一设备,用于发布识别信息;所述识别信息至少包括:被识别对象在第一坐标系中的坐标、第一坐标系信息;
第二设备,用于接收识别信息。
20.根据权利要求19所述的信息识别系统,其特征在于,所述第一设备还用于:
捕获图像,根据捕获的图像识别所述被识别对象获得所述识别信息。
21.根据权利要求19所述的信息识别系统,其特征在于,所述第一设备还用于:以广播、或多播、或单播、或响应查询请求的方式发布所述识别信息。
22.根据权利要求19所述的信息识别系统,其特征在于,所述第二设备还用于:
根据所述识别信息计算被识别对象在第二坐标系中的坐标。
23.根据权利要求22所述的信息识别系统,其特征在于,所述第二设备还用于:
根据所述识别信息中的第二设备在第一坐标系中的坐标和第二设备在第二坐标系中的坐标计算转换矩阵,根据所述转换矩阵和识别信息计算所述被识别对象在第二坐标系中的坐标。
24.根据权利要求22所述的信息识别系统,其特征在于,所述第二设备还用于:
保存所述被识别对象上的一个或一个以上点在第一坐标系中的坐标、和/或所述被识别对象的网络地址或通讯端口、和/或被识别对象标识、和/或第一设备标识。
CN201410623925.1A 2014-11-07 2014-11-07 一种发布和传递识别信息的方法和装置及信息识别系统 Pending CN105630142A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201410623925.1A CN105630142A (zh) 2014-11-07 2014-11-07 一种发布和传递识别信息的方法和装置及信息识别系统
PCT/CN2015/093896 WO2016070827A1 (zh) 2014-11-07 2015-11-05 一种发布和传递识别信息的方法和装置及信息识别系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410623925.1A CN105630142A (zh) 2014-11-07 2014-11-07 一种发布和传递识别信息的方法和装置及信息识别系统

Publications (1)

Publication Number Publication Date
CN105630142A true CN105630142A (zh) 2016-06-01

Family

ID=55908606

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410623925.1A Pending CN105630142A (zh) 2014-11-07 2014-11-07 一种发布和传递识别信息的方法和装置及信息识别系统

Country Status (2)

Country Link
CN (1) CN105630142A (zh)
WO (1) WO2016070827A1 (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101282411A (zh) * 2008-03-14 2008-10-08 青岛海信电器股份有限公司 控制装置、包括所述控制装置的视频装置及控制方法
CN101344816A (zh) * 2008-08-15 2009-01-14 华南理工大学 基于视线跟踪和手势识别的人机交互方法及装置
CN102452611A (zh) * 2010-10-21 2012-05-16 上海振华重工(集团)股份有限公司 集装箱起重机的吊具空间姿态的检测方法和装置
CN102984592A (zh) * 2012-12-05 2013-03-20 中兴通讯股份有限公司 一种数字媒体内容播放转移的方法、装置和系统
CN103072528A (zh) * 2013-01-30 2013-05-01 深圳市汉华安道科技有限责任公司 一种车辆及其全景泊车方法、系统
CN104102335A (zh) * 2013-04-15 2014-10-15 中兴通讯股份有限公司 一种手势控制方法、装置和系统
CN105589550A (zh) * 2014-10-21 2016-05-18 中兴通讯股份有限公司 信息发布方法、信息接收方法、装置及信息共享系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5614014B2 (ja) * 2009-09-04 2014-10-29 ソニー株式会社 情報処理装置、表示制御方法及び表示制御プログラム
JP6030430B2 (ja) * 2012-12-14 2016-11-24 クラリオン株式会社 制御装置、車両及び携帯端末

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101282411A (zh) * 2008-03-14 2008-10-08 青岛海信电器股份有限公司 控制装置、包括所述控制装置的视频装置及控制方法
CN101344816A (zh) * 2008-08-15 2009-01-14 华南理工大学 基于视线跟踪和手势识别的人机交互方法及装置
CN102452611A (zh) * 2010-10-21 2012-05-16 上海振华重工(集团)股份有限公司 集装箱起重机的吊具空间姿态的检测方法和装置
CN102984592A (zh) * 2012-12-05 2013-03-20 中兴通讯股份有限公司 一种数字媒体内容播放转移的方法、装置和系统
CN103072528A (zh) * 2013-01-30 2013-05-01 深圳市汉华安道科技有限责任公司 一种车辆及其全景泊车方法、系统
CN104102335A (zh) * 2013-04-15 2014-10-15 中兴通讯股份有限公司 一种手势控制方法、装置和系统
CN105589550A (zh) * 2014-10-21 2016-05-18 中兴通讯股份有限公司 信息发布方法、信息接收方法、装置及信息共享系统

Also Published As

Publication number Publication date
WO2016070827A1 (zh) 2016-05-12

Similar Documents

Publication Publication Date Title
KR102627363B1 (ko) 혼합 현실 시스템들을 위한 로컬화 결정
CN105659170B (zh) 用于向远程用户传送视频的方法及视频通信装置
JP2019533372A (ja) パノラマ画像の表示制御方法、装置及び記憶媒体
US10013067B2 (en) Gesture control method, apparatus and system
CN104081317B (zh) 信息处理设备和信息处理方法
US9658744B1 (en) Navigation paths for panorama
US10198083B2 (en) Hand gesture recognition method, device, system, and computer storage medium
US20120192088A1 (en) Method and system for physical mapping in a virtual world
CN110235120A (zh) 用于媒体内容项目之间的转换的系统和方法
JP2017534091A (ja) ロボット装置の行為の仮想表現を表示する拡張現実のための方法及びシステム
CN105760106A (zh) 一种智能家居设备交互方法和装置
US10591999B2 (en) Hand gesture recognition method, device, system, and computer storage medium
JP5799018B2 (ja) 拡張物体との対話用デバイス
EP3427233B1 (en) Method and apparatus for providing augmented reality services
KR20220063205A (ko) 인터넷 연결 설치를 위한 증강 현실
KR20120035036A (ko) 증강 현실을 이용한 영상 데이터 생성 방법 및 재생 방법, 그리고 이를 이용한 촬영 장치
CN108919653A (zh) 一种查找家居设备方法及装置
CN104239842B (zh) 一种实现视觉识别的方法、装置和系统
WO2021093703A1 (zh) 基于光通信装置的交互方法和系统
WO2016062191A1 (zh) 信息发布方法、信息接收方法、装置及信息共享系统
WO2022176450A1 (ja) 情報処理装置、情報処理方法、およびプログラム
CN105630142A (zh) 一种发布和传递识别信息的方法和装置及信息识别系统
KR101108542B1 (ko) 위치기반 증강현실을 이용하는 이동통신 단말기 및 이의 제어방법
CN109213307A (zh) 一种手势识别方法及装置、系统
KR101352090B1 (ko) 게임 영상 디스플레이 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination