CN111967352A

CN111967352A - 一种手持物品的多目标跟踪和行为判定的装置和方法

Info

Publication number: CN111967352A
Application number: CN202010757549.0A
Authority: CN
Inventors: 张元本
Original assignee: Guangzhou Weilin Software Co ltd
Current assignee: Guangzhou Weilin Software Co ltd
Priority date: 2020-07-31
Filing date: 2020-07-31
Publication date: 2020-11-20

Abstract

本发明提供一种手持物品的多目标跟踪和行为判定的装置和方法，整个系统分为成像模块、标注模块、训练模块，识别模块、轨迹跟踪模块、行为判定模块。通过网络摄像头获取图像，图像数据上传至服务器，由运行在服务器中的程序，判定是否是人手持物品，并最终判定是放物品，还是取物品。该装置和方法通过将手掌，手掌‑手持物品，物品三种目标分情况检测，并通过检测逻辑，在不更改检测算法的前提下，提升识别率。在行为判定阶段，通过行为判定逻辑，剔除错误轨迹，提升正确率。

Description

一种手持物品的多目标跟踪和行为判定的装置和方法

技术领域

本发明涉及图像识别技术领域，尤其涉及一种手持物品的多目标跟踪和行为判定的装置和方法。

背景技术

智能家居(smart home,home automation)是以住宅为平台，利用综合布线技术、网络通信技术、安全防范技术、自动控制技术、音视频技术将家居生活有关的设施集成，构建高效的住宅设施与家庭日程事务的管理系统，提升家居安全性、便利性、舒适性、艺术性，并实现环保节能的居住环境。

近年来，随着智能家居的普及，越来越多的家用设备进行了智能化更迭，而现有智能家居中的用于存储食物的冷柜、冰箱、食物柜或置物柜等，其仅仅只具备前端的部分功能，缺少后端的智能化进行支持，存在着智能化不足，功能较少的问题。

随着人工智能的快速发展，目标跟踪算法得到了快速发展，特别是在行人、车辆跟踪等多目标跟踪领域取得了很好的效果，但是对于其他目标的跟踪，例如专利201310568186.6这类的智能冰箱的使用，尤其是手持物品的多目标跟踪，由于物体被遮挡，跟踪时很容易被误判为另一个目标。

发明内容

本发明的目的就在于为了解决上述问题而提供了一种手持物品的多目标跟踪和行为判定的装置和方法，降低了目标被误判的可能性。

本发明解决其技术问题所采用的技术方案是：

一种手持物品的多目标跟踪和行为判定的装置，包括以下部分，

成像模块，用于拍摄并捕捉视野范围内的运动目标；

标注模块，用于分别对手掌进行标注，对手掌-手持物品进行标注，对物品进行标注，生成标注图像数据，给训练模块提供训练数据；

训练模块，用于对标注模块标注的图像数据进行训练；

识别模块，用于用训练模块训练好的模型对目标对象进行识别，给出识别的目标位置；

轨迹跟踪模块，用于通过目标对象轨迹，在一帧图像中，判定目标对象是否为疑似目标；

判定模块，用于在疑似目标的连续帧图像中，通过预先设定的行为判定逻辑，对轨迹进行限定，剔除部分明显不符合行为的轨迹，最终给出不同轨迹的行为判定。

一种手持物品的多目标跟踪和行为判定的方法，通过网络摄像头，拍摄并捕捉视野范围内的运动目标，分别对手掌进行标注，对手掌-手持物品进行标注，对物品进行标注，生成标注图像数据，对图像数据进行训练，用训练好的模型对目标对象进行识别，给出识别的目标位置，通过目标对象轨迹，在一帧图像中，判定目标对象是否为疑似目标，在疑似目标的连续帧图像中，通过预先设定的行为判定逻辑，对轨迹进行限定，剔除部分明显不符合行为的轨迹，最终给出不同轨迹的行为判定。

进一步的，其中，对图像数据进行训练，采用rcnn算法或者yolo算法。

进一步的，其中，用训练好的模型对目标对象进行识别，对象包括手掌A、手掌-手持物品B、物品C，给出识别的目标位置box、类别class、得分score，分别为手掌的目标位置box_A、手掌的类别class_A、手掌的得分score_A、手掌-手持物品的目标位置box_B、手掌-手持物品的类别class_B、手掌-手持物品的得分score_B、物品的目标位置box_C、物品的类别class_C、物品的得分score_C。

进一步的，其中，通过目标对象轨迹，在一帧图像中，判定目标对象是否为疑似目标，判定是否包含class_A，如果不包含，认为此帧没有目标，等待下一帧的检测，如果包含class_A，则保存相关的class_A、box_A、score_A的数据，并继续去检查class_B和class_C，如果存在，则保存相关的class_B、box_B、score_B和class_C、box_C、score_C的数据，通过不同的class_A与class_C目标的交并比IOU_{A_C}来判定哪些目标是一体的，剔除错误目标，而

多组IOU_{A_C}构成集合E(IOU_{A_C})，通过非极大值抑制nms，去掉集合E(IOU_{A_C})和多个class_B的集合E(class_B)中重复的目标。

进一步的，其中，在疑似目标的连续帧图像中，通过预先设定的行为判定逻辑，对轨迹进行限定，剔除部分明显不符合行为的轨迹，最终给出不同轨迹的行为判定，轨迹共有取、放、不确定三种状态，依靠当前目标box_now中心点与前一帧的目标box_pre的位置差确认轨迹的状态，设当前帧的疑似目标集合为E(object)，当前轨迹集合为E(track)，趋势判定为

ifbox_now.x>box_pre.xandbox_now.y>box_pre.y:take

ifbox_now.x<box_pre.xandbox_now.y<box_pre.y:put

if(box_now.x-box_pre.x)*(box_now.y-box_pre.y)<0:unsure

如果E(object)的第一个对象移动趋势与E(track)中某个轨迹一致，该对象属于该轨迹，更新轨迹，如果不一致，则在E(object)中依次选择目标与E(track)的轨迹进行比较，如果都没有匹配，则将当前E(object)列为疑似轨迹加入E(track)中，当E(track)中有连续多帧都是一个趋势的话，确定该行为，并将轨迹删除。

本发明的有益效果是：

通过采用上述技术方案，本装置和方法通过将手掌，手掌-手持物品，物品三种目标分情况检测，并通过检测逻辑，在不更改检测算法的前提下，提升识别率。在行为判定阶段，通过行为判定逻辑，剔除错误轨迹，提升正确率。

附图说明

下面结合附图和实施例对本发明进一步说明。

图1是本发明的手持物品的多目标跟踪和行为判定方法的整体实施流程图。

具体实施方式

下面结合附图和具体实施例对本发明作进一步说明，以使本领域技术人员可以更好的理解本发明并能予以实施，但所举实施例不作为对本发明的限定。

本实例提供一种手持物品的多目标跟踪和行为判定的装置和方法，根据图1的流程，通过网络摄像头获取图像，图像数据上传至服务器，由运行在服务器中的程序，判定是否是人手持物品，并最终判定是放物品，还是取物品。

具体的，整个系统分为成像模块、标注模块、训练模块，识别模块、轨迹跟踪模块、行为判定模块。成像模块，通过外接网络摄像头，放置在固定位置，拍摄并捕捉视野范围内的运动目标。

标注模块，给训练模块提供训练数据，分为三部分，第一部分就是对手掌进行标注，第二部分是对手-手持物品进行标注，第三部分是针对不同物品进行不同种类的标注。

训练模块，对标注的图像可以选择不同的模型进行训练。比如采用两步法的rcnn系列模型或者一步法的yolo系列。训练类别包括3类，一类是手掌，一类是手掌-手持的物品，一类是物品。前两类是固定的，最后一类物品，是根据实际需要来选择，可以是一种物品，也可以是多种物品。

识别模块，用训练好的模型对图片进行识别，对象包括手掌A，手掌-手持的物品B，手持物品C，给出识别的目标位置box、类别class、得分score。之所以要对三者进行识别，原因在于手持物体本身容易被遮挡，识别率低。而手掌本身识别率高，通过手掌作为辅助判定条件，更容易降低误判率。

轨迹跟踪模块，具体步骤如下：

1.目标类别及位置判定。判定识别模块返回的类别class是否包含类别手掌class_A，如果不包含，认为此帧没有目标，等待下一帧的检测。如果包含class_A,保存box_A,score_A的数据，并继续去检查class_B,class_C。如果存在则保存相关class、box、score这些相关数据。

2.目标的组合。由于是多目标检测。可能会存在多个class_A，class_B,class_C。可以通过不同的class_A与class_C目标的交并比IOU_{A_C}来判定，哪些目标是一体的。从而剔除，错误目标。公式如下：

多组IOU_{A_C}构成集合E(IOU_{A_C})，集合E(IOU_{A_C})内部按IOU_{A_C}值递增排序。

3.去重。由于集合E(IOU_AC)和多个class_B的集合E(class_B)代表的都是手掌-手持物体，因此有可能会出现重复，通过非极大值抑制nms，去掉双方集合中重复的目标。nms一般是通过score来剔除重叠的box，这里面集合E(class_B)中存在类别B的得分score_B，但是集合E(class_B)里面是IOU_{A_C}无法与score_B比对，可以设定

再比较。

行为判定模块，连续帧中，确认轨迹。轨迹共有三种状态，取、放、不确定。状态的确认是通过趋势判定，也就是依靠当前目标box_now中心点与前一帧用来比较的目标box_pre的位置差。假设当前帧的疑似目标集合为E(object)，当前轨迹集合为E(track)具体判定步骤如下：

1.趋势判定,ifbox_now.x>box_pre.xandbox_now.y>box_pre.y:take

ifbox_now.x<box_pre.xandbox_now.y<box_pre.y:put

if(box_now.x-box_pre.x)*(box_now.y-box_pre.y)<0:unsure

2.轨迹更新，如果E(object)的第一个对象obj移动趋势与E(track)中某个轨迹track_x一致，那么认为该对象属于该轨迹，更新轨迹。如果不一致，那么在E(object)中依次选择目标与E(track)的轨迹进行比较。如果都没有匹配的话，将当前E(object)列为疑似轨迹加入E(track)中。

3.轨迹剔除，当E(track)中有连续多帧都是一个趋势的话，确定该行为，并将轨迹删除。

本发明的上述实施例并不是对本发明保护范围的限定，本发明的实施方式不限于此，凡此种种根据本发明的上述内容，按照本领域的普通技术知识和惯用手段，在不脱离本发明上述基本技术思想前提下，对本发明上述结构做出的其它多种形式的修改、替换或变更，均应落在本发明的保护范围之内。

Claims

1.一种手持物品的多目标跟踪和行为判定的装置，其特征在于：包括以下部分，

成像模块，用于拍摄并捕捉视野范围内的运动目标；

训练模块，用于对标注模块标注的图像数据进行训练；

2.一种手持物品的多目标跟踪和行为判定的方法，其特征在于：通过网络摄像头，拍摄并捕捉视野范围内的运动目标，分别对手掌进行标注，对手掌-手持物品进行标注，对物品进行标注，生成标注图像数据，对图像数据进行训练，用训练好的模型对目标对象进行识别，给出识别的目标位置，通过目标对象轨迹，在一帧图像中，判定目标对象是否为疑似目标，在疑似目标的连续帧图像中，通过预先设定的行为判定逻辑，对轨迹进行限定，剔除部分明显不符合行为的轨迹，最终给出不同轨迹的行为判定。

3.根据权利要求2所述的一种手持物品的多目标跟踪和行为判定的方法，其特征在于：其中，对图像数据进行训练，采用rcnn算法或者yolo算法。

4.根据权利要求2所述的一种手持物品的多目标跟踪和行为判定的方法，其特征在于：其中，用训练好的模型对目标对象进行识别，对象包括手掌A、手掌-手持物品B、物品C，给出识别的目标位置box、类别class、得分score，分别为手掌的目标位置box_A、手掌的类别class_A、手掌的得分score_A、手掌-手持物品的目标位置box_B、手掌-手持物品的类别class_B、手掌-手持物品的得分score_B、物品的目标位置box_C、物品的类别class_C、物品的得分score_C。

5.根据权利要求4所述的一种手持物品的多目标跟踪和行为判定的方法，其特征在于：其中，通过目标对象轨迹，在一帧图像中，判定目标对象是否为疑似目标，判定是否包含class_A，如果不包含，认为此帧没有目标，等待下一帧的检测，如果包含class_A，则保存相关的class_A、box_A、score_A的数据，并继续去检查class_B和class_C，如果存在，则保存相关的class_B、box_B、score_B和class_C、box_C、score_C的数据，通过不同的class_A与class_C目标的交并比IOU_{A_C}来判定哪些目标是一体的，剔除错误目标，而

6.根据权利要求5所述的一种手持物品的多目标跟踪和行为判定的方法，其特征在于：其中，在疑似目标的连续帧图像中，通过预先设定的行为判定逻辑，对轨迹进行限定，剔除部分明显不符合行为的轨迹，最终给出不同轨迹的行为判定，轨迹共有取、放、不确定三种状态，依靠当前目标box_now中心点与前一帧的目标box_pre的位置差确认轨迹的状态，设当前帧的疑似目标集合为E(object)，当前轨迹集合为E(track)，趋势判定为

ifbox_now.x>box_pre.xandbox_now.y>box_pre.y:take

ifbox_now.x<box_pre.xandbox_now.y<box_pre.y:put

if(box_now.x-box_pre.x)*(box_now.y-box_pre.y)<0:unsure