CN108122245A

CN108122245A - 一种目标行为描述方法、装置和监控设备

Info

Publication number: CN108122245A
Application number: CN201611092831.1A
Authority: CN
Inventors: 罗达新; 王明; 薛常亮
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2016-11-30
Filing date: 2016-11-30
Publication date: 2018-06-05
Anticipated expiration: 2036-11-30
Also published as: CN108122245B

Abstract

本申请公开了一种目标行为描述方法和装置，通过摄像头的姿态位置信息和运动参数信息可根据上一图像得到预测图像，根据预测图像和当前图像进行目标检测可减少运算量。将识别出来的运动目标和显著性目标进行去重复处理，在对去重复处理后的每个目标进行行为描述得到行为描述结果，这样可对图像中的多个目标同时进行行为描述，并减少计算量。

Description

一种目标行为描述方法、装置和监控设备

技术领域

本发明涉及图像处理领域，尤其涉及一种目标行为描述方法、装置和监控设备。

背景技术

近年来，在政府对汽车安全法令的贯彻和实施、消费者的驾驶体验更高需求及自动驾驶的趋势推动下，业界提出了ADAS(Advanced Driver Assistant System，先进辅助驾驶系统)的解决方案。ADAS是指利用车辆上安装的传感器收集周围的数据，进行物体的辨识、侦测和追踪等功能，能够让驾驶者在最快时间察觉潜在危险，提高驾驶的安全性。车辆上的摄像头为核心的感知部件，摄像头可以采集道路上行人和车辆的图像，然而如何利用摄像头对采集的图像中的物体行为描述是目前研究的热点。

发明内容

本申请所要解决的技术问题在于，提供一种目标行为描述方法、装置和监控设备。可图像中的多个目标进行行为描述，同时有效减少计算量。

为了解决上述技术问题，本申请提供了一种目标行为描述方法，包括：摄像头将采集到的多个图像存储在缓冲区中，目标行为描述装置(以下简称描述装置)，描述装置从缓冲区中取出当前图像和当前图像的上一图像，描述装置确定摄像头的姿态位置信息和运动参数信息，摄像头安装在车辆上，可安装在车辆的任意位置，且随车辆的运动而运动。姿态位置信息表示摄像头预先设置的固定参数，例如：姿态位置信息包括视角，运动参数信息表示摄像头在运动过程中的相关参数，例如：运动参数信息包括速度和转向角。生成预测图像的方法可以是：根据摄像头的运动参数信息(如速度和转向角)，以及摄像头的姿态位置信息(如视角)可计算出车辆前进的距离，摄像头与物体之间的运动趋势决定了目标在图像中的变化规律，物体表示真实世界中的实体，例如物体包括行人、车辆、红绿灯等，目标表示物体在摄像头采集的图像中的像素区域。根据运动趋势的不同，目标在图像中的变化规律为：如果摄像头靠近物体，则目标在图像中会慢慢变大，将上一图像中的目标放大预设比例后得到预测图像；如果摄像头远离物体，则目标在图像中会慢慢变小，将上一图像中的物体缩小预设比例后得到预测图像；如果摄像头相对于物体发生拐弯，则目标会在图像中水平移动，将上一图像中的物体进行平移预设距离后得到预测图像。因此通过运动状态信息和姿态位置信息可以精确确定目标的变化情况，再对上一图像中的目标进行放大、缩小或平移得到预测图像。然后，描述装置根据当前图像和预测图像进行进一步的处理：根据预设的目标检测算法从当前图像和预测图像得到至少一个运动目标，运动目标在图像中表现为一个像素区域，运动目标表示在当前图像和预测图像中发生运动的目标，根据识别出的至少一个运动目标生成第一图像。描述装置根据预设的显著性区域检测算法从当前图像中识别出至少一个显著目标，显著目标在图像中表示为一个矩形的像素区域，显著性区域检测算法包括但不限于AC、HC、LC和FT。描述装置将第一图像和第二图像中相同的目标进行去重处理，对于相同的目标只保留一个目标，去重处理后生成预处理图像，预处理图像中包括至少一个互不相同的目标，描述装置根据预设的行为描述算法对预处理图像中的每个目标进行行为描述得到行为描述结果。

上述实施例，通过摄像头的姿态位置信息和运动参数信息可根据上一图像得到预测图像，根据预测图像和当前图像进行目标检测可减少运算量。将识别出来的运动目标和显著性目标进行去重复处理，在对去重复处理后的每个目标进行行为描述得到行为描述结果，这样可对图像中的多个目标同时进行行为描述，并减少计算量。

在本方面的一种可能的实施方式中，对第一图像和第二图像中相同的目标进行去重处理得到预处理图像包括：根据预设的顺序从所述第一图像和所述第二图像中取出两个目标；计算所述两个目标各自对应的相似度值，两个目标的相似度的计算方法包括但不限于直方图匹配、矩阵分解以及SIFT算法，若相似度值大于预设值，确定所述两个目标在各自对应的图像中的坐标位置，若两个目标在各自对应的图像中的坐标位置相同，确定所述两个目标为相同的目标，只保留所述两个目标中的任意一个，重复上述过程，直到完成对第一图像和第二图像中所有的目标的识别。上述实施例，通过对第一图像和第二图像中相同的目标进行去重复处理，在后续的行为描述过程中可减少运算量。

在本方面的一种可能的实施方式中，根据预设的行为描述算法对预处理图像中的每个目标进行行为描述得到行为描述结果包括：针对所述预处理图像中的每个目标，确定目标的初始检测框；将所述初始检测框的长和框都扩大为2倍后生成第一扩展检测框，以及将所述初始检测框的长和框都扩大为4倍后生成第二扩展检测框；将每个目标的初始检测框、第一扩展检测框和第二扩展检测框压缩成预设的相同尺寸的检测框；根据Attention-Based Model算法和LSTM(Long Short-Term Memory，长期记忆)算法对压缩后的3个检测框进行处理得到每个目标的行为描述结果。

在本方面的一种可能的实施方式中，所述目标检测算法为SIFT(Scale-InvariantFeature Transform，尺度不变特征变换)算法和RANSAN(Random Sample Consensus，随机抽样一致性)算法。

在本方面的一种可能的实施方式中，所述姿态位置信息包括：所述摄像头的视角和位置，所述运算状态信息包括速度和转向角。

第二方面，本申请提供了一种目标行为描述装置，包括：

获取模块，用于获取当前图像和所述当前图像的上一图像，以及获取摄像头的姿态位置信息和运动状态信息；

预测模块，用于根据姿态位置信息和运动状态信息对所述上一图像进行预测得到预测图像；

第一生成模块，用于根据预设的目标检测算法从所述当前图像和所述预测图像中识别出至少一个运动目标，生成包括所述至少一个运动目标的第一图像；

第二生成模块，用于根据预设的显著性区域检测算法从所述当前图像中识别出至少一个显著目标，生成包括所述至少一个显著目标的第二图像；

去重模块，用于对所述第一图像和所述第二图像中相同的目标进行去重处理得到预处理图像；

描述模块，用于根据预设的行为描述算法对所述与预处理图像中的每个目标进行行为描述得到行为描述结果。

在本方面的一种可能的实施方式中，所述去重模块用于：

根据预设的顺序从所述第一图像和所述第二图像中取出两个目标；

计算所述两个目标各自对应的相似度值，若相似度值大于预设值，确定所述两个目标在各自对应的图像中的坐标位置，若两个目标在各自对应的图像中的坐标位置相同，确定所述两个目标为相同的目标，只保留所述两个目标中的任意一个。

在本方面的一种可能的实施方式中，所述描述模块用于：

针对所述预处理图像中的每个目标，确定目标的初始检测框；

将所述初始检测框的长和框都扩大为2倍后生成第一扩展检测框，以及将所述初始检测框的长和框都扩大为4倍后生成第二扩展检测框；

将每个目标的初始检测框、第一扩展检测框和第二扩展检测框压缩成预设的相同尺寸的检测框；

根据Attention-Based Model算法和LSTM算法对压缩后的3个检测框进行处理得到每个目标的行为描述结果。

在本方面的一种可能的实施方式中，所述目标检测算法为SIFT算法和RANSAN算法。

第三方面，提供一种本发明提供了一种目标行为描述装置，包括处理器、存储器、通信接口、总线，所述处理器、存储器和通信接口之间通过总线连接并完成相互间的通信，所述存储器中用于存储计算机执行指令，所述目标行为描述装置运行时，所述处理器执行所述存储器中的计算机执行指令以利用所述目标行为描述装置中的硬件资源执行第一方面或第一方面任一种可能实现方式中测试装置所执行的操作。

第四方面，提供了一种计算机可读介质，用于存储计算机程序，该计算机程序包括用于执行第一方面或第一方面任一种可能实现方式中的方法的指令。

第五方面，提供可一种监控设备，监控设备可安装在车辆上，监控设备包括摄像头和目标行为描述装置和显示设备，摄像头用于采集图像，并将采集的图像放在视频缓冲区；

目标行为描述装置用于：获取当前图像和所述当前图像的上一图像，以及获取摄像头的姿态位置信息和运动状态信息；根据姿态位置信息和运动状态信息对所述上一图像进行预测得到预测图像；根据预设的目标检测算法从所述当前图像和所述预测图像中识别出至少一个运动目标，生成包括所述至少一个运动目标的第一图像；根据预设的显著性区域检测算法从所述当前图像中识别出至少一个显著目标，生成包括所述至少一个显著目标的第二图像；对所述第一图像和所述第二图像中相同的目标进行去重处理得到预处理图像；根据预设的行为描述算法对所述与预处理图像中的每个目标进行行为描述得到行为描述结果。

显示设备，用于显示所述行为描述结果。

本申请在上述各方面提供的实现方式的基础上，还可以进行进一步组合以提供更多实现方式。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种目标行为描述方法的流程示意图；

图2a-图2d是预测图像生成的原理示意图；

图2e是行为描述过程的原理示意图；

图3是本发明实施例提供的一种目标行为描述装置的结构示意图；

图4是本发明实施例提供的一种目标行为描述装置的另一结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行描述。

参见图1，为本发明实施例提供的一种目标行为描述方法的流程示意图，在本发明实施例中，所述方法包括：

S101、获取当前图像和所述当前图像的上一图像，以及获取摄像头的姿态位置信息和运动状态信息。

具体的，摄像头根据预设的采样周期采集图像，将采集到的图像按照时间顺序存储在缓冲区中，描述装置可从缓冲区中获取当前图像和当前图像的上一图像。摄像头安装在车辆上，具体可安装在车辆的任意位置，且摄像头会随着车辆的运动而运动，姿态位置信息表示摄像头预先设置的固定参数，包括但不限于视角，运动参数信息表示摄像头随车辆的运动过程中的相关参数，包括但不限于速度和转向角度。

S102、根据姿态位置信息和运动状态信息对所述上一图像进行预测得到预测图像。

具体的，根据摄像头的姿态位置信息和运动状态信息可以确定摄像头相对于物体的运动趋势，例如运动趋势为前进、后退、左转弯、右转弯，不同的运动趋势物体在图像中对应的目标具有不同的变化规律，物体表示真实世界中的实体，目标表示物体在图像中对应的像素区域，可以理解的是图像中一般包括多个目标。

参见图2a所示，在运动趋势为前进的情况下，则目标在图像中会慢慢变大，根据摄像头的速度计算出前进的距离，放大比例和前进的距离成正相关性，根据预设的映射关系确定前进的距离对应的放大比例，那么描述装置可对上一图像中的目标放大预设比例后生成预测图像；

参见图2b所示，在运动趋势为后退的情况下，则目标在图像中会慢慢变小，根据摄像头的速度计算出后退的距离，缩小比例和后退的距离呈正相关性，根据预设的映射关系确定后退的距离对应的缩小比例，那么描述装置可根据缩小比例对上一图像中的目标进行缩小后生成预测图像。

参见图2c所示，在运动趋势为左转弯的情况下，目标在水平方向上向右平移，确定摄像头的转向角，平移的距离和转向角呈正相关性，根据预设的映射关系确定转向角对应的平移距离，那么描述装置可对上一图像中的目标向右平移计算得到距离后生成预测图像。

参见图2d所示，在运动趋势为右转弯的情况下，目标在水平方向上向左平移，确定摄像头的转向角，平移的距离和转向角呈正相关性，根据预设的映射关系确定转向角对应的平移距离，那么描述装置可对上一图像中的目标向左平移计算得到的距离后生成预测图像。

需要说明的是，在运动趋势为多种情况的结合时，描述装置对上一图像中的目标进行对应的处理得到预测图像，例如：运动趋势为前进和左转弯，则描述装置对上一图像中的目标根据预设的放大比例进行放大以及向右平移预设距离后得到预测图像。

S103、根据预设的目标检测算法从所述当前图像和所述预测图像中识别出至少一个运动目标，生成包括所述至少一个运动目标的第一图像。

具体的，运动目标在图像中对应一个像素区域，像素区域的形状由目标对应真实世界中的物体的形状决定，运动目标表示当前图像和预测图像对比发生移动的目标。描述装置根据预设的目标检测算法从当前图像和预测图像中确定出发生至少一个运动目标，根据运动目标生成第一图像，目标检测算法可以是SIFT算法和RANSAC算法的结合。

S104、根据预设的显著性区域检测算法从所述当前图像中识别出至少一个显著目标，生成包括所述至少一个显著目标的第二图像。

具体的，显著性区域在图像中表示一个像素区域，显著性区域检测算法包括但不限于AC、HC、LC和FT，描述装置根据识别出的至少一个显著目标生成第二图像。

S105、对所述第一图像和所述第二图像中相同的目标进行去重处理得到预处理图像。

具体的，描述装置采用遍历的方法识别出第一图像和第二图像中相同的目标，对于相同的目标只保留一个目标，识别相同的目标的方法可以是：根据预设的顺序分别从第一图像和第二图像中取出一个目标，计算两个目标各自对应的相似度值，若相似度值大于预设值，两个目标的相似度值大于预设值并不能说明两个目标是相同的目标，例如同时出现两个相同的车，同时出现两个同样衣服的行人，因此还需要继续识别两个目标在各自对应的图像中的坐标位置，若两个目标在各自图像中的坐标位置相同，才能确定两个目标为相同的目标。计算两个目标的相似度值的方法可以是直方图匹配、矩阵分解或SIFT等。去重处理后，描述装置生成预处理图像，预处理图像中包括至少一个目标，在预处理图像中包括多个目标的情况下，多个目标为互不相同的目标。

S106、根据预设的行为描述算法对所述与预处理图像中的每个目标进行行为描述得到行为描述结果。

具体的，行为描述算法可以是Attention-Based Model模型和LSTM模型的结合，描述装置将确定预处理图像中的所有目标根据预设的行为描述算法进行描述，得到每个目标的行为描述结果。

针对每个目标的行为描述方法可以是：

确定目标的初始检测框；

举例说明：参见图2e所示，预处理图像中包括1个目标，对于该目标而言，确定目标的初始检测框，初始检测框为包括目标的像素块，假设初始检测框为16*16的像素块，然后描述装置生成第一扩展检测框和第二扩展检测框，具体为：将初始检测框的长和宽扩大为2倍后生成第一扩展检测框，将初始检测框的长和宽扩大为4被生成第二扩展检测框，即目标的第一扩展检测框为32*32的像素块，目标的第二扩展检测框为64*64的像素块，将目标的初始检测框、第一扩展检测框和第二扩展检测框压缩成预设大小的像素块，例如：上述的3个检测框均压缩成8*8的像素块，将3个压缩后的像素块输入到Attention-Based模型和LSTM模型得到目标的行为描述结果。在预处理图像中包括多个目标的情况下，每个目标的行为描述过程可参照上述过程，此处不再赘述。

参见图3，为本发明实施例提供的一种目标行为描述装置的结构示意图，以下简称描述装置，本发明实施例的描述装置用于执行图1中的一种目标行为描述方法，所涉及的术语和过程可参照图1实施例的描述。描述装置3包括：获取模块301、预测模块302、第一生成模块303、第二生成模块304、去重模块305和描述模块306。

可选的，所述去重模块用于：

根据预设的顺序每次所述第一图像取出一个目标和所述第二图像中取出一个目标进行两两比较；

计算两个目标各自对应的相似度值，若相似度值大于预设值，确定所述两个目标在各自对应的图像中的坐标位置，若两个目标在各自对应的图像中的坐标位置相同，确定所述两个目标为相同的目标，只保留所述两个目标中的任意一个。

可选的，所述描述模块用于：

可选的，所述目标检测算法为SIFT算法和RANSAN算法。

可选的，所述姿态位置信息包括：所述摄像头的视角和位置，所述运算状态信息包括速度和转向角。

需要说明的是，在本发明实施例中，各个单元的具体实现还可以对应参照图3所示的方法实施例的相应描述。

需要说明的是，测试装置可以通过处理器核、逻辑电路、专用集成电路(英文：Application-Specific Integrated Circuit，缩写：ASIC)中任意一种实现，也可以通过可编程逻辑器件(英文：Programmable Logic Device，缩写：PLD)实现。上述PLD可以是复杂可编程逻辑器件(英文：(Complex Programmable Logic Device，缩写：CPLD)，FPGA，通用阵列逻辑(英文：Generic Array Logic,缩写：GAL)或其任意组合。

参见图4，为本发明实施例提供的一种目标行为描述装置的另一结构示意图，以下简称描述装置，在本发明实施例中，描述装置4包括处理器401、存储器402和收发器403。收发器403用于与外部设备之间收发数据。描述装置4中的处理器401的数量可以是一个或多个。本发明的一些实施例中，处理器401、存储器402和收发器403可通过总线系统或其他方式连接。描述装置4可以用于执行图1所示的方法。关于本实施例涉及的术语的含义以及举例，可以参考图1对应的实施例。此处不再赘述。

其中，存储器402中存储程序代码。处理器401用于调用存储器402中存储的程序代码，用于执行以下操作：

获取当前图像和所述当前图像的上一图像，以及获取摄像头的姿态位置信息和运动状态信息；

根据姿态位置信息和运动状态信息对所述上一图像进行预测得到预测图像；

根据预设的目标检测算法从所述当前图像和所述预测图像中识别出至少一个运动目标，生成包括所述至少一个运动目标的第一图像；

根据预设的显著性区域检测算法从所述当前图像中识别出至少一个显著目标，生成包括所述至少一个显著目标的第二图像；

对所述第一图像和所述第二图像中相同的目标进行去重处理得到预处理图像；

根据预设的行为描述算法对所述与预处理图像中的每个目标进行行为描述得到行为描述结果。

可选的，处理器401执行所述对所述第一图像和所述第二图像中相同的目标进行去重处理得到预处理图像包括：

可选的，处理器401执行所述根据预设的行为描述算法对所述与预处理图像中的每个目标进行行为描述得到行为描述结果包括：

根据Attention-Based算法和LSTM算法对压缩后的3个检测框进行处理得到每个目标的行为描述结果。

可选的，所述目标检测算法为SIFT算法和RANSAN算法。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random AccessMemory，RAM)等。

以上所揭露的仅为本发明较佳实施例而已，当然不能以此来限定本发明之权利范围，因此依本发明权利要求所作的等同变化，仍属本发明所涵盖的范围。

Claims

1.一种目标行为描述方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，所述对所述第一图像和所述第二图像中相同的目标进行去重处理得到预处理图像包括：

以遍历的方式每次分别从所述第一图像和所述第二图像中取出一个目标；

计算取出的两个目标各自对应的相似度值，若相似度值大于预设值，确定所述两个目标在各自对应的图像中的坐标位置，若两个目标在各自对应的图像中的坐标位置相同，确定所述两个目标为相同的目标，只保留所述两个目标中的任意一个。

3.如权利要求1或2所述的方法，其特征在于，所述根据预设的行为描述算法对所述与预处理图像中的每个目标进行行为描述得到行为描述结果包括：

将目标的初始检测框、第一扩展检测框和第二扩展检测框压缩成预设尺寸的检测框；

根据基于注意力模型Attention-Based Model算法和长期记忆LSTM算法对压缩后的3个检测框进行处理得到目标的行为描述结果。

4.如权利要求1-3任意一项所述的方法，其特征在于，所述目标检测算法为尺寸不变特性转换SIFT算法和随机抽样一致性RANSAN算法。

5.如权利要求4所述的方法，其特征在于，所述姿态位置信息包括：所述摄像头的视角和位置，所述运算状态信息包括速度和转向角。

6.一种目标行为描述装置，其特征在于，包括：

7.如权利要求6所述的装置，其特征在于，所述去重模块用于：

以遍历的方式每次分别每次所述第一图像取出一个目标和所述第二图像中取出一个目标；

8.如权利要求6或7所述的装置，其特征在于，所述描述模块用于：

将目标的初始检测框、第一扩展检测框和第二扩展检测框压缩成预设的相同尺寸的检测框；

根据Attention-Based Model算法和LSTM算法对压缩后的3个检测框进行处理得到目标的行为描述结果。

9.如权利要求6-8任意一项所述的装置，其特征在于，所述目标检测算法为SIFT算法和RANSAN算法。

10.如权利要求9所述的装置，其特征在于，所述姿态位置信息包括：所述摄像头的视角和位置，所述运算状态信息包括速度和转向角。

11.一种监控设备，其特征在于，包括摄像头和如权利要求1-10任意一项所述的装置。