CN110414544A - 一种目标状态分类方法、装置及系统 - Google Patents

一种目标状态分类方法、装置及系统 Download PDF

Info

Publication number
CN110414544A
CN110414544A CN201810404947.7A CN201810404947A CN110414544A CN 110414544 A CN110414544 A CN 110414544A CN 201810404947 A CN201810404947 A CN 201810404947A CN 110414544 A CN110414544 A CN 110414544A
Authority
CN
China
Prior art keywords
image
detected
feature
source images
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810404947.7A
Other languages
English (en)
Other versions
CN110414544B (zh
Inventor
楼文杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Hikvision Digital Technology Co Ltd
Original Assignee
Hangzhou Hikvision Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Hikvision Digital Technology Co Ltd filed Critical Hangzhou Hikvision Digital Technology Co Ltd
Priority to CN201810404947.7A priority Critical patent/CN110414544B/zh
Publication of CN110414544A publication Critical patent/CN110414544A/zh
Application granted granted Critical
Publication of CN110414544B publication Critical patent/CN110414544B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches

Abstract

本发明实施例提供了一种目标状态分类方法、装置及系统,其中,目标状态分类方法包括:获取待检测图像序列,待检测图像序列中包括多个待检测图像;利用预设特征提取方法,提取各待检测图像的目标特征;通过向各待检测图像的目标特征分配关注度权重,对各待检测图像的目标特征进行加权组合,得到加权特征;基于加权特征,利用预设循环网络模型,识别待检测图像序列中目标的状态类别。通过本方案可以提高目标状态分类的准确率。

Description

一种目标状态分类方法、装置及系统
技术领域
本发明涉及计算机视觉技术领域,特别是涉及一种目标状态分类方法、装置及系统。
背景技术
随着图像处理技术的不断发展,监控系统的应用范围越来越广。在例如城市道路监控的场景下,通过分析道路监控设备采集的图像,判断机动车辆、行人、非机动车辆等目标的状态,进而实现对城市道路交通状态、交通事件等进行判别,根据判别结果为出行者实时提供出行路线是否有交通事故、是否交通拥堵等交通信息,有效提高出行效率。目标状态分类的核心在于目标特征的提取,由于深度学习方法(例如卷积神经网络)在进行目标特征提取中的高效性和准确率,已成为目标特征提取的主流方法,并且通过在时间维度上将深度学习方法进行扩展,实现对图像序列的目标状态分类,但是,这种方法只能获取短时状态信息,对于复杂的场景,需要利用较早时间的状态信息对当前的目标状态进行分类,这样,导致在进行目标状态分类时,易出现错误。
针对上述问题,相应的目标状态分类方法中,将基于CNN(Convolutional NeuralNetwork,卷积神经网络)的目标特征检测与基于LSTM(Long Short-Term Memory,长短时记忆)的时序检测相结合。针对图像序列,采用目标特征检测和时序结构检测的结果相融合的方式,更为全面的判别图像序列中的目标状态。
由于图像序列中往往包含有多个目标,且场景复杂多变,经常会出现目标被遮挡的情况,则需要非常长的图像序列才能保证目标状态分类的准确性,然而,如果图像序列过长,LSTM的性能会受到较大影响,造成大量的误检。
发明内容
本发明实施例的目的在于提供一种目标状态分类方法、装置及系统,以提高目标状态分类的准确率。具体技术方案如下:
第一方面,本发明实施例提供了一种目标状态分类方法,所述方法包括:
获取待检测图像序列,所述待检测图像序列中包括多个待检测图像;
利用预设特征提取方法,提取各待检测图像的目标特征;
通过向各待检测图像的目标特征分配关注度权重,对各待检测图像的目标特征进行加权组合,得到加权特征;
基于所述加权特征,利用预设循环网络模型,识别所述待检测图像序列中目标的状态类别。
可选的,所述获取待检测图像序列,包括:
获取通过图像采集设备采集的多个源图像;
通过对各源图像进行图像预处理操作,得到与各源图像分别对应的各待检测图像,其中,所述图像预处理操作包括对各源图像的运动前景目标特征进行增强,以及针对相邻的两个源图像进行运动前景目标的光流特征提取;
确定各待检测图像组成待检测图像序列;
所述利用预设特征提取方法,提取各待检测图像的目标特征,包括:
利用预设特征提取方法,提取各待检测图像的运动前景目标特征及光流特征;
针对各待检测图像,按照预设组合规则,将该待检测图像的运动前景目标特征及光流特征进行组合,得到该待检测图像的目标特征。
可选的,所述通过对各源图像进行图像预处理操作,得到与各源图像分别对应的各待检测图像,包括:
利用预先建立的混合高斯模型,提取各源图像中的运动前景目标和背景目标;
针对各源图像,向运动前景目标和背景目标分别分配权重,得到该源图像对应的权重图;
针对各源图像,将该源图像中的像素值与该源图像对应的权重图中的权重值进行点乘操作,得到该源图像对应的点乘图;
基于相邻的两个源图像,提取运动前景目标的光流特征;
确定携带光流特征的点乘图为待检测图像。
可选的,在所述利用预设特征提取方法,提取各待检测图像的目标特征之前,所述方法还包括:
获取多个图像样本,所述图像样本包括目标状态异常的图像样本及目标状态正常的图像样本;
根据所述多个图像样本,对卷积神经网络进行训练,得到卷积神经网络特征提取模型;
所述利用预设特征提取方法,提取各待检测图像的目标特征,包括:
针对各待检测图像,通过所述卷积神经网络特征提取模型,提取目标特征。
可选的,所述待检测图像序列中的各待检测图像按获取的时间顺序排列;
所述关注度权重的确定方式,包括:
基于各待检测图像,利用预设循环网络模型,计算得到各待检测图像对应的状态矩阵;
根据各待检测图像的目标特征,获取各待检测图像的关注度权重的学习参数;
针对各待检测图像,根据与该待检测图像相邻的前一帧待检测图像的状态矩阵,以及该待检测图像的关注度权重的学习参数,计算得到向该待检测图像的目标特征分配的关注度权重。
可选的,所述预设循环网络模型包括长短时记忆模型;
所述基于所述加权特征,利用预设循环网络模型,识别所述待检测图像序列中目标的状态类别,包括:
基于所述加权特征,利用所述长短时记忆模型,对所述待检测图像序列中所有待检测图像进行计算,得到所述待检测图像序列的输出状态;
通过对所述输出状态进行分类,确定所述待检测图像序列中目标的状态类别。
第二方面,本发明实施例提供了一种目标状态分类装置,所述装置包括:
获取模块,用于获取待检测图像序列,所述待检测图像序列中包括多个待检测图像;
提取模块,用于利用预设特征提取方法,提取各待检测图像的目标特征;
加权模块,用于通过向各待检测图像的目标特征分配关注度权重,对各待检测图像的目标特征进行加权组合,得到加权特征;
识别模块,用于基于所述加权特征,利用预设循环网络模型,识别所述待检测图像序列中目标的状态类别。
可选的,所述获取模块,具体用于:
获取通过图像采集设备采集的多个源图像;
通过对各源图像进行图像预处理操作,得到与各源图像分别对应的各待检测图像,其中,所述图像预处理操作包括对各源图像的运动前景目标特征进行增强,以及针对相邻的两个源图像进行运动前景目标的光流特征提取;
确定各待检测图像组成待检测图像序列;
所述提取模块,具体用于:
利用预设特征提取方法,提取各待检测图像的运动前景目标特征及光流特征;
针对各待检测图像,按照预设组合规则,将该待检测图像的运动前景目标特征及光流特征进行组合,得到该待检测图像的目标特征。
可选的,所述获取模块,具体还用于:
利用预先建立的混合高斯模型,提取各源图像中的运动前景目标和背景目标;
针对各源图像,向运动前景目标和背景目标分别分配权重,得到该源图像对应的权重图;
针对各源图像,将该源图像中的像素值与该源图像对应的权重图中的权重值进行点乘操作,得到该源图像对应的点乘图;
基于相邻的两个源图像,提取运动前景目标的光流特征;
确定携带光流特征的点乘图为待检测图像。
可选的,所述装置还包括:
样本获取模块,用于获取多个图像样本,所述图像样本包括目标状态异常的图像样本及目标状态正常的图像样本;
训练模块,用于根据所述多个图像样本,对卷积神经网络进行训练,得到卷积神经网络特征提取模型;
所述提取模块,具体用于:
针对各待检测图像,通过所述卷积神经网络特征提取模型,提取目标特征。
可选的,所述待检测图像序列中的各待检测图像按获取的时间顺序排列;
所述加权模块,还用于:
基于各待检测图像,利用预设循环网络模型,计算得到各待检测图像对应的状态矩阵;
根据各待检测图像的目标特征,获取各待检测图像的关注度权重的学习参数;
针对各待检测图像,根据与该待检测图像相邻的前一帧待检测图像的状态矩阵,以及该待检测图像的关注度权重的学习参数,计算得到向该待检测图像的目标特征分配的关注度权重。
可选的,所述预设循环网络模型包括长短时记忆模型;
所述识别模块,具体用于:
基于所述加权特征,利用所述长短时记忆模型,对所述待检测图像序列中所有待检测图像进行计算,得到所述待检测图像序列的输出状态;
通过对所述输出状态进行分类,确定所述待检测图像序列中目标的状态类别。
第三方面,本发明实施例提供了一种目标状态分类系统,包括图像采集设备和电子设备,其中,
所述图像采集设备,用于采集待检测的源图像;
所述电子设备包括存储器和处理器;所述存储器,用于存放计算机程序;所述处理器,用于执行所述存储器上所存放的程序时,实现本发明实施例第一方面所述的方法步骤。
本发明实施例提供的一种目标状态分类方法、装置及系统,利用预设特征提取方法,提取获取的待检测图像序列中各待检测图像的目标特征,通过向各待检测图像的目标特征分配关注度权重,对各待检测图像的目标特征进行加权组合,得到加权特征,基于加权特征,利用预设循环网络模型,识别待检测图像序列中目标的状态类别。将预设循环网络模型与关注度机制相结合,通过向各待检测图像的目标特征分配关注度权重,将待检测图像序列中的不同目标区别对待,如果关注度较高的目标被遮挡,则可以不对这些待检测图像进行处理,有效控制待检测图像序列的长度,提高目标状态分类的准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的目标状态分类方法的流程示意图;
图2为本发明实施例的目标状态分类装置的结构示意图;
图3为本发明实施例的目标状态分类系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了提高目标状态分类的准确率,本发明实施例提供了一种目标状态分类方法、装置及系统。
下面,首先对本发明实施例所提供的一种目标状态分类方法进行介绍。
本发明实施例所提供的一种目标状态分类方法的执行主体可以为执行智能算法的电子设备,该电子设备可以为安装有处理器的图像采集设备,也可以为远程服务器设备,为了能够实现目标状态分类的目的,执行主体中应该至少包括搭载有核心处理芯片的处理器。实现本发明实施例所提供的一种目标状态分类方法的方式可以为设置于执行主体中的软件、硬件电路和逻辑电路中的至少一种方式。
如图1所示,本发明实施例所提供的一种目标状态分类方法,可以包括如下步骤:
S101,获取待检测图像序列。
其中,待检测图像序列中包括多个待检测图像。待检测图像可以为摄像机拍摄的视频中的视频帧,也可以为照相机拍摄的图片,则待检测图像序列可以为一段视频中连续的多个视频帧,也可以为按时间顺序拍摄的多张图片。待检测图像还可以为对多个视频帧或者多张图片进行预处理之后得到的图像。
可选的,S101具体可以包括如下步骤:
第一步,获取通过图像采集设备采集的多个源图像。
其中,图像采集设备可以为网络摄像机IPC,也可以为智能照相机。图像采集设备采集的源图像可以为视频帧,也可以为图片,多个源图像可以为连续的多个视频帧,也可以为按固定的时间间隔采集的多个视频帧或者多个图片。
第二步,通过对各源图像进行图像预处理操作,得到与各源图像分别对应的各待检测图像。
其中,图像预处理操作包括对各源图像的运动前景目标特征进行增强,以及针对相邻的两个源图像进行运动前景目标的光流特征提取。源图像中包含有行人、机动车辆、非机动车辆等运动前景目标,以及树木、建筑、马路等背景目标,由于关注的是运动前景目标的状态,背景目标往往不予关注,而背景目标的特征太为突出会影响对运动前景目标的判别,因此通过利用对各源图像的运动前景目标与背景目标进行差异处理来对各源图像的运动前景目标特征进行增强,弱化背景目标对运动前景目标的影响,并且如果目标发生状态变化或者异常,目标往往处于运动状态,即目标的光流特征会区别于正常状态的目标,因此,可以针对相邻的两个源图像提取运动前景目标的光流特征。光流特征的提取可以根据相邻的两个源图像的灰度变化进行提取,也可以基于源图像的灰度值计算得到,这里不再赘述。
第三步,确定各待检测图像组成待检测图像序列。
在通过图像预处理操作得到各待检测图像之后,可以将待检测图像进行排列组成待检测图像序列,待检测图像的排列顺序可以按照采集源图像的时间顺序进行排列,也可以随机排列,但是,为了保证图像的连贯性,按照采集源图像的时间顺序对待检测图像进行排列。
可选的,对各源图像进行图像预处理操作的具体步骤,可以包括:
第一步,利用预先建立的混合高斯模型,提取各源图像中的运动前景目标和背景目标;
第二步,针对各源图像,向运动前景目标和背景目标分别分配权重,得到该源图像对应的权重图;
第三步,针对各源图像,将该源图像中的像素值与该源图像对应的权重图中的权重值进行点乘操作,得到该源图像对应的点乘图;
第四步,基于相邻的两个源图像,提取运动前景目标的光流特征;
第五步,确定携带光流特征的点乘图为待检测图像。
增强各源图像的运动前景目标的方式,具体可以是提取源图像中的运动前景目标和背景目标,可以通过向运动前景目标分配较大的权重、向背景目标分配较小的权重,再通过与源图像进行点乘操作后,得到的点乘图中运动前景目标得以增强。
S102,利用预设特征提取方法,提取各待检测图像的目标特征。
预设特征提取方法可以为SIFT(Scale-invariant feature transform尺度不变特征变换)方法、PCA(Principal Component Analysis,主成分分析)方法、基于CNN(Convolutional Neural Network,卷积神经网络)的特征提取方法等。基于S101中可选的步骤,待检测图像可以是对源图像进行图像预处理操作之后得到的图像,则可选的,S102具体可以为:
利用预设特征提取方法,提取各待检测图像的运动前景目标特征及光流特征;
针对各待检测图像,按照预设组合规则,将该待检测图像的运动前景目标特征及光流特征进行组合,得到该待检测图像的目标特征。
其中,预设组合规则可以为,基于光流特征进行权重分配,光流特征所反映出来处于运动状态的运动前景目标分配较大的权重,处于静止状态的运动前景目标分配较小的权重,通过特征组合,得到的待检测图像的目标特征能够更为突出处于运动状态的运动前景目标,更便于对目标进行状态分类。由于在增强运动前景目标时,可能保留的有背景目标,在进行特征提取时,还可能提取得到背景目标特征,则特征组合的方式还可以包括,分别给背景特征、运动前景特征、处于运动状态的目标、处于静止状态的目标分配权重,例如,给背景特征分配0.1的权重,给运动前景目标分配0.9的权重,给基于光流特征分析得到处于运动状态的目标分配0.8的权重,给基于光流特征分析得到处于静止状态的目标分配0.2的权重,则处于运动状态的运动前景目标的权重可以为0.72,该权重大于其他组合形式,则说明更为关注处于运动状态的运动前景目标。
由于基于CNN的特征提取方法具有较高的效率和准确率,可选的,采用基于CNN的特征提取方法对各待检测图像的目标特征进行提取,由于基于CNN的特征提取方法,是提前根据图像样本训练得到一个特征提取模型,通过将各待检测图像输入该特征提取模型即可得到各待检测图像的目标特征。
可选的,在利用预设特征提取方法,提取各待检测图像的目标特征之前,还可以包括如下步骤:
获取多个图像样本,其中,图像样本包括目标状态异常的图像样本及目标状态正常的图像样本;
根据多个图像样本,对卷积神经网络进行训练,得到卷积神经网络特征提取模型。
可选的,S102具体可以为:
针对各待检测图像,通过训练得到的卷积神经网络特征提取模型,提取目标特征。
图像样本的数量越多越好,但需要尽量保证目标状态异常的图像样本的数量与目标状态正常的图像样本的数量基本均衡,例如可以获取500000个目标状态异常的图像样本和500000个目标状态正常的图像样本,并且目标状态异常的图像样本应尽可能的包含各种形式的处于异常状态的目标。卷积神经网络特征提取模型的训练过程,就是基于图像样本,不断调整模型的网络参数,使得利用卷积神经网络特征提取模型在提取特征时,具有较高的效率和准确率。
S103,通过向各待检测图像的目标特征分配关注度权重,对各待检测图像的目标特征进行加权组合,得到加权特征。
本实施例中,利用关注度机制对待检测图像序列进行处理,更为直观的表示对哪些目标更为关注,针对各待检测图像的目标特征所分配的关注度权重可以基于获取的该关注度权重的学习参数进行调整。通常情况下,为了保证待检测图像的实时连续性,可选的,待检测图像序列中的各待检测图像按获取的时间顺序排列。
可选的,关注度权重的确定方式,可以包括:
基于各待检测图像,利用预设循环网络模型,计算得到各待检测图像对应的状态矩阵;
根据各待检测图像的目标特征,获取各待检测图像的关注度权重的学习参数;
针对各待检测图像,根据与该待检测图像相邻的前一帧待检测图像的状态矩阵,以及该待检测图像的关注度权重的学习参数,计算得到向该待检测图像的目标特征分配的关注度权重。
通过分配关注度权重,使得更关注指定的目标,具体可以通过公式(1)计算得到关注度权重。
WGt=Wa×[ht-1] (1)
其中,WGt为向第t时刻获取的待检测图像的目标特征分配的关注度权重,Wa为关注度权重的学习参数,ht-1为通过预设循环网络模型计算得到的第t-1时刻获取的待检测图像的状态矩阵。如果待检测图像序列中包括的是连续的多个视频帧,t表示第t个视频帧。对于采集的第一个待检测图像,Wa和ht-1可以均为设定的初始值。
基于向各待检测图像的目标特征分配的关注度权重,通过加权组合即可得到加权特征,具体的加权组合方式可以如公式(2)所示。
xt=WGt×It (2)
其中,xt为向第t时刻获取的待检测图像的加权特征,It为第t时刻获取的待检测图像的目标特征。
S104,基于加权特征,利用预设循环网络模型,识别待检测图像序列中目标的状态类别。
其中,预设循环网络模型可以为RNN(Recurrent Neural Networks,循环神经网络)模型、GRU(Gated Recurrent Unit,门控循环单元)模型、LSTM(Long Short-TermMemory,长短时记忆)模型等,这些循环网络模型均可以通过网络的循环结构组合序列的特征,以发现目标的分布式特征表示。其中,LSTM通过特殊的网络结构设计避免了长期依赖问题,则可选的,预设循环网络模型包括长短时记忆模型。
可选的,S104具体可以为:
基于加权特征,利用长短时记忆模型,对待检测图像序列中所有待检测图像进行计算,得到待检测图像序列的输出状态;
通过对输出状态进行分类,确定待检测图像序列中目标的状态类别。
具体的,利用长短时记忆模型进行目标状态分类,可以通过以下步骤实现:
第一步,针对第t时刻获取的待检测图像,计算需要更新的目标特征。首先,通过激活函数决定哪些目标特征用来更新,其次利用tanh层生成新的记忆单元状态。具体通过结合公式(3)和公式(4)计算得到的值进行更新。
it=σ(Wi×[ht-1,xt]+bi) (3)
其中,ht-1为通过预设循环网络模型计算得到的第t-1时刻获取的待检测图像的状态矩阵,xt为向第t时刻获取的待检测图像的加权特征,it为第t时刻获取的待检测图像对应的激活函数,用于控制特征的更新,为根据第t时刻获取的待检测图像学习到的记忆单元状态,Wi为激活函数的学习参数,Wc为特征提取的学习参数,bi为输入门的偏置量,为待学习的参数,bc为记忆单元偏置量,为待学习的参数,σ(·)为sigmoid函数,tanh(·)为双曲正切函数。
第二步,根据第t-1时刻获取的待检测图像的状态,利用遗忘门计算第t时刻所需要遗忘的特征的权重。根据第t-1时刻获取的待检测图像的状态和第t时刻获取的待检测图像分配的关注度权重,产生一个0到1的值。具体可以通过公式(5)计算得到遗忘门权重。
ft=σ(Wf×[ht-1,xt]+bf) (5)
其中,ft为遗忘门权重,Wf为遗忘门的学习参数,bf为遗忘门的偏置量,为待学习的参数。
第三步,更新记忆单元的状态,可以根据公式(6)进行更新。
其中,Ct第t时刻获取的待检测图像的记忆单元状态。
第四步,利用输出门,通过公式(7)及公式(8)计算得到第t时刻获取的待检测图像的状态。
ot=σ(Wo×[ht-1,xt]+bo) (7)
ht=ot·tanh(Ct) (8)
其中,ot为输出门的计算结果,Wo为输出门的学习参数,bo为输出门的偏置量,为待学习的参数,ht为第t时刻获取的待检测图像的状态。
通过循环执行上述过程,直至待检测图像序列中的所有待检测图像进行计算,得到待检测图像序列的输出状态,基于该输出状态,进行分类得到目标的状态类别,例如在城市道路交通监控的系统中,通过识别判断车辆的状态类别为撞车的类别,由于撞车的情况发生在车辆行驶的过程中,利用上述目标状态分类方法,可以实时快速有效的识别撞车的异常事件,快速进行报警、出行预警等操作。
应用本实施例,利用预设特征提取方法,提取获取的待检测图像序列中各待检测图像的目标特征,通过向各待检测图像的目标特征分配关注度权重,对各待检测图像的目标特征进行加权组合,得到加权特征,基于加权特征,利用预设循环网络模型,识别待检测图像序列中目标的状态类别。将预设循环网络模型与关注度机制相结合,通过向各待检测图像的目标特征分配关注度权重,将待检测图像序列中的不同目标区别对待,如果关注度较高的目标被遮挡,则可以不对这些待检测图像进行处理,有效控制待检测图像序列的长度,提高目标状态分类的准确率。
相应于上述方法实施例,本发明实施例还提供了一种目标状态分类装置,如图2所示,该目标状态分类装置包括:
获取模块210,用于获取待检测图像序列,所述待检测图像序列中包括多个待检测图像;
提取模块220,用于利用预设特征提取方法,提取各待检测图像的目标特征;
加权模块230,用于通过向各待检测图像的目标特征分配关注度权重,对各待检测图像的目标特征进行加权组合,得到加权特征;
识别模块240,用于基于所述加权特征,利用预设循环网络模型,识别所述待检测图像序列中目标的状态类别。
可选的,所述获取模块210,具体可以用于:
获取通过图像采集设备采集的多个源图像;
通过对各源图像进行图像预处理操作,得到与各源图像分别对应的各待检测图像,其中,所述图像预处理操作包括对各源图像的运动前景目标特征进行增强,以及针对相邻的两个源图像进行运动前景目标的光流特征提取;
确定各待检测图像组成待检测图像序列;
所述提取模块220,具体可以用于:
利用预设特征提取方法,提取各待检测图像的运动前景目标特征及光流特征;
针对各待检测图像,按照预设组合规则,将该待检测图像的运动前景目标特征及光流特征进行组合,得到该待检测图像的目标特征。
可选的,所述获取模块210,具体还可以用于:
利用预先建立的混合高斯模型,提取各源图像中的运动前景目标和背景目标;
针对各源图像,向运动前景目标和背景目标分别分配权重,得到该源图像对应的权重图;
针对各源图像,将该源图像中的像素值与该源图像对应的权重图中的权重值进行点乘操作,得到该源图像对应的点乘图;
基于相邻的两个源图像,提取运动前景目标的光流特征;
确定携带光流特征的点乘图为待检测图像。
可选的,所述装置还可以包括:
样本获取模块,用于获取多个图像样本,所述图像样本包括目标状态异常的图像样本及目标状态正常的图像样本;
训练模块,用于根据所述多个图像样本,对卷积神经网络进行训练,得到卷积神经网络特征提取模型;
所述提取模块220,具体可以用于:
针对各待检测图像,通过所述卷积神经网络特征提取模型,提取目标特征。
可选的,所述待检测图像序列中的各待检测图像按获取的时间顺序排列;
所述加权模块230,还可以用于:
基于各待检测图像,利用预设循环网络模型,计算得到各待检测图像对应的状态矩阵;
根据各待检测图像的目标特征,获取各待检测图像的关注度权重的学习参数;
针对各待检测图像,根据与该待检测图像相邻的前一帧待检测图像的状态矩阵,以及该待检测图像的关注度权重的学习参数,计算得到向该待检测图像的目标特征分配的关注度权重。
可选的,所述预设循环网络模型包括长短时记忆模型;
所述识别模块240,具体可以用于:
基于所述加权特征,利用所述长短时记忆模型,对所述待检测图像序列中所有待检测图像进行计算,得到所述待检测图像序列的输出状态;
通过对所述输出状态进行分类,确定所述待检测图像序列中目标的状态类别。
应用本实施例,利用预设特征提取方法,提取获取的待检测图像序列中各待检测图像的目标特征,通过向各待检测图像的目标特征分配关注度权重,对各待检测图像的目标特征进行加权组合,得到加权特征,基于加权特征,利用预设循环网络模型,识别待检测图像序列中目标的状态类别。将预设循环网络模型与关注度机制相结合,通过向各待检测图像的目标特征分配关注度权重,将待检测图像序列中的不同目标区别对待,如果关注度较高的目标被遮挡,则可以不对这些待检测图像进行处理,有效控制待检测图像序列的长度,提高目标状态分类的准确率。
本发明实施例还提供了一种目标状态分类系统,如图3所示,包括图像采集设备310和电子设备320,其中,
所述图像采集设备310,用于采集待检测的源图像;
所述电子设备320包括处理器321和存储器322;所述存储器322,用于存放计算机程序;所述处理器321,用于执行所述存储器322上所存放的程序时,实现上述目标状态分类方法的所有步骤。
上述存储器可以包括RAM(Random Access Memory,随机存取存储器),也可以包括NVM(Non-Volatile Memory,非易失性存储器),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述处理器可以是通用处理器,包括CPU(Central Processing Unit,中央处理器)、NP(Network Processor,网络处理器)等;还可以是DSP(Digital Signal Processing,数字信号处理器)、ASIC(Application Specific Integrated Circuit,专用集成电路)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
本实施例中,该计算机设备的处理器通过读取存储器中存储的计算机程序,并通过运行该计算机程序,能够实现:利用预设特征提取方法,提取获取的待检测图像序列中各待检测图像的目标特征,通过向各待检测图像的目标特征分配关注度权重,对各待检测图像的目标特征进行加权组合,得到加权特征,基于加权特征,利用预设循环网络模型,识别待检测图像序列中目标的状态类别。将预设循环网络模型与关注度机制相结合,通过向各待检测图像的目标特征分配关注度权重,将待检测图像序列中的不同目标区别对待,如果关注度较高的目标被遮挡,则可以不对这些待检测图像进行处理,有效控制待检测图像序列的长度,提高目标状态分类的准确率。
另外,相应于上述实施例所提供的目标状态分类方法,本发明实施例提供了一种机器可读存储介质,用于存储计算机程序,所述计算机程序被处理器执行时,实现上述目标状态分类方法的所有步骤。
本实施例中,存储介质存储有在运行时执行本发明实施例所提供的目标状态分类方法的应用程序,因此能够实现:利用预设特征提取方法,提取获取的待检测图像序列中各待检测图像的目标特征,通过向各待检测图像的目标特征分配关注度权重,对各待检测图像的目标特征进行加权组合,得到加权特征,基于加权特征,利用预设循环网络模型,识别待检测图像序列中目标的状态类别。将预设循环网络模型与关注度机制相结合,通过向各待检测图像的目标特征分配关注度权重,将待检测图像序列中的不同目标区别对待,如果关注度较高的目标被遮挡,则可以不对这些待检测图像进行处理,有效控制待检测图像序列的长度,提高目标状态分类的准确率。
对于系统以及机器可读存储介质实施例而言,由于其所涉及的方法内容基本相似于前述的方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、系统以及机器可读存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (13)

1.一种目标状态分类方法,其特征在于,所述方法包括:
获取待检测图像序列,所述待检测图像序列中包括多个待检测图像;
利用预设特征提取方法,提取各待检测图像的目标特征;
通过向各待检测图像的目标特征分配关注度权重,对各待检测图像的目标特征进行加权组合,得到加权特征;
基于所述加权特征,利用预设循环网络模型,识别所述待检测图像序列中目标的状态类别。
2.根据权利要求1所述的方法,其特征在于,所述获取待检测图像序列,包括:
获取通过图像采集设备采集的多个源图像;
通过对各源图像进行图像预处理操作,得到与各源图像分别对应的各待检测图像,其中,所述图像预处理操作包括对各源图像的运动前景目标特征进行增强,以及针对相邻的两个源图像进行运动前景目标的光流特征提取;
确定各待检测图像组成待检测图像序列;
所述利用预设特征提取方法,提取各待检测图像的目标特征,包括:
利用预设特征提取方法,提取各待检测图像的运动前景目标特征及光流特征;
针对各待检测图像,按照预设组合规则,将该待检测图像的运动前景目标特征及光流特征进行组合,得到该待检测图像的目标特征。
3.根据权利要求2所述的方法,其特征在于,所述通过对各源图像进行图像预处理操作,得到与各源图像分别对应的各待检测图像,包括:
利用预先建立的混合高斯模型,提取各源图像中的运动前景目标和背景目标;
针对各源图像,向运动前景目标和背景目标分别分配权重,得到该源图像对应的权重图;
针对各源图像,将该源图像中的像素值与该源图像对应的权重图中的权重值进行点乘操作,得到该源图像对应的点乘图;
基于相邻的两个源图像,提取运动前景目标的光流特征;
确定携带光流特征的点乘图为待检测图像。
4.根据权利要求1所述的方法,其特征在于,在所述利用预设特征提取方法,提取各待检测图像的目标特征之前,所述方法还包括:
获取多个图像样本,所述图像样本包括目标状态异常的图像样本及目标状态正常的图像样本;
根据所述多个图像样本,对卷积神经网络进行训练,得到卷积神经网络特征提取模型;
所述利用预设特征提取方法,提取各待检测图像的目标特征,包括:
针对各待检测图像,通过所述卷积神经网络特征提取模型,提取目标特征。
5.根据权利要求1所述的方法,其特征在于,所述待检测图像序列中的各待检测图像按获取的时间顺序排列;
所述关注度权重的确定方式,包括:
基于各待检测图像,利用预设循环网络模型,计算得到各待检测图像对应的状态矩阵;
根据各待检测图像的目标特征,获取各待检测图像的关注度权重的学习参数;
针对各待检测图像,根据与该待检测图像相邻的前一帧待检测图像的状态矩阵,以及该待检测图像的关注度权重的学习参数,计算得到向该待检测图像的目标特征分配的关注度权重。
6.根据权利要求1所述的方法,其特征在于,所述预设循环网络模型包括长短时记忆模型;
所述基于所述加权特征,利用预设循环网络模型,识别所述待检测图像序列中目标的状态类别,包括:
基于所述加权特征,利用所述长短时记忆模型,对所述待检测图像序列中所有待检测图像进行计算,得到所述待检测图像序列的输出状态;
通过对所述输出状态进行分类,确定所述待检测图像序列中目标的状态类别。
7.一种目标状态分类装置,其特征在于,所述装置包括:
获取模块,用于获取待检测图像序列,所述待检测图像序列中包括多个待检测图像;
提取模块,用于利用预设特征提取方法,提取各待检测图像的目标特征;
加权模块,用于通过向各待检测图像的目标特征分配关注度权重,对各待检测图像的目标特征进行加权组合,得到加权特征;
识别模块,用于基于所述加权特征,利用预设循环网络模型,识别所述待检测图像序列中目标的状态类别。
8.根据权利要求7所述的装置,其特征在于,所述获取模块,具体用于:
获取通过图像采集设备采集的多个源图像;
通过对各源图像进行图像预处理操作,得到与各源图像分别对应的各待检测图像,其中,所述图像预处理操作包括对各源图像的运动前景目标特征进行增强,以及针对相邻的两个源图像进行运动前景目标的光流特征提取;
确定各待检测图像组成待检测图像序列;
所述提取模块,具体用于:
利用预设特征提取方法,提取各待检测图像的运动前景目标特征及光流特征;
针对各待检测图像,按照预设组合规则,将该待检测图像的运动前景目标特征及光流特征进行组合,得到该待检测图像的目标特征。
9.根据权利要求8所述的装置,其特征在于,所述获取模块,具体还用于:
利用预先建立的混合高斯模型,提取各源图像中的运动前景目标和背景目标;
针对各源图像,向运动前景目标和背景目标分别分配权重,得到该源图像对应的权重图;
针对各源图像,将该源图像中的像素值与该源图像对应的权重图中的权重值进行点乘操作,得到该源图像对应的点乘图;
基于相邻的两个源图像,提取运动前景目标的光流特征;
确定携带光流特征的点乘图为待检测图像。
10.根据权利要求7所述的装置,其特征在于,所述装置还包括:
样本获取模块,用于获取多个图像样本,所述图像样本包括目标状态异常的图像样本及目标状态正常的图像样本;
训练模块,用于根据所述多个图像样本,对卷积神经网络进行训练,得到卷积神经网络特征提取模型;
所述提取模块,具体用于:
针对各待检测图像,通过所述卷积神经网络特征提取模型,提取目标特征。
11.根据权利要求7所述的装置,其特征在于,所述待检测图像序列中的各待检测图像按获取的时间顺序排列;
所述加权模块,还用于:
基于各待检测图像,利用预设循环网络模型,计算得到各待检测图像对应的状态矩阵;
根据各待检测图像的目标特征,获取各待检测图像的关注度权重的学习参数;
针对各待检测图像,根据与该待检测图像相邻的前一帧待检测图像的状态矩阵,以及该待检测图像的关注度权重的学习参数,计算得到向该待检测图像的目标特征分配的关注度权重。
12.根据权利要求7所述的装置,其特征在于,所述预设循环网络模型包括长短时记忆模型;
所述识别模块,具体用于:
基于所述加权特征,利用所述长短时记忆模型,对所述待检测图像序列中所有待检测图像进行计算,得到所述待检测图像序列的输出状态;
通过对所述输出状态进行分类,确定所述待检测图像序列中目标的状态类别。
13.一种目标状态分类系统,其特征在于,包括图像采集设备和电子设备,其中,
所述图像采集设备,用于采集待检测的源图像;
所述电子设备包括存储器和处理器;所述存储器,用于存放计算机程序;所述处理器,用于执行所述存储器上所存放的程序时,实现权利要求1-6任一所述的方法步骤。
CN201810404947.7A 2018-04-28 2018-04-28 一种目标状态分类方法、装置及系统 Active CN110414544B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810404947.7A CN110414544B (zh) 2018-04-28 2018-04-28 一种目标状态分类方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810404947.7A CN110414544B (zh) 2018-04-28 2018-04-28 一种目标状态分类方法、装置及系统

Publications (2)

Publication Number Publication Date
CN110414544A true CN110414544A (zh) 2019-11-05
CN110414544B CN110414544B (zh) 2023-01-03

Family

ID=68357569

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810404947.7A Active CN110414544B (zh) 2018-04-28 2018-04-28 一种目标状态分类方法、装置及系统

Country Status (1)

Country Link
CN (1) CN110414544B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111950517A (zh) * 2020-08-26 2020-11-17 司马大大(北京)智能系统有限公司 一种目标检测方法、模型训练方法,电子设备及存储介质
WO2021169723A1 (zh) * 2020-02-27 2021-09-02 Oppo广东移动通信有限公司 图像识别方法、装置、电子设备及存储介质
CN114120136A (zh) * 2022-01-27 2022-03-01 人民中科(济南)智能技术有限公司 对垃圾进行分类的方法、装置以及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002008783A1 (en) * 2000-07-24 2002-01-31 Qinetiq Limited Method and apparatus for recognising a radar target
CN104537360A (zh) * 2015-01-15 2015-04-22 上海博康智能信息技术有限公司 车辆未让行违章检测方法及其检测系统
CN106202330A (zh) * 2016-07-01 2016-12-07 北京小米移动软件有限公司 垃圾信息的判断方法及装置
CN106297297A (zh) * 2016-11-03 2017-01-04 成都通甲优博科技有限责任公司 基于深度学习的交通拥堵判别方法
US20170177972A1 (en) * 2015-12-21 2017-06-22 Nokia Technologies Oy Method for analysing media content
CN107194346A (zh) * 2017-05-19 2017-09-22 福建师范大学 一种汽车疲劳驾驶预测方法
CN107463919A (zh) * 2017-08-18 2017-12-12 深圳市唯特视科技有限公司 一种基于深度3d卷积神经网络进行面部表情识别的方法
CN107609460A (zh) * 2017-05-24 2018-01-19 南京邮电大学 一种融合时空双重网络流和attention机制的人体行为识别方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002008783A1 (en) * 2000-07-24 2002-01-31 Qinetiq Limited Method and apparatus for recognising a radar target
CN104537360A (zh) * 2015-01-15 2015-04-22 上海博康智能信息技术有限公司 车辆未让行违章检测方法及其检测系统
US20170177972A1 (en) * 2015-12-21 2017-06-22 Nokia Technologies Oy Method for analysing media content
CN106202330A (zh) * 2016-07-01 2016-12-07 北京小米移动软件有限公司 垃圾信息的判断方法及装置
CN106297297A (zh) * 2016-11-03 2017-01-04 成都通甲优博科技有限责任公司 基于深度学习的交通拥堵判别方法
CN107194346A (zh) * 2017-05-19 2017-09-22 福建师范大学 一种汽车疲劳驾驶预测方法
CN107609460A (zh) * 2017-05-24 2018-01-19 南京邮电大学 一种融合时空双重网络流和attention机制的人体行为识别方法
CN107463919A (zh) * 2017-08-18 2017-12-12 深圳市唯特视科技有限公司 一种基于深度3d卷积神经网络进行面部表情识别的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
QI CHU ET AL.: "Online Multi-object Tracking Using CNN-Based Single Object Tracker with Spatial-Temporal Attention Mechanism", 《2017 IEEE INTERNATIONAL CONFERENCE ON COMPUTER VISION (ICCV)》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021169723A1 (zh) * 2020-02-27 2021-09-02 Oppo广东移动通信有限公司 图像识别方法、装置、电子设备及存储介质
CN111950517A (zh) * 2020-08-26 2020-11-17 司马大大(北京)智能系统有限公司 一种目标检测方法、模型训练方法,电子设备及存储介质
CN114120136A (zh) * 2022-01-27 2022-03-01 人民中科(济南)智能技术有限公司 对垃圾进行分类的方法、装置以及存储介质

Also Published As

Publication number Publication date
CN110414544B (zh) 2023-01-03

Similar Documents

Publication Publication Date Title
CN109978893B (zh) 图像语义分割网络的训练方法、装置、设备及存储介质
CN105550701B (zh) 实时图像提取识别方法及装置
Rachmadi et al. Adaptive traffic signal control system using camera sensor and embedded system
CN109447169A (zh) 图像处理方法及其模型的训练方法、装置和电子系统
CN108304798A (zh) 基于深度学习及运动一致性的街面秩序事件视频检测方法
CN109886951A (zh) 视频处理方法、装置及电子设备
CN109117879A (zh) 图像分类方法、装置及系统
CN109993031A (zh) 一种畜力车目标违章行驶行为检测方法、装置及相机
CN102076531A (zh) 车辆畅通路径检测
CN110689093B (zh) 一种复杂场景下的图像目标精细分类方法
CN110414544A (zh) 一种目标状态分类方法、装置及系统
CN112418360B (zh) 卷积神经网络的训练方法、行人属性识别方法及相关设备
CN109977994A (zh) 一种基于多示例主动学习的代表性图像选取方法
CN109657534A (zh) 对图像中人体进行分析的方法、装置及电子设备
CN109829382A (zh) 基于行为特征智能分析的异常目标预警追踪系统及方法
CN109522970A (zh) 图像分类方法、装置及系统
CN111553321A (zh) 一种流动商贩目标检测模型、检测方法及其管理方法
CN111241964A (zh) 目标检测模型的训练方法、装置、电子设备和存储介质
CN108875500A (zh) 行人再识别方法、装置、系统及存储介质
Dickinson et al. Road traffic monitoring using the TRIP II system
CN108875501A (zh) 人体属性识别方法、装置、系统及存储介质
He et al. Real-time pedestrian warning system on highway using deep learning methods
Alsaedi et al. Design and Simulation of Smart Parking System Using Image Segmentation and CNN
CN112488985A (zh) 图像质量确定方法、装置及设备
CN115565146A (zh) 基于自编码器获取鸟瞰图特征的感知模型训练方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant