CN112164097B - 一种船舶视频检测样本采集方法 - Google Patents
一种船舶视频检测样本采集方法 Download PDFInfo
- Publication number
- CN112164097B CN112164097B CN202011124369.5A CN202011124369A CN112164097B CN 112164097 B CN112164097 B CN 112164097B CN 202011124369 A CN202011124369 A CN 202011124369A CN 112164097 B CN112164097 B CN 112164097B
- Authority
- CN
- China
- Prior art keywords
- target
- detection
- frame
- tracking
- video
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 144
- 238000000034 method Methods 0.000 title claims abstract description 33
- 230000000694 effects Effects 0.000 claims abstract description 22
- 238000012544 monitoring process Methods 0.000 claims abstract description 11
- 230000008569 process Effects 0.000 claims abstract description 4
- 238000012549 training Methods 0.000 claims description 26
- 239000011159 matrix material Substances 0.000 claims description 21
- 238000004364 calculation method Methods 0.000 claims description 16
- 238000001914 filtration Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 4
- 238000012790 confirmation Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 239000013598 vector Substances 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 2
- 230000007704 transition Effects 0.000 claims description 2
- 230000005764 inhibitory process Effects 0.000 claims 1
- 238000013135 deep learning Methods 0.000 abstract description 20
- 230000000295 complement effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/246—Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种船舶视频检测样本采集方法,包括视频船舶目标检测方法;船舶目标跟踪方法;运动目标检测方法;样本采集策略。本发明能够自动从海事CCTV监控视频拍摄的实时视频和历史录像视频中采集高质量的船舶目标数据集,为基于深度学习的船舶目标检测提供数据支撑,在目标检测的过程中积累数据,不断提高深度学习的效果。
Description
技术领域
本发明属于船舶CCTV视频智能监控领域,具体涉及一种船舶视频检测样本采集方法。
背景技术
近年来,随着深度学习算法在船舶视频目标检测领域的应用,检测精度和效果都远超过去基于模板匹配、运动检测、传统机器学习等方法,但是深度学习目标检测的效果是建立在大量训练数据基础上的。海事领域应用深度学习进行船舶目标检测目前还处于起步阶段,没有足够的船舶检测数据集,公开的通用数据集如COCO、VOC、CIFAR,其中船舶的图片与海事监管中船舶的图片相差较大,直接拿来训练在实际检测中的效果达不到要求。因此需要在海事CCTV视频监控系统的采集专用的船舶检测数据集,但在海量的监控视频中采集什么样的图片作为数据集依然是一个难题。
发明内容
发明目的:本发明所要解决的技术问题是针对现有技术的不足,提供一种船舶视频检测样本采集方法,结合视频船舶目标检测、船舶目标跟踪、运动目标检测的输出,样本采集策略融合三者的输出结果,判断当前视频帧是否需要采集。
所述的视频船舶目标检测包括使用海事CCTV监控视频拍摄的实时视频和历史录像视频,使用深度学习方法,如YOLO、SSD、FastRCNN等检测视频中的船舶目标,输出目标的检测矩形框信息(位置信息、大小信息、类别信息、置信度)。
所述的船舶目标跟踪根据船舶目标检测的输出,对视频中所有船舶目标进行跟踪,输出船舶目标的跟踪矩形框信息(位置信息、大小信息、类别信息、跟踪匹配结果、跟踪ID)。
所述的运动目标检测包括使用海事CCTV监控视频拍摄的实时视频和历史录像视频,对视频中的运动目标进行检测,输出运动目标的矩形框信息(位置信息、大小信息)。
所述的样本采集策略包括使用海事CCTV监控视频拍摄的实时视频和历史录像视频,判断视频流中哪些帧需要采集,采集的一帧视频为一张图片,采集后形成多张图片组成的船舶图片数据集,为深度学习提供数据支撑。
为了实现上述目的,本发明具体步骤如下:
步骤1、视频船舶目标检测:基于深度学习方法,在海事CCTV视频中检测出船舶,输出船舶目标的外接矩形框信息;
步骤2、船舶目标跟踪:跟踪检测到的船舶目标,即判断当前帧的目标与上一帧的目标是否为同一目标,输出匹配的跟踪目标、消失目标;
步骤3、运动目标检测:采用背景差分的方法,检测视频中的运动目标,输出目标的外接矩形信息;
步骤4,样本采集策略:结合步骤2和步骤3的输出信息,判断当前视频帧的检测效果,当检测效果不满足要求且离上一次采集时间间隔超过阈值时,采集当前视频帧作为船舶图片样本集。
步骤1包括:
步骤1-1,预处理:从海事CCTV实时监控视频或录像视频中采集视频帧,对视频帧进行缩放和归一化处理;
步骤1-2,将预处理后的视频帧送入船舶目标检测深度网络进行计算(深度网络需要通过大量的船舶图片样本进行训练),计算结果为检测框,包括框的中心坐标和长、宽,置信度,框所属的类别以及类别置信度
步骤1-3,根据设定的阈值,剔除检测框置信度和类别置信度低于阈值的输出框,然后通过非极大值抑制(抑制检测框置信度不是极大值的元素)删除重合的框,输出最终的船舶目标检测框;
步骤2包括:
步骤2-1,初始化跟踪目标:对于新的船舶目标检测框,初始化跟踪目标,包括卡尔曼滤波状态空间矩阵、协方差矩阵;
步骤2-2,预测目标检测框:使用卡尔曼滤波,基于跟踪目标在t-1时刻的状态X来预测其在t时刻的状态X′,计算公式为X′=FX,F为状态空间转移矩阵,并更新协方差矩阵S′=FS+Q,Q为噪声矩阵,Q=diag[Wh,Wh,0.1,Wh],W为噪声权重,h为步骤1-2的计算结果检测框的高;
步骤2-3,目标深度特征提取:使用深度特征提取网络分别提取所有检测目标和跟踪目标的128维特征向量,网络特征通过标注的船舶跟踪目标训练得到;
步骤2-4,进行目标匹配。
步骤2-4包括:
根据如下公式计算跟踪预测目标i和检测目标j的128维深度特征之间的余弦距离d1(i,j):
b1(i,j)=1[d1(i,j)≤t1]
其中,Ri为跟踪预测目标i的历史预测关联框序列,t1是设定的阈值,b1(i,j)为跟踪预测i和检测目标j的图像相似度0-1二值化计算结果,如果跟踪预测i和检测目标j的深度特征余弦距离小于阈值t1,b1(i,j)置为1;
根据如下公式计算跟踪预测i和检测目标j的运动相似度d2(i,j):
b2(i,j)=1[d2(i,j)≤t2]
其中,xj为检测目标j的状态特征,yi为跟踪预测i的状态特征,Si为跟踪预测i的协方差矩阵,t2是设定的阈值,b2(i,j)为跟踪预测i和检测目标j的运动相似度0-1二值化计算结果;
跟踪预测i和检测目标j的最终相似度d(i,j)为:
d(i,j)=αd1(i,j)+(1-α)d2(i,j)
其中,α是设定的阈值,d(i,j)最小且b(i,j)不等于0的跟踪预测i和检测目标j为确认跟踪目标Tracki,没有匹配到的跟踪预测标记为疑似消失目标,没有匹配到的检测目标标记为疑似新目标;跟踪预测i连续I帧标记疑似消失目标,则加入标记为消失目标Ui,检测目标j连续J帧标记疑似新目标,则设为新目标。
步骤3包括:
步骤3-1,背景模型初始化:将视频的第一帧作为背景模型,将该帧中每一个像素点(x,y)的领域Ng(x,y)周围随机取N个像素点,填充该像素点的样本集M0(x,y):
M0(x,y)={v0(z|z∈Ng(x,y))},
式中z表示随机取的像素,v0表示像素点(x,y)的领域周围随机取N个像素点的计算过程;
步骤3-2,前景检测:遍历新一帧图像的每个像素点vi(x,y),判断像素点与样本集M0(x,y)之差D(x,y)=v0(x,y)-vi(x,y)|vi(x,y)∈M0(x,y),D(x,y)中大于阈值Tv的个数R(x,y)=∑1[D(x,y)≥Tv],如果R(x,y)大于阈值TR,则设为运动前景,像素值置1,背景置0;
步骤3-3,背景更新;
步骤3-4,对运动检测后的视频帧进行开运算和闭运算,并进行轮廓检测,并去掉轮廓包含的像素小于阈值的小轮廓,计算轮廓的外接矩形得到最终运动目标检测的输出。
步骤3-3包括:
同时满足以下三种策略时将像素点更新为背景:
1)每个背景点都有φ的概率更新该背景像素点模型样本集M0(x,y)中的值;
2)以φ的概率去更新该像素点领域的模型样本值;
3)对像素点进行统计,如果一个像素点连续n次被检测为前景,则将其更新为背景点;
对前景进行开运算和闭运算,最后输出前景目标的最小外接矩形作为运动目标。
步骤4包括:
步骤4-1,设置样本采集时间间隔阈值Ti,当采集完一次样本后的Ti秒内不再采集样本,
步骤4-2,初始样本采集:对于没有进行步骤1训练过的模型,当运动检测到的运动目标的个数大于0时采集当前帧的画面作为样本;
步骤4-3,根据采集策略决定是否采集当前视频帧作为样本。
步骤4-3包括:
对于已经训练过的模型,联合步骤1、2、3共同判断是否采集样本,具体满足以下两个策略中任意一个,且满足时间间隔阈值时进行样本采集:
1)使用步骤1进行目标检测,将结果输入到步骤2进行目标跟踪,使用步骤3进行运动目标检测,如果步骤2输出的跟踪目标消失,但步骤3在消失目标附近检测到运动物体,则可能是目标检测不良造成检测框消失或突变,造成跟踪目标消失,需要进行样本采集,计算消失目标Ui与运动目标CS的交并比IOU:
其中AT为步骤2输出的跟踪目标消失前最后一帧的跟踪框面积,AC为该帧对应位置的运动目标外接矩形面积;如果IOU大于阈值Tioul,则采集跟踪目标消失时的画面帧作为样本,本发明中Tiou设为0.4。
2)计算步骤2输出的跟踪框Tracki和步骤3输出的运动目标CS的IOU,如果连续F帧IOU小于阈值Tiou2且大于0,且跟踪框的质心与运动目标的质心位置标准差大于阈值Tstd则采集当前帧的画面作为样本,本发明F设为5,Tiou2设为0.8,Tstd设为0.5。
其中B为二值计算,表示跟踪框Tracki的质心,/>表示运动目标CS的质心。
采集的样本集最终是为步骤1船舶目标检测提供训练样本,提高训练效果,增加检测精度。本发明,结合步骤1、2、3,形成深度学习和运动检测两种算法的互补,判断当前视频帧的检测效果,当满足采集策略,采集当前视频帧作为船舶图片样本集,最终实现高效地采集高质量的,可以改善船舶目标检测深度学习训练效果,不易发生过拟合,没有废样本的船舶图片样本集。
本发明产生的有益效果是:为基于深度学习的视频船舶目标检测提供数据集,与船舶目标检测形成闭环,在检测过程中自动样本,且积累的样本为检测时效果不理想的样本,如漏检、误检、检测精度低等,这样在后期训练时可以更好的学习船舶检测模型,提高检测精度。
附图说明
下面结合附图和具体实施方式对本发明做更进一步的具体说明,本发明的上述和/或其他方面的优点将会变得更加清楚。
图1是本发明步骤2中目标跟踪深度特征提取网络结构图;
图2是本发明实施的视频船舶目标检测流程图;
图3是本发明实施的船舶目标跟踪流程图;
图4是本发明实施的运动目标检测流程图;
图5是视频帧样本采集策略流程图;
图6是使用本发明获取的采集样本实例;
图7a是定时截图生成1000张图片作为训练集的训练精度示意图。
图7b是采用本发明生成共计736张图片作为训练集的训练精度。
具体实施方式
本发明提供了一种船舶视频检测样本采集方法,包括:
步骤1,视频船舶目标检测,采用深度学习进行船舶目标检测。流程如图2所示。
1-1预处理。从海事CCTV实时监控视频或录像视频中采集视频帧,对视频帧进行预处理。预处理包括缩放和归一化。缩放是指将视频帧的长宽尺寸缩放到深度学习网络输入尺寸的要求,本发明使用的输入尺寸为416×416。归一化是指将视频帧每一个像素值除以255归一化到0-1之间;
1-2深度目标检测网络计算。将预处理后视频帧送入船舶目标检测深度网络进行计算,本实施例采用的目标识别网络为Darknet53网络,网络参数由标注的船舶目标图片数据训练得到。网络输出13×13×6,26×26×6,52×52×6三种不同尺度的目标检测框序列,其中13×13,26×26,52×52为输出特征图的尺寸,×6表示输出检测框的左上角坐标x,y,长,宽,检测框的置信度,类别置信度。
1-3检测后处理。根据设定的阈值,剔除检测框置信度和类别置信度低于阈值的输出框,然后通过非极大值抑制删除重合的框,输出最终的船舶目标检测框Detectionj,本发明使用的检测框阈值为0.6,类别阈值为0.8,非极大值抑制的阈值为0.5。
步骤2船舶目标跟踪,步骤1检测到目标后,为了判断当前目标检测的效果作为后续样本采集的判断,需要对检测到的船舶目标进行连续跟踪,本发明采用深度学习结合运动学预测结合的方法进行船舶目标跟踪。流程如图3所示。
2-1初始化跟踪目标。对于新的船舶目标检测框,初始化跟踪目标,卡尔曼滤波状态空间矩阵P、协方差矩阵C,状态空间矩阵P包括检测框中心的位置、纵横比、高度、以及在图像坐标中对应的速度信息,其中位置、纵横比、高度由目标检测结果提供速度信息初始化为0,协方差矩阵表示目标位置信息的不确定性,由8×8的对角矩阵表示,矩阵中数字越大则表明不确定性越大,本发明将值初始化为0-1之间的随机数。
2-2预测目标检测框。使用卡尔曼滤波,基于跟踪目标在t-1时刻的状态X来预测其在t时刻的状态X′,计算公式为X′=FX。并更新协方差矩阵S′=FS+Q,Q为噪声矩阵,Q=diag[Wh,Wh,0.1,Wh],W为噪声权重,本发明设为0.05,h为检测框的高。
2-3目标深度特征提取。使用图1网络分别提取所有检测目标和跟踪目标的128维特征向量,网络特征通过标注的船舶跟踪目标训练得到。
2-4目标匹配。计算跟踪预测i和检测目标j的128维深度特征之间的余弦距离d1(i,j),Ri为预测框i的历史预测关联框序列,本发明设置的序列长度为100。如果跟踪预测i和检测目标j的深度特征余弦距离小于阈值t1,b1(i,j)置为1,本发明中t1设为0.2。
b1(i,j)=1[d1(i,j)≤t1]
计算跟踪预测i和检测目标j的运动相似度d2(i,j),其中xj为检测目标j的状态特征,yi为跟踪预测i的状态特征,Si为跟踪预测i的协方差矩阵。同样引入二值判断b2(i,j),本发明中t2设为9.4877。
b2(i,j)=1[d2(i,j)≤t2]
跟踪预测i和检测目标j的最终相似度为,本发明α设置为0.5:
d(i,j)=αd1(i,j)+(1-α)d2(i,j)
d(i,j)最小且b(i,j)不等于0的跟踪预测i和检测目标j为确认跟踪目标Tracki,没有匹配到的跟踪预测标记为疑似消失目标,没有匹配到的检测目标标记为疑似新目标。跟踪预测i连续I帧标记疑似消失目标,则加入标记为消失目标Ui,本发明中I设为50,检测目标j连续J帧标记疑似新目标,则设为新目标,根据2-1进行初始化。
步骤3,运动目标检测。为了判断目标检测的效果,进而选择是否采集样本,仅仅采用深度学习的方法是不够的,本发明采用基于背景差分的算法与步骤1、2的结果进行联合判断船舶目标检测的效果,船舶运动目标流程如图4所示。
3-1背景模型初始化。将视频的第一帧作为背景模型,将该帧中每一个像素点(x,y)的领域Ng(x,y)周围随机取N个像素点,填充该像素点的样本集M0(x,y),本发明N设为25。
M0(x,y)={v0(z|z∈Ng(x,y))}
3-2前景检测。遍历新一帧图像的每个像素点v0(x,y),判断像素点与历史样本M0(x,y)之差D(x,y)=v0(x,y)-vi(x,y)|vi(x,y)∈M0(x,y),D(x,y)中大于阈值Tv的个数R(x,y)=∑1[D(x,y)≥Tv],如果R(x,y)大于阈值TR,则设为运动前景,像素值置1,背景置0。本发明中Tv设为50,TR设为12。
3-3背景更新。同时满足以下三种策略时将像素点更新为背景。1)每个背景点都有φ的概率更新该像素点的模型样本值;2)以φ的概率去更新该像素点领域的模型样本值;3)对像素点进行统计,如果某个像素点连续n次被检测为前景,则将其更新为背景点,本发明中n设为1800,φ设为0.4。
3-4后处理。对运动检测后的视频帧进行开运算和闭运算,轮廓检测,并去掉轮廓包含的像素小于阈值Tc的小轮廓,本发明Tc设为64,计算轮廓的外接矩形得到最终运动目标检测的输出CS。
步骤4,视频帧样本采集策略。采集的样本集最终是为步骤1船舶目标检测提供训练样本,提高训练效果,增加检测精度。如果单纯使用步骤1中深度学习的方法,如使用不同网络进行检测效果判断,存在两个问题,第一,采集的样本没有互补性,对同一艘船采集过多的样本,造成样本集偏斜,训练时易过拟合;第二,当网络没有训练时,无法获取训练样本,只能通过随机的从视频中截图获取初始样本,样本集中大量的图片的无效样本,使得模型初始训练困难。如果单纯使用步骤3中运动目标检测的方法进行样本采集判断,也存在两个问题的,第一,只能盲目增加视频中的存在运动物体的画面到样本集中,运动物体可能不是船舶目标,而是其他物体或噪声;第二,采集的样本没有针对性,无法标记深度学习检测效果不理想的样本。本发明,结合步骤1、2、3,形成深度学习和运动检测两种算法的互补,高效地采集高质量的训练样本。流程如图5所示,最终形成的采集样本实例如图6所示,采用本发明获取的样本集对比一般方法获取的样本集,在相同验证集下训练精度效果对比如图7a和图7b所示。
4-1设置样本采集时间间隔阈值Ti。为了防止多次采集临近帧相似画面的样本,提高样本的多样性,设置一个时间间隔阈值Ti,当采集完一次样本后的Ti秒内不再采集样本,本发明Ti设为30。
4-2初始样本采集。对于没有训练过的模型,采用运动检测进行样本采集判断,当运动检测到的运动目标CS的个数大于0,且满足时间阈值Ti时采集当前帧的画面作为样本。
4-3采集策略。对于已经训练过的模型,联合步骤1、2、3共同判断是否采集样本,具体满足以下两个策略中任意一个,且满足时间间隔阈值时进行样本采集。
1)使用步骤1进行目标检测输入到步骤2进行目标跟踪,使用步骤3进行运动目标检测,如果正在步骤2输出的跟踪的目标消失,但步骤3运动检测在消失目标附近检测到运动物体,则可能是目标检测不良造成检测框消失或突变,进而影响跟踪造成跟踪目标消失,需要进行样本采集,计算消失目标Ui与运动目标CS的IOU,
其中AT为步骤2输出的跟踪目标消失前最后一帧的跟踪框面积,AC为该帧对应位置的运动目标外接矩形面积。若IOU大于阈值Tioul,则采集跟踪目标消失时的画面帧作为样本,本发明中Tiou设为0.4。
2)测试中发现,如果样本集不够丰富,深度学习训练的模型进行目标检测和跟踪,会造成最终的跟踪框Tracki抖动,而运动检测到的目标CS相对稳定,此时进行样本采集以丰富训练样本集。判断跟踪框Tracki是否抖动通过计算Tracki和运动目标CS的IOU实现。若连续F帧IOU小于阈值Tiou2且大于0,且Tracki的质心与CS的质心位置标准差大于阈值Tstd则采集当前帧的画面作为样本,本发明F设为5,Tiou2设为0.8,Tstd设为0.5。
其中B为二值计算,表示跟踪框Tracki的质心,/>表示运动目标CS的质心。
采集的样本集最终是为步骤1船舶目标检测提供训练样本,提高训练效果,增加检测精度。本发明,结合步骤1、2、3,形成深度学习和运动检测两种算法的互补,判断当前视频帧的检测效果,当满足采集策略,采集当前视频帧作为船舶图片样本集,最终实现高效地采集高质量的,可以改善船舶目标检测深度学习训练效果,不易发生过拟合,没有废样本的船舶图片样本集。
本发明提供了一种船舶视频检测样本采集方法,具体实现该技术方案的方法和途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。本实施例中未明确的各组成部分均可用现有技术加以实现。
Claims (6)
1.一种船舶视频检测样本采集方法,其特征在于,包括以下步骤;
步骤1、视频船舶目标检测:在海事CCTV视频中检测出船舶,输出船舶目标的外接矩形框信息;
步骤2、船舶目标跟踪:跟踪检测到的船舶目标,即判断当前帧的目标与上一帧的目标是否为同一目标,输出匹配的跟踪目标、消失目标;
步骤3、运动目标检测:检测视频中的运动目标,输出目标的外接矩形信息;
步骤4,样本采集策略:结合步骤2和步骤3的输出信息,判断当前视频帧的检测效果,当检测效果不满足要求且离上一次采集时间间隔超过阈值时,采集当前视频帧作为船舶图片样本集;
步骤4包括:
步骤4-1,设置样本采集时间间隔阈值Ti,当采集完一次样本后的Ti秒内不再采集样本,
步骤4-2,初始样本采集:对于没有进行步骤1训练过的模型,当运动检测到的运动目标的个数大于0时采集当前帧的画面作为样本;
步骤4-3,根据采集策略决定是否采集当前视频帧作为样本;
步骤4-3包括:
对于已经训练过的模型,联合步骤1、2、3共同判断是否采集样本,具体满足以下两个策略中任意一个,且满足时间间隔阈值时进行样本采集:
1)使用步骤1进行目标检测,将结果输入到步骤2进行目标跟踪,使用步骤3进行运动目标检测,如果步骤2输出的跟踪目标消失,但步骤3在消失目标附近检测到运动物体,则可能是目标检测不良造成检测框消失或突变,造成跟踪目标消失,需要进行样本采集,计算消失目标Ui与运动目标CS的交并比IOU:
其中AT为步骤2输出的跟踪目标消失前最后一帧的跟踪框面积,AC为该帧对应位置的运动目标外接矩形面积;如果IOU大于阈值Tiou1,则采集跟踪目标消失时的画面帧作为样本;
2)计算步骤2输出的跟踪框Tracki和步骤3输出的运动目标Cs的IOU,如果连续F帧IOU小于阈值Tiou2且大于0,且跟踪框的质心与运动目标的质心位置标准差大于阈值Tstd则采集当前帧的画面作为样本:
其中B为二值计算,表示跟踪框Tracki的质心,/>表示运动目标CS的质心。
2.根据权利要求1所述的方法,其特征在于,步骤1包括:
步骤1-1,预处理:从海事CCTV实时监控视频或录像视频中采集视频帧,对视频帧进行缩放和归一化处理;
步骤1-2,将预处理后的视频帧送入船舶目标检测深度网络进行计算,计算结果为检测框,包括框的中心坐标和长、宽,置信度,框所属的类别以及类别置信度;
步骤1-3,根据设定的阈值,剔除检测框置信度和类别置信度低于阈值的输出框,然后通过非极大值抑制删除重合的框,输出最终的船舶目标检测框。
3.根据权利要求2述的方法,其特征在于,步骤2包括:
步骤2-1,初始化跟踪目标:对于新的船舶目标检测框,初始化跟踪目标的卡尔曼滤波状态空间矩阵、协方差矩阵;
步骤2-2,预测目标检测框:使用卡尔曼滤波,基于跟踪目标在t-1时刻的状态X来预测其在t时刻的状态X′,计算公式为X′=FX,F为状态空间转移矩阵,并更新协方差矩阵S′=FS+Q,Q为噪声矩阵,Q=diag[Wh,Wh,0.1,Wh],W为噪声权重,h为步骤1-2中检测框的高;
步骤2-3,目标深度特征提取:使用深度特征提取网络分别提取所有检测目标和跟踪目标的128维特征向量,网络特征通过标注的船舶跟踪目标训练得到;
步骤2-4,进行目标匹配。
4.根据权利要求3述的方法,其特征在于,步骤2-4包括:
根据如下公式计算跟踪预测目标i和检测目标j的128维深度特征之间的余弦距离d1(i,j):
b1(i,j)=1[d1(i,j)≤t1]
其中,Ri为跟踪预测目标i的历史预测关联框序列,t1是设定的阈值,b1(i,j)为跟踪预测i和检测目标j的图像相似度0-1二值化计算结果,如果跟踪预测i和检测目标j的深度特征余弦距离小于阈值t1,b1(i,j)置为1;
根据如下公式计算跟踪预测i和检测目标j的运动相似度d2(i,j):
b2(i,j)=1[d2(i,j)≤t2]
其中,xj为检测目标j的状态特征,yi为跟踪预测i的状态特征,Si为跟踪预测i的协方差矩阵,t2是设定的阈值,b2(i,j)为跟踪预测i和检测目标j的运动相似度0-1二值化计算结果;
跟踪预测i和检测目标j的最终相似度d(i,j)为:
d(i,j)=αd1(i,j)+(1-α)d2(i,j)
其中,α是设定的阈值,d(i,j)最小且b(i,j)不等于0的跟踪预测i和检测目标j为确认跟踪目标Tracki,没有匹配到的跟踪预测标记为疑似消失目标,没有匹配到的检测目标标记为疑似新目标;跟踪预测i连续I帧标记疑似消失目标,则加入标记为消失目标Ui,检测目标j连续J帧标记疑似新目标,则设为新目标。
5.根据权利要求4述的方法,其特征在于,步骤3包括:
步骤3-1,背景模型初始化:将视频的第一帧作为背景模型,将该帧中每一个像素点(x,y)的领域Ng(x,y)周围随机取N个像素点,填充该像素点的样本集M0(x,y):
M0(x,y)={v0(z|z∈Ng(x,y))}
式中z表示随机取的像素,v0表示像素点(x,y)的领域周围随机取N个像素点的计算过程;
步骤3-2,前景检测:遍历新一帧图像的每个像素点vi(x,y),判断像素点与样本集M0(x,y)之差D(x,y)=v0(x,y)-vi(x,y)|vi(x,y)∈M0(x,y),D(x,y)中大于阈值Tv的个数R(x,y)=∑1[D(x,y)≥Tv],如果R(x,y)大于阈值TR,则设为运动前景,像素值置1,背景置0;
步骤3-3,背景更新;
步骤3-4,对运动检测后的视频帧进行开运算和闭运算,并进行轮廓检测,并去掉轮廓包含的像素小于阈值的小轮廓,计算轮廓的外接矩形得到最终运动目标检测的输出。
6.根据权利要求5所述的方法,其特征在于,步骤3-3包括:
同时满足以下三种策略时将像素点更新为背景:
1)每个背景像素点都有φ的概率更新该背景像素点的模型样本集M0(x,y)中的值;
2)以φ的概率去更新该像素点领域的模型样本值;
3)对像素点进行统计,如果一个像素点连续n次被检测为前景,则将其更新为背景点。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011124369.5A CN112164097B (zh) | 2020-10-20 | 2020-10-20 | 一种船舶视频检测样本采集方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011124369.5A CN112164097B (zh) | 2020-10-20 | 2020-10-20 | 一种船舶视频检测样本采集方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112164097A CN112164097A (zh) | 2021-01-01 |
CN112164097B true CN112164097B (zh) | 2024-03-29 |
Family
ID=73867586
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011124369.5A Active CN112164097B (zh) | 2020-10-20 | 2020-10-20 | 一种船舶视频检测样本采集方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112164097B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113705643B (zh) * | 2021-08-17 | 2022-10-28 | 荣耀终端有限公司 | 一种目标物检测方法、装置以及电子设备 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104463117A (zh) * | 2014-12-02 | 2015-03-25 | 苏州科达科技股份有限公司 | 一种基于视频方式的人脸识别样本采集方法及系统 |
CN104599534A (zh) * | 2015-01-14 | 2015-05-06 | 南京鹏力系统工程研究所 | 一种船舶交通导航系统中cctv对船舶跟踪监控方法 |
CN105205852A (zh) * | 2015-10-27 | 2015-12-30 | 中国电子科技集团公司第二十八研究所 | 一种基于多尺度渲染和拟合的三维船舶动态展现方法 |
CN106203274A (zh) * | 2016-06-29 | 2016-12-07 | 长沙慧联智能科技有限公司 | 一种视频监控中行人实时检测系统及方法 |
CN108520218A (zh) * | 2018-03-29 | 2018-09-11 | 深圳市芯汉感知技术有限公司 | 一种基于目标跟踪算法的舰船样本收集方法 |
CN109345559A (zh) * | 2018-08-30 | 2019-02-15 | 西安电子科技大学 | 基于样本扩充和深度分类网络的运动目标跟踪方法 |
CN109657541A (zh) * | 2018-11-09 | 2019-04-19 | 南京航空航天大学 | 一种基于深度学习的无人机航拍图像中的船舶检测方法 |
CN110929560A (zh) * | 2019-10-11 | 2020-03-27 | 杭州电子科技大学 | 融合目标检测与跟踪的视频半自动目标标注方法 |
CN111275733A (zh) * | 2020-02-27 | 2020-06-12 | 赛特斯信息科技股份有限公司 | 基于深度学习目标检测技术实现多艘船舶快速跟踪处理的方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050017968A1 (en) * | 2003-07-21 | 2005-01-27 | Stephan Wurmlin | Differential stream of point samples for real-time 3D video |
CN107316322A (zh) * | 2017-06-27 | 2017-11-03 | 上海智臻智能网络科技股份有限公司 | 视频跟踪方法和装置、以及对象识别方法和装置 |
US11610115B2 (en) * | 2018-11-16 | 2023-03-21 | Nvidia Corporation | Learning to generate synthetic datasets for training neural networks |
-
2020
- 2020-10-20 CN CN202011124369.5A patent/CN112164097B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104463117A (zh) * | 2014-12-02 | 2015-03-25 | 苏州科达科技股份有限公司 | 一种基于视频方式的人脸识别样本采集方法及系统 |
CN104599534A (zh) * | 2015-01-14 | 2015-05-06 | 南京鹏力系统工程研究所 | 一种船舶交通导航系统中cctv对船舶跟踪监控方法 |
CN105205852A (zh) * | 2015-10-27 | 2015-12-30 | 中国电子科技集团公司第二十八研究所 | 一种基于多尺度渲染和拟合的三维船舶动态展现方法 |
CN106203274A (zh) * | 2016-06-29 | 2016-12-07 | 长沙慧联智能科技有限公司 | 一种视频监控中行人实时检测系统及方法 |
CN108520218A (zh) * | 2018-03-29 | 2018-09-11 | 深圳市芯汉感知技术有限公司 | 一种基于目标跟踪算法的舰船样本收集方法 |
CN109345559A (zh) * | 2018-08-30 | 2019-02-15 | 西安电子科技大学 | 基于样本扩充和深度分类网络的运动目标跟踪方法 |
CN109657541A (zh) * | 2018-11-09 | 2019-04-19 | 南京航空航天大学 | 一种基于深度学习的无人机航拍图像中的船舶检测方法 |
CN110929560A (zh) * | 2019-10-11 | 2020-03-27 | 杭州电子科技大学 | 融合目标检测与跟踪的视频半自动目标标注方法 |
CN111275733A (zh) * | 2020-02-27 | 2020-06-12 | 赛特斯信息科技股份有限公司 | 基于深度学习目标检测技术实现多艘船舶快速跟踪处理的方法 |
Non-Patent Citations (2)
Title |
---|
一种改进YOLOv3的动态小目标检测方法;崔艳鹏;王元皓;胡建伟;;西安电子科技大学学报(第03期);全文 * |
融合运动检测与目标跟踪的目标检测方法;邬厚民;吴卫祖;;计算机工程与设计(第07期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112164097A (zh) | 2021-01-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104751491B (zh) | 一种人群跟踪及人流量统计方法及装置 | |
CN110120064B (zh) | 一种基于互强化与多注意机制学习的深度相关目标跟踪算法 | |
CN102542289B (zh) | 一种基于多高斯计数模型的人流量统计方法 | |
CN107633226A (zh) | 一种人体动作跟踪识别方法及系统 | |
CN110569785B (zh) | 一种融合跟踪技术的人脸识别方法 | |
CN113763427B (zh) | 一种基于从粗到精遮挡处理的多目标跟踪方法 | |
CN115240130A (zh) | 一种行人多目标跟踪方法、装置和计算机可读存储介质 | |
CN112488057A (zh) | 一种利用人头点定位和关节点信息的单相机多目标跟踪方法 | |
CN101324958A (zh) | 一种目标跟踪方法及装置 | |
CN115830075A (zh) | 一种面向行人多目标跟踪的分级关联匹配方法 | |
CN108200432A (zh) | 一种基于视频压缩域的目标跟踪技术 | |
Ge et al. | Multi-target tracking based on Kalman filtering and optical flow histogram | |
CN112164097B (zh) | 一种船舶视频检测样本采集方法 | |
CN111428573A (zh) | 一种复杂背景下的红外弱小目标检测虚警抑制方法 | |
CN109215059A (zh) | 一种航拍视频中运动车辆跟踪的局部数据关联方法 | |
CN111091583B (zh) | 长期目标跟踪方法 | |
CN110502968B (zh) | 基于轨迹点时空一致性的红外弱小运动目标的检测方法 | |
Zhou et al. | Dynamic background subtraction using spatial-color binary patterns | |
CN110349184B (zh) | 基于迭代滤波和观测判别的多行人跟踪方法 | |
CN104537690B (zh) | 一种基于最大值‑时间索引联合的运动点目标检测方法 | |
Roopchand et al. | Bat detection and tracking toward batsman stroke recognition | |
CN113379794B (zh) | 基于注意力-关键点预测模型的单目标跟踪系统及方法 | |
CN106951831B (zh) | 一种基于深度摄像机的行人检测跟踪方法 | |
CN113192106B (zh) | 一种家畜跟踪方法及装置 | |
CN112200831B (zh) | 一种基于动态模板的密集连接孪生神经网络目标跟踪方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |