CN111402298A - 基于目标检测与轨迹分析的粮库视频数据压缩方法 - Google Patents
基于目标检测与轨迹分析的粮库视频数据压缩方法 Download PDFInfo
- Publication number
- CN111402298A CN111402298A CN202010233879.XA CN202010233879A CN111402298A CN 111402298 A CN111402298 A CN 111402298A CN 202010233879 A CN202010233879 A CN 202010233879A CN 111402298 A CN111402298 A CN 111402298A
- Authority
- CN
- China
- Prior art keywords
- target
- data
- grain depot
- targets
- monitoring
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 238000004458 analytical method Methods 0.000 title claims abstract description 19
- 238000001514 detection method Methods 0.000 title claims abstract description 19
- 238000013144 data compression Methods 0.000 title claims abstract description 17
- 238000012544 monitoring process Methods 0.000 claims abstract description 69
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 17
- 238000012549 training Methods 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 5
- 238000005070 sampling Methods 0.000 claims description 4
- 230000000877 morphologic effect Effects 0.000 claims description 3
- 238000003062 neural network model Methods 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 2
- 239000000284 extract Substances 0.000 abstract description 4
- 230000008569 process Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 3
- 238000013145 classification model Methods 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000005034 decoration Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 206010000117 Abnormal behaviour Diseases 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000003628 erosive effect Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 239000000779 smoke Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/246—Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/187—Segmentation; Edge detection involving region growing; involving region merging; involving connected component labelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/194—Segmentation; Edge detection involving foreground-background segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
- G06V10/507—Summing image-intensity values; Histogram projection analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/52—Surveillance or monitoring of activities, e.g. for recognising suspicious objects
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/18—Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
- H04N7/181—Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast for receiving images from a plurality of remote sources
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20036—Morphological image processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30232—Surveillance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30241—Trajectory
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Signal Processing (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于目标检测与轨迹分析的粮库视频数据压缩方法,通过监控摄像头采集粮库中的实时视频监控数据;通过目标检测算法分析摄像头获取到的视频监控数据,从中提取存在运动目标的有效帧以及目标的位置和子图信息;采用卷积神经网络模型对目标子图进行目标识别操作,获取目标的类别信息;基于从同一个摄像头采集到的连续多帧图片中采集到的目标信息进行目标匹配和跟踪,获取目标在当前场景下的运动轨迹数据;基于各监控摄像头采集到的信息,构建图像数据、标签数据和轨迹数据的存储架构,实现数据的高效存储。本发明的方法可以从海量的监控视频数据中提取并存储出与运动目标相关的有效数据,提高存储资源的利用率。
Description
技术领域
本发明涉及一种在粮库监控场景中,基于智能视频监控技术提取运动目标的图像和运动轨迹数据,减少视频监控数据存储量的粮库视频数据压缩方法。
背景技术
视频监控系统是粮库信息化建设过程中的重要环节。在一个粮库视频监控系统中,会在系统覆盖区域部署大量的监控摄像头,在这种情况下,每个摄像头每天都会产生相当可观的数据量。
在传统的视频监控系统中,为了保证实时监控异常行为并及时采取有效措施,需要监控人员一刻不停的监看视频。然而,面对粮库中如此巨大的监控规模和视频数据量,通过人工查看的方式来处理和筛查这些视频已经远远跟不上实际应用的要求。
上述问题是在粮库视频数据压缩过程中应当予以考虑并解决的问题。
发明内容
发明目的:本发明的目的是提供一种基于目标检测与轨迹分析的粮库视频数据压缩方法解决现有技术中存在的传统的粮库视频监控系统中存在的智能化水平低,数据冗余且查询不变的问题。本发明针对粮库中部署的视频监控系统,通过智能视频分析技术,提供一种基于目标检测与轨迹分析的粮库视频数据压缩方法,提取视频监控系统覆盖区域的目标信息和目标运动轨迹信息,以实现对海量视频监控数据的压缩。
技术方案:
一种基于目标检测与轨迹分析的粮库视频数据压缩方法,包括以下步骤:
S1、在粮库中部署监控摄像头,构建视频监控系统,通过监控摄像头采集粮库中的实时视频监控数据;
S2、通过目标检测算法分析摄像头获取到的视频监控数据,从中提取存在运动目标的有效帧以及目标的位置和子图信息;
S3、采用卷积神经网络模型对目标子图进行目标识别操作,获取目标的类别信息;
S4、基于从同一个摄像头采集到的连续多帧图片中采集到的目标信息进行目标匹配和跟踪,获取目标在当前监控场景下的运动轨迹数据;
S5、基于粮库视频监控系统中的各监控摄像头采集到的信息,构建图像数据、标签数据和轨迹数据的存储架构,实现数据的高效存储。
进一步地,步骤S2具体为:
S21、以5帧每秒的采样频率采集各摄像头获取到的当前监控场景下的监控图片序列;
S22、通过非参数化背景建模的方法构建背景模型,分割背景和前景,得到分割后的二值图片;
S23、采用帧间差分法处理步骤S22中得到的二值图片,并通过形态学操作进行降噪,得到差分二值图片;
S24、通过分析S23中的差分二值图片中的连通域,判断目标发生运动变化的部分是否超过给定阈值,并在此基础之上判定该帧是否为存在运动目标的有效帧,保存视频流中的有效帧,同时保存有效帧中运动目标的子图以及运动目标的位置信息。
进一步地,步骤S3具体为:
S31、基于开源数据集Microsoft COCO结合在粮库中采集到的实际监控数据构建用于目标识别的训练数据集,训练数据集中包括图片数据和标签数据,标签数据由图片中包含的目标的类别信息以及位置信息组成;
S32、针对分类任务和训练数据集的规模,构建卷积神经网络模型;
S33、调整训练参数,设置迭代次数,训练卷积神经网络模型中的参数,得到基于卷积神经网络模型的目标分类器;
S34、将步骤2中得到的目标子图导入步骤S33中得到的神经网络模型,对子图中的目标进行分类识别,得到子图中的目标的类别信息。
进一步地,步骤S4中,对相邻帧中的目标基于目标的类别信息、位置信息和图像特征信息进行匹配,并提取目标的运动轨迹数据,具体为:
S41、将相邻时间节点中的运动目标根据步骤S3中提取的类别信息分类,不同类别的目标分别进行匹配;
S42、分别对当前时间节点中的各类目标计算其与前一时间节点中的所有同类目标之间的距离,并选择距离最近且未超过设定阈值的3个目标作为备选;
S43、计算当前时间节点中的目标子图与前一时间节点中与其距离最近的那3个目标子图的直方图相似度,直方图相似度最高的即为相邻时间节点中的同一目标;
S44、将S43中得到的所有相邻时间节点中的同一目标连接起来即为该目标在当前场景下的运动轨迹。
有益效果:该种基于目标检测与轨迹分析的粮库视频数据压缩方法,与传统的无差别存储的视频监控系统相比,基于智能视频监控技术的粮库视频数据压缩方法可以从海量的监控视频数据中提取并存储出与运动目标相关的有效数据,提高存储资源的利用率。该种基于目标检测与轨迹分析的粮库视频数据压缩方法完全通过视频分析算法提取监控数据中的运动目标信息和目标的运动轨迹信息,可以在不需要太大的人力资源介入的情况下,取得较高的准确性和效率。
附图说明
图1是本发明实施例基于目标检测与轨迹分析的粮库视频数据压缩方法的流程示意图。
图2是实施例中有效帧提取的流程示意图。
图3是实施例中构建的神经网络结构的说明示意图。
图4是实施例中目标匹配过程的流程示意图。
具体实施方式
下面结合附图对本发明作进一步说明:
实施例
一种基于目标检测与轨迹分析的粮库视频数据压缩方法,如图1,包括以下步骤,
S1、在粮库中部署监控摄像头,摄像头高度优选在2.5米到3米之间,调整摄像头角度以减少监控死角,构建视频监控系统,通过监控摄像头采集粮库中的实时视频监控数据;
S2、对视频监控系统中的每一个监控摄像头以5帧/秒的采样频率采集监控场景下的图像数据,并分别通过基于非参数化模型和帧间差分思想的目标检测模型对采集到的图像序列,这可以有效地抑制背景中的噪声的干扰,并高效地保存图像序列中的运动目标的位置和目标子图信息,具体流程如图2所示,具体实施步骤如下:
S21、对粮库视频监控系统中的各摄像头,设定采用频率为5帧每秒,采集各摄像头覆盖的监控场景下的监控图像序列,并将采集到的图像以“摄像头ID+日期+时间+序号”的格式命名;
S22、基于非参数化模型,通过图像序列中的前3张图像中各像素点的像素值,估计其像素值的概率密度,并以此构建当前场景的背景模型,对于后续采集到的图片,通过与构建的背景模型进行背景差分和连通域分析分割背景和前景,得到分割后的二值图像fk′;
S23、利用帧间差分的思路处理步骤22中相邻的二值图像fk′和fk-1′,以进一步消除前景中的噪声,再通过腐蚀和膨胀等一系列的形态学操作进行进一步的降噪处理,最大程度上减小噪声的干扰,得到分割后的差分二值图像Rk′;
S24、对S23中得到的差分二值图像Rk′进行连通域分析,判断每个连通域中的像素点的个数是否超过设定的阈值Tp,Tp=图像的像素值×10%,若超过则该连通域表示图中的一个运动目标,否则该连通域则是干扰。保存视频流中存在运动目标的有效帧,同时保存该帧中运动目标的子图以及运动目标的位置信息,其余的帧不再存储。
S3、根据粮库视频监控系统的应用需求构建训练数据集,训练基于卷积神经网络的目标识别模型,并通过该模型分析步骤2中提取出的运动目标子图,判断有效帧中的运动目标的类别,基于卷积神经网络的模型可以实现高准确率和高效率的目标识别;
S31、选择人、车辆、地磅、大门、窗户、粮食、烟雾、火焰这些粮库中常见的目标作为待检测的目标类别构建训练数据集,训练数据集中的图像来源于开源数据集MicrosoftCOCO以及通过粮库中部署的视频监控系统采集到的实际监控图像数据,其中的标签数据包括图像中的目标的类别和位置信息;
S32、构建9层卷积神经网络模型,如图3所示,包括3个卷积层用于图像特征提取;3个池化层对输入特征图像进行压缩,在减小图像尺寸简化网络计算复杂度的同时压缩特征,以提取图像的主要特征;两个全连接层连接输入图像的所有特征,并在其中引入dropout策略,在模型训练的测试过程中随机地删除第一个隐含层的部分神经元,可以有效地减轻过拟合问题的发生,设置丢弃概率为0.3;最后一层为输出层,激活函数为ReLU函数,输出为该目标分别属于不同类别的概率,输出的类别标签包括8类,因此输出层的神经元个数为8。
S33、将训练数据集中的图像数据的大小统一缩放为224×224像素单位,输入卷积神经网络模型,其中70%的数据作为训练集,30%的数据作为验证集,采用随机梯度下降法优化神经网络模型,每迭代1000次计算一次模型在验证集上的准确率,待准确率收敛时,停止训练,保存卷积神经网络的参数,得到目标分类模型;
S34、将步骤2中得到的运动目标子图输入步骤33中训练得到的基于卷积神经网络的目标分类模型,得到子图中目标的类型信息。
S4、对当前时间节点中的每一个目标,结合目标的类别信息、位置信息以及图像特征信息对前一个时间节点中的所有目标进行筛选,寻找前一个时间节点中唯一与当前时间节点中的目标相匹配的那个目标,如图4所示,并在此基础上提取监控场景中的各目标的运动轨迹,可以实现在目标匹配过程中的准确率和效率的平衡;
S41、对于当前时间节点中的某个运动目标P,选择前一时间节点中所有的同类别目标作为待匹配的目标集合;
S42、计算目标P与S41中抽取出的待匹配的目标集合中的每个目标之间的像素距离,若计算得到的所有的距离大小都大于阈值Td,则认为目标P为监控场景中在当前时间节点中新出现的目标,否则选择从待匹配的目标集合中删除距离较远的目标,仅保留像素距离小于阈值Td且距离最近的三个目标;
S43、对于目标P和S42中抽取出的待匹配的目标集合中的三个目标,统一将目标子图缩放到128×128像素单位,通过加权平均法进行灰度化处理,并计算灰度子图的直方图,再分别计算目标P与三个待匹配目标的子图的灰度直方图重合度,选择灰度直方图重合度最高的那个目标作为前一时间节点中与P相匹配的目标Q;
S44、将各相邻时间节点中的相同目标两两相连地串联起来即可得到该目标在当前监控场景中的运动轨迹数据
S5、构建新的存储架构,将视频监控系统采集和分析得到的数据进行高效的存储;
S51、对于图像数据的存储,以每小时一帧的采样频率存储当前监控场景下的背景数据,并以“摄像头ID+日期+小时”的格式命名并存储在与之匹配的以“摄像头ID+日期+小时”命名的文件夹下,同时步骤S2中采集到的运动目标子图以“摄像头ID+日期+时间+序号+子图序号”的格式命名并存储在相应的以“摄像头ID+日期+小时”命名的文件夹下;
S52、将S2中提取出的目标的位置信息以及S3中提取出的目标的类型信息存储到数据库中,以对应的目标子图的文件名为主键,并在数据库中添加对应子图的存储路径;
S53、将S4中提取出的目标轨迹数据存储到数据库中,以轨迹中第一个目标和最后一个目标对应的子图的文件名首尾相连作为主键,轨迹数据由一连串的目标子图的文件名按序组合而成。
实施例的基于目标检测与轨迹分析的粮库视频数据压缩方法,通过粮库中部署的视频监控系统采集原始视频监控数据;通过基于非参数化模型和帧间差分模型从大量的图像序列数据中抽取出包含运动目标的有效帧及目标的位置信息和子图信息,这两种模型的结合可以在运动检查的过程中很大程度上降低背景中的噪声的干扰,;针对粮库监控场景,构建目标识别数据集并基于卷积神经网络训练目标识别模型,通过该模型对目标子图中的目标进行目标分类,获取运动目标的类别信息,基于卷积神经网络构建的目标识别模型具有很高的识别准确率,配合高性能计算的硬件条件可以达到100帧/秒的高识别效率;基于目标子图的类别信息、位置信息以及颜色特征信息对相邻时间节点中的目标进行匹配和轨迹融合,根据计算量的由低到高,逐步筛选候选集合中的目标,寻找相邻时间节点中的匹配目标,并在此基础上得到最终的目标在监控场景中连续时间运行轨迹数据;构建新的存储架构,将通过视频监控系统采集和分析得到的运动目标的图像数据、位置数据、轨迹数据,连同当前监控场景的背景数据进行高效的存储。
实施例的基于目标检测与轨迹分析的粮库视频数据压缩方法,与传统的无差别存储并通过人工查询回看的视频监控系统相比,可以大大降低数据存储的成本和人力成本,且利用数据库存储运动目标的各类信息,可以更方便和快速地定位需要查询的内容,查询的效率更高。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (4)
1.一种基于目标检测与轨迹分析的粮库视频数据压缩方法,其特征在于,包括以下步骤:
S1、在粮库中部署监控摄像头,构建视频监控系统,通过监控摄像头采集粮库中的实时视频监控数据;
S2、通过目标检测算法分析摄像头获取到的视频监控数据,从中提取存在运动目标的有效帧以及目标的位置和子图信息;
S3、采用卷积神经网络模型对目标子图进行目标识别操作,获取目标的类别信息;
S4、基于从同一个摄像头采集到的连续多帧图片中采集到的目标信息进行目标匹配和跟踪,获取目标在当前监控场景下的运动轨迹数据;
S5、基于粮库视频监控系统中的各监控摄像头采集到的信息,构建图像数据、标签数据和轨迹数据的存储架构,实现数据的高效存储。
2.根据权利要求1所述的基于目标检测与轨迹分析的粮库视频数据压缩方法,其特征在于,步骤S2具体为:
S21、以5帧每秒的采样频率采集各摄像头获取到的当前监控场景下的监控图片序列;
S22、通过非参数化背景建模的方法构建背景模型,分割背景和前景,得到分割后的二值图片;
S23、采用帧间差分法处理步骤S22中得到的二值图片,并通过形态学操作进行降噪,得到差分二值图片;
S24、通过分析S23中的差分二值图片中的连通域,判断目标发生运动变化的部分是否超过给定阈值,并在此基础之上判定该帧是否为存在运动目标的有效帧,保存视频流中的有效帧,同时保存有效帧中运动目标的子图以及运动目标的位置信息。
3.根据权利要求1所述的基于目标检测与轨迹分析的粮库视频数据压缩方法,其特征在于,步骤S3具体为:
S31、基于开源数据集Microsoft COCO结合在粮库中采集到的实际监控数据构建用于目标识别的训练数据集,训练数据集中包括图片数据和标签数据,标签数据由图片中包含的目标的类别信息以及位置信息组成;
S32、针对分类任务和训练数据集的规模,构建卷积神经网络模型;
S33、调整训练参数,设置迭代次数,训练卷积神经网络模型中的参数,得到基于卷积神经网络模型的目标分类器;
S34、将步骤2中得到的目标子图导入步骤S33中得到的神经网络模型,对子图中的目标进行分类识别,得到子图中的目标的类别信息。
4.根据权利要求1所述的基于目标检测与轨迹分析的粮库视频数据压缩方法,其特征在于,步骤S4中,对相邻帧中的目标基于目标的类别信息、位置信息和图像特征信息进行匹配,并提取目标的运动轨迹数据,具体为:
S41、将相邻时间节点中的运动目标根据步骤S3中提取的类别信息分类,不同类别的目标分别进行匹配;
S42、分别对当前时间节点中的各类目标计算其与前一时间节点中的所有同类目标之间的距离,并选择距离最近且未超过设定阈值的3个目标作为备选;
S43、计算当前时间节点中的目标子图与前一时间节点中与其距离最近的那3个目标子图的直方图相似度,直方图相似度最高的即为相邻时间节点中的同一目标;
S44、将S43中得到的所有相邻时间节点中的同一目标连接起来即为该目标在当前场景下的运动轨迹。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010233879.XA CN111402298A (zh) | 2020-03-30 | 2020-03-30 | 基于目标检测与轨迹分析的粮库视频数据压缩方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010233879.XA CN111402298A (zh) | 2020-03-30 | 2020-03-30 | 基于目标检测与轨迹分析的粮库视频数据压缩方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111402298A true CN111402298A (zh) | 2020-07-10 |
Family
ID=71431342
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010233879.XA Pending CN111402298A (zh) | 2020-03-30 | 2020-03-30 | 基于目标检测与轨迹分析的粮库视频数据压缩方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111402298A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112055172A (zh) * | 2020-08-19 | 2020-12-08 | 浙江大华技术股份有限公司 | 一种监控视频的处理方法、装置以及存储介质 |
CN112533031A (zh) * | 2020-11-23 | 2021-03-19 | 北京爱笔科技有限公司 | 轨迹视频推荐方法、装置、计算机设备和存储介质 |
CN112883783A (zh) * | 2021-01-12 | 2021-06-01 | 普联国际有限公司 | 一种视频浓缩方法、装置、终端设备及存储介质 |
CN113420733A (zh) * | 2021-08-23 | 2021-09-21 | 北京黑马企服科技有限公司 | 一种高效分布式大数据数据采集实现方法及系统 |
CN113822841A (zh) * | 2021-01-29 | 2021-12-21 | 深圳信息职业技术学院 | 一种污水杂质结块检测方法、装置及相关设备 |
CN115187929A (zh) * | 2022-08-24 | 2022-10-14 | 长扬科技(北京)股份有限公司 | 一种两级异动策略的ai视觉检测方法及装置 |
CN116208863A (zh) * | 2022-12-30 | 2023-06-02 | 浙江中尊检测技术有限公司 | 一种图像数据压缩上传方法、装置及电子设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101256626A (zh) * | 2008-02-28 | 2008-09-03 | 王路 | 基于计算机视觉的入侵监控方法 |
CN104244113A (zh) * | 2014-10-08 | 2014-12-24 | 中国科学院自动化研究所 | 一种基于深度学习技术的视频摘要生成方法 |
US9176987B1 (en) * | 2014-08-26 | 2015-11-03 | TCL Research America Inc. | Automatic face annotation method and system |
-
2020
- 2020-03-30 CN CN202010233879.XA patent/CN111402298A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101256626A (zh) * | 2008-02-28 | 2008-09-03 | 王路 | 基于计算机视觉的入侵监控方法 |
US9176987B1 (en) * | 2014-08-26 | 2015-11-03 | TCL Research America Inc. | Automatic face annotation method and system |
CN104244113A (zh) * | 2014-10-08 | 2014-12-24 | 中国科学院自动化研究所 | 一种基于深度学习技术的视频摘要生成方法 |
Non-Patent Citations (1)
Title |
---|
李晓楠: ""基于视频的轨迹分析技术及在目标异常行为检测中的应用研究"" * |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112055172A (zh) * | 2020-08-19 | 2020-12-08 | 浙江大华技术股份有限公司 | 一种监控视频的处理方法、装置以及存储介质 |
CN112055172B (zh) * | 2020-08-19 | 2022-04-19 | 浙江大华技术股份有限公司 | 一种监控视频的处理方法、装置以及存储介质 |
CN112533031A (zh) * | 2020-11-23 | 2021-03-19 | 北京爱笔科技有限公司 | 轨迹视频推荐方法、装置、计算机设备和存储介质 |
CN112533031B (zh) * | 2020-11-23 | 2022-10-04 | 北京爱笔科技有限公司 | 轨迹视频推荐方法、装置、计算机设备和存储介质 |
CN112883783A (zh) * | 2021-01-12 | 2021-06-01 | 普联国际有限公司 | 一种视频浓缩方法、装置、终端设备及存储介质 |
CN113822841A (zh) * | 2021-01-29 | 2021-12-21 | 深圳信息职业技术学院 | 一种污水杂质结块检测方法、装置及相关设备 |
CN113822841B (zh) * | 2021-01-29 | 2022-05-20 | 深圳信息职业技术学院 | 一种污水杂质结块检测方法、装置及相关设备 |
CN113420733A (zh) * | 2021-08-23 | 2021-09-21 | 北京黑马企服科技有限公司 | 一种高效分布式大数据数据采集实现方法及系统 |
CN113420733B (zh) * | 2021-08-23 | 2021-12-31 | 北京黑马企服科技有限公司 | 一种高效分布式大数据数据采集实现方法及系统 |
CN115187929A (zh) * | 2022-08-24 | 2022-10-14 | 长扬科技(北京)股份有限公司 | 一种两级异动策略的ai视觉检测方法及装置 |
CN116208863A (zh) * | 2022-12-30 | 2023-06-02 | 浙江中尊检测技术有限公司 | 一种图像数据压缩上传方法、装置及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111402298A (zh) | 基于目标检测与轨迹分析的粮库视频数据压缩方法 | |
Beery et al. | Context r-cnn: Long term temporal context for per-camera object detection | |
CN107943837B (zh) | 一种前景目标关键帧化的视频摘要生成方法 | |
US10735694B2 (en) | System and method for activity monitoring using video data | |
US9251425B2 (en) | Object retrieval in video data using complementary detectors | |
CN109644255B (zh) | 标注包括一组帧的视频流的方法和装置 | |
CN113536972B (zh) | 一种基于目标域伪标签的自监督跨域人群计数方法 | |
CN111738218A (zh) | 人体异常行为识别系统及方法 | |
CN113537107A (zh) | 一种基于深度学习的人脸识别及追踪方法、装置及设备 | |
CN110414430B (zh) | 一种基于多比例融合的行人重识别方法及装置 | |
Ahmed et al. | Crowd Detection and Analysis for Surveillance Videos using Deep Learning | |
CN115294519A (zh) | 一种基于轻量化网络的异常事件检测及预警方法 | |
CN109359530B (zh) | 一种智能视频监控方法及装置 | |
Usha Rani et al. | Real-time human detection for intelligent video surveillance: an empirical research and in-depth review of its applications | |
Supangkat et al. | Moving Image Interpretation Models to Support City Analysis | |
Balachandran et al. | Moving scene-based video segmentation using fast convolutional neural network integration of VGG-16 net deep learning architecture | |
Prabakaran et al. | Key frame extraction analysis based on optimized convolution neural network (ocnn) using intensity feature selection (ifs) | |
CN113627383A (zh) | 一种用于全景智能安防的行人徘徊重识别方法 | |
Anoopa et al. | Advanced video anomaly detection using 2D CNN and stacked LSTM with deep active learning-based model: 10.48129/kjs. splml. 19159 | |
CN113920470A (zh) | 一种基于自注意力机制的行人检索方法 | |
Indhuja et al. | Suspicious activity detection using lrcn | |
CN113158720A (zh) | 一种基于双模特征和注意力机制的视频摘要方法及装置 | |
Wang et al. | Robust vehicle detection on multi-resolution aerial images | |
CN114049585B (zh) | 一种基于运动前景提取的使用手机动作检测方法 | |
Ştefan et al. | End to end very deep person re-identification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200710 |
|
RJ01 | Rejection of invention patent application after publication |