CN113807389A - 一种确定目标对象动态的方法、装置及电子设备 - Google Patents
一种确定目标对象动态的方法、装置及电子设备 Download PDFInfo
- Publication number
- CN113807389A CN113807389A CN202110886579.6A CN202110886579A CN113807389A CN 113807389 A CN113807389 A CN 113807389A CN 202110886579 A CN202110886579 A CN 202110886579A CN 113807389 A CN113807389 A CN 113807389A
- Authority
- CN
- China
- Prior art keywords
- image
- window
- similarity
- target object
- images
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000001514 detection method Methods 0.000 claims abstract description 124
- 238000012549 training Methods 0.000 claims description 30
- 238000012360 testing method Methods 0.000 claims description 19
- 230000001186 cumulative effect Effects 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 9
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 5
- 230000003068 static effect Effects 0.000 claims description 5
- 238000005259 measurement Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000005070 sampling Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000007499 fusion processing Methods 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- 238000013135 deep learning Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种确定目标对象动态的方法,包括:获得包含有目标对象的图像集;根据所述图像集构建目标对象检测模型;通过所述目标对象检测模型,获得待检测图像中的包含有目标对象的相邻帧的图像;获得所述包含有目标对象的相邻帧的图像的相似度;根据所述相邻帧的图像的相似度确定目标对象动态。本申请通过获得的图像集来构建目标对象检测模型,通过目标对象检测模型对待检测图像进行检测,以待检测图像中的包含有目标对象的相邻帧的图像对应的相似度,通过相邻帧的图像的相似度确定目标对象动态,不仅提升检测的准确度,而且还不用人为地自行检测,从而降低对易发生滚动的物体是否发生移动的检测的投入成本。
Description
技术领域
本申请涉及计算机视觉技术领域,具体涉及一种确定目标对象动态的方法和一种确定目标对象动态的装置,以及一种电子设备。
背景技术
深度学习近年来发展迅猛,在国内外都引起了广泛的关注,随着深度学习技术的不断进步以及数据处理能力的不断提升,越来越多的深度学习算法被用在图像处理,计算机视觉领域。其中,目标检测作为计算机视觉的重要分支被广泛应用于安防、工业、无人驾驶等多个领域。例如在安防领域,在一些户外工地作业中,气瓶的安置都有指定的位置,且在指定位置时,其一般处于静止状态,当其发生滚动位移时,若不及时处理,则会影响工地作业的安全性。
为了防止意外发生,现有对易发生滚动的气瓶的管理一般采取人工查看现场监控视频的方式,此种方式耗费大量的人力,而且由于视频数量多,人可能顾及不过来,从而降低了对易发生滚动的物体是否发生移动的检测的准确度。
因此,如何降低对易发生滚动的物体是否发生移动的检测的投入成本,且同时提升检测的准确度,成为本领域技术人员亟待解决的问题。
发明内容
本申请实施例提供一种确定目标对象动态的方法,以解决现有技术中如何降低对易发生滚动的物体是否发生移动的检测的投入成本,且同时提升检测的准确度的问题。本申请实施例提供一种确定目标对象动态的装置,以及一种电子设备。
本申请实施例提供一种确定目标对象动态的方法,包括:
获得包含有目标对象的图像集;
根据所述图像集构建目标对象检测模型;
通过所述目标对象检测模型,获得待检测图像中的包含有目标对象的相邻帧的图像;
获得所述包含有目标对象的相邻帧的图像的相似度;
根据所述相邻帧的图像的相似度确定目标对象动态。
可选的,所述通过所述目标对象检测模型,获得待检测图像中的包含有目标对象的相邻帧的图像,包括:
通过所述目标对象检测模型,获得待检测图像中的包含有目标对象的第一图像;
定位所述第一图像对应的帧频,获得与所述第一图像对应的帧频相邻的前一帧或后一帧的第二图像;
通过所述第一图像和第二图像获得待检测图像中的包含有目标对象的相邻帧的图像。
可选的,所述通过所述第一图像和第二图像获得待检测图像中的包含有目标对象的相邻帧的图像,包括:
获得包含有目标对象的第一图像的包围盒,将所述包围盒包含有目标对象的第一位置区域裁剪以获得第一目标图像;
获得在所述第二图像中与所述包围盒包含有目标对象的第一位置区域对应的第二位置区域,并将所述第二位置区域裁剪以获得第二目标图像;
将所述第一目标图像和所述第二目标图像作为待检测图像中的包含有目标对象的相邻帧的图像。
可选的,所述获得所述包含有目标对象的相邻帧的图像的相似度,包括:
采用滑动窗口在所述第一目标图像中提取第一窗口,在所述第二目标图像中提取第二窗口;
计算所述第一窗口和所述第二窗口的相似度;
其中,每一次采用滑动窗口会在所述第一目标图像中对应提取一次第一窗口,以及在所述第二目标图像中对应提取一次第二窗口。
可选的,所述相似度至少包括以下相似度的一种:亮度相似度、对比度相似度以及结构相似度;
对应的,所述计算所述第一窗口和所述第二窗口的相似度,至少计算如下相似度的一种:
计算每次滑动窗口在所述第一目标图像和所述第二目标图像中对应提取的所述第一窗口和所述第二窗口的亮度相似度;
计算每次滑动窗口在所述第一目标图像和所述第二目标图像中对应提取的所述第一窗口和所述第二窗口的对比度相似度;
计算每次滑动窗口在所述第一目标图像和所述第二目标图像中对应提取的所述第一窗口和所述第二窗口的结构相似度。
可选的,还包括:计算每次滑动窗口在所述第一目标图像和所述第二目标图像中对应提取的所述第一窗口和所述第二窗口的亮度相似度、对比度相似度以及结构相似度的单次总和。
可选的,所述计算所述第一窗口和所述第二窗口的相似度,还包括:
获得采用滑动窗口的滑动次数;
获得该滑动次数下对应提取的所述第一窗口和所述第二窗口的亮度相似度、对比度相似度以及结构相似度的累计总和;
根据所述累计总和与所述采用滑动窗口的滑动次数,获得所述第一窗口和所述第二窗口的平均相似度。
可选的,所述计算每次滑动窗口在所述第一目标图像和所述第二目标图像中对应提取的所述第一窗口和所述第二窗口的亮度相似度,采用如下公式:
其中,μx表示平均灰度,N表示窗口总数量;
其中,μa表示第一窗口的平均灰度;μb表示第一窗口的平均灰度;c1=(k1L)2,L=255,k1=0.01。
可选的,所述计算每次滑动窗口在所述第一目标图像和所述第二目标图像中对应提取的所述第一窗口和所述第二窗口的对比度相似度,采用如下公式:
其中,σx表示标准差,N表示窗口总数量;
其中,σa表示第一窗口的标准差,σb表示第一窗口的标准差;c2=(k2L)2,L=255,k2=0.03。
可选的,所述计算每次滑动窗口在所述第一目标图像和所述第二目标图像中对应提取的所述第一窗口和所述第二窗口的结构相似度,采用如下公式:
其中,σa表示第一窗口的标准差,σb表示第一窗口的标准差;c3=(k3L)2,L=255,k3=0.02。
可选的,所述计算每次滑动窗口在所述第一目标图像和所述第二目标图像中对应提取的所述第一窗口和所述第二窗口的亮度相似度、对比度相似度以及结构相似度的单次总和,采用如下公式:
M(a,b)=l(a,b)·c(a,b)·s(a,b)。
可选的,所述根据所述相邻帧的图像的相似度确定目标对象动态,包括:
预先设置相似度阈值;
将所述相似度阈值与所述相邻帧的图像的相似度比较,若所述相似度阈值大于所述相邻帧的图像的相似度,则确定所述目标对象发生移动;若所述相似度阈值小于所述相邻帧的图像的相似度,则确定所述目标对象静止。
可选的,所述获得包含有目标对象的图像集,包括:
获得包含有目标对象的多个图像;
对所述多个图像进行预处理得到多个候选图像;
对所述多个候选图像进行标记以得到所述图像集。
可选的,所述根据所述图像集构建目标对象检测模型,包括:
构建初始对象检测模型,将所述初始对象检测模型的参数初始化,并将所述图像集中的训练图像输入至所述初始对象检测模型中;
获得所述初始对象检测模型对所述训练图像的预测结果与标记的图像的损失值;
利用反向传播算法更新所述初始对象检测模型的参数;
再将所述图像集中的其它训练图像输入至所述初始对象检测模型中进行迭代训练,获得损失值最小时所更新的所述初始对象检测模型作为候选对象检测模型;
将所述图像集中的测试图像输入至所述候选对象检测模型中,获得所述候选对象检测模型对所述测试图像的测试结果与标记的图像的损失值;
将所述损失值与预设损失值比较,若所述损失值满足预设损失值,则将所述候选对象检测模型作为目标对象检测模型;反之,则继续将所述图像集中的其它训练图像输入至所述初始对象检测模型中进行迭代训练。
本申请实施例还提供一种确定目标对象动态的装置,包括:
图像集获得单元,用于获得包含有目标对象的图像集;
目标对象检测模型构建单元,用于根据所述图像集构建目标对象检测模型;
图像检测单元,用于通过所述目标对象检测模型,获得待检测图像中的包含有目标对象的相邻帧的图像;
相似度获得单元,用于获得所述包含有目标对象的相邻帧的图像的相似度;
目标对象动态确定单元,用于根据所述相邻帧的图像的相似度确定目标对象动态。
本申请实施例还提供一种电子设备,所述电子设备包括:处理器;存储器,用于存储计算机程序,该计算机程序被处理器运行,执行上述任意一项所述的方法。
本申请实施例还提供一种计算机存储介质,所述计算机存储介质存储有计算机程序,该计算机程序被处理器运行,执行上述任意一项所述的方法。
与现有技术相比,本申请具有以下优点:
本申请实施例提供一种确定目标对象动态的方法,包括:获得包含有目标对象的图像集;根据所述图像集构建目标对象检测模型;通过所述目标对象检测模型,获得待检测图像中的包含有目标对象的相邻帧的图像;获得所述包含有目标对象的相邻帧的图像的相似度;根据所述相邻帧的图像的相似度确定目标对象动态。本申请实施例通过获得的图像集来构建目标对象检测模型,通过目标对象检测模型对待检测图像进行检测,以待检测图像中的包含有目标对象的相邻帧的图像对应的相似度,通过相邻帧的图像的相似度确定目标对象动态,不仅提升检测的准确度,而且还不用人为地自行检测,从而降低对易发生滚动的物体是否发生移动的检测的投入成本。
附图说明
图1为本申请第一实施例提供的确定目标对象动态的方法的流程图。
图2为本申请第一实施例提供的构建目标对象检测模型的流程图。
图3为本申请第二实施例提供的确定目标对象动态的装置的示意图。
图4为本申请第三实施例提供的电子设备的示意图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本申请实施例。但是本申请实施例能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请实施例内涵的情况下做类似推广,因此本申请实施例不受下面公开的具体实施的限制。
为了使本领域的技术人员更好的理解本申请方案,下面基于本申请提供的确定目标对象动态的方法对其实施例的具体应用场景进行详细描述,
应用场景
本场景具体是检测气瓶是否发生滚动(位移)的场景。在本场景中,主要是通过图像检测的方式自动检测气瓶是否发生位移。具体的,可通过监控摄像头获得作业中的包含有气瓶的多个图像,并将该多个图像作为图像样本对目标对象检测模型进行迭代训练,以构建目标对象检测模型。当通过监控摄像头获得待检测图像时,可将待检测图像输入至目标对象检测模型中,从而可以确定待检测图像中的气瓶图像对应于物理世界中的气瓶是否发生滚动。
以下将通过具体的实施例来阐述本申请的技术方案。
本申请第一实施例提供一种确定目标对象动态的方法,图1是本申请第一实施例提供的一种确定目标对象动态的方法的流程图。如图1所示,所述方法包括如下步骤。
步骤S101,获得包含有目标对象的图像集。
在本步骤中,目标对象是指目标对象图像,且对应于上述场景,本步骤中的目标对象是指容易发生滚动(位移)的物体(气瓶)的图像,对应的,含有目标对象的图像是指含有容易发生位移的物体图像的图像。本步骤所获得的包含有目标对象的图像集是指包含有多个容易发生位移的物体图像的集合。例如,包含有目标对象的第一张图像,包含有第二目标对象的第二张图像,包含有目标对象的第三张图像等等,多张包含有目标对象的图像构成图像集。
在本步骤中,获得包含有目标对象的图像集,具体包括如下步骤:
步骤1,获得包含有目标对象的多个图像,目标对象即为容易发生移动的物体。在本步骤中,可从网络上下载具有目标对象的图像,还可以通过设置在不同环境位置下的监控摄像头获得具有目标对象的图像。在获得具有目标对象的图像后,则需要对图像进行处理,如步骤2所述。
步骤2,对所述多个图像进行预处理得到多个候选图像,具体的,在本步骤中,采用Mosaic数据增强的方式对多个图像至少进行如下操作:对多个图像进行随机翻转、随机缩放、随机裁剪,以获得多个初始图像,将多个初始图像进行随机拼接得到多个候选图像,该多个候选图像作为新的具有目标对象的图像。在得到多个候选图像后,执行步骤3。
步骤3,对多个候选图像进行标记以得到所述图像集,具体的,对多个候选图像中的目标对象的图像进行标记,将完全是目标对象的候选图像作为第一图像,将部分包含有目标对象的候选图像作为第二图像。将一部分第一图像和第二图像作为训练图像,将另一部分第一图像和第二图像作为测试图像,训练图像和测试图像形成所述图像集。
在获得图像集后,可通过图像集构建目标对象检测模型,具体详见步骤S102。
步骤S102,根据所述图像集构建目标对象检测模型。
在本步骤中,目标对象检测模型用于检测待检测图像,以获得具有目标对象的目标图像,以及得到目标图像中相邻帧的图像的相似度。其中,根据图像集构建目标对象检测模型具体包括如下步骤,详见图2,图2是本申请第一实施例提供的构建目标对象检测模型的流程图。
步骤1021,构建初始对象检测模型,将初始对象检测模型的参数初始化,并将图像集中的训练图像输入至初始对象检测模型中。
在本步骤中,初始对象检测模型是目标对象检测模型的初始模型,通过图像集中的训练图像对初始对象检测模型的参数不断的迭代训练,以得到目标对象检测模型。
步骤1022,获得所述初始对象检测模型对所述训练图像的预测结果与标记的图像的损失值。
本步骤包括,首先,通过初始对象检测模型获得训练图像中逐像素的目标对象图像的预测结果。具体的,将图像集的训练图像输入到初始对象检测模型中,以得到训练图像的特征信息,根据特征信息得到训练图像中的图像类别,结合图像类别对特征信息进行上采样、下采样处理以及特征融合处理获得逐像素的目标对象图像的预测结果。
其中,在本步骤中,具体是通过Focus切片和特征提取网络提取图像的特征信息的。特征融合处理主要是通过特征融合网络完成的,特征融合网络主要采用了FPN(featurepyramid networks,特征金字塔网络)+PAN(Pyramid Attention Network for SemanticSegmentation,金字塔注意力模型)的网络结构。采用FPN+PAN的网络结构对所述特征信息进行上采样、下采样处理以及特征融合处理以得到逐像素的目标对象图像的预测结果。
具体的,FPN层采用了自顶向下的采样过程,将顶层的低分辨率特征通过上采样的方式提高分辨率,放大到和上一阶段特征相同的尺寸,然后再和上一阶段的特征进行相加合并。通过此操作,将含有较多语义信息的顶层特征与含有较多细节特征的低层特征整合到一起,提高了特征的表达能力。PAN层紧随FPN层之后,与FPN结构相反,PAN采用了自底向上的采样过程,将底层含有的特征信息传给高层的特征,在特征传播过程中采用下采样的方式,缩小到和上一阶段特征相同的尺寸。通过这样的结合,FPN自顶向下传递强语义特征,特征金字塔自底向上传递强定位特征,两个相互结合,对不同的特征进行整合操作以得到逐像素的目标对象图像的预测结果。
然后,将逐像素的目标对象图像的预测结果与训练图像中被标记框标记的目标对象图像的实际结果对比,计算预测结果与实际结果的损失值。具体的,将预测结果中的目标对象图像与实际结果中的目标对象图像对应,并以预测结果中的目标对象图像上的每个像素按照不同大小和长宽对应实际结果中的目标对象图像的网格区域,生成多尺度的先验框。而后,根据实际结果中的目标对象图像的大小和长宽和在同一网格区域内的先验框的大小和长宽进行筛选,得到正样本预测框。最后,根据正样本预测框和所述实际标注框的位置偏移进行损失计算,获得初始对象检测模型对训练图像的预测结果与标记的图像的损失值。
需要说明的是,在步骤中,获得的正样本预测框具体可以通过GIOU(GeneralizedIntersection over Union,边框预测的损失)Loss算法获得。GIOU的计算过程如下所示:
其中,IOU(Intersection over Union,边框预测算法)表示A、B相交区域面积和A、B总共占据区域面积的比值,A表示正样本预测框,B表示先验框,A∩B表示正样本预测框和先验框相交重叠区域,A∪B表示正样本预测框和先验框总共占据的区域;C代表同时包围A与B的最小矩形框区域,C\A∪B表示C的区域除去A、B总共占据的区域所剩余的区域。
步骤1023,利用反向传播算法更新所述初始对象检测模型的参数。
步骤1024,再将所述图像集中的其它训练图像输入至所述初始对象检测模型中进行迭代训练,获得损失值最小时所更新的所述初始对象检测模型作为候选对象检测模型。
在本步骤中,可以通过多次迭代对初始对象检测模型进行训练,将损失值最小时对应的初始对象检测模型作为候选对象检测模型。获得候选对象检测模型是为了进一步通过测试图像(下述内容)验证该模型是否可以获得具有目标对象的目标图像,以及得到目标图像中相邻帧的图像的相似度。详见步骤1205。
步骤1025,将所述图像集中的测试图像输入至所述候选对象检测模型中,获得所述候选对象检测模型对所述测试图像的测试结果与标记的图像的损失值。
首先,通过候选对象检测模型获得测试图像中逐像素的目标对象图像的预测结果。具体的,将图像集的测试图像输入到候选对象检测模型中以得到测试图像的特征信息,根据特征信息得到测试图像中的图像类别,结合图像类别对特征信息进行上采样、下采样处理以及特征融合处理获得逐像素的目标对象图像的预测结果。
然后,将逐像素的目标对象图像的预测结果与测试图像中被标记框标记的目标对象图像的实际结果对比,计算预测结果与实际结果的损失值。具体的,将预测结果中的目标对象图像与实际结果中的目标对象图像对应,并以预测结果中的目标对象图像上的每个像素按照不同大小和长宽对应实际结果中的目标对象图像的网格区域,生成多尺度的先验框。而后,根据实际结果中的目标对象图像的大小和长宽和在同一网格区域内的先验框的大小和长宽进行筛选,得到正样本预测框。最后,根据正样本预测框和所述实际标注框的位置偏移进行损失计算,获得初始对象检测模型对测试图像的预测结果与标记的图像的损失值。
步骤1026,将所述损失值与预设损失值比较,若所述损失值满足预设损失值,则将所述候选对象检测模型作为目标对象检测模型;反之则继续将所述图像集中的其它训练图像输入至所述初始对象检测模型中进行迭代训练。
具体的,在获得初始对象检测模型对测试图像的预测结果与标记的图像的损失值后,将该损失值与预设损失值相比较,若损失值满足预设损失值,则将该候选对象检测模型作为目标对象检测模型。反之,则继续将图像集中的其它训练图像输入至初始对象检测模型中进行迭代训练,直到所获得的损失值满足预设损失值,继而将对应的候选对象检测模型作为目标对象检测模型。
步骤S103,通过所述目标对象检测模型,获得待检测图像中的包含有目标对象的相邻帧的图像。
在获得目标对象检测模型后,获得待检测图像,通过所述目标对象检测模型检测所述待检测图像以得到含有目标对象的相邻帧的图像的相似度。在本步骤中,为了准确地获得目标对象在物理世界中是否发生移动,则可以通过目标对象检测模型检测到对应的目标图像后,在进一步对该目标对象的相邻图像进行检测,以得到含有目标对象的相邻帧的图像的相似度。
具体的,首先,通过目标对象检测模型,获得待检测图像中的包含有目标对象的第一图像。具体的,获得待检测图像中逐像素的目标对象图像的预测结果,然后,将逐像素的目标对象图像的预测结果与图像集中被标记框标记的目标对象图像的实际结果对比,计算预测结果与实际结果的损失值,将损失值最小时对应的图像确定为包含有目标对象的第一图像。
然后,定位第一图像对应的帧频,获得与第一图像对应的帧频相邻的前一帧或后一帧的第二图像。其中,定位第一图像对应的帧频可通过在拍摄包含有目标对象的带检测图像时的拍摄时间戳获得。在本申请第一实施例中,第一图像对应的帧频相邻的前一帧或后一帧的第二图像,其帧频之间的时间间隔并不是很长,当然也不是很短,其时间间隔的设置可根据易滚动物体发生滚动时的状态确定,例如,气瓶从A状态移动至B状态所用的时间是1分钟,那么相邻帧之间的时间间隔则为20秒-50秒之间,该时间段既可以保证气瓶正在发生滚动,且滚动未结束的状态。
最后,通过第一图像和第二图像获得待检测图像中的包含有目标对象的相邻帧的图像,即将获得的第一图像和第二图像作为包含有目标对象的相邻帧的图像。其中,需要说明的是,本申请优先考虑相邻帧的图像中分别都包含有目标对象,这样更能突出两个图像之前的相似度的差异。换言之,若与包含有目标对象的图像的相邻帧的图像中未有目标对象,那么可直接确定出该目标对象发生了移动。
进一步的,通过第一图像和第二图像获得待检测图像中的包含有目标对象的相邻帧的图像,包括:获得包含有目标对象的第一图像的包围盒,将包围盒包含有目标对象的第一位置区域裁剪以获得第一目标图像。对应的,获得在第二图像中与第一图像的包围盒包含有目标对象的第一位置区域对应的第二位置区域,并将第二位置区域裁剪以获得第二目标图像。举例说明,通过目标对象检测模型,获得第一图像中目标对象的包围盒,该包围盒包括左上角(x1,y1)、右下角(x2,y2),然后,将该包围盒对应的第一位置区域裁剪出来以获得第一目标图像。而后,基于第一图像可定位到该第一图像前一帧的第二图像,在第二图像中,确定与第一图像的第一位置区域相同的位置区域,即第二图像中的第二位置区域,并将该第二位置区裁剪出来以获得第二目标图像。最后,将第一目标图像和第二目标图像作为待检测图像中的包含有目标对象的相邻帧的图像。可见,本步骤对待检测图像作了更明确的划分,从而为后续确定出更为具体的相似度比较区域奠定基础。
步骤S104,获得所述包含有目标对象的相邻帧的图像的相似度。
在确定了包含有目标对象的相邻帧的图像中具体的相似度比较区域后,可获得所述包含有目标对象的相邻帧的图像的相似度。
具体的,采用滑动窗口在第一目标图像中提取第一窗口,在第二目标图像中提取第二窗口,并计算所述第一窗口和所述第二窗口的相似度。其中,滑动窗口是指通过不断移动的方式可以对图像中的任意位置的图像信息进行提取的窗口。每一次采用滑动窗口会在第一目标图像中对应提取一次第一窗口,以及在所述第二目标图像中对应提取一次第二窗口。滑动窗口的大小可以根据实际需求进行设置,例如3x3,2x2格式大小的滑动窗口,滑动窗口每滑动到一定的区域,其可以根据自身的窗口大小来提取对应的图像信息,本申请第一实施例可采用依次滑动的方式或随机滑动的方式来提取滑动窗口对应的图像信息。例如,以滑动窗口依次滑动的方式提取窗口,以获得该窗口下对应的图像信息,第一目标图像为8x8大小,滑动窗口为2x2大小,通过依次滑动的方式,则可通过4次移动就可以将第一目标图像提取完成,且没有任何重复提取的区域。
在本申请第一实施例中,相似度至少包括以下相似度的一种:亮度相似度、对比度相似度以及结构相似度。对应的,所述计算第一窗口和第二窗口的相似度,至少计算如下相似度的一种:计算每次滑动窗口在第一目标图像和第二目标图像中对应提取的第一窗口和第二窗口的亮度相似度;计算每次滑动窗口在第一目标图像和第二目标图像中对应提取的第一窗口和第二窗口的对比度相似度;计算每次滑动窗口在第一目标图像和第二目标图像中对应提取的第一窗口和第二窗口的结构相似度。
在本申请第一实施例中,可通过滑动窗口分别在第一目标图像和第二目标图像滑动一次提取的第一窗口和第二窗口,来计算第一窗口和第二窗口的相似度,并且在该一次滑动的提取前提下,可以只计算该次滑动窗口在第一目标图像和第二目标图像中对应提取的第一窗口和第二窗口的亮度相似度,或者只计算该次滑动窗口在第一目标图像和第二目标图像中对应提取的第一窗口和第二窗口的对比度相似度,再或者只计算该次滑动窗口在第一目标图像和第二目标图像中对应提取的第一窗口和第二窗口的结构相似度。
或者是,计算该次滑动窗口在第一目标图像和第二目标图像中对应提取的第一窗口和第二窗口的亮度相似度和该次滑动窗口在第一目标图像和第二目标图像中对应提取的第一窗口和第二窗口的对比度相似度;或者是,计算该次滑动窗口在第一目标图像和第二目标图像中对应提取的第一窗口和第二窗口的亮度相似度和该次滑动窗口在第一目标图像和第二目标图像中对应提取的第一窗口和第二窗口的结构相似度;或者是,计算该次滑动窗口在第一目标图像和第二目标图像中对应提取的第一窗口和第二窗口的对比度相似度和该次滑动窗口在第一目标图像和第二目标图像中对应提取的第一窗口和第二窗口的结构相似度。
以及,计算该次滑动窗口在第一目标图像和第二目标图像中对应提取的第一窗口和第二窗口的亮度相似度、对比度相似度以及结构相似度的单次总和,即计算该次滑动窗口在第一目标图像和第二目标图像中对应提取的第一窗口和第二窗口的亮度相似度、该次滑动窗口在第一目标图像和第二目标图像中对应提取的第一窗口和第二窗口的对比度相似度,以及该次滑动窗口在第一目标图像和第二目标图像中对应提取的第一窗口和第二窗口的结构相似度的单次总和。
当然,在本申请第一实施例中,还可分别计算多次使用滑动窗口的滑动次数下对应的第一窗口和第二窗口的相似度,并且可以单独计算或组合计算多次使用滑动窗口下的第一窗口和第二窗口的亮度相似度、对比度相似度以及结构相似度。
本申请第一实施例优先采用组合计算多次使用滑动窗口下的第一窗口和第二窗口的亮度相似度、对比度相似度以及结构相似度。具体的,首先,获得采用滑动窗口的滑动次数,该滑动窗口分别在第一目标图像和第二目标图像的滑动次数是相同的,且滑动的方式也是相同的。例如,第一目标图像为8x8大小,滑动窗口为2x2大小,通过依次滑动的方式,则可通过4次移动就可以将第一目标图像提取完成;第二目标图像为8x8大小,滑动窗口为2x2大小,通过依次滑动的方式,则可通过4次移动就可以将第二目标图像提取完成。
而后,获得该滑动次数下对应提取的第一窗口和第二窗口的亮度相似度、对比度相似度以及结构相似度的累计总和。具体的,获得该滑动次数下对应提取的第一窗口和第二窗口的亮度相似度累计总和,获得该滑动次数下对应提取的第一窗口和第二窗口的对比度相似度累计总和,以及获得该滑动次数下对应提取的第一窗口和第二窗口的结构相似度累计总和,并将该滑动次数下的亮度相似度累计总和、对比度相似度累计总和以及结构相似度累计总和汇总计算,以获得该滑动次数下对应提取的第一窗口和第二窗口的亮度相似度、对比度相似度以及结构相似度的累计总和。
举例解释,滑动窗口的使用次数是4次,则分别获得4次滑动状态下分别对应的亮度相似度1、亮度相似度2、亮度相似度3以及亮度相似度4,并计算亮度相似度1、亮度相似度2、亮度相似度3以及亮度相似度4累计亮度相似度总和;再分别获得4次滑动状态下分别对应的对比度相似度1、对比度相似度2、对比度相似度3以及对比度相似度4,并计算对比度相似度1、对比度相似度2、对比度相似度3以及对比度相似度4累计对比度相似度总和,再分别获得4次滑动状态下分别对应的结构相似度1、结构相似度2、结构相似度3以及结构相似度4,并计算结构相似度1、结构相似度2、结构相似度3以及结构相似度4累计结构相似度总和。而后,将亮度相似度总和、比度相似度总和以及结构相似度总和汇总计算,获得该滑动次数下对应提取的第一窗口和第二窗口的亮度相似度、对比度相似度以及结构相似度的累计总和。
最后,根据累计总和与采用滑动窗口的滑动次数,获得第一窗口和所述第二窗口的平均相似度。通过平均值反映第一窗口和第二窗口的相似度,更能提升获得第一窗口和第二窗口的相似度的准确度。
在本申请第一实施例中,计算每次滑动窗口在所述第一目标图像和所述第二目标图像中对应提取的所述第一窗口和所述第二窗口的亮度相似度,采用如下公式:
其中,μx表示平均灰度,N表示窗口总数量;
其中,μa表示第一窗口的平均灰度;μb表示第一窗口的平均灰度;c1=(k1L)2,L=255,k1=0.01。
在本申请第一实施例中,计算每次滑动窗口在所述第一目标图像和所述第二目标图像中对应提取的所述第一窗口和所述第二窗口的对比度相似度,采用如下公式:
其中,σx表示标准差,N表示窗口总数量;
其中,σa表示第一窗口的标准差,σb表示第一窗口的标准差;c2=(k2L)2,L=255,k2=0.03。
在本申请第一实施例中,计算每次滑动窗口在所述第一目标图像和所述第二目标图像中对应提取的所述第一窗口和所述第二窗口的结构相似度,采用如下公式:
其中,σa表示第一窗口的标准差,σb表示第一窗口的标准差;c3=(k3L)2,L=255,k3=0.02。
在本申请第一实施例中,计算每次滑动窗口在所述第一目标图像和所述第二目标图像中对应提取的所述第一窗口和所述第二窗口的亮度相似度、对比度相似度以及结构相似度的单次总和,采用如下公式:
M(a,b)=l(a,b)·c(a,b)·s(a,b)
需要说明的是,上述第一窗口和第二窗口的亮度相似度、对比度相似度以及结构相似度可通过计算第一窗口和第二窗口各自的均值、方差,以及第一窗口和第二窗口的协方差来表征,均值和方差是用来反应第一窗口和第二窗口之间的相差程度,方差的数据越小,第一窗口和第二窗口的相似度就越大。
步骤S105,根据所述相邻帧的图像的相似度确定目标对象动态。
在获得相邻帧的图像的相似度后,可根据相邻帧的图像的相似度确定目标对象动态。具体的,预先设置相似度阈值,将相似度阈值与相邻帧的图像的相似度比较,若相似度阈值大于相邻帧的图像的相似度,则确定目标对象发生移动;若相似度阈值小于相邻帧的图像的相似度,则确定目标对象静止。在本申请第一实施例中,获得的相邻帧的图像的相似度设定在0到1之间,继而对应预先设置的相似度阈值为0.5,例如,当获得的相邻帧的图像的相似度大于0.5时,说明第一窗口和第二窗口的相似度高,则确定目标对象静止;当获得的相邻帧的图像的相似度小于0.5时,说明第一窗口和第二窗口的相似度较低,则确定目标对象发生移动。
进一步的,在本申请第一实施例中,当获得的相邻帧的图像的相似度小于预先设置的相似度阈值时,则触发报警机制以提供相应的报警信息。
本申请第一实施例提供一种确定目标对象动态的方法,包括:获得包含有目标对象的图像集;根据所述图像集构建目标对象检测模型;通过所述目标对象检测模型,获得待检测图像中的包含有目标对象的相邻帧的图像;获得所述包含有目标对象的相邻帧的图像的相似度;根据所述相邻帧的图像的相似度确定目标对象动态。本申请第一实施例通过获得的图像集来构建目标对象检测模型,通过目标对象检测模型对待检测图像进行检测,以待检测图像中的包含有目标对象的相邻帧的图像对应的相似度,通过相邻帧的图像的相似度确定目标对象动态,不仅提升检测的准确度,而且还不用人为地自行检测,从而降低对易发生滚动的物体是否发生移动的检测的投入成本。
另外,基于通过获得的图像集,构建了目标对象检测模型,该目标对象检测模型可应用于其他具有多尺度特征图的目标检测网络中,即本申请的目标对象检测模型对于目标对象的检测通用行较强。
在上述的第一实施例中,提供了一种确定目标对象动态的方法,与之相对应的,本申请提供一种确定目标对象动态的装置。如图3所示,其为本申请第二实施例的一种确定目标对象动态的装置的示意图。由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。
本申请第二实施例提供一种确定目标对象动态的装置,包括:图像集获得单元301,用于获得包含有目标对象的图像集;目标对象检测模型构建单元302,用于根据所述图像集构建目标对象检测模型;图像检测单元303,用于通过所述目标对象检测模型,获得待检测图像中的包含有目标对象的相邻帧的图像;相似度获得单元304,用于获得所述包含有目标对象的相邻帧的图像的相似度;目标对象动态确定单元305,用于根据所述相邻帧的图像的相似度确定目标对象动态。
本申请第一实施例给出了一种确定目标对象动态的方法,本申请第三实施例给出了与第一实施例方法对应的电子设备。可参考图4所示,其示出了本实施例电子设备示意图。本申请第三实施例提供一种电子设备,包括:处理器401;存储器402,用于存储计算机程序,该计算机程序被处理器运行,执行上述本申请第一实施例提供的一种确定目标对象动态的方法。
本申请第四实施例给出了与第一实施例方法对应的计算机存储介质。本申请第四实施例提供一种计算机存储介质,计算机存储介质存储有计算机程序,该计算机程序被处理器运行,执行上述本申请第一实施例提供的一种确定目标对象动态的方法。
本申请虽然以较佳实施例公开如上,但其并不是用来限定本申请,任何本领域技术人员在不脱离本申请的精神和范围内,都可以做出可能的变动和修改,因此本申请的保护范围应当以本申请权利要求所界定的范围为准。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
Claims (16)
1.一种确定目标对象动态的方法,其特征在于,包括:
获得包含有目标对象的图像集;
根据所述图像集构建目标对象检测模型;
通过所述目标对象检测模型,获得待检测图像中的包含有目标对象的相邻帧的图像;
获得所述包含有目标对象的相邻帧的图像的相似度;
根据所述相邻帧的图像的相似度确定目标对象动态。
2.根据权利要求1所述的确定目标对象动态的方法,其特征在于,所述通过所述目标对象检测模型,获得待检测图像中的包含有目标对象的相邻帧的图像,包括:
通过所述目标对象检测模型,获得待检测图像中的包含有目标对象的第一图像;
定位所述第一图像对应的帧频,获得与所述第一图像对应的帧频相邻的前一帧或后一帧的第二图像;
通过所述第一图像和第二图像获得待检测图像中的包含有目标对象的相邻帧的图像。
3.根据权利要求2所述的确定目标对象动态的方法,其特征在于,所述通过所述第一图像和第二图像获得待检测图像中的包含有目标对象的相邻帧的图像,包括:
获得包含有目标对象的第一图像的包围盒,将所述包围盒包含有目标对象的第一位置区域裁剪以获得第一目标图像;
获得在所述第二图像中与所述包围盒包含有目标对象的第一位置区域对应的第二位置区域,并将所述第二位置区域裁剪以获得第二目标图像;
将所述第一目标图像和所述第二目标图像作为待检测图像中的包含有目标对象的相邻帧的图像。
4.根据权利要求3所述的确定目标对象动态的方法,其特征在于,所述获得所述包含有目标对象的相邻帧的图像的相似度,包括:
采用滑动窗口在所述第一目标图像中提取第一窗口,在所述第二目标图像中提取第二窗口;
计算所述第一窗口和所述第二窗口的相似度;
其中,每一次采用滑动窗口会在所述第一目标图像中对应提取一次第一窗口,以及在所述第二目标图像中对应提取一次第二窗口。
5.根据权利要求4所述的确定目标对象动态的方法,其特征在于,所述相似度至少包括以下相似度的一种:亮度相似度、对比度相似度以及结构相似度;
对应的,所述计算所述第一窗口和所述第二窗口的相似度,至少计算如下相似度的一种:
计算每次滑动窗口在所述第一目标图像和所述第二目标图像中对应提取的所述第一窗口和所述第二窗口的亮度相似度;
计算每次滑动窗口在所述第一目标图像和所述第二目标图像中对应提取的所述第一窗口和所述第二窗口的对比度相似度;
计算每次滑动窗口在所述第一目标图像和所述第二目标图像中对应提取的所述第一窗口和所述第二窗口的结构相似度。
6.根据权利要求5所述的确定目标对象动态的方法,其特征在于,还包括:
计算每次滑动窗口在所述第一目标图像和所述第二目标图像中对应提取的所述第一窗口和所述第二窗口的亮度相似度、对比度相似度以及结构相似度的单次总和。
7.根据权利要求6所述的确定目标对象动态的方法,其特征在于,所述计算所述第一窗口和所述第二窗口的相似度,还包括:
获得采用滑动窗口的滑动次数;
获得该滑动次数下对应提取的所述第一窗口和所述第二窗口的亮度相似度、对比度相似度以及结构相似度的累计总和;
根据所述累计总和与所述采用滑动窗口的滑动次数,获得所述第一窗口和所述第二窗口的平均相似度。
11.根据权利要求6所述的确定目标对象动态的方法,其特征在于,所述计算每次滑动窗口在所述第一目标图像和所述第二目标图像中对应提取的所述第一窗口和所述第二窗口的亮度相似度、对比度相似度以及结构相似度的单次总和,采用如下公式:
M(a,b)=l(a,b)·c(a,b)·s(a,b)。
12.根据权利要求1所述的确定目标对象动态的方法,其特征在于,所述根据所述相邻帧的图像的相似度确定目标对象动态,包括:
预先设置相似度阈值;
将所述相似度阈值与所述相邻帧的图像的相似度比较,若所述相似度阈值大于所述相邻帧的图像的相似度,则确定所述目标对象发生移动;若所述相似度阈值小于所述相邻帧的图像的相似度,则确定所述目标对象静止。
13.根据权利要求1所述的确定目标对象动态的方法,其特征在于,所述获得包含有目标对象的图像集,包括:
获得包含有目标对象的多个图像;
对所述多个图像进行预处理得到多个候选图像;
对所述多个候选图像进行标记以得到所述图像集。
14.根据权利要求13所述的确定目标对象动态的方法,其特征在于,所述根据所述图像集构建目标对象检测模型,包括:
构建初始对象检测模型,将所述初始对象检测模型的参数初始化,并将所述图像集中的训练图像输入至所述初始对象检测模型中;
获得所述初始对象检测模型对所述训练图像的预测结果与标记的图像的损失值;
利用反向传播算法更新所述初始对象检测模型的参数;
再将所述图像集中的其它训练图像输入至所述初始对象检测模型中进行迭代训练,获得损失值最小时所更新的所述初始对象检测模型作为候选对象检测模型;
将所述图像集中的测试图像输入至所述候选对象检测模型中,获得所述候选对象检测模型对所述测试图像的测试结果与标记的图像的损失值;
将所述损失值与预设损失值比较,若所述损失值满足预设损失值,则将所述候选对象检测模型作为目标对象检测模型;反之,则继续将所述图像集中的其它训练图像输入至所述初始对象检测模型中进行迭代训练。
15.一种确定目标对象动态的装置,其特征在于,包括:
图像集获得单元,用于获得包含有目标对象的图像集;
目标对象检测模型构建单元,用于根据所述图像集构建目标对象检测模型;
图像检测单元,用于通过所述目标对象检测模型,获得待检测图像中的包含有目标对象的相邻帧的图像;
相似度获得单元,用于获得所述包含有目标对象的相邻帧的图像的相似度;
目标对象动态确定单元,用于根据所述相邻帧的图像的相似度确定目标对象动态。
16.一种电子设备,其特征在于,所述电子设备包括:处理器;存储器,用于存储计算机程序,该计算机程序被处理器运行,执行权利要求1-14任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110886579.6A CN113807389A (zh) | 2021-08-03 | 2021-08-03 | 一种确定目标对象动态的方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110886579.6A CN113807389A (zh) | 2021-08-03 | 2021-08-03 | 一种确定目标对象动态的方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113807389A true CN113807389A (zh) | 2021-12-17 |
Family
ID=78942674
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110886579.6A Pending CN113807389A (zh) | 2021-08-03 | 2021-08-03 | 一种确定目标对象动态的方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113807389A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9443320B1 (en) * | 2015-05-18 | 2016-09-13 | Xerox Corporation | Multi-object tracking with generic object proposals |
CN109598299A (zh) * | 2018-11-29 | 2019-04-09 | 微梦创科网络科技(中国)有限公司 | 一种图像相似度确定方法、装置及电子设备 |
CN110246157A (zh) * | 2019-06-21 | 2019-09-17 | 大庆安瑞达科技开发有限公司 | 基于大数据监控的油气田设备生产状态判别系统与方法 |
CN112465859A (zh) * | 2019-09-06 | 2021-03-09 | 顺丰科技有限公司 | 快速运动目标的检测方法、装置、设备和储存介质 |
CN112528937A (zh) * | 2020-12-22 | 2021-03-19 | 嘉洋智慧安全生产科技发展(北京)有限公司 | 一种视频抽油机启停的检测方法 |
-
2021
- 2021-08-03 CN CN202110886579.6A patent/CN113807389A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9443320B1 (en) * | 2015-05-18 | 2016-09-13 | Xerox Corporation | Multi-object tracking with generic object proposals |
CN109598299A (zh) * | 2018-11-29 | 2019-04-09 | 微梦创科网络科技(中国)有限公司 | 一种图像相似度确定方法、装置及电子设备 |
CN110246157A (zh) * | 2019-06-21 | 2019-09-17 | 大庆安瑞达科技开发有限公司 | 基于大数据监控的油气田设备生产状态判别系统与方法 |
CN112465859A (zh) * | 2019-09-06 | 2021-03-09 | 顺丰科技有限公司 | 快速运动目标的检测方法、装置、设备和储存介质 |
CN112528937A (zh) * | 2020-12-22 | 2021-03-19 | 嘉洋智慧安全生产科技发展(北京)有限公司 | 一种视频抽油机启停的检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9418319B2 (en) | Object detection using cascaded convolutional neural networks | |
US20150154450A1 (en) | Optical Flow Tracking Method and Apparatus | |
US8019164B2 (en) | Apparatus, method and program product for matching with a template | |
US20130034305A1 (en) | Image-based crack quantification | |
CN111091123A (zh) | 文本区域检测方法及设备 | |
CN113808200B (zh) | 一种检测目标对象移动速度的方法、装置及电子设备 | |
CN110942456B (zh) | 篡改图像检测方法、装置、设备及存储介质 | |
CN103955888A (zh) | 一种基于sift的高清视频图像拼接方法及装置 | |
CN113505643B (zh) | 违章目标物检测方法及相关装置 | |
US20120249880A1 (en) | Method and apparatus for detecting camera motion type in video | |
CN110737785A (zh) | 一种图片标注的方法及装置 | |
CN115147403A (zh) | 液体污染物的检测方法、装置、电子设备及介质 | |
CN111815576B (zh) | 金属部件腐蚀状况检测方法、装置、设备和存储介质 | |
CN113298130B (zh) | 目标图像的检测、目标对象检测模型的生成方法 | |
CN117173713B (zh) | 一种基于u型网络的文本篡改检测方法、装置以及设备 | |
CN113191237A (zh) | 一种基于改进YOLOv3的果树图像小目标检测方法及装置 | |
CN113807389A (zh) | 一种确定目标对象动态的方法、装置及电子设备 | |
CN114494486B (zh) | 户型图生成方法、设备及存储介质 | |
CN115205793A (zh) | 基于深度学习二次确认的电力机房烟雾检测方法及装置 | |
CN116363656A (zh) | 包含多行文本的图像识别方法、装置及计算机设备 | |
CN113643368A (zh) | 一种物体之间真实间距的确定方法、装置及电子设备 | |
CN117876669B (zh) | 目标检测方法、装置、计算机设备和存储介质 | |
CN118097566B (zh) | 基于深度学习的场景变动检测方法、装置、介质及设备 | |
CN112927231B (zh) | 车身污垢检测模型的训练方法、车身污垢检测方法及装置 | |
Chen et al. | A learning-based approach for leaf detection in traffic surveillance video |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 100000 rooms 206 and 207 on the ground floor of office building 9, Chaolai high tech Industrial Park, No. a, Laiguangying Middle Road, Chaoyang District, Beijing Applicant after: Jiayang Smart Security Technology (Beijing) Co.,Ltd. Address before: 100000 rooms 206 and 207 on the ground floor of office building 9, Chaolai high tech Industrial Park, No. a, Laiguangying Middle Road, Chaoyang District, Beijing Applicant before: PETROMENTOR INTERNATIONAL EDUCATION (BEIJING) CO.,LTD. |
|
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20211217 |