CN111583324B - 单目图像深度估测装载率识别方法和装置 - Google Patents
单目图像深度估测装载率识别方法和装置 Download PDFInfo
- Publication number
- CN111583324B CN111583324B CN201910122856.9A CN201910122856A CN111583324B CN 111583324 B CN111583324 B CN 111583324B CN 201910122856 A CN201910122856 A CN 201910122856A CN 111583324 B CN111583324 B CN 111583324B
- Authority
- CN
- China
- Prior art keywords
- carriage
- image
- loading rate
- monocular
- depth estimation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000012545 processing Methods 0.000 claims abstract description 63
- 238000004364 calculation method Methods 0.000 claims abstract description 27
- 230000003287 optical effect Effects 0.000 claims description 29
- 238000012549 training Methods 0.000 claims description 29
- 230000002159 abnormal effect Effects 0.000 claims description 27
- 230000008569 process Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 7
- 238000012544 monitoring process Methods 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 6
- 238000004590 computer program Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 210000005036 nerve Anatomy 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 210000004556 brain Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000005312 nonlinear dynamic Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/50—Depth or shape recovery
- G06T7/55—Depth or shape recovery from multiple images
- G06T7/579—Depth or shape recovery from multiple images from motion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/49—Segmenting video sequences, i.e. computational techniques such as parsing or cutting the sequence, low-level clustering or determining units such as shots or scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30248—Vehicle exterior or interior
- G06T2207/30268—Vehicle interior
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/08—Detecting or categorising vehicles
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种单目图像深度估测装载率计算方法和装置,该方法包括:获取装载状态初始化后的待深度估计的单目车厢视频图像;将所述车厢视频图像输入到预先建立的模型中判定装载率状态;判断满足预设装载率状态的所述单目车厢视频图像中的车厢图像是否包含完整的车厢;对包含完整车厢的所述车厢图像进行预设的图像处理;确定所述处理后的车厢图像的车框区域的空车厢像素深度总和以及车厢像素深度总和;根据所述空车厢像素深度总和计算出装载率。该方法能够在有遮挡的情况下,精准而快速的找出车厢的位置和形状,提高计算速度。
Description
技术领域
本发明一般涉及图像处理技术领域,具体涉及单目图像深度估测装载率识别方法和装置。
背景技术
随着物流行业的发展,将货物进行集中整合然后再集中分发成为了提高运输效率所必不可少的流程,这个货物集中整合的地方就是中转场,为了提高装卸口装载率识别的效率,首先需要对装卸口的卸货情况进行了解,尤其是装卸时间以及装卸的货物量,可以用来直接评估装载率。
目前的方法主要包括两个,第一方法是直接采用人为监控,会增加一个检测的岗位,从而增加了一个持续性的投入,增加装载人员或监控人员的工作量,因此增加了人的主观判断,增加了误差。第二方法是深度估测也存在严重的准确度问题,因为对体积定量测量需要对深度图像进行采集分析。因此对从单张图片获取车厢的信息甚至车厢的三维模型是整个流程成功的关键。
发明内容
鉴于现有技术中的上述缺陷或不足,期望提供一种单目图像深度估测装载率识别方案。
第一方面,本申请实施例提供一种单目图像深度估测装载率识别方法,包括:
获取装载状态初始化后的待深度估计的单目车厢视频图像;
将所述车厢视频图像输入到预先建立的模型中判定装载率状态;
判断满足预设装载率状态的所述单目车厢视频图像中的车厢图像是否包含完整的车厢;
对包含完整车厢的所述车厢图像进行预设的图像处理;
确定所述处理后的车厢图像的车框区域的空车厢像素深度总和以及车厢像素深度总和;
根据所述空车厢像素深度总和车厢像素深度总和计算出装载率。
可选的,所述模型是通过以下步骤建立的:
获取训练样本集合,所述训练样本集合包括至少一帧车厢视频图像;
将所述车厢视频图像进行训练,得到生成具有装载率状态识别的模型。
可选的,在获取装载状态初始化后的待深度估计的单目车厢视频图像之前,包括:
获取车厢图像帧序列;
计算相邻帧之间的相似度;
若所述相似度小于等于第一阈值,则将所述车厢图像送入模型进行训练以用于判定装载率状态。
可选的,所述对包含完整车厢的所述车厢图像进行预设的图像处理,包括:
对所述车厢图像或空车厢图像进行第一层网络深度估计处理;
将所述车厢图像或空车厢图像进行第二层网络光流估计处理。
可选的,所述进行连续帧一致性检查,包括:
检索光流异常区域;
若光流异常区域运动幅度明显大于整体,则将异常区域标记为障碍物。
第二方面,本申请实施例还提供一种单目图像深度估测装载率计算装置,包括:
第一获取模块,用于获取装载状态初始化后的待深度估计的单目车厢视频图像;
第一判断模块,用于将所述车厢视频图像输入到预先建立的模型中判定装载率状态;
第二判断模块,用于判断满足预设的装载率状态的所述单目车厢视频图像中的车厢图像是否包含完整的车厢;
处理模块,用于对包含完整车厢的所述车厢图像进行预设的图像处理;
确定模块,用于确定所述处理后的车厢图像的车框区域的空车厢像素深度总和以及车厢像素深度总和;
第一计算模块,用于根据所述空车厢像素深度总和车厢像素深度总和计算出装载率。
可选的,所述装置,还包括:
第二获取模块,用于获取训练样本集合,所述训练样本集合包括至少一帧车厢视频图像;
训练模块,用于将所述车厢视频图像进行训练,得到生成具有装载率状态识别的模型。
可选的,所述装置,还包括:
第三获取模块,用于获取车厢图像帧序列;
第二计算模块,用于计算相邻帧之间的相似度;
第三判断模块,用于若所述相似度小于等于第一阈值,则将所述车厢图像送入模型进行训练以用于判定装载率状态。
可选的,所述处理模块,包括
第一处理单元,用于对所述车厢图像或空车厢图像进行第一层网络深度估计处理;
第二处理单元,用于将所述车厢图像或空车厢图像进行第二层网络光流估计处理。
可选的,所述第一处理单元具体用于:
检索光流异常区域;
若光流异常区域运动幅度明显大于整体,则将异常区域标记为障碍物。
本申请实施例提供的单目图像深度估测装载率计算方法,通过利用固定摄像头的单目图像估计深度信息,采用单目方案,建立了空间模型,从而获取车厢深度图像,对图像进行处理后获取空车厢像素深度总和车厢像素深度总和,对图像进行装载率计算。
进一步的,针对关注的车厢区域,重点训练该区域,增加装载率计算的准确度;
进一步的,针对货物遮挡问题,对车厢样本进行分析研究,提高了识别效率;
进一步的,针对不同装载率状态下的车厢的装载率计算提供了有利的依据。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1为本发明的实施例的单目图像深度估测装载率识别方法的流程性示意图;
图2为本发明的实施例的另一实施例的单目图像深度估测装载率识别方法的流程性示意图;
图3为本发明的实施例的单目车厢图像的预处理示意图;
图4为本发明的实施例的单目图像深度估测装载率识别装置的结构示意图;
图5为本发明的实施例的另一实施例的单目图像深度估测装载率识别装置的结构示意图;
图6为本发明的实施例的处理模块的结构示意图;
图7为本发明的实施例的服务器的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
如背景技术中所提到目前装卸口车厢装载率的计算方法主要两个:第一个方法是直接采用人为监控的方法,监控人员用肉眼进行观察获取装卸的各个时刻装载率,并进行记录;第二个方法则是直接将货物量进行计算,通过定量的计算来对装载率进行记录。这两个方法存在一定的弊端:第一种方法,采用专业人员来进行监控,会增加一个检测的岗位,从而增加了一个持续性的投入,增加装载人员或者监控人员的工作量。因为增加了人的主观判断,因此会存在一定的误差(例如人物没有注意到各类车辆区别,则存在一定的误差)。且因为装卸口数量巨大,对于人员的分配也是一个值得考虑的问题;对于第二种方法,深度估测亦存在严重的准确度问题,因为对体积定量测量需要对深度图像进行采集分析,第一是设备成本高,第二是针对不同场景普适性不强。第三,目前在该行业并没有一个完整的检测与计时统计的系统来数据进行统计和分析。而且不同车型长宽高等参数区别很大,因此对从单张图片获取车厢的信息甚至车厢的三维模型是整个流程成功的关键。
基于上述缺陷,为了便于理解和说明,下面通过图1至图7详细说明本申请实施例提供的一种单目图像深度估测装载率识别方法和装置。
图1所示为本申请实施例的单目图像深度估测装载率识别方法的流程示意图,如图1所示,该方法可以包括:
S11,获取装载状态初始化后的待深度估计的单目车厢视频图像。
具体的,本申请实施例提供的实施例中,在通过摄像头采集待测车辆的车厢视频流后,可以截取视频流中的一组图像序列,并经过处理得到待深度估计的单目车厢视频图像集合。其中,装载状态的初始化主要包括初始化当前状态、当前检测状态、前一时刻状态、装卸行为起止时间等,即获取初始化状态机下的车厢视频图像。
S12,将车厢视频图像输入到预先建立的模型中判定装载率状态。
具体的,可以对得到的每一帧车厢图像进行判断,以确定其当前的装载率状态,其中装载率状态为:关门、模糊、能见度低等状态。不同的装载率状态能够影响车厢装载率的计算。
S13,判断满足预设装载率状态的单目车厢视频图像中的车厢图像是否包含完整的车厢。
具体的,可以对满足设定装载率状态下的每一帧车厢图像进行判断,以确定其是否包括完整的车厢。即通过观测装载率的图片,排除掉关车门和能见度差的图片,其余的图片满足装载率识别条件。除此之外,判断是否满足车厢图像的完整性,若满足,即确定该图像包含完整车厢后,可以对该车厢图像进行预设的图像处理。
S14,对包含完整车厢的车厢图像进行预设的图像处理。
具体的,在进行预设的图像处理之前,首先可以将车厢图像的车框进行延伸处理,外框的左右上下按照指定数值进行调整,例如可以为0.05cm。进一步的,还可以对车厢图像的中央区域进行蒙版处理。可以理解的是,对于获取到的待测车辆的车厢图像,由于其内部装有货物,则通过上述的车厢外框各边的完整形态颜色特征,又能提高计算的准确度。
可以理解的,此处的预设的图像处理主要为对按照上述方法调整后的车厢图像进行第一层网络深度估计处理和第二层网络光流估计处理。
S15,确定处理后的车厢图像的车框区域的空车厢像素深度总和以及车厢像素深度总和。
具体的,处理深度信息的获得是通过将图片划分为若干超像素区域,从不具有尺度的超像素三维结构到三维曲面的重建过程表达为求解三维超像素的拼接问题。超像素是把一些具有相似特性的像素“聚合”起来,形成一个更具有代表性的大“元素”,而这个新的元素,将作为其他图像处理算法的基本单位。一来大大降低了维度,二来可以剔除一些异常像素点,至于根据什么特征把一个个像素点聚集起来,可以是颜色、纹理、类别等。应用在本申请实施例中则是根据货物特征,检测货物的颜色(包裹和袋子颜色基本固定)和边缘。
将不规则的复杂曲面简化为若干个平整曲面的拼接。根据论文《Unsupervisedmonocular depth estimation with left-right consistency》中的网络结构,学习像素级的几何信息。该结构主要由两部分构成:编码器encoder和解码decoder。编码器encoder部分以ResNet50作为基本结构,解码器decoder部分由反卷器层构成,将特征图谱扩大到全尺度。为了同时保留全局高层次特征和局部细节信息,在encoder和decoder之间的不同分辨率上采用了skip connections,进行了多尺度的深度预测。对每一个曲面,取其中所有像素点的深度作为输入,取其平均作为曲面的深度,再将所有曲面深度与面积之乘积累加求出货物总体的深度。
S16,根据空车厢像素深度总和车厢像素深度总和计算出装载率。
具体的,在得到空车厢像素深度总和车厢像素深度总和,将两者按照比例计算出车厢的装载率的大小。应用本申请实施例的方法,可以直接缩减掉人工的监控成本,能从单张图片生成深度图像,并通过一系列处理,排除了杂物干扰的影响。
为了更好的理解本申请单目图像深度估测装载率计算方法,通过图2详细阐述本申请另一实施例的方法。
图2所示为本申请的另一实施例的单目图像深度估测装载率计算方法,该方法包括:
S21,获取训练样本集合,训练样本集合包括至少一帧车厢视频图像。
S22,将车厢视频图像进行训练,得到生成具有装载率状态识别的模型。
具体的,在执行该方法时,可以获取所有车型的车厢的图像,作为训练样本集合,训练样本集合包括至少一帧空车厢图像。获取到空车厢图像后,将这些车厢图像送入神经网络模型中进行训练,生成具有装载率状态识别的模型。此处的训练集图像除了上述的空车厢图像之外还包括满足装载率识别条件的非空车厢图像,之所以选择至少一张的空车厢图像,是为了获取空车时候车厢的深度信息,而获取装了货物的非空车厢图像信息是为了和空车厢图像信息进行对比,确定出货物占比的空间信息。
例如,为了得到完整的车厢图像,可以将获取的车厢图像上下左右进行延伸,并在延伸后,还可以将空车厢图像的中央区域做黑色蒙版处理,以使得与后期采集到的待测车辆车厢图像一致。
进一步的,如图3所示,还需要将车厢图像进行预设的图像处理,以获取图像深度和光流数据。确定出含有货物的车厢图像的车框区域的空车厢像素深度总和以及车厢像素深度总和。
S141,对车厢图像或空车厢图像进行第一层网络深度估计处理。
S142,将车厢图像或空车厢图像进行第二层网络光流估计处理。
具体的,可以理解为对得到的每一帧车厢图像进行处理以确定其为车厢图像,并确定其包含完整的车厢之前。如可以通过是否包含车牌号,以确定采集到的图像是否为车厢图像,可以通过是否包括车框确定车厢图像是否完整,在确定车厢图片包含完整的车厢后,可以对该车厢图像进行预设的图像处理。如果判断发现未包含完整的车厢图像,则舍弃该车厢图像。
进一步的,对车厢图像或空车厢图像进行第一层网络深度估计处理。具体为将图片划分为若干超像素区域,从不具有尺度的超像素三维结构重建成为三维曲面,将深度问题转换为进行求解三维超像素拼图的问题。主要是利用网络结构学习像素级的几何信息。该网络结构主要由编码器和解码器两部分构成,编码器部分以ResNet50作为基本结构,解码器部分由反卷器层构成。利用网络结构建立模型,将每一个曲面中的像素点的深度作为模型的输入值,平均后的数值作为图像曲面的深度,曲面深度与面积之积累加后确定货物总体深度。
其中进行第二层网络光流估计处理,是因为场地的摄像头固定,可以一次性标定镜头内外参数,以及地面像素点的深度,辅助分割出运动物体,计算出光流。其中光流估计处理中假设相邻帧之间的光照恒定,相邻帧像素变化微小,其原理为对前一帧寻找货物图像的关键点,随机生成并检测到非空车厢图像中的特征点,预测后一帧中特征点最可能出现的位置,从而确定目标的位置变化信息。
优选的,在进行过第一层网络深度估计处理和第二层网络光流估计处理后,再进行连续帧一致性检查,包括检索光流异常区域,若光流异常区域运动幅度明显大于整体,则将异常区域标记为障碍物。
具体的,对光流的一致性检查中主要检索其中光流异常区域,如果异常区域的运动幅度明显大于整体,则异常区域为障碍物。物流图像视频中的2D投影图像完全由车厢深度结构和本身车厢是否运动决定,可以利用连续帧的一致性检查,自动过滤遮挡和可能存在的异常值,利用该方法可以标记跟踪障碍物的移动情况。
优选的,在获取装载状态初始化后的待深度估计的单目车厢视频图像之前,包括:获取车厢图像帧序列,计算相邻帧之间的相似度;若相似度小于等于第一阈值,则将车厢图像送入模型进行训练以用于判定装载率状态。
具体的,当有待测车辆进入摄像头监控范围后,进行车厢图像采集,即采集车辆图像帧序列。当服务器获取到该待测车辆图像帧序列后,可以计算相邻帧之间的相似度(SSIM)。比较该相似度,如果计算得到的SSIM小于或等于第一阈值,如0.97,则说明书待测车辆发生了位移,可以获取相邻帧的后一帧作为车厢图像。可以理解,如果相似度大于第一阈值,则跳过当前帧,继续计算下一帧与上一帧之间的相似度。在获取到车厢图像后,可以对该车厢图像进行旋转以及色调等处理。
第二方面,本申请实施例提供的单目图像深度估测装载率计算装置的结构示意图,如图4所示,该装置200可以包括:
第一获取模块210,用于获取装载状态初始化后的待深度估计的单目车厢视频图像;
第一判断模块220,用于将车厢视频图像输入到预先建立的模型中判定装载率状态;
第二判断模块230,用于判断满足预设的装载率状态的单目车厢视频图像中的车厢图像是否包含完整的车厢;
处理模块240,用于对包含完整车厢的车厢图像进行预设的图像处理;
确定模块250,用于确定处理后的车厢图像的车框区域的空车厢像素深度总和以及车厢像素深度总和;
第一计算模块260,用于根据空车厢像素深度总和车厢像素深度总和计算出装载率。
优选的,本申请实施例提供的另一实施例的单目图像深度估测装载率识别装置的结构示意图,如图5所示,该装置300可以包括:
第二获取模块310,用于获取训练样本集合,训练样本集合包括至少一帧车厢视频图像;
训练模块320,用于将车厢视频图像进行训练,得到生成具有装载率状态识别的模型。
进一步的,该模型可以为神经网络模型中的BP网络模型,由于人工神经网络(Artificial Neural Network)是一种模拟人脑神经元细胞的网络结构和功能,运用大量的处理部件,由人工方式建立起来的自适应非线性动态系统。它能在一定程度上模仿生物神经系统的智慧和功能,因此广泛应用于信息处理和模式识别等领域。可以采用BP神经网络对装载率的状态进行判定,BP(Back propagation反向传播)网络是神经网络的一个分支,又称误差信号反馈网络,是神经网络中使用最广泛的一类。能够实现从N维到M维的非线性映射,采用梯度下降法实现快速收敛。
BP神经网络采用的是并行网格结构,包括输入层、隐含层和输出层,经作用函数后,再把隐节点的输出信号传递到输出节点,最后给出输出结果。各层次的神经云之间形成全互连接,各层次内的神经元之间没有连接。
优选的,本申请实施例提供的处理模块的结构示意图,如图6所示,该装置240包括:
第一处理单元2401,用于对车厢图像或空车厢图像进行第一层网络深度估计处理。
第二处理单元2401,用于将车厢图像或空车厢图像进行第二层网络光流估计处理。
具体的,在进行第一图像处理和第二图像处理后,由于车厢货物存在遮挡,会造成车厢装载率计算不准确,车厢的装载率状态常见的有几种类型关门、模糊、能见度低等状态,不同的装载率状态下的计算准确度不同。例如,当车辆在装卸口时,由于整体静止,从而障碍物(行人)离开之前的遮挡区域,可以用当前帧源遮挡(当前货物的深度信息)来填补之前被遮挡区域的货物信息,这样可以将货物进行及时的调整和弥补。
可选的,本申请实施例提供的第一处理单元具体用于:检索光流异常区域;若光流异常区域运动幅度明显大于整体,则将异常区域标记为障碍物。
具体的,当存在光流波动时,说明存在障碍物,异常区域划分并进行标记。当选择出障碍物区域以后,剔除掉障碍物区域的像素点,刷新空车厢像素深度总和车厢像素深度总和数据。
应当理解,装置200中记载的诸单元或模块与参考图1描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作和特征同样适用于装置200及其中包含的单元,在此不再赘述。装置200可以预先实现在电子设备的浏览器或其他安全应用中,也可以通过下载等方式而加载到电子设备的浏览器或其安全应用中。装置200中的相应单元可以与电子设备中的单元相互配合以实现本申请实施例的方案。
下面参考图7所示,计算机系统600包括中央如图5所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本公开的实施例,上文参考图1描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,上述计算机程序包含用于执行图1的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,前述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中。
作为另外一方面,本申请还提供一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中前述装置中所包含的计算机可读存储介质;也可以是单独存在,未装配入设备中的计算机可读存储介质。计算机可读存储介质存在有一个或者一个以上程序,前述程度被一个或者一个以上的处理器用来执行描述于本申请的单目图像深度估测装载率识别的方案。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离前述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案
通过以上描述可知:本领域技术人员可以清楚地了解到本申请必须借助硬件后台方式来实现。基于此理解,本申请的技术方案本质上可以说对现有技术做出贡献的部分借助计算机的开发程序形式体现出来,包括若干指令使得一台计算机设备(个人计算,服务器,或者网络设备等)执行本申请实施例的某些部分所述方法。
Claims (6)
1.一种单目图像深度估测装载率计算方法,其特征在于,包括以下步骤:
获取装载状态初始化后的待深度估计的单目车厢视频图像;
将所述车厢视频图像输入到预先建立的模型中判定装载率状态,其中,装载率状态为:关门、模糊、能见度低状态;
判断满足预设装载率状态的所述单目车厢视频图像中的车厢图像是否包含完整的车厢;
对包含完整车厢的所述车厢图像进行预设的图像处理,所述图像处理为,对所述车厢图像进行第一层网络深度估计处理和第二层网络光流估计处理;
确定处理后的车厢图像的车框区域的空车厢像素深度总和以及车厢像素深度总和;
根据所述空车厢像素深度总和车厢像素深度总和计算出装载率;
其中,在获取装载状态初始化后的待深度估计的单目车厢视频图像之前,包括:
获取车厢图像帧序列;
计算相邻帧之间的相似度;
若所述相似度小于等于第一阈值,则将所述车厢图像送入模型进行训练以用于判定装载率状态;
进行连续帧一致性检查,包括:
检索光流异常区域;
若光流异常区域运动幅度明显大于整体,则将异常区域标记为障碍物;
当异常区域标记为障碍物时,用当前帧源遮挡或当前货物的深度信息来填补被遮挡区域的货物信息。
2.根据权利要求1所述的单目图像深度估测装载率计算方法,其特征在于,所述模型是通过以下步骤建立的:
获取训练样本集合,所述训练样本集合包括至少一帧车厢视频图像;
将所述车厢视频图像进行训练,得到生成具有装载率状态识别的模型。
3.根据权利要求1所述的单目图像深度估测装载率计算方法,其特征在于,所述对包含完整车厢的所述车厢图像进行预设的图像处理,包括:
对所述车厢图像或空车厢图像进行第一层网络深度估计处理;
将所述车厢图像或空车厢图像进行第二层网络光流估计处理。
4.一种单目图像深度估测装载率计算装置,其特征在于,包括:
第一获取模块,用于获取装载状态初始化后的待深度估计的单目车厢视频图像;
第一判断模块,用于将所述车厢视频图像输入到预先建立的模型中判定装载率状态,其中,装载率状态为:关门、模糊、能见度低状态;
第二判断模块,用于判断满足预设的装载率状态的所述单目车厢视频图像中的车厢图像是否包含完整的车厢;
处理模块,用于对包含完整车厢的所述车厢图像进行预设的图像处理,所述图像处理为,对所述车厢图像进行第一层网络深度估计处理和第二层网络光流估计处理;
确定模块,用于确定处理后的车厢图像的车框区域的空车厢像素深度总和以及车厢像素深度总和;
第一计算模块,用于根据所述空车厢像素深度总和车厢像素深度总和计算出装载率;
其中,还包括:第三获取模块,用于获取车厢图像帧序列;
第二计算模块,用于计算相邻帧之间的相似度;
第三判断模块,用于若所述相似度小于等于第一阈值,则将所述车厢图像送入模型进行训练以用于判定装载率状态;
所述处理模块,包括:
检索光流异常区域;
若光流异常区域运动幅度明显大于整体,则将异常区域标记为障碍物;
当异常区域标记为障碍物时,用当前帧源遮挡或当前货物的深度信息来填补被遮挡区域的货物信息。
5.根据权利要求4所述的单目图像深度估测装载率计算装置,其特征在于,还包括:
第二获取模块,用于获取训练样本集合,所述训练样本集合包括至少一帧车厢视频图像;
训练模块,用于将所述车厢视频图像进行训练,得到生成具有装载率状态识别的模型。
6.根据权利要求4所述的单目图像深度估测装载率计算装置,其特征在于,所述处理模块,包括:
第一处理单元,用于对所述车厢图像或空车厢图像进行第一层网络深度估计处理;
第二处理单元,用于将所述车厢图像或空车厢图像进行第二层网络光流估计处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910122856.9A CN111583324B (zh) | 2019-02-19 | 2019-02-19 | 单目图像深度估测装载率识别方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910122856.9A CN111583324B (zh) | 2019-02-19 | 2019-02-19 | 单目图像深度估测装载率识别方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111583324A CN111583324A (zh) | 2020-08-25 |
CN111583324B true CN111583324B (zh) | 2023-11-28 |
Family
ID=72124342
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910122856.9A Active CN111583324B (zh) | 2019-02-19 | 2019-02-19 | 单目图像深度估测装载率识别方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111583324B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112911221B (zh) * | 2021-01-15 | 2022-06-21 | 欧冶云商股份有限公司 | 一种基于5g和vr视频的远程实景仓储监管系统 |
CN113640177B (zh) * | 2021-06-29 | 2024-06-14 | 阿里巴巴创新公司 | 货物密度测量方法、系统以及电子设备 |
CN113542392B (zh) * | 2021-07-12 | 2024-05-03 | 安徽大学 | 一种基于无线通信的冷链车运行环境监控方法 |
CN113688750A (zh) * | 2021-08-27 | 2021-11-23 | 上海高德威智能交通系统有限公司 | 车厢状态检测方法及装置 |
CN113888621B (zh) * | 2021-09-29 | 2022-08-26 | 中科海微(北京)科技有限公司 | 装载率确定方法、装置、边缘计算服务器及存储介质 |
CN114022537B (zh) * | 2021-10-29 | 2023-05-05 | 浙江东鼎电子股份有限公司 | 一种用于动态称重区域车辆装载率和偏载率分析方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106599805A (zh) * | 2016-12-01 | 2017-04-26 | 华中科技大学 | 一种基于有监督数据驱动的单目视频深度估计方法 |
WO2018015716A1 (en) * | 2016-07-22 | 2018-01-25 | Imperial College Of Science, Technology And Medicine | Estimating dimensions for an enclosed space using a multi-directional camera |
CN107993239A (zh) * | 2017-12-25 | 2018-05-04 | 北京邮电大学 | 一种计算单目图像的深度次序的方法和装置 |
CN108898044A (zh) * | 2018-04-13 | 2018-11-27 | 顺丰科技有限公司 | 装载率获取方法、装置、系统及存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2184713A1 (en) * | 2008-11-04 | 2010-05-12 | Koninklijke Philips Electronics N.V. | Method and device for generating a depth map |
US9030469B2 (en) * | 2009-11-18 | 2015-05-12 | Industrial Technology Research Institute | Method for generating depth maps from monocular images and systems using the same |
GB2541884A (en) * | 2015-08-28 | 2017-03-08 | Imp College Of Science Tech And Medicine | Mapping a space using a multi-directional camera |
CN107666606B (zh) * | 2016-07-29 | 2019-07-12 | 东南大学 | 双目全景图像获取方法及装置 |
US10318826B2 (en) * | 2016-10-07 | 2019-06-11 | Ford Global Technologies, Llc | Rear obstacle detection and distance estimation |
-
2019
- 2019-02-19 CN CN201910122856.9A patent/CN111583324B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018015716A1 (en) * | 2016-07-22 | 2018-01-25 | Imperial College Of Science, Technology And Medicine | Estimating dimensions for an enclosed space using a multi-directional camera |
CN106599805A (zh) * | 2016-12-01 | 2017-04-26 | 华中科技大学 | 一种基于有监督数据驱动的单目视频深度估计方法 |
CN107993239A (zh) * | 2017-12-25 | 2018-05-04 | 北京邮电大学 | 一种计算单目图像的深度次序的方法和装置 |
CN108898044A (zh) * | 2018-04-13 | 2018-11-27 | 顺丰科技有限公司 | 装载率获取方法、装置、系统及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111583324A (zh) | 2020-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111583324B (zh) | 单目图像深度估测装载率识别方法和装置 | |
CN112132156B (zh) | 多深度特征融合的图像显著性目标检测方法及系统 | |
CN107220603A (zh) | 基于深度学习的车辆检测方法及装置 | |
CN117094914B (zh) | 基于计算机视觉的智慧城市道路监控系统 | |
CN111383257B (zh) | 一种车厢装卸率确定方法和装置 | |
CN109840483B (zh) | 一种滑坡裂缝检测与识别的方法及装置 | |
CN112037177B (zh) | 一种车厢装载率的评估方法和装置以及存储介质 | |
CN112215074A (zh) | 基于无人机视觉的实时目标识别与检测追踪系统及方法 | |
CN110826429A (zh) | 一种基于景区视频的旅游突发事件自动监测的方法及系统 | |
CN111325061B (zh) | 一种基于深度学习的车辆检测算法、设备及存储介质 | |
CN112861690A (zh) | 多方法融合的遥感影像变化检测方法及系统 | |
CN109523502A (zh) | 装卸口状态检测方法、装置、设备及其存储介质 | |
CN111899515A (zh) | 一种基于智慧道路边缘计算网关的车辆检测系统 | |
CN112613434B (zh) | 道路目标检测方法、装置及存储介质 | |
CN109117774A (zh) | 一种基于稀疏编码的多视角视频异常检测方法 | |
CN106056078B (zh) | 一种基于多特征回归式集成学习的人群密度估计方法 | |
CN110930378A (zh) | 基于低数据需求的肺气肿影像处理方法及系统 | |
CN112418149A (zh) | 一种基于深卷积神经网络的异常行为检测方法 | |
CN116052090A (zh) | 图像质量评估方法、模型训练方法、装置、设备及介质 | |
CN114708532A (zh) | 一种监控视频质量评估方法、系统及存储介质 | |
CN115331162A (zh) | 一种跨尺度红外行人检测方法、系统、介质、设备及终端 | |
Shit et al. | An encoder‐decoder based CNN architecture using end to end dehaze and detection network for proper image visualization and detection | |
Su et al. | Regularized fully convolutional networks for RGB-D semantic segmentation | |
Goyal et al. | Recent advances in image dehazing: Formal analysis to automated approaches | |
CN110555437B (zh) | 图像语义分割模型、检测方法、装置、设备及其存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |