CN115410135B - 自主式搬运的航空行李特征感知重构方法、系统及其应用 - Google Patents
自主式搬运的航空行李特征感知重构方法、系统及其应用 Download PDFInfo
- Publication number
- CN115410135B CN115410135B CN202211352620.2A CN202211352620A CN115410135B CN 115410135 B CN115410135 B CN 115410135B CN 202211352620 A CN202211352620 A CN 202211352620A CN 115410135 B CN115410135 B CN 115410135B
- Authority
- CN
- China
- Prior art keywords
- luggage
- baggage
- image
- dimensional
- surface mesh
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/761—Proximity, similarity or dissimilarity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/64—Three-dimensional objects
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明属于航空行李三维重建图像识别技术领域,公开了自主式搬运的航空行李特征感知重构方法、系统及其应用。该方法包括:利用图像采集设备采集行李输送视频,并提取行李输送视频中的行李图像,建立用于行李三维重构的行李图像关键帧组;利用行李图像关键帧组重建完整的行李三维表面网格模型;对重建出的行李三维表面网格模型进行最小包围盒估计,结合像素分辨率与实际尺寸的函数拟合关系计算出行李的三维尺寸。本发明搭建了航空行李特征感知重构系统,实现航空行李尺寸和重量信息一体化检测。本发明具有精确度高、实时性强、鲁棒性好等优点,有效实现了航空行李无人化搬运码放的尺寸和重量检测问题,提高机场运行效率,有较好的应用前景。
Description
技术领域
本发明属于航空行李三维重建图像识别技术领域,尤其涉及自主式搬运的航空行李特征感知重构方法、系统及其应用。
背景技术
随着我国民航业的飞速发展,民航旅客运输量及机场旅客吞吐量不断上升,行李运输量也随之攀升,面对海量的行李,机场行李搬运工人压力巨大,劳动密集,效率低,工人难免承受过劳伤害;相对应的也会出现装卸工人暴力装卸导致乘客行李变形损坏的状况,行李运输问题在航空公司投诉中的占比很高。由此可见,行李无人化自主搬运码放的发展是符合未来四型机场建设发展的必然趋势,为实现航空行李搬运码放的无人化,行李尺寸和重量信息是重要的数据支持,因此对航空行李特征信息感知重构方法的研究尤为重要,精确感知行李尺寸和重量信息可以实现行李搬运无人化,提高行李运输分拣效率,实现无人搬运码放代替繁重的人力劳动,有利于未来航空行李运输过程的无人化和自动化,提高机场运行效率。
常用的行李特征信息感知方法为计算机视觉法,主要有双目立体视觉、深度信息、三维点云等方法:上述方法存在以下问题:(1)双目立体视觉法,通过双目结构采集行李图像信息,经过预处理和立体匹配得到行李三维信息,此方法需要对相机进行精准标定,图像处理算法复杂且效果不佳;(2)深度信息法,利用深度相机采集行李深度图像,经过一系列滤波、分割等图像处理方法得出行李尺寸信息,此方法缺点在于相机成本较高且对图像处理算法的性能要求较高;(3)三维点云法,采集到行李点云数据后经过融合、配准等处理得出行李三维模型,通过坐标信息得出行李的三维尺寸,此方法同样存在相机成本较高的问题,且点云信息存在无序性,易受图像背景信息影响,重建出的行李三维模型表面不够平滑。
通过上述分析,现有技术存在的问题及缺陷为:
(1)现有的计算机视觉法都是通过相机直接采集行李图像,存在相机畸变、背景干扰、镜头抖动等负面因素导致采集到的行李图像模糊的问题,进而导致提取得到的行李尺寸数据和重量数据与实际相差较大,并且静态采集行李图像对机场整体的行李处理效率影响较大。
(2)航空行李种类繁多、形状各异,现有计算机视觉方法对行李图像特征提取能力不足,行李尺寸特征感知以及识别精确度不高。
解决以上问题及缺陷的难度为:通过相机直接采集行李图像难免出现拍摄模糊导致行李尺寸数据识别误差较大的问题,静态采集行李图像会大幅降低机场整体的行李处理效率,且现有的行李图像处理算法鲁棒性较差,面对种类繁多、各式各样的行李不能达到较高的行李尺寸识别精度。
解决以上问题及缺陷的意义为:本发明直接采集行李输送视频,提取行李图像关键帧组,确保图像清晰度较高,改进的三维表面网格重建算法,提取行李图像特征能力增强,得到精确度较高的行李尺寸数据,为机场行李搬运、分拣和码放工作提供了准确有价值的数据参考,提高机场运行效率。
发明内容
为克服相关技术中存在的问题,本发明公开实施例提供了自主式搬运的航空行李特征感知重构方法、系统及其应用。
所述技术方案如下:一种面向自主式搬运的航空行李特征感知重构方法包括以下步骤:
S1,利用图像采集设备采集行李输送视频,并提取所述行李输送视频中的行李图像,建立用于行李三维重构的行李图像关键帧组;所述图像采集设备包括相机;
S2,利用行李图像关键帧组重建完整的行李三维表面网格模型;
S3,对重建出的行李三维表面网格模型进行最小包围盒估计,结合像素分辨率与实际尺寸的函数拟合关系计算出行李的三维尺寸。
在一实施例中,在步骤S1中,利用改进的固定采样关键帧提取算法提取视频中的行李图像关键帧组;
所述改进的固定采样关键帧提取算法具体包括以下步骤:
(1)设置固定的时间阈值t,以时间阈值t作为间隔选取出一组视频帧序列,令每组序列的第一个视频帧作为关键帧;
(2)利用图像差异哈希算法对提取出的关键帧进行视频帧相似度计算,对相似度过大的视频帧进行去除;
(3)利用Tenengrad梯度评价函数对经过相似度计算筛选出的候选帧进行清晰度评价,筛选出最终的行李图像关键帧组,梯度算子公式如下:
Gx=g(x-1,y+1)+g(x+1,y+1)+2g(x,y+1)-g(x-1,y-1)-g(x+1,y-1)-2g(x,y-1)
Gy=g(x+1,y-1)+g(x+1,y+1)+2g(x+1,y)-g(x-1,y-1)-g(x-1,y+1)-2g(x-1,y)
Gx与Gy对应的算子矩阵分别为:
利用Tenengrad梯度函数对二维图像清晰度计算定义:
公式中,Gx与Gy是在横向与纵向两个方向上的卷积,D(f)表示的是该图像的梯度值,G(x,y)表示的是在二维图像中坐标(x,y)处像素点的Sobel算子的卷积,T表示的是给定的卷积阈值,x和y分别表示二维图像中的坐标,g为系数。
在一实施例中,在步骤S2中,通过改进的三维表面网格重建算法,利用行李图像关键帧组重建完整的行李三维表面网格模型;
所述改进的三维表面网格重建算法具体包括:
(i)重建算法模型采用编码器-解码器体系结构形式,编码器部分采用残差神经网络结构,解码器部分由多层感知器和网格细分层两个形变模块组成;
(ii)在残差神经网络ResNet的每个卷积层连接处加入组归一化GN和ReLU激活函数,将改进后的残差网络作为特征提取网络模块;
(iii)多层感知器将前一阶段的输出作为输入并输出形变后的顶点坐标,网格细分层对表面网格的三角形面片作剖分,使每个三角形边长减半以期待在后续的多层感知器形变过程中得到对目标物体表面流形更精确的近似;
(iv)在训练过程中,在每个多层感知器形变阶段之后对形变网格采样以计算优化的目标函数,最小化生成的表面网格M与Ground truth物体表面S之间的距离;生成的表面网格被定义为M=(V,E,T),其中V∈R3是表面网格的顶点的集合,E是连接相邻网格顶点的边的集合,T是由相连接的边围成的三角形面片的集合,训练目标函数如下:
Lall=Lc+λeLe+λNLN+λsmLsm+λlapLlap
其中Lc为倒角距离,Le为边长约束,LN为法线约束,Lsm为平滑约束,Llap为拉普拉斯约束,Lall被作用于模型的最终输出以及每一级形变模块的中间结果;
其中,Lc倒角距离表征重建出的行李表面网格与原始行李模型两者间面到面的距离,Le边长约束用以最小化行李表面网格的三角形面片的面积,LN法线约束用于约束行李表面网格与原始行李模型的法线一致性,Lsm平滑约束使得行李表面网格中相邻的面片夹角趋于平缓,Llap拉普拉斯约束能够最小化重建出的行李表面网格平均曲率;λe为边长约束系数;λN法线约束系数;λsm为平滑约束系数;λlap为拉普拉斯约束系数;R为表面网格的顶点;
(v)结合倒角距离和EMD两种评估指标评估改进的三维表面网格重建算法的性能;
倒角距离对生成的表面网格以及Ground truth表面采样得到的两个点集之间的最近邻距离,被定义如下:
其中φ:S1→S2为根据两个点集之间最小距离和构建的双射,S1和S2均表示点集,x'表示点集S1中的任意一点,φ为双射,φ(x')为在x'点时的双射。
在一实施例中,在步骤S3中,对重建出的行李三维表面网格模型进行最小包围盒估计具体包括:
利用PCA主元分析法获得行李网格模型的三个主方向,获取质心,计算协方差,获得协方差矩阵,求取协方差矩阵的特征值和特征向量,特征向量即为主方向;
利用获得的主方向和质心,将输入网格转换至原点网格,且主方向与坐标系方向重回,建立变换到原点的网格的包围盒;
给输入网格模型设置主方向和包围盒,通过输入网格到原点网格变换的逆变换实现。
在一实施例中,在步骤S3中,计算行李的三维尺寸具体包括:
利用图像采集设备采集不同高度对应每个像素表示的实际大小,形成不同高度与像素分辨率的对照表,拟合出采集高度与每个像素实际尺寸大小的函数关系,根据传送带上图像采集设备相对于皮带的安装高度,以及结合行李网格模型最小包围盒长宽高的像素点数,计算出行李的实际三维尺寸。
在一实施例中,在步骤S3中,还同时进行航空行李尺重量信息检测。
本发明的另一目的在于提供一种面向自主式搬运的航空行李特征感知重构系统包括:
行李图像采集模块,利用安装在传送带上方的相机采集行李输送视频帧序列,对行李视频进行关键帧筛选,得到最终的行李图像关键帧组;
行李尺寸感知模块,利用改进的三维表面网格重建算法重构出行李三维表面网格模型,对网格模型进行最小包围盒估计,计算出行李三维尺寸;
行李重量感知模块,利用安装在传送带皮带下方的称重传感器得到行李的重量数据。
本发明的另一目的在于提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行所述的面向自主式搬运的航空行李特征感知重构方法。
本发明的另一目的在于提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行所述的面向自主式搬运的航空行李特征感知重构方法。
本发明的另一目的在于提供一种信息数据处理终端,所述信息数据处理终端用于实现于电子装置上执行时,提供用户输入接口以实施所述的面向自主式搬运的航空行李特征感知重构方法。
结合上述的所有技术方案,本发明所具备的优点及积极效果为:
第一、针对上述现有技术存在的技术问题以及解决该问题的难度,紧密结合本发明的所要保护的技术方案以及研发过程中结果和数据等,详细、深刻地分析本发明技术方案如何解决的技术问题,解决问题之后带来的一些具备创造性的技术效果。具体描述如下:
(1)本发明通过采集行李输送视频,提取视频帧中相似度低、清晰度高的图像形成行李图像关键帧组,规避了直接采集行李图像出现模糊、畸变等问题影响后续的行李模型三维重构;
(2)本发明利用网格数据形式重构行李三维模型,避免了点云数据的无序性、易受噪音影响的问题,面对表面凹凸不平的异形行李结构,能够重构出表面更平滑、细节更丰富的行李三维模型;
(3)本发明改进了三维表面网格重建算法,在残差神经网络中卷积层连接处加入组归一化GN和ReLU激活函数,减少上采样层与原特征层融合带来的信息混淆,提升了算法的行李图像特征提取能力;
(4)本发明在重建算法中加入多层感知器(MLP)和网格细分层(SubdivisionLayer)两个形变模块形成级联结构,每个形变模块都采用了多层感知器(MLP)去实现网格形变,而每个形变后的表面网格都经过网格细分层进一步增加面片与顶点的个数以便于在后续的形变过程中捕捉更丰富的几何细节,极大地改善重建结果的可视化效果。
(5)本发明改进了三维表面网格重建算法,在残差神经网络中卷积层连接处加入组归一化GN和ReLU激活函数,减少上采样层与原特征层融合带来的信息混淆,提升了算法的行李图像特征提取能力;
由于每件行李经采集筛选形成的图像关键帧组中具体的图片数不相同,而在训练时每次提取的样本数不能改变,会出现训练效果欠佳,导致不同的行李重建效果参差不齐的问题,组归一化GN利用将通道分组并在每个组中将特征归一化的方法,规避了行李图像批量样本数不确定的问题;
为了重建出平滑完整的行李三维模型,在训练模型时引入ReLU激活函数,ReLU是非线性函数,更容易逼近每一层的输出特征形成的函数关系,并且ReLU会使得某些神经元输出为0,减少参数之间的依存关系,在经过若干层的特征提取后,减缓出现过拟合的问题,提高模型收敛速度;
(6)本发明在重建算法中加入多层感知器(MLP)和网格细分层(SubdivisionLayer)两个形变模块形成级联结构,每个形变模块都采用了多层感知器(MLP)去实现网格形变,而每个形变后的表面网格都经过网格细分层进一步增加面片与顶点的个数以便于在后续的形变过程中捕捉更丰富的几何细节,极大地改善重建结果的可视化效果;
多层感知器将前一阶段的输出(表面网格顶点坐标与从图片提取出的特征的组合)作为输入并输出形变后的顶点坐标,网格细分层对表面网格的三角形面片作剖分,使其每个三角形边长减半以期待在后续的多层感知器(MLP)形变过程中得到对目标物体表面流形更精确的近似;
考虑到行李样式纷繁复杂,其表面形状多为局部平滑,故引入网格细分层对表面网格作三角面片剖分,使得重建出的行李三维模型更贴近原始模型表面曲度,利于重建出表面特征鲜明的行李模型,可视化效果更好。
第二、把技术方案看作一个整体或者从产品的角度,本发明所要保护的技术方案具备的技术效果和优点,具体描述如下:
本发明提供的面向自主式搬运的航空行李特征感知重构方法包括:采集行李在传送带上运输过程的视频序列,改进固定采样关键帧算法提取采集到的行李视频的关键帧图像,对提取到的行李帧图像进行相似度计算和清晰度评价,筛选出相似度较低、清晰度较高的行李图像,形成行李图像关键帧组;改进的三维表面网格重建算法,利用筛选出的行李图像关键帧组重建出行李三维表面网格模型,经过最小包围盒估计以及像素分辨率与实际尺寸的函数拟合关系得出行李的三维尺寸。结合行李三维估计和传送带称重模块,搭建航空行李特征感知重构系统,进行航空行李尺寸和重量特征的感知识别。本发明具有精确度高、实时性强、鲁棒性好等优点,有效实现了航空行李无人化搬运码放的尺寸和重量检测问题,提高机场运行效率,有较好的应用前景。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是本发明实施例提供的面向自主式搬运的航空行李特征感知重构原理流程图;
图2是本发明实施例提供的面向自主式搬运的航空行李特征感知重构方法流程图;
图3是本发明实施例提供的行李尺寸检测结果图;
图4是本发明实施例提供的面向自主式搬运的航空行李特征感知重构系统示意图;
图中:1、行李图像采集模块;2、行李尺寸感知模块;3、行李重量感知模块。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本发明。但是本发明能够以很多不同于在此描述的其他方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似改进,因此本发明不受下面公开的具体实施的限制。
一、解释说明实施例:
如图1所示,本发明实施例提供一种面向自主式搬运的航空行李特征感知重构方法包括:
利用相机采集行李输送视频,提取视频中相似度较低、清晰度较高的行李图像,形成用于行李三维重构的行李图像关键帧组;
再对三维表面网格重建算法进行改进,通过添加多层感知器和网格细分层两个形变模块,提高重建算法对行李图像特征的感知能力,对重构出的行李三维网格模型进行最小包围盒估计并结合像素分辨率与采集高度的函数拟合关系得出行李三维尺寸数据;
最后将行李图像采集模块1、行李尺寸感知模块2和行李重量感知模块3进行整合,搭建航空行李特征感知重构系统,实现航空行李尺寸和重量信息一体化检测。
实施例1
如图2所示,本发明实施例提供一种面向自主式搬运的航空行李特征感知重构方法包括以下步骤:
S101,利用安装在行李运输传送带上方的相机采集行李输送视频;
S102,改进的固定采样关键帧提取算法,提取视频中的行李图像关键帧组;
S103,改进的三维表面网格重建算法,利用行李图像关键帧组重建完整的行李三维表面网格模型;
S104,对重建出的行李三维表面网格模型进行最小包围盒估计,结合像素分辨率与实际尺寸的函数拟合关系计算出行李的三维尺寸。
如图2所示,本发明实施例提供的面向自主式搬运的航空行李特征感知重构方法原理。
实施例2
基于本发明实施例1记载的面向自主式搬运的航空行李特征感知重构方法,进一步地,所述步骤S101采集行李输送视频具体包括,利用安装在行李运输传送带上方的相机拍摄采集行李在传送带上运输过程的视频序列。
实施例3
基于本发明实施例1记载的面向自主式搬运的航空行李特征感知重构方法,进一步地,所述步骤S102中,对于机场实际进行行李输送时,为保证行李处理效率,行李的运输速度较快,若采集行李静态图像进行三维重建需要花费较长时间,降低了行李处理系统的工作效率,而直接采集行李输送视频,再通过改进的固定采样关键帧提取算法得到相似度较低、清晰度较高的行李图像关键帧组,便于重建行李三维模型的同时不影响机场整体行李运送效率。
改进的固定采样关键帧提取算法具体包括以下步骤:
(1)设置固定的时间阈值t,以时间阈值t作为间隔选取出一组视频帧序列,令每组序列的第一个视频帧作为关键帧;
(2)利用图像差异哈希算法对提取出的关键帧进行视频帧相似度计算,对相似度过大的视频帧进行去除;
(3)利用Tenengrad梯度评价函数对经过相似度计算筛选出的候选帧进行清晰度评价,筛选出最终的行李图像关键帧组,梯度算子公式如下:
Gx=g(x-1,y+1)+g(x+1,y+1)+2g(x,y+1)-g(x-1,y-1)-g(x+1,y-1)-2g(x,y-1) (1)
Gy=g(x+1,y-1)+g(x+1,y+1)+2g(x+1,y)-g(x-1,y-1)-g(x-1,y+1)-2g(x-1,y) (2)
Gx与Gy对应的算子矩阵分别为:
利用Tenengrad梯度函数对二维图像清晰度计算定义:
D(f)=∑y∑x|G(x,y)|,(G(x,y)>T) (5)
公式中,Gx与Gy是在横向与纵向两个方向上的卷积,D(f)表示的是该图像的梯度值,G(x,y)表示的是在二维图像中坐标(x,y)处像素点的Sobel算子的卷积,T表示的是给定的卷积阈值,x和y分别表示二维图像中的坐标,g为系数。
实施例4
基于本发明实施例1记载的面向自主式搬运的航空行李特征感知重构方法,进一步地,所述步骤S103改进的三维表面网格重建算法具体包括:
(i)重建算法模型采用编码器-解码器体系结构形式,编码器部分采用残差神经网络结构(ResNet),解码器部分由多层感知器(MLP)和网格细分层(Subdivision Layer)两个形变模块组成;
(ii)在残差神经网络ResNet的每个卷积层连接处加入组归一化GN和ReLU激活函数,将改进后的残差网络作为特征提取网络模块;
示例性的,由于每件行李经采集筛选形成的图像关键帧组中具体的图片数不相同,而在训练时每次提取的样本数不能改变,会出现训练效果欠佳,导致不同的行李重建效果参差不齐的问题,组归一化GN利用将通道分组并在每个组中将特征归一化的方法,规避了行李图像批量样本数不确定的问题;
为了重建出平滑完整的行李三维模型,在训练模型时引入ReLU激活函数,ReLU是非线性函数,更容易逼近每一层的输出特征形成的函数关系,并且ReLU会使得某些神经元输出为0,减少参数之间的依存关系,在经过若干层的特征提取后,减缓出现过拟合的问题,提高模型收敛速度。
(iii)多层感知器将前一阶段的输出(表面网格顶点坐标与从图片提取出的特征的组合)作为输入并输出形变后的顶点坐标,网格细分层对表面网格的三角形面片作剖分,使其每个三角形边长减半以期待在后续的多层感知器(MLP)形变过程中得到对目标物体表面流形更精确的近似;
示例性的,对于行李样式纷繁复杂,其表面形状多为局部平滑,故引入网格细分层对表面网格作三角面片剖分,使得重建出的行李三维模型更贴近原始模型表面曲度,利于重建出表面特征鲜明的行李模型,可视化效果更好;
(iv)在训练过程中,在每个多层感知器(MLP)形变阶段之后对形变网格采样以计算优化的目标函数,最小化生成的表面网格M与Ground truth物体表面S之间的距离。生成的表面网格被定义为M=(V,E,T),其中V∈R3是表面网格的顶点的集合,E是连接相邻网格顶点的边的集合,T是由相连接的边围成的三角形面片的集合,训练目标函数如下:
Lall=Lc+λeLe+λNLN+λsnLsm+λlapLlap (6)
其中Lc为倒角距离,Le为边长约束,LN为法线约束,Lsm为平滑约束,Llap为拉普拉斯约束,Lall被作用于模型的最终输出以及每一级形变模块的中间结果;
Lc倒角距离表征重建出的行李表面网格与原始行李模型两者间面到面的距离,Le边长约束用以最小化行李表面网格的三角形面片的面积,LN法线约束用于约束行李表面网格与原始行李模型的法线一致性,Lsm平滑约束使得行李表面网格中相邻的面片夹角尽可能趋于平缓,Llap拉普拉斯约束能够最小化重建出的行李表面网格平均曲率;λe为边长约束系数;λN法线约束系数;λsm为平滑约束系数;λlap为拉普拉斯约束系数;R为表面网格的顶点;
边长约束项Le,通过惩罚生成的表面网格出现的过长边,从而一定程度上避免生成具有较大面积的三角面片,定义如下:
其中p为生成的表面网格M顶点点集V中的任意一点,k为顶点点集V中p的近邻点。
法线约束LN,对于生成的表面网格M顶点点集V中的任意一点,在计算倒角距离时已经得知它在Ground truth中的最近邻点。而法线约束项要求生成的表面网格顶点与其近邻点的连线垂直于它在Ground truth中最近邻点的法线方向,即为:
其中k为顶点p的顶点点集V中p的近邻点,q为Ground truth点云中p的最近邻点,nq为最近邻点q的Ground truth法线值。法线约束项LN利用了Ground truth法线的额外信息,从而保证生成的表面网格M与Ground truth表面法线的一致性,进一步改善最终结果的可视化效果。
平滑约束Lsm,自然界中的大多数物体往往都具有局部平滑的表面,然而对倒角距离的优化并不能保证生成的表面网格的平滑性,因此额外引入了平滑约束项用于确保生成的表面网格中相邻的三角形面片的夹角尽可能趋于平缓,该约束项被定义为:
其中E为生成的表面网格中所有边的集合,θi代表了共享第i条边的两个三角面片之间的夹角。本发明采用的平滑约束项作用于邻接面片的夹角,这使得生成的表面网格会倾向于向具有较高曲率的表面附近分配更多的顶点以确保生成的表面网格的平滑性。
拉普拉斯约束Llap,采用拉普拉斯约束项去鼓励在形变后的表面网格以及未形变的表面网格上定义的离散拉普拉斯算子结果相近。拉普拉斯约束项可以最小化生成的表面网格的平均曲率,从而防止表面网格的过度形变以及自我交叠,即为:
Llap=||LV||2-||LV0||2 (11)
其中L为拉普拉斯-贝尔特拉米算子,V0对应的未形变的表面网格。
(v)为了评估改进的三维表面网格重建算法的性能,分析倒角距离和EMD两种评估指标。
倒角距离(Chamfer Distance,CD),它同时也是训练目标函数之一。倒角距离衡量的是对生成的表面网格以及Ground truth表面采样得到的两个点集之间的最近邻距离,其被定义如下:
其中上述步骤(iv)是行李三维表面网格重建算法的训练函数各个组成部分的解释;步骤(v)是对上述算法性能指标的各项评估。
实施例5
基于本发明实施例1记载的面向自主式搬运的航空行李特征感知重构方法,进一步地,所述步骤四对重建出的行李三维表面网格模型进行最小包围盒估计具体包括:
首先利用PCA主元分析法获得行李网格模型的三个主方向,获取质心,计算协方差,获得协方差矩阵,求取协方差矩阵的特征值和特征向量,特征向量即为主方向;然后利用获得的主方向和质心,将输入网格转换至原点网格,且主方向与坐标系方向重回,建立变换到原点的网格的包围盒。最后给输入网格模型设置主方向和包围盒,通过输入网格到原点网格变换的逆变换实现。
实施例6
基于本发明实施例1记载的面向自主式搬运的航空行李特征感知重构方法,进一步地,所述步骤S104计算行李的三维尺寸具体包括:
由于相机在不同高度下采集物体图像时每个像素表示的实际大小不同,利用像素大小标定图,在A4纸上打印固定大小的棋盘格作为参照物进行相机标定,采集不同高度对应每个像素表示的实际大小,形成相机不同高度与像素分辨率的对照表,拟合出采集高度与每个像素实际尺寸大小的函数关系,最后根据传送带上相机相对于皮带的安装高度,以及结合行李网格模型最小包围盒长宽高的像素点数,计算出行李的实际三维尺寸。
实施例7
基于本发明实施例1记载的面向自主式搬运的航空行李特征感知重构方法,进一步地,步骤S104中,对重建出的行李三维表面网格模型进行最小包围盒估计,结合像素分辨率与实际尺寸的函数拟合关系计算出行李的三维尺寸。
三维表面网格重建算法改进完成后,结合最小包围盒估计和行李尺寸计算函数,为检验改进算法在行李三维尺寸感知识别中的效果,选取100个不同的行李进行测试,测试结果与误差如图3以及如下表1所示:
表1算法测试结果与误差
由上表可以看出,100组行李的三维尺寸检测总误差都在2cm范围之内,本发明提出的改进的三维表面网格重建算法能够较好的重建出平滑完整的行李三维模型,行李三维尺寸识别精确度较高,有效实现了航空行李的适运性检测问题,并且能够为无人化搬运码放提供可靠的数据参考。
实施例8
如图4所示,本发明实施例提供一种面向自主式搬运的航空行李特征感知重构系统,包括:
行李图像采集模块1,利用安装在传送带上方的相机采集行李输送视频帧序列,对行李视频进行关键帧筛选,得到最终的行李图像关键帧组;
行李尺寸感知模块2,利用改进的三维表面网格重建算法重构出行李三维表面网格模型,对网格模型进行最小包围盒估计,计算出行李三维尺寸;
行李重量感知模块3,利用安装在传送带皮带下方的称重传感器得到行李的重量数据。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
上述装置/单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
二、应用实施例:
本发明实施例还提供了一种计算机设备,该计算机设备包括:至少一个处理器、存储器以及存储在所述存储器中并可在所述至少一个处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任意各个方法实施例中的步骤。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时可实现上述各个方法实施例中的步骤。
本发明实施例还提供了一种信息数据处理终端,所述信息数据处理终端用于实现于电子装置上执行时,提供用户输入接口以实施如上述各方法实施例中的步骤,所述信息数据处理终端不限于手机、电脑、交换机。
本发明实施例还提供了一种服务器,所述服务器用于实现于电子装置上执行时,提供用户输入接口以实施如上述各方法实施例中的步骤。
本发明实施例提供了一种计算机程序产品,当计算机程序产品在电子设备上运行时,使得电子设备执行时可实现上述各个方法实施例中的步骤。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括:能够将计算机程序代码携带到拍照装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(RandomAccessMemory,RAM)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。
以上所述,仅为本发明较优的具体的实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。
Claims (9)
1.一种面向自主式搬运的航空行李特征感知重构方法,其特征在于,该方法包括以下步骤:
S1,利用图像采集设备采集行李输送视频,并提取行李输送视频中的行李图像,建立用于行李三维重构的行李图像关键帧组;
S2,利用行李图像关键帧组重建完整的行李三维表面网格模型;
S3,对重建出的行李三维表面网格模型进行最小包围盒估计,结合像素分辨率与实际尺寸的函数拟合关系计算出行李的三维尺寸;
在步骤S2中,利用行李图像关键帧组重建完整的行李三维表面网格模型包括:
(i)重建算法模型采用编码器-解码器体系结构形式,编码器部分采用残差神经网络结构,解码器部分由多层感知器和网格细分层两个形变模块组成;
(ii)在残差神经网络ResNet的每个卷积层连接处加入组归一化GN和ReLU激活函数,将改进后的残差网络作为特征提取网络模块;
(iii)多层感知器将前一阶段的输出作为输入并输出形变后的顶点坐标,网格细分层对表面网格的三角形面片作剖分,使每个三角形边长减半以期待在后续的多层感知器形变过程中得到对目标物体表面流形更精确的近似;
(iv)在训练过程中,在每个多层感知器形变阶段之后对形变网格采样以计算优化的目标函数,最小化生成的表面网格M与Ground truth物体表面S之间的距离;生成的表面网格被定义为M=(V,E,T),其中V∈R3是表面网格的顶点的集合,E是连接相邻网格顶点的边的集合,T是由相连接的边围成的三角形面片的集合,训练目标函数如下:
其中L c 为倒角距离,L e 为边长约束,L N 为法线约束,L sm 为平滑约束,L lap 为拉普拉斯约束,L all 被作用于模型的最终输出以及每一级形变模块的中间结果;L c 倒角距离表征重建出的行李表面网格与原始行李模型两者间面到面的距离,L e 边长约束用以最小化行李表面网格的三角形面片的面积,L N 法线约束用于约束行李表面网格与原始行李模型的法线一致性,L sm 平滑约束使得行李表面网格中相邻的面片夹角趋于平缓,L lap 拉普拉斯约束能够最小化重建出的行李表面网格平均曲率;为边长约束系数;法线约束系数;为平滑约束系数;为拉普拉斯约束系数;R为表面网格的顶点;
(v)结合倒角距离和EMD两种评估指标评估改进的三维表面网格重建算法的性能;
倒角距离对生成的表面网格以及Ground truth表面采样得到的两个点集之间的最近邻距离,被定义如下:
其中,p和q均为顶点,表示点云,表示表面网格;
EMD表征两个对象相似性,定义在两个点数相同的点集S 1 ,S 2 ⊆R 3 之间的EMD如下:
其中ϕ:S 1 ⟶S 2 为根据两个点集之间最小距离和构建的双射,S 1 和S 2 均表示点集,表示点集S 1 中的任意一点,为双射,为在点时的双射。
2.根据权利要求1所述的面向自主式搬运的航空行李特征感知重构方法,其特征在于,在步骤S1中,建立用于行李三维重构的行李图像关键帧组包括:
(1)设置固定的时间阈值t,以时间阈值t作为间隔选取出一组视频帧序列,令每组序列的第一个视频帧作为关键帧;
(2)利用图像差异哈希算法对提取出的关键帧进行视频帧相似度计算,对相似度过大的视频帧进行去除;
(3)利用Tenengrad梯度评价函数对经过相似度计算筛选出的候选帧进行清晰度评价,筛选出最终的行李图像关键帧组,梯度算子公式如下:
G x 与G y 对应的算子矩阵分别为:
利用Tenengrad梯度函数对二维图像清晰度计算定义:
公式中,G x 与G y 是在横向与纵向两个方向上的卷积,D(f)表示的是该图像的梯度值,G(x,y)表示的是在二维图像中坐标(x,y)处像素点的Sobel算子的卷积,T表示的是给定的卷积阈值,x和y分别表示二维图像中的坐标,g为系数。
3.根据权利要求1所述的面向自主式搬运的航空行李特征感知重构方法,其特征在于,在步骤S3中,对重建出的行李三维表面网格模型进行最小包围盒估计包括:
利用PCA主元分析法获得行李网格模型的三个主方向,获取质心,计算协方差,获得协方差矩阵,求取协方差矩阵的特征值和特征向量,特征向量即为主方向;
利用获得的主方向和质心,将输入网格转换至原点网格,且主方向与坐标系方向重回,建立变换到原点的网格的包围盒。
4.根据权利要求1所述的面向自主式搬运的航空行李特征感知重构方法,其特征在于,在步骤S3中,结合像素分辨率与实际尺寸的函数拟合关系计算出行李的三维尺寸包括:
利用图像采集设备采集不同高度对应每个像素表示的实际大小,形成不同高度与像素分辨率的对照表,拟合出采集高度与每个像素实际尺寸大小的函数关系,根据传送带上图像采集设备相对于皮带的安装高度,以及结合行李网格模型最小包围盒长宽高的像素点数,计算出行李的实际三维尺寸。
5.根据权利要求1所述的面向自主式搬运的航空行李特征感知重构方法,其特征在于,在步骤S3中,还同时进行航空行李重量信息检测。
6.一种实现如权利要求1-5任意一项所述面向自主式搬运的航空行李特征感知重构方法的系统,其特征在于,该面向自主式搬运的航空行李特征感知重构系统包括:
行李图像采集模块(1),利用安装在传送带上方的相机采集行李输送视频帧序列,对行李视频进行关键帧筛选,得到最终的行李图像关键帧组;
行李尺寸感知模块(2),利用改进的三维表面网格重建算法重构出行李三维表面网格模型,对网格模型进行最小包围盒估计,计算出行李三维尺寸;
行李重量感知模块(3),利用安装在传送带皮带下方的称重传感器得到行李的重量数据。
7.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1-5任意一项所述的面向自主式搬运的航空行李特征感知重构方法。
8.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行权利要求1-5任意一项所述的面向自主式搬运的航空行李特征感知重构方法。
9.一种信息数据处理终端,其特征在于,所述信息数据处理终端在电子装置上执行时,提供用户输入接口以实施权利要求1-5任意一项所述的面向自主式搬运的航空行李特征感知重构方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211352620.2A CN115410135B (zh) | 2022-11-01 | 2022-11-01 | 自主式搬运的航空行李特征感知重构方法、系统及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211352620.2A CN115410135B (zh) | 2022-11-01 | 2022-11-01 | 自主式搬运的航空行李特征感知重构方法、系统及其应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115410135A CN115410135A (zh) | 2022-11-29 |
CN115410135B true CN115410135B (zh) | 2023-04-07 |
Family
ID=84167014
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211352620.2A Active CN115410135B (zh) | 2022-11-01 | 2022-11-01 | 自主式搬运的航空行李特征感知重构方法、系统及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115410135B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116543343B (zh) * | 2023-07-06 | 2023-09-12 | 民航成都物流技术有限公司 | 一种滞留行李检测方法、装置、计算机设备和存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108416840A (zh) * | 2018-03-14 | 2018-08-17 | 大连理工大学 | 一种基于单目相机的三维场景稠密重建方法 |
CN110174056A (zh) * | 2019-06-18 | 2019-08-27 | 上海商米科技集团股份有限公司 | 一种物体体积测量方法、装置及移动终端 |
CN111524193A (zh) * | 2020-04-17 | 2020-08-11 | 西安交通大学 | 一种物体二维尺寸的测量方法及测量装置 |
CN111583390A (zh) * | 2020-04-28 | 2020-08-25 | 西安交通大学 | 基于深度语义融合的卷积神经网络的三维语义图重建方法 |
CN111899258A (zh) * | 2020-08-20 | 2020-11-06 | 广东机场白云信息科技有限公司 | 自助托运行李规格检测方法 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104637064B (zh) * | 2015-02-28 | 2017-09-12 | 中国科学院光电技术研究所 | 一种基于边缘强度权重的离焦模糊图像清晰度检测方法 |
CN111986251A (zh) * | 2019-05-22 | 2020-11-24 | 顺丰科技有限公司 | 物体体积测量方法、装置、测量设备及存储介质 |
CN111340873B (zh) * | 2020-02-28 | 2023-05-23 | 广东工业大学 | 一种多视角图像的物体最小外包络尺寸测算方法 |
CN113439909A (zh) * | 2020-03-24 | 2021-09-28 | 阿里巴巴集团控股有限公司 | 一种对象的三维尺寸测量方法和移动终端 |
CN113808006B (zh) * | 2021-09-01 | 2023-05-23 | 南京信息工程大学 | 一种基于二维图像重建三维网格模型的方法及装置 |
CN113469152B (zh) * | 2021-09-03 | 2022-02-11 | 腾讯科技(深圳)有限公司 | 相似视频检测方法及装置 |
CN114373060B (zh) * | 2022-03-23 | 2022-06-28 | 超节点创新科技(深圳)有限公司 | 行李模型生成方法与设备 |
-
2022
- 2022-11-01 CN CN202211352620.2A patent/CN115410135B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108416840A (zh) * | 2018-03-14 | 2018-08-17 | 大连理工大学 | 一种基于单目相机的三维场景稠密重建方法 |
CN110174056A (zh) * | 2019-06-18 | 2019-08-27 | 上海商米科技集团股份有限公司 | 一种物体体积测量方法、装置及移动终端 |
CN111524193A (zh) * | 2020-04-17 | 2020-08-11 | 西安交通大学 | 一种物体二维尺寸的测量方法及测量装置 |
CN111583390A (zh) * | 2020-04-28 | 2020-08-25 | 西安交通大学 | 基于深度语义融合的卷积神经网络的三维语义图重建方法 |
CN111899258A (zh) * | 2020-08-20 | 2020-11-06 | 广东机场白云信息科技有限公司 | 自助托运行李规格检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN115410135A (zh) | 2022-11-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Berman et al. | Air-light estimation using haze-lines | |
US10115035B2 (en) | Vision system and analytical method for planar surface segmentation | |
Che et al. | Multi-scan segmentation of terrestrial laser scanning data based on normal variation analysis | |
CN109740588B (zh) | 基于弱监督和深度响应重分配的x光图片违禁品定位方法 | |
US7747106B2 (en) | Method and system for filtering, registering, and matching 2.5D normal maps | |
CN110147714B (zh) | 基于无人机的煤矿采空区裂缝识别方法及检测系统 | |
US11567207B2 (en) | Apparatus and method for efficient point cloud feature extraction and segmentation framework | |
US20230206594A1 (en) | System and method for correspondence map determination | |
AU2020272936B2 (en) | Methods and systems for crack detection using a fully convolutional network | |
CN115410135B (zh) | 自主式搬运的航空行李特征感知重构方法、系统及其应用 | |
CN115294117A (zh) | Led灯珠的缺陷检测方法及相关装置 | |
Paudel et al. | Robust and optimal sum-of-squares-based point-to-plane registration of image sets and structured scenes | |
CN111814739B (zh) | 快递包裹体积的检测方法、装置、设备及存储介质 | |
Daghigh et al. | A critical review of discontinuity plane extraction from 3D point cloud data of rock mass surfaces | |
CN112946679A (zh) | 一种基于人工智能的无人机测绘果冻效应检测方法及系统 | |
Kochi et al. | A 3D shape-measuring system for assessing strawberry fruits | |
CN111160450A (zh) | 一种基于神经网络的果蔬称重方法及储存介质、装置 | |
CN113963054A (zh) | 一种基于双目相机的智能快递箱尺寸测量方法及系统 | |
CN115294035B (zh) | 亮点定位方法、亮点定位装置、电子设备及存储介质 | |
CN117218633A (zh) | 一种物品检测方法、装置、设备及存储介质 | |
CN111179218A (zh) | 传送带物料检测方法、装置、存储介质及终端设备 | |
CN109961028A (zh) | 基于三维块匹配和全连接条件随机场的sar检测方法 | |
Wang et al. | An unsupervised automatic measurement of wheat spike dimensions in dense 3D point clouds for field application | |
Zhu et al. | A filtering strategy for interest point detecting to improve repeatability and information content | |
CN116109543A (zh) | 一种数据快速识别读取方法及装置、计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |