CN111539429B - 一种基于图像几何特征的周转箱自动定位方法 - Google Patents
一种基于图像几何特征的周转箱自动定位方法 Download PDFInfo
- Publication number
- CN111539429B CN111539429B CN202010564389.8A CN202010564389A CN111539429B CN 111539429 B CN111539429 B CN 111539429B CN 202010564389 A CN202010564389 A CN 202010564389A CN 111539429 B CN111539429 B CN 111539429B
- Authority
- CN
- China
- Prior art keywords
- image
- edge
- value
- straight lines
- edges
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 78
- 230000007306 turnover Effects 0.000 claims abstract description 49
- 238000001914 filtration Methods 0.000 claims abstract description 20
- 238000001514 detection method Methods 0.000 claims abstract description 16
- 238000007500 overflow downdraw method Methods 0.000 claims abstract description 9
- 230000009466 transformation Effects 0.000 claims abstract description 7
- 230000008569 process Effects 0.000 claims description 22
- 230000000877 morphologic effect Effects 0.000 claims description 16
- 238000012545 processing Methods 0.000 claims description 10
- 238000013507 mapping Methods 0.000 claims description 9
- 238000004458 analytical method Methods 0.000 claims description 8
- 239000003086 colorant Substances 0.000 claims description 8
- 230000004927 fusion Effects 0.000 claims description 7
- 238000013527 convolutional neural network Methods 0.000 claims description 6
- 238000012549 training Methods 0.000 claims description 6
- 238000013528 artificial neural network Methods 0.000 claims description 4
- 230000007797 corrosion Effects 0.000 claims description 3
- 238000005260 corrosion Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 8
- 238000004519 manufacturing process Methods 0.000 description 6
- 239000000463 material Substances 0.000 description 6
- 238000003062 neural network model Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 101100149325 Escherichia coli (strain K12) setC gene Proteins 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000003708 edge detection Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 1
- 230000003628 erosive effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/30—Noise filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/48—Extraction of image or video features by mapping characteristic values of the pattern into a parameter space, e.g. Hough transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Biology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种基于图像几何特征的周转箱自动定位方法,包括S1:根据原始图像得到垂直边缘和水平边缘,获得感兴趣区域(Roi图像);S2:进行二值化处理;S3:噪声点去除;S4:对所述二值图采用Hough变换策略进行直线检测得到若干条近似直线,然后采用直线融合方法将若干条近似直线融合为一条融合直线;S5:获取待选边缘,若待选边缘的数量为零,则返回步骤S2,减小偏移量C,继续迭代直到获得至少一条待选边缘;S6:确定局部图像的颜色滤除假边缘;S7:整合边缘,计算中心点及旋转角用以实现定位。本发明能够在可见光图像中对周转箱进行定位,耗时短,无需人工参与。
Description
技术领域
本发明涉及图像分析技术领域,具体涉及一种基于图像几何特征的周转箱自动定位方法。
背景技术
对图像中感兴趣的目标进行定位是图像处理、机器视觉等领域的关键技术,其目的是找到图像中感兴趣的目标,并将其在图像中的位置信息提取出来,再通过相机外参标定将其位置转换至世界坐标系,为机器人抓取等后续操作奠定基础。物料的短距离运输是仓库、流水线等场景必不可少的环节。周转箱是经过标准化设计的物料容器,广泛应用于物料的流转及仓储。目前其搬运任务主要是由人工完成,存在的问题有:(1) 人力成本高;(2)效率低下;(3) 错误率不可控,错误源不可追溯。为解决传统搬运方式的弊端,由机器视觉引导机械臂抓取,配合AGV小车运输是一种可行的解决方案。近年来新兴的智慧工厂、智能仓库等场景更是限制人员参与生产过程。而对周转箱的自动定位技术是这些方案顺利实施的重要前提。
现有的图像定位方法大体上分为4类:(1) 基于分割的方法,将原始图像分为多个区域,并标记感兴趣的区域;(2) 基于边缘检测的方法,找到感兴趣目标的轮廓,实现定位;(3) 基于特征的方法,分析感兴趣目标的纹理、颜色等特征,并以此为判据将目标位置提取出来;(4) 基于深度学习的方法,通过神经网络模型代替人工完成特征提取,实现定位。
基于分割的方法对于目标与背景灰度差异较小的图像定位效果较差,且难以做到将目标与背景完全分离,因而定位精度较低,难以引导机械臂抓取。基于边缘的方法对噪声敏感,对于某些灰度与背景差异不明显的周转箱图像准确性较低,识别率难以达到工业级要求。基于特征的方法最大的问题是提取、分析特征的过程耗时较长,且对于某些与目标特征相近的伪目标难以区分。基于深度学习的方法需要大量的标注样本用于训练模型,并且最终定位精度受标注精度的影响,可能出现定位结果不稳定,不适合精确抓取。
周转箱定位问题存在以下难点:(1) 周转箱图像背景复杂,内部物料种类繁多,可能对目标识别造成干扰;(2)周转箱间距较小,邻箱之间可能互相干扰。(3) 对于灰色周转箱,依据颜色特征定位会导致误差较大。(4) 周转箱使用过程中可能发生形变,每个周转箱的形状都不会完全一样。
现有方法难以实现周转箱的精确定位。周转箱的一般形状为规则的矩形,箱体上沿为光滑平面。在俯视图中,会形成较明显的几何特征。如果能对其加以利用,可以提高定位精度,减少耗时,提高自动化性能。
发明内容
有鉴于此,本发明要解决的问题是提供一种基于图像几何特征的周转箱自动定位方法。
为解决上述技术问题,本发明采用的技术方案是:一种基于图像几何特征的周转箱自动定位方法,包括如下步骤:
S1:根据从相机获取的原始图像得到垂直边缘和水平边缘,截取垂直边缘和水平边缘所在区域作为感兴趣区域(Roi图像);
S2:将每张Roi图像依次提取RGB通道分量,再对Roi图像进行灰度化处理得到灰度图像,共得到4张单通道图像,对每张单通道图像求取梯度图像,然后采用局部阈值法将每张梯度图像进行二值化处理,局部阈值为邻域高斯均值,偏移量为C,通过位或运算,每一Roi图像最终得到一张二值图;
S3:采用形态学滤波法对上述二值图进行噪声点去除过程;
S4:对所述二值图采用Hough变换策略进行直线检测得到若干条近似直线,然后采用直线融合方法将若干条近似直线融合为一条融合直线;
S5:对上述融合直线进行几何特征描述,寻找符合该特征的区域,标记为待选边缘,遍历融合直线获取全部待选边缘,若待选边缘的数量为零,则返回步骤S2,减小偏移量C,继续迭代直到获得至少一条待选边缘;
S6:在待选边缘区域截取局部图像进行统计特征分析,遍历所有待选边缘获得局部图像,利用卷积神经网络策略确定局部图像的颜色,对局部图像进行熵值及灰度值分析,滤除假边缘;
S7:整合边缘,将检测结果映射到原始图像中,计算中心点及旋转角用以实现定位。
在本发明中,优选地,所述步骤S2中的单通道图像的梯度图像的求取过程具体是求取垂直边缘的感兴趣区域的X方向梯度,求取水平边缘的感兴趣区域的Y方向梯度,用以突出周转箱边缘。
步骤S5中如果减小偏移量C的过程中若达到最大迭代次数,则返回无目标结果,同时向机械臂发送终止命令使其停止周转箱的抓取操作。
在本发明中,优选地,所述步骤S4中的直线融合方法具体包括以下步骤:
设有n条直线{l 1, l 2, …, l i, …, l j, …, l n },对于任意两条直线l i与l j,若满足公式(1):
则判定l i与l j近似,其中l ik和l jk表示直线l i和l j的斜率,l ib和l jb表示直线l i和l j的截距,T k 表示箱体形变系数,T b 表示融合截距阈值;对于直线l i,遍历所有直线后将所有与其近似的直线以及其本身加入集合C i,遍历所有直线,得到m个集合{C 1, C 2, …, C m};将集合C i内所有直线斜率的均值作为融合后的斜率k i,所有直线截距的均值作为融合后的截距b i;遍历所有集合后得到m条融合后的直线。
在本发明中,优选地,所述步骤S5中的获取全部待选边缘判定的具体过程如下:
对于任意两条直线l p与l q,若满足公式(2):
则判定直线l p与l q之间的区域为待选区域,并记录l p与l q两条直线的位置;否则删除此直线,其中,l pk和l qk表示直线l p和l q的斜率,l pb和l qb表示直线l p和l q的截距,T k 表示箱体形变系数,W表示箱体边缘在图像中的宽度,T W 表示误差阈值。
在本发明中,优选地,步骤S6中的局部图像确定的具体过程是:选取平行线l u与l v并确定边缘区域E,将与l u、l v平行且到l u、l v的距离相等的直线作为边缘区域E的中心线;沿该中心线以步长S移动,然后选取中心线上的点为锚点;以锚点为中心截取获得正矩形,该正矩形即为待分析的局部图像。
在本发明中,优选地,步骤S6中滤除假边缘具体包括以下步骤:步骤S61:建立神经网络训练模型进行颜色分类;步骤S62:将局部图像灰度化,计算其信息熵H和灰度均值G;步骤S63:建立先验知识,不同颜色分别对应一信息熵取值范围和一灰度均值取值范围,判断局部图像的信息熵H和灰度均值G是否同时属于信息熵取值范围和灰度均值取值范围,如果是则标记该局部图像为真,否则标记该局部图像为假;步骤S64:对于某一待选边缘选取的局部图像为k张,求取该待选边缘的置信度,若置信度大于0.75则判定该边缘属于真边缘;否则滤除当前待选边缘。
在本发明中,优选地,步骤S3中形态学滤波法采用的是双层级联滤波法,具体包括如下步骤:先对二值图像进行形态学膨胀运算,填补目标内部空洞平滑边界;再进行形态学腐蚀运算,在纤细处分离目标,去除部分面积的噪声。
在本发明中,优选地,采用所述步骤S3进行噪声点去除过程后,计算大于噪声点的残留区域的连通域面积,采用设定阈值法去掉区域面积小于设定阈值的区域。
在本发明中,优选地,步骤S7中的实现定位的具体步骤为:设边缘中心点为(x,y),将其一垂直边缘的Roi内部的边缘x值与另一垂直边缘的Roi内部的边缘x值作差,获得x差值并保留x差值绝对值的MIN值,将其一水平边缘的Roi内部的边缘y值与另一水平边缘的Roi内部的边缘y值作差,获得y差值并保留y差值绝对值的MIN值;将各感兴趣区域的检测结果映射至步骤S1中的原始图像,获取包含垂直边缘和水平边缘的外接矩形,计算外接矩形的中心点。
本发明具有的优点和积极效果是:本发明充分利用了周转箱在图像中的几何特征,解决了复杂背景下周转箱定位困难的问题,并能识别各种颜色的周转箱;该发明切实可行,并取得了精确的定位效果,且所需时间短,无需人工参与,可以为机器人抓取奠定良好基础;该方法可灵活用于现有产线的改造,所需的硬件改动极少,不需设计复杂的工业视觉系统,对相关问题的方案设计有一定的借鉴意义。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是本发明的一种基于图像几何特征的周转箱自动定位方法的流程框图;
图2是实施例一的从相机获取的原始图像;
图3是实施例一的实现定位后的结果图;
图4是实施例二的从相机获取的原始图像;
图5(a)是实施例二的步骤S2中偏移量C=1时的梯度二值图;
图5(b)是实施例二的步骤S2中偏移量C=2时的梯度二值图;
图5(c)是实施例二的步骤S2中偏移量C=3时的梯度二值图;
图5(d)是实施例二的步骤S2中偏移量C=4时的梯度二值图;
图5(e)是实施例二的步骤S2中偏移量C=5时的梯度二值图;
图6是实施例二的经过步骤S3处理后的结果图;
图7(a)是实施例二的步骤S4采用传统Hough变换策略的结果图;
图7(b)是实施例二的步骤S4采用直线融合方法的结果图;
图7(c)是实施例二的步骤S5采用几何特征描述获取的待选边缘;
图8(a)是实施例二的步骤S6局部图像选取示意图;
图8(b)是实施例二的步骤S6局部图像统计特征分析的结果图;
图9是实施例二的步骤S61中颜色分类的神经网络训练模型图;
图10是实施例二的步骤S7中实现定位后的结果图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,当组件被称为“固定于”另一个组件,它可以直接在另一个组件上或者也可以存在居中的组件。当一个组件被认为是“连接”另一个组件,它可以是直接连接到另一个组件或者可能同时存在居中组件。当一个组件被认为是“设置于”另一个组件,它可以是直接设置在另一个组件上或者可能同时存在居中组件。本文所使用的术语“垂直的”、 “ 水平的”、“ 左”、“ 右”以及类似的表述只是为了说明的目的。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“及/或”包括一个或多个相关的所列项目的任意的和所有的组合。
实施例一:
如图1、图2和图3所示,本发明提供一种基于图像几何特征的周转箱自动定位方法,包括如下步骤:
S1:根据从相机获取的原始图像得到垂直边缘和水平边缘,截取垂直边缘和水平边缘所在区域作为感兴趣区域(Roi图像),具体地将周转箱上、下、左、右4条边对应的Roi图像分别记为Roi_u, Roi_d, Roi_l, Roi_r。
S2:将每张Roi图像依次提取RGB通道分量,再对Roi图像进行灰度化处理得到灰度图像,共得到4张单通道图像,对每张单通道图像求取梯度图像,然后采用局部阈值法将每张梯度图像进行二值化处理,局部阈值为邻域高斯均值,偏移量为C,偏移量即在邻域高斯均值的基础上进行简单的加运算,将局部图像进行分割,高于阈值的像素点置为255,低于阈值的像素点置为0,得到与每一感兴趣区域(Roi图像)相对应的四张二值图,由于周转箱上、下、左、右4条边对应的Roi图像分别记为Roi_u, Roi_d, Roi_l, Roi_r,此时得到上下左右对应共计16张二值图,对这16张二值图中4张Roi_u图像、4张Roi_d图像、4张Roi_l图像、4张Roi_r图像分别进行位或运算,每一Roi图像最终得到一张二值图,共计得到4张二值图;
S3:采用形态学滤波法对上述二值图进行噪声点去除过程;
S4:对所述二值图采用Hough变换策略进行直线检测得到若干条近似直线,然后采用直线融合方法将若干条近似直线融合为一条融合直线;
S5:对上述融合直线进行几何特征描述,寻找符合该特征的区域,周转箱边缘的几何特征概括包括:a) 边缘处有两条平行的直线;b) 边缘宽度是固定值标记为待选边缘,遍历融合直线获取全部待选边缘,若待选边缘的数量为零,则返回步骤S2,减小偏移量C,继续迭代直到获得至少一条待选边缘,随着C的取值减小,二值图像中的有效信息增加,增强了对边缘的检测强度;偏移量C是通过调整局部阈值来控制分割结果中有效像素的数目。偏移量C越大,则阈值越高,有效像素数目越少,噪声也越少;反之则有效像素数目越多,噪声也会越多。C的调整可以理解为检测强度的调整,例如C=5时,可以检测到梯度值>50的边缘, C=4时可以检测到梯度值>45的边缘,相当于获取到的信息增加了。
S6:在待选边缘区域截取局部图像进行统计特征分析,遍历所有待选边缘获得局部图像,利用卷积神经网络策略确定局部图像的颜色,对局部图像进行熵值及灰度值分析,滤除假边缘;
S7:整合边缘,将检测结果映射到原始图像中,计算中心点用以实现定位。
在本实施例中,进一步地,所述步骤S2中的单通道图像的梯度图像的求取过程具体是求取垂直边缘的感兴趣区域的X方向梯度,求取水平边缘的感兴趣区域的Y方向梯度,用以突出原始图像边缘。对于实际周转箱的Roi_u, Roi_d来说求取其Y方向梯度,对于Roi_ l, Roi_r来说求取其X方向梯度,以突出周转箱边缘。
步骤S5在减小偏移量C的过程中若达到最大迭代次数,则返回无目标结果,向机械臂发送终止命令使其停止周转箱抓取操作。
在本实施例中,进一步地,步骤S4中的直线融合方法具体包括以下步骤:
设有n条直线{l 1, l 2, …, l i, …, l j, …, l n },对于任意两条直线l i与l j,若满足公式(1):
则判定l i与l j近似,其中l ik和l jk表示直线l i和l j的斜率,l ib和l jb表示直线l i和l j的截距,T k 表示箱体形变系数,T b 表示融合截距阈值;对于直线l i,遍历所有直线后将所有与其近似的直线以及其本身加入集合C i,遍历所有直线,得到m个集合{C 1, C 2, …, C m};将集合C i内所有直线斜率的均值作为融合后的斜率k i,所有直线截距的均值作为融合后的截距b i;遍历所有集合后得到m条融合后的直线。
在本实施例中,进一步地,步骤S5中的获取全部待选边缘判定的具体过程如下:
对于任意两条直线l p与l q,若满足公式(2):
则判定直线l p与l q之间的区域为待选区域,并记录l p与l q两条直线的位置;否则删除此直线,其中,l pk和l qk表示直线l p和l q的斜率,l pb和l qb表示直线l p和l q的截距,T k 表示箱体形变系数,W表示箱体边缘在图像中的宽度,T W 表示误差阈值。
在本实施例中,进一步地,步骤S6中的局部图像确定的具体过程是:选取平行线l u与l v并确定边缘区域E,将与l u、l v平行且到l u、l v的距离相等的直线作为边缘区域E的中心线;沿该中心线以步长S移动,然后选取中心线上的点为锚点;以锚点为中心截取获得正矩形,该正矩形即为待分析的局部图像。
在本实施例中,进一步地,卷积神经网络策略具体包括以下步骤:首先,建立神经网络训练模型进行颜色分类,由于不同颜色在图像中的特征不同,因此应首先确定局部图像的颜色。本方法采用卷积神经网络算法CNN对局部图像进行颜色分类。此处分类任务并不复杂,而抓取项目对算法实时性要求较高,因而神经网络模型的设计除了保证准确率、召回率等指标,还应以结构简单、运算快为原则。本方法基于LeNet-5模型,修改了原始模型的层数、卷积核形状以及全连接层的节点个数,设计神经网络模型的正向推理过程如附图9所示。其中基础网络层包含卷积层(Conv2D)、最大池化层(MaxPool2D)和全连接层。采用标注过的局部图像作为训练数据,将训练好的网络模型参数持久化,在定位算法过程中仅做正向推理。实验证明本方法进行颜色分类可靠性高,实时性好。
步骤S62:判断颜色后将局部图像灰度化,计算其信息熵H和灰度均值G;
信息熵H的计算公式为:
其中,s为局部图像尺寸,N i 是灰度值为i的像素个数。
设灰度局部图像为L=g(x, y),则灰度均值G的计算公式为:
其中s为局部图像尺寸。
建立先验知识,同一材质、颜色的周转箱其H、G取值范围固定,而不同材质、颜色的
周转箱H、G值会有较大差异。为此不同颜色分别对应一信息熵取值范围和一灰度均值取值
范围,将颜色为c的图像H取值范围记为R Hc 、G取值范围记为R Gc ,判断局部图像的信息熵H和
灰度均值G是否同时属于信息熵取值范围和灰度均值取值范围,根据颜色分类结果,对于颜
色为c的局部图像,若其H、G值满足H∈R Hc ,G∈R Gc ,则标记该局部图像为真,否则标记该局部
图像为假;对于某一待选边缘选取的局部图像为k张,k张图像中为真的图像数目记为 ,利用公式(5)求取该待选边缘的置信度Confidence:
若置信度Confidence大于0.75则判定该边缘属于真边缘;否则滤除当前待选边缘。
在本实施例中,进一步地,步骤S3中形态学滤波法采用的是双层级联滤波法,具体包括如下步骤:先对二值图像进行形态学膨胀运算,填补目标内部空洞平滑边界;再进行形态学腐蚀运算,在纤细处分离目标,去除部分面积的噪声。经过两次形态学运算后,噪声点被去除,目标线条变得平滑,断点减少,而目标总体面积和位置变化很小。
在本实施例中,进一步地,采用步骤S3进行噪声点去除过程后,计算大于噪声点的残留区域的连通域面积,采用设定阈值法去掉区域面积小于设定阈值的区域,可有效排除杂质目标的干扰,提高定位精度并简化运算。
在本实施例中,进一步地,步骤S7中的实现定位的具体步骤为:设边缘中心点为(x, y),将其一垂直边缘的Roi内部的边缘x值与另一垂直边缘的Roi内部的边缘x值作差,获得x差值并保留x差值绝对值的MIN值,将其一水平边缘的Roi内部的边缘y值与另一水平边缘的Roi内部的边缘y值作差,获得y差值并保留y差值绝对值的MIN值;将各感兴趣区域的检测结果映射至步骤S1中的原始图像,获取包含垂直边缘和水平边缘的外接矩形,计算外接矩形的中心点。每张Roi图像应只保留一条边缘。由于外部可能有其它周转箱存在,而周转箱内部不可能有其它周转箱,因而保留Roi中更靠近内部的边缘,具体实现方法为:数字图像的左上角为原点,x轴正方向为向右,y轴正方向为向下,设边缘中心点为(x, y),对于Roi_u保留y值最大的边缘;Roi_d保留y值最小的边缘;Roi_l保留x值最大的边缘;Roi_r保留x值最小的边缘。将各Roi图像的检测结果映射至原始图像,求包含所有垂直边缘和水平边缘的最小外接矩形,计算中心点,并计算垂直边缘和水平边缘的角度均值作为周转箱箱体的旋转角,实现定位。
实施例二:
如图4至图10所示,由于在实际生产过程中,采集到的周转箱图像可能存在目标不完整的情况,也就是说,如果只拍到3条边,则生成3张Roi图像,对生成的3张Roi图像先进行图像处理的步骤与拍摄到4条边的情况类似,不同之处在于进行中心点及旋转角计算的过程中,箱体的长宽尺寸是已知的,将拍摄到的完整边缘与已知的箱体长宽尺寸进行比对,判断得到该完整边缘为长或宽,然后将各Roi图像的检测结果映射至原始图像,将检测到的3条边的角度均值作为箱体旋转角,根据箱体尺寸及旋转角计算得到最终的中心点。该方法适用于对同一条产线的周转箱尺寸进行批量化图像处理,对于其他型号或规格的周转箱生产线,在预先已知周转箱尺寸的情况下也可采用上述方法进行图像处理。
本发明的工作原理和工作过程如下:首先,对现场由工业相机实拍的图像进行处理,获得如图4所示的原始图像,是周转箱的俯视图,为3通道RGB图像,尺寸为2448×2048;梯度图像二值化后的结果如图5所示;采用双层级联滤波法先对二值图像进行形态学膨胀运算,填补目标内部空洞平滑边界;再进行形态学腐蚀运算,在纤细处分离目标,去除部分面积的噪声,然后大于噪声点的残留区域的连通域面积,采用设定阈值法去掉区域面积小于设定阈值的区域,得到的结果如图6;接下来采用Hough变换策略进行直线检测,结果得到6条近似直线具体详见图7(a), Hough变换策略具体是将图像中的点转换至极坐标空间,利用点线对偶性,通过求极坐标空间下交点的个数来检测图像中的直线。由于梯度方向的设定与周转箱边缘垂直,又经过了二值化和形态学滤波,虽然突出了周转箱边缘,但是通过传统Hough直线检测可能会检测到很多近似的直线。同一位置存在多条近似直线,既影响定位精度,又加大了后续的计算量,因此我们采用直线融合方法将这6条直线中近似的直线融合成一条融合直线,结果见图7(b),可见直线由6条减少至4条,且清楚体现了箱体边缘的位置信息;再对周转箱边缘的几何特征进行数字化描述,基于融合后的直线寻找符合该特征的区域,标记为待选边缘,处理结果如图7(c)所示;先对图7(c)中待选边缘区域截取局部图像,然后对其进行统计特征分析,局部图像选取示意图如图8(a),选取平行线l u与l v并确定边缘区域E,将与l u、l v平行且到l u、l v的距离相等的直线作为边缘区域E的中心线;沿该中心线以步长S移动,然后选取中心线上的点为锚点;以锚点为中心截取获得正矩形,该正矩形即为待分析的局部图像。特征分析结果如图8(b)。由于不同颜色在图像中的特征不同,因此应首先确定局部图像的颜色。修改了原始模型的层数、卷积核形状以及全连接层的节点个数,设计神经网络模型的正向推理过程如附图9所示。每张Roi图像应只保留一条边缘,由于外部可能有其它周转箱存在,而周转箱内部不可能有其它周转箱,因而保留Roi中更靠近内部的边缘,具体先设边缘中心点坐标为(x, y),对于Roi_u保留y值最大的边缘;Roi_d保留y值最小的边缘;Roi_l保留x值最大的边缘;Roi_r保留x值最小的边缘,完成边缘整合,然后将各Roi图像的检测结果映射至从相机获得的原始图像,求得包含所有垂直边缘和水平边缘的最小外接矩形,计算得到中心点的坐标,将垂直边缘和水平边缘的角度均值作为周转箱箱体的旋转角,实现周转箱图像自动定位,结果如图10。
本发明的特点在于:本发明充分利用了周转箱在图像中的几何特征,解决了复杂背景下周转箱定位困难的问题,并能识别各种颜色的周转箱;该发明切实可行,并取得了精确的定位效果,且所需时间短,无需人工参与,可以为机器人抓取奠定良好基础;该方法可灵活用于现有产线的改造,所需的硬件改动极少,不需设计复杂的工业视觉系统,对相关问题的方案设计有一定的借鉴意义。
以上对本发明的实施例进行了详细说明,但内容仅为本发明的较佳实施例,不能被认为用于限定本发明的实施范围。凡依本发明范围所作的均等变化与改进等,均应仍归属于本专利涵盖范围之内。
Claims (10)
1.一种基于图像几何特征的周转箱自动定位方法,其特征在于,包括如下步骤:
S1:根据从相机获取的原始图像得到垂直边缘和水平边缘,截取垂直边缘和水平边缘所在区域作为感兴趣区域Roi图像;
S2:将每张Roi图像依次提取RGB通道分量,再对Roi图像进行灰度化处理得到灰度图像,共得到4张单通道图像,对每张单通道图像求取梯度图像,然后采用局部阈值法将每张梯度图像进行二值化处理,局部阈值为邻域高斯均值,偏移量为C,通过位或运算每一Roi图像最终得到一张二值图;
S3:采用形态学滤波法对上述二值图进行噪声点去除过程;
S4:对所述二值图采用Hough变换策略进行直线检测得到若干条近似直线,然后采用直线融合方法将若干条近似直线融合为一条融合直线;
S5:对上述融合直线进行几何特征描述,寻找符合该特征的区域,标记为待选边缘,遍历融合直线获取全部待选边缘,若待选边缘的数量为零,则返回步骤S2,减小偏移量C,继续迭代直到获得至少一条待选边缘;
S6:在待选边缘区域截取局部图像进行统计特征分析,遍历所有待选边缘获得局部图像,利用卷积神经网络策略确定局部图像的颜色,判断局部图像的熵值和灰度值是否同时在该颜色对应下的熵值和灰度值的正常范围内,滤除假边缘;
S7:整合边缘,将检测结果映射到原始图像中,计算周转箱的中心点及旋转角用以实现定位。
2.根据权利要求1所述的一种基于图像几何特征的周转箱自动定位方法,其特征在于,所述步骤S2中的单通道图像的梯度图像的求取过程具体是求取垂直边缘的感兴趣区域的X方向梯度,求取水平边缘的感兴趣区域的Y方向梯度,用以突出周转箱边缘。
3.根据权利要求1所述的一种基于图像几何特征的周转箱自动定位方法,其特征在于,所述步骤S5在减小偏移量C的过程中若达到最大迭代次数,则返回无目标结果,向机械臂发送终止命令使其停止周转箱抓取操作。
4.根据权利要求1所述的一种基于图像几何特征的周转箱自动定位方法,其特征在于,所述步骤S4中的直线融合方法具体包括以下步骤:
设有n条直线{l1,l2,…,li,…,lj,…,ln},对于任意两条直线li与lj,若满足公式(1):
则判定li与lj近似,其中lik和ljk表示直线li和lj的斜率,lib和ljb表示直线li和lj的截距,Tk表示箱体形变系数,Tb表示融合截距阈值;对于直线li,遍历所有直线后将所有与其近似的直线以及其本身加入集合Ci,遍历所有直线,得到m个集合{C1,C2,…,Cm};将集合Ci内所有直线斜率的均值作为融合后的斜率ki,所有直线截距的均值作为融合后的截距bi;遍历所有集合后得到m条融合后的直线。
6.根据权利要求1所述的一种基于图像几何特征的周转箱自动定位方法,其特征在于,步骤S6中的局部图像确定的具体过程是:选取平行线lu与lv并确定边缘区域E,将与lu、lv平行且到lp、lq的距离相等的直线作为边缘区域E的中心线;沿该中心线以步长S移动,然后选取中心线上的点为锚点;以锚点为中心截取获得正矩形,该正矩形即为待分析的局部图像。
7.根据权利要求1所述的一种基于图像几何特征的周转箱自动定位方法,其特征在于,步骤S6中滤除假边缘具体包括以下步骤:
步骤S61:建立神经网络训练模型对局部图像进行颜色分类;
步骤S62:将局部图像灰度化,计算其信息熵H和灰度均值G;
步骤S63:建立先验知识,不同颜色分别对应一信息熵取值范围和一灰度均值取值范围,判断局部图像的信息熵H和灰度均值G是否同时属于信息熵取值范围和灰度均值取值范围,如果是则标记该局部图像为真,否则标记该局部图像为假;
步骤S64:对于某一待选边缘选取的局部图像为k张,求取该待选边缘的置信度,若置信度大于0.75则判定该边缘属于真边缘;否则滤除当前待选边缘。
8.根据权利要求1所述的一种基于图像几何特征的周转箱自动定位方法,其特征在于,步骤S3中形态学滤波法采用的是双层级联滤波法,具体包括如下步骤:先对二值图像进行形态学膨胀运算,填补目标内部空洞平滑边界;再进行形态学腐蚀运算,在纤细处分离目标,去除部分面积的噪声。
9.根据权利要求1所述的一种基于图像几何特征的周转箱自动定位方法,其特征在于,采用所述步骤S3进行噪声点去除过程后,计算大于噪声点的残留区域的连通域面积,采用设定阈值法去掉区域面积小于设定阈值的区域。
10.根据权利要求1所述的一种基于图像几何特征的周转箱自动定位方法,其特征在于,步骤S7中的实现定位的具体步骤为:设边缘中心点为(x,y),将其一垂直边缘的Roi内部的边缘x值与另一垂直边缘的Roi内部的边缘x值作差,获得x差值并保留x差值绝对值的MIN值,将其一水平边缘的Roi内部的边缘y值与另一水平边缘的Roi内部的边缘y值作差,获得y差值并保留y差值绝对值的MIN值;将各感兴趣区域的检测结果映射至步骤S1中的原始图像,获取包含垂直边缘和水平边缘的外接矩形,计算外接矩形的中心点。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010564389.8A CN111539429B (zh) | 2020-06-19 | 2020-06-19 | 一种基于图像几何特征的周转箱自动定位方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010564389.8A CN111539429B (zh) | 2020-06-19 | 2020-06-19 | 一种基于图像几何特征的周转箱自动定位方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111539429A CN111539429A (zh) | 2020-08-14 |
CN111539429B true CN111539429B (zh) | 2020-11-03 |
Family
ID=71976502
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010564389.8A Active CN111539429B (zh) | 2020-06-19 | 2020-06-19 | 一种基于图像几何特征的周转箱自动定位方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111539429B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112180947B (zh) * | 2020-10-22 | 2023-09-12 | 湖南格兰博智能科技有限责任公司 | 一种移动机器人初始行进方向选择方法及其设备 |
CN111968145B (zh) * | 2020-10-23 | 2021-01-15 | 腾讯科技(深圳)有限公司 | 箱式结构识别方法、装置、电子设备及存储介质 |
CN112446908A (zh) * | 2020-11-18 | 2021-03-05 | 中国科学院上海技术物理研究所 | 一种基于几何纹理的热红外影像控制点提取方法 |
CN112580447B (zh) * | 2020-12-04 | 2023-08-04 | 国网福建省电力有限公司泉州供电公司 | 一种基于边缘二阶统计与融合的电力线检测方法 |
CN115272455A (zh) * | 2022-09-02 | 2022-11-01 | 敬科(深圳)机器人科技有限公司 | 一种强光背景下麦克风网状物料的图像定位方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101630411A (zh) * | 2009-07-02 | 2010-01-20 | 浙江省电力公司 | 基于熵值的面向输电线路部件识别的自动阈值图象分割方法 |
CN107449499A (zh) * | 2017-09-30 | 2017-12-08 | 南京中高知识产权股份有限公司 | 集装箱偏载值检测系统及其工作方法 |
CN108258185A (zh) * | 2017-12-29 | 2018-07-06 | 天津市捷威动力工业有限公司 | 防锂电池负极片烘干时鼓边的结构及方法 |
CN109977886A (zh) * | 2019-03-29 | 2019-07-05 | 京东方科技集团股份有限公司 | 货架空置率计算方法及装置、电子设备、存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101814144B (zh) * | 2010-03-25 | 2012-03-07 | 西安电子科技大学 | 遥感图像中无水桥梁目标识别方法 |
CN103488988B (zh) * | 2013-09-06 | 2017-02-01 | 广东电网公司电力科学研究院 | 基于无人机巡线可见光影像的电力设备中绝缘子的提取方法 |
WO2017060850A1 (en) * | 2015-10-07 | 2017-04-13 | Way2Vat Ltd. | System and methods of an expense management system based upon business document analysis |
CN106251332B (zh) * | 2016-07-17 | 2019-05-21 | 西安电子科技大学 | 基于边缘特征的sar图像机场目标检测方法 |
CN106228138A (zh) * | 2016-07-26 | 2016-12-14 | 国网重庆市电力公司电力科学研究院 | 一种融合区域和边缘信息的道路检测算法 |
-
2020
- 2020-06-19 CN CN202010564389.8A patent/CN111539429B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101630411A (zh) * | 2009-07-02 | 2010-01-20 | 浙江省电力公司 | 基于熵值的面向输电线路部件识别的自动阈值图象分割方法 |
CN107449499A (zh) * | 2017-09-30 | 2017-12-08 | 南京中高知识产权股份有限公司 | 集装箱偏载值检测系统及其工作方法 |
CN108258185A (zh) * | 2017-12-29 | 2018-07-06 | 天津市捷威动力工业有限公司 | 防锂电池负极片烘干时鼓边的结构及方法 |
CN109977886A (zh) * | 2019-03-29 | 2019-07-05 | 京东方科技集团股份有限公司 | 货架空置率计算方法及装置、电子设备、存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN111539429A (zh) | 2020-08-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111539429B (zh) | 一种基于图像几何特征的周转箱自动定位方法 | |
CN112070818B (zh) | 基于机器视觉的机器人无序抓取方法和系统及存储介质 | |
CN108304873B (zh) | 基于高分辨率光学卫星遥感影像的目标检测方法及其系统 | |
CN113658132B (zh) | 基于计算机视觉的结构件焊缝检测方法 | |
CN105046252B (zh) | 一种人民币冠字码识别方法 | |
CN111507390A (zh) | 一种基于轮廓特征的仓储箱体识别与定位方法 | |
Shen et al. | A positioning lockholes of container corner castings method based on image recognition | |
CN110084243B (zh) | 一种基于二维码和单目相机的档案识别与定位方法 | |
CN106709500B (zh) | 一种图像特征匹配的方法 | |
CN109409356B (zh) | 一种基于swt的多方向中文印刷体文字检测方法 | |
CN115359021A (zh) | 一种基于激光雷达和相机信息融合的目标定位检测方法 | |
CN110751619A (zh) | 一种绝缘子缺陷检测方法 | |
CN101114337A (zh) | 一种地面建筑物识别定位方法 | |
CN114972968A (zh) | 基于多重神经网络的托盘识别和位姿估计方法 | |
CN111695373A (zh) | 斑马线的定位方法、系统、介质及设备 | |
CN115830359A (zh) | 复杂场景下基于目标检测和模板匹配的工件识别计数方法 | |
CN113033558A (zh) | 一种用于自然场景的文本检测方法及装置、存储介质 | |
CN113435266A (zh) | 基于极值点特征增强的fcos智能目标检测方法 | |
CN110634142B (zh) | 一种复杂车路图像边界优化方法 | |
CN115841633A (zh) | 一种电力塔和电力线关联矫正的电力塔和电力线检测方法 | |
CN115546202A (zh) | 一种用于无人叉车的托盘检测与定位方法 | |
Zhang et al. | Front vehicle detection based on multi-sensor fusion for autonomous vehicle | |
CN117496401A (zh) | 一种用于视频测量影像序列椭圆形目标点全自动识别与跟踪方法 | |
CN110378337B (zh) | 金属切削刀具图纸标识信息视觉输入方法及系统 | |
CN117351078A (zh) | 基于形状先验的目标尺寸与6d姿态估计方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |