CN108898610A - 一种基于mask-RCNN的物体轮廓提取方法 - Google Patents
一种基于mask-RCNN的物体轮廓提取方法 Download PDFInfo
- Publication number
- CN108898610A CN108898610A CN201810810429.5A CN201810810429A CN108898610A CN 108898610 A CN108898610 A CN 108898610A CN 201810810429 A CN201810810429 A CN 201810810429A CN 108898610 A CN108898610 A CN 108898610A
- Authority
- CN
- China
- Prior art keywords
- image
- mask
- profile
- contour
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 29
- 238000000034 method Methods 0.000 claims abstract description 45
- 230000008569 process Effects 0.000 claims abstract description 25
- 230000011218 segmentation Effects 0.000 claims abstract description 19
- 238000012549 training Methods 0.000 claims abstract description 17
- 230000005484 gravity Effects 0.000 claims description 24
- 238000003708 edge detection Methods 0.000 claims description 12
- 238000005530 etching Methods 0.000 claims description 11
- 230000000717 retained effect Effects 0.000 claims description 9
- 238000012216 screening Methods 0.000 claims description 9
- 239000000203 mixture Substances 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 7
- 230000004927 fusion Effects 0.000 claims description 6
- 230000003287 optical effect Effects 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 6
- 230000010339 dilation Effects 0.000 claims description 5
- 230000003628 erosive effect Effects 0.000 claims description 5
- 241001465754 Metazoa Species 0.000 claims description 4
- 238000007906 compression Methods 0.000 claims description 4
- 238000011017 operating method Methods 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 230000009977 dual effect Effects 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 3
- 239000011159 matrix material Substances 0.000 claims description 3
- 229910052500 inorganic mineral Inorganic materials 0.000 claims description 2
- 239000011707 mineral Substances 0.000 claims description 2
- 230000017105 transposition Effects 0.000 claims 1
- 238000012937 correction Methods 0.000 abstract description 5
- 230000003044 adaptive effect Effects 0.000 abstract description 4
- 238000013527 convolutional neural network Methods 0.000 description 18
- 238000001514 detection method Methods 0.000 description 13
- 230000000694 effects Effects 0.000 description 3
- 210000004556 brain Anatomy 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration by the use of local operators
- G06T5/30—Erosion or dilatation, e.g. thinning
-
- G06T5/70—
Abstract
本发明公开了一种基于mask‑RCNN的物体轮廓提取方法,首先通过训练获得一个mask‑RCNN模型,将待提取物体轮廓的RGB图像输入mask‑RCNN模型进行语义分割,通过mask‑RCNN网络处理得到RGB图像对应的二值掩膜图像,将RGB图像和对应的二值掩膜图像输入轮廓细化模块,提出了一种轮廓特征描述方式,准确地表征物体轮廓的方向和角度信息并通过轮廓修正算法对基于mask‑RCNN获得的二值掩膜图像轮廓进行自适应修正,最终实现图像质量不高如分辨率较低、目标模糊以及较低时间和空间复杂度情况下,图像实例轮廓的实时精确提取。
Description
技术领域
本发明属于计算机视觉的图像物体检测与分割技术领域,具体涉及一种基于mask-RCNN的物体轮廓提取方法。
背景技术
图像检测与分割前瞻性论著包括Girshick等人提出的R-CNN(Regions with CNNfeatures)深度卷积神经网络的研究。Kaiming等人提出了SPP-Net模型解决上述问题,处理速度比R-CNN快30~170倍。为了进一步减小实例分割算法在时间和空间上的复杂度,Girshick提出了Fast-RCNN模型将特征提取和分类融合进一个分类框架,提高了训练模型的速度和目标检测的准确率。Kaiming等人通过在Faster-RCNN的基础上添加一个分支网络,在实现目标检测的同时,完成目标像素分割。
最初由Facebook AI研究院的Girshick等提出的R-CNN算法,是一种基于卷积神经网络的目标检测模型。其主要思想是首先使用选择搜索算法,在图像中提取若干个候选目标矩形区域,用深度卷积网络提取目标特征,最后用支持向量机训练一个分类器,对候选目标区域进行分类。其中提取特征的深度卷积网络包含5个卷积层、2个全连接层。这个目标检测框架在PASCAL VOC 2010数据库上检测的平均准确率达到62.9%。但R-CNN模型的缺陷主要有三点:①每幅图片要经过2 000次的深度卷积网络的运算,影响了目标检测的速度;②提取的候选目标区域必须要进行缩放到固定大小,这是与人脑处理图像的过程不符,人脑处理不同尺寸的图像并不需要缩放或裁剪到固定大小。
Kaiming等人的文章在R-CNN的基础上做了实质性的改进,提出了SPP-Net模型。取消了图像归一化过程,解决图像变形导致的信息丢失以及存储问题;采用空间金字塔池化(SpatialPyramid Pooling)替换了全连接层之前的最后一个池化层,最后使用支持向量机进行分类。空间金字塔池化的作用是对于不同大小的图像可以提取固定大小的特征向量,使得不同图片产生的特征图可与全连接层匹配。
Girshick提出了Fast-RCNN模型将特征提取和分类融合进一个分类框架,节省训练模型所需的时间和存储空间。在用深度卷积网络计算得到特征图后,用感兴趣区域RoI(Region of Interesting)投影的方式找到原图中候选目标区域在特征图上的对应区域,再用感兴趣区域(RoI)池化的方式获得固定尺寸的候选目标区域特征图,特征图经过全连接层的运算后,分别输入到一个分类器和一个回归器中。Fast-RCNN模型是一个整体,只需要一次训练过程就可以训练好网络的全部参数,因此大大提高了训练时间并且提升了目标检测的正确率。Fast-RCNN模型的训练比R-CNN模型快了9倍,比SPP-Net模型快了3倍。PASCAL VOC2007数据库上检测的平均准确率达到70%,明显优于R-CNN和SPP-Net模型。Faster R-CNN可看做“区域生成网络RPNs+Fast R-CNN”的系统,用区域生成网络代替FastR-CNN中的选择搜索方法。提高了检测精度和速度,真正实现端到端的目标检测框架,生成建议框仅需约10ms。
以上列举了一些国内外对目标检测和分割问题的研究,在缩减计算和存储复杂度方面,仍有进步的空间,由于图像模糊、分辨率低等因素导致的实例轮廓检测不精确和分割不完整的问题依然存在。一个更全面,同时保证速度快、存储少、精确度高的动态分割方法是今后研究发展的目标。
发明内容
本发明的目的在于:解决现有图像轮廓检测分割和提取存在由于图像模糊、分辨率低等因素导致的实例轮廓检测不精确和分割不完整的问题,提出一种基于mask-RCNN的物体轮廓提取方法,首先通过训练获得一个mask-RCNN实例分割模型,提出一种轮廓特征描述方式,准确地表征物体轮廓的方向和角度信息并通过轮廓修正算法对基于mask-RCNN获得的实例轮廓进行自适应修正,最终实现图像质量不高如分辨率较低、目标模糊以及较低时间和空间复杂度情况下,图像实例轮廓的实时精确提取。
本发明采用的技术方案如下:
一种基于mask-RCNN的物体轮廓提取方法,方法包括如下步骤:
步骤1、输入图片样本生成具有提取图像二值掩膜功能的mask-RCNN模型,将待提取物体轮廓的RGB图像输入生成的mask-RCNN模型进行语义分割,得到RGB图像对应的二值掩膜图像;
步骤2、结合RGB图像将其对应的二值掩膜图像进行轮廓细化步骤:采用轮廓修正算法对二值掩膜图像的轮廓进行细粒度的修正,先提取RGB图像和对应的二值掩膜图像的目标轮廓,再构建轮廓特征描述,包括轮廓角度信息特征向量和轮廓重心,基于计算出的目标轮廓特征描述,将RGB图像目标轮廓与二值掩膜图像的目标轮廓进行匹配,筛选需要保留的RGB图像目标轮廓然后与二值掩膜图像轮廓进行轮廓融合,在二值掩膜图像上得到精细的轮廓形状和位置。
进一步,所述步骤2详细步骤如下:
步骤2.1、对RGB图像和二值掩膜图像进行图像的目标边缘检测,检测出RGB图像和二值掩膜图像的目标物体边缘;
步骤2.2、进行轮廓计算,对得到的RGB图像和二值掩膜图像的目标物体边缘建立层级关系,取第二层结果为目标轮廓;
步骤2.3、进行轮廓融合,先构建轮廓特征描述,包括轮廓角度信息特征向量和轮廓重心,基于计算出的目标轮廓特征描述,将RGB图像目标轮廓与二值掩膜图像的目标轮廓进行匹配,筛选需要保留的RGB图像目标轮廓然后与二值掩膜图像进行轮廓融合,在二值掩膜图像上得到精细的轮廓形状和位置。
进一步,所述步骤2中mask-RCNN模型包括部件为:ROI对齐、卷积层和分类器。
进一步,所述步骤2中还包括对进行轮廓融合后的二值掩膜图像执行边缘内填充操作步骤。
进一步,所述边缘内填充操作步骤采用膨胀腐蚀操作方法,操作时用闭运算公式计算,先进行膨胀操作,再进行腐蚀操作,公式如下:
为膨胀操作,过程为:1)用结构元素B扫描图像A中的每一个像素;2)用结构元素与其覆盖的二值图像做“与”操作;3)操作结果如果都为0,结果图像的该像素为0,否则为1;
为腐蚀操作,过程为:1)用结构单元B扫描图像A的每一个像素;2)用结构元素与其覆盖的二值图像做“与”操作;3)操作结果如果都为1,结果图像的该像素为1,否则为0。
进一步,所述步骤1中图片样本包括各类可见物体训练样本,包含动物、植物、矿物、食物及生活中可见物品。
进一步,所述步骤2.1的目标边缘检测采用Canny边缘检测算法,算法步骤如下:
步骤2.1.1、将图像转换为灰度图,转换公式为:
gray=0.299R+0.587G+0.114B (2-1);
步骤2.1.2、设置高斯方差σ与窗口大小KernelWidth,生成高斯卷积核算子,对灰度图进行高斯卷积模糊;
步骤2.1.3、计算步骤2.1.2所得图像的图像梯度,由x和y方向的梯度计算图像某像素点的梯度幅值和角度,公式如下:
其中,Gx(x,y)为图像在x方向的梯度,Gy(x,y)为图像在y方向的梯度,S为图像在某点的像素值,θ(x,y)为像素点的角度;
步骤2.1.4、基于步骤2.1.3所得像素点的梯度幅值和角度,对步骤2.1.2所得图像进行非最大信号压制处理;
步骤2.1.5、对步骤2.1.4所得图像进行双阈值边缘连接处理;
步骤2.1.6、对步骤2.1.5所得图像进行二值化并输出结果。
进一步,所述步骤2中构建的轮廓角度信息特征向量为 为轮廓上每个点xi(1≤i≤n)与坐标原点的夹角,计算公式如下:
其中,p为图像上两点分别与相机光心连接所形成的夹角,d1为连接光心与图像上一点x1的直线的方向,d2为连接光心与图像上一点x2的直线的方向,T上标表示矩阵的转置,K为相机内置参数;
构建的轮廓重心为(cx,cy),计算公式如下:
其中,n为这条轮廓上像素值的个数,i为像素的x坐标,j为像素的y坐标,g(i,j)为在点(i,j)位置上像素的大小,p与q为像素在x,y方向的矩的阶数,mpq为中心距,(p+q)为中心距阶数,cx、cy为x轴和y轴方向上的重心坐标值。
进一步,所述步骤2中将RGB图像目标轮廓与二值掩膜图像的目标轮廓进行匹配,筛选需要保留的RGB图像目标轮廓的具体过程为:
计算RGB图像上目标轮廓的角度特征向量V=(ρ1,ρ2,...,ρn)、目标重心和掩膜重心,连接目标重心和掩膜重心,判断连线与二值掩膜图像的目标轮廓是否有交点,保留没有交点的目标轮廓和重心与交点距离小于阈值γ的目标轮廓;
再以保留的目标轮廓的重心为一个端点,计算二值掩膜图像目标轮廓上各个点到该点的距离,对计算结果进行从小到大的排序,取前n个距离目标轮廓重心较小的点,并根据构建的轮廓角度信息特征向量计算该n个点组成的轮廓的特征描述U=(δ1,δ2,...,δn),计算向量U与V的余弦距离:
其中U为通过上一段描述方法构成的向量,是二值掩膜图像轮廓上截取了一段构成的向量,V为RGB图像上的目标轮廓构成的向量;
当cosψ小于阈值a时,则保留目标轮廓,否则,剔除该目标轮廓。
进一步,所述步骤2中保留的目标轮廓与二值掩膜图像进行轮廓融合的过程为:将保留的目标轮廓中所有边缘的所有点与二值掩膜图像上相同位置的点对应,如果对应的二值掩膜图像上点的像素为1,那么二值掩膜图像上该点像素值不变,依然为1,如果对应的二值掩膜图像上点的像素为0,那么二值掩膜图像上该点像素值置为1。
综上所述,由于采用了上述技术方案,本发明的有益效果是:
1、本发明中,首先通过训练获得一个mask-RCNN实例分割模型,考虑了实际情况中硬件设备计算能力不足、存储空间等因素的影响,使用mask R-CNN网络结构加速实例分割任务进程,提出一种轮廓特征描述方式,准确地表征物体轮廓的方向和角度信息并通过轮廓修正算法对基于mask-RCNN获得的实例轮廓进行自适应修正,最终实现较低时间和空间复杂度情况下,图像实例轮廓的实时精确提取,同时mask R-CNN与轮廓修正算法相结合,提高了系统鲁棒性,在图像质量不高如分辨率较低、目标模糊时训练好的系统始终可以检测出图像中实例的轮廓;
2、本发明中,对于轮廓融合后的二值掩膜图像执行边缘内填充操作步骤,采用膨胀腐蚀操作方法,操作时用闭运算公式计算,先进行膨胀操作,再进行腐蚀操作,能够去掉目标内的孔,连接邻近物体和平滑边界,将轮廓反映射和闭运算操作相结合,得到修正后的二值掩膜轮廓,该方法对mask R-CNN模型输出的轮廓进行了有效修正,进一步提高了实例分割的准确度;
3、本发明中,图片样本包括各类可见物体训练样本,包含动物、植物、矿物、食物及生活中可见物品,用内容丰富的图像对模型进行训练,使得该模块在不同种类的物体检测中具有较广的普适性;
4、本发明中,目标边缘检测的Canny边缘检测算法中,图像进行高斯模糊能够整体降低图像噪声,更准确计算图像梯度及边缘,通过非最大信号压制处理边缘像素进一步减少,能够实现边缘细化;
5、本发明中,构建轮廓角度信息特征向量为轮廓重心为(cx,cy),能够准确表征物体轮廓的方向和角度信息,对轮廓修正的准确性提供了极大的帮助。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明方法框图;
图2为本发明mask-RCNN模型示意图;
图3为本发明轮廓细化模块原理图;
图4为本发明边缘层级关系图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明,即所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,术语“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
一种基于mask-RCNN的物体轮廓提取方法,本发明方法可以看做一个整体,也可以将本方法整体分为三个模块,分别是网络训练模块、语义分割模块和轮廓细化模块,方法框图如图1所示,本发明先在网络训练模块中获得mask-RCNN模型,再在语义分割模块进行图像的语义分割,最后在轮廓细化模块中进行图像轮廓细化,得到精细的轮廓形状和位置。首先通过训练获得一个mask-RCNN实例分割模型,考虑了实际情况中硬件设备计算能力不足、存储空间等因素的影响,使用mask R-CNN网络结构加速了图像实例分割任务进程,提出一种轮廓特征描述方式,准确地表征物体轮廓的方向和角度信息并通过轮廓修正算法对基于mask-RCNN获得的实例轮廓进行自适应修正,最终实现较低时间和空间复杂度情况下,图像实例轮廓的实时精确提取,同时mask R-CNN与轮廓修正算法相结合,提高了系统鲁棒性,在图像质量不高如分辨率较低、目标模糊时训练好的系统始终可以检测出图像中实例的轮廓。本发明方法包括如下步骤:
步骤1、输入图片样本生成具有提取图像二值掩膜功能的mask-RCNN模型,将待提取物体轮廓的RGB图像输入生成的mask-RCNN模型进行语义分割,得到RGB图像对应的二值掩膜图像。mask-RCNN模型的作用是在像素级场景中识别不同目标,具体来说,对输入的任意一张RGB图像,经过mask-RCNN模型语义分割模块的处理,得到图像中物体的不同类别和轮廓信息。mask-RCNN模型包括部件为:ROI对齐、卷积层和分类器,模型示意图如图2所示。
进一步,所述步骤1中图片样本包括各类可见物体训练样本,包含动物、植物、矿物、食物及生活中可见物品。用内容丰富的图像对模型进行训练,得到一个可语义识别与分割RGB图像中各类物体的深度学习模型,使得该网络训练模块在不同种类的物体检测中具有较广的普适性,根据不同的训练样本可以得到不同的模型。
步骤2、结合RGB图像将其对应的二值掩膜图像进行轮廓细化步骤:采用轮廓修正算法对二值掩膜图像的轮廓进行细粒度的修正,在二值掩膜图像上得到精细的轮廓形状和位置,轮廓细化模块原理图如图3所示,步骤如下:
步骤2.1、对RGB图像和二值掩膜图像进行图像的目标边缘检测,检测出RGB图像和二值掩膜图像的目标物体边缘。
进一步,所述步骤2.1的目标边缘检测采用Canny边缘检测算法,算法步骤如下:
步骤2.1.1、将图像转换为灰度图,转换公式为:
gray=0.299R+0.587G+0.114B (2-1);
步骤2.1.2、设置高斯方差σ与窗口大小KernelWidth,生成高斯卷积核算子,对灰度图进行高斯卷积模糊,高斯模糊能够整体降低图像噪声,更准确计算图像梯度及边缘。
步骤2.1.3、计算步骤2.1.2所得图像的图像梯度,由x和y方向的梯度计算图像某像素点的梯度幅值和角度,公式如下:
其中,Gx(x,y)为图像在x方向的梯度,Gy(x,y)为图像在y方向的梯度,S为图像在某点的像素值,θ(x,y)为像素点的角度。
步骤2.1.4、基于步骤2.1.3所得像素点的梯度幅值和角度,对步骤2.1.2所得图像进行非最大信号压制处理,通过该步处理边缘像素进一步减少,实现边缘细化。主要思想为:假设3x3的像素区域,中心像素P(x,y)根据上一步中计算得到边缘角度,可以将角度分为四个离散值0°、45°、90°和135°,得到角度之后,比较中心像素角度上相邻两个像素,如果中心像素小于其中任意一个,则舍弃该边缘像素点,否则保留。
步骤2.1.5、对步骤2.1.4所得图像进行双阈值边缘连接处理。过程为:选取高阈值TH和低阈值TL,取出非极大值抑制后的图像中的最大梯度幅值,重新定义高低阈值。将小于TL的点抛弃,赋0;将大于TH的点立即标记(这些点就是边缘点),赋1;将大于TL,小于TH的点使用8连通区域确定(只有与TH像素连接时才会被接受,成为边缘点),赋1。
步骤2.1.6、对步骤2.1.5所得图像进行二值化并输出结果。
步骤2.2、进行轮廓计算,对得到的RGB图像和二值掩膜图像的目标物体边缘建立层级关系,取第二层结果为目标轮廓。边缘层级关系图如图4所示。
步骤2.3、进行轮廓融合,先构建轮廓特征描述,包括轮廓角度信息特征向量和轮廓重心,基于计算出的目标轮廓特征描述,将RGB图像目标轮廓与二值掩膜图像的目标轮廓进行匹配,筛选需要保留的RGB图像目标轮廓然后与二值掩膜图像轮廓进行轮廓融合,在二值掩膜图像上得到精细的轮廓形状和位置。
进一步,所述步骤2.3中构建的轮廓角度信息特征向量为 为轮廓上每个点xi(1≤i≤n)与坐标原点的夹角,计算公式如下:
其中,p为图像上两点分别与相机光心连接所形成的夹角,d1为连接光心与图像上一点x1的直线的方向,d2为连接光心与图像上一点x2的直线的方向,T上标表示矩阵的转置,K为相机内置参数;
构建的轮廓重心为(cx,cy),计算公式如下:
其中,n为这条轮廓上像素值的个数,i为像素的x坐标,j为像素的y坐标,g(i,j)为在点(i,j)位置上像素的大小,p与q为像素在x,y方向的矩的阶数,mpq为中心距,(p+q)为中心距阶数,cx、cy为x轴和y轴方向上的重心坐标值。
进一步,所述步骤2.3中将RGB图像目标轮廓与二值掩膜图像的目标轮廓进行匹配,筛选需要保留的RGB图像目标轮廓的具体过程为:
计算RGB图像上目标轮廓的角度特征向量V=(ρ1,ρ2,...,ρn)、目标重心和掩膜重心,连接目标重心和掩膜重心,判断连线与二值掩膜图像的目标轮廓是否有交点,保留没有交点的目标轮廓和重心与交点距离小于阈值γ的目标轮廓,此处阈值γ是通过大量实验获取的参数,是一个经验值;
再以保留的目标轮廓的重心为一个端点,计算二值掩膜图像目标轮廓上各个点到该点的距离,对计算结果进行从小到大的排序,取前n个距离目标轮廓重心较小的点,并根据构建的轮廓角度信息特征向量计算该n个点组成的轮廓的特征描述U=(δ1,δ2,...,δn),计算向量U与V的余弦距离:
其中U为通过上一段描述方法构成的向量,是二值掩膜图像轮廓上截取了一段构成的向量,V为RGB图像上的目标轮廓构成的向量;
当cosψ小于阈值a时,则保留目标轮廓,否则,剔除该目标轮廓,此处阈值a是通过大量实验获取的参数,是一个经验值。
进一步,所述步骤2.3中保留的目标轮廓与二值掩膜图像进行轮廓融合的过程为:将保留的目标轮廓中所有边缘的所有点与二值掩膜图像上相同位置的点对应,如果对应的二值掩膜图像上点的像素为1,那么二值掩膜图像上该点像素值不变,依然为1,如果对应的二值掩膜图像上点的像素为0,那么二值掩膜图像上该点像素值置为1。
进一步,所述步骤2中还包括对于步骤2.3进行轮廓融合后的二值掩膜图像执行边缘内填充操作步骤。
进一步,所述边缘内填充操作步骤采用膨胀腐蚀操作方法,操作时用闭运算公式计算,先进行膨胀操作,再进行腐蚀操作,公式如下:
为膨胀操作,过程为:1)用结构元素B扫描图像A中的每一个像素;2)用结构元素与其覆盖的二值图像做“与”操作;3)操作结果如果都为0,结果图像的该像素为0,否则为1;
为腐蚀操作,过程为:1)用结构单元B扫描图像A的每一个像素;2)用结构元素与其覆盖的二值图像做“与”操作;3)操作结果如果都为1,结果图像的该像素为1,否则为0。
对于轮廓融合后的二值掩膜图像执行边缘内填充操作步骤,采用膨胀腐蚀操作方法,操作时用闭运算公式计算,先进行膨胀操作,再进行腐蚀操作,能够去掉目标内的孔,连接邻近物体和平滑边界,将轮廓反映射和闭运算操作相结合,得到修正后的二值掩膜轮廓,该方法对maskR-CNN模型输出的轮廓进行了有效修正,提高了实例分割的准确度。
以下结合实施例对本发明的特征和性能作进一步的详细描述。
实施例1
本发明较佳实施例提供的一种基于mask-RCNN的物体轮廓提取方法,过程为:
对待提取物体轮廓的RGB图进行复制,得到图像IM1和图像IM2,IM1与IM2完全相同。
第一步:使用获取的ImageNet训练样本预训练得到mask-RCNN模型,将IM1输入得到的mask-RCNN模型进行语义分割,可以获得场景中各个物体的二值掩膜图像。假设当前得到物体A的掩膜图像K1,掩膜图像K1与IM1图像同等大小,物体A所在的区域标记为1,而掩膜图像的其他区域标记为0。由于实际操作中得到的掩膜图像的物体A的区域与原RGB图像的物体A区域不能完全重合,边缘粗糙,因此接下来在轮廓细化模块中进行进一步的边缘细化操作。
第二步、采用Canny边缘检测算法对IM2进行边缘检测,得到边缘检测图像E1,使用Canny边缘检测算法对K1进行边缘检测,得到边缘检测图像E2。
第三步、进行轮廓计算,检测图像目标边缘,对所有边缘建立层级关系,取第二层结果为目标轮廓,由于在实际操作中RGB图像噪声比较多,纹理复杂,因此根据上述操作只能得到所有物体的最外部轮廓片段列表,假设对E1操作得到L1={e_1,e_2,e_3,e_4};使用上述计算轮廓模块对E2进行检测与组织,由于在实际操作中得到的物体掩膜图像比较完整,因此可以得到物体A的大致轮廓L2。
第四步、计算轮廓角度信息特征向量轮廓重心(cx,cy)和轮廓方向θ,基于计算的轮廓特征描述,将RGB图像目标轮廓与二值掩膜图像的目标轮廓进行匹配,筛选需要保留的RGB图像目标轮廓。L1中的e1,假设e1由n个点构成,对构成e1的每个点(xi,yi)(0<i≤n,i∈R),计算得到其轮廓角度信息特征向量F1,与其重心坐标M1(mx1,my1);同时计算L2的重心坐标M2(mx2,my2)。连结M1与M2,如果没有交点或者M1与交点距离小于阈值γ,说明M1在轮廓L2内,继续计算M1到L2上各点(x′i,y′i)的距离dj,假设L2上的点为t个,那么0<j≤t,j∈R,对d1到dt进行从小到大排序,根据这个距离对应的L2上的点,取其前n个距离M1最近的点,构成列表{p1,p2,p3,…,pn},根据轮廓特征描述进行L2轮廓特征计算,得到轮廓角度信息特征向量F2,计算F1与F2的余弦距离,具体计算公式为:
当小于阈值a时,可以判断e1是属于物体A的轮廓。
第五步、根据第四步保留的L1中的轮廓,假设是L′={e1,e2,e3},与掩膜图像K1进行轮廓融合。具体操作为,如e1上的每个点坐标(xi,yi),对应于K1上相同位置的像素,如果其像素值为1,那么该点像素值不变,仍为1,如果像素值为0,则该点像素值置为1。对于L′中的所有边缘的所有点执行如上操作。
第六步、对于第五步得到的掩膜图像,执行边缘内填充操作,这里采用膨胀腐蚀操作,进行闭运算,具体操作为:
闭运算有去掉目标内的孔,连接邻近物体和平滑边界的作用。先进行膨胀操作,再进行腐蚀操作。
为膨胀操作,过程为:
1)用结构元素B扫描图像A中的每一个像素。
2)用结构元素与其覆盖的二值图像做“与”操作。
3)操作结果如果都为0,结果图像的该像素为0,否则为1。
为腐蚀操作,过程为:
1)用结构单元B扫描图像A的每一个像素。
2)用结构元素与其覆盖的二值图像做“与”操作。
3)操作结果如果都为1,结果图像的该像素为1,否则为0。
通过上述所有步骤后,得到细化后的精细的物体轮廓。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于mask-RCNN的物体轮廓提取方法,其特征在于:方法包括如下步骤:
步骤1、输入图片样本生成具有提取图像二值掩膜功能的mask-RCNN模型,将待提取物体轮廓的RGB图像输入生成的mask-RCNN模型进行语义分割,得到RGB图像对应的二值掩膜图像;
步骤2、结合RGB图像将其对应的二值掩膜图像进行轮廓细化步骤:采用轮廓修正算法对二值掩膜图像的轮廓进行细粒度的修正,先提取RGB图像和对应的二值掩膜图像的目标轮廓,再构建轮廓特征描述,包括轮廓角度信息特征向量和轮廓重心,基于计算出的目标轮廓特征描述,将RGB图像目标轮廓与二值掩膜图像的目标轮廓进行匹配,筛选需要保留的RGB图像目标轮廓然后与二值掩膜图像轮廓进行轮廓融合,在二值掩膜图像上得到精细的轮廓形状和位置。
2.根据权利要求1所述的一种基于mask-RCNN的物体轮廓提取方法,其特征在于:所述步骤2详细步骤如下:
步骤2.1、对RGB图像和二值掩膜图像进行图像的目标边缘检测,检测出RGB图像和二值掩膜图像的目标物体边缘;
步骤2.2、进行轮廓计算,对得到的RGB图像和二值掩膜图像的目标物体边缘建立层级关系,取第二层结果为目标轮廓;
步骤2.3、进行轮廓融合,先构建轮廓特征描述,包括轮廓角度信息特征向量和轮廓重心,基于计算出的目标轮廓特征描述,将RGB图像目标轮廓与二值掩膜图像的目标轮廓进行匹配,筛选需要保留的RGB图像目标轮廓然后与二值掩膜图像进行轮廓融合,在二值掩膜图像上得到精细的轮廓形状和位置。
3.根据权利要求1所述的一种基于mask-RCNN的物体轮廓提取方法,其特征在于:所述步骤2中mask-RCNN模型包括部件为:ROI对齐、卷积层和分类器。
4.根据权利要求1或2所述的一种基于mask-RCNN的物体轮廓提取方法,其特征在于:所述步骤2中还包括对进行轮廓融合后的二值掩膜图像执行边缘内填充操作步骤。
5.根据权利要求4所述的一种基于mask-RCNN的物体轮廓提取方法,其特征在于:所述边缘内填充操作步骤采用膨胀腐蚀操作方法,操作时用闭运算公式计算,先进行膨胀操作,再进行腐蚀操作,公式如下:
为膨胀操作,过程为:1)用结构元素B扫描图像A中的每一个像素;2)用结构元素与其覆盖的二值图像做“与”操作;3)操作结果如果都为0,结果图像的该像素为0,否则为1;
为腐蚀操作,过程为:1)用结构单元B扫描图像A的每一个像素;2)用结构元素与其覆盖的二值图像做“与”操作;3)操作结果如果都为1,结果图像的该像素为1,否则为0。
6.根据权利要求1所述的一种基于mask-RCNN的物体轮廓提取方法,其特征在于:所述步骤1中图片样本包括各类可见物体训练样本,包含动物、植物、矿物、食物及生活中可见物品。
7.根据权利要求2所述的一种基于mask-RCNN的物体轮廓提取方法,其特征在于:所述步骤2.1的目标边缘检测采用Canny边缘检测算法,算法步骤如下:
步骤2.1.1、将图像转换为灰度图,转换公式为:
gray=0.299R+0.587G+0.114B (2-1);
步骤2.1.2、设置高斯方差σ与窗口大小KernelWidth,生成高斯卷积核算子,对灰度图进行高斯卷积模糊;
步骤2.1.3、计算步骤2.1.2所得图像的图像梯度,由x和y方向的梯度计算图像某像素点的梯度幅值和角度,公式如下:
其中,Gx(x,y)为图像在x方向的梯度,Gy(x,y)为图像在y方向的梯度,S为图像在某点的像素值,θ(x,y)为像素点的角度;
步骤2.1.4、基于步骤2.1.3所得像素点的梯度幅值和角度,对步骤2.1.2所得图像进行非最大信号压制处理;
步骤2.1.5、对步骤2.1.4所得图像进行双阈值边缘连接处理;
步骤2.1.6、对步骤2.1.5所得图像进行二值化并输出结果。
8.根据权利要求1或2所述的一种基于mask-RCNN的物体轮廓提取方法,其特征在于:所述步骤2中构建的轮廓角度信息特征向量为 为轮廓上每个点xi(1≤i≤n)与坐标原点的夹角,计算公式如下:
其中,p为图像上两点分别与相机光心连接所形成的夹角,d1为连接光心与图像上一点x1的直线的方向,d2为连接光心与图像上一点x2的直线的方向,T上标表示矩阵的转置,K为相机内置参数;
构建的轮廓重心为(cx,cy),计算公式如下:
其中,n为这条轮廓上像素值的个数,i为像素的x坐标,j为像素的y坐标,g(i,j)为在点(i,j)位置上像素的大小,p与q为像素在x,y方向的矩的阶数,mpq为中心距,(p+q)为中心距阶数,cx、cy为x轴和y轴方向上的重心坐标值。
9.根据权利要求1或2所述的一种基于mask-RCNN的物体轮廓提取方法,其特征在于:所述步骤2中将RGB图像目标轮廓与二值掩膜图像的目标轮廓进行匹配,筛选需要保留的RGB图像目标轮廓的具体过程为:
计算RGB图像上目标轮廓的角度特征向量V=(ρ1,ρ2,…,ρn)、目标重心和掩膜重心,连接目标重心和掩膜重心,判断连线与二值掩膜图像的目标轮廓是否有交点,保留没有交点的目标轮廓和重心与交点距离小于阈值γ的目标轮廓;
再以保留的目标轮廓的重心为一个端点,计算二值掩膜图像目标轮廓上各个点到该点的距离,对计算结果进行从小到大的排序,取前n个距离目标轮廓重心较小的点,并根据构建的轮廓角度信息特征向量计算该n个点组成的轮廓的特征描述U=(δ1,δ2,…,δn),计算向量U与V的余弦距离:
其中U为通过上一段描述方法构成的向量,是二值掩膜图像轮廓上截取了一段构成的向量,V为RGB图像上的目标轮廓构成的向量;
当cosψ小于阈值a时,则保留目标轮廓,否则,剔除该目标轮廓。
10.根据权利要求1或2所述的一种基于mask-RCNN的物体轮廓提取方法,其特征在于:所述步骤2中保留的目标轮廓与二值掩膜图像进行轮廓融合的过程为:将保留的目标轮廓中所有边缘的所有点与二值掩膜图像上相同位置的点对应,如果对应的二值掩膜图像上点的像素为1,那么二值掩膜图像上该点像素值不变,依然为1,如果对应的二值掩膜图像上点的像素为0,那么二值掩膜图像上该点像素值置为1。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810810429.5A CN108898610B (zh) | 2018-07-20 | 2018-07-20 | 一种基于mask-RCNN的物体轮廓提取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810810429.5A CN108898610B (zh) | 2018-07-20 | 2018-07-20 | 一种基于mask-RCNN的物体轮廓提取方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108898610A true CN108898610A (zh) | 2018-11-27 |
CN108898610B CN108898610B (zh) | 2020-11-20 |
Family
ID=64352461
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810810429.5A Active CN108898610B (zh) | 2018-07-20 | 2018-07-20 | 一种基于mask-RCNN的物体轮廓提取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108898610B (zh) |
Cited By (60)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109711325A (zh) * | 2018-12-25 | 2019-05-03 | 华南农业大学 | 一种芒果采摘点识别方法 |
CN109717830A (zh) * | 2019-01-22 | 2019-05-07 | 中国科学院苏州生物医学工程技术研究所 | 基于眼动及头动参数监测的疲劳检测及促醒系统 |
CN109815843A (zh) * | 2018-12-29 | 2019-05-28 | 深圳云天励飞技术有限公司 | 目标检测方法及相关产品 |
CN109815874A (zh) * | 2019-01-17 | 2019-05-28 | 苏州科达科技股份有限公司 | 一种人员身份识别方法、装置、设备及可读存储介质 |
CN109903300A (zh) * | 2019-01-15 | 2019-06-18 | 浙江工业大学 | 一种适用于先天性盲人学习识图的智能触点显示方法及装置 |
CN109977782A (zh) * | 2019-02-27 | 2019-07-05 | 浙江工业大学 | 基于目标位置信息推理的跨店经营行为检测方法 |
CN110059690A (zh) * | 2019-03-28 | 2019-07-26 | 广州智方信息科技有限公司 | 基于深度卷积神经网络的户型图语义自动分析方法及系统 |
CN110147778A (zh) * | 2019-05-27 | 2019-08-20 | 江西理工大学 | 稀土矿开采识别方法、装置、设备及存储介质 |
CN110176017A (zh) * | 2019-03-01 | 2019-08-27 | 北京纵目安驰智能科技有限公司 | 一种基于目标检测的边缘检测模型、方法和存储介质 |
CN110197129A (zh) * | 2019-05-09 | 2019-09-03 | 常州大学 | 一种自然环境下果蔬生长形态视觉辨识方法 |
CN110263789A (zh) * | 2019-02-18 | 2019-09-20 | 北京爱数智慧科技有限公司 | 一种物体边界识别方法、装置及设备 |
CN110298884A (zh) * | 2019-05-27 | 2019-10-01 | 重庆高开清芯科技产业发展有限公司 | 一种适于动态环境中单目视觉相机的位姿估计方法 |
CN110321889A (zh) * | 2019-04-23 | 2019-10-11 | 成都数之联科技有限公司 | 一种图片文件中插图定位提取方法及系统 |
CN110378327A (zh) * | 2019-07-09 | 2019-10-25 | 浙江大学 | 添加辅助性显著特征的目标检测装置及方法 |
CN110413824A (zh) * | 2019-06-20 | 2019-11-05 | 平安科技(深圳)有限公司 | 一种相似图片的检索方法及装置 |
CN110490212A (zh) * | 2019-02-26 | 2019-11-22 | 腾讯科技(深圳)有限公司 | 钼靶影像处理设备、方法和装置 |
CN110516524A (zh) * | 2019-06-26 | 2019-11-29 | 东南大学 | 一种交通场景中基于Mask R-CNN的车辆轴数识别方法 |
CN110610453A (zh) * | 2019-09-02 | 2019-12-24 | 腾讯科技(深圳)有限公司 | 一种图像处理方法、装置及计算机可读存储介质 |
CN110675407A (zh) * | 2019-09-17 | 2020-01-10 | 北京达佳互联信息技术有限公司 | 一种图像实例分割方法、装置、电子设备及存储介质 |
CN110689527A (zh) * | 2019-09-18 | 2020-01-14 | 北京航空航天大学 | 飞机线缆支架的安装状态检测方法、装置及设备 |
CN110738673A (zh) * | 2019-10-21 | 2020-01-31 | 哈尔滨理工大学 | 基于实例分割的视觉slam方法 |
CN110866930A (zh) * | 2019-11-18 | 2020-03-06 | 北京云聚智慧科技有限公司 | 语义分割辅助标注方法与装置 |
CN110910360A (zh) * | 2019-11-14 | 2020-03-24 | 腾讯云计算(北京)有限责任公司 | 电网图像的定位方法和图像定位模型的训练方法 |
CN111046950A (zh) * | 2019-12-11 | 2020-04-21 | 北京迈格威科技有限公司 | 一种图像处理方法、装置、存储介质和电子装置 |
CN111079817A (zh) * | 2019-12-12 | 2020-04-28 | 哈尔滨市科佳通用机电股份有限公司 | 一种铁路货车横跨梁故障图像识别方法 |
CN111179289A (zh) * | 2019-12-31 | 2020-05-19 | 重庆邮电大学 | 一种适用于网页长图宽图的图像分割方法 |
CN111178197A (zh) * | 2019-12-19 | 2020-05-19 | 华南农业大学 | 基于Mask R-CNN和Soft-NMS融合的群养粘连猪实例分割方法 |
CN111259772A (zh) * | 2020-01-13 | 2020-06-09 | 广州虎牙科技有限公司 | 图像标注方法、装置、设备和介质 |
CN111369565A (zh) * | 2020-03-09 | 2020-07-03 | 麦克奥迪(厦门)医疗诊断系统有限公司 | 一种基于图卷积网络的数字病理图像的分割与分类方法 |
CN111476798A (zh) * | 2020-03-20 | 2020-07-31 | 长安大学 | 一种基于轮廓约束的车辆空间形态识别方法及系统 |
CN111476343A (zh) * | 2019-01-23 | 2020-07-31 | 斯特拉德视觉公司 | 利用掩蔽参数的方法和装置 |
CN111507334A (zh) * | 2019-01-30 | 2020-08-07 | 中国科学院宁波材料技术与工程研究所 | 一种基于关键点的实例分割方法 |
CN111563871A (zh) * | 2019-10-23 | 2020-08-21 | 深圳市今天国际物流技术股份有限公司 | 图像处理方法、装置、设备和视觉引导拆垛方法、系统 |
CN111564072A (zh) * | 2020-06-09 | 2020-08-21 | 暗物智能科技(广州)有限公司 | 一种平面几何自动出题方法及系统 |
CN111598903A (zh) * | 2020-05-21 | 2020-08-28 | Oppo广东移动通信有限公司 | 人像分割方法、装置、存储介质和电子设备 |
CN111627078A (zh) * | 2019-02-28 | 2020-09-04 | 现代摩比斯株式会社 | 自动图像合成装置与方法 |
CN111767764A (zh) * | 2019-04-02 | 2020-10-13 | 丰图科技(深圳)有限公司 | 建筑楼块的识别方法、装置、服务器及存储介质 |
CN111784627A (zh) * | 2020-04-10 | 2020-10-16 | 福建电子口岸股份有限公司 | 一种车辆的集装箱对位方法 |
CN111860652A (zh) * | 2020-07-22 | 2020-10-30 | 中国平安财产保险股份有限公司 | 基于图像检测的动物体重测量方法、装置、设备及介质 |
CN111859805A (zh) * | 2020-07-21 | 2020-10-30 | 国网山东省电力公司青岛供电公司 | 基于人工智能的电力图纸拓扑关系的检测方法 |
WO2021031506A1 (zh) * | 2019-08-22 | 2021-02-25 | 北京市商汤科技开发有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN112509030A (zh) * | 2020-12-14 | 2021-03-16 | 华中科技大学 | 多目标检测的植物测量方法、系统、计算机设备及介质 |
CN112561850A (zh) * | 2019-09-26 | 2021-03-26 | 上海汽车集团股份有限公司 | 一种汽车涂胶检测方法、设备及存储介质 |
CN112634257A (zh) * | 2020-12-31 | 2021-04-09 | 常州奥创医疗科技有限公司 | 一种真菌荧光检测方法 |
CN112784713A (zh) * | 2021-01-08 | 2021-05-11 | 深圳喜为智慧科技有限公司 | 一种基于图像的猪体重估测方法、系统、设备及存储介质 |
CN112883900A (zh) * | 2021-03-12 | 2021-06-01 | 中科三清科技有限公司 | 遥感影像裸地反演可视图的方法及装置 |
CN112926551A (zh) * | 2021-04-21 | 2021-06-08 | 北京京东乾石科技有限公司 | 目标检测方法、装置、电子设备和存储介质 |
CN113112504A (zh) * | 2021-04-08 | 2021-07-13 | 浙江大学 | 一种植物点云数据分割方法及系统 |
CN113177502A (zh) * | 2021-05-13 | 2021-07-27 | 北京罗克维尔斯科技有限公司 | 环视障碍物检测方法、装置、介质、车载系统以及车辆 |
CN113297991A (zh) * | 2021-05-28 | 2021-08-24 | 杭州萤石软件有限公司 | 一种行为识别方法、装置及设备 |
US20210279883A1 (en) * | 2020-03-05 | 2021-09-09 | Alibaba Group Holding Limited | Image processing method, apparatus, electronic device, and storage medium |
CN113538340A (zh) * | 2021-06-24 | 2021-10-22 | 武汉中科医疗科技工业技术研究院有限公司 | 目标轮廓的检测方法、装置、计算机设备和存储介质 |
CN113723505A (zh) * | 2021-08-30 | 2021-11-30 | 上海大学 | 一种基于细胞骨架图像定量分析的细胞图像分类方法及其分类器 |
CN113781473A (zh) * | 2021-09-28 | 2021-12-10 | 无锡时代天使医疗器械科技有限公司 | 壳状膜片的压膜清晰度检测方法、装置、设备及介质 |
CN114299086A (zh) * | 2021-12-24 | 2022-04-08 | 深圳明锐理想科技有限公司 | 一种低对比度成像的图像分割处理方法、电子设备及系统 |
CN114724107A (zh) * | 2022-03-21 | 2022-07-08 | 北京卓视智通科技有限责任公司 | 一种图像检测方法、装置、设备及介质 |
CN115359065A (zh) * | 2022-10-24 | 2022-11-18 | 广州市玄武无线科技股份有限公司 | 一种排面图像的倾斜检测方法和装置 |
CN117522866A (zh) * | 2024-01-03 | 2024-02-06 | 西北工业大学 | 基于掩膜的荧光微丝试验图像中丝线锚点的判别方法 |
EP4198889A4 (en) * | 2020-11-02 | 2024-02-07 | Tencent Tech Shenzhen Co Ltd | IMAGE PROCESSING METHOD AND APPARATUS BASED ON ARTIFICIAL INTELLIGENCE, AND COMPUTER DEVICE AND STORAGE MEDIUM |
CN111563871B (zh) * | 2019-10-23 | 2024-04-12 | 深圳市今天国际物流技术股份有限公司 | 图像处理方法、装置、设备和视觉引导拆垛方法、系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108229353A (zh) * | 2017-12-21 | 2018-06-29 | 深圳市商汤科技有限公司 | 人体图像的分类方法和装置、电子设备、存储介质、程序 |
-
2018
- 2018-07-20 CN CN201810810429.5A patent/CN108898610B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108229353A (zh) * | 2017-12-21 | 2018-06-29 | 深圳市商汤科技有限公司 | 人体图像的分类方法和装置、电子设备、存储介质、程序 |
Non-Patent Citations (3)
Title |
---|
MARMANIS.D等: "Classification with an edge: Improving semantic with boundary detection", 《ISPRS JOURNAL OF PHOTOGRAMMETRY AND REMOTE SENSING》 * |
SYED AFTAB MEHMOOD等: "Semantic Image Segmentation using Canny-Edge Detector", 《INTERNATIONAL CONFERENCE ON ENGINEERING, COMPUTING & INFORMATION TECHNOLOGY (ICECIT 2017)》 * |
YAN XU等: "Gland Instance Segmentation Using Deep Multichannel Neural Networks", 《IEEE TRANSACTIONS ON BIOMEDICAL ENGINEERING》 * |
Cited By (88)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109711325B (zh) * | 2018-12-25 | 2023-05-23 | 华南农业大学 | 一种芒果采摘点识别方法 |
CN109711325A (zh) * | 2018-12-25 | 2019-05-03 | 华南农业大学 | 一种芒果采摘点识别方法 |
CN109815843A (zh) * | 2018-12-29 | 2019-05-28 | 深圳云天励飞技术有限公司 | 目标检测方法及相关产品 |
CN109903300A (zh) * | 2019-01-15 | 2019-06-18 | 浙江工业大学 | 一种适用于先天性盲人学习识图的智能触点显示方法及装置 |
CN109903300B (zh) * | 2019-01-15 | 2021-05-18 | 浙江工业大学 | 一种适用于先天性盲人学习识图的智能触点显示方法及装置 |
CN109815874A (zh) * | 2019-01-17 | 2019-05-28 | 苏州科达科技股份有限公司 | 一种人员身份识别方法、装置、设备及可读存储介质 |
CN109717830A (zh) * | 2019-01-22 | 2019-05-07 | 中国科学院苏州生物医学工程技术研究所 | 基于眼动及头动参数监测的疲劳检测及促醒系统 |
CN111476343B (zh) * | 2019-01-23 | 2023-05-26 | 斯特拉德视觉公司 | 利用掩蔽参数的方法和装置 |
CN111476343A (zh) * | 2019-01-23 | 2020-07-31 | 斯特拉德视觉公司 | 利用掩蔽参数的方法和装置 |
CN111507334A (zh) * | 2019-01-30 | 2020-08-07 | 中国科学院宁波材料技术与工程研究所 | 一种基于关键点的实例分割方法 |
CN111507334B (zh) * | 2019-01-30 | 2024-03-12 | 中国科学院宁波材料技术与工程研究所 | 一种基于关键点的实例分割方法 |
CN110263789A (zh) * | 2019-02-18 | 2019-09-20 | 北京爱数智慧科技有限公司 | 一种物体边界识别方法、装置及设备 |
CN110490212A (zh) * | 2019-02-26 | 2019-11-22 | 腾讯科技(深圳)有限公司 | 钼靶影像处理设备、方法和装置 |
CN110490212B (zh) * | 2019-02-26 | 2022-11-08 | 腾讯科技(深圳)有限公司 | 钼靶影像处理设备、方法和装置 |
CN109977782B (zh) * | 2019-02-27 | 2021-01-08 | 浙江工业大学 | 基于目标位置信息推理的跨店经营行为检测方法 |
CN109977782A (zh) * | 2019-02-27 | 2019-07-05 | 浙江工业大学 | 基于目标位置信息推理的跨店经营行为检测方法 |
CN111627078A (zh) * | 2019-02-28 | 2020-09-04 | 现代摩比斯株式会社 | 自动图像合成装置与方法 |
CN111627078B (zh) * | 2019-02-28 | 2023-09-19 | 现代摩比斯株式会社 | 自动图像合成装置与方法 |
CN110176017A (zh) * | 2019-03-01 | 2019-08-27 | 北京纵目安驰智能科技有限公司 | 一种基于目标检测的边缘检测模型、方法和存储介质 |
CN110059690A (zh) * | 2019-03-28 | 2019-07-26 | 广州智方信息科技有限公司 | 基于深度卷积神经网络的户型图语义自动分析方法及系统 |
CN111767764A (zh) * | 2019-04-02 | 2020-10-13 | 丰图科技(深圳)有限公司 | 建筑楼块的识别方法、装置、服务器及存储介质 |
CN110321889A (zh) * | 2019-04-23 | 2019-10-11 | 成都数之联科技有限公司 | 一种图片文件中插图定位提取方法及系统 |
CN110197129A (zh) * | 2019-05-09 | 2019-09-03 | 常州大学 | 一种自然环境下果蔬生长形态视觉辨识方法 |
CN110147778A (zh) * | 2019-05-27 | 2019-08-20 | 江西理工大学 | 稀土矿开采识别方法、装置、设备及存储介质 |
CN110298884A (zh) * | 2019-05-27 | 2019-10-01 | 重庆高开清芯科技产业发展有限公司 | 一种适于动态环境中单目视觉相机的位姿估计方法 |
CN110413824A (zh) * | 2019-06-20 | 2019-11-05 | 平安科技(深圳)有限公司 | 一种相似图片的检索方法及装置 |
CN110516524A (zh) * | 2019-06-26 | 2019-11-29 | 东南大学 | 一种交通场景中基于Mask R-CNN的车辆轴数识别方法 |
CN110378327A (zh) * | 2019-07-09 | 2019-10-25 | 浙江大学 | 添加辅助性显著特征的目标检测装置及方法 |
CN110378327B (zh) * | 2019-07-09 | 2021-05-18 | 浙江大学 | 添加辅助性显著特征的目标检测装置及方法 |
CN112419328A (zh) * | 2019-08-22 | 2021-02-26 | 北京市商汤科技开发有限公司 | 图像处理方法及装置、电子设备和存储介质 |
WO2021031506A1 (zh) * | 2019-08-22 | 2021-02-25 | 北京市商汤科技开发有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN110610453A (zh) * | 2019-09-02 | 2019-12-24 | 腾讯科技(深圳)有限公司 | 一种图像处理方法、装置及计算机可读存储介质 |
CN110675407B (zh) * | 2019-09-17 | 2022-08-05 | 北京达佳互联信息技术有限公司 | 一种图像实例分割方法、装置、电子设备及存储介质 |
CN110675407A (zh) * | 2019-09-17 | 2020-01-10 | 北京达佳互联信息技术有限公司 | 一种图像实例分割方法、装置、电子设备及存储介质 |
CN110689527B (zh) * | 2019-09-18 | 2021-08-24 | 北京航空航天大学 | 飞机线缆支架的安装状态检测方法、装置及设备 |
CN110689527A (zh) * | 2019-09-18 | 2020-01-14 | 北京航空航天大学 | 飞机线缆支架的安装状态检测方法、装置及设备 |
CN112561850A (zh) * | 2019-09-26 | 2021-03-26 | 上海汽车集团股份有限公司 | 一种汽车涂胶检测方法、设备及存储介质 |
CN110738673A (zh) * | 2019-10-21 | 2020-01-31 | 哈尔滨理工大学 | 基于实例分割的视觉slam方法 |
CN111563871A (zh) * | 2019-10-23 | 2020-08-21 | 深圳市今天国际物流技术股份有限公司 | 图像处理方法、装置、设备和视觉引导拆垛方法、系统 |
CN111563871B (zh) * | 2019-10-23 | 2024-04-12 | 深圳市今天国际物流技术股份有限公司 | 图像处理方法、装置、设备和视觉引导拆垛方法、系统 |
CN110910360A (zh) * | 2019-11-14 | 2020-03-24 | 腾讯云计算(北京)有限责任公司 | 电网图像的定位方法和图像定位模型的训练方法 |
CN110866930B (zh) * | 2019-11-18 | 2022-04-12 | 北京云聚智慧科技有限公司 | 语义分割辅助标注方法与装置 |
CN110866930A (zh) * | 2019-11-18 | 2020-03-06 | 北京云聚智慧科技有限公司 | 语义分割辅助标注方法与装置 |
CN111046950A (zh) * | 2019-12-11 | 2020-04-21 | 北京迈格威科技有限公司 | 一种图像处理方法、装置、存储介质和电子装置 |
CN111046950B (zh) * | 2019-12-11 | 2023-09-22 | 北京迈格威科技有限公司 | 一种图像处理方法、装置、存储介质和电子装置 |
CN111079817A (zh) * | 2019-12-12 | 2020-04-28 | 哈尔滨市科佳通用机电股份有限公司 | 一种铁路货车横跨梁故障图像识别方法 |
CN111079817B (zh) * | 2019-12-12 | 2020-11-27 | 哈尔滨市科佳通用机电股份有限公司 | 一种铁路货车横跨梁故障图像识别方法 |
CN111178197A (zh) * | 2019-12-19 | 2020-05-19 | 华南农业大学 | 基于Mask R-CNN和Soft-NMS融合的群养粘连猪实例分割方法 |
CN111178197B (zh) * | 2019-12-19 | 2023-04-07 | 华南农业大学 | 基于Mask R-CNN和Soft-NMS融合的群养粘连猪实例分割方法 |
CN111179289A (zh) * | 2019-12-31 | 2020-05-19 | 重庆邮电大学 | 一种适用于网页长图宽图的图像分割方法 |
CN111259772A (zh) * | 2020-01-13 | 2020-06-09 | 广州虎牙科技有限公司 | 图像标注方法、装置、设备和介质 |
US11816842B2 (en) * | 2020-03-05 | 2023-11-14 | Alibaba Group Holding Limited | Image processing method, apparatus, electronic device, and storage medium |
US20210279883A1 (en) * | 2020-03-05 | 2021-09-09 | Alibaba Group Holding Limited | Image processing method, apparatus, electronic device, and storage medium |
CN111369565A (zh) * | 2020-03-09 | 2020-07-03 | 麦克奥迪(厦门)医疗诊断系统有限公司 | 一种基于图卷积网络的数字病理图像的分割与分类方法 |
CN111369565B (zh) * | 2020-03-09 | 2023-09-15 | 麦克奥迪(厦门)医疗诊断系统有限公司 | 一种基于图卷积网络的数字病理图像的分割与分类方法 |
CN111476798B (zh) * | 2020-03-20 | 2023-05-16 | 上海遨遥人工智能科技有限公司 | 一种基于轮廓约束的车辆空间形态识别方法及系统 |
CN111476798A (zh) * | 2020-03-20 | 2020-07-31 | 长安大学 | 一种基于轮廓约束的车辆空间形态识别方法及系统 |
CN111784627A (zh) * | 2020-04-10 | 2020-10-16 | 福建电子口岸股份有限公司 | 一种车辆的集装箱对位方法 |
CN111598903A (zh) * | 2020-05-21 | 2020-08-28 | Oppo广东移动通信有限公司 | 人像分割方法、装置、存储介质和电子设备 |
CN111598903B (zh) * | 2020-05-21 | 2023-09-29 | Oppo广东移动通信有限公司 | 人像分割方法、装置、存储介质和电子设备 |
CN111564072A (zh) * | 2020-06-09 | 2020-08-21 | 暗物智能科技(广州)有限公司 | 一种平面几何自动出题方法及系统 |
CN111859805B (zh) * | 2020-07-21 | 2023-08-29 | 国网山东省电力公司青岛供电公司 | 基于人工智能的电力图纸拓扑关系的检测方法 |
CN111859805A (zh) * | 2020-07-21 | 2020-10-30 | 国网山东省电力公司青岛供电公司 | 基于人工智能的电力图纸拓扑关系的检测方法 |
CN111860652A (zh) * | 2020-07-22 | 2020-10-30 | 中国平安财产保险股份有限公司 | 基于图像检测的动物体重测量方法、装置、设备及介质 |
CN111860652B (zh) * | 2020-07-22 | 2022-03-29 | 中国平安财产保险股份有限公司 | 基于图像检测的动物体重测量方法、装置、设备及介质 |
EP4198889A4 (en) * | 2020-11-02 | 2024-02-07 | Tencent Tech Shenzhen Co Ltd | IMAGE PROCESSING METHOD AND APPARATUS BASED ON ARTIFICIAL INTELLIGENCE, AND COMPUTER DEVICE AND STORAGE MEDIUM |
CN112509030B (zh) * | 2020-12-14 | 2022-05-31 | 华中科技大学 | 多目标检测的植物测量方法、系统、计算机设备及介质 |
CN112509030A (zh) * | 2020-12-14 | 2021-03-16 | 华中科技大学 | 多目标检测的植物测量方法、系统、计算机设备及介质 |
CN112634257B (zh) * | 2020-12-31 | 2023-10-27 | 常州奥创医疗科技有限公司 | 一种真菌荧光检测方法 |
CN112634257A (zh) * | 2020-12-31 | 2021-04-09 | 常州奥创医疗科技有限公司 | 一种真菌荧光检测方法 |
CN112784713A (zh) * | 2021-01-08 | 2021-05-11 | 深圳喜为智慧科技有限公司 | 一种基于图像的猪体重估测方法、系统、设备及存储介质 |
CN112883900A (zh) * | 2021-03-12 | 2021-06-01 | 中科三清科技有限公司 | 遥感影像裸地反演可视图的方法及装置 |
CN113112504B (zh) * | 2021-04-08 | 2023-11-03 | 浙江大学 | 一种植物点云数据分割方法及系统 |
CN113112504A (zh) * | 2021-04-08 | 2021-07-13 | 浙江大学 | 一种植物点云数据分割方法及系统 |
CN112926551A (zh) * | 2021-04-21 | 2021-06-08 | 北京京东乾石科技有限公司 | 目标检测方法、装置、电子设备和存储介质 |
CN113177502A (zh) * | 2021-05-13 | 2021-07-27 | 北京罗克维尔斯科技有限公司 | 环视障碍物检测方法、装置、介质、车载系统以及车辆 |
CN113177502B (zh) * | 2021-05-13 | 2024-02-02 | 北京罗克维尔斯科技有限公司 | 环视障碍物检测方法、装置、介质、车载系统以及车辆 |
CN113297991A (zh) * | 2021-05-28 | 2021-08-24 | 杭州萤石软件有限公司 | 一种行为识别方法、装置及设备 |
CN113538340A (zh) * | 2021-06-24 | 2021-10-22 | 武汉中科医疗科技工业技术研究院有限公司 | 目标轮廓的检测方法、装置、计算机设备和存储介质 |
CN113723505A (zh) * | 2021-08-30 | 2021-11-30 | 上海大学 | 一种基于细胞骨架图像定量分析的细胞图像分类方法及其分类器 |
CN113723505B (zh) * | 2021-08-30 | 2024-04-23 | 上海大学 | 一种基于细胞骨架图像定量分析的细胞图像分类方法及其分类器 |
CN113781473A (zh) * | 2021-09-28 | 2021-12-10 | 无锡时代天使医疗器械科技有限公司 | 壳状膜片的压膜清晰度检测方法、装置、设备及介质 |
CN114299086A (zh) * | 2021-12-24 | 2022-04-08 | 深圳明锐理想科技有限公司 | 一种低对比度成像的图像分割处理方法、电子设备及系统 |
CN114724107B (zh) * | 2022-03-21 | 2023-09-01 | 北京卓视智通科技有限责任公司 | 一种图像检测方法、装置、设备及介质 |
CN114724107A (zh) * | 2022-03-21 | 2022-07-08 | 北京卓视智通科技有限责任公司 | 一种图像检测方法、装置、设备及介质 |
CN115359065A (zh) * | 2022-10-24 | 2022-11-18 | 广州市玄武无线科技股份有限公司 | 一种排面图像的倾斜检测方法和装置 |
CN117522866A (zh) * | 2024-01-03 | 2024-02-06 | 西北工业大学 | 基于掩膜的荧光微丝试验图像中丝线锚点的判别方法 |
CN117522866B (zh) * | 2024-01-03 | 2024-03-15 | 西北工业大学 | 基于掩膜的荧光微丝试验图像中丝线锚点的判别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108898610B (zh) | 2020-11-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108898610A (zh) | 一种基于mask-RCNN的物体轮廓提取方法 | |
CN109961049B (zh) | 一种复杂场景下香烟品牌识别方法 | |
CN103886589B (zh) | 面向目标的自动化高精度边缘提取方法 | |
CN108154519A (zh) | 眼底图像中血管的分割方法、装置及存储介质 | |
CN112967243A (zh) | 一种基于yolo的深度学习芯片封装裂纹缺陷检测方法 | |
Liu et al. | A fabric defect detection method based on deep learning | |
CN108416789A (zh) | 图像边缘检测方法及系统 | |
CN108022233A (zh) | 一种基于改进型Canny算子的工件边缘提取方法 | |
CN106709568A (zh) | 基于深层卷积网络的rgb‑d图像的物体检测和语义分割方法 | |
CN105913415A (zh) | 一种具有广泛适应性的图像亚像素边缘提取方法 | |
CN112560675B (zh) | Yolo与旋转-融合策略相结合的鸟类视觉目标检测方法 | |
Ni et al. | Automatic detection and counting of circular shaped overlapped objects using circular hough transform and contour detection | |
Zhou et al. | Exploring faster RCNN for fabric defect detection | |
CN113888461A (zh) | 基于深度学习的小五金件缺陷检测方法、系统及设备 | |
Zhang et al. | Multi-scale defect detection of printed circuit board based on feature pyramid network | |
CN110660048B (zh) | 一种基于形状特征的皮革表面缺陷检测方法 | |
Ding et al. | Semantic recognition of workpiece using computer vision for shape feature extraction and classification based on learning databases | |
CN105354547A (zh) | 一种结合纹理和彩色特征的行人检测方法 | |
CN107564007A (zh) | 融合全局信息的场景分割修正方法与系统 | |
Li et al. | Wafer crack detection based on yolov4 target detection method | |
CN107564013A (zh) | 融合局部信息的场景分割修正方法与系统 | |
Mao et al. | Disparity filtering with 3D convolutional neural networks | |
Hu et al. | Printed Circuit Board (PCB) Surface Micro Defect Detection Model Based on Residual Network with Novel Attention Mechanism. | |
CN113469224A (zh) | 一种基于卷积神经网络与特征描述算子相融合的大米分类方法 | |
Niu et al. | A PCB Defect Detection Algorithm with Improved Faster R-CNN |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |