CN115984211A - 视觉定位方法、机器人及存储介质 - Google Patents

视觉定位方法、机器人及存储介质 Download PDF

Info

Publication number
CN115984211A
CN115984211A CN202211703376.XA CN202211703376A CN115984211A CN 115984211 A CN115984211 A CN 115984211A CN 202211703376 A CN202211703376 A CN 202211703376A CN 115984211 A CN115984211 A CN 115984211A
Authority
CN
China
Prior art keywords
target
image data
contour
dots
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211703376.XA
Other languages
English (en)
Inventor
黎江华
张鹏飞
杨铤
郑毅斌
韩嘉乐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Youibot Robotics Technology Co ltd
Original Assignee
Shenzhen Youibot Robotics Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Youibot Robotics Technology Co ltd filed Critical Shenzhen Youibot Robotics Technology Co ltd
Priority to CN202211703376.XA priority Critical patent/CN115984211A/zh
Publication of CN115984211A publication Critical patent/CN115984211A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本申请提供一种视觉定位方法、机器人及存储介质,该方法包括:获取预设的视觉标签对应的图像数据,所述视觉标签包括预设轮廓和位于所述预设轮廓内的预设圆点;对所述图像数据进行识别,得到目标轮廓;基于所述目标轮廓确定所述图像数据中的目标兴趣区域;对所述目标兴趣区域内的图像数据进行圆点检测,得到多个目标圆点;获取所述多个目标圆点的位置坐标,根据所述多个目标圆点的位置坐标确定所述图像数据的位置和角度。本申请旨在通过优化视觉定位标签的检测识别过程,得到准确的定位数据,在提高视觉定位标签识别准确性的同时,实现了高效精准的视觉定位引导,进而引导智能机器人高效完成作业任务,提高了用户体验。

Description

视觉定位方法、机器人及存储介质
技术领域
本申请涉及机器人技术领域,尤其涉及一种视觉定位方法、机器人及存储介质。
背景技术
随着人工智能技术的发展,智能机器人已经广泛运用于各种高要求的自动化场景,其中,具备视觉的智能机器人能更快、更准、更灵活地完成定位抓取、对位组装等操作。目前,常见的视觉智能机器人一般通过图像分析视觉定位标签,来获取坐标位置和角度,再引导智能机器人完成对应的操作。因此,视觉定位是引导智能机器人的核心技术。
由于目前一般采用特征点法计算视觉定位标签的定位数据,其提取的图像特征与实际图像的一致性较低,往往计算得出特征点之间存在着偏差,使得定位数据也存在较大的偏差,进而导致视觉定位的准确性低。
发明内容
本申请的主要目的在于提供一种视觉定位方法、机器人及存储介质,旨在通过优化视觉定位标签的检测识别过程,得到准确的定位数据,在提高视觉定位标签识别准确性的同时,实现了高效精准的视觉定位引导,进而引导智能机器人高效完成作业任务,提高了用户体验。
第一方面,本申请提供了一种视觉定位方法,所述方法包括:
获取预设的视觉标签对应的图像数据,所述视觉标签包括预设轮廓和位于所述预设轮廓内的预设圆点;
对所述图像数据进行识别,得到目标轮廓;
基于所述目标轮廓确定所述图像数据中的目标兴趣区域;
对所述目标兴趣区域内的图像数据进行圆点检测,得到多个目标圆点;
获取所述多个目标圆点的位置坐标,根据所述多个目标圆点的位置坐标确定所述图像数据的位置和角度。
第二方面,本申请还提供了一种机器人,所述机器人包括:
存储器和处理器;
其中,所述存储器,用于存储计算机程序;
所述处理器,用于执行所述的计算机程序并在执行所述的计算机程序时实现如本申请实施例任一项所述的视觉定位方法的步骤。
第三方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如本申请实施例中任一项所述的视觉定位方法的步骤。
本申请公开的视觉定位方法、机器人及计算机可读存储介质,能够获取包括预设轮廓和预设原点的视觉标签及其对应的图像数据,并对该图像数据进行识别,得到目标轮廓。进一步的,可基于目标轮廓确定图像数据中的兴趣区域,以排除其他信息对识别过程的干扰,提高识别的稳定性。最后对兴趣区域内的图像数据记性圆点检测,得到目标圆点,进而根据目标圆点的坐标位置得到图像数据的位置和角度。如此,实现了视觉标签的精准识别以及定位。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请的实施例提供的一种视觉定位方法的步骤示意图;
图2是本申请的实施例提供的识别图像数据的步骤示意图;
图3是本申请的实施例提供的确定目标兴趣区域的步骤示意图;
图4是本申请实施例提供的一种机器人的示意图;
图5为本申请提供的一种计算机可读存储介质的结构示意图。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
应当理解,为了便于清楚描述本申请实施例的技术方案,在本申请的实施例中,采用了“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分。例如,第一识别模型和第二识别模型仅仅是为了区分不同的回调函数,并不对其先后顺序进行限定。本领域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定,并且“第一”、“第二”等字样也并不限定一定不同。
还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
请参阅图1,图1是本申请的实施例提供的一种视觉定位方法的步骤示意图。如图1所示,该视觉定位方法包括步骤S11至步骤S15。
步骤S11:获取预设的视觉标签对应的图像数据,视觉标签包括预设轮廓和位于预设轮廓内的预设圆点。
需要说明的是,视觉标签是一种提前布设好、并在移动平台进行实时的导航定位前,就已经为移动平台所知的标识,常用作视觉辅助定位或者物体的识别。因此,机器人可通过识别视觉标签,得到其对应的位置坐标信息,进而实现定位抓取、对位组装等操作。
此外,本申请对于视觉标签的预设轮廓以及预设轮廓内的预设圆点不加以限定。例如预设轮廓可以为五边形方框、六边形方框以及七边形方框等,进一步的,预设圆点的数量可以为6、7、8等。为了构建一个非对称的形状用于区分视觉标签的方向性,本申请以预设轮廓为五边形方框,且预设圆点的数量为6为例进行说明,其中,预设轮廓中最短的边的逆时针第一个点可作为视觉标签中的方向关键点。在此基础上,该视觉标签内部有6个预设圆点,其圆心可用于视觉标签对应的图像数据的精准计算。
进一步的,在具体实施中,基于S11获取到预设的视觉标签对应的图像数据后,本公开实施例还可以通过步骤S12进行下一步处理,具体描述如下:
步骤S12:对图像数据进行识别,得到目标轮廓。
需要说明的是,本申请对于将图像数据进行识别,进而得到目标轮廓的方法不加以限定。例如可以为直接将图像数据识别得到目标轮廓,也可以为将识别得到的轮廓进行筛选,进而得到目标轮廓。
可选地,为了提高图像数据的质量,还可以对图像数据进行优化处理。因此,对图像数据进行识别之前,还包括:将图像数据转化为单通道灰度图像,得到灰度图像数据;对灰度图像数据进行图像预处理,得到待识别轮廓图像,图像预处理包括图像降噪处理、阈值分割处理和图像平滑处理。通过上述操作,可得到质量较高的图像数据。
其中,单通道灰度图像是指用灰度表示的图像,灰度是在白色和黑色之间分的若干个等级,其中最常用的是256级,也就是256级灰度图。图像降噪处理、阈值分割处理和图像平滑处理是使图像的轮廓变得光滑,断开狭窄的间断和消除细的突出物的处理。
具体的,在获取到图像数据后,可将图像数据从原图转为单通道灰度图像。由于单通道灰度图像同样能够反映图像的整体和局部特征,因此使用灰度图像不但可以减小图像处理中的计算量,还可以增强识别过程中算法的适用性;进一步的,可将转单通道灰度图后的图像数据进行图像降噪处理、阈值分割处理和图像平滑处理等预处理,进而得到待识别轮廓图像,以消除图像中存在的大量噪声以及光度不均匀性,也即干扰信息。如此,有利于得到较为精确的目标轮廓。
需要说明的是,本申请对于上述图像降噪处理、阈值分割处理和图像平滑处理中采用的算法不加以限定。例如可以为采用去雾算法、膨胀腐蚀算法、同态滤波算法实现图像降噪处理;采用大律法实现阈值分割处理;采用高斯平滑算法实现图像平滑处理等。
可选地,请参阅图2,图2是本申请的实施例提供的识别图像数据的步骤示意图。如图2所示,可通过步骤S121至步骤S122实现对图像数据进行识别,得到目标轮廓。
步骤S121:提取待识别轮廓图像内的多个轮廓。
具体的,可先提取待识别轮廓图像的边缘,进而基于提取到的轮廓图像的边缘查找当中的轮廓。如此,实现提取待识别轮廓图像中的多个轮廓。
需要说明的是,本申请对于提取待识别轮廓图像的边缘的方法不加以限定,例如可以为Canny边缘检测算法、Sobel边缘检测算法等,本申请以Canny边缘检测算法为例进行说明。
Canny边缘检测算法是一种多步算法,用于检测任何输入图像的边缘。它涉及在检测图像边缘时要遵循的以下步骤:使用高斯滤波器去除输入图像中的噪声;计算高斯滤波器的导数,计算图像像素的梯度,得到沿x和y维度的幅度;考虑垂直于给定边缘方向的任何曲线的一组邻居,抑制非最大边缘贡献像素点;最后,使用滞后阈值方法保留高于梯度幅值的像素,忽略低于低阈值的像素。通过上述步骤后,Canny边缘检测算法能够实现提取待识别轮廓图像的边缘。
进一步的,可通过轮廓查找算法实现查找待识别轮廓图像内的多个轮廓,本申请对此不加以限定。
步骤S122:基于预设轮廓要求对多个轮廓进行筛选,得到目标轮廓。
在提取到多个轮廓后,可基于预设轮廓要求对多个轮廓进行筛选,得到目标轮廓。其中,目标轮廓即为筛选得到的轮廓。
需要说明的是,本申请对于预设轮廓的要求不加以限定,例如可以为将其进行轮廓拟合,进而判断轮廓拟合后的形状等是否满足要求。其中轮廓拟合操作包括但不限于多边形拟合、最小外接矩形拟合、圆形拟合等。本申请以轮廓拟合操作为多边形拟合为例进行说明。
可选地,基于预设轮廓要求对多个轮廓进行筛选,得到目标轮廓,包括:对多个轮廓进行多边形拟合,得到多个多边形;判断多个多边形是否满足预设轮廓要求;若多边形满足预设轮廓要求,则确定为目标轮廓。
具体的,可将提取到的多个轮廓进行多边形拟合,从而得到多个多边形。进一步的,判断多个多边形是否满足预设要求,并在多边形满足预设轮廓要求时,确定其对应的轮廓为目标轮廓。
需要说明的是,该预设要求可以包括拟合后的多边形边数、拟合后的多边形面积等。
可选地,预设轮廓要求包括多边形为五边形,五边形的面积在预设轮廓面积范围内,且五边形的最小边长符合预设长度。
具体的,若拟合后的多边形边数为五边形,且多边形的面积在允许的最小值与最大值之间,则将该五边形加入到候选轮廓中。进一步的,可在候选轮廓中查找最小边长等于预设长度的轮廓,并作为第二次的候选轮廓,并选择第一个轮廓作为目标轮廓。
需要说明的是,本申请对于预设长度以及预设轮廓面积不加以限定,可基于实际情况设定。此外,由于图像数据中只对应于一个视觉标签,因此若出现多个候选轮廓,可使用第一个识别到的轮廓作为目标轮廓。
在本申请实施例中,可对图像数据进行识别,得到目标轮廓,以实现排除其他信息对识别过程中的干扰。具体的,可提取待识别轮廓图像内的多个轮廓,并基于预设轮廓要求对多个轮廓进行筛选,得到目标轮廓。通过对多个轮廓进行筛选,能够得到较为稳定的目标轮廓,从而有利于提高识别结果的稳定性。
步骤S13:基于目标轮廓确定图像数据中的目标兴趣区域。
其中,目标兴趣区域即为在图像处理中,对某个区域进行选择、提取,然后对这个区域进行单独分析、处理、显示的区域。
在本申请实施例中,可基于目标轮廓确定图像数据中的目标兴趣区域,进而对目标兴趣区域进行单独的分析及处理,以减少识别过程中的处理量。
可选地,请参阅图3,图3是本申请的实施例提供的确定目标兴趣区域的步骤示意图。如图3所示,可通过步骤S131至步骤S133实现基于目标轮廓确定图像数据中的目标兴趣区域。
步骤S131:获取目标轮廓对应的多边形的多个顶点。
步骤S132:根据多个顶点的位置关系,确定包含多个顶点的面积最小的四边形。
步骤S133:将四边形的面积范围作为目标兴趣区域。
具体的,在目标轮廓进行多边形拟合后,可获取目标轮廓对应的多边形的多个顶点。进而基于多个顶点的位置关系确定包含每一顶点的四边形,并选择面积最小的四边形其对应的面积范围作为目标兴趣范围。如此,实现基于目标轮廓确定图像数据中的目标兴趣区域。
在本申请实施例中,可基于目标轮廓对应的多边形的多个顶点,确定包含每一顶点的最小四边形,并将四边形的面积范围作为目标兴趣区域。如此,在实现对目标兴趣区域进行单独的分析及处理的同时,还减少识别过程中的处理量。
步骤S14:对目标兴趣区域内的图像数据进行圆点检测,得到多个目标圆点。
在确定目标兴趣区域后,可对目标兴趣区域内的图像数据进行圆点检测,识别每一圆点对应的圆心,得到多个目标圆点,用于后续的视觉标签的定位计算。
可选地,对目标兴趣区域内的图像数据进行圆点检测,得到多个目标圆点,包括:根据步长迭代设置多组二值化的阈值;基于多组二值化阈值,对目标兴趣区域内的图像数据进行二值化处理,得到多个待检测图像;基于预设圆点要求,识别并筛选多个待检测图像中的图像数据,得到多个目标圆点。
其中,步长迭代为阈值分割处理中的迭代增加值,其可根据实际情况设置,本申请对此不加以限定;二值化处理是将图像上的像素点的灰度值设置为0或255,也就是将整个图像呈现出明显的只有黑和白的视觉效果。
具体的,可根据步长迭代设置多组二值化的阈值,并基于多组二值化阈值,对目标兴趣区域内的图像数据进行二值化处理,从而得到多个待检测图像。进一步,基于预设圆点要求,识别并筛选多个待检测图像中的图像数据,得到多个目标圆点。如此,可精确提取目标圆点,防止图像的形态学方法对图像的损坏。
需要说明的是,本申请对于二值化的阈值不加以限定,例如可以为0、50、100、150等,其具体可以根据步长迭代设置。此外,本申请对于预设圆点要求不加以限定,例如预设圆点要求可以为圆点的圆度和凸度在预设规格范围内,和/或圆点的面积在预设圆点面积范围内等。
可选地,预设圆点要求包括圆点的圆度和凸度在预设规格范围内,圆点的面积在预设圆点面积范围内,且圆点至少在两个待检测图像中存在。
其中,圆度为包容同一横剖面实际轮廓且半径差为最小的两同心圆间的半径之差;凸度为斑点或凸包的面积。进一步的,圆点的圆度和凸度可以通过斑点检测算法实现。
需要说明的是,斑点检测算法主要思路是检测出图像中比它周围像素灰度值大或比周围灰度值小的区域。一般有两种方法来实现这一目标:基于求导的微分方法,这类的方法称为微分检测器;基于局部极值的分水岭算法。使用斑点检测算法可以识别图像中的原型标记圆心,以及圆点的圆度和凸度,用于后续的视觉定位计算。
进一步的,本申请对于预设规格范围不加以限定,例如圆点的圆度可根据相机的像素、镜头的焦距以及拍照距离设定;圆点的凸度可以在[0,1]的规格范围内。
在本申请实施例中,可对目标兴趣区域内的图像数据进行圆点检测,得到多个目标圆点,以用于后续的视觉定位计算。具体的,可先对目标兴趣区域内的图像数据进行二值化处理,得到多个待检测图像,从而防止图像的形态学方法对图像的损坏。进一步的,可基于预设圆点要求,识别并筛选多个待检测图像中的图像数据,得到精确度较高的多个目标圆点。如此,能够基于目标圆点得到较为准确的视觉定位计算结果。
步骤S15:获取多个目标圆点的位置坐标,根据多个目标圆点的位置坐标确定图像数据的位置和角度。
可选地,获取多个目标圆点的位置坐标,包括:获取多个目标圆点的中心点;以中心点为原点,分别计算多个目标圆点与中心点所形成的射线向量之间的正弦值;根据射线向量之间的正弦值,将多个目标圆点进行逆时针排序,得到多个目标圆点的位置坐标。
具体的,可获取多个目标圆点的中心点,并以中心点为原点,计算每一目标圆点与中心点所形成的射线向量之间的正弦值。当正弦值大于0时,根据射线向量之间的正弦值,将多个目标圆点进行逆时针排序,如此得到多个目标圆点的位置坐标。进一步的,可根据多个目标圆点的位置坐标确定图像数据的位置和角度,如此实现了视觉标签的定位计算。
在本申请实施例中,可基于每一目标圆点的中心点计算其与对应的目标原点形成的射线向量之间的正弦值,进而得到目标圆点的位置坐标。由于多个目标圆点的位置坐标对应于图像数据的位置和角度,因此可基于多个目标圆点的位置坐标确定图像数据的位置和角度,也即实现了视觉标签的较为精确的定位计算。
本申请公开的视觉定位方法、机器人及计算机可读存储介质,能够获取包括预设轮廓和预设原点的视觉标签及其对应的图像数据,并对该图像数据进行识别,得到目标轮廓。进一步的,可基于目标轮廓确定图像数据中的兴趣区域,以排除其他信息对识别过程的干扰,提高识别的稳定性。最后对兴趣区域内的图像数据记性圆点检测,得到目标圆点,进而根据目标圆点的坐标位置得到图像数据的位置和角度。如此,实现了视觉标签的精准识别以及准确的定位。
请参阅图4,图4是本申请实施例提供的一种机器人的示意图。该机器人300可以是服务器。如图4所示,该机器人300包括通过系统总线连接的处理器301、存储器302和网络接口,其中,存储器302可以包括易失性存储介质、非易失性存储介质和内存储器。
非易失性存储介质可存储操作系统和计算机程序。该计算机程序包括程序指令,该程序指令被执行时,可使得处理器301执行任意一种视觉定位方法。
处理器301用于提供计算和控制能力,支撑整个机器人300的运行。
内存储器为非易失性存储介质中的计算机程序的运行提供环境,该计算机程序被处理器301执行时,可使得处理器301执行任意一种视觉定位方法。
该网络接口用于进行网络通信,如发送分配的任务等。本领域技术人员可以理解,该机器人300的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的机器人300的限定,具体的机器人300可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
应当理解的是,处理器301可以是中央处理单元(Central Processing Unit,CPU),该处理器301还可以是其他通用处理器、数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
其中,在一些实施方式中,所述处理器301用于运行存储在存储器302中的计算机程序,以实现如下步骤:获取预设的视觉标签对应的图像数据,所述视觉标签包括预设轮廓和位于所述预设轮廓内的预设圆点;对所述图像数据进行识别,得到目标轮廓;基于所述目标轮廓确定所述图像数据中的目标兴趣区域;对所述目标兴趣区域内的图像数据进行圆点检测,得到多个目标圆点;获取所述多个目标圆点的位置坐标,根据所述多个目标圆点的位置坐标确定所述图像数据的位置和角度。
在一些实施方式中,所述处理器301还用于将所述图像数据转化为单通道灰度图像,得到灰度图像数据;对所述灰度图像数据进行图像预处理,得到待识别轮廓图像,所述图像预处理包括图像降噪处理、阈值分割处理和图像平滑处理。
在一些实施方式中,所述处理器301还用于提取所述待识别轮廓图像内的多个轮廓;基于预设轮廓要求对所述多个轮廓进行筛选,得到所述目标轮廓。
在一些实施方式中,所述处理器301还用于对所述多个轮廓进行多边形拟合,得到多个多边形;判断所述多个多边形是否满足所述预设轮廓要求;若所述多边形满足所述预设轮廓要求,则确定为所述目标轮廓。
在一些实施方式中,所述处理器301还用于获取所述目标轮廓对应的多边形的多个顶点;根据所述多个顶点的位置关系,确定包含所述多个顶点的面积最小的四边形;将所述四边形的面积范围作为所述目标兴趣区域。
在一些实施方式中,所述处理器301还用于根据步长迭代设置多组二值化的阈值;基于所述多组二值化阈值,对所述目标兴趣区域内的图像数据进行二值化处理,得到多个待检测图像;基于预设圆点要求,识别并筛选所述多个待检测图像中的图像数据,得到所述多个目标圆点。
在一些实施方式中,所述处理器301还用于获取多个目标圆点的中心点;以所述中心点为原点,分别计算所述多个目标圆点与所述中心点所形成的射线向量之间的正弦值;根据所述射线向量之间的正弦值,将所述多个目标圆点进行逆时针排序,得到所述多个目标圆点的位置坐标。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序中包括程序指令,所述程序指令被执行时实现本申请实施例提供的视觉定位方法。
其中,所述计算机可读存储介质可以是前述实施例所述的机器人300的内部存储单元,例如所述机器人的硬盘或内存。
请参阅图5,图5为本申请提供的一种计算机可读存储介质的结构示意图。本申请的存储介质40存储有能够实现上述所有视觉定位方法的计算机程序,其中,该计算机程序可以以软件产品的形式存储在上述存储介质40中,包括若干指令用以使得一台机器人(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施方式方法的全部或部分步骤。而前述的存储装置包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质,或者是计算机、服务器、手机、平板等装置。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (11)

1.一种视觉定位方法,其特征在于,所述方法包括:
获取预设的视觉标签对应的图像数据,所述视觉标签包括预设轮廓和位于所述预设轮廓内的预设圆点;
对所述图像数据进行识别,得到目标轮廓;
基于所述目标轮廓确定所述图像数据中的目标兴趣区域;
对所述目标兴趣区域内的图像数据进行圆点检测,得到多个目标圆点;
获取所述多个目标圆点的位置坐标,根据所述多个目标圆点的位置坐标确定所述图像数据的位置和角度。
2.根据权利要求1所述的方法,其特征在于,所述对所述图像数据进行识别之前,还包括:
将所述图像数据转化为单通道灰度图像,得到灰度图像数据;
对所述灰度图像数据进行图像预处理,得到待识别轮廓图像,所述图像预处理包括图像降噪处理、阈值分割处理和图像平滑处理。
3.根据权利要求2所述的方法,其特征在于,所述对所述图像数据进行识别,得到目标轮廓,包括:
提取所述待识别轮廓图像内的多个轮廓;
基于预设轮廓要求对所述多个轮廓进行筛选,得到所述目标轮廓。
4.根据权利要求3所述的方法,其特征在于,所述基于预设轮廓要求对所述多个轮廓进行筛选,得到所述目标轮廓,包括:
对所述多个轮廓进行多边形拟合,得到多个多边形;
判断所述多个多边形是否满足所述预设轮廓要求;
若所述多边形满足所述预设轮廓要求,则确定为所述目标轮廓。
5.根据权利要求4所述的方法,其特征在于,所述预设轮廓要求包括所述多边形为五边形,所述五边形的面积在预设轮廓面积范围内,且所述五边形的最小边长符合预设长度。
6.根据权利要求4所述的方法,其特征在于,所述基于所述目标轮廓确定所述图像数据中的目标兴趣区域,包括:
获取所述目标轮廓对应的多边形的多个顶点;
根据所述多个顶点的位置关系,确定包含所述多个顶点的面积最小的四边形;
将所述四边形的面积范围作为所述目标兴趣区域。
7.根据权利要求1所述的方法,其特征在于,所述对所述目标兴趣区域内的图像数据进行圆点检测,得到多个目标圆点,包括:
根据步长迭代设置多组二值化的阈值;
基于所述多组二值化阈值,对所述目标兴趣区域内的图像数据进行二值化处理,得到多个待检测图像;
基于预设圆点要求,识别并筛选所述多个待检测图像中的图像数据,得到所述多个目标圆点。
8.根据权利要求7所述的方法,其特征在于,所述预设圆点要求包括所述圆点的圆度和凸度在预设规格范围内,所述圆点的面积在预设圆点面积范围内,且所述圆点至少在两个待检测图像中存在。
9.根据权利要求7所述的方法,其特征在于,所述获取所述多个目标圆点的位置坐标,包括:
获取多个目标圆点的中心点;
以所述中心点为原点,分别计算所述多个目标圆点与所述中心点所形成的射线向量之间的正弦值;
根据所述射线向量之间的正弦值,将所述多个目标圆点进行逆时针排序,得到所述多个目标圆点的位置坐标。
10.一种机器人,其特征在于,所述机器人包括存储器和处理器;
所述存储器,用于存储计算机程序;
所述处理器,用于执行所述的计算机程序并在执行所述的计算机程序时实现如权利要求1至9任一项所述的视觉定位方法。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如权利要求1至9中任一项所述的视觉定位方法。
CN202211703376.XA 2022-12-29 2022-12-29 视觉定位方法、机器人及存储介质 Pending CN115984211A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211703376.XA CN115984211A (zh) 2022-12-29 2022-12-29 视觉定位方法、机器人及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211703376.XA CN115984211A (zh) 2022-12-29 2022-12-29 视觉定位方法、机器人及存储介质

Publications (1)

Publication Number Publication Date
CN115984211A true CN115984211A (zh) 2023-04-18

Family

ID=85962264

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211703376.XA Pending CN115984211A (zh) 2022-12-29 2022-12-29 视觉定位方法、机器人及存储介质

Country Status (1)

Country Link
CN (1) CN115984211A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117392226A (zh) * 2023-12-11 2024-01-12 合肥安迅精密技术有限公司 基于机器视觉的bga元件识别定位方法及系统、存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117392226A (zh) * 2023-12-11 2024-01-12 合肥安迅精密技术有限公司 基于机器视觉的bga元件识别定位方法及系统、存储介质
CN117392226B (zh) * 2023-12-11 2024-04-05 合肥安迅精密技术有限公司 基于机器视觉的bga元件识别定位方法及系统、存储介质

Similar Documents

Publication Publication Date Title
EP3506158B1 (en) Method and apparatus for determining lane line on road
CN113592886B (zh) 建筑图纸的审图方法、装置、电子设备及介质
KR101997048B1 (ko) 물류 관리를 위한 원거리 다수의 코드 인식 방법 및 이를 이용한 코드 인식 장치
CN111461100A (zh) 一种票据识别方法、装置、电子设备和存储介质
CN109993758A (zh) 分割方法、分割装置、计算机设备及存储介质
JPH09185676A (ja) 罫線除去方法
KR20220157369A (ko) 원석과 연관된 위치를 결정하기 위한 방법 및 디바이스
CN111626249A (zh) 题目图像中几何图形的识别方法、装置和计算机存储介质
CN108960247B (zh) 图像显著性检测方法、装置以及电子设备
CN115984211A (zh) 视觉定位方法、机器人及存储介质
CN110348307B (zh) 一种起重机金属结构攀爬机器人的路径边缘识别方法及系统
Chen et al. Image segmentation based on mathematical morphological operator
TW201601119A (zh) 物件辨識與定位方法
CN110378337B (zh) 金属切削刀具图纸标识信息视觉输入方法及系统
CN112784675A (zh) 目标检测方法及装置、存储介质、终端
CN113780040A (zh) 唇部关键点的定位方法及装置、存储介质、电子设备
JP4745966B2 (ja) 目標物の自動識別システム
CN113343987B (zh) 文本检测处理方法、装置、电子设备及存储介质
CN112085816B (zh) 一种字形曲线生成方法及装置
Wang et al. Edge extraction by merging the 3D point cloud and 2D image data
CN109815791B (zh) 基于血管的身份识别方法和装置
CN114972495A (zh) 针对纯平面结构的物体的抓取方法、装置及计算设备
WO2020108785A1 (en) Method and device for training a neural network to specify landmarks on 2d and 3d images
CN112017203A (zh) 图像处理方法、视频处理方法、装置、设备及存储介质
MAARIR et al. Building detection from satellite images based on curvature scale space method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination