发明内容
本申请提供了基于图像增强的断路器试验机器人接线定位方法及装置,用于解决现有技术缺乏准确率和抗干扰能力,无法满足断路器试验的可靠性需求的技术问题。
有鉴于此,本申请第一方面提供了基于图像增强的断路器试验机器人接线定位方法,包括:
以粘贴的方式根据预置背景切片对初始训练图像集进行图像增强操作,得到预置试验训练图像集;
采用所述预置试验训练图像集训练预置YOLOv4检测模型,得到优化目标检测模型;
通过所述优化目标检测模型对断路器试验的待测双目图像进行目标检测,得到目标检测框,所述目标检测框包括检测框坐标;
根据所述目标检测框和所述检测框坐标计算断路器试验的双目摄像头的左成像点坐标和右成像点坐标;
基于双目视觉定位原理,根据所述左成像点坐标和所述右成像点坐标计算接线机器人的目标动作点坐标。
优选地,所述以粘贴的方式根据预置背景切片对初始训练图像集进行图像增强操作,得到预置试验训练图像集,之前还包括:
对获取的断路器试验机器人接线的初始训练图像集中的目标触头进行标注处理,得到标签信息,标签信息包括标注框、框尺寸和框位置;
基于框尺寸和框位置在标注框的上面、下面、左面和右面分别获取预置背景切片。
优选地,所述以粘贴的方式根据预置背景切片对初始训练图像集进行图像增强操作,得到预置试验训练图像集,包括:
将初始训练图像集中的训练图像进行排序;
根据排序的顺序将当前训练图像对应的所述预置背景切片调整尺寸后粘贴在下一张训练图像对应的背景区域,得到预置试验训练图像集。
优选地,所述以粘贴的方式根据预置背景切片对初始训练图像集进行图像增强操作,得到预置试验训练图像集,包括:
将训练图像集中的训练图像进行排序;
根据排序的顺序将前预置数量的所述训练图像对应的所述预置背景切片分别进行上面、下面、左面和右面的背景拼接操作,得到拼接背景切片;
将所述拼接背景切片粘贴至当前训练图像的背景区域,得到预置试验训练图像集。
优选地,所述基于双目视觉定位原理,根据所述左成像点坐标和所述右成像点坐标计算接线机器人的目标动作点坐标,包括:
基于双目视觉定位原理构建坐标变换公式,所述坐标变换公式为:
其中,
、
、
为所述目标动作点坐标的值,
、
分别为左成像点坐标的横坐标值和右成像点坐标的横坐标值,
为左成像点坐标的纵坐标,
为左右双目摄像头之间的距离,
为摄像头焦距;
根据所述左成像点坐标、所述右成像点坐标和所述坐标变换公式计算接线机器人的目标动作点坐标。
本申请第二方面提供了基于图像增强的断路器试验机器人接线定位装置,包括:
图像增强模块,用于以粘贴的方式根据预置背景切片对初始训练图像集进行图像增强操作,得到预置试验训练图像集;
模型训练模块,用于采用所述预置试验训练图像集训练预置YOLOv4检测模型,得到优化目标检测模型;
目标检测模块,用于通过所述优化目标检测模型对断路器试验的待测双目图像进行目标检测,得到目标检测框,所述目标检测框包括检测框坐标;
坐标计算模块,用于根据所述目标检测框和所述检测框坐标计算断路器试验的双目摄像头的左成像点坐标和右成像点坐标;
双目定位模块,用于基于双目视觉定位原理,根据所述左成像点坐标和所述右成像点坐标计算接线机器人的目标动作点坐标。
优选地,还包括:
标注模块,用于对获取的断路器试验机器人接线的初始训练图像集中的目标触头进行标注处理,得到标签信息,标签信息包括标注框、框尺寸和框位置;
切片模块,用于基于框尺寸和框位置在标注框的上面、下面、左面和右面分别获取预置背景切片。
优选地,所述图像增强模块,具体用于:
将初始训练图像集中的训练图像进行排序;
根据排序的顺序将当前训练图像对应的所述预置背景切片调整尺寸后粘贴在下一张训练图像对应的背景区域,得到预置试验训练图像集。
优选地,所述图像增强模块,具体用于:
将训练图像集中的训练图像进行排序;
根据排序的顺序将前预置数量的所述训练图像对应的所述预置背景切片分别进行上面、下面、左面和右面的背景拼接操作,得到拼接背景切片;
将所述拼接背景切片粘贴至当前训练图像的背景区域,得到预置试验训练图像集。
优选地,所述双目定位模块,具体用于:
基于双目视觉定位原理构建坐标变换公式,所述坐标变换公式为:
其中,
、
、
为所述目标动作点坐标的值,
、
分别为左成像点坐标的横坐标值和右成像点坐标的横坐标值,
为左成像点坐标的纵坐标,
为左右双目摄像头之间的距离,
为摄像头焦距;
根据所述左成像点坐标、所述右成像点坐标和所述坐标变换公式计算接线机器人的目标动作点坐标。
从以上技术方案可以看出,本申请实施例具有以下优点:
本申请中,提供了基于图像增强的断路器试验机器人接线定位方法,包括:以粘贴的方式根据预置背景切片对初始训练图像集进行图像增强操作,得到预置试验训练图像集;采用预置试验训练图像集训练预置YOLOv4检测模型,得到优化目标检测模型;通过优化目标检测模型对断路器试验的待测双目图像进行目标检测,得到目标检测框,目标检测框包括检测框坐标;根据目标检测框和检测框坐标计算断路器试验的双目摄像头的左成像点坐标和右成像点坐标;基于双目视觉定位原理,根据左成像点坐标和右成像点坐标计算接线机器人的目标动作点坐标。
本申请提供的基于图像增强的断路器试验机器人接线定位方法,为了提升目标检测模型的准确率和抗干扰能力,对初始训练图像集进行背景增强操作,即通过粘贴不同的背景增加训练图像集的场景种类,基于此训练的模型的泛化能力更强,抗干扰能力和检测准确性更高;此外,还将目标检测算法与双目视觉定位技术结合,根据目标检测框的坐标信息计算双目摄像头的成像点坐标,进而求得机器人的目标动作点坐标;精准的计算方法确保了定位的可靠性,特定的图像增强方法提升了定位算法的抗干扰能力。因此,本申请能够解决现有技术缺乏准确率和抗干扰能力,无法满足断路器试验的可靠性需求的技术问题。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了便于理解,请参阅图1,本申请提供的基于图像增强的断路器试验机器人接线定位方法的实施例,包括:
步骤101、以粘贴的方式根据预置背景切片对初始训练图像集进行图像增强操作,得到预置试验训练图像集。
预置背景切片可以预先获取得到,例如在以往断路器试验的检测图像中进行背景抽取,只要避免前景提取即可。不限制背景切片的类别以及大小,可根据实际情况设置;将获取的预置背景切片随机或者按照一定规则粘贴在初始训练图像集的训练图像中,得到新增的训练图像,与初始训练图像集合在一起构成预置试验训练图像集,数据集的扩充有助于模型的训练,能够进一步提升模型的泛化能力。
实际上,断路器机器人试验接线要求目标检测模型在不同测试场所(背景)或人员走动等背景扰动下都具有很高的检测准确率,即目标检测模型应具足够的泛化能力。显然,只有通过尽可能涵盖不同的断路器触头前景和背景特征的大样本图像集训练断路器目标检测模型,才能保证模型具有足够的泛化能力。
进一步地,步骤101,之前还包括:
对获取的断路器试验机器人接线的初始训练图像集中的目标触头进行标注处理,得到标签信息,标签信息包括标注框、框尺寸和框位置;
基于框尺寸和框位置在标注框的上面、下面、左面和右面分别获取预置背景切片。
本实施例中的检测目标是断路器触头,将断路器触头用标注框标出,并给出标注框的尺寸和位置信息;此外,在模型训练过程中,标签信息还包括置信度。基于标注后的训练图像集训练目标检测模型,可以对模型的训练进行把控调整,从而提升模型的检测性能。
请参阅图3,标注框object的上面(top)、下面(bottom)、左面(left)和右面(right)均可以获取一个预置背景切片,可以分别表示为
、
、
、
;而标注框采用其左上角坐标
和右下角坐标
进行位置描述。
四个预置背景切片
、
、
、
的尺寸和位置是随机的,但是不能包含任何前景特征,即不可将标注框内的区域纳入预置背景切片中;量化描述就是
的底部边界高于
、
的上部边界低于
、
的右侧边界小于
、
的左侧边界大于
。按照描述的区域范围进行随机切片,将获取的四个切片抽出,即如图3左侧所示。
如图3所示,以粘贴的方式根据预置背景切片
、
、
、
对初始训练图像集进行图像增强操作,得到预置试验训练图像集;具体就是按照位置进行大小调整后的粘贴操作,从而得到新的训练图像。
进一步地,步骤101,包括:
将初始训练图像集中的训练图像进行排序;
根据排序的顺序将当前训练图像对应的预置背景切片调整尺寸后粘贴在下一张训练图像对应的背景区域,得到预置试验训练图像集。
具体的图像增强过程有所不同,本实施例提供的是顺序粘贴的方式,具体过程可以参阅图3,将当前训练图像的预置背景切片粘贴给下一张训练图像,形成新的训练图像,这样初始训练图像集可以被扩充一倍,增强的训练图像与初始训练图像一起构成预置试验训练图像集。
进一步地,步骤101,包括:
将训练图像集中的训练图像进行排序;
根据排序的顺序将前预置数量的训练图像对应的预置背景切片分别进行上面、下面、左面和右面的背景拼接操作,得到拼接背景切片;
将拼接背景切片粘贴至当前训练图像的背景区域,得到预置试验训练图像集。
本实施例给出了另外一种背景粘贴方式,请参阅图4,假设前预置数量的训练图像为3,当前训练图像为第4张图像,前面三张训练图像分别抽取各自对应的预置背景切片,然后将对应方位的切片拼接,即三张训练图像的上面(top)的切片
、
、
进行拼接,得到上面的拼接背景切片;三张训练图像的下面(bottom)的切片
、
、
进行拼接,得到下面的拼接背景切片;三张训练图像的左面(left)的切片
、
、
进行拼接,得到左面的拼接背景切片;三张训练图像的右面(right)的切片
、
、
进行拼接,得到右面的拼接背景切片。
四个方位的拼接背景切片按照第4张训练图像抽取切片后的背景缺口区域大小进行基本的尺寸调整,就可以粘贴切片形成新的背景区域,得到一种新的训练图像;而前面3张训练图像则还是可以采用上述依次粘贴背景的方式进行图像增强,在整体上形成一种综合增强方案。基于以上的背景粘贴方式也可以实现图像的增强,得到增强图像集。可以理解的是,以上仅为基于背景粘贴的图像增强示例,并不唯一限定。
可以理解的是,前预置数量的训练图像是相对当前训练图像而言,前预置数量可以根据实际需要设置,即可以是4、5,或者n,在此不作限定。
步骤102、采用预置试验训练图像集训练预置YOLOv4检测模型,得到优化目标检测模型。
预置YOLOv4检测模型的框架如图5所示,是基于双目摄像头的检测模型,且该模型主要包括特征网络、多尺度融合及非极大值抑制(NMS);YOLOv4的特征网络为CSPDdarknet-53,由N个卷积块组成,每个卷积块包含卷积层(Conv)、归一化层(BN)和非线性激活层(Act)。特征网络抽取的图像纹理、颜色等特征是网络预测目标的重要依据;对特征网络输出的三种尺度的特征图进行多尺度融合,预测不同大小尺寸的目标;采用非极大值抑制(NMS)算法消除冗余的目标检测框,获取最佳目标检测框。
具体的模型训练过程请参阅图6,训练数据集的图像数据进行数据增强后,对目标触头检测模型进行预训练操作,得到预训练结果;根据预训练结果与训练数据集的标签信息计算损失,进而根据损失结果调整更新模型的权重,再判断模型是否训练达标,若是则可以得到优化触头检测模型。
考虑到本实施例是基于YOLOv4以及双目视觉定位的算法,整体的计算量可能较大,会在一定程度上延长推理时间,导致机器人的实际反应较慢,不能满足实况的试验需求。还可以对YOLOv4检测模型进行轻量化改进,例如将核心的特征网络采用轻量级网络架构代替,从模型参数上减少计算量;而训练图像的扩增也可以保证在模型轻量化的情况下,仍然具有较强的检测性能。轻量级神经网络可以选取Mobiledets、ShuffleNet、SqueezeNet等。需要说明的是,在改进过程中需要对替代网络架构进行必要调整,例如通道数量、参数形式或者特征图分支等,具体的不作限定,可以根据需要进行改进。
为了验证本实施例中的预置试验训练图像集对模型训练的优势,给出一个示例,在某一试验场所拍摄获取504张背景特征不足的断路器试验图像,采用背景数据增强方法对该图像背景进行扩充,得到背景特征足够的图像训练样本113400张;然后,分别在五种不同背景下各摄取6张断路器图像,共计30张,对每张断路器图像触头目标进行真实框的类别、尺寸和位置的标注,作为图像测试样本;接着,利用图像背景扩充训练样本(113400张)对断路器触头目标检测模型进行训练。每代训练后,就用训练的目标检测模型对图像测试样本进行预测,利用预测框和真实框信息,计算断路器触头的定位准确率;得到的损失函数和定位准确率随训练代数变化的趋势分别如图7、图8所示。
由图7可知,训练初期,模型对训练图像数据集背景的差异性适应较差,损失函数数值较大;随着训练代数增加,损失函数数值下降逐渐趋缓;训练至300代后,训练图像背景的差异性对损失函数数值的影响很小且收敛。
由图8可知,预测框的回归损失函数ciou-loss数值随着训练代数的增加而下降逐渐趋缓,定位准确率则逐渐提高;训练至300代后,模型输出的预测框位置和尺寸的准确率d-accuracy、c-accuracy均达到99.9%。综合以上可知,采用背景数据增强方法扩充得到的图像样本训练的断路器触头目标检测模型,不受测试样本背景的影响,具有很强的泛化能力和很高的准确率。
步骤103、通过优化目标检测模型对断路器试验的待测双目图像进行目标检测,得到目标检测框,目标检测框包括检测框坐标。
目标检测框除了包括具体的检测框坐标,还包括检测框尺寸,以及检测结果置信度。优化目标检测模型具有较强的泛化能力,能够适应待测双目图像的多种背景变化,保证目标检测卡的准确可靠性。请参阅图9,以图9中的(a)所示的某试验场所背景拍摄获取的训练图像为例,采用本申请实施例的背景数据增强方法对训练图像背景样本进行扩充;其中,图9中的(b)为试验场所改变的背景扰动,图9中的(c)为人员走动的背景扰动,图9中的(d)为外来物引起的背景扰动。以上述得到的增强图像对目标检测模型进行训练,优化断路器目标检测模型。根据测试过程中机器人接线出现的碰撞逼停和准确可靠接线次数计算机器人接线的准确率,具体请参阅表1。
表1断路器试验机器人接线准确率测试结果
由表1给出的断路器试验机器人接线准确率测试结果可知,采用背景数据增强方法训练的优化断路器目标检测模型的准确率为98.8%,优于未进行背景扩充的模型。测试结果表明,在试验场所改变、人员走动等背景扰动影响时,断路器试验机器人仍能准确可靠接线,也表明采用背景数据增强方法训练的目标检测模型具有很强的泛化能力和很高的准确率。
步骤104、根据目标检测框和检测框坐标计算断路器试验的双目摄像头的左成像点坐标和右成像点坐标。
目标检测框的检测框坐标与双目摄像头之间存在几何关系,在摄像头确定,且检测框坐标以及尺寸明确的情况下,可以根据几何关系求得双目摄像头的两个成像点坐标,即左成像点坐标
和右成像点坐标
。
步骤105、基于双目视觉定位原理,根据左成像点坐标和右成像点坐标计算接线机器人的目标动作点坐标。
进一步地,步骤105,包括:
基于双目视觉定位原理构建坐标变换公式,坐标变换公式为:
其中,
、
、
为所述目标动作点坐标的值,
、
分别为左成像点坐标的横坐标值和右成像点坐标的横坐标值,
为左成像点坐标的纵坐标,
为左右双目摄像头之间的距离,
为摄像头焦距;
根据左成像点坐标、右成像点坐标和坐标变换公式计算接线机器人的目标动作点坐标。请参阅图10,A、B即为左成像点坐标
和右成像点坐标
;双目摄像头Camera L和Camera R,其相机坐标系的原点和Z轴分别为
、
和光轴
Z l 、
Zr,两摄像头的X轴重合,Y轴垂直于图片向上;机器人的目标动作点为P,或者称为断路器触头外边缘点,其坐标为
;采用上述公式即可计算得到目标动作点P的坐标值,实现机器人的精准定位,保障机器人接线的可靠性。
为了便于理解,本申请提供了具体的应用例,请参阅图11,提供一种基于设备的断路器试验机器人接线系统,主要由六轴机器人视觉定位抓取组件(含六轴机器人、电动爪与双目摄像头)、线仓单元(含接线线夹和线仓)以及真空断路器单元等组成;机器人接线系统的主要功能是实现接线线夹或插头的抓取、断路器触头插入和放置接线仓等试验过程中的接线(含拆线)动作。为保证机器人接线动作的准确可靠性,必须克服自身定位误差和外界干扰引起的误差(如温度和目标对象空间位置扰动),所以采用本实施例提供的方法,将双目视觉定位和深度学习目标检测技术引入断路器试验机器人接线系统,实现机器人接线定位。
其中,机器人中部署了本实施例中的算法,机器人的现场工作如图12所示,主要操作是将线夹插入断路器触头,抓取线夹等。
本申请实施例提供的基于图像增强的断路器试验机器人接线定位方法,为了提升目标检测模型的准确率和抗干扰能力,对初始训练图像集进行背景增强操作,即通过粘贴不同的背景增加训练图像集的场景种类,基于此训练的模型的泛化能力更强,抗干扰能力和检测准确性更高;此外,还将目标检测算法与双目视觉定位技术结合,根据目标检测框的坐标信息计算双目摄像头的成像点坐标,进而求得机器人的目标动作点坐标;精准的计算方法确保了定位的可靠性,特定的图像增强方法提升了定位算法的抗干扰能力。因此,本申请实施例能够解决现有技术缺乏准确率和抗干扰能力,无法满足断路器试验的可靠性需求的技术问题。
为了便于理解,请参阅图2,本申请提供了基于图像增强的断路器试验机器人接线定位装置的实施例,包括:
图像增强模块201,用于以粘贴的方式根据预置背景切片对初始训练图像集进行图像增强操作,得到预置试验训练图像集;
模型训练模块202,用于采用预置试验训练图像集训练预置YOLOv4检测模型,得到优化目标检测模型;
目标检测模块203,用于通过优化目标检测模型对断路器试验的待测双目图像进行目标检测,得到目标检测框,目标检测框包括检测框坐标;
坐标计算模块204,用于根据目标检测框和检测框坐标计算断路器试验的双目摄像头的左成像点坐标和右成像点坐标;
双目定位模块205,用于基于双目视觉定位原理,根据左成像点坐标和右成像点坐标计算接线机器人的目标动作点坐标。
进一步地,还包括:
标注模块206,用于对获取的断路器试验机器人接线的初始训练图像集中的目标触头进行标注处理,得到标签信息,标签信息包括标注框、框尺寸和框位置;
切片模块207,用于基于框尺寸和框位置在标注框的上面、下面、左面和右面分别获取预置背景切片。
进一步地,图像增强模块201,具体用于:
将初始训练图像集中的训练图像进行排序;
根据排序的顺序将当前训练图像对应的预置背景切片调整尺寸后粘贴在下一张训练图像对应的背景区域,得到预置试验训练图像集。
进一步地,图像增强模块201,具体用于:
将训练图像集中的训练图像进行排序;
根据排序的顺序将前预置数量的训练图像对应的预置背景切片分别进行上面、下面、左面和右面的背景拼接操作,得到拼接背景切片;
将拼接背景切片粘贴至当前训练图像的背景区域,得到预置试验训练图像集。
进一步地,双目定位模块205,具体用于:
基于双目视觉定位原理构建坐标变换公式,坐标变换公式为:
其中,
、
、
为所述目标动作点坐标的值,
、
分别为左成像点坐标的横坐标值和右成像点坐标的横坐标值,
为左成像点坐标的纵坐标,
为左右双目摄像头之间的距离,
为摄像头焦距;
根据左成像点坐标、右成像点坐标和坐标变换公式计算接线机器人的目标动作点坐标。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以通过一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称:Read-OnlyMemory,英文缩写:ROM)、随机存取存储器(英文全称:Random Access Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。