CN115761285A

CN115761285A - 一种基于虚拟位姿与场景感知匹配学习的辅助装配方法

Info

Publication number: CN115761285A
Application number: CN202211657723.XA
Authority: CN
Inventors: 李明富; 谭雅斌; 邓旭康; 朱凌枫; 罗朝
Original assignee: Xiangtan University
Current assignee: Xiangtan University
Priority date: 2022-12-22
Filing date: 2022-12-22
Publication date: 2023-03-07

Abstract

本发明提供了一种基于虚拟位姿与场景感知匹配学习的辅助装配方法，属于智能制造技术领域。本发明为了感知场景，利用深度学习模型识别装配零部件及其在装配基体上的装配区域，利用深度学习模型输出的角点信息计算出相应的单应矩阵，从而将识别出的装配零部件渲染到相应装配区域内，为用户提供装配指导，同时在虚拟环境中生成零部件正确安装位姿匹配模板，将装配零部件的位姿信息与匹配模板进行比较，计算相似度得分，得到状态纠错信息。采用本发明的技术方案，可以降低用户的装配认知负担，实现产品的快速装配，并且提高装配效率以及准确率。

Description

一种基于虚拟位姿与场景感知匹配学习的辅助装配方法

技术领域

本发明涉及智能制造领域，更具体地，一种基于虚拟位姿与场景感知匹配学习的辅助装配方法。

背景技术

随着市场需求的个性化，多样化促进了产品的快速变形与升级换代，复杂产品的人工装配作业内容随着产品需求不断变化，传统的人工装配作业中，工人需要参考二维纸质装配工艺，装配信息不集中且可视化程度不高，造成操作人员理解效率以及装配操作效率较低，增强现实作为新型的人机交互以及信息可视化的方式可以有效的解决上述问题。

但现有的比较成熟的增强现实辅助装配大多数集中于整体架构的研究以及方法的实现，很少关注完成装配后的零件状态检测，而对装配完成的零部件进行状态检测是提高装配成功率的关键。此外，增强现实辅助装配过程中大部分需要人为去触发控制流程，增加了用户认知负担，且难以适应于复杂场景的装配现场。

因此，实现一种能主动推送装配辅助信息且状态纠错的智能化增强现实辅助装配方法，对降低装配认知门槛，提高装配效率以及成功率，促进装配制造业发展有着重要的意义。

发明内容

为了解决上述问题，本发明旨在公开一种基于虚拟位姿与场景感知匹配学习的辅助装配方法，利用深度学习算法实现装配零部件与装配区域匹配，同时在虚拟环境中生成待匹配模板以检测装配质量，来提高装配效率以及成功率。

为了实现上述目的，本发明所采用的技术方案主要包括以下过程：

步骤1、收集装配对象的以下信息：装配基体的三维工件模型、各装配零部件的三维工件模型、装配零部件在装配基体上正确安装时的相对位姿、各装配零部件装配时所对应的装配工艺信息；

步骤2、将步骤1中收集到的信息导入虚拟装配环境中，设定一个与真实相机参数一致的虚拟相机，利用虚拟相机对正确安装位姿下的装配零部件进行不同角度上的图像采集，形成一组该装配零部件在装配基体上正确安装的位姿匹配模板；

步骤3、重复步骤2对不同的装配零部件分别进行图像采集，形成位姿匹配模板库；

步骤4、利用真实相机对不同的装配零部件进行图像采集，并为采集到的图像分别标记对应的装配零部件名称标签，建立装配零部件图像数据集；

步骤5、利用真实相机对装配基体进行图像采集，并在采集到的图像上标记角点，两个角点围成一个矩形待装配区域，并为待装配区域标记该区域的待装配零部件名称标签，建立装配基体图像数据集；

步骤6、以装配零部件图像数据集中的装配零部件图像为输入，装配零部件图像数据集中的名称标签为输出，构建深度学习模型Ⅰ；

将装配零部件图像数据集中的数据输入深度学习模型Ⅰ进行训练；

步骤7、以装配基体图像数据集中的装配基体图像为输入，装配基体图像数据集中的角点位置及对应的待装配区域的装配零部件名称标签为输出，构建深度学习模型Ⅱ；

将装配基体图像数据集中的数据输入深度学习模型Ⅱ进行训练；

步骤8、通过真实相机对装配作业现场进行图像采集，并将图像信息输入深度学习模型Ⅰ与深度学习模型Ⅱ中，根据深度学习模型Ⅰ的输出确定用户选择安装的装配零部件，根据深度学习模型Ⅱ的输出确定用户选择安装的装配零部件在装配基体上的装配区域及对应的角点信息；

步骤9、根据用户选择的装配零部件的工件模型及装配工艺信息，以其对应的角点信息为对准信息，将装配零部件三维工件模型与装配工艺信息渲染到真实的装配作业场景中，为用户提供装配指导；

步骤10、用户完成当前装配零部件的相应操作后，将装配完成的图像与步骤3中位姿匹配模板库中所对应的匹配模板进行匹配，计算匹配模板与装配完成图像之间的相似度得分，若相似度得分大于设定的阈值，则输出完成该装配零部件的装配，若小于阈值则执行步骤11；

步骤11、利用真实场景中的二维信息与深度信息估计当前装配零部件位姿信息，并将得到的位姿与步骤3中匹配模板所对应的位姿进行比较，计算位姿差值，并将位姿差值重新渲染，为用户提供装配纠错信息重新装配；

步骤12、重复步骤8到步骤11直至完成所有装配零部件的装配。

作为优选，所述步骤2中，所述正确安装的位姿匹配模板，包含以下信息：利用边缘检测技术得到的颜色梯度信息、利用拟合技术得到的点云法向量信息、装配零部件正确安装时在虚拟相机坐标系下的位姿信息、装配基体在虚拟相机坐标系下的位姿信息、虚拟相机图像采集时在世界坐标系下的位姿信息。

作为优选，所述步骤9中，将装配零部件三维工件模型与装配工艺信息渲染到真实的装配作业场景中，其具体方法为：利用步骤8中由深度学习模型Ⅱ所得到的角点的三维坐标与像素坐标求出单应矩阵，将零部件三维模型通过单应矩阵投影变换到像素平面上，从而叠加到真实场景中。

作为优选，所述步骤10中，计算匹配模板与装配完成图像之间的相似度得分，其方法为：将装配作业现场图像进行ROI区域裁剪，将裁剪后的图像提取关键匹配点，将提取到的关键匹配点转换为特征向量，计算提取到的特征向量与模板图片中的特征向量的欧式距离，欧氏距离越小，则相似度越高。

作为优选，所述步骤11中，位姿差值重新渲染，其渲染方法包括但不限于，以文本标注的渲染方法，以静态箭头指引的渲染方法，以动态三维动画的渲染方法。

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚明了，下面对本发明进行进一步详细说明。但是应该理解，此处所描述的具体实施例仅仅用于解释本发明，并不用于限制本发明的范围。

除非另有定义，本文所使用的所有技术用语与属于本发明的技术领域的技术人员通常理解的含义相同，本文在本发明的说明书中所使用的属于只是为了描述具体的实施例的目的，不是旨在限制于本发明。

作为优选，所述正确安装的位姿匹配模板，包含以下信息：利用边缘检测技术得到的颜色梯度信息、利用拟合技术得到的点云法向量信息、装配零部件正确安装时在虚拟相机坐标系下的位姿信息、装配基体在虚拟相机坐标系下的位姿信息、虚拟相机图像采集时在世界坐标系下的位姿信息；

作为优选，所述图像采集通过相机拍照获得，图像内容为RGB和RGB-D格式，保存的图片为PNG格式；

作为优选，所述装配零件图像数据集包括所有待装配零部件及其对应标签，每个装配零部件分别为200张图片和其对应标签；

作为优选，所述装配基体图像数据集包括装配进度不同的装配基体图像以及完成装配的装配基体整体图像，共包含300张图片及对应的角点信息，保存的图片的格式为PNG格式，保存的角点信息的格式为TXT格式；

作为优选，所述深度学习模型Ⅰ采用AlexNet网络结构，输入经过5个卷积层，3个全连接层的非线性变换后，在输出层由softmax分类器得到最后结果，激活函数选用Relu函数，损失函数选择均方误差函数；

作为优选，所述深度学习模型Ⅱ采用YOLOV5的网络结构，该网络结构分为输入端，Backbone，Neck，Head四个模块，输入端模块调整输入图像的尺寸以支持对图像细粒度特征的挖掘与检测，Backbone模块作为核心特征提取器共有72个卷积层，卷积核大小为3×3，步长为2，Neck模块用以特征融合，包含三个最大池化层，其卷积核大小分别为3×3，9×9，13×13，Head模块输出最后的目标对象及类别概率，损失函数采用CIOULoss函数；

作为优选，所述装配零部件三维工件模型与装配工艺信息渲染到真实的装配作业场景中，其具体方法为：利用步骤8中由深度学习模型Ⅱ所得到的角点的三维坐标与像素坐标求出单应矩阵，将零部件三维模型通过单应矩阵投影变换到像素平面上，从而叠加到真实场景中；

作为优选，所述计算匹配模板与装配完成图像之间的相似度得分，其方法为：将装配作业现场图像进行ROI区域裁剪，将裁剪后的图像提取关键匹配点，将提取到的关键匹配点转换为特征向量，计算提取到的特征向量与模板图片中的特征向量的欧式距离，欧氏距离越小，则相似度越高；

作为优选，所述位姿差值重新渲染，其渲染方法包括但不限于，以文本标注的渲染方法，以静态箭头指引的渲染方法，以动态三维动画的渲染方法；

以上的仅是本发明的实施例,方案中公知的具体结构和/或特性等常识在此未作过多描述。应当指出,对于本领域的技术人员来说,在不脱离本发明结构的前提下,还可以作出若干变形和改进,这些也应该视为本发明的保护范围,这些都不会影响本发明实施的效果和专利的实用性。本申请要求的保护范围应当以其权利要求的内容为准,说明书中的具体实施方式等记载可以用于解释权利要求的内容。

Claims

1.一种基于虚拟位姿与场景感知匹配学习的辅助装配方法，其特征在于，包括以下步骤：

将装配零部件图像数据集之中的数据输入到深度学习模型Ⅰ进行训练；

将装配基体图像数据集之中的数据输入到深度学习模型Ⅱ进行训练；

步骤9、根据用户选择安装的装配零部件的工件模型及装配工艺信息，以其对应的角点信息为对准信息，将装配零部件三维工件模型与装配工艺信息渲染到真实的装配作业场景中，为用户提供装配指导；

2.一种基于虚拟位姿与场景感知匹配学习的辅助装配方法，其特征在于，所述步骤2中，所述正确安装的位姿匹配模板，包含以下信息：利用边缘检测技术得到的颜色梯度信息、利用拟合技术得到的点云法向量信息、装配零部件正确安装时在虚拟相机坐标系下的位姿信息、装配基体在虚拟相机坐标系下的位姿信息、虚拟相机图像采集时在世界坐标系下的位姿信息。

3.一种基于虚拟位姿与场景感知匹配学习的辅助装配方法，其特征在于，所述步骤9中，将装配零部件三维工件模型与装配工艺信息渲染到真实的装配作业场景中，其具体方法为：利用步骤8中由深度学习模型Ⅱ所得到的角点的三维坐标与像素坐标求出单应矩阵，将零部件三维模型通过单应矩阵投影变换到像素平面上，从而叠加到真实场景中。

4.一种基于虚拟位姿与场景感知匹配学习的辅助装配方法，其特征在于，所述步骤10中，计算匹配模板与装配完成图像之间的相似度得分，其方法为：将装配作业现场图像进行ROI区域裁剪，将裁剪后的图像提取关键匹配点，将提取到的关键匹配点转换为特征向量，计算提取到的特征向量与模板图片中的特征向量的欧式距离，欧氏距离越小，则相似度越高。

5.一种基于虚拟位姿与场景感知匹配学习的辅助装配方法，其特征在于，所述步骤11中，位姿差值重新渲染，其渲染方法包括但不限于，以文本标注的渲染方法，以静态箭头指引的渲染方法，以动态三维动画的渲染方法。