CN114491083B

CN114491083B - 工业检测中的知识图库构建方法、知识图库构建装置

Info

Publication number: CN114491083B
Application number: CN202210336010.7A
Authority: CN
Inventors: 杭天欣; 郑钧友; 赵何; 张志琦
Original assignee: Jiangsu Zhiyun Tiangong Technology Co ltd
Current assignee: Jiangsu Zhiyun Tiangong Technology Co ltd
Priority date: 2022-04-01
Filing date: 2022-04-01
Publication date: 2022-07-15
Anticipated expiration: 2042-04-01
Also published as: CN114491083A

Abstract

本发明提供一种工业检测中的知识图库构建方法、知识图库构建装置，所述方法包括：获取待储存图片集并输入目标检测模型，以获得推理结果；根据推理结果进行切图操作，以抠出对应的缺陷图；将缺陷图输入向量提取模型以获取图片特征向量，其中，向量提取模型包括：特征提取网络、降维卷积核和分类器；将缺陷类别进行热编码以获取编码向量；将编码向量与图片特征向量进行通道拼接，以生成关键字向量；将关键字向量和对应的待储存图片存入知识图库。该方法采用向量构建知识图库，从而可以建立一套可用于快速搜索的知识图库，且在特征提取时采用特征提取网络、降维卷积核和分类器相结合，可以获取更加精准的特征提取效果，提高图片搜索的准确性。

Description

工业检测中的知识图库构建方法、知识图库构建装置

技术领域

本发明涉及工业质检技术领域，具体涉及一种工业检测中的知识图库构建方法、一种工业检测中的知识图库构建装置。

背景技术

在工业质检领域，知识图库是将产品各种形态的缺陷储存起来，知识图库的构建有利于：工程师对特征缺陷的学习、模型迁移的搭建、小样本启动以及降低后续类似项目的启动成本。

然而，通常知识图库只涉及到图片本身和缺陷类别的存储，其缺点也很明显，主要有：（1）在数据库中，每张缺陷图片的ID（身份）或者key（键）无法很好的表示出图片本身的含义；（2）当对某张新图进行索引时，无法有效的从图中找出相似的数据集，进而无法快速实现迁移模型的搭建或者项目的小样本启动。

发明内容

为解决上述技术问题，本发明的第一个目的在于提出一种工业检测中的知识图库构建方法，该方法采用向量构建知识图库，从而可以建立一套可用于快速搜索的知识图库，且在特征提取时采用特征提取网络、降维卷积核和分类器相结合，从而可以获取更加精准的特征提取效果，提高图片搜索的准确性。

本发明的第二个目的在于提出一种工业检测中的知识图库构建装置。

本发明采用的技术方案如下：

本发明第一方面的实施例提出了一种工业检测中的知识图库构建方法。

本发明上述提出的工业检测中的知识图库构建方法还可以具有如下附加技术特征：

根据本发明的一个实施例，采用以下步骤训练所述向量提取模型：将所述缺陷图和对应的缺陷类别作为输入送入特征提取网络Swin transformer，其中对应的缺陷类别作为训练标签，以生成三维特征图F1；将所述三维特征图F1输入第一降维卷积核，以生成二维特征图F2；将所述二维特征图F2输入第二降维卷积核，以生成图片特征向量V；将所述图片特征向量V作为输入送入所述分类器，进行梯度下降。

根据本发明的一个实施例，所述三维特征图F1的维度为

，其中

是所述三维特征图F1宽的维度，

是所述三维特征图F1高的维度，C₁是所述三维特征图F1 通道的维度，所述第一降维卷积核的维度为3*3*C，其中3*3为第一降维卷积核滑窗的大小， C为第一降维卷积核的通道且等于C₁；所述二维特征图F2的维度为

，其中

是所述二维特征图F2宽的维度，

是所述二维特征图F2高的维度，且

等于

、

等于

，采用以下公式获取

和

的大小：

其中p为补足的大小，且p=1。

根据本发明的一个实施例，所述图片特征向量V的维度为4096*1，所述第二降维卷积核的维度为

，其中

为所述第二降维卷积核滑窗的大小，且

等于

、

等于

，1为所述第二降维卷积核的通道，4096为所述第二降维卷积核的卷积核个数。

本发明第二方面的实施例提出了一种工业检测中的知识图库构建装置，包括：获取模块，所述获取模块用于获取待储存图片集，并输入目标检测模型，以获得推理结果，所述推理结果包括：缺陷位置和缺陷类别；切图模块，所述切图模块用于根据所述推理结果在对应的待储存图片上进行切图操作，以抠出对应的缺陷图并存储缺陷图对应的缺陷类别；特征提取模块，所述特征提取模块用于将所述缺陷图输入向量提取模型以获取图片特征向量V，其中，所述向量提取模型包括：特征提取网络Swin transformer（一种层次化视觉网络）、降维卷积核和分类器；热编码模块，所述热编码模块用于将所述缺陷类别进行热编码，以获取对应的编码向量H；拼接模块，所述拼接模块用于将编码向量H的维度补齐与所述图片特征向量V一致后，将所述编码向量H与所述图片特征向量V进行通道拼接，以生成关键字向量W；存储模块，所述存储模块用于将所述关键字向量W和对应的待储存图片存入知识图库，其中，所述关键字向量W作为键，对应的待储存图片作为值。

本发明上述提出的工业检测中的知识图库构建装置还可以具有如下附加技术特征：

根据本发明的一个实施例，所述向量提取模型具体用于采用以下步骤训练：将所述缺陷图和对应的缺陷类别作为输入送入特征提取网络Swin transformer，其中对应的缺陷类别作为训练标签，以生成三维特征图F1；将所述三维特征图F1输入第一降维卷积核，以生成二维特征图F2；将所述二维特征图F2输入第二降维卷积核，以生成图片特征向量V；将所述图片特征向量V作为输入送入所述分类器，进行梯度下降。

根据本发明的一个实施例，所述三维特征图F1的维度为

，其中

是所述三维特征图F1宽的维度，

是所述三维特征图F1高的维度，C₁是所述三维特征图F1 通道的维度，所述第一降维卷积核的维度为3*3*C，其中3*3为卷积核滑窗的大小，C为降维卷积核的通道且等于C₁；所述二维特征图F2的维度为

，其中

是所述二维特征图F2宽的维度，

是所述二维特征图F2高的维度，且

等于

、

等于

，所述特征提取模块采用以下公式获取

和

的大小：

其中p为补足的大小，且p=1。

，其中

为所述第二降维卷积核滑窗的大小，且

等于

、

等于

本发明的有益效果：

本发明采用向量构建知识图库，从而可以建立一套可用于快速搜索的知识图库，且在特征提取时采用特征提取网络、降维卷积核和分类器相结合，从而可以获取更加精准的特征提取效果，提高图片搜索的准确性。

附图说明

图1是根据本发明一个实施例的工业检测中的知识图库构建方法的流程图；

图2是根据本发明一个实施例的向量提取模型训练过程流程图；

图3是根据本发明一个实施例的工业检测中的知识图库构建方法的原理图；

图4是根据本发明一个实施例的工业检测中的知识图库构建装置的方框示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1是根据本发明一个实施例的工业检测中的知识图库构建方法的流程图。如图1所示，该方法包括以下步骤：

S1，获取待储存图片集，并输入目标检测模型，以获得推理结果，推理结果包括：缺陷位置和缺陷类别。

具体地，待储存图片集可以从工业流水线对工件进行拍照获取，目标检测模型可以实现待储存图片集中图片上工件缺陷的识别，包括缺陷位置（目标框）和缺陷类别。

S2，根据推理结果在对应的待储存图片上进行切图操作，以抠出对应的缺陷图并存储缺陷图对应的缺陷类别。

具体地，根据推理结果在相应的图片上进行切图操作，从图片上抠出缺陷的目标框获得缺陷图，并将缺陷图对应的缺陷类别进行存储。

S3，将缺陷图输入向量提取模型以获取图片特征向量V，其中，向量提取模型包括：特征提取网络Swin transformer、降维卷积核和分类器。

具体地，向量提取模型可以提取缺陷图的特征并生成图片特征向量V，向量提取模型可以提前进行训练，具体训练过程如下述：

根据本发明的一个实施例，如图2所示，采用以下步骤训练向量提取模型：

S31，将缺陷图和对应的缺陷类别作为输入送入特征提取网络Swin transformer，其中对应的缺陷类别作为训练标签，以生成三维特征图F1。

具体地，选取Swin transformer作为特征提取网络具有如下技术效果：（1）其网络参数数量适中，训练速度较快，适合大规模训练；（2）可以解决梯度消失的问题；（3）有较强的特征提取能力。

S32，将三维特征图F1输入第一降维卷积核

，以生成二维特征图F2。

S33，将二维特征图F2输入第二降维卷积核

，以生成图片特征向量V。其中，图片特征向量V为一维特征向量。

S34，将图片特征向量V作为输入送入分类器，进行梯度下降。

具体地，特征提取网络Swin transformer、第一降维卷积核

、第二降维卷积核

与分类器整体作为向量提取模型。特征提取网络Swin transformer可以提取缺陷图的三维特征图F1，将F1依次输入第一降维卷积核

、第二降维卷积核

，可以将三维特征图F1降维为一维特征图即图片特征向量V，采用多个降维卷积核的渐进式的降维方式，利用网络学习的方式，可以获得更加精准的降维过程和结果。最后，将图片特征向量V送入分类器，进行梯度下降，不断进行模型迭代，完成向量提取模型的训练。

本发明中的向量提取模型，在模型的最后采用分类器，可以获取模型损失，进而进行梯度下降，且方便标注标签。在模型分类学习的过程中，模型为了得到更好的分类效果，其特征提取网络必定会提炼出更加准确的语义特征，因此在模型分类的学习过程中，Swintransformer可以获得比常规预训练网络更加精准的特征提取效果。

S4，将缺陷类别进行热编码，以获取对应的编码向量H。

具体地，编码向量H表示公式为：

，其中向量H的维度为 n，即缺陷类别的数量。

S5，将编码向量H的维度补齐与图片特征向量V一致后，将编码向量H与图片特征向量V进行通道拼接，以生成关键字向量W。

具体地，通道拼接即concat，将编码向量H经过padding补齐到维度与图片特征向量V一致，并将两者进行通道拼接，生成关键字向量W。由此，采用特征向量结合热编码的表示方式，会使得在后续向量库检索时，获得更加精确的相似度。

S6，将关键字向量W和对应的待储存图片存入知识图库，其中，关键字向量W作为键（key），对应的待储存图片作为值（value）。

即，关键字向量W和待储存图片组成键值对，以便于后续图片查找。

具体地，如图3所示，知识图库构建方法具体为：先将待储存图片集输入目标检测模型，目标检测模型输出推理结果，然后根据推理结果在对应的待储存图片上进行切图操作，抠出对应的缺陷图并存储缺陷图对应的缺陷类别。将缺陷图输入向量提取模型，经向量提取模型的特征提取网络Swin transformer提取三维特征图F1，第一降维卷积核

对三维特征图F1进行降维，得到二维特征图F2，第二降维卷积核

对二维特征图F2进行进一步降维得到图片特征向量V。将缺陷类别进行热编码，以获取对应的编码向量H，对编码向量H 进行向量补齐操作后，将编码向量H与图片特征向量V进行通道拼接，生成关键字向量W，最后将关键字向量W和对应的待储存图片存入知识图库即可。

由上，采用向量构建知识图库，从而可以建立一套可用于快速搜索的知识图库，且在特征提取时采用特征提取网络、降维卷积核和分类器相结合，从而可以获取更加精准的特征提取效果，提高图片搜索的准确性。

根据本发明的一个实施例，三维特征图F1的维度为

，其中

是三维特征图F1宽的维度，

是三维特征图F1高的维度，C₁是三维特征图F1通道的维度，第一降维卷积核

的维度为3*3*C，其中3*3为第一降维卷积核滑窗的大小，C为第一降维卷积核

的通道且等于C₁；二维特征图F2的维度为

，其中

是二维特征图F2宽的维度，

是二维特征图F2高的维度，且

等于

、

等于

，特征提取模块采用以下公式获取

和

的大小：

其中p为补足（padding）的大小，且p=1。

图片特征向量V的维度为4096*1，第二降维卷积核

的维度为

，其中

为第二降维卷积核滑窗的大小，且

等于

、

等于

，1为第二降维卷积核的通道，4096为第二降维卷积核的卷积核个数。

具体地，图片特征向量V的维度为4096*1，选取4096是因为4096大小适中，并且这个数字可以适当上下浮动。将第二降维卷积核

中4096个卷积核分别与二维特征图F2进行卷积运算，获得4096*1的1维的图片特征向量V。

综上所述，根据本发明实施例的工业检测中的知识图库构建方法，首先，获取待储存图片集，并输入目标检测模型，以获得推理结果，推理结果包括：缺陷位置和缺陷类别，然后，根据推理结果在对应的待储存图片上进行切图操作，以抠出对应的缺陷图并存储缺陷图对应的缺陷类别，再将缺陷图输入向量提取模型以获取图片特征向量V，其中，向量提取模型包括：特征提取网络Swin transformer、降维卷积核和分类器，将缺陷类别进行热编码，以获取对应的编码向量H，将编码向量H的维度补齐与图片特征向量V一致后，将编码向量H与图片特征向量V进行通道拼接，以生成关键字向量W，最后，将关键字向量W和对应的待储存图片存入知识图库，其中，关键字向量W作为键，对应的待储存图片作为值。由此，该方法，采用向量构建知识图库，从而可以建立一套可用于快速搜索的知识图库，且在特征提取时采用特征提取网络、降维卷积核和分类器相结合，从而可以获取更加精准的特征提取效果，提高图片搜索的准确性。

与上述的工业检测中的知识图库构建方法相对应，本发明还提出一种基工业检测中的知识图库构建装置，由于本发明的装置实施例与上述的方法实施例相对应，对于装置实施例中未披露的细节可参照上述的方法实施例，本发明中不再进行赘述。

图4是根据本发明一个实施例的工业检测中的知识图库构建装置的方框示意图，如图4所示，该装置包括：获取模块1、切图模块2、特征提取模块3、热编码模块4、拼接模块5和存储模块6。

其中，获取模块1用于获取待储存图片集，并输入目标检测模型，以获得推理结果，推理结果包括：缺陷位置和缺陷类别；切图模块2用于根据推理结果在对应的待储存图片上进行切图操作，以抠出对应的缺陷图并存储缺陷图对应的缺陷类别；特征提取模块3用于将缺陷图输入向量提取模型以获取图片特征向量V，其中，向量提取模型包括：特征提取网络Swin transformer、降维卷积核和分类器；热编码模块4用于将缺陷类别进行热编码，以获取对应的编码向量H；拼接模块5用于将编码向量H的维度补齐与图片特征向量V一致后，将编码向量H与图片特征向量V进行通道拼接，以生成关键字向量W；存储模块6用于将关键字向量W和对应的待储存图片存入知识图库，其中，关键字向量W作为键，对应的待储存图片作为值。

根据本发明的一个实施例，向量提取模型具体用于采用以下步骤训练：将缺陷图和对应的缺陷类别作为输入送入特征提取网络Swin transformer，其中对应的缺陷类别作为训练标签，以生成三维特征图F1；将三维特征图F1输入第一降维卷积核，以生成二维特征图F2；将二维特征图F2输入第二降维卷积核，以生成图片特征向量V；将图片特征向量V作为输入送入分类器，进行梯度下降。

根据本发明的一个实施例，三维特征图F1的维度为

，其中

是三维特征图F1宽的维度，

是三维特征图F1高的维度，C₁是三维特征图F1通道的维度，第一降维卷积核的维度为3*3*C，其中3*3为第一降维卷积核滑窗的大小，C为第一降维卷积核的通道且等于C₁；二维特征图F2的维度为

，其中

是二维特征图F2宽的维度，

是二维特征图F2高的维度，且

等于

、

等于

，特征提取模块采用以下公式获取

和

的大小：

其中p为补足的大小，且p=1。

根据本发明的一个实施例，图片特征向量V的维度为4096*1，第二降维卷积核的维度为

，其中

为第二降维卷积核滑窗的大小，且

等于

、

等于

综上所述，根据本发明实施例的工业检测中的知识图库构建装置，采用向量构建知识图库，从而可以建立一套可用于快速搜索的知识图库，且在特征提取时采用特征提取网络、降维卷积核和分类器相结合，从而可以获取更加精准的特征提取效果，提高图片搜索的准确性。

在本发明的描述中，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。“多个”的含义是两个或两个以上，除非另有明确具体的限定。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必针对相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分，并且本发明的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能，这应被本发明的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备（如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统）使用，或结合这些指令执行系统、装置或设备而使用。就本说明书而言，"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例（非穷尽性列表）包括以下：具有一个或多个布线的电连接部（电子装置），便携式计算机盘盒（磁装置），随机存取存储器（RAM），只读存储器（ROM），可擦除可编辑只读存储器（EPROM或闪速存储器），光纤装置，以及便携式光盘只读存储器（CDROM）。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如，如果用硬件来实现和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列（PGA），现场可编程门阵列（FPGA）等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本发明各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器，磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

尽管已经示出和描述了本发明的实施例，对于本领域的普通技术人员而言，可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由所附权利要求及其等同物限定。