CN115100462A

CN115100462A - 一种基于回归预测的插座分类方法

Info

Publication number: CN115100462A
Application number: CN202210699092.1A
Authority: CN
Inventors: 周恩; 徐建楚; 黄志炳; 吴霞; 徐红梅; 王新燕; 梁佳娜
Original assignee: Zhejiang Fangyuan Detection Group Stock Co ltd
Current assignee: Zhejiang Fangyuan Detection Group Stock Co ltd
Priority date: 2022-06-20
Filing date: 2022-06-20
Publication date: 2022-09-23

Abstract

本发明公开了一种基于回归预测的插座分类方法，利用一训练好的特征提取网络对待检测插座图片提取获得n维特征向量A；将n维特征向量A与特征检索库中N个类别的真值标签一一进行相似度计算，取相似度最接近于1的真值标签对应的插座类别作为待检测插座预测的插座类别完成插座分类。本发明的特征提取网络在训练时根据类别图片占比设置权重，避免特征提取网络偏置，同时采用基于回归预测的算法来对插座进行精准分类，以替代人工目视区分。提出的方法只需训练一次，推理时可泛化到对未知的插座也具备分类能力。

Description

一种基于回归预测的插座分类方法

技术领域

本发明属于插座分类领域，具体涉及一种基于回归预测的插座分类方法。

背景技术

市面上的插座具有形形色色的种类，各种插座外形相似但特征不一，若人们在采用肉眼进行区分时不集中注意力，往往容易分类错误。特别是在工业生产中，一方面插座产品种类繁多，且插座样本往往数量分布不均匀，这时更加要求高效且准确的插座分类，此时若采用人为目视进行区分，往往产能低效。采用机器视觉算法在插座样本分布不均匀的情况下进行插座种类的快速、精准区分已成为插座生产行业的刚需。

发明内容

本发明的目的是基于现有技术的不足，提供一种基于回归预测的插座分类方法，采用基于回归预测的算法来对插座进行精准分类，以替代人工目视区分。提出的方法只需训练一次，推理时可泛化到对未知的插座也具备分类能力。

本发明采用的技术方案具体如下：

一种基于回归预测的插座分类方法，具体为：

利用一训练好的特征提取网络对待检测插座图片提取获得n维特征向量A；

将n维特征向量A与特征检索库中N个类别的真值标签一一进行相似度计算，取相似度最接近于1的真值标签对应的插座类别作为待检测插座预测的插座类别。

其中，所述训练好的特征提取网络通过如下方法训练获得：

收集插座图片构建训练数据集，统计训练数据集中每个类别的插座图片占比，将插座图片两两组成训练图片对并标注标签y；其中训练图片对中两张图片属于同一类则标签y为1，否则y为0；

构建一特征提取网络，所述特征提取网络的输入为训练图片对，输出为n维特征向量，以输出和标签构建损失函数并进行训练，直至损失函数收敛或达到设置的训练次数，获得训练好的特征提取网络；所述损失函数为：

其中:

d_Ia,Ib＝||f_Ia-f_Ib||

w_id＝(1-w_a-w_b)

w_id是权重，w_a和w_b分别指训练图片对中图片a和b对应类别的图片数据占比，f_Ia表示特征提取网络输出的图片a对应的n维特征向量，f_Ib表示特征提取网络输出的图片b对应的n维特征向量，α表示阈值，下标+表示取max；

所述特征检索库通过如下方法构建获得：

在训练数据集中每个类别选取多张插座图片分别输入至训练好的特征提取网络，每个类别分别获得对应的多个n维特征向量，取多个n维特征向量的中值作为对应类别的真值标签，所有类别的真值标签构成特征检索库。

进一步地，所述特征提取网络是一具有插座识别能力的检测模型的特征提取部分。

进一步地，还包括检验步骤：

对计算得到的N个相似度按从大到小进行排序，取前3个相似度值进行方差数值波动分析，计算公式如下：

M表示N个余弦相似度的均值，x₁、x₂、x₃表示排序在前的3个相似度；若方差大于1则说明识别结果准确。

进一步地，相似度计算采用余弦相似度。

本发明的有益效果是：根据类别图片占比设置权重，避免特征提取网络偏置，同时采用基于回归预测的算法来对插座进行精准分类，以替代人工目视区分。提出的方法只需训练一次，推理时可泛化到对未知的插座也具备分类能力。

附图说明

图1是数据集分类示意图；

图2是一种检测模型结构图；

图3是特征提取网络结构图；

图4是本发明方法流程图；

具体实施方式

本发明提供了一种基于回归预测的插座分类方法，该方法流程如图4所示，包括以下步骤：

(1)将插座训练数据集按插座ID进行分类，具体如下：

对训练数据集进行标签制作，先将插座数据集按类别ID进行分类，如图1所示，统计每个类别的占比，同时将图片两两组成训练图片对并标注标签y以进行回归聚类。其中训练图片对中两张图片属于同一类则标签y为1，若训练图片对中两张图片不属于同一类则标签y为0。

(2)将具有插座识别能力的检测模型(如图2所示)去掉分类层得到特征提取网络(如图3所示)用来对训练图片对进行前向推理，特征提取网络输出的预测值为n维特征向量，根据特征提取网络的输出和标签构建损失函数进行训练，损失函数具体如下：

其中:

d_Ia,Ib＝||f_Ia-f_Ib||

w_id＝(1-w_a-w_b)

其中，w_id是权重，w_a和w_b分别指训练图片对中图片a和b对应类别的图片数据占比，使用时若当图片a和/或b对应类别的图片数据比较多，对应的wid就小，效果就是让网络不向a倾斜。

f_Ia表示特征提取网络输出的图片a对应的n维特征向量，f_Ib表示特征提取网络输出的图片b对应的n维特征向量，α表示阈值，下标+表示取max，||*||是范数。

损失函数目的是增加类间差距，减小类内差距，训练的目的是把loss降到0，(1)当输入的训练图片对是同一类插座时(y＝1)，后面一半是0，所以a和b之间的距离越小越好，这样loss就趋向0；(2)当输入的训练图片对不是同一类插座时(令y＝0)，第一项是0，希望a和b之间的距离要大于α，这样α减去a和b之间的距离会是一个负数，max后就是0。

(3)将数据集中每个ID类别选多张优选图像输入至训练好的特征提取网络进行模型推理，每个类别得到对应的多个n维特征向量，取其中位值作为该类别的真值标签，将N个类别的真值标签构建成特征检索库。

具体地，对N个类别，每类插座选取10张(10是超参，可开放给用户自定义设置)特征清晰的图片，使用训练好的特征提取网络分别进行前向推理，得到对应的N*10*n维的特征向量。为了更具代表性，在取中位数以消除异常值，这样得到N*n维个特征向量即为N个类别的真值标签)，即得到特征检索库；

(4)将待检测插座图片送入训练好的特征提取网络进行推理，输出n维特征向量A；

(5)采用余弦相似度进行特征检索：

将特征检索库中N个类别的真值标签一一与待分类插座输出的n维特征向量真值进行余弦相似度计算，取最接近于1的对应的插座ID即为预测的插座类别，其中余弦相似度的计算方式为：

其中，A表示待检测插座图片经特征提取网络得到的n维特征向量，B表示检索库里的真值标签，n表示特征向量的维度，本实施例中为512。

(6)结果检验：对计算得到的N个余弦相似度按从大到小进行排序，取前3个值(x₁、x₂、x₃)进行方差数值波动分析，计算公式如下：

M表示N个余弦相似度的均值。

若方差大于1，且最大相似度远大于其他相似度，一般该阈值可设置为0.5，则说明识别结果明确；若方差小于1，说明类间差距不大，即可能识别结果不明确，需要进一步校验，如人工检验等。

显然，上述实施例仅仅是为清楚地说明所作的举例，而并非对实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其他不同形式的变化或变动。这里无需也无法把所有的实施方式予以穷举。而由此所引申出的显而易见的变化或变动仍处于本发明的保护范围。

Claims

1.一种基于回归预测的插座分类方法，其特征在于，具体为：

将n维特征向量A与特征检索库中N个类别的真值标签一一进行相似度计算，取相似度最接近于1的真值标签对应的插座类别作为待检测插座预测的插座类别；

其中，所述训练好的特征提取网络通过如下方法训练获得：

其中:

d_Ia,Ib＝||f_Ia-f_Ib||

w_id＝(1w_a-w_b)

所述特征检索库通过如下方法构建获得：

2.根据权利要求1所述的方法，其特征在于，所述特征提取网络是一具有插座识别能力的检测模型的特征提取部分。

3.根据权利要求1所述的方法，其特征在于，还包括检验步骤：

对通过n维特征向量A与特征检索库中N个类别的真值标签一一进行相似度计算得到的N个相似度按从大到小进行排序，取前3个相似度值进行方差数值波动分析，计算公式如下：

4.根据权利要求1所述的方法，其特征在于，相似度计算采用余弦相似度。