CN115100462A - 一种基于回归预测的插座分类方法 - Google Patents

一种基于回归预测的插座分类方法 Download PDF

Info

Publication number
CN115100462A
CN115100462A CN202210699092.1A CN202210699092A CN115100462A CN 115100462 A CN115100462 A CN 115100462A CN 202210699092 A CN202210699092 A CN 202210699092A CN 115100462 A CN115100462 A CN 115100462A
Authority
CN
China
Prior art keywords
socket
extraction network
feature extraction
pictures
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210699092.1A
Other languages
English (en)
Inventor
周恩
徐建楚
黄志炳
吴霞
徐红梅
王新燕
梁佳娜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Fangyuan Detection Group Stock Co ltd
Original Assignee
Zhejiang Fangyuan Detection Group Stock Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Fangyuan Detection Group Stock Co ltd filed Critical Zhejiang Fangyuan Detection Group Stock Co ltd
Priority to CN202210699092.1A priority Critical patent/CN115100462A/zh
Publication of CN115100462A publication Critical patent/CN115100462A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/761Proximity, similarity or dissimilarity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于回归预测的插座分类方法,利用一训练好的特征提取网络对待检测插座图片提取获得n维特征向量A;将n维特征向量A与特征检索库中N个类别的真值标签一一进行相似度计算,取相似度最接近于1的真值标签对应的插座类别作为待检测插座预测的插座类别完成插座分类。本发明的特征提取网络在训练时根据类别图片占比设置权重,避免特征提取网络偏置,同时采用基于回归预测的算法来对插座进行精准分类,以替代人工目视区分。提出的方法只需训练一次,推理时可泛化到对未知的插座也具备分类能力。

Description

一种基于回归预测的插座分类方法
技术领域
本发明属于插座分类领域,具体涉及一种基于回归预测的插座分类方法。
背景技术
市面上的插座具有形形色色的种类,各种插座外形相似但特征不一,若人们在采用肉眼进行区分时不集中注意力,往往容易分类错误。特别是在工业生产中,一方面插座产品种类繁多,且插座样本往往数量分布不均匀,这时更加要求高效且准确的插座分类,此时若采用人为目视进行区分,往往产能低效。采用机器视觉算法在插座样本分布不均匀的情况下进行插座种类的快速、精准区分已成为插座生产行业的刚需。
发明内容
本发明的目的是基于现有技术的不足,提供一种基于回归预测的插座分类方法,采用基于回归预测的算法来对插座进行精准分类,以替代人工目视区分。提出的方法只需训练一次,推理时可泛化到对未知的插座也具备分类能力。
本发明采用的技术方案具体如下:
一种基于回归预测的插座分类方法,具体为:
利用一训练好的特征提取网络对待检测插座图片提取获得n维特征向量A;
将n维特征向量A与特征检索库中N个类别的真值标签一一进行相似度计算,取相似度最接近于1的真值标签对应的插座类别作为待检测插座预测的插座类别。
其中,所述训练好的特征提取网络通过如下方法训练获得:
收集插座图片构建训练数据集,统计训练数据集中每个类别的插座图片占比,将插座图片两两组成训练图片对并标注标签y;其中训练图片对中两张图片属于同一类则标签y为1,否则y为0;
构建一特征提取网络,所述特征提取网络的输入为训练图片对,输出为n维特征向量,以输出和标签构建损失函数并进行训练,直至损失函数收敛或达到设置的训练次数,获得训练好的特征提取网络;所述损失函数为:
Figure BDA0003703264220000011
其中:
dIa,Ib=||fIa-fIb||
wid=(1-wa-wb)
wid是权重,wa和wb分别指训练图片对中图片a和b对应类别的图片数据占比,fIa表示特征提取网络输出的图片a对应的n维特征向量,fIb表示特征提取网络输出的图片b对应的n维特征向量,α表示阈值,下标+表示取max;
所述特征检索库通过如下方法构建获得:
在训练数据集中每个类别选取多张插座图片分别输入至训练好的特征提取网络,每个类别分别获得对应的多个n维特征向量,取多个n维特征向量的中值作为对应类别的真值标签,所有类别的真值标签构成特征检索库。
进一步地,所述特征提取网络是一具有插座识别能力的检测模型的特征提取部分。
进一步地,还包括检验步骤:
对计算得到的N个相似度按从大到小进行排序,取前3个相似度值进行方差数值波动分析,计算公式如下:
Figure BDA0003703264220000021
M表示N个余弦相似度的均值,x1、x2、x3表示排序在前的3个相似度;若方差大于1则说明识别结果准确。
进一步地,相似度计算采用余弦相似度。
本发明的有益效果是:根据类别图片占比设置权重,避免特征提取网络偏置,同时采用基于回归预测的算法来对插座进行精准分类,以替代人工目视区分。提出的方法只需训练一次,推理时可泛化到对未知的插座也具备分类能力。
附图说明
图1是数据集分类示意图;
图2是一种检测模型结构图;
图3是特征提取网络结构图;
图4是本发明方法流程图;
具体实施方式
本发明提供了一种基于回归预测的插座分类方法,该方法流程如图4所示,包括以下步骤:
(1)将插座训练数据集按插座ID进行分类,具体如下:
对训练数据集进行标签制作,先将插座数据集按类别ID进行分类,如图1所示,统计每个类别的占比,同时将图片两两组成训练图片对并标注标签y以进行回归聚类。其中训练图片对中两张图片属于同一类则标签y为1,若训练图片对中两张图片不属于同一类则标签y为0。
(2)将具有插座识别能力的检测模型(如图2所示)去掉分类层得到特征提取网络(如图3所示)用来对训练图片对进行前向推理,特征提取网络输出的预测值为n维特征向量,根据特征提取网络的输出和标签构建损失函数进行训练,损失函数具体如下:
Figure BDA0003703264220000031
其中:
dIa,Ib=||fIa-fIb||
wid=(1-wa-wb)
其中,wid是权重,wa和wb分别指训练图片对中图片a和b对应类别的图片数据占比,使用时若当图片a和/或b对应类别的图片数据比较多,对应的wid就小,效果就是让网络不向a倾斜。
fIa表示特征提取网络输出的图片a对应的n维特征向量,fIb表示特征提取网络输出的图片b对应的n维特征向量,α表示阈值,下标+表示取max,||*||是范数。
损失函数目的是增加类间差距,减小类内差距,训练的目的是把loss降到0,(1)当输入的训练图片对是同一类插座时(y=1),后面一半是0,所以a和b之间的距离越小越好,这样loss就趋向0;(2)当输入的训练图片对不是同一类插座时(令y=0),第一项是0,希望a和b之间的距离要大于α,这样α减去a和b之间的距离会是一个负数,max后就是0。
(3)将数据集中每个ID类别选多张优选图像输入至训练好的特征提取网络进行模型推理,每个类别得到对应的多个n维特征向量,取其中位值作为该类别的真值标签,将N个类别的真值标签构建成特征检索库。
具体地,对N个类别,每类插座选取10张(10是超参,可开放给用户自定义设置)特征清晰的图片,使用训练好的特征提取网络分别进行前向推理,得到对应的N*10*n维的特征向量。为了更具代表性,在取中位数以消除异常值,这样得到N*n维个特征向量即为N个类别的真值标签),即得到特征检索库;
(4)将待检测插座图片送入训练好的特征提取网络进行推理,输出n维特征向量A;
(5)采用余弦相似度进行特征检索:
将特征检索库中N个类别的真值标签一一与待分类插座输出的n维特征向量真值进行余弦相似度计算,取最接近于1的对应的插座ID即为预测的插座类别,其中余弦相似度的计算方式为:
Figure BDA0003703264220000032
其中,A表示待检测插座图片经特征提取网络得到的n维特征向量,B表示检索库里的真值标签,n表示特征向量的维度,本实施例中为512。
(6)结果检验:对计算得到的N个余弦相似度按从大到小进行排序,取前3个值(x1、x2、x3)进行方差数值波动分析,计算公式如下:
Figure BDA0003703264220000041
M表示N个余弦相似度的均值。
若方差大于1,且最大相似度远大于其他相似度,一般该阈值可设置为0.5,则说明识别结果明确;若方差小于1,说明类间差距不大,即可能识别结果不明确,需要进一步校验,如人工检验等。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其他不同形式的变化或变动。这里无需也无法把所有的实施方式予以穷举。而由此所引申出的显而易见的变化或变动仍处于本发明的保护范围。

Claims (4)

1.一种基于回归预测的插座分类方法,其特征在于,具体为:
利用一训练好的特征提取网络对待检测插座图片提取获得n维特征向量A;
将n维特征向量A与特征检索库中N个类别的真值标签一一进行相似度计算,取相似度最接近于1的真值标签对应的插座类别作为待检测插座预测的插座类别;
其中,所述训练好的特征提取网络通过如下方法训练获得:
收集插座图片构建训练数据集,统计训练数据集中每个类别的插座图片占比,将插座图片两两组成训练图片对并标注标签y;其中训练图片对中两张图片属于同一类则标签y为1,否则y为0;
构建一特征提取网络,所述特征提取网络的输入为训练图片对,输出为n维特征向量,以输出和标签构建损失函数并进行训练,直至损失函数收敛或达到设置的训练次数,获得训练好的特征提取网络;所述损失函数为:
Figure FDA0003703264210000011
其中:
dIa,Ib=||fIa-fIb||
wid=(1wa-wb)
wid是权重,wa和wb分别指训练图片对中图片a和b对应类别的图片数据占比,fIa表示特征提取网络输出的图片a对应的n维特征向量,fIb表示特征提取网络输出的图片b对应的n维特征向量,α表示阈值,下标+表示取max;
所述特征检索库通过如下方法构建获得:
在训练数据集中每个类别选取多张插座图片分别输入至训练好的特征提取网络,每个类别分别获得对应的多个n维特征向量,取多个n维特征向量的中值作为对应类别的真值标签,所有类别的真值标签构成特征检索库。
2.根据权利要求1所述的方法,其特征在于,所述特征提取网络是一具有插座识别能力的检测模型的特征提取部分。
3.根据权利要求1所述的方法,其特征在于,还包括检验步骤:
对通过n维特征向量A与特征检索库中N个类别的真值标签一一进行相似度计算得到的N个相似度按从大到小进行排序,取前3个相似度值进行方差数值波动分析,计算公式如下:
Figure FDA0003703264210000012
M表示N个余弦相似度的均值,x1、x2、x3表示排序在前的3个相似度;若方差大于1则说明识别结果准确。
4.根据权利要求1所述的方法,其特征在于,相似度计算采用余弦相似度。
CN202210699092.1A 2022-06-20 2022-06-20 一种基于回归预测的插座分类方法 Pending CN115100462A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210699092.1A CN115100462A (zh) 2022-06-20 2022-06-20 一种基于回归预测的插座分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210699092.1A CN115100462A (zh) 2022-06-20 2022-06-20 一种基于回归预测的插座分类方法

Publications (1)

Publication Number Publication Date
CN115100462A true CN115100462A (zh) 2022-09-23

Family

ID=83290703

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210699092.1A Pending CN115100462A (zh) 2022-06-20 2022-06-20 一种基于回归预测的插座分类方法

Country Status (1)

Country Link
CN (1) CN115100462A (zh)

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108846426A (zh) * 2018-05-30 2018-11-20 西安电子科技大学 基于深度双向lstm孪生网络的极化sar分类方法
CN110321451A (zh) * 2019-04-25 2019-10-11 吉林大学 基于分布熵增益损失函数的图像检索算法
CN111428823A (zh) * 2020-06-11 2020-07-17 北京科技大学 一种可以识别新类的磨粒分类模型与方法
CN111667050A (zh) * 2020-04-21 2020-09-15 佳都新太科技股份有限公司 度量学习方法、装置、设备及存储介质
CN112115806A (zh) * 2020-08-28 2020-12-22 河海大学 基于Dual-ResNet小样本学习的遥感影像场景精确分类方法
CN112632313A (zh) * 2020-12-25 2021-04-09 江南大学 一种基于深度学习的蕾丝花边检索方法
CN112767366A (zh) * 2021-01-22 2021-05-07 南京汇川图像视觉技术有限公司 基于深度学习的图像识别方法、装置、设备及存储介质
CN112989889A (zh) * 2019-12-17 2021-06-18 中南大学 一种基于姿态指导的步态识别方法
CN113112483A (zh) * 2021-04-16 2021-07-13 合肥科大智能机器人技术有限公司 一种基于相似度度量的刚性接触网缺陷检测方法及系统
CN113191215A (zh) * 2021-04-12 2021-07-30 西安理工大学 融合注意力机制与孪生网络结构的滚动轴承故障诊断方法
CN113255793A (zh) * 2021-06-01 2021-08-13 之江实验室 一种基于对比学习的细粒度舰船识别方法
CN113469253A (zh) * 2021-07-02 2021-10-01 河海大学 一种基于三元组孪生网络的窃电检测方法
CN113705597A (zh) * 2021-03-05 2021-11-26 腾讯科技(北京)有限公司 一种图像处理方法、装置、计算机设备以及可读存储介质
CN114239649A (zh) * 2021-07-15 2022-03-25 电子科技大学 面向可穿戴设备光电容积脉搏波信号发现和识别新用户的身份识别方法

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108846426A (zh) * 2018-05-30 2018-11-20 西安电子科技大学 基于深度双向lstm孪生网络的极化sar分类方法
CN110321451A (zh) * 2019-04-25 2019-10-11 吉林大学 基于分布熵增益损失函数的图像检索算法
CN112989889A (zh) * 2019-12-17 2021-06-18 中南大学 一种基于姿态指导的步态识别方法
CN111667050A (zh) * 2020-04-21 2020-09-15 佳都新太科技股份有限公司 度量学习方法、装置、设备及存储介质
CN111428823A (zh) * 2020-06-11 2020-07-17 北京科技大学 一种可以识别新类的磨粒分类模型与方法
CN112115806A (zh) * 2020-08-28 2020-12-22 河海大学 基于Dual-ResNet小样本学习的遥感影像场景精确分类方法
CN112632313A (zh) * 2020-12-25 2021-04-09 江南大学 一种基于深度学习的蕾丝花边检索方法
CN112767366A (zh) * 2021-01-22 2021-05-07 南京汇川图像视觉技术有限公司 基于深度学习的图像识别方法、装置、设备及存储介质
CN113705597A (zh) * 2021-03-05 2021-11-26 腾讯科技(北京)有限公司 一种图像处理方法、装置、计算机设备以及可读存储介质
CN113191215A (zh) * 2021-04-12 2021-07-30 西安理工大学 融合注意力机制与孪生网络结构的滚动轴承故障诊断方法
CN113112483A (zh) * 2021-04-16 2021-07-13 合肥科大智能机器人技术有限公司 一种基于相似度度量的刚性接触网缺陷检测方法及系统
CN113255793A (zh) * 2021-06-01 2021-08-13 之江实验室 一种基于对比学习的细粒度舰船识别方法
CN113469253A (zh) * 2021-07-02 2021-10-01 河海大学 一种基于三元组孪生网络的窃电检测方法
CN114239649A (zh) * 2021-07-15 2022-03-25 电子科技大学 面向可穿戴设备光电容积脉搏波信号发现和识别新用户的身份识别方法

Similar Documents

Publication Publication Date Title
CN108074231B (zh) 一种基于卷积神经网络的磁片表面缺陷检测方法
CN105389593B (zh) 基于surf特征的图像物体识别方法
CN103870811B (zh) 一种用于视频监控的正面人脸快速判别方法
CN110414368A (zh) 一种基于知识蒸馏的无监督行人重识别方法
CN110069630B (zh) 一种改进的互信息特征选择方法
CN103279768B (zh) 一种基于增量学习人脸分块视觉表征的视频人脸识别方法
CN103544499B (zh) 一种基于机器视觉的表面瑕疵检测的纹理特征降维方法
CN104715254A (zh) 一种基于2d和3d sift特征融合的一般物体识别方法
CN102385592B (zh) 图像概念的检测方法和装置
CN112149758B (zh) 一种基于欧式距离和深度学习的高光谱开放集分类方法
CN111325237B (zh) 一种基于注意力交互机制的图像识别方法
CN110874576B (zh) 一种基于典型相关分析融合特征的行人再识别方法
CN105389326A (zh) 基于弱匹配概率典型相关性模型的图像标注方法
CN110414587A (zh) 基于渐进学习的深度卷积神经网络训练方法与系统
CN108073940B (zh) 一种非结构化环境中的3d目标实例物体检测的方法
CN105930792A (zh) 一种基于视频局部特征字典的人体动作分类方法
CN110288013A (zh) 一种基于block分割和多重输入孪生卷积神经网络的缺陷标签识别方法
Yuvaraj et al. Shape, Color and Texture Based CBIR System Using Fuzzy Logic Classifier.
Yingthawornsuk et al. Automatic Thai Coin Calculation System by Using SIFT
Supekar et al. Multi-parameter based mango grading using image processing and machine learning techniques
Sahlol et al. Elephant herd optimization with neural networks: a case study on acute lymphoblastic leukemia diagnosis
CN106326927B (zh) 一种鞋印新类别检测方法
CN114926702B (zh) 一种基于深度注意力度量的小样本图像分类方法
CN115100462A (zh) 一种基于回归预测的插座分类方法
CN110135306B (zh) 基于角度损失函数的行为识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination