CN116977834A - 一种开放条件下分布内外图像识别方法 - Google Patents
一种开放条件下分布内外图像识别方法 Download PDFInfo
- Publication number
- CN116977834A CN116977834A CN202311083233.8A CN202311083233A CN116977834A CN 116977834 A CN116977834 A CN 116977834A CN 202311083233 A CN202311083233 A CN 202311083233A CN 116977834 A CN116977834 A CN 116977834A
- Authority
- CN
- China
- Prior art keywords
- score
- new
- image
- training
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 238000012549 training Methods 0.000 claims abstract description 61
- 238000013528 artificial neural network Methods 0.000 claims abstract description 45
- 239000013598 vector Substances 0.000 claims abstract description 29
- 230000002159 abnormal effect Effects 0.000 claims abstract description 26
- 238000007781 pre-processing Methods 0.000 claims abstract description 10
- 238000012360 testing method Methods 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 claims description 13
- 230000004913 activation Effects 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 8
- 230000008569 process Effects 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 4
- 101100460203 Schizosaccharomyces pombe (strain 972 / ATCC 24843) new2 gene Proteins 0.000 claims description 3
- 101100273916 Schizosaccharomyces pombe (strain 972 / ATCC 24843) wip1 gene Proteins 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 230000002787 reinforcement Effects 0.000 claims description 3
- 238000003062 neural network model Methods 0.000 abstract description 5
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 238000001514 detection method Methods 0.000 description 8
- 230000009466 transformation Effects 0.000 description 3
- 230000005856 abnormality Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 206010000117 Abnormal behaviour Diseases 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/98—Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Quality & Reliability (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种开放条件下分布内外图像识别方法,包括图像数据采集,构建训练数据集,并进行原始图像预处理;神经网络特征提取;计算交叉熵损失;模型更新;模型特征提取;置信度判断;计算能量得分、相似度得分和异常分数;根据异常分数进行异常类型判断;输出识别结果。本发明的有益效果是:本发明在神经网络训练阶段,在保证分布内图像分类精度的前提下,通过添加线性层来降低特征维度,保存训练集的特征向量用于分布外异常检测。当识别新输入的图像时,利用训练完成的神经网络模型进行推理得到输入图像的特征向量,计算本发明设计的分布外得分函数,从而判断是否为分布外异常类型。
Description
技术领域
本发明涉及图像识别技术领域,更确切地说,它涉及一种开放条件下分布内外图像识别方法。
背景技术
随着计算机视觉的快速发展,图像识别的应用场景增多、需求变广,封闭条件下在有限数据集上训练模型进行图像识别不满足实际应用需求。在开放条件下,模型训练数据集有限,在图像识别任务中可能会遇到未见过的类型,将其识别为数据库中的类型,可能对系统造成潜在威胁。通常将数据库中存储的图像种类称为分布内类型,将实际任务中出现的异常图像种类称为分布外类型。开放条件下的分布内外图像识别要求对分布内图像类型进行准确分类,同时要识别出分布外异常图像。此任务涉及多种领域,如自动驾驶中识别异常道路状况、工业图像识别中检测故障器件、视频监控中异常行为检测等。
现有的分布内图像识别技术已经比较成熟,采用神经网络进行分类有较高的分类精度。而分布外异常识别研究相对落后,主流方法包括:ODIN、马氏距离方法、最大置信度方法、能量函数方法等。然而,如ODIN和马氏距离方法这类需要新的神经网络重新训练,会产生额外的设备开销和时间损耗,或者对分布内分类网络有较大改动,影响分布内分类精度。而简单的分布外检测器,如最大置信度、能量函数等方法,仅仅利用神经网络得到的置信度或逻辑向量进行判断,会因模型对异常类型产生高置信度而对系统产生威胁。
发明内容
本发明的目的是针对现有技术的不足,提出了一种开放条件下分布内外图像识别方法。
第一方面,提供了一种开放条件下分布内外图像识别方法,包括:
S1、进行神经网络训练;
S1包括:
S101、图像数据采集,构建训练数据集,并进行原始图像预处理;
S102、神经网络特征提取;
S103、计算交叉熵损失;
S104、模型更新;
S2、图像类型推理;
S2包括:
S201、模型特征提取;
S202、置信度判断;
S203、计算能量得分、相似度得分和异常分数;
S204、根据异常分数进行异常类型判断;
S205、输出识别结果。
作为优选,S102中,采用Convnet-Tiny神经网络框架作为基础的特征提取器,并将神经网络得到的高维特征进行降维。
作为优选,S103中,交叉熵损失的计算公式为:
其中,N为图像训练集数量,C为类别数量,yic是样本xi的标签编码yi={yi1,yi2,...,yiC},当属于第c类时,yic为1否则为0,pic是样本xi属于类别c的概率。
作为优选,S104中,前向传播完成后,采用梯度下降的方式对模型反向传播,更新模型的网络参数。经过多轮次的模型参数更新,训练完成后,将模型的参数权重进行保存,并将分布内数据集训练过程中得到的特征进行保存,用来识别新输入的图像。
作为优选,S201中,特征提取表示为:
znew=Z(xnew)
lnew=L1(znew)
gnew=L2(relu(lnew))
fnew=L3(gnew)
pnew=softmax(fnew)
其中,xnew为新输入的图像,znew为神经网络编码器Z输出的高维特征向量,lnew为第一层线性层L1输出,gnew为第二层线性层L2输出,fnew是分类线性层L3的逻辑向量,pnew={pnew1,pnew2,...,pnewC}为SoftMax激活函数输出的置信度向量。
作为优选,S202中,根据最大置信度进行初步判断,当最大置信度小于阈值τ时,即 识别为异常类型图像,将该输入图像xnew标记为“Unknown”;当置信度高于阈值τ时,即pm≥τ时,由于模型会对未知图像产生高置信度,计算得分函数来判断。
作为优选,S203包括:
S2031、计算能量得分,根据逻辑向量计算能量得分函数:
S2032、计算相似度得分,根据神经网络得到不同维度的特征向量z,l,g,与训练集的特征向量进行余弦相似度计算,并根据得到的相似度进行加强求和;
scoresim=λ1simmax(ztest,{zm})+λ2simmax(ltest,{lm})+λ3simmax(gtest,{gm})
其中,scoresim是相似度得分函数,是输入图像xnew经过神经网络得到znew,lnew,gnew与分布内数据集余弦相似度最大值的加权和,λ1,λ2,λ3为权重;
S2033、计算异常分数,表示为:
score=μ1scoreenergy+μ2scoresim
其中,μ1,μ2为得分权重。
作为优选,S204中,当设置阈值为ρ,score<ρ时,说明输入图像与训练集分布内图像分布差异较大,新输入的图像为未知类型;当score≥ρ时,说明新输入的图像是数据库中已有类型,根据最大置信度说明新输入的图像属于第m种类型。
第二方面,提供了一种开放条件下分布内外图像识别系统,用于执行第一方面任一所述的开放条件下分布内外图像识别方法,包括:
训练模块,用于进行神经网络训练;
训练模块包括:
采集单元,用于图像数据采集,构建训练数据集,并进行原始图像预处理;
提取单元,用于神经网络特征提取;
第一计算单元,用于计算交叉熵损失;
更新单元,用于模型更新;
推理模块,用于图像类型推理;
推理模块包括:
提取单元,用于模型特征提取;
判断单元,用于置信度判断;
第二计算单元,用于计算能量得分、相似度得分和异常分数;
判断单元,用于根据异常分数进行异常类型判断;
输出单元,用于输出识别结果。
第三方面,提供了一种计算机存储介质,所述计算机存储介质内存储有计算机程序;所述计算机程序在计算机上运行时,使得计算机执行权利要求1至8任一所述的开放条件下分布内外图像识别方法。
本发明的有益效果是:本发明在神经网络训练阶段,在保证分布内图像分类精度的前提下,通过添加线性层来降低特征维度,保存训练集的特征向量用于分布外异常检测。当识别新输入的图像时,利用训练完成的神经网络模型进行推理得到输入图像的特征向量,计算本发明设计的分布外得分函数,从而判断是否为分布外异常类型。本发明设计的分布外异常检测器通过得分函数进行判断,不需要额外的神经网络,因此更加方便且可移植性更强。此外,分布外得分函数综合考虑了分布内分类模型输出的逻辑向量的分布特点和与分布内数据集的相似度差异,提高了对分布外异常类型的识别精度。
附图说明
图1为本发明分布内外图像识别神经网络模型整体框架;
图2为本发明分布内外图像识别神经网络模型训练流程图;
图3为本发明根据训练完成的模型识别新输入图像的推理流程图。
具体实施方式
下面结合实施例对本发明做进一步描述。下述实施例的说明只是用于帮助理解本发明。应当指出,对于本技术领域的普通人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
实施例1:
本申请实施例1提供了一种开放条件下分布内外图像识别方法,在模型训练阶段对神经网络高维特征输出进行降维,在不影响分类精度的前提下提高模型的泛化性。在图像推理识别阶段,设计分布外异常图像检测器,直接利用模型提取的特征向量识别分布外异常图像,避免因对分布外异常类型高置信度而导致误判,提高图像识别精度。
具体的,如图2和图3所示,本发明提供的方法包括:
S1、进行神经网络训练;
S1包括:
S101、图像数据采集,构建训练数据集,并进行原始图像预处理。
具体的,采集视频图像采集平台获得的图像数据,经过人为标注类别后作为训练数据集:
X={x1,x2,x3,...,xN},Y={y1,y2,y3,...,yN}
其中,X为图像训练数据集,N为数据集图像数量,yi是图像xi的标签,且训练集X中共有C种类型。
此外,对获得的原始数据集进行图像预处理,包括图像尺寸变换和图像随机裁剪。通过图像尺寸变换,原始数据集中不同尺寸大小的图像变为长宽分别为固定值D=224维,便于后续模型训练。通过图像随机裁剪,将训练图像部分随机擦除,从而在训练过程中提高模型精度与稳定性。
S102、神经网络特征提取。
具体的,将预处理后的图像数据输入到神经网络模型中进行训练。本发明采用Convnet-Tiny神经网络框架作为基础的特征提取器,为了在分布内图像分类任务中添加分布外异常检测任务,需要将神经网络得到的高维特征进行降维,以便异常图像检测中的相似度对比。
如图1所示为整体网络结构图。在模型后端添加两层感知机网络,第一层线性层L1将Convnet-Tiny神经网络输出zi由768维降至512维,得到输出li:
zi=Z(xi)
li=L1(zi)
其中,zi为Convnet-Tiny神经网络编码器Z的输出,li是线性层L1的输出。经过ReLu激活函数后,第二层线性层L2将特征由512维降至256维,得到输出gi:
gi=L2(relu(li))
其中,relu为激活函数,gi是线性层L2的输出。然后,再经过一层线性层L3降到类别维度C维,得到逻辑向量fi:
fi=L3(gi)
最后,通过SoftMax激活函数得到图像样本的置信度向量pi:
pi=softmax(fi)
其中,softmax为激活函数,pi={pi1,pi2,...,piC}是逻辑向量fi经过激活函数计算得到的置信度,pic是样本xi属于类别c的概率。
S103、计算交叉熵损失。
根据得到每个图像样本的置信度,结合相应的图像标签计算交叉熵损失:
其中,N为图像训练集数量,C为类别数量,yic是样本xi的标签编码yi={yi1,yi2,...,yiC},当属于第c类时,yic为1否则为0。
S104、模型更新。
S104中,前向传播完成后,采用梯度下降的方式对模型反向传播,更新模型的网络参数。经过多轮次的模型参数更新,训练完成后,将模型的参数权重进行保存,并将分布内数据集训练过程中得到的特征进行保存,用来识别新输入的图像。
S2、图像类型推理。
图3是本发明根据训练完成的模型识别新输入图像的推理流程图,如图3所示,本发明在模型训练完成后进行图像识别推理过程包含以下步骤:
S201、模型特征提取。
S202、置信度判断。
S203、计算能量得分、相似度得分和异常分数。
S204、根据异常分数进行异常类型判断。
S205、输出识别结果。
实施例2:
在实施例1的基础上,本申请实施例2提供了一种更具体的开放条件下分布内外图像识别方法,包括:
S1、进行神经网络训练;
S1包括:
S101、图像数据采集,构建训练数据集,并进行原始图像预处理;
S102、神经网络特征提取;
S103、计算交叉熵损失;
S104、模型更新。
S2、图像类型推理;
S2包括:
S201、模型特征提取。
训练完成后,对新输入的图像进行识别,经过图像尺寸变换后,输入到训练好的神经网络中,得到输入图像的特征向量和置信度。
znew=Z(xnew)
lnew=L1(znew)
gnew=L2(relu(lnew))
fnew=L3(gnew)
pnew=softmax(fnew)
其中,xnew为新输入的图像,znew为神经网络编码器Z输出的高维特征向量,lnew为第一层线性层L1输出,gnew为第二层线性层L2输出,fnew是分类线性层L3的逻辑向量,pnew={pnew1,pnew2,...,pnewC}为SoftMax激活函数输出的置信度向量。
S202、置信度判断。
S202中,根据最大置信度进行初步判断,当最大置信度小于阈值τ时,即 识别为异常类型图像,将该输入图像xnew标记为“Unknown”;当置信度高于阈值τ时,即pm≥τ时,由于模型会对未知图像产生高置信度,计算得分函数来判断。
S203、计算能量得分、相似度得分和异常分数。
S203包括:
S2031、计算能量得分,根据逻辑向量计算能量得分函数:
其中,T为温度系数,需要人为调节。
S2032、计算相似度得分,根据神经网络得到不同维度的特征向量z,l,g,与训练集的特征向量进行余弦相似度计算,并根据得到的相似度进行加强求和;
scoresim=λ1simmax(ztest,{zm})+λ2simmax(ltest,{lm})+λ3simmax(gtest,{gm})
其中,sim(x1,x2)为余弦相似度函数,计算两个特征向量(a1,a2)之间的余弦相似度。simmax(znew,{zm})是计算特征向量znew和分布内训练集所有特征向量{zm,m=1,2,...,N}余弦相似度的最大值。scoresim是相似度得分函数,是输入图像xnew经过神经网络得到znew,lnew,gnew与分布内数据集余弦相似度最大值的加权和,λ1,λ2,λ3为权重,需要人为设置。
S2033、计算异常分数,表示为:
score=μ1scoreenergy+μ2scoresim
其中,μ1,μ2为得分权重,需要人为调节。
S204、根据异常分数进行异常类型判断。
S204中,根据最终得到的异常分数score进行异常类型判断,当设置阈值为ρ,score<ρ时,说明输入图像与训练集分布内图像分布差异较大,新输入的图像为未知类型;当score≥ρ时,说明新输入的图像是数据库中已有类型,根据最大置信度说明新输入的图像属于第m种类型。
S205、输出识别结果。
需要说明的,本实施例中与实施例1相同或相似的部分可相互参考,在本申请中不再赘述。
实施例3:
在实施例1、2的基础上,本申请实施例3提供了另一种开放条件下分布内外图像识别方法,包括:
将互联网上收集的无人机图像作为图像识别数据集,其中包括分布内训练样本5种无人机共50张图片,测试集分布内无人机图像5类20张,分布外异常无人机图像2类10张,则N=50,C=5。
将Convnext-Tiny神经网络后端添加两层线性层、一层分类线性层和一层激活函数层,再把经过图像预处理后的训练集无人机图像输入到神经网络中进行训练,经过前向传播和反向传播来更新模型权重。本实例中训练轮次设置为50次。
模型训练完成后,保存分布内无人机图像的特征向量和模型权重,然后进行识别推理任务。初步最大置信度判断的阈值设置为0.9,即τ=0.9,最大置信度小于0.9的图像直接判别为分布外异常无人机图像。当最大置信度大于0.9时,进行后续的得分函数计算。
本实例中能量函数的参数设置为0.5,则能量函数为:
相似度得分函数的参数设置为,μ1=0.2,μ2=0.5,μ3=0.3,则相似度得分函数为:
scoresim=0.2simmax(ztest,{zm})+0.5simmax(ltest,{lm})+0.3simmax(gtest,{gm})
异常得分函数的参数设置为μ1=0.2,μ2=0.9,则异常得分函数为:
score=0.2scoreenergy+0.9scoresim
最终分布外异常得分函数的阈值设置为1.7,即σ=1.7。当一张无人机图像经过计算后得到的异常得分大于1.7则判定为分布内无人机类型,进一步根据最大置信度判断分布内无人机类别。当异常得分小于1.7,则判定为分布外异常无人机类型,其类型判定为“Unknown”。最终分布内无人机类型识别的准确率为0.97,分布外异常类型实验结果如表1所示。表1是不同的分布外异常无人机类型检测方法识别输入是否是异常类型的准确率。
表1
分布外异常检测方法 | 准确率 |
最大置信度函数 | 0.76 |
能量函数 | 0.80 |
相似度函数 | 0.83 |
异常得分函数 | 0.87 |
如表1所示,本发明针对开放条件下的图像识别任务,基于分布内分类神经网络提取的特征,设计分布外异常图像检测器。相比于其他分布外异常检测方法,本发明的方法最大程度上保证了分布内图像分类任务的准确率,并且在分布外异常类型检测中优于其他方法。
需要说明的,本实施例中与实施例1、2相同或相似的部分可相互参考,在本申请中不再赘述。
实施例4:
在实施例1的基础上,本申请实施例提供了一种开放条件下分布内外图像识别系统,包括:
训练模块,用于进行神经网络训练;
训练模块包括:
采集单元,用于图像数据采集,构建训练数据集,并进行原始图像预处理;
提取单元,用于神经网络特征提取;
第一计算单元,用于计算交叉熵损失;
更新单元,用于模型更新;
推理模块,用于图像类型推理;
推理模块包括:
提取单元,用于模型特征提取;
判断单元,用于置信度判断;
第二计算单元,用于计算能量得分、相似度得分和异常分数;
判断单元,用于根据异常分数进行异常类型判断;
输出单元,用于输出识别结果。
具体的,本实施例所提供的系统为实施例1提供的方法对应的系统,因此,在本实施例中与实施例1相同或相似的部分,可相互参考,在本申请中不再赘述。
Claims (10)
1.一种开放条件下分布内外图像识别方法,其特征在于,包括:
S1、进行神经网络训练;
S1包括:
S101、图像数据采集,构建训练数据集,并进行原始图像预处理;
S102、神经网络特征提取;
S103、计算交叉熵损失;
S104、模型更新;
S2、图像类型推理;
S2包括:
S201、模型特征提取;
S202、置信度判断;
S203、计算能量得分、相似度得分和异常分数;
S204、根据异常分数进行异常类型判断;
S205、输出识别结果。
2.根据权利要求1所述的开放条件下分布内外图像识别方法,其特征在于,S102中,采用Convnet-Tiny神经网络框架作为基础的特征提取器,并将神经网络得到的高维特征进行降维。
3.根据权利要求2所述的开放条件下分布内外图像识别方法,其特征在于,S103中,交叉熵损失的计算公式为:
其中,N为图像训练集数量,C为类别数量,yic是样本xi的标签编码yi={yi1,yi2,...,yiC},当属于第c类时,yic为1否则为0,pic是样本xi属于类别c的概率。
4.根据权利要求3所述的开放条件下分布内外图像识别方法,其特征在于,S104中,前向传播完成后,采用梯度下降的方式对模型反向传播,更新模型的网络参数。经过多轮次的模型参数更新,训练完成后,将模型的参数权重进行保存,并将分布内数据集训练过程中得到的特征进行保存,用来识别新输入的图像。
5.根据权利要求4所述的开放条件下分布内外图像识别方法,其特征在于,S201中,特征提取表示为:
znew=Z(xnew)
lnew=L1(znew)
gnew=L2(relu(lnew))
fnew=L3(gnew)
pnew=softmax(fnew)
其中,xnew为新输入的图像,znew为神经网络编码器Z输出的高维特征向量,lnew为第一层线性层L1输出,gnew为第二层线性层L2输出,fnew是分类线性层L3的逻辑向量,pnew={pnew1,pnew2,...,pnewC}为SoftMax激活函数输出的置信度向量。
6.根据权利要求5所述的开放条件下分布内外图像识别方法,其特征在于,S202中,根据最大置信度进行初步判断,当最大置信度小于阈值τ时,即识别为异常类型图像,将该输入图像xnew标记为“Unknown”;当置信度高于阈值τ时,即pm≥τ时,由于模型会对未知图像产生高置信度,计算得分函数来判断。
7.根据权利要求6所述的开放条件下分布内外图像识别方法,其特征在于,S203包括:
S2031、计算能量得分,根据逻辑向量计算能量得分函数:
S2032、计算相似度得分,根据神经网络得到不同维度的特征向量z,l,g,与训练集的特征向量进行余弦相似度计算,并根据得到的相似度进行加强求和;
scoresim=λ1simmax(ztest,{zm})+λ2simmax(ltest,{lm})+λ3simmax(gtest,{gm})
其中,scoresim是相似度得分函数,是输入图像xnew经过神经网络得到znew,lnew,gnew与分布内数据集余弦相似度最大值的加权和,λ1,λ2,λ3为权重;
S2033、计算异常分数,表示为:
score=μ1scoreenergy+μ2scoresim
其中,μ1,μ2为得分权重。
8.根据权利要求7所述的开放条件下分布内外图像识别方法,其特征在于,S204中,当设置阈值为ρ,score<ρ时,说明输入图像与训练集分布内图像分布差异较大,新输入的图像为未知类型;当score≥ρ时,说明新输入的图像是数据库中已有类型,根据最大置信度 说明新输入的图像属于第m种类型。
9.一种开放条件下分布内外图像识别系统,其特征在于,用于执行权利要求1至8任一所述的开放条件下分布内外图像识别方法,包括:
训练模块,用于进行神经网络训练;
训练模块包括:
采集单元,用于图像数据采集,构建训练数据集,并进行原始图像预处理;
提取单元,用于神经网络特征提取;
第一计算单元,用于计算交叉熵损失;
更新单元,用于模型更新;
推理模块,用于图像类型推理;
推理模块包括:
提取单元,用于模型特征提取;
判断单元,用于置信度判断;
第二计算单元,用于计算能量得分、相似度得分和异常分数;
判断单元,用于根据异常分数进行异常类型判断;
输出单元,用于输出识别结果。
10.一种计算机存储介质,其特征在于,所述计算机存储介质内存储有计算机程序;所述计算机程序在计算机上运行时,使得计算机执行权利要求1至8任一所述的开放条件下分布内外图像识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311083233.8A CN116977834A (zh) | 2023-08-25 | 2023-08-25 | 一种开放条件下分布内外图像识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311083233.8A CN116977834A (zh) | 2023-08-25 | 2023-08-25 | 一种开放条件下分布内外图像识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116977834A true CN116977834A (zh) | 2023-10-31 |
Family
ID=88485034
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311083233.8A Pending CN116977834A (zh) | 2023-08-25 | 2023-08-25 | 一种开放条件下分布内外图像识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116977834A (zh) |
-
2023
- 2023-08-25 CN CN202311083233.8A patent/CN116977834A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107563433B (zh) | 一种基于卷积神经网络的红外小目标检测方法 | |
CN110175615B (zh) | 模型训练方法、域自适应的视觉位置识别方法及装置 | |
CN108960342B (zh) | 基于改进Soft-Max损失函数的图像相似度计算方法 | |
CN104978569B (zh) | 一种基于稀疏表示的增量人脸识别方法 | |
CN116167010B (zh) | 具有智能迁移学习能力的电力系统异常事件快速识别方法 | |
CN111126361A (zh) | 基于半监督学习和特征约束的sar目标鉴别方法 | |
CN115580445A (zh) | 一种未知攻击入侵检测方法、装置和计算机可读存储介质 | |
CN114842343A (zh) | 一种基于ViT的航空图像识别方法 | |
CN110991554B (zh) | 一种基于改进pca的深度网络图像分类方法 | |
CN114782997A (zh) | 基于多损失注意力自适应网络的行人重识别方法及系统 | |
CN112784754A (zh) | 一种车辆再识别方法、装置、设备及存储介质 | |
CN109617864B (zh) | 一种网站识别方法及网站识别系统 | |
CN114881173A (zh) | 基于自注意力机制的简历分类方法和装置 | |
CN115082781A (zh) | 一种舰船图像检测方法、装置以及存储介质 | |
CN116524725B (zh) | 一种智能驾驶的交通标志图像数据识别系统 | |
CN117155706A (zh) | 网络异常行为检测方法及其系统 | |
CN111832463A (zh) | 一种基于深度学习的交通标志检测方法 | |
CN116778460A (zh) | 一种基于图像识别的疲劳驾驶识别方法 | |
CN116363469A (zh) | 一种少样本红外目标检测方法、装置和系统 | |
CN116977834A (zh) | 一种开放条件下分布内外图像识别方法 | |
CN116030300A (zh) | 一种用于零样本sar目标识别的渐进式域自适应识别方法 | |
CN114818845A (zh) | 一种噪声稳健的高分辨距离像特征选择方法 | |
CN112364892B (zh) | 一种基于动态模型的图像识别方法及装置 | |
CN114220016B (zh) | 面向开放场景下的无人机航拍图像的域自适应识别方法 | |
CN116912920B (zh) | 表情识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |