CN112818893A - 一种面向移动终端的轻量化开集地标识别方法 - Google Patents

一种面向移动终端的轻量化开集地标识别方法 Download PDF

Info

Publication number
CN112818893A
CN112818893A CN202110184512.8A CN202110184512A CN112818893A CN 112818893 A CN112818893 A CN 112818893A CN 202110184512 A CN202110184512 A CN 202110184512A CN 112818893 A CN112818893 A CN 112818893A
Authority
CN
China
Prior art keywords
landmark
network
training
distribution
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110184512.8A
Other languages
English (en)
Inventor
胡永利
贾林涛
张勇
苗壮壮
尹宝才
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN202110184512.8A priority Critical patent/CN112818893A/zh
Publication of CN112818893A publication Critical patent/CN112818893A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/176Urban or other man-made structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

一种面向移动终端的轻量化开集地标识别方法,属于计算机视觉领域。本发明首先基于MobileNet‑V2轻量化网络进行改进,使其适用于地标识别任务,然后利用辅助训练集并构建新损失函数,从而提高网络的外分布异常检测能力,最后使用多项指标评估网络性能。本发明基于轻量化神经网络模型并结合外分布检测方法,使部署在移动端的模型既能排除异常图像干扰,又能高效识别任务内地标建筑,同时具备低延迟和轻量的优势。

Description

一种面向移动终端的轻量化开集地标识别方法
技术领域
本发明属于计算机视觉领域,具体涉及神经网络、地标识别、外分布检测等知识。
背景技术
地标建筑作为人类日常活动区域中的重要特征,如果能在真实环境下针对特定场景的建筑方位实现精准检测与识别,可以为自主导航、旅游服务业等第三方产业提供重要支持。当前随着以深度学习为特征的人工智能和物联网技术的快速发展,为在移动终端上识别高分辨率的自然场景图像奠定了重要基础。
传统识别方法包括支持向量机、K近邻、最大相关系数、自适应高斯分类器、卷积神经网络等,以卷积神经网络为例,假设输入样本属于已知分布某类,经特征提取通过Softmax层输出概率来预测结果。由于实际应用中面临开集环境,网络往往会遇到大量未知图像,若继续使用传统的闭集识别方法,将会把所有输入错误地判断为已知类别。使用开集识别方法的网络模型在真实环境中不仅能拒绝外分布异常图像还能正确识别任务内地标建筑。从异常检测的角度看,传统学习方法通常假设模型训练和测试的数据独立同分布,而实际在网络部署后,测试图像往往不受控制。目前基于深度学习的地标识别方法很容易将任意图像识别为任务内类别并给出高置信度,这显然不合理。因此,使深度神经网络能排除外分布异常并实现精准识别,将赋予人工智能产业更高的应用价值。
另一方面,随着移动物联网技术的发展,诸如手机等智能移动设备已成为人类日常生活中的重要组成部分。基于移动终端完成地标识别,需要神经网络模型满足尺寸、延迟及准确率等严苛要求。当前深度卷积神经网络虽已普遍用于计算机视觉领域并取得了优异性能,但因过度追求识别精度,模型越来越大,复杂度也越来越高。例如ResNet的层数最大可达152层,VGG-16虽有16层,但其参数量却高达到138M,这在移动终端是难以应用的。首先是模型过大面临内存不足的问题,其次不满足快速响应的要求,如在自动驾驶系统中,识别太慢会使发生危险的可能性显著增加。因此针对移动终端,合理设计轻量高效的神经网络至关重要。
综上所述,针对移动终端的开集地标识别问题,本发明基于轻量化神经网络并结合外分布检测方法,使移动终端能在开集环境下轻量且高效地完成地标识别任务。
发明内容
本发明针对移动终端资源有限和地标识别时存在异常图像干扰的问题,基于轻量化神经网络模型并结合外分布检测方法,使部署在移动端的模型既能排除异常图像干扰,又能高效识别地标建筑,同时具备低延迟和轻量优势。
首先基于MobileNet-V2轻量化网络进行改进,使其适用于地标识别任务;然后利用辅助训练集并构建新损失函数,从而提高外分布异常检测能力,最后使用多项指标评估网络性能。此外还包括数据集处理、模型训练测试等细节,具体步骤如下。
1基于MobileNet-V2的轻量化网络
MobileNet-V2是针对手机和资源有限的设备专门设计的神经网络结构。它在保证准确率的同时,通过减少参数运算量和所需内存,使网络高效运行。基于MobileNet-V2改进后的网络结构如图1所示。
网络第一层为包含32个标准卷积核的二维卷积层(Conv2D),步长为2,然后连接17个倒残差线性瓶颈块(Bottleneck),当倒残差线性瓶颈块的输入与输出通道数相同且步幅为1时,使用快捷连接;接着连接维度为1280的1x1二维卷积核、7x7平均池化层,同时在最后增加两个全连接层,最后对K个地标建筑方位进行预测,K可针对不同地标识别数据集进行设置,例如,若某旅游景点有50个需要识别的地标,就设置K为50;若所有地标建筑共有118个不同方位需要识别(每个建筑的东西南北方位),就设置K为118。网络输入输出结构的变化见表1。
表1网络结构表
输入 卷积结构 t c n s
224x224x3 Conv2d - 32 1 2
112x112x32 Bottleneck 1 16 1 1
112x112x16 Bottleneck 6 24 2 2
56x56x24 Bottleneck 6 32 3 2
28x28x32 Bottleneck 6 64 4 2
14x14x64 Bottleneck 6 96 3 1
14x14x96 Bottleneck 6 160 3 2
7x7x160 Bottleneck 6 320 1 1
7x7x320 Conv2d 1x1 - 1280 1 1
7x7x1280 Avgpool 7x7 - 1280 1 -
1x1x1280 FC-512 - 512 1 -
1x1x512 FC-K - K 1 -
其中,c表示网络的输出通道数;n表示线性倒残差瓶颈块的重复次数;t表示对线性倒残差瓶颈块中输入通道数扩张的倍数,因此除线性倒残差瓶颈块外的其他层无需该参数;s表示每个序列中第一个卷积核的步幅,由于池化层和全连接层非卷积操作,所以无需该参数。表格的每行代表一个序列,当n为1时,该序列包含1层,对应图1中1个线性倒残差瓶颈块(Bottleneck);当n=4时,该序列包含4层,对应图1中4个线性倒残差瓶颈块。同一个序列中各线性倒残差瓶颈块的输出通道数c相同。在n≠1且s≠1的序列中,s≠1只对第一个线性倒残差瓶颈块有效,其他线性倒残差瓶颈块的步幅s仍为1,此时其输入和输出通道数相同,因此使用快捷连接。t表示对每个序列第一个线性倒残差瓶颈块的输入通道数进行t倍升维,例如当线性倒残差瓶颈块的输入通道数为16且t=6时,在1x1逐点卷积扩张后的中间通道数为96,在3x3逐深度卷积和1x1逐点卷积后,输出通道数c为24。经7x7平均池化层计算后的输出特征大小为1x1x1280。最后再连接两个全连接层得到最终地标类别。
MobileNet-V2使用深度可分离卷积代替标准卷积,它可分解为逐深度卷积和逐点卷积,二者结构如图2所示。逐深度卷积在每个输入通道使用一个卷积核,故不改变输入通道数;逐点卷积使用1x1标准卷积核在所有通道上卷积,来融合逐深度卷积核的输出。
深度可分离卷积在性能接近标准卷积的同时能显著降低模型尺寸和计算量,当卷积核尺寸为3x3时,其计算量约为标准卷积的
Figure BDA0002942978310000031
倍,计算如公式1所示,其中DF为输入特征图的高和宽,M为输入特征图通道数。DK为卷积核尺寸,N为输出特征图的数量。
Figure BDA0002942978310000032
线性倒残差瓶颈块(Bottleneck)采用先升维再进行逐深度卷积最后压缩的结构。升维操作利用1x1逐点卷积以t=6的扩张因子对输入通道数进行升维,故其输出为输入通道数的6倍,然后连接批规范化和ReLU6非线性激活函数;逐深度卷积如图2所示,使用3x3卷积核在特征图的每个通道上进行卷积操作,其后跟随批规范化和ReLU6非线性激活函数,其输入和输出通道数相同;压缩使用图2所示的1x1逐点卷积核,后跟随批规范化和线性激活函数。在此过程中,升维的目的是为了丰富特征数量,提高精度;深度卷积之后再压缩通道数,从而自动选择有用特征来减少参数数量。由于ReLU6在压缩后会破坏特征,因此用于压缩的1x1逐点卷积核后连线性激活函数。结构如图3所示。
2外分布检测损失函数
针对地标识别问题,需要在识别准确的同时也满足外分布检测要求,即先判断输入图像是否为任务内地标建筑,若是则预测对应类别,否则拒绝进一步识别。
通过构建新的损失函数,让模型同时在异常辅助训练集
Figure BDA0002942978310000033
和地标识别训练集
Figure BDA0002942978310000034
上学习,来泛化模型的外分布检测能力。给定网络模型f、异常辅助训练集
Figure BDA0002942978310000041
和地标识别训练集
Figure BDA0002942978310000042
使用最大Softmax概率(MSP),通过训练学习待测试样本是内分布还是外分布的启发。构建的损失函数如公式2:
Figure BDA0002942978310000043
其中x∈X为地标输入图像,y∈Y={1,2,3,...,k}为地标对应类别,函数f(x)表示网络模型,对任意x,1T·f(x)=1且f(x)≥0。
Figure BDA0002942978310000044
表示当地标图像服从任务内分布时,对前项损失求数学期望;
Figure BDA0002942978310000045
表示当输入为异常图像时,对后项损失求数学期望;L表示原始分类损失函数,U表示在K类上的均匀分布,H表示f(x)的输出到均匀分布的交叉熵损失函数,λ为超参数,设置为0.5。在训练阶段,由于任务内的地标图像包含类别信息y,而异常辅助训练集中的图像无需提供该信息,因此当输入图像属于任务内分布时将网络模型记为fy(x)。通过多轮训练和微调网络模型,使对正确预测的地标建筑类别对应的MSP趋于1,而异常图像对应的MSP接近均匀分布。MSP的计算如公式3:
Figure BDA0002942978310000046
其中,zi表示全连接层FC-K第i个神经元的输出,K表示地标建筑类别。公式3将包含K个实数的向量z规范到包含K个正比于输入指数的概率分布,并输出最大Softmax概率MSP,即Pmsp
3数据预处理
为使模型具备外分布检测能力,通过引入异常辅助训练集
Figure BDA0002942978310000047
进行训练,因此数据集包含三部分且相互无关。第一部分是地标识别内分布训练集Din,第二部分是外分布辅助训练集
Figure BDA0002942978310000048
第三部分是用于模型评估的测试集,包括内分布和外分布测试集
Figure BDA0002942978310000049
Figure BDA00029429783100000410
数据预处理包括以下步骤:
1)针对不同场所的的地标识别任务,按地标建筑或各建筑的详细方位作为类别,进行数据集采集,然后针对每个类别按8:1:1分割为训练集
Figure BDA0002942978310000051
验证集
Figure BDA0002942978310000052
和测试集
Figure BDA0002942978310000053
以自建的地标建筑数据集BJUT-118为例,共采集30000多张地标建筑图像,包含校内所有建筑东西南北方向共计118个方位,所以共有118个类别,然后按8:1:1分为训练集
Figure BDA0002942978310000054
验证集
Figure BDA0002942978310000055
和测试集
Figure BDA0002942978310000056
2)异常辅助训练集
Figure BDA0002942978310000057
使用公共数据集Places365;
3)测试集包括内分布测试集
Figure BDA0002942978310000058
和外分布测试集
Figure BDA0002942978310000059
其中
Figure BDA00029429783100000510
使用公共数据集ImageNet的地标类,其与
Figure BDA00029429783100000511
不存在交集;
4)网络训练阶段对地标图像进行数据增强,包括对原始图像的尺寸做随机裁剪与水平翻转、归一化。归一化使用均值u为(0.485,0.456,0.406)和标准差σ为(0.229,0.224,0.225)对输入图像的RGB通道进行归一化操作。计算如公式4所示:
Figure BDA00029429783100000512
其中,x为地标图像的输入张量数据,x′为归一化后的数据。
4训练与测试
为评估网络的开集地标识别性能,本发明先将改进的网络作为基网络,再修改损失函数,对网络进行微调。训练与测试步骤如图4。
1)训练地标识别基网络
基于改进后的基网络,在地标识别训练和验证集上训练200轮,损失函数使用交叉熵,使用带Nesterov动量的SGD优化器,其中初始学习率为0.1,动量设为0.9,权重衰减为0.0005,并结合LambdaLR学习率调整策略,训练并保存模型参数。
2)修改外分布检测损失函数
基于步骤1训练的地标识别基网络,使用公式2的损失函数,通过引入辅助训练集
Figure BDA00029429783100000513
微调网络,使其学会判别图像是任务内地标还是异常图像。网络共训练20轮。优化器使用带Nesterov动量的SGD优化器,其中初始学习率为0.001,动量为0.9,权重衰减为0.0005,并结合LambdaLR学习率调整策略,训练并保存模型参数。
3)模型测试
基于步骤1和步骤2训练的网络模型,测试网络的开集地标识别性能。包括以下步骤:
1.加载网络模型,读取任务内地标测试集
Figure BDA0002942978310000061
和外分布测试集
Figure BDA0002942978310000062
2.当待测地标图像服从任务内分布时,可获取其地标信息y,此时使用MSP(最大Softmax概率)的相反数作为OOD分数Sin,因此OOD分数值小于0。其中正确预测的OOD分数记为
Figure BDA0002942978310000063
错误预测的OOD分数记为
Figure BDA0002942978310000064
通过正确分类样本数比测试样本总数,可得到识别准确率。
3.当待测图像非任务内地标类别时,网络会使其对应MSP接近均匀分布。将外分布图像作为正类,任务内地标样本作为负类,使用MSP的相反数作为OOD分数Sout。使用AUROC、AUPR、FPR95指标评估网络的外分布检测能力。其中AUROC和AUPR可跨不同阈值反映网络整体性能,AUROC可视作外分布样本获得比内分布样本更大OOD分数的概率,该值越接近1表明模型越好;AUPR考虑异常样本的频率,即外分布样本与正常样本的比例,设置
Figure BDA0002942978310000065
比例为1:5,该值越接近1性能越好;FPR95表示当真正例率达95%时的假正例率,该值越接近0越好。
4.基于步骤2、3统计的OOD分数,将FPR95对应的OOD分数设为阈值δ,基于δ判断待测图像是否服从任务内分布,若是则预测其地标类别,否则拒绝预测。针对BJUT-118数据集实现的地标识别任务,阈值δ设置为-0.98,可针对各种地标识别任务进行设置。
本发明针对移动终端资源有限和在识别过程中存在外分布异常干扰的问题,通过设计轻量化网络并结合外分布检测方法,使移动终端能在开集环境下正确识别地标建筑,具备低延迟、计算量小和轻量的优势。
以自建的校园地标数据集BJUT-118为例,基网络的地标识别准确率为91.39%,在引入外分布损失函数并微调后,标识别准确率为91.52%,本发明使网络在保证高准确率的同时具备了开集地标识别能力。本发明的模型大小为9.3M,与网络模型为43M的ResNet-18相比,具有轻量和计算量小的优势。为检验网络的开集地标识别能力,通过添加高斯噪声、Radmacher噪声、Blob噪声的合成异常和ImageNet真实异常,本发明能将网络的开集地标识别能力泛化到更大未知范围,具有很好的开集地标识别能力。性能对比如表2所示。
表2网络性能对比
Figure BDA0002942978310000071

Claims (1)

1.一种面向移动终端的轻量化开集地标识别方法,其特征在于:
1)改进基于MobileNet-V2的轻量化网络
网络第一层为包含32个标准卷积核的二维卷积层,步长为2,然后连接17个倒残差线性瓶颈块Bottleneck,接着连接维度为1280的1x1二维卷积核、7x7平均池化层,同时在最后增加两个全连接层,最后对K个地标建筑方位进行预测,K为需要识别的地标个数;网络结构如下:
Figure FDA0002942978300000011
其中,c表示网络的输出通道数;n表示线性倒残差瓶颈块的重复次数;t表示对线性倒残差瓶颈块中输入通道数扩张的倍数,s表示每个序列中第一个卷积核的步幅;
表格的每行代表一个序列,同一个序列中各线性倒残差瓶颈块的输出通道数c相同;在n≠1且s≠1的序列中,s≠1只对第一个线性倒残差瓶颈块有效,其他线性倒残差瓶颈块的步幅s仍为1,此时其输入和输出通道数相同;t表示对每个序列第一个线性倒残差瓶颈块的输入通道数进行t倍升维,经7x7平均池化层计算后的输出特征大小为1x1x1280,最后连接两个全连接层得到最终地标类别;
改进后的网络在地标识别训练集和验证集上训练200轮,损失函数使用交叉熵,使用带Nesterov动量的SGD优化器,其中初始学习率为0.1,动量设为0.9,权重衰减为0.0005;
2)构建外分布检测损失函数
构建新的损失函数,让模型同时在异常辅助训练集
Figure FDA0002942978300000012
和地标识别训练集
Figure FDA0002942978300000013
上学习,来泛化模型的外分布检测能力;给定网络模型f、异常辅助训练集
Figure FDA0002942978300000014
和地标识别训练集
Figure FDA0002942978300000015
使用MSP(最大Softmax概率),通过训练来学习输入的图像是内分布地标图像还是外分布异常的启发;构建的损失函数如公式2:
Figure FDA0002942978300000016
其中x∈X为地标输入图像,y∈Y={1,2,3,...,k}为地标对应的类别,函数f(x)表示网络模型,对任意x,1T·f(x)=1且f(x)≥0;
Figure FDA0002942978300000021
表示当地标图像服从任务内分布时,对前项损失求数学期望;
Figure FDA0002942978300000022
表示当输入为异常图像时,对后项损失求数学期望;L表示原始分类损失函数,U表示在K类上的均匀分布,H表示f(x)的输出到均匀分布的交叉熵损失函数,λ为超参数,设置为0.5;在训练阶段,由于任务内的地标图像包含类别信息y,而异常辅助训练集中的图像无需提供该信息,因此当输入图像属于任务内分布时将网络模型记为fy(x);
在修改损失函数后,网络微调20轮,优化器使用带Nesterov动量的SGD优化器,初始学习率为0.001,动量为0.9,权重衰减为0.0005,最终使网络对正确预测的地标建筑类别对应的MSP趋于1,而异常图像对应的MSP接近均匀分布;MSP计算如公式3:
Figure FDA0002942978300000023
其中,zi表示全连接层FC-K第i个神经元的输出,K表示所需识别的地标类别总数;公式3将包含K个实数的向量z规范到包含K个正比于输入指数的概率分布,并输出最大Softmax概率MSP,即Pmsp
3)数据预处理
通过引入异常辅助训练集
Figure FDA0002942978300000024
进行训练,因此数据集包含三部分且相互无关;第一部分是地标识别内分布训练集Din,第二部分是外分布辅助训练集
Figure FDA0002942978300000025
第三部分是用于模型评估的测试集,包括内分布和外分布测试集
Figure FDA0002942978300000026
Figure FDA0002942978300000027
数据预处理包括以下步骤:
(1)针对不同场景的地标识别任务,按地标建筑或各建筑的详细方位作为类别,进行数据集采集,然后针对每个类别按8:1:1分割为训练集
Figure FDA0002942978300000028
验证集
Figure FDA0002942978300000029
和测试集
Figure FDA00029429783000000210
异常辅助训练集
Figure FDA00029429783000000211
使用公共数据集Places365;
(2)测试集包括内分布测试集
Figure FDA0002942978300000031
和外分布测试集
Figure FDA0002942978300000032
其中
Figure FDA0002942978300000033
使用公共数据集ImageNet的地标类,其与
Figure FDA0002942978300000034
不存在交集;
(3)模型训练阶段对地标图像进行数据增强,包括对原始图像的尺寸做随机裁剪与水平翻转、归一化;归一化使用均值u为(0.485,0.456,0.406)和标准差σ为(0.229,0.224,0.225)对地标图像的RGB通道进行归一化操作;计算如公式4所示:
Figure FDA0002942978300000035
其中,x为地标图像的输入张量数据,x′为归一化后的数据;
4训练与测试
1)训练地标识别基网络
基于改进后的基网络,在地标识别训练和验证集上训练200轮,损失函数使用交叉熵,使用带Nesterov动量的SGD优化器,其中初始学习率为0.1,动量设为0.9,权重衰减为0.0005,并结合LambdaLR学习率调整策略,训练并保存模型参数;
2)修改外分布检测损失函数
基于步骤1训练的地标识别基网络,使用公式2的损失函数,通过引入辅助训练集
Figure FDA0002942978300000036
微调网络,使其学会判别输入是任务内地标建筑还是异常图像;网络共训练20轮;优化器使用带Nesterov动量的SGD优化器,其中初始学习率为0.001,动量为0.9,权重衰减为0.0005,并结合LambdaLR学习率调整策略,训练并保存模型参数;
3)模型测试
基于步骤1和步骤2训练的网络模型,测试网络的开集地标识别性能,包括以下步骤:
(一)加载网络模型,读取任务内地标测试集
Figure FDA0002942978300000037
和外分布测试集
Figure FDA0002942978300000038
(二)当待测地标图像服从任务内分布时,可获取其地标信息y,此时使用MSP的相反数作为OOD分数Sin,因此OOD分数值小于0;其中正确预测的OOD分数记为
Figure FDA0002942978300000039
错误预测的OOD分数记为
Figure FDA00029429783000000310
通过正确分类样本数比测试样本总数,得到识别准确率;
(三)当待测图像不是任务内地标类别时,网络会使其对应MSP接近均匀分布;将外分布图像作为正类,任务内地标样本作为负类,使用MSP的相反数作为OOD分数Sout;使用AUROC、AUPR、FPR95指标评估网络的外分布检测能力;
(四)基于步骤(二)(三)统计的OOD分数,将FPR95对应的OOD分数设为阈值δ,基于δ判断待测图像是否服从任务内分布,若是则预测其地标类别,否则拒绝预测;在内分布训练数据集为BJUT-118的地标识别任务中,阈值δ设置为-0.98。
CN202110184512.8A 2021-02-10 2021-02-10 一种面向移动终端的轻量化开集地标识别方法 Pending CN112818893A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110184512.8A CN112818893A (zh) 2021-02-10 2021-02-10 一种面向移动终端的轻量化开集地标识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110184512.8A CN112818893A (zh) 2021-02-10 2021-02-10 一种面向移动终端的轻量化开集地标识别方法

Publications (1)

Publication Number Publication Date
CN112818893A true CN112818893A (zh) 2021-05-18

Family

ID=75865277

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110184512.8A Pending CN112818893A (zh) 2021-02-10 2021-02-10 一种面向移动终端的轻量化开集地标识别方法

Country Status (1)

Country Link
CN (1) CN112818893A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113724247A (zh) * 2021-09-15 2021-11-30 国网河北省电力有限公司衡水供电分公司 一种基于图像判别技术的变电站智能巡检方法
CN113822212A (zh) * 2021-09-27 2021-12-21 东莞理工学院 一种嵌入式物体识别方法和装置
CN113837154A (zh) * 2021-11-25 2021-12-24 之江实验室 一种基于多任务辅助的开放集过滤系统及方法
CN114782931A (zh) * 2022-04-22 2022-07-22 电子科技大学 改进MobileNetv2网络的驾驶行为分类方法
CN114997248A (zh) * 2022-07-29 2022-09-02 杭州电子科技大学 一种基于原型学习的开放集干扰识别模型和方法
CN116758492A (zh) * 2023-08-18 2023-09-15 厦门民航凯亚有限公司 一种关于民航异常行李基于多维特征的挑找方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110929603A (zh) * 2019-11-09 2020-03-27 北京工业大学 一种基于轻量级卷积神经网络的天气图像识别方法
CN111311538A (zh) * 2019-12-28 2020-06-19 北京工业大学 一种基于卷积神经网络的多尺度轻量化道路路面检测方法
CN111339858A (zh) * 2020-02-17 2020-06-26 电子科技大学 一种基于神经网络的油气管道标志物识别方法
WO2020156028A1 (zh) * 2019-01-28 2020-08-06 南京航空航天大学 一种基于深度学习的室外非固定场景天气识别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020156028A1 (zh) * 2019-01-28 2020-08-06 南京航空航天大学 一种基于深度学习的室外非固定场景天气识别方法
CN110929603A (zh) * 2019-11-09 2020-03-27 北京工业大学 一种基于轻量级卷积神经网络的天气图像识别方法
CN111311538A (zh) * 2019-12-28 2020-06-19 北京工业大学 一种基于卷积神经网络的多尺度轻量化道路路面检测方法
CN111339858A (zh) * 2020-02-17 2020-06-26 电子科技大学 一种基于神经网络的油气管道标志物识别方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113724247A (zh) * 2021-09-15 2021-11-30 国网河北省电力有限公司衡水供电分公司 一种基于图像判别技术的变电站智能巡检方法
CN113724247B (zh) * 2021-09-15 2024-05-03 国网河北省电力有限公司衡水供电分公司 一种基于图像判别技术的变电站智能巡检方法
CN113822212A (zh) * 2021-09-27 2021-12-21 东莞理工学院 一种嵌入式物体识别方法和装置
CN113822212B (zh) * 2021-09-27 2024-01-05 东莞理工学院 一种嵌入式物体识别方法和装置
CN113837154A (zh) * 2021-11-25 2021-12-24 之江实验室 一种基于多任务辅助的开放集过滤系统及方法
CN114782931A (zh) * 2022-04-22 2022-07-22 电子科技大学 改进MobileNetv2网络的驾驶行为分类方法
CN114782931B (zh) * 2022-04-22 2023-09-29 电子科技大学 改进MobileNetv2网络的驾驶行为分类方法
CN114997248A (zh) * 2022-07-29 2022-09-02 杭州电子科技大学 一种基于原型学习的开放集干扰识别模型和方法
CN114997248B (zh) * 2022-07-29 2022-11-08 杭州电子科技大学 一种基于原型学习的开放集干扰识别模型和方法
CN116758492A (zh) * 2023-08-18 2023-09-15 厦门民航凯亚有限公司 一种关于民航异常行李基于多维特征的挑找方法及系统

Similar Documents

Publication Publication Date Title
CN112818893A (zh) 一种面向移动终端的轻量化开集地标识别方法
CN106845421B (zh) 基于多区域特征与度量学习的人脸特征识别方法及系统
CN106951825B (zh) 一种人脸图像质量评估系统以及实现方法
CN111882040B (zh) 基于通道数量搜索的卷积神经网络压缩方法
US10275719B2 (en) Hyper-parameter selection for deep convolutional networks
US20190228268A1 (en) Method and system for cell image segmentation using multi-stage convolutional neural networks
CN110321830B (zh) 一种基于神经网络的中文字符串图片ocr识别方法
CN110197205B (zh) 一种多特征来源残差网络的图像识别方法
CN110322445B (zh) 基于最大化预测和标签间相关性损失函数的语义分割方法
CN110942091B (zh) 寻找可靠的异常数据中心的半监督少样本图像分类方法
CN112308825B (zh) 一种基于SqueezeNet的农作物叶片病害识别方法
CN113326930A (zh) 数据处理方法、神经网络的训练方法及相关装置、设备
CN106599864A (zh) 一种基于极值理论的深度人脸识别方法
CN110069959A (zh) 一种人脸检测方法、装置及用户设备
CN115035418A (zh) 一种基于改进DeepLabV3+网络的遥感图像语义分割方法及系统
CN114565048A (zh) 基于自适应特征融合金字塔网络的三阶段害虫图像识别方法
CN112507114A (zh) 一种基于词注意力机制的多输入lstm_cnn文本分类方法及系统
CN113705596A (zh) 图像识别方法、装置、计算机设备和存储介质
CN110991247B (zh) 一种基于深度学习与nca融合的电子元器件识别方法
CN116912796A (zh) 一种基于新型动态级联YOLOv8的自动驾驶目标识别方法及装置
CN114639000A (zh) 一种基于跨样本注意力聚合的小样本学习方法和装置
CN113066528B (zh) 基于主动半监督图神经网络的蛋白质分类方法
CN109460872B (zh) 一种面向移动通信用户流失不平衡数据预测方法
CN111860601A (zh) 预测大型真菌种类的方法及装置
CN113378866B (zh) 图像分类方法、系统、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination