CN110909760A - 一种基于卷积神经网络的图像开放集识别方法 - Google Patents
一种基于卷积神经网络的图像开放集识别方法 Download PDFInfo
- Publication number
- CN110909760A CN110909760A CN201910968936.6A CN201910968936A CN110909760A CN 110909760 A CN110909760 A CN 110909760A CN 201910968936 A CN201910968936 A CN 201910968936A CN 110909760 A CN110909760 A CN 110909760A
- Authority
- CN
- China
- Prior art keywords
- class
- layer
- model
- space
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于卷积神经网络的图像开放集识别方法,包括利用CNN模型对图像训练集进行处理,使用SoftMax层生成的深度特征作为激活向量;计算每个类的平均激活向量,并将平均激活向量作为每个类的中心;计算出类内点与每个类中心的距离,并通过每个类的距离分布设置阈值;确定目标样本是否为未知类别。本发明方法利用SoftMax变换对logits层所在的空间进行空间变换。经过变换后,这些方向指向的空间将收缩到变换后的特征空间中某些点附近,从而可以被CAP模型生成的边界所覆盖,因此能够改善卷积神经网络模型的开放集图像识别性能,本发明方法具有更强的性能和更好的适用度。
Description
技术领域
本发明属于图像处理与识别领域,具体涉及基于卷积神经网络的图像开放集识别方法。
背景技术
目前,深度神经网络在各种视觉识别应用中取得了很大的成就,并已应用于人脸识别、自动驾驶、医学图像识别等多种商业场景。在建模过程中,这些识别任务大多采用封闭集假设,在这种情况下,所有可能的测试样本都属于训练集中已知的类别。然而,当模型应用到现实世界时,由于它无法识别不断出现的未知图像,它的性能将大幅下降。例如,当你站在一张合照前,你想从中辨认出一个你熟悉的人,但是合照中还有更多的你不认识的人和其他物体,如动物、建筑物、汽车,它们的存在会极大地影响你的识别。
现实世界中的识别任务可以分成三类:1)对已知类别的识别。即在训练集中打出明确标签的类别。2)对已知的未知类别的识别。即在训练集中常用的其他类别。3)对未知的未知类别的识别。即在训练集中没有出现过的类别。
传统的分类通常用于对已知类别分类以及拒绝已知未知类别,一般不考虑未知的未知类别。开放集识别(OSR)则主要关注对未知类别的拒绝。在接下来的描述中,统一将已知类别及已知的未知类别归纳于已知类别,未知的未知类别归纳于未知类别。
OSR是一个非常具有挑战性的问题,因为它要求模型在正确分类所有已知类别的条件下拒绝未知类别,找到已知空间和未知空间之间的精确平衡。对于未知类别,许多标准的概率和统计学习工具不能直接应用。为了在不对未知类别显式建模的条件下,衡量开放空间风险,有关学者提出紧致消减概率(CAP)模型,该模型假定属于该类成员的概率随着点从已知数向开放空间的激动而降低。CAP模型提供了解决OSR的新思路,一系列基于机器学习的方法也采用了这一模型。在此之后发展的基于卷积神经网络(CNN)的OSR方法也采用CAP模型作为基础,OpenMax方法作为第一个将CNN引入OSR领域的方法,在OSR领域中享有很高的声誉。它创新性地提出将CNN的倒数第二层逻辑层(logits层)用于生成OSR任务中需要的特征。这个想法极大地影响了后续的基于CNN的工作。
然而在实验和应用中发现,以逻辑层的空间为特征空间的方法中应用CAP模型是有风险的。因为logits层是CNN的输出层,所以这个空间中的值可以用来确定样本属于哪个已知类别。也就是说,在逻辑层的空间中存在一组方向,样本沿着这个方向移动得越远,属于已知类别的概率就越大,这是一个与CAP模型完全相反的结论,使得现有方法在利用基于卷积神经网络进行未知类型图像识别时可能得出错误的分类结论。
发明内容
有鉴于此,本发明的目的在于提供一种基于卷积神经网络的图像开放集识别方法,用于解决现有技术难以适用于卷积神经网络的开放集图像识别问题,从而导致现有技术可能带来的识别准确率和识别效率较低的缺陷。
基于上述目的,提供了一种基于卷积神经网络的图像开放集识别方法,包括以下步骤:
步骤1,利用CNN模型对图像训练集进行处理,使用SoftMax层生成的深度特征作为激活向量;
步骤2,计算每个类的平均激活向量,并将平均激活向量作为每个类的中心;
步骤3,计算出类内点与每个类中心的距离,并通过每个类的距离分布设置阈值;
步骤4,确定目标样本是否为未知类别。
具体地,在步骤1中,对所述的CNN模型中logits层提取的特征进行归一化指数变换,变换公式为:
其中,σ(z)j表示SoftMax层的第j个分量,zj,zk表示logits层第j个分量和第k个分量,经过CNN模型的处理,得到每个训练样本点的激活向量。
具体地,在步骤2中,对于每一个已知类,计算了真实标签和预测标签都等于类标签的样本之间的平均激活向量,将平均激活向量作为类的中心。
具体地,在步骤3中,包括以下步骤:
步骤301,对于训练集中已知样本,计算类中心与样本之间的欧氏距离;
步骤302,把每个样本计算出来的距离按各自类别集合起来,这样就可以得到距离的统计分布;
步骤302,设置距离分布的阈值τ;
优选地,所述的CNN模型为GoogleNet_v3模型;
具体地,所述的GoogleNetv3的可训练层为Logits层和AuxLogits层,参数更新方法为RMSProp方法,步长为0.0001,批尺寸为32,最大迭代步为6000。
为了弥补现有技术识别准确率和识别效率较低缺陷,本发明提出了一种新的方法,该方法利用SoftMax变换对logits层所在的空间进行空间变换。在logits层所在的空间中,存在某些方向,样本沿此方向移动得越远,样本被判别为已知的概率越高,但是原有方法生成的边界不能将这些空间涵盖起来。经过变换后,这些方向指向的空间将收缩到变换后的特征空间中某些点附近,从而可以被CAP模型生成的边界所覆盖,因此能够改善卷积神经网络模型的开放集图像识别性能,本发明方法具有更强的性能和更好的适用度。
附图说明
图1为本发明实施例的图像开放集识别方法的示意图;
图2为不同方法下,各指标与开放数据占比之间的关系示意图;
图3为不同方法下,三种比例的开放集中不同阈值与各指标下的关系示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
Bendale等人提出了第一个基于CNN的OSR方法OpenMax,使用CNN模型的倒数第二层(logits层)生成特征。结合CAP模型、EVT理论、Weibull
累积分布函数(CDF),OpenMax比传统的基于ML的OSR方法取得了更好的性能。为了扩大已知类别占据的空间和开放空间之间的距离,Hassen等人提出了一个II-损失函数,损失函数设置的目的是最小化内部扩散、最大化外部间距和最小化交叉熵损失。
首先,简要介绍CAP模型和OpenMax模型方法,设S为全特征空间,K为移植类所占据的空间,O为开放空间,K∪O=S,假设有M个已知类C=[C1,C2,…,CM],N个已知样本xi∈K,i=1,2,…,N。
CAP模型的主要思路是构造一个函数f(x),函数值随着与已知点距离的增加而减小。通过对函数值设置阈值τ,将已知空间K和开放空间O分开。CAP模型定如下:对于任何已知的正样本,xi∈K,i=1,2,…,N以及特征空间S中的任意点x,如果则可以得到x∈O。
OpenMax模型的主要思想可以概括如下:
(1)使用由CNN的倒数第二层(logits层)来生成模型所需要的特征。并把生成的特征的值作为激活向量;
(2)对于每一个类别C=[c1,c2,...,cM],使用类平均激活向量MAV=[μ1,μ2,…,μM]来表示每一个类别的中心;
(3)基于EVT理论和CAP模型,利用类内点与类中心的距离分别对每个类别拟合Weibull分布;
(4)用拟合好的Weibull分布估计任意测试样本x∈S与已知类别的MAV之间的Weibull累积分布函数(CDF)概率;
(5)通过对WeibullCDF概率设置阈值τp,确定测试样本是否属于开放空间O。
在概率阈值τp设置好后,每个类别的距离阈值τd也随之确定。
OpenMax是第一个将CNN引入OSR的模型。该模型采用CAP模型的思想,应用了EVT理论,取得了与同期项目相比较好的性能。然而模型在测试集上的最高F1-score仅约为0.596,无法应用于现实世界。
究其原因,由于logits层所在的空间具有这样一种性质:存在某一分量明显大于其他分量的样本应划分为已知类,因此CAP及其派生模型不适用于那些将logits层空间视为它们的特征空间的方法,如OpenMax。
要解决以上问题,可以采取的方法是:对logits层所在的空间做空间变换,使CAP模型生成的边界可以包含最大分量远大于其他分量的样本。基于这种思想,如图1所示,本发明实施例的一种基于卷积神经网络的图像开放集识别方法,包括以下步骤:
步骤1,利用CNN模型对图像集进行处理,使用SoftMax层生成的深度特征作为激活向量;
步骤2,计算每个类的平均激活向量,并将平均激活向量作为每个类的中心;
步骤3,计算出类内点与每个类中心的距离,并通过每个类的距离分布设置阈值;
步骤4,确定目标样本是否为未知类别。
AlexNet是OpenMax使用的CNN模型,在本实施例中,因AlexNet相对落后难以训练,故使用性能更好的GoogleNet_v3模型进行特征提取。表1显示了本实施中GoogleNet的结构。利用卷积和池化的过程提取图像特征,并利用全连接层对这些特征进行线性变换,使用倒数第二层即线性层(通常称为logits层)来生成特征。
表1 GoogleNet网络结构
层名 | 输出尺寸 | 参数 |
卷积层1 | 149×149×32 | 3×3,步长2 |
卷积层2 | 147×147×32 | 3×3,步长1 |
卷积层(padded)3 | 147×147×64 | 3×3,步长1 |
池化层1 | 73×73×64 | 3×3,步长2 |
卷积层4 | 71×71×80 | 3×3,步长1 |
卷积层5 | 35×35×192 | 3×3,384,步长1 |
卷积层6 | 35×35×288 | 3×3,256,步长1 |
3×Inception | 17×17×768 | |
5×Inception | 8×8×1280 | |
2×Inception | 8×8×2480 | |
池化层2 | 1×1×2048 | 8×8 |
线性层 | 1×1×1000 | Logits |
SoftMax | 1×1×1000 | 分类器 |
本实施例方法以SoftMax层所在空间为特征空间,通过下列公式对logits层提取的特征进行归一化指数变换
其中,σ(z)j表示SoftMax层的第j个分量,zj,zk表示logits层第j个分量和第k个分量。
经过CNN模型的处理,可以得到每个训练样本点的激活向量。
在步骤2中,计算每个类的平均激活向量,并将其作为每个类的中心。更具体地说,对于每一个已知类,计算了真实标签和预测标签都等于类标签的样本之间的平均激活向量,将平均激活向量作为类的中心。
在步骤3中,包括步骤301,对于训练集中已知样本,计算类中心与样本之间的欧氏距离;
步骤302,把每个样本计算出来的距离按各自类别集合起来,这样就可以得到距离的统计分布;
步骤302,设置距离分布的阈值τ;
AVx为x的激活向量,mAVi为第i个类别的平均激活向量,即第i个类别中心的激活向量。
为了验证方法的可行性及性能效率,本实施例进行了实验。
本实验的数据评估主要基于有着257个类别的Caltech256数据集。数据集包含30607个图像,每个类别至少有80个图像。由于少数图像只有一个通道,因此我们使用了30815个图像。为了进行开放集测试,随机选择一部分类别作为未知数据,其余的数据设置为已知。具体划分见表2。
表2 CALTECH256的划分细节
已知类别数量 | 已知图片数量 | 未知类别数量 | 未知图片数量 | 开放数据占比 |
237 | 28153 | 20 | 2032 | 6.73% |
217 | 26031 | 40 | 4154 | 13.76% |
197 | 23739 | 60 | 6446 | 21.35% |
177 | 21345 | 80 | 8840 | 29.29% |
157 | 18443 | 100 | 11742 | 38.90% |
137 | 16027 | 120 | 14158 | 46.90% |
117 | 13712 | 140 | 16473 | 54.57% |
97 | 11661 | 160 | 18524 | 61.37% |
77 | 8031 | 180 | 22154 | 73.39% |
57 | 5933 | 200 | 24252 | 80.34% |
37 | 3786 | 220 | 26399 | 87.46% |
模型评估的度量标准包括准确率,F1分数和错误率。
准确率:准确度是正确预测的样本数量除以样本总量,它代表了模型的整体性能,同时考虑了开放集识别和封闭集分类。
F1分数:F1分数综合考虑二分类器的查准率与查全率,衡量二分类器的综合性能。对于OSR模型,查准率表示正确预测为未知的开放数据与所有被预测为未知的数据之比,召回表示正确预测为未知的开放数据与所有开放数据之比。F1分数的计算方式为:
其中P为计算查准率,R为计算查全率。
错误率:错误率是错误预测的已知样本数除以已知样本总数,测试时,如果测试集中存在过多的开放样本,模型倾向于将所有样本识别为开放样本,错误率有助于发现这种情况。
实施例中采用迁移学习的方法来训练模型。已知类别的样本作为训练数据。用于预训练好的神经网络是GoogleNet_v3。AlexNet是OpenMax方法中采用的CNN模型。然而,AlexNet与后来发展起来的模型如GoogleNet_v3相比,Alexnet难以训练且分类精度相对较低。因此,实验中用GoogleNet_v3替代它。迁移学习中使用的训练参数如表3所示。一旦训练精度达到90%,即停止。
表3训练参数列表
名称 | GoogleNetv3 |
可训练层 | Logits,AuxLogits |
参数更新方法 | RMSProp |
步长 | 0.0001 |
批尺寸 | 32 |
最大迭代步 | 6000 |
对比实验中,对本发明方法、OpenMax和基准CNN模型(不加入开放样本识别功能的封闭模型)在表2中划分得到的数据集上进行了十次测试,并通过设定一系列的阈值得到了对应的准确率、F1得分、错误率,以及在各中数据划分方式上的最优准确率、最优F1-score和相应的错误率。首先,我们将通过最优准确率、最优F1-score和相应的错误率来分析整体性能。然后,以开放数据占比为6.73%、46.90%、80.34%的开放数据集为例,对性能进行了详细分析。OpenSoftMax表示本发明方法。
图2展示了不同数据划分下的最优准确率、最大F1-score、相应的错误率与开放数据占比之间的关系。图2(a)显示了最优准确率与开放数据占比的关系,图2(b)显示了相应的错误率。图2(c)显示了最优F1-score与开放数据占比的关系,图2(d)显示了相应的错误率。OpenSoftMax在可接受的错误率范围内,在最优精确度和最优F1-score评测指标上显示了更好的性能。
总的来说,当开放数据占比太低时,OpenSoftMax和OpenMax都表现出了较差的性能。当开放数据占比适中(从约20%到约80%)时,OpenSoftMax对比OpenMax的显示出了显著优势。当开放数据占比太高时,OpenMax是一个更好的选择。
由发明内容和实施例可知,本发明一种基于卷积神经网络的图像开放集识别方法,提出了一种解决开放集识别模型OSR问题的方法,对OpenMax使用的激活向量进行SoftMax变换,并且在caltech256图像数据集上进行实验,本发明方法,它显示出比OpenMax更好的性能。在开放数据占比适中的测试数据集中,本发明方法比OpenMax方法提高了24%的最优准确率和16%的最优F1分数。由此本发明方法更加适合于图像数据的开放集识别,具有更强的性能和更好的适用度。
Claims (7)
1.一种基于卷积神经网络的图像开放集识别方法,其特征在于,包括以下步骤:
步骤1,利用CNN模型对图像训练集进行处理,使用SoftMax层生成的深度特征作为激活向量;
步骤2,计算每个类的平均激活向量,并将平均激活向量作为每个类的中心;
步骤3,计算出类内点与每个类中心的距离,并通过每个类的距离分布设置阈值;
步骤4,确定目标样本是否为未知类别。
3.根据权利要求2所述的图像开放集识别方法,其特征在于,在步骤2中,对于每一个已知类,计算了真实标签和预测标签都等于类标签的样本之间的平均激活向量,将平均激活向量作为类的中心。
6.根据权利要求1或4所述的图像开放集识别方法,其特征在于,所述的CNN模型为GoogleNet_v3模型。
7.根据权利要求6所述的图像开放集识别方法,所述的GoogleNetv3的可训练层为Logits层和AuxLogits层,参数更新方法为RMSProp方法,步长为0.0001,批尺寸为32,最大迭代步为6000。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910968936.6A CN110909760B (zh) | 2019-10-12 | 2019-10-12 | 一种基于卷积神经网络的图像开放集识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910968936.6A CN110909760B (zh) | 2019-10-12 | 2019-10-12 | 一种基于卷积神经网络的图像开放集识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110909760A true CN110909760A (zh) | 2020-03-24 |
CN110909760B CN110909760B (zh) | 2021-03-16 |
Family
ID=69815363
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910968936.6A Active CN110909760B (zh) | 2019-10-12 | 2019-10-12 | 一种基于卷积神经网络的图像开放集识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110909760B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111914919A (zh) * | 2020-07-24 | 2020-11-10 | 天津大学 | 基于深度学习的开放集辐射源个体识别方法 |
CN112308131A (zh) * | 2020-10-29 | 2021-02-02 | 腾讯科技(深圳)有限公司 | 样本拒识方法、装置、设备及存储介质 |
CN113435482A (zh) * | 2021-06-10 | 2021-09-24 | 浙江大华技术股份有限公司 | 一种判断开放集的方法、装置及其设备 |
CN113837154A (zh) * | 2021-11-25 | 2021-12-24 | 之江实验室 | 一种基于多任务辅助的开放集过滤系统及方法 |
CN116628619A (zh) * | 2023-07-26 | 2023-08-22 | 西南交通大学 | 一种基于车网耦合的未知异常电气现象辨识方法 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230386450A1 (en) * | 2022-05-25 | 2023-11-30 | Samsung Electronics Co., Ltd. | System and method for detecting unhandled applications in contrastive siamese network training |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106778804A (zh) * | 2016-11-18 | 2017-05-31 | 天津大学 | 基于类别属性迁移学习的零样本图像分类方法 |
US20170300534A1 (en) * | 2016-04-13 | 2017-10-19 | Disney Enterprises, Inc. | System and method of vocabulary-informed categorization of items of interest included within digital information |
CN107506740A (zh) * | 2017-09-04 | 2017-12-22 | 北京航空航天大学 | 一种基于三维卷积神经网络和迁移学习模型的人体行为识别方法 |
CN107506799A (zh) * | 2017-09-01 | 2017-12-22 | 北京大学 | 一种基于深度神经网络的开集类别发掘与扩展方法与装置 |
CN108304826A (zh) * | 2018-03-01 | 2018-07-20 | 河海大学 | 基于卷积神经网络的人脸表情识别方法 |
CN108846413A (zh) * | 2018-05-21 | 2018-11-20 | 复旦大学 | 一种基于全局语义一致网络的零样本学习方法 |
CN109376786A (zh) * | 2018-10-31 | 2019-02-22 | 中国科学院深圳先进技术研究院 | 一种图像分类方法、装置、终端设备及可读存储介质 |
CN109472276A (zh) * | 2017-09-08 | 2019-03-15 | 富士通株式会社 | 模式识别模型的构建方法和装置及模式识别方法 |
CN109902885A (zh) * | 2019-04-09 | 2019-06-18 | 中国人民解放军国防科技大学 | 基于深度学习混合cnn-lstm模型的台风预测方法 |
CN109919241A (zh) * | 2019-03-15 | 2019-06-21 | 中国人民解放军国防科技大学 | 基于概率模型和深度学习的高光谱未知类别目标检测方法 |
US20190286937A1 (en) * | 2018-03-13 | 2019-09-19 | Fujitsu Limited | Computer-readable recording medium, method for learning, and learning device |
-
2019
- 2019-10-12 CN CN201910968936.6A patent/CN110909760B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170300534A1 (en) * | 2016-04-13 | 2017-10-19 | Disney Enterprises, Inc. | System and method of vocabulary-informed categorization of items of interest included within digital information |
CN106778804A (zh) * | 2016-11-18 | 2017-05-31 | 天津大学 | 基于类别属性迁移学习的零样本图像分类方法 |
CN107506799A (zh) * | 2017-09-01 | 2017-12-22 | 北京大学 | 一种基于深度神经网络的开集类别发掘与扩展方法与装置 |
CN107506740A (zh) * | 2017-09-04 | 2017-12-22 | 北京航空航天大学 | 一种基于三维卷积神经网络和迁移学习模型的人体行为识别方法 |
CN109472276A (zh) * | 2017-09-08 | 2019-03-15 | 富士通株式会社 | 模式识别模型的构建方法和装置及模式识别方法 |
CN108304826A (zh) * | 2018-03-01 | 2018-07-20 | 河海大学 | 基于卷积神经网络的人脸表情识别方法 |
US20190286937A1 (en) * | 2018-03-13 | 2019-09-19 | Fujitsu Limited | Computer-readable recording medium, method for learning, and learning device |
CN108846413A (zh) * | 2018-05-21 | 2018-11-20 | 复旦大学 | 一种基于全局语义一致网络的零样本学习方法 |
CN109376786A (zh) * | 2018-10-31 | 2019-02-22 | 中国科学院深圳先进技术研究院 | 一种图像分类方法、装置、终端设备及可读存储介质 |
CN109919241A (zh) * | 2019-03-15 | 2019-06-21 | 中国人民解放军国防科技大学 | 基于概率模型和深度学习的高光谱未知类别目标检测方法 |
CN109902885A (zh) * | 2019-04-09 | 2019-06-18 | 中国人民解放军国防科技大学 | 基于深度学习混合cnn-lstm模型的台风预测方法 |
Non-Patent Citations (6)
Title |
---|
_PINNACLE_: "真实世界中的开集识别问题(Open-Set Recognition Problem)", 《HTTPS://BLOG.CSDN.NET/U010165147/ARTICLE/DETAILS/97490500?UTM_MEDIUM=DISTRIBUTE.PC_RELEVANT.NONE-TASK-BLOG-SEARCHFROMBAIDU-3.CONTROL&DEPTH_1-UTM_SOURCE=DISTRIBUTE.PC_RELEVANT.NONE-TASK-BLOG-SEARCHFROMBAIDU-3.CONTROL》 * |
ABHIJIT BENDALE等: "Towards open set deep networks", 《PROCEEDINGS OF THE IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR), 2016》 * |
CHUANXING GENG等: "Recent Advances in Open Set Recognition: A Survey", 《HTTPS://ARXIV.ORG/ABS/1811.08581V1》 * |
LAWRENCE NEAL等: "Open Set Learning with Counterfactual Images", 《PROCEEDINGS OF THE EUROPEAN CONFERENCE ON COMPUTER VISION (ECCV), 2018》 * |
张继威等: "基于深度学习和约束稀疏表达的人脸识别算法", 《北京理工大学学报》 * |
知识天地: "深度学习基础(CNN详解以及训练过程1)", 《HTTPS://WWW.CNBLOGS.COM/MFRYF/P/11376647.HTML》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111914919A (zh) * | 2020-07-24 | 2020-11-10 | 天津大学 | 基于深度学习的开放集辐射源个体识别方法 |
CN112308131A (zh) * | 2020-10-29 | 2021-02-02 | 腾讯科技(深圳)有限公司 | 样本拒识方法、装置、设备及存储介质 |
CN113435482A (zh) * | 2021-06-10 | 2021-09-24 | 浙江大华技术股份有限公司 | 一种判断开放集的方法、装置及其设备 |
CN113837154A (zh) * | 2021-11-25 | 2021-12-24 | 之江实验室 | 一种基于多任务辅助的开放集过滤系统及方法 |
CN116628619A (zh) * | 2023-07-26 | 2023-08-22 | 西南交通大学 | 一种基于车网耦合的未知异常电气现象辨识方法 |
CN116628619B (zh) * | 2023-07-26 | 2023-10-20 | 西南交通大学 | 一种基于车网耦合的未知异常电气现象辨识方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110909760B (zh) | 2021-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110909760B (zh) | 一种基于卷积神经网络的图像开放集识别方法 | |
CN113378632B (zh) | 一种基于伪标签优化的无监督域适应行人重识别方法 | |
CN108615010B (zh) | 基于平行卷积神经网络特征图融合的人脸表情识别方法 | |
CN109671102B (zh) | 一种基于深度特征融合卷积神经网络的综合式目标跟踪方法 | |
CN107506793B (zh) | 基于弱标注图像的服装识别方法及系统 | |
CN108629288B (zh) | 一种手势识别模型训练方法、手势识别方法及系统 | |
CN109614921B (zh) | 一种基于对抗生成网络的半监督学习的细胞分割方法 | |
CN108256482B (zh) | 一种基于卷积神经网络进行分布学习的人脸年龄估计方法 | |
CN110135459B (zh) | 一种基于双三元组深度度量学习网络的零样本分类方法 | |
CN109934269B (zh) | 一种电磁信号的开集识别方法和装置 | |
CN109101938B (zh) | 一种基于卷积神经网络的多标签年龄估计方法 | |
CN111476302A (zh) | 基于深度强化学习的Faster-RCNN目标物体检测方法 | |
CN112052893A (zh) | 基于生成对抗网络的半监督图像分类方法 | |
CN111650453A (zh) | 基于加窗特征希尔伯特图像化的电力设备诊断方法及系统 | |
CN110716792B (zh) | 一种目标检测器及其构建方法和应用 | |
CN110082738B (zh) | 基于高斯混合和张量循环神经网络的雷达目标识别方法 | |
CN113408570A (zh) | 一种基于模型蒸馏的图像类别识别方法、装置、存储介质及终端 | |
CN107341440A (zh) | 基于多任务度量多核学习的室内rgb‑d场景图像识别方法 | |
CN109214444B (zh) | 基于孪生神经网络和gmm的游戏防沉迷判定系统及方法 | |
CN109344720B (zh) | 一种基于自适应特征选择的情感状态检测方法 | |
CN116151319A (zh) | 搜索神经网络集成模型的方法、装置和电子设备 | |
CN115048870A (zh) | 基于残差网络和注意力机制的目标轨迹识别方法 | |
CN111586728B (zh) | 一种面向小样本特征的异构无线网络故障检测与诊断方法 | |
CN109101984B (zh) | 一种基于卷积神经网络的图像识别方法及装置 | |
CN107644203B (zh) | 一种形状自适应分类的特征点检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |