CN107506799B - 一种基于深度神经网络的开集类别发掘与扩展方法与装置 - Google Patents

一种基于深度神经网络的开集类别发掘与扩展方法与装置 Download PDF

Info

Publication number
CN107506799B
CN107506799B CN201710780217.2A CN201710780217A CN107506799B CN 107506799 B CN107506799 B CN 107506799B CN 201710780217 A CN201710780217 A CN 201710780217A CN 107506799 B CN107506799 B CN 107506799B
Authority
CN
China
Prior art keywords
class
sample
classification
threshold
expanded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710780217.2A
Other languages
English (en)
Other versions
CN107506799A (zh
Inventor
田永鸿
舒彧
史业民
王耀威
袁庆升
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Computer Network and Information Security Management Center
Original Assignee
Peking University
National Computer Network and Information Security Management Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peking University, National Computer Network and Information Security Management Center filed Critical Peking University
Priority to CN201710780217.2A priority Critical patent/CN107506799B/zh
Publication of CN107506799A publication Critical patent/CN107506799A/zh
Application granted granted Critical
Publication of CN107506799B publication Critical patent/CN107506799B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

一种基于深度神经网络的样本分类方法,使用包含已定义类别样本的样本集训练待扩展分类模型,获得分类阈值信息;将包含未定义类别样本的样本集送入所述待扩展分类模型,根据所述待扩展分类模型的分类阈值信息确定至少部分所述未定义类别样本;人工标注未定义类别样本;在所述深度神经网络的分类层中增加权值转移矩阵列数,以增加模型识别类别的总数,其中,增加的权值列中包含与全局分类相关的第一信息和与类别间联系相关的第二信息;用人工标注的未定义类别样本增量训练更新后的模型。通过修改深度神经网络分类层权值转移矩阵,从而扩展深度神经网络,使其识别类别数动态增加,从而能处理开集识别问题,更贴近真实识别场景下的应用。

Description

一种基于深度神经网络的开集类别发掘与扩展方法与装置
技术领域
本发明涉及深度学习领域,尤其涉及一种基于深度神经网络的开集类别发掘与扩展方法和装置。
背景技术
深度神经网络在许多视觉识别问题上取得了卓越的成就,并且引导了很多具有巨大影响力的学术研究和成功的商业应用。最近的一些关于图像分类、人类行为识别问题的研究,展现了极好的性能。然而,大部分识别系统是为了一个静态封闭的世界而设计,都基于识别类别是先验知识的前提假设。然而在真实世界中,识别场景千变万化,成千上万个不同的识别场景涵盖了不可计数的识别类别。即使在某一特定场景下,我们能够定义特定的识别类别,也不可避免的有诸如异常等事件发生。此外,传统的闭集识别模型强制识别系统在已知的封闭的类别空间中给出一个最大可能的分类预测,即使某一样本根本不属于已知类别空间中的任何一类。因此,真实世界的识别问题本质上是一个开集问题,识别系统需要能够发现并学习未知识别类别。综上,开集识别问题是模式识别和多媒体社区中一个重要而又具有挑战性的问题。
许多关于增量学习算法的研究不断被提出,用来处理已知类别新增的实例。然而,这些方法不能处理未知类别或动态增加模型识别总类别数。一种基于NCM分类概念的算法,通过在初始类别集合上学习一套有识别力的度量系统。新类别可以被添加进当前系统,并通过新类别的特征均值来识别区分。然而,这一方法的限制是初始类别数量需要达到较大规模。另外有人提出了一种基于最小二乘法支持向量机的多类别增量学习算法。在该算法中,每一个类别学习一个决策超平面,每次新增加一个识别类别,所有的决策超平面被更新。随着识别类别数增加,该算法代价就太昂贵了。最近的一些研究工作提出了开集问题中检测未知类别的方法。在这些工作中,一些研究把元检测的概念应用在深度神经网络中,并且提出了基于NCM的OpenMax层以代替经典神经网络中SoftMax层的检测未知类别方法。在这些框架中,增量学习额外的类别这一问题仍没有被解决。另一项工作可以增量学习新的类别,但还是基于NCM类型的支持向量机算法。而基于支持向量机的分类器增量训练和深度学习增量训练有本质的不同,并且在深度网络中参数空间庞大,每次更新成本巨大,所以这些方法很难迁移到深度神经网络。
中国专利申请CN105550713A公开了一种持续学习的视频时间检测方法,该方法包括初始学习阶段和增量学习阶段,在初始学习阶段,准备一个带有标签的视频数据,使用稀疏自编码对所述带有标签的视频数据进行学习,训练出一个先验模型,在增量学习阶段,使用训练好的先验模型对新到来的视频数据进行分类,计算概率评分和梯度距离,根据计算的结果使用主动学习来决定为新到来的视频数据自动添加标签还是人工添加标签。也就是说,在该技术方案中,先采用自编码机提取特征,然后再用分类器进行分类,然而仅仅将新标注的样本和已标注的样本一起重新训练整个自编码机对于整个增量过程而言是存在很多弊端的,首先这样的增量过程需要大量标注新类别样本,其次,重新更新整个模型过程繁琐,更新代价很高。
因此现有技术中需要一种扩展深度神经网络的方法,使深度神经网络能够处理开集识别问题,并且只需要少量标注的新样本来更新模型,在现有的增量学习的基础上进一步减少人工标注。
发明内容
为了解决上述问题,本申请提出了一种基于深度神经网络的样本分类方法,包括如下步骤:
S1,使用包含已定义类别样本的样本集训练待扩展分类模型,获得所述待扩展分类模型的分类阈值信息;
S2,将包含未定义类别样本的样本集送入所述待扩展分类模型,根据所述待扩展分类模型的分类阈值信息确定至少部分所述未定义类别样本;
S3,人工标注至少部分步骤S2中确定的所述未定义类别样本;
S4,在所述深度神经网络的分类层中增加权值转移矩阵列数,以增加模型识别类别的总数,其中,增加的权值列中包含与全局分类相关的第一信息和与类别间联系相关的第二信息;
S5,用步骤S3中人工标注的未定义类别样本增量训练步骤S4中更新后的模型。
优选地,使用包含已定义类别样本的样本集训练待扩展分类模型,获得所述待扩展分类模型的分类阈值信息具体为:使用包含已定义类别样本的样本集训练待扩展分类模型,获得所述待扩展分类模型已定义类别的接受阈值、拒绝阈值、和距离阈值;
根据所述待扩展分类模型的分类阈值信息确定至少部分所述未定义类别样本具体为:提取包含未定义类别样本的样本集在深度神经网络分类层的特征激活值,根据所述特征激活值和所述接受阈值、拒绝阈值、和距离阈值确定至少部分所述未定义类别样本。
优选地,获得所述待扩展分类模型已定义类别的接受阈值包括如下步骤:
获得正确分类的样本xi的激活特征向量:
Figure BDA0001396736750000031
其中i表示样本x被正确分类为i类,n表示已定义类别总数,
样本x对应的i类已知类别的激活特征值fi=vi(xi),
确定接受阈值为:
Figure BDA0001396736750000032
其中X为正确识别为i类的样本总个数。
优选地,获得所述待扩展分类模型已定义类别的拒绝阈值μi具体为:
μi=ε*ηi
其中,每一类已知类别的接受阈值为ηi,ε为拒绝权重。
优选地,所述拒绝权重ε取值为0.6。
优选地,获得所述待扩展分类模型已定义类别的距离阈值具体为:
Figure BDA0001396736750000041
其中,Mean为计算平均值函数,
Figure BDA0001396736750000042
为正确分类的样本xi激活特征向量,fi=vi(xi)为样本x对应的i类已知类别的激活特征值,
Figure BDA0001396736750000043
为次级激活特征值,其中
Figure BDA0001396736750000044
函数返回激活向量
Figure BDA0001396736750000045
中第二大激活值。
优选地,提取包含未定义类别样本的样本集在深度神经网络分类层的特征激活值,根据所述特征激活值和所述接受阈值、拒绝阈值、和距离阈值确定至少部分所述未定义类别样本,具体为:
Figure BDA0001396736750000046
其中
Figure BDA0001396736750000047
函数返回激活向量
Figure BDA0001396736750000048
中第二大激活值,
Figure BDA0001396736750000049
函数返回最大激活值在激活向量中的下标,即l为模型预测标签;
如果fx>ηl,其中ηl为第l类已知类别的接受阈值,则接受该样本为l类识别类别;
如果fx<μl,其中μl为第l类已知类别的拒绝阈值,则拒绝将该样本识别为l类识别类别,并判定为未定义类别;
如果μl<fx<ηl,计算样本距离dx=fx-sx,并比较所述样本距离dx和l类已知类别的距离阈值δl:如果dx>δl,则接受该样本为l类识别类别;否则,拒绝将该样本识别为l类识别类别,并判定为未定义类别。
优选地,还包括:
计算与全局分类相关的第一信息:
Figure BDA00013967367500000410
其中,其中,w′N+1对应所述第一信息,N为当前模型识别类别总数,wn为第n类识别类别对应的权值矩阵列。
优选地,还包括:
计算与类别间联系相关的第二信息:
(a)选择平均激活特征矩阵中较大的M个值对应的权值列hm构成集合H;
(b)计算所述第二信息:
Figure BDA0001396736750000051
其中,w″N+1对应所述第二信息。
优选地,还包括,
初始化新增权值列WN+1
Figure BDA0001396736750000052
其中,k1为第一信息权重,k2为第二信息权重。
优选地,采用均衡训练方法,保证每一类已知类别与新增类别有相同的样本数量。
优选地,采用异速训练方法,使得新增样本学习速率快于已知类别。
优选地,所述异速训练方法主要包括以下步骤:
(1)定义异速因子α:
Figure BDA0001396736750000053
其中,N为当前模型识别类别总数;
(2)当修改后的权值转移矩阵在反向传播更新时,使用异速因子来控制不同学习速率,更新W,b如下:
Figure BDA0001396736750000054
Figure BDA0001396736750000055
其中,J(W,b)是代价函数,λ是学习率,W和b分别为深度神经网络分类层的权值转移矩阵和偏移。
通过在当前模型中增添了新的识别类别,随着上述过程不断迭代,整个系统将逐一增加识别类别总数,深度分类模型不断被扩展。系统整体性能不断上升,能够逐渐识别越来越多的识别类别,并依此处理开集识别问题中未预定义未知类别。
本发明至少具有以下有益效果:
通过修改深度神经网络分类层权值转移矩阵,从而扩展深度神经网络,使其识别类别数动态增加,从而能处理开集识别问题,更贴近真实识别场景下的应用。具体来说,包括:通过迁移全局分类知识和相关类别间联系信息到新增的权值列,减少了增量学习对新增类别样本的需求,只需要使用少量人工标注的样本就能完成深度分类模型扩展识别类别的训练,从而减少了人工标注的成本和网络更新的成本。进一步地,通过引入均衡训练和异速训练方法减少了模型性能抖动,并加快了增量训练速度。随着模型不断迭代,深度模型不断被扩展,整个系统将逐一增加识别类别总数,并能识别越来越多的识别样本,整体性能不断上升,依此处理开集识别问题中未预定义未知类别。综上所述,通过本发明实施例提供的方法,能够基于扩展深度神经网络有效处理开集识别问题,解决真实识别场景下未预定义识别类别识别分类问题。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中基于深度网络开集识别模型的示意图;
图2为本发明实施例中基于深度网络开集识别方法的未预定义的未知类别检测的示例性流程图;
图3为本发明实施例中基于深度网络开集识别方法的修改深度神经网络分类层的示意图;
图4为本发明实施例中基于深度网络开集识别方法的强化初始化过程的示意图。
具体实施方式
本申请实施例提供一种基于深度神经网络的样本分类方法。
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
本申请提供一种基于深度神经网络的样本分类方法。该分类方法同样可以理解为一种基于深度网络开集视频类别发掘和扩展方法,在下面的实施方式中主要以视频图像中的对象行为分类为例对本发明的分类方法进行解释,本领域技术人员可以理解的是,除了视频图像中的对象行为分类以外,本发明的开集分类方法还能应用于很多其它真实环境下的类别确定,不能以实施例中的样本限定本发明的保护范围以及应用范围。
本发明实施例提供的基于深度神经网络的样本分类方法的模型,如图1所示:用特定识别场景下预定义的已知类别样本训练初始固定识别类别数的深度神经网络分类模型,即待扩展分类模型。将训练样本送入该模型,使用上述包含已定义类别样本的样本集训练待扩展分类模型,获得所述待扩展分类模型的分类阈值信息。
将包含未定义类别样本的样本集送入所述待扩展分类模型,根据所述待扩展分类模型的分类阈值信息确定至少部分所述未定义类别样本。
人工标注至少部分步骤S2中确定的所述未定义类别样本。
在所述深度神经网络的分类层中增加权值转移矩阵列数,以增加模型识别类别的总数,其中,增加的权值列中包含与全局分类相关的第一信息和与类别间联系相关的第二信息。
用前述步骤中人工标注的未定义类别样本增量训练更新后的模型。
在一个图中没有展示的实施方式中,确定未定义类别样本的过程包括提取正确分类样本在深度神经网络分类层的特征激活值,并依次计算每一类已知类别的接受阈值、拒绝阈值和距离阈值。使用上述多类阈值检测出真实识别场景下同时包含已知和未知类别样本视频流中未预定义的未知类别样本。人工标注检测到的未知类别样本。更新深度神经网络的分类层,增加对应的权值转移矩阵列数,以扩充模型识别类别总数。采用强化初始化方法初始化新增的权值列,同时迁移深度网络全局分类知识(即,第一信息)和类别间联系信息(即,第二信息)到新增权值列,以减少人工标注需求。用人工标注的未知类别样本增量训练更新后的分类模型,采用均衡训练方法,保证每一类已知类别与新增类别有相同的样本数量。同时,采用异速训练方法,让新增样本学习速率成倍快于已知类别,以快速完成增量训练。模型更新稳定后,已知类别池增加一类识别类别。当然可以理解的是,在一次迭代过程中可能会识别多个未定义类别,此时在模型的一次更新过程中会相应地所述深度神经网络的分类层中增加的权值转移矩阵列数也为多列。
关于第一信息,卷积神经网络对平移、比例缩放、倾斜或者共他形式的变形具有高度不变性,通过对输入图片提取文理、角点等特征,经过网络层卷积和下采样获得深度特征。基于反向传播算法及其扩展算法等训练网络参数至收敛,网络层参数空间保存了识别域中诸如姿势、运动速度、文理变换等全局知识。深度神经网络分类模型基于这些知识进行分类。
关于类别间相似信息或联系信息,即第二信息,可能有多种,举例来说可以是相似的姿势、相似的运动速度幅度等。
如图2所示,为本发明实施例中基于深度网络开集视频类别发掘和扩展方法的未预定义的未知类别检测的示例性流程图,该方法包括以下步骤:
步骤100:提取特征激活值,对于每个视频,每隔s帧提取一帧图像,得到帧f,将所有帧f输入神经网络训练。然后提取神经网络分类层激活向量,获得每一样本对应所有分类的激活值。
步骤101:计算接受阈值,对所有正确分类的样本xi有激活特征向量
Figure BDA0001396736750000091
其中i表示样本x被正确分类为i类;令样本x对应的i类已知类别的激活特征值fi=vi(xi);接受阈值
Figure BDA0001396736750000092
其中X为正确识别为i类的样本总个数。
步骤102:计算拒绝阈值,每一类已知类别的接受阈值为ηi,计算拒绝阈值
μi=ε*ηi,其中ε=0.6。
步骤103:计算距离阈值,对所有正确分类的样本xi有激活特征向量
Figure BDA0001396736750000093
令样本x对应的i类已知类别的激活特征值fi=vi(xi),令次级激活特征值
Figure BDA0001396736750000094
其中
Figure BDA0001396736750000095
函数返回激活向量
Figure BDA0001396736750000096
中第二大激活值;距离阈值
Figure BDA0001396736750000097
步骤104:提取输入样本特征激活向量,输入视频样本x,每隔s帧提取一帧图像,得到f;将所有帧f输入神经网络训练;提取神经网络分类层激活向量
Figure BDA0001396736750000098
步骤105:判定是否接受当前样本,激活值大于接受阈值,则接受当前样本;否则,激活值小于拒绝阈值,则拒绝当前样本;间于两者之间,则比较距离阈值,大于距离阈值则接受当前样本,反之则拒绝。
如图3所示,为本发明实施例中基于深度网络开集视频类别发掘和扩展方法的修改深度神经网络分类层的示意图,该方法包括以下步骤:
修改深度神经网络分类层权值转移矩阵,为扩充模型识别类别总数增添新的一列权值;
从而模型识别总类别数增加,即可应对新增类别的分类识别。
如图4所示,为本发明实施例中基于深度网络开集视频类别发掘和扩展方法的强化初始化过程的示意图,该方法包括以下步骤:
获取深度神经网络分类层权值矩阵,并扩充一列;获取新增类别激活特征向量,并计算平均激活特征向量:将所有帧f输入神经网络训练;提取神经网络分类层激活向量
Figure BDA0001396736750000101
计算平均激活特征向量
Figure BDA0001396736750000102
其中P为新增类别x的所有用于训练样本数。计算迁移全局分类知识部分:
Figure BDA0001396736750000103
其中,N为当前模型识别类别总数,Wn为第n类识别对应的权值矩阵列。计算类别间联系信息部分:选择平均激活特征矩阵中较大的M个值对应的权值列hm构成集合H;计算类别间联系信息部分:
Figure BDA0001396736750000104
结合上述两部分初始化新增权值列:
Figure BDA0001396736750000105
其中,w′N+1对应全局分类知识,w″N+1对应相似类别联系信息,k1为第一信息权重,k2为第二信息权重。
优选地,采用均衡训练方法,保证每一类已知类别与新增类别有相同的样本数量。
优选地,采用异速训练方法,使得新增样本学习速率快于已知类别。
优选地,所述异速训练方法主要包括以下步骤:
(1)定义异速因子α:
Figure BDA0001396736750000111
其中,N为当前模型识别类别总数;
(2)当修改后的权值转移矩阵在反向传播更新时,使用异速因子来控制不同学习速率,更新W,b如下:
Figure BDA0001396736750000112
Figure BDA0001396736750000113
其中,J(W,b)是代价函数,λ是学习率,W和b分别为深度神经网络分类层的权值转移矩阵和偏移。
通过在当前模型中增添了新的识别类别,随着上述过程不断迭代,整个系统将逐一增加识别类别总数,深度分类模型不断被扩展。系统整体性能不断上升,能够逐渐识别越来越多的识别类别,并依此处理开集识别问题中未预定义未知类别。本发明实施例中扩展了深度神经网络,并迁移大量现有知识到扩展后深度网络,减少了扩展模型后增量训练所需人工标注的样本数量;采用强化初始化方法强化类别间联系信息,采用异速训练方法加快增量训练深度。从而,通过本发明实施例提供的方法能够扩展深度神经网络识别模型,使模型识别类别数增加,能够处理开集识别问题中未预定义的识别类别,提高真实识别场景下的识别准确率。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (13)

1.一种基于深度神经网络的样本分类方法,其特征在于,包括如下步骤:
S1,使用包含已定义类别样本的样本集训练待扩展分类模型,获得所述待扩展分类模型的分类阈值信息,其中,所述已定义类别样本是视频图像中预定义的已知类别样本,所述待扩展分类模型为视频图像中预定义的已知类别样本训练初始固定类别数的深度神经网络分类模型,所述分类阈值信息包括接受阈值、拒绝阈值和距离阈值;
S2,将包含未定义类别样本的样本集送入所述待扩展分类模型,根据所述待扩展分类模型的分类阈值信息确定至少部分所述未定义类别样本;
S3,人工标注至少部分步骤S2中确定的所述未定义类别样本;
S4,在所述深度神经网络的分类层中增加权值转移矩阵列数,以增加模型识别类别的总数,其中,增加的权值列中包含与全局分类相关的第一信息和与类别间联系相关的第二信息;
S5,用步骤S3中人工标注的未定义类别样本增量训练步骤S4中更新后的模型。
2.如权利要求1所述的方法,其特征在于,
使用包含已定义类别样本的样本集训练待扩展分类模型,获得所述待扩展分类模型的分类阈值信息具体为:使用包含已定义类别样本的样本集训练待扩展分类模型,获得所述待扩展分类模型已定义类别的接受阈值、拒绝阈值、和距离阈值;
根据所述待扩展分类模型的分类阈值信息确定至少部分所述未定义类别样本具体为:提取包含未定义类别样本的样本集在深度神经网络分类层的特征激活值,根据所述特征激活值和所述接受阈值、拒绝阈值、和距离阈值确定至少部分所述未定义类别样本。
3.如权利要求2所述的方法,其特征在于,
获得所述待扩展分类模型已定义类别的接受阈值包括如下步骤:
获得正确分类的样本xi的激活特征向量:
Figure FDA0002286431190000021
其中i表示样本x被正确分类为i类,n表示已定义类别总数,
样本x对应的i类已知类别的激活特征值fi=vi(xi),
确定接受阈值为:
Figure FDA0002286431190000022
其中X为正确识别为i类的样本总个数,fi,j为第j个样本对应的i类已知类别的激活特征值。
4.如权利要求2所述的方法,其特征在于,
获得所述待扩展分类模型已定义类别的拒绝阈值μi具体为:
μi=ε*ηi
其中,每一类已知类别的接受阈值为ηi,ε为拒绝权重。
5.如权利要求4所述的方法,其特征在于,
所述拒绝权重ε取值为0.6。
6.如权利要求2所述的方法,其特征在于,获得所述待扩展分类模型已定义类别的距离阈值具体为:
Figure FDA0002286431190000023
其中,Mean为计算平均值函数,
Figure FDA0002286431190000024
为正确分类的样本xi激活特征向量,fi=vi(xi)为样本x对应的i类已知类别的激活特征值,
Figure FDA0002286431190000025
为次级激活特征值,其中
Figure FDA0002286431190000026
函数返回激活向量
Figure FDA0002286431190000027
中第二大激活值,si,j为第j个样本对应的次级激活特征值,fi,j为第j个样本对应的i类已知类别的激活特征值。
7.如权利要求2-6中任意一项所述的方法,其特征在于,提取包含未定义类别样本的样本集在深度神经网络分类层的特征激活值,根据所述特征激活值和所述接受阈值、拒绝阈值、和距离阈值确定至少部分所述未定义类别样本,具体为:
Figure FDA0002286431190000031
其中
Figure FDA0002286431190000032
函数返回激活向量
Figure FDA0002286431190000037
中第二大激活值,
Figure FDA0002286431190000033
函数返回最大激活值在激活向量中的下标,即l为模型预测标签;
如果fx>ηl,其中ηl为第l类已知类别的接受阈值,则接受该样本为l类识别类别;
如果fx<μl,其中μl为第l类已知类别的拒绝阈值,则拒绝将该样本识别为l类识别类别,并判定为未定义类别;
如果μl<fx<ηl,计算样本距离dx=fx-sx,并比较所述样本距离dx和l类已知类别的距离阈值δl:如果dx>δl,则接受该样本为l类识别类别;否则,拒绝将该样本识别为l类识别类别,并判定为未定义类别。
8.如权利要求1所述的方法,其特征在于,还包括:
计算与全局分类相关的第一信息:
Figure FDA0002286431190000034
其中,其中,w′N+1对应所述第一信息,N为当前模型识别类别总数,wn为第n类识别类别对应的权值矩阵列。
9.如权利要求8所述的方法,其特征在于,还包括:
计算与类别间联系相关的第二信息:
(a)选择平均激活特征矩阵中较大的M个值对应的权值列hm构成集合H;
(b)计算所述第二信息:
Figure FDA0002286431190000035
其中,w″N+1对应所述第二信息。
10.如权利要求9所述的方法,其特征在于,还包括,
初始化新增权值列wN+1
Figure FDA0002286431190000036
其中,k1为第一信息权重,k2为第二信息权重。
11.如权利要求1所述的方法,其特征在于,
采用均衡训练方法,保证每一类已知类别与新增类别有相同的样本数量。
12.如权利要求1或11所述的方法,其特征在于,
采用异速训练方法,使得新增样本学习速率快于已知类别。
13.如权利要求12所述的方法,其特征在于,
所述异速训练方法主要包括以下步骤:
(1)定义异速因子α:
Figure FDA0002286431190000041
其中,N为当前模型识别类别总数;
(2)当修改后的权值转移矩阵在反向传播更新时,使用异速因子来控制不同学习速率,更新W,b如下:
Figure FDA0002286431190000042
Figure FDA0002286431190000043
其中,J(W,b)是代价函数,λ是学习率,W和b分别为深度神经网络分类层的权值转移矩阵和偏移。
CN201710780217.2A 2017-09-01 2017-09-01 一种基于深度神经网络的开集类别发掘与扩展方法与装置 Active CN107506799B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710780217.2A CN107506799B (zh) 2017-09-01 2017-09-01 一种基于深度神经网络的开集类别发掘与扩展方法与装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710780217.2A CN107506799B (zh) 2017-09-01 2017-09-01 一种基于深度神经网络的开集类别发掘与扩展方法与装置

Publications (2)

Publication Number Publication Date
CN107506799A CN107506799A (zh) 2017-12-22
CN107506799B true CN107506799B (zh) 2020-04-24

Family

ID=60694741

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710780217.2A Active CN107506799B (zh) 2017-09-01 2017-09-01 一种基于深度神经网络的开集类别发掘与扩展方法与装置

Country Status (1)

Country Link
CN (1) CN107506799B (zh)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108520199B (zh) * 2018-03-04 2022-04-08 天津大学 基于雷达图像与生成对抗模型的人体动作开集识别方法
CN110348465B (zh) * 2018-04-03 2022-10-18 富士通株式会社 用于标注样本的方法
US20210117786A1 (en) * 2018-04-18 2021-04-22 Deepmind Technologies Limited Neural networks for scalable continual learning in domains with sequentially learned tasks
CN108932299A (zh) * 2018-06-07 2018-12-04 北京迈格威科技有限公司 用于对线上系统的模型进行更新的方法以及装置
CN110895670B (zh) * 2018-09-13 2022-09-09 珠海格力电器股份有限公司 场景的识别方法及装置
CN109492658A (zh) * 2018-09-21 2019-03-19 北京车和家信息技术有限公司 一种点云分类方法及终端
CN109490704A (zh) * 2018-10-16 2019-03-19 河海大学 一种基于随机森林算法的配电网故障区段定位方法
CN109376786A (zh) * 2018-10-31 2019-02-22 中国科学院深圳先进技术研究院 一种图像分类方法、装置、终端设备及可读存储介质
CN109460471B (zh) * 2018-11-01 2021-09-24 信融源大数据科技(北京)有限公司 一种基于自学习的方式建立纤维种类图谱库的方法
CN109740682B (zh) * 2019-01-08 2020-07-28 南京大学 一种基于域转化和生成模型的图像识别方法
CN109934269B (zh) * 2019-02-25 2023-06-06 中国电子科技集团公司第三十六研究所 一种电磁信号的开集识别方法和装置
CN109977899B (zh) * 2019-04-03 2023-07-14 上海感图网络科技有限公司 一种物品识别的训练、推理以及增加新种类的方法和系统
CN110598578A (zh) * 2019-08-23 2019-12-20 腾讯云计算(北京)有限责任公司 身份识别方法、身份识别系统的训练方法、装置及设备
CN110674877B (zh) * 2019-09-26 2023-06-27 联想(北京)有限公司 图像处理方法和装置
CN110909760B (zh) * 2019-10-12 2021-03-16 中国人民解放军国防科技大学 一种基于卷积神经网络的图像开放集识别方法
CN111191033B (zh) * 2019-12-25 2023-04-25 华南理工大学 一种基于分类效用的开集分类方法
CN111582507A (zh) * 2020-06-19 2020-08-25 南京宁麒智能计算芯片研究院有限公司 一种基于simd架构的ls-svm训练机的硬件系统及训练方法
CN112508062A (zh) * 2020-11-20 2021-03-16 普联国际有限公司 一种开集数据的分类方法、装置、设备及存储介质
CN113033665A (zh) * 2021-03-26 2021-06-25 北京沃东天骏信息技术有限公司 样本扩展方法、训练方法和系统、及样本学习系统
CN113837156A (zh) * 2021-11-26 2021-12-24 北京中超伟业信息安全技术股份有限公司 一种基于增量学习的智能仓储分拣方法和系统
CN114757308A (zh) * 2022-06-15 2022-07-15 科大天工智能装备技术(天津)有限公司 基于开集缺陷识别的智能电网巡检方法、装置及存储介质
CN115659182B (zh) * 2022-11-11 2023-08-15 中国电子科技集团公司第十五研究所 一种模型更新方法、装置及设备
CN116776230B (zh) * 2023-08-22 2023-11-14 北京海格神舟通信科技有限公司 一种基于特征压印与特征迁移识别信号的方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1981293A (zh) * 2004-02-02 2007-06-13 皇家飞利浦电子股份有限公司 具有在线学习能力的连续面貌识别
CN101004793A (zh) * 2007-01-08 2007-07-25 中国民航大学 基于高维空间凸锥构造的手写体文字识别方法
CN101814148A (zh) * 2010-04-30 2010-08-25 霍振国 基于半监督核自适应学习的遥感高光谱图像分类方法
CN102938073A (zh) * 2012-10-23 2013-02-20 中国人民解放军空军工程大学 一种遥感图像的分类方法
CN104866869A (zh) * 2015-05-29 2015-08-26 武汉大学 基于分布差异与增量学习的时序sar图像分类方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9881234B2 (en) * 2015-11-25 2018-01-30 Baidu Usa Llc. Systems and methods for end-to-end object detection

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1981293A (zh) * 2004-02-02 2007-06-13 皇家飞利浦电子股份有限公司 具有在线学习能力的连续面貌识别
CN101004793A (zh) * 2007-01-08 2007-07-25 中国民航大学 基于高维空间凸锥构造的手写体文字识别方法
CN101814148A (zh) * 2010-04-30 2010-08-25 霍振国 基于半监督核自适应学习的遥感高光谱图像分类方法
CN102938073A (zh) * 2012-10-23 2013-02-20 中国人民解放军空军工程大学 一种遥感图像的分类方法
CN104866869A (zh) * 2015-05-29 2015-08-26 武汉大学 基于分布差异与增量学习的时序sar图像分类方法

Also Published As

Publication number Publication date
CN107506799A (zh) 2017-12-22

Similar Documents

Publication Publication Date Title
CN107506799B (zh) 一种基于深度神经网络的开集类别发掘与扩展方法与装置
Taymouri et al. Predictive business process monitoring via generative adversarial nets: the case of next event prediction
CN110852447B (zh) 元学习方法和装置、初始化方法、计算设备和存储介质
CN112699247B (zh) 一种基于多类交叉熵对比补全编码的知识表示学习方法
US9053358B2 (en) Learning device for generating a classifier for detection of a target
CN110334589B (zh) 一种基于空洞卷积的高时序3d神经网络的动作识别方法
CN107683469A (zh) 一种基于深度学习的产品分类方法及装置
CN109002755B (zh) 基于人脸图像的年龄估计模型构建方法及估计方法
CN105354565A (zh) 基于全卷积网络人脸五官定位与判别的方法及系统
Sajanraj et al. Indian sign language numeral recognition using region of interest convolutional neural network
CN113128478B (zh) 模型训练方法、行人分析方法、装置、设备及存储介质
US9536206B2 (en) Method and apparatus for improving resilience in customized program learning network computational environments
CN110443257B (zh) 一种基于主动学习的显著性检测方法
CN112364791B (zh) 一种基于生成对抗网络的行人重识别方法和系统
WO2022051855A1 (en) Method and system for training a neural network model using gradual knowledge distillation
CN114283350A (zh) 视觉模型训练和视频处理方法、装置、设备及存储介质
CN110796260B (zh) 一种基于类扩张学习的神经网络模型优化方法
CN113808123B (zh) 一种基于机器视觉的药液袋动态检测方法
CN113722439B (zh) 基于对抗性类别对齐网络的跨领域情感分类方法及系统
CN112199505B (zh) 一种基于特征表示学习的跨领域情感分类方法及系统
CN112966754A (zh) 样本筛选方法、样本筛选装置及终端设备
CN111104831A (zh) 一种视觉追踪方法、装置、计算机设备以及介质
Li A deep learning-based text detection and recognition approach for natural scenes
CN111783688A (zh) 一种基于卷积神经网络的遥感图像场景分类方法
CN113886578B (zh) 一种表单分类方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Tian Yonghong

Inventor after: Shu Yu

Inventor after: Shi Yemin

Inventor after: Wang Yaowei

Inventor after: Yuan Qingsheng

Inventor before: Tian Yonghong

Inventor before: Shu Yu

Inventor before: Shi Yemin

Inventor before: Wang Yaowei

CB03 Change of inventor or designer information
TA01 Transfer of patent application right

Effective date of registration: 20180807

Address after: 100871 No. 5, the Summer Palace Road, Beijing, Haidian District

Applicant after: Peking University

Applicant after: State Computer Network and Information Safety Management Center

Address before: 100871 No. 5, the Summer Palace Road, Beijing, Haidian District

Applicant before: Peking University

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant