CN113610146B - 基于中间层特征提取增强的知识蒸馏实现图像分类的方法 - Google Patents
基于中间层特征提取增强的知识蒸馏实现图像分类的方法 Download PDFInfo
- Publication number
- CN113610146B CN113610146B CN202110887562.2A CN202110887562A CN113610146B CN 113610146 B CN113610146 B CN 113610146B CN 202110887562 A CN202110887562 A CN 202110887562A CN 113610146 B CN113610146 B CN 113610146B
- Authority
- CN
- China
- Prior art keywords
- layer
- model
- student
- distillation
- teacher
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013140 knowledge distillation Methods 0.000 title claims abstract description 33
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000000605 extraction Methods 0.000 title claims abstract description 19
- 238000004821 distillation Methods 0.000 claims abstract description 33
- 238000012549 training Methods 0.000 claims abstract description 9
- 230000006870 function Effects 0.000 claims description 46
- 230000004044 response Effects 0.000 claims description 12
- 238000007781 pre-processing Methods 0.000 claims description 4
- 230000000694 effects Effects 0.000 abstract description 8
- 238000013527 convolutional neural network Methods 0.000 abstract description 5
- 230000002708 enhancing effect Effects 0.000 abstract description 3
- 239000010410 layer Substances 0.000 description 91
- 238000005457 optimization Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000011229 interlayer Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种基于中间层特征提取增强的知识蒸馏实现图像分类的方法,包括获取待分类图像;将待分类图像导入预先训练好的教师‑学生网络中,得到相应的分类结果;其中,预先训练好的教师‑学生网络是基于历史图像分别输入教师模型和学生模型中,并采用预设的跨层非局部模块分别提取学生模型和教师模型的多尺度像素间关系,且待计算出教师模型和学生模型间的多尺度像素关系蒸馏损失之后,将蒸馏损失加入学生模型的损失函数中,进一步根据损失函数反向传播更新学生模型参数直至学生模型收敛,将收敛后的学生模型作为优化模型输出进行训练得到的。本发明,通过增强知识蒸馏对中间层特征提取能力来改善卷积神经网络优化效果,用以增强图像分类效果。
Description
技术领域
本发明涉及人工智能和图像处理技术领域,尤其涉及一种基于中间层特征提取增强的知识蒸馏实现图像分类的方法。
背景技术
随着人工智能领域中深度学习的发展,日益复杂的卷积神经网络模型在带来高性能的同时,其巨大的参数量和通道量却需要消耗大量的存储资源和计算资源,对模型在移动端和嵌入式设备中应用带来困难。因此,为了降低神经网络模型的存储占用空间和计算开销,典型的神经网络优化方法包括参数量化、紧凑模型、剪枝和共享、低秩分解和知识蒸馏等。
知识蒸馏是对深度模型进行优化的一种常用的方法。通过定义合适的蒸馏损失,知识蒸馏往往能够超越传统的基于真实标签的监督训练方法,实现模型推理准确率的提升。知识蒸馏的训练框架中通常包含一个或多个教师模型,以及一个学生模型。当学生模型的大小小于教师模型时,其本质上就实现了一个高效的模型压缩过程。对比其他神经网络优化方法,知识蒸馏的优点在于无需对模型结构进行复杂的修改,实施过程相对简单,可推广性好,模型稳定性好。通过知识蒸馏获得的轻量化模型具有确定的压缩比和准确率下限,确保了在特定的场景中或设备上的可部署性。
然而,最早的知识蒸馏方法只考虑对教师模型的分对数输出,而忽视了模型中间层所包含的丰富的暗知识。因此,近年来出现了一些基于中间层特征的知识蒸馏方法。
现有方法中,基于中间层的知识蒸馏在图像分类中主要存在以下问题:(1)缺乏对多尺度像素间关系的表征;(2)存在背景噪声干扰:对于图像分类任务而言,一张中间层特征图像中只有少量的关键特征决定了图像的分类结果,剩余的大部分像素对于得出分类结果毫无贡献,因此对所有像素不加筛选地进行蒸馏,不仅降低了蒸馏学习的效率,甚至由于在蒸馏过程中拟合了大量背景噪声而有害于学生模型的训练。
发明内容
本发明实施例所要解决的技术问题在于,提供一种基于中间层特征提取增强的知识蒸馏实现图像分类的方法,通过增强知识蒸馏对中间层特征提取能力来改善卷积神经网络优化效果,用以增强图像分类效果,从而解决了现有技术中所存在的缺乏对多尺度像素间关系的表征以及背景噪声干扰的问题。
为了解决上述技术问题,本发明实施例提供了一种基于中间层特征提取增强的知识蒸馏实现图像分类的方法,所述方法包括以下步骤:
获取待分类图像;
将所述待分类图像导入预先训练好的教师-学生网络中,得到相应的分类结果;其中,所述预先训练好的教师-学生网络是基于历史图像分别输入教师模型和学生模型中,并采用预设的跨层非局部模块分别提取学生模型和教师模型的多尺度像素间关系,且待计算出教师模型和学生模型间的多尺度像素关系蒸馏损失之后,将蒸馏损失加入学生模型的损失函数中,进一步根据损失函数反向传播更新学生模型参数直至学生模型收敛,将收敛后的学生模型作为优化模型输出进行训练得到的。
其中,所述跨层非局部模块采用如下公式进行计算:
R=(Xq,Xr1,…,Xrn)=Xq+∑zri
其中,Xq为查询层特征;Xri为响应层特征;Zri为响应层i与查询层的像素间关系,表示为Z为卷积运算;θ(·),φ(·)和g(·)均为可学习嵌入式函数,使用1×1卷积实现;θ(Xq),/>gi(Xri)为可学习嵌入函数对输入的特征图做预处理,计算单个像素的表示;f(·,·)为二维函数,使用点积实现;为计算对应位置像素间的相关程度。
其中,所述跨层非局部模块提取学生模型或教师模型的多尺度像素间关系的具体步骤如下:
将历史图像作为学生模型或教师模型的输入,并输入相应模型的第一层;
若第一层是选定的响应层,将第一层的输出特征作为响应层输入其后的跨层非局部模块,并将跨层非局部模块的输出特征输入其后的第二层;或若第一层是选定的查询层,将第一层的输出特征作为查询层输入其后的跨层非局部模块;
用第二层更新第一层;
若第一层是最后一层,将最后一层的输出特征作为预测结果并输出。
其中,计算教师模型和学生模型间的多尺度像素关系蒸馏损失时,采用L2范式损失的形式如下:
L蒸馏=L2(RT,M(RS))
其中,M(RS)是可学习的匹配函数,使教师模型和学生模型的多尺度关系特征图在维度和尺寸上匹配;RS首先通过一个卷积层c(·),然后再通过一个上采样函数h(·)进行匹配,即M(RS)=h(c(RS))。
其中,将蒸馏损失加入到学生模型的损失函数中时,采用如下公式进行运算:
L总=L分类+αL蒸馏
其中,L总为总损失函数;L分类为分类损失函数;L蒸馏为蒸馏损失函数;α为蒸馏损失函数在总损失函数中占的比例系数。
其中,所述分类损失函数采用交叉熵形式计算,具体公式如下:
其中,y为图像的真实分类标签,为学生模型输出的预测结果。
实施本发明实施例,具有如下有益效果:
本发明针对现有基于中间层的知识蒸馏方法中缺乏对多尺度像素间关系表征的问题,在教师-学生网络的中间层插入一个可学习的跨层非局部模块,提取教师模型和学生模型的多尺度像素间关系,通过知识蒸馏的方式使学生模型拟合教师模型的多尺度像素间关系,改善学生模型的中间层输出,提升学生模型的特征提取能力,有效地提升知识蒸馏对教师-学生网络优化效果,增强了图像分类效果,从而解决了现有技术中所存在的缺乏对多尺度像素间关系的表征以及背景噪声干扰的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,根据这些附图获得其他的附图仍属于本发明的范畴。
图1为本发明实施例提供的基于中间层特征提取增强的知识蒸馏实现图像分类的方法的流程图;
图2为本发明实施例提供的基于中间层特征提取增强的知识蒸馏实现图像分类的方法中训练教师-学生网络的流程图;
图3为本发明实施例提供的基于中间层特征提取增强的知识蒸馏实现图像分类的方法中跨层非局部模块的结构示意图;
图4为本发明实施例提供的基于中间层特征提取增强的知识蒸馏实现图像分类的方法中使用跨层非局部模块进行多尺度像素关系提取的流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。
如图1所示,为本发明实施例中,提出的一种基于中间层特征提取增强的知识蒸馏实现图像分类的方法,所述方法包括以下步骤:
步骤S1、获取待分类图像;
步骤S2、将所述待分类图像导入预先训练好的教师-学生网络中,得到相应的分类结果;其中,所述预先训练好的教师-学生网络是基于历史图像分别输入教师模型和学生模型中,并采用预设的跨层非局部模块分别提取学生模型和教师模型的多尺度像素间关系,且待计算出教师模型和学生模型间的多尺度像素关系蒸馏损失之后,将蒸馏损失加入学生模型的损失函数中,进一步根据损失函数反向传播更新学生模型参数直至学生模型收敛,将收敛后的学生模型作为优化模型输出进行训练得到的。
具体过程为,在步骤S1之前,预先训练教师-学生网络,其训练过程如图2所示,具体包括:
S201:接收历史图像,作为卷积神经网络模型的输入分别输入教师模型和学生模型;
S202:教师模型通过跨层非局部模块(如图3所示)提取多尺度像素间关系之后,执行步骤S204;
S203:学生模型通过跨层非局部模块(如图3所示)提取多尺度像素间关系之后,执行步骤S204;
S204:计算多尺度像素关系蒸馏损失。计算教师模型和学生模型间的多尺度像素关系蒸馏损失时,采用L2范式损失的形式
L蒸馏=L2(RT,M(RS))
其中,M(RS)是可学习的匹配函数,使教师模型和学生模型的多尺度关系特征图在维度和尺寸上匹配。在本实施例中,RS首先通过一个卷积层c(·),然后再通过一个上采样函数h(·)进行匹配,即M(RS)=h(c(RS))
S205:将蒸馏损失加入到学生模型的损失函数中。采用如下公式求加权和得到总损失函数:
L总=L分类+αL蒸馏
其中,L总为总损失函数;L分类为分类损失函数,该函数采用交叉熵形式计算,具体公式为y为图像的真实分类标签,/>为学生模型输出的预测结果;L蒸馏为蒸馏损失函数;α为蒸馏损失函数在总损失函数中占的比例系数;
S206:判断学生模型的准确率是否收敛,若是,则执行S207;否则,更新学生模型参数,且待参数更新完成之后,返回步骤S203;
S207:将学生模型作为优化模型输出,即得到训练好的教师-学生网络。
在本发明实施例中,跨层非局部模块是为了提取查询层特征Xq和响应层特征Xri之间的多尺度像素间关系,首先使用可学习的嵌入式函数θ(·)和φ(·)分别对Xq和Xri进行预处理,投影到新的特征空间中。然后利用特征空间中的函数f(·,·)处理θ(Xq)和φ(Xri),再经过一个归一化指数函数softmax层计算注意力映射。同时,响应层的位置特征由另一个可学习的嵌入函数g(·)投影得到。在输出端,利用卷积z保证输出的多尺度像素关系特征图与查询层特征图Xq维度和尺寸上的一致性,以便于后续的叠加。因此,跨层非局部模块输出的多尺度像素关系特征图是多尺度像素关系和查询层特征图的叠加,该跨层非局部模块采用如下公式(1)进行计算:
R=(Xq,Xr1,…,Xrn)=Xq+∑Zri (1)
其中,Xq为查询层特征;Xri为响应层特征;Zri为响应层i与查询层的像素间关系,表示为Z为卷积运算;θ(·),φ(·)和g(·)均为可学习嵌入式函数,使用1×1卷积实现;θ(Xq),/>gi(Xri)为可学习嵌入函数对输入的特征图做预处理,计算单个像素的表示;f(·,·)为二维函数,使用点积实现;为计算对应位置像素间的相关程度,即f(θ(Xq),φ(Xri))=θ(Xq)Tφ(Xri)。
在本发明实施例中,跨层非局部模块跨层非局部模块提取学生模型或教师模型的多尺度像素间关系的具体步骤如图4所示,具体包括:
S401:将历史图像作为学生模型或教师模型的输入,并输入相应模型的第一层;
S402:若第一层是选定的响应层,将第一层的输出特征作为响应层输入其后的跨层非局部模块,并将跨层非局部模块的输出特征输入其后的第二层;或若第一层是选定的查询层,将第一层的输出特征作为查询层输入其后的跨层非局部模块;其中,选择模型的倒数第二层作为响应层,倒数第三,四,五,六,七层作为查询层;
S403:用第二层更新第一层;
S404:若第一层是最后一层,将最后一层的输出特征作为预测结果并输出,即将跨层非局部模块的输出作为提取的多尺度像素关系特征用于知识蒸馏。
实施本发明实施例,具有如下有益效果:
本发明针对现有基于中间层的知识蒸馏方法中缺乏对多尺度像素间关系表征的问题,在教师-学生网络的中间层插入一个可学习的跨层非局部模块,提取教师模型和学生模型的多尺度像素间关系,通过知识蒸馏的方式使学生模型拟合教师模型的多尺度像素间关系,改善学生模型的中间层输出,提升学生模型的特征提取能力,有效地提升知识蒸馏对教师-学生网络优化效果,增强了图像分类效果,从而解决了现有技术中所存在的缺乏对多尺度像素间关系的表征以及背景噪声干扰的问题。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于一计算机可读取存储介质中,所述的存储介质,如ROM/RAM、磁盘、光盘等。
以上所揭露的仅为本发明一种较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
Claims (4)
1.一种基于中间层特征提取增强的知识蒸馏实现图像分类的方法,其特征在于,所述方法包括以下步骤:
获取待分类图像;
将所述待分类图像导入预先训练好的教师-学生网络中,得到相应的分类结果;其中,所述预先训练好的教师-学生网络是基于历史图像分别输入教师模型和学生模型中,并采用预设的跨层非局部模块分别提取学生模型和教师模型的多尺度像素间关系,且待计算出教师模型和学生模型间的多尺度像素间关系蒸馏损失之后,将蒸馏损失加入学生模型的损失函数中,进一步根据损失函数反向传播更新学生模型参数直至学生模型收敛,将收敛后的学生模型作为优化模型输出进行训练得到的;
所述跨层非局部模块采用如下公式进行计算:
R=(Xq,Xr1,…,Xrn)=Xq+∑Zri
其中,Xq为查询层特征;Xri为响应层i特征;Zri为响应层i与查询层的像素间关系,表示为为卷积运算;θ(·),/>和g(·)均为可学习嵌入式函数,使用1×1卷积实现;θ(Xq),/>gi(Xri)为可学习嵌入函数对输入的特征图做预处理,计算单个像素的表示;f(·,·为二维函数,使用点积实现;为计算对应位置像素间的相关程度;
所述跨层非局部模块提取学生模型或教师模型的多尺度像素间关系的具体步骤如下:
将历史图像作为学生模型或教师模型的输入,并输入相应模型的第一层;
若第一层是选定的响应层,将第一层的输出特征作为响应层输入其后的跨层非局部模块,并将跨层非局部模块的输出特征输入其后的第二层;或若第一层是选定的查询层,将第一层的输出特征作为查询层输入其后的跨层非局部模块;
用第二层更新第一层;
若第一层是最后一层,将最后一层的输出特征作为预测结果并输出。
2.如权利要求1所述的基于中间层特征提取增强的知识蒸馏实现图像分类的方法,其特征在于,计算教师模型和学生模型间的多尺度像素间关系蒸馏损失时,采用L2范式损失的形式如下:
L蒸馏=L2(RT,M(RS))
其中,M(RS)是可学习的匹配函数,使教师模型和学生模型的多尺度关系特征图在维度和尺寸上匹配;RS首先通过一个卷积层c(·),然后再通过一个上采样函数h(·)进行匹配,即M(RS)=h(c(RS))。
3.如权利要求1所述的基于中间层特征提取增强的知识蒸馏实现图像分类的方法,其特征在于,将蒸馏损失加入到学生模型的损失函数中时,采用如下公式进行运算:
L总=L分类+αL蒸馏
其中,L总为总损失函数;L分类为分类损失函数;L蒸馏为蒸馏损失函数;α为蒸馏损失函数在总损失函数中占的比例系数。
4.如权利要求3所述的基于中间层特征提取增强的知识蒸馏实现图像分类的方法,其特征在于,所述分类损失函数采用交叉熵形式计算,具体公式如下:
其中,y为图像的真实分类标签,为学生模型输出的预测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110887562.2A CN113610146B (zh) | 2021-08-03 | 2021-08-03 | 基于中间层特征提取增强的知识蒸馏实现图像分类的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110887562.2A CN113610146B (zh) | 2021-08-03 | 2021-08-03 | 基于中间层特征提取增强的知识蒸馏实现图像分类的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113610146A CN113610146A (zh) | 2021-11-05 |
CN113610146B true CN113610146B (zh) | 2023-08-04 |
Family
ID=78339339
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110887562.2A Active CN113610146B (zh) | 2021-08-03 | 2021-08-03 | 基于中间层特征提取增强的知识蒸馏实现图像分类的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113610146B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114067819B (zh) * | 2021-11-22 | 2024-06-21 | 南京工程学院 | 基于跨层相似性知识蒸馏的语音增强方法 |
CN114298224B (zh) * | 2021-12-29 | 2024-06-18 | 云从科技集团股份有限公司 | 图像分类方法、装置以及计算机可读存储介质 |
CN114596479A (zh) * | 2022-01-29 | 2022-06-07 | 大连理工大学 | 适用于智能终端的图像摩尔纹去除方法、装置及存储介质 |
CN114663941A (zh) * | 2022-03-17 | 2022-06-24 | 深圳数联天下智能科技有限公司 | 特征检测方法、模型合并方法、设备和介质 |
CN114663714B (zh) * | 2022-05-23 | 2022-11-04 | 阿里巴巴(中国)有限公司 | 图像分类、地物分类方法和装置 |
CN115601536B (zh) * | 2022-12-02 | 2023-05-26 | 荣耀终端有限公司 | 一种图像处理方法及电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107247989A (zh) * | 2017-06-15 | 2017-10-13 | 北京图森未来科技有限公司 | 一种神经网络训练方法及装置 |
CN108764462A (zh) * | 2018-05-29 | 2018-11-06 | 成都视观天下科技有限公司 | 一种基于知识蒸馏的卷积神经网络优化方法 |
CN112116030A (zh) * | 2020-10-13 | 2020-12-22 | 浙江大学 | 一种基于向量标准化和知识蒸馏的图像分类方法 |
CN112784964A (zh) * | 2021-01-27 | 2021-05-11 | 西安电子科技大学 | 基于桥接知识蒸馏卷积神经网络的图像分类方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180268292A1 (en) * | 2017-03-17 | 2018-09-20 | Nec Laboratories America, Inc. | Learning efficient object detection models with knowledge distillation |
-
2021
- 2021-08-03 CN CN202110887562.2A patent/CN113610146B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107247989A (zh) * | 2017-06-15 | 2017-10-13 | 北京图森未来科技有限公司 | 一种神经网络训练方法及装置 |
CN108764462A (zh) * | 2018-05-29 | 2018-11-06 | 成都视观天下科技有限公司 | 一种基于知识蒸馏的卷积神经网络优化方法 |
CN112116030A (zh) * | 2020-10-13 | 2020-12-22 | 浙江大学 | 一种基于向量标准化和知识蒸馏的图像分类方法 |
CN112784964A (zh) * | 2021-01-27 | 2021-05-11 | 西安电子科技大学 | 基于桥接知识蒸馏卷积神经网络的图像分类方法 |
Non-Patent Citations (1)
Title |
---|
用于肺炎图像分类的优化卷积神经网络方法;邓棋;雷印杰;田锋;;计算机应用(第01期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113610146A (zh) | 2021-11-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113610146B (zh) | 基于中间层特征提取增强的知识蒸馏实现图像分类的方法 | |
CN110084281B (zh) | 图像生成方法、神经网络的压缩方法及相关装置、设备 | |
CN112991354B (zh) | 一种基于深度学习的高分辨率遥感影像语义分割方法 | |
CN110222760B (zh) | 一种基于winograd算法的快速图像处理方法 | |
CN111339818B (zh) | 一种人脸多属性识别系统 | |
WO2023231794A1 (zh) | 一种神经网络参数量化方法和装置 | |
CN112183742B (zh) | 基于渐进式量化和Hessian信息的神经网络混合量化方法 | |
WO2024041479A1 (zh) | 一种数据处理方法及其装置 | |
CN113326930A (zh) | 数据处理方法、神经网络的训练方法及相关装置、设备 | |
US11495055B1 (en) | Pedestrian trajectory prediction method and system based on multi-interaction spatiotemporal graph network | |
CN112766089B (zh) | 一种基于全局-局部对抗学习框架的跨域道路提取方法 | |
CN112733693B (zh) | 一种全局感知高分辨率遥感影像多尺度残差道路提取方法 | |
CN113408577A (zh) | 一种基于注意力机制的图像分类方法 | |
CN111339862A (zh) | 一种基于通道注意力机制的遥感场景分类方法及装置 | |
CN113628059A (zh) | 一种基于多层图注意力网络的关联用户识别方法及装置 | |
CN114781499B (zh) | 一种构建基于ViT模型的密集预测任务适配器的方法 | |
CN114742224A (zh) | 行人重识别方法、装置、计算机设备及存储介质 | |
CN115565019A (zh) | 基于深度自监督生成对抗的单通道高分辨sar图像地物分类方法 | |
CN117893807B (zh) | 基于知识蒸馏的联邦自监督对比学习图像分类系统及方法 | |
CN114581789A (zh) | 一种高光谱图像分类方法及系统 | |
CN116386148B (zh) | 基于知识图谱引导的小样本动作识别方法及系统 | |
CN116543338A (zh) | 一种基于注视目标估计的学生课堂行为检测方法 | |
Tan et al. | Active learning for deep object detection by fully exploiting unlabeled data | |
CN115587616A (zh) | 网络模型训练方法、装置、存储介质及计算机设备 | |
CN114913339A (zh) | 特征图提取模型的训练方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP03 | Change of name, title or address |
Address after: No.18 Jinqiao Road, high tech Industrial Development Zone, Yingtan City, Jiangxi Province Patentee after: Jiangxi Xinbo Rui Technology Co.,Ltd. Country or region after: China Address before: No.18 Jinqiao Road, high tech Industrial Development Zone, Yingtan City, Jiangxi Province Patentee before: Jiangxi xinbingrui Technology Co.,Ltd. Country or region before: China |