CN111239137A - 基于迁移学习与自适应深度卷积神经网络的谷物质量检测方法 - Google Patents

基于迁移学习与自适应深度卷积神经网络的谷物质量检测方法 Download PDF

Info

Publication number
CN111239137A
CN111239137A CN202010019933.0A CN202010019933A CN111239137A CN 111239137 A CN111239137 A CN 111239137A CN 202010019933 A CN202010019933 A CN 202010019933A CN 111239137 A CN111239137 A CN 111239137A
Authority
CN
China
Prior art keywords
domain
distribution
model
field
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010019933.0A
Other languages
English (en)
Other versions
CN111239137B (zh
Inventor
李可
张思雨
张秋菊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangnan University
Original Assignee
Jiangnan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangnan University filed Critical Jiangnan University
Priority to CN202010019933.0A priority Critical patent/CN111239137B/zh
Publication of CN111239137A publication Critical patent/CN111239137A/zh
Application granted granted Critical
Publication of CN111239137B publication Critical patent/CN111239137B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/84Systems specially adapted for particular applications
    • G01N21/88Investigating the presence of flaws or contamination
    • G01N21/8851Scan or image signal processing specially adapted therefor, e.g. for scan signal adjustment, for detecting different kinds of defects, for compensating for structures, markings, edges
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/84Systems specially adapted for particular applications
    • G01N21/88Investigating the presence of flaws or contamination
    • G01N21/8851Scan or image signal processing specially adapted therefor, e.g. for scan signal adjustment, for detecting different kinds of defects, for compensating for structures, markings, edges
    • G01N2021/8883Scan or image signal processing specially adapted therefor, e.g. for scan signal adjustment, for detecting different kinds of defects, for compensating for structures, markings, edges involving the calculation of gauges, generating models
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/84Systems specially adapted for particular applications
    • G01N21/88Investigating the presence of flaws or contamination
    • G01N21/8851Scan or image signal processing specially adapted therefor, e.g. for scan signal adjustment, for detecting different kinds of defects, for compensating for structures, markings, edges
    • G01N2021/8887Scan or image signal processing specially adapted therefor, e.g. for scan signal adjustment, for detecting different kinds of defects, for compensating for structures, markings, edges based on image processing techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Signal Processing (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种基于迁移学习与自适应深度卷积神经网络的谷物质量检测方法,涉及机器视觉与谷物质量检测领域,该方法包括:采集源领域以及目标领域下的谷物样本图像,其中包括合格谷物的样本图像与带有缺陷的谷物的样本图像,选择深度卷积神经网络CNN模型识别缺陷,利用源领域训练好的模型参数初始化CNN模型,并引入迁移学习算法利用源领域样本辅助目标领域样本完成目标领域谷物的质量检测。在CNN模型的训练中提出自适应学习率,并引入二次函数与正态分布模型分别采取梯度下降与梯度上升的方式更新模型参数,优化模型损失。该方法能够提高CNN模型的训练性能,自适应领域的变化,极大程度的提高谷物质量检测的准确性。

Description

基于迁移学习与自适应深度卷积神经网络的谷物质量检测 方法
技术领域
本发明涉及机器视觉与谷物质量检测领域,尤其是一种基于迁移学习与自适应深度卷积神经网络的谷物质量检测方法。
背景技术
计算机视觉技术提供一种实时、高效、无损伤的检测方法,通常与智能算法结合获取被测对象的代表特征。卷积神经网络(即CNN)是一种深层识别模型,提供“端对端”的学习方式,输入的原始图像通过特征层被映射为特征表示集,再通过末端的分类层实现多分类。因此,基于计算机视觉技术的CNN质量检测方法是一种不依赖于先验知识的全自动智能检测方法。
在实际应用中CNN仍然存在许多问题。一方面,虽然CNN的多层结构解决了手动提取特征的难题,但同时也扩大了对训练样本的需求量,提高了训练时间以及对设备计算能力的要求;另一方面,由于光照、背景等环境因素的改变,训练好的CNN模型将会失效,需采集新环境下的样本重新训练模型。但在新环境下采集大量带标签的样本是费时且昂贵的,且再次训练一个新的模型也是不现实的。
发明内容
本发明人针对上述问题及技术需求,提出了一种基于迁移学习与自适应深度卷积神经网络的谷物质量检测方法,该方法在传统CNN的基础上引入自适应学习率与迁移学习算法。自适应学习率可以提高CNN模型训练过程中的收敛速度与识别精度,而迁移学习可以使在源领域上训练好的CNN模型在目标领域上表现良好,使得CNN自适应领域的变化,提高CNN的泛化能力,最终实现更加精确的谷物质量检测。本发明采用的技术方案是:
一种基于迁移学习与自适应深度卷积神经网络的谷物质量检测方法,该方法包括:
获取M个源领域样本与N个目标领域样本,其中均包括合格样本与缺陷样本;所述源领域样本与所述目标领域样本按照相同的比例各分为训练集与测试集,M和N都为正整数,且M>N;
采用深度卷积神经网络CNN模型识别样本,并用所述源领域样本训练好的参数初始化所述CNN模型;所述源领域训练集与所述目标领域训练集作为所述CNN模型的输入,并在所述CNN模型的结构中引入迁移学习算法,自适应调节两个领域的分布,计算两个领域的分布差异,即域分布差异与类别分布差异;
在反向传播过程中,根据所述CNN模型的损失变化与权值变化分别提出自适应学习率α1与α2,引入二次函数模型得到所述自适应学习率α1,并采用梯度下降法寻优,将正态分布模型引入所述域分布差异,并结合所述自适应学习率α2采用梯度上升法寻优;
通过所述反向传播迭代更新模型参数,进而优化所述分布差异与分类损失;当迭代次数达最优时,保存所述模型参数,并输入所述目标领域测试集,得到所述目标领域中谷物质量检测的精度。
进一步地,所述通过所述反向传播迭代更新模型参数,进而优化所述分布差异与所述分类损失,包括:
所述CNN模型的损失包含所述分类损失、所述域分布差异与所述类别分布差异,并用μ与
Figure BDA0002360329200000021
分别表示所述域分布差异与所述类别分布差异对所述CNN模型的重要程度;
迭代次数小于最优迭代次数(例如500)时,在每一次迭代过程中,所述分类损失与所述类别分布差异分别结合所述自适应学习率α1更新所述模型参数,所述域分布差异结合所述自适应学习率α2对特征层参数进行二次更新;
大约所述迭代次数达到最优迭代次数,所述CNN模型收敛到最佳,保存所述模型参数,并检测目标领域测试集,从而得到所述目标领域中谷物质量的检测精度。
进一步地,所述分类损失与所述类别分布差异分别结合所述自适应学习率α1更新所述模型参数,包括:
Figure BDA0002360329200000022
其中,θ是所述模型参数,包含所述特征层参数θrepr与分类层参数θc,Lc是所述分类损失,Lcda是所述类别分布差异,且根据交叉熵函数计算所述分类损失与所述类别分布差异;
所述自适应学习率α1与损失变化呈正相关;将所述二次函数与损失结合得到G=E2,E为损失,代表所述分类损失或所述类别分布差异或域分类损失,通过对所述二次函数求导得到所述自适应学习率α1=2Eα;所述CNN模型训练后期,所述损失趋于0,所述自适应学习率α1也趋于0,为保证所述CNN模型后期的收敛速度,提出改进方法:
Figure BDA0002360329200000023
进一步地,所述通过所述域分布差异结合所述自适应学习率α2对所述特征层参数进行二次更新,并将正态分布模型引入所述域分布差异,结合所述自适应学习率α2采用梯度上升法寻优,包括:
Figure BDA0002360329200000024
其中,σ为正态分布模型参数,θrepr为所述特征层参数;所述自适应学习率α2与所述权值变化呈正相关:
Figure BDA0002360329200000025
其中,权值为
Figure BDA0002360329200000031
Lmda为所述域分布差异,通过在所述特征层后加入额外的域分类器得到;将所述自适应学习率α2的值带入所述域分布差异的优化公式中为:
Figure BDA0002360329200000032
为保证所述CNN模型后期的收敛速度,提出改进方法:
Figure BDA0002360329200000033
进一步地,所述根据交叉熵函数计算所述分类损失与所述类别分布差异,包括计算:
Figure BDA0002360329200000034
Figure BDA0002360329200000035
其中,D'是所述源领域训练集与所述目标领域训练集的样本总数,h是样本序数,
Figure BDA0002360329200000036
为预测标签,Yh为输入样本的真实标签;k是类序数,
Figure BDA0002360329200000037
是所述源领域的类别分布,
Figure BDA0002360329200000038
是所述目标领域的类别分布;根据Softmax函数计算得到所述源领域的类别分布与所述目标领域的类别分布。
进一步地,所述根据Softmax函数计算得到所述源领域的类别分布与所述目标领域的类别分布,包括:
类别分布是领域中任一类别与所有类别相似的概率的集合,通过在分类层后接入所述Softmax函数计算,且引入放大因子τ使差异较大的类别占有一定的比列分配;所述源领域的类别分布
Figure BDA0002360329200000039
为:
Figure BDA00023603292000000310
所述目标领域的类别分布
Figure BDA00023603292000000311
为:
Figure BDA00023603292000000312
其中,LS为所述源领域的样本标签,XS为所述源领域样本,
Figure BDA00023603292000000313
为所述源领域中第k类别的第m个样本的类别分布;LT为所述目标领域的样本标签,XT为所述目标领域样本,
Figure BDA00023603292000000314
为所述目标领域中所述第k类别的第n个样本的类别分布。
进一步地,所述通过在特征层后加入额外的域分类器得到所述域分布差异,包括:
所述域分类器是一个二分类器,分类函数是所述Softmax函数,并通过所述交叉熵函数计算域分类损失Ldc
Figure BDA0002360329200000041
其中,d代表领域的集合,且源领域与目标领域的差异是由环境因素的改变引起的;Yd是真实领域,
Figure BDA0002360329200000042
是预测领域,θdc是域分类器参数;
通过所述域分类器得到所述领域分布差异为:
Figure BDA0002360329200000043
其中,
Figure BDA0002360329200000044
是均匀分布标签,
Figure BDA0002360329200000045
是预测标签,X'是所述源领域样本与所述目标领域训练集的集合。
进一步地,所述源领域与目标领域的差异是由环境因素的改变引起的,包括:所述源领域选择光照均匀的黑色背景,所述目标领域选择光照不均匀的白色背景。
本申请的有益技术效果是:
本申请公开了一种基于迁移学习与自适应深度卷积神经网络的谷物质量检测方法,该方法采集源领域以及目标领域下的谷物样本图像,其中包括合格谷物的样本图像与带有缺陷的谷物样本图像,选择深度卷积神经网络CNN模型识别缺陷,利用源领域训练好的模型参数初始化CNN模型,并引入迁移学习算法利用源领域样本辅助目标领域样本完成目标领域下谷物的质量检测。在训练过程中提出自适应学习率,并引入二次函数与正态分布模型分别采取梯度下降与梯度上升的方式更新模型参数,优化模型损失。该方法能够提高CNN模型的训练性能,自适应领域的变化,极大程度的提高谷物质量检测的准确性。
附图说明
图1是本申请公开的基于迁移学习与自适应深度卷积神经网络的谷物质量检测方法的流程图。
图2是引入迁移学习算法的卷积神经网络CNN模型的结构图。
图3是计算领域样本的类别分布示意图。
图4是引入迁移学习的自适应CNN模型的反向传播示意图。
具体实施方式
下面结合具体附图和实施例对本发明作进一步说明。
本申请公开了一种基于迁移学习与自适应深度卷积神经网络的谷物质量检测方法,该方法包括如下步骤,请参考图1示出的流程图:
步骤S1:搭建图像采集系统用于采集不同领域下的样本,选择光照均匀的黑色背景作为源领域,并采集M个源领域样本{XS,YS};选择光照不均匀的白色背景作为目标领域,并采集N个目标领域样本{XT,YT},两个领域的样本均包括合格样本与缺陷样本,M和N都为正整数,且M>N。对所有样本图像进行分割并统一尺寸,具体方法可以参考现有的方法,本申请不再赘述。将源领域样本与目标领域样本按照相同的比例各分为训练集与测试集。
步骤S2:采用深度卷积神经网络CNN模型识别样本,并用源领域样本训练好的参数初始化CNN模型。源领域训练集与目标领域训练集作为CNN模型的输入,并在特征层和分类层后分别引入迁移学习算法,如图2所示,计算两领域的分布差异,即域分布差异与类别分布差异,并通过反向传播算法优化分布差异与分类损失,完成领域迁移,实现谷物的质量检测。
(1)CNN模型的分类损失为:
Figure BDA0002360329200000051
其中,D'=M+N,θrepr为特征层参数,f(·)为特征层的激活函数;θc为分类层参数,分类函数为Softmax,
Figure BDA0002360329200000052
为预测标签,Yh为输入样本的真实标签。
(2)在CNN模型的特征层后加入额外的域分类器用于评估域分布差异,且域分类器是一个二分类器,分类参数为θdc,分类函数为Softmax函数。源领域样本与目标领域训练集通过特征层参数θrepr被映射为特征表示,将特征表示输入域分类器,并通过交叉熵函数计算域分类损失Ldc
Figure BDA0002360329200000053
其中,d为源领域或目标领域,Yd是真实领域,
Figure BDA0002360329200000054
是预测领域,X为XS或XT
通过域分类器计算两个领域的特征表示的差异得到域分布差异Lmda
Figure BDA0002360329200000055
其中,
Figure BDA0002360329200000056
是均匀分布标签,
Figure BDA0002360329200000057
是预测标签,X'是XS与XT的集合。Ldc最优意味着域分类器可以很容易的通过θdc将源领域与目标领域区分开,此时Lmda最大;Lmda最优意味着域分类器无法区分经θrepr映射后的两领域,此时Ldc最大。因此,参数θdc与θrepr需要分别优化,在Ldc中仅更新θdc,在Lmda中仅更新θrepr,保证在性能最好的域分类器中学习领域的不变性,即在性能最好的域分类器中也难以区分两个领域间的样本。
(3)在CNN模型分类层中的Softmax函数用于计算样本的类别分布信息,如图3所示。通过Softmax函数记录样本属于每个类别的概率,对第k类别中的所有样本对应的概率求均值,得到第k类别属于每一个类别的概率,即为第k类别的类别分布,类别分布即为领域中所有类的类别分布的集合。源领域类别分布
Figure BDA0002360329200000061
为:
Figure BDA0002360329200000062
目标领域的类别分布
Figure BDA0002360329200000063
为:
Figure BDA0002360329200000064
其中,
Figure BDA0002360329200000065
为源领域的样本标签,
Figure BDA0002360329200000066
为源领域中第k类别的第m个样本的类别分布。
Figure BDA0002360329200000067
为目标领域的样本标签,
Figure BDA0002360329200000068
为目标领域中第k类别的第n个样本的类别分布。
通过反向传播将源领域的类别分布迁移到目标领域,实现两个领域的类间对齐。其中将
Figure BDA0002360329200000069
调整为与
Figure BDA00023603292000000610
相同的尺寸大小,类别分布差异Lcda通过交叉熵函数计算:
Figure BDA00023603292000000611
步骤S3:如图4所示,在CNN模型训练过程中提出自适应学习率,得到自适应CNN模型。根据CNN模型的损失变化与权值变化分别提出自适应学习率α1与α2
(1)自适应学习率α1与损失变化呈正相关。将二次函数与损失结合得到G=E2,E为损失,代表所述分类损失或所述类别分布差异或所述域分类损失。通过对二次函数求导得到自适应学习率α1=2Eα。CNN模型训练后期的损失趋于0,自适应学习率α1也趋于0,为保证CNN模型后期的收敛速度,提出改进方法:
Figure BDA00023603292000000612
(2)自适应学习率α2与权值变化呈正相关,
Figure BDA00023603292000000613
其中
Figure BDA00023603292000000614
为权值。
步骤S4:基于迁移学习与自适应CNN模型的损失为:
Figure BDA00023603292000000615
其中μ=0.01,
Figure BDA00023603292000000616
分别表示域分布差异与类别分布差异对于CNN模型的重要程度。反向传播算法用于迭代更新模型参数,进而优化分布差异与分类损失。在每次迭代过程中,特征层参数θrepr与分类层参数θc通过自适应学习率α1进行更新后,θrepr再通过自适应学习率α2进行二次更新。
(1)结合自适应学习率α1采用梯度上升法优化分类损失与类别分布差异:
Figure BDA00023603292000000617
带入α1的值得:
Figure BDA0002360329200000071
其中,θ是模型参数,包含θrepr与θc
(2)优化域分布差异时仅更新θrepr,并引入正态分布模型得到:
Figure BDA0002360329200000072
求导得到:
Figure BDA0002360329200000073
由于正态分布模型存在最大值,因此在更新θrepr过程中需采用梯度上升法寻找最优解,结合自适应学习率α2优化Lmda为:
Figure BDA0002360329200000074
带入α2的值得:
Figure BDA0002360329200000075
θrepr的变化系数为:
Figure BDA0002360329200000076
由于CNN模型训练后期Lmda趋于0,变化系数也趋于0,为保证CNN模型后期的收敛速度,提出改进方法:
Figure BDA0002360329200000077
步骤S5:结合自适应学习率α1优化域分类损失Ldc,更新域分类器参数θdc
Figure BDA0002360329200000078
步骤S6:重复步骤S2到S5,大约迭代次数达到500时,模型收敛到最佳,保存模型参数。输入目标领域测试集,实现跨领域与跨任务的谷物质量检测。
以上所述的仅是本申请的优选实施方式,本发明不限于以上实施例。可以理解,本领域技术人员在不脱离本发明的精神和构思的前提下直接导出或联想到的其他改进和变化,均应认为包含在本发明的保护范围之内。

Claims (8)

1.一种基于迁移学习与自适应深度卷积神经网络的谷物质量检测方法,其特征在于,所述方法包括:
获取M个源领域样本与N个目标领域样本,其中均包括合格样本与缺陷样本;所述源领域样本与所述目标领域样本按照相同的比例各分为训练集与测试集,M和N都为正整数,且M>N;
采用深度卷积神经网络CNN模型识别样本,并用所述源领域样本训练好的参数初始化所述CNN模型;所述源领域训练集与所述目标领域训练集作为所述CNN模型的输入,并在所述CNN模型的结构中引入迁移学习算法,自适应调节两个领域的分布,计算两个领域的分布差异,即域分布差异与类别分布差异;
在反向传播过程中,根据所述CNN模型的损失变化与权值变化分别提出自适应学习率α1与α2,引入二次函数模型得到所述自适应学习率α1,并采用梯度下降法寻优,将正态分布模型引入所述域分布差异,并结合所述自适应学习率α2采用梯度上升法寻优;
通过所述反向传播迭代更新模型参数,进而优化所述分布差异与分类损失;当迭代次数达最优时,保存所述模型参数,并输入所述目标领域测试集,得到所述目标领域中谷物质量检测的精度。
2.根据权利要求1所述的方法,其特征在于,所述通过所述反向传播迭代更新模型参数,进而优化所述分布差异与所述分类损失,包括:
所述CNN模型的损失包含所述分类损失、所述域分布差异与所述类别分布差异,并用μ与
Figure FDA0002360329190000012
分别表示所述域分布差异与所述类别分布差异对所述CNN模型的重要程度;
迭代次数小于最优迭代次数时,在每一次迭代过程中,所述分类损失与所述类别分布差异分别结合所述自适应学习率α1更新所述模型参数,所述域分布差异结合所述自适应学习率α2对特征层参数进行二次更新;
大约所述迭代次数达到最优迭代次数,所述CNN模型收敛到最佳,保存所述模型参数,并检测目标领域测试集,从而得到所述目标领域中谷物质量的检测精度。
3.根据权利要求2所述的方法,其特征在于,所述分类损失与所述类别分布差异分别结合所述自适应学习率α1更新所述模型参数,包括:
Figure FDA0002360329190000011
其中,θ是所述模型参数,包含所述特征层参数θrepr与分类层参数θc,Lc是所述分类损失,Lcda是所述类别分布差异,且根据交叉熵函数计算所述分类损失与所述类别分布差异;
所述自适应学习率α1与损失变化呈正相关;将所述二次函数与损失结合得到G=E2,E为损失,代表所述分类损失或所述类别分布差异或域分类损失(域分类损失见权利7),通过对所述二次函数求导得到所述自适应学习率α1=2Eα;所述CNN模型训练后期,所述损失趋于0,所述自适应学习率α1也趋于0,为保证所述CNN模型后期的收敛速度,提出改进方法:
Figure FDA0002360329190000021
4.根据权利要求1或2所述的方法,其特征在于,所述通过所述域分布差异结合所述自适应学习率α2对所述特征层参数进行二次更新,并将正态分布模型引入所述域分布差异,并结合所述自适应学习率α2采用梯度上升法寻优,包括:
Figure FDA0002360329190000022
其中,σ为正态分布模型参数,θrepr为所述特征层参数;所述自适应学习率α2与所述权值变化呈正相关:
Figure FDA0002360329190000023
其中,权值为
Figure FDA0002360329190000024
Lmda为所述域分布差异,通过在所述特征层后加入额外的域分类器得到;将所述自适应学习率α2的值带入所述域分布差异的优化公式中为:
Figure FDA0002360329190000025
为保证所述CNN模型后期的收敛速度,提出改进方法:
Figure FDA0002360329190000026
5.根据权利要求3所述的方法,其特征在于,所述根据交叉熵函数计算所述分类损失与所述类别分布差异,包括计算:
Figure FDA0002360329190000027
Figure FDA0002360329190000028
其中,D'是所述源领域训练集与所述目标领域训练集的样本总数,h是样本序数,
Figure FDA0002360329190000029
为预测标签,Yh为输入样本的真实标签;k是类序数,
Figure FDA00023603291900000210
是所述源领域的类别分布,
Figure FDA00023603291900000211
是所述目标领域的类别分布;根据Softmax函数计算得到所述源领域的类别分布与所述目标领域的类别分布。
6.根据权利要求5所述的方法,其特征在于,所述根据Softmax函数计算得到所述源领域的类别分布与所述目标领域的类别分布,包括:
类别分布是领域中任一类别与所有类别相似的概率的集合,通过分类层中的所述Softmax函数计算,且引入放大因子τ使差异较大的类别占有一定的比列分配;所述源领域的类别分布
Figure FDA0002360329190000031
为:
Figure FDA0002360329190000032
所述目标领域的类别分布
Figure FDA0002360329190000033
为:
Figure FDA0002360329190000034
其中,LS为所述源领域的样本标签,XS为所述源领域样本,
Figure FDA0002360329190000035
为所述源领域中第k类别的第m个样本的类别分布;LT为所述目标领域的样本标签,XT为所述目标领域样本,
Figure FDA0002360329190000036
为所述目标领域中所述第k类别的第n个样本的类别分布。
7.根据权利要求4所述的方法,其特征在于,所述通过在特征层后加入额外的域分类器得到所述域分布差异,包括:
所述域分类器是一个二分类器,分类函数是所述Softmax函数,并通过所述交叉熵函数计算域分类损失Ldc
Figure FDA0002360329190000037
其中,d代表领域的集合,源领域与目标领域的差异是由环境因素的改变引起的;Yd是真实领域,
Figure FDA0002360329190000038
是预测领域,θdc是域分类器参数;
通过所述域分类器得到所述域分布差异为:
Figure FDA0002360329190000039
其中,
Figure FDA00023603291900000310
是均匀分布标签,
Figure FDA00023603291900000311
是预测标签,X'是所述源领域训练集与所述目标领域训练集的集合。
8.根据权利要求7所述的方法,其特征在于,所述源领域与目标领域的差异是由环境因素的改变引起的,包括:所述源领域选择光照均匀的黑色背景,所述目标领域选择光照不均匀的白色背景。
CN202010019933.0A 2020-01-09 2020-01-09 基于迁移学习与自适应深度卷积神经网络的谷物质量检测方法 Active CN111239137B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010019933.0A CN111239137B (zh) 2020-01-09 2020-01-09 基于迁移学习与自适应深度卷积神经网络的谷物质量检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010019933.0A CN111239137B (zh) 2020-01-09 2020-01-09 基于迁移学习与自适应深度卷积神经网络的谷物质量检测方法

Publications (2)

Publication Number Publication Date
CN111239137A true CN111239137A (zh) 2020-06-05
CN111239137B CN111239137B (zh) 2021-09-10

Family

ID=70865627

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010019933.0A Active CN111239137B (zh) 2020-01-09 2020-01-09 基于迁移学习与自适应深度卷积神经网络的谷物质量检测方法

Country Status (1)

Country Link
CN (1) CN111239137B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112132257A (zh) * 2020-08-17 2020-12-25 河北大学 基于金字塔池化及长期记忆结构的神经网络模型训练方法
TWI749731B (zh) * 2020-08-25 2021-12-11 和碩聯合科技股份有限公司 用於評估識別模型的效能的方法和電子裝置
CN116825283A (zh) * 2023-04-27 2023-09-29 清华大学 基于迁移学习的核医学治疗个体化剂量评估方法及装置
CN117238458A (zh) * 2023-09-14 2023-12-15 广东省第二人民医院(广东省卫生应急医院) 基于云计算的重症护理跨机构协同平台系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5631469A (en) * 1996-04-15 1997-05-20 The United States Of America As Represented By The Secretary Of The Army Neural network computing system for pattern recognition of thermoluminescence signature spectra and chemical defense
US20180314944A1 (en) * 2016-10-14 2018-11-01 Tencent Technology (Shenzhen) Company Limited Data processing method and apparatus
CN109034205A (zh) * 2018-06-29 2018-12-18 西安交通大学 基于直推式半监督深度学习的图像分类方法
CN109284662A (zh) * 2018-07-12 2019-01-29 哈尔滨工程大学 一种面向水下声音信号分类的迁移学习方法
CN109902798A (zh) * 2018-05-31 2019-06-18 华为技术有限公司 深度神经网络的训练方法和装置
CN110111297A (zh) * 2019-03-15 2019-08-09 浙江大学 一种基于迁移学习的注塑制品表面图像缺陷识别方法
CN110443372A (zh) * 2019-07-11 2019-11-12 南京邮电大学 一种基于熵最小化的迁移学习方法及系统
CN110580496A (zh) * 2019-07-11 2019-12-17 南京邮电大学 一种基于熵最小化的深度迁移学习系统及方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5631469A (en) * 1996-04-15 1997-05-20 The United States Of America As Represented By The Secretary Of The Army Neural network computing system for pattern recognition of thermoluminescence signature spectra and chemical defense
US20180314944A1 (en) * 2016-10-14 2018-11-01 Tencent Technology (Shenzhen) Company Limited Data processing method and apparatus
CN109902798A (zh) * 2018-05-31 2019-06-18 华为技术有限公司 深度神经网络的训练方法和装置
CN109034205A (zh) * 2018-06-29 2018-12-18 西安交通大学 基于直推式半监督深度学习的图像分类方法
CN109284662A (zh) * 2018-07-12 2019-01-29 哈尔滨工程大学 一种面向水下声音信号分类的迁移学习方法
CN110111297A (zh) * 2019-03-15 2019-08-09 浙江大学 一种基于迁移学习的注塑制品表面图像缺陷识别方法
CN110443372A (zh) * 2019-07-11 2019-11-12 南京邮电大学 一种基于熵最小化的迁移学习方法及系统
CN110580496A (zh) * 2019-07-11 2019-12-17 南京邮电大学 一种基于熵最小化的深度迁移学习系统及方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ALI MOHAMMAD ALQUDAH等: "Segmented and Non-Segmented Skin Lesions Classification Using Transfer Learning and Adaptive Moment Learning Rate Technique Using Pretrained Convolutional Neural Network", 《JOURNAL OF BIOMIMETICS, BIOMATERIALS AND BIOMEDICAL ENGINEERING》 *
金海东等: "一种带自适应学习率的综合随机梯度下降Q-学习方法", 《计算机学报》 *
龙满生等: "基于卷积神经网络与迁移学习的油茶病害图像识别", 《农业工程学报》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112132257A (zh) * 2020-08-17 2020-12-25 河北大学 基于金字塔池化及长期记忆结构的神经网络模型训练方法
TWI749731B (zh) * 2020-08-25 2021-12-11 和碩聯合科技股份有限公司 用於評估識別模型的效能的方法和電子裝置
CN116825283A (zh) * 2023-04-27 2023-09-29 清华大学 基于迁移学习的核医学治疗个体化剂量评估方法及装置
CN117238458A (zh) * 2023-09-14 2023-12-15 广东省第二人民医院(广东省卫生应急医院) 基于云计算的重症护理跨机构协同平台系统
CN117238458B (zh) * 2023-09-14 2024-04-05 广东省第二人民医院(广东省卫生应急医院) 基于云计算的重症护理跨机构协同平台系统

Also Published As

Publication number Publication date
CN111239137B (zh) 2021-09-10

Similar Documents

Publication Publication Date Title
CN111239137B (zh) 基于迁移学习与自适应深度卷积神经网络的谷物质量检测方法
CN111191732B (zh) 一种基于全自动学习的目标检测方法
CN109949317B (zh) 基于逐步对抗学习的半监督图像实例分割方法
CN110705601A (zh) 基于单阶段目标检测的变电站设备渗漏油图像识别方法
CN110580496A (zh) 一种基于熵最小化的深度迁移学习系统及方法
CN114241282A (zh) 一种基于知识蒸馏的边缘设备场景识别方法及装置
CN110717526A (zh) 一种基于图卷积网络的无监督迁移学习方法
CN111882055B (zh) 一种基于CycleGAN与伪标签的目标检测自适应模型的构建方法
CN108875933B (zh) 一种无监督稀疏参数学习的超限学习机分类方法及系统
CN111079847A (zh) 一种基于深度学习的遥感影像自动标注方法
CN111861909B (zh) 一种网络细粒度图像分类方法
CN110648310A (zh) 基于注意力机制的弱监督铸件缺陷识别方法
CN109284779A (zh) 基于深度全卷积网络的物体检测方法
CN113837238A (zh) 一种基于自监督和自蒸馏的长尾图像识别方法
CN111598167B (zh) 基于图学习的小样本图像识别方法及系统
CN111967325A (zh) 一种基于增量优化的无监督跨域行人重识别方法
CN112115993A (zh) 一种基于元学习的零样本和小样本证件照异常检测方法
CN115797694A (zh) 基于多尺度孪生神经网络的显示面板微缺陷分类方法
CN114357221B (zh) 一种基于图像分类的自监督主动学习方法
CN116258990A (zh) 一种基于跨模态亲和力的小样本参考视频目标分割方法
CN114925762A (zh) 一种基于子空间学习和跨域自适应极限学习机的气体传感器漂移补偿方法
CN113313179B (zh) 一种基于l2p范数鲁棒最小二乘法的噪声图像分类方法
CN116910571B (zh) 一种基于原型对比学习的开集域适应方法及系统
CN117152427A (zh) 基于扩散模型和知识蒸馏的遥感图像语义分割方法与系统
CN115861239A (zh) 一种基于元学习的小样本工业零件表面缺陷检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant