CN113537306A - 一种基于渐进式成长元学习的图像分类方法 - Google Patents

一种基于渐进式成长元学习的图像分类方法 Download PDF

Info

Publication number
CN113537306A
CN113537306A CN202110727066.0A CN202110727066A CN113537306A CN 113537306 A CN113537306 A CN 113537306A CN 202110727066 A CN202110727066 A CN 202110727066A CN 113537306 A CN113537306 A CN 113537306A
Authority
CN
China
Prior art keywords
image
model
image classification
features
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110727066.0A
Other languages
English (en)
Inventor
杜刚
周小林
张永刚
姜晓媛
邹卓
郑立荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fudan University
Original Assignee
Fudan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fudan University filed Critical Fudan University
Priority to CN202110727066.0A priority Critical patent/CN113537306A/zh
Publication of CN113537306A publication Critical patent/CN113537306A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2431Multiple classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明属于计算机视觉图像识别技术领域,具体为一种基于渐进式成长元学习的图像分类方法。本发明方法包括:设计渐进式成长元学习图像分类模型,用于提取图像特征和图像分类;图像分类模型的核心功能模块是卷积神经网络;在输入端对图像进行预处理,使样本满足模型输入条件,包括构建元任务;将得到的样本训练构建的图像分类模型,并进行特征提取,然后进行分类识别;仿真结果表明,渐进式成长元学习模型能克服样本数据不足,具有强大的泛化能力,能快速适应并识别新的图像类别。

Description

一种基于渐进式成长元学习的图像分类方法
技术领域
本发明属于计算机视觉图像识别技术领域,具体涉及一种基于渐进式成长元学习的图像分类方法。
背景技术
图像分类是目前研究的热点,其在许多领域都有广泛的应用。近年来深度学习以及在图像分类领域取得较大进展。深度学习需要强大的硬件计算能力、大量的训练数据和较深的网络层数提取数据,这既是它发挥优势的关键所在,同时又是限制它使用范围的因素。实际情况中难以获取足够多的数据样本来训练深度学习模型,大量的计算又会增加时间成本以及深度学习模型不具有良好的泛化能力来快速适应新类别的分类,这些都是急需解决的难题。
元学习算法具有强大的泛化能力,能够利用有限的先验知识,实现在新任务上的快速泛化。本发明将元学习算法应用于图像分类,可以训练数据样本少,耗时长,泛化能力差等问题。仿真结果表明,该方法与装置在图像分类中取得较好效果,并且具有强大的泛化能力,能快速适应并识别新的图像类别。
发明内容
本发明的目的在于提出一种网络识别效率高、计算速度快的基于渐进式成长元学习的图像分类方法。
本发明提供的基于渐进式成长元学习的图像分类方法,具体步骤如下。
S1、设计渐进式成长元学习图像分类模型,用于提取图像特征和图像分类;
这里,设计的图像分类模型是基于渐进式成长元学习的,其核心功能模块是卷积神经网络CNN,用来对图像进行特征提取;所述卷积神经网络CNN由四个完全相同卷积模块级连构成且参数设置完全相同,每个卷积模块有三层,第一层是卷积层,卷积核数为64,卷积核尺寸为3×3,步长为1,第二层是批量归一化层,用来归一化数据以便于处理,并用Relu激活函数处理归一化后的数据,第三层是池化层,采用最大池化,池化窗口尺寸为2×2,步长为2,在第一个卷积模块完成特征提取后,将特征传递至第二个卷积模块,依次类推至第四层完成最终特征提取并利用Flatten层对特征进行维度转换;采用adam优化器,用来最小化交叉熵损失函数。
S2、在输入端对图像进行预处理,使样本满足模型输入条件;包括以下子步骤:
S21、首先将数据集化分为训练集和测试集,二者图像类别互斥;再将训练集和测试集都进行数据划分,分为支持集和查询集,支持集与查询集图像类别相同,但同类别的图像样本互斥;
S22、构建元任务,在支持集中随机抽取N个类别,在这N个类别中再随机抽取K个样本;同理,在查询集的对应N个类别中各随机抽取1个样本,组合起来构成一个元任务;训练集与测试集按照这种方式进行元任务构建,进一步随机从这些元任务中抽取一定数量M个元任务构建元批次,用于训练模型,为了体现元学习能利用少量数据实现快速分类的特点,N,和K的选取值一般较小例如N=5,k=1,同时为了体现元学习泛化能力强的特点,M的选取一般较大,例如M=32。
S3、将步骤S2得到的样本训练步骤S1中构建的图像分类模型,并进行特征提取,然后进行分类识别;
本发明构建的渐进式成长元学习图像分类模型,随着训练轮次epoch的增加,元批次的数目NB 也增加,NB= 10*epoch,可以较大提升模型训练速度;
在训练过程中,采用卷积神经网络CNN作为特征提取模块,从支持集样本中提取特征,该特征代表类别特征,同时该特征提取模块从查询集样本中提取特征;然后计算查询集特征与类别特征的距离,再经过模型的分类层softmax,由计算公式:
Figure 100002_DEST_PATH_IMAGE002
计算出样本属于各类别的概率分布,依据最大概率判断查询样本类别归属;
选用交叉熵损失函数,采用adam优化器最小化损失函数,更新卷积神经网络参数,每轮训练完成后,用测试集测试网络性能并进行微调。
仿真结果表明,渐进式成长元学习模型能克服样本数据不足,具有强大的泛化能力,能快速适应并识别新的图像类别。
本发明还提供一种基于上述图像分类方法的图像分类装置,包括以下模块:
图像预处理模块,用于将数据图像转换为满足模型输入条件的图像样本;
图像分类模块,用于对预处理后的图像样本进行特征提取,进行图像分类。
进一步地,图像预处理模块包括以下子模块:
图像划分子模块,用于对输入图像数据集进行元任务划分,构建元批次;
图像处理子模块,用于对构建好的图像数据进行尺寸转换,满足模型输入条件。
进一步地,图像分类模块包括以下子模块:
图像特征提取子模块,用于提取图像的特征向量;
图像类别判断子模块,用于计算待识别图像特征的类别概率分布并进行类别归属判断。
本发明优点:
(1)基于渐进式成长元学习的信号调制模式识别方法与装置能减少网络训练时间,提升网络识别效率;
(2)基于渐进式成长元学习的信号调制模式识别方法与装置能克服水下光通信复杂多变的通信环境与衰减,具有较强的抗干扰能力;
(3)渐进式成长元学习的信号调制模式识别方法与装置,能克服数据样本少,失真大的等问题,具有强大的泛化能力,能快速识别新的调制模式方式。
附图说明
图1是实施例中一种基于渐进式成长元学习的图像分类方法流程图示。
图2是实施例中一种渐进式成长元学习算法训练流程图示。
具体实施方式
下面结合附图和具体实施例进一步说明本发明的技术方案。
如图1所示,本发明提出的基于渐进式成长元学习的图像分类方法,包括步骤如下。
S1、设计并训练渐进式成长元学习图像分类模型用于提取图像特征和图像分类;
S11、本发明设计的元学习分类模型是基于渐进式成长元学习,其核心功能模块是卷积神经网络,用来对图像进行特征提取,卷积神经网络的设计属于本领域的惯用技术,,本实施例在一个NVIDAGeForce GTX1060GPU的平台上,进行网络的训练和验证。网络体系结构的实现依赖于Torch.nn,以Pytorch1.2.0和Python3.6.4作为后端;
S12、本实施例所用的卷积神经网络CNN由四个完全相同卷积模块级连构成且参数设置完全相同,每个卷积模块有三层,第一层是卷积层,卷积核数为64,卷积核尺寸为3×3,步长为1,第二层是批量归一化层,用来归一化数据以便于处理,并用Relu激活函数处理归一化后的数据,第三层是池化层,采用最大池化,池化窗口尺寸为2×2,步长为2,在第一个卷积模块完成特征提取后,将特征传递至第二个卷积模块,依次类推至第四层完成最终特征提取并利用Flatten层对特征进行维度转换,模型训练中采用adam优化器,用来最小化交叉熵损失函数。
S2、本实施例中选取星座图进行模式识别图像分类,用MATLABR2018b来模拟水下光无线通信系统,生成星座图样本来构建我们的数据集,在本发明系统中,生成了15种调制模式方式样本,包括M-ary QAM (M= 2n, n= 2, 3,. . . , 8), M-ary ASK (M= 2n, n=1, 2, 3), M-ary PSK (M= 2n, n= 2, 3, 4, 5)和BPSK,这些即为构建的数据集,在输入端对图像进行预处理,使样本满足模型输入条件;
S21、首先将数据集化分为训练集和测试集,二者图像类别互斥,再将训练集和测试集都进行数据划分为支持集和查询集,支持集与查询集图像类别相同但同类别的图像样本互斥;
S22、构建元任务,在支持集中随机抽取2个类别,在这2个类别中再随机抽取1个样本,同理在查询集的对应2个类别中各随机抽取1个样本,组合起来构成一个元任务。训练集与测试集按照这种方式进行元任务构建,进一步随机从这些元任务中抽取一定数量32个元任务构建元批次,用于训练模型。
S3、将步骤S2得到的样本进行特征提取,并进行分类识别;
S31、如图2所示,本发明提出渐进式成长元学习模型,即随着训练轮次epoch的增加,从而增加元批次的数目NB = 10*epoch,设定最大epoch =13,可以较大提升模型训练速度;
S32、在训练过程中,支持集样本被特征提取模块提取特征,该特征用于代表类别特征,查询集样本特征被同一特征提取模块提取,通过计算查询集特征与类别特征的距离,再经过模型的分类层softmax,计算公式:
Figure DEST_PATH_IMAGE004
计算出样本属于各类别的概率分布,依据最大概率判断查询样本类别归属;
S33、选用交叉熵损失函数,adam优化器最小化损失函数,更新网络参数,每轮训练完成后,用测试集测试网络性能并进行微调;
S34、仿真结果表明,渐进式成长元学习模型能克服样本数据不足,具有强大的泛化能力,能快速适应并识别新的图像类别。
一种基于渐进式成长元学习的图像分类装置,包括以下模块:
图像预处理模块,用于将数据图像转换为满足模型输入条件的图像样本;
图像预处理模块包括以下子模块:
图像划分模块,用于对输入图像数据集进行元任务划分,构建元批次;
图像处理模块,用于对构建好的图像数据进行尺寸转换,满足模型输入条件;
图像分类模块,用于对预处理后的图像样本进行特征提取,进行图像分类;
图像分类模块包括以下子模块:
图像特征提取模块,用于提取图像的特征向量;
图像类别判断模块,用于计算待识别图像特征的类别概率分布并进行类别归属判断。
以上所述地实施例仅是为了更好地阐述本发明提出地方法与装置,从而帮助读者更好地理解本发明原理,该实施例以及参数设置应被理解为本发明地保护范围并不局限于这样地特例称述和实施例。本领域的技术工作人员可以根据本发明公开的以上技术做出其它各种不脱离本发明实质范围的其它各种具体变形与组合,这些变形与组合仍然属于本发明的保护范围之内。

Claims (3)

1.一种基于渐进式成长元学习的图像分类方法,其特征在于,具体步骤如下:
S1、设计渐进式成长元学习图像分类模型,用于提取图像特征和图像分类;
这里,设计的图像分类模型的核心功能模块是卷积神经网络,所述卷积神经网络CNN由四个完全相同卷积模块级连构成且参数设置完全相同,每个卷积模块有三层,第一层是卷积层,卷积核数为64,卷积核尺寸为3×3,步长为1,第二层是批量归一化层,用来归一化数据以便于处理,并用Relu激活函数处理归一化后的数据,第三层是池化层,采用最大池化,池化窗口尺寸为2×2,步长为2,在第一个卷积模块完成特征提取后,将特征传递至第二个卷积模块,依次类推至第四层完成最终特征提取并利用Flatten层对特征进行维度转换;采用adam优化器,用来最小化交叉熵损失函数;
S2、在输入端对图像进行预处理,使样本满足模型输入条件;包括以下子步骤:
S21、首先将数据集化分为训练集和测试集,二者图像类别互斥;再将训练集和测试集都进行数据划分,分为支持集和查询集,支持集与查询集图像类别相同,但同类别的图像样本互斥;
S22、构建元任务,在支持集中随机抽取N个类别,在这N个类别中再随机抽取K个样本;同理,在查询集的对应N个类别中各随机抽取1个样本,组合起来构成一个元任务;训练集与测试集按照这种方式进行元任务构建,进一步随机从这些元任务中抽取一定数量M个元任务构建元批次,用于训练模型;
S3、将步骤S2得到的样本训练步骤S1中构建的图像分类模型,并进行特征提取,然后进行分类识别;
在训练过程中,采用卷积神经网络CNN作为特征提取模块,从支持集样本中提取特征,该特征代表类别特征,同时该特征提取模块从查询集样本中提取特征;然后计算查询集特征与类别特征的距离,再经过模型的分类层softmax,由计算公式:
Figure DEST_PATH_IMAGE002
计算出样本属于各类别的概率分布,依据最大概率判断查询样本类别归属;
选用交叉熵损失函数,采用adam优化器最小化损失函数,更新卷积神经网络参数,每轮训练完成后,用测试集测试网络性能并进行微调。
2.基于权利要求1所述图像分类方法的图像分类装置,其特征在于,包括以下模块:
图像预处理模块,用于将数据图像转换为满足模型输入条件的图像样本;
图像分类模块,用于对预处理后的图像样本进行特征提取,进行图像分类。
3.基于权利要求2所述图像分类方法的图像分类装置,其特征在于,
所述图像预处理模块包括以下子模块:
图像划分子模块,用于对输入图像数据集进行元任务划分,构建元批次;
图像处理子模块,用于对构建好的图像数据进行尺寸转换,满足模型输入条件;
所述图像分类模块包括以下子模块:
图像特征提取子模块,用于提取图像的特征向量;
图像类别判断子模块,用于计算待识别图像特征的类别概率分布并进行类别归属判断。
CN202110727066.0A 2021-06-29 2021-06-29 一种基于渐进式成长元学习的图像分类方法 Pending CN113537306A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110727066.0A CN113537306A (zh) 2021-06-29 2021-06-29 一种基于渐进式成长元学习的图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110727066.0A CN113537306A (zh) 2021-06-29 2021-06-29 一种基于渐进式成长元学习的图像分类方法

Publications (1)

Publication Number Publication Date
CN113537306A true CN113537306A (zh) 2021-10-22

Family

ID=78097112

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110727066.0A Pending CN113537306A (zh) 2021-06-29 2021-06-29 一种基于渐进式成长元学习的图像分类方法

Country Status (1)

Country Link
CN (1) CN113537306A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114157539A (zh) * 2022-02-10 2022-03-08 南京航空航天大学 一种数据知识双驱动的调制智能识别方法
CN115281662A (zh) * 2022-09-26 2022-11-04 北京科技大学 一种慢性踝关节不稳智能辅助诊断系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110182497A1 (en) * 2010-01-22 2011-07-28 Aricent Inc. Cascade structure for classifying objects in an image
US20120169863A1 (en) * 2010-12-29 2012-07-05 Ido Bachelet Apparatus and method for automatic detection of pathogens
CN106682602A (zh) * 2016-12-16 2017-05-17 深圳市华尊科技股份有限公司 一种驾驶员行为识别方法及终端
CN106709511A (zh) * 2016-12-08 2017-05-24 华中师范大学 基于深度学习的城市轨道交通全景监控视频故障检测方法
CN110276394A (zh) * 2019-06-21 2019-09-24 扬州大学 一种小样本下基于深度学习的电力设备分类方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110182497A1 (en) * 2010-01-22 2011-07-28 Aricent Inc. Cascade structure for classifying objects in an image
US20120169863A1 (en) * 2010-12-29 2012-07-05 Ido Bachelet Apparatus and method for automatic detection of pathogens
CN106709511A (zh) * 2016-12-08 2017-05-24 华中师范大学 基于深度学习的城市轨道交通全景监控视频故障检测方法
CN106682602A (zh) * 2016-12-16 2017-05-17 深圳市华尊科技股份有限公司 一种驾驶员行为识别方法及终端
CN110276394A (zh) * 2019-06-21 2019-09-24 扬州大学 一种小样本下基于深度学习的电力设备分类方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114157539A (zh) * 2022-02-10 2022-03-08 南京航空航天大学 一种数据知识双驱动的调制智能识别方法
US11700156B1 (en) 2022-02-10 2023-07-11 Nanjing University Of Aeronautics And Astronautics Intelligent data and knowledge-driven method for modulation recognition
CN115281662A (zh) * 2022-09-26 2022-11-04 北京科技大学 一种慢性踝关节不稳智能辅助诊断系统
CN115281662B (zh) * 2022-09-26 2023-01-17 北京科技大学 一种慢性踝关节不稳智能辅助诊断系统

Similar Documents

Publication Publication Date Title
Suganuma et al. Attention-based adaptive selection of operations for image restoration in the presence of unknown combined distortions
CN111126386B (zh) 场景文本识别中基于对抗学习的序列领域适应方法
CN109035149B (zh) 一种基于深度学习的车牌图像去运动模糊方法
CN108665460B (zh) 基于组合神经网络和分类神经网络的图像质量评价方法
CN110232341B (zh) 基于卷积-堆叠降噪编码网络的半监督学习图像识别方法
CN108960141B (zh) 基于增强型深度卷积神经网络的行人再识别方法
CN111414942A (zh) 一种基于主动学习和卷积神经网络的遥感图像分类方法
CN111680702B (zh) 一种使用检测框实现弱监督图像显著性检测的方法
CN113537306A (zh) 一种基于渐进式成长元学习的图像分类方法
CN112750129B (zh) 一种基于特征增强位置注意力机制的图像语义分割模型
CN108520212A (zh) 基于改进的卷积神经网络的交通标志检测方法
CN109344856B (zh) 一种基于多层判别式特征学习的脱机签名鉴别方法
US11700156B1 (en) Intelligent data and knowledge-driven method for modulation recognition
CN111222442A (zh) 一种电磁信号分类方法和装置
CN108596044B (zh) 基于深度卷积神经网络的行人检测方法
CN112347910A (zh) 一种基于多模态深度学习的信号指纹识别方法
CN116152554A (zh) 基于知识引导的小样本图像识别系统
CN111353583A (zh) 基于群卷积特征拓扑空间的深度学习网络及其训练方法
CN114980122A (zh) 一种小样本射频指纹智能识别系统与方法
CN112990371B (zh) 一种基于特征扩增的无监督夜间图像分类方法
CN114743133A (zh) 一种轻量化的小样本视频分类识别方法及系统
CN111612803B (zh) 一种基于图像清晰度的车辆图像语义分割方法
CN116862779A (zh) 一种真实图像自监督去噪方法和系统
CN114821174B (zh) 一种基于内容感知的输电线路航拍图像数据清洗方法
CN116304836A (zh) 一种基于领域知识引导的少样本半监督轴承故障诊断方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20211022