CN114241267A - 基于结构熵采样的多目标架构搜索骨质疏松图像识别方法 - Google Patents

基于结构熵采样的多目标架构搜索骨质疏松图像识别方法 Download PDF

Info

Publication number
CN114241267A
CN114241267A CN202111570819.8A CN202111570819A CN114241267A CN 114241267 A CN114241267 A CN 114241267A CN 202111570819 A CN202111570819 A CN 202111570819A CN 114241267 A CN114241267 A CN 114241267A
Authority
CN
China
Prior art keywords
population
neural network
network structure
generation
convolutional neural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111570819.8A
Other languages
English (en)
Inventor
邱剑锋
俞晓山
张兴义
王啟军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui University
Original Assignee
Anhui University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui University filed Critical Anhui University
Priority to CN202111570819.8A priority Critical patent/CN114241267A/zh
Publication of CN114241267A publication Critical patent/CN114241267A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于结构熵采样的多目标架构搜索骨质疏松图像识别方法,包括:1收集含骨密度信息的腰椎X光图像数据并进行预处理,划分为训练集和验证集;2初始化神经网络结构种群;3将种群中所有个体解码成对应的神经网络架构,并使用X光图片训练集对每个神经网络进行训练,将不同类别识别的准确率和神经网络的参数量作为适应度值;4根据个体的适应度值进行交配池选择、基于结构熵采样的交叉变异和环境选择;5重复上述过程进行启发式网络结构搜索,达到预设定条件结束进化,并输出最优的网络结构;6利用训练集重新训练所获得的最优网络结构。本发明能自动搜索适应腰椎X光图像数据集的卷积神经网络架构,实现对腰椎X光图像的分类。

Description

基于结构熵采样的多目标架构搜索骨质疏松图像识别方法
技术领域
本发明属于计算机/机器学习中的自动化机器学习和神经网络架构搜索领域,具体的说是一种基于结构熵采样的多目标架构搜索骨质疏松图像识别方法。
背景技术
医疗图像识别领域利用影像测试的形式,诸如X射线、超声波、CT和核磁共振,来辅助医生。目前随着深度学习的发展,卷积神经网络(CNNs)已经成为图像识别领域的主流技术,同时在医学图像的识别任务上时提供了巨大的诊断支持。因此,设计具有较优性能的神经网络结构能够极大提升医疗图像的识别准确率。
现有的神经架构搜索设计方法包括:基于人工设计的网络架构设计方法和自动化网络架构搜索方法(NAS);然而基于人工设计的网络架构设计方法往往需要大量的专业知识和实验时间,诸如线性结构模型VGGNet、残差结构模型ResNet、多分支结构模型GoogLeNet这些经典的卷积神经网络结构都是专业人员精心设计的。
自动化网络架构搜索方法(NAS)主要包含三种搜索策略:基于强化学习、基于梯度优化和基于进化算法。
基于强化学习的方法主要是利用强化学习作为优化算法,将卷积神经网络结构中的操作算子建模成序列输入到RNN中,作为强化学习不断学习优化的参数,最终搜索出优秀的算子结构以及对应的连接关系。这类方法的效果优于上述经典网络,但是由于搜索空间庞大,非常的耗时。
基于梯度优化的方法主要将网络结构建模成多维优化问题中的决策变量,然后使用梯度法来优化搜索空间中的参数,从而能够在搜索空间中连续的探索结构,而不是离散的搜索,这种方法更具有可解释性。
基于进化算法的方法主要将网络结构建模成种群个体,基于多目标进化算法进行启发式的探索,由于进化算法在多目标和全局优化上有着显著的优势,因此该方法往往能有很好的性能。
上述的网络结构搜索方法相比传统的人工设计网络具有优势,但是均非常的耗时并且容易忽略搜索空间中解的分布性。
发明内容
本发明为解决现有技术的不足之处,提供了一种基于结构熵采样的多目标架构搜索骨质疏松图像识别方法,以期望能够搜索出更加有效的神经网络结构用于骨质疏松图像的识别分类,从而提高分类准确性。
为解决上述技术问题,本发明采用的技术方案是:
本发明一种基于结构熵采样的多目标架构搜索骨质疏松图像识别方法的特点是按以下步骤进行:
步骤0、采集n张含有骨密度标签的腰椎X光图像并进行预处理,得到数据集Dall,并划分为训练集Dtra和验证集Dvall,且腰椎X光图像共有I种类别;
步骤1、构建由NC个卷积块和RC个下采样块组成的卷积神经网络结构A;每个卷积块和下采样块的节点个数相同,并由m个节点构成,每个节点表示一种操作,所述操作的类型包括卷积操作、下采样操作、全连接操作以及通道注意力操作,节点之间存在连接用“1”表示,否则用“0”表示;所述卷积块中的所有操作的步长均为1,所述下采样块中所有操作的步长均为2;所述神经网络结构A由NC个卷积块和RC个下采样块依次堆叠而成;所述神经网络结构A的稠密度由所有节点连接关系中“1”的个数表示;
步骤2、初始化所述神经网络结构的种群Pt并进行迭代进化,获得最优网络结构Abest
步骤2.0、参数定义,包括:初始种群大小为N,候选子代种群大小为M,总的进化迭代次数为T,当前迭代次数为t,每个结构训练的最大次数为Emax,交叉概率为a,变异概率为b,种群所有个体稠密度的划分间隔为α;
步骤2.1、初始化t=1;随机初始化卷积神经网络结构的第t代种群Pt,所述第t代种群Pt由N个卷积网络结构的编码组成,其中任意一个卷积网络结构A所对应的编码记为E,所述编码E是
Figure BDA0003423634130000021
位的二进制编码,其中,m表示所述卷积神经网络结构A中卷积块和下采样块中的节点个数;所述二进制编码包含卷积神经网络结构中层与层之间的连接关系以及节点的操作类型;
步骤2.2、将所述第t代种群Pt中的N个编码映射成卷积神经网络结构信息,从而完成解码操作,构建完整的卷积神经网络结构;
步骤2.3、训练所述完整的卷积神经网络结构,获取个体适应度值:
将所述训练集Dtra和验证集Dval分别进行水平翻转、角度旋转、高斯加噪的增广处理及像素归一化操作后,将处理后的训练集D’tra输入到所述完整的卷积神经网络结构中进行前向传播处理,并在反向传播处理中利用随机梯度下降算法对神经网络结构所对应的第t代种群Pt中每个解码后的神经结构进行迭代训练,同时使用交叉熵损失函数来更新迭代训练过程中卷积神经网络结构的权重参数,直至达到最大训练次数Emax为止,从而得到N个训练好的卷积神经网络结构;
将处理后的验证集D’val分别输入N个训练好的卷积神经网络结构中,得到验证集D’val的N个准确率并将其作为N个个体的适应度值F1,将训练好的卷积神经网络结构的参数量作为适应度值F2
步骤2.4、交配池选择:
在第t代种群Pt中每次有放回的随机抽取两个父代个体,并使用二进制锦标赛选择法将所述适应度值F1更大的个体保留,从而得到种群规模为N的第t代交配池Pt’;
步骤2.5、基于结构熵采样的个体交叉变异:
步骤2.5.1、依次从所述第t代交配池Pt’中随机抽取两个父代个体p1和p2,以交叉率a和变异率b分别进行编码的交叉操作和变异操作,从而得到两个子代个体o1和o2
步骤2.5.2、重复M/2次步骤2.5.1,从而得到种群规模为M的第t代候选子代种群Qt’;
步骤2.5.3、根据式(1)所示的结构熵公式计算第t代父代种群Pt的初始结构熵AE(Pt):
Figure BDA0003423634130000031
式(1)中,F′max和F′min表示当前种群所有个体中最大的稠密度值和最小的稠密度值,α表示当前种群所有个体稠密度值等分的间隔,Q表示根据所述个体稠密度等分间隔划分的区间数量,N表示种群的规模,
Figure BDA0003423634130000032
表示第t代种群的第j个区间,
Figure BDA0003423634130000033
表示第t代种群中的第j个区间中的个体数量占种群数量的比例;
步骤2.5.4、将所述第t代候选子代种群Qt’中的第k个个体qk加入第t代父代种群Pt构成混合种群P′t,再根据式(1)计算所述混合种群P′t的结构熵AE(P′t);
步骤2.5.5、计算所述初始结构熵AE(Pt)和混合种群P′t的结构熵AE(P′t)的差值,从而得到所述第k个个体qk的个体熵IE(qk),用于表示个体多样性的优劣;
步骤2.5.6、按照步骤2.5.3-步骤2.5.5计算候选子代种群Qt’中每个个体的个体熵并进行降序排序,选取前N个个体作为第t代子代种群Qt
步骤2.6、环境选择:
将第t代父代种群Pt和第t代子代种群Qt进行混合,得到种群规模为2N的第t代混合种群Mt;对第t代混合种群Mt中所有的个体基于双目标适应度值F1和F2进行非支配排序,得到第t代第j个个体在目标空间中对应的帕累托前沿面层索引Kj以及在对应前沿面上的拥挤度距离Dj;选择帕累托前沿面层索引更小且拥挤度距离更大的N个个体作为第t+1代种群Pt+1
步骤2.7、令t+1赋值给t后,判断t≤T是否成立,若成立,则重复步骤2.2到步骤2.7,否则执行步骤3;
步骤3、获取最佳神经网络结构个体:
基于N个个体的适应度值对第T代种群PT进行降序排序,并将适应度值F1最大的个体作为最优卷积神经网络结构Abest输出;
步骤4、对所述最优卷积神经网络结构Abest进行训练:
分别将所述处理后的训练集D’tra和验证集D’val输入到最优卷积神经网络结构Abest中,并利用随机梯度下降算法对所述最优卷积神经网络结构Abest进行训练,同时使用如式(2)所示的带权重的交叉熵损失函数
Figure BDA0003423634130000041
对训练迭代中最优卷积神经网络结构Abest的权重参数进行更新,直至达到总训练次数Emax为止,从而得到训练后的最佳卷积神经网络结构A’best并作为骨密度分类预测模型,用于实现X光图像的分类预测;
Figure BDA0003423634130000042
式(2)中,y表示输入样本的真实标签,
Figure BDA0003423634130000043
表示网络模型预测的标签,
Figure BDA0003423634130000044
表示网络结构预测的标签概率,Nc表示第c种类别图片的数量,Nsum表示所有图片的总数量。
与现有技术相比,本发明的有益效果在于:
1、本发明通过设计结构熵指标以衡量种群中每个个体(每个个体代表一个卷积神经网络结构)在搜索空间中的分布性,并且基于结构熵采样在迭代过程中不损失准确率的同时尽可能保持种群的多样性和分布性,使得算法在搜索过程能够更加高效的探索到搜索空间的多个潜在的最优神经网络结构,同时在搜索进化过程中同时考虑了模型准确率和网络结构复杂度两个目标,从而能够搜索到参数量小但是图像识别准确率高的神经网络。
2、本发明所搜索到的卷积神经网络结构能够在给定的骨质疏松数据集上更好地自适应学习图像特征,并且该方法搜索到的网络结构在参数量和准确率两个目标性能均表现优异;采用本发明所设计的方法可以搜索到的网络结构具有参数量小,并且能够在腰椎X光图像上获得较高骨质疏松分类准确率的优势。
3、本发明搜索到的网络结构冗余度低,参数量小,并且可以很方便的集成到现有的PACS系统中,实现对骨质疏松图像的准确分类。
附图说明
图1为本发明方法的流程图;
图2为本发明设计的卷积神经网络结构图。
具体实施方式
如图1所示,本实施例中,一种基于结构熵采样的多目标架构搜索骨质疏松图像识别方法,是按以下步骤进行:
步骤0、采集由n张含有骨密度标签的腰椎X光图像构成的数据集Dall,并进行预处理操作后得到训练集Dtra和验证集Dval,且腰椎X光图像分为骨量正常、骨量减少和骨量异常三种类别的标签;
步骤0.1、获取数量为n的X光图像,其中任意一张X光图像(h0,w0,c,l);其中h0,w0,c,l分别表示X光图像图初始的高度、宽度、通道深度和标签类别;
步骤0.2、将X光图像(h0,w0,c,l)输入到预处理函数R(h,w)中进行resize操作,即调整图片大小,得到预处理后的X光图像(h,w,c,l);其中,h和w分别表示图像resize操作后的高度和宽度;
步骤0.3、将n张X光图像输入到划分函数S(r)中,划分函数S(r)会对输入的X光图像数据shuffle操作(即打乱图片的排列顺序),并输出训练集Dtra和验证集Dval;其中,r表示两者训练集和验证集划分的比例。
步骤1、构建由NC个卷积块和RC个下采样块组成的神经网络结构A;每个卷积块和下采样块的节点个数相同,并由m个节点构成,每个节点表示一种操作,操作的类型包括卷积操作、下采样操作、全连接操作以及通道注意力操作,节点之间存在连接用1表示,否则用0表示;卷积块中的所有操作的步长均为1,下采样块中所有操作的步长均为2;神经网络结构A由NC个卷积块和RC个下采样块依次堆叠而成;神经网络结构A的稠密度由节点之间1的个数表示,1的个数越多表示节点连接的越稠密;设置参数NC=6,RC=2,m=6。如图2所示;
步骤2、初始化神经网络结构的种群Pt并进行迭代进化,获得最优神经网络结构Abest
步骤2.0、参数定义并初始化,包括:初始种群大小为N=20,采样种群大小M=100,总的进化迭代次数T=25,当前迭代次数t=1,每个结构训练的最大次数Emax=100,交叉概率a=0.3,变异概率b=0.2,稠密度的划分间隔为α=5,类别数I=3;
步骤2.1、随机初始化神经网络结构的第t代种群Pt,第t代种群Pt由N个神经网络结构的编码组成,其中任意一个神经网络结构A所对应的编码记为E,编码E是
Figure BDA0003423634130000061
位的二进制编码,其中,m表示所述神经网络结构A中卷积块和下采样块中的节点个数;二进制编码包含神经网络结构中层与层之间的连接关系以及节点的操作类型;
步骤2.2、对第t代种群Pt中的N个个体编码映射成神经网络结构信息,从而完成每个个体编码的解码,并构建完整的卷积神经网络结构;
步骤2.3、训练所述完整的卷积神经网络结构,获取个体适应度值:
将所述训练集Dtra和验证集Dval分别进行水平翻转、角度旋转、高斯加噪的增广处理及像素归一化操作后,将处理后的训练集D’tra输入到所述完整的卷积神经网络结构中进行前向传播处理,并在反向传播处理中利用随机梯度下降(Stochastic GradientDescent,SGD)算法对神经网络结构所对应的第t代种群Pt中每个解码后的神经结构进行迭代训练,同时使用交叉熵损失函数来更新迭代训练过程中卷积神经网络结构的权重参数,直至达到最大训练次数Emax为止,从而得到N个训练好的卷积神经网络结构;
将处理后的验证集D’val分别输入N个训练好的卷积神经网络结构中,得到验证集D’val的N个准确率并将其作为N个个体的适应度值F1,将训练好的卷积神经网络结构的参数量作为适应度值F2
步骤2.4、交配池选择:
在第t代种群Pt中每次有放回的随机抽取两个父代个体,并使用二进制锦标赛选择法将所述适应度值F1更大的个体保留,从而得到种群规模为N的第t代交配池Pt’;
步骤2.5、基于结构熵采样的个体交叉变异:
步骤2.5.1、依次从所述第t代交配池Pt’中随机抽取两个父代个体p1和p2,以交叉率a和变异率b分别进行编码的交叉操作和变异操作,从而得到两个子代个体o1和o2
步骤2.5.2、重复M次步骤2.5.1,从而得到种群规模为2M的第t代候选子代种群Qt’;
步骤2.5.3、根据式(1)所示的结构熵公式计算第t代父代种群Pt的初始结构熵AE(Pt):
Figure BDA0003423634130000071
式(1)中,Pt表示第t代种群,其中F'表示神经网络个体的节点连接稠密度,F′max和Fmin表示当前种群所有个体中最大的稠密度值和最小的稠密度值,α表示当前种群所有个体稠密度值等分的间隔,Q表示根据所述个体稠密度等分间隔划分的区间数量,N表示种群的规模,
Figure BDA0003423634130000072
表示第t代种群的第j个区间,
Figure BDA0003423634130000073
表示第t代种群中的第j个区间中的个体数量占种群数量的比例;
步骤2.5.4、将所述第t代候选子代种群Qt’中的第k个个体qk加入第t代父代种群Pt构成混合种群P′t,再根据式(1)计算所述混合种群P′t的结构熵AE(P′t);
步骤2.5.5、计算所述初始结构熵AE(Pt)和混合种群P′t的结构熵AE(P′t)的差值,从而得到所述第k个个体qk的个体熵IE(qk),用于表示个体多样性的优劣;
步骤2.5.6、按照步骤2.5.3-步骤2.5.5计算候选子代种群Qt’中每个个体的个体熵并进行降序排序,选取前N个个体作为第t代子代种群Qt
步骤2.6、环境选择:
将第t代父代种群Pt和第t代子代种群Qt进行混合,得到种群规模为2N的第t代混合种群Mt;对第t代混合种群Mt中所有的个体基于双目标适应度值F1和F2进行非支配排序,得到第t代第j个个体在目标空间中对应的帕累托前沿面层索引Kj以及在对应前沿面上的拥挤度距离Dj;选择帕累托前沿面层索引更小且拥挤度距离更大的N个个体作为第t+1代种群Pt+1
步骤2.7、令t+1赋值给t后,判断t≤T是否成立,若成立,则重复步骤2.2到步骤2.7,否则执行步骤3;
步骤3、获取最佳神经网络结构个体:
基于N个个体的适应度值对第T代种群PT进行降序排序,并将适应度值F1最大的个体作为最优卷积神经网络结构Abest输出;
步骤4、对所述最优卷积神经网络结构Abest进行训练:分别将所述处理后的训练集D’tra和验证集D’val输入到最优卷积神经网络结构Abest中,并利用随机梯度下降算法(Stochastic Gradient Descent,SGD)对所述最优卷积神经网络结构Abest进行训练,同时使用如式(2)所示的带权重的交叉熵损失函数
Figure BDA0003423634130000081
对训练迭代中最优卷积神经网络结构Abest的权重参数进行更新,直至达到总训练次数Emax为止,从而得到训练后的最佳卷积神经网络结构A’best并作为骨密度分类预测模型,用于实现X光图像的分类预测;
Figure BDA0003423634130000082
式(2)中,y表示输入样本的真实标签,
Figure BDA0003423634130000083
表示网络模型预测的标签,
Figure BDA0003423634130000084
表示网络结构预测的标签概率,其中Nc表示第c种类别图片的数量,Nsum表示所有图片的总数量。
步骤5、保存训练好的神经网络模型Abest以及对应的权重参数,得到骨密度分类预测模型,从而实现X光影像图的骨质类别分类预测。
表1
Figure BDA0003423634130000085
如表1所示,为本发明基于结构熵采样的架构搜索方法的获得的卷积神经网络结构与其他不同模型的骨质疏松图像分类准确率。AEMONAS表示采用本发明基于结构熵采样的架构搜索方法获得的卷积神经网络;ResNet和DenseNet表示使用人工设计的卷积神经网络;ENAS表示基于强化学习的网络结构搜索方法获得的卷积神经网络;DARTS表示基于梯度优化的网络结构搜索方法获得的卷积网络结构;NSGANet和AmoebaNet表示基于进化算法的网络结构搜索方法获得的卷积神经网络。可以看出:本发明的方法比其余方法在精度上有了显著的提升,并且模型的参数量更小,在计算资源受限的环境下更具有优势且方便集成。

Claims (1)

1.一种基于结构熵采样的多目标架构搜索骨质疏松图像识别方法,其特征是按以下步骤进行:
步骤0、采集n张含有骨密度标签的腰椎X光图像并进行预处理,得到数据集Dall,并划分为训练集Dtra和验证集Dvall,且腰椎X光图像共有I种类别;
步骤1、构建由NC个卷积块和RC个下采样块组成的卷积神经网络结构A;每个卷积块和下采样块的节点个数相同,并由m个节点构成,每个节点表示一种操作,所述操作的类型包括卷积操作、下采样操作、全连接操作以及通道注意力操作,节点之间存在连接用“1”表示,否则用“0”表示;所述卷积块中的所有操作的步长均为1,所述下采样块中所有操作的步长均为2;所述神经网络结构A由NC个卷积块和RC个下采样块依次堆叠而成;所述神经网络结构A的稠密度由所有节点连接关系中“1”的个数表示;
步骤2、初始化所述神经网络结构的种群Pt并进行迭代进化,获得最优网络结构Abest
步骤2.0、参数定义,包括:初始种群大小为N,候选子代种群大小为M,总的进化迭代次数为T,当前迭代次数为t,每个结构训练的最大次数为Emax,交叉概率为a,变异概率为b,种群所有个体稠密度的划分间隔为α;
步骤2.1、初始化t=1;随机初始化卷积神经网络结构的第t代种群Pt,所述第t代种群Pt由N个卷积网络结构的编码组成,其中任意一个卷积网络结构A所对应的编码记为E,所述编码E是
Figure FDA0003423634120000011
位的二进制编码,其中,m表示所述卷积神经网络结构A中卷积块和下采样块中的节点个数;所述二进制编码包含卷积神经网络结构中层与层之间的连接关系以及节点的操作类型;
步骤2.2、将所述第t代种群Pt中的N个编码映射成卷积神经网络结构信息,从而完成解码操作,构建完整的卷积神经网络结构;
步骤2.3、训练所述完整的卷积神经网络结构,获取个体适应度值:
将所述训练集Dtra和验证集Dval分别进行水平翻转、角度旋转、高斯加噪的增广处理及像素归一化操作后,将处理后的训练集D’tra输入到所述完整的卷积神经网络结构中进行前向传播处理,并在反向传播处理中利用随机梯度下降算法对神经网络结构所对应的第t代种群Pt中每个解码后的神经结构进行迭代训练,同时使用交叉熵损失函数来更新迭代训练过程中卷积神经网络结构的权重参数,直至达到最大训练次数Emax为止,从而得到N个训练好的卷积神经网络结构;
将处理后的验证集D’val分别输入N个训练好的卷积神经网络结构中,得到验证集D’val的N个准确率并将其作为N个个体的适应度值F1,将训练好的卷积神经网络结构的参数量作为适应度值F2
步骤2.4、交配池选择:
在第t代种群Pt中每次有放回的随机抽取两个父代个体,并使用二进制锦标赛选择法将所述适应度值F1更大的个体保留,从而得到种群规模为N的第t代交配池Pt’;
步骤2.5、基于结构熵采样的个体交叉变异:
步骤2.5.1、依次从所述第t代交配池Pt’中随机抽取两个父代个体p1和p2,以交叉率a和变异率b分别进行编码的交叉操作和变异操作,从而得到两个子代个体o1和o2
步骤2.5.2、重复M/2次步骤2.5.1,从而得到种群规模为M的第t代候选子代种群Qt’;
步骤2.5.3、根据式(1)所示的结构熵公式计算第t代父代种群Pt的初始结构熵AE(Pt):
Figure FDA0003423634120000021
式(1)中,F′max和F′min表示当前种群所有个体中最大的稠密度值和最小的稠密度值,α表示当前种群所有个体稠密度值等分的间隔,Q表示根据所述个体稠密度等分间隔划分的区间数量,N表示种群的规模,
Figure FDA0003423634120000022
表示第t代种群的第j个区间,
Figure FDA0003423634120000023
表示第t代种群中的第j个区间中的个体数量占种群数量的比例;
步骤2.5.4、将所述第t代候选子代种群Qt’中的第k个个体qk加入第t代父代种群Pt构成混合种群P′t,再根据式(1)计算所述混合种群P′t的结构熵AE(P′t);
步骤2.5.5、计算所述初始结构熵AE(Pt)和混合种群P′t的结构熵AE(P′t)的差值,从而得到所述第k个个体qk的个体熵IE(qk),用于表示个体多样性的优劣;
步骤2.5.6、按照步骤2.5.3-步骤2.5.5计算候选子代种群Qt’中每个个体的个体熵并进行降序排序,选取前N个个体作为第t代子代种群Qt
步骤2.6、环境选择:
将第t代父代种群Pt和第t代子代种群Qt进行混合,得到种群规模为2N的第t代混合种群Mt;对第t代混合种群Mt中所有的个体基于双目标适应度值F1和F2进行非支配排序,得到第t代第j个个体在目标空间中对应的帕累托前沿面层索引Kj以及在对应前沿面上的拥挤度距离Dj;选择帕累托前沿面层索引更小且拥挤度距离更大的N个个体作为第t+1代种群Pt+1
步骤2.7、令t+1赋值给t后,判断t≤T是否成立,若成立,则重复步骤2.2到步骤2.7,否则执行步骤3;
步骤3、获取最佳神经网络结构个体:
基于N个个体的适应度值对第T代种群PT进行降序排序,并将适应度值F1最大的个体作为最优卷积神经网络结构Abest输出;
步骤4、对所述最优卷积神经网络结构Abest进行训练:
分别将所述处理后的训练集D’tra和验证集D’val输入到最优卷积神经网络结构Abest中,并利用随机梯度下降算法对所述最优卷积神经网络结构Abest进行训练,同时使用如式(2)所示的带权重的交叉熵损失函数
Figure FDA0003423634120000034
对训练迭代中最优卷积神经网络结构Abest的权重参数进行更新,直至达到总训练次数Emax为止,从而得到训练后的最佳卷积神经网络结构A’best并作为骨密度分类预测模型,用于实现X光图像的分类预测;
Figure FDA0003423634120000031
式(2)中,y表示输入样本的真实标签,
Figure FDA0003423634120000032
表示网络模型预测的标签,
Figure FDA0003423634120000033
表示网络结构预测的标签概率,Nc表示第c种类别图片的数量,Nsum表示所有图片的总数量。
CN202111570819.8A 2021-12-21 2021-12-21 基于结构熵采样的多目标架构搜索骨质疏松图像识别方法 Pending CN114241267A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111570819.8A CN114241267A (zh) 2021-12-21 2021-12-21 基于结构熵采样的多目标架构搜索骨质疏松图像识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111570819.8A CN114241267A (zh) 2021-12-21 2021-12-21 基于结构熵采样的多目标架构搜索骨质疏松图像识别方法

Publications (1)

Publication Number Publication Date
CN114241267A true CN114241267A (zh) 2022-03-25

Family

ID=80760222

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111570819.8A Pending CN114241267A (zh) 2021-12-21 2021-12-21 基于结构熵采样的多目标架构搜索骨质疏松图像识别方法

Country Status (1)

Country Link
CN (1) CN114241267A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115359337A (zh) * 2022-08-23 2022-11-18 四川大学 用于图像识别的脉冲神经网络的搜索方法、系统及应用
CN116612338A (zh) * 2023-07-21 2023-08-18 华中科技大学 基于网络状态索引卷积神经网络集的图像识别方法及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115359337A (zh) * 2022-08-23 2022-11-18 四川大学 用于图像识别的脉冲神经网络的搜索方法、系统及应用
CN115359337B (zh) * 2022-08-23 2023-04-18 四川大学 用于图像识别的脉冲神经网络的搜索方法、系统及应用
CN116612338A (zh) * 2023-07-21 2023-08-18 华中科技大学 基于网络状态索引卷积神经网络集的图像识别方法及系统
CN116612338B (zh) * 2023-07-21 2023-09-29 华中科技大学 基于网络状态索引卷积神经网络集的图像识别方法及系统

Similar Documents

Publication Publication Date Title
CN108334949B (zh) 一种基于优化深度卷积神经网络结构快速进化的图像分类器构建方法
CN111898689B (zh) 一种基于神经网络架构搜索的图像分类方法
CN112465120A (zh) 一种基于进化方法的快速注意力神经网络架构搜索方法
CN110490320B (zh) 基于预测机制和遗传算法融合的深度神经网络结构优化方法
CN114241267A (zh) 基于结构熵采样的多目标架构搜索骨质疏松图像识别方法
CN112084877B (zh) 基于nsga-net的遥感图像识别方法
CN112508104A (zh) 一种基于快速网络架构搜索的跨任务图像分类方法
CN114118369B (zh) 一种基于群智能优化的图像分类卷积神经网络设计方法
CN113033786B (zh) 基于时间卷积网络的故障诊断模型构建方法及装置
CN112215278B (zh) 一种遗传算法和蜻蜓算法相结合的多维数据特征选择方法
WO2022126448A1 (zh) 一种基于演化学习的神经网络结构搜索方法和系统
CN113128432B (zh) 基于演化计算的机器视觉多任务神经网络架构搜索方法
CN111611748A (zh) 一种数据驱动的材料逆向设计方法及系统
CN114792126A (zh) 一种基于遗传算法的卷积神经网络设计方法
CN117611974B (zh) 基于多种群交替进化神经结构搜索的图像识别方法及系统
CN113282747A (zh) 一种基于自动机器学习算法选择的文本分类方法
CN113011091A (zh) 一种自动分组的多尺度轻量型深度卷积神经网络优化方法
CN115908909A (zh) 基于贝叶斯卷积神经网络的进化神经架构搜索方法及系统
CN114943866B (zh) 基于进化神经网络结构搜索的图像分类方法
CN116611504A (zh) 一种基于进化的神经架构搜索方法
CN116976405A (zh) 基于免疫优化算法的变分阴影量子神经网络
Wan et al. RSSM-Net: Remote sensing image scene classification based on multi-objective neural architecture search
CN115063374A (zh) 模型训练、人脸图像质量评分方法、电子设备及存储介质
CN115620046A (zh) 一种基于半监督性能预测器的多目标神经架构搜索方法
CN112819161B (zh) 变长基因遗传算法的神经网络构建系统、方法及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination