CN107316294B - 一种基于改进的深度玻尔兹曼机肺结节特征提取方法 - Google Patents

一种基于改进的深度玻尔兹曼机肺结节特征提取方法 Download PDF

Info

Publication number
CN107316294B
CN107316294B CN201710507191.4A CN201710507191A CN107316294B CN 107316294 B CN107316294 B CN 107316294B CN 201710507191 A CN201710507191 A CN 201710507191A CN 107316294 B CN107316294 B CN 107316294B
Authority
CN
China
Prior art keywords
nodule
layer
hidden
lung
probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710507191.4A
Other languages
English (en)
Other versions
CN107316294A (zh
Inventor
赵涓涓
张婷
强彦
罗嘉滢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Taiyuan University of Technology
Original Assignee
Taiyuan University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Taiyuan University of Technology filed Critical Taiyuan University of Technology
Priority to CN201710507191.4A priority Critical patent/CN107316294B/zh
Publication of CN107316294A publication Critical patent/CN107316294A/zh
Application granted granted Critical
Publication of CN107316294B publication Critical patent/CN107316294B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24137Distances to cluster centroïds
    • G06F18/2414Smoothing the distance, e.g. radial basis function networks [RBFN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • G06T2207/10081Computed x-ray tomography [CT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30061Lung
    • G06T2207/30064Lung nodule

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Artificial Intelligence (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Image Analysis (AREA)
  • Apparatus For Radiation Diagnosis (AREA)

Abstract

本发明公开了一种基于改进的深度玻尔兹曼机肺结节特征提取和良恶性分类方法,包括以下步骤:步骤A,通过阈值概率图像图方法从CT图像分割肺结节,得到感兴趣区域(ROI),并裁剪成同一大小的结节图像;步骤B,设计有监督的深度学习算法Pnd‑EBM实现肺结节的诊断,其中包括三大步骤:B1采用基于深度玻尔兹曼机(DBM)提取肺结节ROI的具有深层表达能力的特征;B2、采用稀疏交叉熵惩罚因子改进代价函数,以解决训练过程中“特征同质化”现象;B3,采用基于极限学习机(ELM)将提取出来的肺结节特征进行良恶性分类。本发明的方法基于改进的深度波尔兹曼机肺结节特征提取方法,优于传统的特征提取方法,避免了人工提取复杂性及特征选择的差异性,能够为临床诊断提供参考依据。

Description

一种基于改进的深度玻尔兹曼机肺结节特征提取方法
技术领域
本发明涉及肺结节特征提取,具体涉及一种基于改进的深度玻尔兹曼机肺结节特征提取方法。
背景技术
传统的计算机辅助诊断系统(computer aided diagnosis,简称CAD)分析肺结节一般采用基于形态学的结节分割和人工提取肺结节纹理特征或形状特征。这种基于底层特征的分类方法可以克服人眼的惰性和对灰度图像的不敏感性,提高放射科医生对结节识别和诊断的精确性,但是选取什么样肺结节图像表征,很大程度上依靠经验和运气;而且使用形态学对结节的描述是不准确的,比如结节边缘的定义是模糊的、主观的。基于深度波尔兹曼机无监督方法能够让机器自动地学习到肺结节图像深层结构特征,就能很好地避免人为因素的影响,借鉴人脑的多层抽象机制来实现对肺结节抽象表达,使学习到的特征相似于生物视觉的特征,从而提升分类的准确性,并辅助医师做出可靠的诊断决策。
发明内容
本发明针对现有技术的不足提供一种基于深度波尔兹曼机的肺结节特征提取方法。
本发明采用的技术方案为:
一种基于改进的深度玻尔兹曼机肺结节特征提取方法,包括以下步骤:
步骤A,采用阈值概率图方法从肺部CT图像分割肺结节,得到感兴趣区域(ROI),并裁剪成同一大小的结节图像存入样本数据库;
所述步骤A具体步骤如下:
A1、预处理数据集
第1步,假设LIDC数据库中4位放射性专家专家经验值一样,因此赋给每个专家的权重值均为0.25;
第2步,如果区域中的某个像素同时被μ(1≤μ≤4)名专家标注,则该像素为结节区域的概率值为0.25μ;
第3步,经过上述操作,将肺结节ROI转换为0~1之间的概率映射图;
第4步,设置一个阈值K,分割肺结节区域时概率值低于K的像素设置为0,高于K的像素设置为1,就生成了相应的二值图像;
第5步,将此二值图像与原图像进行AND运算,即得到肺结节图像;
第6步,将肺结节图像统一裁剪成大小为32×32,存入样本数据库中,作为Pnd-DBM的输入;
A2、扩充并平衡数据集:
第1步,将良性结节向x轴、y轴方向平移±2像素,以及将肺结节旋转90°,180°,270°后存储;
第2步,将恶性结节每隔90°旋转一次并存储;
步骤B,设计有监督的深度学习算法Pnd-EBM实现肺结节的诊断,具体为采用基于深度玻尔兹曼机(DBM)提取肺结节ROI的具有深层表达能力的特征:通过DBM两个隐层提取肺结节浅层和高层特征,并通过修改代价函数,解决训练过程中特征同质化现象,从而获得表达肺结节高维的特征信息。
所述的方法,所述步骤B具体步骤如下:
B1、DBM提取肺结节过程如下;
第1步,采用两隐含层深度玻尔兹曼机来提取肺结节特征,用一个二值的可见单元向量来表示输入结节图像,h1与h2是底层与高层的二值隐含单元向量;对于给定的一组状态{v,h1,h2},定义如下能量函数:
E(v,h1,h2,θ)=-vTWh1-h1Jh2-a1Th1-a2Th2-bTv
其中,θ={W,J,a1,a2,b}为DBM参数,W为可见单元v到隐含单元h1的权值矩阵,J为隐含单元h1到隐含单元h2的权值矩阵,a1和a2分别为表示隐含单元的偏置,b表示可见单元的偏置;
第2步,则可见单元与隐藏单元的联合概率为:
Figure GDA0002133293210000031
其中,常数项Z(θ)定义为:
Figure GDA0002133293210000032
第3步,根据逻辑回归函数得到两个隐含层以及可见层单元重构的条件分布概率为:
Figure GDA0002133293210000033
Figure GDA0002133293210000034
Figure GDA0002133293210000035
通过上述几个式子,就得到了DBM模型的参数;
B2、采用稀疏交叉熵惩罚因子改进代价函数;
定义两个随机分布q(x)与p(x)之间的交叉熵(cross entropy)为q(x)与p(x)之间的Kullback-Leiber距离与p(x)的熵之和,定义如下所示:
CrossEntropy=-∫p(x)lnq(x)dx
当q(x)等于p(x)时,交叉熵最小,即Kullback-Leiber距离最小;
利用交叉熵的概念,提出新的稀疏惩罚因子——交叉熵稀疏惩罚因子,p(x)为隐单元稀疏度,q(x)为隐单元激活概率分布,RBM隐单元个数为M,L为训练样本V的个数,如下所示:
Figure GDA0002133293210000036
对给定训练集V={v(1),...,v(m)},对于RBM的训练,就是处理下式的优化问题:
Figure GDA0002133293210000037
式中λ为稀疏正则化常数,p用于控制隐单元的稀疏程度,即通过稀疏惩罚因子鼓励隐单元在学习过程中的平均激活概率与p之间的Kullback-Leiber距离达到最小,使隐单元具备稀疏性。
与现有技术相比,本发明的有益效果为:
1、本发明的方法针对LIDC数据库中CT进行预处理,采用的是概率阈值图,而不是分割结节,也没有使用任何形态学处理结节,保留了原始结节信息;
2、与传统的方法手工提取结节特征相比,比如纹理特征、形状特性等,本发明方法使用的DBM算法能够自动获取结节有区别能力的特征;
3、本发明方法采用ELM对肺结节特征进行分类,可以保证精度不变的情况下,减少时间复杂度,将ELM运用到DBM中,能更有效的节约时间。
附图说明
图1是本发明算法流程图。
图2是本发明基于阈值概率图的肺结节图像分割过程图。(a)原始结节图像,(b-e)4位专家对同一肺结节分割的二值图像,以及标注恶性度分别为5,5,5,4,(f)概率阈值图处理后的结果,(g)阈值K=0.25时标准结节区域二值图像,(h)最终提取的肺结节图像,恶性度为5。
图3是Pnd-EDBM结构图。
图4是DBM结构图。
图5是在三种不同稀疏惩罚因子下RBM可视化图。
图6是ELM结构图。
图7是相对比其他深度学习框架肺结节分类实验结果图。
具体实施方式
以下结合具体实施例,对本发明进行详细说明。
参照图1,本发明方法的实现流程如下:
一种基于深度波尔兹曼机的肺结节特征提取以及采用极限学习机进行良恶性分类识别的方法,包括以下步骤:
步骤A,采用阈值概率图(threshold probability map,简称TPM)方法从肺部CT图像分割肺结节,得到感兴趣区域(ROI),并裁剪成同一大小的结节图像存入样本数据库,为下一步提取特征做准备。
步骤B,设计有监督的深度学习算法Pnd-EBM实现肺结节的诊断,具体为采用基于深度玻尔兹曼机(DBM)提取肺结节ROI的具有深层表达能力的特征:采用两个隐含层提取肺结节浅层和高层特征,并通过修改代价函数,从而获得表达结节高维的特征信息,并为下一步分类做准备。采用基于极限学习机(ELM)将提取的肺结节特征进行良恶性分类。
优选的,所述步骤A中采用阈值概率图方法从肺部CT图像分割肺结节,得到感兴趣区域(ROI)的过程如下:
本专利使用的数据集来自于美国国家癌症研究会(national cancer institute,简称NCI)于2001年4月起陆续颁布了LIDC(lung image database consortium image,简称LIDC)。数据库包含1018个病例,其中每个病例对应一个文件夹,包括完整的肺部CT扫描图像100~300张以及一个注释文件(.xml文件)。注释文件中只对直径大于3mm的结节给出了由4名放射性专家标注的结节轮廓上每个点的坐标,小于3mm的小结节则只给出了中心点坐标。因此,本实验中只考虑直径大于3mm的结节,以便于对本文分类算法的精准度进行评价。
A1、预处理数据集
第1步,假设LIDC数据库中4位放射性专家专家经验值一样,因此赋给每个专家的权重值均为0.25;
第2步,如果区域中的某个像素同时被μ(1≤μ≤4)名专家标注,则该像素为结节区域的概率值为0.25μ;
第3步,经过上述操作,将肺结节ROI转换为0~1之间的概率映射图;
第4步,设置一个阈值K(本专利设置阈值K=0.25),分割肺结节区域时概率值低于K的像素设置为0,高于K的像素设置为1,就生成了相应的二值图像。
第5步,将此二值图像与原图像进行AND运算,即得到肺结节图像。
第6步,将肺结节图像统一裁剪成大小为32×32,存入样本数据库中,作为Pnd-DBM的输入;
本专利对LIDC数据库中的CT图像预处理采用概率阈值图方法,可以得到结节图像共15864个结节,其中良性结节4469,恶性结节11395,从中,可以发现样本集中恶性结节个数是良性结节的2.55倍,且样本数据集过少,网络在学习过程中可能会出现过拟合现象,因为需要扩充和平衡数据集。
图2为概率阈值图方法处理LIDC数据库中的CT图像结果,(a)为原始结节图像,(b-e)为4位专家标注的结节区域大小的二值图像以及恶性度大小,(f)概率阈值图处理后的结果,(g)经过阈值K处理后的标准结节区域二值图像,(h)为与原始结节图像与运算后的结节区域,即得到最终的结节图像并存入训练数据集中。
A2、扩充并平衡数据集:
第1步,将良性结节向x轴、y轴方向平移±2像素,以及将结节旋转90°,180°,270°后存储;
第2步,将恶性结节每隔90°旋转一次并存储;
经过扩充数据集后,良性结节扩充8倍,恶性结节扩充4倍,在扩充数据集的同时也解决了数据集不平衡的问题。经过上述操作,根据2-8原则将72800个结节作为训练集,其中良性结节32000个,恶性结节40800个,测试集8532个。
优选的,所述步骤B中特征提取过程如下:
参照图3,本发明专利基于DBM和ELM算法,提出Pnd-EDBM用于肺结节特征提取与良恶性分类,DBM前两个隐含层用来提取肺结节特征,可见层与第一个隐含层构成第一个RBM模型,第一个隐含层与第二个隐含层构成第二个RBM模型,由于第二个隐含层同时也作为ELM的隐含层,因此第二、三个隐含层与分类层构成ELM模型;第一个RBM模型提取肺结节特征信息并对输入数据构建低层特征表达,第二个RBM模型构建肺结节高层的特征表达,ELM模型对提取到的高层特征进行快速准确分类。
本专利随机选取训练集72800个,测试样本8532个,在网络结构1024-500-300-500-2下进行测试,mini-batch(分批处理个数)为100,迭代20次,随机隐退概率设置为0.5,学习率ε=0.01下进行训练。具体训练步骤如下:
第1步,无监督训练:以重构误差函数作为目标函数,采用贪婪逐层算法,先对第一层的RBM进行无监督学习,直到数据达到收敛条件或超过训练迭代次数后,固定本层的参数并传递给下一个RBM进行训练。
第2步,微调:首先,利用带标签的训练样本对ELM分类器进行训练,然后利用将已经调好的DBM网络参数作为微调的初始值,采用mini-batch梯度下降法,通过最小化交叉熵函数,找到全局最优点,微调网络参数。
B1、参照图4DBM结构图,DBM提取肺结节过程如下;
第1步,本专利采用两隐含层深度玻尔兹曼机来提取肺结节特征,用一个二值的可见单元向量v来表示输入结节图像,h1与h2是底层与高层的二值隐含单元向量。对于给定的一组状态{v,h1,h2},定义如下能量函数:
E(v,h1,h2,θ)=-vTWh1-h1Jh2-a1Th1-a2Th2-bTv
其中,θ={W,J,a1,a2,b}为DBM参数,W为可见单元v到隐含单元h1的权值矩阵,J为隐含单元h1到隐含单元h2的权值矩阵,a1和a2分别为表示隐含单元的偏置,b表示可见单元的偏置。
第2步,则可见单元与隐藏单元的联合概率为:
Figure GDA0002133293210000071
其中,常数项Z(θ)定义为:
Figure GDA0002133293210000072
第3步,根据逻辑回归函数得到两个隐含层以及可见层单元重构的条件分布概率为:
Figure GDA0002133293210000073
Figure GDA0002133293210000074
Figure GDA0002133293210000075
根据上述几个式子,就得到了DBM的参数。
B2、采用稀疏交叉熵惩罚因子改进代价函数;
定义两个随机分布q(x)与p(x)之间的交叉熵(cross entropy)为q(x)与p(x)之间的Kullback-Leiber距离与p(x)的熵之和,定义如下所示:
CrossEntropy=-∫p(x)lnq(x)dx
当q(x)等于p(x)时,交叉熵最小,即Kullback-Leiber距离最小;
利用交叉熵的概念,提出新的稀疏惩罚因子——交叉熵稀疏惩罚因子,p(x)为隐单元稀疏度,q(x)为隐单元激活概率分布,RBM隐单元个数为M,L为训练样本V的个数,如下所示:
Figure GDA0002133293210000081
对给定训练集V={v(1),...,v(m)},对于RBM的训练,就是处理下式的优化问题:
Figure GDA0002133293210000082
式中λ为稀疏正则化常数,p用于控制隐单元的稀疏程度,即通过稀疏惩罚因子鼓励隐单元在学习过程中的平均激活概率与p之间的Kullback-Leiber距离达到最小,使隐单元具备稀疏性。
图5为在三种不同惩罚因子下,RBM可视化图,(a)为无稀疏交叉熵惩罚因子,(b)为误差平方和稀疏惩罚因子,(c)交叉熵稀疏惩罚因子实验结果图。在没有稀疏惩罚因子的情况下,RBM出现了严重的特征同质化现象,结节特征不明显;但采用稀疏惩罚因子后,可以看到比较明显的结节轮廓,证明了稀疏惩罚因子能够有效地避免特征同质化问题;但对比图(b)和图(c)可以发现,图(b)中仍然存在着结节特征相似的现象,说明相较于误差平方和稀疏惩罚因子,交叉熵稀疏惩罚因子下RBM学习的特征更清楚,证明特征同质化得到进一步弱化。
B3、参照图6ELM结构图,采用ELM进行肺结节良恶性分类过程如下:
第1步,设训练样本为[xi,ti](i=1,2,3,...,k),对于一个M个隐层节点的神经网络可以表示为:
Figure GDA0002133293210000091
其中,β为隐含层和输出层之间的连接权值矩阵;g(x)为隐含层的激活函数,可取sigmoid、sine或者RBF函数;w为输入层和隐含层之间的连接权值,c为隐含层的偏置向量。
第2步,单隐层的神经网络学习的目的是使得输出的误差最小,也就是存在w,β,b使得o与t近似相等:
Figure GDA0002133293210000092
第3步,确定隐含层神经元个数,随机设定输入层与隐含层的连接权值w和隐含层神经元的阈值b;
第4步,选择一个无限可微的函数作为隐含层神经元的激活函数,进而计算隐含层输出层矩阵H,
Figure GDA0002133293210000093
用矩阵形式可表示为:HB=T,式中H被称作网络的隐含层输出矩阵。
第5步,隐含层和输出层之间的连接权值β可由HB=T的极小二范数最小二乘解得:计算输出值权值
Figure GDA0002133293210000094
Figure GDA0002133293210000095
式中
Figure GDA0002133293210000096
为隐含层输出矩阵H的Moore-penrose广义逆。
图7对比了本发明与其他深度学习方法用于肺结节良恶性分类,对肺结节的准确性(ACC)、敏感性(SEN)以及特异性(SPE)进行对比,Setio*使用的是多视角卷积神经网络,分类器采用Softmax,达到了87.93%的敏感性;Ypsilantis*使用的是混合卷积神经网络以及循环神经网络CNN-RNN,采用SVM作为分类器,达到了90.5%的敏感性;Kumar*使用的是自编码提取肺结节特征,并使用二叉树作为分类器,达到了82.78%的特异性,Shen*使用的是多视角卷积神经网络,并采用随机森林进行分类,达到了88.84%的准确率,而本文发明的方法在对肺结节诊断时的敏感度,特异性和准确度分别为85.36%,87.32%和89.85%。
应当理解的是,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。

Claims (2)

1.一种基于改进的深度玻尔兹曼机肺结节特征提取方法,其特征在于,包括以下步骤:
步骤A,采用阈值概率图方法从肺部CT图像分割肺结节,得到感兴趣区域即ROI,并裁剪成同一大小的结节图像存入样本数据库;
所述步骤A具体步骤如下:
A1、预处理数据集
第1步,假设LIDC数据库中4位放射性专家专家经验值一样,因此赋给每个专家的权重值均为0.25;
第2步,如果区域中的某个像素同时被μ名专家标注,则该像素为结节区域的概率值为0.25μ;μ取值范围为[1,4];
第3步,经过上述操作,将肺结节ROI转换为0~1之间的概率映射图;
第4步,设置一个阈值K,分割肺结节区域时概率值低于K的像素设置为0,高于K的像素设置为1,就生成了相应的二值图像;
第5步,将此二值图像与原图像进行AND运算,即得到肺结节图像;
第6步,将肺结节图像统一裁剪成大小为32×32,存入样本数据库中,作为Pnd-DBM的输入;
A2、扩充并平衡数据集:
第1步,将良性结节向x轴、y轴方向平移±2像素,以及将肺结节旋转90°,180°,270°后存储;
第2步,将恶性结节每隔90°旋转一次并存储;
步骤B,具体为采用基于深度玻尔兹曼机即DBM提取肺结节ROI的具有深层表达能力的特征:通过DBM两个隐层提取肺结节浅层和高层特征,并通过修改代价函数,解决训练过程中特征同质化现象,从而获得表达肺结节高维的特征信息。
2.根据权利要求1所述的方法,其特征在于,所述步骤B具体步骤如下:
B1、DBM提取肺结节过程如下;
第1步,采用两隐含层深度玻尔兹曼机来提取肺结节特征,可见层v用来表示输入结节图像,h1是底层的二值隐含层,h2是高层的二值隐含层;对于给定的一组状态{v,h1,h2},定义如下能量函数:
E(v,h1,h2,θ)=-vTWh1-h1Jh2-a1Th1-a2Th2-bTv
其中,θ={W,J,a1,a2,b}为DBM参数,W为可见层v到底层的二值隐含层h1的权值矩阵,J为底层的二值隐含层h1到高层的二值隐含层h2的权值矩阵,a1表示底层的二值隐含层的偏置,a2表示高层的二值隐含层的偏置,b表示可见层v的偏置;
第2步,则可见层与两隐含层的联合概率为:
Figure FDA0002251156630000021
其中,常数项Z(θ)定义为:
Figure FDA0002251156630000022
第3步,根据逻辑回归函数得到两隐含层以及可见层的单元向量重构的条件分布概率为:
Figure FDA0002251156630000023
Figure FDA0002251156630000024
Figure FDA0002251156630000025
通过上述几个式子,就得到了DBM模型的参数;
B2、采用稀疏交叉熵惩罚因子改进代价函数;
定义两个随机分布q(x)与p(x)之间的交叉熵为q(x)与p(x)之间的Kullback-Leiber距离与p(x)的熵之和,定义如下所示:
CrossEntropy=-∫p(x)lnq(x)dx
当q(x)等于p(x)时,交叉熵最小,即Kullback-Leiber距离最小;
利用交叉熵的概念,提出新的稀疏惩罚因子——交叉熵稀疏惩罚因子,隐含单元向量稀疏度在数值上等于p(x);
Figure FDA0002251156630000031
为隐含单元向量激活概率分布,其中
Figure FDA0002251156630000032
表示隐含层hl中第j个单元,l取值为1或2;RBM隐含单元向量个数为M;L为训练集样本V的个数,如下所示:
Figure FDA0002251156630000033
其中,V为训练集;对给定训练集V={v(1),...,v(L)},对于RBM的训练,就是处理下式的优化问题:
Figure FDA0002251156630000034
式中v(k)为V中第k个训练集样本,λ为稀疏正则化常数,p用于控制隐含单元向量的稀疏程度,即通过稀疏惩罚因子鼓励隐含单元向量在学习过程中的平均激活概率与p之间的Kullback-Leiber距离达到最小,使隐含单元向量具备稀疏性。
CN201710507191.4A 2017-06-28 2017-06-28 一种基于改进的深度玻尔兹曼机肺结节特征提取方法 Active CN107316294B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710507191.4A CN107316294B (zh) 2017-06-28 2017-06-28 一种基于改进的深度玻尔兹曼机肺结节特征提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710507191.4A CN107316294B (zh) 2017-06-28 2017-06-28 一种基于改进的深度玻尔兹曼机肺结节特征提取方法

Publications (2)

Publication Number Publication Date
CN107316294A CN107316294A (zh) 2017-11-03
CN107316294B true CN107316294B (zh) 2020-03-13

Family

ID=60180742

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710507191.4A Active CN107316294B (zh) 2017-06-28 2017-06-28 一种基于改进的深度玻尔兹曼机肺结节特征提取方法

Country Status (1)

Country Link
CN (1) CN107316294B (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108053398A (zh) * 2017-12-19 2018-05-18 南京信息工程大学 一种半监督特征学习的黑色素瘤自动检测方法
CN108898577B (zh) * 2018-05-24 2022-03-01 西南大学 基于改进胶囊网络的良恶性肺结节识别装置及方法
CN108921851B (zh) * 2018-06-06 2021-07-09 深圳市未来媒体技术研究院 一种基于3d对抗网络的医学ct图像分割方法
CN109300113B (zh) * 2018-08-28 2021-12-24 东北大学 一种基于改进凸包方法的肺结节辅助检测系统及方法
CN109727228A (zh) * 2018-11-27 2019-05-07 常州市第二人民医院 基于尖峰平板式深度玻尔兹曼机分类的膀胱尿路上皮图像处理方法
CN109359701A (zh) * 2018-11-28 2019-02-19 重庆邮电大学 一种高精度提取和快速分类的三维模型数据解析方法
CN109727256B (zh) * 2018-12-10 2020-10-27 浙江大学 一种基于玻尔兹曼和目标先验知识的图像分割识别方法
CN109902736A (zh) * 2019-02-25 2019-06-18 东北大学 一种基于自动编码器构建特征表示的肺结节图像分类方法
CN110037682B (zh) * 2019-04-01 2020-07-21 上海数创医疗科技有限公司 基于改进卷积神经网络的识别心律类型的方法
CN110148467B (zh) * 2019-05-16 2023-05-23 东北大学 一种基于改进cnn的肺结节计算机辅助诊断装置及方法
CN110223281B (zh) * 2019-06-06 2022-06-28 东北大学 一种数据集中含有不确定数据时的肺结节图像分类方法
CN110458801A (zh) * 2019-06-24 2019-11-15 深圳市未来媒体技术研究院 一种3d双路径神经网络及基于该网络的肺部结节检测方法
CN110321943B (zh) * 2019-06-25 2021-08-31 中国科学院自动化研究所 基于半监督深度学习的ct图像分类方法、系统、装置
CN110543918B (zh) * 2019-09-09 2023-03-24 西北大学 一种基于正则化与数据增广的稀疏数据处理方法
CN113139931B (zh) * 2021-03-17 2022-06-03 杭州迪英加科技有限公司 甲状腺切片图像分类模型训练方法、装置
CN113706517B (zh) * 2021-09-01 2024-05-24 什维新智医疗科技(上海)有限公司 一种基于gulbp算子的结节良恶性判断装置
CN118115940A (zh) * 2024-02-27 2024-05-31 湖北经济学院 一种基于贝叶斯分析的特征稀疏rbm安检识别方法和系统

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
An Empirical Bayes Approach to Robust Variance Estimation: A Statistical Proposal for Quantitative Medical Image Testing;Zhan-Qian et al.;《Open Journal of Statistics》;20121231;第260-268页 *
Hierarchical Feature Representation and Multimodal Fusion with Deep Learning for AD/MCI Diagnosis;Heung-II Suk et al.;《Neuroimage》;20141231;第1-38页 *
Lung Image Patch Classification with Automatic Feature Learning;Qing Li et al.;《35th Annual International Conference of the IEEE EMBS Osaka》;20130707;第6079-6082页 *
Pulmonary Nodule Classification with Deep Convolutional Neural Networks on Computed Tomography Images;Wei Li et al.;《Computational and Mathematical Methods in Medicine》;20161231;第1-8页 *
基于深度信念网络的肺结节良恶性分类;杨佳玲 等;《科学技术与工程》;20161130;第16卷(第32期);第69-74页 *
基于深度玻尔兹曼机的文本特征提取研究;张立民 等;《微电子学与计算机》;20150228;第32卷(第2期);第142-147页 *
基于混合受限玻尔兹曼机的肺结节良恶性诊断;闫晓斐 等;《计算机工程与应用》;20161216;第1-7页 *

Also Published As

Publication number Publication date
CN107316294A (zh) 2017-11-03

Similar Documents

Publication Publication Date Title
CN107316294B (zh) 一种基于改进的深度玻尔兹曼机肺结节特征提取方法
CN107464250B (zh) 基于三维mri图像的乳腺肿瘤自动分割方法
CN110490850B (zh) 一种肿块区域检测方法、装置和医学图像处理设备
Hage Chehade et al. Lung and colon cancer classification using medical imaging: A feature engineering approach
CN107154043B (zh) 一种基于3dcnn的肺结节假阳性样本抑制方法
CN108537102B (zh) 基于稀疏特征与条件随机场的高分辨sar图像分类方法
CN112270666A (zh) 基于深度卷积神经网络的非小细胞肺癌病理切片识别方法
CN101556650B (zh) 一种分布式自适应肺结节计算机检测方法及系统
Cao et al. A multi-kernel based framework for heterogeneous feature selection and over-sampling for computer-aided detection of pulmonary nodules
CN111462116A (zh) 基于影像组学特征的多模态参数模型优化融合方法
CN110827260B (zh) 一种基于lbp特征与卷积神经网络的布匹缺陷分类方法
Swiderski et al. Novel methods of image description and ensemble of classifiers in application to mammogram analysis
CN102855633A (zh) 一种具有抗噪性的快速模糊聚类数字图像分割方法
CN108038844A (zh) 一种基于轻巧型cnn的肺结节良恶性预测方法
CN111815563B (zh) 一种U-Net与区域增长PCNN相结合的视网膜视盘分割方法
CN109801305B (zh) 基于深度胶囊网络的sar图像变化检测方法
Raghavendra et al. Multilayer stacked probabilistic belief network-based brain tumor segmentation and classification
CN106960226A (zh) 一种基于烟花算法的软子空间mr图像聚类算法
CN116884623B (zh) 基于激光扫描成像的医疗康复预测系统
Hang Thyroid Nodule Classification in Ultrasound Images by Fusion of Conventional Features and Res‐GAN Deep Features
Priya Resnet based feature extraction with decision tree classifier for classificaton of mammogram images
CN111127400A (zh) 一种乳腺病变检测方法和装置
CN115995040A (zh) 一种基于多尺度网络的sar图像小样本目标识别方法
CN115393631A (zh) 基于贝叶斯层图卷积神经网络的高光谱图像分类方法
Saifullah et al. Modified histogram equalization for improved CNN medical image segmentation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant