CN109492690B - 一种基于卷积神经网络检测ct图像的方法 - Google Patents

一种基于卷积神经网络检测ct图像的方法 Download PDF

Info

Publication number
CN109492690B
CN109492690B CN201811316415.4A CN201811316415A CN109492690B CN 109492690 B CN109492690 B CN 109492690B CN 201811316415 A CN201811316415 A CN 201811316415A CN 109492690 B CN109492690 B CN 109492690B
Authority
CN
China
Prior art keywords
output
neural network
layer
patient
probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811316415.4A
Other languages
English (en)
Other versions
CN109492690A (zh
Inventor
黄文恺
胡凌恺
何杰贤
彭广龙
薛义豪
吴羽
朱静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou University
Original Assignee
Guangzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou University filed Critical Guangzhou University
Priority to CN201811316415.4A priority Critical patent/CN109492690B/zh
Publication of CN109492690A publication Critical patent/CN109492690A/zh
Application granted granted Critical
Publication of CN109492690B publication Critical patent/CN109492690B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Public Health (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Biology (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Molecular Biology (AREA)
  • Pathology (AREA)
  • Biophysics (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Apparatus For Radiation Diagnosis (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于卷积神经网络检测CT图像的方法,包括如下步骤:S1、提供病人的CT图像、基因组表达谱、蛋白质表达谱、吸烟情况和工作环境信息,并对CT图像进行标注获得数据集;S2、根据步骤S1所述信息搭建一个主要神经网络和四个次要神经网络,其中,主要神经网络以卷积神经网络为主体,四个次要神经网络分别用于分析基因组表达谱、蛋白质表达谱、吸烟情况和工作环境对病人病情影响的大小并输出相应的权值;S3、用已标注的数据集对所述主要神经网络进行训练,代入所述次要神经网络输出的权值,以判断病人的CT图像是否具有肺癌相应特征。采用本发明的方法检测CT图像,可以辅助医生显著提高肺癌诊断的准确率和效率。

Description

一种基于卷积神经网络检测CT图像的方法
技术领域
本发明涉及二水石膏制备技术领域,尤其是一种基于卷积神经网络检测CT图像的方法。
背景技术
近年来,随着医学等领域的发展,检测人类的基因组和蛋白质表达情况成为了现实,同时分析人基因组和蛋白质表达情况成为了分析和诊断辅助疾病的一种手段。卷积神经网络是深度学习在图像处理方面的一个重要应用,它的优点是能够直接对图像像素进行卷积并提取特征,也能够利用海量的图像数据将网络参数训练充分,以达到更好的分类效果。而在医院实际工作中,医生通过人工阅读CT图像以作出病人是否患有癌症的诊断过程目前存在较高误诊率和漏诊率。
发明内容
基于上述问题,本发明的目的在于克服上述现有技术的不足之处而提供一种基于卷积神经网络检测CT图像的方法,医生采用该方法辅助检测CT图像,可以显著地提高肺癌诊断的准确率。
为实现上述目的,本发明采取的技术方案为:一种基于卷积神经网络检测CT图像的方法,包括如下步骤:
S1、提供病人的CT图像、基因组表达谱、蛋白质表达谱、吸烟情况和工作环境信息,并对CT图像进行标注获得数据集;
S2、根据步骤S1所述信息搭建一个主要神经网络和四个次要神经网络,其中,主要神经网络以卷积神经网络为主体,四个次要神经网络分别用于分析基因组表达谱、蛋白质表达谱、吸烟情况和工作环境对病人病情影响的大小并输出相应的权值;
S3、用已标注的数据集对所述主要神经网络进行训练,代入所述次要神经网络输出的权值,以判断病人的CT图像是否具有肺癌相应特征。其中,基因组表达谱、蛋白质表达谱中包含病人基因、蛋白质表达数量、种类、表达与否、表达量、何时表达等信息。其中,已标注的数据集可以是阿里云旗下大数据平台中天池比赛的数据集,还可以是kaggle比赛的数据集。
优选地,所述主体由输入层、隐藏层和输出层构成,所述输入层输入CT图像,隐藏层由四层卷积层和两层平均池化层构成,每两层卷积层后面连接一层平均池化层,所述输出层用softmax将输出结果变成概率输出,两个概率值的和为1,其中更接近1的是正确值。
优选地,所述S1包括如下步骤:
S11、需从病人的CT扫描中获取肺部的CT切片;
S12、需要对病人的基因组进行检测,对病人进行验血检测蛋白质表达情况,咨询吸烟情况,咨询工作环境;
S13、将获取的CT图像进行标注。
优选地,所述主要神经网络由一个卷积层(C1),leaky_relu激活,第二个卷积层(C2),leaky_relu激活,第一个池化层(P1,大小2x2),第三个卷积层(C3),leaky_relu激活,第四个卷积层(C4),leaky_relu激活,第二层池化层(P2,大小2x2),第五层卷积层(C5),leaky_relu激活,第六层卷积层(C6),leaky_relu激活,第三层池化层(P3,大小7x7),然后经过softmax将输出值变成概率输出构成。
优选地,用于分析基因组表达谱的次要神经网络中,用0和1来代表基因未表达和表达,搭建分析基因组因素的神经网络;先将基因组表达与否和是否患病关联起来,收集的有关基因数目为36个,组成大小为【6,6】的数组,该数组将只有0和1两个值,每一个数组对应一个患者,给该数组贴上标签是否患病;该神经网络只有一层卷积层,该层卷积层采用的是大小为【2,2】,步长为1,通道数为2的卷积核进行卷积;其输出层把卷积层的输出值经过softmax处理变成概率输出,然后除以一个有限值,所述有限值是收集的数据中患肺癌并且相关基因表达多达18个的人数占总人数的概率,再将得到的值当做权值。
优选地,用于分析蛋白质表达谱的次要神经网络中,先将病人蛋白质表达与否和是否患病关联起来,收集的有关蛋白质表达情况数目为36个,组成大小为【6,6】的数组,该数组只有0和1两个值,每一个数组对应一个患者,给该数组贴上标签是否患病;该神经网络只有一层卷积层,该层卷积层采用的是大小为【2,2】,步长为1,通道数为2的卷积核进行卷积;其输出层把卷积层的输出值经过softmax处理变成概率输出,然后除以一个有限值,所述有限值是收集的数据中患肺癌并且相关蛋白质表达多达18个的人数占总人数的概率,再将得到的值当做权值。
优选地,用于分析吸烟情况的次要神经网络中,先将病人是否有过戒烟,用1表示没有,0表示有;生活作息是否规律,1表示不规律,0表示规律;基因表达情况与蛋白质表达情况的和;加上环境等级,用这四个数据组成一个【2,2】的数组;该神经网络使用大小为【2,2】,步长为1,通道数为2的卷积核进行卷积;其输出层把卷积层的输出值经过softmax处理变成概率输出,然后除以一个有限值,所述有限值是收集的数据中患肺癌并且有吸烟的人数占总人数的概率,再将得到的值当做权值。
优选地,用于分析工作环境的次要神经网络中,先将工作环境的优劣等级分为,0、1、2、3、4、5、6、7、8、9这十个等级;工作压力是否很大,1代表很大,0代表不大;空气污染等级;工作附近有无施工,1代表有,0代表无,将这四个数据组成【2,2】的数组;该神经网络将使用大小为【2,2】,步长为1,通道数为2的卷积核进行卷积;其输出层把卷积层的输出值经过softmax处理变成概率输出,然后除以一个有限值,所述有限值是收集的数据中患肺癌的人数占总人数的概率,再将得到的值当做权值。
更优选地,将四个次要神经网络得到的权值插入主要神经网络的输出层,将主要神经网络的概率加上各权值再次求概率,然后经过损失函数,再经过梯度优化器,然后完成整个神经网络的搭建。
综上所述,本发明的有益效果为:
采用本发明的方法检测CT图像,可以辅助医生显著提高肺癌诊断的准确率和效率。
附图说明
图1为次要神经网络的功能示意图;
图2为主要神经网络和次要神经网络的作用关系示意图;
图3为主要神经网络的结构示意图;
图4为主要神经网络隐藏层的结构示意图;
图5为分析蛋白质表达因素的次要神经网络的结构示意图;
图6为分析基因表达因素的次要神经网络的结构示意图;
图7为分析吸烟年龄因素的次要神经网络的结构示意图;
图8为分析工作环境因素的次要神经网络的结构示意图;
图9为本发明的检测方法的原理示意图。
具体实施方式
本发明涉及使用多个神经网络联合提高检测肺癌准确率的方法;其公开了一种使用多重卷积神经网络联合预测肺癌发展趋势的方法;首先,搭建一个以卷积神经网络为主体的神经网络,该主体由输入层,卷积层,输出层构成,输入层输入的是CT图像,隐藏则由四层卷积层和两层平均池化层构成,每两层卷积层后面跟一层平均池化层,输出层则用softmax将输出结果变成概率输出,两个概率值和为1,越接近1的就是正确值;同时,搭建四个次要神经网络,分别学习病人基因组,蛋白质表达情况,工作环境,吸烟情况等四种对病人病情有影响的因素,这四种另外的因素应与病人的CT图像同时获取,用以保证相关性;经过四个次要神经网络的分析之后,输出四个值,这四个值将会代入主要神经网络中的输出层那里,用来影响输出概率,经过多次卷积学习判断该CT图像是否具有肺癌病特征,以辅助医生诊断。
为更好的说明本发明的目的、技术方案和优点,下面将结合附图和具体实施例对本发明作进一步说明。
实施例1
参见图1~9,本发明的基于卷积神经网络检测CT图像的方法的一种实施例,包括如下步骤:(1)搭建一个卷积神经网络为主体;
使用该主体卷积神经网络对CT图像进行分析,检测是否有肺癌;
该主体卷积神经网络由输入层,隐藏层和输出层构成;
输入层输入的数据是CT图像;
输入CT图像之前将会对CT图像进行预处理;
将所有CT图像变成相同大小为【28,28】的图像;
隐藏层将由六层卷积层和三层全局平均池化层组成;
隐藏层结构是两卷积一池化、两卷积一池化的结构;
第一层卷积层采用一个大小为【3,3】,步长为1,通道数为8的卷积核对原图像进行特征提取,然后组成特征图,padding=‘SAME’;
采用的激活函数是leaky_relu的激活函数;
第二层卷积层采用一个大小为【3,3】,步长为1,通道数为16的卷积核对第一层卷积层的输出进行卷积,然后组成第二个特征图,padding=’SAME’;
第一层池化层采用的是大小为【2,2】,步长为2的池化层对第二层卷积层的输出进行池化,padding=‘SAME’;
第三层卷积层采用的是大小为【3,3】,步长为1,通道数32的卷积核对第一层池化层的输出进行卷积,然后组成第三个特征图,padding=‘SAME’;
第四层卷积层采用的是大小为【3,3】,步长为1,通道数为64的卷积核对第三层卷积层的输出进行卷积,然后组成第四个特征图,padding=‘SAME’;
第二层池化层采用的是大小为【2,2】,步长为2的池化层对第四层卷积层的输出进行池化,padding=‘SAME’;
第五层卷积层采用的是大小为【3,3】,步长为1,通道数为128的卷积核对第二层池化层输出进行卷积,然后组成第五个特征图,padding=‘SAME’;
第六层卷积层采用的是大小为【3,3】,步长为1,通道数为2的卷积核对第五层卷积层输出进行卷积,然后组成第五个特征图,padding=‘SAME’;
第三层池化层采用的是大小为【7,7】,步长为7的池化层对第六层卷积层的输出进行池化,padding=‘SAME’;
输出层将会用softmax把卷积层输出结果变成概率输出,将会有两个概率,两个概率总和为1,越接近1的表示越是正确;
然后搭建四个次要神经网络。
(2)搭建分析基因组因素的神经网络:基因表达用0和1来代表未表达和表达;
先将基因组表达与否和是否患病关联起来,收集的有关基因数目可以是36个,组成大小为【6,6】的数组,该数组将只有0和1两个值,每一个数组对应一个患者,给该数组贴上标签是否患病;
该神经网络将只有一层卷积层;
该层卷积层采用的是大小为【2,2】,步长为1,通道数为2,的卷积核进行卷积;Padding=‘SAME’;
输出层把卷积层的输出值经过softmax处理变成概率输出,然后除以一个有限值,这个有限值将会是收集的数据中患肺癌并且相关基因表达多达18个的人数占总人数的概率,再把得到的值当做权值;
(3)搭建分析蛋白质表达因素的神经网络:蛋白表达用0和1来代表未表达和表达;
先将蛋白质表达情况与否和是否患病关联起来,收集的有关蛋白质表达情况数目可以是36个,组成大小为【6,6】的数组,该数组将只有0和1两个值,每一个数组对应一个患者,给该数组贴上标签是否患病;
该神经网络将只有一层卷积层;
该层卷积层采用的是大小为【2,2】,步长为1,通道数为2的卷积核进行卷积;Padding=‘SAME’;
输出层把卷积层的输出值经过softmax处理变成概率输出,然后除以一个有限值,这个有限值将会是收集的数据中患肺癌并且相关蛋白质表达多达18个的人数占总人数的概率,再把得到的值当做权值;
(4)搭建分析吸烟情况的神经网络:
烟龄使用实际吸烟年数;是否有过戒烟,用1表示没有,0表示有;其他三因素的表现情况如何,基因表达数和蛋白质表达数的和加上环境等级;生活作息是否规律,1表示不规律,0表示规律,用这四个数据组成一个【2,2】的数组;
该神经网络将使用大小为【2,2】,步长为1,通道数为2的卷积核进行卷积;Padding=‘SAME’;
输出层把卷积层的输出值经过softmax处理变成概率输出,然后除以一个有限值,这个有限值将会是收集的数据中患肺癌并且有吸烟的人数占总人数的概率,再把得到的值当做权值;
(5)搭建分析工作环境的神经网络:
将工作环境的优劣等级分为,0,1,2,3,4,5,6,7,8,9这十个等级;工作压力是否很大,1代表很大,0代表不大;空气污染等级;工作附近有无施工,1代表有,0代表无,将这四个数据组成【2,2】的数组;
该神经网络将使用大小为【2,2】,步长为1,通道数为2的卷积核进行卷积;Padding=‘SAME’;
输出层把卷积层的输出值经过softmax处理变成概率输出,然后除以一个有限值,这个有限值将会是收集的数据中患肺癌的人数占总人数的概率,再把得到的值当做权值,将四个次要神经网络得到的权值插入主要神经网络的输出层,将主要神经网络的概率加上各权值再次求概率,然后经过损失函数,再经过梯度优化器,然后完成整个神经网络的搭建。
实施例2
参见图1~9,本发明的基于卷积神经网络检测CT图像的方法的一种实施例,采用多重卷积神经网络对CT图像进行检测的方法,适于在计算设备中执行,包括如下步骤:
(1)获取病人配套的CT图像,基因组表达,蛋白质表达,吸烟情况,工作环境信息,并对CT图像标注以获得数据集;
(2)根据步骤(1)的信息,搭建一个主要神经网络,4个次要神经网络;
(3)使用已标注的数据集对神经网络进行训练;
(4)使用训练完成的卷积神经网络对CT图像进行识别检测。
其中,所述步骤(1)包括:
1.1、从病人的CT扫描中获取肺部的CT切片;
1.2、对病人的基因组进行检测,对病人进行验血检测蛋白质表达情况,咨询吸烟情况,咨询工作环境。
1.3、将获取的CT图像进行标注。其中,标注包括根据病情,将已确诊病人的CT图像标注为患有某种癌症,或者标注为未患癌症,以及癌症早期、癌症中期、癌症晚期等。
所述步骤(2)包括:
2.1、主要神经网络是由一个卷积层(C1),leaky_relu激活,第二个卷积层(C2),leaky_relu激活,第一个池化层(P1,大小2x2),第三个卷积层(C3),leaky_relu激活,第四个卷积层(C4),leaky_relu激活,第二层池化层(P2,大小2x2),第五层卷积层(C5),leaky_relu激活,第六层卷积层(C6),leaky_relu激活,第三层池化层(P3,大小7x7),然后经过softmax将输出值变成概率输出构成;
2.2、关于基因组表达情况的次要神经网络,先将基因组表达用0和1来代表未表达和表达,搭建分析基因组因素的神经网络先将基因组表达与否和是否患病关联起来,收集的有关基因数目可以是36个,组成大小为【6,6】的数组,该数组将只有0和1两个值,每一个数组对应一个患者,给该数组贴上标签是否患病。该神经网络将只有一层卷积层;该层卷积层采用的是大小为【2,2】,步长为1,通道数为2,的卷积核进行卷积;Padding=‘SAME’;输出层把卷积层的输出值经过softmax处理变成概率输出,然后除以一个有限值,这个有限值将会是收集的数据中患肺癌并且相关基因表达多达18个的人数占总人数的概率,再把得到的值当做权值;
2.3、关于蛋白质表达情况的次要神经网络,先将蛋白质表达情况与否和是否患病关联起来,收集的有关蛋白质表达情况数目可以是36个,组成大小为【6,6】的数组,该数组将只有0和1两个值,每一个数组对应一个患者,给该数组贴上标签是否患病,该神经网络将只有一层卷积层,该层卷积层采用的是大小为【2,2】,步长为1,通道数为2的卷积核进行卷积;Padding=‘SAME’;其输出层把卷积层的输出值经过softmax处理变成概率输出,然后除以一个有限值,这个有限值将会是收集的数据中患肺癌并且相关蛋白质表达多达18个的人数占总人数的概率,再把得到的值当做权值;
2.4、关于烟龄(使用实际吸烟年数)的次要神经网络,先将是否有过戒烟,用1表示没有,0表示有;其他三因素的表现情况如何,基因表达数和蛋白质表达数的和;环境等级;生活作息是否规律,1表示不规律,0表示规律;用这四个数据组成一个【2,2】的数组;该神经网络将使用大小为【2,2】,步长为1,通道数为2的卷积核进行卷积,Padding=‘SAME’;其输出层把卷积层的输出值经过softmax处理变成概率输出,然后除以一个有限值,这个有限值将会是收集的数据中患肺癌并且有吸烟的人数占总人数的概率,再把得到的值当做权值;
2.5、关于工作环境的次要神经网络,先将工作环境的优劣等级分为,0,1,2,3,4,5,6,7,8,9这十个等级;工作压力是否很大,1代表很大,0代表不大;空气污染等级;工作附近有无施工,1代表有,0代表无,将这四个数据组成【2,2】的数组,该神经网络将使用大小为【2,2】,步长为1,通道数为2的卷积核进行卷积,Padding=‘SAME’;其输出层把卷积层的输出值经过softmax处理变成概率输出,然后除以一个有限值,这个有限值将会是收集的数据中患肺癌的人数占总人数的概率,再把得到的值当做权值;
将四个次要神经网络得到的权值插入主要神经网络的输出层,将主要神经网络的概率加上各权值再次求概率,然后经过损失函数,再经过梯度优化器,然后完成整个神经网络的搭建。
实施例3
参见图1~9,本发明的基于卷积神经网络检测CT图像的方法的一种实施例,包括如下步骤:
S1、提供病人的CT图像、基因组表达谱、蛋白质表达谱、吸烟情况和工作环境信息,并对CT图像进行标注获得数据集;
S2、根据步骤S1所述信息搭建一个主要神经网络和四个次要神经网络,其中,主要神经网络以卷积神经网络为主体,四个次要神经网络分别用于分析基因组表达谱、蛋白质表达谱、吸烟情况和工作环境对病人病情影响的大小并输出相应的权值;
S3、用已标注的数据集对所述主要神经网络进行训练,代入所述次要神经网络输出的权值,以判断病人的CT图像是否具有肺癌相应特征。
其中,主体由输入层、隐藏层和输出层构成,所述输入层输入CT图像,隐藏层由四层卷积层和两层平均池化层构成,每两层卷积层后面连接一层平均池化层,所述输出层用softmax将输出结果变成概率输出,两个概率值的和为1,其中更接近1的是正确值;
S1包括如下步骤:
S11、需从病人的CT扫描中获取肺部的CT切片;
S12、需要对病人的基因组进行检测,对病人进行验血检测蛋白质表达情况,咨询吸烟情况,咨询工作环境;
S13、将获取的CT图像进行标注;
S2中:
主要神经网络由一个卷积层(C1),leaky_relu激活,第二个卷积层(C2),leaky_relu激活,第一个池化层(P1,大小2x2),第三个卷积层(C3),leaky_relu激活,第四个卷积层(C4),leaky_relu激活,第二层池化层(P2,大小2x2),第五层卷积层(C5),leaky_relu激活,第六层卷积层(C6),leaky_relu激活,第三层池化层(P3,大小7x7),然后经过softmax将输出值变成概率输出构成;
用于分析基因组表达谱的次要神经网络中,用0和1来代表基因未表达和表达,搭建分析基因组因素的神经网络;先将基因组表达与否和是否患病关联起来,收集的有关基因数目为36个,组成大小为【6,6】的数组,该数组将只有0和1两个值,每一个数组对应一个患者,给该数组贴上标签是否患病;该神经网络只有一层卷积层,该层卷积层采用的是大小为【2,2】,步长为1,通道数为2的卷积核进行卷积;其输出层把卷积层的输出值经过softmax处理变成概率输出,然后除以一个有限值,所述有限值是收集的数据中患肺癌并且相关基因表达多达18个的人数占总人数的概率,再将得到的值当做权值;
用于分析蛋白质表达谱的次要神经网络中,先将病人蛋白质表达与否和是否患病关联起来,收集的有关蛋白质表达情况数目为36个,组成大小为【6,6】的数组,该数组只有0和1两个值,每一个数组对应一个患者,给该数组贴上标签是否患病;该神经网络只有一层卷积层,该层卷积层采用的是大小为【2,2】,步长为1,通道数为2的卷积核进行卷积;其输出层把卷积层的输出值经过softmax处理变成概率输出,然后除以一个有限值,所述有限值是收集的数据中患肺癌并且相关蛋白质表达多达18个的人数占总人数的概率,再将得到的值当做权值;
用于分析吸烟情况的次要神经网络中,先将病人是否有过戒烟,用1表示没有,0表示有;生活作息是否规律,1表示不规律,0表示规律;基因表达情况与蛋白质表达情况的和;加上环境等级,用这四个数据组成一个【2,2】的数组;该神经网络使用大小为【2,2】,步长为1,通道数为2的卷积核进行卷积;其输出层把卷积层的输出值经过softmax处理变成概率输出,然后除以一个有限值,所述有限值是收集的数据中患肺癌并且有吸烟的人数占总人数的概率,再将得到的值当做权值;
用于分析工作环境的次要神经网络中,先将工作环境的优劣等级分为,0、1、2、3、4、5、6、7、8、9这十个等级;工作压力是否很大,1代表很大,0代表不大;空气污染等级;工作附近有无施工,1代表有,0代表无,将这四个数据组成【2,2】的数组;该神经网络将使用大小为【2,2】,步长为1,通道数为2的卷积核进行卷积;其输出层把卷积层的输出值经过softmax处理变成概率输出,然后除以一个有限值,所述有限值是收集的数据中患肺癌的人数占总人数的概率,再将得到的值当做权值;
将四个次要神经网络得到的权值插入主要神经网络的输出层,将主要神经网络的概率加上各权值再次求概率,然后经过损失函数,再经过梯度优化器,然后完成整个神经网络的搭建。
应用例4
IBM的沃森医生在治疗肺癌时,采用了实施例1的CT图像检测方法,在应用的时候,沃森医生识别病人的CT图像,然后根据自己之前学习到的医疗知识给出诊断结果和医疗建议,沃森医生给出的治疗建议96%的情况下与临床医生的治疗方案相吻合;应用实施例1的CT图像检测方法以辅助诊断直肠癌时,与临床医生建议的吻合率也分别高达93%。
四川大学华西医院与依图医疗公司合作研发出国内首个肺癌临床科研智能病种库(以下简称“肺癌病种库”)和全球首个肺癌多学科智能诊断系统,其中采用了实施例1的CT图像检测方法,对数据CT图像的筛选准确率达到99.3%。
最后所应当说明的是,以上实施例仅用以说明本发明的技术方案而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。

Claims (8)

1.一种基于卷积神经网络检测CT图像的方法,其特征在于,包括如下步骤:
S1、提供病人的CT图像、基因组表达谱、蛋白质表达谱、吸烟情况和工作环境信息,并对CT图像进行标注获得数据集;
S2、根据步骤S1提供的CT图像、基因组表达谱、蛋白质表达谱、吸烟情况和工作环境信息搭建一个主要神经网络和四个次要神经网络,其中,主要神经网络以卷积神经网络为主体,四个次要神经网络分别用于分析基因组表达谱、蛋白质表达谱、吸烟情况和工作环境对病人病情影响的大小并输出相应的权值;
S3、用已标注的数据集对所述主要神经网络进行训练,代入所述次要神经网络输出的权值,以判断病人的CT图像是否具有肺癌相应特征。
2.根据权利要求1所述的方法,其特征在于,所述主体由输入层、隐藏层和输出层构成,所述输入层输入CT图像,隐藏层由四层卷积层和两层平均池化层构成,每两层卷积层后面连接一层平均池化层,所述输出层用softmax将输出结果变成概率输出,两个概率值的和为1,其中更接近1的是正确值;其中两个概率值分别为患者有无肺癌的概率。
3.根据权利要求1所述的方法,其特征在于,所述S1包括如下步骤:
S11、需从病人的CT扫描中获取肺部的CT切片;
S12、需要对病人的基因组进行检测,对病人进行验血检测蛋白质表达情况,咨询吸烟情况,咨询工作环境;
S13、将获取的CT图像进行标注。
4.根据权利要求1所述的方法,其特征在于,所述主要神经网络由一个卷积层,leaky_relu激活,第二个卷积层,leaky_relu激活,第一个池化层,第一个池化层大小为2x2,第三个卷积层,leaky_relu激活,第四个卷积层,leaky_relu激活,第二层池化层,第二层池化层大小为2x2,第五层卷积层,leaky_relu激活,第六层卷积层,leaky_relu激活,第三层池化层,第三层池化层大小为7x7,然后经过softmax将输出值变成概率输出构成,其中概率输出为患者有无肺癌的概率输出。
5.根据权利要求1所述的方法,其特征在于,用于分析基因组表达谱的次要神经网络中,用0和1来代表基因未表达和表达,搭建分析基因组因素的神经网络;先将基因组表达与否和是否患病关联起来,收集的有关基因数目为36个,组成大小为【6,6】的数组,该数组将只有0和1两个值,每一个数组对应一个患者,给该数组贴上标签是否患病;该神经网络只有一层卷积层,该层卷积层采用的是大小为【2,2】,步长为1,通道数为2的卷积核进行卷积;其输出层把卷积层的输出值经过softmax处理变成概率输出,然后除以一个有限值,所述有限值是收集的数据中患肺癌并且相关基因表达多达18个的人数占总人数的概率,再将得到的值当做权值;其中概率输出为患者有无肺癌的概率输出。
6.根据权利要求1所述的方法,其特征在于,用于分析蛋白质表达谱的次要神经网络中,先将病人蛋白质表达与否和是否患病关联起来,收集的有关蛋白质表达情况数目为36个,组成大小为【6,6】的数组,该数组只有0和1两个值,每一个数组对应一个患者,给该数组贴上标签是否患病;该神经网络只有一层卷积层,该层卷积层采用的是大小为【2,2】,步长为1,通道数为2的卷积核进行卷积;其输出层把卷积层的输出值经过softmax处理变成概率输出,然后除以一个有限值,所述有限值是收集的数据中患肺癌并且相关蛋白质表达多达18个的人数占总人数的概率,再将得到的值当做权值;其中概率输出为患者有无肺癌的概率输出。
7.根据权利要求1所述的方法,其特征在于,用于分析吸烟情况的次要神经网络中,先将病人是否有过戒烟,用1表示没有,0表示有;生活作息是否规律,1表示不规律,0表示规律;基因表达情况与蛋白质表达情况的和;加上环境等级,用这四个数据组成一个【2,2】的数组;该神经网络使用大小为【2,2】,步长为1,通道数为2的卷积核进行卷积;其输出层把卷积层的输出值经过softmax处理变成概率输出,然后除以一个有限值,所述有限值是收集的数据中患肺癌并且有吸烟的人数占总人数的概率,再将得到的值当做权值;其中概率输出为患者有无肺癌的概率输出。
8.根据权利要求1所述的方法,其特征在于,用于分析工作环境的次要神经网络中,先将工作环境的优劣等级分为,0、1、2、3、4、5、6、7、8、9这十个等级;工作压力是否很大,1代表很大,0代表不大;空气污染等级;工作附近有无施工,1代表有,0代表无,将这四个数据组成【2,2】的数组;该神经网络将使用大小为【2,2】,步长为1,通道数为2的卷积核进行卷积;其输出层把卷积层的输出值经过softmax处理变成概率输出,然后除以一个有限值,所述有限值是收集的数据中患肺癌的人数占总人数的概率,再将得到的值当做权值;其中概率输出为患者有无肺癌的概率输出。
CN201811316415.4A 2018-11-06 2018-11-06 一种基于卷积神经网络检测ct图像的方法 Active CN109492690B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811316415.4A CN109492690B (zh) 2018-11-06 2018-11-06 一种基于卷积神经网络检测ct图像的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811316415.4A CN109492690B (zh) 2018-11-06 2018-11-06 一种基于卷积神经网络检测ct图像的方法

Publications (2)

Publication Number Publication Date
CN109492690A CN109492690A (zh) 2019-03-19
CN109492690B true CN109492690B (zh) 2021-11-30

Family

ID=65693937

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811316415.4A Active CN109492690B (zh) 2018-11-06 2018-11-06 一种基于卷积神经网络检测ct图像的方法

Country Status (1)

Country Link
CN (1) CN109492690B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112420195A (zh) * 2020-11-06 2021-02-26 清华大学 一种高血压风险预测方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060034508A1 (en) * 2004-06-07 2006-02-16 Zhou Xiang S Computer system and method for medical assistance with imaging and genetics information fusion
CN107767960A (zh) * 2017-09-13 2018-03-06 温州悦康信息技术有限公司 临床检测项目的数据处理方法、装置及电子设备
CN108197427B (zh) * 2018-01-02 2020-09-04 山东师范大学 基于深度卷积神经网络的蛋白质亚细胞定位方法和装置
CN108198179A (zh) * 2018-01-03 2018-06-22 华南理工大学 一种生成对抗网络改进的ct医学图像肺结节检测方法
CN108389201B (zh) * 2018-03-16 2020-06-30 北京推想科技有限公司 基于3d卷积神经网络与深度学习的肺结节良恶性分类方法

Also Published As

Publication number Publication date
CN109492690A (zh) 2019-03-19

Similar Documents

Publication Publication Date Title
Yang et al. Deep learning for detecting corona virus disease 2019 (COVID-19) on high-resolution computed tomography: a pilot study
CN108389201B (zh) 基于3d卷积神经网络与深度学习的肺结节良恶性分类方法
WO2022063200A1 (zh) 用于非小细胞肺癌预后生存预测的方法、介质及电子设备
Chetty et al. Role of attributes selection in classification of Chronic Kidney Disease patients
CN110991536B (zh) 原发性肝癌的早期预警模型的训练方法
CN113077434B (zh) 基于多模态信息的肺癌识别方法、装置及存储介质
CN108511056A (zh) 基于脑卒中患者相似性分析的治疗方案推荐方法及系统
CN110141220A (zh) 基于多模态融合神经网络的心肌梗死自动检测方法
CN113077875B (zh) Ct影像的处理方法及装置
CN107145715B (zh) 一种基于推举算法的临床医学智能判别装置
CN111370059A (zh) 一种肿瘤突变负荷的预测系统及方法
Liu et al. Multi-branch fusion auxiliary learning for the detection of pneumonia from chest X-ray images
CN113380396A (zh) 一种基于粪便微生物标志物和人dna含量的多种肠道疾病风险评估的方法及应用
CN109492690B (zh) 一种基于卷积神经网络检测ct图像的方法
CN114098779A (zh) 尘肺病等级智能判别方法
CN117010971B (zh) 一种基于人像识别的智能健康险提供方法及系统
CN114317725B (zh) 克罗恩病生物标志物、试剂盒及生物标志物的筛选方法
Sari et al. Best performance comparative analysis of architecture deep learning on ct images for lung nodules classification
CN114494191A (zh) 医用图像处理方法、设备及计算机存储介质
CN112562851A (zh) 一种口腔癌颈部淋巴转移诊断算法的构建方法及系统
CN117197434B (zh) 基于AMFNet网络融合模型的肺部医学影像精准识别方法
CN108376567A (zh) 一种基于标签传播算法的临床药品-药品不良反应检测方法
de Assis et al. The Use of Convolutional Neural Networks in the Prediction of Invasive Ductal Carcinoma in Histological Images of Breast Cancer.
CN114822784A (zh) 一种基于超声图像的原发性肝癌诊断模型构建方法
CN115620817A (zh) 基于肠道微生物菌群的病症信息处理方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant