CN107154043B - 一种基于3dcnn的肺结节假阳性样本抑制方法 - Google Patents
一种基于3dcnn的肺结节假阳性样本抑制方法 Download PDFInfo
- Publication number
- CN107154043B CN107154043B CN201710411683.3A CN201710411683A CN107154043B CN 107154043 B CN107154043 B CN 107154043B CN 201710411683 A CN201710411683 A CN 201710411683A CN 107154043 B CN107154043 B CN 107154043B
- Authority
- CN
- China
- Prior art keywords
- data
- training
- layer
- samples
- size
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 230000005764 inhibitory process Effects 0.000 title claims abstract description 14
- 230000002685 pulmonary effect Effects 0.000 title claims description 8
- 206010056342 Pulmonary mass Diseases 0.000 claims abstract description 38
- 238000012549 training Methods 0.000 claims abstract description 28
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 27
- 210000004072 lung Anatomy 0.000 claims abstract description 10
- 230000006870 function Effects 0.000 claims description 18
- 238000011176 pooling Methods 0.000 claims description 16
- 238000001514 detection method Methods 0.000 claims description 14
- 238000012545 processing Methods 0.000 claims description 10
- FGUUSXIOTUKUDN-IBGZPJMESA-N C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 Chemical compound C1(=CC=CC=C1)N1C2=C(NC([C@H](C1)NC=1OC(=NN=1)C1=CC=CC=C1)=O)C=CC=C2 FGUUSXIOTUKUDN-IBGZPJMESA-N 0.000 claims description 8
- 238000013528 artificial neural network Methods 0.000 claims description 8
- 230000004913 activation Effects 0.000 claims description 4
- 230000008569 process Effects 0.000 claims description 4
- 238000013519 translation Methods 0.000 claims description 4
- 230000002401 inhibitory effect Effects 0.000 claims description 3
- 210000002569 neuron Anatomy 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 5
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 8
- 201000005202 lung cancer Diseases 0.000 description 8
- 208000020816 lung neoplasm Diseases 0.000 description 8
- 238000013135 deep learning Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000004195 computer-aided diagnosis Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 230000035945 sensitivity Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 230000001629 suppression Effects 0.000 description 3
- 201000011510 cancer Diseases 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 230000004083 survival effect Effects 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 1
- 230000003416 augmentation Effects 0.000 description 1
- 238000013170 computed tomography imaging Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000013101 initial test Methods 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4007—Scaling of whole images or parts thereof, e.g. expanding or contracting based on interpolation, e.g. bilinear interpolation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10072—Tomographic images
- G06T2207/10081—Computed x-ray tomography [CT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30061—Lung
- G06T2207/30064—Lung nodule
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- Radiology & Medical Imaging (AREA)
- Quality & Reliability (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Image Analysis (AREA)
- Apparatus For Radiation Diagnosis (AREA)
Abstract
本发明公开了一种基于3D CNN(Convolutional Neural Networks,卷积神经网络)的肺结节假阳性样本抑制方法,包括如下步骤:1)对肺部CT通过插值进行3D重建;2)根据待抑制的样本坐标,从重建数据中切出固定大小的立方块,将其归一化,并对阳性样本进行扩充,将阴阳性样本一起作为3D CNN的训练数据;3)使用训练样本训练3D CNN模型;4)训练模型时对标准的损失函数进行加权修正,对阴阳性样本分别赋予不同权值。循环迭代训练网络,最终得到3D CNN模型。本发明提供的基于3D CNN训练模型的方法,一方面有效利用肺部CT数据的三维特征,能够最大程度上反映样本信息;另一方面通过对模型训练时的损失函数进行加权,完美解决了真假样本不均衡的问题,因而能够训练出肺结节识别效果很好的模型。
Description
技术领域
本发明属于医学影像的智能诊断领域,尤其涉及一种基于3DCNN的肺结节假阳性样本抑制方法。
背景技术
肺结节的检测对于肺部CT影像的处理十分关键,它是肺癌在早期状态的一种主要表现形式。而对于肺结节进行有效的早期检测和筛查能显著提高肺癌患者的五年存活率,因此具有十分重要的研究价值和意义。
虽然目前随着CT影像技术和各种新型诊断、检测手段的出现和发展,以及各种新型CT技术的出现,使得肺癌的诊断相比之前变得相对容易,但因为在早期发现癌症仍然不易,而且新型CT技术,如多排CT产生数量巨大的CT片子,会给影像科医生的阅片增加繁重负担,在高强度的工作下,造成漏诊率偏高;再者,即使医生给出了结果,但对初期恶性肿瘤的误诊率较高,常常使得病人疏于防范,仍然不能在早期发现肺癌病例,造成发现时已经很难治愈。
为了把影像科医生从繁重的阅片负担中解脱出来,众多科研人员先后研制了肺部影像计算机辅助诊断系统,即肺部CAD(Computer Aided Diagnosis,计算机辅助诊断),辅助医生进行肺结节检测、肺结节良恶性判断等工作。
当前相关研究领域中基于肺部CT影像进行计算机辅助肺结节的自动检测系统一般包括两个关键步骤:
第一步是肺结节候选点检测,即通过一些阈值规则进行粗略的候选区域筛选,这些候选区域中,包含肺结节的则定义为阳性样本,否则定义为阴性样本或假阳性样本。
第二步是假阳性样本抑制,即通过训练一个合适的肺结节分类器,对正负样本进行分类,最终选择出真正包含结节的候选区。
通常情况下,由第一步检测得到的候选点中除了真实的阳性样本外,还会包含大量的假阳性样本,选用合适的技术方案对候选点中的假阳性样本进行抑制,是提高肺结节检测系统精度的重要步骤和手段。
目前的假阳性样本抑制方法多基于传统的图像处理方法,这些方法基于阳性样本和假阳性样本之间的区别,通过人工选择和设计的特征来设计分类器,对真假阳性样本进行分类,从而达到假阳性样本抑制的效果。但肺结节的真假阳性样本区分度十分不明显,人工选择和设计能够将其区分开来的特征任务复杂,往往需要具有丰富专业知识的研究者长达数年的研究,才能选择出符合任务需求的特征,建立分类器;而一旦任务发生了变化,已经选择和设计的特征失效,还需要根据新任务的特点选择和设计新的特征。如此研究,耗费大量的人力物力,还不能取得令人满意的效果。
深度学习是近年来随着各类研究中数据量的增大、计算机计算能力的增强以及人工神经网络模型中的一些关键技术的推演而由传统人工神经网络发展来的具有强大拟合和泛化能力的分析模型。因为其不需要研究者手动选择和设计特征,能够根据不同的具体应用自动对图像中的特征进行分析提取,深度学习在图像分析处理中获得了广泛应用,并取得了很大成功。比如在经典的ImageNet图像分类识别比赛中,深度学习如今已经具有统治地位,基于深度学习而开发的算法已经获得了超越人类水平的结果[1][2]。
对CT影像进行肺结节检测和假阳性抑制是一个典型的图像处理中的识别和分类任务,使用基于深度学习技术而研发的3D深度网络能够综合分析肺结节的3D图像特征,并通过对损失函数的加权操作巧妙地解决真假阳性样本不均衡的问题,从而训练出对肺结节特征进行有效提取并对真假阳性样本精准分类的3D深度神经网络模型,解决这一肺部CAD系统中的重要问题。
发明内容
本发明的目的在于提供一种基于3DCNN的肺结节假阳性样本抑制方法,旨在通过训练3D CNN模型对肺部CT图像中检测到的肺结节候选点进行假阳性抑制,以达到准确检测肺结节,从而筛查早期肺癌,提高潜在肺癌病人的生存可能性。
为实现上述目的,本发明提供的基于3DCNN的肺结节假阳性样本抑制方法包括以下步骤:
a)从肺部CT影像序列数据中检测肺结节候选点坐标;
b)对原始的DICOM图像进行插值,得到插值后的3D原始图像数据;
c)对此前检测得到的候选点坐标,按照如上b)插值步骤进行相应处理,将其映射到插值后的 3D原始图像数据上;
d)对于每个候选点,根据其转换后的坐标,从插值后的3D原始图像数据中切出3D数据,作为训练样本;
e)根据每个候选点的坐标,与原始图像中的标签(label)进行对应,为步骤c)中切出的每一个3D数据贴上相应的label;
f)使用准备好的3D数据训练3D CNN网络;
g)使用训练得到的3D CNN模型对候选点进行假阳性抑制。
进一步地,所述步骤b)中对原始DICOM图像进行插值,将Z方向的切片间隔(spacing) 插值为与X、Y方向的像素间隔相等。这样,在插值完成后,X、Y、Z三个方向的间隔相等。
进一步地,所述步骤d)中,根据转换后的候选点坐标,从插值后的3D原始图像数据中切出3D数据,切出数据的长宽高(X、Y、Z方向)均为40像素,即数据大小为40×40 ×40。随后对切出的数据进行如下处理:将小于-1000HU的数据置为-1000HU,将大于400HU 的数据置为400HU,并将处理后的图像数据归一化到0到1之间。如果候选点为阳性样本,则还需要对其进行数据扩充(augmentation),扩充方式包括平移、缩放和旋转等。对每一个阳性样本扩充个数大约为阴性样本总数除以原始阳性样本个数(如果所除结果不是整数,则取最近的整数),以使得扩充后的阴阳性样本均衡。
进一步地,所述步骤e)中,为每一个3D数据贴上相应的label:如果候选点距任意一个结节的外接边框(bounding box)中心点的距离小于该结节的半径,则候选点的label为1;否则,该候选点的label为0。
进一步地,所述步骤f)中,使用准备好的3D数据训练3D CNN网络,网络结构(如图2)如下:
输入为40×40×40大小的3D数据,逐步通过以下网络层进行处理:
卷积层1:16个大小为3×3×3的卷积核;
PreLU层1;
最大池化层1:大小为2×2×2的池化核;
卷积层2:32个大小为3×3×3的卷积核;
PreLU层2;
最大池化层2:大小为2×2×2的池化核;
卷积层3:64个大小为3×3×3的卷积核;
PreLU层3;
最大池化层3:大小为2×2×2的池化核;
卷积层4:128个大小为3×3×3的卷积核;
PreLU层4;
最大池化层4:大小为2×2×2的池化核;
输出数据拉伸为大小为128×2×2×2即1024的一列数据;
全连层1:大小为1024×32的核;
Dropout层:Drop概率为0.5;
全连层2:大小为32×2的核;
Softmax层;
得到的输出,即为输入样本分别属于阴阳性样本的概率。
进一步地,所述步骤f)中3D CNN网络模型中权值参数的初始化使用K He等[3]提出的初始化激活函数为ReLU的神经网络的方式完成,该方法以方差为输入到当前层的神经元个数的倒数的2倍的截断高斯分布小随机数来初始化当前层的权值参数,如下:
var=2/Nin。
进一步地,所述步骤f)中训练3D CNN模型时,其loss函数如下:
loss=weighted_sparse_softmax_cross_entropy+l1_l2_regularizer
其中,weighted_sparse_softmax_cross_entropy为加权稀疏交叉熵损失函数,其通过如下方式构建:
对于原始的阳性样本,计算其标准的稀疏交叉熵损失函数得到损失值,并乘以一个权重,将所得乘积作为该样本的损失值;
对于其他样本,使用标准的稀疏交叉熵损失函数,计算其损失值;
对于任一batch的所有样本,将使用以上方法得到的加权损失值和不需加权的原始损失值求和,将其作为该batch最终的加权稀疏交叉熵损失函数值;
其中公式中的l1_l2_regularizer为对3D CNN模型中的各可训练参数如权值和偏差添加L1和 L2正则化项,以保证训练得到的参数的稀疏性,并保证其具有较小值,从而达到抑制模型过拟合的目的。
进一步地,所述步骤f)中训练3D CNN模型时,其学习速率设定一个初始值0.01,随后随着训练过程进行衰减调整,在训练的一个epoch中衰减5次,每次变为原来的学习速率的0.95倍。
在本发明的技术方案中,先从样本中检测到肺结节候选点,建立3D训练样本,再通过这些样本训练3D深度神经网络,训练出对肺结节特征进行有效提取并对真假阳性样本精准分类的3D深度神经网络模型。该发明方法使用损失函数的加权操作巧妙地解决真假阳性样本不均衡的问题,而在3D CNN网络模型中权值参数的初始化使用K He等[3]提出的初始化激活函数为ReLU的神经网络的方式能更好地达到目的,将本发明使用于医学临床上,能够精准高效的检测肺结节,从而筛查早期肺癌,提高患者生存可能性。
附图说明
图1是本发明方法流程图。
图2是本发明方法3D CNN网络结构图。
图3是本发明名3D肺结节样本实例。
图4是基于肺结节候选点训练的模型的FROC曲线。
具体实施方式
下面结合附图和实例来说明基于3DCNN的肺结节假阳性样本抑制方法在实际中的应用,并对本发明做进一步的说明和解释。
以被本领域研究者广泛关注和使用的肺部CT影像公开数据库LIDC中的888个切片间隔在2.5mm以内(切片间隔大于2.5mm的对小结节的研究效果大打折扣,故忽略)的病例来进行本方法的演示和说明,并随机选择其中第582个病例(Series UID为 1.3.6.1.4.1.14519.5.2.1.6279.6001.100621383016233746780170740405)进行本方法中数据处理部分的演示和说明。
如图1所示,
步骤一:前期使用候选点检测方法得到的肺结节候选点中心坐标如下所示:
-76.62,156.53,-529.43
120.13,160.73,-404.68
94.23,171.24,-392.76
等等。
第582个病例一共有602个候选点,全部LIDC病例一共有55万余肺结节候选点。在此示例中,检测出的候选点坐标为世界坐标。
步骤二:对该病例的原始图像数据进行插值处理,得到插值后的图像数据。
对应于每一个肺结节候选点的x,y,z坐标,根据对病例数据进行的插值处理过程,对中心坐标进行相应的处理和转换,并将其转换为像素坐标。
步骤三:根据转换后的病例图像数据和肺结节候选点的中心点坐标,从病例图像数据中切出大小为40×40×40像素的立方体,作为该结节候选点的图像数据。
步骤四:根据肺结节候选点的阴阳性,决定是否对该候选点进行数据扩充。
因为我们检测出的候选点一共有55万个左右,而阳性样本(即涵盖肺结节的样本)一共有1351个,所以,为保证正负样本的均衡,我们对阳性样本进行55万除以1351,即大约408倍的数据扩充。考虑到病例数据和肺结节的特点,我们选择的数据扩充方式包括:平移、缩放和旋转。平移范围在±5个像素之间,缩放比例在图像的0.9到1.1倍之间,旋转则在±30°之间。
步骤五:根据以上处理,生成用以训练模型的数据,并根据以上分析,该数据一共有大约55万×2,即110万个;此外,为了保证训练效果的最优化,我们对该数据进行了一个随机乱序。同时,为了接下来对损失函数进行加权处理的方便,我们维护了一个用以记录这110万个数据的顺序的文件,该文件中记录了每个数据的病例ID、真假阳性、是否通过数据扩充得到,等等。
从生成的数据中随机取出的一个肺结节图像图3所示。
步骤六:根据以上生成的肺结节候选点数据训练3D CNN深度神经网络,网络结构图在前面已经进行了详细描述。
此处需要注意的是,需要根据不同的数据对损失函数进行处理,包括是否需要对其进行加权,等等。比如,如果数据属于原始的55万个假阳性样本,或者数据属于阳性样本经数据扩充得到的样本,则对其损失值不进行特别处理;而对于1351个阳性样本,则需要对其损失值进行加权处理,权值取为55万除以1351,即408。同时,为处理的简便考虑,直接将由 1351个阳性样本得到的损失值乘以这个权值,并将其作为最终损失值。
步骤七:依以上分析和处理训练3D CNN,神经网络的权值初始化使用以方差为输入到当前层的神经元个数的倒数的2倍的截断高斯分布小随机数来完成,训练的一个迭代(epoch)中有110万个样本。对学习速率的选择和处理如下:初始学习速率取为0.01,每经过1/5个迭代过程,即大约22万步训练之后,学习速率下降为原来的0.95倍。如此迭代训练,直到110万个样本中1351个真阳性样本的总体正确率达到98%以上(当然,也可以根据具体需求,对其进行灵活选择),或者根据我们的经验,训练2个epoch后保存模型停下即可。
模型的训练在Ubuntu上基于Google的TensorFlow框架完成。
下面列举分析本示例在选出的LIDC的888个病例上使用本发明的方法训练3D CNN进行假阳性抑制的效果。
图4是基于551065个肺结节候选点训练的模型的FROC曲线,888个病例中平均每个病例有大约620个左右的候选点,包含1351个真阳性候选点。这些前期由其他检测方法检测出的候选点涵盖了所有1186个结节中的1120个,其敏感度为94.4%。
将图4中的数据摘录如下表:
假阳性 | 0.125 | 0.25 | 0.5 | 1 | 2 | 4 | 8 | ~620 |
敏感度 | 0.747 | 0.826 | 0.895 | 0.930 | 0.940 | 0.943 | 0.9436 | 0.944 |
最初的检测结果为,在每个病例有大约620个假阳性样本的情况下,其敏感度为94.4%;经过使用本发明的方法训练的3D CNN模型进行假阳性抑制之后,在抑制掉大量假阳性样本的情况下,可以保持与检测结果基本相同的敏感度。这证明了本发明的方法在对肺结节假阳性样本进行假阳性抑制时的有效性。
参考文献
[1]A.Krizhevsky,I.Sutskever,and G.E.Hinton,“Imagenet classificationwith deep convolutional neural networks,”in Advances in neural informationprocessing systems,2012, pp.1097-1105.
[2]K.He,X.Zhang,S.Ren,and J.Sun,“Deep Residual Learning for ImageRecognition,”arXiv Prepr.arXiv1512.03385,2015.
[3]K.He,X.Zhang,S.Ren,and J.Sun,“Delving deep into rectifiers:Surpassing huma n-level perf ormance on imagenet classif ica tion,”inProceedings of the IEEE International Conference on Computer Vision,2016.
Claims (7)
1.一种基于3DCNN的肺结节假阳性样本抑制方法,其特征在于,包括如下步骤:
a)从肺部CT影像序列数据中检测肺结节候选点坐标;
b)对原始的DICOM图像进行插值,得到插值后的3D原始图像数据;
c)对此前检测得到的候选点坐标,按照如上b)插值步骤进行相应处理,将其映射到插值后的3D原始图像数据上;
d)对于每个候选点,根据其转换后的坐标,从插值后的3D原始图像数据中切出3D数据,作为训练样本;
e)根据每个候选点的坐标,与原始图像中的标签进行对应,为步骤c)中切出的每一个3D数据贴上相应的标签;
f)使用准备好的3D数据训练3D CNN网络,3D CNN网络结构数为1;
g)使用训练得到的3D CNN模型对候选点进行假阳性抑制;
所述步骤f)中训练3D CNN模型时,其loss函数如下:
loss=weighted_sparse_softmax_cross_entropy+l1_l2_regularizer
其中,weighted_sparse_softmax_cross_entropy为加权稀疏交叉熵损失函数,其通过如下方式构建:
对于原始的阳性样本,计算其标准的稀疏交叉熵损失函数得到损失值,并乘以一个权重,将所得乘积作为该样本的损失值;
对于其他样本,使用标准的稀疏交叉熵损失函数,计算其损失值;
对于任一batch的所有样本,将使用以上方法得到的加权损失值和不需加权的原始损失值求和,将其作为该batch最终的加权稀疏交叉熵损失函数值;
其中公式中的l1_l2_regularizer为对3D CNN模型中的各可训练参数,权值和偏差,添加L1和L2正则化项,以保证训练得到的参数的稀疏性,并保证其具有较小值,从而达到抑制模型过拟合的目的。
2.根据权利要求1所述的肺结节假阳性样本抑制方法,其特征在于,所述步骤b)中对原始DICOM图像进行插值,将Z方向的切片间隔插值为与X、Y方向的像素间隔相等,即在插值完成后,X、Y、Z三个方向的间隔相等。
3.根据权利要求1所述的肺结节假阳性样本抑制方法,其特征在于,所述步骤d)中,根据转换后的候选点坐标,从插值后的3D原始图像数据中切出3D数据,切出数据的长宽高,X、Y、Z方向,均为40像素,即数据大小为40×40×40;
随后对切出的数据进行如下处理:将小于-1000HU的数据置为-1000HU,将大于400HU的数据置为400HU,并将处理后的图像数据归一化到0到1之间;
如果候选点为阳性样本,则还需要对其进行数据扩充,扩充方式包括平移、缩放和旋转;
对每一个阳性样本扩充个数为阴性样本总数除以原始阳性样本个数,如果所除结果不是整数,则取最近的整数,以使得扩充后的阴阳性样本均衡。
4.根据权利要求1所述的肺结节假阳性样本抑制方法,其特征在于,所述步骤e)中,为每一个3D数据贴上相应的标签:如果候选点距任意一个结节的外接边框中心点的距离小于该结节的半径,则候选点的标签为1;否则,该候选点的标签为0。
5.根据权利要求1所述的肺结节假阳性样本抑制方法,其特征在于,所述步骤f)中,使用准备好的3D数据训练3D CNN网络,网络结构如下:
输入为40×40×40大小的3D数据,逐步通过以下网络层进行处理:
卷积层1:16个大小为3×3×3的卷积核;
PreLU层1;
最大池化层1:大小为2×2×2的池化核;
卷积层2:32个大小为3×3×3的卷积核;
PreLU层2;
最大池化层2:大小为2×2×2的池化核;
卷积层3:64个大小为3×3×3的卷积核;
PreLU层3;
最大池化层3:大小为2×2×2的池化核;
卷积层4:128个大小为3×3×3的卷积核;
PreLU层4;
最大池化层4:大小为2×2×2的池化核;
输出数据拉伸为大小为128×2×2×2即1024的一列数据;
全连层1:大小为1024×32的核;
Dropout层:Drop概率为0.5;
全连层2:大小为32×2的核;
Softmax层;
得到的输出,即为输入样本分别属于阴阳性样本的概率。
6.如权利要求1所述的肺结节假阳性样本抑制方法,其特征在于,所述步骤f)中3DCNN网络模型中权值参数的初始化使用K He提出的初始化激活函数为ReLU的神经网络的方式完成,该方法以方差为输入到当前层的神经元个数的倒数的2倍的截断高斯分布小随机数来初始化当前层的权值参数,如下:
var=2/Nin。
7.如权利要求1所述的肺结节假阳性样本抑制方法,其特征在于,所述步骤f)中训练3DCNN模型时,其学习速率设定一个初始值0.01,随后随着训练过程进行衰减调整,在训练的一个epoch中衰减5次,每次变为原来的学习速率的0.95倍。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710411683.3A CN107154043B (zh) | 2017-06-05 | 2017-06-05 | 一种基于3dcnn的肺结节假阳性样本抑制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710411683.3A CN107154043B (zh) | 2017-06-05 | 2017-06-05 | 一种基于3dcnn的肺结节假阳性样本抑制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107154043A CN107154043A (zh) | 2017-09-12 |
CN107154043B true CN107154043B (zh) | 2020-03-24 |
Family
ID=59796619
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710411683.3A Active CN107154043B (zh) | 2017-06-05 | 2017-06-05 | 一种基于3dcnn的肺结节假阳性样本抑制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107154043B (zh) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108171694B (zh) * | 2017-12-28 | 2021-05-14 | 开立生物医疗科技(武汉)有限公司 | 基于卷积神经网络的结节检测方法、系统及设备 |
CN110119750A (zh) * | 2018-02-05 | 2019-08-13 | 浙江宇视科技有限公司 | 数据处理方法、装置及电子设备 |
CN108460758A (zh) * | 2018-02-09 | 2018-08-28 | 河南工业大学 | 肺结节检测模型的构建方法 |
CN108537784B (zh) * | 2018-03-30 | 2021-08-24 | 四川元匠科技有限公司 | 一种基于深度学习的ct图肺结节检测方法 |
CN108648178A (zh) * | 2018-04-17 | 2018-10-12 | 杭州依图医疗技术有限公司 | 一种影像结节检测的方法及装置 |
CN108830826B (zh) * | 2018-04-28 | 2020-10-20 | 四川大学 | 一种检测肺结节的系统及方法 |
CN108805259A (zh) * | 2018-05-23 | 2018-11-13 | 北京达佳互联信息技术有限公司 | 神经网络模型训练方法、装置、存储介质及终端设备 |
CN108921195A (zh) * | 2018-05-31 | 2018-11-30 | 沈阳东软医疗系统有限公司 | 一种基于神经网络的肺结节图像识别方法及装置 |
CN108765409A (zh) * | 2018-06-01 | 2018-11-06 | 电子科技大学 | 一种基于ct图像的候选结节的筛选方法 |
CN108986085B (zh) * | 2018-06-28 | 2021-06-01 | 深圳视见医疗科技有限公司 | Ct图像肺结节检测方法、装置、设备及可读存储介质 |
CN109191564B (zh) * | 2018-07-27 | 2020-09-04 | 中国科学院自动化研究所 | 基于深度学习的激发荧光断层成像三维重建方法 |
CN110084813B (zh) * | 2019-05-13 | 2022-05-13 | 山东知微智成电子科技有限公司 | 一种基于三维深度学习网络的肺结节良恶性预测方法 |
CN110263724A (zh) * | 2019-06-21 | 2019-09-20 | 腾讯科技(深圳)有限公司 | 图片识别方法、识别模型训练方法、装置及存储介质 |
CN110909258B (zh) * | 2019-11-22 | 2023-09-29 | 上海喜马拉雅科技有限公司 | 一种信息推荐方法、装置、设备及存储介质 |
CN111626989B (zh) * | 2020-05-06 | 2022-07-22 | 杭州迪英加科技有限公司 | 针对缺失标注的病理图像的高精度检测网络训练方法 |
CN111784593B (zh) * | 2020-06-04 | 2024-07-26 | 广东省智能制造研究所 | 一种面向深度学习的肺结节ct图像数据增强方法及系统 |
CN111784638B (zh) * | 2020-06-04 | 2024-06-25 | 广东省智能制造研究所 | 一种基于卷积神经网络的肺结节假阳性筛除方法及系统 |
CN112070772B (zh) * | 2020-08-27 | 2024-01-12 | 闽江学院 | 基于UNet++和ResNet的血液白细胞图像分割方法 |
CN113313698B (zh) * | 2021-06-09 | 2024-07-02 | 光华临港工程应用技术研发(上海)有限公司 | 基于神经网络的肺结节检测方法、装置及图像处理设备 |
CN114596637B (zh) * | 2022-03-23 | 2024-02-06 | 北京百度网讯科技有限公司 | 图像样本数据增强训练方法、装置及电子设备 |
CN116012355B (zh) * | 2023-02-07 | 2023-11-21 | 重庆大学 | 一种基于深度学习的自适应假阳性肺结节剔除方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106372390A (zh) * | 2016-08-25 | 2017-02-01 | 姹ゅ钩 | 一种基于深度卷积神经网络的预防肺癌自助健康云服务系统 |
CN106504232A (zh) * | 2016-10-14 | 2017-03-15 | 北京网医智捷科技有限公司 | 一种基于3d卷积神经网络的肺部结节自动检测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9639933B2 (en) * | 2013-02-14 | 2017-05-02 | The Research Foundation For The State University Of New York | Method for adaptive computer-aided detection of pulmonary nodules in thoracic computed tomography images using hierarchical vector quantization and apparatus for same |
-
2017
- 2017-06-05 CN CN201710411683.3A patent/CN107154043B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106372390A (zh) * | 2016-08-25 | 2017-02-01 | 姹ゅ钩 | 一种基于深度卷积神经网络的预防肺癌自助健康云服务系统 |
CN106504232A (zh) * | 2016-10-14 | 2017-03-15 | 北京网医智捷科技有限公司 | 一种基于3d卷积神经网络的肺部结节自动检测方法 |
Non-Patent Citations (4)
Title |
---|
Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification;Kaiming He 等;《2015 IEEE International Conference on Computer Vision》;20160218;第1026-1034页 * |
Multilevel Contextual 3-D CNNs for False Positive Reduction in Pulmonary Nodule Detection;Qi Dou 等;《IEEE Xplore Digital Libary》;20160926;第1558-1567页 * |
Qi Dou 等.Multilevel Contextual 3-D CNNs for False Positive Reduction in Pulmonary Nodule Detection.《IEEE Xplore Digital Libary》.2016,第1558-1567页. * |
受限玻尔兹曼机的新混合稀疏惩罚机制;刘凯 等;《浙江大学学报(工学版)》;20150630;第49卷(第6期);第1070-1078页 * |
Also Published As
Publication number | Publication date |
---|---|
CN107154043A (zh) | 2017-09-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107154043B (zh) | 一种基于3dcnn的肺结节假阳性样本抑制方法 | |
Kassani et al. | Classification of histopathological biopsy images using ensemble of deep learning networks | |
Khan et al. | Lungs nodule detection framework from computed tomography images using support vector machine | |
CN106940816B (zh) | 基于3d全卷积神经网络的ct图像肺结节检测系统 | |
Singh et al. | An improved CAD system for breast cancer diagnosis based on generalized pseudo-Zernike moment and Ada-DEWNN classifier | |
Albalawi et al. | Classification of breast cancer mammogram images using convolution neural network | |
CN112270666A (zh) | 基于深度卷积神经网络的非小细胞肺癌病理切片识别方法 | |
Yao et al. | Pneumonia Detection Using an Improved Algorithm Based on Faster R‐CNN | |
Ashwin et al. | Efficient and reliable lung nodule detection using a neural network based computer aided diagnosis system | |
Du et al. | UNet retinal blood vessel segmentation algorithm based on improved pyramid pooling method and attention mechanism | |
CN114677403B (zh) | 基于深度学习注意力机制的肝脏肿瘤图像分割方法 | |
Niyaz et al. | Advances in deep learning techniques for medical image analysis | |
Meena et al. | Spatial fuzzy c means pet image segmentation of neurodegenerative disorder | |
Khumancha et al. | Lung cancer detection from computed tomography (CT) scans using convolutional neural network | |
CN112818920B (zh) | 一种双时相高光谱图像空谱联合变化检测方法 | |
Naik et al. | Lung nodule classification on computed tomography images using fractalnet | |
Ge et al. | Melanoma segmentation and classification in clinical images using deep learning | |
Pradhan et al. | Lung cancer detection using 3D convolutional neural networks | |
Zhou et al. | Deep learning-based breast region extraction of mammographic images combining pre-processing methods and semantic segmentation supported by Deeplab v3+ | |
Kim et al. | Weakly-supervised US breast tumor characterization and localization with a box convolution network | |
JP7395668B2 (ja) | 高速マンモグラフィ・データ・ハンドリングのためのシステム及び方法 | |
Lima et al. | Evaluation of data balancing techniques in 3D CNNs for the classification of pulmonary nodules in CT images | |
Yan et al. | Two and multiple categorization of breast pathological images by transfer learning | |
Jose et al. | Liver Tumor Classification using Optimal Opposition-Based Grey Wolf Optimization | |
Pirabaharan et al. | Interactive segmentation using U-Net with weight map and dynamic user interactions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP02 | Change in the address of a patent holder |
Address after: 311200 floor 4-6, East Building e, Hangzhou Bay Information Port, Xiaoshan District, Hangzhou City, Zhejiang Province Patentee after: HANGZHOU JIANPEI TECHNOLOGY Co.,Ltd. Address before: 310018 No. 3, No. 3, Hangzhou economic and Technological Development Zone, Hangzhou, Zhejiang Patentee before: HANGZHOU JIANPEI TECHNOLOGY Co.,Ltd. |
|
CP02 | Change in the address of a patent holder |