CN113222024A - 一种基于深度学习的肺部疾病多层次分类方法、系统及存储介质 - Google Patents

一种基于深度学习的肺部疾病多层次分类方法、系统及存储介质 Download PDF

Info

Publication number
CN113222024A
CN113222024A CN202110535928.XA CN202110535928A CN113222024A CN 113222024 A CN113222024 A CN 113222024A CN 202110535928 A CN202110535928 A CN 202110535928A CN 113222024 A CN113222024 A CN 113222024A
Authority
CN
China
Prior art keywords
classification
data
model
image data
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110535928.XA
Other languages
English (en)
Inventor
高铭泽
杨健程
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Diannei Shanghai Biotechnology Co ltd
Original Assignee
Diannei Shanghai Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Diannei Shanghai Biotechnology Co ltd filed Critical Diannei Shanghai Biotechnology Co ltd
Priority to CN202110535928.XA priority Critical patent/CN113222024A/zh
Publication of CN113222024A publication Critical patent/CN113222024A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • G06T2207/10081Computed x-ray tomography [CT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20112Image segmentation details
    • G06T2207/20132Image cropping
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30061Lung
    • G06T2207/30064Lung nodule
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30096Tumor; Lesion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images
    • G06V2201/032Recognition of patterns in medical or anatomical images of protuberances, polyps nodules, etc.

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Quality & Reliability (AREA)
  • Apparatus For Radiation Diagnosis (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于深度学习的肺部疾病多层次分类方法、系统及存储介质,所述方法包括:S1:对肺部疾病的图像数据进行处理;S2:采用节点泄漏机制训练卷积神经网络模型,得到肺部疾病的多层次分类模型,并对所述多层次分类模型进行测试;S3:将待分类的肺部疾病的图像数据输入所述多层次分类模型,识别并输出所述肺部疾病所属的类别。本发明通过节点泄露机制训练模型,得到多层次分类模型,显著提升模型性能,可以准确的对肺结节CT图像进行多层次分类并提高肺结节病种判断的准确度。

Description

一种基于深度学习的肺部疾病多层次分类方法、系统及存储 介质
技术领域
本发明属于医学图像处理及人工智能技术领域,尤其涉及一种基于深度学习的肺部疾病多层次分类方法、系统及存储介质。
背景技术
目前,肺癌是中国发病率和死亡率最高的癌症,CT(Computed Tomography,电子计算机断层扫描)图像是最主要的肺癌检测方式。CT图像中肺结节是肺癌的重要征象,影像学检查是发现病变,对病变进行定性定量分析,预测疾病的关键。但是肺结节在CT图像上不好辨识,对肺结节的诊断往往需要经穿刺活检取出部分病灶组织进行病理分析才能确定病变性质和其发展程度。应用深度学习技术对肺结节进行病种多层次的自动分类,可以大大提高医生的工作效率。现有肺结节分类技术对肺结节的分类诊断较为单一,未考虑结节的多层次关联诊断。
发明内容
本发明的主要目的在于克服现有技术的缺点与不足,提供一种基于深度学习的肺部疾病多层次分类方法、系统及存储介质,通过建立神经网络模型,对肺部疾病进行二分类和多分类,并通过节点泄露机制训练模型,得到多层次分类模型,显著提升模型性能,可以准确的对肺结节CT图像进行多层次分类并提高肺结节病种判断的准确度。
根据本发明的一个方面,本发明提供了一种基于深度学习的肺部疾病多层次分类方法,所述方法包括以下步骤:
S1:对肺部疾病的图像数据进行处理;
S2:采用节点泄漏机制训练卷积神经网络模型,得到肺部疾病的多层次分类模型,并对所述多层次分类模型进行测试;
S3:将待分类的肺部疾病的图像数据输入所述多层次分类模型,识别并输出所述肺部疾病所属的类别。
优选地,所述对肺部疾病的图像数据进行处理包括对图像数据进行预处理,具体为:
提取肺结节的感兴趣区域ROI所在的3D影像,对数据进行裁剪和加窗操作,将预定比例的数据分别作为训练集和测试集。
优选地,所述对肺部疾病的图像数据进行处理包括对图像数据进行扩增操作,具体为:
在指定范围内随机选取旋转的角度和平移的距离,对数据随机进行旋转、平移、镜像的增强操作,然后将其裁剪为48×48×48大小的三维数据。
优选地,所述采用节点泄漏机制训练卷积神经网络模型,得到肺部疾病的多层次分类模型,包括:
对图像数据进行二分类以及二分类下的多分类,在二分类时利用二值化交叉熵BCE作为损失函数,在多分类时利用交叉熵CE作为损失函数,训练时在每个多分类端增加泄漏节点进行训练,所述泄漏节点包含的数据为每个分类端类别数据的补集,以此得到多层次分类模型;
其中,
BCE函数如公式(1)所示:
Figure BDA0003069633150000021
CE函数如公式(2)所示:
Figure BDA0003069633150000031
其中yi为数据真实标签,
Figure BDA0003069633150000032
为数据预测结果,n为样本数量。
优选地,所述对所述多层次分类模型进行测试,包括:
根据测试样本集的模型输出结果,对二分类结果采用Sigmoid函数激活,绘制受试者工作特征曲线ROC,根据约登指数确定最佳分类阈值;对多分类结果采用Softmax函数激活,在激活时忽略泄漏节点,取值最大的一类作为该数据分类类别;
其中,Sigmoid函数如公式(3)所示:
Figure BDA0003069633150000033
Softmax函数如公式(4)所示:
Figure BDA0003069633150000034
其中xi为输入,C为维度,yi为预测对象属于第c类的概率。
根据本发明的另一个方面,本发明还提供了一种基于深度学习的肺部疾病多层次分类系统,所述系统包括:
数据处理模块,用于对肺部疾病的图像数据进行处理;
模型训练模块,用于采用节点泄漏机制训练卷积神经网络模型,得到肺部疾病的多层次分类模型,并对所述多层次分类模型进行测试;
类别判断模块,用于将待分类的肺部疾病的图像数据输入所述多层次分类模型,识别并输出所述肺部疾病所属的类别。
优选地,所述对肺部疾病的图像数据进行处理包括对图像数据进行预处理,具体为:
提取肺结节的感兴趣区域ROI所在的3D影像,对数据进行裁剪和加窗操作,将预定比例的数据分别作为训练集和测试集。
优选地,所述对肺部疾病的图像数据进行处理包括对图像数据进行扩增操作,具体为:
在指定范围内随机选取旋转的角度和平移的距离,对数据随机进行旋转、平移、镜像的增强操作,然后将其裁剪为48×48×48大小的三维数据。
优选地,所述采用节点泄漏机制训练卷积神经网络模型,得到肺部疾病的多层次分类模型,包括:
对图像数据进行二分类以及二分类下的多分类,在二分类时利用二值化交叉熵BCE作为损失函数,在多分类时利用交叉熵CE作为损失函数,训练时在每个多分类端增加泄漏节点进行训练,所述泄漏节点包含的数据为每个分类端类别数据的补集,以此得到多层次分类模型;
其中,
BCE函数如公式(1)所示:
Figure BDA0003069633150000041
CE函数如公式(2)所示:
Figure BDA0003069633150000042
其中yi为数据真实标签,
Figure BDA0003069633150000043
为数据预测结果,n为样本数量。
优选地,所述对所述多层次分类模型进行测试,包括:
根据测试样本集的模型输出结果,对二分类结果采用Sigmoid函数激活,绘制受试者工作特征曲线ROC,根据约登指数确定最佳分类阈值;对多分类结果采用Softmax函数激活,在激活时忽略泄漏节点,取值最大的一类作为该数据分类类别;
其中,Sigmoid函数如公式(3)所示:
Figure BDA0003069633150000051
Softmax函数如公式(4)所示:
Figure BDA0003069633150000052
其中xi为输入,C为维度,yi为预测对象属于第c类的概率。
根据本发明的另一方面,本发明还提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令被处理器执行时实现基于深度学习的肺部疾病多层次分类方法步骤。
有益效果:本发明通过建立神经网络模型,对肺部疾病进行二分类和多分类,并通过节点泄露机制训练模型,得到多层次分类模型,显著提升模型性能,可以准确的对肺结节CT图像进行多层次分类并提高肺结节病种判断的准确度。
通过参照以下附图及对本发明的具体实施方式的详细描述,本发明的特征及优点将会变得清楚。
附图说明
图1是本发明的基于深度学习的肺部疾病多层次分类方法流程图;
图2是本发明的二分类和多分类示意图;
图3是利用本发明的方法判断肺部疾病类别的示意图;
图4是本发明的基于深度学习的肺部疾病多层次分类系统结构示意图。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
图1是本发明的基于深度学习的肺部疾病多层次分类方法流程图。如图1所示,本发明提供一种基于深度学习的肺部疾病多层次分类方法,所述方法包括以下步骤:
S1:对肺部疾病的图像数据进行处理;
具体地,所述对肺部疾病的图像数据进行处理包括对图像数据进行预处理,具体为:提取肺结节的感兴趣区域ROI所在的3D影像,对数据进行裁剪和加窗操作,将预定比例的数据分别作为训练集和测试集。
例如,将数据的分辨率重采样为1mm×1mm×1mm大小,以医生标记的肺结节位置为准提取肺结节ROI(Region Of Interest,感兴趣区域)所在的3D影像,将数据裁剪为80×80×80的立方体。将80%的数据作为训练集,10%的数据作为验证集,10%的数据作为测试集。每个病种也按照8∶1∶1的比例划分到训练集、验证集和测试集中。在将数据送入网络进行训练之前,对数据进行加窗操作,将小于-1000的值置为-1000,大于400的值置为400,然后将数据值归一化至-1~1。
优选地,所述对肺部疾病的图像数据进行处理包括对图像数据进行扩增操作,具体为:在指定范围内随机选取旋转的角度和平移的距离,对数据随机进行旋转、平移、镜像的增强操作,然后将其裁剪为48×48×48大小的三维数据。
S2:采用节点泄漏机制训练卷积神经网络模型,得到肺部疾病的多层次分类模型,并对所述多层次分类模型进行测试;
如图2所示,所述采用节点泄漏机制训练卷积神经网络模型,得到肺部疾病的多层次分类模型,包括:
对图像数据进行二分类以及二分类下的多分类,在二分类时利用二值化交叉熵BCE作为损失函数,在多分类时利用交叉熵CE作为损失函数,训练时在每个多分类端增加泄漏节点进行训练,所述泄漏节点包含的数据为每个分类端类别数据的补集,以此得到多层次分类模型;
其中,
BCE函数如公式(1)所示:
Figure BDA0003069633150000071
CE函数如公式(2)所示:
Figure BDA0003069633150000072
其中yi为数据真实标签,
Figure BDA0003069633150000073
为数据预测结果,n为样本数量。
在本步骤中,将训练样本输入预设的神经网络模型,在分类端的多层次分类上,包含良恶性二分类,恶性疾病多分类,良性疾病多分类,以及腺癌的四种浸润分型分类。在二分类端利用BCE(Binary Cross Entropy,二值化交叉熵),多分类端利用CE(Cross-Entropy,交叉熵)作为损失函数,训练时在每个多分类端增加泄漏节点进行训练,节点包含的数据为每个分类端类别数据的补集,如在恶性疾病分类中,泄漏节点的数据为训练集中所有的良性数据。以此得到训练好的肺结节病种多层次分类模型。
优选地,所述对所述多层次分类模型进行测试,包括:
根据测试样本集的模型输出结果,对二分类结果采用Sigmoid函数激活,绘制受试者工作特征曲线ROC,根据约登指数确定最佳分类阈值;对多分类结果采用Softmax函数激活,在激活时忽略泄漏节点,取值最大的一类作为该数据分类类别;
其中,Sigmoid函数如公式(3)所示:
Figure BDA0003069633150000081
Softmax函数如公式(4)所示:
Figure BDA0003069633150000082
其中xi为输入,C为维度,yi为预测对象属于第c类的概率。
S3:将待分类的肺部疾病的图像数据输入所述多层次分类模型,识别并输出所述肺部疾病所属的类别。
如图3所示,将待分类的肺结节CT图像运行前述预处理步骤处理后,输入通过模型测试得到的分类模型得到分类结果。
以下给出本实施例的一个具体的应用过程。
数据处理:采用合作医院提供的5000例结节样本,每例数据都由医生进行了良恶性,和病种的标注,对于腺瘤样增生和腺癌进行了浸润程度标注。
将数据的分辨率重采样为1mm×1mm×1mm大小,以医生标记的肺结节位置为准提取肺结节ROI所在的3D影像,将数据裁剪为80×80×80的立方体。将80%的数据即4000例作为训练集,10%的数据即500例作为验证集,10%的数据即500作为测试集。每个病种也按照8∶1∶1的比例划分到训练集、验证集和测试集中。
在数据扩增上,对数据随机进行旋转,平移,镜像,增强操作,其中旋转的角度和平移的距离都是在指定范围内随机抽取,本实施例中旋转角度范围为90度,180度,270度,平移距离范围为上下左右3像素以内。然后将其裁剪为48×48×48大小的三维数据。
模型训练:将训练样本输入预设的神经网络模型,本实施例采用3D-Densnet网络,此处仅用作举例并不局限于该网络。在分类端的多层次分类上,如图2所示,包含良恶性二分类,恶性疾病五分类,良性疾病五分类,以及腺癌的四种浸润分型分类。在二分类端利用BCE,多分类端利用CE作为损失函数,训练时在每个多分类端增加泄漏节点进行训练,得到训练好的肺结节病种多层次分类模型。
模型测试:将测试样本输入模型,根据测试样本集的模型输出结果,对二分类结果采用Sigmoid函数激活,绘制ROC曲线,根据约登指数确定最佳分类阈值。对多分类结果采用Softmax函数激活,在激活时忽略泄漏节点,取值最大的一类作为该数据分类类别。
预测样本:如图3所示,将待分类的肺结节CT图像运行前述预处理步骤处理后,输入通过模型测试得到的分类模型得到分类结果。
在本实施例中,将预处理得到的数据输入构建的网络中,得到结节良恶性分类,良性疾病多病种分类,恶性疾病多病种分类,以及腺癌的浸润程度分类。故针对一个结节,可以得到诸如“良性-结核”,“恶性-大细胞癌”,“恶性-腺癌-浸润程度IA”的多层次信息。
训练过程中,在每个分类的任务中,将总训练集中不属于该分类中的其他数据作为一类,例如在训练恶性疾病分类的过程中,将所有的良性疾病作为一类参与训练,这一类在分类中作为泄漏节点参与训练,用来辅助分类。在推断时,因为泄漏节点中的数据不属于该类别,进行分类激活时舍弃这一类别。例如,对一个结节进行分类,结果为恶性,那么在进行下一层分类时仅做恶性疾病分类即可,不再需要判断良恶性,故在这一层分类时不考虑泄漏节点中的数据。实验证明该操作可大幅提高模型精度。
实施例2
图4是本发明的基于深度学习的肺部疾病多层次分类系统结构示意图。如图4所示,本发明还提供了一种基于深度学习的肺部疾病多层次分类系统,所述系统包括:
数据处理模块,用于对肺部疾病的图像数据进行处理;
模型训练模块,用于采用节点泄漏机制训练卷积神经网络模型,得到肺部疾病的多层次分类模型,并对所述多层次分类模型进行测试;
类别判断模块,用于将待分类的肺部疾病的图像数据输入所述多层次分类模型,识别并输出所述肺部疾病所属的类别。
优选地,所述对肺部疾病的图像数据进行处理包括对图像数据进行预处理,具体为:
提取肺结节的感兴趣区域ROI所在的3D影像,对数据进行裁剪和加窗操作,将预定比例的数据分别作为训练集和测试集。
优选地,所述对肺部疾病的图像数据进行处理包括对图像数据进行扩增操作,具体为:
在指定范围内随机选取旋转的角度和平移的距离,对数据随机进行旋转、平移、镜像的增强操作,然后将其裁剪为48×48×48大小的三维数据。
优选地,所述采用节点泄漏机制训练卷积神经网络模型,得到肺部疾病的多层次分类模型,包括:
对图像数据进行二分类以及二分类下的多分类,在二分类时利用二值化交叉熵BCE作为损失函数,在多分类时利用交叉熵CE作为损失函数,训练时在每个多分类端增加泄漏节点进行训练,所述泄漏节点包含的数据为每个分类端类别数据的补集,以此得到多层次分类模型;
其中,
BCE函数如公式(1)所示:
Figure BDA0003069633150000111
CE函数如公式(2)所示:
Figure BDA0003069633150000112
其中yi为数据真实标签,
Figure BDA0003069633150000113
为数据预测结果,n为样本数量。
优选地,所述对所述多层次分类模型进行测试,包括:
根据测试样本集的模型输出结果,对二分类结果采用Sigmoid函数激活,绘制受试者工作特征曲线ROC,根据约登指数确定最佳分类阈值;对多分类结果采用Softmax函数激活,在激活时忽略泄漏节点,取值最大的一类作为该数据分类类别;
其中,Sigmoid函数如公式(3)所示:
Figure BDA0003069633150000114
Softmax函数如公式(4)所示:
Figure BDA0003069633150000121
其中xi为输入,C为维度,yi为预测对象属于第c类的概率。
本发明实施例2中各个模块所执行的方法步骤的具体实施过程与实施例1中的各个步骤的实施过程相同,在此不再赘述。
实施例3
根据本发明的另一方面,本发明还提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令被处理器执行时实现实施例1中的方法步骤,具体的实现过程可以参考实施例1中的方法步骤的实现过程,在此不再赘述。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是在本发明的构思下,利用本发明说明书及附图内容所作的等效结构变换,或直接/间接运用在其他相关的技术领域均包括在本发明的专利保护范围内。

Claims (11)

1.一种基于深度学习的肺部疾病多层次分类方法,其特征在于,所述方法包括以下步骤:
S1:对肺部疾病的图像数据进行处理;
S2:采用节点泄漏机制训练卷积神经网络模型,得到肺部疾病的多层次分类模型,并对所述多层次分类模型进行测试;
S3:将待分类的肺部疾病的图像数据输入所述多层次分类模型,识别并输出所述肺部疾病所属的类别。
2.根据权利要求1所述的方法,其特征在于,所述对肺部疾病的图像数据进行处理包括对图像数据进行预处理,具体为:
提取肺结节的感兴趣区域ROI所在的3D影像,对数据进行裁剪和加窗操作,将预定比例的数据分别作为训练集和测试集。
3.根据权利要求1所述的方法,其特征在于,所述对肺部疾病的图像数据进行处理包括对图像数据进行扩增操作,具体为:
在指定范围内随机选取旋转的角度和平移的距离,对数据随机进行旋转、平移、镜像的增强操作,然后将其裁剪为48×48×48大小的三维数据。
4.根据权利要求1所述的方法,其特征在于,所述采用节点泄漏机制训练卷积神经网络模型,得到肺部疾病的多层次分类模型,包括:
对图像数据进行二分类以及二分类下的多分类,在二分类时利用二值化交叉熵BCE作为损失函数,在多分类时利用交叉熵CE作为损失函数,训练时在每个多分类端增加泄漏节点进行训练,所述泄漏节点包含的数据为每个分类端类别数据的补集,以此得到多层次分类模型;
其中,
BCE函数如公式(1)所示:
Figure FDA0003069633140000021
CE函数如公式(2)所示:
Figure FDA0003069633140000022
其中yi为数据真实标签,
Figure FDA0003069633140000023
为数据预测结果,n为样本数量。
5.根据权利要求1所述的方法,其特征在于,所述对所述多层次分类模型进行测试,包括:
根据测试样本集的模型输出结果,对二分类结果采用Sigmoid函数激活,绘制受试者工作特征曲线ROC,根据约登指数确定最佳分类阈值;对多分类结果采用Softmax函数激活,在激活时忽略泄漏节点,取值最大的一类作为该数据分类类别;
其中,Sigmoid函数如公式(3)所示:
Figure FDA0003069633140000024
Softmax函数如公式(4)所示:
Figure FDA0003069633140000025
其中xi为输入,C为维度,yi为预测对象属于第c类的概率。
6.一种基于深度学习的肺部疾病多层次分类系统,其特征在于,所述系统包括:
数据处理模块,用于对肺部疾病的图像数据进行处理;
模型训练模块,用于采用节点泄漏机制训练卷积神经网络模型,得到肺部疾病的多层次分类模型,并对所述多层次分类模型进行测试;
类别判断模块,用于将待分类的肺部疾病的图像数据输入所述多层次分类模型,识别并输出所述肺部疾病所属的类别。
7.根据权利要求6所述的系统,其特征在于,所述对肺部疾病的图像数据进行处理包括对图像数据进行预处理,具体为:
提取肺结节的感兴趣区域ROI所在的3D影像,对数据进行裁剪和加窗操作,将预定比例的数据分别作为训练集和测试集。
8.根据权利要求6所述的系统,其特征在于,所述对肺部疾病的图像数据进行处理包括对图像数据进行扩增操作,具体为:
在指定范围内随机选取旋转的角度和平移的距离,对数据随机进行旋转、平移、镜像的增强操作,然后将其裁剪为48×48×48大小的三维数据。
9.根据权利要求6所述的系统,其特征在于,所述采用节点泄漏机制训练卷积神经网络模型,得到肺部疾病的多层次分类模型,包括:
对图像数据进行二分类以及二分类下的多分类,在二分类时利用二值化交叉熵BCE作为损失函数,在多分类时利用交叉熵CE作为损失函数,训练时在每个多分类端增加泄漏节点进行训练,所述泄漏节点包含的数据为每个分类端类别数据的补集,以此得到多层次分类模型;
其中,
BCE函数如公式(1)所示:
Figure FDA0003069633140000031
CE函数如公式(2)所示:
Figure FDA0003069633140000032
其中yi为数据真实标签,
Figure FDA0003069633140000041
为数据预测结果,n为样本数量。
10.根据权利要求6所述的系统,其特征在于,所述对所述多层次分类模型进行测试,包括:
根据测试样本集的模型输出结果,对二分类结果采用Sigmoid函数激活,绘制受试者工作特征曲线ROC,根据约登指数确定最佳分类阈值;对多分类结果采用Softmax函数激活,在激活时忽略泄漏节点,取值最大的一类作为该数据分类类别;
其中,Sigmoid函数如公式(3)所示:
Figure FDA0003069633140000042
Softmax函数如公式(4)所示:
Figure FDA0003069633140000043
其中xi为输入,C为维度,yi为预测对象属于第c类的概率。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令被处理器执行时实现如权利要求1-5任一项所述的方法。
CN202110535928.XA 2021-05-17 2021-05-17 一种基于深度学习的肺部疾病多层次分类方法、系统及存储介质 Pending CN113222024A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110535928.XA CN113222024A (zh) 2021-05-17 2021-05-17 一种基于深度学习的肺部疾病多层次分类方法、系统及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110535928.XA CN113222024A (zh) 2021-05-17 2021-05-17 一种基于深度学习的肺部疾病多层次分类方法、系统及存储介质

Publications (1)

Publication Number Publication Date
CN113222024A true CN113222024A (zh) 2021-08-06

Family

ID=77092445

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110535928.XA Pending CN113222024A (zh) 2021-05-17 2021-05-17 一种基于深度学习的肺部疾病多层次分类方法、系统及存储介质

Country Status (1)

Country Link
CN (1) CN113222024A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109190441A (zh) * 2018-06-21 2019-01-11 丁彦青 女性生殖道细胞病理智能分类方法、诊断仪及存储介质
WO2019200740A1 (zh) * 2018-04-20 2019-10-24 平安科技(深圳)有限公司 肺结节的检测方法、装置、计算机设备和存储介质
CN111767929A (zh) * 2019-03-14 2020-10-13 上海市第一人民医院 黄斑下新生血管模型的构建方法及系统
CN112801222A (zh) * 2021-03-25 2021-05-14 平安科技(深圳)有限公司 基于二分类模型的多分类方法、装置、电子设备及介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019200740A1 (zh) * 2018-04-20 2019-10-24 平安科技(深圳)有限公司 肺结节的检测方法、装置、计算机设备和存储介质
CN109190441A (zh) * 2018-06-21 2019-01-11 丁彦青 女性生殖道细胞病理智能分类方法、诊断仪及存储介质
CN111767929A (zh) * 2019-03-14 2020-10-13 上海市第一人民医院 黄斑下新生血管模型的构建方法及系统
CN112801222A (zh) * 2021-03-25 2021-05-14 平安科技(深圳)有限公司 基于二分类模型的多分类方法、装置、电子设备及介质

Similar Documents

Publication Publication Date Title
CN111127466B (zh) 医学图像检测方法、装置、设备及存储介质
Fuhrman et al. A review of explainable and interpretable AI with applications in COVID‐19 imaging
Rawat et al. Deep learned tissue “fingerprints” classify breast cancers by ER/PR/Her2 status from H&E images
KR102108050B1 (ko) 증강 컨볼루션 네트워크를 통한 유방암 조직학 이미지 분류 방법 및 그 장치
CN108564026B (zh) 用于甲状腺肿瘤细胞学涂片图像分类的网络构建方法及系统
Karimi Jafarbigloo et al. Nuclear atypia grading in breast cancer histopathological images based on CNN feature extraction and LSTM classification
CN112101451A (zh) 一种基于生成对抗网络筛选图像块的乳腺癌组织病理类型分类方法
CN111369530A (zh) 一种基于深度学习的ct图像肺结节快速筛查方法
Deif et al. Diagnosis of oral squamous cell carcinoma using deep neural networks and binary Particle Swarm optimization on histopathological images: an AIoMT approach
Lo et al. Cycle-consistent GAN-based stain translation of renal pathology images with glomerulus detection application
Hu et al. A state-of-the-art survey of artificial neural networks for whole-slide image analysis: from popular convolutional neural networks to potential visual transformers
CN113129293A (zh) 医学图像分类方法、装置、计算机设备和存储介质
Koo et al. Automated detection of superficial fungal infections from microscopic images through a regional convolutional neural network
CN114359671A (zh) 基于多目标学习的超声影像甲状腺结节分类方法及系统
CN114882996A (zh) 基于多任务学习的肝细胞癌ck19及mvi预测方法
CN113222024A (zh) 一种基于深度学习的肺部疾病多层次分类方法、系统及存储介质
CN115760797A (zh) 一种基于混合注意力网络对胰腺图像进行分类的方法
CN115497092A (zh) 图像处理方法、装置及设备
CN112703531A (zh) 生成组织图像的注释数据
CN114004795A (zh) 一种乳腺结节的分割方法及相关装置
Khelil et al. Accurate diagnosis of non-Hodgkin lymphoma on whole-slide images using deep learning
KR102559616B1 (ko) 약지도 딥러닝 인공 지능을 이용한 유방 초음파 진단 방법 및 시스템
Miranda Ruiz Automatic segmentation of epithelium in cervical whole slide images to assist diagnosis of cervical intraepithelial neoplasia
CN117611543A (zh) 基于人工智能的t1期大肠癌淋巴结转移风险预测系统
Abdulaal et al. Enhancing Breast Cancer Classification using a Modified GoogLeNet Architecture with Attention Mechanism

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination