CN112101451A - 一种基于生成对抗网络筛选图像块的乳腺癌组织病理类型分类方法 - Google Patents
一种基于生成对抗网络筛选图像块的乳腺癌组织病理类型分类方法 Download PDFInfo
- Publication number
- CN112101451A CN112101451A CN202010960168.2A CN202010960168A CN112101451A CN 112101451 A CN112101451 A CN 112101451A CN 202010960168 A CN202010960168 A CN 202010960168A CN 112101451 A CN112101451 A CN 112101451A
- Authority
- CN
- China
- Prior art keywords
- image
- breast cancer
- network
- benign
- generation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 206010006187 Breast cancer Diseases 0.000 title claims abstract description 100
- 208000026310 Breast neoplasm Diseases 0.000 title claims abstract description 100
- 238000000034 method Methods 0.000 title claims abstract description 74
- 238000012216 screening Methods 0.000 title claims abstract description 63
- 230000003211 malignant effect Effects 0.000 claims abstract description 47
- 238000009826 distribution Methods 0.000 claims abstract description 44
- 125000004122 cyclic group Chemical group 0.000 claims abstract description 24
- 206010028980 Neoplasm Diseases 0.000 claims abstract description 23
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 18
- 201000011510 cancer Diseases 0.000 claims abstract description 17
- 230000007170 pathology Effects 0.000 claims abstract description 14
- 238000007781 pre-processing Methods 0.000 claims abstract description 5
- 238000012549 training Methods 0.000 claims description 63
- 238000012360 testing method Methods 0.000 claims description 26
- 238000012795 verification Methods 0.000 claims description 22
- 238000005070 sampling Methods 0.000 claims description 21
- 230000003042 antagnostic effect Effects 0.000 claims description 15
- 230000002159 abnormal effect Effects 0.000 claims description 10
- 238000013507 mapping Methods 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 8
- 238000011478 gradient descent method Methods 0.000 claims description 5
- 238000010186 staining Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000001575 pathological effect Effects 0.000 abstract description 25
- 201000010099 disease Diseases 0.000 abstract description 6
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 abstract description 6
- 230000006870 function Effects 0.000 description 28
- 230000007704 transition Effects 0.000 description 14
- 238000004422 calculation algorithm Methods 0.000 description 13
- 238000013135 deep learning Methods 0.000 description 9
- 238000004043 dyeing Methods 0.000 description 9
- 230000009466 transformation Effects 0.000 description 9
- 238000003860 storage Methods 0.000 description 7
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 6
- 238000010801 machine learning Methods 0.000 description 5
- 238000010606 normalization Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 230000004913 activation Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 238000011176 pooling Methods 0.000 description 3
- 238000000844 transformation Methods 0.000 description 3
- WZUVPPKBWHMQCE-UHFFFAOYSA-N Haematoxylin Chemical compound C12=CC(O)=C(O)C=C2CC2(O)C1C1=CC=C(O)C(O)=C1OC2 WZUVPPKBWHMQCE-UHFFFAOYSA-N 0.000 description 2
- 210000000481 breast Anatomy 0.000 description 2
- 238000007635 classification algorithm Methods 0.000 description 2
- 238000002591 computed tomography Methods 0.000 description 2
- 238000004195 computer-aided diagnosis Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 208000030776 invasive breast carcinoma Diseases 0.000 description 2
- 238000000691 measurement method Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 210000003484 anatomy Anatomy 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 230000005750 disease progression Effects 0.000 description 1
- YQGOJNYOYNNSMM-UHFFFAOYSA-N eosin Chemical compound [Na+].OC(=O)C1=CC=CC=C1C1=C2C=C(Br)C(=O)C(Br)=C2OC2=C(Br)C(O)=C(Br)C=C21 YQGOJNYOYNNSMM-UHFFFAOYSA-N 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000001000 micrograph Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000011425 standardization method Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/03—Recognition of patterns in medical or anatomical images
Abstract
本发明提供一种基于生成对抗网络筛选图像块的乳腺癌组织病理类型分类方法,包括获取乳腺癌组织病理类型图像数据集,还包括以下步骤:对乳腺癌组织病理类型图像进行预处理;生成对抗网络筛选良性图像块和恶性图像块中的正常区域;生成对抗网络筛选恶性图像块中的良性区域;使用基于循环密集连接的卷积神经网络对所述乳腺癌组织病理图像进行分类。本发明采用改进的无监督的生成对抗网络分别学习正常病理和良性肿瘤病理图像的数据分布,从而可以筛选恶性肿瘤病理图像中存在良性肿瘤的区域和正常区域,良性肿瘤病理图像中存在的正常区域,最大程度辅助医生更精确、更快速地诊断病情提供可能。
Description
技术领域
本发明涉及图像特征描述的技术领域,特别是一种基于生成对抗网络筛选图像块的乳腺癌组织病理类型分类方法。
背景技术
乳腺癌是全球女性中最常见的癌症,每年约有210万名女性罹患乳腺癌。乳腺癌是一种十分严重的疾病,癌细胞在体内不受限制地生长,超出其细胞界限以侵入相邻部位或扩散到其他器官。根据美国癌症协会提供的最近数据,在美国,到2020年预计将诊断出276480例新发浸润性乳腺癌女性病例,以及48530例新发非浸润性性乳腺癌病例。预计到2020年底,美国约有42170名妇女死于乳腺癌。
由于乳腺癌的高死亡率,建议女性通过乳房X线照片和计算机断层扫描(CT)进行定期检查。但是上述两种检查仅属于定位性质的检查,并不能根据观察到的异常判断患者罹患乳腺癌。乳腺癌组织病理学检查是乳腺癌诊断的“金标准”。由于缺乏经验丰富的病理学专家进行疾病诊断,并且病理学专家的过度疲劳往往会导致误诊,因此迫切需要开发基于计算机辅助诊断乳腺癌病理类型的系统。针对目前的研究方法,大致可以分为两种:基于传统机器学习的乳腺癌组织病理类型分类和基于深度学习的乳腺癌组织病理类型分类。其中,基于传统机器学习算法的乳腺癌组织病理类型分类方法需要通过人工特征提取图像中感兴趣区域的图像特征,再将提取的特征送入常见的机器学习分类器,如支持向量机、贝叶斯分类器和决策树。在基于深度学习的算法中,常见的分类网络AlexNet、VGG16、VGG19、GoogLeNet等卷积神经网络被应用于乳腺癌组织病理类型的分类,与基于传统机器学习算法的乳腺癌组织病理类型分类方法相比,基于深度学习的算法可以最大程度辅助医生更精确、更快速地诊断病情。由于深度学习理论的快速发展,目前的研究已经表明乳腺癌组织病理学图像的分类采用深度学习的方法可以极大的提高分类的准确性,从而帮助医生进行诊断,更好地为病人进行治疗。然而,由于乳腺癌组织病理学图像的分辨率极高,采用基于图像块的乳腺癌组织病理图像深度学习分类方法非常具有挑战性。这是由于在基于图像块的乳腺癌组织病理图像深度学习分类方法中,往往将全切片数字病理图像的标签分配给图像块,但是在恶性全切片数字病理组织学图像中存在良性区域和正常区域,良性全切片数字病理组织图像中存在正常区域,因此只有部分提取的图像块被正确标记。
2020年8月的IEEE Access上刊登了Rui Man,Ping Yang,Bowen Xu的文章《Classification of Breast Cancer Histopathological Images UsingDiscriminative Patches Screen by Generative Adversarial Networks》,该方法采用无监督异常检测生成对抗网络学习良性肿瘤图像的数据分布,从而可以筛选恶性肿瘤中存在良性肿瘤的区域,同时采用密集连接网络作为分类网络,实现多层特征融合进一步提高分类的准确性。其缺点是无法筛选良性图像和恶性图像中的正常区域,影响训练的效果;并且密集连接网络会存在参数过多不易训练的问题。
发明内容
为了解决上述的技术问题,本发明提出一种基于生成对抗网络筛选图像块的乳腺癌组织病理类型分类方法,采用改进的无监督的生成对抗网络分别学习正常病理和良性肿瘤病理图像的数据分布,从而可以筛选恶性肿瘤病理图像中存在良性肿瘤的区域和正常区域,良性肿瘤病理图像中存在的正常区域;同时采用基于循环密集连接的卷积神经网络作为分类网络,一方面密集连接可实现多层特征复用和融合,另一方面通过循环结构可以在实际训练过程中节省存储空间,有利于进一步提高分类的准确性和效率。为最大程度辅助医生更精确、更快速地诊断病情提供可能。
本发明提供一种基于生成对抗网络筛选图像块的乳腺癌组织病理类型分类方法,包括获取乳腺癌组织病理类型图像数据集,还包括以下步骤:
步骤1:对乳腺癌组织病理类型图像进行预处理;
步骤2:生成对抗网络筛选良性图像块和恶性图像块中的正常区域;
步骤3:生成对抗网络筛选恶性图像块中的良性区域;
步骤4:使用基于循环密集连接的卷积神经网络对所述乳腺癌组织病理图像进行分类。
优选的是,所述步骤1包括以下子步骤:
步骤11:对所述乳腺癌组织病理类型图像数据集进行染色标准化处理;
步骤12:将所述乳腺癌组织病理类型图像数据集划分为训练集、验证集和测试集;将所述训练集和所述验证集中正常图像进行随机图像块采样策略,得到正常图像块;
步骤13:使用所述正常图像块训练无监督的生成对抗网络。
在上述任一方案中优选的是,所述生成对抗网络由两个对抗的模块,生成网络G和判别网络D组成。
在上述任一方案中优选的是,所述生成对抗网络在训练时的目标函数为:
其中,x为真实样本,Pdata为真实数据分布,Pz(x)为先验分布.,为x来自真实数据分布Pdata的计算期望,z为随机变量,为z来自先验分布Pz(x)的计算期望,D(x)为真实样本x在判别网络D上的表现,G(z)为生成样本。
在上述任一方案中优选的是,所述步骤2包括使用所述训练集和所述验证集中的所述良性图像进行随机图像块采样策略,使用所述生成对抗网络对所述良性图像块进行筛选,大于第一阈值的图像块为错误标签的图像块,小于第一阈值的图像块为正确标签的图像块,筛选出良性肿瘤中存在的正常区域。
在上述任一方案中优选的是,:所述步骤2还包括所述生成对抗网络自动学习良性图像块样本数据分布,生成带有良性属性的生成对抗网络。
在上述任一方案中优选的是,所述步骤2还包括使用所述训练集和所述验证集中的所述恶性图像进行随机图像块采样策略,使用所述生成对抗网络对恶性图像块进行初次筛选,大于第一阈值的图像块为错误标签的图像块,小于第一阈值的图像块为正确标签的图像块,筛选出恶性肿瘤中存在的正常区域。
在上述任一方案中优选的是,所述步骤3包括使用所述带有良性属性的生成对抗网络对的恶性图像块进行二次筛选,大于第二阈值的图像块为错误标签的图像块,小于第二阈值的图像块为正确标签的图像块,筛选出恶性肿瘤中存在的良性区域。
在上述任一方案中优选的是,所述步骤3还包括对于给定测试图像块x′,在潜在空间中找到一个点z′,该点与图像G(z)对应,该图像在视觉上与异常图像x′最相似,并且位于良性图像分布X上。
在上述任一方案中优选的是,所述点z′的获取方法为:
步骤31:定义一个损失函数,代表潜在空间向量映射到图像的损失;
步骤32:在潜在空间分布Z中随机采样z′1并将其馈送到训练有素的生成器中以获得生成的图像G(z′Γ),代入损失函数计算损失;
步骤33:计算损失函数关于的梯度,利用梯度下降法不断更新迭代,迭代过程中通过δ=1,2,...,Γ来优化z在潜空间Z中的位置,直到最相似的图像G(z′Γ),其中,δ为迭代次数,Γ为迭代总次数。
在上述任一方案中优选的是,所述损失函数包括残差损失和鉴别损失,所述残差损失用于度量生成的图像G(z′Γ)和查询图像块x′之间的相似程度,公式为:
LResidual(z′Γ)=∑|x′-G(z′Γ)|;
所述鉴别损失用于反映鉴别器对两张图像提取的特征之间的差异,公式为:
LDiscriminator(z′Γ)=∑|f(x′)-f(G(z′Γ))|;
总损失定义为所述残差损失和所述鉴别损失的加权和,公式为:
L(z′Γ)=(1-λ)LResidual(z′Γ)+λ·LDiscriminator(z′Γ)
其中,λ为损失函数的权重,z′Γ为随机采样,f为鉴别器中间某一层的输出。
在上述任一方案中优选的是,所述步骤4包括以下子步骤:
步骤41:输入经过所述生成对抗网络筛选的最具有判别特征的乳腺癌组织病理图像块;
步骤42:使用循环密集连接块模块循环提取特征;
步骤43:使用Softmax分类器进行分类。
在上述任一方案中优选的是,所述循环密集块模块包含密集连接网络中的密集块和过渡层,每一个基本单元包含两个卷积核大小不同的批量归一化-ReLU激活-卷积操作,过渡层包含一个批量归一化-ReLU激活-卷积操作和池化操作,过渡层的输出将作为下一个循环密集连接块的输入。
在上述任一方案中优选的是,每层特征图都要经过批量归一化、ReLu激活和卷积操作,所述循环密集连接卷积网络的第l层输出为:
xl=Hl([x0,x1,...,xl-1])
其中,l表示层的维度,xl为l层网络的输出,Hl为非线性变换,xl-1为l-1层中产生的特征映射,[x0,x1,...,xl-1]为0,1,...,l-1层中产生的特征映射的串联。
在上述任一方案中优选的是,所述Softmax的损失函数的优化公式为:
本发明提出了一种基于生成对抗网络筛选图像块的乳腺癌组织病理类型分类方法,在实际训练过程中节省存储空间,消除特征之间的冗余,进一步提高乳腺癌组织病理图像的分类准确率和效率,解决高分辨率乳腺癌组织病理图像分类中显存占用过高的问题,有效缓解GPU显存不足的情况。
附图说明
图1为按照本发明的基于生成对抗网络筛选图像块的乳腺癌组织病理类型分类方法的一优选实施例的流程图。
图2为按照本发明的基于生成对抗网络筛选图像块的乳腺癌组织病理类型分类方法的另一优选实施例的总体技术路线图。
图3为按照本发明的基于生成对抗网络筛选图像块的乳腺癌组织病理类型分类方法的染色标准化的另一实施例的前后对照图。
图4为按照本发明的基于生成对抗网络筛选图像块的乳腺癌组织病理类型分类方法的循环密集连接的卷积神经网络的另一实施例的结构图。
图5为按照本发明的基于生成对抗网络筛选图像块的乳腺癌组织病理类型分类方法的另一优选实施例的具体实例工作流程图。
具体实施方式
下面结合附图和具体的实施例对本发明做进一步的阐述。
实施例一
如图1所示,执行步骤100,获取乳腺癌组织病理类型图像数据集。执行步骤110,对乳腺癌组织病理类型图像进行预处理。本步骤包括以下子步骤:
步骤11:对所述乳腺癌组织病理类型图像数据集进行染色标准化处理;
步骤12:将所述乳腺癌组织病理类型图像数据集划分为训练集、验证集和测试集;将所述训练集和所述验证集中正常图像进行随机图像块采样策略,得到正常图像块;
步骤13:使用所述正常图像块训练无监督的生成对抗网络,所述生成对抗网络由两个对抗的模块,生成网络G和判别网络D组成,所述生成对抗网络在训练时的目标函数为:
其中,x为真实样本,Pdata为真实数据分布,Pz(x)为先验分布.,为x来自真实数据分布Pdata的计算期望,z为随机变量,为z来自先验分布Pz(x)的计算期望,D(x)为真实样本x在判别网络D上的表现,G(z)为生成样本。
执行步骤120,生成对抗网络筛选良性图像块和恶性图像块中的正常区域。使用所述训练集和所述验证集中的所述良性图像进行随机图像块采样策略,使用所述生成对抗网络对所述良性图像块进行筛选,大于第一阈值的图像块为错误标签的图像块,小于第一阈值的图像块为正确标签的图像块,筛选出良性肿瘤中存在的正常区域。生成对抗网络自动学习良性图像块样本数据分布,生成带有良性属性的生成对抗网络。使用所述训练集和所述验证集中的所述恶性图像进行随机图像块采样策略,使用所述生成对抗网络对恶性图像块进行初次筛选,大于第一阈值的图像块为错误标签的图像块,小于第一阈值的图像块为正确标签的图像块,筛选出恶性肿瘤中存在的正常区域。
执行步骤130,生成对抗网络筛选恶性图像块中的良性区域。使用所述带有良性属性的生成对抗网络对的恶性图像块进行二次筛选,大于第二阈值的图像块为错误标签的图像块,小于第二阈值的图像块为正确标签的图像块,筛选出恶性肿瘤中存在的良性区域。对于给定测试图像块x′,在潜在空间中找到一个点z′,该点与图像G(z)对应,该图像在视觉上与异常图像x′最相似,并且位于良性图像分布X上。点z′的获取方法为:
步骤31:定义一个损失函数,代表潜在空间向量映射到图像的损失;
步骤32:在潜在空间分布Z中随机采样z′1并将其馈送到训练有素的生成器中以获得生成的图像G(z′Γ),代入损失函数计算损失;
步骤33:计算损失函数关于的梯度,利用梯度下降法不断更新迭代,迭代过程中通过δ=1,2,...,Γ来优化z在潜空间Z中的位置,直到最相似的图像G(z′Γ),其中,δ为迭代次数,Γ为迭代总次数。损失函数包括残差损失和鉴别损失,所述残差损失用于度量生成的图像G(z′Γ)和查询图像块x′之间的相似程度,公式为:
LResidual(z′Γ)=∑|x′-G(z′Γ)|;
所述鉴别损失用于反映鉴别器对两张图像提取的特征之间的差异,公式为:
LDiscriminator(z′Γ)=∑|f(x′)-f(G(z′Γ))|;
总损失定义为所述残差损失和所述鉴别损失的加权和,公式为:
L(z′Γ)=(1-λ)LResidual(z′Γ)+λ·LDiscriminator(z′Γ)
其中,λ为损失函数的权重,z′Γ为随机采样,f为鉴别器中间某一层的输出。
执行步骤140,使用基于循环密集连接的卷积神经网络对所述乳腺癌组织病理图像进行分类。本步骤包括以下子步骤:
步骤41:输入经过所述生成对抗网络筛选的最具有判别特征的乳腺癌组织病理图像块。
步骤42:使用循环密集连接块模块循环提取特征。环密集块模块包含密集连接网络中的密集块和过渡层,每一个基本单元包含两个卷积核大小不同的批量归一化-ReLU激活-卷积操作,过渡层包含一个批量归一化-ReLU激活-卷积操作和池化操作,过渡层的输出将作为下一个循环密集连接块的输入。每层特征图都要经过批量归一化、ReLu激活和卷积操作,所述循环密集连接卷积网络的第1层输出为:
xl=Hl([x0,x1,...,xl-1])
其中,l表示层的维度,xl为l层网络的输出,Hl为非线性变换,xl-1为l-1层中产生的特征映射,[x0,x1,...,xl-1]为0,1,...,l-1层中产生的特征映射的串联
步骤43:使用Softmax分类器进行分类。所述Softmax的损失函数的优化公式为:
实施例二
针对高分辨率乳腺癌组织病理学图像,现有传统机器学习方法和用于直接分析全切片数字病理组织学图像的深度神经网络模型将导致非常复杂的体系结构问题,在过去的几年中,基于图像块的乳腺癌组织病理图像分类方法在乳腺癌组织病理学数据集中取得了可喜的成果。然而,采用基于图像块的乳腺癌组织病理图像分类方法非常具有挑战性,由于恶性全切片数字病理组织学图像中存在良性区域和正常区域,良性全切片数字病理组织图像中存在正常区域,因此只有部分提取的图像块被正确标记。为了解决这个错误标签的图像块问题并进一步提高分类的准确性。我们提出了一种基于生成对抗网络筛选图像块的乳腺癌组织病理类型分类方法,采用改进的无监督的生成对抗网络分别学习正常病理和良性肿瘤病理图像的数据分布,从而可以筛选恶性肿瘤病理图像中存在良性肿瘤的区域和正常区域,良性肿瘤病理图像中存在的正常区域。同时采用基于循环密集连接的卷积神经网络作为分类网络,一方面密集连接可实现多层特征复用和融合,另一方面通过循环结构可以在实际训练过程中节省存储空间,有利于进一步提高分类的准确性和效率。为最大程度辅助医生更精确、更快速地诊断病情提供可能。
为了实现上述目的,本发明采用如下方案:
一种基于无监督异常检测生成对抗网络筛选图像块的乳腺癌组织病理类型分类方法,包括以下步骤:
1)获取乳腺癌组织病理类型图像数据集,对其进行染色标准化处理,并将其划分为训练集、验证集和测试集三部分,训练集和验证集用于本发明方法的模型训练,测试集用于本发明方法的模型测试;
2)将步骤1)中训练集和验证集中正常图像进行随机图像块采样策略,并进行数据增强处理,包括一系列仿射变换操作;
3)使用步骤2)得到的正常图像块训练无监督的生成对抗网络,通过生成对抗网络学习可以得到正常图像块的数据分布,而这种学习到正常图像块样本数据分布的生成对抗网络,在用于学习良性和恶性样本的数据分布时会有较大的异常分数。
4)使用步骤1)中训练集和验证集中良性图像进行随机图像块采样策略,使用步骤3)中的生成对抗网络对良性性图像块进行筛选。若大于某一阈值则系统判定为错误标签的图像块,若小于某一阈值则系统判定为正确标签的图像块,进而筛选良性肿瘤中存在的正常区域;
5)使用步骤1)中训练集和验证集中恶性图像进行随机图像块采样策略,使用步骤3)中的生成对抗网络对恶性图像块进行筛选。若大于某一阈值则系统判定为错误标签的图像块,若小于某一阈值则系统判定为正确标签的图像块,进而筛选恶性性肿瘤中存在的正常区域;
6)使用步骤4)中筛选出的良性图像块进行步骤2)的数据增强处理,包括一系列的仿射变换操作;
7)使用步骤6)得到的良性图像块训练无监督的生成对抗网络,通过生成对抗网络学习可以得到良性图像块的数据分布,而这种学习到良性图像块样本数据分布的生成对抗网络,在用于学习恶性样本的数据分布时会有较大的异常分数;
8)使用步骤7)中的生成对抗网络对步骤5)得到的恶性图像块进进一步筛选。若大于某一阈值则系统判定为错误标签的图像块,若小于某一阈值则系统判定为正确标签的图像块;进而筛选出恶性肿瘤中存在的良性区域,为近一步提高分类网络的训练性能提供了可能;
9)使用步骤8)中筛选的恶性图像块进行步骤2)的数据增强处理,包括一系列的仿射变换操作,以生成最终用于训练分类网络的训练集和验证集;
10)使用步骤4)得到的良性图像块和步骤9)得到的恶性图像块完成基于循环密集连接的卷积神经网络的训练;
11)对步骤1)的测试集进行步骤2)的随机图像块采样策略和数据增强操作,使用步骤10)的基于循环密集连接的卷积神经网络进行测试,通过多数投票策略组合步骤1)的测试集的分类结果,计算在乳腺癌组织病理数据集在图像级别和患者级别的准确率。
本发明的有益效果:
(1)本发明重在针对采用基于图像块分类方法存在错误标签的问题,通过生成对抗网络学习正常图像和良性图像样本的数据分布,筛选恶性肿瘤病理图像中存在良性肿瘤的区域和正常区域,良性肿瘤病理图像中存在的正常区域。有助于提高后续分类网络的性能;
(2)本发明使用基于循环密集连接的卷积神经网络作为分类网络,密集连接可保证网络中层与层之间最大程度的信息传输,实现特征的复用,循环结构可以在实际训练过程中节省存储空间,消除特征之间的冗余,进一步提高乳腺癌组织病理图像的分类准确率和效率。
(3)本发明通过采用图像块分类的方法解决高分辨率乳腺癌组织病理图像分类中显存占用过高的问题,有效缓解GPU显存不足的情况。
实施例三
在对现有技术的研究中发现,存在着以下缺点:无法筛选良性图像和恶性图像中的正常区域,影响训练的效果;并且密集连接网络会存在参数过多不易训练的问题。
针对上述缺点,本发明在筛选图像块策略增加了对良性和恶性图像块中正常区域的筛选,以保证得到更精确的数据,采用网络结构更加紧凑的基于循环密集连接的卷积神经网络方面进行了修改,能够解决上述问题,从而实现更精确更高效的乳腺癌组织病理图像的分类结果。
本发明主要由四个模块构成:
(1)乳腺癌组织病理图像预处理
(2)基于生成对抗网络筛选良性图像块和恶性图像块中的正常区域,解决存在错误标签的图像块的问题
(3)基于生成对抗网络筛选恶性图像块中的良性区域,解决存在错误标签的图像块的问题
(4)基于循环密集连接的卷积神经网络作为分类网络,对模块(2)和(3)中的得到的具有判别性的乳腺癌组织病理图像块进行分类。
本发明的总体技术路线如图2所示:
其中以上模块的详细介绍如下:
(1)乳腺癌组织病理图像预处理
染色标准化是H&E染色图像预处理中至关重要的一步。通过染色标准化可以减少数字扫描仪的颜色响应,染色供应商的材料和制造技术,以及不同实验室不同的染色方案造成的颜色差异都会给图像自动分类带来影响。本发明采用了一种新型保留结构信息的染色标准化方案。首先,将染色分离问题转化为非负矩阵分解,并对其加入稀疏约束,即稀疏非负矩阵分解。这种方法的一个优点是,颜色基础是在无人监督的情况下确定的,不需要手动标记不同区域的纯污渍。保留结构信息的染色标准化方法的工作原理是将源图像的基准颜色替换为病理学家青睐的目标图像颜色,同时可靠地保持源图像的结构信息完整,并保持其原有的染色浓度。如图3所示,A为目标图像,B为源图像,C为经过处理的图像。
其次,深度学习模型,尤其是卷积神经网络,需要大量的训练数据。由于乳腺癌组织病理图像的特殊性,获得大量与疾病进展和治疗监测相关的乳腺癌组织病理图像数据集十分具有挑战性。因此,我们提出一种图像块采样策略和数据增强方法生成足够数量的数据样本,为后续的网络的训练提供了保障。同时,本专利提出了一种基于提取图像块的数据增强算法来训练密集连接卷积神经网络。值得一提的是,我们避免使用尺寸为32×32或64×64的较小图像块,这是因为在乳腺癌组织病理图像数据集中,标签被指定为整个输入的乳腺癌组织病理学图像,32×32或64×64尺寸的图像块并不能保证将携带足够的诊断信息。因此,我们将大小为700×460的乳腺癌组织病理图像分割成大小为224×224的图像块。与较小尺寸的图像块相比,224×224尺寸的图像块可以携带更多的具有辨别特征的局部信息。
最后,对于乳腺组织病理学图像,我们可以使用翻转和旋转等一系列仿射变换来增加数据量,同时提高计算机辅助诊断系统的预测精度,而不改变图像的组织形态和细胞结构。
(2)基于生成对抗网络筛选良性图像块和恶性图像块中的正常区域
生成对抗网络由两个对抗的模块,生成网络G和判别网络D组成。从潜在空间Z采样的服从某一分布(例如均匀分布)的随机向量z通过生成网络G后,可以得到一个生成样本G(z)。生成样本G(z)和真实样本x一起作为判别网络的输入。判别网络估计G(z)来自于x的概率。在训练过程中,生成网络通过判别网络的判别结果进行优化,以提高生成能力,使G(z)不断接近x以“欺骗”判别网络;判别网络则通过误判概率,对自身进行优化,提高对生成样本的辨别能力。通过生成网络和判别网络的相互博弈,生成网络最终能够输出接近于真实样本分布的生成样本,且判别网络最终无法对生成样本进行辨别。
对于生成网络,生成样本G(z)应尽可能接近于真实样本x;对于判别网络,它可以给出输入样本来自于真实样本的可信度,即:当判别网络输入x时,D(x)接近于1,当输入G(z)时,D(G(z))接近于0。因此生成对抗网络在训练时的目标函数可以表示为:
当对抗训练完成时,生成器已经学习了从潜在空间表示z到正常图像块x的映射G(z)=z→x。但是GAN不会自动无代价地生成由测试图像x到潜在空间z的逆映射μ(x)=x→z,需要迭代地寻z。潜在空间具有平滑的过渡,换句话说,从潜在空间中距离相近的两个点生成的图像非常相似。给定测试图像块x,我们旨在在潜在空间中找到一个点z,该点与图像G(z)对应,该图像在视觉上与异常图像x最相似,并且位于正常图像分布X上。为了找到最佳的z,受特征匹配技术的启发,采用如下的方式:
(a):定义一个损失函数,代表潜在空间向量映射到图像的损失;
(b):在潜在空间分布Z中随机采样z1并将其馈送到训练有素的生成器中以获得生成的图像G(z1)。代入损失函数计算损失;
(c):计算损失函数关于z1的梯度,利用梯度下降法不断更新迭代,迭代过程中通过γ=1,2,...,Γ来优化z在潜空间Z中的位置。直到最相似的图像G(zΓ)。
上述(a)定义了一个将异常图像块映射到潜在空间的损失函数,该函数包括两个分量:残差损失和鉴别损失。
残差损失用于度量生成的图像G(zΓ)和查询图像块x之间的相似程度,残差损失为:
LResidual(zΓ)=∑|x-G(zΓ)|
受特征匹配技术的启发,将鉴别器看成是一个特征提取器,选择鉴别器中间某一层的输出作为函数f,鉴别损失反映了鉴别器对两张图像提取的特征之间的差异:
LDiscriminator(zΓ)=∑|f(x)-f(G(zΓ))|
为了映射到潜在空间,我们将总损失定义为两个分量的加权和:
L(zΓ)=(1-λ)LResidual(zΓ)+λ·LDiscriminator(zΓ)
我们将上述总损失定义为异常分数,该分数表示测试图像x与正常图像的拟合度。通过生成对抗网络学习可以得到正常图像块的数据分布,而这种学习到正常图像块样本数据分布的生成对抗网络,在用于学习良性和恶性样本的数据分布时会有较大的异常分数。从而筛选出良性和恶性图像块中的被错误标记的图像块。并使用翻转和旋转等一系列仿射变换来增加筛选得到的良性图像块的数据量,为下一模块提供足够的训练数据。
(3)基于生成对抗网络筛选恶性图像块中的良性区域
使用筛选得到的良性图像块进行生成对抗网络的训练。当对抗训练完成时,生成器已经学习了从潜在空间表示z’到良性图像块的映射。给定测试图像块x’,我们旨在潜在空间中找到一个点z’,该点与图像G(z)对应,该图像在视觉上与异常图像x’最相似,并且位于良性图像分布X上。为了找到最佳的z’,受受特征匹配技术的启发,采用如下的方式:
(a):定义一个损失函数,代表潜在空间向量映射到图像的损失;
(b):在潜在空间分布Z中随机采样z′1并将其馈送到训练有素的生成器中以获得生成的图像G(z′Γ)。代入损失函数计算损失;
(c):计算损失函数关于的梯度,利用梯度下降法不断更新迭代,迭代过程中通过δ=1,2,...,Γ来优化z在潜空间Z中的位置,直到最相似的图像G(z′Γ)。
上述(a)定义了一个将异常图像块映射到潜在空间的损失函数,该函数包括两个分量:残差损失和鉴别损失。
残差损失用于度量生成的图像G(z′Γ)和查询图像块x′之间的相似程度,残差损失为:
LResidual(z′Γ)=∑|x′-G(z′Γ)|
LDiscriminator(z′Γ)=∑,|f(x′)-f(G(z′Γ))|
为了映射到潜在空间,我们将总损失定义为两个分量的加权和:
L(z′Γ)=(1-λ)LResidual(z′Γ)+λ·LDiscriminator(z′Γ)
我们将上述总损失定义为异常分数,该分数表示测试图像x′与良性图像的拟合度。通过生成对抗网络学习可以得到良性图像块的数据分布,而这种学习到良性图像块样本数据分布的生成对抗网络,在用于学习恶性样本的数据分布时会有较大的异常分数。从而筛选出恶性图像块中的被错误标记为恶性的图像块。并使用翻转和旋转等一系列仿射变换来增加筛选得到的恶性图像块的数据量,为后续分类网络提供足够的训练数据。
(3)基于循环密集连接的卷积神经网络对乳腺癌组织病理图像分类块
密集连接卷积网络是结合了模型ResNet与Highway的优点,旨在解决深层网络中的梯度消失问题.密集连接卷积网络的思想是保证网络中层与层之间最大程度信息的传输,从而直接将所有层连接起来。本发明设计一个更紧凑的循环密集连接网络以进一步减少网络参数,同时保持与密集连接网络近似的性能,每一个循环密集连接块包含密集连接网络中的密集块和过渡层,同时将过渡层的输出作为下一个循环密集连接块的输入,通过此设计可以使得网络变得更深同时减少了参数的数量,一方面密集连接可以实现特征的复用,另一方面通过循环结构可以在实际训练过程中节省存储空间,有利于提高训练的效率。如图4所示,基于循环密集连接的卷积神经网络对乳腺癌组织病理图像分类算法由三部分组成:输入经过生成对抗网络筛选的最具有判别特征的乳腺癌组织病理图像块、使用循环密集连接块提取特征、Softmax分类器。经过上述三部分实现乳腺癌组织病理学图像的分类。
循环密集块模块是循环密集连接卷积网络的核心部分,主要特点是其中的各层网络不仅与下一层连接,而且与后面的每一层都直接连接,每一层的输入来自前面所有层的输出。从而能够促进信息的传递,减轻了梯度消失现象,并且网络能够更好地收敛。密集连接块中每一层的输出将进行通道的拼接做为该块的输出,因此由于通道数量的不同,无法直接将其输出重新输入到循环密集块中,需要通过一个过渡层进行通道数的压缩,所以循环密集块模块包含密集连接网络中的密集块和过渡层,与密集连接网络中的密集块相同,每一个基本单元包含两个卷积核大小不同的批量归一化-ReLU激活-卷积操作,过渡层包含一个批量归一化-ReLU激活-卷积操作和池化操作。过渡层的输出将作为下一个循环密集连接块的输入,从而可以达到节省存储空间的效果。
假设一张图像块x0在卷积网络中传播,网络共有L层,每一层都有一个非线性变换H,即每层特征图都要经过批量归一化、ReLu激活和卷积操作。其中l表示层的维度,xl为l层网络的输出,则循环密集连接卷积网络的第l层输出为:
xl=Hl([x0,x1,...,xl-1])
其中,xl-1为l-1层中产生的特征映射,[x0,x1,...,xl-1]为0,1,...,l-1层中产生的特征映射的串联。
与传统的卷积神经网络相比,密集连接加强了乳腺癌组织病理图像类型特征的传递,提高了特征在各个层间的流动,大大提高了特征利用率,使得网络能够自动学习乳腺癌组织病理图像中鲁棒性强且具有区分度的特征,提高分类的精确度;循环结构使得网络更加紧凑,通过循环结构可以在实际训练过程中节省存储空间,有利于提高训练的效率。。
定义第i个输入图像块xi,标签为yi,通过Softmax损失函数不断优化:
实施例四
本发明采用BreaKHis乳腺癌组织病理图像数据集作为实例数据集,BreaKHis数据集是以患者为单位发布的乳腺组织病理图像数据集,它由巴西巴拉那的P&D实验室病理解剖学和细胞病理学实验室合作建立的。该公共数据集是由82名患者的7909张苏木精和伊红染色的乳腺肿瘤组织显微图像组成的,其中每组图像都由不同放大倍数(40X、100X、200X和400X)的图像组成,图片格式是PNG格式,包含3个RGB通道,单通道是8比特位宽,每张图片的分辨率为700*460。数据集分为良性肿瘤和恶性肿瘤两大类,其中良性有2480张,恶性有5429张。
如图5所示,本发明解决其技术问题的主要步骤如下:
1、采集BreaKHis数据集,对其进行稀疏非负矩阵分解的染色标准化处理,按照7:3划分训练数据,测试集,进一步按照8:2将训练数据划分为训练集和验证集。训练集和验证集用于本发明方法的模型训练,测试集用于本发明方法的模型测试;
2、对乳腺癌组织病理正常图像进行随机图像块采样,并进行旋转45度、90度、135度、180度、225度、270度、315度操作、水平翻转和竖直翻转操作,使用大小为224×224乳腺癌组织病理正常图像训练生成对抗网络,通过生成对抗网络学习可以得到正常图像块的样本的数据分布;
3、以随机采样64张为基数,按照良性图像和恶性图像之间不平衡比率进行随机图像块采样,对训练集和验证集中良性恶性图像进行随机图像块采样策略,并通过正常图像块训练得到的生成对抗网络对恶性图像块进行筛选。若大于某一阈值则系统判定为错误标签的图像块,若小于某一阈值则系统判定为正确标签的图像块;
4、对筛选正常区域得到的良性图像进行旋转45度、90度、135度、180度、225度、270度、315度操作、水平翻转和竖直翻转操作,在40X、100X、200X和400X分别得到63750张、66332张、64169张和58212张224×224尺寸的良性图像块;
5、使用40X、100X、200X和400X分别得到63750张、66332张、64169张和58212张224×224尺寸的良性图像块训练无监督的生成对抗网络,通过生成对抗网络学习可以得到良性图像块的样本的数据分布;
6、通过良性图像块训练得到的生成对抗网络对恶性图像块进行进一步地筛选。若大于某一阈值则系统判定为错误标签的图像块,若小于某一阈值则系统判定为正确标签的图像块;
7、对具有正确标签的恶性图像块进行旋转45度、90度、135度、180度、225度、270度、315度操作、水平翻转和竖直翻转操作,在40X、100X、200X和400X分别得到63020张、66102张、63940张和57904张224×224尺寸的恶性图像块,从而生成最终用于训练分类网络的训练集和验证集;
8、使用在40X、100X、200X和400X分别得到63750张、66332张、64169张和58212张224×224尺寸的良性图像块和在40X、100X、200X和400X分别得到63020张、66102张、63940张和57904张224×224尺寸的恶性图像块训练基于循环密集连接的卷积网络;
本发明使用训练批次大小为64的Adam优化器来训练分类模型。学习率设置为0.001。算法基于Python语言实现,使用Pytorch深度学习框架,在具有三块NVIDIA GeForceGTX 1080iT GPU上运行,显卡内存为24GB。
9、对测试集进行随机图像块采用策略和数据增强操作,使用基于循环密集连接的卷积网络进行测试,通过多数投票策略组合步骤1)的测试集的分类结果,计算在乳腺癌组织病理数据集在图像级别和患者级别的准确率。
令Ck为每个类别的总投票数,则可以表示为:
假设T是测试图像I的预测标签,将图像I中最多数图像块所属的组织病理类型的标签赋予图像I:
T=argmax(Ck)
在对比不同算法模型时,需要使用统一的衡量算法能力的评价标准,即性能度量方法,不同的任务需求有各自适用的性能度量方法。对于医学图像分类任务,采用公认的两个方面评价模型的分类性能:图像级别准确率和患者级别准确率。
1)图像级别准确率
令Nall代表验证集和测试集中病理图像的数量,Nr代表其中被正确分类的图像数量,则图像级别的准确率可表示为:
2)患者级别准确率
对于乳腺癌组织病理学图像的分类,可以从两个方面评价模型的分类性能:患者级别和图像级别。从患者的层面计算准确率,设Nnp为每位患者病理图像的数量,Nrp为每位患者被正确分类的图像数量,Np为患者总数量,则有:
则患者级别的准确率可表示为:
通过采用多数投票算法将图像块的分类结果融合,得出高分辨率乳腺癌组织病理学图像二分类图像级别和患者级别的准确率,为了验证本发明的有效性,与基于深度学习的医学图像分类算法中常见的分类网络AlexNet、VGG16卷积神经网络和仅使用基于循环密集连接的卷积网络(未使用生成对抗网络进行图像块筛选)的方法进行了对比,实验结果如表1所示。
表1 BreakHis数据集图像级别和患者级别的准确率
综上所述,所有方法均在40X放大倍数下获得最佳的性能,这是由于随着放大倍数的增大,图像中的细胞数目变少并且细胞面积变大,导致携带的信息减少。本发明提出的基于生成对抗网络筛选错误标签图像块的乳腺癌组织病理类型分类方法可以有效提升分类的准确率。首先,通过生成对抗网络学习良性图像样本的数据分布,可以解决基于图像块分类方法存在错误标签的问题,筛选出最具有判别性的乳腺癌组织病理图像块,有助于提高后续分类网络的性能;其次,与使用AlexNet、VGG16卷积神经网络的分类算法和仅使用基于循环密集连接的卷积神经网络算法相比,本发明提出基于生成对抗网络筛选错误标签图像块的乳腺癌组织病理类型分类方法既解决了错误标签图像块的问题,又保证网络中层与层之间最大程度的信息传输,实现特征的复用,进一步提高了分类的准确率。另外循环结构可以在实际训练过程中节省存储空间,有利于进一步提高分类的准确性和效率。从而为本发明方法应用于临床诊断奠定了基础。
为了更好地理解本发明,以上结合本发明的具体实施例做了详细描述,但并非是对本发明的限制。凡是依据本发明的技术实质对以上实施例所做的任何简单修改,均仍属于本发明技术方案的范围。本说明书中每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
Claims (10)
1.一种基于生成对抗网络筛选图像块的乳腺癌组织病理类型分类方法,包括获取乳腺癌组织病理类型图像数据集,其特征在于,还包括以下步骤:
步骤1:对乳腺癌组织病理类型图像进行预处理;
步骤2:生成对抗网络筛选良性图像块和恶性图像块中的正常区域;
步骤3:生成对抗网络筛选恶性图像块中的良性区域;
步骤4:使用基于循环密集连接的卷积神经网络对所述乳腺癌组织病理图像进行分类。
2.如权利要求1所述的基于生成对抗网络筛选图像块的乳腺癌组织病理类型分类方法,其特征在于:所述步骤1包括以下子步骤:
步骤11:对所述乳腺癌组织病理类型图像数据集进行染色标准化处理;
步骤12:将所述乳腺癌组织病理类型图像数据集划分为训练集、验证集和测试集;将所述训练集和所述验证集中正常图像进行随机图像块采样策略,得到正常图像块;
步骤13:使用所述正常图像块训练无监督的生成对抗网络。
3.如权利要求2所述的基于生成对抗网络筛选图像块的乳腺癌组织病理类型分类方法,其特征在于:所述生成对抗网络由两个对抗的模块,生成网络G和判别网络D组成。
5.如权利要求4所述的基于生成对抗网络筛选图像块的乳腺癌组织病理类型分类方法,其特征在于:所述步骤2包括使用所述训练集和所述验证集中的所述良性图像进行随机图像块采样策略,使用所述生成对抗网络对所述良性图像块进行筛选,大于第一阈值的图像块为错误标签的图像块,小于第一阈值的图像块为正确标签的图像块,筛选出良性肿瘤中存在的正常区域。
6.如权利要求5所述的基于生成对抗网络筛选图像块的乳腺癌组织病理类型分类方法,其特征在于:所述步骤2还包括所述生成对抗网络自动学习良性图像块样本数据分布,生成带有良性属性的生成对抗网络。
7.如权利要求6所述的基于生成对抗网络筛选图像块的乳腺癌组织病理类型分类方法,其特征在于:所述步骤2还包括使用所述训练集和所述验证集中的所述恶性图像进行随机图像块采样策略,使用所述生成对抗网络对恶性图像块进行初次筛选,大于第一阈值的图像块为错误标签的图像块,小于第一阈值的图像块为正确标签的图像块,筛选出恶性肿瘤中存在的正常区域。
8.如权利要求7所述的基于生成对抗网络筛选图像块的乳腺癌组织病理类型分类方法,其特征在于:所述步骤3包括使用所述带有良性属性的生成对抗网络对的恶性图像块进行二次筛选,大于第二阈值的图像块为错误标签的图像块,小于第二阈值的图像块为正确标签的图像块,筛选出恶性肿瘤中存在的良性区域。
9.如权利要求8所述的基于生成对抗网络筛选图像块的乳腺癌组织病理类型分类方法,其特征在于:所述步骤3还包括对于给定测试图像块x′,在潜在空间中找到一个点z′,该点与图像G(z)对应,该图像在视觉上与异常图像x′最相似,并且位于良性图像分布X上。
10.如权利要求9所述的基于生成对抗网络筛选图像块的乳腺癌组织病理类型分类方法,其特征在于:所述点z′的获取方法为:
步骤31:定义一个损失函数,代表潜在空间向量映射到图像的损失;
步骤32:在潜在空间分布Z中随机采样z′1并将其馈送到训练有素的生成器中以获得生成的图像G(z′Γ),代入损失函数计算损失;
步骤33:计算损失函数关于的梯度,利用梯度下降法不断更新迭代,迭代过程中通过δ=1,2,…,Γ来优化z在潜空间Z中的位置,直到最相似的图像G(z′Γ),其中,δ为迭代次数,Γ为迭代总次数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010960168.2A CN112101451B (zh) | 2020-09-14 | 2020-09-14 | 一种基于生成对抗网络筛选图像块的乳腺癌组织病理类型分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010960168.2A CN112101451B (zh) | 2020-09-14 | 2020-09-14 | 一种基于生成对抗网络筛选图像块的乳腺癌组织病理类型分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112101451A true CN112101451A (zh) | 2020-12-18 |
CN112101451B CN112101451B (zh) | 2024-01-05 |
Family
ID=73752380
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010960168.2A Active CN112101451B (zh) | 2020-09-14 | 2020-09-14 | 一种基于生成对抗网络筛选图像块的乳腺癌组织病理类型分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112101451B (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112687391A (zh) * | 2021-03-15 | 2021-04-20 | 四川大学 | 一种乳腺超声图像病灶智能识别防漏判系统的构建方法 |
CN112862756A (zh) * | 2021-01-11 | 2021-05-28 | 中国医学科学院北京协和医院 | 识别甲状腺肿瘤病理图像中病变类型及基因突变的方法 |
CN112950550A (zh) * | 2021-02-04 | 2021-06-11 | 广州中医药大学第一附属医院 | 一种基于深度学习的2型糖尿病肾脏病变图像分类方法 |
CN113033667A (zh) * | 2021-03-26 | 2021-06-25 | 九江学院 | 一种超声图像两阶段深度学习的乳腺肿瘤分类方法和装置 |
CN113034443A (zh) * | 2021-03-04 | 2021-06-25 | 广州乐智医疗科技有限公司 | 一种基于多层次判别的肺癌病理切片图像处理方法及系统 |
CN113256572A (zh) * | 2021-05-12 | 2021-08-13 | 中国科学院自动化研究所 | 基于修复和选择性增强的胃镜图像分析系统、方法及设备 |
CN114511523A (zh) * | 2022-01-21 | 2022-05-17 | 中山大学 | 基于自监督学习的胃癌分子亚型分类方法及装置 |
CN114663690A (zh) * | 2022-04-19 | 2022-06-24 | 中国人民解放军战略支援部队信息工程大学 | 一种基于新型量子框架实现乳腺癌分类的方法 |
CN114937045A (zh) * | 2022-06-20 | 2022-08-23 | 四川大学华西医院 | 一种肝细胞癌病理图像分割系统 |
CN116071318A (zh) * | 2023-01-10 | 2023-05-05 | 四川文理学院 | 一种图像筛选方法及系统 |
WO2023200732A1 (en) * | 2022-04-11 | 2023-10-19 | Foundation Medicine, Inc. | Systems and methods for predicting slide-level class labels for a whole-slide image |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108765408A (zh) * | 2018-05-31 | 2018-11-06 | 杭州同绘科技有限公司 | 构建癌症病理图像虚拟病例库的方法以及基于卷积神经网络的多尺度癌症检测系统 |
WO2018222755A1 (en) * | 2017-05-30 | 2018-12-06 | Arterys Inc. | Automated lesion detection, segmentation, and longitudinal identification |
WO2018229052A1 (en) * | 2017-06-15 | 2018-12-20 | Visiopharm A/S | Method for training a deep learning model to obtain histopathological information from images |
CN109635835A (zh) * | 2018-11-08 | 2019-04-16 | 深圳蓝韵医学影像有限公司 | 一种基于深度学习与迁移学习的乳腺病变区域检测方法 |
US20190130212A1 (en) * | 2017-10-30 | 2019-05-02 | Nec Laboratories America, Inc. | Deep Network Embedding with Adversarial Regularization |
WO2020000582A1 (zh) * | 2018-06-29 | 2020-01-02 | 北京奇虎科技有限公司 | 建立跨域联合分布匹配模型的方法、装置及其应用 |
CN110727819A (zh) * | 2019-10-10 | 2020-01-24 | 北京航空航天大学 | 一种尺度自适应病理全切片图像数据库检索方法 |
CN111079862A (zh) * | 2019-12-31 | 2020-04-28 | 西安电子科技大学 | 基于深度学习的甲状腺乳头状癌病理图像分类方法 |
CN111127412A (zh) * | 2019-12-18 | 2020-05-08 | 广东工业大学 | 一种基于生成对抗网络的病理图像识别装置 |
CN111583210A (zh) * | 2020-04-29 | 2020-08-25 | 北京小白世纪网络科技有限公司 | 基于卷积神经网络模型集成的乳腺癌图像自动识别方法 |
-
2020
- 2020-09-14 CN CN202010960168.2A patent/CN112101451B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018222755A1 (en) * | 2017-05-30 | 2018-12-06 | Arterys Inc. | Automated lesion detection, segmentation, and longitudinal identification |
WO2018229052A1 (en) * | 2017-06-15 | 2018-12-20 | Visiopharm A/S | Method for training a deep learning model to obtain histopathological information from images |
US20190130212A1 (en) * | 2017-10-30 | 2019-05-02 | Nec Laboratories America, Inc. | Deep Network Embedding with Adversarial Regularization |
CN108765408A (zh) * | 2018-05-31 | 2018-11-06 | 杭州同绘科技有限公司 | 构建癌症病理图像虚拟病例库的方法以及基于卷积神经网络的多尺度癌症检测系统 |
WO2020000582A1 (zh) * | 2018-06-29 | 2020-01-02 | 北京奇虎科技有限公司 | 建立跨域联合分布匹配模型的方法、装置及其应用 |
CN109635835A (zh) * | 2018-11-08 | 2019-04-16 | 深圳蓝韵医学影像有限公司 | 一种基于深度学习与迁移学习的乳腺病变区域检测方法 |
CN110727819A (zh) * | 2019-10-10 | 2020-01-24 | 北京航空航天大学 | 一种尺度自适应病理全切片图像数据库检索方法 |
CN111127412A (zh) * | 2019-12-18 | 2020-05-08 | 广东工业大学 | 一种基于生成对抗网络的病理图像识别装置 |
CN111079862A (zh) * | 2019-12-31 | 2020-04-28 | 西安电子科技大学 | 基于深度学习的甲状腺乳头状癌病理图像分类方法 |
CN111583210A (zh) * | 2020-04-29 | 2020-08-25 | 北京小白世纪网络科技有限公司 | 基于卷积神经网络模型集成的乳腺癌图像自动识别方法 |
Non-Patent Citations (12)
Title |
---|
DILIGENT_321: "生成对抗网络(GAN)应用于图像分类_gan图像分类", pages 1, Retrieved from the Internet <URL:https://blog.csdn.net/diligent_321/article/details/55224631> * |
TATIANA MALYGINA 等: "Data augmentation with GAN: Improving chest X-ray pathologies prediction on class-imbalanced cases", INTERNATIONAL CONFERENCE ON ANALYSIS OF IMAGES, SOCIAL NETWORKS AND TEXTS, pages 321 - 334 * |
TATIANA MALYGINA 等: "Data augmentation with GAN: Improving chest X-ray pathologies prediction on class-imbalanced cases", TATIANA MALYGINA 等, pages 321 * |
YUHUA CHEN 等: "MRI Super-Resolution with GAN and 3D Multi-Level DenseNet: Smaller, Faster, and Better", pages 1, Retrieved from the Internet <URL:https://www.researchgate.net/publication/339675324_MRI_Super-Resolution_with_GAN_and_3D_Multi-Level_DenseNet_Smaller_Faster_and_Better> * |
刘靖雯 等: "基于Inception-ResNet-V2的乳腺癌病理图像识别研究", 软件导刊, no. 05, pages 225 - 229 * |
李晨 等: "基于生成对抗网络的低分化宫颈癌病理图像分类", 东北大学学报(自然科学版), no. 7, pages 1054 - 1060 * |
李晨 等: "基于生成对抗网络的低分化宫颈癌病理图像分类", 东北大学学报(自然科学版), pages 1054 - 1060 * |
杨俊豪: "基于深度学习的乳腺肿瘤病理图像自动识别和分类研究", 中国优秀硕士学位论文全文数据库 医药卫生科技辑, no. 2, pages 072 - 717 * |
杨俊豪: "基于深度学习的乳腺肿瘤病理图像自动识别和分类研究", 中国优秀硕士学位论文全文数据库 医药卫生科技辑, pages 072 - 717 * |
杨萍 等: "乳腺癌组织病理学图像分类方法研究综述", 计算机科学, no. 7, pages 145 - 149 * |
江宗康 等: "MRI脑肿瘤图像分割的深度学习方法综述", 中国图象图形学报, no. 02, pages 215 - 228 * |
陈俊周 等: "基于级联生成对抗网络的人脸图像修复", 电子科技大学学报, no. 6, pages 910 - 917 * |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112862756A (zh) * | 2021-01-11 | 2021-05-28 | 中国医学科学院北京协和医院 | 识别甲状腺肿瘤病理图像中病变类型及基因突变的方法 |
CN112862756B (zh) * | 2021-01-11 | 2024-03-08 | 中国医学科学院北京协和医院 | 识别甲状腺肿瘤病理图像中病变类型及基因突变的方法 |
CN112950550B (zh) * | 2021-02-04 | 2023-11-14 | 广州中医药大学第一附属医院 | 一种基于深度学习的2型糖尿病肾脏病变图像分类方法 |
CN112950550A (zh) * | 2021-02-04 | 2021-06-11 | 广州中医药大学第一附属医院 | 一种基于深度学习的2型糖尿病肾脏病变图像分类方法 |
CN113034443A (zh) * | 2021-03-04 | 2021-06-25 | 广州乐智医疗科技有限公司 | 一种基于多层次判别的肺癌病理切片图像处理方法及系统 |
CN112687391A (zh) * | 2021-03-15 | 2021-04-20 | 四川大学 | 一种乳腺超声图像病灶智能识别防漏判系统的构建方法 |
CN113033667A (zh) * | 2021-03-26 | 2021-06-25 | 九江学院 | 一种超声图像两阶段深度学习的乳腺肿瘤分类方法和装置 |
CN113256572A (zh) * | 2021-05-12 | 2021-08-13 | 中国科学院自动化研究所 | 基于修复和选择性增强的胃镜图像分析系统、方法及设备 |
CN114511523A (zh) * | 2022-01-21 | 2022-05-17 | 中山大学 | 基于自监督学习的胃癌分子亚型分类方法及装置 |
WO2023200732A1 (en) * | 2022-04-11 | 2023-10-19 | Foundation Medicine, Inc. | Systems and methods for predicting slide-level class labels for a whole-slide image |
CN114663690B (zh) * | 2022-04-19 | 2023-04-28 | 中国人民解放军战略支援部队信息工程大学 | 一种基于新型量子框架实现乳腺癌分类的系统 |
CN114663690A (zh) * | 2022-04-19 | 2022-06-24 | 中国人民解放军战略支援部队信息工程大学 | 一种基于新型量子框架实现乳腺癌分类的方法 |
CN114937045A (zh) * | 2022-06-20 | 2022-08-23 | 四川大学华西医院 | 一种肝细胞癌病理图像分割系统 |
CN116071318A (zh) * | 2023-01-10 | 2023-05-05 | 四川文理学院 | 一种图像筛选方法及系统 |
CN116071318B (zh) * | 2023-01-10 | 2024-01-16 | 四川文理学院 | 一种图像筛选方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112101451B (zh) | 2024-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112101451B (zh) | 一种基于生成对抗网络筛选图像块的乳腺癌组织病理类型分类方法 | |
Man et al. | Classification of breast cancer histopathological images using discriminative patches screened by generative adversarial networks | |
CN109166105B (zh) | 人工智能医学影像的肿瘤恶性风险分层辅助诊断系统 | |
CN108389201B (zh) | 基于3d卷积神经网络与深度学习的肺结节良恶性分类方法 | |
Das et al. | Computer-aided histopathological image analysis techniques for automated nuclear atypia scoring of breast cancer: a review | |
KR102108050B1 (ko) | 증강 컨볼루션 네트워크를 통한 유방암 조직학 이미지 분류 방법 및 그 장치 | |
CN108464840B (zh) | 一种乳腺肿块自动检测方法及系统 | |
CN111985536B (zh) | 一种基于弱监督学习的胃镜病理图像分类方法 | |
CN109670510A (zh) | 一种基于深度学习的胃镜活检病理数据筛查系统和方法 | |
CN112365464B (zh) | 一种基于gan的医学图像病变区域弱监督定位方法 | |
CN110827242A (zh) | 一种基于卷积神经网络的颅内动脉瘤检测方法及系统 | |
Pan et al. | Cell detection in pathology and microscopy images with multi-scale fully convolutional neural networks | |
CN113221978A (zh) | 基于弱监督学习的结直肠癌数字病理图像判别方法及系统 | |
CN110264454B (zh) | 基于多隐藏层条件随机场的宫颈癌组织病理图像诊断方法 | |
CN114565761A (zh) | 一种基于深度学习的肾透明细胞癌病理图像肿瘤区域的分割方法 | |
CN110189293A (zh) | 细胞图像处理方法、装置、存储介质及计算机设备 | |
US20230005140A1 (en) | Automated detection of tumors based on image processing | |
Kanwal et al. | Quantifying the effect of color processing on blood and damaged tissue detection in whole slide images | |
Tyagi et al. | Identification and classification of prostate cancer identification and classification based on improved convolution neural network | |
CN116759076A (zh) | 一种基于医疗影像的无监督疾病诊断方法及系统 | |
Pan et al. | A review of machine learning approaches, challenges and prospects for computational tumor pathology | |
Xu et al. | A high-precision classification method of mammary cancer based on improved DenseNet driven by an attention mechanism | |
Chen et al. | An interpretable Algorithm for uveal melanoma subtyping from whole slide cytology images | |
CN113870194A (zh) | 深层特征和浅层lbp特征融合的乳腺肿瘤超声图像处理装置 | |
Chugh et al. | Morphological and otsu’s technique based mammography mass detection and deep neural network classifier based prediction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |