CN109920538B - 一种基于数据增强的零样本学习方法 - Google Patents

一种基于数据增强的零样本学习方法 Download PDF

Info

Publication number
CN109920538B
CN109920538B CN201910171535.8A CN201910171535A CN109920538B CN 109920538 B CN109920538 B CN 109920538B CN 201910171535 A CN201910171535 A CN 201910171535A CN 109920538 B CN109920538 B CN 109920538B
Authority
CN
China
Prior art keywords
focus
outline
color
classifier
pictures
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910171535.8A
Other languages
English (en)
Other versions
CN109920538A (zh
Inventor
罗涛
郭克华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Central South University
Original Assignee
Central South University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Central South University filed Critical Central South University
Priority to CN201910171535.8A priority Critical patent/CN109920538B/zh
Publication of CN109920538A publication Critical patent/CN109920538A/zh
Application granted granted Critical
Publication of CN109920538B publication Critical patent/CN109920538B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了一种基于数据增强的零样本学习方法,画出病灶的轮廓,对轮廓采用形态学操作方法处理病灶轮廓,然后用连续梯度颜色填充方法对病灶填充颜色;使用矩阵线性变换方法丰富填充了颜色的病灶的多样性,生成多张仿真的病灶图片,再使用图像融合技术将仿真病灶图片与疾病背景图片进行融合,对融合后的图片加以高斯白噪声就得到扩充的样本集;用扩充的样本集训练VGG分类器,训练一个最优的分类器;利用所述最优的分类器测试皮肤病病例。本发明有效解决了罕见疾病的零样本学习辅助诊断问题。

Description

一种基于数据增强的零样本学习方法
技术领域
本发明涉及医疗影像辅助诊断领域,特别是一种基于数据增强的零样本学习方法。
背景技术
现阶段医疗资源匮乏,专业医生短缺,医生培养周期长;医疗资源分配不均,大医院人满为患,小医院无人问津。深度学习在医学上的应用,可以帮助医疗欠发达地区和医院开发智能医疗诊断机器人;提供专业而准确的诊断辅助,提高医疗诊断水平,降低误诊率;降低医生的工作压力,提高医务工作者的工作效率。但是目前的医疗影像辅助诊断存在以下问题:现阶段的医疗影像辅助诊断大多为有监督学习,需要收集大量已标注的医疗影像数据去训练模型。但出于保护病人隐私等原因,某些疾病往往收集不到足够的数据去训练模型,尤其是某些罕见疾病更难获得数据,使得传统的有监督学习方法无法在这些疾病辅助诊断上应用。可以用零样本学习解决数据难以收集的问题,但现阶段已有的零样本学习方法在医疗影像上并不适用。
目前零样本学习还是不能摆脱对其他语义信息的依赖:比如标注的属性,或者用词向量去提语义特征。文献[1]在2009年首次提出零样本学习,它是基于属性的,包括直接属性预测和间接属性预测两种模型。基于属性的零样本学习的主要做法是将类别预测转化为属性预测,视觉特征被映射到属性空间,再利用属性空间的最近邻思想实现对未见类的分类。直接属性预测的准确率为40.5%,间接属性预测的准确率为27.8%。文献[2]是一篇零样本学习的综述。文章总结了目前的零样本学习方法,列举了目前的一些公开的零样本学习数据集,指出现有的零样本学习存在域漂移问题并指出未来的研究方向。文献[3]提出了一种用于学习零样本学习无偏嵌入的直接但有效的方法。这种方法假设标注的源数据和未标注的目标数据在模型训练的过程中可以使用。文章提出准全监督学习,将图片映射到语义空间,在语义空间近邻的点属于同一类别。同时文章也指出,大多数现有的零样本学习方法存在着强偏的问题,导致在测试阶段中,在目标数据集中的新类图像倾向于被分到源类当中。
现有的零样本学习技术大多基于属性实现,通过属性预测去实现类别预测,需要事先准备用于属性分类器训练的其他类别图片。即现有零样本学习太依赖语义信息(包括属性等语义信息),而在医疗影像领域,没办法通过属性预测实现类别预测,基于属性的零样本学习在医疗影像领域并不适用。现有零样本学习技术不符合以下场景中医生对疾病的学习认知过程:专家医生教新手医生识别某种疾病,只需要专家医生画出疾病的大致轮廓和特征,新手医生通过抽象理解就可以分辨实际医疗图像。在这个实际场景中,新手医生并未看到真实的疾病图片,仅根据专家医生对疾病的轮廓等属性的描述就可以对疾病进行辨认,现阶段的零样本学习并不符合新手医生对疾病的学习认知过程。
发明内容
本发明所要解决的技术问题是,针对现有技术不足,提供一种基于数据增强的零样本学习方法,
为解决上述技术问题,本发明所采用的技术方案是:一种基于数据增强的零样本学习方法,包括以下步骤:
1)画出病灶的轮廓,对轮廓采用形态学操作中的闭运算处理,即对轮廓先膨胀后腐蚀,使得病灶轮廓连续且封闭;
2)用连续梯度颜色填充方法对病灶填充颜色:在轮廓的几何中心M处选择填充颜色,在填充了颜色的轮廓上任意取一点A,A点的颜色填充为待融合时背景图片上该点处的颜色,连接几何中心M与A,在线段MA上每一点填充的颜色RGB像素值随与M点的距离均匀变化,越靠近M的点RGB像素值越接近M的像素值;
3)使用矩阵线性变换方法丰富填充了颜色的病灶的多样性,生成多张仿真病灶图片;
4)使用图像融合技术将仿真病灶图片与疾病背景图片进行融合:先用仿真病灶图片覆盖在背景图片上,然后将轮廓周围3个像素范围内像素点改为病灶颜色和背景图片颜色的平均值,最后对融合后的图片加以高斯白噪声就得到扩充的样本集;
5)用扩充的样本集训练VGG分类器,训练一个最优的分类器;
6)利用所述最优的分类器测试皮肤病病例,判断测试准确率是否达到阈值,若是,则结束;否则,返回步骤2)。
步骤1)中,搭建Python环境,利用Python的Pyqt5包进行交互界面设计,所述交互界面包括皮肤病的选择、皮肤病背景图片选择、病灶轮廓的描绘、批量生成扩充样本集、扩充样本集的训练、实际皮肤病的病例分类测试六个部分;在所述就界面上选择疾病名称、疾病背景图片,画出病灶的轮廓。
步骤4)中,使用经典的卷积神经网络结构VGG作为分类器,设置卷积神经网络每个超参数取不同的值,训练出多个分类器,根据分类器对真实疾病图片的分类正确率,选取正确率最高的超参数作为最终的超参数,利用最终的超参数,训练得到最优的分类器;所述超参数包括迭代次数、学习率。
所述阈值为0.80。
与现有技术相比,本发明所具有的有益效果为:本发明利用图像融合以及形态学变换等操作,得到扩充后的疾病数据集;利用扩充后的数据集训练一个能对疾病分类的分类器;将训练好的分类器用于实际的医疗影像图片。经过实验证明,经过数据增强后的数据集训练出的深度学习模型,可以很好地对真实医疗图片进行分类,有效解决了罕见疾病的零样本学习辅助诊断问题。
附图说明
图1为本发明方法流程图;
图2为本发明选择背景图片示意图;
图3为本发明画出病灶范围示意图;
图4为本发明画出病灶的轮廓示意图;
图5为本发明生成训练集图片示意图;
具体实施方式
结合传统医疗影像诊断过程和深度学习技术特点,本发明采用tensorflow框架,利用数据增强技术,将专家医生对罕见疾病的特征描绘图与背景图片融合,批量生成医疗影像图片作为训练样本,并放在深度卷积神经网络模型中训练,得到相对应疾病的医疗诊断模型,最后将诊断模型用于真实的医疗影像图片病例分类。
本发明最重要的数据增强部分在医生交互界面模块。医生交互界面模块包括疾病背景图片选择、病灶范围的选择、病灶轮廓的描绘、病灶中心颜色的选取、批量生成扩充样本集、扩充样本集的训练、实际皮肤病的病例分类七个部分。
具体的技术分为以下三个部分:
1)数据增强:基于用户交互与图像融合的零样本学习数据增强技术
首先,搭建Python环境,利用Python的Pyqt5包进行交互界面设计。医生交互界面模块包括皮肤病的选择、皮肤病背景图片选择、病灶轮廓的描绘、批量生成扩充样本集、扩充样本集的训练、实际皮肤病的病例分类测试六个部分。每个部分都有对应的控件以及事件响应。在医生选择疾病名称、疾病背景图片之后,医生画出病灶的轮廓,对轮廓采用OpenCV中的形态学操作方法处理病灶轮廓,然后用连续梯度颜色填充方法对病灶填充颜色,再使用矩阵线性变换方法丰富病灶的多样性,就可以生成多张仿真的病灶图片,再使用图像融合技术将仿真病灶图片与疾病背景图片进行融合,最后为增强模型的鲁棒性,对融合后的图片加以高斯白噪声就得到扩充的样本集。
2)学习:面向深度卷积神经网络的扩充样本集特征学习
在得到数据增强后的扩充样本集后,需要设计一个深度卷积网络训练一个对疾病进行诊断的分类器。使用Python语言的TensorFlow框架构建深度学习环境,使用经典的卷积神经网络结构VGG作为分类器,利用预训练权重初始化网络参数,达到迁移学习的目的。用扩充的样本集去训练VGG分类器,使得分类器对扩充的样本集可以正确分类,学习到了扩充样本集的特征。但神经网络有一些人为设置的参数(称为超参数),比如迭代次数、学习率等。不同的超参数取值,训练出来的分类器是有差别的。超参数合适的取值才能有利于分类器对疾病的分类。为了探索合适的超参数取值,我们设置每个超参数取不同的值,训练出多个分类器,根据分类器对真实疾病图片的分类正确率,选取正确率最高的超参数作为最终的超参数。最后利用挑选的超参数,训练一个最优的分类器。
3)病例分类:面向皮肤病医疗影像的病例分类方法研究
利用中南大学湘雅医院提供的数据:毛囊虫、扁平疣等皮肤病医疗影像数据,先用数据增强得到扩充后的样本集,再用样本集训练卷积网络分类器,最后用分类器测试真实的皮肤病病例,根据多个评价指标对测试结果分析并反思改进数据增强的方法以达到更好测试效果。对于毛囊虫这种皮肤病,一共收集到240张无毛囊虫的CT图片和248张有毛囊虫的CT图片。先从无毛囊虫的CT图片中选取一张包含毛囊的图片作为背景图片,让医生在背景图片上画出毛囊虫的轮廓等特征,再用数据增强方法得到500张有毛囊虫的仿真图片和500张无毛囊虫的仿真图片,将这1000张仿真图片作为扩充样本集去训练卷积神经网络,最后将卷积神经网络对240张无毛囊虫的CT和248张有毛囊虫的CT图片进行测试,对测试准确率进行分析。
参考文献:
[1]Lampert C H,Nickisch H,Harmeling S.Learning to detect unseenobject classes by between-class attribute transfer.In Computer Vision andPattern Recognition,2009.
[2]Fu Y,Xiang T,Jiang Y G,et al.Recent Advances in Zero-shotRecognition.In Computer Vision and Pattern Recognition,2017.
[3]Song J,Shen C,Yang Y,et al.Transductive Unbiased Embedding forZero-Shot Learning.In Computer Vision and Pattern Recognition,2018.
[4]Sung F,Yang Y,Zhang L,et al.Learning to Compare:Relation Networkfor Few-Shot Learning.In Computer Vision and Pattern Recognition,2017.
[5]Kodirov E,Xiang T,Gong S,et al.Semantic Autoencoder for Zero-ShotLearning.In Computer Vision and Pattern Recognition,2017.

Claims (4)

1.一种基于数据增强的零样本学习方法,其特征在于,包括以下步骤:
1)画出病灶的轮廓,对轮廓采用形态学操作中的闭运算处理,即对轮廓先膨胀后腐蚀,使得病灶轮廓连续且封闭;
2)用连续梯度颜色填充方法对病灶填充颜色:在轮廓的几何中心M处选择填充颜色,在填充了颜色的轮廓上任意取一点A,A点的颜色填充为待融合时背景图片上该点处的颜色;
3)使用矩阵线性变换方法丰富填充了颜色的病灶的多样性,生成多张仿真病灶图片;
4)使用图像融合技术将仿真病灶图片与疾病背景图片进行融合:先用仿真病灶图片覆盖在背景图片上,然后将轮廓周围3个像素范围内像素点改为病灶颜色和背景图片颜色的平均值,最后对融合后的图片加以高斯白噪声就得到扩充的样本集;
5)用扩充的样本集训练VGG分类器,训练一个最优的分类器;
6)利用所述最优的分类器测试皮肤病病例,判断测试准确率是否达到阈值,若是,则结束;否则,返回步骤2)。
2.根据权利要求1所述的基于数据增强的零样本学习方法,其特征在于,步骤1)中,搭建Python环境,利用Python的Pyqt5包进行交互界面设计,所述交互界面包括皮肤病的选择、皮肤病背景图片选择、病灶轮廓的描绘、批量生成扩充样本集、扩充样本集的训练、实际皮肤病的病例分类测试六个部分;在所述交互 界面上选择疾病名称、疾病背景图片,画出病灶的轮廓。
3.根据权利要求1所述的基于数据增强的零样本学习方法,其特征在于,步骤4)中,使用经典的卷积神经网络结构VGG作为分类器,设置卷积神经网络每个超参数取不同的值,训练出多个分类器,根据分类器对真实疾病图片的分类正确率,选取正确率最高的超参数作为最终的超参数,利用最终的超参数,训练得到最优的分类器;所述超参数包括迭代次数、学习率。
4.根据权利要求1所述的基于数据增强的零样本学习方法,其特征在于,所述阈值为0.80。
CN201910171535.8A 2019-03-07 2019-03-07 一种基于数据增强的零样本学习方法 Active CN109920538B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910171535.8A CN109920538B (zh) 2019-03-07 2019-03-07 一种基于数据增强的零样本学习方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910171535.8A CN109920538B (zh) 2019-03-07 2019-03-07 一种基于数据增强的零样本学习方法

Publications (2)

Publication Number Publication Date
CN109920538A CN109920538A (zh) 2019-06-21
CN109920538B true CN109920538B (zh) 2022-11-25

Family

ID=66963755

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910171535.8A Active CN109920538B (zh) 2019-03-07 2019-03-07 一种基于数据增强的零样本学习方法

Country Status (1)

Country Link
CN (1) CN109920538B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109948562B (zh) * 2019-03-25 2021-04-30 浙江啄云智能科技有限公司 一种基于x射线图像的安检系统深度学习样本生成方法
CN110288614B (zh) * 2019-06-24 2022-01-11 睿魔智能科技(杭州)有限公司 图像处理方法、装置、设备及存储介质
CN110309875A (zh) * 2019-06-28 2019-10-08 哈尔滨工程大学 一种基于伪样本特征合成的零样本目标分类方法
CN111415293A (zh) * 2020-03-12 2020-07-14 上海数川数据科技有限公司 基于图像目标-背景变换的数据集增强方法及系统
CN111860387B (zh) * 2020-07-27 2023-08-25 平安科技(深圳)有限公司 扩充数据的方法、装置和计算机设备
CN113469279A (zh) * 2021-07-22 2021-10-01 凌云光技术股份有限公司 一种字符样本集的扩增方法、系统及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108198620A (zh) * 2018-01-12 2018-06-22 洛阳飞来石软件开发有限公司 一种基于深度学习的皮肤疾病智能辅助诊断系统
WO2018120942A1 (zh) * 2016-12-31 2018-07-05 西安百利信息科技有限公司 一种多模型融合自动检测医学图像中病变的系统及方法
CN108806792A (zh) * 2017-05-03 2018-11-13 金波 深度学习面诊系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10229492B2 (en) * 2015-06-17 2019-03-12 Stoecker & Associates, LLC Detection of borders of benign and malignant lesions including melanoma and basal cell carcinoma using a geodesic active contour (GAC) technique

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018120942A1 (zh) * 2016-12-31 2018-07-05 西安百利信息科技有限公司 一种多模型融合自动检测医学图像中病变的系统及方法
CN108806792A (zh) * 2017-05-03 2018-11-13 金波 深度学习面诊系统
CN108198620A (zh) * 2018-01-12 2018-06-22 洛阳飞来石软件开发有限公司 一种基于深度学习的皮肤疾病智能辅助诊断系统

Also Published As

Publication number Publication date
CN109920538A (zh) 2019-06-21

Similar Documents

Publication Publication Date Title
CN109920538B (zh) 一种基于数据增强的零样本学习方法
Xu et al. Multi-task joint learning model for segmenting and classifying tongue images using a deep neural network
CN112150478B (zh) 一种构建半监督图像分割框架的方法及系统
CN108364288A (zh) 用于乳腺癌病理图像的分割方法和装置
CN111563452B (zh) 一种基于实例分割的多人体姿态检测及状态判别方法
CN109389129A (zh) 一种图像处理方法、电子设备及存储介质
Pan et al. Mitosis detection techniques in H&E stained breast cancer pathological images: A comprehensive review
CN111767952B (zh) 一种可解释的肺结节良恶性分类方法
CN109977955A (zh) 一种基于深度学习的宫颈癌前病变识别的方法
CN111931811A (zh) 一种基于超像素图像相似度的计算方法
CN113662664B (zh) 一种基于仪器追踪的外科手术质量客观自动化评估方法
CN106780453A (zh) 一种基于深度信任网络实现对脑肿瘤分割的方法
Ye et al. Medical image diagnosis of prostate tumor based on PSP-Net+ VGG16 deep learning network
CN109657634A (zh) 一种基于深度卷积神经网络的3d手势识别方法及系统
CN109934804A (zh) 基于卷积神经网络的阿尔茨海默病变区域的检测方法
Wang et al. Cataract detection based on ocular B-ultrasound images by collaborative monitoring deep learning
CN113627564A (zh) 基于深度学习的ct医学影像处理模型训练方法及诊疗系统
Mamdouh et al. A New Model for Image Segmentation Based on Deep Learning.
CN112489048B (zh) 一种基于深度网络的视神经自动分割方法
CN112215285B (zh) 一种基于跨媒体特征的眼底图像自动标注方法
CN115862837A (zh) 一种基于类型推理与语义约束的医学视觉问答方法
Ke et al. Weakly supervised fine-grained image classification via two-level attention activation model
CN111368663A (zh) 自然场景中静态面部表情识别方法、装置、介质及设备
Guo et al. Zero shot augmentation learning in internet of biometric things for health signal processing
Wang et al. Optic disc detection based on fully convolutional neural network and structured matrix decomposition

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant