CN110223281B - 一种数据集中含有不确定数据时的肺结节图像分类方法 - Google Patents

一种数据集中含有不确定数据时的肺结节图像分类方法 Download PDF

Info

Publication number
CN110223281B
CN110223281B CN201910489713.1A CN201910489713A CN110223281B CN 110223281 B CN110223281 B CN 110223281B CN 201910489713 A CN201910489713 A CN 201910489713A CN 110223281 B CN110223281 B CN 110223281B
Authority
CN
China
Prior art keywords
image
lung nodule
data set
model
nodule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910489713.1A
Other languages
English (en)
Other versions
CN110223281A (zh
Inventor
毛克明
王新琦
常辉东
李佳明
李翰鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenyang Mingran Technology Co ltd
Original Assignee
Northeastern University China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeastern University China filed Critical Northeastern University China
Priority to CN201910489713.1A priority Critical patent/CN110223281B/zh
Publication of CN110223281A publication Critical patent/CN110223281A/zh
Application granted granted Critical
Publication of CN110223281B publication Critical patent/CN110223281B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • G06T2207/10081Computed x-ray tomography [CT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30061Lung
    • G06T2207/30064Lung nodule
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Radiology & Medical Imaging (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Quality & Reliability (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Apparatus For Radiation Diagnosis (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本发明涉及计算机视觉技术领域,提供一种数据集中含有不确定数据时的肺结节图像分类方法。首先,收集肺结节CT图像集并利用专家投票法通过多数投票原则确定图像的类别,经过预处理后得到肺结节CT图像数据集;然后,基于知识蒸馏法,构建包括教师模型、学生模型的肺结节图像分类模型;接着,获取确定标签数据集,在确定标签数据集上训练教师模型,并在肺结节CT图像数据集上计算软标签;然后,在联合硬标签和软标签的数据集上训练学生模型;最后,将预处理后的待分类肺结节CT图像输入训练后的肺结节图像分类模型中,获得其类别。本发明能够有效利用数据集中的不确定标签数据,提升肺结节诊断的准确性和效率,且易用性和鲁棒性高。

Description

一种数据集中含有不确定数据时的肺结节图像分类方法
技术领域
本发明涉及计算机视觉技术领域,特别是涉及一种数据集中含有不确定数据时的肺结节图像分类方法。
背景技术
肺癌是世界上最致命的疾病之一,2017年肺癌约占所有癌症发病人数的26%。尽管最近的诊断和治疗取得了长足的发展,但肺癌五年治愈率仅为18%。值得注意的是,如果患者能够进行早期准确诊断并且实施适当的治疗,那么这一比率将大大增加。低剂量计算机断层扫描(CT)已被广泛用于肺癌检查,与其他成像技术相比,CT可以显示低对比度的结节,具有更多优势。根据全国肺部筛查的报告,低剂量CT扫描可将肺癌死亡率降低20%。传统的肺结节诊断主要依赖医生专家的观察,因此会有一些缺点:诊断结果具有主观性;工作量大耗时长;人类视觉局限性;偏远地区医生无法普及。随着计算机视觉技术的发展,特别是自动分类识别技术取得的进步,通过提供有价值的意见来帮助临床医生进行诊断。
现在计算机视觉和机器学习技术的发展使快速和可靠的CT图像分类成为可能,因其高效和减少人工等优势成为热门的研究领域。一些有代表性的工作包括采用基于肺结节图像的低维度特征,包括纹理、形状、滤波和强度等;还有一些算法采用一些在计算机视觉领域中精心设计的特征提取和表示方法,如SIFT,HOG,LBP特征等;随着计算能力的提高和深度学习的兴起,基于深度学习的目标检测和识别性能,不论是检测速度还是检测准确度都获得了很大的提高。深度学习模型可以描述肺结节图像的高级抽象,具有强大的特征提取能力和泛化能力,因此深度学习方法的效果远远好于传统机器学习方法。但是神经网络模型的训练需要大量的标注正确的数据。因为医学影像标注的专业性和特殊性,还有道德法律的限制,所以获得大量的训练数据是一件困难的事情。在一般的公共数据集中包括以下问题:(i)数据集规模小,类别分布不平衡;(ii)包含噪音和不确定的标签。以LIDC-IDRI数据集为例,肺部CT图片通过多个专家进行标注,每个专家标注数据的一部分,每个数据也被多个专家标注,虽然工作量减少并能给出相对较好的标注结果,但是不同的专家水平不同,会产生很多不统一的标签;其次,数据中有许多被判定为不确定类型的数据和无标签的数据,传统的处理方法是将不确定类型的数据直接舍弃,但这种做法会丢失很多有价值的信息。
因此,针对肺结节图像数据集包含不统一标签和不确定数据的现状,急需要一种可以高效处理和分类CT图像中肺结节良恶性的方法。
发明内容
针对现有技术存在的问题,本发明提供一种数据集中含有不确定数据时的肺结节图像分类方法,能够有效利用数据集中的不确定标签数据,提升肺结节诊断的准确性和效率,且易用性和鲁棒性高。
本发明的技术方案为:
一种数据集中含有不确定数据时的肺结节图像分类方法,其特征在于,包括下述步骤:
步骤1:组织数据集:收集N张肺结节CT图像构成图像集I={I1,I2,...,In,...,IN},将肺结节分为良性、恶性和不确定三种类型;采用专家法对每张肺结节CT图像进行类别标注,得到第n张肺结节CT图像In的类别为en;对每张肺结节CT图像进行预处理,得到肺结节CT图像数据集D;所述预处理包括将肺结节CT图像转换为JPG格式并对转换后的图像进行裁剪、尺寸调整、数据增强预处理;
其中,n∈{1,2,...,N},en∈Mlevel,Mlevel={0,1,2},Mlevel中的0、1、2分别代表良性、不确定、恶性三种肺结节类型;D={(x1,y1),(x2,y2),...,(xi,yi),...,(xm,ym)},m为肺结节CT图像数据集D中的样本总数,xi为肺结节CT图像数据集D中的第i张肺结节CT图像,yi为第i张肺结节CT图像xi的类别标签,yi∈Mlevel
步骤2:基于知识蒸馏法,构建肺结节图像分类模型,所述肺结节图像分类模型包括教师模型、学生模型;所述教师模型包括L个神经网络模型和L个softmax分类器,所述学生模型包括神经网络模型、第一softmax分类器s1、第二softmax分类器s2
步骤3:在确定标签数据集上训练教师模型;
步骤3.1:获取确定标签数据集:从肺结节CT图像数据集D中提取类别标签为良性和类别标签为恶性的元素,构成确定标签数据集DC
其中,DC={(x1,y1),(x2,y2),...,(xj,yj),...,(xmC,ymC)}∈D,mC为确定标签数据集DC中的样本总数,yj为确定标签数据集DC中的肺结节CT图像xj的类别标签,yj∈MC={0,1},MC中的0、1分别代表良性、恶性两种肺结节类型;
步骤3.2:对确定标签数据集DC按照批次处理,依次将每一批次的样本集DCs输入教师模型中的每个神经网络模型,采用随机初始化来初始化网络参数,通过教师模型中的L个神经网络模型对样本集DCs进行特征提取,在教师模型中的每个神经网络模型后都通过softmax分类器对样本集DCs中的肺结节CT图像进行分类;其中,DCs∈DC,DCs中的样本个数为ms;
对于输入的肺结节CT图像xk∈DCs,经过假设函数
Figure BDA0002086592900000031
输出二维向量pk,向量pk中的每个元素代表对于给定的肺结节CT图像xk每一个肺结节类型σ∈MC的概率估计值p(yk=σ|xk),假设函数
Figure BDA0002086592900000032
Figure BDA0002086592900000033
其中,θ={θ,θ1}为模型参数集,
Figure BDA0002086592900000034
为对概率分布进行归一化使得所有概率总和为1,
Figure BDA0002086592900000035
为模型参数集θ中第μ个元素的转置;
在确定标签数据集DC上通过损失函数JC(θ)采用小批量梯度下降法对教师模型进行训练:
Figure BDA0002086592900000036
Figure BDA0002086592900000037
Figure BDA0002086592900000038
其中,
Figure BDA0002086592900000039
logloss为类别交叉熵损失函数,log loss(p,q)=-p log q,
Figure BDA00020865929000000310
为肺结节CT图像xk经过教师模型中的神经网络模型和softmax分类器输出的类别概率向量;
Figure BDA00020865929000000311
为肺结节CT图像xk的正确类别标签即硬标签,根据步骤1中计算的类别标签来确定
Figure BDA00020865929000000312
良性为[1,0]、恶性为[0,1];R(θ)为正则化项,γ为正则化系数,γ≥0;p(yk=σ|xk;θ)为参数为θ时softmax分类器将样本xk分类为类别σ的概率,l_rt为学习率;
步骤3.3:应用训练好的教师模型到肺结节CT图像数据集D以计算软标签:去掉教师模型中每个神经网络模型后的softmax分类器,将肺结节CT图像数据集D作为教师模型中每个神经网络模型的输入,获取教师模型中每个神经网络模型的logits输出值,对教师模型中所有神经网络模型的logits输出值进行加权平均,得到肺结节CT图像xi的最终logits输出值为
Figure BDA0002086592900000041
计算得到肺结节CT图像xi的软标签为
Figure BDA0002086592900000042
其中,αr为教师模型中第r个神经网络模型的logits输出值占最终logtis输出值的权重,
Figure BDA0002086592900000043
lr()为教师模型中第r个神经网络模型的logits输出值,
Figure BDA0002086592900000044
为zi中的第μ个元素;
Figure BDA0002086592900000045
为肺结节CT图像xi的软化的概率分布即软标签,
Figure BDA0002086592900000046
中的元素数值介于0-1之间,
Figure BDA0002086592900000047
为二维向量;T为温度参数,用于控制软标签概率分布的平滑程度;
步骤4:在联合硬标签和软标签的数据集上训练学生模型:
步骤4.1:对确定标签数据集DC和不确定标签数据集Dunc按照批次处理,每一批次中从确定标签数据集DC和不确定标签数据集Dunc中随机提取数据构成联合硬标签和软标签的数据集DC-unc,依次将每一批次的数据集DC-unc输入学生模型;
其中,Dunc=D-DC,数据集DC-unc中来自确定标签数据集DC和不确定标签数据集Dunc的样本比例为ε,数据集DC-unc中的样本总数为mu;
步骤4.2:采用随机初始化来初始化网络参数,通过学生模型中的神经网络模型对数据集DC-unc进行特征提取,输出数据集DC-unc中每个肺结节CT图像的logits输出值,将数据集DC-unc中每个肺结节CT图像的logits输出值输入第一softmax分类器s1,将数据集DC-unc中每个肺结节CT图像的logits输出值除以温度参数T后输入第二softmax分类器s2;将第一softmax分类器s1的输出与硬标签输入到类别交叉熵损失函数中求出硬标签交叉熵损失函数值,将第二softmax分类器s2的输出与软标签输入到类别交叉熵损失函数中求出软标签交叉熵损失函数值,将硬标签交叉熵损失函数值和软标签交叉熵损失函数值按权重加和计算最终的损失函数值为
Figure BDA0002086592900000048
其中,xt为数据集DC-unc中的第t张肺结节CT图像;1{}为指示函数,{}内为条件,若条件成立则1{}=1,若条件不成立则1{}=0;β为硬标签交熵损失函数值的权重;
Figure BDA0002086592900000051
为肺结节CT图像xt经过学生模型中的神经网络模型和第一softmax分类器s1输出的类别标签概率分布,
Figure BDA0002086592900000052
为肺结节CT图像xt经过学生模型中的神经网络模型和第二softmax分类器s2输出的类别软标签,
Figure BDA0002086592900000053
步骤4.3:在联合硬标签和软标签的数据集DC-unc上通过损失函数J(θ)采用小批量梯度下降法对学生模型进行训练,得到训练后的学生模型;除去第二softmax分类器s2,得到训练后的肺结节图像分类模型;
步骤5:采用与步骤1中相同的预处理方法对待分类肺结节CT图像进行预处理,将预处理后的待分类肺结节CT图像输入训练后的肺结节图像分类模型中,训练后的肺结节图像分类模型对待分类肺结节CT图像进行分类,根据
Figure BDA0002086592900000054
输出待分类肺结节CT图像的类别标签。
所述步骤1中,采用专家法对每张肺结节CT图像进行类别标注,得到第n张肺结节CT图像In的类别为en,包括:通过Γ个专家分别对每张肺结节CT图像进行类别标注,得到第η个专家对第n张肺结节CT图像In的类别标注为Eη(In);计算第n张肺结节CT图像In被标注为类别e的总数为
Figure BDA0002086592900000055
若第n张肺结节CT图像In在每个类别上获得的标注数均不相同,则计算第n张肺结节CT图像In的类别为
Figure BDA0002086592900000056
若第n张肺结节CT图像In在多个类别上获得的标注数相同,则取该多个类别的算术平均值四舍五入后的值作为第n张肺结节CT图像In的类别;其中,η∈{1,2,...,Γ};若Eη(In)=e,则S(Eη(In)=e)=1;若Eη(In)≠e,则S(Eη(In)=e)=0。
所述步骤1中,对转换后的图像进行尺寸调整的方法为双三次插值方法。
所述步骤1中,肺结节CT图像的类别标签采用one-hot编码。
本发明的有益效果为:
本发明与传统的应用机器学习进行肺结节图像分类的方法相比,提出了一种模型训练方法,能够有效利用数据集中的不确定标签数据,有效解决数据集中标签不统一以及数据较少等问题,为深度神经网络的训练提供有价值的信息,提升了肺结节图像分类模型的特征提取能力,能够获得更好的模型泛化,并能在较短时间内为医生提供辅助的肺结节分类诊断结果,从而提升肺结节诊断的准确性和效率,并具有更好的易用性和鲁棒性,为肺结节图像分类技术可以应用在用户场景奠定一定的基础。
附图说明
图1为本发明数据集中含有不确定数据时的肺结节图像分类方法的流程图;
图2为本发明数据集中含有不确定数据时的肺结节图像分类方法中肺结节图像分类模型的结构示意图;
图3为本发明数据集中含有不确定数据时的肺结节图像分类方法中教师模型的结构示意图;
图4为本发明数据集中含有不确定数据时的肺结节图像分类方法中学生模型的结构示意图;
图5为本发明数据集中含有不确定数据时的肺结节图像分类方法中肺结节图像分类模型的训练过程示意图;
图6为本发明数据集中含有不确定数据时的肺结节图像分类方法中肺结节图像分类模型的测试过程示意图。
具体实施方式
下面将结合附图和具体实施方式,对本发明作进一步描述。
如图1所示,为本发明数据集中含有不确定数据时的肺结节图像分类方法的流程图。本发明的一种数据集中含有不确定数据时的肺结节图像分类方法,其特征在于,包括下述步骤:
步骤1:组织数据集:收集N张肺结节CT图像构成图像集I={I1,I2,...,In,...,IN},将肺结节分为良性、恶性和不确定三种类型;采用专家法对每张肺结节CT图像进行类别标注,得到第n张肺结节CT图像In的类别为en;对每张肺结节CT图像进行预处理,得到肺结节CT图像数据集D;所述预处理包括将肺结节CT图像转换为JPG格式并对转换后的图像进行裁剪、尺寸调整、数据增强预处理;
其中,n∈{1,2,...,N},en∈Mlevel,Mlevel={0,1,2},Mlevel中的0、1、2分别代表良性、不确定、恶性三种肺结节类型;D={(x1,y1),(x2,y2),...,(xi,yi),...,(xm,ym)},m为肺结节CT图像数据集D中的样本总数,xi为肺结节CT图像数据集D中的第i张肺结节CT图像,yi为第i张肺结节CT图像xi的类别标签,yi∈Mlevel
所述步骤1中,采用专家法对每张肺结节CT图像进行类别标注,得到第n张肺结节CT图像In的类别为en,包括:通过Γ个专家分别对每张肺结节CT图像进行类别标注,得到第η个专家对第n张肺结节CT图像In的类别标注为Eη(In);计算第n张肺结节CT图像In被标注为类别e的总数为
Figure BDA0002086592900000071
若第n张肺结节CT图像In在每个类别上获得的标注数均不相同,则计算第n张肺结节CT图像In的类别为
Figure BDA0002086592900000072
若第n张肺结节CT图像In在多个类别上获得的标注数相同,则取该多个类别的算术平均值四舍五入后的值作为第n张肺结节CT图像In的类别;其中,η∈{1,2,...,Γ};若Eη(In)=e,则S(Eη(In)=e)=1;若Eη(In)≠e,则S(Eη(In)=e)=0。
本实施例中,以LIDC-IDRI公共肺部图片数据集作为图像集I。LIDC-IDRI数据集中已包含的数据标签由四名专家按照肺结节恶性程度分为{1,2,3,4,5}五个恶性等级,其中等级1表示肺结节是恶性的可能性最低,等级5表示肺结节是恶性的可能性最高;针对本数据集的标签特点,按照步骤1所述的公式统一多个专家给出的标签,并定义恶性等级{1,2}为良性,恶性等级{4,5}为恶性,恶性等级{3}为不确定类型。将肺结节CT图像转换为JPG格式后,对图像进行裁剪:原始肺部CT扫描图像为512*512像素,以肺结节位置坐标为中心,将图像裁剪为48*48像素。然后,对图像进行尺寸调整:使用双三次插值法进一步将裁剪后的肺结节CT图像调整为64*64像素。并对肺结节CT图像应用数据增强:对于图像集I,按照0.5的概率对其进行采样,用于数据增强,使用的数据增强方法包括随机旋转、随机偏移和随机扰动(亮度、饱和度、色调和对比度);新创建的样本使用与原始标签相同的标签设置;经过数据增强的数据集被分为8组:7个随机选择的组用于训练,剩下的一组用于测试,该过程重复8次,并通过平均8次独立测试来计算结果。其中,肺结节CT图像的类别标签采用one-hot编码。
步骤2:基于知识蒸馏法,构建如图2所示的肺结节图像分类模型,所述肺结节图像分类模型包括如图3所示的教师模型、如图4所示的学生模型;所述教师模型包括L个神经网络模型和L个softmax分类器,所述学生模型包括神经网络模型、第一softmax分类器s1、第二softmax分类器s2
如图5所示,为本发明肺结节图像分类模型的训练过程示意图,训练过程如下:
步骤3:在确定标签数据集上训练教师模型;
步骤3.1:获取确定标签数据集:从肺结节CT图像数据集D中提取类别标签为良性和类别标签为恶性的元素,构成确定标签数据集DC
其中,DC={(x1,y1),(x2,y2),...,(xj,yj),...,(xmC,ymC)}∈D,mC为确定标签数据集DC中的样本总数,yj为确定标签数据集DC中的肺结节CT图像xj的类别标签,yj∈MC={0,1},MC中的0、1分别代表良性、恶性两种肺结节类型。
步骤3.2:对确定标签数据集DC按照批次处理,依次将每一批次的样本集DCs输入教师模型中的每个神经网络模型,采用随机初始化来初始化网络参数,通过教师模型中的L个神经网络模型对样本集DCs进行特征提取,在教师模型中的每个神经网络模型后都通过softmax分类器对样本集DCs中的肺结节CT图像进行分类;其中,DCs∈DC,DCs中的样本个数为ms;
对于输入的肺结节CT图像xk∈DCs,经过假设函数
Figure BDA0002086592900000081
输出二维向量pk,向量pk中的每个元素代表对于给定的肺结节CT图像xk每一个肺结节类型σ∈MC的概率估计值p(yk=σ|xk),假设函数
Figure BDA0002086592900000082
Figure BDA0002086592900000083
其中,θ={θ,θ1}为模型参数集,
Figure BDA0002086592900000084
为对概率分布进行归一化使得所有概率总和为1,
Figure BDA0002086592900000085
为模型参数集θ中第μ个元素的转置;
在确定标签数据集DC上通过损失函数JC(θ)采用小批量梯度下降法对教师模型进行训练:
Figure BDA0002086592900000086
Figure BDA0002086592900000087
Figure BDA0002086592900000088
其中,
Figure BDA0002086592900000091
logloss为类别交叉熵损失函数,log loss(p,q)=-p log q,
Figure BDA0002086592900000092
为肺结节CT图像xk经过教师模型中的神经网络模型和softmax分类器输出的类别概率向量;
Figure BDA0002086592900000093
为肺结节CT图像xk的正确类别标签即硬标签,根据步骤1中计算的类别标签来确定
Figure BDA0002086592900000094
良性为[1,0]、恶性为[0,1];R(θ)为正则化项,γ为正则化系数,γ≥0;p(yk=σ|xk;θ)为参数为θ时softmax分类器将样本xk分类为类别σ的概率,l_rt为学习率。
本实施例中,教师模型中有3个神经网络模型,分别为VGG16、resnet34、xception。在教师模型的训练过程中,参数的预定义为:初始学习率l_rt=0.01,在训练过程中,时期每增加10,学习率衰减为当前学习率的0.1倍;最大时期(epoch)数et=50,每个时期包含的训练步数s_p_et=200,每个批次大小(batch size)也即DCs中的样本个数为ms=b_st=16。
步骤3.3:应用训练好的教师模型到肺结节CT图像数据集D以计算软标签:去掉教师模型中每个神经网络模型后的softmax分类器,将肺结节CT图像数据集D作为教师模型中每个神经网络模型的输入,获取教师模型中每个神经网络模型的logits输出值,对教师模型中所有神经网络模型的logits输出值进行加权平均,得到肺结节CT图像xi的最终logits输出值为
Figure BDA0002086592900000095
计算得到肺结节CT图像xi的软标签为
Figure BDA0002086592900000096
其中,αr为教师模型中第r个神经网络模型的logits输出值占最终logtis输出值的权重,
Figure BDA0002086592900000097
lr()为教师模型中第r个神经网络模型的logits输出值,
Figure BDA0002086592900000098
为zi中的第μ个元素;
Figure BDA0002086592900000099
为肺结节CT图像xi的软化的概率分布即软标签,
Figure BDA00020865929000000910
中的元素数值介于0-1之间,
Figure BDA00020865929000000911
为二维向量;T为温度参数,用于控制软标签概率分布的平滑程度。本实施例中,温度参数T=10。
从而,确定标签数据集DC拥有硬标签和软标签,不确定标签数据集Dunc拥有软标签。
步骤4:在联合硬标签和软标签的数据集上训练学生模型:
步骤4.1:对确定标签数据集DC和不确定标签数据集Dunc按照批次处理,每一批次中从确定标签数据集DC和不确定标签数据集Dunc中随机提取数据构成联合硬标签和软标签的数据集DC-unc,依次将每一批次的数据集DC-unc输入学生模型;
其中,Dunc=D-DC,数据集DC-unc中来自确定标签数据集DC和不确定标签数据集Dunc的样本比例为ε,数据集DC-unc中的样本总数为mu;
步骤4.2:采用随机初始化来初始化网络参数,通过学生模型中的神经网络模型对数据集DC-unc进行特征提取,输出数据集DC-unc中每个肺结节CT图像的logits输出值,将数据集DC-unc中每个肺结节CT图像的logits输出值输入第一softmax分类器s1,将数据集DC-unc中每个肺结节CT图像的logits输出值除以温度参数T后输入第二softmax分类器s2;将第一softmax分类器s1的输出与硬标签输入到类别交叉熵损失函数中求出硬标签交叉熵损失函数值,将第二softmax分类器s2的输出与软标签输入到类别交叉熵损失函数中求出软标签交叉熵损失函数值,将硬标签交叉熵损失函数值和软标签交叉熵损失函数值按权重加和计算最终的损失函数值为
Figure BDA0002086592900000101
其中,xt为数据集DC-unc中的第t张肺结节CT图像;1{}为指示函数,{}内为条件,若条件成立则1{}=1,若条件不成立则1{}=0;若xt∈DC则1{xt∈DC}=1,若
Figure BDA0002086592900000105
则1{xt∈DC}=0;β为硬标签交熵损失函数值的权重,β越小,表明引导越依赖教师模型的贡献;
Figure BDA0002086592900000102
为肺结节CT图像xt经过学生模型中的神经网络模型和第一softmax分类器s1输出的类别标签概率分布,
Figure BDA0002086592900000103
为肺结节CT图像xt经过学生模型中的神经网络模型和第二softmax分类器s2输出的类别软标签,
Figure BDA0002086592900000104
步骤4.3:在联合硬标签和软标签的数据集DC-unc上通过损失函数J(θ)采用小批量梯度下降法对学生模型进行训练,得到训练后的学生模型;除去第二softmax分类器s2,得到训练后的肺结节图像分类模型。
本实施例中,学生模型中的神经网络模型为mobilenet。在学生模型的训练过程中,参数的预定义为:初始学习率l_rs=0.01,在训练过程中,时期每增加10,学习率衰减为当前学习率的0.1倍;最大时期数es=50,每个时期包含的训练步数s_p_es=200,每个批次大小(batchsize)也即数据集DC-unc中的样本总数为mu=b_ss=16,每个批次中数据集DC-unc中来自确定标签数据集DC和不确定标签数据集Dunc的样本比例为ε=1:1;温度参数T=10;硬标签交熵损失函数值的权重初始值β=0.1,在训练初期使用较小的值,在训练后期适当增加硬标签的比重。
步骤5:采用与步骤1中相同的预处理方法对待分类肺结节CT图像进行预处理,将预处理后的待分类肺结节CT图像输入训练后的肺结节图像分类模型中,训练后的肺结节图像分类模型对待分类肺结节CT图像进行分类,根据
Figure BDA0002086592900000111
输出待分类肺结节CT图像的类别标签。
如图6所示,将测试样本输入训练后的肺结节图像分类模型中,最终输出测试样本的类别标签。
显然,上述实施例仅仅是本发明的一部分实施例,而不是全部的实施例。上述实施例仅用于解释本发明,并不构成对本发明保护范围的限定。基于上述实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,也即凡在本申请的精神和原理之内所作的所有修改、等同替换和改进等,均落在本发明要求的保护范围内。

Claims (4)

1.一种数据集中含有不确定数据时的肺结节图像分类方法,其特征在于,包括下述步骤:
步骤1:组织数据集:收集N张肺结节CT图像构成图像集I={I1,I2,...,In,...,IN},将肺结节分为良性、恶性和不确定三种类型;采用专家法对每张肺结节CT图像进行类别标注,得到第n张肺结节CT图像In的类别为en;对每张肺结节CT图像进行预处理,得到肺结节CT图像数据集D;所述预处理包括将肺结节CT图像转换为JPG格式并对转换后的图像进行裁剪、尺寸调整、数据增强预处理;
其中,n∈{1,2,...,N},en∈Mlevel,Mlevel={0,1,2},Mlevel中的0、1、2分别代表良性、不确定、恶性三种肺结节类型;D={(x1,y1),(x2,y2),...,(xi,yi),...,(xm,ym)},m为肺结节CT图像数据集D中的样本总数,xi为肺结节CT图像数据集D中的第i张肺结节CT图像,yi为第i张肺结节CT图像xi的类别标签,yi∈Mlevel
步骤2:基于知识蒸馏法,构建肺结节图像分类模型,所述肺结节图像分类模型包括教师模型、学生模型;所述教师模型包括L个神经网络模型和L个softmax分类器,所述学生模型包括神经网络模型、第一softmax分类器s1、第二softmax分类器s2
步骤3:在确定标签数据集上训练教师模型;
步骤3.1:获取确定标签数据集:从肺结节CT图像数据集D中提取类别标签为良性和类别标签为恶性的元素,构成确定标签数据集DC
其中,DC={(x1,y1),(x2,y2),...,(xj,yj),...,(xmC,ymC)}∈D,mC为确定标签数据集DC中的样本总数,yj为确定标签数据集DC中的肺结节CT图像xj的类别标签,yj∈MC={0,1},MC中的0、1分别代表良性、恶性两种肺结节类型;
步骤3.2:对确定标签数据集DC按照批次处理,依次将每一批次的样本集DCs输入教师模型中的每个神经网络模型,采用随机初始化来初始化网络参数,通过教师模型中的L个神经网络模型对样本集DCs进行特征提取,在教师模型中的每个神经网络模型后都通过softmax分类器对样本集DCs中的肺结节CT图像进行分类;其中,DCs∈DC,DCs中的样本个数为ms;
对于输入的肺结节CT图像xk∈DCs,经过假设函数
Figure FDA0003581738430000011
输出二维向量pk,向量pk中的每个元素代表对于给定的肺结节CT图像xk每一个肺结节类型σ∈MC的概率估计值p(yk=σ|xk),假设函数
Figure FDA0003581738430000021
Figure FDA0003581738430000022
其中,θ={θ01}为模型参数集,
Figure FDA0003581738430000023
为对概率分布进行归一化使得所有概率总和为1,
Figure FDA0003581738430000024
为模型参数集θ中第μ个元素的转置;
在确定标签数据集DC上通过损失函数JC(θ)采用小批量梯度下降法对教师模型进行训练:
Figure FDA0003581738430000025
Figure FDA0003581738430000026
Figure FDA0003581738430000027
其中,
Figure FDA0003581738430000028
logloss为类别交叉熵损失函数,logloss(p,q)=-plogq,
Figure FDA0003581738430000029
为肺结节CT图像xk经过教师模型中的神经网络模型和softmax分类器输出的类别概率向量;
Figure FDA00035817384300000210
为肺结节CT图像xk的正确类别标签即硬标签,根据步骤1中计算的类别标签来确定
Figure FDA00035817384300000211
良性为[1,0]、恶性为[0,1];R(θ)为正则化项,γ为正则化系数,γ≥0;p(yk=σ|xk;θ)为参数为θ时softmax分类器将样本xk分类为类别σ的概率,l_rt为学习率;
步骤3.3:应用训练好的教师模型到肺结节CT图像数据集D以计算软标签:去掉教师模型中每个神经网络模型后的softmax分类器,将肺结节CT图像数据集D作为教师模型中每个神经网络模型的输入,获取教师模型中每个神经网络模型的logits输出值,对教师模型中所有神经网络模型的logits输出值进行加权平均,得到肺结节CT图像xi的最终logits输出值为
Figure FDA0003581738430000031
计算得到肺结节CT图像xi的软标签为
Figure FDA0003581738430000032
其中,αr为教师模型中第r个神经网络模型的logits输出值占最终logits输出值的权重,
Figure FDA0003581738430000033
lr()为教师模型中第r个神经网络模型的logits输出值,
Figure FDA0003581738430000034
为zi中的第μ个元素;
Figure FDA0003581738430000035
为肺结节CT图像xi的软化的概率分布即软标签,
Figure FDA0003581738430000036
中的元素数值介于0-1之间,
Figure FDA0003581738430000037
为二维向量;T为温度参数,用于控制软标签概率分布的平滑程度;
步骤4:在联合硬标签和软标签的数据集上训练学生模型:
步骤4.1:对确定标签数据集DC和不确定标签数据集Dunc按照批次处理,每一批次中从确定标签数据集DC和不确定标签数据集Dunc中随机提取数据构成联合硬标签和软标签的数据集DC-unc,依次将每一批次的数据集DC-unc输入学生模型;
其中,Dunc=D-DC,数据集DC-unc中来自确定标签数据集DC和不确定标签数据集Dunc的样本比例为ε,数据集DC-unc中的样本总数为mu;
步骤4.2:采用随机初始化来初始化网络参数,通过学生模型中的神经网络模型对数据集DC-unc进行特征提取,输出数据集DC-unc中每个肺结节CT图像的logits输出值,将数据集DC-unc中每个肺结节CT图像的logits输出值输入第一softmax分类器s1,将数据集DC-unc中每个肺结节CT图像的logits输出值除以温度参数T后输入第二softmax分类器s2;将第一softmax分类器s1的输出与硬标签输入到类别交叉熵损失函数中求出硬标签交叉熵损失函数值,将第二softmax分类器s2的输出与软标签输入到类别交叉熵损失函数中求出软标签交叉熵损失函数值,将硬标签交叉熵损失函数值和软标签交叉熵损失函数值按权重加和计算最终的损失函数值为
Figure FDA0003581738430000038
其中,xt为数据集DC-unc中的第t张肺结节CT图像;1{}为指示函数,{}内为条件,若条件成立则1{}=1,若条件不成立则1{}=0;β为硬标签交熵损失函数值的权重;
Figure FDA0003581738430000039
为肺结节CT图像xt经过学生模型中的神经网络模型和第一softmax分类器s1输出的类别标签概率分布,
Figure FDA0003581738430000041
为肺结节CT图像xt经过学生模型中的神经网络模型和第二softmax分类器s2输出的类别软标签,
Figure FDA0003581738430000042
步骤4.3:在联合硬标签和软标签的数据集DC-unc上通过损失函数J(θ)采用小批量梯度下降法对学生模型进行训练,得到训练后的学生模型;除去第二softmax分类器s2,得到训练后的肺结节图像分类模型;
步骤5:采用与步骤1中相同的预处理方法对待分类肺结节CT图像进行预处理,将预处理后的待分类肺结节CT图像输入训练后的肺结节图像分类模型中,训练后的肺结节图像分类模型对待分类肺结节CT图像进行分类,根据
Figure FDA0003581738430000043
输出待分类肺结节CT图像的类别标签。
2.根据权利要求1所述的数据集中含有不确定数据时的肺结节图像分类方法,其特征在于,所述步骤1中,采用专家法对每张肺结节CT图像进行类别标注,得到第n张肺结节CT图像In的类别为en,包括:通过Γ个专家分别对每张肺结节CT图像进行类别标注,得到第η个专家对第n张肺结节CT图像In的类别标注为Eη(In);计算第n张肺结节CT图像In被标注为类别e的总数为
Figure FDA0003581738430000044
若第n张肺结节CT图像In在每个类别上获得的标注数均不相同,则计算第n张肺结节CT图像In的类别为
Figure FDA0003581738430000045
若第n张肺结节CT图像In在多个类别上获得的标注数相同,则取该多个类别的算术平均值四舍五入后的值作为第n张肺结节CT图像In的类别;其中,η∈{1,2,...,Γ};若Eη(In)=e,则S(Eη(In)=e)=1;若Eη(In)≠e,则S(Eη(In)=e)=0。
3.根据权利要求2所述的数据集中含有不确定数据时的肺结节图像分类方法,其特征在于,所述步骤1中,对转换后的图像进行尺寸调整的方法为双三次插值方法。
4.根据权利要求3所述的数据集中含有不确定数据时的肺结节图像分类方法,其特征在于,所述步骤1中,肺结节CT图像的类别标签采用one-hot编码。
CN201910489713.1A 2019-06-06 2019-06-06 一种数据集中含有不确定数据时的肺结节图像分类方法 Active CN110223281B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910489713.1A CN110223281B (zh) 2019-06-06 2019-06-06 一种数据集中含有不确定数据时的肺结节图像分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910489713.1A CN110223281B (zh) 2019-06-06 2019-06-06 一种数据集中含有不确定数据时的肺结节图像分类方法

Publications (2)

Publication Number Publication Date
CN110223281A CN110223281A (zh) 2019-09-10
CN110223281B true CN110223281B (zh) 2022-06-28

Family

ID=67819607

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910489713.1A Active CN110223281B (zh) 2019-06-06 2019-06-06 一种数据集中含有不确定数据时的肺结节图像分类方法

Country Status (1)

Country Link
CN (1) CN110223281B (zh)

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110570417B (zh) * 2019-09-12 2020-07-31 慧影医疗科技(北京)有限公司 肺结节分类装置及图像处理设备
CN110674880B (zh) * 2019-09-27 2022-11-11 北京迈格威科技有限公司 用于知识蒸馏的网络训练方法、装置、介质与电子设备
CN112884695A (zh) * 2019-11-29 2021-06-01 天津大学 一种基于深度学习模型融合架构的结核胸片机器判读方法
CN111159397B (zh) * 2019-12-04 2023-04-18 支付宝(杭州)信息技术有限公司 文本分类方法和装置、服务器
CN111259733A (zh) * 2020-01-02 2020-06-09 武汉理工大学 一种基于点云图像的船舶识别方法及装置
US11386298B2 (en) 2020-01-09 2022-07-12 International Business Machines Corporation Uncertainty guided semi-supervised neural network training for image classification
CN111507378A (zh) * 2020-03-24 2020-08-07 华为技术有限公司 训练图像处理模型的方法和装置
CN111460991A (zh) * 2020-03-31 2020-07-28 科大讯飞股份有限公司 异常检测方法、相关设备及可读存储介质
CN111369576B (zh) * 2020-05-28 2020-09-18 腾讯科技(深圳)有限公司 图像分割模型的训练方法、图像分割方法、装置及设备
CN111723812B (zh) * 2020-06-05 2023-07-07 南强智视(厦门)科技有限公司 一种基于序列知识蒸馏的实时语义分割方法
CN112070233B (zh) * 2020-08-25 2024-03-22 北京百度网讯科技有限公司 模型联合训练方法、装置、电子设备和存储介质
CN112329916A (zh) * 2020-10-27 2021-02-05 上海眼控科技股份有限公司 模型训练方法、装置、计算机设备及存储介质
CN112329885B (zh) * 2020-11-25 2021-07-09 江苏云从曦和人工智能有限公司 模型训练方法、装置以及计算机可读存储介质
CN112331313B (zh) * 2020-11-25 2022-07-01 电子科技大学 一种基于标签编码的糖网影像病变的自动分级方法
CN112545452B (zh) * 2020-12-07 2021-11-30 南京医科大学眼科医院 高度近视眼底病变图像识别装置
CN112560948B (zh) * 2020-12-15 2024-04-26 中南大学 数据偏差下的眼底图分类方法及成像方法
CN112541906B (zh) * 2020-12-17 2022-10-25 上海鹰瞳医疗科技有限公司 一种数据处理的方法及装置、电子设备、存储介质
CN112819043B (zh) * 2021-01-19 2023-10-10 东北大学 一种基于arm的深度学习轻量化肺结节分类方法
CN113158902B (zh) * 2021-04-23 2023-08-11 深圳龙岗智能视听研究院 一种基于知识蒸馏的自动化训练识别模型的方法
CN113239985B (zh) * 2021-04-25 2022-12-13 北京航空航天大学 一种面向分布式小规模医疗数据集的分类检测方法
CN113449776B (zh) * 2021-06-04 2023-07-25 中南民族大学 基于深度学习的中草药识别方法、装置及存储介质
CN113469954B (zh) * 2021-06-15 2024-04-09 北京深睿博联科技有限责任公司 一种肺结节良恶性评价方法及装置
CN113392938A (zh) * 2021-07-30 2021-09-14 广东工业大学 一种分类模型训练方法、阿尔茨海默病分类方法及装置
CN113449821B (zh) * 2021-08-31 2021-12-31 浙江宇视科技有限公司 融合语义和图像特征的智能训练方法、装置、设备及介质
CN113486185B (zh) * 2021-09-07 2021-11-23 中建电子商务有限责任公司 一种基于联合训练的知识蒸馏方法、处理器及存储介质
CN114626550A (zh) * 2022-03-18 2022-06-14 支付宝(杭州)信息技术有限公司 分布式模型协同训练方法和系统
CN114723746B (zh) * 2022-05-24 2022-09-02 神州医疗科技股份有限公司 基于知识蒸馏的病灶区域深度组学特征提取方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107316294A (zh) * 2017-06-28 2017-11-03 太原理工大学 一种基于改进的深度玻尔兹曼机肺结节特征提取和良恶性分类方法
CN108876796A (zh) * 2018-06-08 2018-11-23 长安大学 一种基于全卷积神经网络和条件随机场的道路分割系统及方法
CN108960407A (zh) * 2018-06-05 2018-12-07 出门问问信息科技有限公司 递归神经网路语言模型训练方法、装置、设备及介质
CN109614840A (zh) * 2017-11-28 2019-04-12 重庆交通大学 基于深度学习网络的早产检测方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10074038B2 (en) * 2016-11-23 2018-09-11 General Electric Company Deep learning medical systems and methods for image reconstruction and quality evaluation
US10692211B2 (en) * 2017-06-20 2020-06-23 Case Western Reserve University Intra-perinodular textural transition (IPRIS): a three dimenisonal (3D) descriptor for nodule diagnosis on lung computed tomography (CT) images
US10478134B2 (en) * 2017-09-26 2019-11-19 General Electric Company Systems and methods for improved diagnostics for nuclear medicine imaging

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107316294A (zh) * 2017-06-28 2017-11-03 太原理工大学 一种基于改进的深度玻尔兹曼机肺结节特征提取和良恶性分类方法
CN109614840A (zh) * 2017-11-28 2019-04-12 重庆交通大学 基于深度学习网络的早产检测方法
CN108960407A (zh) * 2018-06-05 2018-12-07 出门问问信息科技有限公司 递归神经网路语言模型训练方法、装置、设备及介质
CN108876796A (zh) * 2018-06-08 2018-11-23 长安大学 一种基于全卷积神经网络和条件随机场的道路分割系统及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CONDITIONAL TEACHER-STUDENT LEARNING;Zhong Meng 等;《arXiv》;20190430;第1-5 *
改进的深度信念网络肺结节良恶性分类;张婷 等;《计算机工程与设计》;20180930;第2707-2713,2729页 *

Also Published As

Publication number Publication date
CN110223281A (zh) 2019-09-10

Similar Documents

Publication Publication Date Title
CN110223281B (zh) 一种数据集中含有不确定数据时的肺结节图像分类方法
CN109493308B (zh) 基于条件多判别生成对抗网络的医疗图像合成与分类方法
Xie et al. Skin lesion segmentation using high-resolution convolutional neural network
CN110084318B (zh) 一种结合卷积神经网络和梯度提升树的图像识别方法
Li et al. Automatic cardiothoracic ratio calculation with deep learning
CN107886514A (zh) 基于深度残差网络的乳腺钼靶图像肿块语义分割方法
CN111242906B (zh) 一种支持向量数据描述的胸部影像异常检测方法
JP7294695B2 (ja) 学習済モデルによるプログラム、情報記録媒体、分類装置、ならびに、分類方法
CN112700461B (zh) 一种肺结节检测和表征类别识别的系统
CN110705565A (zh) 淋巴结肿瘤区域识别方法与装置
Shi et al. Automatic nodule segmentation method for CT images using aggregation-U-Net generative adversarial networks
CN111767952A (zh) 一种可解释的肺结节良恶性分类方法
CN110211116A (zh) 一种基于深度学习网络和浅层纹理特征融合的甲状腺超声图像结节分析方法
CN112861994A (zh) 基于Unet迁移学习的胃印戒细胞癌图像智能分类系统
CN113643297B (zh) 一种基于神经网络的计算机辅助牙龄分析方法
CN110459303B (zh) 基于深度迁移的医疗影像异常检测装置
CN112102330A (zh) 基于类别均衡小样本学习的新冠肺炎感染区域分割方法
CN114565786A (zh) 基于通道注意力机制的断层扫描图像分类装置和方法
CN114445328A (zh) 基于改进Faster R-CNN的医学影像脑肿瘤检测方法与系统
CN113870194B (zh) 深层特征和浅层lbp特征融合的乳腺肿瘤超声图像处理装置
CN115880245A (zh) 一种基于自监督的乳腺癌疾病分类方法
CN115810109A (zh) 一种舌像特征提取方法、系统和存储介质
Mannepalli et al. An Early Detection of Pneumonia in CXR Images using Deep Learning Techniques
Perveen et al. A framework for Early Detection of Acute Lymphoblastic Leukemia and its Subtypes from Peripheral Blood Smear Images Using Deep Ensemble Learning Technique
Koppisetti et al. A Study on Machine Learning Algorithms for Lung Cancer Classification and Prediction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230117

Address after: Room 430, Building F7, No. 860-2, Shangshengou Village, Dongling District, Shenyang, Liaoning Province, 110000

Patentee after: Shenyang Mingran Technology Co.,Ltd.

Address before: 110819 No. 3 lane, Heping Road, Heping District, Shenyang, Liaoning 11

Patentee before: Northeastern University