CN109191452B - 一种基于主动学习的腹腔ct图像腹膜转移自动标记方法 - Google Patents

一种基于主动学习的腹腔ct图像腹膜转移自动标记方法 Download PDF

Info

Publication number
CN109191452B
CN109191452B CN201811061701.0A CN201811061701A CN109191452B CN 109191452 B CN109191452 B CN 109191452B CN 201811061701 A CN201811061701 A CN 201811061701A CN 109191452 B CN109191452 B CN 109191452B
Authority
CN
China
Prior art keywords
image
images
unmarked
matrix
particle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811061701.0A
Other languages
English (en)
Other versions
CN109191452A (zh
Inventor
薛玉静
杜娟
刘松
顾庆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University
Nanjing Drum Tower Hospital
Original Assignee
Nanjing University
Nanjing Drum Tower Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University, Nanjing Drum Tower Hospital filed Critical Nanjing University
Priority to CN201811061701.0A priority Critical patent/CN109191452B/zh
Publication of CN109191452A publication Critical patent/CN109191452A/zh
Application granted granted Critical
Publication of CN109191452B publication Critical patent/CN109191452B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10072Tomographic images
    • G06T2207/10081Computed x-ray tomography [CT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30096Tumor; Lesion

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)
  • Apparatus For Radiation Diagnosis (AREA)

Abstract

本发明公开了一种基于主动学习的腹腔CT图像腹膜转移自动标记方法,其步骤是:1)CT图像预处理,采用阈值法完成图像分割;2)提取图像特征,基于图像分割结果,选择图像颗粒提取灰度和纹理特征;3)采用随机游走分类法计算图像标记不确定性;4)基于标记不确定性和多样性选择CT图像供专家标记;返回步骤3)直至所有CT图像的标记已确定;5)输出确定标记的所有CT图像,其中阴性标记表示未发生腹膜转移,阳性标记表示发生了腹膜转移。本发明方法充分利用CT图像特点和肿瘤腹膜转移特征,应用主动学习思想,在少量专家标记的基础上,能够完成大量腹腔CT图像腹膜转移的自动标记,为恶性肿瘤诊疗提供依据。

Description

一种基于主动学习的腹腔CT图像腹膜转移自动标记方法
技术领域
本发明属于医学图像处理技术领域,涉及一种基于主动学习的腹腔CT图像腹膜转移自动标记方法,特别针对已标记CT图像数量少的问题,运用图像处理技术和机器学习方法,实现大量腹腔CT图像的自动标记。
背景技术
腹膜是腹腔内多种恶性肿瘤常见的转移部位,标记腹膜转移是评价恶性肿瘤治愈效果的重要依据。存在腹膜转移的肿瘤患者病情发展快、预后差,临床治疗难度大,需要尽早诊断、及时治疗。标记腹膜转移可通过结节检测来完成,腹腔CT图像是检测小结节的重要诊断依据。但CT会产生大量的图像,其中包含淋巴、血管等类似于结节的图像颗粒,通过结节检测腹腔转移需要经验丰富的医师来完成,现有的人工阅片方式会消耗大量人力和时间资源,而且受主观因素影响,检测精度低且难以重复。通过人工智能技术处理腹腔CT图像,自动标记腹膜转移以进行恶性肿瘤诊断是计算机辅助医疗的新趋势之一,能够在减少医师工作量的同时提高诊断准确性。
本发明应用主动学习技术完成腹腔CT图像腹膜转移自动标记,若给定CT图像包含腹膜转移,则标记为阳性,否则标记为阴性。通过筛选最有价值的样本进行专家标记来解决标记样本数量少、标记成本高的问题。主动学习的关键在于判断一个未标记样本是否为“有用的”或者“含有信息”的,其中基于分类器的不确定性采样是一种广泛使用的方法。该方法基于现有已标记样本训练分类器,预测未标记样本属于为各类别的概率以衡量未标记样本的不确定性。由于已标记样本的数据分布代表性差以及已标记样本数量少等问题直接影响分类器的预测性能,基于分类器的方法会产生较大的样本标记误差。随机游走分类是一种基于随机游走模型的分类技术,它通过利用整体样本集的信息缓解已标记样本数量少的问题,可有效衡量未标记样本的标记不确定性。
发明内容
针对于上述现有技术的不足,本发明的目的在于提供一种基于主动学习的腹腔CT图像腹膜转移自动标记方法,本发明方法易于理解、计算开销小、算法迭代速度快,能够在少量专家标记的基础上,完成大量腹腔CT图像的腹膜转移自动标记,为恶性肿瘤诊疗提供依据,具有良好的实用性、扩展性和鲁棒性。
为达到上述目的,本发明采用的技术方案如下:
本发明的一种基于主动学习的腹腔CT图像腹膜转移自动标记方法,包括步骤如下:
1)读取腹腔CT图像,对其进行截取、滤波、去噪、平滑、增强的预处理工作;采用阈值分割技术对腹腔CT图像进行区域分割,获取颗粒图像;
2)基于分割后的CT图像,选取颗粒图像,分别提取灰度和纹理特征,构建CT图像的特征向量;
3)基于随机游走分类算法计算未标记CT图像的标记不确定性;
4)基于标记不确定性初次筛选未标记CT图像,采用聚类技术计算图像多样性再次筛选CT图像,提醒专家标记筛选出的CT图像;返回步骤3),直至不存在标记不确定的CT图像;
5)完成所有腹腔CT图像的腹膜转移标记,并输出已标记的腹腔CT图像。
优选地,所述步骤2)中基于每张分割后的CT图像选取颗粒图像的处理过程基于以下三个特征:
21)像素个数:颗粒图像中包含的像素个数;
22)最大灰度值:颗粒图像所有像素中的最大灰度值;
23)最小灰度值:颗粒图像所有像素中的最小灰度值;
分别设置最佳值b1=20,b2=60,b3=20,获取每个颗粒图像的上述三个特征值d1,d2,d3,按以下公式计算颗粒图像的分数Score:
Figure GDA0003103837850000021
将颗粒图像按Score从小到大排序,选择前s个颗粒图像进行后续处理,s=10。
优选地,所述步骤2)中针对筛选出的颗粒图像提取灰度特征的处理过程是:将图像灰度级分为q个区间,q=15,统计灰度直方图h(),按以下公式表示:
h(ri)=ai (2)
其中ri为第i个灰度级区间,1<=i<=q,ai为颗粒图像中灰度值属于区间ri的像素个数;对该直方图进行归一化,公式如下:
Figure GDA0003103837850000022
每个颗粒图像获取q维的灰度特征。
优选地,所述步骤2)中针对筛选出的颗粒图像提取纹理特征的处理过程是:首先对每个颗粒图像,找到能包含颗粒图像且面积最小的矩形,按灰度值0填充颗粒图像外围直至该矩形大小;然后基于矩形图像,使用Log-Gabor函数对矩形图像进行频域滤波,公式如下:
Figure GDA0003103837850000023
其中r为像素的径向坐标,其最小值为0,最大值为矩形高度的1/2,θ为像素的角度坐标,其最小值为0,最大值为2π,exp()为e指数函数,σr为基于径向坐标r计算的标准差,σθ为基于角度坐标θ计算的标准差,f0为滤波器的中心频率,θ0为滤波器方向;每个矩形图像使用1个f0(0.1)和4个不同的θ0(0,π/4,π/2,3π/4)的4种组合,获取4个频域滤波后图像;随后将滤波后图像按行和列平均划分为3×3个子块,求每个子块的灰度平均值,将结果按行拼接为9维向量;分别按4张滤波后图像计算,拼接所得向量;最后进行归一化处理,保证向量中的值累加等于1,得到颗粒图像的纹理特征。
优选地,所述步骤2)中构建CT图像特征向量的过程是:针对CT图像分割后筛选出的s(s=10)个颗粒图像,分别计算每个颗粒图像的灰度特征和纹理特征,拼接两个特征得到颗粒图像的特征向量,然后拼接s个颗粒图像的特征向量,得到CT图像的特征向量。
优选地,所述步骤3)中计算未标记腹腔CT图像标记不确定性的处理过程是:令已有nl张专家已标记CT图像,nu张未标记CT图像,共有n=nl+nu张CT图像,xi∈[0,1]d代表第i张CT图像的特征向量,d为向量维数;首先采用距离衡量CT图像间的相似性,给定CT图像xi,xj,其距离dist(xi,xj)计算公式如下:
Figure GDA0003103837850000031
其中T为向量的转置,M为半正定对称矩阵,M=AT×A,其中正交矩阵A使用随机梯度下降法通过求解目标函数获得,公式如下:
Figure GDA0003103837850000032
其中,Ωi为与已标记CT图像xi属于相同类别的已标记CT图像下标集合,1≤i≤nl,j为集合Ωi中元素,l为下标,1≤l≤nl,nl为已标记的CT图像数量,exp()为e指数函数;
然后基于距离指标将CT图像映射为n×n权重矩阵W∈Rn×n,n为CT图像总数,其第i行第j列元素wij基于CT图像xi和CT图像xj间的距离计算,公式如下:
wij=exp(-dist2(xi,xj))=exp(-(xi-xj)TM(xi-xj)) (7)
再定义n×n对角矩阵D∈Rn×n,其中对角线元素的计算公式如下:
Figure GDA0003103837850000033
除对角线元素外,矩阵D中其他元素为0;基于对角矩阵D和权重矩阵W计算标准化权重矩阵Q∈Rn×n,公式如下:
Q=D-1W (9)
矩阵Q被分解为四个子块,公式如下:
Figure GDA0003103837850000041
其中Qll(nl×nl矩阵)代表已标记图像间的标准化权重,Qlu(nl×nu矩阵)代表未标记图像和已标记图像间的标准化权重,Quu(nu×nu矩阵)代表未标记图像间的标准化权重,T代表矩阵转置,nl和nu分别代表已标记和未标记的CT图像数量;
接下来将已标记CT图像的状态设置为吸收态,未标记CT图像的状态设置为非吸收态,计算带吸收态的马尔科夫转移矩阵G,公式如下:
Figure GDA0003103837850000042
其中Ill(nl×nl)为单位矩阵,即对角线元素全部为1的对角矩阵,0lu(nl×nu)为零矩阵;令集合L包含所有已标记CT图像,集合U包含所有未标记CT图像;基于转移矩阵G计算未标记CT图像被已标记CT图像吸收的稳态概率矩阵P(L|U),公式如下:
Figure GDA0003103837850000043
其中Iuu(nu×nu)为单位矩阵;定义Y=[y1,y2,...ynl]T为已标记CT图像的类标向量,如果CT图像xi∈L,L为已标记CT图像集合,标记为阳性,则yi=1,否则yi=0;令标记为阳性的CT图像集为L+,计算集合U中未标记CT图像被阳性标记吸收的概率向量P(L+|U),公式如下:
Figure GDA0003103837850000044
最后定义概率向量F=[f1,f2,...fnu]T=P(L+|U),其中fi代表未标记CT图像xi属于阳性标记的概率;基于概率向量F,基于熵值法计算未标记CT图像xi的标记不确定性H(xi),公式如下:
H(xi)=-filogfi-(1-fi)log(1-fi) (14)。
优选地,所述步骤4)中基于标记不确定性初次筛选CT图像的处理过程是:首先设定阈值TH,TH=0.151,当未标记图像x的标记不确定性H(x)小于TH时,则认为此图像的标记已确定,不再需要专家标记;挑选标记不确定性大于TH的所有未标记CT图像构成候选集C,若集合C为空集,则执行步骤5)。
优选地,所述步骤4)中计算图像多样性以再次筛选CT图像的处理过程是:首先选择聚类中心个数k,1≤k≤min(|C|,10);若候选图像数量|C|≤10,则全部候选图像提交专家标记;
然后在候选集C中随机选择k张CT图像作为聚簇中心,按公式(5)计算集合C中其他非中心CT图像分别到k个聚簇中心的距离;将非中心图像分配到最近的中心所在聚簇;划分好k个聚簇后,重新选择每个聚簇的中心图像,为到达聚簇中所有其它图像的距离之和最小的CT图像;基于更新的k个中心图像,重新按最短距离划分聚簇;重复上述过程,直至k个聚簇的中心图像不再改变;
在得到k个图像聚簇和对应的中心图像后,计算k个聚簇的误差平方和SSE(k),公式如下:
Figure GDA0003103837850000051
其中Clusteri为第i个聚簇,ci为该聚簇的中心图像,dist()为按公式(5)计算的距离;
继续选择下一个k,重复上述步骤计算SSE(k),得到对应的折线图,k为x轴,SSE为y轴,寻找其中的拐点,如果折线图存在拐点(k’,SSEk’),则选择与此拐点对应的k’张中心图像去标记;如果折线图不存在拐点,当折线图最大值和最小值之差不超过平均值的20%时,按k=5选择5张中心图像去标记,否则当折线图最大值和最小值之差超过平均值的20%时,按k=10选择10张中心图像去标记。
优选地,所述步骤5)中完成所有腹腔CT图像的腹膜转移标记的处理过程是:当不存在不确定标记的CT图像时,对于每个未标记CT图像xi,基于上述步骤3)计算的概率向量F=[f1,f2,...fnu]T=P(L+|U),其中L+为标记阳性的CT图像集合,U为未标记CT图像集合,若fi大于0.5,则标记该CT图像为阳性;否则标记该CT图像为阴性。
本发明的有益效果:
本发明方法充分利用腹腔CT图像特点和肿瘤腹膜转移特征,应用主动学习思想,采用随机游走和马尔科夫链技术,基于完整的CT图像集评估未标记CT图像的标记不确定性,使用聚类技术筛选未标记CT图像供专家标记;在少量专家标记的基础上,能够有效完成大量腹腔CT图像的腹膜转移自动标记;本发明方法易于理解,计算开销小,算法迭代速度快,适用于大量CT图像的自动标记,具有良好的实用性、扩展性和鲁棒性。
附图说明
图1为本发明方法的总体框架图。
图2a为原始腹腔CT图像的示意图。
图2b为经过预处理并完成阈值分割后的CT图像的示意图。
图3为计算未标记CT图像的标记不确定性的处理流程图。
图4为采用聚类技术筛选未标记CT图像的处理流程图。
具体实施方式
为了便于本领域技术人员的理解,下面结合实施例与附图对本发明作进一步的说明,实施方式提及的内容并非对本发明的限定。
参照图1所示,本发明方法的输入是腹腔CT图像集和少量专家标注的CT图像,输出是确定腹膜转移标记的所有CT图像,如果CT图像包含腹膜转移,则标记为阳性,否则标记为阴性。
具体包括步骤如下:
1)读取腹腔CT图像,对其进行截取、滤波、去噪、平滑、增强等预处理;采用阈值分割技术对腹腔CT图像进行区域分割,获取颗粒图像;
2)基于分割后的CT图像,选取颗粒图像,分别提取灰度和纹理特征,构建CT图像的特征向量;
3)基于随机游走分类算法计算未标记CT图像的标记不确定性;
4)基于标记不确定性初次筛选未标记CT图像,采用聚类技术计算图像多样性再次筛选CT图像,提醒专家标记筛选出的CT图像;返回步骤3),直至不存在标记不确定的CT图像;
5)完成所有腹腔CT图像的腹膜转移标记,并输出已标记的腹腔CT图像。
参照图2a、图2b所示,步骤2)中选取颗粒图像的过程是:基于以下三个特征:
(1)像素个数:颗粒图像中包含的像素个数;
(2)最大灰度值:颗粒图像所有像素中的最大灰度值;
(3)最小灰度值:颗粒图像所有像素中的最小灰度值;
分别设置最佳值b1=20,b2=60,b3=20,获取每个颗粒图像的上述三个特征值d1,d2,d3,按以下公式计算颗粒图像的分数Score:
Figure GDA0003103837850000061
将颗粒图像按Score从小到大排序,选择前s个颗粒图像进行后续处理,s=10。
所述步骤2)中针对筛选出的颗粒图像提取灰度特征的处理过程是:将图像灰度级分为q个区间,q=15,统计灰度直方图h(),按以下公式表示:
h(ri)=ai (2)
其中ri为第i个灰度级区间,1<=i<=q,ai为颗粒图像中灰度值属于区间ri的像素个数;对该直方图进行归一化,公式如下:
Figure GDA0003103837850000062
每个颗粒图像获取q维的灰度特征。
所述步骤2)中针对筛选出的颗粒图像提取纹理特征的处理过程是:首先对每个颗粒图像,找到能包含颗粒图像且面积最小的矩形,按灰度值0填充颗粒图像外围直至该矩形大小;然后基于矩形图像,使用Log-Gabor函数对矩形图像进行频域滤波,公式如下:
Figure GDA0003103837850000071
其中r为像素的径向坐标,其最小值为0,最大值为矩形高度的1/2,θ为像素的角度坐标,其最小值为0,最大值为2π,exp()为e指数函数,σr为基于径向坐标r计算的标准差,σθ为基于角度坐标θ计算的标准差,f0为滤波器的中心频率,θ0为滤波器方向;每个矩形图像使用1个f0(0.1)和4个不同的θ0(0,π/4,π/2,3π/4)的4种组合,获取4个频域滤波后图像;随后将滤波后图像按行和列平均划分为3×3个子块,求每个子块的灰度平均值,将结果按行拼接为9维向量;分别按4张滤波后图像计算,拼接所得向量;最后进行归一化处理,保证向量中的值累加等于1,得到颗粒图像的纹理特征。
所述步骤2)中构建CT图像特征向量的过程是:针对CT图像分割后筛选出的s个颗粒图像,分别计算每个颗粒图像的灰度特征和纹理特征,拼接两个特征得到颗粒图像的特征向量,然后拼接s个颗粒图像的特征向量,得到CT图像的特征向量。
参照图3所示,所述步骤3)中计算未标记腹腔CT图像标记不确定性的处理过程是:令已有nl张专家已标记CT图像,nu张未标记CT图像,共有n=nl+nu张CT图像,xi∈[0,1]d代表第i张CT图像的特征向量,d为向量维数;首先采用距离衡量CT图像间的相似性,给定CT图像xi,xj,其距离dist(xi,xj)计算公式如下:
Figure GDA0003103837850000072
其中,T为向量的转置,M为半正定对称矩阵,M=AT×A,其中正交矩阵A使用随机梯度下降法通过求解目标函数获得,公式如下:
Figure GDA0003103837850000073
其中,Ωi为与已标记CT图像xi属于相同类别的已标记CT图像下标集合,1≤i≤nl,j为集合Ωi中元素,l为下标,1≤l≤nl,nl为已标记的CT图像数量,exp()为e指数函数;
然后基于距离指标将CT图像映射为n×n权重矩阵W∈Rn×n,n为CT图像总数,其第i行第j列元素wij基于CT图像xi和CT图像xj间的距离计算,公式如下:
wij=exp(-dist2(xi,xj))=exp(-(xi-xj)TM(xi-xj)) (7)
再定义n×n对角矩阵D∈Rn×n,其中对角线元素的计算公式如下:
Figure GDA0003103837850000074
除对角线元素外,矩阵D中其他元素为0;基于对角矩阵D和权重矩阵W计算标准化权重矩阵Q∈Rn×n,公式如下:
Q=D-1W (9)
矩阵Q被分解为四个子块,公式如下:
Figure GDA0003103837850000081
其中Qll(nl×nl矩阵)代表已标记图像间的标准化权重,Qlu(nl×nu矩阵)代表未标记图像和已标记图像间的标准化权重,Quu(nu×nu矩阵)代表未标记图像间的标准化权重,T代表矩阵转置,nl和nu分别代表已标记和未标记的CT图像数量;
接下来将已标记CT图像的状态设置为吸收态,未标记CT图像的状态设置为非吸收态,计算带吸收态的马尔科夫转移矩阵G,公式如下:
Figure GDA0003103837850000082
其中Ill(nl×nl)为单位矩阵,即对角线元素全部为1的对角矩阵,0lu(nl×nu)为零矩阵;令集合L包含所有已标记CT图像,集合U包含所有未标记CT图像;基于转移矩阵G计算未标记CT图像被已标记CT图像吸收的稳态概率矩阵P(L|U),公式如下:
Figure GDA0003103837850000083
其中Iuu(nu×nu)为单位矩阵;定义Y=[y1,y2,...ynl]T为已标记CT图像的类标向量,如果CT图像xi∈L,L为已标记CT图像集合,标记为阳性,则yi=1,否则yi=0;令标记为阳性的CT图像集为L+,计算集合U中未标记CT图像被阳性标记吸收的概率向量P(L+|U),公式如下:
Figure GDA0003103837850000084
最后定义概率向量F=[f1,f2,...fnu]T=P(L+|U),其中fi代表未标记CT图像xi属于阳性标记的概率;基于概率向量F,基于熵值法计算未标记CT图像xi的标记不确定性H(xi),公式如下:
H(xi)=-filogfi-(1-fi)log(1-fi) (14)。
参照图4所示,步骤4)中基于标记不确定性初次筛选CT图像的处理过程是:首先设定阈值TH(TH=0.151),当未标记图像x的标记不确定性H(x)小于TH时,则认为此图像的标记已确定,不再需要专家标记;挑选标记不确定性大于TH的所有未标记CT图像构成候选集C,如果集合C为空集,则执行步骤5)。
所述步骤4)中计算图像多样性以再次筛选CT图像的处理过程是:首先选择聚类中心个数k,1≤k≤min(|C|,10);若候选图像数量|C|≤10,则全部候选图像提交专家标记;
然后在候选集C中随机选择k张CT图像作为聚簇中心,按公式(5)计算集合C中其他非中心CT图像分别到k个聚簇中心的距离;将非中心图像分配到最近的中心所在聚簇;划分好k个聚簇后,重新选择每个聚簇的中心图像,为到达聚簇中所有其它图像的距离之和最小的CT图像;基于更新的k个中心图像,重新按最短距离划分聚簇;重复上述过程,直至k个聚簇的中心图像不再改变;
在得到k个图像聚簇和对应的中心图像后,计算k个聚簇的误差平方和SSE(k),公式如下:
Figure GDA0003103837850000091
其中Clusteri为第i个聚簇,ci为该聚簇的中心图像,dist()为按公式(5)计算的距离;
继续选择下一个k,重复上述步骤计算SSE(k),得到对应的折线图,k为x轴,SSE为y轴,寻找其中的拐点,如果折线图存在拐点(k’,SSEk’),则选择与此拐点对应的k’张中心图像去标记;如果折线图不存在拐点,当折线图最大值和最小值之差不超过平均值的20%时,按k=5选择5张中心图像去标记,否则当折线图最大值和最小值之差超过平均值的20%时,按k=10选择10张中心图像去标记。
所述步骤5)中完成所有腹腔CT图像的腹膜转移标记的处理过程是:当不存在不确定标记的CT图像时,对于每个未标记CT图像xi,基于上述步骤3)计算的概率向量F=[f1,f2,...fnu]T=P(L+|U),其中L+为标记阳性的CT图像集合,U为未标记CT图像集合,若fi大于0.5,则标记该CT图像为阳性;否则标记该CT图像为阴性。
本发明具体应用途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进,这些改进也应视为本发明的保护范围。

Claims (8)

1.一种基于主动学习的腹腔CT图像腹膜转移自动标记方法,其特征在于,包括步骤如下:
1)读取腹腔CT图像,对其进行截取、滤波、去噪、平滑、增强的预处理工作;采用阈值分割技术对腹腔CT图像进行区域分割,获取颗粒图像;
2)基于分割后的CT图像,选取颗粒图像,分别提取灰度和纹理特征,构建CT图像的特征向量;
3)基于随机游走分类算法计算未标记CT图像的标记不确定性;
4)基于标记不确定性初次筛选未标记CT图像,采用聚类技术计算图像多样性再次筛选CT图像,提醒 专家标记筛选出的CT图像;返回步骤3),直至不存在标记不确定的CT图像;
5)完成所有腹腔CT图像的腹膜转移标记,并输出已标记的腹腔CT图像;
所述步骤3)中计算未标记腹腔CT图像标记不确定性的处理过程是:令已有nl张专家已标记CT图像,nu张未标记CT图像,共有n=nl+nu张CT图像,xi∈[0,1]d代表第i张CT图像的特征向量,d为向量维数;首先采用距离衡量CT图像间的相似性,给定CT图像xi,xj,其距离dist(xi,xj)计算公式如下:
Figure FDA0003103837840000011
其中,T为向量的转置,M为半正定对称矩阵,M=AT×A,其中正交矩阵A使用随机梯度下降法通过求解目标函数获得,公式如下:
Figure FDA0003103837840000012
其中,Ωi为与已标记CT图像xi属于相同类别的已标记CT图像下标集合,1≤i≤nl,j为集合Ωi中元素,l为下标,1≤l≤nl,nl为已标记的CT图像数量,exp()为e指数函数;
然后基于距离指标将CT图像映射为n×n权重矩阵W∈Rn×n,n为CT图像总数,其第i行第j列元素wij基于CT图像xi和CT图像xj间的距离计算,公式如下:
wij=exp(-dist2(xi,xj))=exp(-(xi-xj)TM(xi-xj)) (7)
再定义n×n对角矩阵D∈Rn×n,其中对角线元素的计算公式如下:
Figure FDA0003103837840000013
除对角线元素外,矩阵D中其他元素为0;基于对角矩阵D和权重矩阵W计算标准化权重矩阵Q∈Rn×n,公式如下:
Q=D-1W (9)
矩阵Q被分解为四个子块,公式如下:
Figure FDA0003103837840000021
其中Qll为 nl×nl矩阵, 代表已标记图像间的标准化权重,Qlu为 nl×nu矩阵, 代表未标记图像和已标记图像间的标准化权重,Quu为 nu×nu矩阵, 代表未标记图像间的标准化权重,T代表矩阵转置,nl和nu分别代表已标记和未标记的CT图像数量;
接下来将已标记CT图像的状态设置为吸收态,未标记CT图像的状态设置为非吸收态,计算带吸收态的马尔科夫转移矩阵G,公式如下:
Figure FDA0003103837840000022
其中Ill(nl×nl)为单位矩阵,即对角线元素全部为1的对角矩阵,0lu(nl×nu)为零矩阵;令集合L包含所有已标记CT图像,集合U包含所有未标记CT图像;基于转移矩阵G计算未标记CT图像被已标记CT图像吸收的稳态概率矩阵P(L|U),公式如下:
Figure FDA0003103837840000023
其中Iuu(nu×nu)为单位矩阵;定义Y=[y1,y2,...ynl]T为已标记CT图像的类标向量,如果CT图像xi∈L,L为已标记CT图像集合,标记为阳性,则yi=1,否则yi=0;令标记为阳性的CT图像集为L+,计算集合U中未标记CT图像被阳性标记吸收的概率向量P(L+|U),公式如下:
Figure FDA0003103837840000024
最后定义概率向量F=[f1,f2,...fnu]T=P(L+|U),其中fi代表未标记CT图像xi属于阳性标记的概率;基于概率向量F,基于熵值法计算未标记CT图像xi的标记不确定性H(xi),公式如下:
H(xi)=-filogfi-(1-fi)log(1-fi) (14)。
2.根据权利要求1所述的基于主动学习的腹腔CT图像腹膜转移自动标记方法,其特征在于,所述步骤2)中基于每张分割后的CT图像选取颗粒图像的处理过程基于以下三个特征:
21)像素个数:颗粒图像中包含的像素个数;
22)最大灰度值:颗粒图像所有像素中的最大灰度值;
23)最小灰度值:颗粒图像所有像素中的最小灰度值;
分别设置最佳值b1=20,b2=60,b3=20,获取每个颗粒图像的上述三个特征值d1,d2,d3,按以下公式计算颗粒图像的分数Score:
Figure FDA0003103837840000031
将颗粒图像按Score从小到大排序,选择前s个颗粒图像进行后续处理,s=10。
3.根据权利要求1所述的基于主动学习的腹腔CT图像腹膜转移自动标记方法,其特征在于,所述步骤2)中针对筛选出的颗粒图像提取灰度特征的处理过程是:将图像灰度级分为q个区间,q=15,统计灰度直方图h(),按以下公式表示:
h(ri)=ai (2)
其中ri为第i个灰度级区间,1<=i<=q,ai为颗粒图像中灰度值属于区间ri的像素个数;对该直方图进行归一化,公式如下:
Figure FDA0003103837840000032
每个颗粒图像获取q维的灰度特征。
4.根据权利要求1所述的基于主动学习的腹腔CT图像腹膜转移自动标记方法,其特征在于,所述步骤2)中针对筛选出的颗粒图像提取纹理特征的处理过程是:首先对每个颗粒图像,找到能包含颗粒图像且面积最小的矩形,按灰度值0填充颗粒图像外围直至该矩形大小;然后基于矩形图像,使用Log-Gabor函数对矩形图像进行频域滤波,公式如下:
Figure FDA0003103837840000033
其中r为像素的径向坐标,其最小值为0,最大值为矩形高度的1/2,θ为像素的角度坐标,其最小值为0,最大值为2π,exp()为e指数函数,σr为基于径向坐标r计算的标准差,σθ为基于角度坐标θ计算的标准差,f0为滤波器的中心频率,θ0为滤波器方向;每个矩形图像使用1个f0(0.1)和4个不同的θ0(0,π/4,π/2,3π/4)的4种组合,获取4个频域滤波后图像;随后将滤波后图像按行和列平均划分为3×3个子块,求每个子块的灰度平均值,将结果按行拼接为9维向量;分别按4张滤波后图像计算,拼接所得向量;最后进行归一化处理,保证向量中的值累加等于1,得到颗粒图像的纹理特征。
5.根据权利要求1所述的基于主动学习的腹腔CT图像腹膜转移自动标记方法,其特征在于,所述步骤2)中构建CT图像特征向量的过程是:针对CT图像分割后筛选出的s个颗粒图像,s=10,分别计算每个颗粒图像的灰度特征和纹理特征,拼接两个特征得到颗粒图像的特征向量,然后拼接s个颗粒图像的特征向量,得到CT图像的特征向量。
6.根据权利要求1所述的基于主动学习的腹腔CT图像腹膜转移自动标记方法,其特征在于,所述步骤4)中基于标记不确定性初次筛选CT图像的处理过程是:首先设定阈值TH,TH=0.151,当未标记图像x的标记不确定性H(x)小于TH时,则认为此图像的标记已确定,不再需要专家标记;挑选标记不确定性大于TH的所有未标记CT图像构成候选集C,若集合C为空集,则执行步骤5)。
7.根据权利要求1所述的基于主动学习的腹腔CT图像腹膜转移自动标记方法,其特征在于,所述步骤4)中计算图像多样性以再次筛选CT图像的处理过程是:首先选择聚类中心个数k,1≤k≤min(|C|,10);若候选图像数量|C|≤10,则全部候选图像提交专家标记;
然后在候选集C中随机选择k张CT图像作为聚簇中心,按公式(5)计算集合C中其他非中心CT图像分别到k个聚簇中心的距离;将非中心图像分配到最近的中心所在聚簇;划分好k个聚簇后,重新选择每个聚簇的中心图像,为到达聚簇中所有其它图像的距离之和最小的CT图像;基于更新的k个中心图像,重新按最短距离划分聚簇;重复上述过程,直至k个聚簇的中心图像不再改变;
在得到k个图像聚簇和对应的中心图像后,计算k个聚簇的误差平方和SSE(k),公式如下:
Figure FDA0003103837840000041
其中Clusteri为第i个聚簇,ci为该聚簇的中心图像,dist()为按公式(5)计算的距离;
继续选择下一个k,重复上述步骤计算SSE(k),得到对应的折线图,k为x轴,SSE为y轴,寻找其中的拐点,如果折线图存在拐点(k’,SSEk’),则选择与此拐点对应的k’张中心图像去标记;如果折线图不存在拐点,当折线图最大值和最小值之差不超过平均值的20%时,按k=5选择5张中心图像去标记,否则当折线图最大值和最小值之差超过平均值的20%时,按k=10选择10张中心图像去标记。
8.根据权利要求1所述的基于主动学习的腹腔CT图像腹膜转移自动标记方法,其特征在于,所述步骤5)中完成所有腹腔CT图像的腹膜转移标记的处理过程是:当不存在不确定标记的CT图像时,对于每个未标记CT图像xi,基于上述步骤3)计算的概率向量F=[f1,f2,...fnu]T=P(L+|U),其中L+为标记阳性的CT图像集合,U为未标记CT图像集合,若fi大于0.5,则标记该CT图像为阳性;否则标记该CT图像为阴性。
CN201811061701.0A 2018-09-12 2018-09-12 一种基于主动学习的腹腔ct图像腹膜转移自动标记方法 Active CN109191452B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811061701.0A CN109191452B (zh) 2018-09-12 2018-09-12 一种基于主动学习的腹腔ct图像腹膜转移自动标记方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811061701.0A CN109191452B (zh) 2018-09-12 2018-09-12 一种基于主动学习的腹腔ct图像腹膜转移自动标记方法

Publications (2)

Publication Number Publication Date
CN109191452A CN109191452A (zh) 2019-01-11
CN109191452B true CN109191452B (zh) 2021-10-08

Family

ID=64910235

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811061701.0A Active CN109191452B (zh) 2018-09-12 2018-09-12 一种基于主动学习的腹腔ct图像腹膜转移自动标记方法

Country Status (1)

Country Link
CN (1) CN109191452B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110415253A (zh) * 2019-05-06 2019-11-05 南京大学 一种基于深度神经网络的点交互式医学图像分割方法
CN116994085A (zh) * 2023-06-27 2023-11-03 中电金信软件有限公司 图像样本筛选方法、模型训练方法、装置和计算机设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104933709A (zh) * 2015-06-04 2015-09-23 西安理工大学 基于先验信息的随机游走ct肺组织图像自动分割方法
CN105701832A (zh) * 2016-01-19 2016-06-22 苏州大学 三维图割算法结合随机游走算法的pet‐ct肺肿瘤分割方法
CN105957066A (zh) * 2016-04-22 2016-09-21 北京理工大学 基于自动上下文模型的ct图像肝脏分割方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104933709A (zh) * 2015-06-04 2015-09-23 西安理工大学 基于先验信息的随机游走ct肺组织图像自动分割方法
CN105701832A (zh) * 2016-01-19 2016-06-22 苏州大学 三维图割算法结合随机游走算法的pet‐ct肺肿瘤分割方法
CN105957066A (zh) * 2016-04-22 2016-09-21 北京理工大学 基于自动上下文模型的ct图像肝脏分割方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"An Automatic Random Walk Based Method for 3D Segmentation of The Heart In Cardiac Computed Tomography Images";Vy Bui等;《2018 IEEE 15th International Symposium on Biomedical Imaging》;20180407;第1352-1355页 *

Also Published As

Publication number Publication date
CN109191452A (zh) 2019-01-11

Similar Documents

Publication Publication Date Title
Nir et al. Automatic grading of prostate cancer in digitized histopathology images: Learning from multiple experts
Man et al. Classification of breast cancer histopathological images using discriminative patches screened by generative adversarial networks
Zhang et al. High-throughput histopathological image analysis via robust cell segmentation and hashing
Saeedi et al. Automatic identification of human blastocyst components via texture
Chang et al. Invariant delineation of nuclear architecture in glioblastoma multiforme for clinical and molecular association
Mi et al. Deep learning-based multi-class classification of breast digital pathology images
Ertosun et al. Automated grading of gliomas using deep learning in digital pathology images: a modular approach with ensemble of convolutional neural networks
Al-Dulaimi et al. Benchmarking HEp-2 specimen cells classification using linear discriminant analysis on higher order spectra features of cell shape
CN108648182B (zh) 一种基于分子亚型的乳腺癌核磁共振图像肿瘤区域分割方法
CN103745227A (zh) 一种基于多维信息的肺结节良恶性鉴别方法
Xu et al. Using transfer learning on whole slide images to predict tumor mutational burden in bladder cancer patients
Archana et al. A novel deep learning-based brain tumor detection using the Bagging ensemble with K-nearest neighbor
CN101609485B (zh) 基于迁移核匹配追踪的医学影像诊断系统及诊断方法
CN111340770B (zh) 结合全局加权lbp和纹理分析的癌症预后模型构建方法
CN102945553B (zh) 基于自动差分聚类算法的遥感图像分割方法
Iannello et al. Mitotic cells recognition in HEp-2 images
CN101551855A (zh) 自适应核匹配追踪辅助诊断系统及其辅助诊断方法
CN101551854B (zh) 不平衡医学影像处理系统及其处理方法
Kurmi et al. Content-based image retrieval algorithm for nuclei segmentation in histopathology images: CBIR algorithm for histopathology image segmentation
Wang et al. Feature-based analysis of cell nuclei structure for classification of histopathological images
Chen et al. Segmentation of overlapping cervical cells with mask region convolutional neural network
CN104217213A (zh) 一种基于对称性理论的医学图像多阶段分类方法
Qi et al. Hep-2 cell classification: The role of gaussian scale space theory as a pre-processing approach
CN109191452B (zh) 一种基于主动学习的腹腔ct图像腹膜转移自动标记方法
Di Cataldo et al. ANAlyte: A modular image analysis tool for ANA testing with indirect immunofluorescence

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant