基于谱聚类与K-means结合的乳腺病变区域的识别方法与
装置
技术领域
本申请涉及计算机技术领域,特别是涉及一种基于谱聚类与K-means结合的乳腺病变区域的识别方法与装置。
背景技术
乳腺癌是一种常见的恶性肿瘤,早期诊断和治疗是降低乳腺癌死亡率的关键。肿块和钙化点簇是乳腺癌最常见的影像学征象,因此肿块和钙化点的自动检测也成为计算机辅助诊断系统的两个主要方面。其中肿块由于其边缘模糊,形状各异,与周围组织对比度较低等因素,一直都是计算机辅助检测的一个难点。尤其对于致密型乳腺,由于乳腺内腺体数量多、脂肪组织少,自然对比度差,所以X线片显示乳腺全视野内均为密实团片状高密度影,皮下脂肪层较薄,腺体层与皮下脂肪层分界清晰,当其内出现肿块时,容易被致密的腺体组织所掩盖,难以显示其边界,所以很容易导致漏诊。
但现有技术对乳腺肿块分割时只能针对肿块形状比较规则、边缘比较明确的图像,而对隐匿在致密的腺体组织中的病变区域不能进行很好的分割。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的基于谱聚类与K-means结合的乳腺病变区域的识别方法与装置。
为了解决上述问题,本发明实施例公开了一种基于谱聚类与K-means结合的乳腺病变区域的识别方法,包括如下步骤:
通过对原始乳腺图像进行显著性检测,调整上述原始乳腺图像的目标区域和非目标区域之间的对比度,获得显著性图像;
对上述显著性图像进行乳腺轮廓分割处理,确定上述显著性图像中的有效乳腺区域;
将确定有效乳腺区域后的上述显著性图像进行区域粗分割,保留满足指定灰度阈值的粗分割区域,获得粗分割图像;
采用K-means聚类方法对上述粗分割图像中的指定粗分割区域进行细分割,获得细分割图像;
根据指定形态学特征对上述细分割图像进行假阳性区域滤除,获得真阳性区域图像;
将真阳性区域图像中的真阳性区域标记在上述对显著性图像进行乳腺轮廓分割处理后的图像中,获得标记出了病变区域的乳腺图像。
进一步地,通过对原始乳腺图像进行显著性检测,调整上述原始乳腺图像的目标区域和非目标区域之间的对比度,获得显著性图像的步骤,包括:
将上述原始图像进行反白处理;
采用基于频率协调的显著性检测方法对反白后的上述原始图像中的目标区域和非目标区域之间的对比度进行增强。
进一步地,对上述显著性图像进行乳腺轮廓分割处理,确定上述显著性图像中的有效乳腺区域的步骤,包括:
对上述显著性图像进行采样像素间隔为3-10个像素点的下采样处理,获得下采样图像;
采用最大类间方差法对上述下采样图像进行二值化处理,获得有效乳腺区域。
进一步地,将确定有效乳腺区域后的上述显著性图像进行区域粗分割,保留满足指定灰度阈值的粗分割区域,获得粗分割图像的步骤,包括:
将显著性图像中的像素点按照小于或等于原始数据量的0.3%~1%的原则对像素点进行抽样;
根据被抽样像素点的特征向量推导出上述显著性图像中所有像素点的特征向量的近似值;
对前k1个特征值对应的特征向量进行K-means聚类,根据聚类结果对上述显著性图像进行区域分割;
保留上述显著性图像中灰度最大值所在的区域。
进一步地,将显著性图像中的像素点按照小于或等于原始数据量的0.3%~1%的原则对像素点进行抽样的步骤之前,还包括:
将显著性图像中的像素点转换为列向量。
进一步地,根据指定形态学特征对上述细分割图像进行假阳性区域滤除,获得真阳性区域图像的步骤,包括:
提取指定细分割区域中的上述形态学特征,其中,上述形态学特征包括面积、离心率、圆形度、固性和占空比;
判断上述面积是否处于指定值域内;
若上述面积处于指定值域内,则判断上述离心率是否大于第一指定值;
若上述离心率大于第一指定值,则判断上述圆形度是否大于第二指定值;
若上述圆形度大于第二指定值,则判断上述固性是否大于第三指定值;
若上述固性大于第三指定值,则判断上述占空比是否大于第四指定值;
若上述占空比大于第四指定值,则判定上述聚类结果为真阳性区域。
进一步地,将真阳性区域图像中的真阳性区域标记在上述对显著性图像进行乳腺轮廓分割处理后的图像中,获得标记出了病变区域的乳腺图像的步骤,包括:
将上述真阳性区域图像中转换为区分出真阳性区域和非真阳性区域的二值图像,获得真阳性区域二值图像;
获取上述真阳性区域二值图中的真阳性区域轮廓,并将上述轮廓标记在上述对显著性图像进行乳腺轮廓分割处理后的图像中,获得标记出了病变区域的乳腺图像。
为了解决上述问题,本发明实施例公开了一种基于谱聚类与K-means结合的乳腺病变区域的识别装置,包括如下具体模块:
显著性检测模块,用于通过对原始乳腺图像进行显著性检测,调整上述原始乳腺图像的目标区域和非目标区域之间的对比度,获得显著性图像;
轮廓分割模块,用于对上述显著性图像进行乳腺轮廓分割处理,确定上述显著性图像中的有效乳腺区域;
粗分割模块,用于将确定有效乳腺区域后的上述显著性图像进行区域粗分割,保留满足指定灰度阈值的粗分割区域,获得粗分割图像;
细分割模块,用于采用K-means聚类方法对上述粗分割图像中的指定粗分割区域进行细分割,获得细分割图像;
滤除模块,用于根据指定形态学特征对上述细分割图像进行假阳性区域滤除,获得真阳性区域图像;
标记模块,用于将真阳性区域图像中的真阳性区域标记在上述对显著性图像进行乳腺轮廓分割处理后的图像中,获得标记出了病变区域的乳腺图像。
为了解决上述问题,本发明实施例公开了一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现本发明实施例中任意一项所述的基于谱聚类与K-means结合的乳腺病变区域的识别方法。
为了解决上述问题,本发明实施例公开了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明实施例中任意一项所述的基于谱聚类与K-means结合的乳腺病变区域的识别方法。
与现有技术相比,本申请包括以下优点:
本发明实施例中,通过对原始图像进行显著性检测,提高了原始图像内部区域之间的对比度;利用Nystrom采样谱聚类方法对乳腺图像进行粗分割,得到包含阳性区域(病变区域)的较小范围,用以进行后续分析;通过在粗分割的基础上,利用K-means聚类方法对病变区域进行二次分割,得到更加准确的阳性区域的轮廓范围。
附图说明
图1是本发明一实施例的基于谱聚类与K-means结合的乳腺病变区域的识别方法的步骤流程示意图;
图2是本发明一实施例的基于谱聚类与K-means结合的乳腺病变区域的识别方法的步骤流程示意图;
图3是本发明的实施例的原始图像示意图;
图4是本发明的实施例的显著性图像示意图;
图5是本发明的实施例的对显著性图像进行乳腺轮廓分割处理后的图像示意图;
图6是本发明的实施例的粗分割图像示意图;
图7是本发明的实施例的细分割后图像示意图;
图8是本发明的实施例的标记出了病变区域的乳腺图像示意图;
图9是本发明一实施例的基于谱聚类与K-means结合的乳腺病变区域的识别装置的模块结构示意图;
图10是本发明一实施例的一种计算机设备的结构示意图。
1、显著性检测模块;2、轮廓分割模块;3、粗分割模块;4、细分割模块;5、滤除模块;6、标记模块;12、计算机设备;14、外部设备;16、处理单元;18、总线;20、网络适配器;22、(I/O)接口;24、显示器;28、系统存储器;30、随机存取存储器(RAM);32、高速缓存存储器;34、存储系统;40、程序/实用工具;42、程序模块。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
最后,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
需要说明的是,在发明任一实施例中说描述的原始乳腺图像的尺寸在无特殊限定或说明的情况下大于或等于3000×2000像素,其仅表示当图像尺寸在3000×2000像素或以上时处理效果更佳,但不作为限制本发明的方法仅适用于尺寸在3000×2000像素或以上的医学图像的条件。
需要说明的是,在本发明任一实施例中所描述的真阳性区域图像为通过假阳性区域滤除后的细分割图像,即,为已区分出细分割区域中真阳性区域的细分割图像。
参照图1、3-8,示出了本申请一种基于谱聚类与K-means结合的乳腺病变区域的识别方法,包括如下步骤:
S1、通过对原始乳腺图像进行显著性检测,调整上述原始乳腺图像的目标区域和非目标区域之间的对比度,获得显著性图像;
S2、对上述显著性图像进行乳腺轮廓分割处理,确定上述显著性图像中的有效乳腺区域;
S3、将确定有效乳腺区域后的上述显著性图像进行区域粗分割,保留满足指定灰度阈值的粗分割区域,获得粗分割图像;
S4、采用K-means聚类方法对上述粗分割图像中的指定粗分割区域进行细分割,获得细分割图像;
S5、根据指定形态学特征对上述细分割图像进行假阳性区域滤除,获得真阳性区域图像;
S6、将真阳性区域图像中的真阳性区域标记在上述对显著性图像进行乳腺轮廓分割处理后的图像中,获得标记出了病变区域的乳腺图像。
如上述步骤S1所述,通过对原始乳腺图像进行显著性检测,调整上述原始乳腺图像的目标区域和非目标区域之间的对比度,获得显著性图像,如图3-4所示,需要说明的是,上述目标区域一般为组织区域,非目标区域一般为非组织区域,需要说明的是,在对上述原始乳腺图像进行显著性检测前一般需要对上述原始乳腺图像进行反白处理,即,将图像中的像素颜色进行黑白颠倒处理,再对反白处理后的上述原始乳腺图像进行显著性检测以调整图像中目标区域和非目标区域之间的对比度,其中,显著性检测方法一般为利用多处理自然图像的基于频率协调的显著性检测方法对反白后的上述原始乳腺图像进行增强处理。
如上述步骤S2所述,对上述显著性图像进行乳腺轮廓分割处理,确定上述显著性图像中的有效乳腺区域,如图5所示,需要说明的是,在对上述显著性图像进行乳腺轮廓分割处理前,一般还需要对上述显著性图像进行下采样处理,其中,下采样间隔一般为3-10个像素点,即每3-10个像素点中取一个像素点,作为采样像素点,采样后采用最大类间方差法,对下采样后的上述显著性图像进行二值化处理,最后获得有效乳腺区域,即乳腺组织区域。
如上述步骤S3所述,将确定有效乳腺区域后的上述显著性图像进行区域粗分割,保留满足指定灰度阈值的粗分割区域,获得粗分割图像,如图6所示。
需要说明的是,上述区域粗分割过程一般包含抽样和聚类,其中,在抽样前一般将上述确定有效乳腺区域后的上述显著性图像的各像素点转换为列向量,在抽样时抽样量一般为上述确定有效乳腺区域后的上述显著性图像的0.3%~1%,抽样后,还需要通过样本像素的特征向量值推导出整张图像所有像素点集的特征向量的近似值,在获得整张图像所有像素点集的特征向量的近似之后对前k1个特征向量进行聚类处理,在分割后一般保留图像中灰度最大值所在的区域,最后获得粗分割图像。
如上述步骤S4所述,采用K-means聚类方法对上述粗分割图像中的指定粗分割区域进行细分割,获得细分割图像,如图7所示,需要说明的是,从上述步骤S3进行粗分割后获得的粗分割图像中的粗分割区域一般仅为疑似病变区域,其中包含有非病变区域,通过K-means聚类方法对粗分割区域中指定区域进行二次分割,在发明实施例中,在二次分割时,进行K-means聚类的类别数(即,聚类个数或区域)为k2,且k2≥1并为整数。k2数值一般为3、5或7,在本发明实施例中聚类个数k2优选为3,当k2值为3的时候聚类结果较好。通过二次聚类后上述粗分割图像被分成如图7所示的3簇(即,3个聚类个数),即{C2i},i=1,2,3。
如上述步骤S5所述,根据指定形态学特征对上述细分割图像进行假阳性区域滤除,获得真阳性区域图像,对上述细分割图像进行假阳性区域滤除,其中,滤除过程中需要的形态学特征(滤除条件)包括面积、离心率、圆形度、固性和占空比,滤除不符合要求的细分割区域,滤除后剩下的区域即为真阳性区域(病变区域);
如上述步骤S6所述,将真阳性区域图像中的真阳性区域标记在上述对显著性图像进行乳腺轮廓分割处理后的图像中,获得标记出了病变区域的乳腺图像,如图8所示,需要说明的是,在标记在上述对显著性图像进行乳腺轮廓分割处理后的图像前,一般还需要获取真阳性区域的轮廓边界,在获取完该轮廓边界后,在上述对显著性图像进行乳腺轮廓分割处理后的图像相对应的地方进行标记。
在实际应用中,获取该真阳性区域的轮廓边界的具体步骤为:将真阳性区域的中包含的像素点值设置为1,将图像中的其他像素点的像素值设为0,并将图像构造成与上述对显著性图像进行乳腺轮廓分割处理后的图像的尺寸等大的二值图像,最后利用bwboundaries函数将二值图像中的轮廓进行标记,即获取到上述真阳性区域的轮廓边界。
参照图2和3,示出了本申请一种基于谱聚类与K-means结合的乳腺病变区域的识别方法实施例2的步骤流程图,具体可以包括如下步骤:
在本发明实施例中,通过对原始乳腺图像进行显著性检测,调整上述原始乳腺图像的目标区域和非目标区域之间的对比度,获得显著性图像的步骤,包括:
S11、将上述原始图像进行反白处理;
S12、采用基于频率协调的显著性检测方法对反白后的上述原始图像中的目标区域和非目标区域之间的对比度进行增强。
如上述步骤S11所述,将上述原始图像进行反白处理,需要说明的是,上述反白处理即为将图像中的像素颜色进行黑白颠倒处理。
如上述步骤S12所述,采用基于频率协调的显著性检测方法对反白后的上述原始图像中的目标区域和非目标区域之间的对比度进行增强,反白处理后将反白后的上述原始乳腺图像进行显著性检测以调整图像中目标区域和非目标区域之间的对比度,其中,显著性检测方法优选为利用多处理自然图像的基于频率协调的显著性检测方法对反白后的上述原始乳腺图像进行增强处理:
参照图2和4,在本发明实施例中,对上述显著性图像进行乳腺轮廓分割处理,确定上述显著性图像中的有效乳腺区域的步骤,包括:
S21、对上述显著性图像进行采样像素间隔为3-10个像素点的下采样处理,获得下采样图像;
S22、采用最大类间方差法对上述下采样图像进行二值化处理,获得有效乳腺区域。
如上述步骤S21所述,对上述显著性图像进行采样像素间隔为3-10个像素点的下采样处理,获得下采样图像,需要说明的是,在本实施例中优选采样间隔为5个像素点;
如上述步骤S22所述,采用最大类间方差法对上述下采样图像进行二值化处理,获得有效乳腺区域,需要说明的是,在本发明实施例中最大类间方差法中目标为组织区域,背景为非组织区域。
参照图2和5,在本发明实施例中,将确定有效乳腺区域后的上述显著性图像进行区域粗分割,保留满足指定灰度阈值的粗分割区域,获得粗分割图像的步骤,包括:
S31、将显著性图像中的像素点按照小于或等于原始数据量的0.3%~1%的原则对像素点进行抽样;
S32、根据被抽样像素点的特征向量推导出上述显著性图像中所有像素点的特征向量的近似值;
S33、对前k1个特征值对应的特征向量进行K-means聚类,根据聚类结果对上述显著性图像进行区域分割;
S34、保留上述显著性图像中灰度最大值所在的区域。
如上述步骤S31所述,将显著性图像中的像素点按照小于或等于原始数据量的0.3%~1%的原则对像素点进行抽样,需要说明的是,在本发明实施例中抽样量优选为小于或等于1%;需要说明的是,在步骤S31执行前一般还需要执行以下步骤:S30、将显著性图像中的像素点转换为列向量;
如上述步骤S32所述,根据被抽样像素点的特征向量推导出上述显著性图像中所有像素点的特征向量的近似值,需要说明的是,在本发明实施例中通过抽样像素点的特征向量推导上述显著性图像的方法优选为Nystrom方法;
如上述步骤S33所述,对前k1个特征值对应的特征向量进行K-means聚类,根据聚类结果对上述显著性图像进行区域分割,需要说明的是,上述k1为类别数(即,聚类个数或区域),且k1≥1并为整数。k1数值一般为3、5或7,在本发明实施例中聚类个数k1优选为5,当k1值为5的时候聚类结果较好。具体过程包括通过采样谱聚类算法之后,上述显著性图像被分成5簇(即,5个聚类个数),即即{C2i},i=1,2,3,4,5;
如上述步骤S34所述,保留上述显著性图像中灰度最大值所在的区域,需要说明的是,考虑到肿块区域较正常组织而言具有较高的亮度,因此将聚类分割后的上述显著性图像中灰度最大值所在的簇提取出来,作为二次分割(细分割)的初始区域,需要说明的是,当包含灰度最大值的簇大于一个时,将所有簇提取作为二次分割的初始区域。
参照图2和7,在本发明实施例中,根据指定形态学特征对上述细分割图像进行假阳性区域滤除,获得真阳性区域图像的步骤,包括:
S51、提取指定细分割区域中的上述形态学特征,其中,上述形态学特征包括面积、离心率、圆形度、固性和占空比;
S52、判断上述面积是否处于指定值域内;
S53、若上述面积处于指定值域内,则判断上述离心率是否大于第一指定值;
S54、若上述离心率大于第一指定值,则判断上述圆形度是否大于第二指定值;
S55、若上述圆形度大于第二指定值,则判断上述固性是否大于第三指定值;
S56、若上述固性大于第三指定值,则判断上述占空比是否大于第四指定值;
S57、若上述占空比大于第四指定值,则判定上述聚类结果为真阳性区域。
如上述步骤S51所述,提取指定细分割区域中的上述形态学特征,其中,上述形态学特征包括面积、离心率、圆形度、固性和占空比,
其中,
面积为各个细分割区域的像素点总个数,即为各细分区域的面积的大小。
离心率(eccentricity)为与当前区域具有相同标准二阶中心矩的椭圆的离心率,公式为:式中L和W分别为该椭圆的半焦距和长半轴的长度。
圆形度(Circularity)为描述图像类圆形的程度,公式为:式中,S为该区域的面积,C为该区域的周长。
固性(solidity),公式为:Sa为当前区域的面积,Sb为包含该区域的最小凸多边形的面积。
占空比(Extent),公式为:Sa为当前区域的面积,Sr为包含该区域的最小边界矩形的面积。
需要特别说明的是,步骤S52-S56中的判定可根据实际需求进行位置调换,亦可同时进行或同时进行若干数量的判定,只要各个判定的最终结果为系列结果即判定该聚类结果为真阳性区域,该判定结果为:上述面积处于指定值域内、上述离心率大于第一指定值、上述圆形度大于第二指定值、上述固性大于第三指定值、上述占空比大于第四指定值。
如上述步骤S52所述,判断上述面积是否处于指定值域内,需要说明的是,上述指定值域在本发明实施例中优选为40-90000个像素点数;若上述面积处于指定值域外则直接判定上述聚类结果为假阳性区域,其中,若面积判定为判定序列中的首判定项或任一非末尾判定项,且当判定结果为面积处于指定阈值外时,在执行完面积判定后,无需执行其余判定直接判定该聚类结果为假阳性区域。
如上述步骤S53所述,若上述面积处于指定值域内,则判断上述离心率是否大于第一指定值,需要说明的是,上述第一指定值为0.2-0.5,在本发明实施例中优选为0.3;若上述离心力小于或等于第一指定值则直接判定上述聚类结果为假阳性区域,其中,若离心力判定为判定序列中的首判定项或任一非末尾判定项,且当判定结果为离心力小于或等于第一指定值时,在执行完离心率判定后,无需执行其余判定直接判定该聚类结果为假阳性区域。
如上述步骤S54所述,若上述离心率大于第一指定值,则判断上述圆形度是否大于第二指定值,需要说明的是,上述第二指定值为0.6-0.8,在本发明实施例中优选为0.735,若上述圆形度小于或等于第二指定值则直接判定上述聚类结果为假阳性区域,其中,若圆形度判定为判定序列中的首判定项或任一非末尾判定项,且当判定结果为圆形度小于或等于第二指定值时,在执行完圆形度判定后,无需执行其余判定直接判定该聚类结果为假阳性区域。
如上述步骤S55所述,若上述圆形度大于第二指定值,则判断上述固性是否大于第三指定值,需要说明的是,上第三指定值为0.7-0.85,在本发明实施例中优选为0.79,若上述固性小于或等于第三指定值则直接判定上述聚类结果为假阳性区域,其中,若固性判定为判定序列中的首判定项或任一非末尾判定项,且当判定结果为固性小于或等于第三指定值时,在执行完固性判定后,无需执行其余判定直接判定该聚类结果为假阳性区域。
如上述步骤S56所述,若上述固性大于第三指定值,则判断上述占空比是否大于第四指定值,需要说明的是,上述第四指定值为0.2-0.3,在本发明实施例中优选为0.26,若上述占空比小于或等于第四指定值则直接判定上述聚类结果为假阳性区域,其中,若占空比判定为判定序列中的首判定项或任一非末尾判定项,且当判定结果为占空比小于或等于第四指定值时,在执行完占空比判定后,无需执行其余判定直接判定该聚类结果为假阳性区域。
如上述步骤S57所述,若上述占空比大于第四指定值,则判定上述聚类结果为真阳性区域,需要说明的是,上述真阳性区域即为病变区域。
参照图2和8,在本发明实施例中,将真阳性区域图像中的真阳性区域标记在上述对显著性图像进行乳腺轮廓分割处理后的图像中,获得标记出了病变区域的乳腺图像的步骤,包括:
S61、将上述真阳性区域图像中转换为区分出真阳性区域和非真阳性区域的二值图像,获得真阳性区域二值图像;
S62、获取上述真阳性区域二值图中的真阳性区域轮廓,并将上述轮廓标记在上述对显著性图像进行乳腺轮廓分割处理后的图像中,获得标记出了病变区域的乳腺图像。
如上述步骤S61所述,将上述真阳性区域图像中转换为区分出真阳性区域和非真阳性区域的二值图像,获得真阳性区域二值图像,需要说明的是,具体步骤包括:将上述真阳性区域图像中的真阳性区域内包含的像素点的像素值分别设置为1,上述真阳性区域的其余像素点的像素值设置为0,获得真阳性区域二值图像;
如上述步骤S62所述,获取上述真阳性区域二值图中的真阳性区域轮廓,并将上述轮廓标记在上述对显著性图像进行乳腺轮廓分割处理后的图像中,获得标记出了病变区域的乳腺图像,需要说明的是,采用matlab中的bwboundaries函数获取上述真阳性区域二值图中的真阳性区域轮廓,并将上述轮廓标记在上述对显著性图像进行乳腺轮廓分割处理后的图像中,获得标记出了病变区域的乳腺图像。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
参照图9,示出了本发明的一种基于谱聚类与K-means结合的乳腺病变区域的识别装置,包括如下具体模块:
显著性检测模块1,用于通过对原始乳腺图像进行显著性检测,调整上述原始乳腺图像的目标区域和非目标区域之间的对比度,获得显著性图像;
轮廓分割模块2,用于对上述显著性图像进行乳腺轮廓分割处理,确定上述显著性图像中的有效乳腺区域;
粗分割模块3,用于将确定有效乳腺区域后的上述显著性图像进行区域粗分割,保留满足指定灰度阈值的粗分割区域,获得粗分割图像;
细分割模块4,用于采用K-means聚类方法对上述粗分割图像中的指定粗分割区域进行细分割,获得细分割图像;
滤除模块5,用于根据指定形态学特征对上述细分割图像进行假阳性区域滤除,获得真阳性区域图像;
标记模块6,用于将真阳性区域图像中的真阳性区域标记在上述对显著性图像进行乳腺轮廓分割处理后的图像中,获得标记出了病变区域的乳腺图像。
上述显著性检测模块1,一般用于通过对原始乳腺图像进行显著性检测,调整上述原始乳腺图像的目标区域和非目标区域之间的对比度,获得显著性图像,需要说明的是,上述目标区域一般为组织区域,非目标区域一般为非组织区域,需要说明的是,在对上述原始乳腺图像进行显著性检测前一般需要对上述原始乳腺图像进行反白处理,即,将图像中的像素颜色进行黑白颠倒处理,再对反白处理后的上述原始乳腺图像进行显著性检测以调整图像中目标区域和非目标区域之间的对比度,其中,显著性检测方法一般为利用多处理自然图像的基于频率协调的显著性检测方法对反白后的上述原始乳腺图像进行检测并对图像进行增强。
上述轮廓分割模块2,一般用于对上述显著性图像进行乳腺轮廓分割处理,确定上述显著性图像中的有效乳腺区域,需要说明的是,在对上述显著性图像进行乳腺轮廓分割处理前,一般还需要对上述显著性图像进行下采样处理,其中,下采样间隔一般为3-10个像素点,即每3-10个像素点中取一个像素点,作为采样像素点,采样后采用最大类间方差法,对下采样后的上述显著性图像进行二值化处理,最后获得有效乳腺区域,即乳腺组织区域。
上述粗分割模块3,一般用于将确定有效乳腺区域后的上述显著性图像进行区域粗分割,保留满足指定灰度阈值的粗分割区域,获得粗分割图像。
需要说明的是,上述区域粗分割过程一般包含抽样和聚类,其中,在抽样前一般将上述确定有效乳腺区域后的上述显著性图像的各像素点转换为列向量,在抽样时抽样量一般为上述确定有效乳腺区域后的上述显著性图像的0.3%~1%,抽样后,还需要通过样本像素的特征向量值推导出整张图像所有像素点集的特征向量的近似值,在获得整张图像所有像素点集的特征向量的近似之后对前k1个特征向量进行聚类处理,在分割后一般保留图像中灰度最大值所在的区域,最后获得粗分割图像。
上述细分割模块4,一般用于采用K-means聚类方法对上述粗分割图像中的指定粗分割区域进行细分割,获得细分割图像,需要说明的是,从上述步骤S3进行粗分割后获得的粗分割图像中的粗分割区域一般仅为疑似病变区域,其中包含有非病变区域,通过K-means聚类方法进行对粗分割区域中指定区域的二次分割。
上述滤除模块5,一般用于根据指定形态学特征对上述细分割图像进行假阳性区域滤除,获得真阳性区域图像,对上述细分割图像进行假阳性区域滤除,其中,滤除过程中需要的形态学特征(滤除条件)包括面积、离心率、圆形度、固性和占空比,滤除不符合要求的细分割区域,滤除后剩下的区域即为真阳性区域(病变区域);
上述标记模块6,一般用于将真阳性区域图像中的真阳性区域标记在上述对显著性图像进行乳腺轮廓分割处理后的图像中,获得标记出了病变区域的乳腺图像,需要说明的是,在标记在上述对显著性图像进行乳腺轮廓分割处理后的图像前,一般还需要获取真阳性区域的轮廓边界,在获取完该轮廓边界后,在上述对显著性图像进行乳腺轮廓分割处理后的图像相对应的地方进行标记。
在实际应用中,获取该真阳性区域的轮廓边界的具体步骤为:将真阳性区域中包含的像素点值设置为1,将图像中的其他像素点的像素值设为0,并将图像构造成与上述对显著性图像进行乳腺轮廓分割处理后的图像的尺寸等大的二值图像,最后利用bwboundaries函数将二值图像中的轮廓进行标记,即获取到上述真阳性区域的轮廓边界。
参照图10,示出了本发明的一种实现所述基于谱聚类与K-means结合的乳腺病变区域的识别方法的计算机设备,具体可以包括如下:
上述计算机设备12以通用计算设备的形式表现,计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线18结构中的一种或多种,包括存储器总线18或者存储器控制器,外围总线18,图形加速端口,处理器或者使用多种总线18结构中的任意总线18结构的局域总线18。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线18,微通道体系结构(MAC)总线18,增强型ISA总线18、音视频电子标准协会(VESA)局域总线18以及外围组件互连(PCI)总线18。
计算机设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机设备12可以进一步包括其他移动/不可移动的、易失性/非易失性计算机体统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(通常称为“硬盘驱动器”)。尽管图10中未示出,可以提供用于对可移动非易失性磁盘(如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD~ROM,DVD~ROM或者其他光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质界面与总线18相连。存储器可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块42,这些程序模块42被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器中,这样的程序模块42包括——但不限于——操作系统、一个或者多个应用程序、其他程序模块42以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24、摄像头等)通信,还可与一个或者多个使得用户能与该计算机设备12交互的设备通信,和/或与使得该计算机设备12能与一个或多个其他计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)界面22进行。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN)),广域网(WAN)和/或公共网络(例如因特网)通信。如图所示,网络适配器20通过总线18与计算机设备12的其他模块通信。应当明白,尽管图10中未示出,可以结合计算机设备12使用其他硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元16、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统34等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现本发明实施例所提供的基于谱聚类与K-means结合的乳腺病变区域的识别方法。
也即,上述处理单元16执行上述程序时实现:通过对原始乳腺图像进行显著性检测,调整上述原始乳腺图像的目标区域和非目标区域之间的对比度,获得显著性图像;对上述显著性图像进行乳腺轮廓分割处理,确定上述显著性图像中的有效乳腺区域;将确定有效乳腺区域后的上述显著性图像进行区域粗分割,保留满足指定灰度阈值的粗分割区域,获得粗分割图像;采用K-means聚类方法对上述粗分割图像中的指定粗分割区域进行细分割,获得细分割图像;根据指定形态学特征对上述细分割图像进行假阳性区域滤除,获得真阳性区域图像;将真阳性区域图像中的真阳性区域标记在上述对显著性图像进行乳腺轮廓分割处理后的图像中,获得标记出了病变区域的乳腺图像。
在本发明实施例中,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请所有实施例提供的基于谱聚类与K-means结合的乳腺病变区域的识别方法:
也即,给程序被处理器执行时实现:通过对原始乳腺图像进行显著性检测,调整上述原始乳腺图像的目标区域和非目标区域之间的对比度,获得显著性图像;对上述显著性图像进行乳腺轮廓分割处理,确定上述显著性图像中的有效乳腺区域;将确定有效乳腺区域后的上述显著性图像进行区域粗分割,保留满足指定灰度阈值的粗分割区域,获得粗分割图像;采用K-means聚类方法对上述粗分割图像中的指定粗分割区域进行细分割,获得细分割图像;根据指定形态学特征对上述细分割图像进行假阳性区域滤除,获得真阳性区域图像;将真阳性区域图像中的真阳性区域标记在上述对显著性图像进行乳腺轮廓分割处理后的图像中,获得标记出了病变区域的乳腺图像。
可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机克顿信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦可编程只读存储器(EPOM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD~ROM)、光存储器件、磁存储器件或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言——诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言——诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行或者完全在远程计算机或者服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
在上述任一发明实施例中,通过对原始图像进行显著性检测,提高了原始图像内部区域之间的对比度;利用Nystrom采样谱聚类方法对乳腺图像进行粗分割,得到包含阳性区域(病变区域)的较小范围,用以进行后续分析;通过在粗分割的基础上,利用K-means聚类方法对病变区域进行二次分割,得到更加准确的阳性区域的轮廓范围。
以上对本申请所提供的一种基于谱聚类与K-means结合的乳腺病变区域的识别方法及装置,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。