CN102682305B - 宫颈液基细胞学自动筛查方法和系统 - Google Patents

宫颈液基细胞学自动筛查方法和系统 Download PDF

Info

Publication number
CN102682305B
CN102682305B CN201210124711.0A CN201210124711A CN102682305B CN 102682305 B CN102682305 B CN 102682305B CN 201210124711 A CN201210124711 A CN 201210124711A CN 102682305 B CN102682305 B CN 102682305B
Authority
CN
China
Prior art keywords
image
core
target
automatic
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210124711.0A
Other languages
English (en)
Other versions
CN102682305A (zh
Inventor
张灵
唐盛
尹立东
郑双明
李静立
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Microprofit Medical Equipment Co Ltd
Original Assignee
Shenzhen Microprofit Medical Equipment Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Microprofit Medical Equipment Co Ltd filed Critical Shenzhen Microprofit Medical Equipment Co Ltd
Priority to CN201210124711.0A priority Critical patent/CN102682305B/zh
Publication of CN102682305A publication Critical patent/CN102682305A/zh
Application granted granted Critical
Publication of CN102682305B publication Critical patent/CN102682305B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Processing (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明公开了一种宫颈液基细胞学自动筛查系统和方法,所述的系统包括:图像采集、图像分割、目标识别和综合分析。本发明提出的方法中分别设计了三点渐进均匀采样法保证自动聚焦的可靠性、由粗到精的分割算法提高对病变细胞核的分割准确性、一系列过滤器快速过滤各种杂质、级联分类器训练方法大大降低假阳性率,并使用相对特征进行综合分析。本发明的技术对病变细胞具有高敏感性,对正常细胞具有高特异性,识别速度快,自动化程度高,能在减轻细胞病理学家工作负担的同时提高诊断的准确性。

Description

宫颈液基细胞学自动筛查方法和系统
技术领域
本发明涉及细胞病理学、图像处理及模式识别,尤其涉及一种宫颈液基涂片中病变细胞的自动筛查方法和系统。
背景技术
宫颈癌是对妇女威胁最大的恶性肿瘤疾病。全世界每年有近250,000人死于宫颈癌。随着宫颈癌筛查方法的发展,1996年美国FDA批准了改良的细胞学制样技术——薄层液基细胞学。与传统巴氏涂片法相比,此方法能使细胞均匀地分布在玻片上,提高了发现低度和高度病变的敏感度,有文献报道薄层液基细胞学可检出92.9%的高度病变和100%的瘤癌,与传统涂片的77.8%和90.9%相比有显著性差异。另一方面,细胞均匀平铺也使计算机自动判读更加可行。目前国内外尚未见到针对薄层液基制片的自动宫颈细胞学筛查系统的报道。
尽管薄层液基技术减少了传统涂片中的细胞大量重叠的现象,但由于实际图像的复杂性,对宫颈液基涂片中病变细胞的自动识别仍然存在着诸多难点,传统方法往往忽视了这些问题:细胞核重叠或相互接触;细胞核的形状和大小千变万化(某些人的正常细胞核比某些人的病变细胞核还大);细胞核尤其是病变细胞核染色不均匀(这通常会导致欠分割现象,从而增加假阴性发生的概率);细胞核和其背景间的对比度由于光照不均匀或胞浆堆叠而改变;杂质(如炎症细胞、细胞碎片)的堆叠可能表现出类似病变细胞核的特征。
有鉴于此,有必要研发一种针对宫颈液基涂片的、对病变细胞具有较高敏感性、对正常细胞具有高特异性的自动筛查方法。
发明内容
本发明的目的是提供一种宫颈液基细胞学自动筛查方法和系统,该方法和系统能准确地挑选出宫颈液基涂片中的病变细胞,使细胞病理学家把精力集中在异常病例上,从而在减轻工作负担的同时提高准确性。
为实现上述目的,本发明提出一种宫颈液基细胞学自动筛查方法,该方法包括下列步骤:
步骤1.图像采集,图像采集模块控制自动上片装置将涂片放置到自动载物台上实现自动涂片扫描,通过数字摄像头采集图像;自动涂片扫描过程中,聚焦策略采用能同时处理单峰或双峰准则函数波形的三点渐进均匀采样法;
步骤2.图像分割,图像分析模块对采集到的图像进行预处理、二值化、粘连核分离操作,得到一系列目标物体;
步骤3.目标识别,图像分析模块判断图像中的目标物体是杂质、正常细胞、疑似病变细胞或者萎缩细胞;
步骤4.综合分析,图像分析模块利用相对特征进行综合分析,给出最终识别结果。
所述步骤2中,预处理的步骤为:提取HSV彩色空间中的V通道作为原始图像,用对比度限制的直方图均衡化算法增强核与周围区域的对比度,用双边滤波增强核边缘强度,再用均值滤波器去除高斯噪声和脉冲噪声。
所述步骤2中,二值化的步骤为:首先采用局部自适应阈值对预处理后的图像进行粗分割,再对每一个连通目标进行细分割,最后使用形态学算子进一步修正分割结果。
所述步骤2中,粘连核分离的步骤为:首先判断目标是否粘连,再用基于凹点对和径向对称中心的方法分离粘连核。
所述步骤3中,判断图像中的目标物体是否是杂质的步骤为:将目标物体依次送入细胞质过滤器、石墨和灰层过滤器、分叶状白细胞过滤器、失焦过滤器、级联核/杂质分类器,若目标物体未能通过这些流程,则认为其是杂质。
所述的级联核/杂质分类器的训练步骤为:按照自举法思想训练一个多层级联分类器,特征集包含密度、尺寸、边缘、形状、纹理五类,每层分类器所用特征由二次互信息特征选择算法选出。
所述步骤3中,判断图像中的目标物体是否是正常细胞的步骤为:按照自举法的思想训练一个多层级联病变核/正常核分类器,特征集包含核密度、核尺寸、核形状、核边缘、核纹理五类,每层分类器所用特征由二次互信息特征选择算法选出。
所述步骤3中,判断图像中的目标物体是否是萎缩细胞的步骤为:将疑似病变核的目标进行二次分割,若其中含有似核物体,则认为该目标是萎缩细胞。
所述步骤4中,综合分析的步骤为:计算所有被识别为阴性核的物体的平均灰度、形状、尺寸三方面的特征值,比较疑似病变核与这些特征值的加权差异,根据设定的阈值给出最终识别结果。
本发明还提出一种宫颈液基细胞学自动筛查系统,包括:设置在计算机中的图像采集模块和图像分析模块;受图像采集模块控制的自动上片装置、自动显微平台和数字摄像头;以及与图像分析模块相连的显示装置,其中:所述的图像采集模块控制自动上片装置将涂片放置到自动显微平台上进行自动扫描,聚焦策略采用能同时处理单峰或双峰准则函数波形的三点渐进均匀采样法;所述的图像分析模块对采集到的图像进行分割,包括预处理、二值化、粘连核分离操作,得到一系列目标物体;然后对目标物体进行目标识别,排出杂质、正常细胞、疑似病变细胞或者萎缩细胞;最后,利用相对特征进行综合分析,给出最终识别结果。
与现有技术相比,本发明专门针对宫颈液基涂片,自动聚焦时能处理准则函数曲线的多峰问题,图像分割时能处理图像对比度变化、核染色较浅、染色质不均匀、核粘连等问题,目标识别时能处理各种杂质、萎缩细胞,并充分考虑相对特征。因此,本发明的技术对病变细胞具有高敏感性,对正常细胞具有高特异性,识别速度快,自动化程度高,能在减轻细胞病理学家工作负担的同时提高诊断的准确性。
附图说明
下面结合附图和较佳实施例对本发明进行详细的说明,其中:
图1为本发明宫颈液基细胞学筛查系统的模块图;
图2为本发明自动聚焦策略流程图;
图3为本发明涂片图像分析流程图;
图4为本发明粘连分离方法流程图;
图5为本发明级联分类器训练流程图。
具体实施方式
本发明的关键技术在于对宫颈液基涂片进行筛查,由机器自动挑选出其中的疑似病变细胞。本发明的技术原理包括图像处理、模式识别和机器学习技术。
图1是本发明用于宫颈液基细胞学筛查的一个较佳实施方案的模块图。该方案包括一自动上片装置10、一自动显微平台11、一数字摄像头12、一计算机13及一显示装置14。自动上片装置10用于实现自动将宫颈液基涂片放置在显微平台上及自动换片功能。自动显微平台11用于实现对宫颈液基涂片的扫描和聚焦。数字摄像头12用于实现对宫颈细胞图像的采集。计算机13中包括一个自动图像采集模块15和一个图像分析模块16。显示装置14用于显示找到的疑似病变细胞供医生诊断。自动图像采集模块15用于控制自动显微平台11进行自动扫描和自动聚焦,并控制数字摄像头12对聚焦清晰度视野进行图像采集。图像分析模块16用于对采集到的细胞序列图像进行自动识别,挑选出其中的疑似病变细胞。
由于自动显微平台11的初始位置可能离最佳焦平面位置较远,同时由于实际玻片图像质量千变万化,因此聚焦过程中产生的图像质量准则函数曲线经常出现非单峰现象,传统聚焦策略无法找到最佳焦平面。为解决这个问题,本发明专门针对宫颈液基涂片的特点,开发了一种新的自动聚焦方法,如图2所示。给定平台初始位置21,采用三点渐进法确定调焦方向22,方向的确定是基于对此三点图像质量的评估。针对宫颈液基细胞的特点,本发明采用细胞高频信息量作为图像质量准则函数。根据确定的调焦方向调节焦距23,判断当前三点是否是准则曲线的转折点24,若不是则继续采用三点渐进法确定下一步的调焦方向22,若是则说明焦平面位于这三点之间。上述三点渐进方式能确保准则曲线的波峰位于转折点范围内。这时,采用在三点间均匀点采样的方法寻找候选最优焦平面25,寻找时可根据之前获得的数据特征减少采样点数,提高效率。最后,根据找到的候选最优焦平面,微调至最佳焦平面26。
自动扫描时采用二十倍物镜放大,经与多位病理学专家交流后知道,二十倍放大对于确诊病变细胞已经足够。扫描路径近似圆形,这使得扫描范围与涂片上细胞所在范围能更好的吻合。
图3是本发明图像分析方法的流程图。对于采集到的聚焦清晰的细胞图像序列31,可依次从中选择未经分析过的图像32,使用图像分割模块33分割出感兴趣的目标物体。由于一张病变的玻片含有大量的杂质、正常细胞及萎缩细胞,因此,使用目标识别模块34排除这些杂质或细胞。中间结果保存模块35用于保存被识别为疑似病变的细胞和被识别为正常的细胞。判断模块36用于判断全部采集到的序列图像是否处理完毕。当处理完毕后,综合分析模块37根据保存的中间结果35进行综合分析,挑选出最终的疑似病变细胞作为筛查结果38。
图像分割模块33分为三个步骤:预处理、二值化、粘连核分离。
步骤331.预处理,该步骤的目的是使细胞核更容易从其周围背景中分离出来,这需要考虑核/质对比度、核边缘保持及噪声抑制。
(1)核/质对比度。一般来说,细胞核较其周围的细胞质更加深染,容易分割。然而,当细胞互相堆叠或细胞出现病理改变时,核周围的细胞质颜色都将加深,增加了细胞核分割的难度。传统方法一般是直接对灰度图像进行处理,导致许多病变细胞欠分割进而导致假阴性的发生。本发明在大量实践基础上提出将原始RGB(红、绿、蓝)彩色空间转换到HSV(色相、饱和度、亮度)彩色空间,再提取其中的V通道作为原始待分析的图像。V通道图像中,细胞核将保持其亮度,而细胞质尤其深染的细胞质将变得更亮。另一方面,V通道图像也能增强炎症细胞和其周围区域的对比度,炎症细胞的准确分割更能保证对其准确的识别。所述的V通道图像的整体对比度可能不够强,这是由于染色效果不佳或光照较弱造成的。为此,本发明采用由荷兰乌得勒支大学的Zuiderveld提出的对比度限制的自适应直方图均衡化算法进一步增强细胞核与周围背景的对比度,该方法的优势在于不会带来更多的噪声。
(2)核边缘保持及噪声抑制。本发明采用边缘保持滤波技术中的双边滤波增强核边缘强度。但双边滤波可能会使核边界出现不规则失真,这需要再使用平滑滤波处理。台湾国立中兴大学的Tsai等人经研究发现,只有中值滤波能去除宫颈涂片图像中的脉冲噪声和高斯噪声,据此,本发明采用5×5模板的中值滤波对图像进行平滑及去噪。
步骤332.二值化。该步骤的目的是将细胞核从图像中分离出来。考虑到宫颈细胞学自动筛查的速度和敏感性要求,本发明设计了一个由粗到精度分割方法:
(1)首先采用阈值化方法对图像进行粗分割,提取细胞核区域。由于光照不均匀,用一个全局阈值很难获得满意度分割效果。本发明采用由德国人工智能研究中心(DFKI)的Shafait等人提出的快速局部自适应阈值法。对于图像中的每一个像素点(x,y),该方法计算以该点为中心、w×w窗口内像素的均值m(x,y)和标准差s(x,y),再根据公式(1)求得该点对应的阈值t(x,y):
t ( x , y ) = m ( x , y ) [ 1 + k ( s ( x , y ) R - 1 ) ] - - - ( 1 )
式中R是标准差的最大值,取128,常数k的取值范围为[0.2,0.5]。该方法综合利用了强度及纹理信息,并可根据积分图像实现快速计算,能在光照变化的背景中,实现对细胞核有效的分割。
(2)修正粗分割结果。为实现更精确的分割,尤其是染色不均匀的病变细胞核的分割效果,本发明提出了一种新的方法。对于粗分割得到的每一个连通区域,在其周围一定范围内求取能最小化公式(2)定义的能量函数的像素标签L(x,y):
E ( L ( x , y ) ) = Σ ( x , y ) R ( L ( x , y ) ) + Σ ( x , y ) ( x ′ , y ′ ) ∈ N ( x , y ) B ( L ( x , y ) , L ( x ′ , y ′ ) ) - - - ( 2 )
式中,N(x,y)是像素I(x,y)的邻域。E(L(x,y))的全局最优解可通过由西门子研究院的Boykov等提出的图割(graph cuts)算法来求解。公式(2)等号右边第一项是数据项,表示的像素点自身能量,其可以取值为前景(obj)或背景(bkg)的强度直方图Pr(I|obj)和Pr(I|bkg)。本发明中,前景即是粗分割得到的目标区域,背景则是其他区域。这样,数据项R(L(x,y))可计算如下:
Robj(L(x,y))=-lnPr(I(x,y)|obj)
Rbkg(L(x,y))=-lnPr(I(x,y)|bkg)              (3)
公式(2)等号右边第二项是像素连续性项,它指示相邻像素间连接能量的总和:
B ( L ( x , y ) , L ( x ′ , y ′ ) ) = δ ( L ( x , y ) , L ( x ′ , y ′ ) ) · exp ( - ( I ( x , y ) - I ( x ′ , y ′ ) ) 2 2 σ 2 )
δ ( L ( x , y ) , L ( x ′ , y ′ ) ) = 1 , ifL ( x , y ) ≠ L ( x ′ , y ′ ) 0 , ifL ( x , y ) = L ( x ′ , y ′ ) - - - ( 4 )
式中的σ是尺度因子,当核染色质较平滑时σ取较小值,反之取较大值。本发明中σ设为30。图割法将上述能量函数表达为一个图结构,使用最大流最小割算法求取该图的最小割,即对应图像的最优分割。
对每一个粗分割得到的连通区域使用图割法修正之后,只保留与粗分割得到的前景目标重叠面积最大的结果。将这些修正后的分割结果拼接起来,得到最终对整幅图像的精确分割结果。这一由粗到精的基于局部的分割方法既考虑了强度、纹理等图像底层特征,又考虑了边缘和区域等属性,且修正时能克服整幅图像光照不均匀的影响,因此能准确地分割核染色质不均匀和染色较浅的病变细胞核,也能修正阈值分割可能产生的过分割现象,这是本发明重要贡献之一。此外,图割法用于图像分割时的求解速度也较快。最后,为进一步修正分割结果,如平滑边界毛刺、去除小的孤立像素点、断开小粘连等,本发明采用了3×3模板的形态学开运算操作。
步骤333.粘连核分离。粘连细胞核的分离对全自动宫颈细胞学筛查的性能来说至关重要。两个及两个以上的粘连的细胞核若不能被分离开,则很有可能被误识别为病变细胞。为此,本发明设计了一种结合径向对称中心和凹点对的粘连分离算法。相比于传统方法,该方法的主要优势在其综合考虑了梯度和几何特征,使寻找的分离线更加可靠,特别是能减少过分割现象。
首先,给定一个分割后得到的连通区域χi。本发明使用三个变量来判定该区域是否是粘连核:(1)χi的径向对称中心ri和几何中心gi的距离;(2)χi的似圆度ci;(3)χi的形状因子fi。其中径向对称中心ri能指示图像中的显著目标(细胞核),它是对称变换图像中像素值最大的点对应的位置,对称变换是各像素基于梯度方向投票得到的。如果χi满足下式,则被认为是粘连核:
图4所示是本发明粘连分离流程图。步骤41,给定一幅二值化之后的二值图像,步骤42,扫描图像中目标区域,步骤43,获取目标的边界,生成描述目标轮廓的链码表。根据轮廓计算面积,若该目标面积过小,则必定不是病变细胞,直接去掉。步骤44,根据公式(5)所定义的准则判断目标是否是粘连核,若是则进行分离。步骤45,分离时,对于形状很不规则的目标需先进行边缘修正,即平滑处理,这是因为边缘上过多的小凹点会影响获得的分离线的可靠性。步骤46,寻找所有凹点,在目标轮廓上寻找凹点的依据是平均链码与曲率。平均链码表征直线的方向,边缘上同一点前后平均链码之差可表征该点处的曲率大小,差值为正的点即为凹点。在所有的凹点中,满足如下三个准则的凹点对即是最优凹点对:(1)两凹点确定的弧弦比最大;(2)两凹点离径向对称中心ri最近;(3)两凹点在径向对称中心ri和几何中心gi连线的两侧。步骤47,引导出分离线。连接最优凹点对即可引导出分离线。步骤48,对于分离后的剩余部分判断是否需要继续分离。根据公式(5)所定义的准则判断剩余部分是否还需要分离,若仍然粘连且面积大于一定阈值,则重复步骤46、47,继续引导其他的分离线;否则结束对该目标的粘连分离,继续扫描二值图中余下的区域,重复上述粘连分离流程,直到整个二值图被扫描完毕。
目标识别模块34分为3个步骤:去除杂质、去除正常细胞、去除萎缩细胞。
步骤341.去除杂质
当分割结束后,一些目标物体被提取出来。逐一将这些物体通过一系列过滤器过滤,不能全部通过这些过滤器的物体即被识别为杂质。每个过滤器仅含少量特征,过滤则是通过计算阈值来实现。
细胞质过滤器用于尽可能多的排除掉一些分割出的细胞质。为描述细胞质特点,本发明采用两个特征,其一测量目标物体与周围区域的纹理差异,其二测量目标物体的形状与细胞核的差异。
玻片中可能含有一些由铅笔留下的石墨微粒,另外,玻片或镜头上也可能出现一些灰尘。石墨微粒颜色呈深黑色,而灰尘颜色呈浅灰色,其各彩色分量间差别不大,故本发明提出通过测量各彩色通道之间的差异来排除石墨微粒和灰尘。
分叶状白细胞经过分割后,有可能形状似圆,且整体颜色较深,容易被误识别为阳性细胞核。考虑到白细胞特点是核很小,染色很深,本发明设计的分叶状细胞过滤器使用了两个特征,其一测量目标内深色物质的含量,其二测量目标内对比度。
聚焦模糊(失焦)的物体不具有诊断价值,故本发明使用两个特征,其一测量目标边界强度,其二测量目标内高频信息量,来排除失焦的物体。因为对聚焦清晰度的判据并不十分可靠,故设置的阈值范围较宽。
上述过滤器虽能过滤掉一定数量的典型杂质,但为排除更多数量及种类的杂质,如细胞核过分割、细胞碎片、黏液等,本发明专门训练了一个核/杂质分类器。分类器的训练需要包括以下主要步骤:(1)训练样本搜集、(2)特征提取、(3)特征选择和(4)分类器。
核/杂质分类器训练时所需的正样本为细胞核,包括正常核和病变核,负样本则包括各种杂质。样本的搜集采用半自动方式的专家协助方式。首先用所述的由粗到精的分割方法对一批宫颈细胞图像进行自动分割,再由细胞病理学专家从中挑选出分割效果满意的正常核、病变核作为正样本,最后从余下物体中挑选出具有代表性的物体,如细胞质、细胞和过分割、堆叠炎症细胞等作为负样本。每一个训练样本都包含其原始图像及相应自动分割得到的二值图。
特征提取对于模式识别系统的性能至关重要。在进行特征提取时,主要与临床专家知识相结合,由细胞病理学家定义一些具有临床判别能力的特征,再由算法研究员对这些特征进行量化,转换为能计算的特征值。此外,算法研究员参考了大量计算机视觉、模式识别领域里的用于自动识别细胞病理学改变的特征,构建了一套较丰富的特征集:
密度特征:平均灰度、标准差、熵、目标-背景对比度。
尺寸特征:面积、周长、长径、宽径。
边缘特征:边缘强度、边缘方差、边缘模糊系数。
形状特征:凸度、圆形度、形状因子、偏心率、傅立叶描述子、平均标准化半径、标准化半径方差、标准化半径熵、面积比率、粗糙度。
纹理特征:分形维数、灰度共生矩阵(角二阶矩、对比度、相关、熵、方差、反差分矩等)、局部二值模式(LBP)均值、LBP方差。
上述特征集没有涉及到与颜色相关的特征,使本发明所提出的方法能更好的处理各种染色方法所带来的颜色变化。
为从上述特征集中挑选出最适合分类的特征,本发明采用2003年摩托罗拉实验室的Torkkola提出的二次互信息特征选择方法,该方法的优势在于无需类别密度的先验假设。定义特征向量Y与类别C之间的二次互信息为:
Q ( Y , C ) = 1 N 2 Σ p = 1 Nc Σ k = 1 Jp Σ l = 1 Jp g ( y pk - y pl , 2 σ 2 I )
+ 1 N 2 ( Σ p = 1 Nc ( J p N ) 2 ) Σ k = 1 N Σ l = 1 N g ( y k - y l , 2 σ 2 I ) - - - ( 6 )
- 2 N 2 Σ p = 1 Nc J p N Σ j = 1 Jp Σ k = 1 N g ( y pj - y k , 2 σ 2 I )
式中,N是样本总数,yk是第k个样本对应的特征向量,ypk是第p类,第k个样本对应的的特征向量,p是类别变量,Nc是类别数,Jp是第p类样本个数,g(x,∑)是高斯窗函数,σ取0.5。二次互信息特征选择的目的是挑选出一个次优特征集合y′,该集合与类别属性C之间的Q(Y,C)值最大。
分类器的选择通过5重交叉验证法确定,候选分类器包括:随机森林、神经网络、支持向量机和AdaBoost等。
图5所示是本发明级联分类器训练流程。级联设计是基于自举法思想,训练从第二级开始的分类器所用负样本由当前级联分类器难以识别的负样本组成。给定初始训练样本集51,逐一计算出五类特征,使用二次互信息特征选择方法挑选出一个次优特征组合52,用5重交叉验证法分别比较各种分类器对这组特征的分类性能,确定一个性能最优的分类器及相应参数,训练出第一级分类器53。判断此时分类器的性能是否达到要求55。判断依据是当前分类器的假阳性率。如果分类器的假阳性率还较高(比如,大于1%),则考虑能否再增加一级分类器56。增加依据为当前分类器的敏感性是否还足够高(比如,大于70%)。若够高,则用当前级联分类器在一组图像中寻找新的负样本57,并根据新的负样本及之前的正样本训练下一级分类器。新的负样本即是那些被当前分类器误识别为细胞核的物体。分类器级联54是指将当前所有训练得到的分类器连接起来,即一个待识别目标需依次通过每一个分类器才给出识别结果。当级联分类器的性能达到要求55,或者不能再增加一级分类器时,训练过程结束,得到最终的级联核/杂质分类器。
按上述方法训练出的级联核/杂质分类器共含三级,第一级包含次优特征八个,分别是:两个密度特征、两个尺寸特征、三个形状特征和一个纹理特征。第二级包含次优特征十一个,分别是:两个密度特征、三个尺寸特征、五个形状特征和一个纹理特征。第三级包含次优特征十五个,分别是三个密度特征,三个尺寸特征,一个边缘特征,六个个形状特征和两个纹理特征。三级的次优特征数量依次递增,这说明分类难度在增大,因为靠后的分类器训练时所用的训练样本是靠前的分类器难以区分的。三级分类器都由随机森林训练得到。一个待识别目标,必须依次通过这三级分类器才会被识别为是细胞核,否则被当作杂质排除。
步骤342.去除正常细胞
筛查的目的是尽可能多的去除正常细胞,保留病变细胞。因为大多数正常细胞核都比病变细胞核小,故在统计了大量病变细胞核的尺寸数据后,直接设置面积阈值就能排除掉许多正常细胞,而保留几乎所有病变细胞。余下的正常细胞将送到一个级联病变核/正常核分类器中进行识别。训练此级联分类器的基本方法与图5相同,这里仅就不同之处做简要说明。
训练正样本为病变细胞核,负样本为正常细胞核。全部正样本是从经活检验证为CIN1~3级或癌症的病例对应的宫颈液基涂片中挑选构成的。挑选时邀请五位细胞病理学专家对涂片中的细胞进行鉴别,一个细胞必须被所有专家都鉴别为阳性才归入训练正样本集中,鉴别意见不能达成一致的细胞不予考虑。负样本则是从被诊断为阴性且至今无癌变报告的宫颈液基涂片中挑选。
按图5方法训练出的级联病变核/正常核分类器共含三级,第一级包含次优特征十个,分别是:两个密度特征、三个个尺寸特征、两个形状特征和三个纹理特征。第二级包含次优特征十一个,分别是:一个密度特征、三个尺寸特征、三个形状特征和四个纹理特征。第三级包含次优特征十二个,分别是一个尺寸特征、一个边缘特征、五个形状特征和五个纹理特征。三级的次优特征数量变化不大,但侧重点不同。靠前的分类器侧重核染色深浅及尺寸等特征,靠后的分类器则侧重核形状规则程度及核染色质分布等特征。三级分类器都由多层感知器训练得到。一个待识别目标,必须依次通过这三级分类器才会被识别为是病变细胞核,否则被当作正常细胞核排除。
级联分类器对降低假阳性率有重要作用,是本发明的重要贡献之一。举例来说,假设每级分类器的敏感性为90%,假阳性率为10%,那么三级级联之后的敏感性就是72.9%,而假阳性率仅0.1%。通常一张病变宫颈细胞涂片中大约含有100,000个正常细胞和50个病变细胞,假设不考虑分割产生的误差,则经过所述的级联分类器过滤之后,能挑选出36个病变细胞,同时仅剩下100个阴性细胞。
步骤343.去除萎缩细胞
萎缩细胞在雌性激素分泌较低时大量出现,其特点是细胞较小较圆,染色较深,细胞核较大,染色也较深。因此,自动分割很可能把萎缩细胞分割为一个整体。由于萎缩细胞具有上述特征,其作为整体来识别时就极有可能被识别为病变细胞。本发明排除萎缩细胞时主要抓住其内部含有细胞核这一必然特征,采用二次分割的方法找出细胞核。二次分割只作用于那些被识别为病变细胞的目标,计算时只考虑目标内的像素。所设计的二次分割方法联合了两种不同类型的分割算法。第一种分割基于边缘,采用自适应阈值的Canny算子,寻找目标内是否有封闭的类圆形目标;第二种分割基于区域,采用Otsu阈值,将目标区域分为两部分,判断两部分中是否有一部分是类圆形区域。只要上述两种分割方法中的任一种找到了类圆形目标,且该目标尺寸小于原目标的二分之一,则认为原目标是萎缩细胞。只要细胞核边界较清晰或者和细胞质有较高的对比度,所述的二次分割方法就能将其成功分割出来。值得指出的是,二次分割是在预处理后的图像上执行的。
至此,对一幅未经分析过的图像32的处理过程结束,保存分析中间结果35。中间结果包括:被识别为病变细胞的ROI彩色图像(ROI定义为以目标外接矩形的中心为中心,大小为128×128的矩形区域)、中心坐标、病变程度、平均灰度、形状、尺寸等,被识别为正常细胞的平均灰度、形状、尺寸等。
当全部采集到的序列图像经判断步骤36处理完成后,综合分析模块37根据保存的中间结果35进行综合分析。此过程的目的是进一步减少假阳性结果,减轻医生工作量,这是本发明的重要贡献之一。考虑到细胞核的形状和大小千变万化,单靠绝对特征很难将良恶性细胞完美地分开,本发明利用良恶性细胞间的相对特征进行分析的步骤为:计算所有被识别为阴性核的物体的平均灰度、形状、尺寸等三方面的特征值,比较被识别为病变核的物体与这些特征值的加权归一化差异:
diff=α·Dg+β·Df+γ·Ds                        (7)
式中,Dg、Df、Ds分别表示灰度、形状、尺寸的归一化差异,α、β、γ分别是对应的加权系数。若加权归一化差异diff大于预设阈值,则认为是病变细胞。加权系数是通过对训练样本的统计,根据误识率最小的准则得到三种特征相结合时每种特征所占有的权重,本发明中,α=0.3、β=0.1、γ=0.6。
至此,对整张涂片的识别流程结束,识别为阳性的物体按疑似程度从高到低排序,挑选出疑似程度大于0.6的物体。此时,传统的结果显示方式是将这些物体中的前N个(N可由用户设置)的ROI彩色图像显示在屏幕上供医生诊断。这种方式虽然方便医生浏览,然而不能提供周围细胞及背景的信息,潜在地增加了医生诊断的难度进而增加误诊及漏诊的可能性。据此,本发明提出一种新的结果显示方式——显示含有疑似病变细胞的原彩色图像。挑选这些彩色图像的方法为:计算来自同一幅图像的疑似病变物体的疑似程度之和,按照和从大到小的顺序显示原图像。这样,一张涂片需医生诊断的细胞就由原始的100,000个细胞大大减少到m幅图中的n个带标记的细胞,同时因为提供了周围细胞的信息,稍有经验的医生就能在短时间内排除掉非病变细胞;而只要这n个细胞中有一个病变细胞就足够引起医生对该涂片的关注,进而考虑是否需要人工检查。当然,如果结果中不含有病变细胞,也并不意味着该病例一定没有病变。比如取样时刮取的部位不当导致根本没有病变细胞、制片及染色时操作不当导致细胞数量较少等。对于后者,本发明采用细胞计数的方式来解决。若涂片上总共细胞数量不足,则提醒医生考虑进行人工检查。
本发明可以用作初筛,一方面减轻医生工作量,一方面也潜在地提高对病变细胞的敏感性。也可用于复查那些被医生诊断为阴性的涂片,使医生把精力集中在那些在人工检查时可能被漏掉的疑似病变细胞上。

Claims (8)

1.一种宫颈液基细胞学自动筛查方法,其特征在于该方法包括下列步骤:
步骤1.图像采集,图像采集模块控制自动上片装置将涂片放置到自动载物台上实现自动涂片扫描,通过数字摄像头采集图像;自动涂片扫描过程中,聚焦策略采用能同时处理单峰或双峰准则函数波形的三点渐进均匀采样法;
步骤2.图像分割,图像分析模块对采集到的图像进行预处理、二值化、粘连核分离操作,得到一系列目标物体;
步骤3.目标识别,图像分析模块判断图像中的目标物体是杂质、正常细胞、疑似病变细胞或者萎缩细胞;
步骤4.综合分析,图像分析模块利用相对特征进行综合分析,给出最终识别结果;
其中,步骤2中,粘连核分离的步骤为:首先判断目标是否粘连,再用基于凹点对和径向对称中心的方法分离粘连核;
步骤3中,判断图像中的目标物体是否是杂质的步骤为:将目标物体依次送入细胞质过滤器、石墨和灰层过滤器、分叶状白细胞过滤器、失焦过滤器、级联核/杂质分类器,若目标物体未能通过这些流程,则认为其是杂质。
2.如权利要求1所述的方法,其特征在于步骤2中,预处理的步骤为:提取HSV彩色空间中的V通道作为原始图像,用对比度限制的直方图均衡化算法增强核与周围区域的对比度,用双边滤波增强核边缘强度,再用均值滤波器去除高斯噪声和脉冲噪声。
3.如权利要求1所述的方法,其特征在于步骤2中,二值化的步骤为:首先采用局部自适应阈值对预处理后的图像进行粗分割,再对每一个连通目标进行细分割,最后使用形态学算子进一步修正分割结果。
4.如权利要求1所述的方法,其特征在于:所述的级联核/杂质分类器的训练步骤为:按照自举法思想训练一个多层级联分类器,特征集包含密度、尺寸、边缘、形状、纹理五类,每层分类器所用特征由二次互信息特征选择算法选出。
5.如权利要求1所述的方法,其特征在于步骤3中,判断图像中的目标物体是否是正常细胞的步骤为:按照自举法的思想训练一个多层级联病变核/正常核分类器,特征集包含核密度、核尺寸、核形状、核边缘、核纹理五类,每层分类器所用特征由二次互信息特征选择算法选出。
6.如权利要求1所述的方法,其特征在于步骤3中,判断图像中的目标物体是否是萎缩细胞的步骤为:将疑似病变核的目标进行二次分割,若其中含有似核物体,则认为该目标是萎缩细胞。
7.如权利要求1所述的方法,其特征在于步骤4中,综合分析的步骤为:计算所有被识别为阴性核的物体的平均灰度、形状、尺寸三方面的特征值,比较疑似病变核与这些特征值的加权差异,根据设定的阈值给出最终识别结果。
8.一种宫颈液基细胞学自动筛查系统,包括:
一自动上片装置(10),用于实现自动将宫颈液基涂片放置在显微平台上及自动换片功能;
一自动显微平台(11),用于实现对宫颈液基涂片的扫描和聚焦;
一数字摄像头(12),用于实现对宫颈细胞图像的采集;
一计算机(13),包括一个自动图像采集模块(15)和一个图像分析模块(16);
及一显示装置(14);
其特征在于:
所述的图像采集模块控制自动上片装置将涂片放置到自动显微平台上进行自动扫描,通过数字摄像头采集图像;自动涂片扫描过程中,聚焦策略采用能同时处理单峰或双峰准则函数波形的三点渐进均匀采样法;
所述的图像分析模块对采集到的图像进行预处理、二值化、粘连核分离操作,得到一系列目标物体;判断图像中的目标物体是杂质、正常细胞、疑似病变细胞或者萎缩细胞;利用相对特征进行综合分析,给出最终识别结果;
其中,所述粘连核分离操作包括:首先判断目标是否粘连,再用基于凹点对和径向对称中心的方法分离粘连核;所述判断图像中的目标物体是杂质的操作包括:将目标物体依次送入细胞质过滤器、石墨和灰层过滤器、分叶状白细胞过滤器、失焦过滤器、级联核/杂质分类器,若目标物体未能通过这些流程,则认为其是杂质。
CN201210124711.0A 2012-04-25 2012-04-25 宫颈液基细胞学自动筛查方法和系统 Active CN102682305B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210124711.0A CN102682305B (zh) 2012-04-25 2012-04-25 宫颈液基细胞学自动筛查方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210124711.0A CN102682305B (zh) 2012-04-25 2012-04-25 宫颈液基细胞学自动筛查方法和系统

Publications (2)

Publication Number Publication Date
CN102682305A CN102682305A (zh) 2012-09-19
CN102682305B true CN102682305B (zh) 2014-07-02

Family

ID=46814200

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210124711.0A Active CN102682305B (zh) 2012-04-25 2012-04-25 宫颈液基细胞学自动筛查方法和系统

Country Status (1)

Country Link
CN (1) CN102682305B (zh)

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102273115B1 (ko) * 2013-10-28 2021-07-06 몰레큘라 디바이스 엘엘씨 현미경 이미지 내에서 각각의 세포를 분류 및 식별하는 방법 및 시스템
CN103932679B (zh) * 2014-04-09 2017-01-25 天津大学 一种针对薄层层析成像系统的图像校正方法
CN103984958B (zh) * 2014-05-07 2017-11-07 深圳大学 宫颈癌细胞分割方法及系统
CN104331892B (zh) * 2014-11-05 2017-04-19 南京理工大学 一种基于形态学的神经元识别与分析方法
JP6324338B2 (ja) * 2015-03-25 2018-05-16 株式会社日立ハイテクノロジーズ 細胞診断支援装置、細胞診断支援方法、遠隔診断支援システム、及びサービス提供システム
CN104834914A (zh) * 2015-05-15 2015-08-12 广西师范大学 宫颈细胞图像特征识别方法及宫颈细胞特征识别装置
CN109118492B (zh) * 2016-12-22 2022-04-05 浙江工业大学 一种相差显微镜细胞图像的检测和分割方法
WO2018222897A1 (en) * 2017-06-01 2018-12-06 University Of Washington Smartphone-based digital pupillometer
CN107808381A (zh) * 2017-09-25 2018-03-16 哈尔滨理工大学 一种单细胞图像分割方法
CN108171168B (zh) * 2017-12-28 2020-09-22 浙江大学 弱小目标变动智能图像检测方法及装置
CN108665463A (zh) * 2018-03-30 2018-10-16 哈尔滨理工大学 一种基于对抗式生成网络的宫颈细胞图像分割方法
CN109147932B (zh) * 2018-06-11 2020-11-10 武汉海星通技术股份有限公司 癌细胞her2基因扩增分析方法及系统
CN108982500B (zh) * 2018-07-03 2020-07-14 怀光智能科技(武汉)有限公司 一种宫颈液基细胞学智能辅助阅片方法和系统
CN109087283B (zh) * 2018-07-03 2021-03-09 怀光智能科技(武汉)有限公司 基于细胞团的宫颈细胞病理切片病变细胞识别方法及系统
CN109100253B (zh) * 2018-07-05 2021-04-09 超威电源集团有限公司 铅酸蓄电池隔板的检测方法
CN109102498B (zh) * 2018-07-13 2022-04-22 华南理工大学 一种宫颈涂片图像中簇型细胞核分割的方法
CN109377486B (zh) * 2018-10-15 2020-11-06 易普森智慧健康科技(深圳)有限公司 一种宫颈液基细胞有效图像的判别方法及系统
CN109599166A (zh) * 2018-11-28 2019-04-09 武汉大学人民医院(湖北省人民医院) 基于深度学习的睑板腺红外图像辅助识别系统及方法
CN109801303A (zh) * 2018-12-18 2019-05-24 北京羽医甘蓝信息技术有限公司 在胸水荧光图像中分割细胞的方法和装置
CN109785321A (zh) * 2019-01-30 2019-05-21 杭州又拍云科技有限公司 基于深度学习和Gabor滤波器的睑板腺区域提取方法
CN110148455B (zh) * 2019-05-22 2023-09-26 柯晶 宫颈液基薄片图像之炎性细胞消除方法
CN110334604A (zh) * 2019-06-06 2019-10-15 广州金域医学检验中心有限公司 细胞展示方法、装置、计算机设备和计算机可读存储介质
CN110347727B (zh) * 2019-07-19 2023-04-07 南京梅花软件系统股份有限公司 基于多层级互信息的健康与空气质量数据相关性的过滤方法
CN110736747B (zh) * 2019-09-03 2022-08-19 深思考人工智能机器人科技(北京)有限公司 一种细胞液基涂片镜下定位的方法及系统
CN110610506B (zh) * 2019-09-17 2022-11-29 北京中环易达设施园艺科技有限公司 一种基于图像处理技术的姬松茸子实体生长参数检测方法
CN110706225B (zh) * 2019-10-14 2020-09-04 山东省肿瘤防治研究院(山东省肿瘤医院) 基于人工智能的肿瘤识别系统
CN112257681A (zh) * 2019-12-06 2021-01-22 珠海圣美生物诊断技术有限公司 细胞判读方法及系统
CN111429761B (zh) * 2020-02-28 2022-10-21 中国人民解放军陆军军医大学第二附属医院 一种骨髓细胞形态学人工智能模拟教学系统及其方法
CN111275016B (zh) * 2020-03-03 2023-05-16 湖南国科智瞳科技有限公司 一种玻片扫描影像采集与分析方法及装置
CN111444829B (zh) * 2020-03-25 2023-08-18 南京航空航天大学 面向液基细胞学检查的融合推理与学习的决策分类方法
CN111598133B (zh) 2020-04-22 2022-10-14 腾讯医疗健康(深圳)有限公司 基于人工智能的图像显示方法、装置、系统、设备及介质
CN111613309A (zh) * 2020-05-20 2020-09-01 深圳市妇幼保健院 乳腺癌超声筛查能力考核装置及系统
CN111795919B (zh) * 2020-05-25 2024-03-26 中国人民解放军陆军军医大学第二附属医院 一种骨髓细胞形态学自动检测系统及其工作方法
CN111739010B (zh) 2020-06-23 2022-06-24 珠海圣美生物诊断技术有限公司 一种检测循环异常细胞的方法及装置
CN111797786B (zh) * 2020-07-09 2024-06-25 郑州中普医疗器械有限公司 用于离体生物样本的检测方法及四分类、计算机设备和计算机可读存储介质
CN111932507B (zh) * 2020-07-31 2021-04-09 苏州慧维智能医疗科技有限公司 一种基于消化内镜实时识别病变的方法
CN112070722A (zh) * 2020-08-14 2020-12-11 厦门骁科码生物科技有限公司 一种荧光原位杂交细胞核分割方法及系统
CN112378837B (zh) * 2020-09-15 2021-12-28 深圳市华中生物药械有限公司 一种宫颈脱落细胞检测方法及相关装置
CN112446427B (zh) * 2020-11-27 2021-07-27 王伟佳 一种髓系血细胞识别方法、装置、存储介质和电子设备
CN115393371A (zh) * 2021-05-19 2022-11-25 上海浚真生命科学有限公司 图像处理方法、图像处理设备和光学检测装置
CN113516061B (zh) * 2021-06-23 2022-04-29 南开大学 一种基于机器学习的pc12细胞状态识别的方法
CN113920095A (zh) * 2021-07-05 2022-01-11 深圳科亚医疗科技有限公司 用于宫颈图像的分析管理的装置和方法、设备及存储介质
CN114283408A (zh) * 2021-12-27 2022-04-05 山东众阳健康科技集团有限公司 一种细胞学涂片中挖空细胞的图像识别方法及系统
CN114612333B (zh) * 2022-03-17 2022-12-02 生态环境部长江流域生态环境监督管理局生态环境监测与科学研究中心 一种基于显微镜图像的微囊藻类细胞统计方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1236302C (zh) * 2003-12-19 2006-01-11 武汉大学 一种多光谱细胞涂片自动分析仪及其用于宫颈细胞的分析方法
JP2012500040A (ja) * 2008-08-15 2012-01-05 エスティーアイ・メディカル・システムズ・エルエルシー 子宮頸部画像における血管パターンを強調するための方法
CN202191314U (zh) * 2011-07-07 2012-04-18 广州安必平医药科技有限公司 一次性宫颈细胞采样器

Also Published As

Publication number Publication date
CN102682305A (zh) 2012-09-19

Similar Documents

Publication Publication Date Title
CN102682305B (zh) 宫颈液基细胞学自动筛查方法和系统
US8379961B2 (en) Mitotic figure detector and counter system and method for detecting and counting mitotic figures
CN107274386B (zh) 一种宫颈细胞液基涂片人工智能辅助阅片系统
CN107610114B (zh) 基于支持向量机的光学卫星遥感影像云雪雾检测方法
CN103020639A (zh) 一种白细胞自动识别计数方法
Qing et al. Automated detection and identification of white-backed planthoppers in paddy fields using image processing
Percannella et al. A classification-based approach to segment HEp-2 cells
CN107730499A (zh) 一种基于nu‑支持向量机的白细胞分类方法
CN103679184A (zh) 一种基于相关向量机的白细胞自动识别方法
CN112464942A (zh) 基于计算机视觉的重叠烟叶智能化分级方法
Galsgaard et al. Circular hough transform and local circularity measure for weight estimation of a graph-cut based wood stack measurement
Fatichah et al. Overlapping white blood cell segmentation and counting on microscopic blood cell images
CN113313149B (zh) 一种基于注意力机制和度量学习的菜品识别方法
CN112580748A (zh) 一种对Ki67染色图像癌细胞计数的方法
CN115170518A (zh) 基于深度学习和机器视觉的细胞检测方法及系统
US11790673B2 (en) Method for detection of cells in a cytological sample having at least one anomaly
CN115082776A (zh) 一种基于图像识别的电能表自动检测系统及方法
Mandyartha et al. Global and adaptive thresholding technique for white blood cell image segmentation
Akakin et al. Automated detection of cells from immunohistochemically-stained tissues: Application to Ki-67 nuclei staining
CN117036314A (zh) 一种高密度柔性ic基板氧化区域检测方法
Panicker et al. CNN Based Image Descriptor for Polycystic Ovarian Morphology from Transvaginal Ultrasound
CN112951427B (zh) 异常细胞的分级系统
CN114155399A (zh) 基于多特征融合递进式判别的乳腺病理全切片分类方法
CN114742803A (zh) 一种结合深度学习与数字图像处理算法的血小板聚集检测方法
Nasr-Isfahani et al. A new approach for touching cells segmentation

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant