CN110211108A - 一种新型的基于Feulgen染色方法的异常宫颈细胞自动识别方法 - Google Patents
一种新型的基于Feulgen染色方法的异常宫颈细胞自动识别方法 Download PDFInfo
- Publication number
- CN110211108A CN110211108A CN201910457098.6A CN201910457098A CN110211108A CN 110211108 A CN110211108 A CN 110211108A CN 201910457098 A CN201910457098 A CN 201910457098A CN 110211108 A CN110211108 A CN 110211108A
- Authority
- CN
- China
- Prior art keywords
- nucleus
- pixel
- cervical
- cervical cell
- indicate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 34
- 238000004040 coloring Methods 0.000 title claims abstract description 12
- 230000011218 segmentation Effects 0.000 claims abstract description 21
- 238000013528 artificial neural network Methods 0.000 claims abstract description 8
- 230000008569 process Effects 0.000 claims abstract description 7
- 238000012549 training Methods 0.000 claims abstract description 6
- 238000004043 dyeing Methods 0.000 claims abstract description 5
- 238000013145 classification model Methods 0.000 claims abstract description 4
- 108020004414 DNA Proteins 0.000 claims description 9
- 230000004907 flux Effects 0.000 claims description 9
- 230000003287 optical effect Effects 0.000 claims description 9
- 108091093105 Nuclear DNA Proteins 0.000 claims description 6
- 230000003321 amplification Effects 0.000 claims description 6
- 230000000877 morphologic effect Effects 0.000 claims description 6
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 6
- 230000009467 reduction Effects 0.000 claims description 6
- 230000005856 abnormality Effects 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 3
- 210000003679 cervix uteri Anatomy 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 3
- 239000000203 mixture Substances 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 238000010276 construction Methods 0.000 abstract 1
- 210000004027 cell Anatomy 0.000 description 92
- 210000004940 nucleus Anatomy 0.000 description 45
- 239000011159 matrix material Substances 0.000 description 6
- 238000003745 diagnosis Methods 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 101100280481 Caenorhabditis elegans lbp-2 gene Proteins 0.000 description 2
- 230000001086 cytosolic effect Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000000149 penetrating effect Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 108010077544 Chromatin Proteins 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000001640 apoptogenic effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013016 damping Methods 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000001575 pathological effect Effects 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 210000004881 tumor cell Anatomy 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10056—Microscopic image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30096—Tumor; Lesion
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Radiology & Medical Imaging (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Image Analysis (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明公开了一种新型的基于Feulgen染色方法的异常宫颈细胞自动识别方法。本发明所述自动识别方法通过提取宫颈细胞的特征、训练宫颈细胞分类器从而实现异常宫颈细胞的识别,其中产生宫颈细胞分类器的过程主要分为四个步骤,步骤一:使用Feulgen染色方法对宫颈细胞玻片进行染色,并使用显微镜自动扫描玻片产生数字化视野图;步骤二:使用Surf算法结合RegionGrowing算法分割视野图中的宫颈细胞核;步骤三:提取细胞核的DNA含量信息及细胞核形态特征、宫颈细胞图片纹理特征等,并构建特征向量用于表征每个宫颈细胞的异常程度;步骤四:基于特征向量构建并训练神经网络分类模型,得到宫颈细胞分类器。最后,使用训练好的宫颈细胞分类器预测新的宫颈细胞特征向量,从而实现识别异常宫颈细胞的目的。实验表明,本发明基于Feulgen染色方法的异常宫颈细胞自动识别方法能够以较高的精度和效率完成对异常宫颈细胞的识别任务,并且本发明所述自动识别方法已经应用于现实的产品之中,具有较高的实用价值。
Description
技术领域
本发明涉及一种基于深度学习的异常宫颈细胞自动识别方法,属于机器学习神经网络模型在医疗诊断中的应用。
背景技术
很多研究表明,异常宫颈细胞的细胞核通常发生很明显的变化,比如异常宫颈细胞核在形态结构、纹理特征、DNA含量等方面都和正常宫颈细胞核具有较明显的区别,异常宫颈细胞核通常会呈现出较大的异型性,大小不一、形状各异;在纹理层面上,由于细胞核分裂异常,导致染色质固缩成块,纹理粗糙,另外这也会导致细胞核内部DNA含量增加。上述宫颈细胞核的异常特征为计算机根据宫颈细胞核识别异常宫颈细胞提供了病理学基础。
目前很多研究同时基于宫颈细胞核与细胞质的特征来识别异常宫颈细胞,大致分为两种方法,方法一:不手动提取宫颈细胞的特征,直接基于深度学习技术,使用卷积神经网络模型自动提取宫颈细胞图像的特征,然后构建宫颈细胞分类器,从而检测异常宫颈细胞。但是由于深度学习缺乏可解释性,所提取的特征意义不明确,导致这种方法并不能一直保持良好的性能。方法二:手动对宫颈细胞核和宫颈细胞整体轮廓进行分割,然后提取细胞核与细胞质的各种形态特征、纹理特征等。但是由于宫颈细胞玻片制片或者染色的问题,导致宫颈细胞常常高度堆积重叠,这为宫颈细胞质的分割带来了很大的困难,细胞分割不准确会导致所提取的宫颈细胞的特征不准确,所以方法二的奏效与否严重依赖于宫颈细胞的准确分割。
异常宫颈细胞核的DNA含量相对于正常宫颈细胞而言通常会有显著的增加,特别是对于高度病变细胞及癌变细胞而言,DNA含量增加的幅度会更加明显,所以这是区分异常宫颈细胞的显著特征。然而目前在很多异常宫颈细胞自动化识别的研究中,还没有研究者将细胞核DNA含量特征用于异常宫颈细胞的自动识别。综上所述,目前急迫的需要一种能够有效地挖掘并利用宫颈细胞的异常特征、可解释性高、能够一直保持较高的诊断精度及具有较高诊断效率的异常宫颈细胞自动诊断方法。
发明内容
本发明的目的在于提供一种新型的基于Feulgen染色方法的异常宫颈细胞自动识别方法,它能够有效地解决技术背景中存在的问题。
为实现上述目标,本发明提供如下技术方案:一种新型的基于Feulgen染色方法的异常宫颈细胞自动识别方法,该方法通过提取宫颈细胞的特征、训练宫颈细胞分类器从而识别出异常宫颈细胞,其中产生宫颈细胞分类器的过程分为四个步骤:
步骤一:使用Feulgen染色方法对宫颈细胞玻片进行染色,并使用显微镜自动扫描玻片产生数字化视野图,结果记为SliceImages;
步骤二:依次处理SliceImages中包含的所有视野图,分割出视野图中的宫颈细胞核,得到所有宫颈细胞核的轮廓,记为NucleusContours;
步骤三:依次处理NucleusContours中每一个宫颈细胞核的轮廓,结合该细胞核所在视野图中的局部像素信息,计算该细胞的特征向量,记为FeatureVector,用来表征该宫颈细胞的异常病变程度。
步骤四:对FeatureVector进行最大值归一化及PCA降维预处理。
步骤五:基于步骤四中所处理的FeatureVector构建并训练神经网络分类模型,得到宫颈细胞分类器。
进一步,所述的视野图采用固定大小为1280×1280×3,该图像是在显微镜下采图所得,显微镜目镜放大倍数为10,物镜放大倍数为20,视野图总的放大倍数为200。
进一步,所述的分割视野图中的宫颈细胞核,包括如下三个分割步骤:
步骤一:使用Surf算法定位视野图中的所有宫颈细胞核质心坐标,结果记为NucleusPositions;
步骤二:将NucleusPositions中所有的坐标点作为RegionGrowing算法的种子点,使用区域生长算法得到宫颈细胞核的粗分割区域,结果记为NucleusRoughRegions;
步骤三:依次处理NucleusRoughRegions中每个细胞核的粗分割区域,使用孔洞填充算法填充细胞核粗分割区域中可能存在的孔洞,从而得到细胞核的细分割区域,最后提取所有细分割区域的轮廓,即得到细胞核的精确轮廓,记为NucleusContours。
进一步,所述的宫颈细胞核的特征向量,主要包括三个部分,分别是细胞核的DNA含量特征、细胞核的形态特征、宫颈细胞的纹理特征,其中DNA含量特征的维度数为1,细胞核形态特征的维度数为12,宫颈细胞纹理特征的维度数为126,即宫颈细胞特征向量的总维度为139。
所述的使用Surf算法定位视野图中的宫颈细胞核,其中Surf算法是由Sift算法发展而来,Sift算法定位特征点的步骤如下所示:
(1)、构建尺度空间,检测极值点,获得尺度不变性;
(2)、特征点过滤并进行精确定位;
所以Surf/Sift算法所提取的特征点特征稳定,具有旋转不变性、尺度不变性、仿射不变性等优点。Surf算法相对于Sift算法的改进之处在于Surf算法改进了特征的提取和描述方式,具体而言就是构建Hessian(黑塞矩阵)来生成所有的兴趣点,并用于特征的提取。对于图像中的每个像素点都可以求出一个Hessian矩阵,如下所示:
Hessian矩阵的判别式为:
满足如下条件的像素点被认为是备选的特征点:
det(H)>hessian_thresh
所述的区域增长算法,将相邻像素点包含进生长结果中的准则如下所示:
其中Ω表示以待生长像素点为中心,以L为边长的正方形区域。SeedGray表示种子像素点灰度值大小,ThreshGray表示设置的灰度值阈值。
所述的细胞核DNA含量,它使用积分光密度(IOD值)来表示,IOD的计算公式如下所示:
ODi=log(LuminousE/LuminousO)
IOD本质上是对一定区域内所有像素点光密度求和,其中ODi表示第i个像素点的光密度,其定义为通过像素点之前与之后光通量比值的对数,其中LuminousE表示通过像素点之前的光通量,LuminousO表示通过像素点之后的光通量。
所述的细胞核的形态特征,主要包括:细胞核面积、周长、主轴长度、次轴长度、长半径、短半径、紧凑度、偏心率、圆形度、惯性矩、一维分形面积、二维分形面积,其中部分特征值定义如下所示:
面积:细胞核轮廓内部像素点个数,记为Area;
周长:细胞核轮廓周长,记为Perimeter;
惯性矩:以细胞核的质心坐标为中心构建平面直角坐标系,细胞核(关于x轴)的惯性矩计算如下所示:
其中A表示细胞核轮廓内部像素点集合。
4)、一维分形面积:
5)、二维分形面积:
式中,L=X/2,M=Y/2;D’i,j是原图像中(2i-1,2j-1)~(2i,2j)四个像素点的光密度平均值;Ω’i,j为这四个像素点组成的新掩码,即这四个像素点中只要有一个为细胞核像素,则掩码值为1,否则为0。
偏心率:
e=cellipse/aellipse
其中cellipse表示细胞核最小拟合椭圆的焦点间距,aellipse表示细胞核最小拟合椭圆的长轴长度。
所述的细胞的纹理特征,主要包括:36维具有旋转不变性的LBP纹理特征、4维基于灰度共生矩阵的纹理特征(包括:对比度、能量、熵、逆差矩)、40维Gobar滤波均值、40维Gobar滤波方差、亮点面积、暗点面积、亮点占比、暗点占比、亮点偏心度、暗点偏心度,其中部分特征值定义如下所示:
1)、亮点面积:
其中,Ω表示表示细胞核轮廓内部所有的像素点集合,pi表示Ω内部任意一个像素点的灰度值,该式表示细胞核内部满足灰度值大于threshHigh的像素点表示亮点。
2)、暗点面积:
其中,Ω表示表示细胞核轮廓内部所有的像素点集合,pi表示Ω内部任意一个像素点的灰度值,该式表示细胞核内部满足灰度值小于threshDark的像素点表示暗点。
3)、亮点占比:
4)、暗点占比:
5)、亮点偏心度:
e=cHighEllipse/aHighEllipse
其中cHighEllipse表示亮点集合HighSpot最小拟合椭圆的焦点间距,aHighEllipse表示亮点集合HighSpot最小拟合椭圆的长轴长度。
6)、暗点偏心度:
e=cDarkEllipse/aDarkEllipse
其中cDarkEllipse表示暗点集合DarkSpot最小拟合椭圆的焦点间距,aDarkEllipse表示暗点集合DarkSpot最小拟合椭圆的长轴长度。
所述36维具有旋转不变性的LBP纹理特征是在相应的LBP纹理图像的基础上得来,具有旋转不变性的LBP纹理图像中每个像素点是根据相应位置原图中像素点和周围邻域像素点像素值差异情况决定。对于原图中的每一个像素点,本发明采用半径为R的圆形作为其邻域,并从每一个目标像素点的邻域中随机采样P个像素点用于计算该目标像素点的lbp纹理值。确定LBP纹理图像之后,本发明将灰度值区间[0,255]均匀等分为L个子区间,然后依次求该LBP纹理图像中像素值落入各个子区间中像素点的个数,记为:lpb1、lbp2……、lbp36,即得到本发明中36维具有旋转不变性的纹理特征。优选地,R=3,P=8。
进一步,所述的基于灰度共生矩阵的纹理特征包括对比度、能量、熵、逆差矩4个特征值,对比度定义为:
能量:
熵:
逆差矩:
进一步,所述的宫颈细胞分类器是由全连接神经网络构建的分类模型,一共包含5个全连接层,分别为:1个输入层,3个隐藏层,1个输出层。其中输入层节点个数为41,表示通过PCA算法降维之后的特征向量的维数;三个隐藏层的节点分别为82、82、82;输出层的节点个数为2,表示本发明异常宫颈细胞自动识别方法分类器的分类类别数为2,分别对应于正常宫颈细胞和异常宫颈细胞。
与现有技术相比,本发明的有益效果是:
1、首次将宫颈细胞核DNA含量信息用于异常宫颈细胞的自动诊断;
2、本发明仅仅根据细胞核的异常特征来识别异常宫颈细胞,无需分割出宫颈细胞的完整轮廓,简化了分割的难度,提高了诊断方法的效率;
3、本发明结合宫颈细胞病理学知识,首次提出了包括细胞核DNA含量、细胞核形态特征、纹理特征等139维的特征组合,从而能够很好的表征宫颈细胞的异常病变程度。
4、本发明针对宫颈细胞分类任务,设计并提出了一种高效的神经网络模型,实现了对异常宫颈细胞精确高效的识别。
附图说明
图1是本发明的工作流程图。
图2是使用本发明中视野图示例图像。
图3是使用本发明细胞核分割算法流程图。
图4是本发明使用Surf算法细胞核定位结果示例图。
图5是本发明细胞核分割结果示例图。
图6是本发明宫颈细胞分类器所使用的神经网络结构图。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1-6,本发明提供如下技术方案:一种新型的基于Feulgen染色方法的异常宫颈细胞自动识别方法,该方法通过提取宫颈细胞的特征、训练宫颈细胞分类器从而识别出异常宫颈细胞,其中产生宫颈细胞分类器的过程分为四个步骤:
步骤一:使用Feulgen染色方法对宫颈细胞玻片进行染色,并使用显微镜自动扫描玻片产生数字化视野图,结果记为SliceImages;
步骤二:依次处理SliceImages中包含的所有视野图,分割出视野图中的宫颈细胞核,得到所有宫颈细胞核的轮廓,记为NucleusContours;
步骤三:依次处理NucleusContours中每一个宫颈细胞核的轮廓,结合该细胞核所在视野图中的局部像素信息,计算该细胞的特征向量,记为FeatureVector,用来表征该宫颈细胞的异常病变程度。
步骤四:对FeatureVector进行最大值归一化及PCA降维预处理。
步骤五:基于步骤四中所处理的FeatureVector构建并训练神经网络分类模型,得到宫颈细胞分类器。
进一步,所述的视野图采用固定大小为1280×1280×3,该图像是在显微镜下采图所得,显微镜目镜放大倍数为10,物镜放大倍数为20,视野图总的放大倍数为200。
进一步,所述的分割视野图中的宫颈细胞核,包括如下三个分割步骤:
步骤一:使用Surf算法定位视野图中的所有宫颈细胞核质心坐标,结果记为NucleusPositions;
步骤二:将NucleusPositions中所有的坐标点作为RegionGrowing算法的种子点,使用区域生长算法得到宫颈细胞核的粗分割区域,结果记为NucleusRoughRegions;
步骤三:依次处理NucleusRoughRegions中每个细胞核的粗分割区域,使用孔洞填充算法填充细胞核粗分割区域中可能存在的孔洞,从而得到细胞核的细分割区域,最后提取所有细分割区域的轮廓,即得到细胞核的精确轮廓,记为NucleusContours。
进一步,所述的宫颈细胞特征向量,主要包括三个部分,分别是细胞核的DNA含量特征、细胞核的形态特征、宫颈细胞的纹理特征,其中DNA含量特征的维度数为1,细胞核形态特征的维度数为12,宫颈细胞纹理特征的维度数为126,即宫颈细胞特征向量的总维度为139。
所述的使用Surf算法定位视野图中的宫颈细胞核,其中Surf算法是由Sift算法发展而来,Sift算法定位特征点的步骤如下所示:
(1)、构建尺度空间,检测极值点,获得尺度不变性;
(2)、特征点过滤并进行精确定位;
所以Surf/Sift算法所提取的特征点特征稳定,具有旋转不变性、尺度不变性、仿射不变性等优点。Surf算法相对于Sift算法的改进之处在于Surf算法改进了特征的提取和描述方式,具体而言就是构建Hessian(黑塞矩阵)来生成所有的兴趣点,并用于特征的提取。对于图像中的每个像素点都可以求出一个Hessian矩阵,如下所示:
Hessian矩阵的判别式为:
满足如下条件的像素点被认为是备选的特征点:
det(H)>hessian_thresh
优选地,本发明Surf算法hessian_thresh取值为66。
所述的区域增长算法,将相邻像素点包含进生长结果中的准则如下所示:
其中Ω表示以待生长像素点为中心,以L为边长的正方形区域。SeedGray表示种子像素点灰度值大小,ThreshGray表示设置的灰度值阈值,优选地本发明中ThreshGray取值为10。
所述的细胞核DNA含量使用积分光密度(IOD值)来表示,IOD的计算公式如下所示:
ODi=log(LuminousE/LuminousO)
IOD本质上是对一定区域内所有像素点光密度求和,其中ODi表示第i个像素点的光密度,其定义为通过像素点之前与之后光通量比值的对数,其中LuminousE表示通过像素点之前的光通量,LuminousO表示通过像素点之后的光通量。
所述的细胞核的形态特征主要包括:细胞核面积、周长、主轴长度、次轴长度、长半径、短半径、紧凑度、偏心率、圆形度、惯性矩、一维分形面积、二维分形面积,其中部分特征值定义如下所示:
面积:细胞核轮廓内部像素点个数,记为Area;
周长:细胞核轮廓周长,记为Perimeter;
惯性矩:以细胞核的质心坐标为中心构建平面直角坐标系,细胞核(关于x轴)的惯性矩计算如下所示:
其中A表示细胞核轮廓内部像素点集合。
4)、一维分形面积:
5)、二维分形面积:
式中,L=X/2,M=Y/2;D’i,j是原图像中(2i-1,2j-1)~(2i,2j)四个像素点的光密度平均值;Ω’i,j为这四个像素点组成的新掩码,即这四个像素点中只要有一个为细胞核像素,则掩码值为1,否则为0。
偏心率:
e=cellipse/aellipse
其中cellipse表示细胞核最小拟合椭圆的焦点间距,aellipse表示细胞核最小拟合椭圆的长轴长度。
所述的细胞的纹理特征主要包括:36维具有旋转不变性的LBP纹理特征、4维基于灰度共生矩阵的纹理特征(包括:对比度、能量、熵、逆差矩)、40维Gobar滤波均值、40维Gobar滤波方差、亮点面积、暗点面积、亮点占比、暗点占比、亮点偏心度、暗点偏心度,其中部分特征值定义如下所示:
1)、亮点面积:
其中,Ω表示表示细胞核轮廓内部所有的像素点集合,pi表示Ω内部任意一个像素点的灰度值,该式表示细胞核内部满足灰度值大于threshHigh的像素点表示亮点。
2)、暗点面积:
其中,Ω表示表示细胞核轮廓内部所有的像素点集合,pi表示Ω内部任意一个像素点的灰度值,该式表示细胞核内部满足灰度值小于threshDark的像素点表示暗点。
3)、亮点占比:
4)、暗点占比:
5)、亮点偏心度:
e=cHighEllipse/aHighEllipse
其中cHighEllipse表示亮点集合HighSpot最小拟合椭圆的焦点间距,aHighEllipse表示亮点集合HighSpot最小拟合椭圆的长轴长度。
6)、暗点偏心度:
e=cDarkEllipse/aDarkEllipse
其中cDarkEllipse表示暗点集合DarkSpot最小拟合椭圆的焦点间距,aDarkEllipse表示暗点集合DarkSpot最小拟合椭圆的长轴长度。
所述36维具有旋转不变性的LBP纹理特征是在相应的LBP纹理图像的基础上得来,具有旋转不变性的LBP纹理图像中每个像素点是根据相应位置原图中像素点和周围邻域像素点像素值差异情况决定。对于原图中的每一个像素点,本发明采用半径为R的圆形作为其邻域,并从每一个目标像素点的邻域中随机采样P个像素点用于计算该目标像素点的lbp纹理值。确定LBP纹理图像之后,本发明将灰度值区间[0,255]均匀等分为L个子区间,然后依次求该LBP纹理图像中像素值落入各个子区间中像素点的个数,记为:lpb1、lbp2……、lbp36,即得到本发明中36维具有旋转不变性的纹理特征。优选地,R=3,P=8。
进一步,所述的基于灰度共生矩阵的纹理特征包括对比度、能量、熵、逆差矩4个特征值,对比度定义为:
能量:
熵:
逆差矩:
进一步,所述对特征向量进行PCA降维处理,优选地,本发明PCA算法保留特征向量中95%的方差(本发明中特征向量的维度大约降低到原始特征向量维度的1/5)。
进一步,所述的宫颈细胞分类器是由全连接神经网络构建的分类模型,一共包含5个全连接层,分别为:1个输入层,3个隐藏层,1个输出层。其中输入层节点个数为41,表示通过PCA算法降维之后的特征向量的维数;三个隐藏层的节点分别为82、82、82;输出层的节点个数为2,表示本发明异常宫颈细胞自动识别方法分类器的分类类别数为2,分别对应于正常宫颈细胞和异常宫颈细胞。
进一步,本发明在训练宫颈细胞分类器的过程中使用了交叉熵作为损失函数;优选地,设置了40个epoch,表示完整遍历训练集40遍;使用了SGD优化器,优选地,学习率设置为0.01,并且对学习率使用了指数衰减,学习率每5个epoch衰减为当前学习率的0.94。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围有所附权利要求及其等同物限定。
Claims (9)
1.一种新型的基于Feulgen染色方法的异常宫颈细胞自动识别方法,其特征在于,该方法通过提取宫颈细胞的特征、训练宫颈细胞分类器从而识别出异常宫颈细胞,其中产生宫颈细胞分类器的过程分为四个步骤:
步骤一:使用Feulgen染色方法对宫颈细胞玻片进行染色,并使用显微镜自动扫描玻片产生数字化视野图,结果记为SliceImages;
步骤二:依次处理SliceImages中包含的所有视野图,分割出视野图中的宫颈细胞核,得到所有宫颈细胞核的轮廓,记为NucleusContours;
步骤三:依次处理NucleusContours中每一个宫颈细胞核的轮廓,结合该细胞核所在视野图中的局部像素信息,计算该细胞的特征向量,记为FeatureVector,用来表征该宫颈细胞的异常病变程度。
步骤四:对FeatureVector进行最大值归一化及PCA降维预处理。
步骤五:基于步骤四中所处理的FeatureVector构建并训练神经网络分类模型,得到宫颈细胞分类器。
2.根据权利要求1步骤一中所述的视野图,其特征在于视野图采用固定大小为1280×1280×3,该图像是在显微镜下采图所得,显微镜目镜放大倍数为10,物镜放大倍数为20,视野图总的放大倍数为200。
3.根据权利要求1步骤二中所述的分割视野图中的宫颈细胞核,其特征在于,包括如下三个步骤:
步骤一:使用Surf算法定位视野图中的所有宫颈细胞核质心坐标,结果记为NucleusPositions;
步骤二:将NucleusPositions中所有的坐标点作为RegionGrowing算法的种子点,使用区域生长算法得到宫颈细胞核的粗分割区域,结果记为NucleusRoughRegions;
步骤三:依次处理NucleusRoughRegions中每个细胞核的粗分割区域,使用孔洞填充算法填充细胞核粗分割区域中可能存在的孔洞,从而得到细胞核的细分割区域,最后提取所有细分割区域的轮廓,即得到细胞核的精确轮廓,记为NucleusContours。
4.根据权利要求1步骤三中所述的宫颈细胞特征向量,其特征在于主要包括三个部分,分别是细胞核的DNA含量特征、细胞核的形态特征、宫颈细胞的纹理特征,其中DNA含量特征的维度数为1,细胞核形态特征的维度数为12,宫颈细胞纹理特征的维度数为126,即宫颈细胞特征向量的总维度为139。
5.根据权利要求3步骤二中所述的区域增长算法,其特征在于,将相邻像素点包含进生长结果中的准则如下所示:
其中Ω表示以待生长像素点为中心,以L为边长的正方形区域;SeedGray表示种子像素点灰度值大小,ThreshGray表示设置的灰度值阈值。
6.根据权利要求4中所述的细胞核DNA含量,其特征在于它使用积分光密度(IOD值)来表示,IOD的计算公式如下所示:
ODi=log(LuminousE/LuminousO)
IOD本质上是对一定区域内所有像素点光密度求和,其中ODi表示第i个像素点的光密度,其定义为通过像素点之前与之后光通量比值的对数,其中LuminousE表示通过像素点之前的光通量,LuminousO表示通过像素点之后的光通量。
7.根据权利要求4中所述的细胞核的形态特征,其特征在于主要包括:细胞核面积、周长、主轴长度、次轴长度、长半径、短半径、紧凑度、偏心率、圆形度、惯性矩、一维分形面积、二维分形面积,其中部分特征值定义如下所示:
1)、面积:细胞核轮廓内部像素点个数,记为Area;
2)、周长:细胞核轮廓周长,记为Perimeter;
3)、惯性矩:以细胞核的质心坐标为中心构建平面直角坐标系,细胞核(关于x轴)的惯性矩计算如下所示:
Iz=∫Ay2dA
其中A表示细胞核轮廓内部像素点集合。
4)、一维分形面积:
5)、二维分形面积:
式中,L=X/2,M=Y/2;D’i,j是原图像中(2i-1,2j-1)~(2i,2j)四个像素点的光密度平均值;Ω’i,j为这四个像素点组成的新掩码,即这四个像素点中只要有一个为细胞核像素,则掩码值为1,否则为0。
偏心率:
e=cellipse/aellipse
其中cellipse表示细胞核最小拟合椭圆的焦点间距,aellipse表示细胞核最小拟合椭圆的长轴长度。
8.根据权利要求4中所述的细胞的纹理特征,其特征在于主要包括:36维具有旋转不变性的LBP纹理特征、4维基于灰度共生矩阵的纹理特征(包括:对比度、能量、熵、逆差矩)、40维Gobar滤波均值、40维Gobar滤波方差、亮点面积、暗点面积、亮点占比、暗点占比、亮点偏心度、暗点偏心度,其中部分特征值定义如下所示:
1)、亮点面积:
其中,Ω表示表示细胞核轮廓内部所有的像素点集合,pi表示Ω内部任意一个像素点的灰度值,该式表示细胞核内部满足灰度值大于threshHigh的像素点表示亮点。
2)、暗点面积:
其中,Ω表示表示细胞核轮廓内部所有的像素点集合,pi表示Ω内部任意一个像素点的灰度值,该式表示细胞核内部满足灰度值小于threshDark的像素点表示暗点。
3)、亮点占比:
4)、暗点占比:
5)、亮点偏心度:
e=cHighEllipse/aHighEllipse
其中cHighEllipse表示亮点集合HighSpot最小拟合椭圆的焦点间距,aHighEllipse表示亮点集合HighSpot最小拟合椭圆的长轴长度。
6)、暗点偏心度:
e=cDarkEllipse/aDarkEllipse
其中cDarkEllipse表示暗点集合DarkSpot最小拟合椭圆的焦点间距,aDarkEllipse表示暗点集合DarkSpot最小拟合椭圆的长轴长度。
9.根据权利要求1步骤五中所述的宫颈细胞分类器,其特征在于,是由全连接神经网络构建的分类模型,一共包含5个全连接层,分别为:1个输入层,3个隐藏层,1个输出层。其中输入层节点个数为41,表示通过PCA算法降维之后的特征向量的维数;三个隐藏层的节点分别为82、82、82;输出层的节点个数为2,表示本发明异常宫颈细胞自动识别方法分类器的分类类别数为2,分别对应于正常宫颈细胞和异常宫颈细胞。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910457098.6A CN110211108A (zh) | 2019-05-29 | 2019-05-29 | 一种新型的基于Feulgen染色方法的异常宫颈细胞自动识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910457098.6A CN110211108A (zh) | 2019-05-29 | 2019-05-29 | 一种新型的基于Feulgen染色方法的异常宫颈细胞自动识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110211108A true CN110211108A (zh) | 2019-09-06 |
Family
ID=67789446
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910457098.6A Pending CN110211108A (zh) | 2019-05-29 | 2019-05-29 | 一种新型的基于Feulgen染色方法的异常宫颈细胞自动识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110211108A (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110853021A (zh) * | 2019-11-13 | 2020-02-28 | 江苏迪赛特医疗科技有限公司 | 一种病理鳞状上皮细胞的检测分类模型的构建 |
CN110879999A (zh) * | 2019-11-14 | 2020-03-13 | 武汉兰丁医学高科技有限公司 | 基于手机的微型显微图像采集装置及图像拼接、识别方法 |
CN110992303A (zh) * | 2019-10-29 | 2020-04-10 | 平安科技(深圳)有限公司 | 一种异常细胞筛选方法、装置、电子设备和存储介质 |
CN111126162A (zh) * | 2019-11-28 | 2020-05-08 | 东软集团股份有限公司 | 一种识别图像中炎症细胞的方法、装置及存储介质 |
CN111539354A (zh) * | 2020-04-27 | 2020-08-14 | 易普森智慧健康科技(深圳)有限公司 | 一种液基细胞玻片扫描区域识别方法 |
CN111767809A (zh) * | 2020-06-18 | 2020-10-13 | 湖南理工学院 | 一种基于激光共聚焦显微技术的细胞智能识别方法 |
CN112257711A (zh) * | 2020-10-26 | 2021-01-22 | 哈尔滨市科佳通用机电股份有限公司 | 一种铁路货车地板破损故障检测方法 |
CN112396583A (zh) * | 2020-11-18 | 2021-02-23 | 深思考人工智能机器人科技(北京)有限公司 | 一种基于巴氏染色方式的dna倍体定量分析的方法及系统 |
CN112508909A (zh) * | 2020-12-03 | 2021-03-16 | 中国人民解放军陆军军医大学第二附属医院 | 一种外周血细胞形态学自动检测系统的疾病联想方法 |
CN112750493A (zh) * | 2020-12-22 | 2021-05-04 | 深思考人工智能机器人科技(北京)有限公司 | 基于巴氏染色方式的dna倍体定量分析方法及系统 |
CN113034448A (zh) * | 2021-03-11 | 2021-06-25 | 电子科技大学 | 一种基于多示例学习的病理图像细胞识别方法 |
CN113705318A (zh) * | 2021-04-22 | 2021-11-26 | 腾讯科技(深圳)有限公司 | 基于图像的识别方法、装置、设备及可读存储介质 |
CN113743186A (zh) * | 2021-06-15 | 2021-12-03 | 腾讯医疗健康(深圳)有限公司 | 医学图像的处理方法、装置、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101492740A (zh) * | 2009-02-24 | 2009-07-29 | 武汉兰丁医学高科技有限公司 | 细胞定量分析中细胞核dna物质含量的准确测量方法 |
CN107478818A (zh) * | 2017-08-15 | 2017-12-15 | 曾真 | 一种细胞分析设备及分析方法 |
CN107730499A (zh) * | 2017-10-31 | 2018-02-23 | 河海大学 | 一种基于nu‑支持向量机的白细胞分类方法 |
CN109033936A (zh) * | 2018-06-01 | 2018-12-18 | 齐鲁工业大学 | 一种宫颈脱落细胞核图像识别方法 |
CN109360187A (zh) * | 2018-09-10 | 2019-02-19 | 天津大学 | 淋巴细胞切片癌细胞检测器 |
-
2019
- 2019-05-29 CN CN201910457098.6A patent/CN110211108A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101492740A (zh) * | 2009-02-24 | 2009-07-29 | 武汉兰丁医学高科技有限公司 | 细胞定量分析中细胞核dna物质含量的准确测量方法 |
CN107478818A (zh) * | 2017-08-15 | 2017-12-15 | 曾真 | 一种细胞分析设备及分析方法 |
CN107730499A (zh) * | 2017-10-31 | 2018-02-23 | 河海大学 | 一种基于nu‑支持向量机的白细胞分类方法 |
CN109033936A (zh) * | 2018-06-01 | 2018-12-18 | 齐鲁工业大学 | 一种宫颈脱落细胞核图像识别方法 |
CN109360187A (zh) * | 2018-09-10 | 2019-02-19 | 天津大学 | 淋巴细胞切片癌细胞检测器 |
Non-Patent Citations (3)
Title |
---|
杨磊: "《数字媒体技术概论》", 30 September 2017, 中国铁道出版社 * |
金飞等: "《遥感影像纹理分析与应用》", 30 November 2018, 测绘出版社 * |
高宏伟等: "《电子封装工艺与装备技术基础教程》", 30 June 2017, 西安电子科技大学出版社 * |
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110992303A (zh) * | 2019-10-29 | 2020-04-10 | 平安科技(深圳)有限公司 | 一种异常细胞筛选方法、装置、电子设备和存储介质 |
CN110992303B (zh) * | 2019-10-29 | 2023-12-22 | 平安科技(深圳)有限公司 | 一种异常细胞筛选方法、装置、电子设备和存储介质 |
WO2021082434A1 (zh) * | 2019-10-29 | 2021-05-06 | 平安科技(深圳)有限公司 | 一种异常细胞筛选方法、装置、电子设备和存储介质 |
CN110853021A (zh) * | 2019-11-13 | 2020-02-28 | 江苏迪赛特医疗科技有限公司 | 一种病理鳞状上皮细胞的检测分类模型的构建 |
CN110879999A (zh) * | 2019-11-14 | 2020-03-13 | 武汉兰丁医学高科技有限公司 | 基于手机的微型显微图像采集装置及图像拼接、识别方法 |
CN110879999B (zh) * | 2019-11-14 | 2020-08-25 | 武汉兰丁智能医学股份有限公司 | 基于手机的微型显微图像采集装置及图像拼接、识别方法 |
CN111126162A (zh) * | 2019-11-28 | 2020-05-08 | 东软集团股份有限公司 | 一种识别图像中炎症细胞的方法、装置及存储介质 |
CN111539354A (zh) * | 2020-04-27 | 2020-08-14 | 易普森智慧健康科技(深圳)有限公司 | 一种液基细胞玻片扫描区域识别方法 |
CN111767809A (zh) * | 2020-06-18 | 2020-10-13 | 湖南理工学院 | 一种基于激光共聚焦显微技术的细胞智能识别方法 |
CN112257711B (zh) * | 2020-10-26 | 2021-04-09 | 哈尔滨市科佳通用机电股份有限公司 | 一种铁路货车地板破损故障检测方法 |
CN112257711A (zh) * | 2020-10-26 | 2021-01-22 | 哈尔滨市科佳通用机电股份有限公司 | 一种铁路货车地板破损故障检测方法 |
CN112396583A (zh) * | 2020-11-18 | 2021-02-23 | 深思考人工智能机器人科技(北京)有限公司 | 一种基于巴氏染色方式的dna倍体定量分析的方法及系统 |
CN112396583B (zh) * | 2020-11-18 | 2024-01-26 | 深思考人工智能机器人科技(北京)有限公司 | 一种基于巴氏染色方式的dna倍体定量分析的方法及系统 |
CN112508909A (zh) * | 2020-12-03 | 2021-03-16 | 中国人民解放军陆军军医大学第二附属医院 | 一种外周血细胞形态学自动检测系统的疾病联想方法 |
CN112508909B (zh) * | 2020-12-03 | 2023-08-25 | 中国人民解放军陆军军医大学第二附属医院 | 一种外周血细胞形态学自动检测系统的疾病联想方法 |
CN112750493A (zh) * | 2020-12-22 | 2021-05-04 | 深思考人工智能机器人科技(北京)有限公司 | 基于巴氏染色方式的dna倍体定量分析方法及系统 |
CN112750493B (zh) * | 2020-12-22 | 2024-05-03 | 深思考人工智能机器人科技(北京)有限公司 | 基于巴氏染色方式的dna倍体定量分析方法及系统 |
CN113034448A (zh) * | 2021-03-11 | 2021-06-25 | 电子科技大学 | 一种基于多示例学习的病理图像细胞识别方法 |
CN113034448B (zh) * | 2021-03-11 | 2022-06-21 | 电子科技大学 | 一种基于多示例学习的病理图像细胞识别方法 |
CN113705318A (zh) * | 2021-04-22 | 2021-11-26 | 腾讯科技(深圳)有限公司 | 基于图像的识别方法、装置、设备及可读存储介质 |
CN113705318B (zh) * | 2021-04-22 | 2023-04-18 | 腾讯医疗健康(深圳)有限公司 | 基于图像的识别方法、装置、设备及可读存储介质 |
CN113743186A (zh) * | 2021-06-15 | 2021-12-03 | 腾讯医疗健康(深圳)有限公司 | 医学图像的处理方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110211108A (zh) | 一种新型的基于Feulgen染色方法的异常宫颈细胞自动识别方法 | |
CN110378879B (zh) | 一种桥梁裂缝检测方法 | |
CN106780460B (zh) | 一种用于胸部ct影像的肺结节自动检测系统 | |
CN109325942B (zh) | 基于全卷积神经网络的眼底图像结构分割方法 | |
EP2302583B1 (en) | Image segmentation | |
Dalle et al. | Automatic breast cancer grading of histopathological images | |
CN107506770A (zh) | 糖尿病视网膜病变眼底照相标准图像生成方法 | |
CN107437068B (zh) | 基于Gabor方向直方图和猪体毛发模式的猪个体识别方法 | |
CN111179216B (zh) | 一种基于图像处理与卷积神经网络的作物病害识别方法 | |
CN114749342B (zh) | 一种锂电池极片涂布缺陷识别方法、装置及介质 | |
CN109635846A (zh) | 一种多类医学图像判断方法和系统 | |
CN109211198A (zh) | 一种基于三目视觉的智能目标检测和测量系统及方法 | |
CN105069818A (zh) | 一种基于图像分析的皮肤毛孔识别方法 | |
CN110264454B (zh) | 基于多隐藏层条件随机场的宫颈癌组织病理图像诊断方法 | |
CN107392929A (zh) | 一种基于人眼视觉模型的智能化目标检测及尺寸测量方法 | |
CN113781455B (zh) | 宫颈细胞图像异常检测方法、装置、设备及介质 | |
CN109684906A (zh) | 基于深度学习的检测红脂大小蠹的方法 | |
CN107871316A (zh) | 一种基于深度神经网络的x光片手骨兴趣区域自动提取方法 | |
CN109886267A (zh) | 一种基于最优特征选择的低对比度图像显著性检测方法 | |
CN109035227A (zh) | 对ct图像进行肺部肿瘤检测与诊断的系统 | |
CN109657545A (zh) | 一种基于多任务学习的行人检测方法 | |
CN109886170A (zh) | 一种钉螺智能检测识别与统计系统 | |
CN107610122A (zh) | 一种基于Micro‑CT的单籽粒谷物内部虫害检测方法 | |
CN112069985A (zh) | 基于深度学习的高分辨率大田图像稻穗检测与计数方法 | |
CN109472801A (zh) | 一种用于多尺度的神经形态检测和分割方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190906 |
|
RJ01 | Rejection of invention patent application after publication |