CN116403211B - 一种基于单细胞病理图像细胞核的分割和聚类方法及系统 - Google Patents

一种基于单细胞病理图像细胞核的分割和聚类方法及系统 Download PDF

Info

Publication number
CN116403211B
CN116403211B CN202310293754.XA CN202310293754A CN116403211B CN 116403211 B CN116403211 B CN 116403211B CN 202310293754 A CN202310293754 A CN 202310293754A CN 116403211 B CN116403211 B CN 116403211B
Authority
CN
China
Prior art keywords
image
contour
segmentation
cell
features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310293754.XA
Other languages
English (en)
Other versions
CN116403211A (zh
Inventor
冯宁翰
汤鸿
于观贞
柳丰萍
冯杨焜
汪洋
蒋鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuxi No 2 Peoples Hospital
Original Assignee
Wuxi No 2 Peoples Hospital
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuxi No 2 Peoples Hospital filed Critical Wuxi No 2 Peoples Hospital
Priority to CN202310293754.XA priority Critical patent/CN116403211B/zh
Publication of CN116403211A publication Critical patent/CN116403211A/zh
Application granted granted Critical
Publication of CN116403211B publication Critical patent/CN116403211B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • G06V20/693Acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/762Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
    • G06V10/763Non-hierarchical techniques, e.g. based on statistics of modelling distributions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • G06V20/695Preprocessing, e.g. image segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/69Microscopic objects, e.g. biological cells or cellular parts
    • G06V20/698Matching; Classification
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于单细胞病理图像细胞核的分割和聚类方法及系统,属于图像处理技术领域,本发明基于轮廓追踪方法计算所述病理组织图像中存在的所有的闭合轮廓;并对轮廓进行优化得到细胞核分割图像,然后根据所述细胞核分割图像对应的mask图像将所述细胞核分割图像切分成单个细胞核小图像;通过所述mask图像提取对应区域的细胞核的影响特征;通过特征筛选去除冗余特征,然后使用umap特征降维方法筛选最重要的两个特征对细胞核进行聚类。通过先将病理图像中的细胞核区域分割和切分出来,然后利用切分后的单细胞核进行特征提取,使得聚类依据更有客观性。

Description

一种基于单细胞病理图像细胞核的分割和聚类方法及系统
技术领域
本发明涉及图像处理技术领域,更具体的说是涉及一种基于单细胞病理图像细胞核的分割和聚类方法及系统。
背景技术
图像的分割与分类是图像处理中基本的操作,传统的方法是通过Matlab的一系列图像分割函数对图像进行处理,从而达到分割的目的。随后对目标物体进行特征提取,利用特征的特异性对对象进行分类。虽然随着各方面研究的不断推进,图像分割和分类已经有了一个较大的进展,但是在医学方面病理图像分割的精确度依然存在很大的提升空间,且随着科技的发展,计算机辅助诊断(CAD)技术不断应用于各种领域,均得到了实质性的进展和效果。因此计算机技术与医疗诊断的结合迫在眉睫。
计算机辅助诊断可以提供高速、可重复的医学图像分析,结果更加客观、准确。细胞核检测与分割是医学图像分析中关键的第一步,然而,由于染色不均匀、细胞形态不规则、细胞核之间存在粘连以及杂质噪声等情况,准确的细胞核分割与计数仍然面临着很大的挑战性,现有细胞图像分割技术主要采用深度学习算法,需要大量的训练数据,而免疫组化细胞图像标注样本极难获取,训练数据不足,从而导致准确率不足。同时,深度学习算法计算量很大,对计算机资源要求较高。
因此,提供一种能够快速分割细胞核、提高细胞核分类准确率的病理图像细胞核的分割和聚类方法及系统是本领域技术人员亟需解决的问题。
发明内容
有鉴于此,本发明提供了一种基于单细胞病理组织图像细胞核的分割和聚类方法及系统,通过将病理组织图像分割为单细胞,并基于分割的单个细胞对细胞核进行聚类,提高细胞核分类准确率。
为了实现上述目的,本发明提供如下技术方案:
一种基于单细胞病理组织图像细胞核的分割和聚类方法,包括:
读取病理组织图像;
基于轮廓追踪方法计算所述病理组织图像中存在的闭合轮廓;
根据输入的所述病理组织图像的梯度特征对重叠的闭合轮廓进行评估,包括以下步骤:
获得局部最突出的轮廓;
对所述局部最突出的轮廓的封闭区域进行轮廓优化,并基于优化后的轮廓分割所述病理组织图像得到细胞核分割图像;
根据所述细胞核分割图像对应的mask图像将所述细胞核分割图像切分成单个细胞核小图像;
通过所述mask图像提取对应区域的细胞核的影响特征;
通过特征筛选去除影响特征中的冗余特征;
使用umap特征降维方法选出经过特征筛选的影响特征中最重要的两个特征对细胞核进行聚类。
进一步的,所述基于轮廓追踪方法计算所述病理组织图像中存在的所有的闭合轮廓,具体为:
将所述病理组织图像的原始彩色图像转换为灰度图像,计算图像RGB三通道的平均值,将所述病理组织图像转化为图像函数;
逐行扫描所述灰度图像并存储所有局部最小值和局部最大值以及两者之间的相应最大梯度,并基于所述局部最小值和所述最大值以及所述最大梯度确定轮廓检测的起始像素和相应的强度范围;
使用8连通邻域顺时针跟随追踪对象等值线;
在现有轮廓像素的基础上,由起始像素顺时针测试傍轴邻域,若邻域中存在一个当前对象的像素,则测试逆时针方向的邻域;若轮廓也属于当前物体,那么轮廓将继续使用该像素;
当轮廓跟踪回到种子位置时停止,继续跟踪的轮廓像素与第二个轮廓像素相同;
当轮廓回到所述其起始像素时,为有效像素;如果超过最大轮廓长度,则轮廓描摹终止。
进一步的,根据输入的所述病理组织图像的梯度特征对重叠的闭合轮廓进行评估,获得局部最突出的轮廓,具体为:
根据以下三个指标确定各轮廓的价值:(1)确定在同一局部区域内最突出、平均梯度最高的对象;(2)对比轮廓像素和最大局部渐变之间的梯度拟合;(3)使用Sobel算子及其3*3卷积核进行计算;
获得局部最突出的轮廓:标记分级等值线,标记过程按排序顺序执行,从最有价值的轮廓开始,并阻止覆盖已分配的标签,获取局部最突出的轮廓。
进一步的,对所述局部最突出的轮廓的封闭区域进行轮廓优化,得到细胞核分割图像,具体为:
依据距离值d测试对象像素的紧凑性;
设置一个循环来处理具有特定距离值dt的像素,从dt=d-1到1;每一个周期都要扫描整个距离图;如果像素pi与di=dt的距离值没有距离值为dt+1的傍轴邻居,则像素pi与di=dt的距离值将减少1;
通过删除两个凹面之间的切割线周围的对象像素来分离凹陷边界处的对象,得到细胞核分割图像。
进一步的,根据所述细胞核分割图像对应的mask图像将所述细胞核分割图像切分成单个细胞核小图像,具体为:
识别所述mask图像中的连通域并标记;
画出连通域的最小外界矩阵,通过矩阵坐标进行切分。
进一步的,通过所述mask图像提取对应区域的细胞核的影响特征,具体为:
将切分得到的单个细胞核小图像的文件格式转为nii格式;
确定用于提取特征的图像类型和特征类型;
根据所述图像类型和特征类型提取所述细胞核的影响特征。
进一步的,通过特征筛选去除冗余特征,具体采用Wilcoxon秩和检验。
进一步的,所述使用umap特征降维方法筛选最重要的两个特征对细胞核进行聚类,具体为:
(1)任选一个样本作为第一聚类中心Z1;
(2)选择距离Z1最远的样本作为第二聚类中心Z2;
(3)逐个计算每个样本与已知确定的所有聚类中心之间的距离,并选出其中的最小距离;
(4)在所有最小距离中选出一个最大距离,如果该最大值达到||Z1-Z2||的预设分数比值以上,则将产生最大距离的样本定义为新增聚类中心,并返回上一步;否则,聚类中心的计算步骤结束;
(5)重复步骤(3)和(4),直到没有新的聚类中心出现为止;
(6)将样本按最近距离划分到相应的聚类中心所代表的类别中,完成细胞核的聚类。
一种基于单细胞病理图像细胞核的分割和聚类系统,用于实现上述所述的任意一种基于单细胞病理图像细胞核的分割和聚类方法,所述系统包括:细胞核分割子系统和细胞核聚类子系统;
所述细胞核分割子系统包括:
图像读取模块,用于读取病理组织图像;
轮廓提取模块,用于计算所述病理组织图像中存在的闭合轮廓;
轮廓评价模块,用于对所述轮廓提取模块获得的闭合轮廓进行优化,并基于优化后的轮廓分割所述病理组织图像得到细胞核分割图像;
所述细胞核聚类子系统包括:
细胞核分割模块,用于根据所述轮廓评价模块获得的细胞核分割图像和对应的mask图像将所述细胞核分割图像切分成单个细胞核小图像;
影响特征提取模块,用于根据所述mask图像提取对应区域的细胞核的影响特征;
特征筛选模块,用于去除影响特征中的冗余特征;
细胞核聚类模块,用于使用umap特征降维方法选出经过特征筛选的影响特征中最重要的两个特征对细胞核进行聚类。
经由上述的技术方案可知,与现有技术相比,本发明公开提供了一种基于单细胞病理图像细胞核的分割和聚类方法及系统,首先,本发明提供的细胞核传统图像算法分割提取方法,能够辅助准确定位和提取细胞核,比机器学习和神经网络更加快速,且不需要大量的训练数据进行学习训练,即可准确快速的分割提取单个细胞核。其次,本发明是通过先分割后聚类的思想进行算法构建,并通过特征筛选来定量化特征减少冗余特征。先将病理图像中的细胞核区域分割和切分出来,然后利用切分后的单细胞核进行特征提取,使得聚类依据更有客观性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1是本发明细胞核的分割和聚类方法的流程示意图;
图2是本发明实施例提供的最小模型方法矩阵示意图;
图3是本发明实施例提供的最小模型方法矩阵示意图;
图4是本发明实施例提供的病理图像病变区域采样示意图,其中,a为Lsil,b为hsil,c为cancer;
图5是本发明实施例提供的取样图像分割mask示意图,其中,a为Lsil,b为hsil,c为cancer;
图6是本发明实施例提供的单细胞核聚类示意图,其中,a为Lsil,b为hsil,c为cancer;
图7为本发明细胞核的分割和聚类系统的框架示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种基于单细胞病理组织图像细胞核的分割和聚类方法,如图1所示,包括以下步骤:
读取病理组织图像;本实施例在西京医院采集了100例宫颈肿瘤患者病理图像,经过数据筛选和处理纳入60例宫颈肿瘤患者病理图像(包括20张宫颈癌患者病理图像,20张高级别病变患者病理图像和20张低级别病变患者病理图像)。由专业的经验丰富的妇科医师进行金标准标注。对病理图像的病变区域进行取样,如图4所示。
基于轮廓追踪方法计算病理组织图像中存在的所有的闭合轮廓;
根据输入的病理组织图像的梯度特征对重叠的闭合轮廓进行评估,获得局部最突出的轮廓;
对局部最突出的轮廓的封闭区域进行轮廓优化,得到细胞核分割图像;
根据细胞核分割图像对应的mask图像将细胞核分割图像切分成单个细胞核小图像;
通过mask图像提取对应区域的细胞核的影响特征;
通过特征筛选去除冗余特征;
使用umap特征降维方法筛选最重要的两个特征对细胞核进行聚类。
进一步的,基于轮廓追踪方法计算病理组织图像中存在的所有的闭合轮廓,具体为:将取样图像输入后变换为灰度图像,将图像转化为图像函数I(x),通过从左到右逐行扫描图像并存储所有局部最小值和最大值以及两者之间的相应最大梯度来确定轮廓起始像素的检测和相应强度范围,使用8连通邻域顺时针跟随追踪(潜在)对象等值线;如图2,在现有轮廓像素的基础上,顺时针测试傍轴邻域,邻域中有一个属于当前对象,那么逆时针方向的邻域也会被测试;如果轮廓也属于当前物体,那么轮廓将继续使用该像素。当轮廓跟踪回到种子位置时停止,继续跟踪的轮廓像素与第二个轮廓像素相同;当轮廓回到其起始像素时,为有效像素;如果超过最大轮廓长度(在我们的示例中为225像素),则轮廓描摹终止。
进一步的,根据输入的病理组织图像的梯度特征对重叠的闭合轮廓进行评估,获得局部最突出的轮廓,具体为:
根据以下三个指标确定最合适轮廓:(1)确定在同一局部区域内最突出、平均梯度最高的对象;(2)对比轮廓像素和最大局部渐变之间的梯度拟合;(3)使用Sobel算子及其3*3卷积核进行计算。具体的,确定对象在同一局部区域内比其他对象更突出,更高的平均梯度MeanGrandient(1)更重要;对比轮廓像素和最大局部渐变之间的梯度拟合GradientFit(2),使用Sobel算子S(3)及其3*3卷积核G进行计算;确定最合适轮廓;
其中n,m分别为横向和纵向检测到的轮廓个数;Ci是第i个轮廓,pij第i个轮廓的第j个轮廓像素;I为图像;Gx及Gy分别代表经横向及纵向边缘检测的图像;
获得局部最突出的轮廓:标记分级等值线,标记过程按排序顺序执行,从最有价值的轮廓开始,并阻止覆盖已分配的标签,获得局部最突出的轮廓。
进一步的,对局部最突出的轮廓的封闭区域进行轮廓优化,得到细胞核分割图像,具体为:图3是依据距离值d测试对象像素的紧凑性;设置一个循环来处理具有特定距离值dt的像素,从dt=d-1到1;每一个周期都要扫描整个距离图。如果像素pi与di=dt的距离值没有距离值为dt+1的傍轴邻居,则像素pi与di=dt的距离值将减少1。通过删除两个凹面之间的切割线周围的对象像素(标签)来分离凹陷边界处的对象。
进一步的,根据细胞核分割图像对应的mask图像将细胞核分割图像切分成单个细胞核小图像,具体为:
本实施例在采集了100例宫颈肿瘤患者病理图像,经过数据筛选和处理纳入60例宫颈肿瘤患者病理图像(包括20张宫颈癌患者病理图像,20张高级别病变患者病理图像和20张低级别病变患者病理图像),得到对应的60张mask图像,如图5所示。
识别mask图像中的连通域并标记;
画出连通域的最小外界矩阵,通过矩阵坐标进行切分。
进一步的,通过mask图像提取对应区域的细胞核的影响特征,具体为:将切分得到的单个细胞核小图像的文件格式转为nii格式;确定用于提取特征的图像类型和特征类型;根据图像类型和特征类型提取细胞核的影响特征。
将切分后的单个细胞核和对应的mask图像转换为nii格式文件,进行特征提取,bincount为100,label为1,normalizeScale为255,使用原始图像、梯度图像、小波图像。影像特征分为以下几类:
1.形状特征描述感兴趣的追踪区域的形状及其几何特性,如体积、沿不同正交方向的最大直径、最大表面、肿瘤致密性和球度。例如,针状肿瘤的表面与体积的比率将比类似体积的圆形肿瘤显示更高的值。
2.一阶统计特征描述个体体素值的分布,而不考虑空间关系。这些是基于直方图的属性,报告图像上体素强度的平均值、中值、最大值和最小值,以及它们的偏度(不对称)、峰度(平整度)、均匀性和随机性(熵)。
3.二阶统计特征包括所谓的纹理特征,它是通过计算相邻体素之间的统计相互关系而得到的。它们提供了一种测量体素强度的空间排列,因此是病变内异质性的一种方法。这样的特征可以从灰色级共现矩阵(GLCM)推导出来,它量化了在固定方向上预定距离上具有相同强度的体素的发病率,或者从灰色级运行长度矩阵(GLRLM)推导出来,量化了在固定方向上具有相同强度的连续体素。
4.对图像进行滤波或数学变换后,通过统计方法得到高阶统计特征;例如,目的是识别重复或非重复的模式,抑制噪音,或突出细节。这些方法包括分形分析、闵可夫斯基泛函数、小波变换和高斯滤波图像的拉普拉斯变换,这些方法可以提取纹理越来越粗糙的区域。
为了量化肿瘤内部空间异质性,采用开源的影像组学工具箱Pyradiomics[13]从每个影像序列的ROI中提取影像组学特征。提取的影像特征分为四类:形状特征、一阶统计特征、纹理特征和小波特征。形状特征(n=14)以三角形网格表示ROI形状,定量评价病变形状,其特征包括平坦度、伸长率、体积、表面积、最大直径、表面体积比、密度、偏心度、球度、最小轴长、第二大轴长。利用一阶统计特征(n=18),通过统计指标:平均值、中位数、四分位数范围、灰度值范围、最小值、最大值、方差、均方根、偏度、峰度、均匀性、能量,定量描述ROI中像素灰度水平的分布。纹理特征(n=75)用来描述ROI中灰度分布的异质性,通过构造各种灰度矩阵来发现;包括24个灰度共生矩阵(GLCM)、16个灰度运行长度矩阵(GLRLM)、14个灰度依赖矩阵(GLDM)、16个灰度大小区矩阵(GLSZM)和5个邻域灰度色调差矩阵(NGTDM)。为了提取更多量化肿瘤异质性的图像特征,对每个MRI体积应用小波滤波和高斯滤波。小波滤波将原始图像分解为8个分解点。设L和H分别为低通滤波和高通滤波,则图像的小波分解可标记为LLL、LLH、LHL、LHH、HLL、HLH、HHL、HHH。例如HHL是通过原始图像的x向高通滤波、y向高通滤波、z向低通滤波得到的。得到的分解图像具有与原始图像相同的大小。对8种分解方法分别计算18个一阶统计特征和75个纹理特征,得到相应的1023个小波特征。小波滤波、梯度滤波等采用pywavelet包(v.1.0.1)实现。
进一步的,通过特征筛选去除冗余特征,具体采用Wilcoxon秩和检验。提取特征后进行特征定量化,X为总体,将容量为n的样本观察值按从大到小的次序编号排列成x1,…xn,称Wilcoxon秩和检验假设数据是配对的,并且来自相同的总体;每一对都是随机和独立选择的;在计算配对内差异时,数据至少在一个间隔量表上进行检验。样本数量为N,即对的数量。因此,总共有2N个数据,i=1,…,N,x1,i和x2,i表示测量量。H0:两对中间的差遵循零附近的对称分布;H1:两对之间的差不遵循零附近的对称分布。检验步骤如下:
1.计算|x1,i-x2,i|和sgn(x1,i-x2,i),其中sgn是sign函数,sign函数公式为
2.排除|x1,i-x2,i|=0的数据,使Nr的样本量减少
3.将Nr剩余的数据对从最小绝对差到最大绝对差排序
4.最小绝对差的数据对的编号为1,编号根据排序依次递增。用Ri表示数据对的秩
5.计算验证统计量W,是序列秩总和
6.在H0假设下,W遵循特定的分布,方差为
7.如果W收敛到正态分布,对于Nr≥20,z得分通过公式计算。
如果zcritical>|z|,则假设H0不成立,或者使用精确或近似分布进行单边测试,计算p值做出统计结论。
对于Nr<20则需要使用确切的分布。
WLCX特征选择方法就是使用Wilcoxon秩和检验方法计算每个特征与label之间的p值来进行特征选择,选出与label之间相关度最高的特征。
进一步的,使用umap特征降维方法筛选最重要的两个特征对细胞核进行聚类,具体为:
(1)任选一个样本作为第一聚类中心Z1;
(2)选择距离Z1最远的样本作为第二聚类中心Z2;
(3)逐个计算每个样本与已知确定的所有聚类中心之间的距离,并选出其中的最小距离;
(4)在所有最小距离中选出一个最大距离,如果该最大值达到||Z1-Z2||的预设分数比值以上,则将产生最大距离的样本定义为新增聚类中心,并返回上一步;否则,聚类中心的计算步骤结束;
(5)重复步骤(3)和(4),直到没有新的聚类中心出现为止;
(6)将样本按最近距离划分到相应的聚类中心所代表的类别中,完成细胞核的聚类。如图6所示,Lsil取样图聚类为3类,hsil取样图聚类为5类,cancer取样图聚类为11类。
本发明还提供了一种基于单细胞病理图像细胞核的分割和聚类系统,用于实现一种基于单细胞病理图像细胞核的分割和聚类方法,如图7所示,具体包括:细胞核分割子系统和细胞核聚类子系统;
细胞核分割子系统包括:
图像读取模块,用于读取病理组织图像;
轮廓提取模块,用于计算病理组织图像中存在的闭合轮廓;
轮廓评价模块,用于对轮廓提取模块获得的闭合轮廓进行优化,并基于优化后的轮廓分割病理组织图像得到细胞核分割图像;
细胞核聚类子系统包括:
细胞核分割模块,用于根据轮廓评价模块获得的细胞核分割图像和对应的mask图像将所述细胞核分割图像切分成单个细胞核小图像;
影响特征提取模块,用于根据mask图像提取对应区域的细胞核的影响特征;
特征筛选模块,用于去除影响特征中的冗余特征;
细胞核聚类模块,用于使用umap特征降维方法选出经过特征筛选的影响特征中最重要的两个特征对细胞核进行聚类。
细胞核聚类子系统还包括用于显示细胞核聚类模块聚类结果的显示模块。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (7)

1.一种基于单细胞病理图像细胞核的分割和聚类方法,其特征在于,包括以下步骤:
读取病理组织图像;
基于轮廓追踪方法计算所述病理组织图像中存在的闭合轮廓;
根据输入的所述病理组织图像的梯度特征对重叠的闭合轮廓进行评估,获得局部最突出的轮廓;
对所述局部最突出的轮廓的封闭区域进行轮廓优化,并基于优化后的轮廓分割所述病理组织图像得到细胞核分割图像;
根据所述细胞核分割图像对应的mask图像将所述细胞核分割图像切分成单个细胞核小图像;
通过所述mask图像提取对应区域的细胞核的影像特征,所述影像特征包括:形状特征、一阶统计特征、纹理特征和小波特征;
通过特征筛选去除影像特征中的冗余特征;
使用umap特征降维方法选出经过特征筛选的影像特征中最重要的两个特征对细胞核进行聚类;
所述根据输入的所述病理组织图像的梯度特征对重叠的闭合轮廓进行评估,获得局部最突出的轮廓,具体为:
根据以下三个指标确定各轮廓的价值:(1)确定在同一局部区域内最突出、平均梯度最高的对象;(2)对比轮廓像素和最大局部渐变之间的梯度拟合;(3)使用Sobel算子及其3*3卷积核进行计算;具体的:确定对象在同一局部区域内比其他对象更突出,更高的平均梯度MeanGrandient更重要;对比轮廓像素和最大局部渐变之间的梯度拟合GradientFit,使用Sobel算子S及其3*3卷积核G进行计算;确定最合适轮廓;
其中,n,m分别为横向和纵向检测到的轮廓个数;Ci是第i个轮廓,pij第i个轮廓的第j个轮廓像素;I为图像;Gx及Gy分别代表经横向及纵向边缘检测的图像;
获得局部最突出的轮廓:标记分级等值线,标记过程按排序顺序执行,从最有价值的轮廓开始,并阻止覆盖已分配的标签,获取局部最突出的轮廓;
对所述局部最突出的轮廓的封闭区域进行轮廓优化,得到细胞核分割图像,具体为:
依据距离值d测试对象像素的紧凑性;
设置一个循环来处理具有特定距离值dt的像素,从dt=d-1到1;每一个周期都要扫描整个距离图;如果像素pi与di=dt的距离值没有距离值为dt+1的傍轴邻居,则像素pi与di=dt的距离值将减少1;
通过删除两个凹面之间的切割线周围的对象像素来分离凹陷边界处的对象,得到细胞核分割图像。
2.根据权利要求1所述的一种基于单细胞病理图像细胞核的分割和聚类方法,其特征在于,所述基于轮廓追踪方法计算所述病理组织图像中存在的所有的闭合轮廓,具体为:
将所述病理组织图像的原始彩色图像转换为灰度图像,计算图像RGB三通道的平均值,将所述病理组织图像转化为图像函数;
逐行扫描所述灰度图像并存储所有局部最小值和局部最大值以及两者之间的相应最大梯度,并基于所述局部最小值和所述最大值以及所述最大梯度确定轮廓检测的起始像素和相应的强度范围;
使用8连通邻域顺时针跟随追踪对象等值线;
在现有轮廓像素的基础上,由起始像素顺时针测试傍轴邻域,若邻域中存在一个当前对象的像素,则测试逆时针方向的邻域;若轮廓也属于当前物体,那么轮廓将继续使用该像素;
当轮廓跟踪回到种子位置时停止,继续跟踪的轮廓像素与第二个轮廓像素相同;
当轮廓回到所述起始像素时,为有效像素;如果超过最大轮廓长度,则轮廓描摹终止。
3.根据权利要求1所述的一种基于单细胞病理图像细胞核的分割和聚类方法,其特征在于,根据所述细胞核分割图像对应的mask图像将所述细胞核分割图像切分成单个细胞核小图像,具体为:
识别所述mask图像中的连通域并标记;
画出连通域的最小外界矩阵,通过矩阵坐标进行切分。
4.根据权利要求1所述的一种基于单细胞病理图像细胞核的分割和聚类方法,其特征在于,通过所述mask图像提取对应区域的细胞核的影像特征,具体为:
将切分得到的单个细胞核小图像的文件格式转为nii格式;
确定用于提取特征的图像类型和特征类型;
根据所述图像类型和特征类型提取所述细胞核的影像特征。
5.根据权利要求1所述的一种基于单细胞病理图像细胞核的分割和聚类方法,其特征在于,通过特征筛选去除冗余特征,具体采用Wilcoxon秩和检验。
6.根据权利要求1所述的一种基于单细胞病理图像细胞核的分割和聚类方法,其特征在于,使用umap特征降维方法筛选最重要的两个特征对细胞核进行聚类,具体为:
(1)任选一个所述细胞核作为第一聚类中心Z1;
(2)选择距离Z1最远的所述细胞核作为第二聚类中心Z2;
(3)逐个计算每个样本与已知确定的所有聚类中心之间的距离,并选出其中的最小距离;
(4)在所有最小距离中选出一个最大距离,如果最大距离达到||Z1-Z2||的预设分数比值以上,则将产生最大距离的所述细胞核定义为新增聚类中心,并返回上一步;否则,聚类中心的计算步骤结束;
(5)重复步骤(3)和(4),直到没有新的聚类中心出现为止;
(6)将所述细胞核按最近距离划分到相应的聚类中心所代表的类别中,完成细胞核的聚类。
7.一种基于单细胞病理图像细胞核的分割和聚类系统,其特征在于,用于实现权利要求1-6任意一项所述的一种基于单细胞病理图像细胞核的分割和聚类方法,所述系统包括:细胞核分割子系统和细胞核聚类子系统;
所述细胞核分割子系统包括:
图像读取模块,用于读取病理组织图像;
轮廓提取模块,用于计算所述病理组织图像中存在的闭合轮廓;
轮廓评价模块,用于对所述轮廓提取模块获得的闭合轮廓进行优化,并基于优化后的轮廓分割所述病理组织图像得到细胞核分割图像;所述根据输入的所述病理组织图像的梯度特征对重叠的闭合轮廓进行评估,获得局部最突出的轮廓,具体为:
根据以下三个指标确定各轮廓的价值:(1)确定在同一局部区域内最突出、平均梯度最高的对象;(2)对比轮廓像素和最大局部渐变之间的梯度拟合;(3)使用Sobel算子及其3*3卷积核进行计算;
获得局部最突出的轮廓:标记分级等值线,标记过程按排序顺序执行,从最有价值的轮廓开始,并阻止覆盖已分配的标签,获取局部最突出的轮廓;
所述细胞核聚类子系统包括:
细胞核分割模块,用于根据所述轮廓评价模块获得的细胞核分割图像和对应的mask图像将所述细胞核分割图像切分成单个细胞核小图像;
影像特征提取模块,用于根据所述mask图像提取对应区域的细胞核的影像特征;
特征筛选模块,用于去除影像特征中的冗余特征;
细胞核聚类模块,用于使用umap特征降维方法选出经过特征筛选的影像特征中最重要的两个特征对细胞核进行聚类。
CN202310293754.XA 2023-03-24 2023-03-24 一种基于单细胞病理图像细胞核的分割和聚类方法及系统 Active CN116403211B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310293754.XA CN116403211B (zh) 2023-03-24 2023-03-24 一种基于单细胞病理图像细胞核的分割和聚类方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310293754.XA CN116403211B (zh) 2023-03-24 2023-03-24 一种基于单细胞病理图像细胞核的分割和聚类方法及系统

Publications (2)

Publication Number Publication Date
CN116403211A CN116403211A (zh) 2023-07-07
CN116403211B true CN116403211B (zh) 2024-04-26

Family

ID=87009590

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310293754.XA Active CN116403211B (zh) 2023-03-24 2023-03-24 一种基于单细胞病理图像细胞核的分割和聚类方法及系统

Country Status (1)

Country Link
CN (1) CN116403211B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116580216B (zh) * 2023-07-12 2023-09-22 北京大学 病理图像匹配方法、装置、设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102133109A (zh) * 2010-01-25 2011-07-27 安克生医股份有限公司 肿瘤特征的量化方法及影像化方法
CN106056118A (zh) * 2016-06-12 2016-10-26 合肥工业大学 一种用于细胞的识别计数方法
CN106940889A (zh) * 2017-03-30 2017-07-11 福建师范大学 基于像素邻域特征聚类的淋巴结he染色病理图像分割方法
CN108918481A (zh) * 2018-04-26 2018-11-30 南昌大学 一种脐静脉内皮细胞荧光分析系统
CN112243463A (zh) * 2018-04-09 2021-01-19 小利兰·斯坦福大学托管委员会 原位基因测序方法
CN112508113A (zh) * 2020-12-14 2021-03-16 中国科学院空天信息创新研究院 被动式太赫兹人体图像隐蔽目标的检测方法及装置
CN114092499A (zh) * 2021-12-02 2022-02-25 上海健麾信息技术股份有限公司 一种药盒分割方法
CN114461829A (zh) * 2022-01-28 2022-05-10 北京邮电大学 一种面向传统文化记忆符号子图矢量化的方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102133109A (zh) * 2010-01-25 2011-07-27 安克生医股份有限公司 肿瘤特征的量化方法及影像化方法
CN106056118A (zh) * 2016-06-12 2016-10-26 合肥工业大学 一种用于细胞的识别计数方法
CN106940889A (zh) * 2017-03-30 2017-07-11 福建师范大学 基于像素邻域特征聚类的淋巴结he染色病理图像分割方法
CN112243463A (zh) * 2018-04-09 2021-01-19 小利兰·斯坦福大学托管委员会 原位基因测序方法
CN108918481A (zh) * 2018-04-26 2018-11-30 南昌大学 一种脐静脉内皮细胞荧光分析系统
CN112508113A (zh) * 2020-12-14 2021-03-16 中国科学院空天信息创新研究院 被动式太赫兹人体图像隐蔽目标的检测方法及装置
CN114092499A (zh) * 2021-12-02 2022-02-25 上海健麾信息技术股份有限公司 一种药盒分割方法
CN114461829A (zh) * 2022-01-28 2022-05-10 北京邮电大学 一种面向传统文化记忆符号子图矢量化的方法

Also Published As

Publication number Publication date
CN116403211A (zh) 2023-07-07

Similar Documents

Publication Publication Date Title
CN111931811B (zh) 一种基于超像素图像相似度的计算方法
CN107644420B (zh) 基于中心线提取的血管图像分割方法、核磁共振成像系统
Miller et al. Classification of breast tissue by texture analysis
Pak et al. Breast cancer detection and classification in digital mammography based on Non-Subsampled Contourlet Transform (NSCT) and Super Resolution
DE102008060789A1 (de) System und Verfahren zur nicht überwachten Detektion und Gleason-Abstufung für ein Prostatakrebspräparat (Whole-Mount) unter Verwendung von NIR Fluoreszenz
Pan et al. Mitosis detection techniques in H&E stained breast cancer pathological images: A comprehensive review
CN105069818A (zh) 一种基于图像分析的皮肤毛孔识别方法
CN111340770B (zh) 结合全局加权lbp和纹理分析的癌症预后模型构建方法
CN104182755A (zh) 基于塔形pca的乳腺钼靶x线图像块特征提取方法
CN111738997A (zh) 一种基于深度学习的计算新冠肺炎病变区域占比的方法
CN116403211B (zh) 一种基于单细胞病理图像细胞核的分割和聚类方法及系统
CN104217213A (zh) 一种基于对称性理论的医学图像多阶段分类方法
Rabottino et al. Performance evaluation of a region growing procedure for mammographic breast lesion identification
Razavi et al. MiNuGAN: Dual segmentation of mitoses and nuclei using conditional GANs on multi-center breast H&E images
JP7326316B2 (ja) 細胞学的試料中の少なくとも1つの異常を有する細胞を検出するための方法
CN104835155A (zh) 基于分形的早期乳腺癌钙化点计算机辅助检测方法
CN104732230A (zh) 一种基于细胞核统计信息的病理图像局部特征提取方法
Niwas et al. Complex wavelet based texture features of cancer cytology images
George et al. Cancer tissues recognition system using box counting method and artificial neural network
CN117994271B (zh) 基于分水岭算法的人脑图像分割方法
Chaphekarande et al. Machine learning based brain mri estimation method
Nuzhnaya et al. Segmentation of anatomical branching structures based on texture features and graph cut
Das et al. Interlayer textural variabilities to study the benignancy/malignancy of brain tumors using MR modalities images
Zhang et al. An integrated method for breast mass segmentation in digitized mammograms
CN117876833A (zh) 一种用于机器学习的肺部ct图像特征提取方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant