CN114742758A - 一种全视野数字切片组织病理图片中的细胞核分类方法 - Google Patents

一种全视野数字切片组织病理图片中的细胞核分类方法 Download PDF

Info

Publication number
CN114742758A
CN114742758A CN202210224218.XA CN202210224218A CN114742758A CN 114742758 A CN114742758 A CN 114742758A CN 202210224218 A CN202210224218 A CN 202210224218A CN 114742758 A CN114742758 A CN 114742758A
Authority
CN
China
Prior art keywords
kernel
full
nucleus
classes
field digital
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210224218.XA
Other languages
English (en)
Inventor
俞章盛
鹿可·约翰斯通
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jiaotong University
Original Assignee
Shanghai Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jiaotong University filed Critical Shanghai Jiaotong University
Priority to CN202210224218.XA priority Critical patent/CN114742758A/zh
Publication of CN114742758A publication Critical patent/CN114742758A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20112Image segmentation details
    • G06T2207/20132Image cropping
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • G06T2207/30024Cell structures in vitro; Tissue sections in vitro

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Quality & Reliability (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种全视野数字切片组织病理图片中的细胞核分类方法,包括:对患者的组织病理学WSI进行预处理,并根据处理后的WSI中细胞核的核质心到像素的经验密度对虚拟类别进行分层,并获取训练集和验证集;以空间区域为目标,对类不平衡的影像提升分类F1水平,并提取核特征;核特征提取后,采用Hovernet中的三个独立的密集连接解码器分别执行核检测、像素到核质心的水平和垂直距离估计以及对核预测进行分类;采用拥有多个目标函数组合的成本函数最小化目标函数,获取最终细胞核分类结果。与现有技术相比,本发明具有显著提高MSE,有助于模型对类进行更好地学习,以及提升分类结果准确度等优点。

Description

一种全视野数字切片组织病理图片中的细胞核分类方法
技术领域
本发明涉及计算机辅助医学图像处理技术领域,尤其是涉及一种全视野数字切片组织病理图片中的细胞核分类方法。
背景技术
随着数字病理学的快速发展,通过评估微组织环境以进行细胞核分类的方法得到了极大的改进。由于肿瘤内的异质性,定性技术通常很困难,并且会导致假阴性诊断,而深度学习方法已经为不同组织区域中的许多类型的细胞核提供了具有竞争力和准确的分类结果。取决于组织区域,细胞核经常形成簇的形式;在细胞类别不平衡数据集中,这给深度学习模型带来挑战,因此非常需要模型来合并这些空间特征。
细胞核分割是细胞分类模型中的关键步骤,因为分割的性能直接影响分类性能。具有密集细胞区域的图像通常会导致细胞核聚集和重叠,当聚集的细胞核具有相似的形态特征时,这使得分割变得困难。分水岭模型(watershed)一直是分割模型的常用方法,但是当使用数据增广时,图像中的局部最小值导致过度分割。专注于形态和空间意识的模型可以更好地分割相重叠的细胞核。聚集在一起的细胞核会展现出强度对比,因此当成本函数包含细胞核的梯度时,分割结果会有提升。近年,基于空间感知的生物医学图像方法在具有空间结构特性差异的恶性细胞核正常细胞核的辨别中取得了进展。然而,许多模型专注于细胞核密集区域,对于细胞核分布很不平衡的病理图像则效果欠佳。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种全视野数字切片组织病理图片中的细胞核分类方法。
本发明的目的可以通过以下技术方案来实现:
一种全视野数字切片组织病理图片中的细胞核分类方法,该方法包括:
对患者的组织病理学WSI进行预处理,并根据处理后的WSI中细胞核的核质心到像素的经验密度对虚拟类别进行分层,并获取训练集和验证集;
以空间区域为目标,对类不平衡的影像提升分类F1水平,并提取核特征;
核特征提取后,采用Hovernet中的三个独立的密集连接解码器分别执行核检测、像素到核质心的水平和垂直距离估计以及对核预测进行分类;
采用拥有多个目标函数组合的成本函数最小化目标函数,获取最终细胞核分类结果。
进一步地,所述预处理包括对患者的组织病理学WSI依次进行的裁剪处理、颜色标准化处理和数据增强处理。
所述裁剪处理为对患者的组织病理学WSI裁剪成大小270x270的重叠块,并对裁剪后的重叠块中提取信息后进行下采样。
所述颜色标准化处理为采用Macenko的染色归一化算法归一化裁剪处理后的染色图像块。
所述数据增强处理的具体内容为:
对归一化的图像块通过旋转、镜像、缩放、平移、高斯模糊、中值模糊、混合图像、切割图像以及调整亮度、对比度和饱和度进行数据增强。
进一步地,对虚拟类别进行分层的过程中,利用k折交叉验证将80/20%的样本分成训练集和验证集。
对虚拟类别进行分层的表达式如下:
v0:r≤0.01,
v1:0.01<r≤0.2,
v2:0.2<r≤0.5,
v3:r>0.5.
式中,r为细胞核类别数与像素数的比率,v0、v1、v2、v3分别为虚拟类别的不同层。
进一步地,利用带有挤压和激励块的ResNet-50-SE编码器提取核特征,并采用空间金字塔池化从细胞核密集簇之外的低平衡类中提取更多特征;同时使用空洞卷积实现空间金字塔池化,并只在最后一层初始化偏差项。
进一步地,所述目标函数为最小化多项成本函数,其表达式为:
Figure BDA0003538625890000031
式中,
Figure BDA0003538625890000032
为成本函数,,j=1…4,代表层;i=1…N,代表每一个像素,N为像素的数量。
进一步地,最小化多项成本函数中,第一个成本函数
Figure BDA0003538625890000033
为Huber函数的扩展,其表达式为:
Figure BDA0003538625890000034
式中,yi为像素点到中心的距离,
Figure BDA0003538625890000035
为其拟合值,α为控制异常值的判别标准的参数,δ为控制惩罚的调匀参数,ηj为一个连续函数;
目标函数的第二部分的表达式为:
Figure BDA0003538625890000036
式中,
Figure BDA0003538625890000037
为纵向距离,
Figure BDA0003538625890000038
为横向距离;
目标函数的第三、四部分为针对类别不平衡的Tversky和Focal函数,分别为:
Figure BDA0003538625890000039
式中,yik
Figure BDA00035386258900000310
中细胞核的实际类别,
Figure BDA00035386258900000311
Figure BDA00035386258900000312
中细胞核的预测类别,β为一个权重,γ为控制曲线的形状的参数;
以及:
Figure BDA00035386258900000313
式中,yi(I)为
Figure BDA00035386258900000314
中细胞核的实际类别,
Figure BDA00035386258900000315
Figure BDA00035386258900000316
和细胞核的预测类别,∈为稳定参数,κ为控制假阳性的参数。
本发明提供的全视野数字切片组织病理图片中的细胞核分类方法,相较于现有技术至少包括如下有益效果:
1)本发明通过使用复合凸成本函数检测异常值并改进类不平衡数据集的分类,通过引入新的参数控制平滑度,并基于图像空间经验密度的分层k折交叉验证提高了分类分数,与现有技术相比,成本函数将F1分数的MSE有显著提高。
2)本发明基于细胞核质心到像素的经验密度对虚拟变量进行分层来应对类不平衡,本发明通过在层内将80/20%的样本分成训练集和验证集,能够确保高密度和低密度的细胞核区域将在两个数据集分布相似中,以便可以定位低频率的细胞核,这有助于模型对类进行更好地学习,进而提升分类结果的准确度。
附图说明
图1为实施例中全视野数字切片组织病理图片中的细胞核分类方法的流程示意图。
图2为实施例中对虚拟类别进行分层的原理图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。显然,所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都应属于本发明保护的范围。
实施例
本发明涉及一种全视野数字切片组织病理图片中的细胞核分类方法,下文中将以SpNet代表本发明方法。该方法主要的改进原理在于:(1)首先,通过改进成本函数的结构,使用改进的Huber成本函数,利用附加参数实现平滑。(2)根据图像块的经验密度对数据集进行分层,针对层内划分训练集、验证集,使验证集中有足够的类别不平衡数据点。
基于上述改进原理,本发明方法的具体实施步骤包括:
一、数据准备
由于WSI(Whole-slide image,病理图像)的大小为千兆像素,因此如果将这些图像直接插入到模型中,GPU将无法处理这些图像。因此,把WSI切割成270x270的块用于训练。为了消除颜色染色中的任何不一致和变化,通过Macenko算法(Macenko染色标准化方法)对染色进行标准化。
二、图像预处理
数据增广:增广不同颜色、纹理和图案的图像。基于大小为270×270的图像块,本发明引入了一组辅助变量Z1,...,Zr来代表各种变换。使用了旋转(90°,180°,270°)、镜像、缩放、平移、高斯模糊、中值模糊、混合图像、切割图像、调整亮度、对比度和饱和度。还切割了一个图像的固定矩形并将其替换到另一个图像中,并产生了由图像信号中的急剧和突然干扰引起的脉冲噪声。
分层的训练验证集:为了分离训练和验证图像块,先根据图像块的细胞核密度进行分层,实施分层的k折交叉验证以保持平衡的数据集,本实施例选择k=5来创建80/20%的拆分。由于验证集的图像比例也很低,因此该方法还允许我们选择具有高密度单元格的图像块,从而不使用任何没有单元格的块,并且可以优化验证。根据每个图像块的经验密度对以下虚拟类别进行分层:
v0:r≤0.01,
v1:0.01<r≤0.2,
v2:0.2<r≤0.5,
v3:r>0.5.
其中,其中r是细胞核类别数与像素数的比率。v0、v1、v2、v3分别表示虚拟类别的不同层。如图2所示。
三、模型结构
本发明使用ResNet-50-SE编码器提取核特征,然后使用三个独立的密集连接解码器,通过最近邻上采样,采用空间金字塔池化从细胞核密集簇之外的低平衡类中提取更多特征。使用空洞卷积实现空间金字塔池化。为了进一步解决类不平衡问题,只在最后一层初始化偏差项为:
Figure BDA0003538625890000051
其中,常数k设置为5e^(-4)。假设训练和测试图像遵循相同的分布
Figure BDA0003538625890000052
然后用Sigmoid函数来做类别预测。
本发明方法的流程概述如图1所示。
针对模型架构,考虑目标函数是最小化一个多项成本函数,其表达式为:
Figure BDA0003538625890000053
式中,
Figure BDA0003538625890000054
为成本函数,j=1…4,代表层;i=1…N,代表每一个像素,N为像素的数量;第一个成本函数
Figure BDA0003538625890000055
是Huber函数的扩展:
Figure BDA0003538625890000061
其中,yi是像素点到中心的距离,
Figure BDA0003538625890000062
为其拟合值,α是控制异常值的判别标准的参数,δ为控制惩罚的调匀参数,ηj是一个连续函数。
本发明通过改进Huber函数,实现对类不平衡数据集中的数据点更准确的分类。已有模型没有关注类不平衡,因此分类准确率偏低。J1由两个独立的部分组成,以相应地以不同的比率惩罚异常值。由于原子核倾向于聚集在一起,因此在原子核半径α内使用MSE(均方误差)的惩罚。此半径之外的像素常为异常值,用近似MAE(平均绝对误差)函数的惩罚。α值越高(α>1.5)表示异常值越少,值越小(α<1.5)表示异常值越多。惩罚参数(控制惩罚的调匀参数)δ决定惩罚异常值的程度,其中6值越高表明对异常值的惩罚越多。近似这个函数以允许更快的收敛并控制平滑度,而不是具有恒定的梯度。控制惩罚的调匀参数δ用于进一步控制曲线的陡峭程度,其中δ=1用于实验。函数针对不同的参数值在二维中绘制,以显示对|x|的收敛。
目标函数的第二部分从HoVerNet相关论文中引入为:
Figure BDA0003538625890000063
其中,
Figure BDA0003538625890000064
表示纵向距离,
Figure BDA0003538625890000065
表示横向距离。
上述提及的论文具体为《Graham S,Vu QD,Raza SEA,Azam A,Tsang YW,Kwak JT,Rajpoot N.Hover-Net:Simultaneous segmentation and classification of nuclei inmulti-tissue histology images.Med Image Anal.2019Dec;58:101563.doi:10.1016/j.media.2019.101563.Epub 2019 Sep 18.PMID:31561183》。
通过使用相连的细胞核具有对比梯度的现象来进行分割。第三、四部分为针对类别不平衡的Tversky和Focal函数,分别为:
Figure BDA0003538625890000066
其中,yik是细胞核的实际类别,
Figure BDA0003538625890000067
是细胞核的预测类别,β是一个权重,γ为控制曲线的形状的参数,如果γ越大,对稀有类别细胞的关注越大。
以及:
Figure BDA0003538625890000071
其中yi(I)是
Figure BDA0003538625890000072
中细胞核的实际类别,
Figure BDA0003538625890000073
Figure BDA0003538625890000076
中细胞核的预测类别,∈是一个稳定参数,κ为控制假阳性的参数。
四、实例验证
1)数据集
使用结直肠腺癌核分割和表型(CoNSeP:Colorectal Nuclear SEgmentation andPhenotypes)数据集,该数据集由41个结直肠WSI组成,其大小为1000x1000像素,放大倍数为40x。每张图像属于单个患者,并从16个结直肠腺癌WSI中提取,CoNSeP的数据集中不同类别细胞数量如表1所示。尽管这个数据集有来自病理学家的24,319个详尽注释的细胞核,但存在高度的类别不平衡,这极大地影响了模型性能。我们发现杂项核占训练数据集的2.38%和测试数据集的6.39%。因此,由于组织病理学图像的不平衡性,随机分配训练和验证图像集将不能代表整个WSI,并给出有偏差的结果。本实施例将基于核密度分层的数据划分训练集和验证集。
表1 CoNSeP的数据集中不同类别细胞数量
Figure BDA0003538625890000075
2)数据准备
为了消除颜色染色中的任何不一致和变化,首先对染色进行标准化。由于WSI的大小为千兆像素,因此如果将这些图像直接插入模型中,GPU将无法处理这些图像。此外,每个WSI的大小都有所不同,因此本实施例使用270x270的图像块。
数据增强能够训练无法收集的图像,例如不同颜色、纹理和图案的图像,这些图像是由内部变化产生的,因此WSI可能会在不同的医疗场所表现出不同的图案。使用大小为270×270的补丁,本实施例引入了一组辅助变量Z1,...,Zr代表各种变换。典型示例包括旋转(90°,180°,270°)、镜像、缩放、平移、高斯模糊、中值模糊、混合图像、切割图像以及调整亮度、对比度和饱和度。最近的增强技术也显示出有希望的结果,包括CutMix,它切割一个图像的固定矩形并在另一个图像中替换它。本实施例实现了其他增强方法的例子,包括CoarseDropOut,它在图像中创建随机的黑色矩形,可能有助于学习异常值。SaltPepperNoise会生成由图像信号中的急剧和突然干扰引起的脉冲噪声,这有助于生成更多有时可能存在的伪影。
为了分离训练和验证图像块,本实施例实施分层k折交叉验证以保持平衡的数据集,优先选择k=5来创建80/20%的拆分。本实施例根据每个图像的内核密度进行分层。由于杂项核的频率如此之低,本实施例决定不根据类别进行分层,因为本实施例希望在训练集中保留该类别的高频率。杂项核类通常不存在于两个数据集中的集群中,因此该方法将允许本实施例在验证集中拥有此类,而随机抽样并不能保证这一点。由于验证集的图像比例也很低,因此该方法还允许本实施例选择具有高密度单元格的图像块,从而不使用任何没有单元格的块,并且可以优化验证。根据每个图像块的经验密度对以下虚拟类别进行分层。
v0:r≤0.01,
v1:0.01<r≤0.2,
v2:0.2<r≤0.5,
v3:r>0.5.
其中,其中r是细胞核类别数与像素数的比率。v0、v1、v2、v3分别表示虚拟类别的不同层。
3)结果
本实施例对有和没有分层(随机抽样)的CoNSeP数据集进行分析。结果表明,通过提高所有核类型的分类分数,本实施例的分层方法在分类方面的表现优于随机选择。本实施例还将使用本发明的结果与最新的最先进的同步分割和分类模型HoVer-Net模型进行了比较,结果如表2所示。表中可以看到本发明的分层方法的总体F1-score相比其他方法最高达到0.7575,在每个类别(class总也超过随机方法和Hover-Net提出的方法。
表2 CoNSep数据集上使用分层划分、随机划分训练测试集的结果比较
Figure BDA0003538625890000081
本实施例对新的损失函数进行了消融分析,测试了它的不同种类,包括MSE、MAE、Huber和Pseudo Huber,这使我们能够测试有效性。结果表明本发明方法的成本函数直接提高了类不平衡核(杂项类型)以及其他类型核的分类F1分数。结果如表3所示。表中显示各类方法的PQ测量近似,但是SpNet的总体识别F1-score上超过其他方法,在对混合类、炎症类、纺锤体类的识别F1-score也超过其他方法,表明本发明方法的准确性更高。
表3不同的成本函数的准确度比较
Figure BDA0003538625890000091
本实施例还对不同的编码器进行了分析,如表4所示,发现空间编码器(ResNet50-SE)F1-score高于其他非空间编码器,这意味着空间注意力对本发明方法的任务至关重要。另外,通过表4我们看到ResNet101的分割效果最好,但在分类方面很差。可以清楚地看到,DenseNet的全套预训练权重的遗漏对结果造成了很大的影响,无法有效地产生高质量的结果。虽然ResNet50-SE不是训练最快的模型,但它比Inception和ResNet-101模型更快,它也为每个核产生了优异的结果,并将类不平衡核的分类提高了11%。本实施例已经展示了对原始HoVer Net论文的改进,而DenseNet和ResNet-34模型是唯一表现更快的模型。
表4编码器比较
Figure BDA0003538625890000092
综上,本发明通过使用复合和凸成本函数检测异常值并改进类不平衡数据集的分类。本发明专注于使用挤压和激励块以及空间金字塔池化的空间区域,以将整体检测提高3%以上,并将类别不平衡核的分类提高21.8%。结果表明,尽管ResNet-101有时具有更高的分割指标,但与两个数据集上的任何其他编码器相比,ResNet50-SE具有更好的分类指标。由于ResNet50-SE是最好的模型,这说明了空间感知模型在组织学数据集中的重要性,因为许多数据集存在类别不平衡的问题,标准化模型将在训练期间严重惩罚异常值,然后影响真实世界测试数据集的下游分析,这些数据集具有大量伪像和类别不平衡核。总的来说,这表明通过结合染色归一化、分层采样、Nadam优化、SPP和数据增强,这有助于显着改进本发明模型,即使本发明具有与原始HoVer Net模型相同的编码器。通过根据每个图像块的经验密度对数据集进行分层,以创建类平衡的训练和验证数据集,从而将CoNSeP数据集中杂项核的准确性提高了21.8%。因此,本发明模型可以准确地分割和分类各种类型的细胞核形态和结构,进而可以成功地适应临床环境,有助于癌症诊断。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的工作人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种全视野数字切片组织病理图片中的细胞核分类方法,其特征在于,包括:
对患者的组织病理学WSI进行预处理,并根据处理后的WSI中细胞核的核质心到像素的经验密度对虚拟类别进行分层,并获取训练集和验证集;
以空间区域为目标,对类不平衡的影像提升分类F1水平,并提取核特征;
核特征提取后,采用Hovernet中的三个独立的密集连接解码器分别执行核检测、像素到核质心的水平和垂直距离估计以及对核预测进行分类;
采用拥有多个目标函数组合的成本函数最小化目标函数,获取最终细胞核分类结果。
2.根据权利要求1所述的全视野数字切片组织病理图片中的细胞核分类方法,其特征在于,所述预处理包括对患者的组织病理学WSI依次进行的裁剪处理、颜色标准化处理和数据增强处理。
3.根据权利要求2所述的全视野数字切片组织病理图片中的细胞核分类方法,其特征在于,所述裁剪处理为对患者的组织病理学WSI裁剪成大小270x270的重叠块,并对裁剪后的重叠块中提取信息后进行下采样。
4.根据权利要求3所述的全视野数字切片组织病理图片中的细胞核分类方法,其特征在于,所述颜色标准化处理为采用Macenko的染色归一化算法归一化裁剪处理后的染色图像块。
5.根据权利要求4所述的全视野数字切片组织病理图片中的细胞核分类方法,其特征在于,所述数据增强处理的具体内容为:
对归一化的图像块通过旋转、镜像、缩放、平移、高斯模糊、中值模糊、混合图像、切割图像以及调整亮度、对比度和饱和度进行数据增强。
6.根据权利要求1所述的全视野数字切片组织病理图片中的细胞核分类方法,其特征在于,对虚拟类别进行分层的过程中,利用k折交叉验证将80/20%的样本分成训练集和验证集。
7.根据权利要求6所述的全视野数字切片组织病理图片中的细胞核分类方法,其特征在于,对虚拟类别进行分层的表达式如下:
v0:r≤0.01,
v1:0.01<r≤0.2,
v2:0.2<r≤0.5,
v3:r>0.5.
式中,r为细胞核类别数与像素数的比率,v0、v1、v2、v3分别为虚拟类别的不同层。
8.根据权利要求1所述的全视野数字切片组织病理图片中的细胞核分类方法,其特征在于,利用带有挤压和激励块的ResNet-50-SE编码器提取核特征,并采用空间金字塔池化从细胞核密集簇之外的低平衡类中提取更多特征;同时使用空洞卷积实现空间金字塔池化,并只在最后一层初始化偏差项。
9.根据权利要求8所述的全视野数字切片组织病理图片中的细胞核分类方法,其特征在于,所述目标函数为最小化多项成本函数,其表达式为:
Figure FDA0003538625880000021
式中,
Figure FDA0003538625880000022
为成本函数,,j=1…4,代表层;i=1…N,代表每一个像素,N为像素的数量。
10.根据权利要求9所述的全视野数字切片组织病理图片中的细胞核分类方法,其特征在于,最小化多项成本函数中,第一个成本函数
Figure FDA0003538625880000023
为Huber函数的扩展,其表达式为:
Figure FDA0003538625880000024
式中,yi为像素点到中心的距离,
Figure FDA0003538625880000025
为其拟合值,α为控制异常值的判别标准的参数,δ为控制惩罚的调匀参数,ηj为一个连续函数;
目标函数的第二部分的表达式为:
Figure FDA0003538625880000026
式中,
Figure FDA0003538625880000027
为纵向距离,
Figure FDA0003538625880000028
为横向距离;
目标函数的第三、四部分为针对类别不平衡的Tversky和Focal函数,分别为:
Figure FDA0003538625880000031
式中,yik
Figure FDA0003538625880000032
中细胞核的实际类别,
Figure FDA0003538625880000033
Figure FDA0003538625880000034
中细胞核的预测类别,β为一个权重,γ为控制曲线的形状的参数;
以及:
Figure FDA0003538625880000035
式中,yi(I)为
Figure FDA0003538625880000036
中细胞核的实际类别,
Figure FDA0003538625880000037
Figure FDA0003538625880000038
中细胞核的预测类别,∈为稳定参数,κ为控制假阳性的参数。
CN202210224218.XA 2022-03-09 2022-03-09 一种全视野数字切片组织病理图片中的细胞核分类方法 Pending CN114742758A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210224218.XA CN114742758A (zh) 2022-03-09 2022-03-09 一种全视野数字切片组织病理图片中的细胞核分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210224218.XA CN114742758A (zh) 2022-03-09 2022-03-09 一种全视野数字切片组织病理图片中的细胞核分类方法

Publications (1)

Publication Number Publication Date
CN114742758A true CN114742758A (zh) 2022-07-12

Family

ID=82274381

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210224218.XA Pending CN114742758A (zh) 2022-03-09 2022-03-09 一种全视野数字切片组织病理图片中的细胞核分类方法

Country Status (1)

Country Link
CN (1) CN114742758A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116150617A (zh) * 2022-12-16 2023-05-23 上海药明康德新药开发有限公司 一种肿瘤浸润淋巴细胞识别方法和系统
CN117593746A (zh) * 2024-01-18 2024-02-23 武汉互创联合科技有限公司 基于目标检测的细胞分裂均衡度评估系统及装置
CN117710969A (zh) * 2024-02-05 2024-03-15 安徽大学 一种基于深度神经网络的细胞核分割和分类方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116150617A (zh) * 2022-12-16 2023-05-23 上海药明康德新药开发有限公司 一种肿瘤浸润淋巴细胞识别方法和系统
CN116150617B (zh) * 2022-12-16 2024-04-12 上海药明康德新药开发有限公司 一种肿瘤浸润淋巴细胞识别方法和系统
CN117593746A (zh) * 2024-01-18 2024-02-23 武汉互创联合科技有限公司 基于目标检测的细胞分裂均衡度评估系统及装置
CN117593746B (zh) * 2024-01-18 2024-04-19 武汉互创联合科技有限公司 基于目标检测的细胞分裂均衡度评估系统及装置
CN117710969A (zh) * 2024-02-05 2024-03-15 安徽大学 一种基于深度神经网络的细胞核分割和分类方法
CN117710969B (zh) * 2024-02-05 2024-06-04 安徽大学 一种基于深度神经网络的细胞核分割和分类方法

Similar Documents

Publication Publication Date Title
CN109544555B (zh) 基于生成式对抗网络的细小裂缝分割方法
CN113344849B (zh) 一种基于YOLOv5的微乳头检测系统
CN112116605B (zh) 一种基于集成深度卷积神经网络的胰腺ct图像分割方法
CN114742758A (zh) 一种全视野数字切片组织病理图片中的细胞核分类方法
CN107833220A (zh) 基于深度卷积神经网络与视觉显著性的织物缺陷检测方法
CN108364288A (zh) 用于乳腺癌病理图像的分割方法和装置
WO2021203795A1 (zh) 一种基于显著性密集连接扩张卷积网络的胰腺ct自动分割方法
CN110599500B (zh) 一种基于级联全卷积网络的肝脏ct图像的肿瘤区域分割方法及系统
CN108288271A (zh) 基于三维残差网络的图像检测系统及方法
CN109166102A (zh) 一种基于判别区域候选对抗网络的图像转图像翻译方法
CN113762138B (zh) 伪造人脸图片的识别方法、装置、计算机设备及存储介质
CN109948467A (zh) 人脸识别的方法、装置、计算机设备和存储介质
CN112926652B (zh) 一种基于深度学习的鱼类细粒度图像识别方法
Popescu et al. Retinal blood vessel segmentation using pix2pix gan
CN112215217B (zh) 模拟医师阅片的数字图像识别方法及装置
CN108416801A (zh) 一种面向立体视觉三维重建的Har-SURF-RAN特征点匹配方法
Rezaei et al. Gland segmentation in histopathology images using deep networks and handcrafted features
CN115546605A (zh) 一种基于图像标注和分割模型的训练方法及装置
CN115546187A (zh) 基于YOLO v5的农业病虫害检测方法及装置
CN115471838A (zh) 基于深度自适应特征提取的宫颈鳞状病变细胞检测方法
CN114842201A (zh) 基于改进Mask_Rcnn的砂石骨料图像分割方法
CN112489048B (zh) 一种基于深度网络的视神经自动分割方法
CN113609944A (zh) 一种静默活体检测方法
CN111768420A (zh) 一种细胞图像分割模型
CN116311387A (zh) 一种基于特征交集的跨模态行人重识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination