CN111047559B - 一种数字病理切片异常区域快速检测的方法 - Google Patents

一种数字病理切片异常区域快速检测的方法 Download PDF

Info

Publication number
CN111047559B
CN111047559B CN201911146210.0A CN201911146210A CN111047559B CN 111047559 B CN111047559 B CN 111047559B CN 201911146210 A CN201911146210 A CN 201911146210A CN 111047559 B CN111047559 B CN 111047559B
Authority
CN
China
Prior art keywords
roi
region
patch
sampling
abnormal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911146210.0A
Other languages
English (en)
Other versions
CN111047559A (zh
Inventor
张敬谊
丁偕
王瑜
刘全祥
杨佐鹏
刘鸣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WONDERS INFORMATION CO Ltd
Original Assignee
WONDERS INFORMATION CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WONDERS INFORMATION CO Ltd filed Critical WONDERS INFORMATION CO Ltd
Priority to CN201911146210.0A priority Critical patent/CN111047559B/zh
Publication of CN111047559A publication Critical patent/CN111047559A/zh
Application granted granted Critical
Publication of CN111047559B publication Critical patent/CN111047559B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20092Interactive image processing based on input by user
    • G06T2207/20104Interactive definition of region of interest [ROI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30004Biomedical image processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/03Recognition of patterns in medical or anatomical images

Abstract

本发明涉及一种数字病理切片异常区域快速检测的方法。本发明基于拟蒙特卡洛抽样(quasi‑Monte Carlo sampling)方法,先对整张WSI图像进行采样计算,构建异常区域分类概率的多重二次曲面,计算该ROI区域的概率变化幅度,再对ROI区域概率变化幅度较高的子区域增加采样密度,进一步循环计算,经数次迭代,形成整张WSI的异常区域检测结果。从而,在保证识别准确性的前提下,大大减少WSI异常区域识别的计算成本,加快识别速度、提高识别效率。

Description

一种数字病理切片异常区域快速检测的方法
技术领域
本发明涉及一种数字病理切片异常区域快速检测的方法,属于医学图像计算机辅助诊断技术领域。
背景技术
全视野数字病理切片(Whole slide imaging,WSI)通过光学放大设备自动扫描采集高分辨率数字病理图像,随着高精度采集设备和计算机大存储容量的飞速发展,现代WSI图像像素高达千兆级,仅单张数字病理图像存储空间可高达GB量级。这使得病理医生通常需要重复性地花费大量的时间在千兆级像素的病理图像中识别微小的癌细胞,工作强度非常大。
深度学习(Deep Learning,DL)是一种近年来非常热门的机器学习方法,尤其是卷积神经网络(Convolutional Neural Network,CNN)近年来在图像检测、图像分割和图像分类等领域取得惊人进展。其在医学图像的目标分类与识别、定位与检测、组织器官与病灶的分割等方面得到广泛的应用和发展,为临床医学中各种重大疾病的筛查、诊断、治疗计划、疗效评估和随访提供先进、高效的技术手段与解决方案。
利用深度学习方法对WSI图像进行识别、分类是目前热门研究方向之一,然而由于单张WSI图像像素尺寸高达千兆级,常规的深度学习方法仅适用于数百*数百尺寸的图像,无法直接应用于整张WSI图像。因此,研究人员通常采取的解决方案是:对整张WSI图像进行无重叠、无间隙的等尺寸切块(patch),然后通过遍历的方式使用预训练的卷积神经网络模型对逐个patch分类判断,最后将所有patch的分类结果拼接还原到原尺寸WSI图像,进而实现识别病理图像异常区域的功能。该方法的优点是不存在漏检现象,但缺点也同样明显,存在遍历效率低、计算耗时长、还原图像噪声大的问题。
发明内容
本发明的目的是:提供一种高效、准确的数字病理切片异常区域快速检测方法,帮助病理医生日常初步快速筛选图像异常区域。
为了达到上述目的,本发明的技术方案是提供了一种数字病理切片异常区域快速检测的方法,其特征在于,包括以下步骤:
步骤1、图像预处理:对全视野数字病理切片WSI图像进行颜色标准化和非组织区域去除,形成最终有效的组织区域,并将该组织区域初始化为ROI区域,有效的组织区域内所有坐标点称为ROI区域的点集;
步骤2、在ROI区域内按已定义的切块patch尺寸进行拟蒙特卡洛采样,通过预训练的深度卷积神经网络模型S0计算每个采样切块patch的分类概率值,切块patch尺寸与深度卷积神经网络模型S0相匹配,包括以下步骤:
步骤2.1、对步骤1得到的ROI区域按切块patch尺寸进行n轮迭代的拟蒙特卡洛采样,具体的包括如下步骤:
步骤2.1.1、将ROI区域按坐标的行顺序,降维至一维连续坐标序列;
步骤2.1.2、采用单维度Sobol序列生成器生成拟蒙特卡洛随机采样点,单维度Sobol序列生成器在概率空间中产生均匀分布的、以2为基数的、维度为1的低差异伪随机的随机数生成序列;除第一轮迭代外,每一轮生成的待确认的采样点数量为3m,每一轮最终确认的采样点数量为m,其中第一轮生成的待确认的采样点数量为m;
步骤2.1.3、在由单维度Sobol序列生成的随机数生成序列的基础上乘以一维连续坐标序列长度,得到相应的m个伪随机一维采样点,如下式(1)所示:
Pqmc=Round(Length(LROI)×Sobol(dim,X))    (1)
式(1)中,Pqmc代表生成的由m个伪随机一维采样点组成的伪随机一维采样点集;Round(·)函数代表四舍五入取整;Length(·)函数代表获取集合长度;LROI代表ROI区域的一维连续坐标序列点集;Sobol(·)函数代表按照不同维度生成随机数序列;dim设置为1;在第一轮迭代过程的采样中,X∈[1,m],m∈R,R代表实数集合,生成的伪随机一维采样点的数量为m;在第i轮迭代过程的采样中,每轮X∈[(3i-5)×m+1,(3i-2)×m],i=2,…,n,生成的伪随机一维采样点的数量为3m;
步骤2.2、根据步骤2.1得到m个伪随机一维采样点代表的切块patch集,通过预训练的深度卷积神经网络模型S0计算每个采样切块patch的分类概率值,概率值范围在[0,1]区间;
步骤3、根据步骤2得到的采样点分类概率值,构建基于切块patch尺度的异常区域分类概率的多重二次曲面,选取ROI区域的异常区域分类概率曲面,并计算该异常区域中每个切块patch点对应的概率变化幅度,最终得到的ROI区域的异常区域分类概率曲面和相应的概率变化幅度,包括以下步骤:
步骤3.1、根据步骤2生成的离散的伪随机一维采样点坐标和基于切块patch尺度的分类概率值,采用多重二次曲面函数对异常区域分类概率曲面进行曲面构建,获得ROI区域的异常区域分类概率曲面f,曲面构建过程中,所使用的多重二次曲面函数Φ(r)公式如式(2)所示:
Figure GDA0004112733420000031
式(2)中,Φ(r)代表多重二次曲面函数;r代表构建点x距伪随机一维采样点c的半径;ε代表伪随机一维采样点集Pqmc之间的近似平均距离;
步骤3.2、利用7×7尺寸的Sobol算子分别计算ROI区域的异常区域分类概率曲面f在水平方向x和垂直方向y的概率变化幅度,生成异常区域分类概率曲面f的概率变化向量
Figure GDA0004112733420000032
Sx代表水平方向x的Sobol算子,Sx=a×bT,Sy代表垂直方向y的Sobol算子,Sy=b×aT,a和b分别代表两个设定的一维矩阵,a=[1 4 5 0 -5-4 1],b=[1 6 15 20 156 1];
然后根据下式(3)的范数公式计算ROI区域的概率变化幅度:
Figure GDA0004112733420000033
式(3)中,‖f‖ROi代表f的概率变化幅度,
Figure GDA0004112733420000034
代表沿图像沿水平方向x的概率变化幅度,
Figure GDA0004112733420000035
代表沿图像沿竖直方向y的概率变化幅度;
步骤4、将步骤3中最终使用的异常区域中的切块patch点的点数与ROI区域的点集数量进行对比,当确认的切块patch点的点数小于异常区域的总点数时,进入步骤5,准备新一轮的迭代计算;当确认的切块patch点的点数大于ROI区域的总点数,迭代终止,进入步骤6,产生最终的预测结果;
步骤5、将步骤3中ROI区域的概率变化幅度‖f‖ROI高于设定阈值的子区域作为新一轮迭代的ROI区域,重复执行步骤2和步骤3,除第一轮迭代外,每轮迭代过程中由Sobol序列产生器产生3m个伪随机采样的采样点,并且选取m个概率变化幅度‖f‖ROI较大的采样点,作为当前轮数的最终采样点,其中新一轮迭代的ROI区域,即密集迭代采样区域,其中,每轮迭代之间的ROI区域关系如式(4)所示:
Figure GDA0004112733420000041
式(4)中,ROIi代表第i轮的采样点感兴趣区域,h代表第i轮中大于梯度中位数‖f‖median的梯度变化大的感兴趣区域,ROIi+1代表第i+1轮的采样点感兴趣区域,当i=1时,ROI1代表步骤1获得的有效组织区域;
步骤6、完成步骤2、3、4、5的迭代,获得最后一轮迭代的ROI区域的异常区域分类概率曲面f,设置异常区域分类概率的阈值,得到最终的整个全视野数字病理切片WSI图像的异常区域检测结果R,其中:异常区域分类概率的阈值与异常区域R的关系如下式(5)所示:
Figure GDA0004112733420000042
式(5)中,1值代表异常区域,0值代表正常区域,T代表异常区域分类概率的阈值。
优选地,所述步骤1包括:
步骤1.1、对待识别的全视野数字病理切片WSI图像进行颜色标准化,以降低颜色敏感性;
步骤1.2、对步骤1.1得到的全视野数字病理切片WSI图像进行非组织区域去除,达到通过减少非组织区域提高异常区域分类效率,其中,非组织区域去除方法包括以下步骤:首先将RGB通道的全视野数字病理切片WSI图像转灰度单通道的全视野数字病理切片WSI图像,然后对灰度单通道的全视野数字病理切片WSI图像滤波降噪,最后使用二值化阈值分割操作分割全视野数字病理切片WSI图像的组织和背景区域,以实现单独、快速提取有效组织区域,达到去除非组织区域的效果;
步骤1.3、将步骤1.2提取的有效组织区域初始化为ROI区域,该ROI区域作为后续拟蒙特卡洛采样的限制区域,其目的在于,减少非组织区域的检测,将注意力集中在组织区域,从而在提高异常区域的检测速率的同时保持异常区域的检测准确性。
优选地,所述步骤2中,预训练的深度卷积神经网络模型S0利用专业的病理医生标注的病理图像训练得到的深度卷积神经网络预测模型,模型训练包括以下步骤:首先将全视野数字病理切片WSI图像进行切块处理,然后将1:1比例的阳性切块patch和阴性切块patch数据集输入到深度卷积神经网络模型中进行训练,从而获得能够得到切块patch图像分类概率的深度卷积神经网络模型S0,其中:阳性切块patch数据集为包含/半包含异常区域的小块,阴性切块patch数据集为不包含异常区域的小块。
本发明基于拟蒙特卡洛抽样(quasi-Monte Carlo sampling)方法,先对整张WSI图像进行采样计算,构建异常区域分类概率的多重二次曲面,计算该ROI区域的概率变化幅度,再对ROI区域概率变化幅度较高的子区域增加采样密度,进一步循环计算,经数次迭代,形成整张WSI的异常区域检测结果。从而,在保证识别准确性的前提下,大大减少WSI异常区域识别的计算成本、加快识别速度、提高识别效率。
附图说明
图1为一种数字病理切片异常区域快速检测的方法的总体框架流程图;
图2为一种数字病理切片异常区域快速检测的方法的WSI图像预处理过程示意图;
其中,图2中的(a)为预处理流程示意图;
图2中的(b)为有效组织区域结果示意图;
图3为一种数字病理切片异常区域快速检测的方法的深度卷积神经网络模型预训练过程示意图;
其中,图3中的(a)为各占50%数据比例的阳性阴性训练patch数据集示意图;
图3中的(b)为用于训练预测异常区域的泛化深度卷积神经网络模型示意图;
图4为一种数字病理切片异常区域快速检测的方法的图像采样过程示意图;
其中,图4中的(a)为初始化的ROI区域示意图;
图4中的(b)为ROI区域按坐标的行顺序降维示意图;
图4中的(c)为一维Sobol序列生成示意图;
图4中的(d)为一维伪随机采样点示意图;
图4中的(e)为还原到原尺寸WSI图像的采样点示意图;
图5为一种数字病理切片异常区域快速检测的方法的异常区域分类概率曲面和变化幅度的构建示意图;
图6为一种数字病理切片异常区域快速检测的方法的ROI区域选取过程示意图;
图7为一种数字病理切片异常区域快速检测的方法的WSI图像异常区域检测结果示意图;
其中,图7中的(a)为最后一轮迭代的异常区域分类概率曲面和变化幅度示意图;
图7中的(b)为异常阈值下的异常区域检测结果示意图。
具体实施方式
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
本发明提出一种数字病理切片异常区域快速检测的方法,其总体流程框架如图1所示,包括如下步骤:
步骤1、图像预处理,对全视野数字病理切片WSI图像进行颜色标准化和非组织区域去除,形成最终有效的组织区域,并将其初始化为ROI区域。步骤1的具体流程如图2中的(a)所示,包括以下步骤:
步骤1.1、由于病理细胞本身的颜色和承载病理细胞的载玻片经过一定的医学操作呈现不同颜色,为降低颜色敏感性,对待识别的全视野数字病理切片WSI图像进行颜色标准化;
步骤1.2、对步骤1.1颜色标准化后的全视野数字病理切片WSI图像进行非组织区域去除,达到通过减少非组织区域提高异常区域分类效率。其中非组织区域去除方法流程为:首先将RGB通道的全视野数字病理切片WSI图像转灰度单通道的全视野数字病理切片WSI图像,然后对灰度单通道的全视野数字病理切片WSI图像滤波降噪,最后使用二值化阈值分割操作分割全视野数字病理切片WSI图像的组织和背景区域,以实现单独、快速提取有效组织区域,达到去除非组织区域的效果。
本实施方式中,步骤1.2所述的图像滤波降噪包括高斯滤波、中值滤波以及拉普拉斯滤波中的一种或多种。所述的二值化阈值分割操作包括Otsu阈值分割、自适应阈值分割、最大熵阈值分割中的一种或多种。所述的有效组织区域如图2中的(b)所示。
步骤1.3、将步骤1.2提取的有效组织区域初始化为ROI区域,该ROI区域作为后续拟蒙特卡洛采样的限制区域,其目的在于,减少非组织区域的检测,将注意力集中在组织区域,从而在提高异常区域的检测速率的同时保持异常区域的检测准确性。
步骤2:在ROI区域内按已定义的切块patch尺寸进行拟蒙特卡洛采样,通过预训练的深度卷积神经网络模型S0计算每个采样切块patch的分类概率值。
本实施方式中,步骤2所述的切块patch尺寸为固定大小的病理切片图像小块的尺寸,其固定大小值与深度卷积神经网络模型S0相匹配。
本实施方式中,预训练的深度卷积神经网络模型S0是利用专业的病理医生标注的病理图像训练得到的深度卷积神经网络预测模型,具体的首先将全视野数字病理切片WSI图像进行切块patch处理,然后将1:1比例的阳性切块patch数据集和阴性切块patch数据集输入到深度卷积神经网络模型中进行训练,从而获得能够得到切块patch图像分类概率的深度卷积神经网络模型S0。其中阳性切块patch数据集为包含/半包含异常区域的小块,阴性切块patch数据集为不包含异常区域的小块。
本实施方式中,1:1比例的阳性切块patch数据集和阴性切块patch数据集示意图如图3中的(a)所示,其中,黑色小块代表阳性切块patch,白色小块代表阴性切块patch。
本实验方式中,深度卷积神经网络模型包括但不局限于Inception-V3、VGG-19、ResNet-50中的一种或多种,深度卷积神经网络模型示意图如图3中的(b)所示。
步骤2具体包括以下步骤:
步骤2.1、对步骤1.3得到的ROI区域按切块patch尺寸进行n轮迭代的拟蒙特卡洛采样,具体的包括如下步骤:
步骤2.1.1、将ROI区域按坐标的行顺序,降维至一维连续坐标序列,初始的ROI区域如图4中的(a)所示,降维后的坐标序列如图4中的(b)所示;
步骤2.1.2、采用单维度Sobol序列生成器生成拟蒙特卡洛随机采样点,如图4中的(c)所示。单维度Sobol序列生成器能够在概率空间中产生均匀分布的、以2为基数的、维度为1的低差异伪随机的随机数生成序列。除第一轮迭代外,每一轮生成的待确认的采样点数量为3m,每一轮最终确认的采样点数量为m,其中第一轮生成的待确认的采样点数量为m;
具体的,步骤2.1.2所述的采样点数量m依据全视野数字病理切片WSI图像的尺寸进行选择;
步骤2.1.3:在由Sobol序列产生的随机数的基础上乘以一维连续坐标序列长度,得到相应的m个伪随机采样坐标,如图4中的(d)所示,如式(1)所示:
Pqmc=Round(Length(LRII)×Sobol(dim,X))    (1)
式(1)中,Pqmc代表生成的由m个伪随机一维采样点组成的伪随机一维采样点集;Round(·)函数代表四舍五入取整;Length(·)函数代表获取集合长度;LROI代表ROI区域的一维连续坐标序列点集;Sobol(·)函数代表按照不同维度生成随机数序列;dim设置为1;在第一轮迭代过程的采样中,X∈[1,m],m∈R,R代表实数集合,生成的伪随机一维采样点的数量为m;在第i轮迭代过程的采样中,每轮X∈[(3i-5)×m+1,(3i-2)×m],i=2,…,n,生成的伪随机一维采样点的数量为3m。
本实施方式中,由于每个一维连续坐标映射一个相应的二维图像坐标,通过步骤2.1.3的式(1)和映射关系,即可实现基于切块patch的二维拟蒙特卡洛随机采样,如图4中的(e)所示。
步骤2.2、根据步骤2.1得到随机采样点代表的切块patch集,然后通过预训练的外部深度卷积神经网络模型s0计算每个采样切块patch的分类概率值,概率值范围在[0,1]区间;
步骤3、根据步骤2得到的的采样点分类概率值,构建基于patch尺度的异常区域分类概率的多重二次曲面,选取ROI区域的异常区域分类概率曲面,并计算该区域中每个切块patch点对应的概率变化幅度。最终得到的ROI区域的异常区域分类概率曲面和相应的概率变化幅度示意图如图5所示。
步骤3.1、根据步骤2生成的离散采样点坐标和基于切块patch尺度的异常区域分类概率值,采用多重二次曲面函数对整张图的异常区域分类概率曲面进行曲面构建,获得ROI区域的异常区域分类概率曲面f。曲面构建过程中,所使用的多重二次曲面函数如式(2)所示:
Figure GDA0004112733420000091
式(2)中,Φ(r)代表多重二次曲面函数;r代表构建点x距伪随机一维采样点c的半径;ε代表伪随机一维采样点集Pqmc之间的近似平均距离。
步骤3.2、利用7×7尺寸的Sobol算子分别计算ROI区域的异常区域分类概率曲面f在水平方向x和垂直方向y的概率变化幅度,生成异常区域分类概率曲面f的概率变化向量
Figure GDA0004112733420000092
Sx代表水平方向x的Sobol算子,Sx=a×bT,Sy代表垂直方向y的Sobol算子,Sy=b×aT,a和b分别代表两个设定的一维矩阵,a=[1 4 5 0 -5-4 1],b=[1 6 15 20 156 1],符号T代表矩阵转置。
然后根据下式(3)的范数公式计算ROI区域的概率变化幅度:
Figure GDA0004112733420000093
式(3)中,‖f‖ROI代表f的概率变化幅度,
Figure GDA0004112733420000094
代表沿图像沿水平方向x的概率变化幅度,
Figure GDA0004112733420000095
代表沿图像沿竖直方向y的概率变化幅度。
本实施方式中,在卷积计算过程中,将二维矩阵拆成两个一维矩阵a和b依次与异常区域分类概率曲面f卷积,从而加快卷积操作的速度。
步骤4、将步骤3中最终使用的待确认的采样点与ROI区域点数进行对比,当确认的采样点数小于ROI区域的总点数时,进入步骤5,准备新一轮的迭代计算;当确认的采样点数大于ROI区域的总点数,迭代终止,进入步骤6,产生最终的预测结果。
步骤5、将步骤3中ROI区域的概率变化幅度‖f‖ROI高于设定阈值的子区域作为新一轮迭代的ROI区域,重复执行步骤2和步骤3,除第一轮迭代外,每轮迭代过程中由Sobol序列产生器产生3m个伪随机采样的采样点,并且选取m个概率变化幅度‖f‖ROI较大的采样点,作为当前轮数的最终采样点。其中新一轮迭代的ROI区域,即密集迭代采样区域,如图6所示的灰色区域。
具体的,步骤5所述的选取概率变化幅度‖f‖ROI高于设定阈值,其阈值的选择可以为‖f‖ROI的中位数,但不限于此选择。基于此得到的子区域作为新一轮迭代的ROI区域的理由是,该子区域代表异常区域分类概率变化程度较大的区域,在该子区域内进行密集迭代采样,能够体现异常区域分类概率的变化趋势,从而在不大幅损失准确率的前提下,加速异常区域的检测效率。
具体的,每轮迭代之间的ROI区域关系如式(4)所示:
Figure GDA0004112733420000101
式(4)中,ROIi代表第i轮的采样点感兴趣区域,h代表第i轮中大于梯度中位数‖f‖median的梯度变化大的感兴趣区域,ROIi+1代表第i+1轮的采样点感兴趣区域,当i=1时,ROI1代表步骤1获得的有效组织区域。
步骤6、完成步骤2、3、4、5的迭代,获得最后一轮迭代的ROI区域的异常区域分类概率图f,设置异常区域分类概率的阈值,得到最终的整个WSI的异常区域检测结果R。
具体的,步骤6所述的最后一轮迭代的ROI区域的异常区域分类概率图f,如图7中的(a)所示。
具体的,步骤6所述的异常区域分类概率的阈值为一固定值T,如一具体实例中为0.8,但不局限于此值,具体的依据最终的测试精度进行选择。
具体的,步骤6所述的异常区域分类概率的阈值与异常区域R的关系如式(5)所示:
Figure GDA0004112733420000102
其中,R代表高度疑似异常区域的二值图,1值代表异常区域,0值代表正常区域,f代表第n轮的ROI区域的异常区域分类概率图,T代表异常区域分类概率的阈值。
具体的,步骤6所述的异常区域R,如图7中的(b)所示,其中的黑色区域代表异常区域,白色区域代表正常区域。

Claims (3)

1.一种数字病理切片异常区域快速检测的方法,其特征在于,包括以下步骤:
步骤1、图像预处理:对全视野数字病理切片WSI图像进行颜色标准化和非组织区域去除,形成最终有效的组织区域,并将该有效的组织区域初始化为ROI区域,有效的组织区域内所有坐标点称为ROI区域的点集;
步骤2、在ROI区域内按已定义的切块patch尺寸进行拟蒙特卡洛采样,通过预训练的深度卷积神经网络模型S0计算每个采样切块patch的分类概率值,切块patch尺寸与深度卷积神经网络模型S0相匹配,包括以下步骤:
步骤2.1、对步骤1得到的ROI区域按切块patch尺寸进行n轮迭代的拟蒙特卡洛采样,具体的包括如下步骤:
步骤2.1.1、将ROI区域按坐标的行顺序,降维至一维连续坐标序列;
步骤2.1.2、采用单维度Sobol序列生成器生成拟蒙特卡洛随机采样点,单维度Sobol序列生成器在概率空间中产生均匀分布的、以2为基数的、维度为1的低差异伪随机的随机数生成序列;除第一轮迭代外,每一轮生成的待确认的采样点数量为3m,每一轮最终确认的采样点数量为m,其中第一轮生成的待确认的采样点数量为m;
步骤2.1.3、在由单维度Sobol序列生成的随机数生成序列的基础上乘以一维连续坐标序列长度,得到相应的m个伪随机一维采样点,如下式(1)所示:
Pqmc=Round(Length(LROI)×Sobol(dim,X))    (1)
式(1)中,Pqmc代表生成的由m个伪随机一维采样点组成的伪随机一维采样点集;Round(·)函数代表四舍五入取整;Length(·)函数代表获取集合长度;LROI代表ROI区域的一维连续坐标序列点集;Sobol(·)函数代表按照不同维度生成随机数序列;dim设置为1;在第一轮迭代过程的采样中,X∈[1,m],m∈R,R代表实数集合,生成的伪随机一维采样点的数量为m;在第i轮迭代过程的采样中,每轮X∈[(3i-5)×m+1,(3i-2)×m],i=2,…,n,生成的伪随机一维采样点的数量为3m;
步骤2.2、根据步骤2.1得到m个伪随机一维采样点代表的切块patch集,通过预训练的深度卷积神经网络模型S0计算每个采样切块patch的分类概率值,概率值范围在[0,1]区间;
步骤3、根据步骤2得到的采样点分类概率值,构建基于切块patch尺度的异常区域分类概率的多重二次曲面,选取ROI区域的异常区域分类概率曲面,并计算该异常区域中每个切块patch点对应的概率变化幅度,最终得到的ROI区域的异常区域分类概率曲面和相应的概率变化幅度,包括以下步骤:
步骤3.1、根据步骤2生成的离散的伪随机一维采样点坐标和基于切块patch尺度的分类概率值,采用多重二次曲面函数对异常区域分类概率曲面进行曲面构建,获得ROI区域的异常区域分类概率曲面f,曲面构建过程中,所使用的多重二次曲面函数Φ(r)公式如式(2)所示:
Figure FDA0004089789190000021
式(2)中,Φ(r)代表多重二次曲面函数;r代表构建点x距伪随机一维采样点c的半径;ε代表伪随机一维采样点集Pqmc之间的近似平均距离;
步骤3.2、利用7×7尺寸的Sobol算子分别计算ROI区域的异常区域分类概率曲面f在水平方向x和垂直方向y的概率变化幅度,生成异常区域分类概率曲面f的概率变化向量
Figure FDA0004089789190000022
Sx代表水平方向x的Sobol算子,Sx=a×bT,Sy代表垂直方向y的Sobol算子,Sy=b×aT,a和b分别代表两个设定的一维矩阵,a=[1 4 5 0-5-4 1],b=[1 6 15 20 15 61];
然后根据下式(3)的范数公式计算ROI区域的概率变化幅度:
Figure FDA0004089789190000023
式(3)中,‖f‖ROI代表f的概率变化幅度,
Figure FDA0004089789190000024
代表沿图像沿水平方向x的概率变化幅度,
Figure FDA0004089789190000025
代表沿图像沿竖直方向y的概率变化幅度;
步骤4、将步骤3中最终使用的异常区域中的切块patch点的点数与ROI区域的点集数量进行对比,当确认的切块patch点的点数小于异常区域的总点数时,进入步骤5,准备新一轮的迭代计算;当确认的切块patch点的点数大于ROI区域的总点数,迭代终止,进入步骤6,产生最终的预测结果;
步骤5、将步骤3中ROI区域的概率变化幅度‖f‖ROI高于设定阈值的子区域作为新一轮迭代的ROI区域,重复执行步骤2和步骤3,除第一轮迭代外,每轮迭代过程中由Sobol序列产生器产生3m个伪随机采样的采样点,并且选取m个概率变化幅度‖f‖ROI较大的采样点,作为当前轮数的最终采样点,其中新一轮迭代的ROI区域,即密集迭代采样区域,其中,每轮迭代之间的ROI区域关系如式(4)所示:
Figure FDA0004089789190000031
式(4)中,ROIi代表第i轮的采样点感兴趣区域,h代表第i轮中大于梯度中位数‖f‖median的梯度变化大的感兴趣区域,ROIi+1代表第i+1轮的采样点感兴趣区域,当i=1时,ROI1代表步骤1获得的有效组织区域;
步骤6、完成步骤2、3、4、5的迭代,获得最后一轮迭代的ROI区域的异常区域分类概率曲面f,设置异常区域分类概率的阈值,得到最终的整个全视野数字病理切片WSI图像的异常区域检测结果R,其中:异常区域分类概率的阈值与异常区域R的关系如下式(5)所示:
Figure FDA0004089789190000032
式(5)中,1值代表异常区域,0值代表正常区域,T代表异常区域分类概率的阈值。
2.如权利要求1所述的一种数字病理切片异常区域快速检测的方法,其特征在于,所述步骤1包括:
步骤1.1、对待识别的全视野数字病理切片WSI图像进行颜色标准化,以降低颜色敏感性;
步骤1.2、对上一步得到的全视野数字病理切片WSI图像进行非组织区域去除,其中,非组织区域去除方法包括以下步骤:首先将RGB通道的全视野数字病理切片WSI图像转灰度单通道的全视野数字病理切片WSI图像,然后对灰度单通道的全视野数字病理切片WSI图像滤波降噪,最后使用二值化阈值分割操作分割全视野数字病理切片WSI图像的组织和背景区域,以实现单独、快速提取有效组织区域,达到去除非组织区域的效果;
步骤1.3、将步骤1.2提取的有效组织区域初始化为ROI区域,该ROI区域作为后续拟蒙特卡洛采样的限制区域。
3.如权利要求1所述的一种数字病理切片异常区域快速检测的方法,其特征在于,所述步骤2中,预训练的深度卷积神经网络模型S0利用专业的病理医生标注的病理图像训练得到的深度卷积神经网络预测模型,模型训练包括以下步骤:
首先将全视野数字病理切片WSI图像进行切块处理,然后将1:1比例的阳性切块patch和阴性切块patch数据集输入到深度卷积神经网络模型中进行训练,从而获得能够得到切块patch图像分类概率的深度卷积神经网络模型S0,其中:阳性切块patch数据集为包含/半包含异常区域的小块,阴性切块patch数据集为不包含异常区域的小块。
CN201911146210.0A 2019-11-21 2019-11-21 一种数字病理切片异常区域快速检测的方法 Active CN111047559B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911146210.0A CN111047559B (zh) 2019-11-21 2019-11-21 一种数字病理切片异常区域快速检测的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911146210.0A CN111047559B (zh) 2019-11-21 2019-11-21 一种数字病理切片异常区域快速检测的方法

Publications (2)

Publication Number Publication Date
CN111047559A CN111047559A (zh) 2020-04-21
CN111047559B true CN111047559B (zh) 2023-04-18

Family

ID=70232861

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911146210.0A Active CN111047559B (zh) 2019-11-21 2019-11-21 一种数字病理切片异常区域快速检测的方法

Country Status (1)

Country Link
CN (1) CN111047559B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111681236B (zh) * 2020-06-12 2022-05-17 成都数之联科技股份有限公司 一种带注意力机制的目标密度估计方法
CN111986102B (zh) * 2020-07-15 2024-02-27 万达信息股份有限公司 一种数字病理图像去模糊方法
CN112419253B (zh) * 2020-11-16 2024-04-19 中山大学 数字病理图像分析方法、系统、设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108765408A (zh) * 2018-05-31 2018-11-06 杭州同绘科技有限公司 构建癌症病理图像虚拟病例库的方法以及基于卷积神经网络的多尺度癌症检测系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10223610B1 (en) * 2017-10-15 2019-03-05 International Business Machines Corporation System and method for detection and classification of findings in images
CN109410194B (zh) * 2018-10-19 2022-03-29 山东省计算中心(国家超级计算济南中心) 一种基于深度学习的食管癌病理图像处理方法
CN109493346B (zh) * 2018-10-31 2021-09-07 浙江大学 一种基于多损失的胃癌病理切片图像分割方法和装置
CN110378885B (zh) * 2019-07-19 2023-07-04 王晓骁 一种基于机器学习的wsi病灶区域自动标注方法及系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108765408A (zh) * 2018-05-31 2018-11-06 杭州同绘科技有限公司 构建癌症病理图像虚拟病例库的方法以及基于卷积神经网络的多尺度癌症检测系统

Also Published As

Publication number Publication date
CN111047559A (zh) 2020-04-21

Similar Documents

Publication Publication Date Title
US10783641B2 (en) Systems and methods for adaptive histopathology image unmixing
CN111047559B (zh) 一种数字病理切片异常区域快速检测的方法
CN111105424A (zh) 淋巴结自动勾画方法及装置
US20080101676A1 (en) System and Method For Segmenting Chambers Of A Heart In A Three Dimensional Image
CN109903282B (zh) 一种细胞计数方法、系统、装置和存储介质
CN105809175B (zh) 一种基于支持向量机算法的脑水肿分割方法及系统
Nateghi et al. A deep learning approach for mitosis detection: application in tumor proliferation prediction from whole slide images
CN112348059A (zh) 基于深度学习的多种染色病理图像分类方法及系统
CN105913425B (zh) 一种基于自适应椭圆分块和小波变换的多猪轮廓提取方法
Sun et al. Algorithm of adaptive fast clustering for fish swarm color image segmentation
CN110021019B (zh) 一种aga临床图像的ai辅助毛发的粗细分布分析方法
Elguebaly et al. Bayesian learning of generalized gaussian mixture models on biomedical images
Dewan et al. A method for automatic segmentation of nuclei in phase-contrast images based on intensity, convexity and texture
Samsi et al. Colorization of H&E stained tissue using Deep Learning
CN112508860B (zh) 一种免疫组化图像核阳性的人工智能判读方法及系统
CN110930369B (zh) 一种基于群等变神经网络和条件概率场的病理切片识别方法
CN108830802B (zh) 一种基于短曝图像梯度导向的图像模糊核估计方法
CN116468923A (zh) 一种基于加权重采样聚类不稳定性的图像强化方法及装置
Li et al. Assessing Test-time Variability for Interactive 3D Medical Image Segmentation with Diverse Point Prompts
CN113689950B (zh) 肝癌ihc染色图的血管分布模式的识别方法、系统和存储介质
CN117496276B (zh) 肺癌细胞形态学分析、识别方法及计算机可读存储介质
CN117315378B (zh) 一种尘肺病的分级判定方法及相关设备
Magoulianitis et al. HUNIS: High-Performance Unsupervised Nuclei Instance Segmentation
CN117745736A (zh) 一种基于元学习的跨域小样本ct图像语义分割系统及方法
Zacharia et al. An unsupervised and fully-automated image analysis method for cDNA microarrays

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant