CN114140445A

CN114140445A - 基于重点关注区域提取的乳腺癌病理图像识别方法

Info

Publication number: CN114140445A
Application number: CN202111479700.XA
Authority: CN
Inventors: 郑魁; 丁维龙; 朱峰龙; 赵樱莉; 刘津龙
Original assignee: Shanghai Paiying Medical Technology Co ltd
Current assignee: Shanghai Paiying Medical Technology Co ltd
Priority date: 2021-12-06
Filing date: 2021-12-06
Publication date: 2022-03-04
Anticipated expiration: 2041-12-06
Also published as: CN114140445B

Abstract

本发明公开了一种基于重点关注区域提取的乳腺癌病理图像识别方法，其特征在于，包括：对全切片病理图像进行划分为多个相同尺寸的划分区域；并基于划分区域上获得包含重要信息的区域，将所述包含重要信息的区域输入到分类网络，以通过分类网络计算出每一个图像块的患癌概率值；针对所述全切片病理图像的图像块，根据患癌概率值进行排序，并在基于网格筛选机制去除异常值，获取第一数量个图像块的特征，将所获取的特征输入到LSTM网络模型中，计算所述全切片病理图像的分类结果。有效提高图像识别的准确率和运行效率，为投入实际临床辅助诊断提供可能。

Description

基于重点关注区域提取的乳腺癌病理图像识别方法

技术领域

本发明涉及乳腺癌病理图像识别技术领域，尤其涉及一种基于重点关注区域提取的乳腺癌病理图像识别方法。

背景技术

统计数字表明乳腺癌在全球女性癌症中的发病率为24.2％，随着科技的进步尤其是数字显微镜和扫描仪的出现，可以将传统载玻片数字化为数字病理切片 (whole slideimage，WSI)。一方面有利于病理学家摆脱在光学显微镜下耗时地搜寻病变区域，另一方面也让精准医疗出现可能，降低病理医生人工检查的主观性。因此众多学者将研究精力投入到计算机辅助诊断乳腺癌方向。

一般地，病理图像的分类会经过三个步骤：1)图像预处理；2)特征提取； 3)预测建模。传统特征提取主要依赖人工提取特征并结合机器学习学习人工所提取的特征，从而进行新的病历图像的判断。虽然这种方法能够得到较为有代表性的特征信息，但是存在耗时耗力的缺陷且需要专业的病理学知识。此外，通过人工提取特征难以覆盖到整个特征空间，导致这类方法的泛化能力不强，无法应用到临床诊断当中。

发明内容

本发明的目的在于提供一种基于重点关注区域提取的乳腺癌病理图像识别方法，旨在有效提高图像识别的准确率和运行效率，为投入实际临床辅助诊断提供可能。

为了实现上述目的，本发明提供一种基于重点关注区域提取的乳腺癌病理图像识别方法，包括：

基于预设窗口，对全切片病理图像进行划分为多个相同尺寸的划分区域；

在每一个划分区域上基于软注意力机制赋予每一个像素点一个权重值，并将每一个划分区域裁剪为多个尺寸相同的图像块，获得包含重要信息的区域，其中，所述包含重要信息的区域为图像块的权重值不小于预设阈值；

将所述包含重要信息的区域输入到分类网络，以通过分类网络计算出每一个图像块的患癌概率值；

针对所述全切片病理图像的图像块，根据患癌概率值进行排序，并在基于网格筛选机制去除异常值，获取第一数量个图像块的特征，其中，所述第一数量个图像块由患癌概率值所对应的图像块的数量所决定；

将所获取的特征输入到LSTM网络模型中，计算所述全切片病理图像的图像级分类结果。

一种实现方式中，所述对全切片病理图像进行划分为多个相同尺寸的划分区域的步骤，包括：

通过OpenSlide库对全切片病理图像进行读取，并按预设倍数对所述全切片病理图像进行缩小处理；

针对缩小后的全切片病理图像，去除超过预设比例的白色背景区域，得到去背景后全切片病理图像；

采用尺寸为1024×1024像素的滑动窗口，对所述去背景后全切片病理图像进行区域划分，以得到多个相同尺寸的划分区域。

一种实现方式中，所述在每一个划分区域上基于软注意力机制赋予每一个像素点一个权重值，并将每一个划分区域裁剪为多个尺寸相同的图像块，获得包含重要信息的区域的步骤后，包括：

在每一个划分区域上，基于软注意力机制赋予每一个像素点一个权重值，

将每一个划分区域裁剪为若干个大小为224×224像素的图像块，若图像块的权重均值超过预设阈值，则确定为包含重要信息的区域。

将全切片病理图像缩放至原来的16倍，然后将RGB色彩空间的图像转化为灰度图，在灰度图上使用Otsu算法得到阈值，用该阈值进行图像阈值二值化；

利用形态学操作，先使用开运算去除病理图像掩码中的小点和毛刺，通过闭运算填平掩码中的间隙；

通过大小为1024×1024像素值的滑动窗口，在所述掩码，以1000像素值的步长进行划分区域，以获得多个相同尺寸的划分区域。

一种实现方式中，所述将每一个划分区域裁剪为若干个大小为224×224像素的图像块，若图像块的权重均值超过预设阈值，则确定为包含重要信息的区域的步骤，包括：

将每一个划分区域输入到选择网络中，得到一个大小为1024×1024像素的权重矩阵；并将其进行裁剪为224×224像素值大小的图像块，相邻的图像块之间重叠像素值为20；

判断图像块的权重均值是否大于指定阈值；

将权重均值大于指定阈值的图像块确定为包含重要信息的区域。

一种实现方式中，所述将所述包含重要信息的区域输入到分类网络，以通过分类网络计算出每一个图像块的患癌概率值的步骤，包括：

包含重要信息的区域输入到分类网络中，经过卷积运算判定该patch是否癌变；

保存每一个包含重要信息的区域的癌变概率值，及其在分类网络中特征提取层的向量，作为特征向量。

一种实现方式中，所述针对所述全切片病理图像的图像块，根据患癌概率值进行排序，并在基于网格筛选机制去除异常值，获取第一数量个图像块的特征的步骤，包括：

S41：对同一个全切片病理图像中的所有图像块根据其患癌概率值进行排序；

S42：按照排序结果，对每一个图像块P_i，将与其相邻的多张图像块，记作 P_i+k，，输入到分类网络中判别其癌变性质，其中，P_i+n的相关系数设定为第一相关系数数值，P_i+m的相关系数设定为第二相关系数数值，P_i+r的相关系数设定为第三相关系数数值，对P_i图像块执行网格筛选策略，其中，n是与图像块P_i具有第一位置关系的图像块的数量，m是与图像块P_i具有第二位置关系的图像块的数量，k是与图像块P_i具有第三位置关系的图像块的数量；其具体策略如下：

a)若P_i判为第一结果，并且在设定的网格中，基于位置关系和设定的相关系数值判别为第一结果的图像块的相关系数累加和大于总和的一半，则认为该图像块判别结果正确，所述第一结果为有癌症或者无癌症中的一种；

b)若P_i判为第二结果，并且在设定的网格中，基于位置关系判别为第二结果的图像块的相关系数累加和小于等于总和的一半，则认为该图像块的判别结果为异常值，所述第二结果为有癌症或者无癌症中的一种，其中，所述总和为所述设定的网格中所有图像块的相关系数之和；

S43：重复步骤S42，直到选择出第一数量个判读正确的图像块，取其在分类网络的特征提取层中的特征向量；

S44：将提取出的第一数列个图像块的特征作为序列数据，输入到S5中计算得到图像级预测结果。

一种实现方式中，所述将所获取的特征输入到LSTM网络模型中，计算所述全切片病理图像的分类结果的步骤，包括：

S51：在时刻t时，LSTM网络的输入包括当前的图像块P_t、上一个时刻的输出值H_t-1以及上一时刻的单元状态C_t-1，其中，在初始时刻，H₀和C₀初始化为零张量；

S52：将前一个时刻t-1的输出值H_t-1和P_t进行拼接，然后通过矩阵运算得到一个遗忘门的输出f_t(0≤f_t≤1)；

S53：通过f_t与C_t-1进行按元素相乘，记作F_t，以确定上一时刻的单元状态 C_t-1中，其每个元素的值有多少保留到当前时刻C_t；

S54：将前一个时刻t-1的输出值H_t-1和P_t进行拼接，然后通过矩阵运算得到一个输入门的输出i_t和一个当前输入的单元状态

其中，0≤i_t≤1

S55：将i_t与

进行按元素相乘，结果记作I_t；

S56：将I_t与F_t相加得到最终时刻t的单元状态C_t；

S57：重复步骤S51至S56，当最后一个图像块的特征输入到LSTM网络中，得到该时间步对应的单元状态C_ε，然后连接全连接层，得到全切片病理图像的分类结果，其中，ε为图像块的数量。

本发明所提出的方法能够筛除乳腺病理图像中大部分与癌变无关区域，从而有效提高模型的精度和效率。

本发明实施例中，首先针对基于滑动窗口裁剪全图乳腺病理图像产生的大量图像块patch，以及基于硬注意力机制的方法会造成信息丢失和冗余的问题。然后，本发明提出的重要区域提取方法能够有效降低模型计算量，提高模型的精度；再通过重点区域提取，在该区域中使用多示例方法更具针对性；针对病理图像中存在困难样本的情况，本发明提出基于网格筛选机制的方法去除异常值。本发明的技术途径更符合临床病理医生对切片进行判读的过程，契合临床应用场景。

附图说明

图1是本发明一种基于重点关注区域提取的乳腺癌病理图像识别方法的一种流程示意图。

图2是本发明实施例提供的网格图。

具体实施方式

以下通过特定的具体实例说明本发明的实施方式，本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本发明的精神下进行各种修饰或改变。

乳腺癌病理图像的分类和定位是一个极具挑战的问题。主要来源于以下几个方面：1)病理图像尺寸规模过大，通常一张乳腺癌全切片图像(whole slide image)的大小为数十亿像素(比如64000×64000)，受限于目前的算力，直接处理整张病理图像比较困难；2)来自不同病理实验室和不同光学显微镜扫描形成的数字病理图像一般会存在染色上的差异。

由于数字病理图像的超像素特性，难以通过一个阶段就解决图像分类问题。一般需要经过两个阶段，1)将全切片图像裁剪成patch，然后输入到卷积神经网络中进行训练；2)利用训练好的卷积神经网络提取patch特征，然后进行融合，最后输入到分类器中(常用的分类器有随机森林，支持向量机等)。L.Hou等人训练一个patch级分类器，然后基于期望最大值方法去自动定位有判别力的 patch，进而融合基于patch的分类结果。但是直接融合patch的特征存在缺陷，因为数字病理图像中存在很多与癌变区域颜色、形态和纹理类似的正常组织(本发明称之为困难样本)，而这些困难样本会导致将无癌patch识别为有癌patch，使得基于patch的特征融合过程出现偏差。本发明把patch性质被判错的情况称为异常值。针对基于patch提取特征容易出现异常值的问题，Xi Wang等人研究了不同的上下文感知块选择和特征聚合策略，以生成整体的WSI特征描述符。他们所提出的block思想是将一个较大尺寸的图像(884×884像素)看成多个 patch(244×244像素)的组合。他们假设同一个block中的patch具有相似的性质。然后对block中的所有patch患癌概率取均值，若该block是无癌的区域，则通过取均值可以将无癌判为有癌的patch过滤；若其是有癌区域，则可以通过取均值可以将有癌判为无癌的patch过滤，最终达到去除异常值的作用。block 思想能够通过取均值过滤模型判错的情况，但是在一个block中，相邻patch的重叠区域一般会超过86％，这导致某个异常值的周围大概率也是异常值。一般地，使用滑动窗口的方法能够避免在裁剪patch的过程中丢失异常组织区域，但是会产生众多与癌变区域无关的patch，导致计算量和噪声的大幅增加，从而会降低模型的分类性能。

鉴于此，本发明首先提出一种重要区域选择的方法，将原始全切片数字病理图像划分为重要区域和非重要区域，然后主要针对重要区域进行特征提取和癌症判别。其次，本发明还提出基于网格筛选去除异常值的方法。在考虑patch 上下文信息的同时，通过网格筛选机制避免相邻patch的互相影响。然后在获取 WSI全局特征描述时，结合摩尔近邻思想去除异常值。本发明通过对国内外现有文献和国内现有发明的调研发现，和本发明提出的网格筛选机制类似的思想还未见报道。

判别组织病理图像中的区域是否重要，一般包括两种方法：1)基于硬注意力机制的方法；2)基于软注意力机制的方法。硬注意力机制的目的是从病理图像中找出感兴趣区域(region of interest，ROI)，然后在ROI中进行细致划分 patch；而软注意力机制是给予每一个像素点一个权重，从而区分不同像素之间的重要性。由于全切片图像尺寸过大，更多的研究倾向于使用硬注意力机制。 Talha Qaiser等人构建了一种基于深度强化学习方法的新模型，能够从分辨率为千兆像素的全切片图像中，依次识别出一些与诊断相关的感兴趣区域，有效地降低了组织病理图像分析的计算量。Bolei Xu等人提出一种新的混合注意力方法来进行乳腺图像有无癌变的分类。他们先是通过硬视觉注意力从原始图像中选取一系列粗糙区域，然后基于软注意力机制对每个区域进行研究。但这些基于硬注意力机制的方法，是根据坐标点从原始图像中随机选取感兴趣区域，然后从中裁剪patch。因此会造成过多信息丢失和冗余的情况。针对这些问题，本发明提出基于软注意力机制区分重要区域与非重要区域的方法，然后将权重高于阈值的patch输入到分类网络中，进行训练分类网络。通过大小为1024×1024 像素的窗口从原图中滑动选取区域，能够在考虑原图全部信息之后提取出重点关注区域，避免信息丢失和冗余。

如图1本发明提供一种基于重点关注区域提取的乳腺癌病理图像识别方法，包括：

S101，基于预设窗口，对全切片病理图像进行划分为多个相同尺寸的划分区域。

本发明实施例中，可以通过OpenSlide库对全切片病理图像进行读取，然后将图像缩小为原来的1/16倍，再使用Otsu方法去除占比过大的白色背景，随后通过一个大小为1024×1024像素的滑动窗口进行区域(big region，BR)划分。

具体操作中，例如，将原始乳腺病理图像缩放至原来的16倍，然后将RGB 色彩空间的图像转化为灰度图，在灰度图上使用Otsu算法得到阈值，用该阈值进行图像阈值二值化。在此基础之上，利用形态学操作，先使用开运算去除病理图像掩码中孤立的小点和毛刺等，然后通过闭运算填平掩码中的间隙。然后通过大小为1024×1024像素值的滑动窗口，在所获得的组织掩码上，以1000 像素值的步长进行区域的划分，以得到划分区域。

S102，在每一个划分区域上基于软注意力机制赋予每一个像素点一个权重值，并将每一个划分区域裁剪为多个尺寸相同的图像块，获得包含重要信息的区域，其中，所述包含重要信息的区域为图像块的权重值不小于预设阈值。

针对每一个每一个划分区域上，基于软注意力机制赋予每一个像素点一个权重值。然后将其裁剪为若干个大小为224×224像素的patch。若一个patch的权重均值超过指定阈值，则认为它是包含重要信息的区域。

具体的，通过稀疏染色分离的方法对patch进行颜色标准化操作，从而将其颜色分布转换到和目标图像一致，并保留其组织结构信息。

基于软注意力机制的方法具体实施过程如下：

a)通过尺寸为1024×1024像素的滑动窗口从原图上选取区域；

b)将该区域输入到选择网络中，得到一个大小为1024×1024像素的权重矩阵；并将其进行裁剪为224×224像素值大小的图像块，或者称为patch，相邻的 patch之间重叠像素值为20；

c)然后判断patch的权重均值是否大于指定阈值；

d)将权重均值大于指定阈值的patch作为包含重要信息的区域，并在接下来输入分类网络。

S103，将所述包含重要信息的区域输入到分类网络，以通过分类网络计算出每一个图像块的患癌概率值。

本发明实施例中的分类网络可以预先通过包含重要信息的区域对网络进行训练，在达到成熟的网络后可以直接使用。

本发明实施例中对每一个筛选出的patch，输入到分类网络中，经过卷积运算判定该patch是否癌变；保存每一个patch的癌变概率值，及其在分类网络中倒数第二层的向量，以作为特征向量。

S104，针对所述全切片病理图像的图像块，根据患癌概率值进行排序，并在基于网格筛选机制去除异常值，获取第一数量个图像块的特征，其中，所述第一数量个图像块由患癌概率值所对应的图像块的数量所决定。

S41：对同一个全切片病理图像(bag)中的所有图像块patch根据其患癌概率值进行排序。

S42：按照排序结果，对每一个patch P_i，将与其相邻的48张patch，如图2 所示，记作P_i+k(k＝1,2,…,48)，如图2所示在7*7的网格中除了patch P_i本身以外的其他patch，输入到分类网络中判别其癌变性质。其中，P_i+n(n＝1,2,..., 8)的相关系数设定为3(该部分为与patch P_i具有第一位置关系的图像块的数量，如图2所示，为7*7网格中与patch P_i相邻的8个图形)，P_i+m(m＝9,10,...,24) 的相关系数设定为2(该部分为与patch P_i具有第二位置关系的图像块的数量，如图2所示，为在第一方向上7*7网格中与第一位置关系的图像块所相邻的16 个图像块，该第一方向为远离图像块P_i的方向)，P_i+r(r＝25,26,...,48)的相关系数设定为1(该部分为与patch P_i具有第三位置关系的图像块的数量，如图 2所示，为在第一方向上7*7网格中与第二位置关系的图像块所相邻的24个图像块)。对patch P_i执行网格筛选策略，其具体策略如下：

a)若P_i判为有癌(或无癌)，并且在7×7的网格中(每个格子代表一个 patch，如图2所示)，判别为有癌(或无癌)的patch的相关系数累加和大于其总和的一半，则认为该patch判别结果正确。

b)若P_i判为有癌(或无癌)，并且在7×7的网格中，判别为有癌(或无癌)的patch的相关系数累加和小于等于其总和的一半，则认为该patch的判别结果为异常值。

S43：重复步骤S42，直到选择出K个判读正确的patch，取其在分类网络的特征提取层中的特征向量。

S44：将提取出的第一数量K个图像块(patch)特征看作序列数据，输入到S105中计算得到图像级预测结果。

S105，将所获取的特征输入到LSTM网络模型中，计算所述全切片病理图像的分类结果。

S51：在时刻t时，LSTM的输入包括当前的patch P_t、上一个时刻的输出值 H_t-1以及上一时刻的单元状态C_t-1，其中，在初始时刻，H₀和C₀初始化为零张量。

S52：将前一个时刻t-1的输出值H_t-1和P_t进行拼接，然后通过矩阵运算得到一个遗忘门(forget gate)的输出f_t(0≤f_t≤1)；

S53：通过f_t与C_t-1进行按元素相乘(记作F_t)，以确定上一时刻的单元状态C_t-1中，其每个元素的值有多少保留到当前时刻C_t；

S54：将前一个时刻t-1的输出值H_t-1和P_t进行拼接，然后通过矩阵运算得到一个输入门(input gate)的输出i_t(0≤i_t≤1)和一个当前输入的单元状态

S55：将i_t与

进行按元素相乘，结果记作I_t；

S56：将I_t与F_t相加得到最终时刻t的单元状态C_t；

阶段一是乳腺病理图像的重点区域提取，阶段二是基于MIL的分类网络训练。本发明所提出的方法能够在计算机辅助诊断乳腺病理图像过程中，首先通过第一阶段将WSI中正常组织区域和缺乏判断力的区域排除，起到明显降低计算量、过滤噪声的作用，并且对同一个窗口内的信息进行联系，融合空间信息；其次，通过第二个阶段的多示例方法，只需要提供图像级标注，区别于其他多示例方法，并不是选取单一或固定几个patch进行特征融合，而是通过摩尔近邻思想过滤异常值。经过两个阶段的协作，能够有效提高模型的准确率和运行效率，为投入实际临床辅助诊断提供可能。

不同于以往的硬注意力机制存在的信息丢失和冗余等缺陷，本发明通过 1024×1024的窗口，一方面赋予窗口内的像素以一定权重来区分其重要性，另一方面通过长短时记忆网络融合了同一个窗口内的patch，充分考虑了空间信息。因此，在过滤掉大部分无关信息之后，本发明提出的方法能够明显提高模型效率和准确度。

本发明所提出的多示例学习方法并不是选取患癌概率最高的patch或者是固定几个patch，而是通过摩尔近邻思想，筛选异常值，进一步提高模型的精度和鲁棒性。

上述实施例仅例示性说明本发明的原理及其功效，而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下，对上述实施例进行修饰或改变。因此，举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变，仍应由本发明的权利要求所涵盖。

Claims

1.一种基于重点关注区域提取的乳腺癌病理图像识别方法，其特征在于，包括：

2.根据权利要求1所述的基于重点关注区域提取的乳腺癌病理图像识别方法，其特征在于，所述对全切片病理图像进行划分为多个相同尺寸的划分区域的步骤，包括：

3.根据权利要求1所述的基于重点关注区域提取的乳腺癌病理图像识别方法，其特征在于，所述在每一个划分区域上基于软注意力机制赋予每一个像素点一个权重值，并将每一个划分区域裁剪为多个尺寸相同的图像块，获得包含重要信息的区域的步骤后，包括：

4.根据权利要求1或2所述的基于重点关注区域提取的乳腺癌病理图像识别方法，其特征在于，所述对全切片病理图像进行划分为多个相同尺寸的划分区域的步骤，包括：

5.根据权利要求3所述的基于重点关注区域提取的乳腺癌病理图像识别方法，其特征在于，所述将每一个划分区域裁剪为若干个大小为224×224像素的图像块，若图像块的权重均值超过预设阈值，则确定为包含重要信息的区域的步骤，包括：

判断图像块的权重均值是否大于指定阈值；

6.根据权利要求1-5任一项所述的基于重点关注区域提取的乳腺癌病理图像识别方法，其特征在于，所述将所述包含重要信息的区域输入到分类网络，以通过分类网络计算出每一个图像块的患癌概率值的步骤，包括：

7.根据权利要求6所述的基于重点关注区域提取的乳腺癌病理图像识别方法，其特征在于，所述针对所述全切片病理图像的图像块，根据患癌概率值进行排序，并在基于网格筛选机制去除异常值，获取第一数量个图像块的特征的步骤，包括：

S42：按照排序结果，对每一个图像块P_i，将与其相邻的多张图像块，记作P_i+k，，输入到分类网络中判别其癌变性质，其中，P_i+n的相关系数设定为第一相关系数数值，P_i+m的相关系数设定为第二相关系数数值，P_i+r的相关系数设定为第三相关系数数值，对P_i图像块执行网格筛选策略，其中，n是与图像块P_i具有第一位置关系的图像块的数量，m是与图像块P_i具有第二位置关系的图像块的数量，k是与图像块P_i具有第三位置关系的图像块的数量；其具体策略如下：

8.根据权利要求6所述的基于重点关注区域提取的乳腺癌病理图像识别方法，其特征在于，所述将所获取的特征输入到LSTM网络模型中，计算所述全切片病理图像的分类结果的步骤，包括：

S53：通过f_t与C_t-1进行按元素相乘，记作F_t，以确定上一时刻的单元状态C_t-1中，其每个元素的值有多少保留到当前时刻C_t；

其中，0≤i_t≤1

S55：将i_t与

进行按元素相乘，结果记作I_t；

S56：将I_t与F_t相加得到最终时刻t的单元状态C_t；