CN113706493B

CN113706493B - 基于dct频率自适应选择的数字病理全切片分割方法

Info

Publication number: CN113706493B
Application number: CN202110962248.6A
Authority: CN
Inventors: 郑钰山; 罗伟; 姜志国; 张浩鹏; 谢凤英
Original assignee: Beihang University
Current assignee: Beihang University
Priority date: 2021-08-20
Filing date: 2021-08-20
Publication date: 2024-03-22
Anticipated expiration: 2041-08-20
Also published as: CN113706493A

Abstract

本发明公开了一种基于DCT频率自适应选择的数字病理全切片分割方法，包括以下步骤：基于CNN‑based网络架构将训练样本中的所有全切片分别分割成若干个图像块，并对每个图像块进行JPEG解码操作，得到DCT编码；对DCT编码进行数据重排和频率自适应选择得到DCT压缩编码块；利用DCT压缩编码块对预先构建的CNN分类模型进行训练；基于训练好的CNN分类模型对待检测全切片中所有图像块的DCT压缩编码块进行分类预测，得到待检测全切片范围的预测结果图。本发明利用JPEG压缩图像解码过程的中间结果离散余弦(DCT)编码块，经过自适应的频率选择得到DCT压缩编码块代替原图像块进行网络的训练、预测，使输入数据量得到大幅度削减，使所需的分类模型的尺寸更小、推理速度更快。

Description

基于DCT频率自适应选择的数字病理全切片分割方法

技术领域

本发明涉及数字病理全切片图像处理技术领域，更具体的说是涉及一种基于DCT频率自适应选择的数字病理全切片分割方法。

背景技术

癌症是现代人类健康的重要威胁，在医学领域，基于组织切片的病理学诊断是癌症诊断的“金标准”。随着扫描仪成像技术的发展，数字病理全切片图像因其易于保存、易于传输等优点被迅速普及，加速了癌症远程诊断的发展，与此同时基于深度学习的计算机辅助诊断算法也逐渐成为了该领域的一个研究热点。

与自然图像有所区别，数字病理全切片图像本身具有的超高像素尺寸，使其在处理过程中受限于计算机硬件水平。如图1所示，现有算法对数字病理全切片图像的分割主要分为两种主流思路，一者先将其分割为若干个图像块分别利用卷积神经网络(convolutional neural network,CNN)进行特征提取以获得局部特征进行标签预测，而后按原空间顺序排布单张图像块的标签配合适当的上采样形成分割掩膜结果。而此种方法只能生成图像块级别的分割结果使得边界较为模糊，同时又需对成千上万张图像块进行预测，CPUs与GPUs传输间的带宽限制分析的速度。另一者则利用全卷积网络(fullyconvolutional network，FCN)采用滑窗法对每一窗口的图像进行像素级别的预测，直接能够得到和输入尺寸大小相同的分割掩膜图。但由于此种方法需要通过大量的交叠区域来保证窗口边界分割的平滑和准确，进而造成计算的冗余和耗时的增加。

图1中的框架是现有解决数字病理全切片图像分割中最为高效的一种方法，该方案主要问题描述如下：在整个自动分析流程中，基于CNN的数字病理全切片图像分块预测，其产生的成千上万个图像块在CPUs上预处理后传输到GPUs上进行加速预测的过程中受到带宽的极大限制，实际工程中严重拖慢了计算机自动分析的时间，使现有方法的运行效率远不能满足医生使用需要；为了尽量缩减分析时长，现有算法大多依赖GPU计算，使得自动分析应用部署成本居高不下，难以在医疗经济落后的地区广泛普及。因此，如何提高计算机的分析速度是本领域技术人员亟需解决的问题。

发明内容

有鉴于此，本发明提供了一种基于DCT频率自适应选择的数字病理全切片分割方法，在CNN-based分割思路下，利用JPEG压缩图像解码过程的中间结果离散余弦(DCT)编码块，经过自适应的频率选择得到DCT压缩编码块代替原图像块进行网络的训练、预测，使输入数据量得到大幅度削减，使所需的分类模型的尺寸更小、推理速度更快。

为了实现上述目的，本发明采用如下技术方案：

一种基于DCT频率自适应选择的数字病理全切片分割方法，包括以下步骤：

基于CNN-based网络架构将训练样本中的所有全切片分别分割成若干个图像块，并对每个图像块进行JPEG解码操作，得到DCT编码；

对DCT编码进行数据重排和频率自适应选择得到DCT压缩编码块；

利用DCT压缩编码块对预先构建的CNN分类模型进行训练；

基于训练好的CNN分类模型对待检测全切片中所有图像块的DCT压缩编码块进行分类预测，得到待检测全切片范围的预测结果图。

可选的，在上述一种基于DCT频率自适应选择的数字病理全切片分割方法中，所述对每个图像块进行JPEG解码操作，得到DCT编码，包括以下步骤：

从云端下载得到每个图像块的JPEG二进制码流数据；

从JPEG二进制码流数据中提取出霍夫曼编码表和量化表；

以霍夫曼编码表为基础进行反编码操作，得到Zigzag编码块；以量化表为基础对Zigzag编码块进行反量化操作，得到DCT编码。

优选的，在上述一种基于DCT频率自适应选择的数字病理全切片分割方法中，所述对DCT编码进行数据重排，包括以下步骤：

按照4:1:1的采样格式对DCT编码的Y、Cb、Cr三个通道进行数据重排操作，得到对应三个通道的DCT编码，每个通道的DCT编码的表达式如下：

其中，W、H分别表示原RGB格式图像块的高、宽；/>表示8×8分块的DCT编码中第i行第j列的内容，其含义是图像块中对应8×8位置通道c的DCT变换，M、N分别为D_c包含DCT编码块的行数和列数；/>中由0至63个编号的位置，分别代表64个从低到高的频率分量信息，其中0代表直流分量，低频段集中在左上角，高频段集中在右下角；

将三个通道的DCT编码中每一个8×8分块的DCT编码块中相同频率按照原空间位置关系组成一个通道，即将/>拉伸为1×1×64维度的向量，按其原来所在行列排布，得到转换后的DCT编码/>

将D'_Cb和D'_Cr上采样2倍后与D'_Y拼接，得到DCT频率块D'，其中，

优选的，在上述一种基于DCT频率自适应选择的数字病理全切片分割方法中，所述对DCT编码进行频率自适应选择，包括以下步骤：

基于SENet通道注意力方法构建频率自适应选择模型；

在对频率自适应选择模型的训练阶段，设置一个维度为1×192、固定值初始化的向量，并使该向量依次经过全连接层、Relu激活层和全连接层映射到隐空间的1×192维度连续值向量G；

对1×192维度连续值向量G进行二值化处理，得到1×192维度的0-1值阀门”G'；利用0-1值阀门”G'控制该频率通道保留与否，其中0值代表舍弃该频率分量，1值代表保留该频率分量；

将0-1保阀门”G'与DCT频率块D'相作用，得到DCT压缩编码块F，DCT压缩编码块F的表达式如下：

其中，C为保留下的频率数量，压缩率为C/192，由DCT压缩编码块F代替原图像块作为预先构建的CNN分类模型训练过程的输入数据。

优选的，在上述一种基于DCT频率自适应选择的数字病理全切片分割方法中，在对频率自适应选择模型的训练阶段，还包括以下步骤：

利用回归损失函数L1Loss对0-1o阀门”G'进行稀疏化处理，以加大数据压缩率，其表达式如下所示：

其中，x'表示1×192维度连续值向量G，x表示1×192维度的“阀门”期望值，x_i表示x中第i个元素；x_i'表示x'中第i个元素；

采用分类交叉熵损失函数CELoss对分类效果进行验证，其表达式如下所示：

其中，y'表示样本属于该类别的预测概率，y表示预测类别与真实类别是否相同的指示变量，y_i表示y中第i个元素，y_i'表示y’中第i个元素；

按照下式确定训练过程的loss值：

Loss＝CELoss+β*L1Loss；

其中，超参数β用来控制0-1“阀门”G'的稀疏化程度，其可影响保留的频率数量C。

可选的，在上述一种基于DCT频率自适应选择的数字病理全切片分割方法中，β和C的取值如下：β＝0.03，C＝3；或β＝0.01，C＝5；或β＝0.007，C＝8；或β＝0.005，C＝10。

优选的，在上述一种基于DCT频率自适应选择的数字病理全切片分割方法中，所述基于训练好的CNN分类模型对待检测全切片中所有图像块的DCT压缩编码块进行分类预测，得到待检测全切片范围的预测结果图，包括以下步骤：

利用训练好的CNN分类模型对待检测全切片中所有图像块的DCT压缩编码块F进行预测，得到一系列标签；

将得到的一系列标签按照原图像块的空间位置进行聚合和上采样，得到待检测全切片范围的预测结果图。

优选的，在上述一种基于DCT频率自适应选择的数字病理全切片分割方法中，所述将得到的一系列标签按照原图像块的空间位置进行聚合和上采样，得到待检测全切片范围的预测结果图，包括：

初始化一张全黑掩膜图其中I_w,I_h为待检测全切片的高和宽，W,H为图像块的高和宽；

将每一张图像块得到的标签作为全黑掩膜图MASK在该图像块所在全切片中位置处的像素值；

分别以倍率进行上采样，得到与全切片图像大小相同的分割掩膜结果图。

可选的，在上述一种基于DCT频率自适应选择的数字病理全切片分割方法中，所述CNN分类模型的主体架构为ResNet，DenseNet或EfficientNet。

经由上述的技术方案可知，与现有技术相比，本发明公开提供了一种基于DCT频率自适应选择的数字病理全切片分割方法，以JPEG图像解码过程中产生的DCT编码进行数据重排、频率自适应选择得到的DCT压缩编码块代替原图像块对CNN分类模型进行训练和推理，由于其大幅削减的数据量使得分类模型具备轻量化、对GPUs依赖低、批处理数量大等特点，提高了数字病理全切片图像的分割速度，减轻了计算机癌症辅助诊断的部署成本。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1附图为本发明提供的现有技术中面向数字病理云平台的全切片分割方法的典型框架；

图2附图为本发明提供的基于DCT频率自适应选择的数字病理全切片分割方法的流程图；

图3附图为本发明提供的频率组适应选择的流程图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图2所示，本发明实施例公开了一种基于DCT频率自适应选择的数字病理全切片分割方法，包括以下步骤：

步骤一：基于CNN-based网络架构将训练样本中的所有全切片分别分割成若干个图像块，并对每个图像块进行JPEG解码操作，得到DCT编码；

步骤二：对DCT编码进行数据重排和频率自适应选择得到DCT压缩编码块；

步骤三：利用DCT压缩编码块对预先构建的CNN分类模型进行训练；

步骤四：基于训练好的CNN分类模型对待检测全切片中所有图像块的DCT压缩编码块进行分类预测，得到待检测全切片范围的预测结果图。

下面对上述各步骤进行详细描述：

步骤一：数据获取与解压

以表示组成该切片的第p行第q列的图像块，W、H分别表示图像块的高、宽。图像块在云端以JPEG压缩编码形式存储。

采用基于CNN-based的分割思路，对所有全切片中所有图像块的操作都完全相同。

为了便于表述，令T＝I_pq表示全切片中的任一图像块。首先从云端下载得到图像块T的JPEG二进制码流数据，然后从中提取出霍夫曼编码表和量化表，以霍夫曼编码表为基础进行反编码，而后又根据标准Zigzag表进行Zigzag反编码，得到Zigzag编码块；再按照从JPEG二进制码流数据中提取出的量化表对Zigzag编码块进行反量化等操作便可得到离散余弦变换(DCT)编码,该部分的计算完全依照标准JPEG压缩格式进行，使用libJPEG等公开算法库即可完成DCT编码的解析。

步骤二：DCT编码重排

实际应用中，解析得到的DCT编码呈现3个通道，其存储的内容分别来自于YCbCr颜色空间的Y、Cb、Cr通道，受到JPEG图像采样率一般为4:1:1的影响，来自Y通道的DCT编码与原图大小相同，是Cb、Cr通道的四倍，分别用表示，W、H分别表示原RGB格式图像块的高、宽，如图3(b)DCT编码所示，三个通道的DCT编码的表达式如下所示：

其中，表示8×8分块DCT编码中第i行第j列的内容，其含义是图像块T中对应8×8位置通道c的DCT变换，M、N分别为D_c包含编码块的行数和列数。如图3(a)Zigzag编码所示，/>中由0至63个编号的位置，分别代表64个从低到高的频率分量信息，其中0代表直流分量，低频段集中在左上角，而高频段集中在右下角。对于3个DCT编码块，首先经过如图3的数据重排操作，将每一个8×8分块DCT编码块/>中相同频率按照原空间位置关系组成一个通道，即将/>拉伸为1×1×64维度的向量，按其原来所在行列排布，得到转换后的DCT编码/> 而后将D'_Cb、D'_Cr上采样2倍后与D'_Y拼接(通道拼接)得到最后DCT频率块/>如图3(c)所示。

DCT编码频率自适应选择：

上述得到的DCT编码D'由来自于YCbCr颜色空间的共192个频率分量组成，其数据量与图像块T相同。前期实验可知，低频分量所含关键模式信号远多于高频分量，因此为了达到数据量压缩的目的，本发明采用一种类似于SENet通道注意力的方法构建频率自适应选择模型。在对频率自适应选择模型的训练阶段，如图3(d)所示，首先设置一个维度为1×192、固定值初始化的向量，此192维度对应于全部共192个频率分量的抉择与否，再经过全连接层、Relu激活层、全连接层映射到隐空间的1×192维度连续值向量而后二值化得到1×192维度的0-1“阀门”/>来控制该频率通道保留与否，其中0值代表舍弃该频率分量，1值代表保留该频率分量。然后将其与DCT频率块D'相作用，可得图3(e)离散余弦特征块(DCT压缩编码块)F，其表达式如下所示：

其中，C为保留下的频率数量，压缩率为C/192,后续网络中则由DCT压缩编码快F代替原图像块作为输入数据，完成对CNN分类模型的训练和推理。

为了加大数据压缩率，在对频率自适应选择模型的训练阶段，采用回归损失函数L1Loss使该0-1“阀门”稀疏化(即0值占比)，

其中，x'表示频率选择模块产生的G，x表示1×192维度的“阀门”期望值，x_i'表示x'中第i个元素；x_i表示x中第i个元素；n表示输入向量的维度，此处n＝192，实验中为取最少频率数，设置为1×192维度的全0向量。

采用分类交叉熵损失(CELoss)来保证分类效果，

其中，y'表示样本属于该类别的预测概率，y表示预测类别与真是类别是否相同的指示变量，y_i'表示y'中第i个元素，y_i表示y中第i个元素。具体训练Loss值如下

Loss＝CELoss+β*L1Loss

其中，超参数β用来控制“阀门”的稀疏化程度，即可影响保留的频率数量C，即超参数β取值越大，稀疏化程度越大，则保留的频率数量C越少，反之亦然。为使该频率自适应选择模型快速稳定，保证训练达到一定轮次后频率通道选择跳动幅度较小，本发明实施例设计了两个优化器分别对频率自适应选择模型和CNN分类模型的学习率采用不同的衰减速度，能够使频率自适应选择模型较早稳定，以便后续进一步训练CNN分类模型。

在一个具体实施例中，设置最终训练轮次epoch为40次，初始学习率learningrate均为0.01，频率自适应选择模型在每经过7轮训练后，学习率降为原1/10，而CNN分类模块则在每经过15轮训练后，学习率降为原1/10。

在对频率自适应选择模型的测试阶段，固定频率自适应选择模型取得最高精度的最佳通道选择“阀门”G'，对于测试的每一个图像块，以该方案选择频率分量。频率自适应选择模型的参数与数据集分布特点相关，与单张图像块数据无关，因此，对于每一数据集，有其相适应的最佳频率选择方案。

上述DCT编码频率自适应选择的压缩率取值可按照工程需要选取。压缩率越高，切片分析精度越低；反之亦然。

在一个具体实施例中，推荐取值β＝0.03，可控制C＝3；取值β＝0.01可控制C＝5；取值β＝0.007可控制C＝8；取值β＝0.005可控制C＝10。

步骤三：CNN分类模型的训练

对数字病理全切片图像中所包含的所有图像块I_pq实现压缩编码得到的DCT压缩编码块F可代替原图像块用作XNN分类模型的训练以及推理。由于只涉及幅面大小和通道数目的改变，后续使用的CNN分类模型的卷积核会自动适应该尺寸的输入，可用基础模型包括但不限于ResNet，DenseNet，EfficientNet等。

步骤四：全切片图像快速分割

利用训练好的CNN分类模型对全切片所有图像块的DCT压缩编码块F预测得到一系列标签；初始化一张全黑掩模图，其中I_w,I_h为全切片图像的高和宽，W,H为图像块的大小。将每一张图像块得到的标签序号作为MASK在该图像块所在全切片中位置处的像素值；而后，经过长宽分别上采样/>倍率得到与全切片图像大小相同的分割掩膜结果。

本发明以JPEG图像解码过程中产生的DCT编码进行数据重排、频率自适应选择得到的DCT压缩编码快F代替原图像块进行CNN分类模型的训练和推理，由于其大幅削减的数据量使得CNN分类模型轻量化、GPUs依赖低、批处理数量大等特点，提高了数字病理全切片图像的分割速度，减轻了计算机癌症辅助诊断的部署成本。以C＝8为例，其压缩率达到1/24，能够达到与以RGB为输入的基准网络相近的分割精度。

实验验证：

本发明方法在子宫内膜癌病理数据集中进行了验证，选取EfficientNet-b0为基础分类模型，在使用本发明分类与以RGB输入的基础模型的分类精度对比结果如表1所示：

表1子宫内膜癌病理数据集分类精度对比

方法	输入尺寸、格式	分类精度	输入比
				本发明	28×28×8DCT	91.42	0.04
EfficientNet-b0	224×224×3RGB	92.60	1.0

本发明方法和以RGB输入的基础模型在数字病理全切片图像上的分割速度对比结果如表2所示：

表2子宫内膜癌病理数据集分割速度对比

方法	输入尺寸、格式	DSC	Accuracy	GPUs占用	分析时间
						本发明	28×28×8DCT	0.811	0.810	3470M	11s
EfficientNet-b0	224×224×3RGB	0.832	0.811	17200M	23s

实验结果表明，采用本发明的分割方法，频率自适应选择的索引是Y通道的[0,1]频率分量、Cb通道的[0,5]频率分量、Cr通道的[0,5,6,7]频率分量，精度与基于RGB图像的分割方法十分接近，但速度提高50％以上，且对GPUs依赖较小。

本发明从JPEG压缩原理出发，对提取出的DCT编码特征进行频率自适应选择来压缩数据量，在保证相近分析精度的同时，大幅削减了计算量，同时也减少了全切片自动分析框架对GPU计算的依赖。这一优势意味着搭载本发明全切片压缩编码模块的分析算法无需在专门搭建的高性能GPU计算服务器(包括云服务器)上运行，取而代之可以在多元化个人终端，包括手机、平板电脑、个人办公计算机等轻量化硬件中运行，实现计算的去中心化，使该领域产品的服务方式更加灵活多变。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种基于DCT频率自适应选择的数字病理全切片分割方法，其特征在于，包括以下步骤：

利用DCT压缩编码块对预先构建的CNN分类模型进行训练；

基于训练好的CNN分类模型对待检测全切片中所有图像块的DCT压缩编码块进行分类预测，得到待检测全切片范围的预测结果图；

对DCT编码进行频率自适应选择，包括以下步骤：

基于SENet通道注意力方法构建频率自适应选择模型；

对1×192维度连续值向量G进行二值化处理，得到1×192维度的0-1值“阀门”G'；利用0-1值“阀门”G'控制该频率通道保留与否，其中0值代表舍弃该频率分量，1值代表保留该频率分量；

将0-1值“阀门”G'与DCT频率块D'相作用，得到DCT压缩编码块F，DCT压缩编码块F的表达式如下：

其中，C为保留下的频率数量，压缩率为C/192，由DCT压缩编码块F代替原图像块作为预先构建的CNN分类模型训练过程的输入数据；W、H分别表示原RGB格式图像块的高、宽，C为保留下的频率数量，T表示图像块。

2.根据权利要求1所述的一种基于DCT频率自适应选择的数字病理全切片分割方法，其特征在于，所述对每个图像块进行JPEG解码操作，得到DCT编码，包括以下步骤：

从云端下载得到每个图像块的JPEG二进制码流数据；

从JPEG二进制码流数据中提取出霍夫曼编码表和量化表；

3.根据权利要求1所述的一种基于DCT频率自适应选择的数字病理全切片分割方法，其特征在于，所述对DCT编码进行数据重排，包括以下步骤：

其中，表示8×8分块DCT编码中第i行第j列的内容，其含义是图像块中对应8×8位置通道c的DCT变换，M、N分别为D_c包含DCT编码块的行数和列数；/>中由0至63个编号的位置，分别代表64个从低到高的频率分量信息，其中0代表直流分量，低频段集中在左上角，高频段集中在右下角；

将和/>上采样2倍后与D'_Y拼接，得到DCT频率块D'，其中，/>

4.根据权利要求1所述的一种基于DCT频率自适应选择的数字病理全切片分割方法，其特征在于，在对频率自适应选择模型的训练阶段，还包括以下步骤：

其中，y'表示样本属于该类别的预测概率，y表示预测类别与真实类别是否相同的指示变量，y_i表示y中第i个元素，y_i'表示y'中第i个元素；

按照下式确定训练过程的loss值：

Loss＝CELoss+β*L1Loss；

其中，超参数β用来控制0-1“阀门”G'的稀疏化程度，其影响保留的频率数量C。

5.根据权利要求4所述的一种基于DCT频率自适应选择的数字病理全切片分割方法，其特征在于，β和C的取值如下：β＝0.03，C＝3；或β＝0.01，C＝5；或β＝0.007，C＝8；或β＝0.005，C＝10。

6.根据权利要求4所述的一种基于DCT频率自适应选择的数字病理全切片分割方法，其特征在于，所述基于训练好的CNN分类模型对待检测全切片中所有图像块的DCT压缩编码块进行分类预测，得到待检测全切片范围的预测结果图，包括以下步骤：

7.根据权利要求6所述的一种基于DCT频率自适应选择的数字病理全切片分割方法，其特征在于，所述将得到的一系列标签按照原图像块的空间位置进行聚合和上采样，得到待检测全切片范围的预测结果图，包括：

8.根据权利要求1所述的一种基于DCT频率自适应选择的数字病理全切片分割方法，其特征在于，所述CNN分类模型的主体架构为ResNet，DenseNet或EfficientNet。