CN116091832A

CN116091832A - 基于自编码器网络的肿瘤细胞切片高光谱图像分类方法

Info

Publication number: CN116091832A
Application number: CN202310124577.2A
Authority: CN
Inventors: 张淼; 赵虹博; 邹春柳; 梁瑞东; 王艳; 沈毅
Original assignee: Harbin Institute of Technology
Current assignee: Harbin Institute of Technology
Priority date: 2023-02-16
Filing date: 2023-02-16
Publication date: 2023-05-09
Anticipated expiration: 2043-02-16
Also published as: CN116091832B

Abstract

本发明公开了一种基于自编码器网络的肿瘤细胞切片高光谱图像分类方法，所述方法包括如下步骤：步骤一：通过显微镜和高光谱成像仪得到肿瘤细胞切片的高光谱图像；步骤二：基于高光谱图像数据，分别进行基于线性回归的最小二乘拟合估计和基于非线性回归的高斯拟合估计，通过滑动窗口设置和三次样条插值法，将混合像元按线性和非线性混合程度进行区域划分；步骤三：基于变精度粗糙集方法处理高光谱图像解混数据，构建稀疏自编码器网络进行解混；步骤四：基于优化的卷积神经网络，对解混得到的端元及丰度结果进行分类，实现肿瘤细胞切片高光谱图像分类。本发明可以降低图像在空间分辨率上的精度要求，提高切片扫描效率，进一步缩短分析诊断时间。

Description

基于自编码器网络的肿瘤细胞切片高光谱图像分类方法

技术领域

本发明属于肿瘤细胞切片高光谱图像领域，涉及一种病变组织的病理切片高光谱图像分类方法，具体涉及一种基于高光谱成像、非线性区域探测、稀疏自编码器网络和卷积神经网络的高光谱病理图像分类方法。

背景技术

癌症是全球发病率高且较难治愈的恶性肿瘤疾病。目前，检测癌症的主要方法仍是对病变组织切片进行显微镜扫查，并作出病理诊断。传统的病理诊断方法需要专家观察切片的组织结构、细胞形态和染色情况等，并结合临床情况和其他检查结果做出诊断。这一过程往往需要一定时间才能得到准确结果，并且易受诊断专家主观经验等因素的影响。现在随着人工智能技术的发展，机器学习等方法被广泛用于医学领域研究。在肿瘤病理智能诊断领域，一般的人工智能方法是拍摄肿瘤组织病理切片在显微镜下的二维光学图像，训练分类模型，实现肿瘤细胞图像的分类。

而随着医学成像技术的发展，高光谱成像技术融合了光谱分析和光学成像两种诊断技术。相比于二维病理图像，高光谱病理图像可以得到具有图像信息和光谱信息的三维高光谱图像数据，其中的光谱维信息能够反映切片细胞组织的特征。对此高光谱病理图像数据进行解混可以得到不同细胞组织端元的丰度分布，基于这些丰度分布训练卷积神经网络模型，可以实现肿瘤细胞切片的分类诊断。同时，高光谱图像的空间分辨率一般低于二维彩色图片(这主要是由于高光谱成像仪前置的滤光环节大大降低了通光量，因此成像传感器不宜采取较大的分辨率)，但可以实现较高的光谱分辨率，有利于获得细胞组织的光谱特征。并且较低的空间分辨率可以获得更大的图像视野，缩短病理切片扫描的时间，进一步提高病理诊断的效率。

自编码器网络是一种典型的网络结构，其中的编码器能够对输入数据进行降维处理，以提取输入数据的内在特征，而解码器能够通过所提取的特征还原出原始数据，使还原出的数据和输入的原始数据尽可能相同。高光谱数据的内在特征就是每个像元中的端元组成及其所占的比例，即丰度。而高光谱解混的本质就是将端元和丰度不断组合，以得到最接近实际混合光谱的组合结果。因此，通过自编码器网络可以实现高光谱数据的解混和重构。

高光谱解混算法根据混合方式的不同可以分为线性模型和非线性模型。线性解混模型的物理意义明确，有计算复杂但精度低的特点。非线性解混模型需要考虑不同物质间的反射，模型较复杂，有计算复杂但精度高的特点。

粗糙集理论作为一种处理不精确、不确定、不完备知识的表示、分类、学习方法，已逐渐成为人工智能理论基础方向研究的重要分支，在机器学习、模式识别、医疗诊断等诸多领域有着丰富应用。粗糙集理论的核心思想是利用分类方法，将等价关系确定的等价类当作已知的知识集合，进而利用这些知识来表示任意的对象集。通过一对集值函数：上下接近算子，考虑已知知识包含于对象集还是至少与对象集相交不空，得到对象集在该已知知识框架下的近似范围。然而这种包含关系在现实应用中往往过于苛刻，基于此，Ziarko提出了基于一定包含程度的变精度粗糙集模型。变精度粗糙集模型的核心思想是在经典粗糙集中给出一个阈值，即允许在一定阈值范围内的错误分类率存在，因而变精度粗糙集是经典粗糙集的推广。

目前基于神经网络的图像分类算法应用广泛，特别是在医学图像分类方法研究中，卷积神经网络实现了较高的分类准确率。相比于其他卷积神经网络，GoogLeNet网络在模型的深度(层数)和宽度(层核或者神经元数)上进行了创新。在深度上，GoogLeNet的网络层数达到了22层。在宽度上，网络增加了多种卷积核为1*1、3*3、5*5的卷积层和最大池化层，同时采用集成化的模块设计，在增加的卷积层前和最大池化层后分别加上了1*1的卷积核进行降维处理，以达到减少数据量，增加计算效率的目的。

发明内容

为了克服传统肿瘤细胞切片病理诊断过程繁琐费时和诊断结果易受人为经验影响的问题，本发明提供了一种基于自编码器网络的肿瘤细胞切片高光谱图像分类方法。该方法通过基于最小二乘拟合估计和高斯拟合估计的非线性探测将高光谱图像数据中各像元按线性和非线性混合程度进行划分，再基于变精度的粗糙集方法进行处理，然后将高光谱数据输入稀疏自编码器网络进行无监督的线性或非线性解混，这样既提高了解混精度，又降低了整体的计算量，保证了解混效率，并且使用高光谱图像解混结果作为神经网络训练数据，可以降低切片图像空间分辨率要求，提高切片扫描效率，又可以提高光谱分辨率，有利于细胞特征提取。

本发明的目的是通过以下技术方案实现的：

一种基于自编码器网络的肿瘤细胞切片高光谱图像分类方法，包括如下步骤：

步骤一：通过显微镜和高光谱成像仪得到肿瘤细胞切片的高光谱图像；

步骤二：基于高光谱图像数据，分别进行基于线性回归的最小二乘拟合估计和基于非线性回归的高斯拟合估计，通过滑动窗口设置和三次样条插值法，将混合像元按线性和非线性混合程度进行区域划分；

步骤三：基于变精度粗糙集方法处理高光谱图像解混数据，构建稀疏自编码器网络进行解混；

步骤四：基于优化的卷积神经网络，对解混得到的端元及丰度结果进行分类，实现肿瘤细胞切片高光谱图像分类。

相比于现有技术，本发明具有如下优点：

1)本发明采用高光谱成像仪拍摄肿瘤细胞切片图像，可以得到细胞切片在不同光谱波段下的图像信息，实现较高的光谱分辨率，从而可以降低图像在空间分辨率上的精度要求，提高切片扫描效率，进一步缩短分析诊断时间。

2)本发明采用基于高斯拟合估计和最小二乘拟合估计的非线性混合区域探测算法对高光谱数据进行拟合误差估计，同时设置滑动窗口，对混合像元按区域进行线性和非线性混合程度划分，既实现了高光谱数据的混合区域探测，又防止了探测算法过拟合的现象。

3)本发明基于非线性混合区域探测算法，对高光谱图像数据进行了预处理，结合了线性和非线性解混模型的优点，既可以提高解混精度，又可以提高解混效率。同时，自编码器网络在满足丰度约束时不需额外加入惩罚项，减少了损失函数的复杂性，提高了网络的收敛速度。

4)本发明在对非线性混合区域探测算法划分好区域的高光谱数据进行解混前，使用基于变精度的粗糙集方法对不确定混合区域的像元先进行近似处理，从而构建稀疏自编码器网络进行解混。

5)本发明将高光谱图像用于肿瘤细胞病理诊断，相比于传统的二维光学图像，高光谱数据带有生物组织光谱维信息，利用解混得到的端元及丰度结果训练卷积神经网络，分类精度较高。

附图说明

图1为基于自编码器网络的肿瘤细胞切片高光谱图像分类方法的实施流程图。

图2为自编码器网络的结构图。

图3为卷积神经网络GoogLeNet的结构图。

具体实施方式

下面结合附图对本发明的技术方案作进一步的说明，但并不局限于此，凡是对本发明技术方案进行修改或者等同替换，而不脱离本发明技术方案的精神和范围，均应涵盖在本发明的保护范围中。

本发明提供了一种一种基于自编码器网络的肿瘤细胞切片高光谱图像分类方法，所述方法通过显微镜和高光谱相机得到肿瘤细胞切片的高光谱图像。基于高光谱图像数据，分别进行基于线性回归的最小二乘拟合估计和基于非线性回归的高斯拟合估计，由拟合误差计算统计量，通过滑动窗口处理将像元按线性和非线性混合程度进行划分。进一步基于变精度粗糙集方法处理划分好的高光谱数据，再输入到自编码器网络中，根据划分结果选择线性或非线性重构方式，将重构误差作为损失函数，从而得到编码器的输出即估计丰度，其与下一层的连接权重即为端元矩阵。以得到的端元及丰度结果作为训练集，训练优化的卷积神经网络模型，可实现肿瘤细胞切片的分类。

本发明实现的流程图如图1所示，共分为四个步骤，具体步骤如下：

步骤一：通过显微镜和高光谱成像仪得到肿瘤细胞切片的高光谱图像。

本发明中，高光谱成像系统由高光谱成像仪和显微镜组成，通过接口将高光谱成像仪与显微镜连接。将肿瘤细胞病理切片放至显微镜载物台，调整显微镜物镜放大倍率，使能够观察到清晰切片图像。由高光谱成像仪拍摄图片，光谱波段在350nm至1000nm范围内进行选择，选定N个波段。图像尺寸为sizeX×sizeY(sizeX、sizeY一般为偶数)。通过此高光谱成像仪可得到肿瘤细胞切片的高光谱图像。

步骤二：基于高光谱图像数据，分别进行基于线性回归的最小二乘拟合估计和基于非线性回归的高斯拟合估计，再通过设置滑动窗口和三次样条插值法，将混合像元X按线性和非线性混合程度进行区域划分。具体步骤如下：

步骤二一：对高光谱图像的所有混合像元X分别进行基于线性回归的最小二乘拟合估计和基于非线性回归的高斯拟合估计，其中：

混合像元X的混合模型数学表示可写为：

X＝f(a)+ξ

其中，ξ＝N(0，σ_n ²)，是零均值，方差函数为k(·,·)的高斯先验分布，a＝(a₁,...,a_M)^T是代表丰度的一个列向量。

假设非线性区域探测符合下面的假设检验问题：

其中，E是端元矩阵。当接受假设H₀，则标记像元是线性混合区域。当接受假设H₁，则标记像元是不确定混合区域。当接受假设H₂，则标记像元是非线性混合区域。

最小二乘拟合估计误差定义为：

其中，

是对混合像元的数学表示f(·)的最小二乘拟合估计量，

高斯拟合估计将训练集{E,X}分为输入的端元矩阵E和输出的混合像元X，对X的高斯先验分布为：

X～N(0,K+σ²I)

其中矩阵K的元素由输入e_i,e_j的核函数K_ij＝k(e_i,e_j)组成，I是d×d的单位矩阵。高斯拟合估计的目的是对新的端元输入拟合估计出其混合像元模型的数学表示f(A)，但本发明只需要估计现有的高光谱数据和模型间的拟合误差，不必使用新的数据输入。因此，高斯拟合估计的误差定义为：

其中，

是f(A)的均值。

步骤二二：设置2*2的滑动窗口，用两个拟合误差向量的范数的平方计算窗口范围内每个像元的统计量T，然后利用三次样条插值法，计算滑动窗口区域对应的统计量，其中：

统计量T定义为：

利用三次样条插值法，计算滑动窗口区域对应的统计量的具体步骤如下：

(1)滑动窗口每次对四个像元统计量进行三次样条插值。

(2)将四个像元的统计量T按顺序排列，设每个像元对应的坐标点为(t_p,T_p)，p＝0,1,2,3，其中t_p为像元对应的顺序，T_p为像元的统计量T，可得到由三条区间段插值曲线连成的插值曲线。每个区间段插值曲线公式为：

S_p(t)＝w_p+b_p(t-t_p)+c_p(t-t_p)²+d_p(t-t_p)³

其中w_p，b_p，c_p，d_p是曲线参数；t是滑动窗口内的像素插值后所对应的新像素排列序号；S_p(t)是插值后的像素所对应数值。

(3)得到插值曲线后，选择曲线对应T轴的数值范围的中值作为此窗口区域的统计量R。

步骤二三、根据统计量R，将混合像元X按线性和非线性混合程度进行区域划分。具体步骤如下：

设α和β是探测器的阈值，且α＜β。对于滑动窗口内的像元，当R＞β时接受假设H₀，标记像元是线性混合区域。当R＜α时接受假设H₂，标记像元是非线性混合区域。否则接受假设H₁，标记像元是不确定混合区域。依次移动滑动窗口，将高光谱图像的所有混合像元X进行区域划分。

步骤三：基于变精度粗糙集方法处理高光谱图像解混数据，构建稀疏自编码器网络进行解混。具体步骤如下：

步骤三一、在对划分好区域的高光谱数据进行解混前，使用基于变精度的粗糙集方法对不确定混合区域(即：接受假设H₁的区域)的像元进行近似处理，将所有不确定混合区域的像元划分为线性或非线性混合区域像元。

变精度的粗糙集方法如下：

其中，Z₀代表区域中有三个像元标记为H₂，有一个像元标记为H₀，选择T值最大的像元标记为H₀；Z₁代表区域中有两个像元标记为H₂，有两个像元标记为H₀，选择T值最大的两个像元标记为H₀；Z₂代表区域中有一个像元标记为H₂，有三个像元标记为H₀，选择T值最小的像元标记为H₂；经过近似处理，能够降低背景光线等外部干扰对解混的影响，以提高解混模型的抗干扰能力和解混精度。

步骤三二、构建稀疏自编码器网络，采用具有非负属性的ReLu函数作为网络层之间的激活函数，可以满足丰度的非负约束，而不需要增加惩罚项。同时，为了克服端元矩阵中较多的冗余行带来的影响，提高解混效果，选择了l₂₁范数作为稀疏约束，其表达式为：

其中，下角标中“:”代表该位置变量取值从其定义域的最小值到最大值的整个遍历，Q代表n行q列的矩阵，Q_i,j表示Q矩阵的第i行j列的元素，矩阵Q的l₂₁范数||·||₂₁即为矩阵每一行作为行向量的向量l₂₁范数||·||₂₁之和，上式求和中的根式即为向量l₂范数||·||₂表达式。在l₂₁范数尽可能小的条件下，每一行的l₂范数都需要尽可能小，即出现尽可能多的0。因此上式可以使编码器权重矩阵M的每行元素中的0值尽可能多，从而实现行稀疏。所构建稀疏自编码器网络的目标函数如下：

其中，

为端元估计矩阵，

为丰度估计矩阵，F范数的作用是使重构误差达到最小，

是端元约束项，μ是控制其约束程度的参数，λ是控制范数||E||₂₁的参数。当像元标记为线性时，使用线性混合模型表示，当像元标记为非线性时，使用非线性混合模型表示。

为了优化目标函数，采用梯度下降法进行

和

的迭代求解。其中端元约束项的具体表达式为：

可以看出，此约束项服从已知的高斯分布，可看作网络权重的先验信息。

步骤三三、构建好稀疏自编码器网络后，将划分好区域的高光谱图像数据作为网络的输入，设置参数，网络迭代，直至收敛。其中，编码器的输出单元值是丰度估计值，与下一层相连的权重为端元估计值。通过稀疏自编码器网络对高光谱数据解混后，可得到Y种组织端元和对应的丰度估计二维图像y_h，h＝1,…,Y。

步骤四：基于优化的卷积神经网络GoogLeNet，对解混得到的端元及丰度结果进行分类，实现肿瘤细胞切片高光谱图像分类。

恶性肿瘤细胞往往会出现细胞骨架结构紊乱和染色质不团聚、分布混乱等病理形态学特点。对于得到的Y种组织端元和对应的丰度估计图y_h，不同端元对应的丰度估计图y_h均为二维灰度图像，图像大小为sizeX×sizeY。端元数Y可以看作输入图像数据的通道数。因此，将大小为sizeX×sizeY×Y的解混数据作为输入，使用经典的卷积神经网络GoogLeNet进行分类。由于GoogLeNet神经网络具有较多的网络层数和集成化的模块结构，可以充分提取高光谱数据的特征。同时，考虑到过多的神经网络层数会导致特征丢失和算法效率问题，对模型的网络层数进行调整，使神经网络在达到满意的分类结果的同时，具有较高的计算效率。

实施例：

本实施例中，实验样本采用真实实际宫颈癌患者病理切片，切片已由专家标定出肿瘤组织区域。为降低噪声的影响，只保留350nm至1000nm范围中受噪声影响较小的256个波段的数据作为本次实验的高光谱数据集。

执行步骤一：通过显微镜和高光谱成像仪得到肿瘤细胞切片的高光谱图像。

将肿瘤细胞病理切片放至显微镜载物台，调整显微镜物镜放大倍率，使能够观察到清晰切片图像。由高光谱成像仪拍摄图片，光谱波段选择350nm至1000nm范围内的256个波段，图像尺寸为224*224，共50176个像元。由此得到肿瘤细胞切片的高光谱图像。

执行步骤二：基于高光谱图像数据，分别进行基于线性回归的最小二乘拟合估计和基于非线性回归的高斯拟合估计，再通过设置2*2的滑动窗口和三次样条插值法，将混合像元X按线性和非线性混合程度进行区域划分。

(1)得到高光谱图像数据后，对混合像元X分别进行基于线性回归的最小二乘拟合估计和基于非线性回归的高斯拟合估计。

最小二乘拟合估计误差定义为：

其中

高斯拟合估计的误差定义为：

其中

(2)设置2*2的滑动窗口，用两个拟合误差向量的范数的平方计算窗口范围内每个像元的统计量T，然后利用三次样条插值法，计算滑动窗口区域对应的统计量。统计量T定义为：

将四个像元的统计量T按顺序排列，设每个像元对应的坐标点为(t_p,T_p)，p＝0,1,2,3，其中t_p为像元对应的顺序，T_p为像元的统计量T。可得到由三条区间段插值曲线连成的插值曲线。每个区间段插值曲线公式为：

S_p(t)＝w_p+b_p(t-t_p)+c_p(t-t_p)²+d_p(t-t_p)³

其中p＝0,1,2,3，w_p，b_p，c_p，d_p是曲线参数。得到插值曲线后，选择曲线对应T轴的数值范围的中值作为此窗口区域的统计量R。

(3)根据统计量R，将混合像元X按线性和非线性混合程度进行区域划分。

执行步骤三：基于变精度粗糙集方法处理高光谱图像解混数据，构建稀疏自编码器网络进行解混。

(1)在对划分好区域的高光谱数据进行解混前，使用基于变精度的粗糙集方法对不确定混合区域的像元进行近似处理，具体的变精度粗糙集方法如下：

其中，Z₀代表区域中有三个像元标记为H₂，有一个像元标记为H₀，选择T值最大的像元标记为H₀。Z₁代表区域中有两个像元标记为H₂，有两个像元标记为H₀，选择T值最大的两个像元标记为H₀。Z₂代表区域中有一个像元标记为H₂，有三个像元标记为H₀，选择T值最小的像元标记为H₂。

(2)构建自编码器网络，图2为本发明实施所采用的自编码器网络的结构图。采用ReLu函数作为网络层之间的激活函数，选择l₂₁范数作为稀疏约束。所构建稀疏自编码器网络的目标函数如下：

当像元标记为线性时，使用线性混合模型表示，有：

当像元标记为非线性时，使用非线性混合模型表示，有：

其中，

表示两种端元之间的反射。

为了优化目标函数，我们采用梯度下降法进行

和

的迭代求解。其中端元约束项可看作网络权重的先验信息，在梯度更新权重时产生一个抑制项

将其设为：

其中，

为

的元素。

的梯度下降过程公式为：

其中，

为迭代一次后的端元估计值。η代表学习率，可以调节梯度下降的步长。其公式如下：

其中，

是可设定参数，ε是保证η为正值的可设定参数。稀疏自编码器网络具体结构可见表1，“-”代表“无”。

表1稀疏自编码器网络结构

将划分好区域的高光谱图像数据作为网络的输入，设置参数

ε＝0.001，μ＝0.01，学习率0.001，网络迭代，直至收敛。通过自编码器网络对高光谱数据解混后，可得到Y种组织端元和对应的丰度估计二维图像y_h，h＝1,…,Y。

执行步骤四：基于优化的卷积神经网络GoogLeNet，对解混得到的端元及丰度结果进行分类，实现肿瘤细胞切片高光谱图像分类。

对于得到的Y种组织端元和对应的丰度估计图y_h，不同端元对应的丰度估计图y_h均为二维灰度图像，图像大小为sizeX×sizeY。端元数Y可以看作输入图像数据的通道数。因此，将大小为sizeX×sizeY×Y的解混数据作为输入，使用经典的卷积神经网络GoogLeNet进行分类，图3为本实施例所采用的神经网络的结构图。考虑到过多的神经网络层数会导致特征丢失和算法效率问题，将模型的网络层数变为8层。将专家标定过的肿瘤细胞切片的高光谱图像解混结果作为训练集，采用有癌症和无癌症两个标签作为分类结果。由此可以通过细胞组织端元及丰度解混结果，进行图像分类，实现肿瘤细胞高光谱切片图像的分类。

Claims

1.一种基于自编码器网络的肿瘤细胞切片高光谱图像分类方法，其特征在于所述方法包括如下步骤：

2.根据权利要求1所述的基于自编码器网络的肿瘤细胞切片高光谱图像分类方法，其特征在于所述步骤一的具体步骤如下：

步骤一一、将肿瘤细胞病理切片放至显微镜载物台，调整显微镜物镜放大倍率，使能够观察到清晰切片图像；

步骤一二、由高光谱成像仪拍摄图片，光谱波段在350nm至1000nm范围内进行选择，选定N个波段，图像尺寸为sizeX×sizeY，得到肿瘤细胞切片的高光谱图像。

3.根据权利要求1所述的基于自编码器网络的肿瘤细胞切片高光谱图像分类方法，其特征在于所述步骤二的具体步骤如下：

步骤二一：对高光谱图像的所有混合像元X分别进行基于线性回归的最小二乘拟合估计和基于非线性回归的高斯拟合估计，其中，混合像元X的混合模型数学表示为：

X＝f(a)+ξ

其中，ξ＝N(0,σ_n ²)，是零均值，方差函数为k(·,·)的高斯先验分布，a＝(a₁,...,a_M)^T是代表丰度的一个列向量；

假设非线性区域探测符合下面的假设检验问题：

其中，E是端元矩阵；当接受假设H₀，则标记像元是线性混合区域；当接受假设H₁，则标记像元是不确定混合区域；当接受假设H₂，则标记像元是非线性混合区域；

步骤二二：设置2*2的滑动窗口，用两个拟合误差向量的范数的平方计算窗口范围内每个像元的统计量T，然后利用三次样条插值法，计算滑动窗口区域对应的统计量R；

步骤二三、根据统计量R，将混合像元X按线性和非线性混合程度进行区域划分。

4.根据权利要求3所述的基于自编码器网络的肿瘤细胞切片高光谱图像分类方法，其特征在于所述步骤二二中，统计量T定义为：

其中，ε_l为最小二乘拟合估计误差，ε_g为高斯拟合估计的误差。

5.根据权利要求4所述的基于自编码器网络的肿瘤细胞切片高光谱图像分类方法，其特征在于所述最小二乘拟合估计误差定义为：

其中，

是对混合像元的数学表示f(·)的最小二乘拟合估计量，E为端元矩阵，

高斯拟合估计误差定义为：

其中，

是f(A)的均值。

6.根据权利要求3所述的基于自编码器网络的肿瘤细胞切片高光谱图像分类方法，其特征在于所述步骤二二中，利用三次样条插值法，计算滑动窗口区域对应的统计量的具体步骤如下：

(1)滑动窗口每次对四个像元统计量进行三次样条插值；

(2)将四个像元的统计量T按顺序排列，设每个像元对应的坐标点为(t_p,T_p)，p＝0,1,2,3，其中t_p为像元对应的顺序，T_p为像元的统计量T，可得到由三条区间段插值曲线连成的插值曲线，每个区间段插值曲线公式为：

S_p(t)＝w_p+b_p(t-t_p)+c_p(t-t_p)²+d_p(t-t_p)³

其中w_p，b_p，c_p，d_p是曲线参数；t是滑动窗口内的像素插值后所对应的新像素排列序号；S_p(t)是插值后的像素所对应数值；

7.根据权利要求3所述的基于自编码器网络的肿瘤细胞切片高光谱图像分类方法，其特征在于所述步骤二三的具体步骤如下：

设α和β是探测器的阈值，且α＜β，对于滑动窗口内的像元，当R＞β时接受假设H₀，标记像元是线性混合区域；当R＜α时接受假设H₂，标记像元是非线性混合区域；否则接受假设H₁，标记像元是不确定混合区域；依次移动滑动窗口，将高光谱图像的所有混合像元X进行区域划分。

8.根据权利要求1所述的基于自编码器网络的肿瘤细胞切片高光谱图像分类方法，其特征在于所述步骤三的具体步骤如下：

步骤三一、在对划分好区域的高光谱数据进行解混前，使用基于变精度的粗糙集方法对不确定混合区域的像元进行近似处理，将所有不确定混合区域的像元划分为线性或非线性混合区域像元；

步骤三二、构建稀疏自编码器网络，采用具有非负属性的ReLu函数作为网络层之间的激活函数，选择l₂₁范数作为稀疏约束，所构建稀疏自编码器网络的目标函数如下：

其中，

为端元估计矩阵，

为丰度估计矩阵，F范数的作用是使重构误差达到最小，

是端元约束项，μ是控制其约束程度的参数，λ是控制范数||E||₂₁的参数；当像元标记为线性时，使用线性混合模型表示，当像元标记为非线性时，使用非线性混合模型表示；

步骤三三、构建好稀疏自编码器网络后，将划分好区域的高光谱图像数据作为网络的输入，设置参数，网络迭代，直至收敛，其中，编码器的输出单元值是丰度估计值，与下一层相连的权重为端元估计值，通过稀疏自编码器网络对高光谱数据解混后，得到Y种组织端元和对应的丰度估计二维图像y_h，h＝1,…,Y。

9.根据权利要求8所述的基于自编码器网络的肿瘤细胞切片高光谱图像分类方法，其特征在于所述步骤三一中，变精度的粗糙集方法如下：

其中，Z₀代表区域中有三个像元标记为H₂，有一个像元标记为H₀，选择T值最大的像元标记为H₀；Z₁代表区域中有两个像元标记为H₂，有两个像元标记为H₀，选择T值最大的两个像元标记为H₀；Z₂代表区域中有一个像元标记为H₂，有三个像元标记为H₀，选择T值最小的像元标记为H₂。

10.根据权利要求8所述的基于自编码器网络的肿瘤细胞切片高光谱图像分类方法，其特征在于所述步骤三二中，稀疏约束的表达式为：

端元约束项的具体表达式为：

其中，Q代表n行q列的矩阵，Q_i,j表示Q矩阵的第i行j列的元素，矩阵Q的l₂₁范数||·||₂₁即为矩阵每一行作为行向量的向量l₂₁范数||·||₂₁之和，上式求和中的根式即为向量l₂范数||·||₂表达式。