CN118016149A

CN118016149A - 一种整合空间转录组多模态信息的空间域识别方法

Info

Publication number: CN118016149A
Application number: CN202410419410.3A
Authority: CN
Inventors: 陈泽华; 畅佳星; 邵浩靖
Original assignee: Shenzhen Institute Of Agricultural Genome Chinese Academy Of Agricultural Sciences Shenzhen Branch Of Guangdong Provincial Laboratory Of Lingnan Modern Agricultural Science And Technology; Taiyuan University of Technology
Current assignee: Shenzhen Institute Of Agricultural Genome Chinese Academy Of Agricultural Sciences Shenzhen Branch Of Guangdong Provincial Laboratory Of Lingnan Modern Agricultural Science And Technology; Taiyuan University of Technology
Priority date: 2024-04-09
Filing date: 2024-04-09
Publication date: 2024-05-10
Anticipated expiration: 2044-04-09
Also published as: CN118016149B

Abstract

本发明提供了一种整合空间转录组多模态信息的空间域识别方法，属于空间转录组学技术领域；解决了现有大多数方法在有效利用空间信息和匹配的高分辨率组织学图像方面存在局限性及空间域识别精度低的问题；包括如下步骤：获取数据集；数据集加载与预处理；图像切割和形态特征提取；通过不同的相似性度量构造空间邻接矩阵、特征邻接矩阵和形态邻接矩阵，然后结合基因表达矩阵构建空间图、特征图和形态图；搭建由多通道图卷积自编码器MCGCN()和NB解码器Decoder()构成的空间域识别模型并训练，得到潜在嵌入特征；对潜在嵌入特征进行聚类以生成聚类标签，用于空间域的识别；本发明应用于空间转录组学空间域识别。

Description

一种整合空间转录组多模态信息的空间域识别方法

技术领域

本发明提供了一种整合空间转录组多模态信息的空间域识别方法，属于空间转录组学技术领域。

背景技术

复杂的生物组织以高度协调的方式由许多细胞组成，并执行各种生物学功能，其空间位置对于发挥其生物学功能非常重要。新兴的空间转录组学技术允许同时测量数千个具有精确空间信息的基因，为解剖生物组织提供了前所未有的机会。随着空间转录组学（ST）的发展，研究人员对于生物发育过程中基因表达的空间分布和调控机制的认识日益增加。然而，精确的解析具有相似基因表达和原位组织学的空间结构域仍然具有挑战性。

识别空间结构域，即识别在基因表达模式和组织学特征上空间一致的区域。准确的空间域识别是描述基因组异质性和细胞相互作用的基础，也是空间转录组分析中各种下游任务的重要一步。因此，开展基于深度学习的空间域识别方法的研究，对于深度入理解空间背景下的组织和功能具有重要意义。

发明内容

本发明的目的是提供一种整合空间转录组多模态信息的空间域识别方法，解决现有大多数方法在有效利用空间信息和匹配的高分辨率组织学图像方面存在局限性及空间域识别精度低的问题。

为了解决上述技术问题，本发明采用的技术方案为：一种整合空间转录组多模态信息的空间域识别方法，包括如下步骤：

步骤1：获取数据集，所述数据集通过空间转录组测序技术测量得到，所述数据集中包含组织切片图像、spot的基因表达数据和每个spot在组织切片图像中的实际空间位置信息；

步骤2：数据集加载与预处理：对基因表达数据和空间位置信息进行预处理；

步骤3：图像切割和形态特征提取：通过对组织切片图像进行切割，使用预训练的卷积神经网络提取形态特征向量，得到形态学信息；

步骤4：通过不同的相似性度量构造空间邻接矩阵、特征邻接矩阵和形态邻接矩阵，然后结合基因表达矩阵构建空间图、特征图和形态图；

步骤5：图保存与数据处理；

步骤6：搭建由多通道图卷积自编码器MCGCN()和NB解码器Decoder()构成的空间域识别模型，将预处理后的数据输入搭建到的空间域识别模型进行训练，得到潜在嵌入特征；

步骤7：对潜在嵌入特征进行聚类以生成聚类标签，用于空间域的识别。

步骤3中对组织切片图像进行图像切割是以spot在切片中的实际坐标来确定图像块的中心，将组织切片图像裁剪成设定尺寸的方形图像块；

对组织切片图像进行形态特征提取是利用预训练的ResNet50模型作为特征提取器，以切割好的图像块为输入，提取组织切片图像中的形态学信息。

步骤4中特征图的构建步骤如下：

a.根据数据情况选择是否对输入的基因表达数据进行主成分分析降维；

b.基于基因表达数据计算spot之间的余弦距离d _f，以衡量基因表达相似性；

c.基于计算出的余弦距离d _f选取每个spot的前k个最近邻，构建表征基因表达相似性的特征邻接矩阵A _f；

d.将基因表达矩阵作为节点属性特征矩阵X；

e.基于表征基因表达相似性的特征邻接矩阵A _f和节点属性特征矩阵X，构建特征图G _f(A _f，X)。

步骤4中空间图的构建步骤如下：

a.基于空间位置信息计算spot之间的欧几里得距离d _s，以衡量空间相似性；

b.基于计算出的欧几里得距离d _s结合预先定义的半径r，构建表征空间相似性的空间邻接矩阵A _s；

c.将基因表达矩阵作为节点属性特征矩阵X；

d.基于表征空间相似性的空间邻接矩阵A _s和节点属性特征矩阵X，构建空间图G _s(A _s，X)。

步骤4中形态图的构建步骤如下：

a.基于步骤3中提取到的形态学信息计算每个spot所对应的图像块之间的皮尔逊相关性d _m，以衡量形态相似性；

b.基于计算出的皮尔逊相关性d _m选取每个spot的前k个最近邻，构建表征形态相似性的形态邻接矩阵A _m；

c.将基因表达矩阵作为节点属性特征矩阵X；

d.基于表征形态相似性的形态邻接矩阵A _m和节点属性特征矩阵X，构成形态图G _m(A _m，X)。

步骤6中的空间域识别模型的损失函数L由原始基因的重建损失L _{NB_rec}、一致性约束损失L _con和正则化约束损失L _reg联合而成，定义如下：

L=αL _{NB_rec}+βL _con+γL _reg；

上式中：α表示原始基因的重建损失L _{NB_rec}的权重参数，β表示一致性约束损失L _con的权重参数，γ表示正则化约束损失L _reg的权重参数。

所述正则化约束损失L _reg由考虑空间图的正则化约束损失、考虑形态图的正则化约束损失/>组成，其计算公式如下：

；

其中：

；

上式中：是spot i的空间邻居集，mat _ik和mat _ij是基于所学习的潜在表示E_final的余弦相似性矩阵，σ表示计算mat _ik和mat _ij中每个元素的自然对数，N _spot表示spot的个数，i表示第i个spot，j表示第j个属于空间邻居集的spot，k表示第k个不属于空间邻居集的spot；

；

上式中：M _i是spot i的形态邻居集。

所述多通道图卷积自编码器MCGCN()由空间卷积模块、特征卷积模块、形态卷积模块和协同卷积模块构成，其生成低维嵌入的方式如下：

1)空间卷积模块是对空间图进行卷积运算，应用以下分层传播规则来生成低维嵌入E _s，其表达式如下：

；

其中是空间卷积模块中第l层的权重参数，/>是空间卷积模块中第l层生成的低维嵌入，ReLU代表ReLU激活函数，在上式中初始化的/>代表基因表达矩阵，/>是空间图中对称归一化的邻接矩阵，其计算公式如下：

；

其中代表A _s度矩阵；

2)特征卷积模块对特征图进行卷积运算，应用以下分层传播规则来生成低维嵌入E _f，其表达式如下：

；

其中是特征卷积模块中第l层的权重参数，/>是特征卷积模块中第l层生成的低维嵌入，ReLU代表ReLU激活函数，在上式中初始化的/>代表基因表达矩阵，/>是特征图中对称归一化的邻接矩阵，其计算公式如下：

；

其中代表A _f度矩阵；

3)形态卷积模块对形态图进行卷积运算，应用以下分层传播规则来生成低维嵌入E _m，其表达式如下：

；

其中是形态卷积模块中第l层的权重参数，/>是形态卷积模块中第l层生成的低维嵌入，ReLU代表ReLU激活函数，在上式中初始化的/>代表基因表达矩阵，/>是特征图中对称归一化的邻接矩阵，其计算公式如下：

；

其中代表A _m度矩阵；

4)引入协同卷积模块用于三个图的协同卷积，提取基于空间图的共同嵌入E _cs、基于特征图的共同嵌入E _cf和基于形态图的共同嵌入E _cm，其表达式分别如下：

；

其中是协同卷积模块中第l层的权重参数，/>、/>和/>是分别从空间图、特征图、形态图中提取的共同嵌入，/>、/>和/>分别代表空间图、特征图、形态图中对称归一化的邻接矩阵，下标c表示协同卷积模块；

通过上述计算到的、/>和/>定义共嵌入/>为：

；

一致性约束损失L _con的表达式如下：

；

上式中：是从空间图提取的嵌入，/>是从特征图提取的嵌入，/>是从形态图中提取的嵌入。

步骤6中搭建的空间域识别模型，引入了注意力机制来自适应的学习由多通道图卷积自编码器MCGCN()生成的基于空间图的低维嵌入E _s、基于特征图的低维嵌入E _f、基于形态图的低维嵌入E _m以及共嵌入E _c的重要性以生成相应的权重参数ω _s、ω _f、ω _m和ω _c，通过权重参数生成最终的低维嵌入E_final，权重参数的生成过程如下：

；

。

所述NB解码器Decoder()结合了负二项分布来建模数据的分布特征，基于负二项分布模型，考虑了基因表达数据的离散性和变异性，重建基因表达矩阵，以捕获ST数据的复杂全局信息，NB解码器Decoder()的构成如下：

首先定义一个包含一个线性层和一个批量归一化层的中间层，用于将编码器输出的低维嵌入E_final映射到一个更高维度的空间，采用ReLU激活函数，用于引入非线性，定义两个线性层分别对中间层的输出进行映射到原始维度，得到分布的离散度θ和均值μ；

对于给定的基因表达矩阵X，假设其符合负二项分布，基因表达的概率分布f _NB定义如下：

；

其中离散度θ和均值μ由解码器计算得到，Γ表示伽马函数；

为了最小化预测值与真实值之间的差异，采用负对数似然估计作为原始基因的重建损失L _{NB_rec}，定义如下：

。

本发明相对于现有技术具备的有益效果为：本发明通过由多通道图卷积自编码器MCGCN()和NB解码器Decoder()构成的空间域识别模型整合了空间转录组中的组织学形态信息、基因表达信息和空间位置信息，解决了现有大多数方法在有效利用空间信息和匹配的高分辨率组织学图像方面存在局限性及空间域识别精度低的问题。对于深入理解空间背景下的组织和功能具有重要意义。

附图说明

下面结合附图对本发明做进一步说明：

图1为本发明方法的流程图；

图2为本发明实施例中七种空间域划分方法的平均ARI柱状图；

图3为本发明实施例中七种空间域划分方法的箱线图；

图4为本发明实施例中切片151672的空间转录组测序组织学H&E染色切片图像；

图5为本发明实施例中七种方法对切片151672的识别效果图。

具体实施方式

如图1至图5所示，本发明提供了一种整合空间转录组多模态信息的空间域识别方法，参照图1，本发明的具体实现步骤如下：

步骤1：获取通过空间转录组测序技术测量得到的包含组织切片图像、spot的基因表达数据和每个spot在组织切片图像中的实际空间位置信息的数据集，后续用到的基因表达矩阵即为基因表达数据；

步骤2：数据集加载与预处理：加载数据集，获取基因表达数据和空间位置信息；删除包含空值的样本/细胞；对数据集进行归一化处理，包括过滤基因、选择高度可变基因、归一化基因表达矩阵等；

步骤3：图像切割和形态特征提取：通过对组织切片图像进行切割，使用预训练的卷积神经网络提取形态特征向量，并存储在AnnData对象的obsm字典中，得到形态学信息；

步骤4：图构建：使用预处理后的基因表达数据构建特征邻接矩阵，其中特征邻接矩阵通过计算最近邻居关系得到；使用预处理后的空间位置信息构建空间邻接矩阵，其中空间邻接矩阵通过定义最近邻的半径得到，并进行负采样，得到空间负采样矩阵；使用形态学信息构建形态邻接矩阵，其中形态邻接矩阵通过计算形态学特征矩阵之间的皮尔逊相关系数得到，并进行负采样，得到形态负采样矩阵；

然后将特征邻接矩阵、空间邻接矩阵、形态邻接矩阵分别结合基因表达矩阵后生成特征图、空间图和形态图；

步骤5：图保存与数据处理，将构建的特征邻接矩阵、空间邻接矩阵、形态邻接矩阵、空间负采样矩阵、形态负采样矩阵保存到AnnData对象的obsm字典中，方便后续的空间域识别模型训练；

步骤6：搭建由多通道图卷积自编码器MCGCN()和NB解码器Decoder()构成的空间域识别模型，将预处理后的数据输入空间域识别模型进行训练，得到潜在嵌入特征；

其中步骤2中对数据集的基因表达数据进行预处理的流程如下：

1)对原始基因表达数据进行归一化处理；

2)过滤掉表达基因在少于100个细胞中出现的基因；

3)在剩余的基因中选择排序为n的高度可变基因；

4)对筛选后的基因表达数据进行归一化处理：将每个细胞中的基因表达量除以该细胞的基因表达总和，然后乘以10000；

5)使用Scanpy库对归一化后的基因表达数据进行缩放。

步骤3中对组织切片图像进行图像切割是以spot在切片中的实际坐标来确定图像块的中心，将组织切片图像裁剪成大小为224x224像素的方形图像块。对组织切片图像进行形态特征提取是利用预训练的ResNet50模型作为特征提取器，以切割好的图像块为输入，提取组织切片图像中的形态学信息。

步骤4中的图构建包含特征图构建、空间图构建和形态图构建，其构建流程如下：

1)特征图构建

a.根据数据情况选择是否对输入的基因表达数据进行主成分分析降维，其中数据情况根据采用的不同的数据集进行判断；

d.将基因表达矩阵X作为节点属性特征矩阵；

2)空间图构建

c.将基因表达矩阵X作为节点属性特征矩阵；

3)形态图构建

c.将基因表达矩阵X作为节点属性特征矩阵；

步骤4中的图构建所涉及的邻接矩阵的构建方法如下：

1)特征邻接矩阵的计算

通过余弦距离d _f衡量基因表达相似性，获得基因表达的潜在结构，对于给定的spotS _i和spotS _j，假设其基因表达为x _i和x _j，那么余弦距离d _f的计算公式如下：

。

为了更好的定义基因表达相似性，构建基因表达矩阵X的k近邻图，称为特征图G _f(A _f，X)，其中A _f是N个spot的特征邻接矩阵，根据上述计算得到的余弦距离d _f计算特征邻接矩阵，找到每个spot的前k个基因表达最相似spot定义为邻居。具体计算方法如下：对于给定的spotS _i，若spotS _j是spotS _i的邻居，则令其邻接矩阵相应位置Af _ij=1否则＝0，构建公式如下式所示：

。

2)空间邻接矩阵的计算

首先通过spot的空间位置信息计算每个spot与其它所有spot之间的欧几里得距离d _s，来衡量空间相似性，为了定义其邻接关系，预先定义一个半径r，根据上述计算得到的两个spot之间的欧几里得距离ds _ij结合预先定义的半径r计算两个spot之间的空间邻接矩阵A _s，具体构建方法如下：对于给定的spotS _i，若两个spot中心之间的距离ds _ij小于计算半径r，则认为spotS _j与spotS _i是相邻的，此时令其邻接矩阵相应位置As _ij＝1否则As _ij＝0，计算公式如下式所示：

。

3)形态邻接矩阵的计算

先根据每个spot坐标信息对组织切片图像进行分割，并通过预训练的卷积神经网络对图像特征进行提取并作为该spot的形态特征向量；由于预训练的卷积神经模型提取的形态特征向量是高维的，为了更好的表示spot的形态学特征，使用PCA主成分分析选取前50个成分作为每个spot的形态学潜在特征表示M，最终对于spotS _i和spotS _j，利用上述计算得到的形态学潜在特征表示M _i和M _j计算两个spot之间的皮尔逊相关性dm _ij，其计算公式如下：

；

上式中：cov(M _i,M _j)表示M _i和M _j的协方差，表示M _i的标准差，/>表示M _j的标准差，E表示数学期望。

为了更好的形态相似性，构建基因表达矩阵X的k近邻图，称为特征图G _m(A _m，X)，其中A _m是对应于N个spot的N个图像块的形态邻接矩阵，根据上述计算得到的皮尔逊相关性dm _ij计算形态邻接矩阵，找到每个spot前k个形态特征最相似的图像块定义为邻居，具体计算方法如下：对于给定的spotS _i，若spotS _j是spotS _i的邻居，则令其邻接矩阵相应位置Am _ij＝1否则Am _ij＝0，构建公式同特征邻接矩阵。

其中生成的空间邻接矩阵、空间负采样矩阵和形态邻接矩阵、形态负采样矩阵是为了定义正则化约束，从而促使模型更好地捕捉图的结构信息，优选的考虑多种图结构的影响，通过对比节点之间的余弦相似度使得模型更全面地学到图的结构信息。具体如下：

1)考虑空间图的正则化约束损失的定义如下：

；

上式中：是spot i的空间邻居集，mat _ik和mat _ij是基于所学习的潜在表示E_final的余弦相似性矩阵，σ表示计算mat _ik和mat _ij中每个元素的自然对数，N _spot表示spot的个数，i表示第i个spot，j表示第j个属于空间邻居集的spot，k表示第k个不属于空间邻居集的spot。

损失中包含两个部分，空间邻接矩阵正样本损失：鼓励空间相邻节点的嵌入向量在嵌入空间中更加接近，以促使模型学到空间图中的局部结构。空间邻接矩阵负样本损失：鼓励空间不相邻节点的嵌入向量在嵌入空间中更加远离，以帮助模型避免学到图中的噪声和过拟合。

2)考虑形态图的正则化约束损失的定义如下：

；

上式中：M _i是spot i的形态邻居集。

损失中包含两个部分，形态邻接矩阵正样本损失：鼓励形态特征相邻节点的嵌入向量在嵌入空间中更加接近，以促使模型学到形态图中的局部结构。形态邻接矩阵负样本损失：鼓励不相邻节点的嵌入向量在嵌入空间中更加远离，以帮助模型避免学到形态图中的噪声和过拟合。

3)综上，综合考虑空间图的正则化约束损失和形态图的正则化约束损失/>定义模型整体的正则化约束损失L _reg如下：

。

步骤6中搭建的空间域识别模型由多通道图卷积自编码器MCGCN()和NB解码器Decoder()构成。其损失函数L由原始基因的重建损失L _{NB_rec}、一致性约束损失L _con和正则化约束损失L _reg联合而成，定义如下：

L=αL _{NB_rec}+βL _con+γL _reg；

步骤6中搭建了空间域识别模型，其中多通道图卷积自编码器MCGCN()由空间卷积模块、特征卷积模块、形态卷积模块和协同卷积模块构成，其生成低维嵌入的方式如下：

；

其中代表A _s度矩阵。

；

其中代表A _f度矩阵。

；

其中代表A _m度矩阵。

4)由于基因表达和空间分布以及形态信息有一定的相关性，因此引入协同卷积模块用于三个图的协同卷积，提取基于空间图的共同嵌入E _cs、基于特征图的共同嵌入E _cf和基于形态图的共同嵌入E _cm，其表达式分别如下：

；

其中是协同卷积模块中第l层的权重参数，/>、/>和/>是分别从空间图、特征图、形态图中提取的共同嵌入，/>、/>和/>分别代表空间图、特征图、形态图中对称归一化的邻接矩阵，计算方式同上，下标c表示协同卷积模块。

通过上述计算到的、/>和/>定义共嵌入/>为：

。

为了帮助模型学习到更具一致性的表示，通过比较、/>和/>之间的协方差矩阵的差异来度量它们的一致性。定义一致性约束损失L _con如下：

；

。

步骤6中搭建了空间域识别模型，NB解码器Decoder()结合了负二项分布来建模数据的分布特征，基于负二项分布模型，考虑了基因表达数据的离散性和变异性，重建基因表达矩阵，以捕获ST数据的复杂全局信息。其构成如下：

首先定义了一个包含一个线性层和一个批量归一化层的中间层，用于将编码器输出的低维嵌入E_final映射到一个更高维度的空间，从而提取出更高级别的特征，采用ReLU激活函数，用于引入非线性。定义两个线性层分别对中间层的输出进行映射到原始维度，得到分布的离散度θ和均值μ。离散度和均值都经过不同的激活函数进行处理从而保证其值不会过小或过大。通过这种设计使得模型更好地拟合真实数据。具体的，对于给定的基因表达矩阵X，假设其符合负二项分布，基因表达的概率分布f _NB定义如下：

；

其中离散度θ和均值μ由解码器计算得到，Γ表示伽马函数。

。

步骤7中的聚类依靠R中mclust包中Mclust()函数实现。

为了进一步验证本发明的有效性和可行性，进行实验：以10x Visium的空间转录组测序的人类背外侧前额皮质层数据集进行验证，该数据集中包含spot个数为3460-4789，每个spot有33538个基因。使用调整兰德指数ARI作为评价各方法的空间聚类结果的评价指标。

本发明提出的方法与六种具有代表性的空间域识别方法进行比较，其中包含一种非空间方法Leiden、两种不需要组织学图像的空间方法SEDR、STAGATE和三种使用组织学图像的空间方法stLearn、SpaGCN和DeepST。对比结果如表1所示。基于不同的方法的空间域识别结果如图5所示（以切片151672为例）。

表1 本发明提出的方法与六种具有代表性的空间域识别方法进行的比较。

从表1中可以看出，本发明提出的一种整合空间转录组多模态信息的空间域识别方法在10x Visium的DLPFC的12个数据集上相对于其他方法有较好的结果。其ARI均值如图2所示，七种空间域划分方法的箱线图如图3所示，由图2、图3可知本发明的一种整合空间转录组多模态信息的空间域识别方法均值比其他方法都要高，为0.57。整体的识别效果也比其他方法好。为了更好的说明本发明的技术方案，以切片151672为例，其组织学H&E染色切片图像如图4所示，本发明计算出的调整兰德指数ARI为0.84，与其余六种方法的识别效果对比如图5所示，从图5中可以看出本发明提出的方法相对于其他方法来说对空间域的识别更准确，更接近于真实标签，也充分说明了本发明方法的空间域识别能力。

本发明提出的方法通过对空间转录组中测量得到的组织切片图像、基因表达数据和空间位置信息进行预处理；基于这些信息，通过不同的相似性度量构造空间邻接矩阵、特征邻接矩阵和形态邻接矩阵，接着结合基因表达矩阵构建空间图、特征图、形态图。将基因表达与每个邻接图相结合，构建了基于多通道图的空间域识别模型，学习多个图的特定嵌入。并计算一致性约束损失、重构损失和空间正则化约束损失以训练模型。为了捕捉不同图的重要性，设计了注意力机制自适应的学习各个嵌入的重要性以生成低维最终嵌入。根据学习到的嵌入进行聚类以实现空间域的识别。整合了空间转录组中的组织学形态信息、基因表达信息和空间位置信息，提高了空间域识别精度。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

1.一种整合空间转录组多模态信息的空间域识别方法，其特征在于：包括如下步骤：

步骤5：图保存与数据处理；

2.根据权利要求1所述的一种整合空间转录组多模态信息的空间域识别方法，其特征在于：步骤3中对组织切片图像进行图像切割是以spot在切片中的实际坐标来确定图像块的中心，将组织切片图像裁剪成设定尺寸的方形图像块；

3.根据权利要求2所述的一种整合空间转录组多模态信息的空间域识别方法，其特征在于：步骤4中特征图的构建步骤如下：

d.将基因表达矩阵作为节点属性特征矩阵X；

4.根据权利要求2所述的一种整合空间转录组多模态信息的空间域识别方法，其特征在于：步骤4中空间图的构建步骤如下：

c.将基因表达矩阵作为节点属性特征矩阵X；

5.根据权利要求2所述的一种整合空间转录组多模态信息的空间域识别方法，其特征在于：步骤4中形态图的构建步骤如下：

c.将基因表达矩阵作为节点属性特征矩阵X；

6.根据权利要求3-5任一项所述的一种整合空间转录组多模态信息的空间域识别方法，其特征在于：步骤6中的空间域识别模型的损失函数L由原始基因的重建损失L _{NB_rec}、一致性约束损失L _con和正则化约束损失L _reg联合而成，定义如下：

L=αL _{NB_rec}+βL _con+γL _reg；

7.根据权利要求6所述的一种整合空间转录组多模态信息的空间域识别方法，其特征在于：所述正则化约束损失L _reg由考虑空间图的正则化约束损失、考虑形态图的正则化约束损失/>组成，其计算公式如下：

；

其中：

；

上式中：M _i是spot i的形态邻居集。

8.根据权利要求7所述的一种整合空间转录组多模态信息的空间域识别方法，其特征在于：所述多通道图卷积自编码器MCGCN()由空间卷积模块、特征卷积模块、形态卷积模块和协同卷积模块构成，其生成低维嵌入的方式如下：

；

其中代表A _s度矩阵；

；

其中代表A _f度矩阵；

；

其中代表A _m度矩阵；

；

通过上述计算到的、/>和/>定义共嵌入/>为：

；

一致性约束损失L _con的表达式如下：

；

9.根据权利要求8所述的一种整合空间转录组多模态信息的空间域识别方法，其特征在于：步骤6中搭建的空间域识别模型，引入了注意力机制来自适应的学习由多通道图卷积自编码器MCGCN()生成的基于空间图的低维嵌入E _s、基于特征图的低维嵌入E _f、基于形态图的低维嵌入E _m以及共嵌入E _c的重要性以生成相应的权重参数ω _s、ω _f、ω _m和ω _c，通过权重参数生成最终的低维嵌入E_final，权重参数的生成过程如下：

；

。

10.根据权利要求8所述的一种整合空间转录组多模态信息的空间域识别方法，其特征在于：所述NB解码器Decoder()结合了负二项分布来建模数据的分布特征，基于负二项分布模型，考虑了基因表达数据的离散性和变异性，重建基因表达矩阵，以捕获ST数据的复杂全局信息，NB解码器Decoder()的构成如下：

；

其中离散度θ和均值μ由解码器计算得到，Γ表示伽马函数；

。