CN118016149A - 一种整合空间转录组多模态信息的空间域识别方法 - Google Patents
一种整合空间转录组多模态信息的空间域识别方法 Download PDFInfo
- Publication number
- CN118016149A CN118016149A CN202410419410.3A CN202410419410A CN118016149A CN 118016149 A CN118016149 A CN 118016149A CN 202410419410 A CN202410419410 A CN 202410419410A CN 118016149 A CN118016149 A CN 118016149A
- Authority
- CN
- China
- Prior art keywords
- spatial
- matrix
- feature
- gene expression
- follows
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 80
- 239000011159 matrix material Substances 0.000 claims abstract description 132
- 230000014509 gene expression Effects 0.000 claims abstract description 95
- 230000000877 morphologic effect Effects 0.000 claims abstract description 67
- 238000010586 diagram Methods 0.000 claims abstract description 48
- 238000007781 pre-processing Methods 0.000 claims abstract description 8
- 238000012549 training Methods 0.000 claims abstract description 5
- 238000011524 similarity measure Methods 0.000 claims abstract description 3
- 238000004364 calculation method Methods 0.000 claims description 26
- 230000006870 function Effects 0.000 claims description 22
- 238000010276 construction Methods 0.000 claims description 17
- 108090000623 proteins and genes Proteins 0.000 claims description 17
- 230000004913 activation Effects 0.000 claims description 13
- 239000013598 vector Substances 0.000 claims description 10
- 239000006185 dispersion Substances 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 6
- 239000000203 mixture Substances 0.000 claims description 5
- 238000013527 convolutional neural network Methods 0.000 claims description 4
- 238000000513 principal component analysis Methods 0.000 claims description 4
- 238000005516 engineering process Methods 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 238000004321 preservation Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 claims description 2
- 238000005070 sampling Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 3
- 230000008827 biological function Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000000638 solvent extraction Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008614 cellular interaction Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 210000001061 forehead Anatomy 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000008844 regulatory mechanism Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000011222 transcriptome analysis Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/042—Knowledge-based neural networks; Logical representations of neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/69—Microscopic objects, e.g. biological cells or cellular parts
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/69—Microscopic objects, e.g. biological cells or cellular parts
- G06V20/695—Preprocessing, e.g. image segmentation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/10—Gene or protein expression profiling; Expression-ratio estimation or normalisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/30—Unsupervised data analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Computational Linguistics (AREA)
- Biotechnology (AREA)
- Genetics & Genomics (AREA)
- Mathematical Physics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computing Systems (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Public Health (AREA)
- Epidemiology (AREA)
- Bioethics (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种整合空间转录组多模态信息的空间域识别方法,属于空间转录组学技术领域;解决了现有大多数方法在有效利用空间信息和匹配的高分辨率组织学图像方面存在局限性及空间域识别精度低的问题;包括如下步骤:获取数据集;数据集加载与预处理;图像切割和形态特征提取;通过不同的相似性度量构造空间邻接矩阵、特征邻接矩阵和形态邻接矩阵,然后结合基因表达矩阵构建空间图、特征图和形态图;搭建由多通道图卷积自编码器MCGCN()和NB解码器Decoder()构成的空间域识别模型并训练,得到潜在嵌入特征;对潜在嵌入特征进行聚类以生成聚类标签,用于空间域的识别;本发明应用于空间转录组学空间域识别。
Description
技术领域
本发明提供了一种整合空间转录组多模态信息的空间域识别方法,属于空间转录组学技术领域。
背景技术
复杂的生物组织以高度协调的方式由许多细胞组成,并执行各种生物学功能,其空间位置对于发挥其生物学功能非常重要。新兴的空间转录组学技术允许同时测量数千个具有精确空间信息的基因,为解剖生物组织提供了前所未有的机会。随着空间转录组学(ST)的发展,研究人员对于生物发育过程中基因表达的空间分布和调控机制的认识日益增加。然而,精确的解析具有相似基因表达和原位组织学的空间结构域仍然具有挑战性。
识别空间结构域,即识别在基因表达模式和组织学特征上空间一致的区域。准确的空间域识别是描述基因组异质性和细胞相互作用的基础,也是空间转录组分析中各种下游任务的重要一步。因此,开展基于深度学习的空间域识别方法的研究,对于深度入理解空间背景下的组织和功能具有重要意义。
发明内容
本发明的目的是提供一种整合空间转录组多模态信息的空间域识别方法,解决现有大多数方法在有效利用空间信息和匹配的高分辨率组织学图像方面存在局限性及空间域识别精度低的问题。
为了解决上述技术问题,本发明采用的技术方案为:一种整合空间转录组多模态信息的空间域识别方法,包括如下步骤:
步骤1:获取数据集,所述数据集通过空间转录组测序技术测量得到,所述数据集中包含组织切片图像、spot的基因表达数据和每个spot在组织切片图像中的实际空间位置信息;
步骤2:数据集加载与预处理:对基因表达数据和空间位置信息进行预处理;
步骤3:图像切割和形态特征提取:通过对组织切片图像进行切割,使用预训练的卷积神经网络提取形态特征向量,得到形态学信息;
步骤4:通过不同的相似性度量构造空间邻接矩阵、特征邻接矩阵和形态邻接矩阵,然后结合基因表达矩阵构建空间图、特征图和形态图;
步骤5:图保存与数据处理;
步骤6:搭建由多通道图卷积自编码器MCGCN()和NB解码器Decoder()构成的空间域识别模型,将预处理后的数据输入搭建到的空间域识别模型进行训练,得到潜在嵌入特征;
步骤7:对潜在嵌入特征进行聚类以生成聚类标签,用于空间域的识别。
步骤3中对组织切片图像进行图像切割是以spot在切片中的实际坐标来确定图像块的中心,将组织切片图像裁剪成设定尺寸的方形图像块;
对组织切片图像进行形态特征提取是利用预训练的ResNet50模型作为特征提取器,以切割好的图像块为输入,提取组织切片图像中的形态学信息。
步骤4中特征图的构建步骤如下:
a.根据数据情况选择是否对输入的基因表达数据进行主成分分析降维;
b.基于基因表达数据计算spot之间的余弦距离d f ,以衡量基因表达相似性;
c.基于计算出的余弦距离d f 选取每个spot的前k个最近邻,构建表征基因表达相似性的特征邻接矩阵A f ;
d.将基因表达矩阵作为节点属性特征矩阵X;
e.基于表征基因表达相似性的特征邻接矩阵A f 和节点属性特征矩阵X,构建特征图G f (A f ,X)。
步骤4中空间图的构建步骤如下:
a.基于空间位置信息计算spot之间的欧几里得距离d s ,以衡量空间相似性;
b.基于计算出的欧几里得距离d s 结合预先定义的半径r,构建表征空间相似性的空间邻接矩阵A s ;
c.将基因表达矩阵作为节点属性特征矩阵X;
d.基于表征空间相似性的空间邻接矩阵A s 和节点属性特征矩阵X,构建空间图G s (A s ,X)。
步骤4中形态图的构建步骤如下:
a.基于步骤3中提取到的形态学信息计算每个spot所对应的图像块之间的皮尔逊相关性d m ,以衡量形态相似性;
b.基于计算出的皮尔逊相关性d m 选取每个spot的前k个最近邻,构建表征形态相似性的形态邻接矩阵A m ;
c.将基因表达矩阵作为节点属性特征矩阵X;
d.基于表征形态相似性的形态邻接矩阵A m 和节点属性特征矩阵X,构成形态图G m (A m ,X)。
步骤6中的空间域识别模型的损失函数L由原始基因的重建损失L NB_rec、一致性约束损失L con和正则化约束损失L reg联合而成,定义如下:
L=αL NB_rec+βL con+γL reg;
上式中:α表示原始基因的重建损失L NB_rec的权重参数,β表示一致性约束损失L con的权重参数,γ表示正则化约束损失L reg的权重参数。
所述正则化约束损失L reg由考虑空间图的正则化约束损失、考虑形态图的正则化约束损失/>组成,其计算公式如下:
;
其中:
;
上式中:是spot i的空间邻居集,mat ik 和mat ij 是基于所学习的潜在表示Efinal的余弦相似性矩阵,σ表示计算mat ik 和mat ij 中每个元素的自然对数,N spot表示spot的个数,i表示第i个spot,j表示第j个属于空间邻居集的spot,k表示第k个不属于空间邻居集的spot;
;
上式中:M i 是spot i的形态邻居集。
所述多通道图卷积自编码器MCGCN()由空间卷积模块、特征卷积模块、形态卷积模块和协同卷积模块构成,其生成低维嵌入的方式如下:
1)空间卷积模块是对空间图进行卷积运算,应用以下分层传播规则来生成低维嵌入E s ,其表达式如下:
;
其中是空间卷积模块中第l层的权重参数,/>是空间卷积模块中第l层生成的低维嵌入,ReLU代表ReLU激活函数,在上式中初始化的/>代表基因表达矩阵,/>是空间图中对称归一化的邻接矩阵,其计算公式如下:
;
其中代表A s 度矩阵;
2)特征卷积模块对特征图进行卷积运算,应用以下分层传播规则来生成低维嵌入E f ,其表达式如下:
;
其中是特征卷积模块中第l层的权重参数,/>是特征卷积模块中第l层生成的低维嵌入,ReLU代表ReLU激活函数,在上式中初始化的/>代表基因表达矩阵,/>是特征图中对称归一化的邻接矩阵,其计算公式如下:
;
其中代表A f 度矩阵;
3)形态卷积模块对形态图进行卷积运算,应用以下分层传播规则来生成低维嵌入E m ,其表达式如下:
;
其中是形态卷积模块中第l层的权重参数,/>是形态卷积模块中第l层生成的低维嵌入,ReLU代表ReLU激活函数,在上式中初始化的/>代表基因表达矩阵,/>是特征图中对称归一化的邻接矩阵,其计算公式如下:
;
其中代表A m 度矩阵;
4)引入协同卷积模块用于三个图的协同卷积,提取基于空间图的共同嵌入E cs 、基于特征图的共同嵌入E cf 和基于形态图的共同嵌入E cm ,其表达式分别如下:
;
;
;
其中是协同卷积模块中第l层的权重参数,/>、/>和/>是分别从空间图、特征图、形态图中提取的共同嵌入,/>、/>和/>分别代表空间图、特征图、形态图中对称归一化的邻接矩阵,下标c表示协同卷积模块;
通过上述计算到的、/>和/>定义共嵌入/>为:
;
一致性约束损失L con的表达式如下:
;
上式中:是从空间图提取的嵌入,/>是从特征图提取的嵌入,/>是从形态图中提取的嵌入。
步骤6中搭建的空间域识别模型,引入了注意力机制来自适应的学习由多通道图卷积自编码器MCGCN()生成的基于空间图的低维嵌入E s 、基于特征图的低维嵌入E f 、基于形态图的低维嵌入E m 以及共嵌入E c 的重要性以生成相应的权重参数ω s 、ω f 、ω m 和ω c ,通过权重参数生成最终的低维嵌入Efinal,权重参数的生成过程如下:
;
。
所述NB解码器Decoder()结合了负二项分布来建模数据的分布特征,基于负二项分布模型,考虑了基因表达数据的离散性和变异性,重建基因表达矩阵,以捕获ST数据的复杂全局信息,NB解码器Decoder()的构成如下:
首先定义一个包含一个线性层和一个批量归一化层的中间层,用于将编码器输出的低维嵌入Efinal映射到一个更高维度的空间,采用ReLU激活函数,用于引入非线性,定义两个线性层分别对中间层的输出进行映射到原始维度,得到分布的离散度θ和均值μ;
对于给定的基因表达矩阵X,假设其符合负二项分布,基因表达的概率分布f NB 定义如下:
;
其中离散度θ和均值μ由解码器计算得到,Γ表示伽马函数;
为了最小化预测值与真实值之间的差异,采用负对数似然估计作为原始基因的重建损失L NB_rec,定义如下:
。
本发明相对于现有技术具备的有益效果为:本发明通过由多通道图卷积自编码器MCGCN()和NB解码器Decoder()构成的空间域识别模型整合了空间转录组中的组织学形态信息、基因表达信息和空间位置信息,解决了现有大多数方法在有效利用空间信息和匹配的高分辨率组织学图像方面存在局限性及空间域识别精度低的问题。对于深入理解空间背景下的组织和功能具有重要意义。
附图说明
下面结合附图对本发明做进一步说明:
图1为本发明方法的流程图;
图2为本发明实施例中七种空间域划分方法的平均ARI柱状图;
图3为本发明实施例中七种空间域划分方法的箱线图;
图4为本发明实施例中切片151672的空间转录组测序组织学H&E染色切片图像;
图5为本发明实施例中七种方法对切片151672的识别效果图。
具体实施方式
如图1至图5所示,本发明提供了一种整合空间转录组多模态信息的空间域识别方法,参照图1,本发明的具体实现步骤如下:
步骤1:获取通过空间转录组测序技术测量得到的包含组织切片图像、spot的基因表达数据和每个spot在组织切片图像中的实际空间位置信息的数据集,后续用到的基因表达矩阵即为基因表达数据;
步骤2:数据集加载与预处理:加载数据集,获取基因表达数据和空间位置信息;删除包含空值的样本/细胞;对数据集进行归一化处理,包括过滤基因、选择高度可变基因、归一化基因表达矩阵等;
步骤3:图像切割和形态特征提取:通过对组织切片图像进行切割,使用预训练的卷积神经网络提取形态特征向量,并存储在AnnData对象的obsm字典中,得到形态学信息;
步骤4:图构建:使用预处理后的基因表达数据构建特征邻接矩阵,其中特征邻接矩阵通过计算最近邻居关系得到;使用预处理后的空间位置信息构建空间邻接矩阵,其中空间邻接矩阵通过定义最近邻的半径得到,并进行负采样,得到空间负采样矩阵;使用形态学信息构建形态邻接矩阵,其中形态邻接矩阵通过计算形态学特征矩阵之间的皮尔逊相关系数得到,并进行负采样,得到形态负采样矩阵;
然后将特征邻接矩阵、空间邻接矩阵、形态邻接矩阵分别结合基因表达矩阵后生成特征图、空间图和形态图;
步骤5:图保存与数据处理,将构建的特征邻接矩阵、空间邻接矩阵、形态邻接矩阵、空间负采样矩阵、形态负采样矩阵保存到AnnData对象的obsm字典中,方便后续的空间域识别模型训练;
步骤6:搭建由多通道图卷积自编码器MCGCN()和NB解码器Decoder()构成的空间域识别模型,将预处理后的数据输入空间域识别模型进行训练,得到潜在嵌入特征;
步骤7:对潜在嵌入特征进行聚类以生成聚类标签,用于空间域的识别。
其中步骤2中对数据集的基因表达数据进行预处理的流程如下:
1)对原始基因表达数据进行归一化处理;
2)过滤掉表达基因在少于100个细胞中出现的基因;
3)在剩余的基因中选择排序为n的高度可变基因;
4)对筛选后的基因表达数据进行归一化处理:将每个细胞中的基因表达量除以该细胞的基因表达总和,然后乘以10000;
5)使用Scanpy库对归一化后的基因表达数据进行缩放。
步骤3中对组织切片图像进行图像切割是以spot在切片中的实际坐标来确定图像块的中心,将组织切片图像裁剪成大小为224x224像素的方形图像块。对组织切片图像进行形态特征提取是利用预训练的ResNet50模型作为特征提取器,以切割好的图像块为输入,提取组织切片图像中的形态学信息。
步骤4中的图构建包含特征图构建、空间图构建和形态图构建,其构建流程如下:
1)特征图构建
a.根据数据情况选择是否对输入的基因表达数据进行主成分分析降维,其中数据情况根据采用的不同的数据集进行判断;
b.基于基因表达数据计算spot之间的余弦距离d f ,以衡量基因表达相似性;
c.基于计算出的余弦距离d f 选取每个spot的前k个最近邻,构建表征基因表达相似性的特征邻接矩阵A f ;
d.将基因表达矩阵X作为节点属性特征矩阵;
e.基于表征基因表达相似性的特征邻接矩阵A f 和节点属性特征矩阵X,构建特征图G f (A f ,X)。
2)空间图构建
a.基于空间位置信息计算spot之间的欧几里得距离d s ,以衡量空间相似性;
b.基于计算出的欧几里得距离d s 结合预先定义的半径r,构建表征空间相似性的空间邻接矩阵A s ;
c.将基因表达矩阵X作为节点属性特征矩阵;
d.基于表征空间相似性的空间邻接矩阵A s 和节点属性特征矩阵X,构建空间图G s (A s ,X)。
3)形态图构建
a.基于步骤3中提取到的形态学信息计算每个spot所对应的图像块之间的皮尔逊相关性d m ,以衡量形态相似性;
b.基于计算出的皮尔逊相关性d m 选取每个spot的前k个最近邻,构建表征形态相似性的形态邻接矩阵A m ;
c.将基因表达矩阵X作为节点属性特征矩阵;
d.基于表征形态相似性的形态邻接矩阵A m 和节点属性特征矩阵X,构成形态图G m (A m ,X)。
步骤4中的图构建所涉及的邻接矩阵的构建方法如下:
1)特征邻接矩阵的计算
通过余弦距离d f 衡量基因表达相似性,获得基因表达的潜在结构,对于给定的spotS i 和spotS j ,假设其基因表达为x i 和x j ,那么余弦距离d f 的计算公式如下:
。
为了更好的定义基因表达相似性,构建基因表达矩阵X的k近邻图,称为特征图G f (A f ,X),其中A f 是N个spot的特征邻接矩阵,根据上述计算得到的余弦距离d f 计算特征邻接矩阵,找到每个spot的前k个基因表达最相似spot定义为邻居。具体计算方法如下:对于给定的spotS i ,若spotS j 是spotS i 的邻居,则令其邻接矩阵相应位置Af ij =1否则=0,构建公式如下式所示:
。
2)空间邻接矩阵的计算
首先通过spot的空间位置信息计算每个spot与其它所有spot之间的欧几里得距离d s ,来衡量空间相似性,为了定义其邻接关系,预先定义一个半径r,根据上述计算得到的两个spot之间的欧几里得距离ds ij 结合预先定义的半径r计算两个spot之间的空间邻接矩阵A s ,具体构建方法如下:对于给定的spotS i ,若两个spot中心之间的距离ds ij 小于计算半径r,则认为spotS j 与spotS i 是相邻的,此时令其邻接矩阵相应位置As ij =1否则As ij =0,计算公式如下式所示:
。
3)形态邻接矩阵的计算
先根据每个spot坐标信息对组织切片图像进行分割,并通过预训练的卷积神经网络对图像特征进行提取并作为该spot的形态特征向量;由于预训练的卷积神经模型提取的形态特征向量是高维的,为了更好的表示spot的形态学特征,使用PCA主成分分析选取前50个成分作为每个spot的形态学潜在特征表示M,最终对于spotS i 和spotS j ,利用上述计算得到的形态学潜在特征表示M i 和M j 计算两个spot之间的皮尔逊相关性dm ij ,其计算公式如下:
;
上式中:cov(M i ,M j )表示M i 和M j 的协方差,表示M i 的标准差,/>表示M j 的标准差,E表示数学期望。
为了更好的形态相似性,构建基因表达矩阵X的k近邻图,称为特征图G m (A m ,X),其中A m 是对应于N个spot的N个图像块的形态邻接矩阵,根据上述计算得到的皮尔逊相关性dm ij 计算形态邻接矩阵,找到每个spot前k个形态特征最相似的图像块定义为邻居,具体计算方法如下:对于给定的spotS i ,若spotS j 是spotS i 的邻居,则令其邻接矩阵相应位置Am ij =1否则Am ij =0,构建公式同特征邻接矩阵。
其中生成的空间邻接矩阵、空间负采样矩阵和形态邻接矩阵、形态负采样矩阵是为了定义正则化约束,从而促使模型更好地捕捉图的结构信息,优选的考虑多种图结构的影响,通过对比节点之间的余弦相似度使得模型更全面地学到图的结构信息。具体如下:
1)考虑空间图的正则化约束损失的定义如下:
;
上式中:是spot i的空间邻居集,mat ik 和mat ij 是基于所学习的潜在表示Efinal的余弦相似性矩阵,σ表示计算mat ik 和mat ij 中每个元素的自然对数,N spot表示spot的个数,i表示第i个spot,j表示第j个属于空间邻居集的spot,k表示第k个不属于空间邻居集的spot。
损失中包含两个部分,空间邻接矩阵正样本损失:鼓励空间相邻节点的嵌入向量在嵌入空间中更加接近,以促使模型学到空间图中的局部结构。空间邻接矩阵负样本损失:鼓励空间不相邻节点的嵌入向量在嵌入空间中更加远离,以帮助模型避免学到图中的噪声和过拟合。
2)考虑形态图的正则化约束损失的定义如下:
;
上式中:M i 是spot i的形态邻居集。
损失中包含两个部分,形态邻接矩阵正样本损失:鼓励形态特征相邻节点的嵌入向量在嵌入空间中更加接近,以促使模型学到形态图中的局部结构。形态邻接矩阵负样本损失:鼓励不相邻节点的嵌入向量在嵌入空间中更加远离,以帮助模型避免学到形态图中的噪声和过拟合。
3)综上,综合考虑空间图的正则化约束损失和形态图的正则化约束损失/>定义模型整体的正则化约束损失L reg如下:
。
步骤6中搭建的空间域识别模型由多通道图卷积自编码器MCGCN()和NB解码器Decoder()构成。其损失函数L由原始基因的重建损失L NB_rec、一致性约束损失L con和正则化约束损失L reg联合而成,定义如下:
L=αL NB_rec+βL con+γL reg;
上式中:α表示原始基因的重建损失L NB_rec的权重参数,β表示一致性约束损失L con的权重参数,γ表示正则化约束损失L reg的权重参数。
步骤6中搭建了空间域识别模型,其中多通道图卷积自编码器MCGCN()由空间卷积模块、特征卷积模块、形态卷积模块和协同卷积模块构成,其生成低维嵌入的方式如下:
1)空间卷积模块是对空间图进行卷积运算,应用以下分层传播规则来生成低维嵌入E s ,其表达式如下:
;
其中是空间卷积模块中第l层的权重参数,/>是空间卷积模块中第l层生成的低维嵌入,ReLU代表ReLU激活函数,在上式中初始化的/>代表基因表达矩阵,/>是空间图中对称归一化的邻接矩阵,其计算公式如下:
;
其中代表A s 度矩阵。
2)特征卷积模块对特征图进行卷积运算,应用以下分层传播规则来生成低维嵌入E f ,其表达式如下:
;
其中是特征卷积模块中第l层的权重参数,/>是特征卷积模块中第l层生成的低维嵌入,ReLU代表ReLU激活函数,在上式中初始化的/>代表基因表达矩阵,/>是特征图中对称归一化的邻接矩阵,其计算公式如下:
;
其中代表A f 度矩阵。
3)形态卷积模块对形态图进行卷积运算,应用以下分层传播规则来生成低维嵌入E m ,其表达式如下:
;
其中是形态卷积模块中第l层的权重参数,/>是形态卷积模块中第l层生成的低维嵌入,ReLU代表ReLU激活函数,在上式中初始化的/>代表基因表达矩阵,/>是特征图中对称归一化的邻接矩阵,其计算公式如下:
;
其中代表A m 度矩阵。
4)由于基因表达和空间分布以及形态信息有一定的相关性,因此引入协同卷积模块用于三个图的协同卷积,提取基于空间图的共同嵌入E cs 、基于特征图的共同嵌入E cf 和基于形态图的共同嵌入E cm ,其表达式分别如下:
;
;
;
其中是协同卷积模块中第l层的权重参数,/>、/>和/>是分别从空间图、特征图、形态图中提取的共同嵌入,/>、/>和/>分别代表空间图、特征图、形态图中对称归一化的邻接矩阵,计算方式同上,下标c表示协同卷积模块。
通过上述计算到的、/>和/>定义共嵌入/>为:
。
为了帮助模型学习到更具一致性的表示,通过比较、/>和/>之间的协方差矩阵的差异来度量它们的一致性。定义一致性约束损失L con如下:
;
上式中:是从空间图提取的嵌入,/>是从特征图提取的嵌入,/>是从形态图中提取的嵌入。
步骤6中搭建的空间域识别模型,引入了注意力机制来自适应的学习由多通道图卷积自编码器MCGCN()生成的基于空间图的低维嵌入E s 、基于特征图的低维嵌入E f 、基于形态图的低维嵌入E m 以及共嵌入E c 的重要性以生成相应的权重参数ω s 、ω f 、ω m 和ω c ,通过权重参数生成最终的低维嵌入Efinal,权重参数的生成过程如下:
;
。
步骤6中搭建了空间域识别模型,NB解码器Decoder()结合了负二项分布来建模数据的分布特征,基于负二项分布模型,考虑了基因表达数据的离散性和变异性,重建基因表达矩阵,以捕获ST数据的复杂全局信息。其构成如下:
首先定义了一个包含一个线性层和一个批量归一化层的中间层,用于将编码器输出的低维嵌入Efinal映射到一个更高维度的空间,从而提取出更高级别的特征,采用ReLU激活函数,用于引入非线性。定义两个线性层分别对中间层的输出进行映射到原始维度,得到分布的离散度θ和均值μ。离散度和均值都经过不同的激活函数进行处理从而保证其值不会过小或过大。通过这种设计使得模型更好地拟合真实数据。具体的,对于给定的基因表达矩阵X,假设其符合负二项分布,基因表达的概率分布f NB 定义如下:
;
其中离散度θ和均值μ由解码器计算得到,Γ表示伽马函数。
为了最小化预测值与真实值之间的差异,采用负对数似然估计作为原始基因的重建损失L NB_rec,定义如下:
。
步骤7中的聚类依靠R中mclust包中Mclust()函数实现。
为了进一步验证本发明的有效性和可行性,进行实验:以10x Visium的空间转录组测序的人类背外侧前额皮质层数据集进行验证,该数据集中包含spot个数为3460-4789,每个spot有33538个基因。使用调整兰德指数ARI作为评价各方法的空间聚类结果的评价指标。
本发明提出的方法与六种具有代表性的空间域识别方法进行比较,其中包含一种非空间方法Leiden、两种不需要组织学图像的空间方法SEDR、STAGATE和三种使用组织学图像的空间方法stLearn、SpaGCN和DeepST。对比结果如表1所示。基于不同的方法的空间域识别结果如图5所示(以切片151672为例)。
表1 本发明提出的方法与六种具有代表性的空间域识别方法进行的比较。
从表1中可以看出,本发明提出的一种整合空间转录组多模态信息的空间域识别方法在10x Visium的DLPFC的12个数据集上相对于其他方法有较好的结果。其ARI均值如图2所示,七种空间域划分方法的箱线图如图3所示,由图2、图3可知本发明的一种整合空间转录组多模态信息的空间域识别方法均值比其他方法都要高,为0.57。整体的识别效果也比其他方法好。为了更好的说明本发明的技术方案,以切片151672为例,其组织学H&E染色切片图像如图4所示,本发明计算出的调整兰德指数ARI为0.84,与其余六种方法的识别效果对比如图5所示,从图5中可以看出本发明提出的方法相对于其他方法来说对空间域的识别更准确,更接近于真实标签,也充分说明了本发明方法的空间域识别能力。
本发明提出的方法通过对空间转录组中测量得到的组织切片图像、基因表达数据和空间位置信息进行预处理;基于这些信息,通过不同的相似性度量构造空间邻接矩阵、特征邻接矩阵和形态邻接矩阵,接着结合基因表达矩阵构建空间图、特征图、形态图。将基因表达与每个邻接图相结合,构建了基于多通道图的空间域识别模型,学习多个图的特定嵌入。并计算一致性约束损失、重构损失和空间正则化约束损失以训练模型。为了捕捉不同图的重要性,设计了注意力机制自适应的学习各个嵌入的重要性以生成低维最终嵌入。根据学习到的嵌入进行聚类以实现空间域的识别。整合了空间转录组中的组织学形态信息、基因表达信息和空间位置信息,提高了空间域识别精度。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (10)
1.一种整合空间转录组多模态信息的空间域识别方法,其特征在于:包括如下步骤:
步骤1:获取数据集,所述数据集通过空间转录组测序技术测量得到,所述数据集中包含组织切片图像、spot的基因表达数据和每个spot在组织切片图像中的实际空间位置信息;
步骤2:数据集加载与预处理:对基因表达数据和空间位置信息进行预处理;
步骤3:图像切割和形态特征提取:通过对组织切片图像进行切割,使用预训练的卷积神经网络提取形态特征向量,得到形态学信息;
步骤4:通过不同的相似性度量构造空间邻接矩阵、特征邻接矩阵和形态邻接矩阵,然后结合基因表达矩阵构建空间图、特征图和形态图;
步骤5:图保存与数据处理;
步骤6:搭建由多通道图卷积自编码器MCGCN()和NB解码器Decoder()构成的空间域识别模型,将预处理后的数据输入搭建到的空间域识别模型进行训练,得到潜在嵌入特征;
步骤7:对潜在嵌入特征进行聚类以生成聚类标签,用于空间域的识别。
2.根据权利要求1所述的一种整合空间转录组多模态信息的空间域识别方法,其特征在于:步骤3中对组织切片图像进行图像切割是以spot在切片中的实际坐标来确定图像块的中心,将组织切片图像裁剪成设定尺寸的方形图像块;
对组织切片图像进行形态特征提取是利用预训练的ResNet50模型作为特征提取器,以切割好的图像块为输入,提取组织切片图像中的形态学信息。
3.根据权利要求2所述的一种整合空间转录组多模态信息的空间域识别方法,其特征在于:步骤4中特征图的构建步骤如下:
a.根据数据情况选择是否对输入的基因表达数据进行主成分分析降维;
b.基于基因表达数据计算spot之间的余弦距离d f ,以衡量基因表达相似性;
c.基于计算出的余弦距离d f 选取每个spot的前k个最近邻,构建表征基因表达相似性的特征邻接矩阵A f ;
d.将基因表达矩阵作为节点属性特征矩阵X;
e.基于表征基因表达相似性的特征邻接矩阵A f 和节点属性特征矩阵X,构建特征图G f (A f ,X)。
4.根据权利要求2所述的一种整合空间转录组多模态信息的空间域识别方法,其特征在于:步骤4中空间图的构建步骤如下:
a.基于空间位置信息计算spot之间的欧几里得距离d s ,以衡量空间相似性;
b.基于计算出的欧几里得距离d s 结合预先定义的半径r,构建表征空间相似性的空间邻接矩阵A s ;
c.将基因表达矩阵作为节点属性特征矩阵X;
d.基于表征空间相似性的空间邻接矩阵A s 和节点属性特征矩阵X,构建空间图G s (A s ,X)。
5.根据权利要求2所述的一种整合空间转录组多模态信息的空间域识别方法,其特征在于:步骤4中形态图的构建步骤如下:
a.基于步骤3中提取到的形态学信息计算每个spot所对应的图像块之间的皮尔逊相关性d m ,以衡量形态相似性;
b.基于计算出的皮尔逊相关性d m 选取每个spot的前k个最近邻,构建表征形态相似性的形态邻接矩阵A m ;
c.将基因表达矩阵作为节点属性特征矩阵X;
d.基于表征形态相似性的形态邻接矩阵A m 和节点属性特征矩阵X,构成形态图G m (A m ,X)。
6.根据权利要求3-5任一项所述的一种整合空间转录组多模态信息的空间域识别方法,其特征在于:步骤6中的空间域识别模型的损失函数L由原始基因的重建损失L NB_rec、一致性约束损失L con和正则化约束损失L reg联合而成,定义如下:
L=αL NB_rec+βL con+γL reg;
上式中:α表示原始基因的重建损失L NB_rec的权重参数,β表示一致性约束损失L con的权重参数,γ表示正则化约束损失L reg的权重参数。
7.根据权利要求6所述的一种整合空间转录组多模态信息的空间域识别方法,其特征在于:所述正则化约束损失L reg由考虑空间图的正则化约束损失 、考虑形态图的正则化约束损失/>组成,其计算公式如下:
;
其中:
;
上式中:是spot i的空间邻居集,mat ik 和mat ij 是基于所学习的潜在表示Efinal的余弦相似性矩阵,σ表示计算mat ik 和mat ij 中每个元素的自然对数,N spot表示spot的个数,i表示第i个spot,j表示第j个属于空间邻居集的spot,k表示第k个不属于空间邻居集的spot;
;
上式中:M i 是spot i的形态邻居集。
8.根据权利要求7所述的一种整合空间转录组多模态信息的空间域识别方法,其特征在于:所述多通道图卷积自编码器MCGCN()由空间卷积模块、特征卷积模块、形态卷积模块和协同卷积模块构成,其生成低维嵌入的方式如下:
1)空间卷积模块是对空间图进行卷积运算,应用以下分层传播规则来生成低维嵌入E s ,其表达式如下:
;
其中是空间卷积模块中第l层的权重参数,/>是空间卷积模块中第l层生成的低维嵌入,ReLU代表ReLU激活函数,在上式中初始化的/>代表基因表达矩阵,/>是空间图中对称归一化的邻接矩阵,其计算公式如下:
;
其中代表A s 度矩阵;
2)特征卷积模块对特征图进行卷积运算,应用以下分层传播规则来生成低维嵌入E f ,其表达式如下:
;
其中是特征卷积模块中第l层的权重参数,/>是特征卷积模块中第l层生成的低维嵌入,ReLU代表ReLU激活函数,在上式中初始化的/>代表基因表达矩阵,/>是特征图中对称归一化的邻接矩阵,其计算公式如下:
;
其中代表A f 度矩阵;
3)形态卷积模块对形态图进行卷积运算,应用以下分层传播规则来生成低维嵌入E m ,其表达式如下:
;
其中是形态卷积模块中第l层的权重参数,/>是形态卷积模块中第l层生成的低维嵌入,ReLU代表ReLU激活函数,在上式中初始化的/>代表基因表达矩阵,/>是特征图中对称归一化的邻接矩阵,其计算公式如下:
;
其中代表A m 度矩阵;
4)引入协同卷积模块用于三个图的协同卷积,提取基于空间图的共同嵌入E cs 、基于特征图的共同嵌入E cf 和基于形态图的共同嵌入E cm ,其表达式分别如下:
;
;
;
其中是协同卷积模块中第l层的权重参数,/>、/>和/>是分别从空间图、特征图、形态图中提取的共同嵌入,/>、/>和/>分别代表空间图、特征图、形态图中对称归一化的邻接矩阵,下标c表示协同卷积模块;
通过上述计算到的、/>和/>定义共嵌入/>为:
;
一致性约束损失L con的表达式如下:
;
上式中:是从空间图提取的嵌入,/>是从特征图提取的嵌入,/>是从形态图中提取的嵌入。
9.根据权利要求8所述的一种整合空间转录组多模态信息的空间域识别方法,其特征在于:步骤6中搭建的空间域识别模型,引入了注意力机制来自适应的学习由多通道图卷积自编码器MCGCN()生成的基于空间图的低维嵌入E s 、基于特征图的低维嵌入E f 、基于形态图的低维嵌入E m 以及共嵌入E c 的重要性以生成相应的权重参数ω s 、ω f 、ω m 和ω c ,通过权重参数生成最终的低维嵌入Efinal,权重参数的生成过程如下:
;
。
10.根据权利要求8所述的一种整合空间转录组多模态信息的空间域识别方法,其特征在于:所述NB解码器Decoder()结合了负二项分布来建模数据的分布特征,基于负二项分布模型,考虑了基因表达数据的离散性和变异性,重建基因表达矩阵,以捕获ST数据的复杂全局信息,NB解码器Decoder()的构成如下:
首先定义一个包含一个线性层和一个批量归一化层的中间层,用于将编码器输出的低维嵌入Efinal映射到一个更高维度的空间,采用ReLU激活函数,用于引入非线性,定义两个线性层分别对中间层的输出进行映射到原始维度,得到分布的离散度θ和均值μ;
对于给定的基因表达矩阵X,假设其符合负二项分布,基因表达的概率分布f NB 定义如下:
;
其中离散度θ和均值μ由解码器计算得到,Γ表示伽马函数;
为了最小化预测值与真实值之间的差异,采用负对数似然估计作为原始基因的重建损失L NB_rec,定义如下:
。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410419410.3A CN118016149B (zh) | 2024-04-09 | 2024-04-09 | 一种整合空间转录组多模态信息的空间域识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410419410.3A CN118016149B (zh) | 2024-04-09 | 2024-04-09 | 一种整合空间转录组多模态信息的空间域识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN118016149A true CN118016149A (zh) | 2024-05-10 |
CN118016149B CN118016149B (zh) | 2024-06-18 |
Family
ID=90943299
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410419410.3A Active CN118016149B (zh) | 2024-04-09 | 2024-04-09 | 一种整合空间转录组多模态信息的空间域识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118016149B (zh) |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA3109279A1 (en) * | 2018-05-24 | 2019-11-28 | University Of Pittsburgh-Of The Commonwealth System Of Higher Education | Predicting cancer recurrence from spatial multi-parameter cellular and subcellular imaging data. |
CN114067905A (zh) * | 2021-11-08 | 2022-02-18 | 大连大学 | 一种融合多层药物结构信息的药物-靶点相互作用预测方法 |
CN115732034A (zh) * | 2022-11-17 | 2023-03-03 | 山东大学 | 一种空间转录组细胞表达模式的识别方法及系统 |
CN116189785A (zh) * | 2023-02-10 | 2023-05-30 | 西安电子科技大学 | 基于空间转录组学数据特征提取的空间域识别方法 |
CN116312782A (zh) * | 2023-05-18 | 2023-06-23 | 南京航空航天大学 | 一种融合影像基因数据的空间转录组spot区域聚类方法 |
CN116525003A (zh) * | 2023-04-28 | 2023-08-01 | 郑州大学 | 一种基于非线性深度自编码器的空间转录组空间域划分方法及系统 |
CN116741273A (zh) * | 2023-02-15 | 2023-09-12 | 中山大学中山眼科中心 | 一种识别空间转录组空间区域和细胞类型的特征学习方法 |
US20230306761A1 (en) * | 2020-09-02 | 2023-09-28 | The General Hospital Corporation | Methods for identifying cross-modal features from spatially resolved data sets |
CN117153260A (zh) * | 2023-09-18 | 2023-12-01 | 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) | 基于对比学习的空间转录组数据聚类方法、装置及介质 |
CN117253550A (zh) * | 2023-09-08 | 2023-12-19 | 湖南工业大学 | 一种空间转录组数据聚类方法 |
CN117422897A (zh) * | 2023-11-13 | 2024-01-19 | 江南大学 | 一种基于多模态结构化嵌入模型的脑组织识别与分区方法 |
CN117457081A (zh) * | 2023-10-26 | 2024-01-26 | 湖北文理学院 | 一种基于超图的空间转录组数据处理方法及系统 |
CN117708628A (zh) * | 2023-12-07 | 2024-03-15 | 西安电子科技大学 | 基于图深度学习的空间转录组学中空间域识别方法 |
CN117883082A (zh) * | 2023-12-07 | 2024-04-16 | 太原理工大学 | 一种异常情绪识别方法、系统、设备及介质 |
-
2024
- 2024-04-09 CN CN202410419410.3A patent/CN118016149B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA3109279A1 (en) * | 2018-05-24 | 2019-11-28 | University Of Pittsburgh-Of The Commonwealth System Of Higher Education | Predicting cancer recurrence from spatial multi-parameter cellular and subcellular imaging data. |
US20230306761A1 (en) * | 2020-09-02 | 2023-09-28 | The General Hospital Corporation | Methods for identifying cross-modal features from spatially resolved data sets |
CN114067905A (zh) * | 2021-11-08 | 2022-02-18 | 大连大学 | 一种融合多层药物结构信息的药物-靶点相互作用预测方法 |
CN115732034A (zh) * | 2022-11-17 | 2023-03-03 | 山东大学 | 一种空间转录组细胞表达模式的识别方法及系统 |
CN116189785A (zh) * | 2023-02-10 | 2023-05-30 | 西安电子科技大学 | 基于空间转录组学数据特征提取的空间域识别方法 |
CN116741273A (zh) * | 2023-02-15 | 2023-09-12 | 中山大学中山眼科中心 | 一种识别空间转录组空间区域和细胞类型的特征学习方法 |
CN116525003A (zh) * | 2023-04-28 | 2023-08-01 | 郑州大学 | 一种基于非线性深度自编码器的空间转录组空间域划分方法及系统 |
CN116312782A (zh) * | 2023-05-18 | 2023-06-23 | 南京航空航天大学 | 一种融合影像基因数据的空间转录组spot区域聚类方法 |
CN117253550A (zh) * | 2023-09-08 | 2023-12-19 | 湖南工业大学 | 一种空间转录组数据聚类方法 |
CN117153260A (zh) * | 2023-09-18 | 2023-12-01 | 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) | 基于对比学习的空间转录组数据聚类方法、装置及介质 |
CN117457081A (zh) * | 2023-10-26 | 2024-01-26 | 湖北文理学院 | 一种基于超图的空间转录组数据处理方法及系统 |
CN117422897A (zh) * | 2023-11-13 | 2024-01-19 | 江南大学 | 一种基于多模态结构化嵌入模型的脑组织识别与分区方法 |
CN117708628A (zh) * | 2023-12-07 | 2024-03-15 | 西安电子科技大学 | 基于图深度学习的空间转录组学中空间域识别方法 |
CN117883082A (zh) * | 2023-12-07 | 2024-04-16 | 太原理工大学 | 一种异常情绪识别方法、系统、设备及介质 |
Non-Patent Citations (9)
Title |
---|
HUO XY等: "Integrating multi-modal information to detect spatial domains of spatial transcriptomics by graph attention network", JOURNAL OF GENETICS AND GENOMICS, vol. 50, no. 9, 30 September 2023 (2023-09-30) * |
LEI Y等: "Region-specific transcriptomic responses to obesity and diabetes in macaque hypothalamus", CELL METABOLISM, 6 February 2024 (2024-02-06) * |
LI HAIKUO等: "Transcriptomic, epigenomic, and spatial metabolomic cell profiling redefines regional human kidney anatomy", CELL METABOLISM, 13 March 2024 (2024-03-13) * |
刘帆;陈泽华;柴晶;: "一种基于深度神经网络模型的多聚焦图像融合方法", 山东大学学报(工学版), no. 03, 7 January 2016 (2016-01-07) * |
刘璇: "结合NLM滤波和改进FCM的肝脏CT图像分割算法", 中国优秀硕士学位论文全文数据库(电子期刊)医药卫生科技辑, no. 2, 15 February 2023 (2023-02-15) * |
刘腾等: "基于变分自编码器的空间转录组细胞聚类研究", 生物信息学, 9 October 2023 (2023-10-09) * |
吴瀚文等: "通过图注意力网络识别空间转录组中的空间域", 生物医学工程学杂志, 11 April 2024 (2024-04-11) * |
施俊;汪琳琳;王珊珊;陈艳霞;王乾;魏冬铭;梁淑君;彭佳林;易佳锦;刘盛锋;倪东;王明亮;张道强;沈定刚;: "深度学习在医学影像中的应用综述", 中国图象图形学报, no. 10, 16 October 2020 (2020-10-16) * |
袁立宁等: "基于多通道图卷积自编码器的图表示学习", 计算机工程, 27 May 2022 (2022-05-27) * |
Also Published As
Publication number | Publication date |
---|---|
CN118016149B (zh) | 2024-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kauffmann et al. | From clustering to cluster explanations via neural networks | |
Al-Haija et al. | Breast cancer diagnosis in histopathological images using ResNet-50 convolutional neural network | |
CN111598881B (zh) | 基于变分自编码器的图像异常检测方法 | |
CN111090764B (zh) | 基于多任务学习和图卷积神经网络的影像分类方法及装置 | |
CN113706487A (zh) | 基于自监督特征小样本学习的多器官分割方法 | |
CN111785329A (zh) | 基于对抗自动编码器的单细胞rna测序聚类方法 | |
CN118176527A (zh) | 从空间分辨数据集识别跨模态特征的方法 | |
Sriwong et al. | Dermatological classification using deep learning of skin image and patient background knowledge | |
CN111028923B (zh) | 数字病理图像染色归一化方法、电子装置及存储介质 | |
CN116580848A (zh) | 一种基于多头注意力机制的分析癌症多组学数据方法 | |
CN114496099A (zh) | 细胞功能注释方法、装置、设备及介质 | |
CN115631847B (zh) | 基于多组学特征的早期肺癌诊断系统、存储介质及设备 | |
CN115732034A (zh) | 一种空间转录组细胞表达模式的识别方法及系统 | |
CN115496144A (zh) | 配电网运行场景确定方法、装置、计算机设备和存储介质 | |
CN117520914A (zh) | 一种单细胞分类方法、系统、设备及计算机可读存储介质 | |
CN114121158A (zh) | 一种基于深度网络自适应的scRNA-seq细胞类型识别方法 | |
CN117611918A (zh) | 基于层次神经网络的海洋生物分类方法 | |
CN117457081A (zh) | 一种基于超图的空间转录组数据处理方法及系统 | |
CN118016149B (zh) | 一种整合空间转录组多模态信息的空间域识别方法 | |
CN116189785A (zh) | 基于空间转录组学数据特征提取的空间域识别方法 | |
CN108256569B (zh) | 一种复杂背景下的对象识别方法及使用的计算机技术 | |
CN113177602B (zh) | 图像分类方法、装置、电子设备和存储介质 | |
CN115170599A (zh) | 通过图神经网络的链路预测进行血管分割的方法和装置 | |
CN113971984A (zh) | 分类模型构建方法及装置、电子设备、存储介质 | |
CN117037895B (zh) | 模型训练方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |