CN114187966A - 一种基于生成对抗网络的单细胞rna序列缺失值填补方法 - Google Patents

一种基于生成对抗网络的单细胞rna序列缺失值填补方法 Download PDF

Info

Publication number
CN114187966A
CN114187966A CN202111509958.XA CN202111509958A CN114187966A CN 114187966 A CN114187966 A CN 114187966A CN 202111509958 A CN202111509958 A CN 202111509958A CN 114187966 A CN114187966 A CN 114187966A
Authority
CN
China
Prior art keywords
data
rna sequence
filling
missing
countermeasure network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111509958.XA
Other languages
English (en)
Inventor
徐丽
薛同
许寅
丛晓红
江粤
张新玉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Engineering University
Original Assignee
Harbin Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Engineering University filed Critical Harbin Engineering University
Priority to CN202111509958.XA priority Critical patent/CN114187966A/zh
Publication of CN114187966A publication Critical patent/CN114187966A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Artificial Intelligence (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

一种基于生成对抗网络的单细胞RNA序列缺失值填补方法,它属于生物信息领域。本发明解决了采用现有方法对缺失数据填补的准确率低的问题。本发明通过生成对抗网络对RNA序列缺失值进行填补,在生成器部分,引入由DrImpute填补完成的数据作为方向约束,在使用自编码器生成缺失值的同时,在损失函数中加入方向约束项,并对解码层给予了一个Relu激活函数来解决填补后的数据出现负值的情况。实验证明,采用本发明的方法可以显著提高数据填补的准确率。本发明可以应用于对RNA序列缺失值进行填补。

Description

一种基于生成对抗网络的单细胞RNA序列缺失值填补方法
技术领域
本发明属于生物信息领域,具体涉及一种基于生成对抗网络的单细胞RNA序列缺失值填补方法。
背景技术
随着高通量测序技术的发展,基因组学测序中单细胞RNA测序(scRNA-seq)技术成为近年来的一个热门话题。相比于之前的批量RNA测序(bulk RNA-seq)技术而言,scRNA-seq具有相对较高的噪声水平,特别是由于所谓的辍学事件(dropout event)。在scRNA-seq数据集的基因细胞表达矩阵中观察到的零由真零和缺失值零组成。真零是基因不表达导致的,而缺失值零是由所谓的辍学事件引起的。辍学事件是一种特殊类型的缺失值,这是由于测序实验中的低RNA输入和单细胞水平上基因表达模式的随机性造成的。然而,大多数为scRNA序列分析开发的统计工具并没有明确地解决这些辍学事件。
利用缺失值填补方法对缺失值进行估计可以保留原始数据中的重要信息,从而避免删除包含缺失值而信息量大的有效基因。又因为缺失值填补方法将不完整数据集转换成完整数据集,从而在数据挖掘的过程当中能够在完整的数据集上,而不是在数据集的子集上进行分析,从而避免分析出的结果产生局部规律的错误,因此,对缺失值填补方法进行研究是十分必要的。
深度学习发展迅速,在图像分类、语音识别等领域取得了较好的成绩。一些研究者已经将最广泛使用的卷积神经网络(Convolutional Neural Networks,CNN)和循环神经网络(Recurrent Neural Network,RNN)框架转移到生物医学领域。但总体而言,深度学习在生物医学领域的应用,尤其是在基因组领域的应用还非常有限。造成这种现象的原因主要有以下两点:首先,常用的RNN/CNN不适用于基因组数据建模;其次,对于深度学习的非专业人士而言,没有一个友好的自动化机器学习框架。
目前基于机器学习方法的缺失值填补方法的表现也并不理想。其原因在于:其一是原始数据中大量的零,使得机器学习方法很难提取数据深层的信息,反而将大部分的零视为真零,即不进行填补,因此机器学习方法填补后的数据较为离散。其二是在使用某些基于机器学习的缺失值填补方法进行填补后,输出的数据中含有负值,但现实的基因表达值应该均为非负值。
综上所述,基于现有的机器学习方法进行缺失值填补时很难提取到数据的深层信息,导致对缺失数据填补的准确率较低。
发明内容
本发明的目的是为解决采用现有方法对缺失数据填补的准确率低的问题,而提出了一种基于生成对抗网络的单细胞RNA序列缺失值填补方法。
本发明为解决上述技术问题所采取的技术方案是:
一种基于生成对抗网络的单细胞RNA序列缺失值填补方法,所述方法具体包括以下步骤:
步骤一、基于RNA序列真实数据构造训练集;
步骤二、构建生成对抗网络,所述生成对抗网络中包括生成器和判别器,其中,生成器是由编码模块和解码模块组成的自编码器;
利用训练集对构建的生成对抗网络进行训练;
步骤三、对需要填补的RNA序列数据进行TPM归一化后,再对TPM归一化结果进行预处理,训练好的生成对抗网络根据预处理结果生成填补后的RNA序列数据。
进一步地,所述步骤一的具体过程为:
步骤一一、从数据集Usoskin中获取RNA序列数据,作为训练集;
步骤一二、获取的每条RNA序列数据均根据设置的缺失参数,来生成带有缺失值的RNA序列数据,并给生成的带有缺失值的RNA序列数据打上标签;
并分别对生成的每条带有缺失值的RNA序列数据进行TPM归一化,分别获得各条带有缺失值的RNA序列数据所对应的TPM归一化后数据;
步骤一三、对TPM归一化后的数据进行预处理,分别获得每条RNA序列数据所对应的预处理后矩阵;
将预处理后的矩阵作为训练生成对抗网络的输入。
进一步地,所述预处理的方式为基因选择和对数转换。
进一步地,所述步骤二中,生成器的损失函数为:
利用DrImpute对预处理后的矩阵进行填补,将填补结果作为方向约束来建立生成器的损失函数:
Figure BDA0003404863930000021
其中,E是编码器矩阵、D是解码器矩阵,R为中间变量,σ是神经网络中应用于编码器层的Sigmoid激活函数,||·||O表示针对存在的非零计数计算损耗,δ是方向约束权重,用于控制方向约束项对成本函数的贡献,λ是正则化系数,F′是方向约束,||·||F是F范数。
进一步地,所述中间变量R为:
R=MoX (2)
其中,o是Hadamard乘积,M是二进制掩码,X代表预处理后的矩阵。
进一步地,所述步骤二中,判别器的损失函数为:
Figure BDA0003404863930000031
其中,ak是第k个缺失数据的真实值通过判别器输出的标签值,
Figure BDA0003404863930000032
是生成器输出的第k个缺失数据的预测值通过判别器输出的标签值,k=1,2,…,K,K是缺失数据的总个数,W是判别器的参数集。
进一步地,所述自编码器的正则化系数λ的取值在0~12000之间。
进一步地,所述自编码器的隐藏层层数在1500~8000之间。
更进一步地,所述生成对抗网络的学习率初始值在10-5~10-3之间。
本发明的有益效果是:
本发明通过生成对抗网络对RNA序列缺失值进行填补,在生成器部分,引入由DrImpute填补完成的数据作为方向约束,在使用自编码器生成缺失值的同时,在损失函数中加入方向约束项,并对解码层给予了一个Relu激活函数来解决填补后的数据出现负值的情况。实验证明,采用本发明的方法可以显著提高数据填补的准确率。
附图说明
图1是本发明方法的流程图。
图2(a)是原始模拟数据当v=8时,直接聚类的结果图;
Rtsne_1和Rtsne_2是对数据使用T_SNE进行降维后得到的两列值;
图2(b)是原始模拟数据当v=8时,采用scImpute方法进行填补后再聚类的结果图;
图2(c)是原始模拟数据当v=8时,采用AutoImpute方法进行填补后再聚类的结果图;
图2(d)是原始模拟数据当v=8时,采用本发明方法进行填补后再聚类的结果图。
具体实施方式
具体实施方式一、结合图1说明本实施方式。本实施方式所述的一种基于生成对抗网络的单细胞RNA序列缺失值填补方法,所述方法具体包括以下步骤:
步骤一、基于RNA序列真实数据构造训练集;
步骤二、构建生成对抗网络,所述生成对抗网络中包括生成器和判别器,其中,生成器是由编码模块和解码模块组成的自编码器;
利用训练集对构建的生成对抗网络进行训练;
步骤三、对需要填补的RNA序列数据进行TPM归一化后,再对TPM归一化结果进行预处理(即基因选择和对数转换),训练好的生成对抗网络根据预处理结果生成填补后的RNA序列数据。
具体实施方式二:本实施方式与具体实施方式一不同的是,所述步骤一的具体过程为:
步骤一一、从数据集Usoskin中获取RNA序列数据,作为训练集;
数据集Usoskin由文献1(Usoskin,D.et al.Unbiased classifcation ofsensory neuron types by large-scale single-cell rnasequencing.Nat.neuroscience 18,145(2015))发表共享。
步骤一二、获取的每条RNA序列数据均根据设置的缺失参数,来生成带有缺失值的RNA序列数据,并给生成的带有缺失值的RNA序列数据打上标签;
标签代表的是每个基因位点是否为缺失值,如果是缺失值,则自编码器向着目标数据学习,使对缺失数据的预测结果尽量接近于目标数据,以得到训练好的自编码器参数;
并分别对生成的每条带有缺失值的RNA序列数据进行TPM归一化,分别获得各条带有缺失值的RNA序列数据所对应的TPM归一化后数据;
步骤一三、对TPM归一化后的数据进行预处理,分别获得每条RNA序列数据所对应的预处理后矩阵;
将预处理后的矩阵作为训练生成对抗网络的输入。
其它步骤及参数与具体实施方式一相同。
具体实施方式三:本实施方式与具体实施方式一或二不同的是,所述预处理的方式为基因选择和对数转换。
其它步骤及参数与具体实施方式一或二相同。
具体实施方式四:本实施方式与具体实施方式一至三之一不同的是,所述步骤二中,生成器的损失函数为:
利用DrImpute对预处理后的矩阵进行填补,将填补结果作为方向约束来建立生成器的损失函数:
Figure BDA0003404863930000051
其中,E是编码器矩阵、D是解码器矩阵,R为中间变量,σ是神经网络中应用于编码器层的Sigmoid激活函数,||·||O表示针对存在的非零计数计算损耗,δ是方向约束权重,用于控制方向约束项对成本函数的贡献,λ是正则化系数,F′是方向约束,||·||F是F范数。
其它步骤及参数与具体实施方式一至三之一相同。
具体实施方式五:本实施方式与具体实施方式一至四之一不同的是,所述中间变量R为:
R=MoX (2)
其中,o是Hadamard乘积,M是含有1的二进制掩码,R包含一个非零项,其他地方是0,X代表预处理后的矩阵。
预处理后的矩阵X经过生成器的输出
Figure BDA0003404863930000052
为:
Figure BDA0003404863930000053
ψ是神经网络中应用于解码器层的Relu激活函数。
其它步骤及参数与具体实施方式一至四之一相同。
具体实施方式六:本实施方式与具体实施方式一至五之一不同的是,所述步骤二中,判别器的损失函数为:
Figure BDA0003404863930000054
其中,ak是第k个缺失数据的真实值通过判别器输出的标签值,
Figure BDA0003404863930000055
是生成器输出的第k个缺失数据的预测值通过判别器输出的标签值,k=1,2,…,K,K是缺失数据的总个数,W是判别器的参数集。
本实施方式中,在缺失数据的位置上,将生成器生成的填补数据标注为0,将真实数据标注为1,将生成的填补数据和真实数据共同输入判别器进行真伪判别,判别器输出填补数据和真实数据对应的真伪标签。
其它步骤及参数与具体实施方式一至五之一相同。
具体实施方式七:本实施方式与具体实施方式一至六之一不同的是,所述自编码器的正则化系数λ的取值在0~12000之间。
正则化系数用于防止非零值过度拟合,在本发明中正则化系数也用于控制正则项对成本函数的贡献。
其它步骤及参数与具体实施方式一至六之一相同。
具体实施方式八:本实施方式与具体实施方式一至七之一不同的是,所述自编码器的隐藏层层数在1500~8000之间。
其它步骤及参数与具体实施方式一至七之一相同。
具体实施方式九:本实施方式与具体实施方式一至八之一不同的是,所述生成对抗网络的学习率初始值在10-5~10-3之间。
其它步骤及参数与具体实施方式一至八之一相同。
选择合适的学习率可以使生成器避免陷入局部最小值并更快达到损失函数的最小值。
本发明中设置的正则化系数值、隐藏层大小、学习率初始值以及收敛阈值如表1所示:
表1
Figure BDA0003404863930000061
实验结果及分析
利用R语言CIDR包模拟了5个细胞类每类40个细胞共计200个细胞的单细胞RNA测序数据,数据规模为200细胞*20200基因。对这些数据分别设置随机丢失参数v=8,对应数据缺失比例为41.20%共产生1组缺失数据。缺失数据中只含数据缺失导致的零,没有基因不表达导致的真零。使用本发明方法对模拟数据进行缺失值填补,基于填补后的数据结果进行T-SNE降维、可视化,再用K-means聚类。并与scImpute方法和AutoImpute方法进行比较。
将本发明、scImpute和AutoImpute三种方法的聚类结果与原始数据归一化后直接聚类的结果进行对比,分别计算处理过的数据与原始数据的聚类评价指标。统计数据聚类结果,根据聚类评价指标绘图进行分析。
如图2(a)至图2(d)所示,当随机丢失参数为8时,分别为对数据采用直接聚类以及scImpute、AutoImpute、本发明方法三种方法进行填补后再聚类的结果图。
根据聚类结果,可以计算出这三种方法在模拟数据集上聚类的评价指标,汇总后如表2所示。
表2三种方法对应模拟数据聚类评价指标
Figure BDA0003404863930000071
其中:
1、Rand是兰德指数
兰德指数计算样本预测值与真实值之间的相似度,取值范围是[0,1],值越大意味着聚类结果与真实情况越吻合。
Figure BDA0003404863930000072
2、ARI是调整兰德指数
对于随机结果,兰德指数并不能保证分数接近0,因此具有更高区分度的调整兰德指数被提出,取值范围是[-1,1],值越大表示聚类结果和真实情况越吻合。
Figure BDA0003404863930000073
3、FM是FM指数
如果记在C中属于同一类的样本对中,在C*也是同一类的样本对的比例为p1,在C*中属于同一类的样本对中,在C也是同一类的样本对的比例为p2,那么FM就是p1和p2的几何平均,取值范围是[0,1]。
Figure BDA0003404863930000074
4、Jaccard是Jaccard系数
Jaccard系数刻画了所有属于同一类的样本对(要么在C中属于同一类,要么在C*中属于同一类),同时在C和C*中属于同一类的样本量的比值,取值范围是[0,1]。
Figure BDA0003404863930000081
为了更加清晰的进行分析,给出了三种方法在模拟数据集上结果好坏的排序,如表3所示,其中1表示最优,3表示最差。
表3三种方法对应模拟数据聚类情况排序
Figure BDA0003404863930000082
分析上述实验结果,可以发现,本发明提出的方法在模拟数据集的聚类实验中有着很好的表现。AutoImpute的表现不太理想,scImpute则略差于本发明方法。总的来说,本发明方法在模拟数据集的表现是最好的。
本发明的上述算例仅为详细地说明本发明的计算模型和计算流程,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动,这里无法对所有的实施方式予以穷举,凡是属于本发明的技术方案所引伸出的显而易见的变化或变动仍处于本发明的保护范围之列。

Claims (9)

1.一种基于生成对抗网络的单细胞RNA序列缺失值填补方法,其特征在于,所述方法具体包括以下步骤:
步骤一、基于RNA序列真实数据构造训练集;
步骤二、构建生成对抗网络,所述生成对抗网络中包括生成器和判别器,其中,生成器是由编码模块和解码模块组成的自编码器;
利用训练集对构建的生成对抗网络进行训练;
步骤三、对需要填补的RNA序列数据进行TPM归一化后,再对TPM归一化结果进行预处理,训练好的生成对抗网络根据预处理结果生成填补后的RNA序列数据。
2.根据权利要求1所述的一种基于生成对抗网络的单细胞RNA序列缺失值填补方法其特征在于,所述步骤一的具体过程为:
步骤一一、从数据集Usoskin中获取RNA序列数据,作为训练集;
步骤一二、获取的每条RNA序列数据均根据设置的缺失参数,来生成带有缺失值的RNA序列数据,并给生成的带有缺失值的RNA序列数据打上标签;
并分别对生成的每条带有缺失值的RNA序列数据进行TPM归一化,分别获得各条带有缺失值的RNA序列数据所对应的TPM归一化后数据;
步骤一三、对TPM归一化后的数据进行预处理,分别获得每条RNA序列数据所对应的预处理后矩阵;
将预处理后的矩阵作为训练生成对抗网络的输入。
3.根据权利要求2所述的一种基于生成对抗网络的单细胞RNA序列缺失值填补方法其特征在于,所述预处理的方式为基因选择和对数转换。
4.根据权利要求3所述的一种基于生成对抗网络的单细胞RNA序列缺失值填补方法其特征在于,所述步骤二中,生成器的损失函数为:
利用DrImpute对预处理后的矩阵进行填补,将填补结果作为方向约束来建立生成器的损失函数:
Figure FDA0003404863920000011
其中,E是编码器矩阵、D是解码器矩阵,R为中间变量,σ是神经网络中应用于编码器层的Sigmoid激活函数,||·||O表示针对存在的非零计数计算损耗,δ是方向约束权重,用于控制方向约束项对成本函数的贡献,λ是正则化系数,F′是方向约束,||·||F是F范数。
5.根据权利要求4所述的一种基于生成对抗网络的单细胞RNA序列缺失值填补方法其特征在于,所述中间变量R为:
R=MoX (2)
其中,o是Hadamard乘积,M是二进制掩码,X代表预处理后的矩阵。
6.根据权利要求5所述的一种基于生成对抗网络的单细胞RNA序列缺失值填补方法其特征在于,所述步骤二中,判别器的损失函数为:
Figure FDA0003404863920000021
其中,ak是第k个缺失数据的真实值通过判别器输出的标签值,
Figure FDA0003404863920000022
是生成器输出的第k个缺失数据的预测值通过判别器输出的标签值,k=1,2,…,K,K是缺失数据的总个数,W是判别器的参数集。
7.根据权利要求6所述的一种基于生成对抗网络的单细胞RNA序列缺失值填补方法其特征在于,所述自编码器的正则化系数λ的取值在0~12000之间。
8.根据权利要求7所述的一种基于生成对抗网络的单细胞RNA序列缺失值填补方法其特征在于,所述自编码器的隐藏层层数在1500~8000之间。
9.根据权利要求8所述的一种基于生成对抗网络的单细胞RNA序列缺失值填补方法其特征在于,所述生成对抗网络的学习率初始值在10-5~10-3之间。
CN202111509958.XA 2021-12-10 2021-12-10 一种基于生成对抗网络的单细胞rna序列缺失值填补方法 Pending CN114187966A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111509958.XA CN114187966A (zh) 2021-12-10 2021-12-10 一种基于生成对抗网络的单细胞rna序列缺失值填补方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111509958.XA CN114187966A (zh) 2021-12-10 2021-12-10 一种基于生成对抗网络的单细胞rna序列缺失值填补方法

Publications (1)

Publication Number Publication Date
CN114187966A true CN114187966A (zh) 2022-03-15

Family

ID=80543217

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111509958.XA Pending CN114187966A (zh) 2021-12-10 2021-12-10 一种基于生成对抗网络的单细胞rna序列缺失值填补方法

Country Status (1)

Country Link
CN (1) CN114187966A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115101130A (zh) * 2022-06-30 2022-09-23 山东大学 一种基于网络对抗学习的单细胞数据插补方法及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115101130A (zh) * 2022-06-30 2022-09-23 山东大学 一种基于网络对抗学习的单细胞数据插补方法及系统

Similar Documents

Publication Publication Date Title
CN109376242B (zh) 基于循环神经网络变体和卷积神经网络的文本分类方法
CN107766324B (zh) 一种基于深度神经网络的文本一致性分析方法
CN112883738A (zh) 基于神经网络和自注意力机制的医学实体关系抽取方法
CN112906770A (zh) 一种基于跨模态融合的深度聚类方法及系统
CN109740655B (zh) 基于矩阵分解及神经协同过滤的物品评分预测方法
CN112000772B (zh) 面向智能问答基于语义特征立方体的句子对语义匹配方法
CN113596007B (zh) 一种基于深度学习的漏洞攻击检测方法和设备
CN109711483B (zh) 一种基于Sparse Autoencoder的电力系统运行方式聚类方法
Yan et al. Unsupervised and semi‐supervised learning: The next frontier in machine learning for plant systems biology
CN106777402B (zh) 一种基于稀疏神经网络的图像检索文本方法
CN111368920A (zh) 基于量子孪生神经网络的二分类方法及其人脸识别方法
CN109033833B (zh) 一种基于多特征与特征选择的恶意代码分类方法
CN110532372B (zh) 一种基于神经协同过滤挖掘深层特征的文本对象精准推送方法
CN111564183A (zh) 融合基因本体和神经网络的单细胞测序数据降维方法
CN112529638B (zh) 基于用户分类和深度学习的服务需求动态预测方法及系统
CN114091603A (zh) 一种空间转录组细胞聚类、分析方法
CN114496105A (zh) 一种基于多语义网络的单步逆合成方法及系统
CN113255366A (zh) 一种基于异构图神经网络的方面级文本情感分析方法
CN114187966A (zh) 一种基于生成对抗网络的单细胞rna序列缺失值填补方法
CN110569355A (zh) 一种基于词块的观点目标抽取和目标情感分类联合方法及系统
CN110288002B (zh) 一种基于稀疏正交神经网络的图像分类方法
CN116415177A (zh) 一种基于极限学习机的分类器参数辨识方法
CN115083511A (zh) 基于图表示学习与注意力的外围基因调控特征提取方法
CN112529637B (zh) 基于情景感知的服务需求动态预测方法及系统
CN114881172A (zh) 一种基于加权词向量和神经网络的软件漏洞自动分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination