CN113611363A - 一种利用共识性预测结果识别癌症驱动基因的方法 - Google Patents
一种利用共识性预测结果识别癌症驱动基因的方法 Download PDFInfo
- Publication number
- CN113611363A CN113611363A CN202110910593.5A CN202110910593A CN113611363A CN 113611363 A CN113611363 A CN 113611363A CN 202110910593 A CN202110910593 A CN 202110910593A CN 113611363 A CN113611363 A CN 113611363A
- Authority
- CN
- China
- Prior art keywords
- gene
- driver
- predicted
- genes
- cancer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 97
- 238000000034 method Methods 0.000 title claims abstract description 33
- 206010028980 Neoplasm Diseases 0.000 title claims abstract description 31
- 201000011510 cancer Diseases 0.000 title claims abstract description 31
- 230000035772 mutation Effects 0.000 claims abstract description 15
- 230000010354 integration Effects 0.000 claims abstract description 9
- 238000012800 visualization Methods 0.000 claims abstract description 9
- 238000004458 analytical method Methods 0.000 claims abstract description 7
- 230000037361 pathway Effects 0.000 claims abstract description 4
- 238000012545 processing Methods 0.000 claims abstract description 4
- 238000010586 diagram Methods 0.000 claims description 8
- 108700019961 Neoplasm Genes Proteins 0.000 claims description 6
- 102000048850 Neoplasm Genes Human genes 0.000 claims description 6
- 230000001186 cumulative effect Effects 0.000 claims description 6
- 230000037437 driver mutation Effects 0.000 claims description 4
- 208000005623 Carcinogenesis Diseases 0.000 claims description 3
- 230000036952 cancer formation Effects 0.000 claims description 3
- 231100000504 carcinogenesis Toxicity 0.000 claims description 3
- DVMAUGGKVWJBDV-IREHDKGXSA-N estra-1,3,5(10)-triene-3,16beta-diol Chemical compound C1CC2=CC(O)=CC=C2[C@@H]2[C@@H]1[C@@H]1C[C@H](O)C[C@@]1(C)CC2 DVMAUGGKVWJBDV-IREHDKGXSA-N 0.000 claims description 3
- 238000007619 statistical method Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000007481 next generation sequencing Methods 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000013179 statistical model Methods 0.000 description 2
- 108700020796 Oncogene Proteins 0.000 description 1
- 102000043276 Oncogene Human genes 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000009668 clonal growth Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 101150012509 sub gene Proteins 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000005748 tumor development Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/50—Mutagenesis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B45/00—ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Biophysics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Bioethics (AREA)
- Chemical & Material Sciences (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Evolutionary Computation (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种利用共识性预测结果识别癌症驱动基因的方法,包括以下步骤:S1、接受突变注释格式(MAF)文件作为输入;S2、处理所有预处理的输入突变数据,以分别获得每种策略的候选驱动基因列表;S3、基于每个差异驱动基因列表,使用秩集成方法RobustRankAggreg来获得共有驱动基因列表;S4、使用Top‑N‑Precision和Top‑N‑nDCG评估结果性能,对共有驱动基因进行了KEGG途径和基因本体分析;S5、利用RAA算法获得共识驱动基因列表;S6、应用SuperExactTest和Circos来组织可视化结果。该方法在驱动基因预测中具有一定的优越性,尽管不同的驱动基因识别策略之间存在高度差异,但是通过各个单独策略进行结果的交叉分析不仅可以识别最可靠的驱动基因,而且还有助于发现潜在的,特征不明确的新型驱动基因。
Description
技术领域
本发明涉及癌症驱动基因识别技术领域,具体为一种利用共识性预测结果识别癌症驱动基因的方法。
背景技术
下一代测序技术已鉴定出人类癌细胞中数百万个体细胞突变,然而,解释癌症基因组的主要挑战之一是如何有效地将驱动突变与客体突变区分开,在体内特定的微环境条件下,驱动突变与癌基因有因果关系,并沿着癌症发展沿袭而被积极选择,而客体突变不会赋予克隆生长优势,因此与肿瘤的发展无关,为了解决这个问题,已经提出了多种基于独特的假设和策略来鉴定驱动基因的方法。
据报道,已有几项研究使用源自个体模型的共识性癌症驱动基因对这些方法进行了基准测试,Collin等提出了一个评估框架,以基于包括精度,一致性和平均对数倍数变化(MLFC)在内的几种测量基准来对几种现有模型进行基准测试,Matan等也通过使用诸如精确度和召回率之类的衡量标准对可用方法进行了基准测试,Edward等以亚基因分辨率将驱动基因调用方法分为四种亚型,Denis等人提供了21种驱动基因预测方法的最全面基准,并提出了一种基于Borda的整合方法ConsensusDriver,但在现有的鉴定驱动基因的方法中集成结果的可靠性还有待提高,故而提出一种利用共识性预测结果识别癌症驱动基因的方法以解决上述问题。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种利用共识性预测结果识别癌症驱动基因的方法,该方法设计了一个基于Web服务器的共识癌症驱动基因调用程序平台,以得出共识突变调用结果,使用六个最新技术和互补的预测策略,并提供了一种有效的集成策略,以通过“稳健秩次汇总”(RRA)和基于统计模型的交叉点可视化来得出共识结果,并通过Circos图可视化共有突变调用结果。
(二)技术方案
为实现上述可靠性高的目的,本发明提供如下技术方案:一种利用共识性预测结果识别癌症驱动基因的方法,包括以下步骤:一种利用共识性预测结果识别癌症驱动基因的方法,包括以下步骤:
S1、接受突变注释格式(MAF)文件作为输入;
S2、处理所有预处理的输入突变数据,以分别获得每种策略的候选驱动基因列表;
S3、基于每个差异驱动基因列表,使用秩集成方法RobustRankAggreg来获得共有驱动基因列表;
S4、使用Top-N-Precision和Top-N-nDCG评估结果性能,最后,还对共有驱动基因进行了KEGG途径和基因本体分析,以进行全面注释;
S5、利用RAA算法获得共识驱动基因列表,该列表汇总了各个工具预测的排名驱动基因;
S6、应用SuperExactTest和Circos来组织可视化结果。
优选的,所述MAF文件是从变量调用格式(VCF)文件进行批注的,可以通过使用变量调用工具(如Mutect)在NGS数据上获取该文件。
优选的,在步骤S2中,使用SuperExactTest模型来评估使用所有蛋白质编码基因作为整个背景基因集的单个调用结果的交集的统计显着性。
优选的,在步骤S3中使用了四个数据库,其分别为:
A、癌症基因普查(CGC);
B、整合癌基因组学(IntOGen);
C、癌症基因网络(NCG);
D、在线人类孟德尔遗传(OMIM)用于注释所预测的驱动基因。
优选的,所述Top-N-Precision是基于CGC癌症数据库的前100个基因,根据方程式(1)评估了先前策略获得的结果中的精确性,方程式(1)如下:
同时,SUM(精确度)代表27种癌症类型各自的精确度得分之和,见方程式(2):
此外,使用IntOGen作为驱动基因参考数据集,利用归一化折现累积收益(nDCG)这一参数来衡量排序结果的质量,其次,获得Top-N-nDCG的结果通过以下步骤:
1)首先下载IntOGen癌症驱动基因数据集;
2)利用公式(3)根据参考基因的比例和驱动突变的数量为其分配权重;
3)根据公式(4)得到与基准IntOGen数据集重叠的预测驱动基因的权重;
4)在基准IntOGen数据集上不存在的预测基因的权重设置为0,可以通过等式(4)、(5)、(6)和(7)来计算Top-N-nDCG;
公式(3)、(4)、(5)、(6)和(7)如下:
CGn=SUM(前n个预测基因权重) (5)
IDCGn=DCGn(IntOcen中排序) (7)
其中,n表示前n个排名最高的预测基因,i表示预测基因的排名,CGn表示前n个预测基因的累积权重,DCGn表示CGn与折扣因子1/log2i(i>1)的乘积,IDCGn表示理想条件下的DCGn,即预测排名与参考数据集排名一致,Top-N-nDCG代表标准化的DCGn,并测量预测基因的排名表现。
优选的,所述SuperExactTest是可扩展的可视化工具,用于说明Venn图之外的多组之间的高阶关系,它评估了每种工具的重叠部分,并给出了一个圆形图,说明了使用,统计方法的所有可能的交点,所述Circos直观地可视化了预测的驱动基因组。
(三)有益效果
与现有技术相比,本发明提供了一种利用共识性预测结果识别癌症驱动基因的方法,具备以下有益效果:
该利用共识性预测结果识别癌症驱动基因的方法,通过比较每个替代方案的共识结果的性能,本应用程序的集成结果优于其他使用Top-n-Precision和Top-n-nDCG评估的方法,显示了其在驱动基因预测中的优越性,尽管不同的驱动基因识别策略之间存在高度差异,但是通过各个单独策略进行结果的交叉分析不仅可以识别最可靠的驱动基因,而且还有助于发现潜在的,特征不明确的新型驱动基因。
附图说明
图1为本发明提出的一种利用共识性预测结果识别癌症驱动基因的方法示意图。
具体实施方式
下面将结合本发明的实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明设计了一个基于Web服务器的共识癌症驱动基因调用程序平台,以得出共识突变调用结果,使用六个最新技术和互补的预测策略,并提供了一种有效的集成策略,以通过“稳健秩次汇总”(RRA)和基于统计模型的交叉点可视化来得出共识结果,并通过Circos图可视化共有突变调用结果。
具体的,该利用共识性预测结果识别癌症驱动基因的方法示意图如图1所示,包括以下步骤:
S1、接受突变注释格式(MAF)文件作为输入;
S2、处理所有预处理的输入突变数据,以分别获得每种策略的候选驱动基因列表;
S3、基于每个差异驱动基因列表,使用秩集成方法RobustRankAggreg来获得共有驱动基因列表;
S4、使用Top-N-Precision和Top-N-nDCG评估结果性能,最后,还对共有驱动基因进行了KEGG途径和基因本体分析,以进行全面注释;
S5、利用RAA算法获得共识驱动基因列表,该列表汇总了各个工具预测的排名驱动基因;
S6、应用SuperExactTest和Circos来组织可视化结果。
其中,所述MAF文件是从变量调用格式(VCF)文件进行批注的,可以通过使用变量调用工具(如Mutect)在NGS数据上获取该文件。
此外,本发明使用SuperExactTest模型来评估使用所有蛋白质编码基因作为整个背景基因集的单个调用结果的交集的统计显着性。
另外,使用了四个数据库,其分别为:
A、癌症基因普查(CGC);
B、整合癌基因组学(IntOGen);
C、癌症基因网络(NCG);
D、在线人类孟德尔遗传(OMIM)用于注释所预测的驱动基因。
在步骤S4中,所述Top-N-Precision是基于CGC癌症数据库的前100个基因,根据方程式(1)评估了先前策略获得的结果中的精确性,方程式(1)如下:
同时,SUM(精确度)代表27种癌症类型各自的精确度得分之和,见方程式(2):
平均精度可以衡量泛癌队列样本中各个方法的一般预测能力,我们计算27种癌症类型中每种类型的精确度得分。
此外,使用IntOGen作为驱动基因参考数据集,利用归一化折现累积收益(nDCG)这一参数来衡量排序结果的质量,其次,获得Top-N-nDCG的结果通过以下步骤:
1)首先下载IntOGen癌症驱动基因数据集(URL:https://www.intogen.org/);
2)利用公式(3)根据参考基因的比例和驱动突变的数量为其分配权重,该数据集中基因总数为459;
3)根据公式(4)得到与基准IntOGen数据集重叠的预测驱动基因的权重;
4)在基准IntOGen数据集上不存在的预测基因的权重设置为0,可以通过等式(4)、(5)、(6)和(7)来计算Top-N-nDCG;
公式(3)、(4)、(5)、(6)和(7)如下:
CGn=SUM(前n个预测基因权重) (5)
IDCGn=DCGn(IntOGen中排序) (7)
其中,n表示前n个排名最高的预测基因,i表示预测基因的排名,CGn表示前n个预测基因的累积权重,DCGn表示CGn与折扣因子1/log2i(i>1)的乘积,IDCGn表示理想条件下的DCGn,即预测排名与参考数据集排名一致,Top-N-nDCG代表标准化的DCGn,并测量预测基因的排名表现。
在步骤S5中,与原始的RankAggreg算法相比,RRA算法具有三个优点:
(1)处理不完整的排名,这在实践中很常见;
(2)数据噪声的耐受性;
(3)可以快速集成以进行交互式数据分析。
在步骤S6中,前者是可扩展的可视化工具,用于说明Venn图之外的多组之间的高阶关系,它评估了每种工具的重叠部分,并给出了一个圆形图,说明了使用,统计方法的所有可能的交点,后者直观地可视化了预测的驱动基因组。
本发明的有益效果是:比较了每个替代方案的共识结果的性能,本应用程序的集成结果优于其他使用Top-n-Preci s ion和Top-n-nDCG评估的方法,显示了其在驱动基因预测中的优越性,尽管不同的驱动基因识别策略之间存在高度差异,但是通过各个单独策略进行结果的交叉分析不仅可以识别最可靠的驱动基因,而且还有助于发现潜在的,特征不明确的新型驱动基因。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (6)
1.一种利用共识性预测结果识别癌症驱动基因的方法,其特征在于,包括以下步骤:
S1、接受突变注释格式(MAF)文件作为输入;
S2、处理所有预处理的输入突变数据,以分别获得每种策略的候选驱动基因列表;
S3、基于每个差异驱动基因列表,使用秩集成方法RobustRankAggreg来获得共有驱动基因列表;
S4、使用Top-N-Precision和Top-N-nDCG评估结果性能,最后,还对共有驱动基因进行了KEGG途径和基因本体分析,以进行全面注释;
S5、利用RAA算法获得共识驱动基因列表,该列表汇总了各个工具预测的排名驱动基因;
S6、应用SuperExactTest和Circos来组织可视化结果。
2.根据权利要求1所述的一种利用共识性预测结果识别癌症驱动基因的方法,其特征在于,所述MAF文件是从变量调用格式(VCF)文件进行批注的,可以通过使用变量调用工具(如Mutect)在NGS数据上获取该文件。
3.根据权利要求1所述的一种利用共识性预测结果识别癌症驱动基因的方法,其特征在于,在步骤S2中,使用SuperExactTest模型来评估使用所有蛋白质编码基因作为整个背景基因集的单个调用结果的交集的统计显着性。
4.根据权利要求1所述的一种利用共识性预测结果识别癌症驱动基因的方法,其特征在于,在步骤S3中使用了四个数据库,其分别为:
A、癌症基因普查(CGC);
B、整合癌基因组学(IntOGen);
C、癌症基因网络(NCG);
D、在线人类孟德尔遗传(OMIM)用于注释所预测的驱动基因。
5.根据权利要求4所述的一种利用共识性预测结果识别癌症驱动基因的方法,其特征在于,所述Top-N-Precision是基于CGC癌症数据库的前100个基因,根据方程式(1)评估了先前策略获得的结果中的精确性,方程式(1)如下:
同时,SUM(精确度)代表27种癌症类型各自的精确度得分之和,见方程式(2):
此外,使用IntOGen作为驱动基因参考数据集,利用归一化折现累积收益(nDCG)这一参数来衡量排序结果的质量,其次,获得Top-N-nDCG的结果通过以下步骤:
1)首先下载IntOGen癌症驱动基因数据集;
2)利用公式(3)根据参考基因的比例和驱动突变的数量为其分配权重;
3)根据公式(4)得到与基准IntOGen数据集重叠的预测驱动基因的权重;
4)在基准IntOGen数据集上不存在的预测基因的权重设置为0,可以通过等式(4)、(5)、(6)和(7)来计算Top-N-nDCG;
公式(3)、(4)、(5)、(6)和(7)如下:
CGn=SUM(前n个预测基因权重) (5)
IDCGn=DCGn(IntOGen中排序) (7)
其中,n表示前n个排名最高的预测基因,i表示预测基因的排名,CGn表示前n个预测基因的累积权重,DCGn表示CGn与折扣因子1/log2i(i>1)的乘积,IDCGn表示理想条件下的DCGn,即预测排名与参考数据集排名一致,Top-N-nDCG代表标准化的DCGn,并测量预测基因的排名表现。
6.根据权利要求5所述的一种利用共识性预测结果识别癌症驱动基因的方法,其特征在于,所述SuperExactTest是可扩展的可视化工具,用于说明Venn图之外的多组之间的高阶关系,它评估了每种工具的重叠部分,并给出了一个圆形图,说明了使用,统计方法的所有可能的交点,所述Circos直观地可视化了预测的驱动基因组。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110910593.5A CN113611363B (zh) | 2021-08-09 | 2021-08-09 | 一种利用共识性预测结果识别癌症驱动基因的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110910593.5A CN113611363B (zh) | 2021-08-09 | 2021-08-09 | 一种利用共识性预测结果识别癌症驱动基因的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113611363A true CN113611363A (zh) | 2021-11-05 |
CN113611363B CN113611363B (zh) | 2023-11-28 |
Family
ID=78307803
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110910593.5A Active CN113611363B (zh) | 2021-08-09 | 2021-08-09 | 一种利用共识性预测结果识别癌症驱动基因的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113611363B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115019891A (zh) * | 2022-06-08 | 2022-09-06 | 郑州大学 | 一种基于半监督图神经网络的个体驱动基因预测方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110021364A (zh) * | 2017-11-24 | 2019-07-16 | 上海暖闻信息科技有限公司 | 基于病人临床症状数据和全外显子组测序数据筛选单基因遗传病致病基因的分析检测系统 |
US20200185059A1 (en) * | 2018-12-10 | 2020-06-11 | Grail, Inc. | Systems and methods for classifying patients with respect to multiple cancer classes |
CN112634982A (zh) * | 2020-11-23 | 2021-04-09 | 上海欧易生物医学科技有限公司 | 一种筛选与研究目的相关的关键基因、关键蛋白集的方法 |
CN112908470A (zh) * | 2021-02-08 | 2021-06-04 | 深圳市人民医院 | 一种基于rna结合蛋白基因的肝细胞癌预后评分系统及其应用 |
CN113160879A (zh) * | 2021-04-25 | 2021-07-23 | 上海基绪康生物科技有限公司 | 一种基于网络学习的通过副作用预测药物重定位方法 |
-
2021
- 2021-08-09 CN CN202110910593.5A patent/CN113611363B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110021364A (zh) * | 2017-11-24 | 2019-07-16 | 上海暖闻信息科技有限公司 | 基于病人临床症状数据和全外显子组测序数据筛选单基因遗传病致病基因的分析检测系统 |
US20200185059A1 (en) * | 2018-12-10 | 2020-06-11 | Grail, Inc. | Systems and methods for classifying patients with respect to multiple cancer classes |
CN112634982A (zh) * | 2020-11-23 | 2021-04-09 | 上海欧易生物医学科技有限公司 | 一种筛选与研究目的相关的关键基因、关键蛋白集的方法 |
CN112908470A (zh) * | 2021-02-08 | 2021-06-04 | 深圳市人民医院 | 一种基于rna结合蛋白基因的肝细胞癌预后评分系统及其应用 |
CN113160879A (zh) * | 2021-04-25 | 2021-07-23 | 上海基绪康生物科技有限公司 | 一种基于网络学习的通过副作用预测药物重定位方法 |
Non-Patent Citations (2)
Title |
---|
TIAN, ZJ等: "Identification and validation of an immune-related gene-based prognostic index for bladder cancer", 《AMERICAN JOURNAL OF TRANSLATIONAL RESEARCH》, vol. 12, no. 9, pages 5188 - 5204 * |
曲凯 等: "基于RRA方法的胆道系统肿瘤热点突变基因分析", 《西安交通大学学报(医学版)》》, vol. 40, no. 2, pages 243 - 248 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115019891A (zh) * | 2022-06-08 | 2022-09-06 | 郑州大学 | 一种基于半监督图神经网络的个体驱动基因预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113611363B (zh) | 2023-11-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Batselier et al. | Evaluation of deterministic state-of-the-art forecasting approaches for project duration based on earned value management | |
Bosu et al. | Impact of developer reputation on code review outcomes in oss projects: An empirical investigation | |
Blackburne et al. | Measuring the distance between multiple sequence alignments | |
Cron et al. | Hierarchical modeling for rare event detection and cell subset alignment across flow cytometry samples | |
CN110196814B (zh) | 一种软件质量评价方法 | |
Emrouznejad et al. | An overall profit Malmquist productivity index with fuzzy and interval data | |
CN105279397A (zh) | 一种识别蛋白质相互作用网络中关键蛋白质的方法 | |
RU2733485C1 (ru) | Система и способ обработки данных для комплексной оценки зрелости научно-технологического проекта на основе использования набора параметров | |
Garas et al. | Network analysis of surgical innovation: measuring value and the virality of diffusion in robotic surgery | |
CN113611363A (zh) | 一种利用共识性预测结果识别癌症驱动基因的方法 | |
CN116825192A (zh) | 一种ncRNA基因突变的解读方法、存储介质及终端 | |
Guo et al. | Detecting m6A methylation regions from methylated RNA immunoprecipitation sequencing | |
CN115345530A (zh) | 商场地址推荐方法、装置、设备及计算机可读存储介质 | |
CN113435713B (zh) | 基于gis技术和两模型融合的风险地图编制方法及系统 | |
CN109657122B (zh) | 一种基于学术大数据的学术团队重要成员识别方法 | |
Wang et al. | ActivePPI: quantifying protein–protein interaction network activity with Markov random fields | |
CN114254928A (zh) | 一种工业互联网平台发展指数监测方法及系统 | |
CN111739584A (zh) | 一种用于pgt-m检测的基因分型评估模型的构建方法及装置 | |
CN113204482B (zh) | 基于语义属性子集划分与度量匹配的异质缺陷预测方法及系统 | |
Zanfardino et al. | DeClUt: Decluttering differentially expressed genes through clustering of their expression profiles | |
Al Fajri et al. | EXAMINE THE ROLE OF MOTIVATION IN UTAUT MODEL ON THE USE OF CLOUD COMPUTING BY SMEs DURING COVID-19 PANDEMIC | |
CN117766024B (zh) | 一种卵巢癌cd8+ t细胞相关预后评估方法、系统及其应用 | |
Liu et al. | ScAtt: an Attention based architecture to analyze Alzheimer's disease at cell type level from single-cell RNA-sequencing data | |
CN113450872B (zh) | 磷酸化位点特异激酶的预测方法 | |
RU2798897C1 (ru) | Метод поиска терапевтически значимых молекулярных мишеней для заболеваний путем применения методов машинного обучения к комбинированным данным, включающим графы сигнальных путей, омиксные и текстовые типы данных |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |