CN113344272A - 一种基于机器学习的circRNA与miRNA、RBP相互作用关系的预测方法 - Google Patents

一种基于机器学习的circRNA与miRNA、RBP相互作用关系的预测方法 Download PDF

Info

Publication number
CN113344272A
CN113344272A CN202110634359.4A CN202110634359A CN113344272A CN 113344272 A CN113344272 A CN 113344272A CN 202110634359 A CN202110634359 A CN 202110634359A CN 113344272 A CN113344272 A CN 113344272A
Authority
CN
China
Prior art keywords
circrna
mirna
circmirna
rbp
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110634359.4A
Other languages
English (en)
Other versions
CN113344272B (zh
Inventor
张桂珊
陈耀文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shantou University
Original Assignee
Shantou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shantou University filed Critical Shantou University
Priority to CN202110634359.4A priority Critical patent/CN113344272B/zh
Publication of CN113344272A publication Critical patent/CN113344272A/zh
Application granted granted Critical
Publication of CN113344272B publication Critical patent/CN113344272B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Economics (AREA)
  • Medical Informatics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Operations Research (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Development Economics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明实施例公开了一种基于机器学习的circRNA与miRNA、RBP相互作用关系的预测方法,包括步骤:(1)构建circMIRNA、circRBP数据集和独立测试集。(2)运用工具提取上述数据集中circRNA的序列衍生特征。(3)首先,将circMIRNA数据集所提取的序列特征输入支持向量机进行训练,得到已训练的circRNA‑miRNA相互作用分类器。其次,将circRBP数据集所提取的序列特征输入支持向量机进行训练,得到已训练的circRNA‑RBP相互作用分类器。最后,将上述结果取并集,得到circRNA与miRNA,RBP的相互作用关系。(4)采用两步法分别判断circRNA‑miRNA相互作用分类器与circRNA‑RBP相互作用分类器的最优特征子集。(5)分别将优化的特征子集输入上述circRNA‑miRNA相互作用分类器与circRNA‑RBP相互作用分类器,重新训练得到优化的circRNA与miRNA,RBP相互作用关系预测模型。

Description

一种基于机器学习的circRNA与miRNA、RBP相互作用关系的预 测方法
技术领域
本发明涉及机器学习方法,具体是一种基于机器学习的circRNA与miRNA、RBP相互作用关系的预测方法。
背景技术
circRNA是一类单链闭合环状的非编码RNA,在特定组织中高度丰富,具有稳定性和跨物种保守性。circRNA具有多种生物学功能,如微RNA海绵,RNA结合蛋白(RBP)海绵,转录调控以及翻译蛋白质等。此外,circRNA在人类众多疾病中发挥着重要的调控作用,是多种疾病发生发展过程的生物标志物。因此,准确地预测circRNA互作机制,对深入了解其在细胞中的功能有积极的意义。
机器学习在识别circRNA方面取得一定的进展。但是,所提取的序列特征之间存在冗余导致泛化能力较差。circRNA功能检测方法如荧光原位杂交技术、PCR扩增技术等存在操作繁琐、费用高等缺点。因此,分析circRNA与miRNA、RBP的相互作用关系,将有助于其功能解析研究进展。然而,目前尚未见报道基于机器学习同时预测circRNA与miRNA、RBP的相互作用关系的方法。
发明内容
本发明实施例所要解决的技术问题在于,提供一种基于机器学习的circRNA与miRNA、RBP相互作用关系的预测方法。可同时预测circRNA与miRNA、RBP的相互作用关系。
为了解决上述技术问题,本发明实施例提供了一种基于机器学习的circRNA与miRNA、RBP相互作用关系的预测方法,包括如下步骤:
S1:构建包含正样本和负样本的circMIRNA数据集,包含正样本和负样本的circRBP数据集,以及独立测试集;
S2:提取所述circMIRNA数据集、circRBP数据集和独立测试集各circRNA序列的衍生特征,包括序列基本特征、图特征、基因组上下文特征和调控信息特征;
S3:将circMIRNA数据集的特征以及对应的标签分别输入SVM模型进行训练与测试,构建circmiRNA模型预测circRNA是否与miRNA发生相互作用;
S4:采用二步法优化特征子集,首先,运用随机森林对circMIRNA数据集特征按重要性进行排序;其次,按重要性顺序逐个加入特征构建特征子集,输入circmiRNA模型进行训练,分析MCC值随特征加入的变化,选取使MCC取得最大值的特征子集作为最优特征子集;
S5:运用上述所得的最优特征子集,重新训练circmiRNA模型及circrbp模型,保存最优的模型参数;
S6:在独立测试集进行预测时,分别提取S4中circMIRNA模型所对应的最优特征子集及circRBP模型对应的最优特征子集,分别输入circMIRNA模型和circRBP模型进行预测,并将结果取并集,得到所分析的circRNA序列是否与miRNA、RBP产生相互作用。
其中,所述步骤S1具体包括步骤:首先,从ENCORI数据库获取能与miRNA产生相互作用的circRNA数据作为正样本,并从该数据库中选取无法与miRNA产生相互作用的circRNA数据作为负样本,构建circMIRNA数据集。其次,从ENCORI数据库获取能与RBP产生相互作用的数据作为正样本,并从该数据库中选取无法与RBP产生相互作用的数据作为负样本,构建circRBP数据集。剔除上述两个数据中重复的样本,并确保上述两个数据集中正样本与负样本量相同。最后,从ENCORI数据库中获取数据,剔除与circMIRNA数据集、circRBP数据集中相同的数据,构建独立测试集。
其中,所述序列基本特征、图特征、基因组上下文特征和调控信息特征的维度分别为71,101,7和3。
实施本发明实施例,具有如下有益效果:本发明利用不同工具提取circRNA的序列衍生特征,基于SVM构建circRNA与miRNA、RBP相互作用预测方法,该方法是首个较为全面的circRNA互作关系的机器学习预测模型,能同时预测circRNA-miRNA、circRNA-RBP的相互作用关系,有助于circRNA功能解析研究。
附图说明
图1是本申请中基于机器学习的circRNA与miRNA、RBP相互作用关系预测方法流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。
本申请公开了一种基于机器学习的circRNA与miRNA、RBP相互作用关系预测方法,能准确地预估circRNA能否与miRNA、RBP产生相互作用。主要流程参考图1,具体实施步骤如下:
(1)构建包含正样本和负样本的circMIRNA数据集,包含正样本和负样本的circRBP数据集,以及独立测试集。首先,从ENCORI数据库获取能与miRNA产生相互作用的circRNA数据作为正样本,并从该数据库中选取无法与miRNA产生相互作用的circRNA数据作为负样本,构建circMIRNA数据集。其次,从ENCORI数据库获取能与RBP产生相互作用的数据作为正样本,并从该数据库中选取无法与RBP产生相互作用的数据作为负样本,构建circRBP数据集。剔除上述两个数据中重复的样本,并确保上述两个数据集中正样本与负样本量相同。最后,从ENCORI数据库中获取数据,剔除与circMIRNA数据集、circRBP数据集相同的数据,构建独立测试集。根据circRNA的染色体号、序列起止位点、正负链标记等相关信息,映射到人类基因组上,得到circRNA的序列信息。
(2)分别运用多种工具,提取circMIRNA数据集、circRBP数据集和独立测试集各circRNA序列的衍生特征,包括序列基本特征、图特征、基因组上下文特征和调控信息特征,各类特征维度分别为71,101,7和3。序列基本特征包括64种三核苷酸和其他序列组成特征,包括序列长度、GC含量、AG、GT、AGGT、GTAG的频率和重复序列特征。图特征通过利用GraphProt 1.0.1工具提取 RNA 序列 32768 维的图特征。为了去除冗余特征,运用随机森林将所提取的图特征按重要性排序,选取前101个特征。基因组上下文特征中每个转录本保守分数是从加州大学洛杉矶分校数据库下载 Placent_phylop46文件获取的。根据转录本每个碱基的phyloP保守分数计算保守分数的平均值和标准差。从UCSC下载带有注释的ALU重复位点,计算每个转录本的ALU重复数。此外,在该网站上下载txCdsPredict分析提取开放阅读框长度特征。串联重复序列特征由Tandem Repeat Finder工具获取。SNP数据及转录本的SNP密度来源于国际千人基因组计划。A-to-I 注释数据来源于从RADAR数据库,而A-to-I 密度定义为 A-to-I 数量占整个转录本的序列长度的比例。调控信息包括转录因子、甲基化和 H3K27ac 序列衍生特征主要来源于TRCirc数据库,根据circRNA的位置信息,可以获取其对应的调控信息。
(3)将circMIRNA数据集的特征以及对应的标签分别输入SVM模型进行训练与测试,构建circmiRNA模型预测circRNA是否与miRNA发生相互作用。针对circRBP数据集,采用同样的方法,构建circrbp模型,预测circRNA是否与RBP发生相互作用。circmiRNA及circrbp模型的超参数由具体数据集训练得到,通过网格搜索方法调整的参数包括惩罚因子
Figure 429653DEST_PATH_IMAGE002
和核参数
Figure 346794DEST_PATH_IMAGE004
(4)采用二步法优化特征子集,首先,运用随机森林对circMIRNA数据集特征按重要性进行排序,分数较高的特征预测能力更强;其次,按重要性顺序逐个加入特征构建特征子集,输入circmiRNA模型进行训练,分析MCC值随特征加入的变化,选取使MCC取得最大值的特征子集作为最优特征子集。类似的,采用同样的方法构建circrbp模型的最优特征子集。
(5)运用上述所得的最优特征子集,重新训练circmiRNA模型及circrbp模型,通过计算敏感度、特异度、精确度、F1分数、ACC和MCC评估其预测性能,保存最优的模型参数。
(6)在独立测试集进行预测时,分别提取步骤4中circMIRNA模型所对应的最优特征子集及circRBP模型对应的最优特征子集,分别输入circMIRNA模型和circRBP模型进行预测,并将结果取并集,得到所分析的circRNA序列是否与miRNA、RBP产生相互作用。
本发明针对现阶段运用生化实验检测circRNA功能费时费力且准确率较低,而且尚未有工具能够全面地预测人类circRNA与miRNA、RBP的相互作用关系的问题,提出一种基于机器学习的circRNA与miRNA、RBP相互作用关系预测方法,旨在提高预测准确率,为进一步深入了解circRNA的功能提供了帮助,进而加速研究者理解circRNA在疾病相关的生物过程中的应用。
以上所揭露的仅为本发明一种较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (3)

1.一种基于机器学习的circRNA与miRNA、RBP相互作用关系的预测方法,其特征在于,包括如下步骤:
S1:构建包含正样本和负样本的circMIRNA数据集,包含正样本和负样本的circRBP数据集,以及独立测试集;
S2:提取所述circMIRNA数据集、circRBP数据集和独立测试集各circRNA序列的衍生特征,包括序列基本特征、图特征、基因组上下文特征和调控信息特征;
S3:将circMIRNA数据集的特征以及对应的标签分别输入SVM模型进行训练与测试,构建circmiRNA模型预测circRNA是否与miRNA发生相互作用;
S4:采用二步法优化特征子集,首先,运用随机森林对circMIRNA数据集特征按重要性进行排序;其次,按重要性顺序逐个加入特征构建特征子集,输入circmiRNA模型进行训练,分析MCC值随特征加入的变化,选取使MCC取得最大值的特征子集作为最优特征子集;
S5:运用上述所得的最优特征子集,重新训练circmiRNA模型及circrbp模型,保存最优的模型参数;
S6:在独立测试集进行预测时,分别提取S4中circMIRNA模型所对应的最优特征子集及circRBP模型对应的最优特征子集,分别输入circMIRNA模型和circRBP模型进行预测,并将结果取并集,得到所分析的circRNA序列是否与miRNA、RBP产生相互作用。
2.根据权利要求1所述的基于机器学习的circRNA与miRNA、RBP相互作用关系的预测方法,其特征在于,所述步骤S1具体包括步骤:首先,从ENCORI数据库获取能与miRNA产生相互作用的circRNA数据作为正样本,并从该数据库中选取无法与miRNA产生相互作用的circRNA数据作为负样本,构建circMIRNA数据集。其次,从ENCORI数据库获取能与RBP产生相互作用的数据作为正样本,并从该数据库中选取无法与RBP产生相互作用的数据作为负样本,构建circRBP数据集。剔除上述两个数据中重复的样本,并确保上述两个数据集中正样本与负样本量相同。最后,从ENCORI数据库中获取数据,剔除与circMIRNA数据集、circRBP数据集中相同的数据,构建独立测试集。
3.根据权利要求1所述的基于机器学习的circRNA与miRNA、RBP相互作用关系的预测方法,其特征在于,所述序列基本特征、图特征、基因组上下文特征和调控信息特征的维度分别为71,101,7和3。
CN202110634359.4A 2021-06-08 2021-06-08 一种基于机器学习的circRNA与miRNA、RBP相互作用关系的预测方法 Active CN113344272B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110634359.4A CN113344272B (zh) 2021-06-08 2021-06-08 一种基于机器学习的circRNA与miRNA、RBP相互作用关系的预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110634359.4A CN113344272B (zh) 2021-06-08 2021-06-08 一种基于机器学习的circRNA与miRNA、RBP相互作用关系的预测方法

Publications (2)

Publication Number Publication Date
CN113344272A true CN113344272A (zh) 2021-09-03
CN113344272B CN113344272B (zh) 2022-06-21

Family

ID=77475242

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110634359.4A Active CN113344272B (zh) 2021-06-08 2021-06-08 一种基于机器学习的circRNA与miRNA、RBP相互作用关系的预测方法

Country Status (1)

Country Link
CN (1) CN113344272B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114169106A (zh) * 2021-12-13 2022-03-11 汕头大学 基于改进随机森林模型的评估旋喷桩引起侧向位移的方法
CN116070157A (zh) * 2023-01-13 2023-05-05 东北林业大学 基于级联森林和双流结构的circRNA识别方法
CN116110493A (zh) * 2023-03-20 2023-05-12 电子科技大学长三角研究院(衢州) 用于g-四链体预测模型的数据集构建方法及其预测方法
CN116798513A (zh) * 2023-02-21 2023-09-22 苏州赛赋新药技术服务有限责任公司 筛选siRNA序列以降低脱靶效应的方法及系统
CN116959561A (zh) * 2023-09-21 2023-10-27 北京科技大学 一种基于神经网络模型的基因相互作用预测方法和装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109859798A (zh) * 2019-01-21 2019-06-07 桂林电子科技大学 一种细菌中sRNA与其靶标mRNA相互作用的预测方法
WO2019236673A1 (en) * 2018-06-06 2019-12-12 Massachusetts Institute Of Technology Circular rna for translation in eukaryotic cells
US20200118648A1 (en) * 2018-10-11 2020-04-16 Chun-Chieh Chang Systems and methods for using machine learning and dna sequencing to extract latent information for dna, rna and protein sequences
US20200239939A1 (en) * 2019-01-24 2020-07-30 The Translational Genomics Research Institute Bioinformatics methods of in silico validation and selection of circrnas
CN112420127A (zh) * 2020-10-26 2021-02-26 大连民族大学 基于二级结构和多模型融合的非编码rna与蛋白质相互作用预测方法
CN112530520A (zh) * 2019-09-17 2021-03-19 中山大学 一种基于评分机制与LightGBM的CircRNA功能预测方法
US20210151121A1 (en) * 2019-11-18 2021-05-20 Tata Consultancy Services Limited Method and system for predicting protein-protein interaction between host and pathogen

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019236673A1 (en) * 2018-06-06 2019-12-12 Massachusetts Institute Of Technology Circular rna for translation in eukaryotic cells
US20200118648A1 (en) * 2018-10-11 2020-04-16 Chun-Chieh Chang Systems and methods for using machine learning and dna sequencing to extract latent information for dna, rna and protein sequences
CN109859798A (zh) * 2019-01-21 2019-06-07 桂林电子科技大学 一种细菌中sRNA与其靶标mRNA相互作用的预测方法
US20200239939A1 (en) * 2019-01-24 2020-07-30 The Translational Genomics Research Institute Bioinformatics methods of in silico validation and selection of circrnas
CN112530520A (zh) * 2019-09-17 2021-03-19 中山大学 一种基于评分机制与LightGBM的CircRNA功能预测方法
US20210151121A1 (en) * 2019-11-18 2021-05-20 Tata Consultancy Services Limited Method and system for predicting protein-protein interaction between host and pathogen
CN112420127A (zh) * 2020-10-26 2021-02-26 大连民族大学 基于二级结构和多模型融合的非编码rna与蛋白质相互作用预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
孟炜等: "应用支持向量机预测蛋白质相互作用位点", 《应用科学报》 *
朱玉萍: "基于极限学习机的蛋白质相互作用预测", 《枣庄学院学报》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114169106A (zh) * 2021-12-13 2022-03-11 汕头大学 基于改进随机森林模型的评估旋喷桩引起侧向位移的方法
CN116070157A (zh) * 2023-01-13 2023-05-05 东北林业大学 基于级联森林和双流结构的circRNA识别方法
CN116070157B (zh) * 2023-01-13 2024-04-16 东北林业大学 基于级联森林和双流结构的circRNA识别方法
CN116798513A (zh) * 2023-02-21 2023-09-22 苏州赛赋新药技术服务有限责任公司 筛选siRNA序列以降低脱靶效应的方法及系统
CN116798513B (zh) * 2023-02-21 2023-12-15 苏州赛赋新药技术服务有限责任公司 筛选siRNA序列以降低脱靶效应的方法及系统
CN116110493A (zh) * 2023-03-20 2023-05-12 电子科技大学长三角研究院(衢州) 用于g-四链体预测模型的数据集构建方法及其预测方法
CN116110493B (zh) * 2023-03-20 2023-06-20 电子科技大学长三角研究院(衢州) 用于g-四链体预测模型的数据集构建方法及其预测方法
CN116959561A (zh) * 2023-09-21 2023-10-27 北京科技大学 一种基于神经网络模型的基因相互作用预测方法和装置
CN116959561B (zh) * 2023-09-21 2023-12-19 北京科技大学 一种基于神经网络模型的基因相互作用预测方法和装置

Also Published As

Publication number Publication date
CN113344272B (zh) 2022-06-21

Similar Documents

Publication Publication Date Title
CN113344272B (zh) 一种基于机器学习的circRNA与miRNA、RBP相互作用关系的预测方法
Gusmao et al. Analysis of computational footprinting methods for DNase sequencing experiments
Sinha et al. A probabilistic method to detect regulatory modules
CN113344076B (zh) 一种基于集成学习的circRNA-miRNA相互作用关系预测方法
CN107103205A (zh) 一种基于蛋白质质谱数据注释真核生物基因组的生物信息学方法
CN108427865B (zh) 一种预测LncRNA和环境因素关联关系的方法
US20190139628A1 (en) Machine learning techniques for analysis of structural variants
CN113593634A (zh) 一种融合dna形状特征的转录因子结合位点预测方法
US20210398605A1 (en) System and method for promoter prediction in human genome
Wang et al. A brief review of machine learning methods for RNA methylation sites prediction
Meng et al. lncRNA-LSTM: prediction of plant long non-coding RNAs using long short-term memory based on p-nts encoding
CN108182348A (zh) 基于种子序列信息的dna甲基化数据检测方法及其装置
Grinev et al. ORFhunteR: An accurate approach to the automatic identification and annotation of open reading frames in human mRNA molecules
CN111048145A (zh) 蛋白质预测模型的生成方法、装置、设备和存储介质
CN114627964B (zh) 一种基于多核学习预测增强子及其强度分类方法及分类设备
CN111261228B (zh) 计算保守核酸序列的方法及系统
CN115066503A (zh) 使用批量测序数据指导单细胞测序数据的分析
CN113140255B (zh) 一种预测植物lncRNA-miRNA相互作用的方法
CN112041933A (zh) 使用局部独特特征来解释rna测序数据的转录本表达水平的系统和方法
CN117095748B (zh) 一种构建植物miRNA遗传调控通路的方法
CN116612816B (zh) 一种全基因组核小体密度预测方法、系统及电子设备
CN114512188B (zh) 基于改进蛋白质序列位置特异性矩阵的dna结合蛋白识别方法
Grinev et al. ORFhunteR: an accurate approach for the automatic identification and annotation of open reading frames in human mRNA molecules
Kim et al. MicroRNA Data Analysis
Clouard A computational and statistical framework for cost-effective genotyping combining pooling and imputation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant