CN109215740A - 基于Xgboost的全基因组RNA二级结构预测方法 - Google Patents
基于Xgboost的全基因组RNA二级结构预测方法 Download PDFInfo
- Publication number
- CN109215740A CN109215740A CN201811314747.9A CN201811314747A CN109215740A CN 109215740 A CN109215740 A CN 109215740A CN 201811314747 A CN201811314747 A CN 201811314747A CN 109215740 A CN109215740 A CN 109215740A
- Authority
- CN
- China
- Prior art keywords
- sequence
- rna
- base
- pairing
- secondary structure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 238000012549 training Methods 0.000 claims abstract description 46
- 238000010801 machine learning Methods 0.000 claims abstract description 43
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 38
- 238000012360 testing method Methods 0.000 claims abstract description 30
- 239000012634 fragment Substances 0.000 claims abstract description 26
- 238000011144 upstream manufacturing Methods 0.000 claims abstract description 23
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 19
- 230000006870 function Effects 0.000 claims description 15
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 claims description 10
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 claims description 10
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 claims description 10
- 229930024421 Adenine Natural products 0.000 claims description 5
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 claims description 5
- 229960000643 adenine Drugs 0.000 claims description 5
- 229940104302 cytosine Drugs 0.000 claims description 5
- 229940035893 uracil Drugs 0.000 claims description 5
- 238000003066 decision tree Methods 0.000 claims description 4
- 238000011156 evaluation Methods 0.000 claims description 4
- 230000015572 biosynthetic process Effects 0.000 abstract description 3
- 239000000523 sample Substances 0.000 description 40
- 239000013614 RNA sample Substances 0.000 description 15
- 238000002474 experimental method Methods 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 239000000203 mixture Substances 0.000 description 3
- 238000005481 NMR spectroscopy Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 108090000623 proteins and genes Proteins 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 238000002441 X-ray diffraction Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000007636 ensemble learning method Methods 0.000 description 1
- 239000003016 pheromone Substances 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
Description
Claims (5)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811314747.9A CN109215740A (zh) | 2018-11-06 | 2018-11-06 | 基于Xgboost的全基因组RNA二级结构预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811314747.9A CN109215740A (zh) | 2018-11-06 | 2018-11-06 | 基于Xgboost的全基因组RNA二级结构预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109215740A true CN109215740A (zh) | 2019-01-15 |
Family
ID=64995514
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811314747.9A Pending CN109215740A (zh) | 2018-11-06 | 2018-11-06 | 基于Xgboost的全基因组RNA二级结构预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109215740A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110010192A (zh) * | 2019-04-10 | 2019-07-12 | 浙江工商大学 | 基于决策树算法的rna二级结构的预测方法 |
CN110010194A (zh) * | 2019-04-10 | 2019-07-12 | 浙江科技学院 | 一种rna二级结构的预测方法 |
CN110046259A (zh) * | 2019-03-15 | 2019-07-23 | 浙江大学城市学院 | 一种基于判决书文本的涉毒案件深度分析方法 |
CN110364223A (zh) * | 2019-06-24 | 2019-10-22 | 杭州电子科技大学 | 一种基于多示例学习的ires序列搜寻方法 |
CN111312329A (zh) * | 2020-02-25 | 2020-06-19 | 成都信息工程大学 | 基于深度卷积自动编码器的转录因子结合位点预测的方法 |
CN111489787A (zh) * | 2020-04-21 | 2020-08-04 | 桂林电子科技大学 | 一种CRISPR/Cas9靶向敲除定点DNA效率的预测方法 |
CN113066527A (zh) * | 2021-04-14 | 2021-07-02 | 吉优诺(上海)基因科技有限公司 | 一种siRNA敲减mRNA的靶点预测方法和系统 |
CN113393900A (zh) * | 2021-06-09 | 2021-09-14 | 吉林大学 | 基于改进Transformer模型的RNA状态推断研究方法 |
CN113782096A (zh) * | 2021-09-16 | 2021-12-10 | 平安科技(深圳)有限公司 | Rna碱基不成对概率的预测方法及装置 |
CN114093420A (zh) * | 2022-01-11 | 2022-02-25 | 山东建筑大学 | 一种基于XGBoost的DNA重组位点预测方法 |
CN115881209A (zh) * | 2023-02-15 | 2023-03-31 | 北京深势科技有限公司 | 一种rna二级结构预测的处理方法和装置 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007116787A1 (ja) * | 2006-03-28 | 2007-10-18 | Nec Soft, Ltd. | Rnaの二次構造予測方法、予測装置及び予測プログラム |
US20150141282A1 (en) * | 2013-09-06 | 2015-05-21 | Cornell University | Rna sequences that induce fluorescence of small molecule fluorophores |
CN106250718A (zh) * | 2016-07-29 | 2016-12-21 | 於铉 | 基于独立平衡Boosting算法的N1甲基化腺苷位点预测方法 |
CN107609351A (zh) * | 2017-10-23 | 2018-01-19 | 桂林电子科技大学 | 一种基于卷积神经网络预测假尿苷修饰位点的方法 |
CN108491686A (zh) * | 2018-03-30 | 2018-09-04 | 中南大学 | 一种基于双向XGBoost的基因调控网络构建方法 |
CN108509761A (zh) * | 2018-03-26 | 2018-09-07 | 中山大学 | 一种基于梯度提升决策树和特征选择的药物靶标预测方法 |
CN108563922A (zh) * | 2018-04-04 | 2018-09-21 | 中南大学 | 预测蛋白质rna结合物热点的方法、系统及存储介质 |
CN108629150A (zh) * | 2018-03-16 | 2018-10-09 | 西安电子科技大学 | 基于多种群协助的量子遗传算法的rna二级结构预测方法 |
-
2018
- 2018-11-06 CN CN201811314747.9A patent/CN109215740A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007116787A1 (ja) * | 2006-03-28 | 2007-10-18 | Nec Soft, Ltd. | Rnaの二次構造予測方法、予測装置及び予測プログラム |
US20150141282A1 (en) * | 2013-09-06 | 2015-05-21 | Cornell University | Rna sequences that induce fluorescence of small molecule fluorophores |
CN106250718A (zh) * | 2016-07-29 | 2016-12-21 | 於铉 | 基于独立平衡Boosting算法的N1甲基化腺苷位点预测方法 |
CN107609351A (zh) * | 2017-10-23 | 2018-01-19 | 桂林电子科技大学 | 一种基于卷积神经网络预测假尿苷修饰位点的方法 |
CN108629150A (zh) * | 2018-03-16 | 2018-10-09 | 西安电子科技大学 | 基于多种群协助的量子遗传算法的rna二级结构预测方法 |
CN108509761A (zh) * | 2018-03-26 | 2018-09-07 | 中山大学 | 一种基于梯度提升决策树和特征选择的药物靶标预测方法 |
CN108491686A (zh) * | 2018-03-30 | 2018-09-04 | 中南大学 | 一种基于双向XGBoost的基因调控网络构建方法 |
CN108563922A (zh) * | 2018-04-04 | 2018-09-21 | 中南大学 | 预测蛋白质rna结合物热点的方法、系统及存储介质 |
Non-Patent Citations (3)
Title |
---|
PONTI ET AL: "A high-throughput approach to profile RNA structure", 《NUCLEIC ACIDS RESEARCH》 * |
SEETIN ET AL: "RNA structure prediction: an overview of methods.", 《METHODS IN MOLECULAR BIOLOGY 》 * |
TIANQI CHEN ET AL: "XGBoost: A Scalable Tree Boosting System", 《22ND ACM SIGKDD INTERNATIONAL CONFERENCE ON KNOWLEDGE DISCOVERY AND DATA MINING》 * |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110046259A (zh) * | 2019-03-15 | 2019-07-23 | 浙江大学城市学院 | 一种基于判决书文本的涉毒案件深度分析方法 |
CN110010194A (zh) * | 2019-04-10 | 2019-07-12 | 浙江科技学院 | 一种rna二级结构的预测方法 |
CN110010192A (zh) * | 2019-04-10 | 2019-07-12 | 浙江工商大学 | 基于决策树算法的rna二级结构的预测方法 |
CN110364223B (zh) * | 2019-06-24 | 2021-04-06 | 杭州电子科技大学 | 一种基于多示例学习的ires序列搜寻方法 |
CN110364223A (zh) * | 2019-06-24 | 2019-10-22 | 杭州电子科技大学 | 一种基于多示例学习的ires序列搜寻方法 |
CN111312329B (zh) * | 2020-02-25 | 2023-03-24 | 成都信息工程大学 | 基于深度卷积自动编码器的转录因子结合位点预测的方法 |
CN111312329A (zh) * | 2020-02-25 | 2020-06-19 | 成都信息工程大学 | 基于深度卷积自动编码器的转录因子结合位点预测的方法 |
CN111489787A (zh) * | 2020-04-21 | 2020-08-04 | 桂林电子科技大学 | 一种CRISPR/Cas9靶向敲除定点DNA效率的预测方法 |
CN111489787B (zh) * | 2020-04-21 | 2023-05-12 | 桂林电子科技大学 | 一种CRISPR/Cas9靶向敲除定点DNA效率的预测方法 |
CN113066527A (zh) * | 2021-04-14 | 2021-07-02 | 吉优诺(上海)基因科技有限公司 | 一种siRNA敲减mRNA的靶点预测方法和系统 |
CN113066527B (zh) * | 2021-04-14 | 2024-02-09 | 吉优诺(上海)基因科技有限公司 | 一种siRNA敲减mRNA的靶点预测方法和系统 |
CN113393900A (zh) * | 2021-06-09 | 2021-09-14 | 吉林大学 | 基于改进Transformer模型的RNA状态推断研究方法 |
CN113782096A (zh) * | 2021-09-16 | 2021-12-10 | 平安科技(深圳)有限公司 | Rna碱基不成对概率的预测方法及装置 |
WO2023040148A1 (zh) * | 2021-09-16 | 2023-03-23 | 平安科技(深圳)有限公司 | Rna碱基不成对概率的预测方法、装置、存储介质及设备 |
CN113782096B (zh) * | 2021-09-16 | 2023-06-16 | 平安科技(深圳)有限公司 | Rna碱基不成对概率的预测方法及装置 |
CN114093420A (zh) * | 2022-01-11 | 2022-02-25 | 山东建筑大学 | 一种基于XGBoost的DNA重组位点预测方法 |
CN115881209A (zh) * | 2023-02-15 | 2023-03-31 | 北京深势科技有限公司 | 一种rna二级结构预测的处理方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109215740A (zh) | 基于Xgboost的全基因组RNA二级结构预测方法 | |
Wang et al. | DMfold: a novel method to predict RNA secondary structure with pseudoknots based on deep learning and improved base pair maximization principle | |
CN107862179A (zh) | 一种基于相似性和逻辑矩阵分解的miRNA‑疾病关联关系预测方法 | |
CN112232413B (zh) | 基于图神经网络与谱聚类的高维数据特征选择方法 | |
De Campos et al. | Optimization of neural networks through grammatical evolution and a genetic algorithm | |
CN114927162A (zh) | 基于超图表征与狄利克雷分布的多组学关联表型预测方法 | |
CN111144555A (zh) | 基于改进进化算法的循环神经网络架构搜索方法、系统及介质 | |
CN101794351A (zh) | 一种基于大间隔最近中心点的蛋白质二级结构的工程预测方法 | |
CN109147866A (zh) | 基于采样与集成学习的蛋白质-dna绑定残基预测方法 | |
WO2023197718A1 (zh) | 一种预测环状rna ires的方法 | |
CN113066527B (zh) | 一种siRNA敲减mRNA的靶点预测方法和系统 | |
JP2008146538A (ja) | マイクロrna検出装置、方法およびプログラム | |
Liu et al. | Rest: Constructing rectilinear steiner minimum tree via reinforcement learning | |
CN101324926A (zh) | 一种面向复杂模式分类的特征选择方法 | |
CN114512178A (zh) | 基于伊辛机量子退火的密码子优化方法 | |
CN110491443B (zh) | 一种基于投影邻域非负矩阵分解的lncRNA蛋白质关联预测方法 | |
CN109801681B (zh) | 一种基于改进的模糊聚类算法的snp选择方法 | |
CN114093426B (zh) | 基于基因调控网络构建的标志物筛选方法 | |
CN110111838B (zh) | 含假结基于扩展结构的核糖核酸折叠结构预测方法与装置 | |
Yoo et al. | Discovery of gene-regulation pathways using local causal search. | |
CN114881359B (zh) | 融合GBDT和XGBoost的路面IRI预测方法 | |
CN113223622B (zh) | 基于元路径的miRNA-疾病关联预测方法 | |
Ren et al. | Differential Evolution with fitness-difference based parameter control and hypervolume diversity indicator for numerical optimization | |
CN115295156A (zh) | 一种基于关系图卷积网络融合多源信息预测miRNA-疾病的方法 | |
CN110162704B (zh) | 基于多因子遗传算法的多规模关键用户提取方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB03 | Change of inventor or designer information |
Inventor after: Ke Yaobin Inventor after: Rao Jiahua Inventor after: Yang Yuedong Inventor after: Chen Zhiguang Inventor after: Lu Yutong Inventor before: Xiao Nong Inventor before: Ke Yaobin Inventor before: Rao Jiahua Inventor before: Yang Yuedong Inventor before: Chen Zhiguang Inventor before: Lu Yutong |
|
CB03 | Change of inventor or designer information | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190115 |
|
RJ01 | Rejection of invention patent application after publication |