CN109215740A - 基于Xgboost的全基因组RNA二级结构预测方法 - Google Patents
基于Xgboost的全基因组RNA二级结构预测方法 Download PDFInfo
- Publication number
- CN109215740A CN109215740A CN201811314747.9A CN201811314747A CN109215740A CN 109215740 A CN109215740 A CN 109215740A CN 201811314747 A CN201811314747 A CN 201811314747A CN 109215740 A CN109215740 A CN 109215740A
- Authority
- CN
- China
- Prior art keywords
- bases
- rna
- sequence
- secondary structure
- pairing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 21
- 238000010801 machine learning Methods 0.000 claims abstract description 42
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 36
- 238000012549 training Methods 0.000 claims abstract description 34
- 239000012634 fragment Substances 0.000 claims abstract description 29
- 238000012360 testing method Methods 0.000 claims abstract description 26
- 238000011144 upstream manufacturing Methods 0.000 claims abstract description 20
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 19
- 230000006870 function Effects 0.000 claims description 15
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 claims description 10
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 claims description 10
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 claims description 10
- 229930024421 Adenine Natural products 0.000 claims description 5
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 claims description 5
- 229960000643 adenine Drugs 0.000 claims description 5
- 229940104302 cytosine Drugs 0.000 claims description 5
- 229940035893 uracil Drugs 0.000 claims description 5
- 238000003066 decision tree Methods 0.000 claims description 4
- 238000011156 evaluation Methods 0.000 claims description 4
- 239000013589 supplement Substances 0.000 claims description 3
- 230000015572 biosynthetic process Effects 0.000 abstract description 4
- 239000000523 sample Substances 0.000 description 21
- 239000013614 RNA sample Substances 0.000 description 15
- 238000002474 experimental method Methods 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 5
- 238000011160 research Methods 0.000 description 4
- 239000000203 mixture Substances 0.000 description 3
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 2
- 238000005481 NMR spectroscopy Methods 0.000 description 2
- 238000007636 ensemble learning method Methods 0.000 description 2
- 108090000623 proteins and genes Proteins 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 238000002441 X-ray diffraction Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000002425 crystallisation Methods 0.000 description 1
- 230000008025 crystallization Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000003016 pheromone Substances 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000002424 x-ray crystallography Methods 0.000 description 1
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
Description
Claims (5)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811314747.9A CN109215740A (zh) | 2018-11-06 | 2018-11-06 | 基于Xgboost的全基因组RNA二级结构预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811314747.9A CN109215740A (zh) | 2018-11-06 | 2018-11-06 | 基于Xgboost的全基因组RNA二级结构预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109215740A true CN109215740A (zh) | 2019-01-15 |
Family
ID=64995514
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811314747.9A Pending CN109215740A (zh) | 2018-11-06 | 2018-11-06 | 基于Xgboost的全基因组RNA二级结构预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109215740A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110010194A (zh) * | 2019-04-10 | 2019-07-12 | 浙江科技学院 | 一种rna二级结构的预测方法 |
CN110010192A (zh) * | 2019-04-10 | 2019-07-12 | 浙江工商大学 | 基于决策树算法的rna二级结构的预测方法 |
CN110046259A (zh) * | 2019-03-15 | 2019-07-23 | 浙江大学城市学院 | 一种基于判决书文本的涉毒案件深度分析方法 |
CN110364223A (zh) * | 2019-06-24 | 2019-10-22 | 杭州电子科技大学 | 一种基于多示例学习的ires序列搜寻方法 |
CN111312329A (zh) * | 2020-02-25 | 2020-06-19 | 成都信息工程大学 | 基于深度卷积自动编码器的转录因子结合位点预测的方法 |
CN111489787A (zh) * | 2020-04-21 | 2020-08-04 | 桂林电子科技大学 | 一种CRISPR/Cas9靶向敲除定点DNA效率的预测方法 |
CN113066527A (zh) * | 2021-04-14 | 2021-07-02 | 吉优诺(上海)基因科技有限公司 | 一种siRNA敲减mRNA的靶点预测方法和系统 |
CN113393900A (zh) * | 2021-06-09 | 2021-09-14 | 吉林大学 | 基于改进Transformer模型的RNA状态推断研究方法 |
CN113782096A (zh) * | 2021-09-16 | 2021-12-10 | 平安科技(深圳)有限公司 | Rna碱基不成对概率的预测方法及装置 |
CN114093420A (zh) * | 2022-01-11 | 2022-02-25 | 山东建筑大学 | 一种基于XGBoost的DNA重组位点预测方法 |
CN115881209A (zh) * | 2023-02-15 | 2023-03-31 | 北京深势科技有限公司 | 一种rna二级结构预测的处理方法和装置 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007116787A1 (ja) * | 2006-03-28 | 2007-10-18 | Nec Soft, Ltd. | Rnaの二次構造予測方法、予測装置及び予測プログラム |
US20150141282A1 (en) * | 2013-09-06 | 2015-05-21 | Cornell University | Rna sequences that induce fluorescence of small molecule fluorophores |
CN106250718A (zh) * | 2016-07-29 | 2016-12-21 | 於铉 | 基于独立平衡Boosting算法的N1甲基化腺苷位点预测方法 |
CN107609351A (zh) * | 2017-10-23 | 2018-01-19 | 桂林电子科技大学 | 一种基于卷积神经网络预测假尿苷修饰位点的方法 |
CN108491686A (zh) * | 2018-03-30 | 2018-09-04 | 中南大学 | 一种基于双向XGBoost的基因调控网络构建方法 |
CN108509761A (zh) * | 2018-03-26 | 2018-09-07 | 中山大学 | 一种基于梯度提升决策树和特征选择的药物靶标预测方法 |
CN108563922A (zh) * | 2018-04-04 | 2018-09-21 | 中南大学 | 预测蛋白质rna结合物热点的方法、系统及存储介质 |
CN108629150A (zh) * | 2018-03-16 | 2018-10-09 | 西安电子科技大学 | 基于多种群协助的量子遗传算法的rna二级结构预测方法 |
-
2018
- 2018-11-06 CN CN201811314747.9A patent/CN109215740A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2007116787A1 (ja) * | 2006-03-28 | 2007-10-18 | Nec Soft, Ltd. | Rnaの二次構造予測方法、予測装置及び予測プログラム |
US20150141282A1 (en) * | 2013-09-06 | 2015-05-21 | Cornell University | Rna sequences that induce fluorescence of small molecule fluorophores |
CN106250718A (zh) * | 2016-07-29 | 2016-12-21 | 於铉 | 基于独立平衡Boosting算法的N1甲基化腺苷位点预测方法 |
CN107609351A (zh) * | 2017-10-23 | 2018-01-19 | 桂林电子科技大学 | 一种基于卷积神经网络预测假尿苷修饰位点的方法 |
CN108629150A (zh) * | 2018-03-16 | 2018-10-09 | 西安电子科技大学 | 基于多种群协助的量子遗传算法的rna二级结构预测方法 |
CN108509761A (zh) * | 2018-03-26 | 2018-09-07 | 中山大学 | 一种基于梯度提升决策树和特征选择的药物靶标预测方法 |
CN108491686A (zh) * | 2018-03-30 | 2018-09-04 | 中南大学 | 一种基于双向XGBoost的基因调控网络构建方法 |
CN108563922A (zh) * | 2018-04-04 | 2018-09-21 | 中南大学 | 预测蛋白质rna结合物热点的方法、系统及存储介质 |
Non-Patent Citations (3)
Title |
---|
PONTI ET AL: "A high-throughput approach to profile RNA structure", 《NUCLEIC ACIDS RESEARCH》 * |
SEETIN ET AL: "RNA structure prediction: an overview of methods.", 《METHODS IN MOLECULAR BIOLOGY 》 * |
TIANQI CHEN ET AL: "XGBoost: A Scalable Tree Boosting System", 《22ND ACM SIGKDD INTERNATIONAL CONFERENCE ON KNOWLEDGE DISCOVERY AND DATA MINING》 * |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110046259A (zh) * | 2019-03-15 | 2019-07-23 | 浙江大学城市学院 | 一种基于判决书文本的涉毒案件深度分析方法 |
CN110010192A (zh) * | 2019-04-10 | 2019-07-12 | 浙江工商大学 | 基于决策树算法的rna二级结构的预测方法 |
CN110010194A (zh) * | 2019-04-10 | 2019-07-12 | 浙江科技学院 | 一种rna二级结构的预测方法 |
CN110364223B (zh) * | 2019-06-24 | 2021-04-06 | 杭州电子科技大学 | 一种基于多示例学习的ires序列搜寻方法 |
CN110364223A (zh) * | 2019-06-24 | 2019-10-22 | 杭州电子科技大学 | 一种基于多示例学习的ires序列搜寻方法 |
CN111312329B (zh) * | 2020-02-25 | 2023-03-24 | 成都信息工程大学 | 基于深度卷积自动编码器的转录因子结合位点预测的方法 |
CN111312329A (zh) * | 2020-02-25 | 2020-06-19 | 成都信息工程大学 | 基于深度卷积自动编码器的转录因子结合位点预测的方法 |
CN111489787A (zh) * | 2020-04-21 | 2020-08-04 | 桂林电子科技大学 | 一种CRISPR/Cas9靶向敲除定点DNA效率的预测方法 |
CN111489787B (zh) * | 2020-04-21 | 2023-05-12 | 桂林电子科技大学 | 一种CRISPR/Cas9靶向敲除定点DNA效率的预测方法 |
CN113066527A (zh) * | 2021-04-14 | 2021-07-02 | 吉优诺(上海)基因科技有限公司 | 一种siRNA敲减mRNA的靶点预测方法和系统 |
CN113066527B (zh) * | 2021-04-14 | 2024-02-09 | 吉优诺(上海)基因科技有限公司 | 一种siRNA敲减mRNA的靶点预测方法和系统 |
CN113393900A (zh) * | 2021-06-09 | 2021-09-14 | 吉林大学 | 基于改进Transformer模型的RNA状态推断研究方法 |
CN113782096A (zh) * | 2021-09-16 | 2021-12-10 | 平安科技(深圳)有限公司 | Rna碱基不成对概率的预测方法及装置 |
WO2023040148A1 (zh) * | 2021-09-16 | 2023-03-23 | 平安科技(深圳)有限公司 | Rna碱基不成对概率的预测方法、装置、存储介质及设备 |
CN113782096B (zh) * | 2021-09-16 | 2023-06-16 | 平安科技(深圳)有限公司 | Rna碱基不成对概率的预测方法及装置 |
CN114093420A (zh) * | 2022-01-11 | 2022-02-25 | 山东建筑大学 | 一种基于XGBoost的DNA重组位点预测方法 |
CN115881209A (zh) * | 2023-02-15 | 2023-03-31 | 北京深势科技有限公司 | 一种rna二级结构预测的处理方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109215740A (zh) | 基于Xgboost的全基因组RNA二级结构预测方法 | |
CN111312329B (zh) | 基于深度卷积自动编码器的转录因子结合位点预测的方法 | |
CN111798921A (zh) | 一种基于多尺度注意力卷积神经网络的rna结合蛋白预测方法及装置 | |
CN109063416B (zh) | 基于lstm循环神经网络的基因表达预测方法 | |
CN111341386A (zh) | 引入注意力的多尺度CNN-BiLSTM非编码RNA互作关系预测方法 | |
CN112232413B (zh) | 基于图神经网络与谱聚类的高维数据特征选择方法 | |
CN112908414B (zh) | 一种大规模单细胞分型方法、系统及存储介质 | |
CN108985335A (zh) | 核反应堆包壳材料辐照肿胀的集成学习预测方法 | |
CN114819056B (zh) | 一种基于域对抗和变分推断的单细胞数据整合方法 | |
CN109559781A (zh) | 一种预测dna-蛋白质结合的双向lstm和cnn模型 | |
CN110135498A (zh) | 一种基于深度进化神经网络的图像识别方法 | |
CN104809476A (zh) | 一种基于分解的多目标进化模糊规则分类方法 | |
CN114420211A (zh) | 一种基于注意力机制的rna-蛋白质结合位点预测方法 | |
WO2023197718A1 (zh) | 一种预测环状rna ires的方法 | |
CN114511737A (zh) | 图像识别域泛化模型的训练方法 | |
CN115579068A (zh) | 一种基于预训练和深度聚类的宏基因组物种重建方法 | |
CN112215259A (zh) | 基因选择方法和装置 | |
CN117349494A (zh) | 空间图卷积神经网络的图分类方法、系统、介质及设备 | |
CN116631512A (zh) | 基于深度分解机的piRNA与疾病关联关系预测方法 | |
CN115600602A (zh) | 一种长文本的关键要素抽取方法、系统及终端设备 | |
CN114999566A (zh) | 基于词向量表征和注意力机制的药物重定位方法及系统 | |
CN110991600B (zh) | 一种融合分布估计算法与极限学习机的干旱智慧预测方法 | |
CN113378946A (zh) | 一种考虑特征标签依赖度的鲁棒多标签特征选择方法 | |
CN108182347B (zh) | 一种大规模跨平台基因表达数据分类方法 | |
CN113223622B (zh) | 基于元路径的miRNA-疾病关联预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB03 | Change of inventor or designer information | ||
CB03 | Change of inventor or designer information |
Inventor after: Ke Yaobin Inventor after: Rao Jiahua Inventor after: Yang Yuedong Inventor after: Chen Zhiguang Inventor after: Lu Yutong Inventor before: Xiao Nong Inventor before: Ke Yaobin Inventor before: Rao Jiahua Inventor before: Yang Yuedong Inventor before: Chen Zhiguang Inventor before: Lu Yutong |
|
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190115 |