CN106919809A - 一种响应逆境胁迫的lncRNAs二级结构功能注释方法 - Google Patents

一种响应逆境胁迫的lncRNAs二级结构功能注释方法 Download PDF

Info

Publication number
CN106919809A
CN106919809A CN201710120768.6A CN201710120768A CN106919809A CN 106919809 A CN106919809 A CN 106919809A CN 201710120768 A CN201710120768 A CN 201710120768A CN 106919809 A CN106919809 A CN 106919809A
Authority
CN
China
Prior art keywords
lncrnas
environment stress
secondary structure
functional annotation
plant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710120768.6A
Other languages
English (en)
Other versions
CN106919809B (zh
Inventor
张德强
宋跃朋
次东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Forestry University
Original Assignee
Beijing Forestry University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Forestry University filed Critical Beijing Forestry University
Priority to CN201710120768.6A priority Critical patent/CN106919809B/zh
Publication of CN106919809A publication Critical patent/CN106919809A/zh
Application granted granted Critical
Publication of CN106919809B publication Critical patent/CN106919809B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression

Landscapes

  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了一种植物响应逆境胁迫的lncRNAs二级结构功能注释方法,包括筛选植物响应逆境胁迫的lncRNAs与筛选对植物响应逆境胁迫的lncRNAs的候选靶基因;对植物响应逆境胁迫的lncRNAs的靶基因的功能注释;以及对响应逆境胁迫的lncRNAs二级结构富集分析与功能预测。本发明二级结构功能注释的方法,结合生物信息学与差异表达分析对植物逆境胁迫响应lncRNAs的二级结构进行注释,不但极大地提高了实验的效率、精准性以及灵活性并显著地降低了实验成本。

Description

一种响应逆境胁迫的lncRNAs二级结构功能注释方法
技术领域
本发明涉及分子生物学技术领域,具体涉及一种响应逆境胁迫的lncRNAs二级结构功能注释方法。
背景技术
高通量RNA测序技术是现代基因组学研究最重要的技术手段,在整个生物学领域具有广泛的应用。随着测序数据的大量积累,基因组学研究得到快速发展。在利用高通量RNA测序技术运用于差异表达基因即编码RNA的研究基础上,越来越多的研究关注到基因组的非编码RNA上。这些非编码RNA包括miRNAs、siRNAs、lncRNAs、circularRNA等,其中miRNAs由于其具有独特二级结构以及与靶基因的作用方式已经广泛地被证明在植物生长发育和响应逆境胁迫的转录调控方面具有重要作用。而lncRNAs是一类长度超过200nt,不具有蛋白编码能力的非编码RNA,其不具有保守的二级结构,可以通过多种方式影响靶基因的转录调控。因此,高通量的开展lncRNAs的功能注释工作对于今后的非编码RNA的功能研究具有重要意义。
目前,已有的研究主要通过计算非编码RNA与编码RNA共表达关系的方法将lncRNAs与共表达的mRNA分为一组,利用mRNA的注释信息来完成lncRNAs的功能注释。该方法不仅需要大量的表达数据用于共表达分析,同时将缺失胁迫响应特异表达lncRNAs的功能注释信息。
发明内容
有鉴于此,本发明的第一目的在于提供了一种植物响应逆境胁迫的lncRNAs二级结构功能注释方法,包括以下步骤:
步骤S1,筛选植物响应逆境胁迫的lncRNAs;
步骤S2,筛选对植物响应逆境胁迫的lncRNAs的候选靶基因;
步骤S3,植物响应逆境胁迫的lncRNAs的靶基因的功能注释;
步骤S4,对响应逆境胁迫的lncRNAs二级结构富集分析;
步骤S5,逆境胁迫响应lncRNAs特异二级结构功能预测。
优选地,本发明所述的植物响应逆境胁迫的lncRNAs二级结构功能注释方法中,所述步骤S1中所述逆境胁迫为低温处理或高盐处理;优选地,所述低温处理为4℃处理6小时;所述高盐处理为150mM NaCl处理6小时。
优选地,本发明所述的植物响应逆境胁迫的lncRNAs二级结构功能注释方法中,所述步骤S1中lncRNAs筛选标准为①长度大于200nt;②最小读长覆盖率为5;③开放阅读框小于300nt;④利用CPC分析、CNCI分析编码蛋白能力(阈值为CPC score<0,CNCI score<0)。⑤利用cuffdiff进行lncRNAs差异表达分析(最小阈值为:差异倍数>2或<0.5,p-值<0.05,q-值<0.05)。
优选地,本发明所述的植物响应逆境胁迫的lncRNAs二级结构功能注释方法中,所述步骤S2中对顺式作用靶基因筛选规则为在筛选对逆境胁迫响应lncRNAs的上下游10Kb范围内的基因;对反式作用靶基因筛选规则为①利用Blast进行序列互补计算,参数设置为E-value=1e-10,identity=90%。②利用RNAplex进行热力学上的互补计算,参数设置为e=-70。
优选地,本发明所述的植物响应逆境胁迫的lncRNAs二级结构功能注释方法中,所述步骤S3中对植物响应逆境胁迫的lncRNAs的靶基因的功能注释的方法为:利用NCBI核酸数据库(https://blast.ncbi.nlm.nih.gov/Blast.cgi)进行功能注释;利用AgriGO(http://bioinfo.cau.edu.cn/agriGO/)对候选基因Go term进行富集分析。
优选地,本发明所述的植物响应逆境胁迫的lncRNAs二级结构功能注释方法中,所述步骤S4中对响应逆境胁迫的lncRNAs二级结构富集分析方法为利用RNAmotif2008对胁迫响应的lncRNAs特异二级结构进行富集分析。
优选地,本发明所述的植物响应逆境胁迫的lncRNAs二级结构功能注释方法中,所述分析中筛选的参数设置为:①预测motif数量4-6个;②Stem数量4-6;③Loop数量1-3个④分布模式为一般模式(Normal)。共获得富集的lncRNAs二级结构4个。
优选地,本发明所述的植物响应逆境胁迫的lncRNAs二级结构功能注释方法中,所述步骤S5中逆境胁迫响应lncRNAs特异二级结构功能预测方法为根据胁迫响应lncRNAs特异二级结构富集结构及lncRNAs靶基因的功能注释结果,对lncRNAs特异二级结构的功能进行预测。
本发明还提供了上述方法在响应逆境胁迫的植物lncRNAs二级结构功能注释与预测中的用途。
即本发明提供一种响应逆境胁迫的植物lncRNAs二级结构功能注释的方法,结合生物信息学与差异表达分析对植物逆境胁迫响应lncRNAs的二级结构进行注释,不但极大地提高了实验的效率、精准性以及灵活性并显著地降低了实验成本。
附图说明
图1为植物lncRNAs响应逆境胁迫的二级结构功能注释的方法流程示意图;图2毛白杨响应高温的lncRNAs二级结构功能注释结果;
图3小叶杨响应渗透胁迫的lncRNAs二级结构功能注释结果。
具体实施方式
根据本发明一个典型的实施方式,待测样本为小叶杨1年生植株。对其进行高温(42℃,6小时)处理,立即采取叶片用于提取总RNAs。利用Ribo-Zero rRNA试剂盒对核糖体RNA进行去除。利用SMART试剂盒进行链特异性cDNA文库构建。利用IlluminaHiSeqTM2500测序平台完成cDNA文库测序,测序深度为10×。去除接头以及冗余序列,通过cufflinks软件拼接转录本,筛选长度大于200nt、最小读长覆盖率为5、CPC score<0、CNCI score<0以及与对照差异表达倍数大于2(P<0.05)的lncRNAs。预测差异表达的lncRNAs顺式及反式作用靶基因,并对靶基因的表达模式进行解析,筛选差异表达的靶基因作为候选基因(最小阈值为:差异倍数>2或<0.5,p-值<0.05,q-值<0.05)。对于候选基因,利用NCBI核酸数据库(https://blast.ncbi.nlm.nih.gov/Blast.cgi)进行功能注释。利用AgriGO(http://bioinfo.cau.edu.cn/agriGO/)对候选基因Go term进行富集分析。利用RNA motif 2008(https://genie.weizmann.ac.il/pubs/rnamotifs08/rnamotifs08_predict.html#)对胁迫响应的lncRNAs特异二级结构进行富集分析。根据胁迫响应的lncRNAs特异二级结构富集结构及lncRNAs靶基因的功能注释结果,对lncRNAs特异二级结构的功能进行预测。
以下通过具体实施例进一步对本发明的技术方案进行说明,应理解以下仅为本发明的示例性说明,并不用于限制本发明权利要求的保护范围。
实施例1
对毛白杨1年生植株进行高温(42℃,6小时)处理,提取其总RNA用于响应高温胁迫的lncRNAs二级结构功能注释。
S1,利用Ribo-Zero rRNA试剂盒对核糖体RNA进行去除。利用SMART试剂盒进行链特异性cDNA文库构建。利用Illumina HiSeqTM2500测序平台完成cDNA文库测序,测序深度为10×。去除接头以及冗余序列,通过cufflinks软件拼接转录本,筛选长度大于200nt、最小读长覆盖率为5、CPC score<0、CNCI score<0lncRNAs,共获得3631个。筛选差异倍数大于10且小于20(p-值<0.05,q-值<0.05)的lncRNAs,共16个(见表1)。
表1毛白杨响应高温逆境胁迫的lncRNAs
S2,在14个响应高温胁迫的lncRNA上下游各10Kb范围内筛选顺式作用靶基因,共获得31个(见表2)。利用Blast进行序列互补计算,参数设置为E-value=1e-10,identity=90%以及利用RNAplex进行热力学上的互补计算,参数设置为e=-70。共获得反式作用靶基因30个(见表3)。根据差异表达靶基因筛选标准(p-值<0.05,q-值<0.05)筛选获得候选靶基因42个(见表4)。
表2毛白杨响应低温逆境胁迫的lncRNAs顺式作用靶基因
表3毛白杨响应高温逆境胁迫的lncRNAs反式作用靶基因
表4毛白杨响应高温逆境胁迫的lncRNAs靶基因功能注释
S3,对于候选基因,利用NCBI核酸数据库(https://blast.ncbi.nlm.nih.gov/Blast.cgi)进行功能注释(见表4)。利用AgriGO(http://bioinfo.cau.edu.cn/agriGO/)对候选基因Go term进行富集分析(见表5)。
表5毛白杨响应高温逆境胁迫的lncRNAs靶基因功能富集分析
S4,利用RNAmotif2008(https://genie.weizmann.ac.il/pubs/rnamotifs08/rnamotifs08_predict.html#)对胁迫响应的lncRNAs特异二级结构进行富集分析。筛选参数设置如下:①预测motif数量4-6个;②Stem数量4-6;③Loop数量1-3个④分布模式为一般模式(Normal)。共获得富集的lncRNAs二级结构4个(见图2)。
S5,利用lncRNAs靶基因的功能注释结果,对lncRNAs特异二级结构的功能进行预测(见图2)。
如图2所示,结构序列1,GO:GO:0019725细胞自动调节;
结构序列2:GO:0042592稳定作用;
结构序列3:GO:0045454,细胞氧化还原内稳态;
结构序列4:GO:0065008,生物质量的监管。
实施例2
对1年生小叶杨植株进行渗透胁迫处理(30%聚乙二醇6000,6小时),提取其总RNA用于对响应渗透胁迫的lncRNAs二级结构的功能注释。
S1,利用Ribo-Zero rRNA试剂盒对核糖体RNA进行去除。利用SMART试剂盒进行链特异性cDNA文库构建。利用IlluminaHiSeqTM2500测序平台完成cDNA文库测序,测序深度为10×。去除接头以及冗余序列,通过cufflinks软件拼接转录本,筛选长度大于200nt、最小读长覆盖率为5、CPC score<0、CNCI score<0lncRNAs,共获得7360个。筛选差异倍数大于0.03且小于0.2(p-值<0.05,q-值<0.05)条件下共19个lncRNAs。(见表6)。
表6小叶杨响应渗透逆境胁迫lncRNAs
S2,在19个响应高温胁迫的lncRNA上下游10Kb范围内筛选顺式作用靶基因,共获得53个(见表7)。利用Blast进行序列互补计算,参数设置为E-value=1e-10,identity=90%以及利用RNAplex进行热力学上的互补计算,参数设置为e=-70。共获得反式作用靶基因71个(见表8)。根据差异表达靶基因筛选标准(p-值<0.05,q-值<0.05)筛选获得候选靶基因102个(见表9)
表7小叶杨响应渗透逆境胁迫的lncRNAs顺式作用靶基因
表8小叶杨响应渗透逆境胁迫的lncRNAs反式作用靶基因
表9小叶杨响应渗透逆境胁迫的lncRNAs靶基因功能注释
S3,对于候选基因,利用NCBI核酸数据库(https://blast.ncbi.nlm.nih.gov/Blast.cgi)进行功能注释(见表9)。利用AgriGO(http://bioinfo.cau.edu.cn/agriGO/)对候选基因Go term进行富集分析(见表10)。
表10小叶杨响应渗透逆境胁迫的lncRNAs靶基因功能富集分析
S4,利用RNAmotif2008(https://genie.weizmann.ac.il/pubs/rnamotifs08/rnamotifs08_predict.html#)对响应胁迫的lncRNAs特异二级结构进行富集分析。筛选参数设置如下:①预测motif数量4-6个;②Stem数量4-6;③Loop数量1-3个④分布模式为一般模式(Normal)。共获得富集的lncRNAs二级结构3个(见图3)
S5,利用lncRNAs靶基因的功能注释结果,对lncRNAs特异二级结构的功能进行预测(见图3)。
如图3所示,结构序列1,GO:0006979,抗氧化作用;
结构序列2:GO:0016310,磷酸化作用;
结构序列3:GO:0005509,钙离子绑定。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (9)

1.一种植物响应逆境胁迫的lncRNAs二级结构功能注释方法,包括以下步骤:
步骤S1,筛选植物响应逆境胁迫的lncRNAs;
步骤S2,筛选对植物响应逆境胁迫的lncRNAs的候选靶基因;
步骤S3,植物响应逆境胁迫的lncRNAs的靶基因的功能注释;
步骤S4,对响应逆境胁迫的lncRNAs二级结构富集分析;
步骤S5,逆境胁迫响应lncRNAs特异二级结构功能预测。
2.根据权利要求1所述的植物响应逆境胁迫的lncRNAs二级结构功能注释方法,其特征在于,所述步骤S1中所述逆境胁迫为低温处理或高盐处理;优选地,所述低温处理为4℃处理6小时;所述高盐处理为150mM NaCl处理6小时。
3.根据权利要求1所述的植物响应逆境胁迫的lncRNAs二级结构功能注释方法,其特征在于,所述步骤S1中lncRNAs筛选标准为①长度大于200nt;②最小读长覆盖率为5;③开放阅读框小于300nt;④利用CPC分析、CNCI分析编码蛋白能力(阈值为CPC score<0,CNCIscore<0)。⑤利用cuffdiff进行lncRNAs差异表达分析(最小阈值为:差异倍数>2或<0.5,p-值<0.05,q-值<0.05)。
4.根据权利要求1所述的植物响应逆境胁迫的lncRNAs二级结构功能注释方法,其特征在于,所述步骤S2中对顺式作用靶基因筛选规则为在筛选对逆境胁迫响应lncRNAs的上下游10Kb范围内的基因;对反式作用靶基因筛选规则为①利用Blast进行序列互补计算,参数设置为E-value=1e-10,identity=90%。②利用RNAplex进行热力学上的互补计算,参数设置为e=-70。
5.根据权利要求1所述的植物响应逆境胁迫的lncRNAs二级结构功能注释方法,其特征在于,所述步骤S3中对植物响应逆境胁迫的lncRNAs的靶基因的功能注释的方法为:利用NCBI核酸数据库(https://blast.ncbi.nlm.nih.gov/Blast.cgi)进行功能注释;利用AgriGO(http://bioinfo.cau.edu.cn/agriGO/)对候选基因Go term进行富集分析。
6.根据权利要求1所述的植物响应逆境胁迫的lncRNAs二级结构功能注释方法,其特征在于,所述步骤S4中对响应逆境胁迫的lncRNAs二级结构富集分析方法为利用RNAmotif2008对胁迫响应的lncRNAs特异二级结构进行富集分析。
7.根据权利要求6所述的植物响应逆境胁迫的lncRNAs二级结构功能注释方法,其特征在于,所述分析中筛选的参数设置为:①预测motif数量4-6个;②Stem数量4-6;③Loop数量1-3个④分布模式为一般模式(Normal)。共获得富集的lncRNAs二级结构4个。
8.根据权利要求1所述的植物响应逆境胁迫的lncRNAs二级结构功能注释方法,其特征在于,所述步骤S5中逆境胁迫响应lncRNAs特异二级结构功能预测方法为根据胁迫响应lncRNAs特异二级结构富集结构及lncRNAs靶基因的功能注释结果,对lncRNAs特异二级结构的功能进行预测。
9.根据权利要求1~8任意一项所述方法在响应逆境胁迫的植物lncRNAs二级结构功能注释与预测中的用途。
CN201710120768.6A 2017-03-02 2017-03-02 一种响应逆境胁迫的lncRNAs二级结构功能注释方法 Active CN106919809B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710120768.6A CN106919809B (zh) 2017-03-02 2017-03-02 一种响应逆境胁迫的lncRNAs二级结构功能注释方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710120768.6A CN106919809B (zh) 2017-03-02 2017-03-02 一种响应逆境胁迫的lncRNAs二级结构功能注释方法

Publications (2)

Publication Number Publication Date
CN106919809A true CN106919809A (zh) 2017-07-04
CN106919809B CN106919809B (zh) 2019-03-01

Family

ID=59460276

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710120768.6A Active CN106919809B (zh) 2017-03-02 2017-03-02 一种响应逆境胁迫的lncRNAs二级结构功能注释方法

Country Status (1)

Country Link
CN (1) CN106919809B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108319814A (zh) * 2018-01-29 2018-07-24 中国科学院生物物理研究所 基于染色体空间相互作用预测长非编码rna生物学功能的方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106295246A (zh) * 2016-08-07 2017-01-04 吉林大学 找到与肿瘤相关的lncRNA并预测其功能

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106295246A (zh) * 2016-08-07 2017-01-04 吉林大学 找到与肿瘤相关的lncRNA并预测其功能

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ZHAO B,LIANG R,GE L: "Identification of drought-induced microRNAs in rice", 《BIOCHEMICAL AND BIOPHYSICAL RESEARCH COMMUNICATIONS》 *
许菲菲: "棉花盐胁迫下叶片miRNAs的鉴定与分析", 《棉花学报》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108319814A (zh) * 2018-01-29 2018-07-24 中国科学院生物物理研究所 基于染色体空间相互作用预测长非编码rna生物学功能的方法
CN108319814B (zh) * 2018-01-29 2018-12-14 中国科学院生物物理研究所 基于染色体空间相互作用预测长非编码rna生物学功能的方法

Also Published As

Publication number Publication date
CN106919809B (zh) 2019-03-01

Similar Documents

Publication Publication Date Title
Gao et al. Genome-wide identification of metal tolerance protein genes in Populus trichocarpa and their roles in response to various heavy metal stresses
Lutter et al. Intronic microRNAs support their host genes by mediating synergistic and antagonistic regulatory effects
Xu et al. Multilign: an algorithm to predict secondary structures conserved in multiple RNA sequences
CN107103205A (zh) 一种基于蛋白质质谱数据注释真核生物基因组的生物信息学方法
CN106295246A (zh) 找到与肿瘤相关的lncRNA并预测其功能
Thodberg et al. Comprehensive profiling of the fission yeast transcription start site activity during stress and media response
CN105243293B (zh) 前列腺相关癌基因信息收集及分析系统和方法
Ling et al. Exploring the evolutionary differences of SBP-box genes targeted by miR156 and miR529 in plants
Chen et al. Small RNAs in angiosperms: sequence characteristics, distribution and generation
CN106919809A (zh) 一种响应逆境胁迫的lncRNAs二级结构功能注释方法
Börlin et al. Saccharomyces cerevisiae displays a stable transcription start site landscape in multiple conditions
Provart et al. Systems approaches to understanding cell signaling and gene regulation
CN106446601A (zh) 一种大规模标注lncRNA功能的方法
CN111808935B (zh) 一种植物内源siRNA转录调控关系的鉴定方法
Harkey et al. A new tool for discovering transcriptional regulators of co-expressed genes predicts gene regulatory networks that mediate ethylene-controlled root development
CN113658643A (zh) 一种基于注意力机制对lncRNA和mRNA的预测方法
CN107085673A (zh) 一种植物响应逆境胁迫的lncRNAs序列模块功能注释方法
Paul et al. Computational prediction of submergence responsive microRNA and their binding position within the genome of Oryza sativa
Wang et al. Transcriptome and miRNAs profiles reveal regulatory network and key regulators of secondary xylem formation in “84K” poplar
CN107609349A (zh) 一种生物分析平台中的项目实施质控系统
CN102206654B (zh) 长叶红砂耐盐特有基因序列Rt-st14173在植物抗盐基因工程中的应用
CN110021361A (zh) 一种基于卷积神经网的miRNA靶基因预测方法
CN117095748B (zh) 一种构建植物miRNA遗传调控通路的方法
CN109371166A (zh) 一种高通量检测植物circRNA等位位点差异表达的方法
Meng et al. MicroRNAs in plant roots: current understanding and future perspectives

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant