CN109545278B - 一种鉴定植物lncRNA与基因互作的方法 - Google Patents

一种鉴定植物lncRNA与基因互作的方法 Download PDF

Info

Publication number
CN109545278B
CN109545278B CN201811549079.8A CN201811549079A CN109545278B CN 109545278 B CN109545278 B CN 109545278B CN 201811549079 A CN201811549079 A CN 201811549079A CN 109545278 B CN109545278 B CN 109545278B
Authority
CN
China
Prior art keywords
plant
population
data
snp
lncrna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811549079.8A
Other languages
English (en)
Other versions
CN109545278A (zh
Inventor
张德强
权明洋
杜庆章
肖亮
卢文杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Forestry University
Original Assignee
Beijing Forestry University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Forestry University filed Critical Beijing Forestry University
Priority to CN201811549079.8A priority Critical patent/CN109545278B/zh
Publication of CN109545278A publication Critical patent/CN109545278A/zh
Priority to US16/579,916 priority patent/US20200194097A1/en
Application granted granted Critical
Publication of CN109545278B publication Critical patent/CN109545278B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/40Population genetics; Linkage disequilibrium
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/178Oligonucleotides characterized by their use miRNA, siRNA or ncRNA
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/30Unsupervised data analysis

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Analytical Chemistry (AREA)
  • Biotechnology (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Ecology (AREA)
  • Physiology (AREA)
  • Mycology (AREA)
  • Botany (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供了一种鉴定植物lncRNA与基因互作的方法,涉及分子遗传学技术领域,包括获得lncRNA与基因的群体SNP基因型数据;获得基因在所研究组织的群体表达量数据;获得目标性状群体表型数据;将群体SNP基因型数据与目标性状群体表型数据关联分析;将群体SNP基因型数据与群体表达量数据关联分析;计算群体SNP基因型数据与所述目标性状群体表型数据的相关性系数r;当同时满足3个限定条件时,表明lncRNA与基因有相互作用,共同影响植物目标性状的表型变异。采用该方法准确检测毛白杨lncRNA LNC‑0052611与基因Pto‑COMT25之间存在互作关系,且该互作关系影响了毛白杨胸径的表型变异。

Description

一种鉴定植物lncRNA与基因互作的方法
技术领域
本发明涉及分子遗传学技术领域,具体涉及一种鉴定植物lncRNA与基因互作的方法。
背景技术
长链非编码RNA(Long non-coding RNA,lncRNA)是指一类没有蛋白质编码功能,且长度大于200nt的具有调控作用的转录本。研究表明,lncRNA可在多个层面调控基因的表达,从而影响植物的生长发育过程,例如水稻花粉育性以及拟南芥光形态建成等。植物的生长发育是一个复杂的、多层次与多基因的联合调控过程,各个遗传因子间的互作方式更是多样化。目前,lncRNA具体的作用机制尚不明确,其与基因互作的研究主要基于碱基互补配对原则,通过顺式(cis)或反式(trans)作用的方式与其靶基因互作,从而在转录水平、转录后水平以及表观遗传水平参与基因的表达调控。
目前,植物lncRNA与基因间的互作,大多仅考虑了两个转录本之间的序列相似性,鉴定的与lncRNA互作的基因存在假阳性;并且预测方式较为单一,并不能准确地检测到与lncRNA互作的功能性基因。因此现有技术缺乏一种准确鉴定植物lncRNA与基因互作的方法。
发明内容
本发明的目的在于提供一种鉴定植物lncRNA与基因互作的方法,采用本发明的方法能够准确地鉴定植物lncRNA与基因的互作关系。
本发明提供了一种鉴定植物lncRNA与基因互作的方法,包括以下步骤:
1)获得植物候选lncRNA与植物候选基因的群体SNP基因型数据;
2)获得植物候选基因在所研究组织的群体表达量数据;
3)对植物目标性状进行表型测定,获得目标性状群体表型数据;
4)将所述步骤1)的群体SNP基因型数据与步骤3)目标性状群体表型数据进行关联分析,确定与植物目标性状显著关联的SNP位点;
所述确定的条件包括:与植物目标性状显著关联的SNP位点同时包含植物候选lncRNA与植物候选基因内的SNP位点;
5)将所述步骤1)的群体SNP基因型数据与步骤2)群体表达量数据进行关联分析,确定与植物候选基因表达水平相关联的SNP位点;
所述确定的条件包括:植物候选lncRNA的SNP位点与候选基因的表达水平显著关联;
6)计算所述步骤1)群体SNP基因型数据与所述步骤3)目标性状群体表型数据的相关性系数r,确定两者之间的相关性;
所述确定的条件包括:所述相关性系数r>0.5或r<-0.5;
所述计算相关性系数r的公式如下所示:
Figure BDA0001910163310000021
其中,X为植物候选基因在所检测的组织中的表达量数据,Y为目标性状群体表型数据;
7)当同时满足所述步骤4)~6)的确定条件时,表明植物候选lncRNA与植物候选基因存在相互作用关系,共同影响植物目标性状的表型变异。
优选的,所述步骤1)植物候选lncRNA与植物候选基因在植物的相同组织表达。
优选的,基于植物全基因组重测序数据获得步骤1)群体SNP基因型数据。
优选的,所述步骤1)植物候选lncRNA与植物候选基因的群体SNP基因型的频率大于10%。
优选的,所述步骤4)关联分析使用的软件为TASSELv5.0。
优选的,所述关联分析使用的模型为混合线性模型。
优选的,所述关联分析的方法包括:
利用软件TASSEL v5.0得到每一SNP位点与表型关联的显著性水平P值;
使用Q-value软件对P值进行FDR多重检测,得到Q值;
筛选P≤0.01,Q≤0.1的SNP位点为植物目标性状显著关联的SNP位点。
优选的,所述步骤1)群体SNP基因型数据的获取方法包括:
对所用自然群体中的个体分别进行全基因组测序,分别获得基因组序列;
将所述基因组序列进行序列比对,获得全基因组基因型SNP数据;
将植物候选lncRNA和植物候选基因,与参考基因组进行比对,结合全基因组基因型SNP数据,获得群体SNP基因型数据。
本发明提供了一种鉴定植物lncRNA与基因互作的方法,先前lncRNA与基因互作关系仅考虑序列相似性,鉴定的与lncRNA互作的基因存在假阳性。且仅通过序列相似性鉴定两者之间的互作关系,缺少生物学意义。因此,本发明利用群体遗传学分析策略,提供了一种鉴定植物lncRNA与基因互作的方法,可以准确检测与lncRNA互作的功能性基因,具有十分重要的生物学意义。
本发明实施例的结果显示:采用本发明提供的方法,得出毛白杨lncRNA LNC-0052611与基因Pto-COMT25之间存在互作关系,且该互作关系影响了毛白杨胸径的表型变异。
附图说明
图1为本发明的鉴定方法的分析流程图。
具体实施方式
本发明提供了一种鉴定植物lncRNA与基因互作的方法,包括以下步骤:
1)获得植物候选lncRNA与植物候选基因的群体SNP基因型数据;
2)获得植物候选基因在所研究组织的群体表达量数据;
3)对植物目标性状进行表型测定,获得目标性状群体表型数据;
4)将所述步骤1)的群体SNP基因型数据与步骤3)目标性状群体表型数据进行关联分析,确定与植物目标性状显著关联的SNP位点;
所述确定的条件包括:与植物目标性状显著关联的SNP位点同时包含植物候选lncRNA与植物候选基因内的SNP位点;
5)将所述步骤1)的群体SNP基因型数据与步骤2)群体表达量数据进行关联分析,确定与植物候选基因表达水平相关联的SNP位点;
所述确定的条件包括:植物候选lncRNA的SNP位点与候选基因的表达水平显著关联;
6)计算所述步骤1)群体SNP基因型数据与所述步骤3)目标性状群体表型数据的相关性系数r,确定两者之间的相关性;
所述确定的条件包括:所述相关性系数r>0.5或r<-0.5;
所述计算相关性系数r的公式如下所示:
Figure BDA0001910163310000041
其中,X为植物候选基因在所检测的组织中的表达量数据,Y为目标性状群体表型数据;
7)当同时满足所述步骤4)~6)的确定条件时,表明植物候选lncRNA与植物候选基因存在相互作用关系,共同影响植物目标性状的表型变异。
本发明获得植物候选lncRNA与植物候选基因的群体SNP基因型数据。
本发明对所述植物的种类没有特殊限定,在本发明实施例中,所述植物优选为毛白杨。
在本发明中,所述植物候选lncRNA与植物候选基因优选在植物的相同组织表达。在本发明中,植物候选lncRNA与植物候选基因的群体SNP基因型的频率优选大于10%。
本发明优选基于植物全基因组重测序数据获得群体SNP基因型数据。在本发明中,所述群体SNP基因型数据的获取方法优选包括:对所用自然群体中的个体分别进行全基因组测序,分别获得基因组序列;将所述基因组序列进行序列比对,获得全基因组基因型SNP数据;将植物候选lncRNA和植物候选基因,与参考基因组进行比对,结合全基因组基因型SNP数据,获得群体SNP基因型数据。在本发明中,所述比对使用的软件优选为Bioedit。在本发明中,所述参考基因优选为该植物公开发表的基因组即可。本发明首先通过全基因组重测序,该基因组上每一个SNP位点在基因组上都有固定位置。其次,通过序列比对,可以确定这两个候选基因(lncRNA与候选基因)在参考基因组中的位置。因此,根据候选基因在基因组中的位置,即可确定候选基因内的SNP数据。
本发明优选对所用自然群体中的个体分别进行全基因组测序,分别获得基因组序列。本发明对所述全基因组测序的方法没有特殊限定,采用常规测序方法即可。
本发明将所述基因组序列进行序列比对,获得全基因组基因型SNP数据。本发明对所述序列比对的方法没有特殊限定,采用常规序列比对的方法即可。
本发明将植物候选lncRNA和植物候选基因,与参考基因组进行比对,结合全基因组基因型SNP数据,获得群体SNP基因型数据。
本发明获得植物候选基因在组织的群体表达量数据。本发明对所述植物候选基因在组织的群体表达量数据的获取方法没有特殊限定,采用常规获取组织的群体表达量数据的方法即可。在本发明中,所述组织优选为某一特定组织。在本发明中,所述植物候选基因在群体中所表达的组织优选与,植物候选lncRNA与植物候选基因所表达的组织一致。本发明对所述组织没有特殊限定,植物的任意组织即可。
本发明对植物目标性状进行表型测定,获得目标性状群体表型数据。本发明对所述植物目标性状进行表型测定的方法没有特殊限定,采用常规方法即可。本发明对所述目标性状没有特殊限定,植物的任何性状即可。
本发明将所述群体SNP基因型数据与目标性状群体表型数据进行关联分析,确定与植物目标性状显著关联的SNP位点;所述确定的条件包括:与植物目标性状显著关联的SNP位点同时包含植物候选lncRNA与植物候选基因内的SNP位点。在本发明中,所述关联分析使用的软件优选为TASSEL v5.0;所述关联分析使用的模型优选为混合线性模型。在本发明中,所述关联分析的方法优选包括:利用软件TASSEL v5.0得到每一SNP位点与表型关联的显著性水平P值;使用Q-value软件对P值进行FDR多重检测,得到Q值;筛选P≤0.01,Q≤0.1的SNP位点为植物目标性状显著关联的SNP位点。在本发明中,所述多重检测,得到Q值的目的是为了排出假阳性。在本发明中,得到的显著关联的SNP位点需同时包含来自植物候选lncRNA与植物候选基因内的SNP位点,但对SNP位点的个数以及属性不受限制。
本发明将所述群体SNP基因型数据与群体表达量数据进行关联分析,确定与植物候选基因表达水平相关联的SNP位点;所述确定的条件包括:植物候选lncRNA的SNP位点与候选基因的表达水平显著关联。在本发明中,所述群体SNP基因型数据与群体表达量数据进行关联分析的方法同群体SNP基因型数据与目标性状群体表型数据进行关联分析方法,在此不再赘述。在本发明中,所述植物候选lncRNA内的SNP位点需要与植物候选基因的表达水平显著相关,但对SNP位点的个数以及属性不受限制。
本发明计算所述群体SNP基因型数据与所述目标性状群体表型数据的相关性系数r,确定两者之间的相关性;所述确定的条件包括:所述相关性系数r>0.5或r<-0.5;所述计算相关性系数r的公式如下所示:
Figure BDA0001910163310000061
其中,X为植物候选基因在所检测的组织中的表达量数据,Y为目标性状群体表型数据。
在本发明中,所述相关性系数r>0.5或r<-0.5,为两者具有较强的相关性,表明植物候选基因的表达水平可在很大程度上影响目标性状的变异;所述相关性系数r值的区间在-0.5~0.5,表明两者表达的相关性较低。
在本发明中,当同时满足所述步骤4)~6)的确定条件时,表明植物候选lncRNA与植物候选基因存在相互作用关系,共同影响植物目标性状的表型变异。在本发明中,所述植物候选lncRNA与植物候选基因之间的互作预选是以调控所选的目标性状为前提条件。
下面结合具体实施例对本发明所述的一种鉴定植物lncRNA与基因互作的方法做进一步详细的介绍,本发明的技术方案包括但不限于以下实施例。
实施例1
使用本发明提供的一种鉴定植物lncRNA与基因互作的方法,对毛白杨lncRNALNC-0052611与基因Pto-COMT25之间的相互作用进行鉴定。
步骤S1,lncRNA LNC-0052611与基因Pto-COMT25在毛白杨自然群体的SNP基因型数据,具体步骤如下:
步骤S11,以种植于山东省冠县的一年生毛白杨无性系“LM50”为实验材料,采集其成熟木质部作为转录组测序的待测组织,为防止RNA降解,采集完后立即放入液氮环境(-196℃)中保存。利用Plant Qiagen RNAeasy kit(Qiagen China,Shanghai,China)试剂盒对采集的成熟木质部的RNA进行提取,质量评估之后交由生物公司进行lncRNA与转录组测序,检测在该组织表达的lncRNA与mRNA。选取在该组织表达的lncRNA LNC-0052611与基因Pto-COMT25作为候选遗传因子,对两者之间是否存在互作关系进行进一步分析。
步骤S12,首先,选取毛白杨自然群体中435株个体,提取基因组DNA用于重测序,以毛白杨的近缘物种毛果杨的基因组作为参考基因组进行序列比对,获得全基因组SNP数据。其次,利用bioedit软件,将毛白杨lncRNA LNC-0052611与基因Pto-COMT25的序列与参考基因组进行序列比对,提取候选遗传因子群体SNP基因型数据。最后,筛选SNP基因型频率大于10%的位点作为毛白杨lncRNA LNC-0052611与基因Pto-COMT25的候选SNP,候选SNP详细信息详见表1。
表1 LncRNA LNC-0052611与基因Pto-COMT25内SNP信息
Figure BDA0001910163310000071
Figure BDA0001910163310000081
Figure BDA0001910163310000091
Figure BDA0001910163310000101
步骤2,收集毛白杨自然群体中435株个体的成熟木质部,对其RNA分别进行提取,交由生物公司进行转录组测序,获得所有毛白杨木质部表达的基因在群体中的表达丰度,从中提取候选基因Pto-COMT25在群体中每一个体的表达量。
步骤3,利用生长性状测定工具,对毛白杨自然群体中435株个体的胸径指标进行测定,获得该指标在该群体中的表型数据。
步骤4,利用TASSEL v5.0软件中的混合线性模型,将lncRNA LNC-0052611与基因Pto-COMT25内的SNP与毛白杨胸径指标进行关联分析,检测与毛白杨胸径显著关联的SNP位点,确定与植物目标性状显著关联的SNP位点,所述确定的条件包括:与植物目标性状显著关联的SNP位点同时包含植物候选lncRNA与植物候选基因内的SNP位点。结果发现lncRNALNC-0052611内SNP7与Pto-COMT25内的SNP45和SNP61与胸径性状显著关联(表2)。
表2候选遗传因子内SNP与毛白杨胸径性状关联分析结果
Figure BDA0001910163310000111
步骤5,同样利用TASSEL v5.0软件中的混合线性模型,将lncRNA内的SNP与Pto-COMT25的群体表达水平进行关联分析,筛选与Pto-COMT25显著相关的SNP位点,筛选的条件包括:植物候选lncRNA的SNP位点与候选基因的表达水平显著关联。分析发现,lncRNA LNC-0052611内SNP2、SNP6、SNP7和SNP11与Pto-COMT25的表达水平显著相关(表3),表明LNC-0052611可在一定程度上影响Pto-COMT25的表达。
表3 LNC-0052611内SNP与Pto-COMT25的表达水平关联分析结果
性状 SNP位点 P值 Q值
Pto-COMT25表达水平 SNP2 3.52×10<sup>-5</sup> 0.022
Pto-COMT25表达水平 SNP6 6.68×10<sup>-4</sup> 0.034
Pto-COMT25表达水平 SNP7 1.62×10<sup>-3</sup> 0.052
Pto-COMT25表达水平 SNP11 1.72×10<sup>-3</sup> 0.053
步骤6,利用相关性系数计算公式,公式如下:
Figure BDA0001910163310000121
其中,X为植物候选基因在所检测的组织中的表达量数据,Y为目标性状群体表型数据。将Pto-COMT25在群体中的表达量与该群体胸径性状的相关性系数进行分析,结果发现,两者的相关性系数为r=0.553,表明Pto-COMT25的表达水平可在一定程度上影响毛白杨胸径性状的变异。
步骤7,综合考虑步骤4-6的计算结果。步骤4的关联结果发现lncRNA LNC-0052611与Pto-COMT25内的SNP位点对毛白杨胸径性状的变异具有显著的遗传效应,表明LNC-0052611与Pto-COMT25可能会影响毛白杨胸径的大小;步骤5的分析结果表明,LNC-0052611可能会调控Pto-COMT25的表达;步骤6的研究结果表明,Pto-COMT25的表达水平可在一定程度上影响毛白杨胸径性状的变异。综合以上三点表明,lncRNA LNC-0052611与基因Pto-COMT25之间存在互作关系,且该互作关系影响了毛白杨胸径性状的变异。
由以上可以得出,毛白杨lncRNA LNC-0052611与基因Pto-COMT25之间存在互作关系,且该互作关系影响了毛白杨胸径的表型变异。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (8)

1.一种鉴定植物lncRNA与基因互作的方法,其特征在于,包括以下步骤:
1)获得植物候选lncRNA与植物候选基因的群体SNP基因型数据;
2)获得植物候选基因在所研究组织的群体表达量数据;
3)对植物目标性状进行表型测定,获得目标性状群体表型数据;
4)将所述步骤1)的群体SNP基因型数据与步骤3)目标性状群体表型数据进行关联分析,确定与植物目标性状显著关联的SNP位点;
所述确定的条件包括:与植物目标性状显著关联的SNP位点同时包含植物候选lncRNA与植物候选基因内的SNP位点;
5)将所述步骤1)的群体SNP基因型数据与步骤2)群体表达量数据进行关联分析,确定与植物候选基因表达水平相关联的SNP位点;
所述确定的条件包括:植物候选lncRNA的SNP位点与候选基因的表达水平显著关联;
6)计算所述步骤1)群体SNP基因型数据与所述步骤3)目标性状群体表型数据的相关性系数r,确定两者之间的相关性;
所述确定的条件包括:所述相关性系数r>0.5或r<-0.5;
所述计算相关性系数r的公式如下所示:
Figure FDA0002459064870000011
其中,X为植物候选基因在所检测的组织中的表达量数据,Y为目标性状群体表型数据;
7)当同时满足所述步骤4)~6)的确定条件时,表明植物候选lncRNA与植物候选基因存在相互作用关系,共同影响植物目标性状的表型变异。
2.根据权利要求1所述的方法,其特征在于,所述步骤1)植物候选lncRNA与植物候选基因在植物的相同组织中表达。
3.根据权利要求1所述的方法,其特征在于,基于植物全基因组重测序数据获得步骤1)群体SNP基因型数据。
4.根据权利要求1所述的方法,其特征在于,所述步骤1)植物候选lncRNA与植物候选基因的群体SNP基因型的频率大于10%。
5.根据权利要求1所述的方法,其特征在于,所述步骤4)关联分析使用的软件为TASSELv5.0。
6.根据权利要求1或5所述的方法,其特征在于,所述关联分析使用的模型为混合线性模型。
7.根据权利要求6所述的方法,其特征在于,所述关联分析的方法包括:
利用软件TASSEL v5.0得到每一SNP位点与表型关联的显著性水平P值;
使用Q-value软件对P值进行FDR多重检测,得到Q值;
筛选P≤0.01,Q≤0.1的SNP位点为植物目标性状显著关联的SNP位点。
8.根据权利要求1或3所述的方法,其特征在于,所述步骤1)群体SNP基因型数据的获取方法包括:
对所用自然群体中的个体分别进行全基因组测序,分别获得基因组序列;
将所述基因组序列进行序列比对,获得全基因组基因型SNP数据;
将植物候选lncRNA和植物候选基因,与参考基因组进行比对,结合全基因组基因型SNP数据,获得群体SNP基因型数据。
CN201811549079.8A 2018-12-18 2018-12-18 一种鉴定植物lncRNA与基因互作的方法 Active CN109545278B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201811549079.8A CN109545278B (zh) 2018-12-18 2018-12-18 一种鉴定植物lncRNA与基因互作的方法
US16/579,916 US20200194097A1 (en) 2018-12-18 2019-09-24 METHOD FOR IDENTIFYING PLANT IncRNA AND GENE INTERACTION

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811549079.8A CN109545278B (zh) 2018-12-18 2018-12-18 一种鉴定植物lncRNA与基因互作的方法

Publications (2)

Publication Number Publication Date
CN109545278A CN109545278A (zh) 2019-03-29
CN109545278B true CN109545278B (zh) 2020-07-28

Family

ID=65855172

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811549079.8A Active CN109545278B (zh) 2018-12-18 2018-12-18 一种鉴定植物lncRNA与基因互作的方法

Country Status (2)

Country Link
US (1) US20200194097A1 (zh)
CN (1) CN109545278B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111863127B (zh) * 2020-07-17 2023-06-16 北京林业大学 一种构建植物转录因子对靶基因遗传调控网络的方法
CN112102878B (zh) * 2020-09-16 2024-01-26 张云鹏 一种LncRNA学习系统
CN112599191A (zh) * 2020-12-28 2021-04-02 深兰科技(上海)有限公司 数据关联分析方法、装置、电子设备及存储介质
CN113140255B (zh) * 2021-04-19 2022-05-10 湖南大学 一种预测植物lncRNA-miRNA相互作用的方法
CN113947149B (zh) * 2021-10-19 2022-08-23 大理大学 基因模块群的相似性度量方法、装置、电子设备及存储介质
CN117133354B (zh) * 2023-08-29 2024-06-14 北京林业大学 一种高效鉴定林木关键育种基因模块的方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106997429A (zh) * 2017-02-17 2017-08-01 北京林业大学 一种林木长片段非编码rna靶基因的预测方法
CN107653309A (zh) * 2017-08-30 2018-02-02 广东省心血管病研究所 Mir135hg在调控心血管系统中的应用
CN108004302A (zh) * 2017-12-12 2018-05-08 中国农业科学院麻类研究所 一种转录组参考的关联分析方法及其应用
CN108517368A (zh) * 2017-04-21 2018-09-11 北京林业大学 利用上位性解析毛白杨LncRNA Pto-CRTG及其靶基因Pto-CAD5互作关系的方法及系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10457956B2 (en) * 2014-12-31 2019-10-29 University Of Tennessee Research Foundation SCN plants and methods for making the same
CN106326689A (zh) * 2015-06-25 2017-01-11 深圳华大基因科技服务有限公司 确定群体中受到选择作用的位点的方法和装置
CN106191301B (zh) * 2016-09-23 2019-11-12 中国农业科学院深圳生物育种创新研究院 一种水稻基因快速精细定位的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106997429A (zh) * 2017-02-17 2017-08-01 北京林业大学 一种林木长片段非编码rna靶基因的预测方法
CN108517368A (zh) * 2017-04-21 2018-09-11 北京林业大学 利用上位性解析毛白杨LncRNA Pto-CRTG及其靶基因Pto-CAD5互作关系的方法及系统
CN107653309A (zh) * 2017-08-30 2018-02-02 广东省心血管病研究所 Mir135hg在调控心血管系统中的应用
CN108004302A (zh) * 2017-12-12 2018-05-08 中国农业科学院麻类研究所 一种转录组参考的关联分析方法及其应用

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
《利用90k芯片技术进行小麦穗部性状QTL定位》;武炳瑾、张德强等;《作物学报》;20170406;全文 *
《小麦周8425B及其衍生品种与黄淮麦区主栽品种的遗传解析》;张德强、宋晓朋等;《麦类作物学报》;20160928;全文 *

Also Published As

Publication number Publication date
CN109545278A (zh) 2019-03-29
US20200194097A1 (en) 2020-06-18

Similar Documents

Publication Publication Date Title
CN109545278B (zh) 一种鉴定植物lncRNA与基因互作的方法
CN112322753B (zh) 与猪肉肌内脂肪相关的snp分子标记及其应用
CN111863127A (zh) 一种构建植物转录因子对靶基因遗传调控网络的方法
CN111088382B (zh) 一种玉米全基因组snp芯片及其应用
WO2022165853A1 (zh) 一种大豆snp分型检测芯片及其在分子育种与基础研究中的应用
CN109337997B (zh) 一种山茶属多态性叶绿体基因组微卫星分子标记引物及筛选和甄别近缘种的方法
CN112289384A (zh) 一种柑橘全基因组kasp标记库的构建方法及应用
CN110846429A (zh) 一种玉米全基因组InDel芯片及其应用
CN108517368B (zh) 利用上位性解析毛白杨LncRNA Pto-CRTG及其靶基因Pto-CAD5互作关系的方法及系统
CN115678979A (zh) 菠萝液相芯片及其应用
CN117133354B (zh) 一种高效鉴定林木关键育种基因模块的方法
CN112233722B (zh) 品种鉴定的方法、其预测模型的构建方法和装置
CN109762922A (zh) 用于菜豆种质资源鉴定的snp标记及其筛选方法
CN105907860B (zh) 一种利用|Δ(SNP-index)|进行性状定位的QTL-seq方法及其应用
CN116814805A (zh) 一个杜洛克猪全基因组低密度snp芯片及其制备方法和应用
CN115141893A (zh) 包含7个分子标记的预测猕猴桃果实干物质含量的分子标记组及其应用和试剂盒
CN111684113B (zh) 水稻绿色基因芯片与应用
CN111798922A (zh) 基于重测序数据中多态性位点密度鉴定小麦育种的基因组选择利用区间的方法
CN112102880A (zh) 品种鉴定的方法、其预测模型的构建方法和装置
CN117095748B (zh) 一种构建植物miRNA遗传调控通路的方法
CN112837746A (zh) 用于小麦外显子测序基因定位的探针设计方法及定位方法
CN117587159B (zh) 一种辣椒snp分子标记组合、snp芯片及其应用
CN112391482B (zh) 与猪肉电导率相关的snp分子标记及其应用
CN117265139B (zh) 一种萨福克羊体重相关snp标记及其筛选方法与应用
CN117210596B (zh) 一种甜瓜snp位点标记组合、检测snp位点标记探针组合、液相芯片及应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant