CN116397008A - 一种油松年龄标记基因PtMADS26的筛选鉴定方法与应用 - Google Patents

一种油松年龄标记基因PtMADS26的筛选鉴定方法与应用 Download PDF

Info

Publication number
CN116397008A
CN116397008A CN202211367270.7A CN202211367270A CN116397008A CN 116397008 A CN116397008 A CN 116397008A CN 202211367270 A CN202211367270 A CN 202211367270A CN 116397008 A CN116397008 A CN 116397008A
Authority
CN
China
Prior art keywords
age
gene
ptmads26
genes
screening
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211367270.7A
Other languages
English (en)
Inventor
林金星
张莹莹
张曦
沈微微
胡子建
洪岩铭
杨舜垚
许会敏
钮世辉
沈应柏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Forestry University
Original Assignee
Beijing Forestry University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Forestry University filed Critical Beijing Forestry University
Priority to CN202211367270.7A priority Critical patent/CN116397008A/zh
Publication of CN116397008A publication Critical patent/CN116397008A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/13Plant traits
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/166Oligonucleotides used as internal standards, controls or normalisation probes
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Immunology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Botany (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Mycology (AREA)
  • Artificial Intelligence (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Medicinal Chemistry (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种油松年龄标记基因PtMADS26的筛选鉴定方法与应用,涉及林木育种技术领域。本发明基于加权共表达网络分析筛选和鉴定到油松年龄标记基因PtMADS26,进一步通过实时荧光定量分析实验检测PtMADS26在不同年龄油松中的表达模式,并测定其在反复截顶和未截顶油松中的表达水平,从而确定其参与油松成熟态向幼年态的调控。本发明通过共表达网络分析为挖掘树木年龄标记基因及互作关系预测提供了新的思路,在克服多年生树木成熟效应,促进无性繁殖,缩短育种年限方面具有重要意义。

Description

一种油松年龄标记基因PtMADS26的筛选鉴定方法与应用
技术领域
本发明属于林木育种技术领域,具体涉及一种油松年龄标记基因PtMADS26的筛选鉴定方法与应用。
背景技术
与一年生植物不同,木本植物生命周期漫长、营养生长时间长,许多多年生木本植物特别是针叶树在开始繁殖之前,都会经历一段较长的幼年期。油松(Pinustabuliformis)需要5~7年才能渡过漫长的幼年期,严重阻碍了其繁育和育种的进程,通过有性繁殖的方式难以实现快速遗传育种、品种改良及繁育造林。近些年,以细胞全能性为基础的无性繁殖以其遗传增益显著、育种周期短、成本低、便于集约化经营等优势在松树类树种的繁殖中得以广泛应用。然而,随着年龄的增加,成熟树木在幼年期的优势特征,尤其是良好的再生能力逐渐丧失。这种成熟老化效应给油松的无性繁育带来各种难题,难以实现优良基因型的规模化繁育。
目前,已有许多方法可以实现松树类树种由成熟态向幼年态的逆转,如嫩枝扦插、连续组培、重复嫁接、截顶促萌、反复平茬、生长调节剂处理等,但成活率仍然较低且大多数是从生理层面进行调控。近些年,多项研究表明幼树和老树在分子水平存在较大的差异,与植物年龄相关的分子标记也不断被发现。在被子植物中,已经揭示了主要由microRNAs(miRNAs)介导的衰老途径影响了幼年向成年阶段的转变。其中,miR156和miR172已被确定为关键的调控因子,miR156在幼苗中积累到较高水平,在发育过程中其表达水平逐渐下降,而miR172则呈现出相反的表达模式。与年龄相关的miR156和miR172的信号通路具有保守性,在多年生阔叶树中也存在相似表达模式。在针叶树中,研究人员发现挪威云杉(Piceaabies)中MADS-box家族基因DAL1的表达随着年龄的增长而增加,这与被子植物中miR172的表达相似,DAL1已被认为可能是介导幼年向成年转变的中介。在油松中研究发现DAL1和MADS11通过物理相互作用协调衰老途径,并且鉴定了6个SOC1-like转录因子,且所有SOC-like基因均表现出年龄依赖表达模式。由此可见,筛选分子水平的标记物可以从分子水平为油松成熟态向幼年态的逆转提供理论指导。
林木特别是油松基因组复杂庞大、营养生长期长、遗传转化费力等原因严重阻碍了利用遗传学方法进行功能基因组研究。随着基因组检测水平的不断发展,高通量、快速、低成本的转录组测序技术成为挖掘新基因并分析预测其调控网络的重要手段,但是传统的转录组数据分析方法已不能满足对大样本、高维度的复杂的海量组学数据的分析需求,在样本构成复杂的情况下,差异分析或趋势分析无法对基因进行高效、简洁的分类。
发明内容
有鉴于此,本发明的目的在于提供一种油松年龄标记基因PtMADS26的筛选鉴定方法与应用,对油松大量且复杂的转录组数据进行精准且全面的揭示和分析,并快速找到油松年龄标记基因PtMADS26,且能预测其与其他基因间的互作关系,并将其应用到树木的无性繁育中。
为了实现上述发明目的,本发明提供以下技术方案:
本发明提供了一种油松年龄标记基因PtMADS26的筛选鉴定方法,包括以下步骤:(1)对不同年龄段油松进行转录组测序,初步筛选油松年龄差异基因集,对年龄差异基因集进行筛选,得候选年龄基因;所述筛选的方法包括WGCNA分析、GO功能富集分析和/或UMAP降维分析;
(2)对所述候选年龄基因进行表达模式分析,获得油松年龄标记基因PtMADS26。
优选的,步骤(1)中利用不同年龄油松的基部维管形成层提取总RNA,并进行转录组测序。
优选的,步骤(1)所述筛选,包括:使用R软件包WGCNA对年龄差异基因集进行WGCNA分析,构建加权共表达网络,将与年龄高相关性聚类模块作为年龄特异性模块;使用油松OrgDb包org.Pt.eg.db和R软件包clusterProfiler对年龄特异性模块基因进行GO功能富集分析,筛选年龄特异性模块中参与调控年龄及衰老相关通路的基因,进一步根据模块内基因的连通性,分析挖掘模块中核心基因;
和/或,使用R软件包对模块中核心基因降维聚类,分析模块中核心基因对年龄的聚类情况。
本发明还提供了利用上述筛选鉴定方法得到的年龄标记基因PtMADS26,所述基因PtMADS26的核苷酸序列如SEQ ID NO.1所示。
本发明还提供了一种检测上述基因PtMADS26的引物组,所述引物组包括正向引物和反向引物,其中正向引物的核苷酸序列如SEQ ID NO.2所示,反向引物的核苷酸序列如SEQ ID NO.3所示。
优选的,还包括内参基因,所述内参基因包括18sRNA;
针对18sRNA设计的正向引物的核苷酸序列如SEQ ID NO.4所示,反向引物的核苷酸序列如SEQ ID NO.5所示。
本发明还提供了上述基因PtMADS26在构建年龄相关潜在互作网络中的应用。
优选的,所述互作网络包括年龄特异性模块相关基因。
本发明还提供了上述基因PtMADS26在树木幼嫩或老化程度鉴定中的应用。
本发明还提供了一种树木幼嫩或老化程度的鉴定方法,包括检测上述基因PtMADS26在样本中的表达量。
有益效果:本发明提供了一种油松年龄标记基因PtMADS26的筛选鉴定方法,利用基于加权共表达网络分析的筛选鉴定方法,与传统的转录组数据分析方法相比可以对油松复杂且庞大的基因组水平的数据进行降维分析,从海量的数据中快速、准确筛选年龄分子标记物,并预测其与其他基因间的相互作用关系。
本发明从分子水平提供了年龄标记基因PtMADS26,可用于树木幼嫩或老化程度的鉴定,从而确定更为幼嫩,再生能力更强的无性繁殖材料,从分子层面为树木的无性繁殖提供更科学、更合理的理论指导。
附图说明
图1为WGCNA分析,其中A是模块-年龄相关性,B是不同软阈值下的网络拓扑分析,C是WGCNA模块聚类树状图;
图2为年龄模块特异性基因GO富集分析;
图3为油松年龄核心基因UMAP聚类降维分析;
图4为油松年龄核心基因表达聚类热图;
图5为油松不同年龄样本中PtMADS26的表达模式;
图6为PtMADS26的结构域预测;
图7为PtMADS26和年龄特异性模块中其他编码转录因子基因潜在互作网络;
图8为反复截顶的4年生油松;
图9为反复截顶前后PtMADS26基因的表达水平。
具体实施方式
本发明提供了一种油松年龄标记基因PtMADS26的筛选鉴定方法,包括以下步骤:(1)对不同年龄段油松进行转录组测序,初步筛选油松年龄差异基因集,对年龄差异基因集进行筛选,得候选年龄基因;所述筛选的方法包括WGCNA分析、GO功能富集分析和/或UMAP降维分析;
(2)对所述候选年龄基因进行表达模式分析,获得油松年龄标记基因PtMADS26。
本发明对不同年龄段油松进行转录组测序,初步筛选油松年龄差异基因集,对年龄差异基因集进行筛选,得候选年龄基因;所述筛选的方法包括WGCNA分析、GO功能富集分析和/或UMAP降维分析。本发明所述不同年龄的油松,优选包括长势良好,且来自同一地理位置、具有一致的组织朝向且属于同一家系的油松,从中提取基部维管形成层的总RNA,用来构建转录组文库并测序。本发明优选1-3、4-9、10-15、17-22、45-50、55-60、70-90、110-130年生的油松,优选为2,3,4,7,13,20,46,55,123年生的油松。本发明所述基部维管形成层是指树木自基部至顶端4%-10%高度处的维管形成层。
本发明在进行所述转录组测序后,优选还包括对数据质控和过滤,具体的包括:使用软件FastQC,对测序数据的各个质控点,包括总reads数,总碱基数,reads最大长度,reads平均长度,各个位置的碱基质量值(Q20\Q30)分布,ATCG四种碱基的比例,GC含量等进行质量监测。利用SOAPnuke软件过滤质量评分低的片段,N含量高的碱基片段以及接头adapter片段等,得到高质量的cleandata,用于后续分析;而后比对和基因的表达定量:使用Kallisto软件构建油松cDNA序列索引,采用pseudo-alignment算法,根据reads的kmer特征对基因表达进行丰度统计,获得油松年龄基因表达谱;然后进行差异基因分析及筛选:使用R包DEseq2计算油松各不同年龄样本中基因的表达情况、差异倍数log2FoldChange、p-value值及FDR校正值等参数,设置筛选阈值以获得显著差异基因集。本发明所述差异基因筛选的阈值为|log2FoldChange|>1,且P<0.001。
本发明对年龄差异基因集进行筛选,所述筛选优选包括:使用R软件包WGCNA对年龄差异基因集进行WGCNA分析,构建加权共表达网络,将与年龄龄高相关性聚类模块作为年龄特异性模块;使用油松OrgDb包org.Pt.eg.db和R软件包clusterProfiler对年龄特异性模块基因进行GO功能富集分析,筛选年龄特异性模块中参与调控年龄及衰老相关通路的基因,根据模块内基因的连通性,分析挖掘模块中核心基因;和/或,使用R软件包对模块中核心基因降维聚类,分析模块中核心基因对年龄的聚类情况。
本发明所称WGCNA是用来描述不同样品之间基因关联模式的系统生物学方法,利用基因表达矩阵来构建无尺度共表达网络,其工作原理和参数设定优选参考SoftwareWGCNA:an R package for weighted correlation network analysis(Peter langfelderand Steve Horvath,BMC Bioinformatics,2008)。为了关联模块基因与外部因素,用基因显著性(gene significance,GS)来衡量模块基因与外部表型性状的关联程度,GS越高表示基因与外部表型越相关,越具有生物学意义,GS=0,说明这个基因不参与所研究的生物学问题。
本发明在构建基因共表达网络后,优选还包括对各模块与年龄样本进行相关性分析,更优选包括将所有样本的树龄数值形成外部表型数据,计算各聚类模块的ME值与年龄表型数据相关性r值和p值,根据r值和p值确定年龄特异性模块。本发明所述相关性r值优选大于0.8,包括0.8~1之间的任意数值。
本发明所述GO功能富集分析优选包括使用油松OrgDb包org.Pt.eg.db和R软件包clusterProfiler对年龄特异性模块基因进行GO富集,筛选显著富集p<0.05且编码参与调控年龄及衰老的转录因子基因和/或模块中连通性2%~5%的基因作为核心基因。本发明所述参与调控年龄及衰老的转录因子优选包括MYB、bHLH、SPL、NAC、AP2、MADS-box家族转录因子,更优选为MADS-box家族。
本发明所述UMAP降维分析优选为使用R软件包umap和/或uwot对核心基因降维聚类,分析这些核心基因对年龄的聚类情况。本发明优选通过荧光定量PCR的方法,检测不同年龄样本的表达量水平变化。
本发明还提供了利用上述筛选鉴定方法得到的年龄标记基因PtMADS26,所述基因PtMADS26的核苷酸序列如SEQ ID NO.1所示。本发明所述基因PtMADS26的氨基酸序列优选如SEQ ID NO.10所示。
本发明还提供了一种检测上述基因PtMADS26(Pt1G04940.1)的引物组,所述引物组包括正向引物和反向引物,其中正向引物的核苷酸序列如SEQ ID NO.2所示,反向引物的核苷酸序列如SEQ ID NO.3所示。
本发明所述引物组优选还包括内参基因,所述内参基因包括18sRNA。本发明所述引物组的核苷酸序列优选如下所示:
18sRNA-F(SEQ ID NO.4):CGGCTACCACATCCAAGGAA
18sRNA-R(SEQ ID NO.5):GCTGGAATTACCGCGGCT
Pt1G04940-F(SEQ ID NO.2):AACGGTGAGGGGAAAAACCC
Pt1G04940-R(SEQ ID NO.3):GCTTCCCTCTTGGGGAGAAA
本发明还提供了上述基因PtMADS26在构建年龄相关潜在互作网络中的应用。
优选的,所述互作网络包括年龄特异性模块相关基因,更优选为年龄特异性模块中编码转录因子的基因。
本发明还提供了上述基因PtMADS26在树木幼嫩或老化程度鉴定中的应用。
在本发明实施例中,分别检测油松反复截顶和未截顶样本中PtMADS26的表达量,确定树木幼嫩或老化程度。本发明所述反复截顶油松是指在树木基部至顶端80%-90%高度处截断,当萌发新枝条后,在高于第一次截顶处1-3cm处再次截断,如此反复3-5次。结果显示,油松反复截顶样本中PtMADS26的表达量显著低于未截顶样本,故反复截顶油松更为幼嫩,更适用于作为后续无性繁殖材料。
本发明还提供了一种树木幼嫩或老化程度的鉴定方法,包括检测上述基因PtMADS26在样本中的表达量。
本发明优选采用荧光定量PCR的方法鉴定所述基因PtMADS26的表达量,且在配置荧光定量PCR扩增体系时,以油松各年龄样本的cDNA序列为模板,配制20μL体系,优选包括:2×SuperReal PreMix Plus(SYBR Green)10μL、Forward Primmer 0.8μL、Revers Primmer0.8μL、cDNA 1μL和余量的RNase-free Water。
本发明所述荧光定量PCR优选在Bio-Rad公司的CFX Connect Optics Module荧光定量PCR仪进行,并设定程序:95℃2min;95℃5s,60℃30s,39循环;95℃5s;溶解曲线65℃-95℃,每5s增加0.5℃。
利用本发明所述年龄标记基因,可应用于筛选鉴定方法及树木幼嫩或老化程度,具体的包括挖掘潜在年龄标记基因及其互作关系;和或,克服成熟效应,恢复和/或维持和/鉴定树木的幼嫩状态;和或,从分子层面提供理论依据,促进树木无性繁育,缩短育种年限。
下面结合实施例对本发明提供的一种油松年龄标记基因PtMADS26的筛选鉴定方法与应用进行详细的说明,但是不能把它们理解为对本发明保护范围的限定。
实施例1
油松年龄标记基因PtMADS26及其筛选鉴定
主要试剂
RNA提取试剂盒:品牌:TIANGEN,品名:RNAprep Pure Plant Kit试剂盒,货号:DP441;
反转录试剂盒:品牌:TIANGEN,品名:TransScript One-Step gDAN Removal andcDNA Synthesis SuperMix TransScript试剂盒,货号:AT311-03;
qPCR试剂盒:品牌:TIANGEN,品名:SuperReal PreMix Plus(SYBR Green),货号:FP205-02。
主要仪器
转录组测序北京诺禾致源科技股份有限公司使用Illumina公司的IlluminaNovaSeq 6000型二代测序仪完成;
荧光定量使用Bio-Rad公司的CFX Connect Optics Module荧光定量PCR仪,型号为CFX Connect Optics Module。
1、年龄样本取样:用刨刀和锤子刨取2、3、4、7、13、20、46、55和123年生油松朝阳方向且相同位置的胸径高度处高约6cm的倒三角形样块,用双面刀片和/或单面刀片刮取维管形成层,快速移至液氮中冷冻。取样结束后在伤口处涂抹愈伤膏,促进伤口愈合、隔离病菌侵染。所选取的不同年龄的油松需在相同的地理位置、组织朝向一致、来源于同一家系且长势良好。
2、油松年龄差异基因集的筛选
(1)油松年龄样本转录组测序
用Trizol法提取油松各不同年龄样本中的总RNA,进行cDNA文库构建,质检合格后,使用Illumina高通量测序平台NovaSeq 6000进行测序后获得178.83GB的原始数据。
(2)数据质控和过滤
使用软件FastQC对原始数据进行质量检测,结果显示,平均碱基测序错误率为0.03%,Q20%和Q30%的碱基百分比在93%~98%左右,GC碱基含量均超过40%;通过软件SOAPnuke过滤质量评分低的片段,碱基N的比例大于10%的reads以及adapter片段等,最终获得172.71GB的高质量的cleandata。
(3)比对和基因表达定量
使用软件Kallisto中的index命令对油松基因组cDNA序列构建索引,通过quant命令,根据reads的kmer特征值将其比对到参考序列上,进一步得到不同年龄样本中表达基因的readcount数目,其中-b参数设置为100,其他均为默认值。同时,为了摒除了测序深度和基因长度对fragments计数的影响,将readcount数目转换为TPM值,即每千个碱基的转录每百万映射读取片段数,最终获得油松年龄基因表达谱。
(4)差异基因分析及筛选
使用R软件包DEseq2对年龄样本分别两两比对进行基因差异表达分析,由于样本和差异基因较多,进一步提高筛选标准,以|log2FoldChange|>2,且p-value<0.001为阈值筛选显著性差异基因。将所有两两样本对比获得的显著性差异基因取并集,去除可变剪接转录本,得到差异基因表达谱,其中共23032个基因。
3、油松年龄样本差异基因加权共表达网络构建
(1)数据的预处理
从年龄差异基因表达谱数据中删除有过多缺失值的基因,共剩余22789个基因,通过对各样本进行聚类,发现其中一个油松2年生样本有明显的离群现象,删除这个离群样本。将过滤后的26个年龄样本中22789个基因形成的表达矩阵用于后续分析。
(2)加权共表达网络构建
使用R软件包WGCNA对26个年龄样本的差异基因表达矩阵进行加权共表达网络构建,无尺度网络评价系数R2是连接节点个数取对数((log((k))))和节点出现的概率的对数值((log((p((k)))))之间的相关系数的平方,R2越高,网络越接近于无尺度分布。利用拓扑分析函数pickSoftThreshold计算软阈值β与无尺度网络评价系数R2的关系以及软阈值β与平均连通性的关系,设置β范围1-20,选择R2=0.9时距其最近的β值作为无尺度网络的软阈值,设定软阈值为7(图1中B),此时,网络中大多数的节点拥有少数的连接度,只有少数节点拥有大量的连接数。
软阈值确定后,使用adjacency函数生成邻接矩阵,TOMsimilarity函数将邻接矩阵转换为TOM矩阵,进一步转换为相异度矩阵(dissimilarity),基于基因间相异度,聚类函数hclust依据average对基因进行层级聚类,利用动态剪切建树法cutreeDynamic识别不同的聚类模块,每个聚类模块最少的基因数目minModuleSize=30,模块合并阈值mergeCutHeight=0.25,其余参数均为默认值。将22789个基因划分到35个不同的模块,其中灰色模块是未聚类到其他模块中的基因(图1中C),各聚类模块基因分布情况如表1。
表1各聚类模块基因分布情况
Figure BDA0003923350510000091
Figure BDA0003923350510000101
(3)年龄特异性模块筛选
计算每个模块的ME值与油松年龄之间的spearman相关系数r和检验值p值,r越大,模块与年龄的相关性越高。如图1中A所示,行表示每个模块的特征向量基因,列表示年龄特征信息。红色表示正相关,蓝色表示负相关,随颜色由深到浅相关性低依次递减。每个格子中的数字表示基因模块与年龄特征的相关系数,括号中的数字表示p值。与年龄显著呈正相关的模块为lightgreen(亮绿色1)、darkorange(暗橙色),与年龄呈显著负相关的模块为lightsteelblue1(亮钢蓝1)、ivory(象牙白)、lightcyan1(亮青色1),其中lightgreen模块与年龄的相关性最高,r=0.86,p=2e-8,确定为年龄特异性模块。
4、功能富集分析
eggNOG数据库(http://eggnog5.embl.de/#/app/home)是NCBI的COG数据库的扩展,它收集了更全面的物种和更大量的蛋白序列数据并进行了同源基因聚类分析和对每个同源基因类的描述和功能分类。使用eggNOG数据库的在线注释工具(http://eggnog-mapper.embl.de/),根据根据油松基因组蛋白序列对基因进行功能注释,将注释结果提取基因及GO注释信息后利用R软件包AnnotationForge中的makeOrgPackage函数构建油松OrgDb注释包org.Pt.eg.db,其中gene_info=gene_info(基因信息文件),go=gene2go(GO注释信息文件),maintainer="zhangyingying<zhangyingying@bjfu.edu.cn>",author="zyy",tax_id="88731",genus="P",species="t",goTable="go",其余参数均为默认值,之后通过pkgbuild::build org.Pt.eg.db命令对生成的org.Pt.eg.db进行封装,最终得到R软件包org.Pt.eg.db。
进而通过R软件包clusterProfiler对lightgreen模块的388个基因进行GO功能富集分析,如图2所示,lightgreen模块显著富集到生物学过程、分子功能以及细胞组分三大分类。其中包括多个与油松年龄及衰老相关的生物学过程,比如developmental process,reproductive process,reproduction,metabolic process,growth等生物学过程。此外,lightgreen模块可以富集到干细胞维持(GO:0019827)、花序分生组织及分生组织特性的维持(GO:0010074,GO:0010077)、花发育和生殖过程的调控(GO:0009911,GO:2000243)激素响应(GO:0009725)等通路。
5、油松候选年龄基因的选取
将年龄特异性模块基因的蛋白序列在转录因子预测网站PlantTFDB(http://planttfdb.gao-lab.org/prediction.php)中做转录因子预测,共包含25个转录因子,其中有5个MADS-box家族的转录因子,选择lightgreen模块共表达网络中连通性前5%的基因及其中的MADS-box家族基因作为年龄核心基因,核心基因情况见表2。R软件包umap和/或uwot对核心基因降维聚类(图3),发现这些基因明显的将9个年龄样本划分为三类:2年、3年、4年一类;7年、13年、20年一类;46年、55年、123年一类,说明它们参与油松年龄途径的调控。在multiarray viewer软件中分析并显示核心基因表达聚类热图(图4)从热图中可以发现,MADS-box家族基因中的Pt1G04940、Pt3G44080、Pt5G62640基因随年龄具有明显的变化趋势,随年龄的增加表达量逐渐上升,故将它们作为候选年龄基因。
表2 lightgreen模块中核心基因情况
Figure BDA0003923350510000121
6、油松年龄标记基因表达模式鉴定
(1)取样:不同年龄样本按步骤1方法取样;
(2)不同年龄油松中Pt1G04940、Pt3G44080、Pt5G62640的表达水平检测。
1)油松各年龄样本总RAN提取
将(1)中所取油松不同年龄的基部维管形成层在液氮环境下研磨备用,具体操作步骤参照天根生化科技北京有限公司的植物总RNA提取试剂盒(RNAprep Pure PlantKi)说明书。
2)cDNA合成
按照以下体系配置反转录混合液,并置于200μL RNase free PCR管中:TotalRNA/mRNA 10pg-500ng、Anchored oligo(dT)18primer 1μL、2×TS ReactionMix 10μL、TransScript RT/RI Enzyme Mix 1μL、gDNA Remover 1μL和补充RNase-free Water至20μL。
轻轻混匀后,42℃孵育30min;85℃加热5s失活TransScript RT/RI与gDNARemover,将cDNA放在-20℃保存。反应中所用到的试剂全部购自于北京天根生物技术有限公司。
3)Pt1G04940、Pt3G44080、Pt5G62640基因荧光定量PCR实验
通过NCBI网站中的primer designing tools工具及NCBI Conserved DomainSearch设计油松内参基因18sRNA和Pt1G04940、Pt3G44080、Pt5G62640基因的引物:
18sRNA-F(SEQ ID NO.4):CGGCTACCACATCCAAGGAA;
18sRNA-R(SEQ ID NO.5):GCTGGAATTACCGCGGCT;
Pt1G04940-F(SEQ ID NO.2):AACGGTGAGGGGAAAAACCC;
Pt1G04940-R(SEQ ID NO.3):GCTTCCCTCTTGGGGAGAAA;
Pt5G62640-F(SEQ ID NO.6):GGGGGAAGACCCAGATGAAAA;
Pt5G62640-R(SEQ ID NO.7):GCATGCTGGGACTACCGAAT;
Pt3G44080-F(SEQ ID NO.8):ATGGGGCGCGGTAAAATAGAG;
Pt3G44080-R(SEQ ID NO.9):CTTGGCCGGAGAAAACGATG。
以油松各年龄样本的cDNA序列为模板,按照荧光定量PCR扩增体系检测上述候选基因在不同年龄样本中的表达水平,扩增体系中所用试剂及用量参照全式金公司TransScript One-Step gDAN Removal and cDNA Synthesis SuperMix TransScript试剂盒说明书。
将混合液加入荧光定量PCR 96孔板中,在Bio-Rad公司的CFX Connect OpticsModule荧光定量PCR仪中进行荧光定量PCR,反应条件如下::95℃2min;95℃5s,60℃30s,39循环;95℃5s;溶解曲线65℃-95℃,每5s增加0.5℃。
定量结果显示,Pt1G04940基因在幼年油松中的表达量较低,树木成熟后表达水平随年龄的增加逐渐升高(图5),说明其具有年龄依赖性,故将Pt1G04940确定为油松年龄标记基因。经过结构域预测Pt1G04940属于MDAS-box基因(图6),在全基因组测序的基础上,对所有MADS-box基因进行分析排序后,首次将其命名为PtMADS26。
实施例2
油松年龄标记基因PtMADS26和其他基因互作关系网络预测
年龄特异性模块lightgreen模块编码转录因子的基因占重要比重且MADS-box家族转录因子与针叶树的年龄调控密切相关,在复杂网络可视化软件Cytoscape中对lightgreen模块所有转录因子基因构建共表达互作网络(图7)。
网络中包含5个MADS-box基因,分别为Pt1G04940,Pt0G30020,Pt5G62640,Pt3G44080,Pt1G04820,其中Pt3G44080为AG/AGL12 subfamily基因,其余4个均为SOC1-like subfamily基因,均具有年龄依赖性;包含2个SPL家族基因Pt9G37610和Pt4G33940,在拟南芥中SPLs参与miR156和miR172介导的年龄调控途径;同时还含有其他参与年龄调控相关的基因家族,如MYB(如Pt4G29880)、NAC(如Pt1G35130)、ARF(如Pt8G22510,Pt8G22510,Pt8G22500)等。
实施例3
油松幼嫩或老化程度分子水平鉴定
1、油松反复截顶
在3月初将4年生油松基部至顶端80%-90%高度处截断,当萌发新枝条后,于5月中旬在高于第一次截顶处1-3cm处再次截断,如此反复3-5次,如图8所示,萌发出大量新枝。
2、反复截顶及未截顶油松中PtMADS26的表达水平检测
(1)取样:选取4年生反复截顶及未截顶(对照)油松顶端嫩芽,清除外部鳞片后快速放入液氮中保存,每个样本取3个重复。
(2)反复截顶及未截顶油松总RAN提取,同实施例1。
(3)cDNA合成,同实施例1。
(4)PtMADS26基因荧光定量PCR检测:按照实施例1中的方法步骤检测PtMADS26基因在反复截顶及未截顶油松中的表达水平。
定量结果显示,反复截顶油松中PtMADS26基因的表达量显著低于未截顶油松(图9),说明反复截顶后的油松处于更为幼嫩的生理状态,具备更好的再生能力,更适合用作组织培养、扦插等无性繁殖材料。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种油松年龄标记基因PtMADS26的筛选鉴定方法,其特征在于,包括以下步骤:(1)对不同年龄段油松进行转录组测序,初步筛选油松年龄差异基因集,对年龄差异基因集进行筛选,得候选年龄基因;所述筛选的方法包括WGCNA分析、GO功能富集分析和/或UMAP降维分析;
(2)对所述候选年龄基因进行表达模式分析,获得油松年龄标记基因PtMADS26。
2.根据权利要求1所述筛选鉴定方法,其特征在于,步骤(1)中利用不同年龄油松的基部维管形成层提取总RNA,并进行转录组测序。
3.根据权利要求1所述筛选鉴定方法,其特征在于,步骤(1)所述筛选,包括:使用R软件包WGCNA对年龄差异基因集进行WGCNA分析,构建加权共表达网络,将与年龄高相关性聚类模块作为年龄特异性模块;使用油松OrgDb包org.Pt.eg.db和R软件包clusterProfiler对年龄特异性模块基因进行GO功能富集分析,筛选年龄特异性模块中参与调控年龄及衰老相关通路的基因,进一步根据模块内基因的连通性,分析挖掘模块中核心基因;
和/或,使用R软件包umap和/或uwot对模块中核心基因降维聚类,分析模块中核心基因对年龄的聚类情况。
4.利用权利要求1~3任一项所述筛选鉴定方法得到的年龄标记基因PtMADS26,其特征在于,所述基因PtMADS26的核苷酸序列如SEQ ID NO.1所示。
5.一种检测权利要求4所述基因PtMADS26的引物组,其特征在于,所述引物组包括正向引物和反向引物,其中正向引物的核苷酸序列如SEQ ID NO.2所示,反向引物的核苷酸序列如SEQ ID NO.3所示。
6.根据权利要求5所述引物组,其特征在于,还包括内参基因,所述内参基因包括18sRNA;
针对18sRNA设计的正向引物的核苷酸序列如SEQ ID NO.4所示,反向引物的核苷酸序列如SEQ ID NO.5所示。
7.权利要求4所述基因PtMADS26在构建年龄相关潜在互作网络中的应用。
8.根据权利要求7所述应用,其特征在于,所述互作网络包括年龄特异性模块相关基因。
9.权利要求4所述基因PtMADS26在树木幼嫩或老化程度鉴定中的应用。
10.一种树木幼嫩或老化程度的鉴定方法,其特征在于,包括检测权利要求4所述基因PtMADS26在样本中的表达量。
CN202211367270.7A 2022-11-02 2022-11-02 一种油松年龄标记基因PtMADS26的筛选鉴定方法与应用 Pending CN116397008A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211367270.7A CN116397008A (zh) 2022-11-02 2022-11-02 一种油松年龄标记基因PtMADS26的筛选鉴定方法与应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211367270.7A CN116397008A (zh) 2022-11-02 2022-11-02 一种油松年龄标记基因PtMADS26的筛选鉴定方法与应用

Publications (1)

Publication Number Publication Date
CN116397008A true CN116397008A (zh) 2023-07-07

Family

ID=87014783

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211367270.7A Pending CN116397008A (zh) 2022-11-02 2022-11-02 一种油松年龄标记基因PtMADS26的筛选鉴定方法与应用

Country Status (1)

Country Link
CN (1) CN116397008A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117887734A (zh) * 2024-03-14 2024-04-16 北京林业大学 一种Pt9G41650基因及其蛋白在判定油松种子休眠程度中的应用

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117887734A (zh) * 2024-03-14 2024-04-16 北京林业大学 一种Pt9G41650基因及其蛋白在判定油松种子休眠程度中的应用
CN117887734B (zh) * 2024-03-14 2024-05-28 北京林业大学 一种Pt9G41650基因及其蛋白在判定油松种子休眠程度中的应用

Similar Documents

Publication Publication Date Title
Shulse et al. High-throughput single-cell transcriptome profiling of plant cell types
Cheng et al. Subgenome parallel selection is associated with morphotype diversification and convergent crop domestication in Brassica rapa and Brassica oleracea
Wang et al. Somatic variations led to the selection of acidic and acidless orange cultivars
Hedman et al. Analysis of the WUSCHEL-RELATED HOMEOBOX gene family in the conifer Picea abies reveals extensive conservation as well as dynamic patterns
Lemmon et al. The evolution of inflorescence diversity in the nightshades and heterochrony during meristem maturation
CN111223520B (zh) 一种预测烟草尼古丁含量的全基因组选择模型及其应用
CN114574629B (zh) 与番木瓜果实重量相关的snp分子标记及应用
Zhang et al. Genome-wide association studies of callus differentiation for the desert tree, Populus euphratica
CN116397008A (zh) 一种油松年龄标记基因PtMADS26的筛选鉴定方法与应用
CN114672588A (zh) 一种SNP分子标记Cpa03g017250:8及其扩增引物、检测试剂盒和应用
Niu et al. Transcriptome/degradome-wide discovery of microRNAs and transcript targets in two Paulownia australis genotypes
Tao et al. Transcriptome profiling and digital gene expression by deep sequencing in early somatic embryogenesis of endangered medicinal Eleutherococcus senticosus Maxim.
Kinser et al. Endosperm-based incompatibilities in hybrid monkeyflowers
Li et al. Genome-wide association study of 23 flowering phenology traits and 4 floral agronomic traits in tree peony (Paeonia section Moutan DC.) reveals five genes known to regulate flowering time
Mu et al. Transcriptomic analysis of incised leaf-shape determination in birch
Mondragon et al. Conservation genomics of Agave tequilana Weber var. azul: low genetic differentiation and heterozygote excess in the tequila agave from Jalisco, Mexico
Jiménez-Ruiz et al. Transcriptomic time-series analysis of early development in olive from germinated embryos to juvenile tree
CN115927721B (zh) 一种湿加松年龄标记基因PtTIFY20及其筛选方法与应用
Raturi et al. Overview of developed core and mini core collections and their effective utilization in cultivated rice and its related species (Oryza sp.)—A review
CN110853711B (zh) 一种预测烟草果糖含量的全基因组选择模型及其应用
Liu et al. Classification of lychee cultivars with RAPD analysis
Dodsworth Genome skimming for phylogenomics
CN107937409A (zh) 水稻分蘖角度基因tac3的克隆和应用
Liang et al. Genome-wide association study identifies QTL for girth and dry rubber yield in a progeny population of Whickham Hevea germplasms
Dujak et al. Genomic analysis of fruit size and shape traits in apple: unveiling candidate genes through GWAS analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination