CN110055317B - 小麦远缘杂交后代小片段易位系中发掘外源功能候选基因的方法 - Google Patents

小麦远缘杂交后代小片段易位系中发掘外源功能候选基因的方法 Download PDF

Info

Publication number
CN110055317B
CN110055317B CN201910355215.8A CN201910355215A CN110055317B CN 110055317 B CN110055317 B CN 110055317B CN 201910355215 A CN201910355215 A CN 201910355215A CN 110055317 B CN110055317 B CN 110055317B
Authority
CN
China
Prior art keywords
wheat
sequence
transcript
sequencing
wheatgrass
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910355215.8A
Other languages
English (en)
Other versions
CN110055317A (zh
Inventor
李立会
周升辉
张锦鹏
韩海明
刘伟华
鲁玉清
杨欣明
李秀全
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Crop Sciences of Chinese Academy of Agricultural Sciences
Original Assignee
Institute of Crop Sciences of Chinese Academy of Agricultural Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Crop Sciences of Chinese Academy of Agricultural Sciences filed Critical Institute of Crop Sciences of Chinese Academy of Agricultural Sciences
Priority to CN201910355215.8A priority Critical patent/CN110055317B/zh
Publication of CN110055317A publication Critical patent/CN110055317A/zh
Application granted granted Critical
Publication of CN110055317B publication Critical patent/CN110055317B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/13Plant traits

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Genetics & Genomics (AREA)
  • Botany (AREA)
  • Mycology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提供小麦远缘杂交后代小片段易位系中发掘外源功能候选基因的方法,该方法仅需对小麦远缘杂交衍生的小片段易位系及其小麦受体和野生近缘种供体三个样品进行转录组测序,结合生物信息学分析、比较基因组学和功能标记开发验证,可实现从小麦远缘杂交衍生系中快速挖掘外源功能候选基因。本发明不依赖小麦近缘植物的参考基因组序列,实现了低成本且高效地筛选功能候选基因,为功能基因的克隆奠定基础。

Description

小麦远缘杂交后代小片段易位系中发掘外源功能候选基因的 方法
技术领域
本发明涉及基因组学、转录组学及生物信息学领域,具体地说,涉及小麦远缘杂交后代小片段易位系中发掘外源功能候选基因的方法。
背景技术
从小麦进化历史和育种进程可以看出,远缘杂交是拓宽小麦遗传基础,创制新种质,实现小麦高产、稳产育种的有效途径之一。国内外学者已经实现了小麦族的所有属与小麦间的杂交,获得了大量的且具有可利用价值的小麦新种质,从这些新种质中发掘新的功能基因并加以利用,将在小麦抗性育种中发挥着举足轻重的作用。由于多数小麦近缘植物没有参考基因组序列,且在小麦背景下,对外源功能基因进行图位克隆的研究相对困难。有研究人员通过突变体筛选、抗病基因富集测序和易位染色体分拣测序组装等技术,成功从簇毛麦的6V染色体上克隆了抗白粉病基因Pm21。类似研究工作耗时长、工作量大、成本高,且相关的研究主要集中在抗病相关的基因,但与小麦复杂的数量性状相关的基因克隆还没有相关的研究报道。因此,如何有效地在小麦背景下快速筛选外源功能基因,特别是与产量等复杂性状相关的基因,是亟需解决的问题。
发明内容
本发明的目的是提供小麦远缘杂交后代小片段易位系中发掘外源功能候选基因的方法。
为了实现本发明目的,本发明提供小麦远缘杂交后代小片段易位系中发掘外源功能候选基因的方法,包括以下步骤:
A、小麦近缘植物的全长转录组测序:获取小麦近缘植物多个组织且包含所研究的目的性状发生前和发生时的组织,分别提取各个组织mRNA且等量混合;为了获得小麦近缘植物的全长转录组参考序列,利用第三代测序技术和平台对混合样品进行全长转录组的建库和测序。
B、小麦远缘杂交后代小片段易位系和小麦受体的转录组测序:分别获取小麦远缘杂交后代小片段易位系和小麦受体植株多个组织且包含所研究的目的性状发生前和发生时的组织,分别提取各个组织mRNA且等量混合;为了对转录本的表达进行定量,利用第二代测序技术和平台对各自的混合样品进行高通量转录组的建库和测序,分别得到小麦受体的转录本序列和易位系的转录本测序数据。
C、易位系中外源染色体片段中特异表达转录本分析:对小麦近缘植物的全长转录组测序数据进行生物信息学分析(生物信息学分析包括:使用IsoSeq3软件处理原始测序数据。具体步骤如下:首先,使用ccs算法进行分类,产生每个零模式波导孔中的共有序列,保留具有至少一个完整通道的序列用于后续分析;其次,使用Lima算法获得全长序列;最后,进行聚类和矫正),获得非嵌合且全长的转录本序列,去除冗余后,与小麦参考基因组序列和注释文件进行整合作为总的参考序列;将小麦受体的转录本序列以及易位系的转录本序列分别与所述总的参考序列进行比对,并过滤,去重复,仅保留唯一比对的序列比对结果,然后统计比对到每个转录本上的序列数目,最后进行小麦受体和易位系之间转录本的序列差异表达显著性检验,根据易位系和小麦受体之间转录本的序列比对数目,使用参数log2(差异倍数)≤-4和假阳性率<0.05进行过滤(为了获得可信的以及统计上显著差异表达的转录本,必须控制表达的差异倍数以及多重检验的P-value),获得易位系中外源染色体片段中特异表达的转录本,作为候选转录本序列。
D、分子标记开发:将获得的候选转录本序列与小麦参考基因序列进行比对,根据比对结果找出候选转录本与小麦基因组上同源基因之间的差异,根据差异序列设计并开发分子标记及其检测引物;利用设计的引物在小麦近缘植物、小麦受体和易位系中进行PCR验证,确定所获得的外源染色体片段中特异表达的转录本的真实性。
E、候选基因预测:对于步骤D中获得的真实候选转录本序列,与小麦参考基因序列进行比对,进行比较基因组学分析,构建易位系中外源染色体片段与小麦基因组间的比较基因组学图谱;对共线性候选区间内的基因进行功能注释,获得外源功能候选基因。
可选地,步骤C中,对小麦近缘植物的全长转录组测序数据进行生物信息学分析,获得非嵌合且全长的转录本序列,利用CD-HIT-EST软件去冗余,然后与小麦参考基因组序列和注释文件进行整合作为总的参考序列。
利用STAR软件将小麦受体的转录本序列以及易位系的转录本序列分别与所述总的参考进行序列比对,并过滤,去重复,仅保留唯一比对的序列比对结果。然后,用featureCounts软件统计比对到每个转录本上的序列数目。最后,用DESeq2软件进行小麦受体和易位系之间转录本的差异表达显著性检验。
步骤D中,将获得的候选转录本序列通过BLAST与小麦基因序列进行比对。
步骤D中,所开发的分子标记包括但不限于EST、KASP标记。
在本发明的一个具体实施方式中,提供小麦-冰草易位系中发掘外源功能候选基因的方法,包括以下步骤:
S1、冰草的全长转录组测序:获取冰草Z559根、茎、叶、幼穗、籽粒多个组织,分别提取各个组织mRNA且等量混合,构建PacBio测序文库,利用PacBio sequel平台的2个cell对混合样品进行全长转录组测序。共获得了约15G大小的测序数据量。
S2、小麦受体Fukuhokumugi和易位系的转录组测序:分别获取Fukuhokumugi和易位系植株的根、茎、叶、籽粒(包括灌浆前、中、后期)多个组织,然后提取各个组织mRNA且等量混合,对Fukuhokumugi和易位系各自的混合样品构建高通量测序文库,并使用IlluminaHiSeq 2500高通量测序平台进行转录组测序;
S3、易位系中冰草外源染色体易位片段中特异表达的转录本分析:整合冰草全长转录组测序数据和小麦参考基因组序列作为总的参考序列,用STAR软件将Fukuhokumugi和易位系的转录本序列与所述总的参考序列进行比对,仅保留唯一比对的序列比对结果,然后用featureCounts软件分别计算Fukuhokumugi和易位系中比对到每个转录本上的序列数目,最后使用DESeq2软件进行Fukuhokumugi和易位系之间转录本的序列差异表达显著性检验,用log2(差异倍数)≤-4且假阳性率<0.05进行过滤,获得易位系中外源染色体片段中特异表达的转录本,作为候选转录本序列。共获得普冰3035中冰草外源染色体易位片段中特异表达的12个转录本(表1)。
S4、分子标记开发:将获得的候选转录本序列与小麦参考基因序列进行比对,并根据比对结果找出候选转录本与小麦A/B/D基因组上同源基因之间的差异,根据差异序列设计EST标记及其检测引物;利用设计的EST标记在冰草Z559、Fukuhokumugi和易位系中进行PCR验证,分别对每个候选转录本开发了相对应的多态性分子标记(图1),从而验证外源染色体片段中特异表达的转录本的真实性。
S5、候选基因预测:对于步骤S4中获得的真实候选转录本序列,与小麦参考基因序列进行比对,进行比较基因组学分析,构建易位系中外源染色体片段与小麦A/B/D基因组间的比较基因组学图谱(图2);对共线性候选区间内的基因进行功能注释,获得外源功能候选基因。
本发明中,所述小麦-冰草易位系为普冰3035。
步骤S1还包括对冰草全长转录组测序数据进行过滤、质控;具体方法为主要使用IsoSeq3软件处理原始测序数据,首先,使用ccs算法进行分类,产生每个零模式波导孔中的共有序列,保留具有至少一个完整通道的序列用于后续分析;其次,使用Lima算法获得全长序列;最后,进行聚类和矫正获得高质量的冰草全长转录本。
经过对测序数据进行过滤、质量控制等分析,共得到了44372个全长非冗余的冰草转录本序列。
步骤S2还包括对原始测序数据进行质控、去污染和接头,得到高质量的测序数据;具体方法为:去除两端测序质量值小于20的碱基,小于25bp的测序读长将被去除,过滤使用Trimmomatic软件执行。
步骤S4中所述EST标记包括WGRG8和WGRG9,它们的检测引物分别如下(SEQ ID NO:3-6):
WGRG8_F:5′-TGCCAGTGGTGACCAATGCA-3′;
WGRG8_R:5′-ACTTGGGGAAGAGTCTCACT-3′;
WGRG9_F:5′-TCCAAATCCTCCAGCAAATC-3′;
WGRG9_R:5′-CCCGAGACCGAGCACTATAC-3′。
步骤S5获得的外源功能候选基因包括与小麦千粒重相关的候选基因transcript/2、transcript/4,它们的核苷酸序列分别如SEQ ID NO:1和2所示。
其中,转录本transcript/2在水稻中的同源基因为ASL2,其编码质体核糖体蛋白L21,突变后会导致叶绿体发育缺陷和幼苗死亡,主要影响植株的光合作用;转录本transcript/4在水稻中的同源基因为OsUBP15/LG1,其与GW2基因相互作用,是水稻粒宽和籽粒大小的正调节因子。因此基于此方法从小麦-冰草易位系普冰3035中发掘的冰草特异转录本transcript/2和transcript/4可以作为普冰3035中控制千粒重和粒长的候选基因。
借由上述技术方案,本发明至少具有下列优点及有益效果:
本发明提供一种仅需对小麦远缘杂交衍生的小片段易位系及其小麦受体和野生近缘种供体三个样品进行转录组测序,结合生物信息学分析、比较基因组学和功能标记开发验证,可实现从小麦远缘杂交衍生系中快速挖掘外源功能候选基因。首先对小麦野生近缘种多个组织的混合样品进行全长转录组测序,并与小麦参考基因组序列进行整合作为总的参考序列;其次对小麦远缘杂交衍生的小片段易位系和小麦受体进行高通量转录组测序,鉴定在衍生系中特异表达的外源转录本;再次进行与小麦基因组的比较基因组学分析,开发功能标记;最后结合功能注释确定与目的性状相关的外源功能候选基因。本发明不依赖小麦近缘植物的参考基因组序列,实现了低成本且高效地筛选功能候选基因,为功能基因的克隆奠定基础。
附图说明
图1为本发明实施例1中根据转录本transcript/2开发的多态性标记WGRG8和transcript/4开发的多态性标记WGRG9的聚丙烯酰胺凝胶电泳图。其中,M:DNA Marker;1:冰草Z559;2:普冰3035;3:Fukuhokumugi。
图2为本发明实施例1中普冰3035中冰草6P染色体易位片段与小麦6A染色体间的比较基因组学图谱。
具体实施方式
以下实施例用于说明本发明,但不用来限制本发明的范围。若未特别指明,实施例均按照常规实验条件,如Sambrook等分子克隆实验手册(Sambrook J&Russell DW,Molecular Cloning:a Laboratory Manual,2001),或按照制造厂商说明书建议的条件。实施例1小麦-冰草易位系中发掘外源功能候选基因的方法
前期研究表明,普冰3035(Ti1AS-6PL-1AS·1AL,遗传背景为小麦受体品系Fukuhokumugi)为小麦-冰草易位系,其来自上麦近缘植物冰草6P染色体上的易位片段能够显著提高小麦的千粒重。本实施例提供了该小麦背景下外源染色体片段中功能候选基因快速发掘的方法,在筛选小麦-冰草小片段插入易位系普冰3035中与小麦千粒重相关的候选功能基因的实例。
具体方法为:
A、小麦近缘植物冰草的全长转录组测序:
为了能够获得尽可能多的冰草全长转录组序列,获取冰草Z559根、茎、叶、幼穗、籽粒多个组织,分别提取各个组织mRNA且等量混合,最后构建PacBio的测序文库,使用PacBiosequel平台的2个cell对混合样品进行全长转录组测序,共获得约15G大小的测序数据量。使用IsoSeq3软件处理原始测序数据。具体步骤如下:首先,使用ccs算法进行分类,产生每个零模式波导孔中的共有序列,保留具有至少一个完整通道的序列用于后续分析;其次,使用Lima算法获得全长序列;最后,进行聚类和矫正,获得高44372个全长非冗余的高质量冰草全长转录本。
B、小麦受体Fukuhokumugi和衍生系普冰3035的转录组测序:
分别获取小麦受体Fukuhokumugi和普冰3035植株根、茎、叶、籽粒(包括灌浆前、中、后期)多个组织,然后提取各个组织mRNA且等量混合,最后对小麦受体Fukuhokumugi和普冰3035两个混合的样品构建高通量测序文库,使用Illumina HiSeq 2500高通量测序平台进行转录组测序。对原始测序数据进行质控、去污染和接头,去除两端测序质量值小于20的碱基,小于25bp的测序读长将被去除,过滤使用Trimmomatic软件执行,得到高质量的测序数据。
C、普冰3035中冰草外源染色体易位片段中特异表达的转录本分析:
整合冰草非冗余全长转录组序列和小麦参考基因组(IWGSC RefSeq v1.0)作为总的参考序列,使用STAR软件将小麦Fukuhokumugi和普冰3035的转录组测序序列与参考序列进行比对,只保留唯一比对的序列比对结果,然后使用featureCounts软件分别计算Fukuhokumugi和普冰3035中比对到每个转录本上的序列数目,最后使用DESeq2进行Fukuhokumugi和普冰3035间转录本的差异表达显著性检验,用log2(差异倍数)或log2(变化倍数)≤-4且假阳性率<0.05进行过滤,共获得普冰3035中冰草外源染色体易位片段中特异表达的12个转录本(表1)。
D、分子标记开发
根据获得的12个候选转录本序列,与小麦基因序列进行比对,并依据比对的结果找出候选转录本与小麦A/B/D基因组上同源基因之间的差异,设计EST标记及其检测引物。对设计的EST标记在冰草Z559、Fukuhokumugi和衍生系普冰3035中进行PCR验证,分别对每个候选转录本开发了相对应的多态性分子标记(图1),从而验证外源染色体片段中特异表达的转录本的真实性。
所述EST标记包括WGRG8和WGRG9,它们的检测引物分别如下:
WGRG8_F:5′-TGCCAGTGGTGACCAATGCA-3′;
WGRG8_R:5′-ACTTGGGGAAGAGTCTCACT-3′;
WGRG9_F:5′-TCCAAATCCTCCAGCAAATC-3′;
WGRG9_R:5′-CCCGAGACCGAGCACTATAC-3′。
E、候选基因预测
根据真实的候选转录本序列,与小麦基因序列进行比对,进行比较基因组学分析,构建衍生系中外源染色体片段与小麦染色体A/B/D间的比较基因组学图谱(图2);对共线性候选区间内的基因进行功能注释,其中转录本transcript/2在水稻中的同源基因为ASL2,其编码质体核糖体蛋白L21,突变后会导致叶绿体发育缺陷和幼苗死亡,主要影响植株的光合作用;转录本transcript/4在水稻中的同源基因为OsUBP15/LG1,其与GW2基因相互作用,是水稻粒宽和籽粒大小的正调节因子。因此基于此方法从小麦-冰草易位系普冰3035中发掘的冰草特异转录本transcript/2和transcript/4可以作为普冰3035中控制千粒重和粒长的候选基因。
表1普冰3035中冰草外源染色体中特异表达转录本结果统计
Figure BDA0002045195580000061
虽然,上文中已经用一般性说明及具体实施方案对本发明作了详尽的描述,但在本发明基础上,可以对之做一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。
序列表
<110> 中国农业科学院作物科学研究所
<120> 小麦远缘杂交后代小片段易位系中发掘外源功能候选基因的方法
<130> KHP191111756.2
<160> 6
<170> SIPOSequenceListing 1.0
<210> 1
<211> 839
<212> DNA
<213> 冰草(Agropyron cristatum)
<400> 1
gacgcgattt cgtcctatcc acaatattat cccactcccc tcttcgtctg aaaaccctcc 60
agtccagtat ccgtgttccc cctcgccatc gttccgagcc ccgtccatgg ccaccgccac 120
gctccctctc cgcctcctcc cctccagaac cccactcctc cacgccgccg ccttcctccc 180
cgcgagcacc tctctctccg tcaccgcgtc cgcgccccgc aactggcgca tcttcgccgc 240
cgccgaggag gcgcccgctc tggtggaagc cgaggcggag gaggtggtag aggatgccgc 300
ggttccggag cctgttgagc tgcagctggc tgctgctggc gcggggaagg acgctgacat 360
cttcgccgtt gtcatgattg ggtccagaca atacattgtg atgccaggtc ggtacatata 420
cacgcagagg ctgaaagacg ccaatgtcaa tgatcagatc attttgaaca aggtactact 480
ggtgtcaaca agagacaaag cttatattgg catgccagtg gtgaccaatg cagctgttca 540
tgcaattgtt gaagaacagg gactggacga taaagtgatt gttttcaagt tcaagaagaa 600
gaagaagtac cagaggaaag ctggtcacag acagccaaat acgaggttaa gaattaccgg 660
cataagtgga tatgaggaat accctgctga tccaatactt caagttccag cttaagtgta 720
actgtaagtt gtttagttac aaatgattgg tagtacatta gaatgcaaga gcattttccc 780
cactgttccc caagtgagac tcttccccaa gttaatgtac ttgaaatgct gccattcgt 839
<210> 2
<211> 3631
<212> DNA
<213> 冰草(Agropyron cristatum)
<400> 2
gactatacca aagcaaaaac gcgcacacat gagcagagca cagtagccaa gcaacagcga 60
gcgagccaca gtcggtcact cccaccgccg ctcccgattc cttcagccgc cggcaccgct 120
gccatcctcg gctagagctt ctccatcccc tacccctata taccgcgatc tcctccagaa 180
ccaccggccg ggactgctgc tccgcttgct cgcccccgtt ggagatccgc ccggagcgac 240
atttgtcttt cttggtagtc tagtggttga tttgctggag gatttggaga tagtaaagag 300
gtgatgtgag ccacaaagtg aacttatttc tctggcccta acattctaag gtaaatcagt 360
gatttggaat gtttttccga gctgaagcag agaattcttg gagctggata ataataatct 420
tttagggata tgctccaacc aagggaagct gatgtgcctg cactctttgt tgtatttatc 480
atacttccgg tgatagcata ttttcttctt gggagatggc atgattctgt aagtaagaaa 540
acaagagtag gtgtgcttgg ccagaaagct gcagaagaag ccttcaaagt ggaaacaatg 600
gcatgcccag atgttatatt gccaggaccg tctctgagac ccatgcctta tttgagatct 660
gttccttctt taagatccga ataccacgag tgtgctactt gtcgtggccc tgcaaacact 720
aggtgctcga ggtgcaaatc tgttagatac tgctctggaa agtgtcaaat tatacactgg 780
aggcaagggc ataaacaagc atgccagcag tggcatgtta acggtggtag caactctggt 840
ggactatctc tgatggagag ttctgaacaa atgccgttct tgactaacct gaattcacct 900
cttccagggg gtgacagtca cctgcatgac atgaattttg acacagtatc agagccatcc 960
tttgcgacaa ctgatagcta tattcttgat actgatctat tcctgacaga cagaagcaac 1020
atgaatgaat caaatcaaag tcttctttca agagtaaata gcgcttctgt tgcatcttct 1080
gaaaagagca attacagtgt tgatgaagaa accaactcat ctgagatttt atcagcaaat 1140
aaggtttcaa acaacagtta tggttgtttg gatgaaaaga atggcaacca tgattttact 1200
tatcctctca ataatacggt acaacaaccc aataattgtg ctcctgaaat accaaaatgt 1260
ccaaaagcaa gcatcacagt ttatgaaccc gacatgggtg tctatttaac ttctgatatg 1320
atgagttctt gcgaggggcc atattcttcc gcaacagagt cactacagag gagcaaatca 1380
tctggaaaat atagtgggag aggaaatgtg atctatatga agcctcctta tccaccaggt 1440
aaggtggctt catcacaaaa agcacaggag gtgttggcat catatcaata caatgtccat 1500
gaaaagaaca cttcctgcaa aaatgaacaa agatctgcaa aatcaagtgt ttcaacaaac 1560
aacaatttac aaggacgcac tcgaatctca aaattaggag catccaaggt tgaagtcttg 1620
aagaagccct caaaatttct caaaaccagc ctggtgggtt taatcaatga taacaagagg 1680
agtaaggtat tgtttcgcta tgaagatctc gttaagttct tccagtatga agtacggggc 1740
gtttctccca gaggtctttt caactgtggg aacagctgct atgcaaatgc tgttctacaa 1800
tgcctcatgt gcacaaaacc cctgatgatc cacctgcttc tgagattgca ttctaaagac 1860
tgttgctcaa agaactggtg tcttatgtgt gaacttgagc aatatgcttc aactttacgt 1920
gaaagtggtg gacctgtgtc cccaagcaga atcctttcga atctaaggaa cattggatgt 1980
cgcttgggtg gtggaagtca ggaagatgct catgaatttt taaggcatct tgtgatgtct 2040
atgcaagcag cgtgcctgga ctggactggg tggtgagaag caagtagaac aaagcttgca 2100
ggaaactaca ctgatacaac agatgtttgg tggacgcctt aaatcgaagg ttaagtgcct 2160
cagatgccat catgaatctg aaagatacga gaatataatg gatcttactt tggagattca 2220
tggttgggtg gagtccttgc aagatgcttt gacacagttc actgctcctg aagatttaga 2280
tggggataat atgtataaat gtggaaggtg ttgtgcttat gttaaagcta gaaaacaact 2340
aagcgtgcat gaagtgccaa acatattaac agtagtttta aaaagattcc agacaggaaa 2400
gtatggcaag attaacaaat gtgtcacttt tcctgatatg ttggacatgg ttccttttgt 2460
gactggggct ggtgatcacc cgcctcttta cttcttgtat gctgtggttg tacatgtgga 2520
tacagaaatg catcattctc tggtcactac atatcgtatg tcaaagatat gcagggaaca 2580
tggttaagaa ttgatgactc agaggtcaag gctgtatcat tgaatcaagt tatgtccgaa 2640
ggtgcatata tgctattcta cttgagatct tttcctcgcc ctccgaggat atacattgag 2700
aaaggcctat tgcctgaccc atcatcttca tatcatcact catcaaaatc ctccaagggc 2760
tcttctaaac aagagcagaa gcagacagaa tcactcttta cttctgatga tcaaatccat 2820
ggtatttatg attttagacc agaggaggaa ggttacaggc aagatcagca tgtcaagttg 2880
aggtcccaaa atttatatca caccgatgat gcttttgccg attcggttag cacggacttc 2940
tcggacgcta catcaagtga atggtccctg tttaccagct ctgatgaatc ttcgtttacc 3000
actgaaagca ctagagattc attcagtgtt gtggattatg gtgacaatgc tggccttgat 3060
ccaatcacct caatttttgg gccatattat gctcctgacc atcctcttga caactttgcc 3120
tcatgtacaa ggctctcgcc ttccaatccg caaacaagat actttccgga aagcatgggt 3180
tttgtctcag attcttcctt gccaactcac ccctacggca atgtacatag aggaagatat 3240
ccagacaggg cttgcgcgtc ttcagccgaa cctcttgctt cagcaaacca gcgaagtttg 3300
tacggtaggt ataaccatag tagagatggt tttgttcaaa catctgggtt ttgtcatatg 3360
taatggtctg catctgatag ttttagctgg agctggtctg atatggttag cagtgccatt 3420
aatatcgcct catgttcttt tatttcagat gaggcatatt taattgtagc tgcatattct 3480
agatgtagtt cactcagtgt agtgaagtaa ctagatctgt ctagatgcct agcttttggg 3540
ttgacatgtt agaattcaag gactagcttt gtgaaagcaa agatggccaa gcatttattt 3600
actgtgtgcg aaaagcttcc atttgcttca g 3631
<210> 3
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
tgccagtggt gaccaatgca 20
<210> 4
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
acttggggaa gagtctcact 20
<210> 5
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
tccaaatcct ccagcaaatc 20
<210> 6
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
cccgagaccg agcactatac 20

Claims (5)

1.小麦-冰草易位系中发掘外源功能候选基因的方法,其特征在于,包括以下步骤:
S1、冰草的全长转录组测序:获取冰草Z559根、茎、叶、幼穗、籽粒多个组织,分别提取各个组织mRNA且等量混合,构建PacBio测序文库,利用PacBio sequel平台的2个cell对混合样品进行全长转录组测序;
S2、小麦受体Fukuhokumugi和易位系的转录组测序:分别获取Fukuhokumugi和易位系植株的根、茎、叶、籽粒多个组织,然后提取各个组织mRNA且等量混合,对Fukuhokumugi和易位系各自的混合样品构建高通量测序文库,并使用Illumina HiSeq2500高通量测序平台进行转录组测序;
S3、易位系中冰草外源染色体易位片段中特异表达的转录本分析:整合冰草全长转录组测序数据和小麦参考基因组序列作为总的参考序列,用STAR软件将Fukuhokumugi和易位系的转录本序列与所述总的参考序列进行比对,仅保留唯一比对的序列比对结果,然后用featureCounts软件分别计算Fukuhokumugi和易位系中比对到每个转录本上的序列数目,最后使用DESeq2软件进行Fukuhokumugi和易位系之间转录本的序列差异表达显著性检验,用log2(差异倍数)≤-4且假阳性率<0.05进行过滤,获得易位系中外源染色体片段中特异表达的转录本,作为候选转录本序列;
S4、分子标记开发:将获得的候选转录本序列与小麦参考基因序列进行比对,并根据比对结果找出候选转录本与小麦A/B/D基因组上同源基因之间的差异,根据差异序列设计EST标记及其检测引物;利用设计的EST标记在冰草Z559、Fukuhokumugi和易位系中进行PCR验证,从而验证外源染色体片段中特异表达的转录本的真实性;
S5、候选基因预测:对于步骤S4中获得的真实候选转录本序列,与小麦参考基因序列进行比对,进行比较基因组学分析,构建易位系中外源染色体片段与小麦A/B/D基因组间的比较基因组学图谱;对共线性候选区间内的基因进行功能注释,获得外源功能候选基因;
所述小麦-冰草易位系为普冰3035。
2.根据权利要求1所述的方法,其特征在于,步骤S1还包括对冰草全长转录组测序数据进行过滤、质控;具体方法为:使用IsoSeq3软件处理原始测序数据,首先,使用ccs算法进行分类,产生每个零模式波导孔中的共有序列,保留具有至少一个完整通道的序列用于后续分析;其次,使用Lima算法获得全长序列;最后,进行聚类和矫正获得高质量的冰草全长转录本。
3.根据权利要求1所述的方法,其特征在于,步骤S2还包括对原始测序数据进行质控、去污染和接头,得到高质量的测序数据;具体方法为:去除两端测序质量值小于20的碱基,小于25bp的测序读长将被去除,过滤使用Trimmomatic软件执行。
4.根据权利要求1所述的方法,其特征在于,步骤S4中所述EST标记包括WGRG8和WGRG9,它们的检测引物分别如下:
WGRG8_F:5′-TGCCAGTGGTGACCAATGCA-3′;
WGRG8_R:5′-ACTTGGGGAAGAGTCTCACT-3′;
WGRG9_F:5′-TCCAAATCCTCCAGCAAATC-3′;
WGRG9_R:5′-CCCGAGACCGAGCACTATAC-3′。
5.根据权利要求1-4任一项所述的方法,其特征在于,步骤S5获得的外源功能候选基因包括与小麦千粒重相关的候选基因transcript/2、transcript/4,它们的核苷酸序列分别如SEQ ID NO:1和2所示。
CN201910355215.8A 2019-04-29 2019-04-29 小麦远缘杂交后代小片段易位系中发掘外源功能候选基因的方法 Active CN110055317B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910355215.8A CN110055317B (zh) 2019-04-29 2019-04-29 小麦远缘杂交后代小片段易位系中发掘外源功能候选基因的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910355215.8A CN110055317B (zh) 2019-04-29 2019-04-29 小麦远缘杂交后代小片段易位系中发掘外源功能候选基因的方法

Publications (2)

Publication Number Publication Date
CN110055317A CN110055317A (zh) 2019-07-26
CN110055317B true CN110055317B (zh) 2022-04-26

Family

ID=67321561

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910355215.8A Active CN110055317B (zh) 2019-04-29 2019-04-29 小麦远缘杂交后代小片段易位系中发掘外源功能候选基因的方法

Country Status (1)

Country Link
CN (1) CN110055317B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112086128B (zh) * 2020-08-14 2024-05-10 南京派森诺基因科技有限公司 一种适用于Sequel测序的三代全长转录组测序结果分析方法

Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1924017A (zh) * 2006-09-15 2007-03-07 中国农业科学院作物科学研究所 冰草p基因组特异序列
CN101263782A (zh) * 2008-04-30 2008-09-17 中国科学院遗传与发育生物学研究所 一种小麦-黑麦t2bl.1rs新易位系种质的选育方法
CN101760472A (zh) * 2008-11-19 2010-06-30 李祥 外源基因导入小麦的概况分析
CN101760508A (zh) * 2008-11-19 2010-06-30 李祥 小麦-黑麦1bl/1rs易位系的鉴定方法研究
CN101755669A (zh) * 2008-12-19 2010-06-30 李祥 小麦野生近缘物种基因资源的发掘与利用
CN101760545A (zh) * 2008-12-19 2010-06-30 李祥 普通小麦背景中外源遗传物质的鉴定
CN101792797A (zh) * 2009-11-24 2010-08-04 南京农业大学 普通小麦-百萨偃麦草小片段易位系的选育方法及其分子标记
CN102277351A (zh) * 2010-06-10 2011-12-14 中国科学院上海生命科学研究院 从无基因组参考序列物种获得基因信息及功能基因的方法
CN102907316A (zh) * 2012-10-31 2013-02-06 中国农业科学院作物科学研究所 高效诱导小麦-冰草异源染色体易位的方法
CN103798132A (zh) * 2014-02-19 2014-05-21 中国科学院遗传与发育生物学研究所 一种规模化创制小麦异源易位系的方法
CN104109666A (zh) * 2014-05-26 2014-10-22 扬州大学 小麦背景中长穗偃麦草染色体特异标记及其应用
CN104365471A (zh) * 2014-11-06 2015-02-25 南京农业大学 一个软质、抗白粉病普通小麦-簇毛麦易位系的选育、鉴定方法
CN104789575A (zh) * 2015-04-27 2015-07-22 安徽农业大学 控制小麦千粒重的主效基因TaTGW-2D及其标记方法
CN105331605A (zh) * 2014-08-07 2016-02-17 中国农业科学院作物科学研究所 一种P基因组特异的Gypsy逆转座子及其应用
CN105368821A (zh) * 2014-08-07 2016-03-02 中国农业科学院作物科学研究所 一种P基因组近着丝粒区特异的Copia逆转座子及其应用
CN105441428A (zh) * 2014-08-07 2016-03-30 中国农业科学院作物科学研究所 一种冰草着丝粒特异的Gypsy逆转座子序列及其应用
CN106906281A (zh) * 2017-01-26 2017-06-30 中国农业科学院作物科学研究所 鉴定多花多粒小麦‑冰草渐渗系的snp分子标记及应用
CN106995845A (zh) * 2017-04-01 2017-08-01 中国科学院遗传与发育生物学研究所 利用三代测序平台(PacBio RS II)进行多倍体中基因等位变异挖掘的方法

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1924017A (zh) * 2006-09-15 2007-03-07 中国农业科学院作物科学研究所 冰草p基因组特异序列
CN101263782A (zh) * 2008-04-30 2008-09-17 中国科学院遗传与发育生物学研究所 一种小麦-黑麦t2bl.1rs新易位系种质的选育方法
CN101760472A (zh) * 2008-11-19 2010-06-30 李祥 外源基因导入小麦的概况分析
CN101760508A (zh) * 2008-11-19 2010-06-30 李祥 小麦-黑麦1bl/1rs易位系的鉴定方法研究
CN101755669A (zh) * 2008-12-19 2010-06-30 李祥 小麦野生近缘物种基因资源的发掘与利用
CN101760545A (zh) * 2008-12-19 2010-06-30 李祥 普通小麦背景中外源遗传物质的鉴定
CN101792797A (zh) * 2009-11-24 2010-08-04 南京农业大学 普通小麦-百萨偃麦草小片段易位系的选育方法及其分子标记
CN102277351A (zh) * 2010-06-10 2011-12-14 中国科学院上海生命科学研究院 从无基因组参考序列物种获得基因信息及功能基因的方法
CN102907316A (zh) * 2012-10-31 2013-02-06 中国农业科学院作物科学研究所 高效诱导小麦-冰草异源染色体易位的方法
CN103798132A (zh) * 2014-02-19 2014-05-21 中国科学院遗传与发育生物学研究所 一种规模化创制小麦异源易位系的方法
CN104109666A (zh) * 2014-05-26 2014-10-22 扬州大学 小麦背景中长穗偃麦草染色体特异标记及其应用
CN105331605A (zh) * 2014-08-07 2016-02-17 中国农业科学院作物科学研究所 一种P基因组特异的Gypsy逆转座子及其应用
CN105368821A (zh) * 2014-08-07 2016-03-02 中国农业科学院作物科学研究所 一种P基因组近着丝粒区特异的Copia逆转座子及其应用
CN105441428A (zh) * 2014-08-07 2016-03-30 中国农业科学院作物科学研究所 一种冰草着丝粒特异的Gypsy逆转座子序列及其应用
CN104365471A (zh) * 2014-11-06 2015-02-25 南京农业大学 一个软质、抗白粉病普通小麦-簇毛麦易位系的选育、鉴定方法
CN104789575A (zh) * 2015-04-27 2015-07-22 安徽农业大学 控制小麦千粒重的主效基因TaTGW-2D及其标记方法
CN106906281A (zh) * 2017-01-26 2017-06-30 中国农业科学院作物科学研究所 鉴定多花多粒小麦‑冰草渐渗系的snp分子标记及应用
CN106995845A (zh) * 2017-04-01 2017-08-01 中国科学院遗传与发育生物学研究所 利用三代测序平台(PacBio RS II)进行多倍体中基因等位变异挖掘的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
PRODUCTION AND CYTOGENETIC STUDY OF INTERO-ENERIC HYBRIDS BETWEEN Triticum aestivum AND Agropyron desertorum;LI LI-HUI等;《SCIENNC IN CHINA》;19910430;第34卷(第4期);第421-427页 *
冰草转录组测序揭示可用于小麦遗传改良的优异基因源;张锦鹏等;《第六届全国小麦基因组学及分子育种大会论文集中国作物学会会议论文集》;20150818;第80页 *

Also Published As

Publication number Publication date
CN110055317A (zh) 2019-07-26

Similar Documents

Publication Publication Date Title
Xie et al. A reference-grade wild soybean genome
Walkowiak et al. Multiple wheat genomes reveal global variation in modern breeding
Mamidi et al. A genome resource for green millet Setaria viridis enables discovery of agronomically valuable loci
Souza et al. Assembly of the 373k gene space of the polyploid sugarcane genome reveals reservoirs of functional diversity in the world's leading biomass crop
Golicz et al. The long intergenic noncoding RNA (LincRNA) landscape of the soybean genome
Sakai et al. The power of single molecule real-time sequencing technology in the de novo assembly of a eukaryotic genome
Sato History and future perspectives of barley genomics
Parween et al. An advanced draft genome assembly of a desi type chickpea (Cicer arietinum L.)
Verma et al. High-density linkage map construction and mapping of seed trait QTLs in chickpea (Cicer arietinum L.) using Genotyping-by-Sequencing (GBS)
Wu et al. De novo assembly of the common bean transcriptome using short reads for the discovery of drought-responsive genes
Su et al. A high-continuity and annotated tomato reference genome
Jia et al. Genome resequencing reveals demographic history and genetic architecture of seed salinity tolerance in Populus euphratica
Moisy et al. Characterization of ten novel Ty1/copia-like retrotransposon families of the grapevine genome
Acquadro et al. Whole genome resequencing of four Italian sweet pepper landraces provides insights on sequence variation in genes of agronomic value
Xie et al. PacBio single-molecule long-read sequencing shed new light on the transcripts and splice isoforms of the perennial ryegrass
Yang et al. The genome of the rice variety LTH provides insight into its universal susceptibility mechanism to worldwide rice blast fungal strains
Hu et al. Resequencing of 388 cassava accessions identifies valuable loci and selection for variation in heterozygosity
Nguyen et al. Tools for Chrysanthemum genetic research and breeding: Is genotyping-by-sequencing (GBS) the best approach?
Fangping et al. High-quality de novo genome assembly of Huajingxian 74, a receptor parent of single segment substitution lines
Adhikari et al. A high-throughput skim-sequencing approach for genotyping, dosage estimation and identifying translocations
Garg et al. Near‐gapless genome assemblies of Williams 82 and Lee cultivars for accelerating global soybean research
CN110055317B (zh) 小麦远缘杂交后代小片段易位系中发掘外源功能候选基因的方法
Wang et al. Upland rice genomic signatures of adaptation to drought resistance and navigation to molecular design breeding
Zhang et al. Finding new addictive QTL for yield traits based on a high-density genetic map in hybrid rice
Bouktila et al. Characterization of novel wheat NBS domain-containing sequences and their utilization, in silico, for genome-scale R-gene mining

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant