CN112204156A - 用于通过调节重组率来改善育种的系统和方法 - Google Patents

用于通过调节重组率来改善育种的系统和方法 Download PDF

Info

Publication number
CN112204156A
CN112204156A CN201980035353.6A CN201980035353A CN112204156A CN 112204156 A CN112204156 A CN 112204156A CN 201980035353 A CN201980035353 A CN 201980035353A CN 112204156 A CN112204156 A CN 112204156A
Authority
CN
China
Prior art keywords
trait
plant
population
recombination
marker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980035353.6A
Other languages
English (en)
Inventor
A·鲍姆加滕
J·李
G·D·梅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pioneer Hi Bred International Inc
Original Assignee
Pioneer Hi Bred International Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pioneer Hi Bred International Inc filed Critical Pioneer Hi Bred International Inc
Publication of CN112204156A publication Critical patent/CN112204156A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/6895Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for plants, fungi or algae
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H1/00Processes for modifying genotypes ; Plants characterised by associated natural traits
    • A01H1/06Processes for producing mutations, e.g. treatment with chemicals or with radiation
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H1/00Processes for modifying genotypes ; Plants characterised by associated natural traits
    • A01H1/12Processes for modifying agronomic input traits, e.g. crop yield
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/40Population genetics; Linkage disequilibrium

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Plant Pathology (AREA)
  • Cell Biology (AREA)
  • Botany (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Immunology (AREA)
  • Mycology (AREA)
  • Environmental Sciences (AREA)
  • Developmental Biology & Embryology (AREA)
  • Ecology (AREA)
  • Physiology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Farming Of Fish And Shellfish (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

披露了用于改善标记‑性状关联并用于改善性状渗入精度同时减少性状渗入时间的系统和方法。对负责重组的基因进行编辑以减弱功能,从而提高重组率。重组率提高允许更精确地对标记‑性状关联进行定量,并允许更精确和更快速的性状渗入。本文提供了可用于选择具有目的性状的生物的方法和组合物。通过上述方法中的任何一种鉴定和/或选择的候选生物也是令人感兴趣的。

Description

用于通过调节重组率来改善育种的系统和方法
相关申请的交叉引用
本申请要求2018年5月25日提交的美国临时申请号62/676,564和2018年12月21日提交的美国临时申请号62/783,537的优先权,每个临时申请均特此通过援引以其全文并入本文。
技术领域
本发明涉及利用因提高减数分裂重组率而增强的遗传多样性的育种方法。
背景技术
现代动植物育种方法可以使用基因型分析基于所需基因型进行选择,从而通过避免从育种事件到成熟再到表型使后代生长的需要而缩短育种周期。相反,可以通过从数量性状基因座(QTL)推断出的特定表型性状,或者通过对全基因组预测(WGP)的育种值的测量,从与特定基因型的已知统计关联中推断出表型。QTL和WGP方法均基于以下证据:两个染色体位置之间的重组频率与所述位置之间的DNA长度线性相关。在几项经典研究和现代研究中已观察到这种相关性,其中染色体紧密靠近的基因中的等位基因变异在统计上是相关的,并且产生新的等位基因组合的重组事件比具有更大染色体距离的基因受到更多的限制。
鉴于重组频率和基因组距离之间的这种关系,染色体变异和表型变异之间的统计关联表明观察到的染色体变异与促成表型的基因组变异接近。通过QTL映射和WGP方法使用这些关联(通常称为标记-性状关联或MTA)来统计性估计促成特定表型的基因组变异的染色体位置。然后将MTA用于育种计划,以通过调查和选择与表型相关的标记来选择改良的表型。
育种计划需要先使用经验性实验或现有数据建立经过验证的MTA,然后再利用它们进行选择。传统上,将离散的个体家族用遗传标记进行基因型分析,针对具有商业价值的性状进行表型分析,并且确定遗传标记与表型变异之间的显著统计关联。相反,可以对具有现有表型数据的个体进行基因型分析以建立MTA。无论采用哪种方法,MTA的质量及其在选择有益表型中的有效性都取决于相关标记与促成表型变异的序列之间的染色体距离。这两个基因座之间的距离越大会增加重组将解耦两个基因座之间的等位基因变异的统计关联的机会,从而使该关联无法用于其他杂交或世代。
在育种领域中需要通过减少重组事件对解耦相关基因座之间的等位基因变异的统计关联的影响来改善MTA中的统计关联。在育种领域中需要使用MTA来提高使理想性状渗入的能力,同时限制不良性状的渗入。
发明内容
本文描述了用于增加生物中遗传标记与相关遗传性状之间的关联的方法。所述性状可以是任何目的性状。所述方法可以包括以下步骤:编辑所述生物种群中的一个或多个成员的基因组,以调节减数分裂期间参与重组的一个或多个基因的活性,从而提高所述种群中的减数分裂重组率或重组频率。所述方法还可以包括使所述种群的每个成员受精以产生第二代后代种群。在一些方面,所述方法包括使用与多态性基因组区域相关的一组标记对所述第二代后代种群的每个成员进行基因型分析。可以针对与所述多态性基因组区域表相关的性状对所述第二代后代种群的成员进行表型分析。在一些实施例中,例如,在第二代后代种群中对标记-性状关联进行定量,以确定遗传标记和相关的标记-性状关联之间的关联的变化。标记-性状关联可以增加、减少或保持不变。在一些实施例中,标记-性状关联可以具有增加的连锁、增加的统计关联或相关性或其组合。在一些实施例中,所述生物是植物、哺乳动物、昆虫、微生物或任何其他目的生物。在一些实施例中,对一种或多种玉米植株进行所述方法。在一些实施例中,受精步骤通过自花授粉进行。
本文披露了选择具有目的性状的生物的方法。所述性状可以是任何目的性状。在一些方面,所述生物是但不限于植物、动物、昆虫、微生物或其他目的微生物。在一些实施例中,所述方法包括提供包括基因型数据、表型数据或其组合的数据集。所述数据可以获自:(i)生物种群,其中所述种群中的一种或多种生物包含一个或多个引入的遗传修饰,与不包含所述一个或多个引入的遗传修饰的对照生物相比,所述遗传修饰增加所述一种或多种生物中的减数分裂重组,和/或(ii)源自亲本种群的生物种群。所述亲本种群包括一种或多种包含一个或多个引入的遗传修饰的亲本生物,与不包含所述一个或多个引入的遗传修饰的对照生物相比,所述遗传修饰增加一种或多种亲本生物中的减数分裂重组。所述生物可来自回交种群或分离种群。
在一些方面,所述方法包括在所述数据集中鉴定或生成一种或多种与所述生物种群中的所述目的性状相关的标记-性状关联。
所述生物种群具有一种或多种表型标记、基因型标记或其组合。在一些方面,所述生物种群由于一个或多个引入的遗传修饰而表现出一种或多种表型标记或基因型标记,与不含所述引入的遗传修饰的对照生物相比,所述遗传修饰增加减数分裂重组。在一些实施例中,所述标记-性状关联可以是新赋予的。
在一些实施例中,所述标记-性状关联可以增加、减少或保持不变。在一些实施例中,与对照中相应的标记-性状关联相比,所述标记-性状关联可以具有增加的连锁、增加的统计关联或相关性或其组合。
在一些实施例中,所述方法包括筛选、选择或鉴定候选生物、候选生物种群或其基因型数据和/或其表型数据中存在或不存在一种或多种与目的性状相关的标记-性状关联。在一些实施例中,所述候选生物或所述候选生物种群(i)不含引入的遗传修饰和/或(ii)不是从含有或已含有所述一个或多个引入的遗传修饰的生物或生物种群获得的。在一些实施例中,与不含引入的遗传修饰的对照相比,在生物或生物种群的基因组中或基因组的很大一部分中减数分裂重组增加。在一些方面,增加的减数分裂重组是与对照相比,整个基因组或部分基因组中的减数分裂重组频率或减数分裂交换事件的增加。
可以基于存在或不存在一种或多种与所述目的性状相关的标记-性状关联来选择所述候选生物或候选生物种群。在一些实施例中,所述标记-性状关联是标记和所述目的性状之间已知或预测的负关联。在一些方面,所述方法包括基于不存在负关联而选择所述候选生物或所述候选生物种群。
在一些实施例中,所述标记-性状关联是标记和所述目的性状之间已知或预测的正关联。在一些方面,所述方法包括基于存在正关联而选择所述候选生物或所述候选生物种群。
在一些实施例中,所述基因型数据是核苷酸变异数据。所述变异数据可以包括但不限于单核苷酸多态性(SNP)、单倍型、简单序列重复(SSR)、微RNA、siRNA、数量性状基因座(QTL)、转基因、缺失、mRNA、甲基化模式或基因表达模式或其组合。
在一些实施例中,所述核苷酸变异数据可以包括但不限于来自以下一种或多种的基因型数据:限制性片段长度多态性(RFLP)、靶区域扩增多态性(TRAP)、同工酶电泳、随机扩增多态性DNA(RAPD)、任意引物聚合酶链式反应(AP-PCR)、DNA扩增指纹分析(DAF)、序列特征性扩增区域(SCAR)、扩增片段长度多态性(AFLP)或其组合。在一些实施例中,所述数据集包括但不限于全基因组核苷酸变异-表型关联。
在一些实施例中,当所述生物是植物时,表型数据包括但不限于关于以下方面的数据:产量(诸如增产量、谷物产量、青贮饲料产量)、根抗倒伏、茎秆抗倒伏性、脆断抗性、穗高、穗长、谷粒行数、每行谷粒数、谷粒大小、谷粒数量、谷物水分、株高、耐密性、荚数、每荚籽粒数、成熟度、开花时间、开花热量单位、开花天数、抗病性、耐旱性、耐寒性、耐热性、耐盐性、抗胁迫性、除草剂耐受性、开花时间、颜色、抗真菌性、抗病毒性、雄性不育、雌性不育、茎秆强度、淀粉含量、油性、氨基酸平衡、赖氨酸水平、蛋氨酸水平、消化性、纤维质量或其组合。
在一些实施例中,通过将一个或多个核苷酸取代、添加和/或缺失在遗传上引入所述生物的基因组中以增加一个或多个起到促进减数分裂重组功能的基因的活性,而将所述生物(包括但不限于植物、动物、昆虫、微生物或其他目的微生物)修饰为具有增加的减数分裂重组。在一些方面,所述方法包括将一种或多种多核苷酸在遗传上引入所述生物的基因组中以增加一个或多个起到促进减数分裂重组功能的基因的表达水平或活性。在一些方面,起到促进减数分裂重组功能的基因包括但不限于HEI10、MSH4/MSH5 MutS相关异二聚体、MER3DNA解旋酶、SHORTAGE OF CROSSOVERS1(SHOC1)XPF核酸酶、PARTING DANCERS(PTD)、ZIP4/SPO22、Zip1、Zip2、Zip3、Zip4、Msh4、Msh5、Mlh1/Mlh3、其同源物、其直系同源物或其组合。
在一些实施例中,通过将一个或多个核苷酸取代、添加和/或缺失在遗传上引入所述生物的基因组中以降低一个或多个起到抑制减数分裂重组功能的基因的活性,而将所述生物(包括但不限于植物、动物、昆虫、微生物或其他目的微生物)修饰为具有增加的减数分裂重组。在一些方面,起到抑制重组功能的所述一个或多个基因包括但不限于FANCM、MHF1、MHF2、FIDGETIN-LIKE1、RECQ4、拓扑异构酶3α、RMI1、RMI2、RTEL1、其同源物、其直系同源物或其组合。
可以使用任何合适的技术或方法来引入所述一个或多个核苷酸取代、添加和/或缺失。在一些方面,使用基因组编辑技术引入所述一个或多个核苷酸取代、添加和/或缺失。在一些实例中,基因组编辑技术包括内切核酸酶,内切核酸酶包括但不限于Cas/CRISPR、大范围核酸酶、锌指核酸酶(ZFN)或转录激活因子样效应子核酸酶(TALEN)或其组合。在一些方面,使用辐射、化学诱变或转座子引入所述一个或多个核苷酸取代、添加和/或缺失。在一些实施例中,通过使用RNA技术阻抑一个或多个起到抑制减数分裂重组功能的基因的活性,而将所述一种或多种生物例如植物、微生物、昆虫或动物修饰为具有增加的减数分裂重组。可以使用任何合适的RNA阻抑技术,包括但不限于RNAi、微RNA、shRNA或其组合。在一些方面,所述方法包括使选定的候选生物或候选生物种群生长。
本文还提供了一种选择具有目的性状的生物的方法,其包括基于存在或不存在一种或多种与目的性状相关的标记-性状关联来选择候选生物的步骤。在一些方面,所述生物是植物、动物、昆虫或微生物,或其他目的生物。在一些实施例中,对一种或多种玉米植株进行所述方法。所述性状可以是任何目的性状。
所述标记-性状关联可以来自于包含基因型数据和/或表型数据的数据集,所述基因型数据和/或表型数据获自:(i)生物种群,其中所述种群中的一种或多种生物包含一个或多个引入的遗传修饰,与不包含所述一个或多个引入的遗传修饰的对照植物相比,所述遗传修饰增加一种或多种生物中的减数分裂重组;和/或(ii)源自亲本种群的生物种群,其中所述亲本生物中的一种或多种含有一个或多个引入的遗传修饰,与不含所述遗传修饰的对照生物相比,所述遗传修饰增加减数分裂重组。在一些方面,当所述生物是植物时,所述种群中的所述一种或多种植物包括双单倍体植物、近交系、杂交植物、其后代或其组合。所述植物可来自回交种群或分离种群。
所述生物种群具有一种或多种表型标记、基因型标记或其组合。在一些方面,所述生物种群由于一个或多个引入的遗传修饰而表现出一种或多种表型标记或基因型标记,与不含所述引入的遗传修饰的对照生物相比,所述遗传修饰增加减数分裂重组。在一些实施例中,所述标记-性状关联可以是新赋予的。在一些实施例中,所述标记-性状关联可以鉴定、产生或更新,或其组合。
在一些实施例中,所述标记-性状关联可以增加、减少或保持不变。在一些实施例中,与对照中相应的标记-性状关联相比,所述标记-性状关联可以具有增加的连锁、增加的统计关联或相关性或其组合。
在一些实施例中,与不含引入的遗传修饰的对照相比,在生物或生物种群的基因组中或基因组的很大一部分中减数分裂重组增加。在一些方面,增加的减数分裂重组可以是与对照相比,整个基因组或部分基因组中的减数分裂重组频率或减数分裂交换事件的增加。
可以基于存在或不存在一种或多种与所述目的性状相关的标记-性状关联来选择所述候选生物或候选生物种群。在一些实施例中,所述标记-性状关联是标记和所述目的性状之间已知或预测的负关联。在一些方面,所述方法包括基于不存在负关联而选择所述候选生物或所述候选生物种群。
在一些实施例中,所述标记-性状关联是标记和所述目的性状之间已知或预测的正关联。在一些方面,所述方法包括基于存在正关联而选择所述候选生物或所述候选生物种群。
在一些实施例中,所述基因型数据是核苷酸变异数据。所述变异数据可以包括但不限于单核苷酸多态性(SNP)、单倍型、简单序列重复(SSR)、微RNA、siRNA、数量性状基因座(QTL)、转基因、缺失、mRNA、甲基化模式或基因表达模式或其组合。
在一些实施例中,所述核苷酸变异数据可以包括但不限于来自以下一种或多种的基因型数据:限制性片段长度多态性(RFLP)、靶区域扩增多态性(TRAP)、同工酶电泳、随机扩增多态性DNA(RAPD)、任意引物聚合酶链式反应(AP-PCR)、DNA扩增指纹分析(DAF)、序列特征性扩增区域(SCAR)、扩增片段长度多态性(AFLP)或其组合。在一些实施例中,所述数据集包括但不限于全基因组核苷酸变异-表型关联。所述性状可以是任何目的性状。
在一些实施例中,当所述生物是植物时,表型数据包括但不限于关于以下方面的数据:产量(诸如增产量、谷物产量、青贮饲料产量)、根抗倒伏、茎秆抗倒伏性、脆断抗性、穗高、穗长、谷粒行数、每行谷粒数、谷粒大小、谷粒数量、谷物水分、株高、耐密性、荚数、每荚籽粒数、成熟度、开花时间、开花热量单位、开花天数、抗病性、耐旱性、耐寒性、耐热性、耐盐性、抗胁迫性、除草剂耐受性、开花时间、颜色、抗真菌性、抗病毒性、雄性不育、雌性不育、茎秆强度、淀粉含量、油性、氨基酸平衡、赖氨酸水平、蛋氨酸水平、消化性、纤维质量或其组合。
在一些实施例中,通过将一个或多个核苷酸取代、添加和/或缺失在遗传上引入所述生物的基因组中以增加一个或多个起到促进减数分裂重组功能的基因的活性,而将所述生物(包括但不限于植物、动物、昆虫、微生物或其他目的微生物)修饰为具有增加的减数分裂重组。在一些方面,所述方法包括将一种或多种多核苷酸引入所述生物的基因组中以增加一个或多个起到促进减数分裂重组功能的基因的表达水平或活性。在一些方面,起到促进减数分裂重组功能的基因包括但不限于HEI10、MSH4/MSH5 MutS相关异二聚体、MER3 DNA解旋酶、SHORTAGE OF CROSSOVERS1(SHOC1)XPF核酸酶、PARTING DANCERS(PTD)、ZIP4/SPO22、Zip1、Zip2、Zip3、Zip4、Msh4、Msh5、Mlh1/Mlh3、其同源物、其直系同源物或其组合。
在一些实施例中,通过将一个或多个核苷酸取代、添加和/或缺失在遗传上引入所述生物的基因组中以降低一个或多个起到抑制减数分裂重组功能的基因的活性,而将所述生物(包括但不限于植物或动物)修饰为具有增加的减数分裂重组。在一些方面,起到抑制重组功能的所述一个或多个基因包括但不限于FANCM、MHF1、MHF2、FIDGETIN-LIKE1、RECQ4、拓扑异构酶3α、RMI1、RMI2、RTEL1、其同源物、其直系同源物或其组合。
可以使用任何合适的技术或方法来引入所述一个或多个核苷酸取代、添加和/或缺失。在一些方面,使用基因组编辑技术引入所述一个或多个核苷酸取代、添加和/或缺失。在一些实例中,基因组编辑技术包括内切核酸酶,内切核酸酶包括但不限于Cas/CRISPR、大范围核酸酶、锌指核酸酶(ZFN)或转录激活因子样效应子核酸酶(TALEN)或其组合。在一些方面,使用辐射、化学诱变或转座子引入所述一个或多个核苷酸取代、添加和/或缺失。在一些实施例中,通过使用RNA技术阻抑一个或多个起到抑制减数分裂重组功能的基因的活性,而将所述一种或多种生物例如植物、微生物、昆虫或动物修饰为具有增加的减数分裂重组。可以使用任何合适的RNA阻抑技术,包括但不限于RNAi、微RNA、shRNA或其组合。
在一些方面,所述方法包括使选定的候选生物或候选生物种群生长。
本文提供了选择具有目的性状的植物的方法。在一些方面,所述植物是双子叶植物或单子叶植物。在一些实施例中,所述方法包括提供包括基因型数据、表型数据或其组合的数据集。
所述数据可以获自:(i)植物种群,其中所述种群中的一种或多种植物包含一个或多个引入的遗传修饰,与不包含所述一个或多个引入的遗传修饰的对照植物相比,所述遗传修饰增加一种或多种植物中的减数分裂重组,和/或(ii)源自亲本种群的植物种群,其中所述亲本植物中的一种或多种含有一个或多个引入的遗传修饰,与不含所述遗传修饰的对照植物相比,所述遗传修饰增加减数分裂重组。在一些方面,所述种群中的一种或多种植物包括双单倍体植物、近交系、杂交植物、其后代或其组合。所述植物可来自回交种群或分离种群。所述植物种群具有一种或多种表型标记、基因型标记或其组合。
在一些方面,所述方法包括在所述数据集中鉴定或生成一种或多种与所述植物种群中的所述目的性状相关的标记-性状关联。在一些方面,所述生物种群由于一个或多个引入的遗传修饰而表现出一种或多种表型标记或基因型标记,与不含引入的遗传修饰的对照植物相比,所述遗传修饰增加减数分裂重组。在一些实施例中,所述标记-性状关联可以是新赋予的。
在一些实施例中,所述标记-性状关联可以增加、减少或保持不变。在一些实施例中,与对照中相应的标记-性状关联相比,所述标记-性状关联可以具有增加的连锁、增加的统计关联或相关性或其组合。
在一些实施例中,所述方法包括筛选、选择或鉴定候选植物、候选植物种群或其基因型数据和/或其表型数据中存在或不存在一种或多种与目的性状相关的标记-性状关联。在一些实施例中,所述候选植物或所述候选植物种群(i)不含引入的遗传修饰和/或(ii)不是从含有或已含有所述一个或多个引入的遗传修饰的植物种群获得的。在一些实施例中,与不含引入的遗传修饰的对照相比,在植物或植物种群的基因组中或基因组的很大一部分中减数分裂重组增加。在一些方面,增加的减数分裂重组可以是与对照相比,整个基因组或部分基因组中的减数分裂重组频率或减数分裂交换事件的增加。
可以基于存在或不存在一种或多种与所述目的性状相关的标记-性状关联来选择所述候选植物或候选植物种群。在一些实施例中,所述标记-性状关联是标记和所述目的性状之间已知或预测的负关联。在一些方面,所述方法包括基于不存在负关联而选择所述候选植物或所述候选植物种群。
在一些实施例中,所述标记-性状关联是标记和所述目的性状之间已知或预测的正关联。在一些方面,所述方法包括基于存在正关联而选择所述候选植物或所述候选植物种群。
在一些实施例中,所述基因型数据是核苷酸变异数据。所述变异数据可以包括但不限于单核苷酸多态性(SNP)、单倍型、简单序列重复(SSR)、微RNA、siRNA、数量性状基因座(QTL)、转基因、缺失、mRNA、甲基化模式或基因表达模式或其组合。
在一些实施例中,所述核苷酸变异数据可以包括但不限于来自以下一种或多种的基因型数据:限制性片段长度多态性(RFLP)、靶区域扩增多态性(TRAP)、同工酶电泳、随机扩增多态性DNA(RAPD)、任意引物聚合酶链式反应(AP-PCR)、DNA扩增指纹分析(DAF)、序列特征性扩增区域(SCAR)、扩增片段长度多态性(AFLP)或其组合。在一些实施例中,所述数据集包括但不限于全基因组核苷酸变异-表型关联。
所述性状可以是任何目的性状。在一些实施例中,目的性状是基于遗传、环境或遗传与环境的相互作用的一组可观察特征。在一些方面,目的性状包括但不限于颜色、产量、基因表达、染色质表达、穗高、穗长、谷粒行数、每行谷粒数、抗病性、抗胁迫性、除草剂耐受性或开花时间。
在一些实施例中,当所述生物是植物时,表型数据包括但不限于关于以下方面的数据:产量(诸如增产量、谷物产量、青贮饲料产量)、根抗倒伏、茎秆抗倒伏性、脆断抗性、穗高、穗长、谷粒行数、每行谷粒数、谷粒大小、谷粒数量、谷物水分、株高、耐密性、荚数、每荚籽粒数、成熟度、开花时间、开花热量单位、开花天数、抗病性、耐旱性、耐寒性、耐热性、耐盐性、抗胁迫性、除草剂耐受性、开花时间、颜色、抗真菌性、抗病毒性、雄性不育、雌性不育、茎秆强度、淀粉含量、油性、氨基酸平衡、赖氨酸水平、蛋氨酸水平、消化性、纤维质量或其组合。
在一些实施例中,通过将一个或多个核苷酸取代、添加和/或缺失在遗传上引入所述植物的基因组中以增加一个或多个起到促进减数分裂重组功能的基因的活性,而将所述植物修饰为具有增加的减数分裂重组。在一些方面,所述方法包括将一种或多种多核苷酸引入所述植物的基因组中以增加一个或多个起到促进减数分裂重组功能的基因的表达水平或活性。在一些方面,起到促进减数分裂重组功能的基因包括但不限于HEI10、MSH4/MSH5、Mlh1/Mlh3、MutS相关异二聚体、MER3 DNA解旋酶、SHORTAGE OF CROSSOVERS1(SHOC1)XPF核酸酶、PARTING DANCERS(PTD)、ZIP4/SPO22、Zip1、Zip2、Zip3、Zip4、Msh4、Msh5、Mlh1/Mlh3、其同源物及其直系同源物或其组合。
在一些实施例中,通过将一个或多个核苷酸取代、添加和/或缺失在遗传上引入所述植物的基因组中以降低一个或多个起到抑制减数分裂重组功能的基因的活性,而将所述植物修饰为具有增加的减数分裂重组。在一些方面,起到抑制重组功能的所述一个或多个基因包括但不限于FANCM、MHF1、MHF2、FIDGETIN-LIKE1、RECQ4、拓扑异构酶3α、RMI1、RMI2、RTEL1、其同源物、其直系同源物或其组合。
可以使用任何合适的技术或方法来引入所述一个或多个核苷酸取代、添加和/或缺失。在一些方面,使用基因组编辑技术引入所述一个或多个核苷酸取代、添加和/或缺失。在一些实例中,基因组编辑技术包括内切核酸酶,内切核酸酶包括但不限于Cas/CRISPR、大范围核酸酶、锌指核酸酶(ZFN)或转录激活因子样效应子核酸酶(TALEN)或其组合。在一些方面,使用辐射、化学诱变或转座子引入所述一个或多个核苷酸取代、添加和/或缺失。在一些实施例中,通过使用RNA技术阻抑一个或多个起到抑制减数分裂重组功能的基因的活性,而将所述一种或多种植物修饰为具有增加的减数分裂重组。可以使用任何合适的RNA阻抑技术,包括但不限于RNAi、微RNA、shRNA或其组合。
在本文提供的方法中可以使用任何植物,包括但不限于大豆、玉米、高粱、棉花、油菜籽、向日葵、水稻、小麦、甘蔗、紫花苜蓿烟草、大麦、木薯、花生、粟、油棕、马铃薯、黑麦或甜菜植物。在一些实施例中,所述方法包括的植物为大豆、玉米、高粱、棉花、油菜籽、向日葵、水稻、小麦、甘蔗、紫花苜蓿烟草、大麦、木薯、花生、粟、油棕、马铃薯、黑麦或甜菜植物。因此,任何植物种群均可与本文提供的方法一起使用,包括但不限于以下种群:大豆、玉米、高粱、棉花、油菜籽、向日葵、水稻、小麦、甘蔗、紫花苜蓿烟草、大麦、木薯、花生、粟、油棕、马铃薯、黑麦或甜菜植物。在一些实施例中,所述基因型数据和/或表型数据是从以下种群获得的:大豆、玉米、高粱、棉花、油菜籽、向日葵、水稻、小麦、甘蔗、紫花苜蓿烟草、大麦、木薯、花生、粟、油棕、马铃薯、黑麦或甜菜植物。在一些实施例中,所述方法包括从候选大豆、玉米、高粱、棉花、油菜籽、向日葵、水稻、小麦、甘蔗、紫花苜蓿烟草、大麦、木薯、花生、粟、油棕、马铃薯、黑麦或甜菜植物种群中筛选、选择或鉴定候选植物种群或其基因型数据和/或表型数据。在一些实施例中,所述植物种群包括来自双单倍体的植物、近交植物、杂交植物或其组合。在一些实施例中,所述候选植物种群包括由两种近交亲本植物的杂交产生的种子。
在一些方面,所述方法包括使选定的候选植物或候选植物种群生长。
本文提供了选择具有目的性状的生物或选择具有所需基因型的生物的方法。在一些实施例中,所述生物是植物、哺乳动物、昆虫、微生物或任何其他目的生物。在一些实施例中,对一种或多种玉米植株进行所述方法。所述性状可以是任何目的性状。
在一些方面,所述方法包括提供包含从生物群获得的基因型数据和/或表型数据的数据集。所述种群中的所述一种或多种生物(i)与对照生物相比,由于重组调节因素而表现出经调节的重组模式和/或(ii)是与对照生物相比,由于重组调节因素而表现出经调节的减数分裂重组的一种或多种亲本生物的子代,并且其中所述生物种群包含一种或多种表型标记或基因型标记或其组合。可以鉴定或生成所述数据集中与所述生物种群中的目的性状或所需基因型相关的一种或多种标记-性状关联。
在一些方面,所述生物种群由于一个或多个引入的遗传修饰而表现出一种或多种表型标记或基因型标记,与不含所述引入的遗传修饰的对照生物相比,所述遗传修饰增加减数分裂重组。在一些实施例中,所述标记-性状关联可以是新赋予的。
在一些实施例中,所述标记-性状关联可以增加、减少或保持不变。在一些实施例中,与对照中相应的标记-性状关联相比,所述标记-性状关联可以具有增加的连锁、增加的统计关联或相关性或其组合。
所述方法还包括筛选候选生物或候选生物种群中存在或不存在一种或多种与所述目的性状相关的标记-性状关联,其中所述候选生物或所述候选生物种群(i)不包含由于所述调节因素而产生的经调节的重组模式和/或(ii)不是由于重组调节而表现出经调节的减数分裂重组的亲本生物的子代。
可以基于存在或不存在一种或多种与所述目的性状相关的标记-性状关联来选择所述候选生物或候选生物种群。在一些实施例中,所述标记-性状关联是标记和所述目的性状之间已知或预测的负关联。在一些方面,所述方法包括基于不存在负关联而选择所述候选生物或所述候选生物种群。
在一些实施例中,所述标记-性状关联是标记和所述目的性状之间已知或预测的正关联。在一些方面,所述方法包括基于存在正关联而选择所述候选生物或所述候选生物种群。
所述重组调节因素可以是引入的遗传修饰、化学重组调节因素、生物重组调节因素、外源施加的重组调节因素、辐射、内源基因激活、内源基因阻抑、瞬时重组调节因素或其组合。在一些方面,所述重组调节因素是通过位点特异性CRISPR-Cas系统引入的遗传修饰。在一些方面,所述重组调节因素是通过位点特异性核碱基编辑器引入的没有双链DNA断裂的遗传修饰。
在一些实施例中,经调节的重组可以是与对照相比,整个基因组或部分基因组中的减数分裂重组频率或减数分裂交换事件的增加。在一些实施例中,经调节的重组可以是与对照相比,所述生物的整个基因组或部分基因组中的减数分裂重组频率或减数分裂交换事件的减少。在一些方面,经调节的重组引起交换干扰减少。在本文提供的方法和组合物中可以使用任何调节重组的方法。
附图说明
从以下详细描述和构成本申请的一部分的附图(将其通过援引并入本文)可以更全面地理解本披露。
图1是草图,其显示使用基因组编辑技术诸如Cas9 CRISPR技术编辑玉米品系的基因组(A),使用Cas9 CRISPR技术编辑玉米品系的基因组以破坏抑制减数分裂重组的天然基因(B),使用Cas9 CRISPR技术编辑玉米品系的基因组以插入促进减数分裂重组的基因(C),以及使用Cas9 CRISPR技术编辑玉米品系的基因组以破坏抑制减数分裂重组的天然基因并插入促进减数分裂重组的基因(D)。
图2是草图,其显示来自图1的经基因组编辑的玉米品系与某一玉米品系(品系A)杂交产生具有增加的减数分裂重组的玉米植物种群(种群A)。品系A可以与图1的经基因组编辑的玉米品系相同或不同。例如,品系A可以是经过编辑而具有增加的减数分裂重组的玉米品系、未经修饰/未经编辑的玉米品系、或经过编辑而影响不同性状的玉米品系。
图3是草图,其显示允许来自图2的种群A的植物自花授粉或与某一玉米品系(品系B)杂交产生具有增加的减数分裂重组的玉米植物种群(种群B)。
图4是草图,其显示对例如来自图1、图2或图3的玉米植物的具有增加的减数分裂重组的穗进行授粉。所述穗可以用来自另一植物的花粉进行授粉或者可以自花授粉以产生受精植物。例如,在一个实施例中,F1穗对于敲除增加减数分裂重组的基因而言是杂合的,并且可以自花授粉以产生F2种群。
图5是草图,其显示用具有增加的减数分裂重组的花粉,例如来自图1、图2或图3的玉米植物的花粉对穗进行授粉以产生受精植物。
图6是示出本披露的一个实施例的示意图的草图。(A)种植来自于经过编辑而具有增加的减数分裂重组(或源自其子代植物)的植物基因组的谷粒并使其生长;(B)从植物中提取DNA并进行基因型分析;(C)针对目的性状,例如穗高或株高对植物进行表型分析;(D)分析基因型数据和表型数据的标记-性状关联(MTA);(E)将MTA用于标记辅助选择(MAS),以选择或反选候选玉米品系,以供进一步使用/不使用,例如在育种计划中。这些品系可以是经过基因组编辑的,也可以是未编辑的或经修饰的。
图7是草图,其显示了后代中由于其亲本基因组DNA的很大一部分中的同源重组而产生的新DNA组合,所述重组和新DNA组合是使用本文所述的增加减数分裂重组的方法中的一种的结果。
图8是本披露的一个实施例的草图,其显示可以针对促成目的性状(例如,较矮的株高)或与目的性状相关的单个基因或一组基因来评价来自具有增加的减数分裂重组的植物种群的玉米品系中的标记-性状关联。品系1和品系2是对于其各自的基因1、基因2和基因3而言为纯合的玉米品系。由于使用本文所述的方法增加了减数分裂重组,因此品系1和品系2中的基因2进行了同源重组而产生品系3和品系4。因此,在品系3和品系4中来自品系1的基因1和SNP1不再与来自品系1的基因2或基因3和SNP2连锁;在所得到的品系3和品系4中来自品系2的基因1和SNP3不再与来自品系2的基因2或基因3和SNP4连锁。因此,使用本文所述的方法,现在可以观察和鉴定具有以冲突或不同的方式影响相同性状的一个或多个连锁基因的基因组区域,而先前可能已经忽略了含有连锁基因1-3的基因组区域,并且忽视了该基因组区域对株高的贡献,因为在品系1和品系2中不会观察到对株高的实际影响。因此,使用本文所述的方法,可以分解连锁基因,从而允许鉴定功能等位基因的新组合,例如基因1和基因3。与降低(较矮)的株高相关的SNP2和/或SNP3可用于MAS中以选择株高降低(较矮)的植物,而与增高(较高)的株高相关的SNP1和/或SNP4可用于MAS中以反选株高增高(较高)的植物。
图9是流程图,其描绘了用于育种计划的典型或经典推进过程与基于本文所述方法的用于育种计划的推进过程的一个实施例。上:在经典推进过程中,对表型生物种群进行基因型分析和表型分析以确定基因型-表型关联,以便可以选择生物进行进一步测试。下:使用本文所述的推进过程的一个实施例,对非表型生物种群进行基因型分析并基于预测所需目的性状/与所需目的性状相关的标记-性状关联进行选择,以便可以选择生物进行进一步测试。
图10是流程图,其描绘了用于育种计划的典型或经典非推进过程与基于本文所述方法的用于育种计划的非推进过程的一个实施例。上:在经典非推进过程中,对表型生物种群进行基因型分析和表型分析以确定基因型-表型关联,以便可以反选具有非所需性状的生物和/或将其从育种计划中去除。下:使用本文所述的非推进过程的一个实施例,对非表型生物种群进行基因型分析并基于预测不良目的性状/与不良目的性状相关的标记-性状关联进行反选,以便可以反选具有非所需性状的生物和/或将其从育种计划中去除。
图11示出了两个柱状图,其以图形表示来自如本文实例1中所讨论的F2或F3家族的子代的玉米株高数据(以cm计)(A)或穗高数据(以cm计)(B)的定量。
具体实施方式
本文引用的所有专利、专利申请和出版物的披露内容通过援引以其全文并入。
除非上下文另外明确指示,否则本文和所附权利要求中所使用的单数形式“一个/一种(a/an)”和“该/所述(the)”包括复数指示物。因此,例如,提及“植物”包括多个这样的植物,提及“细胞”包括本领域技术人员已知的一种或多种细胞及其等同物等。
提高重组率可以通过破坏不太可能被分别观察到的遗传上接近的标记之间的连锁来帮助改善标记-性状关联,从而提高了MTA统计数据的分辨率。在建立MTA的实验中提高遗传标记密度和重组频率可以帮助限制重组破坏统计关联的机会。基因组技术的进步使得分子标记可以非常靠近基因组内的所有基因,从而确保可观察到的染色体变异接近于造成特定表型的变异。然而,在创建标记性状关联时,在建立MTA的实验中在种群中发现的重组量往往比遗传标记密度更为重要。在初始实验中,实验条目之间较高的重组水平使促成表型的基因组变异位置得以用遗传标记精确地估计。传统上,在实验中已经通过开发特定种群(诸如重组近交系以及合成和嵌套关联映射种群)来增加重组。这些类型的种群可以大大增加重组频率,但是也增加了种群开发所需的成本和时间。
提高重组率可用于靶向性状渗入,同时保留靶向性状受者的遗传背景。重组频率可以影响标记性状关联的应用,即使在该关联与影响表型的基因组变异完全相关时。植物和动物育种计划已经开发出使有益性状快速渗入优良育种种质中的方法。渗入效率直接取决于MTA周围的重组频率。较低的重组频率将需要另外的世代或更大的种群规模,才能成功地渗入有益性状,同时将来自于携带有益性状的育种伴侣的有害遗传物质的渗入最小化。较低的重组频率可以增加渗入的染色体区段,从而渗入有益性状,但也会渗入促成不良表型性状的其他基因座。然而,提高重组率使杂交产生的种群中的一些成员具有所需性状,但不良遗传较少。
全基因组测序的出现已经证明重组频率与染色体距离可以基于染色体同一性和基因组区域而改变。例如,玉米基因组的近着丝粒区显示出重组受阻,从而导致大的染色体区段几乎没有重组。这种重组的缺乏直接影响玉米育种计划,其中低重组频率在影响有商业价值的性状的基因的等位基因变异之间保持着不利的连锁。玉米育种者需要使用更大的种群才能使重组破坏这些连锁以创造有利的等位基因组合。
已经鉴定了植物、微生物和动物中控制重组的几种基因。通常,在植物中这些基因倾向于限制重组以确保基因组稳定性。这些基因中的一些可能不直接使基因组的特定区域靶向重组,而是整体上提高整个基因组的重组频率。敲除这些影响重组的基因的研究已导致每次减数分裂的重组频率普遍增加。使用基因编辑来修饰这些基因的研究为创造具有更高重组频率或重组率的植物提供了可能性。这种重组的增加可以通过提高MTA检测的准确性,提高将MTA渗入优良种质中的精度(并因此提高渗入速度),并破坏育种种质内毁灭性的、不利的连锁而直接使植物育种计划受益。本文披露的实例描述了如何使用基因编辑型式的影响重组的基因来提高标记-性状关联实验的精度,以及如何使转基因或天然性状精确地渗入优良育种种质中。参见,例如,本文其他地方提供的实例1和实例2。
本文披露了选择具有目的性状的生物的方法。本文所述的方法不限于确定任何特定性状或一组性状。
选定的生物可以是植物、哺乳动物、昆虫、微生物或任何其他目的生物。术语真菌和酵母在本文可互换使用。如本文所用,术语微生物涵盖酵母、细菌和病毒。所述方法中使用的生物可以是该生物的任何物种,包括通常在模型中使用的物种,例如酿酒酵母(S.cerevisiae)(酵母)、拟南芥(Arabidopsis thaliana)(植物)、小鼠(哺乳动物)和果蝇(Drosophila)(昆虫)。
“植物”包括整个植物、植物器官、植物组织、种子和植物细胞以及同一植物的子代。植物细胞包括但不限于得自下列物质的细胞:种子、悬浮培养物、胚、分生区域、愈伤组织、叶、根、谷粒、芽、配子体、孢子体、花粉和小孢子。“子代”包括植物的任何后续世代。
任何单子叶植物或双子叶植物均可与本文提供的方法和组合物一起使用,包括但不限于大豆、玉米、高粱、棉花、油菜籽、向日葵、水稻、小麦、甘蔗、紫花苜蓿烟草、大麦、木薯、花生、粟、油棕、马铃薯、黑麦或甜菜植物。在一些实施例中,所述方法包括的植物为大豆、玉米、高粱、棉花、油菜籽、向日葵、水稻、小麦、甘蔗、紫花苜蓿烟草、大麦、木薯、花生、粟、油棕、马铃薯、黑麦或甜菜植物。因此,任何单子叶植物或双子叶植物种群均可与本文提供的方法一起使用,包括但不限于以下种群:大豆、玉米、高粱、棉花、油菜籽、向日葵、水稻、小麦、甘蔗、紫花苜蓿烟草、大麦、木薯、花生、粟、油棕、马铃薯、黑麦或甜菜植物。在一些实施例中,所述基因型数据和/或表型数据是从以下种群获得的:大豆、玉米、高粱、棉花、油菜籽、向日葵、水稻、小麦、甘蔗、紫花苜蓿烟草、大麦、木薯、花生、粟、油棕、马铃薯、黑麦或甜菜植物。
可以从减数分裂重组增加的生物种群获得数据,诸如天然存在的或通过人为干预产生的那些生物。可以从具有引入的遗传修饰的生物种群获得数据,与不含引入的遗传修饰的对照生物相比,引入的遗传修饰增加减数分裂重组。如本文所用,术语种群通常是指多种生物,例如植物种群意指一种或多种植物,诸如一种或多种玉米植物。
术语重组和减数分裂重组在本文中可互换使用。如本文所用,减数分裂重组的增加是指与合适的对照例如尚未修饰为具有增加的减数分裂重组的生物的细胞相比,同源染色体的减数分裂重组率或重组频率的任何可检测到的增加。遗传重组频率通常是指在两个遗传基因座之间发生交换事件(“事件”)的概率。减数分裂重组率或重组频率,诸如增高或降低,可以通过检测和定量交换来确定。合适的技术包括但不限于涉及减数分裂后标记和/或性状分离的技术。例如,遗传标记的全种群分离分析、使用显微镜术对性母细胞的细胞学分析或植物中花粉特异性的荧光标记系可用于测定减数分裂重组频率。减数分裂交换频率可在整个基因组水平上或以特定基因组间隔进行评价。例如,可以按厘摩(cM)/兆碱基(Mb)来测定基因组间隔的交换率,以相对于基因组大小来计算减数分裂重组频率。在一些实施例中,增加生物种群中的减数分裂重组,使得减数分裂重组事件的比率或频率比未使用本文所述的方法进行修饰以增加减数分裂重组的对照生物种群或单个生物(诸如该种群的成员)中的减数分裂重组率或重组频率增加超过0.5X、1X、2X、3X、4X、5X、6X、7X、8X、9X、10X、11X、12X、13X、14X、15X、20X、25X或更多。在一些实施例中,减数分裂重组事件的比率或频率介于未使用本文所述的方法进行修饰以增加减数分裂重组的对照生物种群或单个生物(诸如该种群的成员)中的减数分裂重组事件的比率或频率的约0.5X-40X之间。例如,可以产生双单倍体植物,其具有的减数分裂重组事件比未使用本文所述的方法进行修饰以增加减数分裂重组的对照双单倍体或对照双单倍体种群中的减数分裂重组率或重组频率增加超过0.5X、1X、2X、3X、4X、5X、6X、7X、8X、9X、10X、11X、12X、13X、14X、15X、20X、25X或更多。
在一些实施例中,增加生物种群或单个生物中的减数分裂重组,使得交换事件的数量比未使用本文所述的方法进行修饰以增加减数分裂重组的对照种群或生物中的交换数量增加超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、75、80、85、90、95、100、105、110、115、120、125、130、140、150、160、175、200、250、300、400。减数分裂重组率或重组频率或交换数量甚至可以通过使这些种群的成员彼此、与其子代或其组合杂交或受精而进一步提高。使用这种方法可以减少交换干扰,使得可以在彼此更接近的基因组DNA中观察到减数分裂重组交换。
“遗传修饰”通常是指通过内源核苷酸序列中一个或多个核苷酸的插入、缺失或取代对任何核酸序列或遗传元件的修饰。遗传修饰可以在编码和非编码序列中产生,诸如启动子区、5′非翻译前导序列、内含子、基因、3′非翻译区和其他调控序列或影响一个或多个核酸序列转录或翻译的序列。“编码序列”通常是指编码特异性氨基酸序列的多核苷酸序列。“调控序列”是指位于编码序列的上游(5′非编码序列)、内部或下游(3′非编码序列)的核苷酸序列,并且其影响相关的编码序列的转录、RNA加工或稳定性、或翻译。调节序列可包括但不限于启动子、翻译前导序列、内含子和聚腺苷酸化识别序列。
在一个实施例中,通过本文所述的基因组编辑方法以及本领域普通技术人员可用的那些方法,可以将生物诸如植物、动物和微生物中参与抑制减数分裂重组和/或促进减数分裂重组的基因工程化以调节一个或多个宿主植物、微生物或动物内源基因的表达。参见,例如图1。
这些基因包括但不限于参与突触起始复合物(SIC)或ZMM途径的基因,诸如MSH4/MSH5 MutS相关异二聚体、MER3 DNA解旋酶、SHORTAGE OF CROSSOVERS1(SHOC1)XPF核酸酶、PARTING DANCERS(PTD)、ZIP4/SPO22、HEI10、Zip1、Zip2、Zip3、Zip4、Msh4和Msh5、Mlh1/Mlh3、其同源物、其直系同源物或其组合。
在一些实施例中,通过增加促进或提高减数分裂重组频率或重组率的一种或多种多核苷酸(例如,促进交换形成的那些多核苷酸)的拷贝数、表达水平或活性,而将生物修饰为具有增加的减数分裂重组。
本文提供了通过增加促进或提高减数分裂重组频率或重组率的一种或多种多核苷酸的拷贝数、表达水平或活性来增加减数分裂重组的方法。示例性的多核苷酸和多肽包括但不限于突触起始复合物(SIC)或ZMM途径中的那些,诸如MSH4/MSH5 MutS相关异二聚体、MER3 DNA解旋酶、SHORTAGE OF CROSSOVERS1(SHOC1)XPF核酸酶、PARTING DANCERS(PTD)、ZIP4/SPO22、HEI10、Zip1、Zip2、Zip3、Zip4、Msh4和Msh5、Mlh1/Mlh3、其同源物、其直系同源物或其组合。参见,例如,Lynn等人(2007)Chromosome Research.[染色体研究]15:591-605;Serra等人(2018)PNAS.115(10):2437-2442,其每一个通过援引以其全文并入本文。
在某些实施例中,用于增加微生物中的减数分裂重组的方法包括增加ZMM途径中的一种或多种多核苷酸或多肽的拷贝数、表达水平或活性,所述多核苷酸或多肽包括但不限于Zip1、Zip2、Zip3、Zip4、Msh4、Msh5、Mlh1/Mlh3、Mer3、HEI10、MMS21、Shoc1/PTD、其同源物及其直系同源物。
在某些实施例中,用于增加植物中的减数分裂重组的方法包括增加ZMM途径中的一种或多种多核苷酸或多肽的拷贝数、表达水平或活性,所述多核苷酸或多肽包括但不限于MSH4/MSH5、Mlh1/Mlh3、MutS相关异二聚体、MER3 DNA解旋酶、SHORTAGE OF CROSSOVERS1(SHOC1)XPF核酸酶、PARTING DANCERS(PTD)、ZIP4/SPO22、HEI10、其同源物及其直系同源物。
可以通过任何合适的方法,例如通过增加多核苷酸的拷贝数和/或多肽的表达水平或活性来增加促进或增加减数分裂重组的一种或多种多核苷酸或多肽的表达水平或活性。
在一些实施例中,通过将一种或多种编码多肽的多核苷酸引入生物基因组中以增加起到促进或增加细胞中的减数分裂重组的功能的基因的表达或活性,而将生物(包括但不限于植物、微生物或动物)修饰为具有增加的减数分裂重组,所述基因包括但不限于HEI10、MSH4/MSH5、Mlh1/Mlh3、MutS相关异二聚体、MER3 DNA解旋酶、SHORTAGE OFCROSSOVERS1(SHOC1)XPF核酸酶、PARTING DANCERS(PTD)、ZIP4/SPO22、Zip1、Zip2、Zip3、Zip4、Msh4、Msh5、Mlh1/Mlh3、其同源物及其直系同源物。
本文提供了通过阻抑抑制减数分裂重组的一种或多种多核苷酸的表达水平或活性来增加减数分裂重组的方法。示例性的多核苷酸和多肽包括但不限于单独或与其他蛋白质一起阻抑同源重组或限制交换的那些,包括抗交换途径中的那些,包括但不限于FANCM、MHF1、MHF2、FIDGETIN-LIKE1、RECQ4、拓扑异构酶3α、RMI1、RMI2、RTEL1、其同源物及其直系同源物。参见,例如,Serra等人(2018)PNAS.115(10):2437-2442,其通过援引以其全文并入本文。如本文所用,术语RECQ4还包括在具有一个以上基因的生物中复制或存在的那些RECQ4,诸如拟南芥中的RECQ4A和RECQ4B。
在某些实施例中,用于增加生物诸如植物、微生物和动物中的减数分裂重组的方法包括阻抑FANCM、MHF1、MHF2、FIDGETIN-LIKE1、RECQ4、拓扑异构酶3α、RMI1、RMI2和RTEL1、其同源物及其直系同源物中的一种或多种多核苷酸或多肽的表达水平或活性。
在一些实施例中,通过破坏编码FANCM、MHF1、MHF2、FIDGETIN-LIKE1、RECQ4、拓扑异构酶3α、RMI1、RMI2和/或RTEL1多肽、其同源物及其直系同源物的基因,例如使用本领域已知的任何方法,包括但不限于基因组编辑方法,阻抑FANCM、MHF1、MHF2、FIDGETIN-LIKE1、RECQ4、拓扑异构酶3α、RMI1、RMI2和/或RTEL1多肽、其同源物及其直系同源物的活性。对于引入的基因编辑或破坏,生物可以是杂合的和/或纯合的,例如,纯合的HEI10敲入和纯合的RecQ4敲除。
在某些实施例中,通过转座子标记破坏FANCM、MHF1、MHF2、FIDGETIN-LIKE1、RECQ4、拓扑异构酶3α、RMI1、RMI2和/或RTEL1基因。在另一个实施例中,通过使用随机或靶向诱变(诸如TUSC突变)来诱变生物(诸如植物或微生物)而破坏FANCM、MHF1、MHF2、FIDGETIN-LIKE1、RECQ4、拓扑异构酶3α、RMI1、RMI2和/或RTEL1基因,并选择具有降低的FANCM、MHF1、MHF2、FIDGETIN-LIKE1、RECQ4、拓扑异构酶3α、RMI1、RMI2和/或RTEL1活性(例如,表达水平)或其组合的生物(例如植物)。阻抑生物(诸如植物或微生物)中内源性FANCM、MHF1、MHF2、FIDGETIN-LIKE1、RECQ4、拓扑异构酶3α、RMI1、RMI2和/或RTEL1多肽的表达的其他方法可包括使用化学药品诸如甲磺酸乙酯诱导的诱变和缺失诱变。另外,使用选定PCR产物的变性HPLC或选择性内切核酸酶消化来筛选化学诱导的突变的快速自动方法TILLING(定向诱导基因组局部突变技术)也可以使用。
在一些方面,起到抑制重组功能的所述一个或多个基因包括但不限于FANCM、MHF1、MHF2、FIDGETIN-LIKE1、RECQ4、拓扑异构酶3α、RMI1、RMI2和/或RTEL1、其同源物及其直系同源物或其组合。
在本文所述的方法中可以使用任何增加重组的方法。在一些实施例中,减数分裂重组方法在生物基因组的很大一部分中产生随机的、非特异性的(非靶向的)交换,而不是使生物基因组中的特定区域,例如着丝粒、端粒、近着丝粒或热点基因靶向重组。参见,例如图7。尽管重组可能未靶向于生物基因组内的特定位置,但可以使用本文所述的各种方法和组合来评价特定目的基因组区域、着丝粒、端粒、近着丝粒或热点中的同源重组。
在用于增加植物中的重组的一些实施例中,所述方法包括通过编辑生物基因组以阻抑以下一种或多种的基因产物的活性来增加重组:FANCM、MHF1、MHF2、FIDGETIN-LIKE1、RECQ4、拓扑异构酶3α、RMI1、RMI2和/或RTEL1、其同源物及其直系同源物。在一些实施例中,例如在植物或微生物中,通过编辑生物基因组以修饰编码RMI1多肽的DUF1767结构域和/或OB-折叠结构域的区域来增加减数分裂重组。在一些实施例中,例如在植物或微生物中,通过编辑生物基因组以修饰编码RTEL1多肽的DEAD 2解旋酶C 2结构域中的一者或多者来增加减数分裂重组。在一些实施例中,通过编辑生物基因组以修饰一个或多个区域,例如编码FANCM多肽中的ERCC4样核酸酶结构域、螺旋-发夹-螺旋(HhH)2结构域、SF2解旋酶结构域的DEXDc和/或HELICc结构域的那些区域来增加减数分裂重组。
在其他实施例中,具有不同的减数分裂重组水平的生物种群可以用于本文所述的方法和组合物中,例如,具有增加、减少或未改变的减数分裂重组的那些种群。在一些实施例中,具有增加、减少或未改变的减数分裂重组的生物与例如具有增加、减少或未改变的减数分裂重组的另一生物杂交。该生物可以来自生物种群。在一些实施例中,通过降低促进或提高减数分裂重组频率或重组率的一种或多种多核苷酸(例如,促进交换形成的那些多核苷酸)的拷贝数、表达水平或活性,而将生物修饰为具有降低的减数分裂重组和/或对生物进行修饰以增加抑制减数分裂重组的一种或多种多核苷酸的拷贝数、表达水平或活性。在一些实施例中,通过将一种或多种编码多肽的多核苷酸引入生物基因组中以降低起到促进或增加细胞中的减数分裂重组的功能的基因的表达或活性,而将生物(包括但不限于植物、微生物或动物)修饰为具有降低的减数分裂重组,所述基因包括但不限于HEI10、MSH4/MSH5、Mlh1/Mlh3、MutS相关异二聚体、MER3 DNA解旋酶、SHORTAGE OF CROSSOVERS1(SHOC1)XPF核酸酶、PARTING DANCERS(PTD)、ZIP4/SPO22、Zip1、Zip2、Zip3、Zip4、Msh4、Msh5、Mlh1/Mlh3、其同源物及其直系同源物。在降低生物(包括但不限于植物、微生物或动物)中的减数分裂重组的方法的一些实施例中,所述方法包括通过编辑生物的基因组以增加以下一种或多种的基因产物的表达水平、活性或拷贝数来降低重组:FANCM、MHF1、MHF2、FIDGETIN-LIKE1、RECQ4、拓扑异构酶3α、RMI1、RMI2、RTEL1、其同源物及其直系同源物。在一些实施例中,可以由具有不同的减数分裂重组水平或重组率(例如,增加、减少或未改变的减数分裂重组)的生物产生在其基因组中具有大于1、2、3、4、5、6、7、8、9个且小于10、9、8、7、6、5、4、3和2个重组事件的生物。此类生物可以用于本文所述的方法和组合物中,例如,用于评价各种基因相互作用和/或评价单个基因对上位性的影响。
可以使用任何合适的技术或方法来引入所述一个或多个核苷酸取代、添加和/或缺失。在一些方面,使用基因组编辑技术引入所述一个或多个核苷酸取代、添加和/或缺失。在一些实例中,基因组编辑技术包括内切核酸酶,内切核酸酶包括但不限于Cas/CRISPR、大范围核酸酶、锌指核酸酶(ZFN)或转录激活因子样效应子核酸酶(TALEN)或其组合。在一些方面,使用化学诱变或转座子引入所述一个或多个核苷酸取代、添加和/或缺失。在一些实施例中,通过使用RNA技术阻抑一个或多个起到抑制减数分裂重组功能的基因的活性,而将所述一种或多种生物例如植物或动物修饰为具有增加的减数分裂重组。
可以使用任何合适的RNA阻抑技术,包括但不限于RNAi、微RNA、shRNA或其组合。
“抑制DNA构建体”是重组DNA构建体,当被转化或稳定整合到植物的基因组中时,导致该植物中靶基因的“沉默”。所述靶基因对于所述植物可以是内源的或转基因的。
术语“阻抑(suppress)”、“受阻抑的(suppressed)”、“阻抑(suppression)”、“阻抑(suppressing)”以及“沉默”在本文中可互换使用并且包括减低、减少、下降、降低、抑制、消除或防止。“沉默”或“基因沉默”并没有指定机制,并且包括但不限于反义、共阻抑、病毒阻抑、发夹阻抑、茎环阻抑、基于RNAi的方法和基于小RNA的方法等。
可以使用各种方法将一个或多个目的序列引入生物的细胞中,例如通过提高增加减数分裂重组的多核苷酸和多肽的表达水平、拷贝数或活性而起到增加生物中的减数分裂重组的功能的序列,通过降低抑制减数分裂重组的多核苷酸和多肽的表达水平、拷贝数或活性而起到增加生物中的减数分裂重组的功能的序列,或两者兼有。在一些实例中,生物中HEI10、MSH4/MSH5 MutS相关异二聚体、MER3 DNA解旋酶、SHORTAGE OF CROSSOVERS1(SHOC1)XPF核酸酶、PARTING DANCERS(PTD)、ZIP4/SPO22、Zip1、Zip2、Zip3、Zip4、Msh4、Msh5、Mlh1/Mlh3、其同源物或其直系同源物的表达水平、拷贝数或活性增加,并且FANCM、MHF1、MHF2、FIDGETIN-LIKE1、RECQ4、拓扑异构酶3α、RMI1、RMI2、RTEL1、其同源物或其直系同源物的表达水平、拷贝数或活性降低。在一些实施例中,生物中HEI10表达水平、拷贝数或活性增加而RECQ4表达水平、拷贝数或活性降低。
“引入”意在指以使得序列得以进入生物细胞内部的方式,将多核苷酸或所产生的多肽呈送给生物或细胞。本披露的方法不取决于用于将序列引入生物或细胞中的具体方法,只要多核苷酸或多肽得以进入生物的至少一个细胞的内部即可。
可以使用任何合适的技术或方法,例如诱变化学物质、辐射或基因组编辑,将遗传修饰引入生物(诸如植物、昆虫、微生物或动物)的细胞中。基因组编辑技术,诸如大范围核酸酶、锌指核酸酶、转录激活因子样效应子核酸酶(TALEN)、CRISPR Cas内切核酸酶(诸如但不限于Cas9)、其他RNA指导的内切核酸酶以及碱基编辑技术也可用于通过基因组编辑或通过插入来引入遗传修饰或编辑生物或生物(包括植物)种群的基因组。在一些实例中,可以编辑生物种群的基因组以降低一个或多个起到抑制重组功能的基因的活性,从而提高种群中的减数分裂重组率。
此类Cas内切核酸酶包括但不限于Cas9和Cpf1内切核酸酶。可用于本文所披露的方法中的其他Cas内切核酸酶和核苷酸-蛋白质复合物包括WO 2013/088446中描述的那些。这些技术允许对目的序列进行靶向修饰,包括将遗传修饰引入生物中的内源或天然宿主DNA序列或预先存在的转基因序列中。
在一些实施例中,可以通过在基因组中所需改变附近的限定位置诱导双链断裂(DSB),通过基因编辑来促进遗传修饰。可以使用可用的任何DSB诱导剂诱导DSB,所述诱导剂包括但不限于,TALEN、大范围核酸酶、锌指核酸酶、Cas9-gRNA系统(基于细菌性CRISPR-Cas系统)等。在一些实施例中,可以将DSB的引入与多核苷酸修饰模板的引入组合。
可以通过本领域已知的任何方法将多核苷酸修饰模板引入细胞中,所述方法例如但不限于瞬时引入方法、转染、电穿孔、显微注射、颗粒介导的递送、局部施用、晶须介导的递送、经由细胞穿透肽的递送或介孔二氧化硅纳米颗粒(MSN)介导的直接递送。
可以将多核苷酸修饰模板作为单链多核苷酸分子、双链多核苷酸分子或作为环状DNA(载体DNA)的一部分引入细胞中。所述多核苷酸修饰模板还可以与指导RNA和/或Cas内切核酸酶进行系链。系链的DNA可以允许共定位靶标和模板DNA,可用于基因组编辑和靶向的基因组调控,并且还可以用于靶向有丝分裂后期细胞,在这些细胞中内源性HR机制的功能预计会大大降低(Mali等人2013 Nature Methods[自然方法]第10卷:957-963)。所述多核苷酸修饰模板可以瞬时地存在于细胞中,或可以经由病毒复制子引入。
“经修饰的核苷酸”或“经编辑的核苷酸”是指当与其非修饰的核苷酸序列相比时,包含至少一个改变的目的核苷酸序列。此类“改变”包括,例如:(i)至少一个核苷酸的替代、(ii)至少一个核苷酸的缺失、(iii)至少一个核苷酸的插入、或(iv)(i)-(iii)的任何组合。
术语“多核苷酸修饰模板”包括,当与待编辑的核苷酸序列相比时,包含至少一个核苷酸修饰的多核苷酸。核苷酸修饰可以是至少一个核苷酸取代、添加或缺失。任选地,多核苷酸修饰模板可以进一步包含位于至少一个核苷酸修饰侧翼的同源核苷酸序列,其中侧翼同源核苷酸序列为待编辑的希望的核苷酸序列提供了充足同源性。
组合DSB和修饰模板的基因组序列的编辑过程通常包括:向宿主细胞提供DSB诱导剂或编码DSB诱导剂的核酸,该DSB诱导剂识别染色体序列中的靶序列并且能够在基因组序列中诱导DSB,以及提供与待编辑的核苷酸序列相比包含至少一个核苷酸改变的至少一个多核苷酸修饰模板。多核苷酸修饰模板还可以包含侧翼于所述至少一个核苷酸变化的核苷酸序列,其中侧翼序列与侧翼于DSB的染色体区域基本同源。
内切核酸酶可以通过本领域已知的任何方法提供给细胞,所述方法例如但不限于瞬时引入方法、转染、显微注射、和/或局部施用、或间接经由重组构建体。内切核酸酶可以作为蛋白质或作为指导多核苷酸复合物直接提供给细胞或经由重组构建体间接提供。使用本领域已知的任何方法,可以瞬时地将内切核酸酶引入细胞中,或可以将内切核酸酶并入宿主细胞的基因组中。在CRISPR-Cas系统的情况下,如2016年5月12日公开的WO2016073433中所述的,可以用细胞穿透肽(CPP)促进内切核酸酶和/或指导多核苷酸摄入进细胞。
如本文所用,“基因组区域”是细胞基因组中的染色体区段并且在一些实施例中存在于靶点任一例上,或者替代性地,还包含靶点的一部分。基因组区域可以包含至少5-10、5-15、5-20、5-25、5-30、5-35、5-40、5-45、5-50、5-55、5-60、5-65、5-70、5-75、5-80、5-85、5-90、5-95、5-100、5-200、5-300、5-400、5-500、5-600、5-700、5-800、5-900、5-1000、5-1100、5-1200、5-1300、5-1400、5-1500、5-1600、5-1700、5-1800、5-1900、5-2000、5-2100、5-2200、5-2300、5-2400、5-2500、5-2600、5-2700、5-2800、5-2900、5-3000、5-3100或更多个碱基,这样使得基因组区域具有足够的同源性以与相应的同源区域进行同源重组。
TAL效应子核酸酶(TALEN)是一类序列特异性核酸酶,其可以被用于在植物或其他生物体的基因组中特异性靶序列处造成双链断裂。(Miller等人(2011)NatureBiotechnology[自然生物技术]29:143-148)。
内切核酸酶是在多核苷酸链内切割磷酸二酯键的酶。内切核酸酶包括限制性内切核酸酶,其在特异性位点处切割DNA而不损坏碱基;并且包括大范围核酸酶,也称为归巢内切核酸酶(HE酶),其相似于限制性内切核酸酶,在特异性识别位点处结合并且切割,然而对于大范围核酸酶,识别位点典型地更长,约18bp或更长(于2012年3月22日提交的专利申请PCT/US 12/30061)。
基于保守的序列基序将大范围核酸酶分类为四个家族,所述家族是LAGLIDADG、GIY-YIG、H-N-H、和His-Cys box家族。这些基序参与金属离子的配位和磷酸二酯键的水解。HE酶的显著之处在于它们的长识别位点,并且还在于耐受其DNA底物中的一些序列多态性。对于大范围核酸酶的命名约定相似于对其他限制性内切核酸酶的约定。大范围核酸酶还分别表征为针对由独立的ORF、内含子、和内含肽编码的酶的前缀F-、I-、或PI-。在重组过程中的一个步骤涉及在识别位点处或在所述识别位点附近的多核苷酸切割。可以将切割活性用于产生双链断裂。有关位点特异性重组酶及其识别位点的综述,请参见(1994)Curr OpBiotechnol[当代生物技术评论]5:521-7;和Sadowski(1993)FASEB[美国实验生物学会联合会会志]7:760-7。在一些实例中,重组酶来自整合酶(Integrase)或解离酶(Resolvase)家族。
锌指核酸酶(ZFN)是由锌指DNA结合结构域和双链-断裂-诱导剂结构域组成的工程化双链断裂诱导剂。识别位点特异性由锌指结构域赋予,所述锌指结构域典型地包含两个、三个、或四个锌指,例如具有C2H2结构,然而其他锌指结构是已知的并且已经被工程化。锌指结构域适于设计特异性结合所选择的多核苷酸识别序列的多肽。ZFN包括连接至非特异性内切核酸酶结构域(例如来自lis型内切核酸酶诸如Fokl的核酸酶结构域)的工程化DNA结合锌指结构域。另外的功能性可以融合到锌指结合结构域中,所述另外的功能性包括转录激活子结构域、转录阻遏物结构域、和甲基化酶。在一些实例中,核酸酶结构域的二聚化是切割活性所需的。每个锌指在靶DNA中识别三个连续的碱基对。例如,3指结构域识别9个连续核苷酸的序列,由于所述核酸酶的二聚化需要,因此两组锌指三联体用于结合18个核苷酸的识别序列。
例如在2015年3月19日公开的美国专利申请US 2015-0082478 A1、2015年2月26日公开的WO 2015/026886 A1、2016年1月14日公开的WO 2016007347、以及2016年2月18日公开的WO 201625131(其全部通过援引并入本文)中已经描述了使用DSB诱导剂(诸如Cas9-gRNA复合物)进行的基因组编辑。
本文中术语“Cas基因”是指在细菌系统中通常与侧翼CRISPR基因座偶联、缔合或接近或在邻近处的基因。术语“Cas基因”、“CRISPR相关的(Cas)基因”在本文中可互换地使用。本文中术语“Cas内切核酸酶”是指由Cas基因编码的蛋白质。当与适合的多核苷酸组分复合时,本文的Cas内切核酸酶能够识别、结合特异性DNA靶序列的全部或部分、并任选地使特异性DNA靶序列的全部或部分产生切口或切割特异性DNA靶序列的全部或部分。本文描述的Cas内切核酸酶包含一个或多个核酸酶结构域。本披露的Cas内切核酸酶包括具有HNH或HNH-样核酸酶结构域和/或RuvC或RuvC-样核酸酶结构域的那些。本披露的Cas内切核酸酶包括Cas9蛋白、Cpf1蛋白、C2c1蛋白、C2c2蛋白、C2c3蛋白、Cas3、Cas5、Cas7、Cas8、Cas10或这些的复合物。
除双链断裂诱导剂外,还可以实现位点特异性碱基转化以工程化一个或多个核苷酸变化,从而在基因组中创建一个或多个本文所述的EME。这些包括例如,由C*G至T·A或A·T至G*C碱基编辑脱氨酶介导的位点特异性碱基编辑(Gaudelli等人,Programmablebase editing of A·T to G*C in genomic DNA without DNA cleavage[在无DNA切割时基因组DNA中A·T至G*C的可编程碱基编辑].″Nature[自然](2017);Nishida等人“Targeted nucleotide editing using hybrid prokaryotic and vertebrate adaptiveimmune systems[使用杂交体原核和脊椎动物适应性免疫系统进行靶向核苷酸编辑].”Science[科学]353(6305)(2016);Komor等人“Programmable editing of a target basein genomic DNA without double-stranded DNA cleavage[在无双链DNA切割时基因组DNA中靶碱基的可编程编辑].”Nature[自然]533(7603)(2016):420-4)。与胞苷脱氨酶或腺嘌呤脱氨酶蛋白融合的催化死亡的dCas9成为特异性的碱基编辑器,其可以改变DNA碱基而不会引起DNA断裂。碱基编辑器转换C->T(或在相反链上,G->A)或腺嘌呤碱基编辑器将腺嘌呤转换为肌苷,从而在gRNA指定的编辑窗口内导致A->G变化。
如本文所用,术语“指导多核苷酸/Cas内切核酸酶复合物”、“指导多核苷酸/Cas内切核酸酶系统”、“指导多核苷酸/Cas复合物”、“指导多核苷酸/Cas系统”、“指导Cas系统”在本文中可互换使用,并且是指能够形成复合物的至少一种指导多核苷酸和至少一种Cas内切核酸酶,其中所述指导多核苷酸/Cas内切核酸酶复合物可以将Cas内切核酸酶引导至DNA靶点,使Cas内切核酸酶能够识别、结合DNA靶点并任选地对DNA靶点产生切口或切割(将单链或双链断裂引入DNA靶点)。本文中指导多核苷酸/Cas内切核酸酶复合物可以包含四种已知的CRISPR系统(Horvath和Barrangou,2010,Science[科学]327:167-170)(诸如I型、II型或III型CRISPR系统)中任一种的一种或多种Cas蛋白和一种或多种合适的多核苷酸组分。Cas内切核酸酶在靶序列处解开DNA双链体并任选地切割至少一条DNA链,如通过由与Cas蛋白复合的多核苷酸(例如但不限于crRNA或指导RNA)识别靶序列所介导的。如果正确的前间隔子邻近基序(PAM)位于或相邻于DNA靶序列的3′末端,则通过Cas内切核酸酶对靶序列进行的此类识别和切割典型地会发生。替代性地,本文中的Cas蛋白可能缺乏DNA切割或切口活性,但是当与合适的RNA组分复合时,仍然可以特异性结合DNA靶序列。(还参见2015年3月19日公开的美国专利申请US 2015-0082478 A1和2015年2月26日公开的US 2015-0059010A1,两者均特此通过援引以其全文并入)。
指导多核苷酸/Cas内切核酸酶复合物可以切割DNA靶序列的一条或两条链。可以切割DNA靶序列的两条链的指导多核苷酸/Cas内切核酸酶复合物典型地包含具有处于功能状态的所有其内切核酸酶结构域的Cas蛋白(例如野生型内切核酸酶结构域或其变体在每个内切核酸酶结构域中保留一些或全部活性)。适用于本文使用的Cas9切口酶的非限制性实例披露于美国专利申请公开号2014/0189896中,将其通过援引并入本文。
其他Cas内切核酸酶系统已经在2016年5月12日提交的PCT专利申请PCT/US 16/32073和2016年5月12日提交的PCT/US 16/32028中描述,将这两个申请通过援引并入本文中。
本文中的“Cas9”(以前称为Cas5、Csn1、或Csx12)是指与cr核苷酸和tracr核苷酸或与单指导多核苷酸形成复合物的II型CRISPR系统的Cas内切核酸酶,其用于特异性识别和切割DNA靶序列的全部或部分。Cas9蛋白包含RuvC核酸酶结构域和HNH(H-N-H)核酸酶结构域,它们各自可以在靶序列处切割单个DNA链(两个结构域的协同作用导致DNA双链切割,而一个结构域的活性导致一个切口)。通常,RuvC结构域包含亚结构域I、II和III,其中结构域I位于Cas9的N-末端附近,并且亚结构域II和III位于蛋白质的中间,即位于HNH结构域的侧翼(Hsu等人,Cell[细胞],157:1262-1278)。II型CRISPR系统包括利用与至少一种多核苷酸组分复合的Cas9内切核酸酶的DNA切割系统。例如,Cas9可以与CRISPR RNA(crRNA)和反式激活CRISPR RNA(tracrRNA)复合。在另一个实例中,Cas9可以与单一指导RNA复合。
任何指导的内切核酸酶可以用于本文披露的方法中。此类内切核酸酶包括但不限于Cas9和Cpf 1内切核酸酶。迄今为止,已经描述了许多可以识别特定PAM序列(参见例如-Jinek等人(2012)Science[科学]337 p 816-821,2016年5月12日提交的PCT专利申请PCT/US16/32073和2016年5月12日提交的PCT/US16/32028,以及Zetsche B等人2015.Cell[细胞]163,1013)并在特定位置切割靶DNA的内切核酸酶。应当理解的是,基于本文所述的使用指导的Cas系统的方法和实施例,现在人们可以定制这些方法这样使得它们可以利用任何指导的内切核酸酶系统。
如本文所用,术语“指导多核苷酸”涉及可以与Cas内切核酸酶形成复合物的多核苷酸序列,并且使得Cas内切核酸酶能够识别、结合并任选地切割DNA靶点。指导多核苷酸可以是单分子或双分子。指导多核苷酸序列可以是RNA序列、DNA序列或其组合(RNA-DNA组合序列)。任选地,指导多核苷酸可以包含至少一种核苷酸、磷酸二酯键或连接修饰,诸如但不限于锁核酸(LNA)、5-甲基dC、2,6-二氨基嘌呤、2′-氟代A、2′-氟代U、2′-0-甲基RNA、硫代磷酸酯键、与胆固醇分子的连接、与聚乙二醇分子的连接、与间隔子18(六乙二醇链)分子的连接、或导致环化的5′至3′共价连接。仅仅包含核糖核酸的指导多核苷酸也被称为“指导RNA”或“gRNA”(还参见于2015年3月19日公开的美国专利申请US 2015-0082478 A1和2015年2月26日公开的US 2015-0059010 A1,两者均特此通过援引以其全文并入)。
指导多核苷酸也可以是包含连接至tracr核苷酸序列的cr核苷酸序列的单分子(也称为单指导多核苷酸)。单指导多核苷酸包含可以与靶DNA中的核苷酸序列杂交的第一核苷酸序列结构域(被称为可变靶向结构域或VT结构域)和与Cas内切核酸酶多肽相互作用的Cas内切核酸酶识别结构域(CER结构域)。“结构域”意指可以为RNA、DNA和/或RNA-DNA组合序列的核苷酸的连续延伸。单指导多核苷酸的VT结构域和/或CER结构域可以包含RNA序列、DNA序列或RNA-DNA组合序列。由来自cr核苷酸和tracr核苷酸的序列构成的单指导多核苷酸可以被称为“单指导RNA”(当由RNA核苷酸的连续延伸构成时)或“单指导DNA”(当由DNA核苷酸的连续延伸构成时)或“单指导RNA-DNA”(当由RNA和DNA核苷酸的组合构成时)。单指导多核苷酸可以与Cas内切核酸酶形成复合物,其中所述指导多核苷酸/Cas内切核酸酶复合物(还称为指导多核苷酸/Cas内切核酸酶系统)可以将Cas内切核酸酶引导至基因组靶点,使所述Cas内切核酸酶能够识别、结合靶点、并任选地使靶点产生切口或切割靶点(引入单链或双链断裂)。(还参见2015年3月19日公开的美国专利申请US 2015-0082478 A1和2015年2月26日公开的US 2015-0059010 A1,两者均特此通过援引以其全文并入)。
术语“可变靶向结构域”或“VT结构域”在本文中可互换使用,并且包括可以与双链DNA靶点的一条链(核苷酸序列)杂交(互补)的核苷酸序列。在一些实施例中,可变靶向结构域包含12至30个核苷酸的连续延伸。可变靶向域可以由DNA序列、RNA序列、修饰的DNA序列、修饰的RNA序列或其任何组合构成。
术语(指导多核苷酸的)“Cas内切核酸酶识别结构域”或“CER结构域”在本文中可互换地使用,并且包括与Cas内切核酸酶多肽相互作用的核苷酸序列。CER结构域包含tracr核苷酸配对序列,随后是tracr核苷酸序列。CER结构域可以由DNA序列、RNA序列、修饰的DNA序列、修饰的RNA序列(参见例如2015年2月26日公开的US 2015-0059010 A1,其通过援引以其全文并入本文)或其任何组合构成。
连接单指导多核苷酸的cr核苷酸和tracr核苷酸的核苷酸序列可以包含RNA序列、DNA序列或RNA-DNA组合序列。在一个实施例中,连接单指导多核苷酸的cr核苷酸和tracr核苷酸的核苷酸序列可以是至少3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100个核苷酸的长度。在另一个实施例中,连接单指导多核苷酸的cr核苷酸和tracr核苷酸的核苷酸序列可以包括四环序列,如但不限于GAAA四环序列。
术语“单指导RNA”和“sgRNA”在本文中可互换使用,并涉及两个RNA分子的合成融合,其中包含可变靶向结构域(与tracrRNA杂交的tracr配对序列连接)的crRNA(CRISPRRNA)与tracrRNA(反式激活CRISPR RNA)融合。单指导RNA可以包含可与II型Cas内切核酸酶形成复合物的II型CRISPR/Cas系统的crRNA或crRNA片段和tracrRNA或tracrRNA片段,其中所述指导RNA/Cas内切核酸酶复合物可以将Cas内切核酸酶引导至DNA靶点,使得Cas内切核酸酶能够识别、结合DNA靶点、并任选地使DNA靶点产生切口或切割DNA靶点(引入单链或双链断裂)。
术语“指导RNA/Cas内切核酸酶复合物”、“指导RNA/Cas内切核酸酶系统”、“指导RNA/Cas复合物”、“指导RNA/Cas系统”、“g RNA/Cas复合物”、“gRNA/Cas系统”、“RNA指导的内切核酸酶”、“RGEN”在本文中可互换使用并且是指能够形成复合物的至少一种RNA组分和至少一种Cas内切核酸酶,其中所述指导RNA/Cas内切核酸酶复合物可以将Cas内切核酸酶引导至DNA靶点,使Cas内切核酸酶能够识别、结合DNA靶点并任选地使DNA靶点产生切口或切割DNA靶点(引入单链或双链断裂)。本文中的指导RNA/Cas内切核酸酶复合物可以包含四种已知的CRISPR系统(Horvath和Barrangou,2010,Science[科学]327:167-170)(诸如I型、II型或III型CRISPR系统)中任一种的一种或多种Cas蛋白和一种或多种合适的RNA组分。指导RNA/Cas内切核酸酶复合物可以包括II型Cas9内切核酸酶和至少一种RNA组分(例如,crRNA和tracrRNA、或gRNA)。(还参见2015年3月19日公开的美国专利申请US 2015-0082478A1和2015年2月26日公开的US 2015-0059010 A1,两者均特此通过援引以其全文并入)。
使用在本领域已知的任何方法(例如,但不限于,粒子轰击、农杆菌转化或局部施用),可以将作为单链多核苷酸或双链多核苷酸的指导多核苷酸瞬时地引入细胞。指导多核苷酸还可以通过引入(通过,诸如但不限于粒子轰击或农杆菌转化等方法)包含编码指导多核苷酸的异源核酸片段的重组DNA分子被间接引入细胞,所述重组DNA分子可操作地连接于能够在所述细胞转录所述指导RNA的特异性启动子。特异性启动子可以是但不限于RNA聚合酶III启动子,其允许具有精确定义的未修饰的5′-端和3′-端的RNA转录(DiCarlo等人,Nucleic Acids Res.[核酸研究]41:4336-4343;Ma等人,Mol.Ther.Nucleic Acids[分子治疗-核酸]3:e161),如在2016年2月18日公开的WO 2016025131中所述,其通过援引以其全文并入本文。
术语“靶点”、“靶序列”、“靶点序列”、“靶DNA”、“靶基因座”、“基因组靶点”、“基因组靶序列”、“基因组靶基因座”和“前间区”在本文中可互换使用,并且是指多核苷酸序列,诸如但不限于,在细胞的染色体、附加体,或基因组中的任何其他DNA分子(包括染色体DNA、叶绿体DNA、线粒体DNA、质粒DNA)上的核苷酸序列,在所述序列处指导多核苷酸/Cas内切核酸酶复合物可以进行识别、结合并任选地产生切口或进行切割。靶点可以是细胞的基因组中的内源位点,或者替代性地,靶点对于该细胞可以是异源的并且从而不是天然存在于细胞的基因组中,或者与在自然界发生的位置相比,可以在异质基因组位置中找到靶点。如本文所用,术语“内源靶序列”和“天然靶序列”在本文中可互换使用,是指对细胞基因组来说是内源的或天然的并且位于细胞的基因组中该靶序列的内源或天然位置处的靶序列。细胞包括但不限于人、非人、动物、细菌、真菌、昆虫、酵母、非常规酵母和植物细胞,以及通过本文所述的方法产生的植物和种子。“人工靶点”或“人工靶序列”在本文中可互换使用,并且是指已经引入细胞的基因组中的靶序列。这种人工靶序列可以在序列上与细胞的基因组中的内源或天然靶序列相同,但是位于细胞的基因组中的不同位置(即,非内源的或非天然的位置)处。
“改变的靶点”、“改变的靶序列”、“经修饰的靶点”、“经修饰的靶序列”在本文中可互换使用,并且是指如本文披露的靶序列,当与非改变的靶序列相比时,所述靶序列包括至少一个改变。此类“改变”包括,例如:(i)至少一个核苷酸的替代、(ii)至少一个核苷酸的缺失、(iii)至少一个核苷酸的插入、或(iv)(i)-(iii)的任何组合。
“修饰靶点”和“改变靶点”的方法在本文中可互换使用并且是指产生改变的靶点的方法。靶DNA序列(靶点)的长度可以变化,并且包括例如为至少12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30或更多个核苷酸长度的靶点。还有可能靶点可以是回文的,即,一条链上的序列与在互补链上以相反方向的读取相同。切口/切割位点可以在靶序列内,或者切口/切割位点可以在靶序列之外。在另一种变异中,切割可以发生在彼此正好相对的核苷酸位置处,以产生平端切割,或者在其他情况下,切口可以交错以产生单链突出端,也称为“粘性末端”,其可以是5′突出端或3′突出端。还可以使用基因组靶点的活性变体。此类活性变体可以与给定靶点具有至少65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性,其中所述活性变体保留生物活性,因此能够被Cas内切核酸酶识别和切割。测量由内切核酸酶引起的靶点的单链或双链断裂的测定是本领域已知的,并且通常测量试剂在包含识别位点的DNA底物上的总体活性和特异性。
本文中的“前间隔子邻近基序”(PAM)指与由本文所述的指导多核苷酸/Cas内切核酸酶系统识别的(靶向的)靶序列(前间隔子序列)邻近的短核苷酸序列。如果靶DNA序列不在PAM序列后面,则Cas内切核酸酶可能无法成功识别所述靶DNA序列。本文中的PAM的序列和长度可以取决于所使用的Cas蛋白或Cas蛋白复合物而不同。所述PAM序列可以是任何长度,但典型地是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸长度。
术语“靶向”、“基因靶向”和“DNA靶向”在本文中可互换使用。本文中的DNA靶向可以是在特定DNA序列(诸如细胞的染色体或质粒)中特异性引入敲除、编辑或敲入。通常,本文中可以通过在具有与合适的多核苷酸组分缔合的内切核酸酶的细胞中的特异性DNA序列处切割一条或两条链来进行DNA靶向。这种DNA切割,如果是双链断裂(DSB),可以促进NHEJ或HDR过程,这可能导致靶点处的修饰。
本文的靶向方法能以例如在该方法中靶向两个或更多个DNA靶点的这样的方式进行。这种方法可以任选地被表征为多重方法。在某些实施例中,可以同时靶向两个、三个、四个、五个、六个、七个、八个、九个、十个或更多个靶点。多重方法典型地通过本文的靶向方法进行,其中提供了多个不同的RNA组分,每一个被设计成将指导多核苷酸/Cas内切核酸酶复合物引导到唯一的DNA靶点。
术语“敲除”、“基因敲除”和“基因的敲除”在本文中可互换使用。敲除表示已经通过用Cas蛋白进行靶向使得细胞的DNA序列部分或完全无效;例如,这种DNA序列在敲除之前可能已编码氨基酸序列,或可能已具有调节功能(例如启动子)。可以通过插入缺失(通过NHEJ在靶DNA序列中插入或缺失核苷酸碱基),或通过特异性去除在靶向位点处或其附近处降低或完全破坏序列功能的序列来产生敲除。指导多核苷酸/Cas内切核酸酶系统可以与共同递送的多核苷酸修饰模板组合使用以允许编辑(修饰)目的基因组核苷酸序列。(还参见2015年3月19日公开的美国专利申请US 2015-0082478 A1和2015年2月26日公开的WO2015/026886 A1,两者均特此通过援引以其全文并入)。
术语“敲入”、“基因敲入”、“基因插入”和“基因的敲入”在本文中可互换使用。敲入代表通过用Cas蛋白靶向在细胞中的特异性DNA序列处进行的DNA序列的替换或插入(通过HR,其中还使用合适的供体DNA多核苷酸)。敲入的实例是异源氨基酸编码序列在基因的编码区中的特异性插入,或转录调节元件在遗传基因座中的特异性插入。
可以采用不同方法和组合物来获得细胞或生物,所述细胞或生物具有插入到针对Cas内切核酸酶的靶点中的目的多核苷酸。此类方法可以采用同源重组以提供目的多核苷酸在靶点处的整合。在提供的一种方法中,在供体DNA构建体中将目的多核苷酸提供至生物细胞。如在此所用,“供体DNA”是包含待插入到Cas内切核酸酶的靶点的目的多核苷酸的DNA构建体。供体DNA构建体进一步包含位于目的多核苷酸侧翼的同源的第一区域和第二区域。供体DNA的同源的第一区域和第二区域分别与存在于细胞或生物基因组的靶点中或位于所述靶点侧翼的第一和第二基因组区域具有同源性。“同源”意指DNA序列是相似的。例如,在供体DNA上发现的“与基因组区域同源的区域”是与细胞或生物基因组中给定的“基因组序列”具有类似序列的DNA的区域。同源的区域可以具有足以促进在切割的靶点处的同源重组的任何长度。例如,同源区域的长度可以包括至少5-10、5-15、5-20、5-25、5-30、5-35、5-40、5-45、5-50、5-55、5-60、5-65、5-70、5-75、5-80、5-85、5-90、5-95、5-100、5-200、5-300、5-400、5-500、5-600、5-700、5-800、5-900、5-1000、5-1100、5-1200、5-1300、5-1400、5-1500、5-1600、5-1700、5-1800、5-1900、5-2000、5-2100、5-2200、5-2300、5-2400、5-2500、5-2600、5-2700、5-2800、5-2900、5-3000、5-3100或更多个碱基,使得同源区域具有足够的同源性以与相应的基因组区域进行同源重组。“足够的同源性”表示两个多核苷酸序列具有足够的结构相似性以充当同源重组反应的底物。结构相似性包括每个多核苷酸片段的总长度以及多核苷酸的序列相似性。
序列相似性可以通过在序列的整个长度上的百分比序列同一性和/或通过包含局部相似性(例如具有100%序列同一性的连续核苷酸)的保守区域以及在序列长度的一部分上的百分比序列同一性来描述。
靶标和供体多核苷酸具有的序列同一性的量可以变化,并且包括总长度和/或在约1-20bp、20-50bp、50-100bp、75-150bp、100-250bp、150-300bp、200-400bp、250-500bp、300-600bp、350-750bp、400-800bp、450-900bp、500-1000bp、600-1250bp、700-1500bp、800-1750bp、900-2000bp、1-2.5kb、1.5-3kb、2-4kb、2.5-5kb、3-6kb、3.5-7kb、4-8kb、5-10kb,或多达并包括靶点的总长度的范围内具有单位整数值的区域。这些范围包括所述范围内的每个整数,例如1-20bp的范围包括1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19和20bp。同源性的量也可以通过在两个多核苷酸的完整比对长度上的百分比序列同一性来描述,其包括约至少50%、55%、60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的百分比序列同一性。足够的同源性包括多核苷酸长度、总体百分比序列同一性,和任选地连续核苷酸的保守区域或局部百分比序列同一性的任何组合,例如,足够的同源性可以被描述为与靶基因座的区域具有至少80%序列同一性的75-150bp的区域。足够的同源性也可以通过两个多核苷酸在高严格条件下特异性杂交的预测能力来描述,参见,例如,Sambrook等人,(1989)Molecular Cloning:ALaboratory Manual[分子克隆:实验室手册],(Cold Spring Harbor Laboratory Press,NY[纽约冷泉港实验室出版社]);Current Protocols in Molecular Biology[分子生物学实验指南],Ausubel等人编辑(1994)Current Protocols[实验室指南],(GreenePublishing Associates,Inc.[格林出版联合公司]和John Wiley&Sons,Inc.[约翰威利父子公司]);以及Tijssen(1993)Laboratory Techniques in Biochemistry and MolecularBiology-Hybridization with Nucleic Acid Probes[生物化学和分子生物学-用核酸探针杂交的实验室技术],(Elsevier,New York[纽约爱思唯尔])。
在给定的基因组区域和在供体DNA上发现的相应的同源的区域之间的结构相似性可以是允许同源重组发生的任何程度的序列同一性。例如,供体DNA的“同源的区域”和生物基因组的“基因组区域”具有的同源性或序列同一性的量可以是至少50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性,使得序列进行同源重组。
供体DNA上的同源的区域可以与靶点侧翼的任何序列具有同源性。虽然在一些实施例中,同源的区域与紧邻靶点侧翼的基因组序列共享显著的序列同源性,但是应当认识到同源的区域可以被设计为与可能更靠近靶点的5′或3′的区域具有足够的同源性。在其他实施例中,同源的区域还可以与靶点的片段以及下游基因组区域具有同源性。在一个实施例中,第一同源的区域进一步包含靶点中的第一片段,并且第二同源的区域包含靶点中的第二片段,其中第一片段和第二片段不同。
如本文所用,“同源重组”包括两个DNA分子之间在同源的位点处的DNA片段交换。
指导RNA/Cas内切核酸酶系统的其他用途已进行了描述(参见2015年3月19日公开的美国专利申请2015-0082478 A1、2015年2月26日公开的WO 2015/026886 A1、2015年2月26日公开的US 2015-0059010 A1、2014年7月07日提交的美国申请62/023246和2014年8月13日提交的美国申请62/036,652,其全部通过援引并入本文),并且包括但不限于修饰或替换目的核苷酸序列(如调节元件)、目的多核苷酸插入、基因敲除、基因敲入、剪接位点的修饰和/或引入交替剪接位点、编码目的蛋白的核苷酸序列的修饰、氨基酸和/或蛋白质融合物、以及通过在目的基因中表达反向重复序列引起的基因沉默。
在其他情况下,可以根据标准技术用诱变化学物质处理种子或其他植物材料,以引入遗传修饰。此类化学物质包括但不限于以下物质:硫酸二乙酯、亚乙基亚胺和N-亚硝基-N-乙基脲。替代性地,来自诸如X射线或γ射线等来源的电离辐射可用于引入遗传修饰。“TILLING”或“定向诱导基因组局部突变技术”是指可用于产生和/或鉴定并最终分离具有经调节的表达和/或活性的特定核酸的诱变变体的诱变技术(McCallum等人,(2000),PlantPhysiology[植物生理学]123:439-442;McCallum等人,(2000)Nature Biotechnology[自然·生物技术]18:455-457和Colbert等人,(2001)Plant Physiology[植物生理学]126:480-484)。
TILLING结合了高密度点突变和对突变的快速灵敏检测。通常,使用甲磺酸乙酯(EMS)诱变植物种子。EMS使鸟嘌呤烷基化,这通常导致错配。例如,将种子浸在约10-20mM的EMS溶液中约10至20小时;将种子洗净,然后播种。这一代植物称为M1。然后将M1植物自体受精。形成生殖组织的细胞中存在的突变被下一代(M2)遗传。通常,针对所需基因中的突变和/或特定表型筛选M2植物。
TILLING还允许选择携带突变变体的植物。这些突变变体可以在强度、位置或时间上表现出改变的表达(例如,如果突变影响启动子)。这些突变变体可表现出比天然形式的基因所表现出的减数分裂重组活性更高或更低的减数分裂重组活性。
在一些实施例中,可以用化学抑制剂(例如EDTA、DMSO等)处理生物(诸如种子或其他植物材料),施加RNAi或将其损伤以增加生物或生物种群中的减数分裂重组。参见,例如,Ihkre和Kronstad.(1975)Crop Science.[作物学]15:429-431,其通过援引以其全文并入本文。
已经公开了主要通过使用根癌农杆菌(Agrobacterium tumefaciens)来转化双子叶植物并获得转基因植物的方法,尤其是对于棉花(美国专利号5,004,863、美国专利号5,159,135);大豆(美国专利号5,569,834、美国专利号5,416,01 1);芸苔(美国专利号5,463,174);花生(Cheng等人,Plant Cell Rep.[植物细胞报告]15:653-657(1996),McKently等人,Plant Cell Rep.[植物细胞报告]14:699-703(1995));木瓜(Ling等人,Bio/technology[生物技术]9:752-758(1991));和豌豆(Grant等人,Plant Cell Rep.[植物细胞报告]15:254-258(1995))。对于其他常用的植物转化方法的综述参见如下文献:Newell,C.A.,Mol.Biotechnol.[分子生物技术]16:53-65(2000)。这些转化方法之一使用发根农杆菌(Agrobacterium rhizogenes)(Tepfler,M.和Casse-Delbart,F.,Microbiol.Sci.[微生物科学]4:24-28(1987))。已经公开了采用如下手段使用DNA的直接递送进行的大豆转化:PEG融合(PCT公开号WO 92/17598)、电穿孔(Chowrira等人,Mol.Biotechnol.[分子生物技术]3:17-23(1995);Christou等人,Proc.Natl.Acad.Sci.U.S.A.[美国科学院院报]84:3962-3966(1987))、显微注射或粒子轰击(McCabe等人,Biotechnology[生物技术]6:923-926(1988);Christou等人,Plant Physiol.[植物生理学]87:671-674(1988))。
有各种各样的方法用于从植物组织再生植物。特定的再生方法将取决于起始植物组织和待再生的特定植物种类。来自单一植物原生质体转化体或来自各种转化的外植体的植物的再生、发育和培养是本领域所熟知的(Weissbach和Weissbach编辑;Methods forPlant Molecular Biology[植物分子生物学方法];Academic Press,Inc.[学术出版社有限公司]:San Diego,CA[加利福尼亚州圣地亚哥],1988)。这种再生和生长过程典型地包括如下步骤:选择转化的细胞,通过胚性发育的通常阶段或通过生根苗阶段培养那些个体化细胞。以同样的方式再生转基因胚和种子。然后将所得的转基因生根芽苗种植在合适的植物生长培养基(如土壤)中。优选地,再生植物自花授粉以提供纯合的转基因植物。或者,将得自再生植物的花粉与农学上重要的品系的产生种子的植物进行杂交。相反地,将来自这些重要品系的植物的花粉用于给再生植物授粉。
经遗传修饰为具有增加的减数分裂重组的生物可以使用本领域技术人员熟知的方法进行培育和评价和/或杂交,以产生种群用于评价减数分裂重组率和/或标记-性状关联的变化。参见,例如图2、图3、图4和图5。在一些实例中,使种群的每个成员受精以产生第二代后代种群,可以任选地使第二代后代种群受精以产生后续世代的后代种群,例如第三代后代种群。受精可以通过任何合适的方法进行,当生物为植物时包括自体受精或自花授粉
在一些实施例中,选择目的性状的方法包括提供包括基因型数据、表型数据或其组合的数据集。因此,可以对种群中的生物进行基因型分析、表型分析或两者兼有。
基因型数据和/或表型数据可以从现有的生物种群、新产生的那些种群中获得的,或是预测的,例如经由计算机模拟。数据可从减数分裂重组增加的生物种群获得。在生物是植物的一些实施例中,数据集包括来自近交植物、杂交植物、双单倍体植物(包括但不限于F1或F2双单倍体植物)、其后代或子代或其组合的基因型数据和/或表型数据。
在一些实施例中,数据集包括核苷酸变异的基因型数据。在一些方面,基因型数据包括核苷酸变异,诸如单核苷酸变异或全基因组序列变异的序列信息。所述核苷酸变异数据可以包括但不限于单核苷酸多态性(SNP)、单倍型、简单序列重复(SSR)、微RNA、siRNA、数量性状基因座(QTL)、转基因、缺失、mRNA、甲基化模式或基因表达模式或其组合。
多种方法可用于检测或测定核苷酸变异数据,包括但不限于限制性片段长度多态性、等位基因特异性杂交(ASH)、扩增的可变序列、随机扩增的多态性DNA(RAPD)、自我持续序列复制、简单序列重复(SSR)、单核苷酸多态性(SNP)、单链构象多态性(SSCP)、扩增片段长度多态性(AFLP)和同工酶标记)。在某些实例中,使用一组与特定多态性基因组区域相关的标记对种群例如或后续世代的后代种群(诸如第二代或第三代)的每个成员进行基因型分析。
因此,在一些实施例中,核苷酸变异数据是限制性片段长度多态性(RFLP)、靶区域扩增多态性(TRAP)、同工酶电泳、随机扩增多态性DNA(RAPD)、任意引物聚合酶链式反应(AP-PCR)、DNA扩增指纹分析(DAF)、序列特征性扩增区域(SCAR)、扩增片段长度多态性(AFLP)或其任何组合。
在一些实施例中,所述数据集包括但不限于整个基因组或全基因组核苷酸变异-表型关联。
在一些实施例中,基因型数据与表达数据有关或者是表达数据,并且包括但不限于关于结构变体、组织特异性表达、基因表达、染色质表达、染色质可及性、DNA甲基化、组蛋白修饰、重组热点、转基因的基因组着陆位置或转录因子结合状态或其组合的数据。
数据集可以包括但不限于表型数据。在某些实例中,针对与特定多态性基因组区域相关的性状对种群或后续世代的后代种群(诸如第二代或第三代后代)的每个成员进行表型分析。在一些实施例中,表型数据包括关于以下方面的数据:基因表达、产量(诸如增产量、谷物产量、青贮饲料产量)、根抗倒伏、茎秆抗倒伏性、脆断抗性、穗高、穗长、谷粒行数、每行谷粒数、谷粒大小、谷粒数量、谷物水分、株高、穗轴颜色、耐密性、荚数、每荚籽粒数、成熟度、开花时间、开花热量单位、开花天数、抗病性、耐旱性、耐寒性、耐热性、耐盐性、抗胁迫性、除草剂耐受性、开花时间、颜色、抗真菌性、抗病毒性、雄性不育、雌性不育、茎秆强度、淀粉含量、油性、氨基酸平衡、赖氨酸水平、蛋氨酸水平、消化性、纤维质量或其组合。
在一些方面,该方法包括生成、鉴定或确定生物中标记和相关性状之间的关联。例如,可以鉴定或定量例如数据集中与种群中的目的性状相关的一种或多种标记-性状关联。该种群可以是后续世代的后代种群,诸如后代种群,诸如第二代或第三代后代种群。
当在本披露的上下文中提到核酸(例如,遗传标记)和性状时,术语“与......相关”或“相关”通常是指连锁不平衡的核酸和性状。术语“连锁不平衡”是指遗传基因座的非随机分离。这意味着此类基因座沿着染色体的长度物理上足够接近,使得它们倾向于以高于随机的频率一起分离。术语“遗传连锁”是指遗传基因座(包括遗传标记基因座)处于连锁不平衡并且经统计确定不独立分类。“标记辅助选择”或“MAS”是指使用遗传标记在育种种群成员中选择所需表型或性状的实践。
当在本披露容的上下文中提到表型标记和性状时,术语“与......相关”或“相关”通常是指连锁不平衡的表型标记和性状以及生物种群的单个成员中表型标记与性状的非随机分离。可以对表型标记和性状的相关性或关联进行统计分析,例如分析统计显著性。
“标记”是发现遗传或物理图谱上的位置或发现标记与性状基因座(影响性状的基因座)之间的连锁的手段。标记所检测的位置可通过检测多态性等位基因及其遗传定位而获知,或通过对已经进行物理标测的序列进行杂交、序列匹配或扩增而获知。标记可以是DNA标记(检测DNA多态性)、蛋白质(检测编码的多肽的变异)、RNA标记、甲基化标记、简单遗传的表型(诸如“蜡质”表型)或表型标记(诸如大豆植物或种子的颜色、玉米的淀粉含量或果蝇的眼睛颜色)。可从基因组核苷酸序列或从表达的核苷酸序列(例如,从剪接的RNA或cDNA)开发DNA标记。根据DNA标记技术,所述标记由侧翼于所述基因座的互补性引物和/或与所述基因座处的多态性等位基因杂交的互补性探针组成。DNA标记或遗传标记还可用于描述该染色体自身上的基因、DNA序列或核苷酸(而非用于检测该基因或DNA序列的组分),并且其通常在该DNA标记与人遗传学中的特定性状相关联时使用(例如乳腺癌标记)。术语标记基因座是该标记所检测的基因座(基因、序列或核苷酸)。如上所述,当鉴定连锁基因座时,术语“分子标记”可以用于指遗传标记,或其用作参照点的编码产物(例如,蛋白质)。标记能够来源于基因组核苷酸序列或来源于表达的核苷酸序列(例如来源于剪接的RNA、cDNA等),或来源于编码的多肽。
标记可由其所检测的多态性的类型以及用于检测所述多态性的标记技术所定义。标记类型包括但不限于,例如限制性片段长度多态性(RFLP)、同功酶标记、随机扩增的多态性DNA(RAPD)、扩增片段长度多态性(AFLP)、简单序列重复(SSR)、植物基因组的扩增可变序列、自我持续序列复制或单核苷酸多态性(SNP)。SNP可以,例如,通过DNA测序、基于PCR的序列特异性扩增方法、通过等位基因特异性杂交(ASH)进行的多核苷酸多态性检测、动态等位基因特异性杂交(DASH)、分子信标、微阵列杂交、寡核苷酸连接酶分析、Flap内切核酸酶、5′内切核酸酶、引物延伸、单链构象多态性(SSCP)或温度梯度凝胶电泳(TGGE)进行检测。DNA测序(诸如焦磷酸测序技术)具有能够检测组成单倍型的一系列连锁SNP等位基因的优点。单倍型倾向于比SNP更具信息性(检测更高水平的多态性)。
可以针对作为个体的生物或生物种群,例如植物、微生物、动物或昆虫,包括种群的成员或亚群,确定标记与目的性状之间的关联。
任何标记均可用于本文提出的方法和组合物的背景中,以鉴定和/或选择具有目的标记-性状关联的生物,而无论标记-性状关联是新赋予的还是与对照生物相比增强的。在某些实施例中,可以使用本领域已知的和本文别处描述的许多测定法来检测存在或不存在标记相关的性状,并将其与不具有相同标记-性状关联的对照生物进行比较。
标记可以证明与目的性状的初始相关性或关联。标记-性状关联可以另外适当地更新和重新评价。例如,可以针对新的标记和/或新的种群,诸如针对新产生的种质或植物系,鉴定另外的标记-性状关联。另外,在因为遗传上接近的标记之间的连锁被破坏而具有增加的减数分裂重组的种群中,可以对标记-性状关联进行重新评价并且评价种群中标记与目的性状之间的统计关系。通常,连锁越紧密,标记对于性状选择目的而言越有用,这是因为重组不太可能发生于标记和与性状相关的基因之间,所述重组可导致假阳性。在一些情况下,标记是基因本身的一部分,并且在标记和基因之间不容易发生重组。
使用本文所述的方法来增加减数分裂重组,可以使与目的性状相关的QTL或基因组区域缩小,并且可以对该较小区域中或与该区域相关联的标记进行标记-性状关联的评价。例如,与未修饰的生物或种群中的该区域相关的标记相比,QTL可以缩小到30cM、29cM、28cM、27cM、26cM、25cM、24cM、23cM、22cM、21cM、20cM、19cM、18cM、17cM、16cM、15cM、14cM、13cM、12cM、11cM、10cM、9cM、8cM、7cM、6cM、5cM、4cM、3cM、2cM、1cM、0.75cM、0.5cM、0.25cM或更小。
使用相同或不同的减数分裂重组增加的种群,与先前评价的一种或多种标记相同或不同的一种或多种标记与目的性状之间的关联可用于鉴定、评价、确认或否认关联。参见,例如图8。可以使用另外的数据通过替换标记-性状关联或通过组合标记以生成标记-性状关联的更新数据库来更新标记-性状关联。这样,随着获得和评价来自于减数分裂重组增加的种群的数据,可以确认和更新标记-性状关联,即对其进行替换和/或补充。这可能是一个反复的过程,使得标记-性状关联保持准确和相关,以用于评价、鉴定和选择目的,例如选择一种或多种候选生物或对具有所需性状的生物的改良选择以用于育种计划中。可以在数据库中输入、移除或以其他方式储存新的或更新的标记-性状关联(包括等位基因偏好),以用于本文所述的任何组合物和方法中。
可以基于标记-性状关联,例如在某些实施例中,与使用本文所述方法鉴定的与某些多态性基因组区域和性状相关的那些遗传标记来选择种群中的一种或多种生物。标记-性状关联数据可以用于确定选择种群例如植物、微生物、昆虫或动物中的哪些候选者进行育种或反选并从育种计划中去除。例如,标记-性状关联可以在标记和目的性状之间具有负关联或正关联。当标记与性状连锁时并且当标记的存在是该性状不会在包含该标记的生物中出现的指标时,标记与性状“负”相关。当标记与性状连锁时并且当标记的存在是所需性状将会在包含该标记的生物中出现的指标时,标记与性状“正”相关。在一些情况下,标记与不利的性状相关,因此提供了鉴定可以反选,例如从育种计划或种植中去除(在该生物是植物的情况下)的候选生物(诸如植物、微生物、昆虫或动物)的益处。
在减数分裂重组增加的种群中,例如在由单次育种杂交、多次有亲缘或无亲缘育种杂交产生的子代中,或选自连续间隔(世代)的育种种群的子代种群中,可以确定标记-性状关联。参见,例如图2、图3、图4和图5。在一些实施例中,在种群是植物种群的情况下,该种群包括近交植物、杂交植物、双单倍体植物,包括但不限于F1或F2双单倍体植物、其后代或子代或其组合。在一些实施例中,就引入的增加生物减数分裂重组的遗传修饰而言,植物可以是杂合的或纯合的。
在一些实施例中,表型数据包括关于以下方面的数据:产量(诸如增产量、谷物产量、青贮饲料产量)、根抗倒伏、茎秆抗倒伏性、脆断抗性、穗高、穗长、谷粒行数、每行谷粒数、谷粒大小、谷粒数量、谷物水分、株高、耐密性、荚数、每荚籽粒数、成熟度、开花时间、开花热量单位、开花天数、抗病性、耐旱性、耐寒性、耐热性、耐盐性、抗胁迫性、除草剂耐受性、开花时间、颜色、抗真菌性、抗病毒性、雄性不育、雌性不育、茎秆强度、淀粉含量、油性、氨基酸平衡、赖氨酸水平、蛋氨酸水平、消化性、纤维质量或其组合。
表型或性状可以通过多种技术进行评估,包括那些使用眼睛或仪器或使用生物化学手段和/或分子手段的技术。例如,可任选地在一个或多个分离或纯化步骤之后,使用一种或多种化学或生物化学测定法来评估含油量、淀粉含量、蛋白质含量、营养含量及其组成成分。蛋白质或RNA水平的分子表型,诸如代谢谱或表达谱,也适合根据本文所述的方法进行评价。例如,无论是代谢途径产生的小分子代谢物还是大的生物分子,代谢谱都提供了有关农艺学感兴趣的有价值的信息。可以将此类代谢谱评价为目的表型的直接或间接度量。类似地,表达谱可以用作表型的间接量度,或者本身可以直接用作要进行标记相关性分析的表型。经常在RNA表达产物的水平上,例如以阵列形式评价表达谱,但是也可以使用抗体或其他结合蛋白在蛋白质水平上进行评价。
可以使用任何适当的技术在任何合适的种群中鉴定、产生或确定生物中一种或多种标记与性状之间的关联。例如,可以在分离、随机或结构化种群中,鉴定、产生或确定所述一种或标记-性状关联。可以使用多种方法来评价标记相对于性状的分离或关联,并确定连锁或关联。
本领域熟知的各种方法可用于鉴定或检测与目的性状相关联(即共分离)的分子标记或分子标记簇,诸如与所需表型显示出统计学上显著的共分离或关联概率,表现为连锁不平衡的那些分子标记或分子标记簇。此类用于检测目的性状基因座的方法包括基于种群的关联分析(即关联作图)和传统的连锁分析,包括整个基因组的关联分析。
许多统计学方法或模型均可用于鉴定显著的标记-性状关联。一种此类方法是区间作图方法(Lander和Botstein,Genetics[遗传学]121:185-199(1989),其中针对控制目的性状的基因位于该位置的概率来测试沿遗传图谱(例如以1cM的区间)的许多位置中的每一个位置。基因型/表型数据用于计算每个测试位置的LOD评分(概率比的对数)。当LOD评分大于阈值时,存在控制目的性状的基因位于遗传图谱上的该位置处的显著证据(它将位于两个特定标记基因座之间)。
所述方法可以使用软件程序,例如,程序
Figure BDA0002798372700000521
Figure BDA0002798372700000522
软件工具,诸如SAS、Genstat、Matlab、Mathematica和S-Plus;遗传建模包,诸如QU-GENE;或模型,诸如HAPLO-MQM+模型。
在一些实施例中,已鉴定为具有以下一项或多项的标记:连锁增加、与性状共分离、相关或统计关联的概率显著,可用于本文所述的方法和组合物中。标记可以是基因型和/或表型。使用一种或多种与候选生物中的特定目的性状相关的标记-性状关联,能够基于检测出存在或不存在标记来筛选和/或选择将会表现出选定性状的候选生物,因为预计标记会指示与性状相关的基因型或表型。
如本文别处所述,本领域技术人员已知的许多合适技术可用于检测生物基因组DNA样品中的一种或多种标记,例如,使用RFLP、同工酶标记、RAPD、AFLP、SSR、生物基因组可变序列的扩增、自我持续序列复制或SNP。SNP可以,例如,通过DNA测序、基于PCR的序列特异性扩增方法、通过ASH进行的多核苷酸多态性检测、DASH、分子信标、微阵列杂交、寡核苷酸连接酶分析、Flap内切核酸酶、5′内切核酸酶、引物延伸、SSCP或TGGE进行检测。
候选生物可以选自与用于确定标记-性状关联的初始种群不同的种群。参见,例如图6。实际上,候选生物可以选自尚未经过遗传修饰为具有增加的减数分裂重组的生物种群。例如,已鉴定或选择的具有所述一种或多种标记-性状关联的候选生物可以选自非遗传修饰的生物种群。可以从由相同或不同的亲本生物或其子代产生的候选生物种群中筛选、鉴定或选择候选生物。
在一些实施例中,所述方法包括从候选单子叶植物或双子叶植物种群,包括但不限于大豆、玉米、高粱、棉花、油菜籽、向日葵、水稻、小麦、甘蔗、紫花苜蓿烟草、大麦、木薯、花生、粟、油棕、马铃薯、黑麦或甜菜植物中筛选、选择或鉴定候选植物或候选植物种群或其基因型数据和/或表型数据。在一些实施例中,所述植物种群包括来自双单倍体的植物、近交植物、杂交植物或其组合。
一种或多种与目的性状相关的标记可以被使用或外推以实现基于标记的选择决定。例如,来自数据库的与目的性状相关的一种标记或一组标记,例如来自数据库的相同SNP,可用于从非遗传修饰种群中筛选和选择或反选候选生物或候选生物种群。在一些实施例中,在候选生物中不存在相同的标记(例如SNP)的情况下,可以检查候选生物的基因组中存在与目的性状相关的共有标记,例如另外的SNP或另一组SNP,并且那些标记可以用于预测表型/性状以进行选择。另外,或在替代方案中,候选生物中不存在相同的SNP可以用作选择的基础。
在一些情况下,选定的标记可以用作在育种计划的标记辅助选择中使用的标记,以产生预计会表现出与标记-性状关联相关的所需性状的生物,诸如植物、微生物、昆虫或动物。
标记-性状关联数据可以用于确定选择种群例如植物、微生物、昆虫或动物中的哪些候选者进行育种或反选并从育种计划中去除。参见,例如图9和图10。例如,标记-性状关联可以在标记和目的性状之间具有负关联或正关联。在一些情况下,标记与不利的性状相关,因此提供了鉴定可以反选,例如从育种计划或种植中去除(在生物是植物的情况下)的候选生物(诸如植物、微生物、昆虫或动物)的益处。因此,可以鉴定出具有不良性状的生物,例如易感病的植物,并且例如将其从某些杂交或育种计划中消除。
另外,一种或多种与目的性状相关的标记可用于多种标记辅助的育种活动中,例如,用于筛选、选择和鉴定新的育种种群中哪些种群具有所述一种或多种标记,在育种种群的子代中选择具有所述一种或多种标记的子代,并且基于存在或不存在所述一种或多种标记而在改良活动中推进候选生物。
在一些情况下,该方法包括使用选定的候选生物,诸如植物或动物,选定的候选生物具有已确认的所需标记,例如标记-性状关联,和/或不存在用于育种计划的不良标记。例如,当生物是植物时,具有所需标记和/或不存在不良标记的植物可用于轮回选择、集团选择、混合选择、回交、谱系育种、开放授粉育种、限制性片段长度多态性增强选择、遗传标记增强选择、双单倍体和转化。在一些情况下,可以使植物与另一植物杂交或回交,使得可以通过有性远交或其他常规育种方法使标记和与之相关的性状渗入到该植物中。
选定的候选生物可用于杂交以产生子代种群。因此,获得了含有与目的性状相关的一种或多种标记的候选生物,然后与例如来自不同种群的另一生物杂交。可以根据与特定育种计划有关的任何育种方案来选择候选生物并使其杂交。
因此,可以通过使选定的生物与基于相同标记或不同标记,例如针对相同或不同目的性状的不同标记选择的一种或多种其他生物杂交,从选定的候选生物产生子代。在一些实例中,选定的候选者可以与一个或两个亲本杂交。在植物的情况下,进行回交通常是为了使供体亲本的一个或几个基因座渗入轮回亲本的其他所需遗传背景中。遗传特性向生物的渗入可以通过任何合适的方法进行。术语“渗入”是指遗传基因座(遗传性状)的所需等位基因从一种遗传背景传递到另一种遗传背景的现象。例如,可以经由相同物种的两个亲本之间的有性杂交将指定基因座处的所需等位基因的渗入传递给至少一个子代,其中所述亲本中的至少一个在其基因组内具有所需等位基因(遗传性状)。所需等位基因可以通过与性状相关的标记进行检测。可以将包含所需等位基因(遗传性状)的后代与具有所需遗传背景(例如,对于基因组编辑为空)的生物(诸如品系)反复回交,并选择所需等位基因(遗传性状),以导致等位基因固定在选定的遗传背景中。
在本文提供的一些实施例中,第一生物具有的遗传性状渗入到能够与第一生物有性繁殖的第二生物的后代的基因组中。这些步骤可以包括编辑第一生物(诸如植物)的基因组,以降低一个或多个起到抑制减数分裂重组功能的基因的活性。经基因组编辑的第一生物可以与第二生物杂交以产生第一杂交生物种群。第一杂交生物种群可以与第二生物杂交以产生第二杂交生物种群。可以使用标记,包括在距遗传性状预定数目的碱基范围内的一组选定的遗传标记,对第二杂交生物种群进行基因型分析。可以从确定具有含遗传性状的双重重组事件的第二杂交生物种群中选择个体,并用于产生选定的第一组个体的种群,然后该种群可以与第二生物杂交以创造第三杂交生物种群。可以使用任何一组选定标记(包括允许区分经基因编辑的基因组与未经编辑的基因组的标记)对第三杂交生物种群进行基因型分析。可以选择那些具有未经编辑的基因组和遗传性状的个体,并使其与第二生物杂交以产生另一杂交生物种群,例如第四杂交生物种群。可以使用相同或不同组的标记或两者,例如使用先前用于对亲本生物进行基因型分析的一组遗传标记和遍布生物基因组的遗传标记来对所得种群进行基因型分析。可以选择那些具有未经编辑的基因组、遗传性状以及与来自该种群的第二生物具有最大或所需水平的遗传同一性的个体。该生物可以进一步与另一生物回交,直到具有目的遗传性状的后代固定于所需遗传背景中。
选定的候选植物也可以与例如其系谱中不存在的植物或品系杂交。此类候选植物可以选自经过前一轮分析的种群,或者可以引入从头开始的育种计划中。候选植物也可以自行杂交(“自交”)以创造具有相同基因型的真正育种系。
在一些实例中,本文所述的方法包括使具有与目的性状相关的已确认的所需标记和/或不存在非所需标记的候选生物(诸如植物或动物)生长,以进一步测试和评价。
可以对选定的候选生物或其子代进行测试,以确认存在或不存在所述一种或多种与目的性状相关的标记-性状关联和/或使其生长以确认选定的生物表现出与一种或多种标记相关的性状。例如,在植物的情况下,可以确认基因型并且使植物生长以验证所述性状。还可以使用所述标记中的一种或多种作为目的标记-性状关联的替代来对子代进行遗传型评价,并且可以将具有所述一种或多种标记的子代选择为具有相关性状。
在某些实施例中,可以在候选生物的子代或候选生物的后续世代(包括计算机模拟产生的那些)中监测存在或不存在所述一种或多种标记-性状关联。
可以使用本文所述的或本领域技术人员已知的任何合适的方法或技术来确定存在或不存在所述一种或多种标记和一种或多种标记相关的性状。
实例
本披露在以下实例中进一步定义,除非另有说明,否则其中份数和百分数以重量计,并且度数以摄氏度计。
应当理解,尽管这些实例说明了本披露的优选实施例,但仅以示例的方式给出。
本文所示的每个参考文献的披露内容通过援引以其全文并入本文。
实例1:
实例1证明通过对调节重组的基因进行基因编辑而增加重组会增加标记-性状关联实验中的重组。
该实例的目的是使用玉米植物种群开发标记-性状关联,在该玉米植物种群中已经使用基因编辑方法去除了阻抑重组的基因。这些基因的去除增加了重组,导致检测到的标记性状关联的精度和准确性增加。
种群开发:如实例3中所述,通过CRISPR/Cas敲除产生针对FANCM基因的缺失而言是纯合的,由两个近交亲本杂交产生的杂交F1种群。对10株F1植物进行自花授粉,产生F2种群,并且对8个所得F2穗进行自花授粉,产生8个F3家族。通过在温室环境中种植来自所述8个F2或F3家族中的每个家族的6-8颗谷粒,产生106株植物的标记性状关联实验。
种群基因型分析:从106株植物中收集了两份重复的叶片组织,并提取DNA。在291个SNP标记处对所得DNA进行基因型分析。选择SNP标记以均匀覆盖两个近交亲本之间的已知多态性基因组区域。将同一植物的技术复制品之间产生的不一致的SNP调用从进一步分析中去除。
种群表型分析:使经过基因型分析的植物生长到成熟,然后针对株高和穗高进行表型分析。通过以厘米为单位测量到雄穗基部的距离来进行株高的测量。通过以厘米为单位测量穗基部的高度来进行穗高的测量。由于一株植物存在基因分型SNP覆盖问题,图11中示出了105株植物而不是106株植物的数据。植物和穗的高度数据,参见本文的图11。
重组和数量性状基因座(QTL)分析:使用R/QTL包分析106株植物所得到的基因型和表型数据的标记-性状关联。F2和F3家族之间观察到的重组的比较显示,平均重组增加6.5个重组事件。使用默认参数并使用F2家族作为协变量,使用Haley-Knott回归来绘制株高和穗高的QTL。使用数据的1,000个排列进行的排列检验用于确定调用QTL的1%概率阈值。然后确定在显著QTL处与较矮的植物和穗高相关的SNP变异。鉴于这些参数,检测到一个穗高的QTL和两个株高的QTL。重组率的提高允许将QTL精确地映射到较小的区间。穗高QTL映射到玉米4号染色体上从70.93到74.93cM的4cM区域。株高QTL分别映射到2号染色体118.19-126.6cM和5号染色体129.82-135.1cM。
应用于育种种质:使用在这项研究中检测到的穗高和株高QTL在先锋良种公司(Pioneer Hi-Bred)的商业育种计划中选择降低的株高和穗高。选择在三个QTL中的每一个的侧翼的两个SNP标记用于未来的标记辅助选择项目。选择在113天成熟先锋育种计划中,先前针对选定SNP进行了基因型分析的两个双单倍体种群进行标记辅助选择。从该种群中筛选出这些种群中携带有经证实与增加株高和穗高相关的SNP等位基因的个体。然后在标准育种过程中对其余品系进行测试。
实例2:
实例2是使用影响重组的基因的基因编辑型式来提高天然或转基因性状渗入的精度的方法。
该实施例描述了如何使用对阻抑重组频率的基因的基因编辑来增加关键天然基因和转基因周围重组事件的频率和精度。这种精度的提高可以直接增加天然和转基因性状渗入的效率。
精确重组体的开发:使用CRISPR/Cas方法,选择在商业上有价值的天然基因或转基因处携带有有益等位基因变异的供体近交系或变种(这里称为供体系)进行基因编辑。使用CRISPR/Cas方法从供体系的基因组中切除阻抑重组的关键基因。通过将经过基因编辑的供体系与优良育种系(近交系或变种)(这里称为优良系)杂交,然后将所得的F1种群再次与优良育种系杂交来产生回交种群。使用落在携带有有益的天然或转基因等位基因变异的基因的5-10千碱基(kb)内的4个SNP,对来自所得回交种群中的1,536个个体进行基因型分析。使用所得到的这些SNP的基因型数据来选择含有双重重组事件,在天然基因处含有有益等位基因的个体。
携带有益等位基因的优良系的开发:在靶向的天然基因或转基因周围含双重重组子的个体与优良育种系杂交。使用4个落入阻抑重组的基因的5-10kb以内的SNP,4个落入天然基因/转基因的2kb以内的SNP,以及一个区分由基因的野生型等位基因编辑而来的基因的SNP,对来自所得种群的1,536个个体进行基因型分析。选择在阻抑重组的基因处携带野生型等位基因并且在天然基因/转基因处携带有益等位基因的个体,然后再次与优良育种系杂交。
用均匀分布在基因组上的3,000个SNP以及在天然基因/转基因靶标和阻抑重组的基因的2kb以内的4个SNP,对来自所得种群的1,536个个体进行基因型分析。将在天然基因/转基因处携带有益等位基因,在阻抑重组的基因处携带野生型等位基因并且与优良育种系具有最大遗传相似性的单个个体自花授粉。使用相同的SNP组对所得种群再进行三轮相同的基因型分析、选择和自花授粉,以开发针对天然基因处的有益等位基因而言为纯合,对于阻抑重组的基因处的野生型等位基因而言为纯合并且使得与优良育种系的基因组相似性最大化的单一品系。
实例3:
实例3是用于产生实例1中使用的FANCM敲除突变体植物的方法。
对玉米杂种的玉米胚进行编辑以改变天然FANCM基因的功能。使用CRISPR/Cas9轰击的标准转化方法结合使用单个指导RNA(fancm-CR4)完成编辑。指导RNA靶序列和FANCM基因模型在表1中。
表1:用于FANCM敲除编辑的指导RNA靶序列。
指导RNA名称 指导RNA靶序列
fancm-CR4 gatgaggctcatcgagcgtc
对预期靶点的扩增子测序鉴定了T0突变体系中的所需编辑。表2中提供了DNA序列分析的结果。结果中包括野生型序列,以及从经过编辑的品系获得的序列、等位基因1、等位基因突变的描述以及所得到的野生型和经过编辑的等位基因产物的氨基酸序列。
表2:显示FANCM靶点的编辑的DNA序列分析。
Figure BDA0002798372700000601
玉米FANCM突变体的表型。将T0编辑品系带至玉米近交系。T0雄性回交产生TO种子,使T0种子生长、取样并使用Taqman SNP基因分型法对其进行基因型分析。使用跨越所有10条玉米染色体的263个SNP标记对总共80个回交植物组织样品进行基因型分析。使用野生型和经过编辑的植物的SNP数据生成加性连锁图谱。带有FANCM编辑的玉米品系表现出重组率比野生型材料高出两倍。累积遗传距离从野生型(未编辑)植物中的1856.2cM增加到FANCM突变体背景中的3841.8cM。
实例4-7:以下实例提供了提高玉米减数分裂重组率的替代方法。
实例4:通过修饰ZmRMI1的c端ob2结构域来增加玉米中的减数分裂重组
RMI1代表“RecQ介导的不稳定性1”。在酵母中,Sgs1-Top3-Rmi1是主要的NCO(非交换)促进因子,RecQ4是酵母Sgs1的植物同源物。在拟南芥中破坏AtRmi1基因的OB2结构域的点突变(Atrmi1-G592X)可以将减数分裂重组率提高至430%(Seguela-Arnaud等人,2017)。Rmi1 KO(敲除)将导致植物的雄性不育,因为除其抗交换功能以外,Rmi1可能在分解减数分裂重组中间体方面也起着重要的作用。因此,在该实例中,仅通过修饰C端OB2结构域来保留Rmi1基因的N端功能。
在这项研究中,使用CRISPR/Cas9系统来修饰ZmRMI1基因的OB2结构域。ZM-RMI1-CR1是ZmRMI1的靶向外显子6,并且ZM-RMI1-CR2是相同基因的靶向外显子7(表3)。两种gRNA均靶向ZmRMI1基因的OB2结构域。将T-DNA载体构建为含有一个Cas9表达盒和两个gRNA(ZM-RMI1-CR1+ZM-RMI1-CR2)。通过农杆菌介导的转化,将T-DNA载体直接递送到由两个近交玉米系杂交产生的第一组杂交胚中。通过直接测序鉴定在OB2结构域处具有双等位基因脱扣或移码突变的T0植物。另外,将一个仅含Cas9表达盒(无gRNA)的T-DNA载体也单独转化到第二组杂交胚。在这种情况下,预计第二组杂交胚转化产生的所有T0植物都只有野生型ZmRMI1等位基因,因此可以用作减数分裂重组的背景对照。
使T0植物在温室中生长到成熟,并与亲本近交系之一杂交。收获T0种子并使其发芽,并从T1幼苗中提取基因组DNA。使用来自染色体V的Taqman探针测量减数分裂转换率。使用遗传测定法确定破坏ZmRMI1的OB2结构域增加玉米减数分裂交换率的程度。还进行表型观察以确定OB2结构域修饰与雄性不育之间的相关性。
表3:ZmRMI1基因的gRNA序列。
Figure BDA0002798372700000621
实例5:通过敲除ZmRMI2基因,增加玉米的减数分裂重组。
RMI2代表“RecQ介导的不稳定性2”。在人类中,RMI2与RMI1的C端OB2结构域发生物理相互作用(Wang等人,2010)。已经证实RMI2在拟南芥中略微阻抑体细胞同源重组(Rohrig等人,2016)。RMI2在减数分裂重组的调节中是否发挥任何作用仍然未知。RMI2与RMI1的C端OB2结构域之间的物理相互作用可能在调节减数分裂交换中起作用。
为了确定ZmRMI2 KO增加玉米减数分裂交换的程度,使用CRISPR/Cas9技术敲除第一组和第二组杂交胚中的ZmRMI12基因,每组杂交胚均由相同的两个近交玉米系杂交产生。设计了三种gRNA以靶向ZmRMI2基因(表4)。其中,ZM-RMI2-CR1和ZM-RMI2-CR2靶向ZmRMI2ORF的上游或下游,目标是脱离ZmRMI2基因的完整ORF。ZM-RMI2-CR3靶向ZmRMI2的外显子II,主要目的是产生移码突变,以破坏ZmRMI2蛋白质的早期翻译。构建两个T-DNA载体,以通过农杆菌介导的转化敲除ZmRMI2。具有Cas9表达盒的第一T-DNA载体包含两个gRNA(ZM-RMI2-CR1和ZM-RMI2-CR2),而具有Cas9表达盒的第二T-DNA载体仅包含一个gRNA(ZM-RMI2-CR3)。经由农杆菌介导的转化,将第一T-DNA载体递送至第一组杂交胚中,并且将第二T-DNA载体递送至第二组杂交胚中。通过直接测序鉴定在ZmRMI2基因处具有双等位基因脱扣或移码突变的T0植物。另外,源自先前实例(实例4)中描述的第二组杂交胚转化的T0植物用作减数分裂重组率的背景对照。实例4中描述的类似测定法可用于检查ZmRMI2突变体和对照植物中的减数分裂重组率。
表4:ZmRMI2基因的gRNA序列
Figure BDA0002798372700000631
实例6:通过敲除ZmRTEL1基因,增加玉米的减数分裂重组。
RTEL1代表“端粒延伸解旋酶调节因子1”。RTEL1同源物存在于人和植物中,但酵母中不存在。AtRTEL1在有丝分裂中的抗重组活性比AtFANCM基因强(Recker等人,2014)。但是,尚不清楚RTEL1基因在减数分裂中是否具有类似的抗重组作用。
使用CRISPR/Cas9技术从两个近交系杂交产生的杂交胚中敲除ZmRTEL1基因。设计了三种gRNA以靶向ZmRTEL1基因(表5)。其中,ZM-RTEL1-CR1和ZM-RTEL1-CR2靶向ZmRMI2ORF的上游或下游以消除ZmRTEL1基因的完整ORF。ZM-RTEL1-CR3靶向ZmRTEL1的外显子II,产生移码突变,这些移码突变可破坏ZmRTEL1的翻译。构建两个T-DNA载体,以通过农杆菌介导的转化敲除ZmRTEL1。第一T-DNA载体含有Cas9表达盒和两个gRNA(ZM-RTEL1-CR1和ZM-RTEL1-CR2),而第二T-DNA载体含有Cas9表达盒和仅一个gRNA(ZM-RTEL1-CR3)。通过农杆菌介导的转化,将两个T-DNA载体分别从杂交的近交系递送到杂交胚中。通过直接测序鉴定在ZmRTEL1基因处具有双等位基因脱扣或移码突变的T0植物。预计实例4中第二组杂交胚转化产生的T0植物只有野生型ZmRMI1等位基因,因此可以用作减数分裂重组率的背景对照。实例4中描述的类似测定法将用于检查ZmRTEL1突变体和对照植物中的减数分裂重组率。
表5.ZmRTEL1基因的gRNA序列。
Figure BDA0002798372700000641
实例7:通过敲除ZmRecQ4基因,增加玉米的减数分裂重组。
Sgs1(缓慢生长抑制因子1)是来自酵母的RecQ家族DNA解旋酶。与野生型对照相比,Sgs1突变体中减数分裂交换率增加1.4倍(Rockmill等人,2003)。来自人的BLM解旋酶是酵母Sgs1的直系同源物。从患有布卢姆综合征(Bloom′s syndrome)的人的体细胞中观察到超体细胞交换(Langlois等人,1989)。RecQ4是Sgs1和BLM解旋酶的直系同源物。拟南芥在基因组中具有两个RecQ4基因:AtRecQ4A和AtRecQ4B。与野生型对照相比,这两个基因的突变导致减数分裂交换率增加六倍(Seguela-Arnaud等人,2015)。玉米基因组中只有一个单拷贝RecQ4,设计下面的研究旨在检验ZmRecQ4 KO是否可以增强玉米中的减数分裂重组。
使用CRISPR/Cas9系统从两个近交系之间杂交产生的杂交胚中敲除ZmRecQ4基因。设计两对gRNA以诱导ZmRecQ4基因的脱扣缺失(表6)。recQ4-CR2和recQ4-CR5指导RNA分别靶向ZmRecQ4的5′UTR和外显子13。recQ4-CR4和recQ4-CR6分别靶向ZmRecQ4的外显子10和外显子15。对于第一项实验,用Cas9表达盒和两个gRNA表达载体(recQ4-CR2和recQ4-CR5)轰击未成熟的杂交胚。对于第二项实验,用Cas9表达盒和两个gRNA表达质粒(recQ4-CR4和recQ4-CR6)轰击未成熟的杂交胚。通过PCR扩增和直接测序鉴定出在ZmRecQ4处具有双等位基因1.8kb脱扣的三株T0植物。另外,还鉴定出仅具有野生型ZmRecQ4等位基因的T0植物作为减数分裂重组的背景对照。
表6.ZmRecQ4基因的gRNA序列
Figure BDA0002798372700000651
使T0植物在温室中生长到成熟,并与亲本近交系之一杂交。收获T0种子并使其发芽,并从T1幼苗中提取基因组DNA。选择具有脱扣缺失的T0植物的子代(平均每株T0有100株T1植物)和两株野生型T0进行TGBS分析。最后,使用385种信息标记分析减数分裂交换率。在野生型对照中,平均观察到每个配子有约21个交换。相比之下,在ZmRecQ4 KO中每个配子有约62个交换。累积遗传距离从野生型对照中的2181cM增加到ZmRecQ4突变体中的9452cM(表7)。另外,在两个亲本近交系中均产生ZmRecQ4脱扣缺失,然后将这些经过编辑的近交系杂交。使用Taqman标记(238)分析ZmRecQ4 KO对减数分裂交换的影响,并且在ZmRecQ4突变体中发现了类似的减数分裂重组增加。
表7.ZmRecQ4突变体中的累积遗传距离
BC1F1 SIID 基因型 累加距离(cM)
90277326 WT-1 2087.18
90220119 WT-2 2277.76
90308544 Recq4 KO-1 9679.5
90341756 Recq4 KO-2 9361.19
90341733 Recq4 KO-3 9318.06
虽然已经根据各实施例和实例讨论了本发明,但是本领域的普通技术人员将认识到本发明不限于那些特定的实施例和实例。例如,已经使用CRISPR/Cas9基因编辑工具证明了重组率的提高,但是可以使用本领域的普通技术人员已知的任何基因编辑工具进行类似有效的编辑,包括例如使用锌指核酸酶(ZFN)或转录激活因子样效应子核酸酶(TALEN)。替代性地,可以通过例如经自然突变、诱变或转座子使修复基因突变来实现重组率提高。
此外,虽然实例集中于增加玉米植物中的重组,但是本领域的普通技术人员将认识到如本说明书中披露的增加重组在任何植物或动物育种计划中的益处。可以从所披露的发明中受益的植物育种计划包括:大豆、玉米、高粱、棉花、油菜籽、向日葵、水稻、小麦、甘蔗、烟草、大麦、木薯、花生、粟、油棕、马铃薯、黑麦、甜菜以及粮食、饲料和油料果实、蔬菜和种子/豆荚。

Claims (42)

1.一种选择具有目的性状的植物的方法,所述方法包括:
提供包含从植物种群获得的基因型数据和/或表型数据的数据集,其中所述种群中的一种或多种植物包含一个或多个引入的遗传修饰,与不包含所述一个或多个引入的遗传修饰的对照植物相比,所述遗传修饰增加一种或多种植物中的减数分裂重组,并且其中所述植物种群包含一种或多种表型标记或基因型标记;
在所述数据集中鉴定或生成一种或多种与所述植物种群中的所述目的性状相关的标记-性状关联;
筛选候选植物或候选植物种群中存在或不存在一种或多种与所述目的性状相关的标记-性状关联,其中所述候选植物或所述候选植物种群(i)不包含所述引入的遗传修饰并且(ii)不是从含有所述引入的遗传修饰的所述植物种群中获得的;以及
基于存在或不存在一种或多种与所述目的性状相关的标记-性状关联来选择所述候选植物。
2.如权利要求1所述的方法,其中减数分裂重组在所述植物基因组的很大一部分中增加。
3.如权利要求1所述的方法,其中所述候选植物或候选植物种群包括双子叶植物或单子叶植物。
4.如权利要求1所述的方法,其中所述一种或多种标记-性状关联是新赋予的。
5.如权利要求1所述的方法,其中所述一种或多种标记-性状关联与对照植物中相应的标记-性状关联相比,具有增加的统计关联。
6.如权利要求1所述的方法,其进一步包括:使选定的候选植物生长。
7.如权利要求1所述的方法,其中所述数据集包括核苷酸变异数据、表型数据或其组合。
8.如权利要求7所述的方法,其中所述核苷酸变异数据包括单核苷酸多态性(SNP)、单倍型、简单序列重复(SSR)、微RNA、siRNA、数量性状基因座(QTL)、转基因、缺失、mRNA、甲基化模式或基因表达模式或其组合。
9.如权利要求1所述的方法,其中所述数据集包括全基因组核苷酸变异-表型关联。
10.如权利要求1所述的方法,其中所述目的性状选自由颜色、产量、穗高、穗长、谷粒行数、每行谷粒数、抗病性、抗胁迫性、除草剂耐受性和开花时间组成的组。
11.如权利要求1所述的方法,其中所述标记-性状关联是所述标记和所述目的性状之间已知或预测的负关联。
12.如权利要求1所述的方法,其中所述标记-性状关联是所述标记和所述目的性状之间已知或预测的正关联。
13.如权利要求11所述的方法,其进一步包括:基于不存在负关联而选择所述候选植物。
14.如权利要求12所述的方法,其进一步包括:基于存在正关联而选择所述候选植物。
15.如权利要求1所述的方法,其中所述数据集包括来自双单倍体植物、近交系、杂交植物、其后代或其组合的基因型数据和/或表型数据。
16.如权利要求1所述的方法,其中通过将一种或多种多核苷酸在遗传上引入所述植物的基因组中以增加一个或多个起到促进减数分裂重组功能的基因的表达水平或活性,而将所述植物种群修饰为具有增加的减数分裂重组。
17.如权利要求16所述的方法,其中所述一个或多个起到促进减数分裂重组功能的基因包括HEI10、MSH4/MSH5、Mlh1/Mlh3、MutS相关异二聚体、MER3 DNA解旋酶、SHORTAGE OFCROSSOVERS1(SHOC1)XPF核酸酶、PARTING DANCERS(PTD)、ZIP4/SPO22、Zip1、Zip2、Zip3、Zip4、Msh4、Msh5、Mlh1/Mlh3或其组合。
18.如权利要求1所述的方法,其中通过将一个或多个核苷酸取代、添加和/或缺失在遗传上引入所述植物的基因组中以降低一个或多个起到抑制减数分裂重组功能的基因的表达水平或活性,而将所述植物种群修饰为具有增加的减数分裂重组。
19.如权利要求18所述的方法,其中所述一个或多个起到抑制减数分裂重组功能的基因包括RMI1、RMI2、RTEL1、RECQ4或FANCM或其组合。
20.如权利要求1所述的方法,其中使用基因组编辑技术引入所述遗传修饰。
21.如权利要求1所述的方法,其中所述候选植物或候选植物种群包括双单倍体植物、近交系、杂交植物、其后代或其组合。
22.如权利要求1所述的方法,其中所述植物种群中的植物是单子叶植物或双子叶植物。
23.一种选择具有目的性状的植物的方法,所述方法包括:
选择基于存在或不存在一种或多种与所述目的性状相关的标记-性状关联而选定的候选植物,其中所述标记-性状关联来自于包含基因型数据和/或表型数据的数据集,所述基因型数据和/或表型数据获自:(i)含有一个或多个引入的遗传修饰的植物种群,与不含所述一个或多个遗传修饰的对照植物相比,所述遗传修饰增加减数分裂重组;和/或(ii)源自亲本植物种群的植物种群,其中所述亲本植物中的一种或多种含有一个或多个引入的遗传修饰,与不含所述遗传修饰的对照植物相比,所述遗传修饰增加减数分裂重组。
24.如权利要求23所述的方法,其中减数分裂重组在所述植物基因组的很大一部分中增加。
25.如权利要求23所述的方法,其中所述一种或多种标记-性状关联是新赋予的。
26.如权利要求23所述的方法,其中所述候选植物或候选植物种群包括双单倍体植物、近交系、杂交植物、其后代或其组合。
27.如权利要求23所述的方法,其进一步包括:使选定的候选植物生长。
28.一种选择具有目的性状的生物的方法,所述方法包括:
提供包含从生物种群获得的基因型数据和/或表型数据的数据集,其中所述种群中的一种或多种生物包含一个或多个引入的遗传修饰,与不包含所述一个或多个引入的遗传修饰的对照生物相比,所述遗传修饰增加所述一种或多种生物中的减数分裂重组,并且其中所述生物种群包含一种或多种表型标记或基因型标记;
在所述数据集中鉴定或生成一种或多种与所述生物种群中的所述目的性状相关的标记-性状关联;
筛选候选生物或候选生物种群中存在或不存在一种或多种与所述目的性状相关的标记-性状关联,其中所述候选生物或所述候选生物种群(i)不含所述引入的遗传修饰并且(ii)不是从含有所述引入的遗传修饰的所述生物种群中获得的;以及
基于存在或不存在一种或多种与所述目的性状相关的标记-性状关联来选择所述候选生物或候选生物种群。
29.如权利要求28所述的方法,其中减数分裂重组在所述生物的基因组中增加。
30.如权利要求28所述的方法,其中所述候选生物或候选生物种群是植物、动物或微生物。
31.如权利要求30所述的方法,其中所述候选生物是植物并且所述植物种群包括双单倍体植物、近交系、杂交植物、其后代或其组合。
32.如权利要求28所述的方法,其进一步包括:使选定的候选生物生长。
33.一种增加生物中遗传标记与相关遗传性状之间的关联的方法,其包括:
a.编辑所述生物种群中的一个或多个成员的基因组,以调节减数分裂期间参与重组的一个或多个基因的活性,从而提高所述种群中的减数分裂重组率;
b.使所述种群的每个成员受精以产生第二代后代种群;
c.使用与多态性基因组区域相关的一组标记对所述第二代后代种群的每个成员进行基因型分析;
d.针对与所述多态性基因组区域相关的性状对所述第二代后代种群的每个成员进行表型分析;以及
e.对所述第二代后代种群中的一种或多种标记-性状关联进行定量。
34.如权利要求33所述的方法,其中所述生物是植物。
35.如权利要求33所述的方法,其中一种或多种标记-性状关联与对照生物中相应的标记-性状关联相比,具有增加的统计关联。
36.一种选择具有目的性状的植物或选择具有所需基因型的植物的方法,所述方法包括:
提供包含从植物种群获得的基因型数据和/或表型数据的数据集,其中所述种群中的一种或多种植物(i)与对照植物相比,由于重组调节因素而表现出经调节的重组模式或(ii)是与对照植物相比,由于重组调节因素而表现出经调节的减数分裂重组的一种或多种亲本植物的子代,并且其中所述植物种群包含一种或多种表型标记或基因型标记;
在所述数据集中鉴定或生成一种或多种与所述植物种群中的所述目的性状或所述所需基因型相关的标记-性状关联;
筛选候选植物或候选植物种群中存在或不存在一种或多种与所述目的性状相关的标记-性状关联,其中所述候选植物或所述候选植物种群(i)不包含由于所述调节因素而产生的经调节的重组模式并且(ii)不是由于重组调节而表现出经调节的减数分裂重组的亲本植物的子代;以及
基于存在或不存在一种或多种与所述目的性状相关的标记-性状关联来选择所述候选植物。
37.如权利要求36所述的方法,其中所述重组调节因素选自由以下组成的组:引入的遗传修饰、化学重组调节因素、生物重组调节因素、外源施加的重组调节因素、辐射、内源基因激活、内源基因阻抑、瞬时重组调节因素及其组合。
38.如权利要求36所述的方法,其中所述重组调节因素是通过位点特异性CRISPR-Cas系统引入的遗传修饰。
39.如权利要求36所述的方法,其中所述重组调节因素是通过位点特异性核碱基编辑器引入的没有双链DNA断裂的遗传修饰。
40.如权利要求36所述的方法,其中所述经调节的重组是整个基因组或部分基因组中的减数分裂重组频率或减数分裂交换事件的增加。
41.如权利要求36所述的方法,其中所述经调节的重组是整个基因组或部分基因组中的减数分裂重组频率或减数分裂交换事件的减少。
42.如权利要求36所述的方法,其中所述经调节的重组引起交换干扰减少。
CN201980035353.6A 2018-05-25 2019-05-24 用于通过调节重组率来改善育种的系统和方法 Pending CN112204156A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862676564P 2018-05-25 2018-05-25
US62/676564 2018-05-25
US201862783537P 2018-12-21 2018-12-21
US62/783537 2018-12-21
PCT/US2019/033907 WO2019226984A2 (en) 2018-05-25 2019-05-24 Systems and methods for improved breeding by modulating recombination rates

Publications (1)

Publication Number Publication Date
CN112204156A true CN112204156A (zh) 2021-01-08

Family

ID=66912945

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980035353.6A Pending CN112204156A (zh) 2018-05-25 2019-05-24 用于通过调节重组率来改善育种的系统和方法

Country Status (7)

Country Link
US (1) US20210210163A1 (zh)
EP (1) EP3802887A2 (zh)
CN (1) CN112204156A (zh)
AU (1) AU2019274597A1 (zh)
BR (1) BR112020023853A2 (zh)
CA (1) CA3096859A1 (zh)
WO (1) WO2019226984A2 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116863998A (zh) * 2023-06-21 2023-10-10 扬州大学 一种基于遗传算法的全基因组预测方法及其应用
CN117133354A (zh) * 2023-08-29 2023-11-28 北京林业大学 一种高效鉴定林木关键育种基因模块的方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023164606A1 (en) * 2022-02-25 2023-08-31 The University Of North Carolina At Chapel Hill Compounds for modifying meiotic recombination and methods relating thereto

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050144664A1 (en) * 2003-05-28 2005-06-30 Pioneer Hi-Bred International, Inc. Plant breeding method
CN101854797A (zh) * 2007-06-22 2010-10-06 孟山都技术公司 针对性状表现和表达选择基因座的方法和组合物
US20160102370A1 (en) * 2014-10-10 2016-04-14 Dow Agrosciences Llc Molecular markers associated with green snap in maize
CN105829536A (zh) * 2013-08-22 2016-08-03 纳幕尔杜邦公司 用于在不掺入选择性转基因标记的情况下,在植物基因组中产生基因修饰的方法,以及用于这种方法的组合物
US20170137840A1 (en) * 2014-06-03 2017-05-18 Pioneer Hi-Bred International, Inc. Compositions and methods for selecting maize plants with resistance to bacterial stalk rot
CN106978438A (zh) * 2017-02-27 2017-07-25 北京大北农生物技术有限公司 提高同源重组效率的方法
US20170245446A1 (en) * 2014-10-27 2017-08-31 Pioneer Hi-Bred International, Inc. Improved molecular breeding methods
WO2018015956A1 (en) * 2016-07-21 2018-01-25 Kaiima Bio Agritech Ltd. Compositions and methods for generating a haploid of a target plant

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5188958A (en) 1986-05-29 1993-02-23 Calgene, Inc. Transformation and foreign gene expression in brassica species
US5004863B2 (en) 1986-12-03 2000-10-17 Agracetus Genetic engineering of cotton plants and lines
US5416011A (en) 1988-07-22 1995-05-16 Monsanto Company Method for soybean transformation and regeneration
AU1871492A (en) 1991-03-29 1992-11-02 Board Of Trustees Of The University Of Illinois, The Production fo transgenic soybean plants
US11458157B2 (en) 2011-12-16 2022-10-04 Targetgene Biotechnologies Ltd. Compositions and methods for modifying a predetermined target nucleic acid sequence
EP4286402A3 (en) 2012-12-12 2024-02-14 The Broad Institute, Inc. Crispr-cas component systems, methods and compositions for sequence manipulation
FR3021668B1 (fr) * 2014-05-30 2018-11-16 Institut National De La Recherche Agronomique Augmentation de la recombinaison meiotique chez les plantes par inhibition d'une proteine recq4 ou top3a du complexe rtr
AU2015288157A1 (en) 2014-07-11 2017-01-19 E. I. Du Pont De Nemours And Company Compositions and methods for producing plants resistant to glyphosate herbicide
US10513711B2 (en) 2014-08-13 2019-12-24 Dupont Us Holding, Llc Genetic targeting in non-conventional yeast using an RNA-guided endonuclease
US10208298B2 (en) 2014-11-06 2019-02-19 E.I. Du Pont De Nemours And Company Peptide-mediated delivery of RNA-guided endonuclease into cells

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050144664A1 (en) * 2003-05-28 2005-06-30 Pioneer Hi-Bred International, Inc. Plant breeding method
CN101854797A (zh) * 2007-06-22 2010-10-06 孟山都技术公司 针对性状表现和表达选择基因座的方法和组合物
CN105829536A (zh) * 2013-08-22 2016-08-03 纳幕尔杜邦公司 用于在不掺入选择性转基因标记的情况下,在植物基因组中产生基因修饰的方法,以及用于这种方法的组合物
US20170137840A1 (en) * 2014-06-03 2017-05-18 Pioneer Hi-Bred International, Inc. Compositions and methods for selecting maize plants with resistance to bacterial stalk rot
US20160102370A1 (en) * 2014-10-10 2016-04-14 Dow Agrosciences Llc Molecular markers associated with green snap in maize
US20170245446A1 (en) * 2014-10-27 2017-08-31 Pioneer Hi-Bred International, Inc. Improved molecular breeding methods
WO2018015956A1 (en) * 2016-07-21 2018-01-25 Kaiima Bio Agritech Ltd. Compositions and methods for generating a haploid of a target plant
CN106978438A (zh) * 2017-02-27 2017-07-25 北京大北农生物技术有限公司 提高同源重组效率的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
MATHILDE S´EGU´ELA-ARNAUD ET AL.: "RMI1 and TOP3 limit meiotic CO formation through their C-terminal domains", NUCLEIC ACIDS RESEARCH *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116863998A (zh) * 2023-06-21 2023-10-10 扬州大学 一种基于遗传算法的全基因组预测方法及其应用
CN116863998B (zh) * 2023-06-21 2024-04-05 扬州大学 一种基于遗传算法的全基因组预测方法及其应用
CN117133354A (zh) * 2023-08-29 2023-11-28 北京林业大学 一种高效鉴定林木关键育种基因模块的方法

Also Published As

Publication number Publication date
AU2019274597A1 (en) 2020-11-12
BR112020023853A2 (pt) 2021-04-13
WO2019226984A2 (en) 2019-11-28
US20210210163A1 (en) 2021-07-08
EP3802887A2 (en) 2021-04-14
CA3096859A1 (en) 2019-11-28
WO2019226984A3 (en) 2019-12-26

Similar Documents

Publication Publication Date Title
Lyzenga et al. Advanced domestication: harnessing the precision of gene editing in crop breeding
US20230227836A1 (en) Simultaneous gene editing and haploid induction
CN113631722A (zh) 鉴定、选择和生产南方玉米锈病抗性作物的方法
IL285707B2 (en) Cannabis plants are resistant to downy mildew
CN111988988A (zh) 鉴定、选择和产生抗白叶枯病水稻的方法
CN112204156A (zh) 用于通过调节重组率来改善育种的系统和方法
Abid et al. Changes in DNA-methylation during zygotic embryogenesis in interspecific hybrids of beans (Phaseolus ssp.)
US20230279418A1 (en) Plant haploid induction
CN115335506A (zh) 鉴定、选择和生产南方玉米锈病抗性作物的方法
US20230193305A1 (en) Methods for increasing powdery mildew resistance in cannabis
US20220049265A1 (en) Plants with improved digestibility and marker haplotypes
US20240141369A1 (en) Domestication of a legume plant
US20220243287A1 (en) Drought tolerance in corn
Bradshaw et al. Mutation breeding
WO2022040134A1 (en) Multiple disease resistance genes and genomic stacks thereof
CA3142241A1 (en) Cannabis plants with improved yield
CN113544277A (zh) 用于驱动t1事件多样性的组合物和方法
US20220186243A1 (en) Cannabis plants with improved yield
US20230203513A1 (en) Cucumber plant habit
EP4278891A1 (en) Clubroot resistance and markers in brassica
US20210071192A1 (en) Methods to evaluate traits
WO2024079157A1 (en) Virus and insect resistance and markers in barley
WO2023164453A2 (en) Multiple disease resistance genes and genomic stacks thereof
WO2022241461A1 (en) Modified autoflower cannabis plants with value phenotypes
WO2024124509A1 (en) Maize plants comprising resistance to southern leaf blight and compositions and methods for selecting and producing the same

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination