CN114786473B - 制备突变植物的方法 - Google Patents

制备突变植物的方法 Download PDF

Info

Publication number
CN114786473B
CN114786473B CN202080085516.4A CN202080085516A CN114786473B CN 114786473 B CN114786473 B CN 114786473B CN 202080085516 A CN202080085516 A CN 202080085516A CN 114786473 B CN114786473 B CN 114786473B
Authority
CN
China
Prior art keywords
pool
sub
regenerated
plant
mutation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202080085516.4A
Other languages
English (en)
Other versions
CN114786473A (zh
Inventor
伯吉特·斯卡德豪奇
索伦·克努森
古斯塔夫·汉布雷乌斯
T·文特
M·拉斯马森
J·图林奥斯特伯格
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Carlsberg AS
Original Assignee
Carlsberg AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Carlsberg AS filed Critical Carlsberg AS
Publication of CN114786473A publication Critical patent/CN114786473A/zh
Application granted granted Critical
Publication of CN114786473B publication Critical patent/CN114786473B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H1/00Processes for modifying genotypes ; Plants characterised by associated natural traits
    • A01H1/04Processes of selection involving genotypic or phenotypic markers; Methods of using phenotypic markers for selection
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H1/00Processes for modifying genotypes ; Plants characterised by associated natural traits
    • A01H1/02Methods or apparatus for hybridisation; Artificial pollination ; Fertility
    • A01H1/026Methods or apparatus for hybridisation; Artificial pollination ; Fertility by treatment with chemicals
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H5/00Angiosperms, i.e. flowering plants, characterised by their plant parts; Angiosperms characterised otherwise than by their botanic taxonomy
    • A01H5/10Seeds
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H6/00Angiosperms, i.e. flowering plants, characterised by their botanic taxonomy
    • A01H6/46Gramineae or Poaceae, e.g. ryegrass, rice, wheat or maize
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H6/00Angiosperms, i.e. flowering plants, characterised by their botanic taxonomy
    • A01H6/46Gramineae or Poaceae, e.g. ryegrass, rice, wheat or maize
    • A01H6/4624Hordeum vulgarus [barley]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries

Abstract

本发明提供了制备具有一个或多个NOI中特定的预定突变的植物的方法。所述特定的预定突变优选可以导致鉴定具有所需性状的植物。

Description

制备突变植物的方法
发明领域
本发明提供了制备在一个或多个感兴趣的核苷酸(NOI)中具有特定的预定突变的植物的方法。所述特定的预定突变优选可以导致鉴定具有所需性状的植物。
背景技术
遗传变异是育种群体中几乎所有表型和基因型差异的原因。遗传变异自然发生,通常是通过作用于生物体的环境胁迫,例如通过增加暴露于太阳辐射、极端土壤条件或其他非生物或生物胁迫。这种胁迫诱导的变异是生物体自然多样性、适应和进化的驱动因素之一。
传统育种利用这种遗传变异来开发适合当地的作物。增加超出育种群体中已有的遗传变异的一种方法是提高暴露于胁迫的水平以主动诱导额外的遗传变异。在过去的90年中,这已经由突变育种成功完成,从而产生了成千上万种具有基于诱导的遗传变异的有益性状的经济作物品种。这种类型的突变诱导通常通过建立一个独特的育种群体来加以利用,该群体由诱变的种质组成,其然后作为鉴定性状的来源,并进一步为与现有优良育种系的遗传杂交提供亲本生物体。诱变育种群体的一个明显特征是与自然群体相比,该群体包含极大增加的遗传变异。为了实现高突变频率,通常选择诱变处理,由于积累了太多的具有有害表型效应的突变,其导致很大比例的处理过的材料死亡。为了选择最佳诱变处理,通常准备一系列突变处理并比较处理过的生物体在正常条件下发育的能力。这通常被称为杀灭曲线。杀灭曲线用作确定50%的诱变材料死亡的浓度和处理持续时间的工具。然后使用这种处理来产生例如谷类谷粒的诱变育种群体。
可以使用各种化学品或辐射剂量进行突变处理。暴露于诱变剂的时间和诱变剂的相对浓度都决定了对生物体的最终影响。这种处理在很大程度上取决于生物体。
诱变剂的选择可以取决于待突变的生物体的性质,因为某些诱变剂在某些生物体中的作用比在其他生物体中更好。暴露时间也可以从几个小时到很多小时不等,且化学品浓度负荷可根据暴露时间、生物体的性质、组织和化学诱变剂而有所不同。
诱导的突变通常是杂合的,并在最初诱变的作物中引起嵌合植物基因型。这意味着从植物的诱变再生部分(例如诱变种子,即M1再生部分)收获的谷粒具有高度的遗传多样性。因此,诱变育种群体通常通过M2再生部分或后代的再生部分(例如种子)表示。以这种方式,根据孟德尔遗传学,植物的大多数后代仅分离两个等位基因(突变型和野生型),以允许纯合隐性突变在表型水平上表达(可见)。这也使育种者能够使用以低灵敏度为特征的筛选技术。随着筛选技术的进一步发展,育种者已开始利用敏感性增加的筛选工具,通过结合几个用于筛选的M2再生部分(例如种子或植物)的DNA。虽然在诱变群体中筛选遗传变异的已知方法受限于筛选5-10个植物的池(异源双链体分析、Sanger测序、高分辨率熔解曲线分析),但如今,当采用先进的测序技术进行分析时,这些库中的一些可多达100个DNA样品。然而,尽管取得了明显的进展,挑战仍然存在,不仅在于制备大量单独的DNA样品,而且还在于鉴定可能进入育种计划的具有许多背景突变的潜在突变植物,即与感兴趣的性状无关但可能影响其他作物特征,例如作物产量和繁殖特征的那些。
饱和作物突变文库没有明确的定义,但诱变育种群体的基本思想是每个基因的几个突变等位基因代表整个群体。为了保持文库较小,群体中的每个成员都必须携带几个基因的突变。在典型的大麦文库中,群体的每个成员在编码区携带100-200个突变。在确定所需性状后,这些额外的编码突变是育种者最关心的问题。真正饱和的突变文库将包括每个基因中每个氨基酸的突变等位基因。为了实现这一点,突变频率或突变密度必须更高或群体更大。然而,明显降低的植物适合度(plant fitness)仍然是与利用由增加的突变剂量制备的文库有关的限制因素。此外,组装具有数千个个体的文库所涉及的劳动和时间以及筛选此类文库的成本限制了扩展文库的潜力。克服上述障碍的一种方法涉及在建立突变体文库时应用更高水平的诱变剂。在这方面,植物适合度的进一步降低限制了每个个体的突变剂量的增加。因此,不存在真正饱和的诱变文库。
在用赋予高突变密度或高突变频率的处理进行诱变后,通常将突变作物回交至野生型或亲本作物,以便消除可能已在基因组其他部分发生的突变。这可有助于消除因不想要的脱靶突变而导致的“副作用”。
发明内容
迄今为止,植物育种者的目标一直是使用具有尽可能高突变率或频率的育种群体,以便增加鉴定携带特定性状的植物的可能性。与此相反,本发明提供了减少诱变育种群体中每个个体的编码突变数量的方法。换言之,本发明提供了允许使用具有低诱变率的植物群体或其再生物(regenerative)的方法。
在用赋予高突变密度或高突变频率的处理进行诱变后,通常将突变作物回交至野生型或亲本作物,以便消除可能已在基因组其他部分发生的突变。这可有助于消除因不想要的脱靶突变而导致的“副作用”。在实际设置中,如本文所述的育种问题的改善转化为育种群体的生物体中的表型劣势从根本上减少。这些诱导的突变将减少,其随着时间的推移,即在实际突变体鉴定过程之后,赋予具有挑战性甚至不利的表型-特别是在响应于与温度和降水挑战有关的环境胁迫时赋予表型劣势的突变。此外,可预期用本方法鉴定的突变体具有增加的生存力,因为它们可以避免突变的产生,所述突变可能仅在获得突变体后很长时间才变得明显或相关。携带许多突变的植物起初可能看起来与亲本植物一样有活力,但在某些条件下,例如干旱、寒冷、多雨等,可能揭示它们含有额外的、尚未识别的可能对生存力构成挑战的突变。
低诱变率可以表示为编码区非同义突变的数量少。每个个体的编码突变数量少降低了额外突变在诱变育种群体中的不利影响。对于化学诱变剂,每种植物的突变密度取决于暴露于诱变剂的时间、作物、组织、化学诱变剂的性质和浓度。对于特定植物,可通过使用“杀灭曲线”检查来测定特定化学诱变剂的最佳浓度和/或暴露时间来开发具有低突变密度个体的文库。对于本发明的方法,优选使用给定诱变剂的浓度和/或暴露时间,这不会导致诱变植物群体的适合度丧失或生存力丧失。理想地,供本发明的方法使用的诱变植物群体中的每株植物具有1至30个非同义突变,即编码区中导致在所翻译的蛋白中氨基酸交换的突变。
与查看非同义突变的数量不同,低诱变率也可以表示为高的基因百分比,这些基因没有非同义突变。因此,在一些实施方案中,低诱变率可以是植物(例如在M1代的再生部分中)的基因的至少99%、例如至少99.8%、例如至少99.9%没有非同义突变。
具体可以认为是低诱变率的可能因植物而异,特别是基于植物的倍性。因此,具有高倍性的植物通常可耐受较高的诱变率,因此,此类植物中的“低诱变率”可能远高于二倍体植物中的“低诱变率”。一般而言,二倍体植物中的低诱变率可以是M1中所有基因的至少99.8%,优选至少99.9%没有非同义突变。一般而言,在具有高于二的倍性的植物中,例如在四倍体或六倍体植物中的低诱变率,低诱变率可以是M1中所有基因的至少98.0%,优选至少99.0%没有非同义突变。
低诱变率也可以表示为低突变频率。例如,在二倍体植物中,低诱变率可以是至多500,000分之一、例如至多750,000分之一、例如至多1,000,000分之一的突变频率。在四倍体植物中,低诱变率可以是至多70,000分之一、例如至多100,000分之一、例如至多300,000分之一的突变频率。在六倍体植物中,低诱变率可以是至多40,000分之一、例如至多80,000分之一、例如至多200,000分之一的突变频率。
通过使用温和的诱变条件可以获得低诱变率。例如,将包含具有给定数量基因的给定物种的植物的文库在特定条件(例如特定浓度的诱变剂、持续特定时间)下进行随机诱变,如实施例3-5和12中所示。例如,如本文所述在给定长度的给定区域中鉴定突变体。在该区域中鉴定的突变体数量可用于计算所使用的给定诱变条件(浓度和时间)的突变密度。
突变密度也可以通过对所有诱变植物或其再生部分中的至少所有开放阅读框进行测序并计数所获得的突变体的数量来测定。知道基因组的大小,因此也可计算突变密度。
待使用的文库的大小通常取决于给定植物的基因数量。例如,大麦具有约30000个基因,这意味着由每个个体在编码区只含有1个非同义突变的个体组成的突变库需要含有至少30000个个体才能为每个基因提供突变等位基因。然而,在通过随机诱变制备的文库中,突变在统计学上不会完全均匀分布,并因此需要显著超过30,000个随机诱变的个体以确保文库包含每个基因的一个突变等位基因。如果认为大麦基因平均含有1,000个密码子,则需要至少3000万个个体的文库来鉴定每个基因的每个密码子中的一个突变。可以执行本方法以筛选大型文库,同时显著减少回交时间或完全减轻对回交的需要。
或者,可基于突变频率和如本文所述筛选的突变数量计算最佳文库大小。为了获得最佳文库大小,应对给定数量的再生部分(Np)进行诱变。可以根据最佳文库大小、GECN数量和诱变后植物物种的收获率来计算最佳Np。
为了筛选这样的大型文库,本发明提供了一种汇集诱变育种群体的植物,然后使用高灵敏度检测方法,例如目前用于诊断的依赖于检测稀有DNA、例如循环肿瘤DNA(ctDNA)方法的方法。这样的方法包括例如数字PCR(dPCR)和/或使用复杂的寡核苷酸化学反应,所述化学反应具有超特异性并能够鉴定和扩增DNA分子的复杂混合物中非常稀有的PCR片段。因此,可以将植物池划分为子池(sub-pool)进行筛选。可以根据GECN数量和所用检测手段的检测灵敏度计算最佳子池大小。
本文描述的方法代表了高通量筛选程序的基础,该程序适用于筛选非常大的突变文库,其可以从优良品种或高级育种系中产生,以及用于筛选整个育种群体或种质集合。该方法还可用于鉴定不适合遗传修饰和基因编辑程序的不可转化作物物种中的遗传变体。
因此,本发明提供了一种用于鉴定在预定靶序列中在感兴趣的核苷酸[NOI]中携带一个或多个突变的预定物种的突变植物的方法,所述方法包括以下步骤:
a)提供所述物种的亲本植物的再生部分,其中提供至少5,000个,例如至少10,000个、例如至少15,000个、例如至少20,000个、例如至少25,000个、例如至少30,000个再生部分;
b)使所述再生部分经受诱变步骤,优选随机诱变步骤,从而产生代表多个基因型的M0代再生部分池;
c)使所述M0代再生部分生长成M1代成熟植物,并从所述成熟植物中获得M1代再生部分;
d)任选地,重复前述步骤X次以获得包含M(1+X)代再生部分的M(1+X)代植物;
e)将多个M1代或M(1+X)代植物的再生部分分成子池,每个子池包含代表多个基因型的再生部分,其中来自一个给定成熟植物的所有再生部分都放置在同一个子池中;
f)从每个子池中制备DNA样品,例如gDNA样品或从mRNA样品获得的cDNA样品;
g)使用灵敏检测手段鉴定包含含有(一个或多个)突变的DNA的(一个或多个)子池;
h)鉴定包含所述突变的所述子池内的再生部分,从而鉴定所述突变植物,
其中所述诱变步骤导致M1代的再生部分的诱变率为每个细胞1至30个非同义突变,优选地,其中再生部分是营养组织、种子、谷粒、种子中的种系细胞、所述植物的谷粒或胚、花粉或胚,优选地,再生部分是种子。
附图说明
图1筛选程序示例。(a)诱变的再生部分(此处为种子(M0))在田间生长至成熟,(b)在300株植物的子池中收获的,(c)收集的作为代表每个池的大量样品(bulk sample)的种子。大量样品被分成两部分:一部分(d)用于DNA提取,另一部分作为种子库保存以供进一步分析。使用灵敏的检测手段分析来自大量样品(d)的DNA(e)。鉴定了携带感兴趣的突变的300株植物的原始池(f)并将其用于单种子分析(g)。(h)突变植物可从鉴定的种子萌发。
图2突变大麦谷粒的繁殖。该图举例说明了突变谷粒的繁殖,这里用叠氮化钠诱变了大麦。M0代突变种子产生M1代植物。M1代植物的种子产生M2代植物。M2植物的种子产生M3代植物,其可用于筛选和杂交。
图3将池划分为子池。提供了将池划分为子池的方法的示例。
发明详述
定义
术语“沉默突变”是指在序列例如生物体的基因组序列中发生的突变,其不会导致氨基酸序列的改变。因此,沉默突变可以是基因组非编码区中的任何突变,或者它可以是基因组编码区中不改变翻译产物的氨基酸序列的突变。同义突变是指不改变翻译产物的氨基酸序列的核苷酸取代,因此是一种沉默突变。
如本文所用,术语“非同义突变”是指在序列例如生物体的基因组序列中发生的突变,其确实导致氨基酸序列的改变。因此,非同义突变发生在编码区,并因此可以是基因组编码区中改变了翻译产物的氨基酸序列的任何突变,例如通过编码不同的氨基酸(例如错义突变、连读突变),通过引入提前终止密码子(无义突变)和/或通过引入移码。该术语在本文中将与术语“编码突变”互换使用。
如本文所用,术语“轻度诱变”或“低诱变”是指诱变处理导致(在编码区中,不包括内含子)1至30个非同义突变的突变密度,优选地如在例如M1代的再生部分的细胞中测量的。突变密度可通过对基因组的所有开放阅读框进行测序来测量。被认为是“低诱变”的可能取决于植物的类型。因此,术语“低诱变”在涉及二倍体植物时可以意指所有基因的平均至少99.8%、优选至少99.9%在M1代的再生部分中没有非同义突变,而在涉及更高倍性的植物时,“低诱变”可以意指所有基因的平均至少98.0%、优选至少99.0%在M1代的再生部分中没有非同义突变。
术语“突变频率”-缩写为“Mf”-是指给定长度的核酸内的突变数量,例如在全基因组中获得的突变数量。具体地,突变频率可计算为:
其中
Nnc是核苷酸变化的总数
Nna是分析的核苷酸数。
换句话说,
在本发明的实施方案中,在确切的突变频率未知的情况下,可以使用估计突变频率。因此,突变频率(Mf)可以是实际突变频率或估计突变频率。
如本文所用,术语“诱变率”可以是指突变密度或突变频率”。
术语“等位基因”是指基因的特定形式或状态。如本文所用,术语“突变体等位基因”是指在NOI携带一个或多个预定突变的基因。当突变是整个基因的缺失时,突变体等位基因也可以是缺少所述基因的等位基因。
如本文所用,与数字有关的术语“大约”是指±10%,优选±5%,例如±1%。
如本文所用,术语“阻断探针”是指寡核苷酸,其不能通过DNA聚合酶在3'末端延伸。阻断探针通常是寡核苷酸,其与靶序列相同或互补,包括与阻断剂连接的参考NOI,所述阻断剂抑制DNA聚合酶对阻断探针的延伸。
如本文所用,术语“编码区”或“编码序列(CDS)”是指DNA或RNA的一部分,不包括内含子,其在翻译时产生蛋白。
如本文所用,术语“基因型”是指包含特定组基因的生物体。因此,包含相同基因组的两个生物体具有相同的基因型。与特定基因相关的生物体基因型由所述生物体携带的等位基因决定。在二倍体生物体中,给定基因的基因型可以是AA(纯合的,显性的)或Aa(杂合的)或aa(纯合的,隐性的)。
如本文所用,术语“表型”是生物体的可观察特征或性状的综合。
术语“遗传有效细胞数”-缩写为“GECN”-是指植物中最终形成配子的细胞的数量。这样的细胞在本文中也称为“种系细胞”。它在这里被认为是在后代中产生独立基因型的事件的数量。GECN对于计算突变体群体的预期多样性很重要,因为每个遗传有效细胞都将为文库贡献不同的突变事件。例如,GECN可以如下文实施例12中所述地计算。对于本发明的方法,不需要使用实际GECN。因此,GECN可以是实际GECN或预期GECN。最常见的是,GECN为至少2,因此预期GECN可以例如为2。一些选定植物的GECN在下表1中提供。
表1
术语“用于检测核酸序列的检测手段”是指允许检测特定核酸序列的任何检测手段。因此,所述检测手段可检测感兴趣的核苷酸中的突变并与野生型序列区分开。许多检测手段基于PCR。
术语“发芽率”-缩写为“Gr”-是指给定植物物种在诱变后的平均发芽率。为了确定发芽率,在允许生长的条件下培育一些再生部分,并测定开始生长的再生部分的百分比。举例来说,如果再生部分是种子,则在允许发芽的条件下培育给定数量的种子,并在适当的培育后测定发芽种子的百分比。如果没有其他说明,发芽率以%提供。对于本发明的方法,不需要使用实际发芽率(Gr)。因此,发芽率(Gr)可以是实际发芽率或预期发芽率。
术语“收获率”-缩写为“Hr”-是指每个经过诱变的再生部分收获的植物的平均数量。对于一些植物,收获率约等于发芽率。然而,对于其他植物物种,与实际收获的植物数量相比,播种的再生部分数量要多得多。如果没有其他说明,则收获率以%提供。对于本发明的方法,不需要使用实际收获率(Hr)。因此,收获率(Hr)可以是实际收获率或预期收获率。
术语“种系细胞”是指将其染色体或可遗传遗传物质传递给其后代(progeny)、其子代(offspring)或下一代的细胞。
术语“灵敏检测手段”是指即使在突变生物体的基因型与非突变生物体的基因型相差最多一个核苷酸的情况下,它们也允许在至少300个生物体的文库中检测一个突变生物体的检测手段。优选地,它们允许在300个基因组的文库中检测一个突变基因组。
如本文所用,术语“突变检测探针”是指任选地与可检测手段连接的寡核苷酸,其中寡核苷酸与靶序列相同或互补,包括NOI的预定突变。
如本文所用,术语“PCR”是指聚合酶链式反应。PCR是用于扩增核酸的反应。该方法依赖于热循环,并且包括反复加热和冷却反应以获得所述DNA的连续解链和酶促复制的周期。在第一步中,形成DNA双螺旋的两条链在也称为DNA解链的过程中在高温下物理分离。在第二步中,降低温度以允许DNA的酶促复制。PCR还可以包括在另外的温度下孵育以增强引物的退火和/或优化复制的温度。在PCR中,温度通常在各种温度之间循环多个周期。
如本文所用,术语“PCR试剂”是指除了样品和一组引物之外还添加到PCR中的试剂。PCR试剂包含至少核苷酸和核酸聚合酶。此外,PCR试剂可以包含其他化合物,例如盐和缓冲剂。
术语“dPCR”是指数字聚合酶链式反应。它可用于直接定量和克隆式扩增包括DNA、cDNA或RNA在内的核酸链。dPCR以比PCR更精确的方式测量核酸量。在常规PCR中,每个单个样品进行一个反应。dPCR还依赖于在样品内执行单个反应,然而该样品是分区的,即将该样品分成大量分区,并且在每个分区中单独进行反应。
术语“ddPCR”是指液滴数字聚合酶链反应。在ddPCR中,进行一次或多次PCR扩增,其中每个反应被分离成多个水-油乳液液滴,从而可以在每个个体液滴中发生靶序列的PCR扩增。ddPCR是分区PCR的一个示例。
术语“成功概率”-缩写为“PS”-是指可以从给定的再生部分文库中鉴定的所需突变的可能性,所述再生部分已经经过随机诱变。本领域技术人员可以选择适当的成功概率。通常,优选成功概率为至少85%,优选至少90%,更优选至少95%,例如至少98%。
如本文所用,术语“繁殖”是指有性和无性繁殖。因此,繁殖可以以克隆方式繁殖生物体(也称为“无性繁殖”)。繁殖还可以产生生物体的后代,其中该后代包含来自亲本生物体的等位基因。因此,包含突变体等位基因的生物体的繁殖可以指产生所述生物体的后代,其中该后代包含突变体等位基因。优选地,突变体等位基因携带NOI中的一个或多个突变。
如本文所用,术语“生物体的再生部分”是指生物体的任何部分,其在恰当的条件下可以生长成完整的生物体。例如,如果生物体是植物,则该术语是指植物的可以再生成整株植物的任何部分。因此,植物的再生部分可以是所述植物的任何“繁殖材料”。植物的再生部分可以例如是种子、谷粒、种子中的种系细胞、所述植物的谷粒或胚、所述植物的营养组织、花粉或胚。该术语在本文中将与术语“繁殖部分”互换使用。术语“种系细胞”是指将其染色体或可遗传遗传物质传递给其后代、其后代或下一代的细胞。
如本文所用,术语“位于靶序列侧翼的引物组”是指位于靶序列侧翼的一组两个引物,因此,一个引物包含与靶序列的5'末端相同的序列(也称为“正向引物”),一个引物包含与靶序列的3'末端互补的序列(也称为“反向引物”)。当在允许扩增所述靶序列的条件下,与包含靶序列和PCR试剂的核酸一起加入PCR时,“引物组”能够扩增靶序列。
如本文所用,术语“靶序列”是指在其中需要产生或鉴定突变的任何核酸序列。此外,靶序列优选是核酸序列,其可以使用位于靶序列侧翼的引物通过PCR技术扩增。另外,靶序列通常包含一个或多个NOI。本发明提供了产生和/或鉴定在所述NOI中携带突变的生物体的方法。例如,靶序列可以是与特定性状相关的核酸序列。
如本文所用,术语“参考检测探针”是指任选与可检测手段连接的寡核苷酸,其中寡核苷酸与靶序列相同或互补,包括参考NOI。通常,包括参考NOI的靶序列对应于诱变前的靶序列。“参考检测探针”也可以称为“野生型探针”。
关于制造基于大麦的饮料例如啤酒的方法的术语“大麦”,特别是当用于描述麦芽制造过程时,意指大麦籽粒。在所有其他情况下,除非另有说明,“大麦”意指大麦植物(Hordeum vulgare,L.),包括任何育种系或培育品种或品种,而大麦植物的部分可以是大麦植物的任何部分,例如外部植物结构,例如叶子、茎、根、花和谷粒,称为植物器官。它还可以包括任何组织或细胞。
如本文所定义,“谷类”植物是禾本科(Poaceae)植物家族的成员,主要为了它们的含淀粉种子或籽粒而栽培。谷类植物包括但不限于大麦(Hordeum)、小麦(Triticum)、水稻(Oryza)、玉米(Zea)、黑麦(Secale)、燕麦(Avena)、高粱(Sorghum)和黑麦-小麦杂交的黑小麦(Triticale)。
本文中的术语“谷粒品质”是指从植物例如突变植物获得的谷粒的特性。因此,该术语可以是指谷粒的水分含量;谷粒重量;变色、破碎或损坏谷粒的百分比;谷粒的易碎性;碾磨品质;蛋白含量;油含量和/或谷粒的生存力。其他内在因素包括颜色、组成、体积密度、气味和香气、大小和形状。
本文中的术语“不育%”是指在给定基因型的植物群体中不产生种子的花的百分比。
鉴定突变植物的方法
本文提供了一种用于鉴定在预定靶序列中在感兴趣的核苷酸[NOI]中携带一个或多个突变的预定物种的突变植物的方法,所述方法包括以下步骤:
a)提供所述物种的亲本植物的Np再生部分,其中Np是至少5000的整数;
b)使所述再生部分经受诱变步骤,优选随机诱变步骤,从而产生代表多个基因型的M0代再生部分池;
c)使所述M0代再生部分生长成成熟植物,从而从所述成熟植物中获得M1代再生部分;
d)任选地重复前一步骤X次以获得包含M(1+X)代再生部分的M(1+X)代植物;
e)将多个M1代或M(1+X)代植物的再生部分划分为子池,每个子池包含代表多个基因型的再生部分,其中将来自一个给定成熟植物的所有再生部分放置在同一子池中;
f)从每个子池制备DNA样品,例如从mRNA样品制备的cDNA样品或gDNA样品;
g)使用灵敏检测手段鉴定包含含有突变的DNA的子池;
h)鉴定包含所述突变的所述子池内的再生部分和/或再生部分的后代,从而鉴定所述突变植物,
其中所述诱变步骤导致M1代再生部分的诱变率为每个细胞1至30个非同义突变。
应当理解,本方法在优选实施方案中可以用种子进行。然而,在一些实施方案中,本方法可以用亲本植物的种子以外的其他再生部分进行,例如可以使用亲本植物的胚胎。在本发明的实施方案中,其中植物是谷类,种子是所述谷类的谷粒。
感兴趣的突变植物可以如例如下文实施例3-5中所述,使用合适的PCR试剂进行鉴定。PCR试剂通常包含至少核苷酸和核酸聚合酶。此外,PCR试剂还可以优选地包含一种或多种检测探针,例如如本文上文“检测PCR产物”部分所述的突变检测探针和/或参考检测探针。
或者,可以通过对诱变植物或其再生部分的整个基因组进行测序来鉴定感兴趣的突变体,如本领域中已知的。因此,突变密度也可通过对一些或所有诱变植物或其再生部分的至少所有开放阅读框进行测序并计数获得的突变体的数量来测定。已知基因组的大小,因此也可计算突变密度。
除了上述步骤之外,本发明的方法可以包括一个或多个另外的步骤。例如,该方法可以包括例如通过诱变制备所述再生部分(例如种子)池的步骤。制备生物体池的方法在下文“池”部分中描述。
该方法还可以包括在池内或在植物或再生部分的子池内繁殖一种或多种所述植物或再生部分的步骤。该步骤可以包括通过一个或多个循环栽培所述植物或再生部分。
在下文中,通常仅提及“种子”、“作物”或“植物”。然而,同样的考虑也适用于使用作物或植物的其他再生部分的方法。栽培的每个步骤都可能产生与原始植物、种子或其他再生部分不同的后代。例如,在多倍体植物的随机诱变后,大多数植物将仅在一个等位基因上携带任何随机突变,因此就该突变而言是遗传杂合的。对于自花授粉植物,一般而言,后代生物体包括:(1)没有突变的生物体,(2)对突变遗传杂合的后代生物体和(3)对突变遗传纯合的后代生物体。因此,原始池或植物或再生部分(例如种子)的后代池不一定与原始池相同,但通常至少代表原始池中存在的NOI中的任何突变-作为杂合子和/或纯合子生物体。因此,至少一些所述后代将包含突变等位基因。类似地,子池的后代可能与原始子池不同,但通常至少代表原始子池中存在的NOI中的任何突变,以杂合子或纯合子的形式。
因此,将再生部分池划分为一个或多个子池的步骤e)可以包括繁殖植物或其再生部分的步骤。例如,这可以与将池划分为子池同时进行。或者,这可以在将池划分为子池之后完成。因此,本发明的方法可以在步骤e)之后包括在所述子池内繁殖植物或其再生部分的步骤。
类似地,本发明的方法可以在步骤f)之后包括在所述子池部分内繁殖植物或其再生部分例如种子的步骤。然而,在本发明的一些实施方案中,特别是在本发明的植物是谷类的实施方案中,优选的是所述方法在步骤f)和g)之间不包括繁殖植物或其再生部分的步骤。
在本发明的一些实施方案中,所述方法包括繁殖在包含NOI中的突变的子池或其部分中含有的植物或其再生部分例如种子的步骤。所述步骤可以在任何有用的时间进行,例如在如上所述的步骤h)和i)之间。
该方法还可以包括鉴定包含NOI中的突变的一组子池的步骤。所述步骤可以在任何有用的时间进行,但是经常在上述方法的步骤c)之后进行,并且可以例如如下文“超级池”部分中所述进行。
感兴趣的核苷酸(NOI)
本发明涉及用于鉴定一种或多种携带一个或多个感兴趣核苷酸中的突变的植物的方法。特别地,该方法允许鉴定携带NOI中的一个或多个预定突变的植物。NOI可以在编码区域内或在编码区域外。因此,该方法允许鉴定携带特定突变的植物,同时仍依赖于常规育种方法。突变优选在预定的靶序列中。
突变可以是任何突变,其中所述一个或多个感兴趣的NOI与参考序列中的相应NOI不同。通常,参考序列是野生型序列。然而,参考序列也可以是任何其他序列。因此,与野生型序列相比,参考序列可能已经包含一些突变,其中所述突变可能已经自然发生或已经例如通过诱变诱导。
突变可以是任何种类的突变,例如缺失、插入、替换或前述的混合。突变可以是同义突变或非同义突变。例如,突变可以是(1)引入提前终止密码子的突变,(2)引入移码的突变或(3)导致翻译蛋白中氨基酸取代的突变。
NOI可以是单个核苷酸或几个核苷酸,因此NOI可以由至少一个,例如1个,例如2个,例如3个,例如4个,例如5个,例如6个,例如7个,例如8个,例如9个,例如10个,例如10至20个,例如20至50个,例如超过50个核苷酸组成。
在本发明的优选实施方案中,NOI由单个核苷酸组成-在这种情况下,突变例如可以是单个核苷酸的取代。这种突变也称为点突变。
在本发明的其他实施方案中,突变可以是所述NOI的缺失。在其他实施方案中,突变可以是在感兴趣的两个核苷酸之间插入一个或多个核苷酸。
在一个实施方案中,参考序列是野生型序列,即最常见的天然存在的序列,因此突变是与所述野生型序列相比的突变。在其他实施方案中,参考序列已经包含突变,并且与所述参考序列相比该突变是另外的突变。
在一个实施方案中,突变可以与所述物种内的期望性状相关。根据物种的类型,可以从多种不同性状中选择所需的性状。在本发明的实施方案中,其中所述物种是驯化植物,所述性状可以例如是增强的生存力、增强的对各种环境因素的抗性、增强的生长、提高的谷粒质量或更高的产量。在本发明的实施方案中,其中所述物种是用于食品、饲料或饮料生产的植物,所述性状还可以涉及增强的营养价值,增强的风味特性,增强的储存特性或增强的用于生产所述食物、饲料或饮料的有用性。
NOI可以位于任何核酸中的任何靶序列中。通常,靶序列是基因组DNA(gDNA)序列的一部分。更优选地,靶序列是gDNA序列的一部分。因此,突变可以是所述生物体的gDNA的突变。NOI可以位于gDNA的任何部分,既可以位于编码区也可以位于非编码区中。通常,NOI可以位于基因的任何部分,例如在编码区内(例如在外显子内),在内含子中或在基因的调节区中,例如,在启动子、终止子和/或内含子中。优选地,突变是编码突变或非同义突变。
代替基因组DNA,从mRNA样品制备的cDNA也可以用于鉴定所需的突变。
植物
在本发明的优选实施方案中,植物可以是绿色植物,例如选自由开花植物、针叶树、裸子植物、蕨类植物、石松、金鱼藻、苔类、苔藓和绿藻构成的组的植物。植物可以例如是单子叶植物或双子叶植物。
特别地,植物可以是驯化植物。所述驯化植物可以是人类培养的任何植物,例如作为食品、饲料的来源,或用于生产商品或用于美学目的的原材料。
在本发明的一个优选实施方案中,该物种是谷类。如本文所定义的“谷类”是禾本科(Graminae)植物家族的成员,主要为其含淀粉的种子或谷粒而栽培。谷类植物包括但不限于大麦(Hordeum)、小麦(Triticum)、水稻(Oryza)、玉米(Zea)、黑麦(Secale)、燕麦(Avena)、高粱(Sorghum)和黑麦-小麦杂交的黑小麦(Triticale)。
植物也可以是其他驯化植物,包括番茄。
亲本植物可以是作物植物或开花植物,例如属于十字花科(Brassicaceae)、豆科(Fabaceae)、禾本科(Poaceae)、苋科(Amaranthaceae)、菊科(Asteraceae)、茄科(Solanaceae)、茜草科(Rubiaceae)或兰科(Orchidaceae)的植物。在具体实施方案中,植物是大麦。本方法对于不易经受例如通过转化的基因编辑的植物可能特别有利。
亲本植物也可以是树或灌木。此处的术语“树”以其最广泛的意义使用,指的是多年生植物,具有细长的茎或树干,其在大多数物种中支撑着枝叶。因此,该术语包括植物,例如香蕉树或椰子树。灌木是中小型多年生木本植物。本方法对于鉴定树或灌木的突变体是有利的。树和灌木生长缓慢,因此对于绕过回交的需要而鉴定感兴趣的突变体是特别有利的,因为这导致大大缩短鉴定这些突变体所需的时间。一般而言,本方法对于具有长繁殖周期的任何植物都是特别有利的。
本发明的方法包括提供给定植物的Np再生部分并诱变所述植物的所述再生部分以获得代表多种基因型的再生部分池。所述植物可以例如是本文上文“植物”部分中描述的任何植物。因此,池或再生部分是指从本方法的步骤a)中提供的再生部分获得的诱变再生部分。因此,再生部分池由与步骤a)中提供的再生部分数量相同数量的再生部分组成。例如,如果在步骤a)中提供了30,000个再生部分,则(诱变)再生部分池计数为30,000个诱变再生部分。
因此,再生部分池包括多个再生部分,它们全都属于同一物种,但代表所述植物的不同基因型。该池可以包含每种基因型的一个以上再生部分。然而,该池必须包含不同基因型的多个再生部分。
如下文实施例6和7中所述,为了获得一定的成功概率,可以优选使用某一最佳文库大小(OLS)。在这种情况下,最佳意指获得所需成功概率的最佳文库大小。文库大小是在M1代或M(1+x)代的再生部分中表示的不同基因型的总数。OLS取决于突变频率和筛选的突变数量。在优选的实施方案中,OLS如下文实施例6中所述进行测定。
基于OLS,可以测定待诱变的再生部分的最佳数量(Np)。最佳Np取决于特定植物的种系细胞数量以及诱变后的收获率。
特别地,最佳Np(ONp)可以如下文实施例7中所述进行测定。
在优选的实施方案中,Np在0.7*ONp至1.3*ONp的范围内,其中
其中Hr是诱变后所述植物物种的预期平均收获率,以%计;且
OLS是最佳文库大小,其中
其中PS是成功概率,以%表示;且
Mf为突变频率;且
n是筛选的突变数量;并且
其中步骤b)包括导致诱变频率为Mf的随机诱变的步骤。
对于一些植物物种,例如对于谷类,收获率与发芽率大致相同,并且对于这样的植物物种,可以使用发芽率Gr代替收获率来计算ONp。
优选地,所述突变频率对应于低诱变率。可以根据突变频率、基因数量和特定植物中基因的平均长度使用以下公式计算以不含非同义突变的基因%表示的诱变率:
其中GFoNSM是不含非同义突变的基因数量,以%表示;且
Gn是具体植物中的基因数量,Gl是基因的平均长度,以bp表示(Tiessen等人2012),Mf是突变频率,Nsnm是诱变引起的非同义突变的平均数量,以%表示。
通常,Nsnm在60%至70%的范围内,例如为66%。如果不知确切的Nsnm,则可以使用66%的Nsnm。
在现有技术中,诱变率经常以突变频率来描述。例如,有时描述了在M2代拟南芥植物中突变频率为500,000分之一。这相当于在M1代拟南芥植物中大约57个基因具有编码突变,或在M1代拟南芥植物中所有基因中的99.79%不含非同义突变。此外,有时描述了在M2代拟南芥植物中突变频率为10,000分之一。这相当于在M1代拟南芥植物中约2862个基因具有编码突变,或在M1代拟南芥植物中所有基因中的89.65%不含非同义突变。
在一个实施方案中,Np在0.9*ONp至1.1*ONp的范围内,优选地,Np在0.9*ONp至1.1*ONp的范围内。
有时,计算ONp所需的一个或多个参数的实际值是未知的。在这类情况下,可以使用预期值而不是实际值。因此,如果诱变后的收获率是未知的,则可以使用预期收获率。预期收获率可以基于技术人员来自类似诱变过程的知识。类似地,如果确切的突变频率是未知的,则可以使用预期突变频率。预期突变频率可以基于技术人员来自类似诱变过程的知识。
执行本发明方法的人可以选择合适的成功概率。通常,成功概率为至少85%,优选至少90%,更优选至少95%,例如至少98%。
在一些实施方案中,池(即Np)包括具有不同的基因型的至少5,000个再生部分,例如至少10,000个再生部分,例如至少15,000个再生部分,例如至少20,000个再生部分,例如至少25,000个再生部分,例如至少30,000个再生部分,例如至少40,000个再生部分,例如至少50,000个再生部分,例如至少60,000个再生部分,例如至少70,000个再生部分,例如至少80,000个再生部分,例如至少90,000个再生部分,例如至少100,000个再生部分,例如至少200,000个再生部分,例如至少300,000个再生部分,例如至少400,000个再生部分,例如至少500,000个再生部分,例如至少600,000个再生部分,例如至少700,000个再生部分,例如至少800,000个再生部分,例如至少900,000个再生部分,例如至少106个再生部分,例如至少2×106个再生部分,例如至少3×106个再生部分,例如至少4×106个再生部分,例如至少5×106个再生部分,例如至少6×106个再生部分,例如至少7×106个再生部分,例如至少8×106个再生部分,例如至少9×106个再生部分,例如至少107个再生部位或植物的再生部分或更多。在一些实施方案中,该池包括5,000至100,000个再生部分,例如10,000至90,000个再生部分,例如15,000至85,000个再生部分,例如20,000至80,000个再生部分,例如25,000至90,000个再生部分,例如30,000至100,000个再生部分,例如30,000至75,000个再生部分,例如50,000至75,000个再生部分,例如50,000至1,000,000个再生部分,例如100,000至500,000个再生部分,或500,000至1,000,000个再生部分,或600,000至900,000个再生部分,或900,000至1,500,000个再生部分。在一些实施方案中,再生部分是种子。
优选的是,生物体池包含足够数量的具有不同基因型的植物再生部分,使得该池理论上可以包含所述植物的所有基因中的所有可能突变。例如,在本发明的实施方案中,其中物种是大麦,据信包含~1,500,000个随机诱变的大麦谷粒的池理论上将包含所述大麦的所有基因中的所有可能的突变,突变密度为1500kbp的基因组DNA中有1个突变。为了提高本发明方法的效率,该池可以包含多达至少2×、例如至少3×的植物再生部分,具有理论上预期包含所有可能突变的不同基因型。因此,该池可以包含具有不同的基因型的至少5,000个再生部分,例如至少10,000个再生部分,例如至少15,000个再生部分,例如至少20,000个再生部分,例如至少25,000个再生部分,例如至少30,000个再生部分,例如至少40,000个再生部分,例如至少50,000个再生部分,例如至少60,000个再生部分,例如至少70,000个再生部分,例如至少80,000个再生部分,例如至少90,000个再生部分,例如至少100,000个再生部分,例如至少200,000个再生部分,例如至少300,000个再生部分,例如至少400,000个再生部分,例如至少500,000个再生部分,例如至少600,000个再生部分,例如至少700,000个再生部分,例如至少800,000个再生部分,例如至少900,000个再生部分,例如至少106个再生部分,例如至少2×106个再生部分,例如至少3×106个再生部分,例如至少4×106个再生部分,例如至少5×106个再生部分,例如至少6×106个再生部分,例如至少7×106个再生部分,例如至少8×106个再生部分,例如至少9×106个再生部分,例如至少107个再生部分或更多。在一些实施方案中,该池包含5,000至100,000个再生部分,例如10,000至90,000个再生部分,例如15,000至85,000个再生部分,例如20,000至80,000个再生部分,例如25,000至90,000个再生部分,例如30,000至100,000个再生部分,例如30,000至75,000个再生部分,例如50,000至75,000个再生部分,例如50,000至1,000,000个再生部分,例如100,000至500,000个再生部分,或500,000至1,000,000个再生部分,或600,000至900,000个再生部分,或900,000至1,500,000个再生部分。在一些实施方案中,再生部分是种子。这可以例如是在其中所讨论的物种是大麦的实施方案中的情况。
在一些实施方案中,再生部分池可以包含至少5,000,000个、例如在1,000,000至100,000,000个范围内的具有不同基因型的植物再生部分。在一些实施方案中,再生部分池代表至少5,000种不同的基因型,例如至少10,000种不同的基因型,例如至少15,000种不同的基因型,例如至少20,000种不同的基因型,例如至少25,000种不同的基因型,例如至少30,000种不同的基因型,例如至少40,000种不同的基因型,例如至少50,000种不同的基因型,例如至少60,000种不同的基因型,例如至少70,000种不同的基因型,例如至少80,000种不同的基因型,例如至少90,000种不同的基因型,例如至少100,000种不同的基因型,例如至少200,000种不同的基因型,例如至少300,000种不同的基因型,例如至少400,000种不同的基因型,例如至少500,000种不同的基因型,例如至少600,000种不同的基因型,例如至少700,000种不同的基因型,例如至少800,000种不同的基因型,例如至少900,000种不同的基因型,例如至少106种不同的基因型,例如至少2×106种不同的基因型,例如至少3×106种不同的基因型,例如至少4×106种不同的基因型,例如至少5×106种不同的基因型,例如至少6×106种不同的基因型,例如至少7×106种不同的基因型,例如至少8×106种不同的基因型,例如至少9×106种不同的基因型,例如至少107种不同的基因型或更多。在一些实施方案中,该池代表5,000至100,000种不同的基因型,例如10,000至90,000种不同的基因型,例如15,000至85,000种不同的基因型,例如20,000至80,000种不同的基因型,例如25,000至90,000种不同的基因型,例如30,000至100,000种,例如30,000至75,000种不同的基因型,例如50,000至75,000种不同的基因型,例如50,000至1,000,000种不同的基因型,例如100,000至500,000种不同的基因型,或500,000至1,000,000种不同的基因型,或600,000至900,000种不同的基因型,或900,000至1,500,000种不同的基因型。
本发明方法的一个优点是该方法允许筛选大量的具有不同基因型的植物(例如种子)的再生部分。因此,该池可以包含非常大量的不同基因型的再生部分。此外,本发明的方法可以允许鉴定具有在任何NOI中的预定突变的植物。为了能够鉴定具有在任何NOI中的突变的植物,这可能需要该池包含大量不同的基因型,例如上述数量的不同基因型。
在本发明的一个优选实施方案中,植物(例如种子)的再生部分池是通过诱变,特别是通过随机诱变制备的。因此,可以对多个再生部分进行诱变以获得再生部分池。所述诱变可以特别是随机诱变,其例如可以如下所述进行。
使所述多细胞生物体的再生部分经受所述随机诱变可能就足够了。在这样的实施方案中,植物的多个再生部分-例如植物的多个种子,或其混合物-经受随机诱变。
该池可以包含代表多种基因型的多个再生部分。因此,该池可以包含多个已经受诱变的再生部分。然而,该池还可以包含已经受诱变的再生部分的后代。
在本文中,已经受诱变的再生部分(例如种子,例如谷类谷粒)可以被称为M0代。所述再生部分,例如种子,例如谷类谷粒,可以被播种并允许发育成成熟植物,其再生部分(例如种子,例如谷类谷粒)被认为是M1代。可以播种M1代再生部分,例如种子,并使其生长成成熟植物,其再生部分(例如种子)被认为是M2代,以此类推。尚未经受诱变的用于建立文库的植物品种也可以称为“亲本植物”。这如图2所示。
再生部分池可以包括任何上述代的再生部分,例如种子,例如谷类谷粒。再生部分池还可以包括M1、M2或M3代的再生部分,例如种子,例如谷类谷粒。优选的是,再生部分池包括M1代的再生部分,优选地,所述再生部分池中的所有再生部分都属于M1代。
随机诱变
传统上,有效的诱变方案被认为是成功育种计划的关键、基本要求。
然而,本发明提供的方法包括使用“温和”诱变,其导致在每株植物的编码区中产生1至30个范围内的非同义突变。
随机诱变目前基于使用化学诱变剂或辐射。从历史上看,诱变剂的有效性是根据生物学效应来测量的。然而,期望在观察到的生物学效应与明确定义且易于测量的物理量之间建立关系,所述物理量表征赋予该效应的辐射或化学诱变剂的量。
随机诱变可以以任何有用的方式进行,例如,通过辐射或化学处理。辐射可以是紫外线照射、X射线照射或放射性照射。化学诱变可以包括用任何诱变化学品处理,例如选自由以下构成的组的化合物:叠氮化钠(NaN3),烷化剂如N-乙基-N-亚硝基脲(ENU),甲基亚硝基胍(MNNG)和乙基甲磺酸盐(EMS)或下面提到的烷化剂。NaN3、ENU和EMS通常用于随机产生突变体。
为了在植物的DNA、特别是基因组DNA中诱导随机突变,可以用突变剂或突变剂混合物处理籽粒或可再生的植物组织-包括但不限于,烷化剂,例如磺酸盐(例如乙基甲磺酸盐(EMS)、硫酸二乙酯(DES));硫磺芥子,例如乙基-2-氯乙基硫醚;氮芥,例如2-氯乙基-二甲胺,和;环氧化物,例如环氧乙烷。其他包括乙烯亚胺、羟胺(NH2OH)、N-甲基-N'-硝基-N-亚硝基胍(MNNG)、NaN3和重氮甲烷。然后经处理的组织或籽粒可以繁殖以产生子代生物体。这种随机诱变可以用于植物,例如作物植物,或“植物”部分中描述的任何植物。
本发明的方法不限于任何特定类型的诱变,只要它是“温和”或“低”诱变。所述低诱变可以是导致诱变率为每株植物的编码区中具有1至30个非同义突变的诱变。在一些实施方案中,这对应于以对应于每1.5个基因组DNA碱基1个突变的频率发生的感兴趣的突变。在一些实施方案中,二倍体植物中的低诱变可以是在M1中所有基因中的超过99.8%、优选超过99.9%不含非同义突变,并且具有高于二的倍性的植物中的低诱变可以是在M1中所有基因中的超过98.0%、优选超过99.0%不含非同义突变。
许多类型的诱变的突变率是已知的,并且技术人员将能够容易地计算每种类型的诱变的最佳诱变剂剂量、浓度和/或暴露时间以获得所需的突变密度或突变频率。或者,技术人员可以测试诱变以鉴定最佳诱变剂剂量、浓度和/或暴露时间以获得植物物种所需的低诱变率。本方法基于以本文所述的任何方式进行诱变以获得低诱变率。所述低诱变率可以特别是导致每株植物在编码区中具有1至30个非同义突变的诱变率。或者,低诱变率可以是在M1的二倍体植物中所有基因中超过99.8%,例如99.9%不含非同义突变,低诱变率可以是在M1的具有高于二的倍性的植物中所有基因中的至少98.0%,优选至少99.0%不含非同义突变。
例如,使包含具有给定数量基因的给定物种的植物的文库在特定条件(例如特定浓度的诱变剂、持续特定持续时间)下进行随机诱变,如实施例3-5中所示。如本文所述,例如在给定长度的给定区域中鉴定突变体。在该区域中鉴定的突变体数量可用于计算所使用的给定诱变条件(浓度和时间)的突变密度。例如,如果对10,000个个体分析1,000bp的片段,并且在分析的碱基对中总共鉴定出10个突变体,则在这些条件下的突变率为10/(1,000x 10,000)=1×10-6个突变/bp。换言之,这些条件下的突变密度可以看作等于鉴定出的突变体数量除以所筛选的元素(再生部分)数量与所筛选的区域长度的乘积,如下所示:
突变密度=(鉴定出的突变体数量)/((诱变个体的数量)x(分析区域的长度))。
在一些实施方案中,诱变导致每株植物在编码区中具有1个非同义突变。在其他实施方案中,诱变导致每株植物在编码区中具有2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个非同义突变。除了编码区中的非同义突变之外,植物还可以包括沉默突变,例如在非编码区中。
在优选的实施方案中,诱变步骤使得诱变率为每1000个基因最多1个非同义突变,例如每5000个基因最多1个非同义突变,例如每10000个基因最多1个非同义突变,例如每20000个基因最多1个非同义突变,例如每30000个基因最多1个非同义突变,例如每5000个基因最多1个非同义突变。每1000个基因1个非同义突变意指,如果植物有6000个基因,预计6个基因将携带非同义突变,而5994个基因预期缺乏在编码区中的非同义突变,但仍可能包含在编码区之外的其他突变,例如同义突变。在其他优选实施方案中,诱变步骤使得诱变率是在M1二倍体植物中所有基因中的至少99.8%,优选至少99.9%不含非同义突变,并且低诱变率可以是在M1的具有高于二的倍性的植物中所有基因中的至少98.0%,优选至少99.0%不含非同义突变。
在一些实施方案中,诱变步骤转化为在M1或M(1+X)代植物中编码区中最多30个非同义突变,例如编码区中最多25个非同义突变,例如编码区中最多20个非同义突变,例如编码区中最多15个非同义突变,例如编码区中最多10个非同义突变,例如编码区中最多5个非同义突变,例如编码区中最多4个非同义突变,例如编码区中最多3个非同义突变,例如编码区中最多2个非同义突变,例如编码区中1个非沉默突变。
涉及诱变的方法通常在使明显部分(高达50%)的诱变生物体不能存活并死亡的条件下进行。相比之下,由于本方法可以在大量植物或其再生部分上进行,因此在使大多数植物存活的条件下进行随机诱变是有利的。优选地,诱变在这样的条件下进行,使得90%的再生部分在诱变步骤中存活,例如至少91%的再生部分,例如至少92%的再生部分,例如至少93%的再生部分,例如至少94%的再生部分,例如至少95%的再生部分,例如至少96%的再生部分,例如至少97%的再生部分,例如至少98%的再生部分,或例如至少99%的再生部分在诱变步骤中存活。
对于大多数作物,甲磺酸乙酯(EMS)通常是首选的诱变剂。然而,大麦的诱变通常使用基于叠氮化钠(NaN3)的诱变处理来进行。
叠氮化钠(1.5mM,2小时)处理大麦通常导致每500,000bp 1个突变的突变密度(Szurman-Zubrzycka等人,2018)。这个数字通常是通过分析来自群体内各种基因的测序数据而确定的。在1:500,000bp的突变密度和5.3GB的大麦基因组中,每株大麦植物将携带约10,000个突变。大麦的编码序列是约65Mb,占总基因组的1-2%。基于此,可假设10,000个诱导突变中有约100-200个位于编码区中。
在编码区中约三分之一的叠氮化钠突变导致沉默的核苷酸取代。因此,如果使用叠氮化钠进行诱变,则Nsnm通常为66%。因此,可假设10,000个诱导突变中的50-100个突变将导致编码区中的非同义突变。由于突变在整个基因组中随机发生,因此,可假设编码区中的50-100个氨基酸取代位于整个基因组的不同编码区或基因中。突变密度取决于作物和处理。在其他作物中,典型TILLING文库中的突变密度范围可以为总基因组DNA的每20,000bp有1个到每100万bp有1个。
在一些实施方案中,诱变剂是NaN3。在这样的实施方案中,NaN3优选以小于1mM或更小的浓度使用2小时或更短时间,例如0.9mM或更小,例如0.8mM或更小,例如0.7mM或更小,例如0.6mM或更小,例如0.5mM或更小,例如0.4mM或更小,例如0.3mM或更小。在一个实施方案中,NaN3优选以约0.3mM的浓度使用1.5至2.5小时。
随机诱变步骤也可以用EMS进行,优选以4%或更小的浓度持续2小时或更短时间,例如3%或更小,例如2%或更小,例如1.5%或更小,例如1%或更小,例如0.75%或更小,例如0.5%或更小,例如0.4%或更小,例如0.3%或更小,例如0.2%或更小,例如0.1%或更少,例如0.1%持续24小时或更短时间。
随机诱变也可以通过本领域已知的其他方法进行,例如随机CRISPR诱变,其中特定的CRISPR阵列可用于随机诱变植物群体(Lu等人,2017)。例如,可合成CRISPR指导RNA阵列并随机转化到植物中,从而生成一个植物文库,每个植物都在基因组中携带CRISPR诱导的突变。
将再生部分池划分为子池
本发明的方法包括将M1或M(1+X)代植物的再生部分(例如种子)池划分为一个或多个子池的步骤,其中每个子池包含植物的多个再生部分,例如种子。每个子池包含代表多种基因型的植物再生部分-重要的是,每个子池包含来自一种给定成熟植物的所有再生部分。
在一些实施方案中,当再生部分属于M(1+X)代时,可以优选将给定M0代植物的所有后代的所有再生部分都置于同一子池中。
在实践中,以再生部分是在田间生长的植物的种子为例,一旦获得了(M0代)诱变种子池,则在田间播种整个池。整个田地代表另一个M1代种子池,包括由M0代种子池得到的植物的所有种子。M1代种子的总池在本文中称为“文库”。根据GECN数量和收获率,文库的大小与Np不同。将M1代种子的文库划分为子池,例如如下:将田地划分为不同的区域,来自一个区域的种子代表一个子池。然后这些种子在M1代的这个示例中。然后将种子子池分成几个部分,如本文其他地方详细描述的。
如果使用M2代或更后代的种子,在一些实施方案中,获得更后代种子的植物可以优选地以可能将同一M0植物的后代植物的所有种子放入同一子池中的方式生长。
技术人员将能够将上述示例转用到在不同条件下生长的植物,例如在温室中、在单独的盆中等。
如下文在实施例8中所述,可以基于所采用的(灵敏)检测手段的检测灵敏度和GECN数量来确定子池的最佳大小。因此,在优选的实施方案中,如以下实施例8中所述确定最佳子池大小。
因此,最大子池大小(SPm)可以如下计算:
其中检测灵敏度为Y分之1。
在一个实施方案中,每个子池包含来自一定数量的成熟植物的再生部分,所述数量在0.5*SPm至SPm的范围内,其中来自一株给定成熟植物的所有再生部分都被放置在同一个子池中。
在一个实施方案中,每个子池包含来自0.7*SPm至SPm范围内的成熟植物的再生部分。
通常,将池划分为多个子池,优选划分为至少2个子池,例如至少50个子池,例如至少100个子池,优选至少200个子池,更优选至少300个子池,甚至更优选至少400个子池,还更优选至少500个子池,甚至更优选至少1000个子池,还更优选至少1500个子池。
在一些实施方案中,池被划分为至少500个、例如至少1000个、例如至少1500个子池。在其中池包含大量不同基因型的生物体的本发明实施方案中,可能尤其是这种情况。
子池的数量原则上没有上限。然而,通常,池被划分为最多50,000个,例如最多25,000个,例如最多10,000个子池。
在一些实施方案中,池被划分为90至1000个子池。
每个子池优选地包括植物的代表多种基因型的多个再生部分。优选地,每个子池包括至少10个、更优选至少100个、甚至更优选至少200个、甚至更优选至少300个、甚至更优选至少400个、甚至更优选至少500个、还更优选至少1,000个、甚至更优选至少5,000个具有不同基因型的植物再生部分。在一些实施方案中,每个子池包括500至5,000个、例如600至2000个具有不同基因型的再生部分。
在一些实施方案中,每个子池包括1,000至2,000个代表不同基因型的再生部分。
还优选的是,每个子池包含每个基因型的一个以上再生部分。这可以通过确保将任何给定成熟植物的所有再生部分置于同一个子池中来实现。特别地,优选的是,每个子池包含每种基因型的足够量的再生部分,以便将子池随机划分为2、3或4个部分,使得每个部分在理论上包括代表子池的每种基因型的再生部分。因此,优选的是,每个子池包括至少5个、优选至少10个、甚至更优选至少15个代表每种基因型的再生部分。在其中物种是谷类的本发明实施方案中,可能尤其是这种情况。
在图3中提供了将池划分为子池的方法的图示。
通常,可以以使一株特定植物的所有再生部分包含在一个子池中的方式制备子池。因此,在本发明的一个实施方案中,该方法包括以下步骤:
-提供植物的多个再生部分,例如种子,例如谷类谷粒;
-对所述种子进行诱变,从而得到M0代再生部分,例如种子;
-使所述M0代再生部分例如种子生长成成熟植物,并从所述成熟植物获得再生部分,例如种子,其中所述再生部分例如种子为M1代种子;
-任选地,重复前一步骤X次以获得包含M(1+X)代再生部分例如种子的植物;
-从所述成熟植物获得M1或M(1+X)代再生部分例如种子,从而获得再生部分例如种子池(例如谷类谷粒池);
-将所述池划分为子池,其中来自给定成熟植物的所有再生部分例如种子(例如谷类谷粒)被放置在同一个子池中。
图2以大麦为例示出了这些步骤。该方法可以包括图2所示的步骤。技术人员将理解类似的原理可应用于其他植物。因此,图2所示的步骤可以使用任何开花植物进行,因此并不限于大麦。可以使用其他诱变方案,这些方案不限于用叠氮化钠进行突变。此外,图2所示的步骤可以使用任何数量的突变植物进行。
因此,该方法包括以下步骤:
-提供植物的多个再生部分,例如种子,例如谷类谷粒;
-对所述再生部分进行诱变,从而得到M0代再生部分;
-任选地,将所述M0代再生部分培育成成熟植物,并从所述成熟植物中获得再生部分,其中所述再生部分为M1代再生部分;
-任选地,重复前一步骤X次以获得包含M(1+X)代再生部分的植物;
-将M0、M1或M(1+X)代再生部分例如种子在离散的田间地块中培育成成熟植物,其中所述成熟植物的再生部分构成再生部分池;
-将所述区域划分为子田间地块;
-收获一个子田间地块内所有植物的所有再生部分,例如种子,从而获得再生部分的子池(例如种子例如谷类谷粒的子池),其可以被称为“谷粒总池”。
代替在田间地块培育再生部分例如种子,可以以任何可用的允许将植物分成亚组的方式培育这些,从而获得子池。例如,再生部分可以在单独的容器中培育,每个容器包含一株或多株植物。种子也可以在温室中培育。
在PCT/EP2017/065516中,特别是在题为“WS2:制备源自突变谷类植物的谷粒的有序库(WS2:preparing an ordered library of grains derived from mutated cerealplants)”的部分中,提供了用于将再生部分池划分为子池的方法的示例。
鉴定子池
本发明的方法包括将再生部分(例如种子)池划分为子池的步骤。然后制备来自每个子池的DNA样品并将其用于鉴定包含含有该突变的DNA的子池。
优选地,DNA样品通过包括以下步骤的方法制备:(1)将每个子池分成多部分;(2)从一个整个部分制备DNA样品。
优选地,每个子池的部分以使得理论上至少两个部分包含子池中代表的所有基因型的植物再生部分的方式制备。优选地,理论上所有部分都包含子池中代表的所有基因型的再生部分。这可以例如通过均匀混合子池的所有再生部分,将子池随机分成2至10个部分,例如分成2至6个部分,例如分成2至4个部分来实现。优选的是,所述至少2个部分各自包含子池中10-50%、例如15-50%、例如20-50%的再生部分。
因此,子池可以分成至少2个部分,例如至少3个部分,例如至少4个部分,或更多,每个部分理论上包含子池中代表的所有基因型的再生部分。
i.如实施例10中所述,可以基于每株植物的再生部分的平均数量和GECN数量来计算最佳部分大小。因此,在一个实施方案中,优选的是,如下从子池再生部分的部分制备DNA样品:将每个子池随机分成多部分,其中第一部分包括子池中在至/>范围内的再生部分;并且其中所述第一部分包括最多50%的所述再生部分;
ii.制备每个子池的整个第一部分的DNA样品,
其中RPp是每株成熟植物的再生部分数量。
分析所述部分,以及因此鉴定子池,可以包括以下步骤:
a)制备DNA样品,每个样品包含来自一个部分内每种基因型的DNA,其例如可以如下文“制备DNA样品”部分所述进行;
b)使用灵敏检测手段来检测感兴趣的NOI中的突变的存在。
步骤a)可以特别包括从整个部分提取DNA(或RNA)。
使用灵敏检测手段的步骤可以包括进行多个PCR扩增,每个PCR扩增均包括多个区室化PCR扩增,例如如下文“包括多个区室化PCR扩增的PCR扩增”部分中所述进行;以及包含具有感兴趣的NOI中的突变的PCR扩增产物,从而鉴定感兴趣的部分,并因此鉴定感兴趣的子池,例如如下文在“检测PCR扩增产物”部分中所述完成。
例如,可以直接鉴定子池,只要PCR扩增产物包含可以在PCR扩增之后或期间直接检测的NOI中的突变。例如,如果PCR扩增产物包含产生一种或多种可检测信号的检测手段,则可以进行这种操作,只要PCR扩增产物包含含有NOI的突变的靶序列。这种检测手段在下文“检测PCR产物”部分中更详细地描述,可以例如是突变检测探针。
用于鉴定包含一个或多个特定突变的部分的方法的一个实例包括以下步骤:
-提供子池并将每个子池分成多个部分;
-从每个子池的一个整个部分制备样品;
-从所述样品制备DNA样品,例如基因组DNA或mRNA;
-用来自所有子池的所有个体DNA样品制备PCR扩增,例如在板的个体孔中,例如在微量滴定板中;
-选择包含NOI中的突变的那些样品。
制备DNA样品
本发明的方法不需要为包含在一个部分内的每个再生部分个体都制备DNA样品。实际上,优选的是,使用整个部分来获得DNA样品,其在实践中是合并的DNA样品,其包含来自该部分内包含的所有基因型的DNA。DNA样品可以是gDNA样品或者它可以是cDNA,例如如本领域已知的那样从mRNA样品制备的cDNA样品。因此,优选地,该方法不包括为一个部分或子池的每个植物或再生部分都制备个体DNA样品的步骤。
本发明的方法包括制备DNA样品的一个或多个步骤,特别是gDNA或从mRNA样品制备的cDNA样品,优选gDNA样品。特别地,该方法可以包括一个从整个部分制备DNA样品的步骤。
本发明的方法还可以包括从次级子池制备DNA样品的步骤。
一般而言,子池的所述DNA样品以使得DNA样品理论上包含来自子池内的每种基因型的DNA的方式制备。可以从整个部分制备DNA样品,而在子池的其他部分中保持每种基因型的再生部分的繁殖潜力。
因此,每个子池通常包含每种基因型的多于一个个体种子或再生部分,使得当分成多部分时,每个部分包含每种基因型的多于一个个体再生部分。特别地,可以优选的是,每个子池包含每种基因型的足够量的再生部分,以便能够以如下方式将子池或超级池随机分成2至10个部分,例如分成2至6个部分,例如分成2、3或4个部分:使得每个部分理论上包括代表子池或超级池的每种基因型的再生部分。
以这种方式,可以使用来自子池的一部分再生部分,例如每个子池中10至90%、优选10至50%、例如15至50%、例如20%至50%的再生部分来制备DNA样品。所述部分再生部分在本文中也称为“再生部分样品”。子池的剩余再生部分可以在保持所述再生部分的繁殖潜力的条件下储存。储存所述植物的种子可能就足够了。种子,例如谷类谷粒,可以经常储存在任何干燥和黑暗的地方。
尽管子池优选地包括如本文其他地方所述的每种基因型的几个个体再生部分,但是次级子池通常可以包括每种基因型的仅几个(有时甚至仅一个)个体再生部分。
如上所解释的,当从子池中获得DNA时,通常从子池的一个整个部分提取DNA。然而,当从次级子池获得DNA时,所述DNA也可以从来自个体再生部分的样品中获得。当从个体再生部分获得样品时,就繁殖潜力而言,可以优选以不会显著损害所述再生部分的方式获得样品。因此,DNA样品可以从包含再生部分(例如种子)的一部分或由其组成的样品制备,所述再生部分(例如种子)的一部分对于繁殖不是必需的。可以根据物种以任何有用的方式获得样品,例如通过使用活组织检查、切割、钻孔、磨碎、撕裂或通过使用配有针头的注射器。举例来说,在物种是谷类的实施方案中,则所述样品优选包含谷类谷粒的一部分,其对于繁殖不是必需的。样品可以通过不同的方式获得,例如通过使用任何尖锐的器械例如刀、手术刀或剪刀切割谷粒的一部分,或者将谷物的一部分磨碎,或者其可以通过在谷粒上钻孔来获得。在后一种情况下,样品可以是钻孔后获得的面粉。
一旦部分再生部分或从再生部分获得的样品或其部分可用(在本文中也统称为“样品”),可以以任何有用的方式从所述样品制备DNA样品。如果所述样品含有大结构,例如整个种子,则制备DNA样品例如gDNA样品的第一步通常包括将所述样品的所述内容物分成更小的部分,例如通过物理手段,例如通过压碎或碾磨。制备DNA样品的方法通常包括破坏细胞和/或组织的步骤,例如通过去污剂、通过酶(例如裂解酶)、通过超声波或通过它们的组合-从而产生粗裂解物。可以通过任何有用的手段将所述裂解物与任何剩余的碎片分离。粗裂解物可以构成包含gDNA样品的DNA样品。或者,可以进一步纯化DNA,例如gDNA或用于获得cDNA样品的mRNA,例如通过将所述DNA与裂解物的剩余部分分离,例如通过结合选择性基质、离心、梯度离心和/或沉淀(例如使用沉淀剂,例如盐、醇或磁珠)。在这种分离之前,可以例如通过使用酶和/或变性剂使裂解物的其他组分(包括蛋白和/或核蛋白)变性或破坏。可以去除其他含有RNA的分子,例如在酶的帮助下。制备DNA样品(例如cDNA样品或gDNA样品)的有用方法例如描述在以下文献中:Sambrook等人,Molecular Cloning–LaboratoryManual,ISBN 978-1-936113-42-2。
灵敏检测手段
本发明的方法包括以下步骤:使用用于检测核酸序列的检测手段,优选灵敏检测手段,识别子池的一部分,并因此识别相应的感兴趣的子池。术语“灵敏检测手段”是指这样的检测手段,即使在突变生物体的基因型与非突变生物体的基因型的差别在于最多一个核苷酸的情况下,它们也允许检测至少300个生物体的文库中的一个突变生物体。优选地,检测手段足够灵敏以允许检测300个基因组文库中的一个突变基因组,即使当突变基因组与299个其他基因组的差别仅在于一个核苷酸时也是如此。在一些实施方案中,检测手段允许检测至少300个生物体例如植物的文库中的一个突变生物体例如植物,例如至少400个生物体的文库中的一个突变体,例如至少500个生物体的文库中的一个突变体,例如至少600个生物体的文库中的一个突变体,例如至少700个生物体的文库中的一个突变体,例如至少800个生物体的文库中的一个突变体,例如至少900个生物体的文库中的一个突变体,例如至少1,000个生物体的文库中的一个突变体,例如至少1,100个生物体的文库中的一个突变体,例如至少1,200个生物体的文库中的一个突变体,例如至少1,300个生物体的文库中的一个突变体,例如至少1,400个生物体的文库中的一个突变体,例如至少1,500个生物体的文库中的一个突变体,例如至少1,600个生物体的文库中的一个突变体,例如至少1,700个生物体的文库中的一个突变体,例如至少1,800个生物体的文库中的一个突变体,例如至少1,900个生物体的文库中的一个突变体,例如至少2,000个生物体的文库中的一个突变体,例如至少2,500个生物体的文库中的一个突变体,例如至少3,000个生物体的文库中的一个突变体,例如至少4000个生物体的文库中的一个突变体,例如至少5,000个或更多生物体的文库中的一个突变体。
例如,灵敏检测手段具有至多1,000分之一的检测灵敏度,例如1,000至10000分之一的检测灵敏度,例如1,000至5,000分之一的检测灵敏度。
例如,本发明的方法可以包括进行多个PCR扩增的步骤,每个PCR扩增都包含来自一个部分的DNA样品,即来自一个部分中存在的所有再生部分(例如如以上部分所述制备的)的DNA样品,从而扩增靶序列。每个PCR扩增可以包括多个区室化PCR扩增,每个区室化PCR扩增包含所述DNA样品的一部分、位于靶序列侧翼的一组或多组引物和PCR试剂。
RNase H2依赖性PCR(rhPCR)可以通过引入含有单个核糖核苷酸残基的封闭引物来提高PCR的特异性,这些封闭引物经由酶促切割被激活。具体来说,用于rhPCR的封闭引物含有一个核糖核苷酸残基,该残基在与靶DNA完美杂交后诱导RNase H2切割。切割发生在RNA碱基的5'侧,因此将RNA碱基与3'封闭部分一起释放,允许选择性扩增靶DNA片段。尾序列可被整合到扩增子中,以将基于5'-核酸酶测定的报告系统与rhPCR结合使用。在一些实施方案中,PCR反应是rhPCR反应,例如如实施例2中所述。
在另一种情况下,具有反式切割活性的Cas核酸酶,如Cas12a,可用作灵敏检测手段(Chen等人,2018年)。最近报道了几种具有反式切割活性的Cas核酸酶,其可用于检测复杂样品中的核苷酸取代。该方法利用CRISPR将分子(在本情况中为Cas12a核酸酶)引导至特定DNA或RNA片段的能力。可以将CRISPR分子设计为对含有NOI的靶序列具有特异性。在与包括NOI在内的靶序列结合后,Cas12a将切割特定的RNA或DNA链。与传统的CRISPR相关核酸酶(如Cas9)不同,Cas12a也将开始切割靠近核酸酶的单链DNA或RNA分子。在这里,用荧光标志物和猝灭剂标记的单链DNA或RNA链(一种报告分子)被用作Cas12a反式切割的底物。在本示例中,CRISPR-Cas12a特异性结合仅含有NOI的DNA或RNA序列,并开始切割紧邻的报告分子。报告分子的切割将释放荧光团并发出含有NOI的DNA或RNA分子存在的信号。如果反应仅含有无NOI的靶序列,则CRISPR-Cas12a复合物不与该靶结合,因此将不会启动报告分子的反式切割,这些分子仍然处于猝灭状态。
可以以多种不同方式制备包括多个区室化PCR扩增的整个PCR反应。在一个实施方案中,包含多个区室化PCR扩增的PCR扩增可以作为数字PCR(dPCR)扩增进行。本领域技术人员已知的任何dPCR扩增均可与本发明一起使用。通常,为所制备的每种DNA样品准备至少一种包含多个区室化PCR扩增的dPCR扩增。因此,每个子池的每个部分将准备至少一个包含多个区室化dPCR扩增的dPCR扩增。
通常,区室化dPCR扩增以包括下述步骤的方法制备:
-制备dPCR扩增,其包括DNA样品、位于靶序列侧翼的一组引物和PCR试剂;
-对所述dPCR扩增进行分区,使得样品中的核酸分子定位并集中在多个空间上分离的区室内;
-进行dPCR扩增;
-检测基于dPCR的扩增产物。
DNA样品可以是gDNA样品或从mRNA样品获得的cDNA样品。在一些实施方案中,DNA样品是gDNA样品。
所述分离的区室可以是任何单独的可以进行PCR扩增的区室。例如,它可以是一个平板的孔,例如微孔板或微量滴定板的孔,可以是微流体室,可以是毛细管,可以是乳液的分散相,或者可以是微型室阵列的液滴或小型化室。分离的区室也可以是固体支持物上的离散点,例如离散的核酸结合表面。
通常优选将DNA样品随机分配到样品中用于区室化dPCR扩增。还优选每个区室化dPCR扩增仅包括少量包含靶序列的核酸。由于随机分布的性质,每个区室化dPCR扩增中包含的核酸分子的数量可能存在一些变化。在一个实施方案中,每个区室化dPCR扩增平均包含至多10个,例如至多5个包含靶序列的核酸分子。
在本发明的一个优选实施方案中,包含多个区室化PCR扩增的dPCR扩增是液滴数字聚合酶链式反应(ddPCR)。ddPCR是一种基于水-油乳液液滴技术进行dPCR的方法。将PCR扩增分级为多个微液滴,并且在每个单独的液滴中发生靶序列的PCR扩增。通常,ddPCR技术采用类似于进行常规PCR所用的PCR试剂和工作流程。因此,PCR扩增的分区是ddPCR技术的关键方面。
因此,区室化ddPCR扩增可以包含在液滴中,其可以例如包括乳液组合物,或两种或更多不混溶流体的混合物(例如,美国专利号7,622,280中所述或如下文示例中所述)。液滴可以通过WO/2010/036352中描述的装置产生。特别地,可以使用液滴发生器制备液滴,例如可从Bio-Rad Laboratories,USA (下文缩写为Bio-Rad)获得的QX200 DropletGenerator。如本文所用,术语乳液可以指不混溶液体(例如油和水)的混合物。乳液可以例如是油包水液滴,例如如Hindson等人(2011)所述。因此,乳液可包括位于连续油相中的水性液滴。乳液也可以是水包油乳液,其中液滴是位于连续水相中的油滴。本文使用的液滴通常设计成防止区室之间的混合,不仅保护单个区室内的内容物免于蒸发,而且还防止与其他区室的内容物聚结。因此,每个液滴可以被视为空间分离的区室。
ddPCR的每个液滴可以具有任何有用的体积。然而,优选地,液滴具有nL范围内的体积。因此,优选液滴体积平均在0.1至10nL的范围内。
已知使用微通道交叉流聚焦或物理搅拌产生乳液液滴的微流体方法来产生单分散或多分散乳液。液滴可以是单分散液滴。而且,可以产生液滴,使得它们的尺寸变化不超过液滴平均尺寸的±5%。在一些情况下,产生液滴,使得液滴尺寸的变化仅在液滴平均尺寸的2%内。
较高的机械稳定性可用于微流体操作和更高剪切的流体处理(例如在微流体毛细管中或通过90°转弯,例如流体路径中的阀)。热处理前和热处理后的液滴或胶囊对于标准移液管操作和离心是机械稳定的。
通过使油相流过含水样品可以形成液滴。水相可以包含PCR扩增中的组分,或由其组成,例如,包含DNA样品、位于靶序列侧翼的一组引物和PCR试剂的PCR扩增,例如下文“PCR试剂”部分中所述的任何PCR试剂。
油相可包含氟化基油,其可另外通过与氟化表面活性剂(例如全氟化聚醚)组合以稳定化。在一些情况下,基油可以是HFE 7500、FC-40、FC-43、FC-70或其他常见氟化油中的一种或多种。在一些情况下,阴离子表面活性剂是Ammonium Krytox(Krytox-AM)、KrytoxFSH的铵盐或Krytox-FSH的吗啉代衍生物。
油相可进一步包含用于调节油性质的添加剂,例如蒸气压、粘度或表面张力。非限制性例子包括全氟辛醇和1H,1H,2H,2H-全氟癸醇。油相也可以是产生液滴的油,例如来自Bio-Rad的Droplet Generation Oil。
可以配制该乳液以产生具有液状界面膜的高度单分散液滴,其可以通过加热成具有固体状界面膜的微胶囊而转化;这样的微胶囊可以作为生物反应器,其通过反应过程,例如PCR扩增,保留其内容物。在加热时可以发生向微胶囊形式的转化。例如,这种转化可以在大于50、60、70、80、90或95℃的温度下发生。在某些情况下,使用热循环仪进行所述加热。在加热过程中,可以使用流体或矿物油覆盖层来防止蒸发。
在一些情况下,使用市售的液滴发生器产生液滴,例如Bio-Rad QX100TM DropletGenerator或Bio-Rad QX200TM Droplet Generator。ddPCR和随后的检测可以使用市售的液滴读取器进行,例如Bio-Rad QX100或QX200TM Droplet Reader。
每个PCR扩增可以区室化为任何合适数量的区室。然而,在一个优选的实施方案中,每个PCR扩增被区室化为1,000至100,000个区室(例如液滴)。例如,每个PCR扩增可以区室化为10,000至50,000个区室(例如液滴)。例如,每个PCR扩增可以区室化为15,000至25,000个区室(例如液滴)。进一步地,每个PCR扩增可以区室化为大约20,000个区室(例如液滴)。
子池的组织化
在鉴定子池的步骤之前,本发明的方法还可以包括以某种方式组织所述子池的步骤,这便于鉴定包含含有感兴趣的突变的再生部分(例如种子)的子池。
例如,来自几个子池的DNA样品的部分可以组合成“超级池”。然后可以使用极其灵敏的检测手段来鉴定包含含有感兴趣的突变的DNA的超级池。之后,仅包含在超级池中的包含具有感兴趣的突变的DNA的子池才必须进行测试。用于制备和测试超级池的有用方法描述在国际专利申请WO 2018/001884中。
在另一个示例中,子池被放置到多维网格中,并且超级池由每个维度中的子池制备。以二维网格为例,这是最容易说明的。每个子池在所述网格中给出一个坐标(x,y)。将具有给定坐标X的所有子池的DNA样品的部分合并并测试是否存在包含感兴趣的突变的DNA。类似地,将具有给定坐标Y的所有子池的DNA样品的部分合并并测试是否存在包含感兴趣的突变的DNA。一旦包含来自给定坐标X和给定坐标Y的DNA样品的超级池被鉴定为包含具有感兴趣的突变的DNA,则可以基于其坐标X和Y鉴定包含所述DNA的子池。技术人员将理解可使用多个维度而不是仅使用两个维度来制作类似的系统。
因此,除了测试每个子池是否存在包含感兴趣的突变的DNA之外,本发明的方法还包括对子池进行组织以使得可以一起测试子池组。例如,可以使用本文所述的任何灵敏检测手段进行测试。
PCR试剂
在一些实施方案中,该方法包括进行几个PCR扩增,其中这些PCR中的至少一些可包含多个区室化PCR扩增。
无论所述PCR是否包含区室化PCR扩增,PCR扩增通常包括DNA样品、位于靶序列侧翼的一组引物和PCR试剂。所述PCR试剂可以是本部分所述的任何PCR试剂。
通常,PCR试剂至少包含核苷酸和核酸聚合酶。核苷酸可以是脱氧核糖核苷酸三磷酸分子,并且优选地,PCR试剂包含至少dATP、dCTP、dGTP和dTTP。在一些情况下,PCR试剂还包含dUTP。
核酸聚合酶可以是能够催化核苷酸的模板依赖性聚合即复制的任何酶。核酸聚合酶应该耐受PCR扩增的温度,并且它应该在延伸温度下具有催化活性。几种热稳定核酸聚合酶是本领域技术人员已知的。
在本发明的一些实施方案中,核酸聚合酶具有5'-3'核酸酶活性,因此可用于与TaqMan探针的扩增反应。
核酸聚合酶可以是大肠杆菌DNA聚合酶I。核酸聚合酶也可以是Taq DNA聚合酶,其具有DNA合成依赖性链置换5'-3'外切核酸酶活性。具有5'-3'核酸酶活性的其他聚合酶包括但不限于rTth DNA聚合酶。Taq DNA聚合酶,例如从New England Biolabs获得的,可包括CrimonTaq DNA聚合酶、Crimson Taq DNA聚合酶、Hemo KlenTaqTM或/>Taq。
在一些情况下,核酸聚合酶可以是例如大肠杆菌DNA聚合酶、大肠杆菌DNA聚合酶I的Klenow片段、T7 DNA聚合酶、T4 DNA聚合酶、Taq聚合酶、Pfu DNA聚合酶、Vent DNA聚合酶、噬菌体29、REDTaqTM、基因组DNA聚合酶或测序酶。DNA聚合酶例如在美国专利申请公开号20120258501中所述。
另外,PCR试剂可以包括盐、缓冲液和检测手段。缓冲液可以是任何有用的缓冲液,例如TRIS。盐可以是任何有用的盐,例如氯化钾、氯化镁或乙酸镁或硫酸镁。
PCR试剂可包含非特异性阻断剂,例如BSA、来自牛皮的明胶、β-乳球蛋白、酪蛋白、干乳、鲑鱼精子DNA或其他常见的阻断剂。
PCR试剂还可包含生物防腐剂(例如NaN3)、PCR增强剂(例如甜菜碱、海藻糖等)和抑制剂(例如RNase抑制剂)。其他添加剂可包括二甲基亚砜(DMSO)、甘油、甜菜碱(单)水合物、海藻糖、7-脱氮-2'-脱氧鸟苷三磷酸(7-deaza-2'-dGTP)、牛血清白蛋白(BSA)、甲酰胺(甲酰胺)、四甲基氯化铵(TMAC)、其他四烷基铵衍生物[例如四乙基氯化铵(TEA-Cl)];四丙基氯化铵(TPrA-Cl)或非离子型洗涤剂,例如Triton X-100、吐温20、Nonidet P-40(NP-40)或PREXCEL-Q。
此外,PCR试剂还可以包含一种或多种用于检测包含NOI的突变的PCR扩增产物的手段。所述手段可以是任何可检测的手段,并且它们可以作为单独的化合物添加或与引物之一结合或甚至共价连接。可检测的手段包括但不限于染料、放射性化合物、生物发光和荧光化合物。在优选的实施方案中,检测手段是一种或多种探针。因此,优选PCR试剂包含一种或多种检测探针,例如下文“检测PCR产物”部分中所述的任何探针。
位于靶序列侧翼的引物
本发明的方法涉及使用位于靶序列侧翼的一个或多个引物组。位于靶序列侧翼的各自“引物组”包括包含与靶序列的5'末端相同的序列的一个引物(也称为“正向引物”),以及包含与靶序列的3'末端互补的序列的一个引物(也称为“反向引物”)。当在允许扩增所述靶序列的条件下,将引物组与包含靶序列的核酸、PCR试剂一起加入PCR时,该引物组能够扩增靶序列。相同的引物组可用于本发明方法的所有PCR扩增,即使不同组的引物也可能用于本发明不同步骤的PCR扩增。
除了与靶序列的5'末端相同的序列外,正向引物可以包含另外的序列。类似地,除了与靶序列的3'末端互补的序列外,反向引物可以包含另外的序列。例如,引物可以在5'末端含有另外的核酸序列,该核酸序列不与靶核酸杂交,但是有助于处理引物或PCR扩增产物,例如检测所述产物。
正向引物和反向引物的长度可取决于靶序列的序列。例如,可以调节引物的长度以获得引物的所需解链温度Tm。因此,正向引物和反向引物的长度可以分别在10至100个核苷酸的范围内,例如在10至50个核苷酸的范围内,例如在15至20个核苷酸的范围内,例如在15至25个核苷酸的范围,例如15至30个核苷酸的范围内,例如15至40个核苷酸的范围内,例如15至45个核苷酸的范围内,例如15至50个核苷酸长度的范围内。通常将正向引物和反向引物的Tm调节在40至70℃的范围内。
PCR扩增的水相内的引物浓度可以例如在0.05至2.0μM的范围内,例如在0.1至1.0μM的范围内,例如在0.2至1.0μM的范围内,例如在0.3至1.0μM的范围内,例如在0.4至1.0μM的范围内或在0.5至1.0μM的范围内。
通常,正向引物和反向引物包含或甚至由寡核苷酸组成。然而,在一些情况下,引物可包含核苷酸类似物。许多核苷酸类似物是本领域技术人员已知的并且包括衍生物,其中糖被修饰,如2'-O-甲基,2'-脱氧-2'-氟和2',3'-双脱氧核苷衍生物,基于其他糖骨架的核酸,例如苏糖,锁核酸(LNA),LNA衍生物,肽核酸(PNA),乙二醇核酸(GNA),苏糖核酸(TNA),双环糖或己糖,甘油和乙二醇糖,基于非离子骨架的核酸类似物,或非线性拓扑的核酸及其类似物,例如树枝状大分子、梳状结构和纳米结构。
引物还可以与各种标签(例如荧光标签、功能化标签或结合标签)连接,其可任选地与其末端、糖或核碱基结合。
引物可以通过多种方法制备,包括但不限于,使用本领域熟知的方法克隆合适的序列和直接化学合成[Narang等人,Methods Enzymol.68:90(1979);Brown等人,MethodsEnzymol.68:109(1979)]。引物也可以从商业来源获得。
正向引物和反向引物可以具有相同的解链温度或类似的解链温度,例如,±5℃的解链温度。引物的长度可以在5'和/或3'末端延伸或缩短,以产生具有所需熔解温度的引物组。因此,引物对的引物之一可以比另一引物长。
可以基于解链温度设计引物。确定小于25bp的引物的解链温度的等式被称为Wallace Rule[Td=2×(A+T)+4×(G+C)]。这里,Td是特定盐浓度下的温度,其中50%的寡核苷酸及其完美过滤结合互补体处于双链构象。通常,Td在0.9M NaCl中测定。然而,在设计引物时,其他考虑因素也很重要,例如,其预测的二级结构。有若干种计算机程序和在线服务可用于设计引物。
在一个实施方案中,可以下列方式设计引物组,其中引物能够特异性地扩增包含NOI的突变的靶序列,但不能扩增包含参考NOI的靶序列。例如,这可以通过将正向引物设计为包括与包含突变的NOI相同的序列来实现,和/或可以通过设计反向引物使其包括一个或多个与包含突变的NOI互补的序列来实现。
在其他实施方案中,引物组可以下列方式设计,其中引物能够特异性地扩增包含参考NOI的靶序列,但不能扩增包含NOI的突变的靶序列。这可以例如通过设计正向引物使其包含与参考NOI相同的序列,和/或通过设计反向引物使其包含与参考NOI互补的序列来实现。
然而,在本发明的一些实施方案中,引物组能够扩增包含NOI的突变的靶序列和包含参考NOI的靶序列。
值得注意的是,本发明的方法包括具有一组以上引物的PCR扩增,例如2组引物,例如3组引物,例如2至10组引物。因此,每个PCR扩增可包含位于不同靶序列侧翼的几组引物。这允许在一次PCR扩增期间检测一种以上不同的突变。
在其中PCR是rhPCR的实施方案中,PCR反应优选在含有单个核糖核苷酸残基的封闭引物存在下进行。这种封闭的引物在与靶DNA完美杂交后被RNase HE2酶促切割激活。切割发生在RNA碱基的5'侧,因此将RNA碱基与3'封闭部分一起释放,允许选择性扩增目标DNA片段。尾序列可被整合到扩增子中,以将基于5'-核酸酶测定的报告系统与rhPCR结合使用。
检测PCR产物
在一些实施方案中,本发明的方法包括以下步骤:检测包含靶序列的PCR扩增产物,所述靶序列包含感兴趣的NOI中的突变。可以通过任何有用的手段检测PCR扩增产物。
如上所述,所述突变可以是取代、缺失和/或插入,仅涉及一个或几个核苷酸至大量核苷酸。因此,检测可以适应于NOI指定的特定突变。
在一些实施方案中,以下列方式设计引物组,其中引物能够特异性地扩增包含NOI的突变的靶序列,但不能扩增包含参考NOI的靶序列。在其他实施方案中,可以下列方式设计引物组,其中这些引物能够特异性地扩增包含参考NOI的靶序列,但不能扩增包含NOI的突变的靶序列。在此类实施方案中,可以简单地基于检测PCR扩增产物的存在或不存在来进行检测。特别地,这可以是突变为大量NOI突变的本发明实施方案中的情况。
在优选的实施方案中,借助于检测探针检测PCR扩增产物。特别地,当突变是较少数量的NOI突变(例如一个或多个点突变)时,可以是这种情况。
检测探针可以是包括与包含突变的NOI相同的序列的寡核苷酸。另外,所述探针通常还包含与NOI侧翼的靶序列区域相同的序列。类似地,检测探针可以是包括与包含突变的NOI互补的序列的寡核苷酸,此外,所述探针还可以包含与NOI侧翼的靶序列区域互补的序列。位于NOI侧翼的所述区域可以分别是NOI的5'和/或3'的序列。此类探针优选与包含NOI突变的PCR扩增产物退火,但不与包含参考NOI的PCR扩增产物退火。此类检测探针在本文中也称为“突变检测探针”。突变检测探针通常包含10至30个核苷酸。特别地,突变检测探针可以包括与包含NOI的突变的靶序列相同或互补的10至30个核苷酸的连续序列。
检测探针也可以是包含与参考NOI相同的序列的寡核苷酸。另外,所述探针通常还包含与NOI侧翼的靶序列区域相同的序列。类似地,检测探针可以是包含与参考NOI互补的序列的寡核苷酸,并且所述探针还可以包含与NOI侧翼的靶序列区域互补的序列。此类探针优选与包含参考NOI的PCR扩增产物退火,但不与包含NOI突变的扩增产物退火。此类检测探针在本文中也称为“参考检测探针”。参考检测探针通常包含10至30个核苷酸。特别地,参考检测探针可以包括与包含参考NOI的靶序列相同或互补的10至30个核苷酸的连续序列。
在一些实施方案中,PCR试剂包含一组探针,其由突变检测探针和参考检测探针组成。当在允许所述靶序列扩增的条件下,当与包括靶序列的核酸、PCR试剂和引物组一起加入PCR扩增时,“探针组”优选能够竞争NOI处的结合位点。如上所述,检测探针通常是寡核苷酸。特别地,它们可以是单链DNA的短核苷酸片段。检测探针可以与可检测手段结合或甚至共价连接,包括但不限于,报道分子、染料、放射性化合物、生物发光化合物、荧光化合物和荧光团/猝灭剂对。
在一些实施方案中,检测探针的最5'核苷酸不是G。因此,突变检测探针可以包含寡核苷酸,其中最5'核苷酸不是G。类似地,参考检测探针可以包含寡核苷酸,其中最5'核苷酸不是G。
本发明的方法可包括使用突变检测探针和参考检测探针。在此类情况下,优选地,探针被差异标记,例如,使得一个探针与可检测手段相结合或共价连接,而另一个则不是。两种探针可能均与可检测手段相结合或共价连接,其中所述可检测手段是不同的。
在一个实施方案中,参考检测探针在5'末端用荧光团标记,在3'末端用猝灭剂标记。所述荧光团和猝灭剂可以分别是例如HEX和Black-Hole Quencher。在一个实施方案中,突变检测探针在5'末端用荧光团标记,在3'末端用猝灭剂标记。所述荧光团和猝灭剂可以分别例如是FAM和Black-Hole Quencher。
PCR反应可包含相似量的突变检测探针和野生型检测探针。然而,在一些实施方案中,可优选使用过量的突变检测探针。尤其在超级池PCR扩增后检测PCR产物的情况下。在此类情况下,与参考检测探针相比,PCR反应可以包括至少2倍过量、更优选至少4倍过量的突变检测探针。
在一些实施方案中,检测探针是探针(Heid等人,1996),其利用核酸聚合酶的5'核酸外切酶活性。这就是为什么PCR试剂优选包括具有5'核酸外切酶活性的核酸聚合酶(例如Taq聚合酶)的原因。通常,/>探针可以是如上所述的突变检测探针,或如上所述的参考检测探针,其与荧光团/猝灭剂对共价连接。因此,探针可含有荧光团,通常在5'碱基处或附近。此外,/>探针可以含有猝灭剂,其可以在3'碱基处或附近,并且能够淬灭所述荧光团的荧光[Tyagi等人(1998)]。当被照射时,激发的荧光团将能量转移到附近的猝灭剂而不是发荧光[Forste或荧光共振能量转移(FRET)]。因此,荧光团和猝灭剂的紧密接近可以防止任何荧光的发射,同时探针是完整的。然而,当/>探针与靶序列的内部区域退火,并且聚合酶复制其上结合/>探针的模板时,其5'外切核酸酶活性可以切割探针。这一系列事件消除了猝灭的功能,即没有FRET,荧光团开始发射荧光,其可以通过任何有用的手段来测量。
值得注意的是,如上所强调的,本发明还包括,这些方法可用于鉴定一种以上不同的突变。这可以通过使用如上所述的多组引物来实现。然而,这也可以通过使用几种不同的检测探针来实现。因此,在一个实施方案中,所述方法可用于鉴定靶序列中NOI的一种以上不同的突变。在所述实施方案中,PCR试剂可包含参考检测探针和若干突变检测探针,其中每个突变检测探针包括与一个突变相同或互补的序列的寡核苷酸。优选地,参考检测探针和突变检测探针与不同的检测手段连接。所有突变检测探针可以连接到相同的检测手段或类似的检测手段或不同的检测手段。
在一些情况下,检测探针是分子信标(MB),即包含能够自身杂交的互补序列(也称为“茎”)的探针,产生“发夹环”结构。MB的环可含有与NOI(或突变体或参考NOI)互补或相同的序列。此外,MB通常包括位于MB任一端的荧光团和猝灭剂,使得当探针与其自身杂交时它们彼此接近。MB可以是如上所述与荧光团/猝灭剂对以及提供MB互补区域的茎序列共价连接的如上所述的突变检测探针或参考检测探针。文献中已经给出了关于制备和使用MB的标准方法的进一步细节,并且MB可以从许多商业试剂来源获得。
在某些情况下,使用引物/探针;在某些情况下,引物/探针是ScorpionsTM探针,它可以提供类似于MB的基于FRET的茎-环检测机制,不同之处在于,探针还具有连接的区段,其用作正向或反向引物(Whitcombe等人(1999);美国专利No.6,326,145)。ScorpionsTM探针可以在未杂交状态下保持茎-环构型,荧光团淬灭。ScorpionsTM探针可以具有更长的多组分结构,例如5'荧光团,然后是靶特异性茎-环部分,然后是猝灭剂,然后是阻断剂[例如己二醇(HEG)],最后是3'引物序列。阻断剂可以防止产物反向延伸到探针上。
在一些情况下,引物/探针是SunriseTM探针,其包含附着于发夹探针的引物,所述发夹探针在扩增期间延伸。该设置可以将内部猝灭剂与5'末端荧光团分开(Nazarenko等人(1997))。
检测探针可以是任何有用的长度,例如长度为10至60个核苷酸。寡核苷酸探针的长度也可以在10至30个核苷酸的范围内。寡核苷酸探针的精确序列和长度可部分取决于其结合的靶多核苷酸的性质。可以改变结合位置和长度以在特定情况下实现适当的退火和解链特性。例如,检测探针可以设计成具有与正向引物和/或反向引物相同的解链温度,例如±10℃以内,例如±5℃以内。
检测探针的3'末端核苷酸可被核酸聚合酶阻断或不能延伸。通过连接部分,通过荧光团或猝灭剂将可检测手段连接至寡核苷酸探针的末端3'碱基,可以便利地实现所述阻断。
文献中有大量实用指南,其描述了有用的荧光团-猝灭剂对,包括选择荧光团-猝灭剂对的方法,如下所示:
-Clegg,Meth.Enzymol.,211:353-388(1992);Wo等人,Anal.Biochem.,218:1-13(1994);Pesce等人,编辑,Fluorescence Spectroscopy(Marcel Dekker,New York,1971);White等人,Fluorescence Analysis:A Practical Approach(Marcel Dekker,New York,1970);等等;
-文献还包括提供荧光和生色分子的详尽列表以及用于选择报告分子-猝灭剂对的相关光学性质的参考文献,例如,Berlman,Handbook of Fluorescence Spectra ofAromatic Molecules,第二版(Academic Press,New York,1971);Griffiths,Colour andConstitution of Organic Molecules(Academic Press,New York,1976);Bishop,编辑,Indicators(Pergamon Press,Oxford,1972);Haugland,Handbook of FluorescentProbes and Research Chemicals(Molecular Probes,Eugene,1992)Pringsheim,Fluorescence and Phosphorescence(Interscience Publishers,New York,1949);等等。
-此外,文献中有广泛的用于衍生报告分子和猝灭剂分子的指导,用于通过可以加入寡核苷酸的常见反应基团进行共价连接,如下列参考文献所示:Haugland(上文引用);Ullman等人,美国专利No.3,996,345;Khanna等人,美国专利No.4,351,760;等等。
荧光团和猝灭剂可以例如选自荧光素和罗丹明染料。这些染料与用于连接至寡核苷酸的适当连接方法结合在许多参考文献中描述,例如,Khanna等人.(如上所述);Marshall,Histochemical J.,7:299-303(1975);Menchen等人,美国专利号5,188,934;Menchen等人,欧洲专利申请87310256.0;和Bergot等人,国际申请PCT/US90/05565。后四篇文献在此引入作为参考。
荧光团/猝灭剂对可以例如在5'末端使用荧光团如EDANS或荧光素,和在3'端使用猝灭剂如Dabcyl。
PCR扩增产物的检测可以包括将在包含给定DNA样品的PCR扩增中获得的信号与在对照PCR扩增中获得的信号进行比较的步骤。该信号通常与可检测手段相关,所述可检测手段与突变检测探针和/或野生型检测探针相关。因此,如果所述探针与荧光团连接,则信号可以是荧光。对照PCR扩增可以是在相同条件下进行的PCR扩增,但缺少DNA样品,即所述对照PCR扩增可能缺乏DNA模板,或者它可能仅包括只包含参考靶序列的对照DNA,例如野生型DNA。在一些实施方案中,任何比来自对照PCR扩增的信号更强的信号可以被认为是阳性信号,即指示存在包含NOI的一个或多个突变的靶序列的信号。
在一个实施方案中,高于给定阈值的任何信号可以被认为是阳性信号。阈值可以通过任何有用的方式确定,通常通过合适的软件,例如Biorad提供的QX200TM DropletReader和QuantasoftTM软件。
在使用突变检测参考检测探针的本发明实施方案中,可确定位于突变检测探针获得的信号与参考检测探针的信号之间的分数丰度,并用于评估PCR产物的存在。分数丰度可以确定为:[(“突变检测探针”)的信号]除以[(“参考检测探针”+“突变检测探针”)的信号]。
例如,可以假设样品含有包含NOI的突变的靶DNA,只要与对照PCR扩增相比其具有以下特征:
1)分数丰度增加,和/或;
2)突变体液滴的浓度增加,和/或;
3)突变体事件的数量增加,比平均值高50%或更高。
突变体液滴可以是从突变检测探针产生阳性信号的液滴。本文,“突变体事件”等于突变体液滴的数量。
鉴定子池内的再生部分
一旦已经鉴定了包含再生部分的子池,所述再生部分具有包含感兴趣的突变的DNA,该方法通常包括在包含所述突变的所述子池内鉴定再生部分的步骤。
这可以以任何常规方式完成。如果子池足够小,这可以简单地通过测试所述子池内的每个种子或其后代是否存在突变来完成。例如,可以从每个再生部分获取样品,或者可以使每个再生部分生长成植物,并且可以使用来自所述植物的样品来检测所述植物是否携带突变。
然而,经常可以采用劳动强度较低的方法来鉴定携带该突变的子池内的再生部分。例如,可以将子池划分为次级子池,并且可以鉴定包括再生部分的次级子池,所述再生部分具有包含感兴趣的突变的DNA。这可以以基本上与上文描述的用于鉴定包括感兴趣的再生部分的子池相同的方式来完成。然而,由于子池通常明显小于初始池,因此也可以采用不太灵敏的方法。
在一个实施方案中,感兴趣的再生部分通过包括以下步骤的方法来鉴定:
-提供包含植物的多个再生部分的子池,其中所述子池包含含有NOI的一个或几个突变的再生部分;
-将所述子池的再生部分划分为次级子池;
-从次级子池的每个再生部分获取样品-以使再生部分保持足够完整以发育成植物的方式-以及合并来自每个次级子池的所有再生部分的所有样品;
-从所述合并的样品制备DNA样品;
-鉴定包含含有突变的DNA的次级子池;
-鉴定包含所述突变的所述次级子池内的再生部分。
在一个实施方案中,鉴定包含所述突变的所述次级子池内的再生部分的步骤包括对所述次级子池内的每个再生部分,例如其每个种子或其后代,测试突变的存在。例如,每个再生部分可以生长成植物,并且可以使用来自所述植物的样品来检测所述植物是否携带该突变。
植物表型和改变的性状
本方法允许使用最好的栽培品种和最先进的育种系进行文库建设。这确保将所需性状引入到期望的背景,例如地区适应的、高产的、气候适应的和/或抗病繁殖原种。如上所说明的,本方法减少或消除了回交的必要性。本方法基于随机诱变。相比之下,GM或基因编辑技术通常需要转化的步骤,并因此仅限于可被转化的物种,或在组织培养中生长旺盛但对当地环境适应不佳的非优良、可转化品种。
术语植物的表型是用于描述观察性特征的术语,例如植物的高度、产量、谷粒大小、叶形、生物量等。在结合环境对植物的可观察特征的影响的情况下,通常将植物的表型确定为植物基因型的集体表现。
在某些情况下,与环境相互作用的具有相同基因型的植物可以表现出不同的表型。在其他情况下,植物可以具有相同的表型但不同的基因型。
在诱变和选择具有特定的所需突变的植物后,本发明的突变植物与亲本植物相比具有不同的基因型。特别地,突变植物包含编码区中的1至30个非同义突变,如上文所详述的。
在一个实施方案中,突变植物和亲本植物可以具有相同的表型。在另一个实施方案中,植物具有不同的表型。优选的是,突变植物具有与亲本植物相同的可观察特征,不包括由NOI中的突变引起的特征/性状。换言之,优选的是,诱变植物具有与亲本植物相同的表型,但不包括所需的诱变性状。
因此,突变导致一种或多种特定性状,其优选地是突变植物与M0代(即诱变前)植物之间唯一不同的性状。由于本方法中使用的低诱变率,这是可能的。
在一些实施方案中,突变植物的外观、高度、生物量、叶形和味道中的一种或多种与亲本植物相同,优选地,突变植物的外观、高度、生物量、产量、谷粒大小、叶形和味道全部都与亲本植物相同。
产量、谷粒品质、不育性和其他性状
高诱变率通常导致植物产量下降。如上文所述,由于本方法是基于低诱变率,可获得与亲本植物具有相似产量的诱变植物。特别地,突变植物可以产生为亲本植物的总(作物)产量的至少90%、例如至少91%、例如至少92%、例如至少93%、例如至少94%、例如至少95%、例如至少96%、例如至少97%、例如至少98%、例如至少99%或例如100%或更多的产量。在一些实施方案中,突变植物的产量可以高于亲本植物的总产量。因此,在一些实施方案中,突变植物可以产生的产量为亲本植物的总产量的105%或更多,例如110%或更多,例如120%或更多,例如130%或更多,例如140%或更多,例如150%或更多,例如175%或更多,例如200%或更多。
在本发明的另一个实施方案中,NOI被预先确定以影响突变植物的产量,因此,在该实施方案中,与亲本植物的产量相比,突变植物的产量将被改变。在一个优选的实施方案中,突变植物的产量至少等于或大于亲本植物的产量。由于产量可以根据生长条件或土壤的性质而变化,因此,突变植物和亲本植物的产量应优选地与在相似条件下生长的植物进行比较。
通过本方法获得的突变植物优选具有与亲本植物的谷粒品质基本上相同或更高的谷粒品质。
因此,在一些实施方案中,感兴趣的突变对谷粒品质无害。因此,谷粒的水分含量;容重;变色、破碎或损坏籽粒的百分比;谷粒的易碎性;碾磨品质;蛋白和油含量;和谷粒的生存力中的一项或多项,与亲本植物中的相应特征相同或更大。此外,谷粒颜色、组成、堆积密度、气味和香气、大小和形状中的一项或多项优选与亲本植物中的相应特征相同或更好。
优选地,所需突变不增加或仅轻微增加植物的不育性。因此,在一些实施方案中,通过本方法获得的突变植物,即每穗不育花的百分比,具有低于30%的不育性。
实施例
实施例1-低突变密度方案
为了诱导突变,根据Kleinhofs等人(1978)提供的详细信息以及在US 7,838,053中提供的那些详细信息,并进行了以下改变,将从大麦植物中收集的籽粒在含有诱变剂叠氮化钠(NaN3)的溶液中孵育:用于诱变的叠氮化钠的浓度降低到0.3mM,持续2小时。
该方法诱导大麦谷粒的基因组DNA(gDNA)中的点突变,通常赋予随机分布的用于氨基酸取代或蛋白编码DNA的翻译终止的密码子,即分别导致由诱变DNA编码的蛋白中的蛋白变化和截短。然而,本发明的方法也用于生产在非蛋白编码区的gDNA中具有点突变的谷类植物,例如启动子、终止子和内含子。
将15kg谷粒诱变并种植在30个地块中,每个地块为7.5m2。然后将这些地块分成17个子地块,每个子地块对应一个子池,从中生成种子库和DNA样品。
实施例2-RNase H2依赖性PCR(rhPCR)以检测突变体文库中的突变体
RNase H2依赖性PCR(rhPCR)(Dobosy等人,2011)可通过利用所谓的“封闭引物”提高PCR扩增的特异性。这些引物含有单个核糖核苷酸残基和3'封闭部分,其防止引物在PCR期间延伸。然而,引物可以被RNase H2激活,其然后允许它们在PCR扩增期间延伸。只有当封闭引物与完美匹配结合时,才会发生RNase H2切割。即使只有核苷酸变化的错配也可显著抑制切割。这意味着可以设计封闭引物来特异性地阻断非特异性或不需要的扩增子的扩增,从而提供一种非常灵敏的工具来检测罕见的特异性核苷酸取代。荧光团标记的探针与rhPCR引物的5'末端互补,能够在特定扩增子的rhPCR期间对成功的引物延伸进行定量。
设计了一种独特的rhPCR测定(SNP Genotyping System,IntegratedDNA Technologies)来区分大麦基因的突变等位基因和野生型等位基因。rhPCR突变检测引物与包括NOI的编码序列互补。rhPCR参考检测引物与编码序列互补。rhPCR参考和突变检测引物被另外标记,例如分别用荧光团FAM和Yakima Yellow标记。
使用该测定来筛选起源自M2个体池的子池文库。将纯化的gDNA加入到含有所需试剂的PCR混合物中。使用标准PCR条件对样品进行热循环。在荧光读数器上对反应产物进行定量。
通过比较所有筛选的子池的平均荧光信号与个体子池的荧光信号来分析来自荧光读数器的数据。当个体荧光信号比所有子池的平均荧光信号高至少2倍时,阳性子池被认为是候选物。
显示高于平均荧光信号的荧光的子池被认为含有突变体。为了证实子池中突变体的存在,对所述子池的一部分进行非破坏性DNA分离。在这里,来自个体大麦谷粒的组织样品被取出并在池中进行DNA分析。使用与上述相同的rhPCR测定分析这些DNA池中的每一个。鉴定出荧光信号比剩余DNA池的平均荧光信号高至少2倍的DNA池。这些池中的突变信号证实了所需突变体的存在。
实施例3-低诱变大麦植物的直接测序
我们对一个包含6000株大麦植物的文库(cv.Quench)进行测序。使用0.3mM叠氮化钠使谷粒突变2小时。构建了一个由6000个个体M3穗组成的库。利用每穗一个谷粒进行DNA提取。
我们已经扩增了感兴趣基因的790bp片段,以便分析该基因的645bp的外显子3。分析所有6000个系的扩增子的多态性。我们已经对6000个品系在645bp内鉴定了3个个体突变体。这相当于3/(645x 6000)=每129万bp中有1个突变体,相当于编码区中约24个非同义突变。
这三个突变体对应于以下突变位点:
1.核苷酸G989>A(cDNA)对应于氨基酸变化S330>N(蛋白)
2.核苷酸C1091>T(cDNA)对应于氨基酸变化P364>L(蛋白)
3.核苷酸C858>T(cDNA)不引起氨基酸变化
我们已经扩增了基因AAP3(HvAAP3)的860bp片段,以便分析该基因的648bp的外显子6。分析所有6000个品系的扩增子的多态性。我们已经对6000个品系在648bp内鉴定了3个个体突变体。这相当于每129.6万bp中有1个突变体,相当于编码区中的约24个非同义突变,这相当于99.94%的基因没有非同义突变。
这三个突变体对应于以下突变位点:
4.核苷酸C982>T(cDNA)对应氨基酸变化H328>Y(蛋白)
5.核苷酸G820>A(cDNA)对应氨基酸变化A274>T(蛋白)
6.核苷酸C851>T(cDNA)对应氨基酸变化A284>V(蛋白)
实施例4-筛选在氨基酸通透酶3(HvAAP3)中具有提前终止的大麦突变体
如实施例1所述进行大麦cv.Planet的诱变,以达到130万bp中约1个突变的突变密度,相当于编码区中约24个非同义突变,相当于99.94%的基因不含非同义突变。
参考下面的实施例6,如果需要>94%的成功概率并搜索7个不同的突变,则最佳文库大小为约520.000。因此,如果根据下面的实施例7计算,则培育的再生部分的最佳数量为99.640。
使用检测灵敏度为2000分之一的ddPCR方案进行筛选,大麦的GECN数量为5-6。在此基础上,如下文实施例8中所述计算的理论最大子池大小为363。
因此,筛选了源自于110,000株植物池的374个子池的文库,以鉴定一个阳性子池。因此,每个子池都含有来自约294株植物的M1代谷粒。然后再次筛选该阳性子池的一部分以鉴定突变谷粒。如PCT/EP2017/065516中所述,使用ddPCR进行筛选。搜索的突变是终止密码子,因此7个不同的突变是可接受的。所需突变体之一在HvAAP3的编码序列的位置820处具有从鸟嘌呤到腺嘌呤的核苷酸变化,其可通过国际大麦测序联盟(International BarleySequencing Consortium)在IPK Barley Blast Server上的HORVU.MOREX.r2.7HG0553990.1下获得(2019年9月29日),这引起位置274处的氨基酸变化,从而导致该蛋白序列中的氨基酸从丙氨酸变化为苏氨酸,其可通过国际大麦测序联盟在IPK Barley Blast Server上的HORVU.MOREX.r2.7HG0553990.1下获得(2019年9月29日)。为了鉴定突变体,设计了靶特异性正向引物(CCGGCCGAGAACAAG)、靶特异性反向引物(CGTGGTGGTGGAGAC)、用6-羧基荧光素(FAM)标记的突变特异性检测探针(AGGAAGACAAACCTACTGG)和用六氯荧光素(HEX)标记的参考特异性检测探针(AGGAAGGCAAACCTACTG)。
实施例5-筛选在富含甘氨酸的RNA结合蛋白(HvGR-RBP1)中具有提前终止的大麦突变体
如实施例1中所述进行大麦cv.Paustian的诱变以达到130万bp中约1个突变的突变率,相当于编码区中约25个非同义突变。我们筛选了起源自110,000个M1个体池的374个子池的文库,以鉴定一个阳性子池。然后再次筛选该阳性子池的子部分以鉴定突变谷粒。使用专门为鉴定HvGR-RBP1基因座处所需突变体而设计的引物和探针,如WO 2018/001884中所述采用ddPCR进行筛选。
该突变对应于以下突变位点:核苷酸G54>A(cDNA)对应于氨基酸变化W18(蛋白)。
如实施例1所述进行大麦cv.Planet的诱变,以达到130万bp中约1个突变的突变密度,相当于编码区中约24个非同义突变,相当于99.94%的基因不含非同义突变。
参考下面的实施例6,如果需要>33%的成功概率并搜索1个突变,则最佳文库大小为约520.620。因此,如果根据下面的实施例7计算,则作为开始的再生部分的最佳数量为99.640。
使用检测灵敏度为2000分之一的ddPCR方案进行筛选,大麦的GECN数量为5-6。在此基础上,如下文实施例8中所述计算的理论最大子池大小为363。
因此,筛选了源自于110,000株植物池的374个子池的文库,以鉴定一个阳性子池。因此,每个子池都含有来自约294株M1植物的M1代谷粒。然后再次筛选该阳性子池的一部分以鉴定突变谷粒。如PCT/EP2017/065516中所述,使用ddPCR进行筛选。所需突变体在HvGR-RBP1的编码序列的位置54处具有从鸟嘌呤到腺嘌呤的核苷酸变化,其可通过国际大麦测序联盟在IPK Barley Blast Server上的HORVU.MOREX.r2.6HG0491380.1下获得(2019年9月29日),这引起位置18处的氨基酸变化,从而导致该蛋白序列中的提前终止,其可通过国际大麦测序联盟在IPK Barley Blast Server上的HORVU.MOREX.r2.6HG0491380.1下获得(2019年9月29日)。为了鉴定突变体,设计了靶特异性正向引物(CGCTGCTTCGTCGG)、靶特异性反向引物(GAGCTAAAAGCAGCCTC)、用6-羧基荧光素(FAM)标记的突变特异性检测探针(CTGTCCTGAAACACCGA)和用六氯荧光素(HEX)标记的参考特异性检测探针(CTGTCCTGGAACACCG)。
实施例6
确定最佳文库大小
为了提高鉴定感兴趣的突变体的成功概率,可以考虑各种因素。首先可以优化文库大小的大小。最佳文库大小(OLS)取决于许多因素。如果所需的突变是翻译终止突变体,则可以靶向几个潜在的密码子。这意味着较小的文库可以转化为较高的成功概率。如果所需的突变是特定的核苷酸变化或氨基酸变化的密码子,那么只有一个(有时很少)事件将给出所需的结果,并且优选较大的文库以提高成功概率。
通常,最佳文库大小优选反映需要进行筛选以便鉴定至少一个所需突变体的突变基因组的总量。可使用突变频率(Mf)计算在某个突变基因组文库中鉴定特定突变的概率。如果同时筛选几个突变(例如,如果有几个潜在的同样期望的终止密码子),则概率增加。筛选的突变数量在本文中也称为n。
因此,使用文库大小LS和突变频率Mf的文库以鉴定至少一个所需突变的概率可计算为:
PS=1-MfLS
举例来说,在来自1.000.000株诱变油菜籽植物(每株突变频率为1/500kbp)的M1种子文库中,在目标基因座鉴定至少一个特定核苷酸的概率为0.86,计算如下:
PS=1-(499999/500000)1000000=0.86
该公式还可用于确定为达到一定概率所需的文库的最佳大小。最佳文库大小等于该文库的最大大小,在上面的实施例中其等于1.000.000个独特的基因组。
因此,最佳文库大小可以如下进行计算:
其中
OLS是最佳文库大小;
PS是成功概率,以%表示
Mf是突变频率,且
n是进行筛选的突变的数量。
举例来说,如果文库等于1.497.864个突变基因组,则可以以95%的概率鉴定每株具有1/500kbp的突变频率的植物的文库中至少一个特定核苷酸变化。
可以使用基因组中筛选的核苷酸总数量和筛选的核苷酸数量中鉴定的遗传变体总数量来确定突变频率。因此,突变频率可计算为:
其中
Nnc是核苷酸变化的总数量
Nna是分析的核苷酸数量。
举例来说,如果分析突变基因组和非突变基因组中的1,000,000个核苷酸,并在它们之间鉴定出2个不同的核苷酸,则突变频率为500,000分之一。
实施例7
确定作为开始的再生部分的最佳数量(Np)
最佳文库大小可以如实施例1中所述确定。
然后可以确定用于本发明的方法进行随机诱变的再生部分的最佳数量(ONp)。换言之,ONp等于为了达到预定的成功概率而进行突变的再生部分(例如种子)的最佳数量。最佳ONp可利用最佳文库大小、种系细胞数量(GECN)和材料的发芽率如下进行计算:
其中
OLS是如实施例6中所述计算的最佳文库大小;
Gr是随机诱变后的预期发芽率,以%表示;且
GECN是种系细胞数量。
对于大麦,收获率和发芽率大致相同,因此可以使用发芽率代替收获率来计算ONp。
举例来说,假设平均发芽率为95%且GECN数量为2,则需要对526.315个种子进行突变,以便建立一个包含1.000.000个基因组的文库。
实施例8
确定子池的数量和大小
为了以最有效的方式筛选大型文库,本发明提出了一种多步骤方法,该方法至少包括将初始池划分为子池的步骤,筛选以鉴定包含含有所筛选的突变的再生部分的子池的步骤,随后是在所鉴定的子池中鉴定包含所筛选的突变的特定再生部分的后续步骤。本发明的方法允许在合理的时间框架和工作投入内筛选非常大量的再生部分。
关于确定子池大小的一个主要限制因素是所用筛选方法的检测限。如果检测灵敏度是无穷大的,那么文库的总大小就是最大可能的子池。然而,即使在这种情况下,将总文库(总池)拆分成子池也将更有利,否则总池的每个筛选都产生阳性结果,并且通常将非常困难且耗时地确定对阳性结果负责的个体再生部分。
如果检测灵敏度是Y个基因组中1个基因组,那么最大子池大小原则上是Y。举例来说,如果检测灵敏度是2000个基因组中1个,那么最大子池大小原则上是包含2000个不同基因组的子池。如果每个子池中不同基因组的总数与检测灵敏度相同,则每个基因组需要在所述子池内以大致相等的数量表示。这意味着样品优选以使合并的DNA提取物将导致每种基因型的DNA贡献相等的方式收集。通过将任何给定植物的所有再生部分置于同一个子池中,子池将包含大致相同量的来自每株植物的再生部分。
(基于筛选技术的检测灵敏度确定的)小于最大子池大小的子池的优点是其可以不太均匀,这大大简化了子池的制备。例如,如果建立了一个具有200个个体的池,每个个体贡献10粒种子,则总池由2000粒种子组成。1/2000的检测灵敏度将允许1999粒种子为野生型以及1粒为突变的,以便鉴定它。因此,采用这个池,收获一个个体的少于90%的材料,同时对剩余的199个个体收获相同或更多的种子,仍然能够检测到最终池中的突变体是可行的。
因此,子池应当具有足够的大小来满足特定的检测灵敏度。基于检测灵敏度和非均匀DNA池所需的灵活性量,子池的最终数量可以通过总池的大小(即Np)除以每个子池的植物数量来确定。
本发明的方法一般包括使再生部分生长成成熟植物的步骤,并将来自所述成熟植物的再生部分以某种方式划分为子池,使得来自一株成熟植物的所有再生部分被放置在同一个子池中。以这种方式制备子池确保了子池包含每种基因型的大致相同数量的再生部分。如果植物在每株植物中包含若干种系细胞,则每株成熟植物都贡献了多于一种不同基因型的再生部分。
因此,为给定子池提供再生部分的成熟植物的最大数量(此处称为最大子池大小(SPm))可以如下进行计算:
其中
检测灵敏度为Y分之1;且
GECN是种系细胞的数量
举例来说,如果检测灵敏度为2000分之一,且假设GECN数量为5,则最大子池大小为
如果进行随机诱变的再生部分数量为526,315,且最大子池大小为400,则M1再生部分池应当被划分成至少526,315/400=1315个子池,其中每个子池包含来自400株植物的再生部分。可以优选减小子池的大小,并且因此实际的子池大小(Np)可以小于最佳子池大小(ONp)。
实施例9
确定作为开始的再生部分的最佳数量(Np)的大小和最佳子池大小
有许多植物特异性因素可能限制筛选的池的大小。这些因素可以是:
·储存一定大小的池的成本
·从一定大小的池中鉴定单个植物或其再生部分的难易程度
·从一定大小的池中鉴定单个植物的速度
·鉴定单个植物的成本
所有这些因素都是高度可变的且具有植物特异性。例如,一些作物的个体植物繁殖比筛选成本更高,而其他植物则相反。熟悉特定作物的人将能够判断所有因素并确定总池的合适大小。出于实际而非技术原因,这一大小是池的最大大小。
例如,大植物(例如香蕉植物或树)或具有大果实的植物(例如西瓜)占用大量空间,因此,速率限制因素是可以种植的植物总数。因此,如果植物是西瓜,即使达到最佳文库大小的种子数量可以很高,但该方法可以使用的量也较少。
如果植物在田间种植,通常可以以低成本种植大量植物。因此,繁殖的种子数量不是限制因素。
一个明显的限制因素与每株植物可收获的谷粒数量有关。如果一株植物只产生10个谷粒,且种系细胞的数量为5个,那么每个种系细胞将仅由2个谷粒表示。在自花授粉作物中,只有75%的来自一个种系的谷粒将携带所需的突变,并且;在异花授粉作物中只有50%。如果有必要在任何阶段拆分池,则这个数字就变得很重要。
实施例10
制备DNA样品
一旦产生了子池,本发明的方法将包括制备DNA样品的步骤。通常,通过将整个子池分成随机数量的部分,然后从整个部分制备DNA来制备DNA样品。取决于植物,每个子池将包含一定数量的具有相同基因型的再生部分。该数量将取决于每株成熟植物的再生部分总数(RPp)以及GECN数量。如果GECN数量为1,则子池将包含具有相同基因型的RP个再生部分。
最佳部分大小是其中理论上每种基因型都由一个再生部分表示的部分大小。因此,最佳部分大小可以如下进行计算:
举例来说,以下适用于大麦品种,其平均每株植物包含20个种子,并且其GECN数量为5。因此,每株M1大麦植物将包含每种基因型的20个种子。子池包含成熟大麦植物的所有种子。因此,原则上,给定子池的大麦种子的最佳部分大小(=25%)的随机部分将包括代表每种基因型的1个种子。
实施例11-低诱变率
“低诱变率”因作物而异。特别地,作物的倍性在作物对特定突变处理的反应程度方面起着重要作用(Tsai等人2013)。这也可以基于六倍体、四倍体或二倍体基因组中耐受的突变数量(突变频率)进行观察(Kurowska等人2013)。如上所说明的,突变频率在本文中提供为
由于自交事件通常导致所有杂合突变中25%的损失,M2植物中每个突变的核苷酸数量通常比相应M1植物中每个突变的核苷酸数量低25%。
为了确定低和高诱变率,我们比较了M1植物中不含任何编码突变的基因数量。不含任何编码突变的基因数量基于给定基因组中的基因数量、突变频率和植物蛋白的平均长度(Tiessen等人2012)。在二倍体作物中,数百个基因在用高常规突变剂量处理后可能包含编码突变。相比之下,在常规诱变六倍体基因组中,数千个基因通常包含编码突变。为了构建低诱变文库,二倍体作物中的低诱变率相当于小于M1代中具有非同义突变的基因的0.1%。在多倍体作物(如六倍体小麦)中,低突变频率被认为是小于M1代中具有非同义突变基因的1%。
不含非同义突变的基因%(GFoNSM)可根据以下公式计算:
其中Gn为基因数量,Gl为平均基因长度,Mf为突变频率,且Nsnm为诱变引起的非同义突变的平均数量,用%表示。在这个实施例中,Nsnm为66%。
实施例12
开发诱变的欧洲油菜群体并筛选在芥子醛脱氢酶/松柏醛脱氢酶的基因(REF1)中具有特定突变的突变体
最佳库大小和最佳植物数量
REF1基因在芥子酰胆碱酯(油菜籽中的一种主要抗营养化合物)的生物合成中发挥作用(Emrani等人,2015)。我们的目的是在轻度诱变的欧洲油菜植物文库(即低诱变率)中鉴定REF1敲除。在这种四倍体作物的常规诱变文库中,所有基因中>3.5%的基因含有编码突变。在轻度诱变文库中,所有基因中不到1%的基因含有编码区中的突变。我们使用GBS测序方法来确定我们的群体中突变的数量和突变起源的数量。使用一种可商购GBS测序方法对源自突变的欧洲油菜个体的12株植物进行测序。我们使用以下过滤器进行数据分析:
-从分析中去除未被所有分析样品中至少8个序列读数覆盖的基因座。
-从分析中去除具有如对参考基因组所解释的50个碱基对距离内的额外变化的基因座。
-从分析中去除被确定为异常值的样品。
-当在任意数量的对照样品中基因座显示变化时,忽略分析中的基因座变化。
-忽略分析中来自在25%或更多序列读数中未显示变化的基因座的基因座变化。
-对于在样品组和对照样品中显示变化的基因座,忽略分析中的基因座变化。
-对于在样品组中在多于一个样品中未显示变化的基因座,忽略分析中的基因座变化。
在分析中包括共计6.018.138个基因座。每株植物平均鉴定出65,75个突变,相当于86.607个碱基对中1个突变的平均突变频率。在这组植物中,我们已经鉴定了4个突变起源或遗传有效细胞,即GECN数量为4。该数量可以如下进行计算。在整组12个样品中鉴定的独特突变全都代表了在所有样品来源的亲本植物中发生的突变事件。然后,样品集中独特突变的总和对应于在基因组检查区域中存在于亲本植物中的已鉴定可遗传突变的总和(Sumpar)。
如果所有突变都发生在亲本植物的单个可遗传起源中,则将在所有样品中鉴定出相同的突变,并且整个样品集中独特突变的总和与单个样品中的平均突变之间的比率(avg.sam)将是1。假设样品集中的所有12个样品均源自于不同的突变起源,则该比率将为12,因为所有已鉴定突变都是独特的。
然后可将亲本植物中突变的不同起源数量推导为独特亲本突变的总和与单个样品中的平均突变数量之间的比率。
突变起源=Sumpar/Avgsam
突变起源=272/65,8=4,12我们在12个样品中鉴定出272个独特突变,每个样品的平均突变数量为65.8,相当于突变起源数(或GECN)为4.14。
这一信息可用于确定最佳文库大小,该文库大小给出95%的概率以鉴定至少一个导致REF1中提前终止的核苷酸取代。
为了有95%的概率鉴定出REF1中两个终止密码子中的一个,需要一个包含129,724个个体的文库。为了计算获得包含129,724个基因型的文库需要多少再生部分,我们可以使用以下公式:
在种植油菜籽时,通常播种的植物多于收获的植物,因此油菜籽的收获率相当低,约为17%。对于收获率为17%且GECN数量为4,190.771是待诱变以建立一个文库的最佳种子数量,该文库具有95%的概率鉴定出至少一个导致REF1中提前终止的核苷酸取代。
文库构建和突变体鉴定
制备了欧洲油菜(Brassica napus cv.Epure)的诱变文库。使用PCT/EP2017/065516中描述的合并和拆分方法组织该文库。在室温下用0.25%EMS处理含有200.000个种子的池16小时,并使用标准做法在田间繁殖。在约300株植物的池中收获了34.992株植物。从25%的收获材料中提取DNA并用于文库筛选。
根据PCT/EP2017/065516中描述的ddPCR筛选方法进行突变体鉴定。引物和探针设计用于鉴定REF1基因座处的特定突变体。所需突变体在REF-1的编码序列的位置504处具有从鸟嘌呤到腺嘌呤的核苷酸变化,其可在GenBank登录号NCBI:FN995990.1下获得,这引起位置168处的氨基酸变化,导致了蛋白序列中的提前终止,其可在GenBank登录号NCBI:FN995990.1下获得。为了鉴定突变体,设计了靶特异性正向引物(TATTGGAGTGGTCGGTC)、靶特异性反向引物(CACTTTCATGGCAAACATAAT)、用6-羧基荧光素(FAM)标记的突变特异性检测探针(ATAATCCCTTGAAATTTTCCAAG)和用六氯荧光素(HEX)标记的参考特异性检测探针(ATAATCCCTTGGAATTTTCCAA)。
1.一种用于鉴定在预定靶序列中携带感兴趣的核苷酸[NOI]中的一个或多个突变的预定物种的突变植物的方法,所述方法包括以下步骤:
a)提供所述物种的亲本植物的Np个再生部分,其中Np是>5,000、例如>10,000、例如>15,000、例如>20,000、例如>25,000、例如>30,000的整数;
b)使所述再生部分经受诱变步骤,优选随机诱变步骤,从而产生代表多种基因型的M0代再生部分池;
c)使所述M0代再生部分生长成M1代成熟植物,并从所述成熟植物获得M1代再生部分;
d)任选地,重复前一步骤X次以获得包含M(1+X)代再生部分的M(1+X)代植物;
e)将多个M1代或M(1+X)代植物的再生部分划分为子池,每个子池均包含代表多种基因型的再生部分,其中来自一株给定成熟植物的所有再生部分都放置在同一个子池中;
f)从每个子池制备DNA样品,例如gDNA样品或从mRNA样品获得的cDNA样品;
g)使用灵敏检测手段鉴定包含含有突变的DNA的子池;
h)鉴定包含所述突变的所述子池内的再生部分,从而鉴定所述突变植物,
其中所述诱变步骤导致M1代的再生部分的每个细胞1至30个非同义突变的诱变率。
2.一种用于鉴定在预定靶序列中携带感兴趣的核苷酸[NOI]中的一个或多个突变的预定物种的突变植物的方法,所述方法包括以下步骤:
a)提供所述物种的亲本植物的Np个再生部分,其中Np是至少5,000、例如至少10,000、例如至少15,000、例如至少20,000、例如至少25,000、例如至少30,000的整数;
b)使所述再生部分经受导致低诱变率的诱变步骤,优选随机诱变步骤,从而产生代表多种基因型的M0代再生部分池;
c)使所述M0代再生部分生长成M1代成熟植物,并从所述成熟植物获得M1代再生部分;
d)任选地,重复前一步骤X次以获得包含M(1+X)代再生部分的M(1+X)代植物;
e)将多个M1代或M(1+X)代植物的再生部分划分为子池,每个子池均包含代表多种基因型的再生部分,其中来自一株给定成熟植物的所有再生部分都放置在同一个子池中;
f)从每个子池制备DNA样品,例如gDNA样品或从mRNA样品获得的cDNA样品;
g)使用灵敏检测手段鉴定包含含有突变的DNA的子池;
h)鉴定包含所述突变的所述子池内的再生部分,从而鉴定所述突变植物,
其中,二倍体植物中的低诱变率是在M1代再生部分中,所有基因中平均至少99.8%、优选至少99.9%的所有基因不含非同义突变,且在更高倍性植物中的低诱变率是在M1代再生部分中,所有基因中平均至少98.0%、优选至少99.0%的所有基因不含非同义突变,优选地,其中再生部分是营养组织、种子、谷粒、种子中的种系细胞、所述植物的谷粒或胚、花粉或胚,优选地,再生部分是种子。
3.根据前述项中任一项所述的方法,其中步骤e)通过包括以下步骤的方法来进行:
i.确定子池的最佳大小,其中最大子池大小(SPm)
ii.将所述再生部分划分为子池,其中每个子池均包括来自一定数量的成熟植物的再生部分,所述数量在0.5*SPm至1.1*SPm的范围内,其中来自一株给定成熟植物的所有再生部分都放置在同一个子池中;
其中灵敏检测手段的检测灵敏度是Y分之1,并且其中植物具有GECN的遗传有效细胞数。
4.一种鉴定具有遗传有效细胞数(GECN)的预定植物物种的植物或其再生部分的方法,其中所述植物在靶序列中携带感兴趣的核苷酸[NOI]中的n个预定突变中的至少一个,所述方法采用检测手段以Y分之一的检测灵敏度检测核酸序列,包括以下步骤:
a)提供所述物种的植物的Np个再生部分,其中Np是>1000、例如至少5,000、例如至少10,000、例如至少15,000、例如至少20,000、例如至少25,000、例如至少30,000的整数;
b)使所述再生部分经受诱变步骤,优选随机诱变步骤,从而产生代表多种基因型的M0代再生部分池;
c)使所述M0代再生部分生长成成熟植物,并从所述成熟植物获得M1代再生部分;
d)任选地,重复前一步骤X次以获得包含M(1+X)代再生部分的植物;
e)通过包含以下步骤的方法将所述M1代或M(1+X)代再生部分划分为子池:
i)确定子池的最佳尺寸,其中最大子池尺寸(SPm)
ii)将所述再生部分划分为子池,其中每个子池均包含来自一定数量的成熟植物的再生部分,所述数量在0.5*SPm至1.1*SPm的范围内,其中来自一株给定成熟植物的所有再生部分都放置在同一个子池中;
f)从每个子池制备DNA样品,例如gDNA样品或cDNA样品;
g)使用所述检测手段鉴定包含含有突变的再生部分的子池;
h)鉴定包含所述突变的所述子池内的再生部分,从而鉴定所述突变植物。
5.根据第3至4项所述的方法,其中,用于检测核酸序列的检测手段是灵敏检测手段。
6.根据前述项中任一项所述的方法,其中每个子池均包含来自0.5*SPm至SPm范围内的成熟植物的再生部分。
7.根据前述项中任一项所述的方法,其中每个子池均包含来自0.7*SPm到SPm范围内的成熟植物的再生部分。
8.根据前述项中任一项所述的方法,其中Np在0.7*ONp至1.3*ONp的范围内,其中并且
其中Hr是所述植物物种在诱变后的预期平均收获率,以%计;且
OLS是最佳文库大小,其中
其中PS是成功概率,以%表示;且
Mf是突变频率;且
n是筛选的突变数量;并且
其中步骤b)包括导致Mf的诱变频率的随机诱变步骤。
9.根据第8项所述的方法,其中收获率是诱变后所述植物物种的发芽率,以%表示。
10.根据前述项中任一项所述的方法,其中Np在0.8*ONp至1.2*ONp的范围内。
11.根据前述项中任一项所述的方法,其中Np在0.9*ONp至1.1*ONp的范围内。
12.根据前述项中任一项所述的方法,其中所述再生部分是种子。
13.根据前述项中任一项所述的方法,其中成功概率为至少85%,优选至少90%,更优选至少95%,例如至少98%。
14.根据前述项中任一项所述的方法,其中在步骤a)中提供至少30,000个再生部分,例如在步骤a)中提供至少40,000个再生部分,例如至少50,000个再生部分,例如至少60,000个再生部分,例如至少70,000个再生部分,例如至少80,000个再生部分,例如至少90,000个再生部分,例如至少100,000个再生部分,例如至少200,000个再生部分,例如至少300,000个再生部分,例如至少400,000个再生部分,例如至少500,000个再生部分,例如至少600,000个再生部分,例如至少700,000个再生部分,例如至少800,000个再生部分,例如至少900,000个再生部分,例如至少106个再生部分,2×106个再生部分,例如至少3×106个再生部分,例如至少4×106个再生部分,例如至少5×106个再生部分,例如至少6×106个再生部分,例如至少7×106个再生部分,例如至少8×106个再生部分,例如至少9×106个再生部分,例如至少107个再生部分或更多。
15.根据前述项中任一项所述的方法,其中诱变率是每1000个基因最多1个突变,例如每5000个基因最多1个突变,例如每10000个基因最多1个突变,例如每20000个基因最多1个突变,例如每30000个基因最多1个突变。
16.根据前述项中任一项所述的方法,其中所述诱变导致M1代植物的编码区中最多25个非同义突变,例如编码区中最多20个非同义突变,例如编码区中最多15个非同义突变,例如编码区中最多10个非同义突变,例如编码区中最多5个非同义突变,例如编码区中1个非沉默突变。
17.根据前述项中任一项所述的方法,其中所述植物是二倍体植物并且所述低诱变率是至多500,000分之1、例如至多750,000分之1、例如至多1,000,000分之1的突变频率。
18.根据前述项中任一项所述的方法,其中所述植物是四倍体植物并且所述低诱变率是至多70,000分之1、例如至多100,000分之1、例如至多300,000分之1的突变频率。
19.根据前述项中任一项所述的方法,其中所述植物是六倍体植物并且所述低诱变率是至多40,000分之1、例如至多80,000分之1、例如至多200,000分之1的突变频率。
20.根据前述项中任一项所述的方法,其中诱变是化学诱变或辐射诱导的诱变。
21.根据前述项中任一项所述的方法,其中诱变是用诱变化学品例如选自下组的诱变化学品进行的化学诱变:叠氮化钠(NaN3)、乙烯亚胺、羟胺(NH2OH)、N-甲基-N'-硝基-N-亚硝基胍(MNNG)、重氮甲烷、甲基亚硝基胍(MNNG)和甲磺酸乙酯(EMS)以及烷化剂,例如磺酸酯,例如甲磺酸乙酯(EMS)、硫酸二乙酯(DES)或N-乙基-N-亚硝基脲(ENU),或例如硫芥,例如乙基-2-氯乙基硫醚,或例如氮芥,例如2-氯乙基二甲胺,或例如环氧化物,例如环氧乙烷。
22.根据前述项中任一项所述的方法,其中使用叠氮化钠进行随机诱变的步骤,优选以1mM或更小的浓度进行2小时或更短的时间,例如0.9mM或更小,例如0.8mM或更小,例如0.7mM或更小,例如0.6mM或更小,例如0.5mM或更小,例如0.4mM或更小,例如0.3mM或更小。
23.根据第1至21项中任一项所述的方法,其中使用EMS进行随机诱变的步骤,优选以4%或更小的浓度进行2小时或更短的时间,例如3%或更小,例如2%或更小,例如1.5%或更小,例如1%或更小,例如0.75%或更小,例如0.5%或更小,例如0.4%或更小,例如0.3%或更小,例如0.2%或更小,例如0.1%或更小,例如0.1%持续24小时或更短的时间。
24.根据前述项中任一项所述的方法,其中诱变在如下条件下进行:使得至少90%的再生部分在诱变步骤中存活,例如至少91%的再生部分,例如至少92%的再生部分,例如至少93%的再生部分,例如至少94%的再生部分,例如至少95%的再生部分,例如至少96%的再生部分,例如至少97%的再生部分,例如至少98%的再生部分,或例如至少99%的再生部分在诱变步骤中存活。
25.根据前述项中任一项所述的方法,其中所述突变植物具有与亲本植物相同的表型,但不包括由靶序列中的突变引起的表型性状。
26.根据前述项中任一项所述的方法,其中所述突变植物的外观、高度、生物量、产量、谷粒大小、适合度、叶形和味道中的一种或多种与亲本植物相同,优选所述突变植物的外观、高度、生物量、叶形和味道全部都与亲本植物相同。
27.根据前述项中任一项所述的方法,其中所述突变植物的(作物)产量相当于亲本植物的总(作物)产量的至少90%,例如至少91%,例如至少92%,例如至少93%,例如至少94%,例如至少95%,例如至少96%,例如至少97%,例如至少98%,例如至少99%,例如至少100%,例如至少105%,例如至少110%,例如至少125%,例如至少150%,例如至少175%,例如至少200%,或更多。
28.根据前述项中任一项所述的方法,其中所述突变植物的谷粒品质与亲本植物的谷粒品质基本上相同或更高。
29.根据前述项中任一项所述的方法,其中感兴趣的突变以相当于每150万株植物1个突变的频率发生。
30.根据前述项中任一项所述的方法,其中在步骤c)中获得至少5,000个再生部分,例如至少10,000个再生部分,例如至少15,000个再生部分,例如至少20,000个再生部分,例如至少25,000个再生部分,例如至少30,000个再生部分,例如至少40,000个再生部分,例如至少50,000个再生部分,例如至少60,000个再生部分,例如至少70,000个再生部分,例如至少80,000个再生部分,例如至少90,000个再生部分,例如至少100,000个再生部分,例如至少200,000个再生部分,例如至少300,000个再生部分,例如至少400,000个再生部分,例如至少500,000个再生部分,例如至少600,000个再生部分,例如至少700,000个再生部分,例如至少800,000个再生部分,例如至少900,000个再生部分,例如至少106个再生部分,例如至少106株成熟植物,例如2×106株成熟植物,例如至少3×106株成熟植物,例如至少4×106株成熟植物,例如至少5×106株成熟植物,例如至少6×106株成熟植物,例如至少7×106株成熟植物,例如至少8×106株成熟植物,例如至少9×106株成熟植物,例如至少107株成熟植物。
31.根据前述项中任一项所述的方法,其中所述M0代再生部分的生存力等于或大于步骤a)中提供的再生部分的生存力。
32.根据前述项中任一项所述的方法,其中所述突变植物的不育性低于30%。
33.根据前述项中任一项所述的方法,其中植物为作物植物或开花植物,例如属于十字花科、豆科、禾本科、苋科、菊科、茄科、茜草科或兰科的植物。
34.根据前述项中任一项所述的方法,其中植物选自谷类、豆类和十字花科。
35.根据前述项中任一项所述的方法,其中植物是大麦。
36.根据前述项中任一项所述的方法,其中植物物种的每株植物平均再生部分数量为RPp,并且其中步骤f)包括:
i.将每个子池随机分成多个部分,其中第一部分包括子池的至/>范围内的再生部分;并且其中所述第一部分包括最多50%的所述再生部分;
ii.制备每个子池的整个第一部分的DNA样品。
37.根据前述项中任一项所述的方法,其中步骤f)包括以下步骤:
-将每个子池分成多个部分;
-制备每个子池的一个整个部分的DNA样品,例如gDNA样品或从mRNA样品获得的cDNA样品。
38.根据前述项中任一项所述的方法,其中通过将每个子池分成至少2个部分,例如至少3个部分,例如至少4个部分,并从每个子池的一个整个部分制备DNA样品来进行步骤f)。
39.根据前述项中任一项所述的方法,其中步骤f)包括获得包含每个子池中10%至50%再生部分的部分,并从每个子池的一个整个部分制备DNA样品。
40.根据前述项中任一项所述的方法,其中检测手段或灵敏检测手段具有至多1000分之1的检测灵敏度,例如1000至10,000分之1的检测灵敏度,例如1000至5000分之1的检测灵敏度。
41.根据前述项中任一项所述的方法,其中对于每个子池,步骤g)包括以下步骤:
-进行一个或多个PCR扩增,包括来自子池的所述部分的DNA样品;一组或多组引物,每组引物均位于靶序列的侧翼;和PCR试剂,从而扩增靶序列;
-检测包含靶序列的PCR扩增产物,所述靶序列包含NOI中的一个或多个突变。
42.根据第41项所述的方法,其中将所述一个或多个PCR扩增分成多个空间分离的区室。
43.根据第42项所述的方法,其中所述空间分离的区室是液滴,例如水-油乳液液滴。
44.根据第43项所述的方法,其中每个液滴具有0.1至10nL的平均体积。
45.根据第42至44项中任一项所述的方法,其中每个PCR被区室化为1000至100,000个空间分离的区室。
46.根据第41至45项中任一项所述的方法,其中PCR试剂包含一个或多个突变检测探针,其中每个突变检测探针都包含任选地连接到可检测手段的寡核苷酸,其中所述寡核苷酸与包括NOI的预定突变的靶序列相同或互补。
47.根据第41至46项中任一项所述的方法,其中PCR试剂包含一个或多个参考检测探针,其中每个参考检测探针都包含任选地连接到可检测手段的寡核苷酸,其中所述寡核苷酸与包括参考NOI的靶序列相同或互补。
48.根据第47项所述的方法,其中突变检测探针与荧光团和猝灭剂连接,且参考检测探针与不同的荧光团和猝灭剂连接。
49.根据第47至48项中任一项所述的方法,其中PCR试剂包含相对于参考检测探针至少2倍过量的突变检测探针。
50.根据第40至49项中任一项所述的方法,其中PCR是RNase H依赖性PCR。
51.根据前述项中任一项所述的方法,其中步骤a)的诱变是随机诱变。
52.根据前述项中任一项所述的方法,其中在步骤b)中获得具有不同基因型的106个M0代再生部分,例如至少2×106个再生部分,例如至少3×106个再生部分,例如至少4×106个再生部分,例如至少5×106个再生部分,例如至少6×106个再生部分,例如至少7×106个再生部分,例如至少8×106个再生部分,例如至少9×106个再生部分,例如至少107个再生部分或更多。
53.根据前述项中任一项所述的方法,其中所述方法包括繁殖池内的生物体或其再生部分的步骤,并且其中所述繁殖步骤可以与将生物体划分为子池的步骤e)同时进行或在该步骤e)之后进行。
54.根据前述项中任一项所述的方法,其中所述方法包括获得M(1+X)代植物的步骤,其中给定M0代植物的所有后代的所有再生部分被放置在同一个子池中。
55.根据前述项中任一项所述的方法,其中在鉴定的子池中鉴定再生部分的步骤包括以下步骤:
i)使再生部分生长成植物
ii)从每个所述植物制备DNA样品
iii)鉴定包含该突变的植物。
56.根据前述项中任一项所述的方法,其中步骤e)的再生部分为M2代。
57.根据前述项中任一项所述的方法,其中步骤h)包括以下步骤:
-提供包含植物的多个再生部分的子池,其中所述子池包含含有NOI的一个或多个突变的再生部分;
-将所述子池的再生部分划分为次级子池;
-获得来自次级子池的每个再生部分的样品-以使再生部分保持足够完整以发育成植物的方式-并合并来自每个次级子池的所有再生部分的所有样品;
-从所述合并的样品制备DNA样品;
-鉴定包含含有所述突变的DNA的次级子池。
58.根据第57项所述的方法,其中所述样品通过在再生部分、优选种子中钻孔,随后收集所获得的面粉而获得。
59.根据第57至58项中任一项所述的方法,还包括以下步骤:
-提供所鉴定的次级子池,其包含含有NOI中的突变的再生部分,其中再生部分是种子;
-培育所述次级子池内的所有种子以允许发芽,并且任选地从每个种子发育成植物;
-从每个发芽的种子获得样品;
-测试所述样品是否存在NOI中的突变,从而鉴定携带NOI中的突变的植物;
-任选地,使所述植物生长至成熟。
60.根据第59项所述的方法,其中该方法还包括在步骤f)之后进行的以下步骤:
-从每个子池获得每个DNA样品的一部分;
-将多个部分合并成超级池,从而获得包含来自多个子池的DNA样品的DNA超级池,其中来自每个子池的DNA仅存在于一个超级池中;
-进行多个PCR扩增,每个PCR扩增均包括DNA样品超级池,其中每个PCR扩增包括多个区室化PCR扩增,每个区室化PCR扩增均包含所述DNA样品的一部分;一组或多组引物,每组均位于靶序列侧翼;和PCR试剂,从而扩增靶序列;
-检测包含含有NOI中的突变的一个或多个靶序列的PCR扩增产物,从而鉴定包含所述突变的超级池。
61.根据第60项所述的方法,其中仅对来自包含突变之一的子池的DNA样品进行PCR扩增。
62.根据第60至61项中任一项所述的方法,其中制备5至100个超级池。
63.根据第60至62项中任一项所述的方法,其中通过包括以下步骤的方法进行包含DNA样品超级池的PCR扩增:
-准备PCR扩增,其包括DNA样品;一组或多组引物,每组引物均位于靶序列侧翼;和PCR试剂;
-将所述PCR扩增分成多个空间分离的区室,其中每个区室具有0.1至10pL的平均体积;
-进行PCR扩增;
-检测PCR扩增产物。
64.根据第60至63项中任一项所述的方法,其中PCR是RNase H依赖性PCR。
65.根据第60至64项中任一项所述的方法,其中每个PCR被区室化为至少1,000,000个区室,例如空间分离的区室。
66.根据第60至65项中任一项所述的方法,其中,所述空间分离的区室是液滴,例如水-油乳液液滴。
67.根据前述项中任一项所述的方法,其中所述突变是预定多肽中的预期功能丧失突变,并且筛选的预期突变数为所述多肽的氨基酸数量的5%。
68.根据前述项中任一项所述的方法,其中筛选的突变数(n)为1。
69.根据前述项中任一项所述的方法,其中突变是单个核苷酸的取代。
70.根据前述项中任一项所述的方法,其中所述方法是鉴定靶序列中的一个预定突变的方法,并且所述方法仅使用位于所述靶序列侧翼的一组引物。
71.根据第41至70项中任一项所述的方法,其中PCR试剂包含仅一个突变检测探针。
72.根据前述项中任一项所述的方法,其中再生部分是营养组织、种子、谷粒、种子中的种系细胞、所述植物的谷粒或胚、花粉或胚,优选地,再生部分是种子。
参考文献
Chen et al.(2018)CRISPR-Cas12a target binding unleashesindiscriminate single-stranded DNAse activity.Science 27:436-439
Dobosy et al.(2011)RNase H-dependent PCR(rhPCR):improved specificityand single nucleotide polymorphism detection using blocked cleavableprimers.BMC Biotechnology 11,80
Emrani et al.(2015)Reduction in sinapine content in rapeseed(Brassicanapus L.)by induced mutations in sinapine biosyntheis genes.MolecularBreeding.35.1-11.10.1007/s11032-015-0236-2.
Hindson et al.(2011).High-throughput droplet digital PCR system forabsolute quantitation of DNA copy number.Anal Chem 83:8604–8610].
Kleinhofs et al.(1978)Induction and selection of specific genemutations in Hordeum and Pisum.Mut.Res.51:29-35,1978.
Kurowska et al-(2011)TILLING:a shortcut in functional genomics.J ApplGenet.doi:10.1007/s13353-011-0061-1
Lu et al.(2017)Genome-wide Targeted Mutagenesis in Rice Using theCRISPR/Cas9 system.Mol Plant.2017Sep 12;10(9):1242-1245.
Nazarenko et al.(1997)A closed tube format for amplification anddetection of DNA based on energy transfer.Nucl.Acids Res.1997,25:2516-2521
Rédei GP and Koncz C(1992).Classical mutagenesis.In:Koncz C et al.(eds.):Methods in Arabidopsis research,Chapter 2
Szurman-Zubrzycka et al.(2018)HorTILLUS-A Rich and Renewable Sourceof Induced Mutations for Forward/Reverse Genetics and Pre-breeding Programsin Barley(Hordeum vulgare L.).Front Plant Sci.2018Feb 21;9:216.
Tiessen et al.(2012)Mathematical modeling and comparison of proteinsize distribution in different plant,animal,fungal and microbial speciesreveals a negative correlation between protein size and protein number,thusproviding insight into the evolution of proteomes.BMC Res Notes.doi:10.1186/1756-0500-5-85
Tsai et al.(2013)Production of a high-efficiency TILLING populationthrough polyploidization.Plant Physiol.doi:10.1104/pp.112.213256
Tyagi et al.(1998)Multicolor molecular beacons for allelediscrimination.Nature Biotechnology 16:49-53
Whitcombe et al.(1999)Detection of PCR products using selfprobingamplicons and fluorescence.Nature Biotechnol.1999,August 17(8):804-7.
US 6,326,145
US 7,838,053
WO 2018/001884
序列表
<110> 嘉士伯有限公司(Carlsberg A/S)
<120> 制备突变植物的方法
<130> P5355PC00
<160> 12
<170> PatentIn version 3.5
<210> 1
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 1
ccggccgaga acaag 15
<210> 2
<211> 15
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 2
cgtggtggtg gagac 15
<210> 3
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 探针
<400> 3
aggaagacaa acctactgg 19
<210> 4
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 探针
<400> 4
aggaaggcaa acctactg 18
<210> 5
<211> 14
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 5
cgctgcttcg tcgg 14
<210> 6
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 6
gagctaaaag cagcctc 17
<210> 7
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 探针
<400> 7
ctgtcctgaa acaccga 17
<210> 8
<211> 16
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 探针
<400> 8
ctgtcctgga acaccg 16
<210> 9
<211> 17
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 9
tattggagtg gtcggtc 17
<210> 10
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 引物
<400> 10
cactttcatg gcaaacataa t 21
<210> 11
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 探针
<400> 11
ataatccctt gaaattttcc aag 23
<210> 12
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 探针
<400> 12
ataatccctt ggaattttcc aa 22

Claims (54)

1.一种制备突变植物的方法,所述方法包括以下步骤:
a)提供物种的亲本植物的Np个再生部分,其中Np是至少5,000的整数倍,其中Np在0.7*ONp至1.3*ONp的范围内,
其中并且其中Hr是所述植物物种在诱变后的预期平均收获率,以%表示,并且其中GECN是指遗传有效细胞数;且
OLS是最佳文库大小,其中
其中PS是成功概率,以%表示;且
n是筛选的突变数量;并且
Mf是步骤b)的随机诱变率;
b)使所述再生部分经受导致低诱变率的诱变步骤,从而产生代表多种基因型的M0代再生部分池;
c)使所述M0代再生部分生长成M1代成熟植物,并从所述成熟植物获得M1代再生部分;
d)任选地,重复前一步骤X次以获得包含M(1+X)代再生部分的M(1+X)代植物;
e)将多个M1代或M(1+X)代植物的再生部分划分成子池,每个子池均包含代表多种基因型的再生部分,其中来自一株给定成熟植物的所有再生部分都放置在同一个子池中,并且其中该步骤还包括:
i.确定子池的最佳大小,其中最大子池大小SPm=Y/GECN,
ii.将所述再生部分划分为子池,其中每个子池均包括来自一定数量的成熟植物的再生部分,所述数量在0.5*SPm至1.1*SPm的范围内,其中来自一株给定成熟植物的所有再生部分都放置在同一个子池中;
其中灵敏检测手段的检测灵敏度为Y分之1,并且其中植物具有GECN的遗传有效细胞数;
f)从每个子池制备DNA样品,其中制备DNA样品的步骤包括以下步骤:
·将每个子池分成多个部分;
·制备每个子池的一个部分的DNA样品;
g)使用灵敏检测手段鉴定包含含有所述突变的DNA的子池;
h)鉴定包含所述突变的所述子池内的再生部分,从而鉴定所述突变植物,
其中二倍体植物中的低诱变率是在M1代再生部分中,所有基因的平均至少99.8%不含非同义突变,并且较高倍性植物中的低诱变率是在M1代再生部分中,所有基因的平均至少98.0%不含非同义突变。
2.根据权利要求1所述的方法,其中步骤f)的DNA样品为gDNA样品或从mRNA样品获得的cDNA样品。
3.根据权利要求1所述的方法,其中二倍体植物中的低诱变率是在M1代再生部分中,所有基因的平均至少99.9%不含非同义突变,并且较高倍性植物中的低诱变率是在M1代再生部分中,所有基因的平均至少99.0%不含非同义突变。
4.根据权利要求1所述的方法,其中所述再生部分是营养组织。
5.根据权利要求1所述的方法,其中所述再生部分是种子、种子中的种系细胞、花粉或胚。
6.根据权利要求1所述的方法,其中所述再生部分是谷粒。
7.根据权利要求1所述的方法,其中所述诱变率是每1000个基因最多1个突变。
8.根据权利要求1所述的方法,其中所述诱变率是每10000个基因最多1个突变。
9.根据权利要求1所述的方法,其中所述诱变率是每20000个基因最多1个突变。
10.根据权利要求1所述的方法,其中所述诱变率是每30000个基因最多1个突变。
11.根据权利要求1所述的方法,其中所述诱变导致M1代植物的编码区中最多25个非同义突变。
12.根据权利要求1所述的方法,其中所述诱变导致M1代植物的编码区中最多15个非同义突变。
13.根据权利要求1所述的方法,其中所述诱变导致M1代植物的编码区中最多5个非同义突变。
14.根据权利要求1所述的方法,其中所述诱变是辐射诱导的诱变或用诱变化学品进行的化学诱变。
15.根据权利要求14所述的方法,其中所述诱变化学品选自:叠氮化钠、羟胺和烷化剂。
16.根据权利要求15所述的方法,其中烷化剂选自:乙烯亚胺、重氮甲烷、甲基亚硝基胍和甲磺酸乙酯。
17.根据权利要求14所述的方法,其中诱变化学品是叠氮化钠。
18.根据权利要求14所述的方法,其中诱变化学品是叠氮化钠,以0.3mM的浓度进行2小时,并且其中所述再生部分来自大麦Hordeum vulgare。
19.根据权利要求15所述的方法,其中烷化剂是磺酸酯,N-乙基-N-亚硝基脲,硫芥,氮芥,或环氧化物。
20.根据权利要求15所述的方法,其中烷化剂是甲磺酸乙酯或硫酸二乙酯。
21.根据权利要求15所述的方法,其中烷化剂是乙基-2-氯乙基硫醚。
22.根据权利要求15所述的方法,其中烷化剂是2-氯乙基-二甲胺。
23.根据权利要求15所述的方法,其中烷化剂是环氧乙烷。
24.根据权利要求20所述的方法,其中烷化剂是甲磺酸乙酯。
25.根据权利要求20所述的方法,其中烷化剂是甲磺酸乙酯,以0.25%进行16小时,并且其中所述再生部分来自欧洲油菜Brassica napus。
26.根据权利要求1所述的方法,其中所述突变植物具有与亲本植物相同的表型,但不包括由靶序列中的突变引起的表型性状。
27.根据权利要求1所述的方法,其中诱变以相当于每150万株植物1个突变的频率发生。
28.根据权利要求1所述的方法,其中Np在0.8*ONp至1.2*ONp的范围内。
29.根据权利要求1所述的方法,其中Np在0.9*ONp至1.1*ONp的范围内。
30.根据权利要求1所述的方法,其中所述成功概率为至少85%。
31.根据权利要求1所述的方法,其中所述成功概率为至少95%。
32.根据权利要求1所述的方法,其中在步骤c)中获得至少5,000个再生部分。
33.根据权利要求1所述的方法,其中在步骤c)中获得至少50,000个再生部分。
34.根据权利要求1所述的方法,其中在步骤c)中获得至少100,000个再生部分。
35.根据权利要求1所述的方法,其中在步骤c)中获得至少500,000个再生部分。
36.根据权利要求1所述的方法,其中在步骤c)中获得至少106个再生部分。
37.根据权利要求1所述的方法,其中在步骤c)中获得至少106株成熟植物。
38.根据权利要求1所述的方法,其中在步骤c)中获得至少107株成熟植物。
39.根据权利要求1所述的方法,其中所述植物为作物植物。
40.根据权利要求1所述的方法,其中所述植物为开花植物。
41.根据权利要求1所述的方法,其中所述植物属于十字花科Brassicaceae、豆科Fabaceae、禾本科Poaceae、苋科Amaranthaceae、菊科Asteraceae、茄科Solanaceae、茜草科Rubiaceae或兰科Orchidaceae。
42.根据权利要求1-41中任一项所述的方法,其中所述植物物种具有RPp的每株植物平均再生部分数量,并且其中步骤f)包括
i.将每个子池随机划分为多个部分,其中第一部分包含子池的至/>范围内的再生部分;并且其中所述第一部分包含最多50%的所述再生部分;
ii.制备每个子池的整个第一部分的DNA样品。
43.根据权利要求1-41中任一项所述的方法,其中通过将每个子池分成至少2个部分,并从每个子池的一个部分制备DNA样品来进行步骤f)。
44.根据权利要求1-41中任一项所述的方法,其中通过将每个子池分成至少4个部分,并从每个子池的一个部分制备DNA样品来进行步骤f)。
45.根据权利要求1-41中任一项所述的方法,其中步骤f)包括获得包含每个子池的10%至50%范围内的再生部分的部分,并从每个子池的部分制备DNA样品。
46.根据权利要求1-41中任一项所述的方法,其中对于每个子池,步骤g)包括以下步骤:
-进行一个或多个PCR扩增,其包括来自子池的所述部分的DNA样品;一组或多组引物,每组引物均位于靶序列侧翼;和PCR试剂,从而扩增靶序列;
-检测包含靶序列的PCR扩增产物,所述靶序列包含一个或多个突变。
47.根据权利要求1-41中任一项所述的方法,其中在步骤b)中获得具有不同基因型的至少106个M0代再生部分。
48.根据权利要求1-41中任一项所述的方法,其中在步骤b)中获得具有不同基因型的至少5×106个M0代再生部分。
49.根据权利要求1-41中任一项所述的方法,其中在步骤b)中获得具有不同基因型的至少107个M0代再生部分。
50.根据权利要求1-41中任一项所述的方法,其中所述方法包括繁殖所述池内的生物体或其再生部分的步骤,并且其中所述繁殖步骤可以与将生物体划分为子池的步骤e)同时或在其之后进行,和/或其中步骤e)的再生部分为M2代。
51.根据权利要求1-41中任一项所述的方法,其中步骤h)包括以下步骤:
-提供包含植物的多个再生部分的子池,其中所述子池包含含有一个或几个突变的再生部分;
-将所述子池的再生部分划分为次级子池;
-以使所述再生部分保持足够完整以发育成植物的方式从次级子池的每个再生部分获得样品,并合并来自每个次级子池的所有再生部分的所有样品;
-从所述合并的样品制备DNA样品;
-鉴定包含含有突变的DNA的次级子池。
52.根据权利要求51所述的方法,其还包括以下步骤:
-提供所鉴定的次级子池,其包含含有突变的再生部分,其中所述再生部分是种子;
-培育所述次级子池内的所有种子以允许发芽,并且任选地从每个种子发育成植物;
-从每个发芽的种子获得样品;
-测试所述样品是否存在突变,从而鉴定携带突变的植物;
-任选地,使所述植物生长至成熟。
53.根据权利要求52所述的方法,其中所述方法还包括在步骤f)之后进行的以下步骤:
-从每个子池获得每个DNA样品的一部分;
-将多个部分合并成超级池,从而获得包含来自多个子池的DNA样品的DNA超级池,其中来自每个子池的DNA仅存在于一个超级池中;
-进行多个PCR扩增,每个PCR扩增均包含DNA样品超级池,其中每个PCR扩增均包括多个区室化PCR扩增,每个区室化PCR扩增均包含所述DNA样品的一部分;一组或多组引物,每组引物均位于靶序列的侧翼;和PCR试剂,从而扩增靶序列;
-检测包含一个或多个靶序列的PCR扩增产物,所述靶序列包含突变,从而鉴定包含所述突变的超级池。
54.根据权利要求53所述的方法,其中仅对来自包含所述突变之一的子池的DNA样品进行PCR扩增。
CN202080085516.4A 2019-10-10 2020-10-08 制备突变植物的方法 Active CN114786473B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP19202380 2019-10-10
EP19202380.2 2019-10-10
PCT/EP2020/078321 WO2021069614A1 (en) 2019-10-10 2020-10-08 Methods for preparing mutant plants

Publications (2)

Publication Number Publication Date
CN114786473A CN114786473A (zh) 2022-07-22
CN114786473B true CN114786473B (zh) 2023-12-19

Family

ID=68280685

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080085516.4A Active CN114786473B (zh) 2019-10-10 2020-10-08 制备突变植物的方法

Country Status (11)

Country Link
US (1) US20220312707A1 (zh)
EP (1) EP4040946A1 (zh)
JP (1) JP2023502317A (zh)
CN (1) CN114786473B (zh)
AU (1) AU2020361455A1 (zh)
BR (1) BR112022005455A2 (zh)
CA (1) CA3152086A1 (zh)
IL (1) IL292003A (zh)
MX (1) MX2022004361A (zh)
WO (1) WO2021069614A1 (zh)
ZA (1) ZA202203866B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023170272A1 (en) 2022-03-11 2023-09-14 Carlsberg A/S Modulation of protein levels

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9825698D0 (en) * 1998-06-13 1999-01-20 Zeneca Ltd Methods
WO2000046375A2 (en) * 1999-02-02 2000-08-10 Novozymes Biotech, Inc. Methods for producing polypeptides in fungal cells
WO2001075167A1 (en) * 2000-03-31 2001-10-11 Fred Hutchinson Cancer Research Center Reverse genetic strategy for identifying functional mutations in genes of known sequence
WO2004090146A1 (en) * 2003-04-14 2004-10-21 Finnzymes Oy Delivery of nucleic acids into eukaryotic genomes using in vitro assembled mu transposition complexes
CN1981041A (zh) * 2004-03-11 2007-06-13 卡尔斯伯格公司 产生风味稳定饮料的大麦
CN101801176A (zh) * 2007-09-24 2010-08-11 凯津公司 选择具有特异性突变的植物的方法
CN102202492A (zh) * 2008-10-06 2011-09-28 耶路撒冷希伯来大学伊森姆研究发展有限公司 诱导的杂种优势相关的突变
CN104781421A (zh) * 2012-09-04 2015-07-15 夸登特健康公司 检测稀有突变和拷贝数变异的系统和方法
CN105145366A (zh) * 2015-09-24 2015-12-16 江苏农林职业技术学院 一种沿阶草ems同质突变体库快速构建的方法
CN107488704A (zh) * 2016-06-12 2017-12-19 上海市内分泌代谢病研究所 Cah相关基因靶向二代测序检测方法
WO2018001884A1 (en) * 2016-07-01 2018-01-04 Carlsberg A/S Method to screen for a mutant within a population of organisms by applying a pooling and splitting approach
CN107955835A (zh) * 2017-05-27 2018-04-24 广州市达瑞生物技术股份有限公司 一种检测brca1/2基因突变的引物池及检测方法
CA3087889A1 (en) * 2018-01-10 2019-07-18 Arista Cereal Technologies Pty Ltd High amylose wheat - iv

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3996345A (en) 1974-08-12 1976-12-07 Syva Company Fluorescence quenching with immunological pairs in immunoassays
US4351760A (en) 1979-09-07 1982-09-28 Syva Company Novel alkyl substituted fluorescent compounds and polyamino acid conjugates
US5188934A (en) 1989-11-14 1993-02-23 Applied Biosystems, Inc. 4,7-dichlorofluorescein dyes as molecular probes
GB0127564D0 (en) 2001-11-16 2002-01-09 Medical Res Council Emulsion compositions
CN102405402A (zh) 2008-09-23 2012-04-04 阔达生命有限公司 基于液滴的测定系统
US9005565B2 (en) 2010-06-24 2015-04-14 Hamid-Reza Jahangiri-Famenini Method and apparatus for forming graphene
WO2012139748A1 (en) 2011-04-11 2012-10-18 Roche Diagnostics Gmbh Dna polymerases with improved activity

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9825698D0 (en) * 1998-06-13 1999-01-20 Zeneca Ltd Methods
WO2000046375A2 (en) * 1999-02-02 2000-08-10 Novozymes Biotech, Inc. Methods for producing polypeptides in fungal cells
WO2001075167A1 (en) * 2000-03-31 2001-10-11 Fred Hutchinson Cancer Research Center Reverse genetic strategy for identifying functional mutations in genes of known sequence
WO2004090146A1 (en) * 2003-04-14 2004-10-21 Finnzymes Oy Delivery of nucleic acids into eukaryotic genomes using in vitro assembled mu transposition complexes
CN1981041A (zh) * 2004-03-11 2007-06-13 卡尔斯伯格公司 产生风味稳定饮料的大麦
CN101801176A (zh) * 2007-09-24 2010-08-11 凯津公司 选择具有特异性突变的植物的方法
CN102202492A (zh) * 2008-10-06 2011-09-28 耶路撒冷希伯来大学伊森姆研究发展有限公司 诱导的杂种优势相关的突变
CN104781421A (zh) * 2012-09-04 2015-07-15 夸登特健康公司 检测稀有突变和拷贝数变异的系统和方法
CN105145366A (zh) * 2015-09-24 2015-12-16 江苏农林职业技术学院 一种沿阶草ems同质突变体库快速构建的方法
CN107488704A (zh) * 2016-06-12 2017-12-19 上海市内分泌代谢病研究所 Cah相关基因靶向二代测序检测方法
WO2018001884A1 (en) * 2016-07-01 2018-01-04 Carlsberg A/S Method to screen for a mutant within a population of organisms by applying a pooling and splitting approach
CN109477087A (zh) * 2016-07-01 2019-03-15 嘉士伯有限公司 通过应用混合分裂方法筛选生物群体内突变体的方法
CN107955835A (zh) * 2017-05-27 2018-04-24 广州市达瑞生物技术股份有限公司 一种检测brca1/2基因突变的引物池及检测方法
CA3087889A1 (en) * 2018-01-10 2019-07-18 Arista Cereal Technologies Pty Ltd High amylose wheat - iv

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Helen Tsai等."Discovery of Rare Mutations in Populations: TILLING by Sequencing ".《Plant Physiology》.2011,第156卷(第3期),第1257-1268页. *
Xu Chi等."Discovery of rare mutations in extensively pooled DNA samples using multiple target enrichment".《Plant Biotechnol J》.2014,第12卷(第6期),第709-717页. *
Yunbi Xu等."Whole-genome strategies for marker-assisted plant breeding".《Molecular Breeding 》.2012,第29卷第833–854页. *

Also Published As

Publication number Publication date
ZA202203866B (en) 2024-01-31
EP4040946A1 (en) 2022-08-17
US20220312707A1 (en) 2022-10-06
CA3152086A1 (en) 2021-04-15
WO2021069614A1 (en) 2021-04-15
JP2023502317A (ja) 2023-01-24
AU2020361455A1 (en) 2022-04-21
CN114786473A (zh) 2022-07-22
IL292003A (en) 2022-06-01
BR112022005455A2 (pt) 2022-06-21
MX2022004361A (es) 2022-05-03

Similar Documents

Publication Publication Date Title
AU2019268102B2 (en) Method of identifying a sub-pool comprising a mutant organism
CA2688644A1 (en) Methods for sequence-directed molecular breeding
JP4775945B2 (ja) Pb1遺伝子と連鎖する分子マーカーを指標にイネの穂いもち抵抗性を識別する方法
CN109609687B (zh) 用于检测西瓜枯萎病抗性的kasp标记引物组合及其应用
CA3129544C (en) Methods of determining sensitivity to photoperiod in cannabis
CN114786473B (zh) 制备突变植物的方法
US20190241981A1 (en) Plant breeding using next generation sequencing
US6500616B1 (en) Methods of monitoring genomic integrity and detecting genomic destabilization of plant cells in tissue culture
US20230279508A1 (en) Transgenic corn event zm_bcs216090 and methods for detection and uses thereof
NZ576708A (en) Method for selecting hop line and breeding marker and primer set used for selecting hop line
EA041123B1 (ru) Способ скрининга мутанта в популяции организмов с применением подхода объединения в пулы и разделения
US9631232B2 (en) Recovery of genomic DNA from remnant extracted seed samples
US20220235425A1 (en) Methods of determining sensitivity to photoperiod in cannabis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant