附图描述
图1.使用TALENs靶向的基因敲除TaMLO基因。(a)TALENs靶向的小麦TaMLO同源物的外显子2的保守区域内的位点。MLO-A1、MLO-B1和MLO-D1中TALEN-靶向的序列下划线,并且间隔区中的AvaII限制性位点是GGACC(SEQ ID NO.38)。有三个SNPs,两个在间隔区区域。第一个是分别直接临近下划线的5’区域的C/G/G。第二个是A/C/A,位于接着直接临近AvaII区域的残基C的AvaII区域的3’。第三个位于接近TALEN结合位点的极右侧(倒数第二个3’残基)。(b)在15个代表性的T0转基因小麦植物中PCR/RE测定以检测TALEN-诱导的突变的结果。从独立的幼苗用基因特异的引物扩增的TaMLO基因中鉴定突变。泳道T0-1至T0-15,用AvaII消化的从转基因小麦植物扩增的PCR片段。泳道WT,用或不用AvaII消化的从野生型植物对照扩增的PCR片段。箭头标出的条带由TALEN-诱导的突变导致。(c)通过测序15个代表性的转基因小麦植鉴定株TALEN-诱导的突变体TaMLO等位基因。右侧的数显示突变的类型以及包括多少核苷酸,利用“-”和“+”表明给定核苷酸数量的缺失或插入。
图2.TaMLO功能的损失赋予面包小麦对白粉病的抗性。(a)由在野生型(WT)和各种tamlo突变体的叶片上接种的小麦白粉菌(Bgt)的发芽的孢子的总数形成的小菌落的百分数。在用有毒力的Bgt分离株E09接种后72小时检查至少2,000个发芽的孢子/基因型/实验。值是四次独立实验的平均值±s.d.。**P<0.01(t-检验)。(b)接种后3天在指示的基因型的叶片表面上Bgt的小菌落形成的显微图。白粉病孢子和克隆用考马斯蓝染色。比例尺=200μm.(c)在接种具有Bgt的分离的叶片后7天代表性的WT叶片和指示的mlo突变体的宏观感染表型。比例尺=1cm。(d)野生型(WT)和tamlo-aabbdd突变体植物的疾病症状。在植物中接种后7天拍摄的照片。比例尺=2cm。
图3.在小麦原生质体中的TaMLO位点非同源末端连接(NHEJ)-介导的基因敲入GFP报道基因。(a)GFP供体质粒的结构和GFP基因敲入事件的预期结果。花椰菜花叶病毒(CaMV)35S终止子位于GFP编码序列的下游。该盒侧面有两个T-MLO位点,其通过与共转化的T-MLO质粒重组产生线性结构。显示用于PCR分析基因敲入事件的引物的位置和名称。(b)通过流式细胞术测量小麦原生质体中GFP基因敲入效率。显示三个区的原生质体。将原生质体用以下DNA构建体转染(从左到右):1)T-MLO加上GFP供体质粒;2)单独GFP供体质粒;3)具有由玉米泛蛋白1(Ubi-1)启动子驱动的GFP-表达的阳性对照。流式细胞术用于定量表达GFP的原生质体的百分数。比例尺=100um。(c)5′和3′连接点的测序确认NHEJ-介导的基因敲入事件。5′连接点序列用引物F1和R1进行PCR-扩增,并且3′连接点用引物F2和R2扩增。T-MLO位点下划线。在T-MLO位点中存在内在的SNP。右侧的数表示突变的类型和包括多少核苷酸,利用“-”和“+”分别表明核苷酸缺失和插入。
图4.小麦原生质体中TaMLO基因的TALEN-诱导的靶向的突变。(a)两种核酸酶单体的编码序列从玉米泛蛋白1(Ubi-1)启动子表达并且T2A翻译跳过序列分开。(b)PCR/RE测定的凝胶以检测小麦原生质体中TaMLO基因中的TALEN-诱导的突变。特定引物分别用于扩增TaMLO-A1、TaMLO-B1和TaMLO-D1。在所有三个基因组中发生突变。标记有“1”的泳道,消化的用T-MLO-转化的原生质体;用“2”和“3”标记的泳道,消化和未消化的野生型对照。红色箭头表明具有突变的条带。凝胶底部的数表示插入缺失突变频率,其从条带强度测量。(d)在原生质体的三个MLO同源等位基因中的突变的序列。野生型序列在各个序列组的顶部显示。侧面的数表示突变的类型和包括多少核苷酸。
图5.各种纯合突变体中TaMLO基因组基因座的DNA序列。在T1或T2中鉴定了所有突变体(tamlo-aa、tamlo-bb、tamlo-dd、tamlo-aabb、tamlo-aadd、tamlo-bbdd和tamlo-aabbdd)并且对应的杂合T0系在括号中表明。在各个序列的右侧给出插入缺失的尺寸(+,插入;-,缺失)。纯合突变体的所有不同组合用于评估TALEN-诱导的TaMLO突变对小麦对白粉病的抗性的影响。
图6.TaMLO功能的缺失赋予面包小麦对白粉病的广谱的抗性。(a)用有毒力的小麦白粉菌(Bgt)分离株E22攻毒的植物的叶片。(b)用有毒力的Bgt分离株B13攻毒的植物的叶片。由在野生型(WT)和tamlo-aabbdd(aabbdd)突变体的叶片上接种的Bgt的发芽的孢子的总数形成的小菌落的百分数。在接种后72小时检查至少2000发芽的孢子/基因型/实验。值是四次独立实验的平均值±s.d.。**P<0.01(t-检验)。
图7.用CRISPR-Cas9系统产生TaMLO-A1基因敲除突变体。(a)TaMLO的外显子2中的sgRNA靶位点的示意图。sgMLO-A1靶位点下划线。在20-nt sgRNA靶位点中存在两个SNP,为红色(C/G/G和A/C/A)。(b)T7EI测定检测小麦原生质体中sgMLO-A1-诱导的突变。基因特异的引物(表2)分别用于检测TaMLO-A1、TaMLO-B1和TaMLO-D1中的突变。用“1”标记的泳道,sgRNA:Cas9-转化的原生质体;用“2”标记的泳道,野生型对照。箭头表明由T7E1消化的片段。凝胶下的百分数表示插入缺失突变平吕,其由条带强度测量。TaMLO-A1中的突变的序列显示在凝胶右侧。(c)T7E1测定和DNA测序检测转基因小麦植物中CRISPR-诱导的突变。箭头表示由T7E1消化的片段。TaMLO-A1中突变体的序列显示在凝胶底部。
图8.GFP供体盒的DNA序列。该盒含有GFP编码序列(粗体)和CaMV 35S终止子序列(斜体),并且两侧末端有T-MLO靶序列(下划线)。
图9.载体序列。(a)载体pYP010中UBI-attr1-attr2-Nos的序列:4047bp。下划线的是Ubi-1的序列,attr1和attr2是斜体。Nos以粗体表示。(SEQ ID NO.7)(b)载体pZHY500中TAL-L的序列:2202bp。N末端和C末端的序列下划线。TAL-L以粗体标记。(SEQ ID NO.8)(c)载体pZHY501中TAL-R的序列:2304bp。表明N末端和C末端的序列。TAL-R以粗体标记。(SEQID NO.9)(d)载体pZHY013中TALENs(TAL-L+TAL-R)的序列。斜体的序列是attr1和attr2。N末端和C末端部分的序列以下划线表示。TAL-L和TAL-R为粗体。FokI序列为斜体并下划线。T2A基序下划线并是粗体(SEQ ID NO.10)。
详细描述
现在将进一步描述本发明。在以下段落中,更详细地限定本发明的不同方面。这样限定的各个方面可以与任何其他一个方面或多个方面组合,除非明确相反指示。尤其是,表示为优选或有利的任何特征可以与任何其他表明为优选或有利的一个特征或多个特征组合。
除非另有指示,本发明的实践将使用本领与技术内的植物学、微生物学、组织培养、分子生物学、化学、生物化学和重组DNA技术、生物信息学的常规技术。这样的技术在文献中充分解释。
如本文中使用的,术语″核酸″,″核酸序列″,″核苷酸″,″核酸分子″或″多核苷酸″意在包括DNA分子(例如,cDNA或基因组DNA),RNA分子(例如,mRNA),天然存在的、突变的、合成的DNA或RNA分子和使用核苷酸类似物产生的DNA或RNA的类似物。其可以是单链或双链的。这样的核酸或多核苷酸包括,但不限于,结构基因的编码序列、反义序列、和不编码mRNAs或蛋白产物的非编码调节序列。这些术语还包括基因。术语″基因″、“等位基因”或“基因序列”直接用于指与生物功能相关的DNA核酸。因此,基因可以包括基因组序列中的内含子和外显子,或可以仅包括如在cDNA中的编码序列,和/或可以包括与调节序列组合的cDNA。因此,根据本发明的各个方面,可以使用基因组DNA、cDNA或编码DNA。在一个实施方案中,所述核酸是cDNA或编码DNA。
术语“肽”、″多肽″和″蛋白″在本文中可交替使用并且指任意长度的,通过肽键连接在一起的聚合形式的氨基酸。
为了本发明,″转基因的″,“转基因”或″重组的″意为关于,例如,核酸序列,包含所述核酸序列的表达盒、基因构建体或载体或转化有根据本发明的核酸序列、表达盒或载体的生物,通过重组方法带来的所有那些构建,其中
(a)编码用于本发明的方法的蛋白的核酸序列,或
(b)与根据本发明的核酸序列可操作连接的一个或多个遗传控制序列,例如启动子,或
(c)a)和b)
不位于它们的天然遗传环境或已经通过重组方法修饰。
为了本发明,“突变体”植物是与天然存在的野生型(WT)植物相比改变的植物。具体地,与野生型序列相比,使用本文中所述的诱变方法改变小麦中的各个MLO同源物的内源性核酸序列(野生型核酸序列TaMLO-A1、TaMLO-B1和TaMLO-D1)。这导致内源性Mlo基因的失活并且因此使Mlo功能丧失。这样的植物具有改变的表型并且显示针对Pm的抗性或与野生型植物相比增加的对Pm的抗性。因此,所述抗性由使用靶向的基因组修饰特异靶向的小麦植物基因组中突变的内源性TaMLO-A1、TaMLO-B1和TaMLO-D1基因的存在赋予并且不由小麦中表达的转基因的存在而赋予。
如本文中使用的,野生型核酸序列使用大写字母指出,为TaMLO-A1、TaMLO-B1和TaMLO-D1。突变体mlo核酸序列使用非大写形式,为taml-a1、tamlo-b1、tamlo-d1。本发明的突变体小麦植物包含并表达突变体mlo等位基因。
下调或破坏野生型Mlo序列的功能表达的mlo突变是隐性的,从而它们由野生型序列的表达补充。因此可以通过评估植物对病原体如,例如,白粉病的组成型防御反应和/或易感性水平确定"Mlo功能″。因此,根据本发明,推定的具有Mlo功能的核苷酸序列可以在补充合适的mlo突变体时测试。术语"mlo功能″用于指在植物上赋予mlo突变体表型的序列。因此大写的"Mlo″和非大写的"mlo″用于区分″野生型和突变体″功能。
根据本发明的mlo突变体表型特征在于呈现增加的针对Pm的抗性。换句话说,三倍mlo突变体赋予针对引起Pm的病原体的抗性。
本发明的方面包括靶向的诱变方法,具体是基因组编辑,并且在优选的实施方案中排除了仅基于通过传统育种方法产生植物的实施方案。
在第一个方面,本发明涉及突变体小麦植物,其在TaMLO-A1、TaMLO-B1和/或TaMLO-D1核酸序列中包含功能丧失突变。因此,根据本发明第一方面的突变体小麦植物包含taml-al、tamlo-bl和/或tamlo-dl突变体核酸序列。
在一个实施方案中,本发明涉及突变体小麦植物,其在TaMLO-A1、TaMLO-B1和TaMLO-D1核酸序列中包含功能丧失突变,其中所述突变赋予对白粉病的抗性。因此,所述突变体小麦植物在各个内源性MLO基因中,即在TaMLO-A1、TaMLO-B1和TaMLO-D1的每个中包含功能丧失突变。因此,根据本发明第一方面的突变体小麦植物包含taml-al、tamlo-bl和tamlo-dl突变体核酸序列。这些突变体mlo等位基因的存在赋予Pm抗性。
此种突变体植物显示的Pm抗性因为功能突变丧失由MLO野生型等位基因的失活(功能丧失)引起,导致隐性抗性表型。
在优选的实施方案中,使用靶向的基因组修饰将突变引入野生型TaMLO-A1、TaMLO-B1、和/或TaMLO-D1中,优选小麦植物中的TaMLO-A1,TaMLO-B1和TaMLO-D1核酸序列的每一个中。
在一个实施方案中,所述靶向的基因组修饰包括使用SSNs。这些可以选自ZFNs、TALENs或CRISPR/Cas9。在一个实施方案中,所述SSN选自TALEN。在另一实施方案中,所述SSN选自CRISPR/Cas9。这在下文更详细描述。
TaMLO-A1、TaMLO-B1和TaMLO-D1中的一个、两个或每个中的功能突变丧失可以是相对野生型TaMLO-A1、TaMLO-B1和TaMLO-D1序列的缺失或插入。
本发明的植物包括这样的植物,其中所述植物对于各个突变是杂合的。然而在优选的实施方案中,所述植物对于TaMLO-A1,TaMLO-B1和TaMLO-D1中的每一个中的突变是纯合的。这样的植物可以设计为具有基因型tamlo-aabbdd。也是纯合的子代可以容易地从这些植物产生。
根据本发明的各种方面,野生型TaMLO-A1包含SEQ ID NO.1、其片段或功能变体或由SEQ ID NO.1、其片段或功能变体组成。相应氨基酸序列是SEQ ID NO.4。根据本发明的各个方面,野生型TaMLO-B1包含SEQ ID NO.2、其片段或功能变体或由SEQ ID NO.2、其片段或功能变体组成。相应氨基酸序列是SEQ ID NO.5。根据本发明的各个方面,野生型TaMLO-D1包含SEQ ID NO.3、其片段或功能变体或由SEQ ID NO.3、其片段或功能变体组成。相应氨基酸序列是SEQ ID NO.6。
因此,本发明涉及突变体小麦植物,其在TaMLO-A1、TaMLO-B1和TaMLO-D1中的每一个中包含功能丧失突变,其中所述突变赋予白粉病抗性,其中TaMLO-A1的野生型序列包含SEQ ID NO.1或其cDNA或由SEQ ID NO.1或其cDNA组成,TaMLO-B1的野生型序列包含SEQ IDNO.2或其cDNA或由SEQ ID NO.2或其cDNA组成,并且TaMLO-AD1的野生型序列包含SEQ IDNO.3或其cDNA或由SEQ ID NO.3或其cDNA组成。
如本文中使用的术语“核酸或蛋白序列的功能变体”,例如关于SEQ ID NOs:1,2或3,是指保留完全非变体TaMLO序列的生物功能并且因此用于调节对Pm的反应的变体基因序列或基因序列的部分。功能变体还包括编码具有不影响得到的蛋白的功能的序列改变(例如在非保守残基中)的多肽的研究的基因的变体。还包括的是基本上与如本文中的所示的野生型序列同一(即仅例如在非保守残基具有一些序列改变)的变体并且是有生物活性的。
通常,如通过本领域中已知的序列比对程序确定的,根据本发明的各个方面的特定TaMLO核苷酸或氨基酸序列的变体将与该特定非变体TaMLO核苷酸序列具有至少约80%-99%,例如85%,86%,87%,88%,89%,90%,92%,94%,95%,96%,97%,98%或99%或更多的序列同一性。
此外,本发明的各个方面(包括所述方法和用途)不仅包括TaMLO核酸序列,还包括其片段。″片段″意为核苷酸序列的部分或氨基酸序列的部分,和因此由其编码的蛋白。核苷酸序列的片段可以编码保留天然蛋白的生物活性并且因此用于调节对Pm的反应的蛋白片段。
在一个实施方案中,所述植物在如图5中所示的TaMLO-A1,TaMLO-B1和/或TaMLO-D1或其组合中包含突变。在一个实施方案中,突变如对于tamlo-aabbdd所示的。换句话说,在所述小麦植物中,内源性TaMLO-A1是突变体TaMLO-A1并且包含SEQ ID NO.39,内源性TaMLO-B1是突变体TaMLO-B1并且包含SEQ ID NO.40,并且内源性TaMLO-D1是突变体TaMLO-D1并且包含SEQ ID NO.41。
在一个方面,突变体植物是无TALEN的(参见实施例)。
所述小麦植物选自包括但不限于以下各项的列表:普通小麦(Triticumaestivum),埃塞俄比亚小麦(T.aethiopicum),阿拉拉特小麦(T.araraticum),野生一粒小麦(T.boeoticum),波斯小麦(T.carthlicum),密穗小麦(T.compactum),野生二粒小麦(T.dicoccoides),栽培二粒小麦(T.dicoccum),硬粒小麦(T.durum),依斯帕汗小麦(T.ispahanicum),科尔希二粒小麦(T.karamyschevii),马卡小麦(T.macha),T.militinae,一粒小麦(T.monococcum),波兰小麦(T.polonicum),偃麦小麦(T.repens),斯佩耳特小麦(T.spelta),印度圆粒小麦(T.sphaerococcum),提莫非维小麦(T.timopheevii),东方小麦(T.turanicum),圆锥小麦(T.turgidum),乌拉尔图小麦(T.urartu),瓦维洛夫小麦(T.vavilovii)和茹科夫斯基小麦(T.zhukovskyi)。
根据本文描述的发明的各个方面的另一实施方案,所述植物是物种普通小麦或圆锥小麦的。根据另一优选的实施方案,所述植物属于栽培品种Bobwhite或栽培品种DonPedro。更优选地,选择属于小麦物种普通小麦L.亚种小麦的栽培品种BW208和BW2003(Bobwhite),和属于小麦物种四倍体硬粒小麦(Triticum turgidum L.ssp durum)的品种Don Pedro。
Bobwhite是获自国际玉米和小麦改良中心(International Maize and WheatImprovement Center,CIMMYT)的栽培品种的名称。BW208和BW2003是不同的Bobwhite系。Don Pedro是硬直小麦栽培,也来自CIMMYT。
尤其是,本发明涉及三倍突变体小麦基因型(普通小麦(Triticum aestivum)),指定登录号CGMCC 9322,按布达佩斯条约由北京朝阳区,北辰西路1号(北京100101),中国科学院遗传与发育生物学研究所,高彩霞(Caixia Gao,The Institute of Genetics andDevelopmental Biology Chinese Academy of Sciences,No.1 Beichen West Road,Chaoyang District,Beijing 100101)在2014年6月18日保藏在北京朝阳区,北辰西路1号(北京100101),中国微生物菌种保藏管理委员会普通微生物中心,中国科学院微生物研究所(China General Microbiological Culture Collection Center,Institute ofMicrobiology,Chinese Academy of Sciences,No.1Beichen West Road,ChaoyangDistrict,Beijing 100101)。保藏者的参考名称是Tamlo。本发明因此涉及具有该基因型的任何植物,其部分,包括种子。该突变体在本文中描述为Tamlo-aabbdd(图5)。
根据本发明的三倍体突变体小麦植物显示对Pm的抗性或与对照植物,优选野生型植物相比增加的对Pm的抗性,因为TaMLO-A1,TaMLO-B1,和TaMLO-D1中的突变是下调或破坏野生型Mlo的功能表达的基因敲除(功能缺失)突变。此外,在生物胁迫条件下,与对照植物相比,根据本发明的小麦植物显示增加的产率,其中所述胁迫是Pm。
抗性可以例如通过评估病原体克隆的存活、生长、产率或大小来评估。
术语″增加″,″改善″或″增强″是可交替的。与对照植物相比,产率例如以至少3%,4%,5%,6%,7%,8%,9%或10%,优选至少15%或20%,更优选25%,30%,35%,40%或50%或更多增加。术语″产率″通常意为经济价值的可测量的产生,通常与指定的作物、地区和时期相关。个体植物部分基于它们的数量、大小和/或重量直接促进产率,或实际产率是对于作物和年没平方米的产量,其通过用种植的平方米除以总生产(包括收获的和评估的生产)确定。术语植物的″产率″可以涉及植物生物量(根和/或新枝生物量),该植物的生殖器官,和/或繁殖体(如种子)。因此,根据本发明,产率包括以下各项中的一项或多项并且可以通过评估以下各项中的一项或多项测量:增加的种子产率/植物,增加的种子填充率,增加的填充种子数,增加的收获指数,增加的种皮和/或荚数量,增加的种子大小,增加的生长或增加的分枝,例如具有更多分枝的花序。优选地,产率包括增加的种皮/荚数量和/或增加的分枝。产率相对于对照植物增加。
如本文中使用的对照植物是这样的植物,其未根据本发明的方法修饰。因此,对照植物不具有如本文所述的突变体tamlo核酸序列。在一个实施方案中,对照植物是野生型小麦植物。在另一实施方案中,对照植物是不具有如本文所述的突变体tamlo核酸序列,但另外修饰的植物。对照植物通常是同一植物物种,优选与要评估的植物相同生态型或相同或类似遗传背景。
如本文中使用的术语″植物″包括完全植物、植物的原种和子代以及植物部分,包括种子、果实、新枝、茎、叶片、根(包括块茎)、花和组织以及器官,其中上述的每个包含研究的基因/核酸。术语″植物″还包括植物细胞、悬浮培养物、原生质体、愈伤组织、胚、分生组织区域、蕨类配子体、孢子植物、花粉和小孢子,再次其中上述的每种包含研究的基因/核酸。
本发明还延伸至如上文所述的本发明的突变体植物的可收获部分,如,但不限于种子、叶片、果实、花、茎、根、根茎、块茎和球茎。本发明此外涉及源自,优选直接源自这样的植物的可收获部分的产物,如干燥小球或粉末、油、脂肪和脂肪酸、面粉、淀粉或蛋白。本发明还涉及包含本发明的植物或其部分的食品和食物补充剂。
在一个方面,本发明涉及本发明的突变体小麦植物的种子。从在TaMLO-A1、TaMLO-B1和TaMLO-D1中的每个中对于mlo突变纯合的突变体植物收获的种子是优选的。
在另一实施方案中,本发明提供如本文中所述的可再生突变体植物细胞用于组织培养。所述组织培养优选能够再生基本上具有之前的突变体小麦植物的所有生理和形态特征的植物,和再生基本上具有相同基因型的植物。优选地,这样的组织培养物中所述可再生细胞将是愈伤组织、原生质体、分生细胞、子叶、胚轴、叶片、花粉、胚、根、根尖、花粉囊、雌蕊、新枝、茎、叶柄、花、和种子。更进一步地,本发明提供从本发明的组织培养物再生的小麦植物。
在另一方面,本发明涉及包含SEQ ID NO.39(突变体tamlo-a1)或相应cDNA的分离的核酸。在另一方面,本发明涉及包含SEQ ID NO.40(突变体tamlo-b1)或相应cDNA的分离的核酸。在另一方面,本发明涉及包含SEQ ID NO.41(突变体tamlo-d1)或相应cDNA的分离的核酸。
用于产生突变体植物的方法
在另一方面,本发明涉及用于产生抵抗Pm的突变体小麦植物的方法,其包括使用靶向的基因组修饰在小麦植物中的TaMLO-A1、TaMLO-B1、和/或a TaMLO-D1核酸序列中引入功能丧失突变。
可以将在一个或两个MLO基因中具有功能丧失突变的植物杂交获得功能丧失三倍突变体。例如,可以将通过上述方法获得在TaMLO-A1核酸中具有功能丧失突变的植物与通过上述方法获得的在TaMLO-B1和/或TaMLO-D1中具有功能丧失突变的植物杂交。可以根据需要将得到的双倍突变体与通过上述方法获得的在TaMLO-B1和/或TaMLO-D1中具有功能丧失突变的另一植物以获得三倍体突变体。在另一实施例中,可以将通过上述方法获得的在TaMLO-A1和TaMLO-B1中具有功能丧失突变的植物与通过上述方法获得的在TaMLO-D1中具有功能丧失突变的另一植物杂交。其他组合对于技术人员是显而易见的。所述双倍或单倍突变体可以如图5中所示。.
在本文中描述的方法的一个实施方案中,使用靶向的基因组修饰将功能丧失突变同时引入三种内源性TaMLO基因的每一个中。因此,得到的突变体小麦植物在各个内源性MLO基因,即TaMLO-A1,TaMLO-B1和TaMLO-D1中包含功能丧失突变。突变体植物因此包含突变体tamlo-a1,tamlo-b1和tamlo-d1核酸序列。优选地,得到的突变体小麦植物对于这些突变是纯合的。
靶向的基因组修饰或靶向的基因组编辑是使用靶向的DNA双链断裂(DSBs)以经同源重组(HR)-介导的重组事件刺激基因组编辑的基因组改造技术。为了经引入位点特异的DNADSBs实现有效基因组编辑,可以使用四种主要类型的可定制的DNA结合蛋白:源自微生物移动遗传元件的归巢核酸内切酶(meganuclease),基于真核转录因子的ZF核酸酶,来自黄单胞杆菌的转录激活剂样效应物(TALEs),和来自II型细菌适应性免疫系统CRISPR(规律成簇间隔短回文重复)的RNA-指导的DNA核酸内切酶Cas9。归巢核酸内切酶、ZF和TALE蛋白全部通过蛋白-DNA相互作用识别特定DNA序列。尽管归巢核酸内切酶整合其核酸酶和DNA-结合结构域,ZF和TALE蛋白分别由靶向DNA的3个或1个核苷酸(nt)的个体模块组成。ZF和TALE以所需的组合组装并且连接于FokI的核酸酶结构域,以指导向特定基因组基因座的溶核活性。
在经细菌III型分泌系统递送入宿主细胞中时,TAL效应物进入核,结合宿主基因启动子中效应物特异的序列并且激活转录。其靶向特异性通过串联的33-35个氨基酸重复的中间结构域确定。这接着单个截短的20个氨基酸的重复。检查的多数天然存在的TAL效应物具有12至27个完全重复。
这些重复仅彼此相差两个相邻氨基酸,它们的重复可变双残基(RVD)。确定TAL效应物将识别哪个单个核苷酸的RVD:一个RVD对应于一个核苷酸,四种最常见的RVD各自优先与四种碱基中的一种相关联。天然存在的识别位点均匀地在TAL效应物活性所需的T之后。TAL效应物可以与FokI核酸酶的催化结构域融合以产生TAL效应物核酸酶(TALEN),其使得靶向的DNA双链断裂(DSBs)在体内用于基因组编辑。该技术在基因组编辑中的使用在文献,例如US 8,440,431、US 8,440,432和US 8,450,471中充分描述。参考文献30描述了一组定制的质粒,所述质粒可以Golden Gate克隆方法一起使用以组装多个DNA片段。如本文中所述,所述Golden Gate方法使用IIs型限制性核酸内切酶,其在它们的识别位点外侧切割以产生唯一的4bp突出。通过在吸纳沟通反应混合物中消化和连接加速克隆,因为正确组装消除酶识别位点。通常的TALEN或TAL效应物的组装构成并且包括两个步骤:(i)组装重复的模块为1-10个重复的中间阵列和(ii)将中间阵列连接为骨架以制成最终构建体。
可以根据本发明的各个方面使用的另一基因组编辑方法说CRISPR。该技术在基因组编辑中的使用在本领域中充分描述,例如在US 8,697,359和本文引用的参考文献中描述。简言之,CRISPR是参与防御入侵的噬菌体和质粒的微生物核酸酶系统。微生物宿主中的CRISPR基因座含有CRISPR-相关(Cas)基因以及能够编程CRISPR-介导的核酸切割(sgRNA)的特异性的非编码RNA元件的组合。已经在宽范围的细菌宿主中鉴定了三种类型(I-III)的CRISPR系统。各个CRISPR基因座的一个关键特征是存在由短的非重复序列区段(间隔区)间隔的重复序列(直接重复)阵列。非编码CRISPR阵列被转录并在直接重复内切割为含个体间隔区序列的短的crRNAs,其引导Cas核酸酶至靶位点(原型间隔区)。II型CRISPR是最充分表征的系统之一并且以四个连续步骤进行靶向的DNA双链断裂。首先,两条非编码RNA,前-crRNA阵列和tracrRNA,从CRISPR基因座转录。第二,tracrRNA与前-crRNA的重复区域杂交并且介导处理前crRNA为含有个体间隔区序列的成熟crRNAs。第三,经在crRNA上的间隔区和紧邻原型间隔区相邻基序(PAM)(用于靶点识别的另外的需要)上的原型间隔区之间的沃森-克里克碱基配对,成熟crRNA:tracrRNA复合体引导Cas9至靶DNA。最后,Cas9介导靶DNA的切割以在原型间隔区内产生双链断裂。
因此Cas9是II型CRISPR-Cas系统的标志性蛋白,并且是由两个非编码RNAs:CRIPSR RNA(crRNA)和反式激活crRNA(tracrRNA)的复合体引导至紧邻PAM(原型间隔区相邻基序)序列基序的DNA靶序列的大的单体DNA核酸酶。Cas9蛋白含有两个与RuvC和HNH核酸酶同源的核酸酶结构域。HNH核酸酶结构域切割互补DNA链,而RuvC-样结构域切割非互补链,并且因此,钝性切割(blunt cut)引入靶DNA中。Cas9与sgRNA一起异源表达可以向来自各种生物的活细胞的基因组DNA中引入位点特异性双链断裂(DSBs)。为了应用于真核生物,已经使用了密码子优化的Cas9版本,其源自细菌酿脓链球菌(Streptococcus pyogenes)。
单向导RNA(sgRNA)是CRISPR/Cas的第二成分,其与Cas9核酸酶形成复合体。sgRNA是合成的RNA嵌合体,其通过将crRNA与tracrRNA融合而产生。位于其5′端的sgRNA向导序列赋予DNA靶向特异性。因此,通过修饰向导序列,可能产生具有不同靶特异性的sgRNAs。向导序列的典型长度是20bp。在植物中,已经使用植物RNA聚合酶III启动子,如U6和U3表达sgRNA。
可以如本领域中所述构建用于在本发明的方法中使用的Cas9表达质粒。如本文中的实施例部分所述的提供一个实施例。
用于使用基因组编辑产生抵抗Pm的根据本发明的突变体小麦植物的方法包括使用SSN。这可以选自归巢核酸内切酶、ZFN、TALEN或CRISPR/Cas9。在一个实施方案中,所述SSNs是TALEN。
因此,在一个实施方案中,所述方法包括使用TALEN。在该实施方案中,所述方法包括将包含TALEN的表达载体引入小麦植物并在TaMLO-A1,TaMLO-B1和/或TaMLO-D1基因中筛选TALEN-诱导的靶向的突变。所述方法还可以包括再生植物和选择或挑选抵抗Pm的植物的进一步步骤。
在一个实施方案中,所述载体包含一对靶向外显子2中的保守区域的TALENs(T-MLO)(图1a,9和表1)。载体构建体编码在靶向在小麦的所有三个同源物MLO基因之间保守的序列的一对TALENs。
因此,在一个实施方案中,TaMLO中的靶序列位点是TCGCTGCTGCTCGCCGTgacgcaggaccccatctcCGGGATATGCATCTCCGA(SEQ ID NO.13,表1)。
具体而言,这些TALENs结合的第二外显子保守区域TaMLO-A,TaMLO-B和TaMLO-D的结合位点序列还参见图1):
MLO-A:TCGCTGCTGCTCGCCGTcacgcaggacccaatctcCGGGATATGCATCTCCCA(SEQ IDNO.14)
MLO-B:TCGCTGCTGCTCGCCGTgacgcaggaccccatctcCGGGATATGCATCTCCGA(SEQ IDNO.15)
MLO-D:TCGCTGCTGCTCGCCGTgacgcaggacccaatctcCGGGATATGCATCTCCGA(SEQ IDNO.16)
三个SNPs为粗体并下划线。AvaII限制性位点以小写字母表示并下划线。
TALEN对具有例如核酸序列SEQ ID NO.11。相应氨基酸序列为SEQ ID NO.12。
在该实施方案中,如上文所示,所述TALEN对分别识别由含有AvaII限制性位点的18bp间隔区DNA分离的连续DNA的16bp和17bp(图5a.10和表1)。TALEN识别序列在TaMLO-B1和TaMLO-D1中严格保守,但同源TaMLO-A1靶位点具有一个核苷酸错配(图1a)。此外,在三个MLO同源等位基因中图1a中的保守间隔区区域含有两个单核苷酸多态性(SNPs)。
如实施例中所示,为了检测在由基因编辑技术靶向的位点处的突变,Ava II酶消化基因座选自靶向的位点;如果突变发生,则Ava II酶消化基因座被破坏并且不能被消化。然而,非突变的PCR产物对消化易感。
在一个实施方案中,TALENs通过Golden Gate克隆方法组装并且如实施例中所述构建入单个质粒中。
在一个实施方案中,在TaMLO-A1,TaMLO-B1和TaMLO-D1基因中筛选TALEN-诱导的靶向的突变包括从转化的植物获得DNA样品并且进行DNA扩增和任选地限制酶消化以检测TaMLO-A1,TaMLO-B1和/或TaMLO-D1中的突变。当靶位点如上文所示时,限制酶是AvaII。
然后使用基于凝胶电泳的测定评估从转化的植物扩增的PCR片段。在进一步的步骤中,突变的存在可以通过测序TaMLO-A1,TaMLO-B1和/或TaMLO-D1基因确认。
在另一实施方案中,所述方法包括使用CRISPR/Cas9。在该实施方案中,所述方法因此包括在小麦植物中引入和共表达靶向TaMLO-A1,TaMLO-B1和/或TaMLO-D1的Cas9和sgRNA并且在TaMLO-A1,TaMLO-B1和TaMLO-D1基因中筛选诱导的靶向的突变。所述方法还可以包括再生植物和选择或挑选抵抗Pm的植物的进一步步骤。
Cas9和sgRNA可以包含在单个或两个表达载体中。
TaMLO-A1中的靶序列可以是CCGTCACGCAGGACCCAATCTCC(SEQ ID NO.17,参见表1)。
在一个实施方案中,在TaMLO-A1,TaMLO-B1和TaMLO-D1基因中筛选CRISPR-诱导的靶向的突变包括从转化的植物获得DNA样品并且进行DNA扩增和任选地限制酶消化以检测TaMLO-A1,TaMLO-B1和/或TaMLO-D1中的突变。
在一个实施方案中,所述限制酶是错配敏感的T7核酸内切酶。T7E1酶对由基因组编辑引起的异源双链DNA特异。
然后使用基于凝胶电泳测定的测定评估从转化的植物扩增的PCR片段。在进一步的步骤中,突变的存在可以通过测序TaMLO-A1,TaMLO-B1和/或TaMLO-D1基因确认。
如实施例中所示,基因组DNA(即野生型和突变体)可以从各个样品制备,并且包括各个靶位点的DNA片段通过PCR扩增(参见表)。PCR产物被限制酶消化,以为靶基因座包括限制酶位点。限制酶位点被由NHEJ或HR导致的CRISPR-或TALEN-诱导的突变破坏,因此突变体扩增子对限制酶消化有抗性,并且导致未切割的条带。备选地,PCR产物被T7E1消化(对由基因组编辑引起的异源双链DNA特异的由T7E1酶产生的切割的DNA)并且通过琼脂糖凝胶电泳可视化。在进一步的步骤中,将它们测序。
在另一方面,本发明涉及用于向小麦植物赋予对Pm的抗性或增加小麦植物对Pm的抗性的方法,其包括使用靶向的基因组修饰向TaMLO-A1,TaMLO-B1,和TaMLO-D1核酸序列中引入功能丧失突变。
因此,得到的突变体小麦植物在小麦中的各个内源性MLO基因,即TaMLO-A1,TaMLO-B1和TaMLO-D1中包含功能丧失突变。因此,得到的突变体小麦植物包含突变体基因tamlo-a1,tamlo-b1和tamlo-d1。
在一个实施方案中,使用ZFN,TALEN或CRISPR/Cas9。在一个实施方案中,所述方法包括产生如上文所述的突变体植物。
在上文的方法中,扩增优选使用PCR和特异扩增TaMLO-A1,TaMLO-B1和TaMLO-D1(表2)和如以下所示的引物进行:
以下引物对扩增TaMLO-A1靶位点:
MLO-A1-F(SEQ ID NO.18)
TGGCGCTGGTCTTCGCCGTCATGATCATCGTC
MLO-A1-R(SEQ ID NO.19)
TACGATGAGCGCCACCTTGCCCGGGAA
以下引物对扩增TaMLO-B1靶位点:
MLO-B1-F(SEQ ID NO.20)
ATAAGCTCGGCCATGTAAGTTCCTTCCCGG
MLO-B1-R(SEQ ID NO,21)
CCGGCCGGAATTTGTTTGTGTTTTTGTT
以下引物对扩增TaMLO-D1靶位点:
MLO-D1-F(SEQ ID NO.22)
TGGCTTCCTCTGCTCCCTTGGTGCACCT
MLO-D1-R(SEQ ID NO.23)
TGGAGCTGGTGCAAGCTGCCCGTGGACATT
以下引物对扩增所有三个等位基因
MLO-F(SEQ ID NO.24)
GTCTTCGCCGTCATGATCATCGTCTCC
MLO-R(SEQ ID NO.25)
TGGTATTCCAAGGAGGCGGTCTCTGTCT
在优选的实施方案中,上述方法通过转化小麦胚进行。在进一步优选的实施方案中,所述方包括产生稳定的T2植物,优选对于突变纯合的。
在一个实施方案中,所述方法不包括转化小麦原生质体。
上述方法使用植物转化将包含SSN的表达载体引入植物。本文中所称的术语″引入″或″转化″包括将外源多核苷酸转入宿主细胞,不论何种用于转移的方法。能够随后克隆繁殖(通过器官发生或胚胎发生)的植物组织,可以用本发明的遗传构建体和由其再生整个植物转化。选择的特定组织将取决于对于要转化的特定物种可获得的,并且最适于其的克隆繁殖系统而改变。示例性的组织靶点包括叶盘、花粉、胚、子叶、胚轴、雌配子体、愈伤组织、存在的分生组织(例如,顶端分生组织、腋芽和根分生组织)、和诱导的分生组织(例如,子叶分生组织和胚轴分生组织)。得到的转化的植物细胞可以随后用于以本领域技术人员已知的方式再生转化的植物。
外源基因转入植物的基因组称为转化。在很多物种中,植物的转化现在是常规技术。有利地,多种转化方法中的任一个可以用于将研究的基因引入合适的祖细胞。对于转化植物组织或植物细胞和从植物组织或植物细胞再生植物所描述的方法可以用于瞬时或稳定转化。转化方法包括使用脂质体、电穿孔、增加游离DNA摄取的化学物质、直接将DNA注射入植物、实施例中所述的粒子轰击、使用病毒或花粉转化和显微喷射(microprojection)。所述方法可以选自用于原生质体的钙/聚乙二醇方法,电穿孔原生质体,微注射入植物材料,DNA或RNA-包被的粒子轰击,用(非整合性)病毒等感染。转基因植物,包括转基因作物植物,优选经由根癌农杆菌(Agrobacterium tumefaciens)介导的转化产生。
为了选择转化的植物,通常将在转化中获得的植物材料置于选择性条件中,从而可以区分转化的植物和未转化的植物。例如,可以种植以上述方式获得的种子,并且,在初始生长期后,通过喷雾进行适当的选择。进一步的可能性是,如果合适,在灭菌后在琼脂平板上使用合适的选择剂使种子生长,从而仅转化的种子可以生长为植物。备选地,对转化的植物筛选可选择标记的存在。
在DNA转移和再生后,还可以例如使用DNA印迹分析评价推定转化的植物中研究的基因的存在、拷贝数和/或基因组组织。备选地或此外,新引入的DNA的表达水平可以使用RNA印迹和/或蛋白印迹分析监测,两种技术都是本领域技术人员公知的。
产生的转化的植物可以可以通过多种方式,如克隆繁殖或经典育种技术繁殖。例如,第一代(或T1)转化的植物可以自交,并且选择纯合第二代(或T2)转化子,并且T2植物可以随后进一步通过常规育种技术繁殖。
SSN优选作为表达载体的部分引入植物。载体可以含有一个以上复制系统,其允许其在宿主细胞中复制。自我复制载体包括质粒,粘粒和病毒载体。备选地,所述载体可以是整合载体,其允许DNA序列整合入宿主细胞的染色体。希望的载体还具有唯一的限制性位点用于插入DNA序列。如果载体不具有唯一的限制性位点,可以修饰它以引入或排除限制性位点,使其更适于进一步操作。适于用于表达核酸的载体是技术人员己知的并且非限制性实例是pYP010。
将核酸插载体中,从而其与合适的植物活性启动子可操作连接。用于与核酸一起使用的合适的植物活性启动子包括,但不限于CaMV35S小麦U6或玉米泛蛋白启动子。
如实施例和附图中解释的,所述载体还可以包含GFP序列或其他标志物。
通过上文所述方法获得或可通过上文所述方法获得的植物也在本发明的范围内。
在一个方面,所述突变体无TALEN。因此,根据上述方法,TALEN的存在可以如实施例中所述评估。
在另一方面,本发明涉及选自SED ID NO.18至25或42至47的分离的核酸或与其具有至少90%,91%,92%,93%,94%,95%,96%,97%,98%或99%同源性的序列。这些序列是如本文中所述的允许分别扩增TaMLO-A1,TaMLO-B1和TaMLO-D1靶位点的引物或等位基因特异的引物。
本发明还涉及包含靶向SEQ ID NO.13的TALEN的表达载体。本发明还涉及用所述载体转化的宿主细胞。在一个实施方案中,所述载体如图9中所示(SEQ ID NO.7-10)。
检测方法
本发明还涉及用于确定在小麦植物或其部分中一起赋予对Pm的抗性一个以上突变体tamlo-a1,tamlo-b1和/或tamlo-d1核酸或多肽,优选所有突变体tamlo-a1,tamlo-b1和/tamlo-d1核酸或多肽的存在的诊断测试、方法和测定。
宽泛地,所述方法分为筛选一种以上突变体核酸序列的存在的那些和依赖于检测存在或不存在多肽的那些。所述方法可以使用来自一种以上怀疑含有核酸序列或多肽的根据本发明修饰的植物或细胞的生物样品。
使用用于对一起赋予对Pm的抗性的突变体tamlo-a1,tamlo-b1和/或tamlo-d1核酸的诊断测试允许研究者或植物育种工作者充满信心并且独立于耗时的抗性测试建立,所需等位基因存在或不存在于研究的植物(或其细胞)中,植物是否是其他遗传上同一的植物(例如自交系品种或栽培品种)或相关(例如育种者的选择)或不相关植物的样品中的一个个体的集合的代表。赋予所希望的疾病抗性表型的mlo突变体核酸是隐性的,并且因此当在野生型Mlo等位基因的存在下,在杂合状况下时,在整个植物表型水平不可检测。
这样的隐性等位基因的存在的表型筛选因此仅在对于mlo基因座材料纯合时可能并且这样基本上在选择可以可信地和成本有效地应用的植物育种程序中延迟产生。在例如,育种者目的在于将所需的mlo等位基因基因渗入至精华适应的高效靶基因型回交育种程序中,mlo基因座将永久为杂合状况直到进行自交。测试隐性等位基因的存在的核酸或多肽避免对测试回交后代个体的自交子代的需要,因此节省相当长的时间和相当多的钱。在基于所需个体的选择和自交的其他类型的育种方案中,可以在早期后代和对另外可能的更多材料以高通量对所需mlo等位基因核酸或多肽诊断,如通过本发明提供的低成本测定,对所需mlo等位基因的可信选择。通过能够较早测试材料而没有昂贵的抗性表型筛选的该选择可信度的获得加上省时在植物育种中由相当大的价值。
存在用于在测试样品中确定存在或不存特定核酸或由这样的核酸,如在三倍突变体中一起赋予对Pm的抗性的突变体tamlo-a1,tamlo-b1和/或tamlo-d1多肽编码的多肽的各种方法。
例如,本文提供的序列信息还允许设计用于在任何给定小麦植物、栽培品种、种类、群体、地方品种、科的部分或育种程序中的其他选择或其他这样的基因型中确定赋予Pm抗性的特定突变体tamlo-a1,tamlo-b1和/或tamlo-d1核酸序列的存在,优选确定特定tamlo-a1,tamlo-b1和/或tamlo-d1突变体核酸或易感性等位基因(例如野生型)的存在的诊断测试。根据本发明的诊断测试或检测方法可以基于通过核酸或多肽确定的方式的存在或不存在赋予Pm抗性的特定突变体tamlo-a1,tamlo-b1和/或tamlo-d1核酸序列的确定。
在核酸水平,诊断测试可以包括合适的寡核苷酸或多核苷酸,如Mlo基因的片段的杂交。所述杂交可以包括设计以从mlo的给定等位基因版本扩增产物的PCR,随后通过很多可能的方法中的任一种检测扩增的产物,所述方法包括但不限于凝胶电泳、毛细管电泳和直接杂交核苷酸序列探针。诊断测试可以基于设计以从Mlo基因座扩增各种突变体核酸的PCR,同时通过很多可能方法中的任一种将不同可能突变体核酸与野生型相区分的测试,包括DNA片段尺寸,限制性位点变异(例如CAPS-切割的扩增的多态性位点)等。诊断测试还可以基于对于本领域技术人员将显而易见的大量可能的核酸分析的变化形式,如使用合成的mlo-衍生的序列作为杂交探针。
诊断测试鉴别植物的基因型。植物的基因型可以通过可以鉴别相同种类或相关种类的植物,或用于确定或确认谱系的遗传标志物概况(profile)表征。
存在很多可获得的基于实验室的技术,其用于分析、比较合表征植物基因型以评估根据本发明的突变体等位基因的存在。这些包括但不限于这些中的是同工酶电泳、限制性片段长度多态性(RFLPs),随机扩增多态DNA(RAPDs),任意引物聚合酶链反应(AP-PCR),DNA扩增指纹印迹(DAF),序列表征的扩增的区域(SCARs),扩增的片段长度多态性(AFLPs),简单序列重复(SSRs-其也称为微卫星),和单核苷酸多态性(SNPs)。
在一个实施方案中,基因分型基于SNP。这可以基于SNP-特异的杂交探针对PCR产物如Taqman或分子信标的荧光检测。其他策略如Sequenom均匀质量延伸(hME)和iPLEX基因分型系统包括SNP-特异性PCR引物延伸产物的MALDI-TOF质谱。可以使用如本文中描述的TaMLO基因中的SNP。
在一个实施方案中,使用Kompetitive等位基因特异性的PCR(KASP)基因分型。这需要以下各项的存在:1)纯化的DNA样品,2)两个等位基因-特异的正向引物,和3)普通反向引物。KASP是SNP基因分型系统FRET(荧光共振能量转移)。FRET允许在不需要分离步骤的情况下检测SNP。外加竞争性等位基因特异的PCR的力量,KASP是用于确定SNP或插入/缺失基因型的充分描述的系统。
用于这些目的的特定标志物不限于任何特定组的标志物,但设想包括提供区别品种的手段的任何类型的标志物和标志物特性(profile)。
使用SSR多态性进行标志物表征的方式是本领域中公知的。SSR是基于重复的核苷酸序列,如微卫星中的多态性的遗传标志物。相对于其他标志物系统,基于SSR的标志物系统在连锁分析中可以是提供大量信息的,因为可以存在多个等位基因。该类型的标志物的另一优势是,通过使用侧翼引物,可以例如通过聚合酶链式反应(PCR)实现SSR的检测,从而排除了对于劳动密集型的DNA印迹杂交的需要。PCR检测通过使用重复DNA的多态性区段侧面的两个寡核苷酸引物进行。热变性DNA接着在低温将引物与其互补序列退火,和用DNA聚合酶延伸退火的引物的重复循环,包括方法的主要部分。
扩增后,可以通过将扩增产物电泳对标志物评分。标志物基因型的评分基于扩增片段的大小,其可以通过片段的碱基对的数量来测量。尽管使用的引物或实验步骤中的变化可能影响报告的片段大小,相对值应该保持恒定(不考虑使用的特异引物或实验室)。当比较品种时,如果所有SSR表征在相同实验室进行,其是优选的。
根据本文中描述的方法检测核酸或多肽的其他示例性方法包括通过以下各项分析来自植物或植物细胞的样品:
(a)将样品中突变体核tamlo-a1,tamlo-b1和/或tamlo-d1核酸的序列与野生型核苷酸序列的全部或部分相比较,确定来自植物的样品是否含有突变;
(b)确定样品中包括TaMLO-A1,TaMLO-B1和TaMLO-D1的野生型氨基酸序列或其片段的多肽的存在,并且,如果存在,确定所述多肽是否是全长的,和/或是突变的,和/或以正常水平表达;
(c)进行DNA指纹印迹以将当限制酶切割样品中的核酸时产生的限制性样式与从野生型TaMLO-A1,TaMLO-B1和TaMLO-D1核苷酸序列或从己知突变体、等位基因或其变体获得的限制性样式相比较;
(d)将样品与能够结合包括TaMLO-A1,TaMLO-B1和TaMLO-D1的野生型核苷酸序列或其片段,或其突变体、等位基因或变体的核酸的特定结合成员接触,所述特定结合成员包括能够与野生型核苷酸杂交的核酸或包括对核酸具有特异性的结合结构域的多肽,并且确定所述特定结合成员的结合;
(e)进行包括一种以上基于TaMLO-A1、TaMLO-B1和TaMLO-D1的野生型核苷酸序列或tamlo-a1,tamlo-b1和/或tamlo-d1的突变体核苷酸序列的引物的PCR,从而对样品筛选包括野生型核苷酸序列或其突变体、等位基因或变体的核酸。
测试可以基于含有基因组DNA、cDNA和/或mRNA的制备物进行。测试cDNA或mRNA具有由于缺少内含子序列而减少的核酸复杂性的优势,但具有进行制备物制备所需的额外时间和努力的可能的劣势。因为RNA酶的广泛存在,RNA比DNA更难以操作。
在一个方面,本发明涉及一种用于确定小麦植物中突变体tamlo-a1,tamlo-b1和/或tamlo-d1核酸的存在的方法。
在一个实施方案中,基因分型基于检测SNP或突变。
所述方法可以包括以下步骤:
a)从小麦植物获得核酸样品
b)使用一种以上选自SED ID No.18至25或SEQ ID NO.42-47的引物对进行一个以上TaMLO基因的核酸扩增。
引物对是等位基因特异的并且可以用于检测如图5中所示的三倍体突变体tamloaabbdd。
以下突变体等位基因特异的引物对扩增三倍体突变体tamloaabbdd中的Tamloa。
MLO-MU-A1-F:CTGATGCTGGTGGGATTCAATCTCCGG(SEQ ID NO.42)
MLO-MU-A1-R:TGGTATTCCAAGGAGGCGGTCTCTGTCT(SEQ ID NO.43)
以下突变体等位基因特异的引物对扩增三倍体突变体tamloaabbdd中的Tamlob。
MLO-MU-B1-F:ACATCGTTGCGCTCAGCCAACACCCGGC(SEQ ID NO.44)
MLO-MU-B1-R:TGGTATTCCAAGGAGGCGGTCTCTGTCT(SEQ ID NO.45)
以下突变体等位基因特异的引物对扩增三倍体突变体tamloaabbdd中的Tamlod。
MLO-MU-D1-F:CTAACTATGCGTGACGGCGAGCAGCAGGA(SEQ ID NO.46)
MLO-MU-D1-R:TGGTATTCCAAGGAGGCGGTCTCTGTCT(SEQ lD NO.47)
在另一实施方案中,使用KASP基因分型。所述方法可以包括以下步骤
a)从小麦植物获得核酸样品
b)使用两个等位基因-特异的正向引物和普通反向引物进行扩增。
等位基因-特异的引物可以选自本文中描述的用于三倍体突变体的SEQ IDNO.42-47。可以使用的普通引物是本文中描述的。备选地,引物可以使用专有的KrakenTM软件系统设计。
所述核酸优选为DNA。所述方法还可以包括用限制酶或T7E1消化样品以检测突变体等位基因。
如实施例中所示,基因组DNA(即野生型突变体)可以从各个样品制备,并且包括各个靶位点的DNA片段通过PCR扩增(参见表)。PCR产物通过限制酶消化为包括限制酶位点的靶基因座。限制酶位点被由NHEJ或HR导致的CRISPR-或TALEN-诱导的突变破坏,由此突变体扩增子对限制酶消化有抗性,并导致未切割的条带。备选地,PCR产物被T7E1消化(由对由基因组编辑导致的异源双链DNA特异的T7E1酶产生的切割的DNA)并通过葡聚糖凝胶电泳可视化。在进一步的步骤中,将它们测序。
扩增产物使用凝胶电泳测定分析。在一个实施方案中,TaMLO-A1、TaMLO-B1、和/或TaMLO-D1核酸序列的序列使用序列分析确定。然后将序列与野生型核酸序列比较以评估突变的存在。
可以使用变体-或等位基因特异的探针筛选核酸。这样的探针在序列上对应于基因的区域,或其互补部分对应,含有己知与疾病抗性相关的序列改变。在适当严格的条件,这样的探针对测试核酸的特异杂交表示测试核酸中存在序列改变。为了有效筛选的目的,可以对同一测试样品使用多于一个探针。探针可以被标记。
等位基因-或变体-特异的寡核苷酸可以类似地用于PCR以特异扩增特定序列(如果存在于测试样品中)。PCR条带是否含有基因变体的评估可以以很多本领与技术人员熟悉的方式进行。可以例如以使PCR产物能够在变性聚丙烯酰胺DNA测序凝胶上显示突变或多态性的方式处理PCR产物,选择与基因变体相关的特异条带。
检测图5中所示的Tamlo-aabbd的特异引物可以由本领与技术人员通过常规方法设计。换句话说,可以基于核酸序列中的突变设计本文中描述的三倍体突变体中的tamlo-aa,tamlo-bb和tamlo-dd突变中的每个特异的特异探针/引物。
在测试样品中寻找变体序列的存在的备选方案或补充是例如使用适当特异的寡核苷酸探针或引物寻找正常序列的存在。
在一个实施方案中,所述方法包括获得小麦原生质体并且将所述样品从原生质体分离。
还存在确定在测试样品中存在或不存在特定多肽,如TaMLO-A1、TaMLO-B1和TaMLO-D1多肽的各种方法。
在根据本发明的另一诊断测试中,可以对本文中描述的小麦植物的样品测试存在或不存在对于特异结合成员的结合伙伴如抗体(或抗体的混合物),其对一种或多种突变体TaMLO-A1、TaMLO-B1、和TaMLO-D1多肽和/或野生型TaMLO-A1、TaMLO-B1和TaMLO-D1多肽特异。
在另一实施方案中,本发明涉及确定小麦植物中存在或不存在野生型TaMLO-A1、TaMLO-B1和TaMLO-D1多肽的方法,所述方法使用特异检测野生型TaMLO-A1、TaMLO-B1和TaMLO-D1多肽的抗体。野生型TaMLO-A1、TaMLO-B1和TaMLO-D1多肽可以包含由SEQ IDNO.1,2或3编码的SEQ ID NO:4,5或6。
如果由于突变,突变体不产生蛋白,这是特别有用的。这是本文中描述的保藏的三倍体突变体的情形。
在另一实施方案中,本发明涉及用于确定在小麦植物中存在突变体TaMLO-A1、TaMLO-B1和TaMLO-D1多肽的方法,所述方法包括使用特异检测突变体TaMLO-A1、TaMLO-B1和TaMLO-D1多肽的抗体评估突变体TaMLO-A1、TaMLO-B1和TaMLO-D1多肽。突变体TaMLO-A1、TaMLO-B1和TaMLO-D1多肽可以由本文中描述的突变体TaMLO-A1、TaMLO-B1和TaMLO-D1核酸编码,例如SEQ ID NO.39-41中所示的。
在另一方面,本发明涉及确定小麦植物中存在突变体TaMLO-A1、TaMLO-B1、和/或TaMLO-D1核酸序列的检测试剂盒,其包含引物选自SED ID NO.18-25或42至47中的一种或多种。在一个实施方案中,所述试剂盒包含SED ID NO.18-25或42至47的所有引物。在一个实施方案中,还可以使用限制酶消化。
本文中描述的本发明的各个方面明确扩展到通过本文中描述的任意方法生产的、获得的或可获得的任意植物细胞或任意植物,并且扩展到所有植物部分和繁殖体,除非另外指明。本发明进一步扩展到包括通过前述任意方法产生的突变体植物细胞、组织、器官或整体植物的子代,仅需要子代与根据本发明的方法中的母体产生的那些呈现相同的基因型和/或表型特征。
上述公开内容提供本发明的范围内包括的主题的一般描述,包括进行和使用本发明的方法、以及其最佳方式,同时,提供以下实施例以进一步使得本领域技术人员能够实践本发明并且提供其完全的书面描述。然而,本领与技术人员将理解,这些实施例的具体细节不应该被认为限制本发明,其范围应该从本公开所附的权利要求和其对等物理解。根据本公开内容,本发明的实施方案的各种进一步的方面对于本领域技术人员将显而易见。
本说明书中提及的所有文献,包括对序列数据识别符的引用,通过参考以其整体结合于本文。除非另外指出,当对序列数据识别符进行参考时,版本号是1。
本文中使用″和/或″处要被认为具体公开了两个指定的特征的每个或与另一个一起或不一起的成分。例如″A和/或B″要被认为是具体公开了(i)A,(ii)B和(iii)A和B中的每一个,就像每个在本文中单独陈述一样。
除非上下文另外说明,上述特征的描述和定义不限于本发明的任意特定方面或实施方案,并且与描述的所有方面和实施方案同等利用。
以以下非限制性实例进一步描述本发明。
实施例
TALEN设计和构建
使用TAL效应物-核苷酸Targeter 2.0(TALE-NT)程序(https://tale-nt.cac.cornell.edu/)设计TALEN靶位点。所有靶位点在-1位置具有T,并且相应TAL效应物阵列使用如之前描述的Golden Gate方法构建33。所有TAL效应物阵列和靶位点上的信息在表1中给出。将TALENs组装在具有截短的N152/C63骨架结构的载体(pZHY500和pZHY501)。Gateway-相容进入质粒,pZHY013,用作中间体载体以产生TALEN表达载体34。该质粒含有两个由T2A翻译跳跃序列分离的异二聚的FokI核酸酶结构域。质粒pZHY500和pZHY501中的TAL阵列通过用XbaI/BamHI消化释放并且一个接一个地亚克隆入pZHY01334,35。一个阵列(左侧阵列)首先作为XbaI/BamHI片段克隆入pZHY013;另一个(右侧阵列)随后克隆入NheI/BglII位点,其具有与XbaI和BamHI相容的末端。进行Gateway LR反应以将TALEN编码序列克隆入目标载体,pYP010(通过用玉米泛蛋白启动子替代35S启动子形成的pZHY05134的衍生物)。
Cas9和sgRNA表达载体的构建
质粒pJIT163用于构建Cas9表达质粒。将其用KpnI和HindIII消化并且与玉米泛蛋白1启动子(Ubi)融合以构建载体pJIT163-Ubi。将全长Cas9(植物密码子优化的)产物用BamHI和MfeI消化并插入质粒pJIT163-Ubi BamHI和MfeI位点之间,得到表达载体pJIT163-Ubi-Cas9。由GenScript合成小麦U6启动子和小麦gRNA支架并克隆入pEASY-钝性载体(TransGen Biotech)。Cas9和gRNA的序列在之前的出版物中给出17。选择在5′-NGG PAM之前紧接的小麦基因组DNA区域,如5′-G-N(20)-GG-3′或5′-N(21)-GG-3′作为靶点。
在三个同源等位基因中TaMLO中的CRSIPR/Cas9靶位点含有两个单核苷酸多态性(SNPs)。我们设计了sgRNA(sgMLO-A1)来特异靶向TaMLO-A1。我们的结果表明,sgRNA-A1-诱导的突变仅在TaMLO-A1中出现,这样确认了sgRNA对TaMLO-A1的特异性。因此,脱靶切割不在TaMLO-B1和TaMLO-D1中发生。结果表明,CRISPR/Cas9在小麦植物中有活性并且可以产生转基因突变体系。其他突变体,包括三倍体突变体AA、BB和DD可以使用Cas9/sgRNA通过靶向保守靶位点获得。
小麦原生质体转化
如之前所述分离和转化小麦原生质体3。平均转化效率是60-80%。原生质体转化利用20μg的TALEN质粒/转化,或10μg pJIT163-Ubi-Cas9质粒和10μg pU6-gRNA质粒的混合物进行。
小麦的基因枪(Biolistic)转化
使用PDS1000/He粒子轰击系统(Bio-Rad,Hercules,CA),以距终止板6.0cm的靶距离,以氦压1100psi进行基因枪转化。将质粒DNAs(T-MLO和pAHC20)以1∶1(对于Cas9、sgRNA和pAHC20为1∶1∶1)摩尔比混合,之后轰击。轰击后,将胚转移至愈伤组织诱导培养基中。三或四周内,将所有愈伤组织转移至含有5mg/l草丁膦(PPT)的选择性再生培养基中。PPT存在于所有后续的组织培养程序中,包括2轮的再生(4周)和2轮的生根(4周)。10-12周后,获得T0转基因植物,转入土壤中并在管理温室中生长37。
SSN-诱导的突变的筛选
使用高通量Automation WorkstationFX(Beckmen),利用基于磁珠的DNA提取试剂盒(GeneOn Biotech)提取来自个体小麦植物的基因组DNA。如之前所述,PCR/RE消化筛选测定和T7E1测定用于鉴定突变35,36,37。将用TaMLO-特异性引物(表3)从个体突变体植物扩增的PCR产物克隆入pUC-T载体(CWBIO)用于测序。通过用UVP VisionWorks LS图像采集分析软件7.036测量条带强度计算在原生质体中的突变频率(插入缺失(%))。
白粉病感染和显微分析
将小麦植物在土壤中在受控环境小室中在22℃和16-h的光强度范围从400-1,000μmol m-2s-1的光周期生长。白粉病感染和显微分析如之前报道的39进行,其中具有一些改进。将源自主茎的叶片(叶片2、3和4)切为5cm片段并立即至于含有1%(w/v)蒸馏水琼脂和8.5mM苯并咪唑的皮氏培养皿中。将叶片段在22℃在连续光(100μmol m-2s-1)下孵育四小时,然后用有毒力的小麦白粉菌(Bgt)株E09、E22和B13接种,得到大约15至20个形成孢子的克隆/cm2并在22℃在连续光(100umol m-2s-1)下孵育。接种后七十二小时,将叶片段用1∶1(v/v)乙醇:乙酸固定24h,用乳酸甘油(1∶1∶1[v/v]乳酸:甘油:H2O)澄清48h,并用考马斯蓝(0.6%[w/v]考马斯亮蓝R 250[Sigma]于甲醇中)染色7秒以使真菌结构可视化,最后在蒸馏水中冲洗并封在50%(v/v)甘油中,之后显微镜检。在Olympus BX51光学显微镜下观察并分析样品,并且使用软件Cellsens Entry 1.21拍摄照片。
结果和讨论
为了改良所有三种TaMLO拷贝,我们采用一对靶向外显子2中的保守区域的TALENs(T-MLO)(图1a)。TALEN对分别识别由含有AvaII限制性位点的18bp间隔区DNA分开的连续DNA的16bp和17bp(图1a和表1)。TALEN识别序列在TaMLO-B1和TaMLO-D1中严格保守,但与同源TaMLO-A1靶位点具有一个核苷酸错配(图1a)。此外,在三个MLO同源-等位基因中,图1a中的保守的间隔区区域含有两个单核苷酸多态性(SNPs)。TALENs通过Golden Gate通过方法组装30,并且通过由玉米泛蛋白启动子驱动的T2A翻译跳跃序列构建入单个质粒中(图4a)。得到的T-MLO的活性首先通过将携带TALEN的质粒转化入小麦原生质体来评价。使用之前开发的PCR限制酶消化测定(PCR/RE)16分析来自转化的原生质体的基因组DNA,表明在靶位点处插入/缺失(插入缺失)突变的存在,在基因组A、B和D中效率从23%至38%(图4b和4c);一个核苷酸差异不影响在TaMLO-A1位点处的T-MLO切割。
接着,我们通过粒子轰击方法将T-MLO质粒和pAHC2031(带有可选择的bar基因的质粒)共转化入未成熟的小麦胚中。在5μg/ml草丁膦(PPT)上选择6-8周后从抗除草剂愈伤组织再生小麦幼苗。MLO靶位点(在TaMLO-A1,TaMLO-B1和TaMLO-D1中)首先使用保守引物组(表2)从这些转基因幼苗(T0植物)的基因组DNA扩增,并且通过PCR/RE测定分析以检测可能的突变。我们从来自冬小麦品种Kenong199中的五次独立转化实验的450个独立的T0转基因系中鉴定了27个突变(6.0%),并且从一次转化实验在春小麦品种Bobwhite中鉴定了237T0系中的8个突变(3.4%)(Table 3)。为了鉴定在哪个TaMLO基因中发生突变,我们设计引物以特异扩增TaMLO-A1,TaMLO-B1和TaMLO-D1。PCR/RE测定利用特异性引物(表2)的PCR扩增子表明,T-MLO-诱导的突变在所有三个二倍体基因组中发生(图1b)。突变通过测序确认,其表明TALEN靶区域内的多数突变是1至10bp的小的缺失(图1c)。在27个T0植物中,我们鉴别出12株对于TaMLO-A1杂合的突变体,8株对于TaMLO-D1杂合的突变体,1株对于TaMLO-B1杂合但对于TaMLO-A1纯合的突变体,3株对于TaMLO-A1和TaMLO-D1二者都杂合的突变体,和1株对于所有三个同源-等位基因都杂合的突变体(图1b和表6)。此外,我们发现其中多个类型的缺失在单个靶位点发生的两个T0植物(T0-6和T0-9),即,在植物T0-6中发现TaMLO-A1的四种突变样式并且在T0-9中发现TaMLO-D1的三种突变样式(图1c和表6)。该现象也已经在大麦13、玉米23、水稻19和拟南芥11,24中报道。上述结果支持这样的观点:TALENs可以在面包小麦基因组中有效产生靶向的突变。
为了研究突变是否可以传递到下一代,将在不同二倍体基因组中携带突变的T0植物中的九个自花授粉,并且将个体T1子代用MLO等位基因-特异性引物基因分型。分离数据表明,TALEN-产生的突变传给下一代。通常,对于在T0中纯合的突变,传递率为100%,并且在T0中杂合的多数突变在T1中以孟德尔方式(1∶2∶1)分开(表6)。例如,在植物T0-8中,在T0中纯合的TaMLO-A1突变存在于所有58个T1子代中,而在T0中杂合的TaMLO-B1突变在58个T1子代中以1∶2∶1比例分开(表6)。然而,在植物T0-6和T0-9中发现的复杂突变的分离样式不匹配孟德尔比例,可能因为这些突变在体细胞中发生,其不参与配子的产生。有趣的是,在T1植物中检测到一些新的突变,例如,在植物T0-4中产生的突变仅在TaMLO-D1中检测到,但在其T1子代,我们在TaMLO-A1和TaMLO-B1中发现另外的突变(表6),这提示TALENs在T0和/或T1植物中仍有活性。在用CRISPR/Cas9系统处理的拟南芥植物中报道了类似的结果11。我们进一步分析纯合和杂合突变从六个T1植物到它们的T2子代的传递。再一次,纯合突变100%传递,而杂合突变以孟德尔方式分开(表4)。这些结果表明,在原代转化的面包小麦植物(T0)中观察到的TALEN-介导的基因修饰可以稳定转移至后续的子代。
为了研究实现靶向修饰而不将外源DNA并入面包小麦基因组中的可能性,我们设计了对在质粒pAHC20中驱动bar基因并且在T-MLO质粒中驱动TALEN基因的泛蛋白1启动子特异的PCR引物。PCR测定在源自9个T0系的652(6.9%)个T1植物中的45个和源自3个T1系的105个(21.0%)T2植物中的22个中未能检测泛蛋白启动子(表6和表4)。获得两个无TALENtamlo-aabbdd纯合突变体植物(表4)。这表明,仅携带所需DNA序列改变的无TALEN植物系可以通过遗传分离获得。
我们评估了TALEN-诱导的TaMLO的突变对针对白粉病小的麦抗性的影响。通过自交和通过RCR/RE的基因型以及测序获得TaMLO-A1、TaMLO-B1和TaMLO-D1纯合突变体(tamlo-aa、tamlo-bb、tamlo-dd、tamlo-aabb、tamlo-aadd、tamlo-bbdd和tamlo-aabbdd)的所有组合(图5)。这些面包小麦突变体(tamlo-aa,tamlo-bb,tamlo-dd,tamlo-aabb,tamlo-aadd和tamlo-aabbdd)的幼苗叶片,用有毒力的Bgt种的分生孢子攻毒。显微检查显示,叶片上形成的霉小菌落数仅在tamlo-aabbdd突变体植物中显著减少(图2a和2b)。与该研究结果一致的,在tamlo-aabbdd植物的叶片上未观察到明显的真菌生长,尽管在野生型(WT)植物的叶片和其他突变体组合的叶片发现大量的真菌(图2c和2d)。tamlo-aabbdd植物也对数个另外的测试的有毒力的Bgt种呈现强烈抗性(图1)。这些结果提示,TaMLO-A1,TaMLO-B1和TaMLO-D1全都参与到面包小麦对Bgt感染反应的控制中,并且同时突变三个同源-等位基因赋予光谱的对白粉病的抗性。迄今,由抗性(R)基因控制的种特异抗性通常用于开发抗性小麦品种,但这趋于失败,同时新的Bgt种在田间出现32。相比之下,功能丧失mlo突变-赋予的针对白粉病的抗性自从其三十年前基因渗入精品大麦品种起尚未被破坏25。因此,我们在精品小麦栽培品种中产生的mlo-aabbdd等位基因可以提供极好的用于在面包小麦中产生持久和光谱抗性的起始材料。
我们还表明,通过获得利用CRISPR/Cas9系统产生的TaMLO突变体将SSNs应用于面包小麦。之前,我们报道了CRISPR/Cas9系统可以用于将MLO基因的序列特异的基因组修饰引入小麦原生质体16。本文中,我们使用T7核酸内切酶I(T7E1)测定21鉴别小麦原生质体和转基因植物中sgMLO-A1诱导的突变(图7和表1)。迄今,我们已经鉴定了TaMLO-A1中的突变。在72个T0转基因小麦系中我们发现了四个携带TaMLO-A1突变独立的突变体(图7c)。该突变频率(5.6%)类似于使用TALENs获得的频率(表3)。
如上文所述的TaMLO基因在调节白粉病抗性方面的重要作用促使我们测试是否我们可以经由因TALENs导致的在DSB处的NHEJ实现它们的启动子的基因添加下调,因为可以需要该方法进一步改善TaMLO基因产物的效力。我们构建了含有较少启动子GFP编码序列和CaMV 35S终止子,侧面有T-MLO识别位点的供体载体(图3a和8)并且将T-MLO质粒和GFP供体载体共转化入小麦原生质体。GFP编码序列正确插入TaMLO基因座赋予原生质体荧光(图3b)。我们用TALENs和GFP供体转化检测到比单独用GFP供体转化显著更多的荧光原生质体(图3b)。将转化的原生质体的基因组DNA的PCR产物测序确认GFP盒被插入TaMLO基因做,由于在5′和3′接合处的NHEJ伴有小的缺失和插入(图3c)。我们还测试用分别编码His-标签和Myc-标签肽的ssDNAs(ssDNA-1和ssDNA-2)在TaMLO基因座处靶向的基因敲入(表5)。将T-MLO质粒和pAHC20,与ssDNA-1或ssDNA-2组合,经由粒子轰击共转化入未成熟小麦胚。在69株再生的转基因植物的一株中将His-标签序列以正确取向整合入TaMLO-A1靶位点,同时在39个转基因植物的1个中,Myc-标签序列以两个拷贝以相反取向整合入TaMLO-B1(表3)。分析T1群体表明,插入以孟德尔方式遗传。这些结果表明,经NHEJ的靶向的基因插入在面包小麦中是可行的,并且可以用于进一步操作TaMLO和其他控制重要农学性状的基因的功能。
作物改善需要持续产生和使用新的等位基因变体。用于作物改善的基因组编辑的巨大希望现在刚开始实现,并且刚开始以非常少的例子证明。我们的研究证明,TALENs和CRISPR/Cas9系统可以用于在六倍体面包小麦产生新的遗传性状。此外,我们表明,靶向的DNA插入可以通过NHEJ通路实现。后一策略应该对于产生不能通过简单诱变产生的性状是有价值的。我们的工作提供将SSN用于面包小麦的分子育种的成功的例子。可以通过该方法实现快速和准确改变,应该以足以保证世界食品安全的速率确信帮助改善小麦。
表1.SSN靶基因座和序列
表2.使用的PCR引物和它们的应用
基因特异的引物扩增野生型和突变体TaMLO基因二者。
表3.转基因小麦植物(T0)中SSN-诱导的基因敲出和基因敲入突变的频率
a基于突变植物数相对于测试植物总数。
表4.TaMLO同源物中的TALEN-诱导的突变和它们向T2代传递的分子和遗传分析
a基于携带观察的突变的植物数相对于测试的植物的总数;b缺少完整TALEN构建体和除草剂抗性基因;基于不带有泛蛋白启动子的突变体植物数相对于测试的植物的总数;c选自T1代的无TALEN植物;*表明根据χ2检验杂合系的分离按照孟德尔1∶2∶1比例(P>0.5);WT,野生型;Hetero,杂合;Homo,纯合;-n,缺失指定数量的核苷酸;+n,插入指定数量的核苷酸;-n/+n,在同一位点同时缺失和插入指定数量的核苷酸;-n,...-n,同一靶位点的不同突变事件中发生的多种类型的缺失。
表5.单链DNA寡核苷酸供体的序列。
表6.TaMLO同源物中的TALEN-诱导的突变和它们向T2代传递的分子和遗传分析。
a基于携带观察的突变的植物数相对于测试的植物的总数;b缺少完整TALEN构建体和除草剂抗性基因;基于不带有泛蛋白启动子的突变体植物数相对于测试的植物的总数;*表明根据χ2检验杂合系的分离按照孟德尔1∶2∶1比例(P>0.5);WT,野生型;Hetero,杂合;Homo,纯合;-n,缺失指定数量的核苷酸;+n,插入指定数量的核苷酸;-n/+n,在同一位点同时缺失和插入指定数量的核苷酸;-n,...-n,同一靶位点的不同突变事件中发生的多种类型的缺失。
参考文献
所有参考文献通过引用结合于本文。
1.Voytas,D.F.Plant genome engineering with sequence-specificnucleases.Annu.Rev.Plant.Biol.64,327-350(2013).
2.Bogdanove,A.J.&Voytas,D.F.TAL effectors:customizable proteins forDNA pargeting.Science 333,1843-1846(2011).
3.Jinek,M.等人A programmable dual-RNA-guided DNA endonuclease inadaptive bacterial immunity.Science 337,816-821(2012).
4.Várallyay,E.,Giczey,G.&Burgyán,J.Virus-induced gene silencing ofMlo genes induces powdery mildew resistance in Triticumaestivum.Arch.Virol.157,1345-1350(2012).
5.Slade,A.J.等人A reverse genetic,nontransgenic approach to wheatcrop improvement by TILLING.Nat.Biotechnol.23,75-81(2005).
6.J.in Genetics and Genomics of the Triticeae,第7卷(编辑G.J.Muehlbauer&C.Feuillet)685-711(Springer US,2009).
7.Bibikova,M.,Beumer,K.,Trautman,J.K.&Carroll,D.Enhabcing genetargeting with designed zinc finger nucleases.Science 300,764(2003).
8.Gorbunova,V.&Levy,A.A.Non-homologous DNA end joining in plant cellsis associated with deletions and filler DNA insertions.Nucleic Acids Res.25,4650-4657(1997).
9.Puchta,H.,Dujon,B.&Hohn,B.Homologous recombination in plant cellsis enhanced by in Vivo induction of double strand breaks into DNA by a site-specific endonuelease.Nucleic Acids Res.21,5034-5040(1993).
10.Zhang,F.等人High frequency targeted mutagenesis in Arabidopsisthaliana using zinc-finger nucleases.Proc.Nat.l Acad.Sci.107,12028-12033(2010).
11.Feng,Z.等人Multigeneration analysis reveals the inheritance,specificity,and patterns of CRISPR/Cas-induced gene modifications inArabidopsis.Proc.Nat.l Acad.Sci.doi:10.1073/pnas.1400822111(2014).
12.Zhang,Y.等人Transcription activator-like effector nucleases enableefficient plant genome engineering.Plant physiol.161,20-27(2013).
13.Wendt,T.等人TAL effector hucleases induce mutations at a pre-selected location in the genome of primary barley transformants.PlantMol.Biol.83,279-285(2013).
14.Gurushidze,M.等人True-breeding targeted gene knock-out in barleyusing designer TALE-nuclease in haploid cells.PloS one 9,e92046.doi:10.1371/journal.pone.0092046(2014).
15.Curtin,S.J.等人Targeted mutagenesis of duplicated genes in soybeanwith zinc-finger nucleases.Plant physiol.156,466-473(2011).
16.Shan,Q.等人Rapid and efficient gene modification in rice andbrachypodium using TALENs.Mol.Plant 6,1365-1368(2013).
17.Shan,Q.等人Targeted genome modification of crop plants using aCRISPR-Cas system.Nat.Biotechnol.31,686-688(2013).
18.Li,T.等人High-efficiency TALEN-based gene editing producesdisease-resistant rice.Nat.Biotechnol.30,390-392(2012).
19.Feng,Z.等人Efficient genome editing in plants using a CRISPR/Cassystem.Cell Res.23,1229-1232(2013).
20.Miao,J.等人Targeted mutagenesis in rice using CRISPR-Cassystem.Cell Res.23,1233-1236(2013).
21.Xie,K.&Yang,Y.RNA-guided geBome editing in plants using a CRISPR-Cas system.Mol.Plant.doi:10.1093/mp/sst119(2013).
22.Shukla,V.K.等人Precise genome modification in the crop species Zeamays using zinc-finger nucleases.Nature 459,437-441(2009).
23.Liang,Z.,Zhang,K.,Chen,K.和Gao,C.Targeted mutagenesis in zea maysusing TALENs and the CRISPR/Cas system.J.Genet.Genomics 41,63-68(2014).
24.Christian,M.,Qi,Y.,Zhang,Y.和Voytas,D.F.Targeted mutagenesis ofArabidopsis thaliana using engineered TAL effector nucleases.G3(Bethesda)3,1697-1705(2013).
25.Büschges,R.等人The barley Mlo gene:A novel control element ofplant pathogen resistance.Cell 88,695-705(1997)..
26.Piffanelli,P.等人A barley cultivation-associated polymorphismconveys resistance to powdery mildew.Nature 430,887-891(2004).
27.Consonni,C.等人Conserved requirement for a plant host cell proteinin powdery mildew pathogenesis.Nat.Genet.38,716-720(2006).
28.Bai,Y.等人Naturally occurring broad-spectrum powdery mildewresistance in a central american tomato accession is caused by loss of mlofunction.Mol.Plant Microbe In.21,30-39(2007).
29.Elliott,C.等人Functional conservation of wheat and rice Mloorthologs in defense modulation to the powdery mildew fungus.Mol.PlantMicrobe In.15,1069-1077(2002).
30.Cermak,T.等人Efficient design and assembly of custom TALEN andother TAL effector-based constructs for DNA targeting.Nucleic Acids Res.39(2011).
31.Christensen,A.和Quail,P.Ubiquitin promoter-based vectors for high-level expression of selectable and/or screenable marker genes inmonocotyledonous plants.Transgenic.Res.5,213-218(1996).
32.McDonald,B.A.和Linde,C.Pathogen population genetics,evolutionarypotential,and durable resistance.Annu.Re.Phytopathol.40,349-379(2002).
33.Cermak,T.等人Efficient design and assembly of custom TALEN andother TAL effector-based constructs for DNA targeting.Nucleic Acids Res.39,1-11(2011).
34.Zhang,Y.等人Transcription activator-like effector nucleases enableefficient plant genome engineering.Plant physiol.161,20-27(2013).
35.Shan,Q.等人Rapid and efficient gene modification in rice andbrachypodium using TALENs.Mol.Plant 6,1365-1368(2013).
36.Shan,Q.等人Targeted genome modification of crop plants using aCRISPR-Cas system.Nat.Biotechnol.31,686-688(2013).
37.Rasco-Gaunt,S.等人Procedures allowing the transformation of arange of European elite wheat(Triticum aestivum L.)Varieties Via particlebombardment.J.Exp Bot.52,865-874(2001).
38.Xie,K.和Yang,Y..RNA-guided genome editing in plants using aCRISPR-Cas system.Molecular plant 6,1975-1983(2013).
39.Hein,I.等人Virus-induced gene silencing-based functionalcharacterization of genes associated with powdery mildew resistance inbarley.Plantphysiol.138,2155-2164(2005).
40.Acevedo-Garcia等人:magical Mystery tour:MLO proteins in plantimmunity and beyond.New Phytologist.1-9(2014)
41.Hsu等人:Development and Applications of CRISPR-Cas9 for GenomeEngineering.Cell157,1262-1278,2014
序列表
SEQ ID NO.1 TaMLO-A1的编码序列:1605bp;TALEN靶位点以下划线指示。
ATGGCGGAGGACGACGGGTACCCCCCGGCGCGGACGCTGCCGGAGACGCCGTCCTGGGCGGTGGCGCTGGTCTTCGCCGTCATGATCATCGTCTCCGTCCTCCTGGAGCACGCGCTCCACAAGCTCGGCCAGTGGTTCCACAAGCGGCACAAGAACGCGCTGGCGGAGGCGCTGGAGAAGATGAAGGCGGAGCTGATGCTGGTGGGATTCATCTCGCTGCTGC TCGCCGTCACGCAGGACCCAATCTCCGGGATATGCATCTCCCAGAAGGCCGCCAGCATCATGCGCCCCTGCAAGGTGGAACCCGGTTCCGTCAAGAGCAAGTACAAGGACTACTACTGCGCCAAAGAGGGCAAGGTGGCGCTCATGTCCACGGGCAGCCTGCACCAGCTCCACATATTCATCTTCGTGCTAGCCGTCTTCCATGTCACCTACAGCGTCATCATCATGGCTCTAAGCCGTCTCAAGATGAGAACATGGAAGAAATGGGAGACAGAGACCGCCTCCTTGGAATACCAGTTCGCAAATGATCCTGCGCGGTTCCGCTTCACGCACCAGACGTCGTTCGTGAAGCGGCACCTGGGCCTGTCCAGCACCCCCGGCGTCAGATGGGTGGTGGCCTTCTTCAGGCAGTTCTTCAGGTCGGTCACCAAGGTGGACTACCTCACCTTGAGGGCAGGCTTCATCAACGCGCACTTGTCGCAGAACAGCAAGTTCGACTTCCACAAGTACATCAAGAGGTCCATGGAGGACGACTTCAAAGTCGTCGTTGGCATCAGCCTCCCGCTGTGGGCTGTGGCGATCCTCACCCTCTTCCTTGATATCGACGGGATCGGCACACTCACCTGGGTTTCTTTCATCCCTCTCATCATCCTCTTGTGTGTTGGAACCAAGCTAGAGATGATCATCATGGAGATGGCCCTGGAGATCCAGGACCGGTCGAGCGTCATCAAGGGGGCACCCGTGGTCGAGCCCAGCAACAAGTTCTTCTGGTTCCACCGCCCCGACTGGGTCCTCTTCTTCATACACCTGACGCTGTTCCAGAACGCGTTTCAGATGGCACATTTCGTGTGGACAGTGGCCACGCCCGGCTTGAAGGACTGCTTCCATATGAACATCGGGCTGAGCATCATGAAGGTCGTGCTGGGGCTGGCTCTCCAGTTCCTGTGCAGCTACATCACCTTCCCCCTCTACGCGCTAGTCACACAGATGGGATCAAACATGAAGAGGTCCATCTTCGACGAGCAGACAGCCAAGGCGCTGACCAACTGGCGGAACACGGCCAAGGAGAAGAAGAAGGTCGGAGACACGGACATGCTGATGGCGCAGATGATCGGCGACGCAACACCCAGCCGAGGCACGTCCCCGATGGCTAGCCGGGGCTCATCGCGGGTGCACCTGCTTCAGAAGGGCATGGGACGGTCTGACGATCCCCAGAGCGCACCGACCTCGCCAAGGACCATGGAGGAGGCTAGGGACATGTACCCGGTTGTGGTGGCGCATCCTGTACACAGACTAAATCCTGCTGACAGGAGAAGGTCGGTCTCTTCATCAGCCCTCGATGCCGACATCCCCAGCGCAGATTTTTCCTTCAGCCAGGGATGA
SEQ ID NO.2 TaMLO-B1的编码序列:1605bp;TALEN靶位点以下划线指示。
ATGGCGGAGGACGACGGGTACCCCCCAGCGAGGACGCTGCCGGAGACGCCGTCCTGGGCGGTGGCCCTCGTCTTCGCCGTCATGATCATCGTGTCCGTCCTCCTGGAGCACGCGCTCCATAAGCTCGGCCAGTGGTTCCACAAGCGGCACAAGAACGCGCTGGCGGAGGCGCTGGAGAAGATCAAGGCGGAGCTCATGCTGGTGGGCTTCATCTCGCTGCTGC TCGCCGTGACGCAGGACCCCATCTCCGGGATATGCATCTCCGAGAAGGCCGCCAGCATCATGCGGCCCTGCAAGCTGCCCCCTGGCTCCGTCAAGAGCAAGTACAAAGACTACTACTGCGCCAAACAGGGCAAGGTGTCGCTCATGTCCACGGGCAGCTTGCACCAGCTGCACATATTCATCTTCGTGCTCGCCGTCTTCCATGTCACCTACAGCGTCATCATCATGGCTCTAAGCCGTCTCAAGATGAGAACCTGGAAGAAATGGGAGACAGAGACCGCCTCCCTGGAATACCAGTTCGCAAATGATCCTGCGCGGTTCCGCTTCACGCACCAGACGTCGTTCGTGAAGCGGCACCTGGGCCTCTCCAGCACCCCCGGCGTCAGATGGGTGGTGGCCTTCTTCAGGCAGTTCTTCAGGTCGGTCACCAAGGTGGACTACCTCACCTTGAGGGCAGGCTTCATCAACGCGCATTTGTCGCATAACAGCAAGTTCGACTTCCACAAGTACATCAAGAGGTCCATGGAGGACGACTTCAAAGTCGTCGTTGGCATCAGCCTCCCGCTGTGGTGTGTGGCGATCCTCACCCTCTTCCTTGACATTGACGGGATCGGCACGCTCACCTGGATTTCTTTCATCCCTCTCGTCATCCTCTTGTGTGTTGGAACCAAGCTGGAGATGATCATCATGGAGATGGCCCTGGAGATCCAGGACCGGGCGAGCGTCATCAAGGGGGCGCCCGTGGTTGAGCCCAGCAACAAGTTCTTCTGGTTCCACCGCCCCGACTGGGTCCTCTTCTTCATACACCTGACGCTATTCCAGAACGCGTTTCAGATGGCACATTTCGTGTGGACAGTGGCCACGCCCGGCTTGAAGAAATGCTTCCATATGCACATCGGGCTGAGCATCATGAAGGTCGTGCTGGGGCTGGCTCTTCAGTTCCTCTGCAGCTATATCACCTTCCCGCTCTACGCGCTCGTCACACAGATGGGATCAAACATGAAGAGGTCCATCTTCGACGAGCAGACGGCCAAGGCGCTGACAAACTGGCGGAACACGGCCAAGGAGAAGAAGAAGGTCCGAGACACGGACATGCTGATGGCGCAGATGATCGGCGACGCGACGCCCAGCCGAGGGGCGTCGCCCATGCCTAGCCGGGGCTCGTCGCCAGTGCACCTGCTTCACAAGGGCATGGGACGGTCCGACGATCCCCAGAGCACGCCAACCTCGCCAAGGGCCATGGAGGAGGCTAGGGACATGTACCCGGTTGTGGTGGCGCATCCAGTGCACAGACTAAATCCTGCTGACAGGAGAAGGTCGGTCTCGTCGTCGGCACTCGATGTCGACATTCCCAGCGCAGATTTTTCCTTCAGCCAGGGATGA
SEQ ID NO.3 TaMLO-D1的编码序列:1605bp;TALEN靶位点以下划线指示。
ATGGCGGAGGACGACGGGTACCCCCCGGCGCGGACGCTGCCGGAGAGGCCGTCCTGGGCGGTGGCGCTCGTCTTCGCCGTCATGATCATCGTGTCCGTCCTCCTGGAGCACGCGCTCCACAAGCTCGGCCAGTGGTTCCACAAGCGGCACAAGAACGCGCTGGCGGAGGCGCTGGAGAAGATCAAAGCGGAGCTGATGCTGGTGGGGTTCATCTCGCTGCTGC TCGCCGTGACGCAGGACCCAATCTCCGGGATATGCATCTCCGAGAAGGCCGCCAGCATCATGCGGCGCTGGAGCCTGCCCCCTGGTTCCGTCAAGAGCAAGTACAAAGACTACTACTGGGCCAAAAAGGGCAAGGTGTCGCTAATGTCCACGGGCAGCTTGCACCAGCTCCACATATTCATCTTCGTGCTCGCCGTCTTCCATGTCACCTACAGCGTCATCATCATGGCTCTAAGCCGTCTCAAGATGAGGACATGGAAGAAATGGGAGACAGAGACCGCCTCCTTGGAATACCAGTTCGCAAATGATCCTGCGCGGTTCCGCTTCACGCACCAGACGTCGTTCGTGAAGCGTCACCTGGGCCTCTCCAGCACCCCCGGCATCAGATGGGTGGTGGCCTTCTTCAGGCAGTTCTTCAGGTCGGTCACCAAGGTGGACTACCTCACCCTGAGGGCAGGCTTCATCAACGCGCATTTGTCGCATAACAGGAAGTTCGACTTCCACAAGTACATCAAGAGGTCCATGGAGGACGACTTCAAAGTGGTCGTTGGCATCAGCCTCCCGCTGTGGTGTGTGGCGATCCTCACCCTCTTCCTTGATATTGACGGGATCGGCACGCTCACCTGGATTTCTTTCATCCCTCTCGTCATCCTCTTGTGTGTTGGAACCAAGCTGGAGATGATCATCATGGAGATGGCCCTGGAGATCCAGGACCGGGCGAGCGTCATCAAGGGGGCGCCCGTGGTTGAGCCCAGCAACAAGTTCTTCTGGTTCCACCGCCCCGACTGGGTCCTCTTCTTCATACACCTGACGCTGTTCCAGAATGCGTTTCAGATGGCACATTTCGTCTGGACAGTGGCCA
CGCCCGGCTTGAAGAAATGCTTCCATATGCACATCGGGCTGAGCATCATGAAGGTCGTGCTGGGGCTGGCTCTTCAGTTCCTCTGCAGCTATATCACCTTCCCGCTCTACGCGCTCGTCACACAGATGGGATCAAACATGAAGAGGTCCATCTTCGACGAGCAGACGGCCAAGGCGCTGACAAACTGGCGGAACACGGCCAAGGAGAAGAAGAAGGTCCGAGACACGGACATGCTGATGGCGCAGATGATCGGCGACGCGACGCCCAGCCGAGGGGCGTCGCCCATGCCTAGCCGGGGCTCGTCGCCAGTGCACCTGCTTCACAAGGGCATGGGACGGTCCGACGATCCCCAGAGCACGCCAACCTCGCCAAGGGCCATGGAGGAGGCTAGGGAGATGTACCCGGTTGTGGTGGCGCATCCAGTGCACAGACTAAATCCTGCTGACAGGAGAAGGTCGGTCTCTTCGTCGGCACTCGATGCCGACATCCCCAGCGCAGATTTTTCCTTCAGCCAGGGATGA
SEQ ID NO.4 TaMLO-A1的氨基酸序列:534aa。
MAEDDGYPPARTLPETPSWAVALVFAVMIIVSVLLEHALHKLGQWFHKRHKNALAEALEKMKAELMLVGFISLLLAVTQDPISGICISQKAASIMRPCKVEPGSVKSKYKDYYCAKEGKVALMSTGSLHQLHIFIFVLAVFHVTYSVIIMALSRLKMRTWKKWETETASLEYQFANDPARFRFTHQTSFVKRHLGLSSTPGVRWVVAFFRQFFRSVTKVDYLTLRAGFINAHLSQNSKFDFHKYIKRSMEDDFKVVVGISLPLWAVAILTLFLDIDGIGTLTWVSFIPLIILLCVGTKLEMIIMEMALEIQDRSSVIKGAPVVEPSNKFFWFHRPDWVLFFIHLTLFQNAFQMAHFVWTVATPGLKDCFHMNIGLSIMKVVLGLALQFLCSYITFPLYALVTQMGSNMKRSIFDEQTAKALTNWRNTAKEKKKVRDTDMLMAQMIGDATPSRGTSPMPSRGSSPVHLLQKGMGRSDDPQSAPTSPRTMEEARDMYPVVVAHPVHRLNPADRRRSVSSSALDADIPSADFSFSQG
SEQ ID NO.5 TaMLO-B1的氨基酸序列:534aa。
MAEDDGYPPARTLPETPSWAVALVFAVMIIVSVLLEHALHKLGQWFHKRHKNALAEALEKIKAELMLVGFISLLLAVTQDPISGICISEKAASIMRPCKLPPGSVKSKYKDYYCAKQGKVSLMSTGSLHQLHIFIFVLAVFHVTYSVIIMALSRLKMRTWKKWETETASLEYQFANDPARFRFTHQTSFVKRHLGLSSTPGVRWVVAFFRQFFRSVTKVDYLTLRAGFINAHLSHNSKFDFHKYIKRSMEDDFKVVVGISLPLWCVAILTLFLDIDGIGTLTWISFIPLVILLCVGTKLEMIIMEMALEIQDRASVIKGAPVVEPSNKFFWFHRPDWVLFFIHLTLFQNAFQMAHFVWTVATPGLKKCFHMHIGLSIMKVVLGLALQFLCSYITFPLYALVTQMGSNMKRSIFDEQTAKALTNWRNTAKEKKKVRDTDMLMAQMIGDATPSRGASPMPSRGSSPVHLLHKGMGRSDDPQSTPTSPRAMEEARDMYPVVVAHPVHRLNPADRRRSVSSSALDVDIPSADFSFSQG
SEQ ID NO.6 TaMLO-D1的氨基酸序列:534aa
MAEDDGYPPARTLPETPSWAVALVFAVMIIVSVLLEHALHKLGQWFHKRHKNALAEALEKIKAELMLVGFISLLLAVTQDPISGICISEKAASIMRPCSLPPGSVKSKYKDYYCAKKGKVSLMSTGSLHQLHIFIFVLAVFHVTYSVIIMALSRLKMRTWKKWETETASLEYQFANDPARFRFTHQTSFVKRHLGLSSTPGIRWVVAFFRQFFRSVTKVDYLTLRAGFINAHLSHNSKFDFHKYIKRSMEDDFKVVVGISLPLWCVAILTLFLDIDGIGTLTWISFIPLVILLCVGTKLEMIIMEMALEIQDRASVIKGAPVVEPSNKFFWFHRPDWVLFFIHLTLFQNAFQMAHFVWTVATPGLKKCFHMHIGLSIMKVVLGLALQFLCSYITFPLYALVTQMGSNMKRSIFDEQTAKALTNWRNTAKEKKKVRDTDMLMAQMIGDATPSRGASPMPSRGSSPVHLLHKGMGRSDDPQSTPTSPRAMEEARDMYPVVVAHPVHRLNPADRRRSVSSSALDADIPSADFSFSQG
SEQ ID NO.11载体pYP010中的TALENs(TAL-L+TAL-R)的编码序列。T2A基序位点以下划线和粗体指示。
ATGGTGGATCTACGCACGCTCGGCTACAGTCAGCAGCAGCAAGAGAAGATCAAACCGAAGGTGCGTTCGACAGTGGCGCAGCACCACGAGGCACTGGTGGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCACGTATCAGCACATAATCACGGCGTTGCCAGAGGCGACACACGAAGACATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGATGCGGGGGAGTTGAGAGGTCCGCCGTTACAGTTGGACACAGGCCAACTTGTGAAGATTGCAAAACGTGGCGGCGTGACCGCAATGGAGGCAGTGCATGCATCGCGCAATGCACTGACGGGTGCCCCCCTGAACCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCCACGATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACAATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACTCCGGACCAAGTGGTGGCTATCGCCAGCCACGATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACGGTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGGCAGGACGATGGGCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACAATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACTCCGGACCAAGTGGTGGCTATCGCCAGCCACGATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACGGTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACAATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACTCCGGACCAAGTGGTGGCTATCGCCAGCCACGATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACGGTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACGCCGGACCAAGTGGTGGCTATCGCCAGCCACGATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCGGGACCAAGTGGTGGCTATCGCCAGCAACAATGGCGGCAAGCAAGGGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACTCCGGACCAAGTGGTGGCTATCGCCAGCCACGATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACTCCGGACCAAGTGGTGGCTATCGCCAGCCACGATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACAATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCG
GACCAAGTGGTGGCTATCGCCAGCAACGGTGGCGGCAAGCAAGCGCTCGAAAGCATTGTGGCCCAGCTGAGGCGGCCTGATCCGGCGTTGGCCGCGTTGACCAACGAGCACCTCGTCGCCTTGGCCTGCCTCGGCGGACGTCCTGCCATGGATGCAGTGAAAAAGGGATTGCCGCACGCGCCGGAATTGATCAGAAGAGTCAATCGCCGTATTGGCGAACGCACGTCCCATCGCGTTGCCGGATCCCAGCTGGTGAAGTCCGAGCTGGAAGAAAAAAAGAGCGAGCTGCGCCACAAGCTCAAGTACGTGCCCCACGAGTACATCGAGCTGATCGAGATCGCCCGCAACAGCACCCAAGACCGCATCCTGGAGATGAAAGTGATGGAGTTCTTCATGAAGGTGTACGGCTACCGCGGCAAGCACCTGGGCGGCTCCCGCAAGCCCGATGGCGCCATCTACACCGTGGGCTCCCCCATCGACTATGGCGTCATTGTCGACACCAAGGCCTACTCCGGCGGCTAGAACTTACCCATCGGTCAGGCCGACGAGATGCAACGCTACGTGAAGGAGAACCAGACCCGCAATAAGCACATTAATCCCAACGAGTGGTGGAAGGTGTACCCCTCCTCCGTGACCGAGTTCAAATTCCTGTTCGTGTCCGGCCACTTGAAGGGCAATTATAAGGCCCAACTGACCCGCCTGAACCACAAGACCAACTGCAACGGCGCCGTGCTGTCCGTGGAGGAACTGCTGATCGGCGGCGAGATGATCAAGGCTGGTACCCTGACCCTGGAAGAGGTGCGCCGCAAGTTCAACAATGGTGAAATCAATTTCAGGTCCGGCGGCGGAGAGGGCAGAGGAAGTCTTCTAACATGCGGTGACGTGGAGGAGAATCCCGGCCCTAGGATGGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGATGGCCCCCAAGAAGAAGAGGAAGGTGGGCATTCACGGGGTGCCGGCTAGCATGGTGGATCTACGCACGCTCGGCTACAGTCAGCAGCAGCAAGAGAAGATCAAACCGAAGGTGCGTTCGACAGTGGCGCAGCACCACGAGGCACTGGTGGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCACGTATCAGCACATAATCACGGCGTTGCCAGAGGCGACACACGAAGACATCGTTGGCGTCGGCAAACAGTGGTCCGGCGCACGCGCCCTGGAGGCCTTGCTCACGGATGCGGGGGAGTTGAGAGGTCCGCCGTTACAGTTGGACACAGGCCAACTTGTGAAGATTGCAAAACGTGGCGGCGTGACCGCAATGGAGGCAGTGCATGCATCGCGCAATGCACTGACGGGTGCCCCCCTGAACCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACAAGGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACAAGGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACAAGGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACATTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACAAGGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACATTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACGGTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACAAGGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACTCCGGACCAAGTGGTGGCTATCGCCAGCCACGATGGCGGCAAGCAAGCGCTCGAAA
CGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACATTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACGGTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACATTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACGGTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACTCCGGACCAAGTGGTGGCTATCGCCAGCCACGATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACTCCGGACCAAGTGGTGGCTATCGCCAGCCACGATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACTCCGGACCAAGTGGTGGCTATCGCCAGCCACGATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACAAGGGCGGCAAGCAAGCGCTCGAAAGCATTGTGGCCCAGCTGAGCCGGCCTGATCCGGCGTTGGCCGCGTTGACCAACGACCACCTCGTCGCCTTGGCCTGCCTCGGCGGACGTCCTGCCATGGATGCAGTGAAAAAGGGATTGCCGCACGCGCCGGAATTGATCAGAAGAGTCAATCGCCGTATTGGCGAACGCACGTCCCATCGCGTTGCCAGATCTCAACTAGTCAAAAGTGAACTGGAGGAGAAGAAATCTGAACTTCGTCATAAATTGAAATATGTGCCTCATGAATATATTGAATTAATTGAAATTGCCAGAAATTCCACTCAGGATAGAATTCTTGAAATGAAGGTAATGGAATTTTTTATGAAAGTTTATGGATATAGAGGTAAACATTTGGGTGGATCAAGGAAACCGGACGGAGCAATTTATACTGTCGGATCTCCTATTGATTACGGTGTGATCGTGGATACTAAAGCTTATAGCGGAGGTTATAATCTGCCAATTGGCCAAGCAGATGAAATGGAGCGATATGTCGAAGAAAATCAAACACGAAACAAACATCTCAACCCTAATGAATGGTGGAAAGTCTATCCATCTTCTGTAACGGAATTTAAGTTTTTATTTGTGAGTGGTCACTTTAAAGGAAACTACAAAGCTCAGCTTACACGATTAAATCATATCACTAATTGTAATGGAGCTGTTCTTAGTGTAGAAGAGCTTTTAATTGGTGGAGAAATGATTAAAGCCGGCACATTAACCTTAGAGGAAGTGAGACGGAAATTTAATAACGGCGAGATAAACTTTTAATAG
SEQID NO.12 TALEN的氨基酸序列。T2A基序位点以下划线和粗体表示。MVDLRTLGYSQQQQEKIKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVTYQHIITALPEATHEDIVGVGKQWSGARALEALLTDAGELRGPPLQLDTGQLVKIAKRGGVTAMEAVHASRNALTGAPLNLTPDQVVAIASHDGGKQALETVQHLLPVLCQDHGLTPDQVVAIASNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGL于PDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETV
QRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNNGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALESIVAQLSRPDPALAALTNDHLVALACLGGRPAMDAVKKGLPHAPELIRRVNRRIGERTSHRVAGSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMQRYVKENQTRNKHINPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHKTNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINFRSGGGEGRGSLLTCGDVEENPGPRMDYKDHDGDYKDHDIDYKDDDDKMAPKKKRKVGIHGVPASMVDLRTLGYSQQQQEKlKPKVRSTVAQHHEALVGHGFTHAHIVALSQHPAALGTVAVTYQHIITALPEATHEDIVGVGKQWSGARALEALLTDAGELRGPPLQLDTGQLVKIAKRGGVTAMEAVHASRNALTGAPLNLTPDQVVAIASNKGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNKGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNKGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNKGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNKGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNIGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNGGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASHDGGKQALETVQRLLPVLCQDHGLTPDQVVAIASNKGGKQALESIVAQLSRPDPALAALTNDHLVALACLGGRPAMDAVKKGLPHAPELIRRVNRRIGERTSHRVARSQLVKSELEEKKSELRHKLKYVPHEYIELIEIARNSTQDRILEMKVMEFFMKVYGYRGKHLGGSRKPDGAIYTVGSPIDYGVIVDTKAYSGGYNLPIGQADEMERYVEENQTRNKHLNPNEWWKVYPSSVTEFKFLFVSGHFKGNYKAQLTRLNHITNCNGAVLSVEELLIGGEMIKAGTLTLEEVRRKFNNGEINF
SEQID NO.39
突变体tamlo-aabbdd的编码序列。
Tamlo-a.在靶位点缺失32bp。缺失序列用点表示。
ATGGCGGAGGACGACGGGTACCCCCCGGCGCGGACGCTGCCGGAGACGCCGTCCTGGGCGGTGGCGCTGGTCTTCGCCGTCATGATCATCGTGTCCGTCCTCCTGGAGCACGCGCTCCACAAGCTCGGCCAGTGGTTCCACAAGCGGCACAAGAACGCGCTGGCGGAGGCGCTGGAGAAGATGAAGGCGGAGCTGATGCTGGTGGGATT…………………………..CAATCTCCGGGATATGCATCTCCCAGAAGGCCGCCAGCATCATGCGCCCCTGCAAGGTGGAACCCGGTTCCGTCAAGAGCAAGTACAAGGACTACTACTGCGCCAAAGAGGGCAAGGTGGCGCTCATGTCCACGGGCAGCCTGCACCAGCTCCACATATTCATCTTCGTGCTAGCCGTCTTCCATGTCACCTACAGCGTCATCATCATGGCTCTAAGCCGTCTCAAGATGAGAACATGGAAGAAATGGGAGACAGAGACCGCCTCCTTGGAATACCAGTTCGCAAATGATCCTGCGCGGTTCCGCTTCACGCACCAGACGTCGTTCGTGAAGCGGCACCTGGGCCTGTCCAGCACCCCCGGCGTCAGATGGGTGGTGGCCTTCTTCAGGCAGTTCTTCAGGTCGGTCACCAAGGTGGACTACCTCACCTTGAGGGCAGGCTTCATCAACGCGCACTTGTCGCAGAACAGCAAGTTCGACTTCCACAAGTACATCAAGAGGTCCATGGAGGACGACTTCAAAGTCGTCGTTGGCATCAGCCTCCCGCTGTGGGCTGTGGCGATCCTCACCCTCTTCCTTGATATCGACGGGATCGGCACACTCACCTGGGTTTCTTTCATCCCTCTCATCATCCTCTTGTGTGTTGGAACCAAGCTAGAGATGATCATCATGGAGATGGCCCTGGAGATCCAGGACCGGTCGAGCGTCATCAAGGGGGCACCCGTGGTCGAGCCCAGCAACAAGTTCTTCTGGTTCCACCGCCCCGACTGGGTCCTCTTCTTCATACACCTGACGCTGTTCCAGAACGCGTTTCAGATGGCACATTTCGTGTGGACAGTGGCCACGCCCGGCTTGAAGGACTGCTTCCATATGAACATCGGGCTGAGCATCATGAAGGTCGTGCTGGGGCTGGCTCTCCAGTTCCTGTGCAGCTACATCACCTTCCCCCTCTACGCGCTAGTCACACAGATGGGATCAAACATGAAGAGGTCCATCTTCGACGAGCAGACAGCCAAGGCGCTGACCAACTGGCGGAACACGGCCAAGGAGAAGAAGAAGGTCCGAGACACGGACATGCTGATGGCGCAGATGATCGGCGACGCAACACCCAGCCGAGGCACGTCCCCGATGCCTAGCCGGGGCTGATCGCCGGTGCACCTGCTTCAGAAGGGCATGGGACGGTCTGACGATCCCCAGAGCGCACCGACCTCGCCAAGGACCATGGAGGAGGCTAGGGACATGTACCCGGTTGTGGTGGCGCATCCTGTACACAGACTAAATCCTGCTGACAGGAGAAGGTCGGTCTCTTCATCAGCCCTCGATGCCGACATCCCCAGCGCAGATTTTTCCTTCAGCCAGGGATGA
SEQ ID NO.40
tamlo-b.在靶位点中插入141bp。插入序列以粗体标记。
ATGGCGGAGGACGACGGGTACCCGCCAGCGAGGACGCTGCCGGAGACGCCGTCCTGGGCGGTGGCCCTCGTCTTCGCCGTCATGATCATCGTGTCCGTCCTCCTGGAGCACGCGCTCCATAAGCTCGGCCAGTGGTTCCACAAGCGGCACAAGAACGCGCTGGCGGAGGCGCTGGAGAAGATCAAGGCGGAGCTCATGCTGGTGGGCTTCATCTCGCTGCTGC TCGCCGTGACGCAGGACGAGGCACTGGTGGGCCATGGGTTTACACACGCGCACATCGTTGCGCTCAGCCAACACCCGGCAGCGTTAGGGACCGTCGCTGTCACGTATCAGCACATAATCACGGCGTTGCCAGAGGCGACACACGAAGACATCGTTGGCCCCATCTCCGGGATATGCATCTCCGAGAAGGCCGCCAGCATCATGCGGCCCTGCAAGCTGCCCCCTGGCTCCGTCAAGAGCAAGTACAAAGACTACTACTGCGCCAAACAGGGCAAGGTGTCGCTCATGTCCACGGGCAGCTTGCACCAGCTGCACATATTCATCTTCGTGCTCGCCGTCTTCCATGTCACCTACAGCGTCATCATCATGGGTCTAAGCCGTCTCAAGATGAGAACCTGGAAGAAATGGGAGACAGAGACCGCCTCCCTGGAATACCAGTTCGCAAATGATCCTGCGCGGTTCCGCTTCACGCACCAGACGTCGTTCGTGAAGCGGCACCTGGGCCTCTCCAGCACCCCCGGCGTCAGATGGGTGGTGGCCTTCTTCAGGCAGTTCTTCAGGTCGGTCACCAAGGTGGACTACCTCACCTTGAGGGCAGGCTTCATCAACGCGCATTTGTCGCATAACAGCAAGTTCGACTTCCACAAGTACATCAAGAGGTCCATGGAGGACGACTTCAAAGTCGTCGTTGGCATCAGCCTCCCGCTGTGGTGTGTGGCGATCCTCACCCTCTTCCTTGACATTGACGGGATCGGGACGGTCACCTGGATTTCTTTCATCCCTCTCGTCATCCTCTTGTGTGTTGGAACCAAGCTGGAGATGATCATCATGGAGATGGCCCTGGAGATCCAGGACCGGGCGAGCGTCATCAAGGGGGCGCCCGTGGTTGAGCCCAGCAACAAGTTCTTCTGGTTCCACCGCCCCGACTGGGTCCTCTTCTTCATACACCTGACGCTATTCCAGAACGCGTTTCAGATGGCACATTTCGTGTGGACAGTGGCCACGCCCGGCTTGAAGAAATGCTTCCATATGCACATCGGGCTGAGCATCATGAAGGTCGTGCTGGGGCTGGCTCTTCAGTTCCTCTGCAGCTATATCACCTTCCCGCTCTACGCGCTCGTCACACAGATGGGATCAAACATGAAGAGGTCCATCTTCGACGAGCAGACGGCCAAGGCGCTGACAAACTGGCGGAACACGGCCAAGGAGAAGAAGAAGGTCCGAGACACGGACATGCTGATGGCGCAGATGATCGGCGACGCGACGCCCAGCCGAGGGGCGTCGCCCATGCCTAGCCGGGGCTCGTCGCCAGTGCACCTGCTTCACAAGGGCATGGGACGGTCCGACGATCCCCAGAGCACGCCAACCTCGCCAAGGGCCATGGAGGAGGCTAGGGACATGTACCCGGTTGTGGTGGCGCATCCAGTGCACAGACTAAATCCTGCTGACAGGAGAAGGTCGGTCTCGTCGTCGGCACTCGATGTCGACATTCCCAGCGCAGATTTTTCCTTCAGCCAGGGATGA
SEQ ID NO.41
tamlo-d.在靶位点中缺失11bp并插入81bp。插入序列以粗体标记。
ATGGCGGAGGACGACGGGTACCCCCCGGCGCGGACGCTGCCGGAGACGCCGTCCTGGGCGGTGGCGCTCGTCTTCGCCGTCATGATCATCGTGTCCGTCCTCCTGGAGCACGCGCTCCACAAGCTCGGCCAGTGGTTCCACAAGCGGCACAAGAACGCGCTGGCGGAGGCGCTGGAGAAGATCAAAGCGGAGCTGATGCTGGTGGGGTTCATCTCGCTGCTGC TCGCCGTGACGCAGGAGATGCATATCCCGGAGATGGCTAAACTAACTATGCGTGACGGCGAGCAGCAGGAGATGCAT ATCCCGGAGATGGCTAAACTGGATATGCATCTCCGAGAAGGCCGCCAGCATCATGCGGCCCTGCAGCCTGCCCCCTGGTTCCGTCAAGAGCAAGTACAAAGACTACTACTGCGCCAAAAAGGGCAAGGTGTCGCTAATGTCCACGGGCAGCTTGCACCAGCTCCACATATTCATCTTCGTGCTCGCCGTCTTCCATGTCACCTACAGCGTCATCATCATGGCTCTAAGCCGTCTCAAGATGAGGACATGGAAGAAATGGGAGACAGAGACCGCCTCCTTGGAATACCAGTTCGCAAATGATCCTGCGCGGTTCCGCTTCACGCACCAGACGTCGTTCGTGAAGCGTCACCTGGGCCTCTCCAGCACCCCCGGCATCAGATGGGTGGTGGCCTTCTTCAGGCAGTTCTTCAGGTCGGTCACCAAGGTGGACTACCTCACCCTGAGGGCAGGCTTCATCAACGCGCATTTGTCGCATAACAGCAAGTTCGACTTCCACAAGTACATCAAGAGGTCCATGGAGGACGACTTCAAAGTCGTCGTTGGCATCAGCCTCCCGCTGTGGTGTGTGGCGATCCTCACCCTCTTCCTTGATATTGACGGGATCGGCACGCTCACCTGGATTTCTTTCATGCCTCTCGTCATCCTCTTGTGTGTTGGAACCAAGCTGGAGATGATCATCATGGAGATGGCCCTGGAGATCCAGGACCGGGCGAGCGTCATCAAGGGGGCGCCCGTGGTTGAGCCCAGCAACAAGTTCTTCTGGTTCCACCGCCCCGACTGGGTCCTCTTCTTCATACACCTGACGCTGTTCCAGAATGCGTTTCAGATGGCACATTTCGTCTGGACAGTGGCCACGCCCGGCTTGAAGAAATGCTTCCATATGCACATCGGGCTGAGCATCATGAAGGTCGTGCTGGGGCTGGCTCTTCAGTTCCTCTGCAGCTATATCACCTTCCCGCTCTACGCGCTCGTCACACAGATGGGATCAAACATGAAGAGGTCCATCTTCGACGAGCAGACGGCCAAGGCGCTGACAAACTGGCGGAACACGGCCAAGGAGAAGAAGAAGGTCCGAGACACGGACATGCTGATGGCGCAGATGATCGGCGACGCGACGCCCAGCCGAGGGGCGTCGCCCATGCCTAGCCGGGGCTCGTCGCCAGTGCACCTGCTTCACAAGGGCATGGGACGGTCCGACGATCCCCAGAGCACGCCAACCTCGCCAAGGGCCATGGAGGAGGCTAGGGACATGTACCCGGTTGTGGTGGCGCATCCAGTGCACAGACTAAATCCTGCTGACAGGAGAAGGTCGGTCTCTTCGTCGGCACTCGATGCCGACATCCCCAGCGCAGATTTTTCCTTCAGCCAGGGATGA