CN107075526B - 具有工程内源基因的植物 - Google Patents
具有工程内源基因的植物 Download PDFInfo
- Publication number
- CN107075526B CN107075526B CN201580052482.8A CN201580052482A CN107075526B CN 107075526 B CN107075526 B CN 107075526B CN 201580052482 A CN201580052482 A CN 201580052482A CN 107075526 B CN107075526 B CN 107075526B
- Authority
- CN
- China
- Prior art keywords
- plant
- seq
- sequence
- nucleic acid
- gwd
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8242—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
- C12N15/8243—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
- C12N15/8245—Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving modified carbohydrate or sugar alcohol metabolism, e.g. starch biosynthesis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8216—Methods for controlling, regulating or enhancing expression of transgenes in plant cells
- C12N15/8218—Antisense, co-suppression, viral induced gene silencing [VIGS], post-transcriptional induced gene silencing [PTGS]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/12—Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
- C12N9/1294—Phosphotransferases with paired acceptors (2.7.9)
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Molecular Biology (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Cell Biology (AREA)
- Nutrition Science (AREA)
- Virology (AREA)
- Medicinal Chemistry (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本发明提供了表达改变的葡聚糖水合二激酶且具有升高的淀粉水平的基因工程植物。本发明提供了基因工程改造植物以表达改变的葡聚糖水合二激酶的方法和基因构建体。本文描述了育种对于编码改变的葡聚糖水合二激酶的突变基因是纯合的基因工程植物的方法。本发明还提供了使用基因工程植物进行农业加工和制备动物饲料的方法。
Description
相关申请的交叉引用
本申请要求于2014年9月29日提交的申请号为62/056,852的美国临时申请的权利,这些都通过引用并入本文,如同完整阐述。
与本申请一起以电子方式提交的标题为“Sequence Listing”的序列表创建于2015年9月29日,具有159,500字节大小,也通过引用并入本文,如同完整阐述。
政府支持声明
本发明是在由高级能源研究计划署ARPA-E颁发的奖励号为DE-AR0000042的政府支持下完成的。政府对本发明具有一定的权利。
技术领域
本文的公开内容涉及具有优化的编码改变的葡聚糖水合二激酶(glucan waterdikinase)的内源核酸序列和具有升高的淀粉水平的基因改良植物。本发明还涉及优化的编码改变的葡聚糖水合二激酶的核酸序列,优化内源核酸的方法,提高植物中的淀粉水平的方法以及制备和繁殖基因改良植物的方法。
背景技术
在白天,植物在营养组织中合成淀粉并在晚上降解淀粉来动员产生的糖以支持植物的能量需求。在夜间,营养型植物细胞表达一系列酶以启动中间淀粉的动员。使淀粉磷酸化的葡聚糖水合二激酶(“GWD”)是这些酶之一。GWD的转录水平显示出经历了昼夜波动(Smith et al.Plant Phys.Preview,April 29,2014)。增加生物质的淀粉含量可以增加动物饲料中的能量含量(卡路里)或提高从生物质中提取葡萄糖以用于乙醇或其他生化制品的生产。
存在不同的用于操纵植物特性的分子方法。几乎所有的方法都依赖于通过转化过程将新的、合成的或重组的核酸插入至植物中。因此,插入的核酸可以编码核糖核酸(RNA)或蛋白质,它们可以被转化的植物表达从而改变植物表型。在许多情况下,核酸可以编码异源蛋白或产生更多的内源蛋白。类似地,转化的核酸可以产生通过多种机制(例如,RNA干扰、反义RNA等)降低内源基因的表达从而“沉默”基因并产生其产物的RNA。在所有情况下,插入植物中的核酸以显性方式表达,即,它的存在对植物的特性具有直接的影响。最近,已经证明通过在生物体中表达编码改变蛋白质(例如核酸酶)的脱氧核糖核酸(DNA)的核酸,生物体的基因组可以被永久地改变,即使在插入的核酸已经被除去以及内源基因优化之后。以这种方式,可能不仅产生有益的显性性状,而且产生具有非常特异性的靶向突变作为产生有益的隐性性状(recessive trait)的基础,而这本来是非常难以用于商业应用的发现和发展。目前,在行栽作物(row crops)的商业用途中尚没有使用核酸酶产生的隐性性状。使用核酸酶产生的隐性性状先前已在植物和植物细胞中证明,但是在完全发育的多细胞玉米和高粱植物(包括杂交玉米和高粱)中未见。像显性性状(dominant traits)一样,隐性性状可能具有商业价值,并且可能具有优于显性性状的特定商业优势(特别是安全和监管方面的益处)。这种隐性性状将需要新的繁殖、跟踪和传递性状的方法,特别是在杂交作物中。
显性性状特别是在杂交和交叉授粉作物如玉米中的一个问题是它们很容易地转移到相同物种的其他品系。在世界上的一些地区中,农民至少生产部分他们自己的用于种植的种子,这为将显性性状培育至农民现有的品系中提供了机会,而无需向技术所有者付费。已建立的性状商业模式目前需要种子和性状购买者向性状提供者支付特许权使用费,并且许可证通常将性状的使用限于单一种植并且禁止育种。对于很多性状,监测无授权的育种几乎是不可能的,并且在世界上的一些地方发生大量的性状的未经授权的性状转移(盗用,pirating)。根据性状,盗用或将性状转移到可用品系中而不向技术所有者付费是一项容易的工作,并且对于技术提供者来说难以检测。例如,抗虫性或农艺性状,它们的使用不需要任何其他材料,例如,除草剂抗性或特定肥料,如果它们已经转移到不同品系中,是几乎不可能检测的。可以产生后代,并且育种者可以使用商业上可以获得的测试条对其进行跟踪,或者如果该性状赋予了易获得的表型,可以通过表型进行跟踪。因为性状是显性的,所以对于农民使用而言在子代中它可能不需要是纯合的(homozygous),从而能够很容易继续育种和在技术许可者不知晓的情况下使用。
与显性性状相反,隐性性状在作物中需要是纯合的,以便进行表型观察或易于评分。简单的测试条可能不可用于跟踪性状的分子基础,并且通过使用核酸酶产生的隐性性状的精准育种可能至少需要使用聚合酶链反应(PCR)进行检测。在这种情况下,携带该性状的纯合亲本的异交(outcross)所产生的后代将不显示该性状,并且在扩大育种、跟踪和一些情况下,杂交组合(hybrid crosses)将被要求使用该性状。这使得技术的盗用比使用显性性状显得更昂贵和困难。制备、维持和提供隐性性状的过程需要在显性性状的生产中所不必要的额外的步骤,因此,在种子和性状的生产中需要使用新的方法。
基于含有特定基因突变的优化基因的隐性性状也可以具有超过使用转基因技术制备的显性性状的监管优势。因为这样的隐性性状可能不包含任何新引入的异源DNA,在世界的许多地区,它可能不会被作为转基因作物而被监管。
发明内容
一方面,本发明涉及一种基因工程植物(genetically engineered plant),该基因工程植物含有编码改变的葡聚糖水合二激酶的工程核酸(engineered nucleic acid),其中,与含有野生型葡聚糖水合二激酶的具有相同遗传背景的植物相比,该植物具有升高的淀粉水平。
一方面,本发明涉及一种基因工程改造植物的方法,以使其含有改变的葡聚糖水合二激酶。该方法包括将含有编码葡聚糖水合二激酶的内源基因中的靶序列的至少一个植物细胞与含有编码能够诱导靶序列上的双链断裂的核酸酶的第一核酸的载体接触。该方法还包括选择在靶序列中具有改变的植物细胞。该方法还包括从植物细胞再生包含改变的基因工程植物。
一方面,本发明涉及一种提高植物中淀粉水平的方法。该方法包括表达编码能够诱导靶序列上双链断裂的核酸酶的核酸,其中,所述靶序列是编码葡聚糖水合二激酶的内源基因的序列。该方法还包括选择与含有野生型葡聚糖水合二激酶的具有相同遗传背景的植物相比,在靶序列中具有改变并且具有升高的淀粉水平的纯合植物。
一方面,本发明涉及一种农业加工的方法。该方法包括表达编码能够诱导靶序列上的双链断裂的核酸酶的核酸,其中,所述靶序列为编码葡聚糖水合二激酶的内源基因中的序列。该方法可以包括选择与含有野生型葡聚糖水合二激酶的具有相同遗传背景的植物相比,在靶序列中具有改变并且具有升高的淀粉水平的纯合植物。该方法还可以包括对所述纯合植物进行加工。
一方面,本发明涉及一种制备动物饲料的方法。该方法包括表达编码能够诱导靶序列上的双链断裂的核酸酶和核酸,其中,所述靶序列是编码葡聚糖水合二激酶的内源基因的序列。该方法可以包括与含有野生型葡聚糖水合二激酶的具有相同遗传背景的植物相比,选择在靶序列中具有改变并且具有升高的淀粉水平的纯合植物。该方法还可以包括进行选自由以下所组成的组中的至少一个步骤:收获(harvesting)、排水(bailing)、粉碎(shredding)、干燥(drying)、青贮(ensiling)、造粒(pelletizing)、与可食用的纤维素源结合和与植物生物质结合。
一方面,本发明涉及一种制备对于工程核酸纯合的基因工程植物的方法,该工程核酸编码改变的葡聚糖水合二激酶,所述方法包括进行任意一种本文所述的对含有改变的葡聚糖水合二激酶的植物进行基因工程的方法。
一方面,本发明涉及一种合成的核酸启动子(nucleic acid promoter),所述核酸启动子与参考序列具有至少70、72、75、80、85、90、91、92、93、94、95、96、97、98、99或100%的同一性(identity)的序列,所述参考序列选自由:SEQ ID NO:78(MzU3.8)、SEQ ID NO:79(ZmU3)、SEQ ID NO:82(ZmU3P1)、SEQ ID NO:84(ZmU3P2)和SEQ ID NO:86(MzU3.8P)所组成的组中。
一方面,本发明涉及一种含有编码Cas9核酸酶的第一工程核酸序列的基因构建体。所述Cas9核酸酶能够切割包含在编码植物中葡聚糖水合二激酶的内源核酸中的靶序列。
一方面,本发明涉及一种鉴定样品中编码葡聚糖水合二激酶的内源基因的修饰序列的试剂盒。所述试剂盒含有第一引物和第二引物。所述第一引物和所述第二引物能够扩增包含在编码葡聚糖水合二激酶的内源基因中的靶序列。所述靶序列含有与选自SEQ IDNO:1-4、75、170-184、186、187、189-193的参考序列具有至少90%同一性的核酸序列。所述试剂盒还可以含有一种或多种组件用于检测靶序列扩增区域的修饰。所述修饰(modification)可以是编码本文所述的任意基因工程植物中的葡聚糖水合二激酶的内源基因的修饰序列(modified sequence)。
一方面,本发明涉及一种鉴定样品中编码葡聚糖水合二激酶的内源基因的修饰序列的方法。该方法包括将样品与第一引物和第二引物进行接触。该方法包括扩增包含在编码葡聚糖水合二激酶的内源基因中的靶序列。所述靶序列含有与选自SEQ ID NO:1-4、75、170-184、186、187、189-193的参考序列具有至少90%同一性的核酸序列。该方法还包括检测靶序列的修饰。所述修饰可以是编码本文所述的任意基因工程植物中的葡聚糖水合二激酶的内源基因的修饰序列。
附图说明
结合附图阅读将会更好地理解以下对本发明的实施方式的详细描述。出于说明的目的,图中显示的是具体的实施方式。然而,应当理解的是,本发明并不局限于显示出的具体设置和方法。在附图中:
图1显示了用于表达大范围核酸酶(meganuclease)的载体pAG4715。
图2显示了用于表达大范围核酸酶的载体pAG4716。
图3显示了突变体的PCR检测。
图4显示了描述通过使用载体pAG4715和pAG4716产生的突变的纯合子、杂合子和半合子玉米植物群之间的淀粉含量(mg淀粉/g干重)的图表。品系195、20、19、18、9和6为对照植物。
图5显示了gwd敲除的玉米突变体的绿色组织中的淀粉含量:柱1是野生型(WT)植物,柱2是M17,柱3是M18,柱4是M1,柱5是M20,柱6是M13/M12,柱7是M9,柱8是M7/M11,柱9是M4/M14,柱10是M11/M12,柱11是M15,柱12是M14,柱13是M11,柱14是M11/M10,柱15是M13。
图6显示了gwd敲除的(GWDko)大范围核酸酶穗轴(cobs)中的淀粉染色。
图7显示了用于表达ZmCas9的载体pAG4800。
图8显示了用于表达sgRNA支架(scaffold)和ZmCas9的载体pAG4804。
图9显示了pAG4804玉米事件(maize events)中的淀粉积累。
图10显示了pAG4806玉米事件中的淀粉积累。
图11显示了源自玉米事件4716_164的靶向突变M20的自交和异交的示意图。
图12显示了来自自交T0 4716_164 M20植株的T1子代的基因分型。
图13显示了来自异交T0 4716_164 M20植株的T1子代的基因分型。
图14显示了来自异交4716_164 M20植株的T1子代的基因分型。
具体实施方式
以下描述中使用的特定术语仅为了方便而并非限制。
本文使用的“工程核酸序列”、“工程多核苷酸”、“工程寡核苷酸”、“工程DNA”或“工程RNA”是指与自然界中的任意一种均不同的核酸、多核苷酸(polynucleotide)、寡核苷酸(oligonucleotide)、DNA或RNA,其具有与自然界中任意一种所不同的序列或者自然界中尚未发现的化学修饰。所述“工程核酸序列”、“工程多核苷酸”、“工程寡核苷酸”、“工程DNA”或“工程RNA”可以是合成的核酸序列、合成的多核苷酸、合成的寡核苷酸、合成的DNA或合成的RNA。工程核酸的定义包括但不限于使用生物技术工具产生的DNA序列。这些工具包括但不限于重组DNA技术、化学合成或核酸酶的定向使用(所谓的“基因组编辑”或“基因优化”技术)。
本文所用的“内源核酸”是指天然存在于生物体或基因组中的核酸、多核苷酸、寡核苷酸、DNA或RNA。内源核酸可以是内源基因。
本文所用的“改变的蛋白质”是指与天然存在的生物体,例如亲本生物体中所含的氨基酸序列相比含有至少一个氨基酸发生变化或缺失的蛋白质、多肽、寡肽或肽。改变的蛋白质可以保留或缺乏原始序列的生物活性。
本文所用的“可操作地连接(operably linked)”是指两种或多种生物分子以相对于彼此的方式结合,以使所述生物分子能够进行正常功能。对于两个或多个核酸序列,“可操作地连接”是指所述核酸序列以相对于彼此的方式结合,以使所述序列能够进行正常功能。例如,对于多肽,如果表达为参与多肽分泌的前蛋白(preprotein),编码前序列或分泌型前导体的核苷酸(nucleotide)序列与用于多肽的核苷酸序列可操作地连接;如果其影响编码序列的转录,启动子或增强子序列与编码序列可操作地连接;如果其被定位以促进核糖体与核酸结合,核酸核糖体结合位点与编码序列可操作地连接。
本文所用的遗传背景定义为植物中所有基因或特定基因(例如,除基因工程修饰之外的所有基因)集合的总和。相同物种的植物可以被称为具有相同基因或相同遗传背景的植物。基因工程植物可以包括本文所述的工程核酸或多核苷酸,但是另外还具有与相同遗传背景的非基因工程植物相同的基因。
用于权利要求和说明书相应部分的词“一种”(a)和“一个”(one),除特别声明外,定义为包括一个或多个引用项。该术语包括以上特别提到的词、其派生词和类似含义的词。短语“至少一种”之后列出的两项或多项,如“A、B或C”,意思为A、B或C中的任意单独的一个以及它们任意的组合。
一种实施方式包括基因工程植物,该基因工程植物含有编码改变的葡聚糖水合二激酶的工程核酸。与具有相同遗传背景但含有野生型(wt)GWD的植物相比,基因工程植物具有升高的淀粉水平。与包含在具有相同遗传背景的植物中的野生型(wt)GWD相比,改变的GWD的活性可以被降低。基于wt GWD的水平,降低的水平可以是20、30、40、50、60、70、80、90、91、92、93、94、95、96、97、98、99或100%。可以通过监测植物中的淀粉含量,例如,通过使用本文实施例3中所述的傅里叶变换近红外(FT-NIR)技术来检测GWD的活性。改变的GWD可能是无活性的。增加的淀粉水平表明GWD的活性降低。
在一种实施方式中,基因工程植物中的工程核酸可以含有内源核酸,所述内源核酸包括编码GWD蛋白但与野生型植物相比具有一种或多种修饰的gwd基因的至少一个等位基因。所述修饰可以通过对植物或其原种(ancestors)进行基因工程改造实现。所述内源核酸可以是工程植物中gwd基因的一个或多个等位基因。所述修饰可以位于gwd的编码序列中。所述内源核酸可以含有以下序列、基本上由以下序列组成或由以下序列组成:与参考序列具有至少70、72、75、80、85、90、91、92、93、94、95、96、97、98、99或100%同一性的序列,所述参考序列选自SEQ ID NO:1(Zm GWD编码序列)或SEQ ID NO:2(Sb GWD编码序列)。所述工程核酸可以包括相对于内源核酸的至少一个突变。与内源核酸相比,所述突变可以包括一个或多个核苷酸的插入。与天然核酸相比,突变可以包括核苷酸的缺失。与内源核酸相比,突变可以包括一个或多个核苷酸的取代。突变可以是几个突变的组合。所述至少一个突变可以在靶序列内与参考序列具有至少70、72、75、80、85、90、91、92、93、94、95、96、97、98、99或100%的同一性,所述参考序列选自SEQ ID NO:1(Zm GWD编码序列)、SEQ ID NO:2(SbGWD编码序列)、SEQ ID NO:3(Zm GWD外显子24+内含子)、SEQ ID NO:4(SbGWD外显子24+内含子)、SEQ ID NO:91(GWDe1a)、SEQ ID NO:92(GWDe24b)、SEQ ID NO:93(GWDe24c)、SEQ IDNO:94(GWDe25a)、SEQ ID NO:182(ZmGWD外显子24)、SEQ ID NO:183(Sb GWD外显子24)、SEQID NO:184(SbGWD外显子7)和SEQ ID NO:189(Zm GWD外显子25)。
在一种实施方式中,基因工程植物中的工程核酸可以是内源核酸,所述内源核酸包括编码GWD蛋白但具有通过对植物或其原种进行基因工程改造制备得到的具有一个或多个修饰的gwd基因的至少一个等位基因。内源基因可以是工程植物中gwd基因的一个或多个等位基因。修饰可以位于gwd的编码序列中。内源核酸可以含有以下序列、基本上由以下序列组成或由以下序列组成:与参考序列具有至少70、72、75、80、85、90、91、92、93、94、95、96、97、98、99或100%同一性的序列,所述参考序列选自SEQ ID NO:1(Zm GWD编码序列)或SEQID NO:2(Sb GWD编码序列)。工程核酸可以包括相对于内源核酸的至少一个突变。与内源核酸相比,突变可以包括一个或多个核苷酸的插入。与天然核酸相比,突变可以包括核苷酸的缺失。与内源核酸相比,突变可以包括一个或多个核苷酸的取代。突变可以是几个突变的组合。所述至少一个突变可以在与参考序列具有至少70、72、75、80、85、90、91、92、93、94、95、96、97、98、99或100%的同一性的靶序列内,所述参考序列选自SEQ ID NO:1(Zm GWD编码序列)、SEQ ID NO:2(Sb GWD编码序列)、SEQ ID NO:3(Zm GWD外显子24+内含子)、SEQ ID NO:4(SbGWD外显子24+内含子)、SEQ ID NO:91(GWDe1a)、SEQ ID NO:92(GWDe24b)、SEQ ID NO:93(GWDe24c)、和SEQ ID NO:94(GWDe25a)、SEQ ID NO:182(ZmGWD外显子4)、SEQ ID NO:183(Sb GWD外显子24)、SEQ ID NO:184(SbGWD外显子7)和SEQ ID NO:189(Zm GWD外显子25)。
在一种实施方式中,基因工程植物中的工程核酸含有玉米gwd基因的外显子24经过修饰的序列。工程核酸可以含有以下序列、基本上由以下序列组成或由以下序列组成:与参考序列具有至少70、72、75、80、85、90、91、92、93、94、95、96、97、98、99或100%同一性的多核苷酸,所述参考序列选自SEQ ID NO:12-40、114-118、119-120和131–146,其包含玉米gwd基因中的突变。
在一种实施方式中,基因工程植物中的工程核酸可以含有在野生型Zm GWD基因(SEQ ID NO:1)的区域内具有一个或多个修饰的修饰序列,所述修饰序列位于3030核苷酸(nt,碱基)至3243nt。在一种实施方式中,基因工程植物中的工程核酸可以含有在野生型ZmGWD基因(SEQ ID NO:1)的从3157nt至3213nt的位置内具有一个或多个修饰的修饰序列。在一种实施方式中,基因工程植物中的工程核酸可以含有在野生型Zm GWD基因外显子24(SEQID NO:3)的从81nt至160nt的位置内具有一个或多个修饰的修饰序列。
在一种实施方式中,基因工程植物中的Zm GWD基因可以含有相对于野生型Zm GWD基因(SEQ ID NO:1)具有序列变化的修饰序列,其选自SEQ ID NO:12-40、114-118、119-120和131-146中的一个。具有位于变化位置之外的变化的Zm GWD序列可以与SEQ ID NO:1的相应区域具有至少70、72、75、80、85、90、91、92、93、94、95、96、97、98、99或100%的同一性。所述变化可以与SEQ ID NO:12-40、114-118、119-120和131-146中的一个相同或不同。
在一种实施方式中,基因工程植物中的工程核酸可以含有高粱gwd基因的外显子24的经修饰的序列。工程核酸可以含有以下序列、基本上由以下序列组成或由以下序列组成:与参考序列具有至少70、72、75、80、85、90、91、92、93、94、95、96、97、98、99或100%同一性的序列,所述参考序列选自SEQ ID NO:106(Sb4715_1((WT+ins)_外显子24)和SEQ IDNO:107(Sb4715_2(WT+del)_外显子24),这些是在高粱gwd基因的外显子24上的突变体。在一种实施方式中,基因工程植物的工程核酸可以含有在野生型Sb GWD基因(SEQ ID NO:2)的3030nt至3243nt位置内具有一个或多个修饰的修饰序列。基因工程植物的工程核酸可以含有在野生型Sb GWD基因(SEQ ID NO:2)的736nt至969nt位置内具有一个或多个修饰的修饰序列。改变的GWD可以由本文中任意一种工程核酸编码。
在一种实施方式中,基因工程植物可以含有改变的玉米(Zea mays)GWD(Zm GWD)。改变的Zm GWD可以含有以下氨基酸序列、基本上由以下氨基酸序列组成或由以下氨基酸序列组成:与参考序列具有至少70、72、75、80、85、90、91、92、93、94、95、96、97、98、99或100%的同一性,所述参考序列选自SEQ ID NO:45-73(Zm GWD突变蛋白M1-M29)、121-125(Zm GWD突变蛋白M32-M36)、126-127(Zm GWD突变蛋白M38-M39)和147-162(Zm GWD突变蛋白M40-M55)。
在一种实施方式中,基因工程植物中的改变的ZmGWD蛋白可以含有在野生型ZmGWD蛋白(SEQ ID NO:43)的1040氨基酸(aa)至1120aa的位置内具有一个或多个修饰的修饰序列。基因工程植物中的改变的ZmGWD蛋白可以含有在野生型Zm GWD蛋白(SEQ ID NO:43)的1054aa至1081aa的位置内具有一个或多个修饰的修饰序列。基因工程植物中的改变的ZmGWD蛋白可以含有在野生型Zm GWD蛋白(SEQ ID NO:43)的1011aa至1057aa的位置内具有一个或多个修饰的修饰序列。基因工程植物中的改变的ZmGWD蛋白可以含有在野生型ZmGWD蛋白(SEQ ID NO:43)的1082aa至1116aa的位置内具有一个或多个修饰的修饰序列。
在一种实施方式中,基因工程植物中的Zm GWD蛋白可以含有相对于野生型Zm GWD蛋白(SEQ ID NO:43)具有序列变化的的修饰序列,其选自SEQ ID NO:45-73(Zm GWD突变蛋白M1-M29)、121-125(Zm GWD突变蛋白M32-M36)、126-127(Zm GWD突变蛋白M38-M39)和147-162(Zm GWD突变蛋白M40-M55)中的一个。具有位于变化位置之外的变化的Zm GWD序列可以与SEQ ID NO:43的相应区域具有至少70、72、75、80、85、90、91、92、93、94、95、96、97、98、99或100%的同一性。所述变化可以与SEQ ID NO:45-73(Zm GWD突变蛋白M1-M29)、121-125(Zm GWD突变蛋白M32-M36)、126-127(Zm GWD突变蛋白M38-M39)和147-162(Zm GWD突变蛋白M40-M55)中的一个相同或不同。
在一种实施方式中,基因工程植物可以含有改变的高粱(Sorghum bicolor)GWD(Sb GWD)。改变的Sb GWD可以包含以下氨基酸序列、基本上由以下氨基酸序列组成或由以下氨基酸序列组成:与参考序列具有至少70、72、75、80、85、90、91、92、93、94、95、96、97、98、99或100%的同一性,所述参考序列选自SEQ ID NO:194(Sb GWD突变蛋白Sb4715_1WT+ins)和SEQ ID NO:195(Sb GWD突变蛋白Sb4715_2WT+del)。本文的核酸、核苷酸序列、蛋白或氨基酸序列可以被分离、纯化、化学合成或通过重组DNA技术产生。所有这些方法是本领域公知的。
在一种实施方式中,基因工程植物可以是任何类型的植物。基因工程植物可以是但不限于单子叶植物(monocotyledonous plant)、双子叶植物(dicotyledonous plant)、C4植物、C3植物、玉米(corn)、大豆(soybean)、水稻(rice)、甘蔗(sugar cane)、甜菜(sugarbeet)、高粱(sorghum)、柳枝稷(switchgrass)、芒草(miscanthus)、桉树(eucalyptus)、小麦、苜蓿(alfalfa)、柳树(willow)或杨树(poplar)。基因工程植物可以来自能源作物(energy crop plant)、饲料作物(forage crop plant)或食物作物(food crop plant)。所述能源作物植物可以是玉米植物、柳枝稷植物、高粱植物、杨树植物或芒草植物。所述饲料作物植物可以是玉米植物、苜蓿植物、高粱植物或大豆植物。所述食物作物植物可以是玉米植物、小麦植物、大豆植物、水稻植物或番茄植物。
基因工程植物可以是转基因植物或突变植物。基因工程植物可以是转基因植物或突变植物的子代(progeny),或转基因植物或突变植物的后代(descendant)。
基因工程植物可以是在编码GWD的基因的核酸序列中具有一个或多个突变的常规突变体,其导致GWD的表达受抑制或GWD的活性降低。所述突变可以是GWD编码基因序列中核酸的缺失、插入或取代。与具有相同遗传背景但表达野生型GWD的非突变植物相比,常规突变体可以具有改变的营养性淀粉水平。
如本文所用,基因工程植物可以指完整的转基因植物或突变植物或其部分。该部分可以是但不限于叶、茎、花、芽、花瓣、子房、果实或种子中的一种或多种。该部分可以是来自转基因植物或突变植物的愈伤组织(callus)。基因工程植物可以从转基因植物或突变植物的部分或者从植株再生。基因工程植物可以是第一转基因植物和第二转基因植物或非转基因植物的有性杂交的产物,其中,产物植物保留了被引入至第一转基因植物的工程核酸。基因工程植物可以是第一突变植物和第二非突变植物的有性杂交的产物,其中,产物植物保留了被引入第一突变植物的突变。转基因植物或突变植物可以是本文所述的转基因植物或突变植物中的任意一种。
在一种实施方式中,提供了含有改变的葡聚糖水合二激酶的植物的基因工程方法。所述方法可以包括将至少一种含有编码葡聚糖水合二激酶的内源基因中的靶序列的植物细胞与载体接触。所述载体可以含有编码能够诱导靶序列上的单链断裂或双链断裂的核酸酶的第一核酸。载体可以通过转化或以其他基因工程的方式被引入植物。转化可以为使用含有编码核酸酶的第一核酸的载体的农杆菌(Agrobacterium)介导的转化。如前所述,核酸酶可以切割靶序列(Puchta et al.,1993;Wright et al.,2005;Wehrkamp-Richter etal.,2009;Cong et al.,2013;Belhaj et al.,2013,全部通过引用并入本文,如同完整阐述)。核酸酶可以是但不限于大范围核酸酶、Cas9核酸酶、锌指核酸酶(zinc fingernuclease)或转录激活子样效应物核酸酶(transcription activator-like effectornuclease)。
如本文所述,所述核酸酶可以是大范围核酸酶。大范围核酸酶可以引入单链或双链DNA断裂并且具有长度为14至40个核苷酸的识别位点,提供良好的特异性。对于大范围核酸酶用于靶向修饰的用途,参见Rosen et al.,2006;Wehrkamp-Richter et al.,2009;Djukanovic et al.,2013,全部通过引用并入本文,如同完整阐述。大范围核酸酶可以是LAGLIDADG归巢核酸内切酶(LHE)。LAGLIDADG归巢核酸内切酶(LHEs)是天然的基因靶向蛋白,其编码序列存在于内含子或内含肽(intein)中。参见Arnould et al.,2011,全部通过引用并入本文,如同完整阐述。大范围核酸酶可以是I-CreI归巢核酸内切酶。如本文所用,I-CreI归巢核酸内切酶是天然存在于莱茵衣藻(Chlamydomonas reinhardtii)的叶绿体中的大范围核酸酶,并且是含有对于核酸酶酶活性很重要的单一序列基序(motif)的被充分表征的蛋白质。参见Heath et al.,1997,全部通过引用并入本文,如同完整阐述。I-CreI核酸内切酶适用于蛋白质工程,并且被用于包括植物在内的若干物种中的靶向基因组修饰。参见Rosen et al.,2006;Arnould et al.,2007;Djukanovic et al.,2013,全部通过引用并入本文,如同完整阐述。大范围核酸酶可以是I-DmoI、I-SceI、E-DmeI或DmoCre。可以使用其他大范围核酸酶。
大范围核酸酶可以由与参考序列具有至少70、72、75、80、85、90、91、92、93、94、95、96、97、98、99或100%同一性的序列编码,所述参考序列选自由SEQ ID NO:108(4715_大范围核酸酶)和SEQ ID NO:109(4716_大范围核酸酶)所组成的组。
在一种实施方式中,所述核酸酶可以是Cas9核酸酶。所述Cas9核酸酶是在规律成簇间隔短回文重复(Clustered Regularly Interspaced Short Palindromic Repeats,CRISPR)/CRISPR相关蛋白9(Cas9)系统中使用的核酸酶(Cong et al.,2013;Belhaj etal.,2013,两者均通过引用并入本文,如同完整阐述)。CRISPR/Cas9是基因组编辑技术,由于它的低成本、高效率和对技术人员来说相对简单,所以该技术有潜力成为各种物种基因组编辑的可选技术,但是其尚未被证明通过使用稳定转化可以在多细胞植物中起作用。CRISPR/Cas9系统可以包括Cas9核酸酶和单引导RNA(single guide RNA,sg RNA)。本文的Cas9核酸酶可以由与SEQ ID NO:74(Cas9核酸酶)或SEQ ID NO:75(ZmCas9)的参考序列具有至少70、72、75、80、85、90、91、92、93、94、95、96、97、98、99或100%同一性的序列编码。所述核酸酶可以对能够使核酸酶切割靶序列的序列具有亲和力,或者可以通过使用sgRNA将其引导至靶序列。本文的载体可以进一步含有编码sgRNA的第二核酸序列。内源基因的靶向修饰可以通过在植物细胞中表达Cas9和sgRNA来进行。sgRNA嵌合体分子可以含有非翻译的CRISPR RNA(crRNA),一个与具有3bp前间区序列邻近基序(protospacer adjacent motif,PAM)序列的靶基因组DNA序列互补的20bp间隔序列(Jinek et al.,2012,通过引入并入本文,如同完整阐述)。Cas9核酸酶可以从植物例如拟南芥(Arabidopsis)、玉米、烟草、水稻、小麦和高粱中的PPDK、CaMV 35S、肌动蛋白或泛素启动子表达。sgRNA可以主要从RNA聚合酶III启动子U6或U3和从RNA聚合酶II启动子CaMV E35S表达(Belhaj et al.,2013;Upadhyayet al.,2014,二者通过引用并入本文,如同完整阐述)。sgRNA可以从本文所述的SEQ IDNO:78(MzU3.8)、SEQ ID NO:79(ZmU3)、ZmU3P1(SEQ ID NO:82)、ZmU3P2(SEQ ID NO:84)或ZmU3.8启动子(SEQ ID NO:86)表达。所述启动子可以与SEQ ID NO:78(MzU3.8)、SEQ IDNO:79(ZmU3)、ZmU3P1(SEQ ID NO:82)、ZmU3P2(SEQ ID NO:84)或ZmU3.8启动子(SEQ IDNO:86)中的一种具有70、72、75、80、85、90、91、92、93、94、95、96、97、98、99或100%的同一性。所述启动子可以具有等于SEQ ID NO:78(MzU3.8)、SEQ ID NO:79(ZmU3)、ZmU3P1(SEQID NO:82)、ZmU3P2(SEQ ID NO:84)或ZmU3.8启动子(SEQ ID NO:86)中的一种的核苷酸长度的长度。比SEQ ID NO:78(MzU3.8)、SEQ ID NO:79(ZmU3)、ZmU3P1(SEQ ID NO:82)、ZmU3P2(SEQ ID NO:84)或ZmU3.8启动子(SEQ ID NO:86)更短的启动子的同一性百分数可以如上所述沿着较短启动子的长度。Cas9核酸酶可以将单链断裂或双链DNA断裂引入包含在基因组DNA中的内源核酸中。随后,由Cas9在基因组DNA中引入的断裂可以通过两种不同的机制NHEJ(非同源末端连接)和HR(同源重组)(Symington and Gautier,2011,通过引用并入本文,如同完整阐述)进行修复。
在一种实施方式中,所述核酸酶可以是转录激活子样效应物核酸酶(transcription activator-like effector nucleases,TALEN)。本文所用的TALEN是指来自黄单胞菌属(Xanthomonas)的蛋白质。TALEN是可程序化运行的融合蛋白,其包含与FokI核酸内切酶的DNA切割结构域融合的TAL效应子的工程DNA结合结构域(Boch and Bonas,2010;Christianet al.,2010;Joung and Sander,2013;Li et al.,所有这些文献通过引用并入本文,如同完整阐述)。这些嵌合蛋白可以以成对的两个单体起作用,以将FokI核酸内切酶靶向作用于基因组内用于DNA切割的特定DNA序列。可以修饰TAL DNA结合结构域以识别不同的序列(Cermak et al.,2011,其通过引用并入本文,如同完整阐述)。
在一种实施方式中,所述核酸酶可以是锌指核酸酶。(Wright et al.,2005;Shuklaet al.,2009,二者通过引用并入本文,如同完整阐述)。
在一种实施方式中,所述核酸酶可以是任何其他的适用于靶序列的靶向修饰的核酸酶。
所述靶序列可以为靶基因。所述靶基因可以是植物天然的内源基因。所述靶序列可以是植物的gwd基因。所述靶序列可以被包含在SEQ ID NO:1(Zm GWD编码序列)或SEQ IDNO:2(Sb GWD编码序列)内。靶序列可以是包含在编码GWD的内源核酸的外显子中的任何核酸序列。所述靶序列可以被包含在编码玉米GWD的内源核酸的外显子中。所述靶序列可以包含在编码高粱GWD的内源核酸的外显子中。靶序列可以包含在编码GWD的内源核酸的外显子1、外显子7、外显子24或外显子25中。所述靶序列可以是大范围核酸酶的靶序列。所述靶序列可以含有以下序列、基本上由以下序列组成或由以下序列组成:与SEQ ID NO:41(大范围核酸酶GWD-9/10x.272靶序列(pAG4715))或SEQ ID NO:42(大范围核酸酶GWD-7/8x靶序列(pAG4716))具有至少70、72、75、80、85、90、91、92、93、94、95、96、97、98、99或100%同一性的序列。所述靶序列可以是Cas9核酸酶的靶序列。所述靶序列可以含有以下序列、基本上由以下序列组成或由以下序列组成:与SEQ ID NO:91(GWDe1a)、SEQ ID NO:92(GWDe24b)、SEQID NO:93(GWDe24c)或SEQ ID NO:94(GWDe25a)具有至少70、72、75、80、85、90、91、92、93、94、95、96、97、98、99或100%同一性的序列。所述sgRNA能够结合靶序列,所述靶序列选自由SEQ ID NO:91(GWDe1a)、SEQ ID NO:92(GWDe24b)、SEQ ID NO:93(GWDe24c)和SEQ ID NO:94(GWDe25a)所组成的组。所述靶序列可以是与sgRNA杂交的任何序列。所述核酸酶可以对能够使核酸酶切割靶序列的序列具有亲和力,或者可以通过使用sgRNA将其引导至靶序列。
一旦表达,核酸酶将在靶序列中引起单链或双链DNA断裂。例如,核酸酶可以切断短片段,然后可以通过细胞的DNA修复机制进行部分修复,但是在靶序列内留下损伤。修复的靶序列可以包括改变。所述改变可以包括突变。所述突变可以是靶序列中一个或多个核苷酸的插入、缺失或取代中的至少一种。所述突变可以是无效突变(null mutation)。如本文所用,术语“无效突变”是指基因中的突变,能够导致其不被转录成RNA或翻译成功能性蛋白质。由于靶序列中的突变,天然核酸序列可以编码改变的GWD。改变的GWD的活性可以被降低。降低的水平可以是野生型GWD活性水平的20、30、40、50、60、70、80、90、91、92、93、94、95、96、97、98、99或100%,其可以通过使用本文实施例3中所述的傅里叶变换近红外(FT-NIR)技术来监测植物中的淀粉含量进行检测。改变的GWD可能是无活性的。与具有相同遗传背景的非基因工程植物相比,基因工程植物具有升高的淀粉水平。
所述方法可以包括选择含有靶序列的改变的植物细胞。所述方法可以包括从植物细胞再生含有所述改变的植物。所述基因工程植物对于该改变可以是纯合的。
所述基因工程植物对于所述改变可以是杂合的。本文中的基因工程植物对于含有突变的基因可以是杂合的。所述基因可以包括编码改变的GWD的工程核酸。杂合植物可以含有编码野生型、未改变的GWD的内源基因的等位基因。当编码GWD的基因的至少一个等位基因缺失时,所述杂合植物还可以包括半合子植物。杂合植物可以在表型上与野生型植物无法区分,并且可以不具有升高的淀粉水平。为了产生具有升高的淀粉水平的纯合植物,杂合的基因工程植物可以进行自交。可以从这样的杂交获得子代。所述子代可以包括纯合子、杂合子和野生型植物。杂合植物可以在表型上与野生型植物无法区分。所述方法可以包括分析所述子代是否存在所述改变,并选择含有所述改变的子代植物。
在一种实施方式中,所述方法可以进一步包括为了相同的改变将杂合的基因工程植物与另一个杂合的基因工程植物杂交。该方法可以包括选择对于该改变是纯合的第一子代植物。所述方法可以进一步包括将基因工程植物与相同遗传背景的野生型植物杂交。可以从这样的杂交获得子代。子代可以包括杂合植物和野生型植物。所述方法可以包括选择对于所述改变是杂合的第一子代植物。所述方法可以进一步包括使第一杂合子代植物自交和选择对于该改变是纯合的第二子代植物。
本文的基因工程植物对于含有突变的基因来说可以是纯合的或杂合的,并且可以含有编码核酸酶的转基因。所述编码核酸酶的转基因可以在上述杂交过程中分离。
一种实施方式包括生产对于编码蛋白质的工程核酸是纯合的基因工程植物的方法。工程核酸可以编码隐性性状。所述隐性性状可以包括基因的切割的内源靶序列。所述隐性性状仅可以在不含有基因的未改变的野生型等位基因的植物中观察到。该方法可以包括通过修饰内源核酸的序列以制备工程核酸。该方法还可以包括将隐性性状育种至其他作物品系中。该方法可以包括保持作物品系的性状。该方法可以包括产生纯合子代。该方法可以包括制备具有隐性性状的杂种种子。
一种实施方式包括通过本文所述的任意一种方法获得的基因工程植物。
一种实施方式包括提高植物中淀粉水平的方法。该方法可以包括在植物中表达编码大范围核酸酶的核酸。该方法可以包括在植物中表达编码TALEN的核酸。该方法可以包括表达编码Cas9核酸酶的第一核酸和编码靶向特定序列的所需引导RNA的第二核酸。核酸在植物中的表达可以改变内源DNA序列的功能或编码。核酸在植物中的表达可以改变植物中GWD的活性和淀粉代谢。所述植物可以是本文中的任意转基因或突变植物。所述植物可以是转基因植物或突变植物的子代。核酸可以包含在基因构建体中。该方法可以包括制备本文中的任意基因工程植物。所述基因工程植物或其子代可以是通过本文的方法得到的淀粉水平升高的的植物。
具有编码大范围核酸酶的核酸的基因构建体可以在所述方法中的任意点被表达,所述大范围核酸酶可以灭活或抑制参与植物中淀粉动员的GWD蛋白的表达。所述核酸可以在处理植物的步骤之前表达。所述核酸可以在处理植物的步骤期间表达。所述表达可以被诱导。在表达核酸时,与具有相同遗传背景但缺少一个或多个基因构建体的非基因工程植物中的淀粉水平相比,所述基因工程植物可以具有改变的营养性淀粉水平。
本文的任意基因工程植物可以由农业加工方法、制备动物饲料的方法或饲喂动物的方法提供。提供基因工程植物的步骤可以包括从生产它的另一方获得。提供的步骤可以包括制备基因工程植物。所述基因工程植物可以是转基因植物或突变植物。提供的步骤可以包括通过将植物与本文的任意一种基因构建体接触以进行转化。提供的步骤可以包括通过本文所述的任何方法或已知方法稳定转化植物。提供的步骤可以包括将植物与含有编码核酸酶的多核酸的基因构建体接触之后,通过在植物中瞬时表达的核酸酶识别的切割位点切割编码参与淀粉代谢的蛋白的基因以对植物进行基因工程改造。提供的步骤还可以包括从具有改变的营养性淀粉水平的基因工程植物的组织再生植物。提供的步骤可以包括获得来自自花授粉或基因工程植物与非基因工程植物之间的异花授粉产生的基因工程植物的子代。提供的步骤可以包括获得纯合的子代。所述纯合的子代可以是近交植物。所述纯合的子代可以是杂交植物。基因工程植物可以被用于多种后续方法或用途。提供的步骤可以包括购得所述基因工程植物。提供的步骤可以包括使基因工程植物可用于进一步加工步骤。提供步骤可以包括使基因工程植物可用于作为动物饮食的部分。
在农业加工方法中,基因工程植物可以是具有升高的淀粉水平经改造的原料和/或表达一种或多种多糖降解酶的原料。所述原料可以包括单独的或与其他组分组合的任何基因工程植物。所述其他组分可以包括其他植物材料。农业加工可以包括操作或转换任何农业原料,包括用于特定产品或用途的基因工程植物。农业加工可以包括干燥基因工程植物。农业加工可以包括发酵基因工程植物。农业加工可以包括使用一种或多种外源酶水解基因工程植物以获得生化产物。所述外源酶可以是木质素降解酶、纤维素降解酶或半纤维素降解酶。所述外源酶可以是糖苷酶、木聚糖酶、纤维素酶、内切葡聚糖酶、外切葡聚糖酶、纤维二糖水解酶、β-木糖苷酶、阿魏酸酯酶(feruloyl esterases)、β-葡糖苷酶和淀粉酶。所述外源酶可以从供应商处购买,并且可以包括可以从杰能科国际公司(GenencorInternational,罗切斯特,纽约)获得的Accellerase 1000、Accellerase 1500、Accelerase TRIO TM和Accellerase XY。所述外源酶可以包括来自诺维信公司(Novozymes,丹麦)的Cellic、CTEC、HTEC。所述外源酶可以包括淀粉降解酶。所述外源酶可以包括淀粉酶或转化酶。所述农业加工方法可以包括同时糖化和发酵可溶性糖以生产乙醇。
本文所述的农业加工方法可以包括收获具有升高的淀粉水平的基因工程植物,以用作农业加工的原料。该方法可以包括将基因工程植物与植物生物质相结合。所述植物生物质可以包括非基因工程植物。所述植物生物质可以是基因工程植物生物质。所述基因工程植物生物质可以表达多糖降解酶。通过将基因工程植物与表达多糖降解酶的植物生物质组合,本文所述的方法可以不需要苛刻的预处理,以提高纤维素细胞壁对外源酶的易接近性。本文的方法可以利用用于表达细胞壁降解酶的植物生物质的固结预处理和水解的任何方法和组合物,所述细胞壁降解酶于2012年3月7日提交的申请号为13/414,627的美国专利申请和2012年3月7日提交的申请号为PCT/US2012/028132的国际专利申请中进行描述,均通过引用并入本文,如同完整阐述。具有改变的升高的淀粉水平的植物在2011年6月27日提交的申请号为PCT/US2011/041991的国际专利申请、2013年3月19日提交的申请号为13/806,654的美国专利和2013年3月11日提交的申请号为13/793,078的美国专利申请中进行了描述,全部通过引用并入本文,如同完整阐述。
基因工程植物可以以制备动物饲料的方法提供。制备动物饲料可以包括将基因工程植物与动物饲料(包括但不限于玉米、谷物、大豆和/或其他饲料)相结合。制备动物饲料可以包括青贮基因工程植物,以制备青贮饲料。制备动物饲料可以包括将基因工程植物与酒糟(distillers’grains)组合。制备动物饲料可以包括将基因工程植物造粒成饲料颗粒。制备动物饲料可以包括将基因工程植物与可食用纤维源组合。制备动物饲料可以包括将基因工程植物与蛋白质源组合。制备动物饲料可以包括将基因工程植物与一种或多种作为能量源的碳水化合物组合。制备动物饲料可以包括将基因工程植物与本文所述的一种或多种外源酶组合。
农业加工方法或制备动物饲料的方法还可以包括收获(harvesting)、打包(baling)、研磨(grinding)、碾磨(milling)、切碎(chopping)、减小尺寸、粉碎(crushing)、从原料中提取组分、纯化原料的组分或部分、提取或纯化淀粉、将多糖水解成寡糖或单糖、原料的化学转化或化学催化。
在一种实施方式中,提供了在营养组织中含有升高的淀粉水平的动物饲料制剂。动物饲料制剂可以被用于通过饲喂动物具有升高的淀粉水平的植物材料以提高牛奶和牛肉产量。发酵过程中可用的易发酵的糖可以由本文的实施方式提供。生物燃料的生产可以通过提供易发酵的糖来加强。提供易发酵的糖的方法和加强生物燃料的生产的方法作为本文的实施方式提供。动物饲料制剂可以含有一种或多种本文中的基因工程植物。动物饲料制剂可以包括本文的制备动物饲料的方法的产物。
具有升高的营养性淀粉水平的作物可以具有多种用途和效用。在一种实施方式中,提供了来自相对于野生型植物积累营养性淀粉升高水平的植物中的生物质。所述生物质可以来自本文中的任何基因工程植物或其子代。这些植物可以具有作为用于发酵过程或动物饲料应用的原料的附加值。例如,在典型的纤维素工艺中,存在于生物质中的多糖,例如,纤维素和半纤维素,被水解成单糖,然后可以通过微生物将其发酵成乙醇、丁醇、异丁醇、脂肪酸或其他烃类。由于生物质的难降解性,从聚合物如纤维素和半纤维素中释放单糖通常需要使用苛刻的预处理条件和使用相对昂贵的酶混合物进行水解。类似的情况发生在食用饲料,包括青贮玉米,作为营养和能量来源的反刍动物中。在反刍动物中,饲料被咀嚼并移动至瘤胃中,在其中纤维多糖,如纤维素和半纤维素,被瘤胃菌群中的微生物水解和发酵。这些有机物产生被动物吸收并代谢的脂肪酸,为动物提供营养。在反刍动物消化或生物燃料处理中,存在于生物质中的任何淀粉代表易于发酵的糖(即葡萄糖)的额外来源,其对水解较不耐受并且可以通过淀粉酶或温和的化学处理非常容易地释放。结果生物质中存在的淀粉量的任何增加将同时增加可回收的可发酵糖的量。含有升高水平的淀粉的生物质在饲料应用中可能具有更大的价值,其中,将植物材料喂养给家畜或奶畜。同样,存在于该材料中的过量淀粉比纤维素材料更容易被大多数动物消化,与具有普通水平的淀粉的生物质相比,每单位生物质提供更多的能量。实施方式包括将本文所述的植物用于这些方法中的任意一种。
本文中的方法,包括前面段落中的那些,可以包括下述内容中的至少一种:改造植物以产生基因工程植物、种植基因工程植物、收获基因工程植物、按照其他饲料作物将其加工(例如,减小饲料的尺寸、青贮、使用接种剂处理、与其他饲料组分组合,或造粒)用于动物饲料应用、或以与用于纤维素加工中使用的处理方式类似的方式发酵基因工程植物。所使用的纤维素加工步骤可以包括通过酶促或化学水解或消化来预处理和水解多糖成其组分糖。本文的方法中可以提供本段落中阐述的任何一个步骤,一组步骤或所有步骤。
一种实施方式包括基因构建体,旨在实施改变植物中营养性淀粉水平的策略。所述基因构建体可以含有编码能够切割编码GWD的内源核酸中的靶序列的核酸酶的第一工程核酸序列。所述第一工程核酸可以编码本文所述的任何一种核酸酶。所述基因构建体还可以含有编码sgRNA的第二工程核酸序列。所述第二工程核酸可以编码本文所述的任何一种sgRNA。所述基因构建体可以含有与第一工程核酸序列或第二工程核酸可操作地连接的启动子。所述可操作地连接的启动子可以允许编码核酸酶的第一工程核酸序列或编码sgRNA的第二工程核酸序列的转录。第一工程核酸序列的转录和翻译可以被称为核酸酶的表达。一旦表达,所述核酸酶可以切割内源核酸的靶序列。所述内源核酸可以编码GWD。所述第二核酸序列的转录可以导致识别内源核酸内的靶序列的sgRNA的产生,并将Cas9核酸酶引导至靶标以使其断裂。
所述基因构建体可以含有编码核定位信号的区域。本文所使用的SEQ ID NO:135核定位信号(nuclear localization signal,NLS)是指核蛋白内的碱性氨基酸序列的短基序。某些蛋白质从细胞质转运到核仁(nucleolus)中以发挥其特定功能,通过核包膜发生,并涉及核孔复合物(NPC)(Wagner et al.,1990,通过引用并入本文,如同完整阐述)。在该过程中,核定位信号(NLS)发挥重要的作用,因为它们被认为被NPC受体识别,随后通过核孔复合体转移蛋白质。NLS属于若干定义的类别之一(Garcia-Bustos et al.,1991,通过引用并入本文,如同完整阐述)。NLS可以是来自猿猴病毒40大T抗原的SV40NLS,由于其在各种包括植物在内的生物体中的活性而在靶向基因组修饰的实验中被集中使用(Kalderon etal.,1984;Raikhel,1992,这些都通过引用并入本文,如同完整阐述)。SV40NLS可以由与SEQID NO:163的参考序列具有至少70、72、75、80、85、90、91、92、93、94、95、96、97、98、99或100%的同一性的核酸序列编码。SV NLS可以含有以下序列、基本上由以下序列组成或由以下序列组成:与SEQ ID NO:196的参考序列具有至少70、72、75、80、85、90、91、92、93、94、95、96、97、98、99或100%同一性的氨基酸序列。所述NLS可以是植物特异性NLS序列。还描述了所述植物特异性NLS序列,例如,在玉米调节蛋白opaque-2和R(Varagona et al.,1992;Shieh et al.,1993,两者通过引用并入本文,如同完整阐述)。所述植物特异性NLS可以由与参考序列具有至少70、72、75、80、85、90、91、92、93、94、95、96、97、98、99或100%同一性的核酸序列编码,所述参考序列选自由SEQ ID NO:164(NLS1)、165(NLS3)、166(NLS4)、167(NLS5)和168(NLS6)所组成的组。所述植物特异性NLS可以含有以下序列、基本上由以下序列组成或由以下序列组成:与参考序列具有至少70、72、75、80、85、90、91、92、93、94、95、96、97、98、99或100%同一性的氨基酸序列,所述参考序列选自由SEQ ID NO:128(NLS1)、129(NLS3)、130(NLS4)、169(NLS5)和170(NLS6)所组成的组。所述NLS序列可以是衍生的NLS序列。NLS序列或其衍生物可以被用于将大范围核酸酶、ZFN、TALEN或Cas9蛋白靶向作用于植物细胞核中以用于靶向基因组修饰。一个或多个NLS序列可以与所述核酸酶的氨基酸序列相融合。
所述基因构建体可以进一步含有与编码核酸酶的核酸可操作地连接的一个或多个调节序列(也称为调节元件)。启动子可以是任何种类的启动子。所述启动子可以是诱导型启动子。所述启动子可以是组成型启动子。所述启动子可以是诱导型启动子,其仅当暴露于特定的化学或环境刺激时才启动编码核酸酶的核酸的转录。所述诱导型启动子的实例包括但不限于醇诱导型启动子、四环素诱导型启动子、类固醇诱导型启动子或激素诱导型启动子。所述启动子可以是组成型启动子,其在大多数细胞、组织和器官中以及在许多但不一定是所有发育阶段期间在整个植物中提供核酸或多核酸序列的转录。所述启动子可以对特定发育阶段、器官或组织具有特异性。组织特异性启动子可以能够在特定植物组织中启动转录。可以被组织特异性启动子靶向作用的植物组织可以为但不限于茎、叶、毛状体(trichomes)、花药(anther)或种子。本文的组成型启动子可以是水稻泛素3启动子(OsUbi3P)或玉米泛素启动子(ZmUbi1)。其他已知的组成型启动子可以是本文的基因构建体的一部分,并且包括但不限于花椰菜花叶病毒(Cauliflower Mosaic Virus,CAMV)35S启动子、夜香树黄化卷曲病毒启动子(Cestrum Yellow Leaf Curling Virus,CMP)或CMP短型(CMPS)、二磷酸核酮糖羧化酶小亚基启动子(Rubisco small subunit promoter)、水稻肌动蛋白启动子(rice actin promoter,OsAct1P)和玉米磷酸烯醇丙酮酸羧化酶启动子(maize phosphoenolpyruvate carboxylase promoter,ZmPepCP)。所述启动子可以是来自玉米的合成的核酸启动子。所述来自玉米的合成的核酸启动子可以含有以下序列、基本上由以下序列组成或由以下序列组成:与参考序列具有至少70、72、75、80、85、90、91、92、93、94、95、96、97、98、99或100%同一性的序列,所述参考序列选自由SEQ ID NO:78(MzU3.8)、SEQ ID NO:79(ZmU3)、ZmU3P1(SEQ ID NO:82)、ZmU3P2(SEQ ID NO:84)或ZmU3.8启动子(SEQ ID NO:86)所组成的组。所述合成的核酸启动子可以具有等于SEQ ID NO:78(MzU3.8)、SEQ ID NO:79(ZmU3)、ZmU3P1(SEQ ID NO:82)、ZmU3P2(SEQ ID NO:84)或ZmU3.8启动子SEQ ID NO:86)中的一种的核苷酸长度的长度。比SEQ ID NO:78(MzU3.8)、SEQ IDNO:79(ZmU3)、ZmU3P1(SEQ ID NO:82)、ZmU3P2(SEQ ID NO:84)或ZmU3.8启动子SEQ ID NO:86)短的启动子的同一性百分数可以如上所述沿着较短启动子的长度。一种实施方式包括本文所述的任何一种合成的核酸启动子。所述合成的核酸启动子可以与第一工程核酸或第二改造核酸分子可操作地连接,并且可以转录激活所述第一或第二工程核酸。作为转录激活的结果,所述第一或第二工程核酸可以在植物中组成型表达。
本文的基因构建体中的调节元件可以是终止子。终止子能够终止转录。终止子序列可以被包括在表达盒(expression cassette)的转录单元的3'端。所述转录单元可以编码核酸酶。所述终止子可以是来源于在多种植物基因中发现的终止子。所述终止子可以是来自根癌土壤杆菌(Agrobacterium tumefaciens)的胭脂碱合酶(NOS)或章鱼碱合酶(OCS)基因的终止子序列。所述终止子可以是酿脓链球菌(S.pyogenes)Cas9终止子(SEQ ID NO:88)。所述终止子可以是ZmU3T终止子(SEQ ID NO:89)。所述终止子序列可以是来自CaMV的CaMV 35S终止子,或显示出可以终止植物中转基因转录的任何3'UTR序列。例如,所述终止子可以是玉米PepC终止子(3'UTR)。所述基因构建体可以被包括在载体中。所述基因构建体可以被整合到基因工程植物的基因组中。所述基因构建体可以在基因工程植物中瞬时表达。
所述基因构建体可以被用于植物的转化。所述基因构建体可以被用于农杆菌(Agrobacterium)介导的植物转化。所述基因构建体可以通过任何已知的方法用于转化植物,例如,粒子轰击或直接DNA摄取。所述基因构建体可以被克隆并被并入载体中。
一种实施方式包括含有本文的基因构建体并适用于基因工程改造植物的载体。所述载体可以是中间载体。所述载体可以是转化载体。并入了本文的基因构建体的载体还可以含有另外的基因元件,例如,促进分子克隆的多克隆位点和一个或多个选择性标记物以促进选择。包含在载体中的选择性标记物可以是来自大肠杆菌(Escherichia coli)的磷酸甘露糖异构酶(PMI)基因,其赋予转化细胞利用甘露糖生长的能力。包含在载体中的选择性标记包括但不限于赋予卡那霉素抗性的新霉素磷酸转移酶(npt)基因、赋予潮霉素抗性的潮霉素磷酸转移酶(hpt)基因或赋予草甘膦抗性的烯醇丙酮酰莽草酸-3-磷酸合酶(enolpyruvylshikimate-3-phosphate synthase gene)基因。所述载体可以是在2013年3月11日提交的申请号为13/793,078的美国专利申请中描述的任何载体。全部通过引用并入本文,如同完整阐述。所述载体可以包括编码本文所述的任何一种核酸酶的基因构建体。所述载体可以含有与SEQ ID NO:108(大范围核酸酶4715)或SEQ ID NO:109(大范围核酸酶4716)的参考序列具有至少70、72、75、80、85、90、91、92、93、94、95、96、97、98、99或100%同一性的核酸序列。所述载体可以含有与SEQ ID NO:75(Zm Cas9)的参考序列具有至少70、72、75、80、85、90、91、92、93、94、95、96、97、98、99或100%同一性的核酸序列。所述载体可以含有与参考序列具有与至少70、72、75、80、85、90、91、92、93、94、95、96、97、98、99或100%同一性的序列,所述参考序列选自由SEQ ID NO:95(ZmU3P1:sgRNA_GWDe24b)、SEQ ID NO:96(ZmU3P2:sgRNA_GWDe24b)、SEQ ID NO:97(ZmU3.8P:sgRNA_GWDe24b)、SEQ ID NO:98(ZmU3P2:sgRNA_GWDe24c)、SEQ ID NO:99(ZmU3P2:sgRNA_GWDe25a)和SEQ ID NO:100(ZmU3P2:sgRNA_GWDe1a)所组成的组。本文所述的载体或基因构建体可以含有工程核酸。所述载体可以是pAG4715(图1)、pAG4716(图2)或其修饰,使用本文另外描述的对应物代替任何一处注释标志。在图1和2中注释的常规载体元件可以被本文中描述的或本领域已知的对应物替代。
一种实施方式包括工程核酸,该工程核酸含有以下序列、基本上由以下序列组成或由以下序列组成:与SEQ ID NO:41(大范围核酸酶GWD-9/10x.272靶序列(pAG4715))或SEQ ID NO:42(大范围核酸酶GWD-7/8x靶序列(pAG4716))具有至少70、72、75、80、85、90、91、92、93、94、95、96、97、98、99或100%同一性的序列。
一种实施方式包括工程核酸序列,该工程核酸序列含有以下序列、基本上由以下序列组成或由以下序列组成:与参考序列具有至少70、72、75、80、85、90、91、92、93、94、95、96、97、98、99或100%同一性的序列,所述参考序列选自由SEQ ID NO:91(GWDe1a)、SEQ IDNO:92(GWDe24b)、SEQ ID NO:93(GWDe24c)和SEQ ID NO:94(GWDe25a)所组成的组。
一种实施方式包括具有如本文所列的任意一个工程核酸或其互补序列中如前所述序列的工程核酸。在一种实施方式中,提供了具有与本文所列任何核酸的序列或其互补序列的核酸杂交的序列的工程核酸。在一种实施方式中,杂交条件是低严格度条件。在一种实施方式中,杂交条件是中严格度条件。在一种实施方式中,杂交条件是高严格度条件。用于优化杂交方案的杂交方案和方法的实例如下列书籍所述:Molecular Cloning,T.Maniatis,E.F.Fritsch,and J.Sambrook,Cold Spring Harbor Laboratory,1982;和Current Protocols in Molecular Biology,F.M.Ausubel,R.Brent,R.E.Kingston,D.D.Moore,J.G.Seidman,J.A.Smith,K.Struhl,Volume 1,John Wiley&Sons,2000,其全部内容通过引用并入本文,如同完整阐述。中等条件包括以下内容:在含有6×柠檬酸盐缓冲盐水(SSC;Amresco公司,梭伦,俄亥俄州)、0.5%十二烷基硫酸钠(SDS;Amresco公司,梭伦,俄亥俄州)、5xDenhardt溶液(Amresco公司,梭伦,俄亥俄州)和变性鲑精DNA(InvitrogenLife Technologies公司,卡尔斯巴德,加拿大)的溶液中,在68℃下预处理装载有DNA样品的滤器2-4小时。杂交在具有以下变化的相同溶液中进行:0.01M EDTA(Amresco公司,梭伦,俄亥俄州)、100μg/ml鲑鱼精DNA和5-20×106cpm的32P-标记的或荧光标记的探针。将滤膜在杂交混合物中孵育16-20小时,然后在含有2xSSC和0.1%SDS的溶液中洗涤15分钟。使用含有0.1×SSC和0.5%SDS的溶液代替洗涤溶液以进行第二次洗涤,并在低于Tm(熔融温度,℃)的20℃至29℃下再孵育2小时。Tm=81.5+16.61Log10([Na+]/(1.0+0.7[Na+]))+0.41(%[G+C])-(500/n)-P-F。[Na+]=钠离子的摩尔浓度。%[G+C]=DNA序列中G+C碱基的百分比。N=以碱基计的DNA序列长度。P=对于错配的碱基对%的温度校正(~1℃/1%错配)。F=甲酰胺浓度校正(=0.63℃/1%甲酰胺)。过滤器暴露于成像器或通过放射自显影进行显影。低严格度条件是指在37℃至60℃之间的低温下的杂交条件,并且在更高的[Na+](高达0.825M)和低于Tm 40℃至48℃的温度下进行的第二次洗涤。高严格度是指在高于68℃的高温下的杂交条件,并且在低于Tm 5℃至10℃的温度下在[Na+]=0.0165至0.0330M进行第二次洗涤。
在一种实施方式中,提供了工程核酸,该工程核酸具有沿着其长度与具有本文所述的任何一种序列的核酸或其补体的连续部分(contiguous portion)具有至少70、72、75、80、85、90、91、92、93、94、95、96、97、98、99或100%同一性的序列。所述连续部分可以为本文所述序列或其补体的全长。
确定两种氨基酸序列或两种核酸序列的同一性百分数可以包括比对和比较两种序列相应位置的氨基酸残基或核苷酸。如果两种序列的所有位置被完全相同的氨基酸残基或核苷酸占据,则所述序列被认为具有100%同一性。同一性百分数可以使用SmithWaterman算法测量(Smith TF,Waterman MS 1981“Identification of Common MolecularSubsequences,”J Mol Biol 147:195-197,其通过引用并入本文,如同完整阐述)。
一种实施方式包括工程核酸、工程多核苷酸或工程寡核苷酸,其具有如本文所列的任意一种核酸或其互补序列中所示的序列的一部分。这些工程核酸、工程多核苷酸或工程寡核苷酸可以具有10至全长、10至5000、10至4900、10至4800、10至4700、10至4600、10至4500、10至4400、10至4300、10至4200、10至4100、10至4000、10至3900、10至3800、10至3700、10至3600、10至3500、10至3400、10至3300、10至3200、10至3100、10至3000、10至2900、10至2800、10至2700、10至2600、10至2500、10至2400、10至2300、10至2200、10至2100、10至200010至1900、10至1800、10至1700、10至1600、10至1500、10至1400、10至1300、10至1200、10至1100、10至1000、10至900、10至800、10至700、10至600、10至500、10至400、10至300、10至200、10至100、10至90、10至80、10至70、10至60、10至50、10至40、10至35、10至30、10至25、10至20、10至15、或20至30个核苷酸、或10、15、20或25个核苷酸。具有在上述范围之一内的长度的工程核酸、工程多核苷酸或工程寡核苷酸可以具有在所述范围内(包括端点)的任何特定长度。所述核苷酸长度可以起始于参考序列(即,本文中的任何一个核酸)中的任何单一位置,其中,足够的核苷酸跟随在单一位置之后以适应所列出的长度。在一种实施方式中,杂交探针或引物与核酸具有85至100%、90至100%、91至100%、92至100%、93至100%、94至100%、95至100%、96至100%、97至100%、98至100%、99至100%或100%互补,所述核酸与探针和引物的长度相同,并且具有选自在本文所列的任何一种核酸中所述部分序列内的核苷酸的长度相当于探针或引物长度的序列。在一种实施方式中,杂交探针或引物沿着其长度与相应长度的具有本文所列的任意一种核酸中所述序列的核酸杂交。在一种实施方式中,杂交条件是低严格度的。在一种实施方式中,杂交条件是中严格度的。在一种实施方式中,杂交条件是高严格度的。
一种实施方式包括用于鉴定样品中编码葡聚糖水合二激酶的内源基因的修饰序列的试剂盒。所述试剂盒可以含有第一引物和第二引物。所述第一引物和第二引物能够扩增包含在编码葡聚糖水合二激酶的内源基因中的靶序列。所述靶序列可以含有与选自SEQID NO:1-4、75、170-184、186、187、189-193的参考序列具有至少70、72、75、80、85、90、91、92、93、94、95、96、97、98、99或100%同一性的核酸序列。所述试剂盒可以进一步含有一个或多个用于检测靶序列的扩增区域中的修饰的组件。所述试剂盒可以包含含有选自SEQ IDNO:6、7、9、11、101、103、105、110和111的核酸序列的第一引物。所述试剂盒可以包含含有选自SEQ ID NO:5、8、10、102和104的核酸序列的第二引物。所述试剂盒可以包含含有SEQ IDNO:6的核酸序列的第一引物和含有SEQ ID NO:5的核酸序列的第二引物。所述试剂盒可以包含含有SEQ ID NO:7的核酸序列的第一引物和含有SEQ ID NO:8的核酸序列的第二引物。所述试剂盒可以包含含有SEQ ID NO:9的核酸序列的第一引物和含有SEQ ID NO:10的核酸序列的第二引物。所述试剂盒可以包含含有SEQ ID NO:11的核酸序列的第一引物和含有SEQ ID NO:13的核酸序列的第二引物。所述试剂盒可以包含含有SEQ ID NO:110的核酸序列的第一引物和含有SEQ ID NO:13的核酸序列的第二引物。所述试剂盒可以包含含有SEQID NO:111的核酸序列的第一引物和含有SEQ ID NO:112的核酸序列的第二引物。所述试剂盒可以包含含有SEQ ID NO:105的核酸序列的第一引物和含有SEQ ID NO:13的核酸序列的第二引物。所述第一引物和第二引物能够扩增靶序列以产生扩增产物。所述扩增产物可以含有修饰的靶序列。所述修饰的靶序列能够在高严格度条件下与含有选自SEQ ID NO:12-40、114-116、188-189、19-120和131-162的序列的核酸序列杂交。所述修饰的靶序列可以被用作用于诊断在编码葡聚糖水合二激酶的内源基因中具有突变的基因工程植物的探针。样品可以包括来自目前存在的植物物质(plant matter)的核酸的任何样品。所述样品可以包括任何植物物质。所述植物物质可以来自植物或其部分。所述植物材料可以来自动物饲料或食物。
一种实施方式提供了鉴定样品中编码葡聚糖水合二激酶的内源基因的修饰的序列的方法。该方法可以包括将样品与第一引物和第二引物接触。该方法可以包括扩增含有被包含在编码葡聚糖水合二激酶的内源基因中的靶序列的合成的多核苷酸。所述靶序列可以是被包含在编码本文所述的葡聚糖水合二激酶的内源基因中的任何靶序列。所述第一引物和第二引物能够扩增靶序列以产生扩增产物。所述扩增产物可用于确定由有性杂交或自交产生的植物是否在靶序列中含有一个或多个修饰并诊断特异性突变体。来自突变植物的样品的扩增产物的长度可以不同于来自具有相同遗传背景的野生型植物的样品的扩增产物的长度。来自突变体样品的扩增产物可以进一步用于在高严格度条件下与包含编码突变蛋白的特定区域的合成的多核苷酸杂交的探针。该方法可以包括进一步检测至少一种探针与靶序列的特异性区域的杂交。
制备基因工程植物的方法、提高植物中淀粉水平的方法、农业加工方法、制备动物饲料的方法和用于生产对于编码改变的葡聚糖水合二激酶的工程核酸是纯合的基因工程植物的方法可以包括本文所述的检测方法,作为制备基因工程植物和/或鉴定包含本文中基因工程核酸的植物或植物生物质的部分。
以下列表包括本发明的特定实施方式。但是该列表不是限制性的,并且不排除替代实施方式或本文另外描述的实施方式。在下列实施方式列表中描述的同一性百分数是指沿着参考序列的全长所列举序列的同一性。
实施方式
1、一种合成的核酸启动子,该核酸启动子与参考序列具有至少70、72、75、80、85、90、91、92、93、94、95、96、97、98、99或100%的同一性,所述参考序列选自由SEQ ID NO:78(MzU3.8)、SEQ ID NO:79(ZmU3)、SEQ ID NO:82(ZmU3P1)、SEQ ID NO:84(ZmU3P2)和SEQ IDNO:86(MzU3.8P)所组成的组。
2、一种基因构建体,该构建体含有编码Cas9核酸酶的第一工程核酸序列,其中,所述Cas9核酸酶能够切割植物中编码葡聚糖水合二激酶的内源核酸中的靶序列。
3、实施方式2中的基因构建体,其中,第一合成的核酸序列与SEQ ID NO:74(Cas9核酸酶)或SEQ ID NO:75(ZmCas9)的参考序列具有至少70、72、75、80、85、90、91、92、93、94、95、96、97、98、99或100%同一性。
4、实施方式2和实施方式3中的一项或两项的基因构建体,其中,第一核酸与编码至少一个核定位信号(NLS)的多核苷酸序列融合。
5、实施方式2-4中任意一项或多项的基因构建体,其中,编码核定位信号的多核苷酸序列选自SEQ ID NO:163-168。
6、实施方式2-5中任意一项或多项的基因构建体,其进一步含有编码sgRNA的第二工程核酸序列,并且所述sgRNA能够结合靶序列。
7、实施方式6中的基因构建体,其中,所述第二工程核酸含有与参考序列至少70、72、75、80、85、90、91、92、93、94、95、96、97、98、99或100%的同一性的序列,所述参考序列选自SEQ ID NO:135(ZmU3P1:sgRNA_GWDe24b)、SEQ ID NO:136(ZmU3P2:sgRNA_GWDe24b)、SEQID NO:137(ZmU3.8P:sgRNA_GWDe24b)、SEQ ID NO:138(ZmU3P2:sgRNA_GWDe24c)、SEQ IDNO:139(ZmU3P2:sgRNA_GWDe25a)和SEQ ID NO:40(ZmU3P2:sgRNA_GWDe1a)。
8、实施方式2-7中任意一项或多项的基因构建体,其中,靶序列与参考序列具有至少70、72、75、80、85、90、91、92、93、94、95、96、97、98、99或100%的同一性,所述参考序列选自由SEQ ID NO:91(GWDe1a)、SEQ ID NO:92(GWDe24b)、SEQ ID NO:93(GWDe24c)和SEQ IDNO:94(GWDe25a)所组成的组。
9、实施方式2-8中任意一项或多项的基因构建体,其进一步含有与第一工程核酸可操作地连接的第一启动子和与第二工程核酸可操作地连接的第二启动子。
10、实施方式9中的基因构建体,其中,所述第一启动子或第二启动子为实施方式1中的合成的核酸启动子。
11、实施方式2-10中任意一项或多项的基因构建体,其进一步含有终止子。
12、实施方式11中的基因构建体,其中,所述终止子含有与SEQ ID NO:88具有至少90%同一性的核酸序列。
13、一种基因构建体,该基因构建体含有编码核酸酶的工程核酸序列,其中,所述核酸酶能够切割包含在编码葡聚糖水合二激酶的内源核酸中的靶序列。
14、实施方式13中的基因构建体,其中,所述核酸酶是由与参考序列具有至少70、72、75、80、85、90、91、92、93、94、95、96、97、98、99或100%同一性的序列编码的大范围核酸酶,所述参考序列选自由SEQ ID N:164(4715_大范围核酸酶)和SEQ ID NO:165(4716_大范围核酸酶)所组成的组。
15、实施方式13-14中任意一项或多项的基因构建体,其中,所述靶序列含有SEQID NO:41(大范围核酸酶GWD-9/10x.272)或SEQ ID NO:42(大范围核酸酶3e GWD-7/8x)的多核苷酸。
16、实施方式13-15中任意一项或多项的基因构建体,该基因构建体含有至少一种调节元件,其中,所述调节元件选自启动子、终止子和增强子。
17、一种载体,该载体含有实施方式2-16中任意一项或多项的基因构建体。
18、一种基因工程植物,该基因工程植物含有编码改变的葡聚糖水合二激酶的工程核酸,并且与具有相同遗传背景的非基因工程植物相比具有升高的淀粉水平。
19、实施方式18中的基因工程植物,其中,与具有相同遗传背景的非基因工程植物中的野生型葡聚糖水合二激酶相比,改变的葡聚糖水合二激酶的活性降低。
20、实施方式18中的基因工程植物,其中,所述改变的葡聚糖水合二激酶是无活性的。
21、实施方式18-20中任意一项或多项所述的基因工程植物,其中,所述工程核酸是编码葡聚糖水合二激酶的基因的一个等位基因的内源核酸的修饰序列。
22、实施方式18-21中任意一项或多项的基因工程植物,其中,植物中编码葡聚糖水合二激酶的基因的所有等位基因具有工程核酸的序列。
23、实施方式18-22中任意一项或多项的基因工程植物,其中,所述内源核酸含有与SEQ ID NO:1(Zm GWD编码序列)或SEQ ID NO:2(Sb GWD编码序列)的参考序列具有至少70、72、75、80、85、90、91、92、93、94、95、96、97、98、99或100%,同一性的序列。
24、实施方式18-23中任意一项或多项所述的基因工程植物,其中,所述工程核酸含有选自以下至少一种的突变:编码野生型GWD的核酸的内源性序列中一个或多个核苷酸的插入、缺失或取代。
25、实施方式24中的基因工程植物,其中,内源核酸中的靶序列中的突变与参考序列具有至少70、72、75、80、85、90、91、92、93、94、95、96、97、98、99或100%的同一性,所述参考序列选自SEQ ID NO:3(Zm GWD外显子24+内含子)、SEQ ID NO:4(SbGWD外显子24+内含子)、SEQ ID NO:182(ZmGWD外显子24)、SEQ ID NO:183(Sb GWD外显子24)、SEQ ID NO:184(SbGWD外显子7)和SEQ ID NO:189(Zm GWD外显子25)。
26、实施方式18-25中任意一项或多项的基因工程植物,其中,内源核酸中的靶序列中的突变与参考序列具有至少70、72、75、80、85、90、91、92、93、94、95、96、97、98、99或100%的同一性,所述参考序列选自由SEQ ID NO:91(GWDe1a)、SEQ ID NO:92(GWDe24b)、SEQ ID NO:93(GWDe24c)和SEQ ID NO:94(GWDe25a)所组成的组。
27、实施方式18-26中任意一项或多项的基因工程植物,其中,所述工程核酸含有与参考序列具有至少70、72、75、80、85、90、91、92、93、94、95、96、97、98、99或100%的同一性的多核苷酸,所述参考序列选自由SEQ ID NO:12-40(Zm GWD突变-外显子24)所组成的组。
28、实施方式18-26中任意一项或多项的基因工程植物,其中,所述工程核酸含有与参考序列具有至少70、72、75、80、85、90、91、92、93、94、95、96、97、98、99或100%的同一性的多核苷酸,所述参考序列选自由SEQ ID NO:114-118、188、131-146(Zm GWD突变-外显子24)和119-120(Zm GWD突变-外显子25)所组成的组。
29、实施方式18-25中任意一项或多项的基因工程植物,其中,所述工程核酸含有与参考序列具有至少70、72、75、80、85、90、91、92、93、94、95、96、97、98、99或100%的同一性的多核苷酸,所述参考序列选自由SEQ ID NO:106(Sb4715_1((WT+ins)_外显子24)和SEQID NO:107(Sb4715_2(WT+del)_外显子24)所组成的组。
30、实施方式16-28中任意一项或多项基因工程植物,其中,所述改变的葡聚糖水合二激酶含有与参考序列具有至少70、72、75、80、85、90、91、92、93、94、95、96、97、98、99或100%的同一性的氨基酸序列,所述参考序列选自由SEQ ID NO:45-73(Zm GWD突变蛋白M1-M29)所组成的组。
31、实施方式16-25中任意一项或多项基因工程植物,其中,所述改变的葡聚糖水合二激酶含有与参考序列具有至少70、72、75、80、85、90、91、92、93、94、95、96、97、98、99或100%的同一性的氨基酸序列,所述参考序列选自由SEQ ID NO:121-125(Zm GWD突变蛋白M32-M36)、126-127(Zm GWD突变蛋白M38-M39)和147-162(Zm GWD突变蛋白M40-M55)所组成的组。
32、实施方式18-26中任意一项或多项的基因工程植物,其中,所述改变的葡聚糖水合二激酶含有与参考序列具有至少70、72、75、80、85、90、91、92、93、94、95、96、97、98、99或100%的同一性的氨基酸序列,所述参考序列选自SEQ ID NO:82(Sb GWD突变蛋白Sb4715_1WT+ins)或SEQ ID NO:83(Sb GWD突变蛋白Sb4715_2WT+del)。
33、实施方式18-33中任意一项或多项的基因工程植物,其中,所述植物选自:由单子叶植物、双子叶植物、C4植物、C3植物、番茄、甜菜、甘蔗、桉树,柳树、杨树、玉米、高粱、小麦、苜蓿、大豆、水稻、芒草和柳枝稷所组成的组。
34、一种基因工程植物,该基因工程植物含有实施方式2-16中任意一项或多项的基因构建体。
35、一种用于产生基因工程植物的方法,该方法包括:
使用实施方式17的载体转化植物细胞;
选择表达核酸酶并含有编码改变的葡聚糖水合二激酶的工程核酸的转化植物细胞;和
从转化的植物细胞再生基因工程植物,其中,与具有相同遗传背景的非基因工程植物相比,基因工程植物或其子代具有升高的淀粉水平。
36、实施方式35中的方法,其中,所述核酸酶为大范围核酸酶。
37、实施方式35中的方法,其中所述核酸酶为Cas9核酸酶。
38、一种用于基因改造含有改变的葡聚糖水合二激酶的植物的方法,该方法包括:
将含有编码葡聚糖水合二激酶的内源基因中的靶序列的至少一个植物细胞与含有编码能够诱导靶序列上的单链或双链断裂的核酸酶的第一核酸的载体接触;选择含有所述靶序列改变的植物细胞;
再生含有来自植物细胞的改变的基因工程植物。
39、实施方式38中的方法,其中,所述基因工程植物对于所述改变是纯合的。
40、实施方式38的方法,其中,所述基因工程植物对于所述改变是杂合的。
41、实施方式40的方法,该方法还包括使杂合的基因工程植物自交,或杂交至具有相同改变的另一杂合的基因工程植物,并且选择对于所述改变是纯合的第一子代植物。
42、实施方式40的方法,该方法还包括将基因工程植物与具有相同遗传背景的野生型植物杂交,并且选择对于所述改变是杂合的第一子代植物。
43、实施方式42的方法,该方法还包括使所述第一杂合子代植物自交和选择对于所述改变是纯合的第二子代植物。
44、实施方式38-43中任意一项或多项的方法,其中,所述改变是选自靶序列中至少一个核苷酸的插入、缺失或取代中的至少一种的突变。
45、实施方式44的方法,其中,所述突变是无效突变。
46、实施方式38-44中任意一项或多项的方法,其中,与具有相同遗传背景的非基因工程植物相比,所述基因工程植物或其子代具有升高的淀粉水平。
47、实施方式38-46中任意一项或多项的方法,其中,所述核酸酶选自由大范围核酸酶、Cas9核酸酶、锌指核酸酶和转录激活物样效应物核酸酶所组成的组。
48、实施方式47的方法,其中,所述核酸酶是大范围核酸酶,并且由与参考序列具有至少90%同一性的序列编码,所述参考序列选自由SEQ ID NO:108(4715_大范围核酸酶)和SEQ ID NO:109(4716_大范围核酸酶)所组成的组。
49、实施方式48的方法,其中,所述大范围核酸酶能够切割含有SEQ ID NO:41(4715_WWD-9/10x.272的靶标)或SEQ ID NO:42(4716_3e GWD-7/8x276的靶标)的多核苷酸的靶序列。
50、实施方式47的方法,其中,所述核酸酶为Cas9核酸酶。
51、实施方式50的方法,其中,所述Cas9核酸酶由与SEQ ID NO:74(Cas9核酸酶)或SEQ ID NO:75(ZmCas9)具有至少90%同一性的核酸编码。
52、实施方式51的方法,其中,所述编码Cas9核酸酶的核酸与至少一个核定位信号(NLS)融合,并且所述NLS具有选自SEQ ID NO:163-168的多核苷酸序列。
53、实施方式38-47和50-52中任意一项的方法,其中,所述载体还含有编码sgRNA的第二核酸序列。
54、实施方式53的方法,其中,所述sgRNA能够结合靶序列,并且所述靶序列选自由SEQ ID NO:91(GWDe1a)、SEQ ID NO:92(GWDe24b)、SEQ ID NO:93(GWDe24c)和SEQ ID NO:94(GWDe25a)所组成的组。
55、实施方式53-54中任意一项或多项的方法,其中,所述第二核酸含有与SEQ IDNO:95(ZmU3P1:sgRNA_GWDe24b)、SEQ ID NO:96(ZmU3P2:sgRNA_GWDe24b)、SEQ ID NO:97(ZmU3.8P:sgRNA_GWDe24b)、SEQ ID NO:98(ZmU3P2:sgRNA_GWDe24c)、SEQ ID NO:99(ZmU3P2:sgRNA_GWDe25a)和SEQ ID NO:100(ZmU3P2:sgRNA_GWDe1a)具有至少90%同一性的序列。
56、实施方式38-55中任意一项或多项的方法,其中,所述载体还含有与第一核酸或第二核酸可操作地连接的核酸启动子。
57、实施方式56的方法,其中,所述核酸启动子含有与参考序列具有至少90%同一性的序列,所述参考序列选自由SEQ ID NO:78(MzU3.8)、SEQ ID NO:79(ZmU3),SEQ ID NO:82(ZmU3P1)、SEQ ID NO:84(ZmU3P2)和SEQ ID NO:86(MzU3.8)所组成的组。
58.由实施方式38-57中任意一项的方法产生的基因工程植物,或其子代或其后代,其中,在所述植物、其子代或其后代中含有所述改变。
59、实施方式58的基因工程植物,该基因工程植物与具有相同遗传背景的含有野生型葡聚糖水合二激酶的植物相比具有升高的淀粉水平。
60、一种提高植物中淀粉水平的方法,该方法包括在植物中表达核酸,所述核酸编码能够诱导靶序列上的双链断裂的核酸酶,并且选择含有靶序列改变的和具有升高的淀粉水平的纯合植物,其中,所述靶序列被包含在仅编码葡聚糖水合二激酶的内源基因中。
61、一种农业加工的方法,该方法包括:
在植物中表达编码能够诱导靶序列上的双链断裂的核酸酶的核酸,其中,所述靶序列被包含在编码葡聚糖水合二激酶的内源基因中;
选择含有靶序列中的改变并且具有升高的淀粉水平的纯合植物;和
加工所述纯合植物,其中,所述加工包括一种或多种选自收获、排水、粉碎、干燥、发酵、使用化学品水解、使用外源酶水解和与植物生物质组合的步骤。该方法还可以包括用于产生实施方式63-71中任意一项或多项的基因工程植物的方法。
62、一种制备动物饲料的方法,该方法包括:
在植物中表达编码能够诱导靶序列上的双链断裂的核酸酶的核酸,其中,所述靶序列被包含在编码葡聚糖水合二激酶的内源基因中;
选择含有靶序列中的改变并且具有升高的淀粉水平的纯合植物;和
进行选自由以下步骤所组成的组:收获、排水、粉碎、干燥、青贮、造粒、与可食用纤维源组合、以及与植物生物质组合。该方法还可以包括用于产生实施方式63-71中任意一项或多项的基因工程植物的方法。
63、一种用于产生含有编码改变的葡聚糖水合二激酶的工程核酸的基因工程植物的方法,该方法包括修饰植物中编码葡聚糖水合二激酶的基因的至少一个等位基因的内源核酸序列,其中,修饰的工程核酸是工程核酸,并且修饰的植物是基因工程植物。
64、实施方式63的方法,其中,所述基因工程植物对于含有突变的基因是纯合的,并且所有等位基因含有所述工程核酸的序列。
65、实施方式63的方法,其中,所述基因工程植物对于含有所述突变的基因是杂合的。
66、实施方式63或65中的任意一项或多项的方法,该方法还包括将所述基因工程植物自交并获得子代。
67、实施方式63-65中任意一项或多项的方法,该方法还包括将所述基因工程植物与具有相同遗传背景的非基因工程植物杂交并获得子代。
68、实施方式66-67中任意一项或多项的方法,该方法包括分析子代中改变的葡聚糖水合二激酶的存在并选择含有突变的子代植物。
69、实施方式63的方法,该方法包括实施方式18-34和58-59中任意一项或多项的基因工程植物。
70、实施方式63的方法,其中,所述修饰的步骤通过使用实施方式35-36中任意一项所述的方法进行。
71、实施方式63的方法,其中,所述修饰的步骤通过使用实施方式2-16中任意一项的基因构建体进行。
72、一种用于鉴定样品中编码葡聚糖水合二激酶的内源基因的修饰序列的试剂盒,其中,所述试剂盒含有第一引物和第二引物,其中,所述第一引物和第二引物能够扩增包含在编码葡聚糖水合二激酶的内源基因中的靶序列。所述靶序列含有与选自SEQ ID NO:1-4、75、171-187、189-193的参考序列具有至少90%同一性的核酸序列
73、实施方式72的试剂盒,该试剂盒还包含一个或多个用于检测靶序列的扩增区域中的修饰的组件。
74、实施方式72-73任意一项或多项的试剂盒,其中,所述第一引物含有选自SEQID NO:6、7、9、11、101、103、105、110和111的核酸序列。
75、实施方式72-74中任意一项或多项所述的试剂盒,其中,所述第二引物含有选自SEQ ID NO:5、8、10、102和104的核酸序列。
76、实施方式72-75中任意一项或多项的试剂盒,其中,第一引物和第二引物能够扩增靶序列以产生含有修饰的靶序列的扩增产物。
77、实施方式73-76中任意一项或多项的试剂盒,其中,所述扩增的靶序列含有选自SEQ ID NO:12-40、106-107、114-120、131-146和188的序列。
78、实施方式72-76中任意一项或多项的试剂盒,其中,所述修饰的靶序列能够在高严格度条件下与含有选自SEQ ID NO:12-40、106-107、114-120、131-146和188的序列的核酸序列杂交。
79、实施方式72-78中任意一项或多项的试剂盒,其中,所述样品含有来源于在编码葡聚糖水合二激酶的内源基因中具有至少一个突变的基因工程植物物质。
80、一种鉴定样品中编码葡聚糖水合二激酶的内源基因的修饰序列的方法,该方法包括:
将样品与第一引物和第二引物接触;
扩增包含在编码葡聚糖水合二激酶的内源基因中的靶序列,并且所述靶序列含有与参考序列具有至少90%同一性的核酸序列,所述参考序列选自SEQ ID NO:1-4、75、170-184、186、187、189-193;和
检测靶序列中的修饰。
81、实施方式79的方法,其中,所述靶序列中的修饰含有选自SEQ ID NO:12-40、106-107、114-120、131-146和188的序列。该鉴定方法可以被加入实施方式60-71中的任意一项或多项。
可以通过由本问的一种或多种其他实施方式的一个或多个要素(element)补充实施方式,和/或使用本文的一种或多种其他实施方式的一个或多个要素代替一种实施方式中的一个或多个要素形成本文进一步地的实施方式。
实施例
提供以下非限制性的实施例来说明具体的实施方式。全部实施方式均可以由来自以下一个或多个实施例的一处或多处细节补充,和/或一种实施方式中的一个或多个要素可以用一个或多个以下实施例的一处或多处细节代替。
实施例1基于大范围核酸酶的玉米和高粱基因组中的GWD基因的修饰
设计靶向GWD外显子24的大范围核酸酶构建体,其接近预测的编码的酶的活性位点,目的是引入使GWD失活的突变(无效突变)。在玉米和高粱中鉴定和表征大范围核酸酶诱导的GWD DNA突变体。
为了改造具有针对玉米和高粱基因组中的GWD基因的特异性的I-CreI归巢内切核酸酶,从玉米和高粱的之前注释的全长GWD基因中选择两个核苷酸序列。所述序列选择是基于玉米和高粱序列之间的高核苷酸序列同一性(95%核苷酸序列同一性)的存在以及两种作物的外显子#24中存在GWD蛋白活性所需的序列基序。目的是以这样的方式研发两个大范围核酸酶构建体,使得它们中的每一个将特异性用于玉米和高粱中的GWD修饰。使用大范围核酸酶方法在选择的GWD序列处的靶向基因组修饰将导致缺乏活性位点的GWD蛋白变体(从含有编码序列的帧错位表达的截短的蛋白质或修饰的蛋白质)的表达,因此是催化失活的。将如下所示的ZmGWD(玉米)和SbGWD(高粱)的选定序列提供给Precision Biosciences公司,用于设计大范围核酸酶GWD9-10x.272和GWD7-8x.226。
大范围核酸酶GWD-9/10x.272(pAG4715)的靶序列是:ATCCTTGTGGCAAAGAGTGTCA(SEQ ID NO:41)。
大范围核酸酶GWD-7/8x.226靶序列(pAG4716)的靶序列是:GTAGTTGGTGTAATTACACCTG(SEQ ID NO:42)。
被设计的大范围核酸酶识别的外显子24内的DNA序列加下划线。大写字母的序列显示外显子24,而小写字母的序列表示侧翼内含子。双下划线的“CAT”密码子编码对GWD蛋白活性至关重要的组氨酸残基。
>ZmGWD_外显子24
aagtgatactagtgaccctctccacaattttatgcgaaccacagaaattaataatatattctattactctgcacctgacatctggctcctgctatcagTTGGCAGGTTATAAGCCCGGTTGAAGTATCAGGTTATGTGGTTGTGGTTGATGAGTTACTTGCTGTCCAGAACAAATCTTATGATAAACCAACCATCCTTGTGGCAAAGAGTGTCAAGGGAGAGGAAGAAATACCAGATGGAGTAGTTGGTGTAATTACACCTGATATGCCAGATGTTCTGTCT GTGTCAGTCCGAGCAAGGAATAGCAAGgtttatcttcacagctatgttgcaagatttcttgaattttttctcttgtattgatgttgacatactagctttttcctaat(SEQ ID NO:3)
>SbGWD_外显子24
aagtggtactagtgacctctccacagttttatgtgaaccacagaaattaaatatgataatatattctattactctgcacctgacatctggctcctgataacagTTGGCAGGTTATAAGCCCAGTTGAAGTATCAGGTTATGTGGTTGTGGTTGATGAGTTACTTGCTGTCCAGAACAAATCTTATGATAAACCAACCATCCTTGTGGCAAAGAGTGTCAAGGGAGAGGAAGAAATACCAGATGGAGTAGTTGGTGTAATTACACCTGATATGCCAGATGTTCTGTCCGTGTCAGTCCGAGCAAGGAATAGCAAGgtttattttcacagttatgttgcaagctttctcagattttttttcttgtatcgatgttgacataccagttttttcctaat(SEQ ID NO:4)
使用Clustal软件比对选择的ZmGWD和SbGWD序列(Larkin MA et al.,2007;Goujon Met al.,2010,二者均通过引用并入本文,如同完整阐述)。
CLUSTAL 2.1多序列比对
用于表达大范围核酸酶的植物转化载体的研发:
由Precision Biosciences公司提供的大范围核酸酶序列GWD-9/10x.272[SEQ IDNO:108]和GWD-7/8x.226[SEQ ID NO:109],通过使用PCR方法在5'端添加BamHI限制性位点,在3'端添加AvrII位点进行进一步修饰。随后,将GWD-9/10x.272和GWD-7/8x.226核苷酸序列作为在玉米泛素1基因启动子和Nos转录终止子序列之间的BamHI-AvrII片段克隆到pAG4500载体中,以分别产生植物转化载体pAG4715和pAG4716。图1和图2显示了pAG4715和pAG4716载体的各自的图谱。参考图1和图2,pAG4715和4716含有玉米泛素启动子(ZmUbi1)、玉米泛素内含子(ZmUbi1内含子)和用作转录终止子的聚腺苷酸化信号NosT。两种载体还含有作为选择性标记物的磷酸甘露糖异构酶基因(PMI)、At NLS(核定位序列)、ZmKozak、mUBQmono、T-DNA右和左边界(分别为RB和LB)、链球菌乙酰转移酶(streptothricinacetyltransferase)基因和赋予链霉素抗性的氨基糖苷乙酰转移酶(aadA)基因。pAG4715含有GWD9-10x.272大范围核酸酶序列[SEQ ID NO:108],pAG4716含有GWD7-8x.226大范围核酸酶序列[SEQ ID NO:109]。
pAG4715和pAG4716被用于在玉米和高粱中产生转基因事件和突变体。
本文使用的靶蛋白、基因、突变体和载体的序列列于表1中。
表1序列描述
实施例2将TALENs应用于靶向高粱基因组中GWD基因的修饰
在高粱GWD基因(SbGWD)的外显子7和24的每一个中选择两对DNA序列用于研发四个定制的TAL DNA结合结构域,其将与截短的FokI核酸酶序列融合。选择高粱外显子24是因为其含有GWD活性位点,并且为了与玉米中的其他内源性DNA编辑技术进行比较,例如,大范围核酸酶和CRISP/Cas9技术。在GWD基因序列的上游区域选择高粱外显子7用于产生更短的截短形式的GWD蛋白。使用专有程序在Life Technologies网站上进行DNA结合结构域的序列的选择。融合到截短FokI内切核酸酶的用于靶向GWD基因的外显子7和24中的高粱基因组修饰的两对TAL DNA结合结构域由Life Technologies构建。每对TALEN将在相应的GWD位点识别基因组DNA序列的上链和下链,以靶向作用于FokI核酸酶进行DNA切割。
选择用于基于TALEN的GWD修饰的SbGWD核苷酸序列。SbGWD_外显子7序列位于SbGWD编码序列(SEQ ID NO:2)的736-969nt内:
>SbGWD_外显子7
GAGGAGTATGAAGCTGCACGAGCTGAGTTAATAGAGGAATTAAATAGAGGTGTTTCTTTAGAGAAGCTTCGAGCTAAATTGACAAAAACACCTGAAGCACCTGAGTCAGATGAACGTAAATCTCCTGCATCTCGAATGCCCGTTGATAAACTTCCAGAGGACCTTGTACAGGTGCAGGCTTATATAAGGTGGGAGAAAGCGGGCAAGCCAAATTATCCTCCTGAGAAGCAACTG(SEQ ID NO:184)
SbGWD_外显子24序列位于SbGWD编码序列(SEQ ID NO:2)的3030-3243nt内:
>SbGWD_外显子24
TTGGCAGGTTATAAGCCCAGTTGAAGTATCAGGTTATGTGGTTGTGGTTGATGAGTTACTTGCTGTCCAGAACAAATCTTATGATAAACCAACCATCCTTGTGGCAAAGAGTGTCAAGGGAGAGGAAGAAATACCAGATGGAGTAGTTGGTGTAATTACACCTGATATGCCAGATGTTCTGTCCGTGTCAGTCCGAGCAAGGAATAGCAAG(SEQID NO:183)
每个外显子中下划线的序列代表所选的TAL DNA结合位点,左侧序列对DNA上链是特异性的,右侧序列靶向作用于DNA下链。编码对于GWD蛋白活性具有催化重要性的组氨酸残基的密码子是双下划线的,并且在外显子24内是粗体。对于外显子7或外显子24特异性的TALEN将各自成对被克隆至基于pAG4500的植物转化载体中。
实施例3植物转化和分析
玉米和高粱转化:使用质粒pSB1操作手册中所述的方案提取来自农杆菌的DNA。使用Qiagen DNeasy Plant Mini试剂盒(69140)提取植物DNA。根据Negrotto D et al.PlantCell Rep 19:798;Ishida Y et al.1996 Nat Biotech 14:74,使用GWD大范围核酸酶靶向构建体pAG4715和/或pAG4716转化玉米和高粱胚,全部通过引用并入本文,如同完整阐述。简言之,将携带合适的转化质粒的LBA4404农杆菌细胞接种于来自野生型AxB玉米的胚发生愈伤组织。农杆菌介导的未成熟玉米胚胎的转化按照Negrotto D等描述的那样进行。使用先前报道的步骤(Ishida Y et al.1996 Nat Biotech 14:745;Hiei Y et al.1994 PlantJ 6:271;Hiei Y and Komari T 2006 Plant Cell Tissue Organ Cult.85:27;Komari Tet al.1996 Plant J 10:165),将用于GWD大范围核酸酶的表达盒克隆到能够与根癌土壤杆菌菌株LBA4404的三亲交配中的pSB1载体重组的中间载体的KpnI-EcoRI位点。将玉米(Zea mays栽培品种HiII,A188或B73)母本植株在温室中在28℃的日光下生长16小时。从籽粒中分离出未成熟的合子胚,并用含有目标基因的土壤杆菌溶液接种。接种后,未成熟胚在组织培养过程中生长10-12周。对具有叶和根的发育良好的幼苗进行取样用于PCR分析,以鉴定含有目标基因的转基因植物。用水冲洗PCR阳性和生根的植物以洗去琼脂培养基,并将其移植到土壤中并在温室中生长以产生种子和秸秆。
根据Gao等,2005的方案进行高粱转化。根据Elkonin和Pakhomova,2000进行转基因植物的再生。
使用质粒pSB1操作手册中描述的方案提取来自农杆菌的DNA。使用Qiagen DNeasyPlant Mini试剂盒(69140)提取植物DNA。
10×TE+十二烷基肌酸钠(Sarkosyl)-用于96孔板的植物DNA分离:简言之,将COSTAR研磨块装填3/4的叶样品,将一个5mm钢珠加入具有样品的每个孔中,并使用存储垫施用器以密封所述块。在研磨前或直至处理时间,将样品在-80℃下储存至少30分钟。为了处理,使用Klecko粉碎机和安全研磨机以最大速度将样品研磨45秒。将密封移除并丢弃。使用多通道移液器和无菌溶液槽向每个样品中加入300微升的10×TE+十二烷基肌酸钠缓冲液(5mL 1M Tris、1mL 0.5M EDTA,0.5g十二烷基肌酸钠,46mL ddH2O)。将板在振荡器上以300rpm温育10min,并以4000rpm旋转3分钟。除去上清液并弃去,将沉淀重悬于1×TE缓冲液中。将150微升样品等分试样加入96孔PCT板中。所述PCR板用铝箔密封。为了获得最佳结果,在同一天进行DNA分离和PCR。
转基因诊断PCR反应设置:“完全”PCR反应混合物如下:15μl 2×GoTaq MM(GoTaqGreen Master Mix(PROMEGA#M712)、3μl目标基因特异的正向和反向引物组合(每个以10μM混合)、2μl制备的DNA和水,以将体积调节至30μl。将每孔的28微升“完全”PCR反应混合物等分到PCR板(FISHER,#14230236)中,将2微升植物DNA样品分装到PCR板的每个孔中。在每个PCR反应中使用阳性对照和无模板阴性对照。土壤杆菌DNA对照品在TE缓冲液中以1:100稀释以产生清晰的带,PCR板用密封垫(COSTAR#6555)和滚轮,在BIORAD PTC-100热循环仪上进行PCR。热循环程序如下:1)95℃-3min;30个循环95℃-30sec,55℃-30sec,72℃-45sec;72℃-5min;10℃(保持),和2)90℃30min和10℃(保持)。将每个12微升的PCR反应物加入到Ready Agarose 96 Plus凝胶-3%(BIORAD#161-3062)上并在约100V下电泳20分钟,然后用配备Quantity One软件的BIORAD凝胶系统观察。快速负载的50bp DNA梯状条带(NEBN0473S)用于鉴定PCR片段的大小。使用10×TBE缓冲液(Promega V4251)。
使用傅里叶变换近红外(FT-NIR)技术在线监测活玉米叶的淀粉含量:玉米叶组织中的淀粉含量是动物饲料和生物燃料生产的重要因素。常用的GOPOD测定不适用于在活组织中的实时监测,因为该测定是侵入性的,需要物理组织样品,以及密集的劳动。基于天然淀粉和玉米叶淀粉或玉米粉(湿和干)的干混物的FT-NIR光谱的淀粉含量的预测模型使用偏最小二乘回归来进行研发。三个关键因素决定了FT-NIR技术成功应用于快速化学表征:准确和可重复的近红外光谱采集、可靠的校准数据和稳健的化学计量分析。为了分析,使用以下材料:分光光度计(Perkin Elmer Spectrum One NTS沃尔瑟姆,马萨诸塞州)、(版本10.2.,Camo Software公司,伍德布里奇,新泽西州)、烘箱、Hi-maize抗性淀粉(Honeyville,布里格姆市,犹他州)和淀粉(产品编号S516-500,FisherScientific)。使用去离子水将所有空白和测试样品稀释10倍,并使用葡萄糖氧化酶-过氧化物酶(GOPOD)比色测定法(Megazyme International,威克洛,爱尔兰)测定未反应的淀粉含量。
样品制备:通过将一定重量比例的抗性淀粉(Honeyville,布里格姆市,犹他州)与淀粉(产品编号S516-500,Fisher Scientific)混合以制备共计56个具有0-33%淀粉含量的干淀粉混合物样品。Honeyville产品含有从通过传统植物育种产生的高直链淀粉玉米杂种中分离的HI-MAIZE 260(Ingredion,布里奇沃特,纽泽西州)抗性淀粉,并且含有33%可消化的或血糖淀粉。
收集来自不同活的玉米植物的在一定年龄或具有不同淀粉积累的150个绿叶样品。将100个样品烘干并将50个样品未干燥(“湿”)。将叶片样品研磨至0.5mm并储存在塑料样品袋中用于湿度平衡。使用标准方法测量水分含量。
淀粉测定:使用GOPOD测定分析淀粉共混物、湿和干绿色组织或玉米粉样品的淀粉含量。
FT-NIR光谱的扫描、处理和分析:扫描-将大约5g碾磨的样品倒入较小的NIRA杯中,调平,并在每次扫描之间手动旋转扫描16次。用单独的子样品重复该程序5次,并将得到的光谱扫描取平均值。共计56个淀粉共混物样品用于建立淀粉模型。在校准设置中使用36个样本,在验证设置中使用14个样本,在测试设置中使用6个样本。使用100个玉米叶或种子样品建立干粉碎的绿色组织或粉末模型。对于校准、验证和测试,分别使用72、20和8个样品。使用49个玉米叶或玉米种子样品建立湿磨玉米模型。36个样品用于校准,10个样品用于验证,并且3样品用于测试设置。
使用FT-NIR光谱-(版本10.2.,Camo Software公司,伍德布里奇,新泽西州)的处理和分析来处理和分析光谱数据,建立和验证校准,并测试回归模型。使用乘法散射校正(MSC)和基于二阶导数的平滑技术,例如,Savitzky-Golay(SG)技术,进行数据预处理。使用MSC与SG二阶导数预处理光谱数据组合的部分最小二乘模型被研发用于淀粉共混物和碾磨的绿色组织或磨碎的玉米。表2中显示了校准、验证和测试样品的测量和预测(MSC+二阶导数模型)淀粉含量的实施例。
表2测量的和预测的(MSC+二阶导数模型)校准、验证和测试样品的淀粉含量
R2:淀粉共混物:校准:0.98,验证:0.97,预测:0.97
干玉米粉:校准:0.86,验证:0.80,预测:0.80
湿玉米粉:校准:0.94,验证:0.80,预测:0.75
实施例4在玉米和高粱GWD基因中大范围核酸酶诱导的DNA突变的鉴定和表征
目标基因(GOI)阳性玉米和高粱转化体的鉴定:从使用pAG4715或pAG4716转化的玉米和高粱植物的叶子取样,提取DNA,并筛选存在被包含在pAG4715或pAG4716中的大范围核酸酶转基因。
玉米和高粱转化体的筛选:使用PCR扩增的GWD DNA序列的序列分析,筛选分别携带pAG4715或pAG4716转基因的被称为4715或4716植物的GWD突变。
GWD的PCR扩增:使用表3所示的ZmGWDmega-2和SbGWDmega-2引物扩增外显子24上的大范围核酸酶靶向区周围的DNA序列。
表3用于基因分型4715和4716植物的引物
将引物组在无核酸酶的水中稀释至终浓度为5μM。如上所述进行PCR反应。
使用我们的PMI55程序(95℃,2min;30个循环[95℃,30sec;55℃,30sec;72℃,45sec;72℃,8min)在Eppendorf Mastercycler proS(Eppendorf)上运行PCR样品。
在Bio-Rad ReadyAgarose 96 Plus Gels,TBE(#161-3062)上分离PCR样品,并用Bio-Rad凝胶成像系统进行可视化。
图3示出了显示4715和4716事件的条带或分别成功并入来自pAG4715或pAG4716的转基因的凝胶的实例。参考该图,移位的GWD条带表明在GWD大范围核酸酶靶向位点处存在潜在的插入和缺失(插入缺失,indel),并且用星号标记。
GWD Indel等位基因的DNA序列表征:
初始GWD PCR产物的测序-使用用于扩增的相同引物(ZmGWDmega-2或SbGWDmega-2),在Beckman Coulter Genomics(36Cherry Hill Dr,Danvers,MA 01923)上对PCR产物进行测序。测序允许GWD基因座、野生型、纯合突变体和杂合突变体的三种不同遗传结果之间存在差异。野生型在204或208bp GWD PCR片段内没有突变,纯合子带有插入缺失突变,杂合体带有GWD PCR片段的无法解析的序列区(表明至少存在一处插入缺失)。
单个GWD等位基因的克隆和测序。为了开始克隆,使用与来自杂合植物的DNA相同的如上所述的引物组(ZmGWDmega-2或SbGWDmega-2),使用PCR扩增GWD,以表征单个GWD等位基因。如上所述,通过在琼脂糖凝胶上运行8μl PCR产物以确认PCR扩增,剩余的22μl PCR反应物使用Qiagen PCR纯化试剂盒(28104;Qiagen,马里兰州,美国)进行纯化,并用30μl洗脱缓冲液(EB)洗脱。
使用具有OneTOP10感受态大肠杆菌(K4500-01;Life Technologies)的TA克隆试剂盒根据方案克隆纯化的PCR产物。对于克隆过程,将4μl纯化的PCR产物用于连接,将连接物在冰上孵育至少10min,将50μl每个转化反应物接种在LB羧苄青霉素(50μg/ml)X-gal板上。
使用无菌移液器的枪头从每个反应中挑取8个大肠杆菌菌落,并转移到20μl含有羧苄青霉素的无菌液体LB中。然后使用与上述相同的引物组(ZmGWDmega-2或SbGWDmega-2)和2μl每种稀释的大肠杆菌克隆培养物通过PCR扩增GWD。确认PCR产物并如上所述进行测序。
表4描述了ZmGWD大范围核酸酶事件的接合性、突变类型和位置。在表4中,ZmGWD突变编号为1-28。野生型(WT)植物是指两个GWD野生型等位基因。半合子事件是指一个GWD突变体等位基因和一个GWD野生型等位基因。杂合事件是指两个不同的GWD突变体等位基因。纯合事件是指两个相同的GWD突变体等位基因。
表4 ZmGWD大范围核酸酶事件的接合性和突变
使用Vector NTI Advance(版本11.5;Life Technologies)将每个克隆的DNA序列与野生型(WT)GWD进行比较。比较野生型ZmGWD和SbGWD的DNA序列和转基因事件,并显示在以下文件中:ZmGWD大范围核酸酶突变体DNA序列比对;ZmGWD大范围核酸酶突变蛋白序列比对;SbGWD大范围核酸酶突变体DNA序列比对;SbGWD大范围核酸酶突变蛋白序列比对。
如下所示,来自三个PCR产物的序列的比对表明了将玉米突变体M5和M26与野生型序列ZmGWD外显子24区分开的插入和缺失。
用于ZmGWD的玉米突变体M5和M26的CLUSTAL O(1.2.1)多重序列比对:
ZmGWD外显子24
ZmGWD外显子24
ZmGWD外显子24
ZmGWD外显子24
ZmGWD外显子24
ZmGWD外显子24
ZmGWD外显子24
ZmGWD外显子24
来自28个PCR产物的序列的以下比对表明了区别玉米突变体M1-M4、M6-M25和M27-M29与野生型序列ZmGWD外显子24(SEQ ID NO:1(ZmGWD)的3030-3243nt)的修饰(例如,缺失和插入):
用于玉米突变体M1-M4、M6-M25和M27-M29的CLUSTAL O(1.2.1)多重序列比对:
ZmGWD外显子24
ZmGWD外显子24
ZmGWD外显子24
分析来自29个转基因玉米事件和野生型植物的GWD的氨基酸序列,并且显示在野生型ZmGW(SEQ ID NO:185)蛋白中在氨基酸1040-1120位置的缺失和插入,将该蛋白与以下玉米突变体区分开:ZmGWD_M1(SEQ ID NO:45)、ZmGWD_M2(SEQ ID NO:46)、ZmGWD_M3(SEQID NO:47)、ZmGWD_M4(SEQ ID NO:48)、ZmGWD_M5(SEQ ID NO:49)、ZmGWD_M6(SEQ ID NO:50)、ZmGWD_M7(SEQ ID NO:51)、ZmGWD_M8(SEQ ID NO:52)、ZmGWD_M9(SEQ ID NO:53)、ZmGWD_M10(SEQ ID NO:54)、ZmGWD_M11(SEQ ID NO:55)、ZmGWD_M12(SEQ ID NO:56)、ZmGWD_M13(SEQ ID NO:57)、ZmGWD_M14(SEQ ID NO:58)、ZmGWD_M15(SEQ ID NO:59)、ZmGWD_M16(SEQ ID NO:60)、ZmGWD_M17(SEQ ID NO:61)、ZmGWD_M18(SEQ ID NO:62、ZmGWD_M19(SEQ ID NO:63)、ZmGWD_M20(SEQ ID NO:4)、ZmGWD_M21(SEQ ID NO:65)、ZmGWD_M22(SEQ ID NO:66)、ZmGWD_M23(SEQ ID NO:67)、ZmGWD_M24(SEQ ID NO:68)、ZmGWD_M25(SEQID NO:69)、ZmGWD_M26(SEQ ID NO:70)、ZmGWD_M27(SEQ ID NO:71)、ZmGWD_M28(SEQ IDNO:72)和ZmGWD_M29(SEQ ID NO:73)。
ZmGWD(SEQ ID NO:43)氨基酸1040-11120的CLUSTAL O(1.2.1)多重序列比对:
对于高粱,使用两个大范围核酸酶构建体产生GWD突变,4715和4716。第一代(T0)转化的植物可以产生纯合的GWD突变体、半合子(WT+突变)GWD突变体或杂合(两个不同的突变体,例如,等位基因1+等位基因2)GWD突变体。使用以下缩写:del=缺失;ins=插入;sub=取代;SbGWD CDS是野生型序列。例如,序列名“Sb4715_1(WT+ins)”具有以下含义:Sb4715是高粱中的构建体;1是转基因事件:WT+ins表明T0事件4715_1对于携带WT GWD等位基因和插入(ins)GWD等位基因的GWD突变是半合子的。相同的构建体被用于玉米(Zm)的转化。
高粱双色(Sb)GWD序列和高粱双色GWD突变体Sb475_1(WT+ins)和Sb4715_2(WT+del)之间的CLUSTAL核酸比对显示与野生型SbGWD序列相比突变体序列的改变。SbGWD_外显子24序列位于SbGWD编码序列(SEQ ID NO:2)的3030-3243nt内。Sb475_1(WT+ins)的序列含有在SbGWD的位置3139-3149中的13个核苷酸插入和在SbGWD的位置3133-3136的核苷酸取代。
如下所示,来自3个PCR产物的序列的比对表明了区分Sb4715_1(WT+ins)和Sb4715_2(WT+del)与SbGWD外显子24区域的插入和缺失。
CLUSTAL O(1.2.1)多重序列比对:
使用序列野生型SbGWD(SEQ ID NO:44)进行大范围核酸酶突变蛋白氨基酸序列的预测。
实施例5.突变植物积累升高水平的绿色组织淀粉
在第一代(T0)转化的玉米和高粱GWD大范围核酸酶植物中测定淀粉。收集组织、干燥并研磨成细粉末。通过标准方法(Smith AM and Zeeman SC,Quantification of starchin plant tissues(2006)Nat Protocols 1:11342-1345,其通过引用并入本文,如同完整阐述)测定淀粉含量。通过改编来自Megazyme国际爱尔兰有限公司(Megazyme试剂盒和试剂;货号K-TSTA)的方案测定总淀粉含量。简单地说,建立85℃和50℃的加热块。将5至15mg干燥的碾磨组织置于1.5ml防沸腾微量离心管中。向每个管中加入1毫升70%乙醇,涡旋混合样品并沉淀。向每个样品中加入400微升溶液1。所述溶液1含有1ml的热稳定性α-淀粉酶和29ml的100mM乙酸钠缓冲液,pH5.0。将样品重悬并涡旋。将样品在85℃下孵育12分钟,并在室温下冷却5分钟。将300微升的GOPOD试剂(Megazyme试剂盒,货号K-TST)预先加入至平底96孔测定板的每个孔中。将10微升样品加入到每个孔中,并与也被加入至它们各自孔中的1μL,5μL,10μL和20μL葡萄糖标准品(1mg/ml)相比较。将板在50℃下孵育20min。在510nm测定吸光值。参考图4。图4显示了与野生型植物WT_195、WT_18和WT_6相比,突变体4715_20(两个突变体等位基因)、4716_7(M1)、4716_1(M1)、4716_18(M20)、4716_12(M3/M8)、4716_23(M15)、4716_28(未表征)、4716_3M9/M6)、4716_22(M5/M11)、4716_24(M2/M14)、24716_25(M10/M28)、4716_15(M11/M12)、4716_5(M7/M11)、4716_6(M4/M14)、4716_27(M11/M10)、4716_4(M11/M12)、4716_26(M11/M12)、4716_2(M15)、4716_13(M14)、4716_13(M14)、4716_11(M11/M10)、4716_8(M11)、4716_10(M11/M10)和4716_14(M13)具有升高的淀粉水平。许多纯合和杂合事件在叶中表现出大于20重量%的淀粉增加量。基于不同组织中淀粉积累的加权平均值,我们估计总植物淀粉(不包括谷物)为约10%(重量/重量)。
使用RNA干扰技术,先前在玉米中观察到的水平显著升高,尽管在那些实验中测量到低转录丰度。这是令人惊讶的结果,因为预期基于RNAi的沉默在植物中将式明显的并且具有与基因缺失或敲除策略相同的效果。
图5显示了所选择的半合、纯合和杂合事件的绿色组织淀粉。图5显示了转基因玉米事件M17(4715_14)、M18(4715_15)、M1(4716_1)、M20(4716_18)、M3/M12(4716_12)、M9(4716_3)、M7/M11(4716_5)、M4/M14(4716_6)、M11/M12(4716_4)、M15(4716_2)、M14(4716_13)、M11(4716_8)、M11/M10(4716_10)、M13(4716_14)与非转基因对照WT(4716_9)相比,具有升高的淀粉水平。观察到数个事件(4716_13(M14)、4715_15(M11/M12)和4716_6(M4/M14)具有高于平均的生物质的量。
实施例6.GWD敲除(GWDko)的穗轴具有升高的淀粉水平
T0GWDko和野生型(wt)玉米突变体品系自交,培育至成熟,干燥,并进行横切以进行染色。将穗轴切片用Lugol's溶液(5%KI)染色4min,并用H2O过夜脱色。
分析突变事件4716_13、4716_26、4716_167、4716_164、4716_9和4716-153的淀粉含量。结果如表5所示。
表5突变品系中的淀粉含量
构建体_事件 | 接合性 | 绿色组织淀粉 | 秸秆淀粉 |
4716_13 | 纯合子 | 229.7 | 38.5 |
4716_26 | 杂合子 | 220.7 | 35.3 |
4716_167 | 杂合子 | 112.0 | 31.7 |
4716_164 | 半合子 | 30.5 | 4.0 |
4716_9 | 野生型 | 18.8 | 8.4 |
4716_153 | 野生型 | 5.7 | 1.2 |
参考表5和图6,表明与半合子(4716_164)和野生型(4716_9和4716_153)穗轴相比,纯合的(4716_13)和杂合的(4716_26和4716_167)穗轴具有加深的淀粉染色。
实施例7.CRISPR/Cas玉米转化载体的构建
为了构建Cas9表达盒,选择含有N端和C端At核定位序列(NLS)的化脓性链球菌Cas9蛋白序列以及紧接在第一个ATG密码子之后的3xFLAG序列(Jiang et al.,2013)(SEQID NO:74)用于在玉米中表达。在玉米中表达的含有两个SV40核定位序列(以粗体字母表示)和3xFLAG序列在N-末端部分(下划线序列)的化脓性链球菌Cas9的序列如下所示:
MDYKDHDGDYKDHDTDYKDDDDKMAGTHGVPAADKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDRGG(SEQ ID NO:74)
将序列反向翻译并且优化玉米密码子以产生ZmCas9(SEQ ID NO:75)。优化的ZmCas9核苷酸序列由Genscript合成。将ZmCas9作为在玉米泛素1启动子(ZmUbi1P)和胭脂碱合酶转录终止子(NosT)序列之间的BamHI-AvrII片段克隆到pAG4500中以产生pAG4800。
关于构建sgRNA盒的工作包括:1)鉴定和分离玉米RNA聚合酶III启动子以促进sgRNA的表达;2)sgRNA支架的设计与合成;和3)选择靶基因和该基因内的20bp特异性序列,用于将Cas9核酸内切酶引导至其靶位点。
在1994年,Leader等报道了关于编码U3小核RNA(U3snRNA)的玉米序列的首次描述,他从玉米基因组DNA文库中分离出MzU3.8基因(Genebank登录号Z29641)(SEQ ID NO:76),并表明了MzU3.8U3snRNA在玉米原生质体中表达。使用BLASTN算法和Z29641序列搜索玉米遗传学和基因组学数据库(http://www.maizegdb.org/),我们鉴定了标记为ZmU3(SEQID NO:77)的玉米U3的同源序列。
所述ZmU3位于玉米染色体8上并且被包含在具有核苷酸配位163620300-163621800的序列内。MzU3.8(SEQ ID NO:78)和ZmU3(SEQ ID NO:79)的推导启动子区的CLUSTAL 2.1多核苷酸序列比对显示在两个序列之间具有93.8%的同一性。
CLUSTAL 2.1多重序列比对:
使用PCR方法,采用正向引物ob2297(SEQ ID NO:80)和反向引物ob2299(SEQ IDNO:81),随后从玉米品系AxB的玉米基因组DNA中分离出758bp的ZmU3启动子(ZmU3P1)(SEQID NO:82)。正向引物ob2297在其5'端包括AsiSI限制性位点以利于将sgRNA盒克隆至基于pAG4500的载体中。类似地,使用在其5'端含有AsiSI限制性位点的正向引物ob2343(SEQ IDNO:83),分离出较短的398bp形式的玉米U3启动子(ZmU3P2)(SEQ ID NO:84),用于测试截短的玉米U3启动子的效率。使用在其5'端具有SwaI限制酶位点的正向引物ob2351(SEQ IDNO:85)扩增ZmU3P2的另外的变体。此外,使用在Leader等(1994)公开的MzU3.8序列上设计的长引物,显示其在玉米原生质体中表达,合成308bp对照启动子片段ZmU3.8P(SEQ ID NO:86)。该ZmU3.8P序列还包括5'端的AsiSI限制性位点。将所有扩增的启动子变体克隆到pCR-BluntII-TOPO载体(Life Technologies)中,并通过完全测序证实其完整性。
本文的sgRNA支架设计基于sgRNA嵌合体的已被公开的组织(Larson et al.,2013),并且含有42bp Cas9柄发夹(SEQ ID NO:87),其后连有41bp化脓性链球菌终止子(SEQ ID NO:88)。为了提高玉米中转录终止的效率,从ZmU3 snRNA(SEQ ID NO:77)中分离37bp的推导的转录终止子序列ZmU3T(SEQ ID NO:89),并将其融合在化脓性链球菌终止子(SEQ ID NO:NO:88)的下游。使用长引物和具有校对读取活性的KOD Xtreme DNA聚合酶通过PCR合成120bp sgRNA支架(SEQ ID NO:90)。在两个PCR扩增的sgRNA主链DNA片段的3'末端添加SnaBI或AscI限制性位点以利于进一步克隆。将以这种方式合成的sgRNA支架DNA片段克隆到pCR-BluntII-TOPO载体中并验证序列。
为了测试玉米中CRISPR/Cas系统的效率,选择编码GWD的玉米基因用于初始靶向修饰。
玉米GWD基因早期已经被注释过,并在正义和反义DNA链上筛选AN19NGG靶序列的存在。AN19NGG序列中的5'末端“A”表示在U3RNA聚合酶III启动子的转录起始处的保守的“腺嘌呤”核苷酸,位于3'末端的“NGG”序列对应于CRISPR/Cas系统活性原生质体-相邻基序(PAM)序列。在外显子1、24和25以及其侧翼内含子中鉴定的候选靶序列针对玉米GDB进一步筛选,以消除在玉米基因组内具有多重同一性命中的序列。这项工作已经完成,以尽量减少CRISPR/Cas系统脱靶活性的可能性。在该分析中,在Larson等(2013年)提出的BLASTN程序中仅使用靶序列的种子序列(12bp)加上两个相邻的PAM核苷酸。选择外显子1以产生几乎完全的GWD敲除,而选择外显子24和25以产生缺乏由外显子24编码的活性位点的GWD变体。最终的19bp GWD靶序列(SEQ ID NO:131-134),其被鉴定用于sgRNA研发,如表6所示。
表6 GWD基因靶序列及其对应的SEQ ID NO
使用KOD Xtreme DNA聚合酶通过融合PCR的方式将玉米U3启动子的三种变体中的每一种、选择的GWD靶序列和sgRNA骨架组装在一起,以构建六个sgRNA表达盒(SEQ ID NO:135-140)。将PCR扩增的片段克隆到pCR-BluntII-TOPO载体中,并通过测序验证合成的sgRNA表达盒的完整性。PCR合成的sgRNA盒的列表如表7所示。
表7合成的sgRNA表达盒及其对应的SEQ ID NO
SEQ ID NO | sgRNA表达盒 | 侧翼限制性位点 |
95 | ZmU3P1:sgRNA_GWDe24b | AsiSI-SnaBI |
96 | ZmU3P2:sgRNA_GWDe24b | AsiSI-SnaBI |
97 | ZmU3.8P:sgRNA_GWDe24b | AsiSI-SnaBI |
98 | ZmU3P2:sgRNA_GWDe24c | AsiSI-SnaBI |
99 | ZmU3P2:sgRNA_GWDe25a | SwaI-AscI |
100 | ZmU3P2:sgRNA_GWDe1a | AsiSI-SnaBI |
随后将组装的sgRNA盒作为AsiSI-SnaBI片段克隆到pAG4800中以构建载体pAG4804-4809(表8)。
表8用于玉米CRISPR/Case系统研发的载体及其SEQ ID NO
通过将作为SwaI-AscI片段的ZmU3P2:sgRNA_GWDe25a盒克隆到pAG4807中构建一个含有两个sgRNA表达盒的另外的载体pAG4817。通过将Cas9核酸内切酶靶向作用于位于玉米GWD基因和侧翼外显子24内相距364bp的两个不同位点,该载体被构建用于完全去除GWD外显子24。
为了研发用于玉米的CRISP/Cas系统而构建的植物转化载体pAG4800和pAG4804的图谱显示在图7-8中。如图7所示,pAG4800载体含有Cas9表达盒和PMI表达盒。所述Cas9表达盒含有核苷酸序列ZmCas9(SEQ ID NO:75)。所述ZmCas9是编码Cas9的化脓性链球菌基因的玉米密码子优化的序列,其被融合到两个At NLS的5'末端和3'末端以及紧接在第一个ATG密码子之后的3xFLAG序列。Zm Cas9编码在用于在玉米中表达的氮末端部分含有两个At核定位序列和3xFLAG序列的化脓性链球菌Cas9蛋白(SEQ ID NO:74)。所述Cas9盒还含有ZmUbi1启动子、Zm Ubi1内含子、mUBQMono前导序列和NosT终止子。所述PMI盒含有PMI基因、ZmUbi1启动子、mUBQMono、ZmKozak前导序列和NosT终止子。如图8所示,pAG4804载体含有GWDe24b-sgRNA支架盒、Cas9表达盒和PMI表达盒。所述GWDe24b-sgRNA支架盒含有ZmU3P1启动子、GWDed24序列、sgRNA支架和ZmU3T终止子。所述Cas9表达盒含有在5'末端和3'末端与两个At NLS融合的ZmCas9和紧接在第一个ATG密码子之后的3xFLAG序列。所述Cas9盒还含有Zm Ubi1启动子、Zm Ubi1内含子、mUBQMono前导序列和NosT终止子。所述PMI盒含有PMI基因、ZmUbi1启动子,mUBQMono、ZmKozak前导序列和NosT终止子。
实施例8.CRISPR/Cas诱导的突变植物的产生
CRISPR/Cas和玉米NLS大范围核酸酶诱导的玉米GWD基因突变的鉴定和表征
根据实施例3中所述的方案进行玉米植物转化。筛选CRISPR/Cas诱导的突变,其与实施例3中描述的筛选大范围核酸酶诱导的突变方法相似,除了用于基因分型的引物和识别突变。
表9描述了用于CRISPR/Cas植物基因分型的引物,包括4804-4806、4804-6引物组;将GWD24b-F替换为GWDe24a-F的4809、4817和4804-6引物组和围绕GWD大范围核酸酶靶向区域的用于扩增DNA序列的引物,其包括4804-4807、4804-7mut引物;4817、2856/2858引物;4837-4839,371/429引物。表9用于基因分型4804、4805、4806、4817、4837、4838和4839植物和扩增围绕GWD外显子24靶向区域的DNA序列的引物
与之前的分析类似,使用Vector NTI Advance(版本11.5;Life Technologies)将每个突变体的DNA序列与WT GWD进行比较。突变体DNA序列描述于表10中。
已经产生了携带靶向作用于GWD基因区域的基因编辑构建体的转基因玉米植物,并且正在分析GWD基因的靶区域中的突变。GWD突变和预测的蛋白质列于表11-14中。在这些表中,携带两个不同GWD突变等位基因(杂合子)的事件用-1或-2标记,以表示单个等位基因。内含子序列以小写字母表示,外显子24或25用大写字母表示。因为pAG4817靶向作用于ZmGWD内的两个不同位置,所以为4817_2和4817_52提供了两个突变。第一靶序列位于外显子24的5'末端的上游,插入至该靶位点的额外的“T”显示为在内含子23特异的小写字母内的大写字母“T”(参见M37序列)。M37是4817_2和4817_52中的相同修饰。
由CRISPR/Cas9引入的所有修饰被突出显示(粗黑色=插入;灰色=缺失),并且缺失的核苷酸由点显示。删除或插入的核苷酸的相应数目呈现在表11和12的最后一列中。
类似地,突出显示M32-M39的推导的蛋白质序列的所有改变。在翻译阅读框架移位和翻译早期终止的情况下,与野生型GWD不同的所有氨基酸也被突出显示,蛋白质的末端用星号(*)表示。
表10 CRISPR/Cas9在单个转基因4804、4806和4817事件中诱导的突变
突变 | 事件和等位基因 |
M32 | 4804_2,4804_3-2,4804_4-1,4804_5-2,4806_1 |
M33 | 4804_3-1,4804_5-1,4804_7-1 |
M34 | 4804_4-2 |
M35 | 4804_6 |
M36 | 4804_7-2 |
M37,M38 | 4817_2 |
M37,M39 | 4817_52 |
表11单个4804和4806事件中CRISPR/Cas9诱导的突变的核苷酸序列
*野生型ZmGWD是外显子24的81-160nt的区域(SEQ ID NO:3)
表12单个4817事件中CRISPR/Cas9诱导突变的核苷酸序列
*野生型ZmGWD是外显子24的81-160nt的区域(SEQ ID NO:3)
表13在CRISPR/Cas9突变体4804和4806中外显子24的部分推导的蛋白质序列
*野生型ZmGWD外显子24是野生型ZmGWD(SEQ ID NO:43)的1011-1057氨基酸(aa)的区域
表14在CRISPR/Cas9突变体4817中外显子25的部分推导的蛋白质序列
**野生型ZmGWD外显子25是野生型ZmGWD(SEQ ID NO:43)的1082-1116aa的区域
玉米NLS大范围核酸酶诱导的突变的表征
为了构建玉米NLS大范围核酸酶构建体pAG4837-4839,使用来自Opaque2(Hickset al.,PNAS,1995)(表15)的玉米NLS序列替换pAG4716中的病毒SV40NLS序列。观察到玉米GWD基因的外显子24中诱导的突变的大的变异。这些突变包括1至114个核苷酸的取代、缺失和插入(表16-17)。NLS变体的间接评估的效率被估计为含有GWD基因的靶区域中的任何修饰的事件数除以分析的事件的总数(表15)。每个评估的NLS序列支持诱导突变的产生,其中NLS3和NLS4是最有效的。
表15含有植物来源的NLS序列的大范围核酸酶构建体
表16在4837、4838和4839事件中ZmGWD基因的外显子24中的玉米NLS大范围核酸酶诱导的代表性突变的列表
*野生型ZmGWD是SEQ ID NO:1的3157-3213nt的区域。
表17在CRISPR/Cas9突变体4837、4838和4839中外显子24的部分推导的蛋白质序列
*野生型ZmGWD外显子24是SEQ ID NO:43的1054-1081aa的区域。
绿色组织淀粉的测定
测定CRISPR/Cas和玉米NLS大范围核酸酶品系的绿叶组织中的淀粉。根据实施例3中所述的方案测定从40天龄事件收获的叶组织的淀粉。这些数据证实了我们的CRISPR/Cas靶向系统和玉米NLS大范围核酸酶基因编辑构建体的效果。
表18 CRISPR/Cas和玉米NLS大范围核酸酶品系中的淀粉含量
表19 CRISPR/Cas和玉米NLS大范围核酸酶4837、4838和4839品系中的淀粉含量
参考表18和19,观察到许多事件表现出高淀粉含量,其范围为约3%-27.8%。
实施例10.绿色组织淀粉的测定
测定所有CRISPR/Cas细胞系在绿叶组织以及干燥的秸秆叶、茎和穗轴中的淀粉。根据实施例3描述的方案测定从40天龄的CRISPR/Cas事件收获的叶组织的淀粉。图9说明了pAG4804玉米事件中的淀粉积累。如图9所示,所有7个T0玉米4804事件具有高淀粉含量,其范围为9.6-27.8%,这表明所有当前未解析的GWD序列是两个不同GWD突变的结果,而不是一个野生型和一个突变体等位基因(半合子)。图10说明了pAG4806玉米事件中的淀粉积累。如图10所示,T0玉米4806事件都具有低淀粉含量,这表明一个未解析的GWD序列是半合子。这些数据证实了本文的CRISPR/Cas靶向系统的功效,其包括新的GWD引导RNA靶向序列和用于表达引导RNA的新U3启动子。
实施例11.用于优良近交基因渗入和测试的隐性突变的育种
用于精确DNA基因工程和诱变的新方法的出现提供了产生用于研发新的和具有有益植物性状的靶向隐性突变和显性突变的手段。这些方法中的一些包括用大范围核酸酶、Talens和CRISPR/Cas系统靶向基因的特定区域。跟踪和推进靶向突变对性状研发提出了新的挑战,因为与传统的转基因植物性状不同,它们不携带显性T-DNA表达盒和选择标记物。使用本文所述的TALENS、ZFN、大范围核酸酶和CRISPR/Cas方法产生玉米和高粱中的靶向突变可以导致产生用于筛选和育种这些独特植物性状的新方法。
实施例12.跟踪和育种靶向突变
转化(T0)生成基因型:使用所述方法鉴定的基因特异性突变导致具有三种不同基因型中的一种的第一代转化(T0)植物:1)一个野生型基因等位基因和一个突变等位基因,2)两个不同的突变等位基因,或3)两个相同的突变等位基因。这些突变型等位基因组合分别被称为半合子、杂合子和纯合子。
跟踪靶向突变的分子方法:相对于野生型序列,靶向DNA突变(例如,取代、缺失、插入或组合)的特定序列的特征是,当将突变育种至其他品系时,或通过育种扩大现有品系时,可以使用本文所述的方法跟踪。为了区分T0和T1+(来源于T0亲本品系及其以后的子代)分离群体中的野生型、半合子、杂合子和纯合子,可以使用至少五种方法。这些方法包括:1)使用凝胶电泳对突变位点进行PCR以进行大小分离,2)使用限制酶消化和凝胶电泳进行PCR以产生突变特异性限制模式,3)使用直接测序进行PCR,4)使用克隆和测序进行PCR,和5)使用结合或不结合突变位点的引物进行PCR。
来自野生型或工程的、改变的或优化的内源核酸的纯合DNA序列将容易通过靶向或突变区域中的PCR、大小测定和/或DNA测序来分析。相反,具有不同等位基因的DNA序列可能导致由于两个等位基因序列(例如,野生型和突变体或两个不同的突变体)的差异而难以使用测序、PCR或大小测定来分析的序列的一部分序列。来自这些类型的靶向事件的PCR产物将需要进行克隆以分离和有效地对每个等位基因进行测序。
一旦已经确认了靶向突变的序列,就建立了用于跟踪的突变特异性分子策略。如前所述,该策略将取决于突变的特征。在跟踪本文中产生的gwd突变时,针对本文所述的每种突变和工程内源(优化的)核酸研发PCR特异性反应。
育种杂交和自交:使用转基因诱导的靶向突变产生的性状的主要目标是通过从转基因中分离所需的突变来分离突变。这可以通过遗传杂交来实现,并且通过异交(更高频率的回收转基因阴性的突变植物)是最有效的,其涉及将T0花粉交叉到非转基因植物的雌性组分。这也可以使用自交以较低的频率完成,其包括自花授粉(使用T0花粉授粉同一T0植株)。近缘授粉(sibbing)是另一种选择,并且涉及两个基因相同的植物之间的杂交,这将预期与自交的结果相同。
携带靶向突变的T0植物可以自交以产生纯合植物,并且根据T0接合性将导致不同数量和类型的子代。纯合T0植物将产生100%纯合子代,半合子T0植物对于突变等位基因以1:2:1(纯合:半合子:野生型)分离,杂合T0植物将以1:2:1(纯合靶向等位基因1:杂合:纯合靶向等位基因2)。
携带靶向突变的T0植物也可以异交到其他品系中,并且根据T0接合性将导致不同数量和类型的子代。纯合T0植物将产生100%半合子代,半合子T0植物将产生50%半合子代和50%野生型子代,杂合T0植物将产生半合子代,50%具有靶向等位基因和50%具有靶向等位基因2。
因为所有T0植物都携带转基因,转基因插入位置是最常见的不同,并且转基因插入的数目可以不同,所以转基因的分离模式在每个T0转化事件/植物之间具有显著变化的可能性。为了鉴定转基因阴性植物,可以将PCR应用于与T0植物进行任意杂交(自交、近缘或异交)的子代。转基因阴性植物将通过不存在转基因特异性PCR产物来鉴定。然后使用在T0植物的初始表征期间定义的分子诊断方法筛选转基因阴性植物的靶向突变。
然后可以保持和培育从转基因分离的靶向突变,用于测试和基因渗入(introgressions),继续使用性状特异性分子诊断方案。
用于靶向突变的跟踪和育种程序的实例:本文描述了用于靶向突变的分子跟踪和育种过程。本文描述了来自玉米(M20,来自事件4716_164的ZmGWD_M20)的GWD基因的跟踪。该部分内容和其他大范围核酸酶诱导的玉米和高粱中的靶向突变的产生和初始序列表征已经在本文的实施例中描述。T0 4716_164植物最初对M20突变是半合的,并携带未知数量的T-DNA插入。M20突变是在ZmGWD的外显子24中的隐性单碱基对(bp)缺失,其导致在野生型序列中的MluCI限制酶位点处的突变。这种小尺寸缺失需要使用具有凝胶电泳的MluCIRFLP,因为其不能仅通过凝胶电泳与野生型区分。
图11显示了来自于玉米事件4716_164的靶向突变M20的自交和异交的示意图。如图11所示,T04716_164植物自交和异交,分别产生用于功效测试和基因渗入的子代。为了鉴定来自T0自交亲本的纯合M20子代,使用大范围核酸酶靶向基因和GWD基因的靶区域进行PCR。图12显示了来自自交T04716_164 M20植物的T1子代的基因分型。如图12所示,来自大范围核酸酶GOI和ZmGWD靶区域的PCR产物使用MluCI消化,在5%聚丙烯酰胺上分离并使用溴化乙锭染色。这显示了不携带T-DNA(大范围核酸酶)但对于M20是纯合的植物。维持这些植物用于测试。
为了鉴定来自T0异型亲本的半合子M20子代,进行选择性标记基因、PMI、大范围核酸酶基因和靶区域的PCR,然后进行3%琼脂糖凝胶电泳和溴化乙锭染色。这也允许鉴定T-DNA阴性植物。图13显示了来自异型T04716_164 M20植物的T1子代的基因分型。然后对来自T-DNA阴性植物的相同PCR产物进行MluCI限制性消化,并在使用溴化乙锭染色的5%聚丙烯酰胺凝胶上将它们分离。图14说明来自异型4716_164 M20植物的T1子代的基因分型。维持这些植物用于进一步基因渗入和将来的测试。
参考文献
An,G et al.,2005.Reverse genetic approaches for functional genomicsof rice.Plant molecular biology,59(1),pp.111–23.在http://www.ncbi.nlm.nih.gov/pubmed/16217606[Accessed July 25,2012]可以获得。ArnouldS,Perez C,Cabaniols JP,Smith J,Gouble A,Grizot S,Epinat JC,Duclert A,Duchateau P,Paques F.(2007)Engineered I-CreI derivatives cleaving sequencesfrom the human XPC gene can induce highly efficient gene correction inmammalian cells.J.Mol.Biol.371:49–65.
Arnould S,Delenda C,Grizot S,Desseaux C,Paques F,Silva GH,Smith J.(2011)The I–CreI meganuclease and its engineered derivatives:Applicationsfrom cell modifi cation to gene therapy.Protein Eng.Des.Sel.24:27–31.
Belhaj K,Chaparro-Garcia A,Kamoun S,Nekrasov V.(2013)Plant genomeediting made easy:targeted mutagenesis in model and crop plants using theCRISPR/Cas system.Plant Methods 9:39-48.
Boch J.&Bonas U.(2010)Xanthomonas AvrBs3family-type III effectors:discovery and function.Annu.Rev.Phytopathol.48:419–436.
Cermak T,Doyle EL,Christian M,Wang L,Zhang Y,Schmidt C,Baller JA,Somia NV,Bogdanove AJ,Voytas DF.(2011)Efficient design and assembly of customTALEN and other TAL effector-based constructs for DNA targeting.Nucleic AcidsRes.39:e82
Chi-Ham CL et al.,2010.The intellectual property landscape for genesuppression technologies in plants.Nature Biotechnology,28(1):32-36.
Christian,M et al.,2010.Targeting DNA double-strand breaks with TALeffector nucleases.Genetics,186(2),pp.757–61.在http://www.pubmedcentral.nih.gov/articlerender.fcgi?artid=2942870&tool=pmcentre z&rendertype=abstract[Accessed July 14,2012]可以获得。
Cong L,Ran FA,Cox D,Lin S,Barretto R,Habib N,Hsu PD,Wu X,Jiang W,Marraffini LA,Zhang F.(2013)Multiplex genome engineering using CRISPR/Cassystems.Science 339:819–823.
Djukanovic V,Smith J,Lowe K,Yang M,Gao H,Jones S,Nicholson MG,West A,Lape J,Bidney D,Falco SC,Jantz D,Lyznik LA.(2013)Male-sterile maize plantsproduced by targeted mutagenesis of the cytochrome P450-like gene(MS26)usinga re-designed I–CreI homing endonuclease.The Plant Journal 76:888–899.
Elkonin LA,Pakhaomova NV.(2000)Influence of nitrogen and phosphoruson induction embryogenic callus of sorghum.Plant Cell Tissue and OrganCulture 61:115-123.
Frizzi A&Huang S,2010.Tapping RNA silencing pathways for plantbiotechnology.Plant biotechnology journal,8(6),pp.655–77.在http://www.ncbi.nlm.nih.gov/pubmed/20331529[Accessed July 24,2012]可以获得。Gao Z,XieX,Ling Y,Muthukrishnan S,Liang GH.(2005)Agrobacterium tumefaciens-mediatedsorghum transformation using a mannose selection.Plant biotechnology journal,3,pp.591-599.
Garcia-Bustos J,Heitman J,Hall MN(1991)Nuclear proteinlocalization.Biochim Biophys Acta 1071:83-101.
Gasiunas G,Barrangou R,Horvath P,Siksnys V.(2012)Cas9–crRNAribonucleoprotein complex mediates specific DNA cleavage for adaptiveimmunity in bacteria.Proc Natl Acad Sci US A.109(39):2579-2586.
Goujon M et al.,2010 A new bioinformatics analysis tools framework atEMBL-EBI(2010)Nucleic acids research Jul,38 Suppl:W695-9 doi:10.1093/nar/ gkq313Heath PJ,Stephens KM,Monnat RJ Jr.,Stoddard BL.(1997)The structure ofI-Crel,a group I intron-encoded homing endonuclease.Nat.Struct.Biol.4:468-76.
Jinek M,Chylinski K,Fonfara I,Hauer M,Doudna JA,Charpentier E.(2012)Aprogrammable dual-RNA-guided DNA endonuclease in adaptive bacterialimmunity.Science 337:816–821.
Joung JK&Sander JD.(2013)TALENs:a widely applicable technology fortargeted genome editing.Nature Reviews(Mol Cell Biol)14:49-55.
Kalderon D,Richardson WD,Markham AF,Smith AE(1984)Sequencerequirements for nuclear lócation of simian virus 40 1arge T antigen.Nature311:33-38.
Larkin MA et al.,2007 ClustalW and ClustalX version 2 Bioinformatics,23(21):2947-2948.doi:10.1093/bioinformatics/btm404
Larson MH,Gilbert LA,Wang X,Lim WA,Weissman JS,Qi LS.(2013)CRISPRinterference(CRISPRi)for sequence-specific control of geneexpression.Nat.Protoc.8(11):2180-2196.
Leader DJ,Connelly S,Filipowicz W,Brown JWS.(1994)Characterisationand expression of a maize U3 snRNA gene.Biochimica et Biophysica Acta 1219:145-147.
Liang Z,Zhang K,Chen K,Gao C.(2014)Targeted mutagenesis in Zea maysusing TALENs and the CRISPR/Cas System.Journal of Genetics and Genomics 41:63-68.Li T,Huang S,Jiang WZ,Wright D,Spalding MH,Weeks DP,Yang B.(2011)TALnucleases(TALNs):hybrid proteins composed of TAL effectors and FokI DNA-cleavage domain.Nucleic Acids Res.39:359–372.
Maniatis T,Fritsch EF and J.Sambrook J,1982.Molecular Cloning ColdSpring Harbor Laboratory.
Puchta H,Dujon B and Hohn B,1993.Homologous recombination in plantcells is enhanced by in vivo induction of double strand breaks into DNA by asite-specific endonuclease.Nucleic acids research,21(22),pp.5034–40.在http:// www.pubmedcentral.nih.gov/articlerender.fcgi?artid=310614&tool=pmcentrez& rendertype=abstract可以获得。
Raikhel NV(1992)Nuclear targeting in plants.Plant Physiol 100:1627-1632.
Rosen LE et al.,(2006)Homing endonuclease I-CreI derivatives withnovel DNA target specificities.Nucleic Acids Res.34:4791–4800.
Shieh MW et al.,(1993)Nuclear targeting of the maize R proteinrequires two nuclear localization sequences.Plant Physiology 101:353-361.
Shukla VK et al.,(2009)Precise genome modification in the cropspecies Zea mays using zinc-finger nucleases.Nature 459:437–441.
Sikora P et al.,2011.Mutagenesis as a tool in plant genetics,functional genomics,and breeding.International journal of plant genomics,2011,p.314829.在http://www.pubmedcentral.nih.gov/articlerender.fcgi?artid=3270407&tool=pmcentre z&rendertype=abstract[Accessed July 25,2012]可以获得。
Smith AM and Zeeman SC,2006.Quantification of starch in planttissues.Nat.Protocols 1:1342-1345.
Smith TF,Waterman MS,1981.Identification of Common MolecularSubsequences.J Mol Biol 147:195-197.
Symington LS,Gautier J.(2011)Double-Strand Break End Resection andRepair Pathway Choice.Annual Review of Genetics.45:247-271.
Till BJ et al.,2007Discovery of chemically induced mutations in riceby TILLING.BMC Plant Biol.7:19.
Upadhyay SK et al.,(2014)RNA-guided genome editing for target genemutations in wheat.Genes,Genomes,Genetics 3:2233-2238.
Vainstein A et al.,2011.Permanent genome modifications in plant cellsby transient viral vectors.Trends in biotechnology,29(8),pp.363–9.在http://www.ncbi.nlm.nih.gov/pubmed/21536337[Accessed July 30,2012]可以获得。
Varagona MJ et al.,(1992)Nuclear localization signal(s)required fornuclear targeting of the maize regulatory protein Opaque-2.The Plant Cell 4:1213-1227.
Wagner P et al.,1990)Active transport of proteins into thenucleus.FEBS 275:1-5.
Wehrkamp-Richter S et al.,2009.Characterisation of a new reportersystem allowing high throughput in planta screening for recombination eventsbefore and after controlled DNA double strand break induction.Plantphysiology and biochemistry:PPB/Sociétéde physiologie végétale,47(4),pp.248–55.在http://www.ncbi.nlm.nih.gov/pubmed/19136269[Accessed July 17,2012]可以获得。Weise,S.E.et al.,(2012)Engineering starch accumulation bymanipulation of phosphate metabolism of starch.P.Biotech.J.10,545-554.
Wright D et al.,2005.High-frequency homologous recombination inplants mediated by zinc-finger nucleases.The Plant journal:for cell andmolecular biology,44(4),pp.693–705.在http://www.ncbi.nlm.nih.gov/pubmed/16262717[Accessed July 19,2012].Yon J,Fried M.(1989)Precise gene fusion byPCR.Nucleic Acids Res.17(12):4895.可以获得。
Larkin MA et et al.,2007ClustalW and ClustalX version 2Bioinformatics,23(21):2947-2948.doi:10.1093/bioinformatics/btm404
Goujon M et al.,2010A new bioinformatics analysis tools framework atEMBL-EBI(2010)Nucleic acids research Jul,38 Suppl:W695-9doi:10.1093/nar/gkq313
在本申请通篇中引用的参考文献均出于本文显而易见的目的而被纳入本文,如同将它们全文纳入本文一样。出于说明的目的,这些参考文献的特定部分被引用到本文特定的位置。在特定位置的参考文献的引用表明将参考文献中教导的方法纳入本文。然而,在特定位置的参考文献的引用,不限制将所有引用的参考文献教导的方法,出于任何目的而纳入本文。
因此,应当理解的是,本发明不限于具体公开的实施方式,旨在涵盖如从属权利要求、如上的说明和/或如附图所示所定义的,在本发明的精神和范围内的所有变型。
Claims (20)
1.一种动物饲料制剂,含有编码改变的葡聚糖水合二激酶的工程核酸的基因工程植物,其特征在于,所述工程核酸为SEQ ID NO:114所示的多核苷酸,与含有野生型葡聚糖水合二激酶的具有相同遗传背景的植物相比,所述植物具有升高的淀粉水平;
其中,所述基因工程植物的制备方法包括:
将至少一个植物细胞与含有第一核酸和第二核酸的载体接触,所述至少一个植物细胞含有存在于编码葡聚糖水合二激酶的内源基因中的靶序列,所述第一核酸编码能够诱导靶序列上的双链断裂的核酸酶,所述第二核酸编码sgRNA,其中,所述核酸酶为Cas9核酸酶,所述Cas9核酸酶由如SEQ ID NO: 75所示的核酸序列编码,且所述sgRNA能够结合如SEQ IDNO: 92所示的靶序列;
选择在所述靶序列中具有改变的植物细胞;和
再生含有来自植物细胞的改变的基因工程植物。
2.根据权利要求1所述的动物饲料制剂,其中,所述改变的葡聚糖水合二激酶是无活性的。
3.根据权利要求1所述的动物饲料制剂,其中,进一步含有选自玉米、谷物、大豆、酒糟其他饲料所组成的组中的动物饲料。
4.根据权利要求1所述的动物饲料制剂,其中,进一步含有一种或多种外源酶。
5.根据权利要求4所述的动物饲料制剂,其中,所述一种或多种外源酶选自由糖苷酶、木聚糖酶、纤维素酶、内切葡聚糖酶、外切葡聚糖酶、纤维二糖水解酶、β-木糖苷酶、阿魏酸酯酶、β-葡糖苷酶和淀粉酶所组成的组中。
6.一种提高植物中淀粉水平的方法,该方法包括:
将至少一个植物细胞与含有第一核酸和第二核酸的载体接触,所述至少一个植物细胞含有存在于编码葡聚糖水合二激酶的内源基因中的靶序列,所述第一核酸编码能够诱导靶序列上的双链断裂的核酸酶,所述第二核酸编码sgRNA,其中,所述核酸酶为Cas9核酸酶,所述Cas9核酸酶由如SEQ ID NO: 75所示的核酸序列编码,且所述sgRNA能够结合如SEQ IDNO: 92所示的靶序列;
选择在所述靶序列中具有改变的植物细胞;和
再生含有来自植物细胞的改变的基因工程植物;
所述基因工程植物含有编码改变的葡聚糖水合二激酶的工程核酸,所述工程核酸为SEQ ID NO:114所示的多核苷酸。
7.根据权利要求6所述的方法,其中,所述基因工程植物对于所述改变是纯合的。
8.根据权利要求6所述的方法,其中,所述基因工程植物对于所述改变是杂合的。
9.根据权利要求8所述的方法,其中,该方法还包括将杂合的基因工程植物自交,或与对于相同改变是杂合的另外的基因工程植物杂交,且选择改变是纯合的第一子代植物。
10.根据权利要求8所述的方法,其中,该方法还包括将所述基因工程植物与具有相同遗传背景的野生型植物杂交,且选择改变是杂合的第一子代植物。
11.根据权利要求10所述的方法,其中,该方法还包括将第一杂合的子代植物自交并选择改变是纯合的第二子代植物。
12.根据权利要求6所述的方法,其中,所述改变包括突变。
13.根据权利要求12所述的方法,其中,所述突变包括靶序列中至少一个核苷酸的插入、缺失或取代中的至少一种。
14.根据权利要求6所述的方法,其中,与具有相同遗传背景的非基因工程植物相比,包含所述改变的基因工程植物或其子代具有升高的淀粉水平。
15.根据权利要求6所述的方法,其中,所述载体还含有与所述第一核酸可操作地连接的第一核酸启动子。
16.根据权利要求6所述的方法,其中,所述载体还含有与所述第二核酸可操作地连接的第二核酸启动子。
17.根据权利要求16所述的方法,其中,所述第二核酸启动子含有如SEQ ID NO:82所示的序列。
18.根据权利要求6所述的方法,其中,所述第二核酸含有如SEQ ID NO:95所示的序列。
19.一种农业加工的方法,该方法包括:
表达编码能够诱导靶序列上的双链断裂的核酸酶的第一核酸和编码sgRNA的第二核酸,其中,所述靶序列被包含在编码葡聚糖水合二激酶的内源基因中,且含有如SEQ ID NO:92所示的序列;并且所述核酸酶为Cas9核酸酶,所述Cas9核酸酶由含有如SEQ ID NO: 75所示的序列的核酸编码;
选择与含有野生型序列的具有相同遗传背景的植物相比,在靶序列中具有改变且具有升高的淀粉水平的纯合植物;和
加工所述纯合植物,其中,所述加工包括选自收获、排水、粉碎、干燥、发酵、使用化学品水解、使用外源酶水解和与植物生物质组合中的一个或多个步骤;
所述纯合植物含有编码改变的葡聚糖水合二激酶的工程核酸,所述工程核酸为SEQ IDNO:114所示的多核苷酸。
20.一种制备动物饲料的方法,该方法包括:
表达编码能够诱导靶序列上的双链断裂的核酸酶的第一核酸,其中,所述靶序列被包含在编码葡聚糖水合二激酶的内源基因中,并含有如SEQ ID NO: 92所示的序列,所述核酸酶为Cas9核酸酶,所述Cas9核酸酶由含有如SEQ ID NO: 75所示的序列的核酸编码;
选择与含有野生型序列的具有相同遗传背景的植物相比,在靶序列中具有改变且具有升高的淀粉水平的纯合植物;和
进行选自由以下所组成的组中的至少一个步骤:收获、排水、粉碎、干燥、青贮、造粒、与可食用纤维素源组合和与植物生物质组合;
所述纯合植物含有编码改变的葡聚糖水合二激酶的工程核酸,所述工程核酸为SEQ IDNO:114所示的多核苷酸。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201462056852P | 2014-09-29 | 2014-09-29 | |
US62/056,852 | 2014-09-29 | ||
PCT/US2015/052940 WO2016054039A1 (en) | 2014-09-29 | 2015-09-29 | Plants with engineered endogenous genes |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107075526A CN107075526A (zh) | 2017-08-18 |
CN107075526B true CN107075526B (zh) | 2022-07-08 |
Family
ID=55631363
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201580052482.8A Active CN107075526B (zh) | 2014-09-29 | 2015-09-29 | 具有工程内源基因的植物 |
Country Status (3)
Country | Link |
---|---|
CN (1) | CN107075526B (zh) |
AU (1) | AU2015323980B2 (zh) |
WO (1) | WO2016054039A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2017356846B2 (en) * | 2016-11-08 | 2022-07-28 | Agrivida, Inc. | Phytase production and methods of using the same |
EA201992790A1 (ru) * | 2017-05-25 | 2020-04-03 | Инститьют Оф Джинетикс Энд Дивелопментал Байолоджи Чайниз Академи Оф Сайенсиз | Способы повышения урожая зерна |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103667338A (zh) * | 2013-11-28 | 2014-03-26 | 中国科学院遗传与发育生物学研究所 | 一种玉米基因组定点改造方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7834146B2 (en) * | 2000-05-08 | 2010-11-16 | Monsanto Technology Llc | Recombinant polypeptides associated with plants |
CA2704016A1 (en) * | 2007-11-05 | 2009-05-14 | Syngenta Participations Ag | Methods for increasing starch content in plants |
US9598700B2 (en) * | 2010-06-25 | 2017-03-21 | Agrivida, Inc. | Methods and compositions for processing biomass with elevated levels of starch |
WO2014078588A1 (en) * | 2012-11-14 | 2014-05-22 | Agrivida, Inc. | Methods and compositions for processing biomass with elevated levels of starch |
CN103554238B (zh) * | 2013-10-30 | 2015-07-01 | 南京农业大学 | 一种植物淀粉合成相关蛋白flo6及其编码基因与应用 |
-
2015
- 2015-09-29 CN CN201580052482.8A patent/CN107075526B/zh active Active
- 2015-09-29 AU AU2015323980A patent/AU2015323980B2/en active Active
- 2015-09-29 WO PCT/US2015/052940 patent/WO2016054039A1/en active Application Filing
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103667338A (zh) * | 2013-11-28 | 2014-03-26 | 中国科学院遗传与发育生物学研究所 | 一种玉米基因组定点改造方法 |
Also Published As
Publication number | Publication date |
---|---|
AU2015323980A1 (en) | 2017-03-02 |
WO2016054039A1 (en) | 2016-04-07 |
CN107075526A (zh) | 2017-08-18 |
AU2015323980B2 (en) | 2021-07-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhang et al. | Development of an Agrobacterium‐delivered CRISPR/Cas9 system for wheat genome editing | |
CN105802991B (zh) | 一种通过基因瞬时表达对植物定点改造的方法 | |
CN107267524B (zh) | 用于基因打靶和性状堆叠的工程化转基因整合平台(etip) | |
CN105264067A (zh) | Fad3性能基因座及相应的能够诱导靶向断裂的靶位点特异性结合蛋白 | |
AU2014378946A1 (en) | Modified plants | |
EP4013217A1 (en) | Alteration of flavor traits in consumer crops via disablement of the myrosinase/glucosinolate system | |
Mohan et al. | Gene editing technologies for sugarcane improvement: opportunities and limitations | |
CN107075526B (zh) | 具有工程内源基因的植物 | |
EP2920311B1 (en) | Methods and compositions for processing biomass with elevated levels of starch | |
CN114072512A (zh) | 不育基因及其相关构建体和应用 | |
US10443068B2 (en) | Plants with engineered endogenous genes | |
CN111630171A (zh) | 植物抗倒伏性 | |
CN112980839B (zh) | 创制水稻高直链淀粉型新种质的方法及其应用 | |
WO2018228348A1 (en) | Methods to improve plant agronomic trait using bcs1l gene and guide rna/cas endonuclease systems | |
WO2020232660A1 (en) | Abiotic stress tolerant plants and methods | |
Ghose et al. | Cisgenesis in the era of genome editing and modern plant biotechnology | |
WO2021016906A1 (en) | Abiotic stress tolerant plants and methods | |
WO2019165199A1 (en) | Methods and compositions relating to maintainer lines | |
CN114058639B (zh) | 利用单碱基基因编辑技术突变OsWaxy基因改良水稻直链淀粉含量的方法 | |
CN113774068B (zh) | 一种水稻胚乳粉质相关基因OsPDC-E1-α1及其编码蛋白质和应用 | |
US20230313214A1 (en) | Promoter elements for improved polynucleotide expression in plants | |
US20230220409A1 (en) | Alteration of seed composition in plants | |
US20140317783A1 (en) | Polynucleotides, polypeptides and methods for enhancing photossimilation in plants | |
WO2023130031A2 (en) | Inot1824 transgenic maize | |
Roeintan et al. | Rapeseed Transformation with aro A Bacterial Gene Containing P101S Mutation Confers Glyphosate Resistance |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |