CN102725412B - 优化的内切核酸酶及其用途 - Google Patents

优化的内切核酸酶及其用途 Download PDF

Info

Publication number
CN102725412B
CN102725412B CN201080062324.8A CN201080062324A CN102725412B CN 102725412 B CN102725412 B CN 102725412B CN 201080062324 A CN201080062324 A CN 201080062324A CN 102725412 B CN102725412 B CN 102725412B
Authority
CN
China
Prior art keywords
endonuclease
scei
sequence
amino acid
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201080062324.8A
Other languages
English (en)
Other versions
CN102725412A (zh
Inventor
A·赫鲁贝克
C·比斯根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BASF Plant Science Co GmbH
Original Assignee
BASF Plant Science Co GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BASF Plant Science Co GmbH filed Critical BASF Plant Science Co GmbH
Publication of CN102725412A publication Critical patent/CN102725412A/zh
Application granted granted Critical
Publication of CN102725412B publication Critical patent/CN102725412B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/10Cells modified by introduction of foreign genetic material
    • C12N5/12Fused cells, e.g. hybridomas
    • C12N5/14Plant cells

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Peptides Or Proteins (AREA)

Abstract

提供了优化的内切核酸酶,以及使用优化的内切核酸酶靶向整合、靶向缺失或靶向突变多核苷酸的方法。

Description

优化的内切核酸酶及其用途
发明领域
本发明涉及优化的内切核酸酶,以及使用优化的内切核酸酶对多核苷酸进行靶向整合、靶向缺失或靶向突变的方法。
发明背景
基因组改造(genome engineering)是概括用于在基因组内插入、缺失、取代或操纵特定遗传序列的不同技术的通用术语,其具有大量的治疗应用和生物技术应用。所有基因组改造技术或多或少都使用重组酶、整合酶或内切核酸酶,用于在预定位点制造DNA双链断裂,以促进同源重组。
尽管已利用了大量的方法来制造DNA双链断裂,开发在基因组中于高度特异性位点制造DNA双链断裂的有效方法仍是基因疗法、农业技术和合成生物学中的主要目标。
实现该目标的一种手段是使用对下述序列具有特异性的核酸酶,所述序列足够大到仅存在于基因组内的单个位点。识别此类大约15至30个核苷酸的大DNA序列的核酸酶因此被称为“大范围核酸酶”或“归巢(homing)内切核酸酶”,并常与寄生性(parasitic)或自私的(selfish)DNA元件相关联,所述元件例如常发现于植物和真菌基因组中的组1自剪接内含子和内含肽。大范围核酸酶通常被分组为四个家族:LAGLIDADG家族、GIY-YIG家族、His-Cys盒家族和HNH家族。这些家族的特征在于影响催化活性和它们的DNA识别序列的序列的结构基序。
来自LAGLIDADG家族的天然大范围核酸酶已被用于在昆虫和哺乳动物细胞培养物以及很多生物(例如植物、酵母或小鼠)中有效促进位点特异性基因组修饰,但是该手段已局限于对DNA识别序列保守的同源基因的修饰或已向其中引入了识别序列的预改造(preengineered)基因组的修饰。为避免此类局限以及为促进DNA双链断裂激发的基因修饰的系统性(systematic)执行,已经制造了新的核酸酶类型。
一种新核酸酶类型由人工组合的非特异性核酸酶和高度特异性DNA结合结构域构成。已使用FokI限制性酶的非特异性核酸酶结构域和经改造的锌指DNA结合结构域之间的嵌合融合体,在多种生物中展现了该策略的有效性(例如WO03/089452)。该手段的一种变化是使用作为DNA结合结构域的大范围核酸酶的失活变体与非特异性核酸酶(例如FokI)融合的,例如Lippow等人,“Creation of a type IIS restriction endonuclease with along recognition sequence”,Nucleic Acid Research(2009),Vol.37,No.9,3061至3073页所公开的。
一种备选手段是对天然大范围核酸酶进行遗传改造,以定制其与基因组中存在的位点结合的DNA结合区域,由此制造具有新特异性的经改造的大范围核酸酶(例如WO07093918、WO2008/093249、WO09114321)。但是,已针对DNA切割特异性改造过的很多大范围核酸酶相对于其所来源的天然存在的大范围核酸酶而言具有减少的切割活性(US2010/0071083)。大多数的大范围核酸酶还作用于与其最优结合位点相似的序列上,这可能导致非意图性的或者甚至有害的脱靶作用。已采取了若干手段,以增强大范围核酸酶诱导的同源重组的效率,例如通过将核酸酶与大鼠糖皮质激素受体的配体结合结构域融合,以通过添加地塞米松或相似化合物促进或者甚至诱导该经修饰的核酸酶运送至细胞核以及由此运送至其靶向位点(WO2007/135022)。尽管如此,本领域仍需要开发具有对同源重组有高诱导效率和/或针对其结合位点有高特异性的大范围核酸酶,由此限制脱靶作用的风险。
发明简述
本发明提供了LAGLIDADG内切核酸酶家族的优化版本的内切核酸酶。特别是包括与SEQ ID NO:1、15、16、17或19所描述的多肽具有至少80%的氨基酸序列同一性的氨基酸序列的优化的内切核酸酶。在本发明的一个实施方案中,优化的内切核酸酶是野生型或经改造版本的I-SceI,如SEQ ID NO:1所述,或其一种在氨基酸水平具有至少55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的同源物,具有一种或多种选自以下的突变:a)I-Scel-1,I-Scel-2,I-Scel-3,I-Scel-4,I-Scel-5,I-Scel-6,I-Scel-7,I-Scel-8和I-Scel-9;b)S229K,S229A,S229P,S229G,S229E,S229Q,S229D,S229N,S229C,S229Y,S229T,M203K,M203H,M203R,Q77K,Q77H,Q77R,E130K,E130H,E130R,Y199K,Y199H和Y199R;
c)在其氨基酸序列的起始甲硫氨酸之后的甲硫氨酸、缬氨酸、甘氨酸、苏氨酸、丝氨酸、丙氨酸、半胱氨酸、谷氨酸、谷氨酰胺、天冬氨酸、天冬酰胺、异亮氨酸或组氨酸;或
d)选自上述a)和b)、a)和c)、b)和c)或a)、b)和c)的一个或多个突变的组合。
在一个实施方案中,优化的内切核酸酶包括SEQ ID NO:2、3或5所描述的氨基酸序列。
在本发明的另一个实施方案中,优化的内切核酸酶是经改造的内切核酸酶版本,其包含与SEQ ID NO:1、15、16、17或19所描述的多肽具有至少80%的氨基酸序列同一性的氨基酸序列。
在另一个实施方案中,本发明提供了与SEQ ID NO:1所描述的多肽具有至少80%的氨基酸序列同一性的内切核酸酶,或与SEQ ID NO:1所描述的多肽具有至少80%的氨基酸序列同一性的经改造的内切核酸酶版本,其中通过删除或突变氨基酸序列TISSETFLK的任一个氨基酸,去除了氨基酸序列TISSETFLK。本发明的另一个优选的实施方案是权利要求1至4的任一项所述的优化的内切核酸酶,其包含与SEQ ID NO:1或2所描述的多肽具有至少80%的氨基酸序列同一性的氨基酸序列,且包含SE9 ID NO:1的丝氨酸Nr229的突变。在本发明的另一个实施方案中,优化的内切核酸酶与至少一个锌指结构域,或与源自转录激活物-样(TAL)效应子的至少一个重复单元,或与至少一个锌指结构域和源自转录激活物-样(TAL)效应子的至少一个重复单元融合。优选的,优化的内切核酸酶包括SecIII或SecIV分泌信号。本发明还提供了包含多核苷酸序列的经分离的多核苷酸,所述多核苷酸序列编码优化的内切核酸酶。
优选地,这一多核苷酸是经密码子优化的,或具有低含量的DNA不稳定性基序(motives),或具有低含量的密码子重复,或具有低含量的隐蔽剪接位点,或具有低含量的备选起始密码子,具有低含量的限制性位点,或具有低含量的RNA二级结构,或具有上述这些特征的任何组合。本发明的另一实施方式是表达盒,所述表达盒包含与启动子和终止子序列功能性组合的、如上文所述的经分离的多核苷酸。本发明的其他实施方案是下述载体、宿主细胞或非人生物,它们包含编码优化的内切核酸酶的多核苷酸,或编码优化的内切核酸酶的经分离的多核苷酸,或含有编码优化的内切核酸酶的多核苷酸的表达盒,以及包含上述内切核酸酶、多核苷酸和表达盒的组合的载体、宿主细胞或非人生物。优选地,非人生物是植物。
本发明提供了使用本文所述的内切核酸酶诱导同源重组或末端连接事件的方法。优选地,在用于序列切除的靶向整合的方法中。优选地,被切除的序列是标记基因。本发明进一步提供了用于同源重组多核苷酸的方法,包括下列步骤:a)提供用于同源重组的感受态细胞,b)提供下述多核苷酸,所述多核苷酸包含侧翼有序列A和序列B的经优化的内切核酸酶的DNA识别位点,c)提供包含序列A’和B’的多核苷酸,所述序列A’和B’足够长并且与序列A和序列B足够同源,从而允许在所述细胞中同源重组,以及d)提供本文所述的优化的内切核酸酶或本文所述的表达盒,e)在所述细胞中组合b)、c)和d),以及f)检测b)和c)的重组多核苷酸,或选择出包含b)和c)的重组多核苷酸的细胞,或使包含b)和c)的重组多核苷酸的细胞生长。优选地,用于多核苷酸同源重组的方法导致同源重组,其中,步骤a)的感受态细胞中包含的多核苷酸序列从步骤f)的生长细胞的基因组中缺失。本发明的另一方法是用于靶向突变的方法,所述方法包括下述步骤:a)提供包含下述多核苷酸的细胞,所述多核苷酸包含优化的内切核酸酶的DNA识别位点,b)提供能切割步骤a)的所述DNA识别位点的、如权利要求1至7中任意一项所述的经优化的内切核酸酶或权利要求10所述的表达盒,c)在所述细胞中组合a)和b),以及d)检测经突变的多核苷酸,或针对包含经突变的多核苷酸的细胞加以选择并且生长所述细胞。
在本发明的另一优选的实施方式中,上文所述的方法包括下述步骤,其中优化的内切核酸酶和DNA识别位点组合于至少一种细胞中,这通过生物的杂交、通过转化或通过经由融合至经优化内切核酸酶的SecIII或SecIV肽介导的运送来实现。
附图简述
图1显示了同源重组频率的比较,这是通过在三种不同的I-SceI变体诱导重组后,β-葡糖醛酸糖苷酶活性的重建(%蓝色幼苗)来测量的。每个I-SceI变体都在5株携带了测试构建体的不同植物株系中测试。对于每个组合,分析96株幼苗的T2代的β-葡糖醛酸糖苷酶活性(“I-SceI”,具有SEQ ID NO:1所述的氨基酸序列;“I-SceI c-term mod”具有SEQ IDNO:3所述的氨基酸序列;“NLS I-SceI c-term mod”具有SEQ ID NO:5所述的氨基酸序列),还参见实施例10b。
图2描述了不同的I-SceI同源物的序列比对,其中1是SEQ ID NO:1,2是SEQ IDNO:15,3是SEQ ID NO:16,4是SEQ ID NO:17,5是SEQID NO:18。
发明详述
本发明提供了优化的内切核酸酶,其可以用作备选的诱导DNA双链断裂的酶。本发明还提供了使用这些优化的内切核酸酶的方法。
优化的内切核酸酶是I-Sce-I(SEQ ID NO:1所述)的变体,以及I-Sce-I的同源物,所述同源物在氨基酸水平具有至少55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性。优化的I-SceI版本也被称为优化的I-SceI。
I-SceI内切核酸酶的同源物可克隆自其它生物,或可通过对LAGLIDADG内切核酸酶加以突变来制造,例如通过替代、添加或缺失给定的LAGLIDADG内切核酸酶的氨基酸序列中的氨基酸来进行。
例如,可向LAGLIDADG内切核酸酶的氨基酸序列添加核定位信号和/或改变其序列的一个或多个氨基酸和/或缺失其序列的部分,例如,其N-末端的部分或C-末端的部分。
表1:I-SceI的示例性同源物(可克隆自其它生物)描述在表1中;
可用于本发明的LAGLIDADG内切核酸酶可在藻类、真菌、酵母、原生动物、叶绿体、线粒体、细菌和古细菌的基因组中发现。LAGLIDADG内切核酸酶包含至少一个保守的LAGLIDADG基序。LAGLIDADG基序的名称基于出现于所有LAGLIDADG内切核酸酶中的特征性氨基酸序列。术语LAGLIDADG是该氨基酸序列根据STANDARD ST.25(即,PCIPI执行协调委员会(PCIPI Executive Coordination Committee)针对专利申请中呈现的核苷酸和氨基酸序列表所采用的标准)中所述的单字母编码的首字母缩写。
但是,LAGLIDADG基序并非在所有LAGLIDADG内切核酸酶中完全保守(见例如Chevalier等人(2001),Nucleic Acids Res.29(18):3757至3774,或Dalgaard等人(1997),Nucleic Acids Res.25(22):4626至4638),从而一些LAGLIDADG内切核酸酶在它们的LAGLIDADG基序中包含一个或数个氨基酸改变。包含仅一个LAGLIDADG基序的LAGLIDADG内切核酸酶通常作为同源或异源二聚体发挥作用。包含两个LAGLIDADG基序的LAGLIDADG内切核酸酶作为单体发挥作用,并且通常包含伪二聚体结构。
LAGLIDADG内切核酸酶可分离自表1中作为例子提到的生物的多核苷酸,或通过本领域已知的技术从头合成,例如使用本领域技术人员已知的公众数据库中可获得的序列信息来进行,所述数据库例如Genbank(Benson(2010)),Nucleic Acids Res 38:D46-51或Swissprot(Boeckmann(2003),Nucleic Acids Res 31:365-70)。
可在针对蛋白质家族的PFAM-数据库中发现LAGLIDADG内切核酸酶的集合。PFAM-数据库检录号PF00961描述了LAGLIDADG 1蛋白质家族,其包含约800条蛋白序列。PFAM-数据库检录号PF03161描述了LAGLIDADG 2蛋白质家族的成员,其包含约150条蛋白序列。可在InterPro数据库中找到LAGLIDADG内切核酸酶的一个备选集合,例如,InterPro检录号IPR004860。
产生LAGLIDADG内切核酸酶的同源物的另一种方法是突变LAGLIDADG内切核酸酶的氨基酸序列,从而修饰它的DNA结合亲和力、它的二聚体形成亲和力或改变它的DNA识别序列。LAGLIDADG内切核酸酶的蛋白质结构确定以及同源物的序列比对允许涉及下述可以改变的氨基酸的理性的选择,所述氨基酸的改变影响它的DNA结合亲和力、它的酶活性或改变它的DNA识别序列。
在本文中使用时,术语“DNA结合亲和性”表示大范围核酸酶或LAGLIDADG内切核酸酶与参照DNA分子(例如DNA识别序列或任意序列)非共价联结的趋势。结合亲和性是通过解离常数KD(例如,I-SceI针对WT DNA识别序列的KD为大约0.1nM)测量的。在本文中使用时,如果相对于参照大范围核酸酶或LAGLIDADG内切核酸酶而言,重组大范围核酸酶针对参照DNA识别序列的KD增加或减少统计上显著(p<0.05)的量,那么大范围核酸酶则具有“变动的”结合亲和性。
在本文中使用时,术语“酶活性”指大范围核酸酶(例如LAGLIDADG内切核酸酶)切割特定DNA识别序列的速率。此类活性是可测量的酶促反应,所述反应涉及对双链DNA的磷酸二酯键的水解。作用于特定DNA底物上的大范围磷酸酶的活性受大范围核酸酶对该特定DNA底物的亲和性(affinity)或亲合力(avidity)的影响,这又进而受与DNA的序列特异性相互作用和非序列特异性相互作用的影响。
可通过缺失核酸酶氨基酸序列中的50、40、30、20、10、9、8、7、6、5、4、3、2或1个氨基酸对核酸酶进行优化,而不破坏其内切核酸酶活性。例如,当LAGLIDADG内切核酸酶的氨基酸序列中的部分被缺失的情况下,保留上文所述的LAGLIDADG内切核酸酶基序则是重要的。
优选地,缺失PEST序列或其它失稳(destabilizing)基序,例如KEN-框、D-框和A-框。还可通过引入单个氨基酸改变,例如向PEST序列中引入带正电荷的氨基酸(精氨酸、组氨酸和赖氨酸),来破坏这些基序。
经过突变而修饰了它的DNA结合亲和性或改变了它的DNA识别位点的LAGLIDADG内切核酸酶被称为经改造的内切核酸酶。可以像其他LAGLIDADG内切核酸酶一样,改造I-SceI及其在氨基酸水平上具有至少55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的I-Sce I同源物,从而改变它的DNA结合亲和力、它的酶活性或改变它的DNA识别序列。经过改造的I-SceI和I-Sce I同源物版本在氨基酸水平上具有至少55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性
因此,在本发明的一个实施方案中,优化的内切核酸酶是经改造的版本的I-Sce I及其在氨基酸水平上具有至少55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的同源物,并且相比其未改造的形式(意指天然存在的各个LAGLIDADG内切核酸酶)时,具有改变的DNA结合亲和力、改变的酶活性或改变的DNA识别序列。
在本发明的另一个实施方案中,优化的内切核酸酶是SEQ ID NO:1所述的I-SecI或如它们天然存在的其在氨基酸水平上具有至少55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的同源物的变体。
只要不包含其他突变,则这样的同源物也将被认为是天然存在的同源物,其中所述同源物不是天然存在的,但具有A36G,L40M,L40V,I41S,I41N,L43A,H91A和I123L中的至少一个突变,所述突变对I-SceI的DNA结合亲和力几乎没有影响,或者将改变的它的DNA识别序列,而相比SEQ ID NO:1所述的I-SecI或在氨基酸水平上具有至少55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的各个同源物(如其天然存在的),所述其他突变改变了其DNA结合亲和力、酶活性或其DNA识别序列。
具有增加的或减少的DNA结合亲和性的I-SceI的经改造的版本例如被公开于WO07/047859和WO09/076292中,两者通过引用包括到本文中。
如果没有另外的明确指明,所有突变体都将按照各内切核酸酶的野生型氨基酸序列的氨基酸编号来命名,例如,I-SceI的突变体L19将在如SEQ ID NO:1所示的野生型I-SceI氨基酸序列第19位处具有对亮氨酸的氨基酸替换。I-SceI的L19H突变体将以组氨酸替代野生型I-SceI氨基酸序列第19位的氨基酸亮氨酸。
例如,I-SceI的DNA结合亲和性可通过对应于选自下组的取代的至少一种修饰而增加,所述组由
(a)用H、N、Q、S、T、K或R对D201、L19、L80、L92、Y151、Y188、I191、Y199或Y222的取代;或
(b)用K或R对N15、N17、S81、H84、N94、N120、T156、N157、S159、N163、Q165、S166、N194或S202的取代
构成。
I-SceI的DNA结合亲和性可通过对应于选自下组的取代的至少一种突变而减少,所述组由
(a)用H、N、Q、S、T、D或E对K20、K23、K63、K122、K148、K153、K190、K193、K195或K223的取代;或
(b)用D或E对L19、L80、L92、Y151、Y188、I191、Y199、Y222、N15、N17、S81、H84、N94、N120、T156、N157、S159、N163、Q165、S166、N194或S202的取代
构成。
具有改变的DNA识别序列的I-SceI、I-CreI、I-MsoI和I-CeuI的经改造版本被公开于例如WO07/047859和WO09/076292中。
例如,I-SceI的一个重要DNA识别位点具有下述序列:
正义:5’-T T A C C C T G T T A T C C C T A G-3’
碱基位置: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
反义 3′-A A T G G G A C A A T A G G G A T C-5′
I-SceI的下述突变将使第4位对C的优先性改变至A:K50。
I-SceI的下述突变将保持第4位对C的优先性:K50、CE57。
I-SceI的下述突变将使第4位对C的优先性改变至G:E50、R57、K57。
I-SceI的下述突变将使第4位对C的优先性改变至T:K57、M57、Q50。
I-SceI的下述突变将使第5位对C的优先性改变至A:K48、Q102。
I-SceI的下述突变将保持第5位对C的优先性:R48、K48、E102、E59。
I-SceI的下述突变将使第5位对C的优先性改变至G:E48、K102、R102。
I-SceI的下述突变将使第5位对C的优先性改变至T:Q48、C102、L102、V102。
I-SceI的下述突变将使第6位对C的优先性改变至A:K59。
I-SceI的下述突变将保持第6位对C的优先性:R59、K59。
I-SceI的下述突变将使第6位对C的优先性改变至G:K84、E59。
I-SceI的下述突变将使第6位对C的优先性改变至T:Q59、Y46。
I-SceI的下述突变将使第7位对T的优先性改变至A:C46、L46、V46。
I-SceI的下述突变将使第7位对T的优先性改变至C:R46、K46、E86。
I-SceI的下述突变将使第7位对T的优先性改变至G:K86、R86、E46。
I-SceI的下述突变将保持第7位对T的优先性:K68、C86、L86、Q46*。
I-SceI的下述突变将使第8位对G的优先性改变至A:K61、S61、V61、A61、L61。
I-SceI的下述突变将使第8位对G的优先性改变至C:E88、R61、H61。
I-SceI的下述突变将保持第8位对G的优先性:E61、R88、K88。
I-SceI的下述突变将使第8位对G的优先性改变至T:K88、Q61、H61。
I-SceI的下述突变将使第9位对T的优先性改变至A:T98、C98、V98、L9B。
I-SceI的下述突变将使第9位对T的优先性改变至C:R98、K98。
I-SceI的下述突变将使第9位对T的优先性改变至G:E98、D98。
I-SceI的下述突变将保持第9位对T的优先性:Q98。
I-SceI的下述突变将使第10位对T的优先性改变至A:V96、C96、A96。
I-SceI的下述突变将使第10位对T的优先性改变至C:K96、R96。
I-SceI的下述突变将使第10位对T的优先性改变至G:D96、E96。
I-SceI的下述突变将保持第10位对T的优先性:Q96。
I-SceI的下述突变将保持第11位对A的优先性:C90、L90。
I-SceI的下述突变将使第11位对A的优先性改变至C:K90、R90。
I-SceI的下述突变将使第11位对A的优先性改变至G:E90。
I-SceI的下述突变将使第11位对A的优先性改变至T:Q90。
I-SceI的下述突变将使第12位对T的优先性改变至A:Q193。
I-SceI的下述突变将使第12位对T的优先性改变至C:E165、E193、D193。
I-SceI的下述突变将使第12位对T的优先性改变至G:K165、R165。
I-SceI的下述突变将保持第12位对T的优先性:C165、L165、C193、V193、A193、T193、S193。
I-SceI的下述突变将使第13位对C的优先性改变至A:C193、L193。
I-SceI的下述突变将保持第13位对C的优先性:K193、R193、D192。
I-SceI的下述突变将使第13位对C的优先性改变至G:E193、D193、K163、R192。
I-SceI的下述突变将使第13位对C的优先性改变至T:Q193、C163、L163。
I-SceI的下述突变将使第14位对C的优先性改变至A:L192、C192。
I-SceI的下述突变将保持第14位对C的优先性:E161、R192、K192。
I-SceI的下述突变将使第14位对C的优先性改变至G:K147、K161、R161、R197、D192、E192。
I-SceI的下述突变将使第14位对C的优先性改变至T:K161、Q192。
I-SceI的下述突变将保持第15位对C的优先性:E151。
I-SceI的下述突变将使第15位对C的优先性改变至G:K151。
I-SceI的下述突变将使第15位对C的优先性改变至T:C151、L151、K151。
I-SceI的下述突变将保持第17位对A的优先性:N152、S152、C150、L150、V150、T150。
I-SceI的下述突变将使第17位对A的优先性改变至C:K152、K150。
I-SceI的下述突变将使第17位对A的优先性改变至G:N152、S152、D152、D150、E150。
I-SceI的下述突变将使第17位对A的优先性改变至T:Q152、Q150。
I-SceI的下述突变将使第18位对G的优先性改变至A:K155、C155。
I-SceI的下述突变将使第18位对G的优先性改变:R155、K155。
I-SceI的下述突变将保持第18位对G的优先性:E155。
I-SceI的下述突变将使第18位对G的优先性改变至T:H155、Y155。
若干突变的组合可增强效果。一个例子是三重突变体W149G、D150C和N152K,其将使I-SceI在第17位对A的优先性改变至G。
为保持酶活性,应当避免I-SceI或其在氨基酸水平上具有至少55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的同源物的下述突变:I38S、I38N、G39D、G39R、L40Q、L42R、D44E、D44G、D44H、D44S、A45E、A45D、Y46D、I47R、I47N、D144E、D145E、D145N和G146E。
可组合改变了I-SceI或其在氨基酸水平上具有至少55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的同源物的酶活性、DNA结合亲和性、DNA识别序列的突变,以制造经改造的内切核酸酶,例如基于I-SceI的经改造的内切核酸酶、并且较之SEQ ID NO:1所描述的I-SceI具有变动的DNA结合亲和性和/或改变的DNA识别序列。
除了理性的改造I-SecI外,还可以利用分子进化改变I-SceI或其在氨基酸水平上具有至少55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的同源物的酶活性、DNA结合亲和性、DNA识别序列。可例如采用DNA改组方案来调节编码候选内切核酸酶的多核苷酸。DNA改组是递归性重组和突变的方法,其通过对相关基因的库进行随机片段化、接着通过聚合酶链式反应样的方法重新组装片段来进行。见例如,Stemmer(1994)Proc Natl Acad SciUSA 91:10747-10751;Stemmer(1994)Nature 370:389-391和US5,605,793、US 5,837,458、US 5,830,721和US 5,811,238。还可基于对给定内切核酸酶晶体结构的进一步了解,使用理性设计,来制造经改造的内切核酸酶,见例如,Faj ardo-Sanchez等人,“Computer design of obligate heterodimermeganucleases allows efficient cutting of custom DNA sequences”,Nucleic AcidsResearch,2008,第36卷,第7期,2163-2173。
经改造的内切核酸酶以及它们各自的DNA识别位点的大量例子是本领域已知的,并被公开于例如WO 2005/105989、WO 2007/034262、WO2007/047859、WO 2007/093918、WO2008/093249、WO 2008/102198、WO 2008/152524、WO 2009/001159、WO 2009/059195、WO2009/076292、WO 2009/114321或WO 2009/134714、WO 10/001189中,上述文献均通过引用并入本文。
为了制造优化的核酸酶的突变和改变可以与用于制造经改造的内切核酸酶的突变组合,例如I-SceI的同源物可以是本文所述的优化的核酸酶,但也可以包括用于改变它的DNA结合亲和性和/或改变它的DNA识别序列的突变。
通过调整多核苷酸序列使其适合生物的密码子使用,或者通过从编码内切核酸酶的多核苷酸序列中删除备选的起始密码子或者通过删除隐蔽的多聚腺苷酸化信号,可以改善I-SceI或其在氨基酸水平上具有至少55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的同源物的氨基酸序列,以及编码I-SceI或其在氨基酸水平上具有至少55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的同源物的多核苷酸,其中所述生物中意图表达I-SceI或其在氨基酸水平上具有至少55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的同源物的。
用于制造优化的核酸酶的突变:
可以通过改变各个LAGLIDADG内切核酸酶的氨基酸序列,优化已优化过的核酸酶,如优化版本的I-SceI或其在氨基酸水平上具有至少55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的同源物,来增强蛋白稳定性。因此,较之未经优化的核酸酶的氨基酸序列而言,经优化的核酸酶不包含下述,或具有降低的数量的下述:
a)PEST-序列
b)KEN-框
c)A-框,
d)D-框,或
e)根据N-末端规则包含用于稳定性的经优化的N-端末端,
f)包含甘氨酸(glycin)作为N-端第二个氨基酸,或
g)a)、b)、c)、d)、e)和f)的任何组合。
PEST序列是约12个氨基酸的序列,其包含至少一个脯氨酸、一个谷氨酸(glutamate)或天冬氨酸(aspartate),以及至少一个丝氨酸或苏氨酸。PEST序列例如被描述于Rechsteiner M,Rogers SW.“PEST Sequences and regulation by proteolySis.”TrendS Biochem.Sci.1996;21(7),267至271页中。
KEN-框的氨基酸共有序列是:KENXXX(N/D)。
A-框的氨基酸共有序列是:AQRXLXXSXXXQRVL。
D-框的氨基酸共有序列是:RXXL。
对核酸酶进行稳定以对抗降解的另一途径是根据N-末端规则优化各内切核酸酶的N-端的氨基酸序列。针对在真核生物中的表达优化过的核酸酶在其氨基酸序列的起始甲硫氨酸之后包含甲硫氨酸、缬氨酸、甘氨酸、苏氨酸、丝氨酸、丙氨酸或半胱氨酸。针对在原核生物中的表达优化过的核酸酶在其氨基酸序列的起始甲硫氨酸之后包含甲硫氨酸、缬氨酸、甘氨酸、苏氨酸、丝氨酸、丙氨酸、半胱氨酸、谷氨酸、谷氨酰胺、天冬氨酸、天冬酰胺、异亮氨酸或组氨酸。
可通过缺失核酸酶氨基酸序列中的50、40、30、20、10、9、8、7、6、5、4、3、2或1个氨基酸对核酸酶进行优化,而不破坏其内切核酸酶活性。例如,当LAGLIDADG内切核酸酶的氨基酸序列中的部分被缺失的情况下,保留上文所述的LAGLIDADG内切核酸酶基序则是重要的。
用于优化核酸酶的另一途径是向核酸酶的氨基酸序列添加核定位信号。例如,SEQID NO:4所描述的核定位信号。
经优化的核酸酶可包含上文所述的方法和特征的组合,例如,它们可包含核定位信号,包含甘氨酸作为第二个N-端氨基酸,或者包含C-端的缺失,或这些特征的组合。具有上文所述的方法和特征的组合的经优化的核酸酶的例子是例如SEQ ID NOs:2、3和5所描述的。
经优化的核酸酶不包含下述序列所示的氨基酸序列:
HVCLLYDQWVLSPPH,LAYWFMDDGGK,KTIPNNLVENYLTPMSLAYWFMDDGGK,KPIIY-IDSMSYLIFYNLIK,KLPNTISSETFLK,或TISSETFLK,
或者其不包含下述序列所示的氨基酸序列:
HVCLLYDQWVLSPPH,LAYWFMDDGGK,KPIIYIDSMSYLIFYNLIK,KLPNTISSETFLK或TIS-SETFLK,
或者其不包含下述序列所示的氨基酸序列:
HVCLLYDQWVLSPPH,LAYWFMDDGGK,KLPNTISSETFLK或TISSETFLK,
或者其不包含下述序列所示的氨基酸序列:
LAYWFMDDGGK,KLPNTISSETFLK或TISSETFLK,
或者其不包含下述序列所示的氨基酸序列:KLPNTISSETFLK或TISSETFLK。
在一种实施方式中,经优化的核酸酶是I-SceI或其在氨基酸水平上具有至少55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的同源物,其中,位于野生型I-SceI或其下述同源物的C-端的氨基酸序列TISSETFLK被缺失或突变,所述同源物在氨基酸水平上具有至少55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性且在C-端具有氨基酸序列TISSETFLK。
可通过缺失或突变野生型I-SceI或下述其同源物的C-端的至少1、2、3、4、5、6、7、8或9个氨基酸,来缺失或突变氨基酸序列TISSETFLK,所述其同源物在氨基酸水平上具有至少55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性且在C-端具有氨基酸序列TISSETFLK。
表2:针对野生型I-SceI中TISSETFLK氨基酸序列的缺失的不同例子
野生型和经优化的I-SceI C-端的氨基酸序列
I-SceI野生型 TISSETFLK
I-SceI-1 TISSETFL
I-SceI-2 TISSETF
I-SceI-3 TISSET
I-SceI-4 TISSE
I-SceI-5 TISS
I-SceI-6 TIS
I-SceI-7 TI
I-SceI-8 T
I-SceI-9 完全缺失
在本发明的一个实施方案中,优化的核酸酶或优化版本的I-SceI或其在氨基酸水平上具有至少55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的同源物包括至少一个下列突变:L74K、Y75H、Q77K、E130K、T134H、Y199H、M203K、Y205H。
同等优选的是将SEQ ID NO:1中公开的野生型I-SceI的氨基酸序列第229位的丝氨酸突变为Lys、Ala、Pro、Gly、Glu、Gln、Asp、Asn、Cys、Tyr或Thr。由此制造I-SceI突变体S229K、S229A、S229P、S229G、S229E、S229Q、S229D、S229N、S229C、S229Y或S229T。野生型I-SceI的第229位氨基酸是SEQ ID No.2中的第230位氨基酸。
在本发明的另一实施方式中,SEQ ID No.1中公开的野生型I-SceI的氨基酸序列第202位的氨基酸甲硫氨酸(如果参照SEQ ID No.2的话是第203位氨基酸)被突变为Lys、His或Arg。由此制造I-SceI突变体M202K、M202H和M202R。
备选地,氨基酸序列TISSETFLK可被突变,例如,突变为氨基酸序列:TIKSETFLK或AIANQAFLK。
I-SceI的优选经优化版本是缺失I-SceI-1、I-SceI-2、I-SceI-3、I-SceI-4、I-SceI-5、I-SceI-6、I-SceI-7、I-SceI-8、I-SceI-9和突变体S229K和S229A,进一步更优选的是缺失I-SceI-1、I-SceI-2、I-SceI-3、I-SceI-4、I-SceI-5、I-SceI-6和突变体S229K。最优选的是缺失I-SceI-5(SEQ ID NO 30)和突变体S229K。
还可组合上述缺失和突变,例如通过将缺失I-SceI-1与突变体S229A组合,由此制造C-端的氨基酸序列TIASETFL。
另一些优选的I-SceI的经优化版本是与突变M202K组合的缺失I-SceI-1、I-SceI-2、I-SceI-3、I-SceI-4、I-SceI-5、I-SceI-6、I-SceI-7、I-SceI-8、I-SceI-9或突变体S229K和S229A。
进一步更优选的是与突变M202K组合的缺失SceI-1、I-SceI-2、I-SceI-3、I-SceI-4、I-SceI-5、I-SceI-6或突变体S229K。
在本发明的另一实施方案中,SEQ ID No.1中公开的野生型I-SceI的氨基酸序列第76位的氨基酸谷氨酰胺、第129位的谷氨酸或第198位的酪氨酸(如果参照SEQ ID No.2的话是第77、130和199位氨基酸)被突变为Lys、His或Arg。由此制造I-SceI突变体Q76K、Q76H、Q76R、E129K、E129H、E129R、Y198K、Y198H和Y198R。
上文所述的缺失和突变还将可应用于I-SceI的在氨基酸水平上具有至少55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性且在C-端具有氨基酸序列TISSETFLK的同源物。
因此,在本发明的一种实施方案中,经优化的内切核酸酶是I-SceI或下述其同源物之一的经优化版本,所述其同源物在氨基酸水平上具有至少55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且具有选自I-SceI-1、I-SceI-2、I-SceI-3、I-SceI-4、I-SceI-5、I-SceI-6、I-SceI-7、I-SceI-8、I-SceI-9、S229K、S229A、S229P、S229G、S229E、S229Q、S229D、S229N、S229C、S229Y、S229T、M202K、M202H、M202R、Q76K、Q76H、Q76R、E129K、E129H、E129R、Y198K、Y198H和Y198R的组的一种或多种突变或缺失,其中氨基酸编号参照SEQ ID NO:1所描述的氨基酸序列。
在本发明的另一实施方案中,经优化的内切核酸酶是I-SceI或下述其同源物之一的经优化版本,所述其同源物在氨基酸水平上具有至少55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且具有选自I-SceI-1、I-SceI-2、I-SceI-3、I-SceI-4、I-SceI-5、I-SceI-6、S229K和M202K的组的一种或多种突变或缺失,其中氨基酸编号参照SEQ ID NO:1所描述的氨基酸序列。
一种特别优选的经优化的内切核酸酶是如SEQ ID NO:1所述I-SceI或下述其同源物之一的野生型或经改造版本,所述其同源物在氨基酸水平上具有至少55%、58%、60%、70%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,并且具有选自下述组的一种或多种突变:
a)I-SceI-1、I-SceI-2、I-SceI-3、I-SceI-4、I-SceI-5、I-SceI-6、I-SceI-7、I-SceI-8和I-SceI-9;
b)S229K、S229A、S229P、S229G、S229E、S229Q、S229D、S229N、S229C、S229Y、S229T、M203K、M203H、M203R、Q77K、Q77H、Q77R、E130K、E130H、E130R、Y199K、Y199H和Y199R;
c)它们的氨基酸序列的起始甲硫氨酸之后,甲硫氨酸、缬氨酸、甘氨酸、苏氨酸、丝氨酸、丙氨酸、半胱氨酸、谷氨酸、谷氨酰胺、天冬氨酸、天冬酰胺、异亮氨酸或组氨酸;或
d)选自上述a)和b)、a)和c)、b)和c)或a)、b)和c)的一种或多种突变的组合。
优化的内切核酸酶优选作为与核定位序列(NLS)的融合蛋白表达。该NLS序列能实现进入核中的协助运送并且增加重组系统的效力。本领域技术人员已知有多种NLS序列,它们被Jicks GR和Raikhel NV(1995)Annu.Rev.Cell Biol.11:155-188等等所描述。对于植物生物来说优选的是,例如,SV40大抗原的NLS序列。例子提供于WO 03/060133中。NLS可以是对内切核酸酶和/或DNA结合结构域来说异源的,或者可以是天然包含在内切核酸酶和/或DNA结合结构域内的。
本发明的另一个实施方案是包含优化的内切核酸酶和异源性DNA结合结构域的翻译融合体。优化的内切核酸酶包括如上所述的突变,并且可以包括或不包括如上所述的其他突变,例如用于制造经改造的内切核酸酶的突变。
优选的异源性DNA结合结构域是锌指或源自转录激活物-样(TAL)效应子的重复单元(也称为TAL重复)。
因此,在本发明的一个实施方案中,优化的内切核酸酶,与至少一个锌指结构域,或与至少一个源自转录激活物-样(TAL)效应子的重复单元,或与至少一个锌指结构域和至少一个源自转录激活物-样(TAL)效应子的重复单元融合。
这些融合体可以是与优化的内切核酸酶的N末端或C末端或者N-和C-末端。
例如,可以在优化的内切核酸酶的N末端融合至少一个锌指结构域和在C末端融合至少一个锌指结构域,或者在优化的内切核酸酶的N末端融合至少一个锌指结构域和在C末端融合至少一个源自转录激活物-样(TAL)效应子的重复单元。可选的,还可以是在优化的内切核酸酶的N末端或C末端或者N-和C-末端融合至少一个锌指结构域和至少一个源自转录激活物-样(TAL)效应子的重复单元的组合。基本上这些元件的各种排列是可能的。
锌指结构域具有保守的半胱氨酸和组氨酸残基,在每个锌指结构域中四面配位(tetrahedycally-coordinate)单个锌原子。特别的是,大部分ZFP的特征是一般性序列的指状组分:
-Cys-(X)2-4-Cys-(X)12-His-(X)3-5-His-,
其中X代表任何氨基酸(C2H2ZFP)。这一最普遍代表性的类型的锌指结构域含有具特殊空间位置关系的2个半胱氨酸和2个组氨酸。每个锌指结构域的折叠结构含有反平行的β转角、指尖区(finger tip region)和短的两亲性α-10螺旋。金属配位配体结合锌离子,在zif268型锌指的情况下,短的两亲性α螺旋结合在DNA的大沟中。此外,某些保守的疏水性氨基酸残基(例如,刚好在第一个保守性Cys前的残基和在锌指的螺旋片段+4位的残基)和锌配位15至保守性半胱氨酸和组氨酸残基稳定了锌指的结构。已经描述了在直接接触碱基的位置上具有改变的规范C2H2ZFP,与碱基接触位置紧邻的“支持”或“支撑(buttressing)”残基,和能够接触DNA的磷酸骨架的位置。参见例如美国专利号6,007,988;6,013,453;6,140,081;6,866,997;6,746,838;6,140,081;6,610,512;7,101,972;6,453,242;6,785,613;7,013,219;PCT WO 98/53059;Choo等人,(2000)Curro Opin.Struct.BioI.10:411-416;Segal等人,(2000)Curro Opin.Chern.BioI.4:34-39。
此外,还已描述了含有具修饰的锌配位残基的锌指的锌指蛋白(参见例如,美国专利申请号2520030108880、20060246567和20060246588;其公开内容通过引用而整合)。
术语“源自转录激活物-样(TAL)效应子的重复单元”、“重复单元”和“TAL重复”可互换的使用,用于描述TAL效应子的重复结构域的模块化部分,或其人为的版本,所述部分含有重复单元的氨基酸序列的第12和13位的两个氨基酸,这两个氨基酸决定对靶向的DNA序列中的碱基对的识别,此氨基酸产生的识别如下:HD用于识别C/G;NI用于识别A/T;NG用于识别T/A;NS用于识别C/G或A/T或T/A或G/C;NN用于识别G/C或A/T;IG用于识别T/A;N用于识别C/G;HG用于识别C/G或T/A;H用于识别T/A;以及NK用于识别G/C。
(氨基酸H、D、I、G、S、K是按一字母代码描述的,而A、T、C、G指被氨基酸识别的DNA碱基对)。
本领域技术人员可以通过常规实验验证重复结构域中使用的重复单元数。一般而言,至少1.5个重复单元被认为是最低值,但通常使用至少约8个重复单元。重复单元不必是完整的重复单元,可以使用一半大小的重复单元。本发明的异源DNA结合结构域可以包括例如1.5、2、2.5、3、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、9.5、10、10.5、11、11.5、12、12.5、13、13.5、14、14.5、15、15.5、16、16.5、17、17.5、18、18.5、19、19.5、20、20.5、21、21.5、22、22.5、23、23.5、24、24.5、25、25.5、26、26.5、27、27.5、28、28.5、29、29.5、30、30.5、31、31.5、32、32.5、33、33.5、34、34.5、35、35.5、36、36.5、37、37.5、38、38.5、39、39.5、40、40.5、41、41.5、42、42.5、43、43.5、44、44.5、46、46.5、47、47.5、48、48.5、49、49.5、50、50.5或更多个重复单元。
具有34个氨基酸(按一字母代码)的重复的典型共有序列显示如下:
LTPEQVVAIASNGGGKQALETVQRLLPVLCQAHG(SEQ ID NO:19)
具有35个氨基酸(按一字母代码)的重复的另一个共有序列显示如下:
LTPEQVVAIASNGGGKQALETVQRLLPVLCQAPHD(SEQ ID NO:20)
可用于本发明的一个实施方案中的重复单元与上述共有序列具有至少35%、40%、50%、60%、70%、75%、80%、85%、90%或95%的同一性。
可以突变锌指结构域以及TAL重复,使其结合任何给定的多核苷酸序列。如何选择恰当的突变的方法公开在WO0027878、WO03062455、WO08076290、WO08076290、WO9945132和WO2010/079430中,其通过引用整合到本文中。
因此,可以选择与优化的内切核酸酶的DNA识别序列接近的多核苷酸序列,突变锌指结构域或TAL重复使其结合那些邻近的多核苷酸序列。然后,那些锌指结构域或TAL重复可用于与各个的优化的内切核酸酶翻译融合,其中所述内切核酸酶具有邻近的DNA识别序列。
还可以选择这样的多核苷酸序列,所述多核苷酸序列与优化的内切核酸酶的DNA识别序列相似,但被优化的内切核酸酶无效识别和/或无效切割。可以制造优化的内切核酸酶与至少一个结合靠近该非最优的DNA识别位点的多核苷酸序列的锌指或TAL重复的翻译融合体,所述翻译翻译融合体将更有效的识别和切割所述非最优的DNA识别位点。
可以产生优化的LAGLIDADG核酸酶与TAL重复和锌指结构域的组合的融合体。由于TAL效应子能够识别富含AT的区域,因而可以补偿优先结合GC丰富区域的锌指结构域的局限性。
可以使用TAL重复和锌指结构域制造与优化的LAGLIDADG核酸酶的N-末端、或C-末端、或N-末端和C-末端的融合体,其中若干TAL重复和/或锌指结构域及其组合可以融合在优化的LAGLIDADG核酸酶的N-末端或C-末端。
此类融合体的示例性结构是:
N-端-I-SceI-TAL重复(x)-C-端
N-端-TAL重复(x)-I-SceI--C-端
N-端-TAL重复(x)-I-SceI-TAL重复-C-端
N-端-I-SceI-锌指结构域(x)-C-端
N-端-锌指结构域(x)-I-SceI--C-端
N-端-锌指结构域(x)-I-SceI-锌指结构域(x)-C-端
N-端-TAL重复(x)-I-SceI-锌指结构域(x)-C-端
N-端-锌指结构域(x)-I-SceI-TAL重复-C-端
N-端-TAL重复(x)-I-SceI-锌指结构域(x)-C-端
N-端-锌指结构域(x)-I-SceI-TAL重复-C-端
N-端-锌指结构域(x)-TAL重复(x)-I-SceI-锌指结构域(x)-C-端
N-端-锌指结构域(x)I-SceI-TAL重复(x)-锌指结构域(x)-C-端,
其中(x)意指一个或若干个TAL重复或锌指结构域。
在优选的实施方案中,通过插入内含子序列修饰编码优化的内切核酸酶的序列。这防止了功能性酶在原核宿主生物中的表达,并且由此协助了克隆和转化程序(例如基于大肠杆菌或农杆菌)。在真核生物中,例如在植物生物中,功能性酶的表达得以实现,因为植物能识别和“剪接”出内含子。优选地,内含子被插入进前文作为优选提到的优化的内切核酸酶。
在另一优选的实施方式中,可通过向优化的内切核酸酶的N-端或C-端添加Sec IV分泌信号,来修饰优化的内切核酸酶的氨基酸序列。
在优选的实施方式中,SecIV分泌信号是农杆菌Vir蛋白中包含的SecIV分泌信号。此类SecIV分泌信号的例子以及如何应用它们的方法被公开于WO 01/89283、Vergunst等人,Positive charge is an important feature of the C-terminal transport signalof the VirB/D4-translocated proteins of Agrobacterium,PNAS 2005,102,03,832至837页中。
还可通过以与WO01/38504(其描述了RecA/VirE2融合蛋白)说明书所述相似的方式将Vir蛋白的片段或者甚至完全的Vir蛋白(例如完全的VirE2蛋白)添加至优化的内切核酸酶,来添加Sec IV分泌信号。
在另一优选的实施方式中,可通过向优化的内切核酸酶的N-端或C-端添加SecIII分泌信号,来修饰优化的内切核酸酶的氨基酸序列。合适的SecIII分泌信号例如公开于WO 00/02996中。
在添加SecIII分泌信号的情况下,将该优化的内切核酸酶表达于下述细胞中可以是有利的,所述细胞还包含编码完全的功能性III型分泌系统或其部分的重组构建体,以在此类细胞中过表达或补足完全的功能性III型分泌系统或其部分。
编码完全的功能性III型分泌系统或其部分的重组构建体例如公开于WO 00/02996中。
如果将SecIV分泌信号添加至优化的内切核酸酶并且意图将优化的内切核酸酶表达于例如发根土壤杆菌(Agrobacterium rhizogenes)或根癌农杆菌(Agrobacteriumtumefaciens)中,那么改造编码优化的内切核酸酶的DNA序列以适应表达生物的密码子使用是有利的。优选地,优化的内切核酸酶不具有或者仅具有很少的表达生物基因组中的DNA识别序列。如果优化的内切核酸酶不具有农杆菌基因组中的DNA识别序列或具有较不优选的DNA识别序列,则是进一步更有利的。当意图将优化的内切核酸酶表达于原核生物中时,优化的核酸酶的编码序列应当没有内含子。
多核苷酸:
本发明还包含编码上文所述的优化的内切核酸酶的经分离的多核苷酸。
此类经分离的多核苷酸的例子是下述经分离的多核苷酸,其编码SEQID NO:3、5所描述的氨基酸序列,或与SEQ ID NO:2、3、5所描述的任一氨基酸序列具有至少70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸序列相似性(优选地,具有至少70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的氨基酸序列同一性)的氨基酸序列。
优选地,经分离的多核苷酸具有针对特定宿主生物中的表达经优化的密码子使用,或具有低含量的RNA不稳定性基序,或具有低含量的密码子重复,或具有低含量的隐蔽剪接位点,或具有低含量的备选起始密码子,或具有低含量的限制性位点,或具有低含量的RNA二级结构,或具有上述特征的任何组合。
经分离的多肽的密码子使用可被优化,例如,针对在植物(优选地,选自包含稻、玉米、小麦、油菜、甘蔗、向日葵、甜菜、马铃薯或烟草的组的植物)中的表达来进行。
优选地,经分离的多核苷酸与适于形成下述功能性表达盒的启动子序列和终止子序列组合,所述功能性表达盒用于优化的内切核酸酶在特定宿主生物中的表达。
合适的启动子例如是组成型启动子、热或病原体诱导型启动子或种子、花粉、花或果特异性启动子。
本领域技术人员知道大量具有这些特征的启动子。
例如,植物中组成型启动子有若干是已知的。它们大多来源于病毒或细菌来源,例如胭脂氨酸合酶(nos)启动子(Shaw等人(1984)Nucleic Acids Res.12(20):7831-7846)、甘露碱合酶(mas)启动子(Co-mai等人(1990)Plant Mol Biol 15(3):373-381)或章鱼碱合酶(ocs)启动子(Leisner和Gelvin(1988)Proc Natl Acad Sci USA 85(5):2553-2557)(来自根癌农杆菌)或来自烟草花叶病毒的CaMV35S启动子(US 5,352,605)。后者最经常用于转基因在植物中的组成型表达(Odell等人(1985)Nature313:810-812;Battraw和Hall(1990)Plant Mol Biol 15:527-538;Benfey等人(1990)EMBO J 9(69):1677-1684;US 5,612,472)。但是,CaMV 35S启动子不仅在不同的植物物种中展示出可变性,其还在不同的植物组织中展示出可变性(Atanassova等人(1998)Plant Mol Biol 37:275-85;Battraw和Hall(1990)Plant Mol Biol 15:527-538;Holtorf等人(1995)Plant Mol Biol 29:637-646;Jefferson等人(1987)EMBO J 6:3901-3907)。另外的缺点是野生型CaMV病毒对35S启动子的转录调控活性的干扰(Al-Kaff等人(2000)Nature Biotechnology 18:995-99)。用于组成型表达的另一病毒启动子是甘蔗杆状病毒(ScBV)启动子(Schenk等人(1999)Plant MolBiol39(6):1221-1230)。
若干植物组成型启动子被描述过,例如,来自拟南芥的泛素启动子(Callis等人(1990)J Biol Chem 265:12486-12493;Holtorf S等人(1995)Plant Mol Biol 29:637-747),但其被报道为不能调控选择标记的表达(WO03102198),或两种玉米泛素启动子(Ubi-1和Ubi-2;US 5,510,474;US 6,020,190;US 6,054574),其除了组成型表达情况之外还展示出热激诱导(Christensen等人(1992)Plant.Mol.Biol.18(4):675-689)。基于经稳定转化的拟南芥属植物,对CaMV35S、大麦硫堇启动子和拟南芥属泛素启动子的特异性和表达水平的比较展示出CaMV 35S启动子的高表达速率,而硫堇启动子在大多数株系中无活性,并且来自拟南芥属的ubi1启动子仅导致中等表达活性(Holtorf等人(1995)Plant Mol Biol29(4):637-6469)。
载体:
上文所述的多核苷酸可被包含进适于转化、转染、克隆或过表达的DNA载体。
在一个实例中,上文所述的多核苷酸包含于用于转化非人生物或细胞的载体中,优选地,非人生物是植物或植物细胞。
本发明的载体通常包含另外的功能元件,这可包括但不限于:
i)复制起点,其确保根据本发明的表达盒或载体在例如大肠杆菌中的复制。可被提到的例子是ORI(DNA复制起点)、pBR322ori或P15A ori(Sam-brook等人:MolecularCloning.A Laboratory Manual,第2版,Cold Spring Harbor Laboratory Press,ColdSpring Harbor,NY,1989)。
ii)多克隆位点(MCS),用于实现和协助一条或多条核酸序列的插入。
iii)使得能同源重组或插入进宿主生物基因组中的序列。
iv)元件,例如边界序列,其使得能在植物细胞中进行农杆菌介导的转移,用于转移和整合进植物基因组,例如,T-DNA的右边界或左边界或vir区域。
标记序列
术语“标记序列”应当以广义被理解为包括能协助缺失、鉴定或选择经转化的细胞、组织或生物(例如植物)的所有核苷酸序列(和/或由其翻译的多肽序列)。术语“允许对经转化的植物材料加以选择的序列”、“选择标记”或“选择标记基因”或“选择标记蛋白”或“标记”具有基本上相同的含义。
标记可包括(但不限于)可选择标记和可筛选标记。可选择标记向细胞或生物赋予导致生长或存活差异的表型。可选择标记可与选择试剂(例如除草剂或抗生素或前药)相互作用,以带来该表型。可筛选标记向细胞或生物赋予易于检测到的表型,优选地,视觉可检测的表型,例如颜色或染色。可筛选标记可与筛选试剂(例如染料)相互作用以带来该表型。
可选择标记(或可选择标记序列)包括但不限于:
a)阴性选择标记,其赋予针对一种或多种毒性(植物的情况下,植物毒性)试剂(例如抗生素、除草剂或其它生物杀灭剂)的抗性,
b)反向选择标记,其赋予针对某些化学化合物(例如,通过将非毒性化合物转化成毒性化合物)的敏感性,以及
c)阳性选择标记,其赋予生长优势(例如通过表达细胞分裂素或激素生物合成的关键元素,导致植物激素(例如生长素、赤霉素、细胞分裂素、脱落酸和乙烯)的产生来实现;Ebi-numa H等人(2000)Proc Natl Acad SciUSA 94:2117-2121)。
当使用阴性选择标记时,仅包含所述阴性选择标记的细胞或植物被选择。当使用反向选择标记时,仅缺乏所述反向选择标记的细胞或植物被选择。反向选择标记可用于验证序列(包含所述反向选择标记)从基因组的成功切除。可筛选标记包括但不限于报道基因(例如,荧光素酶、葡糖醛酸糖苷酶、氯霉素乙酰转移酶(CAT等等)。优选地标记序列包括但不限于:
i)阴性选择标记
一般来说,阴性选择标记可用于选择成功经历了转化的细胞。已引入本发明的DNA构建体的阴性选择标记可向成功经历转化的细胞赋予对下述物质的抗性:生物杀灭剂或植物毒性试剂(例如,除草剂,例如膦丝菌素、草甘膦或溴苯腈),代谢抑制剂(例如2-脱氧葡糖-6-磷酸)(WO98/45456)或抗生素(例如,四环素、氨苄青霉素、卡那霉素、G418、新霉素、博来霉素或潮霉素)。阴性选择标记允许选出经转化的细胞,将其与未经转化的细胞分开(McCormick等人(1986)Plant Cell Reports5:81-84)。本发明载体中的阴性选择标记可用于在超过一种生物中赋予抗性。例如,本发明的载体可包含用于在细菌(例如大肠杆菌或农杆菌)和植物中扩增的选择标记。用于大肠杆菌的可选择标记的例子包括:指定对抗生素(即氨苄青霉素、四环素、卡那霉素、红霉素)的抗性的基因,或赋予其它类型的可选择酶活性(例如半乳糖苷酶)的基因,或乳糖操纵子。用于哺乳动物细胞中的合适的可选择标记包括,例如,二氢叶酸还原酶基因(DHFR)、胸苷激酶基因(TK),或赋予药物抗性的原核基因,gpt(黄嘌呤-鸟嘌呤磷酸核糖转移酶基因,其可用霉酚酸来选择);neo(新霉素磷酸转移酶),其可用G418、潮霉素或嘌呤霉素来选择;和DHFR(二氢叶酸还原酶),其可用甲氨蝶呤来选择(Mulligan & Berg(1981)ProcNatl Acad Sci USA 78:2072;Southern & Berg(1982)J Mol Appl Genet 1:327)。用于植物细胞的选择标记通常赋予对生物杀灭剂或抗生素(例如卡那霉素、G418、博来霉素、潮霉素或氯霉素)的抗性,或除草剂抗性,例如对氯磺隆(chlorsulfuron)或Basta的抗性。
尤其优选的阴性选择标记是赋予对除草剂抗性的那些。阴性选择标记的例子是:
-编码膦丝菌素乙酰转移酶(PAT)的DNA序列,其将谷氨酰胺合酶抑制剂膦丝菌素(PPT)的游离氨基基团乙酰化,并由此导致PPT去毒(deBlock等人(1987)EMBO J 6:2513-2518)(也被称为双丙氨磷抗性基因bar;EP242236),
-5-烯醇丙酮莽草酸-3-磷酸合酶基因(EPSP合酶基因),其赋予对草甘膦(N-(膦酰甲基)甘氨酸)的抗性,
-gox基因,其编码降解草甘膦的酶,草甘膦氧化还原酶(Glyphosateoxidoreductase),
-deh基因(编码使得茅草枯失活的脱卤素酶),
-乙酰乳酸合酶,其赋予对磺脲和咪唑啉酮的抗性,
-bxn基因,其编码降解溴苯腈的腈水解酶,
-卡那霉素或G418抗性基因(NPTII)。NPTII基因编码新霉素磷酸转移酶,其因为磷酸化反应而降低卡那霉素、新霉素、G418和巴龙霉素的抑制作用(Beck等人(1982)Gene 19:327),
-DOGR1基因。DOGR1基因已从酿酒酵母中分离(EP 0 807 836)。其编码2-脱氧葡糖-6-磷酸磷酸酶,这赋予对2-DOG的抗性(Randez-Gil等人(1995)Yeast 11:1233-1240)。
-hyg基因,其编码潮霉素磷酸转移酶,并且赋予对抗生素潮霉素的抗性(Gritz和Davies(1983)Gene 25:179);
-尤其优选的是赋予针对D-氨基酸(例如D-丙氨酸和D-丝氨酸)施加的毒性作用的抗性的阴性选择标记(WO 03/060133;Erikson 2004)。本发明范畴内作为阴性选择标记尤其优选的是来自瘦弱红酵母(Rhodotorula gracilis)(圆红冬孢酵母菌(Rhodosporidiumtoruloides))的daol基因(EC:1.4.3.3:GenBank Acc.-No.:U60066)和大肠杆菌基因dsdA(D-丝氨酸脱水酶(D-丝氨酸脱氨酶))(EC:4.3.1.18;GenBank Acc.-No.:J01603)。
ii)阳性选择标记
阳性选择标记包含但不限于生长刺激性选择标记基因,例如来自根癌农杆菌的异戊烯基转移酶(菌株:PO22:Genbank Acc.-No.:AB025109)可——作为细胞分裂素生物合成的关键酶——协助经转化植物的再生(例如通过在不含细胞分裂素的培养基上的选择)。相应的选择方法描述在Ebinuma H等人(2000)Proc Natl Acad Sci USA 94:2117-2121;Ebinuma H等人(2000)Selection of Marker-free transgenic plants using theoncogenes(ipt,rol A,B,C)of Agrobacterium as selectable markers,In MolecularBiology of Woody Plants.Kluwer Academic Publishers。向经转化的植物赋予较之未经转化的植物而言的生长优势的另外的阳性选择标记被描述于例如EP-A 0 601 092中。生长刺激选择标记可包括(但不限于)β-葡糖醛酸糖苷酶(与例如细胞分裂素葡糖醛酸苷组合)、甘露糖-6-磷酸异构酶(与甘露糖组合)、UDP-半乳糖-4-差向异构酶(与例如半乳糖组合),其中与甘露糖组合的甘露糖-6-磷酸异构酶是尤其优选的。
iii)反向选择标记
反向选择标记使得能选择具有成功缺失了序列的生物(Koprek T等人(1999)Plant J 19(6):719-726)。TK胸苷激酶(TK)和白喉毒素A片段(DT-A),编码胞嘧啶脱氨酶的codA基因(Gleve AP等人(1999)Plant Mol Biol 40(2):223-35;Pereat RI等人(1993)Plant Mol Biol 23(4):793-799;Stougaard J(1993)Plant J 3:755-761),细胞色素P450基因(Koprek等人(1999)Plant J 16:719-726),编码卤代烷脱卤素酶的基因(Naested H(1999)Plant J 18:571-576),iaaH基因(Sundaresan V等人(1995)Genes& Development9:1797-1810),tms2基因(Fedoroff NV & Smith DL(1993)Plant J 3:273-289)和通过转化D-氨基酸导致毒性作用的D-氨基酸氧化酶(WO 03/060133)。
在一种优选的实施方式中,切除盒包括至少一个所述反向选择标记,以将已成功切除了序列的植物细胞或植物与仍含有所述序列的植物区分开。在一种更优选的实施方式中,本发明的切除盒包含双功能标记,即,可用作为阴性选择标记和反向选择标记二者的标记,这取决于选择流程中所使用的底物。双功能标记的一个例子是来自瘦弱红酵母的daol基因(EC:1.4.3.3:GenBank Acc.-No.:U60066),采用如D-丙氨酸和D-丝氨酸等D-氨基酸时,其可用作为阴性选择标记,采用D-异亮氨酸和D-缬氨酸等D-氨基酸是,其可用作为反向选择标记(见欧洲专利申请No.:04006358.8)。
iv)可筛选标记(报道基因)
可筛选标记(例如报道基因)编码可易于定量或检测的蛋白,并且其通过内在颜色或酶活性确保对转化效力或表达的位置或时机的评估。尤其优选的是编码报道蛋白的基因(还见Schenborn E,Groskreutz D.(1999)Mol Biotechnol 13(1):29-44),例如
-“绿色荧光蛋白”(GFP)(Chui WL等人(1996)Curr Biol 6:325-330;Lef-fel SM等人(1997)Biotechniques 23(5):912-8;Sheen等人(1995)Plant J 8(5):777-784;Haseloff等人(1997)Proc Natl Acad Sci USA94(6):2122-2127;Reichel等人(1996)ProcNatl Acad Sci USA93(12):5888-5893;Tian等人(1997)Plant Cell Rep 16:267-271;WO97/41228)。
-氯霉素转移酶,
-荧光素酶(Millar等人(1992)Plant Mol Biol Rep 10:324-414;Ow等人(1986)Science 234:856-859)允许通过对生物发光的检测进行选择,
-β-半乳糖苷酶,编码可获得多种生色底物的酶,
-β-葡糖醛酸糖苷酶(GUS)(Jefferson等人(1987)EMBO J6:3901-3907)或uidA基因,其编码针对多种生色底物的酶,
-R基因座基因产物:调控花青素色素(红色)在植物组织中的产生的蛋白质,其由此使得能在不添加额外的佐剂或生色底物的情况下对启动子活性进行直接分析(Dellaporta等人(1988)In:Chromosome Structure and Function:Impact of NewConcepts,18th Stadler Genetics Symposium,11:263-282),
-β-内酰胺酶(Sutcliffe(1978)Proc Natl Acad Sci USA 75:3737-3741),针对多种生色底物的酶(例如,PADAC,生色的头孢菌素),
-xylE基因产物(Zukowsky等人(1983)Proc Natl Acad Sci USA80:1101-1105),能转化生色儿茶酚的儿茶酚双加氧酶,
-α-淀粉酶(Ikuta等人(1990)Bio/technol.8:241-242),
-酪氨酸酶(Katz等人(1983)J Gene Microbiol 129:2703-2714),氧化酪氨酸产生DOPA和多巴醌的酶,多巴醌随后形成易于被检测的黑素,
-水母发光蛋白(Prasher等人(1985)Biochem Biophys Res Commun126(3):1259-1268),可用于钙敏感性的生物发光检测。
靶生物
适于转化或递送优化的内切核酸酶的任何生物可用作为靶生物。这包括原核生物、真核生物和古细菌,特别是人或动物细胞、动物、植物、真菌或酵母,优选地植物、真菌或酵母。
在一种实施方式中,靶生物是植物。
术语“植物”包括整株植物,苗营养器官/结构(例如叶、茎和块茎)、根、花和花器官/结构(例如苞叶、萼片、花瓣、雄蕊、心皮、花药和胚珠),种子(包括胚、胚乳和种皮)和果实(成熟的子房),植物组织(例如维管组织,基本组织等等)和细胞(例如保卫细胞、卵细胞、毛状体等等)及它们的后代。可用于本发明的植物的纲通常广至可接受转化技术的高等植物和低等植物的纲,包括被子植物(单子叶植物和双子叶植物)、裸子植物、蕨类植物和多细胞藻类。其包括多种倍体水平的植物,包括非整倍体、多倍体、二倍体、单倍体和半合子的植物。
本发明的范围内包括植物界高等植物和低等植物的所有属和种。还包括成熟的植物、种子、苗和幼苗,以及源于其的部分、繁殖材料(例如种子和果实)和培养物,例如细胞培养物。
优选的是下述植物科的植物和植物材料:苋科、十字花科、石竹科、藜科、菊科、葫芦科、唇形科、豆科、蝶形花亚科、百合科、亚麻科、锦葵科、蔷薇科、虎耳草科、玄参科、茄科、番杏科(Tetragoniaceae)。
一年生、多年生、单子叶植物和双子叶植物是用于产生转基因植物的优选宿主生物。此外,根据本发明的重组系统的用途或方法在所有观赏植物,有价值或观赏树、花、切花、灌木或草皮中是有利的。所述植物可包括但不限于:苔藓类(bryophytes),例如苔纲(Hepaticae)(地钱属(hepatica))和藓纲(Musci)(苔藓(mosse));蕨类植物(pteridophyte),例如羊齿类(fern)、马尾(horsetail)和石松(club-mosses);裸子植物,例如松柏科植物(conifer)、苏铁科植物(cycad)、银杏(ginkgo)和买麻藤科(Gnetaeae);藻类,例如绿藻纲(Chlorophyceae)、褐藻纲(Phaeophpyceae)、红藻纲(Rhodophyceae)、Myxophyceae、黄藻纲(Xanthophyceae)、硅藻纲(Bacillariophyceae)(硅藻(diatoms))和裸藻纲(Euglenophyceae)。
用于本发明目的的植物可包含:蔷薇科,例如玫瑰,杜鹃花科,例如杜鹃花属植物(rhododendrons)和杜鹃(azaleas),大戟科,例如一品红(poinsettias)和巴豆(croton),石竹科,例如香石竹(pinks),茄科,例如碧冬茄属(petunias),苦苣苔科,例如非洲紫罗兰(African violet),凤仙花科,例如凤仙花(touchmenot),兰科,例如兰花(orchid),鸢尾科,例如唐菖蒲(gladioli)、鸢尾(iris)、小苍兰(freesia)和番红花属植物(crocus),菊科,例如金盏花(marigold),牻牛儿苗科,例如老鹳草属植物(geraniums),百合科,例如龙血树属植物(drachaena),桑科,例如榕属植物(ficus),天南星科,例如蔓绿绒(philodendron)等等。
根据本发明的转基因植物还特别选自双子叶作物植物,例如,来自下述科的植物:豆科,例如豌豆、苜蓿和大豆;茄科,例如烟草等等;伞形科,特别是胡萝卜属(非常特别是胡萝卜种(胡萝卜))和芹属(非常特别是旱芹种(graveolens dulce)(芹菜))等等;茄科,特别是番茄属,非常特别是普通栽培种番茄种(esculentum)(西红柿),和茄属,非常特别是马铃薯种(tuberosum)(马铃薯)和茄子种(melongena)(茄子(au-bergine))等等;和辣椒属,非常特别是甜椒种(annum)(胡椒(pepper))等等;豆科,特别是大豆属,非常特别是大豆种(大豆)等等;和十字花科,特别是芸苔属,非常特别是欧洲油菜种(napus)(油菜)、芸苔油菜种(campestris)(甜菜)、oleracea cv Tastie种(卷心菜)、球叶甘蓝种(oleracea cvSnowball Y)(花椰菜)和oleracea cv Emperor种(西兰花(broccoli));和拟南芥属,非常特别是拟南芥种等等;菊科,特别是莴苣属,非常特别是sativa(莴苣(lettuce))等等。
根据本发明的转基因植物特别选自单子叶作物植物,例如,谷物,例如小麦、大麦、高粱和黍、黑麦、黑小麦、玉米、稻或燕麦以及甘蔗。尤其优选的是拟南芥(Arabidopsisthaliana)、烟草(Nicotiana tabacum)、油菜、大豆、玉米(苞谷)、小麦、亚麻籽、马铃薯和万寿菊。
用于本发明目的的植物生物还可以是能光合作用的其它生物,例如,藻类或蓝细菌,以及还有苔藓。优选的藻类是绿藻,例如,红球藻属(Haematococcus)的藻类、三角褐指藻(Phaedactylum tricornatum)、团藻属(Volvox)或杜氏藻属(Dunaliella)。
可被人或动物消耗的根据本发明的经遗传修饰的植物还可用作为植物或饲料,例如直接使用或在本领域已知的加工之后使用。
多核苷酸构建体的构建
典型地,使用转基因表达技术来制备将被引入非人生物或细胞(例如植物或植物细胞)的多核苷酸构建体(例如,用于表达盒)。重组表达技术涉及重组核酸的构建和基因在经转染细胞中的表达。实现这些目标的分子克隆技术是本领域中已知的。适于构建重组核酸的多种克隆和体外扩增方法是本领域技术人员公知的。这些技术和足以指导本领域技术人员通过很多克隆练习的说明的例子见于Berger和Kimmel,Guide to Molecular CloningTechniques,Methods in Enzymology,Vol.152,Academic Press,hic.,San Diego,CA(Berger);Current Protocols in Molecular Biology,F.M.Ausubel等人编著,CurrentProtocols,a j oint venture between Greene Publish-ing Associates,Inc.和JohnWiley & Sons,Inc.,(1998Supplement),T.Maniatis,E.F.Fritsch和J.Sambrook,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Laboratory,ColdSpring Harbor,NY(1989),T.J.Silhavy,M.L.Berman和L.W.Enquist,Experiments withGene Fusions,Cold Spring Harbor Laboratory,Cold Spring Harbor,NY(1984)。优选地,用于本发明的DNA构建体是通过使用技术人员熟悉的重组和克隆技术将DNA构建体的上述必要组件与上述序列连到一起来产生的。
构建多核苷酸构建体通常需要使用能在细菌中复制的载体。可商业获得大量的试剂盒用于从细菌纯化质粒。经分离和纯化的质粒然后被进一步操作,以产生其它质粒,用于转染细胞或整合入根癌农杆菌或发根土壤杆菌中以感染和转化植物。农杆菌是转化手段的情况下,构建穿梭质粒。
将构建体引入靶细胞的方法
可将用于本发明的DNA构建体有利地引入细胞,这使用向其中插入了所述DNA构建体的载体而进行。载体的例子可以是质粒、粘粒、噬菌体、病毒、逆转录病毒或农杆菌。在一种有利的实施方式中,表达盒是通过质粒载体引入的。优选地载体是能将表达盒稳定整合进宿主基因组的那些。
可通过本领域技术人员已知的若干手段中的任何被称为“转化”的程序,来将DNA构建体引入靶植物细胞和/或生物(还见Keown等人(1990)Meth Enzymol 185:527-537)。例如,可通过多种常规技术,将DNA构建体引入或者在培养物中的细胞,或者在植物器官中的细胞。例如,可使用弹击(ballistic)方法,例如DNA颗粒轰击,将DNA构建体直接引入植物细胞,或者可使用诸如对细胞的显微注射和电穿孔等技术来引入DNA构建体。颗粒介导的转化技术(也被称为“生物弹”)被描述于例如Klein等人(1987)Nature 327:70-73;Vasil V等人(1993)BiolTechnol11:1553-1558;和Becker D等人(1994)Plant J 5:299-307中。这些方法涉及用小颗粒穿透细胞,所述颗粒具有位于小珠粒或颗粒基质内或位于表面上的核酸。生物弹PDS-1000基因枪(Biorad,Hercules,加利福尼亚州)使用氦气压来加速包覆有DNA的金或钨微载体冲向靶细胞。该过程可应用于广范围的来自生物(包括植物)的组织和细胞。本领域技术人员还已知其它转化方法。
显微注射技术是本领域已知的,其已被描述于科学和专利文献中。此外,可用化学方式来透过细胞,例如使用聚乙二醇,使得DNA可通过扩散进入细胞。还可使用其它含有DNA的单元,例如,微细胞(minicells)、细胞、溶酶体或脂质体,通过原生质体融合来引入DNA。使用聚乙二醇(PEG)沉淀来引入DNA构建体描述于Paszkowski等人(1984)EMBO J3:2717中。基于脂质体的基因递送例如描述于WO 93/24640;Mannino和Gould-Fogerite(1988)BioTechniques 6(7):682-691;US 5,279,833;WO91/06309和Felgner等人(1987)ProcNatl Acad Sci USA 84:7413-7414)中。
引入DNA的另一合适方法是电穿孔,其中通过电脉冲使得细胞可逆性透过。电穿孔技术描述于Fromm等人(1985)Proc Natl Acad Sci USA82:5824中。PEG介导的转化和对植物原生质体电穿孔也被讨论于LazzeriP(1995)Methods Mol Biol 49:95-106中。可被提到的优选一般方法是磷酸钙介导的转染、DEZE-葡聚糖介导的转染、阳离子脂质介导的转染、电穿孔、转导和感染。此类方法是技术人员已知的,并描述于例如Davis等人,BasicMethods In Molecular Biology(1986)中。关于对植物和细胞培养物的基因转移方法的综述,见Fisk等人(1993)Scientia Horticulturae 55:5-36和Potrykus(1990)CIBA FoundSymp 154:198。
用于在单子叶植物和双子叶植物中引入和表达异源基因的方法是已知的。见例如US 5,633,446,US 5,317,096,US 5,689,052,US 5,159,135和US5,679,558;Weising等人(1988)Ann.Rev.Genet.22:421-477。特别地,对单子叶植物的转化可使用多种技术,包括电穿孔(例如Shimamoto等人(1992)Nature 338:274-276);生物弹(例如EP-A1270,356)和农杆菌(例如Bytebier等人(1987)Proc Natl Acad Sci USA 84:5345-5349)。
在植物中,技术人员熟悉的用于从植物组织或植物细胞转化和再生植物的方法被用于瞬时或稳定转化。合适的方法尤其是通过聚乙二醇诱导的DNA摄入进行的原生质体转化、生物弹方法如基因枪(“颗粒轰击”方法)、电穿孔、在含DNA的溶液中孵育干胚胎、超声波处理和显微注射、以及通过显微注射或宏观注射进组织或胚胎来转化完整细胞或组织、组织电穿孔、或对种子的真空渗入。在将DNA注射或电穿孔进植物细胞的情况下,使用的质粒不需要满足任何特别需求。可以使用简单的质粒,例如pUC系列的那些。如果要从经转化的细胞再生完整的植物,质粒上存在额外的可选择标记基因是有用的。
除了这些“直接”转化技术之外,还可通过经由根癌农杆菌或发根土壤杆菌进行细菌感染来进行转化。这些菌株含有质粒(Ti或Ri质粒)。该质粒被称为T-DNA(转移的DNA)的部分在农杆菌感染之后被转移至植物,并整合进植物细胞的基因组。
为对植物进行农杆菌介导的转化,可将本发明的DNA构建体与合适的T-DNA侧翼区域组合,并将其引入常规的根癌农杆菌宿主载体。当细胞被细菌感染时,根癌农杆菌宿主的毒力功能将引导转基因和邻近的标记基因(如果有的话)插入进植物细胞DNA中。根癌农杆菌介导的转化技术被充分地描述于科学文献中。见例如,Horsch等人(1984)Science233:496-498,Fraley等人(1983)Proc Natl Acad Sci USA 80:4803-4807,Hooykaas(1989)Plant Mol Biol 13:327-336,Horsch RB(1986)Proc Natl Acad Sci USA 83(8):2571-2575),Bevans等人(1983)Nature 304:184-187,Bechtold等人(1993)Comptes Rendus DeL’Academie Des Sciences Serie III-Sciences De La Vie-Life Sciences 316:1194-1199,Valvekens等人(1988)Proc Natl Acad Sci USA 85:5536-5540。
本发明的DNA构建体优选整合进特定质粒载体,或者整合进穿梭载体或者中间载体,或整合进二元载体。如果例如将用Ti或Ri质粒进行转化的话,将Ti或Ri质粒T-DNA的至少右边界(但在大多数情况下是右边界和左边界)作为侧翼区域与待引入表达盒相连。二元载体是优选使用的。二元载体在大肠杆菌和农杆菌二者中均能复制。一般来说,它们含有选择标记基因和接头或多聚接头(侧翼有右或左T-DNA侧翼序列)。它们可直接转化进农杆菌(Holsters等人(1978)Mol Gen Genet163:181-187)。选择标记基因允许选择经转化的农杆菌,其例如是赋予卡那霉素抗性的nptII基因。在该情况下作为宿主生物发挥作用的农杆菌应当已经含有具有vir区域的质粒。后者是将T-DNA转移进植物细胞所需要的。由此转化的农杆菌可用于转化植物细胞。
很多根癌农杆菌菌株能转移遗传材料(例如根据本发明的DNA构建体),例如,菌株HA101(pEHA101)(Hood EE等人(1996)J Bacteriol168(3):1291-1301)、EHA105(pEHA105)(Hood等人1993,Transgenic Research 2,208-218)、LBA4404(pAL4404)(Hoekema等人(1983)Nature303:179-181)、C58C1(pMP90)(Koncz和Schell(1986)Mol Gen Genet204,383-396)和C58C1(pGV2260)(De-blaere等人(1985)Nucl Acids Res.13,4777-4788)。
除了包含其卸甲Ti质粒之外,用于转化的农杆菌菌株还包含具有待转移的T-DNA的二元质粒,其原则上包含用于选择经转化的细胞的基因和待被转移的基因。两个基因都必须装备有转录和翻译起始及终止信号。二元质粒可转移进农杆菌菌株,例如通过电穿孔或其它转化方法来进行(Mozo & Hooykaas(1991)Plant Mol Biol 16:917-918)。对植物外植体与农杆菌菌株的共培养通常进行两至三天。
可使用多种载体。原则上,人们对这些载体进行辨别,哪些能用于农杆菌介导的转化或农杆菌感染,即,哪些在T-DNA内包含本发明的DNA构建体,哪些确实允许T-DNA稳定整合进植物基因组。此外,不含边界序列的载体也可使用,可例如通过颗粒轰击将其转化进植物细胞,在所述植物细胞中它们可产生瞬时表达和稳定表达二者。
T-DNA用于转化植物细胞的用途已被广泛研究和描述过(EP-A1120516;Hoekema,In:The Binary Plant Vector System,Offset-drukkerij Kanters B.V.,Alblasserdam,Chapter V;Fraley等人(1985)Crit Rev Plant Sci 4:1-45和An等人(1985)EMBO J 4:277-287)。多种二元载体是已知的,它们中一些可商业获得,例如pBIN19(ClontechLaboratories,Inc.美国)。
为将DNA转移至植物细胞,将植物外植体与根癌农杆菌或发根土壤杆菌共培养。可使用合适的培养基(其可含有例如用于选择经转化细胞的抗生素或生物杀灭剂),从被感染的植物材料(例如叶、根或茎的切片,也包括原生质体或植物细胞的悬浮液)开始,再生完整的植物。然后可针对引入的DNA(该情况下,是根据本发明的DNA构建体)的存在,对获得的植物加以筛选。一旦DNA已被整合进宿主基因组,目的基因型一般来说就是稳定的,目的插入物也被发现于随后的世代中。一般来说,整合的表达盒含有选择标记,其向经转化的植物赋予对生物杀灭剂(例如除草剂)或抗生素(例如卡那霉素、G418、博来霉素、潮霉素或膦丝菌素等等)的抗性。选择标记允许选择经转化的细胞(McCormick等人,Plant Cell Reports 5(1986),81-84)。获得的植物可以以惯常方式被培养和杂交。为确保基因组整合稳定且可传承,应当生长两个或多个世代。
上述方法被描述于例如B.Jenes等人,Techniques for Gene Transfer,于:Transgenic Plants,Vol.1,Engineering and Utilization,由SD Kung和R Wu编辑,Academic Press(1993),128-143,以及于Potrykus(1991)Annu Rev Plant Physiol PlantMolec Biol 42:205-225中。待表达的构建体优选被克隆进适于对根癌农杆菌进行转化的载体,例如pBin19(Bevan等人(1984)Nucl Acids Res 12:8711)。
本发明的DNA构建体可被用于向基本上任何植物赋予想要的性状。技术人员将认知到,DNA构建体稳定整合入转基因植物并且被确认是可操纵的之后,就可通过有性杂交被引入其它植物。可使用大量标准育种技术中的任何技术,这取决于待被杂交的物种。
或者,优化的内切核酸酶可瞬时表达。嵌合内切核酸酶可作为递送进靶细胞的DNA或RNA瞬时表达,和/或可作为蛋白质被递送。作为蛋白质递送可在细胞穿透肽的帮助下实现,或者可通过与融合至核酸酶或嵌合内切核酸酶的SEciV信号肽的融合来实现,所述信号肽介导了从递送生物至靶生物细胞的分泌,例如,从发根土壤杆菌或根癌农杆菌分泌进植物细胞。
转基因植物的再生
如果可选择标记是引入的DNA的一部分的话,可将经转化的细胞(即,包含整合进宿主细胞的DNA的DNA的那些)与未经转化的细胞选择分开。标记可以是例如能赋予对抗生素或除草剂的抗性的任何基因(例如见上文所述)。表达此类标记基因的经转化细胞能在存在浓度将杀死未经转化的野生型的合适抗生素或除草剂的情况下存活。一旦经转化的植物细胞产生后,即可使用技术人员已知的方法来获得完整的植物。例如,愈伤组织被用作为起始材料。可以以已知的方式,在此尚未经分化的细胞生物量中诱导苗和根的形成。获得的苗可被种植和培养。
通过上述任何转化技术获得的经转化的植物细胞可被培养,以再生具有经转化的基因型以及由此具有想要的表型的整株植物。此类再生技术依赖于对组织培养物生长培养基中某些植物激素的操纵,典型地,依赖于已与想要的核苷酸序列一起被引入的生物杀灭剂和/或除草剂标记。来自培养的原生质体的植物再生描述于Evans等人,ProtoplastsIsolation and Culture,Handbook of Plant Cell Culture,pp.124176,MacmillianPublishing Company,New York(1983)以及Binding,Regeneration of Plants,PlantProtoplasts,pp.21-73,CRC Press,Boca Raton,(1985)中。还可从植物愈伤组织、外植体、体细胞胚(Dandekar等人(1989)J Tissue Cult Meth 12:145;McGranahan等人(1990)Plant Cell Rep 8:512)、器官或其部分获得再生。此类再生技术被一般性地描述于Klee等人(1987)Ann Rev Plant Physiol 38:467-486中。
与其它重组增强技术的组合
在另一优选的实施方式中,通过与促进同源重组的系统组合来增加重组系统的效力。此类系统被描述过,它们包括,例如,诸如RecA等的蛋白的表达,或用PARP抑制剂进行处理。已经展示,可使用PARP抑制剂增加烟草植物中的染色体内同源重组(Puchta H等人(1995)Plant J.7:203-210)。使用这些抑制剂,诱导序列特异性DNA双链断裂之后重组盒中的同源重组速率以及由此对转基因序列加以缺失的效力,可被进一步增加。若干种PARP抑制剂可用于该目的。优选包括抑制剂例如,3-氨基苯甲酰胺、8-羟基-2-甲基喹唑啉(methylquinazolin)-4-酮(NU1025)、1,11b-二氢-(2H)苯并吡喃(4,3,2-de)异喹啉-3-酮(GPI 6150)、5-氨基异喹啉酮、3,4-二氢-5-(4-(1-哌啶基)丁氧基)-1(2H)-异喹啉酮或WO00/26192、WO 00/29384、WO 00/32579、WO 00/64878、WO 00/68206、WO 00/67734、WO 01/23386和WO 01/23390中描述的化合物。
此外,可通过表达大肠杆菌RecA基因增加植物中多种同源重组反应的频率(ReissB等人(1996)Proc Natl Acad Sci USA 93(7):3094-3098)。此外,蛋白质的存在使得同源和异常DSB修复之间的比例倾向于同源修复(Reiss B等人(2000)Proc Natl Acad Sci USA97(7):3358-3363)。还可参照WO 97/08331中描述的方法,用于增加植物中的同源重组。也可通过RecA基因或增加同源重组效力的其它基因的同时表达,实现重组系统效力的进一步增加(Shalev G等人(1999)Proc Natl Acad Sci USA96(13):7398-402)。上述用于促进同源重组的系统还可有利地用于重组构建体将被以定点方式通过同源重组引入真核生物基因组的情况下。
使用优化的内切核酸酶进行同源重组和靶向突变的方法
本发明提供了用于多核苷酸的同源重组的方法,所述方法包含:
a.提供同源重组的感受态细胞,
b.提供包含侧翼有序列A和序列B的重组多核苷酸的多核苷酸,
c.提供包含序列A’和B’的多核苷酸,序列A’和B’足够长并且与序列A和序列B足够同源,从而允许在所述细胞中同源重组,以及
d.提供优化的内切核酸酶或编码优化的内切核酸酶的表达盒,
e.在所述细胞中组合b)、c)和d),以及
f.检测b)和c)的重组多核苷酸,或选择出包含b)和c)的重组多核苷酸的细胞,或使包含b)和c)的重组多核苷酸的细胞生长。
在本发明的一种实施方式中,步骤e)导致步骤c)中提供的多核苷酸中包含的多核苷酸的缺失。
在本发明的一种实施方式中,步骤c)中提供的多核苷酸中包含的缺失的多核苷酸编码标记基因或标记基因的部分。
在本发明的一种实施方式中,步骤b)中提供的多核苷酸包含至少一个表达盒。
在本发明的一种实施方式中,步骤b)中提供的多核苷酸包含至少一个表达盒,导致选择标记基因或报道基因的表达。
在本发明的一种实施方式中,步骤b)中提供的多核苷酸包含至少一个表达盒,导致选择标记基因或报道基因的表达,并且包含至少一个DNA识别位点或至少一个嵌合识别位点。
本发明的另一实施方式提供了对多核苷酸进行靶向突变的方法,所述方法包括:
a.提供包含含有I-SecI识别位点的多核苷酸的细胞,
b.提供能切割步骤a)的嵌合识别位点的优化的内切核酸酶,
c.在所述细胞中组合a)和b),以及
d.检测经突变的多核苷酸,或针对包含经突变的多核苷酸的生长细胞加以选择。
本发明在另一实施方式中提供了用于如上文所述的同源重组的方法或用于如上文所述的靶向突变多核苷酸的方法,所述方法包括:
通过生物的杂交、通过对细胞的转化或通过与优化的内切核酸酶融合的SecIV肽,组合优化的内切核酸酶和SecI识别位点,以及将包含SecI识别位点的细胞与下述生物接触,所述生物表达所述优化的内切核酸酶并表达能识别与所述嵌合内切核酸酶融合的SecIV肽的SecIV运送复合体。
实施例
一般方法:
寡核苷酸的化学合成可例如以已知方式使用亚磷酰胺方法(Voet,Voet,第2版,Wiley Press New York,pages 896-897)实现。为本发明目的而进行的克隆步骤,例如,限制性切割、琼脂糖凝胶电泳、DNA片段纯化、将核酸转移至硝酸纤维素和尼龙膜、DNA片段连接、转化大肠杆菌细胞、细菌培养、噬菌体增殖和对重组DNA的序列分析,按照Sambrook等人(1989)Cold Spring Harbor Laboratory Press;ISBN 0-87969-309-6所述来进行。使用ALF表达激光荧光DNA测序仪(ALF Express laser fluorescence DNAsequencer)(Pharmacia,Upsala[sic],瑞典),按照Sanger的方法(Sanger等人,Proc.Natl.Acad.Sci.USA 74(1977),5463-5467)对重组DNA分子加以测序。
实施例1:用于在大肠杆菌中表达的具有序列特异性DNA内切核酸酶表达盒的构建体
实施例1a:基础构建体
在本实施例中,我们展示了被命名为“构建体I”的载体的大致概况(generaloutline),其适用于大肠杆菌中的转化。该载体的这种大致概况包含用于选择的氨苄青霉素抗性基因、用于大肠杆菌的复制起点和基因araC(其编码阿拉伯糖可诱导的转录调控因子)。SEQ ID NO:7显示了“NNNNNNNNNN”的序列段(stretch)。这表示用于编码序列特异性DNA内切核酸酶的不同版本的基因的占位符。可从阿拉伯糖可诱导的pBAD启动子表达不同的基因(Guzman等人,J Bacteriol 177:4121-4130(1995)),编码不同核酸酶版本的基因序列于下述实施例中给出。
其中占位符被I-SceI的序列(SEQ ID NO:8)替代的对照构建体称为VC-SAH40-4。
实施例2:编码稳定版本的核酸酶的大肠杆菌质粒
在I-SceI的氨基酸序列中可鉴别不同的失稳序列。其中有包含228至236位氨基酸残基的C端的弱PEST序列,和表现出与KEN基序的相似性的N端序列(Pfleger和Kirschner,Genes and Dev.14:655-665(2000))。根据N端规则,I-SceI的第2个氨基酸残基赋予蛋白质不稳定性。
为了测试这些序列对核酸酶的稳定性的影响,通过PCR产生了不同版本的I-SceI,分别缺失N端的氨基酸、C端的9个氨基酸或同时缺失两者。这些构建体是根据实施例1a)中描述的“构建体I”表述的。因此,所述占位符被编码各版本的核酸酶的多个序列(显示在SEQID NO:2、3、5中)替代。质粒被称为VC-SAH43-8(C端缩短的I-SceI)和VC-SAH42-13(NLS-C端缩短的I-SceI)、VC-SAH44-32(N端缩短的I-SceI,SEQ ID NO:21)和VC-SAH45-3(N-和C-端缩短的I-Sce,SEQ ID NO:22)。
根据N-末端规则,所有这些构建体都携带了稳定化的第2氨基酸残基G。为了测试第2氨基酸对蛋白质稳定性的效应,还产生了具有I-SecI的天然的、去稳残基的版本。所获得的质粒被称为VC-SAH105和VC-SAH106。
产生了其他的C末端缺失:
从C末端相继去除一个氨基酸残基。这些变体概括在表3中,并测试它们在大肠杆菌中的活性。
此外,还在I-SecI中发现了潜在的PEST序列,并通过导入单个氨基酸改变进行分析。这些变体概括在表3中,并测试它们在大肠杆菌中的活性。
表3:
实施例3:编码DNA内切核酸酶的构建体和具有核酸酶识别序列的构建体在大肠杆菌中的共转化
质粒VC-SAH44-32、VC-SAH43-8、VC-SAH42-13、VC-SAH45-3和VC-SAH40-4(描述在实施例2中)分别与靶向载体VC-SAH6-1或对照载体VC-SAH7-1共转化于大肠杆菌中。用VC-SAH105和VC-SAH106与表3中概括的载体进行同样的操作。
实施例4:在大肠杆菌中证实内切核酸酶活性
测试实施例2中描述的I-SecI版本的活性。
使携带有两种质粒的组合的共转化体在具有氨苄青霉素、卡那霉素和葡萄糖(抑制pBAD启动子)的LB中生长过夜,两种质粒之一编码核酸酶或,另一种具有核酸酶的靶位点。将培养物以1∶100稀释,并使其生长至其达到OD600=0.5。通过添加阿拉伯糖,处理3-4小时,诱导核酸酶的表达。pBAD启动子被描述为是剂量依赖型的(Guzman 1995),因此,将培养物分为不同的小分试样,用浓度在0.2%至0.0002%之间变动的阿拉伯糖来诱导蛋白质表达。将5μl的每种小分试样涂布于补充有氨苄青霉素和卡那霉素的LB固体培养基上。将平板孵育于37℃过夜,以半定量方式分析细胞生长。活性核酸酶融合体确实切割了具有靶位点的构建体。这导致丢失卡那霉素抗性。因此,由于共转化体失去在含卡那霉素培养基上生长的能力,观察到融合蛋白的活性。
结果:
VC-SAH43-8(C端缩短的I-SceI)和VC-SAH42-13(NLS-C端缩短的I-SceI)是非常有活性的,即使在缺少诱导剂阿拉伯糖的条件下也切割靶位点。仅在存在葡萄糖的条件下观察到这些共转化体的细胞生长,其中葡萄糖进一步抑制了pBAD启动子。因此,在VC-SAH43-8和VC-SAH42-13的情况下,由于pBAD启动子的基础表达而产生的少量I-SceI蛋白足以切割靶质粒。
结果被简化并概括于表4中。++和+代表非常强的生长和强的生长,这指示表达的核酸酶对各靶位点没有活性或活性极低。-和--代表降低的生长或没有生长,其指示核酸酶对各靶位点的高活性或非常高的活性。
表4:I-SceI变体:大肠杆菌生长检验指示了针对各靶位点的内切核酸酶活性。
实施例5:转化酿酒酵母
酿酒酵母细胞生长在10ml YEPS中过夜,然后1∶10稀释。然后生长该培养物至其达到OD600=0.5。沉淀细胞,并重悬在15ml无菌水中2次,再次沉淀,并重悬在1ml无菌水中。将该细胞悬浮液等分为100μl,并再次沉淀。在冰上,在64μl水中加入240μl 50%PEG4000、36μl 1M LiAc、20μl鲑精DNA(5mg/ml)(5分钟100℃,然后冰上10分钟)和6μg质粒。悬浮液在42℃孵育45分钟,置于冰上30秒。沉淀细胞,并重悬在500μl水中。其中200μl涂在缺少甲硫氨酸的选择性培养基上。平板在30℃孵育3至4天。选择单个菌落进行进一步的分析。
实施例6:在酿酒酵母中表达具有稳定化版本的核酸酶的构建体
将实施例2中描述的序列克隆到载体pGBT9-3H/B(Tirode等人,1997,J Biol Chem272:22995-22999)中,置于MET25启动子的控制下,所述启动子在存在甲硫氨酸时被抑制,而在缺少甲硫氨酸时被活化。
实施例7:在酿酒酵母中证实内切核酸酶稳定性
使转化体在缺少甲硫氨酸的培养基上生长,诱导蛋白质表达。生成不同转化体的全蛋白质提取物,通过Western印迹分析测试I-SceI的丰度和量。使用放线菌酮(Cycloheximide)和MG132进行脉冲追踪实验,确定不同版本的体内半衰期。
实施例8:编码用于在拟南芥中表达的稳定化版本的核酸酶的构建体
实施例8a:通过杂交表达核酸酶的植物与携带具各个靶位点的T-DNA的植物,验证内切核酸酶活性的构建体
表现出表4中的活性的所有构建体对测试都是有价值的,下列实施例将集中关注I-SecI的C端截短版本。生成不同的质粒,其中“构建体IV”的占位符(SEQ ID NO:13)被不同的序列替换,所述序列编码I-SecI的C端截短版本,组合或未组合稳定化G作为第2氨基酸残基,以及有或无NLS。最有利的是由构建体VC-SAH151-2、VC-SAH152-6、VC-SAH153-6、VC-SAH154-1、VC-SAH155-1、VC-SAH156-3编码的核酸酶变体。
实施例8b:通过将这些构建体转化已携带具有各个靶位点的T-DNA的植物,验证内切核酸酶活性的构建体
在该实施例中,我们展示了被命名为“构建体VI”(VC-SCB697)的二元载体的大致概况,其适用于植物中的转化。该二元载体的这种大致概况包含具有nos-启动子::nptII::nos-终止子盒的T-DNA,当整合到植物基因组中时,该盒使得能够基于卡那霉素进行选择。SEQ ID NO:23(VC-SCB697)显示了“NNNNNNNNNN”的序列段。这表示用于编码I-SceI的版本的基因的占位符。
当占位符被不同的构建体替换时,生成了不同的质粒,所述构建体包括I-SceI的C端截短版本:VC-SAH124-3(NLS-I-SceI C端缩短的,G)(SEQ ID NO:5)、VC-SAH125-2(I-SceI C端缩短的,G)(SEQ ID NO:3)、VC-SAH122-7(I-SceI,G)(SEQ ID NO:2)和VC-SAH123-3(NLS-I-SceI,G),参见实施例2(作为对照,使用没有稳定化G作为第2氨基酸残基的I-SceI:VC-SCB697-3)。表现出表4中的活性的所有构建体对测试都是有价值的,最有利的是由构建体VC-SAH151-2、VC-SAH152-6、VC-SAH153-6、VC-SAH154-1、VC-SAH155-1、VC-SAH156-3编码的核酸酶变体。
生成没有稳定化G作为第2氨基酸残基的相同质粒。
实施例9:将编码核酸酶的稳定化版本的构建体转化到拟南芥中
将实施例8b描述的质粒转化到携带VC-SCB583-40(SEQ ID NO:24)的T-DNA的拟南芥株系中。
将实施例8a描述的构建体转化到野生型植物中。
实施例10:监测稳定化的核酸酶的活性
实施例10a:通过杂交
通过杂交表达序列特异性DNA内切核酸酶的株系与含有具有识别序列的构建体的株系,监测不同的I-SceI版本的活性。识别序列被一部分的uidA(GUS)基因(被称为“GU”)和另一部分uidA基因(被称为“US”)包围。部分重叠的半GUS基因(GU和US)是无功能的,但作为靶位点上的I-SceI活性的结果,功能性GUS基因将通过同源染色体内重组(ICHR)得以恢复。这可通过组织化学GUS染色来监测(Jefferson等人(1987)EMBO J 6:3901-3907)。
为视觉观察I-SceI活性,将具有实施例9a所述质粒的T-DNA的拟南芥(Arabidopsis)转基因株系与具有构建体VC-SCB734-4的T-DNA的拟南芥株系杂交。收获杂交的F1种子。对种子进行表面灭菌,并令其生长于补充有各抗生素和/或除草剂的培养基A上。收获3-4熟(old)幼苗,用其进行组织化学GUS染色。蓝色区域的量是杂交中发生ICHR的组织/部分组织的指标,并且由此是I-SceI活性的指标。
实施例10b:通过超级转化(supertransformation)
通过用具有表达盒的质粒转化包含具有识别序列的构建体的株系,监测I-SceI的不同版本的活性,所述表达盒具有稳定化I-SceI的不同版本。识别序列被一部分的uidA(GUS)基因(被称为“GU”)和另一部分uidA基因(被称为“US”)包围。部分重叠的半GUS基因(GU和US)是无功能的,但作为靶位点上的I-SceI活性的结果,功能性GUS基因将通过同源染色体内重组(ICHR)得以恢复。这可通过组织化学GUS染色来监测(Jefferson等人(1987)EMBO J 6:3901-3907)。
为视觉观察I-SceI活性,用实施例8b所述质粒转化具有构建体pCB583-40的T-DNA的拟南芥转基因株系。收获F1种子,对种子进行表面灭菌,并令其生长于补充有各抗生素和/或除草剂的培养基A上。分析F1植株的核酸酶构建体单拷贝整合,并自花授粉。在没有选择压力的培养基A上生长F2植株。编码核酸酶的T-DNA也编码dsRed。由于分离(segregation),在UV光下选择无dsRed因而无核酸酶的植株。收获具有4叶的幼苗,用其进行组织化学GUS染色。蓝色幼苗代表在前一世代中发生的同源重组事件。每个构建体分析3至5个独立的株系,染色多达96株幼苗。蓝色幼苗的数量是I-SceI活性的指标。
结果:
总而言之,I-SceI、I-SceI+G和NLS-I-SceI+G导致在30%-41%之间的蓝色植株。而表达由VC-SAH124-3和VC-SAH125-2编码的C端缩短的版本导致约60%的蓝色幼苗。
阳性的GUS信号表示由I-SceI活性导致的ICHR事件。核酸酶还可以产生切割,该切割不被ICHR修复,但被非常规重组修复。这一事件将导致I-SceI识别序列的破坏,并导致无功能的GUS基因。在此情况下,可以通过蓝色染色监测I-SceI活性。为进一步分析在该测定中获得的白色幼苗,实施扩增半GUS基因(GU和US)的PCR反应。扩增子经过I-SceI消化,检测靶序列的存在或缺失。靶位点的缺失代表了前一世代中的I-SceI活性。总而言之,C端缩短的I-SceI变体导致88株测试的T2植株中1株具有完整的I-SceI位点。相反,由构建体VC-SCB697-3编码的I-SceI导致48株测试植株中14株仍然具有未切割的I-SceI位点。
由VC-SAH124-3和VC-SAH125-2编码的C端缩短的版本产生了T2世代,其中几乎所有的个体都表现出I-SceI活性的结果。

Claims (18)

1.优化的内切核酸酶,其由下述氨基酸序列组成,所述氨基酸序列是SEQ ID NO:1、2或15所描述的氨基酸序列但是通过缺失SEQ ID NO:1、2或15中所示的内切核酸酶的C末端的氨基酸序列TISSETFLK的1、2、3、4、5、6、7、8或9个氨基酸而不具有所述氨基酸序列TISSETFLK。
2.权利要求1所述的优化的内切核酸酶,其氨基酸序列由SEQ ID NO:3所描述的氨基酸序列组成。
3.优化的内切核酸酶,其氨基酸序列由SEQ ID NO:5所描述的氨基酸序列组成。
4.权利要求1或3所述的优化的内切核酸酶,其是经改造的内切核酸酶。
5.权利要求1至3的任一项所述的优化的内切核酸酶,其与至少一个锌指结构域,或至少一个源自转录激活物-样(TAL)效应子的重复单元,或至少一个锌指结构域和至少一个源自转录激活物-样(TAL)效应子的重复单元融合。
6.权利要求4所述的优化的内切核酸酶,其与至少一个锌指结构域,或至少一个源自转录激活物-样(TAL)效应子的重复单元,或至少一个锌指结构域和至少一个源自转录激活物-样(TAL)效应子的重复单元融合。
7.权利要求1至3和6的任一项所述的优化的内切核酸酶,其还包含SecIII或SecIV分泌信号。
8.权利要求4所述的优化的内切核酸酶,其还包含SecIII或SecIV分泌信号。
9.权利要求5所述的优化的内切核酸酶,其还包含SecIII或SecIV分泌信号。
10.包含多核苷酸序列的经分离的多核苷酸,所述多核苷酸序列编码权利要求1至9中任意一项所述的优化的内切核酸酶。
11.权利要求10所述的包含核苷酸序列的经分离的多核苷酸,其中经分离的多核苷酸的序列:
a.是经密码子优化的,
b.具有低含量的RNA不稳定性基序,
c.具有低含量的密码子重复,
d.具有低含量的隐蔽剪接位点,
e.具有低含量的备选起始密码子,
f.具有低含量的限制性位点,
g.具有低含量的RNA二级结构,
h.具有a)、b)、c)、d)、e)、f)或g)的任何组合。
12.表达盒,所述表达盒包含与启动子和终止子序列功能性组合的、权利要求10或11所述的经分离的多核苷酸。
13.载体或宿主细胞,其包含:
a.编码权利要求1至9中任一所述的优化的内切核酸酶的多核苷酸,或
b.权利要求10或11所述的经分离的多核苷酸,或
c.权利要求12所述的表达盒,或
d.a)、b)和c)的任何组合。
14.权利要求13所述的宿主细胞,其中所述宿主细胞是农杆菌细胞。
15.用于多核苷酸同源重组的方法,其包括:
a.提供用于同源重组的感受态细胞,
b.提供下述多核苷酸,所述多核苷酸包含侧翼为序列A和序列B的经优化的内切核酸酶的DNA识别位点,
c.提供包含序列A’和B’的多核苷酸,所述序列A’和B’足够长并且与序列A和序列B足够同源,从而允许在所述细胞中同源重组,以及
d.提供如权利要求1至9中任意一项所述的优化的内切核酸酶或如权利要求12所述的表达盒,
e.在所述细胞中组合b)、c)和d),以及
f.检测b)和c)的重组多核苷酸,或选择出或生长包含b)和c)的重组多核苷酸的细胞。
16.如权利要求15所述的用于多核苷酸同源重组的方法,其中,同源重组之后,步骤a)的所述感受态细胞中包含的多核苷酸序列从步骤f)的生长细胞的基因组中缺失。
17.用于多核苷酸的靶向突变的方法,其包括:
a.提供包含含有如权利要求1至9中任意一项所述的经优化的内切核酸酶的DNA识别位点的多核苷酸的细胞,
b.提供能切割步骤a)的所述DNA识别位点的、如权利要求1至9中任意一项所述的经优化的内切核酸酶或权利要求10所述的表达盒,
c.在所述细胞中组合a)和b),以及
d.检测经突变的多核苷酸,或选择出或生长包含经突变的多核苷酸的细胞。
18.如权利要求15或17所述的用于同源重组或靶向突变的方法,其中所述经优化的内切核酸酶和DNA识别位点通过生物的杂交、通过转化或通过经由融合至经优化的内切核酸酶的SecIII或SecIV肽介导的运送,组合于至少一个细胞中。
CN201080062324.8A 2009-11-27 2010-11-25 优化的内切核酸酶及其用途 Active CN102725412B (zh)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US26471509P 2009-11-27 2009-11-27
EP09177375 2009-11-27
US61/264,715 2009-11-27
EP09177375.4 2009-11-27
US36583610P 2010-07-20 2010-07-20
EP10170199 2010-07-20
EP10170199.3 2010-07-20
US61/365,836 2010-07-20
PCT/IB2010/055428 WO2011064736A1 (en) 2009-11-27 2010-11-25 Optimized endonucleases and uses thereof

Publications (2)

Publication Number Publication Date
CN102725412A CN102725412A (zh) 2012-10-10
CN102725412B true CN102725412B (zh) 2017-09-22

Family

ID=44065918

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201080062324.8A Active CN102725412B (zh) 2009-11-27 2010-11-25 优化的内切核酸酶及其用途

Country Status (10)

Country Link
US (1) US9404099B2 (zh)
EP (1) EP2504439B1 (zh)
JP (1) JP5944320B2 (zh)
CN (1) CN102725412B (zh)
AU (1) AU2010325549B2 (zh)
BR (1) BR112012012588B1 (zh)
CA (1) CA2782014C (zh)
DE (1) DE112010004582T5 (zh)
WO (1) WO2011064736A1 (zh)
ZA (1) ZA201204700B (zh)

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110239315A1 (en) 2009-01-12 2011-09-29 Ulla Bonas Modular dna-binding domains and methods of use
EP2206723A1 (en) 2009-01-12 2010-07-14 Bonas, Ulla Modular DNA-binding domains
AU2010325563B2 (en) 2009-11-27 2017-02-02 Basf Plant Science Company Gmbh Chimeric endonucleases and uses thereof
ES2527997T5 (es) 2009-12-10 2018-05-17 Regents Of The University Of Minnesota Modificación del ADN inducida por el efector TAL
EP3156062A1 (en) 2010-05-17 2017-04-19 Sangamo BioSciences, Inc. Novel dna-binding proteins and uses thereof
CN102787125B (zh) * 2011-08-05 2013-12-04 北京大学 一种构建tale重复序列的方法
CN103890181A (zh) 2011-08-22 2014-06-25 拜尔作物科学公司 修饰植物基因组的方法和手段
EP2612918A1 (en) 2012-01-06 2013-07-10 BASF Plant Science Company GmbH In planta recombination
BR112014031891A2 (pt) 2012-06-19 2017-08-01 Univ Minnesota direcionamento genético nas plantas utilizando vírus de dna
ES2894832T3 (es) 2012-11-01 2022-02-16 Cellectis Plantas para la producción de proteínas terapéuticas
US20160272980A1 (en) 2012-11-16 2016-09-22 Total Marketing Services Method for targeted modification of algae genomes
IL307735A (en) * 2012-12-12 2023-12-01 Broad Inst Inc Systems engineering, methods and optimal guiding components for sequence manipulation
EP2931892B1 (en) 2012-12-12 2018-09-12 The Broad Institute, Inc. Methods, models, systems, and apparatus for identifying target sequences for cas enzymes or crispr-cas systems for target sequences and conveying results thereof
DK3327127T3 (da) * 2012-12-12 2021-06-28 Broad Inst Inc Fremføring, modificering og optimering af systemer, fremgangsmåder og sammensætninger til sekvensmanipulation og terapeutiske anvendelser
EP4286404A3 (en) * 2012-12-12 2024-02-14 The Broad Institute Inc. Crispr-cas component systems, methods and compositions for sequence manipulation
EP2934097B1 (en) 2012-12-21 2018-05-02 Cellectis Potatoes with reduced cold-induced sweetening
US10113162B2 (en) 2013-03-15 2018-10-30 Cellectis Modifying soybean oil composition through targeted knockout of the FAD2-1A/1B genes
CN103173491A (zh) * 2013-03-15 2013-06-26 中国人民解放军第三军医大学 融合蛋白NLS-I-SceI在制备介导哺乳动物基因转移的试剂中的应用
CA2915834A1 (en) 2013-06-17 2014-12-24 Massachusetts Institute Of Technology Delivery, engineering and optimization of tandem guide systems, methods and compositions for sequence manipulation
EP3011033B1 (en) 2013-06-17 2020-02-19 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions methods, screens and applications thereof
WO2014204729A1 (en) 2013-06-17 2014-12-24 The Broad Institute Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for targeting disorders and diseases using viral components
DK3011031T3 (da) 2013-06-17 2020-12-21 Broad Inst Inc Fremføring og anvendelse af crispr-cas-systemerne, vektorer og sammensætninger til levermålretning og -terapi
EP4245853A3 (en) 2013-06-17 2023-10-18 The Broad Institute, Inc. Optimized crispr-cas double nickase systems, methods and compositions for sequence manipulation
WO2015089364A1 (en) 2013-12-12 2015-06-18 The Broad Institute Inc. Crystal structure of a crispr-cas system, and uses thereof
AU2014361781B2 (en) 2013-12-12 2021-04-01 Massachusetts Institute Of Technology Delivery, use and therapeutic applications of the CRISPR -Cas systems and compositions for genome editing
WO2015089486A2 (en) 2013-12-12 2015-06-18 The Broad Institute Inc. Systems, methods and compositions for sequence manipulation with optimized functional crispr-cas systems
WO2015089351A1 (en) 2013-12-12 2015-06-18 The Broad Institute Inc. Compositions and methods of use of crispr-cas systems in nucleotide repeat disorders
WO2015193858A1 (en) 2014-06-20 2015-12-23 Cellectis Potatoes with reduced granule-bound starch synthase
IL286474B2 (en) * 2014-06-23 2023-11-01 Massachusetts Gen Hospital Genome-wide random identification of DSBS assessed by sequencing (guide-sequence)
EP3230451B1 (en) 2014-12-12 2021-04-07 The Broad Institute, Inc. Protected guide rnas (pgrnas)
JP6590333B2 (ja) * 2015-02-26 2019-10-16 学校法人東京理科大学 Dna結合ドメイン組込み用ベクターおよびそのセット、融合タンパク質コーディングベクターおよびそのセットならびにその製造方法、デスティネーションベクター、植物細胞用発現ベクターおよびその製造方法、植物細胞用発現ベクター作製用キット、形質転換方法、ならびにゲノム編集方法
WO2016168694A1 (en) * 2015-04-15 2016-10-20 Ohio State Innovation Foundation Engineered calmodulin for treatment of ryanopathies
WO2016205759A1 (en) 2015-06-18 2016-12-22 The Broad Institute Inc. Engineering and optimization of systems, methods, enzymes and guide scaffolds of cas9 orthologs and variants for sequence manipulation
TWI813532B (zh) 2015-06-18 2023-09-01 美商博得學院股份有限公司 降低脱靶效應的crispr酶突變
US10837024B2 (en) 2015-09-17 2020-11-17 Cellectis Modifying messenger RNA stability in plant transformations
UY37108A (es) 2016-02-02 2017-08-31 Cellectis Modificación de la composición de aceites de soja mediante el knockout dirigido de los genes fad3a/b/c
CA3021682A1 (en) 2016-05-25 2017-11-30 Cargill Incorporated Engineered nucleases to generate deletion mutants in plants
CA3042857A1 (en) 2016-11-16 2018-05-24 Cellectis Methods for altering amino acid content in plants through frameshift mutations
WO2018198049A1 (en) 2017-04-25 2018-11-01 Cellectis Alfalfa with reduced lignin composition
CN109337887B (zh) * 2018-10-24 2021-04-27 成都大学 一种Nucyep的编码基因、重组表达载体、重组工程菌及其制备方法和应用
EP3906309A2 (en) 2019-01-04 2021-11-10 Cargill, Incorporated Engineered nucleases to generate mutations in plants

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5962327A (en) * 1992-05-05 1999-10-05 Institut Pasteur Universite Paris-Vi Nucleotide sequence encoding the enzyme I-SceI and the uses thereof
WO2002099105A2 (en) * 2001-06-05 2002-12-12 Cellectis Methods for modifying the cpg content of polynucleotides
WO2009042163A2 (en) * 2007-09-27 2009-04-02 Sangamo Biosciences, Inc. Rapid in vivo identification of biologically active nucleases
WO2009076292A2 (en) * 2007-12-07 2009-06-18 Precision Biosciences, Inc. Rationally-designed meganucleases with recognition sequences found in dnase hypersensitive regions of the human genome

Family Cites Families (72)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5352605A (en) 1983-01-17 1994-10-04 Monsanto Company Chimeric genes for transforming plant cells using viral promoters
NL8300698A (nl) 1983-02-24 1984-09-17 Univ Leiden Werkwijze voor het inbouwen van vreemd dna in het genoom van tweezaadlobbige planten; agrobacterium tumefaciens bacterien en werkwijze voor het produceren daarvan; planten en plantecellen met gewijzigde genetische eigenschappen; werkwijze voor het bereiden van chemische en/of farmaceutische produkten.
US5254799A (en) 1985-01-18 1993-10-19 Plant Genetic Systems N.V. Transformation vectors allowing expression of Bacillus thuringiensis endotoxins in plants
ATE57390T1 (de) 1986-03-11 1990-10-15 Plant Genetic Systems Nv Durch gentechnologie erhaltene und gegen glutaminsynthetase-inhibitoren resistente pflanzenzellen.
US5004863B2 (en) 1986-12-03 2000-10-17 Agracetus Genetic engineering of cotton plants and lines
IL84459A (en) 1986-12-05 1993-07-08 Agracetus Apparatus and method for the injection of carrier particles carrying genetic material into living cells
DE68918494T2 (de) 1988-05-17 1995-03-23 Lubrizol Genetics Inc Pflanzliches Ubiquitinpromotorsystem.
AU625013B2 (en) 1989-11-03 1992-06-25 Vanderbilt University Method of in vivo delivery of functioning foreign genes
US5279833A (en) 1990-04-04 1994-01-18 Yale University Liposomal transfection of nucleic acids into animal cells
US5633446A (en) 1990-04-18 1997-05-27 Plant Genetic Systems, N.V. Modified Bacillus thuringiensis insecticidal-crystal protein genes and their expression in plant cells
DK152291D0 (da) 1991-08-28 1991-08-28 Danisco Fremgangsmaade og kemiske forbindelser
US5612472A (en) 1992-01-09 1997-03-18 Sandoz Ltd. Plant promoter
JPH07505531A (ja) 1992-04-15 1995-06-22 プラント・ジェネティック・システムズ・エヌ・ブイ 単子葉植物細胞の形質転換法
US5792632A (en) * 1992-05-05 1998-08-11 Institut Pasteur Nucleotide sequence encoding the enzyme I-SceI and the uses thereof
EP0646178A1 (en) 1992-06-04 1995-04-05 The Regents Of The University Of California expression cassette with regularoty regions functional in the mammmlian host
US5689052A (en) 1993-12-22 1997-11-18 Monsanto Company Synthetic DNA sequences having enhanced expression in monocotyledonous plants and method for preparation thereof
US5837458A (en) 1994-02-17 1998-11-17 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
GB9824544D0 (en) 1998-11-09 1999-01-06 Medical Res Council Screening system
JP4118327B2 (ja) 1994-08-20 2008-07-16 ゲンダック・リミテッド Dna認識のための結合タンパク質におけるまたはそれに関連する改良
AU719001B2 (en) 1994-12-29 2000-05-04 Massachusetts Institute Of Technology Chimeric DNA-binding proteins
US6583336B1 (en) 1995-08-30 2003-06-24 Basf Plant Science Gmbh Stimulation of homologous recombination in eukaryotic organisms or cells by recombination promoting enzymes
AR006928A1 (es) 1996-05-01 1999-09-29 Pioneer Hi Bred Int Una molecula de adn aislada que codifica una proteina fluorescente verde como marcador rastreable para la transformacion de plantas, un metodo para laproduccion de plantas transgenicas, un vector de expresion, una planta transgenica y celulas de dichas plantas.
DE19619353A1 (de) 1996-05-14 1997-11-20 Bosch Gmbh Robert Verfahren zur Herstellung eines integriert optischen Wellenleiterbauteiles sowie Anordnung
EP0870836A1 (de) 1997-04-09 1998-10-14 IPK Gatersleben 2-Desoxyglucose-6-Phosphat (2-DOG-6-P) Phosphatase DNA-Sequenzen als Selektionsmarker in Pflanzen
GB9710807D0 (en) 1997-05-23 1997-07-23 Medical Res Council Nucleic acid binding proteins
GB9710809D0 (en) 1997-05-23 1997-07-23 Medical Res Council Nucleic acid binding proteins
US6479626B1 (en) 1998-03-02 2002-11-12 Massachusetts Institute Of Technology Poly zinc finger proteins with improved linkers
US6596509B1 (en) 1998-07-10 2003-07-22 Cornell Research Foundation, Inc. Recombinant constructs and systems for secretion of proteins via type III secretion systems
US6140081A (en) 1998-10-16 2000-10-31 The Scripps Research Institute Zinc finger binding domains for GNN
HUP0200312A3 (en) 1998-11-03 2002-12-28 Basf Ag Substituted 2-phenylbenzimidazoles, pharmaceutical compositions containing them, the production thereof and their use
DE59912473D1 (de) 1998-11-17 2005-09-29 Abbott Gmbh & Co Kg 2-phenylbenzimidazole und 2-phenylindole, deren herstellung und anwendung
SK285529B6 (sk) 1998-11-27 2007-03-01 Basf Aktiengesellschaft Substituované benzimidazoly, farmaceutická kompozícia s ich obsahom a ich použitie ako inhibítorov PARP
US6453242B1 (en) 1999-01-12 2002-09-17 Sangamo Biosciences, Inc. Selection of sites for targeting by zinc finger proteins and methods of designing zinc finger proteins to bind to preselected sites
US7013219B2 (en) 1999-01-12 2006-03-14 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
DE19918211A1 (de) 1999-04-22 2000-10-26 Basf Ag Cycloalkylsubstituierte Benzimidazole, deren Herstellung und Anwendung
DE19920936A1 (de) 1999-05-07 2000-11-09 Basf Ag Heterozyklisch substituierte Benzimidazole, deren Herstellung und Anwendung
DE19921567A1 (de) 1999-05-11 2000-11-16 Basf Ag Verwendung von Phthalazine-Derivaten
BR0007174A (pt) 1999-09-28 2001-09-04 Basf Ag Composto, preparação farmacêutica e uso de compostos
DE19946289A1 (de) 1999-09-28 2001-03-29 Basf Ag Benzodiazepin-Derivate, deren Herstellung und Anwendung
AU1799801A (en) 1999-11-23 2001-06-04 Maxygen, Inc. Homologous recombination in plants
NL1015252C2 (nl) 2000-05-19 2001-11-20 Univ Leiden Werkwijze voor het teweegbrengen van een verandering in een cel, en een vector.
US20030082561A1 (en) 2000-07-21 2003-05-01 Takashi Sera Zinc finger domain recognition code and uses thereof
US9234187B2 (en) 2001-01-22 2016-01-12 Sangamo Biosciences, Inc. Modified zinc finger binding proteins
DE10130555B4 (de) 2001-06-25 2005-03-10 Knorr Bremse Systeme Verschlußkörper für Atmungsöffnungen von Gehäusen
GB0201043D0 (en) 2002-01-17 2002-03-06 Swetree Genomics Ab Plants methods and means
WO2003089452A2 (en) 2002-04-17 2003-10-30 Sangamo Biosciences, Inc. Compositions and methods for regulation of plant gamma-tocopherol methyltransferase
DE10224889A1 (de) 2002-06-04 2003-12-18 Metanomics Gmbh & Co Kgaa Verfahren zur stabilen Expression von Nukleinsäuren in transgenen Pflanzen
FR2843404A1 (fr) 2002-08-07 2004-02-13 Cellectis Methode de determination de l'activite de clivage d'une endonuclease
EP1591521A1 (en) 2004-04-30 2005-11-02 Cellectis I-Dmo I derivatives with enhanced activity at 37 degrees C and use thereof
CA2578140A1 (en) 2004-09-23 2006-03-30 Basf Plant Science Gmbh Recombination cassettes and methods for sequence excision in plants
WO2007034262A1 (en) 2005-09-19 2007-03-29 Cellectis Heterodimeric meganucleases and use thereof
US20090263900A1 (en) * 2008-04-14 2009-10-22 Sangamo Biosciences, Inc. Linear donor constructs for targeted integration
DK1945762T3 (da) * 2005-10-18 2013-07-29 Prec Biosciences Rationelt konstruerede meganucleaser med ændret sekvensspecificitet og DNA-bindingsaffinitet
WO2007093836A1 (en) 2006-02-13 2007-08-23 Cellectis Meganuclease variants cleaving a dna target sequence from a xp gene and uses thereof
WO2007135022A1 (en) 2006-05-18 2007-11-29 Biogemma Method for performing homologous recombination in plants
WO2009001159A1 (en) 2007-06-25 2008-12-31 Cellectis Method for enhancing the cleavage activity of i-crei derived meganucleases
KR101613624B1 (ko) 2006-12-14 2016-04-29 다우 아그로사이언시즈 엘엘씨 최적화된 비-정규 아연 손가락 단백질
WO2008093152A1 (en) 2007-02-01 2008-08-07 Cellectis Obligate heterodimer meganucleases and uses thereof
AU2007347328B2 (en) 2007-02-19 2013-03-07 Cellectis LAGLIDADG homing endonuclease variants having novel substrate specificity and use thereof
EP2155868A2 (en) 2007-04-19 2010-02-24 Codon Devices, Inc Engineered nucleases and their uses for nucleic acid assembly
CN101784658A (zh) 2007-06-06 2010-07-21 赛莱克蒂斯公司 增强来自I-CreI的大范围核酸酶的切割活性的方法
WO2009009105A2 (en) 2007-07-10 2009-01-15 Carnegie Mellon University Compositions and methods for producing cellular labels for nuclear magnetic resonance techniques
EP2215223B1 (en) 2007-10-31 2013-05-01 Precision Biosciences, Inc. Rationally-designed single-chain meganucleases with non-palindromic recognition sequences
WO2009114321A2 (en) 2008-03-11 2009-09-17 Precision Biosciencs, Inc. Rationally-designed meganucleases for maize genome engineering
US20100071083A1 (en) 2008-03-12 2010-03-18 Smith James J Temperature-dependent meganuclease activity
AU2009239333A1 (en) 2008-04-21 2009-10-29 Danziger Innovations Ltd. Plant viral expression vectors and use of same for generating genotypic variations in plant genomes
EP2279250A4 (en) 2008-04-28 2011-10-12 Prec Biosciences Inc Fusion Molecules of DNA Binding Proteins with Rational Design and Effects Domain
WO2010001189A1 (en) 2008-07-03 2010-01-07 Cellectis The crystal structure of i-dmoi in complex with its dna target, improved chimeric meganucleases and uses thereof
EP2206723A1 (en) 2009-01-12 2010-07-14 Bonas, Ulla Modular DNA-binding domains
AU2010325563B2 (en) 2009-11-27 2017-02-02 Basf Plant Science Company Gmbh Chimeric endonucleases and uses thereof
EP2504430A4 (en) 2009-11-27 2013-06-05 Basf Plant Science Co Gmbh CHIMERIC ENDONUCLEASES AND USES THEREOF

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5962327A (en) * 1992-05-05 1999-10-05 Institut Pasteur Universite Paris-Vi Nucleotide sequence encoding the enzyme I-SceI and the uses thereof
WO2002099105A2 (en) * 2001-06-05 2002-12-12 Cellectis Methods for modifying the cpg content of polynucleotides
WO2009042163A2 (en) * 2007-09-27 2009-04-02 Sangamo Biosciences, Inc. Rapid in vivo identification of biologically active nucleases
WO2009076292A2 (en) * 2007-12-07 2009-06-18 Precision Biosciences, Inc. Rationally-designed meganucleases with recognition sequences found in dnase hypersensitive regions of the human genome

Also Published As

Publication number Publication date
AU2010325549B2 (en) 2017-04-20
CA2782014C (en) 2021-08-31
JP5944320B2 (ja) 2016-07-05
BR112012012588A2 (pt) 2015-09-29
AU2010325549A1 (en) 2012-07-12
ZA201204700B (en) 2013-09-25
DE112010004582T5 (de) 2012-11-29
JP2013511977A (ja) 2013-04-11
WO2011064736A1 (en) 2011-06-03
EP2504439A4 (en) 2013-06-12
US9404099B2 (en) 2016-08-02
EP2504439A1 (en) 2012-10-03
BR112012012588B1 (pt) 2019-03-26
CA2782014A1 (en) 2011-06-03
EP2504439B1 (en) 2016-03-02
CN102725412A (zh) 2012-10-10
US20120246764A1 (en) 2012-09-27

Similar Documents

Publication Publication Date Title
CN102725412B (zh) 优化的内切核酸酶及其用途
CN102686726B (zh) 嵌合内切核酸酶及其用途
CN102762726A (zh) 嵌合内切核酸酶及其用途
US7736886B2 (en) Recombination systems and methods for eliminating nucleic acid sequences from the genome of eukaryotic organisms
AU2011207769A1 (en) Targeted genomic alteration
EP3757219A1 (en) Enhanced plant regeneration and transformation by using grf1 booster gene
CN108070578A (zh) 一种与植物耐逆性相关蛋白GmHAD1及其编码基因与应用
ZA200400871B (en) Recombination systems and a method for removing nucleic acid sequences from the genome of eukaryotic organisms

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant