CN103620027B - 核酸酶融合蛋白及其用途 - Google Patents

核酸酶融合蛋白及其用途 Download PDF

Info

Publication number
CN103620027B
CN103620027B CN201280028627.7A CN201280028627A CN103620027B CN 103620027 B CN103620027 B CN 103620027B CN 201280028627 A CN201280028627 A CN 201280028627A CN 103620027 B CN103620027 B CN 103620027B
Authority
CN
China
Prior art keywords
dna
nucleic acid
polypeptide
seq
polynucleotides
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201280028627.7A
Other languages
English (en)
Other versions
CN103620027A (zh
Inventor
I·丰法拉
W·文德
A·平戈德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BASF Plant Science Co GmbH
Original Assignee
BASF Plant Science Co GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BASF Plant Science Co GmbH filed Critical BASF Plant Science Co GmbH
Publication of CN103620027A publication Critical patent/CN103620027A/zh
Application granted granted Critical
Publication of CN103620027B publication Critical patent/CN103620027B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Mycology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

提供了嵌合的核酸酶。具体而言,编码多肽的多核苷酸包含(i)至少包含源自归巢内切核酸酶的第一DNA结合结构域的第一模块,(ii)接头,和(iii)至少包含源自限制性内切核酸酶的第二DNA结合结构域和切割结构域的第二模块,其中嵌合的核酸酶仅与包含第一DNA结合结构域的DNA识别位点和第二DNA结合结构域的DNA识别位点的DNA在功能上相互作用,且其中所述切割结构域在嵌合的核酸酶结合后,切割特异性DNA切割位点内的DNA。还提供了包含多核苷酸的载体以及非人转基因生物。也提供了用于向非人生物的基因组中导入多核苷酸的方法。

Description

核酸酶融合蛋白及其用途
本发明涉及核酸酶融合蛋白及其多种用途。具体而言,涉及编码多肽的多核苷酸,所述多肽包含(i)第一模块,所述第一模块至少包含源自归巢内切核酸酶的第一DNA结合结构域,(ii)接头,和(iii)第二模块,所述第二模块至少包含源自限制性内切核酸酶的第二DNA结合结构域和切割结构域,其中所述多肽仅与包含第一DNA结合结构域的DNA识别位点和第二DNA结合结构域的DNA识别位点的DNA在功能上相互作用,且其中在多肽结合后,所述切割结构域在特异性DNA切割位点内切割DNA。本发明还考虑了包含所述多核苷酸的载体以及非人转基因生物,和由本发明的多核苷酸编码的多肽。最后,本发明涉及用于将目标核酸导入非人生物的基因组中的方法,其中应用本发明的多肽。
限制性内切核酸酶是DNA分子克隆的重要工具。这些酶是在特异性的识别和切割位点切割DNA必需的,从而允许可重复地生成确定的DNA片段。此外,可以组合由限制性内切核酸酶生成的所述确定的片段与其他DNA分子,特别是出于分子克隆的目的在连接反应中与载体组合。限制性内切核酸酶可如何用于分子克隆的原则是多年已知的。
过去已经表征了许多不同的原核生物中的许多限制性内切核酸酶。需要极少切割基因组DNA的限制性内切核酸酶,即,基因组中仅存在于有限数量的所述限制性内切核酸酶的DNA识别和切割位点。本领域已知存在极少切割的、天然存在的内切核酸酶。然而,在统计学上,绝大多数所述限制性内切核酸酶在基因组中切割超过1次。最近,生成了统计学上更少切割基因组,有时甚至只切割1次的人工酶。
现有技术中已经报道了这样的人工融合蛋白,所述融合蛋白包含用于DNA结合的锌指结构域和限制性内切核酸酶FokI的非特异性DNA切割结构域(Wah1998,Proc.Natl.Acad.Sci.USA95:10564-10569;WO2003/080809;WO2007/139898;WO2002/057294;WO2000/27878;WO1999/45132;WO2003/062455;WO2002/057293)。报道了转录激活子样效应子(TALE)而不是锌指结构域作为与Fokd的非特异性DNA切割结构域融合时的非常高特异性的核酸酶的合适的基础(Christian2010,Genetics186(2):757-U476)。
用于生成人工的、切点罕见大范围核酸酶(meganuclease)的其他方法基于归巢内切核酸酶,如LAGLIDADG归巢内切核酸酶,特别是I-CreI或I-SceI的(WO2009/076292;WO2007/047859;WO2008/152524;WO2008/102198;WO2008/093249;WO2007/034262;WO2003/078619;Doyon2006,J Am Chem Soc128:2477-2484)。还已经报道了包含归巢内切核酸酶(如I-SceI)和FokI的非特异性DNA切割结构域的人工融合蛋白(Lippow2009,核酸Res37(9):3061-3073)。
此外,已经报道了在体内促进同源重组和DNA片段其他整合进入基因组的切点罕见内切核酸酶(WO2003/080809;WO2000/46386;WO2009/006297;WO2006/074956;WO2006/134496;WO2007/148964;WO2009/130695)。相应的,可以使用这些酶生成多种类型的转基因生物。
因此,需要其他的切点罕见内切核酸酶,特别是在确定的DNA切割位点进行切割并生产可以被生物的内源性DNA修复系统识别和使用的合适的切割产物使得促进目标DNA整合到所述生物的基因组中的那些切点罕见内切核酸酶。
因此,本发明潜在的技术问题可被视为提供符合上述需求的工具和方法。通过权利要求和下文表征的实施方案解决了上述技术问题。
因此,本发明涉及编码多肽的多核苷酸,所述多肽包含:
(i)第一模块,所述第一模块至少包含源自归巢内切核酸酶的第一DNA结合结构域;
(ii)接头;和
(iii)第二模块,所述第而模块至少包含源自限制性内切核酸酶的第二DNA结合结构域和切割结构域;
其中所述多肽仅与包含第一DNA结合结构域的DNA识别位点和第二DNA结合结构域的DNA识别位点的DNA在功能上相互作用,且
其中在多肽结合后,所述切割结构域在特异性DNA切割位点内切割DNA。
术语“多核苷酸”在本文中用于指单链或双链DNA分子和RNA分子。所述术语涵盖了基因组DNA、cDNA、hnRNA、mRNA和这类分子的所有的天然存在的或人工修饰的衍生物。多核苷酸优选可以为线性或环状的分子。此外,除了编码上述多肽的核酸序列外,本发明的多核苷酸可包含正确的转录和/或翻译所需要的额外序列,如5’-或3'-UTR序列。
术语“第一模块”在本文中用于指由本发明的多核苷酸编码的多肽的第一结构和/或功能部分。所述第一模块优选至少包含第一DNA结合结构域,或至少基本上由第一DNA结合结构域组成。DNA结合在本文中用于指多肽或其结构域与DNA物理结合的能力。这样的多肽或其结构域是DNA结合结构域,或包含DNA结合结构域。DNA结合发生DNA分子内的确定的核苷酸序列处,在本文也称为DNA结合结构域的DNA识别位点。除第一DNA结合结构域外,第一模块还可以包含另外的结构域。这类另外的结构域优选可以是DNA结合结构域,或介导与调控蛋白或运输蛋白相互作用的其他结构域,例如,用于核运输调控蛋白的相互作用结构域。可理解,所述第一DNA结合结构域优选还可以包含在第一模块中作为完整的DNA结合蛋白,如天然存在的归巢内切核酸酶、遗传修饰的归巢内切核酸酶或这类归巢内切核酸酶与另一种DNA结合蛋白(例如锌指DNA结合蛋白或DNA结合转录因子)的人工融合蛋白。本文的其他地方描述了可根据本发明应用的优选的DNA结合结构域的细节。
优选地,所述第一模块表现出关于DNA切割的降低的催化活性或未表现出催化活性。优选地,可以通过测量由本发明的多核苷酸编码的多肽的第一模块和包含第一DNA结合结构域的相应的野生型归巢内切核酸酶引发的DNA切割,即,关于得到第一模块中的至少第一DNA结合结构域的归巢内切核酸酶的DNA切割活性的比较,确定根据本发明所述的降低的催化活性。在本发明上下文中使用的降低意指统计学显著程度的降低,优选降低至少70%、至少80%、至少90%、至少99%、至少99.9%、至少99.99%、至少99.999%或至少99.9999%。通过标准的统计学技术,本领域技术人员可以在不进行额外工作的条件下确定降低是否是统计学显著的。
术语“归巢内切核酸酶”在本文中用于指通常由内含子或内含肽编码的内切核酸酶。与转座子相似,天然存在的归巢内切核酸酶允许编码它们的遗传元件持续存在,因为它们通常切割受体生物的较少内含子或较少内含肽的等位基因DNA。归巢内切核酸酶的DNA识别位点足够长使得仅以非常低的可能性随机出现,优选大约每107bp一次至每109bp一次,或者甚至更低的可能性。优选地,与其他的内切核酸酶相反,归巢内切核酸酶的DNA结合结构域所识别的DNA识别位点由至少10、至少12、至少14、至少16、至少18、至少20、至少30或至少40个连续的核苷酸组成。优选地,所述识别位点是不对称的。切割较少内含子或较少等位基因的DNA后,活化细胞DNA修复系统,由此以反式供给含有内含子或内含肽的基因,即所谓的“归巢”过程。
存在5个不同的归巢内切核酸酶家族。归巢内切核酸酶LAGLIDADG家族的成员每者具有1个或2个LAGLIDADG基序每条多肽链。LAGLIDADG氨基酸序列是直接参与结构域-结构域和亚基-亚基相互作用和DNA切割过程的保守的序列。仅具有1个基序每条多肽链的那些酶充当同源二聚体,而具有2个基序的那些酶充当单体。归巢内切核酸酶的GIY-YIG家族的成员具有1个GIY-YIG基序作为与DNA结合基序相关的催化基序。该家族的蛋白水解酶是I-TevI。归巢内切核酸酶的His-Cys盒家族的成员含有30个氨基酸的序列段,包括2个保守的组氨酸和3个保守的半胱氨酸。I-PpoI是所述家族的成员,并且充当单体。归巢内切核酸酶的H-N-H家族的成员的特征是约30个氨基酸的共有序列,具有2对保守的组氨酸和1个天冬酰胺。所述保守的氨基酸形成α-β-β-α(αββα)金属指基序。归巢内切核酸酶的PD...D/EXK家族的特征是由侧翼为α螺旋的4链β片层组成的结构核心,所述α螺旋具有特征性的PD...D/EXK活性位点基序(参见例如Pingoud2005,Cell Mol Life Sci62(6):685-707)。
如上所述,根据本发明的第一DNA结合结构域是归巢内切核酸酶的DNA结合结构域。这类第一DNA结合结构域可源自的优选的归巢内切核酸酶选自:LAGLIDADG家族的归巢内切核酸酶、GIY-YIG家族归巢核酸酶、His-Cvs盒家族归巢内切核酸酶、H-N-H家族归巢内切核酸酶和PD...D/EXK家族归巢内切核酸酶。可用于得到待包括在由本发明的多核苷酸编码的多肽中的DNA结合结构域的所述归巢内切核酸酶家族的优选成员是F-CphI、F-EcoT5I、F-EcoT5II、F-EcoT5IV、F-PhiU5I、F-SceI、F-SceII、F-TevI、F-TevII、F-TevIII、F-TevIV、H-DreI、I-AniI、I-ApeKI、I-BanI、I-BasI、I-BmoI、I-BthII、I-BthORFAP、I-CeuI、I-ChuI、I-CmoeI、I-CpaI、I-CpaII、I-CreI、I-CreII、I-CsmI、I-CVuI、I-DdiI、I-DmoI、I-HmnI、I-HmuII、I-LIaI、I-LtrI、I-LtrWI、I-MsoI、I-NanI、I-NitI、I-NjaI、I-OnuI、1-PakI、I-PogI、I-PorI、I-PpoI、I-ScaI、I-SceI、I-SceII、I-SceIII、I-SceIV、I-SceV、I-SceVI、I-SceVII、I-SpomI、I-Ssp6803I、I-TevI、I-TcvII、I-TevIII、I-Tsp061I、I-TwoI、I-Vdi141I、PI-MgaI、PI-MleSI、PI-MtuI、PI-PabI、PI-PabII、PI-PfuI、PI-PfuII、PI-PkoI、PI-PkoII、PI-PspI、PI-ScaI、PI-SceI、PI-TfuI、PI-TfuII、PI-ThyI、PI-TIiI、PI-TliII、PI-TmaI、P1-TmaKI,和PI-ZbaI。
更优选地,所述包含在第一模块中的第一DNA结合结构域源自LAGLIDADG家族的归巢内切核酸酶。甚至更优选地,所述包含在第一模块中的第一DNA结合结构域源自I-SceI。最优选的,所述DNA结合结构域源自I-SceI或其变体,并包含至少一个下列修饰:单独的替换D44S,或其与D145A的组合,或替换D44N与D145A的组合。上述修饰的位置是针对野生型I-SeeI蛋白提出的。这些修饰使DNA切割所需的I-SceI的催化结构域失活,使得经修饰的I-SceI缺少切割DNA的能力或至少具有降低的DNA切割活性,而基本维持了DNA结合特性。可以理解,如果使用I-SceI蛋白的经修饰的变体,则上述氨基酸位置是可以改变的。但不论如何,可以设想来自这类变体的DNA结合结构域优选也在其氨基酸序列中的相应位置处包含至少1个修饰,这优选还导致DNA切割活性的缺失或降低。本领域技术人员可以在不付出额外劳动的条件下确定经修饰的变体的DNA切割活性,例如,通过使用后续实施例描述的测定法。I-SceI的氨基酸序列是本领域普遍已知的,并描述在例如Pingoud2005,见引文。此外,还描述了编码所述I-SceI氨基酸序列的核酸序列,并且考虑遗传密码的简并性,本领域技术人员可以在不付出额外劳动的条件下从氨基酸序列得出所述核酸序列。
在特别优选的实施方案中,所述I-SceI野生型序列具有如SEQ ID NO:1所示氨基酸序列或者是其变体,所述变体具有以至少1个氨基酸替换、缺失和/或添加不同于SEQ IDNO:1的氨基酸序列。
优选地,I-Scel的这类变体具有与SEQ ID NO:1至少70%、至少80%、至少90%、至少95%、至少98%或至少99%相同的氨基酸序列,并且优选地,包含与SEQ ID NO:1中所示I-SceI的DNA结合结构域具有基本相同的DNA结合活性的DNA结合结构域。优选地,通过分别比对氨基酸或核酸序列的全长或连续的氨基酸或核苷酸的序列段,确定本文使用的序列同一性。所述序列段是应比较的给定序列的参照序列的至少50%的长度。用于确定序列同一性百分比的优选的算法是已经整合到EMBOSS软件包(EMBOSS:The European MolecularBiology Open Software Suite.Rice 2000,Trends in Genetics16(6),276-277)的needle程序中的Needleman和Wunsch算法(Needleman1970,J.M01.Bi01.(,48):444-453),使用BLOSUM45或PAM250评分矩阵用于关系较远的蛋白质,或者使用BLOSUM62或PAM160评分矩阵用于更紧密相关的蛋白质,以及空位开放罚分为16、14、12、10、8、6或4,和空位延伸罚分为0.5、1、2、3、4、5或6。本地安装EMBOSS软件包的指导和与其网络服务器的连接可见于http://emboss.sourceforge.net。使用needle程序用于比对两条氨基酸序列的优选参数是默认参数,包括EBLOSUM62评分矩阵,空位开放罚分10,
空位延伸罚分0.5。还优选地,使用EMBOSS软件包的中的needle程序,确定两条核苷酸序列之间的百分比同一性,使用EDNAFULL评分矩阵,空位开放罚分为16、14、12、10、8、6或4,空位延伸罚分为0.5、l、2、3、4、5或6。与使用Needle程序比对两条核酸序列结合的待使用的另外的优选的参数是默认参数,包括EDNAFULL评分矩阵,空位开放罚分10,空位延伸罚分0.5。本发明的核酸和蛋白质序列还可用作“查询序列”,用于对公共数据库实施检索,以例如鉴别其他家族成员或相关序列。可使用Altschul等人(Altschul1990,J.M01.Bi01.215:403-10)的BLAST系列程序(2.2版),实施这类检索。
优选地,本文所述的I-Scel变体包括由这样的核酸编码的变体,所述核酸特异性地,并且优选在严谨条件下,与编码SEQ ID NO:1中所示氨基酸序列的核酸杂交。这些严谨条件是本领域技术人员已知的,可见于Current Protocols in Molecular Biology,JohnWiley&Sons,N.Y.(1989),6.3.1-6.3.6。优选的严谨杂交条件是在约45℃的6×氯化钠/柠檬酸钠(=SSC)中的杂交条件,随后在50至65℃的0.2×SSC,0.1%SDS中进行一次或两次洗涤步骤。本领域技术人员已知关于温度和缓冲液浓度这些杂交条件依赖于核酸类型和例如存在有机溶剂而不同。例如,在“标准杂交条件下”,浓度为0.1至5×SSC(pH7.2)的水性缓冲液的温度依赖于核酸类型在42℃至58℃之间改变。如果上述缓冲液中存在有机溶剂,例如50%甲酰胺,则标准条件的温度是约42℃。DNA:DNA杂交物的杂交条件优选是0.1×SSC和20℃至45℃,优选在30℃至45℃之间。DNA:RNA杂交物的杂交条件优选是0.1×SSC和30℃至55℃,优选在45℃至55℃之间。上述杂交温度是针对例如在缺乏甲酰胺的条件下,长度约100bp(=碱基对)的核酸和50%的G+C含量确定的。本领域技术人员通过查询教科书,如上述教科书或下列教科书:Sambrook等人,″Molecular Cloning”,Cold Spring HarborLaboratory,1989;Hames和Higgins(编著)1985,”Nucleic Acids Hybridization:APractical Approach”,IRL Press at Oxford University Press,Oxford;Brown(编著)1991,″Essential Molecular Biology:A Practical Approach”,IRL Press atOxfordUniversity Press,Oxford知晓如何确定需要的杂交条件。备选地,多核苷酸变体可通过基于PCR的技术获得,如基于混合的寡核苷酸引物的DNA扩增,即,使用针对本发明的多肽的保守结构域的简并引物。可以通过多核苷酸的核酸序列或本发明的多肽的氨基酸序列的序列比较,鉴别本发明的多肽的保守的结构域。所附实施例中描述了适合作为PCR引物的寡核苷酸以及合适的PCR条件。可使用来自酵母的DNA,优选来自酿酒酵母的DNA作为模板。
优选地,本发明也设想了缩短的l-SceI多肽,其不同于SEQ ID NO:l的或其上述变体,不同在于缺失了5至9个C-末端氨基酸,优选缺失了至少5、6、7、8或多达全部9个C-末端氨基酸。
术语“第二模块”在本文中用于指由本发明的多核苷酸编码的多肽的第二结构和/或功能部分。优选地,所述第二模块至少包含源自限制性内切核酸酶的第二DNA结合结构域和切割结构域,或至少基本上由源自限制性内切核酸酶的第二DNA结合结构域和切割结构域组成。本文所述的切割结构域能够在特异性DNA切割位点处切割DNA分子。根据本发明所述的特异性DNA切割位点指被切割结构域识别并在预先确定的核苷酸之间切割的位点。相反,一些内切核酸酶具有这样的切割结构域,所述切割结构域在某位置处切割DNA而不论该位置处存在的核苷酸。表现出这类非特异性切割的原型内切核酸酶是FokI。除第二DNA结合结构域和切割结构域外,第二模块还可以包含另外的结构域。这类另外的结构域优选可以是DNA结合结构域,以及介导两个第二模块之间的相互作用的结构域,或介导与调控蛋白或运输蛋白的相互作用的其他结构域,例如核运输调控蛋白的相互作用结构域。可理解,优选地,所述第二DNA结合结构域和/或切割结构域也可以包含在第二模块中作为完整的内切核酸酶蛋白,例如天然存在的限制性内切核酸酶或经遗传修饰的内切核酸酶。此外,已知限制性内切核酸酶,并且特别是所述II型限制性内切核酸酶作为同源二聚体结合DNA,只有非常少的例外。因此,本文所述的DNA结合结构域和切割结构域可以是两个限制性内切核酸酶亚基的同源二聚化的结果。优选地,特异性的DNA切割位点和所述限制性内切核酸酶的第二DNA结合结构域的DNA识别位点是相同的。还优选地,包含在第二模块中的所述第二DNA结合结构域和切割结构域源自这样的限制性内切核酸酶,所述限制性内切核酸酶当与野生型限制性内切核酸酶相比较时,表现出降低的DNA结合和/或降低的催化活性。本文其他地方描述了根据本发明应用的优选的DNA结合结构域的细节。还优选地,根据本发明设想的是在缺乏DNA识别位点的条件下,具有降低的形成同源二聚体的能力的第二模块。特别的是,在特别优选的实施方案中设想了仅当两个多肽单体被募集到相应的DNA识别位点时形成如上文所述多肽的功能性同源二聚体。由此,可以阻止由于形成同源二聚体产生的非特异性DNA结合,而同源二聚体的形成是1个单体与其相应的识别位点结合以及随后的单体之间的蛋白质-蛋白质相互作用而非特异性DNA结合导致的第二单体的二聚化的结果。
优选的内切核酸酶是IIp型限制性内切核酸酶(参见Pingoud2005,见上述引文处),从所述内切核酸酶可以得到包含在第二模块中的第二DNA结合结构域和DNA切割结构域。与前述归巢内切核酸酶相反,这类内切核酸酶的DNA结合结构域识别的DNA分子中的识别位点由至少4个,至少6或多至8个连续核苷酸组成。优选地,所述识别位点是回文的。此外,优选地,IIp型酶切割DNA识别位点中的DNA或与其直接相邻的DNA。所述DNA识别位点在基因组中是相当常见的。本文所述优选的IIp型限制性内切核酸酶选自PvuII、EcoRV、BamHI、BcnI、BfaSORF1835P、BfiI、Bg11、Bg11I、BpuJ1、Bse634I、BsoBI、BspD6I、BstYI、Cfr10I、Ecll8kI、EcoO1091、EcoR1、EcoRII、EcoRV、EcoR1241、EcoR12411、HinP1I、HincII、HindIII、Hpy99I、Hpy1881、MspI、MunI、MvaI、NaeI、NgoMIV、NotI、OkrAI、PabI、PacI、PspGI、PvuII、Sau3AI、SdaI、SfiI,SgrAI、ThaI、VvuYORF266P、DdeI,Eco57I、HaeIII,HhaII,HindII和NdeI。更优选地,所述IIp型限制性内切核酸酶或源自其的DNA结合和切割结构域经修饰,表现出没有或至少降低的星活性、关于其DNA识别位点的降低的DNA结合(Km)和/或切割结构域的降低的DNA切割活性(kcat)。更优选地,在一个实施方案中设想了II型限制性内切核酸酶或源自其的结构域在缺乏DNA识别位点的条件下,具有降低的形成同源二聚体的能力。可以通过例如随机突变和之后在存在和缺乏DNA识别位点条件下测试二聚化作用,获得用于该目的的合适的限制性内切核酸酶或其结构域。可以鉴别出仅在存在DNA识别位点时二聚化,而不在缺乏DNA识别位点时二聚化的那些变体并将所述变体用于由本发明多核苷酸编码的多肽。
最优选地,根据本发明设想的内切核酸酶是PvuII或其经遗传修饰的变体,因此,包含在第二模块中的所述第二DNA结合结构域和切割结构域源自PvuII。更优选地,包含在第二模块中的所述第二DNA结合结构域和切割结构域源自PvuII或其变体,并包含至少一个下列修饰:替换T46G、替换H83A、替换Y94F、替换T46G与H83A的组合、替换T46G与Y94F的组合,或替换T46G与H83A和Y94F的组合。上文所述修饰的位置是对于野生型PvuII蛋白标注的。然而可理解,如果使用PvuII蛋白的经修饰的变体,则这些位置将发生改变。不论如何,设想了来自这类变体的DNA结合结构域在其氨基酸序列中的相应位置处优选也包含至少一个修饰。PvuII的氨基酸序列是本领域普遍已知的,并描述在例如Athanasiadis1990,NucIeic acid Res18(21):6434中。此外,也已经描述了编码所述PvuII氨基酸序列的核酸序列,并且在考虑遗传密码的简并性时,本领域技术人员不付出额外劳动就可以从氨基酸序列得到所述核酸序列。
在特别优选的实施方案中,根据本发明所述的PvuII野生型序列具有如SEQ IDNO:2中所示氨基酸序列或其变体,所述变体具有以至少一个氨基酸替换、缺失和/或添加而不同于SEQ ID NO:2的氨基酸序列。
优选地,PvuII的这类变体具有与SEQ ID NO:2至少70%、至少80%、至少90%、至少95%、至少98%或至少99%相同的氨基酸序列,并且优选包含与具有SEQ ID NO:2的PvuII的DNA结合和切割结构域基本相同的DNA结合和切割特性的DNA结合结构域。本文其他地方详细描述了如何确定所述序列同一性。
优选地,本文所述的PvuII变体包括由这样的核酸编码的那些变体,所述核酸特异性地并且,优选在严谨条件下,与编码SEQ ID NO:2中所示氨基酸序列的核酸杂交。本文其他地方详细描述了优选的严谨杂交条件。可选的,多核苷酸变体可通过基于PCR的技术获得,如基于混合的寡核苷酸引物的DNA扩增,即,使用针对本发明的多肽的保守结构域的简并引物。可以通过本发明的多核苷酸的核酸序列或多肽的氨基酸序列的序列比较,鉴别本发明的多肽的保守结构域。所附实施例中描述了适合作为PCR引物的寡核苷酸以及合适的PCR条件。可使用来自细菌的DNA,并且优选普通变形杆菌(Proteus vulgaris)的DNA作为模板。
在由本发明的多核苷酸编码的多肽中,通过接头分隔第一模块和第二模块。所述接头优选是这样的灵活结构,所述结构具有的长度足以允许包含在模块中的DNA结合结构域与其DNA结合位点相互作用,并允许DNA切割结构域切割DNA。待用于由本发明的多核苷酸编码的多肽中的灵活的接头结构优选由5至20个,更优选6至10个或更多个氨基酸组成,即,至少6、至少7、至少8、至少9或l0或更多个氨基酸组成。优选地,所述接头具有如SEQ ID NO:3(ASRTTG)或SEO ID NO:4(ASTKQLVKSG)中所示氨基酸序列。可选地,接头可具有如SEQ IDNO:5(ASGGSGSGSG)或SEQ ID NO:6中(ASGDSGSDSG)的氨基酸序列。
由本发明的多核苷酸编码的多肽应该仅与包含第一DNA结合结构域的DNA识别位点和第二DNA结合结构域的DNA识别位点的DNA在功能上相互作用。因此,第一DNA结合结构域或第二DNA结合结构域优选都不应该足以允许由本发明的多核苷酸编码的多肽与DNA在功能上相互作用。在功能上相互作用在本文中用于指与DNA结合位点的特异性DNA结合,使切割结构域可以在结合后在其特异性的DNA切割位点处切割。为了有功能,根据本发明的多肽将形成包含两条多肽的同源二聚体,具有本发明的多肽的结构。两条多肽的第二模块在物理上彼此相互作用。然后,第二模块能够结合二聚体化形式中的第二DNA识别位点。因此,处于其二聚体化的功能性形式的本发明的多肽识别三重DNA识别位点,所述三重DNA识别位点包含第二DNA结合结构域的识别位点,在所述第二DNA结合结构域的识别位点的5’和3’端的侧翼为第一DNA结合结构域的识别位点。在与所述三重DNA识别位点特异结合后,多肽应该通过其DNA切割结构域在所述特异性切割位点内或与其相邻处切割DNA。优选地,所述切割位点和第二DNA结合位点是相同的。因此,根据本发明的多肽在切割位点内或与其相邻的定义的核苷酸处切割DNA。
本发明的多核苷酸优选编码这样的多肽,所述多肽包含(i)至少包含DNA结合结构域的第一模块,所述DNA结合结构域源自I-SceI,并且优选地,源自上述I-SceI的失活变体的(ii)具有SEQ ID NO:3或4的接头;和(iii)至少包含第二DNA结合结构域和切割结构域的第二模块,所述第二DNA结合结构域和切割结构域源自PvuII,并且优选地,源自上述PvuII变体,其中DNA结合和切割结构域经修饰以表现出没有或至少降低的星活性、具有关于其DNA识别位点的降低的DNA结合和/或表现出切割结构域的降低的DNA切割。由这类多核苷酸编码的多肽应该仅与包含I-SceI的第一DNA结合结构域的DNA识别位点和源自PvuII的第二DNA结合结构域的DNA识别位点的DNA在功能上相互作用。由于为了形成活性酶,PvuII将形成同源二聚体,因此可理解多肽识别的DNA结合位点是包含PvuII DNA结合位点的三重DNA结合位点,在所述PvuII DNA结合位点的5’和3’端侧翼是I-SceI DNA结合位点(I-SceI DNA识别位点-PvuII DNA识别位点-I-SceI DNA识别位点)。此外,多肽在结合后将在特异性DNA切割位点内,即,在PvuII结合位点的确定的位置和核苷酸处切割DNA。
更优选地,编码这类多肽的本发明的多核苷酸包含如SEQ ID NO:7或8中任一项所示的核酸序列,或编码包含如SEQ ID NO:9或10中任一项所示氨基酸序列的多肽的核酸序列。本发明也涵盖了这样的变体多核苷酸,所述变体具有不同于SEQ ID NO:7或8的核酸序列,或编码以至少1个核苷酸或氨基酸的替换、缺失和/或添加不同于SEQ ID NO:9或10的氨基酸序列。优选地,这类变体具有与SEQ ID NO:7或8至少70%、至少80%、至少90%、至少95%、至少98%或至少99%相同的核酸序列,或与SEQ ID NO:9或10至少70%、至少80%、至少90%、至少95%、至少98%或至少99%相同的氨基酸序列。这类变体优选包含上述第一和第二模块以及接头。本文其他地方详细描述了如何确定所述序列同一性。还优选地,本文所述的变体包括由核酸编码的那些变体,所述核酸特异性地,并且优选在严谨条件下,与编码SEQ ID NO:7或8所示氨基酸序列的核酸或与编码如SEQ ID NO:9或10中所示氨基酸序列的核酸杂交。再次,这类变体优选地包含上述第一和第二模块以及接头的结构特征。
有利地,本发明提供了编码这样的多肽的多核苷酸,所述多肽能够特异性识别人工组成的三重DNA识别序列,并能够在特异性DNA切割位点内,即,在预先确定的核苷酸之间的确定的位置处切割包含这类三重DNA识别序列的DNA。由于三重DNA识别序列是相当大的序列,因此假设在天然存在的基因组中仅罕见的出现。优选地,所述三重DNA识别位点在统计学上出现少于1次每个基因组。其结果是,根据本发明的多肽应该仅罕见地切割基因组,并且优选地,切割1次,即,在三重DNA识别位点处。因而,多肽可以协助异源DNA(如转基因)整合在基因组DNA内的某个基因座处,其在发生整合后可以轻易地鉴别。此外,也可以协助同源重组事件。由于本发明的缘故,将显著改善了转基因生物,如转基因微生物、转基因植物或转基因动物的生成。然而,本发明的多肽还可用作单纯的DNA切割工具,即,作为特异性针对上述人工三重DNA识别位点的切点罕见内切核酸酶。这类切点罕见内切核酸酶理所当然可用于所有的常规克隆方法。本发明的多核苷酸编码这样的多肽,所述多肽相比锌指核酸酶或TALe核酸酶、以及所谓的人工大范围核酸酶具有改良的特异性,因其识别上述延伸的三重DNA识别位点。此外,还发现平末端切割物(如PvuII)可用于生成本发明的多肽。这多少是令人惊讶的,因为之前报道过通过平末端切割内切核酸酶(如PvuII)向基因组DNA中导入的平末端对于一些生物的修复系统可能是较差底物(Westmoreland2010,DNA Repair9:617-626)。
关于上述术语的解释和定义经必要修正后适用于本发明的下列实施方案。
本发明还涉及包含本发明的多核苷酸的载体。
在本文中使用的术语“载体”涵盖了噬菌体、质粒、病毒或逆转录病毒载体,以及人工染色体,如细菌或酵母人工染色体。涵盖了本发明的多核苷酸的载体优选还包含用于在宿主中增殖和/或选择的可选择标志物。可以通过常规转化或转染技术将载体导入到原核和真核细胞中。术语“转化”和“转染”、接合和转导在本上下文中意在包括现有技术已知的多种用于将外源核酸(例如DNA)导入宿主细胞中的方法,包括磷酸钙或氯化钙共沉淀、DEAE-葡聚糖介导的转染、脂质体转染、天然感受态、化学介导的转移、电穿孔或颗粒轰击。用于宿主细胞(包括植物细胞)的转化或转染的合适方法可见于Sambrook等人(MolecularCloning:A Laboratory Manual.,第2版,Cold Spring Harbor Laboratory,Cold SpringHarbor Laboratory Press,Cold Spring Harbor,NY,1989)和其他实验室教科书,如Methods in Molecular Biology,1995,第44卷,Agrobacterium protocols,编著:Gartland和Davey,Humana Press,Totowa,New Jersey。可选地,可以通过热休克或电穿孔技术导入质粒载体。如果载体是病毒,其可以在应用于宿主细胞之前,使用恰当的包装细胞系在体外包装。逆转录载体可以是复制感受态或复制缺陷型。在后一情况下,病毒增殖一般仅发生在感受态宿主细胞中。
合适的克隆载体一般是熟练的技术人员已知的。特别地,其包括可以在微生物系统中复制的载体。这些载体优选确保在细菌、酵母或真菌中的有效克隆。
优选地,在本发明的载体中,多核苷酸与允许在原核或真核宿主细胞或其分离的级分中表达的表达控制序列有效连接。因此,本发明的载体优选是表达载体。多核苷酸的表达包含多核苷酸转录为可翻译的mRNA。确保在宿主细胞中表达的调控元件是本领域普遍已知的。优选地其包含确保转录起始的调控序列和/或确保转录终止和稳定转录物的多聚A信号。额外的调控元件可包括转录和翻译增强子。允许在原核宿主细胞中表达的可能的调控元件包含,例如大肠杆菌中的lac-、trp-或tac-启动子,并且允许在真核宿主细胞中表达的调控元件的例子是酵母中的AOX1-或GAL1-启动子或哺乳动物和其他动物细胞中的CMV-、SV40-、RSV-启动子(劳斯氏肉瘤病毒)、CMV-增强子、SV40-增强子或球蛋白内含子。此外,可诱导的表达控制序列可用于本发明涵盖的表达载体中。这类可诱导的载体可包含tet或lac操纵子序列或受热激或其他环境因素可诱导的序列。合适的表达控制序列是本领域普遍已知的。除了负责转录起始的元件外,此类调控元件还可包含在多核苷酸的下游的转录终止信号,如SV40-多聚A位点或tk-多聚A位点。
优选地,原核生物中的蛋白质表达优选涉及使用包含组成型或诱导型启动子的载体,所述启动子控制融合蛋白或非融合蛋白的表达。典型的融合表达载体尤其是pGEX(GEHealthcare,Piscataway,NJ;Smith1988,Gene67:31-40)、pMAL(New England Biolabs,Ipswich,MA)和pRIT5(GE Healthcare,Piscataway,NJ),其中谷胱甘肽S转移酶(GST)、麦芽糖-E-结合蛋白和蛋白分别与重组靶蛋白融合。合适的诱导型非融合大肠杆菌表达载体的例子尤其是pTrc(Amann1988,Gene69:301-315)和pET11d(Studier等人,Gene ExpressionTechnology:Methods in Enzymology185,Academic Press,San Diego,California(1990)60-89)。pTrc载体的靶基因表达是基于宿主RNA聚合酶对杂交体trp-lac融合启动子的转录的。载体pET11d的靶基因表达是基于由共表达的病毒RNA聚合酶(T7gn1)介导的T7-gn10-1ac融合启动子的转录的。由宿主菌株BL21(DE3)或HMS174(DE3)从常驻的λ-原噬菌体提供此病毒聚合酶,所述λ-原噬菌体具有处于lacUV5启动子的转录控制下的T7gn1基因。适用于原核生物的其他载体是本领域技术人员已知的,这些载体是例如在大肠杆菌中pLG338、pACYC184、pBR系例如pBR322、pUC系歹如pUC18或pUC19、M113mp系歹、pKC30、pRep4、pHS1、pHS2、pPLc236、pMBL24、pLG200、pUR290、piN-II1113-B1、λgt11或pBdCI;在链霉菌中piJ101、piJ364、pIJ702或pIJ361;在芽孢杆菌中pUB110、pC194或pBD214;棒状杆菌中的pSA77或pAJ667。
本文还优选涵盖了酵母表达载体。用于在酿酒酵母中表达的载体例子包含pYeDesaturasec1(Baldari1987,EMBO J6:229-234)、pMFa(Kurjan1982,Cell30:933-943)、pJRY88(Schultz1987,Gene54:113-123)和pYES2(Invitrogen Corporation,San Diego,CA)。载体和用于构建适用于其他真菌(如丝状真菌)的载体的方法包括详细描述在:vanden Hondel,C.A.M.J.J.,&Punt,P.J.(1991)“Gene transfer systems and vectordevelopment for filamentous fungi,in:Applied Molecular Genetics of fungi,J.F.Peberdy等人编著,第1-28页,Cambridge University Press:Cambridge,或在:MoreGene Manipulations in Fungi[J.W.Bennet&L.L.Lasure,编著,第396-428页:AcademicPress:San Diego1中的那些。另外的合适的酵母载体是例如pAG-1、YEp6、YEp13或pEMBLYe23。
作为备选,还可以使用杆状病毒表达载体,在昆虫细胞中表达根据本发明的多核苷酸。可用于在培养的昆虫细胞(例如Sf9细胞)中表达蛋白质的杆状病毒载体包含pAc系列(Smith1983,Mo1.Cell Bio1..3:2156-2165)和pVL系列(Lucldow1989,Virology170:31-39)。
优选也被本发明涵盖的用于真核细胞的合适的表达载体是本领域已知的,如Okayama-Berg c1)NA表达载体pcDV1(Pharmacia)、pBluescript(Stratagene)、pCDM8、pRc/CMV、pcDNA1、pcDNA3(Invitrogen)或pSPORT1(Invitrogen)。表达载体还可以源自病毒,如逆转录病毒、痘病毒、腺相关病毒、肝炎病毒或牛乳头瘤病毒,可用于将本发明的多核苷酸或载体递送到靶细胞群中。可使用本领域技术人员普遍已知的方法构建重组病毒载体;参见例如Sambrook,Molecular Cloning A Laboratory Manual Cold Spring HarborLaboratory(1989)N.Y.和Ausubel,Current Protocols in Molecular Biology.GreenPublishing Associates and Wiley Interscience,N.Y.(1994)中描述的技术。
优选的植物表达载体包含详细描述在:Becker1992,Plant Mol.Biol.20:1195-1197;和Bevan1984,Nucl.Acids Res.12:8711-8721;Vectors for Gene Transfer inHigher Plants;在:Transgenic Plants,第1卷,Engineering and Utilization,编著:Kung和R.Wu,Academic Press,1993,第15-38页中。植物表达盒优选包含表达控制序列,所述表达控制序列能够控制植物细胞中的基因表达且有效连接使得每条序列都可以实现它的功能,如转录终止,例如,多聚腺苷酸信号。优选的多聚腺苷酸信号是那些源自根癌农杆菌(Agrobacterium tumefaciens)T-DNA,如已知是章鱼碱合酶的Ti质粒pTiACH5的基因3(Gielen1984,EMBO J.3:835ff)的那些多聚腺苷酸信号,或其功能等价物,但在植物中有功能活性的所有其他终止子也是合适的。由于植物基因表达非常经常不受限于转录水平,植物表达盒优选包含有效连接的其他序列,如翻译增强子,例如超驱动序列,所述超驱动序列包含烟草花叶病毒5’-非翻译前导序列,增加蛋白质/RNA比例(Gallie1987,Nucl.AcidsResearch15:8693-8711)。如上所述,植物基因表达必须与合适的启动子有效连接,所述启动子以正确的定时或以细胞-或组织-特异性的方式触发基因表达。可利用的启动子是组成型启动子(Benfey1989,EMBO J.8:2195-2202),如源自植物病毒的启动子,如35S CAMV(Franck1980,Cell21:285-294)、19S CaMV(还参见US5352605和WO84/02913),或植物启动子,如描述在US4,962,028中的二磷酸核酮糖羧化酶小亚基的启动子。在植物基因表达盒中用于有效连接的其他优选的序列是将基因产物引导至其相应的细胞区室中所需要的靶向序列(参见综述Kermode1996,Crit.Rev.Plant Sci.15,4:285-423及其中引用的参考文献),例如引导到液泡、细胞核、所有类型的质体(如淀粉粒、叶绿体、有色体)、胞外空间、线粒体、内质网、油体、过氧化物酶体和植物细胞的其他区室中所需要的。
还可以通过化学诱导型启动子协助基因表达(参见Gatz1997,Annu.Rev.PlantPhysio1.Plant Mo1.Bio1.,48:89-108中的综述)。当需要基因表达以时间特异性的方式发生时,化学诱导型启动子是特别合适的。这类启动子的例子是水杨酸诱导型启动子(WO95/19443)、四环素诱导型启动子(Gatz1992,Plant J.2,397-404)和乙醇诱导型启动子。
本发明考虑了包含本发明的多核苷酸或载体的非人生物。
术语“非人生物”在本文中涉及除人以外的任何生物。因此,非人生物优选是微生物、植物、植物部分或其分离的细胞,或动物、动物组织或其分离的细胞。此外,真核或细菌宿主细胞也被涵盖在非人生物中。非人生物可包含本发明的多核苷酸或本发明的载体,用于DNA增殖的目的以及表达根据本发明的多肽的目的以及上述两种目的。多核苷酸或载体可以以整合到宿主基因组中的形式存在,或以附加体的形式存在。下文描述了根据本发明的另外的优选的非人生物。
优选的微生物是原核和真核微生物,并且特别地选自细菌、真菌、酵母或来自任一种下述非人动物或植物的细胞培养物细胞。
优选的非人动物包括哺乳动物、鸟类、爬行类、鱼类、线虫和昆虫。更优选地,非人动物是哺乳动物,并且特别是大鼠、小鼠、兔、狗、猫或农场动物,如猪、马、羊或奶牛。
优选的植物选自以下植物科:Adelotheciaceae、漆树科(Anacardiaceae)、菊科(Asteraceae)、伞形科(Apiaceae)、桦木科(Betulaceae)、紫草科(Boraginaceae)、十字花科(Brassicacae)、凤梨科(Bromeliaceae)、番木瓜科(Caricaceae)、大麻科(Cannabaceae)、旋花科(Convolvulaceae)、藜科(Chenopodiaceae)、隐甲藻科(Crypthecodiniaceae)、葫芦科(Cucurbitaceae)、牛毛藓科(Ditrichaceae)、胡颓子科(Elaeagnaceae)、杜鹃花科(Ericaceae)、大戟科(Euphorbiaceae)、豆科(Fabaceae)、牻牛儿科(Geraniaceae)、禾本科(Gramineae)、胡桃科(Juglandaceae)、樟科(Lauraceae)、豆科(Leguminosae)、亚麻科(Linaceae)、真绿藻纲(Prasinophyceae)或蔬菜植物、或观赏植物,如万寿菊(Tagetes)。可提及的例子是下列植物,选自:Adelotheciaceae,例如剑叶藓属(,Physcomitrella);漆树科(Anacardiaceae),例如黄连木属(Pistacia)、芒果属(Mangifera)、腰果属(Anacardium);菊科(Asteraceae),例如金盖花属(Calendula)、红花属(Carthamus)、矢车菊属(Centaurea)、菊苣属(Cichorium)、菜蓟属(Cynara)、向日葵属(Helianthus)、莴苣属(Lactuca)、Locusta、万寿菊属(Tagetes)、缬草属(Valeriana);伞形科(Apiaceae),例如胡萝卜属(Daucus);桦木科(Betulaceae),例如榛属(Corylus);紫草科(Boraginaceae),例如琉璃苣属(Borago);十字花科(Brassicaceae),例如芸薹属(Brassica)、Melanosinapis、白芥属(Sinapis)、拟南芥属(Arabadopsis);凤梨科(Bromeliaceae),例如凤梨属(Ananas)、凤梨科植物(Bromelia);番木瓜科(Caricaceae),例如番木瓜属(Carica);大麻科(Cannabaceae),例如大麻属(Cannabis);旋花科(Convolvulaceae),例如甘薯属(Ipomea)、旋花属(Convolvulus);藜科(Chenopodiaceae),例如甜菜属(Beta);隐甲藻科(Crypthecodiniaceae),例如隐甲藻属(Crypthecodinium);葫芦科(Cucurbitaceae),例如南瓜属(Cucurbita);桥弯藻科(Cymbellaceae),例如双眉藻属(Amphora)、桥弯藻属(Cymbella)、Okedenia、褐指藻属(Phaeodactylum)、瑞氏藻属(Reimeria);牛毛藓科(Ditrichaceae),如牛毛藓科(Ditrichaceae)、高地藓属(Astomiopsis)、角齿藓属(Ceratodon)、Chrysoblastella、牛毛藓属(Ditrichum)、对叶藓属(Distichium)、Eccremidium、Lophidion、Philibertiella、丛毛藓属(Pleuridium)、石缝藓属(Saelania)、毛齿藓属(Trichodon)、Skottsbergia;胡颓子科(Elaeagnaceae),如胡颓子属(Elaeagnus);杜鹃花科(Ericaceae),如山月桂属(Kalmia);大戟科(Euphorbiaceae),如木薯属(Manihot)、Janipha、麻风树属(Jatropha)、蓖麻属(Ricinus);豆科(Fabaceae),如豌豆属(Pisum)、合欢属(Albizia)、Cathormion、Feuillea、音加属(Inga)、围涎树属(Pithecolobium)、金合欢属(Acacia)、含羞草属(Mimosa)、苜蓿属(Medicago)、大豆属(Glycine)、扁豆属(Dolichos)、菜豆属(Phaseolus)、大豆属(Soja);葫芦藓秫Funariaceae),如Aphanorrhegma,Entosthodon,葫芦藓属(Funaria),剑叶藓属(Physcomitrella),立碗藓属(Physcomitrium);牻牛儿科(Geraniaceae),如天竺葵属(Pelargonium)、椰子属(Cocos)、Oleum;禾本科(Gramineae),如甘蔗属(Saccharum);胡桃科(Juglandaceae),如胡桃属(Juglans)、Wallia;樟科(Lauraceae),如鳄梨属(Persea)、月桂属(Laurus);豆科(Leguminosae),如落花生属(Arachis);亚麻科(Linaceae),如亚麻属(Linum)、Adenolinum;Lythrarieae,如石榴属(Punica);锦葵科(Malvaceae),如棉属(Gossypium);地钱科(Marchantiaceae),如地钱属(Marchantia);芭蕉科(Musaceae),如芭蕉属(Musa);柳叶菜科(Onagraceae),如Camissonia、月见草属(Oenothera);棕榈科(Palmae),如Elacis;罂粟科(Papaveraceae),如罂粟属(Papaver);胡麻科(Pedaliaceae),如胡麻属(Sesamum);胡椒科(Piperaceae),如胡椒属(Piper)、Artanthe、草胡椒属(Peperomia)、Steffensia;禾本科(Poaceae),如大麦属(Hordeum)、黑麦属(Secale)、燕麦属(Avena)、高梁属(Sorghum)、须芒草属(Andropogon)、域毛草属(Holcus)、黍属(Panicum)、稻属(Oryza)、玉蜀黍属(Zea(玉米))、小麦属(Triticum);紫球藻科(Porphyridiaceae),如Chroothece、Flintiella、Petrovanella、紫球藻属(Porphyridium)、红球藻属(Rhodella)、Rhodosorus、Vanhoeffenia;山龙眼科(Proteaceae),如澳洲坚果属(Macadamia);真绿藻纲(Prasinophyceae),如肾藻属(Nephroselmis)、Prasinococcus、Scherffelia、扁藻属(Tetraselmis)、Mantoniella、Ostreococcus;茜草科(Rubiaceae),如咖啡属(Coffea);玄参科(Scrophulariaceae),如毛蕊花属(Verbascum);茄科(Solanaceae),如辣椒属(Capsicum)、烟草属(Nicotiana)、茄属(Solanum)、番茄属(Lycopersicon);梧桐科(Sterculiaceae),如可可属(Theobroma);或山茶科(Theaceae),如山茶属(Camellia)。
更优选地,植物选自植物科:菊科、十字花科、藜科、大戟科、禾本科、豆科和锦葵科。
尤其优选的是例如以下属和种:欧洲油菜(Brassica napus)、芜菁亚种(Brassicarapa ssp.)、野欧白芥(Sinapis arvensis)、芥菜(Brassica j uncea)、芥菜芥菜变种(Brassica juncea vaF.juncea)、芥菜皱叶变种(Brassica juncea var.crispifolia)、芥菜大叶变种(Brassica juncea var.foliosa)、黑芥(Brassica nigra)、Brassicasinapioides、芥菜(Melanosinapis communis)、野甘蓝(Brassica oleracea)、拟南芥(Arabidopsis thaliana)、甜菜(Beta vulgaris)、Beta vulgaris var.altissima、甜菜普通变种(Beta vulgaris var.Vulgaris)、Beta maritima、甜菜宿根变种(Beta vulgarisvar.perennis)、Beta vulgaris var.conditiva或Beta vulgaris var.esculenta、三角褐指藻(Phaeodactylum tricornutum)、豌豆(Pisum sativum)、饲料豌豆(Pisum arvense)、Pisum humile、Albizia berteriana、合欢(Albizia iulibrissin)、阔荚合欢(Albizialebbeck)、Acacia berteriana、Acacia littoralis、Albizia berteriana、Albizziaberteriana、Cathormion berteriana、Feuillea berteriana、Inga fragrans、Pithecellobium berterianum、Pithecellobium fragrans、Pithecolobium berterianum、Pseudalbizzia berteriana、Acacia julibrissin、Acacia nemu、Albizia nemu、Feuilleea j ulibrissin、Mimosa julibrissin、Mimosa speciosa、Sericanrdajulibrissin、阔荚金合欢(Acacia lebbeck)、Acacia macrophylla,大叶合欢(Albizialebbeck)、Feuilleea lebbeck、大叶含羞草(Mimosa lcbbeck)、木棉树(Mimosaspeciosa)、紫花苜蓿(Medicago sativa)、野苜蓿(Medicago falcata)、杂交苜蓿(Medicago varia)、大豆(Glycine max)、镰扁豆(Dolichos soja)、宽叶蔓豆(Glycinegracilis)、大豆(Glycine hispida)、大菜豆(Phaseolus max)、Soja hispida或大豆(Sojamax)、大麦(Hordeum vulgare)、芒颖大麦草(Hordeum jubatum)、鼠大麦草(Hordeum murinum)、短芒大麦草(Hordeum secalinum)、栽培二棱大麦(Hordeum distichon)、Hordeumaegiceras、六列大麦(Hordeum hcxastichon)、六棱大麦(Hordeum hexastichum)、不规则大麦(Hordeum irregulare)、大麦(Hordeum sativum)、短芒大麦草(Hordeum secalinum)、黑麦(Secale cereale)、燕麦(Avena sativa)、野燕麦(Avena fatua)、地中海红燕麦(Avena byzantina)、Avena fatua var.sativa、杂种燕麦(Avena hybrida)、二色高粱(Sorghum bicolor)、石茅高梁(Sorghum halepense)、甜高粱(Sorghum saccharatum)、高粱(Sorghum vulgare)、Andropogon drummondii、二色域毛草(Holcus bicolor)、Holcussorghum、Sorghum aethiopicum、Sorghum arundinaceum、Sorghum caffrorum、垂穗高梁草(Sorghum cernuum)、工艺高梁(Sorghum dochna)、Sorghum drummondii、硬高梁草(Sorghum durra)、Sorghum guineense、Sorghum lanceolatum、多脉高梁草(Sorghumnervosum)、甜高粱(Sorghum saccharatum)、Sorghum subglabrescens、垂叶高梁草(Sorghum verticilliflorum)、高梁(Sorghum vulgate)、石茅高梁(Holcus halepensis)、Sorghum miliaceum、黍粟(Panicum militaceum)、稻(Oryza sativa)、Oryza latifolia、玉蜀黍(Zea mays)、小麦(Triticum aestivum)、硬粒小麦(Triticum durum)、圆柱小麦(Triticum turgidum)、Triticum hybernum、马卡小麦(Triticum macha)、普通小麦(Triticum sativum)或小麦(Triticum vulgare)、辣椒(Capsicum annuum)、Capsicumannuum var.glabriusculum、五色椒(Capsicum frutescens)、辣椒(Capsicum annuum)、烟草(Nicotiana tabacum)、花烟草(Nicotiana alata)、长头烟草(Nicotiana attenuata)、光烟草(Nicotiana glauca),郎氏烟草(Nicotiana langsdorffii),Nicotianaobtusifolia,裂叶烟草(Nicotiana quadrivalvis),浅波烟草(Nicotiana repanda)、黄花烟草(Nicotiana rustica)、美花烟草(Nicotiana sylvestris),马铃薯(Solanumtuberosum)、茄子(Solanum melongena)、番茄(Lycopersicon esculentum)、Lycopersiconlycopersicu m、梨形番茄(Lycopersicon pyriforme)、红茄(Solanum integrifolium)或番茄(Solanum lycopersicum)。
最优选的植物物种是欧洲油菜(Brassica napus)、芜菁(Brassica rapa)、野甘蓝(Brassica oleracea)、甜菜(Beta vulgaris)、紫花苜蓿(Medicago sativa)、大豆(Glycine max)、镰扁豆(Dolichos soia)、大麦(Hordeum vulgate)、黑麦(Secalecereale)、燕麦(Avena sativa)、二色高粱(Sorghum bicolor)、石茅高梁(Sorghumhalepense)、甜高粱(Sorghum saccharatum)、高粱(Sorghum vulgare)、Panicummilitaceum、稻(Oryza sativa)、玉蜀黍(Zea mays)、小麦(Triticum aestivum)、硬粒小麦(Triticum durum)、马铃薯(Solanum tuberosum)、番茄(Lycopersicon esculentum)和陆地棉(Gossypium hirsutum)。
可以通过本说明书的其他地方的转化技术获得转基因植物。优选地,可以通过TDNA-介导的转化获得转基因植物。作为规律,这类载体系统的特征在于其至少含有农杆菌介导的转化所需的vir基因,和划定T-DNA界限(T-DNA边界)的序列。本说明书的其他地方详细的描述了合适的载体。
用作根据本发明的非人转基因生物的优选的藓类是剑叶藓属(Physcomitrella)或角齿藓属(Ceratodon)。用作根据本发明的非人转基因生物的优选的藻类是等鞭金藻属(Isochrysis)、Mantoniella、Ostreococcus或隐甲藻属、藻类/硅藻类如褐指藻属(Phaeodactylum)或破囊壶菌属(Thraustochytrium)。
本发明涉及由本发明的多核苷酸编码的多肽。
本文使用的术语“多肽”涵盖了分离的或基本纯化的多肽,所述多肽基本不合其它组分。然而,术语还涵盖了包含本发明多肽或此外其他蛋白质的多肽制品。本文使用的多肽可以是化学修饰的多肽。所述修饰可以是人工修饰或天然存在的修饰。本发明的多肽应该具有上述活性。可以通过本领域技术人员普遍已知的化学合成或重组分子生物学技术生产。优选地,这类生产本发明的多肽的方法包括(a)培养本文其他地方更加详细描述的本发明的宿主细胞,(b)从所述宿主细胞获得本发明的多肽。在该方法的方面,可以通过常规的纯化技术,从宿主细胞的裂解液中获得多肽,所述纯化技术包括亲和层析、离子交换层析、大小排阻层析、疏水性相互作用层析和/或制备性的凝胶电泳。关于生产和测试所需活性的细节也可见于下文所附实施例中。
如本文其他地方所示,本发明的多肽可用于多种遗传改造方法中。因此,本发明尤其考虑了本发明的多肽在非人生物中,并且优选在微生物或植物中用于将目标异源核酸整合到靶核酸分子中,优选整合到基因组靶DNA(例如染色体)中的用途。还考虑了本发明的多肽在非人生物,优选微生物或植物中用于促进目标异源核酸整合到靶核酸分子中,优选整合到基因组靶DNA(例如染色体)中的用途。优选地,目标核酸的整合将发生在靶核酸分子中的三重DNA识别位点的位点处。因此,本发明的多肽优选可用于靶向的转基因(基因插入)、基因敲除方法(基因失活)、或同源替代、或敲入方法(基因替代)。特别的是,本发明的多肽还可用于从基因组中去除或失活目标核酸,例如用于在进行所述选择后去除用于选择转基因非人生物的标志物基因。此外,本发明的多肽通过允许在预先确定的基因座处的靶向的转基因,允许控制待整合的转基因的整合位点和拷贝数。
本发明涵盖了用于向非人生物的基因组中导入目标核酸的方法,包括:
a)将待导入到所述生物的基因组中的目标核酸导入到非人生物中;
b)在所述生物中表达本发明的多肽;和
c)在允许所述多肽切割基因组和允许目标核酸导入到基因组中的条件下培养所述生物。
在本发明的方法中,将如本文其他地方所述应该整合到非人生物的基因组中的目标核酸导入到所述生物中。可以通过多种本文其他地方更详细所述的多种转染或转化技术,实现目标核酸的导入。本文所述的目标核酸涵盖了应该被非人生物表达的核酸,如编码蛋白质或RNA的核酸,并设想了所述核酸的生产,或应该用于破裂基因组中的基因的核酸,或应该出于任何其他原因整合到生物基因组中的核酸。
根据本发明方法的非人生物应该表达本发明的多肽。这优选可以通过生成转基因非人生物来实现,所述转基因非人生物包含了稳定或瞬时整合的可表达形式的本发明多核苷酸的转基因。为此,优选可以将多核苷酸包含在表达载体中,优选是上述本发明的表达载体中而转化或转染到生物中。此外,待应用于本发明方法的转基因非人生物选自微生物、植物、植物部分或其分离的细胞、或动物组织、或其分离的细胞,并且最优选地,是本文其他地方明确指出的本发明的非人转基因生物之一。
可理解在待在本发明的方法中使用的非人转基因生物中,本发明的多肽以生物学活性的形式存在,即,能够结合三重DNA识别位点并能够在其DNA切割位点内结合之后切割DNA。可以通过在允许所述DNA结合和切割的条件下,培养非人转基因生物一段时间,来实现本发明的多核苷酸对DNA的结合和切割。此外,应该在允许将目标核酸整合到切割过的基因组DNA中的条件下,培养非人生物。本领域技术人员可以在不付出额外劳动的条件下应用合适的条件,并且在绝大多数情况下,目标核酸的整合是内源DNA修复过程的结果或受内源DNA修复过程的促进,该过程是由非人生物的基因组中的本发明多肽引起的DNA切割触发的。允许DNA结合和切割的优选条件更详细地描述在下文所附实施例中,或可以源自WO2003/080809、WO2000/46386、WO2009/006297、WO2006/074956、WO2006/134496、WO2007/148964和/或WO2009/130695的任一篇。
最后,本发明涉及包含本发明多肽的三重DNA识别位点的核酸分子。
优选地,所述核酸分子是例如由载体包含的用于整合到基因组中的目标核酸。可选地,所述核酸分子可以包含在上述目标核酸将要整合进的基因组中。包含在上述核酸分子中的三重DNA识别位点优选是这样的DNA识别位点,其包含第一DNA结合结构域的识别位点连接的第二DNA结合结构域的识别位点连接的第一DNA结合结构域的识别位点。
在优选的实施方案中,包含本发明多肽的三重DNA识别位点的核酸分子按5,至3,的方向包含:
i.归巢内切核酸酶的DNA识别位点,
ii.第一核酸接头,
iii.限制性内切核酸酶的DNA识别位点,
iv.第二核酸接头,和
v.归巢内切核酸酶的DNA识别位点的反向互补序列。
本文其他地方描述了优选的归巢内切核酸酶以及优选的限制性内切核酸酶。优选地,(i)和(v)中的归巢内切核酸酶是LAGLIDADG家族的归巢内切核酸酶或其变体。更优选是I-SceI归巢内切核酸酶或其变体。优选地,(v)中的限制性内切核酸酶是IIp型限制性内切核酸酶。最优选是PvuII。
因此,在另外的优选的实施方案中,包含三重DNA识别位点的核酸分子按5’至3’的方向包括:
i.I-SceI的DNA识别位点,
ii.第一核酸接头,
iii.PvuII的DNA识别位点,
iv.第二核酸接头,和
vi.1-SceI的DNA识别位点的反向互补序列。
SEQ ID NO:11的第1至18位碱基代表了优选的I-SceI的DNA识别位点。SEQ ID NO:11的第37至54位碱基代表了优选的I-SceI的DNA识别位点的反向互补序列。SEQ ID NO:11的第25至30位碱基代表了PvuII的DNA识别位点(cagctg)。
已知归巢内切核酸酶(包括I-SceI)可以耐受其识别位点的核苷酸序列的小偏差(简并),然而所述小偏差能够被特定的归巢内切核酸酶识别和切割。因此,本文也包括了在一个或两个归巢内切核酸酶识别位点中包含1、2、3或4个核苷酸改变的三重DNA识别位点。
所述识别位点应该通过包含多个核苷酸的核酸接头序列(如ii.和iv.中所示出)连接,所述接头序列的长度足以允许本发明多肽的同源二聚体的特异性结合。核酸接头的长度取决于本发明多肽的大小,特别是本发明多肽中的接头长度。优选地,核酸接头涵盖了1至20个核苷酸的长度,更优选4至8个核苷酸,甚至更优选5至7个核苷酸,并且最优选6个核苷酸的长度。接头核酸的核苷酸可以彼此相同或不同。但是优选地,接头核酸不干扰或影响同源二聚体的DNA结合。可以通过普遍已知的技术确定核酸接头是否影响或干扰DNA结合。
在一个实施方案中,三重DNA识别位点包含以下核酸序列:
a)SEQ ID NO:11、12或13所述核酸序列,
b)与SEQ ID NO:11、12或13所述核酸序列相差1、2、3或4个碱基的核酸序列,这些差异位于SEQ ID NO:11、12或13所述序列的第1至18位碱基,
c)与SEQ ID NO:11、12或13所述核酸序列相差1、2、3或4个碱基的核酸序列,这些差异位于SEQ ID NO:11、12或13所述序列的第37至54位碱基,
d)与SEQ ID NO:11、12或13所述核酸序列相差2、3、4、5、6、7或8个碱基的核酸序列,这些差异位于SEQ ID NO:11、12或13所述序列的第37至54位碱基,但在第1至18位具有不多于4个有差异的碱基,且在第37至54位具有不多于4个有差异的碱基。
优选地,三重DNA识别位点包含如SEQ ID NO:11、12或13中所述核酸序列。
有利地,本发明提供了不应在基因组中内源性存在的人工三重DNA识别位点。因此,在由于DNA重组技术(例如同源重组)而在某些理想位置携带所述三重DNA识别位点的非人生物中,可以更精确地控制异源DNA的整合。
因此,根据本发明尤其考虑了包含本发明的多肽的三重DNA识别位点的核酸分子在非人生物,并且优选微生物或植物中用于整合到靶核酸分子中,优选整合到基因组靶DNA(如染色体)中的用途。因此,本发明还涉及包含核酸分子的非人生物,所述核酸分子包含三重DNA识别位点。优选地,核酸分子还将控制核酸分子在靶核酸分子中的整合。因此,本发明的所述核酸分子可优选地用于靶向的转基因(基因插入)、基因敲除方法(基因失活)或同源替代或敲入(knock-in)方法(基因替代)。特别地,核酸分子还可用于从基因组中移除或失活目标核酸,如用于在已进行所述选择后去除用于选择转基因非人生物的标志物基因。此外,核酸分子允许在包含所述核酸分子的预先确定的基因座处的靶向的转基因,因而控制待整合的转基因的整合位点和拷贝数。
可理解,本发明因此还考虑了包含上述核酸分子的载体,以及包含所述核酸分子的非人生物。
此外,所述核酸分子优选应用于本发明的方法中,且除三重DNA识别位点外,还包含待整合到基因组中的目标核酸。
对上述载体、非人生物和方法作出的定义和解释是经过必要修正后适用的。
本发明还涉及包含核酸分子的非人生物,所述核酸分子包含上述三重DNA识别位点和编码本发明多肽的多核苷酸。优选地,所述生物是微生物、植物或动物。优选地,用所述核酸分子和/或编码本发明多肽的所述多核苷酸转化植物。
说明书全文引用的所有参考文献都通过关于上述特定的公开内容和关于全文公开内容以引用的方式整合到本文中。
附图
图1显示了在开始孵育后的不同时间点,确定本发明多肽的L(6)(SEQID NO:9)变体的切割产物的琼脂糖凝胶分析。动力学分析揭示了即使在消化21小时后,在非特异性位点也没有切割。
图2显示了用于确定多种不同浓度的本发明多肽的L(6)(SEQ ID NO:9)和L(+)(SEQ11)NO:10)变体的切割产物的琼脂糖凝胶分析。酶滴度揭示了对于L(6)变体仅在酶比DNA过量8-32x摩尔的浓度,才出现非特异性切割。
图3显示了在存在或缺乏噬茵体入竞争DNA的条件下,用于确定本发明多肽的L(6)(SEQ ID NO:9)和L(+)(SEQ ID NO:10)变体的切割产物的琼脂糖凝胶分析。切割的发生独立于噬菌体入DNA的存在。
图4显示了电泳迁移率移动分析(EMSA)。(A)融合蛋白L(6)结合三重DNA识别位点I-SceI-PvuII-I-SceI;(b)和(C)仅在I-SceI DNA识别位点(B)或PvuII DNA识别位点(C)处,不发生结合。
图5显示了融合蛋白活性的体内分析。用编码PvuII的同伴甲基转移酶的质粒转化大肠杆菌细胞。共转化编码野生型PvuII、L(6)融合蛋白或L(+)融合蛋白的质粒。在缺乏甲基转移酶的条件下,融合蛋白显示了存活的克隆,证实融合蛋白不攻击未甲基化的(即,未保护的)PvuII位点。
图6显示了用于确定L(6)(SEQ ID NO:9)和L(+)(SEQ ID NO:10)融合蛋白的缩短的变体的活性的琼脂糖凝胶分析。未观察到任何差异。
所附序列表中显示了此处所述的下列序列:
SEQ ID NO:1:I-SceI的氨基酸序列;
SEQ ID NO:2:PvuII的氨基酸序列;
SEQ ID NO:3:接头ASRTTG
SEQ ID NO:4:接头ASTKQLVKSG
SEQ ID NO:5:接头ASGGSGSGSG
SEQ ID NO:6:接头ASGDSGSDSG
SEQ ID NO:7:编码融合蛋白P(T46G,Y94F)-L(6)-Ss*的核酸序列;
SEQ ID NO:8:编码融合蛋白P(T46G,Y94F)-L(+)-Ss*的核酸序列;
SEQ ID No:9:融合蛋白P(T46G,Y94F)-L(6)-Ss*的氨基酸序列;
SEQ ID NO:10:融合蛋白P(T46G,Y94F)-L(+)-Ss*的氨基酸序列;
SEQ ID NO:1\:上述融合蛋白的三重DNA识别位点的核酸序列:
TAGGGATAACAGGGTAATGGTACTCAGCTGATTCATATTACCCTGTTATCCCTA。
SEQ ID NO:12:上述融合蛋白的三重DNA识别位点的核酸序列:
TAGGGATAACAGGGTAATATGAATCAGCTGAGTACCATTACCCTGTTATCCCTA
SEQ ID No:13:上述融合蛋白的三重DNA识别位点的核酸序列:
TAGGGATAACAGGGTAATNNNNNNCAGCTGNNNNNNATTACCCTGTTATCCCTA,
其中n可以是A、T、C或G
实施例
下列实施例示例了本发明,但无论如何不应被视为对发明范围的限制。
实施例1:I-SceI和PvuII的不同的融合蛋白的克隆
通过经PvuII的C-末端将PvuII与I-SceI的催化失活变体的N-末端融合,生成PvuII-I-SceI融合酶(Gruen2002,Nucleic Acids Res;30(7):e29.),所述I-SceI的催化失活变体在C-末端截短(与共结晶结构对应,Moure2003,J.Mo1.Bi01.334(4)685-95)。为此,将编码PvuII的基因通过其C-末端His6-标签与编码I-SceI(D44s)ΔC9的基因相连接,并克隆到编码C-末端Strep-标签的载体pASK-IBA63b-plus(IBA)中。为了进一步改良,根据Lippow2009,Nucleic Acids Res37(9):3061-3073,通过基于PCR的定向诱变(Kirsch1998,Nucleic Acids Res.26(7)1848-50),突变I-SceI的2个活性位点残基(D44和D145)。获得的变体之后被称为S*(I-SceI_D44N,D145A)和Ss*(I-SceIAC9_D44N,D145A)。以与对于融合酶相同的方式,对PvuII的某些残基实施诱变。为了在PvuII和I-SceI的基因之间具有类似接头区结构的构件,在这两个基因之间导入3个限制性酶位点(NheI、BsiWI、AgeI)而非His6-tag(L(H)),获得L(6)(SEQ ID No:3)。通过用NheI和AgeI切割获得的载体,可以将具有互补末端的接头L(N)(SEQ ID NO:5)、L(SEQ ID NO:4)和L(-)(SEQ ID NO:6)克隆到这些位点中。
实施例2:不同融合蛋白的功能表征
在优化的KG缓冲液(100mM谷氨酸钾、25mM Tris-醋酸、0.8mM Mg-醋酸、100mMKCI、500DM2-巯基乙醇、10ytg/mI BSA)中,用8nM 融合酶(SEQ ID NO:9)的L(6)变体孵育8nM含有三重位点(S6P6S)和额外的无地址的(unaddressed)PvuII位点的线性化的质粒DNA。该缓冲液也用于所有其他实验。在某时间点后,取出切割反应的样品,通过添加装载缓冲液终止反应,并在琼脂糖凝胶上分析。结果显示在图1中。
在优化的KG缓冲液中,用范围从4-256nM的融合酶孵育8nM含有定址(addressed)位点和额外的无地址PvuII位点(S6P6S_P;A)的线性化的质粒DNA,或仅含有PvuII位点(B)的超螺旋的质粒DNA过夜(~16h)。在0.8%琼脂糖凝胶上分析反应。结果显示在图2中。
在优化的KG缓冲液中,在存在或缺乏含有15PvuII位点的940pMλ-DNA的条件下,用8nM融合酶37℃孵育8nM线性化质粒DNA(S6P6S_P)3h。在0.8%琼脂糖凝胶上分析反应。结果显示在图3
为了确定融合酶的结合常数,用放射性标记的PCR片段进行EMSA。使用[α32p]dATP,通过PCR生成迁移片段。一个片段含有定址位点(S6P6S;A)、仅I-SceI位点(S;B)或仅PvuII位点(P;C)。在不含镁的优化的KG缓冲液中,用浓度范围从1-150nM的融合酶室温孵育2nM放射标记的底物30min。在添加1μl87%甘油后,将样品装载到6%聚丙烯酰胺Tris-醋酸(pH8.5)凝胶上,并在10V/cm运行2h。使用InstantImager系统(Packard)将条带可视化。结果显示在图4中。
用50ng编码PvuII_wt或融合酶之一的质粒转化具有或不具有编码M.PvuII的质粒的电感受态大肠杆菌细胞。将50μl转化混合物散布在含有相应抗生素的琼脂平板上,并在37℃孵育过夜。结果显示在图5中。
在优化的KG缓冲液中,用8nM具有ΔC9I-SceI(SEQ ID9&10)的融合酶或具有全长I-SceI的融合酶在37℃孵育8nM线性化的质粒DNA(S6P6S_P)1h。在0.8%琼脂糖凝胶上分析反应。结果显示在图6中。

Claims (13)

1.编码多肽的多核苷酸,所述多肽由以下组成:
(i)第一模块,所述第一模块由至少源自I-SceI的第一DNA结合结构域组成,其中第一模块由以下组成:
(a)SEQ ID NO:1的氨基酸序列,或
(b)携带一个以下改变的SEQ ID NO:1的氨基酸序列:(1)替换D44S;(2)替换D44S与D145A的组合;(3)替换D44N与D145A的组合;或(4)缺失5至9个C-末端氨基酸;(5)替换D44S与缺失5至9个C-末端氨基酸的组合;(6)替换D44S与D145A、缺失5至9个C-末端氨基酸的组合;或(7)替换D44N与D145A、缺失5至9个C-末端氨基酸的组合;
(ii)接头;和
(iii)第二模块,所述第二模块由至少源自PvuII的第二DNA结合结构域和切割结构域组成,其中第二模块由以下组成:
(a)SEQ ID NO:2的氨基酸序列,或
(b)携带一个以下改变的SEQ ID NO:2的氨基酸序列:(1)替换T46G;(2)替换H83A;(3)替换Y94F;(4)替换T46G与H83A的组合;(5)替换T46G与Y94F的组合;或(6)替换T46G与H83A和Y94F的组合;
其中所述多肽仅与这样的DNA在功能上相互作用,所述DNA包含第一DNA结合结构域的DNA识别位点、第二DNA结合结构域的DNA识别位点和所述第一DNA结合结构域的DNA识别位点的反向互补序列,且
其中在多肽结合后,所述切割结构域在特异性DNA切割位点内切割DNA,且
其中对于功能上相互作用,所述多肽形成包含两个多肽单体的同源二聚体。
2.权利要求1的多核苷酸,其中所述第一模块表现出降低的催化活性,或不表现出催化活性。
3.权利要求1或2的多核苷酸,其中所述接头由6至10个氨基酸组成。
4.权利要求3的多核苷酸,其中所述接头由如SEQ ID NO:3(ASRTTG)或SEQ ID NO:4(ASTKQLVKSG)中所示的氨基酸序列组成。
5.权利要求1的多核苷酸,其中所述多肽是SEQ ID NO:9或10。
6.核酸分子,其按5’至3’方向由以下组成:
i.I-SceI的DNA识别位点,
ii.第一核酸接头,所述接头包含在SEQ ID NO:11、12或13中,
iii.PvuII的DNA识别位点,
iv.第二核酸接头,所述接头包含在SEQ ID NO:11、12或13中,和
v.I-SceI的DNA识别位点的反向互补序列。
7.权利要求6的核酸分子,其中所述核酸分子是SEQ ID NO:11、12或13中所示核酸序列。
8.载体,其包含权利要求1至5中任一项的多核苷酸或权利要求6或7的核酸分子。
9.非人生物,其包含权利要求1至5中任一项的多核苷酸或权利要求6或7的核酸分子或权利要求8的载体,其中所述非人生物选自由微生物、非繁殖的分离的植物细胞、或动物组织或其分离的细胞组成的组。
10.非人生物,其包含权利要求1或2的多核苷酸和权利要求6或7的核酸分子,其中所述非人生物选自由微生物、非繁殖的分离的植物细胞、或动物组织或其分离的细胞组成的组。
11.由权利要求1至5中任一项的多核苷酸编码的多肽。
12.用于将目标核酸导入到非人生物基因组中的方法,所述方法包括:
a)将待导入到所述生物的基因组中的目标核酸导入到非人生物中,
b)在所述生物中表达权利要求11的多肽;和
c)在允许所述多肽切割基因组和允许目标核酸导入到基因组中的条件下培养所述生物,
其中所述生物的基因组包含权利要求6或7中所述的核酸分子。
13.权利要求12的方法,其中所述非人转基因生物选自由微生物、植物、植物部分或其分离的细胞、或动物组织或其分离的细胞组成的组。
CN201280028627.7A 2011-06-10 2012-06-08 核酸酶融合蛋白及其用途 Expired - Fee Related CN103620027B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201161495410P 2011-06-10 2011-06-10
EP11169567 2011-06-10
US61/495,410 2011-06-10
EP11169567.2 2011-06-10
PCT/IB2012/052898 WO2012168910A1 (en) 2011-06-10 2012-06-08 Nuclease fusion protein and uses thereof

Publications (2)

Publication Number Publication Date
CN103620027A CN103620027A (zh) 2014-03-05
CN103620027B true CN103620027B (zh) 2017-11-21

Family

ID=44351501

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280028627.7A Expired - Fee Related CN103620027B (zh) 2011-06-10 2012-06-08 核酸酶融合蛋白及其用途

Country Status (5)

Country Link
US (1) US9758796B2 (zh)
EP (1) EP2718432A4 (zh)
CN (1) CN103620027B (zh)
BR (1) BR112013030652A2 (zh)
WO (1) WO2012168910A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104513814A (zh) * 2014-11-18 2015-04-15 李云英 I-TevIN201-Cas9null融合蛋白及其应用
WO2016196850A1 (en) * 2015-06-02 2016-12-08 Patil Vishal A Methods for nucleic acid identification
MA46717A (fr) 2016-10-11 2019-09-11 Bluebird Bio Inc Variantes de l'endonucléase homing tcra
US20210147818A1 (en) 2017-05-25 2021-05-20 Bluebird Bio, Inc. Cblb endonuclease variants, compositions, and methods of use
WO2019241685A1 (en) 2018-06-14 2019-12-19 Bluebird Bio, Inc. Cd79a chimeric antigen receptors
WO2020072059A1 (en) 2018-10-04 2020-04-09 Bluebird Bio, Inc. Cblb endonuclease variants, compositions, and methods of use
CN111518794B (zh) * 2020-04-13 2023-05-16 中山大学 基于激活诱导性胞苷脱氨酶的诱导突变蛋白的制备和用途

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011064751A1 (en) * 2009-11-27 2011-06-03 Basf Plant Science Company Gmbh Chimeric endonucleases and uses thereof

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0714349B2 (ja) 1983-01-17 1995-02-22 モンサント カンパニ− 植物細胞での発現に適したキメラ遺伝子
US5352605A (en) 1983-01-17 1994-10-04 Monsanto Company Chimeric genes for transforming plant cells using viral promoters
US4962028A (en) 1986-07-09 1990-10-09 Dna Plant Technology Corporation Plant promotors
US5614395A (en) 1988-03-08 1997-03-25 Ciba-Geigy Corporation Chemically regulatable and anti-pathogenic DNA sequences and uses thereof
GB9824544D0 (en) 1998-11-09 1999-01-06 Medical Res Council Screening system
JP4309051B2 (ja) 1998-03-02 2009-08-05 マサチューセッツ インスティテュート オブ テクノロジー 改善したリンカーを有するポリジンクフィンガータンパク質
JP2002535995A (ja) 1999-02-03 2002-10-29 ザ チルドレンズ メディカル センター コーポレイション 染色体標的部位での二本鎖dna切断の誘導を含む遺伝子修復
ATE355368T1 (de) * 2000-01-24 2006-03-15 Gendaq Ltd Nucleinsäure bindende polypeptide gekennzeichnet durch flexible linker verbundene nucleinsäuredomäne
US20030082561A1 (en) 2000-07-21 2003-05-01 Takashi Sera Zinc finger domain recognition code and uses thereof
DK1353941T3 (da) 2001-01-22 2013-06-17 Sangamo Biosciences Inc Modificerede zinkfingerbindingsproteiner
CA2479153C (en) 2002-03-15 2015-06-02 Cellectis Hybrid and single chain meganucleases and use thereof
ATE531796T1 (de) 2002-03-21 2011-11-15 Sangamo Biosciences Inc Verfahren und zusammensetzungen zur verwendung von zinkfinger-endonukleasen zur verbesserung der homologen rekombination
EP2806025B1 (en) 2002-09-05 2019-04-03 California Institute of Technology Use of zinc finger nucleases to stimulate gene targeting
WO2004031346A2 (en) * 2002-09-06 2004-04-15 Fred Hutchinson Cancer Research Center Methods and compositions concerning designed highly-specific nucleic acid binding proteins
WO2006074956A1 (en) 2005-01-14 2006-07-20 Bayer Bioscience N.V. Improved plant transformation methods
WO2007034262A1 (en) 2005-09-19 2007-03-29 Cellectis Heterodimeric meganucleases and use thereof
EP1734125A1 (en) 2005-06-16 2006-12-20 Institut National De La Recherche Agronomique Homeologous recombination in MSH2 inactivated plants or cells thereof
EP2484758B1 (en) 2005-10-18 2013-10-02 Precision Biosciences Rationally-designed meganucleases with altered sequence specificity and DNA-binding affinity
EP2213731B1 (en) 2006-05-25 2013-12-04 Sangamo BioSciences, Inc. Variant foki cleavage half-domains
EP1870471A1 (en) 2006-06-22 2007-12-26 Universiteit Leiden Method for generation of mutants in Plants
WO2008093152A1 (en) 2007-02-01 2008-08-07 Cellectis Obligate heterodimer meganucleases and uses thereof
CN101679959A (zh) 2007-02-19 2010-03-24 赛莱克蒂斯公司 具有新的底物特异性的laglidadg归巢核酸内切酶变体及其用途
EP2155868A2 (en) * 2007-04-19 2010-02-24 Codon Devices, Inc Engineered nucleases and their uses for nucleic acid assembly
WO2008152524A2 (en) 2007-06-06 2008-12-18 Cellectis Method for enhancing the cleavage activity of i-crei derived meganucleases
US8912392B2 (en) 2007-06-29 2014-12-16 Pioneer Hi-Bred International, Inc. Methods for altering the genome of a monocot plant cell
JP2011505809A (ja) 2007-12-07 2011-03-03 プレシジョン バイオサイエンシズ,インク. ヒトゲノムのDNase高感受性領域に見出される認識配列を有する合理的に設計されたメガヌクレアーゼ
US8791324B2 (en) 2008-04-21 2014-07-29 Danziger Innovations Ltd. Plant viral expression vectors and use of same for generating genotypic variations in plant genomes
DE102009033253A1 (de) 2009-07-14 2011-02-17 Caspar Cloer Gmbh & Co. Kg Maschine zum Zubereiten von Heißgetränken

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011064751A1 (en) * 2009-11-27 2011-06-03 Basf Plant Science Company Gmbh Chimeric endonucleases and uses thereof

Also Published As

Publication number Publication date
WO2012168910A1 (en) 2012-12-13
BR112013030652A2 (pt) 2016-12-13
US9758796B2 (en) 2017-09-12
US20140208457A1 (en) 2014-07-24
CN103620027A (zh) 2014-03-05
EP2718432A1 (en) 2014-04-16
EP2718432A4 (en) 2015-01-07

Similar Documents

Publication Publication Date Title
CN103620027B (zh) 核酸酶融合蛋白及其用途
US9428757B2 (en) Regulatory nucleic acid molecules for enhancing seed-specific gene expression in plants promoting enhanced polyunsaturated fatty acid synthesis
AU2009265795B2 (en) Promoters from Brassica napus for seed specific gene expression
CN101589148B (zh) 产量提高的植物
US20100263088A1 (en) Promoters From Brassica Napus For Seed Specific Gene Expression
JP2021184744A (ja) Pufa生成のための材料及び方法並びにpufa含有組成物
AU2009253939B2 (en) Fatty acid dehydratases and uses thereof
US20110252504A1 (en) Promoter From Z. Mais
CA2488697C (en) Regulation of gene expression using chromatin remodelling factors
AU2002305014A1 (en) A repressor-mediated regulation system for control of gene expression in plants
AU2013201738B2 (en) Regulatory nucleic acid molecules for enhancing seed-specific gene expression in plants promoting enhanced polyunsaturated fatty acid synthesis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20171121

Termination date: 20200608