CN110914414A - 利用设计dna重组酶遗传改变基因组的方法与手段 - Google Patents

利用设计dna重组酶遗传改变基因组的方法与手段 Download PDF

Info

Publication number
CN110914414A
CN110914414A CN201880039699.9A CN201880039699A CN110914414A CN 110914414 A CN110914414 A CN 110914414A CN 201880039699 A CN201880039699 A CN 201880039699A CN 110914414 A CN110914414 A CN 110914414A
Authority
CN
China
Prior art keywords
sequence
leu
arg
ala
site
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880039699.9A
Other languages
English (en)
Inventor
F·布赫霍尔茨
M·施奈德
F·兰辛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Technische Universitaet Dresden
Original Assignee
Technische Universitaet Dresden
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Technische Universitaet Dresden filed Critical Technische Universitaet Dresden
Publication of CN110914414A publication Critical patent/CN110914414A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1058Directional evolution of libraries, e.g. evolution of libraries is achieved by mutagenesis and screening or selection of mixed population of organisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1241Nucleotidyltransferases (2.7.7)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Ecology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Mycology (AREA)
  • Cell Biology (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明提供了用于特异性改变基因组中DNA序列的方法与装置,特别是用于通过缺失或置换感兴趣序列进行基因组编辑的方法与装置。有利地,本发明使用天然存在于基因组中的两个不相同序列作为产生DNA重组酶的两个靶位点。本发明特别适用于医学,特别是修复基因组中的突变或者从细胞或组织中缺失预定义遗传物质并且治疗疾病。本发明的一个优点是实现了DNA的精确位点定向改变,而不涉及宿主DNA修复途径,从而在不诱导随机插入和缺失(indels)的情况下工作。

Description

利用设计DNA重组酶遗传改变基因组的方法与手段
本发明提供了用于特异性改变基因组中DNA序列的方法与装置。提供了用于生成设计(designer)DNA重组酶的载体和方法。本发明可用于医学,特别是修复基因组中的突变或者从细胞或组织中缺失预定义遗传物质并且治疗疾病。进一步地,本发明可用于生物和生物医学研究(例如,创建动物模型)。
在过去的几十年里,已经鉴别出许多导致人类疾病的遗传突变。现在,基因组编辑领域中的最新突破提供了一个建立创新方法以修复DNA损伤以便在体外或体内置换、工程化或再生出现故障的细胞的真正机会。
然而,大多数最近研发的基因组编辑技术,诸如锌指核酸酶(例如US20150093802A1)、TALEN(例如WO2014134412 A1)和CRISPR/Cas9(例如US 8,697,359 B1)在靶位点处引入双链DNA断裂作为基因校正的第一步。随后,通过一种细胞内在DNA修复机制来修复这些断裂,通常在靶位点处诱导大量随机插入和缺失(indels)。然而,理想情况下,治疗性基因组编辑技术应该是高效且特异性的,不会引入indels。
DNA重组酶(特别是位点特异性重组酶(SSR)系统)在不触发内源DNA修复途径的情况下实现对DNA的精确操纵,并且具有在体内完成已处理DNA的裂解和立即重新密封(resealing)的独特能力。此外,SSR系统(诸如Cre/loxP(EP 0 2200 009 B1))已经在模式生物中得到广泛应用,表明SSR体系即使在动物中终生表达时也是安全的。SSR在其靶位点上以四聚体工作,并且根据这些位点的定向,重组可以导致多种结果。众所周知,为了获得新的位点特异性重组酶,可以对Cre的氨基酸序列进行修饰(Buchholz F和Stewart AF2001)。
本领域中公知的其它SSR系统包括Flp/FRT系统(WO 1999025841 A1和US 6,774,279 B2)、Dre/rox系统(US 7,422,889 B2和US 7,915,037 B2)、VCre/VloxP系统和sCre/SloxP系统(WO 2010/143606 A1)以及Vika/vox、Nigri/nox和Panto/pox系统(WO 2014/016248 A1)。
天然存在的DNA重组酶特别是位点特异性重组酶(SSR)系统(如酪氨酸型SSR),通常由四个相同单体组成。通常,它们识别两个相同且对称的回文靶位点,每个靶位点由两个长度为13个核苷酸的半位点组成,这两个半位点由长度通常为8个核苷酸的不对称间隔区隔开。根据靶位点的数量和相对定向,DNA重组酶会引起遗传材料的缺失、插入、倒位或置换。
在治疗性基因组编辑技术中使用DNA重组酶的瓶颈是它们能够重组的序列的数量有限。
在WO2008083931A1中,通过定制重组酶(Tre 1.0)的定向分子进化,在某种程度上解决了这种限制,定制重组酶使用HIV的长末端重复序列(LTR)中的序列作为识别位点(loxLTR Tre 1.0)。在WO2011147590 A2(Tre 3.0)和WO2016034553 A1(Tre 3.1和uTre/Bred)以及公开文献Karpinski J等人2016(Brec1)中描述了这种使用不对称靶位点的方法的进一步发展。然而,在所有情况下,这种方法的使用受到限制,因为长度为34个碱基对的精确识别位点必须在基因组中(诸如在整合HI原病毒的LTR中)出现两次,系统才能工作。
WO2009007982A1描述了位于HIV-1的LTR中的核酸序列作为DNA重组酶的潜在靶位点。
US2009/0217400 A1描述了用于在不对称loxP-M7靶位点处重组的酶和方法。进一步地,Zhang,C等人(2015)和US 20170058297 A1描述了识别不对称loxP-M7靶位点的两个Cre突变体的专性异源四聚体复合体。然而,这些识别位点必须人工引入基因组中。
US 20040003435 A1描述了一种用于将感兴趣的序列靶向插入植物的方法,所述方法包含引入转移盒,该转移盒包含侧翼为不相同的识别位点或包含不相同的识别位点的所述感兴趣的核苷酸序列,这些识别位点是仍可以被野生型FLP重组酶识别的修饰FRT位点。
综合来说,现有技术中公知的重组酶系统的应用受到以下事实的限制:两个识别位点必须人工引入基因组中,或者基因组中感兴趣的序列必须在侧翼有长度为34个碱基对的两个相同序列。
因此,目前简单的基因编辑方法依赖于可编程核酸酶,诸如RNA引导性核酸酶,如CRISPR/Cas9(例如US 8,657,359 B1),因为这些酶对靶位点的特异性是由导向RNA限定的,这可以是适应于感兴趣序列的多功能性。
然而,由于核酸酶系统需要细胞内在DNA修复机制,所以它们通常在靶位点处诱导大量随机插入和缺失(indels)。
理想的基因编辑或基因治疗会用正常等位基因置换缺陷基因或者缺失在其自然位置处的缺陷基因,而无需对基因组进行进一步修饰。因此,理想的基因组编辑技术应该是高效且特异性的,不会引入indels。
因此,本发明的一个目的是提供一种改变基因组中核苷酸序列的方法,该方法克服了核酸酶基因编辑方法的缺点且同时是多功能的,能适用于感兴趣的序列。
本发明基于如下发现:在基因组中很少发现长度为34个碱基对(DNA重组酶的常见靶位点的长度)的两个相同序列。
本发明始于发明人的以下认识:实现设计DNA重组酶的切除重组的唯一限制是间隔序列的保守性,长度通常为8bp(参见图17作为示例)。因为如果要发生重组,该序列必须是相同的,所以为可以重组的序列设置了约束条件。然而,不同基因组的生物信息学分析显示了,在病毒、原核和真核基因组(包括人类基因组)中经常出现8bp长度的同向重复(参见图18和图19作为示例)。
基于这一发现,本发明人认识到,通过基因组中进化为靶向不同靶位点的DNA重组酶的不同单体的组合,在不涉及细胞修复途径的情况下使精确的基因组编辑成为可能。因此,可以生成经由定向进化、合理设计或其组合产生的DNA重组酶的单体组合,以几乎重组基因组中任何感兴趣的序列。在重组会导致序列缺失的情况下,在基因组中需要长度约为8个碱基对的两个相同序列作为间隔序列。然而,在重组会导致序列置换的情况下,优选地,间隔序列在基因组中是不相同的——在这种情况下,相同的间隔序列具有期望序列(供体DNA),该期望序列会置换人工序列上的感兴趣序列。
通过组合不同DNA重组酶的单体,本发明克服了已知DNA重组酶关于靶位点方面的局限性,使得它们能够重组并提供可用于基因编辑的设计DNA重组酶,这些设计DNA重组酶可以识别天然存在于基因组中的靶序列。
在本发明的第一方面,本发明提供了设计DNA重组酶以及制备该设计DNA重组酶的方法,该设计DNA重组酶能够通过重组基因组中(优选地,天然)存在的两个不相同的靶序列来诱导位点特异性DNA重组以改变基因组中的核苷酸序列。
有利地,根据本发明的设计DNA重组酶不需要人工引入基因组中的靶位点,并且还不需要存在长度超过8个核苷酸(特别是不超过34个核苷酸)的相同序列,如长末端重复序列(LTR)。
在本发明的上下文中,不相同的靶序列是指靶位点在至少两个核苷酸处不同。有利地,靶位点可以有更大差异,特别是在至少三个核苷酸处不同。在本发明的实施方案中,靶位点在至少四个核苷酸或甚至八个核苷酸处不同。有利地,靶位点中至少20%或甚至更优选30%的核苷酸以及高达70%或甚至高达90%的核苷酸可以不同,这意味着靶位点可以具有仅10%至80%、优选30%至90%的序列相同性。每个靶位点包含由间隔序列(优选5至12个核苷酸)隔开的第一半位点(优选10至20个核苷酸)和第二半位点(优选10至20个核苷酸)。有利地,一个或甚至两个靶位点可以是不对称的,这意味着靶位点的半位点不是彼此反向互补的。有利地,半位点中至少20%或甚至更优选30%的核苷酸以及高达70%或甚至高达90%的核苷酸可以不同,这意味着所有半位点可以具有仅10%至80%、优选30%至90%的序列相同性。在一个实施方案中,靶位点的差异仅在于半位点,间隔序列是相同的以诱导感兴趣序列的缺失。在另一个实施方案中,两个间隔序列也是不同的,以便通过提供合成序列来实现感兴趣序列的置换,该合成序列包含两个序列,这两个序列与基因组中存在的靶位点相同并且围绕将置换该感兴趣序列的供体序列。
在优选实施方案中,根据本发明的设计DNA重组酶包含一种或两种或高达四种不同的单体。在一个实施方案中,所述设计DNA重组酶包含四种不同的单体,并且每种单体识别不同的半位点:然而,设计DNA重组酶也可能包含两种或三种不同的单体,而一种或两种单体识别不对称的靶位点。设计DNA重组酶甚至可能包含四种相同的单体,而该设计DNA重组酶识别两个不同的不对称靶位点。根据本发明的不同单体是指单体在至少2%、特别是至少4%、优选地至少8%的氨基酸残基处不同。有利地,高达10%或甚至高达30%的氨基酸残基可以不同,这意味着所述单体可以具有仅70%至98%、优选90%至96%或高达92%的序列相同性。
因此,根据本发明的DNA重组酶是包含两种或高达四种不同单体的同源四聚体或异源四聚体。
在异源四聚体的优选实施方案中,单体-单体界面以只有不同单体可以形成四聚体的方式被遗传修饰(例如如公开文献Zhang等人2015和US 20170058297 A1中所述)。通过这种修饰,形成了专性异源四聚体,除了仅包含一种单体的四聚体。
感兴趣的序列是待改变的核苷酸序列。它优选是包含突变的序列。根据本发明,术语突变包括所有类型的遗传或染色体畸变,特别是点突变、移码突变、易位、复制、缺失或插入。
或者,感兴趣的序列是将要被失活的序列,特别是病原体(如细菌、病毒或寄生物等微生物)或癌基因或另一种基因的序列,而所述活性会引起疾病或已知抑制基因活性会减轻症状。一个实例是编码PCSK9(前蛋白转化酶枯草杆菌蛋白酶/kexin9型)的基因,其中已知抑制会降低低密度脂蛋白颗粒(LDL)的胆固醇水平和血液浓度。
在感兴趣的序列是插入、复制或将要被失活的序列(例如病毒序列)的情况下,由根据本发明的DNA重组酶诱导的重组优选地导致插入序列或将要被失活的序列的缺失。这种缺失(也称为设计DNA重组酶诱导的基因缺失(DRiGD))是通过两个靶位点处两个相同间隔序列实现的(也参见图2作为说明性示例)。
或者,由根据本发明的DNA重组酶诱导的重组会导致感兴趣的序列被期望序列置换。这种置换(也称为设计DNA重组酶诱导的基因置换(DRiGR))是通过提供包含第一靶位点和第二靶位点的合成供体序列来实现的,而第一靶位点和第二靶位点围绕所述期望序列。通过用期望序列置换感兴趣的序列,在原理上可以治疗任何突变,包括点突变、无义突变、移码突变、复制、甚至缺失和插入(也参见图1作为说明性示例)。
有利地,根据本发明的DNA重组酶在不触发内源DNA修复途径的情况下实现精确基因组编辑,并且具有在体内完成已处理DNA的裂解和立即重新密封的独特能力。
术语DNA重组酶包含能够诱导位点特异性DNA重组事件的每种酶,优选重组酶或整合酶,特别是选自进行拓扑异构酶样反应的酶,诸如丝氨酸或酪氨酸重组酶家族。在一个实施方案中,其靶序列用于步骤a)且在步骤b)中对其应用分子定向进化的已知DNA重组酶选自Cre、Dre、VCre、sCre、FLP、Tre(包括Tre 1.0至Tre 3.1以及Bred)、Vika、Nigri和Panto。
术语“设计(designer)”DNA重组酶是指通过本发明对给定靶位点生成DNA重组酶并且在自然界中不存在所述DNA重组酶的事实。
在一个方面,本发明涉及一种用于识别序列的方法,该序列是DNA重组酶的潜在靶位点,该DNA重组酶能够诱导基因组中感兴趣序列的位点特异性DNA重组,该方法包括以下步骤:
i.筛选包含感兴趣序列的基因组或其一部分以选出作为潜在间隔序列的两个序列。这些潜在间隔序列的长度为至少5bp,优选至少7bp,更优选8bp,并且优选最多12bp,更优选最多10bp。潜在间隔序列中的一个位于感兴趣序列的上游,而另一个位于感兴趣序列的下游。这两个序列具有优选100kb、更优选10kb、甚至更优选2kb的最大距离,并且具有优选150bp的最小距离。
ii.鉴别(定义)潜在靶位点:(在步骤i.中获得的)潜在间隔序列及其周围的序列形成潜在靶位点。对于(在步骤i.中获得的)每个潜在间隔序列,在该潜在间隔序列一侧的邻近核苷酸、优选10至20个核苷酸、更优选12至15个核苷酸、最优选13个核苷酸形成潜在第一半位点,而在另一侧的邻近核苷酸、优选10至20个核苷酸、更优选12至15个核苷酸形成潜在第二半位点。因此,两个潜在半位点和它们之间的间隔序列形成潜在靶位点。
iii.在步骤ii.中鉴别出的潜在靶位点优选地进行进一步筛选以选出不会出现在宿主基因组中(其它地方)的潜在靶序列,从而确保序列特异性重组,特别是缺失。
该方法特别适用于筛选识别序列,这些序列是DNA重组酶的潜在靶位点,该DNA重组酶诱导基因组中感兴趣序列的缺失(DRiGD)。在这种情况下,在步骤i.中,对基因组进行筛选以选出两个相同序列,这两个序列是潜在间隔序列。图18中的示例也图示了这种方法。
在一个实施方案中,待缺失的感兴趣序列是宿主基因组中的序列,例如将要被失活的癌基因或另一基因。因此,在步骤i.中筛选的基因组是宿主自身的基因组(或其包含感兴趣序列的一部分),例如人类基因组或人类染色体的一部分。在这种情况,在步骤iii.中,优选地,对潜在靶序列进行筛选,使其不会出现在宿主基因组中的其它地方(因此仅在感兴趣序列周围),以确保序列特异性缺失。
在另一个实施方案中,待缺失的感兴趣序列是病原体例如病毒的基因组中的序列。在此,对病原体基因组进行步骤i.,并且对受病原体感染的宿主的基因组进行步骤iii.。在这种情况中,在步骤iii.中,优选地对潜在靶序列进行筛选,使其不会出现在宿主的基因组中(因此仅在病原体的基因组中),以确保序列特异性缺失。
在另一个优选步骤iv.中,靶序列选自在步骤ii.或iii.中获得的潜在靶序列的列表,这些潜在靶序列包含半位点,所述半位点分别与DNA重组酶的已知靶位点的半位点具有同源性。同源性是指一定数量的核苷酸位置具有相同碱基。优选地,每个半位点与DNA重组酶的已知靶位点的半位点具有至少10%、优选至少20%、优选至少30%的相同核苷酸位置。进一步地,半位点优选地彼此具有同源性。优选地,每个半位点与同一个靶位点的另一个半位点和/或另一个靶位点的半位点具有至少10%、优选至少20%、优选至少30%的相同核苷酸位置。靶半位点之间的同源性增加了可以产生在两个半位点上均有活性的单体的几率,因此减少了重组所需的单体数量。
步骤iii.的选择以确保序列特异性缺失可以在步骤iv.之前或之后进行。
优选地,在步骤i.期间或在步骤i.之前,确定待失活的感兴趣序列(优选基因或外显子)在基因组中的坐标。生成覆盖感兴趣序列和周围序列的150bp至10kb片段的搜索窗口。移除与其它基因重叠的片段。对于所有其它片段,鉴别出潜在相同间隔序列(因此是至少重复一次的间隔序列)。
在一个实施方案中,在步骤ii.之前选择间隔序列,这些间隔序列围绕感兴趣序列(例如待失活的基因的外显子或至少与感兴趣序列(例如外显子)重叠)。或者,如步骤ii所述鉴别潜在靶位点,随后选择靶位点对,这些靶位点对围绕感兴趣序列(例如待失活的基因的外显子)或至少与感兴趣序列(例如外显子)重叠。
在另一个实施方案中,所述方法用于鉴别序列,这些序列是DNA重组酶的潜在靶位点,该DNA重组酶诱导基因组中感兴趣序列的置换(DRiGR)。在这种情况下,在步骤i.中对基因组进行筛选以选出两个序列,这两个序列是潜在间隔序列并且是不相同的。在这种情况下,潜在间隔序列在至少30%至100%、优选至少50%的核苷酸处不同。因此,在这种情况下,潜在间隔序列优选地具有0%至50%或至少低于70%的序列相同性。
在另一个优选实施方案中,通过如下方法鉴别序列,这些序列是DNA重组酶的潜在靶位点,该DNA重组酶诱导基因组中感兴趣序列的置换(DRiGR),所述方法包括以下步骤:
i.筛选包含感兴趣序列的基因组或其一部分以选出作为潜在靶位点的两个序列。这些潜在靶位点包含由间隔序列间隔开的第一半位点和第二半位点,所述第一半位点和第二半位点分别具有10至20个核苷酸、更优选12至15个核苷酸,所述间隔序列的长度为至少5bp,优选至少7bp,更优选8bp并且优选最多12bp,更优选最多10bp。潜在靶位点中的一个位于所述感兴趣序列的上游,而另一个潜在靶位点位于所述感兴趣序列的下游。这两个序列具有优选100kb、更优选10kb、甚至更优选2kb的最大距离,并且具有优选150bp的最小距离。为实现置换,选择所述间隔序列是不相同的。间隔序列在至少30%至100%、优选至少50%的核苷酸处不同。因此,间隔序列优选地具有0%至50%或至少低于70%的序列相同性。
ii.在步骤i.中鉴别出的潜在靶位点优选地进行进一步筛选以选出不会出现在宿主基因组中(其它地方)的潜在靶序列,从而确保序列特异性(用供体序列置换,见下文)置换。
在进一步的优选步骤iii.中,靶序列选自在步骤i或ii.中获得的潜在靶序列的列表,这些潜在靶序列包含半位点,所述半位点分别与DNA重组酶的已知靶位点的半位点具有同源性。同源性是指一定数量的核苷酸位置具有相同碱基。优选地,每个半位点与DNA重组酶的已知靶位点的半位点具有至少10%、优选至少20%、优选至少30%的相同核苷酸位置。
步骤ii.的选择以确保序列特异性置换可以在步骤iii.之前或之后进行。
优选地,在步骤i.期间或在步骤i.之前,确定待置换的感兴趣序列(优选基因或外显子)在基因组中的坐标。生成覆盖所述感兴趣序列和周围序列的150bp至10kb片段的搜索窗口。移除与其它基因重叠的片段。对于所有其它片段,鉴别出潜在靶位点。
在一个实施方案中,选择间隔序列,该间隔序列围绕所述感兴趣序列(例如待置换的基因的外显子)或至少与所述感兴趣序列(例如外显子)重叠。
用于制备根据本发明的设计DNA重组酶的方法如下步骤,该设计DNA重组酶能够通过重组基因组中天然存在的两个靶序列来诱导位点特异性DNA重组以改变基因组中的核苷酸序列(设计重组酶诱导的基因置换或缺失):
a)选择待改变的核苷酸序列(感兴趣位点)上游的核苷酸序列(优选具有30至40个碱基对的长度)作为第一靶位点,并且选择所述待改变的核苷酸序列下游的核苷酸序列(优选具有30至40个碱基对的长度)作为第二靶位点,而靶位点的序列是不相同的。术语不相同的或非相同的靶序列如上定义。有利地,因为在基因组中几乎找不到对称位点,所以一个或两个靶位点是非对称的。靶位点分别包含由间隔序列(如上定义,优选5至12个核苷酸)隔开的第一半位点和第二半位点(如上定义,优选10至20个核苷酸)。靶序列优选地选择为包含半位点,该半位点分别与DNA重组酶的已知靶位点的半位点具有同源性。同源性是指一定数量的核苷酸位置具有相同碱基。优选地,每个半位点与DNA重组酶的已知靶位点的半位点具有至少10%、优选至少20%、优选至少30%的相同核苷酸位置。进一步地,如上所述,半位点优选地彼此具有同源性。优选地,每个半位点与同一个靶位点的另一个半位点和/或另一个靶位点的半位点具有至少10%、优选至少20%、优选至少30%的相同核苷酸位置。
b)使用包含有在步骤a)中选择的第一靶位点和第二靶位点的核酸作为底物,对DNA重组酶的至少一个、优选至少两个并优选多达四个文库应用分子定向进化,
直到(通过分子定向进化或者分子定向进化和合理设计的组合)获得在a1)中选择的第一靶位点和第二靶位点上有活性的至少一种设计DNA重组酶。
可以选择设计DNA重组酶来靶向任何一对靶序列,并且因此靶向侧翼有这些靶位点的任何感兴趣序列。靶序列是天然存在于宿主(例如细胞或生物体)的基因组内或者病原体(如病毒)的基因组中的序列。在本发明的上下文中,“基因组内天然存在的序列”是指靶序列不是人工引入的并且两个非相同的序列天然(自然)存在于同一基因组中。
基因组定义为生物体或病原体的所有遗传材料。它通常由DNA(或RNA病毒中的RNA)组成。基因组包括基因(编码区或外显子)、非编码DNA(如内含子和调控序列)以及线粒体和叶绿体的遗传材料。
优选的靶序列包括宿主细胞或生物体的靶基因组中唯一的那些序列。由于一些生物体具有染色体的多个拷贝,在这种情况下,唯一是指在每组染色体只出现一次。
本发明人惊奇地发现(参见实施例F9-3,其可以重组loxF9a和loxF9b),在所有半位点在13个位置中的7至9个位置上彼此不同的情况下,一种DNA重组酶可以用于重组两个不同的靶位点。
通常,如果所有半位点在不超过7个位置、优选不超过5个位置、更优选不超过4个位置上彼此不同,则可以使用一个DNA重组酶文库来进化能够重组两个靶位点的酶,特别是在DRiGR反应中(例如参见图15和图16以及第57页的表)。
在另一种情况下,半位点显示出最多7个、优选5个、更优选4个错配的成对差异,因此两个靶位点显示出在半位点之间的最多7个、优选5个或更优选4个错配。在这种情况下,使用2个DNA重组酶文库来进化能够重组两个靶位点的酶。
在另一种情况下,只有一个靶位点显示出具有最多7个、优选5个、更优选4个错配的一对半位点,因此另一个靶位点在超过7个、优选5个、更优选4个错配上不同,并且另一个靶位点的半位点相互比较之下也显示出超过7个、优选5个、更优选4个错配。在这种情况下,使用3个或4个DNA重组酶文库来进化能够重组两个靶位点的酶。
对在步骤b)中使用的一个或多个DNA重组酶文库进行进化以获得DNA重组酶的一种单体或者进行共同进化以获得在所述靶位点对上共同作用的DNA重组酶的至少两种单体。在步骤b)中使用了两个或更多个DNA重组酶文库的情况下,这些文库优选可操作地连接,优选在一个表达载体上。在使用了两个或更多个DNA重组酶文库的情况下,这些文库优选地在相同调控元件、优选相同启动子的控制下表达。
优选地,在步骤b)中使用一个或两个至四个DNA重组酶文库以共同进化。在特别优选的实施方案中,在步骤b)中使用两个或四个DNA重组酶文库。
在使用了不止一个文库的情况下,所使用的不同的DNA重组酶文库在靶位点特异性方面不同。
在使用了两个DNA重组酶文库的情况下,每个文库中的DNA重组酶有利地识别不同的不对称靶位点——由两个不同半位点组成的靶位点。
在使用了四个DNA重组酶文库的情况下,每个文库中的DNA重组酶优选识别不对称靶位点的每个不同半位点。因此,当共同表达为异源四聚体时,它们仅重组所述靶位点。
在一个优选实施方案中,步骤b)中的共同进化是使用表达载体进行的,所述表达载体编码所述DNA重组酶文库或所述至少两个不同的DNA重组酶文库,并且包含第一和第二靶位点。特别地,在优选的实施方案中,表达载体编码两个或四个DNA重组酶文库。
在载体的优选实施方案中,负选择标记位于第一靶位点与第二靶位点之间。因此,第一靶位点和第二靶位点优选地围绕负选择标记。因此,在发生重组的情况下,切割掉具有负选择标记的序列,并且没有发生负选择。然而,如果没有发生重组,则负选择标记具有活性。
在一个优选实施方案中,负选择标记是限制酶的识别位点。优选地,独特的识别位点(即限制酶的识别位点)在载体中只出现一次。通过与限制酶一起温育,对未经过重组的表达载体进行线性化。对线性化的表达载体进行负选择,例如通过选择仅扩增非线性化质粒的PCR的引物对(如图4至图7所示)和/或通过使用核酸外切酶来消化线性化DNA。
在一个优选实施方案中,负选择包含限制酶的一个以上的识别位点,优选地相同限制酶或特别地两个至三个(或甚至多达五个)不同限制酶的两个或三个(或甚至多达五个)识别位点。
这显著提高了未经过重组的表达载体的线性化效率。为了进一步提高对导致置换的酶的选择,优选地添加核酸外切酶来消化线性化DNA。
包含第一靶位点和第二靶位点(优选地围绕负选择标记)的底物核酸优选地与编码所述DNA重组酶文库或所述至少两个不同的DNA重组酶文库的DNA位于相同的载体上(如图4和图7所示)。
在一个实施方案中,所述方法还包含利用如上定义的表达载体转导细胞,并且表达DNA重组酶。或者,使用无细胞表达系统。
在根据本发明的DNA重组酶将会导致缺失(DRiGD)的情况下,优选地,没有对一个重组反应使用其它DNA底物或载体。成功重组切割出负选择标记,并且优选地通过PCR(如图6和图7所示的pDuoSLiDE-DRiGD、pQuSLiDE-DRiGD)对质粒进行扩增。如上所述,在这种情况下,第一靶序列和第二靶序列包含相同的间隔序列(也参见图2)。
优选地,在制备用于缺失或置换的设计DNA重组酶的方法的步骤a)中选择靶位点时或之前,进行上述的用于鉴别作为DNA重组酶的潜在靶位点的序列的方法。
在根据本发明的DNA重组酶将会导致置换(DRiGR)的情况下,除了底物之外,还使用了包含第一靶位点和第二靶位点的合成序列。如上所述,在这种情况下,第一靶序列和第二靶序列包含不同的间隔序列以避免发生缺失。因此,通过重组底物上(编码文库的载体上)的相同靶序列和合成序列,相对于置换使重组发生转移。这里,通过与合成序列重组来置换负选择标记。
在一个优选实施方案中,合成序列是复制缺陷型质粒(也参见图4和图5作为示例)。然而,在一个可替代实施方案中,使用了线性DNA链。在另一个优选实施方案中,合成序列位于高拷贝数质粒上(参见图14作为示例)。
为了进一步选出导致置换的DNA重组酶,合成序列优选地包含位于第一与第二靶之间的正选择标记。在发生重组的情况下,具有正选择标记的序列将插入表达载体中,并且具有正选择标记的表达载体可以被正选择。在一个实施方案中,正选择标记是抗生素抗性基因。因此,在载体转导到细胞中之后,可以容易地选择包含具有正选择标记的载体的细胞。
在一个实施方案中(对于DRiGR),载体具有在第一与第二靶位点之间的负选择标记,并且合成序列还包含在第一与第二靶位点之间的正选择标记。
本领域技术人员已知其它负和正选择标记。其它可应用的负选择标记包括编码酶的基因,所述酶编码编码毒素的基因或将前体药物转化成毒性药物的基因,如URA3(将5-氟乳清酸转化成毒性化合物5-氟尿嘧啶)或病毒胸苷激酶(使宿主对更昔洛韦选择敏感)。其它可应用的正选择标记是编码能够补充营养缺陷的酶的基因。
分子进化的一个步骤优选地包含至少一个选择步骤和至少一个诱变步骤。为了使所选择的分子在选择步骤之间“进化”,优选地诱变所选择的候选分子以将突变引入序列中,以供下一轮选择中的测试。合适的诱变方法是本领域技术人员已知的,特别包括易错PCR、化学诱变、使用特异性突变宿主菌株、递归总体诱变、组合盒式诱变、DNA改组以及这些方法的组合。
优选地,进行一个或多个、优选5至50个、优选8个至30个共同进化循环,直到在靶位点上有活性的DNA重组酶进化出来。
在本发明的某些实施方案中,步骤b)的共同进化可以直接在现有的DNA重组酶文库上进行。
在一个优选实施方案中,本发明的方法包含以下其它步骤,以获得在步骤b)中使用的两个DNA重组酶文库。这里,步骤a)进一步称为步骤a1)
a2)鉴别四个序列,其是DNA重组酶的已知靶位点的半位点,而第一序列与第一靶位点的第一半位点同源(根据a1)选择),第二序列与第一靶位点的第二半位点同源(根据a1)选择),第三序列与第二靶位点的第一半位点同源(根据a1)选择),第四序列与第二靶位点的第二半位点同源(根据a1)选择),
选择a1)和鉴别a2)优选地在一个步骤a)中同时进行,例如通过计算机程序,如SeLOX算法(Surendranath,V.等人(2010)。优选地,将感兴趣位点上游和下游的序列与DNA重组酶的已知靶位点进行比较,并且如a1)所述来选择每个半位点均与DNA重组酶的已知靶位点的半位点具有一定同源性的靶序列。以这种方式鉴别的已知靶位点的半位点是在a2)中提及的半位点。同源性程度优选地如a1)中所提及的。
步骤a3):
在该步骤中,优选地,生成中间靶位点,其是步骤a2)中鉴别的半位点与步骤a1)中选择的靶位点之间的混合体。
优选地,通过确定在第一至第四序列(如a2中定义的)内不同于a1)中选择的靶位点的核苷酸并且由靶位点的相应半位点中存在的核苷酸置换一个或多个、优选地最多三个不同的核苷酸,来生成中间靶位点。
在一个实施方案中,对于每个中间靶位点上DAN重组酶的分离分子定向进化,中间靶位点是对称的,因此它们包含相同或反向互补半位点。在该实施方案中,优选地,生成一组4个中间靶位点-为a1)中选择的靶位点的每个半位点生成一个中间靶位点。
在另一个实施方案中,对于DNA重组酶的共同进化,生成一组、优选地两个不对称的中间靶位点。第一中间第一靶位点包含与其中核苷酸用第一靶位点(如步骤a1)中选择的)的第一半位点中存在的核苷酸置换的第一序列(如a2)中定义的)相对应的一个序列、以及与其中核苷酸用第一靶位点(如步骤a1)中选择的)的第二半位点中存在的核苷酸置换的第二序列(如a2)中定义的)相对应的序列。第二中间靶位点包含与其中核苷酸用第二靶位点(如步骤a1)中选择的)的第一半位点中存在的核苷酸置换的第三序列(如a2)中定义的)相对应的序列、以及与其中核苷酸用第二靶位点(如步骤a1)中选择的)的第二半位点中存在的核苷酸置换的第四序列(如a2)中定义的)相对应的序列。
步骤a4):
使用包含中间第一靶位点和中间第二靶位点的核酸作为底物,在识别步骤a2)中定义的序列的DNA重组酶上应用分子定向进化。
在一个实施方案中,核酸包含中间第一靶位点和中间第二靶,并且在两个中间靶位点上进行DNA重组酶的定向进化(定向共同进化)。优选地,共同进化如上面对步骤B描述的那样进行。
在一个优选实施方案中,第一轮分子定向进化是作为针对每个中间靶位点的DNA重组酶的分离分子定向进化(分离进化)(例如,如图8所示)。在另一个实施方案中,接下来是一个或多个共同进化步骤。
优选地,分子定向进化步骤包含对中间靶位点上的重组进行正选择和/或对其它靶位点上的重组进行负选择。
为了使所选择的分子在选择步骤之间“进化”,优选地诱变所选择的候选分子以将突变引入序列中,以供下一轮选择中的测试。合适的诱变方法是本领域技术人员已知的,特别包括易错PCR、化学诱变、使用特异性突变宿主菌株、递归总体诱变、组合盒式诱变、DNA改组以及这些方法的组合。
优选地,进行一个或多个、优选8至40个、优选15个分子定向进化循环,直到在中间靶位点上有活性的DNA重组酶进化出来。
所使用的分子定向进化优选是底物连接蛋白质进化,特别如WO2002044409 A2所述。然而,诸如连续进化(WO2012088381 A2)等其它定向进化策略也是适用的。
然后,优选地,通过进一步使序列适应靶位点(在a1)中选择)的半位点,优选地通过置换一个或多个、优选地最多三个与靶位点的相应半位点中出现的核苷酸不同的核苷酸,来生成另一组中间靶位点。
优选地,进行分子定向进化、改组和产生其它组中间靶位点的子步骤,直到中间靶位点与靶位点(在a1)中选择)的半位点,每个半位点仅相差一个至三个、优选地一个或两个核苷酸。
在一个优选实施方案中,为了获得诱导置换(DRiGR)的DNA重组酶,以三个分子进化子步骤来进行步骤b)。
在第一步骤中,如上所述,在没有人工序列(因此没有供载体)情况下对DRiGD进化所述一个或多个文库以选出在靶位点上至少表现出一些活性的重组酶,从而选出至少表现出切除活性的DNA重组酶。优选地,该第一步骤如上所述首先在第一组中间靶位点上进行,然后可选地在第二组中间靶位点上进行,最后在最终靶位点上进行。
在第二步骤中,使用具有正选择标记(如抗生素抗性基因)的人工序列来进化步骤i)获得的所述一个或多个DNA重组酶文库。优选地,人工序列是复制缺陷型供体载体。因此,使用不携带在宿主细胞中有活性的复制起点的质粒或线性序列(如图9所示)。优选地,该第二步骤在最终靶位点上进行。在第二步骤中,选择能够用DRiGR置换序列的DNA重组酶(这是比单纯切除更复杂的反应)。优选地进行5至20个、更优选地8至15个底物连接分子进化循环,直到获得在最终靶位点上有活性的酶。复制缺陷型供体载体与抗生素选择标记的组合使用使得可以将第一靶位点上的第一重组反应(整合)与第二靶位点上的第二重组反应(切除)分开,这是成功DRiGR反应所需的。
在第三步骤中,利用步骤ii)获得的一个或多个DNA重组酶文库和没有正选择标记的人工序列来进行分子进化。优选地,人工序列是携带有在所使用的宿主细胞中有活性的功能复制起点的供体载体(如图14所示)。优选地,该第三步骤在最终靶位点上进行。优选进行5至20个、更优选8至15个底物连接分子进化循环,直到获得在最终靶位点上有活性的酶。在该第三步骤中,在不需要正选择标记的情况下,利用靶位点1和靶位点2上的相似重组动力学,选择表现出高置换活性的DNA重组酶。这一点很重要,因为对于许多用途(特别是医疗用途或者当产生具有修饰序列的多细胞生物体时),正选择标记(例如抗生素抗性基因)的存在不是一个有利选择。
已经表明这种三步方法对选择诱导置换(DRiGR)的酶非常高效,特别是当与包含对于在靶位点之间的相同或特别是两种或三种(或甚至多达五种)不同限制酶的一个或若干个识别位点的载体结合时。
通常,在整个说明书中,术语“载体”是指能够运送与其连接的核酸的核酸分子。载体包括但不限于:单链、双链或部分双链的核酸分子;包含一个或多个游离端或者无游离端(例如环形)的核酸分子;包含DNA、RNA或两者的核酸分子;以及本领域已知的其它种类的多核苷酸。一种类型载体是“质粒”,其是指其中能够通过诸如标准分子克隆技术插入额外DNA片段的环状双链DNA环。另一种类型载体是病毒载体,其中在载体中存在源自病毒的DNA或RNA序列以包装成病毒(例如逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒和腺相关病毒-AAV)。病毒载体还包括由病毒携带的用于转染到宿主细胞中的多核苷酸。某些载体能够在其引入的宿主细胞中自主复制(例如具有细菌复制起点的细菌载体和游离型哺乳动物载体)。其它载体(例如非游离型哺乳动物载体)在引入宿主细胞之后整合到宿主细胞的基因组中,从而与宿主基因组一起复制。
此外,某些载体能够指导与其可操作连接的基因的表达。此类载体在本文中称为“表达载体”。重组DNA技术中使用的常见表达载体通常是质粒形式的。
优选地,表达载体是质粒、病毒或人工染色体。
本发明的另一个目的是所述方法中使用的一种或多种载体。
优选的表达载体包含:
i)一个、两个、三个或四个基因,每个基因编码(不同)DNA重组酶文库,而编码这些文库的基因在相同启动子控制下,
ii)底物核酸,其包含围绕负选择标记的第一靶位点和第二靶位点,该负选择标记优选是限制酶的识别位点,该识别位点在表达载体中只出现一次(独特识别位点)。
为了选择出诱导感兴趣位点的缺失(DRiGD)的DNA重组酶,不需要其它底物DNA,因为重组仅仅会发生在表达载体上的中间第一靶位点与中间第二靶位点之间。
为了选择出诱导感兴趣位点用期望序列置换(DRiGR)的DNA重组酶,优选地,使用包含中间第一靶位点和/或中间第二靶位点的合成核酸(优选地复制缺陷型质粒)作为额外(供体)载体。优选地,正选择标记位于第一与第二中间靶位点之间。因此,第一和第二靶位点优选地围绕正选择标记,如抗生素抗性基因)。
根据本发明的用于制备DNA重组酶的方法可以还包含以下步骤:
c)从文库中分离出在步骤b)中获得的至少一种DNA重组酶的核酸;以及优选地,
d)将步骤c)中获得的核酸克隆到合适的递送载体中。
本发明还包含通过根据本发明的方法获得的设计DNA重组酶。
利用本发明,本发明人提供了一种基于重组的基因编辑的技术方案,其实现了遗传信息的灵活且无缺陷改变。这些方法特别实现了生成DNA重组酶以置换导致人类疾病的遗传突变或者从细胞中缺失预定义遗传物质。因此,根据本发明的DNA重组酶用于改变核苷酸序列,特别是修复突变或缺失基因组的序列或由病毒引入的序列。根据本发明可修复的突变特别包含点突变、移码突变、缺失和插入。
有利地,所述DNA重组酶可以使用基因组包括宿主细胞的基因组、宿主器官或宿主生物体、或甚至病原体如病毒的基因组中天然存在的靶序列。本发明的一个优点是实现了DNA的精确位点定向改变,而不涉及宿主DNA修复途径,从而在不诱导随机插入和缺失(indels)的情况下工作。
因此,本发明还包含一种通过在不相同的天然存在靶位点上诱导特异性重组来修饰基因组的方法。该方法包含通过递送来自mRNA或DNA模板的蛋白质本身或者通过引入并表达编码蛋白质的核苷酸序列,将根据本发明的DNA重组酶递送到宿主中。
如上定义的,“天然存在”是指靶位点不是人工引入的,即天然存在于相同基因组中。
合适的宿主细胞特别是真核细胞,包括干细胞,如造血干细胞、神经元干细胞、脂肪组织衍生干细胞、胎儿干细胞、脐带干细胞、诱导多功能干细胞和胚胎干细胞。在人类胚胎干细胞的情况下,优选地,不会破坏胚胎来获得。进一步地,优选地,排除将人类种系和人类配子修饰作为宿主细胞。
用于递送根据本发明的DNA重组酶的合适宿主器官包含体内的任何细胞,包括骨髓、皮肤、肌肉、肝脏、肺、淋巴结和脾脏。
根据本发明的方法可以在体外(活生物体外部)或体内进行。体外包括对分离细胞和/或器官的操作。
在一个方面,本发明提供了如上所述的置换或缺失基因组中感兴趣序列的方法。
在一个方面,本发明涉及根据本发明的DNA重组酶在产生具有感兴趣序列(例如基因或外显子)的敲除或携带修饰序列(例如转基因)的细胞或(优选非人类的)多细胞生物体中的(优选非治疗性)应用。
在该方法中,根据本发明的DNA重组酶或编码根据本发明的所述酶的基因(每个单体一个基因)通过递送方法引入细胞或生物体。
根据本发明的设计DNA重组酶在基因组中围绕感兴趣序列的两个不相同靶位点上诱导位点特异性重组。
为了通过诱导位点特异性重组以缺失(DRiGD)感兴趣序列(例如插入或病毒序列)来修饰基因组,不需要额外DNA或RNA。
为了通过诱导位点特异性重组以置换(DRiGR)感兴趣序列(例如点突变)来修饰基因组,根据本发明的DNA重组酶,另外将包含期望序列(供体DNA)的合成序列引入宿主。合成序列包含置换感兴趣序列的期望序列(供体DNA),而期望序列侧翼有通过根据本发明的DNA重组酶识别的第一靶位点和第二靶位点。
在另一个方面,本发明提供了一种生成模型真核细胞的方法,该模型真核细胞包含突变或改变的疾病相关基因或多核苷酸或者突变或改变的序列,其选自信号传导生化途径相关基因和多核苷酸。这些基因和多核苷酸的实例在下表A至C中列出。
本发明的另一个应用是特异性地改变基因组中的感兴趣序列,特别是通过引入突变或者引入或置换核苷酸序列,例如以产生模型真核细胞或动物模型,其优选地具有与人类疾病相应的特定突变和/或具有人源化序列。有利地,所述方法实现了动物模型的靶向生成,而不诱导随机插入和缺失(indels)或遗传物质的其它不希望的不受控修饰。在某些实施方案中,引入的突变与患有或发展疾病的风险增加相关。
在一个优选实施方案中,根据本发明的方法用于产生可用于生物医学研究的动物模型,例如用于人类疾病的模型。在动物中实施本发明的情况下,优选地,针对动物的非治疗用途来实施。
合适的宿主生物体包括无脊椎动物和脊椎动物,特别是牛科、黑腹果蝇(Drosophila melanogaster)、秀丽隐杆线虫(Caenorhabditis elegans)、非洲爪蟾(Xenopus laevis)、青鳉、斑马鱼、小家鼠(Mus musculus)、褐家鼠(ratus norvegicus)或这些生物体的胚胎。
然而,也可以使用植物和真菌及其细胞作为宿主。
在某些实施方案中,本文描述的一种或多种载体用于产生非人类转基因动物或转基因植物。在某些实施方案中,转基因动物是哺乳动物,诸如小鼠、大鼠或兔。在某些实施方案中,所述生物体或受试者是植物。在某些实施方案中,所述生物体或受试者或植物是藻类。产生转基因植物和动物的方法是本领域中已知的,并且通常从细胞转染方法开始。还提供了了转基因动物、以及转基因植物,特别是作物和藻类。转基因动物或植物可以用于除了提供疾病模型之外的应用。这些应用可以包括通过表达例如比野生型中正常见到的更高的蛋白质、碳水化合物、营养物或维生素水平来生产食物或饲料。在这点上,优选转基因植物(特别是豆类(pulses)和块茎)和动物(特别是哺乳动物,诸如牛、绵羊、山羊和猪等家畜类),也优选家禽和食用昆虫。
为了将DNA重组酶引入宿主并在宿主中表达,可以使用递送载体或者也可以使用其它递送方法,诸如包装在脂质体或纳米颗粒中的DNA、mRNA或蛋白质(例如Wang M等人(2016)所述)、或体外电穿孔、或细胞挤压。
所使用的递送方法取决于其中将被改变感兴趣序列的宿主、宿主细胞或宿主中的靶组织。
同样,所使用的递送载体的选择取决于其中将被改变感兴趣序列的宿主、宿主细胞或宿主中的靶组织。合适的递送载体是本领域技术人员已知的,包括质粒、人工染色体、逆转录病毒载体、慢病毒载体、泡沫病毒载体和腺病毒载体、以及含有穿梭载体的农杆菌。有利的递送载体包括慢病毒和腺相关病毒,并且也可以选择这些载体(特别是腺相关病毒载体)的类型以用于靶向特定类型的细胞或组织。
递送载体优选地包含调控元件。术语“调控元件”旨在包括启动子、增强子、内部核糖体进入位点(IRES)和其它表达控制元件(例如转录终止信号,诸如聚腺苷酸化信号和聚U序列)。在某些实施方案中,调控元件是细胞、细菌、病毒或杂种启动子,其中所述启动子优选是组成型或诱导型启动子。而且,优选地,也根据宿主、宿主细胞或宿主中的靶组织来选择启动子。合适的启动子也是本领域技术人员已知的。优选的组成型启动子选自巨细胞病毒、劳斯肉瘤病毒、鼠白血病病毒相关逆转录病毒、磷酸甘油激酶基因、鼠脾脏病灶形成病毒或人延伸因子1α的启动子。
为了置换感兴趣序列(DRiGR),递送载体还优选含有供体序列,该供体序列包含由根据本发明的设计DNA重组酶识别的两个不相同的靶位点,而靶位点围绕置换感兴趣序列的期望序列(供体DNA),而期望序列侧翼是第一靶位点和第二靶位点。
或者,供体序列提供在单独的核苷酸分子或载体(例如复制缺陷型质粒)上。
本发明还包含编码根据本发明的设计DNA重组酶的核酸或载体。在一个优选实施方案中,编码根据本发明的设计DNA重组酶的单体的核酸是一个核酸分子或在一个载体中。优选地,设计DNA重组酶的单体在一个启动子或其它调控元件的控制下表达。
本发明还包含利用以下方法转导细胞的方法:
1、如上所述的编码根据本发明的设计DNA重组酶的表达载体或递送载体,而根据本发明的设计DNA重组酶在基因组中围绕感兴趣序列的两个不相同靶位点上诱导位点特异性重组
2、作为供体序列的核苷酸序列,其包含相同的两个不同靶位点,这两个靶位点围绕置换感兴趣序列的期望序列(供体DNA),而期望序列侧翼是第一靶位点和第二靶位点,并且表达DNA重组酶。
供体序列可以位于表达或递送载体上,或者提供作为单独的核酸,优选地复制缺陷型质粒。优选地,供体序列以每个细胞多个拷贝来提供,以增加置换靶序列的可能性(也参见图3)。
在另一个方面,本发明涉及一种成套工具或试剂盒,其包含:
i)根据本发明的设计DNA重组酶或编码根据本发明的设计DNA重组酶的核酸或载体,而根据本发明的设计DNA重组酶在基因组中围绕感兴趣序列的两个不相同靶位点上诱导位点特异性重组;
ii)作为供体序列的核苷酸序列,其包含相同的两个不同靶位点,这两个靶位点围绕置换感兴趣序列的期望序列(供体DNA),而期望序列侧翼是第一靶位点和第二靶位点。优选地,供体序列以每个细胞多个拷贝来提供,以增加置换靶序列的可能性(也参见图3)。
同样,供体序列位于(编码根据本发明的设计DNA重组酶)的相同载体上,或者提供作为单独的核酸,优选地复制缺陷型质粒。
通常,为了根据本发明的置换(DRiGR),供体序列上的期望序列优选是与感兴趣序列相对应的序列,但是其中突变用野生型序列(基因或其一部分如外显子)或其功能变体(例如沉默突变或增加活性的突变)置换。
本发明的另一个重要部分是根据本发明的DNA重组酶、根据本发明的核酸或载体或者根据本发明的成套工具/试剂盒的医学应用。
对于医学应用,感兴趣序列是“疾病相关”基因或多核苷酸,其被改变以治疗疾病或至少减轻症状或延长寿命。
在一个方面,本发明涉及一种体外方法。在该方法中,本发明应用于分离的细胞或器官,如上所述。
在另一个方面,本发明涉及一种治疗受试者(优选地人类或动物)的方法,包含应用根据本发明的DNA重组酶、根据本发明的编码设计DNA重组酶的核酸或载体或者根据本发明的成套工具的步骤。
优选地,递送方法和载体如上所述进行选择。
在一个实施方案中,待治疗的受试者在核苷酸序列(感兴趣序列)中携带使受试者患有疾病的突变,特别是使基因产物的功能降低或功能丧失的突变,例如引起血友病的因子9基因的突变。通过递送根据本发明的DNA重组酶、编码其的核酸或载体以及携带期望序列、所述基因的野生型或其它功能变体(或其一部分,如外显子)的供体序列,用期望(功能)序列置换所述基因的突变部分。为了实现位点特异性重组,供体序列中的期望序列侧翼是用于DNA重组酶的靶位点。
在另一个实施方案中,待治疗的受试者携带引起疾病或其抑制减轻疾病症状的核苷酸序列(感兴趣序列)。这里,通过应用根据本发明的方法并且递送根据本发明的DNA重组酶、编码其的核酸或载体来缺失所述感兴趣序列。这里,感兴趣序列特别是病原体(如细菌、病毒或寄生物等微生物)或癌基因或另一种基因的序列,而所述活性会引起疾病或已知抑制基因活性会减轻症状(例如编码PCSK9的基因)。
进一步地,本发明包含一种药物组合物,其包含根据本发明的DNA重组酶、根据本发明的编码设计DNA重组酶的核酸或载体或者根据本发明的成套工具以及合适的载体。
由根据本发明的DNA重组酶靶向的感兴趣序列可以是真核细胞内源或外源的任何多核苷酸。例如,感兴趣序列可以是存在于真核细胞的细胞核或线粒体中的多核苷酸、或者整合或未整合到宿主细胞基因组中的病毒。感兴趣序列可以是编码基因产物(例如蛋白质)的序列或非编码序列(例如内含子或调控多核苷酸)。
由根据本发明的DNA重组酶靶向的感兴趣序列可以包括若干疾病相关基因和多核苷酸、以及信号传导生化途径相关基因和多核苷酸。
“疾病相关”基因或多核苷酸是指与非患病对照的组织或细胞相比,在源于受疾病影响的组织的细胞中以异常水平或异常形式产生转录或翻译产物的任何基因或多核苷酸。它可以是以异常高水平表达的基因;它可以是以异常低水平表达的基因,其中改变的表达与疾病的发生和/或进展相关。疾病相关基因也指具有突变或遗传变异的基因,该突变或遗传变异与负责疾病病因的基因直接相关或者与该基因处于连锁不平衡。所述转录或翻译产物可以是已知或未知的,并且可以处于正常或异常水平。疾病相关基因和多核苷酸的实例可从约翰霍普金斯大学的McKusick-Nathans Institute of Genetic Medicine(Baltimore,Md.)和NationalCenter for Biotechnology Information,NationalLibrary of Medicine(Bethesda,Md.)获得,并且可在万维网上获得。
由根据本发明的DNA重组酶靶向的感兴趣序列可以包括若干疾病相关基因和多核苷酸、以及信号传导生化途径相关基因和多核苷酸,如美国专利US8697359B1中所列出的,其全部内容通过引用并入本文中。
疾病相关基因和多核苷酸的实例在表A和B中列出。疾病特异性信息可从约翰霍普金斯大学的McKusick-Nathans Institute of Genetic Medicine(Baltimore,Md.)和National Center for Biotechnology Information,National Library of Medicine(Bethesda,Md.)获得,并且可在万维网上获得。信号传导生化途径相关基因和多核苷酸的实例在表C中列出。
这些基因和途径的突变可以导致产生不适当的蛋白质或影响功能的不适当量的蛋白质。基因、疾病和蛋白质的其它实例通过参考美国临时申请并入于此。这些基因、蛋白质和途径可以是根据本发明的DNA重组酶靶向的感兴趣序列。
Figure BDA0002317134990000241
Figure BDA0002317134990000251
Figure BDA0002317134990000261
Figure BDA0002317134990000271
Figure BDA0002317134990000281
Figure BDA0002317134990000291
Figure BDA0002317134990000301
Figure BDA0002317134990000311
Figure BDA0002317134990000321
Figure BDA0002317134990000331
Figure BDA0002317134990000341
Figure BDA0002317134990000351
Figure BDA0002317134990000361
Figure BDA0002317134990000371
本发明的实施方案还涉及与敲除基因、扩增基因和修复特定突变(包括点突变、移码突变、缺失或插入)相关的方法与组合物。
在本发明的又一个方面,本发明可以用于校正由若干遗传突变引起的眼部缺陷。
本发明的若干其它方面涉及校正与多种遗传疾病相关的缺陷,这些遗传疾病将在国家卫生研究院网站上的Genetic Disorders主题小节下进一步描述(网站health.nih.gov/topic/Genetic Disorders)。遗传性脑部疾病可以包括但不限于肾上腺脑白质营养不良、胼胝体发育不全、艾卡尔迪综合征、阿尔珀氏病、阿尔茨海默病、Barth综合征、贝敦氏症、CADASIL、小脑退化症、法布瑞氏症、Gerstmann-Straussler-Scheinker病、亨廷顿病和其它三联体重复病症、利氏病、莱施-奈恩综合征、Menkes病、线粒体肌病和NINDS空洞脑。这些疾病将在国家卫生研究院网站上的GeneticBrain Disorders小节下进一步描述。
在某些实施方案中,病症可以是新生物形成。在某些实施方案中,在病症是新生物形成的情况下,待靶向的基因是表A中列出的基因中的任何基因(在这种情况下是PTEN asn等)。在某些实施方案中,病症可以是年龄相关性黄斑变性。在某些实施方案中,病症可以是精神分裂性失调。在某些实施方案中,病症可以是三核苷酸重复失调。在某些实施方案中,病症可以是脆性X染色体综合征。在某些实施方案中,病症可以是分泌酶相关失调。在某些实施方案中,病症可以是朊病毒相关失调。在某些实施方案中,病症可以是ALS。在某些实施方案中,病症可以是药物成瘾。在某些实施方案中,病症可以是自闭症。在某些实施方案中,病症可以是阿尔茨海默病。在某些实施方案中,病症可以是炎症。在某些实施方案中,病症可以是帕金森病。
与帕金森病相关的蛋白质的实例包括但不限于突触核蛋白、DJ-1、LRRK2、PINK1、Parkin、UCHL1、Synphilin-1和NURR1。
例如,成瘾相关蛋白的实例可以包括ABAT。
例如,炎症相关蛋白的实例可以包括由Ccr2基因编码的单核细胞趋化蛋白1(MCP1)、由Ccr5基因编码的C-C趋化因子受体5型(CCR5)、由Fcgr2b基因编码的lgG受体IIB(FCGR2b,也称为CD32)、或由Fcer1g基因编码的FcεR1g(FCER1g)蛋白。
例如,心血管疾病相关蛋白的实例可以包括IL1B(白细胞介素1,β)、XDH(黄嘌呤脱氢酶)、TP53(肿瘤蛋白p53)、PTGIS(前列腺素12(环前列腺素)合酶)、MB(肌红蛋白)、IL4(白细胞介素4)、ANGPT1(血管生成素1)、ABCG8(ATP结合盒,亚家族G(WHITE),成员8)或CTSK(组织蛋白酶K)。
例如,阿尔茨海默病相关蛋白的实例可以包括由VLDLR基因编码的极低密度脂蛋白受体蛋白(VLDLR)、由UBA1基因编码的泛素样修饰激活酶1(UBA1)、或由UBA3基因编码的NEDD8激活酶E1催化亚基蛋白(UBE1 C)。
例如,与自闭症谱系失调相关的蛋白的实例可以包括由BZRAP1基因编码的苯二氮受体(外围)相关蛋白1(BZRAP1)、由AFF2基因编码的AF4/FMR2家族成员2蛋白(AFF2)(也称为MFR2)、由FXR1基因编码的脆性X智力迟钝常染色体同源物1蛋白(FXR1)、或由FXR2基因编码的脆性X智力迟钝常染色体同源物2蛋白(FXR2)。
例如,与黄斑变性相关的蛋白的实例可以包括由ABCR基因编码的ATP结合盒亚家族A(ABC1)成员4蛋白(ABCA4)、由APOE基因编码的载脂蛋白E蛋白(APOE)、或由CCL2基因编码的趋化因子(C-C基序)配体2蛋白(CCL2)。
与精神分裂症相关的蛋白的实例可以包括NRG1、ErbB4、CPLX1、TPH1、TPH2、NRXN1、GSK3A、BDNF、DISC1、GSK3B及其组合。
例如,参与肿瘤抑制的蛋白的实例可以包括ATM(共济失调毛细血管扩张突变)、ATR(共济失调毛细血管扩张及Rad3相关)、EGFR(表皮生长因子受体)、ERBB2(v-erb-b2成红细胞性白血病病毒癌基因同源物2)、ERBB3(v-erb-b2成红细胞性白血病病毒癌基因同源物3)、ERBB4(v-erb-b2成红细胞性白血病病毒癌基因同源物4)、Notch 1、Notch2、Notch 3或Notch 4。
例如,与分泌酶失调相关的蛋白的实例可以包括PSENEN(早老蛋白增强子2同源物(秀丽隐杆线虫(C.elegans)))、CTSB(组织蛋白酶B)、PSEN1(早老蛋白1)、APP(淀粉样β(A4)前体蛋白)、APH1B(前咽缺陷型1同源物B(秀丽隐杆线虫))、PSEN2(早老蛋白2(阿尔茨海默病4))、或BACE1(β-位点APP裂解酶1)。
与肌萎缩性脊髓侧索硬化相关的蛋白的实例可以包括SOD1(超氧化物歧化酶1)、ALS2(肌萎缩性脊髓侧索硬化2)、FUS(肉瘤融合)、TARDBP(TAR DNA结合蛋白)、VAGFA(血管内皮生长因子A)、VAGFB(血管内皮生长因子B)和VAGFC(血管内皮生长因子C)、及其任意组合。
与朊蛋白病相关的蛋白的实例可以包括SODI(超氧化物歧化酶1)、ALS2(肌萎缩性脊髓侧索硬化2)、FUS(肉瘤融合)、TARDBP(TAR DNA结合蛋白)、VAGFA(血管内皮生长因子A)、VAGFB(血管内皮生长因子B)和VAGFC(血管内皮生长因子C)、及其任意组合。
例如,与朊病毒失调中的神经变性病症相关的蛋白的实例可以包括A2M(α-2-巨球蛋白)、AATF(凋亡拮抗转录因子)、ACPP(前列腺酸性磷酸酶)、ACTA2(肌动蛋白α2平滑肌主动脉)、ADAM22(ADAM金属肽酶结构域)、ADORA3(腺苷A3受体)、或ADRA1D(α-1D肾上腺素能受体的α-1D肾上腺素受体)。
例如,与免疫缺陷相关的蛋白的实例可以包括A2M[α-2-巨球蛋白];AANAT[芳烷基胺N-乙酰转移酶];ABCA1[ATP结合盒,亚家族A(ABC1),成员1];ABCA2[ATP结合盒,亚家族A(ABC1),成员2];或ABCA3[ATP结合盒,亚家族A(ABC1),成员3]。
例如,与三核苷酸重复失调相关的蛋白的实例包括AR(雄激素受体)、FMR1(脆性X智力迟钝1)、HTT(亨廷顿蛋白)或DMPK(萎缩性肌强直-蛋白激酶)、FXN(共济蛋白)、ATXN2(共济失调蛋白2(ataxin2))。
例如,与神经传递失调相关的蛋白的实例包括SST(生长抑素)、NOS1(一氧化氮合成酶1(神经元))、ADRA2A(肾上腺素能,α-2A-,受体)、ADRA2C(肾上腺素能,α-2C-,受体)、TACR1(速激肽受体1)、或HTR2c(5-羟色胺(血清素)受体2C)。
例如,神经发育相关序列的实例包括A2BP1[共济失调蛋白2结合蛋白1]、AADAT[氨基乙二酸转氨酶]、AANAT[芳烷基胺N-乙酰转移酶]、ABAT[4-氨基丁酸转氨酶]、ABCA1[ATP结合盒,亚家族A(ABC1),成员1]、或ABCA13[ATP结合盒,亚家族A(ABC1),成员13]。
可利用本发明治疗的优选病症的其它实例可以选自:Aicardi-Goutieres综合征;Alexander病;Allan-Herndon-Dudley综合征;POLG相关失调;α-甘露糖苷过多症(II型和III型);阿尔斯特雷姆综合征;Angelman;综合征;共济失调毛细血管扩张;神经元蜡样脂褐质沉积症;β-地中海贫血;双侧视神经萎缩和(婴儿)视神经萎缩1型;视网膜母细胞瘤(双侧);卡纳万病;脑眼面骨骼综合征1[COFS1];脑腱黄瘤病;德朗热综合征;MAPT相关失调;遗传性朊蛋白病;Dravet综合征;早发性家族性阿尔茨海默病;弗里德赖希共济失调[FRDA];Fryns综合征;岩藻糖苷贮积症;福山型先天性肌营养不良;半乳糖唾液酸贮积症;戈谢病;有机酸血症;噬血细胞性淋巴组织细胞增生症;Hutchinson-Gilford早衰综合征;粘脂贮积病Ⅱ型;婴儿游离唾液酸贮积病;PLA2G6相关神经变性;耶韦尔和朗格-尼尔森综合征;结合性大疱性表皮松解症;亨廷顿病;克拉伯病(婴儿);线粒体DNA相关Leigh综合征和NARP;莱施-奈恩综合征;LIS1相关无脑回畸形;Lowe综合征;槭糖尿病;MECP2复制综合征;ATP7A相关铜转运失调;LAMA2相关肌营养不良症;芳基硫酸酯酶A缺乏症;粘多糖贮积症I型、II型或III型;过氧化物酶体生物发生失调、Zellweger综合征谱;伴有脑铁积聚失调的神经变性;酸性鞘磷脂酶缺乏症;尼曼匹克症C型;甘氨酸脑病;ARX相关失调;尿素循环失调;COL1A 1/2相关成骨不全症;线粒体DNA缺失综合征;PLP1相关失调;Perry综合征;Phelan-McDermid综合征;糖原贮积病II型(蓬佩病)(婴儿);MAPT相关失调;MECP2相关失调;肢根点状软骨发育不良1型;罗伯茨综合症;桑德霍夫病;Schindler病-1型;腺苷脱氨酶缺乏症;Smith-Lemli-Opitz综合征;脊髓性肌萎缩、婴儿发病型脊髓小脑共济失调;己糖胺酶A缺乏症;致死性骨发育不全1型;VI型胶原蛋白相关失调;Usher综合征I型;先天性肌营养不良;Wolf-Hirschhorn综合征;溶酶体酸性脂肪酶缺乏症;以及着色性干皮病。
显而易见,设想本发明的系统可以用于靶向任何感兴趣的多核苷酸序列。上面列出了可以使用本发明系统有效治疗的病症或疾病的一些实例,并且还提供了当前与这些病症相关的基因的实例。然而,举例说明的基因并不是穷尽的。
实例F-9:
在一个优选实施方案中,对于DRiGR,根据本发明的设计DNA重组酶置换了引起血友病B的F9基因的外显子8中的突变。外显子8在严重的血友病B中经常突变,并且在种群中发生的突变是已知的(www.factorix.org)。
在一个实施方案中,F9设计DNA重组酶是异源四聚体,包含两种不同的单体:具有根据SEQ ID NO:1(Rec F9-1)的序列或者与SEQ ID NO:1具有至少90%序列相同性、更优选95%序列相同性的序列的单体、以及具有根据SEQ ID NO:2(Rec F9-2)的序列或者与SEQID NO:2具有至少80%序列相同性、优选90%序列相同性、更优选95%或甚至98%序列相同性的序列的单体。
本发明的一个目的也是设计DNA重组酶,其包含根据SEQ ID NO:1(Rec F9-1)或SEQ ID NO:2(Rec F9-2)的序列或者与SEQ ID NO:1或SEQ ID NO:2具有至少80%序列相同性、优选90%序列相同性、更优选95%或甚至98%序列相同性的序列。
SEQ ID NO:1(Rec F9-1):
Figure BDA0002317134990000421
在具有根据SEQ ID NO:1(Rec F9-1)的序列的单体中,优选地,
以下位置具有以下氨基酸残基:
X17是任意氨基酸,优选D或G
X19是任意氨基酸,优选T或A
X22是任意氨基酸,优选G或E
X30是非极性小氨基酸,优选选自V、L、I、A或G,更优选V或A
X43是正电荷氨基酸,优选K或R,
X60是任意氨基酸,优选N或D
X68是任意氨基酸,优选P或S
X69是正电荷或负电荷氨基酸,优选选自D、E、K或R,更优选E或K,
X81是极性氨基酸,优选选自S、T、C、K或R,更优选C或R;
X84是任意氨基酸,优选A或T
X89是任意氨基酸,优选L或Q
X93是小氨基酸,优选选自C、S和A,更优选C或A;
X140是任意氨基酸,优选I或T
X166是非极性氨基酸,优选选自I、L或V,更优选I或V;
X177是非极性氨基酸,优选选自I、L或V,更优选I或V;
X182是非极性氨基酸,优选选自I、L或V,更优选I或V;
X183是正电荷氨基酸,优选K或R,
X186是极性氨基酸,优选S或T
X206是任意氨基酸,优选A或T
X222是任意氨基酸,优选V或E
X225是非极性氨基酸,优选选自I、L或V,更优选I或V;
X237是极性氨基酸,优选选自S、T、C或Y,更优选Y或C;
X239是非极性氨基酸,优选选自I、L、V或F,更优选F或I;
X249是非极性小氨基酸,优选选自V、L、I、A或G,更优选V或A
X259是任意氨基酸,优选F或P
X260是任意氨基酸,优选T或A
X264是任意氨基酸,优选A或D
X278是任意氨基酸,优选L或Q
X284是非极性氨基酸,优选选自I、L或V,更优选I或V;
X318是非极性氨基酸,优选选自I、L或V,更优选I或L;
X342是任意氨基酸,优选G或D
大写字母代表根据IUPAC命名法的单字母代码。根据SEQ ID NO:1的优选序列选自根据SEQ ID NO:28、SEQ ID NO:3和SEQ ID NO:5的序列、以及与SEQ ID NO:28、SEQ ID NO:3或SEQ ID NO:5具有至少80%序列相同性、优选90%序列相同性、更优选95%或甚至98%序列相同性的序列。
SEQ ID NO:2(Rec F9-2):
Figure BDA0002317134990000431
在具有根据SEQ ID NO:2(Rec F9-2)的序列的单体中,优选地,
以下位置具有以下氨基酸残基:
X3是任意氨基酸,优选K或N
X5是任意氨基酸,优选P或Q
X8是任意氨基酸,优选H或T
X14是非极性氨基酸,优选选自I、L或V,更优选I或L,
X16是非极性小氨基酸,优选选自V、L、I、A或G,更优选V或A
X18是小氨基酸,优选A或G
X19是任意氨基酸,优选T或A
X20是极性氨基酸,优选选自S、T、N或Q,更优选S或N;
X21是任意氨基酸,优选D或G;
X31是非极性氨基酸,优选选自I、L、V和F,更优选L或F
X39是正电荷或负电荷氨基酸,优选选自D、E、K或R,更优选K或E,
X80是任意氨基酸,优选T或A
X84是任意氨基酸,优选T或A
X93是任意氨基酸,优选C或A
X97是非极性氨基酸,优选选自I、L、V和M,更优选L或M;
X125是非极性氨基酸,优选选自I、L和V,更优选I或V;
X132是正电荷氨基酸,优选K或R
X182是非极性氨基酸,优选选自I、L和V,更优选I或V;
X183是正电荷氨基酸,优选K或R
X186是极性氨基酸,优选T或S,
X195是非极性氨基酸,优选选自I、L和V,更优选I或V;
X206是任意氨基酸,优选A或T
X216是任意氨基酸,优选G或R
X249是非极性小氨基酸,优选选自V、L、I、A或G,更优选V或A
X253是任意氨基酸,优选I或T
X259是任意氨基酸,优选P或S
X260是任意氨基酸,优选A或T
X264是非极性氨基酸,优选选自I、L和V,更优选V或I(或L)
X266是小氨基酸,优选A或G
X273是芳族或杂芳族氨基酸,优选H或Y
X276是任意氨基酸,优选K或Q
X278是任意氨基酸,优选A或D
X306是非极性氨基酸,优选选自I、L和V,更优选L或I;
X325是非极性氨基酸,优选选自I、L和V,更优选L或I
同样,大写字母代表根据IUPAC命名法的单字母代码。
根据SEQ ID NO:2的优选序列选自根据SEQ ID NO:29、SEQ ID NO:4和SEQ ID NO:6的序列、以及与SEQ ID NO:29、SEQ ID NO:4或SEQ ID NO:6具有至少85%序列相同性、优选90%序列相同性、更优选95%或甚至98%序列相同性的序列。
形成根据本发明的F9设计DNA重组酶的优选单体对具有根据SEQ ID NO:28和29的氨基酸序列,特别是根据SEQ ID NO:3和4以根据SEQ ID NO:5和6的氨基酸序列。
在另一个实施方案中,F9设计DNA重组酶包含根据SEQ ID NO:36(Rec F9-3)的序列或者与SEQ ID NO:36具有至少90%序列相同性、优选95%、更优选98%序列相同性的序列。在这种情况下,F9设计DNA重组酶优选是同源四聚体。
根据本发明的F9设计DNA重组酶已经使用本文中描述的根据本发明的方法获得,并且识别根据SEQ ID NO:7和SEQ ID NO:8的不对称的loxF9-A和loxF9-A靶位点。
名称 序列 SEQ ID No.
loxF9a <u>CTCATTACATTTA</u> ACCAAAAT <u>TATCACAATATAA</u> 7
loxF9b <u>CCATCTTTTGTTA</u> GATTTGAA <u>TATATACATTCTA</u> 8
这些序列存在于人类基因组和F9基因的侧翼外显子8中。本发明包含选自SEQ IDNO:7(loxF9a)和SEQ ID NO:8(loxF9b)的核酸或与SEQ ID NO:7或SEQ ID NO:8具有至少90%序列相同性、优选至少95%序列相同性、更优选至少99%序列相同性的序列或与这些序列之一反向互补的核酸序列、以及它们用作DNA重组酶(优选根据本发明的F9设计DNA重组酶)的靶位点的用途。在一个实施方案中,根据本发明的这些核酸的长度为30至40个核苷酸,优选32至36、更优选34个核苷酸。
本发明还包含编码本发明F9设计DNA重组酶的核酸或载体。
本发明还包含利用以下转导细胞的方法:
1、递送载体,包含编码根据本发明的F9设计DNA重组酶的核酸,
2、供体序列,其包含围绕编码F9基因的外显子8或其功能突变体的序列的loxF9a和LoxF9b位点,并且表达DNA重组酶。
供体序列可以位于表达或递送载体上,或者提供作为单独的核酸,优选复制缺陷型质粒。优选地,供体序列以每个细胞多个拷贝来提供,以增加置换靶序列的可能性(也参见图3并如图11所示)。
本发明还包含一种通过引入如下到细胞中来置换细胞中F9基因的(非功能性或功能异常的)突变外显子8的方法:
-根据本发明的F9设计DNA重组酶或编码并表达其的核酸或载体,
-供体序列,包含编码F9基因的外显子8或其侧翼为loxF9a和loxF9b靶位点的功能突变体的序列,
而F9设计DNA重组酶通过位点特异性重组用供体序列置换包含突变外显子8的序列。
本发明还包含一种试剂盒,该试剂盒包含:
-根据本发明的F9设计DNA重组酶或编码其的核酸或载体,
-供体序列,包含编码F9基因的外显子8或其侧翼为loxF9a和loxF9b靶位点的功能突变体的序列。
在一个优选实施方案中,缺陷型F9外显子8序列被携带有超活性Padua突变(R338L)的供体序列(PMID:23197580)置换。
用于上述方法和试剂盒的特别优选的供体序列选自SEQ ID NO:26(野生型外显子8)和SEQ ID NO:27(具有Padua突变的外显子8)。
供体序列可以位于编码F9设计DNA重组酶的载体上(参见图11作为示例)或者提供作为单独的核酸,优选复制缺陷型质粒。
优选地,供体序列以每个细胞多个拷贝提供在上述方法和试剂盒中(例如在AAV载体上)以增加置换靶序列的可能性(也参见图11作为示例)。
实例Hex:
在一个优选实施方案中,对于DRiGD,根据本发明的设计DNA重组酶缺失人类染色体7上的序列。该设计DNA重组酶进一步称为Hex设计DNA重组酶并且识别根据SEQ ID NO:40和SEQ ID NO:41的不对称的Hex1和Hex2靶位点:
名称 序列 SEQ ID No.
Hex1 TACACAGTGTATATTGATTTTTATCAAATGCCTT 40
Hex2 TACACAATGTATATTGATTTTTATCAAATGCCTT 41
在一个实施方案中,设计DNA重组酶是异源四聚体,包含两种不同的单体:具有根据SEQ ID NO:46(Hex-R-#7)的序列或与SEQ ID NO:46具有至少90%序列相同性、更优选95%序列相同性的序列的单体、以及具有根据SEQ ID NO:47(Hex-L-#7)的序列或与SEQ IDNO:47具有至少80%序列相同性、优选90%序列相同性、更优选95%或甚至98%序列相同性的序列的单体。
在另一个实施方案中,设计DNA重组酶是异源四聚体,包含两种不同的单体:具有根据SEQ ID NO:48(Hex-R-#30)的序列或与SEQ ID NO:48具有至少90%序列相同性、更优选95%序列相同性的序列的单体、以及具有根据SEQ ID NO:49(Hex-L-#30)的序列或与SEQID NO:49具有至少80%序列相同性、优选90%序列相同性、更优选95%或甚至98%序列相同性的序列的单体。
本发明还包含编码本发明Hex设计DNA重组酶的核酸或载体。
在另一个方面,本发明包括根据本年发明的DNA重组酶、根据本发明的核酸或载体或根据本发明的成套工具/试剂盒用于医学、特别是用于治疗与上述疾病相关基因或多核苷酸或上述信号传导生化途径相关基因和多核苷酸之一相关的疾病或病症。
在一个类似方面,本发明包括制备用于治疗与上述疾病基因或多核苷酸或上述信号传导生化途径相关基因和多核苷酸之一相关的疾病或病症的药物,包含根据本发明的DNA重组酶、根据本发明的核酸或载体或根据本发明的成套工具/试剂盒或者使用根据本发明的方法。
应当注意,在本公开中,特别是在权利要求和/或说明书段落中,诸如“包含(comprise)”等术语可以具有美国专利法赋予的含义;例如,它们可以指“包括(include)”等;并且,诸如“基本上由……组成”等术语具有美国专利法赋予的含义,例如,它们允许没有明确列举的元件,但是排除现有技术中发现的或影响本发明的基本或新颖性特征的元件。这些和其它实施方案由下面的详细描述公开,或者从下面的详细描述变得显而易见并涵盖于其中。
进一步地,本发明描述的实施方案可以相互组合。
本发明通过以下附图和非限制性实施例来说明:
图1示出了根据本发明的优选设计DNA重组酶诱导的基因置换(DRiGR)的总体方案。示出了DAN重组酶的不同单体R1-4以及它们相应的DNA结合序列loxR1-loxR4(靶位点的半位点)。基因组中的感兴趣位点(皱眉表情)用期望序列(笑脸表情)替换。
图2示出了设计DNA重组酶诱导的基因缺失(DRiGD)的总体方案。同样,在上面方案中示出了在相应DNA结合序列loxR1-loxR4处结合的DNA重组酶的不同单体R1-4。这里,靶位点分别具有相同的8bp间隔区。这里,切除了基因组中的感兴趣位点(皱眉表情)。
图3说明了,如果供体载体超过基因组DNA,则将由DNA重组酶诱导的基因置换朝着用供体载体DNA置换基因组DNA的方向驱动。优选地,供体载体以多个拷贝存在于靶细胞的细胞核中,诸如在AAV载体中,这导致了细胞突变的有效修复。
图4示出了通过应用新定向进化策略(Duo-SLiDE DRiGR)获得用于DRiGR的DNA重组酶的一般方法,所述策略递送DNA重组酶的一对单体,该对单体共同作用以重组基因组中存在的两个不同靶位点(白色三角形lox1和黑色三角形lox 2),所述策略起始于具有两个DNA重组酶文库的源载体。表达该系统中的单一重组酶也是可行的(参见图15)。R1、R2和R3表示三种不同的限制酶或相应的限制位点。P1和P2表示两种不同的PCR引物或相应的引物结合位点。
当DNA重组酶的这些单体与也携带两个靶位点的DNA模板(此处为pDonor质粒)一起表达时,在两个靶位点处的重组导致了DNA片段的交换。因为引入的DNA片段将限制位点从pDuoSLiDE载体移除,所以可以通过用限制酶消化DNA后的PCR来扩增促进置换的有效重组酶。结合随机诱变和DNA改组,通过该系统的循环发现了促进反应的最有效重组酶。通过使用在宿主中没有活性的pDonor上的复制起点(R6K-ori),可以对通过一个靶位点(例如lox1)进行整合并通过另一个靶位点(例如lox2)进行切除的过程进行解偶联。此外,整合可以通过在含有卡那霉素的平板上的抗生素选择来鉴定。
图5示出了一种通过应用新定向进化策略(QuSLiDE DRiGR)获得用于DRiGR的DNA重组酶的相似方法,该策略递送DNA重组酶的两对单体,这两对单体共同作用以重组两个不同的靶位点。这里,起始于具有四个DNA重组酶文库的源载体,每个单体指向起始基因组中存在的一个靶位点的一个半位点(白色三角形lox 1和黑色三角形lox 2)。(R1、R2和R3以及P1和P2具有图4的含义。)
如果供体载体上的DNA含有野生型等位基因并且基因组含有导致疾病的突变,则基因缺陷在细胞中得以修复(参见图1)。
图6示出了通过应用新定向进化策略(Duo-SLiDE DRiGD)获得用于DRiGD的DNA重组酶的一般方法,该策略递送DNA重组酶的一对单体,该对单体共同作用以重组基因组中存在的两个不同靶位点,该策略起始于具有两个DNA重组酶库的源载体(白色三角形lox 1和黑色三角形lox 2)。(R1、R2和R3以及P1和P2具有图4的含义。)
当表达DNA重组酶的这些单体时,pDuoSLiDE载体的两个拷贝之间的重组将限制位点从pDuoSLiDE载体移除,可以通过用限制酶消化DNA后的PCR来扩增促进缺失的有效重组酶。结合随机诱变和DNA改组,通过该系统的循环发现了促进反应的最有效重组酶。
图7示出了一种通过应用新定向进化策略(QuSLiDE DRiGD)获得用于DRiGD的DNA重组酶的相似方法,该策略递送DNA重组酶的两对单体,这两对单体共同作用以重组两个不同的靶位点。这里,起始于具有四个DNA重组酶库的源载体,每个单体指向基因组中存在的一个靶位点的一个半位点(白色三角形lox 1和黑色三角形lox 2)。(R1、R2和R3以及P1和P2具有图4的含义。)
这组单体允许缺失基因组中的感兴趣位点(参见图2)。
图8示出了现有技术中公知的通过底物连接蛋白质进化(SLiPE)获得作用于一个靶位点的定制重组酶的方法(Buchholz F和Stewart AF,2001)。这里,载体只含有一个文库和两个相同靶位点(虚线三角形)。
图9示出了本发明用Duo-SLiDE DRiGR置换F9基因的外显子8的突变中的应用。图9A示出了F9基因的外显子8和侧翼序列的示意图。两个选定的靶序列(loxF9a-SEQ ID NO:3和loxF9b-SEQ ID NO:4)用三角形(黑色和白色)表示,并且示出了核苷酸序列和染色体位置。图9B图示了用于获得两种重组酶单体F9-1(SEQ ID NO:1、3、5和28)和F9-2(SEQ ID NO:2、4、6和29)的方法以及置换反应。通过DNA测序来确认重组反应已经如预测发生。图9C示出了琼脂糖凝胶,表明了在用NdeI和SacI消化后的pDuoF9(来源)(泳道1)和pDuoF9(产物)(泳道2)的限制模式。M=分子标记。
图10示出了使DNA重组酶文库适应给定靶位点的示例性进化过程,这里应用于loxF9a和loxF9b靶位点。
这里,在loxF9a位点(F9A)上有活性的DNA重组酶是通过设计两个对称的中间位点AL和AR并进行20或17次SLiPE循环来获得的(参见图8)。在组合并改组获得的DNA重组酶文库之后,在不对称loxF9a位点(F9A)上进行108次SLiPE循环。示出了所指示生成循环的琼脂糖凝胶,具有两个三角形的线表示非重组条带,具有一个三角形的线表示重组条带的大小。凝胶图片下方的灰色三角形表示添加到生长培养基中的L-阿拉伯糖的量减少。为了获得在loxF9b位点(F9B)上有活性的DNA重组酶,设计了第一组两个对称中间位点BLS和BRS并且进行9个SLiPE循环(参见图8)。在重新改组DNA重组酶文库之后,在第二组对称中间位点BL(30个循环)和BR(22个循环)上进行SLiPE。最后,在组合并改组获得的DNA重组酶文库之后,在不对称loxF9b位点(F9B)上进行17次SLIPE循环。最后(未示出),将在loxF9a位点和loxF9b位点上获得的两个DNA重组酶文库克隆到pDuoF9(来源)中,参见图9。
图11图示了F9设计DNA重组酶在治疗环境中的应用,F9-1和F9-2编码序列与供体序列一起克隆到递送载体(诸如腺相关病毒载体)中,该供体序列含有在F9基因的外显子8的野生型或Padua突变(R338L)侧翼的loxF9a和loxF9b。将这种载体以多个拷贝递送到靶细胞中以置换基因组中的失活突变。
图12示出了针对8bp重复序列对染色体1上人类PCSK9基因进行筛选的结果。PCSK9基因的外显子用粗方框表示。8bp重复序列被间隔开至少150bp并不超过2kb,并且位于长度为34bp的潜在靶位点(用垂直线表示)中,其被筛选不会出现在基因组中的其它地方。潜在靶位点之间的感兴趣序列用水平线表示。
图13示出了针对8bp重复序列对人乳头瘤病毒16(HPV16)的基因组进行类似筛选的结果,该重复序列被间隔开至少150bp并不超过2kb并且位于长度为34bp的潜在靶位点中,其被筛选不会出现在人基因组中。编码病毒蛋白的序列用带有箭头(大于符号)的粗方框表示。
图14示出了一种通过应用新定向进化策略(SLiDE DRiGR 2.0)获得在示例3步骤3中用于DRiGR的DNA重组酶的不同的一般方法,该策略递送DNA重组酶文库,所述重组酶重组起始基因组中存在的两个不同靶位点(白色三角形lox 1和黑色三角形lox 2)。R1、R2、R3、R4和R5表示五种不同的限制酶或各自的限制位点。P3和P4表示两种不同的PCR引物或各自的引物结合位点。当该DNA重组酶文库在存在也携带两个靶位点的DNA模板(此处为pDonor-ex8质粒)的情况下表达时,在两个靶位点处的重组导致了DNA片段的交换。因为引入的DNA片段将限制位点从pF9载体移除,所以可以通过用限制酶R1-3和RecBCD消化DNA后的PCR来扩增促进置换的有效重组酶。结合随机诱变和DNA改组,通过该系统的循环发现了促进DRIGR反应的最有效重组酶。
图15突出显示了在示例3步骤3中使用的新定向进化策略(SLiDEDRiGR)的步骤。在子步骤1中,将pF9(来源)和pDonor转化到细菌中。只有诱导重组酶的表达,才能观察到对抗生素有抗性的菌落的生长。在子步骤2中,使用限制酶R1-3对获得的菌落的质粒DNA进行消化。这将富集已经成功经历DRIGR并产生pF9(产物)的纯制备物的克隆。质粒制备物的纯度通过使用酶XhoI和XmaI的限制消化来验证,显示了pDuoF9(产物)的独特限制模式。此外,DNA测序表明了pF9(产物)的正确序列。
图16示出了一种通过应用新定向进化策略(Duo-SLiDE DRiGR 2.0)获得用于DRiGR的DNA重组酶的不同的一般方法,该策略递送DNA重组酶的一个或一对单体,其共同作用以重组基因组中存在的两个不同靶位点,该策略起始于具有一个或两个DNA重组酶文库的源载体(白色三角形lox 1和黑色三角形lox 2)。R1、R2、R3、R4和R5表示五种不同的限制酶或相应的限制位点。P3和P4表示两种不同的PCR引物或相应的引物结合位点。当该DNA重组酶的这些单体与也携带两个靶位点的DNA模板(此处为高拷贝数质粒pDonor-ex8)一起表达时,在两个靶位点处的重组导致了DNA片段的交换。因为引入的DNA片段将限制位点从pDuoSLiDE载体移除,所以可以通过用限制酶消化DNA后的PCR来扩增促进置换的有效重组酶。重要的是,在该检测中没有使用抗生素选择标记。结合随机诱变和DNA改组,通过该系统的循环发现了促进反应的最有效重组酶。
图17示出了Cre(现有技术)、在示例3的步骤1之后获得的重组酶(R#1)、在示例的步骤2之后获得的重组酶(3R#7-B5)和在示例3的步骤3之后获得的重组酶(F9-3)之间的比对。该比对示出了在进化后期如何出现额外的突变。
图18示出了本发明方法的总体方案,以本发明的DRiGD方法和步骤为例。
图19和图20示出了本发明方法的更详细方案,以DRiGD方法为例并应用于人类基因组。
图21图示了本发明的应用于人类染色体7上的靶位点的DRIGD方法,在实施例5中进一步描述。A.示出了靶位点:Hex 1和Hex 2是用于切除的靶位点-HexL、HexR、HexR1和HexR2是中间靶位点。B.示出了用于Hex1和Hex2靶位点的特异性重组酶的进化。C.示出了获得的两个克隆(克隆#7和克隆#30)的重组效率。
图22示出使用实施例5中获得的重组酶精确切除质粒底物的序列。
实施例1:
为了证明DRiGD的实用性,发明人已经筛选了人类基因组的所有8bp重复序列,这些重复序列间隔至少150bp:潜在靶位点是指示的序列,其在8bp重复序列的左侧13bp和右侧13bp而在窗口中在人类基因组的其它地方不会出现,从基因组中缺失最多2kb。图12示出了人类基因PCSK9中的DNA重组酶的所有309个可能靶位点的结果。图13示出了人乳头瘤病毒16(HPV16)中的DNA重组酶的所有176个可能靶位点的结果。
实施例2:
为了证明DRiGR发明的可行性,发明人已经生成了在联合应用时能够置换人类因子9(F9)基因的第八外显子的重组酶。该外显子通常在血友病B患者中携带突变。我们的结果表明,提供合适的供体载体并表达协同工作的两种重组酶,该外显子可以被有效置换为不同序列(图6、图9和图11)。
如果没有另外说明,则使用WO 2008/083931A1、WO 2011/147590A1、WO2016034553A1和公开文献Buchholz F和Stewart AF,2001中描述的材料和方法。
靶序列(loxF9a-SEQ ID NO:7和loxF9b-SEQ ID NO:8)是通过将人类基因组中的序列与DNA重组酶的先前鉴别的靶位点(LoxP、LoxH、LoxM7、LoxM5、loxLTR、LoxBTR)的半位点进行比较来选择的:
名称 序列 SEQ ID No.
loxF9a <u>CTCATTACATTTA</u> ACCAAAAT <u>TATCACAATATAA</u> 7
loxF9b <u>CCATCTTTTGTTA</u> GATTTGAA <u>TATATACATTCTA</u> 8
loxP <u>ATAACTTCGTATA</u> ATGTATGC <u>TATACGAAGTTAT</u> 9
loxH <u>ATATATACGTATA</u> TAGACATA <u>TATACGTATATAT</u> 10
loxM7 <u>ATAACTCTATATA</u> ATGTATGC <u>TATATAGAGTTAT</u> 11
LoxM5 <u>ATAACTTCGTGCA</u> ATGTATGC <u>TGCACGAAGTTAT</u> 12
loxLTR <u>ACAACATCCTATT</u> ACACCCTA <u>TATGCCAACATGG</u> 13
loxBTR <u>AACCCACTGCTTA</u> AGCCTCAA <u>TAAAGCTTGCCTT</u> 14
在表格中,靶位点中的第一(左)和第二(右)半位点标有下划线。在第一步中,分别使用如上所述的SLiDE方法来进化两个重组酶文库(Buchholz和Stewart,2001以及WO2002044409 A2,参见图8)。总之,每个文库都朝着重组中间靶位点(AL、AR、BLS、BLRS、BL、BR)并最终重组两个靶位点之一,loxF9a或loxF9b,的方向进化。通过易错PCR和DNA改组引入新的突变,并且通过重组酶的表达水平进一步调控选择压力。活性重组酶通过它们重组相应靶位点以从载体中缺失侧翼为靶位点的序列的能力来选择(参见图8)。
使用下面的中间序列;
名称 序列 SEQ ID No.
loxF9-AL <u>CTCATTACATTTA</u> ACCAAAAT <u>TAAATGTAATGAG</u> 15
loxF9-AR <u>TTATATTGTGATA</u> ACCAAAAT <u>TATCACAATATAA</u> 16
loxF9-BLS <u>CCAACTTTTGATA</u> GATTTGAA <u>TATCAAAAGTTGG</u> 17
loxF9-BRS TAGACTTTATATA GATTTGAA <u>TATATAAAGTCTA</u> 18
loxF9-BL <u>CCATCTTTTGTTA</u> GATTTGAA <u>TAACAAAAGATGG</u> 19
loxF9-BR <u>TAGAATGTATATA</u> GATTTGAA <u>TATATACATTCTA</u> 20
然后,将来自这两个文库的重组酶编码序列克隆到载体骨架pDuoF9(来源)中(SEQID NO:21,参见图9)。在该载体中,这两个重组酶文库由操纵子样结构中的共享诱导型启动子表达,该操纵子样结构将两种酶转录连接在一起。该文库的大小超过100,000个克隆。
为了实施DRiGR,用1ng pDuoF9(来源)文库转化50μl电感受态大肠杆菌XL1-Blue细胞并在含有15μg/ml氯霉素的200ml LB培养基中生长过夜。次日,使用1ml过夜培养物接种100ml新鲜培养基并生长2h。然后,将培养物分成2x 50ml并加入L-阿拉伯糖至终浓度为50μg/ml以在培养物之一中诱导重组酶表达。在温育2.5h后,将细胞放在冰上并如前所述准备用于电穿孔(Sambrook和Russell,2001)。将电感受态细胞重悬在200μl水中,并在1700V,将50μl细胞悬浮液立即用于转化0.4ngpDonor。然后,让细菌在SOC培养基中恢复2h,然后将整个悬浮液铺板在含有15μg/ml卡那霉素的LB琼脂板上。
在未诱导细胞铺板的琼脂板上没有菌落生长过夜,证实了pDonor载体(SEQ IDNO:22)的整合需要重组酶表达。将从诱导样品中生长的所有菌落合并并在含有15μg/ml卡那霉素和50μg/ml L-阿拉伯糖的220ml LB培养基中培养以通过第二对靶位点实现可能的重组。
次日,将质粒DNA从培养物中分离。为富集成功经历DRiGR的克隆,用酶消化DNA,裂解任何非pDuoF9(产物)-负选择-并重新转化。为此,用各1μl的NdeI、AvrlI和PspXI消化500ng质粒制备物。在37℃温育3h之后,沉淀DNA并重悬在50μl水中。将1μl用于转化50μl电感受态大肠杆菌XL1-Blue细胞。转化后的细胞在含有15μg/ml卡那霉素的220ml LB培养基中生长-正选择-。
次日,将质粒DNA从培养物中分离。使用引物P1和P2(SEQ ID NO:23和24)通过PCR扩增重组酶文库并将PCR产物上柱纯化并用限制酶SacI和SbfI消化。然后,将分离的重组酶文库连接回pDuoF9(来源)中以开始另一个DRiGR循环。进行三轮Duo-SLiDE DRIGR(参见图10)以富集能够在靶位点loxF9a和LoxF9b上有效实施DRiGR的重组酶。
使用的引物:
名称 序列 SEQ ID No.
P1 CTCTACTGTTTCTCCATAC 23
P2 AGGGAATAAGGGCGACA 24
质粒pDuoF9(产物)的序列在SEQ ID NO:25中给出。
通过该方法,获得了以下重组酶单体对的序列:
Rec F9-1a:SEQ ID NO:3和Rec F9-2a:SEQ ID NO:4
Rec F9-1b:SEQ ID NO:5和Rec F9-2b:SEQ ID NO:6
实施例3
步骤1:
在第一步中,分别使用如前所述的SLiDE方法进化两个重组酶文库(Buchholz和Stewart,2001以及WO 2002044409 A2,参见图8)。总之,如实施例2所述,每个文库都朝着重组中间靶位点(loxF9-AL、AR、BLS、BLRS、BL、BR,参见实施例2)并最终重组两个靶位点之一,loxF9a或loxF9b,的方向进化。通过易错PCR和DNA改组引入新的突变并且通过重组酶的表达水平进一步调控选择压力。活性重组酶通过它们重组相应靶位点以从载体中缺失侧翼为靶位点的序列的能力来选择(参见图8)。
步骤2:
在第二步中,对单个重组酶文库进行进化以在用复制缺陷型pDonor的选择方案之后实施DRiGR(参见图9)。这涉及将在步骤1中生成的文库中的重组酶编码序列克隆到载体骨架pF9(来源)(=pDuoF9 SEQ ID NO:21)中。在该载体中,1至4个重组酶文库可以由操纵子样结构中的共享诱导型启动子表达,该操纵子样结构将两种酶转录连接在一起。该文库的大小超过100000个克隆。
为实施DRiGR,用1ng pDuoF9(来源)文库转化50μl电感受态大肠杆菌XL1-Blue细胞并在含有15μg/ml氯霉素的200ml LB培养基中生长过夜。次日,使用1ml过夜培养物接种100ml新鲜培养基并生长2h。然后,将培养物分成2x 50ml并加入L-阿拉伯糖至终浓度为1-200μg/ml以在培养物之一中诱导重组酶表达。温育2.5h后,将细胞放在冰上并如前所述准备电穿孔(Sambrook和Russell,2001)。将电感受态细胞重悬在200μl水中,并在1700V将200μl细胞悬浮液立即用于转化80ngpDonor。然后,让细菌在SOC培养基中恢复2h,之后使用整个悬浮液接种含有15μg/ml氯霉素、5μg/ml卡那霉素和1-200μg/ml L-阿拉伯糖的200ml LB培养基。将一小部分悬浮液铺板在琼脂板上以评估文库大小。
次日,证实在未诱导细胞铺板的琼脂板上没有菌落生长,证实了pDonor载体(SEQID NO:22)的整合需要重组酶表达。将质粒DNA从液体培养物中分离。为富集成功经历DRiGR的克隆,用酶消化DNA,裂解任何非pDuoF9(产物)-负选择-并重新转化。为此,用各1μl的NdeI、AvrlI、PspXI和FspI消化500ng质粒制备物。在37℃温育3h之后,在膜滤器上通过微渗透清洗DNA。3μl该消化产物用于转化50μl电感受态大肠杆菌XL1-Blue细胞。转化后的细胞在含有15μg/ml氯霉素和15μg/ml卡那霉素的100ml LB培养基中生长-正选择-。
次日,将质粒DNA从培养物中分离,并且用各1μl的NdeI和AvrlI消化500ng DNA。使用引物P1#和P2#(SEQ ID NO:30和31)通过易错PCR扩增重组酶文库并且将PCR产物上柱纯化并用限制酶SacI和SbfI消化。然后,将分离的重组酶文库连接回pDuoF9(来源)中以开始另一个DRiGR循环。在第3个循环和第8个循环之后,进行DNA改组,如前所述(Buchholz和Stewart,2001)。进行十一轮Duo-SLiDE DRIGR以富集能够在靶位点loxF9a和LoxF9b上有效实施DRiGR的重组酶。
步骤3:
在第三步中,对单个重组酶文库进行进化,以在用高拷贝数质粒pDonor-ex8(参见图14,SEQ ID 37)的不同选择方案(参见图14)之后实施DRiGR 2.0,而无需抗生素选择,也无需将整合与分解供体载体分开。这涉及将在步骤2中生成的文库中的重组酶编码序列克隆到载体骨架pF9(来源)(=pDuoF9(来源)SEQ ID NO:21)中。然后,将该文库转化到已经携带有pDonor-ex8的电感受态大肠杆菌XL1-Blue细胞中。转化后的细胞在含有15μg/ml氯霉素、5μg/ml卡那霉素和1-200μg/mlL-阿拉伯糖的100ml LB培养基中生长。该文库大小超过100000个克隆。
次日,将质粒DNA从培养物中分离,并且用各1μl的NdeI、AvrlI、PspXI(限制酶R1、R2和R3,参见图14和图15)和核酸外切酶RecBCD消化1000ng DNA。使用引物P3和P4(SEQ IDNO:32和33)通过易错PCR扩增重组酶文库并且将PCR产物上柱纯化并用限制酶SacI和SbfI消化。然后,将分离的重组酶文库连接回pF9(来源)中并转化到携带pDonor-ex8的电感受态大肠杆菌XL1-Blue细胞中。转化后的细胞在含有15μg/ml氯霉素、5μg/ml卡那霉素和1-200μg/ml L-阿拉伯糖的100ml LB培养基中生长,从而开始下一个循环。每三个循环,进行DNA改组,如前所述(Buchholz和Stewart,2001)。进行十一轮SLiDE DRIGR(参见图14)以富集能够在靶位点loxF9a和LoxF9b上有效实施DRiGR而无需抗生素选择且也无需将整合与分解供体载体分开的重组酶。
使用的引物:
名称 序列 SEQ ID No.
P1# CGGCGTCACACTTTGCTATG 30
P2# CCCTTAAACGCCTGGTGCTA 31
P3 AAGATTAGCGGATCCTACCT 32
P4 GTGATTAGTTAGTGAGAGGC 33
通过该方法,获得了以下重组酶单体的序列:
步骤1之后的R#1(SEQ ID NO:34);步骤2之后的R#7-B5(SEQ ID NO:35)以及最后步骤3之后的Rec F9-3(SEQ ID NO:36)。
在下表中比较了在步骤1、2和3之后获得的重组酶的重组酶效率(DRGR效率):
Figure BDA0002317134990000571
实施例4:
为在治疗环境下利用F9重组酶,F9-1和F9-2编码序列与供体序列一起克隆到递送载体(诸如腺相关病毒载体)中,该供体序列包含在F9基因的外显子8的野生型或Padua突变(R338L)侧翼的loxF9a和loxF9a。将这种载体以多个拷贝递送到靶细胞中以置换基因组中的失活突变(参见图11)。
实施例5:
为证明DRiGD的实用性,将用于切除人类基因组染色体7上的特异性DNA序列的重组酶进行进化。
首先,使用所述底物连接定向进化方案来进化两个不同的重组酶文库(Buchholz和Stewart,2001以及WO 2002044409 A2,参见图8)。针对最终靶位点Hex1和Hex2的左半位点或右半位点(HexL或HexR)来进化文库(参见图21A)。为进化用于HexR的重组酶文库,使用两个中间靶位点(HexR1和HcxR2)(参见图21B)。在整个进化过程中,通过易错PCR(使用引物P1#和P2#)和DNA改组引入新的突变并且通过重组酶的表达水平进一步调控选择压力。活性重组酶通过它们重组相应靶位点以从载体中缺失侧翼为靶位点的序列的能力来选择(参见图8-标准SLiPE以及图21B)。
接下来,将(在HexR个HexL上获得的)两个文库合并以便重组最终靶位点Hex1和Hex2。因此,将这些文库(文库大小大于100000个重组酶)克隆到相同表达质粒中并由操纵子样结构中的共享诱导型启动子共同表达,该操纵子样结构将两种酶转录连接在一起(参见图6pDUO-SLiDE DRiGD)。然后,将携带有这两个文库的质粒转化到XL-1 blue大肠杆菌细胞中。在1ml SOC培养基中回收细胞一小时后,将10μl铺板在含有15μg/ml氯霉素的LB琼脂板上。次日,挑选32个克隆并在含有25μg/ml氯霉素的500μl LB中培养8h。接下来,使用250μl预培养物接种含有25μg/ml氯霉素的2x5ml LB。在其中一个5ml培养基中,加入10μg/ml L-阿拉伯糖以诱导重组酶二聚体的表达。次日,将质粒DNA分离并用ScaI(R2)和SbfI(R3)消化以评估诱导样品和未诱导样品中的重组效率。
利用这种方法,获得了能够高效实施切除反应的两种重组酶二聚体(克隆#7和克隆#30)。通过对重组的pDUO-SLiDE DRiGD测序来确定精确切除,参见图22。
在下表中列出了靶位点以及所使用的中间靶位点和引物:
Hex靶位点 SEQ-ID
Hex1 TACACAGTGTATATTGATTTTTATCAAATGCCTT 40
Hex2 TACACAATGTATATTGATTTTTATCAAATGCCTT 41
HexL TACACAGTGTATATTGATTTTTATACATTGTGTA 42
HexR AAGGCATTTGATATTGATTTTTATCAAATGCCTT 43
HexR1 AAGACATTTTATATTGATTTTTATAAAATGTCTT 44
HexR2 AACGCATTGGATATTGATTTTTATCCAATGCGTT 45
P1# CGGCGTCACACTTTGCTATG 30
P2# AAGGGAATAAGGGCGACACG 31
通过该方法,获得了以下重组酶单体对的序列:
Hex-R-#7:SEQ ID NO:46和Hex-L-#7:SEQ ID NO:47
Hex-R-#30:SEQ ID NO:48和Hex-L-#30:SEQ ID NO:49
引用的非专利文献
Buchholz,F.,&Stewad,A.F.(2001).Alteration of Cre recombinase sitespecificity by substrate-linked protein evolution.Nature Biotechnology,19(11),1047-1052.
Karpinski J,Hauber I,Chemnitz J,et al.(2016).Directed evolution of arecombinase that excises the provirus of most HIV-1 primary isolates withhigh specificity.Nat Biotechnol 34(4):401-9.
Sambrook,J.,&Russell,D.W.(2001).Molecular Cloning:A LaboratoryManual,(3rd edition).
Surendranath,V.et al.(2010).SeLOX--a locus of recombination sitesearch tool for the detection and directed evolution of site-specificrecombination systems.Nucleic Acids Res.2010,38(W293-W298)
Wang M et al.(2016).Efficient delivery of genome-editing proteinsusing bioreducible lipid nanoparticles.PNAS 113:2868-2873.
Zhang,C et al.(2015)Redesign of the monomer-monomer interface of Crerecombinase yields an obligate heterotetrameric complex.Nucleic AcidsRes.2015,43(18):9076-9085.
序列表
<110> 德累斯顿工业大学
<120> 利用设计DNA重组酶遗传改变基因组的方法与手段
<130> 00017P0322EPWO
<150> EP17175895.6
<151> 2017-06-14
<160> 49
<170> PatentIn version 3.5
<210> 1
<211> 343
<212> PRT
<213> Artificial Sequence
<220>
<223> Recombinase F9-1
<220>
<221> MISC_FEATURE
<222> (17)..(17)
<223> Xaa can be any naturally occurring amino acid, preferably
aspartic acid or glycine
<220>
<221> MISC_FEATURE
<222> (19)..(19)
<223> Xaa can be any naturally occurring amino acid, preferably
threonine or alanine
<220>
<221> MISC_FEATURE
<222> (22)..(22)
<223> Xaa can be any naturally occurring amino acid, preferably glycine
or glutamic acid
<220>
<221> MISC_FEATURE
<222> (30)..(30)
<223> Xaa is a small unpolar amino acid, preferably selected from
valine, leucine, isoleucine, alanine and glycine
<220>
<221> MISC_FEATURE
<222> (43)..(43)
<223> Xaa is apositively charged amino acid, preferably lysine or
arginine
<220>
<221> MISC_FEATURE
<222> (60)..(60)
<223> Xaa can be any naturally occurring amino acid, preferably
aspartic acid or asparagine
<220>
<221> MISC_FEATURE
<222> (68)..(68)
<223> Xaa can be any naturally occurring amino acid, preferably proline
or serine
<220>
<221> MISC_FEATURE
<222> (69)..(69)
<223> Xaa is a charged amino acid, preferably selected form aspartic
acid, glutamic acid, lysine or arginine
<220>
<221> MISC_FEATURE
<222> (81)..(81)
<223> Xaa is a polar amino acid, preferably selected from serine,
threonine, cysteine, lysine or arginine
<220>
<221> MISC_FEATURE
<222> (84)..(84)
<223> Xaa can be any naturally occurring amino acid, preferably alanine
or threonine
<220>
<221> MISC_FEATURE
<222> (89)..(89)
<223> Xaa can be any naturally occurring amino acid, preferably leucine
or glutamine
<220>
<221> MISC_FEATURE
<222> (93)..(93)
<223> Xaa is a small amino acid, preferably selected from cysteine,
serine and alanine
<220>
<221> MISC_FEATURE
<222> (140)..(140)
<223> Xaa can be any naturally occurring amino acid, preferably
isoleucine or threonine
<220>
<221> MISC_FEATURE
<222> (166)..(166)
<223> Xaa is an unpolar amino acid, preferably selected from
isoleucine, leucine and valine
<220>
<221> MISC_FEATURE
<222> (177)..(177)
<223> Xaa is an unpolar amino acid, preferably selected from
isoleucine, leucine and valine
<220>
<221> MISC_FEATURE
<222> (182)..(182)
<223> Xaa is an unpolar amino acid, preferably selected from
isoleucine, leucine and valine
<220>
<221> misc_feature
<222> (183)..(183)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> MISC_FEATURE
<222> (184)..(184)
<223> Xaa is a postively cahrged amino acid, preferably selected from
lysine and arginine
<220>
<221> MISC_FEATURE
<222> (186)..(186)
<223> Xaa is a polar amino acid, preferably selected from serine or
threonine
<220>
<221> MISC_FEATURE
<222> (206)..(206)
<223> Xaa can be any naturally occurring amino acid, preferably alanine
or threonine
<220>
<221> MISC_FEATURE
<222> (222)..(222)
<223> Xaa can be any naturally occurring amino acid, preferably valine
or glutamic acid
<220>
<221> MISC_FEATURE
<222> (225)..(225)
<223> Xaa is an unpolar amino acid, preferably selected from
isoleucine, leucine and valine
<220>
<221> MISC_FEATURE
<222> (237)..(237)
<223> Xaa is a polar amino acid, preferably selected from serine,
threonine, cysteine or tyrosine
<220>
<221> MISC_FEATURE
<222> (239)..(239)
<223> Xaa is an unpolar amino acid, preferably selected from
isoleucine, leucine, valine or phenylalanine
<220>
<221> MISC_FEATURE
<222> (249)..(249)
<223> Xaa is a small unpolar amino acid, preferably selected from
alanine, glycine, isoleucine, leucine and valine
<220>
<221> MISC_FEATURE
<222> (259)..(259)
<223> Xaa can be any naturally occurring amino acid, preferably
phenylalanine or proline
<220>
<221> MISC_FEATURE
<222> (260)..(260)
<223> Xaa can be any naturally occurring amino acid, preferably
threonine or alanine
<220>
<221> MISC_FEATURE
<222> (264)..(264)
<223> Xaa can be any naturally occurring amino acid, preferably alanine
or aspartic acid
<220>
<221> MISC_FEATURE
<222> (278)..(278)
<223> Xaa can be any naturally occurring amino acid, preferably leucine
or glutamine
<220>
<221> MISC_FEATURE
<222> (284)..(284)
<223> Xaa is an unpolar amino acid, preferably selected from
isoleucine, leucine or valine
<220>
<221> MISC_FEATURE
<222> (318)..(318)
<223> Xaa is an unpolar amino acid, preferably selected from
isoleucine, leucine or valine
<220>
<221> MISC_FEATURE
<222> (342)..(342)
<223> Xaa can be any naturally occurring amino acid, preferably glycine
or aspartic acid
<400> 1
Met Ser Asn Leu Gln Thr Leu His Gln Asn Leu Ser Ala Leu Leu Val
1 5 10 15
Xaa Ala Xaa Ser Asp Xaa Ala Arg Lys Asn Leu Met Asp Xaa Phe Arg
20 25 30
Asp Arg Gln Ala Phe Ser Glu His Thr Trp Xaa Val Leu Leu Ser Val
35 40 45
Cys Arg Ser Trp Ala Ala Trp Cys Lys Leu Asn Xaa Arg Lys Trp Phe
50 55 60
Pro Ala Glu Xaa Xaa Asp Val Arg Asp Tyr Leu Leu His Leu Gln Ala
65 70 75 80
Xaa Gly Leu Xaa Val Asn Thr Ile Xaa Gln His Leu Xaa Gln Leu Asn
85 90 95
Met Leu His Arg Arg Ser Gly Leu Pro Arg Pro Gly Asp Ser Asn Ala
100 105 110
Val Ser Leu Val Met Arg Arg Ile Arg Lys Glu Asn Val Asp Ala Gly
115 120 125
Glu Arg Val Lys Gln Ala Leu Ala Phe Glu Arg Xaa Asp Phe Asp Gln
130 135 140
Val Arg Ser Leu Met Glu Asn Ser Asp Arg Cys Gln Asp Ile Arg Asn
145 150 155 160
Leu Ala Phe Leu Gly Xaa Ala Tyr Asn Thr Leu Leu Arg Ile Ser Glu
165 170 175
Xaa Ala Arg Ile Arg Xaa Xaa Asp Ile Xaa Arg Thr Asp Gly Gly Arg
180 185 190
Met Leu Ile His Ile Gly Arg Thr Lys Thr Leu Val Ser Xaa Ala Gly
195 200 205
Val Glu Lys Ala Leu Ser Leu Arg Val Thr Arg Leu Val Xaa Arg Trp
210 215 220
Xaa Ser Val Ser Gly Val Ala Asp Asp Pro Asn Asn Xaa Leu Xaa Cys
225 230 235 240
Arg Val Arg Arg Asn Gly Val Ala Xaa Pro Ser Ala Thr Ser Gln Leu
245 250 255
Ser Thr Xaa Xaa Leu Gln Gly Xaa Phe Ala Ala Ala His Arg Leu Ile
260 265 270
Tyr Gly Ala Arg Asp Xaa Ser Gly Gln Arg Tyr Xaa Thr Trp Ser Gly
275 280 285
His Ser Ala Arg Val Gly Ala Ala Arg Asp Met Ala Arg Ala Gly Val
290 295 300
Ser Ile Ala Glu Ile Met Gln Ala Gly Gly Trp Thr Thr Xaa Glu Ser
305 310 315 320
Val Met Asn Tyr Ile Arg Asn Leu Asp Ser Glu Thr Gly Ala Met Val
325 330 335
Arg Leu Leu Glu Asp Xaa Asp
340
<210> 2
<211> 343
<212> PRT
<213> Artificial Sequence
<220>
<223> Recombinase F9-2
<220>
<221> misc_feature
<222> (3)..(3)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (5)..(5)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (8)..(8)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (14)..(14)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (16)..(16)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (18)..(21)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (31)..(31)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (39)..(39)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (80)..(80)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (84)..(84)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (93)..(93)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (97)..(97)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (125)..(125)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (132)..(132)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (182)..(183)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (186)..(186)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (195)..(195)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (206)..(206)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (216)..(216)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (249)..(249)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (253)..(253)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (259)..(260)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (264)..(264)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (266)..(266)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (273)..(273)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (276)..(276)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (278)..(278)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (306)..(306)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (325)..(325)
<223> Xaa can be any naturally occurring amino acid
<400> 2
Met Ser Xaa Leu Xaa Thr Leu Xaa Gln Asn Leu Ser Ala Xaa Leu Xaa
1 5 10 15
Asp Xaa Xaa Xaa Xaa Glu Ala Arg Lys Asn Leu Met Asp Val Xaa Arg
20 25 30
Asp Arg Gln Ala Phe Ser Xaa His Thr Trp Arg Val Leu Leu Ser Val
35 40 45
Cys Arg Ser Trp Ala Ala Trp Cys Glu Leu Asn Asn Arg Lys Trp Phe
50 55 60
Pro Ala Glu Pro Glu Asp Val Arg Asp Tyr Leu Leu His Leu Gln Xaa
65 70 75 80
Arg Gly Leu Xaa Val Asn Thr Ile Gln Gln His Leu Xaa Gln Leu Asn
85 90 95
Xaa Leu His Arg Arg Ser Gly Leu Pro Arg Pro Gly Asp Ser Asn Ala
100 105 110
Val Ser Leu Val Met Arg Arg Ile Arg Lys Glu Asn Xaa Asp Ala Gly
115 120 125
Glu Arg Val Xaa Gln Ala Leu Ala Phe Glu Arg Thr Asp Phe Asp Gln
130 135 140
Val Arg Ser Leu Met Glu Asn Ser Asp Arg Cys Gln Asp Ile Arg Asn
145 150 155 160
Leu Ala Phe Leu Gly Val Ala Tyr Asn Thr Leu Leu Arg Ile Ser Glu
165 170 175
Ile Ala Arg Ile Arg Xaa Xaa Asp Ile Xaa Arg Thr Asp Gly Gly Arg
180 185 190
Met Leu Xaa His Ile Gly Arg Thr Lys Thr Leu Val Ser Xaa Ala Gly
195 200 205
Val Glu Lys Ala Leu Ser Leu Xaa Val Thr Lys Leu Val Glu Arg Trp
210 215 220
Ile Ser Val Ser Gly Val Ala Asp Asp Pro Asn Asn Tyr Leu Phe Cys
225 230 235 240
Arg Val Arg Arg Asn Gly Val Ala Xaa Pro Ser Ala Xaa Ser Gln Leu
245 250 255
Ser Thr Xaa Xaa Leu Gln Gly Xaa Phe Xaa Ala Ala His Arg Leu Ile
260 265 270
Xaa Gly Ala Xaa Asp Xaa Ser Gly Gln Arg Tyr Leu Thr Trp Ser Gly
275 280 285
His Ser Ala Arg Val Gly Ala Ala Arg Asp Met Ala Arg Ala Gly Val
290 295 300
Ser Xaa Ala Glu Ile Met Gln Ala Gly Gly Trp Thr Thr Val Glu Ser
305 310 315 320
Val Met Asn Tyr Xaa Arg Asn Leu Asp Ser Glu Thr Gly Ala Met Val
325 330 335
Arg Leu Leu Glu Asp Gly Asp
340
<210> 3
<211> 343
<212> PRT
<213> Artificial Sequence
<220>
<223> Recombinase F9-1a
<400> 3
Met Ser Asn Leu Gln Thr Leu His Gln Asn Leu Ser Ala Leu Leu Val
1 5 10 15
Asp Ala Thr Ser Asp Gly Ala Arg Lys Asn Leu Met Asp Val Phe Arg
20 25 30
Asp Arg Gln Ala Phe Ser Glu His Thr Trp Lys Val Leu Leu Ser Val
35 40 45
Cys Arg Ser Trp Ala Ala Trp Cys Lys Leu Asn Asn Arg Lys Trp Phe
50 55 60
Pro Ala Glu Pro Glu Asp Val Arg Asp Tyr Leu Leu His Leu Gln Ala
65 70 75 80
Cys Gly Leu Ala Val Asn Thr Ile Leu Gln His Leu Ala Gln Leu Asn
85 90 95
Met Leu His Arg Arg Ser Gly Leu Pro Arg Pro Gly Asp Ser Asn Ala
100 105 110
Val Ser Leu Val Met Arg Arg Ile Arg Lys Glu Asn Val Asp Ala Gly
115 120 125
Glu Arg Val Lys Gln Ala Leu Ala Phe Glu Arg Ile Asp Phe Asp Gln
130 135 140
Val Arg Ser Leu Met Glu Asn Ser Asp Arg Cys Gln Asp Ile Arg Asn
145 150 155 160
Leu Ala Phe Leu Gly Ile Ala Tyr Asn Thr Leu Leu Arg Ile Ser Glu
165 170 175
Val Ala Arg Ile Arg Ile Lys Asp Ile Ser Arg Thr Asp Gly Gly Arg
180 185 190
Met Leu Ile His Ile Gly Arg Thr Lys Thr Leu Val Ser Ala Ala Gly
195 200 205
Val Glu Lys Ala Leu Ser Leu Arg Val Thr Arg Leu Val Val Arg Trp
210 215 220
Val Ser Val Ser Gly Val Ala Asp Asp Pro Asn Asn Tyr Leu Phe Cys
225 230 235 240
Arg Val Arg Arg Asn Gly Val Ala Val Pro Ser Ala Thr Ser Gln Leu
245 250 255
Ser Thr Phe Thr Leu Gln Gly Val Phe Ala Ala Ala His Arg Leu Ile
260 265 270
Tyr Gly Ala Arg Asp Ala Ser Gly Gln Arg Tyr Leu Thr Trp Ser Gly
275 280 285
His Ser Ala Arg Val Gly Ala Ala Arg Asp Met Ala Arg Ala Gly Val
290 295 300
Ser Ile Ala Glu Ile Met Gln Ala Gly Gly Trp Thr Thr Val Glu Ser
305 310 315 320
Val Met Asn Tyr Ile Arg Asn Leu Asp Ser Glu Thr Gly Ala Met Val
325 330 335
Arg Leu Leu Glu Asp Gly Asp
340
<210> 4
<211> 343
<212> PRT
<213> Artificial Sequence
<220>
<223> Recombinase F9-2a
<400> 4
Met Ser Lys Leu Pro Thr Leu His Gln Asn Leu Ser Ala Leu Leu Ala
1 5 10 15
Asp Ala Thr Ser Asp Glu Ala Arg Lys Asn Leu Met Asp Val Leu Arg
20 25 30
Asp Arg Gln Ala Phe Ser Lys His Thr Trp Arg Val Leu Leu Ser Val
35 40 45
Cys Arg Ser Trp Ala Ala Trp Cys Glu Leu Asn Asn Arg Lys Trp Phe
50 55 60
Pro Ala Glu Pro Glu Asp Val Arg Asp Tyr Leu Leu His Leu Gln Thr
65 70 75 80
Arg Gly Leu Thr Val Asn Thr Ile Gln Gln His Leu Cys Gln Leu Asn
85 90 95
Leu Leu His Arg Arg Ser Gly Leu Pro Arg Pro Gly Asp Ser Asn Ala
100 105 110
Val Ser Leu Val Met Arg Arg Ile Arg Lys Glu Asn Ile Asp Ala Gly
115 120 125
Glu Arg Val Lys Gln Ala Leu Ala Phe Glu Arg Thr Asp Phe Asp Gln
130 135 140
Val Arg Ser Leu Met Glu Asn Ser Asp Arg Cys Gln Asp Ile Arg Asn
145 150 155 160
Leu Ala Phe Leu Gly Val Ala Tyr Asn Thr Leu Leu Arg Ile Ser Glu
165 170 175
Ile Ala Arg Ile Arg Val Arg Asp Ile Thr Arg Thr Asp Gly Gly Arg
180 185 190
Met Leu Ile His Ile Gly Arg Thr Lys Thr Leu Val Ser Ala Ala Gly
195 200 205
Val Glu Lys Ala Leu Ser Leu Gly Val Thr Lys Leu Val Glu Arg Trp
210 215 220
Ile Ser Val Ser Gly Val Ala Asp Asp Pro Asn Asn Tyr Leu Phe Cys
225 230 235 240
Arg Val Arg Arg Asn Gly Val Ala Ala Pro Ser Ala Ile Ser Gln Leu
245 250 255
Ser Thr Pro Ala Leu Gln Gly Val Phe Ala Ala Ala His Arg Leu Ile
260 265 270
His Gly Ala Lys Asp Ala Ser Gly Gln Arg Tyr Leu Thr Trp Ser Gly
275 280 285
His Ser Ala Arg Val Gly Ala Ala Arg Asp Met Ala Arg Ala Gly Val
290 295 300
Ser Val Ala Glu Ile Met Gln Ala Gly Gly Trp Thr Thr Val Glu Ser
305 310 315 320
Val Met Asn Tyr Leu Arg Asn Leu Asp Ser Glu Thr Gly Ala Met Val
325 330 335
Arg Leu Leu Glu Asp Gly Asp
340
<210> 5
<211> 343
<212> PRT
<213> Artificial Sequence
<220>
<223> Recombinase F9-1b
<400> 5
Met Ser Asn Leu Gln Thr Leu His Gln Asn Leu Ser Ala Leu Leu Val
1 5 10 15
Gly Ala Ala Ser Asp Glu Ala Arg Lys Asn Leu Met Asp Ala Phe Arg
20 25 30
Asp Arg Gln Ala Phe Ser Glu His Thr Trp Arg Val Leu Leu Ser Val
35 40 45
Cys Arg Ser Trp Ala Ala Trp Cys Lys Leu Asn Asp Arg Lys Trp Phe
50 55 60
Pro Ala Glu Ser Lys Asp Val Arg Asp Tyr Leu Leu His Leu Gln Ala
65 70 75 80
Arg Gly Leu Thr Val Asn Thr Ile Gln Gln His Leu Cys Gln Leu Asn
85 90 95
Met Leu His Arg Arg Ser Gly Leu Pro Arg Pro Gly Asp Ser Asn Ala
100 105 110
Val Ser Leu Val Met Arg Arg Ile Arg Lys Glu Asn Val Asp Ala Gly
115 120 125
Glu Arg Val Lys Gln Ala Leu Ala Phe Glu Arg Thr Asp Phe Asp Gln
130 135 140
Val Arg Ser Leu Met Glu Asn Ser Asp Arg Cys Gln Asp Ile Arg Asn
145 150 155 160
Leu Ala Phe Leu Gly Val Ala Tyr Asn Thr Leu Leu Arg Ile Ser Glu
165 170 175
Ile Ala Arg Ile Arg Val Arg Asp Ile Thr Arg Thr Asp Gly Gly Arg
180 185 190
Met Leu Ile His Ile Gly Arg Thr Lys Thr Leu Val Ser Thr Ala Gly
195 200 205
Val Glu Lys Ala Leu Ser Leu Arg Val Thr Arg Leu Val Glu Arg Trp
210 215 220
Ile Ser Val Ser Gly Val Ala Asp Asp Pro Asn Asn Cys Leu Ile Cys
225 230 235 240
Arg Val Arg Arg Asn Gly Val Ala Ala Pro Ser Ala Thr Ser Gln Leu
245 250 255
Ser Thr Pro Ala Leu Gln Gly Ile Phe Ala Ala Ala His Arg Leu Ile
260 265 270
Tyr Gly Ala Arg Asp Asp Ser Gly Gln Arg Tyr Gln Thr Trp Ser Gly
275 280 285
His Ser Ala Arg Val Gly Ala Ala Arg Asp Met Ala Arg Ala Gly Val
290 295 300
Ser Ile Ala Glu Ile Met Gln Ala Gly Gly Trp Thr Thr Ile Glu Ser
305 310 315 320
Val Met Asn Tyr Leu Arg Asn Leu Asp Ser Glu Thr Gly Ala Met Val
325 330 335
Arg Leu Leu Glu Asp Asp Asp
340
<210> 6
<211> 343
<212> PRT
<213> Artificial Sequence
<220>
<223> F9-2b
<400> 6
Met Ser Asn Leu Gln Thr Leu Thr Gln Asn Leu Ser Ala Ile Leu Val
1 5 10 15
Asp Gly Ala Asn Gly Glu Ala Arg Lys Asn Leu Met Asp Val Phe Arg
20 25 30
Asp Arg Gln Ala Phe Ser Glu His Thr Trp Arg Val Leu Leu Ser Val
35 40 45
Cys Arg Ser Trp Ala Ala Trp Cys Glu Leu Asn Asn Arg Lys Trp Phe
50 55 60
Pro Ala Glu Pro Glu Asp Val Arg Asp Tyr Leu Leu His Leu Gln Ala
65 70 75 80
Arg Gly Leu Ala Val Asn Thr Ile Gln Gln His Leu Ala Gln Leu Asn
85 90 95
Met Leu His Arg Arg Ser Gly Leu Pro Arg Pro Gly Asp Ser Asn Ala
100 105 110
Val Ser Leu Val Met Arg Arg Ile Arg Lys Glu Asn Val Asp Ala Gly
115 120 125
Glu Arg Val Arg Gln Ala Leu Ala Phe Glu Arg Thr Asp Phe Asp Gln
130 135 140
Val Arg Ser Leu Met Glu Asn Ser Asp Arg Cys Gln Asp Ile Arg Asn
145 150 155 160
Leu Ala Phe Leu Gly Val Ala Tyr Asn Thr Leu Leu Arg Ile Ser Glu
165 170 175
Ile Ala Arg Ile Arg Ile Lys Asp Ile Ser Arg Thr Asp Gly Gly Arg
180 185 190
Met Leu Val His Ile Gly Arg Thr Lys Thr Leu Val Ser Thr Ala Gly
195 200 205
Val Glu Lys Ala Leu Ser Leu Arg Val Thr Lys Leu Val Glu Arg Trp
210 215 220
Ile Ser Val Ser Gly Val Ala Asp Asp Pro Asn Asn Tyr Leu Phe Cys
225 230 235 240
Arg Val Arg Arg Asn Gly Val Ala Val Pro Ser Ala Thr Ser Gln Leu
245 250 255
Ser Thr Ser Thr Leu Gln Gly Ile Phe Gly Ala Ala His Arg Leu Ile
260 265 270
Tyr Gly Ala Gln Asp Asp Ser Gly Gln Arg Tyr Leu Thr Trp Ser Gly
275 280 285
His Ser Ala Arg Val Gly Ala Ala Arg Asp Met Ala Arg Ala Gly Val
290 295 300
Ser Ile Ala Glu Ile Met Gln Ala Gly Gly Trp Thr Thr Val Glu Ser
305 310 315 320
Val Met Asn Tyr Ile Arg Asn Leu Asp Ser Glu Thr Gly Ala Met Val
325 330 335
Arg Leu Leu Glu Asp Gly Gly
340
<210> 7
<211> 34
<212> DNA
<213> Homo sapiens
<400> 7
ctcattacat ttaaccaaaa ttatcacaat ataa 34
<210> 8
<211> 34
<212> DNA
<213> Homo sapiens
<400> 8
ccatcttttg ttagatttga atatatacat tcta 34
<210> 9
<211> 34
<212> DNA
<213> Bacteriophage P1
<400> 9
ataacttcgt ataatgtatg ctatacgaag ttat 34
<210> 10
<211> 34
<212> DNA
<213> Homo sapiens
<400> 10
atatatacgt atatagacat atatacgtat atat 34
<210> 11
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> LoxM7 target site - artificial variant of LoxP
<400> 11
ataactctat ataatgtatg ctatatagag ttat 34
<210> 12
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> LoxM5 target site - artificial variant of LoxP
<400> 12
ataacttcgt gcaatgtatg ctgcacgaag ttat 34
<210> 13
<211> 34
<212> DNA
<213> Human immunodeficiency virus
<400> 13
acaacatcct attacaccct atatgccaac atgg 34
<210> 14
<211> 34
<212> DNA
<213> Human immunodeficiency virus
<400> 14
aacccactgc ttaagcctca ataaagcttg cctt 34
<210> 15
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Intermediate target site loxF9-AL
<400> 15
ctcattacat ttaaccaaaa ttaaatgtaa tgag 34
<210> 16
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Intermediate target site loxF9-AR
<400> 16
ttatattgtg ataaccaaaa ttatcacaat ataa 34
<210> 17
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Intermediate target site loxF9-BLS
<400> 17
ccaacttttg atagatttga atatcaaaag ttgg 34
<210> 18
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Intermediate target site loxF9-BRS
<400> 18
tagactttat atagatttga atatataaag tcta 34
<210> 19
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Intermediate target site loxF9-BL
<400> 19
ccatcttttg ttagatttga ataacaaaag atgg 34
<210> 20
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Intermediate target site loxF9-BR
<400> 20
ccatcttttg ttagatttga ataacaaaag atgg 34
<210> 21
<211> 7184
<212> DNA
<213> Artificial Sequence
<220>
<223> vector pDuoF9 (source)
<220>
<221> P1 binding site
<222> (1412)..(1430)
<220>
<221> Rec. F9-1 (placeholder)
<222> (1519)..(2550)
<220>
<221> Ribosome binding site
<222> (2551)..(2633)
<220>
<221> Rec. F9-2 (placeholder)
<222> (2634)..(3665)
<220>
<221> LoxF9a
<222> (4220)..(4253)
<220>
<221> LoxF9b
<222> (4961)..(4994)
<220>
<221> P2 binding site
<222> (5012)..(5028)
<220>
<221> CmR
<222> (5315)..(5974)
<220>
<221> Ori
<222> (6336)..(7184)
<400> 21
gctcatgagc ccgaagtggc gagcccgatc ttccccatcg gtgatgtcgg cgatataggc 60
gccagcaacc gcacctgtgg cgccggtgat gccggccacg atgcgtccgg cgtagaggat 120
ctgctcatgt ttgacagctt atcatcgatg cataatgtgc ctgtcaaatg gacgaagcag 180
ggattctgca aaccctatgc tactccgtca agccgtcaat tgtctgattc gttaccaatt 240
atgacaactt gacggctaca tcattcactt tttcttcaca accggcacgg aactcgctcg 300
ggctggcccc ggtgcatttt ttaaataccc gcgagaaata gagttgatcg tcaaaaccaa 360
cattgcgacc gacggtggcg ataggcatcc gggtggtgct caaaagcagc ttcgcctggc 420
tgatacgttg gtcctcgcgc cagcttaaga cgctaatccc taactgctgg cggaaaagat 480
gtgacagacg cgacggcgac aagcaaacat gctgtgcgac gctggcgata tcaaaattgc 540
tgtctgccag gtgatcgctg atgtactgac aagcctcgcg tacccgatta tccatcggtg 600
gatggagcga ctcgttaatc gcttccatgc gccgcagtaa caattgctca agcagattta 660
tcgccagcag ctccgaatag cgcccttccc cttgcccggc gttaatgatt tgcccaaaca 720
ggtcgctgaa atgcggctgg tgcgcttcat ccgggcgaaa gaaccccgta ttggcaaata 780
ttgacggcca gttaagccat tcatgccagt aggcgcgcgg acgaaagtaa acccactggt 840
gataccattc gcgagcctcc ggatgacgac cgtagtgatg aatctctcct ggcgggaaca 900
gcaaaatatc acccggtcgg caaacaaatt ctcgtccctg atttttcacc accccctgac 960
cgcgaatggt gagattgaga atataacctt tcattcccag cggtcggtcg ataaaaaaat 1020
cgagataacc gttggcctca atcggcgtta aacccgccac cagatgggca ttaaacgagt 1080
atcccggcag caggggatca ttttgcgctt cagccatact tttcatactc ccgccattca 1140
gagaagaaac caattgtcca tattgcatca gacattgccg tcactgcgtc ttttactggc 1200
tcttctcgct aaccaaaccg gtaaccccgc ttattaaaag cattctgtaa caaagcggga 1260
ccaaagccat gacaaaaacg cgtaacaaaa gtgtctataa tcacggcaga aaagtccaca 1320
ttgattattt gcacggcgtc acactttgct atgccatagc atttttatcc ataagattag 1380
cggatcctac ctgacgcttt ttatcgcaac tctctactgt ttctccatac ccgttttttt 1440
gggctagcga attcgagctc taaggaggtg ccacaattct cgagccatac ccattctaat 1500
gatcataagg aggtgtacat gtcaatacta ctgaccttgc accaaagttt gtccgcatta 1560
ctggtcgatg caacgagtga tgaggctcgc aagaacctga tggatgtgct cagggatcgc 1620
caggcgttct ccgagcgtac ctggaaagtg ctcctgtccg tttgccggac gtgggcggca 1680
tggtgcaagt tgaacaaccg gaaatggttt cccgcggaac ctgaagatgt tcgcgattac 1740
cttctacatc ttcaggctcg cggtctggca gtaaacacta tcctgcaaca tttggcccag 1800
ctaaacatgc tccaccgtcg gttcgggctg ccacgaccgg gcgacagcga cgctgtttca 1860
ctggttatgc ggcgaatccg aagggagaac gtcgatgctg gtgagcgtac gaagcaggcc 1920
ctagcgttcg agcgcactga cttcgaccag gttcgtgcac tcatggaaaa tagcgaacgg 1980
ggccaggata tacgtactct ggcacttctg ggggttgctt ataacaccct gttacgcgta 2040
tccgaaattg ccaggattcg gattaaagac atctcacgta ctgacggtgg gaggatgcta 2100
atccacatta gcagaacgaa aacgctggtc agcaccgcag gcgtagagaa ggcgcttagc 2160
ctgggggtaa ctaaactggt cgagcgatgg atttccgtct ctggtgtggc tagtgaccca 2220
aacaattacc tgttttgcca ggttagaata aatggtgtgg ccgtgccgtc tgccaccagc 2280
cggctatcaa ccgacgtcct gcgaaagatt tttgaggctg cccaccgcct gatctacggt 2340
gccaaggatg gctctggtca gagatacctg gcctggtctg ggcacagtgc ccgtgtcgga 2400
gccgcgcggg atatggcccg cgctggggtt tcaatagcgg agattatgca ggctggtggc 2460
tggaccaccg tagagagtgt catgaactat atccgtaacc tggacagtga gacaggggca 2520
atggtgcgtc tgctggaaga tggcgactag tctagaggta ccattccgat cgcggatcgg 2580
ccggaatggg atagacgtcc tatcatccac acctactagt taaggaggtg tacatgtcaa 2640
tactactgac cttgcaccaa agtttgtccg cattactggt cgatgcaacg agtgatgagg 2700
ctcgcaagaa cctgatggat gtgctcaggg atcgccaggc gttctccgag cgtacctgga 2760
aagtgctcct gtccgtttgc cggacgtggg cggcatggtg caagttgaac aaccggaaat 2820
ggtttcccgc ggaacctgaa gatgttcgcg attaccttct acatcttcag gctcgcggtc 2880
tggcagtaaa cactatcctg caacatttgg cccagctaaa catgctccac cgtcggttcg 2940
ggctgccacg accgggcgac agcgacgctg tttcactggt tatgcggcga atccgaaggg 3000
agaacgtcga tgctggtgag cgtacgaagc aggccctagc gttcgagcgc actgacttcg 3060
accaggttcg tgcactcatg gaaaatagcg aacggggcca ggatatacgt actctggcac 3120
ttctgggggt tgcttataac accctgttac gcgtatccga aattgccagg attcggatta 3180
aagacatctc acgtactgac ggtgggagga tgctaatcca cattagcaga acgaaaacgc 3240
tggtcagcac cgcaggcgta gagaaggcgc ttagcctggg ggtaactaaa ctggtcgagc 3300
gatggatttc cgtctctggt gtggctagtg acccaaacaa ttacctgttt tgccaggtta 3360
gaataaatgg tgtggccgtg ccgtctgcca ccagccggct atcaaccgac gtcctgcgaa 3420
agatttttga ggctgcccac cgcctgatct acggtgccaa ggatggctct ggtcagagat 3480
acctggcctg gtctgggcac agtgcccgtg tcggagccgc gcgggatatg gcccgcgctg 3540
gggtttcaat agcggagatt atgcaggctg gtggctggac caccgtagag agtgtcatga 3600
actatatccg taacctggac agtgagacag gggcaatggt gcgtctgctg gaagatggcg 3660
actagtctag acgtacgcct gcaggcaagc ttggctgttt tggcggatga gagaagattt 3720
tcagcctgat acagattaaa tcagaacgca gaagcggtct gataaaacag aatttgcctg 3780
gcggcagtag cgcggtggtc ccacctgacc ccatgccgaa ctcagaagtg aaacgccgta 3840
gcgccgatgg tagtgtgggg tctccccatg cgagagtagg gaactgccag gcatcaaata 3900
aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt gtcggtgaac 3960
gctctcctga gtaggacaaa tccgccggga gcggatttga acgttgcgaa gcaacggccc 4020
ggagggtggc gggcaggacg cccgccataa actgccaggc atcaaattaa gcagaaggcc 4080
atcctgacgg atggcctttt tgcgtttcta caaactcttt tgtttatttt tctaaataca 4140
ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 4200
aaggaagagt atgagatctc tcattacatt taaccaaaat tatcacaata taaaagcttg 4260
catgcctgca gatcgaggct ggcctgtatc ggacgggtca tctcgtttcc ttagctgtgt 4320
gcgccatgta aatggcccgg acgtgatggc gtaaatccac ggctgtagcg cgctacgctt 4380
agatcctcat atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagt 4440
atacactccg ctatcgctac gtgactgggt catggctgcg ccccgacacc cgccaacacc 4500
cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 4560
cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgaggca 4620
gctgtggaat gtgtgtcagt tagggtgtgg aaagtcccca ggctccccag caggcagaag 4680
tatgcaaagc atgcatctca attagtcagc aaccaggtgt ggaaagtccc caggctcccc 4740
agcaggcaga agtatgcaaa gcatgcatct caattagtca gcaaccatag tcccgcccct 4800
aactccgccc atcccgcccc taactccgcc cagttccgcc cattctccgc cccatggctg 4860
actaattttt tttatttatg cagaggccga ggccgcctcg gcctaggaac agtcgacgac 4920
actgcagaga cctacttcac taacaaccgg tacagttcga ccatcttttg ttagatttga 4980
atatatacat tctaagatct caacatttcc gtgtcgccct tattcccttt tttgcggcat 5040
tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc 5100
agttgggtgc agcaaactat taactggcga actacttact ctagcttccc ggcaacaatt 5160
aatagactgg atggaggcgg ataaagttgc aggaccactt ctgcgctcgg cccggtcgaa 5220
tttgctttcg aatttctgcc attcatccgc ttattatcac ttattcaggc gtagcaccag 5280
gcgtttaagg gcaccaataa ctgccttaaa aaaattacgc cccgccctgc cactcatcgc 5340
agtactgttg taattcatta agcattctgc cgacatggaa gccatcacag acggcatgat 5400
gaacctgaat cgccagcggc atcagcacct tgtcgccttg cgtataatat ttgcccatgg 5460
tgaaaacggg ggcgaagaag ttgtccatat tggccacgtt taaatcaaaa ctggtgaaac 5520
tcacccaggg attggctgag acgaaaaaca tattctcaat aaacccttta gggaaatagg 5580
ccaggttttc accgtaacac gccacatctt gcgaatatat gtgtagaaac tgccggaaat 5640
cgtcgtggta ttcactccag agcgatgaaa acgtttcagt ttgctcatgg aaaacggtgt 5700
aacaagggtg aacactatcc catatcacca gctcaccgtc tttcattgcc atacggaatt 5760
ccggatgagc attcatcagg cgggcaagaa tgtgaataaa ggccggataa aacttgtgct 5820
tatttttctt tacggtcttt aaaaaggccg taatatccag ctgaacggtc tggttatagg 5880
tacattgagc aactgactga aatgcctcaa aatgttcttt acgatgccat tgggatatat 5940
caacggtggt atatccagtg atttttttct ccattttagc ttccttagct cctgaaaatc 6000
tcgataactc aaaaaatacg cccggtagtg atcttatttc attatggtga aagttggaac 6060
ctcttacgtg ccgatcaacg tctcattttc gccaaaagtt ggcccagggc ttcccggtat 6120
caacagggac accaggattt atttattctg cgaagtgatc ttccgtcaca ggtatttatt 6180
cggcgcaaag tgcgtcgggt gatgctgcca acttactgat ttagtgtatg atggtgtttt 6240
tgaggtgctc cagtggcttc tgtttctatc agctgtccct cctgttcagc tactgacggg 6300
gtggtgcgta acggcaaaag caccgccgga catcagcgct agcggagtgt atactggctt 6360
actatgttgg cactgatgag ggtgtcagtg aagtgcttca tgtggcagga gaaaaaaggc 6420
tgcaccggtg cgtcagcaga atatgtgata caggatatat tccgcttcct cgctcactga 6480
ctcgctacgc tcggtcgttc gactgcggcg agcggaaatg gcttacgaac ggggcggaga 6540
tttcctggaa gatgccagga agatacttaa cagggaagtg agagggccgc ggcaaagccg 6600
tttttccata ggctccgccc ccctgacaag catcacgaaa tctgacgctc aaatcagtgg 6660
tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggcgg ctccctcgtg 6720
cgctctcctg ttcctgcctt tcggtttacc ggtgtcattc cgctgttatg gccgcgtttg 6780
tctcattcca cgcctgacac tcagttccgg gtaggcagtt cgctccaagc tggactgtat 6840
gcacgaaccc cccgttcagt ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 6900
caacccggaa agacatgcaa aagcaccact ggcagcagcc actggtaatt gatttagagg 6960
agttagtctt gaagtcatgc gccggttaag gctaaactga aaggacaagt tttggtgact 7020
gcgctcctcc aagccagtta cctcggttca aagagttggt agctcagaga accttcgaaa 7080
aaccgccctg caaggcggtt ttttcgtttt cagagcaaga gattacgcgc agaccaaaac 7140
gatctcaaga agatcatctt attaatcaga taaaatattt ctag 7184
<210> 22
<211> 2795
<212> DNA
<213> Artificial Sequence
<220>
<223> pDonor vector
<220>
<221> AmpR
<222> (121)..(981)
<220>
<221> LoxF9a
<222> (1042)..(1075)
<220>
<221> KanR
<222> (1172)..(1987)
<220>
<221> LoxF9b
<222> (2062)..(2095)
<220>
<221> R6K-ori
<222> (2328)..(2719)
<400> 22
tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca ttcaaatatg 60
tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa aaggaagagt 120
atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt ttgccttcct 180
gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca gttgggtgca 240
cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag ttttcgcccc 300
gaagaacgtt ttccaatgat gagcactttt aaagttctgc tatgtggcgc ggtattatcc 360
cgtgttgacg ccgggcaaga gcaactcggt cgccgcatac actattctca gaatgacttg 420
gttgagtact caccagtcac agaaaagcat cttacggatg gcatgacagt aagagaatta 480
tgcagtgctg ccataaccat gagtgataac actgcggcca acttacttct gacaacgatc 540
ggaggaccga aggagctaac cgcttttttg cacaacatgg gggatcatgt aactcgcctt 600
gatcgttggg aaccggagct gaatgaagcc ataccaaacg acgagcgtga caccacgatg 660
cctgcagcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact tactctagct 720
tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc acttctgcgc 780
tcggcccttc cggctggctg gtttattgct gataaatctg gagccggtga gcgtgggtct 840
cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt agttatctac 900
acgacgggga gtcaggcaac tatggatgaa cgaaatagac agatcgctga gataggtgcc 960
tcactgatta agcattggta acccagcccg cctaatgagc gggctttttt ttgaacaaaa 1020
ggctgcagct ggacttctag actcattaca tttaaccaaa attatcacaa tataaggtct 1080
gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatgaacaa taaaactgtc 1140
tgcttacata aacagtaata caaggggtgt tatgagccat attcaacggg aaacgtcttg 1200
ctctaggccg cgattaaatt ccaacatgga tgctgattta tatgggtata aatgggctcg 1260
cgataatgtc gggcaatcag gtgcgacaat ctatcgattg tatgggaagc ccgatgcgcc 1320
agagttgttt ctgaaacatg gcaaaggtag cgttgccaat gatgttacag atgagatggt 1380
cagactaaac tggctgacgg aatttatgcc tcttccgacc atcaagcatt ttatccgtac 1440
tcctgatgat gcatggttac tcaccactgc gatccccggg aaaacagcat tccaggtatt 1500
agaagaatat cctgattcag gtgaaaatat tgttgatgcg ctggcagtgt tcctgcgccg 1560
gttgcattcg attcctgttt gtaattgtcc ttttaacagc gatcgcgtat ttcgtctcgc 1620
tcaggcgcaa tcacgaatga ataacggttt ggttgatgcg agtgattttg atgacgagcg 1680
taatggctgg cctgttgaac aagtctggaa agaaatgcat aaacttttgc cattctcacc 1740
ggattcagtc gtcactcatg gtgatttctc acttgataac cttatttttg acgaggggaa 1800
attaataggt tgtattgatg ttggacgagt cggaatcgca gaccgatacc aggatcttgc 1860
catcctatgg aactgcctcg gtgagttttc tccttcatta cagaaacggc tttttcaaaa 1920
atatggtgtt gataatcctg atatgaataa attgcagttt catttgatgc tcgatgagtt 1980
tttctaagaa ttaattcatg agcggataca tatttgaatg tatttagaaa aataaacaaa 2040
taggggttcc gcgcacattt cccatctttt gttagatttg aatatataca ttctactcga 2100
gggtgcgaat aagggacatg aagaaggaac acccgctcgc gggtgggcct acttcaccta 2160
tcctgcccgg ctgacgccgt tggatacacc aaggaaagtc tacacgaacc ctttggcaaa 2220
atcctgtata tcgtgcgaaa aaggatggat ataccgaaaa aatcgctata atgaccccga 2280
agcagggtta tgcagcggaa aacggccacg atgcgtccgg cgtagaggat ctgaagatca 2340
gcagttcaac ctgttgatag tacgtactaa gctctcatgt ttcacgtact aagctctcat 2400
gtttaacgta ctaagctctc atgtttaacg aactaaaccc tcatggctaa cgtactaagc 2460
tctcatggct aacgtactaa gctctcatgt ttcacgtact aagctctcat gtttgaacaa 2520
taaaattaat ataaatcagc aacttaaata gcctctaagg ttttaagttt tataagaaaa 2580
aaaagaatat ataaggcttt taaagctttt aaggtttaac ggttgtggac aacaagccag 2640
ggatgtaacg cactgagaag cccttagagc ctctcaaagc aattttgagt gacacaggaa 2700
cacttaacgg ctgacatggg aattagcttc acgctgccgc aagcactcag ggcgcaaggg 2760
ctgctaaagg aagcggatag acgtcaggtg gcact 2795
<210> 23
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer P1 for amplifying the plasmid pDuoF9
<400> 23
ctctactgtt tctccatac 19
<210> 24
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer P2 for amplifying the plasmid pDuoF9
<400> 24
agggaataag ggcgaca 17
<210> 25
<211> 7463
<212> DNA
<213> Artificial Sequence
<220>
<223> vector pDuoF9 product
<220>
<221> P1 binding site
<222> (1412)..(1430)
<220>
<221> Rec. F9-1 (placeholder)
<222> (1519)..(2550)
<220>
<221> Ribosome binding site
<222> (2551)..(2633)
<220>
<221> Rec. F9-2 (placeholder)
<222> (2634)..(3665)
<220>
<221> LoxF9a
<222> (4220)..(4253)
<220>
<221> KanR
<222> (4350)..(5165)
<220>
<221> LoxF9b
<222> (5240)..(5273)
<220>
<221> P2 binding site
<222> (5291)..(5307)
<220>
<221> CmR
<222> (5594)..(6253)
<220>
<221> Ori
<222> (6615)..(7463)
<400> 25
gctcatgagc ccgaagtggc gagcccgatc ttccccatcg gtgatgtcgg cgatataggc 60
gccagcaacc gcacctgtgg cgccggtgat gccggccacg atgcgtccgg cgtagaggat 120
ctgctcatgt ttgacagctt atcatcgatg cataatgtgc ctgtcaaatg gacgaagcag 180
ggattctgca aaccctatgc tactccgtca agccgtcaat tgtctgattc gttaccaatt 240
atgacaactt gacggctaca tcattcactt tttcttcaca accggcacgg aactcgctcg 300
ggctggcccc ggtgcatttt ttaaataccc gcgagaaata gagttgatcg tcaaaaccaa 360
cattgcgacc gacggtggcg ataggcatcc gggtggtgct caaaagcagc ttcgcctggc 420
tgatacgttg gtcctcgcgc cagcttaaga cgctaatccc taactgctgg cggaaaagat 480
gtgacagacg cgacggcgac aagcaaacat gctgtgcgac gctggcgata tcaaaattgc 540
tgtctgccag gtgatcgctg atgtactgac aagcctcgcg tacccgatta tccatcggtg 600
gatggagcga ctcgttaatc gcttccatgc gccgcagtaa caattgctca agcagattta 660
tcgccagcag ctccgaatag cgcccttccc cttgcccggc gttaatgatt tgcccaaaca 720
ggtcgctgaa atgcggctgg tgcgcttcat ccgggcgaaa gaaccccgta ttggcaaata 780
ttgacggcca gttaagccat tcatgccagt aggcgcgcgg acgaaagtaa acccactggt 840
gataccattc gcgagcctcc ggatgacgac cgtagtgatg aatctctcct ggcgggaaca 900
gcaaaatatc acccggtcgg caaacaaatt ctcgtccctg atttttcacc accccctgac 960
cgcgaatggt gagattgaga atataacctt tcattcccag cggtcggtcg ataaaaaaat 1020
cgagataacc gttggcctca atcggcgtta aacccgccac cagatgggca ttaaacgagt 1080
atcccggcag caggggatca ttttgcgctt cagccatact tttcatactc ccgccattca 1140
gagaagaaac caattgtcca tattgcatca gacattgccg tcactgcgtc ttttactggc 1200
tcttctcgct aaccaaaccg gtaaccccgc ttattaaaag cattctgtaa caaagcggga 1260
ccaaagccat gacaaaaacg cgtaacaaaa gtgtctataa tcacggcaga aaagtccaca 1320
ttgattattt gcacggcgtc acactttgct atgccatagc atttttatcc ataagattag 1380
cggatcctac ctgacgcttt ttatcgcaac tctctactgt ttctccatac ccgttttttt 1440
gggctagcga attcgagctc taaggaggtg ccacaattct cgagccatac ccattctaat 1500
gatcataagg aggtgtacat gtcaatacta ctgaccttgc accaaagttt gtccgcatta 1560
ctggtcgatg caacgagtga tgaggctcgc aagaacctga tggatgtgct cagggatcgc 1620
caggcgttct ccgagcgtac ctggaaagtg ctcctgtccg tttgccggac gtgggcggca 1680
tggtgcaagt tgaacaaccg gaaatggttt cccgcggaac ctgaagatgt tcgcgattac 1740
cttctacatc ttcaggctcg cggtctggca gtaaacacta tcctgcaaca tttggcccag 1800
ctaaacatgc tccaccgtcg gttcgggctg ccacgaccgg gcgacagcga cgctgtttca 1860
ctggttatgc ggcgaatccg aagggagaac gtcgatgctg gtgagcgtac caagcaggcc 1920
ctagcgttcg agcgcactga cttcgaccag gttcgtgcac tcatggaaaa tagcgaacgg 1980
ggccaggata tacgtactct ggcacttctg ggggttgctt ataacaccct gttacgcgta 2040
tccgaaattg ccaggattcg gattaaagac atctcacgta ctgacggtgg gaggatgcta 2100
atccacatta gcagaacgaa aacgctggtc agcaccgcag gcgtagagaa ggcgcttagc 2160
ctgggggtaa ctaaactggt cgagcgatgg atttccgtct ctggtgtggc tagtgaccca 2220
aacaattacc tgttttgcca ggttagaata aatggtgtgg ccgtgccgtc tgccaccagc 2280
cggctatcaa ccgacgtcct gcgaaagatt tttgaggctg cccaccgcct gatctacggt 2340
gccaaggatg gctctggtca gagatacctg gcctggtctg ggcacagtgc ccgtgtcgga 2400
gccgcgcggg atatggcccg cgctggggtt tcaatagcgg agattatgca ggctggtggc 2460
tggaccaccg tagagagtgt catgaactat atccgtaacc tggacagtga gacaggggca 2520
atggtgcgtc tgctggaaga tggcgactag tctagaggta ccattccgat cgcggatcgg 2580
ccggaatggg atagacgtcc tatcatccac acctactagt taaggaggtg tacatgtcaa 2640
tactactgac cttgcaccaa agtttgtccg cattactggt cgatgcaacg agtgatgagg 2700
ctcgcaagaa cctgatggat gtgctcaggg atcgccaggc gttctccgag cgtacctgga 2760
aagtgctcct gtccgtttgc cggacgtggg cggcatggtg caagttgaac aaccggaaat 2820
ggtttcccgc ggaacctgaa gatgttcgcg attaccttct acatcttcag gctcgcggtc 2880
tggcagtaaa cactatcctg caacatttgg cccagctaaa catgctccac cgtcggttcg 2940
ggctgccacg accgggcgac agcgacgctg tttcactggt tatgcggcga atccgaaggg 3000
agaacgtcga tgctggtgag cgtaccaagc aggccctagc gttcgagcgc actgacttcg 3060
accaggttcg tgcactcatg gaaaatagcg aacggggcca ggatatacgt actctggcac 3120
ttctgggggt tgcttataac accctgttac gcgtatccga aattgccagg attcggatta 3180
aagacatctc acgtactgac ggtgggagga tgctaatcca cattagcaga acgaaaacgc 3240
tggtcagcac cgcaggcgta gagaaggcgc ttagcctggg ggtaactaaa ctggtcgagc 3300
gatggatttc cgtctctggt gtggctagtg acccaaacaa ttacctgttt tgccaggtta 3360
gaataaatgg tgtggccgtg ccgtctgcca ccagccggct atcaaccgac gtcctgcgaa 3420
agatttttga ggctgcccac cgcctgatct acggtgccaa ggatggctct ggtcagagat 3480
acctggcctg gtctgggcac agtgcccgtg tcggagccgc gcgggatatg gcccgcgctg 3540
gggtttcaat agcggagatt atgcaggctg gtggctggac caccgtagag agtgtcatga 3600
actatatccg taacctggac agtgagacag gggcaatggt gcgtctgctg gaagatggcg 3660
actagtctag acgtacgcct gcaggcaagc ttggctgttt tggcggatga gagaagattt 3720
tcagcctgat acagattaaa tcagaacgca gaagcggtct gataaaacag aatttgcctg 3780
gcggcagtag cgcggtggtc ccacctgacc ccatgccgaa ctcagaagtg aaacgccgta 3840
gcgccgatgg tagtgtgggg tctccccatg cgagagtagg gaactgccag gcatcaaata 3900
aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt gtcggtgaac 3960
gctctcctga gtaggacaaa tccgccggga gcggatttga acgttgcgaa gcaacggccc 4020
ggagggtggc gggcaggacg cccgccataa actgccaggc atcaaattaa gcagaaggcc 4080
atcctgacgg atggcctttt tgcgtttcta caaactcttt tgtttatttt tctaaataca 4140
ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 4200
aaggaagagt atgagatctc tcattacatt taaccaaaat tatcacaata taaggtctga 4260
cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgaacaata aaactgtctg 4320
cttacataaa cagtaataca aggggtgtta tgagccatat tcaacgggaa acgtcttgct 4380
ctaggccgcg attaaattcc aacatggatg ctgatttata tgggtataaa tgggctcgcg 4440
ataatgtcgg gcaatcaggt gcgacaatct atcgattgta tgggaagccc gatgcgccag 4500
agttgtttct gaaacatggc aaaggtagcg ttgccaatga tgttacagat gagatggtca 4560
gactaaactg gctgacggaa tttatgcctc ttccgaccat caagcatttt atccgtactc 4620
ctgatgatgc atggttactc accactgcga tccccgggaa aacagcattc caggtattag 4680
aagaatatcc tgattcaggt gaaaatattg ttgatgcgct ggcagtgttc ctgcgccggt 4740
tgcattcgat tcctgtttgt aattgtcctt ttaacagcga tcgcgtattt cgtctcgctc 4800
aggcgcaatc acgaatgaat aacggtttgg ttgatgcgag tgattttgat gacgagcgta 4860
atggctggcc tgttgaacaa gtctggaaag aaatgcataa acttttgcca ttctcaccgg 4920
attcagtcgt cactcatggt gatttctcac ttgataacct tatttttgac gaggggaaat 4980
taataggttg tattgatgtt ggacgagtcg gaatcgcaga ccgataccag gatcttgcca 5040
tcctatggaa ctgcctcggt gagttttctc cttcattaca gaaacggctt tttcaaaaat 5100
atggtgttga taatcctgat atgaataaat tgcagtttca tttgatgctc gatgagtttt 5160
tctaagaatt aattcatgag cggatacata tttgaatgta tttagaaaaa taaacaaata 5220
ggggttccgc gcacatttcc catcttttgt tagatttgaa tatatacatt ctaagatctc 5280
aacatttccg tgtcgccctt attccctttt ttgcggcatt ttgccttcct gtttttgctc 5340
acccagaaac gctggtgaaa gtaaaagatg ctgaagatca gttgggtgca gcaaactatt 5400
aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga tggaggcgga 5460
taaagttgca ggaccacttc tgcgctcggc ccggtcgaat ttgctttcga atttctgcca 5520
ttcatccgct tattatcact tattcaggcg tagcaccagg cgtttaaggg caccaataac 5580
tgccttaaaa aaattacgcc ccgccctgcc actcatcgca gtactgttgt aattcattaa 5640
gcattctgcc gacatggaag ccatcacaga cggcatgatg aacctgaatc gccagcggca 5700
tcagcacctt gtcgccttgc gtataatatt tgcccatggt gaaaacgggg gcgaagaagt 5760
tgtccatatt ggccacgttt aaatcaaaac tggtgaaact cacccaggga ttggctgaga 5820
cgaaaaacat attctcaata aaccctttag ggaaataggc caggttttca ccgtaacacg 5880
ccacatcttg cgaatatatg tgtagaaact gccggaaatc gtcgtggtat tcactccaga 5940
gcgatgaaaa cgtttcagtt tgctcatgga aaacggtgta acaagggtga acactatccc 6000
atatcaccag ctcaccgtct ttcattgcca tacggaattc cggatgagca ttcatcaggc 6060
gggcaagaat gtgaataaag gccggataaa acttgtgctt atttttcttt acggtcttta 6120
aaaaggccgt aatatccagc tgaacggtct ggttataggt acattgagca actgactgaa 6180
atgcctcaaa atgttcttta cgatgccatt gggatatatc aacggtggta tatccagtga 6240
tttttttctc cattttagct tccttagctc ctgaaaatct cgataactca aaaaatacgc 6300
ccggtagtga tcttatttca ttatggtgaa agttggaacc tcttacgtgc cgatcaacgt 6360
ctcattttcg ccaaaagttg gcccagggct tcccggtatc aacagggaca ccaggattta 6420
tttattctgc gaagtgatct tccgtcacag gtatttattc ggcgcaaagt gcgtcgggtg 6480
atgctgccaa cttactgatt tagtgtatga tggtgttttt gaggtgctcc agtggcttct 6540
gtttctatca gctgtccctc ctgttcagct actgacgggg tggtgcgtaa cggcaaaagc 6600
accgccggac atcagcgcta gcggagtgta tactggctta ctatgttggc actgatgagg 6660
gtgtcagtga agtgcttcat gtggcaggag aaaaaaggct gcaccggtgc gtcagcagaa 6720
tatgtgatac aggatatatt ccgcttcctc gctcactgac tcgctacgct cggtcgttcg 6780
actgcggcga gcggaaatgg cttacgaacg gggcggagat ttcctggaag atgccaggaa 6840
gatacttaac agggaagtga gagggccgcg gcaaagccgt ttttccatag gctccgcccc 6900
cctgacaagc atcacgaaat ctgacgctca aatcagtggt ggcgaaaccc gacaggacta 6960
taaagatacc aggcgtttcc ccctggcggc tccctcgtgc gctctcctgt tcctgccttt 7020
cggtttaccg gtgtcattcc gctgttatgg ccgcgtttgt ctcattccac gcctgacact 7080
cagttccggg taggcagttc gctccaagct ggactgtatg cacgaacccc ccgttcagtc 7140
cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggaaa gacatgcaaa 7200
agcaccactg gcagcagcca ctggtaattg atttagagga gttagtcttg aagtcatgcg 7260
ccggttaagg ctaaactgaa aggacaagtt ttggtgactg cgctcctcca agccagttac 7320
ctcggttcaa agagttggta gctcagagaa ccttcgaaaa accgccctgc aaggcggttt 7380
tttcgttttc agagcaagag attacgcgca gaccaaaacg atctcaagaa gatcatctta 7440
ttaatcagat aaaatatttc tag 7463
<210> 26
<211> 800
<212> DNA
<213> Homo sapiens
<220>
<221> loxF9a
<222> (1)..(34)
<220>
<221> loxF9b
<222> (766)..(800)
<220>
<221> Exon 8 of the F9 gene wildtype
<222> (766)..(800)
<400> 26
ctcattacat ttaaccaaaa ttatcacaat ataagaatga gatctttaac attgccaatt 60
aggtcagtgg tcccaagtag tcacttagaa aatctgtgta tgtgaaatac tgtttgtgac 120
ttaaaatgaa atttattttt aataggtgaa cataatattg aggagacaga acatacagag 180
caaaagcgaa atgtgattcg aattattcct caccacaact acaatgcagc tattaataag 240
tacaaccatg acattgccct tctggaactg gacgaaccct tagtgctaaa cagctacgtt 300
acacctattt gcattgctga caaggaatac acgaacatct tcctcaaatt tggatctggc 360
tatgtaagtg gctggggaag agtcttccac aaagggagat cagctttagt tcttcagtac 420
cttagagttc cacttgttga ccgagccaca tgtcttcgat ctacaaagtt caccatctat 480
aacaacatgt tctgtgctgg cttccatgaa ggaggtagag attcatgtca aggagatagt 540
gggggacccc atgttactga agtggaaggg accagtttct taactggaat tattagctgg 600
ggtgaagagt gtgcaatgaa aggcaaatat ggaatatata ccaaggtatc ccggtatgtc 660
aactggatta aggaaaaaac aaagctcact taatgaaaga tggatttcca aggttaattc 720
attggaattg aaaattaaca gggcctctca ctaactaatc actttcccat cttttgttag 780
atttgaatat atacattcta 800
<210> 27
<211> 800
<212> DNA
<213> Homo sapiens
<220>
<221> loxF9a
<222> (1)..(34)
<220>
<221> Exon 8 of the F9 gene Arg338Leu (Padua mutation)
<222> (146)..(693)
<220>
<221> LoxF9b
<222> (766)..(800)
<400> 27
ctcattacat ttaaccaaaa ttatcacaat ataagaatga gatctttaac attgccaatt 60
aggtcagtgg tcccaagtag tcacttagaa aatctgtgta tgtgaaatac tgtttgtgac 120
ttaaaatgaa atttattttt aataggtgaa cataatattg aggagacaga acatacagag 180
caaaagcgaa atgtgattcg aattattcct caccacaact acaatgcagc tattaataag 240
tacaaccatg acattgccct tctggaactg gacgaaccct tagtgctaaa cagctacgtt 300
acacctattt gcattgctga caaggaatac acgaacatct tcctcaaatt tggatctggc 360
tatgtaagtg gctggggaag agtcttccac aaagggagat cagctttagt tcttcagtac 420
cttagagttc cacttgttga ccgagccaca tgtcttctgt ctacaaagtt caccatctat 480
aacaacatgt tctgtgctgg cttccatgaa ggaggtagag attcatgtca aggagatagt 540
gggggacccc atgttactga agtggaaggg accagtttct taactggaat tattagctgg 600
ggtgaagagt gtgcaatgaa aggcaaatat ggaatatata ccaaggtatc ccggtatgtc 660
aactggatta aggaaaaaac aaagctcact taatgaaaga tggatttcca aggttaattc 720
attggaattg aaaattaaca gggcctctca ctaactaatc actttcccat cttttgttag 780
atttgaatat atacattcta 800
<210> 28
<211> 343
<212> PRT
<213> Artificial Sequence
<220>
<223> Recombinase F9-1
<220>
<221> misc_feature
<222> (17)..(17)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (19)..(19)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (22)..(22)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (30)..(30)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (43)..(43)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (60)..(60)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (68)..(69)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (81)..(81)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (84)..(84)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (89)..(89)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (93)..(93)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (140)..(140)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (166)..(166)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (177)..(177)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (182)..(183)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (186)..(186)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (206)..(206)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (222)..(222)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (225)..(225)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (237)..(237)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (239)..(239)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (249)..(249)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (259)..(260)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (264)..(264)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (278)..(278)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (284)..(284)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (318)..(318)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (342)..(342)
<223> Xaa can be any naturally occurring amino acid
<400> 28
Met Ser Asn Leu Gln Thr Leu His Gln Asn Leu Ser Ala Leu Leu Val
1 5 10 15
Xaa Ala Xaa Ser Asp Xaa Ala Arg Lys Asn Leu Met Asp Xaa Phe Arg
20 25 30
Asp Arg Gln Ala Phe Ser Glu His Thr Trp Xaa Val Leu Leu Ser Val
35 40 45
Cys Arg Ser Trp Ala Ala Trp Cys Lys Leu Asn Xaa Arg Lys Trp Phe
50 55 60
Pro Ala Glu Xaa Xaa Asp Val Arg Asp Tyr Leu Leu His Leu Gln Ala
65 70 75 80
Xaa Gly Leu Xaa Val Asn Thr Ile Xaa Gln His Leu Xaa Gln Leu Asn
85 90 95
Met Leu His Arg Arg Ser Gly Leu Pro Arg Pro Gly Asp Ser Asn Ala
100 105 110
Val Ser Leu Val Met Arg Arg Ile Arg Lys Glu Asn Val Asp Ala Gly
115 120 125
Glu Arg Val Lys Gln Ala Leu Ala Phe Glu Arg Xaa Asp Phe Asp Gln
130 135 140
Val Arg Ser Leu Met Glu Asn Ser Asp Arg Cys Gln Asp Ile Arg Asn
145 150 155 160
Leu Ala Phe Leu Gly Xaa Ala Tyr Asn Thr Leu Leu Arg Ile Ser Glu
165 170 175
Xaa Ala Arg Ile Arg Xaa Xaa Asp Ile Xaa Arg Thr Asp Gly Gly Arg
180 185 190
Met Leu Ile His Ile Gly Arg Thr Lys Thr Leu Val Ser Xaa Ala Gly
195 200 205
Val Glu Lys Ala Leu Ser Leu Arg Val Thr Arg Leu Val Xaa Arg Trp
210 215 220
Xaa Ser Val Ser Gly Val Ala Asp Asp Pro Asn Asn Xaa Leu Xaa Cys
225 230 235 240
Arg Val Arg Arg Asn Gly Val Ala Xaa Pro Ser Ala Thr Ser Gln Leu
245 250 255
Ser Thr Xaa Xaa Leu Gln Gly Xaa Phe Ala Ala Ala His Arg Leu Ile
260 265 270
Tyr Gly Ala Arg Asp Xaa Ser Gly Gln Arg Tyr Xaa Thr Trp Ser Gly
275 280 285
His Ser Ala Arg Val Gly Ala Ala Arg Asp Met Ala Arg Ala Gly Val
290 295 300
Ser Ile Ala Glu Ile Met Gln Ala Gly Gly Trp Thr Thr Xaa Glu Ser
305 310 315 320
Val Met Asn Tyr Ile Arg Asn Leu Asp Ser Glu Thr Gly Ala Met Val
325 330 335
Arg Leu Leu Glu Asp Xaa Asp
340
<210> 29
<211> 343
<212> PRT
<213> Artificial Sequence
<220>
<223> Recombinase F9-1
<220>
<221> misc_feature
<222> (3)..(3)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (5)..(5)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (8)..(8)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (14)..(14)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (16)..(16)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (18)..(21)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (31)..(31)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (39)..(39)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (80)..(80)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (84)..(84)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (93)..(93)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (97)..(97)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (125)..(125)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (132)..(132)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (182)..(183)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (186)..(186)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (195)..(195)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (206)..(206)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (216)..(216)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (249)..(249)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (253)..(253)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (259)..(260)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (264)..(264)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (266)..(266)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (273)..(273)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (276)..(276)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (278)..(278)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (306)..(306)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (325)..(325)
<223> Xaa can be any naturally occurring amino acid
<400> 29
Met Ser Xaa Leu Xaa Thr Leu Xaa Gln Asn Leu Ser Ala Xaa Leu Xaa
1 5 10 15
Asp Xaa Xaa Xaa Xaa Glu Ala Arg Lys Asn Leu Met Asp Val Xaa Arg
20 25 30
Asp Arg Gln Ala Phe Ser Xaa His Thr Trp Arg Val Leu Leu Ser Val
35 40 45
Cys Arg Ser Trp Ala Ala Trp Cys Glu Leu Asn Asn Arg Lys Trp Phe
50 55 60
Pro Ala Glu Pro Glu Asp Val Arg Asp Tyr Leu Leu His Leu Gln Xaa
65 70 75 80
Arg Gly Leu Xaa Val Asn Thr Ile Gln Gln His Leu Xaa Gln Leu Asn
85 90 95
Xaa Leu His Arg Arg Ser Gly Leu Pro Arg Pro Gly Asp Ser Asn Ala
100 105 110
Val Ser Leu Val Met Arg Arg Ile Arg Lys Glu Asn Xaa Asp Ala Gly
115 120 125
Glu Arg Val Xaa Gln Ala Leu Ala Phe Glu Arg Thr Asp Phe Asp Gln
130 135 140
Val Arg Ser Leu Met Glu Asn Ser Asp Arg Cys Gln Asp Ile Arg Asn
145 150 155 160
Leu Ala Phe Leu Gly Val Ala Tyr Asn Thr Leu Leu Arg Ile Ser Glu
165 170 175
Ile Ala Arg Ile Arg Xaa Xaa Asp Ile Xaa Arg Thr Asp Gly Gly Arg
180 185 190
Met Leu Xaa His Ile Gly Arg Thr Lys Thr Leu Val Ser Xaa Ala Gly
195 200 205
Val Glu Lys Ala Leu Ser Leu Xaa Val Thr Lys Leu Val Glu Arg Trp
210 215 220
Ile Ser Val Ser Gly Val Ala Asp Asp Pro Asn Asn Tyr Leu Phe Cys
225 230 235 240
Arg Val Arg Arg Asn Gly Val Ala Xaa Pro Ser Ala Xaa Ser Gln Leu
245 250 255
Ser Thr Xaa Xaa Leu Gln Gly Xaa Phe Xaa Ala Ala His Arg Leu Ile
260 265 270
Xaa Gly Ala Xaa Asp Xaa Ser Gly Gln Arg Tyr Leu Thr Trp Ser Gly
275 280 285
His Ser Ala Arg Val Gly Ala Ala Arg Asp Met Ala Arg Ala Gly Val
290 295 300
Ser Xaa Ala Glu Ile Met Gln Ala Gly Gly Trp Thr Thr Val Glu Ser
305 310 315 320
Val Met Asn Tyr Xaa Arg Asn Leu Asp Ser Glu Thr Gly Ala Met Val
325 330 335
Arg Leu Leu Glu Asp Gly Asp
340
<210> 30
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer P1# for amplifying the plasmid pDuoF9
<400> 30
cggcgtcaca ctttgctatg 20
<210> 31
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer P2# for amplifying the plasmid pDuoF9
<400> 31
cccttaaacg cctggtgcta 20
<210> 32
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer P3 for amplifying the recombinase library
<400> 32
aagattagcg gatcctacct 20
<210> 33
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> Primer P4 for amplifying the recombinase library
<400> 33
gtgattagtt agtgagaggc 20
<210> 34
<211> 343
<212> PRT
<213> Artificial Sequence
<220>
<223> Recombinase R#1
<400> 34
Met Ser Lys Leu Gln Thr Ile His Gln Asn Leu Ser Ala Leu Leu Val
1 5 10 15
Asp Ala Thr Ser Asp Glu Ala Arg Lys Asn Leu Met Asp Val Leu Arg
20 25 30
Asp Arg Gln Ala Phe Ser Lys His Thr Trp Arg Val Leu Leu Ser Val
35 40 45
Cys Arg Ser Trp Ala Ala Trp Cys Glu Leu Asn Asn Arg Lys Trp Phe
50 55 60
Pro Ala Glu Pro Glu Asp Val Arg Asp Tyr Leu Leu His Leu Gln Thr
65 70 75 80
Arg Gly Leu Thr Val Asn Thr Ile Gln Gln His Leu Cys Gln Leu Asn
85 90 95
Leu Leu His Arg Arg Ser Gly Leu Pro Arg Pro Gly Asp Ser Asn Ala
100 105 110
Val Ser Leu Val Met Arg Arg Ile Arg Lys Glu Asn Ile Asp Ala Gly
115 120 125
Glu Arg Val Lys Gln Ala Leu Ala Phe Glu Arg Thr Asp Phe Asp Gln
130 135 140
Val Arg Ser Leu Met Glu Asn Ser Asp Arg Cys Gln Asp Ile Arg Asn
145 150 155 160
Leu Ala Phe Leu Gly Val Ala Tyr Asn Thr Leu Leu Arg Ile Ser Glu
165 170 175
Ile Ala Arg Ile Arg Val Arg Asp Ile Thr Arg Thr Asp Gly Gly Arg
180 185 190
Met Leu Ile His Ile Gly Arg Thr Lys Thr Leu Val Ser Ala Ala Gly
195 200 205
Val Glu Lys Ala Leu Ser Leu Gly Val Thr Lys Leu Val Glu Arg Trp
210 215 220
Ile Ser Val Ser Gly Val Ala Asp Asp Pro Asn Asn Tyr Leu Phe Cys
225 230 235 240
Arg Val Arg Arg Asn Gly Val Ala Ala Pro Ser Ala Ile Ser Gln Leu
245 250 255
Ser Thr Pro Ala Leu Gln Gly Val Phe Ala Ala Ala His Arg Leu Ile
260 265 270
His Gly Ala Lys Asp Ala Ser Gly Gln Arg Tyr Leu Thr Trp Ser Gly
275 280 285
His Ser Ala Arg Val Gly Ala Ala Arg Asp Met Ala Arg Ala Gly Val
290 295 300
Ser Val Ala Glu Ile Met Gln Ala Gly Gly Trp Thr Thr Val Glu Ser
305 310 315 320
Val Met Asn Tyr Leu Arg Asn Leu Asp Ser Glu Thr Gly Ala Met Val
325 330 335
Arg Leu Leu Glu Asp Gly Asp
340
<210> 35
<211> 343
<212> PRT
<213> Artificial Sequence
<220>
<223> Recombinase R#7-B5
<400> 35
Met Ser Lys Leu Gln Thr Ile His Gln Asp Leu Ser Ala Leu Leu Val
1 5 10 15
Asp Val Thr Ser Asp Glu Ala Arg Lys Asn Leu Met Asp Val Leu Arg
20 25 30
Asp Arg Gln Ala Phe Ser Lys His Thr Trp Arg Val Leu Leu Ser Val
35 40 45
Cys Arg Ser Trp Ala Ala Trp Cys Glu Leu Asn Asn Arg Lys Trp Phe
50 55 60
Pro Ala Glu Pro Glu Asp Val Arg Asp Tyr Leu Leu His Leu Gln Thr
65 70 75 80
Arg Gly Leu Thr Val Asn Thr Ile Gln Gln His Leu Cys Gln Leu Asn
85 90 95
Leu Leu His Arg Arg Ser Gly Leu Pro Arg Pro Gly Asp Ser Asn Ala
100 105 110
Val Ser Leu Val Met Arg Arg Ile Arg Lys Glu Asn Ile Asp Ala Gly
115 120 125
Glu Arg Val Lys Gln Ala Leu Ala Phe Glu Arg Thr Asp Phe Asp Gln
130 135 140
Val Arg Ser Leu Met Glu Asn Ser Asp Arg Cys Gln Asp Ile Arg Asn
145 150 155 160
Leu Ala Phe Leu Gly Val Ala Tyr Asn Thr Leu Leu Arg Ile Ser Glu
165 170 175
Ile Ala Arg Ile Arg Val Arg Asp Ile Thr Arg Thr Asp Gly Gly Arg
180 185 190
Met Leu Ile His Ile Gly Arg Thr Lys Thr Leu Val Ser Ala Ala Gly
195 200 205
Val Glu Lys Ala Leu Ser Leu Gly Val Thr Lys Leu Val Glu Arg Trp
210 215 220
Ile Ser Val Ser Gly Val Ala Asp Asp Pro Asn Asn His Leu Phe Cys
225 230 235 240
Arg Val Arg Arg Asn Gly Val Ala Ala Pro Ser Ala Ile Ser Gln Leu
245 250 255
Ser Thr Pro Ala Leu Gln Gly Val Phe Ala Ala Ala His Arg Leu Ile
260 265 270
His Gly Ala Lys Asp Ala Ser Gly Gln Arg Tyr Leu Thr Trp Ser Gly
275 280 285
His Ser Ala Arg Val Gly Ala Ala Arg Asp Met Ala Arg Ala Gly Val
290 295 300
Ser Val Ala Glu Ile Met Gln Ala Gly Gly Trp Thr Thr Val Glu Ser
305 310 315 320
Val Met Asn Tyr Leu Arg Asn Leu Asp Ser Glu Thr Gly Ala Met Val
325 330 335
Arg Leu Leu Glu Asp Gly Asp
340
<210> 36
<211> 343
<212> PRT
<213> Artificial Sequence
<220>
<223> Recombinase F9-3
<400> 36
Met Pro Lys Leu Gln Thr Ile His Gln Asp Leu Ser Ala Leu Leu Val
1 5 10 15
Asp Val Thr Ser Asp Glu Ala Arg Lys Asn Leu Met Asp Val Leu Arg
20 25 30
Asp Arg Gln Ala Phe Ser Arg His Thr Trp Arg Val Leu Leu Ser Val
35 40 45
Cys Arg Ser Trp Ala Ala Trp Cys Glu Leu Asn Asn Arg Lys Trp Phe
50 55 60
Pro Ala Glu Pro Glu Asp Val Arg Asp Tyr Leu Leu Gln Leu Gln Thr
65 70 75 80
Arg Gly Leu Thr Val Asn Thr Ile Gln Gln His Leu Cys Gln Leu Asn
85 90 95
Leu Leu His Arg Arg Ser Gly Leu Pro Arg Pro Gly Asp Ser Asn Ala
100 105 110
Val Ser Leu Val Met Arg Arg Ile Arg Lys Glu Asn Ile Asp Ala Gly
115 120 125
Glu Arg Val Lys Gln Ala Leu Ala Phe Glu Arg Thr Asp Phe Asp Gln
130 135 140
Val Arg Ser Leu Met Glu Asn Ser Asp Arg Cys Gln Asp Ile Arg Asn
145 150 155 160
Leu Ala Phe Leu Gly Val Ala Tyr Asn Thr Leu Leu Arg Ile Ser Glu
165 170 175
Ile Ala Arg Ile Arg Val Arg Asp Ile Thr Arg Thr Asp Gly Gly Arg
180 185 190
Met Leu Ile His Ile Gly Ile Thr Lys Thr Leu Val Ser Ala Ala Gly
195 200 205
Val Glu Lys Ala Leu Ser Leu Gly Val Thr Lys Leu Val Glu Arg Trp
210 215 220
Ile Ser Val Ser Gly Val Ala Asp Asp Pro Asn Asn His Leu Phe Cys
225 230 235 240
Arg Val Arg Arg Asn Gly Val Ala Ala Pro Ser Ala Ile Ser Gln Leu
245 250 255
Ser Thr Pro Ala Leu Gln Gly Val Phe Ala Ala Ala His Arg Leu Ile
260 265 270
His Gly Ala Lys Asp Asp Ser Gly Gln Arg Tyr Leu Thr Trp Ser Gly
275 280 285
His Ser Ala Arg Val Gly Ala Ala Arg Asp Met Ala Arg Ala Gly Val
290 295 300
Pro Val Ala Glu Ile Met Gln Ala Gly Gly Trp Thr Thr Val Glu Ser
305 310 315 320
Val Met Ser Tyr Leu Arg Asn Leu Asp Ser Glu Thr Gly Ala Met Val
325 330 335
Arg Leu Leu Glu Asp Gly Asp
340
<210> 37
<211> 4930
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pDonor-ex8
<220>
<221> Origin of replication
<222> (167)..(786)
<220>
<221> AmpR
<222> (941)..(1801)
<220>
<221> KanR
<222> (1822)..(2610)
<220>
<221> part of human F9 gene including exon 8
<222> (3638)..(4636)
<220>
<221> LoxF9a
<222> (3713)..(3746)
<220>
<221> LoxF9b
<222> (4479)..(4512)
<220>
<221> P4 binding site
<222> (4479)..(4512)
<400> 37
cttccgcttc ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat 60
cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga 120
acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt 180
ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt 240
ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc 300
gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa 360
gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct 420
ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta 480
actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg 540
gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc 600
ctaactacgg ctacactaga agaacagtat ttggtatctg cgctctgctg aagccagtta 660
ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg 720
gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt 780
tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg 840
tcatgagatt atcaaaaagg atcttcacct agatcctttt aaattaaaaa tgaagtttta 900
aatcaatcta aagtatatat gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg 960
aggcacctat ctcagcgatc tgtctatttc gttcatccat agttgcctga ctccccgtcg 1020
tgtagataac tacgatacgg gagggcttac catctggccc cagtgctgca atgataccgc 1080
gagacccacg ctcaccggct ccagatttat cagcaataaa ccagccagcc ggaagggccg 1140
agcgcagaag tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg 1200
aagctagagt aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc attgctacag 1260
gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat 1320
caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc 1380
cgatcgttgt cagaagtaag ttggccgcag tgttatcact catggttatg gcagcactgc 1440
ataattctct tactgtcatg ccatccgtaa gatgcttttc tgtgactggt gagtactcaa 1500
ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac 1560
gggataatac cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt 1620
cggggcgaaa actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc 1680
gtgcacccaa ctgatcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa 1740
caggaaggca aaatgccgca aaaaagggaa taagggcgac acggaaatgt tgaatactca 1800
tactcttcct ttttcaattc agaagaactc gtcaagaagg cgatagaagg cgatgcgctg 1860
cgaatcggga gcggcgatac cgtaaagcac gaggaagcgg tcagcccatt cgccgccaag 1920
ctcttcagca atatcacggg tagccaacgc tatgtcctga tagcggtccg ccacacccag 1980
ccggccacag tcgatgaatc cagaaaagcg gccattttcc accatgatat tcggcaagca 2040
ggcatcgcca tgggtcacga cgagatcctc gccgtcgggc atgcgcgcct tgagcctggc 2100
gaacagttcg gctggcgcga gcccctgatg ctcttcgtcc agatcatcct gatcgacaag 2160
accggcttcc atccgagtac gtgctcgctc gatgcgatgt ttcgcttggt ggtcgaatgg 2220
gcaggtagcc ggatcaagcg tatgcagccg ccgcattgca tcagccatga tggatacttt 2280
ctcggcagga gcaaggtggg atgacaggag atcctgcccc ggcacttcgc ccaatagcag 2340
ccagtccctt cccgcttcag tgacaacgtc gagcacagct gcgcaaggaa cgcccgtcgt 2400
ggccagccac gatagccgcg ctgcctcgtc ctgcagttca ttcagggcac cggacaggtc 2460
ggtcttgaca aaaagaaccg ggcgcccctg cgctgacagc cggaacacgg cggcatcaga 2520
gcagccgatt gtctgttgtg cccagtcata gccgaatagc ctctccaccc aagcggccgg 2580
agaacctgcg tgcaatccat cttgttcaat catgcgaaac gatcctcatc ctgtctcttg 2640
atcagatctt gatcccctgc gccatcagat ccttggcggc aagaaagcca tccagtttac 2700
tttgcagggc ttcccaacct taccagaggg cgccccagct ggcaattccg gttcgcttgc 2760
tgtccataaa accgcccagt ctagctatcg ccatgtaagc ccactgcaag ctacctgctt 2820
tctctttgcg cttgcgtttt cccttgtcca gatagcccag tagctgacat tcatccgggg 2880
tcagcaccgt ttctgcggac tggctttcta cgtgttccgc ttcctttagc agcccttgcg 2940
ccctgaattt tgttaaaatt cgcgttaaat ttttgttaaa tcagctcatt ttttaaccaa 3000
taggccgaaa tcggcaaaat cccttataaa tcaaaagaat agaccgagat agggttgagt 3060
gttgttccag tttggaacaa gagtccacta ttaaagaacg tggactccaa cgtcaaaggg 3120
cgaaaaaccg tctatcaggg cgatggccca ctacgtgaac catcacccta atcaagtttt 3180
ttggggtcga ggtgccgtaa agcactaaat cggaacccta aagggagccc ccgatttaga 3240
gcttgacggg gaaagccggc gaacgtggcg agaaaggaag ggaagaaagc gaaaggagcg 3300
ggcgctaggg cgctggcaag tgtagcggtc acgctgcgcg taaccaccac acccgccgcg 3360
cttaatgcgc cgctacaggg cgcgtccatt cgccattcag gctgcgcaac tgttgggaag 3420
ggcgatcggt gcgggcctct tcgctattac gccagctggc gaaaggggga tgtgctgcaa 3480
ggcgattaag ttgggtaacg ccagggtttt cccagtcacg acgttgtaaa acgacggcca 3540
gtgaattgta atacgactca ctatagggcg aattgggccc tctagatgca tgctcgagcg 3600
gccgccagtg tgatggatat ctgcagaatt cgccctttaa cagcatgagt gaacagaacc 3660
atctctatga tagtcctgaa tggctttttg gtctgaaaaa tatgcattgg ctctcattac 3720
atttaaccaa aattatcaca atataagaat gagatcttta acattgccaa ttaggtcagt 3780
ggtcccaagt agtcacttag aaaatctgtg tatgtgaaat actgtttgtg acttaaaatg 3840
aaatttattt ttaataggtg aacataatat tgaggagaca gaacatacag agcaaaagcg 3900
aaatgtgatt cgaattattc ctcaccacaa ctacaatgca gctattaata agtacaacca 3960
tgacattgcc cttctggaac tggacgaacc cttagtgcta aacagctacg ttacacctat 4020
ttgcattgct gacaaggaat acacgaacat cttcctcaaa tttggatctg gctatgtaag 4080
tggctgggga agagtcttcc acaaagggag atcagcttta gttcttcagt accttagagt 4140
tccacttgtt gaccgagcca catgtcttcg atctacaaag ttcaccatct ataacaacat 4200
gttctgtgct ggcttccatg aaggaggtag agattcatgt caaggagata gtgggggacc 4260
ccatgttact gaagtggaag ggaccagttt cttaactgga attattagct ggggtgaaga 4320
gtgtgcaatg aaaggcaaat atggaatata taccaaggta tcccggtatg tcaactggat 4380
taaggaaaaa acaaagctca cttaatgaaa gatggatttc caaggttaat tcattggaat 4440
tgaaaattaa cagggcctct cactaactaa tcactttccc atcttttgtt agatttgaat 4500
atatacattc tatgatcatt gctttttctc tttacagggg agaatttcat attttacctg 4560
agcaaattga ttagaaaatg gaaccactag aggaatataa tgtgttagga aattacagtc 4620
atttctaagg gcccagaagg gcgaattcca gcacactggc ggccgttact agtggatccg 4680
agctcggtac caagcttggc gtaatcatgg tcatagctgt ttcctgtgtg aaattgttat 4740
ccgctcacaa ttccacacaa catacgagcc ggaagcataa agtgtaaagc ctggggtgcc 4800
taatgagtga gctaactcac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga 4860
aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt 4920
attgggcgct 4930
<210> 38
<211> 6996
<212> DNA
<213> Artificial Sequence
<220>
<223> Plasmid pDuoF9-ex8 (outcome)
<220>
<221> P3 binding site
<222> (1373)..(1392)
<220>
<221> Recombinase R1 (placeholder)
<222> (1519)..(2550)
<220>
<221> Recombinase R#7-B5 (placeholder)
<222> (1519)..(2550)
<220>
<221> Ribosome binding site
<222> (2551)..(2633)
<220>
<221> LoxF9a
<222> (4220)..(4253)
<220>
<221> exchanged part of human F9 gene including exon 8
<222> (4220)..(4253)
<220>
<221> LoxF9b
<222> (4962)..(5019)
<220>
<221> P4 binding site
<222> (4962)..(4981)
<220>
<221> CmR
<222> (5127)..(5786)
<220>
<221> Origin of replication
<222> (6148)..(6996)
<400> 38
gctcatgagc ccgaagtggc gagcccgatc ttccccatcg gtgatgtcgg cgatataggc 60
gccagcaacc gcacctgtgg cgccggtgat gccggccacg atgcgtccgg cgtagaggat 120
ctgctcatgt ttgacagctt atcatcgatg cataatgtgc ctgtcaaatg gacgaagcag 180
ggattctgca aaccctatgc tactccgtca agccgtcaat tgtctgattc gttaccaatt 240
atgacaactt gacggctaca tcattcactt tttcttcaca accggcacgg aactcgctcg 300
ggctggcccc ggtgcatttt ttaaataccc gcgagaaata gagttgatcg tcaaaaccaa 360
cattgcgacc gacggtggcg ataggcatcc gggtggtgct caaaagcagc ttcgcctggc 420
tgatacgttg gtcctcgcgc cagcttaaga cgctaatccc taactgctgg cggaaaagat 480
gtgacagacg cgacggcgac aagcaaacat gctgtgcgac gctggcgata tcaaaattgc 540
tgtctgccag gtgatcgctg atgtactgac aagcctcgcg tacccgatta tccatcggtg 600
gatggagcga ctcgttaatc gcttccatgc gccgcagtaa caattgctca agcagattta 660
tcgccagcag ctccgaatag cgcccttccc cttgcccggc gttaatgatt tgcccaaaca 720
ggtcgctgaa atgcggctgg tgcgcttcat ccgggcgaaa gaaccccgta ttggcaaata 780
ttgacggcca gttaagccat tcatgccagt aggcgcgcgg acgaaagtaa acccactggt 840
gataccattc gcgagcctcc ggatgacgac cgtagtgatg aatctctcct ggcgggaaca 900
gcaaaatatc acccggtcgg caaacaaatt ctcgtccctg atttttcacc accccctgac 960
cgcgaatggt gagattgaga atataacctt tcattcccag cggtcggtcg ataaaaaaat 1020
cgagataacc gttggcctca atcggcgtta aacccgccac cagatgggca ttaaacgagt 1080
atcccggcag caggggatca ttttgcgctt cagccatact tttcatactc ccgccattca 1140
gagaagaaac caattgtcca tattgcatca gacattgccg tcactgcgtc ttttactggc 1200
tcttctcgct aaccaaaccg gtaaccccgc ttattaaaag cattctgtaa caaagcggga 1260
ccaaagccat gacaaaaacg cgtaacaaaa gtgtctataa tcacggcaga aaagtccaca 1320
ttgattattt gcacggcgtc acactttgct atgccatagc atttttatcc ataagattag 1380
cggatcctac ctgacgcttt ttatcgcaac tctctactgt ttctccatac ccgttttttt 1440
gggctagcga attcgagctc taaggaggtg ccacaattct cgagccatac ccattctaat 1500
gatcataagg aggtgtacat gtcaatacta ctgaccttgc accaaagttt gtccgcatta 1560
ctggtcgatg caacgagtga tgaggctcgc aagaacctga tggatgtgct cagggatcgc 1620
caggcgttct ccgagcgtac ctggaaagtg ctcctgtccg tttgccggac gtgggcggca 1680
tggtgcaagt tgaacaaccg gaaatggttt cccgcggaac ctgaagatgt tcgcgattac 1740
cttctacatc ttcaggctcg cggtctggca gtaaacacta tcctgcaaca tttggcccag 1800
ctaaacatgc tccaccgtcg gttcgggctg ccacgaccgg gcgacagcga cgctgtttca 1860
ctggttatgc ggcgaatccg aagggagaac gtcgatgctg gtgagcgtac caagcaggcc 1920
ctagcgttcg agcgcactga cttcgaccag gttcgtgcac tcatggaaaa tagcgaacgg 1980
ggccaggata tacgtactct ggcacttctg ggggttgctt ataacaccct gttacgcgta 2040
tccgaaattg ccaggattcg gattaaagac atctcacgta ctgacggtgg gaggatgcta 2100
atccacatta gcagaacgaa aacgctggtc agcaccgcag gcgtagagaa ggcgcttagc 2160
ctgggggtaa ctaaactggt cgagcgatgg atttccgtct ctggtgtggc tagtgaccca 2220
aacaattacc tgttttgcca ggttagaata aatggtgtgg ccgtgccgtc tgccaccagc 2280
cggctatcaa ccgacgtcct gcgaaagatt tttgaggctg cccaccgcct gatctacggt 2340
gccaaggatg gctctggtca gagatacctg gcctggtctg ggcacagtgc ccgtgtcgga 2400
gccgcgcggg atatggcccg cgctggggtt tcaatagcgg agattatgca ggctggtggc 2460
tggaccaccg tagagagtgt catgaactat atccgtaacc tggacagtga gacaggggca 2520
atggtgcgtc tgctggaaga tggcgactag tctagaggta ccattccgat cgcggatcgg 2580
ccggaatggg atagacgtcc tatcatccac acctactagt taaggaggtg tacatgtcaa 2640
tactactgac cttgcaccaa agtttgtccg cattactggt cgatgcaacg agtgatgagg 2700
ctcgcaagaa cctgatggat gtgctcaggg atcgccaggc gttctccgag cgtacctgga 2760
aagtgctcct gtccgtttgc cggacgtggg cggcatggtg caagttgaac aaccggaaat 2820
ggtttcccgc ggaacctgaa gatgttcgcg attaccttct acatcttcag gctcgcggtc 2880
tggcagtaaa cactatcctg caacatttgg cccagctaaa catgctccac cgtcggttcg 2940
ggctgccacg accgggcgac agcgacgctg tttcactggt tatgcggcga atccgaaggg 3000
agaacgtcga tgctggtgag cgtaccaagc aggccctagc gttcgagcgc actgacttcg 3060
accaggttcg tgcactcatg gaaaatagcg aacggggcca ggatatacgt actctggcac 3120
ttctgggggt tgcttataac accctgttac gcgtatccga aattgccagg attcggatta 3180
aagacatctc acgtactgac ggtgggagga tgctaatcca cattagcaga acgaaaacgc 3240
tggtcagcac cgcaggcgta gagaaggcgc ttagcctggg ggtaactaaa ctggtcgagc 3300
gatggatttc cgtctctggt gtggctagtg acccaaacaa ttacctgttt tgccaggtta 3360
gaataaatgg tgtggccgtg ccgtctgcca ccagccggct atcaaccgac gtcctgcgaa 3420
agatttttga ggctgcccac cgcctgatct acggtgccaa ggatggctct ggtcagagat 3480
acctggcctg gtctgggcac agtgcccgtg tcggagccgc gcgggatatg gcccgcgctg 3540
gggtttcaat agcggagatt atgcaggctg gtggctggac caccgtagag agtgtcatga 3600
actatatccg taacctggac agtgagacag gggcaatggt gcgtctgctg gaagatggcg 3660
actagtctag acgtacgcct gcaggcaagc ttggctgttt tggcggatga gagaagattt 3720
tcagcctgat acagattaaa tcagaacgca gaagcggtct gataaaacag aatttgcctg 3780
gcggcagtag cgcggtggtc ccacctgacc ccatgccgaa ctcagaagtg aaacgccgta 3840
gcgccgatgg tagtgtgggg tctccccatg cgagagtagg gaactgccag gcatcaaata 3900
aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt gtcggtgaac 3960
gctctcctga gtaggacaaa tccgccggga gcggatttga acgttgcgaa gcaacggccc 4020
ggagggtggc gggcaggacg cccgccataa actgccaggc atcaaattaa gcagaaggcc 4080
atcctgacgg atggcctttt tgcgtttcta caaactcttt tgtttatttt tctaaataca 4140
ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 4200
aaggaagagt atgagatctc tcattacatt taaccaaaat tatcacaata taagaatgag 4260
atctttaaca ttgccaatta ggtcagtggt cccaagtagt cacttagaaa atctgtgtat 4320
gtgaaatact gtttgtgact taaaatgaaa tttattttta ataggtgaac ataatattga 4380
ggagacagaa catacagagc aaaagcgaaa tgtgattcga attattcctc accacaacta 4440
caatgcagct attaataagt acaaccatga cattgccctt ctggaactgg acgaaccctt 4500
agtgctaaac agctacgtta cacctatttg cattgctgac aaggaataca cgaacatctt 4560
cctcaaattt ggatctggct atgtaagtgg ctggggaaga gtcttccaca aagggagatc 4620
agctttagtt cttcagtacc ttagagttcc acttgttgac cgagccacat gtcttcgatc 4680
tacaaagttc accatctata acaacatgtt ctgtgctggc ttccatgaag gaggtagaga 4740
ttcatgtcaa ggagatagtg ggggacccca tgttactgaa gtggaaggga ccagtttctt 4800
aactggaatt attagctggg gtgaagagtg tgcaatgaaa ggcaaatatg gaatatatac 4860
caaggtatcc cggtatgtca actggattaa ggaaaaaaca aagctcactt aatgaaagat 4920
ggatttccaa ggttaattca ttggaattga aaattaacag ggcctctcac taactaatca 4980
ctttcccatc ttttgttaga tttgaatata tacattctaa gatctggtcg aatttgcttt 5040
cgaatttctg ccattcatcc gcttattatc acttattcag gcgtagcacc aggcgtttaa 5100
gggcaccaat aactgcctta aaaaaattac gccccgccct gccactcatc gcagtactgt 5160
tgtaattcat taagcattct gccgacatgg aagccatcac agacggcatg atgaacctga 5220
atcgccagcg gcatcagcac cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg 5280
ggggcgaaga agttgtccat attggccacg tttaaatcaa aactggtgaa actcacccag 5340
ggattggctg agacgaaaaa catattctca ataaaccctt tagggaaata ggccaggttt 5400
tcaccgtaac acgccacatc ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg 5460
tattcactcc agagcgatga aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg 5520
tgaacactat cccatatcac cagctcaccg tctttcattg ccatacggaa ttccggatga 5580
gcattcatca ggcgggcaag aatgtgaata aaggccggat aaaacttgtg cttatttttc 5640
tttacggtct ttaaaaaggc cgtaatatcc agctgaacgg tctggttata ggtacattga 5700
gcaactgact gaaatgcctc aaaatgttct ttacgatgcc attgggatat atcaacggtg 5760
gtatatccag tgattttttt ctccatttta gcttccttag ctcctgaaaa tctcgataac 5820
tcaaaaaata cgcccggtag tgatcttatt tcattatggt gaaagttgga acctcttacg 5880
tgccgatcaa cgtctcattt tcgccaaaag ttggcccagg gcttcccggt atcaacaggg 5940
acaccaggat ttatttattc tgcgaagtga tcttccgtca caggtattta ttcggcgcaa 6000
agtgcgtcgg gtgatgctgc caacttactg atttagtgta tgatggtgtt tttgaggtgc 6060
tccagtggct tctgtttcta tcagctgtcc ctcctgttca gctactgacg gggtggtgcg 6120
taacggcaaa agcaccgccg gacatcagcg ctagcggagt gtatactggc ttactatgtt 6180
ggcactgatg agggtgtcag tgaagtgctt catgtggcag gagaaaaaag gctgcaccgg 6240
tgcgtcagca gaatatgtga tacaggatat attccgcttc ctcgctcact gactcgctac 6300
gctcggtcgt tcgactgcgg cgagcggaaa tggcttacga acggggcgga gatttcctgg 6360
aagatgccag gaagatactt aacagggaag tgagagggcc gcggcaaagc cgtttttcca 6420
taggctccgc ccccctgaca agcatcacga aatctgacgc tcaaatcagt ggtggcgaaa 6480
cccgacagga ctataaagat accaggcgtt tccccctggc ggctccctcg tgcgctctcc 6540
tgttcctgcc tttcggttta ccggtgtcat tccgctgtta tggccgcgtt tgtctcattc 6600
cacgcctgac actcagttcc gggtaggcag ttcgctccaa gctggactgt atgcacgaac 6660
cccccgttca gtccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg 6720
aaagacatgc aaaagcacca ctggcagcag ccactggtaa ttgatttaga ggagttagtc 6780
ttgaagtcat gcgccggtta aggctaaact gaaaggacaa gttttggtga ctgcgctcct 6840
ccaagccagt tacctcggtt caaagagttg gtagctcaga gaaccttcga aaaaccgccc 6900
tgcaaggcgg ttttttcgtt ttcagagcaa gagattacgc gcagaccaaa acgatctcaa 6960
gaagatcatc ttattaatca gataaaatat ttctag 6996
<210> 39
<211> 343
<212> PRT
<213> Bacteriophage P1
<400> 39
Met Ser Asn Leu Leu Thr Val His Gln Asn Leu Pro Ala Leu Pro Val
1 5 10 15
Asp Ala Thr Ser Asp Glu Val Arg Lys Asn Leu Met Asp Met Phe Arg
20 25 30
Asp Arg Gln Ala Phe Ser Glu His Thr Trp Lys Met Leu Leu Ser Val
35 40 45
Cys Arg Ser Trp Ala Ala Trp Cys Lys Leu Asn Asn Arg Lys Trp Phe
50 55 60
Pro Ala Glu Pro Glu Asp Val Arg Asp Tyr Leu Leu Tyr Leu Gln Ala
65 70 75 80
Arg Gly Leu Ala Val Lys Thr Ile Gln Gln His Leu Gly Gln Leu Asn
85 90 95
Met Leu His Arg Arg Ser Gly Leu Pro Arg Pro Ser Asp Ser Asn Ala
100 105 110
Val Ser Leu Val Met Arg Arg Ile Arg Lys Glu Asn Val Asp Ala Gly
115 120 125
Glu Arg Ala Lys Gln Ala Leu Ala Phe Glu Arg Thr Asp Phe Asp Gln
130 135 140
Val Arg Ser Leu Met Glu Asn Ser Asp Arg Cys Gln Asp Ile Arg Asn
145 150 155 160
Leu Ala Phe Leu Gly Ile Ala Tyr Asn Thr Leu Leu Arg Ile Ala Glu
165 170 175
Ile Ala Arg Ile Arg Val Lys Asp Ile Ser Arg Thr Asp Gly Gly Arg
180 185 190
Met Leu Ile His Ile Gly Arg Thr Lys Thr Leu Val Ser Thr Ala Gly
195 200 205
Val Glu Lys Ala Leu Ser Leu Gly Val Thr Lys Leu Val Glu Arg Trp
210 215 220
Ile Ser Val Ser Gly Val Ala Asp Asp Pro Asn Asn Tyr Leu Phe Cys
225 230 235 240
Arg Val Arg Lys Asn Gly Val Ala Ala Pro Ser Ala Thr Ser Gln Leu
245 250 255
Ser Thr Arg Ala Leu Glu Gly Ile Phe Glu Ala Thr His Arg Leu Ile
260 265 270
Tyr Gly Ala Lys Asp Asp Ser Gly Gln Arg Tyr Leu Ala Trp Ser Gly
275 280 285
His Ser Ala Arg Val Gly Ala Ala Arg Asp Met Ala Arg Ala Gly Val
290 295 300
Ser Ile Pro Glu Ile Met Gln Ala Gly Gly Trp Thr Asn Val Asn Ile
305 310 315 320
Val Met Asn Tyr Ile Arg Asn Leu Asp Ser Glu Thr Gly Ala Met Val
325 330 335
Arg Leu Leu Glu Asp Gly Asp
340
<210> 40
<211> 34
<212> DNA
<213> Homo sapiens
<400> 40
tacacagtgt atattgattt ttatcaaatg cctt 34
<210> 41
<211> 34
<212> DNA
<213> Homo sapiens
<400> 41
tacacaatgt atattgattt ttatcaaatg cctt 34
<210> 42
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Intermediate target site HexL
<400> 42
tacacagtgt atattgattt ttatacattg tgta 34
<210> 43
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Intermediate target site HexR
<400> 43
aaggcatttg atattgattt ttatcaaatg cctt 34
<210> 44
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Intermediate target site HexR1
<400> 44
aagacatttt atattgattt ttataaaatg tctt 34
<210> 45
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Intermediate target site HexR2
<400> 45
aacgcattgg atattgattt ttatccaatg cgtt 34
<210> 46
<211> 343
<212> PRT
<213> Artificial Sequence
<220>
<223> Recombinase Hex-R-#7
<400> 46
Met Ser Asn Leu Gln Thr Leu His Gln Asn Leu Ser Ala Leu Leu Ala
1 5 10 15
Asp Ala Thr Ser Asp Glu Ala Arg Lys Asn Leu Thr Asp Val Leu Arg
20 25 30
Asp Ser Gln Ala Phe Ser Glu His Thr Trp Arg Val Leu Leu Ser Val
35 40 45
Cys Arg Ser Trp Ala Ala Trp Cys Glu Leu Asn Asn Arg Lys Trp Phe
50 55 60
Pro Ala Glu Pro Glu Asp Val Arg Asp Tyr Leu Leu His Leu Gln Ala
65 70 75 80
Arg Gly Leu Thr Val Asn Thr Ile Gln Gln His Leu Cys Gln Leu Asn
85 90 95
Met Leu His Arg Arg Ser Gly Leu Pro Pro Pro Gly Asp Ser Asn Ala
100 105 110
Ala Ser Leu Val Met Arg Arg Ile Arg Lys Glu Asn Val Asp Ala Gly
115 120 125
Glu Arg Val Lys Gln Ala Leu Ala Phe Glu Arg Thr Asp Leu Asp Gln
130 135 140
Val Cys Ala Leu Met Glu Asn Ser Asn Arg Cys Gln Asp Ile Arg Asn
145 150 155 160
Leu Ala Phe Leu Gly Val Ala Tyr Asn Thr Leu Leu Arg Ile Ser Glu
165 170 175
Val Ala Arg Ile Arg Val Arg Asp Ile Thr Arg Thr Asp Gly Gly Arg
180 185 190
Met Leu Ile His Ile Gly Arg Thr Lys Thr Leu Val Ser Thr Ala Gly
195 200 205
Val Glu Lys Ala Leu Ser Leu Arg Val Thr Lys Leu Val Glu Arg Trp
210 215 220
Ile Ser Val Ser Gly Val Ala Asp Asp Pro Asn Asn Phe Leu Phe Cys
225 230 235 240
Arg Val Gly Arg Asn Gly Val Ala Val Ser Ser Ala Thr Ser Gln Leu
245 250 255
Ser Thr Pro Ala Leu Gln Gly Ile Phe Ala Ser Ala His Arg Leu Ile
260 265 270
Tyr Gly Ala Arg Asp Asp Pro Gly Gln Arg Tyr Leu Thr Trp Ser Gly
275 280 285
His Ser Ala Arg Val Gly Ala Ala Arg Asp Met Ala Arg Ala Gly Val
290 295 300
Pro Ile Ala Glu Ile Met Gln Ala Gly Gly Trp Thr Thr Ile Glu Ser
305 310 315 320
Val Met Asn Tyr Leu Arg Asn Leu Asp Ser Glu Thr Gly Ala Met Val
325 330 335
Arg Leu Leu Glu Gly Asp Asp
340
<210> 47
<211> 343
<212> PRT
<213> Artificial Sequence
<220>
<223> Recombinase Hex-L-#7
<400> 47
Met Ser Asn Leu Gln Thr Leu His Gln Asn Leu Ser Ala Leu Leu Val
1 5 10 15
Asp Val Thr Ser Asp Glu Ala Arg Lys Ser Leu Met Asp Met Leu Arg
20 25 30
Asp Arg Gln Ala Phe Ser Glu His Thr Trp Lys Met Leu Leu Ser Val
35 40 45
Cys Arg Ser Trp Ala Ala Trp Cys Glu Ser Asn Asn Arg Lys Trp Phe
50 55 60
Pro Ala Glu Pro Glu Asp Val Arg Asp Tyr Leu Leu His Leu Gln Ala
65 70 75 80
Arg Gly Leu Ala Val Arg Thr Ile Gln Gln His Leu Cys Gln Leu Asn
85 90 95
Met Leu His Arg Arg Ser Gly Leu Pro Arg Pro Gly Asp Ser Asn Ala
100 105 110
Val Ser Leu Val Met Arg Arg Ile Arg Lys Glu Asn Val Asp Ala Gly
115 120 125
Glu Arg Ala Lys Gln Ala Leu Ala Phe Glu Arg Thr Asp Phe Asp Gln
130 135 140
Val Arg Ser Leu Met Glu Asp Ser Asp Arg Cys Gln Asp Ile Arg Asn
145 150 155 160
Leu Ala Phe Leu Gly Ile Ala Tyr Asn Thr Leu Leu Arg Ile Ser Glu
165 170 175
Ile Ala Arg Ile Arg Val Arg Asp Ile Ser Arg Thr Asp Gly Gly Arg
180 185 190
Met Leu Ile His Ile Gly Arg Thr Lys Thr Leu Ile Ser Thr Ala Gly
195 200 205
Val Glu Lys Ala Leu Ser Leu Gly Val Thr Lys Leu Val Glu Arg Trp
210 215 220
Ile Ser Val Ser Gly Val Ala Asp Asp Pro Asn Asn Tyr Leu Phe Cys
225 230 235 240
Arg Val Arg Lys His Gly Val Ala Ala Pro Ser Ala Thr Ser Gln Leu
245 250 255
Ser Thr Asn Ala Leu Gln Arg Ile Phe Glu Ala Ala His Cys Leu Ile
260 265 270
Tyr Gly Ala Lys Asp Asp Ser Gly Gln Arg Tyr Leu Ala Trp Ser Gly
275 280 285
His Ser Ala Arg Val Gly Ala Ala Arg Asp Met Ala Arg Ala Gly Val
290 295 300
Ser Ile Pro Glu Ile Met Gln Ala Gly Gly Trp Thr Thr Val Asn Ser
305 310 315 320
Val Met Asn Tyr Ile Arg Asn Leu Asp Ser Glu Thr Gly Ala Met Val
325 330 335
Arg Leu Leu Glu Glu Gly Asp
340
<210> 48
<211> 343
<212> PRT
<213> Artificial Sequence
<220>
<223> Recombinase Hex-R-#30
<400> 48
Met Ser Tyr Leu His Thr Leu His Gln Ser Leu Ser Ala Leu Leu Val
1 5 10 15
Asn Ala Thr Ser Asp Glu Ala Arg Lys Asn Leu Met Asp Val Phe Arg
20 25 30
Asp Cys Gln Ala Phe Ser Glu His Thr Trp Arg Val Leu Leu Ser Val
35 40 45
Cys Arg Ser Trp Val Thr Trp Cys Lys Leu Asn Asn Arg Lys Trp Phe
50 55 60
Pro Ala Glu Pro Glu Asp Val Arg Asp Tyr Leu Leu His Leu Gln Ala
65 70 75 80
Arg Gly Leu Thr Val Asn Thr Ile Gln Gln His Leu Cys Gln Leu Asn
85 90 95
Met Leu His Arg Arg Ser Gly Leu Pro Arg Pro Gly Asp Ser Asn Ala
100 105 110
Val Thr Leu Val Met Arg Arg Ile Arg Lys Glu Asn Val Asp Ala Gly
115 120 125
Glu Arg Thr Lys Gln Ala Leu Ala Phe Glu Arg Thr Asp Phe Gly Gln
130 135 140
Val Arg Ser Leu Met Glu Asn Ser Asp Arg Cys Arg Asp Ile Arg Asn
145 150 155 160
Leu Ala Phe Leu Gly Val Ala Tyr Asn Thr Leu Leu Arg Ile Ser Glu
165 170 175
Ile Ala Arg Ile Arg Val Arg Asp Ile Ser Arg Thr Asp Gly Gly Arg
180 185 190
Met Leu Ile His Ile Gly Arg Thr Lys Thr Leu Val Ser Thr Ala Gly
195 200 205
Ala Glu Lys Ala Leu Ser Gln Gly Val Thr Lys Leu Val Glu Arg Trp
210 215 220
Ile Ser Val Ser Gly Val Ala Asp Asp Pro Asn Asn Tyr Leu Phe Cys
225 230 235 240
Arg Val Arg Arg Asn Gly Val Ala Ala Pro Ser Ala Thr Gly Gln Leu
245 250 255
Ser Thr Pro Ala Leu Gln Gly Ile Phe Val Ser Ala His Arg Leu Val
260 265 270
Tyr Gly Ala Arg Asp Ala Ser Gly Gln Arg Tyr Leu Thr Trp Ser Gly
275 280 285
His Ser Ala Arg Val Gly Thr Ala Arg Asp Met Ala Arg Ala Gly Val
290 295 300
Pro Ile Ala Glu Ile Met Gln Ala Gly Gly Trp Thr Thr Ile Glu Ser
305 310 315 320
Val Met Asn Tyr Leu Arg Asn Leu Asp Ser Glu Thr Gly Ala Met Val
325 330 335
Arg Leu Leu Glu Asp Asp Asp
340
<210> 49
<211> 343
<212> PRT
<213> Artificial Sequence
<220>
<223> Recombinase Hex-L-#30
<400> 49
Met Ser Asn Leu Gln Thr Leu His Gln Asn Leu Ser Ala Leu Leu Val
1 5 10 15
Asp Ala Thr Cys Asp Glu Ala Arg Glu Asn Leu Leu Asn Met Phe Arg
20 25 30
Asp Arg Gln Ala Phe Ser Glu His Thr Trp Lys Met Leu Leu Ser Val
35 40 45
Cys Arg Ser Trp Ala Ala Trp Cys Glu Leu Asn Asn Arg Lys Trp Phe
50 55 60
Pro Ala Glu Pro Glu Asp Val Arg Asp Tyr Leu Leu His Leu Gln Ala
65 70 75 80
Arg Gly Leu Ala Val Lys Thr Ile Gln Gln His Leu Ala Gln Leu Asn
85 90 95
Met Leu His Arg Arg Ser Gly Leu Pro Arg Pro Gly Asp Ser Asn Ala
100 105 110
Val Ser Leu Val Val Arg Arg Ile Arg Lys Glu Asn Val Asp Ala Gly
115 120 125
Glu Arg Ala Lys Gln Ala Leu Ala Phe Glu Arg Thr Asp Phe Asp Gln
130 135 140
Val Arg Ser Leu Met Glu Asn Ser Asp Arg Cys Gln Asp Ile Arg Asn
145 150 155 160
Leu Ala Phe Leu Gly Ile Ala Tyr Asn Thr Leu Leu Arg Ile Ser Glu
165 170 175
Ile Ala Arg Ile Arg Val Lys Asp Ile Ser Arg Thr Asp Gly Gly Arg
180 185 190
Met Leu Ile His Ile Gly Arg Thr Lys Thr Leu Val Ser Thr Ala Gly
195 200 205
Val Glu Lys Ala Leu Ser Leu Gly Val Thr Lys Leu Val Glu Arg Trp
210 215 220
Ile Ser Val Ser Gly Val Ala Asp Asp Pro Asn Asn Tyr Leu Phe Cys
225 230 235 240
Arg Val Ser Lys Tyr Gly Val Ala Ala Pro Ser Ala Thr Ser Gln Leu
245 250 255
Ser Thr His Ala Leu Gln Arg Ile Phe Glu Ala Ala His Arg Leu Ile
260 265 270
Tyr Gly Ala Lys Asp Asp Ser Gly Arg Arg Tyr Leu Ala Trp Ser Gly
275 280 285
His Ser Ala Arg Val Gly Ala Ala Arg Asp Met Ala Arg Ala Gly Val
290 295 300
Ser Ile Pro Glu Ile Met Gln Ala Gly Gly Trp Ala Thr Val Asn Ser
305 310 315 320
Val Met Asn Tyr Ser Arg Asn Leu Asp Ser Glu Ala Gly Ala Met Val
325 330 335
Arg Leu Leu Glu Asp Gly Asp
340

Claims (26)

1.用于鉴别序列的方法,所述序列是DNA重组酶的潜在靶位点,所述DNA重组酶能够诱导基因组中感兴趣序列的位点特异性DNA重组,所述方法包括以下步骤:
i.筛选包含所述感兴趣序列的所述基因组或其一部分以选出作为潜在间隔序列的两个序列,所述潜在间隔序列的长度为至少5bp且最多12bp,其中所述潜在间隔序列中的一个位于所述感兴趣序列的上游,而另一个位于所述感兴趣序列的下游,以及其中所述两个序列具有100kb的最大距离和150bp的最小距离,
ii.通过对于每个潜在间隔序列确定在其一侧形成潜在第一半位点的相邻核苷酸、优选10至20个核苷酸,以及在其另一侧形成潜在第二半位点的相邻核苷酸、优选10至20个核苷酸、更优选12至15个核苷酸,来鉴别潜在靶位点,两个潜在半位点和其间的间隔序列形成潜在靶位点,
iii.对步骤ii.中鉴别的所述潜在靶位点进行进一步筛选以选出不会出现在宿主的基因组中(其它地方)的潜在靶序列,以确保序列特异性缺失。
2.用于制备设计DNA重组酶的方法,所述设计DNA重组酶能够通过重组基因组中天然存在的两个靶序列来诱导位点特异性DNA重组以改变所述基因组中的核苷酸序列,所述方法包含:
a)选择在待改变的核苷酸序列上游的核苷酸序列作为第一靶位点,并且选择在所述待改变的核苷酸序列下游的核苷酸序列作为第二靶位点,所述靶位点的序列是不相同的,其中每个靶位点包含分别具有10至20个核苷酸的第一半位点和第二半位点,所述第一半位点和第二半位点由具有5至12个核苷酸的间隔序列隔开,
其中权利要求1的步骤在步骤a)之前进行或者作为步骤a)的一部分进行,
b)使用包含在步骤a)中选择的所述第一靶位点和所述第二靶位点的载体作为底物,在DNA重组酶的至少一个文库上应用分子定向进化,
直到获得在a)中选择的所述第一靶位点和所述第二靶位点上有活性的至少一种设计DNA重组酶。
3.权利要求1或2所述的方法,其中所述DNA重组酶适用于缺失,并且所述(潜在)间隔序列是相同的。
4.权利要求1或2所述的方法,其中所述DNA重组酶适用于置换,并且所述(潜在)间隔序列是不相同的。
5.用于制备设计DNA重组酶的方法,所述设计DNA重组酶能够通过重组基因组中天然存在的两个靶序列来诱导位点特异性DNA重组以置换所述基因组中的核苷酸序列,所述方法包含:
a)选择在待改变的核苷酸序列上游的核苷酸序列作为第一靶位点,并且选择在所述待改变的核苷酸序列下游的核苷酸序列作为第二靶位点,所述靶位点的序列是不相同的,其中每个靶位点包含分别具有10至20个核苷酸的第一半位点和第二半位点,所述第一半位点和第二半位点由具有5至12个核苷酸的间隔序列隔开,
b)使用包含在步骤a)中选择的所述第一靶位点和所述第二靶位点的载体作为底物,在DNA重组酶的至少一个文库上应用分子定向进化,其中步骤b)在存在包含所述第一靶位点和所述第二靶位点的合成序列的情况下进行,以选择所述载体与所述合成序列之间的重组。
直到获得在a)中选择的所述第一靶位点和所述第二靶位点上有活性的至少一种设计DNA重组酶。
6.权利要求1至5之一所述的方法,其中所述待改变的核苷酸序列是包含突变,特别是点突变、移码突变、缺失或插入的序列。
7.权利要求1至6任一项所述的方法,其中步骤b)中使用的所述载体是表达载体,所述表达载体编码DNA重组酶的至少一个文库,并且包含位于所述第一靶位点与所述第二靶位点之间的负选择标记,更优选至少一个独特的限制酶识别位点。
8.权利要求5至7任一项所述的方法,用于制备适用于置换的设计DNA重组酶,其中所述合成序列包含位于所述第一靶位点与所述第二靶位点之间的正选择标记。
9.权利要求5至8任一项所述的方法,用于制备适用于置换的设计DNA重组酶,步骤b)以三个子步骤来进行:
i)所述至少一个文库在没有人工序列的情况下进化,
ii)使用具有正选择标记的人工序列进化作为步骤i)的结果获得的所述至少一个文库,
iii)使用不具有正选择标记的人工序列进化作为步骤ii)的结果获得的所述至少一个文库。
10.设计DNA重组酶,其可通过权利要求1至9任一项所述的方法获得。
11.设计DNA重组酶,优选权利要求10的设计DNA重组酶,优选地可通过权利要求1至9任一项所述的方法获得,其包含至少两种不同的单体,所述酶能够通过重组基因组中天然存在的两个靶序列而在宿主生物体基因组中诱导位点特异性DNA重组,所述靶位点的序列是不相同的。
12.权利要求10或11所述的设计DNA重组酶,其中一种单体包含SEQ ID NO:1(Rec F9-1)的序列或包含与SEQ ID NO:1或优选与SEQ ID NO:28、SEQ ID NO:3或SEQ ID NO:5具有至少95%序列相同性、优选98%序列相同性的序列,并且一种单体包含SEQ ID NO:2(RecF9-2)的序列或包含与SEQ ID NO:2或优选与SEQ ID NO:29、SEQ ID NO:4或SEQ ID NO:6具有至少90%序列相同性、优选95%序列相同性、更优选98%序列相同性的序列。
13.设计DNA重组酶,其包含SEQ ID NO:1(Rec F9-1)和/或SEQ ID NO:2(Rec F9-2)或SEQ ID NO:36(Rec F9-3)或SEQ ID NO:46(Hex-R-#7)和/或SEQ ID NO:47(Hex-L-#7)或SEQ ID NO:48(Hex-R-#30)和/或SEQ ID NO:49(Hex-L-#30)的序列、与SEQ ID NO:1和/或SEQ ID NO:2或SEQ ID NO:36或SEQ ID NO:46和/或SEQ ID NO:47或SEQ ID NO:48和/或SEQ ID NO:49、或者优选地与选自SED ID NO:28、29或3-6的至少一个序列具有至少90%序列相同性、优选95%序列相同性、更优选98%序列相同性的序列。
14.用于医学的权利要求10至13任一项所述的设计DNA重组酶或用于医学的编码权利要求9至11任一项所述的DNA重组酶的核酸或载体,其中通过引入所述设计DNA重组酶或编码所述DNA重组酶的核酸或载体通过重组第一靶位点和第二靶位点而在基因组中诱导位点特异性DNA重组以改变感兴趣核苷酸序列,这两个靶位点是天然存在于所述基因组中并且不相同,其中所述靶位点围绕所述感兴趣序列,并且每个靶位点包含具有10至20个核苷酸的第一半位点和第二半位点,所述第一半位点和第二半位点由具有5至12个核苷酸的间隔序列隔开。
15.权利要求14所述的用于医学的设计DNA重组酶或核酸或载体,其中两个靶位点包含相同的间隔序列,并且所述重组导致所述感兴趣序列的缺失。
16.权利要求14所述的用于医学的设计DNA重组酶或核酸或载体,其中两个靶位点包含不相同的间隔序列,并另外提供合成供体序列,所述合成供体序列包含围绕期望序列的两个靶位点并且所述重组导致用所述期望序列置换所述感兴趣序列。
17.核酸或载体,其编码权利要求10至13任一项所述的设计DNA重组酶。
18.核酸,其选自SEQ ID NO:7(loxF9a)和SEQ ID NO:8(loxF9b)或与SEQ ID NO:7或SEQ ID NO:8具有至少90%序列相同性的序列或与其反向互补的核酸序列。
19.宿主细胞、宿主器官或非人类宿主生物体,其包含权利要求17或18所述的核酸或载体和/或权利要求10至13任一项所述的设计DNA重组酶。
20.通过引入权利要求10至13任一项所述的设计DNA重组酶或编码权利要求10至13任一项所述的设计DNA重组酶的核酸或载体而重组第一靶位点和第二靶位点诱导位点特异性DNA重组以改变基因组中感兴趣核苷酸序列的方法,其中两个靶位点天然存在于所述基因组中并且不相同。
21.权利要求20所述的方法,通过选择所述第一和第二靶位点以使其间隔序列不同并且另外提供合成序列来诱导所述感兴趣核苷酸序列的置换,所述合成序列包含所述第一靶位点和所述第二靶位点,而所述第一和第二靶位点围绕期望序列;或者通过选择所述第一和第二靶位点以包含相同的间隔序列来诱导所述感兴趣核苷酸序列的缺失。
22.试剂盒,用于通过重组基因组中天然存在的两个靶序列进行位点特异性DNA重组以置换所述基因组中的感兴趣序列,所述试剂盒包含:
-权利要求10至13任一项所述的设计DNA重组酶或权利要求17或18所述的核酸或载体,
-合成序列,其包含侧翼为所述第一靶位点和所述第二靶位点的期望序列,所述期望序列置换所述感兴趣序列。
23.权利要求10至13任一项所述的设计DNA重组酶在催化两个识别位点之间的位点特异性DNA重组中的应用。
24.权利要求23所述的应用,用于产生具有感兴趣序列的敲除或携带修饰序列的细胞或多细胞生物体。
25.权利要求23所述的应用,其中所述靶位点选自与SEQ ID NO:7(loxF9a)和SEQ IDNO:8(loxF9b)相同或反向互补的序列。
26.药物组合物,其包含权利要求10至13任一项所述的设计DNA重组酶或权利要求9所述的核酸或载体。
CN201880039699.9A 2017-06-14 2018-06-14 利用设计dna重组酶遗传改变基因组的方法与手段 Pending CN110914414A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP17175895.6 2017-06-14
EP17175895 2017-06-14
PCT/EP2018/065881 WO2018229226A1 (en) 2017-06-14 2018-06-14 Methods and means for genetic alteration of genomes utilizing designer dna recombining enzymes

Publications (1)

Publication Number Publication Date
CN110914414A true CN110914414A (zh) 2020-03-24

Family

ID=59269741

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880039699.9A Pending CN110914414A (zh) 2017-06-14 2018-06-14 利用设计dna重组酶遗传改变基因组的方法与手段

Country Status (6)

Country Link
US (2) US11845954B2 (zh)
EP (1) EP3638776A1 (zh)
JP (2) JP7402503B2 (zh)
CN (1) CN110914414A (zh)
CA (1) CA3066047A1 (zh)
WO (1) WO2018229226A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3638776A1 (en) 2017-06-14 2020-04-22 Technische Universität Dresden Methods and means for genetic alteration of genomes utilizing designer dna recombining enzymes
AU2020351204A1 (en) 2019-09-18 2022-04-21 Aldevron, Llc Synthetic DNA vectors and methods of use
EP3831939A1 (en) 2019-12-06 2021-06-09 Technische Universität Dresden Fusion of site-specific recombinases for efficient and specific genome editing
AU2022386716A1 (en) 2021-11-15 2024-05-02 Technische Universität Dresden Site-specific recombinases for efficient and specific genome editing

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011147590A2 (en) * 2010-05-27 2011-12-01 Heinrich-Pette-Institut Tailored recombinase for recombining asymmetric target sites in a plurality of retrovirus strains
WO2016034553A1 (en) * 2014-09-02 2016-03-10 Heinrich-Pette-Institut Leibniz-Institut Für Experimentelle Virologie - Stiftung Bürgerlichen Rechts Well-tolerated and highly specific tailored recombinase for recombining asymmetric target sites in a plurality of retrovirus strains
WO2016089866A1 (en) * 2014-12-01 2016-06-09 President And Fellows Of Harvard College Rna-guided systems for in vivo gene editing
US20170058297A1 (en) * 2015-08-25 2017-03-02 Washington University Compositions and methods for site specific recombination at asymmetric sites

Family Cites Families (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1293460C (en) 1985-10-07 1991-12-24 Brian Lee Sauer Site-specific recombination of dna in yeast
US4861719A (en) 1986-04-25 1989-08-29 Fred Hutchinson Cancer Research Center DNA constructs for retrovirus packaging cell lines
US5278056A (en) 1988-02-05 1994-01-11 The Trustees Of Columbia University In The City Of New York Retroviral packaging cell lines and process of using same
US5670488A (en) 1992-12-03 1997-09-23 Genzyme Corporation Adenovirus vector for gene therapy
EP0689601B1 (en) 1993-02-22 2006-10-04 The Rockefeller University Production of high titer helper-free retroviruses by transient transfection
FR2712812B1 (fr) 1993-11-23 1996-02-09 Centre Nat Rech Scient Composition pour la production de produits thérapeutiques in vivo.
IL116816A (en) 1995-01-20 2003-05-29 Rhone Poulenc Rorer Sa Cell for the production of a defective recombinant adenovirus or an adeno-associated virus and the various uses thereof
US6013516A (en) 1995-10-06 2000-01-11 The Salk Institute For Biological Studies Vector and method of use for nucleic acid delivery to non-dividing cells
US6774279B2 (en) 1997-05-30 2004-08-10 Carnegie Institution Of Washington Use of FLP recombinase in mice
US5981830A (en) 1997-05-30 1999-11-09 Schering Aktiengesellschaft Knockout mice and their progeny with a disrupted hepsin gene
US5929301A (en) 1997-11-18 1999-07-27 Pioneer Hi-Bred International Nucleic acid sequence encoding FLP recombinase
AU760113C (en) 1997-11-18 2004-04-22 Pioneer Hi-Bred International, Inc. Compositions and methods for genetic modification of plants
DE69833457T2 (de) 1997-11-18 2006-09-14 Pioneer Hi-Bred International, Inc. Neuartige methode zur integration von fremd-dna ins eukaryotische genom
DE19941186A1 (de) 1999-08-30 2001-03-01 Peter Droege Sequenz-spezifische DNA-Rekombination in eukaryotischen Zellen
GB0029375D0 (en) 2000-12-01 2001-01-17 Total Fina Elf Substrate linked directed evolution (slide)
DE10140030C1 (de) 2001-08-16 2002-12-19 Gsf Forschungszentrum Umwelt Einsatz mutierter Erkennungssequenzen für mehrfache aufeinander folgende Rekombinase-vermittelte Rekombinationen in einem genetischen System
US20090217400A1 (en) 2004-02-26 2009-08-27 State Of Israel, Ministry Of Agriculture, Agricultural Research Organization Enzymes, cells and methods for site specific recombination at asymmetric sites
US7422889B2 (en) 2004-10-29 2008-09-09 Stowers Institute For Medical Research Dre recombinase and recombinase systems employing Dre recombinase
EP1942192A1 (en) 2007-01-08 2008-07-09 Heinrich-Pette-Institut für experimentelle Virologie und Immunologie Use of a tailored recombinase for the treatment of retroviral infections
DE102007001370A1 (de) 2007-01-09 2008-07-10 Curevac Gmbh RNA-kodierte Antikörper
WO2009007982A1 (en) 2007-07-11 2009-01-15 State Of Israel, Ministry Of Agriculture, Agricultural Research Organization A conserved region of the hiv-1 genome and uses thereof
WO2009146179A1 (en) 2008-04-15 2009-12-03 University Of Iowa Research Foundation Zinc finger nuclease for the cftr gene and methods of use thereof
WO2010075441A1 (en) 2008-12-22 2010-07-01 Trustees Of Boston University Modular nucleic acid-based circuits for counters, binary operations, memory, and logic
DE102008063216A1 (de) 2008-12-29 2010-07-01 Wilhelm Karmann Gmbh Verdeck eines Cabriolet-Fahrzeugs mit wenigstens zwei Dachsegmenten und einem Innenhimmel
WO2010143606A1 (ja) 2009-06-08 2010-12-16 財団法人かずさディー・エヌ・エー研究所 新規な部位特異的組換え酵素とその認識配列を用いた部位特異的組換え方法
RS63817B1 (sr) 2010-07-06 2023-01-31 Glaxosmithkline Biologicals Sa Čestice za isporuku slične virionu za molekule samoreplicirajuće rnk
US9394537B2 (en) 2010-12-22 2016-07-19 President And Fellows Of Harvard College Continuous directed evolution
EP2690177B1 (en) 2012-07-24 2014-12-03 Technische Universität Dresden Protein with recombinase activity for site-specific DNA-recombination
JP6410726B2 (ja) 2012-12-10 2018-10-24 レゾリューション バイオサイエンス, インコーポレイテッド 標的化ゲノム解析のための方法
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
WO2014134412A1 (en) 2013-03-01 2014-09-04 Regents Of The University Of Minnesota Talen-based gene correction
GB201414130D0 (en) 2014-08-08 2014-09-24 Agency Science Tech & Res Mutants of the bacteriophage lambda integrase
CN106191041B (zh) 2015-04-30 2020-12-29 杭州菁因康生物科技有限公司 基因打靶方法
US10392674B2 (en) 2015-07-22 2019-08-27 President And Fellows Of Harvard College Evolution of site-specific recombinases
US11078493B2 (en) 2016-06-21 2021-08-03 Nanyang Technological University Site-specific DNA recombination
CA3033327A1 (en) 2016-08-09 2018-02-15 President And Fellows Of Harvard College Programmable cas9-recombinase fusion proteins and uses thereof
EP3638776A1 (en) 2017-06-14 2020-04-22 Technische Universität Dresden Methods and means for genetic alteration of genomes utilizing designer dna recombining enzymes
WO2021015997A1 (en) 2019-07-15 2021-01-28 President And Fellows Of Harvard College Methods and compositions for gene delivery
EP3831939A1 (en) 2019-12-06 2021-06-09 Technische Universität Dresden Fusion of site-specific recombinases for efficient and specific genome editing
US20230064644A1 (en) 2020-02-04 2023-03-02 The Board Of Trustees Of The Leland Stanford Junior University Compositions and Methods for Controlling Production of Polypeptides in Cells
EP4133086A4 (en) 2020-04-07 2024-06-05 IO Biosciences, Inc. NUCLEIC ACID CONSTRUCTS WITH GENE-EDITING MULTI-SITES
GB202005180D0 (en) 2020-04-08 2020-05-20 Ge Healthcare Bio Sciences Ab Methods for targeted integration

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011147590A2 (en) * 2010-05-27 2011-12-01 Heinrich-Pette-Institut Tailored recombinase for recombining asymmetric target sites in a plurality of retrovirus strains
WO2016034553A1 (en) * 2014-09-02 2016-03-10 Heinrich-Pette-Institut Leibniz-Institut Für Experimentelle Virologie - Stiftung Bürgerlichen Rechts Well-tolerated and highly specific tailored recombinase for recombining asymmetric target sites in a plurality of retrovirus strains
WO2016089866A1 (en) * 2014-12-01 2016-06-09 President And Fellows Of Harvard College Rna-guided systems for in vivo gene editing
US20170058297A1 (en) * 2015-08-25 2017-03-02 Washington University Compositions and methods for site specific recombination at asymmetric sites

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JANET KARPINSKI等: "Directed evolution of a recombinase that excises the provirus of most HIV-1 primary isolates with high specificity", 《NATURE BIOTECHNOLOGY》 *
SWETHA BOLUSANI等: "Evolution of variants of yeast site-specific recombinase Flp that utilize native genomic sequences as recombination target sites", 《NUCLEIC ACIDS RESEARCH》 *

Also Published As

Publication number Publication date
JP2020527938A (ja) 2020-09-17
US11845954B2 (en) 2023-12-19
JP2023116580A (ja) 2023-08-22
US20210147878A1 (en) 2021-05-20
CA3066047A1 (en) 2018-12-20
JP7402503B2 (ja) 2023-12-21
US20230235364A1 (en) 2023-07-27
WO2018229226A1 (en) 2018-12-20
EP3638776A1 (en) 2020-04-22

Similar Documents

Publication Publication Date Title
CN108070611B (zh) 植物碱基编辑方法
CN108753813B (zh) 获得无标记转基因植物的方法
CN110914414A (zh) 利用设计dna重组酶遗传改变基因组的方法与手段
US7384776B2 (en) Expression vectors for increasing protein yield from a cell culture and methods of use thereof
KR20230136697A (ko) Rna-가이드 유전자 편집 및 유전자 조절
KR102096592B1 (ko) 신규한 crispr 연관 단백질 및 이의 용도
CN109475619A (zh) 神经元蜡样脂褐质沉积症的基因治疗
CN108486105B (zh) 一种马克斯克鲁维酵母启动子及其制备方法与应用
US6544779B1 (en) Pseudo-type retroviral vectors with modifiable surface capsid proteins
CN113302303A (zh) 经修饰的丝状真菌宿主细胞
CN113061626B (zh) 一种组织特异性敲除斑马鱼基因的方法及应用
CN105176936B (zh) 复制耐受型的西门利克森林病毒的亚克隆及制备方法和应用
CN111171132B (zh) 乌鳢抗菌肽
CN110734480B (zh) 大肠杆菌分子伴侣GroEL/ES在协助合成植物Rubisco中的应用
CN113039278A (zh) 通过指导的内切核酸酶和单链寡核苷酸进行基因组编辑
CA2440044A1 (en) Cloning vectors and method for molecular cloning
CN114874332B (zh) 经修饰的rnf112作为治疗als药物的应用
KR101566371B1 (ko) 구제역 아시아1 혈청형의 표준백신 바이러스의 방어항원을 발현하는 재조합 구제역 바이러스 및 이의 제조 방법
CN114438083A (zh) 识别猪PERV基因的sgRNA及其编码DNA和应用
CN108728484B (zh) 用于获得无标记转基因植物的载体及其应用
CN111826397A (zh) 生产重组目标蛋白的方法、过表达载体以及病毒悬液
CN114317605B (zh) 一种小胶质细胞钾离子探针转基因小鼠模型的构建方法
CN115109791B (zh) 一种基于IncQ型质粒泛宿主的功能基因递送载体、构建方法和应用
CN101717787A (zh) 肝组织特异性表达rtTA的载体及其应用
CN112111512A (zh) 一种斑马鱼中条件性诱导kdrl基因敲除用于研究血管生长的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination