CN107429241A - Dna敲入系统 - Google Patents

Dna敲入系统 Download PDF

Info

Publication number
CN107429241A
CN107429241A CN201580041157.1A CN201580041157A CN107429241A CN 107429241 A CN107429241 A CN 107429241A CN 201580041157 A CN201580041157 A CN 201580041157A CN 107429241 A CN107429241 A CN 107429241A
Authority
CN
China
Prior art keywords
sequence
nucleic acid
cell
homology
chromosome
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201580041157.1A
Other languages
English (en)
Inventor
沈月雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Biocytogen Co Ltd
Original Assignee
Beijing Biocytogen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Biocytogen Co Ltd filed Critical Beijing Biocytogen Co Ltd
Publication of CN107429241A publication Critical patent/CN107429241A/zh
Pending legal-status Critical Current

Links

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/072Animals genetically altered by homologous recombination maintaining or altering function, i.e. knock in
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/0393Animal model comprising a reporter system for screening tests

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Environmental Sciences (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Animal Behavior & Ethology (AREA)
  • Animal Husbandry (AREA)
  • Veterinary Medicine (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Cell Biology (AREA)
  • Mycology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本公开内容涉及一种高效基因组编辑技术。一方面,该技术可显著提高细胞内靶向(包括基因打靶)的同源重组效率。使用该技术,可以快速且高效地产生经遗传修饰的细胞系、大鼠、小鼠、斑马鱼,和其他物种的受精卵。

Description

DNA敲入系统
相关申请
本申请要求于2014年8月14日提交的美国临时专利申请号62/037,551的优先权权益,其内容通过引用整体并入本文。
ASCII文本文件的序列表的提交
以下ASCII文本文件的提交的内容通过引用整体并入本文:计算机可读形式(computer readable form,CRF)的序列表(文件名:735782000140SeqList.txt,记录日期:2015年8月11日,大小:24KB)。
技术领域
本发明涉及一种高效的DNA敲入(enhanced DNA knock-in,EKI)系统及其用途。
背景技术
DNA编辑的最新发展允许将外源基因有效引入宿主细胞的染色体中(基因敲入)。这允许将编码蛋白质的cDNA序列插入生物体基因组中的特定基因座,例如,在染色体上的特定基因座处插入突变或外源基因。例如,可通过敲入将点突变引入靶基因中,以模拟人类遗传疾病。此外,可以通过同源重组将外源基因如报告基因(EGFP、mRFP、mCherry、tdTomato等)引入靶基因的特定基因座,并且可以将所述外源基因用于跟踪靶基因的表达并通过报告基因的表达研究其表达谱。
在许多情况下,基因敲入涉及生物体内的同源重组机制。在自然条件下,外源靶向载体和细胞基因组之间的同源重组的概率非常低,约为1/105至1/106。自发基因打靶通常在哺乳动物细胞中以非常低的频率发生,其效率为百万个细胞之一。双链断裂的存在经常产生重组,并会将同源重组频率提高几千倍。参见Jasin,1996,“Genetic manipulation ofgenomes with rare-cutting endonucleases,”Trends in genetics:TIG 12(6):224-228。在植物中,已知在DNA中产生双链断裂可将同源重组的频率从约10-3至10-4的背景水平提高约100倍。参见Hanin等,2001,“Gene targeting in Arabidopsis,”Plant J.28:671-77。通过建立鼠胚胎干细胞系使得通过同源重组产生基因修饰的小鼠成为可能。例如,可以使用细菌人工染色体(bacterial artificial chromosome,BAC)构建靶向载体,并通过转染(例如电穿孔)将其引入鼠胚胎干细胞。选择阳性胚胎干细胞克隆并将其注射到小鼠囊胚内显微细胞团中,然后植入代孕小鼠以产生遗传工程化的嵌合小鼠。然而,用于建立来自其他物种的胚胎干细胞系的方法尚未得到成功和广泛使用。
最近开发的技术,包括ZFN(zinc finger nuclease,锌指核酸酶)、TALEN(transcription activator-like effector nuclease,转录激活因子样效应物核酸酶)、CRISPR(clustered regularly interspaced short palindromic repeat,成簇的规律间隔的短回文重复)/Cas9和其他位点特异性核酸酶技术,使得可能在所需的基因座位点处产生双链DNA断裂。这些受控的双链断裂可以促进在这些特定基因座位点处的同源重组。该过程依赖于用内切核酸酶靶向核酸分子(例如染色体)的特定序列,所述内切核酸酶识别并结合这样的序列并诱导在核酸分子中的双链断裂。双链断裂通过易错的非同源末端连接(nonhomologous end-joining,NHEJ)或通过同源重组(homologous recombination,HR)修复。
在DNA修复期间发生的同源重组倾向于导致非交换型(non-crossover)产物,实际上按照其在双链断裂之前存在的状态修复受损的DNA分子,或通过并入模板的序列产生重组分子。后者已被用于基因打靶、蛋白质工程和基因治疗。如果以反式提供同源重组的模板(例如通过将外源模板引入细胞中),则可以使用提供的模板来修复细胞中的双链断裂。在基因打靶中,与常规的基于同源重组的基因打靶相比,初始双链断裂使打靶的效率提高几个数量级。原则上,该方法可用于在修复位点插入任何序列,只要其侧翼有适当的区域与靠近双链断裂的序列同源。虽然这种方法已经在多种物种(例如小鼠和大鼠)中成功,但同源重组的效率和成功率仍然较低,这阻碍了该方法被广泛使用。例如,该方法对于科学和商业用途来说仍然是昂贵的和技术上的挑战。
本文引用的所有出版物、专利、专利申请和公开的专利申请的公开内容均通过引用整体并入本文。
发明概述
在一个实施方案中,本文公开了在真核细胞中染色体上的预定插入位点处插入供体序列的方法,其包括(a)将在所述插入位点切割所述染色体的序列特异性核酸酶引入所述细胞;(b)将供体构建体引入所述细胞;以及(c)将外切核酸酶引入所述细胞。在一个方面,所述供体构建体是线性核酸或者其在所述细胞内被切割以产生线性核酸。在另一个方面,所述线性核酸包含5’同源臂、所述供体序列和3’同源臂。在某些方面,所述5’同源臂与所述染色体上的核酸酶切割位点上游的序列同源,并且所述3’同源臂与所述染色体上的切割位点下游的序列同源。在一些实施方案中,所述5’同源臂和所述3’同源臂分别邻近所述线性核酸的5’和3’末端。在另一些实施方案中,所述供体序列通过同源重组在所述插入位点处插入所述染色体。
在一些实施方案中,本文所使用的序列特异性核酸酶是锌指核酸酶(ZFN)。在一些实施方案中,本文所使用的序列特异性核酸酶是转录激活因子样效应物核酸酶(TALEN)。在一些实施方案中,本文所使用的序列特异性核酸酶是RNA引导性核酸酶(RNA-guidednuclease)。在一个方面,所述RNA引导性核酸酶是Cas,例如Cas9。
在涉及RNA引导性核酸酶的任何前述实施方案中,所述方法还可以包括将识别所述插入位点的向导RNA(guide RNA,gRNA)引入细胞中。
在任何前述实施方案中,可以将所述序列特异性核酸酶作为蛋白质、mRNA或cDNA引入细胞中。
在一些实施方案中,所述5’同源臂和所述插入位点5’侧的序列之间的序列同源性为至少约80%。在一些实施方案中,所述3’同源臂和所述插入位点3’侧的序列之间的序列同源性为至少约80%。在任何前述实施方案中,所述5’同源臂和3’同源臂可为至少约200碱基对(bp)。
在任何前述实施方案中,所述外切核酸酶是5’至3’外切核酸酶。在一个方面,所述外切核酸酶是1型单纯疱疹病毒(herpes simplex virus type 1,HSV-1)外切核酸酶。在一个实施方案中,所述外切核酸酶是UL12。
在任何前述实施方案中,供体构建体可以是线性核酸。在一些实施方案中,供体构建体在引入细胞中时是环状的,并在细胞内被切割以产生线性核酸。在一个方面,供体构建体还包含5’同源臂上游的5’侧翼序列和3’同源臂下游的3’侧翼序列。在一个实施方案中,5’侧翼序列或3’侧翼序列为约1至约500bp。
在一些实施方案中,本文公开的方法还包括将第二序列特异性核酸酶引入细胞,所述第二序列特异性核酸酶在一个或两个侧翼序列处切割供体构建体,从而产生线性核酸。在某些实施方案中,序列特异性核酸酶是RNA引导性核酸酶,并且该方法还包括将识别侧翼序列之一或两者的第二向导RNA引入细胞。
在任何前述实施方案中,真核细胞可以是哺乳动物细胞。在一些实施方案中,哺乳动物细胞是合子或多能干细胞。
在一些方面,本文公开了产生经遗传修饰的动物的方法,所述动物包含在动物染色体上的预定插入位点处插入供体序列。在一个实施方案中,所述方法包括(a)将在所述插入位点处切割所述染色体的序列特异性核酸酶引入所述细胞;(b)将供体构建体引入所述细胞;(c)将外切核酸酶引入所述细胞;以及(d)将所述细胞引入受体动物(carrieranimal)以产生所述经遗传修饰的动物。在一个实施方案中,供体构建体是线性核酸或其在细胞内被切割以产生线性核酸。在一个方面,线性核酸包含5’同源臂、供体序列和3’同源臂。在一个方面,5’同源臂与染色体上的核酸酶切割位点上游的序列同源。在一个方面,3’同源臂与染色体上切割位点下游的序列同源。在一些实施方案中,5’同源臂和3’同源臂分别邻近线性核酸的5’和3’末端。在一些实施方案中,供体序列通过同源重组在插入位点处插入染色体。
在一个方面,经遗传修饰的动物是啮齿动物。在另一些方面,所述细胞是合子或多能干细胞。
在一些方面,本文提供了通过上述方法中的任一种的方法产生的遗传修饰的动物。
在另一些方面,本文提供了用于在真核细胞中染色体上的插入位点处插入供体序列的试剂盒,其包含:(a)在所述插入位点处切割所述染色体的序列特异性核酸酶;(b)供体构建体;以及(c)外切核酸酶。在一个实施方案中,供体构建体是线性核酸或其可以在细胞内被切割以产生线性核酸。在一个方面,线性核酸包含5’同源臂、供体序列和3’同源臂。在一个方面,5’同源臂与染色体上的核酸酶切割位点上游的序列同源。在一个方面,3’同源臂与染色体上切割位点下游的序列同源。在一个方面,5’同源臂和3’同源臂分别邻近线性核酸的5’和3’末端。在一些实施方案中,序列特异性核酸酶是RNA引导性核酸酶。在另一些实施方案中,试剂盒还包含识别插入位点的向导RNA(gRNA)。
在一些实施方案中,供体构建体是环状的。在一个方面,供体构建体还包含5’同源臂上游的5’侧翼序列和3’同源臂下游的3’侧翼序列。在另一方面,5’侧翼序列或3’侧翼序列为约1至约500bp。在任何前述实施方案中,序列特异性核酸酶可以是RNA引导性核酸酶,并且试剂盒还可以包含识别侧翼序列中之一或两者的第二向导RNA。在任何前述实施方案中,外切核酸酶可以是5’至3’外切核酸酶。在一个方面,外切核酸酶是1型单纯疱疹病毒(HSV-1)外切核酸酶。在另一个方面,外切核酸酶是UL12。在一个实施方案中,UL12与核定位序列(nuclear localization sequence,NLS)融合。
在一些实施方案中,本公开内容提供了在真核细胞中产生线性核酸的方法,其中所述线性核酸包含5’同源臂、供体序列和3’同源臂;5’同源臂与染色体上核酸酶切割位点上游的序列同源,并且3’同源臂与染色体上切割位点下游的序列同源;并且5’同源臂和3’同源臂分别邻近线性核酸的5’和3’末端。在一个方面,所述方法包括:(a)将包含所述线性核酸并且还包含所述5’同源臂上游的5’侧翼序列和所述3’同源臂下游的3’侧翼序列的环状供体构建体引入所述细胞;和(b)将序列特异性核酸酶引入所述细胞,其中所述序列特异性核酸酶在所述5’侧翼序列和所述3’侧翼序列处切割所述环状供体构建体,从而产生所述线性核酸。在一个方面,序列特异性核酸酶是ZFN。在另一个方面,序列特异性核酸酶是TALEN。在另一个方面,序列特异性核酸酶是RNA引导性核酸酶。在一个实施方案中,RNA引导性核酸酶是Cas。在一些实施方案中,RNA引导性核酸酶是Cas9。在任何前述实施方案中,所述方法还可以包括将识别5’侧翼序列和/或3’侧翼序列的向导RNA引入细胞。
附图简述
图1显示了在U2OS细胞系中敲入EGFP-ACTB的打靶方案。
图2是荧光显微图像,显示了在使用高效敲入(“EKI”)系统敲入后U2OS细胞中EGFP-ACTB融合蛋白的表达。
图3A、3B和3C描述了流式细胞检测结果,表明与常规CRISPR/Cas9介导的敲入相比,使用EKI系统,在U2OS细胞中EGFP-ACTB的敲入效率显著提高。图3A是对照实验的结果,图3B是常规CRISPR/Cas9介导的敲入的结果,图3C是EKI系统介导的敲入的结果。
图4显示了C6细胞系中敲入EGFP-LMNB1的打靶方案。
图5是荧光显微图像,显示了在C6细胞中使用EKI系统敲入后,EGFP-LMNB1融合蛋白的表达。
图6A、6B和6C是流式细胞检测结果,显示了与常规CRISPR/Cas9介导的敲入相比,使用EKI系统,在C6细胞中EGFP-LMNB1的敲入效率显著提高。图6A是对照实验的结果,图6B是常规CRISPR/Cas9介导的敲入的结果,图6C是EKI系统介导的敲入的结果。
图7A和7B显示了在U2OS细胞系中双敲入EGFP-ACTB和mCherry-LMNB1的打靶方案。图7A显示了敲入EGFP-ACTB的打靶方案,图7B显示了敲入mCherry-LMNB1的打靶方案。
图8是荧光显微图像,显示了在由EKI系统介导的相同U2OS细胞中成功的双敲入EGFP-ACTB和mCherry-LMNB1及其融合蛋白的表达。
图9显示了制备CD4-2A-dsRed敲入大鼠的打靶方案。
图10是F0代CD4-2A-dsRed敲入大鼠的5’端PCR反应基因型检测结果。
图11是F0代CD4-2A-dsRed敲入大鼠的3’端PCR反应基因型检测结果。
图12A和12B是CD4-2A-dsRed敲入大鼠的southern印迹杂交结果。图12A是southern印迹杂交策略,图12B是使用5’探针、3’探针和dsRed探针的southern印迹杂交结果。用于southern印迹杂交测试的两只F1代大鼠(19号和21号)是图10和图11中22号F0大鼠的后代。WT:野生型大鼠。PC:阳性对照。
图13显示了在H9细胞系中敲入TH-GFP的打靶方案。
图14是荧光显微图像,显示了使用EKI系统敲入后,H9细胞中TH-GFP融合蛋白的表达。
图15显示了在H9细胞中针对TH-GFP敲入的基因型检测引物的位置。LA:左同源臂。RA:右同源臂。
图16A和16B是H9细胞中TH-GFP敲入的基因型检测结果。图16A是5’端PCR反应结果,图16B是3’端PCR反应结果。WT:野生型H9细胞。
图17是图16所示1号H9-TH-GFP细胞系的PCR产物的测序结果。图谱中示出的是如下序列:CAGACGTACCAGTCAGTCTACTTCGTGTCTGAGAGCTTCAGTGACG(SEQ ID NO:40)和CTCCTCTCAAGGAGGCACCCATGTCCTCTCCAGCTGCCGGGCCTCA(SEQ ID NO:41)。
图18是图16所示1号H9-TH-GFP细胞系的核型。
图19显示了在H9细胞系中敲入OCT4-EGFP的打靶方案。
图20是荧光显微图像,显示了使用EKI系统敲入后,H9细胞中OCT4-EGFP融合蛋白的表达。
图21显示了在H9细胞中针对OCT4-EGFP敲入的基因型检测引物的位置。LA:左同源臂。RA:右同源臂。
图22A、22B和22C是H9细胞中OCT4-EGFP敲入的基因型检测结果。图22A是5’端PCR反应结果,图22B是3’端PCR反应结果,图22C是全长PCR反应结果。wt:野生型H9细胞。c-:H2O作为阴性对照。
图23是图22所示6号H9-OCT4-EGFP细胞系的PCR产物的测序结果。图谱中示出的是如下序列:GATACCCGGGGACCTTCCCTTTCTTGGCCTAATTTCCATTGCTTC(SEQ ID NO:42)和GTGGGTTAAGCGGTTTGATTCACACTGAACCAGGCCAGCCCAGTTG(SEQ ID NO:43)。
图24是图22中所示6号H9-OCT4-EGFP细胞系的核型。
发明详述
本发明提供了新型的DNA敲入方法,其允许将一种或更多种外源序列引入细胞染色体上的特定靶位点,与使用序列特异性核酸酶的传统DNA敲入方法,例如基于CRISPR/Cas9或TALEN的基因敲入系统相比,其具有显著更高的效率。除了使用序列特异性核酸酶外,本申请的方法还利用了与供体构建体相结合的外切核酸酶(例如5’至3’外切核酸酶,例如UL12),所述供体构建体是线性核酸或其可以在细胞内被切割以产生线性核酸。该DNA敲入系统允许供体序列以高效率插入任何期望的靶位点,使得其通过例如将外源非编码序列(例如序列标签或调节元件)添加到基因组中,可用于许多用途,例如产生表达外源基因的转基因动物、修饰(例如突变)基因组基因座和基因编辑。使用本文提供的方法产生的细胞和动物可以具有多种应用,例如细胞疗法、疾病模型、研究工具,以及作为用于多种目的的人源化动物。
因此,本申请一方面提供将供体序列插入真核细胞染色体上的预定插入位点的方法。
在另一方面,提供了在细胞内产生线性核酸的方法。
在另一方面,提供了用于本文所述的任何一种方法的试剂盒。
在另一方面,提供了通过使用本文所述的基因敲入系统产生经遗传修饰的动物的方法。
本文中涉及“约为的值或参数包括(并描述)针对该值或参数本身的变化。例如,涉及“约X”的描述包括“X”的描述。
如本文和所附权利要求书中所使用的,除非上下文另有明确指示,无数量词修饰的名词、“或”和“该/所述”包括一个或更多个指示物。
本发明的组合物和方法可包括、由或基本上由本文所述的本发明的基本要素和限制,以及本文所述的任何附加或任选的成分、组分或限制组成,或以其他方式用于营养品或药物的应用。
发明方法
本发明提供了在真核细胞中染色体上的预定插入位点处插入供体序列的方法。在一些实施方案中,该方法包括:a)将在所述插入位点切割所述染色体的序列特异性核酸酶引入所述细胞;b)将供体构建体引入所述细胞;以及c)将外切核酸酶引入所述细胞;其中所述供体构建体是线性核酸或者其在所述细胞内被切割以产生线性核酸,其中所述线性核酸包含5’同源臂、所述供体序列和3’同源臂,其中所述5’同源臂与所述染色体上的核酸酶切割位点上游的序列同源,并且其中所述3’同源臂与所述染色体上的核酸酶切割位点下游的序列同源;其中所述5’同源臂和所述3’同源臂分别邻近所述线性核酸的5’和3’末端,并且其中所述供体序列通过同源重组在所述插入位点处插入所述染色体。
在一些实施方案中,将序列特异性核酸酶、外切核酸酶和供体构建体同时引入细胞。在一些实施方案中,将这三种组分中的至少一种在与其他组分不同的时间引入细胞中。例如,可以首先将供体构建体引入细胞,随后引入序列特异性核酸酶和外切核酸酶。在一些实施方案中,首先将序列特异性核酸酶引入细胞,随后引入供体构建体和外切核酸酶。在一些实施方案中,所有三种组分在相对于彼此的不同时间点引入。例如,三种组分可以以特定顺序一个接一个地顺序施用。
在一些实施方案中,将序列特异性核酸酶和/或外切核酸酶作为cDNA引入细胞。在一些实施方案中,将序列特异性核酸酶和/或外切核酸酶作为mRNA引入细胞。在一些实施方案中,将序列特异性核酸酶和/或外切核酸酶作为蛋白质引入细胞。
例如,在一些实施方案中,提供了在真核细胞中染色体上的预定插入位点处插入供体序列的方法,所述方法包括:a)将编码在插入位点切割染色体的序列特异性核酸酶的核酸序列引入细胞;b)将供体构建体引入所述细胞;和c)将编码外切核酸酶的核酸序列引入细胞;其中所述供体构建体是线性核酸或者其在所述细胞内被切割以产生线性核酸,其中所述线性核酸包含5’同源臂、所述供体序列和3’同源臂,其中所述5’同源臂与所述染色体上的核酸酶切割位点上游的序列同源,并且其中所述3’同源臂与所述染色体上的核酸酶切割位点下游的序列同源;其中所述5’同源臂和所述3’同源臂分别邻近所述线性核酸的5’和3’末端,并且其中所述供体序列通过同源重组在所述插入位点处插入所述染色体。在一些实施方案中,编码序列特异性核酸酶的核酸和/或编码外切核酸酶的核酸是mRNA。在一些实施方案中,编码序列特异性核酸酶的核酸和/或编码外切核酸酶的核酸是cDNA。在一些实施方案中,通过转染(包括例如通过电穿孔转染)将编码序列特异性核酸酶的核酸和/或编码外切核酸酶的核酸引入细胞。在一些实施方案中,通过注射将编码序列特异性核酸酶的核酸和/或编码外切核酸酶的核酸引入细胞。
在一些实施方案中,提供了在真核细胞中染色体上的预定插入位点处插入供体序列的方法,所述方法包括:a)将包含编码在插入位点切割染色体的序列特异性核酸酶的核酸序列的载体引入细胞;b)将供体构建体引入细胞;和c)将包含编码外切核酸酶的核酸序列的载体引入细胞;其中所述供体构建体是线性核酸或者其在所述细胞内被切割以产生线性核酸,其中所述线性核酸包含5’同源臂、所述供体序列和3’同源臂,其中所述5’同源臂与所述染色体上的核酸酶切割位点上游的序列同源,并且其中所述3’同源臂与所述染色体上的核酸酶切割位点下游的序列同源;其中所述5’同源臂和所述3’同源臂分别邻近所述线性核酸的5’和3’末端,并且其中所述供体序列通过同源重组在所述插入位点处插入所述染色体。在一些实施方案中,通过转染(包括例如通过电穿孔转染)将包含编码序列特异性核酸酶的核酸和/或包含编码外切核酸酶的核酸的载体引入细胞。
在一些实施方案中,提供了在真核细胞中染色体上的预定插入位点处插入供体序列的方法,所述方法包括:a)将包含编码在插入位点切割染色体的序列特异性核酸酶的核酸序列和编码外切核酸酶的核酸序列的载体引入细胞;b)将供体构建体引入所述细胞;其中所述供体构建体是线性核酸或者其在所述细胞内被切割以产生线性核酸,其中所述线性核酸包含5’同源臂、所述供体序列和3’同源臂,其中所述5’同源臂与所述染色体上的核酸酶切割位点上游的序列同源,并且其中所述3’同源臂与所述染色体上的核酸酶切割位点下游的序列同源;其中所述5’同源臂和所述3’同源臂分别邻近所述线性核酸的5’和3’末端,并且其中所述供体序列通过同源重组在所述插入位点处插入所述染色体。在一些实施方案中,通过转染(包括例如通过电穿孔转染)将包含编码序列特异性核酸酶的核酸和编码外切核酸酶的核酸的载体引入细胞。
在一些实施方案中,提供了在真核细胞(例如合子细胞)中染色体上的预定插入位点处插入供体序列的方法,所述方法包括:a)将编码在插入位点处切割染色体的序列特异性核酸酶的mRNA序列引入(例如注射入)细胞;b)将供体构建体引入(例如注射入)细胞;和c)将编码外切核酸酶的mRNA序列引入(例如注射入)细胞;其中所述供体构建体是线性核酸或其在所述细胞内被切割以产生线性核酸,其中所述线性核酸包含5’同源臂、所述供体序列和3’同源臂,其中所述5’同源臂与所述染色体上的核酸酶切割位点上游的序列同源,并且其中所述3’同源臂与所述染色体上的核酸酶切割位点下游的序列同源;其中所述5’同源臂和所述3’同源臂分别邻近所述线性核酸的5’和3’末端,并且其中所述供体序列通过同源重组在所述插入位点处插入所述染色体。在一些实施方案中,引入(例如注射)在体外进行。在一些实施方案中,引入(例如注射)在体内进行。在一些实施方案中,所述方法还包括在体外将编码序列特异性核酸酶的核酸转录成mRNA。在一些实施方案中,所述方法还包括在体外将编码外切核酸酶的核酸转录成mRNA。
例如,在一些实施方案中,提供了在免疫细胞(例如T细胞)中染色体上的预定插入位点处插入供体序列的方法,所述方法包括:a)将编码在插入位点切割染色体的序列特异性核酸酶的核酸序列引入细胞;b)将供体构建体引入细胞;和c)将编码外切核酸酶的核酸序列引入细胞;其中所述供体构建体是线性核酸或其在所述细胞内被切割以产生线性核酸,其中所述线性核酸包含5’同源臂、所述供体序列和3’同源臂,其中所述5’同源臂与所述染色体上的核酸酶切割位点上游的序列同源,并且其中所述3’同源臂与所述染色体上的核酸酶切割位点下游的序列同源;其中所述5’同源臂和所述3’同源臂分别邻近所述线性核酸的5’和3’末端,并且其中所述供体序列通过同源重组在所述插入位点处插入所述染色体。在一些实施方案中,编码序列特异性核酸酶的核酸和/或编码外切核酸酶的核酸是mRNA。在一些实施方案中,编码序列特异性核酸酶的核酸和/或编码外切核酸酶的核酸是cDNA。在一些实施方案中,通过转染(包括例如通过电穿孔转染)将编码序列特异性核酸酶的核酸和/或编码外切核酸酶的核酸引入细胞。在一些实施方案中,通过注射将编码序列特异性核酸酶的核酸和/或编码外切核酸酶的核酸引入细胞。
在一些实施方案中,提供了在免疫细胞(例如T细胞)中染色体上的预定插入位点处插入供体序列的方法,所述方法包括:a)将包含编码在插入位点处切割染色体的序列特异性核酸酶的核酸序列的载体引入细胞;b)将供体构建体引入细胞;和c)将包含编码外切核酸酶的核酸序列的载体引入细胞;其中所述供体构建体是线性核酸或其在所述细胞内被切割以产生线性核酸,其中所述线性核酸包含5’同源臂、所述供体序列和3’同源臂,其中所述5’同源臂与所述染色体上的核酸酶切割位点上游的序列同源,并且其中所述3’同源臂与所述染色体上的核酸酶切割位点下游的序列同源;其中所述5’同源臂和所述3’同源臂分别邻近所述线性核酸的5’和3’末端,并且其中所述供体序列通过同源重组在所述插入位点处插入所述染色体。在一些实施方案中,通过转染(包括例如通过电穿孔转染)将包含编码序列特异性核酸酶的核酸的载体和/或包含编码外切核酸酶的核酸的载体引入细胞。
在一些实施方案中,提供了在免疫细胞(例如T细胞)中染色体上的预定插入位点处插入供体序列的方法,所述方法包括:a)将包含编码在插入位点处切割染色体的序列特异性核酸酶的核酸序列和编码外切核酸酶的核酸序列的载体引入细胞;b)将供体构建体引入细胞;其中所述供体构建体是线性核酸或其在所述细胞内被切割以产生线性核酸,其中所述线性核酸包含5’同源臂、所述供体序列和3’同源臂,其中所述5’同源臂与所述染色体上的核酸酶切割位点上游的序列同源,并且其中所述3’同源臂与所述染色体上的核酸酶切割位点下游的序列同源;其中所述5’同源臂和所述3’同源臂分别邻近所述线性核酸的5’和3’末端,并且其中所述供体序列通过同源重组在所述插入位点处插入所述染色体。在一些实施方案中,通过转染(包括例如通过电穿孔转染)将包含编码序列特异性核酸酶的核酸和编码外切核酸酶的核酸的载体引入细胞。
在一些实施方案中,提供了在免疫细胞(例如T细胞)中染色体上的预定插入位点处插入供体序列的方法,所述方法包括:a)将编码在插入位点处切割染色体的序列特异性核酸酶的mRNA序列引入(例如注射入)细胞;b)将供体构建体引入(例如注射入)细胞;和c)将编码外切核酸酶的mRNA序列引入(例如注射入)细胞;其中所述供体构建体是线性核酸或其在所述细胞内被切割以产生线性核酸,其中所述线性核酸包含5’同源臂、所述供体序列和3’同源臂,其中所述5’同源臂与所述染色体上的核酸酶切割位点上游的序列同源,并且其中所述3’同源臂与所述染色体上的核酸酶切割位点下游的序列同源;其中所述5’同源臂和所述3’同源臂分别邻近所述线性核酸的5’和3’末端,并且其中所述供体序列通过同源重组在所述插入位点处插入所述染色体。在一些实施方案中,引入(例如注射)在体外进行。在一些实施方案中,引入(例如注射)在体内进行。在一些实施方案中,所述方法还包括在体外将编码序列特异性核酸酶的核酸转录成mRNA。在一些实施方案中,所述方法还包括在体外将编码外切核酸酶的核酸转录成mRNA。
本文所述的细胞可以是任何真核细胞,例如动物的分离细胞,例如全能、多能或成体干细胞,合子或体细胞。在一些实施方案中,细胞来自原代细胞培养物。在一些实施方案中,用于所述方法的细胞是人细胞。在一些实施方案中,用于所述方法的细胞是酵母细胞。在一些实施方案中,细胞来自驯养动物(例如,牛、绵羊、猫、狗和马)。在一些实施方案中,细胞来自灵长类动物(例如,非人灵长类动物例如猴)。在一些实施方案中,细胞来自兔。在一些实施方案中,细胞来自鱼(例如斑马鱼)。在一些实施方案中,细胞来自啮齿动物(例如,小鼠、大鼠、仓鼠、豚鼠)。在一些实施方案中,细胞来自无脊椎动物(例如,黑腹果蝇(Drosophila melanogaster)和秀丽隐杆线虫(Caenorhabditis elegans))。
本文所述的细胞可以是免疫细胞,其包括但不限于粒细胞(例如嗜碱性粒细胞、嗜酸性粒细胞和嗜中性粒细胞)、肥大细胞、单核细胞、树突状细胞(dendritic cell,DC)、自然杀伤(natural killer,NK)细胞、B细胞和T细胞(例如CD8+T细胞和CD4+T细胞)。在一些实施方案中,细胞是CD4+T细胞(例如,T辅助细胞TH1、TH2、TH17和调节性T细胞)。
本文所述的方法和组合物可用于将供体序列插入细胞中的一个或多个基因组基因座。在某些实施方案中,本文所述的方法和组合物可用于靶向细胞内的多于一个基因组基因座,例如用于双DNA敲入。在某些实施方案中,本文所述的方法和组合物用于靶向细胞内的两个、三个、四个、五个、六个、七个、八个、九个、十个或多于十个基因组基因座。在一些方面,双重或多重敲入可以同时或依次进行。例如,将用于靶向相同细胞内的两个或更多个基因组基因座的试剂混合并在基本上相同的时间引入细胞中。在另一些实施方案中,靶向多个基因组基因座中的每一个的试剂可以以特定顺序一个接一个地顺序引入细胞。在另一些实施方案中,靶向第一基因组基因座,并选择、富集和/或分离成功敲入的细胞,并且使其靶向第二基因组基因座。
可例如通过使用两种或更多种不同的序列特异性核酸酶(其中每个核酸酶识别预定插入位点之一的序列)来实现双重或多重敲入。这些序列特异性核酸酶可以同时或依次引入细胞。因此,例如,在一些实施方案中,提供了在真核细胞中在染色体上的预定插入位点处各自插入两个或更多个供体序列的方法,包括:a)将一个或更多个在预定插入位点处切割染色体的序列特异性核酸酶引入细胞;b)将两个或更多个供体构建体引入细胞;和c)将外切核酸酶引入细胞,其中每个所述供体构建体是线性核酸或其在所述细胞内被切割以产生线性核酸,其中所述线性核酸包含5’同源臂、所述供体序列和3’同源臂,其中所述5’同源臂与所述染色体上的对应的核酸酶切割位点上游的序列同源,并且其中所述3’同源臂与所述染色体上的对应的核酸酶切割位点下游的序列同源,其中所述5’同源臂和所述3’同源臂分别邻近所述线性核酸的5’和3’末端,并且其中所述两个或更多个供体序列通过同源重组在所述插入位点处插入所述染色体。在一些实施方案中,提供了在真核细胞中在染色体上的预定插入位点处各自插入两个供体序列的方法,包括:a)将第一序列特异性核酸酶引入细胞,所述第一序列特异性核酸酶在第一预定插入位点处切割染色体;b)将第一供体构建体引入细胞;c)将第二序列特异性核酸酶引入细胞,所述第二序列特异性核酸酶在第二预定插入位点处切割染色体;和d)将第二供体构建体引入细胞;以及e)将外切核酸酶引入细胞,其中每个所述供体构建体是线性核酸或其在所述细胞内被切割以产生线性核酸,其中所述线性核酸包含5’同源臂、所述供体序列和3’同源臂,其中所述5’同源臂与所述染色体上的对应的核酸酶切割位点上游的序列同源,并且其中所述3’同源臂与所述染色体上的对应的核酸酶切割位点下游的序列同源,其中所述5’同源臂和所述3’同源臂分别邻近所述线性核酸的5’和3’末端,并且其中所述两个供体序列通过同源重组在所述插入位点处插入所述染色体。
可以以蛋白质形式或以编码序列特异性核酸酶(和本文所述的外切核酸酶)的核酸形式,例如mRNA或cDNA的形式将序列特异性核酸酶(和本文所述的外切核酸酶)引入细胞。核酸可作为较大构建体(例如质粒或病毒载体)的一部分递送,或直接递送,例如通过电穿孔、脂质囊泡、病毒转运蛋白、显微注射和生物弹道技术。例如,可以通过本领域已知的多种方法将序列特异性核酸酶(和本文所述的外切核酸酶)引入细胞,包括转染、磷酸钙-DNA共沉淀、DEAE-葡聚糖介导的转染、聚凝胺介导的转染、电穿孔、显微注射、转导、细胞融合、脂质体融合、脂质体转染、原生质体融合、逆转录病毒感染、使用基因枪、使用DNA载体转运子,和生物弹道技术(例如粒子轰击)(参见例如Wu等,1992,J.Biol.Chem.,267:963-967;Wu和Wu,1988,J.Biol.Chem.,263:14621-14624;和Williams等,1991,Proc.Natl.Acad.Sci.USA 88:2726-2730)。也可以使用受体介导的DNA递送方法(Curiel等,1992,Hum.Gene Ther.,3:147-154;以及Wu和Wu,1987,J.Biol.Chem.,262:4429-4432)。
可以以线性核酸的形式将供体构建体引入细胞或在细胞内切割供体构建体以产生线性核酸。其可以通过任何适于将核酸引入细胞的方法递送。例如,可以通过本领域已知的多种方法将供体构建体引入细胞,包括转染、磷酸钙-DNA共沉淀、DEAE-葡聚糖介导的转染、聚凝胺介导的转染、电穿孔、显微注射、转导、细胞融合、脂质体融合、脂质体转染、原生质体融合、逆转录病毒感染、使用基因枪、使用DNA载体转运子,和生物射弹(例如粒子轰击)(参见例如Wu等,1992,J.Biol.Chem.,267:963-967;Wu和Wu,1988,J.Biol.Chem.,263:14621-14624;和Williams等,1991,Proc.Natl.Acad.Sci.USA 88:2726-2730)。也可以使用受体介导的DNA递送方法(Curiel等,1992,Hum.Gene Ther.,3:147-154;以及Wu和Wu,1987,J.Biol.Chem.,262:4429-4432)。
在一个实施方案中,可以用含有导致基因产物在靶细胞中表达的特定基因的核酸(例如本文所述的序列特异性核酸酶或外切核酸酶)转染靶细胞。在另一个实施方案中,使用膜破坏、成孔方法或试剂(例如显微注射和电穿孔),或其他试剂(例如作为载体递送蛋白质穿过细胞膜的脂质体),将功能性蛋白质(例如序列特异性核酸酶或外切核酸酶)递送到靶细胞中。使用本领域已知的多种测定法,可以确认核酸或蛋白质在靶细胞中的引入,并且可以研究它们对细胞生理学和/或基因表达的影响。
在一些方面,本文所述的序列特异性核酸酶、供体构建体和/或外切核酸酶向靶细胞的递送是非特异性的,例如,一旦膜被破坏,任何东西都可以进入或离开细胞。在另一些方面,核酸和/或蛋白质向靶细胞的递送是特异性的。例如,可以使用介导蛋白质递送进入细胞的蛋白质转导结构域(protein-transduction domain,PTD)和/或膜转位肽,将本文所述的序列特异性核酸酶、供体构建体和/或外切核酸酶递送到细胞中。这些PTD或信号肽序列是天然存在的15至30个氨基酸的多肽,其通常介导细胞中的蛋白质分泌。它们由带正电荷的氨基末端、中心疏水核心和由信号肽酶识别的羧基末端切割位点构成。在某些实施方案中,可以使用基于溶液的蛋白质转染方案将多肽、蛋白质结构域和全长蛋白质(包括抗体)引入细胞。在一个方面,将待引入细胞中的蛋白质与载质试剂预复合。在另一个实施方案中,使用了待引入的蛋白质与另一部分之间的融合蛋白。例如,该融合蛋白包含与显示出自发性细胞内穿透性质的蛋白质或肽共价融合的目的蛋白质(例如,序列特异性核酸酶和/或外切核酸酶)或目的蛋白质结构域。这种膜转导肽的实例包括特洛伊肽(Trojanpeptide)、人类免疫缺陷病毒(human immuodeficiency virus,HIV)-1转录激活物(TAT)蛋白或其功能结构域肽,以及其他含有来源于易位蛋白(例如果蝇同源异型转录因子触角蛋白(Antennapedia,Antp)和单纯疱疹病毒DNA结合蛋白VP22等)的蛋白质转导结构域(PTD)的肽。可以使用一些市售的肽,例如穿膜肽1(penetratin 1)、Pep-1(Chariot试剂,ActiveMotif Inc.,CA)和HIV GP41片段(519-541)。
在一些实施方案中,本文所述的外切核酸酶是碱性外切核酸酶。在一些实施方案中,外切核酸酶是pH依赖性碱性外切核酸酶。在一些实施方案中,外切核酸酶与单链DNA结合蛋白相互作用并促进链交换。在一些实施方案中,外切核酸酶也是内切核酸酶。在一些实施方案中,外切核酸酶是5’至3’外切核酸酶。在一些实施方案中,外切核酸酶是1型单纯疱疹病毒(herpes simplex virus-type 1,HSV-1)外切核酸酶。在一些实施方案中,外切核酸酶是UL-12,例如US7,135,324B2中所述的,由SEQ ID NO:1(登录号NC_001806.1,基因ID:2703382)编码的UL-12蛋白(SEQ ID NO:2,登录号NP_044613.1),其公开内容出于所有目的整体并入本文。在一些实施方案中,外切核酸酶是来自Epstaine-Barr病毒、1型牛疱疹病毒、伪狂犬病病毒和人巨细胞病毒(human cytomegalovirus,HCMV)的UL-12同源物。
在单纯疱疹病毒中,HSV-1碱性核酸酶UL-12和HSV-1单链DNA结合多肽(由ICP 8基因编码,以下称为“ICP8”;本领域也称为UL-29)共同作用以影响DNA链交换。如本文所用,UL-12是指HSV-1UL-12及其同源物、直系同源物和旁系同源物。“同源物”是本领域中使用的通用术语,用于指示与目标序列具有高度序列相关性的多核苷酸或多肽序列。这种相关性可以通过确定被比较的序列之间的同一性和/或相似性的程度来量化。落在该通用术语范围内的是术语“直系同源物”和“旁系同源物”,所述“直系同源物”意指另一物种中多核苷酸或多肽的功能等同物的多核苷酸或多肽;所述“旁系同源物”意指当在相同物种中考虑时的功能上类似的序列。存在于相同物种中的旁系同源物或其他物种中的UL-12基因的直系同源物可以容易地通过本领域公知的分子生物学技术鉴定而无需过多实验。
Goldstein和Weller(1998,Virology,244(2):442-57)检测了HSV-1 UL-12在疱疹病毒同源物中高度保守的区域,并鉴定了7个保守氨基酸区域。疱疹病毒中的七个同源性区域最初在Martinez等,1996,Virology,215:152-64中报道。杆状病毒(Baculovirus)也编码该蛋白质的同源物(Ahrens等,1997,Virology,229(2):381-99;Ayres等,1994,202:586-605);然而,只有基序I-IV存在于这些同源物中。
HSV-1UL-12的7个保守基序如下:基序I(从SEQ ID NO:2的氨基酸残基218至残基244),基序II(从SEQ ID NO:2的氨基酸残基325至残基340),基序III(从SEQ ID NO:2的氨基酸残基362至残基377),基序IV(从SEQ ID NO:2的氨基酸残基415至残基445),基序V(从SEQ ID NO:2的氨基酸残基455至残基465),基序VI(从SEQ ID NO:2的氨基酸残基491至残基514)以及基序VII(从SEQ ID NO:2的氨基酸残基565至残基576)。参见Goldstein和Weller,1998,Virology,244(2):442-57,其公开内容出于所有目的整体并入本文。基序II是最高度保守的区域之一。在该基序内,C-末端5个氨基酸(336-GASLD-340)代表最保守的簇。Asp340是绝对保守的氨基酸,并且天冬氨酸残基在一些内切核酸酶和外切核酸酶中是金属结合所需的(Kovall和Matthews,1997,Science,277:1824-7)。在基序II中,Gly336和Ser338在16个疱疹病毒同源物中是绝对保守的。Goldstein和Weller证明了UL-12的D340E突变体和G336A/S338A突变体缺乏外切核酸酶活性,因此缺乏体内功能。
在一些实施方案中,外切核酸酶具有与SEQ ID NO:1以至少约70%、80%、90%、95%、98%或99%中的任一量同源的序列。在一些实施方案中,该外切核酸酶包含UL12的至少1个(例如2、3、4、5、6或7中的任一量)保守基序。
在一些实施方案中,外切核酸酶是真核生物或病毒来源的。在一些方面,外切核酸酶是EXOI(真核生物的)或exo(噬菌体)。在其他一些实施方案中,使用了外切核酸酶例如ExoIII或噬菌体T7基因6外切核酸酶。在一些实施方案中,外切核酸酶是Mre11、MRE11A或MRE11B,例如来源于人。
将外切核酸酶和/或供体构建体引入细胞时,可同时或顺序地将序列特异性核酸酶引入细胞中。如本文所用,术语“序列特异性内切核酸酶”或“序列特异性核酸酶”是指可以识别并结合特定核酸序列上的多核苷酸并催化多核苷酸中的单链或双链断裂的蛋白质。在某些实施方案中,序列特异性核酸酶仅切割染色体一次,即在本文所述的方法中,在插入位点处引入了单个双链断裂。
序列特异性核酸酶的实例包括锌指核酸酶(zinc finger nuclease,ZFN)。ZFN是由DNA结合锌指蛋白结构域和效应物核酸酶结构域构成的重组蛋白。锌指蛋白结构域是识别并结合特定DNA序列的普遍存在的(例如与转录因子相关的)蛋白质结构域。一个“指(finger)”结构域可以由约30个氨基酸构成,其包括与锌形成复合物的不变组氨酸残基。虽然迄今已经鉴定了超过10,000个锌指序列,但是通过在锌指结构域中替换靶向氨基酸以产生可用于识别特定目的核苷酸序列的新锌指蛋白,进一步扩展了锌指蛋白的种类。例如,噬菌体展示文库已用于筛选锌指组合文库以获得所需的序列特异性(Rebar等,Science 263:671-673(1994);Jameson等,Biochemistry 33:5689-5695(1994);Choo等,PNAS 91:11163-11167(1994),其每一篇均如同以其整体并入本文)。然后可以将具有所需序列特异性的锌指蛋白连接至效应物核酸酶结构域,例如US 6,824,978中所述的,如PCT申请公开号WO1995/09233和WO1994018313中所述的FokI,其每一篇均通过引用如同以其整体并入本文。
序列特异性核酸酶的另一个实例包括转录激活因子样效应物内切核酸酶(TALEN),其包含结合特定核苷酸序列的TAL效应物结构域和催化靶位点处的双链断裂的内切核酸酶结构域。TALEN的实例以及制造和使用方法由PCT专利申请公开号WO2011072246和WO 2013163628以及美国申请公开号US 20140073015A1描述,其通过引用如同以其整体并入本文。
在一方面,转录激活因子样效应物(transcription activator-like effector,TALE)通过结合基因启动子内的特定序列来调节宿主基因功能。本文可互换使用的“转录激活因子样效应物核酸酶”或“TALEN”是指核酸酶的催化结构域(例如内切核酸酶FokI)与可靶向特定DNA序列的经设计的TALE DNA结合结构域的工程化融合蛋白。“TALEN单体为是指具有催化核酸酶结构域与经设计TALE DNA结合结构域的工程化融合蛋白。可以设计两种TALEN单体用于靶向和切割靶区域。一般来说,TALE包括串联样和几乎相同的单体(即,重复结构域),其侧翼为N端和C端序列。在一些实施方案中,每个单体含有34个氨基酸,并且每个单体的序列都是高度保守的。每个重复只有两个氨基酸(即第12和13残基)是高可变性的,也称为重复可变二残基(repeat variable di-residue,RVD)。RVD决定每个TALE重复结构域的核苷酸结合特异性。RVD或RVD模块通常包含TALE DNA结合结构域的33至35个氨基酸。RVD模块可以组合以产生RVD阵列。本文使用的“RVD阵列长度”是指对应于由TALEN识别的靶区域(即结合区)内的核苷酸序列的长度的RVD模块的数目。
TALEN可以用于在目的基因组基因座处引入位点特异性的双链断裂。当两个独立的TALEN与临近的DNA序列结合时,会产生位点特异性双链断裂,从而允许Fokl的二聚化和对靶DNA的切割。由于其高成功率和高效的遗传修饰,TALEN具有先进的基因组编辑能力。这种DNA切割可以刺激天然DNA修复机制,导致两种可能的修复途径之一:同源定向修复(homology-directed repair,HDR)或非同源末端连接(non-homologous end joining,NHEJ)途径。TALEN可以设计成靶向任何基因,包括涉及遗传疾病的基因。TALEN可以包含核酸酶和结合靶基因的TALE DNA结合结构域。靶基因可以具有突变,例如移码突变或无义突变。如果靶基因具有产生过早终止密码子的突变,则可以将TALEN设计成识别并结合过早终止密码子上游或下游的核苷酸序列。在一些实施方案中,TALE DNA结合结构域可以具有1至30个模块、1至25个模块、1至20个模块、1至15个模块、5至30个模块、5至25个模块、5至20个模块、5至15个模块、7至25个模块、7至23个模块、7至20个模块、10至30个模块、10至25个模块、10至20个模块、10至15个模块、15至30个模块、15至25个模块、15至20个模块、15至19个模块、16至26个模块、16至41个模块、20至30个模块或20至25个模块的RVD阵列长度。RVD阵列长度可以是约5个模块、8个模块、10个模块、11个模块、12个模块、13个模块、14个模块、15个模块、16个模块、17个模块、18个模块、19个模块、20个模块、22个模块、25个模块或30个模块中的任何量。
可以与本文所述的方法和组合物一起使用的序列特异性核酸酶系统的另一个实例包括Cas/CRISPR系统(Wiedenheft,B.等Nature 482,331-338(2012);Jinek,M.等Science 337,816-821(2012);Mali,P.等Science 339,823-826(2013);Cong,L.等Science339,819-823(2013))。Cas/CRISPR(Clustered Regularly Interspaced ShortPalindromic Repeat,成簇的规律间隔的短回文重复)系统利用由RNA引导的DNA结合和靶DNA的序列特异性切割。向导RNA(gRNA)含有与基因组PAM(protospacer adjacent motif,前间隔序列邻近基序)位点上游的靶基因组DNA序列和恒定RNA支架区域互补的约20至25(例如20)个核苷酸。在某些实施方案中,靶序列与PAM相关联,所述PAM是由CRISPR复合物识别的短序列。PAM的精确序列和长度要求根据所使用的CRISPR酶而不同,但是PAM通常是与前间隔序列(即靶序列)相邻的2至5bp序列。PAM序列的实例是本领域已知的,并且技术人员将能够鉴定用于给定CRISPR酶的其他PAM序列。例如,可以通过在引入序列和与引入序列反向互补序列上检索5’-Nx-NGG-3’来鉴定来自具有PAM序列NGG的化脓性链球菌(S.pyogenes)的Cas9的靶位点。在某些实施方案中,本文使用的基因组PAM位点是NGG、NNG、NAG、NGGNG或NNAGAAW。用于鉴定PAM序列的其他PAM序列和方法是本领域已知的,例如美国专利号8,697,359中所公开的,其公开内容出于所有目的通过引用并入本文。在一些具体实施方案中,使用化脓性链球菌(Streptococcus pyogenes)Cas9(SpCas9),并且相应的PAM是NGG。在一些方面,来自不同细菌菌株的不同Cas9酶使用不同的PAM序列。Cas(CRISPR相关的)蛋白结合到gRNA和gRNA所结合的靶DNA处,并在PAM位点上游的确定位置引入双链断裂。一方面,CRISPR/Cas、Cas/CRISPR或CRISPR-Cas系统(这些术语在整个本申请中可互换使用)不需要产生定制的蛋白质以靶向特定序列,而是可以通过短RNA分子编程得到单个Cas酶来识别特定DNA靶标,即,可以使用短RNA分子将Cas酶募集至特定DNA靶标。
在一些实施方案中,序列特异性核酸酶是II型Cas蛋白。在一些实施方案中,序列特异性核酸酶是Cas9(也称为Csn1和Csxl2),其同源物或其修饰形式。在一些实施方案中,可以使用两种或更多种Cas蛋白的组合。在一些实施方案中,CRISPR酶是Cas9,并且可以是来自化脓性链球菌或肺炎链球菌(S.pneumoniae)的Cas9。Cas酶是本领域已知的;例如,化脓性链球菌Cas9蛋白的氨基酸序列可以在SwissProt数据库中以登录号Q99ZW2找到。
在一些实施方案中,Cas9用于本文所述的方法中。Cas9携带与HNH和RuvC内切核酸酶同源的两个独立的核酸酶结构域,并且通过突变这两个结构域中的任一个,Cas9蛋白可以转化为引入单链断裂的切口酶(Cong,L.等Science 339,819-823(2013))。特别预期的是,本发明的方法和组合物可以与单链或双链诱导形式的Cas9以及与其他RNA引导性DNA核酸酶(例如其他细菌Cas9样系统)一起使用。本文所述的方法和组合物的序列特异性核酸酶可以从生物体工程改造、嵌合或分离。
CRISPR,也称为SPIDR(SPacer Interspersed Direct Repeat,间隔散在正向重复),构成通常对特定细菌物种有特异性的DNA基因座家族。CRISPR基因座包含在大肠杆菌(E.coli)中识别的不同类别的散在短序列重复(short sequence repeat,SSR)(Ishino等,1987,J.Bacteriol.,169:5429-5433;和Nakata等,1989,J.Bacteriol.,171:3553-3556)以及相关基因。类似的散在SSR已经在地中海富盐菌(Haloferax mediterranei)、化脓性链球菌、鱼腥藻(Anabaena)和结核分枝杆菌(Mycobacterium tuberculosis)中鉴定(参见Groenen等,1993,Mol.Microbiol,10:1057-1065;Hoe等,1999,Emerg.Infect.Dis.,5:254-263;Masepohl等,1996,Biochim.Biophys.Acta 1307:26-30;以及Mojica等,1995,Mol.Microbiol,17:85-93)。CRISPR基因座通常通过重复的结构与其他SSR相区分,其被称为短规律间隔重复(short regularly spaced repeat,SRSR)(Janssen等,2002,OMICSJ.Integ.Biol.,6:23-33;和Mojica等,2000,Mol.Microbiol.,36:244-246)。一般而言,重复是发生在簇中的短元件,其被具有基本上长度恒定的独特插入序列规律地间隔开(Mojica等,2000,同上)。尽管重复序列在菌株之间是高度保守的,但是散在重复的数目和间隔区的序列通常在菌株之间存在差异(van Embden等,2000,J.Bacteriol,182:2393-2401)。CRISPR基因座已在超过40种原核生物中被鉴定(参见例如Jansen等,2002,Mol.Microbiol.,43:1565-1575),其包括但不限于气火菌属(Aeropyrum)、火棒菌属(Pyrobaculum)、硫化叶菌属(Sulfolobus)、古球状菌属(Archaeoglobus)、盐盒菌属(Haloarcula)、甲烷杆菌属(Methanobacteriumn)、产甲烷球菌属(Methanococcus)、甲烷八叠球菌属(Methanosarcina)、甲烷火菌属(Methanopyrus)、火球菌属(Pyrococcus)、Picrophilus、肺炎链球菌属(Thernioplasnia)、棒状杆菌属(Corynebacterium)、分枝杆菌属(Mycobacterium)、链霉菌属(Streptomyces)、Aquifrx、卟啉单胞菌属(Porphyromonas)、绿菌属(Chlorobium)、栖热菌属(Thermus)、芽孢杆菌属(Bacillus)、李斯特菌属(Listeria)、葡萄球菌属(Staphylococcus)、梭菌属(Clostridium)、热厌氧杆菌属(Thermoanaerobacter)、支原体属(Mycoplasma)、梭杆菌属(Fusobacterium)、Azarcus、色杆菌属(Chromobacterium)、奈瑟菌属(Neisseria)、亚硝化单胞菌属(Nitrosomonas)、脱硫弧菌属(Desulfovibrio)、Geohacter、微球菌属(Myrococcus)、弯曲杆菌属(Campylobacter)、沃林氏菌属(Wolinella)、不动杆菌属(Acinetobacter)、欧文氏菌属(Erwinia)、埃希氏菌属(Escherichia)、军团菌属(Legionella)、甲基球菌属(Methylococcus)、巴斯德菌属(Pasteurella)、发光杆菌属(Photobacterium)、沙门氏菌属(Salmonella)、黄单胞菌属(Xanthomonas)、耶尔森菌属(Yersinia)、密螺旋体属(Treponema)以及热孢菌属(Thermotoga)。
CRISPR系统指共同参与Cas基因表达或指导Cas基因活性的转录物和其他元件,包括编码Cas基因的序列、tracr(trans-activating CRISPR,反式激活CRISPR)序列(例如tracrRNA或活性部分tracrRNA)、tracr配偶序列(在内源性CRISPR系统的情况中包括“正向重复”和tracrRNA处理的部分正向重复)、向导序列(在内源性CRISPR系统的情况中也称为“间隔区”)或来自CRISPR基因座的其他序列和转录物。在一些实施方案中,CRISPR系统的一种或更多种元件来自I型、II型或III型CRISPR系统。在一些实施方案中,CRISPR系统的一种或更多种元件可以来自包含内源性CRISPR系统的特定生物体,例如化脓性链球菌。在某些实施方案中,CRISPR系统的元件促使在靶序列(在内源性CRISPR系统的情况中也称为前间隔序列)的位置处形成CRISPR复合物。在形成CRISPR复合物的情况中,“靶序列”是指向导序列被设计为对其具有互补性的序列,其中靶序列和向导序列之间的杂交促使CRISPR复合物的形成。只要有足够的互补性以引起杂交并促使CRISPR复合物形成,则不必完全互补。靶序列可以包含任何多核苷酸,例如DNA或RNA多核苷酸。在一些实施方案中,靶序列位于细胞的细胞核或细胞质中。在一些实施方案中,靶序列可以在真核细胞的细胞器内,例如线粒体或叶绿体内。可用于重组到包含靶序列的靶基因座中的序列或模板称为“编辑模板”或“编辑多核苷酸”或“编辑序列”。在本公开的一些方面中,可以将外源模板多核苷酸称为编辑模板。在一些方面,重组是同源重组。CRISPR-Cas系统已经用于编辑、调节和靶向基因组,例如,如Sander和Joung,2014Nature Biotechnology 32(4):347-55中公开的,出于所有目的其公开内容通过引用并入本文。
示例性II型CRISPR系统是来自化脓性链球菌SF370的II型CRISPR基因座,其含有四个基因Cas9、Cas1、Cas2和Csn1的簇,以及两个非编码RNA元件,tracrRNA和由非重复序列的短段(间隔区,每个约30bp)间隔的重复序列(正向重复)的特征阵列。在该系统中,靶向的DNA双链断裂(double-strand break,DSB)经四个连续步骤产生。首先,使两个非编码RNA(pre-crRNA阵列和tracrRNA)从CRISPR基因座转录。其次,使tracrRNA与pre-crRNA的正向重复杂交,然后使其加工成含有单独间隔区序列的成熟crRNA。第三,使成熟的crRNA:tracrRNA复合物通过在crRNA的间隔区和前间隔DNA之间形成异源双链体将Cas9导向由前间隔和相应的PAM组成的DNA靶标。最后,Cas9介导切割PAM上游的靶DNA以在前间隔内产生DSB。CRISPR和/或Cas和使用方法的另一些描述可在如下文件中找到:WO 2007025097、US20100093617、US 20130011828、US 13/960,796、US 8,546,553、WO 2010011961、US20140093941、US 20100076057、US 20110217739、WO 2010075424、WO 2013142578、WO2013141680、US 20130326645、WO 2013169802、US 20140068797、WO 2013176772、WO2013181440、US 20130330778、WO 2013188037、WO 2013188522、WO 2013188638、WO2013192278、WO 2014018423、CN 103388006、WO 2014022702、US 20140090113、WO2014039872、WO 2014065596、US 8,697,359以及CN 103725710,出于所有目的其公开内容通过引用以其全部内容并入本文。
在一些实施方案中,序列特异性核酸酶是RNA引导的内切核酸酶(例如Cas/CRIPSR)系统。本文所用的术语“RNA引导性DNA核酸酶”或“RNA引导性DNA核酸酶”或“RNA引导性内切核酸酶”是指这样的蛋白质,其在特定核苷酸序列处识别并结合向导RNA和多核苷酸(例如靶基因),并催化多核苷酸中的单链或双链断裂。在一些实施方案中,向导RNA是包含这样的5’区域和3’区域的RNA,所述5’区域包含来自CRISPR基因座的至少一个重复,所述3’区域与染色体上的预定插入位点互补。在某些实施方案中,5’区域包含与染色体上的预定插入位点互补的序列,并且3’区域包含来自CRISPR基因座的至少一个重复。在一些方面,向导RNA的3’区域还包含crRNA和/或trRNA的一个或更多个结构序列。5’区域可以包含例如来自CRISPR基因座的约1、2、3、4、5或更多个重复,并且可以是约5、10、15、20、25、30或更多个核苷酸长度中的任何长度。在一些实施方案中,与染色体上的预定插入位点互补的5’区序列包含约17至约24个核苷酸。在另一些实施方案中,3’区域可以是例如约5、10、15、20、25、30或更多个核苷酸长度中的任何长度。在一些方面,与染色体上的预定插入位点互补的5’区域序列的长度可以变化,而3’区域序列的长度是固定的。在需要向导RNA的这种实施方案中,引入序列特异性核酸酶的步骤还可以包括将向导RNA引入细胞中。向导RNA可以作为例如RNA或作为编码向导RNA的质粒或其他核酸载体而引入。质粒或其他核酸载体还可以包含序列特异性核酸酶(例如Cas)和/或外切核酸酶(例如UL-12)的编码序列。在一些实施方案中,向导RNA包含crRNA和tracrRNA,并且这两段RNA通过杂交形成复合物。在一些实施方案中,当使用多种向导RNA时,可以使用与不同crRNA配对的单个tracrRNA。
因此,例如,在一些实施方案中,提供了在真核细胞中染色体上的预定插入位点处插入供体序列的方法,所述方法包括:a)将序列特异性RNA引导性核酸酶(例如Cas,例如Cas9)引入细胞;b)将识别插入位点的向导RNA引入细胞;c)将供体构建体引入细胞;和d)将编码外切核酸酶(例如UL-12)的核酸序列引入细胞;其中所述供体构建体是线性核酸或其在所述细胞内被切割以产生线性核酸,其中所述线性核酸包含5’同源臂、所述供体序列和3’同源臂,其中所述5’同源臂与所述染色体上的核酸酶切割位点上游的序列同源,并且其中所述3’同源臂与所述染色体上的核酸酶切割位点下游的序列同源;其中所述5’同源臂和所述3’同源臂分别邻近所述线性核酸的5’和3’末端,并且其中所述供体序列通过同源重组在所述插入位点处插入所述染色体。
在一些实施方案中,提供了在真核细胞中染色体上的预定插入位点处插入供体序列的方法,所述方法包括:a)将编码序列特异性RNA引导性核酸酶(例如Cas,例如Cas9)的核酸序列引入细胞;b)将编码识别插入位点的引导性RNA的核酸序列引入细胞;c)将供体构建体引入细胞;和d)将编码外切核酸酶(例如UL-12)的核酸序列引入细胞;其中所述供体构建体是线性核酸或其在所述细胞内被切割以产生线性核酸,其中所述线性核酸包含5’同源臂、所述供体序列和3’同源臂,其中所述5’同源臂与所述染色体上的核酸酶切割位点上游的序列同源,并且其中所述3’同源臂与所述染色体上的核酸酶切割位点下游的序列同源;其中所述5’同源臂和所述3’同源臂分别邻近所述线性核酸的5’和3’末端,并且其中所述供体序列通过同源重组在所述插入位点处插入所述染色体。
在一些实施方案中,提供了在真核细胞中染色体上的预定插入位点处插入供体序列的方法,所述方法包括:a)将包含编码序列特异性的RNA引导性核酸酶(例如Cas,例如Cas9)的核酸序列的载体引入细胞;b)将包含编码识别所述插入位点的引导性RNA的核酸序列的载体引入细胞;c)将供体构建体引入细胞;和d)将包含编码外切核酸酶(例如UL-12)的核酸序列的DNA载体引入细胞;其中所述供体构建体是线性核酸或其在所述细胞内被切割以产生线性核酸,其中所述线性核酸包含5’同源臂、所述供体序列和3’同源臂,其中所述5’同源臂与所述染色体上的核酸酶切割位点上游的序列同源,并且其中所述3’同源臂与所述染色体上的核酸酶切割位点下游的序列同源;其中所述5’同源臂和所述3’同源臂分别邻近所述线性核酸的5’和3’末端,并且其中所述供体序列通过同源重组在所述插入位点处插入所述染色体。
在一些实施方案中,提供了在真核细胞中染色体上的预定插入位点处插入供体序列的方法,所述方法包括:a)将包含编码序列特异性的RNA引导性核酸酶(例如Cas,例如Cas9)和识别插入位点的向导RNA的核酸序列的载体引入细胞;b)将供体构建体引入细胞;以及c)将包含编码外切核酸酶(例如UL-12)的核酸序列的DNA载体引入细胞;其中所述供体构建体是线性核酸或其在所述细胞内被切割以产生线性核酸,其中所述线性核酸包含5’同源臂、所述供体序列和3’同源臂,其中所述5’同源臂与所述染色体上的核酸酶切割位点上游的序列同源,并且其中所述3’同源臂与所述染色体上的核酸酶切割位点下游的序列同源;其中所述5’同源臂和所述3’同源臂分别邻近所述线性核酸的5’和3’末端,并且其中所述供体序列通过同源重组在所述插入位点处插入所述染色体。
在一些实施方案中,提供了在真核细胞中染色体上的预定插入位点处插入供体序列的方法,所述方法包括:a)将包含编码序列特异性的RNA引导性核酸酶(例如Cas,例如Cas9)的核酸序列和编码外切核酸酶(例如UL-12)的核酸序列的载体引入细胞;b)将识别插入位点的向导RNA引入细胞;和c)将供体构建体引入细胞;其中所述供体构建体是线性核酸或其在所述细胞内被切割以产生线性核酸,其中所述线性核酸包含5’同源臂、所述供体序列和3’同源臂,其中所述5’同源臂与所述染色体上的核酸酶切割位点上游的序列同源,并且其中所述3’同源臂与所述染色体上的核酸酶切割位点下游的序列同源;其中所述5’同源臂和所述3’同源臂分别邻近所述线性核酸的5’和3’末端,并且其中所述供体序列通过同源重组在所述插入位点处插入所述染色体。
在一些实施方案中,提供了在真核细胞中染色体上的预定插入位点处插入供体序列的方法,所述方法包括:a)将包含编码序列特异性核酸酶(例如Cas,例如Cas9)的核酸序列、识别插入位点的向导RNA和编码外切核酸酶(例如UL-12)的核酸序列的载体引入细胞;b)将供体构建体引入细胞;其中所述供体构建体是线性核酸或其在所述细胞内被切割以产生线性核酸,其中所述线性核酸包含5’同源臂、所述供体序列和3’同源臂,其中所述5’同源臂与所述染色体上的核酸酶切割位点上游的序列同源,并且其中所述3’同源臂与所述染色体上的核酸酶切割位点下游的序列同源;其中所述5’同源臂和所述3’同源臂分别邻近所述线性核酸的5’和3’末端,并且其中所述供体序列通过同源重组插入所述染色体的插入位点。
在一些实施方案中,提供了在真核细胞(例如合子细胞)中的染色体上的预定插入位点处插入供体序列的方法,所述方法包括:a)将编码序列特异性核酸酶(例如Cas,例如Cas9)的mRNA序列注射到细胞中;b)将识别插入位点的向导RNA注射到细胞中;c)将供体构建体引入(例如注射入)细胞;和d)将编码外切核酸酶的mRNA序列注射到细胞中;其中所述供体构建体是线性核酸或其在所述细胞内被切割以产生线性核酸,其中所述线性核酸包含5’同源臂、所述供体序列和3’同源臂,其中所述5’同源臂与所述染色体上的核酸酶切割位点上游的序列同源,并且其中所述3’同源臂与所述染色体上的核酸酶切割位点下游的序列同源;其中所述5’同源臂和所述3’同源臂分别邻近所述线性核酸的5’和3’末端,并且其中所述供体序列通过同源重组在所述插入位点处插入所述染色体。在一些实施方案中,注射在体外进行。在一些实施方案中,注射在体内进行。在一些实施方案中,所述方法还包括在体外将编码序列特异性RNA引导性核酸酶的核酸转录为mRNA。在一些实施方案中,所述方法还包括在体外将编码识别插入位点的向导RNA的核酸转录为mRNA。在一些实施方案中,所述方法还包括在体外将编码外切核酸酶的核酸转录为mRNA。
可以使用本领域已知的任何方法评估供体序列的插入。例如,可以设计对应于5’同源臂上游的序列的5’引物和对应于供体序列中的区域的相应3’引物,以评估插入的5’连接。类似地,可以设计对应于3’同源臂下游的序列的3’引物和对应于供体序列中的区域的相应5’引物,以评估插入的3’连接。也可以使用其他方法,例如southern印迹杂交和DNA测序技术。
只要可以设计序列特异性核酸酶用于在该位点处实现切割,则插入位点可以在任何期望的位点处。在一些实施方案中,插入位点是在靶基因座处。在一些实施方案中,插入位点不是基因座。
如本文所用的“供体序列为是指待插入宿主细胞染色体中的核酸。在一些实施方案中,供体核酸是不存在于宿主细胞中的序列。在一些实施方案中,供体序列是存在于预定靶位点以外的位点的内源序列。在一些实施方案中,供体序列是编码序列。在一些实施方案中,供体序列是非编码序列。在一些实施方案中,供体序列是基因的突变基因座。
供体序列的大小可以在约1bp至约100kb的范围内。在某些实施方案中,供体序列的大小为约1bp至约10bp,约10bp至约50bp,约50bp至约100bp,约100bp至约500bp,约500bp至约1kb,约1kb至约10kb,约10kb至约50kb,约50kb至约100kb或大于约100kb。
在一些实施方案中,供体序列是待插入染色体的外源基因。在一些实施方案中,供体序列是在靶位点处替换内源序列的经修饰的序列。例如,供体序列可以是含有所需突变的基因,并且可以用于替换存在于染色体上的内源基因。在一些实施方案中,供体序列是调节元件。在一些实施方案中,供体序列是编码报告蛋白和/或RNA的标签或编码序列。在一些实施方案中,供体序列可以插入到靶基因编码序列的编码框中,其将允许融合蛋白的表达,所述融合蛋白包含与靶蛋白的N-或C-末端融合的外源序列。
本文所述的供体构建体是线性核酸或在细胞内被切割以产生的线性核酸。本文所述的线性核酸包含5’同源臂、供体序列和3’同源臂。5’和3’同源臂与靶染色体上DNA切割位点上游和下游的序列同源,从而允许同源重组发生。
本文所用的术语“同源性”或“同源的”定义为在比对序列和引入空位(如果需要,以实现最大百分比的序列同一性)之后,同源臂中的核苷酸残基与靶染色体上相应序列中核苷酸残基相同的百分比。用于确定百分比核苷酸序列同源性的比对可以以本领域技术内的多种方式实现,例如使用可公开获得的计算机软件如BLAST、BLAST-2、ALIGN、ClustalW2或Megalign(DNASTAR)软件。本领域技术人员可以确定用于比对序列的适当参数,包括在被比较序列的全长上实现最大对齐所需的任何算法。在一些实施方案中,5’同源臂和染色体上相应序列之间的同源性为至少约80%、85%、90%、95%、98%、99%或100%中的任何值。在一些实施方案中,3’同源臂和染色体上的相应序列之间的同源性为至少约80%、85%、90%、95%、98%、99%或100%中的任何值。
在一个实施方案中,同源臂长度大于约30bp,例如大于约50bp、100bp、200bp、300bp、500bp、800bp、1kb、1.5kb、2kb和5kb长度中的任何值。5’和/或3’同源臂可以与紧邻DNA切割位点上游和/或下游的序列同源。或者,5’和/或3’同源臂可以与远离DNA切割位点的序列同源,例如距离DNA切割位点0bp或与DNA切割位点部分或完全重叠的序列。在另一些实施方案中,5’和/或3’同源臂可以与这样的序列同源,其距DNA切割位点至少约1、2、5、10、15、20、25、30、50、100、200、300、400或500bp。
线性核酸的5’和3’同源臂分别邻近线性核酸的5’和3’末端,即距离线性核酸的5’和3’末端不超过约200bp。在一些实施方案中,5’同源臂距离线性DNA的5’末端不超过约1、2、5、10、15、20、25、30、35、40、45、50、55、60、70、80、90,100、120、140、160、180或200bp中的任何值。在一些实施方案中,3’同源臂距离线性DNA的3’末端不超过约1、2、5、10、15、20、25、30、35、40、45、50、55、60、70、80、90、100、120、140、160、180或200bp中的任何值。在一些方面,5’和/或3’同源臂可以分别直接连接到线性DNA的5’和3’末端,或者分别部分或完全地与线性DNA的5’和3’末端重叠。
在一些实施方案中,供体构建体在细胞内被切割(例如通过识别构建体上的切割位点的序列特异性核酸酶)以产生本文所述的线性核酸。例如,供体构建体可以包含5’同源臂上游和3’同源臂下游的侧翼序列。在一些实施方案中,此类侧翼序列不存在于宿主细胞的基因组序列中,从而允许切割仅发生在供体构建体上。然后可以相应地设计序列特异性核酸酶以实现在侧翼序列处的切割,其允许线性核酸的释放而不影响宿主序列。侧翼序列可以是例如约5至约500bp,包括约5至15、15至30、30至50、50至80、80至100、100至150、150至200、200至300、300至400或400至500bp中的任何值。在一些实施方案中,侧翼序列不超过约10、20、30、40、50、60、70、80、90或100bp中的任何值。在一些实施方案中,在序列特异性切割后保留在线性核酸上的侧翼序列的部分是约10、20、30、40、50、60、70、80、90或100bp中的任何值。在一些实施方案中,侧翼序列包含以下序列中的任一个:
GGCAGAAATGGCTCCGATCGAGG(SEQ ID NO:3)
GGGCGGGATTGATAGCGCGCGGG(SEQ ID NO:4)
GGCAGTCGGGAACATCTCGTGGG(SEQ ID NO:5)
GGGCGCAGTAATTCTTAGAGCGG(SEQ ID NO:6)
GGCTAATAACTTAATCGTGGAGG(SEQ ID NO:7)
GGTTAAGCCTTATTGGTGGTCGG(SEQ ID NO:8)
GGAGGCCTGCTTGCAAGCATTGG(SEQ ID NO:9)
GGTTAGGCCCTAAGCGAATACGG(SEQ ID NO:10)
GGAGCCGAGTTGACGGTTAGCGG(SEQ ID NO:11)
GGGGTTCCTTCACGAGCGTCCGG(SEQ ID NO:12)
GGTACAATGTAACGTTGCGCGGG(SEQ ID NO:13)
GGTATTCAAGTCACTAATGTCGG(SEQ ID NO:14)
GGAACCCCTTCCGTTCCGTCGGG(SEQ ID NO:15)
GGTATTCACTCCTAAAGCGTCGG(SEQ ID NO:16)
GGGATGGAACACTAGACTGCGGG(SEQ ID NO:17)
GGTTAATCCCTCATGACCGTCGG(SEQ ID NO:18)
GGAGCTTCAGTGTCGGTCGTTGG(SEQ ID NO:19)
GGTTACGTGCCATATACGTTCGG(SEQ ID NO:20)
在一些实施方案中,供体构建体是环状DNA构建体。供体构建体还可以包含提供结构或功能支持的某些序列,例如支持供体构建体(例如pUC19载体)扩增的质粒或其他载体的序列。供体构建体还可以任选地包含某些可选择标志物或报告分子,其中一些可以在侧翼具有重组酶识别位点,用于随后的激活、失活或缺失。
在一些实施方案中,当供体构建体在细胞内被切割以产生线性核酸时,本文所述的方法还可以包括将第二序列特异性核酸酶引入细胞中。第二序列特异性核酸酶识别构建体上的切割位点(例如本文所述的侧翼序列),并导致细胞内供体构建体的切割,以产生线性核酸。
因此,在一些实施方案中,提供了在真核细胞染色体上的预定插入位点处插入供体序列的方法,包括:a)将在插入位点处切割染色体的第一序列特异性核酸酶引入细胞;b)将供体构建体(例如环状供体构建体)引入细胞,c)将切割供体构建体的第二序列特异性核酸酶引入细胞;和d)将外切核酸酶引入细胞;其中在被所述第二序列特异性核酸酶切割时,所述供体构建体产生包含5’同源臂、所述供体序列和3’同源臂的线性核酸,其中所述5’同源臂与所述染色体上的核酸酶切割位点上游的序列同源,并且其中所述3’同源臂与所述染色体上的核酸酶切割位点下游的序列同源;并且其中所述5’同源臂和所述3’同源臂分别邻近所述线性核酸的5’和3’末端,并且其中所述供体序列通过同源重组在所述插入位点处插入染色体。在一些实施方案中,第一序列特异性核酸酶和第二序列特异性核酸酶是相同类型(例如,两者都是ZFN、TALEN或基于CRISPR的核酸酶)。在一些实施方案中,第一序列特异性核酸酶和第二序列特异性核酸酶是不同类型的。在一些实施方案中,将第一序列特异性核酸酶、第二序列特异性核酸酶和/或外切核酸酶同时引入细胞。在一些实施方案中,将第一序列特异性核酸酶、第二序列特异性核酸酶和/或外切核酸酶依次引入细胞。在一些实施方案中,将第一序列特异性核酸酶、第二序列特异性核酸酶和/或外切核酸酶作为cDNA引入细胞。在一些实施方案中,将第一序列特异性核酸酶、第二序列特异性核酸酶和/或外切核酸酶作为mRNA引入细胞。在一些实施方案中,将第一序列特异性核酸酶、第二序列特异性核酸酶和/或外切核酸酶作为蛋白质引入细胞。
在一些实施方案中,第一序列特异性核酸酶和第二序列特异性核酸酶都是序列特异性的RNA引导性核酸酶。在这样的一些实施方案中,可以与两种不同的向导RNA(一个识别插入位点,另一个识别供体构建体上的切割位点)一起使用单个核酸酶。例如,在一些实施方案中,该方法包括:a)将序列特异性RNA引导性核酸酶引入细胞;b)将供体构建体(例如环状供体构建体)引入细胞;c)将识别插入位点的第一向导RNA引入细胞;d)将识别所述供体构建体上的切割位点的第二向导RNA引入细胞;以及e)将外切核酸酶引入细胞;其中在被所述序列特异性核酸酶切割时,所述供体构建体产生包含5’同源臂、所述供体序列和3’同源臂的线性核酸,其中所述5’同源臂与所述染色体上的核酸酶切割位点上游的序列同源,并且其中所述3’同源臂与所述染色体上的核酸酶切割位点下游的序列同源;并且其中所述5’同源臂和所述3’同源臂分别邻近所述线性核酸的5’和3’末端,并且其中所述供体序列通过同源重组在所述插入位点处插入染色体。在一些实施方案中,第一向导RNA和第二向导RNA经由DNA载体(并且在一些实施方案中在相同载体上)引入细胞。在一些实施方案中,通过注射将第一向导RNA和第二向导RNA(例如在通过体外转录产生之后)引入细胞。
因此,本申请还提供了产生本文所述的线性核酸的方法。在一些实施方案中,提供了在真核细胞中产生线性核酸的方法,其中所述线性核酸包含5’同源臂、所述供体序列和3’同源臂,其中所述5’同源臂与所述染色体上的核酸酶切割位点上游的序列同源,并且其中所述3’同源臂与所述染色体上的核酸酶切割位点下游的序列同源;并且其中所述5’同源臂和所述3’同源臂分别邻近所述线性核酸的5’和3’末端,所述方法包括:a)将包含所述线性核酸并且还包含5’同源臂上游5’侧翼序列和3’同源臂下游3’侧翼序列的环状供体构建体引入细胞;和b)将序列特异性核酸酶引入细胞,其中所述序列特异性核酸酶在所述侧翼序列处切割所述环状核酸构建体,从而产生所述线性核酸。在一些实施方案中,切割位点在5’侧翼序列和/或3’侧翼序列处。在一些实施方案中,线性DNA长约200bp至约100kb。在某些实施方案中,线性DNA长约10bp至约50bp,约50bp至约100bp,约100bp至约150bp,约150bp至约200bp,约200bp至约500bp,约500bp至约1kb,约1kb至约10kb,约10kb至约50kb,约50kb至约100kb或长于约100kb。
本方法的用途
本文所述的方法可以具有许多用途。例如,本文所述的方法可用于产生可用于细胞治疗的经基因修饰的细胞(例如免疫细胞)。
在一些实施方案中,提供了产生经遗传修饰的动物(例如经遗传修饰的啮齿动物,例如小鼠或大鼠)的方法,所述动物包含在动物染色体上的预定插入位点处插入的供体序列,所述方法包括:a)将在插入位点处切割所述染色体的序列特异性核酸酶引入所述动物的细胞;b)将供体构建体引入细胞;c)将外切核酸酶引入细胞;其中所述供体构建体是线性核酸或在所述细胞内被切割以产生线性核酸;和d)将所述细胞引入载体动物中以产生经遗传修饰的动物,其中所述供体构建体是线性核酸或其在所述细胞内被切割以产生线性核酸,其中所述线性核酸包含5’同源臂、所述供体序列和3’同源臂,其中所述5’同源臂与所述染色体上的核酸酶切割位点上游的序列同源,并且其中所述3’同源臂与所述染色体上的核酸酶切割位点下游的序列同源;其中所述5’同源臂和所述3’同源臂分别邻近所述线性核酸的5’和3’末端,并且其中所述供体序列通过同源重组在所述插入位点处插入所述染色体。在一些实施方案中,细胞是胚胎干细胞。在一些实施方案中,细胞是合子细胞。在一些实施方案中,所述方法还包括对经遗传修饰的动物进行繁育。
在一些实施方案中,细胞是来自囊胚的细胞。在将多种组分注射入细胞中后,可以从注射的囊胚中发育出嵌合动物。杂合F1动物可以通过在嵌合体和纯近交系动物之间进行育种获得。纯合动物可以通过杂合动物之间的杂交获得。
在一些实施方案中,该方法用于产生具有特定突变体等位基因的突变动物。例如,供体序列可以包含突变等位基因,并且可以插入动物的基因组中(例如通过替换相应的内源基因座)。突变动物可用于许多目的,例如用作研究工具或疾病模型。在一些实施方案中,将动物修饰以具有所需的表型,例如所需的疾病表型。可通过本文所述的方法产生的具有各种疾病表型的动物包括但不限于在代谢疾病、免疫疾病、神经疾病、神经退行性疾病(例如阿尔茨海默氏病)、胚胎发育疾病、血管疾病、炎性疾病(例如哮喘和关节炎)、感染性疾病、癌症、行为疾病和认知疾病中表现出表型的动物。
在一些实施方案中,本文所述的方法用于产生“人源化”动物,例如人源化小鼠或人源化大鼠。本文使用的“人源化动物”是指具有人来源供体序列的动物。人供体序列可以被插入到基因组上的任何位点处。在一些实施方案中,人供体序列被插入到动物细胞中相应的内源基因座处。
在一些实施方案中,可以产生能够生产包含人可变结构域和/或人恒定结构域之免疫球蛋白的人源化啮齿动物。可以将含有人免疫球蛋白V、D、J和/或恒定基因座的重排或未重排的人免疫球蛋白基因座置于本文所述的供体构建体上,并通过同源重组将其引入动物细胞的基因组中。在一些实施方案中,将人免疫球蛋白插入到动物细胞中相应的内源性免疫球蛋白基因座处。通过这种操作,可以产生能够生产完全人抗体、嵌合抗体(例如包含小鼠可变结构域和人恒定结构域的抗体)或反向嵌合抗体(例如包含人可变结构域和小鼠恒定区的抗体)的转基因动物。
在一些实施方案中,本文所述的方法用于产生用于人类疾病或病症的小鼠模型。在另一些方面,该小鼠模型反映或模拟人类疾病或病症的至少一个方面。在其他方面,本文公开的组合物和方法用于将人基因敲入小鼠并替换相应的小鼠基因,以产生人源化小鼠,例如具有人源化TNF-α(TNF-α H-小鼠)和具有人源化IL-6(IL-6H-小鼠)的小鼠。人类疾病或病症的小鼠模型的产生公开于Wu等,“Correction of a Genetic Disease in Mousevia Use of CRISPR-Cas9,”Cell Stem Cell(2013)13(6):659-62,和Yang等,“One-StepGeneration of Mice Carrying Reporter and Conditional Alleles by CRISPR/Cas-Mediated Genome Engineering,”Cell(2013)154(6):1370-9中,其公开内容出于所有目的通过引用以其全部内容并入本文。
在一些实施方案中,可以通过将编码免疫细胞因子报告子的序列通过本文所述的供体构建体插入动物细胞染色体上期望的插入位点处来产生具有免疫细胞因子报告子的转基因动物。
在一些实施方案中,可以通过将包含ROSA26基因座的序列通过本文所述的供体构建体插入动物细胞染色体上的期望的插入位点来产生携带ROSA26基因座的转基因小鼠。
还提供了通过本文所述的任何一种方法产生的细胞和经遗传修饰的动物。
试剂盒
本文还提供了可用于本文所述的任何一种方法的试剂盒。例如,在一些实施方案中,提供了用于在真核细胞中染色体上的插入位点处插入供体序列的试剂盒,其包含:a)在插入位点处切割染色体的序列特异性核酸酶;b)供体构建体,其中所述供体构建体包含5’同源臂、所述供体序列和3’同源臂,其中5’同源臂与染色体上插入位点5’侧的序列同源,并且其中3’同源臂与染色体上插入位点3’侧的序列同源;和c)外切核酸酶,其中所述供体构建体是线性核酸或可以被切割以产生线性核酸,并且其中所述5’同源臂和所述3’同源臂邻近所述线性核酸的5’和3’末端。
本文所述的试剂盒还可以包含容纳试剂盒的内容物的包装。所述包装任选地提供无菌、无污染的环境,并且可以由塑料、纸、箔、玻璃等中的任何一种制成。在一些实施方案中,包装是玻璃小瓶。在一些实施方案中,试剂盒还包含用于进行本文所述的任何一种方法的说明书。
实施例
以下非限制性实施例进一步说明了本发明的组合物和方法。本领域技术人员将认识到,在本发明的范围和精神内,诸多实施方案是可能的。现在将通过参考以下非限制性实施例更详细地描述本发明。以下实施例进一步说明了本发明,但是当然不应该以任何方式解释为限制其范围。
实施例1.EKI系统显著提高U2OS细胞中EGFP-ACTB的敲入效率
图1中示出了表达EGFP-ACTB融合蛋白的靶向方案。靶向载体含有位于EGFP序列侧翼的约1kb的同源臂,并且sgRNA在ACTB基因起始密码子ATG附近的位置靶向ACTB等位基因。在成功同源重组后,EGFP序列将被插入到ACTB基因组基因座的起始密码子之后,以用于表达EGFP-ACTB融合蛋白。人ACTB基因的sgRNA靶序列是5’-cgcggcgatatcatcatccatgg-3’(SEQ ID NO:21)。
Cas9序列(SEQ ID NO:22)如下所示。粗体下划线序列是3×FLAG标签序列。斜体下划线序列是两个SV40核定位序列(nuclear localization sequence,NLS)。
SEQ ID NO:22:
5’-
ATG ATGGCCGGTATCCACGGAGTCCCAGCAGCCGACAAGAAGTACAGCATCGGCCTGGACATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGAAACCTGATTGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCCCTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCCCACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTTCGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGGCCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGCGAC taa-3’
UL12序列(SEQ ID NO:23)如下所示。粗体下划线序列是3×FLAG标签序列。斜体下划线序列是SV40核定位序列(NLS)。
SEQ ID NO:23:
5’-
ATGGAGTCCACGGGAGGCCCAGCATGTCCGCCGGGACGCACCGTGACTAAGCGTTCCTGGGCCCTGGCCGAGGACACCCCTCGTGGCCCCGACAGCCCCCCCAAGCGCCCCCGCCCTAACAGTCTTCCGCTGACAACCACCTTCCGTCCCCTGCCCCCCCCACCCCAGACGACGTCAGCTGTGGACCCAAGCTCCCATTCGCCCGATAACCCCCCACGTGATCAGCACGCCACCGACACCGCAGACGAAAAGCCCCGGGCCGCGTCGCCGGCACTTTCTGACGCCTCAGGGCCTCCGACCCCAGACATTCCGCTATCTCCTGGGGGCACCCACGCCCGCGACCCGGACGCCGATCCCGACTCCCCGGACCTTGACTCTATGTGGTCGGCGTCGGTGATCCCCAACGCGCTGCCCTCCCATATACTAGCCGAGACGTTCGAGCGCCACCTGCGCGGGTTGCTGCGCGGCGTCCGCGCCCCCCTGGCCATCGGTCCCCTCTGGGCCCGCCTGGATTATCTGTGTTCCCTGGCCGTGGTCCTCGAGGAGGCGGGTATGGTGGACCGCGGACTCGGCCGGCACCTATGGCGCCTGACGCGCCGCGGGCCCCCGGCCGCCGCGGACGCCGTGGCGCCCCGGCCCCTCATGGGGTTTTACGAGGCGGCCACGCAAAACCAGGCCGACTGCCAGCTATGGGCCCTGCTCCGGCGGGGCCTCACGACCGCATCCACCCTCCGCTGGGGCCCCCAGGGTCCGTGTTTCTCGCCCCAGTGGCTGAAGCACAACGCCAGCCTGCGGCCGGATGTACAGTCTTCGGCGGTGATGTTCGGGCGGGTGAACGAGCCGACGGCCCGAAGCCTGCTGTTTCGCTACTGCGTGGGCCGCGCGGACGACGGCGGCGAGGCCGGCGCCGACACGCGGCGCTTTATCTTCCACGAACCCGGCGACCTCGCCGAAGAGAACGTGCATACGTGTGGGGTCCTCATGGACGGTCACACGGGGATGGTCGGGGCGTCCCTGGATATTCTCGTCTGTCCTCGGGACACTCACGGCTACCTGGCCCCAGTCCCCAAGACCCCCCTGGCCTTTTACGAGGTCAAATGCCGGGCCAAGTACGCTTTCGACCCCATGGACCCCAGCGACCCCACGGCCTCCGCGTACGAGGACTTGATGGCACACCGGTCCCCGGAGGCGTTCCGGGCATTTATCCGGTCGATCCCGAAGCCCAGCGTGCGATACTTCGCGCCCGGGCGCGTCCCCGGCCCGGAGGAGGCTCTCGTCACGCAAGACCAGGCCTGGTCAGAGGCCCACGCCTCGGGCGAAAAAAGGCGGTGCTCCGCCGCGGATCGGGCCTTGGTGGAGTTAAATAGCGGCGTTGTCTCGGAGGTGCTTCTGTTTGGCGCCCCCGACCTCGGACGCCAAACCATCTCCCCCGTGTCCTGGAGCTCCGGGGATCTGGTCCGCCGCGAGCCCGTCTTCGCGAACCCCCGTCACCCGAACTTTAAGCAGATCTTGGTGCAGGGCTACGTGCTCGACAGCCACTTCCCCGACTGCCCCCCCCACCCGCATCTGGTGACGTTTATCGGCAGGCACCGCACCAGCGCGGAGGAGGGCGTAACGTTCCGCCTGGAGGACGGCGCCGGGGCTCTCGGGGCCGCAGGACCCAGCAAGGCGTCCATTCTCCCGAACCAGGCCGTTCCGATCGCCCTGATCATTACCCCCGTCCGCATCGATCCGGAGATCTATAAGGCCATCCAGCGAAGCAGCCGCCTGGCGTTCGACGACACGCTCGCCGAGCTATGGGCCTCTCGTTCTCCGGGGCCCGGCCCTGCTGCTGCCGAAACAACGTCCTCATCACCGACGACGGGGAGGTCGTCTCGC TGA-3’
构建了以下质粒:Cas9/sgRNA-hACTB;Cas9/sgRNA-LS14;靶向载体TV-LS14-hACTB;和pcDNA3.1Hygro(+)-UL12。
使用Neon(Invitrogen)转染系统通过电穿孔将构建的质粒转染到U2OS细胞中。
ACTB基因编码β-肌动蛋白,其是细胞骨架的组分。转染后三天,通过荧光显微术观察到指示细胞骨架的丝状结构的绿色荧光(图2)。
流式细胞术分析表明常规CRISPR/Cas9介导的EGFP敲入的效率仅为约1.91%。相比之下,EKI系统实现了15.02%的敲入效率(图3)。
实施例2.EKI系统显著提高在C6细胞中EGFP-LMNB1的敲入效率
图4中示出了表达EGFP-LMNB1融合蛋白的靶向方案。靶向载体含有位于EGFP序列侧翼的约1kb的同源臂,并且sgRNA在LMNB1基因起始密码子ATG附近的位置靶向LMNB1等位基因。在成功同源重组后,EGFP序列将被插入到LMNB1基因组基因座的起始密码子之后,以用于表达EGFP-LMNB1融合蛋白。人LMNB1基因的sgRNA靶序列是5’-gctgtctccgccgcccgccatgg-3’(SEQ ID NO:24)。大鼠LMNB1基因的sgRNA靶序列是5’-gggggtcgcggtcgccatggcgg-3’(SEQ ID NO:25)。
构建了以下质粒:Cas9/sgRNA-LMNB1;Cas9/sgRNA-LS14;靶向载体TV-LS14-LMNB1;和pcDNA3.1Hygro(+)-UL12。
使用Neon(Invitrogen)转染系统通过电穿孔将构建的质粒转染到C6细胞中。
LMNB1基因编码核纤层蛋白(lamin)BI,其是核纤层(nuclear lamina)的组分。转染后三天,通过荧光显微镜观察到指示核膜结构的绿色荧光(图5)。
流式细胞术分析表明常规CRISPR/Cas9介导的EGFP敲入的效率仅为约0.19%。相比之下,EKI系统实现3.6%的敲入效率(图6)。
在另一个实验中,使用图4中所示的靶向方案,使用TurboGFP代替EGFP用于在C6细胞中表达TurboGFP-LMNB1融合蛋白(数据未示出)。
实施例3.EKI系统在U2OS细胞中实现EGFP-ACTB和mCherry-LMNB1的双敲入。
图7中示出了在将EGFP和mCherry序列分别敲入内源性ACTB和LMNB1基因座后,表达EGFP-ACTB融合蛋白和mCherry-LMNB1融合蛋白的靶向方案。靶向载体含有分别位于EGFP和mCherry序列侧翼的约1kb的同源臂。此外,sgRNA在其起始密码子ATG附近的位置靶向ACTB等位基因和LMNB1等位基因。在成功同源重组后,EGFP序列将被插入到ACTB基因组基因座的起始密码子之后,以用于表达EGFP-ACTB融合蛋白,并且mCherry序列将被插入到LMNB1基因组基因座的起始密码子之后,以用于表达mCherry-LMNB1融合蛋白。
构建了以下质粒:Cas9/sgRNA-ACTB;Cas9/sgRNA-LMNB1;Cas9/sgRNA-LS14;靶向载体TV-LS14-ACTB;靶向载体TV-LS14-LMNB1;和pcDNA3.1Hygro(+)-UL12。
使用Neon(Invitrogen)转染系统通过电穿孔将构建的质粒转染到U2OS细胞中。转染后3天,通过荧光显微术观察到表示细胞骨架的丝状结构的绿色荧光和表示核膜结构的红色荧光(图8)。
实施例4.使用EKI系统高效地产生CD4-2A-dsRed敲入大鼠
图9中示出了产生CD4-2A-dsRed敲入大鼠的靶向方案。靶向载体含有位于2A-dsRed序列侧翼的约1kb的同源臂,并且sgRNA在终止密码子附近的位置靶向内源性大鼠CD4等位基因。在成功同源重组后,插入在CD4基因组基因座的终止密码子附近的2A-dsRed序列将被表达为CD4-2A-dsRed融合蛋白。敲入大鼠的CD4阳性细胞将表达2A-dsRed红色荧光蛋白。大鼠CD4基因的sgRNA靶序列是5’-gaaaagccacaatctcatatgagg-3’(SEQ ID NO:26)。LS14的sgRNA靶序列是5’-ggtattcactcctaaagcgtcgg-3’(SEQ ID NO:27)。
示例性的靶向载体以5’至3’方向示出:CCGACGCTTTAGGAGTGAATACC(SEQ ID NO:28,LS14序列)-左同源臂-2A-dsRed-右同源臂-CCGACGCTTTAGGAGTGAATACC(SEQ ID NO:29,LS14序列)。
可以使用U6-sgRNA骨架序列(SEQ ID NO:30)。下划线的序列是U6启动子序列,加粗的序列在制备构建体时被靶序列替代,并且斜体的序列是sgRNA的结构序列。
SEQ ID NO:30:
GAGGGCCTATTTCCCATGATTCCTTCATATTTGCATATACGATACAAGGCTGTTAGAGAGATAATTGGAATTAATTT GACTGTAAACACAAAGATATTAGTACAAAATACGTGACGTAGAAAGTAATAATTTCTTGGGTAGTTTGCAGTTTTAA AATTATGTTTTAAAATGGACTATCATATGCTTACCGTAACTTGAAAGTATTTCGATTTCTTGGCTTTATATATCTTG TGGAAAGGACGAAACACC
T7-sgRNA骨架序列(SEQ ID NO:31)如下所示。下划线的序列是T7启动子序列,加粗的序列在制备构建体时被靶序列替代,并且斜体的序列是sgRNA的结构序列。
SEQ ID NO:31:
TAATACGACTCACTATAGG
构建了如下质粒:Cas9/sgRNA-CD4;Cas9/sgRNA-LS14;靶向载体TV-LS14-CD4;pcDNA3.1Hygro(+)-UL12;T7-Cas9;T7-sgRNA-CD4;和T7-sgRNA-LS14。
构建的质粒在体外转录以获得UL12mRNA、Cas9mRNA以及CD4和LS14的sgRNA。然后将UL12mRNA、Cas9mRNA、sgRNA-CD4、sgRNA-LS14和TV-LS14-CD4注射到大鼠的受精卵中。然后将注射的受精卵移植到假孕大鼠中。
F0代的33只大鼠出生并进行基因型检测。在5’端PCR反应(5’-junction PCRreaction)中使用引物LF和INR(图9)。正向引物LF位于左同源臂的远端,反向引物INR位于2A-dsRed区域内。33只F0大鼠中的7只被测试为敲入阳性(图10)。
引物INF和RR用于3’端PCR反应(图9)。正向引物INF位于2A-dsRed区域内,反向引物RR位于右同源臂的远端。33只F0大鼠中的7只被测试为敲入阳性(图11)。
因此,5’端PCR反应和3’端PCR反应产生相同的结果,并且编号6号、7号、14号、17号、22号、23号和29号的F0大鼠通过这两种PCR测定被测试为敲入阳性。阳性率为7/33(21.2%)。
图12示出敲入大鼠的southern印迹杂交结果,进一步表明供体序列在预定位点的插入。用southern印迹杂交测试的两只F1大鼠(19号和21号)是图10和图11中22号F0大鼠的后代。
实施例5.使用EKI系统在H9细胞中产生TH-GFP的敲入
该实施例说明了使用EKI系统在H9人胚胎干细胞中产生了TH-GFP敲入。
人TH基因编码酪氨酸羟化酶(也称为酪氨酸3-单加氧酶或酪氨酸酶),其为一种催化氨基酸L-酪氨酸转化成L-3,4-二羟基苯丙氨酸(L-3,4-dihydroxyphenylalanine,L-DOPA)的酶。L-DOPA是多巴胺的前体。TH在中枢神经系统、外周交感神经元和肾上腺髓质中表达,并用作多巴胺能神经元标志物。
图13中示出了产生TH-GFP敲入的H9细胞系的靶向方案。靶向载体含有F2A-GFP盒上游和PGK-EM7-Neo-SV40polyA盒下游的约1kb的同源臂。sgRNA在其终止密码子附近的位置靶向TH等位基因。在成功同源重组后,将F2A-GFP盒和PGK-EM7-Neo-SV40polyA盒分别置于紧邻终止密码子之前和TH基因的3’UTR之后,以用于表达TH-GFP融合蛋白。人TH基因的sgRNA靶序列是5’-ggacgccgtgcacctagccaa tgg-3’(SEQ ID NO:44)。
构建了以下质粒:Cas9/sgRNA-TH;Cas9/sgRNA-LS14;靶向载体TV-LS1 4-TH;和pcDNA3.1Neo(+)-UL12。
使用Neon(Invitrogen)转染系统通过电穿孔将构建的质粒转染到H9细胞中。使用了2×106个H9细胞,以及各自2.5μg的Cas9/sgRNA-TH、Cas9/sgRNA-LS14、TV-LS14-TH和pcDNA3.1Neo(+)-UL12。挑选抗药性菌落并在以G418选择7至10天后进行扩增。
来自GFP的绿色荧光可以用作TH基因活性的标志物,当H9细胞分化成多巴胺能神经元时会发现其表达(参见图14)。这种H9-TH-GFP细胞系可用于支持许多领域的研究,包括来自人类胚胎干细胞的多巴胺能神经元分化。
使用表1所列的引物、表2所列的反应组分和表3所列的PCR循环条件,在三个独立细胞系中对H9细胞中TH-GFP的敲入进行基因分型。表1.用于H9-TH-GFP基因分型的引物
表2.PCR反应组分
H2O 17.75μl
KOD缓冲液(10x) 3μl
dNTP(2mM) 3μl
DMSO(0.5%) 1.5μl
MgSO4(25mM) 1.5ul
正向引物(10μM) 0.75ul
反向引物(10μM) 0.75ul
基因组DNA(100~200ng/μl) 1μl
KOD-plus 0.75μl
总量 30μl
表3.PCR循环条件
将引物TH-5’-F和TH-5’-R用于5’端PCR反应中(图15)。正向引物TH-5’F位于左同源臂的远端,而反向引物TH-5’-R位于F2A-GFP盒处。所有三种细胞系测试为敲入阳性(图16A)。
将引物TH-3’-F和TH-3’-R用于3’端PCR反应中(图15)。正向引物TH-3’-F位于PGK-EM7-Neo-SV40polyA盒处,而反向引物TH-3’-R位于右同源臂的远端。所有三种细胞系测试为敲入阳性(图16B)。
因此,5’端PCR和3’端PCR产生相同的结果,编号1号、2号和3号的细胞系都通过这两种PCR测定被测试为敲入阳性。
图17示出来自细胞系1号的PCR产物的测序结果,其证实细胞系正确地靶向TH基因座。
图18示出测试的细胞系1号具有正常的人核型。
实施例6.使用EKI系统在H9细胞中产生OCT4-EGFP敲入
该实施例证明了使用EKI系统在H9人胚胎干细胞中产生了OCT4-EGFP敲入。
由人的POU5F1基因编码的OCT4(octamer-binding transcription factor 4,八聚体结合转录因子4;也称为POU5F1:POU结构域,5类,转录因子1)是结合八聚体基序(5’-ATTTGCAT-3’)的转录因子。它在胚胎发育和干细胞自我更新以及多能性中起关键作用。OCT4在人胚胎干细胞、生殖细胞和成体干细胞中表达。该基因在成体细胞中的异常表达与肿瘤发生相关。
图19中示出了产生OCT4-EGFP敲入的H9细胞系的靶向方案。靶向载体含有位于EGFP-F2A-Puro-SV40-polyA信号序列盒侧翼的约1kb的同源臂。sgRNA在其终止密码子附近的位置靶向OCT4等位基因。在成功同源重组后,EGFP-F2A-Puro-SV40-polyA信号序列盒将被放置在紧邻OCT4基因的终止密码子之前,以用于表达OCT4-EGFP融合蛋白。人OCT4基因的sgRNA靶向序列是5’-tctcccatgcattcaaactgagg-3’(SEQ ID NO:45)。
构建了以下质粒:Cas9/sgRNA-OCT4;Cas9/sgRNA-LS14;靶向载体TV-LS14-OCT4;和pcDNA3.1Puro(+)-UL12。
使用Neon(Invitrogen)转染系统通过电穿孔将构建的质粒转染到H9细胞中。使用了2×106个H9细胞,以及各自2.5μg的Cas9/sgRNA-OCT4、Cas9/sgRNA-LS14、TV-LS14-OCT4和pcDNA3.1Puro(+)-UL12。挑选抗药性菌落并在以嘌呤霉素选择7至10天后进行扩增。
来自EGFP的绿色荧光可以用作OCT4基因活性的标志物,其被发现在多能干细胞中表达(参见图20)。这种H9-OCT4-EGFP细胞系可用于支持许多领域的研究,包括重编程和人胚胎干细胞自我更新和分化。
使用表4中所列的引物、表2中所列的反应组分和表3中所列的PCR循环条件,在15个独立细胞系中对H9细胞中OCT4-EGFP的敲入进行基因分型。
表4.用于H9-OCT4-EGFP基因分型的引物
将引物OCT4-5’-F和OCT4-5’-R用于5’端PCR反应中(图21)。正向引物OCT4-5’-F位于左侧同源臂的远端,而反向引物OCT4-5’-R位于EGFP-F2A-Puro-SV40-polyA信号序列盒处。所有15个细胞系测试为敲入阳性(图22A)。
将引物OCT4-3’-F和OCT4-3’-R用于3’端PCR反应中(图21)。正向引物OCT4-3’-F位于EGFP-F2A-Puro-SV40-polyA信号序列盒处,而反向引物OCT4-3’-R位于右侧同源臂的远端。编号为1号、2号、4号、6号、7号、10号、11号和12号的细胞系测试为敲入阳性(图22B)。
还使用引物OCT4-5’-F和OCT4-3’-R测试了全长PCR反应(图21)。编号为1号、3号、4号、5号、6号、7号、10号、11号和13号的细胞系测试为敲入阳性(图22C)。
图23示出来自细胞系6号的PCR产物的测序结果,其证实细胞系正确地靶向OCT4基因座。
图24示出测试的细胞系6号具有正常人核型。
参考文献
Iacovitti L,Wei X,Cai J,Kosmk EW,Lin R,Gorodinsky A,Roman P,Kusek G,Das SS,Dufour A,Martinez TN,Dave KD.2014.The hTH-GFP reporter rat model forthe study of Parkinson′s disease.PLoS One 9(12):e113151.[PubMed:25462571]
Hockemeyer D,Wang H,Kiani S,Lai CS,Gao Q,Cassady JP,Cost GJ,Zhang L,Santiago Y,Miller JC,Zeitler B,Cherone JM,Meng X,Hinkley SJ,Rebar EJ,GregoryPD,Urnov FD,Jaenisch R.2011.Genetic engineering of human pluripotent cellsusing TALE nucleases.Nat.Biotechnol 29(8):731-4.[PubMed:21738127]
Yu J,Vodyanik MA,Smuga-Otto K,Antosiewicz-Bourget J,Frane JL,Tian S,Nie J,Jonsdottir GA,Ruotti V,Stewart R,Slukvin II,Thomson JA.2007.Inducedpluripotent stem cell lines derived from human somatic cells.Science 318(5858):1917-20.[PubMed:18029452]
Boyer LA,Lee TI,Cole MF,Johnstone SE,Levine SS,Zucker JP,Guenther MG,Kumar RM,Murray HL,Jenner RG,Gifford DK,Melton DA,Jaenisch R,YoungRA.2005.Core transcriptional regulatory circuitry in human embryonic stemcells.Cell 122(6):947-56.[PubMed:16153702]
序列表
<110> 北京百奥赛图基因生物技术有限公司
<120> DNA敲入系统
<130> 735782000140
<150> US 62/037,551
<151> 2014-08-14
<160> 45
<170> FastSEQ for Windows Version 4.0
<210> 1
<211> 2247
<212> DNA
<213> 1型人疱疹病毒
<400> 1
tactgtcgtc ggtggcgctg cctcccgagc ttaagcctct cctggtgctg gtgtcccgcc 60
tgtgtcacac caacccgtgc gcgcggcacg cgctgtcgtg agaatcagcg ttcacccggc 120
ggcgcgctca accaccgctc cccccacgtc gtctcggaaa tggagtccac ggtaggccca 180
gcatgtccgc cgggacgcac cgtgactaag cgtccctggg ccctggccga ggacacccct 240
cgtggccccg acagcccccc caagcgcccc cgccctaaca gtcttccgct gacaaccacc 300
ttccgtcccc tgcccccccc accccagacg acatcagctg tggacccgag ctcccattcg 360
cccgttaacc ccccacgtga tcagcacgcc accgacaccg cagacgaaaa gccccgggcc 420
gcgtcgccgg cactttctga cgcctcaggg cctccgaccc cagacattcc gctatctcct 480
gggggcaccc acgcccgcga cccggacgcc gatcccgact ccccggacct tgactctatg 540
tggtcggcgt cggtgatccc caacgcgctg ccctcccata tactagccga gacgttcgag 600
cgccacctgc gcgggttgct gcgcggcgtc cgcgcccctc tggccatcgg tcccctctgg 660
gcccgcctgg attatctgtg ttccctggcc gtggtcctcg aggaggcggg tatggtggac 720
cgcggactcg gtcggcacct atggcgcctg acgcgccgcg ggcccccggc cgccgcggac 780
gccgtggcgc cccggcccct catggggttt tacgaggcgg ccacgcaaaa ccaggccgac 840
tgccagctat gggccctgct ccggcggggc ctcacgaccg catccaccct ccgctggggc 900
ccccagggtc cgtgtttctc gccccagtgg ctgaagcaca acgccagcct gcggccggat 960
gtacagtctt cggcggtgat gttcgggcgg gtgaacgagc cgacggcccg aagcctgctg 1020
tttcgctact gcgtgggccg cgcggacgac ggcggcgagg ccggcgccga cacgcggcgc 1080
tttatcttcc acgaacccag cgacctcgcc gaagagaacg tgcatacgtg tggggtcctc 1140
atggacggtc acacggggat ggtcggggcg tccctggata ttctcgtctg tcctcgggac 1200
attcacggct acctggcccc agtccccaag acccccctgg ccttttacga ggtcaaatgc 1260
cgggccaagt acgctttcga ccccatggac cccagcgacc ccacggcctc cgcgtacgag 1320
gacttgatgg cacaccggtc cccggaggcg ttccgggcat ttatccggtc gatcccgaag 1380
cccagcgtgc gatacttcgc gcccgggcgc gtccccggcc cggaggaggc tctcgtcacg 1440
caagaccagg cctggtcaga ggcccacgcc tcgggcgaaa aaaggcggtg ctccgccgcg 1500
gatcgggcct tggtggagtt aaatagcggc gttgtctcgg aggtgcttct gtttggcgcc 1560
cccgacctcg gacgccacac catctccccc gtgtcctgga gctccgggga tctggtccgc 1620
cgcgagcccg tcttcgcgaa cccccgtcac ccgaacttta agcagatctt ggtgcagggc 1680
tacgtgctcg acagccactt ccccgactgc cccccccacc cgcatctggt gacgtttatc 1740
ggcaggcacc gcaccagcgc ggaggagggc gtaacgttcc gcctggagga cggcgccggg 1800
gctctcgggg ccgcaggacc cagcaaggcg tccattctcc cgaaccaggc cgttccgatc 1860
gccctgatca ttacccccgt ccgcatcgat ccggagatct ataaggccat ccagcgaagc 1920
agccgcctgg cattcgacga cacgctcgcc gagctatggg cctctcgttc tccggggccc 1980
ggccctgctg ctgccgaaac aacgtcctca tcaccgacga cggggaggtc gtctcgctga 2040
ccgcccacga ctttgacgtc gtggatatcg agtccgaaga ggaaggtaat ttctacgtgc 2100
ccccggatat gcgcggggtt acgcgggccc cggggagaca gcgcctgcgt tcatcggacc 2160
ccccctcgcg ccacactcac cggcggaccc ccggaggcgc ctgccccgcc acccagtttc 2220
caccccccat gtccgatagc gaataaa 2247
<210> 2
<211> 626
<212> PRT
<213> 1型人疱疹病毒
<400> 2
Met Glu Ser Thr Val Gly Pro Ala Cys Pro Pro Gly Arg Thr Val Thr
1 5 10 15
Lys Arg Pro Trp Ala Leu Ala Glu Asp Thr Pro Arg Gly Pro Asp Ser
20 25 30
Pro Pro Lys Arg Pro Arg Pro Asn Ser Leu Pro Leu Thr Thr Thr Phe
35 40 45
Arg Pro Leu Pro Pro Pro Pro Gln Thr Thr Ser Ala Val Asp Pro Ser
50 55 60
Ser His Ser Pro Val Asn Pro Pro Arg Asp Gln His Ala Thr Asp Thr
65 70 75 80
Ala Asp Glu Lys Pro Arg Ala Ala Ser Pro Ala Leu Ser Asp Ala Ser
85 90 95
Gly Pro Pro Thr Pro Asp Ile Pro Leu Ser Pro Gly Gly Thr His Ala
100 105 110
Arg Asp Pro Asp Ala Asp Pro Asp Ser Pro Asp Leu Asp Ser Met Trp
115 120 125
Ser Ala Ser Val Ile Pro Asn Ala Leu Pro Ser His Ile Leu Ala Glu
130 135 140
Thr Phe Glu Arg His Leu Arg Gly Leu Leu Arg Gly Val Arg Ala Pro
145 150 155 160
Leu Ala Ile Gly Pro Leu Trp Ala Arg Leu Asp Tyr Leu Cys Ser Leu
165 170 175
Ala Val Val Leu Glu Glu Ala Gly Met Val Asp Arg Gly Leu Gly Arg
180 185 190
His Leu Trp Arg Leu Thr Arg Arg Gly Pro Pro Ala Ala Ala Asp Ala
195 200 205
Val Ala Pro Arg Pro Leu Met Gly Phe Tyr Glu Ala Ala Thr Gln Asn
210 215 220
Gln Ala Asp Cys Gln Leu Trp Ala Leu Leu Arg Arg Gly Leu Thr Thr
225 230 235 240
Ala Ser Thr Leu Arg Trp Gly Pro Gln Gly Pro Cys Phe Ser Pro Gln
245 250 255
Trp Leu Lys His Asn Ala Ser Leu Arg Pro Asp Val Gln Ser Ser Ala
260 265 270
Val Met Phe Gly Arg Val Asn Glu Pro Thr Ala Arg Ser Leu Leu Phe
275 280 285
Arg Tyr Cys Val Gly Arg Ala Asp Asp Gly Gly Glu Ala Gly Ala Asp
290 295 300
Thr Arg Arg Phe Ile Phe His Glu Pro Ser Asp Leu Ala Glu Glu Asn
305 310 315 320
Val His Thr Cys Gly Val Leu Met Asp Gly His Thr Gly Met Val Gly
325 330 335
Ala Ser Leu Asp Ile Leu Val Cys Pro Arg Asp Ile His Gly Tyr Leu
340 345 350
Ala Pro Val Pro Lys Thr Pro Leu Ala Phe Tyr Glu Val Lys Cys Arg
355 360 365
Ala Lys Tyr Ala Phe Asp Pro Met Asp Pro Ser Asp Pro Thr Ala Ser
370 375 380
Ala Tyr Glu Asp Leu Met Ala His Arg Ser Pro Glu Ala Phe Arg Ala
385 390 395 400
Phe Ile Arg Ser Ile Pro Lys Pro Ser Val Arg Tyr Phe Ala Pro Gly
405 410 415
Arg Val Pro Gly Pro Glu Glu Ala Leu Val Thr Gln Asp Gln Ala Trp
420 425 430
Ser Glu Ala His Ala Ser Gly Glu Lys Arg Arg Cys Ser Ala Ala Asp
435 440 445
Arg Ala Leu Val Glu Leu Asn Ser Gly Val Val Ser Glu Val Leu Leu
450 455 460
Phe Gly Ala Pro Asp Leu Gly Arg His Thr Ile Ser Pro Val Ser Trp
465 470 475 480
Ser Ser Gly Asp Leu Val Arg Arg Glu Pro Val Phe Ala Asn Pro Arg
485 490 495
His Pro Asn Phe Lys Gln Ile Leu Val Gln Gly Tyr Val Leu Asp Ser
500 505 510
His Phe Pro Asp Cys Pro Pro His Pro His Leu Val Thr Phe Ile Gly
515 520 525
Arg His Arg Thr Ser Ala Glu Glu Gly Val Thr Phe Arg Leu Glu Asp
530 535 540
Gly Ala Gly Ala Leu Gly Ala Ala Gly Pro Ser Lys Ala Ser Ile Leu
545 550 555 560
Pro Asn Gln Ala Val Pro Ile Ala Leu Ile Ile Thr Pro Val Arg Ile
565 570 575
Asp Pro Glu Ile Tyr Lys Ala Ile Gln Arg Ser Ser Arg Leu Ala Phe
580 585 590
Asp Asp Thr Leu Ala Glu Leu Trp Ala Ser Arg Ser Pro Gly Pro Gly
595 600 605
Pro Ala Ala Ala Glu Thr Thr Ser Ser Ser Pro Thr Thr Gly Arg Ser
610 615 620
Ser Arg
625
<210> 3
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 3
ggcagaaatg gctccgatcg agg 23
<210> 4
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 4
gggcgggatt gatagcgcgc ggg 23
<210> 5
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 5
ggcagtcggg aacatctcgt ggg 23
<210> 6
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 6
gggcgcagta attcttagag cgg 23
<210> 7
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 7
ggctaataac ttaatcgtgg agg 23
<210> 8
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 8
ggttaagcct tattggtggt cgg 23
<210> 9
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 9
ggaggcctgc ttgcaagcat tgg 23
<210> 10
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 10
ggttaggccc taagcgaata cgg 23
<210> 11
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 11
ggagccgagt tgacggttag cgg 23
<210> 12
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 12
ggggttcctt cacgagcgtc cgg 23
<210> 13
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 13
ggtacaatgt aacgttgcgc ggg 23
<210> 14
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 14
ggtattcaag tcactaatgt cgg 23
<210> 15
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 15
ggaacccctt ccgttccgtc ggg 23
<210> 16
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 16
ggtattcact cctaaagcgt cgg 23
<210> 17
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 17
gggatggaac actagactgc ggg 23
<210> 18
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 18
ggttaatccc tcatgaccgt cgg 23
<210> 19
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 19
ggagcttcag tgtcggtcgt tgg 23
<210> 20
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 20
ggttacgtgc catatacgtt cgg 23
<210> 21
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 21
cgcggcgata tcatcatcca tgg 23
<210> 22
<211> 4272
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 22
atggactata aggaccacga cggagactac aaggatcatg atattgatta caaagacgat 60
gacgataaga tggccccaaa gaagaagcgg aaggtcggta tccacggagt cccagcagcc 120
gacaagaagt acagcatcgg cctggacatc ggcaccaact ctgtgggctg ggccgtgatc 180
accgacgagt acaaggtgcc cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac 240
agcatcaaga agaacctgat cggagccctg ctgttcgaca gcggcgaaac agccgaggcc 300
acccggctga agagaaccgc cagaagaaga tacaccagac ggaagaaccg gatctgctat 360
ctgcaagaga tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccacagactg 420
gaagagtcct tcctggtgga agaggataag aagcacgagc ggcaccccat cttcggcaac 480
atcgtggacg aggtggccta ccacgagaag taccccacca tctaccacct gagaaagaaa 540
ctggtggaca gcaccgacaa ggccgacctg cggctgatct atctggccct ggcccacatg 600
atcaagttcc ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg 660
gacaagctgt tcatccagct ggtgcagacc tacaaccagc tgttcgagga aaaccccatc 720
aacgccagcg gcgtggacgc caaggccatc ctgtctgcca gactgagcaa gagcagacgg 780
ctggaaaatc tgatcgccca gctgcccggc gagaagaaga atggcctgtt cggaaacctg 840
attgccctga gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggat 900
gccaaactgc agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag 960
atcggcgacc agtacgccga cctgtttctg gccgccaaga acctgtccga cgccatcctg 1020
ctgagcgaca tcctgagagt gaacaccgag atcaccaagg cccccctgag cgcctctatg 1080
atcaagagat acgacgagca ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag 1140
cagctgcctg agaagtacaa agagattttc ttcgaccaga gcaagaacgg ctacgccggc 1200
tacattgacg gcggagccag ccaggaagag ttctacaagt tcatcaagcc catcctggaa 1260
aagatggacg gcaccgagga actgctcgtg aagctgaaca gagaggacct gctgcggaag 1320
cagcggacct tcgacaacgg cagcatcccc caccagatcc acctgggaga gctgcacgcc 1380
attctgcggc ggcaggaaga tttttaccca ttcctgaagg acaaccggga aaagatcgag 1440
aagatcctga ccttccgcat cccctactac gtgggccctc tggccagggg aaacagcaga 1500
ttcgcctgga tgaccagaaa gagcgaggaa accatcaccc cctggaactt cgaggaagtg 1560
gtggacaagg gcgcttccgc ccagagcttc atcgagcgga tgaccaactt cgataagaac 1620
ctgcccaacg agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtat 1680
aacgagctga ccaaagtgaa atacgtgacc gagggaatga gaaagcccgc cttcctgagc 1740
ggcgagcaga aaaaggccat cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg 1800
aagcagctga aagaggacta cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc 1860
ggcgtggaag atcggttcaa cgcctccctg ggcacatacc acgatctgct gaaaattatc 1920
aaggacaagg acttcctgga caatgaggaa aacgaggaca ttctggaaga tatcgtgctg 1980
accctgacac tgtttgagga cagagagatg atcgaggaac ggctgaaaac ctatgcccac 2040
ctgttcgacg acaaagtgat gaagcagctg aagcggcgga gatacaccgg ctggggcagg 2100
ctgagccgga agctgatcaa cggcatccgg gacaagcagt ccggcaagac aatcctggat 2160
ttcctgaagt ccgacggctt cgccaacaga aacttcatgc agctgatcca cgacgacagc 2220
ctgaccttta aagaggacat ccagaaagcc caggtgtccg gccagggcga tagcctgcac 2280
gagcacattg ccaatctggc cggcagcccc gccattaaga agggcatcct gcagacagtg 2340
aaggtggtgg acgagctcgt gaaagtgatg ggccggcaca agcccgagaa catcgtgatc 2400
gaaatggcca gagagaacca gaccacccag aagggacaga agaacagccg cgagagaatg 2460
aagcggatcg aagagggcat caaagagctg ggcagccaga tcctgaaaga acaccccgtg 2520
gaaaacaccc agctgcagaa cgagaagctg tacctgtact acctgcagaa tgggcgggat 2580
atgtacgtgg accaggaact ggacatcaac cggctgtccg actacgatgt ggaccatatc 2640
gtgcctcaga gctttctgaa ggacgactcc atcgacaaca aggtgctgac cagaagcgac 2700
aagaaccggg gcaagagcga caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac 2760
tactggcggc agctgctgaa cgccaagctg attacccaga gaaagttcga caatctgacc 2820
aaggccgaga gaggcggcct gagcgaactg gataaggccg gcttcatcaa gagacagctg 2880
gtggaaaccc ggcagatcac aaagcacgtg gcacagatcc tggactcccg gatgaacact 2940
aagtacgacg agaatgacaa gctgatccgg gaagtgaaag tgatcaccct gaagtccaag 3000
ctggtgtccg atttccggaa ggatttccag ttttacaaag tgcgcgagat caacaactac 3060
caccacgccc acgacgccta cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac 3120
cctaagctgg aaagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg 3180
atcgccaaga gcgagcagga aatcggcaag gctaccgcca agtacttctt ctacagcaac 3240
atcatgaact ttttcaagac cgagattacc ctggccaacg gcgagatccg gaagcggcct 3300
ctgatcgaga caaacggcga aaccggggag atcgtgtggg ataagggccg ggattttgcc 3360
accgtgcgga aagtgctgag catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag 3420
acaggcggct tcagcaaaga gtctatcctg cccaagagga acagcgataa gctgatcgcc 3480
agaaagaagg actgggaccc taagaagtac ggcggcttcg acagccccac cgtggcctat 3540
tctgtgctgg tggtggccaa agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa 3600
gagctgctgg ggatcaccat catggaaaga agcagcttcg agaagaatcc catcgacttt 3660
ctggaagcca agggctacaa agaagtgaaa aaggacctga tcatcaagct gcctaagtac 3720
tccctgttcg agctggaaaa cggccggaag agaatgctgg cctctgccgg cgaactgcag 3780
aagggaaacg aactggccct gccctccaaa tatgtgaact tcctgtacct ggccagccac 3840
tatgagaagc tgaagggctc ccccgaggat aatgagcaga aacagctgtt tgtggaacag 3900
cacaagcact acctggacga gatcatcgag cagatcagcg agttctccaa gagagtgatc 3960
ctggccgacg ctaatctgga caaagtgctg tccgcctaca acaagcaccg ggataagccc 4020
atcagagagc aggccgagaa tatcatccac ctgtttaccc tgaccaatct gggagcccct 4080
gccgccttca agtactttga caccaccatc gaccggaaga ggtacaccag caccaaagag 4140
gtgctggacg ccaccctgat ccaccagagc atcaccggcc tgtacgagac acggatcgac 4200
ctgtctcagc tgggaggcga caaaaggccg gcggccacga aaaaggccgg ccaggcaaaa 4260
aagaaaaagt aa 4272
<210> 23
<211> 1968
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 23
atgccaaaga agaagcggaa ggtcgagtcc acgggaggcc cagcatgtcc gccgggacgc 60
accgtgacta agcgttcctg ggccctggcc gaggacaccc ctcgtggccc cgacagcccc 120
cccaagcgcc cccgccctaa cagtcttccg ctgacaacca ccttccgtcc cctgcccccc 180
ccaccccaga cgacgtcagc tgtggaccca agctcccatt cgcccgataa ccccccacgt 240
gatcagcacg ccaccgacac cgcagacgaa aagccccggg ccgcgtcgcc ggcactttct 300
gacgcctcag ggcctccgac cccagacatt ccgctatctc ctgggggcac ccacgcccgc 360
gacccggacg ccgatcccga ctccccggac cttgactcta tgtggtcggc gtcggtgatc 420
cccaacgcgc tgccctccca tatactagcc gagacgttcg agcgccacct gcgcgggttg 480
ctgcgcggcg tccgcgcccc cctggccatc ggtcccctct gggcccgcct ggattatctg 540
tgttccctgg ccgtggtcct cgaggaggcg ggtatggtgg accgcggact cggccggcac 600
ctatggcgcc tgacgcgccg cgggcccccg gccgccgcgg acgccgtggc gccccggccc 660
ctcatggggt tttacgaggc ggccacgcaa aaccaggccg actgccagct atgggccctg 720
ctccggcggg gcctcacgac cgcatccacc ctccgctggg gcccccaggg tccgtgtttc 780
tcgccccagt ggctgaagca caacgccagc ctgcggccgg atgtacagtc ttcggcggtg 840
atgttcgggc gggtgaacga gccgacggcc cgaagcctgc tgtttcgcta ctgcgtgggc 900
cgcgcggacg acggcggcga ggccggcgcc gacacgcggc gctttatctt ccacgaaccc 960
ggcgacctcg ccgaagagaa cgtgcatacg tgtggggtcc tcatggacgg tcacacgggg 1020
atggtcgggg cgtccctgga tattctcgtc tgtcctcggg acactcacgg ctacctggcc 1080
ccagtcccca agacccccct ggccttttac gaggtcaaat gccgggccaa gtacgctttc 1140
gaccccatgg accccagcga ccccacggcc tccgcgtacg aggacttgat ggcacaccgg 1200
tccccggagg cgttccgggc atttatccgg tcgatcccga agcccagcgt gcgatacttc 1260
gcgcccgggc gcgtccccgg cccggaggag gctctcgtca cgcaagacca ggcctggtca 1320
gaggcccacg cctcgggcga aaaaaggcgg tgctccgccg cggatcgggc cttggtggag 1380
ttaaatagcg gcgttgtctc ggaggtgctt ctgtttggcg cccccgacct cggacgccaa 1440
accatctccc ccgtgtcctg gagctccggg gatctggtcc gccgcgagcc cgtcttcgcg 1500
aacccccgtc acccgaactt taagcagatc ttggtgcagg gctacgtgct cgacagccac 1560
ttccccgact gcccccccca cccgcatctg gtgacgttta tcggcaggca ccgcaccagc 1620
gcggaggagg gcgtaacgtt ccgcctggag gacggcgccg gggctctcgg ggccgcagga 1680
cccagcaagg cgtccattct cccgaaccag gccgttccga tcgccctgat cattaccccc 1740
gtccgcatcg atccggagat ctataaggcc atccagcgaa gcagccgcct ggcgttcgac 1800
gacacgctcg ccgagctatg ggcctctcgt tctccggggc ccggccctgc tgctgccgaa 1860
acaacgtcct catcaccgac gacggggagg tcgtctcgcg actataagga ccacgacgga 1920
gactacaagg atcatgatat tgattacaaa gacgatgacg ataagtga 1968
<210> 24
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 24
gctgtctccg ccgcccgcca tgg 23
<210> 25
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 25
gggggtcgcg gtcgccatgg cgg 23
<210> 26
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 26
gaaaagccac aatctcatat gagg 24
<210> 27
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 27
ggtattcact cctaaagcgt cgg 23
<210> 28
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 28
ccgacgcttt aggagtgaat acc 23
<210> 29
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 29
ccgacgcttt aggagtgaat acc 23
<210> 30
<211> 341
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<220>
<221> misc_feature
<222> 250, 251, 252, 253, 254, 255, 256, 257, 258, 259
<223> n = A,T,C or G
<400> 30
gagggcctat ttcccatgat tccttcatat ttgcatatac gatacaaggc tgttagagag 60
ataattggaa ttaatttgac tgtaaacaca aagatattag tacaaaatac gtgacgtaga 120
aagtaataat ttcttgggta gtttgcagtt ttaaaattat gttttaaaat ggactatcat 180
atgcttaccg taacttgaaa gtatttcgat ttcttggctt tatatatctt gtggaaagga 240
cgaaacaccn nnnnnnnnng ttttagagct agaaatagca agttaaaata aggctagtcc 300
gttatcaact tgaaaaagtg gcaccgagtc ggtgcttttt t 341
<210> 31
<211> 109
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<220>
<221> misc_feature
<222> 20, 21, 22, 23, 24, 25, 26, 27, 28, 29
<223> n = A,T,C or G
<400> 31
taatacgact cactataggn nnnnnnnnng ttttagagct agaaatagca agttaaaata 60
aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgctttt 109
<210> 32
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 32
agtggagtca gtgatgccat tggcctc 27
<210> 33
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 33
gcctttggtg ctcttcatct tgttgg 26
<210> 34
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 34
tacccgtgat attgctgaag agcttg 26
<210> 35
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 35
tttggtagtg ggcaccagct atctg 25
<210> 36
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 36
ggtattcagc caaacgacca tctgccg 27
<210> 37
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 37
agtcgtgctg cttcatgtgg tcg 23
<210> 38
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 38
tgacacgtgc tacgagattt cgattc 26
<210> 39
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 39
acaggcttca cctgtactgt cagggca 27
<210> 40
<211> 46
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 40
cagacgtacc agtcagtcta cttcgtgtct gagagcttca gtgacg 46
<210> 41
<211> 46
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 41
ctcctctcaa ggaggcaccc atgtcctctc cagctgccgg gcctca 46
<210> 42
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 42
gatacccggg gaccttccct ttcttggcct aatttccatt gcttc 45
<210> 43
<211> 46
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 43
gtgggttaag cggtttgatt cacactgaac caggccagcc cagttg 46
<210> 44
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 44
ggacgccgtg cacctagcca atgg 24
<210> 45
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 45
tctcccatgc attcaaactg agg 23

Claims (44)

1.在真核细胞中染色体上的预定插入位点处插入供体序列的方法,其包括:
a)将在所述插入位点切割所述染色体的序列特异性核酸酶引入所述细胞;
b)将供体构建体引入所述细胞;以及
c)将外切核酸酶引入所述细胞;
其中所述供体构建体是线性核酸或者其在所述细胞内被切割以产生线性核酸,
其中所述线性核酸包含5’同源臂、所述供体序列和3’同源臂,其中所述5’同源臂与所述染色体上的核酸酶切割位点上游的序列同源,并且其中所述3’同源臂与所述染色体上的核酸酶切割位点下游的序列同源;
其中所述5’同源臂和所述3’同源臂分别邻近所述线性核酸的5’和3’末端,并且
其中所述供体序列通过同源重组在所述插入位点处插入所述染色体。
2.权利要求1所述的方法,其中所述序列特异性核酸酶是锌指核酸酶(ZFN)。
3.权利要求1所述的方法,其中所述序列特异性核酸酶是转录激活因子样效应物核酸酶(TALEN)。
4.权利要求1所述的方法,其中所述序列特异性核酸酶是RNA引导性核酸酶。
5.权利要求4所述的方法,其中所述RNA引导性核酸酶是Cas。
6.权利要求5所述的方法,其中所述RNA引导性核酸酶是Cas9。
7.权利要求4至6中任一项所述的方法,其还包括将识别所述插入位点的向导RNA(gRNA)引入所述细胞。
8.权利要求1至7中任一项所述的方法,其中所述序列特异性核酸酶作为蛋白质、mRNA或cDNA引入所述细胞。
9.权利要求1至8中任一项所述的方法,其中所述5’同源臂和所述插入位点5’侧的序列之间的序列同源性为至少约80%。
10.权利要求1至9中任一项所述的方法,其中所述3’同源臂和所述插入位点3’侧的序列之间的序列同源性为至少约80%。
11.权利要求1至10中任一项所述的方法,其中所述5’同源臂和所述3’同源臂为至少约200bp。
12.权利要求1至11中任一项所述的方法,其中所述外切核酸酶是5’至3’外切核酸酶。
13.权利要求12所述的方法,其中所述外切核酸酶是1型单纯疱疹病毒(HSV-1)外切核酸酶。
14.权利要求13所述的方法,其中所述外切核酸酶是UL12。
15.权利要求1至14中任一项所述的方法,其中所述供体构建体是线性核酸。
16.权利要求1至14中任一项所述的方法,其中所述供体构建体在引入所述细胞时是环状的,并且在所述细胞内被切割以产生线性核酸。
17.权利要求16所述的方法,其中所述供体构建体还包含所述5’同源臂上游的5’侧翼序列和所述3’同源臂下游的3’侧翼序列。
18.权利要求17所述的方法,其中所述5’侧翼序列或所述3’侧翼序列为约1至约500bp。
19.权利要求17或18所述的方法,其中所述方法还包括将第二序列特异性核酸酶引入所述细胞,所述第二序列特异性核酸酶在所述侧翼序列之一或两者处切割所述供体构建体,从而产生所述线性核酸。
20.权利要求17或18所述的方法,其中所述序列特异性核酸酶是RNA引导性核酸酶,并且其中所述方法还包括将识别所述侧翼序列之一或两者的第二向导RNA引入所述细胞。
21.权利要求1至20中任一项所述的方法,其中所述真核细胞是哺乳动物细胞。
22.权利要求21所述的方法,其中所述哺乳动物细胞是合子或多能干细胞。
23.产生经遗传修饰的动物的方法,所述动物包含插入所述动物染色体上预定插入位点处的供体序列,所述方法包括:
a)将在所述插入位点处切割所述染色体的序列特异性核酸酶引入细胞;
b)将供体构建体引入所述细胞;
c)将核酸外切酶引入所述细胞;以及
d)将所述细胞引入载体动物以产生所述经遗传修饰的动物;
其中所述供体构建体是线性核酸或者其在所述细胞内被切割以产生线性核酸,
其中所述线性核酸包含5’同源臂、所述供体序列和3’同源臂,其中所述5’同源臂与所述染色体上的核酸酶切割位点上游的序列同源,并且其中所述3’同源臂与所述染色体上的核酸酶切割位点下游的序列同源;
其中所述5’同源臂和所述3’同源臂分别邻近所述线性核酸的5’和3’末端,并且
其中所述供体序列通过同源重组在所述插入位点处插入所述染色体。
24.权利要求23所述的方法,其中所述经遗传修饰的动物是啮齿动物。
25.权利要求23或24所述的方法,其中所述细胞是合子或多能干细胞。
26.通过权利要求23至25中任一项所述的方法产生的经遗传修饰的动物。
27.用于在真核细胞中染色体上的插入位点处插入供体序列的试剂盒,其包含:
a)在所述插入位点处切割所述染色体的序列特异性核酸酶;
b)供体构建体;和
c)核酸外切酶;
其中所述供体构建体是线性核酸或者其可以在所述细胞内被切割以产生线性核酸,
其中所述线性核酸包含5’同源臂、所述供体序列和3’同源臂,其中所述5’同源臂与所述染色体上的核酸酶切割位点上游的序列同源,并且其中所述3’同源臂与所述染色体上的核酸酶切割位点下游的序列同源;并且
其中所述5’同源臂和所述3’同源臂分别邻近所述线性核酸的5’和3’末端。
28.权利要求27所述的试剂盒,其中所述序列特异性核酸酶是RNA引导性核酸酶。
29.权利要求28所述的试剂盒,其中所述试剂盒还包含识别所述插入位点的向导RNA(gRNA)。
30.权利要求27至29中任一项所述的试剂盒,其中所述供体构建体是环状的。
31.权利要求30所述的试剂盒,其中所述供体构建体还包含所述5’同源臂上游的5’侧翼序列和所述3’同源臂下游的3’侧翼序列。
32.权利要求31所述的试剂盒,其中所述5’侧翼序列或所述3’侧翼序列为约1至约500bp。
33.权利要求31至32所述的试剂盒,其中所述序列特异性核酸酶是RNA引导性核酸酶,并且其中所述试剂盒还包含识别所述侧翼序列之一或两者的第二向导RNA。
34.权利要求27至33中任一项所述的试剂盒,其中所述外切核酸酶是5’至3’外切核酸酶。
35.权利要求34所述的试剂盒,其中所述外切核酸酶是1型单纯疱疹病毒(HSV-1)外切核酸酶。
36.权利要求35所述的试剂盒,其中所述外切核酸酶是UL12。
37.权利要求36所述的试剂盒,其中所述UL12与核定位序列融合。
38.在真核细胞中产生线性核酸的方法,
其中所述线性核酸包含5’同源臂、供体序列和3’同源臂,
其中所述5’同源臂与所述染色体上的核酸酶切割位点上游的序列同源,并且其中所述3’同源臂与所述染色体上的核酸酶切割位点下游的序列同源,并且
其中所述5’同源臂和所述3’同源臂分别邻近所述线性核酸的5’和3’末端,所述方法包括:
a)将包含所述线性核酸并且还包含所述5’同源臂上游的5’侧翼序列和所述3’同源臂下游的3’侧翼序列的环状供体构建体引入所述细胞;和
b)将序列特异性核酸酶引入所述细胞,其中所述序列特异性核酸酶在所述5’侧翼序列和所述3’侧翼序列处切割所述环状供体构建体,从而产生所述线性核酸。
39.权利要求38所述的方法,其中所述序列特异性核酸酶是ZFN。
40.权利要求38所述的方法,其中所述序列特异性核酸酶是TALEN。
41.权利要求38所述的方法,其中所述序列特异性核酸酶是RNA引导性核酸酶。
42.权利要求41所述的方法,其中所述RNA引导性核酸酶是Cas。
43.权利要求42所述的方法,其中所述RNA引导性核酸酶是Cas9。
44.权利要求41至43中任一项所述的方法,其还包括将识别所述5’侧翼序列和/或3’侧翼序列的向导RNA引入所述细胞。
CN201580041157.1A 2014-08-14 2015-08-13 Dna敲入系统 Pending CN107429241A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201462037551P 2014-08-14 2014-08-14
US62/037,551 2014-08-14
PCT/US2015/045134 WO2016025759A1 (en) 2014-08-14 2015-08-13 Dna knock-in system

Publications (1)

Publication Number Publication Date
CN107429241A true CN107429241A (zh) 2017-12-01

Family

ID=55304644

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580041157.1A Pending CN107429241A (zh) 2014-08-14 2015-08-13 Dna敲入系统

Country Status (3)

Country Link
US (2) US11071289B2 (zh)
CN (1) CN107429241A (zh)
WO (1) WO2016025759A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108559730A (zh) * 2018-01-12 2018-09-21 中国人民解放军第四军医大学 利用CRISPR/Cas9技术构建Hutat2:Fc基因敲入单核细胞的实验方法
CN110358792A (zh) * 2019-07-19 2019-10-22 华中农业大学 外源基因定点整合至actb基因下游的打靶载体构建方法及其应用
CN112779259A (zh) * 2021-03-18 2021-05-11 新疆畜牧科学院生物技术研究所(新疆畜牧科学院中国-澳大利亚绵羊育种研究中心) 一种用于精准编辑绵羊OCT4基因的sgRNA、扩增用引物和应用
CN114107385A (zh) * 2019-01-17 2022-03-01 百奥赛图(北京)医药科技股份有限公司 人源化转基因动物
WO2023046038A1 (en) * 2021-09-24 2023-03-30 Immunocan Biotech Co. Ltd. Methods for large-size chromosomal transfer and modified chromosomes and organisims using same

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3613852A3 (en) 2011-07-22 2020-04-22 President and Fellows of Harvard College Evaluation and improvement of nuclease cleavage specificity
US9163284B2 (en) 2013-08-09 2015-10-20 President And Fellows Of Harvard College Methods for identifying a target site of a Cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9737604B2 (en) 2013-09-06 2017-08-22 President And Fellows Of Harvard College Use of cationic lipids to deliver CAS9
US9322037B2 (en) 2013-09-06 2016-04-26 President And Fellows Of Harvard College Cas9-FokI fusion proteins and uses thereof
US9228207B2 (en) 2013-09-06 2016-01-05 President And Fellows Of Harvard College Switchable gRNAs comprising aptamers
US20150166982A1 (en) 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting pi3k point mutations
PT3155099T (pt) 2014-06-23 2018-04-20 Regeneron Pharma Montagem de dna mediada por nuclease
US10077453B2 (en) 2014-07-30 2018-09-18 President And Fellows Of Harvard College CAS9 proteins including ligand-dependent inteins
WO2016025759A1 (en) 2014-08-14 2016-02-18 Shen Yuelei Dna knock-in system
US11680268B2 (en) 2014-11-07 2023-06-20 Editas Medicine, Inc. Methods for improving CRISPR/Cas-mediated genome-editing
AU2016326711B2 (en) 2015-09-24 2022-11-03 Editas Medicine, Inc. Use of exonucleases to improve CRISPR/Cas-mediated genome editing
IL294014B1 (en) 2015-10-23 2024-03-01 Harvard College Nucleobase editors and their uses
EP3433363A1 (en) 2016-03-25 2019-01-30 Editas Medicine, Inc. Genome editing systems comprising repair-modulating enzyme molecules and methods of their use
US11236313B2 (en) 2016-04-13 2022-02-01 Editas Medicine, Inc. Cas9 fusion molecules, gene editing systems, and methods of use thereof
DK3476865T3 (da) * 2016-06-28 2023-12-18 Biocytogen Pharmaceuticals Beijing Co Ltd Fremgangsmåde til konstruktion af pd-1-gen-modificeret humaniseret dyremodel og anvendelse deraf
AU2017306676B2 (en) 2016-08-03 2024-02-22 President And Fellows Of Harvard College Adenosine nucleobase editors and uses thereof
CA3033327A1 (en) 2016-08-09 2018-02-15 President And Fellows Of Harvard College Programmable cas9-recombinase fusion proteins and uses thereof
WO2018039438A1 (en) 2016-08-24 2018-03-01 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
CN107815468B (zh) 2016-08-31 2021-03-16 百奥赛图(北京)医药科技股份有限公司 人源化基因改造动物模型的制备方法及应用
CN110214180A (zh) 2016-10-14 2019-09-06 哈佛大学的校长及成员们 核碱基编辑器的aav递送
WO2018119359A1 (en) 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
US11898179B2 (en) 2017-03-09 2024-02-13 President And Fellows Of Harvard College Suppression of pain by gene editing
JP2020510439A (ja) 2017-03-10 2020-04-09 プレジデント アンド フェローズ オブ ハーバード カレッジ シトシンからグアニンへの塩基編集因子
KR20190130613A (ko) 2017-03-23 2019-11-22 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵산 프로그램가능한 dna 결합 단백질을 포함하는 핵염기 편집제
WO2018209320A1 (en) 2017-05-12 2018-11-15 President And Fellows Of Harvard College Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation
CN111094573A (zh) * 2017-07-12 2020-05-01 梅约医学教育与研究基金会 有效靶向敲入或基因置换的材料和方法
WO2019014564A1 (en) 2017-07-14 2019-01-17 Editas Medicine, Inc. SYSTEMS AND METHODS OF TARGETED INTEGRATION AND GENOME EDITING AND DETECTION THEREOF WITH INTEGRATED PRIMING SITES
WO2019023680A1 (en) 2017-07-28 2019-01-31 President And Fellows Of Harvard College METHODS AND COMPOSITIONS FOR EVOLUTION OF BASIC EDITORS USING PHAGE-ASSISTED CONTINUOUS EVOLUTION (PACE)
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
WO2019072241A1 (en) 2017-10-13 2019-04-18 Beijing Biocytogen Co., Ltd NON-HUMAN ANIMAL GENETICALLY MODIFIED WITH PD-1 HUMAN OR CHIMERIC
US11795443B2 (en) 2017-10-16 2023-10-24 The Broad Institute, Inc. Uses of adenosine base editors
JP7084021B2 (ja) * 2018-01-24 2022-06-14 公立大学法人大阪 ターゲティングベクター
CN108103108A (zh) * 2018-01-30 2018-06-01 上海交通大学医学院附属瑞金医院 Cebpa基因缺失斑马鱼突变体的制备及其应用
US20190284288A1 (en) 2018-03-19 2019-09-19 The Regents Of The University Of Michigan Compositions and methods for t-cell and cytokine activation
EP3790594A4 (en) * 2018-05-07 2022-02-23 Pioneer Hi-Bred International, Inc. METHODS AND COMPOSITIONS FOR THE HOMOLOGY-DIRECTED REPAIR OF CAS ENDONUCLEASE-MEDIATED DOUBLE STRAND BREAKS
WO2020003311A1 (en) * 2018-06-25 2020-01-02 Yeda Research And Development Co. Ltd. Systems and methods for increasing efficiency of genome editing
US11760786B2 (en) 2019-02-06 2023-09-19 The Regents Of The University Of Michigan Chimeric antigen receptors targeting abnormal glycobiology
AU2020232850A1 (en) 2019-03-07 2021-10-07 The Trustees Of Columbia University In The City Of New York RNA-guided DNA integration using Tn7-like transposons
EP3942040A1 (en) 2019-03-19 2022-01-26 The Broad Institute, Inc. Methods and compositions for editing nucleotide sequences
CN113795588A (zh) 2019-04-04 2021-12-14 瑞泽恩制药公司 用于在靶向性载体中无瘢痕引入靶向修饰的方法
CA3138663A1 (en) 2019-06-25 2020-12-30 Inari Agriculture Technology, Inc. Improved homology dependent repair genome editing
MX2022014008A (es) 2020-05-08 2023-02-09 Broad Inst Inc Métodos y composiciones para la edición simultánea de ambas cadenas de una secuencia de nucleótidos de doble cadena objetivo.
WO2022101286A1 (en) * 2020-11-11 2022-05-19 Leibniz-Institut Für Pflanzenbiochemie Fusion protein for editing endogenous dna of a eukaryotic cell

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101273141A (zh) * 2005-07-26 2008-09-24 桑格摩生物科学股份有限公司 外源核酸序列的靶向整合和表达
CN102625655A (zh) * 2008-12-04 2012-08-01 桑格摩生物科学股份有限公司 使用锌指核酸酶在大鼠中进行基因组编辑
WO2013126794A1 (en) * 2012-02-24 2013-08-29 Fred Hutchinson Cancer Research Center Compositions and methods for the treatment of hemoglobinopathies

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5436150A (en) 1992-04-03 1995-07-25 The Johns Hopkins University Functional domains in flavobacterium okeanokoities (foki) restriction endonuclease
EP0682699B1 (en) 1993-02-12 2003-05-07 The Johns-Hopkins University FUNCTIONAL DOMAINS IN $i(FLAVOBACTERIUM OKEANOKOITES) (FOKI) RESTRICTION ENDONUCLEASE
US6534261B1 (en) 1999-01-12 2003-03-18 Sangamo Biosciences, Inc. Regulation of endogenous gene expression in cells using zinc finger proteins
US10066233B2 (en) 2005-08-26 2018-09-04 Dupont Nutrition Biosciences Aps Method of modulating cell resistance
EP2281050B1 (en) * 2008-04-14 2014-04-02 Sangamo BioSciences, Inc. Linear donor constructs for targeted integration
US8546553B2 (en) 2008-07-25 2013-10-01 University Of Georgia Research Foundation, Inc. Prokaryotic RNAi-like system and methods of use
US20100076057A1 (en) 2008-09-23 2010-03-25 Northwestern University TARGET DNA INTERFERENCE WITH crRNA
WO2010054108A2 (en) 2008-11-06 2010-05-14 University Of Georgia Research Foundation, Inc. Cas6 polypeptides and methods of use
WO2010075424A2 (en) 2008-12-22 2010-07-01 The Regents Of University Of California Compositions and methods for downregulating prokaryotic genes
WO2011072246A2 (en) 2009-12-10 2011-06-16 Regents Of The University Of Minnesota Tal effector-mediated dna modification
CA2828303C (en) * 2011-02-28 2020-04-07 Seattle Children's Research Institute Coupling endonucleases with end-processing enzymes drive high efficiency gene disruption
US20130006472A1 (en) 2011-06-30 2013-01-03 Continental Automotive System, Inc. Electronic path entering for autonomous or semi-autonomous trailer backing
WO2013141680A1 (en) 2012-03-20 2013-09-26 Vilnius University RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX
US9637739B2 (en) 2012-03-20 2017-05-02 Vilnius University RNA-directed DNA cleavage by the Cas9-crRNA complex
WO2013163628A2 (en) 2012-04-27 2013-10-31 Duke University Genetic correction of mutated genes
CN104471067B (zh) * 2012-05-07 2020-08-14 桑格摩生物治疗股份有限公司 用于核酸酶介导的转基因靶向整合的方法和组合物
PT2800811T (pt) 2012-05-25 2017-08-17 Univ California Métodos e composições para modificação de adn alvo dirigida por arn e para modulação dirigida por arn de transcrição
KR20150027756A (ko) 2012-05-30 2015-03-12 베일러 칼리지 오브 메디신 Dna 수복, 변경 및 대체를 위한 도구로서의 초나선 미니벡터
WO2013188037A2 (en) 2012-06-11 2013-12-19 Agilent Technologies, Inc Method of adaptor-dimer subtraction using a crispr cas6 protein
WO2013188522A2 (en) 2012-06-12 2013-12-19 Genentech, Inc. Methods and compositions for generating conditional knock-out alleles
WO2013188638A2 (en) 2012-06-15 2013-12-19 The Regents Of The University Of California Endoribonucleases and methods of use thereof
CA2877290A1 (en) 2012-06-19 2013-12-27 Daniel F. Voytas Gene targeting in plants using dna viruses
EP3494997B1 (en) 2012-07-25 2019-09-18 The Broad Institute, Inc. Inducible dna binding proteins and genome perturbation tools and applications thereof
WO2014022702A2 (en) 2012-08-03 2014-02-06 The Regents Of The University Of California Methods and compositions for controlling gene expression by rna processing
UA119135C2 (uk) 2012-09-07 2019-05-10 ДАУ АГРОСАЙЄНСІЗ ЕлЕлСі Спосіб отримання трансгенної рослини
CN103668470B (zh) 2012-09-12 2015-07-29 上海斯丹赛生物技术有限公司 一种dna文库及构建转录激活子样效应因子核酸酶质粒的方法
EA201590488A1 (ru) * 2012-10-12 2015-09-30 Гликоваксин Аг Способы модификации клеток-хозяев
CN110643600A (zh) 2012-10-23 2020-01-03 基因工具股份有限公司 用于切割靶dna的系统及其用途
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
MX2015007550A (es) 2012-12-12 2017-02-02 Broad Inst Inc Suministro, modificación y optimización de sistemas, métodos y composiciones para la manipulación de secuencias y aplicaciones terapéuticas.
CN103388006B (zh) 2013-07-26 2015-10-28 华东师范大学 一种基因定点突变的构建方法
CN103725710B (zh) 2013-12-25 2015-10-28 北京济福霖生物技术有限公司 一种可自我删除游离载体及其应用
US9522936B2 (en) * 2014-04-24 2016-12-20 Sangamo Biosciences, Inc. Engineered transcription activator like effector (TALE) proteins
US20160053272A1 (en) * 2014-07-18 2016-02-25 Whitehead Institute For Biomedical Research Methods Of Modifying A Sequence Using CRISPR
WO2016025759A1 (en) 2014-08-14 2016-02-18 Shen Yuelei Dna knock-in system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101273141A (zh) * 2005-07-26 2008-09-24 桑格摩生物科学股份有限公司 外源核酸序列的靶向整合和表达
CN102625655A (zh) * 2008-12-04 2012-08-01 桑格摩生物科学股份有限公司 使用锌指核酸酶在大鼠中进行基因组编辑
WO2013126794A1 (en) * 2012-02-24 2013-08-29 Fred Hutchinson Cancer Research Center Compositions and methods for the treatment of hemoglobinopathies

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108559730A (zh) * 2018-01-12 2018-09-21 中国人民解放军第四军医大学 利用CRISPR/Cas9技术构建Hutat2:Fc基因敲入单核细胞的实验方法
CN108559730B (zh) * 2018-01-12 2021-09-24 中国人民解放军第四军医大学 利用CRISPR/Cas9技术构建Hutat2:Fc基因敲入单核细胞的实验方法
CN114107385A (zh) * 2019-01-17 2022-03-01 百奥赛图(北京)医药科技股份有限公司 人源化转基因动物
CN110358792A (zh) * 2019-07-19 2019-10-22 华中农业大学 外源基因定点整合至actb基因下游的打靶载体构建方法及其应用
CN112779259A (zh) * 2021-03-18 2021-05-11 新疆畜牧科学院生物技术研究所(新疆畜牧科学院中国-澳大利亚绵羊育种研究中心) 一种用于精准编辑绵羊OCT4基因的sgRNA、扩增用引物和应用
CN112779259B (zh) * 2021-03-18 2023-05-26 新疆畜牧科学院生物技术研究所(新疆畜牧科学院中国-澳大利亚绵羊育种研究中心) 一种用于精准编辑绵羊OCT4基因的sgRNA、扩增用引物和应用
WO2023046038A1 (en) * 2021-09-24 2023-03-30 Immunocan Biotech Co. Ltd. Methods for large-size chromosomal transfer and modified chromosomes and organisims using same

Also Published As

Publication number Publication date
US10314297B2 (en) 2019-06-11
US11071289B2 (en) 2021-07-27
US20170273284A1 (en) 2017-09-28
US20180049412A1 (en) 2018-02-22
WO2016025759A1 (en) 2016-02-18

Similar Documents

Publication Publication Date Title
CN107429241A (zh) Dna敲入系统
RU2704283C9 (ru) Способы и композиции для модификации целевого локуса
JP7095066B2 (ja) 単一ステップの複数標的化を通じた標的化された遺伝子修飾のための方法及び組成物
US20180064073A1 (en) Method for Transferring Cas9 mRNA Into Mammalian Fertilized Egg by Electroporation
CN116064529A (zh) 使用可编程dna结合蛋白增强靶向基因组修饰
CN108291218A (zh) 核酸酶非依赖性靶向基因编辑平台及其用途
US20200255867A1 (en) Double selection hdr crispr-based editing
WO2021032759A1 (en) Coiled-coil mediated tethering of crispr/cas and exonucleases for enhanced genome editing
CN116970590B (zh) 小于380个氨基酸的超级迷你型基因编辑器及其应用
US20100173800A1 (en) Delivery of nucleic acids into genomes of human stem cells using in vitro assembled mu transposition complexes
CN117265003A (zh) 一种超级迷你型基因编辑器及其应用
JP2016198044A (ja) 細胞の作製方法および該作製方法で作製された細胞
KR20230064634A (ko) 표적 DNA에 특이적인 가이드 RNA 및 Cas 단백질을 암호화하는 핵산 또는 Cas 단백질을 포함하는, 표적 DNA를 절단하기 위한 조성물 및 이의 용도

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 102629 No.12 Baoshen South Street, Daxing biomedical industrial base, Zhongguancun Science and Technology Park, Daxing District, Beijing

Applicant after: Baccetus (Beijing) Pharmaceutical Technology Co.,Ltd.

Address before: Room 1208, building 3, incubation center, 88 Kechuang Sixth Street, Yizhuang Economic and Technological Development Zone

Applicant before: BEIJING BIOCYTOGEN Co.,Ltd.

CB02 Change of applicant information