CN107109422A - 使用由两个载体表达的Cas9蛋白质调节基因表达的方法 - Google Patents

使用由两个载体表达的Cas9蛋白质调节基因表达的方法 Download PDF

Info

Publication number
CN107109422A
CN107109422A CN201580069646.8A CN201580069646A CN107109422A CN 107109422 A CN107109422 A CN 107109422A CN 201580069646 A CN201580069646 A CN 201580069646A CN 107109422 A CN107109422 A CN 107109422A
Authority
CN
China
Prior art keywords
domain
cas9
cas9 protein
sequence
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201580069646.8A
Other languages
English (en)
Other versions
CN107109422B (zh
Inventor
金晋秀
具兑英
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute Of Basic Sciences
Institute for Basic Science
Original Assignee
Institute Of Basic Sciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute Of Basic Sciences filed Critical Institute Of Basic Sciences
Publication of CN107109422A publication Critical patent/CN107109422A/zh
Application granted granted Critical
Publication of CN107109422B publication Critical patent/CN107109422B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/746Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for lactic acid bacteria (Streptococcus; Lactococcus; Lactobacillus; Pediococcus; Enterococcus; Leuconostoc; Propionibacterium; Bifidobacterium; Sporolactobacillus)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/635Externally inducible repressor mediated regulation of gene expression, e.g. tetR inducible by tetracyline
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • C12N15/864Parvoviral vectors, e.g. parvovirus, densovirus
    • C12N15/8645Adeno-associated virus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • C12N15/867Retroviral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明涉及一种用于调节基因表达的方法,该方法包括将表达包含Cas9蛋白质的N末端的第一结构域的重组载体和表达包含Cas9蛋白质的C末端的第二结构域的重组载体中的每个都导入到细胞中,本发明还涉及一种包含所述重组载体的组合物,一种用于调节基因表达的试剂盒,以及一种用于在细胞内制备Cas9蛋白质的方法。此外,本发明涉及一种导入了包装第一结构域的病毒载体和包装第二结构域的病毒载体的转化细胞,并且涉及一种包含由该转化细胞制备的病毒的组合物。

Description

使用由两个载体表达的Cas9蛋白质调节基因表达的方法
技术领域
本发明涉及一种用于调节基因表达的方法,该方法包括将表达包含Cas9蛋白质的N末端的第一结构域的重组载体和表达包含Cas9蛋白质的C末端的第二结构域的重组载体中的每个都导入到细胞中;本发明涉及包含重组载体的组合物;用于调节基因表达的试剂盒和用于细胞内制备Cas9蛋白质的方法。
此外,本发明涉及被导入了包装第一结构域的病毒载体和包装第二结构域的病毒载体的转化细胞并涉及包含由其制备的病毒的组合物。
背景技术
限制酶作为当前广泛用于基因工程的工具,是当前分子生物学研究中最重要工具之一。然而,由于出现了对于可用于处理基因组大小的DNA且用作能够识别和切割长度为9bp或以上的DNA核苷酸序列的“稀有切割器”的限制酶的需要,所以已经进行了各种尝试。
作为此类尝试的一部分,开发了人工核酸酶,诸如大范围核酸酶、锌指核酸酶(ZFN)和TAL效应子核酸酶(TALEN),该人工核酸酶是能够诱导细胞和微生物中的内源基因突变、靶基因插入和染色体重排的工具。这些人造核酸酶可以有效地用作各种领域(包括基因工程领域、生物技术领域和医疗领域)中的强力和通用工具。作为使用被称为微生物免疫系统的CRISPR/Cas系统的第三代可编程核酸酶的RGEN(RNA引导的工程化核酸酶)的最新发展已经引起在生物技术领域中的所有方面上的新发现和创新(Kim,H等人,《自然评论:遗传学》,2014年第15卷,第321页至334页)。
如上所述的人造核酸酶识别细胞中的特异性靶核苷酸序列以诱导DNA双链断裂(DSB)。诱导的细胞内DSB可以通过细胞的内源性DNA修复机制(同源重组(HR)和非同源末端连接(NHEJ))修复,其中发生靶特异性突变和基因修饰。当同源DNA供体不存在于真核细胞和生物体中时,由核酸酶诱导的DSB可以主要由NHEJ机制而非HR机制修复。HR介导的突变发生在HR供体DNA中的序列正确拷贝时,但NHEJ介导的突变随机发生。因为NHEJ是易错的修复机制,所以在发生DSB的区域中可发生少量插入/删除突变(插入缺失突变)。此类突变诱导移码突变,从而导致基因突变。
具体地,CRISPR/Cas系统的Cas9蛋白质是设计真核细胞和生物体中基因修饰的有用工具。然而,编码Cas9蛋白质的基因的大小很大,并且为此,当将Cas9蛋白质插入用于细胞内递送的病毒载体中时,存在这样的问题:由于病毒载体的有限包装能力,病毒制备效率低并且细胞内递送的效率低。因此,需要聚焦在通过病毒载体表达Cas9蛋白质的研究。
发明内容
技术问题
本发明人已经进行了广泛努力来克服病毒载体的有限包装能力并且开发出能够通过病毒载体表达Cas9蛋白质的系统。因此,本发明人已经将Cas9蛋白质分割成两个可包装到病毒载体中的结构域,并且已经构建能够表达结构域中的每个的重组载体。此外,本发明人已经发现,当重组载体导入到细胞中时,结构域彼此融合以表现出对基因组靶DNA的插入缺失(插入或删除)效应,从而完成本发明。
技术方案
本发明的目的在于提供用于调节基因表达的方法,该方法包括将表达包含Cas9蛋白质的N末端的第一结构域的重组载体和表达包含Cas9蛋白质的C末端的第二结构域的重组载体中的每个都导入到细胞中。
本发明的另一个目的在于提供组合物,该组合物包含表达包含Cas9蛋白质的N末端的第一结构域的重组载体和表达包含Cas9蛋白质的C末端的第二结构域的重组载体。
本发明的另一个目的在于提供用于调节基因表达的试剂盒,该试剂盒包含上述组合物。
本发明的另一个目的在于提供转化细胞,该转化细胞被导入了包装包含Cas9蛋白质的N末端的第一结构域的病毒载体及包装包含Cas9蛋白质的C末端的第二结构域的病毒载体。
本发明的另一个目的在于提供组合物,该组合物包含上述转化细胞的培养物或细胞裂解物。
本发明的另一个目的在于提供用于细胞内制备Cas9蛋白质的方法,该方法包括将表达包含Cas9蛋白质的N末端的第一结构域的重组载体和表达包含Cas9蛋白质的C末端的第二结构域的重组载体中的每个都导入到细胞中。
有益效果
本发明可以改善Cas9蛋白质的靶特异性,并且还能够将Cas9蛋白质应用于病毒载体,使得其可用于使用Cas9蛋白质调节基因表达。
附图说明
图1是示出方法的示意图,在该方法中,构建分别包含Cas9蛋白质的第一结构域和第二结构域的重组载体,且随后该重组载体导入在细胞中并且表达,由此这些结构域在细胞中彼此融合以形成全长Cas9蛋白质(称为拆分的Cas9)。
图2示出T7内切核酸酶1(T7E1)突变检测测定法的结果,该结果指示拆分的Cas9蛋白质在细胞中形成并与sgRNA一起作用以诱导在HPRT基因、DMD基因和CCR5基因的全部中的插入缺失(1)拆分的Cas9+sgRNA,2)Cas9的第二结构域+sgRNA,3)Cas9的第一结构域+sgRNA,4)模拟试验)。
图3示出经实施以用于分析通过拆分的Cas9蛋白质的基因靶诱变效率的下一代测序结果。
图4示出分析拆分的Cas9蛋白质对于靶基因的特异性的结果。具体地,图4示出经实施以分析在Hela细胞(图4a)和Hep1细胞(图4b)中的中靶位点和脱靶位点处的诱变效率的下一代测序结果。通过将在中靶位点处的诱变效率除以在四个脱靶位点中的每个位点处的诱变效率而获得的特异性比率分析特异性。
图5示出构建拆分的Cas9递送载体的方法以及检查载体功能的结果。具体地,图5(a)和图5(b)示意性地示出用于递送拆分的Cas9的腺相关病毒载体的构建。将U6启动子、sgRNA、EFS启动子、第一结构域和剪接供体依次插入腺相关病毒载体,从而构建包装第一结构域的病毒载体。此外,构建腺相关病毒载体,其包含剪接受体、第二结构域或者其能够包装第二结构域和U6启动子及sgRNA。图5(c)示出通过用10MOI、50MOI和100MOI(多重感染性)的包装U6启动子、sgRNA、EFS启动子和第一结构域的腺相关病毒和包装第二结构域的病毒共同感染Hela细胞,并且在5天、7天和10天后,通过下一代测序分析DMD外显子51中突变的诱导而获得的结果。
具体实施方式
为了实现上述目的,本发明的一个实施方案提供用于调节基因表达的方法,该方法包括将表达包含Cas9蛋白的N末端的第一结构域的重组载体和表达包含Cas9蛋白的C末端的第二结构域的重组载体中的每个都导入到细胞中。
如本文所用,术语“调节基因表达”是指增加或减少基因表达的所有措施。具体地,就本发明的目的而言,可以通过Cas9蛋白质实施基因表达的调节。具体地,使用Cas9蛋白质增加或减少基因表达的任何方法可以没有任何限制地包括在本发明的范围内。例如,基因表达的调节可指基因组编辑、增加基因表达或减少基因表达。
如本文所用,术语“基因组编辑”是指能够将靶向突变导入到动物细胞和植物细胞(包括人细胞)中的基因的核苷酸序列的技术,并且指敲除或敲入特定基因,或将突变导入不产生蛋白质的非编码DNA序列中。此外,基因组编辑能够删除、复制、倒置、替换或重排基因组DNA。
如本文所用,术语“删除”是指由删除染色体的一部分或删除DNA核苷酸的一部分导致的突变。
如本文所用,术语“复制”意指两个或多个相同基因存在于基因组中。
如本文所用,术语“倒置”意指基因组的一部分相对于原始基因组反向排列。
如本文所用,术语“替换”意指一个核苷酸序列由另一个核苷酸序列替换(即,替换具有信息的序列),并且不一定仅意指一种多核苷酸由另一种多核苷酸化学上或物理上替换。
如本文所用,术语“重排”是指导致染色体基因的位置和序列改变的结构改变,并且还包括插入转座元件诸如转座子。此外,该术语可以包括通过在DNA分子中的核苷酸重排而转换基因信息。
如本文所用,术语“Cas9蛋白质”是指CRISPR/Cas9系统的主要蛋白质元素,其与crRNA(CRISPR RNA)和tracrRNA(反式激活性crRNA)形成复合物以形成活化的内切核酸酶或切口酶。
Cas9蛋白质或基因信息可以从已知的数据库获得,诸如NCBI(国家生物技术中心(National Center for Biotechnology Information))的基因银行(Genbank),但不限于此。例如,Cas9蛋白质可以由SEQ ID NO:1或SEQ ID NO:2的核苷酸序列编码,但不限于此,而是具有靶特异性核酸酶活性的任何Cas9蛋白质以及引导RNA可以包括在本发明的范围中。此外,Cas9蛋白质可与蛋白质转导结构域结合。蛋白质转导结构域可为聚精氨酸或HIVTAT蛋白质,但不限于此。此外,本领域技术人员可以理解,根据预期用途,其他结构域可以适当与Cas9蛋白质结合。
此外,Cas9蛋白质不仅可包括野生型Cas9,还可包括失活的Cas9(dCas9)或Cas9变体诸如Cas9切口酶。失活的Cas9可为包含与dCas9结合的FokI核酸酶结构域的RFN(RNA引导的FokI核酸酶)或与转录激活因子或阻遏物结构域结合的dCas9。Cas9切口酶可为D10ACas9或H840A Cas9,但不限于此。
本发明的Cas9蛋白质在其来源上不受限制。例如,Cas9蛋白质可以来源于化脓性链球菌(Streptococcus pyogenes)、新凶手弗朗西丝菌(Francisella novicida)、嗜热链球菌(Streptococcus thermophilus)、嗜肺性军团病杆菌(Legionella pneumophila)、无害李斯特(氏)菌(Listeria innocua)或变形链球菌(Streptococcus mutans)。就本发明的目的而言,Cas9蛋白质是这样的Cas9蛋白质,该Cas9蛋白质的大小如此之大而使其不能在病毒载体中有效表达,但Cas9蛋白质不限于此。
在本发明中,为了在病毒载体中表达Cas9,构建能够表达Cas9的一部分的载体。具体地,将Cas9蛋白质分割成能够由病毒载体表达的结构域并且该Cas9蛋白质由载体中的每个表达。在本发明中,Cas9蛋白质的第一结构域和第二结构域是指Cas9蛋白质的部分,并且这些结构域由待在细胞中融合的分离载体表达。在本发明中,以这种方式构建的Cas9蛋白质被命名为“拆分的Cas9”(图1)。
本发明的拆分的Cas9的特征在于,其通过将常规Cas9蛋白质(由于其大尺寸而未被包装到病毒载体等中)分割成具有大小可包装的结构域而构建,并且即使这些结构域由相应载体表达,这些结构域也不会失去其在细胞中的功能。
如本文所用,术语“第一结构域”是指为了上述目的而切割的包含原始Cas9蛋白质的N末端的结构域,而术语“第二结构域”是指包含原始Ccas9蛋白质的C末端的结构域。在本发明中,术语“第一结构域”或“第二结构域”可与术语“半结构域”互换使用。结构域中的每个由病毒载体表达,并且因此可以具有范围在400bp至3.7kbp的大小,该大小可以包装在每个病毒载体中。具体地,在本发明中,第一结构域和第二结构域彼此融合以形成原始全长Cas9蛋白质,并且因此Cas9蛋白质的整个大小减去另一个结构域的大小将是一个结构域的大小。
在本发明的具体示例中,将大小为2.1kbp的第一结构域和大小为1.9kbp的第二结构域导入到质粒载体和病毒载体中。因此,示出的是,由载体表达的拆分的Cas9可在细胞中的中靶位点处诱导插入缺失。
此外,本领域技术人员可以理解,可以根据预期用途将具有特定功能的核苷酸序列添加到第一结构域和第二结构域。例如,第一结构域和第二结构域还可以包含NLS(核定位信号)序列、标签序列、剪接供体/剪接受体序列等。此外,第一结构域可以由核苷酸序列SEQ ID NO:3编码,而第二结构域可以由核苷酸序列SEQ ID NO:5编码,但本发明的范围不限于此。
如本文所用,术语“载体”是指能够在适当的宿主细胞中表达靶蛋白质的表达载体和包含基因插入序列以可表达的方式可操作地连接的基本调节元件的基因构建体。
如本文所用,术语“可操作地连接”意指核酸表达控制序列与编码相关蛋白质的核酸序列功能性连接以实施一般功能。编码根据本发明的核酸酶DNA的第一结构域或第二结构域的序列与启动子可操作地连接,由此使得编码序列的表达受启动子的影响或控制。当编码序列通过诱导启动子作用而转录时,两个核酸序列(编码DNA的第一结构域或第二结构域的序列和编码序列的5'末端处的启动子区域的序列)可操作地连接。此外,在两个序列之间的连接不诱导移码突变,并且当表达调节序列不损害控制每个结构域表达的能力时,两个序列彼此可操作地连接。可以使用本领域熟知的基因重组技术实施与重组载体的可操作连接,并且可使用本领域通常已知的酶实施位点特异性DNA切割和连接。
在本发明中,载体可包括表达调节元件(诸如启动子、操纵子、起始密码子、终止密码子、聚腺苷酸化信号或增强子)以及用于膜靶向和分泌的信号序列或阅读序列,并且载体可以进行各种加工以适应某些目的。载体的启动子可为构建性的或诱导性的。此外,表达载体包括用于选择含有载体的宿主细胞的选择性标记,并且可复制表达载体包括复制起点。载体可为自我复制的,或可整合到宿主DNA中。载体包括质粒载体、粘粒载体、病毒载体等。具体地,载体可为病毒载体。病毒载体的示例可包括但不限于源于逆转录酶病毒(诸如HIV(Human Immunodeficiency Virus,人类免疫缺陷病毒)、MLV(Murine Leukemia Virus,鼠类白血病病毒)、ASLV(Avian Sarcoma/Leukosis,禽肉瘤/白血病)、SNV(Spleen NecrosisVirus,脾坏死病毒)、RSV(Rous Sarcoma Virus,Rous肉瘤病毒)、MMTV(Mouse MammaryTumor Virus,小鼠乳腺肿瘤病毒)、腺病毒、腺相关病毒、单纯疱疹病毒等)的载体。
在本发明中,“导入到细胞中”可以使用本领域已知的任何方法,并且可以通过转染或转导将外源DNA导入到细胞中。转染可以通过本领域已知的各种方法实施,包括磷酸钙-DNA共沉淀、DEAE-葡聚糖介导的转染、聚凝胺介导的转染、电穿孔、显微注射、脂质体介导的转染、脂质体融合、脂质转染和原生质体融合。
在本发明的一个示例中,构建各编码Cas9蛋白质的第一结构域和第二结构域中的每个重组载体(图1),且随后导入在细胞中并表达。因此,示出所表达结构域在细胞中彼此融合以作为全长Cas9蛋白质发挥功能。具体地,示出作为半结构域的第一结构域和第二结构域由重组载体表达,且随后彼此融合以形成Cas9形式,并且所形成Cas9蛋白质与sgRNA一起作用以在所有靶基因中诱导插入缺失(插入或删除)(图2和图3)。
在本发明的另一个示例中,检查Hela细胞和Hep1细胞中的拆分的Cas9蛋白质的靶特异性,并且因此,示出拆分的Cas9蛋白质的靶特异性比野生型Cas9的特异性高80倍至220倍(图4)。这表明当本发明的拆分的Cas9在细胞中表达时,其可以在期望中靶位点上起作用,同时使脱靶效应最小化。
在本发明的另一个实施方案中,使用腺相关病毒载体表达拆分的Cas9,并且用产生的病毒感染细胞。因此,Cas9有效地诱导了插入缺失(图5)。因此,据发现,Cas9蛋白质也可以通过包含拆分的Cas9的病毒载体有效地使用。
具体地,当载体导入到细胞中时,可以另外导入序列特异性引导RNA。更具体地,可以同时、顺序地或以反向顺序导入每个载体和引导RNA。
在本发明中,“引导RNA”可以由两个RNA(即crRNA(CRISPR RNA)和tracrRNA(反式激活的crRNA))组成。另选地,引导RNA可为通过融合crRNA和tracrRNA的主要部分制备的sgRNA(单链RNA)。此外,引导RNA可为包含crRNA和tracrRNA的双RNA。
被称为第三代可编程核酸酶的RGEN可以由Cas蛋白质和双RNA构成,或者可以由Cas蛋白质和sgRNA构成。引导RNA可以在sgRNA的5'末端或双RNA的crRNA上包含一个或多个额外的核苷酸,并且可以作为RNA或编码RNA的DNA在细胞内递送。
本发明的另一个实施方案提供组合物,该组合物包含表达含有Cas9蛋白质的N末端的第一结构域的重组载体和表达含有Cas9蛋白质的C末端的第二结构域的重组载体。该组合物可导入到细胞中以调节所需基因的表达。组合物还可以包含序列特异性引导RNA。Cas9蛋白质和重组载体与上述那些相同。
在本发明的示例中,将表达第一结构域的重组载体和表达第二结构域的重组载体导入到细胞中。原因在于更有效地递送Cas9蛋白质(其具有使得Cas9蛋白质难以包装到载体中的尺寸)和表达递送的蛋白质。使用包含重组载体中的每个的组合物使得Cas9蛋白质更容易在细胞中表达。除了表达第一结构域的重组载体和表达第二结构域的重组载体外,组合物还可以包含能够维持将重组载体导入到细胞中所需的细胞或物质的培养基组合物。
本发明的另一个实施方案提供用于调节基因表达的试剂盒,该试剂盒包含表达Cas9蛋白质的第一结构域的重组载体和表达Cas9蛋白质的第二结构域的重组载体。具体地,试剂盒还可以包含序列特异性引导RNA。
此外,根据本发明的试剂盒不仅可以包含诱导或促进重组载体的表达的物质或能够维持细胞的培养基组合物,而且还可以包含能够有利于构建或细胞内导入重组载体的组合物和构建或细胞内导入重组载体的手册。
本发明的另一个实施方案提供转化细胞,其被导入了包装Cas9蛋白质的第一结构域的病毒载体和包装Cas9蛋白质的第二结构域的病毒载体。
如本文所用,术语“转化细胞”意指通过将期望的多核苷酸导入到宿主细胞中而获得的细胞。转化可以通过“导入”方法实现,并且可以根据宿主细胞通过选择合适的标准技术(如本领域已知的)来实施。
应当理解,宿主细胞是指其中导入一个或多个DNA或载体的真核细胞或原核细胞,并且不仅是指特定受试细胞,而且还指其子代或潜在子代。因为由于突变或环境影响,在后代中可发生某些修饰,所以此类子代实际上可不与母细胞相同,但仍包括在本文所用术语的范围内。在本发明中,转化细胞是导入有病毒载体和病毒的细胞,该病毒载体编码半结构域中的每个,该病毒包装编码可从转化细胞获得的Cas9的每个结构域的核苷酸序列。具体地,可以从转化细胞的培养物或裂解物获得病毒。
细胞的示例包括但不限于原核细胞诸如大肠杆菌,真核细胞诸如酵母、真菌、原生动物、高等植物或昆虫、哺乳动物细胞诸如CHO、HeLa、HEK293或COS-1等。
此外,本发明可以应用于所有人体细胞,包括体细胞、生殖细胞、诱导的多能干细胞和成体干细胞。
体细胞是指除生殖细胞以外的所有细胞,体细胞可以从胚胎和儿童和及成体获得,并且还可以包括从其衍生的经基因修饰的细胞。此外,成体干细胞不仅可以包括可从人类胚胎,新生儿和成人身体获得的所有成体干细胞,还可以包括胚胎干细胞(extraembryonic stem cell)(包括脐带血干细胞、胎盘干细胞、脐带胶质干细胞(Wharton's jelly stem cell)、羊水干细胞和羊膜上皮细胞)以及从其衍生的经基因修饰的细胞。
此外,细胞也可为培养的细胞(体外),移植物和原代培养物(体外和离体)或体内细胞,并且没有特别限制,只要它们是在本领域中通常使用的细胞即可。
在本发明的另一个实施方案中,提供包含转化细胞的培养物或细胞裂解物的组合物。转化细胞及其培养物和裂解物如上所述。组合物包含包装编码结构域中的每个的核苷酸序列的病毒,并且因此可用于调节基因表达。
根据本发明,克服通过载体包装Cas9蛋白质的限制,并且通过构建单独表达Cas9蛋白质的两个经切割的结构域的重组载体以及递送待在细胞中表达的所构建重组载体而增加了Cas9蛋白质的细胞内递送的效率。因此,无论细胞的类型或Cas9蛋白质的类型如何,均可以应用本发明人开发的本发明原理,以提高Cas9蛋白质的细胞内递送的效率,从而有效调节基因表达。
发明模式
在下文,将参考实施例详细描述本发明。对于本领域的技术人员显而易见的是,这些实施例仅用于例示性目的,而不应理解为限制本发明的范围。
实施例1:构建表达Cas9蛋白质的第一结构域和第二结构域中的每个的重组载体
存在于野生型(WT)Cas9(CRISPR相关蛋白质9)蛋白质的中间部分(SEQ ID NO:2)中的无序连接子的中间部分(SEQ ID NO:9;agcggccagggc;编码SGQG氨基酸的序列)被切割,从而构建其中SG氨基酸和QG氨基酸分别连接到第一结构域和第二结构域的两个半结构域。
半结构域中的每一个经构造进而其独立结构域可以由CMV启动子诱导。通过PCR克隆将终止密码子插入第一结构域的经切割的3'末端,使得可以完成表达,并且起始密码子连接到第二结构域的经切割的5'末端区域,使得可以初始表达。依次将HA标签和NLS(核定位信号)插入第一结构域的5'末端区域中的起始密码子下游,将NLS区域和HA标签依次插入在第二结构域的3'末端和终止密码子之间,使得可通过核定位和HA抗体来测量蛋白质表达。
实施例2:检查表达每个半结构域的重组载体和sgRNA的细胞内导入以及靶基因的 敲除
通过使用脂质体的转染将实施例1中构建的表达每个半结构域的重组载体,表达用于CCR5基因、HPRT基因和DMD基因中的每一个的sgRNA(单引导RNA)的质粒递送到细胞中。
作为CCR5基因的等位基因敲除的靶序列,使用通常存在于所有人体中的经转换序列,并靶向CCR5外显子2中存在的5'-TGACATCAATTATTATACATCGG-3'序列(SEQ ID NO:11)。
此外,作为HPRT基因的等位基因敲除的靶序列,靶向存在于DMD外显子51中的5'-GCCCCCCTTGAGCACACAGAGGG-3'序列(SEQ ID NO:12)。
此外,作为DMD基因的等位基因敲除的靶序列,靶向存在于DMD外显子51中的5'-TCCTACTCAGACTGTTACTCTGG-3'序列(SEQ ID NO:13)。
接下来,从Hela细胞提取基因组DNA,且随后通过PCR扩增在HPRT基因、DMD基因和CCR5每个基因中的靶序列区。
接下来,通过T7E1(T7内切核酸酶I)突变检测测定法来分析插入缺失(插入或删除)是否被诱导,并且琼脂糖凝胶分析的结果示出在图2中。根据已知方法实施T7E1测定法。简而言之,根据制造商的说明书,使用DNeasy血液和组织试剂盒(G-DEX IIc基因组提取试剂盒)分离基因组DNA。
如在图2中可看出的,由细胞内导入的重组载体(实施例1中构建的)表达了每个半结构域,且随后将表达的半结构域彼此融合以形成Cas9蛋白质(命名为“拆分的Cas9”),该Cas9蛋白质然后与sgRNA一起作用以在所有HPRT基因、DMD基因和CCR5基因中诱导插入缺失。
实施例3:通过拆分的Cas9和靶基因特异性sgRNA分析靶基因的敲除效率
为了分析靶基因的敲除效率,通过PCR扩增靶序列区域,且随后通过下一代测定法分析靶序列。分析的结果指示,HPRT基因中的插入缺失频率为27.1%,DMD基因中的插入缺失频率为23.75%,而CCR5基因中的插入缺失频率为20.27%。在对照组中,仅将用于第一结构域或第二结构域的一个半结构域导入细胞中并且表达,并且在这种情况下,未出现插入缺失(图3)。
通过如上所述的结果可以看出,当将表达Cas9的每个半结构域的重组载体导入到细胞中时,半结构域被正常表达,且随后彼此融合以形成全长Cas9蛋白质,指示半结构域可与sgRNA一起作用以表现出对靶基因的插入缺失效应。由于Cas9表达盒的大小(Cas9表达盒大于能够包装在病毒载体中的大小),Cas9具有减少的细胞内递送效率。根据本发明,将Cas9的第一结构域和第二结构域单独导入到细胞中,使得它们可以在细胞中表达,且随后彼此融合以表现出其功能,从而解决与将Cas9蛋白质包装到载体中相关的问题。
实施例4:拆分的Cas9的靶序列切割特异性的分析
为了分析靶基因的脱靶效应,用拆分的Cas9质粒和野生型Cas9质粒中的每一种处理细胞,并且在3天后,通过PCR扩增具有与HBB基因的靶序列不匹配的序列的相似序列区域。接下来,通过下一代测定法分析靶序列。
当Hela细胞中的中靶效率除以脱靶效率时,示出拆分的Cas9的特异性比野生型Cas9的特异性高出220倍(图4a)。此外,示出的是,在Hep1细胞中拆分的Cas9的特异性比野生型Cas9的特异性高出80倍(图4b)。
实施例5:通过表达拆分的Cas9的腺相关病毒分析靶序列切割特异性
为了检查即使使用病毒载体递送时拆分的Cas9是否也有效地起作用,将第一结构域和第二结构域中的每一个克隆到腺相关病毒载体质粒中(图5a和5b)。
将剪接供体连接到第一结构域的C末端区域,并将剪接受体连接到第二结构域的N末端区域。在细胞内制备、回收和递送包装半结构域中的每个的病毒,且随后分析靶序列区域的切割率。
因此,可以看出,半结构域彼此融合以形成全长Cas9蛋白质,从而表现出基因切割效应。同时,Hela细胞用10MOI、50MOI和100MOI(多重感染性)的腺相关病毒感染用于递送拆分的Cas9,并且5天、7天和10天后,分析靶序列切割率。因此,可以看出,出现了约5%的靶序列切割效应(图5c)。这表明本发明的拆分的Cas9即使在使用病毒载体递送时也有效地起作用。
通过上述内容,本发明所属领域的技术人员将会理解,在不改变本发明的技术精神或基本特征的情况下,本发明可以在其它具体实施方案中进行。在这方面,应当理解,上述实施例在所有方面都是例示性的,而非限制性的。本发明的范围应被理解为包括所附权利要求的含义和范围,以及从本发明等同概念而非具体实施方式衍生的所有变化形式和修饰形式。
序列表
<110> 基础科学研究院
<120> 借助由两个载体表达的拆分的Cas9的基因组编辑
<130> PF-B1890-CN
<140> PCT/KR2015/012503
<141> 2015-11-19
<150> 10-2014-0161809
<151> 2014-11-19
<160> 54
<170> PatentIn version 3.5
<210> 1
<211> 4104
<212> DNA
<213> 人工序列
<220>
<223> Cas9
<400> 1
atggacaaga agtacagcat cggcctggac atcggtacca acagcgtggg ctgggccgtg 60
atcaccgacg agtacaaggt gcccagcaag aagttcaagg tgctgggcaa caccgaccgc 120
cacagcatca agaagaacct gatcggcgcc ctgctgttcg acagcggcga gaccgccgag 180
gccacccgcc tgaagcgcac cgcccgccgc cgctacaccc gccgcaagaa ccgcatctgc 240
tacctgcagg agatcttcag caacgagatg gccaaggtgg acgacagctt cttccaccgc 300
ctggaggaga gcttcctggt ggaggaggac aagaagcacg agcgccaccc catcttcggc 360
aacatcgtgg acgaggtggc ctaccacgag aagtacccca ccatctacca cctgcgcaag 420
aagctggtgg acagcaccga caaggccgac ctgcgcctga tctacctggc cctggcccac 480
atgatcaagt tccgcggcca cttcctgatc gagggcgacc tgaaccccga caacagcgac 540
gtggacaagc tgttcatcca gctggtgcag acctacaacc agctgttcga ggagaacccc 600
atcaacgcca gcggcgtgga cgccaaggcc atcctgagcg cccgcctgag caagagccgc 660
cgcctggaga acctgatcgc ccagctgccc ggcgagaaga agaacggcct gttcggcaac 720
ctgatcgccc tgagcctggg cctgaccccc aacttcaaga gcaacttcga cctggccgag 780
gacgccaagc tgcagctgag caaggacacc tacgacgacg acctggacaa cctgctggcc 840
cagatcggcg accagtacgc cgacctgttc ctggccgcca agaacctgag cgacgccatc 900
ctgctgagcg acatcctgcg cgtgaacacc gagatcacca aggcccccct gagcgccagc 960
atgatcaagc gctacgacga gcaccaccag gacctgaccc tgctgaaggc cctggtgcgc 1020
cagcagctgc ccgagaagta caaggagatc ttcttcgacc agagcaagaa cggctacgcc 1080
ggctacatcg acggcggcgc cagccaggag gagttctaca agttcatcaa gcccatcctg 1140
gagaagatgg acggcaccga ggagctgctg gtgaagctga accgcgagga cctgctgcgc 1200
aagcagcgca ccttcgacaa cggcagcatc ccccaccaga tccacctggg cgagctgcac 1260
gccatcctgc gccgccagga ggacttctac cccttcctga aggacaaccg cgagaagatc 1320
gagaagatcc tgaccttccg catcccctac tacgtgggcc ccctggcccg cggcaacagc 1380
cgcttcgcct ggatgacccg caagagcgag gagaccatca ccccctggaa cttcgaggag 1440
gtggtggaca agggcgccag cgcccagagc ttcatcgagc gcatgaccaa cttcgacaag 1500
aacctgccca acgagaaggt gctgcccaag cacagcctgc tgtacgagta cttcaccgtg 1560
tacaacgagc tgaccaaggt gaagtacgtg accgagggca tgcgcaagcc cgccttcctg 1620
agcggcgagc agaagaaggc catcgtggac ctgctgttca agaccaaccg caaggtgacc 1680
gtgaagcagc tgaaggagga ctacttcaag aagatcgagt gcttcgacag cgtggagatc 1740
agcggcgtgg aggaccgctt caacgccagc ctgggcacct accacgacct gctgaagatc 1800
atcaaggaca aggacttcct ggacaacgag gagaacgagg acatcctgga ggacatcgtg 1860
ctgaccctga ccctgttcga ggaccgcgag atgatcgagg agcgcctgaa gacctacgcc 1920
cacctgttcg acgacaaggt gatgaagcag ctgaagcgcc gccgctacac cggctggggc 1980
cgcctgagcc gcaagcttat caacggcatc cgcgacaagc agagcggcaa gaccatcctg 2040
gacttcctga agagcgacgg cttcgccaac cgcaacttca tgcagctgat ccacgacgac 2100
agcctgacct tcaaggagga catccagaag gcccaggtga gcggccaggg cgacagcctg 2160
cacgagcaca tcgccaacct ggccggcagc cccgccatca agaagggcat cctgcagacc 2220
gtgaaggtgg tggacgagct ggtgaaggtg atgggccgcc acaagcccga gaacatcgtg 2280
atcgagatgg cccgcgagaa ccagaccacc cagaagggcc agaagaacag ccgcgagcgc 2340
atgaagcgca tcgaggaggg catcaaggag ctgggcagcc agatcctgaa ggagcacccc 2400
gtggagaaca cccagctgca gaacgagaag ctgtacctgt actacctgca gaacggccgc 2460
gacatgtacg tggaccagga gctggacatc aaccgcctga gcgactacga cgtggaccac 2520
atcgtgcccc agagcttcct gaaggacgac agcatcgaca acaaggtgct gacccgcagc 2580
gacaagaacc gcggcaagag cgacaacgtg cccagcgagg aggtggtgaa gaagatgaag 2640
aactactggc gccagctgct gaacgccaag ctgatcaccc agcgcaagtt cgacaacctg 2700
accaaggccg agcgcggcgg cctgagcgag ctggacaagg ccggcttcat caagcgccag 2760
ctggtggaga cccgccagat caccaagcac gtggcccaga tcctggacag ccgcatgaac 2820
accaagtacg acgagaacga caagctgatc cgcgaggtga aggtgatcac cctgaagagc 2880
aagctggtga gcgacttccg caaggacttc cagttctaca aggtgcgcga gatcaacaac 2940
taccaccacg cccacgacgc ctacctgaac gccgtggtgg gcaccgccct gatcaagaag 3000
taccccaagc tggagagcga gttcgtgtac ggcgactaca aggtgtacga cgtgcgcaag 3060
atgatcgcca agagcgagca ggagatcggc aaggccaccg ccaagtactt cttctacagc 3120
aacatcatga acttcttcaa gaccgagatc accctggcca acggcgagat ccgcaagcgc 3180
cccctgatcg agaccaacgg cgagaccggc gagatcgtgt gggacaaggg ccgcgacttc 3240
gccaccgtgc gcaaggtgct gagcatgccc caggtgaaca tcgtgaagaa gaccgaggtg 3300
cagaccggcg gcttcagcaa ggagagcatc ctgcccaagc gcaacagcga caagctgatc 3360
gcccgcaaga aggactggga ccccaagaag tacggcggct tcgacagccc caccgtggcc 3420
tacagcgtgc tggtggtggc caaggtggag aagggcaaga gcaagaagct gaagagcgtg 3480
aaggagctgc tgggcatcac catcatggag cgcagcagct tcgagaagaa ccccatcgac 3540
ttcctggagg ccaagggcta caaggaggtg aagaaggacc tgatcatcaa gctgcccaag 3600
tacagcctgt tcgagctgga gaacggccgc aagcgcatgc tggccagcgc cggcgagctg 3660
cagaagggca acgagctggc cctgcccagc aagtacgtga acttcctgta cctggccagc 3720
cactacgaga agctgaaggg cagccccgag gacaacgagc agaagcagct gttcgtggag 3780
cagcacaagc actacctgga cgagatcatc gagcagatca gcgagttcag caagcgcgtg 3840
atcctggccg acgccaacct ggacaaggtg ctgagcgcct acaacaagca ccgcgacaag 3900
cccatccgcg agcaggccga gaacatcatc cacctgttca ccctgaccaa cctgggcgcc 3960
cccgccgcct tcaagtactt cgacaccacc atcgaccgca agcgctacac cagcaccaag 4020
gaggtgctgg acgccaccct gatccaccag agcatcaccg gtctgtacga gacccgcatc 4080
gacctgagcc agctgggcgg cgac 4104
<210> 2
<211> 4173
<212> DNA
<213> 人工序列
<220>
<223> Cas9-修饰的
<400> 2
atggacaaga agtacagcat cggcctggac atcggtacca acagcgtggg ctgggccgtg 60
atcaccgacg agtacaaggt gcccagcaag aagttcaagg tgctgggcaa caccgaccgc 120
cacagcatca agaagaacct gatcggcgcc ctgctgttcg acagcggcga gaccgccgag 180
gccacccgcc tgaagcgcac cgcccgccgc cgctacaccc gccgcaagaa ccgcatctgc 240
tacctgcagg agatcttcag caacgagatg gccaaggtgg acgacagctt cttccaccgc 300
ctggaggaga gcttcctggt ggaggaggac aagaagcacg agcgccaccc catcttcggc 360
aacatcgtgg acgaggtggc ctaccacgag aagtacccca ccatctacca cctgcgcaag 420
aagctggtgg acagcaccga caaggccgac ctgcgcctga tctacctggc cctggcccac 480
atgatcaagt tccgcggcca cttcctgatc gagggcgacc tgaaccccga caacagcgac 540
gtggacaagc tgttcatcca gctggtgcag acctacaacc agctgttcga ggagaacccc 600
atcaacgcca gcggcgtgga cgccaaggcc atcctgagcg cccgcctgag caagagccgc 660
cgcctggaga acctgatcgc ccagctgccc ggcgagaaga agaacggcct gttcggcaac 720
ctgatcgccc tgagcctggg cctgaccccc aacttcaaga gcaacttcga cctggccgag 780
gacgccaagc tgcagctgag caaggacacc tacgacgacg acctggacaa cctgctggcc 840
cagatcggcg accagtacgc cgacctgttc ctggccgcca agaacctgag cgacgccatc 900
ctgctgagcg acatcctgcg cgtgaacacc gagatcacca aggcccccct gagcgccagc 960
atgatcaagc gctacgacga gcaccaccag gacctgaccc tgctgaaggc cctggtgcgc 1020
cagcagctgc ccgagaagta caaggagatc ttcttcgacc agagcaagaa cggctacgcc 1080
ggctacatcg acggcggcgc cagccaggag gagttctaca agttcatcaa gcccatcctg 1140
gagaagatgg acggcaccga ggagctgctg gtgaagctga accgcgagga cctgctgcgc 1200
aagcagcgca ccttcgacaa cggcagcatc ccccaccaga tccacctggg cgagctgcac 1260
gccatcctgc gccgccagga ggacttctac cccttcctga aggacaaccg cgagaagatc 1320
gagaagatcc tgaccttccg catcccctac tacgtgggcc ccctggcccg cggcaacagc 1380
cgcttcgcct ggatgacccg caagagcgag gagaccatca ccccctggaa cttcgaggag 1440
gtggtggaca agggcgccag cgcccagagc ttcatcgagc gcatgaccaa cttcgacaag 1500
aacctgccca acgagaaggt gctgcccaag cacagcctgc tgtacgagta cttcaccgtg 1560
tacaacgagc tgaccaaggt gaagtacgtg accgagggca tgcgcaagcc cgccttcctg 1620
agcggcgagc agaagaaggc catcgtggac ctgctgttca agaccaaccg caaggtgacc 1680
gtgaagcagc tgaaggagga ctacttcaag aagatcgagt gcttcgacag cgtggagatc 1740
agcggcgtgg aggaccgctt caacgccagc ctgggcacct accacgacct gctgaagatc 1800
atcaaggaca aggacttcct ggacaacgag gagaacgagg acatcctgga ggacatcgtg 1860
ctgaccctga ccctgttcga ggaccgcgag atgatcgagg agcgcctgaa gacctacgcc 1920
cacctgttcg acgacaaggt gatgaagcag ctgaagcgcc gccgctacac cggctggggc 1980
cgcctgagcc gcaagcttat caacggcatc cgcgacaagc agagcggcaa gaccatcctg 2040
gacttcctga agagcgacgg cttcgccaac cgcaacttca tgcagctgat ccacgacgac 2100
agcctgacct tcaaggagga catccagaag gcccaggtga gcggccaggg cgacagcctg 2160
cacgagcaca tcgccaacct ggccggcagc cccgccatca agaagggcat cctgcagacc 2220
gtgaaggtgg tggacgagct ggtgaaggtg atgggccgcc acaagcccga gaacatcgtg 2280
atcgagatgg cccgcgagaa ccagaccacc cagaagggcc agaagaacag ccgcgagcgc 2340
atgaagcgca tcgaggaggg catcaaggag ctgggcagcc agatcctgaa ggagcacccc 2400
gtggagaaca cccagctgca gaacgagaag ctgtacctgt actacctgca gaacggccgc 2460
gacatgtacg tggaccagga gctggacatc aaccgcctga gcgactacga cgtggaccac 2520
atcgtgcccc agagcttcct gaaggacgac agcatcgaca acaaggtgct gacccgcagc 2580
gacaagaacc gcggcaagag cgacaacgtg cccagcgagg aggtggtgaa gaagatgaag 2640
aactactggc gccagctgct gaacgccaag ctgatcaccc agcgcaagtt cgacaacctg 2700
accaaggccg agcgcggcgg cctgagcgag ctggacaagg ccggcttcat caagcgccag 2760
ctggtggaga cccgccagat caccaagcac gtggcccaga tcctggacag ccgcatgaac 2820
accaagtacg acgagaacga caagctgatc cgcgaggtga aggtgatcac cctgaagagc 2880
aagctggtga gcgacttccg caaggacttc cagttctaca aggtgcgcga gatcaacaac 2940
taccaccacg cccacgacgc ctacctgaac gccgtggtgg gcaccgccct gatcaagaag 3000
taccccaagc tggagagcga gttcgtgtac ggcgactaca aggtgtacga cgtgcgcaag 3060
atgatcgcca agagcgagca ggagatcggc aaggccaccg ccaagtactt cttctacagc 3120
aacatcatga acttcttcaa gaccgagatc accctggcca acggcgagat ccgcaagcgc 3180
cccctgatcg agaccaacgg cgagaccggc gagatcgtgt gggacaaggg ccgcgacttc 3240
gccaccgtgc gcaaggtgct gagcatgccc caggtgaaca tcgtgaagaa gaccgaggtg 3300
cagaccggcg gcttcagcaa ggagagcatc ctgcccaagc gcaacagcga caagctgatc 3360
gcccgcaaga aggactggga ccccaagaag tacggcggct tcgacagccc caccgtggcc 3420
tacagcgtgc tggtggtggc caaggtggag aagggcaaga gcaagaagct gaagagcgtg 3480
aaggagctgc tgggcatcac catcatggag cgcagcagct tcgagaagaa ccccatcgac 3540
ttcctggagg ccaagggcta caaggaggtg aagaaggacc tgatcatcaa gctgcccaag 3600
tacagcctgt tcgagctgga gaacggccgc aagcgcatgc tggccagcgc cggcgagctg 3660
cagaagggca acgagctggc cctgcccagc aagtacgtga acttcctgta cctggccagc 3720
cactacgaga agctgaaggg cagccccgag gacaacgagc agaagcagct gttcgtggag 3780
cagcacaagc actacctgga cgagatcatc gagcagatca gcgagttcag caagcgcgtg 3840
atcctggccg acgccaacct ggacaaggtg ctgagcgcct acaacaagca ccgcgacaag 3900
cccatccgcg agcaggccga gaacatcatc cacctgttca ccctgaccaa cctgggcgcc 3960
cccgccgcct tcaagtactt cgacaccacc atcgaccgca agcgctacac cagcaccaag 4020
gaggtgctgg acgccaccct gatccaccag agcatcaccg gtctgtacga gacccgcatc 4080
gacctgagcc agctgggcgg cgacggcggc tccggacctc caaagaaaaa gagaaaagta 4140
tacccctacg acgtgcccga ctacgcctaa taa 4173
<210> 3
<211> 2145
<212> DNA
<213> 人工序列
<220>
<223> 结构域1
<400> 3
atggacaaga agtacagcat cggcctggac atcggtacca acagcgtggg ctgggccgtg 60
atcaccgacg agtacaaggt gcccagcaag aagttcaagg tgctgggcaa caccgaccgc 120
cacagcatca agaagaacct gatcggcgcc ctgctgttcg acagcggcga gaccgccgag 180
gccacccgcc tgaagcgcac cgcccgccgc cgctacaccc gccgcaagaa ccgcatctgc 240
tacctgcagg agatcttcag caacgagatg gccaaggtgg acgacagctt cttccaccgc 300
ctggaggaga gcttcctggt ggaggaggac aagaagcacg agcgccaccc catcttcggc 360
aacatcgtgg acgaggtggc ctaccacgag aagtacccca ccatctacca cctgcgcaag 420
aagctggtgg acagcaccga caaggccgac ctgcgcctga tctacctggc cctggcccac 480
atgatcaagt tccgcggcca cttcctgatc gagggcgacc tgaaccccga caacagcgac 540
gtggacaagc tgttcatcca gctggtgcag acctacaacc agctgttcga ggagaacccc 600
atcaacgcca gcggcgtgga cgccaaggcc atcctgagcg cccgcctgag caagagccgc 660
cgcctggaga acctgatcgc ccagctgccc ggcgagaaga agaacggcct gttcggcaac 720
ctgatcgccc tgagcctggg cctgaccccc aacttcaaga gcaacttcga cctggccgag 780
gacgccaagc tgcagctgag caaggacacc tacgacgacg acctggacaa cctgctggcc 840
cagatcggcg accagtacgc cgacctgttc ctggccgcca agaacctgag cgacgccatc 900
ctgctgagcg acatcctgcg cgtgaacacc gagatcacca aggcccccct gagcgccagc 960
atgatcaagc gctacgacga gcaccaccag gacctgaccc tgctgaaggc cctggtgcgc 1020
cagcagctgc ccgagaagta caaggagatc ttcttcgacc agagcaagaa cggctacgcc 1080
ggctacatcg acggcggcgc cagccaggag gagttctaca agttcatcaa gcccatcctg 1140
gagaagatgg acggcaccga ggagctgctg gtgaagctga accgcgagga cctgctgcgc 1200
aagcagcgca ccttcgacaa cggcagcatc ccccaccaga tccacctggg cgagctgcac 1260
gccatcctgc gccgccagga ggacttctac cccttcctga aggacaaccg cgagaagatc 1320
gagaagatcc tgaccttccg catcccctac tacgtgggcc ccctggcccg cggcaacagc 1380
cgcttcgcct ggatgacccg caagagcgag gagaccatca ccccctggaa cttcgaggag 1440
gtggtggaca agggcgccag cgcccagagc ttcatcgagc gcatgaccaa cttcgacaag 1500
aacctgccca acgagaaggt gctgcccaag cacagcctgc tgtacgagta cttcaccgtg 1560
tacaacgagc tgaccaaggt gaagtacgtg accgagggca tgcgcaagcc cgccttcctg 1620
agcggcgagc agaagaaggc catcgtggac ctgctgttca agaccaaccg caaggtgacc 1680
gtgaagcagc tgaaggagga ctacttcaag aagatcgagt gcttcgacag cgtggagatc 1740
agcggcgtgg aggaccgctt caacgccagc ctgggcacct accacgacct gctgaagatc 1800
atcaaggaca aggacttcct ggacaacgag gagaacgagg acatcctgga ggacatcgtg 1860
ctgaccctga ccctgttcga ggaccgcgag atgatcgagg agcgcctgaa gacctacgcc 1920
cacctgttcg acgacaaggt gatgaagcag ctgaagcgcc gccgctacac cggctggggc 1980
cgcctgagcc gcaagcttat caacggcatc cgcgacaagc agagcggcaa gaccatcctg 2040
gacttcctga agagcgacgg cttcgccaac cgcaacttca tgcagctgat ccacgacgac 2100
agcctgacct tcaaggagga catccagaag gcccaggtga gcggc 2145
<210> 4
<211> 2238
<212> DNA
<213> 人工序列
<220>
<223> 结构域1-修饰的
<400> 4
atggtgtacc cctacgacgt gcccgactac gccgaattgc ctccaaaaaa gaagagaaag 60
gtagggatcc gaattcccgg ggaaaaaccg gacaagaagt acagcatcgg cctggacatc 120
ggtaccaaca gcgtgggctg ggccgtgatc accgacgagt acaaggtgcc cagcaagaag 180
ttcaaggtgc tgggcaacac cgaccgccac agcatcaaga agaacctgat cggcgccctg 240
ctgttcgaca gcggcgagac cgccgaggcc acccgcctga agcgcaccgc ccgccgccgc 300
tacacccgcc gcaagaaccg catctgctac ctgcaggaga tcttcagcaa cgagatggcc 360
aaggtggacg acagcttctt ccaccgcctg gaggagagct tcctggtgga ggaggacaag 420
aagcacgagc gccaccccat cttcggcaac atcgtggacg aggtggccta ccacgagaag 480
taccccacca tctaccacct gcgcaagaag ctggtggaca gcaccgacaa ggccgacctg 540
cgcctgatct acctggccct ggcccacatg atcaagttcc gcggccactt cctgatcgag 600
ggcgacctga accccgacaa cagcgacgtg gacaagctgt tcatccagct ggtgcagacc 660
tacaaccagc tgttcgagga gaaccccatc aacgccagcg gcgtggacgc caaggccatc 720
ctgagcgccc gcctgagcaa gagccgccgc ctggagaacc tgatcgccca gctgcccggc 780
gagaagaaga acggcctgtt cggcaacctg atcgccctga gcctgggcct gacccccaac 840
ttcaagagca acttcgacct ggccgaggac gccaagctgc agctgagcaa ggacacctac 900
gacgacgacc tggacaacct gctggcccag atcggcgacc agtacgccga cctgttcctg 960
gccgccaaga acctgagcga cgccatcctg ctgagcgaca tcctgcgcgt gaacaccgag 1020
atcaccaagg cccccctgag cgccagcatg atcaagcgct acgacgagca ccaccaggac 1080
ctgaccctgc tgaaggccct ggtgcgccag cagctgcccg agaagtacaa ggagatcttc 1140
ttcgaccaga gcaagaacgg ctacgccggc tacatcgacg gcggcgccag ccaggaggag 1200
ttctacaagt tcatcaagcc catcctggag aagatggacg gcaccgagga gctgctggtg 1260
aagctgaacc gcgaggacct gctgcgcaag cagcgcacct tcgacaacgg cagcatcccc 1320
caccagatcc acctgggcga gctgcacgcc atcctgcgcc gccaggagga cttctacccc 1380
ttcctgaagg acaaccgcga gaagatcgag aagatcctga ccttccgcat cccctactac 1440
gtgggccccc tggcccgcgg caacagccgc ttcgcctgga tgacccgcaa gagcgaggag 1500
accatcaccc cctggaactt cgaggaggtg gtggacaagg gcgccagcgc ccagagcttc 1560
atcgagcgca tgaccaactt cgacaagaac ctgcccaacg agaaggtgct gcccaagcac 1620
agcctgctgt acgagtactt caccgtgtac aacgagctga ccaaggtgaa gtacgtgacc 1680
gagggcatgc gcaagcccgc cttcctgagc ggcgagcaga agaaggccat cgtggacctg 1740
ctgttcaaga ccaaccgcaa ggtgaccgtg aagcagctga aggaggacta cttcaagaag 1800
atcgagtgct tcgacagcgt ggagatcagc ggcgtggagg accgcttcaa cgccagcctg 1860
ggcacctacc acgacctgct gaagatcatc aaggacaagg acttcctgga caacgaggag 1920
aacgaggaca tcctggagga catcgtgctg accctgaccc tgttcgagga ccgcgagatg 1980
atcgaggagc gcctgaagac ctacgcccac ctgttcgacg acaaggtgat gaagcagctg 2040
aagcgccgcc gctacaccgg ctggggccgc ctgagccgca agcttatcaa cggcatccgc 2100
gacaagcaga gcggcaagac catcctggac ttcctgaaga gcgacggctt cgccaaccgc 2160
aacttcatgc agctgatcca cgacgacagc ctgaccttca aggaggacat ccagaaggcc 2220
caggtgagcg gctaataa 2238
<210> 5
<211> 1959
<212> DNA
<213> 人工序列
<220>
<223> 结构域2
<400> 5
cagggcgaca gcctgcacga gcacatcgcc aacctggccg gcagccccgc catcaagaag 60
ggcatcctgc agaccgtgaa ggtggtggac gagctggtga aggtgatggg ccgccacaag 120
cccgagaaca tcgtgatcga gatggcccgc gagaaccaga ccacccagaa gggccagaag 180
aacagccgcg agcgcatgaa gcgcatcgag gagggcatca aggagctggg cagccagatc 240
ctgaaggagc accccgtgga gaacacccag ctgcagaacg agaagctgta cctgtactac 300
ctgcagaacg gccgcgacat gtacgtggac caggagctgg acatcaaccg cctgagcgac 360
tacgacgtgg accacatcgt gccccagagc ttcctgaagg acgacagcat cgacaacaag 420
gtgctgaccc gcagcgacaa gaaccgcggc aagagcgaca acgtgcccag cgaggaggtg 480
gtgaagaaga tgaagaacta ctggcgccag ctgctgaacg ccaagctgat cacccagcgc 540
aagttcgaca acctgaccaa ggccgagcgc ggcggcctga gcgagctgga caaggccggc 600
ttcatcaagc gccagctggt ggagacccgc cagatcacca agcacgtggc ccagatcctg 660
gacagccgca tgaacaccaa gtacgacgag aacgacaagc tgatccgcga ggtgaaggtg 720
atcaccctga agagcaagct ggtgagcgac ttccgcaagg acttccagtt ctacaaggtg 780
cgcgagatca acaactacca ccacgcccac gacgcctacc tgaacgccgt ggtgggcacc 840
gccctgatca agaagtaccc caagctggag agcgagttcg tgtacggcga ctacaaggtg 900
tacgacgtgc gcaagatgat cgccaagagc gagcaggaga tcggcaaggc caccgccaag 960
tacttcttct acagcaacat catgaacttc ttcaagaccg agatcaccct ggccaacggc 1020
gagatccgca agcgccccct gatcgagacc aacggcgaga ccggcgagat cgtgtgggac 1080
aagggccgcg acttcgccac cgtgcgcaag gtgctgagca tgccccaggt gaacatcgtg 1140
aagaagaccg aggtgcagac cggcggcttc agcaaggaga gcatcctgcc caagcgcaac 1200
agcgacaagc tgatcgcccg caagaaggac tgggacccca agaagtacgg cggcttcgac 1260
agccccaccg tggcctacag cgtgctggtg gtggccaagg tggagaaggg caagagcaag 1320
aagctgaaga gcgtgaagga gctgctgggc atcaccatca tggagcgcag cagcttcgag 1380
aagaacccca tcgacttcct ggaggccaag ggctacaagg aggtgaagaa ggacctgatc 1440
atcaagctgc ccaagtacag cctgttcgag ctggagaacg gccgcaagcg catgctggcc 1500
agcgccggcg agctgcagaa gggcaacgag ctggccctgc ccagcaagta cgtgaacttc 1560
ctgtacctgg ccagccacta cgagaagctg aagggcagcc ccgaggacaa cgagcagaag 1620
cagctgttcg tggagcagca caagcactac ctggacgaga tcatcgagca gatcagcgag 1680
ttcagcaagc gcgtgatcct ggccgacgcc aacctggaca aggtgctgag cgcctacaac 1740
aagcaccgcg acaagcccat ccgcgagcag gccgagaaca tcatccacct gttcaccctg 1800
accaacctgg gcgcccccgc cgccttcaag tacttcgaca ccaccatcga ccgcaagcgc 1860
tacaccagca ccaaggaggt gctggacgcc accctgatcc accagagcat caccggtctg 1920
tacgagaccc gcatcgacct gagccagctg ggcggcgac 1959
<210> 6
<211> 2031
<212> DNA
<213> 人工序列
<220>
<223> 结构域2-修饰的
<400> 6
atgcagggcg acagcctgca cgagcacatc gccaacctgg ccggcagccc cgccatcaag 60
aagggcatcc tgcagaccgt gaaggtggtg gacgagctgg tgaaggtgat gggccgccac 120
aagcccgaga acatcgtgat cgagatggcc cgcgagaacc agaccaccca gaagggccag 180
aagaacagcc gcgagcgcat gaagcgcatc gaggagggca tcaaggagct gggcagccag 240
atcctgaagg agcaccccgt ggagaacacc cagctgcaga acgagaagct gtacctgtac 300
tacctgcaga acggccgcga catgtacgtg gaccaggagc tggacatcaa ccgcctgagc 360
gactacgacg tggaccacat cgtgccccag agcttcctga aggacgacag catcgacaac 420
aaggtgctga cccgcagcga caagaaccgc ggcaagagcg acaacgtgcc cagcgaggag 480
gtggtgaaga agatgaagaa ctactggcgc cagctgctga acgccaagct gatcacccag 540
cgcaagttcg acaacctgac caaggccgag cgcggcggcc tgagcgagct ggacaaggcc 600
ggcttcatca agcgccagct ggtggagacc cgccagatca ccaagcacgt ggcccagatc 660
ctggacagcc gcatgaacac caagtacgac gagaacgaca agctgatccg cgaggtgaag 720
gtgatcaccc tgaagagcaa gctggtgagc gacttccgca aggacttcca gttctacaag 780
gtgcgcgaga tcaacaacta ccaccacgcc cacgacgcct acctgaacgc cgtggtgggc 840
accgccctga tcaagaagta ccccaagctg gagagcgagt tcgtgtacgg cgactacaag 900
gtgtacgacg tgcgcaagat gatcgccaag agcgagcagg agatcggcaa ggccaccgcc 960
aagtacttct tctacagcaa catcatgaac ttcttcaaga ccgagatcac cctggccaac 1020
ggcgagatcc gcaagcgccc cctgatcgag accaacggcg agaccggcga gatcgtgtgg 1080
gacaagggcc gcgacttcgc caccgtgcgc aaggtgctga gcatgcccca ggtgaacatc 1140
gtgaagaaga ccgaggtgca gaccggcggc ttcagcaagg agagcatcct gcccaagcgc 1200
aacagcgaca agctgatcgc ccgcaagaag gactgggacc ccaagaagta cggcggcttc 1260
gacagcccca ccgtggccta cagcgtgctg gtggtggcca aggtggagaa gggcaagagc 1320
aagaagctga agagcgtgaa ggagctgctg ggcatcacca tcatggagcg cagcagcttc 1380
gagaagaacc ccatcgactt cctggaggcc aagggctaca aggaggtgaa gaaggacctg 1440
atcatcaagc tgcccaagta cagcctgttc gagctggaga acggccgcaa gcgcatgctg 1500
gccagcgccg gcgagctgca gaagggcaac gagctggccc tgcccagcaa gtacgtgaac 1560
ttcctgtacc tggccagcca ctacgagaag ctgaagggca gccccgagga caacgagcag 1620
aagcagctgt tcgtggagca gcacaagcac tacctggacg agatcatcga gcagatcagc 1680
gagttcagca agcgcgtgat cctggccgac gccaacctgg acaaggtgct gagcgcctac 1740
aacaagcacc gcgacaagcc catccgcgag caggccgaga acatcatcca cctgttcacc 1800
ctgaccaacc tgggcgcccc cgccgccttc aagtacttcg acaccaccat cgaccgcaag 1860
cgctacacca gcaccaagga ggtgctggac gccaccctga tccaccagag catcaccggt 1920
ctgtacgaga cccgcatcga cctgagccag ctgggcggcg acggcggctc cggacctcca 1980
aagaaaaaga gaaaagtata cccctacgac gtgcccgact acgcctaata a 2031
<210> 7
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 核定位信号
<400> 7
ccaaagaaaa agagaaaagt a 21
<210> 8
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> HA tag
<400> 8
tacccctacg acgtgcccga ctacgcc 27
<210> 9
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> 接头
<400> 9
agcggccagg gc 12
<210> 10
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 接头
<400> 10
Ser Gly Gln Gly
1
<210> 11
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> CCR5外显子2靶序列
<400> 11
tgacatcaat tattatacat cgg 23
<210> 12
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> HPRT外显子3靶序列
<400> 12
gccccccttg agcacacaga ggg 23
<210> 13
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> DMD外显子51靶序列
<400> 13
tcctactcag actgttactc tgg 23
<210> 14
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于T7E1测定法PCR的CCR5外显子2靶标正向引物
<400> 14
ctccatggtg ctatagagca 20
<210> 15
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于T7E1测定法PCR的CCR5外显子2靶标反向引物
<400> 15
gccctgtcaa gagttgacac 20
<210> 16
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 用于T7E1测定法巢式PCR 的CCR5外显子2靶标正向引物
<400> 16
gagccaagct ctccatctag t 21
<210> 17
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于T7E1测定法巢式PCR 的CCR5外显子2靶标反向引物
<400> 17
gccctgtcaa gagttgacac 20
<210> 18
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于深度测序PCR的CCR5外显子2靶标正向引物
<400> 18
ctccatggtg ctatagagca 20
<210> 19
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于深度测序PCR的CCR5外显子2靶标反向引物
<400> 19
gccctgtcaa gagttgacac 20
<210> 20
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 用于深度测序巢式PCR的CCR5外显子2靶标正向引物
<400> 20
acactctttc cctacacgac gctcttccga tctaagatca ctttttattt atgcacagg 59
<210> 21
<211> 54
<212> DNA
<213> 人工序列
<220>
<223> 用于深度测序巢式PCR的CCR5外显子2靶标反向引物
<400> 21
gtgactggag ttcagacgtg tgctcttccg atctatgttg cccacaaaac caaa 54
<210> 22
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于T7E1测定法PCR 的HPRT外显子3靶标正向引物
<400> 22
ccaggttggt gtggaagttt 20
<210> 23
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于T7E1测定法PCR 的HPRT外显子3靶标反向引物
<400> 23
ggacttttga ctccccacaa 20
<210> 24
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于T7E1测定法巢式PCR的HPRT外显子3靶标正向引物
<400> 24
ccaggttggt gtggaagttt 20
<210> 25
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 用于T7E1测定法巢式PCR的HPRT外显子3靶标反向引物
<400> 25
tggtttgcag agattcaaag aa 22
<210> 26
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于深度测序PCR的HPRT外显子3靶标正向引物
<400> 26
ccaggttggt gtggaagttt 20
<210> 27
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于深度测序PCR的HPRT外显子3靶标反向引物
<400> 27
ggacttttga ctccccacaa 20
<210> 28
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 用于深度测序巢式PCR的HPRT外显子3靶标正向引物
<400> 28
acactctttc cctacacgac gctcttccga tcttgctcga gatgtgatga agg 53
<210> 29
<211> 56
<212> DNA
<213> 人工序列
<220>
<223> 用于深度测序巢式PCR的HPRT外显子3靶标反向引物
<400> 29
gtgactggag ttcagacgtg tgctcttccg atctaagaaa acctactgtt gccact 56
<210> 30
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 用于T7E1测定法PCR的DMD外显子51靶标正向引物
<400> 30
acttgtccag gcatgagaat gagca 25
<210> 31
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 用于T7E1测定法PCR的DMD外显子51靶标反向引物
<400> 31
gctgcgtagt gccaaaacaa acagt 25
<210> 32
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 用于T7E1测定法巢式PCR的DMD外显子51靶标正向引物
<400> 32
ccaggcatga gaatgagcaa aatcg 25
<210> 33
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 用于T7E1测定法巢式PCR的DMD外显子51靶标反向引物
<400> 33
ggtaagttct gtccaagccc ggtt 24
<210> 34
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 用于深度测序PCR的DMD外显子51靶标正向引物
<400> 34
acttgtccag gcatgagaat gagca 25
<210> 35
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 用于深度测序PCR的DMD外显子51靶标反向引物
<400> 35
gctgcgtagt gccaaaacaa acagt 25
<210> 36
<211> 56
<212> DNA
<213> 人工序列
<220>
<223> 用于深度测序巢式PCR的DMD外显子51靶标正向引物
<400> 36
acactctttc cctacacgac gctcttccga tctggctctt tagcttgtgt ttctaa 56
<210> 37
<211> 58
<212> DNA
<213> 人工序列
<220>
<223> 用于深度测序巢式PCR的DMD外显子51靶标反向引物
<400> 37
gtgactggag ttcagacgtg tgctcttccg atctggtaag ttctgtccaa gcccggtt 58
<210> 38
<211> 57
<212> DNA
<213> 人工序列
<220>
<223> 用于深度测序巢式PCR的中靶(HBB基因)正向引物
<400> 38
acactctttc cctacacgac gctcttccga tcttgtcttg taaccttgat accaacc 57
<210> 39
<211> 54
<212> DNA
<213> 人工序列
<220>
<223> 用于深度测序巢式PCR的中靶(HBB基因)反向引物
<400> 39
gtgactggag ttcagacgtg tgctcttccg atctgcaacc tcaaacagac acca 54
<210> 40
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 用于深度测序巢式PCR的OT1靶标正向引物
<400> 40
acactctttc cctacacgac gctcttccga tctgaaaggg gaagatccca gag 53
<210> 41
<211> 54
<212> DNA
<213> 人工序列
<220>
<223> 用于深度测序巢式PCR的OT1靶标反向引物
<400> 41
gtgactggag ttcagacgtg tgctcttccg atctatttcc aggctatgct tcca 54
<210> 42
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 用于深度测序巢式PCR的OT3靶标正向引物
<400> 42
acactctttc cctacacgac gctcttccga tcttttgtgt gggatgctga gag 53
<210> 43
<211> 56
<212> DNA
<213> 人工序列
<220>
<223> 用于深度测序巢式PCR的OT3靶标反向引物
<400> 43
gtgactggag ttcagacgtg tgctcttccg atctagctac cacggtgaca gtaaca 56
<210> 44
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 用于深度测序巢式PCR的HBB_48靶标正向引物
<400> 44
acactctttc cctacacgac gctcttccga tctaggaggt gagagtccag tcg 53
<210> 45
<211> 54
<212> DNA
<213> 人工序列
<220>
<223> 用于深度测序巢式PCR的HBB_48靶标反向引物
<400> 45
gtgactggag ttcagacgtg tgctcttccg atctgaacca gctgcctcag actt 54
<210> 46
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 用于深度测序巢式PCR的HBB_75靶标正向引物
<400> 46
acactctttc cctacacgac gctcttccga tcttgggtgg tagatgagga tga 53
<210> 47
<211> 54
<212> DNA
<213> 人工序列
<220>
<223> 用于深度测序巢式PCR的HBB_75靶标反向引物
<400> 47
gtgactggag ttcagacgtg tgctcttccg atctcctggc aaaagtgttt ggat 54
<210> 48
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 中靶序列(HBB基因)
<400> 48
cttgccccac agggcagtaa cgg 23
<210> 49
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 脱靶序列(OT1)
<400> 49
tcagccccac agggcagtaa ggg 23
<210> 50
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 脱靶序列(OT3)
<400> 50
gctgccccac agggcagcaa agg 23
<210> 51
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 脱靶序列(HBB_48)
<400> 51
attgccccac ggggcagtga cgg 23
<210> 52
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 脱靶序列(HBB_75)
<400> 52
gtggccccac agggcaggaa tgg 23
<210> 53
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 携载spCas9的结构域1的腺相关病毒载体中的剪接供体
<400> 53
gtaagtatca aggttacaag acaggtttaa ggagaccaat agaaactggg 50
<210> 54
<211> 83
<212> DNA
<213> 人工序列
<220>
<223> 携载spCas9的结构域2的腺相关病毒载体中的剪接受体
<400> 54
cttgtcgaga cagagaagac tcttgcgttt ctgataggca cctattggtc ttactgacat 60
ccactttgcc tttctctcca cag 83

Claims (25)

1.一种调节基因表达的方法,其包括将表达包含Cas9蛋白质的N末端的第一结构域的重组载体和表达包含Cas9蛋白质的C末端的第二结构域的重组载体中的每个都导入到细胞中,其中所述Cas9蛋白质由所述第一结构域和所述第二结构域组成。
2.根据权利要求1所述的方法,其中所述的基因表达调节为基因组编辑、增加基因表达或减少基因表达。
3.根据权利要求2的所述方法,其中所述基因组编辑为基因敲除或基因敲入。
4.根据权利要求2所述的方法,其中所述基因组编辑是将靶向突变导入到基因组中,或删除、复制、倒置、替换或重排基因组中的DNA。
5.根据权利要求1所述的方法,其中所述Cas9蛋白质为野生型Cas9、失活的Cas9(dCas9)或Cas9切口酶。
6.根据权利要求5所述的方法,其中所述失活的Cas9为包含与dCas9结合的FokI核酸酶结构域的RFN(RNA引导的FokI核酸酶)、或与转录激活因子或阻遏物结构域结合的dCas9。
7.根据权利要求5所述的方法,其中所述Cas9切口酶为D10A Cas9或H840A Cas9。
8.根据权利要求1所述的方法,其中所述Cas9蛋白质衍生自选自下组的任一种:化脓性链球菌(Streptococcus pyogenes)、新凶手弗朗西丝菌(Francisella novicida)、嗜热链球菌(Streptococcus thermophilus)、嗜肺性军团病杆菌(Legionella pneumophila)、无害李斯特(氏)菌(Listeria innocua)和变形链球菌(Streptococcus mutans)。
9.根据权利要求1所述的方法,其中所述重组载体为质粒载体、粘粒载体或病毒载体。
10.根据权利要求9所述的方法,其中所述病毒载体选自下组:逆转录病毒载体、腺病毒载体、腺相关病毒载体和单纯疱疹病毒载体。
11.根据权利要求1所述的方法,其还包括通过融合由所述导入的重组载体中的每个表达的所述第一结构域和所述第二结构域而形成Cas9蛋白质的步骤。
12.根据权利要求1所述的方法,其中所述第一结构域和所述第二结构域中的每一个由具有范围在400bp(碱基对)至3.7kbp(千碱基对)的大小的核苷酸序列编码。
13.根据权利要求1所述的方法,其中所述第一结构域和所述第二结构域中的每一个分别还包含NLS(核定位信号)序列、HA-标签序列、剪接供体序列、剪接受体序列或其组合。
14.根据权利要求1所述的方法,其中所述第一结构域由SEQ ID NO:3的核苷酸序列编码,而所述第二结构域由SEQ ID NO:5的核苷酸序列编码。
15.根据权利要求1所述的方法,其还包括在所述导入到细胞中的步骤中将序列特异性引导RNA导入到细胞中的步骤。
16.根据权利要求15所述的方法,其中导入每个载体和所述引导RNA是以同时、顺序或反向的方式实施的。
17.一种组合物,其包含表达包含Cas9蛋白质的N末端的第一结构域的重组载体和表达包含Cas9蛋白质的C末端的第二结构域的重组载体,其中所述Cas9蛋白质由所述第一结构域和所述第二结构域组成。
18.根据权利要求17所述的组合物,其中所述组合物用于调节基因表达。
19.根据权利要求17所述的组合物,其中所述组合物还包含序列特异性引导RNA。
20.一种用于调节基因表达的试剂盒,所述试剂盒包含根据权利要求17所述的组合物。
21.根据权利要求20所述的试剂盒,其中所述试剂盒还包含序列特异性引导RNA。
22.一种转化细胞,所述细胞被导入了包装包含Cas9蛋白质的N末端的第一结构域的病毒载体以及包装包含Cas9蛋白质的C末端的第二结构域的病毒载体,其中所述Cas9蛋白质由所述第一结构域和所述第二结构域组成。
23.一种组合物,其包含根据权利要求22所述的转化细胞的培养物或细胞裂解物。
24.根据权利要求23所述的组合物,其中所述组合物用于调节基因表达。
25.一种用于细胞内制备Cas9蛋白质的方法,其包括将表达包含Cas9蛋白质的N末端的第一结构域的重组载体和表达包含Cas9蛋白质的C末端的第二结构域的重组载体中的每个都导入细胞,其中所述Cas9蛋白质由所述第一结构域和所述第二结构域组成。
CN201580069646.8A 2014-11-19 2015-11-19 使用由两个载体表达的拆分的Cas9的基因组编辑 Active CN107109422B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR20140161809 2014-11-19
KR10-2014-0161809 2014-11-19
PCT/KR2015/012503 WO2016080795A1 (ko) 2014-11-19 2015-11-19 두 개의 벡터로부터 발현된 cas9 단백질을 이용한 유전자 발현 조절 방법

Publications (2)

Publication Number Publication Date
CN107109422A true CN107109422A (zh) 2017-08-29
CN107109422B CN107109422B (zh) 2021-08-13

Family

ID=56014239

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580069646.8A Active CN107109422B (zh) 2014-11-19 2015-11-19 使用由两个载体表达的拆分的Cas9的基因组编辑

Country Status (6)

Country Link
US (1) US10858662B2 (zh)
EP (1) EP3222728B1 (zh)
JP (2) JP2017534294A (zh)
KR (2) KR20160059994A (zh)
CN (1) CN107109422B (zh)
WO (1) WO2016080795A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114945671A (zh) * 2019-11-01 2022-08-26 上海蓝十字医学科学研究所 靶向性修饰植物基因组序列的方法

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3613852A3 (en) 2011-07-22 2020-04-22 President and Fellows of Harvard College Evaluation and improvement of nuclease cleavage specificity
US9163284B2 (en) 2013-08-09 2015-10-20 President And Fellows Of Harvard College Methods for identifying a target site of a Cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
US9228207B2 (en) 2013-09-06 2016-01-05 President And Fellows Of Harvard College Switchable gRNAs comprising aptamers
US20150166985A1 (en) 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting von willebrand factor point mutations
CA2956224A1 (en) 2014-07-30 2016-02-11 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
US20190225955A1 (en) 2015-10-23 2019-07-25 President And Fellows Of Harvard College Evolved cas9 proteins for gene editing
WO2018027078A1 (en) 2016-08-03 2018-02-08 President And Fellows Of Harard College Adenosine nucleobase editors and uses thereof
AU2017308889B2 (en) 2016-08-09 2023-11-09 President And Fellows Of Harvard College Programmable Cas9-recombinase fusion proteins and uses thereof
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
KR20240007715A (ko) 2016-10-14 2024-01-16 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 핵염기 에디터의 aav 전달
WO2018119359A1 (en) 2016-12-23 2018-06-28 President And Fellows Of Harvard College Editing of ccr5 receptor gene to protect against hiv infection
EP3592853A1 (en) 2017-03-09 2020-01-15 President and Fellows of Harvard College Suppression of pain by gene editing
WO2018165629A1 (en) 2017-03-10 2018-09-13 President And Fellows Of Harvard College Cytosine to guanine base editor
IL269458B2 (en) 2017-03-23 2024-02-01 Harvard College Nucleic base editors that include nucleic acid programmable DNA binding proteins
WO2018209320A1 (en) 2017-05-12 2018-11-15 President And Fellows Of Harvard College Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation
US11732274B2 (en) 2017-07-28 2023-08-22 President And Fellows Of Harvard College Methods and compositions for evolving base editors using phage-assisted continuous evolution (PACE)
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
EP3697906A1 (en) 2017-10-16 2020-08-26 The Broad Institute, Inc. Uses of adenosine base editors
EP3710583A1 (en) * 2017-11-16 2020-09-23 Astrazeneca AB Compositions and methods for improving the efficacy of cas9-based knock-in strategies
US11168141B2 (en) 2018-08-02 2021-11-09 Dyne Therapeutics, Inc. Muscle targeting complexes and uses thereof for treating dystrophinopathies
MX2021011426A (es) 2019-03-19 2022-03-11 Broad Inst Inc Metodos y composiciones para editar secuencias de nucleótidos.
JP2023525304A (ja) 2020-05-08 2023-06-15 ザ ブロード インスティテュート,インコーポレーテッド 標的二本鎖ヌクレオチド配列の両鎖同時編集のための方法および組成物
WO2022114815A1 (ko) * 2020-11-25 2022-06-02 연세대학교 산학협력단 트랜스-스플라이싱 아데노-연관 바이러스 벡터를 포함하는 프라임에디팅용 조성물
WO2022169235A1 (ko) * 2021-02-04 2022-08-11 연세대학교 산학협력단 교정 효율이 개선된 프라임에디팅용 조성물

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070161067A1 (en) * 2006-01-10 2007-07-12 Gambhir Sanjiv S Split protein self complementing fragments, systems, and methods of use thereof
WO2013142578A1 (en) * 2012-03-20 2013-09-26 Vilnius University RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL300199A (en) * 2012-12-06 2023-03-01 Sigma Aldrich Co Llc CRISPR-based genome modification and regulation
SG10201912327SA (en) * 2012-12-12 2020-02-27 Broad Inst Inc Engineering and Optimization of Improved Systems, Methods and Enzyme Compositions for Sequence Manipulation
CA3161835A1 (en) * 2013-03-15 2014-09-25 The General Hospital Corporation Rna-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci
CA2913869C (en) * 2013-05-29 2023-01-24 Cellectis New compact scaffold of cas9 in the type ii crispr system
WO2015073044A1 (en) 2013-11-18 2015-05-21 Interactive Intelligence, Inc. System and method for communication routing
KR101381368B1 (ko) 2013-12-12 2014-04-04 유상근 휴대용 가스레인지의 폭발 방지장치
KR20160097327A (ko) * 2013-12-12 2016-08-17 더 브로드 인스티튜트, 인코퍼레이티드 유전자 산물, 구조 정보 및 유도성 모듈형 cas 효소의 발현의 변경을 위한 crispr-cas 시스템 및 방법
US20160304893A1 (en) * 2013-12-13 2016-10-20 Cellectis Cas9 nuclease platform for microalgae genome engineering

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070161067A1 (en) * 2006-01-10 2007-07-12 Gambhir Sanjiv S Split protein self complementing fragments, systems, and methods of use thereof
WO2013142578A1 (en) * 2012-03-20 2013-09-26 Vilnius University RNA-DIRECTED DNA CLEAVAGE BY THE Cas9-crRNA COMPLEX

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
PATRICK D. HSU 等: "Development and Applications of CRISPR-Cas9 for Genome Engineering", 《CELL》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114945671A (zh) * 2019-11-01 2022-08-26 上海蓝十字医学科学研究所 靶向性修饰植物基因组序列的方法

Also Published As

Publication number Publication date
JP2017534294A (ja) 2017-11-24
EP3222728B1 (en) 2021-07-14
JP2020141683A (ja) 2020-09-10
WO2016080795A1 (ko) 2016-05-26
KR102021585B1 (ko) 2019-09-16
KR20180012834A (ko) 2018-02-06
US10858662B2 (en) 2020-12-08
US20170349905A1 (en) 2017-12-07
KR20160059994A (ko) 2016-05-27
CN107109422B (zh) 2021-08-13
EP3222728A1 (en) 2017-09-27
JP7335200B2 (ja) 2023-08-29
EP3222728A4 (en) 2018-09-12

Similar Documents

Publication Publication Date Title
CN107109422A (zh) 使用由两个载体表达的Cas9蛋白质调节基因表达的方法
US20220251550A1 (en) Methods for extending the replicative capacity of somatic cells during an ex vivo cultivation process
ES2901074T3 (es) Métodos y composiciones para modificaciones genéticas objetivo y métodos de uso
CN109983124A (zh) 使用可编程dna结合蛋白增强靶向基因组修饰
CN113881652B (zh) 新型Cas酶和系统以及应用
EP3704237A1 (en) Novel crispr-associated transposon systems and components
JP2022520428A (ja) Ruvcドメインを有する酵素
CN113373130A (zh) Cas12蛋白、含有Cas12蛋白的基因编辑系统及应用
US11730150B2 (en) Fibrillin-1 mutations for modeling neonatal progeroid syndrome with congenital lipodystrophy
US20190144852A1 (en) Combinatorial Metabolic Engineering Using a CRISPR System
CN108823202A (zh) 用于特异性修复人hbb基因突变的碱基编辑系统、方法、试剂盒及其应用
CN109136272A (zh) 用于特异性修复人hbb基因突变的碱基编辑系统、方法、试剂盒及其在人生殖系中的应用
Korepanov et al. Importance of the 5 S rRNA-binding ribosomal proteins for cell viability and translation in Escherichia coli
Joo et al. Common ancestry of heterodimerizing TALE homeobox transcription factors across Metazoa and Archaeplastida
Kawai et al. Highly efficient transformation of the model zygnematophycean alga Closterium peracerosum‐strigosum‐littorale complex by square‐pulse electroporation
KR20220151175A (ko) 킬로베이스 스케일에서 rna-가이드된 게놈 재조합
JP2024501892A (ja) 新規の核酸誘導型ヌクレアーゼ
CN114395585B (zh) 用于碱基编辑的组合物
RU2706298C1 (ru) НУКЛЕАЗА PaCas9
Lowry The meiotic drive mechanism of a selfish chromosome in Zea mays
CN103849640A (zh) 一种寡核苷酸和可消除质粒共转化用于大肠杆菌必需基因点突变的方法
CN113652411A (zh) Cas9蛋白、含有Cas9蛋白的基因编辑系统及应用
Campbell et al. DNA technology and genomics
Krishnappan Establishing a Working Protocol for Plasmid Cloning and shRNA Design in Endogenous Brachionus manjavacas Gene TRP7
Kedes et al. Molecular genetics and its application to understanding cardiovascular disease

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant