CN109844116A - 包括使用h1启动子对crispr指导rna的改进的组合物和方法 - Google Patents

包括使用h1启动子对crispr指导rna的改进的组合物和方法 Download PDF

Info

Publication number
CN109844116A
CN109844116A CN201780054074.5A CN201780054074A CN109844116A CN 109844116 A CN109844116 A CN 109844116A CN 201780054074 A CN201780054074 A CN 201780054074A CN 109844116 A CN109844116 A CN 109844116A
Authority
CN
China
Prior art keywords
seq
nucleotide sequence
sequence
promoter
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201780054074.5A
Other languages
English (en)
Inventor
V.贾斯库拉-兰加
D.扎克
D.S.威尔斯比
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Johns Hopkins University
Original Assignee
Johns Hopkins University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Johns Hopkins University filed Critical Johns Hopkins University
Publication of CN109844116A publication Critical patent/CN109844116A/zh
Pending legal-status Critical Current

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • A61K9/0012Galenical forms characterised by the site of application
    • A61K9/0014Skin, i.e. galenical aspects of topical compositions
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/43Enzymes; Proenzymes; Derivatives thereof
    • A61K38/46Hydrolases (3)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • A61K9/0012Galenical forms characterised by the site of application
    • A61K9/0019Injectable compositions; Intramuscular, intravenous, arterial, subcutaneous administration; Compositions to be administered through the skin in an invasive manner
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2330/00Production
    • C12N2330/50Biochemical production, i.e. in a transformed host cell
    • C12N2330/51Specially adapted vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/10011Adenoviridae
    • C12N2710/10311Mastadenovirus, e.g. human or simian adenoviruses
    • C12N2710/10341Use of virus, viral particle or viral elements as a vector
    • C12N2710/10344Chimeric viral vector comprising heterologous viral elements for production of another viral vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector

Abstract

本文公开的主题提供包含CRISPR系统(例如CRISPR相关(Cas)9(CRISPR‑Cas9)、非Cas9 CRISPR系统)的改进的组合物和方法。这类组合物可包含对H1启动子区的修饰、5’UTR修饰的添加、H1启动子的不同直向同源序列、具有pol II和pol III活性二者的新型紧凑双向启动子序列、Kozak共有序列的添加、终止序列、条件性pol II/pol III双向启动子表达的添加、用于校正突变的供体模板序列的添加或其组合。本发明的其他方面涉及通过转录后细胞周期调节融合物对Cas9的修饰,工程化部分靶位点使得核酸酶可以在没有DNA切割的情况下结合,自动调节位点和N末端修饰以调节半衰期。

Description

包括使用H1启动子对CRISPR指导RNA的改进的组合物和方法
交叉引用
本申请要求2016年7月5日提交的美国临时申请号62/358,335的权益,其全部内容通过引用并入本文。
背景
成簇的规律间隔的短回文重复(CRISPR)与cas(CRISPR相关)基因一起构成适应性免疫系统,其在细菌和古细菌中提供对入侵外来核酸的获得性抗性(Barrangou等人(2007)Science 315:1709-12)。CRISPR由短的保守重复序列的阵列组成,所述保守重复序列被相似大小的独特可变DNA序列(称为间隔区)间隔,所述间隔区通常来源于噬菌体或质粒DNA(Barrangou等人(2007) Science 315:1709-12;Bolotin等人(2005) Microbiology 151 :2551-61;Mojica等人(2005) J. Mol. Evol. 60:174-82)。CRISPR-Cas系统通过获取插入CRISPR区域并提供抵抗随后暴露于携带匹配序列的噬菌体和质粒的免疫力的短片段的外源DNA(间隔区)起作用(Barrangou等人(2007) Science 315:1709-12;Brouns等人(2008)Science 321:960-64)。正是这种CRISPR-Cas干扰/免疫使得能够对外源核酸进行crRNA介导的沉默(Horvath & Barrangou (2010) Science 327:167-70;Deveau等人(2010) Annu. Rev. Microbiol. 64:475-93;Marraffini & Sontheimer (2010) Nat. Rev. Genet. 11:181-90;Bhaya等人(2011) Annu. Rev. Genet. 45:273-97;Wiedenheft等人(2012)Nature 482:331-338)。
使用依赖于与合成指导RNA(gRNA)偶联的Cas9蛋白的核酸酶活性的CRISPR构建体(Makarova等人(2011) Nat. Rev. Microbiol. 9:467-77)最近彻底改革了基因组工程,允许前所未有的DNA序列操作。CRISPR/Cas9构建体合成简单且快速且可以多路复用。然而,尽管它们的合成相对容易,但CRISPR具有与其对可靶向基因组空间的接近相关的技术限制,所述接近是Cas9本身的性质和其gRNA的合成二者的函数。
被CRISPR系统切割需要gRNA与20个核苷酸的DNA序列和必需的原型间隔区相邻基序(protospacer-adjacent motif,PAM)的互补碱基配对,PAM是在靶位点的3'处发现的短核苷酸基序(Jinek等人(2012) Science 337: 816-821)。理论上,人们可以使用CRISPR技术靶向基因组中的任何独特的N20-PAM序列。PAM序列的DNA结合特异性(其取决于所用特定Cas9的起源种类而变化)提供一个约束。目前,限制性最小且最常用的Cas9蛋白来自酿脓链球菌(S. pyogenes),其识别序列NGG,且因此,可以靶向后接两个鸟苷核苷酸的基因组中的任何独特的21-核苷酸序列(N20NGG)。由蛋白质组分施加的可用靶向空间的扩展受限于发现和使用具有改变的PAM要求的新型Cas9蛋白(Cong等人(2013) Science 339: 819-823;Hou等人(2013) Proc. Natl. Acad. Sci. U.S.A. 110(39):15644-9),或等待经由诱变或定向进化产生新型Cas9变体。
CRISPR系统的第二个技术限制源于在5’鸟苷核苷酸处起始的gRNA表达。III型类别的RNA聚合酶III启动子的使用特别适合于gRNA表达,因为这些短的非编码转录物具有良好限定的末端,且除1+核苷酸之外,转录的所有必需元件被包含在上游启动子区域中。然而,由于常用的U6启动子需要鸟苷核苷酸来起始转录,使用U6启动子进一步将基因组靶向位点限制于GN19NGG(Mali等人(2013) Science 339:823-826;Ding等人(2013) Cell Stem Cell 12:393-394 Ranganathan, V等人Nature communications 5, 4516 (2014))。替代方法如通过T7、T3或SP6启动子的体外转录,也会需要一个或多个起始鸟苷核苷酸(Adhya等人(1981) Proc. Natl. Acad. Sci. U.S.A. 78:147-151;Melton等人(1984) Nucleic Acids Res. 12:7035-7056;Pleiss等人(1998) RNA 4:1313-1317)。
概述
除非另有说明,否则本发明的实践通常采用细胞生物学、细胞培养、分子生物学、转基因生物学、微生物学、重组核酸(例如DNA)技术、免疫学和RNA干扰(RNAi)的常规技术,所述常规技术在本领域的技术内。这些技术中的某些的非限制性描述在下述出版物中发现:Ausubel,F.,等人(编辑),Current Protocols in Molecular Biology、Current Protocols in Immunology、Current Protocols in Protein ScienceCurrent Protocols in Cell Biology,均为John Wiley & Sons,N.Y.,截止2008年12月的版本;Sambrook,Russell和Sambrook,Molecular Cloning. A Laboratory Manual,第3版,ColdSpring Harbor Laboratory Press,Cold Spring Harbor,2001;Harlow,E.和Lane,D.,Antibodies—A Laboratory Manual,Cold Spring Harbor Laboratory Press,ColdSpring Harbor,1988;Freshney,R. I.,“Culture of Animal Cells,A Manual of BasicTechnique”,第5版,John Wiley & Sons,Hoboken,N.J.,2005。关于治疗剂和人类疾病的非限制性信息可在Goodman and Gilman's The Pharmacological Basis of Therapeutics,第11版,McGraw Hill,2005,Katzung,B.(编辑)Basic and Clinical Pharmacology,McGraw-Hill/Appleton & Lange第10版(2006)或第11版(2009年7月)中找到。关于基因和遗传病症的非限制性信息在以下中找到:McKusick,V. A.: Mendelian Inheritance inMan. A Catalog of Human Genes and Genetic Disorders. Baltimore: Johns HopkinsUniversity Press,1998(第12版)或更近的在线数据库:Online Mendelian Inheritancein Man,OMIM™. McKusick-Nathans Institute of Genetic Medicine,Johns HopkinsUniversity(Baltimore,Md.)和National Center for Biotechnology Information,National Library of Medicine(Bethesda,Md.),截至2010年5月1日,可获自万维网:http://www.ncbi.nlm.nih.gov/omim/和Online Mendelian Inheritance in Animals(OMIA),动物物种(除人和小鼠外)的基因、遗传性病症和性状数据库,可获自万维网:http://omia.angis.org.au/contact.shtml。本文提及的所有专利、专利申请和其他出版物(例如,科学论文、书籍、网站和数据库)通过引用整体并入。在说明书与任何引用的参考文献之间冲突的情况下,以说明书(包括其任何修改,其可以基于引用的参考文献)为准。除非另有说明,否则本文使用标准的本领域公认的术语含义。本文使用关于各种术语的标准缩写。
本文提供包含CRISPR/Cas9系统(即,使用H1启动子的CRISPR指导RNA)的改进的组合物和方法。在一些实施方案中,所述改进包括对H1启动子区的修饰。在一些实施方案中,所述组合物包含使用5’UTR修饰增强H1双向pol II表达。在一些实施方案中,所述组合物包含通过使用H1启动子的不同直向同源序列调节双向表达。在一些实施方案中,所述组合物包含具有pol II和pol III活性二者的新型紧凑的双向启动子序列(例如7sk、5’UTR、Kozak共有序列或其组合)。在一些实施方案中,该方法包括具有RNA pol II和RNA pol III活性二者的双向启动子的表达筛选。在一些实施方案中,所述组合物包含条件性pol II/polIII双向启动子表达(例如,TetR和TetO位点),其可调节核糖核蛋白酶活性或RNA指导的核酸酶。在一些实施方案中,所述改进包括加入用于校正突变的供体模板序列(例如,同源定向修复(HDR))。
在本发明的其他实施方案中,所述改进包括对CRISPR/Cas9系统的组分的修饰。在一些实施方案中,对核酸酶(例如,RNA指导的核酸酶)进行修饰。在一些实施方案中,通过转录后细胞周期调节(例如,包含孪蛋白(Gem)或Cdt1的融合蛋白)修饰核酸酶(例如,Cas9)。在一些实施方案中,通过工程化部分靶位点使得核酸酶可以在没有DNA切割的情况下结合来修饰核酸酶(例如,Cas9)。在一些实施方案中,通过使用N-末端氨基酸身份(identity)调节其半衰期来修饰核酸酶(例如,Cas9)。
本发明的一个方面涉及包含一种或多种载体的非天然存在的核酸酶系统,所述载体包含:a)可操作地连接到至少一种编码核酸酶系统指导RNA(gRNA)的核苷酸序列的启动子,其中所述gRNA与细胞中DNA分子或RNA分子的靶序列杂交,且其中所述DNA分子或RNA编码细胞中表达的一种或多种基因产物;和b)可操作地连接到编码基因组靶向核酸酶的核苷酸序列的在细胞中可操作的调节元件,
其中组分(a)和(b)位于所述系统的相同或不同载体上,其中所述gRNA靶向所述靶序列并与之杂交,且所述核酸酶切割所述DNA分子或RNA以改变所述一种或多种基因产物的表达。
在一些实施方案中,该系统是CRISPR(例如CRISPR相关(Cas) 9(CRISPR-Cas9)、非Cas9 CRISPR系统、CRISPR-Cpf-1系统等)。
在一些实施方案中,将该系统包装到单个腺相关病毒(AAV)颗粒中。
在一些实施方案中,腺相关包装病毒选自腺病毒血清型2、腺病毒血清型5或腺病毒血清型35。
在一些实施方案中,腺相关包装病毒是腺病毒血清型5。
在一些实施方案中,该系统使一种或多种基因产物失活。
在一些实施方案中,核酸酶系统切除至少一个基因突变。
在一些实施方案中,启动子选自H1启动子、7sk、人RPPH1-PARP2、SRP-RPS29、7sk1-GSTA4、SNAR-G-1-CGB1、SNAR- CGB2、RMRP-CCDC107、tRNA(Lys)-ALOXE3、RNU6-9-MED16:tRNA (Gly)-DPP9、RNU6-2-THEM259、SNORD13-C8orf41、小鼠RPPH1-PARP2和大鼠RPPH1-PARP2。
在一些实施方案中,启动子是H1启动子。
在一些实施方案中,H1启动子包含与SEQ ID NO:12或32所示的核苷酸序列具有至少80%同一性的核苷酸序列。
在一些实施方案中,H1启动子包含具有SEQ ID NO:12所示的核苷酸序列的核苷酸序列。
在一些实施方案中,H1启动子包含具有SEQ ID NO:32所示的核苷酸序列的核苷酸序列。
在一些实施方案中,启动子与H1启动子是直向同源的。
在一些实施方案中,直向同源H1启动子衍生自真哺乳亚纲的哺乳动物。
在一些实施方案中,直向同源H1启动子衍生自大熊猫(ailuropoda melanoleuca)、牛(bos taurus)、普通狨(callithrix jacchus)、,家犬(canis familiaris)、豚鼠(cavia porcellus)、绿猴(chlorocebus sabaeus)、霍氏树懒(choloepus hoffmanni)、九带犰狳(dasypus novemcinctus)、美洲跳鼠(dipodomys ordii)、家马(equus caballus)、刺猬(erinaceus europaeus)、家猫(felis catus)、大猩猩(gorilla gorilla)、智人(homo sapiens)、十三条纹地松鼠(ictidomys tridecemlineatus)、非洲象(loxodonta africana)、猕猴(macaca mulatta)、小家鼠(mus musculus)、雪貂(mustela putorius furo)、小棕蝠(myotis lucifugus)、白颊长臂猿(nomascus leucogenys)、北美鼠兔(ochotona princeps)、穴兔(oryctolagus cuniculus)、小耳大婴猴(otolemur garnettii)、绵羊(ovis aries)、黑猩猩(pan troglodytes)、东非狒狒(papio anubis)、苏门答腊猩猩(pongo abelii)、蹄兔(procavia capensis)、大狐蝠(pteropus vampyrus)、褐家鼠(rattus norvegicus)、野猪(sus scrofa)、眼镜猴(tarsius syrichta)、树鼩(tupaia belangeri)、宽吻海豚(tursiops truncatus)、羊驼(vicugna pacos)。
在一些实施方案中,直向同源H1启动子衍生自小鼠或大鼠。
在一些实施方案中,直向同源H1启动子包含与SEQ ID NO:84-119所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。
在一些实施方案中,直向同源H1启动子包含由SEQ ID NO:84-119组成的组中所示的核苷酸序列。
在一些实施方案中,H1启动子是双向的。H1启动子是pol II和pol III启动子二者。
在一些实施方案中,H1启动子包含:a)在至少一种编码gRNA的核苷酸序列的一个方向上提供转录的控制元件;和b)在编码基因组靶向核酸酶的核苷酸序列的相反方向上提供转录的控制元件。
在一些实施方案中,启动子是7sk启动子。
在一些实施方案中,7sk启动子衍生自人、大鼠或小鼠。
在一些实施方案中,7sk启动子选自7sk1、7sk2和7sk3。
在一些实施方案中,7sk启动子是7sk1。
在一些实施方案中,7sk1衍生自人。
在一些实施方案中,人7sk1包含与SEQ ID NO:3所示的核苷酸序列具有至少80%同一性的核苷酸序列。
在一些实施方案中,人7sk1包含具有SEQ ID NO:3所示的核苷酸序列的核苷酸序列。
在一些实施方案中,7sk1衍生自小鼠。
在一些实施方案中,小鼠7sk1包含与SEQ ID NO:6具有至少80%同一性的核苷酸序列。
在一些实施方案中,小鼠7sk1包含具有SEQ ID NO:6所示的核苷酸序列的核苷酸序列。
在一些实施方案中,7sk启动子是7sk2。
在一些实施方案中,7sk2衍生自人。
在一些实施方案中,人7sk2包含与SEQ ID NO:4具有至少80%同一性的核苷酸序列。
在一些实施方案中,人7sk2包含具有SEQ ID NO:4所示的核苷酸序列的核苷酸序列。
在一些实施方案中,7sk2衍生自小鼠。
在一些实施方案中,小鼠7sk2包含与SEQ ID NO:7具有至少80%同一性的核苷酸序列。
在一些实施方案中,小鼠7sk2包含具有SEQ ID NO:7所示的核苷酸序列的核苷酸序列。
在一些实施方案中,7sk启动子是7sk3。
在一些实施方案中,7sk3衍生自人。
在一些实施方案中,人7sk3包含与SEQ ID NO:5具有至少80%同一性的核苷酸序列。
在一些实施方案中,人7sk3包含具有SEQ ID NO:5所示的核苷酸序列的核苷酸序列。
在一些实施方案中,7sk3衍生自小鼠。
在一些实施方案中,小鼠7sk3包含与SEQ ID NO:8具有至少80%同一性的核苷酸序列。
在一些实施方案中,小鼠7sk3包含具有SEQ ID NO:8所示的核苷酸序列的核苷酸序列。
在一些实施方案中,启动子具有至少一个修饰。
在一些实施方案中,启动子的至少一个修饰包括允许条件调节的元件。
在一些实施方案中,该元件是tet响应性启动子。
在一些实施方案中,tet响应性启动子包含被工程化到H1启动子中的Tet阻遏物(TetR)和Tet操纵子(TetO)。
在一些实施方案中,TetR包含与SEQ ID NO:14具有至少80%同一性的氨基酸序列。
在一些实施方案中,TetR包含具有SEQ ID NO:14所示的氨基酸序列的氨基酸序列。
在一些实施方案中,TetO包含与SEQ ID NO:11所示的核苷酸序列具有至少80%同一性的核苷酸序列。
在一些实施方案中,TetO包含具有SEQ ID NO:11所示的核苷酸序列的核苷酸序列。
在一些实施方案中,H1-TetO包含与SEQ ID NO:13所示的核苷酸序列具有至少80%同一性的核苷酸序列。
在一些实施方案中,H1-TetO包含具有SEQ ID NO:13所示的核苷酸序列的核苷酸序列。
在一些实施方案中,启动子的至少一个修饰包括允许自动调节的位点。
在一些实施方案中,自动调节位点包含与SEQ ID NO:33或34所示的核苷酸序列具有至少80%同一性的核苷酸序列。
在一些实施方案中,自动调节位点包含SEQ ID NO:33所示的核苷酸序列。
在一些实施方案中,自动调节位点包含SEQ ID NO:34所示的核苷酸序列。
在一些实施方案中,该方法还包括至少一个终止子序列。
在一些实施方案中,至少一个终止子序列选自SV40或合成的聚A(SPA)序列。
在一些实施方案中,终止子序列是SV40 120(SEQ ID NO:123)或240(SEQ ID NO:122)碱基对序列。
在一些实施方案中,终止子序列是SPA 49碱基对序列。
在一些实施方案中,该方法还包含5’非翻译区(5’UTR)序列。
在一些实施方案中,该方法还包括Kozak序列。
在一些实施方案中,Kozak序列包含与SEQ ID NO:1或2具有至少80%同一性的核苷酸序列。
在一些实施方案中,Kozak序列包含SEQ ID NO:1所示的核苷酸序列。
在一些实施方案中,Kozak序列包含SEQ ID NO:2所示的核苷酸序列。
在一些实施方案中,该方法还包含介导不依赖帽的翻译起始的RNA序列。
在一些实施方案中,RNA序列选自6.947或6.967。
在一些实施方案中,基因组靶向的核酸酶是Cas9蛋白。
在一些实施方案中,Cas9包含与SEQ ID NO:61所示的核苷酸序列具有至少80%同一性的核苷酸序列。
在一些实施方案中,Cas9包含SEQ ID NO:61所示的核苷酸序列。
在一些实施方案中,Cas9包含至少一个修饰。
在一些实施方案中,Cas9中的至少一个修饰包括切割序列的改变。
在一些实施方案中,切割序列的改变选自T2A、P2A、E2A和F2A。
在一些实施方案中,T2A包含与SEQ ID NO:36所示的核苷酸序列具有至少80%同一性的氨基酸序列。
在一些实施方案中,T2A包含具有SEQ ID NO:36所示的核苷酸序列的氨基酸序列。
在一些实施方案中,P2A包含与SEQ ID NO:35所示的核苷酸序列具有至少80%同一性的氨基酸序列。
在一些实施方案中,P2A包含具有SEQ ID NO:35所示的核苷酸序列的氨基酸序列。
在一些实施方案中,E2A包含与SEQ ID NO:37所示的核苷酸序列具有至少80%同一性的氨基酸序列。
在一些实施方案中,E2A包含具有SEQ ID NO:37所示的核苷酸序列的氨基酸序列。
在一些实施方案中,F2A包含与SEQ ID NO:38所示的核苷酸序列具有至少80%同一性的氨基酸序列。
在一些实施方案中,F2A包含具有SEQ ID NO:38所示的核苷酸序列的氨基酸序列。
在一些实施方案中,Cas9中的至少一个修饰包含针对在细胞中表达而优化的密码子。
在一些实施方案中,Cas9还包含在框内与细胞周期依赖性蛋白质可操作地融合的接头序列(Cas9融合物)。
在一些实施方案中,细胞周期依赖性蛋白质选自APE2、ATR、BRCA1、Chk1、Cdc5、Cdc6、Cdc7、Cdc45、Cdt1、CSA、CSB、Ctf18、DDB1、DDB2、DNA2、DUT、Elg1、EndoV、Esp1、核酸外切酶1、FBH1、FEN1、孪蛋白、Hus1、KNTC2 (NDC80)、Ku80、连接酶1、Mad2、MBD4、Mcm3、Mcm4、Mcm5、Mcm6、Mcm7、Mcm8、Mcm10、MGMT、MLH3、Mms4、MPG、MSH2、Mus81、NBS1、NEIL2、NEIL3、NTH1、Orc1、Orc3、PARP1、PCNA、Pif1、PMS1、PMS2、PNK、Pola p180、Pola p70、Pola Spp1(Prim2a)、Polb、Pold p125、Pole Dpb3、Pole Dpb4、Pole Pol2、Poli、Poll、Polm、Psf1、Psf2、Psf3、Rad1、Rad18、Rad23A、Rad23B、Rad51、Rad51D、Rad54、Rad6A、RPA34、RPA70、Scc1、Scc3、Sir2、SIRT1 (Sirtuin)、TDG、TDP1、TIMELESS、Tin2、拓扑异构酶I、拓扑异构酶IIIa、拓扑异构酶IIIb、Ubc13、UNG、XAB2、XPC、XPF、XPG、Xrcc2和XRCC4。
在一些实施方案中,细胞周期依赖性蛋白质是孪蛋白。
在一些实施方案中,细胞周期依赖性蛋白质是人孪蛋白。
在一些实施方案中,人孪蛋白包含位置1-110的氨基酸(hGem(1-110))。
在一些实施方案中,hGem(1-110)包含与SEQ ID NO:19中所示的氨基酸序列具有至少80%同一性的氨基酸序列。
在一些实施方案中,hGem(1-110)包含SEQ ID NO:19中所示的氨基酸序列。
在一些实施方案中,细胞周期依赖性蛋白质是Cdt1。
在一些实施方案中,细胞周期依赖性蛋白质是人Cdt1。
在一些实施方案中,人Cdt1包含位置30-120的氨基酸(hCdt1(30-120))。
在一些实施方案中,hCdt1(30-120)包含与SEQ ID NO:18所示的氨基酸序列具有至少80%同一性的氨基酸序列。
在一些实施方案中,hCdt1(30-120)包含SEQ ID NO:18中所示的氨基酸序列。
在一些实施方案中,Cas9融合物包含与选自SEQ ID NO:20-27的氨基酸序列具有至少80%同一性的氨基酸序列。
在一些实施方案中,Cas9融合物包含选自SEQ ID NO:20-27的氨基酸序列。
在一些实施方案中,Cas9在框内可操作地与遍在蛋白融合(UB-Cas9)。
在一些实施方案中,Ub-Cas9具有至少一个N末端修饰。
在一些实施方案中,N末端修饰的Ub-Cas9包含与选自SEQ ID NO:39-58的氨基酸序列具有至少80%同一性的氨基酸序列。
在一些实施方案中,N-末端修饰的Ub-Cas9包含选自SEQ ID NO:39-58的氨基酸序列。
在一些实施方案中,遍在蛋白包含与SEQ ID NO:60所示的核苷酸序列具有至少80%同一性的核苷酸序列。
在一些实施方案中,遍在蛋白包含SEQ ID NO:60所示的核苷酸序列。
在一些实施方案中,该方法还包含SaCas9切口酶。
在一些实施方案中,该方法还包含供体模板序列。
在一些实施方案中,至少一种载体包含与SEQ ID NO:62或67所示的核苷酸序列具有至少80%同一性的核苷酸序列。
在一些实施方案中,至少一种载体包含SEQ ID NO:62所示的核苷酸序列。
在一些实施方案中,至少一种载体包含SEQ ID NO:67所示的核苷酸序列。
在一些实施方案中,供体模板序列校正至少一个基因突变。
在一些实施方案中,至少一个基因突变是rd10或rd12。
在一些实施方案中,至少一种载体包含与SEQ ID NO:63或64所示的核苷酸序列具有至少80%同一性的核苷酸序列。
在一些实施方案中,至少一种载体包含SEQ ID NO:63所示的核苷酸序列。
在一些实施方案中,至少一种载体包含SEQ ID NO:64所示的核苷酸序列。
在一些实施方案中,至少一种载体包含与SEQ ID NO:65或66所示的核苷酸序列具有至少80%同一性的核苷酸序列。
在一些实施方案中,至少一种载体包含SEQ ID NO:65所示的核苷酸序列。
在一些实施方案中,至少一种载体包含SEQ ID NO:66所示的核苷酸序列。
在一些实施方案中,启动子可操作地连接到至少一个、两个、三个、四个、五个、六个、七个、八个、九个或十个gRNA。
在一些实施方案中,靶序列包含核苷酸序列AN19NGG、GN19NGG、CN19NGG或TN19NGG。
在一些实施方案中,细胞是真核细胞或非真核细胞。
在一些实施方案中,真核细胞是哺乳动物或人细胞。
在一些实施方案中,真核细胞是视网膜感光细胞。
在一些实施方案中,一种或多种基因产物是视紫红质。
在一些实施方案中,一种或多种基因产物的表达降低。
本发明的另一方面涉及改变细胞中一种或多种基因产物的表达的方法,其中所述细胞包含编码所述一种或多种基因产物的DNA分子,所述方法包括将如上所述的非天然存在的核酸酶系统引入细胞中。
在一些实施方案中,该系统使一种或多种基因产物失活。
在一些实施方案中,核酸酶系统切除至少一个基因突变。
在一些实施方案中,一种或多种基因产物的表达降低。
在一些实施方案中,细胞是真核或非真核细胞。
在一些实施方案中,真核细胞是哺乳动物或人细胞。
在一些实施方案中,细胞是视网膜感光细胞。
在一些实施方案中,细胞是视网膜神经节细胞。
在一些实施方案中,真核细胞是癌细胞。
在一些实施方案中,癌细胞中的细胞增殖被抑制或减少。
在一些实施方案中,癌细胞中的细胞凋亡增强或增加。
本发明的另一方面涉及在有此需要的受试者中治疗选自视网膜营养不良、角膜营养不良、微卫星扩张疾病和癌症的疾病的方法,该方法包括:(a)提供如上所述的非天然存在的核酸酶系统;和(b)向受试者施用有效量的所述系统。
在一些实施方案中,该疾病是角膜营养不良。
在一些实施方案中,该疾病是视网膜营养不良。
在一些实施方案中,视网膜营养不良选自利伯氏先天性黑蒙(Leber’scongenital amaurosis,LCA)、视网膜色素变性(RP)和青光眼。
在一些实施方案中,角膜营养不良选自上皮基底膜营养不良、上皮复发性糜烂营养不良、上皮下粘液性角膜营养不良、遗传性青少年性角膜上皮营养不良、Lisch上皮角膜营养不良、凝胶状滴状角膜营养不良、雷-布二氏(Reis-Bucklers)角膜营养不良、Thiel–Behnke角膜营养不良、格子状角膜营养不良1型(经典)、格子状角膜营养不良2型、格子状角膜营养不良III型、格子状角膜营养不良IIIA型、格子状角膜营养不良I/IIIA型、格子状角膜营养不良IV型、多形性(角膜)淀粉样变性、颗粒状角膜营养不良1型、颗粒状角膜营养不良2型、黄斑角膜营养不良、Schnyder角膜营养不良、先天性基质角膜营养不良、斑点状角膜营养不良、后部无定形角膜营养不良、弗朗索瓦中央云雾状营养不良(Central CloudyDystrophy of Francois)、德斯密膜前角膜营养不良(Pre-Descemet CornealDystrophy)、富克斯(Fuchs)内皮角膜营养不良、多形性角膜后层营养不良(PosteriorPolymorphous Corneal Dystrophy)、先天性遗传性内皮营养不良和X连锁内皮角膜营养不良。
在一些实施方案中,微卫星扩张疾病选自睑裂狭小、上睑下垂和倒转型内眦赘皮并指(ptosis and epicanthus inversus syndactyly)、颅骨锁骨发育不良、先天性中枢肺换气不足综合征、Haddad综合征DM(强直性肌营养不良)、FRAXA(脆性X综合征)、FRAXE(脆性XE智力低下)、FRDA(弗里德赖希氏共济失调(Friedreich's ataxia))、富克斯内皮角膜营养不良、FXTAS(脆性X相关震颤/共济失调综合征)、手足生殖器综合征、HD(亨廷顿病)、前脑无裂畸形、智力低下伴生长激素缺乏、智力低下、癫痫、韦斯特综合征(West syndrome)、帕廷综合征(Partington syndrome)、眼咽肌营养不良、SBMA(脊髓和延髓肌肉萎缩症)、SCA1(脊髓小脑性共济失调1型)、SCA12(脊髓小脑性共济失调12型)、SCA17(脊髓小脑性共济失调17型)、SCA2(脊髓小脑性共济失调2型)、SCA3(脊髓小脑性共济失调3型或马-约病(Machado-Joseph disease))、SCA6(脊髓小脑性共济失调6型)、SCA7(脊髓小脑性共济失调7型)、SCA8(脊髓小脑性共济失调8型)和并指。
在一些实施方案中,通过植入、注射或经病毒进行向受试者施用。
在一些实施方案中,通过视网膜下注射进行向受试者施用。
在一些实施方案中,局部、血管内、皮内、透皮、胃肠外、静脉内、肌肉内、鼻内、皮下、区域、经皮、气管内、腹膜内、动脉内、膀胱内、肿瘤内、肿瘤周围、吸入、全身、灌注、灌洗、经由注射直接、或经由施用和制剂口服进行向受试者施用。
在一些实施方案中,施用到受试者局部发生在眼睛表面。
在一些实施方案中,施用到受试者发生在角膜、巩膜之上或之外,眼内、结膜下、筋膜下(sub-tenon)或眼球后空间、或眼睑内或周围。
在一些实施方案中,用至少一种另外的抗癌剂治疗受试者。
在一些实施方案中,抗癌剂选自紫杉醇、顺铂、托泊替康、吉西他滨、博来霉素、依托泊苷、卡铂、多西他赛、多柔比星、托泊替康、环磷酰胺、曲贝替定(trabectedin)、奥拉帕利、他莫昔芬、来曲唑和贝伐单抗。
在一些实施方案中,用至少一种另外的抗癌疗法治疗受试者。
在一些实施方案中,抗癌疗法是放射疗法、化学疗法或手术。
在一些实施方案中,癌症是实体瘤。
在一些实施方案中,癌症选自脑癌、胃肠癌、口腔癌、乳腺癌、卵巢癌、前列腺癌、胰腺癌、肺癌、肝癌、咽喉癌、胃癌和肾癌。
在一些实施方案中,癌症是脑癌。
在一些实施方案中,全身施用选自口服、静脉内、皮内、腹膜内、皮下和肌肉内施用。
在一些实施方案中,受试者是哺乳动物。
在一些实施方案中,哺乳动物是人。
已在上文中陈述了本文公开主题的某些方面,其全部或部分地由本文公开主题解决,当与如本文下文最佳描述的所附实施例和附图结合进行描述时,其他方面将变得显而易见。
附图简述
因此已经概括地描述了本文公开主题,现在将参考附图,所述附图不一定按比例绘制,并且其中::
图1包括六个图,A-F,其显示5’UTR序列对H1 Pol II表达的影响。图1A-IC显示5’UTR和翻译增强子对H1 Pol II表达的影响。图1D和1E显示5’UTR Kozak序列对H1 Pol II表达的影响。图1F描绘终止子序列。功能性终止子大致相同。最短的有效终止子是49bp SPA终止子。
图2包括三个图,A、B和C,其显示通过使用不同的直向同源序列调节双向表达。
图3包括两个图,A和B,其显示不同的直向同源序列的H1比对。
图4包括两个图,A和B,其显示来自双向启动子的Pol II和Pol III突变体的筛选。
图5显示不同直向同源序列的进一步H1比对。
图6包括两个图,A和B,其显示关于调节核糖核蛋白酶活性使用TetO进行的H1 PolIII表达的条件表达。图6A显示H1启动子中的工程化TetO位点的示意图。图6B显示来自工程化H1的Pol II表达不受Tet操纵子序列的存在的很大影响。
图7包括两个图,A和B,其显示调节核糖核蛋白酶活性的H1 Pol III表达的条件表达。图7A显示Pol III表达在TetR存在下且不存在多西环素时被阻遏。图7B显示Pol III表达在TetR存在和多西环素存在下被去阻遏。
图8包括两个图,A和B,其显示调节核糖核蛋白酶活性的H1 Pol III表达的条件表达。图8A显示在多西环素存在下的活性酶复合物。图8B显示不存在多西环素时的无活性酶复合物。
图9包括三个图,A、B和C,其显示细胞对DNA断裂的响应的示意图。图9A显示对DNA断裂的细胞响应通过细胞周期调节。图9B显示细胞周期的阶段很大程度上决定DNA途径的选择。图9C显示RNA指导的核酸酶可以与hGEM1或hCDT1结构域融合,导致这些蛋白质的细胞周期依赖性调节。
图10包括三个图,A、B和C。图10A显示在S期、G2期和M期期间有活性的细胞周期调节的构建体(顶部),和在G1期期间有活性的细胞周期调节的构建体(底部)。图10B显示用于将EcoRI位点敲入视紫红质基因的寡核苷酸序列,以及CRISPR靶标和切割位点的位置。图10C显示HDR成功进入视紫红质基因并将EcoRI位点掺入基因后的序列。
图11包括三个图,A、B和C。图11A显示对不同细胞周期调节的构建体使用T7 EndoI测定以及使用不同量的供体寡核苷酸序列进行的NHEJ的定量。图11B显示对不同细胞周期调节的构建体使用EcoRI测定以及使用不同量的供体寡核苷酸序列进行的HDR的定量。图11C显示NHEJ和HDR数据的定量。Gem构建体优先诱导HDR,而Cdt构建体优先诱导NHEJ。二者(gem/cdt)的混合物是没有融合的类似Cas9,且NHEJ和HDR的总体速率在所有条件下大致相等,如预期的那样。
图12包括两个图,A和B,其显示使用部分靶位点自动调节RNA指导的核酸酶。图12A显示在靶位点具有完全互补性的Cas9导致DNA切割(白色箭头)。图12B显示具有广泛碱基配对但没有互补性的Cas9仍然结合,然而没有DNA切割活性。
图13包括三个图,A、B和C,其显示使用部分靶位点自动调节RNA指导的核酸酶。图13A显示聚合酶与20碱基靶序列的结合。图13B显示dCas9(Cas9的核酸酶死亡形式)与DNA结合但不切割。当与启动子区域和活性转录区域结合时,这可抑制转录,可能是由于空间效应。图13C显示具有广泛碱基配对但没有互补性的Cas9仍然结合,然而没有DNA切割活性。
图14显示使用部分靶位点自动调节RNA指导的核酸酶。在所需位点的完全互补性导致DNA切割(白色箭头)(左下图描绘)。在工程化启动子位点处的不完全互补性导致没有DNA切割和其自身表达的抑制(右下图描绘)。
图15显示使用部分靶位点:GFP报道物对RNA指导的核酸酶的自动调节。条形图显示来自工程化H1的Pol II表达不受部分靶序列的存在的极大影响。
图16显示使用部分靶位点:Cas9和gRNA对RNA指导的核酸酶的自动调节。
图17包括两个图,A和B。图17A显示后接甘氨酸(Gly)、脯氨酸(Pro)、丝氨酸(Ser)、苏氨酸(Thr)、丙氨酸(Ala)、缬氨酸(Val)或半胱氨酸(Cys)的甲硫氨酸(Met)通过甲硫氨酸氨肽酶加工,所述甲硫氨酸氨肽酶切除N-末端甲硫氨酸。图17B显示N末端规则用作细胞内蛋白质半衰期的估计。
图18显示线性聚遍在蛋白在细胞中被脱遍在蛋白酶识别,所述脱遍在蛋白酶切割单个Ub肽。通过将Ub融合至任何蛋白质的N-末端,可以指派该过程以产生特异性N-末端残基。
图19包括两个图,A和B,其显示N-末端氨基酸的简单变化(通过Met-氨肽酶、脱遍在蛋白化或替代方法)可以实现RNA指导的核酸酶半衰期的调节。图19A和19B显示Cas9(RNA指导的核酸酶)的水平可以通过N-末端氨基酸的身份调节多达8-10倍(核酸酶表达的显著范围)。
图20显示还可如何利用常用的2A肽来调节细胞中的蛋白质水平。
图21包括三个图,A-C,其描绘AAV包装容量的图示。野生型AAV为~4.7kb且重组AAV可填充至多达5.2kb。图21B描绘使用H1双向启动子表达SpCas9和单个gRNA的AAV病毒大小的图示。图21C描绘使用更强的小鼠启动子的构建体。使用人启动子进行第一组实验。图21B构建体使用SV40终止子,其用较小的SPA终止子代替。
图22包括九个图,A-I。图22A描绘AAV递送问题。通过常规方法表达Cas9和gRNA所需的DNA超过5.2kb:Pol II启动子(~0.5kb)、SpCas9(~4.1kb)、Pol II终止子(~0.2kb)、U6启动子(~0.3kb)和gRNA(~0.1kb)。图22B显示金黄色葡萄球菌(S. aureus) Cas9比酿脓链球菌(S. pyogenes) Cas9小~1kb,这允许其包装到AAV中。图22C描绘H1基因组基因座,其指示以正向表达的H1RNA(pol III转录物),以及以反定转录的PARP-2基因(pol II转录物)。这个~200bp序列是一个非常紧凑的双向启动子。图22D描绘将“指令”缩小以递送最常用且最广泛研究的Cas9蛋白SpCas9。重要的是,SpCas9蛋白可以靶向比SaCas9蛋白远远更多的基因组位点数量。这意味着可以靶向更多的突变/疾病。图22E显示将“指令”缩小以递送许多其他Cas9蛋白,其已被显示在真核细胞中的基因组编辑中是有效的。我们还可以比通过使用标准启动子更紧凑得多的载体递送SaCas9。图22F显示本发明能够对远远更多数量的基因组靶标以及因此对远远更多数量的潜在突变和疾病具有潜力。图22G描绘使用H1双向启动子表达SaCas9和单个gRNA的AAV病毒大小的图示。大约1kb的空间可用作HDR模板。图22H描绘使用H1双向启动子表达SaCas9和单个gRNA和模板的AAV病毒大小的图示。图22I显示以下:1.腺相关病毒(AAV)是基因治疗中最安全且最常用的载体。该病毒有一个缺点:它非常小。2.天然上,它由4700个核苷酸的单链DNA基因组组成。基因组的末端是称为ITR(橙色)的反向重复序列。3.这些序列(各自~150bp)是将DNA包装到AAV中的唯一必需元件,因此可以去除病毒序列(Rep和Cap)。4.任何货物(蓝色)都可以插入ITR之间且该病毒总共可以填充多达5200个核苷酸,这意味着该病毒可以容纳高达4900个核苷酸的货物。5.重组腺相关病毒(rAAV)被用作将货物递送到细胞中的高效载体。一旦进入细胞内,单链基因组将变成双链且将在细胞的整个寿命中保持在内部。
图23显示来自含有Cas9、单个gRNA和模板的的单一AAV病毒的位点特异性重组的机制。
图24包括两个图,A和B。图24A显示AAV载体内的HDR递送的潜在配置。图24B显示在AAV载体内RNA指导聚合酶的基因内区内HDR递送的潜在配置。
图25包括两个图,A和B。图25A显示使用SaCas9和单个gRNA和模板的Cas9 切口酶方法的图示。图25B显示用于校正隐性RPE65突变的rd12靶向序列的描述。
图26包括两个图,A和B。图26A显示使用H1双向启动子表达SpCas9和单个gRNA的AAV病毒大小的图示。大约0.7kb的空间可用作HDR模板。图26B显示在单个AAV中递送RNA指导的核酸酶、指导RNA和模板的一般方法。
图27描绘用于校正隐性PDE6b突变的rd10靶向序列。
图28描绘通过插入HDR模板可容易地定制的克隆载体。
图29包含两个图,A和B。图29A描绘具有pol II和III活性二者的紧凑双向启动子序列的卡通示意图和表格。图29B描绘显示包含图29A中所示的紧凑双向启动子序列的构建体的GFP表达的条形图。图29B从右侧的y轴开始并沿x轴向左移动显示条柱的以下标签:1)负对照,2) hH1Koz (SEQ ID NO: 71 (或SEQ ID NO: 12或32)),3) hSk1 (SEQ ID NO:73),4) biSRP (SEQ ID NO: 72),5) biCGB1 (SEQ ID NO: 74),6) biAloxE3 (SEQ IDNO: 77),7) biDPP9 (SEQ ID NO: 79),8) biTHEM (SEQ ID NO: 83),和9) biORF (SEQID NO: 80)。
图30包含两个图,A和B。图30A描绘具有pol II和III活性二者的直向同源双向启动子序列的卡通示意图和表格。图30B描绘显示包含图30A中所示的直向同源双向启动子序列的构建体的GFP表达的条形图。图30B从右侧的y轴开始并沿x轴向左移动显示条柱的以下标签:1)负对照,2) hH1+(对应于人RPPH1-PARP2),3) mH1+(对应于小鼠RPPH1-PARP2)和4)rH1+(对应于大鼠RPPH1-PARP2)。
详述
本文公开主题现在将参考附图在下文中更全面地描述,所述附图中显示了本文公开主题的一些但并非全部实施方案。相同的数目自始至终指相同的要素。本文公开主题可以以许多不同的形式体现,并且不应被解释为限于本文阐述的实施方案;相反,提供这些实施方案使得本公开内容满足适用的法律要求。实际上,本文公开主题所属领域的技术人员将会想到本文阐述的本文公开主题的许多修改和其他实施方案,其具有前述描述和相关附图中呈现的教导的益处。因此,应理解,本文公开主题并不限于所公开的特定实施方案,并且修改和其他实施方案预期包括在所附权利要求的范围内。
基因组编辑技术,例如锌指核酸酶(ZFN)(Porteus和Baltimore(2003)Science300: 763;Miller等人(2007)Nat. Biotechnol. 25:778-785;Sander等人(2011)Nature Methods 8:67-69;Wood等人(2011)Science 333:307)和类转录激活因子效应物核酸酶(TALEN)(Wood等人(2011)Science 333:307; Boch等人(2009)Science 326:1509-1512;Moscou和Bogdanove(2009)Science 326:1501;Christian等人(2010)Genetics 186:757-761; Miller等人(2011)Nat. Biotechnol. 29:143-148;Zhang等人(2011)Nat. Biotechnol. 29:149-153;Reyon等人(2012)Nat. Biotechnol. 30:460-465)已赋予生成靶向基因组修饰的能力,并且提供了精确校正疾病突变的潜力。虽然有效,但这些技术受到实际局限性的阻碍,因为ZFN和TALEN对均需要对于给定的DNA靶位点合成大而独特的识别蛋白。几个团体最近已报道了通过使用工程化的II型CRISPR/Cas9系统的高效基因组编辑,所述系统克服了这些关键局限性(Cong等人(2013)Science 339:819-823;Jinek等人(2013)eLife 2:e00471;Mali等人(2013)Science 339:823-826;Cho等人(2013)Nat. Biotechnol. 31:230-232;Hwang等人(2013)Nat. Biotechnol. 31:227-229)。与相对耗时且难以制造的ZFN和TALEN不同,依赖与合成指导RNA(gRNA)偶联的Cas9蛋白的核酸酶活性的CRISPR构建体合成简单且快速,并且可以多重使用。然而,尽管它们的合成相对容易,但CRISPR具有与其接近可靶向基因组空间相关的技术局限性,这是Cas9本身的特性和其gRNA的合成两者的函数。
被CRISPR系统切割需要gRNA与20个核苷酸的DNA序列和必需的原型间隔区相邻基序(PAM)的互补碱基配对,PAM是在靶位点的3'处发现的短核苷酸基序(Jinek等人(2012)Science 337: 816-821)。理论上,人们可以使用CRISPR技术靶向基因组中的任何独特的N20-PAM序列。PAM序列的DNA结合特异性(其取决于所用特定Cas9的起源种类而变化)提供一个约束。目前,限制性最小且最常用的Cas9蛋白来自酿脓链球菌,其识别序列NGG,且因此,可以靶向后接两个鸟苷核苷酸的基因组中的任何独特的21-核苷酸序列(N20NGG)。由蛋白质组分施加的可用靶向空间的扩展受限于发现和使用具有改变的PAM要求的新型Cas9蛋白(Cong等人(2013)Science 339: 819-823;Hou等人(2013)Proc. Natl. Acad. Sci. U.S.A.,110(39):15644-9),或等待经由诱变或定向进化产生新型Cas9变体。CRISPR系统的第二个技术限制源于在5’鸟苷核苷酸处起始的gRNA表达。III型类别的RNA聚合酶III启动子的使用特别适合于gRNA表达,因为这些短的非编码转录物具有良好限定的末端,且除1+核苷酸之外,转录的所有必需元件被包含在上游启动子区域中。然而,由于常用的U6启动子需要鸟苷核苷酸来起始转录,使用U6启动子进一步将基因组靶向位点限制于GN19NGG(Mali等人(2013)Science 339:823-826;Ding等人(2013)Cell Stem Cell 12:393-394)。替代方法如通过T7、T3或SP6启动子的体外转录,也会需要一个或多个起始鸟苷核苷酸(Adhya等人(1981)Proc. Natl. Acad. Sci. U.S.A. 78:147-151;Melton等人(1984)Nucleic Acids Res. 12:7035-7056;Pleiss等人(1998)RNA 4:1313-1317)。
本文公开的主题涉及包含CRISPR/Cas9系统(即使用H1启动子的CRISPR指导RNA;WO2015/19561,其通过引用以其整体并入本文)的改进的组合物和方法。这种修饰的CRISPR/Cas9系统可包含对H1启动子区的修饰。在一些实施方案中,修饰的CRISPR/Cas9系统包括使用5’UTR修饰增强H1双向pol II表达。在一些实施方案中,修饰的CRISPR/Cas9系统包括通过使用H1启动子的不同直向同源序列调节双向表达。在一些实施方案中,修饰的CRISPR/Cas9系统包含具有pol II和pol III活性二者的新型紧凑双向启动子(包括紧凑和直向同源启动子)序列(例如7sk、5’UTR、Kozak共有序列或其组合)。
在一些实施方案中,修饰的CRISPR/Cas9系统包含条件性pol II/pol III双向启动子(包括紧凑和直向同源启动子)表达(例如,TetR和TetO位点),其可以调节核糖核蛋白酶活性或RNA指导的核酸酶。在一些实施方案中,所述改进包括加入用于校正突变的供体模板序列(例如,同源定向修复(HDR))。
在一些实施方案中,紧凑双向启动子包括但不限于RPPH1-PARP2(人)、SRP-RPS29、7sk1-GSTA4、SNAR-G-1-CGB1、SNAR-CGB2、RMRP-CCDC107、tRNA(Lys)-ALOXE3、RNU6-9-MED16: tRNA (Gly)-DPP9、RNU6-2-THEM259或SNORD13-C8orf41。
在一些实施方案中,直向同源双向启动子包括但不限于RPPH1-PARP2(小鼠)或RPPH1-PARP2(大鼠),或衍生自大熊猫、牛、普通狨、家犬、豚鼠、绿猴、霍氏树懒、九带犰狳、美洲跳鼠、家马、刺猬、家猫、大猩猩、智人、十三条纹地松鼠、非洲象、猕猴、小家鼠、雪貂、小棕蝠、白颊长臂猿、北美鼠兔、穴兔、小耳大婴猴、绵羊、黑猩猩、东非狒狒、苏门答腊猩猩、蹄兔、大狐蝠、褐家鼠、野猪、眼镜猴、树鼩、宽吻海豚、羊驼的那些。
表3:紧凑双向启动子的实例
RPPH1-PARP2(人):
GGAATTCGAACGCTGACGTCATCAACCCGCTCCAAGGAATCGCGGGCCCAGTGTCACTAGGCGGGAACACCCAGCGCGCGTGCGCCCTGGCAGGAAGATGGCTGTGAGGGACAGGGGAGTGGCGCCCTGCAATATTTGCATGTCGCTATGTGTTCTGGGAAATCACCATAAACGTGAAATGTCTTTGGATTTGGGAATCTTATAAGTTCTGTATGAGACCACTTTTTCCC (SEQ ID NO:71)
SRP-RPS29:
CTTGCTCTCAGCAGTGCAACGAGGTAAAAGGAAGAAGCTGGCCCACGCATGCGCTCTTCAAATTTTTGAGACAGTTTACCCAGAATGCAGTGCTCAAAGGAAACGCGTGCGCAGTGTGGTCAGGTTGTTTCGCTGGGTGAGTAAAATGAAATCTTAGAGGCGTTGTGGGCTGGCCCAGTTGATGACGTCACCATACCACAGCTTCTAGTGCTATTCTGCGCCGGTATCCGACC (SEQ ID NO:72)
7sk1-GSTA4:
AGTATTTAGCATGCCCCACCCATCTGCAAGGCATTCTGGATAGTGTCAAAACAGCCGGAAATCAAGTCCGTTTATCTCAAACTTTAGCATTTTGGGAATAAATGATATTTGCTATGCTGGTTAAATTAGATTTTAGTTAAATTTCCTGCTGAAGCTCTAGTACGATAAGCAACTTGACCTAAGTGTAAAGTTGAGACTTCCTTCAGGTTTATATAGCTTGTGCGCCGCTTGGGTACCTC (SEQ ID NO:73)
SNAR-G-1-CGB1:
GTCTCTCTCTTAGCGGGATATCTTCCGCAAGCACTGGGAATGTGGACATGGAAAGTAAATTGAGTCTCCGTGGGGGAGTGAGACAGGGAGTGAGGGGTGTTGGACGCGGCACGGGAACCTGGCCAGAGTCAGCGGACCCAATTGGCTGCTCTCTCTCAGATGCAGTTCCCCTTCCTCCCTCCAGGGGGCGCCACGGAACGCAGGGCCCTCACTGGCCCTGGGGACTGGGTGACGTCAGGGATGAGCCTCTTGTGATTGGCTCCATCACCCTGCGTAAGATCAAAGGGAAGAAAGGATGGGCCCGACAA (SEQ ID NO:74)
SNAR-CGB2:
GTCTCTCTCTTAGCGGGATATCTTCCGCAAGCACTGGGGATGTGGACATGGAAAGTAAATTGAGTCTCCGTGGGGGAGTGAGACAGGGAGTGAGGGGTGTTGGACGCGGCACGGGAACCCGGCCGGAGTCAGCGGACCCAATTGGCTGCTCTCTCTCAGATACAGTTCCCCTTCCTCCCTCCAGGGGGCGCCACGGAACGCAGGGCCCTCACTGGCCCTGGGGACTGGGTGACGTCAGGGGTGAGCCTCTCCTGATTGGCTCCATCACCCTGCGTAAGGTCAAAAGGAAGAAAGGAGATCCCCGACAC (SEQ ID NO:75)
RMRP-CCDC107:
TGCCGGCCCACGGGTGGAGGGATCGGGCGGGCGGTGCCGAAGCGGTCCGGCATTGGCCGGCCGCCCCAACGCGCACGCGCACGCGAGCAGGCCGGCCGGCTCCGGGGAGGCCACGCCCACTCCCCGTAGGGCGGGGCCAGACCATATTTGCATAAGATAGTGTCATTCTAGCTTTCCTGTATTTGTTCATTTCGTGTCTATTAGCTATTCTGCTAGCCACAATGCCTCTGAAAGCCTATAGTCTTAGAAAGTTATGCCCGAAAACGGTTTTTTTAATCTCACGCCACCAACTTTCTCACCCTAATCATAAAACACAATTTCTTTAGGGCTATAAAATACTACTCTGTGAAGCTGAGGACGT (SEQ ID NO:76)
tRNA(Lys)-ALOXE3:
TCTTTCCGCTCCAGGACCGCCCTGGGCCTGCAGGATCCTGGGCGGGAGCCCAGGTGTCCGGGATCTGGGCCACTAGGGACTGGGGAGGAACCTCTCAGAGAAGCCCATAGCCCGCAGCGGCCCCGCGCGGCCGGTTCCGGCGCCGCACTGTTCCAGCCTCTACTATGGTACAGTCCCTGCGTCGCAGCCTCGGCGGGGGCTCTAAGAACGGGAGGCAGAAAAAGCTCAATCAGCAGCAGGCGAGCTTCACCCGCTGCTTCCAAATCTGTGCCAAAATATTCTATGCTGCACAGATAAAATCCTCTGTCGGTTCTACAAGCCTGGCTTTTCCTATAGAGAACCCTCTTATAAGCAAAAAGTAAAGCTCTCGTGAAGA(SEQ ID NO:77)
RNU6-9-MED16:
GAGGGCAGTCACCAGCTCCTGGCCCGTGCGCCAAGCTCAGCGGGCGTCCGCGGTGCGATCTTCCCTAGCGCCTCGGGTCTGGCGCCGCCATCTTCCTCGGTAACAACCAGTCGCCTGAGGCGTGGGGCCGCCTCCCAAAGACTTCTGGGAGGGCGGTGCGGCTCAGGCTCTGCCCCGCCTCCGGGGCTATTTGCATACGACCATTTCCAGTAATTCCCAGCAGCCACCGTAGCTATATTTGGTAGAACAACGAGCACTTTCTCAACTCCAGTCAATAACTACGTTAGTTGCATTACACATTGGGCTAATATAAATAGAGGTTAAATCTCTAGGTCATTTAAGAGAAGTCGGCCTATGTGTACAGACATTTGTTCCAGGGGCTTTAAATAGCTGGTGGTGGAACTCAATATTC (SEQ ID NO:78)
tRNA (Gly)-DPP9:
TAACCGCTCAGCTGACCTCAGGAGGGCAGGGGTGCCTTCTAAAGGGTCCAGAGAGCCTCCATTCCAGCTGCAGGCGTGGGACACAGACCGGGACGTGGGGCGGCGGCCGGACTGGGCAGGTCGTCCCGGGTCCAGCGGCGCCTCACGGTCGCGGCTCCATGCCCGGGACTGCGACCCCGGAAGTGGCGGGAGCGGGGGACGACAGCCGCGGCGGACACAGGGGACCCGCCGGCTCAGGCACCTTTGACCCGGAAGTTGAGCGACCCAGGCGGCGGCCTGGGATTGGACACCACCAGGCACGTACCAAGGCGTCCGCGGCGCTTGGGGGGGAGCCCGCGGCGCGGCGGCCTAAGGTGCGTAACGCCCCATGAACGACATCTTCCGGTGGGTTAGGGAGAGACACCCCCCTGTGACTTGGTATCACTCAGTCAAACCCATGATCCCCCACTATTAAGGATATCCGGAGAGGATGCTACCTATCAGG (SEQ ID NO:79)
SNORD13- C8orf41:
TCCTGACTGCAGCACCAGAAGGCTGGTCTCTCCCACAGAACGAGGATGGAGGCGGGGAGGGATCCGTTGAAGAGGGAAGGAGCGATCACCCAAAGAGAACTAAAATCAAATAAAATAAAACAGAGAGATGTCTTGGAGGAGGGGGCGAGTCTGACCGGGATAAGAATAAAGAGAAAGGGTGAACCCGGGAGGCGGAGTTTGCAGTGAGCCGAGATCGCGCCACTGCACTCCAGCCTGGGCGACAGAGTGAGACTCCGTCTCAGTAAAAAAAAAAAAAAAAAAAAGAATAAAGAGGAAAGGACGCAAGAAAGGGAAAGGGGACTCTCAGGGAGTAAAAGAGTCTTACACTTTTAACAGTGACGTTAAAAGACTACTGTTGCCTTTCTGAAGACTAAAAAGAAAAAAAACTTAAAAATTTAAAGAAATAAACTTCTGAGCCATGTCACCAACTTAACCACCCCCAGGTACCTGCAACGGCTCGCGCCCGCCGGTGTCTAACAGGATCCGGACCTAGCTCATATTGCTGCCGCAAAACGCAAGGCTAGCTTCCGCCAGTACTGCCGCAACACCTTCTTATTTCACGACGTATGGTCGTAAAGCAATAAAGATCCAGGCTCGGGAAAATGACGGAGAGGTGGAACTATAGAGAATAAATTTGCATATATAATAATCCGCTCGCTAATTGTGTTTCTGTTTTCCTTTGCTAAGGTAGAAACAAAAGAATAATCACAGAATCTCAGTGGGACTTTGAAAATATCCAGGATTTTATACGTGAAGAATGGATGTATCGCATTACGGTAGTCACCCTATGTGTAAATTAGTGGCACATACTTGGCACTCCTTAATGTCAACTATAAGATG (SEQ ID NO:80)
RNU6-2-THEM259;
GCCTCCCAGCGTCGCGCCCTAACGACCCGCAAGTGTCCGAGGGCGCCTCCCGGCCGCCATCGGCCGCCCTCGCAGCCGCCGCTCTCCTCACGGCCTCCCGGCCGCCGCCGCCATCTTCCGCTTTCTCGTCCGGCTGCGGCGCTGCTGACGCTAGCGAGTCGCCACGCCGGGCAAGAGCGGCCCCCCTGCGCCCGCAGAGAACGCTGGGATGCCAGCGGCGCCCGCGGAGGCCTCACCCCCTACCTCGGCCGCTCCAGGGGGCGGGCCTGCATCTGGGCCACCTCTTTTGCATATTGGCACCCACAATCCACCGCGGCTATGAGGCCAGTATAAGGCGGTAAAATTACGATAAGATATGGGATTTTACGTGATCGAAGACATCAAAGTAAGCGTAAGCACGAAAGTTGTTCTGCAACATACCACTGTAGGAAATTATGCTAAATATGAAACCGACCATAAGTTATCCTAACCAAAAGATGATTTGATTGAAGGGCTTAAAATAGGTGTGACAGTAACCCTTGAGTC(SEQ ID NO:83)
表4:直向同源双向启动子的实例
RPPH1-PARP2 (小鼠):
CGCTCTTGAAGGACGACGTCATCATCCCTTGCCCGGATGCGCGGGCTTCTTGTCTAGCACAGGAGCCTGGGGTAGAGCGCATGCAAATTACGCGCTGTGCTTTGTGGGAAATCACCCTAAACGAAAAATTTATTCCTCTTTCGAGCCTTATAGTGGCGGCCGGTCTACATCC (SEQ ID NO:81)
RPPH1-PARP2 (大鼠):
GGCTGATGAGCTTCCCCCGCCCACTAGGAGTGTGAAGACCTGCCGCCATAATAAGACTCCAAAAGACAGTGAATTTAACACTTACGGTGACTTCCCACAAAGCACAGCGTGTAATTTGCATGCGCTCTAGCCCAGGCTCCAGCTCCGGACCAGAAGCCCGCGCATCCCGGCAAAGGGTGATGACGTCGTCCTTCAAGCGCT (SEQ ID NO:82)
在一些实施方案中,对核酸酶(例如,RNA指导的核酸酶)进行修饰。在一些实施方案中,通过转录后细胞周期调节(例如,包含孪蛋白(Gem)或Cdt1的融合蛋白)修饰核酸酶(例如,Cas9)。在一些实施方案中,通过工程化部分靶位点使得核酸酶可以在没有DNA切割的情况下结合来修饰核酸酶(例如,Cas9)。在一些实施方案中,通过使用N-末端氨基酸身份调节其半衰期来修饰核酸酶(例如,Cas9)。
这种修饰的CRISPR/Cas9系统可以更高的功效、安全性和精确性精确地靶向基因组位点,或促进缺陷基因组位点的修复。此外,该修饰提供紧凑的CRISPR/Cas9系统,其允许相对于现有的CRISPR、TALEN或锌指技术更高分辨率的癌基因靶向。
本发明的其他方面涉及包含具有RNA pol II和RNA pol III活性二者的额外双向启动子的表达筛选的方法。
I. 改进/修饰CRISPR/Cas9系统
A. 组合物
在一些实施方案中,本文公开的主题涉及包含先前在WO2015/195621(通过引用以其整体并入本文)中描述的CRISPR/Cas9系统的改进的组合物。这种改进包括包含一种或多种载体的非天然存在的核酸酶系统(例如,CRISPR-Cas9),所述载体包含:a)可操作地连接到至少一种编码核酸酶系统指导的RNA(gRNA)的核苷酸序列的启动子(例如,直向同源H1启动子或7sk),其中gRNA与细胞中DNA分子的靶序列杂交,且其中所述DNA分子编码在细胞中表达的一种或多种基因产物;和b)可操作地连接到编码基因组靶向核酸酶(例如,修饰的Cas9蛋白)的核苷酸序列的在细胞中可操作的调节元件,其中组分(a)和(b)位于所述系统的相同或不同载体上,其中所述gRNA靶向所述靶序列并与之杂交,且所述核酸酶切割所述DNA分子以改变所述一种或多种基因产物的表达。在一些实施方案中,将系统包装到单个腺相关病毒(AAV)颗粒中。在一些实施方案中,该系统使一种或多种基因产物失活。在一些实施方案中,该系统切除至少一个基因突变。在一些实施方案中,H1启动子包含与SEQ ID NO:12或32所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,直向同源H1启动子衍生自小鼠或大鼠。在一些实施方案中,直向同源H1启动子包含与SEQ ID NO:84-119所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,直向同源H1启动子包含由SEQ ID NO:84-119组成的组中所示的核苷酸序列。在一些实施方案中,H1启动子包含:a)在至少一种编码gRNA的核苷酸序列的一个方向上提供转录的控制元件;和b)在编码基因组靶向核酸酶的核苷酸序列的相反方向上提供转录的控制元件。在一些实施方案中,启动子是人、小鼠或大鼠7sk启动子。在一些实施方案中,7sk选自7sk1(7sk的变体1,其使用内源性GSTA4 5’UTR),7sk2(7sk的变体2,其仅使用5’UTR中的kozak序列),和7sk3(使用β珠蛋白5’UTR的7sk的变体)。在一些实施方案中,人7sk1包含与SEQ ID NO:3所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,小鼠7sk1包含与SEQ ID NO:6具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,人7sk2包含与SEQ ID NO:4具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,小鼠7sk2包含与SEQ ID NO:7具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,人7sk3包含与SEQ ID NO:5具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,小鼠7sk3包含与SEQ ID NO:8具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,直向同源H1启动子或7sk启动子具有至少一个修饰。在一些实施方案中,启动子的至少一个修饰包括允许条件调节的元件。在一些实施方案中,该元件是tet响应性启动子。在一些实施方案中,tet响应性启动子包含Tet阻遏物(TetR)和Tet操纵子(TetO),其被工程化到H1启动子中。在一些实施方案中,TetR包含与SEQ ID NO:14具有至少80%、85%、90%、95%、98%、99%或100%同一性的氨基酸序列。在一些实施方案中,TetO包含与SEQ ID NO:11所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,H1-TetO包含与SEQ ID NO:13所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,启动子的至少一个修饰包括允许自动调节的位点。在一些实施方案中,自动调节位点包含与SEQ ID NO:33或34所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,核酸酶系统还包含至少一个终止子序列。在一些实施方案中,终止子序列是选自SEQ IDNO:120-130的任何核酸。在一些实施方案中,至少一个终止子序列选自SV40或合成的聚A(SPA)序列。在一些实施方案中,终止子序列是SV40 120(SEQ ID NO:123)或240(SEQ IDNO:122)碱基对序列。在一些实施方案中,终止子序列是SPA 49碱基对序列。在一些实施方案中,核酸酶系统还包含5’非翻译区(5’UTR)序列。在一些实施方案中,核酸酶系统还包含Kozak序列。在一些实施方案中,Kozak序列包含与SEQ ID NO:1或2具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,核酸酶系统还包含介导不依赖帽的翻译起始的RNA序列。在一些实施方案中,RNA序列选自6.947或6.967(WellensiekI. (2013) Nature Methods, 10:747-750)。在一些实施方案中,Cas9包含与SEQ ID NO:61所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,Cas9包括至少一个修饰。在一些实施方案中,Cas9中的至少一个修饰包括切割序列的改变。在一些实施方案中,核酸酶选自Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9 (也称为Csn1和Csx12)、Cas10、Cas13a、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、Cpf1、C2c1、C2c2、和C2c3。在一些实施方案中,切割序列的改变选自T2A、P2A、E2A和F2A。在一些实施方案中,T2A包含氨基酸序列,其与SEQ ID NO:36所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性。在一些实施方案中,P2A包含与SEQ ID NO:35所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的氨基酸序列。在一些实施方案中,P2A包含具有SEQ ID NO:35所示的核苷酸序列的氨基酸序列。在一些实施方案中,E2A包含与SEQ ID NO:37所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的氨基酸序列。在一些实施方案中,F2A包含与SEQ ID NO:38所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的氨基酸序列。在一些实施方案中,Cas9中的至少一个修饰包含针对在细胞中表达而优化的密码子。在一些实施方案中,Cas9还包含在框内与细胞周期依赖性蛋白质可操作地融合的接头序列(Cas9融合物)。在一些实施方案中,细胞周期依赖性蛋白质选自APE2、ATR、53BP1、BRCA1、Chk1、Cdc5、Cdc6、Cdc7、Cdc45、Cdt1、CSA、CSB、Ctf18、CtIP、DDB1、DDB2、DNA2、DUT、Elg1、EndoV、Esp1、核酸外切酶1、FBH1、FEN1、孪蛋白、Hus1、KNTC2 (NDC80)、Ku80、连接酶1、Mad2、MBD4、Mcm3、Mcm4、Mcm5、Mcm6、Mcm7、Mcm8、Mcm10、MGMT、MLH3、Mms4、MPG、MSH2、Mus81、NBS1、NEIL2、NEIL3、NTH1、Orc1、Orc3、PARP1、PCNA、Pif1、Pin1、PMS1、PMS2、PNK、Pola p180、Pola p70、Pola Spp1 (Prim2a)、Polb、Pold p125、Pole Dpb3、Pole Dpb4、Pole Pol2、Poli、Poll、Polm、Psf1、Psf2、Psf3、Rad1、Rad18、Rad23A、Rad23B、Rad51、Rad51D、Rad54、Rad6A、Rag1、Rag2、RPA34、RPA70、Scc1、Scc3、Sir2、SIRT1 (Sirtuin)、TDG、TDP1、TIMELESS、Tin2、拓扑异构酶I、拓扑异构酶IIIa、拓扑异构酶IIIb、Ubc13、UNG、XAB2、XPC、XPF、XPG、Xrcc2和XRCC4。在一些实施方案中,细胞周期依赖性蛋白质是孪蛋白。在一些实施方案中,细胞周期依赖性蛋白质是人孪蛋白。在一些实施方案中,人孪蛋白包含位置1-110的氨基酸(hGem(1-110))。在一些实施方案中,hGem(1-110)包含与SEQ ID NO:19中所示的氨基酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的氨基酸序列。在一些实施方案中,细胞周期依赖性蛋白质是Cdt1。在一些实施方案中,细胞周期依赖性蛋白质是人Cdt1。在一些实施方案中,人Cdt1包含位置30-120的氨基酸(hCdt1(30-120))。在一些实施方案中,hCdt1(30-120)包含与SEQ ID NO:18所示的氨基酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的氨基酸序列。在一些实施方案中,Cas9融合物包含与选自SEQ ID NO:20-27的氨基酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的氨基酸序列。在一些实施方案中,Cas9在框内可操作地与遍在蛋白融合(UB-Cas9)。在一些实施方案中,Ub-Cas9具有至少一个N末端修饰。在一些实施方案中,N-末端修饰的Ub-Cas9包含与选自SEQ ID NO:39-58的氨基酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的氨基酸序列。在一些实施方案中,遍在蛋白包含与SEQ ID NO:60所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,核酸酶系统还包含SaCas9切口酶。在一些实施方案中,核酸酶系统还包含供体模板序列。在一些实施方案中,至少一种载体包含与SEQ ID NO:62或67所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,供体模板序列校正至少一个基因突变。在一些实施方案中,至少一个基因突变是rd10或rd12。在一些实施方案中,至少一种载体包含与SEQ ID NO:63或64所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,至少一种载体包含与SEQ ID NO:65或66所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,启动子可操作地连接到至少一个、两个、三个、四个、五个、六个、七个、八个、九个或十个gRNA。在一些实施方案中,靶序列包含核苷酸序列AN19NGG、GN19NGG、CN19NGG或TN19NGG。在一些实施方案中,细胞是真核细胞或非真核细胞。在一些实施方案中,真核细胞是哺乳动物或人细胞。在一些实施方案中,真核细胞是视网膜感光细胞。在一些实施方案中,一种或多种基因产物是视紫红质。在一些实施方案中,一种或多种基因产物的表达降低。
表5:直向同源H1序列的实例
小家鼠
TTCAGGATGTAGACCGGCCGCCACTATAAGGCTCGAAAGAGGAATAAATTTTTCGTTTAGGGTGATTTCCCACAAAGCACAGCGCGTAATTTGCATGCGCTCTACCCCAGGCTCCTGTGCTAGACAAGAAGCCCGCGCATCCGGGCAAGGGATGATGACGTCGTCCTTCAAGAGCG (SEQ ID NO:84)
褐家鼠
AGGAGTGTGAAGACCTGCCGCCATAATAAGACTCCAAAAGACAGTGAATTTAACACTTACGGTGACTTCCCACAAAGCACAGCGTGTAATTTGCATGCGCTCTAGCCCAGGCTCCAGCTCCGGACCAGAAGCCCGCGCATCCCGGCAAAGGGTGATGACGTCGTCCTTCAAGCGCT (SEQ ID NO:85)
美洲跳鼠
AGGAAAGACTTCGCTGAGGCAGACTTTATAAGGCTCCCGCGCAGAAAGAAACTTTATAGTTATGGTGATTTCCCACAAGCCACTGCGTCATGCAAATAAAGCAGGGTACGGCTTCCATGTACCTTAAGGTTTTTTTCTAGGCCGCGTACGCTCTGCGTATTCAGCCACGTGACCCTGAGCCAGTGGTTGTTGGGAGCACGTTGTGGACCTCTGCGTTTGGATTCC(SEQ ID NO:86)
十三条纹地松鼠
GAAAGGGACTCCGCACAAGCAGAGTTTATAAGGCTCCCATCTGTACAGCCATTTCTCGGTCATGGTAACTACCCACAACACACAGCGATATGCAAATATAGCAGAGCGTGTCTTCCCGCGCGCGCCTGGTCGTCTCGGCGCCGGCGCGCTGCGTGGGGCGGAACTGTGACAGAGACCCTGCGATTCCTGGGAGCTGGCTGATGACATCAGTGTCTAACCTCC(SEQ ID NO:87)
豚鼠
GAGAAAGAAAGGCTCAAACCTAGCCTTATAAGGCTCCCAAATGTCGGTATATTTTTTGGTTATGGTGACTTCCCACAATGCATAGCGATATGTAGATATTGCCAGGAGTACCTCCCACTTCTGGTCCTGTCAGCTCTTTTCTAGGACGCGCGCGCTGCAGGTTTCCAGCCTGTGATTGGGCCAGCAATTCCGGGAATGAATTGATGACGTCAGCGTTTGAATTCC(SEQ ID NO:88)
北美鼠兔
GGGGGAAGCTGGGCTCGATCAGCCTTTATAAAGCTCCAAAAACTCAAGACATTTTTCTGTTACGGTGGCTTCCCACAGTACACAGCGACATGCAAATAGCTTGCCAATGAATTCGCGGACCGCTTCCCGCCCCGGCGCAGGCGCGCGGACGCTGTCTCCCCTGGACGCGCGCTCGCGGTTCCCGGGAGCTGGCTGATGACGTTCGGTCTCC (SEQ ID NO:89)
穴兔
GGGGAGAGGTGGATCCGAACAGACTTTATAAAGCTCCGAAAGCCCAAGGCATCTTTCCCTTACGGTAGCTTCCCACAAGACATAGCGACATGCAAATTTCTTGAAGTATGCTTCAGACGCGCTTCTCGCCACAGCGCAAGCGCGCTGTGTGCTGACGCGGGAACGGGCCAGGGCGCGGTTCCCGGGAGCGGGTTGATGACGTTAGATCTCC (SEQ ID NO:90)
普通狨
GAGGAAAAGTAGTCCCACAGACAACTTATAAGATTCCCATACCCTAAGACATTTCACGATTATGGTGACTTCCCAGAAGACACAGCGACATGCAAATATTGCAGGTCGTGTTTCGCCTGTCCCTCACAGTCGTCTTCCTGCCAGGGCGCACGCGCGCTGGGTTTCCCGCCAACTGACGCTGGGCTCGCGATTCCTTGGAGCGGGTTGATGACGTCAGCGTTTGAATTCC (SEQ ID NO:91)
绿猴
GGGGAAGGGTGGTCCCTTACAGAACTTATAAGATTCCCAAACTCAAAGACATTTCACGTTTATGGTGACTTCCCAGAAGACATAGCGACATGCAAATATTGCAGGGCGTCACACCCCTCTCCCTCACAGTCATCTTCCTGCCAGGGCGCACGCGCGCTGGGTGTTCTCGCGTAGTGACACTGGGCCCGCGATTCCTTGGAGCGGGTTGATGACGTCAGCGTTCGAATTCC (SEQ ID NO:92)
猕猴
GGGGAAGGGTGGTCCCACACAGAACTTATAAGATTCCCATACTCAAAGACATTTCTCGTTTATGGTGACTTCCCAGAAGACACAGCGACATGCAAATATTGTAGGGCGTCACACCCCTGTCCCTCACAGTCATCTTCCTGCCAGGGCGCACGCGCGCTGGGTGTTCCCGCGTAGTGACACTGGGCCCGCGATTCCTTGGAGCGGGTTGATGACGTCAGCGTTCGAATTCC (SEQ ID NO:93)
东非狒狒
GGGGAAAGGTGGTACCATACAGAACTTATAAGATTCCCATACTCAAAGACATTTCACGATTATGGTGACTTCCCAGAAGACACAGCGACATGCAAATATTGTAGGGCGTCACACCCCCTGTCCCTCACAGTCATCTTCCTGCCAGGGCGCACGCGCGCTGGGTGTTCCCGCGTAGTGACACTGGGCCCGCGATTCCTTGGAGCGGGTTGATGACGTCAGCGTTCGAATTCC (SEQ ID NO:94)
大猩猩
GGGAAAGGGTGGTCCCACACAGAACTTATAAGACTCCCATATCCAAAGACATTTCACGGTTATGGTGATTTCCCAGAACACATAGCGACATGTAAATATTGCAGGGCGCCACTCCCCAGTCCCTCACAGCCATCTTCCTGCCAGGGCGCACGCGCGCTGGGTGTTCCCGCCTAGTGACACTGGGCCCGCGATTCCTTGGAGCGGGTTGATGACGTCAGCGTTCGAATTCC (SEQ ID NO:95)
智人
GGGAAAAAGTGGTCTCATACAGAACTTATAAGATTCCCAAATCCAAAGACATTTCACGTTTATGGTGATTTCCCAGAACACATAGCGACATGCAAATATTGCAGGGCGCCACTCCCCTGTCCCTCACAGCCATCTTCCTGCCAGGGCGCACGCGCGCTGGGTGTTCCCGCCTAGTGACACTGGGCCCGCGATTCCTTGGAGCGGGTTGATGACGTCAGCGTTCGAATTCC (SEQ ID NO:96)
黑猩猩
GGGAAAGGGTGGTGCCACACAGAACTTATAAGATTCCCATATGCAAAGACATTTCACGTTTATGGTGATTTCCCAGAACACATAGCGACATGCAAATATTGCAGGGCGCCACTCCCCTGTCCCTCACTGCCATCTTCCTGCCAGGGCGCACGCGCGCTGGGTGTTCCCGCCTAGTGACACTGGGCCCGCGATTCCTTGGAGCGGGTTGATGACGTCAGCGTTCGAATTCC (SEQ ID NO:97)
苏门答腊猩猩
GAGAAAGGGTGGTCCCGTCCAGAACTTATAAGATTCCCATACCCAAAGACATTTCACGTTTATGGTGACTTCCCAGAATGCATAGCGACATGCAAATATTGCAGGGCGTCACTCCCCTGTCCCTCACAGCCATCTTCCTGCCAGGGCGCCCGCGCGCTGGTGTTCCCGCCTAGTGACACTGGGCCCACGATTCCTTGGAGCGGGTTGATGACGTCAGCGCTCGTATTCC (SEQ ID NO:98)
白颊长臂猿
GGGGAAAAGTAGTAGACCTTATAAGATTCCCAAACCCAAAGACATTTCTCGTTTATGGTGACTTCCCAGAAGACATAGCGACATGCAAATATTGCAGGGCGCCACTCCCCTGTCCCTCACAGCCATCTTCCTGCCAGGGCGCACGCGCGCTGGGTGTTCCCGCCTAGTGACACTCGGCCCGCGATTCCTTGGAGCGGGTTGATGACGTCAGCGTTCGAATTCC(SEQ ID NO:99)
眼镜猴
GCGAGAGGGTGGGTCCACACAGAGCTTATAAGGTTCACAAGTAAAGATATTTCACGGTGACGGTGACTTCCCACAATACACTGCGACATGCAAATATAGCCGGGCGTGCCTCCCCGATCCCGGAAGAGCGACTCCTAGCCAGTGCGCACGCGCGCTGCGTGTTCGCGTCCTAGGTCGCTGGGCCCGCGGTTCCTGGGAGCGGGTGGTGACGTCAGCGGCCCAGCTTC (SEQ ID NO:100)
小耳大婴猴
GCCTAAAAGGGCGCTTGCACAGAATTTATAAGGTTCCCAAACAGAGACACATTTCATTATTATGGTGACTTCCCACAATGCACAGCGCCATGCAAATATGCTAGGACGCCTCCCCCCGCTACCTTAAGGTCGTCAACTAACCAGTGCGCGCGCGCACTGCGCGTTTCCCGCCGGTGACTCAATGCCCGCGTTTGGTGGGAGCTAGTTGGTGACCTCAGTTCTGGAGGCTC (SEQ ID NO:101)
树鼩
GGGGGAAGCTGGGTCCACTGAGTTCTTATAAGGTTTCCAGTCCTAGAGCGATTTTACCATTGCGGTGATTTCCCAGCATCCGTAGCTACATGCAAATAGCGCGGGGCGCGTCTCTCAGGTCCCTCCCCGCCCTCTCACTGTACGTACCCGCGTCCTAGGGACGCCGCGCCCGGGGTTCCCGGACGTCAGCGTTCCGACGCA (SEQ ID NO:102)
大熊猫
AGGGAAAGCCGCGCCTGGGGCGGATTTATAAGGCTTCCATATCTAAAGGCATTTCACAGTCATGGTGACTTCCCACAATACATAGCAACATGCAAATATCGCGGGGAGAACCTCCCCTGTCCCTTGTACGCGGCTTCTAAAGACGCACGCGCGCTCTGTGTTCCCGCCCTGTGACTCTAGGCGGGCAATTCCTGGGACAGTGTTCTGACGGGAACGTTCAGGCTCC (SEQ ID NO:103)
雪貂
GGGAAAGGGTGGACCCACCGAGCATTTATAAGGCTCCCGCATCTAAAGACATTTTACAGTTATGGTGACTTCCCACAACGCGTAGCAACATGCAAATATCGTGGAGAGTACCGCCCCTGTCCCATGCACGCGTCTTCTCAGCAGCACGCACGCGCGCTGTGTTCCCGCCCTGTGACTCCAGGCGGGTATTTCCAGGGGCGGGTTGCTGACAGGAACGTTCAGGCTTC (SEQ ID NO:104)
家犬
GCAGCGCAGCCCTCTCGCCGCTTATAAAGTGCCGCCCGCACGGCCCTTCTCGCTCACGGCGACTTCCCATAACACACAGCAGCATGCAAATACCGCGGGGAGCCCCGCCCCGCCCCGGCCCCCGCACCGCCTCGGGACGCATGCGCCGGCTCTCCGTTCCCGCCTTGGGCCGGCGGCGGGCGGGCGGGCGAGCGGGCGGGAGCGGCTCCGGCGGGGACGAGCGGGCGCC (SEQ ID NO:105)
家猫
GGGAAAGGGTGGCCCCGCCGAGCATTTATAAGACTCCCATACCTAAAGACATTTCTCAGTTATGGTGATTTCCCACAACACACAGCAACATGCAAATATCGAGGGGTGTACCGCCCCTGTCCTTTGTAGACGTCTTCTCTCCAGGACGCACGCGCGCTGTATTCCCGCCTTGTGACTCTAGGCGGGCGATTCCTGGGAGAGGGTTGATGACGTCCAAGTTCTGGCTTC (SEQ ID NO:106)
家马
GGGGGAAAACAGCCCATGGCTGCATTTATAAGACTCACAGATCTAAAGCCATTTCACGAATAGGGTGACTTCCCACAATACACAGCGACATGCAAACATAGCGGGGCGTGCCTTTCCTGTACCCTGTGGGCATCTCTCCTGGACGCACGCGCGCCGGGTGTTCCCGCGCTGTGACTCTAGGCAAGCGCTTCCTGGGAGAGAGTTGATGACGGCAGCATTCGGGCTCC (SEQ ID NO:107)
小棕蝠
GGGAGAAGGAGGCGTAGAGGATATATAAGGCCCCCTTATGTGTAGTCCTTTTACGGTTAGGGTGACTTCCCACAACGCATAGCGACATGCAAATTTGACGGGCGTGCCTCCTCTGTCCCTGCGGGCAACTTCTCTCCTGGACGCGCGCGCGCTGCGTGTTCCCGCCTTTTGACTCCAGCCGAGCGAATCCTGGGAGAGGGCAGGTGACGTCAACAGTCAGGCTCG(SEQ ID NO:108)
大狐蝠
GCGAGAAAAATTCTTCACGCAGAATATATAAGGATCCCATATCTGAAGACATTTTACGATTACGGCGATTTCCCACAACACATAGCGACATGTAAATGTAGTGGGGCATGCCTCCCCTGTCCCTTGTGGGCAGCTTCTCGCCAGAACGCACGCGCGGTGCGTGTTCCCGCCTTGTGACTAAGTTGGCGAGTCAGGGAGGAGATTGATGACGTCAGCTCACCCGCTCC (SEQ ID NO:109)
GGCAAACACCGCACGCAAATAGCACTTATAATGTGCTCATACCTAGAGCCACTTTTCGGTTACGGTGACTTCTCAAAAAGACAGTGGAACATGCAAATATTACAGTGCGTCCCGCCCCTGGTAGGTCTACGCTAGGACGCACGCGCACTACGGTTCCCGCCTATAGACTGCGCTGGCGATTCCTGGGAGCGGACTGATGACGTCAGCGTTCGGGATCC (SEQID NO:110)
绵羊
GGCGAACAATGCGCGCAAACAGCATTTATAATGAGCTCATACCTAAAGCCACTTTACGGTTACGGTGACTTCCCACAAGACATTGCGGCATGCAAATATTTTAGTGCGTCCCGCCCCTGGTAGTTCCACGCTAGGACGCACACGCACTACGGTTCCCGCCTTTAGACTGCGCTGGCGATTCCAGGAGCGGACTGATGACGTCAGCGTTGGGGCTCC (SEQ IDNO:111)
宽吻海豚
GCCGAAAACCAGGCTCAAGCCACATTTATAAGGCTCCCAAATCTAAGTACATTTGTCGGTTATGGTGACTTCCCGCACCACATTGCGACATGCAAATACTGCGGAGCGTCCCTCCCCTGGCAACTCCTCGCTGGGACGCACGCGCGCTACGTGCTCCCGCCTTTTGACTGCGCCGGCGATACTTGGGAGAGGGTTGATGACGTCAGCGTTCTGGCTCC (SEQID NO:112)
羊驼
GGGAAAGGGTGGGCTCACGCAGCCTTTATAAGACTCCCAAACTTAAAGACATTTCTCGGTTATGGCGACTTCCCACAAGACATAGCGACATGCAAATACTGCAGGGCGCCGACCCGGTCCTGTGCAGCCATCTTTCGGCTGGGACGCACGCGCGCTGCGTGTTCCCGCCCTGTGACTGCGCCGGCGATTACTGGGAGAGGATTGATGACGTCAACGTTCGGGTTCC (SEQ ID NO:113)
野猪
GTAGGAAAACTGCTTCTGTGAGCACTTATAAAACTCCCATAAGTAGAGAGATTTCATAGTTATGGTGATTTCCCATAAGACATTGCGACATGCAAATATTGTGGCGCGTTCGTCCCCGTCCGGTGCAGGCAGCTTCGCTCCAGGACGCACGCGCAATACATGTTCCCGCCTTGAGACTGCGCCGGCAGATTCCTAGGAAGTGGTTGATGACGTCGATGTTAGGGATCC (SEQ ID NO:114)
刺猬
GCCTAAACCGGCTCTTTCGACAGACTTATAAGGACCTCTTATCTTAGGACATTTTTTTGTTAGGGTAACTTCCCACGATGCATAGCGATATGTAAATATGGCGCCGCGAGTCTCTCCTAGGCGTCTCCCCAGGACGCAGGCGCACTGCTTGTTCCCGCGTTAACATTGCTGATTCTGGGAGACTGCTGATGACGTCAGCGTCCAGTCTAC (SEQ ID NO:115)
霍氏树懒
AGAAAAAAATAGTTTATGCTGGATTTATAAGATTCCCAAATCTAAAGCCATTTCACAGTTACGGTGATTCCCCACTACACACGGCGATATGCAAATATAGCGGAAGTGTTCCTGAGGCGTGGTAAAGCGCGCGCGCGCTGAGAGTTCCCGCCCTGTGGTGCTGGGCTGGAGATGCCTGAGAACTGGCTGATGACGGCAACGTTCGGGCTCC (SEQ ID NO:116)
九带犰狳
AAAGCGATAGTTTTTTAAACTGGACTTATAAGGCACCCATATCTACGTATATTTCATGGTTAGGGTGATTTCCCACAACACATAGCGAAATGCAAATATTGGAGGGCGCTGAGGCGTGGTCGGGCGCAAGCGCGCTGCGACTTCCCGCCTTTCGGCCCTAGGCCCCAGATTCCTGGGAGCTGGATGATGACGTTGACGTTCGGATACC (SEQ ID NO:117)
非洲象
GGGAAGGAACAAATTCGTCAGGATTTATAAGACTCTCAGAGCTGTAGACATTTCACAGTTAGGGCGATGTCCCACAATACATAGCAACATGCAAATATTCTAGGAGGCCAGCCTCCCCGTCCGCGTGGTCATCTTCTCGCTAGGGCGCACGCCCGCTGCGTGTTCCCGCTCTGTGACCAGGCAGGCGATTCCTGAGAACCGCTTGGTGACGTCAGTGTTCTGGCTCC (SEQ ID NO:118)
蹄兔
AGGGTAAATCGGCGCTGCTCAGCATTTAAAAGAATCCCAAATGTGTCGCCATTTTACGCTTAGGGTGATATCCCACAAGACACAGCGACATGCAAATATCGTGAGTCTCTGTTTCCCTGTCCACGAGGGCGTCCTCTCGCTGGGGCGCACGCGCGGTGTGTGTGCCCCCGTTGTGTGTTCCCGCGATTCCAAAGAACTGGTTGATAACGTTAGACTTCCGGCTGC(SEQ ID NO:119)
表6:终止子的实例
SPA
AATAAAATATCTTTATTTTCATTACATCTGTGTGTTGGTTTTTTGTGTG (SEQ ID NO:120)
SPA和暂停
AATAAAATATCTTTATTTTCATTACATCTGTGTGTTGGTTTTTTGTGTGAATCGATAGTACTAACATACGCTCTCCATCAAAACAAAACGAAACAAAACAAACTAGCAAAATAGGCTGTCCCCAGTGCAAGTGCAGGTGCCAGAACATTTCTCT (SEQ ID NO:121)
SV40 (240bp)
ATCTAGATAACTGATCATAATCAGCCATACCACATTTGTAGAGGTTTTACTTGCTTTAAAAAACCTCCCACACCTCCCCCTGAACCTGAAACATAAAATGAATGCAATTGTTGTTGTTAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTA (SEQ ID NO:122)
SV40-微型的(120bp)
TTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTAT (SEQ ID NO:123)
bGH 聚A
CGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGG (SEQ ID NO:124)
TK 聚A
GGGGGAGGCTAACTGAAACACGGAAGGAGACAATACCGGAAGGAACCCGCGCTATGACGGCAATAAAAAGACAGAATAAAACGCACGGGTGTTGGGTCGTTTGTTCATAAACGCGGGGTTCGGTCCCAGGGCTGGCACTCTGTCGATACCCCACCGAGACCCCATTGGGGCCAATACGCCCGCGTTTCTTCCTTTTCCCCACCCCACCCCCCAAGTTCGGGTGAAGGCCCAGGGCTCGCAGCCAACGTCGGGGCGGCAGGCCCTGCCATAG (SEQ ID NO:125)
sNRP1
GGTATCAAATAAAATACGAAATGTGACAGATT (SEQ ID NO:126)
sNRP1a
AAATAAAATACGAAATGTGACAGATT (SEQ ID NO:127)
组蛋白H4B
GGTTGCTGATTTCTCCACAGCTTGCATTTCTGAACCAAAGGCCCTTTTCAGGGCCGCCCAACTAAACAAAAGAAGAGCTGTATCCATTAAGTCAAGAAGC (SEQ ID NO:128)
MALAT-1
GATTCGTCAGTAGGGTTGTAAAGGTTTTTCTTTTCCTGAGAAAACAACCTTTTGTTTTCTCAGGTTTTGCTTTTTGGCCTTTCCCTAGCTTTAAAAAAAAAAAAGCAAAAGACGCTGGTGGCTGGCACTCCTGGTTTCCAGGACGGGGTTCAAGTCCCTGCGGTGTCTTTGCTT (SEQ ID NO:129)
MALAT-comp14
AAAGGTTTTTCTTTTCCTGAGAAATTTCTCAGGTTTTGCTTTTTAAAAAAAAAGCAAAAGACGCTGGTGGCTGGCACTCCTGGTTTCCAGGACGGGGTTCAAGTCCCTGCGGTGTCTTTGCTT (SEQ ID NO:130)
术语“同源的”是指“%同源性”且在本文中可与在本文中术语“%同一性”互换使用,且涉及当使用序列比对程序比对时核酸序列同一性的水平。
例如,如本文所用,80%同源性意指以通过限定的算法确定的80%序列同一性相同的事物,且因此给定序列的同源物在给定序列的长度上具有大于80%的序列同一性。优选的序列同一性水平包括但不限于与SEQ ID NO:1-82所示的核苷酸序列约60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%或更高的序列同一性。序列同一性的示例性水平包括但不限于与SEQ ID NO:1-82所示的核苷酸序列约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%或更高的序列同一性。
在一些实施方案中,本文公开的主题提供非天然存在的CRISPR-Cas系统,所述CRISPR-Cas系统包含一种或多种载体,所述载体包含:a)与编码CRISPR-Cas系统指导RNA(gRNA)的至少一种核苷酸序列可操作地连接的H1启动子,其中所述gRNA与细胞中DNA分子的靶序列杂交,并且其中所述DNA分子编码在细胞中表达的一种或多种基因产物;以及b)在细胞中可操作的调节元件,其与编码Cas9蛋白的核苷酸序列可操作地连接,其中组分(a)和(b)位于系统的相同或不同载体上,其中所述gRNA靶向所述靶序列且与之杂交,并且Cas9蛋白切割所述DNA分子以改变所述一种或多种基因产物的表达。
在一些实施方案中,本文公开的主题提供非天然存在的CRISPR-Cas系统,所述CRISPR-Cas系统包含一种或多种载体,所述载体包含:a)与编码CRISPR-Cas系统指导RNA(gRNA)的至少一种核苷酸序列可操作地连接的H1启动子,其中所述gRNA与真核细胞中DNA分子的靶序列杂交,并且其中所述DNA分子编码在真核细胞中表达的一种或多种基因产物;以及b)在真核细胞中可操作的调节元件,其与编码II型Cas9蛋白的核苷酸序列可操作地连接,其中组分(a)和(b)位于所述系统的相同或不同载体上,由此所述gRNA靶向所述靶序列且与之杂交,并且Cas9蛋白切割所述DNA分子,并且由此改变所述一种或多种基因产物的表达。在一个方面,靶序列可以是以任何核苷酸开始的靶序列,例如N20NGG。在一些实施方案中,靶序列包含核苷酸序列AN19NGG。在一些实施方案中,靶序列包含核苷酸序列GN19NGG。在一些实施方案中,靶序列包含核苷酸序列CN19NGG。在一些实施方案中,靶序列包含核苷酸序列TN19NGG。在一些实施方案中,靶序列包含核苷酸序列AN19NGG或GN19NGG。在另一个方面,Cas9蛋白进行密码子优化用于在细胞中表达。在另一个方面,Cas9蛋白进行密码子优化用于在真核细胞中表达。在一个进一步方面,真核细胞是哺乳动物细胞或人细胞。在另外一个方面,一种或多种基因产物的表达降低。
本文公开的主题还提供非天然存在的CRISPR-Cas系统,所述CRISPR-Cas系统包含含有双向H1启动子的载体,其中所述双向H1启动子包含:a)提供在编码CRISPR-Cas系统指导RNA(gRNA)的至少一种核苷酸序列的一个方向上的转录的控制元件,其中所述gRNA与真核细胞中DNA分子的靶序列杂交,并且其中所述DNA分子编码在真核细胞中表达的一种或多种基因产物;以及b)提供在编码II型Cas9蛋白的核苷酸序列的相反方向上的转录的控制元件,由此所述gRNA靶向所述靶序列且与之杂交,并且Cas9蛋白切割DNA分子,并且由此改变一种或多种基因产物的表达。在一个方面,靶序列可以是以任何核苷酸开始的靶序列,例如N20NGG。在一些实施方案中,靶序列包含核苷酸序列AN19NGG。在一些实施方案中,靶序列包含核苷酸序列GN19NGG。在一些实施方案中,靶序列包含核苷酸序列CN19NGG。在一些实施方案中,靶序列包含核苷酸序列TN19NGG。在一些实施方案中,靶序列包含核苷酸序列AN19NGG或GN19NGG。在另一个方面,Cas9蛋白进行密码子优化用于在细胞中表达。在另一个方面,Cas9蛋白进行密码子优化用于在真核细胞中表达。在一个进一步方面,真核细胞是哺乳动物细胞或人细胞。在另外一个方面,一种或多种基因产物的表达降低。
在一些实施方案中,CRISPR复合物包含足够强度的一个或多个核定位序列,以驱动CRISPR复合物在细胞(例如真核细胞)的核中以可检测的量的积累。不希望受理论束缚,认为核定位序列对于真核生物中的CRISPR复合物活性不是必需的,但包括此类序列增强了系统尤其是关于靶向核中的核酸分子的活性。在一些实施方案中,CRISPR酶是II型CRISPR系统酶。在一些实施方案中,CRISPR酶是Cas9酶。在一些实施方案中,Cas9酶是空肠弯曲杆菌(C. jejuni)、嗜热脂肪地芽孢杆菌(G. stearothermophilus)、脑膜炎奈瑟氏球菌(N. meningitidis)、金黄色葡萄球菌(S. aureus)、肺炎链球菌(S. pneumoniae)、酿脓链球菌或嗜热链球菌(S. thermophilus)Cas9,并且可以包括衍生自这些生物体的突变的Cas9。酶可以是Cas9同源物或直向同源物例如Cpf1或Cas13a/C2c2。
一般而言,并且在本说明书自始至终,术语“载体”指能够转运它已与之连接的另一种核酸的核酸分子。载体包括但不限于其为单链、双链或部分双链的核酸分子;包含一个或多个游离末端,无游离末端(例如环状)的核酸分子;包含DNA、RNA或两者的核酸分子;以及本领域已知的其他各种各样的多核苷酸。一种类型的载体是“质粒”,其指环状双链DNA环,另外的DNA区段可以插入其内,例如通过标准分子克隆技术。另一种类型的载体是病毒载体,其中病毒衍生的DNA或RNA序列存在于载体中,用于包装到病毒(例如逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒和腺相关病毒)内。病毒载体还包括由病毒携带用于转染到宿主细胞内的多核苷酸。
某些载体能够在它们引入其内的宿主细胞中自主复制(例如具有细菌复制起点的细菌载体和附加型哺乳动物载体)。其他载体(例如,非附加型哺乳动物载体)在引入宿主细胞内后整合到宿主细胞的基因组内,并且从而连同宿主基因组一起复制。此外,某些载体能够指导它们与之可操作地连接的基因的表达。此类载体在本文中称为“表达载体”。在重组DNA技术中有用的常见表达载体经常以质粒的形式。
重组表达载体可以包含以适合于在宿主细胞中表达核酸的形式的本文公开主题的核酸,这意指重组表达载体包括一种或多种调节元件,其可以基于待用于表达的宿主细胞加以选择,其与待表达的核酸序列可操作地连接。
在重组表达载体内,“可操作地连接”预期意指目的核苷酸序列以允许核苷酸序列表达(例如在体外转录/翻译系统中,或当载体引入宿主细胞内时,在宿主细胞中)的方式与调节元件连接。
术语“调节元件”预期包括启动子、增强子、内部核糖体进入位点(IRES)和其他表达控制元件(例如转录终止信号,例如多聚腺苷酸化信号和聚U序列)。此类调节元件在例如Goeddel(1990)Gene Expression Technology: Methods in Enzymology 185,AcademicPress,San Diego,Calif中描述。调节元件包括在许多类型的宿主细胞中指导核苷酸序列的组成型表达的那些元件,以及仅在某些宿主细胞中指导核苷酸序列的表达的那些元件(例如,组织特异性调节序列)。组织特异性启动子可以主要在所需目的组织,例如肌肉、神经元、骨、皮肤、血液、特定器官(例如肝、胰腺)或特定细胞类型(例如淋巴细胞)中指导表达。调节元件还可以以时间依赖性方式指导表达,例如以细胞周期依赖性或发育阶段依赖性方式,其可以是或可以不是组织或细胞类型特异性的。
在一些实施方案中,载体包含一种或多种pol III启动子、一种或多种pol II启动子、一种或多种pol I启动子或其组合。pol III启动子的实例包括但不限于U6和H1启动子。pol II启动子的实例包括但不限于逆转录病毒劳氏肉瘤病毒(RSV)LTR启动子(任选地具有RSV增强子)、巨细胞病毒(CMV)启动子(任选地具有CMV增强子)(例如,Boshart等人(1985)Cell 41:521-530)、SV40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(PGK)启动子和EF1α启动子。
还由术语“调节元件”涵盖的是增强子元件,例如WPRE;CMV增强剂;HTLV-1的LTR中的R-U5'区段(Takebe等人(1988)Mol. Cell. Biol.8:466-472);SV40增强子;以及兔β-珠蛋白的外显子2和3之间的内含子序列(O’Hare等人(1981)Proc. Natl. Acad. Sci. USA.78(3):1527-31)。本领域技术人员应了解,表达载体的设计可以取决于此类因素如待转化的宿主细胞的选择、所需表达水平等。可以将载体引入宿主细胞内,以从而产生由如本文所述的核酸编码的转录物、蛋白质或肽,包括融合蛋白或肽(例如,成簇的规律间隔的短回文重复(CRISPR)转录物、蛋白质、酶、其突变体形式、其融合蛋白等)。有利的载体包括慢病毒和腺相关病毒,并且还可以选择此类载体的类型用于靶向特定类型的细胞。
术语“多核苷酸”、“核苷酸”、“核苷酸序列”、“核酸”和“寡核苷酸”可互换使用。它们指任何长度的聚合形式的核苷酸(脱氧核糖核苷酸或核糖核苷酸,或其类似物)。多核苷酸可以具有任何三维结构,并且可以执行已知或未知的任何功能。下述是多核苷酸的非限制性实例:基因或基因片段的编码或非编码区、由连锁分析定义的基因座(loci)(基因座(locus))、外显子、内含子、信使RNA(mRNA)、转移RNA、核糖体RNA、短干扰RNA(siRNA)、短发夹RNA(shRNA)、微RNA(miRNA)、核酶、cDNA、重组多核苷酸、分支多核苷酸、质粒、载体、任何序列的分离的DNA、任何序列的分离的RNA、核酸探针和引物。多核苷酸可以包含一种或多种修饰的核苷酸,例如甲基化的核苷酸和核苷酸类似物。如果存在,则可以在聚合物组装之前或之后赋予对核苷酸结构的修饰。核苷酸序列可以被非核苷酸组分中断。聚合后可以进一步修饰多核苷酸,例如通过与标记组分缀合。
在本文公开主题的方面,术语“嵌合RNA”、“嵌合指导RNA”、“指导RNA”、“单指导RNA”、“合成指导RNA”和“crRNA”可互换使用,并且指包含指导序列的多核苷酸序列。术语“指导序列”指指导RNA内指定靶位点的约20 bp的序列,并且可以与术语“指导”或“间隔区”互换使用。
如本文使用的,术语“野生型”是由本领域技术人员理解的术语,并且意指如它在自然界中出现的生物体、菌株、基因或特征的典型形式,如区别于突变体或变体形式。
如本文使用的,术语“变体”应当视为意指具有偏离自然界中出现的模式的品质的展示。
术语“非天然存在的”或“工程化的”可互换使用并且指示人工参与。当提及核酸分子或多肽时,该术语意指核酸分子或多肽至少基本上不含它们与之在自然界中天然结合且如自然界中发现的至少一种其他组分。
“互补性”指核酸通过传统的沃森-克里克或其他非传统类型与另一种核酸序列形成氢键的能力。百分比互补性指示核酸分子中可以与第二核酸序列形成氢键(例如,沃森-克里克碱基配对)的残基的百分比(例如,10个中的5、6、7、8、9、10个是 50%、60%、70%、80%、90%和100%互补的)。“完全互补”意指核酸序列的所有邻接残基将与第二核酸序列中相同数目的邻接残基氢键键合。如本文使用的,“基本上互补”指在8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50个或更多个核苷酸的区域上,其为至少60%、65%、70%、75%、80%、85%、90%、95%. 97%、98%、99%或100%的互补性程度,或者指在严格条件下杂交的两种核酸。
如本文使用的,关于杂交的“严格条件”指在其下与靶序列具有互补性的核酸占优势地与靶序列杂交,并且基本上不与非靶序列杂交的条件。严格条件一般是序列依赖性的,并且取决于许多因素而变。一般而言,序列越长,在其下序列与其靶序列特异性杂交的温度越高。Tijssen(1993),Laboratory Techniques In Biochemistry And MolecularBiology-Hybridization With Nucleic Acid Probes 第一部分第二章"Overview ofprinciples of hybridization and the strategy of nucleic acid probe assay",Elsevier,N.Y中详细描述了严格条件的非限制性实例。
“杂交”指其中一种或多种多核苷酸反应以形成复合物的反应,所述复合物经由核苷酸残基的碱基之间的氢键合稳定。氢键合可以通过沃森克里克碱基配对、Hoogstein结合或以任何其他序列特异性方式发生。复合物可以包含形成双链体结构的两条链,形成多链复合物的三条或更多条链,单一自杂交链或这些的任何组合。杂交反应可以构成更广泛过程中的步骤,例如PCR的起始或通过酶的多核苷酸切割。能够与给定序列杂交的序列称为给定序列的“互补体”。
如本文使用的,“表达”指多核苷酸通过其从DNA模板转录(为例如mRNA或其他RNA转录物)的过程和/或转录的mRNA随后通过其翻译成肽、多肽或蛋白质的过程。转录物和编码的多肽可以统称为“基因产物”。如果多核苷酸衍生自基因组DNA,则表达可以包括mRNA在真核细胞中的剪接。
术语“多肽”、“肽”和“蛋白质”在本文中可互换使用,以指任何长度的氨基酸聚合物。聚合物可以是线性或分支的,它可以包含修饰的氨基酸,并且它可以被非氨基酸中断。该术语还涵盖已修饰的氨基酸聚合物;例如,二硫键形成、糖基化、脂化、乙酰化、磷酸化或任何其他操作,例如与标记组分的缀合。
如本文使用的,术语“氨基酸”包括天然和/或非天然或合成的氨基酸,包括甘氨酸和D或L光学异构体两者,以及氨基酸类似物和肽模拟物。
除非另有说明,否则本文公开主题的实践采用免疫学、生物化学、化学、分子生物学、微生物学、细胞生物学、基因组学和重组DNA的常规技术,所述技术在本领域的技术内(Sambrook,Fritsch和Maniatis(1989)Molecular Cloning: A Laboratory Manual,第2版;Ausubel等人,编辑(1987)Current Protocols in Molecular Biology);MacPherson等人,编辑(1995) Methods in Enzymology(Academic Press,Inc.): PCR 2: A PracticalApproach);Harlow和Lane,编辑(1988)Antibodies,A Laboratory Manual;Freshney,ed.(1987)Animal Cell Culture)。
本文公开主题的几个方面涉及包含一种或多种载体的载体系统或者载体本身。载体可以设计用于在原核细胞或真核细胞中表达CRISPR转录物(例如核酸转录物、蛋白质或酶)。例如,CRISPR转录物可以在细菌细胞例如大肠杆菌(Escherichia coli)、昆虫细胞(使用杆状病毒表达载体)、酵母细胞或哺乳动物细胞中表达。合适的宿主细胞在Goeddel(1990)Gene Expression Technology: Methods in Enzymology 185,Academic Press,San Diego,Calif中进一步讨论。可替代地,重组表达载体可以在体外转录且翻译,例如使用T7启动子调节序列和T7聚合酶。
可以在原核生物中引入和繁殖载体。在一些实施方案中,将原核生物用于扩增待引入真核细胞内的载体或作为待引入真核细胞内的载体的产生中的中间载体(例如,扩增作为病毒载体包装系统的部分的质粒)的拷贝。在一些实施方案中,原核生物用于扩增载体的拷贝并且表达一种或多种核酸,例如以提供用于递送至宿主细胞或宿主生物体的一种或多种蛋白质的来源。蛋白质在原核生物中的表达最经常在大肠杆菌中用含有组成型或诱导型启动子的载体进行,所述启动子指导融合蛋白或非融合蛋白的表达。
融合载体向其中编码的蛋白质,例如重组蛋白质的氨基末端添加许多氨基酸。此类融合载体可以发挥一个或多个目的,例如:(i)增加重组蛋白的表达;(ii)增加重组蛋白的溶解度;以及(iii)通过在亲和纯化中充当配体来帮助重组蛋白的纯化。通常,在融合表达载体中,在融合部分和重组蛋白的连接处引入蛋白酶解切割位点,以致使融合蛋白纯化后重组蛋白与融合部分的分离。此类酶及其同源识别序列包括因子Xa、凝血酶和肠激酶。示例性融合表达载体包括pGEX(Pharmacia Biotech Inc;Smith和Johnson(1988)Gene 67:31-40)、pMAL(New England Biolabs,Beverly,Mass.)和pRIT5(Pharmacia,Piscataway,N.J.),其将谷胱甘肽S-转移酶(GST)、麦芽糖E结合蛋白或蛋白A分别与靶重组蛋白融合。
合适的诱导型非融合大肠杆菌表达载体的实例包括pTrc(Amrann等人(1988)Gene 69:301-315)和pET 11d(Studier等人(1990)Gene Expression Technology: Methods inEnzymology 185,Academic Press,San Diego,Calif.)。
在一些实施方案中,载体是酵母表达载体。用于在酵母酿酒酵母(Saccharomyces cerivisae)中表达的载体的实例包括pYepSec1(Baldari,等人(1987) EMBO J. 6: 229-234)、pMFa(Kuijan和Herskowitz (1982) Cell 30: 933-943)、pJRY88(Schultz等人(1987)Gene 54: 113-123)、pYES2(Invitrogen Corporation,San Diego,Calif.)和picZ(InVitrogen Corp,San Diego,Calif.)。
在一些实施方案中,载体能够使用哺乳动物表达载体驱动一种或多种序列在哺乳动物细胞中的表达。哺乳动物表达载体的实例包括pCDM8(Seed (1987)Nature 329: 840)和pMT2PC(Kaufman等人(1987)EMBO J. 6: 187-195)。当在哺乳动物细胞中使用时,表达载体的控制功能通常由一种或多种调节元件提供。例如,常用的启动子衍生自多瘤病毒、腺病毒2、巨细胞病毒、猿猴病毒40以及本文公开和本领域已知的其他病毒。对于用于原核细胞和真核细胞两者的其他合适的表达系统,参见例如Sambrook等人(1989)MolecularCloning: A Laboratory Manual. 第2版,Cold Spring Harbor Laboratory,Cold SpringHarbor Laboratory Press,Cold Spring Harbor,N.Y.的第16章和第17章。
在一些实施方案中,重组哺乳动物表达载体能够优先指导核酸在特定细胞类型中的表达(例如,组织特异性调节元件用于表达核酸)。组织特异性调节元件是本领域已知的。合适的组织特异性启动子的非限制性实例包括白蛋白启动子(肝特异性;Pinkert等人(1987)Genes Dev. 1: 268-277),淋巴样特异性启动子(Calame和Eaton(1988)Adv. Immunol. 43: 235-275),特别是T细胞受体(Winoto和Baltimore(1989)EMBO J.8: 729-733)和免疫球蛋白(Baneiji等人(1983)Cell 33: 729-740;Queen和Baltimore(1983)Cell 33: 741-748)的启动子,神经元特异性启动子(例如,神经丝启动子;Byrne和Ruddle(1989)Proc. Natl. Acad. Sci. USA 86: 5473-5477),胰腺特异性启动子(Edlund等人(1985)Science 230: 912-916)和乳腺特异性启动子(例如,乳清启动子;美国专利号4,873,316和欧洲申请公开号264,166)。还涵盖发育调节的启动子,例如鼠hox启动子(Kessel和Gruss(1990)Science 249: 374-379)和甲胎蛋白启动子(Campes和Tilghman(1989)Genes Dev. 3: 537-546)。
在一些实施方案中,调节元件可操作地连接至CRISPR系统的一种或多种元件,以便驱动CRISPR系统的一种或多种元件的表达。一般而言,CRISPR(成簇的规律间隔的短回文重复),也称为SPIDR(间隔区穿插的直接重复(SPacer Interspersed Direct Repeats)),构成通常对特定细菌物种特异性的DNA基因座家族。CRISPR基因座包含在大肠杆菌中识别的不同种类的散布短序列重复(SSR)(Ishino等人(1987)J. Bacteriol.,169:5429-5433;以及Nakata等人(1989)J. Bacteriol.,171:3553-3556)和相关基因。已在极端嗜盐古菌(Haloferax mediterranei)、酿脓链球菌、鱼腥藻属(Anabaena)和结核分枝杆菌(Mycobacterium tuberculosis)中鉴定了类似的散布SSR(Groenen等人(1993)Mol. Microbiol.,10:1057-1065;Hoe等人(1999)Emerg. Infect. Dis.,5:254-263;Masepohl等人(1996)Biochim. Biophys. Acta 1307:26-30;和Mojica等人(1995)Mol. Microbiol.,17:85-93)。CRISPR基因座通常与其他SSR的不同之处在于重复的结构,其已被命名为短规律间隔重复(SRSR)(Janssen等人(2002)OMICS J. Integ. Biol.,6:23-33;和Mojica等人(2000)Mol. Microbiol.,36:244-246)。一般而言,重复是以簇形式出现的短元件,所述簇由具有基本上恒定长度的独特间插序列规律地间隔开(Mojica等人(2000)Mol. Microbiol.,36:244-246)。尽管重复序列在菌株之间是高度保守的,但散布重复的数目和间隔区的序列通常因菌株而异(van Embden等人(2000)J. Bacteriol.,182:2393-2401)。已在多于40种原核生物中鉴定了CRISPR基因座(例如,Jansen等人(2002)Mol. Microbiol.,43:1565-1575;和Mojica等人(2005)J. Mol. Evol. 60:174-82),所述原核生物包括但不限于气火菌属(Aeropyrum)、热棒菌属(Pyrobaculum)、硫化叶菌属(Sulfolobus)、古生球菌属(Archaeoglobus)、Halocarcula、甲烷短杆菌属(Methanobacteriumn)、甲烷球菌属(Methanococcus)、甲烷八叠球菌属(Methanosarcina)、甲烷火菌属(Methanopyrus)、火球菌属(Pyrococcus)、嗜酸菌属(Picrophilus)、Thernioplasnia、棒状杆菌属(Corynebacterium)、分枝杆菌属(Mycobacterium)、链霉菌属(Streptomyces)、产液菌属(Aquifrx)、卟啉单胞菌属(Porphvromonas)、绿菌属(Chlorobium)、栖热菌属(Thermus)、芽孢杆菌属(Bacillus)、李斯特菌属(Listeria)、葡萄球菌属(Staphylococcus)、梭菌属(Clostridium)、高温厌氧杆菌属(Thermoanaerobacter)、支原体属(Mycoplasma)、梭杆菌属(Fusobacterium)、Azarcus、色杆菌属(Chromobacterium)、奈瑟菌属(Neisseria)、亚硝化单胞菌属(Nitrosomonas)、脱硫弧菌属(Desulfovibrio)、地杆菌属(Geobacter)、Myrococcus、弯曲杆菌属(Campylobacter)、沃林氏菌属(Wolinella)、不动杆菌属(Acinetobacter)、欧文氏菌属(Erwinia)、埃希氏杆菌属(Escherichia)、军团菌属(Legionella)、甲基球菌属(Methylococcus)、巴斯德菌属(Pasteurella)、发光杆菌属(Photobacterium)、沙门氏菌属(Salmonella)、黄单胞菌属(Xanthomonas)、耶尔森氏菌属(Yersinia)、密螺旋体属(Treponema)和栖热袍菌属(Thermotoga)。
一般而言,“CRISPR系统”共同指涉及CRISPR相关(“Cas”)基因表达或指导CRISPR相关(“Cas”)基因活性的转录物和其他元件,包括编码Cas基因的序列、指导序列(在内源CRISPR系统的背景下也称为“间隔区”)、或来自CRISPR基因座的其他序列和转录物。在一些实施方案中,CRISPR系统的一种或多种元件衍生自I型、II型或III型CRISPR系统。在一些实施方案中,CRISPR系统的一种或多种元件衍生自包含内源CRISPR系统的特定生物体,例如酿脓链球菌。一般而言,CRISPR系统的特征在于促进靶序列的位点处的CRISPR复合物形成的元件(在内源CRISPR系统的背景下也称为原型间隔区)。
在CRISPR复合物形成的背景下,“靶序列”指指导序列设计为针对其具有互补性的序列,其中靶序列和指导序列之间的杂交促进CRISPR复合物的形成。不一定需要完全互补性,条件是存在足够的互补性以引起杂交且促进CRISPR复合物的形成。靶序列可以包含任何多核苷酸,例如DNA或RNA多核苷酸。在一些实施方案中,靶序列位于细胞的核或细胞质中。在一些实施方案中,靶序列可以在真核细胞的细胞器内,例如线粒体或叶绿体。可以用于重组到包含靶序列的靶基因座内的序列或模板称为“编辑模板”或“编辑多核苷酸”或“编辑序列”。在本文公开主题的方面,外源模板多核苷酸可以称为编辑模板。在本文公开主题的一个方面,重组是同源重组。
在一些实施方案中,载体包含一个或多个插入位点,例如限制性核酸内切酶识别序列(也称为“克隆位点”)。在一些实施方案中,一个或多个插入位点(例如,约或多于约1、2、3、4、5、6、7、8、9、10个或更多个插入位点)位于一种或多种载体的一个或多个序列元件的上游和/或下游。当使用多个不同的指导序列时,单个表达构建体可以用于将CRISPR活性靶向细胞内的多个不同的相应靶序列。例如,单个载体可以包含约或多于约1、2、3、4、5、6、7、8、9、10、15、20个或更多个指导序列。在一些实施方案中,可以提供约或多于约1、2、3、4、5、6、7、8、9、10个或更多个此类含有指导序列的载体,并且任选地递送至细胞。
在一些实施方案中,载体包含与编码CRISPR酶例如Cas蛋白的酶编码序列可操作地连接的调节元件。Cas蛋白的非限制性实例包括Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csn1和Csx12)、Cas10、Cas13a、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、其同源物或其修饰形式。这些酶是已知的;例如,酿脓链球菌Cas9蛋白的氨基酸序列可以在登录号Q99ZW2下在SwissProt数据库中找到。在一些实施方案中,未修饰的CRISPR酶具有DNA切割活性,例如Cas9。在一些实施方案中,CRISPR酶是Cas9,并且可以是来自酿脓链球菌或肺炎链球菌的Cas9。
在一些实施方案中,CRISPR酶指导在靶序列的位置处的一条或两条链的切割,例如在靶序列内和/或在靶序列的互补体内。在一些实施方案中,CRISPR酶指导距离靶序列的第一个或最后一个核苷酸的约1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500个或更多个碱基对内的一条链或两条链的切割。在一些实施方案中,载体编码关于相应的野生型酶突变的CRISPR酶,使得突变的CRISPR酶缺乏切割含有靶序列的靶多核苷酸的一条链或两条链的能力。
在一些实施方案中,编码CRISPR酶的酶编码序列进行密码子优化,用于在特定细胞例如真核细胞中表达。真核细胞可以是特定生物体的那些或衍生自特定生物体,例如哺乳动物,包括但不限于人、小鼠、大鼠、兔、犬或非人灵长类动物。一般而言,密码子优化指通过用在该宿主细胞的基因中更频繁或最频繁使用的密码子替换天然序列的至少一个密码子(例如,约或多于约1、2、3、4、5、10、15、20、25、50个或更多个密码子),同时维持天然氨基酸序列,来修饰核酸序列用于目的宿主细胞中的增强表达的过程。各种物种显示出对于特定氨基酸的某些密码子的特别偏倚。密码子偏倚(生物体之间的密码子使用中的差异)经常与信使RNA(mRNA)的翻译效率相关联,所述信使RNA(mRNA)的翻译效率依次又被认为尤其取决于待翻译的密码子的特性和特定转移RNA(tRNA)分子的可用性。所选择的tRNA在细胞中的优势一般是肽合成中最频繁使用的密码子的反映。相应地,可以基于密码子优化来定制基因,用于在给定生物体中的最佳基因表达。密码子使用表例如在“密码子使用数据库”中可容易获得,并且这些表可以以多种方式进行调整。参见Nakamura等人(2000)Nucl. Acids Res. 28:292。用于密码子优化特定序列用于在特定宿主细胞中表达的计算机算法也是可用的,例如Gene Forge(Aptagen;Jacobus,Pa.)也是可用的。在一些实施方案中,编码CRISPR酶的序列中的一个或多个密码子(例如,1、2、3、4、5、10、15、20、25、50个或更多个或所有密码子)对应于关于特定氨基酸的最频繁使用的密码子。
一般而言,指导序列是与靶多核苷酸序列具有足够互补性以与靶序列杂交并且指导CRISPR复合物与靶序列的直接序列特异性结合的任何多核苷酸序列。在一些实施方案中,当使用合适的比对算法最佳比对时,指导序列与其相应的靶序列之间的互补性程度为约或多于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或更多。可以使用用于比对序列的任何合适的算法来确定最佳比对,所述算法的非限制性实例包括Smith-Waterman算法、Needleman-Wunsch算法、基于Burrows-Wheeler变换的算法(例如Burrows WheelerAligner)、ClustalW、Clustal X、BLAT、Novoalign(Novocraft Technologies、ELAND(Illumina,San Diego,Calif.)、SOAP(可在soap.genomics.org.cn处获得)和Maq(可在maq.sourceforge.net处获得)。在一些实施方案中,指导序列为长度约或多于约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75个或更多个核苷酸。在一些实施方案中,指导序列为长度小于约75、50、45、40、35、30、25、20、15、12个或更少的核苷酸。
可以通过任何合适的测定来评价指导序列指导CRISPR复合物与靶序列的序列特异性结合的能力。例如,足以形成CRISPR复合物的CRISPR系统的组分,包括待测试的指导序列,可以提供给具有相应靶序列的宿主细胞,例如通过用编码CRISPR序列的组分的载体转染,随后为靶序列内的优先切割的评价,例如通过如本文所述的Surveyor测定。类似地,通过提供靶序列,CRISPR复合物的组分,包括待测试的指导序列和不同于测试指导序列的对照指导序列,并且比较在测试和对照指导序列反应之间的靶序列处的结合或切割速率,可以在试管中评估靶多核苷酸序列的切割。其他测定是可能的,并且将是本领域技术人员想到的。
可以选择指导序列以靶向任何靶序列。在一些实施方案中,靶序列是细胞基因组内的序列。示例性靶序列包括靶基因组中独特的靶序列。
在一些实施方案中,CRISPR酶是包含一个或多个异源蛋白结构域(例如,除CRISPR酶之外,约或多于约1、2、3、4、5、6、7、8、9、10个或更多个结构域)的融合蛋白的部分。CRISPR酶融合蛋白可以包含任何另外的蛋白质序列,以及任选地在任何两个结构域之间的接头序列。可以与CRISPR酶融合的蛋白质结构域的实例包括但不限于表位标签、报道基因序列和具有下述活性中的一种或多种的蛋白质结构域:甲基化酶活性、去甲基化酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性和核酸结合活性。表位标签的非限制性实例包括组氨酸(His)标签、V5标签、FLAG标签、流感血凝素(HA)标签、Myc标签、VSV-G标签和硫氧还蛋白(Trx)标签。报道基因的实例包括但不限于谷胱甘肽-5-转移酶(GST)、辣根过氧化物酶(HRP)、氯霉素乙酰转移酶(CAT)、β-半乳糖苷酶、β-葡糖醛酸酶、荧光素酶、绿色荧光蛋白(GFP)、HcRed、DsRed、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)和自体荧光蛋白包括蓝色荧光蛋白(BFP)。CRISPR酶可以与编码蛋白质或蛋白质片段的基因序列融合,所述蛋白质或蛋白质片段结合DNA分子或结合其他细胞分子,包括但不限于麦芽糖结合蛋白(MBP)、S标签、Lex A DNA结合结构域(DBD)融合物、GAL4A DNA结合域融合物和单纯疱疹病毒(HSV)BP16蛋白融合物。可以形成包含CR ISPR酶的融合蛋白的部分的另外结构域在US20110059502中描述,所述专利通过引用并入本文。在一些实施方案中,加上标签的CRISPR酶用于鉴定靶序列的位置。
在本文公开主题的一个方面,包括但不限于谷胱甘肽-5-转移酶(GST)、辣根过氧化物酶(HRP)、氯霉素乙酰转移酶(CAT)、β-半乳糖苷酶、β-葡糖醛酸酶、荧光素酶、绿色荧光蛋白(GFP)、HcRed、DsRed、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)和自体荧光蛋白包括蓝色荧光蛋白(BFP)的报道基因可以引入细胞内,以编码充当通过其测量基因产物表达的改变或修饰的标记的基因产物。在本文公开主题的一个进一步实施方案中,可以经由载体将编码基因产物的DNA分子引入细胞内。在本文公开主题的一个优选实施方案中,基因产物是荧光素酶。在本文公开主题的一个进一步实施方案中,基因产物的表达降低。
一般地,本文公开主题的启动子实施方案包括:1)完整的Pol III启动子,其包括TATA盒、近端序列元件(PSE)和远端序列元件(DSE);以及2)第二基础Pol III启动子,其包括以相反方向与DSE的5'末端融合的PSE和TATA盒。因其核苷酸序列命名的TATA盒是PolIII特异性的主要决定因素。它通常位于相对于转录序列nt. −23 和−30之间的位置处,并且是转录序列开始的主要决定因素。PSE通常位于nt. −45和−66之间。DSE增强了基础PolIII启动子的活性。在H1启动子中,PSE和DSE之间不存在间隙。
双向启动子是指以头尾尾头方式定向的任何启动子(通常为pol II),基本上任何控制区域指导异向转录。在一些实施方案中,双向H1启动子可以是pol II和pol II或polIII和pol III,或其组合。H1双向以及7Sk和本文所述的其他是独特的,因为它们是双向的,这在真核基因组中本身并不常见,但这里最重要的是,在一侧指导蛋白质编码基因(polII)且在另一侧指导RNA基因(pol III)。
在一些实施方案中,双向启动子由以下组成:1)完整的、常规、单向Pol III启动子,其含有3个外部控制元件:DSE、PSE和TATA盒;以及2)第二基础Pol III启动子,其包括以相反方向与DSE的5'末端融合的PSE和TATA盒。被TATA结合蛋白识别的TATA盒对于将PolIII募集到启动子区是必需的。TATA结合蛋白与TATA盒的结合通过SNAPc与PSE的相互作用得到稳定。这些元件一起正确定位Pol III,使得它可以转录表达的序列。DSE对于Pol III启动子的完全活性也是必需的(Murphy等人(1992)Mol. Cell Biol. 12:3247-3261;Mittal等人(1996)Mol. Cell Biol. 16:1955-1965;Ford和Hernandez (1997)J.Biol.Chem.,272:16048-16055;Ford等人(1998)Genes,Dev.,12:3528-3540;Hovde等人(2002)Genes Dev. 16:2772-2777)。通过转录因子Oct-1和/或SBF/Staf与其在DSE内的基序的相互作用,转录增强高达100倍(Kunkel和Hixon(1998)Nucl. Acid Res.,26:1536-1543)。因为正向和反向取向的基础启动子指导序列在双链DNA模板的相反链上的转录,所以反向取向的基础启动子的正链附加到DSE负链的5'末端。在H1启动子的控制下表达的转录物由4或5个T的连续序列终止。
在H1启动子中,DSE与PSE和TATA盒相邻(Myslinski等人(2001)Nucl. Acid Res.29:2502-2509)。为了使序列重复最小化,通过产生杂合启动子,致使该启动子双向,其中通过附加衍生自U6启动子的PSE和TATA盒来控制反向中的转录。为了促进双向H1启动子的构建,还可以在反向取向的基础启动子和DSE之间插入小间隔区序列。
细胞周期依赖性蛋白质的实例可包括以下任何一种:
(a)染色体DNA复制反应,包括染色体DNA复制的起始和复制叉的进展
Mcm10、Orc1、Orc3、Cdc6、Cdt1、孪蛋白、Mcm3、Mcm4、Mcm5、Mcm6、Mcm7、Mcm8、Cdc7、Cdc5、Psf1、Psf2、Psf3、Cdc45、Pola p180、Pola p70、Pola Spp1(Prim2a)、RPA70、RPA34、PCNA、Elg1、连接酶1、Pole Pol2、Pole Dpb3、拓扑异构酶I、TDP1、Orc2、Orc4、Orc5、Orc6、Mcm2、Dbf4、TopBP1、Sld5、Pola Spp2、RFC1、RFC2、RFC3、RFC4、RFC5、Pif1、Pold p50、Pole Dpb2、拓扑异构酶Iia、拓扑异构酶Iib、RPAI4、FEN1、DNA2、Pold p125、Pold p68、Pold p12、PoleDpb4
(b)DNA损伤检查点
ATR、Chk1、NBS1、Hus1、Rad1、Mad2、BubR1、ATM、Rad50、Mre11、Mdc1、53BP1、Rad17、BubR1、ATRIP、Chk2、H2AX、RFC1、RFC2、RFC3、RFC4、RFC5、ATM、BRCA1、Chk1、Chk2、14-3-3eta、14-3-3σ、cdc25A、cdc25c、wee1、ATR、ATRIP、Rad17、RFC2、RFC3、RFC4、RFC5、HUS1、Rad1、Rad9、P53、Rad50、Mre11、NBS1、TopBP1、53BP1、H2AX
(c)姐妹染色单体凝集和分离
Ctf18、Scc1、Scc3、Dcc1、Trf4-1、Trf4-2、Smc1、Smc3、Pds1(分离酶抑制蛋白)、Mad-2、BubR1、Esp1
(d)碱基切除修复
UNG、MBD4、TDG、NTH1、NEIL2、NEIL3、APE2、PARP1、PNK、Polb、OGG1、APE1、XRCC1、连接酶3、SMUG1、TDG、MYH、MPG、NEIL1、ADPRT、ADPRTL2、MGMT、ABH1、ABH2、ABH3
(e)错配切除修复
MSH2、PMS1、PMS2、MLH3、核酸外切酶1、MSH3、MSH6、MSH5、MLH1、MSH4、PMS2L3、Trex1、Trex2、PMS2L4
(f)核苷酸切除修复
XPC、Rad23A、Rad23B、CSA、CSB、XPG、XPF、DDB1、DDB2、XAB2、XPB、ERCC1、XPD、XPA、DDB2、Mms19、CETN2、RPA70、RPA34、RPAI4、GTF2H1、GTF2H2、GTF2H3、GTF2H4、CDK7、CCNH、MNAT1、连接酶I、CSA、CSB
(g)同源重组修复
Rad51、Rad51L1、Rad51C、Rad51L3、DMC1、XRCC2、XRCC3、Rad52、Rad54L、Rad54B、BRCA1、BRCA2、Rad50、Mre11、NBS1、拓扑异构酶IIIa、拓扑异构酶IIIb、WHIP、WRN、BLM、RecQ1、RecQ5
(h)非同源末端连接修复(非同源重组修复)
Ku70、Ku80、DNA-pk、连接酶4、XRCC4、Artemis、WRN
i)双链DNA断裂修复
Rad51、Rad51D、Xrcc2、Rad54、BRCA1、Ku80、XRCC4、Rad52、Rad51C、Dmc1、Rad54B、DNA-pk、Ku70、连接酶4、Rad51B、XRCC3、BRCA2、Artemis
(j)DNA复制后修复(DNA损伤耐受)
Rad6A、Rad6B、Rad18、Ubc13、FBH1
(k)DNA交联损伤修复
FANCA、FANCC、FANCD2、FANCE、FANCF、FANCG
(l)DNA-蛋白质交联损伤修复
TDP1
(m)DNA聚合酶
Poli、Polh、Polq、Polk、Polz (REV3)、Poll、Polm、Rev1、Polb、Polg、Pold p50、PolePol2、REV7、Poln、Pola P180、Pola p70、Pola Spp1、Pola Spp2、Pold p68、Pold p12、PoleDpb2、Pole Dpb3、Pole Dpb4
(n)核苷酸清洁
MTH1、DUT、p53R2
(o)染色质结构维持
H2AX、Sir2、SIRT1(Sirtuin)
(p)端粒结构维持
Tin2、Sir2、hTert、TRF1、TRF2、端锚聚合酶、Pot1、Rap1、Pif1
与每种上述功能(a)至(p)相关的基因的优选实例包括以下实例中描述的基因。更具体地,这种基因的实例如下:APE2、ATR、BRCA1、Chk1、Cdc5、Cdc6、Cdc7、Cdc45、Cdt1、CSA、CSB、Ctf18、DDB1、DDB2、DNA2、DUT、Elg1、EndoV、Esp1、核酸外切酶1、FBH1、FEN1、孪蛋白、Hus1、KNTC2 (NDC80)、Ku80、连接酶1、Mad2、MBD4、Mcm3、Mcm4、Mcm5、Mcm6、Mcm7、Mcm8、Mcm10、MGMT、MLH3、Mms4、MPG、MSH2、Mus81、NBS1、NEIL2、NEIL3、NTH1、Orc1、Orc3、PARP1、PCNA、Pif1、PMS1、PMS2、PNK、Pola p180、Pola p70、Pola Spp1(Prim2a)、Polb、Pold p125、PoleDpb3、Pole Dpb4、Pole Pol2、Poli、Poll、Polm、Psf1、Psf2、Psf3、Rad1、Rad18、Rad23A、Rad23B、Rad51、Rad51D、Rad54、Rad6A、RPA34、RPA70、Scc1、Scc3、Sir2、SIRT1 (Sirtuin)、TDG、TDP1、TIMELESS、Tin2、拓扑异构酶I、拓扑异构酶IIIa、拓扑异构酶IIIb、Ubc13、UNG、XAB2、XPC、XPF、XPG、Xrcc2、和XRCC4。
由于本说明书中描述的基因名称是广泛且通常已知的名称,本领域技术人员能够基于基因名称从公共参考数据库或基因数据库(例如,GenBank)适当地获取关于所述基因的核苷酸序列的数据。
B.方法
在一些实施方案中,本文公开的主题还提供改变真核或非真核细胞中一种或多种基因产物的表达的方法,其中所述细胞包含编码所述一种或多种基因产物的DNA分子,所述方法包括将改进的和修饰的先前在WO2015/195621(通过引用以其整体并入本文)中描述的非天然存在的CRISPR-Cas系统引入到细胞中。这种改进包括包含一种或多种载体的非天然存在的核酸酶系统(例如,CRISPR-Cas9),所述载体包含:a)可操作地连接到至少一种编码核酸酶系统指导RNA(gRNA)的核苷酸序列的启动子(例如,直向同源H1启动子或7sk),其中gRNA与细胞中DNA分子的靶序列杂交,且其中DNA分子编码在细胞中表达的一种或多种基因产物;和b)可操作地连接到编码基因组靶向核酸酶(例如,修饰的Cas9蛋白)的核苷酸序列的在细胞中可操作的调节元件,其中组分(a)和(b)位于所述系统的相同或不同载体上,其中所述gRNA靶向所述靶序列并与之杂交且所述核酸酶切割所述DNA分子以改变所述一种或多种基因产物的表达。在一些实施方案中,将系统包装到单个腺相关病毒(AAV)颗粒中。在一些实施方案中,该系统使一种或多种基因产物失活。在一些实施方案中,该系统切除至少一个基因突变。在一些实施方案中,H1启动子包含与SEQ ID NO:12或32所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,直向同源H1启动子衍生自小鼠或大鼠。在一些实施方案中,直向同源H1启动子包含与SEQ ID NO:84-119所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,直向同源H1启动子包含由SEQ ID NO:84-119组成的组中所示的核苷酸序列。在一些实施方案中,H1启动子包含:a)在至少一种编码gRNA的核苷酸序列的一个方向上提供转录的控制元件;和b)在编码基因组靶向核酸酶的核苷酸序列的相反方向上提供转录的控制元件。在一些实施方案中,启动子是人、小鼠或大鼠7sk启动子。在一些实施方案中,7sk选自7sk1(7sk的变体1,其使用内源性GSTA4 5’UTR)、7sk2(7sk的变体2,其仅使用5’UTR中的kozak序列)和7sk3(使用β珠蛋白5’UTR的7sk的变体)。在一些实施方案中,人7sk1包含与SEQ ID NO:3所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,小鼠7sk1包含与SEQ ID NO:6具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,人7sk2包含与SEQ IDNO:4具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,小鼠7sk2包含与SEQ ID NO:7具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,人7sk3包含与SEQ ID NO:5具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,小鼠7sk3包含与SEQ ID NO:8具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,直向同源H1启动子或7sk启动子具有至少一个修饰。在一些实施方案中,启动子的至少一个修饰包括允许条件调节的元件。在一些实施方案中,该元件是tet响应性启动子。在一些实施方案中,tet响应性启动子包含Tet阻遏物(TetR)和Tet操纵子(TetO),其被工程化到H1启动子中。在一些实施方案中,TetR包含与SEQ ID NO:14具有至少80%、85%、90%、95%、98%、99%或100%同一性的氨基酸序列。在一些实施方案中,TetO包含与SEQ ID NO:11所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,H1-TetO包含与SEQ ID NO:13所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,启动子的至少一个修饰包括允许自动调节的位点。在一些实施方案中,自动调节位点包含与SEQ ID NO:33或34所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,核酸酶系统还包含至少一个终止子序列。在一些实施方案中,所述至少一个终止子序列选自SV40或合成的聚A(SPA)序列。在一些实施方案中,终止子序列是SV40 120(SEQ ID NO:123)或240(SEQ IDNO:122)碱基对序列。在一些实施方案中,终止子序列是SPA 49碱基对序列。在一些实施方案中,核酸酶系统还包含5’非翻译区(5’UTR)序列。在一些实施方案中,核酸酶系统还包含Kozak序列。在一些实施方案中,Kozak序列包含与SEQ ID NO:1或2具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,核酸酶系统还包含介导不依赖帽的翻译起始的RNA序列。在一些实施方案中,RNA序列选自6.947或6.967。在一些实施方案中,Cas9包含与SEQ ID NO:61所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,Cas9包含至少一个修饰。在一些实施方案中,Cas9中的至少一个修饰包括切割序列的改变。在一些实施方案中,核酸酶选自Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9 (也称为Csn1和Csx12)、Cas10、Cas13a、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、Cpf1、C2c1、C2c2、和C2c3。在一些实施方案中,切割序列的改变选自T2A、P2A、E2A和F2A。在一些实施方案中,T2A包含与SEQ ID NO:36所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的氨基酸序列。在一些实施方案中,P2A包含与SEQ ID NO:35所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的氨基酸序列。在一些实施方案中,P2A包含具有SEQ ID NO:35所示的核苷酸序列的氨基酸序列。在一些实施方案中,E2A包含与SEQ ID NO:37所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的氨基酸序列。在一些实施方案中,F2A包含与SEQ IDNO:38所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的氨基酸序列。在一些实施方案中,Cas9中的至少一个修饰包含针对在细胞中表达而优化的密码子。在一些实施方案中,Cas9还包含在框内与细胞周期依赖性蛋白质可操作地融合的接头序列(Cas9融合物)。在一些实施方案中,细胞周期依赖性蛋白质选自APE2、ATR、BRCA1、Chk1、Cdc5、Cdc6、Cdc7、Cdc45、Cdt1、CSA、CSB、Ctf18、DDB1、DDB2、DNA2、DUT、Elg1、EndoV、Esp1、核酸外切酶1、FBH1、FEN1、孪蛋白、Hus1、KNTC2 (NDC80)、Ku80、连接酶1、Mad2、MBD4、Mcm3、Mcm4、Mcm5、Mcm6、Mcm7、Mcm8、Mcm10、MGMT、MLH3、Mms4、MPG、MSH2、Mus81、NBS1、NEIL2、NEIL3、NTH1、Orc1、Orc3、PARP1、PCNA、Pif1、PMS1、PMS2、PNK、Pola p180、Pola p70、PolaSpp1 (Prim2a)、Polb、Pold p125、Pole Dpb3、Pole Dpb4、Pole Pol2、Poli、Poll、Polm、Psf1、Psf2、Psf3、Rad1、Rad18、Rad23A、Rad23B、Rad51、Rad51D、Rad54、Rad6A、RPA34、RPA70、Scc1、Scc3、Sir2、SIRT1 (Sirtuin)、TDG、TDP1、TIMELESS、Tin2、拓扑异构酶I、拓扑异构酶IIIa、拓扑异构酶IIIb、Ubc13、UNG、XAB2、XPC、XPF、XPG、Xrcc2、和XRCC4。在一些实施方案中,细胞周期依赖性蛋白质是孪蛋白。在一些实施方案中,细胞周期依赖性蛋白质是人孪蛋白。在一些实施方案中,人孪蛋白包含位置1-110的氨基酸(hGem(1-110))。在一些实施方案中,hGem(1-110)包含与SEQ ID NO:19中所示的氨基酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的氨基酸序列。在一些实施方案中,细胞周期依赖性蛋白质是Cdt1。在一些实施方案中,细胞周期依赖性蛋白质是人Cdt1。在一些实施方案中,人Cdt1包含位置30-120的氨基酸(hCdt1(30-120))。在一些实施方案中,hCdt1(30-120)包含与SEQ ID NO:18所示的氨基酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的氨基酸序列。在一些实施方案中,Cas9融合物包含与选自SEQ ID NO:20-27的氨基酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的氨基酸序列。在一些实施方案中,Cas9在框内与遍在蛋白可操作地融合(Ub-Cas9)。在一些实施方案中,Ub-Cas9具有至少一个N末端修饰。在一些实施方案中,N-末端修饰的Ub-Cas9包含与选自SEQ ID NO:39-58的氨基酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的氨基酸序列。在一些实施方案中,遍在蛋白包含与SEQ ID NO:60所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,核酸酶系统还包含SaCas9切口酶。在一些实施方案中,核酸酶系统还包含供体模板序列。在一些实施方案中,至少一种载体包含与SEQ ID NO:62或67所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,供体模板序列校正至少一个基因突变。在一些实施方案中,至少一个基因突变是rd10或rd12。在一些实施方案中,至少一种载体包含与SEQ ID NO:63或64所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,至少一种载体包含与SEQ ID NO:65或66所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,启动子可操作地连接到至少一个、两个、三个、四个、五个、六个、七个、八个、九个或十个gRNA。在一些实施方案中,靶序列包含核苷酸序列AN19NGG、GN19NGG、CN19NGG或TN19NGG。在一些实施方案中,细胞是真核或非真核细胞。在一些实施方案中,真核细胞是哺乳动物或人细胞。在一些实施方案中,真核细胞是视网膜感光细胞。在一些实施方案中,一种或多种基因产物是视紫红质。在一些实施方案中,一种或多种基因产物的表达降低。在一些实施方案中,该系统使一种或多种基因产物失活。在一些实施方案中,核酸酶系统切除至少一个基因突变。在一些实施方案中,一种或多种基因产物的表达降低。在一些实施方案中,细胞是视网膜神经节细胞。在一些实施方案中,真核细胞是癌细胞。在一些实施方案中,癌细胞中的细胞增殖被抑制或减少。在一些实施方案中,癌细胞中的细胞凋亡增强或增加。
在一些实施方案中,本文公开主题还提供了改变细胞中的一种或多种基因产物的表达的方法,其中所述细胞包含编码一种或多种基因产物的DNA分子,所述方法包括向所述细胞内引入非天然存在的CRISPR-Cas系统,所述CRISPR-Cas系统包含一种或多种载体,所述载体包含:a)与编码CRISPR-Cas系统指导RNA(gRNA)的至少一种核苷酸序列可操作地连接的H1启动子,其中所述gRNA与DNA分子的靶序列杂交;以及b)在细胞中可操作的调节元件,其与编码Cas9蛋白的核苷酸序列可操作地连接,其中组分(a)和(b)位于所述系统的相同或不同载体上,其中所述gRNA靶向所述靶序列且与之杂交,并且Cas9蛋白切割所述DNA分子以改变所述一种或多种基因产物的表达。
在一些实施方案中,本文公开主题还提供了改变真核细胞中的一种或多种基因产物的表达的方法,其中所述细胞包含编码一种或多种基因产物的DNA分子,所述方法包括向所述细胞内引入非天然存在的CRISPR-Cas系统,所述CRISPR-Cas系统包含一种或多种载体,所述载体包含:a)与编码CRISPR-Cas系统指导RNA(gRNA)的至少一种核苷酸序列可操作地连接的H1启动子,其中所述gRNA与DNA分子的靶序列杂交;以及b)在真核细胞中可操作的调节元件,其与编码II型Cas9蛋白的核苷酸序列可操作地连接,其中组分(a)和(b)位于所述系统的相同或不同载体上,由此所述gRNA靶向所述靶序列且与之杂交,并且Cas9蛋白切割所述DNA分子,并且由此改变所述一种或多种基因产物的表达。在一个方面,靶序列可以是以任何核苷酸开始的靶序列,例如N20NGG。在一些实施方案中,靶序列包含核苷酸序列AN19NGG。在一些实施方案中,靶序列包含核苷酸序列GN19NGG。在一些实施方案中,靶序列包含核苷酸序列CN19NGG。在一些实施方案中,靶序列包含核苷酸序列TN19NGG。在一些实施方案中,靶序列包含核苷酸序列AN19NGG或GN19NGG。在另一个方面,Cas9蛋白进行密码子优化用于在细胞中表达。在另外一个方面,Cas9蛋白进行密码子优化用于在真核细胞中表达。在一个进一步方面,真核细胞是哺乳动物细胞或人细胞。在另一个方面,一种或多种基因产物的表达降低。
本文公开主题还提供了改变真核细胞中的一种或多种基因产物的表达的方法,其中所述细胞包含编码一种或多种基因产物的DNA分子,所述方法包括向所述细胞内引入非天然存在的CRISPR-Cas系统,所述CRISPR-Cas系统包含含有双向H1启动子的载体,其中所述双向H1启动子包含:a)提供在编码CRISPR-Cas系统指导RNA(gRNA)的至少一种核苷酸序列的一个方向上的转录的控制元件,其中所述gRNA与DNA分子的靶序列杂交;以及b)提供在编码II型Cas9蛋白的核苷酸序列的相反方向上的转录的控制元件,由此所述gRNA靶向所述靶序列且与之杂交,并且Cas9蛋白切割DNA分子,并且由此改变一种或多种基因产物的表达。在一个方面,靶序列可以是以任何核苷酸开始的靶序列,例如N20NGG。在一些实施方案中,靶序列包含核苷酸序列AN19NGG。在一些实施方案中,靶序列包含核苷酸序列GN19NGG。在一些实施方案中,靶序列包含核苷酸序列CN19NGG。在一些实施方案中,靶序列包含核苷酸序列TN19NGG。在另一个方面,靶序列包含核苷酸序列AN19NGG或GN19NGG。在另外一个方面,Cas9蛋白进行密码子优化用于在细胞中表达。在另一个方面,Cas9蛋白进行密码子优化用于在真核细胞中表达。在一个进一步方面,真核细胞是哺乳动物细胞或人细胞。在另一个方面,一种或多种基因产物的表达降低。
在一些方面,本文公开主题提供了包括将一种或多种多核苷酸例如如本文所述的一种或多种载体、其一种或多种转录物、和/或由其转录的一种或多种蛋白质递送至宿主细胞的方法。在一些方面,本文公开主题进一步提供了通过此类方法产生的细胞,以及包含此类细胞或由此类细胞产生的生物体(例如动物、植物或真菌)。在一些实施方案中,将与指导序列组合(并且任选地与之复合)的CRISPR酶递送至细胞。常规的基于病毒和非病毒的基因转移方法可以用于在哺乳动物细胞或靶组织中引入核酸。此类方法可以用于将编码CRISPR系统组分的核酸施用于培养中的细胞或宿主生物体中的细胞。非病毒载体递送系统包括DNA质粒、RNA(例如本文所述载体的转录物)、裸露核酸和与递送媒介物复合的核酸,例如脂质体。病毒载体递送系统包括DNA和RNA病毒,其在递送至细胞后具有附加或整合的基因组。关于基因治疗程序的综述,参见Anderson(1992)Science 256:808-813;Nabel和Felgner(1993)TIBTECH 11:211-217;Mitani和Caskey(1993)TIBTECH 11:162-166;Dillon(1993)TIBTECH 11:167-175;Miller(1992)Nature 357:455-460;Van Brunt(1998)Biotechnology 6(10): 1149-1154;Vigne(1995)Restorative Neurology and Neuroscience 8:35-36;Kremer和Perricaudet(1995)British Medical Bulletin 51(1):31-44;Haddada等人(1995)Current Topics in Microbiology and Immunology.Doerfler和Bohm(编辑);以及Yu等人(1994)Gene Therapy 1:13-26。
核酸的非病毒递送方法包括脂转染、核转染、显微注射、基因枪、病毒体、脂质体、免疫脂质体、聚阳离子或脂质:核酸缀合物、裸露DNA、人工病毒粒子和试剂增强的DNA摄取。脂转染在例如美国专利号5,049,386、4,946,787;和4,897,355)中描述;并且脂转染试剂是商业销售的(例如Transfectam™和Lipofectin™)。适合于多核苷酸的有效受体识别脂转染的阳离子和中性脂质包括Felgner,WO 91/17424;WO 91/16024的那些。递送可以针对细胞(例如体外或离体施用)或靶组织(例如体内施用)。
脂质:核酸复合物(包括靶向脂质体例如免疫脂质复合物)的制备,是本领域技术人员众所周知的(例如,Crystal(1995)Science 270:404-410;Blaese等人(1995)Cancer Gene Ther. 2:291-297: Behr等人(1994)Bioconjugate Chem. 5:382-389;Remy等人(1994)Bioconjugate Chem. 5:647-654;Gao等人(1995)Gene Therapy 2:710-722;Ahmad等人(1992)Cancer Res. 52:4817-4820;美国专利号4,186,183、4,217,344、4,235,871、4,261,975、4,485,054、4,501,728、4,774,085、4,837,028和4,946,787)。
基于RNA或DNA病毒的系统用于递送核酸的用途利用高度进化的方法,所述方法用于将病毒靶向体内的特定细胞并且将病毒载荷运输至核。病毒载体可以直接施用于患者(体内),或者它们可以用于在体外处理细胞,并且可以任选地将修饰的细胞施用于患者(离体)。常规的基于病毒的系统可以包括用于基因转移的逆转录病毒、慢病毒、腺病毒、腺伴关和单纯疱疹病毒载体。在宿主基因组中的整合对于逆转录病毒、慢病毒和腺相关病毒基因转移方法是可能的,经常导致插入的转基因的长期表达。另外,已在许多不同细胞类型和靶组织中观察到高转导效率。
逆转录病毒的向性可以通过掺入外来包膜蛋白,扩展靶细胞的潜在靶群体来改变。慢病毒载体是逆转录病毒载体,其能够转导或感染非分裂细胞并且通常产生高病毒滴度。逆转录病毒基因转移系统的选择因此将取决于靶组织。逆转录病毒载体由顺式作用长末端重复组成,具有高达6-10 kb外来序列的包装能力。最小顺式作用LTR足以用于载体的复制和包装,所述载体随后用于将治疗基因整合到靶细胞内,以提供永久的转基因表达。广泛使用的逆转录病毒载体包括基于鼠白血病病毒(MuLV)、长臂猿白血病病毒(GaLV)、猿猴免疫缺陷病毒(SIV)、人免疫缺陷病毒(HIV)及其组合的那些载体(例如,Buchscher等人(1992)J. Virol. 66:2731-2739;Johann等人(1992)J. Virol. 66:1635-1640;Sommnerfelt等人(1990)J. Virol. 176:58-59;Wilson等人(1989)J. Virol. 63:2374-2378;Miller等人(1991)J. Virol. 65:2220-2224;PCT/US94/05700)。在其中优选瞬时表达的应用中,可以使用基于腺病毒的系统。基于腺病毒的载体在许多细胞类型中能具有非常高的转导效率,并且不需要细胞分裂。使用此类载体,已获得了高滴度和水平的表达。该载体可以在相对简单的系统中大量生产。腺相关病毒(“AAV”)载体也可以用于用靶核酸转导细胞,例如,在核酸和肽的体外生产中,以及用于体内和离体基因治疗程序(例如,West等人(1987)Virology 160:38-47;美国专利号4,797,368;WO 93/24641;Kotin(1994)Human Gene Therapy 5:793-801;Muzyczka(1994)J. Clin. Invest. 94:1351。重组AAV载体的构建在许多出版物中描述,包括美国专利号5,173,414;Tratschin等人(1985)Mol. Cell. Biol. 5:3251-3260;Tratschin等人(1984)Mol. Cell. Biol. 4:2072-2081;Hermonat和Muzyczka(1984)Proc. Natl. Acad. Sci. U.S.A. 81:6466-6470;以及Samulski等人(1989)J. Virol. 63:03822-3828。
包装细胞通常用于形成能够感染宿主细胞的病毒颗粒。此类细胞包括包装腺病毒的293细胞和包装逆转录病毒的ψ2细胞或PA317细胞。用于基因治疗中的病毒载体通常通过产生将核酸载体包装到病毒颗粒内的细胞系来生成。载体通常含有包装和随后整合到宿主内所需的最小病毒序列,其他病毒序列被用于表达多核苷酸的表达盒取代。缺失的病毒功能通常由包装细胞系反式提供。例如,用于基因治疗中的AAV载体通常仅具有来自AAV基因组的ITR序列,其是包装和整合到宿主基因组内所必需的。病毒DNA包装在细胞系中,所述细胞系含有编码其他AAV基因的辅助质粒,即rep和cap,但缺乏ITR序列。细胞系也可以用腺病毒作为辅助物进行感染。辅助病毒促进来自辅助质粒的AAV载体的复制和AAV基因的表达。由于缺乏ITR序列,辅助质粒未以显著量包装。由腺病毒的污染可以通过例如腺病毒对其比AAV更敏感的热处理来减少。用于将核酸递送至细胞的另外方法是本领域技术人员已知的。参见例如US20030087817,其通过引用并入本文。
在一些实施方案中,用本文所述的一种或多种载体瞬时或非瞬时转染宿主细胞。在一些实施方案中,细胞在其天然存在于受试者中时被转染。在一些实施方案中,转染的细胞取自受试者。在一些实施方案中,细胞衍生自取自受试者的细胞,例如细胞系。用于组织培养的广泛多样的细胞系是本领域已知的。细胞系的实例包括但不限于C8161、CCRF-CEM、MOLT、mIMCD-3、NHDF、HeLa-S3、Huh1、Huh4、Huh7、HUVEC、HASMC、HEKn、HEKa、MiaPaCell、Panel、PC-3、TF1、CTLL-2、C1R、Rat6、CV1、RPTE、A10、T24、J82、A375、ARH-77、Calu1、SW480、SW620、SKOV3、SK-UT、CaCo2、P388D1、SEM-K2、WEHI-231、HB56、TIB55、Jurkat、J45.01、LRMB、Bcl-1、BC-3、IC21、DLD2、Raw264.7、NRK、NRK-52E、MRC5、MEF、Hep G2、HeLa B、HeLa T4、COS、COS-1、COS-6、COS-M6A、BS-C-1猴肾上皮、BALB/3T3小鼠胚胎成纤维细胞、3T3 Swiss、3T3-L1、132-d5人胎儿成纤维细胞;10.1小鼠成纤维细胞、293-T、3T3、721、9L、A2780、A2780ADR、A2780cis、A172、A20、A253、A431、A-549、ALC、B16、B35、BCP-1细胞、BEAS-2B、bEnd.3、BHK-21、BR 293、BxPC3、C3H-10T1/2、C6/36、Cal-27、CHO、CHO-7、CHO-IR、CHO-K1、CHO-K2、CHO-T、CHO Dhfr −/−、COR-L23、COR-L23/CPR、COR-L23/5010、COR-L23/R23、COS-7、COV-434、CMLT1、CMT、CT26、D17、DH82、DU145、DuCaP、EL4、EM2、EM3、EMT6/AR1、EMT6/AR10.0、FM3、H1299、H69、HB54、HB55、HCA2、HEK-293、HeLa、Hepa1c1c7、HL-60、HMEC、HT-29、Jurkat、JY细胞、K562细胞、Ku812、KCL22、KG1、KYO1、LNCap、Ma-MeI 1-48、MC-38、MCF-7、MCF-10A、MDA-MB-231、MDA-MB-468、MDA-MB-435、MDCK II、MDCK II、MOR/0.2R、MONO-MAC 6、MTD-1A、MyEnd、NCI-H69/CPR、NCI-H69/LX10、NCI-H69/LX20、NCI-H69/LX4、NIH-3T3、NALM-1、NW-145、OPCN/OPCT细胞系、Peer、PNT-1A/PNT 2、RenCa、RIN-5F、RMA/RMAS、Saos-2细胞、Sf-9、SkBr3、T2、T-47D、T84、THP1细胞系、U373、U87、U937、VCaP、Vero细胞、WM39、WT-49、X63、YAC-1、YAR及其转基因变种。细胞系可从本领域技术人员已知的各种来源获得(参见例如,美国典型培养物保藏中心(ATCC)(Manassus,Va.))。在一些实施方案中,用本文所述的一种或多种载体转染的细胞用于建立包含一种或多种载体衍生序列的新细胞系。在一些实施方案中,用如本文所述的CRISPR系统的组分瞬时转染(例如通过一种或多种载体的瞬时转染,或用RNA转染),并且通过CRISPR复合物的活性修饰的细胞,用于建立包含含有修饰但缺乏任何其他外源序列的细胞的新细胞系。在一些实施方案中,用本文所述的一种或多种载体瞬时或非瞬时转染的细胞,或衍生自此类细胞的细胞系用于评价一种或多种测试化合物。
在一些实施方案中,本文描述的一种或多种载体用于产生非人转基因动物。在一些实施方案中,转基因动物是哺乳动物,例如小鼠、大鼠或兔。在某些实施方案中,生物体或受试者是植物。用于产生转基因动物的方法是本领域已知的,并且一般以例如本文所述的细胞转染方法开始。
在一个方面,本文公开主题提供了修饰真核细胞中的靶多核苷酸的方法,所述方法可以是体内、离体或体外。在一些实施方案中,该方法包括从人或非人动物取样细胞或细胞群体,并且修饰一种或多种细胞。培养可以在离体的任何阶段发生。甚至可以将一种或多种细胞重新引入非人动物内。
在一个方面,本文公开主题提供了修饰真核细胞中的靶多核苷酸的方法。在一些实施方案中,该方法包括允许CRISPR复合物与靶多核苷酸结合,以实现靶多核苷酸的切割,从而修饰靶多核苷酸,其中所述CRISPR复合物包含与指导序列复合的CRISPR酶,所述指导序列与靶多核苷酸内的靶序列杂交。
在一个方面,本文公开主题提供了修饰真核细胞中的多核苷酸表达的方法。在一些实施方案中,该方法包括允许CRISPR复合物与多核苷酸结合,使得结合导致多核苷酸的表达增加或降低;其中所述CRISPR复合物包含与指导序列复合的CRISPR酶,所述指导序列与多核苷酸内的靶序列杂交。
在一个方面,本文公开主题提供了关于使用CRISPR系统的一种或多种元件的方法。本文公开主题的CRISPR复合物提供了用于修饰靶多核苷酸的有效手段。本文公开主题的CRISPR复合物具有广泛多样的用途,包括在多种细胞类型中修饰(例如,缺失、插入、易位、失活、激活)靶多核苷酸。像这样,本文公开主题的CRISPR复合物在例如基因治疗、药物筛选、疾病诊断和预后中具有广谱应用。示例性的CRISPR复合物包含与指导序列复合的CRISPR酶,所述指导序列与靶多核苷酸内的靶序列杂交。
CRISPR复合物的靶多核苷酸可以是对于真核细胞内源或外源的任何多核苷酸。例如,靶多核苷酸可以是位于真核细胞的细胞核中的多核苷酸。靶多核苷酸可以是编码基因产物(例如蛋白质)的序列或非编码序列(例如调节多核苷酸或无用DNA)。不希望受理论束缚,认为靶序列应与PAM(原型间隔区相邻基序)即由CRISPR复合物识别的短序列结合。PAM的精确序列和长度要求根据所用的CRISPR酶而不同,但PAM通常是与原型间隔区(即,靶序列)相邻的2-5个碱基对序列。PAM序列的实例在下文实施例节段中给出,并且技术人员将能够鉴定用于与给定CRISPR酶一起使用的进一步PAM序列。
靶多核苷酸的实例包括与信号传导生化途径相关的序列,例如信号传导生化途径相关基因或多核苷酸。靶多核苷酸的实例包括疾病相关基因或多核苷酸。“疾病相关”基因或多核苷酸指任何基因或多核苷酸,与非疾病对照的组织或细胞相比,其在衍生自患病组织的细胞中以异常水平或异常形式产生转录或翻译产物。它可以是变得以异常高水平表达的基因;它可以是变得以异常低水平表达的基因,其中改变的表达与疾病的发生和/或进展相关。疾病相关基因还指具有突变或遗传变异的基因,其直接负责疾病的病因学或与负责疾病的病因学的基因处于连锁不平衡。转录或翻译的产物可以是已知的或未知的,并且可以处于正常或异常水平。
本文公开的主题的实施方案还涉及与敲除基因、扩增基因和修复与DNA重复不稳定性和神经障碍相关的特定突变有关的方法和组合物(Robert D. Wells, TetsuoAshizawa, Genetic Instabilities and Neurological Diseases, 第二版, AcademicPress, 2011年10月13日-Medical)。已经发现串联重复序列的特定方面负责多于20种人类疾病(McIvor等人(2010) RNA Biol. 7(5):551-8)。可以利用CRISPR-Cas系统来校正基因组不稳定性的这些缺陷。
在本文公开的主题的又一个方面,CRISPR-Cas系统可以用于校正由几种基因突变引起的眼部缺陷,其在Traboulsi,编辑(2012) Genetic Diseases of the Eye, 第2版,Oxford University Press中进一步描述。
本文公开的主题的若干其他方面涉及校正与多种遗传疾病相关的缺陷。例如,遗传性脑疾病可包括但不限于肾上腺脑白质营养不良、胼胝体发育不全、艾卡迪综合征、阿尔珀斯病(Alpers' Disease)、阿尔茨海默病、巴斯综合征(Barth Syndrome)、贝敦氏症(Batten Disease)、CADASIL、小脑变性、法布瑞氏症(Fabry's Disease)、Gerstmann-Straussler-Scheinker病、亨廷顿病和其他三联体重复障碍、利氏病(Leigh's Disease)、Lesch-Nyhan综合征、门克斯病(Menkes Disease)、线粒体肌病和NINDS空洞脑。
在一些实施方案中,所述病症可以是瘤形成。在一些实施方案中,所述病症可以是与年龄相关的黄斑变性。在一些实施方案中,所述病症可以是精神分裂症。在一些实施方案中,所述病症可以是三核苷酸重复障碍。在一些实施方案中,所述病症可以是脆性X综合征。在一些实施方案中,所述病症可以是分泌酶相关障碍。在一些实施方案中,所述病症可以是朊病毒相关障碍。在一些实施方案中,所述病症可以是ALS。在一些实施方案中,所述病症可以是药物成瘾。在一些实施方案中,所述病症可以是自闭症。在一些实施方案中,所述病症可以是阿尔茨海默病。在一些实施方案中,所述病症可以是炎症。在一些实施方案中,所述病症可以是帕金森氏病。
与帕金森氏病相关的蛋白质的实例包括但不限于α-突触核蛋白、DJ-1、LRRK2、PINK1、Parkin、UCHL1、Synphilin-1、和NURR1。
成瘾相关蛋白的实例可包括例如ABAT。
炎症相关蛋白的实例可例如包括由Ccr2基因编码的单核细胞趋化蛋白-1(MCP1)、由Ccr5基因编码的C-C趋化因子受体5型(CCR5)、由Fcgr2b基因编码的IgG受体IIB(FCGR2b、也称为CD32)、或由Fcer1g基因编码的Fc ε R1g (FCER1g)蛋白质。
心血管疾病相关蛋白的实例可例如包括IL1B(白细胞介素1, β)、XDH(黄嘌呤脱氢酶)、TP53(肿瘤蛋白p53)、PTGIS(前列腺素12(前列环素)合酶)、MB(肌红蛋白)、IL4(白细胞介素4)、ANGPT1(血管生成素1)、ABCG8(ATP结合盒, 亚家族G(WHITE), 成员8)或CTSK(组织蛋白酶K)。
阿尔茨海默病相关蛋白的实例可例如包括由VLDLR基因编码的极低密度脂蛋白受体蛋白(VLDLR)、由UBA1基因编码的遍在蛋白样修饰物激活酶1(UBA1)、或由UBA3基因编码的NEDD8活化酶E1催化亚基蛋白(UBE1C)。
与自闭症谱系障碍相关的蛋白质的实例可例如包括由BZRAP1基因编码的苯并二氮杂受体(外周)相关蛋白1(BZRAP1),由AFF2基因(也称为MFR2)编码的AF4/FMR2家族成员2蛋白(AFF2),由FXR1基因编码的脆性X智力低下的常染色体同源物1蛋白(FXR1),或由FXR2基因编码的脆性X智力低下的常染色体同源物2蛋白(FXR2)。
与黄斑变性相关的蛋白质的实例可例如包括由ABCR基因编码的ATP结合盒亚家族A(ABC1)成员4蛋白(ABCA4),由APOE基因编码的载脂蛋白E蛋白(APOE)或由CCL2基因编码的趋化因子(C—C基序)配体2蛋白(CCL2)。
与精神分裂症相关的蛋白质的实例可包括NRG1、ErbB4、CPLX1、TPH1、TPH2、NRXN1、GSK3A、BDNF、DISC1、GSK3B及其组合。
参与肿瘤抑制的蛋白质的实例可例如包括ATM(共济失调性毛细血管扩张症突变的)、ATR(共济失调性毛细血管扩张症和Rad3相关的)、EGFR(表皮生长因子受体)、ERBB2(v-erb-b2成红细胞白血病病毒致癌基因同源物2)、ERBB3(v-erb-b2成红细胞白血病病毒致癌基因同源物3)、ERBB4(v-erb-b2成红细胞白血病病毒致癌基因同源物4)、Notch1、Notch2、Notch3或Notch4。
与分泌酶障碍相关的蛋白质的实例可例如包括PSENEN(早老素增强子2同源物(秀丽隐杆线虫(C. elegans)))、CTSB(组织蛋白酶B)、PSEN1(早老素1)、APP(淀粉样蛋白β(A4)前体蛋白)、APH1B(前咽缺陷1同源物B(秀丽隐杆线虫))、PSEN2 (早老素2(阿尔茨海默病4))或BACE1(β-位点APP-切割酶1)。
与肌萎缩侧索硬化相关的蛋白质的实例可包括SOD1(超氧化物歧化酶1)、ALS2(肌萎缩侧索硬化2)、FUS(在肉瘤中融合)、TARDBP(TAR DNA结合蛋白)、VAGFA(血管内皮生长因子A)、VAGFB(血管内皮生长因子B)和VAGFC (血管内皮生长因子C)及其任何组合。
与朊病毒疾病相关的蛋白质的实例可包括SODI(超氧化物歧化酶1)、ALS2(肌萎缩侧索硬化2)、FUS(在肉瘤中融合)、TARDBP(TAR DNA结合蛋白)、VAGFA(血管内皮生长因子A)、VAGFB(血管内皮生长因子B)和VAGFC(血管内皮生长因子C)及其任何组合。
与朊病毒障碍中的神经变性病症相关的蛋白质的实例可例如包括A2M(α2-巨球蛋白)、AATF(凋亡拮抗转录因子)、ACPP(前列腺酸性磷酸酶)、ACTA2(主动脉平滑肌肌动蛋白α2)、ADAM22(ADAM金属肽酶结构域)、ADORA3(腺苷A3受体)或ADRA1D(α-1D肾上腺素受体的α-1D肾上腺素能受体)。
与免疫缺陷相关的蛋白质的实例可例如包括A2M [α2-巨球蛋白];AANAT [芳基烷基胺N-乙酰基转移酶];ABCA1 [ATP结合盒,亚家族A(ABC1),成员1];ABCA2 [ATP结合盒,亚家族A(ABC1),成员2];或ABCA3 [ATP结合盒,亚家族A(ABC1),成员3]。
与三核苷酸重复障碍相关的蛋白质的实例例如包括AR(雄激素受体),FMR1(脆性X智力低下1)、HTT(亨廷顿蛋白)或DMPK(肌营养不良性肌强直症蛋白激酶)、FXN(共济蛋白)、ATXN2(ataxin 2)。
与神经递送障碍相关的蛋白质的实例例如包括SST(生长抑素)、NOS1(一氧化氮合酶1(神经元))、ADRA2A(肾上腺素能,α-2A-,受体),ADRA2C(肾上腺素能,α-2C-,受体)、TACR1 (速激肽受体1)或HTR2c(5-羟色胺(血清素)受体2C)。
神经发育相关序列的实例例如包括A2BP1(ataxin 2-结合蛋白1)、AADAT(氨基己二酸氨基转移酶)、AANAT(芳基烷基胺N-乙酰转移酶),ABAT(4-氨基丁酸氨基转移酶)、ABCA1(ATP结合盒,亚家族A(ABCl),成员1)或ABCA13(ATP结合盒,亚家族A(ABC1),成员13)。
可用本系统治疗的优选病症的其他实例包括可以选自:Aicardi-Goutières综合征;亚历山大病;Allan-Herndon-Dudley综合征;POLG相关障碍;α-甘露糖苷贮积症(II型和III型);Alström综合征;Angelman;综合征;共济失调毛细血管扩张;神经元蜡样脂褐质沉积症(Neuronal Ceroid-Lipofuscinoses);β-地中海贫血;双侧视神经萎缩和(婴儿)视神经萎缩1型;成视网膜细胞瘤(双侧);卡纳万病(Canavan Disease);脑眼面骨骼综合征1(COFS1);脑腱黄瘤病;Cornelia de Lange综合征;MAPT相关障碍;遗传朊病毒病;Dravet综合征;早发性家族性阿尔茨海默病;弗里德赖希氏共济失调[FRDA];Fryns综合征;岩藻糖苷贮积症;福山型先天性肌营养不良;半乳糖唾液酸贮积症;戈谢病;有机酸血症;噬血细胞淋巴组织细胞增多症;Hutchinson-Gilford早衰综合征;粘脂质沉积病II型;婴儿游离唾液酸贮积病;PLA2G6相关神经变性;Jervell和Lange-Nielsen综合征;大疱性表皮松解症;亨廷顿病;克拉伯病(婴儿);线粒体DNA-相关Leigh综合征和NARP;Lesch-Nyhan综合征;LIS1相关平脑症;Lowe综合征;枫糖尿病;MECP2重复综合征;ATP7A相关铜运输障碍;LAMA2相关肌营养不良症;芳基硫酸酯酶A缺乏症;粘多糖贮积病I、II或III型;过氧化物酶体生物发生障碍,Zellweger综合征谱;神经变性变伴脑铁积聚障碍;酸性鞘磷脂酶缺乏症;尼曼-匹克二氏病C型;甘氨酸脑病;ARX相关障碍;尿素循环障碍;COL1A 1/2相关的成骨不全症;线粒体DNA缺失综合征;PLP1相关障碍;佩里综合征;Phelan-McDermid综合征;糖原贮积病II型(Pompe病)(婴儿);MAPT相关障碍;MECP2相关障碍;肢近端型点状软骨发育不良1型;罗伯茨综合征;桑德霍夫病;辛德勒病-1型;腺苷脱氨酶缺乏症;Smith-Lemli-Opitz综合征,脊髓性肌肉萎缩,婴儿期发作的脊髓小脑共济失调;己糖胺酶A缺乏症;致死性骨发育不全1型;胶原蛋白VI型相关障碍;Usher综合征I型;先天性肌营养不良症;Wolf-Hirschhorn综合征;溶酶体酸性脂肪酶缺乏症;和着色性干皮病。
II. 治疗神经变性疾病的方法
本文公开的主题还提供在有此需要的受试者中治疗选自视网膜营养不良、角膜营养不良、微卫星扩张疾病、癌症和神经变性疾病的疾病的方法,该方法包括:(a)提供包含一种或多种载体的非天然存在的核酸酶系统(例如,CRISPR相关(Cas)9(CRISPR-Cas9,非Cas9CRISPR系统,CRISPR-Cpf-1系统等),所述载体包含:a)可操作地连接到至少一种编码核酸酶系统指导RNA(gRNA)的核苷酸序列的启动子(例如,直向同源H1启动子或7sk),其中gRNA与细胞中DNA分子的靶序列杂交,且其中DNA分子编码一种或多种在细胞中表达的基因产物;和b)可操作地连接到编码基因组靶向核酸酶(例如,修饰的Cas9蛋白)的核苷酸序列的在细胞中可操作的调节元件,其中组分(a)和(b)位于所述系统的相同或不同载体上,其中所述gRNA靶向所述靶序列并与之杂交,且所述核酸酶切割所述DNA分子以改变所述一种或多种基因产物的表达;和(b)向受试者施用有效量的所述系统。在一些实施方案中,将系统包装到单个腺相关病毒(AAV)颗粒中。在一些实施方案中,该系统使一种或多种基因产物失活。在一些实施方案中,该系统切除至少一个基因突变。在一些实施方案中,H1启动子包含与SEQ ID NO:12或32所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,直向同源H1启动子衍生自小鼠或大鼠。在一些实施方案中,直向同源H1启动子包含与SEQ ID NO:84-119所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,直向同源H1启动子包含SEQID NO:84-119所示的核苷酸序列。在一些实施方案中,H1启动子包含:a)在至少一种编码gRNA的核苷酸序列的一个方向上提供转录的控制元件;和b)在编码基因组靶向核酸酶的核苷酸序列的相反方向上提供转录的控制元件。在一些实施方案中,启动子是人、小鼠或大鼠7sk启动子。在一些实施方案中,7sk选自7sk1(7sk的变体1,其使用内源性GSTA4 5’UTR),7sk2(7sk的变体2,其仅使用5’UTR中的kozak序列),和7sk3(使用β珠蛋白5’UTR的7sk的变体)。在一些实施方案中,人7sk1包含与SEQ ID NO:3所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,小鼠7sk1包含与SEQ IDNO:6具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,人7sk2包含与SEQ ID NO:4具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,小鼠7sk2包含与SEQ ID NO:7具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,人7sk3包含与SEQ ID NO:5具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,小鼠7sk3包含与SEQ ID NO:8具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,直向同源H1启动子或7sk启动子具有至少一个修饰。在一些实施方案中,启动子的至少一个修饰包括允许条件调节的元件。在一些实施方案中,该元件是tet响应性启动子。在一些实施方案中,tet响应性启动子包含被工程化到H1启动子中的Tet阻遏物(TetR)和Tet操纵子(TetO)。在一些实施方案中,TetR包含与SEQ ID NO:14具有至少80%、85%、90%、95%、98%、99%或100%同一性的氨基酸序列。在一些实施方案中,TetO包含与SEQ ID NO:11所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,H1-TetO包含与SEQ ID NO:13所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,启动子的至少一个修饰包括允许自动调节的位点。在一些实施方案中,自动调节位点包含与SEQ ID NO:33或34所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,核酸酶系统还包含至少一个终止子序列。在一些实施方案中,至少一个终止子序列选自SV40或合成的聚A(SPA)序列。在一些实施方案中,终止子序列是SV40 120(SEQ ID NO:123)或240(SEQ ID NO:122)碱基对序列。在一些实施方案中,终止子序列是SPA 49碱基对序列。在一些实施方案中,核酸酶系统还包含5’非翻译区(5’UTR)序列。在一些实施方案中,核酸酶系统还包含Kozak序列。在一些实施方案中,Kozak序列包含与SEQ ID NO:1或2具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,核酸酶系统还包含介导不依赖帽的翻译起始的RNA序列。在一些实施方案中,RNA序列选自6.947或6.967。在一些实施方案中,Cas9包含与SEQ ID NO:61所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,Cas9包含至少一个修饰。在一些实施方案中,Cas9中的至少一个修饰包括切割序列的改变。在一些实施方案中,核酸酶选自Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9 (也称为Csn1和Csx12)、Cas10、Cas13a、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、Cpf1、C2c1、C2c2和C2c3。在一些实施方案中,切割序列的改变选自T2A、P2A、E2A和F2A。在一些实施方案中,T2A包含与SEQ ID NO:36所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的氨基酸序列。在一些实施方案中,P2A包含与SEQ ID NO:35所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的氨基酸序列。在一些实施方案中,P2A包含具有SEQ ID NO:35所示的核苷酸序列的氨基酸序列。在一些实施方案中,E2A包含与SEQ ID NO:37所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的氨基酸序列。在一些实施方案中,F2A包含与SEQ ID NO:38所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的氨基酸序列。在一些实施方案中,Cas9中的至少一个修饰包含针对在细胞中表达而优化的密码子。在一些实施方案中,Cas9还包含在框内与细胞周期依赖性蛋白质可操作地融合的接头序列(Cas9融合物)。在一些实施方案中,细胞周期依赖性蛋白质选自APE2、ATR、BRCA1、Chk1、Cdc5、Cdc6、Cdc7、Cdc45、Cdt1、CSA、CSB、Ctf18、DDB1、DDB2、DNA2、DUT、Elg1、EndoV、Esp1、核酸外切酶1、FBH1、FEN1、孪蛋白、Hus1、KNTC2 (NDC80)、Ku80、连接酶1、Mad2、MBD4、Mcm3、Mcm4、Mcm5、Mcm6、Mcm7、Mcm8、Mcm10、MGMT、MLH3、Mms4、MPG、MSH2、Mus81、NBS1、NEIL2、NEIL3、NTH1、Orc1、Orc3、PARP1、PCNA、Pif1、PMS1、PMS2、PNK、Pola p180、Pola p70、Pola Spp1 (Prim2a)、Polb、Pold p125、Pole Dpb3、Pole Dpb4、Pole Pol2、Poli、Poll、Polm、Psf1、Psf2、Psf3、Rad1、Rad18、Rad23A、Rad23B、Rad51、Rad51D、Rad54、Rad6A、RPA34、RPA70、Scc1、Scc3、Sir2、SIRT1 (Sirtuin)、TDG、TDP1、TIMELESS、Tin2、拓扑异构酶I、拓扑异构酶IIIa、拓扑异构酶IIIb、Ubc13、UNG、XAB2、XPC、XPF、XPG、Xrcc2和XRCC4。在一些实施方案中,细胞周期依赖性蛋白质是孪蛋白。在一些实施方案中,细胞周期依赖性蛋白质是人孪蛋白。在一些实施方案中,人孪蛋白包含位置1-110的氨基酸(hGem(1-110))。在一些实施方案中,hGem(1-110)包含与SEQ ID NO:19中所示的氨基酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的氨基酸序列。在一些实施方案中,细胞周期依赖性蛋白质是Cdt1。在一些实施方案中,细胞周期依赖性蛋白质是人Cdt1。在一些实施方案中,人Cdt1包含位置30-120的氨基酸(hCdt1(30-120))。在一些实施方案中,hCdt1(30-120)包含与SEQID NO:18所示的氨基酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的氨基酸序列。在一些实施方案中,Cas9融合物包含与选自SEQ ID NO:20-27的氨基酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的氨基酸序列。在一些实施方案中,Cas9在框内可操作地与遍在蛋白融合(Ub-Cas9)。在一些实施方案中,Ub-Cas9具有至少一个N末端修饰。在一些实施方案中,N-末端修饰的Ub-Cas9包含与选自SEQ ID NO:39-58的氨基酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的氨基酸序列。在一些实施方案中,遍在蛋白包含与SEQ ID NO:60所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,核酸酶系统还包含SaCas9切口酶。在一些实施方案中,核酸酶系统还包含供体模板序列。在一些实施方案中,至少一种载体包含与SEQ ID NO:62或67所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,供体模板序列校正至少一个基因突变。在一些实施方案中,至少一个基因突变是rd10或rd12。在一些实施方案中,至少一种载体包含与SEQ ID NO:63或64所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,至少一种载体包含与SEQ ID NO:65或66所示的核苷酸序列具有至少80%、85%、90%、95%、98%、99%或100%同一性的核苷酸序列。在一些实施方案中,启动子可操作地连接到至少一个、两个、三个、四个、五个、六个、七个、八个、九个或十个gRNA。在一些实施方案中,靶序列包含核苷酸序列AN19NGG、GN19NGG、CN19NGG或TN19NGG。在一些实施方案中,细胞是真核或非真核细胞。在一些实施方案中,真核细胞是哺乳动物或人细胞。在一些实施方案中,真核细胞是视网膜感光细胞。在一些实施方案中,一种或多种基因产物是视紫红质。在一些实施方案中,一种或多种基因产物的表达降低。在一些实施方案中,该系统使一种或多种基因产物失活。在一些实施方案中,核酸酶系统切除至少一个基因突变。在一些实施方案中,一种或多种基因产物的表达降低。在一些实施方案中,细胞是视网膜神经节细胞。在一些实施方案中,真核细胞是癌细胞。在一些实施方案中,癌细胞中的细胞增殖被抑制或减少。在一些实施方案中,癌细胞中的细胞凋亡增强或增加。在一些实施方案中,该疾病是角膜营养不良。在一些实施方案中,该疾病是视网膜营养不良。在一些实施方案中,视网膜营养不良选自利伯氏先天性黑蒙(LCA)、视网膜色素变性(RP)和青光眼。在一些实施方案中,角膜营养不良选自上皮基底膜营养不良,上皮复发性糜烂营养不良,上皮下粘液性角膜营养不良,遗传性青少年性角膜上皮营养不良,Lisch上皮角膜营养不良,凝胶状滴状角膜营养不良,雷-布二氏角膜营养不良,Thiel–Behnke角膜营养不良,格子状角膜营养不良1型(经典),格子状角膜营养不良2型,格子状角膜营养不良III型,格子状角膜营养不良IIIA型,格子状角膜营养不良I/IIIA型,格子状角膜营养不良IV型,多形性(角膜)淀粉样变性,颗粒状角膜营养不良1型,颗粒状角膜营养不良2型,黄斑角膜营养不良,Schnyder角膜营养不良,先天性基质角膜营养不良,斑点状角膜营养不良,后部无定形角膜营养不良,弗朗索瓦中央云雾状营养不良,德斯密膜前角膜营养不良,富克斯内皮角膜营养不良,多形性角膜后层营养不良,先天性遗传性内皮营养不良和X连锁内皮角膜营养不良。在一些实施方案中,微卫星扩张疾病选自:睑裂狭小、上睑下垂和倒转型内眦赘皮并指、颅骨锁骨发育不良、先天性中枢肺换气不足综合征、Haddad综合征DM(强直性肌营养不良)、FRAXA(脆性X综合征)、FRAXE(脆性XE智力低下)、FRDA(弗里德赖希氏共济失调)、富克斯内皮角膜营养不良、FXTAS(脆性X相关震颤/共济失调综合征)、手足生殖器综合征、HD(亨廷顿病)、前脑无裂畸形、智力低下伴生长激素缺乏、智力低下、癫痫、韦斯特综合征、帕廷综合征、眼咽肌营养不良、SBMA(脊髓和延髓肌肉萎缩症)、SCA1(脊髓小脑性共济失调1型)、SCA12(脊髓小脑性共济失调12型)、SCA17(脊髓小脑性共济失调17型)、SCA2(脊髓小脑性共济失调2型)、SCA3(脊髓小脑性共济失调3型或马-约病)、SCA6(脊髓小脑性共济失调6型)、SCA7(脊髓小脑性共济失调7型)、SCA8(脊髓小脑性共济失调8型)和并指。在一些实施方案中,通过植入、注射或病毒进行向受试者施用。在一些实施方案中,通过视网膜下注射进行向受试者施用。在一些实施方案中,局部、血管内、皮内、透皮、胃肠外、静脉内、肌肉内、鼻内、皮下、区域、经皮、气管内、腹膜内、动脉内、膀胱内、肿瘤内、肿瘤周围、吸入、全身、灌注、灌洗、经由注射直接或经由施用和制剂口服进行向受试者施用。在一些实施方案中,向受试者施用局部发生在眼睛表面。在一些实施方案中,向受试者施用发生在角膜、巩膜之上或之外,眼内、结膜下、筋膜下或眼球后空间,或眼睑内或周围。在一些实施方案中,用至少一种另外的抗癌剂治疗受试者。在一些实施方案中,抗癌剂选自紫杉醇、顺铂、托泊替康、吉西他滨、博来霉素、依托泊苷、卡铂、多西他赛、多柔比星、托泊替康、环磷酰胺、曲贝替定、奥拉帕利、他莫昔芬、来曲唑和贝伐单抗。在一些实施方案中,用至少一种另外的抗癌疗法治疗受试者。在一些实施方案中,抗癌疗法是放射疗法、化学疗法或手术。在一些实施方案中,癌症是实体瘤。在一些实施方案中,癌症选自脑癌、胃肠癌、口腔癌、乳腺癌、卵巢癌、前列腺癌、胰腺癌、肺癌、肝癌、咽喉癌、胃癌和肾癌。在一些实施方案中,癌症是脑癌。在一些实施方案中,全身施用选自口服、静脉内、皮内、腹膜内、皮下和肌肉内施用。在一些实施方案中,受试者是哺乳动物。在一些实施方案中,哺乳动物是人。
在一些实施方案中,本文公开的主题提供治疗有此需要的受试者的眼神经变性疾病的方法,该方法包括:(a)提供包含一种或多种载体的非天然存在的CRISPR-Cas系统,所述载体包含:i)可操作地连接到至少一种编码CRISPR-Cas系统指导RNA(gRNA)的核苷酸序列的H1启动子,其中gRNA与受试者细胞中DNA分子的靶序列杂交,且其中DNA分子编码一种或多种在细胞中表达的基因产物;和ii)可操作地连接到编码Cas9蛋白的核苷酸序列的在细胞中可操作的调节元件,其中组分(i)和(ii)位于所述系统的相同或不同载体上,其中所述gRNA靶向所述靶序列并与之杂交,且Cas9蛋白切割所述DNA分子以改变所述一种或多种基因产物的表达;和(b)向受试者施用有效量的所述系统。
“神经变性疾病、障碍或病症”意指与神经元或其他神经细胞(例如视网膜感光细胞)的变性或功能障碍相关的疾病、障碍或病症(包括神经病)。神经变性疾病、障碍或病症可以是任何疾病、障碍或病症,其中可以发生神经元的功能降低或功能障碍,或者神经元或其他神经细胞的丧失。
这种疾病、障碍或病症包括但不限于青光眼,和神经系统的神经变性疾病、障碍或病症,例如以下疾病或与以下疾病相关:肌萎缩侧索硬化(ALS)、三叉神经痛、舌咽神经痛、贝尔麻痹、重症肌无力、肌营养不良、进行性肌萎缩、原发性侧索硬化(PLS)、假性延髓麻痹、进行性延髓麻痹、脊髓性肌萎缩、遗传性肌萎缩、椎间盘综合征(invertebrate disksyndromes)、颈椎病、丛障碍、胸廓出口破坏综合征、外周神经病变、卟啉症病、阿尔茨海默病、亨廷顿病、帕金森氏病、帕金森氏附加性疾病、多系统萎缩、进行性核上麻痹、皮质基底节变性、路易体痴呆、额颞叶痴呆、脱髓鞘疾病、格-巴二氏综合征、多发性硬化、夏-马-图三氏病、朊病毒病、克雅二氏病、Gerstmann-Straussler-Scheinker综合征(GSS)、致命性家族性失眠症(FFI)、牛海绵状脑病(BSE)、皮克氏病、癫痫和AIDS痴呆综合症。
神经系统的其他神经变性疾病、障碍或病症例如以下疾病或与以下疾病相关:酒精中毒、亚历山大病、阿尔珀斯病、共济失调性毛细血管扩张症、贝敦氏症(也称为Spielmeyer-Vogt-Sjogren-Batten病)、卡纳万病、科卡因综合征、糖尿病性神经病变、额颞叶变性、HIV相关性痴呆、肯尼迪氏病、克拉伯病、神经疏螺旋体病(neuroborreliosis)、马-约病(脊髓小脑性共济失调3型)、湿性或干性黄斑变性、尼曼-匹克二氏病、佩-梅二氏病、光感受器变性疾病如视网膜色素变性和相关疾病、雷弗素姆氏病、桑德霍夫氏病(Sandhoff'sdisease)、谢耳德氏病、继发于恶性贫血的脊髓亚急性联合变性、Spielmeyer-Vogt-Sjogren-Batten病(也称为贝敦氏症)、脊髓小脑性共济失调(具有不同特征的多种类型)、Steele-Richardson-Olszewski病和脊髓痨。
眼相关神经变性的实例包括但不限于青光眼、格子状角膜营养不良、视网膜色素变性、年龄相关性黄斑变性(AMD)、与湿性或干性AMD相关的光感受器变性、其他视网膜变性如视网膜色素变性(RP)、视神经玻璃膜疣、视神经病变和视神经炎如起因于多发性硬化的视神经炎。在一些实施方案中,眼神经变性疾病选自青光眼、视网膜变性和年龄相关性黄斑变性。在一些实施方案中,眼神经变性疾病是视网膜色素变性(RP)。
可以根据本文公开主题预防或治疗的不同类型青光眼的非限制性实例包括原发性青光眼(也称为原发性开角型青光眼、慢性开角型青光眼、慢性单纯性青光眼和单纯性青光眼)、低眼压性青光眼、原发性闭角型青光眼(又称原发性闭角型青光眼、窄角型青光眼、瞳孔阻滞性青光眼和急性充血性青光眼)、急性闭角型青光眼、慢性闭角型青光眼、间歇性闭角型青光眼、慢性开角闭合型青光眼、色素性青光眼、剥脱性青光眼(也称为假性剥脱性青光眼或囊膜性青光眼)、发育性青光眼(如原发性先天性青光眼和婴儿型青光眼)、继发性青光眼(如炎性青光眼(如葡萄膜炎和福斯氏异色性虹膜睫状体炎))、晶状体源性青光眼(如闭角型青光眼伴成熟性白内障、继发于晶状体囊破裂的晶状体过敏性青光眼、由于晶状体毒性网络阻塞和晶状体半脱位的晶状体溶解性青光眼)、继发于眼内出血的青光眼(如前房积血和溶血性青光眼,又称为红细胞性青光眼)、创伤性青光眼(如房角退缩性青光眼、创伤性前房角后退、术后青光眼、无晶状体性瞳孔阻滞和睫状体阻滞性青光眼)、新生血管性青光眼、药源性青光眼(如皮质类固醇诱发的青光眼和α-胰凝乳蛋白酶性青光眼)、中毒性青光眼以及与眼内肿瘤、视网膜脱离、严重的化学性眼部灼伤和虹膜萎缩相关的青光眼。在某些实施方案中,神经变性疾病、障碍或病症是与过度血管生成无关的疾病、障碍或病症,例如,并非新生血管性青光眼的青光眼。
如本文使用的,术语“障碍”一般而言指获益于用针对鉴定的靶或途径之一的化合物治疗的任何病症,包括可以通过有效量的针对鉴定的靶或途径之一的化合物或其药学上可接受的盐治疗的任何疾病、障碍或病症。
如本文使用的,术语“治疗”可以包括逆转、减轻此类术语适用的疾病、障碍或病症或者此类疾病、障碍或病症的一种或多种症状或表现(例如,引起视网膜感光细胞功能障碍和/或死亡的疾病或障碍)、抑制其进展、预防或减少其可能性。在一些实施方案中,治疗减少视网膜感光细胞的功能障碍和/或死亡。例如,与在经历治疗之前的受试者或未经历治疗的受试者中的视网膜感光细胞的功能障碍和/或死亡相比,治疗可以使视网膜感光细胞的功能障碍和/或死亡减少至少5%、10%、15%、20%、25%、30%、33%、35%、40%、45%、50%、55%、60%、66%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多。在一些实施方案中,治疗完全抑制受试者中的视网膜感光细胞的功能障碍和/或死亡。如本文使用的,“视网膜感光细胞”是在视网膜中发现的能够光转导的专门类型的神经元。在一些实施方案中,至少一种基因产物是视紫红质。
在一些实施方案中,在施用于受试者之前,将系统包装到单个腺相关病毒(AAV)颗粒内。在一些实施方案中,对受试者的施用通过视网膜下注射而发生。治疗、施用或疗法可以是连续的或间歇的。连续治疗、施用或疗法指至少在每天的基础上的治疗,而不中断治疗一天或多天。间歇性治疗或施用,或以间歇方式的治疗或施用,指在性质中并非连续的,而是循环的治疗。根据本文公开方法的治疗可以导致疾病、障碍或病症的完全缓解或治愈,或者疾病、障碍或病症的一种或多种症状的部分改善,并且可以是瞬时的或永久的。术语“治疗”还预期涵盖预防、治疗和治愈。
术语“有效量”或“治疗有效量”指足以实现有益或所需结果的试剂的量。治疗有效量可以根据以下一种或多种而变:待治疗的受试者和疾病状况、受试者的重量和年龄、疾病状况的严重性、施用方式等等,其可以通过本领域普通技术人员容易地确定。该术语还应用于将提供通过本文所述的任何一种成像方法的检测的图像的剂量。具体剂量可以根据以下一种或多种而变:所选择的具体试剂、待遵循的给药方案、它是否与其他化合物组合施用、施用时机、待成像的组织和携带剂量的物理递送系统。
术语“受试者”和“患者”在本文中可互换使用。在其许多实施方案中通过本文公开方法治疗的受试者期望地是人受试者,尽管应理解本文所述的方法关于所有脊椎动物物种都是有效的,所述脊椎动物物种预期包括在术语“受试者”中。相应地,“受试者”可以包括用于医学目的人受试者,例如用于治疗现有病症或疾病或者用于预防病症或疾病发作的预防性治疗,或者用于医学、兽医学目的或发育目的的动物受试者。合适的动物受试者包括哺乳动物,包括但不限于灵长类动物,例如人、猴、猿等等;牛科动物,例如牛、黄牛等等等;绵羊动物,例如绵羊等等;山羊动物,例如山羊等等;猪科动物,例如猪、阉公猪等等;马科动物,例如马、驴、斑马等等;猫科动物,包括野猫和家猫;犬科动物,包括犬;兔类动物,包括兔、野兔等等;以及啮齿类动物,包括小鼠、大鼠等等。动物可以是转基因动物。在一些实施方案中,受试者是人,包括但不限于胎儿、新生儿、婴儿、青少年和成人受试者。此外,“受试者”可以包括患有或怀疑患有病况或疾病的患者。
IV. 一般定义
尽管本文采用了特定术语,但它们仅以一般性和描述性意义使用,而不是出于限制性目的。除非另外定义,否则本文使用的所有技术和科学术语都具有与本文所述主题所属领域的普通技术人员通常理解相同的含义。
遵循长期存在的专利法惯例,在包括权利要求在内的本申请中使用时,术语“一个”、“一种”和“该/所述”指“一个或多个/一种或多种”。因此,例如,对“受试者”的提及包括多个受试者,除非上下文明显相反(例如,多个受试者),等等。
在说明书和权利要求自始至终,术语“包含”、“含有”和“包括”以非排他性的意义使用,除非上下文另有要求。同样地,术语“包括”及其语法变体预期是非限制性的,使得列表中的项目的叙述不排除可以取代或加入所列项目的其他类似项目。
为了本说明书和所附权利要求的目的,除非另有说明,否则表示说明书和权利要求中使用的量、大小、尺寸、比例、形状、制剂、参数、百分比、参数、数量、特征和其他数值的所有数目,应理解为在所有情况下都用术语“约”进行修饰,即使术语“约”可能没有明确地出现在值、量或范围处。相应地,除非有相反的指示,否则在下述说明书和所附权利要求中阐述的数值参数不是精确的并且无需是精确的,而是可以根据需要近似和/或更大或更小,其反映公差、转换因子、四舍五入、测量误差等等以及本领域技术人员已知的其他因素,这取决于寻求通过本文公开主题获得的所需性质。例如,当提及值时,术语“约”可以意欲涵盖与指定量在一些实施方案中± 100%、在一些实施方案中± 50%、在一些实施方案中±20%、在一些实施方案中± 10%、在一些实施方案中± 5%、在一些实施方案中± 1%、在一些实施方案中± 0.5%、以及在一些实施方案中± 0.1%的变化,因为此类变化适于执行所公开的方法或采用所公开的组合物。
此外,当与一个或多个数目或数值范围结合使用时,术语“约”应理解为指所有此类数目,包括范围中的所有数目,并且通过扩展所述数值上方和下方的边界来修改该范围。通过端点的数值范围的叙述包括包含在该范围内的所有数目,例如整数,包括其分数(例如,1至5的叙述包括1、2、3、4和5,及其分数例如,1.5、2.25、3.75、4.1等等),以及该范围内的任何范围。
例证
已包括下述实施例,以对本领域普通技术人员提供了用于实践本文公开主题的代表性实施方案的指导。鉴于本公开内容和本领域的一般技术水平,技术人员可以了解,下述实施例仅预期是示例性的,并且可以采用众多变化、修改和改变,而不脱离本文公开主题的范围。下述合成描述和具体实施例仅用于说明性目的,并且不应解释为以任何方式限制通过其他方法制备本公开内容的化合物。
实施例1
背景
CRISPR-Cas9技术的发展彻底改革基因编辑领域且为治疗遗传性疾病提供一种全新的方法。CRISPR-Cas9系统由以序列特异性方式靶向Cas9核酸酶的指导RNA(gRNA)构成。被CRISPR系统切割需要gRNA与DNA序列的互补碱基配对和必需的原型间隔区相邻(protospaceradjacent)基序(PAM),即在靶位点3'处发现的短核苷酸基序(Dalkara, D.等人Science translational medicine 5, 189ra176 (2013);Berns, KI等人FundamentalVirology (B.N. Fields , 和Knipe, D.M.编辑) 545-562 (Raven Press, 1986))。目前,限制性最小且最常用的Cas9蛋白来自酿脓链球菌,其识别序列NGG,且因此,CRISPR靶向序列是N20NGG。虽然许多研究已经表明可以在体外有效靶向疾病突变,用于体内使用的基于CRISPR-Cas9的疗法的开发受到安全性问题和递送限制的阻碍。
虽然已经显示疾病突变的CRISPR靶向在许多体外环境中以及通过小鼠和其他动物研究在体内有效,所有当前的方法仍远未达到临床使用,这在很大程度上归因于递送限制。AAV载体是在眼基因治疗注射中最常用和最成功使用的病毒载体(Swiech, L.等人Nature biotechnology 33, 102-106 (2015);Jinek, M.等人Science 337, 816-821(2012);Cong, L.等人 Science 339, 819-823 (2013);Mali, P.等人Science 339, 823-826 (2013))。若干特点使AAV成为最具吸引力的选择:该病毒是非致病性的,它感染分裂和非分裂细胞二者,表达可以持续很长一段时间,且特别值得注意的是它在临床试验中的安全史、功效和普遍缺乏毒性。另外,特定的AAV血清型在视网膜下注射后靶向感光细胞上是有效的。虽然AAV载体提供一种安全的递送治疗性CRISPR组分的手段,存在限制它们的效用的一个主要的技术障碍,即它们的大小。野生型AAV基因组的长度为~4.7kb且重组病毒可以包装至至多~5.2kb(Mancuso, K.等人Nature 461, 784-787 (2009);Beltran, WA等人Proceedings of the National Academy of Sciences of the United States of America 109, 2132-2137 (2012))。该包装容量限定可用于单一病毒载体的DNA的上限。
通过常规方法表达Cas9和gRNA所需的DNA超过5.2kb:Pol II启动子(~0.5kb)、SpCas9(~4.1kb)、Pol II终止子(~0.2kb)、U6启动子(~0.3kb)和gRNA(~0.1kb)。AAV递送挑战的一种方法是双载体方法:一种AAV载体用于递送Cas9,和另一种AAV载体用于递送gRNA(Petrs-Silva, H.等人Molecular therapy: the journal of the American Society of Gene Therapy 19, 293-301 (2011))。然而,双AAV方法利用小的小鼠Mecp2启动子,其是一种已被发现在视网膜细胞中表达的基因——除了视杆(rod)的关键例外外(Song, C.等人Epigenetics & chromatin 7, 17 (2014);Jain, D.等人Pediatric neurology 43, 35-40 (2010)),表明除了由于病毒递送载荷增加引起的潜在毒性外,共同递送方法可能无法先验靶向绝大多数LCA突变。虽然这是其他基因疗法介导的基因组编辑的潜在可行方法,但本文提供的是用于视网膜基因编辑的单一载体方法,其应当提高效率,特异性靶向光感受器,并减少来自病毒载荷递送的潜在毒性。
最近报告使用H1启动子而不是更传统使用的U6启动子来指导gRNA转录允许可用的CRISPR基因靶向空间的近似加倍(Ranganathan, V等人Nature communications 5,4516 (2014))。值得注意的是,还检测到较低的脱靶切割倾向,这表明H1启动子将对治疗方法更有利。在这些研究期间,注意到与内源性H1RNA基因紧密基因组接近的蛋白质编码基因(PARP-2)的存在 (Baer, M.等人Nucleic acids research 18, 97-103 (1990);Myslinski, E.等人Nucleic acids research 29, 2502-2509 (2001);Ame JC等人J Biol Chem. 276(14):11092-9 (2001))。H1RNA (pol III RNA转录物)和PARP-2基因(pol II转录物)的起点之间的序列是230bp(图2),这表明该相对较小的序列可以起紧凑的双向启动子的作用。假设H1启动子的这些偶然性质可能克服将两种CRISPR组分包装到单个AAV中的大小障碍。
A.使用5’UTR修饰增强H1双向pol II表达
为了开发H1作为双向pol II/III启动子,且因为pol III活性已经被充分表征,产生eGFP报道构建体以更好地优化其pol II活性(图1A)。人(HEK293)和小鼠细胞(NIH3T3)显示出弱但可清楚检测的GFP荧光,表明H1启动子可指导pol II表达。使用该GFP报道系统,进行实验以增加pol II表达,同时通过评估系统中的三个可变组分,保持紧密性:(a)启动子序列,(b)5’UTR,和(c)终止子序列。
为了评估不同的终止子序列,测试了七种不同的序列。发现SV40(240bp和120bp)终止子和49bp合成聚(A)序列(SPA)对于GFP表达均具有功能,表达,尽管SPA序列也不起作用。
研究了通过修饰5’UTR来优化翻译效率是否会改进报道物的表达。发现从β-珠蛋白5’UTR序列中获得的50bp序列的插入能够显著改进报道物表达,且与此概念一致,简单插入编码强Kozak序列的9个碱基(5’-GCCGCCACC-3’ SEQ ID NO:1)足以接近这些水平。
此外,使用经鉴定为介导不依赖于帽的翻译起始的RNA序列的序列(Wellensiek等人Nature Methods 10, 747–750 (2013))也是有效的(6.947和6.967)。
关注于Kozak序列,发现强9-碱基共有序列(5’-GCCGCCACC-3’ SEQ ID NO:1)或较小的6-碱基共有序列(5’-GCCACC-3’ SEQ ID NO:2)可以增强GFP表达(图1)。在不同的H1双向序列中,9-碱基序列一致地略微更好。
B.通过使用不同的直向同源序列调节双向表达
测试来自不同生物体的H1启动子序列表明小鼠(176bp)和大鼠(207bp)序列都能够比人H1启动子驱动更强的GFP表达(分别为~7倍和~6倍高)。该结果与其他研究中报告的结果相反,例如Hung等人(2006) Biochemical and Biophysical Research Communication339:1035-1042,其报告人类序列以更高水平表达。
使用H1启动子序列从36种真哺乳亚纲哺乳动物的直向同源区域进行基因组比对。这些提供可用于微调双向表达的额外序列(SEQ ID NO:84-119)。
C.具有pol II和pol III活性二者的新型紧凑的双向启动子序列
在鉴定H1双向启动子序列可以有效指导pol II和pol III基因二者的表达后,搜索其他可能紧凑的双向序列的基因组。
开发定制的perl脚本来比较pol III基因的5’转录起始位点与pol II基因的转录起始位点。对于以相反方向定向的那些(异向转录)过滤结果。输入文件可以是注释的基因组文件或转录数据(pol II或pol III ChIP位点)。从人类基因组中鉴定的一些ChIP位点包括但不限于:
ALOXE3-tRNA(lys):
TCTTTCCGCTCCAGGACCGCCCTGGGCCTGCAGGATCCTGGGCGGGAGCCCAGGTGTCCGGGATCTGGGCCACTAGGGACTGGGGAGGAACCTCTCAGAGAAGCCCATAGCCCGCAGCGGCCCCGCGCGGCCGGTTCCGGCGCCGCACTGTTCCAGCCTCTACTATGGTACAGTCCCTGCGTCGCAGCCTCGGCGGGGGCTCTAAGAACGGGAGGCAGAAAAAGCTCAATCAGCAGCAGGCGAGCTTCACCCGCTGCTTCCAAATCTGTGCCAAAATATTCTATGCTGCACAGATAAAATCCTCTGTCGGTTCTACAAGCCTGGCTTTTCCTATAGAGAACCCTCTTATAAGCAAAAAGTAAAGCTCTCGTGAAGA;
C8orf41-SNORD13:
TCCTGACTGCAGCACCAGAAGGCTGGTCTCTCCCACAGAACGAGGATGGAGGCGGGGAGGGATCCGTTGAAGAGGGAAGGAGCGATCACCCAAAGAGAACTAAAATCAAATAAAATAAAACAGAGAGATGTCTTGGAGGAGGGGGCGAGTCTGACCGGGATAAGAATAAAGAGAAAGGGTGAACCCGGGAGGCGGAGTTTGCAGTGAGCCGAGATCGCGCCACTGCACTCCAGCCTGGGCGACAGAGTGAGACTCCGTCTCAGTAAAAAAAAAAAAAAAAAAAAGAATAAAGAGGAAAGGACGCAAGAAAGGGAAAGGGGACTCTCAGGGAGTAAAAGAGTCTTACACTTTTAACAGTGACGTTAAAAGACTACTGTTGCCTTTCTGAAGACTAAAAAGAAAAAAAACTTAAAAATTTAAAGAAATAAACTTCTGAGCCATGTCACCAACTTAACCACCCCCAGGTACCTGCAACGGCTCGCGCCCGCCGGTGTCTAACAGGATCCGGACCTAGCTCATATTGCTGCCGCAAAACGCAAGGCTAGCTTCCGCCAGTACTGCCGCAACACCTTCTTATTTCACGACGTATGGTCGTAAAGCAATAAAGATCCAGGCTCGGGAAAATGACGGAGAGGTGGAACTATAGAGAATAAATTTGCATATATAATAATCCGCTCGCTAATTGTGTTTCTGTTTTCCTTTGCTAAGGTAGAAACAAAAGAATAATCACAGAATCTCAGTGGGACTTTGAAAATATCCAGGATTTTATACGTGAAGAATGGATGTATCGCATTACGGTAGTCACCCTATGTGTAAATTAGTGGCACATACTTGGCACTCCTTAATGTCAACTATAAGATG;
CGB1:
GTCTCTCTCTTAGCGGGATATCTTCCGCAAGCACTGGGAATGTGGACATGGAAAGTAAATTGAGTCTCCGTGGGGGAGTGAGACAGGGAGTGAGGGGTGTTGGACGCGGCACGGGAACCTGGCCAGAGTCAGCGGACCCAATTGGCTGCTCTCTCTCAGATGCAGTTCCCCTTCCTCCCTCCAGGGGGCGCCACGGAACGCAGGGCCCTCACTGGCCCTGGGGACTGGGTGACGTCAGGGATGAGCCTCTTGTGATTGGCTCCATCACCCTGCGTAAGATCAAAGGGAAGAAAGGATGGGCCCGACAA;
CGB2:
GTCTCTCTCTTAGCGGGATATCTTCCGCAAGCACTGGGGATGTGGACATGGAAAGTAAATTGAGTCTCCGTGGGGGAGTGAGACAGGGAGTGAGGGGTGTTGGACGCGGCACGGGAACCCGGCCGGAGTCAGCGGACCCAATTGGCTGCTCTCTCTCAGATACAGTTCCCCTTCCTCCCTCCAGGGGGCGCCACGGAACGCAGGGCCCTCACTGGCCCTGGGGACTGGGTGACGTCAGGGGTGAGCCTCTCCTGATTGGCTCCATCACCCTGCGTAAGGTCAAAAGGAAGAAAGGAGATCCCCGACAC;
DPP9-tRNA(gly):
TAACCGCTCAGCTGACCTCAGGAGGGCAGGGGTGCCTTCTAAAGGGTCCAGAGAGCCTCCATTCCAGCTGCAGGCGTGGGACACAGACCGGGACGTGGGGCGGCGGCCGGACTGGGCAGGTCGTCCCGGGTCCAGCGGCGCCTCACGGTCGCGGCTCCATGCCCGGGACTGCGACCCCGGAAGTGGCGGGAGCGGGGGACGACAGCCGCGGCGGACACAGGGGACCCGCCGGCTCAGGCACCTTTGACCCGGAAGTTGAGCGACCCAGGCGGCGGCCTGGGATTGGACACCACCAGGCACGTACCAAGGCGTCCGCGGCGCTTGGGGGGGAGCCCGCGGCGCGGCGGCCTAAGGTGCGTAACGCCCCATGAACGACATCTTCCGGTGGGTTAGGGAGAGACACCCCCCTGTGACTTGGTATCACTCAGTCAAACCCATGATCCCCCACTATTAAGGATATCCGGAGAGGATGCTACCTATCAGG;
MED16-RNU6-9:
GAGGGCAGTCACCAGCTCCTGGCCCGTGCGCCAAGCTCAGCGGGCGTCCGCGGTGCGATCTTCCCTAGCGCCTCGGGTCTGGCGCCGCCATCTTCCTCGGTAACAACCAGTCGCCTGAGGCGTGGGGCCGCCTCCCAAAGACTTCTGGGAGGGCGGTGCGGCTCAGGCTCTGCCCCGCCTCCGGGGCTATTTGCATACGACCAT
为了证实这一点,使用我们的GFP报道物测定测试7sk双向启动子,或GSTA4基因(polII基因)和RN7SK基因(pol III基因)之间的区域。该启动子的pol III活性已有详细记载。
同时测试5’UTR的几种变体;内源性地,人GSTA4基因的注释5’UTR被内含子分开,其当克隆到我们的报道系统(7sk1)中时被融合。还测试了缩短形式的5’UTR或β珠蛋白5’UTR(7sk3)。使用的所有构建体掺入强9-碱基Kozak共有序列(5’-GCCGCCACC-3’ SEQ IDNO:1) (7sk2)。
报道物测定表明该区域能够指导pol II表达,这证实充当双向启动子区域的能力。尽管该区域略大于H1双向启动子区域,但发现它更活跃。
测试了直向同源序列指导表达的能力。小鼠序列也是活跃的,且比人序列略强。
这些结果证实具有pol II和pol III活性二者的双向启动子的存在,以及针对该区域搜索基因组序列的能力。
D.具有RNA pol II和RNA pol III活性二者的双向启动子的表达筛选
生物信息学:
双向启动子序列可用作鉴定pol II/pol III活性的不同变体的起点。开发了定制的perl脚本来比较pol III基因的5’转录起始位点与pol II基因的转录起始位点。对于在相反方向上定向的那些(异向转录)过滤结果。输入文件可以是注释的基因组文件或转录数据(pol II或pol III ChIP位点)。使用该信息,鉴定了具有RNA pol II和RNA pol III活性二者的双向启动子。这些序列可用于产生衍生序列
靶向转录因子结合位点:
启动子序列可以用于鉴定转录结合位点,或可以比对多个启动子序列以鉴定转录因子结合位点,其可以继而用于设计双向启动子。转录结合因子位点的鉴定可以通过共有序列,或通过使用差异距离矩阵或多维标度来确定(De Bleser P等人Genome Biol. 2007;8(5):R83.)。
随机序列文库:
或者,可以使用随机序列的合成文库作为筛选具有双向活性的序列的起始点。通过随机化、改组或突变双向序列,可以搜索具有不同pol II或pol III启动子活性的DNA序列。
可以使用qPCR或荧光来建立筛选以读出pol II和pol III活性。简单的荧光屏会使用如所述的报道物(GFP、mCherry等)和RNA适体,例如在小分子如DFHB1-1T存在下变为荧光的Broccoli。筛选可以使用蛋白质读出例如耐药性(例如抗生素)、抗原性肽(pepdies)或细胞表面标志物等。
替代报道物可以是由蛋白质和RNA二者组成的功能复合物。例如,可以将MS2外壳蛋白结合茎环掺入RNA中且pol II转录可以编码MS2外壳蛋白,其继而结合RNA序列。如果将两个结合位点掺入到RNA中,则可以使用荧光互补性(分裂蛋白互补性)作为读出。
筛选也可以通过分离和评估pol II活性然后pol III活性来进行。最后,这些序列然后可以以允许RNA pol II或RNA pol III二者的异向转录的方式组合。
方法
质粒构建:GFP报道质粒由略有修改的Gibson Assembly (New England Biolabs,Ipswich, MA) (Gibson等人(2009) Nature Methods 6:343-345)构建。
将人胚肾(HEK)细胞系293T(Life Technologies,Grand Island,NY)在用10%胎牛血清(热失活的) (Gibco, Life Technologies, Grand Island, NY)和2mM GlutaMAX(Invitrogen)补充的Dulbecco改良Eagle培养基(DMEM)(Invitrogen)中在37℃和5% CO2/20% O2下维持。
将N2A细胞系(Life Technologies,Grand Island,NY)在用10%胎牛血清(Gibco,Life Technologies, Grand Island, NY)和2mM GlutaMAX (Invitrogen)补充的Dulbecco改良Eagle培养基(DMEM)(Invitrogen)中在37℃和5% CO2/20% O2下维持。
用每种构建体转染(Lipofectamine 3000)细胞。使用流式细胞术分析GFP表达。
人7sk1 (具有Kozak的GSTA4 5’UTR):
GGTGGCGGCGATAGCTTTTCAGGCTTTCTGGAGTCCACTCGGAGGCCTGGAGCCGCACAAAGCGCCAGGTCAGCGGTCCCGGCTGGGTGAGACCAGCAGGCGGCTCTAGCGCGCGGGAGCTGGGCGAGGCTCCGGGACGACCTCACCAATGGAGACTGCAGTATTTAGCATGCCCCACCCATCTGCAAGGCATTCTGGATAGTGTCAAAACAGCCGGAAATCAAGTCCGTTTATCTCAAACTTTAGCATTTTGGGAATAAATGATATTTGCTATGCTGGTTAAATTAGATTTTAGTTAAATTTCCTGCTGAAGCTCTAGTACGATAAGCAACTTGACCTAAGTGTAAAGTTGAGACTTCCTTCAGGTTTATATAGCTTGTGCGCCGCTT GGGTACCTC (SEQ ID NO:3)
人7sk2 (短5’ UTR):
GGTGGCGGCAGTATTTAGCATGCCCCACCCATCTGCAAGGCATTCTGGATAGTGTCAAAACAGCCGGAAATCAAGTCCGTTTATCTCAAACTTTAGCATTTTGGGAATAAATGATATTTGCTATGCTGGTTAAATTAGATTTTAGTTAAATTTCCTGCTGAAGCTCTAGTACGATAAGCAACTTGACCTAAGTGTAAAGTTGAGACTTCCTTCAGGTTTATATAGCT TGTGCGCCGCTTGGGTACCTC (SEQ ID NO:4)
人7sk3 (β-珠蛋白5’ UTR):
GGTGTCTGTTTGAGGTTGCTAGTGAACACAGTTGTGTCAGAAGCAAATGTAGTATTTAGCATGCCCCACCCATCTGCAAGGCATTCTGGATAGTGTCAAAACAGCCGGAAATCAAGTCCGTTTATCTCAAACTTTAGCATTTTGGGAATAAATGATATTTGCTATGCTGGTTAAATTAGATTTTAGTTAAATTTCCTGCTGAAGCTCTAGTACGATAAGCAACTTGACCTAAGTGTAAAGTTGAGACTTCCTTCAGGTTTATATAGCTTGTGCGCCGCTTGG GTACCTC (SEQ IDNO:5)
小鼠7sk1 (具有Kozak的GSTA4 5’UTR):
GGTGGCGGCCTCGTATGGGACCGCACCGGACACGGGCGCCTGGGCCAGGAGCAGAGCCGGGCCGTAGAATAGACATGGCCGTCGGGGGCGGGGCTTCGGAAGGTTTAACCAATCCAAACTGTTGTATTTTGCATAGCCCCAAAGCATTTTGGTTAACAGTAAAAACATCCTAAATTTAAGTATTTTAATTTAAACTTAGAACGAAGCGAGTATAAAAAGGATTATTTAACCCTAAAACGGATTCAGGATTTGTTATAATATCAAGTACAGTCGGCTACATAAGGTCACCACATGTGTAAAGTTACAAAATTCTATGGCCTTATATACCTACCAAGA GCCTGCTTACTCTC (SEQ ID NO:6)
小鼠7sk2 (短5’ UTR):
GGTGGCGGCAGACATGGCCGTCGGGGGCGGGGCTTCGGAAGGTTTAACCAATCCAAACTGTTGTATTTTGCATAGCCCCAAAGCATTTTGGTTAACAGTAAAAACATCCTAAATTTAAGTATTTTAATTTAAACTTAGAACGAAGCGAGTATAAAAAGGATTATTTAACCCTAAAACGGATTCAGGATTTGTTATAATATCAAGTACAGTCGGCTACATAAGGTCACCACATGTGTAAAGTTACAAAATTCTATGGCCTTATATACCTACCAAGAGCCTGCTT ACTCTC (SEQ IDNO:7)
小鼠7sk3 (β-珠蛋白5’ UTR):
GGTGTCTGTTTGAGGTTGCTAGTGAACACAGTTGTGTCAGAAGCAAATGTAGACATGGCCGTCGGGGGCGGGGCTTCGGAAGGTTTAACCAATCCAAACTGTTGTATTTTGCATAGCCCCAAAGCATTTTGGTTAACAGTAAAAACATCCTAAATTTAAGTATTTTAATTTAAACTTAGAACGAAGCGAGTATAAAAAGGATTATTTAACCCTAAAACGGATTCAGGATTTGTTATAATATCAAGTACAGTCGGCTACATAAGGTCACCACATGTGTAAAGTTACAAAATTCTATGGCCTTATATACCTACCAAGAGCCTGCTTACTCTC (SEQ ID NO:8)
1.Dryja, TP等人.The New England Journal of Medicine 323, 1302-1307(1990).
2.Dryja, TP等人.Nature 343, 364-366 (1990).
3.Doudna, JA等人.Science 346, 1258096 (2014).
4.Hsu, PD等人.Cell 157, 1262-1278 (2014).
5.Liang, Y.等人.The Journal of Biological Chemistry 279, 48189-48196(2004).
6.Dalkara, D. & Sahel, J. A. Comptes Rendus Biologies 337, 185-192(2014).
7.Day, TP.等人.Advances in Experimental Medicine and Biology 801, 687-693(2014).
8.Willett, K. & Bennett, Frontiers in immunology 4, 261, (2013).
9.Dinculescu, A.等人.Human Gene Therapy 16, 649-663 (2005).
10.Kotterman, MA等人.Gene Therapy 22, 116-126 (2015).
11.Mowat, FM等人.Gene Therapy 21, 96-105 (2014).
12.Dalkara, D.等人.Science Translational Medicine 5, 189ra176 (2013).
13.Berns, KI等人.Fundamental Virology (B.N. Fields ,和Knipe, D.M.编辑)545-562 (Raven Press, 1986).
14.Swiech, L.等人.Nature Biotechnology 33, 102-106 (2015).
15.Jinek, M.等人.Science 337, 816-821 (2012).
16.Cong, L.等人. Science 339, 819-823 (2013).
17.Mali, P.等人.Science 339, 823-826 (2013).
18.Mancuso, K.等人.Nature 461, 784-787 (2009).
19.Beltran, WA等人.Proceedings of the National Academy of Sciences of the United States of America 109, 2132-2137 (2012).
20.Petrs-Silva, H.等人.Molecular therapy :The Journal of the American Society of Gene Therapy 19, 293-301 (2011).
21.Song, C.等人.Epigenetics & Chromatin 7, 17 (2014).
22.Jain, D.等人.Pediatric Neurology 43, 35-40 (2010).
23.Ranganathan, V等人.Nature Communications 5, 4516 (2014).
24.Baer, M.等人.Nucleic Acids Research 18, 97-103 (1990).
25.Myslinski, E.等人.Nucleic Acids Research 29, 2502-2509 (2001).
26.Ame JC等人.J Biol Chem. 276(14):11092-9 (2001)。
实施例2
用于调节核糖核蛋白酶活性或RNA指导的核酸酶的条件pol II/pol III双向启动子表达
先前的工作已经证明H1启动子的pol III活性可以被工程化到tet响应性启动子中且可以通过四环素调节。在Tet阻遏物(TetR)存在下,工程化到H1启动子中的Tet操纵子(TetO)序列被TetR结合并阻遏pol III表达。
该系统先前未与H1启动子的双向组分组合,H1启动子是一种可以允许调节pol II和pol III转录物的系统。核糖核蛋白酶或RNA指导的核酸酶可以使用工程化的双向启动子系统通过四环素调节。
在此,显示H1的pol II活性没有因TetO操纵子位点的存在而显著改变。这提供核糖核蛋白酶或RNA指导的核酸酶(例如Cas9/gRNA)的诱导活性的机制。或者,可以进行TetO位点的放置以特异性阻遏pol II或pol III转录物或二者。
这种系统对于调节由AAV病毒递送的CRISPR活性具有巨大的临床优势且可以用于其他紧凑的双向启动子。
1.Matthess等人Oncogene. 2005四月21日;24(18):2973-80。
方法
质粒构建:GFP报道质粒由略有修改的Gibson Assembly (New England Biolabs,Ipswich, MA) (Gibson等人(2009) Nature Methods 6:343-345)构建。
将人胚肾(HEK)细胞系293T(Life Technologies,Grand Island,NY)在用10%胎牛血清(热失活的) (Gibco, Life Technologies, Grand Island, NY)和2mM GlutaMAX(Invitrogen)补充的Dulbecco改良Eagle培养基(DMEM)(Invitrogen)中在37℃和5% CO2/20% O2下维持。
将N2A细胞系(Life Technologies,Grand Island,NY)在用10%胎牛血清(Gibco,Life Technologies, Grand Island, NY)和2mM GlutaMAX (Invitrogen)补充的Dulbecco改良Eagle培养基(DMEM)(Invitrogen)中在37℃和5% CO2/20% O2下维持。
用每种构建体转染(Lipofectamine 3000)细胞。使用流式细胞术分析GFP表达。
mm079靶序列:GAAGAAGGTTCGAGATCTCA (SEQ ID NO:9)
mm079基因组靶位点:GAAGAAGGTTCGAGATCTCAAGG (SEQ ID NO:10)
TetO位点:TCCCTATCAGTGATAGAGA (SEQ ID NO:11)
H1_wt:
GGAATTCGAACGCTGACGTCATCAACCCGCTCCAAGGAATCGCGGGCCCAGTGTCACTAGGCGGGAACACCCAGCGCGCGTGCGCCCTGGCAGGAAGATGGCTGTGAGGGACAGGGGAGTGGCGCCCTGCAATATTTGCATGTCGCTATGTGTTCTGGGAAATCACCATAAACGTGAAATGTCTTTGGATTTGGGAATCTTATAAGTTCTGTATGAGACCACTTTTTCCC (SEQ ID NO:12)
H1_TetO:
GGAATTCGAACGCTGACGTCATCAACCCGCTCCAAGGAATCGCGGGCCCAGTGTCACTAGGCGGGAACACCCAGCGCGCGTGCGCCCTGGCAGGAAGATGGCTGTGAGGGACAGGGGAGTGGCGCCCTGCAATATTTGCATGTCGCTATGTGTTCTGGGAAATCACCATAAACGTGAAATCCCTATCAGTGATAGAGACTTATAAGTTCCCTATCAGTGATAGA GATCCC (SEQ ID NO:13)
TetR序列:
MSRLDKSKVINSALELLNEVGIEGLTTRKLAQKLGVEQPTLYWHVKNKRALLDALAIEMLDRHHTHFCPLEGESWQDFLRNNAKSFRCALLSHRDGAKVHLGTRPTEKQYETLENQLAFLCQQGFSLENALYALSAVGHFTLGCVLEDQEHQVAKEERETPTTDSMPPLLRQAIELFDHQGAEPAFLFGLELIICGLEKQLKCESGSAYSGSREF (SEQ IDNO:14)
实施例3
A.通过转录后细胞周期调节对基因组工程核酸酶的调节
新的RNA指导的核酸酶的出现彻底改革基因组编辑技术并改变生物学研究。这些技术虽然提供前所未有的精确修饰基因组的手段,但受到调节如何修复DNA断裂的细胞过程的限制。特别是对于基因组工程应用,调节细胞对DNA断裂的响应的能力具有巨大的后果(见Gutschner等人(2016) Cell Reports)。
细胞对DNA断裂的响应主要通过两种竞争途径之一发生:非同源末端连接(NHEJ)或同源定向修复(HDR)。NHEJ通常被认为是容易出错的途径,其导致断裂点周围的序列变化。一般而言,NHEJ是DNA修复的更有效或更主要的途径。另一方面,HDR途径远不易出错,但需要大段的同源性以成为模板和修复。
两种途径都具有有利于不同结果的性质。例如,如果想要“敲除”基因,则NHEJ是优选的途径,因为该基因中的DNA断裂将在很大程度上导致序列改变。在实验室中,许多遗传筛选依赖于消除基因功能,且对于治疗方法,将非常需要完全破坏具有显性或功能获得突变的基因。然而,如果想要引入特定的序列变化(“敲入”),人们会尝试通过HDR途径进行修复,从而允许精确的切割和粘贴结果。对于许多科学应用和大多数临床应用,该途径是有利的,因为它可以允许精确的突变修复。
还已知细胞对DNA断裂的响应受细胞周期的调节(图9A);细胞周期的阶段很大程度上决定DNA途径的选择(图9B)。NHEJ主导整个细胞周期的G1,而HDR在S期和G2期期间主导。因此,调节相对于细胞周期的DNA断裂时机的能力可以是将细胞偏向特定修复途径的有力方法。
许多蛋白质以细胞周期依赖性方式受到调节,主要通过转录调节和转录后机制,尤其是遍在蛋白介导的蛋白水解。通常,通过转录机制的调节较慢,而蛋白水解机制是快速的。对于基因组编辑应用,蛋白水解机制可能提供更有利的调节方法。
在细胞中具有相反且因此振荡表达的两种充分表征的蛋白质是孪蛋白(Gem)和Cdt1。Cdt1在细胞周期的G1期累积,而Gem在S/G2/M期期间累积。已经绘制细胞周期调节所需的这些蛋白质的特定区域:hCdt1的氨基酸30-120,和hGem的氨基酸1-110(Sakaue-Sawano A等人Cell 132, 487-498 (2008))。此外,即使各自mRNA在整个细胞周期中不断转录,也可以使与这些结构域融合的蛋白质表现出细胞周期依赖性调节。实质上,细胞蛋白仅在细胞周期的特定阶段识别结构域,这导致融合蛋白遍在蛋白化,然后快速降解。
这里,显示基因组编辑技术,例如RNA指导的核酸酶,可以与hCdt1结构域的hGem融合,导致这些蛋白质的细胞周期依赖性调节(图9C)。因此,这种调节导致截然不同的DNA修复结果。使用CRISPR-Cas9系统,显示使用与hGem或hCdt1融合的Cas9增强或抑制NHEJ和HDR途径。该系统非常稳健,使得其可以将HDR的水平提高到大于NHEJ的水平,考虑到HDR在细胞中的效率低得多,这是非常显著的。
此外,所描述的方法在其优雅和简单性方面非常强大。调节基因组编辑技术结果的其他尝试已经利用在细胞周期的某些阶段中阻止细胞的繁琐方法,随后是直接蛋白质/RNA递送的技术上具有挑战性和低效的方法。相反,本文描述的方法依赖于将编码融合物的质粒、mRNA或蛋白质简单递送至各自的调节序列。
方法
质粒构建:为了产生细胞周期调节的核酸酶蛋白,修饰来自Cas9:T2A:GFP载体(Addgene 44719)的人密码子优化的Cas9基因以用更佳切割的P2A序列替换T2A。接下来,用编码mKate2荧光蛋白的序列替换GFP荧光报道物。接下来,将载体线性化并将编码与hGem(1-110)或hCdt1(30-120)结构域融合的柔性15氨基酸序列接头的gBlock在框内插入以产生Cas9:接头:hGem和Cas9:接头:hCdtl (分别称为Cas9-Gem或Cas9-Cdt)。所有克隆步骤均使用略有修改的Gibson Assembly (New England Biolabs, Ipswich, MA) (Gibson等人(2009) Nature Methods 6:343-345)进行。
将人胚肾(HEK)细胞系293T(Life Technologies,Grand Island,NY)在用10%胎牛血清(Gibco, Life Technologies, Grand Island, NY)和2mM GlutaMAX (Invitrogen)补充的Dulbecco改良Eagle培养基(DMEM)(Invitrogen)中在37℃和5% CO2/20% O2下维持。
靶向视紫红质(hs086172175:AGTACTGTGGGTACTCGAAGGGG (SEQ ID NO:68))的gRNA (参见Jaskula-Ranga, V., & Zack, D. J. (2016). grID:A CRISPR-Cas9 guideRNA Database and Resource for Genome-Editing. bioRxiv, 097352)通过重叠以下寡核苷酸产生,所述寡核苷酸使用两步扩增Phusion Flash DNA聚合酶(Thermo FisherScientific,Rockford,IL)通过PCR退火和扩增,随后使用Zymo DNA清洁和浓缩柱纯化。然后将纯化的PCR产物重悬于H2O中,并使用NanoDrop 1000(Thermo Fisher Scientific)定量。表达gRNA的构建体使用略微修改的Gibson Assembly(New England Biolabs,Ipswich,MA)(Gibson等人Nature Methods 6:343-345(2009))产生。总反应体积从20μl减少到2μl。
用Cas9(未修饰的或细胞周期调节的版本)和靶向视紫红质的gRNA构建体共转染HEK293细胞。转染后48小时,收获基因组DNA,并根据下列引物扩增靶切割位点周围的序列。然后在进行T7 Endo I测定之前纯化和定量PCR产物。简言之,将200ng PCR产物变性,然后缓慢再退火以允许形成异源双链体,将T7核酸内切酶I加入PCR产物中并在37℃下孵育25分钟以切割异源双链体,反应在负载染料中淬灭,最后,在6% TBE PAGE凝胶上跑反应物以分离产物。凝胶用SYBR-Gold染色,可视化,并使用ImageJ定量。使用二项式导出的方程计算NUEJ频率:
其中“a”和“b”的值等于背景扣除后切割片段的积分面积,且“c”等于背景扣除后未切割的PCR产物的积分面积。为了计算HDR频率,在异源双链体形成之前,将与上述相同的PCR产物与EcoRI混合1小时,然后在负载染料中淬灭,最后,在6%TBE PAGE凝胶上跑反应物以分离产物。
HDR频率使用以下方程计算:
其中“a”和“b”的值等于背景扣除后切割片段的积分面积,且“c”等于背景扣除后未切割的PCR产物的积分面积。
HDR寡核苷酸(EcoRI):
CAGAAGGCCCTAACTTCTACGTGCCCTTCTCCAATGCGACGGGTGTGGTACGCAGCCCCTGAATTCACCCACAGTACTACCTGGCTGAGCCATGGCAGTTCTCCATGCTGGCCGCCTACATGTTTC (SEQ ID NO:15)
T7EI引物:
Rho_HDR_F;TGGAGCCCTGAGTGGCTGAG (SEQ ID NO:16)
Rho_HDR_R;CCACCTAGGACCATGAAGAGGTCAG (SEQ ID NO:17)
蛋白质序列:
hCdt1(30-120)
PSPARPALRAPASATSGSRKRARPPAAPGRDQARPPARRRLRLSVDEVSSPSTPEAPDIPACPSPGQKIKKSTPAAGQPPHLTSAQDQDTI (SEQ ID NO:18)
hGem (1-110)
MNPSMKQKQEEIKENIKNSSVPRRTLKMIQPSASGSLVGRENELSAGLSKRKHRNDHLTSTTSSPGVIVPESSENKNLGGVTQESFDLMIKENPSSQYWKEVAEKRRKAL (SEQ ID NO:19)
Cas9:接头:hCdt1
MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEE
VVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIRE
VKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSRADPKKKRKVRGGGGSGGGGSGGGGSPSPARPALRAPASATSGSRKRARPPAAPGRDQARPPARRRLRLSVDEVSSPSTPEAPDIPACPSPGQKIKKSTPAAGQPPHLTSAQDQDTI (SEQ ID NO:20)
Cas9:接头:hGem
MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEE VVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIRE
VKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSRADPKKKRKVRGGGGSGGGGSGGGGSMNPSMKQKQEEIKENIKNSSVPRRTLKMIQPSASGSLVGRENELSAGLSKRKHRNDHLTSTTSSPGVIVPESSENKNLGGVTQESFDLMIKENPSSQYWKEVAEKRRKAL (SEQ ID NO:21)
Cdt1:接头:Cas9
MPSPARPALRAPASATSGSRKRARPPAAPGRDQARPPARRRLRLSVDEVSSPSTPEAPDIPACPSPGQKIKKSTPAAGQPPHLTSAQDQDTIGGGGSGGGGSGGGGSDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSRADPKKKRKVR (SEQ ID NO:22)
Gem:接头:Cas9
MNPSMKQKQEEIKENIKNSSVPRRTLKMIQPSASGSLVGRENELSAGLSKRKHRNDHLTSTTSSPGVIVPESSENKNLGGVTQESFDLMIKENPSSQYWKEVAEKRRKALGGGGSGGGGSGGGGSDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQEL
DINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSRADPKKKRKVR (SEQ ID NO:23)
Cas9:Cdt1:
ATGGACAAGAAGTACTCCATTGGGCTCGATATCGGCACAAACAGCGTCGGCTGGGCCGTCATTACGGACGAGTACAAGGTGCCGAGCAAAAAATTCAAAGTTCTGGGCAATACCGATCGCCACAGCATAAAGAAGAACCTCATTGGCGCCCTCCTGTTCGACTCCGGGGAGACGGCCGAAGCCACGCGGCTCAAAAGAACAGCACGGCGCAGATATACCCGCAGAAAGAATCGGATCTGCTACCTGCAGGAGATCTTTAGTAATGAGATGGCTAAGGTGGATGACTCTTTCTTCCATAGGCTGGAGGAGTCCTTTTTGGTGGAGGAGGATAAAAAGCACGAGCGCCACCCAATCTTTGGCAATATCGTGGACGAGGTGGCGTACCATGAAAAGTACCCAACCATATATCATCTGAGGAAGAAGCTTGTAGACAGTACTGATAAGGCTGACTTGCGGTTGATCTATCTCGCGCTGGCGCATATGATCAAATTTCGGGGACACTTCCTCATCGAGGGGGACCTGAACCCAGACAACAGCGATGTCGACAAACTCTTTATCCAACTGGTTCAGACTTACAATCAGCTTTTCGAAGAGAACCCGATCAACGCATCCGGAGTTGACGCCAAAGCAATCCTGAGCGCTAGGCTGTCCAAATCCCGGCGGCTCGAAAACCTCATCGCACAGCTCCCTGGGGAGAAGAAGAACGGCCTGTTTGGTAATCTTATCGCCCTGTCACTCGGGCTGACCCCCAACTTTAAATCTAACTTCGACCTGGCCGAAGATGCCAAGCTTCAACTGAGCAAAGACACCTACGATGATGATCTCGACAATCTGCTGGCCCAGATCGGCGACCAGTACGCAGACCTTTTTTTGGCGGCAAAGAACCTGTCAGACGCCATTCTGC
TGAGTGATATTCTGCGAGTGAACACGGAGATCACCAAAGCTCCGCTGAGCGCTAGTATGATCAAGCGCTATGATGAGCACCACCAAGACTTGACTTTGCTGAAGGCCCTTGTCAGACAGCAACTGCCTGAGAAGTACAAGGAAATTTTCTTCGATCAGTCTAAAAATGGCTACGCCGGATACATTGACGGCGGAGCAAGCCAGGAGGAATTTTACAAATTTATTAAGCCCATCTTGGAAAAAATGGACGGCACCGAGGAGCTGCTGGTAAAGCTTAACAGAGAAGATCTGTTGCGCAAACAGCGCACTTTCGACAATGGAAGCATCCCCCACCAGATTCACCTGGGCGAACTGCACGCTATCCTCAGGCGGCAAGAGGATTTCTACCCCTTTTTGAAAGATAACAGGGAAAAGATTGAGAAAATCCTCACATTTCGGATACCCTACTATGTAGGCCCCCTCGCCCGGGGAAATTCCAGATTCGCGTGGATGACTCGCAAATCAGAAGAGACCATCACTCCCTGGAACTTCGAGGAAGTCGTGGATAAGGGGGCCTCTGCCCAGTCCTTCATCGAAAGGATGACTAACTTTGATAAAAATCTGCCTAACGAAAAGGTGCTTCCTAAACACTCTCTGCTGTACGAGTACTTCACAGTTTATAACGAGCTCACCAAGGTCAAATACGTCACAGAAGGGATGAGAAAGCCAGCATTCCTGTCTGGAGAGCAGAAGAAAGCTATCGTGGACCTCCTCTTCAAGACGAACCGGAAAGTTACCGTGAAACAGCTCAAAGAAGACTATTTCAAAAAGATTGAATGTTTCGACTCTGTTGAAATCAGCGGAGTGGAGGATCGCTTCAACGCATCCCTGGGAACGTATCACGATCTCCTGAAAATCATTAAA
GACAAGGACTTCCTGGACAATGAGGAGAACGAGGACATTCTTGAGGACATTGTCCTCACCCTTACGTTGTTTGAAGATAGGGAGATGATTGAAGAACGCTTGAAAACTTACGCTCATCTCTTCGACGACAAAGTCATGAAACAGCTCAAGAGGCGCCGATATACAGGATGGGGGCGGCTGTCAAGAAAACTGATCAATGGGATCCGAGACAAGCAGAGTGGAAAGACAATCCTGGATTTTCTTAAGTCCGATGGATTTGCCAACCGGAACTTCATGCAGTTGATCCATGATGACTCTCTCACCTTTAAGGAGGACATCCAGAAAGCACAAGTTTCTGGCCAGGGGGACAGTCTTCACGAGCACATCGCTAATCTTGCAGGTAGCCCAGCTATCAAAAAGGGAATACTGCAGACCGTTAAGGTCGTGGATGAACTCGTCAAAGTAATGGGA
AGGCATAAGCCCGAGAATATCGTTATCGAGATGGCCCGAGAGAACCAAACTACCCAGAAGGGACAGAAGAACAGTAGGGAAAGGATGAAGAGGATTGAAGAGGGTATAAAAGAACTGGGGTCCCAAATCCTTAAGGAACACCCAGTTGAAAACACCCAGCTTCAGAATGAGAAGCTCTACCTGTACTACCTGCAGAACGGCAGGGACATGTACGTGGATCAGGAACTGGACATCAATCGGCTCTCCGACTACGACGTGGATCATATCGTGCCCCAGTCTTTTCTCAAAGATGATTCTATTGATAATAAAGTGTTGACAAGATCCGATAAAAATAGAGGGAAGAGTGATAACGTCCCCTCAGAAGAAGTTGTCAAGAAAATGAAAAATTATTGGCGGCAGCTGCTGAACGCCAAACTGATCACACAACGGAAGTTCGATAATCTGACTAAGGCTGAACGAGGTGGCCTGTCTGAGTTGGATAAAGCCGGCTTCATCAAAAGGCAGCTTGTTGAGACACGCCAGATCACCAAGCACGTGGCCCAAATTCTCGATTCACGCATGAACACCAAGTACGATGAAAATGACAAACTGATTCGAGAGGTGAAAGTTATTACTCTGAAGTCTAAGCTGGTCTCAGATTTCAGAAAGGACTTTCAGTTTTATAAGGTGAGAGAGATCAACAATTACCACCATGCGCATGATGCCTACCTGAATGCAGTGGTAGGCACTGCACTTATCAAAAAATATCCCAAGCTTGAATCTGAATTTGTTTACGGAGACTATAAAGTGTACGATGTTAGGAAAATGATCGCAAAGTCTGAGCAGGAAATAGGCAAGGCCACCGCTAAGTACTTCTTTTACAGCAATATTATGAATTTTTTCAAGACCGAGATTACACTGGCCAATGGAGAGATTCGGAAGCGACCACTTATCGAAACAAACGGAGAAACAGGAGAAATCGTGTGGGACAAGGGTAGGGATTTCGCGACAGTCCGGAAGGTCCTGTCCATGCCGCAGGTGAACATCGTTAAAAAGACCGAAGTACAGACCGGAGGCTTCTCCAAGGAAAGTATCCTCCCGAAAAGGAACAGCGACAAGCTGATCGCACGCAAAAAAGATTGGGACCCCAAGAAATACGGCGGATTCGATTCTCCTACAGTCGCTTACAGTGTACTGGTTGTGGCCAAAGTGGAGAAAGGGAAGTCTAAAAAACTCAAAAGCGTCAAGGAACTGCTGGGCATCACAATCATGGAGCGATCAAGCTTCGAAAAAAACCCCATCGACTTTCTCGAGG
CGAAAGGATATAAAGAGGTCAAAAAAGACCTCATCATTAAGCTTCCCAAGTACTCTCTCTTTGAGCTTGAAAACGGCCGGAAACGAATGCTCGCTAGTGCGGGCGAGCTGCAGAAAGGTAACGAGCTGGCACTGCCCTCTAAATACGTTAATTTCTTGTATCTGGCCAGCCACTATGAAAAGCTCAAAGGGTCTCCCGAAGATAATGAGCAGAAGCAGCTGTTCGTGGAACAACACAAACACTACCTTGATGAGATCATCGAGCAAATAAGCGAATTCTCCAAAAGAGTGATCCTCGCCGACGCTAACCTCGATAAGGTGCTTTCTGCTTACAATAAGCACAGGGATAAGCCCATCAGGGAGCAGGCAGAAAACATTATCCACTTGTTTACTCTGACCAACTTGGGCGCGCCTGCAGCCTTCAAGTACTTCGACACCACCATAGACAGAA
AGCGGTACACCTCTACAAAGGAGGTCCTGGACGCCACACTGATTCATCAGTCAATTACGGGGCTCTATGAAACAAGAATCGACCTCTCTCAGCTCGGTGGAGACAGCAGGGCTGACCCCAAGAAGAAGAGGAAGGTGAGGGGAGGCGGAGGATCTGGCGGAGGCGGAAGTGGCGGAGGGGGCAGCCCATCTCCTGCCAGACCTGCTCTGAGAGCCCCTGCCTCTGCCACAAGCGGCAGCAGAAAGAGAGCCAGACCTCCTGCCGCCCCTGGCAGAGATCAGGCTAGACCTCCAGCTCGGCGGAGACTGAGACTGAGCGTGGACGAGGTGTCCAGCCCTAGCACACCTGAGGCCCCTGATATCCCCGCCTGTCCTAGCCCTGGCCAGAAGATCAAGAAGTCCACCCCTGCCGCCGGACAGCCTCCTCATCTGACATCTGCCCAGGACCAGGACACCATC (SEQ ID NO:24)
Cas9:Gem:
ATGGACAAGAAGTACTCCATTGGGCTCGATATCGGCACAAACAGCGTCGGCTGGGCCGTCATTACGGACGAGTACAAGGTGCCGAGCAAAAAATTCAAAGTTCTGGGCAATACCGATCGCCACAGCATAAAGAAGAACCTCATTGGCGCCCTCCTGTTCGACTCCGGGGAGACGGCCGAAGCCACGCGGCTCAAAAGAACAGCACGGCGCAGATATACCCGCAGAAAGAATCGGATCTGCTACCTGCAGGAGATCTTTAGTAATGAGATGGCTAAGGTGGATGACTCTTTCTTCCATAGGCTGGAGGAGTCCTTTTTGGTGGAGGAGGATAAAAAGCACGAGCGCCACCCAATCTTTGGCAATATCGTGGACGAGGTGGCGTACCATGAAAAGTACCCAACCATATATCATCTGAGGAAGAAGCTTGTAGACAGTACTGATAAGGCTGACTTGCGGTTGATCTATCTCGCGCTGGCGCATATGATCAAATTTCGGGGACACTTCCTCATCGAGGGGGACCTGAACCCAGACAACAGCGATGTCGACAAACTCTTTATCCAACTGGTTCAGACTTACAATCAGCTTTTCGAAGAGAACCCGATCAACGCATCCGGAGTTGACGCCAAAGCAATCCTGAGCGCTAGGCTGTCCAAATCCCGGCGGCTCGAAAACCTCATCGCACAGCTCCCTGGGGAGAAGAAGAACGGCCTGTTTGGTAATCTTATCGCCCTGTCACTCGGGCTGACCCCCAACTTTAAATCTAACTTCGACCTGGCCGAAGATGCCAAGCTTCAACTGAGCAAAGACACCTACGATGATGATCTCGACAATCTGCTGGCCCAGATCGGCGACCAGTACGCAGACCTTTTTTTGGCGGCAAAGAACCTGTCAGACGCCATTCTGC
TGAGTGATATTCTGCGAGTGAACACGGAGATCACCAAAGCTCCGCTGAGCGCTAGTATGATCAAGCGCTATGATGAGCACCACCAAGACTTGACTTTGCTGAAGGCCCTTGTCAGACAGCAACTGCCTGAGAAGTACAAGGAAATTTTCTTCGATCAGTCTAAAAATGGCTACGCCGGATACATTGACGGCGGAGCAAGCCAGGAGGAATTTTACAAATTTATTAAGCCCATCTTGGAAAAAATGGACGGCACCGAGGAGCTGCTGGTAAAGCTTAACAGAGAAGATCTGTTGCGCAAACAGCGCACTTTCGACAATGGAAGCATCCCCCACCAGATTCACCTGGGCGAACTGCACGCTATCCTCAGGCGGCAAGAGGATTTCTACCCCTTTTTGAAAGATAACAGGGAAAAGATTGAGAAAATCCTCACATTTCGGATACCCTACTATG
TAGGCCCCCTCGCCCGGGGAAATTCCAGATTCGCGTGGATGACTCGCAAATCAGAAGAGACCATCACTCCCTGGAACTTCGAGGAAGTCGTGGATAAGGGGGCCTCTGCCCAGTCCTTCATCGAAAGGATGACTAACTTTGATAAAAATCTGCCTAACGAAAAGGTGCTTCCTAAACACTCTCTGCTGTACGAGTACTTCACAGTTTATAACGAGCTCACCAAGGTCAAATACGTCACAGAAGGGATGAGAAAGCCAGCATTCCTGTCTGGAGAGCAGAAGAAAGCTATCGTGGACCTCCTCTTCAAGACGAACCGGAAAGTTACCGTGAAACAGCTCAAAGAAGACTATTTCAAAAAGATTGAATGTTTCGACTCTGTTGAAATCAGCGGAGTGGAGGATCGCTTCAACGCATCCCTGGGAACGTATCACGATCTCCTGAAAATCATTAAA
GACAAGGACTTCCTGGACAATGAGGAGAACGAGGACATTCTTGAGGACATTGTCCTCACCCTTACGTTGTTTGAAGATAGGGAGATGATTGAAGAACGCTTGAAAACTTACGCTCATCTCTTCGACGACAAAGTCATGAAACAGCTCAAGAGGCGCCGATATACAGGATGGGGGCGGCTGTCAAGAAAACTGATCAATGGGATCCGAGACAAGCAGAGTGGAAAGACAATCCTGGATTTTCTTAAGTCCGATGGATTTGCCAACCGGAACTTCATGCAGTTGATCCATGATGACTCTCTCACCTTTAAGGAGGACATCCAGAAAGCACAAGTTTCTGGCCAGGGGGACAGTCTTCACGAGCACATCGCTAATCTTGCAGGTAGCCCAGCTATCAAAAAGGGAATACTGCAGACCGTTAAGGTCGTGGATGAACTCGTCAAAGTAATGGGA
AGGCATAAGCCCGAGAATATCGTTATCGAGATGGCCCGAGAGAACCAAACTACCCAGAAGGGACAGAAGAACAGTAGGGAAAGGATGAAGAGGATTGAAGAGGGTATAAAAGAACTGGGGTCCCAAATCCTTAAGGAACACCCAGTTGAAAACACCCAGCTTCAGAATGAGAAGCTCTACCTGTACTACCTGCAGAACGGCAGGGACATGTACGTGGATCAGGAACTGGACATCAATCGGCTCTCCGACTACGACGTGGATCATATCGTGCCCCAGTCTTTTCTCAAAGATGATTCTATTGATAATAAAGTGTTGACAAGATCCGATAAAAATAGAGGGAAGAGTGATAACGTCCCCTCAGAAGAAGTTGTCAAGAAAATGAAAAATTATTGGCGGCAGCTGCTGAACGCCAAACTGATCACACAACGGAAGTTCGATAATCTGACTAAGGCTGAACGAGGTGGCCTGTCTGAGTTGGATAAAGCCGGCTTCATCAAAAGGCAGCTTGTTGAGACACGCCAGATCACCAAGCACGTGGCCCAAATTCTCGATTCACGCATGAACACCAAGTACGATGAAAATGACAAACTGATTCGAGAGGTGAAAGTTATTACTCTGAAGTCTAAGCTGGTCTCAGATTTCAGAAAGGACTTTCAGTTTTATAAGGTGAGAGAGATCAACAATTACCACCATGCGCATGATGCCTACCTGAATGCAGTGGTAGGCACTGCACTTATCAAAAAATATCCCAAGCTTGAATCTGAATTTGTTTACGGAGACTATAAAGTGTACGATGTTAGGAAAATGATCGCAAAGTCTGAGCAGGAAATAGGCAAGGCCACCGCTAAGTACTTCTTTTACAGCAATATTATGAATTTTTTCAAGACCGAGATTACACTGGCCAATGGAGAGATTCGGAAGCGACCACTTATCGAAACAAACGGAGAAACAGGAGAAATCGTGTGGGACAAGGGTAGGGATTTCGCGACAGTCCGGAAGGTCCTGTCCATGCCGCAGGTGAACATCGTTAAAAAGACCGAAGTACAGACCGGAGGCTTCTCCAAGGAAAGTATCCTCCCGAAAAGGAACAGCGACAAGCTGATCGCACGCAAAAAAGATTGGGACCCCAAGAAATACGGCGGATTCGATTCTCCTACAGTCGCTTACAGTGTACTGGTTGTGGCCAAAGTGGAGAAAGGGAAGTCTAAAAAACTCAAAAGCGTCAAGGAACTGCTGGGCATCACAATCATGGAGCGATCAAGCTTCGAAAAAAACCCCATCGACTTTCTCGAGG
CGAAAGGATATAAAGAGGTCAAAAAAGACCTCATCATTAAGCTTCCCAAGTACTCTCTCTTTGAGCTTGAAAACGGCCGGAAACGAATGCTCGCTAGTGCGGGCGAGCTGCAGAAAGGTAACGAGCTGGCACTGCCCTCTAAATACGTTAATTTCTTGTATCTGGCCAGCCACTATGAAAAGCTCAAAGGGTCTCCCGAAGATAATGAGCAGAAGCAGCTGTTCGTGGAACAACACAAACACTACCTTGATGAGATCATCGAGCAAATAAGCGAATTCTCCAAAAGAGTGATCCTCGCCGACGCTAACCTCGATAAGGTGCTTTCTGCTTACAATAAGCACAGGGATAAGCCCATCAGGGAGCAGGCAGAAAACATTATCCACTTGTTTACTCTGACCAACTTGGGCGCGCCTGCAGCCTTCAAGTACTTCGACACCACCATAGACAGAA
AGCGGTACACCTCTACAAAGGAGGTCCTGGACGCCACACTGATTCATCAGTCAATTACGGGGCTCTATGAAACAAGAATCGACCTCTCTCAGCTCGGTGGAGACAGCAGGGCTGACCCCAAGAAGAAGAGGAAGGTGAGGGGAGGCGGAGGATCTGGCGGAGGCGGAAGTGGCGGAGGGGGCAGCATGAACCCTAGCATGAAGCAGAAGCAGGAAGAGATCAAAGAGAACATCAAGAACAGCAGCGTGCCCAGACGGACCCTGAAGATGATCCAGCCTAGCGCCAGCGGCAGCCTCGTGGGCAGAGAGAATGAACTGTCTGCCGGCCTGAGCAAGCGGAAGCACAGAAACGACCACCTGACCAGCACCACCAGCAGCCCTGGCGTGATCGTGCCTGAGAGCAGCGAGAACAAGAACCTGGGCGGCGTGACCCAGGAATCCTTCGACCTGATGATCAAAGAAAACCCCAGCAGCCAGTATTGGAAAGAGGTGGCCGAGAAGCGGCGGAAGGCCCTG (SEQ ID NO:25)
Cdt1:接头:Cas9
ATGCCATCTCCTGCCAGACCTGCTCTGAGAGCCCCTGCCTCTGCCACAAGCGGCAGCAGAAAGAGAGCCAGACCTCCTGCCGCCCCTGGCAGAGATCAGGCTAGACCTCCAGCTCGGCGGAGACTGAGACTGAGCGTGGACGAGGTGTCCAGCCCTAGCACACCTGAGGCCCCTGATATCCCCGCCTGTCCTAGCCCTGGCCAGAAGATCAAGAAGTCCACCCCTGCCGCCGGACAGCCTCCTCATCTGACATCTGCCCAGGACCAGGACACCATCGGAGGCGGAGGATCTGGCGGAGGCGGAAGTGGCGGAGGGGGCAGCGACAAGAAGTACTCCATTGGGCTCGATATCGGCACAAACAGCGTCGGCTGGGCCGTCATTACGGACGAGTACAAGGTGCCGAGCAAAAAATTCAAAGTTCTGGGCAATACCGATCGCCACAGCATAAA GAAGAACCTCATTGGCGCCCTCCTGTTCGACTCCGGGGAGACGGCCGAAGCCACGCGGCTCAAAAGAACAGCACGGCGCAGATATACCCGCAGAAAGAATCGGATCTGCTACCTGCAGGAGATCTTTAGTAATGAGATGGCTAAGGTGGATGACTCTTTCTTCCATAGGCTGGAGGAGTCCTTTTTGGTGGAGGAGGATAAAAAGCACGAGCGCCACCCAATCTTTGGCAATATCGTGGACGAGGTGGCGTACCATGAAAAGTACCCAACCATATATCATCTGAGGAAGAAGCTTGTAGACAGTACTGATAAGGCTGACTTGCGGTTGATCTATCTCGCGCTGGCGCATATGATCAAATTTCGGGGACACTTCCTCATCGAGGGGGACCTGAACCCAGACAACAGCGATGTCGACAAACTCTTTATCCAACTGGTTCAGACTTACAATCAGCTTTTCGAAGAGAACCCGATCAACGCATCCGGAGTTGACGCCAAAGCAATCCTGAGCGCTAGGCTGTCCAAATCCCGGCGGCTCGAAAACCTCATCGCACAGCTCCCTGGGGAGAAGAAGAACGGCCTGTTTGGTAATCTTATCGCCCTGTCACTCGGGCTGACCCCCAACTTTAAATCTAACTTCGACCTGGCCGAAGATGCCAAGCTTCAACTGAGCAAAGACACCTACGATGATGATCTCGACAATCTGCTGGCCCAGATCGGCGACCAGTACGCAGACCTTTTTTTGGCGGCAAAGAACCTGTCAGACGCCATTCTGCTGAGTGATATTCTGCGAGTGAACACGGAGATCACCAAAGCTCCGCTGAGCGCTAGTATGATCAAGCGCTATGATGAGCACCACCAAGACTTGACTTTGCTGAAGGCCCTTGTCAGACAGCAACTGCCTGAGAAGTACAAGGAAATTTTCTTCGATCAGTCTAAAAATGGCTACGCCGGATACATTGACGGCGGAGCAAGCCAGGAGGAATTTTACAAATTTATTAAGCCCATCTTGGAAAAAATGGACGGCACCGAGGAGCTGCTGGTAAAGCTTAACAGAGAAGATCTGTTGCGCAAACAGCGCACTTTCGACAATGGAAGCATCCCCCACCAGATTCACCTGGGCGAACTGCACGCTATCCTCAGGCGGCAAGAGGATTTCTACCCCTTTTTGAAAGATAACAGGGAAAAGATTGAGAAAATCCTCACATTTCGGATACCCTACTATGTAGGCCCCCTCGCCCGGGGAAATTCCAGATTCGCGTGGATGACTCGCAAATCAGAAGAGACCATCACTCCCTGGAACTTCGAGGAAGTCGTGGATAAGGGGGCCTCTGCCCAGTCCTTCATCGAAAGGATGACTAACTTTGATAAAAATCTGCCTAACGAAAAGGTGCTTCCTAAACACTCTCTGCTGTACGAGTACTTCACAGTTTATAACGAGCTCACCAAGGTCAAATACGTCACAGAAGGGATGAGAAAGCCAGCATTCCTGTCTGGAGAGCAGAAGAAAGCTATCGTGGACCTCCTCTTCAAGACGAACCGGAAAGTTACCGTGAAACAGCTCAAAGAAGACTATTTCAAAAAGATTGAATGTTTCGACTCTGTTGAAATCAGCGGAGTGGAGGATCGCTTCAACGCATCCCTGGGAACGTATCACGATCTCCTGAAAATCATTAAAGACAAGGACTTCCTGGACAATGAGGAGAACGAGGACATTCTTGAGGACATTGTCCTCACCCTTACGTTGTTTGAAGATAGGGAGATGATTGAAGAACGCTTGAAAACTTACGCTCATCTCTTCGACGACAAAGTCATGAAACAGCTCAAGAGGCGCCGATATACAGGATGGGGGCGGCTGTCAAGAAAACTGATCAATGGGATCCGAGACAAGCAGAGTGGAAAGACAATCCTGGATTTTCTTAAGTCCGATGGATTTGCCAACCGGAACTTCATGCAGTTGATCCATGATGACTCTCTCACCTTTAAGGAGGACATCCAGAAAGCACAAGTTTCTGGCCAGGGGGACAGTCTTCACGAGCACATCGCTAATCTTGCAGGTAGCCCAGCTATCAAAAAGGGAATACTGCAGACCGTTAAGGTCGTGGATGAACTCGTCAAAGTAATGGGAAGGCATAAGCCCGAGAATATCGTTATCGAGATGGCCCGAGAGAACCAAACTACCCAGAAGGGACAGAAGAACAGTAGGGAAAGGATGAAGAGGATTGAAGAGGGTATAAAAGAACTGGGGTCCCAAATCCTTAAGGAACACCCAGTTGAAAACACCCAGCTTCAGAATGAGAAGCTCTACCTGTACTACCTGCAGAACGGCAGGGACATGTACGTGGATCAGGAACTGGACATCAATCGGCTCTCCGACTACGACGTGGATCATATCGTGCCCCAGTCTTTTCTCAAAGATGATTCTATTGATAATAAAGTGTTGACAAGATCCGATAAAAATAGAGGGAAGAGTGATAACGTCCCCTCAGAAGAAGTTGTCAAGAAAATGAAAAATTATTGGCGGCAGCTGCTGAACGCCAAACTGATCACACAACGGAAGTTCGATAATCTGACTAAGGCTGAACGAGGTGGCCTGTCTGAGTTGGATAAAGCCGGCTTCATCAAAAGGCAGCTTGTTGAGACACGCCAGATCACCAAGCACGTGGCCCAAATTCTCGATTCACGCATGAACACCAAGTACGATGAAAATGACAAACTGATTCGAGAGGTGAAAGTTATTACTCTGAAGTCTAAGCTGGTCTCAGATTTCAGAAAGGACTTTCAGTTTTATAAGGTGAGAGAGATCAACAATTACCACCATGCGCATGATGCCTACCTGAATGCAGTGGTAGGCACTGCACTTATCAAAAAATATCCCAAGCTTGAATCTGAATTTGTTTACGGAGACTATAAAGTGTACGATGTTAGGAAAATGATCGCAAAGTCTGAGCAGGAAATAGGCAAGGCCACCGCTAAGTACTTCTTTTACAGCAATATTATGAATTTTTTCAAGACCGAGATTACACTGGCCAATGGAGAGATTCGGAAGCGACCACTTATCGAAACAAACGGAGAAACAGGAGAAATCGTGTGGGACAAGGGTAG
GGATTTCGCGACAGTCCGGAAGGTCCTGTCCATGCCGCAGGTGAACATCGTTAAAAAGACCGAAGTACAGACCGGAGGCTTCTCCAAGGAAAGTATCCTCCCGAAAAGGAACAGCGACAAGCTGATCGCACGCAAAAAAGATTGGGACCCCAAGAAATACGGCGGATTCGATTCTCCTACAGTCGCTTACAGTGTACTGGTTGTGGCCAAAGTGGAGAAAGGGAAGTCTAAAAAACTCAAAAGCGTCAAGGAACTGCTGGGCATCACAATCATGGAGCGATCAAGCTTCGAAAAAAACCCCATCGACTTTCTCGAGGCGAAAGGATATAAAGAGGTCAAAAAAGACCTCATCATTAAGCTTCCCAAGTACTCTCTCTTTGAGCTTGAAAACGGCCGGAAACGAATGCTCGCTAGTGCGGGCGAGCTGCAGAAAGGTAACGAGCTGGCACTGCCCTCTAAATACGTTAATTTCTTGTATCTGGCCAGCCACTATGAAAAGCTCAAAGGGTCTCCCGAAGATAATGAGCAGAAGCAGCTGTTCGTGGAACAACACAAACACTACCTTGATGAGATCATCGAGCAAATAAGCGAATTCTCCAAAAGAGTGATCCTCGCCGACGCTAACCTCGATAAGGTGCTTTCTGCTTACAATAAGCACAGGGATAAGCCCATCAGGGAGCAGGCAGAAAACATTATCCACTTGTTTACTCTGACCAACTTGGGCGCGCCTGCAGCCTTCAAGTACTTCGACACCACCATAGACAGAAAGCGGTACACCTCTACAAAGGAGGTCCTGGACGCCACACTGATTCATCAGTCAATTACGGGGCTCTATGAAACAAGAATCGACCTCTCTCAGCTCGGTGGAGACAGCAGGGCTGACCCCAAGAAGAAGAGGAAGGTGAGG(SEQ ID NO:26)
Gem:接头:Cas9
ATGAACCCTAGCATGAAGCAGAAGCAGGAAGAGATCAAAGAGAACATCAAGAACAGCAGCGTGCCCAGACGGACCCTGAAGATGATCCAGCCTAGCGCCAGCGGCAGCCTCGTGGGCAGAGAGAATGAACTGTCTGCCGGCCTGAGCAAGCGGAAGCACAGAAACGACCACCTGACCAGCACCACCAGCAGCCCTGGCGTGATCGTGCCTGAGAGCAGCGAGAACAAGAACCTGGGCGGCGTGACCCAGGAATCCTTCGACCTGATGATCAAAGAAAACCCCAGCAGCCAGTATTGGAAAGAGGTGGCCGAGAAGCGGCGGAAGGCCCTGGGAGGCGGAGGATCTGGCGGAGGCGGAAGTGGCGGAGGGGGCAGCGACAAGAAGTACTCCATTGGGCTCGATATCGGCACAAACAGCGTCGGCTGGGCCGTCATTACGGACGAG
TACAAGGTGCCGAGCAAAAAATTCAAAGTTCTGGGCAATACCGATCGCCACAGCATAAAGAAGAACCTCATTGGCGCCCTCCTGTTCGACTCCGGGGAGACGGCCGAAGCCACGCGGCTCAAAAGAACAGCACGGCGCAGATATACCCGCAGAAAGAATCGGATCTGCTACCTGCAGGAGATCTTTAGTAATGAGATGGCTAAGGTGGATGACTCTTTCTTCCATAGGCTGGAGGAGTCCTTTTTGGTGGAGGAGGATAAAAAGCACGAGCGCCACCCAATCTTTGGCAATATCGTGGACGAGGTGGCGTACCATGAAAAGTACCCAACCATATATCATCTGAGGAAGAAGCTTGTAGACAGTACTGATAAGGCTGACTTGCGGTTGATCTATCTCGCGCTGGCGCATATGATCAAATTTCGGGGACACTTCCTCATCGAGGGGGACCTGAACCCAGACAACAGCGATGTCGACAAACTCTTTATCCAACTGGTTCAGACTTACAATCAGCTTTTCGAAGAGAACCCGATCAACGCATCCGGAGTTGACGCCAAAGCAATCCTGAGCGCTAGGCTGTCCAAATCCCGGCGGCTCGAAAACCTCATCGCACAGCTCCCTGGGGAGAAGAAGAACGGCCTGTTTGGTAATCTTATCGCCCTGTCACTCGGGCTGACCCCCAACTTTAAATCTAACTTCGACCTGGCCGAAGATGCCAAGCTTCAACTGAGCAAAGACACCTACGATGATGATCTCGACAATCTGCTGGCCCAGATCGGCGACCAGTACGCAGACCTTTTTTTGGCGGCAAAGAACCTGTCAGACGCCATTCTGCTGAGTGATATTCTGCGAGTGAACACGGAGATCACCAAAGCTCCGCTGAGCGCTAGTATGATCAAGCGCTATGATGAGCACCACCAAGACTTGACTTTGCTGAAGGCCCTTGTCAGACAGCAACTGCCTGAGAAGTACAAGGAAATTTTCTTCGATCAGTCTAAAAATGGCTACGCCGGATACATTGACGGCGGAGCAAGCCAGGAGGAATTTTACAAATTTATTAAGCCCATCTTGGAAAAAATGGACGGCACCGAGGAGCTGCTGGTAAAGCTTAACAGAGAAGATCTGTTGCGCAAACAGCGCACTTTCGACAATGGAAGCATCCCCCACCAGATTCACCTGGGCGAACTGCACGCTATCCTCAGGCGGCAAGAGGATTTCTACCCCTTTTTGAAAGATAACAGGGAAAAGATTGAGAAAATCCTCACATTTCGGATACCCTACTATGTAGGCCCCCTCGCCCGGGGAAATTCCAGATTCGCGTGGATGACTCGCAAATCAGAAGAGACCATCACTCCCTGGAACTTCGAGGAAGTCGTGGATAAGGGGGCCTCTGCCCAGTCCTTCATCGAAAGGATGACTAACTTTGATAAAAATCTGCCTAACGAAAAGGTGCTTCCTAAACACTCTCTGCTGTACGAGTACTTCACAGTTTATAACGAGCTCACCAAGGTCAAATACGTCACAGAAGGGATGAGAAAGCCAGCATTCCTGTCTGGAGAGCAGAAGAAAGCTATCGTGGACCTCCTCTTCAAGACGAACCGGAAAGTTACCGTGAAACAGCTCAAAGAAGACTATTTCAAAAAGATTGAATGTTTCGACTCTGTTGAAATCAGCGGAGTGGAGGATCGCTTCAACGCATCCCTGGGAACGTATCACGATCTCCTGAAAATCATTAAAGACAAGGACTTCCTGGACAATGAGGAGAACGAGGACATTCTTGAGGACATTGTCCTCACCCTTACGTTGTTTGAAGATAGGGAGATGATTGAAGAACGCTTGAAAACTTACGCTCATCTCTTCGACGACAAAGTCATGAAACAGCTCAAGAGGCGCCGATATACAGGATGGGGGCGGCTGTCAAGAAAACTGATCAATGGGATCCGAGACAAGCAGAGTGGAAAGACAATCCTGGATTTTCTTAAGTCCGATGGATTTGCCAACCGGAACTTCATGCAGTTGATCCATGATGACTCTCTCACCTTTAAGGAGGACATCCAGAAAGCACAAGTTTCTGGCCAGGGGGACAGTCTTCACGAGCACATCGCTAATCTTGCAGGTAGCCCAGCTATCAAAAAGGGAATACTGCAGACCGTTAAGGTCGTGGATGAACTCGTCAAAGTAATGGGAAGGCATAAGCCCGAGAATATCGTTATCGAGATGGCCCGAGAGAACCAAACTACCCAGAAGGGACAGAAGAACAGTAGGGAAAGGATGAAGAGGATTGAAGAGGGTATAAAAGAACTGGGGTCCCAAATCCTTAAGGAACACCCAGTTGAAAACACCCAGCTTCAGAATGAGAAGCTCTACCTGTACTACCTGCAGAACGGCAGGGACATGTACGTGGATCAGGAACTGGACATCAATCGGCTCTCCGACTACGACGTGGATCATATCGTGCCCCAGTCTTTTCTCAAAGATGATTCTATTGATAATAAAGTGTTGACAAGATCCGATAAAAATAGAGGGAAGAGTGATAACGTCCCCTCAGAAGAAGTTGTCAAGAAAATGAAAAATTATTGGCGGCAGCTGCTGAACGCCAAACTGATCACACAACGGAAGTTCGATAATCTGACTAAGGCTGAACGAGGTGGCCTGTCTGAGTTGGATAAAGCCGGCTTCATCAAAAGGCAGCTTGTTGAGACACGCCAGATCACCAAGCACGTGGCCCAAATTCTCGATTCACGCATGAACACCAAGTACGATGAAAATGACAAACTGATTCGAGAGGTGAAAGTTATTACTCTGAAGTCTAAGCTGGTCTCAGATTTCAGAAAGGACTTTCAGTTTTATAAGGTGAGAGAGATCAACAATTACCACCATGCGCATGATGCCTACCTGAATGCAGTGGTAGGCACTGCACTTATCAAAAAATATCCCAAGCTTGAATCTGAATTTGTTTACGGAGACTATAAAGTGTACGATGTTAGGAAAATGATCGCAAAGTCTGAGCAGGAAATAGGCAAGGCCACCGCTAAGTACTTCTTTTACAGCAATATTATGAATTTTTTCAAGACCGAGATTACACTGGCCAATGGAGAGATTCGGA
AGCGACCACTTATCGAAACAAACGGAGAAACAGGAGAAATCGTGTGGGACAAGGGTAGGGATTTCGCGACAGTCCGGAAGGTCCTGTCCATGCCGCAGGTGAACATCGTTAAAAAGACCGAAGTACAGACCGGAGGCTTCTCCAAGGAAAGTATCCTCCCGAAAAGGAACAGCGACAAGCTGATCGCACGCAAAAAAGATTGGGACCCCAAGAAATACGGCGGATTCGATTCTCCTACAGTCGCTTACAGTGTACTGGTTGTGGCCAAAGTGGAGAAAGGGAAGTCTAAAAAACTCAAAAGCGTCAAGGAACTGCTGGGCATCACAATCATGGAGCGATCAAGCTTCGAAAAAAACCCCATCGACTTTCTCGAGGCGAAAGGATATAAAGAGGTCAAAAAAGACCTCATCATTAAGCTTCCCAAGTACTCTCTCTTTGAGCTTGAAAACGGCCGGAAACGAATGCTCGCTAGTGCGGGCGAGCTGCAGAAAGGTAACGAGCTGGCACTGCCCTCTAAATACGTTAATTTCTTGTATCTGGCCAGCCACTATGAAAAGCTCAAAGGGTCTCCCGAAGATAATGAGCAGAAGCAGCTGTTCGTGGAACAACACAAACACTACCTTGATGAGATCATCGAGCAAATAAGCGAATTCTCCAAAAGAGTGATCCTCGCCGACGCTAACCTCGATAAGGTGCTTTCTGCTTACAATAAGCACAGGGATAAGCCCATCAGGGAGCAGGCAGAAAACATTATCCACTTGTTTACTCTGACCAACTTGGGCGCGCCTGCAGCCTTCAAGTACTTCGACACCACCATAGACAGAAAGCGGTACACCTCTACAAAGGAGGTCCTGGACGCCACACTGATTCATCAGTCAATTACGGGGCTCTATGAAACAAGAATCGACCTCTCTCAGCTCGGTGGAGACAGCAGGGCTGACCCCAAGAAGAAGAGGAAGGTGAGG (SEQ ID NO:27)
实施例4
通过工程化部分靶位点自动调节RNA指导的核酸酶
降低RNA指导的核酸酶活性可有利于降低脱靶效应的可能性。在临床环境中,这对于病毒递送方法(例如AAV)是非常重要的,所述病毒递送方法特征在于延长或终生表达。
这里,描述了用于表达Cas9(一种RNA指导的核酸酶)的自我调节系统,所述Cas9依赖于使用在Cas9/gRNA表达系统自身内编码的不完美靶位点。许多研究已显示Cas9结合(无切割)有效调节基因表达。大多数研究使用核酸酶死亡形式的Cas9来防止切割活性,然而,会非常需要允许切割和自我调节二者的系统。
通过使用对应于部分靶位点的工程序列,可以分离Cas9的切割和结合活性;部分序列互补性允许Cas9在没有DNA切割的情况下结合。使用这种结合倾向,Cas9可以被引导回调节其自身的表达。对于SpCas9,通常低于17nt互补性的位点不会导致切割,甚至单个错配也可导致高保真或高特异性Cas9突变体不切割。
重要的是,所有这些调节都以最小的序列变化发生,且没有额外的结合因子、融合物或其他蛋白质,这保持表达盒大小足够小以通过AAV递送。
方法
质粒构建:GFP报道质粒通过略有修改的Gibson Assembly (New England Biolabs,Ipswich, MA) (Gibson等人(2009) Nature Methods 6:343-345)构建。
将人胚肾(HEK)细胞系293T(Life Technologies,Grand Island,NY)在用10%胎牛血清(热失活的)(Gibco, Life Technologies, Grand Island, NY)和2mM GlutaMAX(Invitrogen)补充的Dulbecco改良Eagle培养基(DMEM)(Invitrogen)中在37℃和5% CO2/20% O2下维持。
将N2A细胞系(Life Technologies,Grand Island,NY)在用10%胎牛血清(Gibco,Life Technologies, Grand Island, NY)和2mM GlutaMAX (Invitrogen)补充的Dulbecco改良Eagle培养基(DMEM)(Invitrogen)中在37℃和5% CO2/20% O2下维持。
用每种构建体转染(Lipofectamine 3000)细胞。使用流式细胞术分析GFP表达。
mm079靶序列:GAAGAAGGTTCGAGATCTCA (SEQ ID NO:28)
mm079基因组靶位点:GAAGAAGGTTCGAGATCTCAAGG (SEQ ID NO:29)
Auto1位点:GTTCGAGATCTCAGGGAAT (SEQ ID NO:30)
·:GTTCGAGATCTCAGGGTTT (SEQ ID NO:31)
H1_wt:GGAATTCGAACGCTGACGTCATCAACCCGCTCCAAGGAATCGCGGGCCCAGTGTCACTAGGCGGGAACACCCAGCGCGCGTGCGCCCTGGCAGGAAGATGGCTGTGAGGGACAGGGGAGTGGCGCCCTGCAATATTTGCATGTCGCTATGTGTTCTGGGAAATCACCATAAACGTGAAATGTCTTTGGATTTGGGAATCTTATAAGTTCTGTATGAGACCA CTTTTTCCC (SEQ ID NO:32)
H1_Auto1:GGAATTCGAACGCTGACGTCATCAACCCGCTCCAAGGAATCGCGGGCCCAGTGTCACTAGGCGGGAACACCCAGCGCGCGTGCGCCCTGGCAGGAAGATGGCTGTGAGGGACAGGGGAGTGGCGCCCTGCAATATTTGCATGTCGCTATGTGTTCTGGGAAATCACCATAAACGTGAAAGTTCGAGATCTCAGGGAATCTTATAAGTTCTGTATGAGACC ACTTTTTCCC (SEQ ID NO:33)
H1_Auto2:GGAATTCGAACGCTGACGTCATCAACCCGCTCCAAGGAATCGCGGGCCCAGTGTCACTAGGCGGGAACACCCAGCGCGCGTGCGCCCTGGCAGGAAGATGGCTGTGAGGGACAGGGGAGTGGCGCCCTGCAATATTTGCATGTCGCTATGTGTTCTGGGAAATCACCATAAACGTGAAATGTCTTTGGATTTGGGAATCTTATAAGTGTTCGAGATCTCAG GGTTTTCCC (SEQ ID NO:34)
实施例5
甲硫氨酸(Met)后接甘氨酸(Gly)、脯氨酸(Pro)、丝氨酸(Ser)、苏氨酸(Thr)、丙氨酸(Ala)、缬氨酸(Val)或半胱氨酸(Cys)通过甲硫氨酸氨肽酶加工,所述甲硫氨酸氨肽酶切除N-末端met(图1A)。然后,位置2氨基酸的身份使整个蛋白质稳定或不稳定。因此,通过改变第二氨基酸的身份,可以通过Met-氨肽酶改变一些蛋白质的半衰期。
虽然在不同生物体中不同,且蛋白质之间可变,但N末端规则用作细胞内蛋白质半衰期的估计(图17B)。蛋白质水平通过遍在蛋白(Ub)蛋白水解系统调节。遍在蛋白是通常与蛋白质降解有关的76个氨基酸的高度保守蛋白;Ub分子与靶蛋白缀合,标记那些蛋白质以被蛋白酶体破坏。
线性聚遍在蛋白在细胞中被脱遍在蛋白酶识别,所述脱遍在蛋白酶切割单个Ub肽。通过将Ub融合至任何蛋白质的N-末端,可以指派该过程以产生特异性N-末端残基(图18)。一旦进入细胞,脱遍在蛋白酶识别并切割Ub部分,释放融合蛋白。该过程可用于在给定蛋白质上产生精确的N-末端氨基酸残基,其身份决定蛋白质的半衰期。
一般地,控制RNA指导的核酸酶或指导RNA的表达可以调节整个全酶(holoenzyme)复合物;对于CRISPR-Cas9系统,这可以通过调节Cas9或gRNA的水平来完成。此外,通过Met-氨肽酶、脱遍在蛋白化或替代方法,N末端氨基酸的简单变化可以实现该调节(图19A)。
降低Cas9半衰期可有利于降低脱靶效应的可能性。在临床环境中,这对于病毒递送方法(例如AAV)是非常重要的,所述病毒递送方法特征在于延长或终生表达。相反,用低效的递送方法,可能需要或必需增加蛋白质半衰期以引发效应。在各种不同的环境中,非常需要调节核酸酶水平的能力。另外,这种调节方法是简单的且可以与其他形式的调节例如降解决定子、诱导型降解决定子或RNA指导核酸酶的分裂变体结合使用。
在这里,显示Cas9(一种RNA指导的核酸酶)的水平可以通过N-末端氨基酸的身份调节多达8-10倍(核酸酶表达的显著范围) (图19A)。还显示可如何利用常用的2A肽来调节细胞中的蛋白质水平(图20)。
方法
质粒构建:为了产生遍在蛋白融合的Cas9蛋白,使用略有修改的Gibson Assembly(New England Biolabs, Ipswich, MA) (Gibson等人(2009) Nature Methods 6:343-345)将遍在蛋白与Cas9的N末端融合。简而言之,编码所有20个氨基酸的引物用于扩增编码遍在蛋白的gBlock,然后将其与Cas9在框内克隆。对所有构建体进行测序验证。
将人胚肾(HEK)细胞系293T(Life Technologies,Grand Island,NY)在用10%胎牛血清(Gibco, Life Technologies, Grand Island, NY)和2mM GlutaMAX (Invitrogen)补充的Dulbecco改良Eagle培养基(DMEM)(Invitrogen)中在37℃和5% CO2/20% O2下维持。
用每种构建体在2000ng、500ng或125ng下转染细胞。48小时后收获细胞的蛋白质,然后在Simple Simon机器上分析Cas9表达或用于对照的GAPDH。比率用于标准化值并确定蛋白质稳定性。
1. Tasaki T等人.(2012) Annu Rev Biochem. 81:261-89。
2. Varshavsky A等人.(2011) Protein Sci. 20(8) :1298-345。
3. Bachmair A等人.(1986) Science. 234(4773):179-86。
表1:基于N-末端残基的哺乳动物细胞中蛋白质的近似半衰期
表2:常用2A序列的列表
P2A:GSGATNFSLLKQAGDVEENPGP (SEQ ID NO:35)
T2A:GSGEGRGSLLTCGDVEENPGP (SEQ ID NO:36)
E2A:GSGQCTNYALLKLAGDVESNPGP (SEQ ID NO:37)
F2A:GSGVKQTLNFDLLKLAGDVESNPGP (SEQ ID NO:38)
蛋白质序列
Ub:Val::Cas9
MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGGVDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKK
MKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSRADPKKKRKV (SEQ ID NO:39)
Ub:Met::Cas9
MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGGMDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSRADPKKKRKV (SEQ ID NO:40)
Ub:Gly::Cas9
MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGGGDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKK
MKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSRADPKKKRKV(SEQ ID NO:41)
Ub:Pro::Cas9
MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGGPDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKK
MKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSRADPKKKRKV (SEQ ID NO:42)
Ub:Ile::Cas9
MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGGIDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKK
MKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSRADPKKKRKV (SEQ ID NO:43)
Ub:Thr::Cas9
MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGGTDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKK
MKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSRADPKKKRKV (SEQ ID NO:44)
Ub:Leu::Cas9
MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGGLDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKK
MKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSRADPKKKRKV (SEQ ID NO:45)
Ub:Ala::Cas9
MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGGADKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKK
MKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSRADPKKKRKV (SEQ ID NO:46)
Ub:His::Cas9
MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGGHDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKK
MKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSRADPKKKRKV (SEQ ID NO:47)
Ub:Trp::Cas9
MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGGWDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKK
MKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSRADPKKKRKV (SEQ ID NO:48)
Ub:Try::Cas9
MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGGYDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKK
MKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSRADPKKKRKV (SEQ ID NO:49)
Ub:Ser::Cas9
MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGGSDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKK
MKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSRADPKKKRKV (SEQ ID NO:50)
Ub:Asn::Cas9
MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGGNDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKK
MKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSRADPKKKRKV (SEQ ID NO:51)
Ub:Lys::Cas9
MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGGKDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKK
MKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSRADPKKKRKV (SEQ ID NO:52)
Ub:Cys::Cas9
MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGGCDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKK
MKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSRADPKKKRKV (SEQ ID NO:53)
Ub:Asp::Cas9
MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGGDDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKK
MKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSRADPKKKRKV (SEQ ID NO:54)
Ub:Phe::Cas9
MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGGFDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKK
MKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSRADPKKKRKV (SEQ ID NO:55)
Ub:Glu::Cas9
MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGGEDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKK
MKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSRADPKKKRKV (SEQ ID NO:56)
Ub:Arg::Cas9
MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGGRDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKK
MKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSRADPKKKRKV (SEQ ID NO:57)
Ub:Gln::Cas9
MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGGQDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKK
MKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSRADPKKKRKV (SEQ ID NO:58)
Ub(G76V)::Cas9
MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVLRLRGVDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKK
MKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDSRADPKKKRKV (SEQ ID NO:59)
DNA序列
Ub:
ACCACCTCTCAGACGCAGGACCAGGTGCAGGGTCGACTCCTTCTGGATGTTGTAGTCAGAAAGAGTGCGGCCATCTTCCAGCTGCTTGCCTGCAAAGATGAGCCTCTGCTGGTCGGGAGGGATGCCTTCTTTATCCTGGATCTTGGCCTTCACATTTTCGATGGTGTCACTGGGCTCCACTTCCAGGGTGATGGTCTTGCCGGTCAGGGTCTTCACGAAGATCTGCAT (SEQ ID NO:60)
Cas9:
GACAAGAAGTACTCCATTGGGCTCGATATCGGCACAAACAGCGTCGGCTGGGCCGTCATTACGGACGAGTACAAGGTGCCGAGCAAAAAATTCAAAGTTCTGGGCAATACCGATCGCCACAGCATAAAGAAGAACCTCATTGGCGCCCTCCTGTTCGACTCCGGGGAGACGGCCGAAGCCACGCGGCTCAAAAGAACAGCACGGCGCAGATATACCCGCAGAAAGAATCGGATCTGCTACCTGCAGGAGATCTTTAGTAATGAGATGGCTAAGGTGGATGACTCTTTCTTCCATAGGCTGGAGGAGTCCTTTTTGGTGGAGGAGGATAAAAAGCACGAGCGCCACCCAATCTTTGGCAATATCGTGGACGAGGTGGCGTACCATGAAAAGTACCCAACCATATATCATCTGAGGAAGAAGCTTGTAGACAGTACTGATAAGGCTGACTTGCGGTTGATCTATCTCGCGCTGGCGCATATGATCAAATTTCGGGGACACTTCCTCATCGAGGGGGACCTGAACCCAGACAACAGCGATGTCGACAAACTCTTTATCCAACTGGTTCAGACTTACAATCAGCTTTTCGAAGAGAACCCGATCAACGCATCCGGAGTTGACGCCAAAGCAATCCTGAGCGCTAGGCTGTCCAAATCCCGGCGGCTCGAAAACCTCATCGCACAGCTCCCTGGGGAGAAGAAGAACGGCCTGTTTGGTAATCTTATCGCCCTGTCACTCGGGCTGACCCCCAACTTTAAATCTAACTTCGACCTGGCCGAAGATGCCAAGCTTCAACTGAGCAAAGACACCTACGATGATGATCTCGACAATCTGCTGGCCCAGATCGGCGACCAGTACGCAGACCTTTTTTTGGCGGCAAAGAACCTGTCAGACGCCATTCTGCTGAGTGATATTCTGCGAGTGAACACGGAGATCACCAAAGCTCCGCTGAGCGCTAGTATGATCAAGCGCTATGATGAGCACCACCAAGACTTGACTTTGCTGAAGGCCCTTGTCAGACAGCAACTGCCTGAGAAGTACAAGGAAATTTTCTTCGATCAGTCTAAAAATGGCTACGCCGGATACATTGACGGCGGAGCAAGCCAGGAGGAATTTTACAAATTTATTAAGCCCATCTTGGAAAAAATGGACGGCACCGAGGAGCTGCTGGTAAAGCTTAACAGAGAAGATCTGTTGCGCAAACAGCGCACTTTCGACAATGGAAGCATCCCCCACCAGATTCACCTGGGCGAACTGCACGCTATCCTCAGGCGGCAAGAGGATTTCTACCCCTTTTTGAAAGATAACAGGGAAAAGATTGAGAAAATCCTCACATTTCGGATACCCTACTATGTAGGCCCCCTCGCCCGGGGAAATTCCAGATTCGCGTGGATGACTCGCAAATCAGAAGAGACCATCACTCCCTGGAACTTCGAGGAAGTCGTGGATAAGGGGGCCTCTGCCCAGTCCTTCATCGAAAGGATGACTAACTTTGATAAAAATCTGCCTAACGAAAAGGTGCTTCCTAAACACTCTCTGCTGTACGAGTACTTCACAGTTTATAACGAGCTCACCAAGGTCAAATACGTCACAGAAGGGATGAGAAAGCCAGCATTCCTGTCTGGAGAGCAGAAGAAAGCTATCGTGGACCTCCTCTTCAAGACGAACCGGAAAGTTACCGTGAAACAGCTCAAAGAAGACTATTTCAAAAAGATTGAATGTTTCGACTCTGTTGAAATCAGCGGAGTGGAGGATCGCTTCAACGCATCCCTGGGAACGTATCACGATCTCCTGAAAATCATTAAAGACAAGGACTTCCTGGACAATGAGGAGAACGAGGACATTCTTGAGGACATTGTCCTCACCCTTACGTTGTTTGAAGATAGGGAGATGATTGAAGAACGCTTGAAAACTTACGCTCATCTCTTCGACGACAAAGTCATGAAACAGCTCAAGAGGCGCCGATATACAGGATGGGGGCGGCTGTCAAGAAAACTGATCAATGGGATCCGAGACAAGCAGAGTGGAAAGACAATCCTGGATTTTCTTAAGTCCGATGGATTTGCCAACCGGAACTTCATGCAGTTGATCCATGATGACTCTCTCACCTTTAAGGAGGACATCCAGAAAGCACAAGTTTCTGGCCAGGGGGACAGTCTTCACGAGCACATCGCTAATCTTGCAGGTAGCCCAGCTATCAAAAAGGGAATACTGCAGACCGTTAAGGTCGTGGATGAACTCGTCAAAGTAATGGGAAGGCATAAGCCCGAGAATATCGTTATCGAGATGGCCCGAGAGAACCAAACTACCCAGAAGGGACAGAAGAACAGTAGGGAAAGGATGAAGAGGATTGAAGAGGGTATAAAAGAACTGGGGTCCCAAATCCTTAAGGAACACCCAGTTGAAAACACCCAGCTTCAGAATGAGAAGCTCTACCTGTACTACCTGCAGAACGGCAGGGACATGTACGTGGATCAGGAACTGGACATCAATCGGCTCTCCGACTACGACGTGGATCATATCGTGCCCCAGTCTTTTCTCAAAGATGATTCTATTGATAATAAAGTGTTGACAAGATCCGATAAAAATAGAGGGAAGAGTGATAACGTCCCCTCAGAAGAAGTTGTCAAGAAAATGAAAAATTATTGGCGGCAGCTGCTGAACGCCAAACTGATCACACAACGGAAGTTCGATAATCTGACTAAGGCTGAACGAGGTGGCCTGTCTGAGTTGGATAAAGCCGGCTTCATCAAAAGGCAGCTTGTTGAGACACGCCAGATCACCAAGCACGTGGCCCAAATTCTCGATTCACGCATGAACACCAAGTACGATGAAAATGACAAACTGATTCGAGAGGTGAAAGTTATTACTCTGAAGTCTAAGCTGGTCTCAGATTTCAGAAAGGACTTTCAGTTTTATAAGGTGAGAGAGATCAACAATTACCACCATGCGCATGATGCCTACCTGAATGCAGTGGTAGGCACTGCACTTATCAAAAAATATCCCAAGCTTGAATCTGAATTTGTTTACGGAGACTATAAAGTGTACGATGTTAGGAAAATGATCGCAAAGTCTGAGCAGGAAATAGGCAAGGCCACCGCTAAGTACTTCTTTTACAGCAATATTATGAATTTTTTCAAGACCGAGATTACACTGGCCAATGGAGAGATTCGGAAGCGACCACTTATCGAAACAAACGGAGAAACAGGAGAAATCGTGTGGGACAAGGGTAGGGATTTCGCGACAGTCCGGAAGGTCCTGTCCATGCCGCAGGTGAACATCGTTAAAAAGACCGAAGTACAGACCGGAGGCTTCTCCAAGGAAAGTATCCTCCCGAAAAGGAACAGCGACAAGCTGATCGCACGCAAAAAAGATTGGGACCCCAAGAAATACGGCGGATTCGATTCTCCTACAGTCGCTTACAGTGTACTGGTTGTGGCCAAAGTGGAGAAAGGGAAGTCTAAAAAACTCAAAAGCGTCAAGGAACTGCTGGGCATCACAATCATGGAGCGATCAAGCTTCGAAAAAAACCCCATCGACTTTCTCGAGGCGAAAGGATATAAAGAGGTCAAAAAAGACCTCATCATTAAGCTTCCCAAGTACTCTCTCTTTGAGCTTGAAAACGGCCGGAAACGAATGCTCGCTAGTGCGGGCGAGCTGCAGAAAGGTAACGAGCTGGCACTGCCCTCTAAATACGTTAATTTCTTGTATCTGGCCAGCCACTATGAAAAGCTCAAAGGGTCTCCCGAAGATAATGAGCAGAAGCAGCTGTTCGTGGAACAACACAAACACTACCTTGATGAGATCATCGAGCAAATAAGCGAATTCTCCAAAAGAGTGATCCTCGCCGACGCTAACCTCGATAAGGTGCTTTCTGCTTACAATAAGCACAGGGATAAGCCCATCAGGGAGCAGGCAGAAAACATTATCCACTTGTTTACTCTGACCAACTTGGGCGCGCCTGCAGCCTTCAAGTACTTCGACACCACCATAGACAGAAAGCGGTACACCTCTACAAAGGAGGTCCTGGACGCCACACTGATTCATCAGTCAATTACGGGGCTCTATGAAACAAGAATCGACCTCTCTCAGCTCGGTGGAGACAGCAGGGCTGACCCCAAGAAGAAGAGGAAGGTG (SEQ ID NO:61)
实施例6
使用双向启动子通过单一AAV病毒递送RNA指导的核酸酶、指导RNA和HDR模板
通过单一AAV病毒递送RNA指导的核酸酶、指导RNA和HDR模板,一种革命性的基因组编辑技术(称为CRISPR),正在改变生物学研究并开创基因医学的新时代。我们体内的每个细胞都含有30亿对碱基对的DNA,并且甚至单个变化或突变都可以导致多种遗传或后天性疾病。通过类似于基因组手术的过程,CRISPR技术允许研究人员以前所未有的精度靶向疾病相关突变,在疾病的根本原因处治疗疾病。
世界各地的研究实验室已经表明CRISPR可以有效地靶向疾病突变;然而,直到现在,基于CRISPR的人用疗法的开发受到递送限制的阻碍。组织特异性体内基因治疗的优选递送选择是重组腺相关病毒(AAV)。AAV具有显著的安全史、功效和缺乏毒性,使用这种方法的FDA批准的试验数量越来越多进一步说明了这一点,全世界已有150项使用AAV的试验。这些紧凑病毒可以向多种细胞类型以高效率和特异性递送材料,而虽然安全,但它们的小尺寸对于CRISPR组分的包装提供一个重大障碍。
当人们遗传一个坏基因然后其使正常拷贝中毒时,就会出现显性疾病。虽然通过基因治疗技术无法治愈,但可以使用CRISPR抑制这些突变,CRISPR破坏突变并允许其他正常基因起作用。我们先前公开了使用紧凑的H1双向启动子将两种CRISPR组分包装到单一AAV病毒中的方法。
另一方面,隐性突变是遗传两个坏基因拷贝的结果。这些疾病需要递送CRISPR以及突变周围的长片段的DNA(模板),以便细胞可以通过在正确的序列中拷贝来编辑掉突变。尽管绝大多数疾病属于这一类,但由于AAV的大小限制,并不存在经由存在的单一AAV病毒递送CRISPR组分和模板DNA的手段。
从历史上看,AAV用作为位点特异性DNA变化递送模板的方法。与其他已知方法相比,AAV模板是最具重组性的,尽管在基因编辑方法之前,比率仍然很低,大约小于1/104。我们知道DNA断裂是高度重组性的,且CRISPR-Cas9与AAV模板的共同递送具有以高频率重组的能力。我们也知道小至40-60nt的ssDNA模板是非常有效的HDr模板,200nt和更大的dsDNA模板亦是如此。不幸的是,没有在一个AAV病毒中递送CRISPR组分和HDR模板的手段。
然而,由于H1双向启动子系统如此紧凑,我们可以通过单一AAV病毒递送切割(Cas9和gRNA)和粘贴(HDR模板)元件二者。就可治疗的人和疾病数量而言,这类疾病的治疗潜力要远大得多。
这里,显示了用于校正体内突变的AAV载体设计,其使用H1启动子表达RNA指导的核酸酶(Cas9)、指导RNA和供体模板序列。对于实例1)使用SaCas9切口酶以及两个gRNA和模板校正rd12突变(图25B)和2) rd10突变的SpCas9校正(图27),说明了用于突变校正的两个实例。
方法
将人胚肾(HEK)细胞系293T(Life Technologies,Grand Island,NY)在用10%胎牛血清(Gibco, Life Technologies, Grand Island, NY)和2mM GlutaMAX (Invitrogen)补充的Dulbecco改良Eagle培养基(DMEM)(Invitrogen)中在37℃和5% CO2/20% O2下维持。
构建体设计。见图28。设计构建体以使用小鼠H1启动子表达SpCas9和gRNA二者。在侧翼NotI位点之前掺入两个限制位点以允许Gibson克隆HDR模板:用于左侧HDR的KpnI和用于右侧HDR的HpaI。对于KpnI消化后的插入,使用以下序列5’-GAGAGTGCACCATAGCGGCCGCGNNNGTACCCACACAAAAAACCAACACACAG-3’(SEQ ID NO:69),其中N'代表模板区,或在HpaI消化后,使用以下序列5’-GGCACCGAGTCGGTGCTTTTTTGTTNNNNNNAACGCGGCCGCCTAGAGTCGAC-3’(SEQ ID NO:70),其中N'代表模板区域。
gRNA(参见Jaskula-Ranga, V., & Zack, D. J. (2016). grID:A CRISPR-Cas9guide RNA Database and Resource for Genome-Editing. bioRxiv, 097352)通过重叠以下寡核苷酸产生,所述寡核苷酸使用两步扩增Phusion Flash DNA聚合酶(ThermoFisher Scientific,Rockford,IL)通过PCR退火和扩增,随后使用Zymo DNA清洁和浓缩柱纯化。然后将纯化的PCR产物重悬于H2O中并使用NanoDrop 1000(Thermo FisherScientific)定量。表达gRNA的构建体使用略有修改的Gibson Assembly (New EnglandBiolabs, Ipswich, MA) (Gibson等人(2009) Nature Methods 6:343-345)产生。总反应体积从20μl减少到2μl。通过Sanger测序验证克隆。
用Cas9(未修饰的或细胞周期调节的版本)和靶向视紫红质的gRNA构建体共转染HEK293细胞。转染后48小时,收获基因组DNA,并根据附录中列出的引物扩增靶切割位点周围的序列。然后在进行T7 Endo I测定之前纯化和定量PCR产物。简言之,将200ng PCR产物变性,然后缓慢再退火以允许形成异源双链体,将T7核酸内切酶I加入PCR产物中并在37℃下孵育25分钟以切割异源双链体,反应在负载染料中淬灭,最后,在6%TBE PAGE凝胶上跑反应物以分离产物。凝胶用SYBR-Gold染色,可视化,并使用ImageJ定量。使用二项式导出的方程计算NHEJ频率:
其中“a”和“b”的值等于背景扣除后切割片段的积分面积,且“c”等于背景扣除后未切割的PCR产物的积分面积。
序列
mSPA_HDR SpCas9进入质粒
CCTGCTGTCTCCACCGAGCTGAGAGAGGTCGATTCTTGTTTCATAGAGCCCCGTAATTGACTGATGAATCAGTGTGGCGTCCAGGACCTCCTTTGTAGAGGTGTACCGCTTTCTGTCTATGGTGGTGTCGAAGTACTTGAAGGCTGCAGGCGCGCCCAAGTTGGTCAGAGTAAACAAGTGGATAATGTTTTCTGCCTGCTCCCTGATGGGCTTATCCCTGTGCTTATTGTAAGCAGAAAGCACCTTATCGAGGTTAGCGTCGGCGAGGATCACTCTTTTGGAGAATTCGCTTATTTGCTCGATGATCTCATCAAGGTAGTGTTTGTGTTGTTCCACGAACAGCTGCTTCTGCTCATTATCTTCGGGAGACCCTTTGAGCTTTTCATAGTGGCTGGCCAGATACAAGAAATTAACGTATTTAGAGGGCAGTGCCAGCTCGTTACCTTTCTGCAGCTCGCCCGCACTAGCGAGCATTCGTTTCCGGCCGTTTTCAAGCTCAAAGAGAGAGTACTTGGGAAGCTTAATGATGAGGTCTTTTTTGACCTCTTTATATCCTTTCGCCTCGAGAAAGTCGATGGGGTTTTTTTCGAAGCTTGATCGCTCCATGATTGTGATGCCCAGCAGTTCCTTGACGCTTTTGAGTTTTTTAGACTTCCCTTTCTCCACTTTGGCCACAACCAGTACACTGTAAGCGACTGTAGGAGAATCGAATCCGCCGTATTTCTTGGGGTCCCAATCTTTTTTGCGTGCGATCAGCTTGTCGCTGTTCCTTTTCGGGAGGATACTTTCCTTGGAGAAGCCTCCGGTCTGTACTTCGGTCTTTTTAACGATGTTCACCTGCGGCATGGACAGGACCTTCCGGACTGTCGCGAAATCCCTACCCTTGTCCCACACGATTTCTCCTGTTTCTCCGTTTGTTTCGATAAGTGGTCGCTTCCGAATCTCTCCATTGGCCAGTGTAATCTCGGTCTTGAAAAAATTCATAATATTGCTGTAAAAGAAGTACTTAGCGGTGGCCTTGCCTATTTCCTGCTCAGACTTTGCGATCATTTTCCTAACATCGTACACTTTATAGTCTCCGTAAACAAATTCAGATTCAAGCTTGGGATATTTTTTGATAAGTGCAGTGCCTACCACTGCATTCAGGTAGGCATCATGCGCATGGTGGTAATTGTTGATCTCTCTCACCTTATAAAACTGAAAGTCCTTTCTGAAATCTGAGACCAGCTTAGACTTCAGAGTAATAACTTTCACCTCTCGAATCAGTTTGTCATTTTCATCGTACTTGGTGTTCATGCGTGAATCGAGAATTTGGGCCACGTGCTTGGTGATCTGGCGTGTCTCAACAAGCTGCCTTTTGATGAAGCCGGCTTTATCCAACTCAGACAGGCCACCTCGTTCAGCCTTAGTCAGATTATCGAACTTCCGTTGTGTGATCAGTTTGGCGTTCAGCAGCTGCCGCCAATAATTTTTCATTTTCTTGACAACTTCTTCTGAGGGGACGTTATCACTCTTCCCTCTATTTTTATCGGATCTTGTCAACACTTTATTATCAATAGAATCATCTTTGAGAAAAGACTGGGGCACGATATGATCCACGTCGTAGTCGGAGAGCCGATTGATGTCCAGTTCCTGATCCACGTACATGTCCCTGCCGTTCTGCAGGTAGTACAGGTAGAGCTTCTCATTCTGAAGCTGGGTGTTTTCAACTGGGTGTTCCTTAAGGATTTGGGACCCCAGTTCTTTTATACCCTCTTCAATCCTCTTCATCCTTTCCCTACTGTTCTTCTGTCCCTTCTGGGTAGTTTGGTTCTCTCGGGCCATCTCGATAACGATATTCTCGGGCTTATGCCTTCCCATTACTTTGACGAGTTCATCCACGACCTTAACGGTCTGCAGTATTCCCTTTTTGATAGCTGGGCTACCTGCAAGATTAGCGATGTGCTCGTGAAGACTGTCCCCCTGGCCAGAAACTTGTGCTTTCTGGATGTCCTCCTTAAAGGTGAGAGAGTCATCATGGATCAACTGCATGAAGTTCCGGTTGGCAAATCCATCGGACTTAAGAAAATCCAGGATTGTCTTTCCACTCTGCTTGTCTCGGATCCCATTGATCAGTTTTCTTGACAGCCGCCCCCATCCTGTATATCGGCGCCTCTTGAGCTGTTTCATGACTTTGTCGTCGAAGAGATGAGCGTAAGTTTTCAAGCGTTCTTCAATCATCTCCCTATCTTCAAACAACGTAAGGGTGAGGACAATGTCCTCAAGAATGTCCTCGTTCTCCTCATTGTCCAGGAAGTCCTTGTCTTTAATGATTTTCAGGAGATCGTGATACGTTCCCAGGGATGCGTTGAAGCGATCCTCCACTCCGCTGATTTCAACAGAGTCGAAACATTCAATCTTTTTGAAATAGTCTTCTTTGAGCTGTTTCACGGTAACTTTCCGGTTCGTCTTGAAGAGGAGGTCCACGATAGCTTTCTTCTGCTCTCCAGACAGGAATGCTGGCTTTCTCATCCCTTCTGTGACGTATTTGACCTTGGTGAGCTCGTTATAAACTGTGAAGTACTCGTACAGCAGAGAGTGTTTAGGAAGCACCTTTTCGTTAGGCAGATTTTTATCAAAGTTAGTCATCCTTTCGATGAAGGACTGGGCAGAGGCCCCCTTATCCACGACTTCCTCGAAGTTCCAGGGAGTGATGGTCTCTTCTGATTTGCGAGTCATCCACGCGAATCTGGAATTTCCCCGGGCGAGGGGGCCTACATAGTAGGGTATCCGAAATGTGAGGATTTTCTCAATCTTTTCCCTGTTATCTTTCAAAAAGGGGTAGAAATCCTCTTGCCGCCTGAGGATAGCGTGCAGTTCGCCCAGGTGAATCTGGTGGGGGATGCTTCCATTGTCGAAAGTGCGCTGTTTGCGCAACAGATCTTCTCTGTTAAGCTTTACCAGCAGCTCCTCGGTGCCGTCCATTTTTTCCAAGATGGGCTTAATAAATTTGTAAAATTCCTCCTGGCTTGCTCCGCCGTCAATGTATCCGGCGTAGCCATTTTTAGACTGATCGAAGAAAATTTCCTTGTACTTCTCAGGCAGTTGCTGTCTGACAAGGGCCTTCAGCAAAGTCAAGTCTTGGTGGTGCTCATCATAGCGCTTGATCATACTAGCGCTCAGCGGAGCTTTGGTGATCTCCGTGTTCACTCGCAGAATATCACTCAGCAGAATGGCGTCTGACAGGTTCTTTGCCGCCAAAAAAAGGTCTGCGTACTGGTCGCCGATCTGGGCCAGCAGATTGTCGAGATCATCATCGTAGGTGTCTTTGCTCAGTTGAAGCTTGGCATCTTCGGCCAGGTCGAAGTTAGATTTAAAGTTGGGGGTCAGCCCGAGTGACAGGGCGATAAGATTACCAAACAGGCCGTTCTTCTTCTCCCCAGGGAGCTGTGCGATGAGGTTTTCGAGCCGCCGGGATTTGGACAGCCTAGCGCTCAGGATTGCTTTGGCGTCAACTCCGGATGCGTTGATCGGGTTCTCTTCGAAAAGCTGATTGTAAGTCTGAACCAGTTGGATAAAGAGTTTGTCGACATCGCTGTTGTCTGGGTTCAGGTCCCCCTCGATGAGGAAGTGTCCCCGAAATTTGATCATATGCGCCAGCGCGAGATAGATCAACCGCAAGTCAGCCTTATCAGTACTGTCTACAAGCTTCTTCCTCAGATGATATATGGTTGGGT
ACTTTTCATGGTACGCCACCTCGTCCACGATATTGCCAAAGATTGGGTGGCGCTCGTGCTTTTTATCCTCCTCCACCAAAAAGGACTCCTCCAGCCTATGGAAGAAAGAGTCATCCACCTTAGCCATCTCATTACTAAAGATCTCCTGCAGGTAGCAGATCCGATTCTTTCTGCGGGTATATCTGCGCCGTGCTGTTCTTTTGAGCCGCGTGGCTTCGGCCGTCTCCCCGGAGTCGAACAGGAGGGCGCCAATGAGGTTCTTCTTTATGCTGTGGCGATCGGTATTGCCCAGAACTTTGAATTTTTTGCTCGGCACCTTGTACTCGTCCGTAATGACGGCCCAGCCGACGCTGTTTGTGCCGATATCGAGCCCAATGGAGTACTTCTTGTCCATGGTGGCGGCTCTTGAAGGACGACGTCATCATCCCTTGCCCGGATGCGCGGGCTTCTTGTCTAGCACAGGAGCCTGGGGTAGAGCGCATGCAAATTACGCGCTGTGCTTTGTGGGAAATCACCCTAAACGAAAAATTTATTCCTCTTTCGAGCCTTATAGTGGCGGCCGGTCTACATCCTAGGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTGTTAACGCGGCCGCCTAGAGTCGACCTGCAGGCATGCAAGCTTGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAG
GCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCTAAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACGAGGCCCTTTCGTCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGCACCATAGCGGCCGCGGTACCCACACAAAAAACCAACACACAGATGTAATGAAAATAAAGATATTTTATT
TCACACCTTCCTCTTCTTCTTGGGGTCAGC (SEQ ID NO:62)
mSPA_HDR rd10(250)右侧
CTGCAGGCATGCAAGCTTGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGC
TCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAAC
CCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGC
TACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCA
TTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGC
AAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCTAAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACGAGGCCCTTTCGTCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGCACCATAGCGGCCGCGGTACCCACACAAAAAACCAACACACAGATGTAATGAAAATAAAGATATTTTATTTCACACCTTCCTCTTCTTCTTGGGGTCAGCCCTGCTGTCTCCACCGAGCTGAGAGAGGTCGATTCTTGTTTCATAGAGCCCCGTAATTGACTGATGAATCAGTGTGGCGTCCAGGACCTCCTTTGTAGAGGTGTACCGCTTTCTGTCTATGGTGGTGTCGAAGTACTTGAAGGCTGCAGGCGCGCCCAAGTTGGTCAGAGTAAACAAGTGGATAATGTTTTCTGCCTGCTCCCTGATGGGCTTATCCCTGTGCTTATTGTAAGCAGAAAGCACCTTATCGAGGTTAGCGTCGGCGAGGATCACTCTTTTGGAGAATTCGCTTATTTGCTCGATGATCTCATCAAGGTAGTGTTTGTGTTGTTCCACGAACAGCTGCTTCTGCTCATTATCTTCGGGAGACCCTTTGAGCTTTTCATAGTGGCTGGCCAGATACAAGAAATTAACGTATTTAGAGGGCAGTGCCAGCTCGTTACCTTTCTGCAGCTCGCCCGCACTAGCGAGCATTCGTTTCCGGCCGTTTTCAAGCTCAAAGAGAGAGTACTTGGGAAGCTTAATGATGAGGTCTTTTTTGACCTCTTTATATCCTTTCGCCTCGAGAAAGTCGATGGGGTTTTTTTCGAAGCTTGATCGCTCCATGATTGTGATGCCCAGCAGTTCCTTGACGCTTTTGAGTTTTTTAGACTTCCCTTTCTCCACTTTGGCCACAACCAGTACACTGTAAGCGACTGTAGGAGAATCGAATCCGCCGTATTTCTTGGGGTCCCAATCTTTTT
TGCGTGCGATCAGCTTGTCGCTGTTCCTTTTCGGGAGGATACTTTCCTTGGAGAAGCCTCCGGTCTGTACTTCGGTCTTTTTAACGATGTTCACCTGCGGCATGGACAGGACCTTCCGGACTGTCGCGAAATCCCTACCCTTGTCCCACACGATTTCTCCTGTTTCTCCGTTTGTTTCGATAAGTGGTCGCTTCCGAATCTCTCCATTGGCCAGTGTAATCTCGGTCTTGAAAAAATTCATAATATTGCTGTAA
AAGAAGTACTTAGCGGTGGCCTTGCCTATTTCCTGCTCAGACTTTGCGATCATTTTCCTAACATCGTACACTTTATAGTCTCCGTAAACAAATTCAGATTCAAGCTTGGGATATTTTTTGATAAGTGCAGTGCCTACCACTGCATTCAGGTAGGCATCATGCGCATGGTGGTAATTGTTGATCTCTCTCACCTTATAAAACTGAAAGTCCTTTCTGAAATCTGAGACCAGCTTAGACTTCAGAGTAATAACTTTCACCTCTCGAATCAGTTTGTCATTTTCATCGTACTTGGTGTTCATGCGTGAATCGAGAATTTGGGCCACGTGCTTGGTGATCTGGCGTGTCTCAACAAGCTGCCTTTTGATGAAGCCGGCTTTATCCAACTCAGACAGGCCACCTCGTTCAGCCTTAGTCAGATTATCGAACTTCCGTTGTGTGATCAGTTTGGCGTTCAGCAGCTGCCGCCAATAATTTTTCATTTTCTTGACAACTTCTTCTGAGGGGACGTTATCACTCTTCCCTCTATTTTTATCGGATCTTGTCAACACTTTATTATCAATAGAATCATCTTTGAGAAAAGACTGGGGCACGATATGATCCACGTCGTAGTCGGAGAGCCGATTGATGTCCAGTTCCTGATCCACGTACATGTCCCTGCCGTTCTGCAGGTAGTACAGGTAGAGCTTCTCATTCTGAAGCTGGGTGTTTTCAACTGGGTGTTCCTTAAGGATTTGGGACCCCAGTTCTTTTATACCCTCTTCAATCCTCTTCATCCTTTCCCTACTGTTCTTCTGTCCCTTCTGGGTAGTTTGGTTCTCTCGGGCCATCTCGATAACGATATTCTCGGGCTTATGCCTTCCCATTACTTTGACGAGTTCATCCACGACCTTAACGGTCTGCAGTATTCCCTTTTTGATAGCTGGGCTACCTGCAAGATTAGCGATGTGCTCGTGAAGACTGTCCCCCTGGCCAGAAACTTGTGCTTTCTGGATGTCCTCCTTAAAGGTGAGAGAGTCATCATGGATCAACTGCATGAAGTTCCGGTTGGCAAATCCATCGGACTTAAGAAAATCCAGGATTGTCTTTCCACTCTGCTTGTCTCGGATCCCATTGATCAGTTTTCTTGACAGCCGCCCCCATCCTGTATATCGGCGCCTCTTGAGCTGTTTCATGACTTTGTCGTCGAAGAGATGAGCGTAAGTTTTCAAGCGTTCTTCAATCATCTCCCTATCTTCAAACAACGTAAGGGTGAGGACAATGTCCTCAAGAATGTCCTCGTTCTCCTCATTGTCCAGGAAGTCCTTGTCTTTAATGATTTTCAGGAGATCGTGATACGTTCCCAGGGATGCGTTGAAGCGATCCTCCACTCCGCTGATTTCAACAGAGTCGAAACATTCAATCTTTTTGAAATAGTCTTCTTTGAGCTGTTTCACGGTAACTTTCCGGTTCGTCTTGAAGAGGAGGTCCACGATAGCTTTCTTCTGCTCTCCAGACAGGAATGCTGGCTTTCTCATCCCTTCTGTGACGTATTTGACCTTGGTGAGCTCGTTATAAACTGTGAAGTACTCGTACAGCAGAGAGTGTTTAGGAAGCACCTTTTCGTTAGGCAGATTTTTATCAAAGTTAGTCATCCTTTCGATGAAGGACTGGGCAGAGGCCCCCTTATCCACGACTTCCTCGAAGTTCCAGGGAGTGATGGTCTCTTCTGATTTGCGAGTCATCCACGCGAATCTGGAATTTCCCCGGGCGAGGGGGCCTACATAGTAGGGTATCCGAAATGTGAGGATTTTCTCAATCTTTTCCCTGTTATCTTTCAAAAAGGGGTAGAAATCCTCTTGCCGCCTGAGGATAGCGTGCAGTTCGCCCAGGTGAATCTGGTGGGGGATGCTTCCATTGTCGAAAGTGCGCTGTTTGCGCAACAGATCTTCTCTGTTAAGCTTTACCAGCAGCTCCTCGGTGCCGTCCATTTTTTCCAAGATGGGCTTAATAAATTTGTAAAATTCCTCCTGGCTTGCTCCGCCGTCAATGTATCCGGCGTAGCCATTTTTAGACTGATCGAAGAAAATTTCCTTGTACTTCTCAGGCAGTTGCTGTCTGACAAGGGCCTTCAGCAAAGTCAAGTCTTGGTGGTGCTCATCATAGCGCTTGATCATACTAGCGCTCAGCGGAGCTTTGGTGATCTCCGTGTTCACTCGCAGAATATCACTCAGCAGAATGGCGTCTGACAGGTTCTTTGCCGCCAAAAAAAGGTCTGCGTACTGGTCGCCGATCTGGGCCAGCAGATTGTCGAGATCATCATCGTAGGTGTCTTTGCTCAGTTGAAGCTTGGCATCTTCGGCCAGGTCGAAGTTAGATTTAAAGTTGGGGGTCAGCCCGAGTGACAGGGCGATAAGATTACCAAACAGGCCGTTCTTCTTCTCCCCAGGGAGCTGTGCGATGAGGTTTTCGAGCCGCCGGGATTTGGACAGCCTAGCGCTCAGGATTGCTTTGGCGTCAACTCCGGATGCGTTGATCGGGTTCTCTTCGAAAAGCTGATTGTAAGTCTGAACCAGTTGGATAAAGAGTTTGTCGACATCGCTGTTGTCTGGGTTCAGGTCCCCCTCGATGAGGAAGTGTCCCCGAAATTTGATCATATGCGCCAGCGCGAGATAGATCAACCGCAAGTCAGCCTTATCAGTACTGTCTACAAGCTTCTTCCTCAGATGATATATGGTTGGGTACTTTTCATGGTACGCCACCTCGTCCACGATATTGCCAAAGATTGGGTGGCGCTCGTGCTTTTTATCCTCCTCCACCAAAAAGGACTCCTCCAGCCTATGGAAGAAAGAGTCATCCACCTTAGCCATCTCATTACTAAAGATCTCCTGCAGGTAGCAGATCCGATTCTTTCTGCGGGTATATCTGCGCCGTGCTGTTCTTTTGAGCCGCGTGGCTTCGGCCGTCTCCCCGGAGTCGAACAGGAGGGCGCCAATGAGGTTCTTCTTTATGCTGTGGCGATCGGTATTGCCCAGAACTTTGAATTTTTTGCTCGGCACCTTGTACTCGTCCGTAATGACGGCCCAGCCGACGCTGTTTGTGCCGATATCGAGCCCAATGGAGTACTTCTTGTCCATGGTGGCGGCTCTTGAAGGACGACGTCATCATCCCTTGCCCGGATGCGCGGGCTTCTTGTCTAGCACAGGAGCCTGGGGTAGAGCGCATGC
AAATTACGCGCTGTGCTTTGTGGGAAATCACCCTAAACGAAAAATTTATTCCTCTTTCGAGCCTTATAGTGGCGGCCGGTCTACATCCTAGGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTGTTGATATGGTGCTGTGTAGGCTCATATGTGGATCTCAGAACCCACATGTACTCTGCTCCCCAGGTCTTGGTGCGCTTTCTATTCTCTGTCAGCAAAGCCTATCGAAGAATCACCTACCACAACTGGCGCCACGGCTTCAATGTAGCCCAGACCATGTTTACCCTACTCATGGTACGTATGTAAATTGGATGGGCTAGATGAATCAGAGGGCTGGGGCAAGGACCACAGCTAACTATCTTCTGGCCCAAGGAACGCGGCCGCCTAGAGTCGAC (SEQID NO:63)
mSPA_HDR rd10(250)左侧
ATGTAATGAAAATAAAGATATTTTATTTCACACCTTCCTCTTCTTCTTGGGGTCAGCCCTGCTGTCTCCACCGAGCTGAGAGAGGTCGATTCTTGTTTCATAGAGCCCCGTAATTGACTGATGAATCAGTGTGGCGTCCAGGACCTCCTTTGTAGAGGTGTACCGCTTTCTGTCTATGGTGGTGTCGAAGTACTTGAAGGCTGCAGGCGCGCCCAAGTTGGTCAGAGTAAACAAGTGGATAATGTTTTCTGCCTGCTCCCTGATGGGCTTATCCCTGTGCTTATTGTAAGCAGAAAGCACCTTATCGAGGTTAGCGTCGGCGAGGATCACTCTTTTGGAGAATTCGCTTATTTGCTCGATGATCTCATCAAGGTAGTGTTTGTGTTGTTCCACGAACAGCTGCTTCTGCTCATTATCTTCGGGAGACCCTTTGAGCTTTTCATAGTGGCTGGCCAGATACAAGAAATTAACGTATTTAGAGGGCAGTGCCAGCTCGTTACCTTTCTGCAGCTCGCCCGCACTAGCGAGCATTCGTTTCCGGCCGTTTTCAAGCTCAAAGAGAGAGTACTTGGGAAGCTTAATGATGAGGTCTTTTTTGACCTCTTTATATCCTTTCGCCTCGAGAAAGTCGATGGGGTTTTTTTCGAAGCTTGATCGCTCCATGATTGTGATGCCCAGCAGTTCCTTGACGCTTTTGAGTTTTTTAGACTTCCCTTTCTCCACTTTGGCCACAACCAGTACACTGTAAGCGACTGTAGGAGAATCGAATCCGCCGTATTTCTTGGGGTCCCAATCTTTTTTGCGTGCGATCAGCTTGTCGCTGTTCCTTTTCGGGAGGATACTTTCCTTGGAGAAGCCTCCGGTCTGTACTTCGGTCTTTTTAACGATGTTCACCTGCGGCATGGACAGGACCTTCCGGACTGTCGCGAAATCCCTACCCTTGTCCCACACGATTTCTCCTGTTTCTCCGTTTGTTTCGATAAGTGGTCGCTTCCGAATCTCTCCATTGGCCAGTGTAATCTCGGTCTTGAAAAAATTCATAATATTGCTGTAAAAGAAGTACTTAGCGGTGGCCTTGCCTATTTCCTGCTCAGACTTTGCGATCATTTTCCTAACATCGTACACTTTATAGTCTCCGTAAACAAATTCAGATTCAAGCTTGGGATATTTTTTGATAAGTGCAGTGCCTACCACTGCATTCAGGTAGGCATCATGCGCATGGTGGTAATTGTTGATCTCTCTCACCTTATAAAACTGAAAGTCCTTTCTGAAATCTGAGACCAGCTTAGACTTCAGAGTAATAACTTTCACCTCTCGAATCAGTTTGTCATTTTCATCGTACTTGGTGTTCATGCGTGAATCGAGAATTTGGGCCACGTGCTTGGTGATCTGGCGTGTCTCAACAAGCTGCCTTTTGATGAAGCCGGCTTTATCCAACTCAGACAGGCCACCTCGTTCAGCCTTAGTCAGATTATCGAACTTCCGTTGTGTGATCAGTTTGGCGTTCAGCAGCTGCCGCCAATAATTTTTCATTTTCTTGACAACTTCTTCTGAGGGGACGTTATCACTCTTCCCTCTATTTTTATCGGATCTTGTCAACACTTTATTATCAATAGAATCATCTTTGAGAAAAGACTGGGGCACGATATGATCCACGTCGTAGTCGGAGAGCCGATTGATGTCCAGTTCCTGATCCACGTACATGTCCCTGCCGTTCTGCAGGTAGTACAGGTAGAGCTTCTCATTCTGAAGCTGGGTGTTTTCAACTGGGTGTTCCTTAAGGATTTGGGACCCCAGTTCTTTTATACCCTCTTCAATCCTCTTCATCCTTTCCCTACTGTTCTTCTGTCCCTTCTGGGTAGTTTGGTTCTCTCGGGCCATCTCGATAACGATATTCTCGGGCTTATGCCTTCCCATTACTTTGACGAGTTCATCCACGACCTTAACGGTCTGCAGTATTCCCTTTTTGATAGCTGGGCTACCTGCAAGATTAGCGATGTGCTCGTGAAGACTGTCCCCCTGGCCAGAAACTTGTGCTTTCTGGATGTCCTCCTTAAAGGTGAGAGAGTCATCATGGATCAACTGCATGAAGTTCCGGTTGGCAAATCCATCGGACTTAAGAAAATCCAGGATTGTCTTTCCACTCTGCTTGTCTCGGATCCCATTGATCAGTTTTCTTGACAGCCGCCCCCATCCTGTATATCGGCGCCTCTTGAGCTGTTTCATGACTTTGTCGTCGAAGAGATGAGCGTAAGTTTTCAAGCGTTCTTCAATCATCTCCCTATCTTCAAACAACGTAAGGGTGAGGACAATGTCCTCAAGAATGTCCTCGTTCTCCTCATTGTCCAGGAAGTCCTTGTCTTTAATGATTTTCAGGAGATCGTGATACGTTCCCAGGGATGCGTTGAAGCGATCCTCCACTCCGCTGATTTCAACAGAGTCGAAACATTCAATCTTTTTGAAATAGTCTTCTTTGAGCTGTTTCACGGTAACTTTCCGGTTCGTCTTGAAGAGGAGGTCCACGATAGCTTTCTTCTGCTCTCCAGACAGGAATGCTGGCTTTCTCATCCCTTCTGTGACGTATTTGACCTTGGTGAGCTCGTTATAAACTGTGAAGTACTCGTACAGCAGAGAGTGTTTAGGAAGCACCTTTTCGTTAGGCAGATTTTTATCAAAGTTAGTCATCCTTTCGATGAAGGACTGGGCAGAGGCCCCCTTATCCACGACTTCCTCGAAGTTCCAGGGAGTGATGGTCTCTTCTGATTTGCGAGTCATCCACGCGAATCTGGAATTTCCCCGGGCGAGGGGGCCTACATAGTAGGGTATCCGAAATGTGAGGATTTTCTCAATCTTTTCCCTGTTATCTTTCAAAAAGGGGTAGAAATCCTCTTGCCGCCTGAGGATAGCGTGCAGTTCGCCCAGGTGAATCTGGTGGGGGATGCTTCCATTGTCGAAAGTGCGCTGTTTGCGCAACAGATCTTCTCTGTTAAGCTTTACCAGCAGCTCCTCGGTGCCGTCCATTTTTTCCAAGATGGGCTTAATAAATTTGTAAAATTCCTCCTGGCTTGCTCCGCCGTCAATGTATCCGGCGTAGCCATTTTTAGACTGATCGAAGAAAATTTCCTTGTACTTCTCAGGCAGTTGCTGTCTGACAAGGGCCTTCAGCAAAGTCAAGTCTTGGTGGTGCTCATCATAGCGCTTGATCATACTAGCGCTCAGCGGAGCTTTGGTGATCTCCGTGTTCACTCGCAGAATATCACTCAGCAGAATGGCGTCTGACAGGTTCTTTGCCGCCAAAAAAAGGTCTGCGTACTGGTCGCCGATCTGGGCCAGCAGATTGTCGAGATCATCATCGTAGGTGTCTTTGCTCAGTTGAAGCTTGGCATCTTCGGCCAGGTCGAAGTTAGATTTAAAGTTGGGGGTCAGCCCGAGTGACAGGGCGATAAGATTACCAAACAGGCCGTTCTTCTTCTCCCCAGGGAGCTGTGCGATGAGGTTTTCGAGCCGCCGGGATTTGGACAGCCTAGCGCTCAGGATTGCTTTGGCGTCAACTCCGGATGCGTTGATCGGGTTCTCTTCGAAAAGCTGATTGTAAGTCTGAACCAGTTGGATAAAGAGTTTGTCGACATCGCTGTTGTCTGGGTTCAGGTCCCCCTCGATGAGGAAGTGTCCCCGAAATTTGATCATATGCGCCAGCGCGAGATAGATCAACCGCAAGTCAGCCTTATCAGTACTGTCTACAAGCTTCTTCCTCAGATGATATATGGTTGGGTACTTTTCATGGTACGCCACCTCGTCCACGATATTGCCAAAGATTGGGTGGCGCTCGTGCTTTTTATCCTCCTCCACCAAAAAGGACTCCTCCAGCCTATGGAAGAAAGAGTCATCCACCTTAGCCATCTCATTACTAAAGATCTCCTGCAGGTAGCAGATCCGATTCTTTCTGCGGGTATATCTGCGCCGTGCTGTTCTTTTGAGCCGCGTGGCTTCGGCCGTCTCCCCGGAGTCGAACAGGAGGGCGCCAATGAGGTTCTTCTTTATGCTGTGGCGATCGGTATTGCCCAGAACTTTGAATTTTTTGCTCGGCACCTTGTACTCGTCCGTAATGACGGCCCAGCCGACGCTGTTTGTGCCGATATCGAGCCCAATGGAGTACTTCTTGTCCATGGTGGCGGCTCTTGAAGGACGACGTCATCATCCCTTGCCCGGATGCGCGGGC
TTCTTGTCTAGCACAGGAGCCTGGGGTAGAGCGCATGCAAATTACGCGCTGTGCTTTGTGGGAAATCACCCTAAACGAAAAATTTATTCCTCTTTCGAGCCTTATAGTGGCGGCCGGTCTACATCCTAGGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTGTTAACGCGGCCGCCTAGAGTCGACCTGCAGGCATGCAAGC
TTGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCT
CACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAA
GATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGT
GTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCTAAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACGAGGCCCTTTCGTCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGCACCATAGCGGCCGCGGTACGATATGGTGCTGTGTAGGCTCATATGTGGATCTCAGAACCCACATGTACTCTGCTCCCCAGGTCTTGGTGCGCTTTCTATTCTCTGTCAGCAAAGCCTATCGAAGAATCACCTACCACAACTGGCGCCACGGCTTCAATGTAGCCCAGACCATGTTTACCCTACTCATGGTACGTATGTAAATTGGATGGGCTAGATGAATCAGAGGGCTGGGGCAAGGACCACAGCTAACTATCTTCTGGCCCAAGGGTACCCACACAAAAAACCAACACACAG (SEQ ID NO:64)
mSPA_HDR rd12(250)右侧
CTGCAGGCATGCAAGCTTGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCTAAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACGAGGCCCTTTCGTCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGCACCATAGCGGCCGCGGTACCCACACAAAAAACCAACACACAGATGTAATGAAAATAAAGATATTTTATTTCACACCTTCCTCTTCTTCTTGGGGTCAGCCCTGCTGTCTCCACCGAGCTGAGAGAGGTCGATTCTTGTTTCATAGAGCCCCGTAATTGACTGATGAATCAGTGTGGCGTCCAGGACCTCCTTTGTAGAGGTGTACCGCTTTCTGTCTATGGTGGTGTCGAAGTACTTGAAGGCTGCAGGCGCGCCCAAGTTGGTCAGAGTAAACAAGTGGATAATGTTTTCTGCCTGCTCCCTGATGGGCTTATCCCTGTGCTTATTGTAAGCAGAAAGCACCTTATCGAGGTTAGCGTCGGCGAGGATCACTCTTTTGGAGAATTCGCTTATTTGCTCGATGATCTCATCAAGGTAGTGTTTGTGTTGTTCCACGAACAGCTGCTTCTGCTCATTATCTTCGGGAGACCCTTTGAGCTTTTCATAGTGGCTGGCCAGATACAAGAAATTAACGTATTTAGAGGGCAGTGCCAGCTCGTTACCTTTCTGCAGCTCGCCCGCACTAGCGAGCATTCGTTTCCGGCCGTTTTCAAGCTCAAAGAGAGAGTACTTGGGAAGCTTAATGATGAGGTCTTTTTTGACCTCTTTATATCCTTTCGCCTCGAGAAAGTCGATGGGGTTTTTTTCGAAGCTTGATCGCTCCATGATTGTGATGCCCAGCAGTTCCTTGACGCTTTTGAGTTTTTTAGACTTCCCTTTCTCCACTTTGGCCACAACCAGTACACTGTAAGCGACTGTAGGAGAATCGAATCCGCCGTATTTCTTGGGGTCCCAATCTTTTTTGCGTGCGATCAGCTTGTCGCTGTTCCTTTTCGGGAGGATACTTTCCTTGGAGAAGCCTCCGGTCTGTACTTCGGTCTTTTTAACGATGTTCACCTGCGGCATGGACAGGACCTTCCGGACTGTCGCGAAATCCCTACCCTTGTCCCACACGATTTCTCCTGTTTCTCCGTTTGTTTCGATAAGTGGTCGCTTCCGAATCTCTCCATTGGCCAGTGTAATCTCGGTCTTGAAAAAATTCATAATATTGCTGTAAAAGAAGTACTTAGCGGTGGCCTTGCCTATTTCCTGCTCAGACTTTGCGATCATTTTCCTAACATCGTACACTTTATAGTCTCCGTAAACAAATTCAGATTCAAGCTTGGGATATTTTTTGATAAGTGCAGTGCCTACCACTGCATTCAGGTAGGCATCATGCGCATGGTGGTAATTGTTGATCTCTCTCACCTTATAAAACTGAAAGTCCTTTCTGAAATCTGAGACCAGCTTAGACTTCAGAGTAATAACTTTCACCTCTCGAATCAGTTTGTCATTTTCATCGTACTTGGTGTTCATGCGTGAATCGAGAATTTGGGCCACGTGCTTGGTGATCTGGCGTGTCTCAACAAGCTGCCTTTTGATGAAGCCGGCTTTATCCAACTCAGACAGGCCACCTCGTTCAGCCTTAGTCAGATTATCGAACTTCCGTTGTGTGATCAGTTTGGCGTTCAGCAGCTGCCGCCAATAATTTTTCATTTTCTTGACAACTTCTTCTGAGGGGACGTTATCACTCTTCCCTCTATTTTTATCGGATCTTGTCAACACTTTATTATCAATAGAATCATCTTTGAGAAAAGACTGGGGCACGATATGATCCACGTCGTAGTCGGAGAGCCGATTGATGTCCAGTTCCTGATCCACGTACATGTCCCTGCCGTTCTGCAGGTAGTACAGGTAGAGCTTCTCATTCTGAAGCTGGGTGTTTTCAACTGGGTGTTCCTTAAGGATTTGGGACCCCAGTTCTTTTATACCCTCTTCAATCCTCTTCATCCTTTCCCTACTGTTCTTCTGTCCCTTCTGGGTAGTTTGGTTCTCTCGGGCCATCTCGATAACGATATTCTCGGGCTTATGCCTTCCCATTACTTTGACGAGTTCATCCACGACCTTAACGGTCTGCAGTATTCCCTTTTTGATAGCTGGGCTACCTGCAAGATTAGCGATGTGCTCGTGAAGACTGTCCCCCTGGCCAGAAACTTGTGCTTTCTGGATGTCCTCCTTAAAGGTGAGAGAGTCATCATGGATCAACTGCATGAAGTTCCGGTTGGCAAATCCATCGGACTTAAGAAAATCCAGGATTGTCTTTCCACTCTGCTTGTCTCGGATCCCATTGATCAGTTTTCTTGACAGCCGCCCCCATCCTGTATATCGGCGCCTCTTGAGCTGTTTCATGACTTTGTCGTCGAAGAGATGAGCGTAAGTTTTCAAGCGTTCTTCAATCATCTCCCTATCTTCAAACAACGTAAGGGTGAGGACAATGTCCTCAAGAATGTCCTCGTTCTCCTCATTGTCCAGGAAGTCCTTGTCTTTAATGATTTTCAGGAGATCGTGATACGTTCCCAGGGATGCGTTGAAGCGATCCTCCACTCCGCTGATTTCAACAGAGTCGAAACATTCAATCTTTTTGAAATAGTCTTCTTTGAGCTGTTTCACGGTAACTTTCCGGTTCGTCTTGAAGAGGAGGTCCACGATAGCTTTCTTCTGCTCTCCAGACAGGAATGCTGGCTTTCTCATCCCTTCTGTGACGTATTTGACCTTGGTGAGCTCGTTATAAACTGTGAAGTACTCGTACAGCAGAGAGTGTTTAGGAAGCACCTTTTCGTTAGGCAGATTTTTATCAAAGTTAGTCATCCTTTCGATGAAGGACTGGGCAGAGGCCCCCTTATCCACGACTTCCTCGAAGTTCCAGGGAGTGATGGTCTCTTCTGATTTGCGAGTCATCCACGCGAATCTGGAATTTCCCCGGGCGAGGGGGCCTACATAGTAGGGTATCCGAAATGTGAGGATTTTCTCAATCTTTTCCCTGTTATCTTTCAAAAAGGGGTAGAAATCCTCTTGCCGCCTGAGGATAGCGTGCAGTTCGCCCAGGTGAATCTGGTGGGGGATGCTTCCATTGTCGAAAGTGCGCTGTTTGCGCAACAGATCTTCTCTGTTAAGCTTTACCAGCAGCTCCTCGGTGCCGTCCATTTTTTCCAAGATGGGCTTAATAAATTTGTAAAATTCCTCCTGGCTTGCTCCGCCGTCAATGTATCCGGCGTAGCCATTTTTAGACTGATCGAAGAAAATTTCCTTGTACTTCTCAGGCAGTTGCTGTCTGACAAGGGCCTTCAGCAAAGTCAAGTCTTGGTGGTGCTCATCATAGCGCTTGATCATACTAGCGCTCAGCGGAGCTTTGGTGATCTCCGTGTTCACTCGCAGAATATCACTCAGCAGAATGGCGTCTGACAGGTTCTTTGCCGCCAAAAAAAGGTCTGCGTACTGGTCGCCGATCTGGGCCAGCAGATTGTCGAGATCATCATCGTAGGTGTCTTTGCTCAGTTGAAGCTTGGCATCTTCGGCCAGGTCGAAGTTAGATTTAAAGTTGGGGGTCAGCCCGAGTGACAGGGCGATAAGATTACCAAACAGGCCGTTCTTCTTCTCCCCAGGGAGCTGTGCGATGAGGTTTTCGAGC
CGCCGGGATTTGGACAGCCTAGCGCTCAGGATTGCTTTGGCGTCAACTCCGGATGCGTTGATCGGGTTCTCTTCGAAAAGCTGATTGTAAGTCTGAACCAGTTGGATAAAGAGTTTGTCGACATCGCTGTTGTCTGGGTTCAGGTCCCCCTCGATGAGGAAGTGTCCCCGAAATTTGATCATATGCGCCAGCGCGAGATAGATCAACCGCAAGTCAGCCTTATCAGTACTGTCTACAAGCTTCTTCCTCAG
ATGATATATGGTTGGGTACTTTTCATGGTACGCCACCTCGTCCACGATATTGCCAAAGATTGGGTGGCGCTCGTGCTTTTTATCCTCCTCCACCAAAAAGGACTCCTCCAGCCTATGGAAGAAAGAGTCATCCACCTTAGCCATCTCATTACTAAAGATCTCCTGCAGGTAGCAGATCCGATTCTTTCTGCGGGTATATCTGCGCCGTGCTGTTCTTTTGAGCCGCGTGGCTTCGGCCGTCTCCCCGGAGTCGAACAGGAGGGCGCCAATGAGGTTCTTCTTTATGCTGTGGCGATCGGTATTGCCCAGAACTTTGAATTTTTTGCTCGGCACCTTGTACTCGTCCGTAATGACGGCCCAGCCGACGCTGTTTGTGCCGATATCGAGCCCAATGGAGTACTTCTTGTCCATGGTGGCGGCTCTTGAAGGACGACGTCATCATCCCTTGCCCGGATGCGCGGGCTTCTTGTCTAGCACAGGAGCCTGGGGTAGAGCGCATGCAAATTACGCGCTGTGCTTTGTGGGAAATCACCCTAAACGAAAAATTTATTCCTCTTTCGAGCCTTATAGTGGCGGCCGGTCTACATCCTAGGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTGTTGTTCTGTCTATAGGTAAGCTGACAAATAACAAATAGGCACATAGAAAATCTAGTAAGTAGTACCACCTGATATCTCACTTTGCTGCAGGCAGGATTCCCCTCTGGCTCACTGGCAGTCTCCTCCGGTGTGGGCCAGGGCTCTTTGAAGTTGGATCTGAGCCTTTCTATCACCTGTTTGATGGACAAGCCCTTTTGCACAAGTTTGACTTCAAGGAGGGCCATGTCACATACCACAGAAGGTAAGTCCATGAACGCGGCCGCCTAGAGTCGAC (SEQ ID NO:65)
mSPA_HDR rd12(250)左侧
ATGTAATGAAAATAAAGATATTTTATTTCACACCTTCCTCTTCTTCTTGGGGTCAGCCCTGCTGTCTCCACCGAGCTGAGAGAGGTCGATTCTTGTTTCATAGAGCCCCGTAATTGACTGATGAATCAGTGTGGCGTCCAGGACCTCCTTTGTAGAGGTGTACCGCTTTCTGTCTATGGTGGTGTCGAAGTACTTGAAGGCTGCAGGCGCGCCCAAGTTGGTCAGAGTAAACAAGTGGATAATGTTTTCTGCCTGCTCCCTGATGGGCTTATCCCTGTGCTTATTGTAAGCAGAAAGCACCTTATCGAGGTTAGCGTCGGCGAGGATCACTCTTTTGGAGAATTCGCTTATTTGCTCGATGATCTCATCAAGGTAGTGTTTGTGTTGTTCCACGAACAGCTGCTTCTGCTCATTATCTTCGGGAGACCCTTTGAGCTTTTCATAGTGGCTGGCCAGATACAAGAAATTAACGTATTTAGAGGGCAGTGCCAGCTCGTTACCTTTCTGCAGCTCGCCCGCACTAGCGAGCATTCGTTTCCGGCCGTTTTCAAGCTCAAAGAGAGAGTACTTGGGAAGCTTAATGATGAGGTCTTTTTTGACCTCTTTATATCCTTTCGCCTCGAGAAAGTCGATGGGGTTTTTTTCGAAGCTTGATCGCTCCATGATTGTGATGCCCAGCAGTTCCTTGACGCTTTTGAGTTTTTTAGACTTCCCTTTCTCCACTTTGGCCACAACCAGTACACTGTAAGCGACTGTAGGAGAATCGAATCCGCCGTATTTCTTGGGGTCCCAATCTTTTTTGCGTGCGATCAGCTTGTCGCTGTTCCTTTTCGGGAGGATACTTTCCTTGGAGAAGCCTCCGGTCTGTACTTCGGTCTTTTTAACGATGTTCACCTGCGGCATGGACAGGACCTTCCGGACTGTCGCGAAATCCCTACCCTTGTCCCACACGATTTCTCCTGTTTCTCCGTTTGTTTCGATAAGTGGTCGCTTCCGAATCTCTCCATTGGCCAGTGTAATCTCGGTCTTGAAAAAATTCATAATATTGCTGTAAAAGAAGTACTTAGCGGTGGCCTTGCCTATTTCCTGCTCAGACTTTGCGATCATTTTCCTAACATCGTACACTTTATAGTCTCCGTAAACAAATTCAGATTCAAGCTTGGGATATTTTTTGATAAGTGCAGTGCCTACCACTGCATTCAGGTAGGCATCATGCGCATGGTGGTAATTGTTGATCTCTCTCACCTTATAAAACTGAAAGTCCTTTCTGAAATCTGAGACCAGCTTAGACTTCAGAGTAATAACTTTCACCTCTCGAATCAGTTTGTCATTTTCATCGTACTTGGTGTTCATGCGTGAATCGAGAATTTGGGCCACGTGCTTGGTGATCTGGCGTGTCTCAACAAGCTGCCTTTTGATGAAGCCGGCTTTATCCAACTCAGACAGGCCACCTCGTTCAGCCTTAGTCAGATTATCGAACTTCCGTTGTGTGATCAGTTTGGCGTTCAGCAGCTGCCGCCAATAATTTTTCATTTTCTTGACAACTTCTTCTGAGGGGACGTTATCACTCTTCCCTCTATTTTTATCGGATCTTGTCAACACTTTATTATCAATAGAATCATCTTTGAGAAAAGACTGGGGCACGATATGATCCACGTCGTAGTCGGAGAGCCGATTGATGTCCAGTTCCTGATCCACGTACATGTCCCTGCCGTTCTGCAGGTAGTACAGGTAGAGCTTCTCATTCTGAAGCTGGGTGTTTTCAACTGGGTGTTCCTTAAGGATTTGGGACCCCAGTTCTTTTATACCCTCTTCAATCCTCTTCATCCTTTCCCTACTGTTCTTCTGTCCCTTCTGGGTAGTTTGGTTCTCTCGGGCCATCTCGATAACGATATTCTCGGGCTTATGCCTTCCCATTACTTTGACGAGTTCATCCACGACCTTAACGGTCTGCAGTATTCCCTTTTTGATAGCTGGGCTACCTGCAAGATTAGCGATGTGCTCGTGAAGACTGTCCCCCTGGCCAGAAACTTGTGCTTTCTGGATGTCCTCCTTAAAGGTGAGAGAGTCATCATGGATCAACTGCATGAAGTTCCGGTTGGCAAATCCATCGGACTTAAGAAAATCCAGGATTGTCTTTCCACTCTGCTTGTCTCGGATCCCATTGATCAGTTTTCTTGACAGCCGCCCCCATCCTGTATATCGGCGCCTCTTGAGCTGTTTCATGACTTTGTCGTCGAAGAGATGAGCGTAAGTTTTCAAGCGTTCTTCAATCATCTCCCTATCTTCAAACAACGTAAGGGTGAGGACAATGTCCTCAAGAATGTCCTCGTTCTCCTCATTGTCCAGGAAGTCCTTGTCTTTAATGATTTTCAGGAGATCGTGATACGTTCCCAGGGATGCGTTGAAGCGATCCTCCACTCCGCTGATTTCAACAGAGTCGAAACATTCAATCTTTTTGAAATAGTCTTCTTTGAGCTGTTTCACGGTAACTTTCCGGTTCGTCTTGAAGAGGAGGTCCACGATAGCTTTCTTCTGCTCTCCAGACAGGAATGCTGGCTTTCTCATCCCTTCTGTGACGTATTTGACCTTGGTGAGCTCGTTATAAACTGTGAAGTACTCGTACAGCAGAGAGTGTTTAGGAAGCACCTTTTCGTTAGGCAGATTTTTATCAAAGTTAGTCATCCTTTCGATGAAGGACTGGGCAGAGGCCCCCTTATCCACGACTTCCTCGAAGTTCCAGGGAGTGATGGTCTCTTCTGATTTGCGAGTCATCCACGCGAATCTGGAATTTCCCCGGGCGAGGGGGCCTACATAGTAGGGTATCCGAAATGTGAGGATTTTCTCAATCTTTTCCCTGTTATCTTTCAAAAAGGGGTAGAAATCCTCTTGCCGCCTGAGGATAGCGTGCAGTTCGCCCAGGTGAATCTGGTGGGGGATGCTTCCATTGTCGAAAGTGCGCTGTTTGCGCAACAGATCTTCTCTGTTAAGCTTTACCAGCAGCTCCTCGGTGCCGTCCATTTTTTCCAAGATGGGCTTAATAAATTTGTAAAATTCCTCCTGGCTTGCTCCGCCGTCAATGTATCCGGCGTAGCCATTTTTAGACTGATCGAAGAAAATTTCCTTGTACTTCTCAGGCAGTTGCTGTCTGACAAGGGCCTTCAGCAAAGTCAAGTCTTGGTGGTGCTCATCATAGCGCTTGATCATACTAGCGCTCAGCGGAGCTTTGGTGATCTCCGTGTTCACTCGCAGAATATCACTCAGCAGAATGGCGTCTGACAGGTTCTTTGCCGCCAAAAAAAGGTCTGCGTACTGGTCGCCGATCTGGGCCAGCAGATTGTCGAGATCATCATCGTAGGTGTCTTTGCTCAGTTGAAGCTTGGCATCTTCGGCCAGGTCGAAGTTAGATTTAAAGTTGGGGGTCAGCCCGAGTGACAGGGCGATAAGATTACCAAACAGGCCGTTCTTCTTCTCCCCAGGGAGCTGTGCGATGAGGTTTTCGAGCCGCCGGGATTTGGACAGCCTAGCGCTCAGGATTGCTTTGGCGTCAACTCCGGATGCGTTGATCGGGTTCTCTTCGAAAAGCTGATTGTAAGTCTGAACCAGTTGGATAAAGAGTTTGTCGACATCGCTGTTGTCTGGGTTCAGGTCCCCCTCGATGAGGAAGTGTCCCCGAAATTTGATCATATGCGCCAGCGCGAGATAGATCAACCGCAAGTCAGCCTTATCAGTACTGTCTACAAGCTTCTTCCTCAGATGATATATGGTTGGGTACTTTTCATGGTACGCCACCTCGTCCACGATATTGCCAAAGATTGGGTGGCGCTCGTGCTTTTTATCCTCCTCCACCAAAAAGGACTCCTCCAGCCTATGGAAGAAAGAGTCATCCACCTTAGCCATCTCATTACTAAAGATCTCCTGCAGGTAGCAGATCCGATTCTTTCTGCGGGTATATCTGCGCCGTGCTGTTCTTTTGAGCCGCGTGGCTTCGGCCGTCTCCCCGGAGTCGAACAGGAGGGCGCCAATGAGGTTCTTCTTTATGCTGTGGCGATCGGTATTGCCCAGAACTTTGAATTTTTTGCTCGGCACCTTGTACTCGTCCGTAATGACGGCCCAGCCGACGCTGTTTGTGCCGATATCGAGCCCAATGGAGTACTTCTTGTCCATGGTGGCGGCTCTTGAAGGACGACGTCATCATCCCTTGCCCGGATGCGCGGGC
TTCTTGTCTAGCACAGGAGCCTGGGGTAGAGCGCATGCAAATTACGCGCTGTGCTTTGTGGGAAATCACCCTAAACGAAAAATTTATTCCTCTTTCGAGCCTTATAGTGGCGGCCGGTCTACATCCTAGGTTTTAGAGCTAGAAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTGTTAACGCGGCCGCCTAGAGTCGACCTGCAGGCATGCAAGC
TTGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCT
CACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAA
GATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGT
GTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCTAAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACGAGGCCCTTTCGTCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGCACCATAGCGGCCGCGGTTCTGTCTATAGGTAAGCTGACAAATAACAAATAGGCACATAGAAAATCTAGTAAGTAGTACCACCTGATATCTCACTTTGCT
GCAGGCAGGATTCCCCTCTGGCTCACTGGCAGTCTCCTCCGGTGTGGGCCAGGGCTCTTTGAAGTTGGATCTGAGCCTTTCTATCACCTGTTTGATGGACAAGCCCTTTTGCACAAGTTTGACTTCAAGGAGGGCCATGTCACATACCACAGAAGGTAAGTCCATGGTACCCACACAAAAAACCAACACACAG (SEQ ID NO:66)
mSPA_HDR SaCas9进入质粒
GCTTGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCTAAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACGAGGCCCTTTCGTCTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGCACCATAGCGGCCGCGGTACCCACACAAAAAACCAACACACAGATGTAATGAAAATAAAGATATTTTATTAGGCTGATCAGCGAGCTCTAGGAATTCTTAGGATCCCTTTTTCTTTTTTGCCTGGCCGGCCTTTTTCGTGGCCGCCGGCCTTTTGCCCTTTTTGATGATCTGAGGGTGCTTCTTAGATTTCACTTCATACAGGTTGCCCAGAATGTCTGTGCTGTACTTCTTAATGCTCTGGGTCTTGGAGGCGATTGTCTTAATGATCCTGGGGGGCCTCTTGTCGTTCATGTTTTCCAGGTACTCGCGGTAGGTGATGTCGATCATGTTCACTTCGATCCGGTTCAGCAGGTCGTTGTTCACGCCGATCACTCTATACAGCTCGCCGTTGATCTTGATCAGATCGTTGTTGTAGAAGGAGGCGATAAACTCGGCCTGGTTGCTGATCTTCTTCAGCTTCTTAGCTTCCTCATAGCACTTGCTATTCACTTCGTAGTAGTTTTCTTTTTTGATCACATCCAGATTCTTCACGGTCACGAACTTGTACACGCCATTGTCCAGGTACACGTCGAATCTGTAGGGCTTCAGGGACAGCTTCACGACCTTGTTTCTGCTGTTGGGGTAGTCGTCGGTGATGTCCAGATGGGCGTTCAGTTTGTTGCCGTAATACTTAATCTTCTTGATCACGGGGCCGTTGTCCTTTTTGGAGTACTTGGTCAGGTAGTTCCCGGTTTCCTCGTAGTACTTGTACAGGGGATTCTTCTCGTCGCCGTACTGTTCCATAATCAGCTTCAGTTTCTGGTAGGTCTGGGGGTCGTGGTGGTACATCAGCAGCTTTTCGGGGCTCTTGTTGATCAGCTTTTTCAGCTTGTCATTGTCCTTGTCGTACAGGCCGTTCAGATTGTTCACGATCAGGGTGTTGCCCTTGTCGTCCTTCCGGGTGGAGTACAGGGTGTCGTTAATCAGCTCTCTATTAGGCTTCTTGTCCACCCGGTGGCTGTACTTGTAGTCCTTGAAGTCCTTAATGTGCTTGATCTGGTGGGGGGTGATGAAGATCTCTTTGTACTCCTGCTCGGTTTCGATCTCGGGCATGCTCTCGGCCTGCTTTTCCTCGAACATCTGGTTTTCCATCACTTTTTTGGCCTTGTCCAGTTTCTTCCACTCTTTGAAGATGAAATCGGCGTTGGCAATGATCAGGGCGTCCTCGGCGTGGTGCTTGTACCCCTTGTTCCGCTCTTTCTTAAACTTCCACTTCCGCCGCAGAAAGCTGGTGAAGCCGCCATTGATGGACTTCACTTTCACGTCCAGGTTGTTCACTCTGAAGTAGCTCCGCAGCAGGTTCATCAGGCCTCTGGTGGCGTATCTGGTATCCACCAGGTTCCGGTTGATGAAGTCTTTCTGCACGGAGAACCTGTTGATGTCCCGTTCTTCCAGCAGATACTCTTTCTTGGTCTTGCTGATTCTGCCCTTGCCCTTGGCCAGATTCAGGATGTGCTTCTTGAAGGTTTCGTAGCTGATCTTGCTGTCGCTGCTGCTCAGGTACTGGAATGGGGTCCGGTTGCCCTTCTTGCTGTTTTCTTCCTGCTTCACGAGCACCTTGTTGTTGAAGCTGTTGTCGAAGGACACGCTTCTGGGGATGATGTGGTCCACCTCATAGTTGAAGGGGTTGTTCAGCAGATCTTCCAGAGGGATGGCTTCCAGGCTGTACAGGCACTTGCCTTCCTGCATGTCGTGCAGCTTGATCTTCTCGATCAGGTACTTGGCGTTCTCTTTGCCGGTGGTCCGGATGATTTCCTCGATCCGCTCGTTGGTCTGCCGGTTCCGCTTCTGCATCTCGTTGATCATTTTCTGGGCGTCCTTGGAGTTCTTCTCGCGGGCCAGCTCGATAATGATGTCGTTGGGCAGGCCGTACTTCTTGATGATGGCGTTGATCACTTTGATGCTCTGGATGAAGCTTCTCTTCACGACGGGGCTCAGGATGAAGTCGTCCACCAGGGTGGTGGGGATCTCTTTCTGCTGGGACAGGTCCACCTTCTTGGGCACCAGCTTCAGCCGGTTGAAGATAGCGATCTGGTTGTCGTTGGTGTGCCACAGCTCGTCCAGGATCAGGTTGATGGCCTTCAGGCTCAGGTTGTGGGTGCCGGTATAGCCCTTCAGATTAGAGATCTGCTCGATCTCTTCCTGGGTCAGCTCGGAGTTCAGATTGGTCAGTTCTTCCTGGATGTCCTCGCTGCTCTGGTAGATGGTCAGGATCTTGGCAATCTGATCCAGCAGCTCGGCGTTCTCAATAATCTCTTTCCGGGCGGTAATGTCCTTGATGTCGTGGTACACCTTCAGGTTGGTGAACTCGGGCTTGCCGGTGCTGGTCACTCTGTAGCCCTTAATATCCTCTTCGTTCACGAGGATTTCTTTGGCGATCTGCTTCAGGGTGGGCTTCTTCTTCTGCTTGAACACGTTCTCGATGATCTGGAACTTCTCGTAATATTCCAGCTTCTCGTTCTCGTCCCTGGTGATCACGAGATTGTTCAGGTCGTTCAGGGCGTTGTACAGGTCGGCGTTGTAGGCGTACTTCACGCTCCGCAGTTCCTCGGGGAAGTAGGTGCAGTGGCCCATCAGCATCTCGTACCATTCTTTGATGTCCTTCCAGCCGAAGGGGCTGCCCTCGCCAGGTCCCTCATAGTAGGTCCGCCGGGTTTCCAGCAGGTCGATGTAGGTGTCGATGAAGCTCTGGTCCAGCTGGTGGTAGGCCTTCTGCACCTTCAGCAGCTGTTTGGCTTCTTTCACGTAGTCGCTGGTCTTGAATCTGTTGATGCTGCCCCGCACTTCGCCGTCTTTCTTCAGCCGTTCCAGCTGCAGTTCGGCCACGTATTTCTCTTCCAGGGCCTTGCTGTTCCGGCTGATCTGCTCTTTGGTGGACAGCTCGTTGCCGGTGTCCTCTTCCACCTCGTTCACGTTGT
GCACGCCTCTTCTCTTGGCCAGGTGCAGCAGGGCGGCAGAGAACTCTTCCTCGCTCAGCTTCTGGCTCAGGCCCTTCACTCTGGCCTCGTAGGGGTTGATGCCGCTCAGCTCGCTGTGGTCGGTCAGCAGGTTGTAGTCGAACAGCAGCTTCTTCACTCTCTGGATTCTATGCCGCCTCCGCCGCTTCAGCCTTCTGGCGCCTCTCTTGCTCCGCCTGCCCTCGTTGTTTTCCACGTTGGCCTCTTTGAACAGCCGCACGCCGGCATCGATCACGTCCCGTGTCTCGTAGTCGATGATGCCGTAGCCCACGCTGGTGATGCCGATGTCCAGGCCCAGGATGTAGTTCCGCTTGGCTGCTGGGACTCCGTGGATACCGACCTTCCGCTTCTTCTTTGGGGCCATGTGGCGGCTCTTGAAGGACGACGTCATCATCCCTTGCCCGGATGCGCGGGCTTCTTGTCTAGCACAGGAGCCTGGGGTAGAGCGCATGCAAATTACGCGCTGTGCTTTGTGGGAAATCACCCTAAACGAAAAATTTATTCCTCTTTCGAGCCTTATAGTGGCGGCCGGTCTACATCCTAGGTTTTAGTACTCTGGAAACAGAATCTACTAAAACAAGGCAAAATGCCGTGTTTATCTCGTCAACTTGTTGGCGAGATTTTTTGTTAACGCGGCCGCCTAGAGTCGACCTGCAGGCATGCAA (SEQ ID NO:67)
参考文献
本说明书中提及的所有出版物、专利申请、专利和其他参考文献指示了本文公开主题所属领域的技术人员的水平。所有出版物、专利申请、专利和其他参考文献都通过引用并入本文,其程度如同每个个别出版物、专利申请、专利和其他参考文献明确地且个别地指出通过引用并入。应理解,尽管本文提及了许多专利申请、专利和其他参考文献,但此类参考文献并不构成承认这些文献中任一形成本领域公知常识的部分。
尽管为了清楚理解的目的已通过说明和实施例略微详细地描述了前述主题,但本领域技术人员应理解,可以在所附权利要求的范围内实践某些改变和修改。

Claims (152)

1.包含一种或多种载体的非天然存在的核酸酶系统,所述载体包含:
a)可操作地连接到至少一种编码核酸酶系统指导RNA(gRNA)的核苷酸序列的启动子,其中所述gRNA与细胞中的DNA分子或RNA分子的靶序列杂交,且其中所述DNA分子或RNA编码在所述细胞中表达的一种或多种基因产物;和
b)可操作地连接到编码基因组靶向核酸酶的核苷酸序列的在细胞中可操作的调节元件,
其中组分(a)和(b)位于所述系统的相同或不同载体上,其中所述gRNA靶向所述靶序列并与之杂交,且所述核酸酶切割所述DNA分子或RNA以改变所述一种或多种基因产物的表达。
2.权利要求1的系统,其中所述系统是CRISPR。
3.权利要求1的系统,其中所述系统被包装到单个腺相关病毒(AAV)颗粒中。
4.权利要求3的系统,其中所述腺相关包装病毒选自腺病毒血清型2、腺病毒血清型5或腺病毒血清型35。
5.权利要求7的系统,其中所述腺相关包装病毒是腺病毒血清型5。
6.权利要求1的系统,其中所述系统使一种或多种基因产物失活。
7.权利要求1的系统,其中所述核酸酶系统切除至少一个基因突变。
8.权利要求1的系统,其中所述启动子选自H1启动子、7sk、人RPPH1-PARP2、SRP-RPS29、7sk1-GSTA4、SNAR-G-1-CGB1、SNAR-CGB2、RMRP-CCDC107、tRNA(Lys)-ALOXE3、RNU6-9-MED16:tRNA(Gly)-DPP9、RNU6-2-THEM259、SNORD13-C8orf41、小鼠RPPH1-PARP2和大鼠RPPH1-PARP2。
9.权利要求8的系统,其中所述启动子是H1启动子。
10.权利要求9的系统,其中所述H1启动子包含与SEQ ID NO:12或32所示的核苷酸序列具有至少80%同一性的核苷酸序列。
11.权利要求10的系统,其中所述H1启动子包含具有SEQ ID NO:12所示的核苷酸序列的核苷酸序列。
12.权利要求10的系统,其中所述H1启动子包含具有SEQ ID NO:32所示的核苷酸序列的核苷酸序列。
13.权利要求9-12中任一项的系统,其中所述启动子与H1启动子直向同源。
14.权利要求13的系统,其中所述直向同源H1启动子衍生自小鼠或大鼠。
15.权利要求9-14中任一项的系统,其中所述H1启动子是双向的。
16.权利要求9-15中任一项的系统,其中所述H1启动子包含:
a)在至少一种编码gRNA的核苷酸序列的一个方向上提供转录的控制元件;和
b)在编码基因组靶向核酸酶的核苷酸序列的相反方向上提供转录的控制元件。
17.权利要求8的系统,其中所述启动子是7sk启动子。
18.权利要求17的系统,其中所述7sk启动子衍生自人、大鼠或小鼠。
19.权利要求17-18中任一项的系统,其中所述7sk启动子选自7sk1、7sk2和7sk3。
20.权利要求19的系统,其中所述7sk启动子是7sk1。
21.权利要求20的系统,其中所述7sk1衍生自人。
22.权利要求17-21中任一项的系统,其中所述人7sk1包含与SEQ ID NO:3所示的核苷酸序列具有至少80%同一性的核苷酸序列。
23.权利要求22的系统,其中所述人7sk1包含具有SEQ ID NO:3所示的核苷酸序列的核苷酸序列。
24.权利要求19的系统,其中所述7sk1衍生自小鼠。
25.权利要求24的系统,其中所述小鼠7sk1包含与SEQ ID NO:6具有至少80%同一性的核苷酸序列。
26.权利要求24-25中任一项的系统,其中所述小鼠7sk1包含具有SEQ ID NO:6所示的核苷酸序列的核苷酸序列。
27.权利要求19的系统,其中所述7sk启动子是7sk2。
28.权利要求27的系统,其中所述7sk2衍生自人。
29.权利要求28的系统,其中所述人7sk2包含与SEQ ID NO:4具有至少80%同一性的核苷酸序列。
30.权利要求29的系统,其中所述人7sk2包含具有SEQ ID NO:4所示的核苷酸序列的核苷酸序列。
31.权利要求27的系统,其中所述7sk2衍生自小鼠。
32.权利要求31的系统,其中所述小鼠7sk2包含与SEQ ID NO:7具有至少80%同一性的核苷酸序列。
33.权利要求32的系统,其中所述小鼠7sk2包含具有SEQ ID NO:7所示的核苷酸序列的核苷酸序列。
34.权利要求19的系统,其中所述7sk启动子是7sk3。
35.权利要求34的系统,其中所述7sk3衍生自人。
36.权利要求35的系统,其中所述人7sk3包含与SEQ ID NO:5具有至少80%同一性的核苷酸序列。
37.权利要求36的系统,其中所述人7sk3包含具有SEQ ID NO:5所示的核苷酸序列的核苷酸序列。
38.权利要求34的系统,其中所述7sk3衍生自小鼠。
39.权利要求38的系统,其中所述小鼠7sk3包含与SEQ ID NO:8具有至少80%同一性的核苷酸序列。
40.权利要求39的系统,其中所述小鼠7sk3包含具有SEQ ID NO:8所示的核苷酸序列的核苷酸序列。
41.权利要求8-40中任一项的系统,其中所述启动子具有至少一个修饰。
42.权利要求41的系统,其中所述启动子的至少一个修饰包括允许条件调节的元件。
43.权利要求42的系统,其中所述元件是tet响应性启动子。
44.权利要求43的系统,其中所述tet响应性启动子包含工程化到H1启动子中的Tet阻遏物(TetR)和Tet操纵子(TetO)。
45.权利要求44的系统,其中所述TetR包含与SEQ ID NO:14具有至少80%同一性的氨基酸序列。
46.权利要求45的系统,其中所述TetR包含具有SEQ ID NO:14所示的氨基酸序列的氨基酸序列。
47.权利要求45的系统,其中所述TetO包含与SEQ ID NO:11所示的核苷酸序列具有至少80%同一性的核苷酸序列。
48.权利要求47的系统,其中所述TetO包含具有SEQ ID NO:11所示的核苷酸序列的核苷酸序列。
49.权利要求44的系统,其中所述H1-TetO包含与SEQ ID NO:13所示的核苷酸序列具有至少80%同一性的核苷酸序列。
50.权利要求49的系统,其中所述H1-TetO包含具有SEQ ID NO:13所示的核苷酸序列的核苷酸序列。
51.权利要求41的系统,其中所述启动子的至少一个修饰包括允许自动调节的位点。
52.权利要求51的系统,其中所述自动调节位点包含与SEQ ID NO:33或34所示的核苷酸序列具有至少80%同一性的核苷酸序列。
53.权利要求52的系统,其中所述自动调节位点包含SEQ ID NO:33所示的核苷酸序列。
54.权利要求52的系统,其中所述自动调节位点包含SEQ ID NO:34所示的核苷酸序列。
55.权利要求1的系统,还包括至少一个终止子序列。
56.权利要求55的系统,其中所述至少一个终止子序列选自SV40或合成的聚A(SPA)序列。
57.权利要求56的系统,其中所述终止子序列是SV40 120(SEQ ID NO:123)或240(SEQID NO:122)碱基对序列。
58.权利要求56的系统,其中所述终止子序列是SPA 49碱基对序列。
59.权利要求1的系统,还包括5’非翻译区(5’UTR)序列。
60.权利要求1的系统,还包括Kozak序列。
61.权利要求60的系统,其中所述Kozak序列包含与SEQ ID NO:1或2具有至少80%同一性的核苷酸序列。
62.权利要求61的系统,其中所述Kozak序列包含SEQ ID NO:1所示的核苷酸序列。
63.权利要求61的系统,其中所述Kozak序列包含SEQ ID NO:2所示的核苷酸序列。
64.权利要求1的系统,其进一步包含介导不依赖于帽的翻译起始的RNA序列。
65.权利要求64的系统,其中所述RNA序列选自6.947或6.967。
66.权利要求1的系统,其中所述基因组靶向核酸酶是Cas9蛋白。
67.权利要求66的系统,其中所述Cas9包含与SEQ ID NO:61所示的核苷酸序列具有至少80%同一性的核苷酸序列。
68.权利要求67的系统,其中所述Cas9包含SEQ ID NO:61所示的核苷酸序列。
69.权利要求66-68中任一项的系统,其中所述Cas9包含至少一个修饰。
70.权利要求69的系统,其中所述Cas9中的至少一个修饰包括切割序列的改变。
71.权利要求70的系统,其中所述切割序列的改变选自T2A、P2A、E2A和F2A。
72.权利要求71的系统,其中所述T2A包含与SEQ ID NO:36所示的核苷酸序列具有至少80%同一性的氨基酸序列。
73.权利要求72的系统,其中所述T2A包含具有SEQ ID NO:36所示的核苷酸序列的氨基酸序列。
74.权利要求71的系统,其中所述P2A包含与SEQ ID NO:35所示的核苷酸序列具有至少80%同一性的氨基酸序列。
75.权利要求74的系统,其中所述P2A包含具有SEQ ID NO:35所示的核苷酸序列的氨基酸序列。
76.权利要求71的系统,其中所述E2A包含与SEQ ID NO:37所示的核苷酸序列具有至少80%同一性的氨基酸序列。
77.权利要求76的系统,其中所述E2A包含具有SEQ ID NO:37所示的核苷酸序列的氨基酸序列。
78.权利要求71的系统,其中所述F2A包含与SEQ ID NO:38所示的核苷酸序列具有至少80%同一性的氨基酸序列。
79.权利要求78的系统,其中所述F2A包含具有SEQ ID NO:38所示的核苷酸序列的氨基酸序列。
80.权利要求69的系统,其中所述Cas9中的至少一个修饰包括针对在细胞中表达而优化的密码子。
81.权利要求66-80中任一项的系统,其中所述Cas9还包含在框内与细胞周期依赖性蛋白质可操作地融合的接头序列(Cas9融合物)。
82.权利要求81的系统,其中所述细胞周期依赖性蛋白质选自APE2、ATR、BRCA1、Chk1、Cdc5、Cdc6、Cdc7、Cdc45、Cdt1、CSA、CSB、Ctf18、DDB1、DDB2、DNA2、DUT、Elg1、EndoV、Esp1、核酸外切酶1、FBH1、FEN1、孪蛋白、Hus1、KNTC2(NDC80)、Ku80、连接酶1、Mad2、MBD4、Mcm3、Mcm4、Mcm5、Mcm6、Mcm7、Mcm8、Mcm10、MGMT、MLH3、Mms4、MPG、MSH2、Mus81、NBS1、NEIL2、NEIL3、NTH1、Orc1、Orc3、PARP1、PCNA、Pif1、PMS1、PMS2、PNK、Pola p180、Pola p70、PolaSpp1(Prim2a)、Polb、Pold p125、Pole Dpb3、Pole Dpb4、Pole Pol2、Poli、Poll、Polm、Psf1、Psf2、Psf3、Rad1、Rad18、Rad23A、Rad23B、Rad51、Rad51D、Rad54、Rad6A、RPA34、RPA70、Scc1、Scc3、Sir2、SIRT1(Sirtuin)、TDG、TDP1、TIMELESS、Tin2、拓扑异构酶I、拓扑异构酶IIIa、拓扑异构酶IIIb、Ubc13、UNG、XAB2、XPC、XPF、XPG、Xrcc2和XRCC4。
83.权利要求82的系统,其中所述细胞周期依赖性蛋白质是孪蛋白。
84.权利要求83的系统,其中所述细胞周期依赖性蛋白质是人孪蛋白。
85.权利要求84的系统,其中所述人孪蛋白包含位置1-110的氨基酸(hGem(1-110))。
86.权利要求85的系统,其中所述hGem(1-110)包含与SEQ ID NO:19所示的氨基酸序列具有至少80%同一性的氨基酸序列。
87.权利要求86的系统,其中所述hGem(1-110)包含SEQ ID NO:19所示的氨基酸序列。
88.权利要求82的系统,其中所述细胞周期依赖性蛋白质是Cdt1。
89.权利要求88的系统,其中所述细胞周期依赖性蛋白质是人Cdt1。
90.权利要求90的系统,其中所述人Cdt1包含位置30-120的氨基酸(hCdt1(30-120))。
91.权利要求91的系统,其中所述hCdt1(30-120)包含与SEQ ID NO:18所示的氨基酸序列具有至少80%同一性的氨基酸序列。
92.权利要求92的系统,其中hCdt1(30-120)包含SEQ ID NO:18所示的氨基酸序列。
93.权利要求81-93中任一项的系统,其中所述Cas9融合物包含与选自SEQ ID NO:20-27的氨基酸序列具有至少80%同一性的氨基酸序列。
94.权利要求94的系统,其中所述Cas9融合物包含选自SEQ ID NO:20-27的氨基酸序列。
95.权利要求66-95中任一项的系统,其中所述Cas9在框内与遍在蛋白可操作地融合(Ub-Cas9)。
96.权利要求96的系统,其中所述Ub-Cas9具有至少一个N末端修饰。
97.权利要求97的系统,其中所述N末端修饰的Ub-Cas9包含与选自SEQ ID NO:39-58的氨基酸序列具有至少80%同一性的氨基酸序列。
98.权利要求98的系统,其中所述N末端修饰的Ub-Cas9包含选自SEQ ID NO:39-58的氨基酸序列。
99.权利要求96的系统,其中所述遍在蛋白包含与SEQ ID NO:60所示的核苷酸序列具有至少80%同一性的核苷酸序列。
100.权利要求100的系统,其中所述遍在蛋白包含SEQ ID NO:60所示的核苷酸序列。
101.权利要求1的系统,还包括SaCas9切口酶。
102.权利要求102的系统,还包括供体模板序列。
103.权利要求102-103中任一项的系统,其中所述至少一种载体包含与SEQ ID NO:62或67所示的核苷酸序列具有至少80%同一性的核苷酸序列。
104.权利要求104的系统,其中所述至少一种载体包含SEQ ID NO:62所示的核苷酸序列。
105.权利要求104的系统,其中所述至少一种载体包含SEQ ID NO:67所示的核苷酸序列。
106.权利要求103-106中任一项的系统,其中所述供体模板序列校正至少一个基因突变。
107.权利要求107的系统,其中所述至少一个基因突变是rd10或rd12。
108.权利要求108的系统,其中所述至少一种载体包含与SEQ ID NO:63或64所示的核苷酸序列具有至少80%同一性的核苷酸序列。
109.权利要求109的系统,其中所述至少一种载体包含SEQ ID NO:63所示的核苷酸序列。
110.权利要求109的系统,其中所述至少一种载体包含SEQ ID NO:64所示的核苷酸序列。
111.权利要求108的系统,其中所述至少一种载体包含与SEQ ID NO:65或66所示的核苷酸序列具有至少80%同一性的核苷酸序列。
112.权利要求112的系统,其中所述至少一种载体包含SEQ ID NO:65所示的核苷酸序列。
113.权利要求112的系统,其中所述至少一种载体包含SEQ ID NO:66所示的核苷酸序列。
114.权利要求8-54中任一项的系统,其中所述启动子可操作地连接到至少一个、两个、三个、四个、五个、六个、七个、八个、九个或十个gRNA。
115.权利要求1的系统,其中所述靶序列包含核苷酸序列AN19NGG、GN19NGG、CN19NGG或TN19NGG。
116.权利要求1的系统,其中所述细胞是真核或非真核细胞。
117.权利要求117的系统,其中所述真核细胞是哺乳动物或人细胞。
118.权利要求5的系统,其中所述真核细胞是视网膜感光细胞。
119.权利要求1的系统,其中所述一种或多种基因产物是视紫红质。
120.权利要求1的系统,其中所述一种或多种基因产物的表达降低。
121.一种改变细胞中一种或多种基因产物的表达的方法,其中所述细胞包含编码所述一种或多种基因产物的DNA分子,所述方法包括将权利要求1的非天然存在的核酸酶系统引入所述细胞。
122.权利要求122的方法,其中所述系统使一种或多种基因产物失活。
123.权利要求122的方法,其中所述核酸酶系统切除至少一个基因突变。
124.权利要求122的方法,其中所述一种或多种基因产物的表达降低。
125.权利要求122的方法,其中所述细胞是真核或非真核细胞。
126.权利要求126的方法,其中所述真核细胞是哺乳动物或人细胞。
127.权利要求122的方法,其中所述细胞是视网膜感光细胞。
128.权利要求122的方法,其中所述细胞是视网膜神经节细胞。
129.权利要求127的方法,其中所述真核细胞是癌细胞。
130.权利要求130的方法,其中在所述癌细胞中抑制或减少细胞增殖。
131.权利要求130的方法,其中在所述癌细胞中增强或增加细胞凋亡。
132.一种治疗有需要的受试者中的选自视网膜营养不良、角膜营养不良、微卫星扩张疾病和癌症的疾病的方法,所述方法包括:
(a)提供权利要求1的非天然存在的核酸酶系统;和
(b)向所述受试者施用有效量的所述系统。
133.权利要求133的方法,其中所述疾病是角膜营养不良。
134.权利要求133的方法,其中所述疾病是视网膜营养不良。
135.权利要求133的方法,其中所述视网膜营养不良选自利伯氏先天性黑蒙(LCA)、视网膜色素变性(RP)和青光眼。
136.权利要求133的方法,其中所述角膜营养不良选自上皮基底膜营养不良、上皮复发性糜烂营养不良、上皮下粘液性角膜营养不良、遗传性青少年性角膜上皮营养不良、Lisch上皮角膜营养不良、凝胶状滴状角膜营养不良、雷-布二氏角膜营养不良、Thiel–Behnke角膜营养不良、格子状角膜营养不良1型(经典)、格子状角膜营养不良2型、格子状角膜营养不良III型、格子状角膜营养不良IIIA型、格子状角膜营养不良I/IIIA型、格子状角膜营养不良IV型、多形性(角膜)淀粉样变性、颗粒状角膜营养不良1型、颗粒状角膜营养不良2型、黄斑角膜营养不良、Schnyder角膜营养不良、先天性基质角膜营养不良、斑点状角膜营养不良、后部无定形角膜营养不良、弗朗索瓦中央云雾状营养不良、德斯密膜前角膜营养不良、富克斯内皮角膜营养不良、多形性角膜后层营养不良、先天性遗传性内皮营养不良和X连锁内皮角膜营养不良。
137.权利要求133的方法,其中所述微卫星扩张疾病选自睑裂狭小、上睑下垂和倒转型内眦赘皮并指、颅骨锁骨发育不良、先天性中枢肺换气不足综合征、Haddad综合征DM(强直性肌营养不良)、FRAXA(脆性X综合征)、FRAXE(脆性XE智力低下)、FRDA(弗里德赖希氏共济失调)、富克斯内皮角膜营养不良、FXTAS(脆性X相关震颤/共济失调综合征)、手足生殖器综合征、HD(亨廷顿病)、前脑无裂畸形、智力低下伴生长激素缺乏、智力低下、癫痫、韦斯特综合征、帕廷综合征、眼咽肌营养不良、SBMA(脊髓和延髓肌肉萎缩症)、SCA1(脊髓小脑性共济失调1型)、SCA12(脊髓小脑性共济失调12型)、SCA17(脊髓小脑性共济失调17型)、SCA2(脊髓小脑性共济失调2型)、SCA3(脊髓小脑性共济失调3型或马-约病)、SCA6(脊髓小脑性共济失调6型)、SCA7(脊髓小脑性共济失调7型)、SCA8(脊髓小脑性共济失调8型)和并指。
138.权利要求133的方法,其中通过植入、注射或病毒进行向所述受试者施用。
139.权利要求139的方法,其中通过视网膜下注射进行向所述受试者施用。
140.权利要求133的方法,其中局部、血管内、皮内、透皮、胃肠外、静脉内、肌肉内、鼻内、皮下、区域、经皮、气管内、腹膜内、动脉内、膀胱内、肿瘤内、肿瘤周围、吸入、全身、灌注、灌洗、经由注射直接、或经由施用和制剂口服进行向所述受试者施用。
141.权利要求141的方法,其中向所述受试者施用局部发生在眼睛表面。
142.权利要求133的方法、其中向所述受试者施用发生在角膜、巩膜之上或之外,眼内、结膜下、筋膜下或眼球后空间,或眼睑内或周围。
143.权利要求133的方法,其中所述受试者用至少一种另外的抗癌剂治疗。
144.权利要求134的方法,其中所述抗癌剂选自紫杉醇、顺铂、托泊替康、吉西他滨、博来霉素、依托泊苷、卡铂、多西他赛、多柔比星、托泊替康、环磷酰胺、曲贝替定、奥拉帕利、他莫昔芬、来曲唑和贝伐单抗。
145.权利要求144-145中任一项的方法,其中所述受试者用至少一种另外的抗癌疗法治疗。
146.权利要求146的方法,其中所述抗癌疗法是放射疗法、化学疗法或手术。
147.权利要求133的方法,其中所述癌症是实体瘤。
148.权利要求133的方法,其中所述癌症选自脑癌、胃肠癌、口腔癌、乳腺癌、卵巢癌、前列腺癌、胰腺癌、肺癌、肝癌、咽喉癌、胃癌和肾癌。
149.权利要求149的方法,其中所述癌症是脑癌。
150.权利要求141的方法,其中所述全身施用选自口服、静脉内、皮内、腹膜内、皮下和肌肉内施用。
151.权利要求133-153中任一项的方法,其中所述受试者是哺乳动物。
152.权利要求154的方法,其中所述哺乳动物是人。
CN201780054074.5A 2016-07-05 2017-07-05 包括使用h1启动子对crispr指导rna的改进的组合物和方法 Pending CN109844116A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662358335P 2016-07-05 2016-07-05
US62/358335 2016-07-05
PCT/US2017/040707 WO2018009534A1 (en) 2016-07-05 2017-07-05 Compositions and methods comprising improvements of crispr guide rnas using the h1 promoter

Publications (1)

Publication Number Publication Date
CN109844116A true CN109844116A (zh) 2019-06-04

Family

ID=60912275

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780054074.5A Pending CN109844116A (zh) 2016-07-05 2017-07-05 包括使用h1启动子对crispr指导rna的改进的组合物和方法

Country Status (14)

Country Link
US (1) US11766488B2 (zh)
EP (1) EP3481956A4 (zh)
JP (2) JP2019520078A (zh)
KR (1) KR20190039702A (zh)
CN (1) CN109844116A (zh)
AU (2) AU2017292667A1 (zh)
BR (1) BR112019000055A2 (zh)
CA (1) CA3029860A1 (zh)
CL (1) CL2019000025A1 (zh)
EA (1) EA201990213A1 (zh)
IL (1) IL264020A (zh)
MX (1) MX2019000251A (zh)
SG (1) SG11201900038QA (zh)
WO (1) WO2018009534A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110607302A (zh) * 2019-10-09 2019-12-24 广州医科大学附属第二医院 检测花生四烯酸脂氧合酶aloxe3基因启动子突变的方法及其应用
CN110622921A (zh) * 2019-09-29 2019-12-31 镇江杰胜瑞科技有限公司 阿尔茨海默病病变区FoxG1过表达小鼠模型的构建方法及应用
CN111718933A (zh) * 2020-06-28 2020-09-29 暨南大学 一种rrbp1基因敲除热带爪蛙模型的制备方法与应用

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3688159A4 (en) * 2017-09-26 2021-10-20 The Board of Trustees of the University of Illinois CRISPR / CAS SYSTEM AND PROCESS FOR GENOME EDITING AND TRANSCRIPT MODULATION
CA3082450A1 (en) 2017-11-21 2019-05-31 Crispr Therapeutics Ag Materials and methods for treatment of autosomal dominant retinitis pigmentosa
CN108728441B (zh) * 2018-04-18 2022-07-22 深圳市第二人民医院 特异性识别p53突变的基因系统
EP3794130A4 (en) 2018-05-16 2022-07-27 Synthego Corporation METHODS AND SYSTEMS FOR DESIGN AND USE OF GUIDE RNA
JPWO2019225638A1 (ja) * 2018-05-25 2021-07-29 国立大学法人 筑波大学 融合タンパク質、核酸、細胞及び動物の製造方法
JPWO2020059708A1 (ja) * 2018-09-17 2021-09-02 国立大学法人 東京医科歯科大学 Casタンパク質の活性調節法
KR20210091167A (ko) 2018-10-16 2021-07-21 블루알렐, 엘엘씨 유전자에서 dna의 표적화 삽입을 위한 방법
AU2019370297A1 (en) * 2018-11-01 2021-05-27 Blueallele Corporation Methods for altering gene expression for genetic disorders
US20220112516A1 (en) * 2018-11-08 2022-04-14 National University Corporation Tokai National Higher Education And Research System Gene therapy employing genome editing with single aav vector
EP3990636A1 (en) * 2019-06-28 2022-05-04 CRISPR Therapeutics AG Materials and methods for controlling gene editing
CN114096667A (zh) * 2019-07-08 2022-02-25 因思科瑞普特公司 经由LexA-Rad51融合蛋白增加核酸指导的细胞编辑
WO2022212768A2 (en) * 2021-03-31 2022-10-06 Hunterian Medicine Llc Compact promoters for gene editing
WO2023120536A1 (ja) * 2021-12-21 2023-06-29 国立大学法人東海国立大学機構 単一のaavベクターによるゲノム編集を用いた遺伝子治療

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014197748A2 (en) * 2013-06-05 2014-12-11 Duke University Rna-guided gene editing and gene regulation
WO2015195621A1 (en) * 2014-06-16 2015-12-23 The Johns Hopkins University Compositions and methods for the expression of crispr guide rnas using the h1 promoter
WO2016057961A1 (en) * 2014-10-10 2016-04-14 Editas Medicine, Inc. Compositions and methods for promoting homology directed repair

Family Cites Families (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4217344A (en) 1976-06-23 1980-08-12 L'oreal Compositions containing aqueous dispersions of lipid spheres
US4198626A (en) 1977-09-02 1980-04-15 Rauscher Frank J Intravenous alarm device
US4235871A (en) 1978-02-24 1980-11-25 Papahadjopoulos Demetrios P Method of encapsulating biologically active materials in lipid vesicles
US4186183A (en) 1978-03-29 1980-01-29 The United States Of America As Represented By The Secretary Of The Army Liposome carriers in chemotherapy of leishmaniasis
US4261975A (en) 1979-09-19 1981-04-14 Merck & Co., Inc. Viral liposome particle
US4485054A (en) 1982-10-04 1984-11-27 Lipoderm Pharmaceuticals Limited Method of encapsulating biologically active materials in multilamellar lipid vesicles (MLV)
US4501728A (en) 1983-01-06 1985-02-26 Technology Unlimited, Inc. Masking of liposomes from RES recognition
US4897355A (en) 1985-01-07 1990-01-30 Syntex (U.S.A.) Inc. N[ω,(ω-1)-dialkyloxy]- and N-[ω,(ω-1)-dialkenyloxy]-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US5049386A (en) 1985-01-07 1991-09-17 Syntex (U.S.A.) Inc. N-ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)Alk-1-YL-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4946787A (en) 1985-01-07 1990-08-07 Syntex (U.S.A.) Inc. N-(ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor
US4797368A (en) 1985-03-15 1989-01-10 The United States Of America As Represented By The Department Of Health And Human Services Adeno-associated virus as eukaryotic expression vector
US4774085A (en) 1985-07-09 1988-09-27 501 Board of Regents, Univ. of Texas Pharmaceutical administration systems containing a mixture of immunomodulators
US4837028A (en) 1986-12-24 1989-06-06 Liposome Technology, Inc. Liposomes with enhanced circulation time
US4873316A (en) 1987-06-23 1989-10-10 Biogen, Inc. Isolation of exogenous recombinant proteins from the milk of transgenic mammals
US4931777A (en) 1988-11-16 1990-06-05 Chiang Cheng San Low level alarm for drop-feed injection liquid
US5264618A (en) 1990-04-19 1993-11-23 Vical, Inc. Cationic lipids for intracellular delivery of biologically active molecules
WO1991017424A1 (en) 1990-05-03 1991-11-14 Vical, Inc. Intracellular delivery of biologically active substances by means of self-assembling lipid complexes
US5173414A (en) 1990-10-30 1992-12-22 Applied Immune Sciences, Inc. Production of recombinant adeno-associated virus vectors
US5112319A (en) 1991-05-14 1992-05-12 Eric Lai Infusion alarm system
US5587308A (en) 1992-06-02 1996-12-24 The United States Of America As Represented By The Department Of Health & Human Services Modified adeno-associated virus vector capable of expression from a novel promoter
US6121555A (en) 1997-10-10 2000-09-19 Northgate Technologies Incorporated Fluid container sensor
US7750817B2 (en) 1999-12-10 2010-07-06 Beverage Metrics Holding Ltd System and method using a scale for monitoring the dispensing of a beverage
JP2001343294A (ja) 2000-05-31 2001-12-14 Ishida Co Ltd ロードセル及び秤
GB0130955D0 (en) * 2001-12-24 2002-02-13 Cancer Res Ventures Expression system
US7180015B2 (en) 2004-09-24 2007-02-20 Hudson Douglas A Scale with clampable protrusion for weighing bicycles and other sports-related items
US10022457B2 (en) * 2005-08-05 2018-07-17 Gholam A. Peyman Methods to regulate polarization and enhance function of cells
US20070106177A1 (en) 2005-10-11 2007-05-10 Yoshito Hama Apparatus for collecting and calculating quantity of patient fluid loss and method of using same
US20080293142A1 (en) * 2007-04-19 2008-11-27 The Board Of Regents For Oklahoma State University Multiple shRNA Expression Vectors and Methods of Construction
KR101196701B1 (ko) 2009-07-16 2012-11-07 주식회사 실티 가축용 자동 급수장치
US8889394B2 (en) 2009-09-07 2014-11-18 Empire Technology Development Llc Multiple domain proteins
US8797166B2 (en) 2011-05-27 2014-08-05 Pet Wireless Llc Systems, methods and computer program products for monitoring the behavior, health, and/or characteristics of an animal
US20150251894A1 (en) 2014-03-06 2015-09-10 Julie Barbara Lake Transportable Device for Automatically Filling Water Buckets, Troughs and Containers
EP3553176A1 (en) * 2014-03-10 2019-10-16 Editas Medicine, Inc. Crispr/cas-related methods and compositions for treating leber's congenital amaurosis 10 (lca10)
AU2015236128A1 (en) 2014-03-25 2016-11-10 Editas Medicine Inc. CRISPR/CAS-related methods and compositions for treating HIV infection and AIDS
EP2982758A1 (en) 2014-08-04 2016-02-10 Centre Hospitalier Universitaire Vaudois (CHUV) Genome editing for the treatment of huntington's disease
WO2016054225A1 (en) * 2014-09-30 2016-04-07 Stc.Unm Plasmid delivery in the treatment of cancer and other disease states
JP6879910B2 (ja) * 2014-10-31 2021-06-02 ザ トラスティーズ オブ ザ ユニバーシティ オブ ペンシルバニア Cart細胞における遺伝子発現の改変およびその使用
WO2016073990A2 (en) 2014-11-07 2016-05-12 Editas Medicine, Inc. Methods for improving crispr/cas-mediated genome-editing
CN104531632A (zh) * 2014-11-18 2015-04-22 李云英 快速降解的Cas9-ODC422-461融合蛋白及其应用
WO2016106244A1 (en) 2014-12-24 2016-06-30 The Broad Institute Inc. Crispr having or associated with destabilization domains
CN204440762U (zh) 2015-02-09 2015-07-01 刘苹芳 阿基米德原理演示仪
WO2016210271A1 (en) * 2015-06-24 2016-12-29 Sigma-Aldrich Co. Llc Cell cycle dependent genome regulation and modification
GB2541459B (en) 2015-08-21 2021-01-13 Carton Bernard A method and system for monitoring pregnancy toxaemia

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014197748A2 (en) * 2013-06-05 2014-12-11 Duke University Rna-guided gene editing and gene regulation
WO2015195621A1 (en) * 2014-06-16 2015-12-23 The Johns Hopkins University Compositions and methods for the expression of crispr guide rnas using the h1 promoter
WO2016057961A1 (en) * 2014-10-10 2016-04-14 Editas Medicine, Inc. Compositions and methods for promoting homology directed repair

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
RANGANATHAN,V.等: "Expansion of the CRISPR-Cas9 genome targeting space through the use of H1 promoter-expressed guide RNAs", 《NATURE COMMUNICATIONS》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110622921A (zh) * 2019-09-29 2019-12-31 镇江杰胜瑞科技有限公司 阿尔茨海默病病变区FoxG1过表达小鼠模型的构建方法及应用
CN110607302A (zh) * 2019-10-09 2019-12-24 广州医科大学附属第二医院 检测花生四烯酸脂氧合酶aloxe3基因启动子突变的方法及其应用
CN111718933A (zh) * 2020-06-28 2020-09-29 暨南大学 一种rrbp1基因敲除热带爪蛙模型的制备方法与应用

Also Published As

Publication number Publication date
KR20190039702A (ko) 2019-04-15
JP2019520078A (ja) 2019-07-18
CL2019000025A1 (es) 2019-06-21
CA3029860A1 (en) 2018-01-11
JP2022153576A (ja) 2022-10-12
BR112019000055A2 (pt) 2019-04-02
EA201990213A1 (ru) 2019-11-29
AU2023266246A1 (en) 2023-12-07
AU2017292667A1 (en) 2019-02-21
US20190314521A1 (en) 2019-10-17
SG11201900038QA (en) 2019-02-27
EP3481956A1 (en) 2019-05-15
MX2019000251A (es) 2019-10-09
US11766488B2 (en) 2023-09-26
IL264020A (en) 2019-02-03
EP3481956A4 (en) 2020-07-08
WO2018009534A1 (en) 2018-01-11

Similar Documents

Publication Publication Date Title
CN109844116A (zh) 包括使用h1启动子对crispr指导rna的改进的组合物和方法
JP6960951B2 (ja) 配列操作のための系、方法および最適化ガイド組成物のエンジニアリング
JP7090775B2 (ja) 遺伝子産物の発現を変更するためのCRISPR-Cas系および方法
JP7094323B2 (ja) 最適化機能CRISPR-Cas系による配列操作のための系、方法および組成物
AU2016326711B2 (en) Use of exonucleases to improve CRISPR/Cas-mediated genome editing
CN106852157B (zh) 用于使用h1启动子表达crispr向导rna的组合物和方法
US20200080108A1 (en) Crispr/cas9-based compositions and methods for treating retinal degenerations
EP3180426A1 (en) Genome editing using cas9 nickases
EP3080257A1 (en) Compositions and methods of use of crispr-cas systems in nucleotide repeat disorders
KR20150105956A (ko) 서열 조작 및 치료적 적용을 위한 시스템, 방법 및 조성물의 전달, 유전자 조작 및 최적화
CN113355357A (zh) 对用于序列操纵的改进的系统、方法和酶组合物进行的工程化和优化
JP2020511931A (ja) 改良された遺伝子編集

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination