CN110612113A - 单倍体机能不全的基因疗法 - Google Patents

单倍体机能不全的基因疗法 Download PDF

Info

Publication number
CN110612113A
CN110612113A CN201880023129.0A CN201880023129A CN110612113A CN 110612113 A CN110612113 A CN 110612113A CN 201880023129 A CN201880023129 A CN 201880023129A CN 110612113 A CN110612113 A CN 110612113A
Authority
CN
China
Prior art keywords
ser
leu
seq
pro
gly
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201880023129.0A
Other languages
English (en)
Other versions
CN110612113B (zh
Inventor
N·阿黑度威
N·玛莎鲁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of California
Original Assignee
University of California
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of California filed Critical University of California
Priority to CN202410279202.8A priority Critical patent/CN118370844A/zh
Publication of CN110612113A publication Critical patent/CN110612113A/zh
Application granted granted Critical
Publication of CN110612113B publication Critical patent/CN110612113B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0066Manipulation of the nucleic acid to modify its expression pattern, e.g. enhance its duration of expression, achieved by the presence of particular introns in the delivered nucleic acid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/17Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • A01K67/0276Knock-out vertebrates
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0008Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition
    • A61K48/0016Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition wherein the nucleic acid is delivered as a 'naked' nucleic acid, i.e. not combined with an entity such as a cationic lipid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P13/00Drugs for disorders of the urinary system
    • A61P13/12Drugs for disorders of the urinary system of the kidneys
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • A61P25/08Antiepileptics; Anticonvulsants
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • A61P25/28Drugs for disorders of the nervous system for treating neurodegenerative disorders of the central nervous system, e.g. nootropic agents, cognition enhancers, drugs for treating Alzheimer's disease or other forms of dementia
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P27/00Drugs for disorders of the senses
    • A61P27/02Ophthalmic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P3/00Drugs for disorders of the metabolism
    • A61P3/04Anorexiants; Antiobesity agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/075Animals genetically altered by homologous recombination inducing loss of function, i.e. knock out
    • A01K2217/077Animals genetically altered by homologous recombination inducing loss of function, i.e. knock out heterozygous knock out animals displaying phenotype
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/035Animal model for multifactorial diseases
    • A01K2267/0362Animal model for lipid/glucose metabolism, e.g. obesity, type-2 diabetes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Pharmacology & Pharmacy (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Neurology (AREA)
  • Neurosurgery (AREA)
  • Epidemiology (AREA)
  • Environmental Sciences (AREA)
  • Diabetes (AREA)
  • Obesity (AREA)
  • Child & Adolescent Psychology (AREA)
  • Hematology (AREA)
  • Animal Husbandry (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Virology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Psychiatry (AREA)

Abstract

提供了用于激活哺乳动物细胞中的转录的方法和组合物。

Description

单倍体机能不全的基因疗法
相关申请的交叉引用
本申请要求于2017年2月7日提交的美国临时申请62/455,988号的优先权,其通过引用纳入本文用于所有目的。
联邦资助的研究与开发下作出发明的权利声明
本发明是在政府支持下由国家卫生研究院授予的基金号R01 DK090382资助完成。政府对本发明拥有一定的权利。
提交序列表的引用
本申请包括2018年2月6日生成的名为“081906-224410PC-1072775_SequenceListing.txt”的文本文件的序列表并且含有107kb。该文本文件中包含的材料通过引用全文纳入用于所有目的。
发明领域
本公开一般涉及用于激活哺乳动物细胞中的转录的方法和组合物。
背景技术
导致一种或多种基因或基因产物的转录或活性降低的基因组改变是无数哺乳动物疾病的致病因素。一种这样的基因组改变是单倍体机能不全(haploinsufficiency),其中只有一个基因的功能性拷贝,并且单个拷贝不产生足够的基因产物以产生野生型表型。其他疾病是由改变基因产物的基因的一个或两个拷贝中的基因组改变引起的,因此它表现出活性的降低但不消除。在其他疾病中,基因组改变降低基因的一个或两个拷贝的转录或降低转录物稳定性,使得基因产物不足以产生野生型表型。已经尝试了许多方法通过增加转录或活性降低的一种或多种基因的量或活性来治疗这些疾病。这些方法包括将一种或多种基因的野生型拷贝递送到基因组中。最近,已经使用基于聚集的规则间隔短回文重复序列(CRISPR),锌指核酸酶(ZFN)(参见,Urnov等,Nat.Rev.Genet.,11:636-646(2010))或转录激活因子样效应核酸酶(TALEN)(参见Joung和Sander,Nat.Rev.Mol.Cell Biol.,1:49-55(2013))的方法和组合物证明了基因组内靶向引入。用于增加一种或多种靶基因的转录的其他方法包括使用促进组成型剪接的反义寡聚体(参见,US 2016/0298121)。然而,仍然需要用于增加靶基因转录的替代方法和组合物,以治疗由其转录,数量或活性减少引起的疾病。
发明概述
本发明涉及用于增加哺乳动物(例如人)对象中靶基因转录的方法和组合物。发明人已经发现,这种增加的转录可以通过靶向基因的启动子或增强子区域的转录激活向导-RNA(gRNA)构建体(例如,作为dCAS9/gRNA复合物的一部分)来实现。此外,本发明人已经发现,可以用非整合载体实现足以治疗疾病的量和时间的转录激活。在一些情况下,用于转录激活的方法和组合物不通过内切核酸酶切割,切口和/或修复来共价修饰宿主哺乳动物的基因组。在一些情况下,非整合载体是附加型载体,例如腺相关病毒载体。
在一个方面,本发明提供治疗哺乳动物对象中单倍体功能不全疾病的方法,该方法包括使对象的细胞与组合物接触,所述组合物包含:i)向导RNA,其中所述向导RNA包含:a)靶向区域,其在所述细胞的核中存在的条件下,与和单倍体机能不全的基因的野生型拷贝操作性地连接的启动子区域或增强子区域特异性杂交;和b)CRISPR核酸酶结合区域,其在所述细胞的核中存在的条件下特异性结合CRISPR核酸酶,或特异性结合CRISPR核酸酶结合区域的区域;和ii)CRISPR核酸酶,-其中接触形成包含与向导RNA结合的CRISPR核酸酶的复合物,其中复合物中向导RNA的靶向区域与所述启动子或增强子杂交;-其中复合物包含催化失活的CRISPR核酸酶和转录激活结构域,并且-其中复合物以足以治疗对象中的单倍体机能不全疾病的量和持续时间激活单倍体机能不全的基因的野生型拷贝的转录。在一些实施方式中,用获自对象的宿主细胞治疗哺乳动物对象。在一个实施方式中,用获自不同(其他)哺乳动物对象的宿主细胞治疗哺乳动物对象。在一些实施方式中,宿主细胞是分离的哺乳动物宿主细胞。在另一个实施方式中,宿主细胞包含分离的哺乳动物宿主细胞,其具有靶基因的一个功能性拷贝。
在一些实施方式中,接触包括使细胞与编码向导RNA或CRISPR核酸酶的附加型载体接触。在一些实施方式中,接触包括使细胞与编码向导RNA和CRISPR核酸酶的附加型载体接触。在一些实施方式中,接触包括使细胞与编码向导RNA的附加型载体和编码CRISPR核酸酶的第二附加型载体接触。在一些实施方式中,附加型载体是非整合的。在一些实施方式中,附加型载体是非复制性的。在一些实施方式中,附加型载体是腺相关病毒(AAV)载体。在一些实施方式中,附加型载体独立地包含第一末端和第二末端,其中第一末端和第二末端各自独立地包含AAV反向末端重复序列。
在一些实施方式中,CRISPR核酸酶包含(i)经修饰以消除核酸酶和切口活性的核酸酶结构域和(ii)转录激活结构域。在一些实施方式中,CRISPR核酸酶包括Cas9或Cpf1核酸酶。在一些实施方式中,修饰包括在对应于化脓性链球菌Cas9的D10和H840的位置处的突变。在一些实施方式中,CRISPR核酸酶包含D10A,H840A化脓性链球菌dCas9。在一些实施方式中,CRISPR核酸酶包含金黄色葡萄球菌dCas9。在一些实施方式中,金黄色葡萄球菌dCas9在以下残基之一中包含一个或多个突变:E782,K929,N968,R1015。在一些实施方式中,向导RNA包含死亡指导序列(dead guide sequence)。
在一些实施方式中,向导RNA包含转录激活结合结构域,其中转录激活结合结构域特异性结合包含一种或多种转录激活结构域的组合物。在一些实施方式中,包含与向导RNA结合的CRISPR核酸酶的复合物还包含选自下组的转录激活结构域:HSF1,VP16,VP64,p65,MyoD1,RTA,SET7/9,VPR,组蛋白乙酰转移酶p300,TET家族蛋白的羟化酶催化结构域(例如,TET1羟化酶催化结构域),LSD1,CIB1,AD2,CR3,EKLF1,GATA4,PRVIE,p53,SP1,MEF2C,TAX和PPARγ。在一些实施方式中,CRISPR核酸酶是CRISPR核酸酶-VP64融合多肽。
在一些实施方式中,向导RNA包含支架区域。在一些实施方式中,支架区域包含ms2,f6,PP7,com或L7a配体序列。在一些实施方式中,复合物中向导RNA的支架区域与融合至MCP多肽,COM多肽,PCP多肽或L7a多肽的转录激活结构域结合。在一些实施方式中,单倍体机能不全的基因是SIM1,瘦蛋白,瘦蛋白受体,MC4R,SCN2A,SETD5,PAX6,PKD1,MC3R,POMC,STAT3,STAT5,SOCS3,GHR,NPY,NPY1R,NPY2R,NPY5R,PYY,AMPK(PRKAA1,PRKAA2,PRKAB1,PRKAB2,PRKAG1,PRKAG2,PRKAG3),OXT,JAK2,SHP2,NOS3,NROB2,BRS3,CARTPT,FABP4,HTR2C,IL6,NHLH2,NMU,NPB,NPBWRI,PNPLA2,UCP3,ADIPOQ,APOA5,ARNT2,ASIP,C1QTNF2,C3AR1,CCK,CPT1B,CSF2,DGAT1,DGAT2,GHRL,GHSR,HSD11B1,HTR7,INSIG1,INSIG2,LIPC,NMURI,NMUR2,NPBWR2,NTS,PPARGC1A,PPY,RETN,SIRT1,TGFBR2,WDTC1,或FOXO1。
在一些实施方式中,向导RNA的靶向区域由以下编码或与以下特异性杂交:SEQ IDNO:1(GACACGGAATTCATTGCCAG),SEQ ID NO:2(CTGCGGGTTAGGTCTACCGG),SEQ ID NO:3(GTTGAGCGCTCAGTCCAGCG),SEQ ID NO:4(TCCCGACGTCGTGCGCGACC),或SEQ ID NO:5(GCTCTGAATCTTACTACCCG)。在一些实施方式中,向导RNA的靶向区域由以下编码或与以下特异性杂交:SEQ ID NO:6(GCTGTTAACTAAAGACAGGG),SEQ ID NO:7(GTGGTCTGGGTGATCTCATG),SEQ ID NO:8(GACAAAGGAACATCTGAGAGG),SEQ ID NO:9(GTGATCTCATGGGGAAGAGG),或SEQ IDNO:10(GGCTTTGATCGTGGTCTGGG)。在一些实施方式中,向导RNA的靶向区域由以下编码或与以下特异性杂交:SEQ ID NO:11(GCGAGCCCAGTCGCGTGGGG),或SEQ ID NO:12(GCCAAGAATTGGCCAAAGGG),SEQ ID NO:34(GTCAAAGGGGCATATGGAAGG),SEQ ID NO:35(GGGAAGAAAGCCCCACTTGG),SEQ ID NO:36(GCCCAGTCGCGTGGGGGGGG),或SEQ ID NO:37(GGAGCGCGAGTGTCACTCGG)。在另一个实施方式中,向导RNA的靶向区域由以下编码或与以下特异性杂交:SEQ ID NO:38(GCTCACTGTAGGACCCGAGCC),SEQ ID NO:39(GACGCGGCGCTCATTGGCCAA),SEQ ID NO:40(CGAGCCGCGAGCCCAGTCGCG),SEQ ID NO:41(TCCCCCCCCCCCCCCACGCGA),SEQ ID NO:42(GTCACTCACCCCGATTGGCCA),或SEQ ID NO:43(CGCGAGCCCAGTCGCGTGGGG)。在一些实施方式中,向导RNA的靶向区域由以下编码或与以下特异性杂交:SEQ ID NO:44(GTTGGCTTATCCAAACATCTC),SEQ ID NO:45(ATGTTAAGCAAGGGTAATAGA),SEQ ID NO:46(CTGTGAAAGGAATACAATTCA),SEQ ID NO:47(GCCAATTCTTGGCAACCGAGC),SEQ ID NO:48(GAATTGGCCAAAGGGAGGGGT),或SEQ ID NO:49(AATTAGCAGACAGCTTGGTAC)。在一些实施方式中,向导RNA的靶向区域由以下编码或与以下特异性杂交:SEQ ID NO:50(CTGGCTGATTCCCGAGGATTT),SEQ ID NO:51(CACTGAATACGGATTGGTCAG),SEQ ID NO:52(GATGTCTCAGAACCACTGAAT),SEQ ID NO:53(AACCACTGAATACGGATTGGT),或SEQ ID NO:54(ACCAATCCGTATTCAGTGGTT)。在一些实施方式中,向导RNA的靶向区域由以下编码或与以下特异性杂交:SEQ ID NO:55(GGCGCGGGGCGGACGGGGCGA),SEQ ID NO:56(GCGCCCCGGGAACGCGTGGGG),SEQ ID NO:57(CGCCCCGCGCCGCGCGGGGAG),SEQ ID NO:58(TCCGCCCCGCGCCGCGCGGGG),SEQ ID NO:59(GGAACGCGTGGGGCGGAGCTT),SEQ ID NO:60(GCCCCGCGCCGCGCGGGGAGG),SEQ ID NO:61(TGCGCCCCGGGAACGCGTGGG),SEQ ID NO:62(GAACGCGTGGGGCGGAGCTTC),SEQ ID NO:63(GCGGCGCGGGGCGGACGGGGC),或SEQ ID NO:64(CCCGTCCGCCCCGCGCCGCGC)。在一些实施方式中,向导RNA的靶向区域由以下编码或与以下特异性杂交:SEQ ID NO:65(GGCCCACTCGCCGCCAATCAG),SEQ ID NO:66(GGAAGCCGCCGGGGCCGCCTA),SEQ ID NO:67(TGATTGGCGGCGAGTGGGCCA),SEQ ID NO:68:(GCCGCCAATCAGCGGAAGCCG),SEQ ID NO:69:(GGCGGCTTCCGCTGATTGGCG),SEQ ID NO:70:(CCGCCAATCAGCGGAAGCCGC),SEQ ID NO:71:(AGCCGCCGGGGCCGCCTAGAG),SEQ ID NO:72:(GCTTCCGCTGATTGGCGGCGA),SEQ ID NO:73:(CGGCGAGTGGGCCAATGGGTG),或SEQ ID NO:74:(CCAATGGGTGCGGGGCGGTGG)。在一些实施方式中,向导RNA的靶向区域由以下编码或与以下特异性杂交:SEQ ID NO:75(GGCTGCCGGGGCCGCCTAAAG),SEQ ID NO:76(GGAGGCTGCCGGGGCCGCCTA),SEQ ID NO:77(GCCGCCAATCAGCGGAGGCTG),SEQ ID NO:78(CCGCCAATCAGCGGAGGCTGC),SEQ ID NO:79(TGGCCGGTGCGCCGCCAATCA),SEQ ID NO:80(GGCCGGTGCGCCGCCAATCAG),SEQ ID NO:81(CGGCGCACCGGCCAATAAGTG),SEQ ID NO:82(ATAAGTGTGGGGCGGTGGGG),SEQ ID NO:83(CCAATAAGTGTGGGGCGGTGG),或SEQ ID NO:84(CAATAAGTGTGGGGCGGTGGG)。在一些实施方式中,向导RNA的靶向区域由以下编码或与以下特异性杂交:SEQ ID NO:85(CCTTTCTATGACCTAGTCGG),SEQ ID NO:86(CAGAATCAGTAACGCACTGT),SEQ ID NO:87(GAAACCAGGAGAGATAACCC),SEQ ID NO:88(GGACCCCAGATATTCTGGAA),SEQ ID NO:89(TTATTGTTGACTTAACGAAG),SEQ ID NO:90(AAAAAGAAGCAAATAGCTAA),或SEQ ID NO:91(AGAATCAGTAACGCACTGTA)。在一些实施方式中,向导RNA的靶向区域由以下编码或与以下特异性杂交:SEQ ID NO:92(TGTTGGTTTATTGGACCCCAGATATTC),SEQ ID NO:93(TGTTGGAGAAAATTAACTTAGTGCATA),或SEQ ID NO:94(TGTTGGTATAACTGCCACTAGAGGGCT)。在一些实施方式中,向导RNA的靶向区域由SEQ ID NO:95(AGGAGCCGGGACCCACCGG)编码或与其特异性杂交。
在一些实施方式中,细胞是非分裂细胞。在一些实施方式中,细胞是神经元。在一些实施方式中,细胞是下丘脑细胞。在一些实施方式中,接触包括将编码向导RNA和/或CRISPR核酸酶的核酸注射到含有下丘脑的脑区域中。在一些实施方式中,接触包括将包含编码向导RNA和/或CRISPR核酸酶的核酸的腺相关病毒载体注射到含有下丘脑的脑区域中。在一些实施方式中,单倍体机能不全疾病选自表1。在一些实施方式中,单倍体机能不全疾病选自肥胖症,自闭症,癫痫,智力障碍,无虹膜和多囊肾病。在一些实施方式中,单倍体机能不全疾病是肥胖症。
另一方面,本发明提供哺乳动物宿主细胞,其包含:I)包含靶基因的至少一个功能性拷贝的基因组,其中所述一个或多个功能性拷贝在没有异源复合物的转录激活的情况下不能产生足够的相应基因产物以在生物体中产生野生型表型;和II)异源复合物,其中异源复合物包含:a)向导RNA,其中向导RNA包含:i)靶向区域,其在所述细胞的核中存在的条件下和与靶基因的一个或多个功能性拷贝操作性地连接的增强子区域或启动子区域特异性杂交;和ii)CRISPR核酸酶结合区域,其在所述细胞的核中存在的条件下特异性结合CRISPR核酸酶;和b)CRISPR核酸酶,-其中包含与向导RNA结合的CRISPR核酸酶的异源复合物的向导RNA与所述启动子或增强子杂交;-其中CRISPR核酸酶是催化失活的,并且-其中复合物激活靶基因的一个或多个功能性拷贝的转录,其量和持续时间足以在宿主细胞在生物体中存在时产生野生型表型。
在一些实施方式中,基因组包含靶基因的单个功能性拷贝。在一些实施方式中,靶基因的单功能拷贝包含单倍体机能不全的基因。在一些实施方式中,基因组包含靶基因的少于两个功能性拷贝。
附图说明
图1A-F:体外和体内转基因CRISPRa Sim1过表达。A,小鼠Sim1基因组基因座的原理图。B,靶向Sim1启动子(Pr)或增强子(Enh)的Neuro-2A细胞中的CRISPRa。结果表示为使用ΔΔCT方法标准化至β-肌动蛋白的mRNA倍数增加。从3个独立实验中获得平均值±s.d.。*=p值<0.001***=p值<0.0005(ANOVA,Tukey检验)。C,显示各种小鼠品系和小鼠转基因CRISPRa概念的原理图。D,野生型同窝仔畜的每周重量测量,Sim1+/-,H11PCAG-dCas9- VP64X ROSA26Sim1Pr-sgRNA和H11PCAG-dCas9-VP64X ROSA26SCE2En-sgRNA。每种基因型测量至少10只雄性和雌性小鼠。显示平均值±s.d。E-F,图片显示每种基因型的20周龄小鼠:Sim1+/-,H11PCAG -dCas9-VP64X ROSA26Sim1Pr-sgRNA和野生型同窝仔(E)和Sim1+/-,H11PCAG-dCas9-VP64X ROSA26SCE2En -sgRNA和野生型同窝仔(F)。每只小鼠的长度和重量分别在上方和下方描述。
图2A-D Sim1 CRISPRa转基因小鼠的身体组成和代谢分析。A,通过双能X射线吸收测定法(DEXA)或Echo磁共振成像(EchoMRI)测定的野生型同窝仔畜Sim1+/-,H11PCAG-dCas9- VP64X ROSA26Sim1Pr-sgRNA(PrmCRISPRa)和H11PCAG-dCas9-VP64X ROSA26SCE2En-sgRNA(EnhCRISPRa)的估计脂肪百分比,带有相应的体重测量值。从3只雌性和3只雄性中获得平均值±s.d.。B,对于经4天期间确定的所有四种基因型的3只雄性和3只雌性的代谢室能量消耗分析。C,经4天期间确定的所有四种基因型的食物摄入量。从3只雌性和3只雄性中获得平均值±s.d.。*=p值<0.001;***=p值<0.0005;n.s=非显著性(ANOVA,Tukey检验)。D,从3只雌性和3只雄性中获得的所有四种基因型的呼吸交换比(RER;VCO2/VO2),并以平均值±s.d绘图。
图3A-D显示CRISPRa转基因小鼠中的dCas9和Sim1 mRNA表达水平。A,Sim1组织表达的热图。红色和灰色实心方块分别表示Sim1表达和不表达的组织,我们的野生型小鼠中所确定的。B,来自4只Sim1+/-X H11PCAG-dCas9-VP64小鼠的下丘脑,肾,肺和肝中的dCas9 mRNA表达。使用ΔΔCT方法,基于对β-肌动蛋白(对于下丘脑)和Rp138(对于肾,肺,肝)标准化的mRNA倍数增加来确定平均值±s.d。C-D,来自2只雌性(C)和2只雄性(D)的以下基因型中Sim1 mRNA在下丘脑,肾,肺和肝中的表达:野生型同窝小鼠,Sim1+/-,H11pCAG-dCas9-VP64XROSA26Sim1Pr-sgRNA(Prm-CRISPRa)和H11PCAG-dCas9-VP64X ROSA26SCE2En-sgRNA(Enh-CRISPRa)。基于与野生型同窝仔畜相比的mRNA倍数增加确定平均值±s.d,并使用ΔΔCT方法标准化至β-肌动蛋白或Rp138。B.D.L=低于检测到的水平。
图4A-E使用AAV的体外和体内转基因CRISPRa Sim1过表达。A,AAV CRISPRa在Neuro-2A细胞中使用含有以下的病毒体(viron):pCMV-dCas9-VP64(dCas9-VP64),pCMV-dCas9-VP64与pSim1Pr-mCherry(PrmCRIPSRa)和pCMV-dCas9-VP64与pSCE2En-mCherry(EnhCRISPRa)。结果表示为使用ΔΔCT方法标准化至β-肌动蛋白的mRNA倍数增加。从3个独立实验中获得平均值±s.d.。***=p值<0.0005(ANOVA,Tukey检验)。B,显示PVN注射区域的原理图。C,来自20周龄小鼠的pSim1Pr-mCherry注射的下丘脑的免疫组织化学,其显示PVN中的mCherry表达。D-E,Cas9(d)和Sim1(e)来自注射小鼠的pCMV-dCas9-VP64(dCas9-VP64),pCMV-dCas9-VP64+pSim1Pr-mCherry(PrmCRIPSRa,n=3)和pCMV-dCas9-VP64+pSCE2En-mCherry(EnhCRISPRa,n=4)的mRNA表达。基于与Sim1+/-小鼠相比的mRNA倍数增加确定平均值±s.d,并使用ΔΔCT方法标准化至β-肌动蛋白。
图5A-C中PVN中的CRISPRa-AAV注射降低了Sim1+/-小鼠的体重增加。A,PVN中CRISPRa-AAV注射后体重测量的时间线。B-C,与未注射的野生型同窝仔和Sim1+/-小鼠相比,用pCMV-dCas9-VP64(dCas9-VP64),pCMV-dCas9-VP64+pSim1Pr-mCherry(Prm-CRIPSRa)pCMV-dCas9-VP64+pSCE2En-mCherry(Enh-CRISPRa)注射的Sim1+/-小鼠经7周时间测得体重增加。从3只雌性(B)和3只雄性(C)显示平均值±s.d。*=p值<0.001;***=p值<0.0005;n.s=非显著性(ANOVA,Tukey检验)。
图6CRISPRa单倍体机能不全拯救实验的原理图。通过使用转基因和出生后AAV方法靶向Sim1启动子或增强子,通过CRISPRa拯救Sim1+/-小鼠中的肥胖表型。
图7A-7B:体外CRISPRa Sim1过表达。图7A显示了通过将各种sgRNA(SEQ ID NO:38-43)转染到Neuro-2A(N2A)细胞中而靶向Sim1启动子(Pr)的示例性金黄色葡萄球菌CRISPRa系统。结果表示为标准化至Sa-dCas9-VP64的mRNA倍数增加。从3个独立实验中获得平均值±s.d.。图7B显示了在含有选择的sgRNA(SEQ ID NO:38,40或42)的AAV感染N2A细胞后,靶向Sim1启动子(Pr)的N2A细胞中的示例性金黄色葡萄球菌CRISPRa。结果表示为标准化至单独VP64的mRNA倍数增加。从3个独立实验中获得平均值±s.d.。
图8A-8B:体外CRISPRa Sim1过表达。图8A显示了通过将各种sgRNA(SEQ ID NO:44-49)转染到N2A细胞中而靶向Sim1 SCE2增强子(Enh)的示例性金黄色葡萄球菌CRISPRa系统。结果表示为标准化至Sa-dCas9-VP64的mRNA倍数增加。从3个独立实验中获得平均值±s.d.。图8B显示了通过将含有选择sgRNA(SEQ ID NO:45,46或47)的AAV转染到N2A细胞中而靶向Sim1 SCE2增强子(Enh)的示例性金黄色葡萄球菌CRISPRa系统。结果表示为标准化至单独VP64的mRNA倍数增加。从3个独立实验中获得平均值±s.d.。
图9A-9B:体外CRISPRa Mc4r过表达。图9A显示了通过将各种sgRNA(SEQ ID NO:50-54)转染到N2A细胞中而靶向Mc4r启动子(Pr)的示例性金黄色葡萄球菌CRISPRa系统。结果表示为标准化至VP64的mRNA倍数增加。从3个独立实验中获得平均值±s.d.。图9B显示了通过将含有选择sgRNA(SEQ ID NO:51,52或54)的AAV转染到N2A细胞中而靶向Mc4r启动子(Pr)的示例性金黄色葡萄球菌CRISPRa系统。结果表示为标准化至VP64的mRNA倍数增加。从3个独立实验中获得平均值±s.d.。
图10:体外CRISPRaPKD1过表达。通过将人启动子sgRNA(SEQ ID NO:55-64)转染到人HEK293T细胞中而靶向PKD1启动子(Pr)的示例性金黄色葡萄球菌CRISPRa系统。结果表示为标准化至dCas9-VP64的mRNA倍数增加。从3个独立实验中获得平均值±s.d.。
图11A-11B:体外CRISPRa SETD5过表达。图11A显示了通过将人启动子sgRNA(SEQID NO:65-74)转染到人HEK293T细胞中而靶向SETD5启动子(Pr)或THUMPD3的示例性金黄色葡萄球菌CRISPRa系统。HS MIX是指将等摩尔浓度的每种HS01-HS10转染到人HEK293T细胞中。结果表示为标准化至单独VP64的mRNA倍数增加。从3个独立实验中获得平均值±s.d.。图11B显示了通过将小鼠启动子sgRNA(SEQ ID NO:75-84)转染到人小鼠Neuro-2A细胞中而靶向SETD5启动子(Pr)或ROSA26的示例性金黄色葡萄球菌CRISPRa系统。MS MIX是指将等摩尔浓度的每种MS01-MS10转染到小鼠Neuro-2A细胞中。结果表示为标准化至单独VP64的mRNA倍数增加。从3个独立实验中获得平均值±s.d.。
图12A-12B:体外CRISPRa Scn2A过表达。图12A显示了通过将各种sgRNA(SEQ IDNO:85-91)转染到N2A细胞中而靶向Scn2a启动子(Pr)的示例性化脓性链球菌(Sp)Cas9CRISPRa系统。结果表示为标准化至单独VP64的mRNA倍数增加。从3个独立实验中获得平均值±s.d.。图12B显示了通过将含有选择sgRNA(SEQ ID NO:92-94)的AAV转染到N2A细胞中而靶向Scn2a启动子(Pr)的示例性金黄色葡萄球菌CRISPRa系统。使用两种不同的感染复数(MOI):5000和1250病毒基因组(vg/ml)。结果表示为标准化至单独VP64的mRNA倍数增加。从3个独立实验中获得平均值±s.d.。
图13:体外CRISPRa PAX6过表达。显示了通过人启动子sgRNA(SEQ ID NO:95)的慢病毒递送向分化成神经元的人H1-ESC细胞中靶向PAX6启动子(Pr)的示例性化脓性链球菌(Sp)Cas9 CRISPRa系统。结果表示为HPRT的相对表达。从3个独立实验中获得平均值±s.d.。显示其他神经元标志物证明PAX6CRISPRa导致H1-ESC的神经诱导。
定义
在本说明书和所附权利要求书中所用的单数形式“一个”,“一种”和“该”、“所述”包含复数指示物,除非上下文中有明确的另外说明。
“治疗”指疾病、病症或紊乱的治疗或改善或预防中任何成功的迹象,包括任何客观或主观参数,例如疾病病症的减轻、缓解、消除或使病变或病症对患者而言更可耐受,减慢退化或衰退的速率,或使退化的终点不那么虚弱。症状的治疗或缓解可基于主观或客观参数,包括医生检查的结果。因此,术语“治疗”包括给予本发明的化合物或药剂以预防或延迟,减轻或阻止或抑制与本文所述的疾病,病症或紊乱相关的症状或病症的发展。术语“治疗效果”是指在对象中减轻,消除或预防疾病,疾病症状或疾病副作用。使用本发明的方法“治疗”或“处理”包括预防对象中症状的发作,所述症状可能处于与本文所述的疾病,病症或紊乱相关的疾病或病症的风险增加,但尚未经历或表现出症状,抑制疾病或病症的症状(减缓或阻止其发展),缓解疾病的症状或副作用(包括姑息性治疗),并缓解疾病的症状(导致消退)。治疗可以是预防性的(以预防或延迟疾病的发作,或预防其临床或亚临床症状的表现)或在疾病或病症的表现后治疗性抑制或缓解症状。如本文所用,术语“治疗”包括预防性(例如预防),治愈性或姑息性治疗。
术语“核酸”或“多核苷酸”是指单链或双链形式的脱氧核糖核酸(DNA)或核糖核酸(RNA)及其聚合物。除非特别限定,否则该术语涵盖含有天然核苷酸的已知类似物的核酸,其具有与参比核酸相似的结合特性,并以与天然存在的核苷酸相似的方式代谢。除非另有说明,否则具体核酸序列还隐含地包括其保守修饰的变体(例如,简并密码子取代),等位基因,直系同源物,SNP和互补序列以及明确指出的序列。具体而言,可通过产生一个或多个选定(或所有)密码子的第三个位置被混合碱基和/或脱氧肌苷残基取代的序列来获得简并密码子取代形式(Batzer等,Nucleic Acid Res.19:5081(1991);Ohtsuka等,J.Biol.Chem.260:2605-2608(1985);和Rossolini等,Mol.Cell.Probes 8:91-98(1994))。术语核酸与基因、cDNA、和基因编码的mRNA互换使用。
术语“基因”是指参与产生多肽链的DNA区段。它可以包括编码区之前和之后的区域(前导区和尾区)以及各个编码区段(外显子)之间的间插序列(内含子)。
“启动子”定义为指导核酸转录的核酸控制序列的阵列。如本文所用,启动子包括转录起始位点附近的必需核酸序列,例如,在聚合酶II型启动子的情况中,TATA元件。启动子还任选地包括远端增强子或阻遏子元件,其可位于距转录起始位点数千碱基对的位置。
“表达盒”是重组或合成产生的核酸构建体,具有一系列允许特定多核苷酸序列在宿主细胞中转录的特定核酸元件。表达盒可以是质粒,病毒基因组或核酸片段的一部分。通常,表达盒包括待转录的多核苷酸,其操作性地连接至启动子。
“报告基因”编码由于其生物化学特征(例如酶活性或化学荧光特征)而易于检测的蛋白质。这种报告物的一个具体示例是绿色荧光蛋白。可以用各种市售荧光检测系统检测由该蛋白质产生的荧光。其他报告物可以通过染色检测。报告物也可以是与适当的底物接触时产生可检测信号的酶。报告物可以是催化可检测产物形成的酶。合适的酶包括但不限于蛋白酶,核酸酶,脂肪酶,磷酸酶和水解酶。报告物可编码其底物基本上不能渗透真核细胞质膜的酶,从而可以严格控制信号形成。编码酶的合适报告基因的具体实例包括但不限于CAT(氯霉素乙酰转移酶;Alton和Vapnek,(1979)Nature 282:864-869);荧光素酶(1ux);β-半乳糖苷酶;LacZ;β-葡萄糖醛酸酶;和碱性磷酸酶(Toh等,(1980)Eur.J.Biochem.182:231-238;和Hall等,(1983)J.Mol.Appl.Gen.2:101),各自通过引用全文纳入本文。其他合适的报告物包括编码特定表位的那些,所述特定表位可以用特异性识别表位的标记抗体检测。
术语“氨基酸”指天然产生的和合成的氨基酸,以及作用方式类似于天然产生氨基酸的氨基酸类似物和氨基酸模拟物。天然产生的氨基酸是由遗传密码编码的氨基酸,以及随后修饰的氨基酸,如羟基脯氨酸、γ-羧基谷氨酸和O-磷酸丝氨酸。氨基酸类似物指与天然产生的氨基酸具有相同基本化学结构的化合物,即结合于氢、羧基、氨基和R基的α碳,如高丝氨酸、正亮氨酸、甲硫氨酸亚砜、甲硫氨酸甲基锍。这种类似物具有修饰的R基(如正亮氨酸)或修饰的肽主链,但保留了与天然产生的氨基酸相同的基本化学结构。“氨基酸模拟物”指结构不同于氨基酸的普通化学结构,但作用方式类似于天然产生氨基酸的化合物。
本领域有多种不同已知方法,其允许以位点特异性方式将非天然氨基酸衍生物或类似物纳入多肽链中,参见例如WO 02/086075。
在本文中,氨基酸可用IUPAC-IUB生物化学命名委员会推荐的通用三字母代号或单字母代号表示。同样,核苷酸可由其公认的单字母代码表示。
“多肽”,“肽”和“蛋白质”在本文中可互换使用,指氨基酸残基的聚合物。三个术语全部适用于其中一个或多个氨基酸残基是相应天然产生氨基酸的人造化学模拟物的氨基酸聚合物,以及天然产生的氨基酸聚合物和非天然产生的氨基酸聚合物。如本文所用,该术语涵盖任意长度的氨基酸链,包括全长蛋白质,其中所述氨基酸残基通过共价肽键连接。
“保守修饰变体”可应用于氨基酸和核酸序列。关于特定的核酸序列,“保守修饰的变体”是指那些编码相同或基本相同的氨基酸序列的核酸,或者当核酸不编码氨基酸序列时,指的是基本相同的序列。由于遗传密码的简并性,大量功能相同的核酸编码任何给定的蛋白质。例如,密码子GCA、GCC、GCG和GCU都编码氨基酸丙氨酸。因此,在密码子指定丙氨酸的每个位置,该密码子可以改变为所述的任何相应密码子而不改变编码的多肽。这类核酸变异是“沉默变异”,这是保守修饰变异的一种。本文中编码多肽的每个核酸序列也描述了核酸的每种可能的沉默变异。本领域技术人员应认识到,核酸中的每个密码子(除了AUG,其通常是甲硫氨酸的唯一密码子,和TGG,其通常是色氨酸的唯一密码子)均可以被修饰以产生功能相同的分子。因此,编码多肽的核酸的每个沉默变异隐含在每个所描述的序列中。
至于氨基酸序列,本领域技术人员将认识到,在编码序列中改变、加入或删除一个氨基酸或较少百分数氨基酸的某一核酸、肽、多肽或蛋白质序列单独取代、缺失或添加是“保守修饰变体”,其中所述改变导致氨基酸被化学上相似的氨基酸所取代。提供功能上相似氨基酸的保守取代表是本领域熟知的。此类保守修饰的变体是本发明的多态性变体、种间同源物和等位基因的补充且并不排除它们。在一些情况下,如WO 2016/011080中所述,CRISPR核酸酶(例如Cas9)或向导RNA(例如小向导RNA(sgRNA))的保守修饰的变体可具有增加的稳定性,组装或活性,其内容通过引用全文纳入本文用于所有目的,包括但不限于其中描述的sgRNA,sgRNA支架,sgRNA文库和sgRNA结合区。
以下八组每组含有相互保守取代的氨基酸:
1)丙氨酸(A),甘氨酸(G);
2)天冬氨酸(D),谷氨酸(E);
3)天冬酰胺(N),谷胺酰胺(Q);
4)精氨酸(R),赖氨酸(K);
5)异亮氨酸(I),亮氨酸(L),甲硫氨酸(M),缬氨酸(V);
6)苯丙氨酸(F),酪氨酸(Y),色氨酸(W);
7)丝氨酸(S),苏氨酸(T);和
8)半胱氨酸(C),甲硫氨酸(M)
(参见,例如,Creighton,《蛋白质》(Proteins),弗里曼公司(W.H.Freeman andCo.),纽约(1984))。
在本文中,氨基酸可用IUPAC-IUB生物化学命名委员会推荐的通用三字母符号或单字母符号表示。同样,核苷酸可由其公认的单字母代码表示。
在本申请中,氨基酸残基根据它们在未修饰的野生型多肽序列中从最左边的残基(编号为1)的相对位置编号。
如本文所用,在描述两个或更多个多核苷酸或氨基酸序列的上下文中,术语“相同”或“相同性”百分比是指两个或更多个相同或具有指定百分比的氨基酸残基或核苷酸相同的序列或子序列。例如,在与比较窗口或指定区域进行比较和比对时,负责sgRNA:核酸酶复合物的组装和活性的核心小向导RNA(sgRNA)与参考序列序列有至少80%的相同性,优选85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或100%的相同性,使用以下序列比较算法之一或通过手动比对和目视检查测量,与指定区域有至少80%的相同性,优选85%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或100%的相同性。
为了序列比较,一般将一个序列用作与测试序列比较的参比序列。当使用序列比较算法时,将测试和参比序列输入计算机,如果需要,指定子序列坐标,并指定序列算法程序参数。可使用默认的程序参数,或者可指定另外的参数。然后,序列比较算法基于程序参数计算测试序列相对于参比序列的序列相同性百分比。对于核酸和蛋白质的序列比较,使用BLAST和BLAST 2.0算法和下面讨论的默认参数。
本文所用的“比较窗口”包括参考选自20-600,通常约50-200,更常见约100-150的任一数量的毗连位置的区段,其中对两个序列进行最优比对后,可将序列与具有相同数量毗连位置的参比序列作比较。比对序列的比较方法是本领域熟知的。可通过,例如Smith和Waterman的局部同源性算法,Adv.Appl.Math.2:482(1981),通过Needleman和Wunsch的同源性比对算法,J.Mol.Biol.48:443(1970),通过Pearson和Lipman的相似性搜索法,Proc.Nat’1.Acad.Sci.USA 85:2444(1988),通过计算机执行这些算法(遗传学计算组(Genetics Computer Group)的威斯康星遗传学软件包(Wisconsin Genetics SoftwarePackage)中的GAP、BESTFIT、FASTA和TFASTA,威斯康星州麦迪逊科学大道第575号,或通过手工比对和目测(参见例如,《新编分子生物学实验指南》(Current Protocols inMolecular Biology)(Ausubel等编,1995增刊))进行最优序列比对以便比较。
适合测定序列相同性百分数和序列相似性百分数的算法示例是BLAST和BLAST2.0算法,分别描述于Altschul等(1990)J.Mol.Biol.215:403-410和Altschul等(1977)Nucleic Acids Res.3389-3402。用于进行BLAST分析的软件可在国家生物技术信息中心网站ncbi.nlm.nih.gov上公开获得。此算法包括:首先通过鉴定查询序列中长度为W的短字来鉴定高评分序列对(HSP),与数据库序列中长度相同的字比对时它们能匹配或满足一些正值的阈值评分T。T称为相邻字评分阈值(Altschul等,同上)。这些初始相邻字命中(wordhit)用作启动搜索的种子,以便找到含有它们的较长HSP。然后,沿各序列在两个方向上延伸该字命中,直到提高累积的比对评分。就核苷酸序列而言,采用参数M(一对匹配残基的奖励评分;总是>0)和N(错配残基的罚分;总是<0)计算累积评分。就氨基酸序列而言,用评分矩阵计算累积评分。出现以下情况时中止字命中在各个方向上的延伸:累积比对评分比其最大获得值降低X;由于一个或多个负评分残基比对的累积,累积评分变为零或零以下;或者达到任一序列的末端。BLAST算法参数W、T和X确定该比对的灵敏度和速度。BLASTN程序(用于核苷酸序列)采用的默认值如下:字长(W)28,期望值(E)10,M=1,N=-2,以及比较两条链。对氨基酸序列而言,BLASTP程序使用的默认值为:字长(W)3,期望值(E)10,BLOSUM62评分矩阵(参见Henikoff和Henikoff,Proc.Natl.Acad.Sci.USA 89:10915(1989))。
BLAST算法也对两条序列间的相似性进行统计学分析(参见例如,Karlin和Altschul,Proc.Nat’l.Acad.Sci.USA 90:5873-5787(1993))。BLAST算法提供的一种相似性度量是最小概率和(P(N)),它表明两条核苷酸或氨基酸序列之间偶尔发生匹配的概率。例如,如果测试核酸与参比核酸比较时的最小概率和小于约0.2,更优选小于约0.01,最优选小于约0.001,那么认为该核酸与参比序列相似。
两个核酸序列或多肽基本上相同的指示是由第一核酸编码的多肽与针对由第二核酸编码的多肽产生的抗体在免疫学上交叉反应,如下所述。因此,例如某多肽与第二条多肽的区别仅为保守取代时,该两种肽通常基本相同。两个核酸序列基本相同的另一个指示是两个分子或它们的互补物在严谨条件下彼此杂交,如下所述。两个核酸序列基本相同的另一个指示是相同的引物可用于扩增序列。两种多肽基本相同的另一个指示是两种多肽保持相同或基本相似的活性。
“易位序列”或“转导序列”是指肽或蛋白质(或其活性片段或结构域)序列,其指导蛋白质从一个细胞区室移动到另一个细胞区室,或从细胞外空间通过细胞或质膜移动进入细胞。指导蛋白质从细胞外空间通过细胞或质膜移动进入细胞的易位序列是“细胞穿透肽”。定位于细胞核的易位序列称为“核定位”序列,信号,结构域,肽等。
易位序列的示例包括但不限于TAT转导结构域(参见,例如,S.Schwarze等,Science 285(1999年9月3日));穿透蛋白或穿膜肽(D.Derossi等,Trends in CellBiol.8,84-87);单纯疱疹病毒1型VP22(A.Phelan等,Nature Biotech.16,440-443(1998)),和聚阳离子(例如聚精氨酸)肽(Cell Mol.Life Sci.62(2005)1839-1849)。其他易位序列是本领域已知的。易位肽可以与本发明化合物等融合(例如在氨基或羧基末端),偶联或偶合,产生一种偶联化合物,该偶联化合物可以很容易地进入靶细胞,或通过血脑屏障进入靶细胞。
如本文所用,术语“CRISPR”是指任何一种天然存在的规则簇集的有间隙的短回文重复系统或基因座或其衍生物。CRISPR基因座可以在许多细菌和古细菌的基因组中找到。有四种类型的CRISPR系统(例如,I型,II型,III型和U型)。
CRISPR基因座可包含编码CRISPR相关基因(Cas)基因的多核苷酸序列。Cas基因可以参与crRNA功能的生物发生和/或干扰阶段。Cas基因可以根据它们来源的生物体命名。例如,表皮葡萄球菌中的Cas基因可以称为Csm型,嗜热链球菌中的Cas基因可以称为Csn型,而激烈热球菌中的Cas基因可以称为Cmr型。
如本文所用,术语CRISPR核酸酶是指在四种类型的CRISPR基因座:I型,II型,III型和U型中的任何一种中编码的核酸酶的多肽,或由其衍生,其中该多肽的天然序列表现出RNA引导的核酸酶活性。CRISPR核酸酶可以是催化失活的。催化失活的CRISPR核酸酶在与RNA指导复合并且与含有靶结构域,并且在某些实施方式中,PAM序列的核酸靶标结合时不显示核酸酶或切口酶活性。催化失活的CRISPR核酸酶可能由于CRISPR核酸酶多肽序列的一个或多个突变,或由于与足以提供RNA引导靶向但不足以支持催化活性(即,核酸酶或切口活性)的向导RNA形成复合物而催化失活的。例如,CRISPR核酸酶可以是与死亡指导序列复合的野生型CRISPR核酸酶(例如,Cas9或Cpf1核酸酶)。例如,Cpf1是II类CRISPR-Cas系统,并且描述于Zetsche等,Cell,163:759-771(2015)。死亡指导序列及其用途进一步描述于例如WO 2016/094872中,其通过引用纳入本文用于所有目的,包括死亡指导序列,CRISPR核酸酶与死亡指导序列之间的复合物,以及用于制备和使用该死亡指导序列和含有它们的复合物的方法和组合物。
在某些实施方式中,CRISPR核酸酶符合以下标准中的一个或两个:其与来自参考序列的氨基酸序列,例如天然存在的CRISPR核酸酶具有至少20,30,40,50,55,60,65,70,75,80,81,82,83,84,85,86,87,88,89,90,91,92,93,94,95,96,97,98,99或100%同源性,或与来自参考序列的氨基酸序列,例如天然存在的CRISPR核酸酶相差不超过1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,25,30,35,40,35,50,55,60,65,70,75,80,85,90,95,100,150,200,250,300,350或400个氨基酸残基。另外的CRISPR核酸酶包括但不限于WO 2016/154579中描述的一种或多种CRISPR核酸酶。
在某些实施方式中,CRISPR核酸酶含有(即,共价或非共价连接)一种或多种另外的多肽或核酸。例如,CRISPR核酸酶可以在氨基或羧基末端与一个或多个转录激活结构域多肽,一个或多个DNA结合多肽,一个或多个亲和标签(例如,与一个或多个亲和标签配体复合,例如亲和标签配体-转录激活域融合蛋白),核定位序列或其组合融合。
示例性DNA结合多肽包括但不限于Bolukbasi等,Nature Methods 12,1150-1156(2015)中描述的可编程DNA结合结构域,其内容通过引用全文纳入本文,包括:例如,其中描述的可编程DNA结合结构域(pDBD),Cas9变体和Cas9-pDBD嵌合体。示例性转录激活域多肽包括但不限于以下一种或多种的激活域或其激活域的组合:
·热休克转录因子1(HSF1),例如,SEQ ID NO:13
·病毒蛋白16(VP16),例如,SEQ ID NO:14(DALDDFDLDML);
·四聚体VP16(VP64),例如,SEQ ID NO:15
·p65 NF-Kβ反式激活亚基(p65),例如,SEQ ID NO:16
·MyoD1,例如,SEQ ID NO:17
·RTA,例如,SEQ ID NO:18
·SET7,例如,SEQ ID NO:19
·VPR,例如,SEQ ID NO:20
·组蛋白乙酰转移酶p300,例如,SEQ ID NO:21
·TET家族蛋白质的羟化酶催化结构域(例如,TET1羟化酶催化结构域),例如,SEQID NO:22
·LSD1,例如,SEQ ID NO:23
·CIB1,例如,SEQ ID NO:24
·AD2,例如,SEQ ID NO:25
·CR3,例如,SEQ ID NO:26
·GATA4,例如,SEQ ID NO:27
·p53,例如,SEQ ID NO:28
·SP1,例如,SEQ ID NO:29
·MEF2C,例如,SEQ ID NO:30
·TAX,例如,SEQ ID NO:31
·PPARγ,例如,SEQ ID NO:32
·SET9,例如,SEQ ID NO:33
Chavez等,Nat Methods,2015年4月;12(4):326-328中描述的一个或多个转录激活结构域,其全部内容通过引用纳入本文用于任何和所有目的,包括但不限于激活域多肽和编码多核苷酸,Cas9(例如,dCas9)多肽和编码多核苷酸,以及融合蛋白,及其复合物(例如,与sgRNA)。
在一些情况下,CRISPR核酸酶与一个或多个亲和标签融合。例如,CRISPR核酸酶可以是SunTag的组分。示例性SunTag或SunTag组分包括但不限于WO 2016/011070中描述的亲和标记的CRISPR核酸酶或亲和标签配体及其融合蛋白中的一种或多种。在一个实施方式中,CRISPR核酸酶含有一个或多个与一个或多个配体-转录激活结构域融合蛋白非共价结合的亲和标签。在此类实施方式中,与亲和标签配体融合的转录激活结构域可以是,例如,本文所述的转录激活结构域,例如SEQ ID NO:13-33的那些,WO 2016/011070中描述的转录激活结构域,或其组合或衍生物中的一个或多个。
如本文所用,术语“Cas9”,“Cas9分子”等是指Cas9多肽或编码Cas9多肽的核酸。“Cas9多肽”是可以与向导RNA(gRNA)形成复合物并且与含有靶结构域,并且在某些实施方式中,PAM序列的核酸靶标结合的多肽。Cas9分子包括具有天然存在的Cas9多肽序列的那些,和例如与参考序列(例如,最相似的天然存在的Cas9分子)相差,例如,至少一个氨基酸残基的,经改造的、改变的或修饰的Cas9多肽。Cas9分子可以是Cas9多肽或编码Cas9多肽的核酸。Cas9分子可以是核酸酶(切割双链核酸的两条链的酶),切口酶(切割双链核酸的一条链的酶),或催化失活的(或失效(dead))Cas9分子。具有核酸酶或切口酶活性的Cas9分子被称为“催化活性的Cas9分子”(“caCas9”分子)。缺乏切割或切开靶核酸的能力的Cas9分子被称为“催化失活的Cas9分子”(“ciCas9”分子)或“失效Cas9”(“dCas9”)。
在某些实施方式中,Cas9分子符合以下标准中的一个或两个:其与来自参考序列的氨基酸序列,例如天然存在的Cas9分子具有至少20,30,40,50,55,60,65,70,75,80,81,82,83,84,85,86,87,88,89,90,91,92,93,94,95,96,97,98,99或100%同源性,或与来自参考序列的氨基酸序列,例如天然存在的Cas9分子相差不超过1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,25,30,35,40,35,50,55,60,65,70,75,80,85,90,95,100,150,200,250,300,350或400个氨基酸残基。
在一些实施方式中,Cas9分子是化脓性链球菌Cas9(SpCas9)或其变体。在一些实施方式中,Cas9分子是金黄色葡萄球菌Cas9(SaCas9)或其变体(参见例如本文的图7A-11B)。在一些实施方式中,Cas9分子是空肠弯曲杆菌Cas9(CjCas9)或其变体(参见Kim等,Nat.Comm.,8,14500(2017))。在一些实施方式中,Cas9分子是脑膜炎奈瑟球菌Cas9(NmCas9)或其变体(参见例如美国专利号9,074,199)。在一些实施方式中,Cas9分子是嗜热链球菌Cas9(StCas9)或其变体(参见Xu等,Cell Mol Life Sci.,72:383-99(2014))。在一些实施方式中,Cas9分子是dCas9分子。
在某些实施方式中,Cas9分子是化脓性链球菌Cas9变体。在某些实施方式中,Cas9变体是EQR变体。在某些实施方式中,Cas9变体是VRER变体。在某些实施方式中,dCas9分子是化脓性链球菌Cas9变体。在某些实施方式中,Cas9变体是EQR变体。在某些实施方式中,Cas9变体是VRER变体。在某些实施方式中,Cas9系统包含Cas9分子,例如本文所述的Cas9分子,例如Cas9EQR变体或Cas9 VRER变体。
在某些实施方式中,Cas9分子是金黄色葡萄球菌Cas9变体。在某些实施方式中,Cas9变体是KKH(E782K/N968K/R1015H)变体(参见,例如,Kleinstiver等,Nature 523,481-485(2015年7月23日);和Leenay等,Molecular Cell,第62卷,第1期,2016,第137页),其全部内容通过引用明确地纳入本文,尤其是关于Cas(例如,Cas9)变体,例如具有改变的PAM特异性的那些变体)。在某些实施方式中,Cas9变体是E782K/K929R/R1015H变体(参见,例如,Kleinstiver 2015)。在某些实施方式中,Cas9变体是E782K/K929R/N968K/R1015H变体(参见,例如,Kleinstiver 2015)。在某些实施方式中,Cas9变体在以下残基之一中包含一个或多个突变:E782,K929,N968,R1015。在某些实施方式中,Cas9变体包含一种或多种以下突变:E782K,K929R,N968K,R1015H和R1015Q(参见,例如,Kleinstiver 2015)。在某些实施方式中,Cas9系统包含Cas9分子,例如本文所述的Cas9分子,例如Cas9 KKH变体。
如本文所用,术语“Cpf1”,“Cpf1分子”等是指Cpf1多肽或编码Cpf1多肽的核酸。“Cpf1多肽”是可以与向导RNA(gRNA)形成复合物并且与含有靶结构域的核酸靶标,并且在某些实施方式中,PAM序列结合的多肽。Cpf1分子包括具有天然存在的Cpf1多肽序列的那些,和例如与参考序列(例如,最相似的天然存在的Cpf1分子)相差,例如,至少一个氨基酸残基的经改造的,改变的或修饰的Cpf1多肽。Cpf1分子可以是Cpf1多肽或编码Cpf1多肽的核酸。示例性Cpf1多肽包括从普氏菌(Prevotella),新弗朗西斯菌(Francisellanovicida)(FnCpf1),毛螺科菌(Lachnospiraceae bacterium)(LbCpf1)和氨基酸球菌种(AsCpf1)分离的多肽(参见,例如,Tóth等,Biology Direct,11:46(2016))。
在某些实施方式中,Cpf1分子符合以下标准中的一个或两个:其与来自参考序列的氨基酸序列,例如天然存在的Cas9分子具有至少20,30,40,50,55,60,65,70,75,80,81,82,83,84,85,86,87,88,89,90,91,92,93,94,95,96,97,98,99或100%同源性,或与来自参考序列的氨基酸序列,例如天然存在的Cpf1分子相差不超过1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,25,30,35,40,35,50,55,60,65,70,75,80,85,90,95,100,150,200,250,300,350或400个氨基酸残基。
如本文所用,术语“gRNA分子”或“gRNA”是指能够将CRISPR核酸酶靶向靶核酸的向导RNA。在一个实施方式中,术语“gRNA分子”是指指导核糖核酸。在另一个实施方式中,术语“gRNA分子”是指编码gRNA的核酸。在一个实施方式中,gRNA分子是非天然存在的。在一个实施方式中,gRNA分子是合成的gRNA分子。
向导RNA可以是与一种或多种蛋白质或核酸配体(支架RNA配体)结合的支架RNA。配体可以与转录激活结构域融合或以其他方式共价或非共价连接。在另一个实施方式中,支架RNA不是向导RNA,因为它不与CRISPR核酸酶特异性结合。示例性支架RNA,和CRISPR核酸酶/支架RNA复合物,以及制备和使用它们的方法描述于,例如WO 2016/054106(描述CRISPR-结合和CRISPR独立支架RNA)和Zhang等,Scientific Reports 5,第16277号(2015年);Konermann等,2015,Nature 517:583-8(描述CRISPR/gRNA指导的协同激活介质(SAM))。
如本文所用,“对象”可以指人或非人动物。该术语包括但不限于哺乳动物(例如,人类,其他灵长类动物,猪,啮齿动物(例如,小鼠和大鼠或仓鼠),兔,豚鼠,牛,马,猫,狗,绵羊和山羊)。在一个实施方式中,对象是人。在另一个实施方式中,对象是禽类。在另一个实施方式中,对象是鱼类。在某些实施方式中,对象是人,并且在这些实施方式的某些中,人是婴儿,儿童,年轻成人或成人。
如本文所用,术语“靶核酸”或“靶基因”是指针对结合靶向的核酸,例如被与向导RNA,向导-RNA或支架RNA复合的CRISPR核酸酶结合。在某些实施方式中,靶核酸包含一个基因,或与一个基因操作性地连接的启动子或增强子区域。在某些实施方式中,靶核酸可包含一个或多个基因,例如两个基因,三个基因,四个基因或五个基因,或与一个或多个基因操作性地连接的启动子或增强子区域。在一个实施方式中,靶核酸可包含基因的启动子区域或控制区。在一个实施方式中,靶核酸可包含基因的内含子。在另一个实施方式中,靶核酸可包含基因的外显子。在一个实施方式中,靶核酸可包含基因的编码区。在一个实施方式中,靶核酸可包含基因的非编码区。在一些实施方式中,靶核酸是本文表1中列出的基因的控制区,启动子,增强子,内含子,外显子,转录起始位点,编码区或非编码区。
在一些实施方式中,靶核酸是与本文表1中列出的基因相同途径中的基因的控制区,启动子,增强子,内含子,外显子,转录起始位点,编码区或非编码区。靶核酸可以例如是与本文表1中列出的基因相同途径中且上游的基因的控制区,启动子,增强子,内含子,外显子,转录起始位点,编码区或非编码区。另外,在靶向两个或更多个基因或位置的情况下,或者,靶核酸可以例如是与本文表1中列出的基因相同途径中且下游的基因的控制区,启动子,增强子,内含子,外显子,转录起始位点,编码区或非编码区。另外,在靶向两个或更多个基因或位置的情况下,或者,靶核酸可以例如是与本文表1中列出的基因平行途径中的基因的控制区,启动子,增强子,内含子,外显子,转录起始位点,编码区或非编码区。与表1中列出的一种或多种基因相同途径或平行途径中的示例性基因描述于例如KEGG途径数据库(可从www.genome.jp/kegg/pathway.html获得)。
如本文所用,“靶位置”是指靶核酸上与向导RNA(例如,与CRISPR核酸酶复合)或支架RNA杂交的位点。优化的靶位置包括但不限于WO 2016/011080中描述的针对转录激活而优化的一个或多个靶位置。
“附加型载体”或“附加型增殖载体”是指在哺乳动物细胞中作为附加型元件持续存在或增殖的质粒或病毒载体。本文所述的附加型载体可编码一种或多种组分(例如,CRISPR核酸酶,向导RNA,锌指核酸酶,TALEN,TAL效应物,支架RNA,转录激活因子,亲和元件或其组合),用于通过转录激活来治疗疾病或病症(例如,表1的疾病或病症)。附加型载体包括但不限于腺相关病毒(AAV)载体和爱泼斯坦-巴尔病毒(EBV)载体。合适的AAV载体以及制备和使用此类AAV载体的方法,例如用于将载体递送到靶细胞中的方法描述于Samulski R等,(1987),J.Virol.61:3096-3101;Walsh等,Proc.Soc.Exp.Biol.Med.204:289-300(1993);Fisher K J等,(1996),J.Virol,70:520-532;Samulski R等,(1989),J.Virol.63:3822-3826;美国专利号5,252,479;美国专利号5,139,941;美国专利号5,436,146;国际专利申请号WO 94/13788;和国际专利申请号WO 93/24641,其全部公开内容在此通过引用全文纳入本文。
如本文所用,术语“锌指核酸酶”是指锌指DNA结合蛋白(或较大蛋白质内的锌指DNA结合结构域),其通过一个或多个锌指以序列特异性方式结合DNA,其是锌指结合结构域内的氨基酸序列的区域,其结构通过锌离子的配位而稳定。术语锌指DNA结合蛋白常缩写为锌指核酸酶或ZFN。
如本文所用,术语“转录激活因子样效应核酸酶”是指蛋白质,其包括与DNA切割结构域融合的转录激活因子样效应DNA结合结构域,其以序列特异性方式结合DNA。术语转录激活因子样效应核酸酶通常缩写为TALEN。
发明详述
导言
本文描述了通过增加靶基因的转录来治疗哺乳动物对象中与基因转录减少,基因产物量减少或基因产物活性降低相关,由其加剧或由其引起的疾病的方法和组合物。此类方法和组合物可用于例如治疗对象中的单倍体机能不全疾病。可通过本文所述的方法和组合物治疗的单倍体机能不全疾病包括但不限于表1中列出的一种或多种疾病。表1提供来自国家生物信息学中心(NCBI)的Entrez基因ID(第2列)和由人类基因组命名委员会(HGNC)提供的相应基因符号(第1列),对支持参考文献的PubMed ID(PMID)引用(第4列),以及相关病症的简要描述(第5列)。该表改编自Dang等,European Journal of Human Genetics(2008)16,1350-57的补充表1以及ClinVar(https://www.ncbi.nlm.nih.gov/clinvar)和ClinGen(https://www.clinicalgenome.org)数据库。
核酸酶
在本文所述方法的一些实施方式中,使宿主细胞与一种或多种核酸酶接触。在一些实施方式中,核酸酶是内切核酸酶,位点特异性重组酶,转座酶,拓扑异构酶,锌指核酸酶,TALEN,并且包括其修饰的衍生物和变体。
在一些实施方式中,核酸酶能够靶向靶位点内的指定核苷酸或区域。在一些实施方式中,核酸酶能够靶向位于靶位点的5′和3′区域之间的区域。在另一个实施方式中,核酸酶能够靶向位于靶位点的5′和3′区域上游或下游的区域(例如,转录起始位点(TSS)的上游或下游)。识别序列是由核酸酶特异性识别和/或结合的多核苷酸序列。识别位点序列的长度可以变化,并且包括例如长度为至少10,12,14,16,18,19,20,21,22,23,24,25,26,27,28,29,30,35,40,45,50,55,60,65,70或更多个核苷酸的核苷酸序列。在一些实施方式中,识别序列是回文序列,即一条DNA链上的序列在互补DNA链上以相反方向读取相同序列。在一些实施方式中,核酸酶的靶位点在识别序列内。
锌指核酸酶
在一些实施方式中,所述核酸酶是锌指核酸酶(ZFN)。ZFN通常包含锌指DNA结合结构域和核酸酶结构域。通常,ZFN包括两个锌指阵列(ZFA),每个锌指阵列与非特异性内切核酸酶的单个亚基融合,例如来自FokI酶的核酸酶结构域,其在二聚化时变得有活性。通常,单个ZFA由3或4个锌指结构域组成,每个锌指结构域设计用于识别特定的核苷酸三联体(GGC,GAT等)。因此,包含两个“3指”ZFA的ZFN能够识别18碱基对的靶位点(即识别序列);18碱基对识别序列通常是独特的,甚至在诸如人和植物的大基因组中也是如此。通过指导两种FokI核酸酶单体的共定位和二聚化,ZFN产生可靶向特定基因座(例如基因,启动子或增强子)的功能性位点特异性内切核酸酶。
可用于本文公开的方法的锌指核酸酶包括已知的那些和被工程改造以对本文所述的一个或多个靶位点(例如,启动子或增强子核苷酸序列)具有特异性的ZFN。锌指结构域适用于设计特异性结合宿主细胞基因组靶位点内的选定多核苷酸识别序列的多肽。ZFN可包含与非特异性内切核酸酶结构域连接的工程改造的DNA结合锌指结构域,例如来自II型核酸内切酶如HO或FokI的核酸酶结构域。在一些实例中,锌指DNA结合结构域可以与保留DNA切口和/或切割活性的位点特异性重组酶,转座酶或其衍生物融合。
在一个优选的实施方式中,其他功能可以与锌指结合结构域融合,包括但不限于转录激活因子结构域(如VP16,VP48,VP64,VP160等)或转录抑制结构域(如KRAB)。在一个实施方式中,对锌指核酸酶进行工程改造,使得锌指核酸酶包含选自VP16,VP48,VP64或VP160的转录激活因子结构域。在一个实施方式中,对锌指核酸酶进行工程改造,使得锌指核酸酶包含选自HSF1,VP16,VP64,p65,RTA,MyoD1,SET7,VPR,组蛋白乙酰转移酶p300,TET1羟化酶催化结构域,LSD1,CIB1,AD2,CR3,GATA4,p53,SP1,MEF2C,TAX,PPAR-γ和SET9的转录激活因子结构域。例如,显示与γ-球蛋白基因的启动子区域相互作用的工程改造的锌指转录激活因子增强初级成体成红细胞中胎儿血红蛋白的产生(Wilber等,Blood,115(15):3033-3041)。其他多指的锌指转录因子也是本领域已知的,包括Beerli和Barbas中公开的那些(参见Nature Technology,(2002)20:135-141)。
每个锌指结构域识别靶DNA中的三个连续碱基对。例如,三指结构域识别九个连续核苷酸的序列,具有核酸酶的二聚化要求,两组锌指三联体用于结合18个核苷酸的识别序列。有用的锌指模块包括识别各种GNN和ANN三联体的那些(Dreier等,(2001)J Biol Chem276:29466-78;Dreier等,(2000)J Mol Biol 303:489-502;Liu等,(2002)J Biol Chem277:3850-6),以及识别各种CNN或TNN三联体的那些(Dreier等,(2005)J Biol Chem 280:35588-97;Jamieson等,(2003)Nature Rev Drug Discovery 2:361-8)。还参见Durai等,(2005)Nucleic Acids Res 33:5978-90;Segal,(2002)Methods 26:76-83;Porteus和Carroll,(2005)Nat Biotechnology 23:967-73;Pabo等,(2001)Ann Rev Biochem 70:313-40;Wolfe等,(2000)Ann Rev Biophys Biomol Struct 29:183-212;Segal和Barbas(2001)Curr Opin Biotechnol 12:632-7;Segal等,(2003)Biochemistry 42:2137-48;Beerli和Barbas,(2002)Nat Biotechnol 20:135-41;Carroll等,(2006)NatureProtocols 1:1329;Ordiz等,(2002)Proc Natl Acad Sci USA 99:13290-5;Guan等,(2002)Proc Natl Acad Sci USA 99:13296-301;WO2002099084;WO00/42219;WO02/42459;WO2003062455;US20030059767;美国专利申请公开号2003/0108880;美国专利号6,140,466,6,511,808和6,453,242。有用的锌指核酸酶还包括WO03/080809;WO05/014791;WO05/084190;WO08/021207;WO09/042186;WO09/054985;和WO10/065123中描述的那些。
在一些实施方式中,ZFN包含融合蛋白,所述融合蛋白具有与工程改造的锌指结合结构域融合的IIS型限制性内切核酸酶的切割结构域,其中所述结合结构域还包含一种或多种转录激活因子。在一些实施方式中,IIS型限制性内切核酸酶选自HO内切核酸酶或FokI内切核酸酶。在一些实施方式中,锌指结合结构域包含3个,4个,5个或6个锌指。在另一个实施方式中,锌指结合结构域特异性结合对应于本文公开的启动子或增强子的识别序列(例如,SIM1,MC4R,PKD1,SETD5,THUMPD3,SCN2A和PAX6启动子或增强子)。在一个实施方式中,一种或多种转录激活因子选自VP16,VP48,VP64或VP160。通常,ZFN的DNA结合结构域含有3至6个单独的锌指重复,并且可以识别9至18个连续核苷酸。可以设计每个ZFN以靶向宿主细胞基因组中的特定靶位点,例如基因内的启动子序列,增强子序列或外显子/内含子。
TALEN
在该方法的一些实施方式中,核酸酶是TALEN。TAL效应物(TALE)是黄单胞菌属细菌分泌的蛋白质,通过结合宿主DNA和激活效应物特异性宿主基因在疾病或触发防御机制中发挥重要作用。参见,例如,Gu等,(2005)Nature 435:1122-5;Yang等,(2006)Proc.Natl.Acad.Sci.USA 103:10503-8;Kay等,(2007)Science 318:648-51;Sugio等,(2007)Proc.Natl.Acad.Sci.USA 104:10720-5;Romer等,(2007)Science 318:645-8;Boch等,(2009)Science 326(5959):1509-12;以及Moscou和Bogdanove,(2009)326(5959):1501。TALEN包含与DNA切割结构域融合的TAL效应物DNA结合结构域。DNA结合结构域通过一个或多个串联重复结构域以序列特异性方式与DNA相互作用。重复序列通常包含33-34个高度保守的氨基酸,具有不同的第12和第13个氨基酸。这两个位置,称为重复可变的双残基(RVD)是高度可变的并且显示出与特定核苷酸识别的强相关性(Boch等,(2009)Science326(5959):1509-12;以及Moscou和Bogdanove,(2009)326(5959):1501)。氨基酸序列和DNA识别序列之间的关系允许通过选择含有合适RVD的重复区段的组合来构建特异性DNA结合结构域。
可以将TAL-效应物DNA结合结构域工程改造以结合靶DNA序列并与核酸酶结构域融合,例如IIS型限制性内切核酸酶,例如FokI(参见例如,Kim等,(1996)Proc.Natl.Acad.Sci.USA 93:1156-1160)。在一些实施方式中,核酸酶结构域可包含一个或多个改善切割特异性(参见Doyon等,(2011)Nature Methods,8(1):74-9)和切割活性(Guo等,(2010)Journal of Molecular Biology,400(1):96-107)的突变(例如,FokI变体)。可用作核酸酶结构域的其他有用的核酸内切酶包括但不限于HhaI,HindIII,Nod,BbvCI,EcoRI,BglI和AlwI。在一些实施方式中,TALEN可包含TAL效应物DNA结合结构域,其包含多个TAL效应物重复序列,其与靶DNA中的特定核苷酸序列(即识别序列)结合。尽管不应解释为限制,但可用于本文提供的方法的TALEN包括WO10/079430和美国专利申请公开号201I/0145940中描述的那些。
在一些实施方式中,TAL效应物DNA结合结构域可包含10个或更多个DNA结合重复序列,优选15个或更多个DNA结合重复序列。在一些实施方式中,每个DNA结合重复序列包含确定靶DNA中碱基对识别的RVD,并且其中每个DNA结合重复序列负责识别靶DNA中的一个碱基对。在一些实施方式中,RVD包括以下中的一个或多个:用于识别C的HD;用于识别T的NG;用于识别A的NI;用于识别G或A的NN;用于识别A或C或G或T的NS;用于识别C或T的N*,其中*表示RVD的第二位置的间隙;用于识别T的HG;用于识别T的H*,其中*表示RVD的第二位置的间隙;用于识别T的IG;用于识别G的NK;用于识别C的HA;用于识别C的ND;用于识别C的HI;用于识别G的HN;用于识别G的NA;用于识别G或A的SN;和用于识别T的YG。
在优选的实施方式中,对TALEN进行工程改造使得TAL效应物包含一个或多个转录激活因子结构域(例如,VP16,VP48,VP64或VP160)。例如,在TAL效应物的c-末端具有转录激活因子结构域的工程改造的TAL效应物显示出调节人293FT细胞中Sox2和Klf4基因的转录(Zhang等,Nature Biotechnology,29(2):149-153(2011))。其他TAL效应物转录因子(TALE-TF)也是本领域已知的,包括Perez-Pinera等,(Nature Methods,(2013)10(3):239-242)中公开的那些,其使用TALE-TF证明了人293T细胞中IL1RN,KLK3,CEACAM5和ERBB2基因的调节。在一些实施方式中,一个或多个转录激活因子结构域位于存在于TAL效应物的C-末端存在的核定位信号(NLS)附近。在另一个实施方式中,TALE-TF可以结合靶基因的转录起始位点(TSS)上游或下游的附近位点。在一个实施方式中,TAL效应物包含选自VP16,VP48,VP64或VP160的转录激活因子结构域。在一个实施方式中,TAL效应物包含选自HSF1,VP16,VP64,p65,RTA,MyoD1,SET7,VPR,组蛋白乙酰转移酶p300,TET1羟化酶催化结构域,LSD1,CIB1,AD2,CR3,GATA4,p53,SP1,MEF2C,TAX,PPAR-γ和SET9的转录激活因子结构域。
在一些实施方式中,TALEN包含与DNA切割结构域融合的TAL效应物DNA结合结构域,其中TAL效应物包含转录激活因子。在一些实施方式中,DNA切割结构域是选自HO内切核酸酶或FokI内切核酸酶的IIS型限制性内切核酸酶。在一些实施方式中,TAL效应物DNA结合结构域特异性结合对应于本文公开的启动子区域或增强子区域的识别序列(例如,SIM1,MC4R,PKD1,SETD5,THUMPD3,SCN2A和PAX6启动子或增强子)。通常,设计TALEN的DNA结合结构域以靶向宿主细胞中的特定靶位点,例如启动子序列或增强子序列。
在一些实施方式中,锌指核酸酶或TALEN的靶位点对宿主细胞是内源的,例如宿主细胞基因组中的天然基因座。在一些实施方式中,根据待在该方法中使用的核酸酶的类型选择靶位点。如果待使用的核酸酶是锌指核酸酶,则可以使用多个公开可用的在线资源来选择最佳靶位点。参见,例如Reyon等,BMC Genomics 12:83(2011),其通过引用全文纳入本文。公开可用的锌指核酸酶工程改造方法包括:(1)依赖于上下文的组装(CoDA),(2)寡聚化池工程改造(OPEN),(3)模块化组装,(4)ZiFiT(用于设计工程改造的锌指阵列的互联网可访问软件),(5)ZiFDB(互联网可访问的锌指和工程改造的锌指阵列数据库),和(6)ZFNGenome。例如,OPEN是一种公开可用的工程改造锌指阵列的工具,具有高特异性和体内功能,并已成功用于生成在植物,斑马鱼和人体细胞和多能干细胞中有效发挥作用的ZFN。OPEN是一种基于选择的方法,其中筛选预先构建的候选ZFA随机化库以鉴定对所需靶序列具有高亲和力和特异性的那些。此外,ZFNGenome是一种基于GBrowse的工具,用于识别和可视化OPEN生成的ZFN的潜在靶位点。ZFNGenome在模式生物的测序和注释基因组中提供了潜在ZFN靶位点的概要。ZFNGenome包含超过1100万个潜在的ZFN靶位点,在以下7种模式生物的完全测序基因组内映射:酿酒酵母(S.cerevisiae),莱茵衣藻(C.reinhardtii),拟南芥(A.thaliana),黑腹果蝇(D.melanogaster),斑马鱼(D.rerio),秀丽隐杆线虫(C.elegans)和智人(H.sapiens)。ZFNGenome提供有关每个潜在ZFN靶位点的信息,包括其染色体位置和相对于转录起始位点的位置。用户可以使用几种不同的标准(例如,基因ID,转录物ID,靶位点序列)来查询ZFNGenome。
在一些实施方式中,如果核酸酶是TALEN,则可以根据Sanjana等,NatureProtocols,7:171-192(2012)中描述的方法选择最佳靶位点,其通过引用全文纳入本文。TALEN以二聚体起作用,并且一对TALEN(称为左右TALEN)靶向DNA相反链上的序列。TALEN被工程改造成TALE DNA结合结构域和单体FokI催化结构域的融合体。为了促进FokI二聚化,通常选择左和右TALEN靶位点,间隔为约14-20个碱基。
在一些实施方式中,提供了可用于本文所述方法的一种或多种核酸酶,例如以纯化的蛋白质递送到宿主细胞中。在一些实施方式中,通过包含编码核酸酶的核酸的多核苷酸提供一种或多种核酸酶。在另一个实施方式中,可以将一种或多种核酸酶以纯化的RNA引入宿主细胞中,所述纯化的RNA可以在宿主细胞核中直接翻译。在优选的实施方式中,包含编码核酸酶的核酸的多核苷酸包含允许在宿主细胞内表达核酸酶的表达载体。合适的表达载体包括附加型载体。
在一些实施方式中,当核酸酶充当需要单独表达每种单体的二聚体时,例如锌指核酸酶和TALEN,二聚体的每个单体可以从相同的附加型载体或不同的附加型载体表达。在另一个实施方式中,其中将多个核酸酶引入细胞以在不同靶位点处引入双链断裂,核酸酶可以在单个附加型载体上或在分开的附加型载体上编码。
在一个方面,本发明提供治疗哺乳动物对象中单倍体机能不全疾病的方法,该方法包括使对象的细胞与包含锌指核酸酶或TALEN的组合物接触,在所述细胞的核中存在的条件下,锌指核酸酶或TALEN与所述启动子区域或增强子区域特异性杂交;其中所述接触形成包含锌指核酸酶或TALEN的DNA结合结构域和启动子区域或增强子区域的复合物,其中所述复合物以足够的量和持续时间激活单倍体机能不全的基因的野生型拷贝的转录以治疗对象的单倍体机能不全疾病。在一些实施方式中,启动子或增强子区域对应于表1中列出的任何基因的启动子或增强子区域(即,控制区域)。
在一些实施方式中,接触包括使细胞与编码锌指核酸酶或TALEN的附加型载体接触。在一些实施方式中,附加型载体是非整合的。在一些实施方式中,锌指核酸酶或TALEN已被修饰为包含一个或多个转录激活结构域。在一些实施方式中,一个或多个转录激活结构域选自下组:HSF1,VP16,VP64,p65,MyoD1,RTA,SET7/9,VPR,组蛋白乙酰转移酶p300,TET家族蛋白的羟化酶催化结构域(例如,TET1羟化酶催化结构域),LSD1,CIB1,AD2,CR3,EKLF1,GATA4,PRVIE,p53,SP1,MEF2C,TAX和PPARγ。在一些实施方式中,转录激活结构域是VP64。在一些实施方式中,单倍体机能不全的基因是SIM1,瘦蛋白,瘦蛋白受体,MC4R,SCN2A,SETD5,PAX6,PKD1,MC3R,POMC,STAT3,STAT5,SOCS3,GHR,NPY,NPY1R,NPY2R,NPY5R,PYY,AMPK(PRKAA1,PRKAA2,PRKAB1,PRKAB2,PRKAG1,PRKAG2,PRKAG3),OXT,JAK2,SHP2,NOS3,NROB2,BRS3,CARTPT,FABP4,HTR2C,IL6,NHLH2,NMU,NPB,NPBWRI,PNPLA2,UCP3,ADIPOQ,APOA5,ARNT2,ASIP,G1QTNF2,C3AR1,CCK,CPT1B,CSF2,DGAT1,DGAT2,GHRL,GHSR,HSD11B1,HTR7,INSIG1,INSIG2,LIPC,NMURI,NMUR2,NPBWR2,NTS,PPARGC1A,PPY,RETN,SIRT1,TGFBR2,WDTC1,或FOXO1。
表1:与单倍体机能不全疾病关联的@@基因
组合物
附加型载体
本文描述了用作靶向转录激活结构域到遗传控制元件的组分的组合物,以增加内源性基因的转录,从而治疗与基因转录减少、基因产物的量减少、或基因产物的活性降低相关,由其加剧或由其导致的疾病或病症。组分包括向导RNA,支架RNA,支架RNA配体,CRISPR核酸酶,转录激活结构域,亲和标签,亲和标签配体,其一种或多种的融合蛋白,及其组合。组分包括附加型载体,其编码一种或多种向导RNA,支架RNA,支架RNA配体,CRISPR核酸酶,转录激活结构域,亲和标签,亲和标签配体,其一种或多种的融合蛋白,及其组合。附加型载体可以是单链或双链DNA,单链RNA或双链RNA。
在一个实施方式中,提供了编码CRISPR核酸酶的附加型载体,例如催化失活的CRISPR核酸酶。在一些情况下,附加型载体编码与一个或多个转录激活结构域融合的CRISPR核酸酶。在一些情况下,附加型载体编码与一个或多个亲和标签融合的CRISPR核酸酶。在一些情况下,附加型载体编码与一个或多个亲和标签和一个或多个转录激活结构域融合的CRISPR核酸酶。CRISPR核酸酶融合蛋白可含有在CRISPR核酸酶的氨基末端,羧基末端或其组合处融合的转录激活因子结构域和/或亲和标签。另外或可替代地,可以通过在表面环内插入转录激活因子结构域和/或亲和标签来修饰CRISPR核酸酶。附加型载体(例如,AAV载体)可含有与CRISPR核酸酶或CRISPR核酸酶融合蛋白操作性地连接的启动子。启动子可以是对于病毒来源内源性的启动子,附加型载体是从该病毒来源获得的。例如,在附加型载体是AAV载体的情况下,启动子可以是内源性AAV启动子。或者,启动子可以是与附加型载体衍生的病毒来源形式异源的启动子。例如,在附加型载体是AAV载体的情况下,启动子可以是非AAV启动子。启动子可以是转录激活所靶向的基因(例如,选自表1的基因)的启动子或与靶向的基因异源的启动子。启动子可以是组成型的(例如,CMV启动子,CAG启动子,CBA启动子,EF1a启动子,PGK启动子等),组织特异性的(例如,突触蛋白,camKIIa,GFAP,RPE,ALB,TBG,MBP,MCK,TNT,或aMHC,启动子等),或诱导型的(例如,四环素诱导型的)。
在一个实施方式中,提供了编码锌指核酸酶的附加型载体。在一些情况下,附加型载体编码与一个或多个转录激活结构域融合的锌指核酸酶。在一些情况下,附加型载体编码与一个或多个亲和标签融合的锌指核酸酶。在一些情况下,附加型载体编码与一个或多个亲和标签和一个或多个转录激活结构域融合的锌指核酸酶。锌指核酸酶融合蛋白可含有在锌指核酸酶的氨基末端,羧基末端或其组合处融合的转录激活因子结构域和/或亲和标签。附加型载体(例如,AAV载体)可含有与锌指核酸酶或锌指核酸酶融合蛋白操作性地连接的启动子。启动子可以是对于病毒来源内源性的启动子,附加型载体是从该病毒来源获得的。例如,在附加型载体是AAV载体的情况下,启动子可以是内源性AAV启动子。或者,启动子可以是与附加型载体衍生的病毒来源形式异源的启动子。例如,在附加型载体是AAV载体的情况下,启动子可以是非AAV启动子。启动子可以是转录激活所靶向的基因(例如,选自表1的基因)的启动子或与靶向的基因异源的启动子。启动子可以是组成型的(例如,CMV启动子,CAG启动子,CBA启动子,EF1a启动子,PGK启动子等),组织特异性的(例如,突触蛋白,camKIIa,GFAP,RPE,ALB,TBG,MBP,MCK,TNT,或aMHC,启动子等),或诱导型的(例如,四环素诱导型的)。
在一个实施方式中,提供了编码TALEN的附加型载体。在一些情况下,附加型载体编码与一个或多个转录激活结构域融合的TALEN。在一些情况下,附加型载体编码与一个或多个亲和标签融合的TALEN。在一些情况下,附加型载体编码与一个或多个亲和标签和一个或多个转录激活结构域融合的TALEN。TALEN可含有在氨基末端,羧基末端或其组合处融合的转录激活因子结构域和/或亲和标签。附加型载体(例如,AAV载体)可含有与TALEN操作性连接的启动子。启动子可以是对于病毒来源内源性的启动子,附加型载体是从该病毒来源获得的。例如,在附加型载体是AAV载体的情况下,启动子可以是内源性AAV启动子。或者,启动子可以是与附加型载体衍生的病毒来源形式异源的启动子。例如,在附加型载体是AAV载体的情况下,启动子可以是非AAV启动子。启动子可以是转录激活所靶向的基因(例如,选自表1的基因)的启动子或与靶向的基因异源的启动子。启动子可以是组成型的(例如,CMV启动子,CAG启动子,CBA启动子,EF1a启动子,PGK启动子等),组织特异性的(例如,突触蛋白,camKIIa,GFAP,RPE,ALB,TBG,MBP,MCK,TNT,或aMHC,启动子等),或诱导型的(例如,四环素诱导型的)。
在一个实施方式中,提供了编码向导RNA的附加型载体。该向导RNA可以是小向导RNA。向导RNA可以是协同激活介质的组分(例如,如Zhang等,Scientific Reports 5,文章编号16277(2015);和Konermann等,2015,Nature 517:583-8中所述)。附加型载体(例如,AAV载体)可含有与向导RNA操作性连接的启动子。启动子可以是对于病毒来源内源性的启动子,附加型载体是从该病毒来源获得的。例如,在附加型载体是AAV载体的情况下,启动子可以是内源性AAV启动子。或者,启动子可以是与附加型载体衍生的病毒来源形式异源的启动子。例如,在附加型载体是AAV载体的情况下,启动子可以是非AAV启动子。启动子可以是转录激活所靶向的基因(例如,选自表1的基因)的启动子或与靶向的基因异源的启动子。启动子可以是组成型的(例如,CMV启动子,CAG启动子,CBA启动子,EF1a启动子,PGK启动子等),组织特异性的(例如,突触蛋白,camKIIa,GFAP,RPE,ALB,TBG,MBP,MCK,TNT,或aMHC,启动子等),或诱导型的(例如,四环素诱导型的)。
在一些实施方式中,附加型载体编码CRISPR核酸酶和向导RNA。在一些情况下,CRISPR核酸酶与启动子操作性地连接,并且向导RNA与不同的启动子操作性地连接。在一些情况下,两个启动子是相同的。在一些情况下,两个启动子是不同的。在一些情况下,两个启动子都是诱导型的。在一些情况下,两个启动子都是组织特异性的。在一些情况下,两个启动子都是组成型的。在一些情况下,一个启动子是组成型的,而另一个启动子是组织特异性的。在一些情况下,一个启动子是组成型的,而另一个启动子是诱导型的。在一些情况下,一个启动子是组织特异性的,而另一个启动子是诱导型的。
在一些实施方式中,附加型载体编码支架RNA,例如WO 2016/054106中描述的支架RNA。在一些实施方式中,附加型载体还编码CRISPR核酸酶。另外或替代地,附加型载体还可以编码一个或多个转录激活结构域。在一些情况下,转录激活结构域与结合支架RNA的结合元件融合(例如,结合支架RNA的ms2,f6,PP7,com或L7a序列)。
在一些实施方式中,提供了两种或更多种不同的附加型载体。例如,可以提供编码CRISPR核酸酶的附加型载体和编码向导RNA的分开的附加型载体。或者,可以提供编码CRISPR核酸酶和向导RNA的附加型载体,并且可以提供编码一个或多个转录激活结构域的分开的附加型载体。在一些情况下,一个或多个转录激活结构域与结合支架RNA的结合元件融合(例如,结合SAM的向导RNA)。在一些情况下,一个或多个转录激活结构域与结合CRISPR核酸酶的亲和标签的结合元件融合。在一些实施方式中,提供编码支架RNA的附加型载体,并提供分开的附加型载体,其编码与结合支架RNA的结合元件融合的一个或多个转录激活结构域。
在一些实施方式中,附加型载体编码锌指核酸酶或TALEN,其与表1中列出的基因,或与表1中列出基因的相同途径或平行途径中的基因杂交或特异性杂交(例如,在严谨杂交条件下)。在一些实施方式中,附加型载体编码锌指核酸酶或TALEN,其与表1中列出的基因,或与表1中列出基因的相同途径或平行途径中的基因的控制区域(例如,启动子区域或增强子区域)杂交或特异性杂交(例如,在严谨杂交条件下)。
在一些情况下,附加型载体编码锌指核酸酶或TALEN,其与以下杂交或特异性杂交(例如,在严谨杂交条件下):SIM1,瘦蛋白,瘦蛋白受体,MC4R,SCN2A,SETD5,PAX6,PKD1,MC3R,POMC,STAT3,STAT5,SOCS3,GHR,NPY,NPY1R,NPY2R,NPY5R,PYY,AMPK(PRKAA1,PRKAA2,PRKAB1,PRKAB2,PRKAG1,PRKAG2,PRKAG3),OXT,JAK2,SHP2,NOS3,NROB2,BRS3,CARTPT,FABP4,HTR2C,IL6,NHLH2,NMU,NPB,NPBWRI,PNPLA2,UCP3,ADIPOQ,APOA5,ARNT2,ASIP,C1QTNF2,C3AR1,CCK,CPT1B,CSF2,DGAT1,DGAT2,GHRL,GHSR,HSD11B1,HTR7,INSIG1,INSIG2,LIPC,NMURI,NMUR2,NPBWR2,NTS,PPARGC1A,PPY,RETN,SIRT1,TGFBR2,WDTC1,或FOXO1。
在一些情况下,附加型载体编码锌指核酸酶或TALEN,其与以下的控制区域(例如,启动子区域或增强子区域)杂交或特异性杂交(例如,在严谨杂交条件下):SIM1,瘦蛋白,瘦蛋白受体,MC4R,SCN2A,SETD5,PAX6,PKD1,MC3R,POMC,STAT3,STAT5,SOCS3,GHR,NPY,NPY1R,NPY2R,NPY5R,PYY,AMPK(PRXAA1,PRKAA2,PRKAB1,PRKAB2,PRKAG1,PRKAG2,PRKAG3),OXT,JAK2,SHP2,NOS3,NROB2,BRS3,CARTPT,FABP4,HTR2C,IL6,NHLH2,NMU,NPB,NPBWRI,PNPLA2,UCP3,ADIPOQ,APOA5,ARNT2,ASIP,C1QTNF2,C3AR1,CCK,CPT1B,CSF2,DGAT1,DGAT2,GHRL,GHSR,HSD11B1,HTR7,INSIG1,INSIG2,LIPC,NMURI,NMUR2,NPBWR2,NTS,PPARGC1A,PPY,RETN,SIRT1,TGFBR2,WDTC1,或FOXO1。
在一些情况下,附加型载体编码锌指核酸酶或TALEN,其与SIM1的控制区域(例如,启动子区域或增强子区域)杂交或特异性杂交(例如,在严谨杂交条件下)。在一些情况下,附加型载体编码锌指核酸酶或TALEN,其与SIM1的启动子区域杂交或特异性杂交(例如,在严谨杂交条件下)。在一些情况下,附加型载体编码锌指核酸酶或TALEN,其与SIM1的增强子区域杂交或特异性杂交(例如,在严谨杂交条件下)。在一些情况下,附加型载体编码锌指核酸酶或TALEN,其与MC4R的控制区域(例如,启动子区域或增强子区域)杂交或特异性杂交(例如,在严谨杂交条件下)。在一些情况下,附加型载体编码锌指核酸酶或TALEN,其与MC4R的启动子区域杂交或特异性杂交(例如,在严谨杂交条件下)。在一些情况下,附加型载体编码锌指核酸酶或TALEN,其与MC4R的增强子区域杂交或特异性杂交(例如,在严谨杂交条件下)。在一些情况下,附加型载体编码锌指核酸酶或TALEN,其与PDK1的控制区域(例如,启动子区域或增强子区域)杂交或特异性杂交(例如,在严谨杂交条件下)。在一些情况下,附加型载体编码锌指核酸酶或TALEN,其与PDK1的启动子区域杂交或特异性杂交(例如,在严谨杂交条件下)。在一些情况下,附加型载体编码锌指核酸酶或TALEN,其与PDK1的增强子区域杂交或特异性杂交(例如,在严谨杂交条件下)。在一些情况下,附加型载体编码锌指核酸酶或TALEN,其与SETD5的控制区域(例如,启动子区域或增强子区域)杂交或特异性杂交(例如,在严谨杂交条件下)。在一些情况下,附加型载体编码锌指核酸酶或TALEN,其与SETD5的启动子区域杂交或特异性杂交(例如,在严谨杂交条件下)。在一些情况下,附加型载体编码锌指核酸酶或TALEN,其与SETD5的增强子区域杂交或特异性杂交(例如,在严谨杂交条件下)。在一些情况下,附加型载体编码锌指核酸酶或TALEN,其与SETD5的控制区域(例如,启动子区域或增强子区域)杂交或特异性杂交(例如,在严谨杂交条件下)。在一些情况下,附加型载体编码锌指核酸酶或TALEN,其与SCN2A的启动子区域杂交或特异性杂交(例如,在严谨杂交条件下)。在一些情况下,附加型载体编码锌指核酸酶或TALEN,其与SCN2A的增强子区域杂交或特异性杂交(例如,在严谨杂交条件下)。在一些情况下,附加型载体编码锌指核酸酶或TALEN,其与PAX6的控制区域(例如,启动子区域或增强子区域)杂交或特异性杂交(例如,在严谨杂交条件下)。在一些情况下,附加型载体编码锌指核酸酶或TALEN,其与PAX6的启动子区域杂交或特异性杂交(例如,在严谨杂交条件下)。在一些情况下,附加型载体编码锌指核酸酶或TALEN,其与PAX6的增强子区域杂交或特异性杂交(例如,在严谨杂交条件下)。
在一些实施方式中,附加型载体编码指导或支架RNA,其与表1中列出的基因,或与表1中列出基因的相同途径或平行途径中的基因杂交或特异性杂交(例如,在严谨杂交条件下)。在一些实施方式中,附加型载体编码指导或支架RNA,其与表1中列出的基因,或与表1中列出基因的相同途径或平行途径中的基因的控制区域(例如,启动子区域或增强子区域)杂交或特异性杂交(例如,在严谨杂交条件下)。
在一些情况下,附加型载体编码指导或支架RNA,其与以下杂交或特异性杂交(例如,在严谨杂交条件下):SIM1,瘦蛋白,瘦蛋白受体,MC4R,SCN2A,SETD5,PAX6,PKD1,MC3R,POMC,STAT3,STAT5,SOCS3,GHR,NPY,NPY1R,NPY2R,NPY5R,PYY,AMPK(PRKAA1,PRKAA2,PRKAB1,PRKAB2,PRKAG1,PRKAG2,PRKAG3),OXT,JAK2,SHP2,NOS3,NROB2,BRS3,CARTPT,FABP4,HTR2C,IL6,NHLH2,NMU,NPB,NPBWRI,PNPLA2,UCP3,ADIPOQ,APOA5,ARNT2,ASIP,C1QTNF2,C3AR1,CCK,CPT1B,CSF2,DGAT1,DGAT2,GHRL,GHSR,HSD11B1,HTR7,INSIG1,INSIG2,LIPC,NMURI,NMUR2,NPBWR2,NTS,PPARGC1A,PPY,RETN,SIRT1,TGFBR2,WDTC1,或FOXO1。
在一些情况下,附加型载体编码指导或支架RNA,其与以下的控制区域(例如,启动子区域或增强子区域)杂交或特异性杂交(例如,在严谨杂交条件下):SIM1,瘦蛋白,瘦蛋白受体,MC4R,SCN2A,SETD5,PAX6,PKD1,MC3R,POMC,STAT3,STAT5,SOCS3,GHR,NPY,NPY1R,NPY2R,NPY5R,PYY,AMPK(PRKAA1,PRKAA2,PRKAB1,PRKAB2,PRKAG1,PRKAG2,PRKAG3),OXT,JAK2,SHP2,NOS3,NROB2,BRS3,CARTPT,FABP4,HTR2C,IL6,NHLH2,NMU,NPB,NPBWRI,PNPLA2,UCP3,ADIPOQ,APOA5,ARNT2,ASIP,C1QTNF2,C3AR1,CCK,CPT1B,CSF2,DGAT1,DGAT2,GHRL,GHSR,HSD11B1,HTR7,INSIG1,INSIG2,LIPC,NMURI,NMUR2,NPBWR2,NTS,PPARGC1A,PPY,RETN,SIRT1,TGFBR2,WDTC1,或FOXO1。
在一些情况下,附加型载体编码指导或支架RNA,其与SIM1的控制区域(例如,启动子区域或增强子区域)杂交或特异性杂交(例如,在严谨杂交条件下)。在一些情况下,附加型载体编码指导或支架RNA,其与SIM1的启动子区域杂交或特异性杂交(例如,在严谨杂交条件下)。在一些情况下,附加型载体编码指导或支架RNA,其与SIM1的增强子区域杂交或特异性杂交(例如,在严谨杂交条件下)。在一些情况下,附加型载体编码指导或支架RNA,其与MC4R的控制区域(例如,启动子区域或增强子区域)杂交或特异性杂交(例如,在严谨杂交条件下)。在一些情况下,附加型载体编码指导或支架RNA,其与MC4R的启动子区域杂交或特异性杂交(例如,在严谨杂交条件下)。在一些情况下,附加型载体编码指导或支架RNA,其与MC4R的增强子区域杂交或特异性杂交(例如,在严谨杂交条件下)。在一些情况下,附加型载体编码指导或支架RNA,其与PDK1的控制区域(例如,启动子区域或增强子区域)杂交或特异性杂交(例如,在严谨杂交条件下)。在一些情况下,附加型载体编码指导或支架RNA,其与PDK1的启动子区域杂交或特异性杂交(例如,在严谨杂交条件下)。在一些情况下,附加型载体编码指导或支架RNA,其与PDK1的增强子区域杂交或特异性杂交(例如,在严谨杂交条件下)。在一些情况下,附加型载体编码指导或支架RNA,其与SETD5的控制区域(例如,启动子区域或增强子区域)杂交或特异性杂交(例如,在严谨杂交条件下)。在一些情况下,附加型载体编码指导或支架RNA,其与SETD5的启动子区域杂交或特异性杂交(例如,在严谨杂交条件下)。在一些情况下,附加型载体编码指导或支架RNA,其与SETD5的增强子区域杂交或特异性杂交(例如,在严谨杂交条件下)。在一些情况下,附加型载体编码指导或支架RNA,其与SCN2A的控制区域(例如,启动子区域或增强子区域)杂交或特异性杂交(例如,在严谨杂交条件下)。在一些情况下,附加型载体编码指导或支架RNA,其与SCN2A的启动子区域杂交或特异性杂交(例如,在严谨杂交条件下)。在一些情况下,附加型载体编码指导或支架RNA,其与SCN2A的增强子区域杂交或特异性杂交(例如,在严谨杂交条件下)。在一些情况下,附加型载体编码指导或支架RNA,其与PAX6的控制区域(例如,启动子区域或增强子区域)杂交或特异性杂交(例如,在严谨杂交条件下)。在一些情况下,附加型载体编码指导或支架RNA,其与PAX6的启动子区域杂交或特异性杂交(例如,在严谨杂交条件下)。在一些情况下,附加型载体编码指导或支架RNA,其与PAX6的增强子区域杂交或特异性杂交(例如,在严谨杂交条件下)。
在一些情况中,向导RNA的靶向区域由以下编码,与以下特异性杂交,或与以下完全互补:SEQ ID NO:1(GACACGGAATTCATTGCCAG),SEQ ID NO:2(CTGCGGGTTAGGTCTACCGG),SEQ ID NO:3(GTTGAGCGCTCAGTCCAGCG),SEQ ID NO:4(TCCCGACGTCGTGCGCGACC),或SEQ IDNO:5(GCTCTGAATCTTACTACCCG)。在一些情况中,向导RNA的靶向区域由以下编码,与以下特异性杂交,或与以下完全互补:SEQ ID NO:6(GCTGTTAACTAAAGACAGGG),SEQ ID NO:7(GTGGTCTGGGTGATCTCATG),SEQ ID NO:8(GACAAAGGAACATCTGAGAGG),SEQ ID NO:9(GTGATCTCATGGGGAAGAGG),或SEQ ID NO:10(GGCTTTGATCGTGGTCTGGG)。在一些实施方式中,向导RNA的靶向区域由以下编码,与以下特异性杂交,或与以下完全互补:SEQ ID NO:11(GCGAGCCCAGTCGCGTGGGG),SEQ ID NO:12(GCCAAGAATTGGCCAAAGGG),SEQ ID NO:34(GTCAAAGGGGCATATGGAAGG),SEQ ID NO:35(GGGAAGAAAGCCCCACTTGG),SEQ ID NO:36(GCCCAGTCGCGTGGGGGGGG),或SEQ ID NO:37(GGAGCGCGAGTGTCACTCGG)。在另一个实施方式中,向导RNA的靶向区域由以下编码,与以下特异性杂交,或与以下完全互补:SEQ ID NO:38(GCTCACTGTAGGACCCGAGCC),SEQ ID NO:39(GACGCGGCGCTCATTGGCCAA),SEQ ID NO:40(CGAGCCGCGAGCCCAGTCGCG),SEQ ID NO:41(TCCCCCCCCCCCCCCACGCGA),SEQ ID NO:42(GTCACTCACCCCGATTGGCCA),或SEQ ID NO:43(CGCGAGCCCAGTCGCGTGGGG)。在一些实施方式中,向导RNA的靶向区域由以下编码,与以下特异性杂交,或与以下完全互补:SEQ ID NO:44(GTTGGCTTATCCAAACATCTC),SEQ ID NO:45(ATGTTAAGCAAGGGTAATAGA),SEQ ID NO:46(CTGTGAAAGGAATACAATTCA),SEQ ID NO:47(GCCAATTCTTGGCAACCGAGC),SEQ ID NO:48(GAATTGGCCAAAGGGAGGGGT),或SEQ ID NO:49(AATTAGCAGACAGCTTGGTAC)。在一些实施方式中,向导RNA的靶向区域由以下编码,与以下特异性杂交,或与以下完全互补:SEQ ID NO:50(CTGGCTGATTCCCGAGGATTT),SEQ ID NO:51(CACTGAATACGGATTGGTCAG),SEQ ID NO:52(GATGTCTCAGAACCACTGAAT),SEQ ID NO:53(AACCACTGAATACGGATTGGT),或SEQ ID NO:54(ACCAATCCGTATTCAGTGGTT)。在一些实施方式中,向导RNA的靶向区域由以下编码,与以下特异性杂交,或与以下完全互补:SEQ ID NO:55(GGCGCGGGGCGGACGGGGCGA),SEQ ID NO:56(GCGCCCCGGGAACGCGTGGGG),SEQ ID NO:57(CGCCCCGCGCCGCGCGGGGAG),SEQ ID NO:58(TCCGCCCCGCGCCGCGCGGGG),SEQ ID NO:59(GGAACGCGTGGGGCGGAGCTT),SEQ ID NO:60(GCCCCGCGCCGCGCGGGGAGG),SEQ ID NO:61(TGCGCCCCGGGAACGCGTGGG),SEQ ID NO:62(GAACGCGTGGGGCGGAGCTTC),SEQ ID NO:63(GCGGCGCGGGGCGGACGGGGC),或SEQ ID NO:64(CCCGTCCGCCCCGCGCCGCGC)。在一些实施方式中,向导RNA的靶向区域由以下编码,与以下特异性杂交,或与以下完全互补:SEQ ID NO:65(GGCCCACTCGCCGCCAATCAG),SEQ ID NO:66(GGAAGCCGCCGGGGCCGCCTA),SEQ ID NO:67(TGATTGGCGGCGAGTGGGCCA),SEQ ID NO:68:(GCCGCCAATCAGCGGAAGCCG),SEQ ID NO:69:(GGCGGCTTCCGCTGATTGGCG),SEQ ID NO:70:(CCGCCAATCAGCGGAAGCCGC),SEQ ID NO:71:(AGCCGCCGGGGCCGCCTAGAG),SEQ ID NO:72:(GCTTCCGCTGATTGGCGGCGA),SEQ ID NO:73:(CGGCGAGTGGGCCAATGGGTG),或SEQ ID NO:74:(CCAATGGGTGCGGGGCGGTGG)。在一些实施方式中,向导RNA的靶向区域由以下编码或与以下特异性杂交:SEQ ID NO:75(GGCTGCCGGGGCCGCCTAAAG),SEQ ID NO:76(GGAGGCTGCCGGGGCCGCCTA),SEQ ID NO:77(GCCGCCAATCAGCGGAGGCTG),SEQ ID NO:78(CCGCCAATCAGCGGAGGCTGC),SEQ ID NO:79(TGGCCGGTGCGCCGCCAATCA),SEQ ID NO:80(GGCCGGTGCGCCGCCAATCAG),SEQ ID NO:81(CGGCGCACCGGCCAATAAGTG),SEQ ID NO:82(ATAAGTGTGGGGCGGTGGGG),SEQ ID NO:83(CCAATAAGTGTGGGGCGGTGG),或SEQ ID NO:84(CAATAAGTGTGGGGCGGTGGG)。在一些实施方式中,向导RNA的靶向区域由以下编码或与以下特异性杂交:SEQ ID NO:85:CCTTTCTATGACCTAGTCGG,SEQ ID NO:86:CAGAATCAGTAACGCACTGT,SEQ ID NO:87:GAAACCAGGAGAGATAACCC,SEQ ID NO:88:GGACCCCAGATATTCTGGAA,SEQ ID NO:89:TTATTGTTGACTTAACGAAG,SEQ ID NO:90:AAAAAGAAGCAAATAGCTAA,或SEQ ID NO:91:(AGAATCAGTAACGCACTGTA)。在一些实施方式中,向导RNA的靶向区域由以下编码,与以下特异性杂交,或与以下完全互补:SEQ ID NO:92(TGTTGGTTTATTGGACCCCAGATATTC),SEQ ID NO:93(TGTTGGAGAAAATTAACTTAGTGCATA),或SEQID NO:94(TGTTGGTATAACTGCCACTAGAGGGCT)。在一些实施方式中,向导RNA的靶向区域由SEQID NO:95(AGGAGCCGGGACCCACCGG)编码,与其特异性杂交,或与其完全互补。
在一些情况下,向导RNA的靶向区域由与包含SEQ ID NO:1-12或34-95之一的sgRNA对应或由其靶向的小鼠或人类基因组的区域直系同源和/或同源的序列编码,与其特异性杂交或与其完全互补。在一些情况下,向导RNA由与SEQ ID NO:1-12或34-95之一90%,95%或99%相同或相差1,2或3个核苷酸,或者在5′和/或3′末端长或短的1,2或3个核苷酸的序列编码,与其特异性杂交或与其完全互补。
本文所述的一种或多种附加型载体可以作为用于治疗哺乳动物对象的疾病的试剂盒提供,所述疾病与基因转录减少,基因产物减少或基因产物活性减少相关,由其加剧或由其引起。例如,编码CRISPR核酸酶的附加型载体,锌指核酸酶,TALEN,TAL效应物,向导RNA,转录激活结构域,支架RNA,支架RNA配体,亲和标签配体,其一种或多种的融合蛋白,或其组合可以含有附加型载体包装质粒,细胞系或辅助病毒或其组合的试剂盒的组分提供。
在一些情况下,其中编码的多肽和/或RNA侧翼为AAV反向末端重复序列的附加型载体以试剂盒的组分提供,该试剂盒含有用于将附加型载体包装到功能性AAV颗粒中的其他材料。此类其他材料可包括一种或多种编码AAV rep和cap基因的质粒,一种或多种编码腺病毒辅助因子E1A,E1B,E2A,E4ORF6和VA的质粒,腺病毒或其组合。在一些情况下,用于AAV包装的反式激活元件和/或辅助元件在稳定的细胞系中提供,作为试剂盒的组分。
在一些实施方式中,cap基因是AAV-DJ,AAV1,AAV2,AAV3,AAV4,AAV5,AAV6,AAV7,AAV8或AAV9 cap基因。在一些实施方式中,cap基因是AAV-DJ,AAV1,AAV2,AAV5,AAV7,AAV8或AAV9 cap基因。在一些实施方式中,cap基因是AAV2 cap基因。在一些实施方式中,cap基因是AAV-DJ cap基因。在一些实施方式中,反向末端重复序列(ITR)是AAV1,AAV2,AAV3,AAV4,AAV5,AAV6,AAV7,AAV8或AAV9 ITR。在一些实施方式中,ITR是AAV1,AAV2,AAV5,AAV7,AAV8或AAV9 ITR。在一些实施方式中,ITR是AAV2 ITR。在一些情况下,由cap基因编码的衣壳蛋白与ITR具有相同的血清型。例如,cap基因可以是AAV2 cap基因,并且ITR可以是AAV2ITR。在一些情况下,由cap基因编码的衣壳蛋白是与ITR血清型不同的血清型。因此,例如,cap基因可以是AAV5 cap基因,并且ITR可以是AAV2 ITR。作为另一个示例,cap基因可以是AAV-DJ cap基因,并且ITR可以是AAV2 ITR。
在一些情况下,附加型载体可以在靶细胞或靶组织的细胞中。在一些情况下,靶细胞或靶组织的细胞是分裂细胞。在一些情况下,细胞是非分裂细胞。在一些情况下,细胞是神经元。在一些情况下,细胞是下丘脑的细胞。在一些情况下,靶细胞或靶组织的细胞是哺乳动物细胞,其含有具有靶基因的至少一个功能性拷贝的基因组,其中一个或多个功能性拷贝在没有异源性复合物的转录激活的情况下不能产生足够的相应基因产物以在生物体中产生野生型表型。在一些情况下,哺乳动物细胞还包含由本文所述的附加型载体编码的支架RNA,由本文所述的附加型载体编码的向导RNA,由本文所述的附加型载体编码的CRISPR核酸酶,由本文所述的一种或多种附加型载体编码的SunTag,由本文所述的一种或多种附加型载体编码的协同激活介质(SAM),由本文所述的附加型载体编码的转录激活结构域,由本文所述的附加型载体编码的亲和标签配体,由本文所述的附加型载体编码一种或多种多肽的融合体,或其组合。
在一些情况下,靶细胞或靶组织的细胞中的附加型载体被转化为环形,环状多联体或线性多联体,例如通过重复元件如ITR的重组。在一些情况下,靶细胞或靶组织的细胞中的附加型载体从单链DNA载体转变为双链DNA。在一些情况下,双链DNA被转变为环形,环状多联体或线性多联体。在一些情况下,靶细胞或靶组织的细胞中的附加型载体作为附加型元件持续存在,提供持久性转基因(例如,CRISPR核酸酶,转录激活因子,向导RNA,支架RNA等)表达。在一些情况下,附加型元件是前述环状形式,环状多联体或线性多联体中的一种。
病毒颗粒
前述附加型载体中的一种或多种可以被包装在病毒颗粒中。例如,病毒颗粒可含有编码CRISPR核酸酶,向导RNA,支架RNA,转录激活因子,亲和标签,亲和标签配体,支架RNA配体,其一种或多种的融合蛋白,或其一种或多种的组合的附加型载体。病毒颗粒可以是能够将附加型载体递送至靶细胞或组织的病毒颗粒,使得附加型载体进入靶细胞或靶组织的细胞的细胞核,并且不会或基本上不会整合到细胞的基因组中。
在一些情况下,病毒颗粒将附加型载体递送至靶细胞或靶组织的细胞,并且附加型载体被转变为环状形式,环状多联体或线性多联体,例如通过重复元件,例如ITR的重组。在一些情况下,由病毒颗粒递送的附加型载体从单链DNA载体转变为双链DNA。在一些情况下,双链DNA被转变为环形,环状多联体或线性多联体。在一些情况下,病毒颗粒将附加型载体递送至靶细胞或靶组织的细胞,并且附加型载体作为提供持久转基因表达的附加型元件持续存在。
病毒颗粒可以是EBV或AAV病毒颗粒。在一些情况下,病毒颗粒是AAV病毒颗粒。在一些情况下,病毒颗粒是AAV-DJ,AAV1,AAV2,AAV3,AAV4,AAV5,AAV6,AAV7,AAV8或AAV9病毒颗粒。在一些情况下,病毒颗粒是AAV-DJ,AAV1,AAV2,AAV5,AAV7,AAV8或AAV9病毒颗粒。在一些情况下,病毒颗粒是AAV2病毒颗粒。.在一些情况下,病毒颗粒是AAV-DJ病毒颗粒。包装在病毒颗粒中并编码一种或多种转基因(附加型载体)的基因组可以是AAV1,AAV2,AAV3,AAV4,AAV5,AAV6,AAV7,AAV8或AAV9基因组。在一些情况下,基因组是AAV1,AAV2,AAV5,AAV7,AAV8或AAV9基因组。在某些情况下,基因组是AAV2基因组。在某些情况下,基因组与其中其被包装的病毒颗粒是相同的血清型。在其他情况下,基因组和病毒颗粒是不同的血清型。例如,衣壳可以是AAV5血清型,并且附加型载体可以是AAV2血清型。作为另一个示例,衣壳可以是AAV-DJ血清型,并且附加型载体可以是AAV2血清型。
本文所述的一种或多种病毒颗粒可以作为用于治疗哺乳动物对象的疾病的试剂盒提供,所述疾病与基因转录减少,基因产物减少或基因产物活性减少相关,由其加剧或由其引起。例如,可以将编码CRISPR核酸酶的附加型载体,向导RNA,转录激活域,支架RNA,支架RNA配体,亲和标签配体,其一种或多种的融合蛋白,或其组合包装到一种或多种病毒颗粒中并作为试剂盒的组分提供,所述试剂盒含有合适的药物赋形剂,运载体,稀释剂,或缓冲液,用于递送给对象。
在一个实施方式中,病毒颗粒在合适的药物赋形剂,运载体,稀释剂或缓冲液中用于递送至对象。此类赋形剂,运载体,稀释剂和缓冲剂包括可以在没有过度毒性的情况下给予的任何药剂。药学上可接受的赋形剂包括但不限于液体,例如水,盐水,甘油和乙醇。其中还可以包括药学上可接受的盐,例如无机酸盐,例如盐酸盐,氢溴酸盐,磷酸盐,硫酸盐等;和有机酸盐,例如乙酸盐,丙酸盐,丙二酸盐,苯甲酸盐等。另外,在这种载剂中可以存在辅助物质,例如润湿剂或乳化剂,pH缓冲物质等。多种药学上可接受的赋形剂是本领域已知的,无需在此详细讨论。药学上可接受的赋形剂已在各种出版物中充分描述,包括例如,A.Gennaro(2000)《雷明顿:药物科学与实践》(“Remington:The Science and Practice ofPharmacy”),第20版,LWW出版社(Lippincott,Williams,&Wilkins);《药物剂型和药物递送系统》(Pharmaceutical Dosage Forms and Drug Delivery Systems)(1999)H.C.Ansel等编著,第7版,LWW出版社;和《药学赋形剂手册》(Handbook of PharmaceuticalExcipients)(2000)A.H.Kibbe等编著,第3版,美国药学协会(Amer.PharmaceuticalAssoc)。
方法
本文描述了通过增加靶基因的转录来治疗哺乳动物对象中与基因转录减少,基因产物量减少或基因产物活性降低相关,由其加剧或由其引起的疾病的方法。该方法通常包括使靶细胞或靶组织的细胞与一种或多种前述附加型载体接触。在一些实施方式中,附加型载体是非整合的或基本上非整合的。在一些实施方式中,将附加型载体包装到病毒颗粒中,并使病毒颗粒与靶细胞或靶组织的细胞接触。一些情况中,体内进行所述接触。在一些情况下,接触在体外进行(例如,使用从对象获得的原代细胞),并将接触的细胞递送至对象,或任选地培养并递送至对象。
附加型载体(例如,包装到病毒颗粒中)可以通过本领域已知的任何手段递送。在一些情况下,附加型载体通过全身递送(例如,静脉内递送)在体内与细胞接触。在一些情况下,附加型载体(例如,包装到病毒颗粒中)通过位点特异性递送至受影响的细胞或组织而在体内与细胞接触。例如,其中包装附加型载体的病毒颗粒可以注射到受影响的细胞或组织的部位。在一些情况下,将两种或更多种附加型载体包装到病毒颗粒中,使得每种病毒颗粒含有两种或更多种附加型载体之一的单拷贝或是空的(不含基因组或含有缺乏功能性转基因的基因组)。这些病毒颗粒可以作为混合物或单独递送。在某些情况下,颗粒同时递送。在某些情况下,颗粒顺序递送。通常,递送颗粒使得由附加型载体编码的递送的转基因在对象中共表达,从而治疗疾病。
在一个实施方式中,将一种或多种不同的病毒颗粒(例如,具有相同衣壳但含有编码不同转基因的载体的病毒颗粒)注射到对象的脑中。在一些情况下,将一种或多种病毒颗粒注射到对象的下丘脑中。病毒颗粒可以被递送到下丘脑的前部,下丘脑的后部,下丘脑的腹内侧部分或其组合。病毒颗粒可以双侧递送(例如,通过双侧注射到对象的下丘脑)。在一些情况下,将一种或多种病毒颗粒递送至对象的神经元。在一些情况下,通过立体定向注射递送一种或多种病毒颗粒。
递送至对象的病毒颗粒的剂量可以是1×103个病毒颗粒/kg对象至1×1020个病毒颗粒/kg对象。递送至对象的附加型载体的剂量可以是1×103个载体分子/kg对象至1×1020个载体分子/kg对象。在一些情况下,剂量为1×104至1×1018,1×105至1×1016,1×106至1×1015个病毒颗粒/kg对象或载体分子/kg对象。在一些情况下,剂量为至少1×104,1×105,1×106,1×107,1×108,1×109,1×1010,1×1011,1×1012,1×1013,1×1014或1×1015个病毒颗粒/kg对象或载体分子/kg对象。在一些情况下,载体分子是以病毒颗粒递送的病毒基因组的形式。在一些情况下,剂量是递送的病毒基因组的剂量(例如,包装在病毒颗粒中),其编码CRISPR核酸酶(例如,与激活结构域融合的dCas9)和向导RNA(例如,sgRNA)。在一些情况下,剂量是递送的病毒基因组的剂量(例如,包装在病毒颗粒中),其编码CRISPR核酸酶(例如,与激活结构域融合的dCas9),并且第二剂,例如前述剂量中的一种或多种,是编码向导RNA(例如,sgRNA)的递送的病毒基因组(例如,包装在病毒颗粒中)的剂量。
在一些情况下,与直接施用于待治疗的组织或器官的剂量相比,全身剂量可能更高。例如,对于治疗由下丘脑组织或细胞中的单倍体机能不全的sim1基因失调的肥胖症,与全身剂量相比,可以将较低剂量递送至下丘脑。在人类中,全身递送可以例如约6.7×1013-2.0×1014个病毒基因组(vg)/kg(参见,clinicaltrials.gov/ct2/show/NCT02122952)并且神经外科递送可以例如约7.5×1011-8.8×1012vg/kg(参见,clinicaltrials.gov/ct2/show/NCT01973543)。
剂量可以给予一次或多次。在一些情况下,剂量在30天,60天,90天,120天或180天的时间内递送至少一次。在一些情况下,剂量每10周,20周,30周,40周,52周或75周或100周递送至少一次。在某些情况下,剂量每6个月,12个月,18个月,2年,3年,5年或10年递送至少一次。在一些情况下,单剂量或2或3或4个剂量导致持久和充分表达否则单倍体机能不全的靶基因,以治疗由单倍体机能不全引起的疾病或病症的至少一种症状,持续数月或数年。在一些情况下,给予剂量,评估靶单倍体机能不全的基因(例如,表1中的基因,例如sim1)的表达的充分性(例如,在诸如下丘脑的靶组织中)并且根据需要通过相同或不同途径递送另外的剂量。在一些情况下,递送足够量的一个或多个剂量的如本文所述的病毒颗粒以增加靶基因的转录,从而治疗与基因的转录减少,基因产物的量减少或基因产物的活性降低相关,由其加剧或由其引起的疾病或由其减少的疾病的至少一种症状,当靶基因的转录从其最大表达减少至少10%,25%,50%,75%,90%或更多时,重新给予一个或多个剂量。
实施例
拯救单倍体机能不全引起的肥胖症
I.引言
已知超过300种基因由于单倍体机能不全而导致人类疾病(1,2),导致广泛的表型,包括癌症,神经疾病,发育障碍,免疫疾病,代谢紊乱,不育,肾病,肢体畸形等(1)。大规模外显子组测序分析估计共有3230个人类基因可能是杂合子功能丧失(LoF)不耐受的(3)。通过插入突变基因的一个或多个功能性重组拷贝,基因疗法在纠正单倍体机能不全的疾病方面具有很大的前景。目前,共进行了2300项基因治疗临床试验,其中大多数使用腺相关病毒(AAV)来递送重组基因(4)。AAV是一种优选的基因递送方法,因为它能够在不整合到基因组中的情况下递送DNA,不会导致致病性并提供转基因的长期基因表达(5)。然而,AAV具有最佳的4.7千碱基(kb)包装能力,限制其对于超过3.5kb的基因的基因治疗用途(考虑到其稳定表达所需的额外调节序列)。对3230个杂合LoF基因的分析发现其中715个(22%)具有长于3.5kb的编码序列,使得它们不适合AAV基因治疗。
CRISPR基因编辑可以潜在地修复单倍体机能不全的突变,但是需要针对每个突变定制专门编辑策略。此外,它不是一种可行的对杂合LoF微缺失的疗法。为了解决这些挑战,我们设计了一种使用CRISPR激活(CRISPRa)的针对单倍体机能不全的新型治疗策略。CRISPRa利用CRISPR的RNA引导靶向能力将核酸酶缺陷型Cas9(dCas9)与转录激活因子一起导向特定基因的调节元件,从而增加其表达(6-10)。在此,我们测试了我们是否可以使用该系统来增加单倍体机能不全的疾病中未受影响的内源基因的转录以拯救疾病表型。
SIM1是在发育中的肾脏和中枢神经系统中表达的转录因子,并且对于下丘脑的视上(SON)和室旁(PVN)核的形成是必需的(11)。它也被认为在瘦蛋白途径中起主要作用(12)。在人类中,由于染色体畸变导致的SIM1单倍体机能不全(12,13)导致过度摄食肥胖(13)和SIM1编码突变,其中许多是功能丧失的,被认为是人类严重肥胖的主要原因(14-16)。Sim1纯合缺失小鼠围产期死亡,而Sim1杂合小鼠(Sim1+/-)存活,过度摄食并发展为早发性肥胖,带有线性生长增加,高胰岛素血症和高瘦蛋白血症(17)。下丘脑Sim1的出生后条件性敲除导致杂合小鼠中的相似表型(18),暗示Sim1是能量稳态的重要调节因子。在小鼠中使用人类细菌人工染色体过度表达SIM1拯救饮食诱导的肥胖并减少食物摄入(19),这表明Sim1可能作为肥胖的一般治疗靶标。在此,我们使用Sim1作为我们的CRISPRa治疗策略的概念验证模型。我们使用靶向Sim1启动子或其下丘脑特异性增强子的基于转基因和AAV的方法测试了CRISPRa在Sim1+/-小鼠中拯救肥胖表型的能力。我们的结果提出了一种治疗单倍体机能不全的疾病或由基因剂量改变引起的其他疾病的新型治疗方法。
II.结果
A.Sim1体外上调
我们首先着手优化我们的体外CRISPRa条件。SIM1具有充分表征的启动子(20)和远端下丘脑增强子(距离转录起始位点约270kb),Sim1候选增强子2(SCE2(21)),两者都被选择作为CRISPRa的靶标(图1A)。我们为Sim1启动子或增强子(SCE2)设计了sgRNA。使用这些向导(guide)我们测试了融合至VP64的dCas9(dCas9-VP64),一种携带四个串联拷贝的VP16(单纯疱疹病毒1型转录因子)的转录激活因子(22),是否可以在小鼠神经母细胞瘤细胞(Neuro-2a)中过表达Sim1。选择该激活因子是因为与其他已知的激活因子相比其激活水平较低(23),因为我们希望在体内获得与野生型相似的治疗性Sim1剂量水平。用dCas9-VP64和各种指导物转染细胞,并在48小时后使用定量PCR(qPCR)测量Sim1 mRNA水平。我们针对启动子或SCE2鉴定了一种sgRNA,其分别能够过表达内源性Sim1 13和4倍(图1B)。另外,我们鉴定了针对Sim1启动子的四种sgRNA,其能够过表达内源性Sim1超过4倍(图7A),和针对SCE2的至少一种sgRNA,其能够过表达内源性Sim1超过2倍(图8A)。
B.转基因CRISPRa拯救肥胖
为了测试我们的CRISPRa系统在体内激活Sim1的能力,我们使用TARGATT技术生成敲入小鼠品系(24),其中将dCas9-VP64插入小鼠Hipp11(H11PCAG-dCas9-VP64)基因座和将靶向Sim1启动子(ROSA26Sim1Pr-sgRNA)或SCE2(ROSA26SCE2En-sgRNA)的sgRNA插入Rosa26基因座(图1C)。然后我们将这些小鼠与发生严重肥胖的Sim1+/-小鼠杂交(17)。使用育种者食物(picodiet-5058)维持具有所有三个等位基因(Sim1+/-X H11PCAG-dCas9-VP64和ROSA26Sim1Pr-sgRNA或ROSA26SCE2En-sgRNA)的小鼠并且与野生型同窝仔和Sim1+/-X H11PCAG-dCas9-VP64小鼠和Sim1+/-一起每周称重直至16周龄,后两者都变得严重肥胖(阴性对照)。对每种条件下至少7只雌性和7只雄性的分析显示,与Sim1+/-X H11PCAG-dCas9-VP64和Sim1+/-同窝仔相比,携带dCas9-VP64和Sim1启动子或增强子sgRNA的Sim1+/-小鼠体重显著减轻(图1D-F)。
C.CRISPRa修正Sim1+/-代谢概况
为了将体重减轻与身体组成和代谢参数联系起来,我们接下来对Sim1+/-XH11PCAG-dCas9-VP64X ROSA26Sim1Pr-sgRNA(Prm CRISPRa)Sim1+/-X H11PCAG-dCas9-VP64X ROSA26SCE2En -sgRNA(Enh-CRISPRa)和我们的其他小鼠系进行代谢概况分析。正好在肥胖阶段开始,6-8周龄时分析每种基因型的三只小鼠的身体组成和代谢概况。在雌性和雄性中,与Sim1+/-相比,Prm-CRISPRa和Enh-CRISPRa小鼠均显示出体脂含量显著降低(图2A)。对Sim1+/-肥胖小鼠的其他标志的代谢室分析,例如氧消耗和食物摄入,显示在Prm-CRISPRa和Enh-CRISPRa小鼠中向野生型代谢参数的转变(图2B-C)。此外,他们的呼吸交换比率(RER;VCO2/VO2),一种定义基本代谢率的间接方法,也显示出与野生型同窝仔相似的参数(图2D)。然而,我们没有发现他们在个别腔室中的身体活动有任何显著差异。结合起来,这些结果表明,Prm-CRISPRa和Enh-CRISPRa小鼠体内脂肪较少,并且其代谢参数得到改善,这有助于降低其总体重。
D.Sim1激活是组织特异性的
为了测试我们小鼠中的Sim1激活水平和组织特异性,我们测量了其在不同组织中的mRNA表达水平。我们选择了已知表达Sim1的两种组织,下丘脑和肾,以及两种不表达的组织,肺和肝(25)(图3A)。我们首先测量dCas9表达,并发现它在所有四种组织中表达,如预期的那样,因为我们使用遍在CMV增强子鸡β-肌动蛋白(CAG)启动子来驱动其表达(图3B)。相反,对于Sim1,与Sim1+/-小鼠相比,我们在Prm-CRISPRa小鼠中的下丘脑和肾中,并且仅在Enh-CRISPRa小鼠的下丘脑中观察到显著更高的mRNA水平(图3C-D)。由于我们未观察到Prm-CRISPRa和Enh-CRISPRa小鼠的肥胖表型之间存在任何显著差异,我们可以推测下丘脑中Sim1的激活足以拯救Sim1+/-肥胖表型。有趣的是,在不表达Sim1的组织(即肝和肺)中,尽管观察到Cas9表达,我们仍未检测到Prm-CRISPRa或Enh-CRISPRa小鼠中的Sim1表达。这些结果意味着在我们研究的体内条件下,dCas9-VP64只能在其靶基因的顺式调节元件有活性的组织中上调其表达。这表明顺式调节元件可用于确定CRISPRa的组织特异性。
E.CRISPRa AAV降低Sim1+/-体重增加
为了进一步将该方法转化为对单倍体机能不断的治疗策略,我们利用AAV将CRISPRa递送到Sim1+/-小鼠的下丘脑中。我们产生了以下三种AAV载体:1)由巨细胞病毒(CMV)启动子驱动的dCas9-VP64(pCMV-dCas9-VP64);2)Sim1启动子sgRNA和mCherry(pU6-Sim1Pr-CMV-mCherry);3)SCE2 sgRNA和mCherry(pU6-SCE2-CMV-mCherry)。对于pCMV-dCas9-VP64载体,由于dCas9-VP64表达盒的大小,我们获得了5.4kb插入片段。虽然这种插入片段大小高于4.7kb限制,显示高于5kb会降低转基因表达水平,但仍可用于递送(26)。将这些载体单独包装到AAV-DJ血清型中,该血清型是2型,8型和9型嵌合体,显示在多种组织中实现高表达水平(27)(图4A)。我们确实观察到pCMV-dCas9-VP64 AAV的较低但可用的病毒滴度(参见方法)。我们首先测试了我们的AAV CRISPRa载体是否可以使用Neuro-2a细胞在体外过表达Sim1。当分别靶向启动子或增强子时,我们观察到Sim1 mRNA表达的4和5倍上调(图4A)。使用额外的sgRNA(SEQ ID NO:38,40或42),我们观察到我们的AAV CRISPRa载体可以使用Neuro-2a细胞在体外过表达Sim1。当靶向启动子时,我们观察到Sim1 mRNA表达上调2倍至6倍(图7B),当靶向增强子(SCE2)时,我们观察到Sim1 mRNA表达上调2倍至4.5倍(图8B)。
接下来,在它们开始肥胖之前,我们进行立体定向注射以将携带pCMV-dCas9-VP64和pU6-Sim1Pr-CMV-mCherry(Prm-CRISPRa-AAV)或pU6-SCE2-CMV-mCherry(Enh-CRISPRa-AAV)的病毒递送到4周龄的Sim1+/-小鼠的下丘脑的PVN中。作为阴性对照,我们还仅用pCMV-dCas9-VP64病毒注射Sim1+/-小鼠。我们通过对注射的小鼠的下丘脑进行免疫染色来测试我们的sgRNA-CMV-mCherry盒的表达,并发现它在PVN中表达(图4B-C)。为了测试通过将CRISPRa-AAV递送至Sim1+/-小鼠的下丘脑是否增加Sim1表达水平,我们测量了来自11周龄AAV注射小鼠的dCas9和Sim1的mRNA表达水平。发现dCas9在我们所有注射pCMV-dCas9-VP64AAV的小鼠的下丘脑中表达(图4D)。在注射Prm-CRISPRa-AAV和Enh-CRISPRa-AAV的下丘脑中均观察到Sim1上调,但在仅注射pCMV-dCas9-VP64-AAV的小鼠中未观察到Sim1上调(图4E)。测量注射的小鼠的体重直至11周龄(图5A)。我们观察到与Sim1+/-或注射pCMV-dCas9-VP64-AAV的Sim1+/-小鼠相比,注射Prm-CRISPRa-AAV或Enh-CRISPRa-AAV的小鼠重量显著减轻(图5B-C)。这些结果表明,CRISPRa-AAV介导的上调可以用作治疗单倍体机能不全的可行的基因治疗工具。
F.Mc4r体外上调
超过70%的具有遗传基础的肥胖症是由瘦蛋白途径缺陷引起的。MC4R是瘦蛋白途径的一部分,其突变是肥胖个体中最常见的突变(占1%肥胖人群的约5%)。由于它是下游因子,MC4R和SIM1的上调可能拯救这些其他瘦蛋白途径基因突变引起的肥胖。在此,我们已经表明我们可以通过靶向其启动子来上调MC4R,并且还表明SIM1的上调可以增加MC4R表达。我们还能够拯救Mc4r杂合子小鼠中的肥胖表型(基本上如上文讨论的在Sim1体外上调中所述)。因此,MC4R上调可用作肥胖症的疗法。
我们针对Mc4r启动子设计了sgRNA(参见SEQ ID NO:50-54)。使用这些向导,我们测试了与VP64融合的dCas9(dCas9-VP64)是否可以在小鼠神经母细胞瘤细胞(Neuro-2a)中过表达Mc4r。用dCas9-VP64和各种向导转染细胞,并在48小时后使用定量PCR(qPCR)测量Mc4r mRNA水平。我们鉴定了Mc4r启动子的一个sgRNA,其能够将内源性Mc4r过表达7倍(图9A)。
G.CRISPRa AAV诱导Mc4r上调
我们接下来测试了我们的含有sgRNA,SEQ ID NO:51,52或54的AAV CRISPRa载体(基本上如上文Sim1 CRISPRa AAV中所述制备)是否可以使用Neuro-2a细胞在体外过表达Mc4r。当靶向启动子时,我们观察到Mc4r mRNA表达上调3.4倍至6.6倍(图9B)。
H.SCN2A体外上调
SCN2A突变是自闭症谱系障碍(ASD)和癫痫患者中最常见的突变。由于单倍体机能不全,大多数突变是导致ASD的功能丧失。在此,我们已经证明我们可以通过靶向其启动子来上调SCN2A。因此,SCN2A上调可用作ASD和癫痫的疗法。
我们针对Scn2a启动子设计了sgRNA(参见SEQ ID NO:85-91)。使用这些向导,我们测试了与VP64融合的dCas9(dCas9-VP64)是否可以在小鼠神经母细胞瘤细胞(Neuro-2a)中过表达Scn2a。用dCas9-VP64和各种向导转染细胞,并在48小时后使用定量PCR(qPCR)测量Scn2a mRNA水平。我们鉴定了Scn2a启动子的4个sgRNA,其能够将内源性Scn2a过表达超过2倍(图12A)。
I.CRISPRa AAV诱导Scn2A上调
我们接下来测试了我们的含有sgRNA,SEQ ID NO:92-94的AAV CRISPRa载体(基本上如上文Sim1 CRISPRa AAV中所述制备)是否可以使用Neuro-2a细胞在体外过表达Scn2a。使用两种不同的感染复数(MOI):5000和1750病毒基因组(vg/ml)。当以每毫升5000个病毒基因组的MOI靶向启动子时,我们观察到Scn2a mRNA表达的轻微上调(图12B)。
J.SETD5体外上调
SETD5的突变导致精神发育迟滞-23(OMIM#615761),其包括智力障碍和畸形特征。在此,我们已经证明我们可以通过靶向其启动子来上调SETD5。因此,SETD5上调可用作智力障碍的疗法。
我们针对Setd5启动子设计了sgRNA(参见SEQ ID NO:75-84)。使用这些向导,我们测试了与VP64融合的dCas9(dCas9-VP64)是否可以在小鼠神经母细胞瘤细胞(Neuro-2a)中过表达Setd5。用dCas9-VP64和各种向导转染细胞,并在48小时后使用定量PCR(qPCR)测量Setd5 mRNA水平。我们鉴定了Setd5启动子的2个sgRNA,其能够将内源性Setd5过表达超过1.5倍(图11B)。
接下来,我们针对人类的SETD5启动子设计了sgRNA(参见SEQ ID NO:65-74)。使用这些向导,我们测试了与VP64融合的dCas9(dCas9-VP64)是否可以在人HEK293T细胞中过表达SETD5。用dCas9-VP64和各种向导转染细胞,并在48小时后使用定量PCR(qPCR)测量SETD5mRNA水平。我们鉴定了SETD5启动子的至少一个sgRNA,其能够将内源性SETD5过表达超过2.5倍(图11A)。
K.PKD1体外上调
PKD1的突变导致常染色体显性多囊肾病(ADPKD;OMIM#173900),这是影响1至400-1000个体的最常见的遗传性肾病。85%的ADPKD是由PKD1突变引起的,其中大部分是功能丧失。PKD1长13kb,因此不能包装在标准基因治疗载体中。使用本文公开的CRISPRa技术,我们已经显示我们可以通过靶向其启动子来上调PKD1。因此,PKD1上调可用作常染色体显性多囊肾病的疗法。
我们针对人的PKD1启动子设计了sgRNA(参见SEQ ID NO:55-64)。使用这些向导,我们测试了与VP64融合的dCas9(dCas9-VP64)是否可以在人HEK293T细胞中过表达PKD1。用dCas9-VP64和各种向导转染细胞,并在48小时后使用定量PCR(qPCR)测量PKD1 mRNA水平。我们鉴定了PKD1启动子的至少3个sgRNA,其能够将内源性PKD1过表达超过2倍(图11A)。
L.PAX6体外上调
由于单倍体机能不全,PAX6中的功能丧失突变导致无虹膜1(OMIM#106210)。在此,我们已经证明我们可以通过靶向其启动子来上调PAX6。因此,PAX6上调可用作无虹膜1的疗法。
我们为人类的PAX6启动子设计了一种sgRNA(SEQ ID NO:95)。使用本指南,我们测试了与VP64(dCas9-VP64)融合的dCas9(化脓性链球菌)是否可以在分化为神经元的人H1-ESC细胞中过表达PAX6。用携带指导的慢病毒感染细胞,48小时后,使用定量PCR(qPCR)测量PAX6 mRNA水平。我们用于PAX6启动子的示例性sgRNA能够过表达内源性PAX6超过6倍(图13)。图13还证明另外的神经元标志物(例如,NES)也能够神经诱导H1-ESC。
III.讨论
基于CRISPR的基因编辑是纠正基因突变的有前景的治疗技术。然而,目前它不是单倍体机能不全的可行技术,受低非同源末端连接(NHEJ)效率(即仅编辑一小部分细胞)的限制,并且需要为每个单独的突变定制专门的特定向导和供体序列。此外,它不是一种可行的微缺失治疗策略,已知其中超过200种引起人类疾病(28),主要是由于单倍体机能不全。在这项研究中,我们使用一种新方法来解决这些障碍,并展示如何通过增加现有功能等位基因通过CRISPRa的转录输出来纠正单倍体机能不全的疾病。
使用CRISPRa靶向Sim1的启动子或增强子,我们能够以组织特异性方式在对Sim1单倍体机能不全的小鼠中拯救肥胖表型(图6)。由于这种治疗方法利用了现有的功能等位基因,它具有以下几个好处:1)它克服了针对不同的单倍体机能不全导致同一基因的突变定制专门CRISPR基因编辑方法的需要。2)该方法可能用于靶向两个或更多个基因。因此,它可以作为微缺失相关疾病的潜在治疗策略,所述疾病由多于一种基因的杂合LoF引起。3)CRISPRa-AAV可用于拯救由比其最佳包装能力更长的基因引起的单倍体机能不全的疾病。4)基于CRISPR的疗法可以利用顺式调节元件来指导组织特异性。基因调节元件的大规模组织特异性图谱的可用性可以提供用于该治疗方法的充足候选者。我们在研究中观察到Sim1组织特异性激活的明显差异,这可归因于各种组织中基因座的染色质可及性。以前的大规模Cas9和dCas9细胞培养筛选显示出具有低核小体占据率的区域的靶向偏好(29)。活性启动子或增强子具有较低的核小体占据,因此更适合dCas9靶向。
我们的dCas9-VP64小鼠和AAV载体可以是通过在某些组织/细胞类型中递送靶向一个或多个特定基因的sgRNA体内靶向基因激活的有用工具。该方法可用于通过测量其活化后的表达水平来评估基因-基因相互作用或用于体内特定调节元件的一个或多个靶基因的鉴定。另一个潜在的研究领域可能是神经元电路操纵。已经观察到急性和慢性神经元回路操作之间的差异(30),其可以分别通过我们的AAV-CRISPRa和转基因-CRISPRa策略来解决。
Sim1的单倍体机能不全导致小鼠(17)和人(13)的肥胖。这是否是由Sim1+/-小鼠(17)中观察到的发育过程中PVN大小的减少引起的或者是由成年期间受扰动的能量稳态引起的是一个主要研究领域。在出生后条件性敲除下丘脑Sim1中观察到的肥胖表型(18)强化了Sim1确实在成年后期在能量稳态中起作用的假设。我们通过CRISPRa AAV注射到4周龄小鼠下丘脑来拯救肥胖表型的能力进一步证实了这一作用。黑皮质素4受体(Mc4r)信号传导的消除是大多数多基因和单基因肥胖表型的标志。Sim1的条件性出生后缺陷导致Mc4r信号传导水平降低。由于Sim1被证明是瘦蛋白-Mc4r途径的一个整体下游组分(18),因此Sim1CRISPRa靶向可以为破坏瘦蛋白信号传导途径的条件提供潜在的治疗。
尽管基于CRISPR的治疗干预技术有所进步,但我们对CRISPR表达的长期副作用及其体内脱靶效应的理解仍然很大程度上未知,这对我们目前的研究也是如此。抗CRISPR基因(31)或我们的CRISPRa系统的条件性激活或沉默可以在将来解决这些问题。此外,还需要开发用于调节基因剂量的CRISPRa/i工具,以便能够优化某些疾病的转录输出,其中可能需要更高或更低的激活水平。在这项研究中,我们使用VP64作为我们的激活因子,因为它具有已知的弱激活能力(23),这符合我们获得与具有两个正常等位基因类似的基因表达水平的需要。基于CRISPRa的基因激活依赖于融合的激活因子(23),sgRNA靶标(29)的性质,并且可能需要优化CRISPR系统和递送方法。
如本研究所示,CRISPRa不仅可以通过靶向其启动子来激活基因,还可以通过靶向远端顺式调节元件(如增强子)来激活基因。以前的研究表明,这些元件可以成为可行的治疗靶点。例如,通过用与染色质环化因子,LIM结构域结合1(LDB1)基因融合的锌指核酸酶靶向球蛋白增强子,体外实现胎儿血红蛋白的激活,为镰状细胞病提供潜在的治疗(37)。在另一项研究中,通过使用CRISPR基因编辑使其阻遏物B细胞CLL/淋巴瘤11A(BCL11A)的增强子失活来实现胎儿血红蛋白的再激活(38)。我们的研究提供了一种新方法,该方法也利用顺式调节元件用于治疗目的。有许多可能用CRISPRa疗法治疗的由较低基因剂量引起的疾病。此外,通过激活具有类似功能的另一基因可以潜在拯救一些人类疾病。这些可以包括例如用于杜兴肌营养不良症的肌营养不良蛋白(39),用于脊髓性肌萎缩的运动神经元2(SMA2)的存活(SMA;(40))或用于镰状细胞病的上述胎儿球蛋白。该技术的进一步发展可为患有这些疾病的患者提供可行的疗法。
III.材料和方法
质粒
pMSCV-LTR-dCas9-VP64-BFP载体,编码与两个C末端SV40 NLS和tagBFP以及VP64结构域融合的哺乳动物密码子优化的化脓性链球菌dCas9,和U6-sgRNA-CMV-mCherry-T2A-Puro质粒用于细胞系转染(来自Stanley Qi博士的两种礼物)。使用In-Fusion HD-克隆试剂盒(克隆泰克公司(Clontech))按照制造商的方案将sgRNA克隆到BstXI和XhoI位点中。通过将来自上述载体的dCas9-VP64和U6-sgRNA-CMV-mCherry表达盒克隆到TARGATT(CAG+多聚A)质粒(应用干细胞公司(Applied StemCell))中,产生小鼠敲入载体。克隆了pcDNA-dCas9-VP64(Addgene 47107)和U6-sgRNA-CMV-mCherry-WPREpA进入pAAV-Ef1a-FAS-hChR2(H134R)-mCherry-WPRE-pA(Addgene 37090)的骨架,用我们的U6-sgRNA-CMV-mCherry替换了Ef1a-FAS-hChR2(H134R)-mCherry-WPRE-pA。
生成AAV
使用Stanford Neuroscience病毒载体核心产生AAV DJ血清型颗粒。pCMV-dCas9-VP64的包装负荷为5.4kb,pU6-Sim1Pr-CMV-mCherry和pU6-SCE2-CMV-mCherry为2.5kb。通过WPRE和ITR探针确定基因组滴度,对于pCMV-dCas9-VP64为1.40E10病毒基因组(vg)/ml,并且对于pU6-Sim1Pr-CMV-mCherry为3.30E13vg/ml,对于pU6-SCE2-CMV-mCherry为2.20E13vg/ml。
细胞培养
根据ATCC指南培养神经母细胞瘤2a细胞(Neuro-2a; CCL-131)。按照制造商的方案,使用X-tremeGENE HP DNA转染试剂(罗氏(Roche))将质粒转染到Neuro-2a细胞中。在不同的MOI下将AAV颗粒感染到Neuro2a细胞中。转染后48小时和感染后5天收获Neuro2a细胞以分离RNA用于qRT-PCR分析。
按照ATCC指南培养人HEK293T细胞。按照制造商的方案,使用X-tremeGENE HP DNA转染试剂(罗氏(Roche))将质粒转染到这些细胞中。
定量逆转录PCR
使用RNeasy迷你试剂盒(凯杰公司(Qiagen))按照制造商的方案从细胞或组织中分离RNA。对于小鼠,将动物安乐死并将组织直接收获到RNeasy迷你试剂盒的RNA裂解缓冲液中。使用来自Zivic仪器公司(Zivic Instruments)的小鼠Brain Matrix和切片机解剖下丘脑。使用SuperScript III第一链合成系统(英杰公司(Invitrogen)),使用制造商的方案以及DNA酶I消化制备cDNA。使用SsoFast EvaGreen超混合物(伯乐公司(Biorad))进行qPCR。结果表示为通过ΔΔCT方法标准化至β-肌动蛋白,Rpl38或Elf3表达的目标基因mRNA表达的倍数增加,随后进行ANOVA和Tukey检验以进行统计学分析。报告的值是在不同日期(N=3)进行的三次独立实验的平均值和标准误差,其中每个实验平均化的技术重复。
小鼠
混合遗传背景上的Sim1+/-小鼠(17)作为Jacques Michaud博士实验室的礼物获得。在这些小鼠中,含有750bp的5′区域的1kb片段,起始密码子和编码碱性结构域的序列(前17个氨基酸)被Pgk-neo盒取代,用于使用KAPA小鼠基因分型试剂盒(KAPA生物系统公司)进行基因分型。为了产生dCas9-VP64和sgRNA小鼠,我们使用TARGATT技术(24)。制备注射用DNA,并使用TARGATT转基因试剂盒V6(应用干细胞公司(Applied StemCell))纯化为小环状体(mini-circle)。注射混合物在显微注射TE缓冲液(0.1mM EDTA,10mM Tris,pH 7.5)中含有3ng/μL DNA和48ng/μL体外转录的φC31o mRNA,并使用标准小鼠转基因方案进行注射(41)。将dCas9-VP64插入小鼠Hipp11基因座并将sgRNA插入Rosa26基因座。使用KAPA小鼠基因分型试剂盒对小鼠进行基因分型。使用在(PMID:21464299)中描述的PCR7+8,PCR1以及载体插入特异性dCas9-VP64引物以及mCherry特异性引物评估F0 TARGATT敲入。所有小鼠随意喂食Picolab小鼠饮食20,5058,其含有20%蛋白质,9%脂肪,4%纤维用于整个研究。卡路里由以下提供:蛋白质,23.210%,脂肪(醚提取物),21.559%,碳水化合物,55.231%。所有动物工作均经加州大学旧金山分校动物护理和使用委员会批准。
小鼠体重测量
将H11PCAG-dCas9-VP64,ROSA26Sim1Pr-sgRNA和ROSA26SCE2En-sgRNA小鼠与FVB小鼠交配3-5代以评估种系传递。各种系使用三个独立的整合体来建立交配。将H11PCAG-dCas9-VP64与Sim1+/-交配,随后将Sim1+/-X H11PCAG-dCas9-VP64小鼠用ROSA26Sim1Pr-sgRNA或ROSA26SCE2En-sgRNA杂交,以产生具有所有三个未连接等位基因的小鼠。在整个研究期间将小鼠维持在Picodiet 5058,并且来自所有基因型的至少6只雌性和6只雄性(野生型同窝仔,Sim1+/-,Sim1+/-X H11PCAG -dCas9-VP64,Sim1+/-X H11PCAG-dCas9-VP64X ROSA26Sim1Pr-sgRNA,Sim1+/-X H11PCAG-dCas9-VP64XROSA26SCE2En-sgRNA)从4-16周龄开始每周测量它们的体重。
小鼠代谢概况分析
使用哥伦布仪器公司(Columbus Instruments)综合实验室动物监测系统(CLAMS;哥伦布仪器公司)测量来自个体小鼠的代谢率。在进行代谢监测之前,将小鼠单独饲养并用粉末状picodiet 5058适应3-4天。我们将小鼠单独饲养在CLAMS单元中,并经4-5天进行测量。将温度保持在22℃,用设定为20.901和0.0049的“空气参比”校准氧气和二氧化碳。测量来自每种基因型的三只雄性和三只雌性:野生型同窝仔,Sim1+/-,Sim1+/-X H11PCAG-dCas9-VP64XROSA26Sim1Pr-sgRNA,Sim1+/-X H11PCAG-dCas9-VP64X ROSA26SCE2En-sgRNA。具有代谢参数(VCO2,VO2,RER,食物摄入和活动监测)。使用CLAX支持软件(哥伦布仪器公司)分析代谢数据。
身体组成分析
使用双能X射线吸收测定法(DEXA)或Echo磁共振成像(EchoMRI;Echo医疗系统公司(Echo Medical System))测量身体组成。对于DEXA,使用Lunar PIXImus测量使用异氟烷麻醉的小鼠的骨矿物质密度和组织组成(脂肪质量和瘦肉质量)。EchoMRI(Echo医疗系统公司)用于测量活体小鼠的全身组成参数,例如总体脂肪,瘦肉质量,体液和全身水,而无需麻醉或镇静。
立体定向注射
在手术干预之前,将4周龄的Sim1+/-雄性或雌性(体重22至26g)单独圈养在笼中至少2天。用100mg/kg阿佛丁腹膜内注射麻醉小鼠。将头骨固定在立体定向装置(David Kopf仪器公司(David Kopf Instruments))中。注入PVN的立体定位坐标为前囟尾部0.80mm,中线0mm,颅骨表面下5.2mm。使用手持式Dumont 5-45镊子(Fine科学工具公司(Fine ScienceTools))通过圆周运动在颅骨中形成1.5mm的孔。使用31号1ul Hamilton微量注射器,我们注射剂量为0.5×107vg/ml的sgRNA-AAV和2.5×106vg/kg的dCas-VP64-AAV,每只动物的总注射体积为1ul,单侧进入PVN经10分钟。在AAV递送后,将针留在原位20分钟以防止回流并经10分钟分几步缓慢取出。在手术前和手术后24小时给小鼠施用两剂丁丙诺啡(100mg/kg)。如下所述,mCherry的免疫染色用于在几只小鼠中注射后2-12周验证PVN注射坐标。将小鼠维持在picodiet 5058上并每周称重。
免疫染色
对于免疫染色,用戊巴比妥(7.5mg/0.15ml,腹膜内)麻醉小鼠,并用10ml肝素化盐水(10U/ml,2ml/分钟)经心脏灌注,然后用10ml磷酸盐缓冲的4%多聚甲醛(PFA)灌注。取出脑,在4%PFA中后固定24小时,然后在30%蔗糖的PBS溶液中平衡72小时。在滑动切片机(Leica SM 2000R)上对脑进行冠状切片(35微米用于免疫染色,50微米用于立体学)。如前所述进行免疫组织化学(19,42,43)。将储存在4℃的PBS中的冠状脑切片透化并在3%正常山羊血清/0.3%曲通X-100中封闭1小时,并使用mCherry抗体以1∶500的稀释度在4℃孵育过夜(Abcam ab167453)。将切片置于4,6-二脒基-2-苯基吲哚(DAPI)(0.2g/ml;236276;罗氏)中10分钟,然后将其固定在正涂布的载玻片上,并使用Vectashield(H-1000;载体实验室公司(Vector Laboratories))覆盖。在Zeiss Apotome上捕获含有PVN的切片的图像。
参考文献
1 Dang,V.T.,Kassahn,K.S.,Marcos,A.E.和Ragan,M.A.鉴定人单倍体机能不全的基因及其与节段重复的基因组接近度(Identification of human haploinsufficientgenes and their genomic proximity to segmental duplications).Eur J HumGenet.16,1350-1357.doi:1310.1038/ejhg.2008.1111.Epub 2008年6月1354.(2008).
2 Huang,N.,Lee,I.,Marcotte,E.M.和Hurles,M.E.表征和预测人类基因组中的单倍体机能不全(Characterising and predicting haploinsufficiency in the humangenome).PLoS Genet.6,e1001154.doi:1001110.1001371/journal.pgen.1001154.(2010).
3 Lek,M.等,分析60,706人的蛋白质编码遗传变异(Analysis of protein-coding genetic variation in 60,706humans).Nature.536,285-291.doi:210.1038/nature19057.(2016).
4 Bender,E.基因疗法:工业实力(Gene therapy:Industrial strength).Nature.537,S57-59.doi:10.1038/1537S1057a.(2016).
5 Kotterman,M.A.和Schaffer,D.V.用于临床基因治疗的工程改造的腺相关病毒(Engineering adeno-associated viruses for clinical gene therapy).Nat RevGenet.15,445-451.doi:410.1038/nrg3742.Epub 2014年5月1020.(2014).
6 Gilbert,L.A.等,CRISPR介导的模块化RNA指导的真核生物转录调控(CRISPR-mediated modular RNA-guided regulation of transcription in eukaryotes).Cell.154,442-451.doi:410.1016/j.cell.2013.1006.1044.Epub 2013年7月1011.(2013).
7 Perez-Pinera,P.等,基于CRISPR-Cas9的转录因子激活RNA指导的基因激活(RNA-guided gene activation by CRISPR-Cas9-based transcription factors).NatMethods.10,973-976.doi:910.1038/nmeth.2600.Epub 2013年7月1025.(2013).
8 Konermann,S.等,通过工程改造的CRISPR-Cas9复合物进行基因组规模的转录激活(Genome-scale transcriptional activation by an engineered CRISPR-Cas9complex).Nature(2014).
9 Hilton,I.B.等,基于CRISPR-Cas9的乙酰转移酶的表观基因组编辑激活来自启动子和增强子的基因(Epigenome editing by a CRISPR-Cas9-based acetyltransferaseactivates genes from promoters and enhancers).Nat Biotechnol.33,510-517.doi:510.1038/nbt.3199.Epub 2015年4月1036.(2015).
10 Chavez,A.等,高效Cas9介导的转录编程(Highly efficient Cas9-mediatedtranscriptional programming).Nat Methods.12,326-328.doi:310.1038/nmeth.3312.Epub 2015年3月1032.(2015).
11 Michaud,J.L.,Rosenquist,T.,May,N.R.和Fan,C.M.神经内分泌谱系的发展需要bHLH-PAS转录因子SIM1(Development ofneuroendocrine lineages requires thebHLH-PAS transcription factor SIM1).Genes Dev 12,3264-3275(1998).
12 Beckers,S.,Zegers,D.,Van Gaal,L.F.和Van Hul,W.瘦蛋白-黑皮质素信号传导通路在控制食物摄入中的作用(The role of the leptin-melanocortin signallingpathway in the control offood intake).Crit Rev Eukaryot Gene Expr.19,267-287.(2009).
13 Holder,J.L.,Jr.,Butte,N.F.和Zinn,A.R.与破坏了SIM1基因的平衡易位相关的深度肥胖(Profound obesity associated with a balanced translocation thatdisrupts the SIM1 gene).Hum Mol Genet 9,101-108(2000).
14 Ahituv,N.等,在人体质量极端的医学测序(Medical sequencing at theextremes ofhuman body mass).Am J Hum Genet.80,779-791.(2007).
15 Ramachandrappa,S.等,单一意识1(SIM1)中的罕见变体与严重肥胖有关(Rarevariants in single-minded 1(SIM1)are associated with severe obesity).J ClinInvest.123,3042-3050.doi:3010.1172/JCI68016.Epub 62013年6月68017.(2013).
16 Bonnefond,A.等,SIM1中的功能丧失突变导致肥胖和类似Prader-Willi的特征(Loss-of-function mutations in SIM1 contribute to obesity and Prader-Willi-like features).J Clin Invest.123,3037-3041.doi:3010.1172/JCI68035.Epub 62013年6月68017.(2013).
17 Michaud,J.L.等,Sim1单倍体机能不全导致食欲过盛,肥胖和下丘脑室旁核减少(Sim1 haploinsufficiency causes hyperphagia,obesity and reduction of theparaventricular nucleus of the hypothalamus).Hum Mol Genet 10,1465-1473(2001).
18 Tolson,K.P.等,出生后的Sim1缺乏导致过度摄食肥胖并减少Mc4r和催产素表达(Postnatal Sim1 deficiency causes hyperphagic obesity and reduced Mc4r andoxytocin expression).J30,3803-3812.(2010).
19 Kublaoui,B.M.,Holder,J.L.,Jr.,Tolson,K.P.,Gemelli,T.和Zinn,A.R.SIM1过度表达通过使食物摄入正常化来部分地拯救刺豚鼠黄色和饮食诱导的肥胖症(SIM1 overexpression partially rescues agouti yellow and diet-induced obesityby normalizing food intake).Endocrinology.147,4542-4549.Epub 2006年5月4518.(2006).
20 Yang,C.,Boucher,F.,Tremblay,A.和Michaud,J.L.芳基烃受体和SIM1之间的调节相互作用是参与控制食物摄入的两种基本螺旋-环-螺旋PAS蛋白(Regulatoryinteraction between arylhydrocarbon receptor and SIM1,two basic helix-loop-helix PAS proteins involved in the control of food intake).J Biol Chem.279,9306-9312.Epub 2003年12月9301.(2004).
21 Kim,M.J.,Oksenberg,N.,Hoffmann,T.J.,Vaisse,C.和Ahituv,N.SIM1相关增强子的功能表征(Functional characterization of SIM1-associated enhancers).HumMol Genet(2013).
22 Flint,J.和Shenk,T.病毒反式激活蛋白(Viral transactivatingproteins).Annu Rev Genet.31,177-212.(1997).
23 Chavez,A.等,多物种中Cas9激活因子的比较(Comparison of Cas9activators in multiple species).Nat Methods.13,563-567.doi:510.1038/nmeth.3871.Epub 2016年5月1023.(2016).
24 Tasic,B.等,通过原核注射在小鼠中的位点特异性整合酶介导的转基因(Site-specific integrase-mediated transgenesis in mice via pronuclearinjection).Proc Natl Acad Sci USA.108,7902-7907.doi:7910.1073/pnas.1019507108.Epub 1019502011年4月1019507104.(2011).
25 Su,A.I.等,编码小鼠和人蛋白质的转录组的基因图谱(A gene atlas of themouse and human protein-encoding transcriptomes).Proc Natl Acad Sci USA.101,6062-6067.Epub 2004年4月6069.(2004).
26 Wu,Z.,Yang,H.和Colosi,P.基因组大小对AAV载体包装的影响(Effect ofgenome size on AAV vector packaging).Mol Ther.18.80-86.doi:10.1038/mt.2009.1255.Epub 2009年11月1010.(2010).
27 Zincarelli,C.,Soltys,S.,Rengo,G.和Rabinowitz,J.E.分析全身注射后AAV血清型1-9介导的小鼠的基因表达和向性(Analysis of AAV serotypes 1-9 mediatedgene expression and tropism in mice after systemic injection).Mol Ther.16,1073-1080.doi:1010.1038/mt.2008.1076.Epub 2008年4月1015.(2008).
28 Weise,A.等,微缺失和微复制综合征(Microdeletion and microduplicationsyndromes).J HistochemCytochem.60,346-358.doi:310.1369/0022155412440001.Epub0022155412442012年3月0022155412440006.(2012).
29 Horlbeck,M.A.等,核小体阻碍Cas9进入DNA(Nucleosomes impede Cas9access to DNA and).Elife.5.,e12677.doi:12610.17554/eLife.12677.(2016).
30 Otchy,T.M.等,神经回路操纵的急性脱靶效应(Acute off-target effectsof neural circuit manipulations).Nature.528.358-363.doi:310.1038/nature16442.Epub 12015年12月16449.(2015).
31 Bondy-Denomy,J.,Pawluk,A.,Maxwell,K.L.和Davidson,A.R.使CRISPR/Cas细菌免疫系统失活的噬菌体基因(Bacteriophage genes that inactivate the CRISPR/Cas bacterial immune system).Nature.493.429-432.doi:410.1038/nature11723.Epub12012年12月11716.(2013).
32 Wang,D.等,尽管Cas9特异性免疫应答,小鼠肝脏中CRISPR/Cas9的腺病毒介导的对Pten的体细胞基因组编辑(Adenovirus-Mediated Somatic Genome Editing of Ptenby CRISPR/Cas9 in Mouse Liver in Spite of Cas9-Specific Immune Responses).HumGene Ther.26,432-442.doi:410.1089/hum.2015.1087.(2015).
33 Chew,W.L.等,多功能AAV-CRISPR-Cas9及其宿主应答(A multifunctionalAAV-CRISPR-Cas9 and its host response).Nat Methods.13,868-874.doi:810.1038/nmeth.3993.Epub 2016年9月1035.(2016).
34 Donsante,A.等,小鼠肝细胞癌中的AAV载体整合位点(AAV vectorintegration sites in mouse hepatocellular carcinoma).Science.317,477.(2007).
35 Chandler,R.J.等,载体设计影响腺相关病毒基因治疗后的肝脏遗传毒性(Vector design influences hepatic genotoxicity after adeno-associated virusgene therapy).J Clin Invest.125,870-880.doi:810.1172/JCI79213.Epub 72015年1月79220.(2015).
36 Nault,J.C.等,在人肝细胞癌中复发的AAV2相关插入诱变(Recurrent AAV2-related insertional mutagenesis in human hepatocellular carcinomas).NatGenet.47,1187-1193.doi:1110.1038/ng.3389.Epub 2015年8月1124.(2015).
37 Deng,W.等,通过强制染色质环化重新激活发育沉默的球蛋白基因(Reactivation of developmentally silenced globin genes by forced chromatinlooping).Cell.158,849-860.doi:810.1016/j.cell.2014.1005.1050.(2014).
38 Canver,M.C.等,通过Cas9介导的原位饱和诱变进行BCL11A增强子解剖(BCL11A enhancer dissection by Cas9-mediated in situ saturating mutagenesis).Nature.527,192-197.doi:110.1038/nature15521.Epub 12015年9月15516.(2015).
39 Hirst,R.C.,McCullagh,K.J.和Davies,K.E.杜氏肌营养不良中的肌养相关蛋白上调(Utrophin upregulation in Duchenne muscular dystrophy).Acta Myol.24,209-216.(2005).
40 Sproule,D.M.和Kaufmann,P.脊髓性肌萎缩症的治疗进展(Therapeuticdevelopments in spinal muscular atrophy).Ther Adv Neurol Disord.3,173-185.doi:110.1177/1756285610369026.(2010).
41 Nagy,A.,Gertsenstein,M.,Vintersten,K.和Behringer,R.《小鼠胚胎操作:实验室手册》(Manipulating the mouse embryo:A laboratory manual).第三版(冷泉港实验室(Cold Spring Harbor),2002).
42 Beuckmann,C.T.等,在食欲素神经元中表达多谷氨酰胺-共济失调蛋白-3转基因诱导大鼠发作性睡病-猝倒(Expression of a poly-glutamine-ataxin-3 transgenein orexin neurons induces narcolepsy-cataplexy in the rat).J Neurosci.24,4469-4477.(2004).
43 Kublaoui,B.M.,Gemelli,T.,Tolson,K.P.,Wang,Y.和Zinn,A.R.催产素缺乏介导Sim1单倍体机能不全的小鼠的过度肥胖(Oxytocin deficiency mediateshyperphagic obesity of Sim1 haploinsufficient mice).Mol Endocrinol.22,1723-1734.doi:1710.1210/me.2008-0067.Epub 2008年5月1721.(2008).
***
虽然通过阐述和举例的方式详细描述了上述发明以清晰理解,但本发明技术人员应理解可在所附权利要求书范围内实施某些改变和修改。通过引用将本文引用的所有专利、专利申请和其它公开文献包括GenBank登录号,Entrez基因ID和由PubMed ID(PMID)引用的公开文献全文纳入本文用于所有目的。
序列表
<110> 加利福尼亚大学董事会(The Regents of the University of California)
<120> 单倍体机能不全的基因疗法
<130> 081906-224410PC-1072775
<150> PCT/US2018/017186
<151> 2018-02-07
<150> US 62/455,988
<151> 2017-02-07
<160> 95
<170> PatentIn version 3.5
<210> 1
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 1
gacacggaat tcattgccag 20
<210> 2
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 2
ctgcgggtta ggtctaccgg 20
<210> 3
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 3
gttgagcgct cagtccagcg 20
<210> 4
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 4
tcccgacgtc gtgcgcgacc 20
<210> 5
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 5
gctctgaatc ttactacccg 20
<210> 6
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 6
gctgttaact aaagacaggg 20
<210> 7
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 7
gtggtctggg tgatctcatg 20
<210> 8
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 8
gacaaaggaa catctgagag g 21
<210> 9
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 9
gtgatctcat ggggaagagg 20
<210> 10
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 10
ggctttgatc gtggtctggg 20
<210> 11
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 11
gcgagcccag tcgcgtgggg 20
<210> 12
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 12
gccaagaatt ggccaaaggg 20
<210> 13
<211> 159
<212> PRT
<213> 智人(Homo sapiens)
<400> 13
Glu Lys Cys Leu Ser Val Ala Cys Leu Asp Lys Asn Glu Leu Ser Asp
1 5 10 15
His Leu Asp Ala Met Asp Ser Asn Leu Asp Asn Leu Gln Thr Met Leu
20 25 30
Ser Ser His Gly Phe Ser Val Asp Thr Ser Ala Leu Leu Asp Leu Phe
35 40 45
Ser Pro Ser Val Thr Val Pro Asp Met Ser Leu Pro Asp Leu Asp Ser
50 55 60
Ser Leu Ala Ser Ile Gln Glu Leu Leu Ser Pro Gln Glu Pro Pro Arg
65 70 75 80
Pro Pro Glu Ala Glu Asn Ser Ser Pro Asp Ser Gly Lys Gln Leu Val
85 90 95
His Tyr Thr Ala Gln Pro Leu Phe Leu Leu Asp Pro Gly Ser Val Asp
100 105 110
Thr Gly Ser Asn Asp Leu Pro Val Leu Phe Glu Leu Gly Glu Gly Ser
115 120 125
Tyr Phe Ser Glu Gly Asp Gly Phe Ala Glu Asp Pro Thr Ile Ser Leu
130 135 140
Leu Thr Gly Ser Glu Pro Pro Lys Ala Lys Asp Pro Thr Val Ser
145 150 155
<210> 14
<211> 11
<212> PRT
<213> 未知
<220>
<223> 单纯疱疹病毒
<400> 14
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
1 5 10
<210> 15
<211> 50
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 15
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu
1 5 10 15
Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe
20 25 30
Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp
35 40 45
Met Leu
50
<210> 16
<211> 261
<212> PRT
<213> 智人(Homo sapiens)
<400> 16
Ser Gln Tyr Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu Glu Lys
1 5 10 15
Arg Lys Arg Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys Lys Ser Pro
20 25 30
Phe Ser Gly Pro Thr Asp Pro Arg Pro Pro Pro Arg Arg Ile Ala Val
35 40 45
Pro Ser Arg Ser Ser Ala Ser Val Pro Lys Pro Ala Pro Gln Pro Tyr
50 55 60
Pro Phe Thr Ser Ser Leu Ser Thr Ile Asn Tyr Asp Glu Phe Pro Thr
65 70 75 80
Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro
85 90 95
Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro
100 105 110
Ala Met Val Ser Ala Leu Ala Gln Ala Pro Ala Pro Val Pro Val Leu
115 120 125
Ala Pro Gly Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys Pro Thr
130 135 140
Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe
145 150 155 160
Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala
165 170 175
Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu
180 185 190
Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro Met Leu
195 200 205
Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg
210 215 220
Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn
225 230 235 240
Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp
245 250 255
Phe Ser Ala Leu Leu
260
<210> 17
<211> 318
<212> PRT
<213> 小家鼠(Mus musculus)
<400> 17
Met Glu Leu Leu Ser Pro Pro Leu Arg Asp Ile Asp Leu Thr Gly Pro
1 5 10 15
Asp Gly Ser Leu Cys Ser Phe Glu Thr Ala Asp Asp Phe Tyr Asp Asp
20 25 30
Pro Cys Phe Asp Ser Pro Asp Leu Arg Phe Phe Glu Asp Leu Asp Pro
35 40 45
Arg Leu Val His Met Gly Ala Leu Leu Lys Pro Glu Glu His Ala His
50 55 60
Phe Pro Thr Ala Val His Pro Gly Pro Gly Ala Arg Glu Asp Glu His
65 70 75 80
Val Arg Ala Pro Ser Gly His His Gln Ala Gly Arg Cys Leu Leu Trp
85 90 95
Ala Cys Lys Ala Cys Lys Arg Lys Thr Thr Asn Ala Asp Arg Arg Lys
100 105 110
Ala Ala Thr Met Arg Glu Arg Arg Arg Leu Ser Lys Val Asn Glu Ala
115 120 125
Phe Glu Thr Leu Lys Arg Cys Thr Ser Ser Asn Pro Asn Gln Arg Leu
130 135 140
Pro Lys Val Glu Ile Leu Arg Asn Ala Ile Arg Tyr Ile Glu Gly Leu
145 150 155 160
Gln Ala Leu Leu Arg Asp Gln Asp Ala Ala Pro Pro Gly Ala Ala Ala
165 170 175
Phe Tyr Ala Pro Gly Pro Leu Pro Pro Gly Arg Gly Ser Glu His Tyr
180 185 190
Ser Gly Asp Ser Asp Ala Ser Ser Pro Arg Ser Asn Cys Ser Asp Gly
195 200 205
Met Met Asp Tyr Ser Gly Pro Pro Ser Gly Pro Arg Arg Gln Asn Gly
210 215 220
Tyr Asp Thr Ala Tyr Tyr Ser Glu Ala Ala Arg Glu Ser Arg Pro Gly
225 230 235 240
Lys Ser Ala Ala Val Ser Ser Leu Asp Cys Leu Ser Ser Ile Val Glu
245 250 255
Arg Ile Ser Thr Asp Ser Pro Ala Ala Pro Ala Leu Leu Leu Ala Asp
260 265 270
Ala Pro Pro Glu Ser Pro Pro Gly Pro Pro Glu Gly Ala Ser Leu Ser
275 280 285
Asp Thr Glu Gln Gly Thr Gln Thr Pro Ser Pro Asp Ala Ala Pro Gln
290 295 300
Cys Pro Ala Gly Ser Asn Pro Asn Ala Ile Tyr Gln Val Leu
305 310 315
<210> 18
<211> 190
<212> PRT
<213> 未知
<220>
<223> EB病毒
<400> 18
Arg Asp Ser Arg Glu Gly Met Phe Leu Pro Lys Pro Glu Ala Gly Ser
1 5 10 15
Ala Ile Ser Asp Val Phe Glu Gly Arg Glu Val Cys Gln Pro Lys Arg
20 25 30
Ile Arg Pro Phe His Pro Pro Gly Ser Pro Trp Ala Asn Arg Pro Leu
35 40 45
Pro Ala Ser Leu Ala Pro Thr Pro Thr Gly Pro Val His Glu Pro Val
50 55 60
Gly Ser Leu Thr Pro Ala Pro Val Pro Gln Pro Leu Asp Pro Ala Pro
65 70 75 80
Ala Val Thr Pro Glu Ala Ser His Leu Leu Glu Asp Pro Asp Glu Glu
85 90 95
Thr Ser Gln Ala Val Lys Ala Leu Arg Glu Met Ala Asp Thr Val Ile
100 105 110
Pro Gln Lys Glu Glu Ala Ala Ile Cys Gly Gln Met Asp Leu Ser His
115 120 125
Pro Pro Pro Arg Gly His Leu Asp Glu Leu Thr Thr Thr Leu Glu Ser
130 135 140
Met Thr Glu Asp Leu Asn Leu Asp Ser Pro Leu Thr Pro Glu Leu Asn
145 150 155 160
Glu Ile Leu Asp Thr Phe Leu Asn Asp Glu Cys Leu Leu His Ala Met
165 170 175
His Ile Ser Thr Gly Leu Ser Ile Phe Asp Thr Ser Leu Phe
180 185 190
<210> 19
<211> 366
<212> PRT
<213> 智人(Homo sapiens)
<400> 19
Met Asp Ser Asp Asp Glu Met Val Glu Glu Ala Val Glu Gly His Leu
1 5 10 15
Asp Asp Asp Gly Leu Pro His Gly Phe Cys Thr Val Thr Tyr Ser Ser
20 25 30
Thr Asp Arg Phe Glu Gly Asn Phe Val His Gly Glu Lys Asn Gly Arg
35 40 45
Gly Lys Phe Phe Phe Phe Asp Gly Ser Thr Leu Glu Gly Tyr Tyr Val
50 55 60
Asp Asp Ala Leu Gln Gly Gln Gly Val Tyr Thr Tyr Glu Asp Gly Gly
65 70 75 80
Val Leu Gln Gly Thr Tyr Val Asp Gly Glu Leu Asn Gly Pro Ala Gln
85 90 95
Glu Tyr Asp Thr Asp Gly Arg Leu Ile Phe Lys Gly Gln Tyr Lys Asp
100 105 110
Asn Ile Arg His Gly Val Cys Trp Ile Tyr Tyr Pro Asp Gly Gly Ser
115 120 125
Leu Val Gly Glu Val Asn Glu Asp Gly Glu Met Thr Gly Glu Lys Ile
130 135 140
Ala Tyr Val Tyr Pro Asp Glu Arg Thr Ala Leu Tyr Gly Lys Phe Ile
145 150 155 160
Asp Gly Glu Met Ile Glu Gly Lys Leu Ala Thr Leu Met Ser Thr Glu
165 170 175
Glu Gly Arg Pro His Phe Glu Leu Met Pro Gly Asn Ser Val Tyr His
180 185 190
Phe Asp Lys Ser Thr Ser Ser Cys Ile Ser Thr Asn Ala Leu Leu Pro
195 200 205
Asp Pro Tyr Glu Ser Glu Arg Val Tyr Val Ala Glu Ser Leu Ile Ser
210 215 220
Ser Ala Gly Glu Gly Leu Phe Ser Lys Val Ala Val Gly Pro Asn Thr
225 230 235 240
Val Met Ser Phe Tyr Asn Gly Val Arg Ile Thr His Gln Glu Val Asp
245 250 255
Ser Arg Asp Trp Ala Leu Asn Gly Asn Thr Leu Ser Leu Asp Glu Glu
260 265 270
Thr Val Ile Asp Val Pro Glu Pro Tyr Asn His Val Ser Lys Tyr Cys
275 280 285
Ala Ser Leu Gly His Lys Ala Asn His Ser Phe Thr Pro Asn Cys Ile
290 295 300
Tyr Asp Met Phe Val His Pro Arg Phe Gly Pro Ile Lys Cys Ile Arg
305 310 315 320
Thr Leu Arg Ala Val Glu Ala Asp Glu Glu Leu Thr Val Ala Tyr Gly
325 330 335
Tyr Asp His Ser Pro Pro Gly Lys Ser Gly Pro Glu Ala Pro Glu Trp
340 345 350
Tyr Gln Val Glu Leu Lys Ala Phe Gln Ala Thr Gln Gln Lys
355 360 365
<210> 20
<211> 531
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 20
Glu Ala Ser Gly Ser Gly Arg Ala Asp Ala Leu Asp Asp Phe Asp Leu
1 5 10 15
Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
20 25 30
Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp
35 40 45
Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Ile Asn Ser Arg Ser Ser
50 55 60
Gly Ser Pro Lys Lys Lys Arg Lys Val Gly Ser Gln Tyr Leu Pro Asp
65 70 75 80
Thr Asp Asp Arg His Arg Ile Glu Glu Lys Arg Lys Arg Thr Tyr Glu
85 90 95
Thr Phe Lys Ser Ile Met Lys Lys Ser Pro Phe Ser Gly Pro Thr Asp
100 105 110
Pro Arg Pro Pro Pro Arg Arg Ile Ala Val Pro Ser Arg Ser Ser Ala
115 120 125
Ser Val Pro Lys Pro Ala Pro Gln Pro Tyr Pro Phe Thr Ser Ser Leu
130 135 140
Ser Thr Ile Asn Tyr Asp Glu Phe Pro Thr Met Val Phe Pro Ser Gly
145 150 155 160
Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro Pro Gln Val Leu
165 170 175
Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala Met Val Ser Ala Leu
180 185 190
Ala Gln Ala Pro Ala Pro Val Pro Val Leu Ala Pro Gly Pro Pro Gln
195 200 205
Ala Val Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr
210 215 220
Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly
225 230 235 240
Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala Val Phe Thr Asp Leu Ala
245 250 255
Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro
260 265 270
Val Ala Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr Pro Glu Ala
275 280 285
Ile Thr Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro
290 295 300
Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp
305 310 315 320
Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Gly
325 330 335
Ser Gly Ser Gly Ser Arg Asp Ser Arg Glu Gly Met Phe Leu Pro Lys
340 345 350
Pro Glu Ala Gly Ser Ala Ile Ser Asp Val Phe Glu Gly Arg Glu Val
355 360 365
Cys Gln Pro Lys Arg Ile Arg Pro Phe His Pro Pro Gly Ser Pro Trp
370 375 380
Ala Asn Arg Pro Leu Pro Ala Ser Leu Ala Pro Thr Pro Thr Gly Pro
385 390 395 400
Val His Glu Pro Val Gly Ser Leu Thr Pro Ala Pro Val Pro Gln Pro
405 410 415
Leu Asp Pro Ala Pro Ala Val Thr Pro Glu Ala Ser His Leu Leu Glu
420 425 430
Asp Pro Asp Glu Glu Thr Ser Gln Ala Val Lys Ala Leu Arg Glu Met
435 440 445
Ala Asp Thr Val Ile Pro Gln Lys Glu Glu Ala Ala Ile Cys Gly Gln
450 455 460
Met Asp Leu Ser His Pro Pro Pro Arg Gly His Leu Asp Glu Leu Thr
465 470 475 480
Thr Thr Leu Glu Ser Met Thr Glu Asp Leu Asn Leu Asp Ser Pro Leu
485 490 495
Thr Pro Glu Leu Asn Glu Ile Leu Asp Thr Phe Leu Asn Asp Glu Cys
500 505 510
Leu Leu His Ala Met His Ile Ser Thr Gly Leu Ser Ile Phe Asp Thr
515 520 525
Ser Leu Phe
530
<210> 21
<211> 377
<212> PRT
<213> 智人(Homo sapiens)
<400> 21
Lys Phe Ser Ala Lys Arg Leu Pro Ser Thr Arg Leu Gly Thr Phe Leu
1 5 10 15
Glu Asn Arg Val Asn Asp Phe Leu Arg Arg Gln Asn His Pro Glu Ser
20 25 30
Gly Glu Val Thr Val Arg Val Val His Ala Ser Asp Lys Thr Val Glu
35 40 45
Val Lys Pro Gly Met Lys Ala Arg Phe Val Asp Ser Gly Glu Met Ala
50 55 60
Glu Ser Phe Pro Tyr Arg Thr Lys Ala Leu Phe Ala Phe Glu Glu Ile
65 70 75 80
Asp Gly Val Asp Leu Cys Phe Phe Gly Met His Val Gln Glu Tyr Gly
85 90 95
Ser Asp Cys Pro Pro Pro Asn Gln Arg Arg Val Tyr Ile Ser Tyr Leu
100 105 110
Asp Ser Val His Phe Phe Arg Pro Lys Cys Leu Arg Thr Ala Val Tyr
115 120 125
His Glu Ile Leu Ile Gly Tyr Leu Glu Tyr Val Lys Lys Leu Gly Tyr
130 135 140
Thr Thr Gly His Ile Trp Ala Cys Pro Pro Ser Glu Gly Asp Asp Tyr
145 150 155 160
Ile Phe His Cys His Pro Pro Asp Gln Lys Ile Pro Lys Pro Lys Arg
165 170 175
Leu Gln Glu Trp Tyr Lys Lys Met Leu Asp Lys Ala Val Ser Glu Arg
180 185 190
Ile Val His Asp Tyr Lys Asp Ile Phe Lys Gln Ala Thr Glu Asp Arg
195 200 205
Leu Thr Ser Ala Lys Glu Leu Pro Tyr Phe Glu Gly Asp Phe Trp Pro
210 215 220
Asn Val Leu Glu Glu Ser Ile Lys Glu Leu Glu Gln Glu Glu Glu Glu
225 230 235 240
Arg Lys Arg Glu Glu Asn Thr Ser Asn Glu Ser Thr Asp Val Thr Lys
245 250 255
Gly Asp Ser Lys Asn Ala Lys Lys Lys Asn Asn Lys Lys Thr Ser Lys
260 265 270
Asn Lys Ser Ser Leu Ser Arg Gly Asn Lys Lys Lys Pro Gly Met Pro
275 280 285
Asn Val Ser Asn Asp Leu Ser Gln Lys Leu Tyr Ala Thr Met Glu Lys
290 295 300
His Lys Glu Val Phe Phe Val Ile Arg Leu Ile Ala Gly Pro Ala Ala
305 310 315 320
Asn Ser Leu Pro Pro Ile Val Asp Pro Asp Pro Leu Ile Pro Cys Asp
325 330 335
Leu Met Asp Gly Arg Asp Ala Phe Leu Thr Leu Ala Arg Asp Lys His
340 345 350
Leu Glu Phe Ser Ser Leu Arg Arg Ala Gln Trp Ser Thr Met Cys Met
355 360 365
Leu Val Glu Leu His Thr Gln Ser Gln
370 375
<210> 22
<211> 2136
<212> PRT
<213> 智人(Homo sapiens)
<400> 22
Met Ser Arg Ser Arg His Ala Arg Pro Ser Arg Leu Val Arg Lys Glu
1 5 10 15
Asp Val Asn Lys Lys Lys Lys Asn Ser Gln Leu Arg Lys Thr Thr Lys
20 25 30
Gly Ala Asn Lys Asn Val Ala Ser Val Lys Thr Leu Ser Pro Gly Lys
35 40 45
Leu Lys Gln Leu Ile Gln Glu Arg Asp Val Lys Lys Lys Thr Glu Pro
50 55 60
Lys Pro Pro Val Pro Val Arg Ser Leu Leu Thr Arg Ala Gly Ala Ala
65 70 75 80
Arg Met Asn Leu Asp Arg Thr Glu Val Leu Phe Gln Asn Pro Glu Ser
85 90 95
Leu Thr Cys Asn Gly Phe Thr Met Ala Leu Arg Ser Thr Ser Leu Ser
100 105 110
Arg Arg Leu Ser Gln Pro Pro Leu Val Val Ala Lys Ser Lys Lys Val
115 120 125
Pro Leu Ser Lys Gly Leu Glu Lys Gln His Asp Cys Asp Tyr Lys Ile
130 135 140
Leu Pro Ala Leu Gly Val Lys His Ser Glu Asn Asp Ser Val Pro Met
145 150 155 160
Gln Asp Thr Gln Val Leu Pro Asp Ile Glu Thr Leu Ile Gly Val Gln
165 170 175
Asn Pro Ser Leu Leu Lys Gly Lys Ser Gln Glu Thr Thr Gln Phe Trp
180 185 190
Ser Gln Arg Val Glu Asp Ser Lys Ile Asn Ile Pro Thr His Ser Gly
195 200 205
Pro Ala Ala Glu Ile Leu Pro Gly Pro Leu Glu Gly Thr Arg Cys Gly
210 215 220
Glu Gly Leu Phe Ser Glu Glu Thr Leu Asn Asp Thr Ser Gly Ser Pro
225 230 235 240
Lys Met Phe Ala Gln Asp Thr Val Cys Ala Pro Phe Pro Gln Arg Ala
245 250 255
Thr Pro Lys Val Thr Ser Gln Gly Asn Pro Ser Ile Gln Leu Glu Glu
260 265 270
Leu Gly Ser Arg Val Glu Ser Leu Lys Leu Ser Asp Ser Tyr Leu Asp
275 280 285
Pro Ile Lys Ser Glu His Asp Cys Tyr Pro Thr Ser Ser Leu Asn Lys
290 295 300
Val Ile Pro Asp Leu Asn Leu Arg Asn Cys Leu Ala Leu Gly Gly Ser
305 310 315 320
Thr Ser Pro Thr Ser Val Ile Lys Phe Leu Leu Ala Gly Ser Lys Gln
325 330 335
Ala Thr Leu Gly Ala Lys Pro Asp His Gln Glu Ala Phe Glu Ala Thr
340 345 350
Ala Asn Gln Gln Glu Val Ser Asp Thr Thr Ser Phe Leu Gly Gln Ala
355 360 365
Phe Gly Ala Ile Pro His Gln Trp Glu Leu Pro Gly Ala Asp Pro Val
370 375 380
His Gly Glu Ala Leu Gly Glu Thr Pro Asp Leu Pro Glu Ile Pro Gly
385 390 395 400
Ala Ile Pro Val Gln Gly Glu Val Phe Gly Thr Ile Leu Asp Gln Gln
405 410 415
Glu Thr Leu Gly Met Ser Gly Ser Val Val Pro Asp Leu Pro Val Phe
420 425 430
Leu Pro Val Pro Pro Asn Pro Ile Ala Thr Phe Asn Ala Pro Ser Lys
435 440 445
Trp Pro Glu Pro Gln Ser Thr Val Ser Tyr Gly Leu Ala Val Gln Gly
450 455 460
Ala Ile Gln Ile Leu Pro Leu Gly Ser Gly His Thr Pro Gln Ser Ser
465 470 475 480
Ser Asn Ser Glu Lys Asn Ser Leu Pro Pro Val Met Ala Ile Ser Asn
485 490 495
Val Glu Asn Glu Lys Gln Val His Ile Ser Phe Leu Pro Ala Asn Thr
500 505 510
Gln Gly Phe Pro Leu Ala Pro Glu Arg Gly Leu Phe His Ala Ser Leu
515 520 525
Gly Ile Ala Gln Leu Ser Gln Ala Gly Pro Ser Lys Ser Asp Arg Gly
530 535 540
Ser Ser Gln Val Ser Val Thr Ser Thr Val His Val Val Asn Thr Thr
545 550 555 560
Val Val Thr Met Pro Val Pro Met Val Ser Thr Ser Ser Ser Ser Tyr
565 570 575
Thr Thr Leu Leu Pro Thr Leu Glu Lys Lys Lys Arg Lys Arg Cys Gly
580 585 590
Val Cys Glu Pro Cys Gln Gln Lys Thr Asn Cys Gly Glu Cys Thr Tyr
595 600 605
Cys Lys Asn Arg Lys Asn Ser His Gln Ile Cys Lys Lys Arg Lys Cys
610 615 620
Glu Glu Leu Lys Lys Lys Pro Ser Val Val Val Pro Leu Glu Val Ile
625 630 635 640
Lys Glu Asn Lys Arg Pro Gln Arg Glu Lys Lys Pro Lys Val Leu Lys
645 650 655
Ala Asp Phe Asp Asn Lys Pro Val Asn Gly Pro Lys Ser Glu Ser Met
660 665 670
Asp Tyr Ser Arg Cys Gly His Gly Glu Glu Gln Lys Leu Glu Leu Asn
675 680 685
Pro His Thr Val Glu Asn Val Thr Lys Asn Glu Asp Ser Met Thr Gly
690 695 700
Ile Glu Val Glu Lys Trp Thr Gln Asn Lys Lys Ser Gln Leu Thr Asp
705 710 715 720
His Val Lys Gly Asp Phe Ser Ala Asn Val Pro Glu Ala Glu Lys Ser
725 730 735
Lys Asn Ser Glu Val Asp Lys Lys Arg Thr Lys Ser Pro Lys Leu Phe
740 745 750
Val Gln Thr Val Arg Asn Gly Ile Lys His Val His Cys Leu Pro Ala
755 760 765
Glu Thr Asn Val Ser Phe Lys Lys Phe Asn Ile Glu Glu Phe Gly Lys
770 775 780
Thr Leu Glu Asn Asn Ser Tyr Lys Phe Leu Lys Asp Thr Ala Asn His
785 790 795 800
Lys Asn Ala Met Ser Ser Val Ala Thr Asp Met Ser Cys Asp His Leu
805 810 815
Lys Gly Arg Ser Asn Val Leu Val Phe Gln Gln Pro Gly Phe Asn Cys
820 825 830
Ser Ser Ile Pro His Ser Ser His Ser Ile Ile Asn His His Ala Ser
835 840 845
Ile His Asn Glu Gly Asp Gln Pro Lys Thr Pro Glu Asn Ile Pro Ser
850 855 860
Lys Glu Pro Lys Asp Gly Ser Pro Val Gln Pro Ser Leu Leu Ser Leu
865 870 875 880
Met Lys Asp Arg Arg Leu Thr Leu Glu Gln Val Val Ala Ile Glu Ala
885 890 895
Leu Thr Gln Leu Ser Glu Ala Pro Ser Glu Asn Ser Ser Pro Ser Lys
900 905 910
Ser Glu Lys Asp Glu Glu Ser Glu Gln Arg Thr Ala Ser Leu Leu Asn
915 920 925
Ser Cys Lys Ala Ile Leu Tyr Thr Val Arg Lys Asp Leu Gln Asp Pro
930 935 940
Asn Leu Gln Gly Glu Pro Pro Lys Leu Asn His Cys Pro Ser Leu Glu
945 950 955 960
Lys Gln Ser Ser Cys Asn Thr Val Val Phe Asn Gly Gln Thr Thr Thr
965 970 975
Leu Ser Asn Ser His Ile Asn Ser Ala Thr Asn Gln Ala Ser Thr Lys
980 985 990
Ser His Glu Tyr Ser Lys Val Thr Asn Ser Leu Ser Leu Phe Ile Pro
995 1000 1005
Lys Ser Asn Ser Ser Lys Ile Asp Thr Asn Lys Ser Ile Ala Gln
1010 1015 1020
Gly Ile Ile Thr Leu Asp Asn Cys Ser Asn Asp Leu His Gln Leu
1025 1030 1035
Pro Pro Arg Asn Asn Glu Val Glu Tyr Cys Asn Gln Leu Leu Asp
1040 1045 1050
Ser Ser Lys Lys Leu Asp Ser Asp Asp Leu Ser Cys Gln Asp Ala
1055 1060 1065
Thr His Thr Gln Ile Glu Glu Asp Val Ala Thr Gln Leu Thr Gln
1070 1075 1080
Leu Ala Ser Ile Ile Lys Ile Asn Tyr Ile Lys Pro Glu Asp Lys
1085 1090 1095
Lys Val Glu Ser Thr Pro Thr Ser Leu Val Thr Cys Asn Val Gln
1100 1105 1110
Gln Lys Tyr Asn Gln Glu Lys Gly Thr Ile Gln Gln Lys Pro Pro
1115 1120 1125
Ser Ser Val His Asn Asn His Gly Ser Ser Leu Thr Lys Gln Lys
1130 1135 1140
Asn Pro Thr Gln Lys Lys Thr Lys Ser Thr Pro Ser Arg Asp Arg
1145 1150 1155
Arg Lys Lys Lys Pro Thr Val Val Ser Tyr Gln Glu Asn Asp Arg
1160 1165 1170
Gln Lys Trp Glu Lys Leu Ser Tyr Met Tyr Gly Thr Ile Cys Asp
1175 1180 1185
Ile Trp Ile Ala Ser Lys Phe Gln Asn Phe Gly Gln Phe Cys Pro
1190 1195 1200
His Asp Phe Pro Thr Val Phe Gly Lys Ile Ser Ser Ser Thr Lys
1205 1210 1215
Ile Trp Lys Pro Leu Ala Gln Thr Arg Ser Ile Met Gln Pro Lys
1220 1225 1230
Thr Val Phe Pro Pro Leu Thr Gln Ile Lys Leu Gln Arg Tyr Pro
1235 1240 1245
Glu Ser Ala Glu Glu Lys Val Lys Val Glu Pro Leu Asp Ser Leu
1250 1255 1260
Ser Leu Phe His Leu Lys Thr Glu Ser Asn Gly Lys Ala Phe Thr
1265 1270 1275
Asp Lys Ala Tyr Asn Ser Gln Val Gln Leu Thr Val Asn Ala Asn
1280 1285 1290
Gln Lys Ala His Pro Leu Thr Gln Pro Ser Ser Pro Pro Asn Gln
1295 1300 1305
Cys Ala Asn Val Met Ala Gly Asp Asp Gln Ile Arg Phe Gln Gln
1310 1315 1320
Val Val Lys Glu Gln Leu Met His Gln Arg Leu Pro Thr Leu Pro
1325 1330 1335
Gly Ile Ser His Glu Thr Pro Leu Pro Glu Ser Ala Leu Thr Leu
1340 1345 1350
Arg Asn Val Asn Val Val Cys Ser Gly Gly Ile Thr Val Val Ser
1355 1360 1365
Thr Lys Ser Glu Glu Glu Val Cys Ser Ser Ser Phe Gly Thr Ser
1370 1375 1380
Glu Phe Ser Thr Val Asp Ser Ala Gln Lys Asn Phe Asn Asp Tyr
1385 1390 1395
Ala Met Asn Phe Phe Thr Asn Pro Thr Lys Asn Leu Val Ser Ile
1400 1405 1410
Thr Lys Asp Ser Glu Leu Pro Thr Cys Ser Cys Leu Asp Arg Val
1415 1420 1425
Ile Gln Lys Asp Lys Gly Pro Tyr Tyr Thr His Leu Gly Ala Gly
1430 1435 1440
Pro Ser Val Ala Ala Val Arg Glu Ile Met Glu Asn Arg Tyr Gly
1445 1450 1455
Gln Lys Gly Asn Ala Ile Arg Ile Glu Ile Val Val Tyr Thr Gly
1460 1465 1470
Lys Glu Gly Lys Ser Ser His Gly Cys Pro Ile Ala Lys Trp Val
1475 1480 1485
Leu Arg Arg Ser Ser Asp Glu Glu Lys Val Leu Cys Leu Val Arg
1490 1495 1500
Gln Arg Thr Gly His His Cys Pro Thr Ala Val Met Val Val Leu
1505 1510 1515
Ile Met Val Trp Asp Gly Ile Pro Leu Pro Met Ala Asp Arg Leu
1520 1525 1530
Tyr Thr Glu Leu Thr Glu Asn Leu Lys Ser Tyr Asn Gly His Pro
1535 1540 1545
Thr Asp Arg Arg Cys Thr Leu Asn Glu Asn Arg Thr Cys Thr Cys
1550 1555 1560
Gln Gly Ile Asp Pro Glu Thr Cys Gly Ala Ser Phe Ser Phe Gly
1565 1570 1575
Cys Ser Trp Ser Met Tyr Phe Asn Gly Cys Lys Phe Gly Arg Ser
1580 1585 1590
Pro Ser Pro Arg Arg Phe Arg Ile Asp Pro Ser Ser Pro Leu His
1595 1600 1605
Glu Lys Asn Leu Glu Asp Asn Leu Gln Ser Leu Ala Thr Arg Leu
1610 1615 1620
Ala Pro Ile Tyr Lys Gln Tyr Ala Pro Val Ala Tyr Gln Asn Gln
1625 1630 1635
Val Glu Tyr Glu Asn Val Ala Arg Glu Cys Arg Leu Gly Ser Lys
1640 1645 1650
Glu Gly Arg Pro Phe Ser Gly Val Thr Ala Cys Leu Asp Phe Cys
1655 1660 1665
Ala His Pro His Arg Asp Ile His Asn Met Asn Asn Gly Ser Thr
1670 1675 1680
Val Val Cys Thr Leu Thr Arg Glu Asp Asn Arg Ser Leu Gly Val
1685 1690 1695
Ile Pro Gln Asp Glu Gln Leu His Val Leu Pro Leu Tyr Lys Leu
1700 1705 1710
Ser Asp Thr Asp Glu Phe Gly Ser Lys Glu Gly Met Glu Ala Lys
1715 1720 1725
Ile Lys Ser Gly Ala Ile Glu Val Leu Ala Pro Arg Arg Lys Lys
1730 1735 1740
Arg Thr Cys Phe Thr Gln Pro Val Pro Arg Ser Gly Lys Lys Arg
1745 1750 1755
Ala Ala Met Met Thr Glu Val Leu Ala His Lys Ile Arg Ala Val
1760 1765 1770
Glu Lys Lys Pro Ile Pro Arg Ile Lys Arg Lys Asn Asn Ser Thr
1775 1780 1785
Thr Thr Asn Asn Ser Lys Pro Ser Ser Leu Pro Thr Leu Gly Ser
1790 1795 1800
Asn Thr Glu Thr Val Gln Pro Glu Val Lys Ser Glu Thr Glu Pro
1805 1810 1815
His Phe Ile Leu Lys Ser Ser Asp Asn Thr Lys Thr Tyr Ser Leu
1820 1825 1830
Met Pro Ser Ala Pro His Pro Val Lys Glu Ala Ser Pro Gly Phe
1835 1840 1845
Ser Trp Ser Pro Lys Thr Ala Ser Ala Thr Pro Ala Pro Leu Lys
1850 1855 1860
Asn Asp Ala Thr Ala Ser Cys Gly Phe Ser Glu Arg Ser Ser Thr
1865 1870 1875
Pro His Cys Thr Met Pro Ser Gly Arg Leu Ser Gly Ala Asn Ala
1880 1885 1890
Ala Ala Ala Asp Gly Pro Gly Ile Ser Gln Leu Gly Glu Val Ala
1895 1900 1905
Pro Leu Pro Thr Leu Ser Ala Pro Val Met Glu Pro Leu Ile Asn
1910 1915 1920
Ser Glu Pro Ser Thr Gly Val Thr Glu Pro Leu Thr Pro His Gln
1925 1930 1935
Pro Asn His Gln Pro Ser Phe Leu Thr Ser Pro Gln Asp Leu Ala
1940 1945 1950
Ser Ser Pro Met Glu Glu Asp Glu Gln His Ser Glu Ala Asp Glu
1955 1960 1965
Pro Pro Ser Asp Glu Pro Leu Ser Asp Asp Pro Leu Ser Pro Ala
1970 1975 1980
Glu Glu Lys Leu Pro His Ile Asp Glu Tyr Trp Ser Asp Ser Glu
1985 1990 1995
His Ile Phe Leu Asp Ala Asn Ile Gly Gly Val Ala Ile Ala Pro
2000 2005 2010
Ala His Gly Ser Val Leu Ile Glu Cys Ala Arg Arg Glu Leu His
2015 2020 2025
Ala Thr Thr Pro Val Glu His Pro Asn Arg Asn His Pro Thr Arg
2030 2035 2040
Leu Ser Leu Val Phe Tyr Gln His Lys Asn Leu Asn Lys Pro Gln
2045 2050 2055
His Gly Phe Glu Leu Asn Lys Ile Lys Phe Glu Ala Lys Glu Ala
2060 2065 2070
Lys Asn Lys Lys Met Lys Ala Ser Glu Gln Lys Asp Gln Ala Ala
2075 2080 2085
Asn Glu Gly Pro Glu Gln Ser Ser Glu Val Asn Glu Leu Asn Gln
2090 2095 2100
Ile Pro Ser His Lys Ala Leu Thr Leu Thr His Asp Asn Val Val
2105 2110 2115
Thr Val Ser Pro Tyr Ala Leu Thr His Val Ala Gly Pro Tyr Asn
2120 2125 2130
His Trp Val
2135
<210> 23
<211> 552
<212> PRT
<213> 小家鼠(Mus musculus)
<400> 23
Gly Met Asp Val Thr Leu Leu Glu Ala Arg Asp Arg Val Gly Gly Arg
1 5 10 15
Val Ala Thr Phe Arg Lys Gly Asn Tyr Val Ala Asp Leu Gly Ala Met
20 25 30
Val Val Thr Gly Leu Gly Gly Asn Pro Met Ala Val Val Ser Lys Gln
35 40 45
Val Asn Met Glu Leu Ala Lys Ile Lys Gln Lys Cys Pro Leu Tyr Glu
50 55 60
Ala Asn Gly Gln Ala Val Pro Lys Glu Lys Asp Glu Met Val Glu Gln
65 70 75 80
Glu Phe Asn Arg Leu Leu Glu Ala Thr Ser Tyr Leu Ser His Gln Leu
85 90 95
Asp Phe Asn Val Leu Asn Asn Lys Pro Val Ser Leu Gly Gln Ala Leu
100 105 110
Glu Val Val Ile Gln Leu Gln Glu Lys His Val Lys Asp Glu Gln Ile
115 120 125
Glu His Trp Lys Lys Ile Val Lys Thr Gln Glu Glu Leu Lys Glu Leu
130 135 140
Leu Asn Lys Met Val Asn Leu Lys Glu Lys Ile Lys Glu Leu His Gln
145 150 155 160
Gln Tyr Lys Glu Ala Ser Glu Val Lys Pro Pro Arg Asp Ile Thr Ala
165 170 175
Glu Phe Leu Val Lys Ser Lys His Arg Asp Leu Thr Ala Leu Cys Lys
180 185 190
Glu Tyr Asp Glu Leu Ala Glu Thr Gln Gly Lys Leu Glu Glu Lys Leu
195 200 205
Gln Glu Leu Glu Ala Asn Pro Pro Ser Asp Val Tyr Leu Ser Ser Arg
210 215 220
Asp Arg Gln Ile Leu Asp Trp His Phe Ala Asn Leu Glu Phe Ala Asn
225 230 235 240
Ala Thr Pro Leu Ser Thr Leu Ser Leu Lys His Trp Asp Gln Asp Asp
245 250 255
Asp Phe Glu Phe Thr Gly Ser His Leu Thr Val Arg Asn Gly Tyr Ser
260 265 270
Cys Val Pro Val Ala Leu Ala Glu Gly Leu Asp Ile Lys Leu Asn Thr
275 280 285
Ala Val Arg Gln Val Arg Tyr Thr Ala Ser Gly Cys Glu Val Ile Ala
290 295 300
Val Asn Thr Arg Ser Thr Ser Gln Thr Phe Ile Tyr Lys Cys Asp Ala
305 310 315 320
Val Leu Cys Thr Leu Pro Leu Gly Val Leu Lys Gln Gln Pro Pro Ala
325 330 335
Val Gln Phe Val Pro Pro Leu Pro Glu Trp Lys Thr Ser Ala Val Gln
340 345 350
Arg Met Gly Phe Gly Asn Leu Asn Lys Val Val Leu Cys Phe Asp Arg
355 360 365
Val Phe Trp Asp Pro Ser Val Asn Leu Phe Gly His Val Gly Ser Thr
370 375 380
Thr Ala Ser Arg Gly Glu Leu Phe Leu Phe Trp Asn Leu Tyr Lys Ala
385 390 395 400
Pro Ile Leu Leu Ala Leu Val Ala Gly Glu Ala Ala Gly Ile Met Glu
405 410 415
Asn Ile Ser Asp Asp Val Ile Val Gly Arg Cys Leu Ala Ile Leu Lys
420 425 430
Gly Ile Phe Gly Ser Ser Ala Val Pro Gln Pro Lys Glu Thr Val Val
435 440 445
Ser Arg Trp Arg Ala Asp Pro Trp Ala Arg Gly Ser Tyr Ser Tyr Val
450 455 460
Ala Ala Gly Ser Ser Gly Asn Asp Tyr Asp Leu Met Ala Gln Pro Ile
465 470 475 480
Thr Pro Gly Pro Ser Ile Pro Gly Ala Pro Gln Pro Ile Pro Arg Leu
485 490 495
Phe Phe Ala Gly Glu His Thr Ile Arg Asn Tyr Pro Ala Thr Val His
500 505 510
Gly Ala Leu Leu Ser Gly Leu Arg Glu Ala Gly Arg Ile Ala Asp Gln
515 520 525
Phe Leu Gly Ala Met Tyr Thr Leu Pro Arg Gln Ala Thr Pro Gly Val
530 535 540
Pro Ala Gln Gln Ser Pro Ser Met
545 550
<210> 24
<211> 191
<212> PRT
<213> 智人(Homo sapiens)
<400> 24
Met Gly Gly Ser Gly Ser Arg Leu Ser Lys Glu Leu Leu Ala Glu Tyr
1 5 10 15
Gln Asp Leu Thr Phe Leu Thr Lys Gln Glu Ile Leu Leu Ala His Arg
20 25 30
Arg Phe Cys Glu Leu Leu Pro Gln Glu Gln Arg Ser Val Glu Ser Ser
35 40 45
Leu Arg Ala Gln Val Pro Phe Glu Gln Ile Leu Ser Leu Pro Glu Leu
50 55 60
Lys Ala Asn Pro Phe Lys Glu Arg Ile Cys Arg Val Phe Ser Thr Ser
65 70 75 80
Pro Ala Lys Asp Ser Leu Ser Phe Glu Asp Phe Leu Asp Leu Leu Ser
85 90 95
Val Phe Ser Asp Thr Ala Thr Pro Asp Ile Lys Ser His Tyr Ala Phe
100 105 110
Arg Ile Phe Asp Phe Asp Asp Asp Gly Thr Leu Asn Arg Glu Asp Leu
115 120 125
Ser Arg Leu Val Asn Cys Leu Thr Gly Glu Gly Glu Asp Thr Arg Leu
130 135 140
Ser Ala Ser Glu Met Lys Gln Leu Ile Asp Asn Ile Leu Glu Glu Ser
145 150 155 160
Asp Ile Asp Arg Asp Gly Thr Ile Asn Leu Ser Glu Phe Gln His Val
165 170 175
Ile Ser Arg Ser Pro Asp Phe Ala Ser Ser Phe Lys Ile Val Leu
180 185 190
<210> 25
<211> 654
<212> PRT
<213> 智人(Homo sapiens)
<400> 25
Met Asn Gln Pro Gln Arg Met Ala Pro Val Gly Thr Asp Lys Glu Leu
1 5 10 15
Ser Asp Leu Leu Asp Phe Ser Met Met Phe Pro Leu Pro Val Thr Asn
20 25 30
Gly Lys Gly Arg Pro Ala Ser Leu Ala Gly Ala Gln Phe Gly Gly Ser
35 40 45
Gly Leu Glu Asp Arg Pro Ser Ser Gly Ser Trp Gly Ser Gly Asp Gln
50 55 60
Ser Ser Ser Ser Phe Asp Pro Ser Arg Thr Phe Ser Glu Gly Thr His
65 70 75 80
Phe Thr Glu Ser His Ser Ser Leu Ser Ser Ser Thr Phe Leu Gly Pro
85 90 95
Gly Leu Gly Gly Lys Ser Gly Glu Arg Gly Ala Tyr Ala Ser Phe Gly
100 105 110
Arg Asp Ala Gly Val Gly Gly Leu Thr Gln Ala Gly Phe Leu Ser Gly
115 120 125
Glu Leu Ala Leu Asn Ser Pro Gly Pro Leu Ser Pro Ser Gly Met Lys
130 135 140
Gly Thr Ser Gln Tyr Tyr Pro Ser Tyr Ser Gly Ser Ser Arg Arg Arg
145 150 155 160
Ala Ala Asp Gly Ser Leu Asp Thr Gln Pro Lys Lys Val Arg Lys Val
165 170 175
Pro Pro Gly Leu Pro Ser Ser Val Tyr Pro Pro Ser Ser Gly Glu Asp
180 185 190
Tyr Gly Arg Asp Ala Thr Ala Tyr Pro Ser Ala Lys Thr Pro Ser Ser
195 200 205
Thr Tyr Pro Ala Pro Phe Tyr Val Ala Asp Gly Ser Leu His Pro Ser
210 215 220
Ala Glu Leu Trp Ser Pro Pro Gly Gln Ala Gly Phe Gly Pro Met Leu
225 230 235 240
Gly Gly Gly Ser Ser Pro Leu Pro Leu Pro Pro Gly Ser Gly Pro Val
245 250 255
Gly Ser Ser Gly Ser Ser Ser Thr Phe Gly Gly Leu His Gln His Glu
260 265 270
Arg Met Gly Tyr Gln Leu His Gly Ala Glu Val Asn Gly Gly Leu Pro
275 280 285
Ser Ala Ser Ser Phe Ser Ser Ala Pro Gly Ala Thr Tyr Gly Gly Val
290 295 300
Ser Ser His Thr Pro Pro Val Ser Gly Ala Asp Ser Leu Leu Gly Ser
305 310 315 320
Arg Gly Thr Thr Ala Gly Ser Ser Gly Asp Ala Leu Gly Lys Ala Leu
325 330 335
Ala Ser Ile Tyr Ser Pro Asp His Ser Ser Asn Asn Phe Ser Ser Ser
340 345 350
Pro Ser Thr Pro Val Gly Ser Pro Gln Gly Leu Ala Gly Thr Ser Gln
355 360 365
Trp Pro Arg Ala Gly Ala Pro Gly Ala Leu Ser Pro Ser Tyr Asp Gly
370 375 380
Gly Leu His Gly Leu Gln Ser Lys Ile Glu Asp His Leu Asp Glu Ala
385 390 395 400
Ile His Val Leu Arg Ser His Ala Val Gly Thr Ala Gly Asp Met His
405 410 415
Thr Leu Leu Pro Gly His Gly Ala Leu Ala Ser Gly Phe Thr Gly Pro
420 425 430
Met Ser Leu Gly Gly Arg His Ala Gly Leu Val Gly Gly Ser His Pro
435 440 445
Glu Asp Gly Leu Ala Gly Ser Thr Ser Leu Met His Asn His Ala Ala
450 455 460
Leu Pro Ser Gln Pro Gly Thr Leu Pro Asp Leu Ser Arg Pro Pro Asp
465 470 475 480
Ser Tyr Ser Gly Leu Gly Arg Ala Gly Ala Thr Ala Ala Ala Ser Glu
485 490 495
Ile Lys Arg Glu Glu Lys Glu Asp Glu Glu Asn Thr Ser Ala Ala Asp
500 505 510
His Ser Glu Glu Glu Lys Lys Glu Leu Lys Ala Pro Arg Ala Arg Thr
515 520 525
Ser Pro Asp Glu Asp Glu Asp Asp Leu Leu Pro Pro Glu Gln Lys Ala
530 535 540
Glu Arg Glu Lys Glu Arg Arg Val Ala Asn Asn Ala Arg Glu Arg Leu
545 550 555 560
Arg Val Arg Asp Ile Asn Glu Ala Phe Lys Glu Leu Gly Arg Met Cys
565 570 575
Gln Leu His Leu Asn Ser Glu Lys Pro Gln Thr Lys Leu Leu Ile Leu
580 585 590
His Gln Ala Val Ser Val Ile Leu Asn Leu Glu Gln Gln Val Arg Glu
595 600 605
Arg Asn Leu Asn Pro Lys Ala Ala Cys Leu Lys Arg Arg Glu Glu Glu
610 615 620
Lys Val Ser Gly Val Val Gly Asp Pro Gln Met Val Leu Ser Ala Pro
625 630 635 640
His Pro Gly Leu Ser Glu Ala His Asn Pro Ala Gly His Met
645 650
<210> 26
<211> 1663
<212> PRT
<213> 智人(Homo sapiens)
<400> 26
Met Gly Pro Thr Ser Gly Pro Ser Leu Leu Leu Leu Leu Leu Thr His
1 5 10 15
Leu Pro Leu Ala Leu Gly Ser Pro Met Tyr Ser Ile Ile Thr Pro Asn
20 25 30
Ile Leu Arg Leu Glu Ser Glu Glu Thr Met Val Leu Glu Ala His Asp
35 40 45
Ala Gln Gly Asp Val Pro Val Thr Val Thr Val His Asp Phe Pro Gly
50 55 60
Lys Lys Leu Val Leu Ser Ser Glu Lys Thr Val Leu Thr Pro Ala Thr
65 70 75 80
Asn His Met Gly Asn Val Thr Phe Thr Ile Pro Ala Asn Arg Glu Phe
85 90 95
Lys Ser Glu Lys Gly Arg Asn Lys Phe Val Thr Val Gln Ala Thr Phe
100 105 110
Gly Thr Gln Val Val Glu Lys Val Val Leu Val Ser Leu Gln Ser Gly
115 120 125
Tyr Leu Phe Ile Gln Thr Asp Lys Thr Ile Tyr Thr Pro Gly Ser Thr
130 135 140
Val Leu Tyr Arg Ile Phe Thr Val Asn His Lys Leu Leu Pro Val Gly
145 150 155 160
Arg Thr Val Met Val Asn Ile Glu Asn Pro Glu Gly Ile Pro Val Lys
165 170 175
Gln Asp Ser Leu Ser Ser Gln Asn Gln Leu Gly Val Leu Pro Leu Ser
180 185 190
Trp Asp Ile Pro Glu Leu Val Asn Met Gly Gln Trp Lys Ile Arg Ala
195 200 205
Tyr Tyr Glu Asn Ser Pro Gln Gln Val Phe Ser Thr Glu Phe Glu Val
210 215 220
Lys Glu Tyr Val Leu Pro Ser Phe Glu Val Ile Val Glu Pro Thr Glu
225 230 235 240
Lys Phe Tyr Tyr Ile Tyr Asn Glu Lys Gly Leu Glu Val Thr Ile Thr
245 250 255
Ala Arg Phe Leu Tyr Gly Lys Lys Val Glu Gly Thr Ala Phe Val Ile
260 265 270
Phe Gly Ile Gln Asp Gly Glu Gln Arg Ile Ser Leu Pro Glu Ser Leu
275 280 285
Lys Arg Ile Pro Ile Glu Asp Gly Ser Gly Glu Val Val Leu Ser Arg
290 295 300
Lys Val Leu Leu Asp Gly Val Gln Asn Pro Arg Ala Glu Asp Leu Val
305 310 315 320
Gly Lys Ser Leu Tyr Val Ser Ala Thr Val Ile Leu His Ser Gly Ser
325 330 335
Asp Met Val Gln Ala Glu Arg Ser Gly Ile Pro Ile Val Thr Ser Pro
340 345 350
Tyr Gln Ile His Phe Thr Lys Thr Pro Lys Tyr Phe Lys Pro Gly Met
355 360 365
Pro Phe Asp Leu Met Val Phe Val Thr Asn Pro Asp Gly Ser Pro Ala
370 375 380
Tyr Arg Val Pro Val Ala Val Gln Gly Glu Asp Thr Val Gln Ser Leu
385 390 395 400
Thr Gln Gly Asp Gly Val Ala Lys Leu Ser Ile Asn Thr His Pro Ser
405 410 415
Gln Lys Pro Leu Ser Ile Thr Val Arg Thr Lys Lys Gln Glu Leu Ser
420 425 430
Glu Ala Glu Gln Ala Thr Arg Thr Met Gln Ala Leu Pro Tyr Ser Thr
435 440 445
Val Gly Asn Ser Asn Asn Tyr Leu His Leu Ser Val Leu Arg Thr Glu
450 455 460
Leu Arg Pro Gly Glu Thr Leu Asn Val Asn Phe Leu Leu Arg Met Asp
465 470 475 480
Arg Ala His Glu Ala Lys Ile Arg Tyr Tyr Thr Tyr Leu Ile Met Asn
485 490 495
Lys Gly Arg Leu Leu Lys Ala Gly Arg Gln Val Arg Glu Pro Gly Gln
500 505 510
Asp Leu Val Val Leu Pro Leu Ser Ile Thr Thr Asp Phe Ile Pro Ser
515 520 525
Phe Arg Leu Val Ala Tyr Tyr Thr Leu Ile Gly Ala Ser Gly Gln Arg
530 535 540
Glu Val Val Ala Asp Ser Val Trp Val Asp Val Lys Asp Ser Cys Val
545 550 555 560
Gly Ser Leu Val Val Lys Ser Gly Gln Ser Glu Asp Arg Gln Pro Val
565 570 575
Pro Gly Gln Gln Met Thr Leu Lys Ile Glu Gly Asp His Gly Ala Arg
580 585 590
Val Val Leu Val Ala Val Asp Lys Gly Val Phe Val Leu Asn Lys Lys
595 600 605
Asn Lys Leu Thr Gln Ser Lys Ile Trp Asp Val Val Glu Lys Ala Asp
610 615 620
Ile Gly Cys Thr Pro Gly Ser Gly Lys Asp Tyr Ala Gly Val Phe Ser
625 630 635 640
Asp Ala Gly Leu Thr Phe Thr Ser Ser Ser Gly Gln Gln Thr Ala Gln
645 650 655
Arg Ala Glu Leu Gln Cys Pro Gln Pro Ala Ala Arg Arg Arg Arg Ser
660 665 670
Val Gln Leu Thr Glu Lys Arg Met Asp Lys Val Gly Lys Tyr Pro Lys
675 680 685
Glu Leu Arg Lys Cys Cys Glu Asp Gly Met Arg Glu Asn Pro Met Arg
690 695 700
Phe Ser Cys Gln Arg Arg Thr Arg Phe Ile Ser Leu Gly Glu Ala Cys
705 710 715 720
Lys Lys Val Phe Leu Asp Cys Cys Asn Tyr Ile Thr Glu Leu Arg Arg
725 730 735
Gln His Ala Arg Ala Ser His Leu Gly Leu Ala Arg Ser Asn Leu Asp
740 745 750
Glu Asp Ile Ile Ala Glu Glu Asn Ile Val Ser Arg Ser Glu Phe Pro
755 760 765
Glu Ser Trp Leu Trp Asn Val Glu Asp Leu Lys Glu Pro Pro Lys Asn
770 775 780
Gly Ile Ser Thr Lys Leu Met Asn Ile Phe Leu Lys Asp Ser Ile Thr
785 790 795 800
Thr Trp Glu Ile Leu Ala Val Ser Met Ser Asp Lys Lys Gly Ile Cys
805 810 815
Val Ala Asp Pro Phe Glu Val Thr Val Met Gln Asp Phe Phe Ile Asp
820 825 830
Leu Arg Leu Pro Tyr Ser Val Val Arg Asn Glu Gln Val Glu Ile Arg
835 840 845
Ala Val Leu Tyr Asn Tyr Arg Gln Asn Gln Glu Leu Lys Val Arg Val
850 855 860
Glu Leu Leu His Asn Pro Ala Phe Cys Ser Leu Ala Thr Thr Lys Arg
865 870 875 880
Arg His Gln Gln Thr Val Thr Ile Pro Pro Lys Ser Ser Leu Ser Val
885 890 895
Pro Tyr Val Ile Val Pro Leu Lys Thr Gly Leu Gln Glu Val Glu Val
900 905 910
Lys Ala Ala Val Tyr His His Phe Ile Ser Asp Gly Val Arg Lys Ser
915 920 925
Leu Lys Val Val Pro Glu Gly Ile Arg Met Asn Lys Thr Val Ala Val
930 935 940
Arg Thr Leu Asp Pro Glu Arg Leu Gly Arg Glu Gly Val Gln Lys Glu
945 950 955 960
Asp Ile Pro Pro Ala Asp Leu Ser Asp Gln Val Pro Asp Thr Glu Ser
965 970 975
Glu Thr Arg Ile Leu Leu Gln Gly Thr Pro Val Ala Gln Met Thr Glu
980 985 990
Asp Ala Val Asp Ala Glu Arg Leu Lys His Leu Ile Val Thr Pro Ser
995 1000 1005
Gly Cys Gly Glu Gln Asn Met Ile Gly Met Thr Pro Thr Val Ile
1010 1015 1020
Ala Val His Tyr Leu Asp Glu Thr Glu Gln Trp Glu Lys Phe Gly
1025 1030 1035
Leu Glu Lys Arg Gln Gly Ala Leu Glu Leu Ile Lys Lys Gly Tyr
1040 1045 1050
Thr Gln Gln Leu Ala Phe Arg Gln Pro Ser Ser Ala Phe Ala Ala
1055 1060 1065
Phe Val Lys Arg Ala Pro Ser Thr Trp Leu Thr Ala Tyr Val Val
1070 1075 1080
Lys Val Phe Ser Leu Ala Val Asn Leu Ile Ala Ile Asp Ser Gln
1085 1090 1095
Val Leu Cys Gly Ala Val Lys Trp Leu Ile Leu Glu Lys Gln Lys
1100 1105 1110
Pro Asp Gly Val Phe Gln Glu Asp Ala Pro Val Ile His Gln Glu
1115 1120 1125
Met Ile Gly Gly Leu Arg Asn Asn Asn Glu Lys Asp Met Ala Leu
1130 1135 1140
Thr Ala Phe Val Leu Ile Ser Leu Gln Glu Ala Lys Asp Ile Cys
1145 1150 1155
Glu Glu Gln Val Asn Ser Leu Pro Gly Ser Ile Thr Lys Ala Gly
1160 1165 1170
Asp Phe Leu Glu Ala Asn Tyr Met Asn Leu Gln Arg Ser Tyr Thr
1175 1180 1185
Val Ala Ile Ala Gly Tyr Ala Leu Ala Gln Met Gly Arg Leu Lys
1190 1195 1200
Gly Pro Leu Leu Asn Lys Phe Leu Thr Thr Ala Lys Asp Lys Asn
1205 1210 1215
Arg Trp Glu Asp Pro Gly Lys Gln Leu Tyr Asn Val Glu Ala Thr
1220 1225 1230
Ser Tyr Ala Leu Leu Ala Leu Leu Gln Leu Lys Asp Phe Asp Phe
1235 1240 1245
Val Pro Pro Val Val Arg Trp Leu Asn Glu Gln Arg Tyr Tyr Gly
1250 1255 1260
Gly Gly Tyr Gly Ser Thr Gln Ala Thr Phe Met Val Phe Gln Ala
1265 1270 1275
Leu Ala Gln Tyr Gln Lys Asp Ala Pro Asp His Gln Glu Leu Asn
1280 1285 1290
Leu Asp Val Ser Leu Gln Leu Pro Ser Arg Ser Ser Lys Ile Thr
1295 1300 1305
His Arg Ile His Trp Glu Ser Ala Ser Leu Leu Arg Ser Glu Glu
1310 1315 1320
Thr Lys Glu Asn Glu Gly Phe Thr Val Thr Ala Glu Gly Lys Gly
1325 1330 1335
Gln Gly Thr Leu Ser Val Val Thr Met Tyr His Ala Lys Ala Lys
1340 1345 1350
Asp Gln Leu Thr Cys Asn Lys Phe Asp Leu Lys Val Thr Ile Lys
1355 1360 1365
Pro Ala Pro Glu Thr Glu Lys Arg Pro Gln Asp Ala Lys Asn Thr
1370 1375 1380
Met Ile Leu Glu Ile Cys Thr Arg Tyr Arg Gly Asp Gln Asp Ala
1385 1390 1395
Thr Met Ser Ile Leu Asp Ile Ser Met Met Thr Gly Phe Ala Pro
1400 1405 1410
Asp Thr Asp Asp Leu Lys Gln Leu Ala Asn Gly Val Asp Arg Tyr
1415 1420 1425
Ile Ser Lys Tyr Glu Leu Asp Lys Ala Phe Ser Asp Arg Asn Thr
1430 1435 1440
Leu Ile Ile Tyr Leu Asp Lys Val Ser His Ser Glu Asp Asp Cys
1445 1450 1455
Leu Ala Phe Lys Val His Gln Tyr Phe Asn Val Glu Leu Ile Gln
1460 1465 1470
Pro Gly Ala Val Lys Val Tyr Ala Tyr Tyr Asn Leu Glu Glu Ser
1475 1480 1485
Cys Thr Arg Phe Tyr His Pro Glu Lys Glu Asp Gly Lys Leu Asn
1490 1495 1500
Lys Leu Cys Arg Asp Glu Leu Cys Arg Cys Ala Glu Glu Asn Cys
1505 1510 1515
Phe Ile Gln Lys Ser Asp Asp Lys Val Thr Leu Glu Glu Arg Leu
1520 1525 1530
Asp Lys Ala Cys Glu Pro Gly Val Asp Tyr Val Tyr Lys Thr Arg
1535 1540 1545
Leu Val Lys Val Gln Leu Ser Asn Asp Phe Asp Glu Tyr Ile Met
1550 1555 1560
Ala Ile Glu Gln Thr Ile Lys Ser Gly Ser Asp Glu Val Gln Val
1565 1570 1575
Gly Gln Gln Arg Thr Phe Ile Ser Pro Ile Lys Cys Arg Glu Ala
1580 1585 1590
Leu Lys Leu Glu Glu Lys Lys His Tyr Leu Met Trp Gly Leu Ser
1595 1600 1605
Ser Asp Phe Trp Gly Glu Lys Pro Asn Leu Ser Tyr Ile Ile Gly
1610 1615 1620
Lys Asp Thr Trp Val Glu His Trp Pro Glu Glu Asp Glu Cys Gln
1625 1630 1635
Asp Glu Glu Asn Gln Lys Gln Cys Gln Asp Leu Gly Ala Phe Thr
1640 1645 1650
Glu Ser Met Val Val Phe Gly Cys Pro Asn
1655 1660
<210> 27
<211> 442
<212> PRT
<213> 智人(Homo sapiens)
<400> 27
Met Tyr Gln Ser Leu Ala Met Ala Ala Asn His Gly Pro Pro Pro Gly
1 5 10 15
Ala Tyr Glu Ala Gly Gly Pro Gly Ala Phe Met His Gly Ala Gly Ala
20 25 30
Ala Ser Ser Pro Val Tyr Val Pro Thr Pro Arg Val Pro Ser Ser Val
35 40 45
Leu Gly Leu Ser Tyr Leu Gln Gly Gly Gly Ala Gly Ser Ala Ser Gly
50 55 60
Gly Ala Ser Gly Gly Ser Ser Gly Gly Ala Ala Ser Gly Ala Gly Pro
65 70 75 80
Gly Thr Gln Gln Gly Ser Pro Gly Trp Ser Gln Ala Gly Ala Asp Gly
85 90 95
Ala Ala Tyr Thr Pro Pro Pro Val Ser Pro Arg Phe Ser Phe Pro Gly
100 105 110
Thr Thr Gly Ser Leu Ala Ala Ala Ala Ala Ala Ala Ala Ala Arg Glu
115 120 125
Ala Ala Ala Tyr Ser Ser Gly Gly Gly Ala Ala Gly Ala Gly Leu Ala
130 135 140
Gly Arg Glu Gln Tyr Gly Arg Ala Gly Phe Ala Gly Ser Tyr Ser Ser
145 150 155 160
Pro Tyr Pro Ala Tyr Met Ala Asp Val Gly Ala Ser Trp Ala Ala Ala
165 170 175
Ala Ala Ala Ser Ala Gly Pro Phe Asp Ser Pro Val Leu His Ser Leu
180 185 190
Pro Gly Arg Ala Asn Pro Ala Ala Arg His Pro Asn Leu Asp Met Phe
195 200 205
Asp Asp Phe Ser Glu Gly Arg Glu Cys Val Asn Cys Gly Ala Met Ser
210 215 220
Thr Pro Leu Trp Arg Arg Asp Gly Thr Gly His Tyr Leu Cys Asn Ala
225 230 235 240
Cys Gly Leu Tyr His Lys Met Asn Gly Ile Asn Arg Pro Leu Ile Lys
245 250 255
Pro Gln Arg Arg Leu Ser Ala Ser Arg Arg Val Gly Leu Ser Cys Ala
260 265 270
Asn Cys Gln Thr Thr Thr Thr Thr Leu Trp Arg Arg Asn Ala Glu Gly
275 280 285
Glu Pro Val Cys Asn Ala Cys Gly Leu Tyr Met Lys Leu His Gly Val
290 295 300
Pro Arg Pro Leu Ala Met Arg Lys Glu Gly Ile Gln Thr Arg Lys Arg
305 310 315 320
Lys Pro Lys Asn Leu Asn Lys Ser Lys Thr Pro Ala Ala Pro Ser Gly
325 330 335
Ser Glu Ser Leu Pro Pro Ala Ser Gly Ala Ser Ser Asn Ser Ser Asn
340 345 350
Ala Thr Thr Ser Ser Ser Glu Glu Met Arg Pro Ile Lys Thr Glu Pro
355 360 365
Gly Leu Ser Ser His Tyr Gly His Ser Ser Ser Val Ser Gln Thr Phe
370 375 380
Ser Val Ser Ala Met Ser Gly His Gly Pro Ser Ile His Pro Val Leu
385 390 395 400
Ser Ala Leu Lys Leu Ser Pro Gln Gly Tyr Ala Ser Pro Val Ser Gln
405 410 415
Ser Pro Gln Thr Ser Ser Lys Gln Asp Ser Trp Asn Ser Leu Val Leu
420 425 430
Ala Asp Ser His Gly Asp Ile Ile Thr Ala
435 440
<210> 28
<211> 393
<212> PRT
<213> 智人(Homo sapiens)
<400> 28
Met Glu Glu Pro Gln Ser Asp Pro Ser Val Glu Pro Pro Leu Ser Gln
1 5 10 15
Glu Thr Phe Ser Asp Leu Trp Lys Leu Leu Pro Glu Asn Asn Val Leu
20 25 30
Ser Pro Leu Pro Ser Gln Ala Met Asp Asp Leu Met Leu Ser Pro Asp
35 40 45
Asp Ile Glu Gln Trp Phe Thr Glu Asp Pro Gly Pro Asp Glu Ala Pro
50 55 60
Arg Met Pro Glu Ala Ala Pro Pro Val Ala Pro Ala Pro Ala Ala Pro
65 70 75 80
Thr Pro Ala Ala Pro Ala Pro Ala Pro Ser Trp Pro Leu Ser Ser Ser
85 90 95
Val Pro Ser Gln Lys Thr Tyr Gln Gly Ser Tyr Gly Phe Arg Leu Gly
100 105 110
Phe Leu His Ser Gly Thr Ala Lys Ser Val Thr Cys Thr Tyr Ser Pro
115 120 125
Ala Leu Asn Lys Met Phe Cys Gln Leu Ala Lys Thr Cys Pro Val Gln
130 135 140
Leu Trp Val Asp Ser Thr Pro Pro Pro Gly Thr Arg Val Arg Ala Met
145 150 155 160
Ala Ile Tyr Lys Gln Ser Gln His Met Thr Glu Val Val Arg Arg Cys
165 170 175
Pro His His Glu Arg Cys Ser Asp Ser Asp Gly Leu Ala Pro Pro Gln
180 185 190
His Leu Ile Arg Val Glu Gly Asn Leu Arg Val Glu Tyr Leu Asp Asp
195 200 205
Arg Asn Thr Phe Arg His Ser Val Val Val Pro Tyr Glu Pro Pro Glu
210 215 220
Val Gly Ser Asp Cys Thr Thr Ile His Tyr Asn Tyr Met Cys Asn Ser
225 230 235 240
Ser Cys Met Gly Gly Met Asn Arg Arg Pro Ile Leu Thr Ile Ile Thr
245 250 255
Leu Glu Asp Ser Ser Gly Asn Leu Leu Gly Arg Asn Ser Phe Glu Val
260 265 270
Arg Val Cys Ala Cys Pro Gly Arg Asp Arg Arg Thr Glu Glu Glu Asn
275 280 285
Leu Arg Lys Lys Gly Glu Pro His His Glu Leu Pro Pro Gly Ser Thr
290 295 300
Lys Arg Ala Leu Pro Asn Asn Thr Ser Ser Ser Pro Gln Pro Lys Lys
305 310 315 320
Lys Pro Leu Asp Gly Glu Tyr Phe Thr Leu Gln Ile Arg Gly Arg Glu
325 330 335
Arg Phe Glu Met Phe Arg Glu Leu Asn Glu Ala Leu Glu Leu Lys Asp
340 345 350
Ala Gln Ala Gly Lys Glu Pro Gly Gly Ser Arg Ala His Ser Ser His
355 360 365
Leu Lys Ser Lys Lys Gly Gln Ser Thr Ser Arg His Lys Lys Leu Met
370 375 380
Phe Lys Thr Glu Gly Pro Asp Ser Asp
385 390
<210> 29
<211> 785
<212> PRT
<213> 智人(Homo sapiens)
<400> 29
Met Ser Asp Gln Asp His Ser Met Asp Glu Met Thr Ala Val Val Lys
1 5 10 15
Ile Glu Lys Gly Val Gly Gly Asn Asn Gly Gly Asn Gly Asn Gly Gly
20 25 30
Gly Ala Phe Ser Gln Ala Arg Ser Ser Ser Thr Gly Ser Ser Ser Ser
35 40 45
Thr Gly Gly Gly Gly Gln Glu Ser Gln Pro Ser Pro Leu Ala Leu Leu
50 55 60
Ala Ala Thr Cys Ser Arg Ile Glu Ser Pro Asn Glu Asn Ser Asn Asn
65 70 75 80
Ser Gln Gly Pro Ser Gln Ser Gly Gly Thr Gly Glu Leu Asp Leu Thr
85 90 95
Ala Thr Gln Leu Ser Gln Gly Ala Asn Gly Trp Gln Ile Ile Ser Ser
100 105 110
Ser Ser Gly Ala Thr Pro Thr Ser Lys Glu Gln Ser Gly Ser Ser Thr
115 120 125
Asn Gly Ser Asn Gly Ser Glu Ser Ser Lys Asn Arg Thr Val Ser Gly
130 135 140
Gly Gln Tyr Val Val Ala Ala Ala Pro Asn Leu Gln Asn Gln Gln Val
145 150 155 160
Leu Thr Gly Leu Pro Gly Val Met Pro Asn Ile Gln Tyr Gln Val Ile
165 170 175
Pro Gln Phe Gln Thr Val Asp Gly Gln Gln Leu Gln Phe Ala Ala Thr
180 185 190
Gly Ala Gln Val Gln Gln Asp Gly Ser Gly Gln Ile Gln Ile Ile Pro
195 200 205
Gly Ala Asn Gln Gln Ile Ile Thr Asn Arg Gly Ser Gly Gly Asn Ile
210 215 220
Ile Ala Ala Met Pro Asn Leu Leu Gln Gln Ala Val Pro Leu Gln Gly
225 230 235 240
Leu Ala Asn Asn Val Leu Ser Gly Gln Thr Gln Tyr Val Thr Asn Val
245 250 255
Pro Val Ala Leu Asn Gly Asn Ile Thr Leu Leu Pro Val Asn Ser Val
260 265 270
Ser Ala Ala Thr Leu Thr Pro Ser Ser Gln Ala Val Thr Ile Ser Ser
275 280 285
Ser Gly Ser Gln Glu Ser Gly Ser Gln Pro Val Thr Ser Gly Thr Thr
290 295 300
Ile Ser Ser Ala Ser Leu Val Ser Ser Gln Ala Ser Ser Ser Ser Phe
305 310 315 320
Phe Thr Asn Ala Asn Ser Tyr Ser Thr Thr Thr Thr Thr Ser Asn Met
325 330 335
Gly Ile Met Asn Phe Thr Thr Ser Gly Ser Ser Gly Thr Asn Ser Gln
340 345 350
Gly Gln Thr Pro Gln Arg Val Ser Gly Leu Gln Gly Ser Asp Ala Leu
355 360 365
Asn Ile Gln Gln Asn Gln Thr Ser Gly Gly Ser Leu Gln Ala Gly Gln
370 375 380
Gln Lys Glu Gly Glu Gln Asn Gln Gln Thr Gln Gln Gln Gln Ile Leu
385 390 395 400
Ile Gln Pro Gln Leu Val Gln Gly Gly Gln Ala Leu Gln Ala Leu Gln
405 410 415
Ala Ala Pro Leu Ser Gly Gln Thr Phe Thr Thr Gln Ala Ile Ser Gln
420 425 430
Glu Thr Leu Gln Asn Leu Gln Leu Gln Ala Val Pro Asn Ser Gly Pro
435 440 445
Ile Ile Ile Arg Thr Pro Thr Val Gly Pro Asn Gly Gln Val Ser Trp
450 455 460
Gln Thr Leu Gln Leu Gln Asn Leu Gln Val Gln Asn Pro Gln Ala Gln
465 470 475 480
Thr Ile Thr Leu Ala Pro Met Gln Gly Val Ser Leu Gly Gln Thr Ser
485 490 495
Ser Ser Asn Thr Thr Leu Thr Pro Ile Ala Ser Ala Ala Ser Ile Pro
500 505 510
Ala Gly Thr Val Thr Val Asn Ala Ala Gln Leu Ser Ser Met Pro Gly
515 520 525
Leu Gln Thr Ile Asn Leu Ser Ala Leu Gly Thr Ser Gly Ile Gln Val
530 535 540
His Pro Ile Gln Gly Leu Pro Leu Ala Ile Ala Asn Ala Pro Gly Asp
545 550 555 560
His Gly Ala Gln Leu Gly Leu His Gly Ala Gly Gly Asp Gly Ile His
565 570 575
Asp Asp Thr Ala Gly Gly Glu Glu Gly Glu Asn Ser Pro Asp Ala Gln
580 585 590
Pro Gln Ala Gly Arg Arg Thr Arg Arg Glu Ala Cys Thr Cys Pro Tyr
595 600 605
Cys Lys Asp Ser Glu Gly Arg Gly Ser Gly Asp Pro Gly Lys Lys Lys
610 615 620
Gln His Ile Cys His Ile Gln Gly Cys Gly Lys Val Tyr Gly Lys Thr
625 630 635 640
Ser His Leu Arg Ala His Leu Arg Trp His Thr Gly Glu Arg Pro Phe
645 650 655
Met Cys Thr Trp Ser Tyr Cys Gly Lys Arg Phe Thr Arg Ser Asp Glu
660 665 670
Leu Gln Arg His Lys Arg Thr His Thr Gly Glu Lys Lys Phe Ala Cys
675 680 685
Pro Glu Cys Pro Lys Arg Phe Met Arg Ser Asp His Leu Ser Lys His
690 695 700
Ile Lys Thr His Gln Asn Lys Lys Gly Gly Pro Gly Val Ala Leu Ser
705 710 715 720
Val Gly Thr Leu Pro Leu Asp Ser Gly Ala Gly Ser Glu Gly Ser Gly
725 730 735
Thr Ala Thr Pro Ser Ala Leu Ile Thr Thr Asn Met Val Ala Met Glu
740 745 750
Ala Ile Cys Pro Glu Gly Ile Ala Arg Leu Ala Asn Ser Gly Ile Asn
755 760 765
Val Met Gln Val Ala Asp Leu Gln Ser Ile Asn Ile Ser Gly Asn Gly
770 775 780
Phe
785
<210> 30
<211> 473
<212> PRT
<213> 智人(Homo sapiens)
<400> 30
Met Gly Arg Lys Lys Ile Gln Ile Thr Arg Ile Met Asp Glu Arg Asn
1 5 10 15
Arg Gln Val Thr Phe Thr Lys Arg Lys Phe Gly Leu Met Lys Lys Ala
20 25 30
Tyr Glu Leu Ser Val Leu Cys Asp Cys Glu Ile Ala Leu Ile Ile Phe
35 40 45
Asn Ser Thr Asn Lys Leu Phe Gln Tyr Ala Ser Thr Asp Met Asp Lys
50 55 60
Val Leu Leu Lys Tyr Thr Glu Tyr Asn Glu Pro His Glu Ser Arg Thr
65 70 75 80
Asn Ser Asp Ile Val Glu Thr Leu Arg Lys Lys Gly Leu Asn Gly Cys
85 90 95
Asp Ser Pro Asp Pro Asp Ala Asp Asp Ser Val Gly His Ser Pro Glu
100 105 110
Ser Glu Asp Lys Tyr Arg Lys Ile Asn Glu Asp Ile Asp Leu Met Ile
115 120 125
Ser Arg Gln Arg Leu Cys Ala Val Pro Pro Pro Asn Phe Glu Met Pro
130 135 140
Val Ser Ile Pro Val Ser Ser His Asn Ser Leu Val Tyr Ser Asn Pro
145 150 155 160
Val Ser Ser Leu Gly Asn Pro Asn Leu Leu Pro Leu Ala His Pro Ser
165 170 175
Leu Gln Arg Asn Ser Met Ser Pro Gly Val Thr His Arg Pro Pro Ser
180 185 190
Ala Gly Asn Thr Gly Gly Leu Met Gly Gly Asp Leu Thr Ser Gly Ala
195 200 205
Gly Thr Ser Ala Gly Asn Gly Tyr Gly Asn Pro Arg Asn Ser Pro Gly
210 215 220
Leu Leu Val Ser Pro Gly Asn Leu Asn Lys Asn Met Gln Ala Lys Ser
225 230 235 240
Pro Pro Pro Met Asn Leu Gly Met Asn Asn Arg Lys Pro Asp Leu Arg
245 250 255
Val Leu Ile Pro Pro Gly Ser Lys Asn Thr Met Pro Ser Val Ser Glu
260 265 270
Asp Val Asp Leu Leu Leu Asn Gln Arg Ile Asn Asn Ser Gln Ser Ala
275 280 285
Gln Ser Leu Ala Thr Pro Val Val Ser Val Ala Thr Pro Thr Leu Pro
290 295 300
Gly Gln Gly Met Gly Gly Tyr Pro Ser Ala Ile Ser Thr Thr Tyr Gly
305 310 315 320
Thr Glu Tyr Ser Leu Ser Ser Ala Asp Leu Ser Ser Leu Ser Gly Phe
325 330 335
Asn Thr Ala Ser Ala Leu His Leu Gly Ser Val Thr Gly Trp Gln Gln
340 345 350
Gln His Leu His Asn Met Pro Pro Ser Ala Leu Ser Gln Leu Gly Ala
355 360 365
Cys Thr Ser Thr His Leu Ser Gln Ser Ser Asn Leu Ser Leu Pro Ser
370 375 380
Thr Gln Ser Leu Asn Ile Lys Ser Glu Pro Val Ser Pro Pro Arg Asp
385 390 395 400
Arg Thr Thr Thr Pro Ser Arg Tyr Pro Gln His Thr Arg His Glu Ala
405 410 415
Gly Arg Ser Pro Val Asp Ser Leu Ser Ser Cys Ser Ser Ser Tyr Asp
420 425 430
Gly Ser Asp Arg Glu Asp His Arg Asn Glu Phe His Ser Pro Ile Gly
435 440 445
Leu Thr Arg Pro Ser Pro Asp Glu Arg Glu Ser Pro Ser Val Lys Arg
450 455 460
Met Arg Leu Ser Glu Gly Trp Ala Thr
465 470
<210> 31
<211> 353
<212> PRT
<213> 未知
<220>
<223> 人T-淋巴细胞病毒
<400> 31
Met Ala His Phe Pro Gly Phe Gly Gln Ser Leu Leu Phe Gly Tyr Pro
1 5 10 15
Val Tyr Val Phe Gly Asp Cys Val Gln Gly Asp Trp Cys Pro Ile Ser
20 25 30
Gly Gly Leu Cys Ser Ala Arg Leu His Arg His Ala Leu Leu Ala Thr
35 40 45
Cys Pro Glu His Gln Ile Thr Trp Asp Pro Ile Asp Gly Arg Val Ile
50 55 60
Gly Ser Ala Leu Gln Phe Leu Ile Pro Arg Leu Pro Ser Phe Pro Thr
65 70 75 80
Gln Arg Thr Ser Lys Thr Leu Lys Val Leu Thr Pro Pro Ile Thr His
85 90 95
Thr Thr Pro Asn Ile Pro Pro Ser Phe Leu Gln Ala Met Arg Lys Tyr
100 105 110
Ser Pro Phe Arg Asn Gly Tyr Met Glu Pro Thr Leu Gly Gln His Leu
115 120 125
Pro Thr Leu Ser Phe Pro Asp Pro Gly Leu Arg Pro Gln Asn Leu Tyr
130 135 140
Thr Leu Trp Gly Gly Ser Val Val Cys Met Tyr Leu Tyr Gln Leu Ser
145 150 155 160
Pro Pro Ile Thr Trp Pro Leu Leu Pro His Val Ile Phe Cys His Pro
165 170 175
Gly Gln Leu Gly Ala Phe Leu Thr Asn Val Pro Tyr Lys Arg Ile Glu
180 185 190
Glu Leu Leu Tyr Lys Ile Ser Leu Thr Thr Gly Ala Leu Ile Ile Leu
195 200 205
Pro Glu Asp Cys Leu Pro Thr Thr Leu Phe Gln Pro Ala Arg Ala Pro
210 215 220
Val Thr Leu Thr Ala Trp Gln Asn Gly Leu Leu Pro Phe His Ser Thr
225 230 235 240
Leu Thr Thr Pro Gly Leu Ile Trp Thr Phe Thr Asp Gly Thr Pro Met
245 250 255
Ile Ser Gly Pro Cys Pro Lys Asp Gly Gln Pro Ser Leu Val Leu Gln
260 265 270
Ser Ser Ser Phe Ile Phe His Lys Phe Gln Thr Lys Ala Tyr His Pro
275 280 285
Ser Phe Leu Leu Ser His Gly Leu Ile Gln Tyr Ser Ser Phe His Ser
290 295 300
Leu His Leu Leu Phe Glu Glu Tyr Thr Asn Ile Pro Ile Ser Leu Leu
305 310 315 320
Phe Asn Glu Lys Glu Ala Asp Asp Asn Asp His Glu Pro Gln Ile Ser
325 330 335
Pro Gly Gly Leu Glu Pro Pro Ser Glu Lys His Phe Arg Glu Thr Glu
340 345 350
Val
<210> 32
<211> 505
<212> PRT
<213> 智人(Homo sapiens)
<400> 32
Met Gly Glu Thr Leu Gly Asp Ser Pro Ile Asp Pro Glu Ser Asp Ser
1 5 10 15
Phe Thr Asp Thr Leu Ser Ala Asn Ile Ser Gln Glu Met Thr Met Val
20 25 30
Asp Thr Glu Met Pro Phe Trp Pro Thr Asn Phe Gly Ile Ser Ser Val
35 40 45
Asp Leu Ser Val Met Glu Asp His Ser His Ser Phe Asp Ile Lys Pro
50 55 60
Phe Thr Thr Val Asp Phe Ser Ser Ile Ser Thr Pro His Tyr Glu Asp
65 70 75 80
Ile Pro Phe Thr Arg Thr Asp Pro Val Val Ala Asp Tyr Lys Tyr Asp
85 90 95
Leu Lys Leu Gln Glu Tyr Gln Ser Ala Ile Lys Val Glu Pro Ala Ser
100 105 110
Pro Pro Tyr Tyr Ser Glu Lys Thr Gln Leu Tyr Asn Lys Pro His Glu
115 120 125
Glu Pro Ser Asn Ser Leu Met Ala Ile Glu Cys Arg Val Cys Gly Asp
130 135 140
Lys Ala Ser Gly Phe His Tyr Gly Val His Ala Cys Glu Gly Cys Lys
145 150 155 160
Gly Phe Phe Arg Arg Thr Ile Arg Leu Lys Leu Ile Tyr Asp Arg Cys
165 170 175
Asp Leu Asn Cys Arg Ile His Lys Lys Ser Arg Asn Lys Cys Gln Tyr
180 185 190
Cys Arg Phe Gln Lys Cys Leu Ala Val Gly Met Ser His Asn Ala Ile
195 200 205
Arg Phe Gly Arg Met Pro Gln Ala Glu Lys Glu Lys Leu Leu Ala Glu
210 215 220
Ile Ser Ser Asp Ile Asp Gln Leu Asn Pro Glu Ser Ala Asp Leu Arg
225 230 235 240
Ala Leu Ala Lys His Leu Tyr Asp Ser Tyr Ile Lys Ser Phe Pro Leu
245 250 255
Thr Lys Ala Lys Ala Arg Ala Ile Leu Thr Gly Lys Thr Thr Asp Lys
260 265 270
Ser Pro Phe Val Ile Tyr Asp Met Asn Ser Leu Met Met Gly Glu Asp
275 280 285
Lys Ile Lys Phe Lys His Ile Thr Pro Leu Gln Glu Gln Ser Lys Glu
290 295 300
Val Ala Ile Arg Ile Phe Gln Gly Cys Gln Phe Arg Ser Val Glu Ala
305 310 315 320
Val Gln Glu Ile Thr Glu Tyr Ala Lys Ser Ile Pro Gly Phe Val Asn
325 330 335
Leu Asp Leu Asn Asp Gln Val Thr Leu Leu Lys Tyr Gly Val His Glu
340 345 350
Ile Ile Tyr Thr Met Leu Ala Ser Leu Met Asn Lys Asp Gly Val Leu
355 360 365
Ile Ser Glu Gly Gln Gly Phe Met Thr Arg Glu Phe Leu Lys Ser Leu
370 375 380
Arg Lys Pro Phe Gly Asp Phe Met Glu Pro Lys Phe Glu Phe Ala Val
385 390 395 400
Lys Phe Asn Ala Leu Glu Leu Asp Asp Ser Asp Leu Ala Ile Phe Ile
405 410 415
Ala Val Ile Ile Leu Ser Gly Asp Arg Pro Gly Leu Leu Asn Val Lys
420 425 430
Pro Ile Glu Asp Ile Gln Asp Asn Leu Leu Gln Ala Leu Glu Leu Gln
435 440 445
Leu Lys Leu Asn His Pro Glu Ser Ser Gln Leu Phe Ala Lys Leu Leu
450 455 460
Gln Lys Met Thr Asp Leu Arg Gln Ile Val Thr Glu His Val Gln Leu
465 470 475 480
Leu Gln Val Ile Lys Lys Thr Glu Thr Asp Met Ser Leu His Pro Leu
485 490 495
Leu Gln Glu Ile Tyr Lys Asp Leu Tyr
500 505
<210> 33
<211> 366
<212> PRT
<213> 智人(Homo sapiens)
<400> 33
Met Asp Ser Asp Asp Glu Met Val Glu Glu Ala Val Glu Gly His Leu
1 5 10 15
Asp Asp Asp Gly Leu Pro His Gly Phe Cys Thr Val Thr Tyr Ser Ser
20 25 30
Thr Asp Arg Phe Glu Gly Asn Phe Val His Gly Glu Lys Asn Gly Arg
35 40 45
Gly Lys Phe Phe Phe Phe Asp Gly Ser Thr Leu Glu Gly Tyr Tyr Val
50 55 60
Asp Asp Ala Leu Gln Gly Gln Gly Val Tyr Thr Tyr Glu Asp Gly Gly
65 70 75 80
Val Leu Gln Gly Thr Tyr Val Asp Gly Glu Leu Asn Gly Pro Ala Gln
85 90 95
Glu Tyr Asp Thr Asp Gly Arg Leu Ile Phe Lys Gly Gln Tyr Lys Asp
100 105 110
Asn Ile Arg His Gly Val Cys Trp Ile Tyr Tyr Pro Asp Gly Gly Ser
115 120 125
Leu Val Gly Glu Val Asn Glu Asp Gly Glu Met Thr Gly Glu Lys Ile
130 135 140
Ala Tyr Val Tyr Pro Asp Glu Arg Thr Ala Leu Tyr Gly Lys Phe Ile
145 150 155 160
Asp Gly Glu Met Ile Glu Gly Lys Leu Ala Thr Leu Met Ser Thr Glu
165 170 175
Glu Gly Arg Pro His Phe Glu Leu Met Pro Gly Asn Ser Val Tyr His
180 185 190
Phe Asp Lys Ser Thr Ser Ser Cys Ile Ser Thr Asn Ala Leu Leu Pro
195 200 205
Asp Pro Tyr Glu Ser Glu Arg Val Tyr Val Ala Glu Ser Leu Ile Ser
210 215 220
Ser Ala Gly Glu Gly Leu Phe Ser Lys Val Ala Val Gly Pro Asn Thr
225 230 235 240
Val Met Ser Phe Tyr Asn Gly Val Arg Ile Thr His Gln Glu Val Asp
245 250 255
Ser Arg Asp Trp Ala Leu Asn Gly Asn Thr Leu Ser Leu Asp Glu Glu
260 265 270
Thr Val Ile Asp Val Pro Glu Pro Tyr Asn His Val Ser Lys Tyr Cys
275 280 285
Ala Ser Leu Gly His Lys Ala Asn His Ser Phe Thr Pro Asn Cys Ile
290 295 300
Tyr Asp Met Phe Val His Pro Arg Phe Gly Pro Ile Lys Cys Ile Arg
305 310 315 320
Thr Leu Arg Ala Val Glu Ala Asp Glu Glu Leu Thr Val Ala Tyr Gly
325 330 335
Tyr Asp His Ser Pro Pro Gly Lys Ser Gly Pro Glu Ala Pro Glu Trp
340 345 350
Tyr Gln Val Glu Leu Lys Ala Phe Gln Ala Thr Gln Gln Lys
355 360 365
<210> 34
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 34
gtcaaagggg catatggaag g 21
<210> 35
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 35
gggaagaaag ccccacttgg 20
<210> 36
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 36
gcccagtcgc gtgggggggg 20
<210> 37
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 37
ggagcgcgag tgtcactcgg 20
<210> 38
<211> 21
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 38
gctcactgta ggacccgagc c 21
<210> 39
<211> 21
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 39
gacgcggcgc tcattggcca a 21
<210> 40
<211> 21
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 40
cgagccgcga gcccagtcgc g 21
<210> 41
<211> 21
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 41
tccccccccc cccccacgcg a 21
<210> 42
<211> 21
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 42
gtcactcacc ccgattggcc a 21
<210> 43
<211> 21
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 43
cgcgagccca gtcgcgtggg g 21
<210> 44
<211> 21
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 44
gttggcttat ccaaacatct c 21
<210> 45
<211> 21
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 45
atgttaagca agggtaatag a 21
<210> 46
<211> 21
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 46
ctgtgaaagg aatacaattc a 21
<210> 47
<211> 21
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 47
gccaattctt ggcaaccgag c 21
<210> 48
<211> 21
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 48
gaattggcca aagggagggg t 21
<210> 49
<211> 21
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 49
aattagcaga cagcttggta c 21
<210> 50
<211> 21
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 50
ctggctgatt cccgaggatt t 21
<210> 51
<211> 21
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 51
cactgaatac ggattggtca g 21
<210> 52
<211> 21
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 52
gatgtctcag aaccactgaa t 21
<210> 53
<211> 21
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 53
aaccactgaa tacggattgg t 21
<210> 54
<211> 21
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 54
accaatccgt attcagtggt t 21
<210> 55
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 55
ggcgcggggc ggacggggcg a 21
<210> 56
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 56
gcgccccggg aacgcgtggg g 21
<210> 57
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 57
cgccccgcgc cgcgcgggga g 21
<210> 58
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 58
tccgccccgc gccgcgcggg g 21
<210> 59
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 59
ggaacgcgtg gggcggagct t 21
<210> 60
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 60
gccccgcgcc gcgcggggag g 21
<210> 61
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 61
tgcgccccgg gaacgcgtgg g 21
<210> 62
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 62
gaacgcgtgg ggcggagctt c 21
<210> 63
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 63
gcggcgcggg gcggacgggg c 21
<210> 64
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 64
cccgtccgcc ccgcgccgcg c 21
<210> 65
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 65
ggcccactcg ccgccaatca g 21
<210> 66
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 66
ggaagccgcc ggggccgcct a 21
<210> 67
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 67
tgattggcgg cgagtgggcc a 21
<210> 68
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 68
gccgccaatc agcggaagcc g 21
<210> 69
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 69
ggcggcttcc gctgattggc g 21
<210> 70
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 70
ccgccaatca gcggaagccg c 21
<210> 71
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 71
agccgccggg gccgcctaga g 21
<210> 72
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 72
gcttccgctg attggcggcg a 21
<210> 73
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 73
cggcgagtgg gccaatgggt g 21
<210> 74
<211> 21
<212> DNA
<213> 智人(Homo sapiens)
<400> 74
ccaatgggtg cggggcggtg g 21
<210> 75
<211> 21
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 75
ggctgccggg gccgcctaaa g 21
<210> 76
<211> 21
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 76
ggaggctgcc ggggccgcct a 21
<210> 77
<211> 21
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 77
gccgccaatc agcggaggct g 21
<210> 78
<211> 21
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 78
ccgccaatca gcggaggctg c 21
<210> 79
<211> 21
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 79
tggccggtgc gccgccaatc a 21
<210> 80
<211> 21
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 80
ggccggtgcg ccgccaatca g 21
<210> 81
<211> 21
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 81
cggcgcaccg gccaataagt g 21
<210> 82
<211> 21
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 82
ataagtgtgg ggcggtgggc g 21
<210> 83
<211> 21
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 83
ccaataagtg tggggcggtg g 21
<210> 84
<211> 21
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 84
caataagtgt ggggcggtgg g 21
<210> 85
<211> 20
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 85
cctttctatg acctagtcgg 20
<210> 86
<211> 20
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 86
cagaatcagt aacgcactgt 20
<210> 87
<211> 20
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 87
gaaaccagga gagataaccc 20
<210> 88
<211> 20
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 88
ggaccccaga tattctggaa 20
<210> 89
<211> 20
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 89
ttattgttga cttaacgaag 20
<210> 90
<211> 20
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 90
aaaaagaagc aaatagctaa 20
<210> 91
<211> 20
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 91
agaatcagta acgcactgta 20
<210> 92
<211> 27
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 92
tgttggttta ttggacccca gatattc 27
<210> 93
<211> 27
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 93
tgttggagaa aattaactta gtgcata 27
<210> 94
<211> 27
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 94
tgttggtata actgccacta gagggct 27
<210> 95
<211> 19
<212> DNA
<213> 智人(Homo sapiens)
<400> 95
aggagccggg acccaccgg 19

Claims (46)

1.一种治疗哺乳动物对象中单倍体机能不全疾病的方法,所述方法包括使所述对象的细胞与组合物接触,所述组合物包含:
i)向导RNA,其中所述向导RNA包含:
a)靶向区域,其在所述细胞的核中存在的条件下,与和单倍体机能不全的基因的野生型拷贝操作性地连接的启动子区域或增强子区域特异性杂交;和
b)CRISPR核酸酶结合区域,其在所述细胞的核中存在的条件下特异性结合CRISPR核酸酶,或特异性结合CRISPR核酸酶结合区域的区域;和
ii)CRISPR核酸酶,
-其中所述接触形成包含与向导RNA结合的CRISPR核酸酶的复合物,其中所述复合物中向导RNA的靶向区域与所述启动子或增强子杂交;
-其中所述复合物包含催化失活的CRISPR核酸酶和转录激活结构域,并且
-其中所述复合物以足以治疗所述对象中的单倍体机能不全疾病的量和持续时间激活单倍体机能不全的基因的野生型拷贝的转录。
2.如权利要求1所述的方法,其中所述接触包括使细胞与编码向导RNA或CRISPR核酸酶的附加型载体接触。
3.如权利要求1或2所述的方法,其中所述接触包括使细胞与编码向导RNA和CRISPR核酸酶的附加型载体接触。
4.如权利要求1或2所述的方法,其中所述接触包括使细胞与编码向导RNA的附加型载体和编码CRISPR核酸酶的第二附加型载体接触。
5.如前述权利要求中任一项所述的方法,其中所述附加型载体是非整合的。
6.如前述权利要求中任一项所述的方法,其中所述附加型载体是非复制性的。
7.如前述权利要求中任一项所述的方法,其中所述附加型载体是腺相关病毒(AAV)载体。
8.如前述权利要求中任一项所述的方法,其中所述附加型载体独立地包含第一末端和第二末端,其中第一末端和第二末端各自独立地包含AAV反向末端重复序列。
9.如前述权利要求中任一项所述的方法,其中所述CRISPR核酸酶包含(i)经修饰以消除核酸酶和切口活性的核酸酶结构域和(ii)转录激活结构域。
10.如前述权利要求中任一项所述的方法,其中所述修饰包括在对应于化脓性链球菌Cas9的D10和H840的位置处的突变。
11.如前述权利要求中任一项所述的方法,其中所述CRISPR核酸酶包含D10A,H840A化脓性链球菌dCas9。
12.如前述权利要求中任一项所述的方法,其中所述向导RNA包含死亡指导序列。
13.如前述权利要求中任一项所述的方法,其中所述向导RNA包含转录激活结合结构域,其中所述转录激活结合结构域特异性结合包含一种或多种转录激活结构域的组合物。
14.如前述权利要求中任一项所述的方法,其中包含与向导RNA结合的CRISPR核酸酶的所述复合物还包含选自下组的转录激活结构域:HSF1,VP16,VP64,p65,MyoD1,RTA,SET7/9,VPR,组蛋白乙酰转移酶p300,TET家族蛋白的羟化酶催化结构域(例如,TET1羟化酶催化结构域),LSD1,CIB1,AD2,CR3,EKLF1,GATA4,PRVIE,p53,SP1,MEF2C,TAX和PPARγ。
15.如前述权利要求中任一项所述的方法,其中所述CRISPR核酸酶是CRISPR核酸酶-VP64融合多肽。
16.如前述权利要求中任一项所述的方法,其中所述向导RNA包含支架区域。
17.如权利要求16所述的方法,其中所述支架区域包含ms2,f6,PP7,com或L7a配体序列。
18.如权利要求17所述的方法,其中所述复合物中向导RNA的支架区域与融合至MCP多肽,COM多肽,PCP多肽或L7a多肽的转录激活结构域结合。
19.如前述权利要求中任一项所述的方法,其中所述单倍体机能不全的基因是SIM1,瘦蛋白,瘦蛋白受体,MC4R,SCN2A,SETD5,PAX6,PKD1,MC3R,POMC,STAT3,STAT5,SOCS3,GHR,NPY,NPY1R,NPY2R,NPY5R,PYY,AMPK(PRKAA1,PRKAA2,PRKAB1,PRKAB2,PRKAG1,PRKAG2,PRKAG3),OXT,JAK2,SHP2,NOS3,NROB2,BRS3,CARTPT,FABP4,HTR2C,IL6,NHLH2,NMU,NPB,NPBWRI,PNPLA2,UCP3,ADIPOQ,APOA5,ARNT2,ASIP,C1QTNF2,C3AR1,CCK,CPT1B,CSF2,DGAT1,DGAT2,GHRL,GHSR,HSD11B1,HTR7,INSIG1,INSIG2,LIPC,NMURI,NMUR2,NPBWR2,NTS,PPARGC1A,PPY,RETN,SIRT1,TGFBR2,WDTC1,或FOXO1。
20.如前述权利要求中任一项所述的方法,其中所述向导RNA的靶向区域由以下编码或与以下特异性杂交:
SEQ ID NO:1(GACACGGAATTCATTGCCAG),
SEQ ID NO:2(CTGCGGGTTAGGTCTACCGG),
SEQ ID NO:3(GTTGAGCGCTCAGTCCAGCG),
SEQ ID NO:4(TCCCGACGTCGTGCGCGACC),或
SEQ ID NO:5(GCTCTGAATCTTACTACCCG)。
21.如权利要求1-19中任一项所述的方法,其中所述向导RNA的靶向区域由以下编码或与以下特异性杂交:
SEQ ID NO:6(GCTGTTAACTAAAGACAGGG),
SEQ ID NO:7(GTGGTCTGGGTGATCTCATG),
SEQ ID NO:8(GACAAAGGAACATCTGAGAGG),
SEQ ID NO:9(GTGATCTCATGGGGAAGAGG),或
SEQ ID NO:10(GGCTTTGATCGTGGTCTGGG)。
22.如权利要求1-19中任一项所述的方法,其中所述向导RNA的靶向区域由以下编码或与以下特异性杂交:
SEQ ID NO:11(GCGAGCCCAGTCGCGTGGGG),
SEQ ID NO:12(GCCAAGAATTGGCCAAAGGG),
SEQ ID NO:34(GTCAAAGGGGCATATGGAAGG),
SEQ ID NO:35(GGGAAGAAAGCCCCACTTGG),
SEQ ID NO:36(GCCCAGTCGCGTGGGGGGGG),或
SEQ ID NO:37(GGAGCGCGAGTGTCACTCGG)。
23.如权利要求1-19中任一项所述的方法,其中所述向导RNA的靶向区域由以下编码或与以下特异性杂交:
SEQ ID NO:38(GCTCACTGTAGGACCCGAGCC),
SEQ ID NO:39(GACGCGGCGCTCATTGGCCAA),
SEQ ID NO:40(CGAGCCGCGAGCCCAGTCGCG),
SEQ ID NO:41(TCCCCCCCCCCCCCCACGCGA),
SEQ ID NO:42(GTCACTCACCCCGATTGGCCA),或
SEQ ID NO:43(CGCGAGCCCAGTCGCGTGGGG)。
24.如权利要求1-19中任一项所述的方法,其中所述向导RNA的靶向区域由以下编码或与以下特异性杂交:
SEQ ID NO:44(GTTGGCTTATCCAAACATCTC),
SEQ ID NO:45(ATGTTAAGCAAGGGTAATAGA),
SEQ ID NO:46(CTGTGAAAGGAATACAATTCA),
SEQ ID NO:47(GCCAATTCTTGGCAACCGAGC),
SEQ ID NO:48(GAATTGGCCAAAGGGAGGGGT),或
SEQ ID NO:49(AATTAGCAGACAGCTTGGTAC)。
25.如权利要求1-19中任一项所述的方法,其中所述向导RNA的靶向区域由以下编码或与以下特异性杂交:
SEQ ID NO:50(CTGGCTGATTCCCGAGGATTT),
SEQ ID NO:51(CACTGAATACGGATTGGTCAG),
SEQ ID NO:52(GATGTCTCAGAACCACTGAAT),
SEQ ID NO:53(AACCACTGAATACGGATTGGT),或
SEQ ID NO:54(ACCAATCCGTATTCAGTGGTT)。
26.如权利要求1-19中任一项所述的方法,其中所述向导RNA的靶向区域由以下编码或与以下特异性杂交:
SEQ ID NO:55(GGCGCGGGGCGGACGGGGCGA),
SEQ ID NO:56(GCGCCCCGGGAACGCGTGGGG),
SEQ ID NO:57(CGCCCCGCGCCGCGCGGGGAG),
SEQ ID NO:58(TCCGCCCCGCGCCGCGCGGGG),
SEQ ID NO:59(GGAACGCGTGGGGCGGAGCTT),
SEQ ID NO:60(GCCCCGCGCCGCGCGGGGAGG),
SEQ ID NO:61(TGCGCCCCGGGAACGCGTGGG),
SEQ ID NO:62(GAACGCGTGGGGCGGAGCTTC),
SEQ ID NO:63(GCGGCGCGGGGCGGACGGGGC),或
SEQ ID NO:64(CCCGTCCGCCCCGCGCCGCGC)。
27.如权利要求1-19中任一项所述的方法,其中所述向导RNA的靶向区域由以下编码或与以下特异性杂交:
SEQ ID NO:65(GGCCCACTCGCCGCCAATCAG),
SEQ ID NO:66(GGAAGCCGCCGGGGCCGCCTA),
SEQ ID NO:67(TGATTGGCGGCGAGTGGGCCA),
SEQ ID NO:68(GCCGCCAATCAGCGGAAGCCG),
SEQ ID NO:69(GGCGGCTTCCGCTGATTGGCG),
SEQ ID NO:70(CCGCCAATCAGCGGAAGCCGC),
SEQ ID NO:71(AGCCGCCGGGGCCGCCTAGAG),
SEQ ID NO:72(GCTTCCGCTGATTGGCGGCGA),
SEQ ID NO:73(CGGCGAGTGGGCCAATGGGTG),或
SEQ ID NO:74(CCAATGGGTGCGGGGCGGTGG)。
28.如权利要求1-19中任一项所述的方法,其中所述向导RNA的靶向区域由以下编码或与以下特异性杂交:
SEQ ID NO:75(GGCTGCCGGGGCCGCCTAAAG),
SEQ ID NO:76(GGAGGCTGCCGGGGCCGCCTA),
SEQ ID NO:77(GCCGCCAATCAGCGGAGGCTG),
SEQ ID NO:78(CCGCCAATCAGCGGAGGCTGC),
SEQ ID NO:79(TGGCCGGTGCGCCGCCAATCA),
SEQ ID NO:80(GGCCGGTGCGCCGCCAATCAG),
SEQ ID NO:81(CGGCGCACCGGCCAATAAGTG),
SEQ ID NO:82(ATAAGTGTGGGGCGGTGGGCG),
SEQ ID NO:83(CCAATAAGTGTGGGGCGGTGG),或
SEQ ID NO:84(CAATAAGTGTGGGGCGGTGGG)。
29.如权利要求1-19中任一项所述的方法,其中所述向导RNA的靶向区域由以下编码或与以下特异性杂交:
SEQ ID NO:85(CCTTTCTATGACCTAGTCGG),
SEQ ID NO:86(CAGAATCAGTAACGCACTGT),
SEQ ID NO:87(GAAACCAGGAGAGATAACCC),
SEQ ID NO:88(GGACCCCAGATATTCTGGAA),
SEQ ID NO:89(TTATTGTTGACTTAACGAAG),
SEQ ID NO:90(AAAAAGAAGCAAATAGCTAA),或
SEQ ID NO:91(AGAATCAGTAACGCACTGTA)。
30.如权利要求1-19中任一项所述的方法,其中所述向导RNA的靶向区域由以下编码或与以下特异性杂交:
SEQ ID NO:92(TGTTGGTTTATTGGACCCCAGATATTC),
SEQ ID NO:93(TGTTGGAGAAAATTAACTTAGTGCATA),或
SEQ ID NO:94(TGTTGGTATAACTGCCACTAGAGGGCT)。
31.如权利要求1-19中任一项所述的方法,其中所述向导RNA的靶向区域由以下编码或与以下特异性杂交:
SEQ ID NO:95(AGGAGCCGGGACCCACCGG)。
32.如前述权利要求中任一项所述的方法,其中所述细胞是非分裂细胞。
33.如前述权利要求中任一项所述的方法,其中所述细胞是神经元。
34.如前述权利要求中任一项所述的方法,其中所述细胞是下脑丘细胞。
35.如前述权利要求中任一项所述的方法,其中所述接触包括将编码向导RNA和/或CRISPR核酸酶的核酸注射到含有下丘脑的脑区域中。
36.如前述权利要求中任一项所述的方法,其中所述接触包括将包含编码向导RNA和/或CRISPR核酸酶的核酸的腺相关病毒载体注射到含有下丘脑的脑区域中。
37.如前述权利要求中任一项所述的方法,其中所述单倍体机能不全疾病选自肥胖症,自闭症,癫痫,智力障碍,无虹膜和多囊肾病。
38.如前述权利要求中任一项所述的方法,其中所述单倍体机能不全疾病选自表1。
39.如权利要求37所述的方法,所述单倍体机能不全疾病是肥胖症。
40.一种分离的哺乳动物宿主细胞,包含:
I)包含靶基因的至少一个功能性拷贝的基因组,其中一个或多个功能性拷贝在没有异源复合物的转录激活的情况下不产生足够的相应基因产物以在生物体中产生野生型表型;和
II)异源复合物,其中所述异源复合物包含:
a)向导RNA,其中所述向导RNA包含:
i)靶向区域,其在所述细胞的核中存在的条件下和与靶基因的一个或多个功能性拷贝操作性地连接的增强子区域或启动子区域特异性杂交;和
ii)CRISPR核酸酶结合区域,其在所述细胞的核中存在的条件下特异性结合CRISPR核酸酶;和
b)CRISPR核酸酶,
-其中包含与向导RNA结合的CRISPR核酸酶的异源复合物的向导RNA与所述启动子或增强子杂交;
-其中所述CRISPR核酸酶是催化失活的,并且
-其中所述复合物激活靶基因的一个或多个功能性拷贝的转录,其量和持续时间足以在宿主细胞在生物体中存在时产生野生型表型。
41.如权利要求40所述的分离的哺乳动物宿主细胞,其中所述基因组包含所述靶基因的单个功能性拷贝。
42.如权利要求41所述的分离的哺乳动物宿主细胞,其中所述靶基因的单个功能性拷贝包含单倍体机能不全的基因。
43.如权利要求42所述的分离的哺乳动物宿主细胞,其中所述单倍体机能不全的基因是SIM1,瘦蛋白,瘦蛋白受体,MC4R,SCN2A,SETD5,PAX6,PKD1,MC3R,POMC,STAT3,STAT5,SOCS3,GHR,NPY,NPY1R,NPY2R,NPY5R,PYY,AMPK(PRKAA1,PRKAA2,PRKAB1,PRKAB2,PRKAG1,PRKAG2,PRKAG3),OXT,JAK2,SHP2,NOS3,NROB2,BRS3,CARTPT,FABP4,HTR2C,IL6,NHLH2,NMU,NPB,NPBWRI,PNPLA2,UCP3,ADIPOQ,APOA5,ARNT2,ASIP,C1QTNF2,C3AR1,CCK,CPT1B,CSF2,DGAT1,DGAT2,GHRL,GHSR,HSD11B1,HTR7,INSIG1,INSIG2,LIPC,NMURI,NMUR2,NPBWR2,NTS,PPARGC1A,PPY,RETN,SIRT1,TGFBR2,WDTC1,或FOXO1。
44.如权利要求43所述的分离的哺乳动物宿主细胞,其中所述单倍体机能不全的基因治疗选自表1的单倍体机能不全疾病。
45.如权利要求44所述的分离的哺乳动物宿主细胞,其中所述单倍体机能不全疾病选自肥胖症,自闭症,癫痫,智力障碍,无虹膜和多囊肾病。
46.如权利要求45所述的分离的哺乳动物宿主细胞,其中所述单倍体机能不全疾病是肥胖症。
CN201880023129.0A 2017-02-07 2018-02-07 单倍体机能不全的基因疗法 Active CN110612113B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410279202.8A CN118370844A (zh) 2017-02-07 2018-02-07 单倍体机能不全的基因疗法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762455988P 2017-02-07 2017-02-07
US62/455,988 2017-02-07
PCT/US2018/017186 WO2018148256A1 (en) 2017-02-07 2018-02-07 Gene therapy for haploinsufficiency

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202410279202.8A Division CN118370844A (zh) 2017-02-07 2018-02-07 单倍体机能不全的基因疗法

Publications (2)

Publication Number Publication Date
CN110612113A true CN110612113A (zh) 2019-12-24
CN110612113B CN110612113B (zh) 2024-03-26

Family

ID=63107613

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202410279202.8A Pending CN118370844A (zh) 2017-02-07 2018-02-07 单倍体机能不全的基因疗法
CN201880023129.0A Active CN110612113B (zh) 2017-02-07 2018-02-07 单倍体机能不全的基因疗法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202410279202.8A Pending CN118370844A (zh) 2017-02-07 2018-02-07 单倍体机能不全的基因疗法

Country Status (6)

Country Link
US (2) US11730828B2 (zh)
EP (1) EP3579858A4 (zh)
JP (2) JP2020506948A (zh)
CN (2) CN118370844A (zh)
AU (1) AU2018218280B2 (zh)
WO (1) WO2018148256A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113015801A (zh) * 2018-09-20 2021-06-22 赛诺菲 基于内含子的通用克隆方法和组合物

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013066438A2 (en) 2011-07-22 2013-05-10 President And Fellows Of Harvard College Evaluation and improvement of nuclease cleavage specificity
WO2013163628A2 (en) 2012-04-27 2013-10-31 Duke University Genetic correction of mutated genes
KR102210322B1 (ko) 2013-03-15 2021-02-01 더 제너럴 하스피탈 코포레이션 Rna-안내 게놈 편집의 특이성을 증가시키기 위한 rna-안내 foki 뉴클레아제(rfn)의 용도
US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9340799B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College MRNA-sensing switchable gRNAs
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US9322037B2 (en) 2013-09-06 2016-04-26 President And Fellows Of Harvard College Cas9-FokI fusion proteins and uses thereof
US9068179B1 (en) 2013-12-12 2015-06-30 President And Fellows Of Harvard College Methods for correcting presenilin point mutations
WO2016022363A2 (en) 2014-07-30 2016-02-11 President And Fellows Of Harvard College Cas9 proteins including ligand-dependent inteins
KR20240132120A (ko) 2015-08-25 2024-09-02 듀크 유니버시티 Rna-가이드된 엔도뉴클레아제를 이용하는 게놈 조작에서 특이성을 개선하는 조성물 및 방법
EP4089175A1 (en) 2015-10-13 2022-11-16 Duke University Genome engineering with type i crispr systems in eukaryotic cells
IL294014B2 (en) 2015-10-23 2024-07-01 Harvard College Nucleobase editors and their uses
CA3032699A1 (en) 2016-08-03 2018-02-08 President And Fellows Of Harvard College Adenosine nucleobase editors and uses thereof
AU2017308889B2 (en) 2016-08-09 2023-11-09 President And Fellows Of Harvard College Programmable Cas9-recombinase fusion proteins and uses thereof
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
WO2018071868A1 (en) 2016-10-14 2018-04-19 President And Fellows Of Harvard College Aav delivery of nucleobase editors
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
EP3592853A1 (en) 2017-03-09 2020-01-15 President and Fellows of Harvard College Suppression of pain by gene editing
JP2020510439A (ja) 2017-03-10 2020-04-09 プレジデント アンド フェローズ オブ ハーバード カレッジ シトシンからグアニンへの塩基編集因子
IL269458B2 (en) 2017-03-23 2024-02-01 Harvard College Nucleic base editors that include nucleic acid programmable DNA binding proteins
AU2018254616B2 (en) 2017-04-21 2022-07-28 The General Hospital Corporation Inducible, tunable, and multiplex human gene regulation using crispr-Cpf1
WO2018209320A1 (en) 2017-05-12 2018-11-15 President And Fellows Of Harvard College Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation
JP2020534795A (ja) 2017-07-28 2020-12-03 プレジデント アンド フェローズ オブ ハーバード カレッジ ファージによって支援される連続的進化(pace)を用いて塩基編集因子を進化させるための方法および組成物
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
US11795443B2 (en) 2017-10-16 2023-10-24 The Broad Institute, Inc. Uses of adenosine base editors
MA50942A (fr) 2017-12-01 2020-10-07 Encoded Therapeutics Inc Protéines de liaison à l'adn modifiées
WO2019204766A1 (en) 2018-04-19 2019-10-24 The Regents Of The University Of California Compositions and methods for gene editing
CA3119618A1 (en) * 2018-11-16 2020-05-22 Astellas Pharma Inc. Method for treating muscular dystrophy by targeting utrophin gene
AU2020228028A1 (en) * 2019-02-25 2021-09-30 University Of Massachusetts DNA-binding domain transactivators and uses thereof
DE112020001342T5 (de) 2019-03-19 2022-01-13 President and Fellows of Harvard College Verfahren und Zusammensetzungen zum Editing von Nukleotidsequenzen
WO2020214990A1 (en) * 2019-04-17 2020-10-22 Ascidian Therapeutics, Inc. Abca4 cell line and methods of use
CN112266418A (zh) * 2019-07-08 2021-01-26 中国科学院微生物研究所 改进的基因组编辑系统及其应用
JP2023503618A (ja) * 2019-11-27 2023-01-31 ザ ジェネラル ホスピタル コーポレイション 遺伝子発現を活性化するためのシステムおよび方法
DE112021002672T5 (de) 2020-05-08 2023-04-13 President And Fellows Of Harvard College Vefahren und zusammensetzungen zum gleichzeitigen editieren beider stränge einer doppelsträngigen nukleotid-zielsequenz
CN111521821A (zh) * 2020-05-09 2020-08-11 四川省人民医院 血管钙化的生物标志物及其应用
WO2022125420A1 (en) * 2020-12-09 2022-06-16 City Of Hope Compounds and methods to treat cystic fibrosis
CN113207808B (zh) * 2021-06-03 2023-09-29 贵州大学 一种柯乐猪的选育方法
US11476090B1 (en) * 2021-08-24 2022-10-18 Applied Materials, Inc. Voltage pulse time-domain multiplexing
WO2023039373A2 (en) * 2021-09-08 2023-03-16 The Regents Of The University Of California Crispr-cas effector polypeptides and method of use thereof
MX2024003412A (es) * 2021-09-21 2024-04-08 Univ Johns Hopkins Terapia de regulon de arnm para el tratamiento de los trastornos por haploinsuficiencia.
WO2023164545A1 (en) * 2022-02-23 2023-08-31 Massachusetts Institute Of Technology Methods for upregulating shank3 expression
WO2023172995A1 (en) * 2022-03-11 2023-09-14 Epicrispr Biotechnologies, Inc. Systems and methods for genetic modulation to treat ocular diseases
CN114731987B (zh) * 2022-05-19 2023-06-23 华芯微鱼(苏州)生物科技有限公司 颅缝早闭症小鼠模型、其构建方法及应用
CN116041477B (zh) * 2022-10-13 2023-08-08 呈诺再生医学科技(北京)有限公司 Tdgf1基因在制备治疗衰老相关疾病或逆转细胞衰老的药物中的应用
CN116790603B (zh) * 2023-08-18 2023-10-31 成都中科奥格生物科技有限公司 一种sgRNA、CRISPR/Cas9载体及其构建方法和用途

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105358568A (zh) * 2013-04-03 2016-02-24 阿里奥弗塔股份公司 治疗由opa1单倍剂量不足引起的疾病的人工转录因子
US20160355797A1 (en) * 2013-12-12 2016-12-08 The Broad Institute Inc. Systems, methods and compositions for sequence manipulation with optimized functional crispr-cas systems

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1736553A1 (en) * 2005-06-17 2006-12-27 Centre National De La Recherche Scientifique ENPP1 (PC-1) gene haplotype associated with the risk of obesity and type 2 diabetes and their applications
WO2013185239A1 (en) * 2012-06-14 2013-12-19 Université de Montréal Transgenic mouse models for mc4r
PL2896697T3 (pl) 2012-12-12 2016-01-29 Broad Inst Inc Projektowanie systemów, sposoby i optymalizowane kompozycje kierujące do manipulacji sekwencją
CN105793425B (zh) * 2013-06-17 2021-10-26 布罗德研究所有限公司 使用病毒组分靶向障碍和疾病的crispr-cas系统和组合物的递送、用途和治疗应用
WO2014204723A1 (en) 2013-06-17 2014-12-24 The Broad Institute Inc. Oncogenic models based on delivery and use of the crispr-cas systems, vectors and compositions
US11013219B2 (en) * 2014-01-17 2021-05-25 Path Therapeutics, Inc. Metabolism-based drug screening platform in bioengineered zebrafish
WO2016049163A2 (en) * 2014-09-24 2016-03-31 The Broad Institute Inc. Use and production of chd8+/- transgenic animals with behavioral phenotypes characteristic of autism spectrum disorder
WO2016083360A1 (en) 2014-11-25 2016-06-02 Ait Austrian Institute Of Technology Gmbh Diagnosis of lung cancer
US20160324987A1 (en) * 2015-04-15 2016-11-10 Cedars-Sinai Medical Center Use of crispr/cas9 as in vivo gene therapy to generate targeted genomic disruptions in genes bearing dominant mutations for retinitis pigmentosa
WO2016187717A1 (en) 2015-05-26 2016-12-01 Exerkine Corporation Exosomes useful for genome editing
WO2018049073A1 (en) 2016-09-07 2018-03-15 Flagship Pioneering, Inc. Methods and compositions for modulating gene expression

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105358568A (zh) * 2013-04-03 2016-02-24 阿里奥弗塔股份公司 治疗由opa1单倍剂量不足引起的疾病的人工转录因子
US20160355797A1 (en) * 2013-12-12 2016-12-08 The Broad Institute Inc. Systems, methods and compositions for sequence manipulation with optimized functional crispr-cas systems

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
LI-FANG JIN等: "Generation of genetically modified mice using CRISPR/Cas9 and haploid embryonic stem cell systems", 《ZOOLOGICAL RESEARCH》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113015801A (zh) * 2018-09-20 2021-06-22 赛诺菲 基于内含子的通用克隆方法和组合物

Also Published As

Publication number Publication date
WO2018148256A1 (en) 2018-08-16
JP2020506948A (ja) 2020-03-05
CN110612113B (zh) 2024-03-26
EP3579858A1 (en) 2019-12-18
CN118370844A (zh) 2024-07-23
WO2018148256A9 (en) 2019-10-10
AU2018218280B2 (en) 2024-10-17
JP2023058644A (ja) 2023-04-25
EP3579858A4 (en) 2020-12-23
US11730828B2 (en) 2023-08-22
AU2018218280A1 (en) 2019-08-29
AU2018218280A2 (en) 2019-10-31
US20190351074A1 (en) 2019-11-21
US20230293729A1 (en) 2023-09-21

Similar Documents

Publication Publication Date Title
CN110612113B (zh) 单倍体机能不全的基因疗法
JP7083364B2 (ja) 配列操作のための最適化されたCRISPR-Cas二重ニッカーゼ系、方法および組成物
JP6625971B2 (ja) 配列操作のためのタンデムガイド系、方法および組成物の送達、エンジニアリングおよび最適化
JP7012650B2 (ja) Dna結合ドメインと切断ドメインとを連結するための組成物
JP2020185014A (ja) Dna結合ドメインと切断ドメインとを連結するための組成物
AU2016362282A1 (en) Therapeutic targets for the correction of the human dystrophin gene by gene editing and methods of use
WO2018009562A1 (en) Crispr/cas9-based compositions and methods for treating retinal degenerations
WO2016061073A1 (en) Composition and method for in vivo engineering of chromosomal rearrangements
KR20060039019A (ko) 표적화된 절단과 재조합을 위한 방법 및 그 조성물
JP2023522788A (ja) 標的化されたゲノム組込みによってデュシェンヌ型筋ジストロフィーを矯正するためのcrispr/cas9療法
JP2022505381A (ja) アルファ1アンチトリプシン欠乏症を治療するための組成物及び方法
WO2022247873A1 (zh) 工程化的Cas12i核酸酶、效应蛋白及其用途
Wang et al. Porcine ZBED6 regulates growth of skeletal muscle and internal organs via multiple targets
US20170355956A1 (en) Compositions for increasing survival of motor neuron protein (smn) levels in target cells and methods of use thereof for the treatment of spinal muscular atrophy
JP2022507828A (ja) 肝臓特異的調節性核酸配列
US20070031390A1 (en) Methods and compositions for site-specific genomic expression of nucleic acid sequences
Matharu et al. Promoter or enhancer activation by CRISPRa rescues haploinsufficiency caused obesity
AU2018244986A9 (en) Coupling device for a medical instrument
US20110172144A1 (en) Methods for increasing expression of serca2a in cardiac muscle
EP4402265A1 (en) Novel transcription factors

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant