CN113710693A - Dna结合结构域反式激活因子及其用途 - Google Patents

Dna结合结构域反式激活因子及其用途 Download PDF

Info

Publication number
CN113710693A
CN113710693A CN202080021751.5A CN202080021751A CN113710693A CN 113710693 A CN113710693 A CN 113710693A CN 202080021751 A CN202080021751 A CN 202080021751A CN 113710693 A CN113710693 A CN 113710693A
Authority
CN
China
Prior art keywords
nucleic acid
seq
leu
lys
ala
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080021751.5A
Other languages
English (en)
Inventor
M·S·埃斯特维斯
S·A·沃尔夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Massachusetts UMass
Original Assignee
University of Massachusetts UMass
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Massachusetts UMass filed Critical University of Massachusetts UMass
Publication of CN113710693A publication Critical patent/CN113710693A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/705Receptors; Cell surface antigens; Cell surface determinants
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • A61P25/08Antiepileptics; Anticonvulsants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/70Fusion polypeptide containing domain for protein-protein interaction
    • C07K2319/71Fusion polypeptide containing domain for protein-protein interaction containing domain for transcriptional activaation, e.g. VP16
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • C07K2319/81Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor containing a Zn-finger domain for DNA binding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Virology (AREA)
  • Cell Biology (AREA)
  • Immunology (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Veterinary Medicine (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Neurosurgery (AREA)
  • Pain & Pain Management (AREA)
  • Neurology (AREA)
  • Epidemiology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Peptides Or Proteins (AREA)

Abstract

在一些方面,本公开涉及包含编码包含DNA结合结构域和转录调控子结构域的融合蛋白的核酸的重组腺相关病毒(rAAV)及其使用方法。在一些实施方案中,所述融合蛋白的表达导致细胞中靶基因的修饰的表达。

Description

DNA结合结构域反式激活因子及其用途
相关申请
本申请根据35U.S.C.§119(e)要求标题为“ZINC FINGER PROTEINTRANSACTIVATORS AND USES THEREOF”且于2019年2月25日提交的美国临时申请序列号62/810,005的申请日的权益,其全部内容以引用的方式并入本文。
背景技术
靶基因表达的调控已作为生物医学研究的主要领域而出现。基因表达的上调可纠正因基因表达降低而导致的单倍体不足(haploinsufficient)病状。当基因的至少一个拷贝中存在一个或多个功能丧失突变时,通常会导致单倍体不足。用于治疗与单倍体不足相关的疾病的基于AAV的基因增强方法受到传统rAAV载体的包装能力的阻碍。
发明内容
本公开的方面涉及用于基因递送的分离的核酸和重组AAV载体。本公开部分地基于用于调控靶基因表达的组合物(例如,rAAV载体和rAAV)和方法,其中靶基因是单倍体不足的,诸如SCN1A。在一些实施方案中,本公开提供包含DNA结合结构域(诸如Cys2-His2锌指蛋白(ZFP))和转录调控子结构域的融合蛋白。在一些实施方案中,本公开描述的组合物包含含有融合至转录调控子结构域的DNA结合结构域(例如,ZFP、转录激活因子样效应物(TALE)结构域等)的融合蛋白。在一些实施方案中,本公开描述的融合蛋白增加靶基因(例如,SCN1A)的表达,并因此可用于治疗与正常细胞或受试者相比,细胞或受试者中以靶基因表达缺陷为特征的疾病(例如,与靶基因的单倍体不足相关的疾病)。
因此,在一些方面,本公开提供一种分离的核酸,其包含被配置来表达融合至至少一个转录调控子结构域的至少一个DNA结合结构域的转基因,其中DNA结合结构域结合至靶基因或靶基因(例如,在受试者或细胞中)的调控区(例如,增强子序列、启动子序列、阻遏子序列等),其中靶基因编码电压门控钠通道(例如,Nav1.1)。在一些实施方案中,靶基因为SCN1A基因。在一些实施方案中,转基因的侧翼为腺相关病毒(AAV)反向末端重复序列(ITR)。在一些实施方案中,至少一个DNA结合结构域结合靶基因(例如,在受试者或细胞中),并且转录调控子结构域修饰(例如,上调)靶基因的表达。
在一些方面,本公开提供一种重组AAV(rAAV),其包含:核酸,所述核酸包含编码融合至至少一个转录调控子结构域的至少一个DNA结合结构域,其中DNA结合结构域结合至靶基因或靶基因(例如,在受试者或细胞中)的调控区,其中靶基因编码电压门控钠通道(例如,Nav1.1);以及至少一种衣壳蛋白。在一些实施方案中,靶基因为SCN1A基因。在一些实施方案中,转基因的侧翼为AAV反向末端重复序列(ITR)。
在一些实施方案中,至少一个DNA结合结构域结合靶基因(例如,在受试者或细胞中),并且转录调控子结构域修饰(例如,上调)受试者中靶基因的表达。
在一些实施方案中,至少一个DNA结合结构域结合到靶基因的非翻译区。在一些实施方案中,DNA结合结构域结合到靶基因的调控区,任选地增强子序列、启动子序列和/或阻遏子序列。
在一些实施方案中,DNA结合结构域结合在靶基因的调控区(例如,增强子序列、启动子序列和/或阻遏子序列等)的上游2bp与2000bp或上游或下游2bp与2000bp之间。
在一些实施方案中,至少一个DNA结合结构域编码锌指蛋白(ZFP)、转录激活因子样效应物(TALE)、dCas蛋白(例如,dCas9或dCas12a)和/或同源结构域(homeodomain)。在一些实施方案中,至少一个DNA结合结构域结合到SEQ ID NO:5-7中的任一个中列出的核酸序列。在一些实施方案中,至少一个DNA结合结构域为锌指蛋白,其包含由具有SEQ ID NO:11-16、23-28或35-40中的任一个中列出的序列的核酸编码的识别螺旋。在一些实施方案中,至少一个DNA结合结构域为锌指蛋白,其包含SEQ ID NO:17-22、29-34或41-46中的任一个中列出的氨基酸序列。
在一些实施方案中,至少一个DNA结合结构域为锌指蛋白,其包含由包含SEQ IDNO:11的核酸编码的识别螺旋、由包含SEQ ID NO:12的核酸编码的识别螺旋、由包含SEQ IDNO:13的核酸编码的识别螺旋、由包含SEQ ID NO:14的核酸编码的识别螺旋、由包含SEQ IDNO:15的核酸编码的识别螺旋和/或由包含SEQ ID NO:16的核酸编码的识别螺旋。在一些实施方案中,至少一个DNA结合结构域为锌指蛋白,其包含SEQ ID NO:57的氨基酸序列。在一些实施方案中,结合到SCN1A基因的ZFP包含与SEQ ID NO:57的氨基酸序列至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%的序列同一性。
在一些实施方案中,至少一个DNA结合结构域为锌指蛋白,其包含由包含SEQ IDNO:23的核酸编码的识别螺旋、由包含SEQ ID NO:24的核酸编码的识别螺旋、由包含SEQ IDNO:25的核酸编码的识别螺旋、由包含SEQ ID NO:26的核酸编码的识别螺旋、由包含SEQ IDNO:27的核酸编码的识别螺旋和/或由包含SEQ ID NO:28的核酸编码的识别螺旋。在一些实施方案中,至少一个DNA结合结构域为锌指蛋白,其包含SEQ ID NO:59的氨基酸序列。在一些实施方案中,结合到SCN1A基因的ZFP包含与SEQ ID NO:59的氨基酸序列至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%的序列同一性。
在一些实施方案中,至少一个DNA结合结构域为锌指蛋白,其包含由包含SEQ IDNO:35的核酸编码的识别螺旋、由包含SEQ ID NO:36的核酸编码的识别螺旋、由包含SEQ IDNO:37的核酸编码的识别螺旋、由包含SEQ ID NO:38的核酸编码的识别螺旋、由包含SEQ IDNO:39的核酸编码的识别螺旋和/或由包含SEQ ID NO:40的核酸编码的识别螺旋。在一些实施方案中,至少一个DNA结合结构域为锌指蛋白,其包含SEQ ID NO:61的氨基酸序列。在一些实施方案中,结合到SCN1A基因的ZFP包含与SEQ ID NO:61的氨基酸序列至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%的序列同一性。
在一些实施方案中,至少一个DNA结合结构域为锌指蛋白,其包含含SEQ ID NO:17的氨基酸序列的识别螺旋、含SEQ ID NO:18的氨基酸序列的识别螺旋、含SEQ ID NO:19的氨基酸序列的识别螺旋、含SEQ ID NO:20的氨基酸序列的识别螺旋、含SEQ ID NO:21的氨基酸序列的识别螺旋和/或含SEQ ID NO:22的氨基酸序列的识别螺旋。
在一些实施方案中,至少一个DNA结合结构域为锌指蛋白,其包含含SEQ ID NO:29的识别螺旋、含SEQ ID NO:30的识别螺旋、含SEQ ID NO:31的识别螺旋、含SEQ ID NO:32的识别螺旋、含SEQ ID NO:33的识别螺旋和/或含SEQ ID NO:34的识别螺旋。
在一些实施方案中,至少一个DNA结合结构域为锌指蛋白,其包含含SEQ ID NO:41的识别螺旋、含SEQ ID NO:42的识别螺旋、含SEQ ID NO:43的识别螺旋、含SEQ ID NO:44的识别螺旋、含SEQ ID NO:45的识别螺旋和/或含SEQ ID NO:46的识别螺旋。
在一些实施方案中,至少一个DNA结合结构域为催化失活的CRISPR相关蛋白(Cas蛋白)。在一些实施方案中,催化失活的Cas蛋白(或“死亡Cas蛋白”)为dCas9或dCas12蛋白。在一些实施方案中,核酸或rAAV还包含至少一种指导核酸(例如,指导RNA或gRNA)。在一些实施方案中,指导核酸包含靶向SCN1A的间隔区序列。在一些实施方案中,指导核酸包含具有SEQ ID NO:85、86、89、90、93或94中的任一个的核苷酸序列的间隔区序列。在一些实施方案中,指导核酸包含具有SEQ ID NO:83-94中的任一个的核苷酸序列。在一些实施方案中,指导核酸由SEQ ID NO:83-94中的任一个列出的核酸序列编码。
在一些实施方案中,至少一个转录调控子结构域为包含VP16结构域、VP64结构域、Rta结构域、p65结构域、Hsf1结构域或其任何组合的反式激活因子结构域,诸如VPR结构域(VP64+p65+Rta1结构域)。在一些实施方案中,至少一个转录调控子结构域由如SEQ ID NO:47中列出的核酸序列编码。在一些实施方案中,至少一个反式激活结构域包含SEQ ID NO:48中列出的氨基酸序列。
在一些实施方案中,位于转基因侧翼的ITR包含选自由以下组成的组的ITR:AAV1ITR、AAV2 ITR、AAV3 ITR、AAV4 ITR、AAV5 ITR、AAV6 ITR、AAV8 ITR、AAVrh8 ITR、AAV9ITR、AAV10 ITR或AAVrh10 ITR。在一些实施方案中,ITR为ΔTR或mTR。
在一些实施方案中,分离的核酸的转基因可操作地连接到启动子。在一些实施方案中,启动子为组织特异性启动子。在一些实施方案中,组织特异性启动子为神经元启动子,诸如SST、NYP、磷酸激活的谷氨酰胺酶(PAG)、囊泡谷氨酸转运蛋白-1(VGLUT1)、谷氨酸脱羧酶65和57(GAD65、GAD67)、突触蛋白I、a-CamKII、Dock10、Prox1、小白蛋白(PV)、生长抑素(SST)、胆囊收缩素(CCK)、钙视网膜蛋白(CR)或神经肽Y(NPY)。
在一些实施方案中,转基因的DNA结合结构域通过接头结构域与转录调控子结构域融合。在一些实施方案中,接头结构域为柔性接头,例如富含甘氨酸的接头或甘氨酸-丝氨酸接头;或可裂解的接头,诸如可光裂解的接头或酶(例如,蛋白酶)可裂解的接头。
在一些实施方案中,分离的核酸包含编码多个DNA结合结构域(例如,1、2、3、4、5、6、7、8、9或10个DNA结合结构域)的转基因。在一些实施方案中,分离的核酸包含编码多个转录调控子结构域(例如,1、2、3、4、5、6、7、8、9或10个转录调控子结构域)的转基因。
在一些实施方案中,分离的核酸或rAAV在特征在于相对于正常细胞或受试者,靶基因的异常表达或单倍体不足(例如,表达增加或表达减少)的细胞或受试者中表达。在一些实施方案中,分离的核酸或rAAV在特征在于相对于正常细胞或受试者,靶基因的表达不足(例如,减少)的细胞或受试者中表达。在一些实施方案中,分离的核酸或rAAV的靶基因为SCN1A。
在一些实施方案中,AAV衣壳血清型选自由以下组成的组:AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAVrh8、AAV9、AAV10、AAVrh10或AAV.PHPB。
在一些方面,本公开提供了调控靶基因表达的方法。在一些实施方案中,本公开的方法包括向表达靶基因的细胞或受试者施用如本文所述的分离的核酸或rAAV,其中所述受试者对靶基因单倍体不足(例如,对SCN1A单倍体不足)。例如,在一些实施方案中,靶基因(诸如SCN1A)在所述细胞或受试者中的表达相对于正常细胞或受试者中的靶基因表达是缺陷的(例如,减少)。在一些实施方案中,向其施用分离的核酸或rAAV的细胞为神经元。在一些实施方案中,神经元为GABA能神经元。
在一些实施方案中,施用分离的核酸或rAAV导致靶基因表达(例如,SCN1A表达)相对于未施用分离的核酸或rAAV的受试者增加至少2倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍、至少60倍、至少70倍、至少80倍、至少90倍或至少100倍。在一些实施方案中,施用分离的核酸或rAAV导致靶基因表达(例如,SCN1A表达)相对于施用分离的核酸或rAAV之前受试者中的靶基因(例如,SCN1A)表达增加至少2倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍、至少60倍、至少70倍、至少80倍、至少90倍或至少100倍。
在一些方面,本公开提供了一种调控受试者中的基因表达(例如,SCN1A的表达)的方法,其中将如本文所述的分离的核酸或rAAV施用于表达靶基因的受试者。在一些实施方案中,相对于健康受试者,受试者中靶基因的表达是异常的(例如,增加或减少)。在一些实施方案中,相对于健康受试者,受试者关于靶基因的表达是或疑似是单倍体不足的。
在一些实施方案中,受试者患有或疑似患有由靶基因的单倍体不足表达引起的疾病或病状。例如,在一些实施方案中,对于SCN1A表达单倍体不足的受试者患有德拉韦综合征(Dravet syndrome)。在一些实施方案中,通过静脉内注射、肌肉内注射、吸入、皮下注射和/或颅内注射向受试者施用分离的核酸或rAAV。
在一些方面,本公开提供了一种包含如本公开所述的分离的核酸或rAAV的组合物。在一些实施方案中,组合物包含药学上可接受的载剂。
在一些方面,本公开提供了一种包含容纳如本公开所述的分离的核酸或rAAV的容器的试剂盒。在一些实施方案中,试剂盒包含容纳药学上可接受的载剂的容器。在一些实施方案中,分离的核酸或rAAV和药学上可接受的载剂容纳在同一容器中。在一些实施方案中,容器为注射器。
在一些方面,本公开提供了一种包含如本公开所述的分离的核酸或rAAV的宿主细胞。在一些实施方案中,宿主细胞为真核细胞。在一些实施方案中,宿主细胞为哺乳动物细胞。在一些实施方案中,宿主细胞为人细胞,任选地为神经元,例如GABA能神经元。
附图说明
图1示出了表明人(HEK)与小鼠(HEPG2)SCN1A基因之间的序列保守性的色谱测序数据(共有序列–SEQ ID NO:98;靶序列–SEQ ID NO:99;Hep-SCN1A_R4序列(顶部)–SEQ IDNO:100;Hep-SCN1A_R4序列(底部)–SEQ ID NO:101
图2示出了人(SEQ ID NO:1)和小鼠(SEQ ID NO:2)SCN1A基因的近端启动子区的序列比对,其中突出显示了保守序列。在此保守序列中的是锌指蛋白(ZFP)结合区的关注的靶区,其以粗体显示(SEQ ID NO:4)。
图3是示出SCN1A基因近端启动子区中三个重叠靶ZFP(ZFP-1、ZFP-2、ZFP-3)(SEQID NO:5-7)结合位点的位置(SEQ ID NO:3)的示意图。
图4A至图4D示出了ZFP-1中单个锌指(指1至指6;F1-F6)的六个识别螺旋序列的比对,其将识别SCN1A基因(SEQ ID NO:2)的近端启动子区内的单独的三个碱基区(以红色表示的DNA三联体,通过“·”分隔)。图4A突出显示了ZFP-1的锌指1至6(F1-F6)将结合的核苷酸序列(SEQ ID NO:3)。图4B示出了由ZFP-1(SEQ ID NO:17-22)的指1至6的每个识别螺旋(七个氨基酸)识别的三个核苷酸序列。图4C示出了ZFP-1的氨基酸序列,其含有6个指,每行一个,其中指之间的接头被突出显示以指定经典(TGEKP)和非经典(TGSQKP)接头序列(SEQID NO:65-70)。图4D示出了ZFP-1(F1-F6)(SEQ ID NO:102-107)的核苷酸序列。
图5A至图5D示出了ZFP-2中单个锌指(指1至指6;F1-F6)的六个识别螺旋序列的比对,其将识别SCN1A基因(SEQ ID NO:3)的近端启动子区内的单独的三个碱基区(以红色表示的DNA三联体,通过“*”分隔)。图5A突出显示了ZFP-2的锌指1至6(F1-F6)将结合的核苷酸序列(SEQ ID NO:3)。图5B示出了由ZFP-2(SEQ ID NO:29-34)的指1至6的每个识别螺旋(七个氨基酸)识别的前三个核苷酸。图5C示出了ZFP-2的氨基酸序列,其含有6个指,每行一个(SEQ ID NO:69-74),其中指之间的接头被突出显示以指定经典(TGEKP)和非经典(TGSQKP)接头序列。图5D示出了ZFP-2(F1-F6)(SEQ ID NO:108-113)的核苷酸序列。
图6A至图6D示出了ZFP-3中单个锌指(指1至指6;F1-F6)的六个识别螺旋序列的比对,其将识别SCN1A基因(SEQ ID NO:4)的近端启动子区内的单独的三个碱基区(以红色表示的DNA三联体,通过“*”分隔)。图6A突出显示了ZFP-3的锌指1至6(F1-F6)将结合的核苷酸序列(SEQ ID NO:3)。图6B示出了由ZFP-3(SEQ ID NO:41-46)的指1至6的每个识别螺旋(七个氨基酸)识别的前三个核苷酸。图6C示出了ZFP-3的氨基酸序列,其含有6个指,每行一个(SEQ ID NO:75-80),其中指之间的接头被突出显示以指定经典(TGEKP)和非经典(TGSQKP)接头序列。图6D示出了ZFP-3(F1-F6)(SEQ ID NO:114-119)的核苷酸序列。
图7示出了表明如通过定量实时聚合酶链反应(qRT-PCR)所测量,图4至图6中所述的SCN1A结合ZFP增加HEK293T细胞中的SCN1A基因表达的数据。通过瞬时转染编码以下转录调控因子的表达质粒来将这些表达构建体递送至细胞:酿脓链球菌(Streptococcuspyogenes)Cas9+SCN1A指导RNA(SpCas9+Scn1a);无核酸内切酶活性的Cas9(dCas9);VPR激活结构域+SCN1A指导RNA(dCas9_VPR+Scn1a);VPR激活结构域+ZFP1(VPR_ZFP1);VPR激活结构域+ZPF2(VPR_ZFP2);VPR激活结构域+ZFP3(VPR_ZFP3);SpCas9+ASCL1指导RNA(SpCas9+Ascl1);三个VPR_ZFP(VPR_ZFP1+VPR_ZFP2+VPR_ZFP3)。将表达水平归一化为每个样品中通过qRT-PCR确定的TBP表达水平。
图8示出了表明如通过定量实时聚合酶链反应(qRT-PCR)所测量,图4至图6中所述的SCN1A结合ZFP以及Cas9+SCN1A指导RNA增加HEK293T细胞中的SCN1A基因表达的数据。
具体实施方式
本公开的方面涉及用于调控(例如,增加)细胞或受试者中靶基因的表达的方法和组合物,其中靶基因为单倍体不足的(即,靶基因包含一个功能拷贝)。在一些实施方案中,靶基因为SCN1A。
在一些实施方案中,本公开提供包含DNA结合结构域(诸如ZFP)和转录调控子结构域的融合蛋白。在一些实施方案中,本公开提供包含DNA结合结构域(诸如ZFP)和反式激活因子结构域(例如,VPR结构域)的融合蛋白。在一些实施方案中,DNA结合蛋白结合到靶基因序列或靶基因的调控区。在一些实施方案中,调控区为增强子序列、启动子序列或阻遏子序列。在一些实施方案中,启动子序列可为内部启动子(例如,位于靶基因的内含子中)或外部启动子(例如,位于靶基因的转录起始位点的上游)。在一些实施方案中,本文所述的融合蛋白的DNA结合结构域结合靶基因(例如,SCN1A)的启动子区中的保守序列,因此反式激活因子结构域增加基因表达。
在一些方面,本公开涉及用于增加细胞或受试者中靶基因(例如,SCN1A)的表达的方法。在一些实施方案中,靶基因含有使细胞或受试者对靶基因单倍体不足的突变。因此,在一些实施方案中,本公开的方法和组合物可用于治疗与靶基因产物的单倍体不足相关的疾病和病症,例如德拉韦综合征,其通常是由于SCN1A基因的一个拷贝中的突变导致电压门控钠通道α亚基Nav1.1的单倍体不足所致。
反式激活因子融合蛋白
本公开的一些方面涉及包含DNA结合结构域(DBD)和反式激活因子结构域的融合蛋白。如本文所用,融合蛋白包含由两个或更多个单独的氨基酸序列编码的两个或更多个连接多肽。如本文所用,嵌合蛋白为融合蛋白,其中两个或更多个连接基因来自不同物种。融合蛋白通常是重组产生的,其中编码融合蛋白的基因位于支持两个或更多个连接基因表达和将所得mRNA翻译成重组蛋白的系统中。在一些实施方案中,融合蛋白在原核或真核细胞中重组产生。融合蛋白可以多种排列构造。例如,一种蛋白质(蛋白质A)位于第二种蛋白质(蛋白质B)的上游。在其他融合蛋白构型中,蛋白质B位于蛋白质A的上游。在一些实施方案中,编码DNA结合结构域的核酸序列位于编码反式激活因子结构域的核酸序列的上游,并产生包含连接到反式激活因子的DBD的融合蛋白。在一些实施方案中,编码反式激活因子结构域的核酸序列位于编码DNA结合结构域的核酸序列的上游,并产生包含连接到DNA结合结构域的反式激活因子结构域的融合蛋白。在一些实施方案中,融合蛋白包含位于DNA结合结构域上游的反式激活因子结构域。在一些实施方案中,融合蛋白包含位于反式激活因子结构域上游的DNA结合结构域。
在一些实施方案中,本公开所述的融合蛋白包含DNA结合结构域。如本文所用,“DNA结合结构域(DBD)”是指包含识别双链或单链DNA(dsDNA或ssDNA)的至少一个结构基序的独立折叠蛋白质。某些DBD识别特定序列(识别序列或基序),而其他类型的DBD对DNA具有一般亲和力。在一些实施方案中,本公开所述的融合蛋白包含序列特异性DBD。在一些实施方案中,DBD识别(例如,特异性结合)编码SCN1A蛋白(例如Nav1.1)的基因内或附近的核酸序列。含有DBD的蛋白质通常参与细胞过程,诸如转录、复制、修复和DNA储存。转录因子中的DBD识别启动子区或增强子元件中的特定DNA序列以促进基因表达。转录因子DBD在基因工程中用作融合蛋白来调控靶基因的表达,并且可突变以改变DNA结合特异性或DNA结合亲和力,从而调控所需靶基因的表达。DBD的实例包括但不限于螺旋-转角-螺旋基序、锌指基序(包括Cys2-His2锌指)、转录激活因子样效应物(TALE)、翼螺旋基序、HMG-盒、dCas蛋白(例如,dCas9或dCas12a)、同源结构域和OB折叠结构域。
在一些实施方案中,本公开涉及锌指DBD融合蛋白。如本文所用,“锌指蛋白(ZFP)”是指含有至少一个结构基序的蛋白质,其特征在于稳定蛋白质折叠的一种或多种锌离子的配位。锌指是在蛋白质中发现的最多样化的结构基序之一,并且高达3%的人基因编码锌指。大多数ZFP含有与靶分子(包括DNA、RNA和小蛋白泛素)串联接触的多个锌指。“经典”锌指基序由2个半胱氨酸氨基酸和2个组氨酸氨基酸(C2H2)组成,并以序列特异性方式结合DNA。这些ZFP(包括转录因子IIIIA(TFIIIA))通常涉及基因表达。DNA结合蛋白中的多个锌指基序结合并包裹在DNA双螺旋的外侧。由于它们的尺寸相对较小(例如,每个指为约25-40个,通常为27-35个氨基酸),锌指结构域融合蛋白用于创建具有新的DNA结合特异性的DBD。这些DBD可递送其他融合结构域(例如,转录激活或抑制结构域或表观遗传修饰结构域)以改变靶基因的转录调控。在一些实施方案中,锌指蛋白包含2至8个指,其中每个指含有27至40个氨基酸(例如,27、28、29、30、31、32、33、34、35、36、37、38、39或40个氨基酸)。
在一些实施方案中,ZFP包含1、2、3、4、5、6、7或8个锌指。每个锌指可包含25-40、25-30、30-35、35-40或40-45个氨基酸。在一些实施方案中,锌指包含27-35个氨基酸。在一些实施方案中,锌指包含27、28、29、30、31、32、33、34或35个氨基酸。锌指可特异性识别或结合在受试者中单倍体不足的靶序列,例如,靶基因或靶基因的调控区。在一些实施方案中,锌指结合到SCN1A基因(例如,人SCN1A,例如如SEQ ID NO:49中列出的)的靶序列。在一些实施方案中,结合到SCN1A基因的靶序列的锌指包含SEQ ID NO:63-80的一个或多个氨基酸序列或其组合。在一些实施方案中,锌指特异性识别或结合到包含三核苷酸序列的靶序列。
在一些实施方案中,锌指包含识别或结合到靶序列(例如,包含三核苷酸序列的靶序列)的识别螺旋。在一些实施方案中,识别螺旋结合到三核苷酸。在一些实施方案中,识别螺旋包含4-10个氨基酸。在一些实施方案中,识别螺旋包含4、6、7、8、9或10个氨基酸。在一些实施方案中,识别螺旋结合到SCN1A基因的三核苷酸序列。在一些实施方案中,结合到SCN1A基因的识别序列包含SEQ ID NO:17-22、29-34或41-46中的任一个的氨基酸序列。在一些实施方案中,结合到SCN1A基因的识别序列由SEQ ID NO:11-16、23-28或35-40中的任一个编码。在一些实施方案中,锌指结合到与包含SEQ ID NO:17-22、29-34或41-46中的任一个的氨基酸序列的识别螺旋相同的核苷酸序列。
在一些实施方案中,锌指在其C末端包含接头序列,其可用于将所述锌指链接或连接至另外的锌指。在一些实施方案中,接头序列可为例如包含TGEKP(SEQ ID NO:120)的氨基酸序列的经典接头。在一些实施方案中,接头序列可为例如包含TGSQKP(SEQ ID NO:121)的氨基酸序列的非经典接头。在一些实施方案中,接头序列可为2-10个氨基酸,例如,2、3、4、5、6、7、8、9或10个氨基酸。
在一些实施方案中,结合到靶基因(例如,SCN1A基因)的ZFP包含六个锌指,每个锌指识别或结合到靶基因(例如,SCN1A基因)的不同三核苷酸序列。在一些实施方案中,结合到SCN1A基因的ZFP包含SEQ ID NO:57的氨基酸序列。在一些实施方案中,结合到SCN1A基因的ZFP包含含有SEQ ID NO:63、64、65、66、67和/或68的氨基酸序列的锌指。在一些实施方案中,结合到SCN1A基因的ZFP包含含有SEQ ID NO:17、18、19、20、21和/或22的氨基酸序列的识别螺旋。在一些实施方案中,结合到SCN1A基因的ZFP包含SEQ ID NO:59的氨基酸序列。在一些实施方案中,结合到SCN1A基因的ZFP包含含有SEQ ID NO:69、70、71、72、73和/或74的氨基酸序列的锌指。在一些实施方案中,结合到SCN1A基因的ZFP包含含有SEQ ID NO:29、30、31、32、33和/或34的氨基酸序列的识别螺旋。在一些实施方案中,结合到SCN1A基因的ZFP包含SEQ ID NO:61的氨基酸序列。在一些实施方案中,结合到SCN1A基因的ZFP包含含有SEQ ID NO:75、76、77、78、79和/或80的氨基酸序列的锌指。在一些实施方案中,结合到SCN1A基因的ZFP包含含有SEQ ID NO:41、42、43、44、45和/或46的氨基酸序列的识别螺旋。在一些实施方案中,结合到SCN1A基因的ZFP包含与如下所示的SEQ ID NO:57、59或61至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%的序列同一性。
SEQ ID NO:57(ZFP1蛋白的氨基酸序列)
RPFQCRICMRNFSQRGNLVRHIRTHTGEKPFACDICGKKFALSFNLTRHTKIHTGSQKPFQCRICMRNFSRSDNLTRHIRTHTGEKPFACDICGKKFADRSHLARHTKIHTGSQKPFQCRICMRNFSQKAHLTAHIRTHTGEKPFACDICGRKFARSDNLTRHTKIHLRQKD
SEQ ID NO:59(ZFP2蛋白的氨基酸序列)
RPFQCRICMRNFSRSSNLTRHIRTHTGEKPFACDICGKKFADKRTLIRHTKIHTGSQKPFQCRICMRNFSQRGNLVRHIRTHTGEKPFACDICGKKFALSFNLTRHTKIHTGSQKPFQCRICMRNFSRSDNLTRHIRTHTGEKPFACDICGRKFADRSHLARHTKIHLRQKD
SEQ ID NO:61(ZFP3蛋白的氨基酸序列)
RPFQCRICMRNFSDRSALARHIRTHTGEKPFACDICGKKFARSDNLTRHTKIHTGSQKPFQCRICMRNFSQSGDLTRHIRTHTGEKPFACDICGKKFAVRQTLKQHTKIHTGSQKPFQCRICMRNFSAAGNLTRHIRTHTGEKPFACDICGRKFARSDNLTRHTKIHLRQKD
在一些实施方案中,DBD为转录激活因子样效应物蛋白(TALE)。TALE可特异性识别或结合靶序列,例如,靶基因或靶基因的调控区。在一些实施方案中,受试者对靶基因单倍体不足。在一些实施方案中,TALE结合到SCN1A基因(例如,如SEQ ID NO:49中提供的人SCN1A)的靶序列。TALE蛋白由细菌分泌并结合宿主植物中的启动子序列,以激活有助于细菌感染的植物基因的表达。通常,TALE蛋白被操纵以结合新的DNA序列,因为通过由可变数量的约30-35个氨基酸重复组成的中心重复结构域识别靶序列,其中每个重复识别靶序列内的单个碱基对。这些重复的阵列通常是识别DNA序列所必需的。
在一些实施方案中,DBD为同源结构域。同源结构域可特异性识别或结合靶序列,例如,靶基因或靶基因的调控区。在一些实施方案中,受试者对靶基因单倍体不足。在一些实施方案中,同源结构域结合到SCN1A基因(例如,如SEQ ID NO:49中提供的人SCN1A)的靶序列。同源结构域是负责识别靶序列的含有三个α螺旋和一个N端臂的蛋白质。同源结构域通常识别小的DNA序列(约4至8个碱基对),然而这些结构域可与其他DNA结合结构域(其他同源结构域或锌指蛋白)串联融合以识别更长的延伸序列(12至24个碱基对)。因此,同源结构域可为识别人基因组中的独特序列的DBD的组成部分。
在一些实施方案中,至少一个DNA结合结构域为催化失活的CRISPR相关蛋白(Cas蛋白)。催化失活的Cas蛋白(也称为dCas或“死亡Cas蛋白”)为经修饰或突变使得其核酸酶活性(例如,核酸内切酶活性)降低或缺乏所有核酸酶活性(例如,核酸内切酶活性)的Cas蛋白。在一些实施方案中,催化失活的Cas蛋白为dCas9或dCas12蛋白。在一些实施方案中,DBD为dCas蛋白(也称为‘死亡Cas’),诸如dCas9或dCas12a。dCas蛋白是已突变使得其催化失活(即不能进行核苷酸裂解)的CRISPR相关蛋白(Cas,例如Cas9或Cas12a)的突变变体。dCas可特异性识别或结合靶序列,例如,靶基因或靶基因的调控区。包含dCas蛋白和指导核酸(例如,gRNA)的复合物可靶向和/或结合到与指导核酸互补的特定核苷酸序列或基因。在一些实施方案中,受试者对靶基因单倍体不足。在一些实施方案中,dCas结合到SCN1A基因(例如,如SEQ ID NO:49中提供的人SCN1A)的靶序列。然而,当结合到与所述靶DNA序列互补或部分互补的指导核酸(例如,指导RNA、gRNA或sgRNA)时,dCas蛋白保留其识别和结合到靶DNA序列的能力。在一些实施方案中,用于将dCas(例如,dCas9)蛋白靶向SCN1A的指导核酸包含具有SEQ ID NO:85、86、89、90、93或94中的任一个的间隔区序列。在一些实施方案中,用于将dCas(例如,dCas9)蛋白靶向SCN1A的指导核酸包含具有SEQ ID NO:85、86、89、90、93或94中的任一个的至少15个(例如,至少16、17、18、19或20个)连续核苷酸的间隔区序列。在一些实施方案中,用于将dCas(例如,dCas9)蛋白靶向SCN1A的指导核酸包含SEQ ID NO:83、84、87、88、91或92中的任一个。在一些实施方案中,用于将dCas(例如,dCas9)蛋白靶向SCN1A的指导核酸包含SEQ ID NO:83-94中的任一个或由其组成。因此,dCas核酸内切酶可为识别人基因组中的独特序列的DBD的组成部分。在一些实施方案中,融合蛋白包含dCas9蛋白和反式激活结构域(例如,VPR结构域)。
在一些方面,本公开涉及结合到编码电压门控钠通道(例如,Nav1.1)的基因的DNA结合结构域。在一些实施方案中,编码电压门控钠通道的基因为SCN1A基因,并且包含SEQID NO:49中列出的序列。在一些实施方案中,DNA结合结构域结合到靶基因的非翻译区,诸如3'-非翻译区(3'UTR)或5'-非翻译区(5'UTR)。在一些实施方案中,非翻译区包含调控序列,例如增强子、启动子、内含子或阻遏子序列。在一些实施方案中,DNA结合结构域为锌指蛋白,其包含SEQ ID NO:57-62中列出的序列。在一些实施方案中,DNA结合结构域结合到SEQ ID NO:5-7中的任一个中列出的核酸序列。
由转基因编码的DNA结合结构域的数量可变化。在一些实施方案中,转基因编码一个DNA结合结构域。在一些实施方案中,转基因编码2个DNA结合结构域。在一些实施方案中,转基因编码3个DNA结合结构域。在一些实施方案中,转基因编码4个DNA结合结构域。在一些实施方案中,转基因编码5个DNA结合结构域。在一些实施方案中,转基因编码6个DNA结合结构域。在一些实施方案中,转基因编码7个DNA结合结构域。在一些实施方案中,转基因编码8个DNA结合结构域。在一些实施方案中,转基因编码9个DNA结合结构域。在一些实施方案中,转基因编码10个DNA结合结构域。在一些实施方案中,转基因编码多于10个(例如,20、30、50、100个等)DNA结合结构域。DNA结合结构域可为相同的DNA结合结构域(例如,相同DBD的多个拷贝)、不同的DNA结合结构域(例如,每个DBD结合唯一序列)或其组合。
在一些方面,本公开涉及包含反式激活因子结构域的融合蛋白。如本文所用,“反式激活结构域”是指转录因子中的支架结构域,其含有调控基因表达的其他蛋白质(诸如转录共调控因子)的结合位点。在一些实施方案中,反式激活结构域(也称为转录激活结构域)与DBD联合作用,以直接通过接触转录因子或间接通过共激活因子蛋白激活来自启动子或增强子的转录。反式激活结构域(TAD)通常以其氨基酸组成命名,其中氨基酸为活性所必需的或为TAD中最丰富的。TAD在基因工程中被用作融合蛋白来调控靶基因的表达,并且可突变以改变转录激活水平,从而改变靶基因的表达。反式激活结构域的实例包括但不限于GAL4、HAP1、VP16、P65、RTA和GCN4。
在一些实施方案中,反式激活因子结构域包含VP64结构域。VP64是由单纯疱疹病毒自然表达的VP16蛋白的四个串联拷贝组成的酸性TAD。当与结合在基因启动子处或其附近的DBD融合时,VP64充当强转录激活因子,并因此可用于调控靶基因(例如,SCN1A)的表达。VP64结构域通常由单纯疱疹蛋白VP16的最小激活结构域的四聚体重复组成。在一些实施方案中,VP64结构域包含VP16中氨基酸残基437-448的四个重复。在一些实施方案中,VP16蛋白由人疱疹病毒2UL48基因编码,其包含NCBI参考序列登录号:NC_001798.2中列出的序列。在一些实施方案中,VP16基因包含与由NCBI参考序列登录号:YP_009137200.1中列出的核酸序列编码的氨基酸序列99%相同、95%相同、90%相同、80%相同、70%相同、60%相同或50%相同的核苷酸序列。在一些实施方案中,VP16蛋白包含与NCBI参考序列登录号Q69113-1中列出的氨基酸序列99%相同、95%相同、90%相同、80%相同、70%相同、60%相同或50%相同的氨基酸序列。在一些实施方案中,VP16基因包含与由SEQ ID NO:51中列出的核酸序列编码的氨基酸序列99%相同、95%相同、90%相同、80%相同、70%相同、60%相同或50%相同的核苷酸序列。在一些实施方案中,VP16蛋白包含与SEQ ID NO:52中列出的氨基酸序列99%相同、95%相同、90%相同、80%相同、70%相同、60%相同或50%相同的氨基酸序列。
在一些实施方案中,反式激活因子结构域包含P65激活结构域。P65为NF-κβ转录因子的亚基,其C端含有两个相邻的酸性TAD。当与结合在基因启动子处或其附近的DBD融合时,p65蛋白充当强转录激活因子,并因此可用于调控靶基因的表达,例如如Urlinger等人“The p65 domain from NF-kappaB is an efficient human activator in thetetracycline-regulatable gene expression system,”Gene,2000所述。在一些实施方案中,p65蛋白由人RELA基因编码,其包含NCBI参考序列登录号:NM_001145138.1、NM_001243984.1、NM_001243985.1或NM_021975.3中列出的序列。在一些实施方案中,RELA基因包含与由NCBI参考序列登录号:NM_001145138.1、NM_001243984.1、NM_001243985.1或NM_021975.3中的任一个中列出的核酸序列编码的氨基酸序列99%相同、95%相同、90%相同、80%相同、70%相同、60%相同或50%相同的核苷酸序列。在一些实施方案中,p65蛋白包含与NP_001138610.1、NP_001230913.1、NP_001230914.1和NP_068110.3中列出的氨基酸序列99%相同、95%相同、90%相同、80%相同、70%相同、60%相同或50%相同的氨基酸序列。在一些实施方案中,RELA基因包含与由SEQ ID NO:53中列出的核酸序列编码的氨基酸序列99%相同、95%相同、90%相同、80%相同、70%相同、60%相同或50%相同的核苷酸序列。在一些实施方案中,p65蛋白包含与SEQ ID NO:54中列出的氨基酸序列99%相同、95%相同、90%相同、80%相同、70%相同、60%相同或50%相同的氨基酸序列。
在一些实施方案中,反式激活因子结构域包含RTA结构域。RTA是衍生自爱泼斯坦巴尔病毒(Epstein Barr virus)的疏水性TAD,它是与增强子区结合以促进几种病毒基因的表达的有效的反式激活结构域。当与结合在基因启动子处或其附近的DBD融合时,RTA蛋白充当强转录激活因子,并因此可用于调控靶基因的表达,例如如Miyazawa等人,“IL-10promoter transactivation by the viral K-RTA protein involves the host-celltranscription factors,specificity proteins 1and 3,”Journal of BiologicalChemistry,2018所述。在一些实施方案中,RTA蛋白由爱泼斯坦巴尔病毒BRLF1基因编码,其包含NCBI参考序列登录号:YP_041674.1中列出的序列。在一些实施方案中,BRLF1基因包含与由NCBI参考Seq ID No:YP_041674.1中的任一个中列出的核酸序列编码的氨基酸序列99%相同、95%相同、90%相同、80%相同、70%相同、60%相同或50%相同的核苷酸序列。在一些实施方案中,RTA蛋白包含与YP_041674.1中列出的氨基酸序列99%相同、95%相同、90%相同、80%相同、70%相同、60%相同或50%相同的氨基酸序列。在一些实施方案中,BRLF1基因包含与由SEQ ID NO:55中列出的核酸序列编码的氨基酸序列99%相同、95%相同、90%相同、80%相同、70%相同、60%相同或50%相同的核苷酸序列。在一些实施方案中,RTA蛋白包含与SEQ ID NO:56中列出的氨基酸序列99%相同、95%相同、90%相同、80%相同、70%相同、60%相同或50%相同的氨基酸序列。
本公开部分地基于包含杂交反式激活因子结构域的融合蛋白。如本文所用,“杂交反式激活因子结构域”是指包含多于一种转录激活蛋白或其部分(例如,2、3、4、5个或更多个转录激活蛋白或其部分)的融合蛋白。在基因工程中使用杂交反式激活结构域来增加靶基因的表达。在本公开的一些实施方案中,包含VP64-P65-RTA(VPR)的核苷酸序列的三元杂交反式激活结构域(如描述于Chavez等人“Highly efficient Cas9-mediatedtranscriptional programming”,Nat Methods,2015,(SEQ ID NO∶47)中)用于增加靶基因(例如,SCN1A)表达。
在一些实施方案中,本文所述的融合蛋白可包含DBD(例如,ZFP)和转录阻遏子蛋白。在一些方面,本公开涉及包含转录阻遏子结构域的融合蛋白。如本文所用,“转录阻遏子”蛋白通常是指下调靶基因表达的多肽。转录阻遏子的实例包括但不限于KRAB、SMRT/TRAC-2和NCoR/RIP-13。在一些实施方案中,此类转录阻遏子融合蛋白可用于降低靶基因(例如,在功能获得性疾病中过度表达的基因)的表达水平。
分离的核酸
分离的核酸序列是指DNA或RNA序列。在一些实施方案中,本公开的蛋白质和核酸是分离的。如本文所用,术语“分离的”意指人工生产的。如本文中关于核酸所使用的,术语“分离的”意指:(i)通过例如聚合酶链反应(PCR)在体外扩增;(ii)通过克隆重组产生;(iii)纯化,如通过裂解和凝胶分离;或(iv)通过例如化学合成来合成。分离的核酸是通过本领域众所周知的重组DNA技术易于操作的核酸。因此,包含在已知5'和3'限制位点或已公开聚合酶链反应(PCR)引物序列的载体中的核苷酸序列被认为是分离的,但以天然状态存在于自然宿主中的核酸序列不是分离的。分离的核酸可以是基本上纯化的,但不是必须的。例如,在克隆或表达载体中分离的核酸不是纯的,因为它可能仅占其所在细胞中物质的很小百分比。然而,正如本文所用的术语,此种核酸是分离的,因为通过本领域普通技术人员已知的标准技术易于操作。如本文中关于蛋白质或肽所使用的,术语“分离的”是指已从其天然环境中分离或人工生产(例如,通过化学合成、通过重组DNA技术等)的蛋白质或肽。
在一些方面,本公开涉及被配置为表达一种或多种ZFP反式激活结构域融合蛋白的分离的核酸(例如,表达构建体,诸如rAAV载体)。在一些实施方案中,融合蛋白包含1至10个(例如,1、2、3、4、5、6、7、8、9或10个)DBD和/或1至10个(例如,1、2、3、4、5、6、7、8、9或10个)反式激活因子结构域。在一些实施方案中,融合蛋白包含多于10个DBS和/或多于10个反式激活因子结构域。
在本公开的一些方面,DNA结合结构域通过接头间接融合到转录调控子结构域。如本文所用,“接头”通常为一段多肽,其在结构上连接单个转基因内的两个不同多肽。在一些实施方案中,接头是柔性的,以允许不同多肽的移动。在一些实施方案中,柔性接头包含甘氨酸残基。在一些实施方案中,柔性接头包含甘氨酸和丝氨酸残基的混合物。在一些实施方案中,接头为可裂解的,从而允许分离多肽。在一些实施方案中,可裂解接头被蛋白酶切割。在一些实施方案中,蛋白酶为胰蛋白酶或因子X。
在一些实施方案中,接头包含5至30个氨基酸(例如,5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸)。在一些实施方案中,接头包含3至30个氨基酸(例如,3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸)。在一些实施方案中,接头包含3至20个氨基酸(例如,3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个氨基酸)。
本公开部分地基于融合蛋白,所述融合蛋白被工程化以增加编码电压门控钠离子通道亚基蛋白(也称为SCN蛋白)(例如SCN1A)的基因的表达。如本文所用,“SCN蛋白”是指钠离子通道蛋白,其介导可兴奋膜的电压依赖性钠离子渗透性,从而允许钠离子穿过膜。人中SCN蛋白的实例包括但不限于SCN1A、SCN3A、SCN5A、SCN10A和SCN11A。在一些实施方案中,SCN蛋白为SCN1A(也称为Nav1.1),其编码1型α1离子通道亚基。在一些实施方案中,SCN蛋白为SCN1B蛋白,其编码1型β1离子通道亚基或SCN1C蛋白。在一些实施方案中,SCN蛋白为SCN1A、SCN1B和/或SCN1C蛋白的组合。如本文所公开,SCN蛋白可为SCN蛋白的一部分或片段。在一些实施方案中,如本文所公开的SCN蛋白为SCN蛋白的变体,诸如点突变体或截短的突变体。
在人中,SCN1A由SCN1A基因(基因ID:6323,人)编码,所述基因在黑猩猩、恒河猴、狗、牛、小鼠、大鼠和鸡中保守。人中的SCN1A基因主要在脑、肺和睾丸中表达。在一些实施方案中,SCN1A蛋白包含五个结构重复(I、II、III、IV、Q)。
在一些实施方案中,SCN1A蛋白由人SCN1A基因编码,其包含NCBI参考Seq ID No:NM_001165963.2、NM_00165964.2、NM_001202435.2、NM_001353948.1、NM_001353949.1、NM_001353950.1、NM_00135395.1、NM_001353952.1、NM_001353954.1、NM_00353955.1、NM_001353957.1、NM_001353958.1、NM_001353960.1、NM_001353961.1或NM_006920.5中列出的序列。在一些实施方案中,SCN1A蛋白由小鼠SCN1A基因编码,其包含NCBI参考Seq ID No:NM_001313997.1或NM_018733.2中列出的序列。在一些实施方案中,SCN1A蛋白包含与由NCBI参考Seq ID No:NG_011906.1、NM_001313997.1或NM_018733.2中列出的核酸序列编码的氨基酸序列99%相同、95%相同、90%相同、80%相同、70%相同、60%相同或50%相同的氨基酸序列。在一些实施方案中,SCN1A基因包含与SEQ ID NO:50中列出的序列99%相同、95%相同、90%相同、80%相同、70%相同、60%相同或50%相同的氨基酸序列。在一些实施方案中,人SCN1A蛋白包含NCBI参考Seq ID No:NP_001159435.1、NP_0011159436.1、NP_001189364.1、NP_001340877.1、NP_001340878.1、NP_001340879.1、NP_001340880.1、NP_001340881.1、NP_001340883.1、NP_001340884.1、NP_001340886.1、NP_001340887.1、NP_001340889.1、NP_001340890.1、NP_00851.3中列出的序列。在一些实施方案中,SCN1A蛋白包含与由NCBI参考Seq ID No:NG_011906.1、NM_001313997.1或NM_018733.2中列出的核酸序列编码的氨基酸序列99%相同、95%相同、90%相同、80%相同、70%相同、60%相同或50%相同的氨基酸序列。在一些实施方案中,小鼠SCN1A蛋白包含NCBI参考Seq ID No:NP_001300926.1或NP_061203.2中列出的序列。在一些实施方案中,人SCN1A蛋白包含与SEQ IDNO:49中列出的核酸序列99%相同、95%相同、90%相同、80%相同、70%相同、60%相同或50%相同的氨基酸序列。
本公开的分离的核酸可为重组腺相关病毒(AAV)载体(rAAV载体)。在一些实施方案中,如本公开所述的分离的核酸包含含有第一腺相关病毒(AAV)反向末端重复(ITR)或其变体的区(例如,第一区)。可将分离的核酸(例如,重组AAV载体)包装成衣壳蛋白并施用于受试者和/或递送至选定的靶细胞。“重组AAV(rAAV)载体”通常至少由转基因及其调控序列以及5'和3'AAV反向末端重复(ITR)组成。如本公开别处所述,转基因可包含编码例如蛋白质和/或表达控制序列(例如,聚-A尾)的区。
通常,ITR序列的长度为约145bp。优选地,基本上在分子中使用编码ITR的整个序列,尽管允许对这些序列进行某种程度的微小修饰。修饰这些ITR序列的能力在本领域技术范围内。(参见例如,文本诸如Sambrook等人.,″Molecular Cloning.A LaboratoryManual″,第2版,Cold Spring Harbor Laboratory,New York(1989);和K.Fisher等人,JVirol.,70:520 532(1996))。本公开中采用的这种分子的实例是含有转基因的“顺式作用”质粒,其中选定转基因序列和相关调控元件的侧翼为5'和3'AAV ITR序列。AAV ITR序列可从任何已知的AAV获得,包括目前鉴定的哺乳动物AAV类型。在一些实施方案中,分离的核酸还包含含有第二AAV ITR的区(例如,第二区、第三区、第四区等)。
除了上面鉴定的重组AAV载体的主要元件外,载体还包括以允许其在用载体转染或用本公开产生的病毒感染的细胞中转录、翻译和/或表达的方式与转基因的元件可操作地连接的常规控制元件。如本文所用,“可操作地连接的”序列包括与关注的基因相邻的表达控制序列和反式作用或一定距离作用以控制关注的基因的表达控制序列。表达控制序列包括适当的转录起始、终止、启动子和增强子序列;有效的RNA处理信号,诸如剪接和聚腺苷酸化(polyA)信号;稳定细胞质mRNA的序列;提高翻译效率的序列(例如,Kozak共有序列);增强蛋白质稳定性的序列;以及在需要时,增强编码产物的分泌的序列。许多表达控制序列(包括天然、组成型、诱导型和/或组织特异性启动子)是本领域已知的并且可被利用。
如本文所用,当核酸序列(例如,编码序列)和调控序列以将核酸序列的表达或转录置于调控序列的影响或控制下的方式共价连接时,它们被称为可操作地连接。如果希望将核酸序列翻译成功能性蛋白质,如果5'调控序列中启动子的诱导导致编码序列的转录,并且如果两个DNA序列之间的连接的性质不会(1)导致移码突变的引入,(2)干扰启动子区指导编码序列转录的能力,或(3)干扰相应RNA转录物翻译成蛋白质的能力,则两个DNA序列称为可操作地连接。因此,如果启动子区能够影响该DNA序列的转录,使得所得转录物可翻译成所需的蛋白质或多肽,则启动子区将可操作地连接到核酸序列。类似地,当两个或更多个编码区以它们从共同启动子的转录导致已在框内翻译的两个或更多个蛋白质的表达的方式连接时,它们可操作地连接。在一些实施方案中,可操作地连接的编码序列产生融合蛋白。
包含转基因(例如,包含融合蛋白等)的区可位于将能够表达融合蛋白的分离的核酸的任何合适的位置。
应当理解,在转基因编码多于一个多肽的情况下,每个多肽可位于转基因内的任何合适的位置。例如,编码第一多肽的核酸可位于转基因的内含子中,并且编码第二多肽的核酸序列可位于另一个非翻译区中(例如,在蛋白质编码序列的最后一个密码子与转基因聚-A信号的第一个碱基之间)。
“启动子”是指由需要启动基因的特异性转录的细胞的合成机械或引入的合成机械识别的DNA序列。短语“可操作地连接的”、“可操作地定位”、“受控”或“受转录控制”意指启动子相对于核酸处于正确的位置和方向,以控制RNA聚合酶的起始和基因的表达。
对于编码蛋白质的核酸,通常在转基因序列之后和3'AAV ITR序列之前插入聚腺苷酸化序列。可用于本公开的rAAV构建体还可含有内含子,其理想地位于启动子/增强子序列与转基因之间。一种可能的内含子序列源自SV-40,并且称为SV-40T内含子序列。可使用的另一个载体元件为内部核糖体进入位点(IRES)。IRES序列用于从单个基因转录物产生多于一个多肽。IRES序列将用于产生含有多于一条多肽链的蛋白质。这些和其他常见载体元件的选择是常规的,并且许多此类序列是可用的[参见例如,Sambrook等人及其中在例如第3.183.26和16.17 16.27页引用的参考文献,以及Ausubel等人,Current Protocols inMolecular Biology,John Wiley&Sons,New York,1989]。在一些实施方案中,口蹄疫病毒2A序列包含在多蛋白中;这是已被证明介导多蛋白的裂解的小的肽(长度为大约18个氨基酸)(Ryan,MD等人,EMBO,1994;4∶928-933;Mattion,N M等人,J Virology,1996年11月;第8124-8127页;Furler,S等人,Gene Therapy,2001;8∶864-873;和Halpin,C等人,The PlantJournal,1999;4∶453-459)。2A序列的裂解活性先前已在包括质粒和基因疗法载体(AAV和逆转录病毒)的人工系统中得到证实(Ryan,M D等人,EMBO,1994;4:928-933;Mattion,N M等人,J Virology,1996年11月;第8124-8127页;Furler,S等人,Gene Therapy,2001;8∶864-873;和Halpin,C等人,The Plant Journal,1999;4∶453-459;de Felipe,P等人,GeneTherapy,1999;6∶198-208;de Felipe,P等人,Human Gene Therapy,2000;11∶1921-1931;和Klump,H等人,Gene Therapy,2001;8∶811-817)。
组成型启动子的实例包括但不限于逆转录病毒劳斯肉瘤病毒(RSV)LTR启动子(任选地具有RSV增强子)、巨细胞病毒(CMV)启动子(任选地具有CMV增强子)[参见例如,Boshart等人,Cell,41:521-530(1985)]、SV40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(PGK)启动子和EF1α启动子[Invitrogen]。在一些实施方案中,启动子为P2启动子。在一些实施方案中,启动子为鸡β-肌动蛋白(CBA)启动子。在一些实施方案中,启动子为两个CBA启动子。在一些实施方案中,启动子为由CMV增强子分离的两个CBA启动子。在一些实施方案中,启动子为CAG启动子。
诱导型启动子允许调控基因表达,并且可通过外源提供的化合物、环境因素(诸如温度)或特定生理状态(例如,急性期、细胞的特定分化状态或仅在复制细胞中)的存在来调控。诱导型启动子和诱导型系统可购自多种商业来源,包括但不限于Invitrogen、Clontech和Ariad。已描述了许多其他系统并且本领域技术人员可容易地选择这些系统。通过外源提供的启动子调控的诱导型启动子的实例包括锌诱导型绵羊金属硫蛋白(MT)启动子、地塞米松(Dex)诱导型小鼠乳腺肿瘤病毒(MMTV)启动子、T7聚合酶启动子系统(WO98/10088);蜕皮激素昆虫启动子(No等人,Proc.Natl.Acad.Sci.USA,93:3346-3351(1996))、四环素抑制系统(Gossen等人,Proc.Natl.Acad.Sci.USA,89:5547-5551(1992))、四环素诱导型系统(Gossen等人,Science,268:1766-1769(1995),也参见Harvey等人,Curr.Opin.Chem.Biol.,2:512-518(1998))、RU486诱导型系统(Wang等人,Nat.Biotech.,15:239-243(1997)和Wang等人,Gene Ther.,4:432-441(1997))和雷帕霉素诱导型系统(Magari等人,J.Clin.Invest.,100:2865-2872(1997))。在此情况下可能有用的其他类型的诱导型启动子是受特定生理状态(例如,温度、急性期、细胞的特定分化状态或仅在复制细胞中)调控的那些启动子。
在另一个实施方案中,将使用转基因的天然启动子。当希望转基因的表达应模拟天然表达时,可优选天然启动子。当转基因的表达必须在时间或发育上、或以组织特异性方式、或响应特定转录刺激物时,可使用天然启动子。在另一个实施方案中,其他天然表达控制元件(诸如增强子元件、聚腺苷酸化位点或Kozak共有序列)也可用于模拟天然表达。
在一些实施方案中,调控序列赋予组织特异性基因表达能力。在一些情况下,组织特异性调控序列结合以组织特异性方式诱导转录的组织特异性转录因子。此类组织特异性调控序列(例如,启动子、增强子等)是本领域众所周知的。示例性组织特异性调控序列包括但不限于以下组织特异性启动子:肝特异性甲状腺素结合球蛋白(TBG)启动子、胰岛素启动子、胰高血糖素启动子、生长抑素启动子、胰腺多肽(PPY)启动子、突触素-1(Syn)启动子、肌酸激酶(MCK)启动子、哺乳动物结蛋白(DES)启动子、α-肌球蛋白重链(α-MHC)启动子或心脏肌钙蛋白T(cTnT)启动子。其他示例性启动子包括β-肌动蛋白启动子、乙型肝炎病毒核心启动子,Sandig等人,Gene Ther.,3:1002-9(1996);甲胎蛋白(AFP)启动子,Arbuthnot等人,Hum.Gene Ther.,7:1503-14(1996))、骨骨钙素启动子(Stein等人,Mol.Biol.Rep.,24:185-96(1997));骨唾液蛋白启动子(Chen等人,J.Bone Miner.Res.,11∶654-64(1996))、CD2启动子(Hansal等人,J.Immunol.,161∶1063-8(1998);免疫球蛋白重链启动子;T细胞受体α链启动子、神经元诸如神经元特异性烯醇化酶(NSE)启动子(Andersen等人,Cell.Mol.Neurobiol.,13:503-15(1993))、神经丝轻链基因启动子(Piccioli等人,Proc.Natl.Acad.Sci.USA,88∶5611-5(1991))和神经元特异性vgf基因启动子(Piccioli等人,Neuron,15∶373-84(1995))以及对于本领域技术人员将是显而易见的其他启动子。
在一些实施方案中,编码包含DBD和反式激活因子的融合蛋白的转基因可操作地连接到启动子。在一些实施方案中,启动子为组成型启动子。在一些实施方案中,启动子为诱导型启动子。在一些实施方案中,启动子为组织特异性启动子。在一些实施方案中,启动子对神经组织具有特异性。在一些实施方案中,启动子为SST或NPY启动子。
本公开的方面涉及一种包含多于一个启动子(例如,2、3、4、5个或更多个启动子)的分离的核酸。例如,在具有包含编码蛋白质的第一区和编码蛋白质的第二区的转基因的构建体的情况下,可能需要使用第一启动子序列(例如,可操作地连接到蛋白质编码区的第一启动子序列)驱动第一蛋白质编码区的表达,以及用第二启动子序列(例如,可操作地连接到第二蛋白质编码区的第二启动子序列)驱动第二蛋白质编码区的表达。通常,第一启动子序列和第二启动子序列可为相同的启动子序列或不同的启动子序列。在一些实施方案中,第一启动子序列(例如,驱动蛋白质编码区表达的启动子)为RNA聚合酶III(pol III)启动子序列。pol III启动子序列的非限制性实例包括U6和H1启动子序列。在一些实施方案中,第二启动子序列(例如,驱动第二蛋白质表达表达的启动子序列)为RNA聚合酶II(polII)启动子序列。pol II启动子序列的非限制性实例包括T7、T3、SP6、RSV和巨细胞病毒启动子序列。在一些实施方案中,pol III启动子序列驱动第一蛋白质编码区的表达。在一些实施方案中,pol II启动子序列驱动第二蛋白质编码区的表达。
重组腺相关病毒(rAAV)
在一些方面,本公开提供分离的腺相关病毒(AAV)。如本文中关于AAV所使用的,术语“分离的”是指人工生产或获得的AAV。可使用重组方法生产分离的AAV。此类AAV在本文中称为“重组AAV”。重组AAV(rAAV)优选具有组织特异性靶向能力,使得rAAV的核酸酶和/或转基因将被特异性递送至一个或多个预定组织。AAV衣壳是确定这些组织特异性靶向能力的重要元件。因此,可选择具有适合所靶向组织的衣壳的rAAV。
用于获得具有所需衣壳蛋白的重组AAV的方法是本领域众所周知的。(参见例如,US 2003/0138772),其内容以引用的方式整体并入本文。通常,所述方法涉及培养含有编码AAV衣壳蛋白的核酸序列的宿主细胞;功能性rep基因;由AAV反向末端重复(ITR)和转基因组成的重组AAV载体;和足够的辅助功能,以允许将重组AAV载体包装到AAV衣壳蛋白中。在一些实施方案中,衣壳蛋白是由AAV的cap基因编码的结构蛋白。AAV包含三种衣壳蛋白,病毒蛋白1至3(命名为VP1、VP2和VP3),所有这些蛋白都通过选择性剪接从单个cap基因转录。在一些实施方案中,VP1、VP2和VP3的分子量分别为约87kDa、约72kDa和约62kDa。在一些实施方案中,在翻译时,衣壳蛋白在病毒基因组周围形成球形60-mer蛋白壳。在一些实施方案中,衣壳蛋白的功能为保护病毒基因组、递送基因组并与宿主相互作用。在一些方面,衣壳蛋白以组织特异性方式将病毒基因组递送至宿主。
在一些实施方案中,AAV衣壳蛋白具有选自由AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAVrh8、AAV9、AAV10、AAVrh10和AAV.PHP.B组成的组的AAV血清型。在一些实施方案中,AAV衣壳蛋白具有衍生自非人灵长类动物的血清型,例如AAVrh8血清型。在一些实施方案中,AAV衣壳蛋白具有为广泛且有效的CNS转导而衍生的血清型,例如AAV.PHP.B。在一些实施方案中,衣壳蛋白具有AAV血清型9。
待在宿主细胞中培养以将rAAV载体包装在AAV衣壳中的组分可以反式提供给宿主细胞。替代地,所需组分(例如,重组AAV载体、rep序列、cap序列和/或辅助功能)中的任何一种或多种可由稳定的宿主细胞提供,所述稳定的宿主细胞已使用本领域技术人员已知的方法被工程化以含有所需组分中的一种或多种。最合适的是,此种稳定的宿主细胞将含有在诱导型启动子控制下的一种或多种所需组分。然而,一种或多种所需组分可能在组成型启动子的控制下。在讨论适合与转基因一起使用的调控元件时,本文提供了合适的诱导型和组成型启动子的实例。在另一个替代方案中,选定的稳定宿主细胞可含有在组成型启动子控制下的一种或多种选定组分和在一个或多个诱导型启动子控制下的一种或多种其他选定组分。例如,可产生稳定的宿主细胞,其衍生自293个细胞(其含有在组成型启动子控制下的E1辅助功能),但其含有在诱导型启动子控制下的rep和/或cap蛋白。本领域技术人员还可产生其他稳定的宿主细胞。
在一些实施方案中,本公开涉及含有核酸的宿主细胞,所述核酸包含编码转基因的编码序列(例如,融合至转录调控子结构域的DNA结合结构域)。在一些实施方案中,宿主细胞为哺乳动物细胞、酵母细胞、细菌细胞、昆虫细胞、植物细胞或真菌细胞。
生产本公开的rAAV所需的重组AAV载体、rep序列、cap序列和辅助功能可使用任何适当的遗传元件(载体)递送至包装宿主细胞。选定的遗传元件可通过任何合适的方法递送,包括本文所述的那些方法。用于构建本公开的任何实施方案的方法是核酸操纵技术人员已知的,并且包括基因工程、重组工程和合成技术。参见例如,Sambrook等人,MolecularCloning:A Laboratory Manual,Cold Spring Harbor Press,Cold Spring Harbor,N.Y。类似地,产生rAAV病毒粒子的方法是众所周知的,并且选择合适的方法不是对本公开的限制。参见例如,K.Fisher等人,J.Virol.,70:520-532(1993)和美国专利号5,478,745。
在一些实施方案中,重组AAV可使用三重转染方法(详细描述于美国专利号6,001,650中)生产。通常,重组AAV是通过用待包装成AAV颗粒、AAV辅助功能载体和辅助功能载体的AAV载体(包含侧翼为ITR元件的转基因)转染宿主细胞来生产的。AAV辅助功能载体编码“AAV辅助功能”序列(例如,rep和cap),其反式作用用于生产性AAV复制和包装。优选地,AAV辅助功能载体支持有效的AAV载体生产,而不产生任何可检测的野生型AAV病毒粒子(例如,含有功能性rep和cap基因的AAV病毒粒子)。适合与本公开一起使用的载体的非限制性实例包括描述于美国专利号6,001,650中的pHLP19和描述于美国专利号6,156,303中的pRep6cap6载体,两者的全部内容以引用的方式并入本文。辅助功能载体编码AAV复制所依赖的非AAV衍生病毒和/或细胞功能(例如,“辅助功能”)的核苷酸序列。辅助功能包括AAV复制所需的那些功能,包括但不限于参与AAV基因转录的激活、阶段特异性AAV mRNA剪接、AAVDNA复制、cap表达产物的合成和AAV衣壳组装的那些部分。基于病毒的辅助功能可源自任何已知的辅助病毒,诸如腺病毒、疱疹病毒(单纯疱疹病毒1型除外)和痘苗病毒。
在一些方面,本公开提供转染的宿主细胞。术语“转染”用于指细胞摄取外源DNA,并且当外源DNA被引入细胞膜内时,细胞已被“转染”。许多转染技术是本领域公知的。参见例如,Graham等人(1973)Virology,52:456;Sambrook等人(1989)Molecular Cloning,alaboratory manual,Cold Spring Harbor Laboratories,New York;Davis等人(1986)Basic Methods in Molecular Biology,Elsevier;和Chu等人(1981)Gene13:197。此类技术可用于将一种或多种外源核酸(诸如核苷酸整合载体和其他核酸分子)引入合适的宿主细胞。
“宿主细胞”是指携带或能够携带关注的物质的任何细胞。通常,宿主细胞为哺乳动物细胞。在一些实施方案中,宿主细胞为神经元,任选地为GABA能神经元。如本文所用,“GABA能神经元”为产生γ氨基丁酸(GABA)的神经细胞。在哺乳动物中,GABA是广泛分布在神经系统中的神经递质,它结合并抑制与其结合的神经元。因此,GABA与影响神经系统的许多病症有关,包括癫痫、自闭症和焦虑。对SCN1A半合子和敲除小鼠的研究观察到,脑中GABA能神经元存在严重的钠电流缺陷。宿主细胞可用作AAV辅助构建体、AAV小基因质粒、辅助功能载体或与重组AAV生产相关的其他转移DNA的受体。所述术语包括已被转染的原始细胞的子代。因此,如本文所用,“宿主细胞”可指已用外源DNA序列转染的细胞。应当理解,由于天然、偶然或有意突变,单个亲本细胞的子代可不必在形态或在基因组或总DNA互补序列上与原始亲本完全相同。
如本文所用,术语“细胞系”是指能够在体外连续或延长生长和分裂的细胞群。通常,细胞系是源自单个祖细胞的克隆种群。本领域进一步已知,在此类克隆种群的储存或转移期间,核型可发生自发或诱导的变化。因此,源自所指细胞系的细胞可与祖先细胞或培养物不完全相同,并且所指细胞系包括此类变体。
如本文所用,术语“重组细胞”是指已引入外源DNA片段(诸如导致生物活性多肽转录或生物活性核酸诸如RNA产生的DNA片段)的细胞。
如本文所用,术语“载体”包括任何遗传元件,诸如质粒、噬菌体、转座子、粘粒、染色体、人工染色体、病毒、病毒粒子等,其在与适当的控制元件相关联时能够复制并且其可在细胞之间转移基因序列。在一些实施方案中,载体为病毒载体,诸如rAAV载体、慢病毒载体、腺病毒载体、逆转录病毒载体等。因此,所述术语包括克隆和表达载体,以及病毒载体。在一些实施方案中,设想有用的载体是其中待转录的核酸片段位于启动子的转录控制下的那些载体。
“启动子”是指由需要启动基因的特异性转录的细胞的合成机械或引入的合成机械识别的DNA序列。短语“可操作地连接的”、“可操作地定位”、“受控”或“受转录控制”意指启动子相对于核酸处于正确的位置和方向,以控制RNA聚合酶的起始和基因的表达。术语“表达载体或构建体”意指含有核酸的任何类型的遗传构建体,其中核酸编码序列中的部分或全部能够被转录。在一些实施方案中,表达包括核酸的转录,以例如从转录的基因产生生物活性多肽产物。用于将重组载体包装在所需AAV衣壳中以产生本公开的rAAV的前述方法并不意味着是限制性的,并且其他合适的方法对于技术人员来说将是显而易见的。
用于调控靶基因表达的方法
本公开提供了用于调控细胞或受试者中基因表达的方法。方法通常涉及向细胞或受试者施用分离的核酸或rAAV,所述核酸或rAAV包含编码包含DNA结合结构域(例如,ZFP结构域)和反式激活结构域的融合蛋白的转基因。在一些实施方案中,融合蛋白包含ZFP和VP64反式激活因子。在一些实施方案中,融合蛋白包含ZFP和p65反式激活因子。在一些实施方案中,融合蛋白包含ZFP和RTA反式激活因子。在一些实施方案中,融合蛋白包含ZFP和VPR反式激活因子。在一些实施方案中,方法涉及向细胞或受试者施用dCas9蛋白和靶向SCN1A的至少一种指导核酸(例如,包含SEQ ID NO:83-94中的任一个或由SEQ ID NO:83-94中的任一个编码的指导核酸)。
在一些实施方案中,向细胞或受试者施用编码融合蛋白(例如,包含反式激活因子的融合蛋白)的分离的核酸或rAAV导致靶基因(例如,SCN1A)的表达增加。因此,在一些实施方案中,本公开所述的组合物和方法可用于治疗由靶基因单倍体不足引起的病状,诸如由SCN1A基因单倍体不足引起的德拉韦综合征(Dravet syndrome)。
如本文所用,“单倍体不足”是指其中基因(例如SCN1A)的一个拷贝例如通过基因突变而失活、或缺失,并且基因的剩余功能拷贝不足以产生足以维持基因正常功能的基因产物量的遗传病状。
德拉韦综合征(也称为婴儿严重肌阵挛性癫痫)是通常出现在生命的前三年的罕见的终生癫痫。德拉韦综合征的特点是长时间且频繁的癫痫发作、行为和发育迟缓、运动和平衡问题、语言和言语迟缓问题以及自主神经系统紊乱。在一些实施方案中,受试者患有与德拉韦综合征相关联的单倍体不足,诸如SCN1A基因的一个拷贝发生突变,从而导致细胞或受试者中SCN1A蛋白减少。大多数德拉韦综合征患者携带被翻译成截短的蛋白质的SCN1A突变;与德拉韦综合征相关的其他SCN1A突变,包括剪接位点和错义突变,以及随机分布在整个SCN1A基因中的突变。在一些实施方案中,本公开的融合蛋白包含特异性靶向(例如,结合)SCN1A基因的ZFP结构域以及反式激活结构域。在一些实施方案中,用于靶向SCNA1的组合物包含(i)包含dCas蛋白和反式激活结构域的融合蛋白,和(ii)特异性靶向(例如,结合)SCN1A基因的指导核酸(例如,gRNA)。
在一些实施方案中,受试者患有与MED13L单倍体不足综合征相关联的单倍体不足,其中受试者仅具有MED13L基因的单个功能拷贝。患有MED13L单倍体不足综合征的受试者通常在MED13L基因的第二个非功能拷贝中具有突变。MED13L单倍体不足综合征的特征是智力障碍、言语问题、独特的面部特征和发育迟缓。在一些实施方案中,本公开的融合蛋白包含特异性靶向(例如,结合)MED13L基因的ZFP结构域以及反式激活结构域。在一些实施方案中,用于靶向MED13L的组合物包含(i)包含dCas蛋白和反式激活结构域的融合蛋白,和(ii)特异性靶向(例如,结合)MED13L基因的指导核酸(例如,gRNA)。
在一些实施方案中,受试者患有与骨髓增生异常综合征相关联的单倍体不足。患有骨髓增生异常综合征的受试者通常在异柠檬酸脱氢酶1(IDH1)、异柠檬酸脱氢酶2(IDH2)和/或GATA2基因的一个拷贝中具有突变。骨髓增生异常综合征是骨髓中的未成熟血细胞不成熟为健康血细胞的一组癌症。有时,此种综合征可导致急性髓系白血病。在一些实施方案中,本公开的融合蛋白包含特异性靶向(例如,结合)IDH1基因的ZFP结构域以及反式激活结构域。在一些实施方案中,用于靶向IDH1的组合物包含(i)包含dCas蛋白和反式激活结构域的融合蛋白,和(ii)特异性靶向(例如,结合)IDH1基因的指导核酸(例如,gRNA)。在一些实施方案中,本公开的融合蛋白包含特异性靶向(例如,结合)IDH2基因的ZFP结构域以及反式激活结构域。在一些实施方案中,用于靶向IDH2的组合物包含(i)包含dCas蛋白和反式激活结构域的融合蛋白,和(ii)特异性靶向(例如,结合)IDH2基因的指导核酸(例如,gRNA)。在一些实施方案中,本公开的融合蛋白包含特异性靶向(例如,结合)GATA2基因的ZFP结构域以及反式激活结构域。在一些实施方案中,用于靶向GATA2的组合物包含(i)包含dCas蛋白和反式激活结构域的融合蛋白,和(ii)特异性靶向(例如,结合)GATA2基因的指导核酸(例如,gRNA)。
在一些实施方案中,受试者患有与狄乔治综合征(DiGeorge syndrome)相关联的单倍体不足。患有狄乔治综合征的受试者通常在22号染色体中间的称为22q11.2的位置有30至40个基因的缺失。特别地,所述疾病的特征可能是TBX基因的单倍体不足。狄乔治综合征的特征是先天性心脏问题、特定面部特征、频繁感染、发育迟缓、学习问题和腭裂。在一些实施方案中,本公开的融合蛋白包含特异性靶向(例如,结合)TBX基因的ZFP结构域以及反式激活结构域。在一些实施方案中,用于靶向TBX的组合物包含(i)包含dCas蛋白和反式激活结构域的融合蛋白,和(ii)特异性靶向(例如,结合)TBX基因的指导核酸(例如,gRNA)。
在一些实施方案中,受试者患有与CHARGE综合征相关联的单倍体不足。在大多数情况下,患有CHARGE综合征的受试者对CHD7基因单倍体不足。CHARGE综合征的特征是眼缺损、心脏缺陷、后鼻孔闭锁、生长和/或发育迟缓、生殖器和/或泌尿系统异常、以及耳部异常和耳聋。在一些实施方案中,本公开的融合蛋白包含特异性靶向(例如,结合)CHD7基因的ZFP结构域以及反式激活结构域。在一些实施方案中,用于靶向CHD7的组合物包含(i)包含dCas蛋白和反式激活结构域的融合蛋白,和(ii)特异性靶向(例如,结合)CHD7基因的指导核酸(例如,gRNA)。
在一些实施方案中,受试者患有与埃勒斯-当洛综合征(Ehlers–Danlossyndrome)相关联的单倍体不足。患有埃勒斯-当洛综合征的受试者可对COL1A1、COL1A2、COL3A1、COL5A1、COL5A2、TNXB、ADAMTS2、PLOD1、B4GALT7、DSE和/或D4ST1/CHST14基因单倍体不足。埃勒斯-当洛综合征的特征是皮肤弹性过大,并且可导致主动脉夹层、脊柱侧弯和早发性骨关节炎。在一些实施方案中,本公开的融合蛋白包含特异性靶向(例如,结合)COL1A1、COL1A2、COL3A1、COL5A1、COL5A2、TNXB、ADAMTS2、PLOD1、B4GALT7、DSE或D4ST1/CHST14基因中的任一个的ZFP结构域以及反式激活结构域。在一些实施方案中,用于靶向COL1A1、COL1A2、COL3A1、COL5A1、COL5A2、TNXB、ADAMTS2、PLOD1、B4GALT7、DSE或D4ST1/CHST14中的任一个的组合物包含(i)包含dCas蛋白和反式激活结构域的融合蛋白,和(ii)特异性靶向(例如,结合)COL1A1、COL1A2、COL3A1、COL5A1、COL5A2、TNXB、ADAMTS2、PLOD1、B4GALT7、DSE或D4ST1/CHST14基因中的任一个的指导核酸(例如,gRNA)。
在一些实施方案中,受试者患有与额颞痴呆相关联的单倍体不足。患有FTD的受试者对编码Tau蛋白的MAPT基因和/或GRN基因单倍体不足。FTD的特征是记忆力减退、缺乏社会意识、冲动控制能力差和言语困难。在一些实施方案中,本公开的融合蛋白包含特异性靶向(例如,结合)MAPT基因的ZFP结构域以及反式激活结构域。在一些实施方案中,用于靶向MAPT的组合物包含(i)包含dCas蛋白和反式激活结构域的融合蛋白,和(ii)特异性靶向(例如,结合)MAPT基因的指导核酸(例如,gRNA)。在一些实施方案中,本公开的融合蛋白包含特异性靶向(例如,结合)GRN基因的ZFP结构域以及反式激活结构域。在一些实施方案中,用于靶向GRN的组合物包含(i)包含dCas蛋白和反式激活结构域的融合蛋白,和(ii)特异性靶向(例如,结合)GRN基因的指导核酸(例如,gRNA)。
在一些实施方案中,受试者患有与霍尔特-奥拉姆综合征(Holt–Oram syndrome)相关联的单倍体不足。患有霍尔特-奥拉姆综合征的受试者对TBX5基因单倍体不足。霍尔特-奥拉姆综合征的特征是心脏并发症,包括先天性心脏缺陷和心脏传导疾病。在一些实施方案中,本公开的融合蛋白包含特异性靶向(例如,结合)TBX5基因的ZFP结构域以及反式激活结构域。在一些实施方案中,用于靶向TBX5的组合物包含(i)包含dCas蛋白和反式激活结构域的融合蛋白,和(ii)特异性靶向(例如,结合)TBX5基因的指导核酸(例如,gRNA)。
在一些实施方案中,受试者患有与马凡综合征(Marfan syndrome)相关联的单倍体不足。患有马凡综合征的受试者通常对编码fibrillin-1蛋白的FBN1基因单倍体不足。马凡综合征的特征是肢体长度不成比例、早发性关节炎、心脏并发症和/或自主神经系统功能障碍。在一些实施方案中,本公开的融合蛋白包含特异性靶向(例如,结合)FBN1基因的ZFP结构域以及反式激活结构域。在一些实施方案中,用于靶向FBN1的组合物包含(i)包含dCas蛋白和反式激活结构域的融合蛋白,和(ii)特异性靶向(例如,结合)FBN1基因的指导核酸(例如,gRNA)。
本公开部分地基于向受试者施用如本文所述的融合蛋白的方法。在一些实施方案中,融合蛋白包含DBD和转录激活因子。在一些实施方案中,DBD为ZNF、TALE、dCas蛋白(例如,dCas9或dCas12a)或与SCN1A基因结合的同源结构域。在一些实施方案中,转录激活因子为VP64、p65、RTA或包含VP64-p65-RTA(VPR)的三元转录激活因子。在一些实施方案中,融合蛋白的侧翼为AAV反向末端重复(ITR)序列。在一些实施方案中,融合蛋白可操作地连接到启动子。在一些实施方案中,受试者患有或疑似患有导致SCN1A蛋白质单倍体不足的SCN1A突变。在一些实施方案中,受试者患有或疑似患有德拉韦综合征。
在一些方面,本公开提供了调节(例如,增加、减少等)细胞中靶基因表达的方法。在一些实施方案中,本公开提供了增加细胞中靶基因(例如,SCN1A)表达的方法。在一些实施方案中,细胞为哺乳动物细胞。在一些实施方案中,细胞在受试者中(例如,在体内)。在一些实施方案中,受试者为哺乳动物受试者,例如人。在一些实施方案中,细胞为神经系统细胞(中枢神经系统细胞或外周神经系统细胞),例如神经元(例如,GABA能神经元、单极神经元、双极神经元、篮细胞、Betz细胞、Lugaro细胞、棘神经元、浦肯野细胞、金字塔神经细胞(Pyrimidal cell)、伦肖细胞(Renshaw cell)、颗粒细胞、运动神经元、梭形细胞等)或神经胶质细胞(例如,星形胶质细胞、少突胶质细胞、室管膜细胞、放射状胶质细胞、雪旺氏细胞、卫星细胞等)。
在“正常”细胞或受试者中,靶基因(例如,SCN1A)的表达足以使得细胞或受试者关于靶基因(例如,SCN1A)不是单倍体不足的。在一些实施方案中,相对于未施用如本文所述的一种或多种分离的核酸、rAAV或组合物的细胞或受试者中转基因的表达或活性,测量转基因的“改善的”或“增加的”表达或活性。在一些实施方案中,相对于在向受试者施用(例如,在施用前和施用后测量基因表达)如本文所述的一种或多种分离的核酸、rAAV或组合物后受试者中转基因的表达或活性,测量转基因的“改善的”或“增加的”表达或活性。例如,在一些实施方案中,相对于未施用编码融合ZFP反式激活因子的转基因的细胞或受试者,测量细胞或受试者中SCN1A的“改善的”或“增加的”表达。在一些实施方案中,本公开所述的方法导致相对于未施用本公开所述的一种或多种组合物的受试者的SCN1A表达和/或活性,受试者中SCN1A表达和/或活性增加2倍至100倍(例如,2倍、5倍、10倍、50倍、100倍等)。
如本文所用,术语“治疗(treatment/treating)”和“疗法”是指治疗性治疗和预防性(prophylactic/preventative)操作。所述术语还包括改善现有症状、预防另外的症状、改善或预防症状的根本原因、预防或逆转症状的原因,例如与单倍体不足基因(例如,单倍体不足SCN1A基因)相关的症状。因此,所述术语表示已将有益结果赋予患有病症(例如,与单倍体不足基因相关的疾病或病状,例如,德拉韦综合征)或具有发展此种病症的潜力的受试者。此外,术语“治疗”还包括将剂(例如,治疗剂或治疗组合物,例如靶向或结合靶基因或靶基因的调控区的分离的核酸或rAAV)应用或施用于受试者或来自受试者的分离组织或细胞系,所述受试者可能患有疾病、疾病症状或疾病倾向,其目的是治疗、治愈、缓解、减少、改变、补救、缓和、改善或影响疾病、疾病症状或疾病倾向。
治疗剂或治疗组合物可包括药学上可接受形式的化合物,其防止和/或减少特定疾病(例如,与单倍体不足基因相关的疾病或病状,例如德拉韦综合征)的症状。例如,治疗组合物可为防止和/或减少与单倍体不足基因相关的疾病或病状(例如,德拉韦综合征)的症状的药物组合物。设想本发明的治疗组合物将以任何合适的形式提供。治疗组合物的形式将取决于许多因素,包括如本文所述的施用模式。治疗组合物可含有稀释剂、佐剂和赋形剂以及如本文所述的其他成分。
施用模式
可根据本领域已知的任何适当方法将本公开的分离的核酸、rAAV和组合物以组合物形式递送至受试者。例如,可将优选地悬浮在生理相容载剂中(例如,组合物中)的rAAV施用于受试者,即宿主动物,诸如人、小鼠、大鼠、猫、狗、绵羊、兔、马、牛、山羊、猪、豚鼠、仓鼠、鸡、火鸡或非人灵长类动物(例如,猕猴)。在一些实施方案中,宿主动物不包括人。
将rAAV递送至哺乳动物受试者可通过例如肌肉内注射或通过施用至哺乳动物受试者的血流中。可通过注射到静脉、动脉或任何其他血管导管中来施用到血流中。在一些实施方案中,通过隔离肢体灌注将rAAV施用到血流中,这是外科领域众所周知的技术,所述方法基本上使技术人员能够在施用rAAV病毒粒子之前将肢体与体循环隔离。描述于美国专利号6,177,403中的隔离肢体灌注技术的变体也可由技术人员用来将病毒粒子施用到隔离肢体的脉管系统中,以潜在地增强向肌肉细胞或组织中的转导。此外,在某些情况下,可能需要将病毒粒子递送至受试者的CNS。“CNS”意指脊椎动物脑和脊髓的所有细胞和组织。因此,所述术语包括但不限于神经元细胞、神经胶质细胞、星形胶质细胞、脑脊液(CSF)、间隙空间、骨、软骨等。可通过使用本领域已知的神经外科技术,用针、导管或相关装置将重组AAV注射到例如心室区以及纹状体(例如,纹状体的尾状核或壳核)、丘脑、脊髓和神经肌肉接头或小脑小叶来直接递送至CNS或大脑,所述外科技术诸如通过立体定向注射(参见例如,Stein等人,J Virol 73:3424-3429,1999;Davidson等人,PNAS 97:3428-3432,2000;Davidson等人,Nat.Genet.3:219-223,1993;以及Alisky和Davidson,Hum.Gene Ther.11:2315-2329,2000)。在一些实施方案中,通过静脉内注射施用如本公开所述的rAAV。在一些实施方案中,通过脑内注射施用rAAV。在一些实施方案中,通过鞘内注射施用rAAV。在一些实施方案中,通过纹状体内注射施用rAAV。在一些实施方案中,通过颅内注射递送rAAV。在一些实施方案中,通过大池注射递送rAAV。在一些实施方案中,通过脑侧脑室注射递送rAAV。
本公开的方面涉及包含重组AAV的组合物,所述重组AAV包含衣壳蛋白和编码转基因的核酸,其中转基因包含编码一种或多种蛋白质的核酸序列。在一些实施方案中,核酸还包含AAV ITR。在一些实施方案中,组合物还包含药学上可接受的载剂。
本公开的组合物可包含单独的rAAV或与一种或多种其他病毒的组合的rAAV(例如,编码具有一种或多种不同转基因的第二rAAV)。在一些实施方案中,组合物包含1、2、3、4、5、6、7、8、9、10种或更多种不同的rAAV,其各自具有一种或多种不同的转基因。
鉴于rAAV所针对的适应症,本领域技术人员可容易地选择合适的载剂。例如,一种合适的载剂包括盐水,其可与多种缓冲溶液(例如,磷酸盐缓冲盐水)一起配制。其他示例性载剂包括无菌盐水、乳糖、蔗糖、磷酸钙、明胶、葡聚糖、琼脂、果胶、花生油、芝麻油和水。载剂的选择并不是对本公开的限制。
任选地,除了rAAV和一种或多种载剂之外,本公开的组合物还可含有其他常规药物成分,诸如防腐剂或化学稳定剂。合适的示例性防腐剂包括氯丁醇、山梨酸钾、山梨酸、二氧化硫、没食子酸丙酯、对羟基苯甲酸酯、乙基香兰素、甘油、苯酚、对氯苯酚和泊洛沙姆(非离子表面活性剂)诸如
Figure BDA0003265335870000401
F-68。合适的化学稳定剂包括明胶和白蛋白。
以足够量施用rAAV,以转染所需组织的细胞,并提供足够水平的基因转移和表达,而不产生过度的副作用。常规和药学上可接受的施用途径包括但不限于直接递送至所选器官(例如,经门静脉递送至肝脏)、口服、吸入(包括鼻内和气管内递送)、眼内、静脉内、肌肉内、皮下、皮内、瘤内和其他肠胃外施用途径。如果需要,可组合施用途径。
实现特定“治疗效果”所需的rAAV病毒粒子的剂量(例如,基因组拷贝数/每千克体重(GC/kg)的剂量单位)将根据多种因素而变化,所述因素包括但不限于:rAAV病毒粒子施用的途径、实现治疗效果所需的基因或RNA表达水平、所治疗的特定疾病或病症以及基因或RNA产物的稳定性。本领域技术人员可基于上述因素以及本领域众所周知的其他因素容易地确定治疗患有特定疾病或病症的患者的rAAV病毒粒子剂量范围。
rAAV的有效量为足以靶向感染动物、靶向所需组织的量。在一些实施方案中,在溶酶体贮积疾病的症状前阶段向受试者施用有效量的rAAV。在一些实施方案中,溶酶体贮积疾病的症状前阶段发生在出生(例如,围产期)与4周龄之间。
在一些实施方案中,配制rAAV组合物以减少组合物中AAV颗粒的聚集,特别是在存在高rAAV浓度(例如,约1013GC/mL或更高)的情况下。用于减少rAAV聚集的方法是本领域众所周知的,并且包括例如添加表面活性剂、pH调节、盐浓度调节等。(参见例如,Wright FR等人,Molecular Therapy(2005)12,171–178,其内容以引用的方式并入本文。)
本领域技术人员熟知药学上可接受的赋形剂和载剂溶液的配方,以及用于在各种治疗方案中使用本文所述的特定组合物的合适剂量和治疗方案的开发。
通常,这些制剂可含有至少约0.1%的活性化合物或更多,尽管一种或多种活性成分的百分比当然可变化,并且可方便地在总制剂重量或体积的约1%或2%和约70%或80%或更多之间。自然地,每种治疗上有用的组合物中活性化合物的量可以这样的方式制备,即在化合物的任何给定单位剂量中将获得合适的剂量。制备此类药物制剂领域的技术人员将设想诸如溶解度、生物利用度、生物半衰期、施用途径、产品保质期以及其他药理学考虑的因素,并且因此,多种剂量和治疗方案可为希望的。
在某些情况下,需要通过皮下、胰内、鼻内、肠胃外、静脉内、肌肉内、鞘内或口服、腹膜内或通过吸入递送本文公开的适当配制的药物组合物中的基于rAAV的治疗构建体。在一些实施方案中,如描述于美国专利号5,543,158;5,641,515和5,399,363(各自以引用的方式整体具体并入本文)中的施用模式可用于递送rAAV。在一些实施方案中,优选的施用模式为通过门静脉注射。
适于注射使用的药物剂型包括无菌水性溶液或分散剂以及用于临时制备无菌可注射溶液或分散剂的无菌粉末。分散体也可在甘油、液态聚乙二醇及其混合物和在油中制备。在普通的储存和使用条件下,这些制剂含有防腐剂以防止微生物的生长。在许多情况下,所述形式为无菌的且为易于注射的流体。在制造和储存条件下,所述组合物必须稳定且必须在贮存中防止诸如细菌和真菌的微生物的污染作用。载剂可为溶剂或分散介质,其含有例如水、乙醇、多元醇(例如,甘油、丙二醇和液态聚乙二醇等)、其合适的混合物和/或植物油。例如,可通过包衣(诸如卵磷脂)的使用、通过维持所需的粒子大小(在分散体的情况下)以及通过使用表面活性剂来维持适当的流动性。防止微生物作用可通过各种抗细菌和抗真菌剂(例如对羟基苯甲酸酯、氯丁醇、苯酚、山梨酸、硫柳汞(thimerosal)等)来达成。在许多情况下,将为优选的是包括等张剂,例如糖或氯化钠。延长可注射组合物的吸收可通过在组合物中使用延迟吸收的剂(例如单硬脂酸铝和明胶)来达成。
例如,对于施用可注射水溶液,如果需要,可适当地缓冲溶液,并且首先使液体稀释剂与足够的盐水或葡萄糖等渗。这些特定的水溶液特别适用于静脉内、肌肉内、皮下和腹膜内施用。在此方面,可使用的无菌水介质是本领域技术人员已知的。例如,可将一个剂量溶解于1mL等渗NaCl溶液中,然后添加到1000mL皮下输液中或在提议的输液部位注射,(参见例如,″Remington's Pharmaceutical Sciences″第15版,第1035-1038和1570-1580页)。取决于宿主的状况,剂量必然将存在一定的变化。在任何情况下,负责施用的人将决定各个宿主的适当剂量。
无菌可注射溶液是通过将活性rAAV以所需量在必要时与本文列举的各种其它成分一起并入适当溶剂中,随后进行过滤灭菌来制备。通常,通过将多种灭菌活性成分并入含有碱性分散介质和来自上文所列举那些成分的所需其它成分的无菌媒剂中来制备分散体。在用于制备无菌可注射溶液的无菌粉末的情况下,优选的制备方法是真空干燥技术和冷冻干燥技术,由此产生活性成分外加来自其先前无菌过滤溶液的任何额外所需成分的粉末。
本文公开的rAAV组合物也可配制成中性或盐形式。药学上可接受的盐包括与例如像氢氯酸或磷酸的无机酸或诸如乙酸、草酸、酒石酸、扁桃酸等的有机酸形成的酸加成盐(用蛋白质的游离氨基形成的)。用游离羧基形成的盐也可源自例如像氢氧化钠、氢氧化钾、氢氧化铵、氢氧化钙或氢氧化铁的无机碱和诸如异丙胺、三甲胺、组氨酸、普鲁卡因等的有机碱。当配制时,将以与剂量制剂相容的方式且以治疗有效量施用溶液。制剂是以诸如可注射溶液剂、药物释放胶囊剂等的多种剂型容易地施用。
如本文所用,“制剂”包括任何和全部溶剂、分散介质、媒介物、包衣、稀释剂、抗菌剂和抗真菌剂、等渗剂和吸收延迟剂、缓冲剂、载剂溶液、悬浮剂、胶体等。用于药物活性物质的此类介质和剂的用途是本领域众所周知的。补充活性成分也可并入组合物中。短语“药学上可接受的”是指当施用于宿主时不产生过敏或类似不良反应的分子实体和组合物。
诸如脂质体、纳米胶囊、微粒、微球、脂质颗粒、囊泡等的递送媒介物可用于将本公开的组合物引入到合适的宿主细胞中。特别地,rAAV载体递送的转基因可被配制用于封装在脂质颗粒、脂质体、囊泡、纳米球或纳米颗粒等中递送。
此类制剂可优选用于引入本文公开的核酸或rAAV构建体的药学上可接受的制剂。脂质体的形成和使用通常是本领域技术人员已知的。最近,脂质体的开发提高了血清稳定性和循环半衰期(美国专利号5,741,516)。此外,已描述了脂质体和脂质体样制剂作为潜在药物载剂的各种方法(美国专利号5,567,434;5,552,157;5,565,213;5,738,868和5,795,587)。
脂质体已成功用于通常对通过其他程序的转染具有抗性的许多细胞类型。另外,脂质体不受基于病毒的递送系统典型的DNA长度限制。脂质体已被有效地用于将基因、药物、放射治疗剂、病毒、转录因子和变构效应物引入多种培养的细胞系和动物中。另外,已经完成了检查脂质体介导的药物递送有效性的几项成功的临床试验。
脂质体由分散在水介质中并自发形成多层同心双层囊泡(也称为多层囊泡(MLV))的磷脂形成。MLV通常具有25nm至4μm的直径。MLV的超声处理导致形成核心中含有水溶液的直径在
Figure BDA0003265335870000441
Figure BDA0003265335870000443
Figure BDA0003265335870000442
范围内的小单层囊泡(SUV)。
替代地,可使用rAAV的纳米胶囊制剂。纳米胶囊通常可以稳定且可重复的方式捕获物质。为避免由于细胞内聚合物过载而产生副作用,应使用能够在体内降解的聚合物来设计此类超细颗粒(大小为约0.1μm)。设想使用满足这些要求的可生物降解的聚氰基丙烯酸烷基酯纳米颗粒。
除了上述递送方法之外,还设想以下技术作为将rAAV组合物递送至宿主的替代方法。超声波导入术(即超声波)已在美国专利号5,656,016号中作为提高药物渗透进入和穿过循环系统的速度和功效的装置使用和描述。设想的其他药物递送替代方案为骨内注射(美国专利号5,779,708)、微芯片装置(美国专利号5,797,898)、眼用制剂(Bourlais等人,1998)、透皮基质(美国专利号5,770,219和5,783,208)和反馈控制递送(美国专利号5,697,899)。
实施例
实施例1.上调SCN1A基因表达的锌指蛋白的设计
人(HEK293T细胞)和小鼠(HEPG2细胞)SCN1A启动子序列之间的同源区通过对在RIKEN CAGE-seq数据集中鉴定的每个物种的两个突出转录起始位点周围的序列进行比对来鉴定(图1)。人(HEK)和小鼠(HEPG2)之间的高度保守序列存在于SCN1A的近端启动子区中(图2)。由六个指组成的三个ZFP被设计为通过组装具有预定义DNA结合特异性的一个指和两个指模块来结合SCN1A近端启动子区中重叠的15-22个核苷酸同源区(图3)。各自由六个指组成的三个ZFP(ZFP1-ZFP3)被设计成结合图3中鉴定的重叠的高度保守序列。每个指被设计为结合SCN1A近端启动子的高度保守区中的三个碱基区(三联体)。
ZFP-1识别SCN1A基因(SEQ ID NO:2)的近端启动子区中的单独的三个碱基区(以红色表示的DNA三联体,通过“·”分隔),如图4A所示。ZFP-1的指1至6的每个识别螺旋(七个氨基酸)结合三个核苷酸序列,如图4B所示。ZFP-1(SEQ ID NO:17-22)的六个指的氨基酸序列在图4C中示出;指之间的接头被突出显示以指定经典(TGEKP)和非经典(TGSQKP)接头序列。ZFP-1(SEQ ID NO:11-16)的六个指的核苷酸序列在图4D中示出。
表1.靶向SCN1A的ZFP-1识别螺旋
Figure BDA0003265335870000451
ZFP-2识别SCN1A基因(SEQ ID NO:3)的近端启动子区中的单独的三个碱基区(以红色表示的DNA三联体,通过“·”分隔),如图5A所示。ZFP-2的指1至6的每个识别螺旋(七个氨基酸)结合三个核苷酸序列,如图5B所示。ZFP-2(SEQ ID NO:29-34)的六个指的氨基酸序列在图5C中示出;指之间的接头被突出显示以指定经典(TGEKP)和非经典(TGSQKP)接头序列。ZFP-1(SEQ ID NO:23-28)的六个指的核苷酸序列在图5D中示出。
表2.靶向SCN1A的ZFP-2识别螺旋
Figure BDA0003265335870000461
ZFP-3识别SCN1A基因(SEQ ID NO:4)的近端启动子区中的单独的三个碱基区(以红色表示的DNA三联体,通过“·”分隔),如图6A所示。ZFP-3的指1至6的每个识别螺旋(七个氨基酸)结合三个核苷酸序列,如图6B所示。ZFP-3(SEQ ID NO:41-46)的六个指的氨基酸序列在图6C中示出;指之间的接头被突出显示以指定经典(TGEKP)和非经典(TGSQKP)接头序列。ZFP-1(SEQ ID NO:35-40)的六个指的核苷酸序列在图6D中示出。
表3.靶向SCN1A的ZFP-3识别螺旋
Figure BDA0003265335870000462
Figure BDA0003265335870000471
经设计来靶向SCN1A基因近端启动子区中保守序列的另外的ZFP将各自包含五个或六个指结构域,并将与在人和小鼠SCN1A之间高度保守的15-22个核苷酸的区结合。
表4.靶向SCN1A的锌指蛋白
Figure BDA0003265335870000472
Figure BDA0003265335870000481
实施例2.ZFP增加人细胞中SCN1A基因的表达
为了检查ZFP1-ZFP3上调SCN1A转录的能力,将ZFP1-ZFP3DNA结合结构域与杂交VP64、p53和RTA(VPR)三元强转录激活因子结构域融合以形成嵌合反式激活因子。VPR融合激活因子结构域用于募集转录调控复合物并增加染色质可及性,并且有助于实现高水平的基因表达。因此,ZFP结构域将VPR激活因子靶向至近端启动子区中的高度保守序列,以增加SCN1A基因表达。
通过瞬时转染将编码VPR-ZFP1、VPR-ZFP2和/或VPR-ZFP3融合蛋白的表达质粒转染到HEK293细胞中,并且通过qRT-PCR(使用TBP表达作为归一化参考)测量SCN1A基因表达。VPR-ZFP融合包含融合到VPR的ZFP1、ZFP2和/或ZFP3。含有各自融合到VPR的ZFP1、ZFP2和ZFP3 DNA结合结构域的用于多重调控的三种构建体的转染导致SCN1A基因表达相对于未转染细胞增加45倍,这表明VPR-ZFP嵌合反式激活因子能够通过结合在基因的启动子近端区中来增加SCN1A基因表达(图7)。
VPR-[ZFP1-ZFP3]融合蛋白以及其中目前正在设计ZFP DNA结合结构域的VPR-ZFP融合蛋白正在HeLa和HEPG2细胞中转染,这两种细胞都具有低水平的SCN1A表达。VPR-ZFP融合蛋白含有融合到VPR反式激活因子的单个ZFP DNA结合结构域以及多个ZFP DNA结合结构域的组合。通过qRT-PCR测量SCN1A基因表达,以确定这些VPR-ZFP融合是否能够增加基因表达。在腺相关病毒(AAV)递送融合蛋白后,在原代小鼠皮层神经元中测试最有希望的VPR-ZFP融合候选物的增加SCN1A表达的能力。
正在使用细菌单杂交选择系统进一步优化ZFP结构域的特异性(参见例如,Meng等人,“Targeted gene inactivation in zebrafish using engineered zinc-fingernucleases,”Nat Biotechnol,2008),以从随机文库中鉴定理想的ZFP,其中对DNA结合重要的残基是不同的。新选择的ZFP将与VPR反式激活因子结构域融合,无论是单独的ZFP还是多个ZFP的组合,并在HEK293、HeLa和HEPG2细胞以及原代小鼠皮层神经元中转染,以鉴定在qRT-PCR分析后最能增加SCN1A基因表达的候选ZFP结构域。
实施例3.生成具有不同效力的ZFPSCN1A反式激活因子系列
实施例2中上调SCN1A基因表达的最有效ZFP融合至具有预期效力的梯度的一系列人反式激活结构域(例如,Rta、p65、Hsf1等),以鉴定在AAV感染复数(MOI)范围内实现SCN1A基因表达2倍上调的组装。用表达ZFPSCN1A融合反式激活因子的AAV载体感染来自正常和SCN1A+/-小鼠的小鼠原代皮层神经元。NaV1.1蛋白的表达水平通过使用蛋白质印迹和qPCR进行评估。用TGF-α处理8小时的原代神经元用作阳性对照,因为该处理使NaV1.1蛋白表达增加约6至8倍(Chen等人,2015,Neuroinflammation 12:126)。还评估了其他NaVα亚基基因表达水平的变化,以证明ZFPSCN1A反式激活的特异性。免疫荧光用于通过针对ZFPSCN1A(HA标签)和对GABA能神经元具有特异性的标志物(例如,小白蛋白+或生长抑素+)或通用神经元标志物(例如,NeuN、TUBIII和/或Map2)的抗体的双重免疫荧光染色来确定NaV1.1表达是否仍然局限于GABA能中间神经元。ZFPSCN1A对SCN1A基因反式激活的特异性也通过ChIP-Seq和RNA-Seq进行评估,以绘制基因组结合位点和基因转移后产生的转录组增殖。
实施例4.指导启动子活性依赖性SCN1A-ZFP反式激活因子的设计的GABA能抑制剂中SCN1A启动子的组蛋白组织和表观基因组的图谱
ZFP结合基因组靶点的能力取决于靶序列的可及性(例如,无核小体区的存在)。对DNA可及性的这一要求被用来设计ZFP反式激活因子,所述ZFP反式激活因子仅在基于DNA靶序列可及性的存在的细胞类型子集中起作用。通过使用ZFP反式激活因子表达的组织特异性启动子实现对细胞类型活性的另外限制。来自河豚(红鳍东方鲀(Takifugu rubripes))生长抑素和神经肽Y基因的小启动子已被证明在AAV载体和慢病毒的背景下驱动皮质和海马抑制性中间神经元中的高度特异性转基因表达。在一些实施方案中,对DNA可及性敏感的SCN1A特异性ZFP的基于AAV的转录限制的组合导致整个大脑中抑制性中间神经元中NaV1.1蛋白表达的高度特异性上调。该双重调控方法将最小化NaV1.1蛋白在正常情况下不表达的细胞中异位表达可能产生的副作用。
在小鼠和人GABA能抑制和谷氨酸能兴奋性神经元中分析了SCN1A启动子的核小体结构和表观遗传图谱。该信息用于通过靶向仅可在该细胞类型中的SCN1A基因座周围可及的序列来设计GABA能抑制性神经元限制性ZFP反式激活因子。
使用荧光激活细胞分选(FACS)分离在GAD67启动子下表达TdTomato的转基因小鼠的GABA能抑制神经元和通过Emx1-IRES-Cre与ROSA26/终止/EGFP小鼠杂交产生的GFP阳性谷氨酸兴奋性神经元。人GABA能和兴奋性神经元由诱导多能干细胞(iPS)细胞产生,并使用免疫染色和RT-PCR确认对这些细胞类型具有特异性的标志物以及电生理活性。使用转座酶可及染色质测定(ATAC-Seq)表征小鼠和人神经元群中SCN1A启动子周围的可及基因组区。
基于抑制性和兴奋性神经元中SCN1A启动子周围基因组区的差异染色质可及性设计识别仅在GABA能神经元中可及的序列的ZFPSCN1A反式激活因子。正在产生一系列候选ZFP-VPR反式激活因子融合,以靶向不同的SCN1A可及区,其中反式激活因子的结合有望有效上调抑制区中的NaV1.1表达,以及揭示兴奋性神经元中NaV1.1表达的任何不希望的诱导表达。
在模拟德拉韦综合征的培养的人iPS衍生神经元和小鼠SCN1A+/-原代神经元中进行表达研究,以确定经设计用于识别仅在抑制性神经元中可及的DNA序列的ZFPSCN1A反式激活因子在从泛神经元人突触蛋白1或抑制性中间神经元特异性启动子下的AAV载体表达时,是否提供必要的特异性。NaV1.1表达水平通过qRT-PCR、蛋白质印迹和双重免疫荧光测定,其具有抑制性GABA能(例如,GABA+、GAD65/67+、生长抑素和/或小白蛋白)和兴奋性谷氨酸能(例如,Cux1+、FoxG1,+、GABAA受体、GABA-)神经元的神经元类型特异性标志物。ZFPSCN1A反式激活因子的细胞类型特异性被设计为靶向小鼠和人SCN1A启动子中的不同序列,因为同线区内的染色质结构和DNA序列在物种之间不同。这些实验中的对照包括感染有类似AAV载体的神经元培养物,所述AAV载体编码GFP、不含反式激活结构域的ZFP或不含ZFP DNA结合结构域的反式激活因子。
微小RNA(miRNA)结合位点被并入ZFPSCN1A反式激活因子的3'非翻译区(3'UTR)中,所述反式激活因子仅限于其中发生不希望的表达的细胞类型(例如,谷氨酸能兴奋性神经元)。该方法先前用于限制AAV递送的转基因的表达(Xie等人,“MicroRNA-regulated,systematically delivered rAAV9:a step closer to CNS-restricted transgeneexpression,”Mol.Ther.2011)。GABA能抑制性神经元和其他细胞类型的miRNA表达谱的差异正在通过小RNA测序确定。
实施例5.评价AAV-ZFPSCN1A基因疗法纠正患者来源的iPS产生的GABA能中间神经元中钠电流缺陷的潜力
开发用于德拉韦综合征的一种或多种ZFPSCN1A反式激活因子的关键步骤是证明这些人工反式激活因子在人神经元中具有所需的功能。为此,正在获得来自德拉韦患者(n=4-6)和非德拉韦患者(n=4)的iPS细胞。非德拉韦遗传背景在这些细胞中得以表达,无需人工操纵基因表达,并且因此iPS细胞已成为生物医学研究的最先进细胞系。CRISPR-Cas9基因组编辑技术正用于通过将SCN1A中的遗传突变修复为野生型序列,或通过将德拉韦相关突变引入对照细胞系内的正常等位基因来创建等基因细胞系。因此,等基因系消除了因比较来自不同人受试者的细胞系而产生的自然可变性,并因此对于确认和增强疾病特异性表型具有价值。已建立的抑制性神经元分化方案和验证管道正用于将iPS细胞系分化为前脑GABA能抑制剂中间神经元。
如通过全细胞膜片钳电生理学测量确定,来自德拉韦患者的抑制性神经元表现出减少的钠电流和受损的动作电位放电。正在进行类似的测量,以确认本文所述的德拉韦衍生神经元概括了这些疾病相关表型。钠电流缺陷发生在抑制剂中,但不发生在德拉韦患者中的兴奋性神经元中(Sun等人),并且因此在本公开中仅使用抑制性神经元。德拉韦患者来源的抑制性神经元中突变诱导的钠通道缺陷可通过野生型SCN1A的异位表达来挽救(参考文献20)。因此,本公开中描述的方法适用于测试ZFPSCN1A反式激活因子在德拉韦综合征背景下恢复野生型钠通道功能和生理机能的功效。
GABA能抑制性神经元培养物在通用神经元或抑制性神经元特异性启动子下被编码ZFPSCN1A反式激活因子的AAV载体感染。正通过蛋白质印迹法评估NaV1.1表达水平的变化。与转染细胞相比,正通过未转染细胞的全细胞膜片钳来评估抑制性神经元中功能性钠电流的恢复。正在通过ChIP-seq分析所有患者来源的抑制性神经元内的基因组中ZFPSCN1A反式激活因子的结合,并与通过RNA-seq检测到的任何鉴定的转录组变化相关。这些实验中的对照为感染有类似AAV载体的神经元培养物,所述AAV载体编码GFP、不含VPR反式激活结构域的ZFP和不含ZFP DNA结合结构域的VPR反式激活因子结构域。
实施例6.评估AAV-ZFPSCN1A干预在SCN1A小鼠中不同年龄和递送途径下的治疗潜力
AAV的广泛趋向性是广泛表达基因的基因疗法应用的关键特性,但当关注的转基因以细胞类型特异性方式表达时,可能成为重大挑战。通过使用组织特异性启动子诸如甲状腺素结合蛋白(TBP)、肌酸激酶和肌钙蛋白T,分别在很大程度上解决了诸如肝脏、肌肉和心脏的身体中主要组织的这个问题。可将另外的控制水平叠加在组织特异性启动子上,以通过掺入在那些组织中高度丰富的微小RNA的结合位点的多个拷贝(诸如肝脏中的miR-122和骨骼肌中的miR-1)来实现从特定组织中更高程度的脱靶。在转导广泛的细胞类型的情况下,最近描述的AAV-PHP.B血清型对于全身递送后的CNS基因转移非常有效。此外,它对外周组织的趋向性在很大程度上与AAV9的趋向性一样广泛。德拉韦综合征的基因疗法方法的目标是完全恢复GABA能抑制性中间神经元中的NaV1.1表达,同时防止其他神经元和别处异位表达产生有害影响。在源自河豚(红鳍东方鲀)生长抑素(fSST)和神经肽Y(fNPY)基因的小启动子下编码GFP的AAV和慢病毒载体(<2.8kb)已显示在颅内注射后驱动小鼠大脑中的抑制性神经元特异性表达。携带驱动GFP表达的这些启动子的AAV-PHP.B载体与对照载体正在进行比较,其中转基因表达由泛在的强CAG启动子和最小相对较弱的小鼠MeCP2启动子驱动。通过在6周龄(尾静脉)和出生后第1天(眶后)小鼠全身施用、新生儿CSF递送以及最后靶向齿状回(DG)的单侧注射递送至CNS后,正在研究具有fSST和fNYP启动子的AAV-PHP.B-GFP载体对GABA能抑制性中间神经元的特异性(表5)。CNS基因转移的效率因递送途径的不同而有很大差异,并且因为不同年龄的Scn1a+/-小鼠正在进行治疗,因此正在进行广泛的分析,以建立每个递送途径在整个CNS中对GABA能抑制性中间神经元的神经元转导功效和启动子特异性的基线。从短fSST和fNYP启动子驱动GFP表达的AAV载体先前已被证明对直接注射后海马中的抑制性中间神经元具有高度特异性。本公开的AAV-PHP.B载体正在以与后续研究相同的方式进行验证,其中正在评估恢复Scn1a+/-小鼠海马形成中抑制性神经元中NaV1.1表达(特别位于齿状回和颗粒细胞层内壁)的治疗影响(基本原理如下明确地表达)。正在通过将129SvJ与从Jackson Laboratories(Bar Harbor,ME)获得的C57BL/6小鼠交配而在UMMS产生的129SvJ/C57BL/6小鼠中进行实验。在注射后一个月对小鼠实施安乐死,并收集大脑和脊髓以使用细胞特异性标志物和GFP的抗体的双重免疫荧光对转导效率和特异性进行组织学分析。通过用针对谷氨酸脱羧酶(GAD;GABA能神经元的标志物)和GFP的抗体的双重免疫荧光染色,正在评估整个大脑和脊髓中GABA能抑制性中间神经元的基因转移效率和特异性。另外,使用对那些蛋白质和GFP具有特异性的抗体评估了启动子和/或AAV-PHP.B对表达生长抑素(SST)、小白蛋白(PV)、钙视网膜蛋白(CR)、血管活性肠肽(VIP)或神经肽Y(NPY)的抑制性中间神经元亚群的优先特异性。从通过全身和ICV施用处理的小鼠中收集肝脏、心脏和骨骼肌,以在组织学上评估GFP表达,并且正在利用蛋白质印迹来确定外周组织中异位表达的可能性。
表5.实验组
Figure BDA0003265335870000551
*各组由来自两性的相等数量的小鼠组成。
#每种载体注射一窝
缩写:ICV–侧脑室注射;IC–颅内注射;PND1–产后第1天
向六周龄的Scn1a+/-小鼠施用编码不同ZFPScn1a反式激活因子蛋白的AAV-PHP.B载体(一种具有ZFPScn1a激活结构域但没有DNA结合结构域来控制单独激活因子影响的构建体)或相同体积的磷酸盐缓冲盐水(PBS)的双侧注射液到齿状回中(n=3只雄性+3只雌性/组)。这些实验中使用的单链AAV载体还携带ZFPScn1a cDNA下游的IRES-GFP盒,以促进识别转导细胞。测试了至少两种ZFPScn1a反式激活因子,它们可能在多种神经元中具有更广泛的激活,以及上述两种最有希望的GABA能抑制性神经元限制性ZFPSCN1A反式激活因子。注射后一个月,收获大脑并解剖来自一个大脑半球的海马,以通过使用β-肌动蛋白或微管蛋白作为负载对照的蛋白质印迹评估ZFPScn1a、NaV1.1、NaV1.3、GAD65、GAD67蛋白的表达水平。通过使用连续脑切片(10μm)的组织学研究检查另一个大脑半球,以通过具有针对GAD和GFP或GAD和包括在所有ZFPScn1a蛋白中的表位标签(HA或myc标签)的抗体的双重免疫荧光染色分析颗粒细胞层的齿状回和内小叶中转导的抑制性中间神经元%。此外,正在确定表达NaV1.1和NaV1.3的GAD阳性神经元的百分比,以证明钠通道表达的正常模式的恢复。除了对NaV1.1和NaV1.3蛋白表达进行免疫荧光检测外,还使用针对NaV1.1、NaV1.3、ZFPScn1a和GAD的RNAscope探针评估GABA能中间神经元中mRNA水平的变化。RNAScope是分析大脑内神经元中的mRNA水平的高度灵敏的原位杂交技术。评估由ZFPScn1a表达引起的NaV1.1水平变化的这两种方法的组合提供了对中间神经元变化如何通过本公开的基因疗法方法实现的全面理解。
在出生后第1天或6周龄时通过尾静脉开始的两种性别的Scn1a+/-小鼠中对AAV-PHP.B-ZFPScn1a基因疗法的治疗功效进行分析。对照包括用AAV载体处理的小鼠,所述AAV载体编码不含ZFP DNA结合结构域的ZFP样蛋白;以及年龄匹配的未处理的Scn1a+/-小鼠和野生型同窝小鼠(n=每组15只雄性和15只雌性)。每组中的小鼠的子集(n=3只雄性和3只雌性)在12周龄时被安乐死,以使用蛋白质印迹法以及使用针对GAD(和其他神经元类型特异性标志物,例如GAD65、GAD67)和ZFP的抗体的免疫荧光来评估基因转移到GABA能中间神经元的效率,以及恢复整个大脑和脊髓中那些细胞中的NaV1.1表达。此外,评估了ZFP的异位表达以及外周组织中的NaV1.1表达。每组中的其他动物子集(n=24)正在用于研究对存活率(最多1岁)、运动表现和行为的影响,从2-12个月龄开始每两个月对其进行一次测试。由于Scn1a+/-小鼠表现出由PND21导致的前肢和后肢协调受损,使用加速旋转和波束交叉测试评估运动功能和协调性。另外,正在使用行为测试,其中Scn1a+/-小鼠表现出受损的表现,包括:露天场地、高架十字迷宫、筑巢、大理石埋藏和巴恩斯迷宫,以测试Scn1a+/-小鼠中似乎严重受损的空间学习和记忆。德拉韦综合征患者的自发性癫痫发作特征在Scn1a+/-小鼠中也很明显,并且频率随着年龄和体温而增加。此外,Scn1a+/-小鼠的过早猝死在强直阵挛发作后立即发生。因此,在2个月、6个月和12个月龄时使用连续视频监测24小时,以评估癫痫发作频率和持续时间。如果在上述测试中测量的主要结果中检测到显著变化,则考虑使用对新物体、气味和老鼠做出响应的箱偏好读数的社交互动研究。在人道终点实验收集和评估大脑、脊髓和外周器官,以进行上述分子和组织学分析。
实施例7.ZFP和dCas9系统增加人细胞中SCN1A基因的表达
为了检查ZFP1-ZFP3上调SCN1A转录的能力,将ZFP1-ZFP3DNA结合结构域与杂交VP64、p53和RTA(VPR)三元强转录激活因子结构域融合以形成嵌合反式激活因子。VPR融合激活因子结构域用于募集转录调控复合物并增加染色质可及性,并且有助于实现高水平的基因表达。因此,ZFP结构域将VPR激活因子靶向至近端启动子区中的高度保守序列,以增加SCN1A基因表达。
此外,为了检查靶向SCN1A的dCas9系统上调SCN1A转录的能力,将靶向SCN1A的三个指导RNA与dCas9蛋白复合。
用以下实验条件中的一个对HEK293T细胞进行瞬时转染–(1)VPR-ZFP1构建体;(2)VPR-ZFP2构建体;(3)VPR-ZFP3构建体;(4)VPR-ZFP1、VPR-ZFP2、和VPR-ZFP3构建体中的所有三个;(5)dCas9-VPR构建体和SCN1A指导RNA 1;(6)dCas9-VPR构建体和SCN1A指导RNA 2;(7)dCas9-VPR构建体和SCN1A指导RNA 3;(8)dCas9-VPR构建体和SCN1A指导RNA 1、SCN1A指导RNA 2和SCN1A指导RNA 3中的所有三个;和(9)不含任何指导RNA的dCas9-VPR构建体(对照)。通过qRT-PCR测量SCN1A基因表达。将SCN1A的折叠激活归一化至对照实验(不含任何指导RNA的dCas9-VPR构建体)。
相对于对照实验,所有测试的实验条件都产生了SCN1A基因激活的增加(图8)。这些数据表明,本实施例和整个本公开中描述的锌指蛋白能够靶向SCN1A以影响基因表达。这些数据进一步证明,该实施例的指导RNA序列(SEQ ID NO:83-94)能够将dCas9靶向至SCN1A以影响基因表达。
表6.靶向SCN1A的指导核酸(间隔区序列以粗体显示)
Figure BDA0003265335870000571
Figure BDA0003265335870000581
序列表
<110> 马萨诸塞大学(Univeristy of Massachusetts)
<120> DNA结合结构域反式激活因子及其用途
<130> U0120.70106WO00
<140> 尚未分配
<141> 与此同时
<150> US 62/810,005
<151> 2019-02-25
<160> 121
<170> PatentIn version 3.5
<210> 1
<211> 672
<212> DNA
<213> 智人(Homo sapiens)
<400> 1
aatttccatg gactcttttt ccaaaggaat aactggaatg aataaactta aaatcaagat 60
gaaacaatta gatggcttac ctgattaaaa ggaaaattat ccatctgcag tgaggaacag 120
catcacccaa agacgagatg ataacaatgt gccttcagtt gcaattgttc agttccttct 180
tgcaaaaggt gtcaaagtat ttacaagggc tgcagtctca ctggggcaga acacacagac 240
acacaaacac acacaaacgc acacatacac acatgcacca gagacctctg cagtatcctc 300
tcggcttcat cctcgcctca ctctatggta cctaatacaa atcagcaaat agcttgtttc 360
aaaaaaaaaa aaaagtcaag acagcacctt acattacatc gccatctagt ggctaaatat 420
taaacacttt ctcacaatcc agatttatga tttcttcctc aacctctttt ctctcagctt 480
ttttcctttc ttctctgtaa tctcccagta ttgcttctcc ttgcttctct ttcattccct 540
attgctatat aatatcatga acctaatgac tcaaagagga aaaggtttga aagtaaatat 600
agctattttc aagtagtact tgaaaaactt agcattattt tagtttgaaa ctgttacttt 660
attcctaata tg 672
<210> 2
<211> 669
<212> DNA
<213> 小家鼠(Mus musculus)
<400> 2
tatttccgtg ggctcttctc cccaaggatt taccaggtaa gaattcacca ccaaagaaga 60
tcacaatgag ataatcagat ggcttacctg ataaaaagga aaattatcca tctgcagtca 120
ggagcaacat ctccccacga cgagtccgca ccttccgttg caacgattca gattccttct 180
tgcaaaaggt gaccaagtgc ttcacaaggg ctgcagcctc ataggggaga acacacgtac 240
acaaacacac gcacacacac acacacatgc accagagacc tctgcagtat cctctggctt 300
catcctcgcc tcactctatg gtacctaata caaatcagca aatagcttgt tttaaaaaaa 360
agaaagaaaa aaagcggaga cagcacctaa cgttacagtg ccatctagtg gctacatcgt 420
aaataggttc tcacagcctg gatttctgtg ttctttctca accgcttcct tctggttcct 480
ttttcttttt tcctctttat tttggtttta ttacttcctc agatgccttt ttttcattcc 540
cctttgctct gcctacatgg aactattgac ttaaagatta aaacaatcag aactggagag 600
cgttgctttt aagttaaaaa aaaaaaggtt gctaattttg tttgtaaatg ttactttatt 660
ttctctatt 669
<210> 3
<211> 130
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 3
tttttttttt tttttttgaa acaagctatt tgctgatttg tattaggtac catagagtga 60
ggcgaggatg aagccgagag gatactgcag aggtctctgg tgcatgtgtg tatgtgtgcg 120
tttgtgtgtg 130
<210> 4
<211> 41
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 4
gagtgaggcg aggatgaagc cgagaggata ctgcagaggt c 41
<210> 5
<211> 18
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 5
gagtgaggcg aggatgaa 18
<210> 6
<211> 18
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 6
ggcgaggatg aagccgag 18
<210> 7
<211> 18
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 7
gaggatactg cagaggtc 18
<210> 8
<211> 5
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 8
Glu Gly Glu Asp Glu
1 5
<210> 9
<211> 6
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 9
Gly Glu Asp Glu Ala Glu
1 5
<210> 10
<211> 6
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 10
Glu Asp Thr Ala Glu Val
1 5
<210> 11
<211> 21
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 11
cagcggggaa acctggtgag g 21
<210> 12
<211> 21
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 12
ctgagcttca atctaaccag a 21
<210> 13
<211> 21
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 13
cggagtgaca acttaacgcg g 21
<210> 14
<211> 21
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 14
gaccggtctc accttgcccg a 21
<210> 15
<211> 21
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 15
cagaaggccc atttgactgc c 21
<210> 16
<211> 21
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 16
cggtcggaca acctcacacg c 21
<210> 17
<211> 7
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 17
Gln Arg Gly Asn Leu Val Arg
1 5
<210> 18
<211> 7
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 18
Leu Ser Phe Asn Leu Thr Arg
1 5
<210> 19
<211> 7
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 19
Arg Ser Asp Asn Leu Thr Arg
1 5
<210> 20
<211> 7
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 20
Asp Arg Ser His Leu Ala Arg
1 5
<210> 21
<211> 7
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 21
Gln Lys Ala His Leu Thr Ala
1 5
<210> 22
<211> 7
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 22
Arg Ser Asp Asn Leu Thr Arg
1 5
<210> 23
<211> 21
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 23
cgaagttcca acctgacacg g 21
<210> 24
<211> 21
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 24
gacaagcgga ccttaatccg c 21
<210> 25
<211> 21
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 25
cagcggggaa atctagtgcg a 21
<210> 26
<211> 21
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 26
ctgagcttca acttgactcg t 21
<210> 27
<211> 21
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 27
cggagtgaca atcttacgag a 21
<210> 28
<211> 21
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 28
gaccggagcc acttagccag g 21
<210> 29
<211> 7
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 29
Arg Ser Ser Asn Leu Thr Arg
1 5
<210> 30
<211> 7
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 30
Asp Lys Arg Thr Leu Ile Arg
1 5
<210> 31
<211> 7
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 31
Gln Arg Gly Asn Leu Val Arg
1 5
<210> 32
<211> 7
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 32
Leu Ser Phe Asn Leu Thr Arg
1 5
<210> 33
<211> 7
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 33
Arg Ser Asp Asn Leu Thr Arg
1 5
<210> 34
<211> 7
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 34
Asp Arg Ser His Leu Ala Arg
1 5
<210> 35
<211> 21
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 35
gaccggagcg cgctggcacg g 21
<210> 36
<211> 21
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 36
cgaagtgaca acttaacgcg c 21
<210> 37
<211> 21
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 37
cagtcagggg acctcactcg t 21
<210> 38
<211> 21
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 38
gtacgacaga cgcttaaaca a 21
<210> 39
<211> 21
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 39
gccgctggta acttgacacg a 21
<210> 40
<211> 21
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 40
agatctgata atctaacgcg t 21
<210> 41
<211> 7
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 41
Asp Arg Ser Ala Leu Ala Arg
1 5
<210> 42
<211> 7
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 42
Arg Ser Asp Asn Leu Thr Arg
1 5
<210> 43
<211> 7
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 43
Gln Ser Gly Asp Leu Thr Arg
1 5
<210> 44
<211> 7
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 44
Val Arg Gln Thr Leu Lys Gln
1 5
<210> 45
<211> 7
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 45
Ala Ala Gly Asn Leu Thr Arg
1 5
<210> 46
<211> 7
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 46
Arg Ser Asp Asn Leu Thr Arg
1 5
<210> 47
<211> 1569
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 47
gaggccagcg gttccggacg ggctgacgca ttggacgatt ttgatctgga tatgctggga 60
agtgacgccc tcgatgattt tgaccttgac atgcttggtt cggatgccct tgatgacttt 120
gacctcgaca tgctcggcag tgacgccctt gatgatttcg acctggacat gctgattaac 180
tctagaagtt ccggatctag ccagtacctg cccgacaccg acgaccggca ccggatcgag 240
gaaaagcgga agcggaccta cgagacattc aagagcatca tgaagaagtc ccccttcagc 300
ggccccaccg accctagacc tccacctaga agaatcgccg tgcccagcag atccagcgcc 360
agcgtgccaa aacctgcccc ccagccttac cccttcacca gcagcctgag caccatcaac 420
tacgacgagt tccctaccat ggtgttcccc agcggccaga tctctcaggc ctctgctctg 480
gctccagccc ctcctcaggt gctgcctcag gctcctgctc ctgcaccagc tccagccatg 540
gtgtctgcac tggctcaggc accagcaccc gtgcctgtgc tggctcctgg acctccacag 600
gctgtggctc caccagcccc taaacctaca caggccggcg agggcacact gtctgaagct 660
ctgctgcagc tgcagttcga cgacgaggat ctgggagccc tgctgggaaa cagcaccgat 720
cctgccgtgt tcaccgacct ggccagcgtg gacaacagcg agttccagca gctgctgaac 780
cagggcatcc ctgtggcccc tcacaccacc gagcccatgc tgatggaata ccccgaggcc 840
atcacccggc tcgtgacagg cgctcagagg cctcctgatc cagctcctgc ccctctggga 900
gcaccaggcc tgcctaatgg actgctgtct ggcgacgagg acttcagctc tatcgccgat 960
atggatttct cagccttgct gggctctggc agcggcagcc gggattccag ggaagggatg 1020
tttttgccga agcctgaggc cggctccgct attagtgacg tgtttgaggg ccgcgaggtg 1080
tgccagccaa aacgaatccg gccatttcat cctccaggaa gtccatgggc caaccgccca 1140
ctccccgcca gcctcgcacc aacaccaacc ggtccagtac atgagccagt cgggtcactg 1200
accccggcac cagtccctca gccactggat ccagcgcccg cagtgactcc cgaggccagt 1260
cacctgttgg aggatcccga tgaagagacg agccaggctg tcaaagccct tcgggagatg 1320
gccgatactg tgattcccca gaaggaagag gctgcaatct gtggccaaat ggacctttcc 1380
catccgcccc caaggggcca tctggatgag ctgacaacca cacttgagtc catgaccgag 1440
gatctgaacc tggactcacc cctgaccccg gaattgaacg agattctgga taccttcctg 1500
aacgacgagt gcctcttgca tgccatgcat atcagcacag gactgtccat cttcgacaca 1560
tctctgttt 1569
<210> 48
<211> 523
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 48
Glu Ala Ser Gly Ser Gly Arg Ala Asp Ala Leu Asp Asp Phe Asp Leu
1 5 10 15
Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
20 25 30
Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp
35 40 45
Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Ile Asn Ser Arg Ser Ser
50 55 60
Gly Ser Ser Gln Tyr Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu
65 70 75 80
Glu Lys Arg Lys Arg Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys Lys
85 90 95
Ser Pro Phe Ser Gly Pro Thr Asp Pro Arg Pro Pro Pro Arg Arg Ile
100 105 110
Ala Val Pro Ser Arg Ser Ser Ala Ser Val Pro Lys Pro Ala Pro Gln
115 120 125
Pro Tyr Pro Phe Thr Ser Ser Leu Ser Thr Ile Asn Tyr Asp Glu Phe
130 135 140
Pro Thr Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu
145 150 155 160
Ala Pro Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala Pro Ala Pro
165 170 175
Ala Pro Ala Met Val Ser Ala Leu Ala Gln Ala Pro Ala Pro Val Pro
180 185 190
Val Leu Ala Pro Gly Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys
195 200 205
Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu
210 215 220
Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp
225 230 235 240
Pro Ala Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln
245 250 255
Gln Leu Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro
260 265 270
Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala
275 280 285
Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu
290 295 300
Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp
305 310 315 320
Met Asp Phe Ser Ala Leu Leu Gly Ser Gly Ser Gly Ser Arg Asp Ser
325 330 335
Arg Glu Gly Met Phe Leu Pro Lys Pro Glu Ala Gly Ser Ala Ile Ser
340 345 350
Asp Val Phe Glu Gly Arg Glu Val Cys Gln Pro Lys Arg Ile Arg Pro
355 360 365
Phe His Pro Pro Gly Ser Pro Trp Ala Asn Arg Pro Leu Pro Ala Ser
370 375 380
Leu Ala Pro Thr Pro Thr Gly Pro Val His Glu Pro Val Gly Ser Leu
385 390 395 400
Thr Pro Ala Pro Val Pro Gln Pro Leu Asp Pro Ala Pro Ala Val Thr
405 410 415
Pro Glu Ala Ser His Leu Leu Glu Asp Pro Asp Glu Glu Thr Ser Gln
420 425 430
Ala Val Lys Ala Leu Arg Glu Met Ala Asp Thr Val Ile Pro Gln Lys
435 440 445
Glu Glu Ala Ala Ile Cys Gly Gln Met Asp Leu Ser His Pro Pro Pro
450 455 460
Arg Gly His Leu Asp Glu Leu Thr Thr Thr Leu Glu Ser Met Thr Glu
465 470 475 480
Asp Leu Asn Leu Asp Ser Pro Leu Thr Pro Glu Leu Asn Glu Ile Leu
485 490 495
Asp Thr Phe Leu Asn Asp Glu Cys Leu Leu His Ala Met His Ile Ser
500 505 510
Thr Gly Leu Ser Ile Phe Asp Thr Ser Leu Phe
515 520
<210> 49
<211> 6027
<212> DNA
<213> 智人(Homo sapiens)
<400> 49
atggaacaga ccgtgctggt gccgccgggc ccggatagct ttaacttttt tacccgcgaa 60
agcctggcgg cgattgaacg ccgcattgcg gaagaaaaag cgaaaaaccc gaaaccggat 120
aaaaaagatg atgatgaaaa cggcccgaaa ccgaacagcg atctggaagc gggcaaaaac 180
ctgccgttta tttatggcga tattccgccg gaaatggtga gcgaaccgct ggaagatctg 240
gatccgtatt atattaacaa aaaaaccttt attgtgctga acaaaggcaa agcgattttt 300
cgctttagcg cgaccagcgc gctgtatatt ctgaccccgt ttaacccgct gcgcaaaatt 360
gcgattaaaa ttctggtgca tagcctgttt agcatgctga ttatgtgcac cattctgacc 420
aactgcgtgt ttatgaccat gagcaacccg ccggattgga ccaaaaacgt ggaatatacc 480
tttaccggca tttatacctt tgaaagcctg attaaaatta ttgcgcgcgg cttttgcctg 540
gaagatttta cctttctgcg cgatccgtgg aactggctgg attttaccgt gattaccttt 600
gcgtatgtga ccgaatttgt ggatctgggc aacgtgagcg cgctgcgcac ctttcgcgtg 660
ctgcgcgcgc tgaaaaccat tagcgtgatt ccgggcctga aaaccattgt gggcgcgctg 720
attcagagcg tgaaaaaact gagcgatgtg atgattctga ccgtgttttg cctgagcgtg 780
tttgcgctga ttggcctgca gctgtttatg ggcaacctgc gcaacaaatg cattcagtgg 840
ccgccgacca acgcgagcct ggaagaacat agcattgaaa aaaacattac cgtgaactat 900
aacggcaccc tgattaacga aaccgtgttt gaatttgatt ggaaaagcta tattcaggat 960
agccgctatc attattttct ggaaggcttt ctggatgcgc tgctgtgcgg caacagcagc 1020
gatgcgggcc agtgcccgga aggctatatg tgcgtgaaag cgggccgcaa cccgaactat 1080
ggctatacca gctttgatac ctttagctgg gcgtttctga gcctgtttcg cctgatgacc 1140
caggattttt gggaaaacct gtatcagctg accctgcgcg cggcgggcaa aacctatatg 1200
attttttttg tgctggtgat ttttctgggc agcttttatc tgattaacct gattctggcg 1260
gtggtggcga tggcgtatga agaacagaac caggcgaccc tggaagaagc ggaacagaaa 1320
gaagcggaat ttcagcagat gattgaacag ctgaaaaaac agcaggaagc ggcgcagcag 1380
gcggcgaccg cgaccgcgag cgaacatagc cgcgaaccga gcgcggcggg ccgcctgagc 1440
gatagcagca gcgaagcgag caaactgagc agcaaaagcg cgaaagaacg ccgcaaccgc 1500
cgcaaaaaac gcaaacagaa agaacagagc ggcggcgaag aaaaagatga agatgaattt 1560
cagaaaagcg aaagcgaaga tagcattcgc cgcaaaggct ttcgctttag cattgaaggc 1620
aaccgcctga cctatgaaaa acgctatagc agcccgcatc agagcctgct gagcattcgc 1680
ggcagcctgt ttagcccgcg ccgcaacagc cgcaccagcc tgtttagctt tcgcggccgc 1740
gcgaaagatg tgggcagcga aaacgatttt gcggatgatg aacatagcac ctttgaagat 1800
aacgaaagcc gccgcgatag cctgtttgtg ccgcgccgcc atggcgaacg ccgcaacagc 1860
aacctgagcc agaccagccg cagcagccgc atgctggcgg tgtttccggc gaacggcaaa 1920
atgcatagca ccgtggattg caacggcgtg gtgagcctgg tgggcggccc gagcgtgccg 1980
accagcccgg tgggccagct gctgccggaa gtgattattg ataaaccggc gaccgatgat 2040
aacggcacca ccaccgaaac cgaaatgcgc aaacgccgca gcagcagctt tcatgtgagc 2100
atggattttc tggaagatcc gagccagcgc cagcgcgcga tgagcattgc gagcattctg 2160
accaacaccg tggaagaact ggaagaaagc cgccagaaat gcccgccgtg ctggtataaa 2220
tttagcaaca tttttctgat ttgggattgc agcccgtatt ggctgaaagt gaaacatgtg 2280
gtgaacctgg tggtgatgga tccgtttgtg gatctggcga ttaccatttg cattgtgctg 2340
aacaccctgt ttatggcgat ggaacattat ccgatgaccg atcattttaa caacgtgctg 2400
accgtgggca acctggtgtt taccggcatt tttaccgcgg aaatgtttct gaaaattatt 2460
gcgatggatc cgtattatta ttttcaggaa ggctggaaca tttttgatgg ctttattgtg 2520
accctgagcc tggtggaact gggcctggcg aacgtggaag gcctgagcgt gctgcgcagc 2580
tttcgcctgc tgcgcgtgtt taaactggcg aaaagctggc cgaccctgaa catgctgatt 2640
aaaattattg gcaacagcgt gggcgcgctg ggcaacctga ccctggtgct ggcgattatt 2700
gtgtttattt ttgcggtggt gggcatgcag ctgtttggca aaagctataa agattgcgtg 2760
tgcaaaattg cgagcgattg ccagctgccg cgctggcata tgaacgattt ttttcatagc 2820
tttctgattg tgtttcgcgt gctgtgcggc gaatggattg aaaccatgtg ggattgcatg 2880
gaagtggcgg gccaggcgat gtgcctgacc gtgtttatga tggtgatggt gattggcaac 2940
ctggtggtgc tgaacctgtt tctggcgctg ctgctgagca gctttagcgc ggataacctg 3000
gcggcgaccg atgatgataa cgaaatgaac aacctgcaga ttgcggtgga tcgcatgcat 3060
aaaggcgtgg cgtatgtgaa acgcaaaatt tatgaattta ttcagcagag ctttattcgc 3120
aaacagaaaa ttctggatga aattaaaccg ctggatgatc tgaacaacaa aaaagatagc 3180
tgcatgagca accataccgc ggaaattggc aaagatctgg attatctgaa agatgtgaac 3240
ggcaccacca gcggcattgg caccggcagc agcgtggaaa aatatattat tgatgaaagc 3300
gattatatga gctttattaa caacccgagc ctgaccgtga ccgtgccgat tgcggtgggc 3360
gaaagcgatt ttgaaaacct gaacaccgaa gattttagca gcgaaagcga tctggaagaa 3420
agcaaagaaa aactgaacga aagcagcagc agcagcgaag gcagcaccgt ggatattggc 3480
gcgccggtgg aagaacagcc ggtggtggaa ccggaagaaa ccctggaacc ggaagcgtgc 3540
tttaccgaag gctgcgtgca gcgctttaaa tgctgccaga ttaacgtgga agaaggccgc 3600
ggcaaacagt ggtggaacct gcgccgcacc tgctttcgca ttgtggaaca taactggttt 3660
gaaaccttta ttgtgtttat gattctgctg agcagcggcg cgctggcgtt tgaagatatt 3720
tatattgatc agcgcaaaac cattaaaacc atgctggaat atgcggataa agtgtttacc 3780
tatattttta ttctggaaat gctgctgaaa tgggtggcgt atggctatca gacctatttt 3840
accaacgcgt ggtgctggct ggattttctg attgtggatg tgagcctggt gagcctgacc 3900
gcgaacgcgc tgggctatag cgaactgggc gcgattaaaa gcctgcgcac cctgcgcgcg 3960
ctgcgcccgc tgcgcgcgct gagccgcttt gaaggcatgc gcgtggtggt gaacgcgctg 4020
ctgggcgcga ttccgagcat tatgaacgtg ctgctggtgt gcctgatttt ttggctgatt 4080
tttagcatta tgggcgtgaa cctgtttgcg ggcaaatttt atcattgcat taacaccacc 4140
accggcgatc gctttgatat tgaagatgtg aacaaccata ccgattgcct gaaactgatt 4200
gaacgcaacg aaaccgcgcg ctggaaaaac gtgaaagtga actttgataa cgtgggcttt 4260
ggctatctga gcctgctgca ggtggcgacc tttaaaggct ggatggatat tatgtatgcg 4320
gcggtggata gccgcaacgt ggaactgcag ccgaaatatg aagaaagcct gtatatgtat 4380
ctgtattttg tgatttttat tatttttggc agctttttta ccctgaacct gtttattggc 4440
gtgattattg ataactttaa ccagcagaaa aaaaaatttg gcggccagga tatttttatg 4500
accgaagaac agaaaaaata ttataacgcg atgaaaaaac tgggcagcaa aaaaccgcag 4560
aaaccgattc cgcgcccggg caacaaattt cagggcatgg tgtttgattt tgtgacccgc 4620
caggtgtttg atattagcat tatgattctg atttgcctga acatggtgac catgatggtg 4680
gaaaccgatg atcagagcga atatgtgacc accattctga gccgcattaa cctggtgttt 4740
attgtgctgt ttaccggcga atgcgtgctg aaactgatta gcctgcgcca ttattatttt 4800
accattggct ggaacatttt tgattttgtg gtggtgattc tgagcattgt gggcatgttt 4860
ctggcggaac tgattgaaaa atattttgtg agcccgaccc tgtttcgcgt gattcgcctg 4920
gcgcgcattg gccgcattct gcgcctgatt aaaggcgcga aaggcattcg caccctgctg 4980
tttgcgctga tgatgagcct gccggcgctg tttaacattg gcctgctgct gtttctggtg 5040
atgtttattt atgcgatttt tggcatgagc aactttgcgt atgtgaaacg cgaagtgggc 5100
attgatgata tgtttaactt tgaaaccttt ggcaacagca tgatttgcct gtttcagatt 5160
accaccagcg cgggctggga tggcctgctg gcgccgattc tgaacagcaa accgccggat 5220
tgcgatccga acaaagtgaa cccgggcagc agcgtgaaag gcgattgcgg caacccgagc 5280
gtgggcattt ttttttttgt gagctatatt attattagct ttctggtggt ggtgaacatg 5340
tatattgcgg tgattctgga aaactttagc gtggcgaccg aagaaagcgc ggaaccgctg 5400
agcgaagatg attttgaaat gttttatgaa gtgtgggaaa aatttgatcc ggatgcgacc 5460
cagtttatgg aatttgaaaa actgagccag tttgcggcgg cgctggaacc gccgctgaac 5520
ctgccgcagc cgaacaaact gcagctgatt gcgatggatc tgccgatggt gagcggcgat 5580
cgcattcatt gcctggatat tctgtttgcg tttaccaaac gcgtgctggg cgaaagcggc 5640
gaaatggatg cgctgcgcat tcagatggaa gaacgcttta tggcgagcaa cccgagcaaa 5700
gtgagctatc agccgattac caccaccctg aaacgcaaac aggaagaagt gagcgcggtg 5760
attattcagc gcgcgtatcg ccgccatctg ctgaaacgca ccgtgaaaca ggcgagcttt 5820
acctataaca aaaacaaaat taaaggcggc gcgaacctgc tgattaaaga agatatgatt 5880
attgatcgca ttaacgaaaa cagcattacc gaaaaaaccg atctgaccat gagcaccgcg 5940
gcgtgcccgc cgagctatga tcgcgtgacc aaaccgattg tggaaaaaca tgaacaggaa 6000
ggcaaagatg aaaaagcgaa aggcaaa 6027
<210> 50
<211> 2009
<212> PRT
<213> 智人(Homo sapiens)
<400> 50
Met Glu Gln Thr Val Leu Val Pro Pro Gly Pro Asp Ser Phe Asn Phe
1 5 10 15
Phe Thr Arg Glu Ser Leu Ala Ala Ile Glu Arg Arg Ile Ala Glu Glu
20 25 30
Lys Ala Lys Asn Pro Lys Pro Asp Lys Lys Asp Asp Asp Glu Asn Gly
35 40 45
Pro Lys Pro Asn Ser Asp Leu Glu Ala Gly Lys Asn Leu Pro Phe Ile
50 55 60
Tyr Gly Asp Ile Pro Pro Glu Met Val Ser Glu Pro Leu Glu Asp Leu
65 70 75 80
Asp Pro Tyr Tyr Ile Asn Lys Lys Thr Phe Ile Val Leu Asn Lys Gly
85 90 95
Lys Ala Ile Phe Arg Phe Ser Ala Thr Ser Ala Leu Tyr Ile Leu Thr
100 105 110
Pro Phe Asn Pro Leu Arg Lys Ile Ala Ile Lys Ile Leu Val His Ser
115 120 125
Leu Phe Ser Met Leu Ile Met Cys Thr Ile Leu Thr Asn Cys Val Phe
130 135 140
Met Thr Met Ser Asn Pro Pro Asp Trp Thr Lys Asn Val Glu Tyr Thr
145 150 155 160
Phe Thr Gly Ile Tyr Thr Phe Glu Ser Leu Ile Lys Ile Ile Ala Arg
165 170 175
Gly Phe Cys Leu Glu Asp Phe Thr Phe Leu Arg Asp Pro Trp Asn Trp
180 185 190
Leu Asp Phe Thr Val Ile Thr Phe Ala Tyr Val Thr Glu Phe Val Asp
195 200 205
Leu Gly Asn Val Ser Ala Leu Arg Thr Phe Arg Val Leu Arg Ala Leu
210 215 220
Lys Thr Ile Ser Val Ile Pro Gly Leu Lys Thr Ile Val Gly Ala Leu
225 230 235 240
Ile Gln Ser Val Lys Lys Leu Ser Asp Val Met Ile Leu Thr Val Phe
245 250 255
Cys Leu Ser Val Phe Ala Leu Ile Gly Leu Gln Leu Phe Met Gly Asn
260 265 270
Leu Arg Asn Lys Cys Ile Gln Trp Pro Pro Thr Asn Ala Ser Leu Glu
275 280 285
Glu His Ser Ile Glu Lys Asn Ile Thr Val Asn Tyr Asn Gly Thr Leu
290 295 300
Ile Asn Glu Thr Val Phe Glu Phe Asp Trp Lys Ser Tyr Ile Gln Asp
305 310 315 320
Ser Arg Tyr His Tyr Phe Leu Glu Gly Phe Leu Asp Ala Leu Leu Cys
325 330 335
Gly Asn Ser Ser Asp Ala Gly Gln Cys Pro Glu Gly Tyr Met Cys Val
340 345 350
Lys Ala Gly Arg Asn Pro Asn Tyr Gly Tyr Thr Ser Phe Asp Thr Phe
355 360 365
Ser Trp Ala Phe Leu Ser Leu Phe Arg Leu Met Thr Gln Asp Phe Trp
370 375 380
Glu Asn Leu Tyr Gln Leu Thr Leu Arg Ala Ala Gly Lys Thr Tyr Met
385 390 395 400
Ile Phe Phe Val Leu Val Ile Phe Leu Gly Ser Phe Tyr Leu Ile Asn
405 410 415
Leu Ile Leu Ala Val Val Ala Met Ala Tyr Glu Glu Gln Asn Gln Ala
420 425 430
Thr Leu Glu Glu Ala Glu Gln Lys Glu Ala Glu Phe Gln Gln Met Ile
435 440 445
Glu Gln Leu Lys Lys Gln Gln Glu Ala Ala Gln Gln Ala Ala Thr Ala
450 455 460
Thr Ala Ser Glu His Ser Arg Glu Pro Ser Ala Ala Gly Arg Leu Ser
465 470 475 480
Asp Ser Ser Ser Glu Ala Ser Lys Leu Ser Ser Lys Ser Ala Lys Glu
485 490 495
Arg Arg Asn Arg Arg Lys Lys Arg Lys Gln Lys Glu Gln Ser Gly Gly
500 505 510
Glu Glu Lys Asp Glu Asp Glu Phe Gln Lys Ser Glu Ser Glu Asp Ser
515 520 525
Ile Arg Arg Lys Gly Phe Arg Phe Ser Ile Glu Gly Asn Arg Leu Thr
530 535 540
Tyr Glu Lys Arg Tyr Ser Ser Pro His Gln Ser Leu Leu Ser Ile Arg
545 550 555 560
Gly Ser Leu Phe Ser Pro Arg Arg Asn Ser Arg Thr Ser Leu Phe Ser
565 570 575
Phe Arg Gly Arg Ala Lys Asp Val Gly Ser Glu Asn Asp Phe Ala Asp
580 585 590
Asp Glu His Ser Thr Phe Glu Asp Asn Glu Ser Arg Arg Asp Ser Leu
595 600 605
Phe Val Pro Arg Arg His Gly Glu Arg Arg Asn Ser Asn Leu Ser Gln
610 615 620
Thr Ser Arg Ser Ser Arg Met Leu Ala Val Phe Pro Ala Asn Gly Lys
625 630 635 640
Met His Ser Thr Val Asp Cys Asn Gly Val Val Ser Leu Val Gly Gly
645 650 655
Pro Ser Val Pro Thr Ser Pro Val Gly Gln Leu Leu Pro Glu Val Ile
660 665 670
Ile Asp Lys Pro Ala Thr Asp Asp Asn Gly Thr Thr Thr Glu Thr Glu
675 680 685
Met Arg Lys Arg Arg Ser Ser Ser Phe His Val Ser Met Asp Phe Leu
690 695 700
Glu Asp Pro Ser Gln Arg Gln Arg Ala Met Ser Ile Ala Ser Ile Leu
705 710 715 720
Thr Asn Thr Val Glu Glu Leu Glu Glu Ser Arg Gln Lys Cys Pro Pro
725 730 735
Cys Trp Tyr Lys Phe Ser Asn Ile Phe Leu Ile Trp Asp Cys Ser Pro
740 745 750
Tyr Trp Leu Lys Val Lys His Val Val Asn Leu Val Val Met Asp Pro
755 760 765
Phe Val Asp Leu Ala Ile Thr Ile Cys Ile Val Leu Asn Thr Leu Phe
770 775 780
Met Ala Met Glu His Tyr Pro Met Thr Asp His Phe Asn Asn Val Leu
785 790 795 800
Thr Val Gly Asn Leu Val Phe Thr Gly Ile Phe Thr Ala Glu Met Phe
805 810 815
Leu Lys Ile Ile Ala Met Asp Pro Tyr Tyr Tyr Phe Gln Glu Gly Trp
820 825 830
Asn Ile Phe Asp Gly Phe Ile Val Thr Leu Ser Leu Val Glu Leu Gly
835 840 845
Leu Ala Asn Val Glu Gly Leu Ser Val Leu Arg Ser Phe Arg Leu Leu
850 855 860
Arg Val Phe Lys Leu Ala Lys Ser Trp Pro Thr Leu Asn Met Leu Ile
865 870 875 880
Lys Ile Ile Gly Asn Ser Val Gly Ala Leu Gly Asn Leu Thr Leu Val
885 890 895
Leu Ala Ile Ile Val Phe Ile Phe Ala Val Val Gly Met Gln Leu Phe
900 905 910
Gly Lys Ser Tyr Lys Asp Cys Val Cys Lys Ile Ala Ser Asp Cys Gln
915 920 925
Leu Pro Arg Trp His Met Asn Asp Phe Phe His Ser Phe Leu Ile Val
930 935 940
Phe Arg Val Leu Cys Gly Glu Trp Ile Glu Thr Met Trp Asp Cys Met
945 950 955 960
Glu Val Ala Gly Gln Ala Met Cys Leu Thr Val Phe Met Met Val Met
965 970 975
Val Ile Gly Asn Leu Val Val Leu Asn Leu Phe Leu Ala Leu Leu Leu
980 985 990
Ser Ser Phe Ser Ala Asp Asn Leu Ala Ala Thr Asp Asp Asp Asn Glu
995 1000 1005
Met Asn Asn Leu Gln Ile Ala Val Asp Arg Met His Lys Gly Val
1010 1015 1020
Ala Tyr Val Lys Arg Lys Ile Tyr Glu Phe Ile Gln Gln Ser Phe
1025 1030 1035
Ile Arg Lys Gln Lys Ile Leu Asp Glu Ile Lys Pro Leu Asp Asp
1040 1045 1050
Leu Asn Asn Lys Lys Asp Ser Cys Met Ser Asn His Thr Ala Glu
1055 1060 1065
Ile Gly Lys Asp Leu Asp Tyr Leu Lys Asp Val Asn Gly Thr Thr
1070 1075 1080
Ser Gly Ile Gly Thr Gly Ser Ser Val Glu Lys Tyr Ile Ile Asp
1085 1090 1095
Glu Ser Asp Tyr Met Ser Phe Ile Asn Asn Pro Ser Leu Thr Val
1100 1105 1110
Thr Val Pro Ile Ala Val Gly Glu Ser Asp Phe Glu Asn Leu Asn
1115 1120 1125
Thr Glu Asp Phe Ser Ser Glu Ser Asp Leu Glu Glu Ser Lys Glu
1130 1135 1140
Lys Leu Asn Glu Ser Ser Ser Ser Ser Glu Gly Ser Thr Val Asp
1145 1150 1155
Ile Gly Ala Pro Val Glu Glu Gln Pro Val Val Glu Pro Glu Glu
1160 1165 1170
Thr Leu Glu Pro Glu Ala Cys Phe Thr Glu Gly Cys Val Gln Arg
1175 1180 1185
Phe Lys Cys Cys Gln Ile Asn Val Glu Glu Gly Arg Gly Lys Gln
1190 1195 1200
Trp Trp Asn Leu Arg Arg Thr Cys Phe Arg Ile Val Glu His Asn
1205 1210 1215
Trp Phe Glu Thr Phe Ile Val Phe Met Ile Leu Leu Ser Ser Gly
1220 1225 1230
Ala Leu Ala Phe Glu Asp Ile Tyr Ile Asp Gln Arg Lys Thr Ile
1235 1240 1245
Lys Thr Met Leu Glu Tyr Ala Asp Lys Val Phe Thr Tyr Ile Phe
1250 1255 1260
Ile Leu Glu Met Leu Leu Lys Trp Val Ala Tyr Gly Tyr Gln Thr
1265 1270 1275
Tyr Phe Thr Asn Ala Trp Cys Trp Leu Asp Phe Leu Ile Val Asp
1280 1285 1290
Val Ser Leu Val Ser Leu Thr Ala Asn Ala Leu Gly Tyr Ser Glu
1295 1300 1305
Leu Gly Ala Ile Lys Ser Leu Arg Thr Leu Arg Ala Leu Arg Pro
1310 1315 1320
Leu Arg Ala Leu Ser Arg Phe Glu Gly Met Arg Val Val Val Asn
1325 1330 1335
Ala Leu Leu Gly Ala Ile Pro Ser Ile Met Asn Val Leu Leu Val
1340 1345 1350
Cys Leu Ile Phe Trp Leu Ile Phe Ser Ile Met Gly Val Asn Leu
1355 1360 1365
Phe Ala Gly Lys Phe Tyr His Cys Ile Asn Thr Thr Thr Gly Asp
1370 1375 1380
Arg Phe Asp Ile Glu Asp Val Asn Asn His Thr Asp Cys Leu Lys
1385 1390 1395
Leu Ile Glu Arg Asn Glu Thr Ala Arg Trp Lys Asn Val Lys Val
1400 1405 1410
Asn Phe Asp Asn Val Gly Phe Gly Tyr Leu Ser Leu Leu Gln Val
1415 1420 1425
Ala Thr Phe Lys Gly Trp Met Asp Ile Met Tyr Ala Ala Val Asp
1430 1435 1440
Ser Arg Asn Val Glu Leu Gln Pro Lys Tyr Glu Glu Ser Leu Tyr
1445 1450 1455
Met Tyr Leu Tyr Phe Val Ile Phe Ile Ile Phe Gly Ser Phe Phe
1460 1465 1470
Thr Leu Asn Leu Phe Ile Gly Val Ile Ile Asp Asn Phe Asn Gln
1475 1480 1485
Gln Lys Lys Lys Phe Gly Gly Gln Asp Ile Phe Met Thr Glu Glu
1490 1495 1500
Gln Lys Lys Tyr Tyr Asn Ala Met Lys Lys Leu Gly Ser Lys Lys
1505 1510 1515
Pro Gln Lys Pro Ile Pro Arg Pro Gly Asn Lys Phe Gln Gly Met
1520 1525 1530
Val Phe Asp Phe Val Thr Arg Gln Val Phe Asp Ile Ser Ile Met
1535 1540 1545
Ile Leu Ile Cys Leu Asn Met Val Thr Met Met Val Glu Thr Asp
1550 1555 1560
Asp Gln Ser Glu Tyr Val Thr Thr Ile Leu Ser Arg Ile Asn Leu
1565 1570 1575
Val Phe Ile Val Leu Phe Thr Gly Glu Cys Val Leu Lys Leu Ile
1580 1585 1590
Ser Leu Arg His Tyr Tyr Phe Thr Ile Gly Trp Asn Ile Phe Asp
1595 1600 1605
Phe Val Val Val Ile Leu Ser Ile Val Gly Met Phe Leu Ala Glu
1610 1615 1620
Leu Ile Glu Lys Tyr Phe Val Ser Pro Thr Leu Phe Arg Val Ile
1625 1630 1635
Arg Leu Ala Arg Ile Gly Arg Ile Leu Arg Leu Ile Lys Gly Ala
1640 1645 1650
Lys Gly Ile Arg Thr Leu Leu Phe Ala Leu Met Met Ser Leu Pro
1655 1660 1665
Ala Leu Phe Asn Ile Gly Leu Leu Leu Phe Leu Val Met Phe Ile
1670 1675 1680
Tyr Ala Ile Phe Gly Met Ser Asn Phe Ala Tyr Val Lys Arg Glu
1685 1690 1695
Val Gly Ile Asp Asp Met Phe Asn Phe Glu Thr Phe Gly Asn Ser
1700 1705 1710
Met Ile Cys Leu Phe Gln Ile Thr Thr Ser Ala Gly Trp Asp Gly
1715 1720 1725
Leu Leu Ala Pro Ile Leu Asn Ser Lys Pro Pro Asp Cys Asp Pro
1730 1735 1740
Asn Lys Val Asn Pro Gly Ser Ser Val Lys Gly Asp Cys Gly Asn
1745 1750 1755
Pro Ser Val Gly Ile Phe Phe Phe Val Ser Tyr Ile Ile Ile Ser
1760 1765 1770
Phe Leu Val Val Val Asn Met Tyr Ile Ala Val Ile Leu Glu Asn
1775 1780 1785
Phe Ser Val Ala Thr Glu Glu Ser Ala Glu Pro Leu Ser Glu Asp
1790 1795 1800
Asp Phe Glu Met Phe Tyr Glu Val Trp Glu Lys Phe Asp Pro Asp
1805 1810 1815
Ala Thr Gln Phe Met Glu Phe Glu Lys Leu Ser Gln Phe Ala Ala
1820 1825 1830
Ala Leu Glu Pro Pro Leu Asn Leu Pro Gln Pro Asn Lys Leu Gln
1835 1840 1845
Leu Ile Ala Met Asp Leu Pro Met Val Ser Gly Asp Arg Ile His
1850 1855 1860
Cys Leu Asp Ile Leu Phe Ala Phe Thr Lys Arg Val Leu Gly Glu
1865 1870 1875
Ser Gly Glu Met Asp Ala Leu Arg Ile Gln Met Glu Glu Arg Phe
1880 1885 1890
Met Ala Ser Asn Pro Ser Lys Val Ser Tyr Gln Pro Ile Thr Thr
1895 1900 1905
Thr Leu Lys Arg Lys Gln Glu Glu Val Ser Ala Val Ile Ile Gln
1910 1915 1920
Arg Ala Tyr Arg Arg His Leu Leu Lys Arg Thr Val Lys Gln Ala
1925 1930 1935
Ser Phe Thr Tyr Asn Lys Asn Lys Ile Lys Gly Gly Ala Asn Leu
1940 1945 1950
Leu Ile Lys Glu Asp Met Ile Ile Asp Arg Ile Asn Glu Asn Ser
1955 1960 1965
Ile Thr Glu Lys Thr Asp Leu Thr Met Ser Thr Ala Ala Cys Pro
1970 1975 1980
Pro Ser Tyr Asp Arg Val Thr Lys Pro Ile Val Glu Lys His Glu
1985 1990 1995
Gln Glu Gly Lys Asp Glu Lys Ala Lys Gly Lys
2000 2005
<210> 51
<211> 1470
<212> DNA
<213> 智人(Homo sapiens)
<400> 51
atggatctgc tggtggatga actgtttgcg gatatgaacg cggatggcgc gagcccgccg 60
ccgccgcgcc cggcgggcgg cccgaaaaac accccggcgg cgccgccgct gtatgcgacc 120
ggccgcctga gccaggcgca gctgatgccg agcccgccga tgccggtgcc gccggcggcg 180
ctgtttaacc gcctgctgga tgatctgggc tttagcgcgg gcccggcgct gtgcaccatg 240
ctggatacct ggaacgaaga tctgtttagc gcgctgccga ccaacgcgga tctgtatcgc 300
gaatgcaaat ttctgagcac cctgccgagc gatgtggtgg aatggggcga tgcgtatgtg 360
ccggaacgca cccagattga tattcgcgcg catggcgatg tggcgtttcc gaccctgccg 420
gcgacccgcg atggcctggg cctgtattat gaagcgctga gccgcttttt tcatgcggaa 480
ctgcgcgcgc gcgaagaaag ctatcgcacc gtgctggcga acttttgcag cgcgctgtat 540
cgctatctgc gcgcgagcgt gcgccagctg catcgccagg cgcatatgcg cggccgcgat 600
cgcgatctgg gcgaaatgct gcgcgcgacc attgcggatc gctattatcg cgaaaccgcg 660
cgcctggcgc gcgtgctgtt tctgcatctg tatctgtttc tgacccgcga aattctgtgg 720
gcggcgtatg cggaacagat gatgcgcccg gatctgtttg attgcctgtg ctgcgatctg 780
gaaagctggc gccagctggc gggcctgttt cagccgttta tgtttgtgaa cggcgcgctg 840
accgtgcgcg gcgtgccgat tgaagcgcgc cgcctgcgcg aactgaacca tattcgcgaa 900
catctgaacc tgccgctggt gcgcagcgcg gcgaccgaag aaccgggcgc gccgctgacc 960
accccgccga ccctgcatgg caaccaggcg cgcgcgagcg gctattttat ggtgctgatt 1020
cgcgcgaaac tggatagcta tagcagcttt accaccagcc cgagcgaagc ggtgatgcgc 1080
gaacatgcgt atagccgcgc gcgcaccaaa aacaactatg gcagcaccat tgaaggcctg 1140
ctggatctgc cggatgatga tgcgccggaa gaagcgggcc tggcggcgcc gcgcctgagc 1200
tttctgccgg cgggccatac ccgccgcctg agcaccgcgc cgccgaccga tgtgagcctg 1260
ggcgatgaac tgcatctgga tggcgaagat gtggcgatgg cgcatgcgga tgcgctggat 1320
gattttgatc tggatatgct gggcgatggc gatagcccgg gcccgggctt taccccgcat 1380
gatagcgcgc cgtatggcgc gctggatatg gcggattttg aatttgaaca gatgtttacc 1440
gatgcgctgg gcattgatga atatggcggc 1470
<210> 52
<211> 490
<212> PRT
<213> 智人(Homo sapiens)
<400> 52
Met Asp Leu Leu Val Asp Glu Leu Phe Ala Asp Met Asn Ala Asp Gly
1 5 10 15
Ala Ser Pro Pro Pro Pro Arg Pro Ala Gly Gly Pro Lys Asn Thr Pro
20 25 30
Ala Ala Pro Pro Leu Tyr Ala Thr Gly Arg Leu Ser Gln Ala Gln Leu
35 40 45
Met Pro Ser Pro Pro Met Pro Val Pro Pro Ala Ala Leu Phe Asn Arg
50 55 60
Leu Leu Asp Asp Leu Gly Phe Ser Ala Gly Pro Ala Leu Cys Thr Met
65 70 75 80
Leu Asp Thr Trp Asn Glu Asp Leu Phe Ser Ala Leu Pro Thr Asn Ala
85 90 95
Asp Leu Tyr Arg Glu Cys Lys Phe Leu Ser Thr Leu Pro Ser Asp Val
100 105 110
Val Glu Trp Gly Asp Ala Tyr Val Pro Glu Arg Thr Gln Ile Asp Ile
115 120 125
Arg Ala His Gly Asp Val Ala Phe Pro Thr Leu Pro Ala Thr Arg Asp
130 135 140
Gly Leu Gly Leu Tyr Tyr Glu Ala Leu Ser Arg Phe Phe His Ala Glu
145 150 155 160
Leu Arg Ala Arg Glu Glu Ser Tyr Arg Thr Val Leu Ala Asn Phe Cys
165 170 175
Ser Ala Leu Tyr Arg Tyr Leu Arg Ala Ser Val Arg Gln Leu His Arg
180 185 190
Gln Ala His Met Arg Gly Arg Asp Arg Asp Leu Gly Glu Met Leu Arg
195 200 205
Ala Thr Ile Ala Asp Arg Tyr Tyr Arg Glu Thr Ala Arg Leu Ala Arg
210 215 220
Val Leu Phe Leu His Leu Tyr Leu Phe Leu Thr Arg Glu Ile Leu Trp
225 230 235 240
Ala Ala Tyr Ala Glu Gln Met Met Arg Pro Asp Leu Phe Asp Cys Leu
245 250 255
Cys Cys Asp Leu Glu Ser Trp Arg Gln Leu Ala Gly Leu Phe Gln Pro
260 265 270
Phe Met Phe Val Asn Gly Ala Leu Thr Val Arg Gly Val Pro Ile Glu
275 280 285
Ala Arg Arg Leu Arg Glu Leu Asn His Ile Arg Glu His Leu Asn Leu
290 295 300
Pro Leu Val Arg Ser Ala Ala Thr Glu Glu Pro Gly Ala Pro Leu Thr
305 310 315 320
Thr Pro Pro Thr Leu His Gly Asn Gln Ala Arg Ala Ser Gly Tyr Phe
325 330 335
Met Val Leu Ile Arg Ala Lys Leu Asp Ser Tyr Ser Ser Phe Thr Thr
340 345 350
Ser Pro Ser Glu Ala Val Met Arg Glu His Ala Tyr Ser Arg Ala Arg
355 360 365
Thr Lys Asn Asn Tyr Gly Ser Thr Ile Glu Gly Leu Leu Asp Leu Pro
370 375 380
Asp Asp Asp Ala Pro Glu Glu Ala Gly Leu Ala Ala Pro Arg Leu Ser
385 390 395 400
Phe Leu Pro Ala Gly His Thr Arg Arg Leu Ser Thr Ala Pro Pro Thr
405 410 415
Asp Val Ser Leu Gly Asp Glu Leu His Leu Asp Gly Glu Asp Val Ala
420 425 430
Met Ala His Ala Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly
435 440 445
Asp Gly Asp Ser Pro Gly Pro Gly Phe Thr Pro His Asp Ser Ala Pro
450 455 460
Tyr Gly Ala Leu Asp Met Ala Asp Phe Glu Phe Glu Gln Met Phe Thr
465 470 475 480
Asp Ala Leu Gly Ile Asp Glu Tyr Gly Gly
485 490
<210> 53
<211> 2570
<212> DNA
<213> 智人(Homo sapiens)
<400> 53
agcgcgcagg cgcggccgga ttccgggcag tgacgcgacg gcgggccgcg cggcgcattt 60
ccgcctctgg cgaatggctc gtctgtagtg cacgccgcgg gcccagctgc gaccccggcc 120
ccgcccccgg gaccccggcc atggacgaac tgttccccct catcttcccg gcagagccag 180
cccaggcctc tggcccctat gtggagatca ttgagcagcc caagcagcgg ggcatgcgct 240
tccgctacaa gtgcgagggg cgctccgcgg gcagcatccc aggcgagagg agcacagata 300
ccaccaagac ccaccccacc atcaagatca atggctacac aggaccaggg acagtgcgca 360
tctccctggt caccaaggac cctcctcacc ggcctcaccc ccacgagctt gtaggaaagg 420
actgccggga tggcttctat gaggctgagc tctgcccgga ccgctgcatc cacagtttcc 480
agaacctggg aatccagtgt gtgaagaagc gggacctgga gcaggctatc agtcagcgca 540
tccagaccaa caacaacccc ttccaagaag agcagcgtgg ggactacgac ctgaatgctg 600
tgcggctctg cttccaggtg acagtgcggg acccatcagg caggcccctc cgcctgccgc 660
ctgtcctttc tcatcccatc tttgacaatc gtgcccccaa cactgccgag ctcaagatct 720
gccgagtgaa ccgaaactct ggcagctgcc tcggtgggga tgagatcttc ctactgtgtg 780
acaaggtgca gaaagaggac attgaggtgt atttcacggg accaggctgg gaggcccgag 840
gctccttttc gcaagctgat gtgcaccgac aagtggccat tgtgttccgg acccctccct 900
acgcagaccc cagcctgcag gctcctgtgc gtgtctccat gcagctgcgg cggccttccg 960
accgggagct cagtgagccc atggaattcc agtacctgcc agatacagac gatcgtcacc 1020
ggattgagga gaaacgtaaa aggacatatg agaccttcaa gagcatcatg aagaagagtc 1080
ctttcagcgg acccaccgac ccccggcctc cacctcgacg cattgctgtg ccttcccgca 1140
gctcagcttc tgtccccaag ccagcacccc agccctatcc ctttacgtca tccctgagca 1200
ccatcaacta tgatgagttt cccaccatgg tgtttccttc tgggcagatc agccaggcct 1260
cggccttggc cccggcccct ccccaagtcc tgccccaggc tccagcccct gcccctgctc 1320
cagccatggt atcagctctg gcccaggccc cagcccctgt cccagtccta gccccaggcc 1380
ctcctcaggc tgtggcccca cctgccccca agcccaccca ggctggggaa ggaacgctgt 1440
cagaggccct gctgcagctg cagtttgatg atgaagacct gggggccttg cttggcaaca 1500
gcacagaccc agctgtgttc acagacctgg catccgtcga caactccgag tttcagcagc 1560
tgctgaacca gggcatacct gtggcccccc acacaactga gcccatgctg atggagtacc 1620
ctgaggctat aactcgccta gtgacagggg cccagaggcc ccccgaccca gctcctgctc 1680
cactgggggc cccggggctc cccaatggcc tcctttcagg agatgaagac ttctcctcca 1740
ttgcggacat ggacttctca gccctgctga gtcagatcag ctcctaaggg ggtgacgcct 1800
gccctcccca gagcactggg ttgcagggga ttgaagccct ccaaaagcac ttacggattc 1860
tggtggggtg tgttccaact gcccccaact ttgtggatgt cttccttgga ggggggagcc 1920
atattttatt cttttattgt cagtatctgt atctctctct ctttttggag gtgcttaagc 1980
agaagcatta acttctctgg aaagggggga gctggggaaa ctcaaacttt tcccctgtcc 2040
tgatggtcag ctcccttctc tgtagggaac tctggggtcc cccatcccca tcctccagct 2100
tctggtactc tcctagagac agaagcaggc tggaggtaag gcctttgagc ccacaaagcc 2160
ttatcaagtg tcttccatca tggattcatt acagcttaat caaaataacg ccccagatac 2220
cagcccctgt atggcactgg cattgtccct gtgcctaaca ccagcgtttg aggggctggc 2280
cttcctgccc tacagaggtc tctgccggct ctttccttgc tcaaccatgg ctgaaggaaa 2340
ccagtgcaac agcactggct ctctccagga tccagaaggg gtttggtctg ggacttcctt 2400
gctctccctc ttctcaagtg ccttaatagt agggtaagtt gttaagagtg ggggagagca 2460
ggctggcagc tctccagtca ggaggcatag tttttactga acaatcaaag cacttggact 2520
cttgctcttt ctactctgaa ctaataaatc tgttgccaag ctggctagaa 2570
<210> 54
<211> 548
<212> PRT
<213> 智人(Homo sapiens)
<400> 54
Met Asp Glu Leu Phe Pro Leu Ile Phe Pro Ala Glu Pro Ala Gln Ala
1 5 10 15
Ser Gly Pro Tyr Val Glu Ile Ile Glu Gln Pro Lys Gln Arg Gly Met
20 25 30
Arg Phe Arg Tyr Lys Cys Glu Gly Arg Ser Ala Gly Ser Ile Pro Gly
35 40 45
Glu Arg Ser Thr Asp Thr Thr Lys Thr His Pro Thr Ile Lys Ile Asn
50 55 60
Gly Tyr Thr Gly Pro Gly Thr Val Arg Ile Ser Leu Val Thr Lys Asp
65 70 75 80
Pro Pro His Arg Pro His Pro His Glu Leu Val Gly Lys Asp Cys Arg
85 90 95
Asp Gly Phe Tyr Glu Ala Glu Leu Cys Pro Asp Arg Cys Ile His Ser
100 105 110
Phe Gln Asn Leu Gly Ile Gln Cys Val Lys Lys Arg Asp Leu Glu Gln
115 120 125
Ala Ile Ser Gln Arg Ile Gln Thr Asn Asn Asn Pro Phe Gln Glu Glu
130 135 140
Gln Arg Gly Asp Tyr Asp Leu Asn Ala Val Arg Leu Cys Phe Gln Val
145 150 155 160
Thr Val Arg Asp Pro Ser Gly Arg Pro Leu Arg Leu Pro Pro Val Leu
165 170 175
Ser His Pro Ile Phe Asp Asn Arg Ala Pro Asn Thr Ala Glu Leu Lys
180 185 190
Ile Cys Arg Val Asn Arg Asn Ser Gly Ser Cys Leu Gly Gly Asp Glu
195 200 205
Ile Phe Leu Leu Cys Asp Lys Val Gln Lys Glu Asp Ile Glu Val Tyr
210 215 220
Phe Thr Gly Pro Gly Trp Glu Ala Arg Gly Ser Phe Ser Gln Ala Asp
225 230 235 240
Val His Arg Gln Val Ala Ile Val Phe Arg Thr Pro Pro Tyr Ala Asp
245 250 255
Pro Ser Leu Gln Ala Pro Val Arg Val Ser Met Gln Leu Arg Arg Pro
260 265 270
Ser Asp Arg Glu Leu Ser Glu Pro Met Glu Phe Gln Tyr Leu Pro Asp
275 280 285
Thr Asp Asp Arg His Arg Ile Glu Glu Lys Arg Lys Arg Thr Tyr Glu
290 295 300
Thr Phe Lys Ser Ile Met Lys Lys Ser Pro Phe Ser Gly Pro Thr Asp
305 310 315 320
Pro Arg Pro Pro Pro Arg Arg Ile Ala Val Pro Ser Arg Ser Ser Ala
325 330 335
Ser Val Pro Lys Pro Ala Pro Gln Pro Tyr Pro Phe Thr Ser Ser Leu
340 345 350
Ser Thr Ile Asn Tyr Asp Glu Phe Pro Thr Met Val Phe Pro Ser Gly
355 360 365
Gln Ile Ser Gln Ala Ser Ala Leu Ala Pro Ala Pro Pro Gln Val Leu
370 375 380
Pro Gln Ala Pro Ala Pro Ala Pro Ala Pro Ala Met Val Ser Ala Leu
385 390 395 400
Ala Gln Ala Pro Ala Pro Val Pro Val Leu Ala Pro Gly Pro Pro Gln
405 410 415
Ala Val Ala Pro Pro Ala Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr
420 425 430
Leu Ser Glu Ala Leu Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly
435 440 445
Ala Leu Leu Gly Asn Ser Thr Asp Pro Ala Val Phe Thr Asp Leu Ala
450 455 460
Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro
465 470 475 480
Val Ala Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr Pro Glu Ala
485 490 495
Ile Thr Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro
500 505 510
Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp
515 520 525
Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Ser
530 535 540
Gln Ile Ser Ser
545
<210> 55
<211> 1815
<212> DNA
<213> 智人(Homo sapiens)
<400> 55
atgcgcccga aaaaagatgg cctggaagat tttctgcgcc tgaccccgga aattaaaaaa 60
cagctgggca gcctggtgag cgattattgc aacgtgctga acaaagaatt taccgcgggc 120
agcgtggaaa ttaccctgcg cagctataaa atttgcaaag cgtttattaa cgaagcgaaa 180
gcgcatggcc gcgaatgggg cggcctgatg gcgaccctga acatttgcaa cttttgggcg 240
attctgcgca acaaccgcgt gcgccgccgc gcggaaaacg cgggcaacga tgcgtgcagc 300
attgcgtgcc cgattgtgat gcgctatgtg ctggatcatc tgattgtggt gaccgatcgc 360
ttttttattc aggcgccgag caaccgcgtg atgattccgg cgaccattgg caccgcgatg 420
tataaactgc tgaaacatag ccgcgtgcgc gcgtatacct atagcaaagt gctgggcgtg 480
gatcgcgcgg cgattatggc gagcggcaaa caggtggtgg aacatctgaa ccgcatggaa 540
aaagaaggcc tgctgagcag caaatttaaa gcgttttgca aatgggtgtt tacctatccg 600
gtgctggaag aaatgtttca gaccatggtg agcagcaaaa ccggccatct gaccgatgat 660
gtgaaagatg tgcgcgcgct gattaaaacc ctgccgcgcg cgagctatag cagccatgcg 720
ggccagcgca gctatgtgag cggcgtgctg ccggcgtgcc tgctgagcac caaaagcaaa 780
gcggtggaaa ccccgattct ggtgagcggc gcggatcgca tggatgaaga actgatgggc 840
aacgatggcg gcgcgagcca taccgaagcg cgctatagcg aaagcggcca gtttcatgcg 900
tttaccgatg aactggaaag cctgccgagc ccgaccatgc cgctgaaacc gggcgcgcag 960
agcgcggatt gcggcgatag cagcagcagc agcagcgata gcggcaacag cgataccgaa 1020
cagagcgaac gcgaagaagc gcgcgcggaa gcgccgcgcc tgcgcgcgcc gaaaagccgc 1080
cgcaccagcc gcccgaaccg cggccagacc ccgtgcccga gcaacgcggc ggaaccggaa 1140
cagccgtgga ttgcggcggt gcatcaggaa agcgatgaac gcccgatttt tccgcatccg 1200
agcaaaccga cctttctgcc gccggtgaaa cgcaaaaaag gcctgcgcga tagccgcgaa 1260
ggcatgtttc tgccgaaacc ggaagcgggc agcgcgatta gcgatgtgtt tgaaggccgc 1320
gaagtgtgcc agccgaaacg cattcgcccg tttcatccgc cgggcagccc gtgggcgaac 1380
cgcccgctgc cggcgagcct ggcgccgacc ccgaccggcc cggtgcatga accggtgggc 1440
agcctgaccc cggcgccggt gccgcagccg ctggatccgg cgccggcggt gaccccggaa 1500
gcgagccatc tgctggaaga tccggatgaa gaaaccagcc aggcggtgaa agcgctgcgc 1560
gaaatggcgg ataccgtgat tccgcagaaa gaagaagcgg cgatttgcgg ccagatggat 1620
ctgagccatc cgccgccgcg cggccatctg gatgaactga ccaccaccct ggaaagcatg 1680
accgaagatc tgaacctgga tagcccgctg accccggaac tgaacgaaat tctggatacc 1740
tttctgaacg atgaatgcct gctgcatgcg atgcatatta gcaccggcct gagcattttt 1800
gataccagcc tgttt 1815
<210> 56
<211> 605
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 56
Met Arg Pro Lys Lys Asp Gly Leu Glu Asp Phe Leu Arg Leu Thr Pro
1 5 10 15
Glu Ile Lys Lys Gln Leu Gly Ser Leu Val Ser Asp Tyr Cys Asn Val
20 25 30
Leu Asn Lys Glu Phe Thr Ala Gly Ser Val Glu Ile Thr Leu Arg Ser
35 40 45
Tyr Lys Ile Cys Lys Ala Phe Ile Asn Glu Ala Lys Ala His Gly Arg
50 55 60
Glu Trp Gly Gly Leu Met Ala Thr Leu Asn Ile Cys Asn Phe Trp Ala
65 70 75 80
Ile Leu Arg Asn Asn Arg Val Arg Arg Arg Ala Glu Asn Ala Gly Asn
85 90 95
Asp Ala Cys Ser Ile Ala Cys Pro Ile Val Met Arg Tyr Val Leu Asp
100 105 110
His Leu Ile Val Val Thr Asp Arg Phe Phe Ile Gln Ala Pro Ser Asn
115 120 125
Arg Val Met Ile Pro Ala Thr Ile Gly Thr Ala Met Tyr Lys Leu Leu
130 135 140
Lys His Ser Arg Val Arg Ala Tyr Thr Tyr Ser Lys Val Leu Gly Val
145 150 155 160
Asp Arg Ala Ala Ile Met Ala Ser Gly Lys Gln Val Val Glu His Leu
165 170 175
Asn Arg Met Glu Lys Glu Gly Leu Leu Ser Ser Lys Phe Lys Ala Phe
180 185 190
Cys Lys Trp Val Phe Thr Tyr Pro Val Leu Glu Glu Met Phe Gln Thr
195 200 205
Met Val Ser Ser Lys Thr Gly His Leu Thr Asp Asp Val Lys Asp Val
210 215 220
Arg Ala Leu Ile Lys Thr Leu Pro Arg Ala Ser Tyr Ser Ser His Ala
225 230 235 240
Gly Gln Arg Ser Tyr Val Ser Gly Val Leu Pro Ala Cys Leu Leu Ser
245 250 255
Thr Lys Ser Lys Ala Val Glu Thr Pro Ile Leu Val Ser Gly Ala Asp
260 265 270
Arg Met Asp Glu Glu Leu Met Gly Asn Asp Gly Gly Ala Ser His Thr
275 280 285
Glu Ala Arg Tyr Ser Glu Ser Gly Gln Phe His Ala Phe Thr Asp Glu
290 295 300
Leu Glu Ser Leu Pro Ser Pro Thr Met Pro Leu Lys Pro Gly Ala Gln
305 310 315 320
Ser Ala Asp Cys Gly Asp Ser Ser Ser Ser Ser Ser Asp Ser Gly Asn
325 330 335
Ser Asp Thr Glu Gln Ser Glu Arg Glu Glu Ala Arg Ala Glu Ala Pro
340 345 350
Arg Leu Arg Ala Pro Lys Ser Arg Arg Thr Ser Arg Pro Asn Arg Gly
355 360 365
Gln Thr Pro Cys Pro Ser Asn Ala Ala Glu Pro Glu Gln Pro Trp Ile
370 375 380
Ala Ala Val His Gln Glu Ser Asp Glu Arg Pro Ile Phe Pro His Pro
385 390 395 400
Ser Lys Pro Thr Phe Leu Pro Pro Val Lys Arg Lys Lys Gly Leu Arg
405 410 415
Asp Ser Arg Glu Gly Met Phe Leu Pro Lys Pro Glu Ala Gly Ser Ala
420 425 430
Ile Ser Asp Val Phe Glu Gly Arg Glu Val Cys Gln Pro Lys Arg Ile
435 440 445
Arg Pro Phe His Pro Pro Gly Ser Pro Trp Ala Asn Arg Pro Leu Pro
450 455 460
Ala Ser Leu Ala Pro Thr Pro Thr Gly Pro Val His Glu Pro Val Gly
465 470 475 480
Ser Leu Thr Pro Ala Pro Val Pro Gln Pro Leu Asp Pro Ala Pro Ala
485 490 495
Val Thr Pro Glu Ala Ser His Leu Leu Glu Asp Pro Asp Glu Glu Thr
500 505 510
Ser Gln Ala Val Lys Ala Leu Arg Glu Met Ala Asp Thr Val Ile Pro
515 520 525
Gln Lys Glu Glu Ala Ala Ile Cys Gly Gln Met Asp Leu Ser His Pro
530 535 540
Pro Pro Arg Gly His Leu Asp Glu Leu Thr Thr Thr Leu Glu Ser Met
545 550 555 560
Thr Glu Asp Leu Asn Leu Asp Ser Pro Leu Thr Pro Glu Leu Asn Glu
565 570 575
Ile Leu Asp Thr Phe Leu Asn Asp Glu Cys Leu Leu His Ala Met His
580 585 590
Ile Ser Thr Gly Leu Ser Ile Phe Asp Thr Ser Leu Phe
595 600 605
<210> 57
<211> 172
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 57
Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Arg Gly
1 5 10 15
Asn Leu Val Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala
20 25 30
Cys Asp Ile Cys Gly Lys Lys Phe Ala Leu Ser Phe Asn Leu Thr Arg
35 40 45
His Thr Lys Ile His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile
50 55 60
Cys Met Arg Asn Phe Ser Arg Ser Asp Asn Leu Thr Arg His Ile Arg
65 70 75 80
Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Lys Lys
85 90 95
Phe Ala Asp Arg Ser His Leu Ala Arg His Thr Lys Ile His Thr Gly
100 105 110
Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln
115 120 125
Lys Ala His Leu Thr Ala His Ile Arg Thr His Thr Gly Glu Lys Pro
130 135 140
Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg Ser Asp Asn Leu
145 150 155 160
Thr Arg His Thr Lys Ile His Leu Arg Gln Lys Asp
165 170
<210> 58
<211> 516
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 58
cgaccattcc agtgtcgaat ctgcatgcgc aacttcagcc agcggggaaa cctggtgagg 60
catatccgca cccacacggg agagaagcct tttgcctgcg atatttgtgg aaagaagttt 120
gctctgagct tcaatctaac cagacacacc aagattcata ctgggtccca gaaaccgttc 180
cagtgtagga tatgcatgag gaatttctct cggagtgaca acttaacgcg gcatataagg 240
acgcacacag gtgaaaaacc atttgcatgc gacatctgtg gcaaaaagtt tgcggaccgg 300
tctcaccttg cccgacacac aaaaatccat accggcagtc aaaagccctt tcaatgtcgc 360
atttgcatgc gaaacttctc acagaaggcc catttgactg cccatattcg tactcatact 420
ggcgagaaac ctttcgcttg cgatatatgt ggtcgtaagt ttgcacggtc ggacaacctc 480
acacgccaca ctaagataca cctgcggcag aaggac 516
<210> 59
<211> 172
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 59
Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Ser
1 5 10 15
Asn Leu Thr Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala
20 25 30
Cys Asp Ile Cys Gly Lys Lys Phe Ala Asp Lys Arg Thr Leu Ile Arg
35 40 45
His Thr Lys Ile His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile
50 55 60
Cys Met Arg Asn Phe Ser Gln Arg Gly Asn Leu Val Arg His Ile Arg
65 70 75 80
Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Lys Lys
85 90 95
Phe Ala Leu Ser Phe Asn Leu Thr Arg His Thr Lys Ile His Thr Gly
100 105 110
Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg
115 120 125
Ser Asp Asn Leu Thr Arg His Ile Arg Thr His Thr Gly Glu Lys Pro
130 135 140
Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Asp Arg Ser His Leu
145 150 155 160
Ala Arg His Thr Lys Ile His Leu Arg Gln Lys Asp
165 170
<210> 60
<211> 516
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 60
cgaccattcc agtgtcgaat ctgcatgcgc aacttcagcc gaagttccaa cctgacacgg 60
catatccgca cccacacggg agagaagcct tttgcctgcg atatttgtgg aaagaagttt 120
gctgacaagc ggaccttaat ccgccacacc aagattcata ctgggtccca gaaaccgttc 180
cagtgtagga tatgcatgag gaatttctct cagcggggaa atctagtgcg acatataagg 240
acgcacacag gtgaaaaacc atttgcatgc gacatctgtg gcaaaaagtt tgcgctgagc 300
ttcaacttga ctcgtcacac aaaaatccat accggcagtc aaaagccctt tcaatgtcgc 360
atttgcatgc gaaacttctc acggagtgac aatcttacga gacatattcg tactcatact 420
ggcgagaaac ctttcgcttg cgatatatgt ggtcgtaagt ttgcagaccg gagccactta 480
gccaggcaca ctaagataca cctgcggcag aaggac 516
<210> 61
<211> 172
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 61
Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp Arg Ser
1 5 10 15
Ala Leu Ala Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala
20 25 30
Cys Asp Ile Cys Gly Lys Lys Phe Ala Arg Ser Asp Asn Leu Thr Arg
35 40 45
His Thr Lys Ile His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile
50 55 60
Cys Met Arg Asn Phe Ser Gln Ser Gly Asp Leu Thr Arg His Ile Arg
65 70 75 80
Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Lys Lys
85 90 95
Phe Ala Val Arg Gln Thr Leu Lys Gln His Thr Lys Ile His Thr Gly
100 105 110
Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Ala
115 120 125
Ala Gly Asn Leu Thr Arg His Ile Arg Thr His Thr Gly Glu Lys Pro
130 135 140
Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg Ser Asp Asn Leu
145 150 155 160
Thr Arg His Thr Lys Ile His Leu Arg Gln Lys Asp
165 170
<210> 62
<211> 516
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 62
cgaccattcc agtgtcgaat ctgcatgcgc aacttcagcg accggagcgc gctggcacgg 60
catatccgca cccacacggg agagaagcct tttgcctgcg atatttgtgg aaagaagttt 120
gctcgaagtg acaacttaac gcgccacacc aagattcata ctgggtccca gaaaccgttc 180
cagtgtagga tatgcatgag gaatttctct cagtcagggg acctcactcg tcatataagg 240
acgcacacag gtgaaaaacc atttgcatgc gacatctgtg gcaaaaagtt tgcggtacga 300
cagacgctta aacaacacac aaaaatccat accggcagtc aaaagccctt tcaatgtcgc 360
atttgcatgc gaaacttctc agccgctggt aacttgacac gacatattcg tactcatact 420
ggcgagaaac ctttcgcttg cgatatatgt ggtcgtaagt ttgcaagatc tgataatcta 480
acgcgtcaca ctaagataca cctgcggcag aaggac 516
<210> 63
<211> 28
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 63
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Arg Gly Asn Leu
1 5 10 15
Val Arg His Ile Arg Thr His Thr Gly Glu Lys Pro
20 25
<210> 64
<211> 29
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 64
Phe Ala Cys Asp Ile Cys Gly Lys Lys Phe Ala Leu Ser Phe Asn Leu
1 5 10 15
Thr Arg His Thr Lys Ile His Thr Gly Ser Gln Lys Pro
20 25
<210> 65
<211> 28
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 65
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Asp Asn Leu
1 5 10 15
Thr Arg His Ile Arg Thr His Thr Gly Glu Lys Pro
20 25
<210> 66
<211> 29
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 66
Phe Ala Cys Asp Ile Cys Gly Lys Lys Phe Ala Asp Arg Ser His Leu
1 5 10 15
Ala Arg His Thr Lys Ile His Thr Gly Ser Gln Lys Pro
20 25
<210> 67
<211> 28
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 67
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Lys Ala His Leu
1 5 10 15
Thr Ala His Ile Arg Thr His Thr Gly Glu Lys Pro
20 25
<210> 68
<211> 28
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 68
Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg Ser Asp Asn Leu
1 5 10 15
Thr Arg His Thr Lys Ile His Leu Arg Gln Lys Asp
20 25
<210> 69
<211> 28
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 69
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Ser Asn Leu
1 5 10 15
Thr Arg His Ile Arg Thr His Thr Gly Glu Lys Pro
20 25
<210> 70
<211> 29
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 70
Phe Ala Cys Asp Ile Cys Gly Lys Lys Phe Ala Asp Lys Arg Thr Leu
1 5 10 15
Ile Arg His Thr Lys Ile His Thr Gly Ser Gln Lys Pro
20 25
<210> 71
<211> 28
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 71
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Arg Gly Asn Leu
1 5 10 15
Val Arg His Ile Arg Thr His Thr Gly Glu Lys Pro
20 25
<210> 72
<211> 29
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 72
Phe Ala Cys Asp Ile Cys Gly Lys Lys Phe Ala Leu Ser Phe Asn Leu
1 5 10 15
Thr Arg His Thr Lys Ile His Thr Gly Ser Gln Lys Pro
20 25
<210> 73
<211> 28
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 73
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg Ser Asp Asn Leu
1 5 10 15
Thr Arg His Ile Arg Thr His Thr Gly Glu Lys Pro
20 25
<210> 74
<211> 28
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 74
Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Asp Arg Ser His Leu
1 5 10 15
Ala Arg His Thr Lys Ile His Leu Arg Gln Lys Asp
20 25
<210> 75
<211> 28
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 75
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp Arg Ser Ala Leu
1 5 10 15
Ala Arg His Ile Arg Thr His Thr Gly Glu Lys Pro
20 25
<210> 76
<211> 29
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 76
Phe Ala Cys Asp Ile Cys Gly Lys Lys Phe Ala Arg Ser Asp Asn Leu
1 5 10 15
Thr Arg His Thr Lys Ile His Thr Gly Ser Gln Lys Pro
20 25
<210> 77
<211> 28
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 77
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Gly Asp Leu
1 5 10 15
Thr Arg His Ile Arg Thr His Thr Gly Glu Lys Pro
20 25
<210> 78
<211> 29
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 78
Phe Ala Cys Asp Ile Cys Gly Lys Lys Phe Ala Val Arg Gln Thr Leu
1 5 10 15
Lys Gln His Thr Lys Ile His Thr Gly Ser Gln Lys Pro
20 25
<210> 79
<211> 28
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 79
Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Ala Ala Gly Asn Leu
1 5 10 15
Thr Arg His Ile Arg Thr His Thr Gly Glu Lys Pro
20 25
<210> 80
<211> 28
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 80
Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Arg Ser Asp Asn Leu
1 5 10 15
Thr Arg His Thr Lys Ile His Leu Arg Gln Lys Asp
20 25
<210> 81
<211> 4104
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 81
atggacaaga agtactccat tgggctcgct atcggtacca acagcgtcgg ctgggccgtc 60
attacggacg agtacaaggt gccgagcaaa aaattcaaag ttctgggcaa taccgatcgc 120
cacagcataa agaagaacct cattggagcc ctcctgttcg actccgggga gacggccgaa 180
gccacgcggc tcaaaagaac agcacggcgc agatataccc gcagaaagaa tcggatctgc 240
tacctgcagg agatctttag taatgagatg gctaaggtgg atgactcttt cttccatagg 300
ctggaggagt cctttttggt ggaggaggat aaaaagcacg agcgccaccc aatctttggc 360
aatatcgtgg acgaggtggc gtaccatgaa aagtacccaa ccatatatca tctgaggaag 420
aagctggtag acagtactga taaggctgac ttgcggttga tctatctcgc gctggcgcac 480
atgatcaaat ttcggggaca cttcctcatc gagggggacc tgaacccaga caacagcgat 540
gtcgacaaac tctttatcca actggttcag acttacaatc agcttttcga ggagaacccg 600
atcaacgcat ccggcgttga cgccaaagca atcctgagcg ctaggctgtc caaatcccgg 660
cggctcgaaa acctcatcgc acagctccct ggggagaaga agaacggcct gtttggtaat 720
cttatcgccc tgtcactcgg gctgaccccc aactttaaat ctaacttcga cctggccgaa 780
gatgccaagc tgcaactgag caaagacacc tacgatgatg atctcgacaa tctgctggcc 840
cagatcggcg accagtacgc agaccttttt ttggcggcaa agaacctgtc agacgccatt 900
ctgctgagtg atattctgcg agtgaacacg gagatcacca aagctccgct gagcgctagt 960
atgatcaagc gctatgatga gcaccaccaa gacttgactt tgctgaaggc ccttgtcaga 1020
cagcaactgc ctgagaagta caaggaaatt ttcttcgatc agtctaaaaa tggctacgcc 1080
ggatacattg acggcggagc aagccaggag gaattttaca aatttattaa gcccatcttg 1140
gaaaaaatgg acggcaccga ggagctgctg gtaaagctga acagagaaga tctgttgcgc 1200
aaacagcgca ctttcgacaa tggaagcatc ccccaccaga ttcacctggg cgaactgcac 1260
gctatcctca ggcggcaaga ggatttctac ccctttttga aagataacag ggaaaagatt 1320
gagaaaatcc tcacatttcg gataccctac tatgtaggcc ccctcgctcg gggaaattcc 1380
agattcgcgt ggatgactcg caaatcagaa gagaccatca ctccctggaa cttcgaggaa 1440
gtcgtggata agggggcctc tgcccagtcc ttcatcgaaa ggatgactaa ctttgataaa 1500
aatctgccta acgaaaaggt gcttcctaaa cactctctgc tgtacgagta cttcacagtt 1560
tataacgagc tcaccaaggt caaatacgtc acagaaggga tgagaaagcc agcattcctg 1620
tctggagagc agaagaaagc tatcgtggac ctcctcttca agacgaaccg gaaagttacc 1680
gtgaaacagc tcaaagaaga ctatttcaaa aagattgaat gtttcgactc tgttgaaatc 1740
agcggagtgg aggatcgctt caacgcatcc ctgggaacgt atcacgatct cctgaaaatc 1800
attaaagaca aggacttcct ggacaatgag gagaacgagg acattcttga ggacattgtc 1860
ctcaccctta cgttgtttga agatagggag atgattgaag aacgcttgaa aacttacgct 1920
catctcttcg acgacaaagt catgaaacag ctcaagagac gccgatatac aggatggggg 1980
cggctgtcaa gaaaactgat caatggcatc cgagacaagc agagtggaaa gacaatcctg 2040
gattttctta agtccgatgg atttgccaac cggaacttca tgcagttgat ccatgatgac 2100
tctctcacct ttaaggagga catccagaaa gcacaagttt ctggccaggg ggacagtctt 2160
cacgagcaca tcgctaatct tgcaggtagc ccagctatca aaaagggaat actgcagacc 2220
gttaaggtcg tggatgaact cgtcaaagta atgggaaggc ataagcccga gaatatcgtt 2280
atcgagatgg cccgagagaa ccaaactacc cagaagggac agaagaacag tagggaaagg 2340
atgaagagga ttgaagaggg tataaaagaa ctggggtccc aaatccttaa ggaacaccca 2400
gttgaaaaca cccagcttca gaatgagaag ctctacctgt actacctgca gaacggcagg 2460
gacatgtacg tggatcagga actggacatc aaccggttgt ccgactacga cgtggatgct 2520
atcgtgcccc aaagctttct caaagatgat tctattgata ataaagtgtt gacaagatcc 2580
gataaaaata gagggaagag tgataacgtc ccctcagaag aagttgtcaa gaaaatgaaa 2640
aattattggc ggcagctgct gaacgccaaa ctgatcacac aacggaagtt cgataatctg 2700
actaaggctg aacgaggtgg cctgtctgag ttggataaag ccggcttcat caaaaggcag 2760
cttgttgaga cacgccagat caccaagcac gtggcccaaa ttctcgattc acgcatgaac 2820
accaagtacg atgaaaatga caaactgatt cgagaggtga aagttattac tctgaagtct 2880
aagctggtct cagatttcag aaaggacttt cagttttata aggtgagaga gatcaacaat 2940
taccaccatg cgcatgatgc ctacctgaat gcagtggtag gcactgcact tatcaaaaaa 3000
tatcccaagc tggaatctga atttgtttac ggagactata aagtgtacga tgttaggaaa 3060
atgatcgcaa agtctgagca ggaaataggc aaggccaccg ctaagtactt cttttacagc 3120
aatattatga attttttcaa gaccgagatt acactggcca atggagagat tcggaagcga 3180
ccacttatcg aaacaaacgg agaaacagga gaaatcgtgt gggacaaggg tagggatttc 3240
gcgacagtcc gcaaggtcct gtccatgccg caggtgaaca tcgttaaaaa gaccgaagta 3300
cagaccggag gcttctccaa ggaaagtatc ctcccgaaaa ggaacagcga caagctgatc 3360
gcacgcaaaa aagattggga ccccaagaaa tacggcggat tcgattctcc tacagtcgct 3420
tacagtgtac tggttgtggc caaagtggag aaagggaagt ctaaaaaact caaaagcgtc 3480
aaggaactgc tgggcatcac aatcatggag cgatccagct tcgagaaaaa ccccatcgac 3540
tttctcgaag cgaaaggata taaagaggtc aaaaaagacc tcatcattaa gctgcccaag 3600
tactctctct ttgagcttga aaacggccgg aaacgaatgc tcgctagtgc gggcgagctg 3660
cagaaaggta acgagctggc actgccctct aaatacgtta atttcttgta tctggccagc 3720
cactatgaaa agctcaaagg gtctcccgaa gataatgagc agaagcagct gttcgtggaa 3780
caacacaaac actaccttga tgagatcatc gagcaaataa gcgagttctc caaaagagtg 3840
atcctcgccg acgctaacct cgataaggtg ctttctgctt acaataagca cagggataag 3900
cccatcaggg agcaggcaga aaacattatc cacttgttta ctctgaccaa cttgggcgcg 3960
cctgcagcct tcaagtactt cgacaccacc atagacagaa agcggtacac ctctacaaag 4020
gaggtcctgg acgccacact gattcatcag tcaattacgg ggctctatga aacaagaatc 4080
gacctctctc agctcggtgg agac 4104
<210> 82
<211> 1368
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 82
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
<210> 83
<211> 97
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 83
gaggtaccat agagtgaggc ggttttagag ctagaaatag caagttaaaa taaggctagt 60
ccgttatcaa cttgaaaaag tggcaccgag tcggtgc 97
<210> 84
<211> 97
<212> RNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 84
gagguaccau agagugaggc gguuuuagag cuagaaauag caaguuaaaa uaaggcuagu 60
ccguuaucaa cuugaaaaag uggcaccgag ucggugc 97
<210> 85
<211> 21
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 85
gaggtaccat agagtgaggc g 21
<210> 86
<211> 21
<212> RNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 86
gagguaccau agagugaggc g 21
<210> 87
<211> 99
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 87
accgaggcga ggatgaagcc gaggttttag agctagaaat agcaagttaa aataaggcta 60
gtccgttatc aacttgaaaa agtggcaccg agtcggtgc 99
<210> 88
<211> 99
<212> RNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 88
accgaggcga ggaugaagcc gagguuuuag agcuagaaau agcaaguuaa aauaaggcua 60
guccguuauc aacuugaaaa aguggcaccg agucggugc 99
<210> 89
<211> 23
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 89
accgaggcga ggatgaagcc gag 23
<210> 90
<211> 23
<212> RNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 90
accgaggcga ggaugaagcc gag 23
<210> 91
<211> 100
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 91
accgaagccg agaggatact gcaggtttta gagctagaaa tagcaagtta aaataaggct 60
agtccgttat caacttgaaa aagtggcacc gagtcggtgc 100
<210> 92
<211> 100
<212> RNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 92
accgaagccg agaggauacu gcagguuuua gagcuagaaa uagcaaguua aaauaaggcu 60
aguccguuau caacuugaaa aaguggcacc gagucggugc 100
<210> 93
<211> 24
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 93
accgaagccg agaggatact gcag 24
<210> 94
<211> 24
<212> RNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 94
accgaagccg agaggauacu gcag 24
<210> 95
<211> 1569
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 95
gacgcattgg acgattttga tctggatatg ctgggaagtg acgccctcga tgattttgac 60
cttgacatgc ttggttcgga tgcccttgat gactttgacc tcgacatgct cggcagtgac 120
gcccttgatg atttcgacct ggacatgctg attaactcta gaagttccgg atctccgaaa 180
aagaaacgca aagttggtag ccagtacctg cccgacaccg acgaccggca ccggatcgag 240
gaaaagcgga agcggaccta cgagacattc aagagcatca tgaagaagtc ccccttcagc 300
ggccccaccg accctagacc tccacctaga agaatcgccg tgcccagcag atccagcgcc 360
agcgtgccaa aacctgcccc ccagccttac cccttcacca gcagcctgag caccatcaac 420
tacgacgagt tccctaccat ggtgttcccc agcggccaga tctctcaggc ctctgctctg 480
gctccagccc ctcctcaggt gctgcctcag gctcctgctc ctgcaccagc tccagccatg 540
gtgtctgcac tggctcaggc accagcaccc gtgcctgtgc tggctcctgg acctccacag 600
gctgtggctc caccagcccc taaacctaca caggccggcg agggcacact gtctgaagct 660
ctgctgcagc tgcagttcga cgacgaggat ctgggagccc tgctgggaaa cagcaccgat 720
cctgccgtgt tcaccgacct ggccagcgtg gacaacagcg agttccagca gctgctgaac 780
cagggcatcc ctgtggcccc tcacaccacc gagcccatgc tgatggaata ccccgaggcc 840
atcacccggc tcgtgacagg cgctcagagg cctcctgatc cagctcctgc ccctctggga 900
gcaccaggcc tgcctaatgg actgctgtct ggcgacgagg acttcagctc tatcgccgat 960
atggatttct cagccttgct gggctctggc agcggcagcc gggattccag ggaagggatg 1020
tttttgccga agcctgaggc cggctccgct attagtgacg tgtttgaggg ccgcgaggtg 1080
tgccagccaa aacgaatccg gccatttcat cctccaggaa gtccatgggc caaccgccca 1140
ctccccgcca gcctcgcacc aacaccaacc ggtccagtac atgagccagt cgggtcactg 1200
accccggcac cagtccctca gccactggat ccagcgcccg cagtgactcc cgaggccagt 1260
cacctgttgg aggatcccga tgaagagacg agccaggctg tcaaagccct tcgggagatg 1320
gccgatactg tgattcccca gaaggaagag gctgcaatct gtggccaaat ggacctttcc 1380
catccgcccc caaggggcca tctggatgag ctgacaacca cacttgagtc catgaccgag 1440
gatctgaacc tggactcacc cctgaccccg gaattgaacg agattctgga taccttcctg 1500
aacgacgagt gcctcttgca tgccatgcat atcagcacag gactgtccat cttcgacaca 1560
tctctgttt 1569
<210> 96
<211> 523
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 96
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu
1 5 10 15
Asp Asp Phe Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe
20 25 30
Asp Leu Asp Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp
35 40 45
Met Leu Ile Asn Ser Arg Ser Ser Gly Ser Pro Lys Lys Lys Arg Lys
50 55 60
Val Gly Ser Gln Tyr Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu
65 70 75 80
Glu Lys Arg Lys Arg Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys Lys
85 90 95
Ser Pro Phe Ser Gly Pro Thr Asp Pro Arg Pro Pro Pro Arg Arg Ile
100 105 110
Ala Val Pro Ser Arg Ser Ser Ala Ser Val Pro Lys Pro Ala Pro Gln
115 120 125
Pro Tyr Pro Phe Thr Ser Ser Leu Ser Thr Ile Asn Tyr Asp Glu Phe
130 135 140
Pro Thr Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala Leu
145 150 155 160
Ala Pro Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala Pro Ala Pro
165 170 175
Ala Pro Ala Met Val Ser Ala Leu Ala Gln Ala Pro Ala Pro Val Pro
180 185 190
Val Leu Ala Pro Gly Pro Pro Gln Ala Val Ala Pro Pro Ala Pro Lys
195 200 205
Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu Leu Gln Leu
210 215 220
Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp
225 230 235 240
Pro Ala Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser Glu Phe Gln
245 250 255
Gln Leu Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr Thr Glu Pro
260 265 270
Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val Thr Gly Ala
275 280 285
Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu
290 295 300
Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp
305 310 315 320
Met Asp Phe Ser Ala Leu Leu Gly Ser Gly Ser Gly Ser Arg Asp Ser
325 330 335
Arg Glu Gly Met Phe Leu Pro Lys Pro Glu Ala Gly Ser Ala Ile Ser
340 345 350
Asp Val Phe Glu Gly Arg Glu Val Cys Gln Pro Lys Arg Ile Arg Pro
355 360 365
Phe His Pro Pro Gly Ser Pro Trp Ala Asn Arg Pro Leu Pro Ala Ser
370 375 380
Leu Ala Pro Thr Pro Thr Gly Pro Val His Glu Pro Val Gly Ser Leu
385 390 395 400
Thr Pro Ala Pro Val Pro Gln Pro Leu Asp Pro Ala Pro Ala Val Thr
405 410 415
Pro Glu Ala Ser His Leu Leu Glu Asp Pro Asp Glu Glu Thr Ser Gln
420 425 430
Ala Val Lys Ala Leu Arg Glu Met Ala Asp Thr Val Ile Pro Gln Lys
435 440 445
Glu Glu Ala Ala Ile Cys Gly Gln Met Asp Leu Ser His Pro Pro Pro
450 455 460
Arg Gly His Leu Asp Glu Leu Thr Thr Thr Leu Glu Ser Met Thr Glu
465 470 475 480
Asp Leu Asn Leu Asp Ser Pro Leu Thr Pro Glu Leu Asn Glu Ile Leu
485 490 495
Asp Thr Phe Leu Asn Asp Glu Cys Leu Leu His Ala Met His Ile Ser
500 505 510
Thr Gly Leu Ser Ile Phe Asp Thr Ser Leu Phe
515 520
<210> 97
<211> 1939
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 97
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
Gly Thr Gly Gly Pro Pro Lys Lys Lys Arg Lys Val Ala Ala Ala
1370 1375 1380
Ser Arg Tyr Pro Arg Gly Asp Ala Leu Asp Asp Phe Asp Leu Asp
1385 1390 1395
Met Leu Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu
1400 1405 1410
Gly Ser Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Gly Ser
1415 1420 1425
Asp Ala Leu Asp Asp Phe Asp Leu Asp Met Leu Ile Asn Ser Arg
1430 1435 1440
Ser Ser Gly Ser Pro Lys Lys Lys Arg Lys Val Gly Ser Gln Tyr
1445 1450 1455
Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu Glu Lys Arg Lys
1460 1465 1470
Arg Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys Lys Ser Pro Phe
1475 1480 1485
Ser Gly Pro Thr Asp Pro Arg Pro Pro Pro Arg Arg Ile Ala Val
1490 1495 1500
Pro Ser Arg Ser Ser Ala Ser Val Pro Lys Pro Ala Pro Gln Pro
1505 1510 1515
Tyr Pro Phe Thr Ser Ser Leu Ser Thr Ile Asn Tyr Asp Glu Phe
1520 1525 1530
Pro Thr Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala Ser Ala
1535 1540 1545
Leu Ala Pro Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala Pro
1550 1555 1560
Ala Pro Ala Pro Ala Met Val Ser Ala Leu Ala Gln Ala Pro Ala
1565 1570 1575
Pro Val Pro Val Leu Ala Pro Gly Pro Pro Gln Ala Val Ala Pro
1580 1585 1590
Pro Ala Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu
1595 1600 1605
Ala Leu Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu
1610 1615 1620
Leu Gly Asn Ser Thr Asp Pro Ala Val Phe Thr Asp Leu Ala Ser
1625 1630 1635
Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro
1640 1645 1650
Val Ala Pro His Thr Thr Glu Pro Met Leu Met Glu Tyr Pro Glu
1655 1660 1665
Ala Ile Thr Arg Leu Val Thr Gly Ala Gln Arg Pro Pro Asp Pro
1670 1675 1680
Ala Pro Ala Pro Leu Gly Ala Pro Gly Leu Pro Asn Gly Leu Leu
1685 1690 1695
Ser Gly Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser
1700 1705 1710
Ala Leu Leu Gly Ser Gly Ser Gly Ser Arg Asp Ser Arg Glu Gly
1715 1720 1725
Met Phe Leu Pro Lys Pro Glu Ala Gly Ser Ala Ile Ser Asp Val
1730 1735 1740
Phe Glu Gly Arg Glu Val Cys Gln Pro Lys Arg Ile Arg Pro Phe
1745 1750 1755
His Pro Pro Gly Ser Pro Trp Ala Asn Arg Pro Leu Pro Ala Ser
1760 1765 1770
Leu Ala Pro Thr Pro Thr Gly Pro Val His Glu Pro Val Gly Ser
1775 1780 1785
Leu Thr Pro Ala Pro Val Pro Gln Pro Leu Asp Pro Ala Pro Ala
1790 1795 1800
Val Thr Pro Glu Ala Ser His Leu Leu Glu Asp Pro Asp Glu Glu
1805 1810 1815
Thr Ser Gln Ala Val Lys Ala Leu Arg Glu Met Ala Asp Thr Val
1820 1825 1830
Ile Pro Gln Lys Glu Glu Ala Ala Ile Cys Gly Gln Met Asp Leu
1835 1840 1845
Ser His Pro Pro Pro Arg Gly His Leu Asp Glu Leu Thr Thr Thr
1850 1855 1860
Leu Glu Ser Met Thr Glu Asp Leu Asn Leu Asp Ser Pro Leu Thr
1865 1870 1875
Pro Glu Leu Asn Glu Ile Leu Asp Thr Phe Leu Asn Asp Glu Cys
1880 1885 1890
Leu Leu His Ala Met His Ile Ser Thr Gly Leu Ser Ile Phe Asp
1895 1900 1905
Thr Ser Leu Phe Pro Lys Lys Lys Arg Lys Val Arg Ser Lys Arg
1910 1915 1920
Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Leu
1925 1930 1935
Asp
<210> 98
<211> 112
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 98
gaaacaagct atttgctgat ttgtattagg taccatagag tgaggcgagg atgaagccga 60
gaggatactg cagaggtctc tggtgcaatg tgtgtatgtg tgcgtttgtg tg 112
<210> 99
<211> 71
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 99
gaaacaagct atttgctgat ttgtattagg taccatagag tgaggcgagg atgaagccga 60
gaggatactg c 71
<210> 100
<211> 112
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 100
gaaacaagct atttgctgat ttgtattagg taccatagag tgaggcgagg atgaagccga 60
gaggatactg cagaggtctc tggtgcaatg tgtgtatgtg tgcgtttgtg tg 112
<210> 101
<211> 108
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<220>
<221> 生物学特性无法用特性表关键词描述的序列
<222> (52)..(52)
<223> n为a、c、g或t
<400> 101
gaaacaagct atttgctgat ttgtattagg taccatagag tgaggcgagg angaagccga 60
gaggatactg cagaggtctc tggtgcaatg tgtgtatgtg tgcgtttg 108
<210> 102
<211> 84
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 102
ttccagtgtc gaatctgcat gcgcaacttc agccagcggg gaaacctggt gaggcatatc 60
cgcacccaca cgggagagaa gcct 84
<210> 103
<211> 87
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 103
tttgcctgcg atatttgtgg aaagaagttt gctctgagct tcaatctaac cagacacacc 60
aagattcata ctgggtccca gaaaccg 87
<210> 104
<211> 85
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 104
ttccagtgta ggatatgcat gaggaatttc tctcggagtg acaacttaac gcggcatata 60
aggacgcaca caggtgaaaa aacaa 85
<210> 105
<211> 87
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 105
tttgcatgcg acatctgtgg caaaaagttt gcggaccggt ctcaccttgc ccgacacaca 60
aaaatccata ccggcagtca aaagccc 87
<210> 106
<211> 84
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 106
tttcaatgtc gcatttgcat gcgaaacttc tcacagaagg cccatttgac tgcccatatt 60
cgtactcata ctggcgagaa acct 84
<210> 107
<211> 84
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 107
ttcgcttgcg atatatgtgg tcgtaagttt gcacggtcgg acaacctcac acgccacact 60
aagatacacc tgcggcagaa ggac 84
<210> 108
<211> 85
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 108
ttccagtgtc gaatctgcat gcgcaacttc agcccgaatg tccaacctga cacggcatat 60
ccgcacccac acgggagaga agcct 85
<210> 109
<211> 87
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 109
tttgcctgcg atatttgtgg aaagaagttt gctgacaagc ggaccttaat ccgccacacc 60
aagattcata ctgggtccca gaaaccg 87
<210> 110
<211> 84
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 110
ttccagtgta ggatatgcat gaggaatttc tctcagcggg gaaatctagt gcgacatata 60
aggacgcaca caggtgaaaa acca 84
<210> 111
<211> 87
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 111
tttgcatgcg acatctgtgg caaaaagttt gcgctgagct tcaacttgac tcgtcacaca 60
aaaatccata ccggcagtca aaagccc 87
<210> 112
<211> 84
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 112
tttcaatgtc gcatttgcat gcgaaacttc tcacggagtg acaatcttac gagacatatt 60
cgtactcata ctggcgagaa acct 84
<210> 113
<211> 84
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 113
ttcgcttgcg atatatgtgg tcgtaagttt gcagaccgga gccacttagc caggcacact 60
aagatacacc tgcggcagaa ggac 84
<210> 114
<211> 84
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 114
ttccagtgtc gaatctgcat gcgcaacttc agcgaccgga gcgcgctggc acggcatatc 60
cgcacccaca cgggagagaa gcct 84
<210> 115
<211> 87
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 115
tttgcctgcg atatttgtgg aaagaagttt gctcgaagtg acaacttaac gcgccacacc 60
aagattcata ctgggtccca gaaaccg 87
<210> 116
<211> 84
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 116
ttccagtgta ggatatgcat gaggaatttc tctcagtcag gggacctcac tcgtcatata 60
aggacgcaca caggtgaaaa acca 84
<210> 117
<211> 87
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 117
tttgcatgcg acatctgtgg caaaaagttt gcggtacgac agacgcttaa acaacacaca 60
aaaatccata ccggcagtca aaagccc 87
<210> 118
<211> 84
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 118
tttcaatgtc gcatttgcat gcgaaacttc tcagccgctg gtaacttgac acgacatatt 60
cgtactcata ctggcgagaa acct 84
<210> 119
<211> 84
<212> DNA
<213> 人工序列(Artificial sequence)
<220>
<223> 合成
<400> 119
ttcgcttgcg atatatgtgg tcgtaagttt gcaagatctg ataatctaac gcgtcacact 60
aagatacacc tgcggcagaa ggac 84
<210> 120
<211> 5
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成多肽
<400> 120
Thr Gly Glu Lys Pro
1 5
<210> 121
<211> 6
<212> PRT
<213> 人工序列(Artificial sequence)
<220>
<223> 合成多肽
<400> 121
Thr Gly Ser Gln Lys Pro
1 5

Claims (88)

1.一种分离的核酸,其包含被配置来表达融合至至少一个转录调控子结构域的至少一个DNA结合结构域的转基因,其中所述DNA结合结构域结合至靶基因或靶基因的调控区,并且其中所述靶基因编码电压门控钠通道。
2.如权利要求1所述的分离的核酸,其中所述转基因的侧翼为源自腺相关病毒(AAV)的反向末端重复(ITR)。
3.如权利要求1或2所述的分离的核酸,其中所述转录调控子结构域上调所述靶基因的表达。
4.如权利要求1-3中任一项所述的分离的核酸,其中所述至少一个DNA结合结构域结合至所述靶基因的非翻译区。
5.如权利要求4所述的分离的核酸,其中所述非翻译区为增强子、启动子、内含子和/或阻遏子。
6.如权利要求4或5中任一项所述的分离的核酸,其中所述DNA结合结构域结合在所述靶基因的调控区的上游2-2000bp之间或下游2-2000bp之间。
7.如权利要求1-6中任一项所述的分离的核酸,其中所述至少一个DNA结合结构域编码锌指蛋白(ZFP)、转录激活因子样效应物(TALE)、dCas蛋白(例如,dCas9或dCas12a)和/或同源结构域。
8.如权利要求1-7中任一项所述的分离的核酸,其中所述至少一个DNA结合结构域结合至SEQ ID NO:5-7中的任一个中列出的核酸序列。
9.如权利要求1-8中任一项所述的分离的核酸,其中所述至少一个DNA结合结构域为锌指蛋白,其包含由具有SEQ ID NO:11-16、23-28或35-40中的任一个中列出的序列的核酸编码的识别螺旋。
10.如权利要求9所述的分离的核酸,其中所述至少一个DNA结合结构域为锌指蛋白,其包含由包含SEQ ID NO:11的核酸编码的识别螺旋、由包含SEQ ID NO:12的核酸编码的识别螺旋、由包含SEQ ID NO:13的核酸编码的识别螺旋、由包含SEQ ID NO:14的核酸编码的识别螺旋、由包含SEQ ID NO:15的核酸编码的识别螺旋和/或由包含SEQ ID NO:16的核酸编码的识别螺旋。
11.如权利要求9所述的分离的核酸,其中所述至少一个DNA结合结构域为锌指蛋白,其包含由包含SEQ ID NO:23的核酸编码的识别螺旋、由包含SEQ ID NO:24的核酸编码的识别螺旋、由包含SEQ ID NO:25的核酸编码的识别螺旋、由包含SEQ ID NO:26的核酸编码的识别螺旋、由包含SEQ ID NO:27的核酸编码的识别螺旋和/或由包含SEQ ID NO:28的核酸编码的识别螺旋。
12.如权利要求9所述的分离的核酸,其中所述至少一个DNA结合结构域为锌指蛋白,其包含由包含SEQ ID NO:35的核酸编码的识别螺旋、由包含SEQ ID NO:36的核酸编码的识别螺旋、由包含SEQ ID NO:37的核酸编码的识别螺旋、由包含SEQ ID NO:38的核酸编码的识别螺旋、由包含SEQ ID NO:39的核酸编码的识别螺旋和/或由包含SEQ ID NO:40的核酸编码的识别螺旋。
13.如权利要求1-12中任一项所述的分离的核酸,其中所述至少一个DNA结合结构域为锌指蛋白,其包含SEQ ID NO:17-22、29-34或41-46中的任一个中列出的氨基酸序列。
14.如权利要求13所述的分离的核酸,其中所述至少一个DNA结合结构域为锌指蛋白,其包含含SEQ ID NO:17的识别螺旋、含SEQ ID NO:18的识别螺旋、含SEQ ID NO:19的识别螺旋、含SEQ ID NO:20的识别螺旋、含SEQ ID NO:21的识别螺旋和/或含SEQ ID NO:22的识别螺旋。
15.如权利要求13所述的分离的核酸,其中所述至少一个DNA结合结构域为锌指蛋白,其包含含SEQ ID NO:29的识别螺旋、含SEQ ID NO:30的识别螺旋、含SEQ ID NO:31的识别螺旋、含SEQ ID NO:32的识别螺旋、含SEQ ID NO:33的识别螺旋和/或含SEQ ID NO:34的识别螺旋。
16.如权利要求13所述的分离的核酸,其中所述至少一个DNA结合结构域为锌指蛋白,其包含含SEQ ID NO:41的识别螺旋、含SEQ ID NO:42的识别螺旋、含SEQ ID NO:43的识别螺旋、含SEQ ID NO:44的识别螺旋、含SEQ ID NO:45的识别螺旋和/或含SEQ ID NO:46的识别螺旋。
17.如权利要求1-7中任一项所述的分离的核酸,其中所述至少一个DNA结合结构域为dCas蛋白,任选地dCas9蛋白,并且其中所述分离的核酸还包含至少一种指导核酸。
18.如权利要求17所述的分离的核酸,其中所述指导核酸包含靶向SCN1A的间隔区序列。
19.如权利要求17或18所述的分离的核酸,其中所述指导核酸包含具有SEQ ID NO:85、86、89、90、93或94中的任一个的核苷酸序列的间隔区序列。
20.如权利要求17-19中任一项所述的分离的核酸,其中所述指导核酸包含SEQ ID NO:83-94中的任一个的核苷酸序列。
21.如权利要求1-16中任一项所述的分离的核酸,其中所述至少一个转录调控子结构域包含VPR、Rta、p65或Hsf1反式激活因子或其任何组合。
22.如权利要求1-21中任一项所述的分离的核酸,其中所述至少一个反式激活结构域由SEQ ID NO:47中列出的核酸序列编码。
23.如权利要求1-22中任一项所述的分离的核酸,其中所述至少一个反式激活结构域由SEQ ID NO:48中列出的氨基酸序列编码。
24.如权利要求1-23中任一项所述的分离的核酸,其中所述核酸包含AAV2 ITR。
25.如权利要求24所述的分离的核酸,其中所述ITR为ΔTR和/或mTR。
26.如权利要求1-25中任一项所述的分离的核酸,其中所述转基因可操作地连接到启动子。
27.如权利要求26所述的分离的核酸,其中所述启动子为组织特异性启动子,任选地,其中所述启动子为神经元启动子,诸如SST、NPY、磷酸激活的谷氨酰胺酶(PAG)、囊泡谷氨酸转运蛋白-1(VGLUT1)、谷氨酸脱羧酶65和57(GAD65、GAD67)、突触蛋白I、a-CamKII、Dock10、Prox1、小白蛋白(PV)、生长抑素(SST)、胆囊收缩素(CCK)、钙视网膜蛋白(CR)或神经肽Y(NPY)。
28.如权利要求1-27中任一项所述的分离的核酸,其中所述至少一个DNA结合结构域通过接头结构域与所述至少一个转录调控子结构域融合。
29.如权利要求28所述的分离的核酸,其中所述接头结构域任选地为:
(i)柔性接头,任选地由甘氨酸组成,或
(ii)可裂解的接头。
30.如权利要求1-29中任一项所述的分离的核酸,其中所述转基因编码1个DNA结合结构域、2个DNA结合结构域、3个DNA结合结构域、4个DNA结合结构域、5个DNA结合结构域、6个DNA结合结构域、7个DNA结合结构域域、8个DNA结合结构域、9个DNA结合结构域或10个DNA结合结构域。
31.如权利要求1-30中任一项所述的分离的核酸,其中所述转基因编码1个转录调控子结构域、2个转录调控子结构域、3个转录调控子结构域、4个转录调控子结构域、5个转录调控子结构域、6个转录调控子结构域、7个转录调控子结构域域、8个转录调控子结构域、9个转录调控子结构域或10个转录调控子结构域。
32.一种重组AAV(rAAV),其包含:
(i)核酸,所述核酸包含编码融合至至少一个转录调控子结构域的至少一个DNA结合结构域,其中所述DNA结合结构域结合至靶基因或靶基因的调控区,其中所述靶基因编码电压门控钠通道,
(ii)至少一种衣壳蛋白。
33.如权利要求32所述的rAAV,其中所述转基因的侧翼为源自腺相关病毒(AAV)的反向末端重复(ITR)。
34.如权利要求32或权利要求33所述的rAAV,其中所述转录调控因子上调所述靶基因的表达。
35.如权利要求32-34中任一项所述的rAAV,其中所述至少一个DNA结合结构域结合所述靶基因的非翻译区。
36.如权利要求35所述的rAAV,其中所述非翻译区为增强子、启动子、内含子和/或阻遏子。
37.如权利要求35-36中任一项所述的rAAV,其中所述DNA结合结构域结合在所述靶基因的调控区的上游2-2000bp之间或下游2-2000bp之间。
38.如权利要求32-37中任一项所述的rAAV,其中所述至少一个DNA结合结构域编码锌指蛋白(ZFP)、转录激活因子样效应物(TALE)、dCas蛋白(例如,dCas9或dCas12a)和/或同源结构域。
39.如权利要求32-38中任一项所述的rAAV,其中所述至少一个DNA结合结构域结合到SEQ ID NO:5-7中的任一个中列出的核酸序列。
40.如权利要求32-39中任一项所述的rAAV,其中所述至少一个DNA结合结构域为锌指蛋白,其包含由具有SEQ ID NO:11-16、23-28或35-40中的任一个中列出的序列的核酸编码的识别螺旋。
41.如权利要求40所述的rAAV,其中所述至少一个DNA结合结构域为锌指蛋白,其包含由包含SEQ ID NO:11的核酸编码的识别螺旋、由包含SEQ ID NO:12的核酸编码的识别螺旋、由包含SEQ ID NO:13的核酸编码的识别螺旋、由包含SEQ ID NO:14的核酸编码的识别螺旋、由包含SEQ ID NO:15的核酸编码的识别螺旋和/或由包含SEQ ID NO:16的核酸编码的识别螺旋。
42.如权利要求40所述的rAAV,其中所述至少一个DNA结合结构域为锌指蛋白,其包含由包含SEQ ID NO:23的核酸编码的识别螺旋、由包含SEQ ID NO:24的核酸编码的识别螺旋、由包含SEQ ID NO:25的核酸编码的识别螺旋、由包含SEQ ID NO:26的核酸编码的识别螺旋、由包含SEQ ID NO:27的核酸编码的识别螺旋和/或由包含SEQ ID NO:28的核酸编码的识别螺旋。
43.如权利要求40所述的rAAV,其中所述至少一个DNA结合结构域为锌指蛋白,其包含由包含SEQ ID NO:35的核酸编码的识别螺旋、由包含SEQ ID NO:36的核酸编码的识别螺旋、由包含SEQ ID NO:37的核酸编码的识别螺旋、由包含SEQ ID NO:38的核酸编码的识别螺旋、由包含SEQ ID NO:39的核酸编码的识别螺旋和/或由包含SEQ ID NO:40的核酸编码的识别螺旋。
44.如权利要求32-43中任一项所述的rAAV,其中所述至少一个DNA结合结构域为锌指蛋白,其包含SEQ ID NO:17-22、29-34或41-46中的任一个中列出的序列。
45.如权利要求44所述的rAAV,其中所述至少一个DNA结合结构域为锌指蛋白,其包含含SEQ ID NO:17的识别螺旋、含SEQ ID NO:18的识别螺旋、含SEQ ID NO:19的识别螺旋、含SEQ ID NO:20的识别螺旋、含SEQ ID NO:21的识别螺旋和/或含SEQ ID NO:22的识别螺旋。
46.如权利要求44所述的rAAV,其中所述至少一个DNA结合结构域为锌指蛋白,其包含含SEQ ID NO:29的识别螺旋、含SEQ ID NO:30的识别螺旋、含SEQ ID NO:31的识别螺旋、含SEQ ID NO:32的识别螺旋、含SEQ ID NO:33的识别螺旋和/或含SEQ ID NO:34的识别螺旋。
47.如权利要求44所述的rAAV,其中所述至少一个DNA结合结构域为锌指蛋白,其包含含SEQ ID NO:41的识别螺旋、含SEQ ID NO:42的识别螺旋、含SEQ ID NO:43的识别螺旋、含SEQ ID NO:44的识别螺旋、含SEQ ID NO:45的识别螺旋和/或含SEQ ID NO:46的识别螺旋。
48.如权利要求32-37中任一项所述的rAAV,其中所述至少一个DNA结合结构域为dCas蛋白,任选地dCas9蛋白,并且其中所述rAAV还包含至少一种指导核酸。
49.如权利要求48所述的rAAV,其中所述指导核酸包含靶向SCN1A的间隔区序列。
50.如权利要求48或49所述的rAAV,其中所述指导核酸包含具有SEQ ID NO:85、86、89、90、93或94中的任一个的核苷酸序列的间隔区序列。
51.如权利要求48-50中任一项所述的rAAV,其中所述指导核酸包含SEQ ID NO:83-94中的任一个的核苷酸序列。
52.如权利要求32-47中任一项所述的rAAV,其中所述至少一个转录调控子结构域为源自VPR、Rta、p65、Hsf1或其任何组合的反式激活因子。
53.如权利要求32-52中任一项所述的rAAV,其中编码所述至少一种转录调控子转基因的转基因包含在SEQ ID NO:47中列出的序列。
54.如权利要求32-53中任一项所述的核酸,其中所述至少一个转录调控子结构域由SEQ ID NO:48中列出的氨基酸序列编码。
55.如权利要求32-54中任一项所述的rAAV,其中所述至少一个DNA结合结构域通过接头结构域与所述至少一个转录调控子结构域融合。
56.如权利要求55所述的rAAV,其中所述接头结构域任选地为:
(i)柔性接头,任选地由甘氨酸组成,或
(ii)可裂解的接头。
57.如权利要求32-56中任一项所述的rAAV,其中所述转基因编码1个DNA结合结构域、2个DNA结合结构域、3个DNA结合结构域、4个DNA结合结构域、5个DNA结合结构域、6个DNA结合结构域、7个DNA结合结构域域、8个DNA结合结构域、9个DNA结合结构域或10个DNA结合结构域。
58.如权利要求32-57中任一项所述的rAAV,其中所述转基因编码1个转录调控子结构域、2个转录调控子结构域、3个转录调控子结构域、4个转录调控子结构域、5个转录调控子结构域、6个转录调控子结构域、7个转录调控子结构域域、8个转录调控子结构域、9个转录调控子结构域或10个转录调控子结构域。
59.如权利要求32-58中任一项所述的rAAV,其中所述AAV衣壳血清型选自由以下组成的组:AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAVrh8、AAV9、AAV10、AAVrh10或AAV.PHPB。
60.如权利要求32-59中任一项所述的rAAV,其中所述AAV衣壳血清型为AAV9。
61.如权利要求32-59中任一项所述的rAAV,其中所述AAV衣壳血清型为AAV.PHBP。
62.如权利要求32-61中任一项所述的rAAV,其中所述核酸包含AAV2 ITR。
63.如权利要求62所述的rAAV,其中所述ITR为ΔTR和/或mTR。
64.如权利要求32-63中任一项所述的rAAV,其中所述转基因可操作地连接到启动子。
65.如权利要求64所述的rAAV,其中所述启动子为组织特异性启动子。
66.如权利要求64或65所述的rAAV,其中所述组织特异性启动子为神经元启动子,诸如SST、NPY、磷酸激活的谷氨酰胺酶(PAG)、囊泡谷氨酸转运蛋白-1(VGLUT1)、谷氨酸脱羧酶65和57(GAD65、GAD67)、突触蛋白I、a-CamKII、Dock10、Prox1、小白蛋白(PV)、生长抑素(SST)、胆囊收缩素(CCK)、钙视网膜蛋白(CR)或神经肽Y(NPY)。
67.一种增加靶基因表达的方法,所述方法包括向包含所述靶基因的细胞或受试者施用如权利要求1-31中任一项所述的分离的核酸或如权利要求32-66中任一项所述的rAAV。
68.如权利要求57所述的方法,其中所述受试者对所述靶基因单倍体不足。
69.如权利要求67或68所述的方法,其中所述靶基因为SCN1A。
70.如权利要求67-69中任一项所述的方法,其中所述细胞为神经元,任选地为GABA能神经元。
71.如权利要求67-70中任一项所述的方法,其中施用如权利要求1-31中任一项所述的分离的核酸或如权利要求32-66中任一项所述的rAAV导致靶基因表达相对于施用前所述受试者中所述转基因的表达增加至少2倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍、至少60倍、至少70倍、至少80倍、至少90倍或至少100倍。
72.一种治疗受试者的德拉韦综合征的方法,所述方法包括向表达靶基因的受试者施用如权利要求1-31中任一项所述的分离的核酸或将如权利要求32-66中任一项所述的rAAV施用于表达靶基因的受试者。
73.如权利要求72所述的方法,其中与正常受试者相比,所述受试者中靶基因的表达降低。
74.如权利要求72或权利要求73所述的方法,其中所述受试者相对于正常受试者是或疑似是靶基因表达单倍体不足。
75.如权利要求72-74中任一项所述的方法,其中所述受试者患有或疑似患有由所述靶基因的单倍体不足表达引起的病状。
76.如权利要求72-75中任一项所述的方法,其中所述靶基因为SCN1A。
77.如权利要求72-76中任一项所述的方法,其中通过静脉内注射、肌肉内注射、吸入、皮下注射和/或颅内注射施用所述分离的核酸或所述rAAV。
78.如权利要求72-77中任一项所述的方法,其中施用所述分离的核酸或所述rAAV导致靶基因表达相对于施用前所述受试者中所述转基因的表达增加至少2倍、至少10倍、至少20倍、至少30倍、至少40倍、至少50倍、至少60倍、至少70倍、至少80倍、至少90倍或至少100倍。
79.一种组合物,其包含如权利要求1-31中任一项所述的分离的核酸或如权利要求32-66中任一项所述的rAAV。
80.如权利要求79所述的组合物,其还包含药学上可接受的载剂。
81.一种试剂盒,其包含:
容器,所述容器容纳如权利要求1-31中任一项所述的分离的核酸或如权利要求32-66中任一项所述的rAAV。
82.如权利要求81所述的试剂盒,其中所述试剂盒还包含容纳药学上可接受的载剂的容器。
83.如权利要求81或权利要求82所述的试剂盒,其中所述分离的核酸或所述rAAV和所述药学上可接受的载剂容纳在同一容器中。
84.如权利要求81-83中任一项所述的试剂盒,其中所述容器为注射器。
85.一种宿主细胞,其包含如权利要求1-31中任一项所述的分离的核酸或如权利要求32-66中任一项所述的rAAV。
86.如权利要求85所述的宿主细胞,其中所述宿主细胞为真核细胞。
87.如权利要求85所述的宿主细胞,其中所述宿主细胞为哺乳动物细胞。
88.如权利要求87所述的宿主细胞,其中所述宿主细胞为人细胞,任选地神经元,任选地GABA能神经元。
CN202080021751.5A 2019-02-25 2020-02-24 Dna结合结构域反式激活因子及其用途 Pending CN113710693A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962810005P 2019-02-25 2019-02-25
US62/810,005 2019-02-25
PCT/US2020/019546 WO2020176426A1 (en) 2019-02-25 2020-02-24 Dna-binding domain transactivators and uses thereof

Publications (1)

Publication Number Publication Date
CN113710693A true CN113710693A (zh) 2021-11-26

Family

ID=72238705

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080021751.5A Pending CN113710693A (zh) 2019-02-25 2020-02-24 Dna结合结构域反式激活因子及其用途

Country Status (14)

Country Link
US (1) US20220185862A1 (zh)
EP (1) EP3931213A4 (zh)
JP (1) JP2022521432A (zh)
KR (1) KR20210132109A (zh)
CN (1) CN113710693A (zh)
AU (1) AU2020228028A1 (zh)
BR (1) BR112021016294A2 (zh)
CA (1) CA3129757A1 (zh)
CL (1) CL2021002226A1 (zh)
CO (1) CO2021011722A2 (zh)
IL (1) IL285687A (zh)
MX (1) MX2021010169A (zh)
SG (1) SG11202108568YA (zh)
WO (1) WO2020176426A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117980484A (zh) * 2021-09-16 2024-05-03 诺华股份有限公司 新颖的转录因子
WO2023129940A1 (en) * 2021-12-30 2023-07-06 Regel Therapeutics, Inc. Compositions for modulating expression of sodium voltage-gated channel alpha subunit 1 and uses thereof

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030082561A1 (en) * 2000-07-21 2003-05-01 Takashi Sera Zinc finger domain recognition code and uses thereof
CN1836048A (zh) * 2003-06-10 2006-09-20 图尔金株式会社 可转导的dna结合蛋白
CN102939377A (zh) * 2010-04-26 2013-02-20 桑格摩生物科学股份有限公司 使用锌指核酸酶对Rosa位点进行基因组编辑
CN109068620A (zh) * 2015-09-29 2018-12-21 爱丁堡大学董事会 基因编辑的猪
US20190024120A1 (en) * 2017-04-03 2019-01-24 Encoded Therapeutics, Inc. Tissue selective transgene expression

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3443081A4 (en) * 2016-04-13 2019-10-30 Duke University CRISPR / CAS9-BASED REPRESSORS FOR IN VIVO SHUT-OFF OF GEN-TARGETS AND METHOD OF USE
JP2020506948A (ja) * 2017-02-07 2020-03-05 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア ハプロ不全のための遺伝子治療

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030082561A1 (en) * 2000-07-21 2003-05-01 Takashi Sera Zinc finger domain recognition code and uses thereof
CN1836048A (zh) * 2003-06-10 2006-09-20 图尔金株式会社 可转导的dna结合蛋白
CN102939377A (zh) * 2010-04-26 2013-02-20 桑格摩生物科学股份有限公司 使用锌指核酸酶对Rosa位点进行基因组编辑
CN109068620A (zh) * 2015-09-29 2018-12-21 爱丁堡大学董事会 基因编辑的猪
US20190024120A1 (en) * 2017-04-03 2019-01-24 Encoded Therapeutics, Inc. Tissue selective transgene expression

Also Published As

Publication number Publication date
US20220185862A1 (en) 2022-06-16
EP3931213A1 (en) 2022-01-05
CA3129757A1 (en) 2020-09-03
CL2021002226A1 (es) 2022-04-29
AU2020228028A1 (en) 2021-09-30
KR20210132109A (ko) 2021-11-03
WO2020176426A1 (en) 2020-09-03
EP3931213A4 (en) 2022-12-14
JP2022521432A (ja) 2022-04-07
MX2021010169A (es) 2021-12-10
BR112021016294A2 (pt) 2021-10-13
CO2021011722A2 (es) 2021-12-10
IL285687A (en) 2021-10-31
SG11202108568YA (en) 2021-09-29

Similar Documents

Publication Publication Date Title
KR102604159B1 (ko) 조직 선택적 트랜스진 발현
KR20200107949A (ko) 조작된 dna 결합 단백질
CN110709095B (zh) 小基因治疗
CN114126665A (zh) 眼底黄色斑点症(abca4)的基因疗法
US20230365963A1 (en) Methods for treating neurological disease
CN114174520A (zh) 用于选择性基因调节的组合物和方法
KR20210133227A (ko) 뉴런 세포 흥분성을 정상화하고 드라베 증후군을 치료하기 위한 개재뉴런-특이적 치료제
CN113710693A (zh) Dna结合结构域反式激活因子及其用途
CN114402075A (zh) 乌谢尔综合征(ush2a)的基因疗法
CN116685329A (zh) 核酸构建体及其用于治疗脊髓性肌肉萎缩症的用途
EP2212348B1 (en) Materials and methods for gene mediated therapy of psychiatric disorders
JP2023518980A (ja) 非神経脳細胞での遺伝子発現を選択的に調節する人工発現構築物
EP3372249B1 (en) Aav/upr-plus virus, upr-plus fusion protein, genetic treatment method and use thereof in the treatment of neurodegenerative diseases, such as parkinson&#39;s disease and huntington&#39;s disease,inter alia
CN114206353A (zh) 小基因疗法
US20230279405A1 (en) Dna-binding domain transactivators and uses thereof
KR20230003557A (ko) 스펙트린 융합 도메인을 갖는 소형화 디스트로핀 및 그의 용도
TWI835761B (zh) 工程化dna結合蛋白
CN117580941A (zh) 多重CRISPR/Cas9介导的靶基因激活系统
WO2024009280A1 (en) Integrated stress response inhibitors and methods of using the same
TW202408545A (zh) 整合的壓力反應抑制劑及其使用方法
EP4370679A2 (en) Enhancers driving expression in motor neurons
EA046157B1 (ru) Композиции и способы селективной регуляции экспрессии генов
CN117836420A (zh) 重组tert编码病毒基因组和运载体

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination