CN116234916A - Csrp3(富含半胱氨酸和甘氨酸的蛋白质3)基因疗法 - Google Patents

Csrp3(富含半胱氨酸和甘氨酸的蛋白质3)基因疗法 Download PDF

Info

Publication number
CN116234916A
CN116234916A CN202180057650.8A CN202180057650A CN116234916A CN 116234916 A CN116234916 A CN 116234916A CN 202180057650 A CN202180057650 A CN 202180057650A CN 116234916 A CN116234916 A CN 116234916A
Authority
CN
China
Prior art keywords
gly
polynucleotide
ser
pro
asn
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180057650.8A
Other languages
English (en)
Inventor
C·D·赫尔佐格
C·B·萨克拉门多
R·普拉巴卡尔
D·里克斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Spaceship Seven LLC
Original Assignee
Spaceship Seven LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Spaceship Seven LLC filed Critical Spaceship Seven LLC
Publication of CN116234916A publication Critical patent/CN116234916A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P9/00Drugs for disorders of the cardiovascular system
    • A61P9/04Inotropic agents, i.e. stimulants of cardiac contraction; Drugs for heart failure
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • C07K14/4705Regulators; Modulating activity stimulating, promoting or activating activity
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4716Muscle proteins, e.g. myosin, actin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/072Animals genetically altered by homologous recombination maintaining or altering function, i.e. knock in
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/075Animals genetically altered by homologous recombination inducing loss of function, i.e. knock out
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/0306Animal model for genetic diseases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Cardiology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Virology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Hospice & Palliative Care (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Epidemiology (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Immunology (AREA)

Abstract

本文提供了例如使用腺相关病毒(AAV)载体对与心肌病相关联的CSRP3(富含半胱氨酸和甘氨酸的蛋白质3)‑相关基因缺陷的基因疗法。载体的启动子可以是MHCK7启动子或心肌肌钙蛋白T(HTNNT2)启动子。衣壳可以是AAV9或AAVrh74衣壳或其功能变体。可以使用其他启动子或衣壳。还提供了治疗方法,如通过rAAV载体的静脉内、冠状动脉内、颈动脉内或心内施用,以及其他组合物和方法。

Description

CSRP3(富含半胱氨酸和甘氨酸的蛋白质3)基因疗法
相关申请的交叉引用
本申请要求2020年8月5日提交的美国申请号63/061,727的优先权,该申请的内容通过引用整体并入本文。
关于序列表的声明
与本申请相关联的序列表以文本格式提供,代替纸质副本,并在此通过引用并入本说明书中。包含序列表的文本文件名称为ROPA_020_01WO_ST25.txt。该文本文件约为120KB,创建于2021年8月3日,经由EFS-Web以电子方式提交。
背景技术
富含半胱氨酸和甘氨酸的蛋白质3(CSRP3)编码肌肉LIM蛋白(MLP)。CSRP3中的遗传缺陷与常染色体显性心肌病(肥厚型心肌病(HCM)和扩张型心肌病(DCM)两者)相关联,因为蛋白质的不同结构域中的常染色体显性突变与不同的表型相关。降低MLP水平的功能丧失突变可导致蛋白质错误定位和蛋白酶体介导的降解,从而导致心肌和骨骼肌中正常信号传导通路的破坏。MLP水平或细胞内定位的变化也与骨骼肌病相关联,包括面肩胛肱型肌营养不良症、线状体肌病和2B型肢带型肌营养不良症。在2A型肢带型肌营养不良症、Duchenne型肌营养不良症和皮肌炎患者中已检测到同种型MLP-b蛋白水平的变化或MLP:MLP-b比率的失调。
CSRP3患者表现出取决于特定突变的不同症状,但一般症状包括阻塞性HCM或DCM、心室肥大(室间隔在14-32mm的范围内)、室性心动过速、运动不耐受、心绞痛。I-II的轻度NYHA(纽约心脏协会)得分是常见的。已观察到心脏性猝死,例如在携带C58G突变的家族中。在一项研究中,大多数提供肌肉活检的C58G携带者在就诊时抱怨劳力性肌痛和痉挛。
对于CSRP3相关疾病或病症的治疗存在未满足的需求。本文提供的基因疗法解决了这一需求。
发明内容
本发明大体上涉及使用表达MLP或其功能变体的载体对疾病或病症例如心脏疾病或病症的基因疗法。
在一个方面,本公开提供了包含表达盒和任选地侧接腺相关病毒(AAV)反向末端重复序列(ITR)的多核苷酸,其中所述多核苷酸包含可操作地连接至启动子的编码肌肉LIM蛋白(MLP)或其功能变体的多核苷酸序列。
在一些实施方案中,启动子为心脏特异性启动子。
在一些实施方案中,启动子为肌肉特异性启动子。
在一些实施方案中,启动子为心肌细胞特异性启动子。
在一些实施方案中,启动子为MHCK7启动子。
在一些实施方案中,MHCK7启动子与SEQ ID NO:31具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的同一性。
在一些实施方案中,启动子为心肌肌钙蛋白T(hTNNT2)启动子。
在一些实施方案中,hTNNT2启动子与SEQ ID NO:32具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的同一性。
在一些实施方案中,表达盒包含心肌肌钙蛋白T(hTNNT2)基因的外显子1,其中任选地hTNNT2启动子和外显子1一起与SEQ ID NO:32具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的同一性。
在一些实施方案中,启动子为泛在启动子(ubiquitous promoter),任选地CMV启动子或CAG启动子。
在一些实施方案中,表达盒包含polyA信号。
在一些实施方案中,polyA信号为人生长激素(hGH)polyA。
在一些实施方案中,表达盒包含土拨鼠肝炎病毒转录后调控元件(WPRE),任选地WPRE(x)。
在一些实施方案中,肌肉LIM蛋白(MLP)或其功能变体为MLP。
在一些实施方案中,MLP为人MLP。
在一些实施方案中,MLP为MLP同种型A。
在一些实施方案中,MLP与SEQ ID NO:1具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的同一性。
在一些实施方案中,MLP为MLP同种型B。
在一些实施方案中,MLP与SEQ ID NO:2具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的同一性。
在一些实施方案中,MLP与SEQ ID NO:3具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的同一性。
在一些实施方案中,MLP与SEQ ID NO:4具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的同一性。
在一些实施方案中,编码MLP的多核苷酸序列为富含半胱氨酸和甘氨酸的蛋白质3(CSRP3)多核苷酸。
在一些实施方案中,CSRP3多核苷酸为人CSRP3多核苷酸。
在一些实施方案中,编码MLP的多核苷酸序列与SEQ ID NO:5具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的同一性。
在一些实施方案中,编码MLP的多核苷酸序列与SEQ ID NO:7具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的同一性。
在一些实施方案中,多核苷酸包含至少约2.4kb、至多约2.6kb、或约2.4kb至约2.6kb之间。
在一些实施方案中,多核苷酸包含至少约3.0kb、至多约3.3kb、或约3.0kb至约3.3kb之间。
在一些实施方案中,多核苷酸包含至少约2.4kb、至少约2.6kb、至少约3.0kb、至少约3.3kb、至少约3.5kb、至少约3.7kb、至少约3.9kb、至少约4.1kb、或至少约4.3kb。
在一些实施方案中,多核苷酸包含至少约2.6kb、至少约3.0kb、至多约3.3kb、至多约3.5kb、至多约3.7kb、至多约3.9kb、至多约4.1kb、至多约4.3kb、或至多约4.5kb。
在一些实施方案中,表达盒与SEQ ID NO:8-11中的任何一个具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的同一性。
在一些实施方案中,多核苷酸与SEQ ID NO:12-15中的任何一个具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的同一性。
在一些实施方案中,表达盒侧接5'和3'反向末端重复序列(ITR),任选地AAV2ITR,任选地与SEQ ID NO:20-26中的任何一个具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的同一性的ITR。
在一些实施方案中,多核苷酸是自互补的。
在一些实施方案中,多核苷酸包含表达盒和表达盒的反向补体。
在一些实施方案中,表达盒和表达盒的反向补体侧接5'和3'反向末端重复序列(ITR),任选地AAV2 ITR,任选地与SEQ ID NO:23或SEQ ID NO:26具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的同一性的ITR。
在另一个方面,本公开提供了一种包含本公开的多核苷酸的基因疗法载体。
在一些实施方案中,基因疗法载体为重组腺相关病毒(rAAV)载体。
在一些实施方案中,rAAV载体为AAV9或其功能变体。
在一些实施方案中,rAAV载体包含与SEQ ID NO:77中的任何一个具有90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的同一性的衣壳蛋白。
在一些实施方案中,rAAV载体为AAVrh10或其功能变体。
在一些实施方案中,rAAV载体包含与SEQ ID NO:79中的任何一个具有90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的同一性的衣壳蛋白。
在一些实施方案中,rAAV载体为AAV6或其功能变体。
在一些实施方案中,rAAV载体包含与SEQ ID NO:78中的任何一个具有90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的同一性的衣壳蛋白。
在一些实施方案中,rAAV载体为AAVrh74或其功能变体。
在一些实施方案中,rAAV载体包含与SEQ ID NO:80中的任何一个具有90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的同一性的衣壳蛋白。
在一些实施方案中,rAAV载体为自互补的AAV载体。
在另一个方面,本公开提供了一种在有此需要的受试者中治疗和/或预防疾病或病症的方法,其包括向受试者施用本公开的载体。
在一些实施方案中,疾病或病症为心脏病症。
在一些实施方案中,疾病或病症为心力衰竭。
在一些实施方案中,疾病或病症为肥厚型心肌病。
在一些实施方案中,疾病或病症为扩张型心肌病。
在一些实施方案中,受试者为哺乳动物。
在一些实施方案中,受试者为灵长类动物。
在一些实施方案中,受试者为人。
在一些实施方案中,相对于编码具有SEQ ID NO:1序列的人MLP的人CSRP3,受试者在CSRP3基因中具有引起选自C58G、L44P、S54R、E55G和/或K69R的氨基酸取代的突变。
在一些实施方案中,载体通过静脉内注射、心内注射、心内输注和/或心导管插入术来施用。
在一些实施方案中,施用使MLP表达增加至少约5%。
在一些实施方案中,施用使MLP表达增加至少约30%。
在一些实施方案中,施用使MLP表达增加至少约70%。
在一些实施方案中,施用使MLP表达增加约5%至约10%。
在一些实施方案中,施用使MLP表达增加约30%至约50%。
在一些实施方案中,施用使MLP表达增加约70%至约100%。
在一些实施方案中,所述方法治疗和/或预防所述疾病或病症。
在另一个方面,本公开提供了一种药物组合物,其包含本公开的载体。
在另一个方面,本公开提供了一种试剂盒,其包含本公开的载体或药物组合物和任选地使用说明书。
在另一个方面,本公开提供了本公开的组合物用于任选地根据本文公开的任何方法治疗疾病或病症的用途。
在另一个方面,本公开提供了用于任选地根据本文公开的任何方法治疗疾病或病症的本公开组合物。
在另一个方面,本公开提供了一种表达肌肉LIM蛋白(MLP)或其功能变体的方法,其包括使细胞与本公开的载体接触。
在一些实施方案中,细胞为心肌细胞。
在一些实施方案中,心肌细胞为人心肌细胞。
在一些实施方案中,启动子为MHCK7启动子并且其中MLP的表达水平比用具有hTNNT2启动子的载体转导的细胞中MLP的表达水平高至少2倍。
在一些实施方案中,启动子为MHCK7启动子并且其中MLP的表达水平比用具有hTNNT2启动子的载体转导的细胞中MLP的表达水平高2倍至高10倍。
下面的详细描述中公开了各种其他方面和实施方案。本发明仅受所附权利要求书的限制。
附图说明
图1示出了载体基因组的一个非限制性实例的载体图。该载体基因组的完整多核苷酸序列为SEQ ID NO:12。大写部分为表达盒(SEQ ID NO:8)。
图2示出了载体基因组的一个非限制性实例的载体图。该载体基因组的完整多核苷酸序列为SEQ ID NO:13。大写部分为表达盒(SEQ ID NO:9)。
图3示出了载体基因组的一个非限制性实例的载体图。该载体基因组的完整多核苷酸序列为SEQ ID NO:14。大写部分为表达盒(SEQ ID NO:10)。
图4示出了载体基因组的一个非限制性实例的载体图。该载体基因组的完整多核苷酸序列为SEQ ID NO:15。大写部分为表达盒(SEQ ID NO:11)。
图5A示出了在转导的CHO-Lec2中的CSRP3表达。
图5B示出了在转导的心肌细胞(分化的AC16细胞系-Sigma-
Figure BDA0004113480510000051
目录号SCC109)中的CSRP3表达。用来自每个载体的3E5 MOI转导细胞;6天后,收集细胞裂解物,并使用抗-CSRP3多克隆抗体(Thermo-/>
Figure BDA0004113480510000061
PA5-29155 1:1000)进行蛋白质印迹法。/>
具体实施方式
本公开提供了用于递送编码MLP的多核苷酸的CSPRP3的基因疗法载体,以及使用方法,及其他组合物和方法。CSPRP3-相关病症的治疗因大多数形式的CSPRP3-相关病症的常染色体显性性质而复杂化,并且证据表明蛋白质表达的水平和MLP同种型之间的平衡对于健康受试者的正常功能至关重要。此外,成功的心脏基因疗法是不可预测的。心肌细胞是基因疗法靶向的一种特别具有挑战性的细胞类型。本文公开的组合物和方法解决了这个问题。
定义
章节标题仅用于组织目的,而不应解释为将所描述的主题限制于特定的方面或实施方案。
除非另有定义,否则本文使用的所有技术和科学术语具有与本发明所属领域普通技术人员通常所理解相同的含义。下文将描述合适的方法和材料,但在本发明的实践中可使用与本文描述的那些类似或等同的方法和材料。本文提及的所有出版物、专利申请、专利和其他参考文献明确地通过引用整体并入。在发生冲突的情况下,以本说明书(包括定义)为准。另外,本文描述的材料、方法和实例仅是示意性的而不旨在限制。
本文中提到的所有出版物和专利在此通过引用整体并入,犹如每个个别出版物或专利被具体地和单独地指出通过引用并入。在发生冲突的情况下,以本申请(包括其中的任何定义)为准。然而,本文引用的任何参考文献、文章、出版物、专利、专利公开和专利申请的提及均不是也不应被视为是承认或任何形式的暗示它们构成有效的现有技术或形成世界上任何国家的公知常识的一部分。
在本说明书中,除非另有指明,否则任何浓度范围、百分比范围、比率范围或整数范围均应理解为包括在所述及的范围内的任何整数的值,并在适当时包括其分数(例如,整数的十分之一和百分之一)。术语“约”,当紧接在数字或数值之前时,意指加或减10%的数字或数值范围。应理解,除非另有指明,否则如本文所用,术语“一种(a/an)”是指所列举的组分中的“一种或多种”。备选词(例如,“或”)的使用应理解为表示备选项中的一个、两个或其任何组合。术语“和/或”应理解为意指备选项中的一个或两个。如本文所用,术语“包括”和“包含”同义地使用。
如本文所用,关于多肽或多核苷酸序列,术语“同一性”和“相同”是指在该“查询”序列与“主题”序列的比对中精确匹配残基的百分比,如由BLAST算法生成的比对。除非另有说明,否则在主题序列的全长上计算同一性。因此,如果在将查询序列与主题序列比对时,查询序列与主题序列“具有至少x%的同一性”,则主题序列中至少x%(向下四舍五入)的残基被比对为与查询序列中的对应残基精确匹配。在主题序列具有可变位置(例如,表示为X的残基)时,与查询序列中任何残基的比对被计为匹配。
如本文所用,“AAV载体”或“rAAV载体”是指包含一种或多种侧接AAV末端重复序列(ITR)的目的多核苷酸(或转基因)的重组载体。当存在于已用编码和表达rep和cap基因产物的质粒转染的宿主细胞中时,此类AAV载体可被复制和包装成感染性病毒颗粒。或者,可使用已经稳定工程化以表达rep和cap基因的宿主细胞将AAV载体包装成感染性颗粒。
如本文所用,“AAV病毒体”或“AAV病毒颗粒”或“AAV载体颗粒”是指由至少一种AAV衣壳蛋白和衣壳化多核苷酸AAV载体组成的病毒颗粒。如本文所用,如果颗粒包含异源多核苷酸(即,非野生型AAV基因组的多核苷酸,如待递送至哺乳动物细胞的转基因),则其通常被称为“AAV载体颗粒”或简称为“AAV载体”。因此,AAV载体颗粒的产生必然包括AAV载体的产生,因为这样的载体包含在AAV载体颗粒内。
如本文所用,“启动子”是指能够促进从真核细胞中的多核苷酸开始RNA转录的多核苷酸序列。
如本文所用,“载体基因组”是指由载体(例如,rAAV病毒体)包装的多核苷酸序列,包括侧接序列(在AAV中,反向末端重复序列)。术语“表达盒”和“多核苷酸盒”是指侧接ITR序列之间的载体基因组的部分。“表达盒”意指载体基因组包含至少一个编码基因产物的基因,该基因产物可操作地连接至驱动表达的元件(例如,启动子)。
如本文所用,术语“有需要的患者”或“有需要的受试者”是指有患上适合于用本文公开的重组基因疗法载体或基因编辑系统治疗或改善的疾病、病症或病患的风险或者正罹患适合于用本文公开的重组基因疗法载体或基因编辑系统治疗或改善的疾病、病症或病患的患者或受试者。有需要的患者或受试者可以是例如被诊断患有与心脏相关联的病症的患者或受试者。受试者可能在CSRP3基因中具有突变或具有CSRP3基因的全部或部分的缺失,这会引起MLP蛋白的异常表达。“受试者”和“患者”在本文中可互换地使用。通过本文描述的方法治疗的受试者可以是成人或儿童。受试者的年龄可以不等。
如本文所用,术语“变体”或“功能变体”可互换地指与保留亲本蛋白质的一种或多种所需活性的亲本蛋白质相比具有一个或多个氨基酸取代、插入或缺失的蛋白质。
如本文所用,“遗传破坏”是指基因中功能的部分或完全丧失或异常活性。例如,受试者可能遭受CSRP3基因中表达或功能的遗传破坏,所述遗传破坏在受试者的至少一些细胞(例如,心脏细胞)中降低MLP蛋白的表达或者导致MLP蛋白的丧失或异常功能。
如本文所用,“治疗”是指改善疾病或病症的一种或多种症状。术语“预防”是指延迟或中断疾病或病症的一种或多种症状的发作或者减慢CSRP3-相关疾病或病症例如肥厚型心肌病(HCM)、扩张型心肌病(DCM)或骨骼肌病的进展。
MLP蛋白或多核苷酸
本公开涵盖与肌肉LIM蛋白(MLP)蛋白有关的组合物和使用方法。已知CSRP3中的各种突变与肥厚型心肌病(HCM)或扩张型心肌病(DCM)相关联。已观察到遗传性突变和新生突变。在一些情况下,杂合错义突变足以引起疾病。
MLP的多肽序列为如下:
MPNWGGGAKCGACEKTVYHAEEIQCNGRSFHKTCFHCMACRKALDSTTVAAHESEIYCKVCYGRRYGPKGIGYGQGAGCLSTDTGEHLGLQFQQSPKPARSVTTSNPSKFTAKFGESEKCPRCGKSVYAAEKVMGGGKPWHKTCFRCAICGKSLESTNVTDKDGELYCKVCYAKNFGPTGIGFGGLTQQVEKKE
(SEQ ID NO:1)。
MLP的第二同种型具有以下多肽序列:MPNWGGGAKCGACEKTVYHAEEIQCNGRSFHKTCFHCSPQSRHAQLPPATLPNSLRSLESPRSALDVASQSMLLRRLWEVASLGTRPVSAVPSVGRVWSPQMSLTKMGNFIAKFAMPKILAPRVLGLEALHNKWKRKNEEVRRFSDFLRA
(SEQ ID NO:2)。
MLP的另一同种型具有以下多肽序列:
MPNWGGGAKCGACEKTVYHAEEIQCNGRSFHKTCFHCLC
(SEQ ID NO:3)。
MLP的另一同种型具有以下多肽序列:
MPNWGGGAKCGACEKTVYHAEEIQCNGRSFHKTCFHCTLAQDLFP LCHLWEESGVHKC
(SEQ ID NO:4)。
在一些实施方案中,MLP蛋白包含与SEQ ID NO:1-4中的任何一个至少75%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的多肽序列。
在一些实施方案中,本公开提供了一种重组腺相关病毒(rAAV)病毒体,其包含衣壳和载体基因组,其中所述载体基因组包含可操作地连接至启动子的编码MLP或其功能变体的多核苷酸序列。在一些实施方案中,本公开提供了一种重组腺相关病毒(rAAV)病毒体,其包含衣壳和载体基因组,其中所述载体基因组包含可操作地连接至启动子的编码MLP的多核苷酸序列。编码MLP的多核苷酸可以包含与以下至少75%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的多核苷酸序列:
ATGCCAAACTGGGGCGGAGGCGCAAAATGTGGAGCCTGTGAAAAGACCGTCTACCATGCAGAAGAAATCCAGTGCAATGGAAGGAGTTTCCACAAGACGTGTTTCCACTGCATGGCCTGCAGGAAGGCTCTTGACAGCACGACAGTCGCGGCTCATGAGTCGGAGATCTACTGCAAGGTGTGCTATGGGCGCAGATATGGCCCCAAAGGGATCGGGTATGGACAAGGCGCTGGCTGTCTCAGCACAGACACGGGCGAGCATCTCGGCCTGCAGTTCCAACAGTCCCCAAAGCCGGCACGCTCAGTTACCACCAGCAACCCTTCCAAATTCACTGCGAAGTTTGGAGAGTCCGAGAAGTGCCCTCGATGTGGCAAGTCAGTCTATGCTGCTGAGAAGGTTATGGGAGGTGGCAAGCCTTGGCACAAGACCTGTTTCCGCTGTGCCATCTGTGGGAAGAGTCTGGAGTCCACAAATGTCACTGACAAAGATGGGGAACTTTATTGCAAAGTTTGCTATGCCAAAAATTTTGGCCCCACGGGTATTGGGTTTGGAGGCCTTACACAACAAGTGGAAAAGAAAGAA
(SEQ ID NO:5)。
任选地,编码载体基因组的多核苷酸序列可以包含Kozak序列,包括但不限于GCCACCATGG(SEQ ID NO:6)。Kozak序列可以与编码MLP蛋白或其功能变体的多核苷酸序列重叠。例如,载体基因组可以包含与以下至少75%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的多核苷酸序列(Kozak加有下划线):
gccaccATGCCAAACTGGGGCGGAGGCGCAAAATGTGGAGCCTGTGAAAAGACCGTCTACCATGCAGAAGAAATCCAGTGCAATGGAAGGAGTTTCCACAAGACGTGTTTCCACTGCATGGCCTGCAGGAAGGCTCTTGACAGCACGACAGTCGCGGCTCATGAGTCGGAGATCTACTGCAAGGTGTGCTATGGGCGCAGATATGGCCCCAAAGGGATCGGGTATGGACAAGGCGCTGGCTGTCTCAGCACAGACACGGGCGAGCATCTCGGCCTGCAGTTCCAACAGTCCCCAAAGCCGGCACGCTCAGTTACCACCAGCAACCCTTCCAAATTCACTGCGAAGTTTGGAGAGTCCGAGAAGTGCCCTCGATGTGGCAAGTCAGTCTATGCTGCTGAGAAGGTTATGGGAGGTGGCAAGCCTTGGCACAAGACCTGTTTCCGCTGTGCCATCTGTGGGAAGAGTCTGGAGTCCACAAATGTCACTGACAAAGATGGGGAACTTTATTGCAAAGTTTGCTATGCCAAAAATTTTGGCCCCACGGGTATTGGGTTTGGAGGCCTTACACAACAAGTGGAAAAGAAAGAA
(SEQ ID NO:7)。
在一些实施方案中,Kozak序列为包含以下中的任何一个或由以下中的任何一个组成的替代Kozak序列:
(gcc)gccRccAUGG(SEQ ID NO:16);
(gcc)gccRccAUGC(SEQ ID NO:17);
AGNNAUGN;
ANNAUGG;
ANNAUGC;
ACCAUGG;
ACCAUGC;
GACACCAUGG(SEQ ID NO:18);和
GACACCAUGC(SEQ ID NO:19)。
在一些实施方案中,载体基因组不包含Kozak序列。
载体基因组
本公开的AAV病毒体包含载体基因组。载体基因组可以包含表达盒(或用于不需要表达多核苷酸序列的基因编辑应用的多核苷酸盒)。可以使用任何合适的反向末端重复序列(ITR)。ITR可以来自与衣壳相同的血清型或不同的血清型(例如,可以使用AAV2 ITR)。
在一些实施方案中,5′ITR包含与以下至少75%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的多核苷酸序列:
CCTGCAGGCAGCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCT
(SEQ ID NO:20)
在一些实施方案中,5′ITR包含与以下至少75%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的多核苷酸序列:
GCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTTGTAGTTAATGATTAACCCGCCATGCTACTTATCTACGTA
(SEQ ID NO:21)
在一些实施方案中,5′ITR包含与以下至少75%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的多核苷酸序列:
CTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTTGTAGTTAATGATTAACCCGCCATGCTACTTATCTACGTA
(SEQ ID NO:22)
在一些实施方案中,5′ITR包含与以下至少75%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的多核苷酸序列:
TTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCT
(SEQ ID NO:23)
在一些实施方案中,3′ITR包含与以下至少75%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的多核苷酸序列:
AGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGCTGCCTGCAGG
(SEQ ID NO:24)
在一些实施方案中,3′ITR包含与以下至少75%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的多核苷酸序列:
TACGTAGATAAGTAGCATGGCGGGTTAATCATTAACTACAAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGC
(SEQ ID NO:25)
在一些实施方案中,3′ITR包含与以下至少75%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的多核苷酸序列:
AGGAACCCCTAGTGATGGAGACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGT
(SEQ ID NO:26)
在一些实施方案中,载体基因组包含一个或多个填充序列,例如与以下至少75%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的填充序列:
GCGGCAATTCAGTCGATAACTATAACGGTCCTAAGGTAGCGATTT AAATACGCGCTCTCTTAAGGTAGCCCCGGGACGCGTCAATTGACTACA AACCGAGTATCTGCAGAGGGCCCTGCGTATG(SEQ ID NO:27);
CTTCTGAGGCGGAAAGAACCAGATCCTCTCTTAAGGTAGCATCGA GATTTAAATTAGGGATAACAGGGTAATGGCGCGGGCCGC(SEQ ID NO:28);或
GTTACCCAGGCTGGAGTGCAGTGGCACATTTCTGCTCACTGCAAC CTCCTCCTCCCTGGGTTC(SEQID NO:29)。
启动子
在一些实施方案中,编码MLP蛋白或其功能变体的多核苷酸序列可操作地连接至启动子。
本公开涵盖各种启动子的使用。可用于本公开的实施方案中的启动子包括但不限于巨细胞病毒(CMV)启动子、磷酸甘油酸激酶(PGK)启动子或由CMV增强子及鸡β-肌动蛋白启动子和兔β-球蛋白基因的部分组成的启动子序列(CAG)。在一些情况下,启动子可以是合成启动子。示例性的合成启动子由Schlabach等人,PNAS USA.107(6):2538–43(2010)提供。在一些实施方案中,启动子包含与以下至少75%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的多核苷酸序列:
ACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTCGAGGTGAGCCCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCGG
(SEQ ID NO:30)
在一些实施方案中,编码MLP蛋白或其功能变体的多核苷酸序列可操作地连接至诱导型启动子。诱导型启动子可以配置为响应于试剂的添加或积累或者响应于试剂的去除、降解或稀释而使多核苷酸序列转录表达或不转录表达。试剂可以是药物。试剂可以是四环素或其衍生物之一,包括但不限于强力霉素。在一些情况下,诱导型启动子为tet-on启动子、tet-off启动子、化学调节的启动子、物理调节的启动子(即,响应于光的存在或不存在或响应于低温或高温的启动子)。诱导型启动子包括重金属离子诱导型启动子(如小鼠乳房肿瘤病毒(mMTV)启动子或各种生长激素启动子),以及来自在T7 RNA聚合酶的存在下具有活性的T7噬菌体的启动子。该诱导型启动子列表是非限制性的。
在一些情况下,启动子为组织特异性启动子,如能够在心脏细胞中比在非心脏细胞中更大程度地驱动表达的启动子。在一些实施方案中,组织特异性启动子选自任何各种心脏细胞特异性启动子,包括但不限于肌间线蛋白(Des)、α-肌球蛋白重链(α-MHC)、肌球蛋白轻链2(MLC-2)、心肌肌钙蛋白C(cTnC)、心肌肌钙蛋白T(hTNNT2)、肌肉肌酸激酶(CK)及其启动子/增强子区域的组合,如MHCK7。在一些情况下,启动子为泛在启动子。“泛在启动子”是指在实验或临床条件下不具有组织特异性的启动子。在一些情况下,泛在启动子为CMV、CAG、UBC、PGK、EF1-α、GAPDH、SV40、HBV、鸡β-肌动蛋白和人β-肌动蛋白启动子中的任何一种。
在一些实施方案中,启动子序列选自表3。在一些实施方案中,启动子包含与SEQID NO 31-51中的任何一个至少75%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的多核苷酸序列。
表3
Figure BDA0004113480510000141
/>
Figure BDA0004113480510000151
/>
Figure BDA0004113480510000161
/>
Figure BDA0004113480510000171
/>
Figure BDA0004113480510000181
/>
Figure BDA0004113480510000191
/>
Figure BDA0004113480510000201
/>
Figure BDA0004113480510000211
/>
Figure BDA0004113480510000221
/>
Figure BDA0004113480510000231
/>
Figure BDA0004113480510000241
/>
Figure BDA0004113480510000251
/>
Figure BDA0004113480510000261
/>
Figure BDA0004113480510000271
/>
Figure BDA0004113480510000281
在一个优选的实施方案中,载体基因组包含与SEQ ID NO:31至少75%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的多核苷酸序列。在一个优选的实施方案中,载体基因组包含与SEQ ID NO:32至少75%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的多核苷酸序列。在一个优选的实施方案中,载体基因组包含与SEQ ID NO:33至少75%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的多核苷酸序列。
启动子的其他示意性实例有来自猿猴病毒40的SV40后期启动子、杆状病毒多面体增强子/启动子元件、单纯疱疹病毒胸苷激酶(HSV tk)、来自巨细胞病毒(CMV)的立即早期启动子和包括LTR元件的各种逆转录病毒启动子。多种其他启动子是本领域已知并通常可获得的,并且许多这样的启动子的序列可在序列数据库如GenBank数据库中获得。
其他调控元件
在一些情况下,本公开的载体还包含一种或多种选自以下的调控元件:增强子、内含子、poly-A信号、2A肽编码序列、WPRE(土拨鼠肝炎病毒转录后调控元件)和HPRE(乙型肝炎转录后调控元件)。
在一些实施方案中,载体包含CMV增强子。
在某些实施方案中,载体包含一种或多种增强子。在特定的实施方案中,增强子为CMV增强子序列、GAPDH增强子序列、β-肌动蛋白增强子序列或EF1-α增强子序列。前述序列是本领域已知的。例如,CMV立即早期(IE)增强子的序列为:
ACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCA
(SEQ ID NO:50)
在某些实施方案中,载体包含一种或多种内含子。在特定的实施方案中,内含子为兔球蛋白内含子序列、鸡β-肌动蛋白内含子序列、合成内含子序列、SV40内含子或EF1-α内含子序列。
在某些实施方案中,载体包含polyA序列。在特定的实施方案中,polyA序列为兔球蛋白polyA序列、人生长激素polyA序列、牛生长激素polyA序列、PGK polyA序列、SV40polyA序列或TK polyA序列。在一些实施方案中,poly-A信号可以是牛生长激素多腺苷酸化信号(bGHpA)。
在某些实施方案中,载体包含一种或多种转录物稳定元件。在特定的实施方案中,转录物稳定元件为WPRE序列、HPRE序列、支架附着区、3'UTR或5'UTR。在特定的实施方案中,载体包含5'UTR和3'UTR两者。
在一些实施方案中,载体包含选自表4的5'非翻译区(UTR)。在一些实施方案中,载体基因组包含与SEQ ID NO 51-61中的任何一个至少75%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的多核苷酸序列。
表4
Figure BDA0004113480510000291
/>
Figure BDA0004113480510000301
/>
Figure BDA0004113480510000311
/>
Figure BDA0004113480510000321
/>
Figure BDA0004113480510000331
/>
Figure BDA0004113480510000341
在一些实施方案中,载体包含选自表5的3'非翻译区。在一些实施方案中,载体基因组包含与SEQ ID NO 62-70中的任何一个至少75%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的多核苷酸序列。
表5
Figure BDA0004113480510000351
/>
Figure BDA0004113480510000361
/>
Figure BDA0004113480510000371
/>
Figure BDA0004113480510000381
/>
Figure BDA0004113480510000391
在一些实施方案中,载体包含选自表6的多腺苷酸化(polyA)信号。在一些实施方案中,polyA信号包含与SEQ ID NO 71-75中的任何一个至少75%、80%、85%、90%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同的多核苷酸序列。
表6
Figure BDA0004113480510000392
/>
Figure BDA0004113480510000401
/>
Figure BDA0004113480510000411
示意性的载体基因组在图1-4中描绘并作为SEQ ID NO:12-15提供。大写的每个序列的表达盒为SEQ ID NO:8-11。在一些实施方案中,载体基因组包含以下、基本上由以下组成或由以下组成:与SEQ ID NO:8-11中的任何一个具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的多核苷酸序列,任选地具有或不具有小写的ITR序列。编码序列是大写的。
腺相关病毒载体
腺相关病毒(AAV)是一种复制缺陷型细小病毒,其单链DNA基因组的长度为约4.7kb,包括两个~145-核苷酸反向末端重复序列(ITR)。AAV有多种已知的变体,当按抗原表位分类时有时也称为血清型。AAV血清型的基因组的核苷酸序列是已知的。例如,AAV-1的完整基因组在GenBank登录号NC_002077中提供;AAV-2的完整基因组在GenBank登录号NC_001401和Srivastava等人,J.Virol.,45:555-564(1983)中提供;AAV-3的完整基因组在GenBank登录号NC_1829中提供;AAV-4的完整基因组在GenBank登录号NC_001829中提供;AAV-5基因组在GenBank登录号AF085716中提供;AAV-6的完整基因组在GenBank登录号NC_00 1862中提供;AAV-7和AAV-8基因组的至少一部分分别在GenBank登录号AX753246和AX753249中提供;AAV-9基因组在Gao等人,J.Virol.,78:6381-6388(2004)中提供;AAV-10基因组在Mol.Ther.,13(1):67-76(2006)中提供;AAV-11基因组在Virology,330(2):375-383(2004)中提供。AAVrh.74基因组的序列在美国专利9,434,928中提供,该专利通过引用并入本文。指导病毒DNA复制(rep)、衣壳化/包装和宿主细胞染色体整合的顺式作用序列包含在AAV ITR中。三个AAV启动子(根据其相对图谱位置命名为p5、p19和p40)驱动编码rep和cap基因的两个AAV内部开放阅读框的表达。两个rep启动子(p5和p19),与单个AAV内含子(在核苷酸2107和2227处)的差异剪接相结合,导致从rep基因产生四种rep蛋白(rep78、rep68、rep52和rep40)。Rep蛋白具有多重酶促性质,其最终负责复制病毒基因组。cap基因由p40启动子表达并且其编码三种衣壳蛋白VP1、VP2和VP3。选择性剪接和非共有翻译起始位点负责三种相关衣壳蛋白的产生。单个共有多腺苷酸化位点位于AAV基因组的图谱位置95处。AAV的生命周期和遗传学在Muzyczka,Current Topics in Microbiology andImmunology,158:97-129(1992)中有综述。
AAV具有独特的特征,这些特征使得其作为例如在基因疗法中向细胞递送外源DNA的载体具有吸引力。培养物中细胞的AAV感染是不致细胞病变的,而人和其他动物的自然感染是沉默且无症状的。此外,AAV感染许多哺乳动物细胞,从而有可能在体内靶向许多不同的组织。此外,AAV转导缓慢分裂和非分裂的细胞,并且可以作为转录活性核附加体(染色体外元件)基本上在这些细胞的整个生命周期内持续存在。AAV前病毒基因组作为克隆的DNA插入质粒中,这使得重组基因组的构建成为可能。此外,由于指导AAV复制和基因组衣壳化的信号包含在AAV基因组的ITR内,故内部大约4.3kb的基因组(编码复制和结构衣壳蛋白,rep-cap)中的一些或全部可被替换为外源DNA。为了生成AAV载体,可以以反式提供rep和cap蛋白。AAV的另一显著特征在于其是极其稳定且强大的病毒。它容易承受用于灭活腺病毒的条件(56℃至65℃持续数小时),使得AAV的冷藏保存变得不那么重要。AAV甚至可以冻干。最后,AAV感染的细胞对重复感染没有抵抗力。
可用于本发明的实践中的基因递送病毒载体可利用分子生物学领域中公知的方法来构建。通常,携带转基因的病毒载体由编码转基因的多核苷酸、合适的调控元件和产生介导细胞转导的病毒蛋白所必需的元件组装。这样的重组病毒可以通过本领域已知的技术产生,例如通过转染包装细胞或通过用辅助质粒或病毒瞬时转染。病毒包装细胞的典型实例包括但不限于HeLa细胞、SF9细胞(任选地具有杆状病毒辅助载体)、293细胞等。可使用基于疱疹病毒的系统来产生AAV载体,如US20170218395A1中所述。用于产生这样的复制缺陷型重组病毒的详细方案可见于例如W095/14785、W096/22378、美国专利号5,882,877、美国专利号6,013,516、美国专利号4,861,719、美国专利号5,278,056和W094/19478中,这些专利中的每一个的完整内容在此通过引用并入。
可使用包括基于腺病毒和无辅助系统的各种系统将可用于本发明的实践中的AAV载体包装成AAV病毒体(病毒颗粒)。AAV生物学中的标准方法包括Kwon和Schaffer.PharmRes.(2008)25(3):489-99;Wu等人,Mol.Ther.(2006)14(3):316-27;Burger等人,Mol.Ther.(2004)10(2):302-17;Grimm等人,Curr Gene Ther.(2003)3(4):281-304;DeyleDR,Russell DW.Curr Opin Mol Ther.(2009)11(4):442-447;McCarty等人,Gene Ther.(2001)8(16):1248-54;和Duan等人,Mol Ther.(2001)4(4):383-91中描述的那些。无辅助系统包括US 6,004,797、US 7,588,772和US 7,094,604中描述的那些;
rAAV基因组中的AAV DNA可以来自可衍生出重组病毒的任何AAV变体或血清型,包括但不限于AAV变体或血清型AAV-1、AAV-2、AAV-3、AAV-4、AAV-5、AAV-6、AAV-7、AAV-8、AAV-9、AAV-10、AAV-11、AAV-12、AAV-13和AAVrh10。假型rAAV的生产在例如WO 01/83692中有公开。还涵盖其他类型的rAAV变体,例如具有衣壳突变的rAAV。参见例如Marsic等人,Molecular Therapy,22(11):1900-1909(2014)。各种AAV血清型的基因组的核苷酸序列是本领域已知的。
在一些情况下,rAAV包含自互补基因组。如本文所定义,包含“自互补”或“双链”基因组的rAAV是指已经工程化使得rAAV的编码区配置为形成分子内双链DNA模板的rAAV,如McCarty等人,Self-complementary recombinant adeno-associated virus(scAAV)vectors promote efficient transduction independently of DNA synthesis.GeneTherapy.8(16):1248–54(2001)中所述。本公开涵盖在一些情况下使用包含自互补基因组的rAAV,因为在感染(如转导)时,scAAV的两个互补半部将缔合形成一个准备好立即复制和转录的双链DNA(dsDNA)单元,而不是等待rAAV基因组的第二链的细胞介导合成。应理解,与在rAAV中发现的完全编码容量(4.7-6kb)不同,包含自互补基因组的rAAV只能容纳该量的约一半(≈2.4kb)。
在其他情况下,rAAV载体包含单链基因组。如本文所定义,“单一标准”基因组是指不自互补的基因组。在大多数情况下,非重组AAV具有单链DNA基因组。已经有一些迹象表明,rAAV应当是scAAV以实现细胞的有效转导。然而,本公开涵盖可能具有单链基因组而不是自互补基因组的rAAV载体,应理解rAAV载体的其他遗传修饰可能有益于在靶细胞中获得最佳基因转录。在一些情况下,本公开涉及能够实现向小鼠眼前段的有效基因转移的单链rAAV载体。参见Wang等人,Single stranded adeno-associated virus achievesefficient gene transfer to anterior segment in the mouse eye.PLoS ONE 12(8):e0182473(2017)。
在一些情况下,rAAV载体具有血清型AAV1、AAV2、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、AAV13、AAVrh10或AAVrh74。假型rAAV的生产在例如WO 01/83692中有公开。还涵盖其他类型的rAAV变体,例如具有衣壳突变的rAAV。参见例如Marsic等人,Molecular Therapy,22(11):1900-1909(2014)。在一些情况下,rAAV载体具有血清型AAV9。在一些实施方案中,所述rAAV载体具有血清型AAV9并包含单链基因组。在一些实施方案中,所述rAAV载体具有血清型AAV9并包含自互补基因组。在一些实施方案中,rAAV载体包含AAV2的反向末端重复(ITR)序列。在一些实施方案中,rAAV载体包含AAV2基因组,使得rAAV载体为AAV-2/9载体、AAV-2/6载体或AAV-2/8载体。
大多数已知的AAV的衣壳基因的全长序列和序列在美国专利号8,524,446中提供,该专利整体并入本文。
AAV载体可以包含野生型AAV序列,或者它们可以包含对野生型AAV序列的一个或多个修饰。在某些实施方案中,AAV载体在衣壳蛋白例如VP1、VP2和/或VP3内包含一个或多个氨基酸修饰,例如取代、缺失或插入。在特定的实施方案中,在向受试者提供AAV载体时,修饰提供了降低的免疫原性。
可以修饰rAAV的衣壳蛋白使得rAAV靶向特定的目的靶组织如内皮细胞或更特别地内皮尖端细胞。在一些实施方案中,rAAV被直接注射到受试者的脑室内空间中。
在一些实施方案中,rAAV病毒体为AAV2 rAAV病毒体。衣壳可以是AAV2衣壳或其功能变体。在一些实施方案中,AAV2衣壳与例如以下的参考AAV2衣壳具有至少98%、99%或100%的同一性:
MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKYLGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSGTGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPMADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQSGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRNWLPGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDEEKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQRGNRQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYNKSVNVDFTVDTNGVYSEPRPIGTRYLTRNL
(SEQ ID NO:76)
在一些实施方案中,rAAV病毒体为AAV9 rAAV病毒体。衣壳可以是AAV9衣壳或其功能变体。在一些实施方案中,AAV9衣壳与例如以下的参考AAV9衣壳具有至少98%、99%或100%的同一性:
MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNARGLVLPGYKYLGPGNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRLLEPLGLVEEAAKTAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRLNFGQTGDTESVPDPQPIGEPPAAPSGVGSLTMASGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQSLDRLMNPLIDQYLYYLSKTINGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFGKQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQVATNHQSAQAQAQTGWVQNQGILPGMVWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL
(SEQ ID NO:77)
在一些实施方案中,rAAV病毒体为AAV6 rAAV病毒体。衣壳可以是AAV9衣壳或其功能变体。在一些实施方案中,AAV6衣壳与例如以下的参考AAV6衣壳具有至少98%、99%或100%的同一性:
MAADGYLPDWLEDNLSEGIREWWDLKPGAPKPKANQQKQDDGRGLVLPGYKYLGPFNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLRYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRVLEPFGLVEEGAKTAPGKKRPVEQSPQEPDSSSGIGKTGQQPAKKRLNFGQTGDSESVPDPQPLGEPPATPAAVGPTTMASGGGAPMADNNEGADGVGNASGNWHCDSTWLGDRVITTSTRTWALPTYNNHLYKQISSASTGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTTNDGVTTIANNLTSTVQVFSDSEYQLPYVLGSAHQGCLPPFPADVFMIPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLNRTQNQSGSAQNKDLLFSRGSPAGMSVQPKNWLPGPCYRQQRVSKTKTDNNNSNFTWTGASKYNLNGRESIINPGTAMASHKDDKDKFFPMSGVMIFGKESAGASNTALDNVMITDEEEIKATNPVATERFGTVAVNLQSSSTDPATGDVHVMGALPGMVWQDRDVYLQGPIWAKIPHTDGHFHPSPLMGGFGLKHPPPQILIKNTPVPANPPAEFSATKFASFITQYSTGQVSVEIEWELQKENSKRWNPEVQYTSNYAKSANVDFTVDNNGLYTEPRPIGTRYLTRPL
(SEQ ID NO:78)
在一些实施方案中,rAAV病毒体为AAVrh.10rAAV病毒体。衣壳可以是AAV9衣壳或其功能变体。在一些实施方案中,AAVrh.10衣壳与例如以下的参考AAVrh.10衣壳具有至少98%、99%或100%的同一性:
MAADGYLPDWLEDNLSEGIREWWDLKPGAPKPKANQQKQDDGRGLVLPGYKYLGPFNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLRYNHADAEFQERLQEDTSFGGNLGRAVFQAKKRVLEPLGLVEEGAKTAPGKKRPVEPSPQRSPDSSTGIGKKGQQPAKKRLNFGQTGDSESVPDPQPIGEPPAGPSGLGSGTMAAGGGAPMADNNEGADGVGSSSGNWHCDSTWLGDRVITTSTRTWALPTYNNHLYKQISNGTSGGSTNDNTYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNEGTKTIANNLTSTIQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMIPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFEFSYQFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTQSTGGTAGTQQLLFSQAGPNNMSAQAKNWLPGPCYRQQRVSTTLSQNNNSNFAWTGATKYHLNGRDSLVNPGVAMATHKDDEERFFPSSGVLMFGKQGAGKDNVDYSSVMLTSEEEIKTTNPVATEQYGVVADNLQQQNAAPIVGAVNSQGALPGMVWQNRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGLKHPPPQILIKNTPVPADPPTTFSQAKLASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSTNVDFAVNTDGTYSEPRPIGTRYLTRNL
(SEQ ID NO:79)
在一些实施方案中,衣壳蛋白由在质粒上以反式供给到转移质粒的多核苷酸编码。野生型AAVrh74 cap的多核苷酸序列为如下:
AAVrh74衣壳编码序列(SEQ IDNO:80)
ATGGCTGCCGATGGTTATCTTCCAGATTGGCTCGAGGACAACCTCTCTGAGGGCATTCGCGAGTGGTGGGACCTGAAACCTGGAGCCCCGAAACCCAAAGCCAACCAGCAAAAGCAGGACAACGGCCGGGGTCTGGTGCTTCCTGGCTACAAGTACCTCGGACCCTTCAACGGACTCGACAAGGGGGAGCCCGTCAACGCGGCGGACGCAGCGGCCCTCGAGCACGACAAGGC
CTACGACCAGCAGCTCCAAGCGGGTGACAATCCGTACCTGCGGTATA
ATCACGCCGACGCCGAGTTTCAGGAGCGTCTGCAAGAAGATACGTCT
TTTGGGGGCAACCTCGGGCGCGCAGTCTTCCAGGCCAAAAAGCGGGT
TCTCGAACCTCTGGGCCTGGTTGAATCGCCGGTTAAGACGGCTCCTGG
AAAGAAGAGACCGGTAGAGCCATCACCCCAGCGCTCTCCAGACTCCT
CTACGGGCATCGGCAAGAAAGGCCAGCAGCCCGCAAAAAAGAGACT
CAATTTTGGGCAGACTGGCGACTCAGAGTCAGTCCCCGACCCTCAACC
AATCGGAGAACCACCAGCAGGCCCCTCTGGTCTGGGATCTGGTACAA
TGGCTGCAGGCGGTGGCGCTCCAATGGCAGACAATAACGAAGGCGCC
GACGGAGTGGGTAGTTCCTCAGGAAATTGGCATTGCGATTCCACATG
GCTGGGCGACAGAGTCATCACCACCAGCACCCGCACCTGGGCCCTGC
CCACCTACAACAACCACCTCTACAAGCAAATCTCCAACGGGACCTCG
GGAGGAAGCACCAACGACAACACCTACTTCGGCTACAGCACCCCCTG
GGGGTATTTTGACTTCAACAGATTCCACTGCCACTTTTCACCACGTGA
CTGGCAGCGACTCATCAACAACAACTGGGGATTCCGGCCCAAGAGGC
TCAACTTCAAGCTCTTCAACATCCAAGTCAAGGAGGTCACGCAGAAT
GAAGGCACCAAGACCATCGCCAATAACCTTACCAGCACGATTCAGGT
CTTTACGGACTCGGAATACCAGCTCCCGTACGTGCTCGGCTCGGCGCA
CCAGGGCTGCCTGCCTCCGTTCCCGGCGGACGTCTTCATGATTCCTCA
GTACGGGTACCTGACTCTGAACAATGGCAGTCAGGCTGTGGGCCGGT
CGTCCTTCTACTGCCTGGAGTACTTTCCTTCTCAAATGCTGAGAACGG
GCAACAACTTTGAATTCAGCTACAACTTCGAGGACGTGCCCTTCCACA
GCAGCTACGCGCACAGCCAGAGCCTGGACCGGCTGATGAACCCTCTC
ATCGACCAGTACTTGTACTACCTGTCCCGGACTCAAAGCACGGGCGGT
ACTGCAGGAACTCAGCAGTTGCTATTTTCTCAGGCCGGGCCTAACAAC
ATGTCGGCTCAGGCCAAGAACTGGCTACCCGGTCCCTGCTACCGGCA
GCAACGCGTCTCCACGACACTGTCGCAGAACAACAACAGCAACTTTG
CCTGGACGGGTGCCACCAAGTATCATCTGAATGGCAGAGACTCTCTG
GTGAATCCTGGCGTTGCCATGGCTACCCACAAGGACGACGAAGAGCG
ATTTTTTCCATCCAGCGGAGTCTTAATGTTTGGGAAACAGGGAGCTGG
AAAAGACAACGTGGACTATAGCAGCGTGATGCTAACCAGCGAGGAAG
AAATAAAGACCACCAACCCAGTGGCCACAGAACAGTACGGCGTGGTG
GCCGATAACCTGCAACAGCAAAACGCCGCTCCTATTGTAGGGGCCGT
CAATAGTCAAGGAGCCTTACCTGGCATGGTGTGGCAGAACCGGGACG
TGTACCTGCAGGGTCCCATCTGGGCCAAGATTCCTCATACGGACGGCA
ACTTTCATCCCTCGCCGCTGATGGGAGGCTTTGGACTGAAGCATCCGC
CTCCTCAGATCCTGATTAAAAACACACCTGTTCCCGCGGATCCTCCGA
CCACCTTCAATCAGGCCAAGCTGGCTTCTTTCATCACGCAGTACAGTA
CCGGCCAGGTCAGCGTGGAGATCGAGTGGGAGCTGCAGAAGGAGAA
CAGCAAACGCTGGAACCCAGAGATTCAGTACACTTCCAACTACTACA
AATCTACAAATGTGGACTTTGCTGTCAATACTGAGGGTACTTATTCCG
AGCCTCGCCCCATTGGCACCCGTTACCTCACCCGTAATCTGTAA
本公开还提供了AAVrh74 VP1、VP2和VP3的蛋白质序列,包括SEQ ID NO:2-4,以及其同源物或功能变体。
AAVrh74 VP1 (SEQ ID NO: 81)
MAAGGGAPMADNNEGADGVGSSSGNWHCDSTWLGDRVITTSTRTWALPTYNNHLYKQISNGTSGGSTNDNTYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTQNEGTKTIANNLTSTIQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMIPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFEFSYNFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTQSTGGTAGTQQLLFSQAGPNNMSAQAKNWLPGPCYRQQRVSTTLSQNNNSNFAWTGATKYHLNGRDSLVNPGVAMATHKDDEERFFPSSGVLMFGKQGAGKDNVDYSSVMLTSEEEIKTTNPVATEQYGVVADNLQQQNAAPIVGAVNSQGALPGMVWQNRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGLKHPPPQILIKNTPVPADPPTTFNQAKLASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSTNVDFAVNTEGTYSEPRPIGTRYLTRNL
AAVrh74 VP2(SEQ ID NO: 82)
STIQVFTDSEYQLPYVLGSAHQGCLPPFPADVFMIPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFEFSYNFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTQSTGGTAGTQQLLFSQAGPNNMSAQAKNWLPGPCYRQQRVSTTLSQNNNSNFAWTGATKYHLNGRDSLVNPGVAMATHKDDEERFFPSSGVLMFGKQGAGKDNVDYSSVMLTSEEEIKTTNPVATEQYGVVADNLQQQNAAPIVGAVNSQGALPGMVWQNRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGLKHPPPQILIKNTPVPADPPTTFNQAKLASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSTNVDFAVNTEGTYSEPRPIGTRYLTRNL
AAVrh74 VP3 (SEQ ID NO:83)
RTGNNFEFSYNFEDVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTQSTGGTAGTQQLLFSQAGPNNMSAQAKNWLPGPCYRQQRVSTTLSQNNNSNFAWTGATKYHLNGRDSLVNPGVAMATHKDDEERFFPSSGVLMFGKQGAGKDNVDYSSVMLTSEEEIKTTNPVATEQYGVVADNLQQQNAAPIVGAVNSQGALPGMVWQNRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGLKHPPPQILIKNTPVPADPPTTFNQAKLASFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSTNVDFAVNTEGTYSEPRPIGTRYLTRNL
在某些情况下,AAVrh74衣壳包含SEQ ID NO:2中阐述的氨基酸序列。在一些实施方案中,rAAV载体包含多肽,所述多肽包含例如与SEQ ID NO:2中阐述的AAVrh74 VP1的氨基酸序列至少65%、至少70%、至少75%、至少80%、81%、82%、83%、84%、85%、86%、87%、88%或89%、更通常90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多地相同的序列,或基本上由这样的序列组成,或还进一步由这样的序列组成。在一些实施方案中,rAAV载体包含多肽,所述多肽包含例如与SEQ ID NO:3中阐述的AAVrh74 VP2的氨基酸序列至少65%、至少70%、至少75%、至少80%、81%、82%、83%、84%、85%、86%、87%、88%或89%、更通常90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多地相同的序列,或基本上由这样的序列组成,或还进一步由这样的序列组成。在一些实施方案中,rAAV载体包含多肽,所述多肽包含例如与SEQ ID NO:4中阐述的AAVrh74 VP3的氨基酸序列至少65%、至少70%、至少75%、至少80%、81%、82%、83%、84%、85%、86%、87%、88%或89%、更通常90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多地相同的序列,或基本上由这样的序列组成,或还进一步由这样的序列组成。
在一些实施方案中,rAAV病毒体为AAV-PHP.B rAAV病毒体或其神经营养变体,如但不限于在国际专利公开号WO 2015/038958 A1和WO 2017/100671A1中公开的那些。例如,AAV衣壳可以包含来自序列TLAVPFK(SEQ ID NO:85)或KFPVALT(SEQ ID NO:86)的至少4个连续氨基酸,例如插入在编码AAV9的氨基酸588和589的序列之间。
衣壳可以是AAV-PHP.B衣壳或其功能变体。在一些实施方案中,AAV-PHP.B衣壳与例如以下的参考AAV-PHP.B衣壳具有至少98%、99%或100%的同一性:
MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNARGLVLPGYKYLGPGNGLDKGEPVNAADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRLLEPLGLVEEAAKTAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRLNFGQTGDTESVPDPQPIGEPPAAPSGVGSLTMASGGGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDNAYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTSTVQVFTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFSYEFENVPFHSSYAHSQSLDRLMNPLIDQYLYYLSRTINGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYRQQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFGKQGTGRDNVDADKVMITNEEEIKTTNPVATESYGQVATNHQSAQTLAVPFKAQAQTGWVQNQGILPGMVWQDRDVYLQGPIWAKIPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL
(SEQ ID NO:84)
本公开的rAAV病毒体中使用的更多AAV衣壳包括在专利公开号WO 2009/012176A2和WO 2015/168666A2中公开的那些。
不受理论的束缚,本发明人已确定AAV9载体、AAVrh.74或AAVrh.10载体将在载体上赋予期望的心脏趋向性。不受理论的束缚,本发明人还已确定AAV9载体、AAVrh.74或AAVrh.10载体可以向心脏细胞提供所需的特异性。
药物组合物和试剂盒
在一个方面,本公开提供了包含本公开的rAAV病毒体和一种或多种药学上可接受的载体、稀释剂或赋形剂的药物组合物。
就施用的目的而言,例如通过注射,可以采用各种溶液,如无菌水溶液。如果需要,可对这样的水溶液进行缓冲,并且首先用盐水或葡萄糖使液体稀释剂等渗。rAAV呈游离酸(DNA含有酸性磷酸酯基团)或药理学上可接受的盐的溶液可在与表面活性剂如泊洛沙姆188例如以0.001%或0.01%适当混合的水中制备。rAAV的分散体也可在甘油、液体聚乙二醇及其混合物中和油中制备。在一般的储存和使用条件下,这些制剂含有防腐剂以防止微生物的生长。就此而言,所采用的无菌水性介质均可通过本领域技术人员熟知的标准技术容易地获得。
适合于可注射使用的药物形式包括但不限于无菌水溶液或分散体以及用于临时制备无菌可注射溶液或分散体的无菌粉末。在所有情况下,该形式都是无菌的并且必须是流体的至存在易于注射性的程度。其在制造和储存条件下必须是稳定的,并且必须防止微生物如细菌和真菌的污染作用。载体可以是溶剂或分散介质,其含有例如水、乙醇、多元醇(例如,甘油、丙二醇、液体聚乙二醇等)、它们的合适混合物和植物油。适当的流动性可例如通过使用涂料如卵磷脂、通过在分散体的情况下保持所需的粒度以及通过使用表面活性剂来保持。可通过各种抗细菌剂和抗真菌剂例如对羟基苯甲酸酯、氯丁醇、苯酚、山梨酸、硫柳汞等来防止微生物的作用。在许多情况下,优选包括等渗剂,例如糖或氯化钠。可通过使用延迟吸收剂例如单硬脂酸铝和明胶来延长可注射组合物的吸收。
无菌可注射溶液可以通过将rAAV以所需的量与上文列举的各种其他成分一起并入在适宜的溶剂中来制备,如果需要,随后进行过滤灭菌。通常,通过将灭菌的活性成分并入到无菌载体中来制备分散体,该无菌载体含有基础的分散介质和来自上面列举的那些的所需其他成分。在用于制备无菌可注射溶液的无菌粉末的情况下,优选的制备方法是真空干燥和冷冻干燥技术,其产生活性成分外加来自其先前无菌过滤的溶液的任何其他所需成分的粉末。
在另一个方面,本公开包括试剂盒,所述试剂盒包括本公开的rAAV病毒体和使用说明书。
使用方法
在一个方面,本公开提供了一种增加细胞中的MLP活性的方法,其包括使细胞与本公开的rAAV接触。在另一个方面,本公开提供了一种增加受试者中的MLP活性的方法,其包括施用本公开的rAAV。在一些实施方案中,细胞和/或受试者缺乏CSRP3信使RNA或MLP蛋白表达水平和/或活性和/或在CSRP3中包含功能丧失突变。细胞可以是心脏细胞,例如心肌细胞。
在一些实施方案中,所述方法促进细胞培养物中和/或体内心脏细胞例如心肌细胞的存活。在一些实施方案中,所述方法促进和/或恢复心脏的功能。
治疗方法
在另一个方面,本公开提供了一种在有此需要的受试者中治疗疾病或病症的方法,其包括向受试者施用有效量的本公开的rAAV病毒体。在一些实施方案中,疾病或病症为心脏疾病或病症。示意性的心脏病症包括心力衰竭、肥厚型心肌病和扩张型心肌病。在一些实施方案中,受试者罹患CSRP3表达或功能的遗传破坏。在一些实施方案中,疾病或病症为HCM或DCM。在一些实施方案中,疾病或病症为家族性肥厚型心肌病-12(CMH12)。在一些实施方案中,疾病或病症为扩张型心肌病-1M(CMD1M)。在一些实施方案中,疾病或病症为骨骼肌病。在一些实施方案中,疾病或病症为面肩胛肱型肌营养不良症、线状体肌病或2B型肢带型肌营养不良症。在一些实施方案中,疾病或病症为2A型肢带型肌营养不良症、Duchenne型肌营养不良症或皮肌炎。
AAV介导的MLP蛋白向心脏的递送可以延长寿命,预防或减弱心脏细胞变性、心力衰竭、瘢痕形成、射血分数降低、心律失常、心绞痛、阻塞性HCM或DCM、心室肥大(IVS:范围14-32mm)、室性心动过速、常见的I-II的轻度NYHA得分、运动不耐受、心绞痛(胸痛)、心脏性猝死、劳力性肌痛和痉挛。
本文公开的方法可以在心脏中提供有效的生物分布。它们可能导致在所有或大部分心脏细胞例如心肌细胞中的持续表达。值得注意的是,本文公开的方法可以在受试者施用AAV载体后的整个寿命期间提供MLP蛋白的持久表达。
本发明还涵盖组合疗法。特别涵盖本发明的方法与标准医学治疗(例如,皮质类固醇或局部减压药物)的组合,以及与新型疗法的组合。在一些情况下,可以用类固醇和/或免疫抑制剂的组合来治疗受试者以防止或减少对施用本文所述rAAV的免疫反应。
在一些实施方案中,AAV载体以每千克(vg)受试者总体重约1×1012至5×1014个AAV载体的载体基因组(vg)的剂量(vg/kg)施用。在一些实施方案中,AAV载体以约1×1013至5×1014vg/kg的剂量施用。在一些实施方案中,AAV载体以约5×1013至3×1014vg/kg的剂量施用。在一些实施方案中,AAV载体以约5×1013至1×1014vg/kg的剂量施用。在一些实施方案中,AAV载体以小于约1×1012vg/kg、小于约3×1012vg/kg、小于约5×1012vg/kg、小于约7×1012vg/kg、小于约1×1013vg/kg、小于约3×1013vg/kg、小于约5×1013vg/kg、小于约7×1013vg/kg、小于约1×1014vg/kg、小于约3×1014vg/kg、小于约5×1014vg/kg、小于约7×1014vg/kg、小于约1×1015vg/kg、小于约3×1015vg/kg、小于约5×1015vg/kg、或小于约7×1015vg/kg的剂量施用。
在一些实施方案中,AAV载体以约1×1012vg/kg、约3×1012vg/kg、约5×1012vg/kg、约7×1012vg/kg、约1×1013vg/kg、约3×1013vg/kg、约5×1013vg/kg、约7×1013vg/kg、约1×1014vg/kg、约3×1014vg/kg、约5×1014vg/kg、约7×1014vg/kg、约1×1015vg/kg、约3×1015vg/kg、约5×1015vg/kg、或约7×1015vg/kg的剂量施用。
在一些实施方案中,AAV载体以1×1012vg/kg、3×1012vg/kg、5×1012vg/kg、7×1012vg/kg、1×1013vg/kg、3×1013vg/kg、5×1013vg/kg、7×1013vg/kg、1×1014vg/kg、3×1014vg/kg、5×1014vg/kg、7×1014vg/kg、1×1015vg/kg、3×1015vg/kg、5×1015vg/kg、或7×1015vg/kg的剂量施用。
在一些实施方案中,AAV载体以每千克(vg)受试者总体重约1×1012至5×1014个AAV载体的载体基因组(vg)的剂量(vg/kg)全身施用。在一些实施方案中,AAV载体以约1×1013至5×1014vg/kg的剂量全身施用。在一些实施方案中,AAV载体以约5×1013至3×1014vg/kg的剂量全身施用。在一些实施方案中,AAV载体以约5×1013至1×1014vg/kg的剂量全身施用。在一些实施方案中,AAV载体以小于约1×1012vg/kg、小于约3×1012vg/kg、小于约5×1012vg/kg、小于约7×1012vg/kg、小于约1×1013vg/kg、小于约3×1013vg/kg、小于约5×1013vg/kg、小于约7×1013vg/kg、小于约1×1014vg/kg、小于约3×1014vg/kg、小于约5×1014vg/kg、小于约7×1014vg/kg、小于约1×1015vg/kg、小于约3×1015vg/kg、小于约5×1015vg/kg、或小于约7×1015vg/kg的剂量全身施用。
在一些实施方案中,AAV载体以约1×1012vg/kg、约3×1012vg/kg、约5×1012vg/kg、约7×1012vg/kg、约1×1013vg/kg、约3×1013vg/kg、约5×1013vg/kg、约7×1013vg/kg、约1×1014vg/kg、约3×1014vg/kg、约5×1014vg/kg、约7×1014vg/kg、约1×1015vg/kg、约3×1015vg/kg、约5×1015vg/kg、或约7×1015vg/kg的剂量全身施用。
在一些实施方案中,AAV载体以1×1012vg/kg、3×1012vg/kg、5×1012vg/kg、7×1012vg/kg、1×1013vg/kg、3×1013vg/kg、5×1013vg/kg、7×1013vg/kg、1×1014vg/kg、3×1014vg/kg、5×1014vg/kg、7×1014vg/kg、1×1015vg/kg、3×1015vg/kg、5×1015vg/kg、或7×1015vg/kg的剂量全身施用。
在一些实施方案中,AAV载体以每千克(vg)受试者总体重约1×1012至5×1014个AAV载体的载体基因组(vg)的剂量(vg/kg)静脉内施用。在一些实施方案中,AAV载体以约1×1013至5×1014vg/kg的剂量静脉内施用。在一些实施方案中,AAV载体以约5×1013至3×1014vg/kg的剂量静脉内施用。在一些实施方案中,AAV载体以约5×1013至1×1014vg/kg的剂量静脉内施用。在一些实施方案中,AAV载体以小于约1×1012vg/kg、小于约3×1012vg/kg、小于约5×1012vg/kg、小于约7×1012vg/kg、小于约1×1013vg/kg、小于约3×1013vg/kg、小于约5×1013vg/kg、小于约7×1013vg/kg、小于约1×1014vg/kg、小于约3×1014vg/kg、小于约5×1014vg/kg、小于约7×1014vg/kg、小于约1×1015vg/kg、小于约3×1015vg/kg、小于约5×1015vg/kg、或小于约7×1015vg/kg的剂量静脉内施用。
在一些实施方案中,AAV载体以约1×1012vg/kg、约3×1012vg/kg、约5×1012vg/kg、约7×1012vg/kg、约1×1013vg/kg、约3×1013vg/kg、约5×1013vg/kg、约7×1013vg/kg、约1×1014vg/kg、约3×1014vg/kg、约5×1014vg/kg、约7×1014vg/kg、约1×1015vg/kg、约3×1015vg/kg、约5×1015vg/kg、或约7×1015vg/kg的剂量静脉内施用。
在一些实施方案中,AAV载体以1×1012vg/kg、3×1012vg/kg、5×1012vg/kg、7×1012vg/kg、1×1013vg/kg、3×1013vg/kg、5×1013vg/kg、7×1013vg/kg、1×1014vg/kg、3×1014vg/kg、5×1014vg/kg、7×1014vg/kg、1×1015vg/kg、3×1015vg/kg、5×1015vg/kg、或7×1015vg/kg的剂量静脉内施用。
纽约心脏协会功能分类(NYHA分级)、病理心电图、左心室舒张末期/收缩末期直径、最大心室壁厚度、最大后壁厚度、E峰和A峰速度、峰值早期和峰值晚期经二尖瓣充盈速度、早期舒张和晚期舒张组织多普勒速度、高血压和心脏肥大程度的变化可能揭示患者功能改善、临床获益或疗效的证据。与基线或疾病匹配的对照患者相比,另外的心肌组织学将揭示AAV介导的MLP益处,其显示心肌细胞肥大的减少、肌细胞阵列的减少以及间质和血管周围纤维化和瘢痕的减少。
组合物的施用
可以通过本领域的标准途径施用有效剂量的组合物,包括但不限于全身、局部、直接注射、静脉内、心内施用。在一些情况下,施用包括全身、局部、直接注射、静脉内、心内注射。施用可以通过心导管插入术进行。
在一些实施方案中,本公开提供了有效剂量的rAAV和本发明组合物的局部施用和全身施用。例如,全身施用可以是施用到循环系统中,从而影响整个身体。全身施用包括通过注射、输注或植入进行肠胃外施用。本文公开的组合物的施用途径包括静脉内(“IV”)施用、腹膜内(“IP”)施用、肌肉内(“IM”)施用、病灶内施用或皮下(“SC”)施用,或缓慢释放装置例如微型渗透泵、储库制剂等的植入。在一些实施方案中,本公开的方法包括通过静脉内、肌肉内、动脉内、肾内、尿道内、心内、冠状动脉内、心肌内、真皮内、硬膜外、皮下、腹膜内、心室内、离子电渗疗法或颅内施用来施用本公开的AAV载体或其药物组合物。
特别地,本发明的rAAV的施用可以通过使用将rAAV重组载体输送到动物靶组织中的任何物理方法来实现。施用包括但不限于注射到心脏中。
在一些实施方案中,本公开的方法包括心内递送。可以使用专用套管、导管、注射器/针头、使用输注泵进行输注。施用可以包括向心脏递送有效量的rAAV病毒体或包含rAAV病毒体的药物组合物。这些可以例如经由静脉内、肌肉内、动脉内、肾内、尿道内、心内、冠状动脉内、心肌内、真皮内、硬膜外、皮下、腹膜内、心室内、离子电渗疗法或颅内施用来实现。本公开的组合物还可以静脉内施用。
本文公开的治疗方法可以减少和/或预防一种或多种症状,包括但不限于心室肥大、室性心动过速、常见的I-II的轻度NYHA得分、运动不耐受和心绞痛。
实施例
实施例1:临床前生物活性和功效
使用培养的心肌细胞(例如,诱导的多能干细胞心肌细胞,iPSC-CM)对图1-4中示意的载体进行体外测试。通过免疫荧光法和蛋白质印迹法来评估MLP的表达。磷酸化测定揭示蛋白激酶C-α(PKC-A)自磷酸化的减少。
使用心肌病的MLP-缺陷型或MLP-突变型小鼠模型(例如,C58G敲入(KI)模型或W4RKI模型)对选择的载体进行体内测试。通过测量左心室射血分数(LVEF)和/或左心室舒张末期尺寸(LVED)(使用超声心动描记术)、总体心脏重量的减少(例如,标准化为胫骨长度)、左心室性能dP/dtmax、dP/dtmin和松弛常数Tau的有创血流动力学评估或组织学评价后左和/或右心室肥大的减少来确定功效。另外,通过测量生物标志物来评估在小鼠模型中的体内功效,所述生物标志物包括但不限于心房利钠因子(Nppa)基因表达、脑利钠肽(Nppb)基因表达和β-肌球蛋白重链蛋白表达。通过测试蛋白激酶C-α(PKC-A)活性、心脏中的磷酸化MLP、泛素蛋白酶体降解活性来确定生理功效。对AAV载体观察到响应于治疗的正常化或缓解。
实施例2:人心肌细胞中的蛋白质表达
使用对照细胞系(CHO-Lec2;图5A)和培养的心肌细胞(分化的AC16细胞系;图5B)对图1-4中示意的载体进行体外测试。通过蛋白质印迹法评估肌肉LIM蛋白(MLP;由CSRP3编码的蛋白)的表达。
图5A示出了在转导的CHO-Lec2中的CSRP3表达。图5B示出了在转导的心肌细胞(分化的AC16细胞系-Sigma-
Figure BDA0004113480510000551
目录号SCC109)中的CSRP3表达。用来自每个载体的3E5MOI转导细胞;6天后,收集细胞裂解物,并使用抗-CSRP3多克隆抗体(Thermo-/>
Figure BDA0004113480510000552
PA5-29155 1:1000)进行蛋白质印迹法。
当使用MHCK7启动子时,来自CSRP3转基因的MLP蛋白的表达高于当使用hTNNT2("hTnT")启动子时。AAV载体的AAV9和AAVrh74血清型两者都能够转导心肌细胞细胞系。基于图5B中的数据,用AAVrh74载体的MLP蛋白表达明显高于用AAV9载体的表达。
序列表
<110> Spacecraft Seven, LLC
<120> CSRP3(富含半胱氨酸和甘氨酸的蛋白质3)基因疗法
<130> ROPA-020/01WO 329592-22266
<150> US 63/061,727
<151> 2020-08-05
<160> 86
<170> PatentIn 3.5版
<210> 1
<211> 194
<212> PRT
<213> 智人
<400> 1
Met Pro Asn Trp Gly Gly Gly Ala Lys Cys Gly Ala Cys Glu Lys Thr
1 5 10 15
Val Tyr His Ala Glu Glu Ile Gln Cys Asn Gly Arg Ser Phe His Lys
20 25 30
Thr Cys Phe His Cys Met Ala Cys Arg Lys Ala Leu Asp Ser Thr Thr
35 40 45
Val Ala Ala His Glu Ser Glu Ile Tyr Cys Lys Val Cys Tyr Gly Arg
50 55 60
Arg Tyr Gly Pro Lys Gly Ile Gly Tyr Gly Gln Gly Ala Gly Cys Leu
65 70 75 80
Ser Thr Asp Thr Gly Glu His Leu Gly Leu Gln Phe Gln Gln Ser Pro
85 90 95
Lys Pro Ala Arg Ser Val Thr Thr Ser Asn Pro Ser Lys Phe Thr Ala
100 105 110
Lys Phe Gly Glu Ser Glu Lys Cys Pro Arg Cys Gly Lys Ser Val Tyr
115 120 125
Ala Ala Glu Lys Val Met Gly Gly Gly Lys Pro Trp His Lys Thr Cys
130 135 140
Phe Arg Cys Ala Ile Cys Gly Lys Ser Leu Glu Ser Thr Asn Val Thr
145 150 155 160
Asp Lys Asp Gly Glu Leu Tyr Cys Lys Val Cys Tyr Ala Lys Asn Phe
165 170 175
Gly Pro Thr Gly Ile Gly Phe Gly Gly Leu Thr Gln Gln Val Glu Lys
180 185 190
Lys Glu
<210> 2
<211> 150
<212> PRT
<213> 智人
<400> 2
Met Pro Asn Trp Gly Gly Gly Ala Lys Cys Gly Ala Cys Glu Lys Thr
1 5 10 15
Val Tyr His Ala Glu Glu Ile Gln Cys Asn Gly Arg Ser Phe His Lys
20 25 30
Thr Cys Phe His Cys Ser Pro Gln Ser Arg His Ala Gln Leu Pro Pro
35 40 45
Ala Thr Leu Pro Asn Ser Leu Arg Ser Leu Glu Ser Pro Arg Ser Ala
50 55 60
Leu Asp Val Ala Ser Gln Ser Met Leu Leu Arg Arg Leu Trp Glu Val
65 70 75 80
Ala Ser Leu Gly Thr Arg Pro Val Ser Ala Val Pro Ser Val Gly Arg
85 90 95
Val Trp Ser Pro Gln Met Ser Leu Thr Lys Met Gly Asn Phe Ile Ala
100 105 110
Lys Phe Ala Met Pro Lys Ile Leu Ala Pro Arg Val Leu Gly Leu Glu
115 120 125
Ala Leu His Asn Lys Trp Lys Arg Lys Asn Glu Glu Val Arg Arg Phe
130 135 140
Ser Asp Phe Leu Arg Ala
145 150
<210> 3
<211> 39
<212> PRT
<213> 智人
<400> 3
Met Pro Asn Trp Gly Gly Gly Ala Lys Cys Gly Ala Cys Glu Lys Thr
1 5 10 15
Val Tyr His Ala Glu Glu Ile Gln Cys Asn Gly Arg Ser Phe His Lys
20 25 30
Thr Cys Phe His Cys Leu Cys
35
<210> 4
<211> 58
<212> PRT
<213> 智人
<400> 4
Met Pro Asn Trp Gly Gly Gly Ala Lys Cys Gly Ala Cys Glu Lys Thr
1 5 10 15
Val Tyr His Ala Glu Glu Ile Gln Cys Asn Gly Arg Ser Phe His Lys
20 25 30
Thr Cys Phe His Cys Thr Leu Ala Gln Asp Leu Phe Pro Leu Cys His
35 40 45
Leu Trp Glu Glu Ser Gly Val His Lys Cys
50 55
<210> 5
<211> 582
<212> DNA
<213> 智人
<400> 5
atgccaaact ggggcggagg cgcaaaatgt ggagcctgtg aaaagaccgt ctaccatgca 60
gaagaaatcc agtgcaatgg aaggagtttc cacaagacgt gtttccactg catggcctgc 120
aggaaggctc ttgacagcac gacagtcgcg gctcatgagt cggagatcta ctgcaaggtg 180
tgctatgggc gcagatatgg ccccaaaggg atcgggtatg gacaaggcgc tggctgtctc 240
agcacagaca cgggcgagca tctcggcctg cagttccaac agtccccaaa gccggcacgc 300
tcagttacca ccagcaaccc ttccaaattc actgcgaagt ttggagagtc cgagaagtgc 360
cctcgatgtg gcaagtcagt ctatgctgct gagaaggtta tgggaggtgg caagccttgg 420
cacaagacct gtttccgctg tgccatctgt gggaagagtc tggagtccac aaatgtcact 480
gacaaagatg gggaacttta ttgcaaagtt tgctatgcca aaaattttgg ccccacgggt 540
attgggtttg gaggccttac acaacaagtg gaaaagaaag aa 582
<210> 6
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> Kozak序列基序
<400> 6
gccaccatgg 10
<210> 7
<211> 588
<212> DNA
<213> 人工序列
<220>
<223> 编码具有Kozak序列的MLP的多核苷酸
<400> 7
gccaccatgc caaactgggg cggaggcgca aaatgtggag cctgtgaaaa gaccgtctac 60
catgcagaag aaatccagtg caatggaagg agtttccaca agacgtgttt ccactgcatg 120
gcctgcagga aggctcttga cagcacgaca gtcgcggctc atgagtcgga gatctactgc 180
aaggtgtgct atgggcgcag atatggcccc aaagggatcg ggtatggaca aggcgctggc 240
tgtctcagca cagacacggg cgagcatctc ggcctgcagt tccaacagtc cccaaagccg 300
gcacgctcag ttaccaccag caacccttcc aaattcactg cgaagtttgg agagtccgag 360
aagtgccctc gatgtggcaa gtcagtctat gctgctgaga aggttatggg aggtggcaag 420
ccttggcaca agacctgttt ccgctgtgcc atctgtggga agagtctgga gtccacaaat 480
gtcactgaca aagatgggga actttattgc aaagtttgct atgccaaaaa ttttggcccc 540
acgggtattg ggtttggagg ccttacacaa caagtggaaa agaaagaa 588
<210> 8
<211> 2152
<212> DNA
<213> 人工序列
<220>
<223> 实验室中制备 - MHCK7-CSRP3表达盒
<400> 8
acccttcaga ttaaaaataa ctgaggtaag ggcctgggta ggggaggtgg tgtgagacgc 60
tcctgtctct cctctatctg cccatcggcc ctttggggag gaggaatgtg cccaaggact 120
aaaaaaaggc catggagcca gaggggcgag ggcaacagac ctttcatggg caaaccttgg 180
ggccctgctg tctagcatgc cccactacgg gtctaggctg cccatgtaag gaggcaaggc 240
ctggggacac ccgagatgcc tggttataat taacccagac atgtggctgc cccccccccc 300
ccaacacctg ctgcctctaa aaataaccct gtccctggtg gatcccctgc atgcgaagat 360
cttcgaacaa ggctgtgggg gactgagggc aggctgtaac aggcttgggg gccagggctt 420
atacgtgcct gggactccca aagtattact gttccatgtt cccggcgaag ggccagctgt 480
cccccgccag ctagactcag cacttagttt aggaaccagt gagcaagtca gcccttgggg 540
cagcccatac aaggccatgg ggctgggcaa gctgcacgcc tgggtccggg gtgggcacgg 600
tgcccgggca acgagctgaa agctcatctg ctctcagggg cccctccctg gggacagccc 660
ctcctggcta gtcacaccct gtaggctcct ctatataacc caggggcaca ggggctgccc 720
tcattctacc accacctcca cagcacagac agacactcag gagccagcca ggccaccatg 780
ccaaactggg gcggaggcgc aaaatgtgga gcctgtgaaa agaccgtcta ccatgcagaa 840
gaaatccagt gcaatggaag gagtttccac aagacgtgtt tccactgcat ggcctgcagg 900
aaggctcttg acagcacgac agtcgcggct catgagtcgg agatctactg caaggtgtgc 960
tatgggcgca gatatggccc caaagggatc gggtatggac aaggcgctgg ctgtctcagc 1020
acagacacgg gcgagcatct cggcctgcag ttccaacagt ccccaaagcc ggcacgctca 1080
gttaccacca gcaacccttc caaattcact gcgaagtttg gagagtccga gaagtgccct 1140
cgatgtggca agtcagtcta tgctgctgag aaggttatgg gaggtggcaa gccttggcac 1200
aagacctgtt tccgctgtgc catctgtggg aagagtctgg agtccacaaa tgtcactgac 1260
aaagatgggg aactttattg caaagtttgc tatgccaaaa attttggccc cacgggtatt 1320
gggtttggag gccttacaca acaagtggaa aagaaagaat gatcaacctc tggattacaa 1380
aatttgtgaa agattgactg gtattcttaa ctatgttgct ccttttacgc tatgtggata 1440
cgctgcttta atgcctttgt atcatgctat tgcttcccgt atggctttca ttttctcctc 1500
cttgtataaa tcctggttgc tgtctcttta tgaggagttg tggcccgttg tcaggcaacg 1560
tggcgtggtg tgcactgtgt ttgctgacgc aacccccact ggttggggca ttgccaccac 1620
ctgtcagctc ctttccggga ctttcgcttt ccccctccct attgccacgg cggaactcat 1680
cgccgcctgc cttgcccgct gctggacagg ggctcggctg ttgggcactg acaattccgt 1740
ggtgttgtcg gggaaatcat cgtcctttcc ttggctgctc gcctgtgttg ccacctggat 1800
tctgcgcggg acgtccttct gctacgtccc ttcggccctc aatccagcgg accttccttc 1860
ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt cgccttcgcc ctcagacgag 1920
tcggatctcc ctttgggccg cctccccgca ctgcccgggt ggcatccctg tgacccctcc 1980
ccagtgcctc tcctggccct ggaagttgcc actccagtgc ccaccagcct tgtcctaata 2040
aaattaagtt gcatcatttt gtctgactag gtgtccttct ataatattat ggggtggagg 2100
ggggtggtat ggagcaaggg gcccaagttg ggaagaaacc tgtagggcct gc 2152
<210> 9
<211> 1925
<212> DNA
<213> 人工序列
<220>
<223> 实验室中制备 - hTnT-CSRP3表达盒
<400> 9
ctcagtccat taggagccag tagcctggaa gatgtcttta cccccagcat cagttcaagt 60
ggagcagcac ataactcttg ccctctgcct tccaagattc tggtgctgag acttatggag 120
tgtcttggag gttgccttct gccccccaac cctgctccca gctggccctc ccaggcctgg 180
gttgctggcc tctgctttat caggattctc aagagggaca gctggtttat gttgcatgac 240
tgttccctgc atatctgctc tggttttaaa tagcttatct gagcagctgg aggaccacat 300
gggcttatat ggcgtggggt acatgttcct gtagccttgt ccctggcacc tgccaaaata 360
gcagccaaca ccccccaccc ccaccgccat ccccctgccc cacccgtccc ctgtcgcaca 420
ttcctccctc cgcagggctg gctcaccagg ccccagccca catgcctgct taaagccctc 480
tccatcctct gcctcaccca gtccccgctg agactgagca gacgcctcca ggatctgtcg 540
gcaggccacc atgccaaact ggggcggagg cgcaaaatgt ggagcctgtg aaaagaccgt 600
ctaccatgca gaagaaatcc agtgcaatgg aaggagtttc cacaagacgt gtttccactg 660
catggcctgc aggaaggctc ttgacagcac gacagtcgcg gctcatgagt cggagatcta 720
ctgcaaggtg tgctatgggc gcagatatgg ccccaaaggg atcgggtatg gacaaggcgc 780
tggctgtctc agcacagaca cgggcgagca tctcggcctg cagttccaac agtccccaaa 840
gccggcacgc tcagttacca ccagcaaccc ttccaaattc actgcgaagt ttggagagtc 900
cgagaagtgc cctcgatgtg gcaagtcagt ctatgctgct gagaaggtta tgggaggtgg 960
caagccttgg cacaagacct gtttccgctg tgccatctgt gggaagagtc tggagtccac 1020
aaatgtcact gacaaagatg gggaacttta ttgcaaagtt tgctatgcca aaaattttgg 1080
ccccacgggt attgggtttg gaggccttac acaacaagtg gaaaagaaag aatgatcaac 1140
ctctggatta caaaatttgt gaaagattga ctggtattct taactatgtt gctcctttta 1200
cgctatgtgg atacgctgct ttaatgcctt tgtatcatgc tattgcttcc cgtatggctt 1260
tcattttctc ctccttgtat aaatcctggt tgctgtctct ttatgaggag ttgtggcccg 1320
ttgtcaggca acgtggcgtg gtgtgcactg tgtttgctga cgcaaccccc actggttggg 1380
gcattgccac cacctgtcag ctcctttccg ggactttcgc tttccccctc cctattgcca 1440
cggcggaact catcgccgcc tgccttgccc gctgctggac aggggctcgg ctgttgggca 1500
ctgacaattc cgtggtgttg tcggggaaat catcgtcctt tccttggctg ctcgcctgtg 1560
ttgccacctg gattctgcgc gggacgtcct tctgctacgt cccttcggcc ctcaatccag 1620
cggaccttcc ttcccgcggc ctgctgccgg ctctgcggcc tcttccgcgt cttcgccttc 1680
gccctcagac gagtcggatc tccctttggg ccgcctcccc gcactgcccg ggtggcatcc 1740
ctgtgacccc tccccagtgc ctctcctggc cctggaagtt gccactccag tgcccaccag 1800
ccttgtccta ataaaattaa gttgcatcat tttgtctgac taggtgtcct tctataatat 1860
tatggggtgg aggggggtgg tatggagcaa ggggcccaag ttgggaagaa acctgtaggg 1920
cctgc 1925
<210> 10
<211> 2152
<212> DNA
<213> 人工序列
<220>
<223> 实验室中制备 - MHCK7-CSRP3表达盒
<400> 10
acccttcaga ttaaaaataa ctgaggtaag ggcctgggta ggggaggtgg tgtgagacgc 60
tcctgtctct cctctatctg cccatcggcc ctttggggag gaggaatgtg cccaaggact 120
aaaaaaaggc catggagcca gaggggcgag ggcaacagac ctttcatggg caaaccttgg 180
ggccctgctg tctagcatgc cccactacgg gtctaggctg cccatgtaag gaggcaaggc 240
ctggggacac ccgagatgcc tggttataat taacccagac atgtggctgc cccccccccc 300
ccaacacctg ctgcctctaa aaataaccct gtccctggtg gatcccctgc atgcgaagat 360
cttcgaacaa ggctgtgggg gactgagggc aggctgtaac aggcttgggg gccagggctt 420
atacgtgcct gggactccca aagtattact gttccatgtt cccggcgaag ggccagctgt 480
cccccgccag ctagactcag cacttagttt aggaaccagt gagcaagtca gcccttgggg 540
cagcccatac aaggccatgg ggctgggcaa gctgcacgcc tgggtccggg gtgggcacgg 600
tgcccgggca acgagctgaa agctcatctg ctctcagggg cccctccctg gggacagccc 660
ctcctggcta gtcacaccct gtaggctcct ctatataacc caggggcaca ggggctgccc 720
tcattctacc accacctcca cagcacagac agacactcag gagccagcca ggccaccatg 780
cccaattggg gtggaggagc taaatgtgga gcttgtgaaa aaacagttta tcatgctgaa 840
gaaattcaat gtaatggaag atcttttcat aaaacatgtt ttcattgtat ggcttgtaga 900
aaagcacttg attctacaac tgttgcagca catgaaagtg aaatctattg taaagtatgt 960
tatggaagaa gatatggacc aaaaggaatt ggatatggac aaggagcagg atgtctttct 1020
acagatactg gagaacattt gggattgcaa tttcaacaaa gtcctaaacc agctagatct 1080
gttacaacaa gtaatccatc aaaatttact gctaaatttg gagaatccga aaaatgtcct 1140
agatgtggaa aatcagtata tgctgctgaa aaagttatgg gaggtggaaa accatggcat 1200
aagacatgtt ttagatgtgc aatttgtggt aaatctttgg aatctacaaa tgttacagat 1260
aaagatggag aattgtattg taaagtttgt tatgctaaaa attttggacc tacaggtata 1320
ggatttggag gtttgacaca acaagttgaa aaaaaagaat gatcaacctc tggattacaa 1380
aatttgtgaa agattgactg gtattcttaa ctatgttgct ccttttacgc tatgtggata 1440
cgctgcttta atgcctttgt atcatgctat tgcttcccgt atggctttca ttttctcctc 1500
cttgtataaa tcctggttgc tgtctcttta tgaggagttg tggcccgttg tcaggcaacg 1560
tggcgtggtg tgcactgtgt ttgctgacgc aacccccact ggttggggca ttgccaccac 1620
ctgtcagctc ctttccggga ctttcgcttt ccccctccct attgccacgg cggaactcat 1680
cgccgcctgc cttgcccgct gctggacagg ggctcggctg ttgggcactg acaattccgt 1740
ggtgttgtcg gggaaatcat cgtcctttcc ttggctgctc gcctgtgttg ccacctggat 1800
tctgcgcggg acgtccttct gctacgtccc ttcggccctc aatccagcgg accttccttc 1860
ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt cgccttcgcc ctcagacgag 1920
tcggatctcc ctttgggccg cctccccgca ctgcccgggt ggcatccctg tgacccctcc 1980
ccagtgcctc tcctggccct ggaagttgcc actccagtgc ccaccagcct tgtcctaata 2040
aaattaagtt gcatcatttt gtctgactag gtgtccttct ataatattat ggggtggagg 2100
ggggtggtat ggagcaaggg gcccaagttg ggaagaaacc tgtagggcct gc 2152
<210> 11
<211> 1925
<212> DNA
<213> 人工序列
<220>
<223> 实验室中制备 - 优化的hTnT-CSRP3表达盒密码子
<400> 11
ctcagtccat taggagccag tagcctggaa gatgtcttta cccccagcat cagttcaagt 60
ggagcagcac ataactcttg ccctctgcct tccaagattc tggtgctgag acttatggag 120
tgtcttggag gttgccttct gccccccaac cctgctccca gctggccctc ccaggcctgg 180
gttgctggcc tctgctttat caggattctc aagagggaca gctggtttat gttgcatgac 240
tgttccctgc atatctgctc tggttttaaa tagcttatct gagcagctgg aggaccacat 300
gggcttatat ggcgtggggt acatgttcct gtagccttgt ccctggcacc tgccaaaata 360
gcagccaaca ccccccaccc ccaccgccat ccccctgccc cacccgtccc ctgtcgcaca 420
ttcctccctc cgcagggctg gctcaccagg ccccagccca catgcctgct taaagccctc 480
tccatcctct gcctcaccca gtccccgctg agactgagca gacgcctcca ggatctgtcg 540
gcaggccacc atgcccaatt ggggtggagg agctaaatgt ggagcttgtg aaaaaacagt 600
ttatcatgct gaagaaattc aatgtaatgg aagatctttt cataaaacat gttttcattg 660
tatggcttgt agaaaagcac ttgattctac aactgttgca gcacatgaaa gtgaaatcta 720
ttgtaaagta tgttatggaa gaagatatgg accaaaagga attggatatg gacaaggagc 780
aggatgtctt tctacagata ctggagaaca tttgggattg caatttcaac aaagtcctaa 840
accagctaga tctgttacaa caagtaatcc atcaaaattt actgctaaat ttggagaatc 900
cgaaaaatgt cctagatgtg gaaaatcagt atatgctgct gaaaaagtta tgggaggtgg 960
aaaaccatgg cataagacat gttttagatg tgcaatttgt ggtaaatctt tggaatctac 1020
aaatgttaca gataaagatg gagaattgta ttgtaaagtt tgttatgcta aaaattttgg 1080
acctacaggt ataggatttg gaggtttgac acaacaagtt gaaaaaaaag aatgatcaac 1140
ctctggatta caaaatttgt gaaagattga ctggtattct taactatgtt gctcctttta 1200
cgctatgtgg atacgctgct ttaatgcctt tgtatcatgc tattgcttcc cgtatggctt 1260
tcattttctc ctccttgtat aaatcctggt tgctgtctct ttatgaggag ttgtggcccg 1320
ttgtcaggca acgtggcgtg gtgtgcactg tgtttgctga cgcaaccccc actggttggg 1380
gcattgccac cacctgtcag ctcctttccg ggactttcgc tttccccctc cctattgcca 1440
cggcggaact catcgccgcc tgccttgccc gctgctggac aggggctcgg ctgttgggca 1500
ctgacaattc cgtggtgttg tcggggaaat catcgtcctt tccttggctg ctcgcctgtg 1560
ttgccacctg gattctgcgc gggacgtcct tctgctacgt cccttcggcc ctcaatccag 1620
cggaccttcc ttcccgcggc ctgctgccgg ctctgcggcc tcttccgcgt cttcgccttc 1680
gccctcagac gagtcggatc tccctttggg ccgcctcccc gcactgcccg ggtggcatcc 1740
ctgtgacccc tccccagtgc ctctcctggc cctggaagtt gccactccag tgcccaccag 1800
ccttgtccta ataaaattaa gttgcatcat tttgtctgac taggtgtcct tctataatat 1860
tatggggtgg aggggggtgg tatggagcaa ggggcccaag ttgggaagaa acctgtaggg 1920
cctgc 1925
<210> 12
<211> 2430
<212> DNA
<213> 人工序列
<220>
<223> 实验室中制备 - 载体基因组的全多核苷酸序列
<400> 12
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg 60
cgtcgggcga cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctaccct tcagattaaa aataactgag gtaagggcct 180
gggtagggga ggtggtgtga gacgctcctg tctctcctct atctgcccat cggccctttg 240
gggaggagga atgtgcccaa ggactaaaaa aaggccatgg agccagaggg gcgagggcaa 300
cagacctttc atgggcaaac cttggggccc tgctgtctag catgccccac tacgggtcta 360
ggctgcccat gtaaggaggc aaggcctggg gacacccgag atgcctggtt ataattaacc 420
cagacatgtg gctgcccccc cccccccaac acctgctgcc tctaaaaata accctgtccc 480
tggtggatcc cctgcatgcg aagatcttcg aacaaggctg tgggggactg agggcaggct 540
gtaacaggct tgggggccag ggcttatacg tgcctgggac tcccaaagta ttactgttcc 600
atgttcccgg cgaagggcca gctgtccccc gccagctaga ctcagcactt agtttaggaa 660
ccagtgagca agtcagccct tggggcagcc catacaaggc catggggctg ggcaagctgc 720
acgcctgggt ccggggtggg cacggtgccc gggcaacgag ctgaaagctc atctgctctc 780
aggggcccct ccctggggac agcccctcct ggctagtcac accctgtagg ctcctctata 840
taacccaggg gcacaggggc tgccctcatt ctaccaccac ctccacagca cagacagaca 900
ctcaggagcc agccaggcca ccatgccaaa ctggggcgga ggcgcaaaat gtggagcctg 960
tgaaaagacc gtctaccatg cagaagaaat ccagtgcaat ggaaggagtt tccacaagac 1020
gtgtttccac tgcatggcct gcaggaaggc tcttgacagc acgacagtcg cggctcatga 1080
gtcggagatc tactgcaagg tgtgctatgg gcgcagatat ggccccaaag ggatcgggta 1140
tggacaaggc gctggctgtc tcagcacaga cacgggcgag catctcggcc tgcagttcca 1200
acagtcccca aagccggcac gctcagttac caccagcaac ccttccaaat tcactgcgaa 1260
gtttggagag tccgagaagt gccctcgatg tggcaagtca gtctatgctg ctgagaaggt 1320
tatgggaggt ggcaagcctt ggcacaagac ctgtttccgc tgtgccatct gtgggaagag 1380
tctggagtcc acaaatgtca ctgacaaaga tggggaactt tattgcaaag tttgctatgc 1440
caaaaatttt ggccccacgg gtattgggtt tggaggcctt acacaacaag tggaaaagaa 1500
agaatgatca acctctggat tacaaaattt gtgaaagatt gactggtatt cttaactatg 1560
ttgctccttt tacgctatgt ggatacgctg ctttaatgcc tttgtatcat gctattgctt 1620
cccgtatggc tttcattttc tcctccttgt ataaatcctg gttgctgtct ctttatgagg 1680
agttgtggcc cgttgtcagg caacgtggcg tggtgtgcac tgtgtttgct gacgcaaccc 1740
ccactggttg gggcattgcc accacctgtc agctcctttc cgggactttc gctttccccc 1800
tccctattgc cacggcggaa ctcatcgccg cctgccttgc ccgctgctgg acaggggctc 1860
ggctgttggg cactgacaat tccgtggtgt tgtcggggaa atcatcgtcc tttccttggc 1920
tgctcgcctg tgttgccacc tggattctgc gcgggacgtc cttctgctac gtcccttcgg 1980
ccctcaatcc agcggacctt ccttcccgcg gcctgctgcc ggctctgcgg cctcttccgc 2040
gtcttcgcct tcgccctcag acgagtcgga tctccctttg ggccgcctcc ccgcactgcc 2100
cgggtggcat ccctgtgacc cctccccagt gcctctcctg gccctggaag ttgccactcc 2160
agtgcccacc agccttgtcc taataaaatt aagttgcatc attttgtctg actaggtgtc 2220
cttctataat attatggggt ggaggggggt ggtatggagc aaggggccca agttgggaag 2280
aaacctgtag ggcctgcagg aacccctagt gatggagact ccctctctgc gcgctcgctc 2340
gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc 2400
agtgagcgag cgagcgcgca gagagggagt 2430
<210> 13
<211> 2203
<212> DNA
<213> 人工序列
<220>
<223> 实验室中制备 - 载体基因组的全多核苷酸序列
<400> 13
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg 60
cgtcgggcga cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctctcag tccattagga gccagtagcc tggaagatgt 180
ctttaccccc agcatcagtt caagtggagc agcacataac tcttgccctc tgccttccaa 240
gattctggtg ctgagactta tggagtgtct tggaggttgc cttctgcccc ccaaccctgc 300
tcccagctgg ccctcccagg cctgggttgc tggcctctgc tttatcagga ttctcaagag 360
ggacagctgg tttatgttgc atgactgttc cctgcatatc tgctctggtt ttaaatagct 420
tatctgagca gctggaggac cacatgggct tatatggcgt ggggtacatg ttcctgtagc 480
cttgtccctg gcacctgcca aaatagcagc caacaccccc cacccccacc gccatccccc 540
tgccccaccc gtcccctgtc gcacattcct ccctccgcag ggctggctca ccaggcccca 600
gcccacatgc ctgcttaaag ccctctccat cctctgcctc acccagtccc cgctgagact 660
gagcagacgc ctccaggatc tgtcggcagg ccaccatgcc aaactggggc ggaggcgcaa 720
aatgtggagc ctgtgaaaag accgtctacc atgcagaaga aatccagtgc aatggaagga 780
gtttccacaa gacgtgtttc cactgcatgg cctgcaggaa ggctcttgac agcacgacag 840
tcgcggctca tgagtcggag atctactgca aggtgtgcta tgggcgcaga tatggcccca 900
aagggatcgg gtatggacaa ggcgctggct gtctcagcac agacacgggc gagcatctcg 960
gcctgcagtt ccaacagtcc ccaaagccgg cacgctcagt taccaccagc aacccttcca 1020
aattcactgc gaagtttgga gagtccgaga agtgccctcg atgtggcaag tcagtctatg 1080
ctgctgagaa ggttatggga ggtggcaagc cttggcacaa gacctgtttc cgctgtgcca 1140
tctgtgggaa gagtctggag tccacaaatg tcactgacaa agatggggaa ctttattgca 1200
aagtttgcta tgccaaaaat tttggcccca cgggtattgg gtttggaggc cttacacaac 1260
aagtggaaaa gaaagaatga tcaacctctg gattacaaaa tttgtgaaag attgactggt 1320
attcttaact atgttgctcc ttttacgcta tgtggatacg ctgctttaat gcctttgtat 1380
catgctattg cttcccgtat ggctttcatt ttctcctcct tgtataaatc ctggttgctg 1440
tctctttatg aggagttgtg gcccgttgtc aggcaacgtg gcgtggtgtg cactgtgttt 1500
gctgacgcaa cccccactgg ttggggcatt gccaccacct gtcagctcct ttccgggact 1560
ttcgctttcc ccctccctat tgccacggcg gaactcatcg ccgcctgcct tgcccgctgc 1620
tggacagggg ctcggctgtt gggcactgac aattccgtgg tgttgtcggg gaaatcatcg 1680
tcctttcctt ggctgctcgc ctgtgttgcc acctggattc tgcgcgggac gtccttctgc 1740
tacgtccctt cggccctcaa tccagcggac cttccttccc gcggcctgct gccggctctg 1800
cggcctcttc cgcgtcttcg ccttcgccct cagacgagtc ggatctccct ttgggccgcc 1860
tccccgcact gcccgggtgg catccctgtg acccctcccc agtgcctctc ctggccctgg 1920
aagttgccac tccagtgccc accagccttg tcctaataaa attaagttgc atcattttgt 1980
ctgactaggt gtccttctat aatattatgg ggtggagggg ggtggtatgg agcaaggggc 2040
ccaagttggg aagaaacctg tagggcctgc aggaacccct agtgatggag actccctctc 2100
tgcgcgctcg ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg 2160
cccgggcggc ctcagtgagc gagcgagcgc gcagagaggg agt 2203
<210> 14
<211> 2430
<212> DNA
<213> 人工序列
<220>
<223> 实验室中制备 - 载体基因组的全多核苷酸序列
<400> 14
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg 60
cgtcgggcga cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctaccct tcagattaaa aataactgag gtaagggcct 180
gggtagggga ggtggtgtga gacgctcctg tctctcctct atctgcccat cggccctttg 240
gggaggagga atgtgcccaa ggactaaaaa aaggccatgg agccagaggg gcgagggcaa 300
cagacctttc atgggcaaac cttggggccc tgctgtctag catgccccac tacgggtcta 360
ggctgcccat gtaaggaggc aaggcctggg gacacccgag atgcctggtt ataattaacc 420
cagacatgtg gctgcccccc cccccccaac acctgctgcc tctaaaaata accctgtccc 480
tggtggatcc cctgcatgcg aagatcttcg aacaaggctg tgggggactg agggcaggct 540
gtaacaggct tgggggccag ggcttatacg tgcctgggac tcccaaagta ttactgttcc 600
atgttcccgg cgaagggcca gctgtccccc gccagctaga ctcagcactt agtttaggaa 660
ccagtgagca agtcagccct tggggcagcc catacaaggc catggggctg ggcaagctgc 720
acgcctgggt ccggggtggg cacggtgccc gggcaacgag ctgaaagctc atctgctctc 780
aggggcccct ccctggggac agcccctcct ggctagtcac accctgtagg ctcctctata 840
taacccaggg gcacaggggc tgccctcatt ctaccaccac ctccacagca cagacagaca 900
ctcaggagcc agccaggcca ccatgcccaa ttggggtgga ggagctaaat gtggagcttg 960
tgaaaaaaca gtttatcatg ctgaagaaat tcaatgtaat ggaagatctt ttcataaaac 1020
atgttttcat tgtatggctt gtagaaaagc acttgattct acaactgttg cagcacatga 1080
aagtgaaatc tattgtaaag tatgttatgg aagaagatat ggaccaaaag gaattggata 1140
tggacaagga gcaggatgtc tttctacaga tactggagaa catttgggat tgcaatttca 1200
acaaagtcct aaaccagcta gatctgttac aacaagtaat ccatcaaaat ttactgctaa 1260
atttggagaa tccgaaaaat gtcctagatg tggaaaatca gtatatgctg ctgaaaaagt 1320
tatgggaggt ggaaaaccat ggcataagac atgttttaga tgtgcaattt gtggtaaatc 1380
tttggaatct acaaatgtta cagataaaga tggagaattg tattgtaaag tttgttatgc 1440
taaaaatttt ggacctacag gtataggatt tggaggtttg acacaacaag ttgaaaaaaa 1500
agaatgatca acctctggat tacaaaattt gtgaaagatt gactggtatt cttaactatg 1560
ttgctccttt tacgctatgt ggatacgctg ctttaatgcc tttgtatcat gctattgctt 1620
cccgtatggc tttcattttc tcctccttgt ataaatcctg gttgctgtct ctttatgagg 1680
agttgtggcc cgttgtcagg caacgtggcg tggtgtgcac tgtgtttgct gacgcaaccc 1740
ccactggttg gggcattgcc accacctgtc agctcctttc cgggactttc gctttccccc 1800
tccctattgc cacggcggaa ctcatcgccg cctgccttgc ccgctgctgg acaggggctc 1860
ggctgttggg cactgacaat tccgtggtgt tgtcggggaa atcatcgtcc tttccttggc 1920
tgctcgcctg tgttgccacc tggattctgc gcgggacgtc cttctgctac gtcccttcgg 1980
ccctcaatcc agcggacctt ccttcccgcg gcctgctgcc ggctctgcgg cctcttccgc 2040
gtcttcgcct tcgccctcag acgagtcgga tctccctttg ggccgcctcc ccgcactgcc 2100
cgggtggcat ccctgtgacc cctccccagt gcctctcctg gccctggaag ttgccactcc 2160
agtgcccacc agccttgtcc taataaaatt aagttgcatc attttgtctg actaggtgtc 2220
cttctataat attatggggt ggaggggggt ggtatggagc aaggggccca agttgggaag 2280
aaacctgtag ggcctgcagg aacccctagt gatggagact ccctctctgc gcgctcgctc 2340
gctcactgag gccgggcgac caaaggtcgc ccgacgcccg ggctttgccc gggcggcctc 2400
agtgagcgag cgagcgcgca gagagggagt 2430
<210> 15
<211> 2203
<212> DNA
<213> 人工序列
<220>
<223> 实验室中制备 - 载体基因组的全多核苷酸序列
<400> 15
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg 60
cgtcgggcga cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcctctcag tccattagga gccagtagcc tggaagatgt 180
ctttaccccc agcatcagtt caagtggagc agcacataac tcttgccctc tgccttccaa 240
gattctggtg ctgagactta tggagtgtct tggaggttgc cttctgcccc ccaaccctgc 300
tcccagctgg ccctcccagg cctgggttgc tggcctctgc tttatcagga ttctcaagag 360
ggacagctgg tttatgttgc atgactgttc cctgcatatc tgctctggtt ttaaatagct 420
tatctgagca gctggaggac cacatgggct tatatggcgt ggggtacatg ttcctgtagc 480
cttgtccctg gcacctgcca aaatagcagc caacaccccc cacccccacc gccatccccc 540
tgccccaccc gtcccctgtc gcacattcct ccctccgcag ggctggctca ccaggcccca 600
gcccacatgc ctgcttaaag ccctctccat cctctgcctc acccagtccc cgctgagact 660
gagcagacgc ctccaggatc tgtcggcagg ccaccatgcc caattggggt ggaggagcta 720
aatgtggagc ttgtgaaaaa acagtttatc atgctgaaga aattcaatgt aatggaagat 780
cttttcataa aacatgtttt cattgtatgg cttgtagaaa agcacttgat tctacaactg 840
ttgcagcaca tgaaagtgaa atctattgta aagtatgtta tggaagaaga tatggaccaa 900
aaggaattgg atatggacaa ggagcaggat gtctttctac agatactgga gaacatttgg 960
gattgcaatt tcaacaaagt cctaaaccag ctagatctgt tacaacaagt aatccatcaa 1020
aatttactgc taaatttgga gaatccgaaa aatgtcctag atgtggaaaa tcagtatatg 1080
ctgctgaaaa agttatggga ggtggaaaac catggcataa gacatgtttt agatgtgcaa 1140
tttgtggtaa atctttggaa tctacaaatg ttacagataa agatggagaa ttgtattgta 1200
aagtttgtta tgctaaaaat tttggaccta caggtatagg atttggaggt ttgacacaac 1260
aagttgaaaa aaaagaatga tcaacctctg gattacaaaa tttgtgaaag attgactggt 1320
attcttaact atgttgctcc ttttacgcta tgtggatacg ctgctttaat gcctttgtat 1380
catgctattg cttcccgtat ggctttcatt ttctcctcct tgtataaatc ctggttgctg 1440
tctctttatg aggagttgtg gcccgttgtc aggcaacgtg gcgtggtgtg cactgtgttt 1500
gctgacgcaa cccccactgg ttggggcatt gccaccacct gtcagctcct ttccgggact 1560
ttcgctttcc ccctccctat tgccacggcg gaactcatcg ccgcctgcct tgcccgctgc 1620
tggacagggg ctcggctgtt gggcactgac aattccgtgg tgttgtcggg gaaatcatcg 1680
tcctttcctt ggctgctcgc ctgtgttgcc acctggattc tgcgcgggac gtccttctgc 1740
tacgtccctt cggccctcaa tccagcggac cttccttccc gcggcctgct gccggctctg 1800
cggcctcttc cgcgtcttcg ccttcgccct cagacgagtc ggatctccct ttgggccgcc 1860
tccccgcact gcccgggtgg catccctgtg acccctcccc agtgcctctc ctggccctgg 1920
aagttgccac tccagtgccc accagccttg tcctaataaa attaagttgc atcattttgt 1980
ctgactaggt gtccttctat aatattatgg ggtggagggg ggtggtatgg agcaaggggc 2040
ccaagttggg aagaaacctg tagggcctgc aggaacccct agtgatggag actccctctc 2100
tgcgcgctcg ctcgctcact gaggccgggc gaccaaaggt cgcccgacgc ccgggctttg 2160
cccgggcggc ctcagtgagc gagcgagcgc gcagagaggg agt 2203
<210> 16
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> Kozak序列基序
<400> 16
gccgccrcca ugg 13
<210> 17
<211> 13
<212> DNA
<213> 人工序列
<220>
<223> Kozak序列基序
<400> 17
gccgccrcca ugc 13
<210> 18
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> Kozak序列基序
<400> 18
gacaccaugg 10
<210> 19
<211> 10
<212> DNA
<213> 人工序列
<220>
<223> Kozak序列基序
<400> 19
gacaccaugc 10
<210> 20
<211> 141
<212> DNA
<213> 腺相关病毒
<400> 20
cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60
gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120
actccatcac taggggttcc t 141
<210> 21
<211> 168
<212> DNA
<213> 腺相关病毒2
<400> 21
gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgacctttgg 60
tcgcccggcc tcagtgagcg agcgagcgcg cagagaggga gtggccaact ccatcactag 120
gggttccttg tagttaatga ttaacccgcc atgctactta tctacgta 168
<210> 22
<211> 170
<212> DNA
<213> 腺相关病毒
<400> 22
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta 170
<210> 23
<211> 145
<212> DNA
<213> 腺相关病毒
<400> 23
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgcccgggc aaagcccggg 60
cgtcgggcga cctttggtcg cccggcctca gtgagcgagc gagcgcgcag agagggagtg 120
gccaactcca tcactagggg ttcct 145
<210> 24
<211> 141
<212> DNA
<213> 腺相关病毒
<400> 24
aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60
ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120
gagcgcgcag ctgcctgcag g 141
<210> 25
<211> 168
<212> DNA
<213> 腺相关病毒2
<400> 25
tacgtagata agtagcatgg cgggttaatc attaactaca aggaacccct agtgatggag 60
ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 120
cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgc 168
<210> 26
<211> 133
<212> DNA
<213> 腺相关病毒2
<400> 26
aggaacccct agtgatggag actccctctc tgcgcgctcg ctcgctcact gaggccgggc 60
gaccaaaggt cgcccgacgc ccgggctttg cccgggcggc ctcagtgagc gagcgagcgc 120
gcagagaggg agt 133
<210> 27
<211> 124
<212> DNA
<213> 人工序列
<220>
<223> 实验室中制备 - 载体填充序列
<400> 27
gcggcaattc agtcgataac tataacggtc ctaaggtagc gatttaaata cgcgctctct 60
taaggtagcc ccgggacgcg tcaattgact acaaaccgag tatctgcaga gggccctgcg 120
tatg 124
<210> 28
<211> 84
<212> DNA
<213> 人工序列
<220>
<223> 实验室中制备 - 载体填充序列
<400> 28
cttctgaggc ggaaagaacc agatcctctc ttaaggtagc atcgagattt aaattaggga 60
taacagggta atggcgcggg ccgc 84
<210> 29
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> 实验室中制备 - 载体填充序列
<400> 29
gttacccagg ctggagtgca gtggcacatt tctgctcact gcaacctcct cctccctggg 60
ttc 63
<210> 30
<211> 573
<212> DNA
<213> 人工序列
<220>
<223> 实验室中制备 - 部分人β疱疹病毒5中的CAG启动子
<400> 30
acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat 60
aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga 120
gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc caagtacgcc 180
ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt 240
atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtcga 300
ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac ccccaatttt 360
gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg ggggggcgcg 420
cgccaggcgg ggcggggcgg ggcgaggggc ggggcggggc gaggcggaga ggtgcggcgg 480
cagccaatca gagcggcgcg ctccgaaagt ttccttttat ggcgaggcgg cggcggcggc 540
ggccctataa aaagcgaagc gcgcggcggg cgg 573
<210> 31
<211> 771
<212> DNA
<213> 人工序列
<220>
<223> 实验室中制备 - MHCK7启动子
<400> 31
acccttcaga ttaaaaataa ctgaggtaag ggcctgggta ggggaggtgg tgtgagacgc 60
tcctgtctct cctctatctg cccatcggcc ctttggggag gaggaatgtg cccaaggact 120
aaaaaaaggc catggagcca gaggggcgag ggcaacagac ctttcatggg caaaccttgg 180
ggccctgctg tctagcatgc cccactacgg gtctaggctg cccatgtaag gaggcaaggc 240
ctggggacac ccgagatgcc tggttataat taacccagac atgtggctgc cccccccccc 300
ccaacacctg ctgcctctaa aaataaccct gtccctggtg gatcccctgc atgcgaagat 360
cttcgaacaa ggctgtgggg gactgagggc aggctgtaac aggcttgggg gccagggctt 420
atacgtgcct gggactccca aagtattact gttccatgtt cccggcgaag ggccagctgt 480
cccccgccag ctagactcag cacttagttt aggaaccagt gagcaagtca gcccttgggg 540
cagcccatac aaggccatgg ggctgggcaa gctgcacgcc tgggtccggg gtgggcacgg 600
tgcccgggca acgagctgaa agctcatctg ctctcagggg cccctccctg gggacagccc 660
ctcctggcta gtcacaccct gtaggctcct ctatataacc caggggcaca ggggctgccc 720
tcattctacc accacctcca cagcacagac agacactcag gagccagcca g 771
<210> 32
<211> 544
<212> DNA
<213> 智人
<400> 32
ctcagtccat taggagccag tagcctggaa gatgtcttta cccccagcat cagttcaagt 60
ggagcagcac ataactcttg ccctctgcct tccaagattc tggtgctgag acttatggag 120
tgtcttggag gttgccttct gccccccaac cctgctccca gctggccctc ccaggcctgg 180
gttgctggcc tctgctttat caggattctc aagagggaca gctggtttat gttgcatgac 240
tgttccctgc atatctgctc tggttttaaa tagcttatct gagcagctgg aggaccacat 300
gggcttatat ggcgtggggt acatgttcct gtagccttgt ccctggcacc tgccaaaata 360
gcagccaaca ccccccaccc ccaccgccat ccccctgccc cacccgtccc ctgtcgcaca 420
ttcctccctc cgcagggctg gctcaccagg ccccagccca catgcctgct taaagccctc 480
tccatcctct gcctcaccca gtccccgctg agactgagca gacgcctcca ggatctgtcg 540
gcag 544
<210> 33
<211> 502
<212> DNA
<213> 智人
<400> 33
ctcagtccat taggagccag tagcctggaa gatgtcttta cccccagcat cagttcaagt 60
ggagcagcac ataactcttg ccctctgcct tccaagattc tggtgctgag acttatggag 120
tgtcttggag gttgccttct gccccccaac cctgctccca gctggccctc ccaggcctgg 180
gttgctggcc tctgctttat caggattctc aagagggaca gctggtttat gttgcatgac 240
tgttccctgc atatctgctc tggttttaaa tagcttatct gagcagctgg aggaccacat 300
gggcttatat ggcgtggggt acatgttcct gtagccttgt ccctggcacc tgccaaaata 360
gcagccaaca ccccccaccc ccaccgccat ccccctgccc cacccgtccc ctgtcgcaca 420
ttcctccctc cgcagggctg gctcaccagg ccccagccca catgcctgct taaagccctc 480
tccatcctct gcctcaccca gt 502
<210> 34
<211> 5464
<212> DNA
<213> 小家鼠
<400> 34
ggtaccggat cctgcaaggt cacacaaggg tctccaccca ccaggtgccc tagtctcaat 60
ttcagtttcc atgccttgtt ctcacaatgc tggcctcccc agagctaatt tggactttgt 120
ttttatttca aaagggcctg aatgaggagt agatcttgtg ctacccagct ctaagggtgc 180
ccgtgaagcc ctcagacctg gagcctttgc aacagccctt taggtggaag cagaataaag 240
caattttcct taaagccaaa atcctgcctc tagactcttc ttctctgacc tcggtccctg 300
ggctctaggg tggggaggtg gggcttggaa gaagaaggtg gggaagtggc aaaagccgat 360
ccctagggcc ctgtgaagtt cggagccttc cctgtacagc actggctcat agatcctcct 420
ccagccaaac atagcaagaa gtgatacctc ctttgtgact tccccaggcc cagtacctgt 480
caggttgaaa caggatttag agaagcctct gaactcacct gaactctgaa gctcatccac 540
caagcaagca cctaggtgcc actgctagtt agtatcctac gctgataata tgcagagctg 600
ggccacagaa gtcctggggt gtaggaactg accagtgact tttcagtcgg caaaggtatg 660
accccctcag cagatgtagt aatgtcccct tagatcccat cccaggcagg tctctaagag 720
gacatgggat gagagatgta gtcatgtggc attccaaaca cagctatcca cagtgtccct 780
tgccccttcc acttagccag gaggacagta accttagcct atctttcttc ctccccatcc 840
tcccaggaca caccccctgg tctgcagtat tcatttcttc cttcacgtcc cctctgtgac 900
ttccatttgc aaggcttttg acctctgcag ctgctggaag atagagtttg gccctaggtg 960
tggcaagcca tctcaagaga aagcagacaa cagggggacc agattttgga aggatcagga 1020
actaaatcac tggcgggcct gggggtagaa aaaagagtga gtgagtccgc tccagctaag 1080
ccaagctagt ccccgagata ctctgccaca gctgggctgc tcggggtagc tttaggaatg 1140
tgggtctgaa agacaatggg attggaagac atctctttga gtctcccctc aaccccacct 1200
acagacacac tcgtgtgtgg ccagactcct gttcaacagc cctctgtgtt ctgaccactg 1260
agctaggcaa ccagagcatg ggccctgtgc tgaggatgaa gagttggtta ccaatagcaa 1320
aaacagcagg ggagggagaa cagagaacga aataaggaag gaagaaggaa aggccagtca 1380
atcagatgca gtcagaagag atgggaagcc aacacacagc ttgagcagag gaaacagaaa 1440
agggagagat tctgggcata aggaggccac agaaagaaga gcccaggccc cccaagtctc 1500
ctctttatac cctcatcccg tctcccaatt aagcccactc ttcttcctag atcagacctg 1560
agctgcagcg aagagacccg tagggaggat cacactggat gaaggagatg tgtggagaag 1620
tccagggaac ctaagagcca gagcctaaaa gagcaagaga taaaggtgct tcaaaggtgg 1680
ccaggctgtg cacacagagg gtcgaggact ggtggtagag cctcaagata aggatgatgc 1740
tcagaatggg cggggggggg gattctgggg gggggagaga gaaggtgaga aggagcctgg 1800
aacagagaat ctggaagcgc tggaaacgat accataaagg gaagaaccca ggctaccttt 1860
agatgtaaat catgaaagac agggagaagg gaagctggag agagtagaag gaccccgggg 1920
caagacattg aagcaaggac aagccaggtt gagcgctccg tgaaatcagc ctgctgaagg 1980
cagagccctg gtatgagcac cagaacagca gaggctaggg ttaatgtcga gacagggaac 2040
agaaggtaga cacaggaaca gacagagacg ggggagccag gtaacaaagg aatggtcctt 2100
ctcacctgtg gccagagcgt ccatctgtgt ccacatactc tagaatgttc atcagactgc 2160
agggctggct tgggaggcag ctggaaagag tatgtgagag ccaggggaga caagggggcc 2220
taggaaagga agaagagggc aaaccaggcc acacaagagg gcagagccca gaactgagtt 2280
aactccttcc ttgttgcatc ttccatagga ggcagtggga actctgtgac caccatcccc 2340
catgagcccc cactacccat accaagtttg gcctgagtgg cattctaggt tccctgagga 2400
cagagcctgg cctttgtctc ttggacctga cccaagctga cccaatgttc tcagtacctt 2460
atcatgccct caagagcttg agaaccaggc agtgacatat taggccatgg gctaaccctg 2520
gagcttgcac acaggagcct caagtgacct ccagggacac agctgcagac aggtggcctt 2580
tatccccaaa gagcaaccat ttggcatagg tggctgcaaa tgggaatgca aggttgaatc 2640
aggtcccttc aagaatactg catgcaagac ctaagacccc tggagagagg ggtatgctcc 2700
tgcccccacc caccataagg ggagtgaact atcctagggg gctggcgacc ttggggagac 2760
accacattac tgagagtgct gagcccagaa aaactgaccg ccctgtgtcc tgcccacctc 2820
cacactctag agctatattg agaggtgaca gtagataggg tgggagctgg tagcagggag 2880
agtgttcctg ggtgtgaggg tgtaggggaa agccagagca ggggagtctg gctttgtctc 2940
ctgaacacaa tgtctactta gttataacag gcatgacctg ctaaagaccc aacatctacg 3000
acctctgaaa agacagcagc cctggaggac aggggttgtc tctgagcctt gggtgcttga 3060
tggtgccaca aaggagggca tgagtgtgag tataaggccc caggagcgtt agagaagggc 3120
acttgggaag gggtcagtct gcagagcccc tatccatgga atctggagcc tggggccaac 3180
tggtgtaaat ctctgggcct gccaggcatt caaagcagca cctgcatcct ctggcagcct 3240
ggggaggcgg aagggagcaa ccccccactt ataccctttc tccctcagcc ccaggattaa 3300
cacctctggc cttccccctt cccacctccc atcaggagtg gagggttgca gagggagggt 3360
aaaaacctac atgtccaaac atcatggtgc acgatatatg gatcagtatg tgtagaggca 3420
agaaaggaaa tctgcaggct taactgggtt aatgtgtaaa gtctgtgtgc atgtgtgtgt 3480
gtctgactga aaacgggcat ggctgtgcag ctgttcagtt ctgtgcgtga ggttaccaga 3540
ctgcaggttt gtgtgtaaat tgcccaaggc aaagtgggtg aatcccttcc atggtttaaa 3600
gagattggat gatggcctgc atctcaagga ccatggaaaa tagaatggac actctatatg 3660
tgtctctaag ctaaggtagc aaggtctttg gaggacacct gtctagagat gtgggcaaca 3720
gagactacag acagtatctg tacagagtaa ggagagagag gagggggtgt agaattctct 3780
tactatcaaa gggaaactga gtcgtgcacc tgcaaagtgg atgctctccc tagacatcat 3840
gactttgtct ctggggagcc agcactgtgg aacttcaggt ctgagagagt aggaggctcc 3900
cctcagcctg aagctatgca gatagccagg gttgaaaggg ggaagggaga gcctgggatg 3960
ggagcttgtg tgttggaggc aggggacaga tattaagcct ggaagagaag gtgaccctta 4020
cccagttgtt caactcaccc ttcagattaa aaataactga ggtaagggcc tgggtagggg 4080
aggtggtgtg agacgctcct gtctctcctc tatctgccca tcggcccttt ggggaggagg 4140
aatgtgccca aggactaaaa aaaggccatg gagccagagg ggcgagggca acagaccttt 4200
catgggcaaa ccttggggcc ctgctgtcct cctgtcacct ccagagccaa gggatcaaag 4260
gaggaggagc caggacagga gggaagtggg agggagggtc ccagcagagg actccaaatt 4320
taggcagcag gcatatggga tgggatataa aggggctgga gcactgagag ctgtcagaga 4380
tttctccaac ccaggtaaga gggagtttcg ggtgggggct cttcacccac accagacctc 4440
tccccaccta gaaggaaact gcctttcctg gaagtggggt tcaggccggt cagagatctg 4500
acagggtggc cttccaccag cctgggaagt tctcagtggc aggaggtttc cacaagaaac 4560
actggatgcc ccttccctta cgctgtcttc tccatcttcc tcctggggat gctcctcccc 4620
gtcttggttt atcttggctc ttcgtcttca gcaagatttg ccctgtgctg tccactccat 4680
ctttctctac tgtctccgtg ccttgccttg ccttcttgcg tgtccttcct ttccacccat 4740
ttctcacttc accttttctc cccttctcat ttgtattcat ccttccttcc ttccttcctt 4800
ccttccttcc ttccttcctt ccttcctttc tcccttcctt ccttccttcc ttccttcctt 4860
ccttccttcc ttcctgtgtc agagtgctga gaatcacacc tggggttccc acccttatgt 4920
aaacaatctt ccagtgagcc acagcttcag tgctgctggg tgctctctta ccttcctcac 4980
cccctggctt gtcctgttcc atcctggtca ggatctctag attggtctcc cagcctctgc 5040
tactcctctt cctgcctgtt cctctctctg tccagctgcg ccactgtggt gcctcgttcc 5100
agctgtggtc cacattcttc aggattctct gaaaagttaa ccaggtgaga atgtttcccc 5160
tgtagacagc agatcacgat tctcccggaa gtcaggcttc cagccctctc tttctctgcc 5220
cagctgcccg gcactcttag caaacctcag gcacccttac cccacataga cctctgacag 5280
agaagcaggc actttacatg gagtcctggt gggagagcca taggctacgg tgtaaaagag 5340
gcagggaagt ggtggtgtag gaaagtcagg acttcacata gaagcctagc ccacaccaga 5400
aatgacagac agatccctcc tatctccccc ataagagttt gagtcgaccc gcggccccga 5460
attg 5464
<210> 35
<211> 413
<212> DNA
<213> 原鸡
<400> 35
gggataaaag cagtctgggc tttcacatga cagcatctgg ggctgcggca gagggtcggg 60
tccgaagcgc tgccttatca gcgtccccag ccctgggagg tgacagctgg ctggcttgtg 120
tcagcccctc gggcactcac gtatctccgt ccgacgggtt taaaatagca aaactctgag 180
gccacacaat agcttgggct tatatgggct cctgtggggg aagggggagc acggaggggg 240
ccggggccgc tgctgccaaa atagcagctc acaagtgttg cattcctctc tgggcgccgg 300
gcacattcct gctggctctg cccgccccgg ggtgggcgcc ggggggacct taaagcctct 360
gccccccaag gagcccttcc cagacagccg ccggcaccca ccgctccgtg gga 413
<210> 36
<211> 1090
<212> DNA
<213> 智人
<400> 36
ctctcagccc tggaagtcct tgctcacagc cgaggcgccg agagcgcttg ctctgcccag 60
atctgcgcga gtctggcgcc cgcgctctga acggcgtcgc tgcccagccc ccttccccgg 120
gaggtgggag cggccaccca gggccccgtg gctgcccttg taaggaggcg aggcccgagg 180
acacccgaga cgcccggtta taattaacca ggacacgtgg cgaacccccc tccaacacct 240
gcccccgaac ccccccatac ccagcgcctc gggtctcggc ctttgcggca gaggagacag 300
caaagcgccc tctaaaaata actcctttcc cggcgaccga gaccctccct gtcccccgca 360
cagcggaaat ctcccagtgg caccgagggg gcgagggtta agtggggggg agggtgacca 420
ccgcctccca cccttgccct gagtttgaat ctctccaact cagccagcct cagtttcccc 480
tccactcagt ccctaggagg aaggggcgcc caagcgcggg tttctggggt tagactgccc 540
tccattgcaa ttggtccttc tcccggcctc tgcttcctcc agctcacagg gtatctgctc 600
ctcctggagc cacaccttgg ttccccgagg tgccgctggg actcgggtag gggtgagggc 660
ccagggggca cagggggagc cgagggccac aggaagggct ggtggctgaa ggagactcag 720
gggccagggg acggtggctt ctacgtgctt gggacgttcc cagccaccgt cccatgttcc 780
cggcgggggg ccagctgtcc ccaccgccag cccaactcag cacttggtca gggtatcagc 840
ttggtggggg ggcgtgagcc cagcccctgg ggcggctcag cccatacaag gccatggggc 900
tgggcgcaaa gcatgcctgg gttcagggtg ggtatggtgc gggagcaggg aggtgagagg 960
ctcagctgcc ctccagaact cctccctggg gacaacccct cccagccaat agcacagcct 1020
aggtccccct atataaggcc acggctgctg gcccttcctt tgggtcagtg tcacctccag 1080
gatacagaca 1090
<210> 37
<211> 253
<212> DNA
<213> 智人
<400> 37
gcccagcacc ccaaggcggc caacgccaaa actctccctc ctcctcttcc tcaatctcgc 60
tctcgctctt tttttttttc gcaaaaggag gggagagggg gtaaaaaaat gctgcactgt 120
gcggcgaagc cggtgagtga gcggcgcggg gccaatcagc gtgcgccgtt ccgaaagttg 180
ccttttatgg ctcgagcggc cgcggcggcg ccctataaaa cccagcggcg cgacgcgcca 240
ccaccgccga gtc 253
<210> 38
<211> 281
<212> DNA
<213> 原鸡
<400> 38
ggtcgaggtg agccccacgt tctgcttcac tctccccatc tcccccccct ccccaccccc 60
aattttgtat ttatttattt tttaattatt ttgtgcagcg atgggggcgg gggggggggg 120
ggcgcgcgcc aggcggggcg gggcggggcg aggggcgggg cggggcgagg cggagaggtg 180
cggcggcagc caatcagagc ggcgcgctcc gaaagtttcc ttttatggcg aggcggcggc 240
ggcggcggcc ctataaaaag cgaagcgcgc ggcgggcggg a 281
<210> 39
<211> 220
<212> DNA
<213> 人β疱疹病毒5
<400> 39
tggtgatgcg gttttggcag tacaccaatg ggcgtggata gcggtttgac tcacggggat 60
ttccaagtct ccaccccatt gacgtcaatg ggagtttgtt ttggcaccaa aatcaacggg 120
actttccaaa atgtcgtaat aaccccgccc cgttgacgca aatgggcggt aggcgtgtac 180
ggtgggaggt ctatataagc agagctcgtt tagtgaaccg 220
<210> 40
<211> 583
<212> DNA
<213> 人β疱疹病毒5
<400> 40
tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata tggagttccg 60
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 120
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 180
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 240
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 300
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 360
catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 420
atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 480
ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 540
acggtgggag gtctatataa gcagagctgg tttagtgaac cgt 583
<210> 41
<211> 508
<212> DNA
<213> 人β疱疹病毒5
<400> 41
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 60
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 120
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 180
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 240
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 300
catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 360
atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 420
ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 480
acggtgggag gtctatataa gcagagct 508
<210> 42
<211> 573
<212> DNA
<213> 人工序列
<220>
<223> 实验室中制备 - 部分人β疱疹病毒5中的CAG启动子
<400> 42
acttacggta aatggcccgc ctggctgacc gcccaacgac ccccgcccat tgacgtcaat 60
aatgacgtat gttcccatag taacgccaat agggactttc cattgacgtc aatgggtgga 120
gtatttacgg taaactgccc acttggcagt acatcaagtg tatcatatgc caagtacgcc 180
ccctattgac gtcaatgacg gtaaatggcc cgcctggcat tatgcccagt acatgacctt 240
atgggacttt cctacttggc agtacatcta cgtattagtc atcgctatta ccatggtcga 300
ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac ccccaatttt 360
gtatttattt attttttaat tattttgtgc agcgatgggg gcgggggggg ggggggcgcg 420
cgccaggcgg ggcggggcgg ggcgaggggc ggggcggggc gaggcggaga ggtgcggcgg 480
cagccaatca gagcggcgcg ctccgaaagt ttccttttat ggcgaggcgg cggcggcggc 540
ggccctataa aaagcgaagc gcgcggcggg cgg 573
<210> 43
<211> 580
<212> DNA
<213> 人工序列
<220>
<223> 实验室中制备 - 部分人β疱疹病毒5中的CAG启动子
<400> 43
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 60
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 120
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 180
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 240
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 300
catgtcgagg tgagccccac gttctgcttc actctcccca tctccccccc ctccccaccc 360
ccaattttgt atttatttat tttttaatta ttttgtgcag cgatgggggc gggggggggg 420
ggggcgcgcg ccaggcgggg cggggcgggg cgaggggcgg ggcggggcga ggcggagagg 480
tgcggcggca gccaatcaga gcggcgcgct ccgaaagttt ccttttatgg cgaggcggcg 540
gcggcggcgg ccctataaaa agcgaagcgc gcggcgggcg 580
<210> 44
<211> 455
<212> DNA
<213> 智人
<400> 44
caacctttgg agctaagcca gcaatggtag agggaagatt ctgcacgtcc cttccaggcg 60
gcctccccgt caccaccccc cccaacccgc cccgaccgga gctgagagta attcatacaa 120
aaggactcgc ccctgccttg gggaatccca gggaccgtcg ttaaactccc actaacgtag 180
aacccagaga tcgctgcgtt cccgccccct cacccgcccg ctctcgtcat cactgaggtg 240
gagaatagca tgcgtgaggc tccggtgccc gtcagtgggc agagcgcaca tcgcccacag 300
tccccgagaa gttgggggga ggggtcggca attgaacggg tgcctagaga aggtggcgcg 360
gggtaaactg ggaaagtgat gtcgtgtact ggctccgcct ttttcccgag ggtgggggag 420
aaccgtatat aagtgcagta gtcgccgtga acgtt 455
<210> 45
<211> 401
<212> DNA
<213> 智人
<400> 45
agtgcaagtg ggttttagga ccaggatgag gcggggtggg ggtgcctacc tgacgaccga 60
ccccgaccca ctggacaagc acccaacccc cattccccaa attgcgcatc ccctatcaga 120
gagggggagg ggaaacagga tgcggcgagg cgcgtgcgca ctgccagctt cagcaccgcg 180
gacagtgcct tcgcccccgc ctggcggcgc gcgccaccgc cgcctcagca ctgaaggcgc 240
gctgacgtca ctcgccggtc ccccgcaaac tccccttccc ggccaccttg gtcgcgtccg 300
cgccgccgcc ggcccagccg gaccgcacca cgcgaggcgc gagatagggg ggcacgggcg 360
cgaccatctg cgctgcggcg ccggcgactc agcgctgcct c 401
<210> 46
<211> 448
<212> DNA
<213> 智人
<400> 46
agtgcaagtg ggttttagga ccaggatgag gcggggtggg ggtgcctacc tgacgaccga 60
ccccgaccca ctggacaagc acccaacccc cattccccaa attgcgcatc ccctatcaga 120
gagggggagg ggaaacagga tgcggcgagg cgcgtgcgca ctgccagctt cagcaccgcg 180
gacagtgcct tcgcccccgc ctggcggcgc gcgccaccgc cgcctcagca ctgaaggcgc 240
gctgacgtca ctcgccggtc ccccgcaaac tccccttccc ggccaccttg gtcgcgtccg 300
cgccgccgcc ggcccagccg gaccgcacca cgcgaggcgc gagatagggg ggcacgggcg 360
cgaccatctg cgctgcggcg ccggcgactc agcgctgcct cagtctgcgg tgggcagcgg 420
aggagtcgtg tcgtgcctga gagcgcag 448
<210> 47
<211> 422
<212> DNA
<213> 智人
<400> 47
ctgcagaggg ccctgcgtat gagtgcaagt gggttttagg accaggatga ggcggggtgg 60
gggtgcctac ctgacgaccg accccgaccc actggacaag cacccaaccc ccattcccca 120
aattgcgcat cccctatcag agagggggag gggaaacagg atgcggcgag gcgcgtgcgc 180
actgccagct tcagcaccgc ggacagtgcc ttcgcccccg cctggcggcg cgcgccaccg 240
ccgcctcagc actgaaggcg cgctgacgtc actcgccggt cccccgcaaa ctccccttcc 300
cggccacctt ggtcgcgtcc gcgccgccgc cggcccagcc ggaccgcacc acgcgaggcg 360
cgagataggg gggcacgggc gcgaccatct gcgctgcggc gccggcgact cagcgctgcc 420
tc 422
<210> 48
<211> 281
<212> DNA
<213> 智人
<400> 48
acttgtggac aaagtttgct ctattccacc tcctccaggc cctccttggg tccatcaccc 60
caggggtgct gggtccatcc cacccccagg cccacacagg cttgcagtat tgtgtgcggt 120
atggtcaggg cgtccgagag caggtttcgc agtggaaggc aggcaggtgt tggggaggca 180
gttaccgggg caacgggaac agggcgtttt ggaggtggtt gccatgggga cctggatgct 240
gacgaaggct cgcgaggctg tgagcagcca cagtgccctg c 281
<210> 49
<211> 851
<212> DNA
<213> 人工序列
<220>
<223> 实验室中制备 - eSYN启动子多核苷酸
<400> 49
gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60
catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120
acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180
ctttccattg acgtcaatgg gtggactatt tacggtaaac tgcccacttg gcagtacatc 240
aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300
ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 360
tagtcatcgc tattaccatg gctgcagagg gccctgcgta tgagtgcaag tgggttttag 420
gaccaggatg aggcggggtg ggggtgccta cctgacgacc gaccccgacc cactggacaa 480
gcacccaacc cccattcccc aaattgcgca tcccctatca gagaggggga ggggaaacag 540
gatgcggcga ggcgcgtcgc gactgccagc ttcagcaccg cggacagtgc cttcgccccc 600
gcctggcggc gcgcgccacc gccgcctcag cactgaaggc gcgctgacgt cactcgccgg 660
tcccccgcaa actccccttc ccggccacct tggtcgcgtc cgcgccgccg ccggcccagc 720
cggaccgcac cacgcgaggc gcgagatagg ggggcacggg cgcgaccatc tgcgctgcgg 780
cgccggcgac tcagcgctgc ctcagtctgc ggtgggcagc ggaggagtcg tgtcgtgcct 840
gagagcgcag g 851
<210> 50
<211> 304
<212> DNA
<213> 人β疱疹病毒5
<400> 50
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 60
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 120
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 180
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 240
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 300
catg 304
<210> 51
<211> 953
<212> DNA
<213> 智人
<400> 51
cgcgtccgcc cgcgagcaca gagcctcgcc tttgccgatc cgccgcccgt ccacacccgc 60
cgccaggtaa gcccggccag ccgaccgggg catgcggccg cggcccttcg cccgtgcaga 120
gccgccgtct gggccgcagc ggggggcgca tggggcggaa ccggaccgcc gtggggggcg 180
cgggagaagc ccctgggcct ccggagatgg gggacacccc acgccagttc gcaggcgcga 240
ggccgcgctc gggcgggcgc gctccggggg tgccgctctc ggggcggggg caaccggcgg 300
ggtctttgtc tgagccgggc tcttgccaat ggggatcgca cggtgggcgc ggcgtagccc 360
ccgtcaggcc cggtgggggc tggggcgcca tgcgcgtgcg cgctggtcct ttgggcgcta 420
actgcgtgcg cgctgggaat tggcgctaat tgcgcgtgcg cgctgggact caatggcgct 480
aatcgcgcgt gcgttctggg gcccgggcgc ttgcgccact tcctgcccga gccgctggcg 540
cccgagggtg tggccgctgc gtgcgcgcgc gcgacccggt cgctgtttga accgggcgga 600
ggcggggctg gcgcccggtt gggagggggt tggggcctgg cttcctgccg cgcgccgcgg 660
ggacgcctcc gaccagtgtt tgccttttat ggtaataacg cggccggccc ggcttccttt 720
gtccccaatc tgggcgcgcg ccggcgcccc ctggcggcct aaggactcgg cgcgccggaa 780
gtggccaggg cggcagcggc tgctcttggc ggccccgagg tgactatagc cttcttttgt 840
gtcttgatag ttcgccagcc tctgctaacc atgttcatgc cttcttcttt ttcctacagc 900
tcctgggcaa cgtgctggtt attgtgctgt ctcatcattt tggcaaagaa ttc 953
<210> 52
<211> 1068
<212> DNA
<213> 人工序列
<220>
<223> 实验室中制备 - 鸡β-肌动蛋白外显子/内含子加兔球蛋白内含子
<400> 52
gtcgctgcgc gctgccttcg ccccgtgccc cgctccgccg ccgcctcgcg ccgcccgccc 60
cggctctgac tgaccgcgtt actcccacag gtgagcgggc gggacggccc ttctcctccg 120
ggctgtaatt agcgcttggt ttaatgacgg cttgtttctt ttctgtggct gcgtgaaagc 180
cttgaggggc tccgggaggg ccctttgtgc ggggggagcg gctcgggggg tgcgtgcgtg 240
tgtgtgtgcg tggggagcgc cgcgtgcggc tccgcgctgc ccggcggctg tgagcgctgc 300
gggcgcggcg cggggctttg tgcgctccgc agtgtgcgcg aggggagcgc ggccgggggc 360
ggtgccccgc ggtgcggggg gggctgcgag gggaacaaag gctgcgtgcg gggtgtgtgc 420
gtgggggggt gagcaggggg tgtgggcgcg tcggtcgggc tgcaaccccc cctgcacccc 480
cctccccgag ttgctgagca cggcccggct tcgggtgcgg ggctccgtac ggggcgtggc 540
gcggggctcg ccgtgccggg cggggggtgg cggcaggtgg gggtgccggg cggggcgggg 600
ccgcctcggg ccggggaggg ctcgggggag gggcgcggcg gcccccggag cgccggcggc 660
tgtcgaggcg cggcgagccg cagccattgc cttttatggt aatcgtgcga gagggcgcag 720
ggacttcctt tgtcccaaat ctgtgcggag ccgaaatctg ggaggcgccg ccgcaccccc 780
tctagcgggc gcggggcgaa gcggtgcggc gccggcagga aggaaatggg cggggagggc 840
cttcgtgcgt cgccgcgccg ccgtcccctt ctccctctcc agcctcgggg ctgtccgcgg 900
ggggacggct gccttcgggg gggacggggc agggcggggt tcggcttctg gcgtgtgacc 960
ggcggctcta gagcctctgc taaccatgtt catgccttct tctttttcct acagctcctg 1020
ggcaacgtgc tggttattgt gctgtctcat cattttggca aagaattc 1068
<210> 53
<211> 149
<212> DNA
<213> 人工序列
<220>
<223> 实验室中制备 - 嵌合体内含子序列
<400> 53
ggtaagttta gtctttttgt cttttatttc aggtcccgga tccggtggtg gtgcaaatca 60
aagaactgct cctcagtgga tgttgccttt acttctaggc ctgtacggaa gtgttacttc 120
tgctctaaaa gctgcggaat tgtacccgc 149
<210> 54
<211> 126
<212> DNA
<213> 智人
<400> 54
agtctgcggt gggcagcgga ggagtcgtgt cgtgcctgag agcgcagctg tgctcctggg 60
caccgcgcag tccgcccccg cggctcctgg ccagaccacc cctaggaccc cctgccccaa 120
gtcgca 126
<210> 55
<211> 121
<212> DNA
<213> 人β疱疹病毒5
<400> 55
tcagatcgcc tggagaggcc atccacgctg ttttgacctc catagtggac accgggaccg 60
atccagcctc cgcggccggg aacggtgcat tggaacgcgg attccccgtg ccaagagtga 120
c 121
<210> 56
<211> 512
<212> DNA
<213> 人工序列
<220>
<223> 实验室中制备 - 腺病毒衍生增强子元件
<400> 56
ctcactctct tccgcatcgc tgtctgcgag ggccagctgt tgggctcgcg gttgaggaca 60
aactcttcgc ggtctttcca gtactcttgg atcggaaacc cgtcggcctc cgaacggtac 120
tccgccaccg agggacctga gcgagtccgc atcgaccgga tcggaaaacc tctcgagaaa 180
ggcgtctaac cagtcacagt cgcaaggtag gctgagcacc gtggcgggcg gcagcgggtg 240
gcggtcgggg ttgtttctgg cggaggtgct gctgatgatg taattaaagt aggcggtctt 300
gagacggcgg atggtcgagg tgaggtgtgg caggcttgag atccagctgt tggggtgagt 360
actccctctc aaaagcgggc attacttctg cgctaagatt gtcagtttcc aaaaacgagg 420
aggatttgat attcacctgg cccgatctgg ccatacactt gagtgacaat gacatccact 480
ttgcctttct ctccacaggt gtccactccc ag 512
<210> 57
<211> 956
<212> DNA
<213> 智人
<400> 57
ctttttcgca acgggtttgc cgccagaaca caggtaagtg ccgtgtgtgg ttcccgcggg 60
cctggcctct ttacgggtta tggcccttgc gtgccttgaa ttacttccac ctggctccag 120
tacgtgattc ttgatcccga gctggagcca ggggcgggcc ttgcgcttta ggagcccctt 180
cgcctcgtgc ttgagttgag gcctggcctg ggcgctgggg ccgccgcgtg cgaatctggt 240
ggcaccttcg cgcctgtctc gctgctttcg ataagtctct agccatttaa aatttttgat 300
gacgtgctgc gacgcttttt ttctggcaag atagtcttgt aaatgcgggc caggatctgc 360
acactggtat ttcggttttt gggcccgcgg ccggcgacgg ggcccgtgcg tcccagcgca 420
catgttcggc gaggcggggc ctgcgagcgc ggccaccgag aatcggacgg gggtagtctc 480
aagctggccg gcctgctctg gtgcctggcc tcgcgccgcc gtgtatcgcc ccgccctggg 540
cggcaaggct ggcccggtcg gcaccagttg cgtgagcgga aagatggccg cttcccggcc 600
ctgctccagg gggctcaaaa tggaggacgc ggcgctcggg agagcgggcg ggtgagtcac 660
ccacacaaag gaaaagggcc tttccgtcct cagccgtcgc ttcatgtgac tccacggagt 720
accgggcgcc gtccaggcac ctcgattagt tctggagctt ttggagtacg tcgtctttag 780
gttgggggga ggggttttat gcgatggagt ttccccacac tgagtgggtg gagactgaag 840
ttaggccagc ttggcacttg atgtaattct ccttggaatt tggccttttt gagtttggat 900
cttggttcat tctcaagcct cagacagtgg ttcaaagttt ttttcttcca tttcag 956
<210> 58
<211> 939
<212> DNA
<213> 智人
<400> 58
gtaagtgccg tgtgtggttc ccgcgggcct ggcctcttta cgggttatgg cccttgcgtg 60
ccttgaatta cttccacctg gctgcagtac gtgattcttg atcccgagct tcgggttgga 120
agtgggtggg agagttcgag gccttgcgct taaggagccc cttcgcctcg tgcttgagtt 180
gaggcctggc ctgggcgctg gggccgccgc gtgcgaatct ggtggcacct tcgcgcctgt 240
ctcgctgctt tcgataagtc tctagccatt taaaattttt gatgacctgc tgcgacgctt 300
tttttctggc aagatagtct tgtaaatgcg ggccaagatc tgcacactgg tatttcggtt 360
tttggggccg cgggcggcga cggggcccgt gcgtcccagc gcacatgttc ggcgaggcgg 420
ggcctgcgag cgcggccacc gagaatcgga cgggggtagt ctcaagctgg ccggcctgct 480
ctggtgcctg gcctcgcgcc gccgtgtatc gccccgccct gggcggcaag gctggcccgg 540
tcggcaccag ttgcgtgagc ggaaagatgg ccgcttcccg gccctgctgc agggagctca 600
aaatggagga cgcggcgctc gggagagcgg gcgggtgagt cacccacaca aaggaaaagg 660
gcctttccgt cctcagccgt cgcttcatgt gactccacgg agtaccgggc gccgtccagg 720
cacctcgatt agttctcgag cttttggagt acgtcgtctt taggttgggg ggaggggttt 780
tatgcgatgg agtttcccca cactgagtgg gtggagactg aagttaggcc agcttggcac 840
ttgatgtaat tctccttgga atttgccctt tttgagtttg gatcttggtt cattctcaag 900
cctcagacag tggttcaaag tttttttctt ccatttcag 939
<210> 59
<211> 83
<212> DNA
<213> 智人
<400> 59
tcagaagccc cgggctcgtc agtcaaaccg gttctctgtt tgcactcggc agcacgggca 60
ggcaagtggt ccctaggttc ggg 83
<210> 60
<211> 476
<212> DNA
<213> 智人
<400> 60
gtgagtctat gggacccttg atgttttctt tccccttctt ttctatggtt aagttcatgt 60
cataggaagg ggagaagtaa cagggtacac atattgacca aatcagggta attttgcatt 120
tgtaatttta aaaaatgctt tcttctttta atatactttt ttgtttatct tatttctaat 180
actttcccta atctctttct ttcagggcaa taatgataca atgtatcatg cctctttgca 240
ccattctaaa gaataacagt gataatttct gggttaaggc aatagcaata tttctgcata 300
taaatatttc tgcatataaa ttgtaactga tgtaagaggt ttcatattgc taatagcagc 360
tacaatccag ctaccattct gcttttattt tatggttggg ataaggctgg attattctga 420
gtccaagcta ggcccttttg ctaatcatgt tcatacctct tatcttcctc ccacag 476
<210> 61
<211> 196
<212> DNA
<213> 类人猿病毒40
<400> 61
tctagaggat ccggtactcg aggaactgaa aaaccagaaa gttaactggt aagtttagtc 60
tttttgtctt ttatttcagg tcccggatcc ggtggtggtg caaatcaaag aactgctcct 120
cagtggatgt tgcctttact tctaggcctg tacggaagtg ttacttctgc tctaaaagct 180
gcggaattgt acccgc 196
<210> 62
<211> 589
<212> DNA
<213> 人工序列
<220>
<223> 实验室中制备 - 突变的土拨鼠肝炎调控元件
<400> 62
aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60
ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120
atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180
tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240
ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300
attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360
ttgggcactg acaattccgt ggtgttgtcg gggaaatcat cgtcctttcc ttggctgctc 420
gcctgtgttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480
aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540
cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgc 589
<210> 63
<211> 588
<212> DNA
<213> 人工序列
<220>
<223> 实验室中制备 - 突变的土拨鼠肝炎调控元件
<400> 63
tcaacctctg gattacaaaa tttgtgaaag attgactggt attcttaact atgttgctcc 60
ttttacgcta tgtggatacg ctgctttaat gcctttgtat catgctattg cttcccgtat 120
ggctttcatt ttctcctcct tgtataaatc ctggttgctg tctctttatg aggagttgtg 180
gcccgttgtc aggcaacgtg gcgtggtgtg cactgtgttt gctgacgcaa cccccactgg 240
ttggggcatt gccaccacct gtcagctcct ttccgggact ttcgctttcc ccctccctat 300
tgccacggcg gaactcatcg ccgcctgcct tgcccgctgc tggacagggg ctcggctgtt 360
gggcactgac aattccgtgg tgttgtcggg gaaatcatcg tcctttcctt ggctgctcgc 420
ctgtgttgcc acctggattc tgcgcgggac gtccttctgc tacgtccctt cggccctcaa 480
tccagcggac cttccttccc gcggcctgct gccggctctg cggcctcttc cgcgtcttcg 540
ccttcgccct cagacgagtc ggatctccct ttgggccgcc tccccgca 588
<210> 64
<211> 755
<212> DNA
<213> 人工序列
<220>
<223> 实验室中制备 - 突变的土拨鼠肝炎调控元件
<400> 64
ttcctgttaa tcaacctctg gattacaaaa tttgtgaaag attgactggt attcttaact 60
atgttgctcc ttttacgcta tgtggatacg ctgctttaat gcctttgtat catgctattg 120
cttcccgtat ggctttcatt ttctcctcct tgtataaatc ctggttgctg tctctttatg 180
aggagttgtg gcccgttgtc aggcaacgtg gcgtggtgtg cactgtgttt gctgacgcaa 240
cccccactgg ttggggcatt gccaccacct gtcagctcct ttccgggact ttcgctttcc 300
ccctccctat tgccacggcg gaactcatcg ccgcctgcct tgcccgctgc tggacagggg 360
ctcggctgtt gggcactgac aattccgtgg tgttgtcggg gaagctgacg tcctttccgc 420
ggctgctcgc ctgtgttgcc acctggattc tgcgcgggac gtccttctgc tacgtccctt 480
cggccctcaa tccagcggac cttccttccc gcggcctgct gccggctctg cggcctcttc 540
cgcctcttcg ccttcgccct cagacgagtc ggatctccct ttgggccgcc tccccgccca 600
tgtatctttt tcacctgtgc cttgtttttg cctgtgttcc gcgtcctact tttcaagcct 660
ccaagctgtg ccttgggcgg ctttggggca tggacataga tccctataaa gaatttggtt 720
catcttatca gttgttgaat tttcttcctt tggac 755
<210> 65
<211> 12
<212> DNA
<213> 人工序列
<220>
<223> CAAX基序
<400> 65
tgtgtgataa tg 12
<210> 66
<211> 810
<212> DNA
<213> 智人
<400> 66
ctgttctcat cacatcatat caaggttata taccatcaat attgccacag atgttactta 60
gccttttaat atttctctaa tttagtgtat atgcaatgat agttctctga tttctgagat 120
tgagtttctc atgtgtaatg attatttaga gtttctcttt catctgttca aatttttgtc 180
tagttttatt ttttactgat ttgtaagact tctttttata atctgcatat tacaattctc 240
tttactgggg tgttgcaaat attttctgtc attctatggc ctgacttttc ttaatggttt 300
tttaatttta aaaataagtc ttaatattca tgcaatctaa ttaacaatct tttctttgtg 360
gttaggactt tgagtcataa gaaatttttc tctacactga agtcatgatg gcatgcttct 420
atattatttt ctaaaagatt taaagttttg ccttctccat ttagacttat aattcactgg 480
aatttttttg tgtgtatggt atgacatatg ggttcccttt tattttttac atataaatat 540
atttccctgt ttttctaaaa aagaaaaaga tcatcatttt cccattgtaa aatgccatat 600
ttttttcata ggtcacttac atatatcaat gggtctgttt ctgagctcta ctctatttta 660
tcagcctcac tgtctatccc cacacatctc atgctttgct ctaaatcttg atatttagtg 720
gaacattctt tcccattttg ttctacaaga atatttttgt tattgtcttt gggctttcta 780
tatacatttt gaaatgaggt tgacaagtta 810
<210> 67
<211> 726
<212> DNA
<213> 乙型肝炎病毒
<400> 67
ataacaggcc tattgattgg aaagtttgtc aacgaattgt gggtcttttg gggtttgctg 60
ccccttttac gcaatgtgga tatcctgctt taatgccttt atatgcatgt atacaagcaa 120
aacaggcttt tactttctcg ccaacttaca aggcctttct cagtaaacag tatatgaccc 180
tttaccccgt tgctcggcaa cggcctggtc tgtgccaagt gtttgctgac gcaaccccca 240
ctggttgggg cttggccata ggccatcagc gcatgcgtgg aacctttgtg tctcctctgc 300
cgatccatac tgcggaactc ctagccgctt gttttgctcg cagcaggtct ggagcaaacc 360
tcatcgggac cgacaattct gtcgtactct cccgcaagta tacatcgttt ccatggctgc 420
taggctgtgc tgccaactgg atcctgcgcg ggacgtcctt tgtttacgtc ccgtcggcgc 480
tgaatcccgc ggacgacccc tcccggggcc gcttggggct ctaccgcccg cttctccgtc 540
tgccgtaccg tccgaccacg gggcgcacct ctctttacgc ggactccccg tctgtgcctt 600
ctcatctgcc ggaccgtgtg cacttcgctt cacctctgca cgtcgcatgg aggccaccgt 660
gaacgcccac cggaacctgc ccaaggtctt gcataagagg actcttggac tttcagcaat 720
gtcatc 726
<210> 68
<211> 755
<212> DNA
<213> 人工序列
<220>
<223> 实验室中制备 - HepB衍生增强子元件
<400> 68
ttcctgtaaa caggcctatt gattggaaag tttgtcaacg aattgtgggt cttttggggt 60
ttgctgcccc ttttacgcaa tgtggatatc ctgctttaat gcctttatat gcatgtatac 120
aagcaaaaca ggcttttact ttctcgccaa cttacaaggc ctttctcagt aaacagtata 180
tgacccttta ccccgttgct cggcaacggc ctggtctgtg ccaagtgttt gctgacgcaa 240
cccccactgg ttggggcttg gccataggcc atcagcgcat gcgtggaacc tttgtgtctc 300
ctctgccgat ccatactgcg gaactcctag ccgcttgttt tgctcgcagc tggactggag 360
caaacctcat cgggaccgac aattctgtcg tactctcccg caagcactca ccgtttccgc 420
ggctgctcgc ctgtgttgcc acctggattc tgcgcgggac gtccttctgc tacgtccctt 480
cggccctcaa tccagcggac cttccttccc gcggcctgct gccggctctg cggcctcttc 540
cgcctcttcg ccttcgccct cagacgagtc ggatctccct ttgggccgcc tccccgccca 600
tgtatctttt tcacctgtgc cttgtttttg cctgtgttcc gcgtcctact tttcaagcct 660
ccaagctgtg ccttgggcgg ctttggggca tggacataga tccctataaa gaatttggtt 720
catcttatca gttgttgaat tttcttcctt tggac 755
<210> 69
<211> 94
<212> DNA
<213> 智人
<400> 69
gctggagcct cggtagccgt tcctcctgcc cgctgggcct cccaacgggc cctcctcccc 60
tccttgcacc ggcccttcct ggtctttgaa taaa 94
<210> 70
<211> 596
<212> DNA
<213> 土拨鼠肝炎病毒
<400> 70
attcgagcat cttaccgcca tttattccca tatttgttct gtttttcttg atttgggtat 60
acatttaaat gttaataaaa caaaatggtg gggcaatcat ttacattttt agggatatgt 120
aattactagt tcaggtgtat tgccacaaga caaacatgtt aagaaacttt cccgttattt 180
acgctctgtt cctgttaatc aacctctgga ttacaaaatt tgtgaaagat tgactgatat 240
tcttaactat gttgctcctt ttacgctgtg tggatatgct gctttaatgc ctctgtatca 300
tgctattgct tcccgtacgg ctttcgtttt ctcctccttg tataaatcct ggttgctgtc 360
tctttatgag gagttgtggc ccgttgtccg tcaacgtggc gtggtgtgct ctgtgtttgc 420
tgacgcaacc cccactggct ggggcattgc caccacctgt caactccttt ctgggacttt 480
cgctttcccc ctcccgatcg ccacggcaga actcatcgcc gcctgccttg cccgctgctg 540
gacaggggct aggttgctgg gcactgataa ttccgtggtg ttgtcgggga agggcc 596
<210> 71
<211> 387
<212> DNA
<213> 穴兔
<400> 71
tggctaataa aggaaattta ttttcattgc aatagtgtgt tggaattttt tgtgtctctc 60
actcggaaga acatatggga gggcaaatca tttaaaacat cagaatgagt atttggttta 120
gagtttggca acatatgccc atatgctggc tgccatgaac aaaggttggc tataaagagg 180
tcatcagtat atgaaacagc cccctgctgt ccattcctta ttccatagaa aagccttgac 240
ttgaggttag atttttttta tattttgttt tgtgttattt ttttctttaa catccctaaa 300
attttcctta catgttttac tagccagatt tttcctcctc tcctgactac tcccagtcat 360
agctgtccct cttctcttat ggagatc 387
<210> 72
<211> 251
<212> DNA
<213> 牛
<400> 72
ttgccagcca tctgttgttt gcccctcccc cgtgccttcc ttgaccctgg aaggtgccac 60
tcccactgtc ctttcctaat aaaatgagga aattgcatcg cattgtctga gtaggtgtca 120
ttctattctg gggggtgggg tggggcagga cagcaagggg gaggattggg aatacaatag 180
caggcatgct ggggatgcgg tgggctctat gggtacccag gtgctgaaga attgacccgg 240
ttcctcctgg g 251
<210> 73
<211> 251
<212> DNA
<213> 牛
<400> 73
ttgccagcca tctgttgttt gcccctcccc cgtgccttcc ttgaccctgg aaggtgccac 60
tcccactgtc ctttcctaat aaaatgagga aattgcatcg cattgtctga gtaggtgtca 120
ttctattctg gggggtgggg tggggcagga cagcaagggg gaggattggg aagacaatag 180
caggcatgct ggggatgcgg tgggctctat gggtacccag gtgctgaaga attgacccgg 240
ttcctcctgg g 251
<210> 74
<211> 225
<212> DNA
<213> 牛
<400> 74
ctgtgccttc tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc 60
tggaaggtgc cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc 120
tgagtaggtg tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt 180
gggaagacaa tagcaggcat gctggggatg cggtgggctc tatgg 225
<210> 75
<211> 202
<212> DNA
<213> 智人
<400> 75
ctgcccgggt ggcatccctg tgacccctcc ccagtgcctc tcctggccct ggaagttgcc 60
actccagtgc ccaccagcct tgtcctaata aaattaagtt gcatcatttt gtctgactag 120
gtgtccttct ataatattat ggggtggagg ggggtggtat ggagcaaggg gcccaagttg 180
ggaagaaacc tgtagggcct gc 202
<210> 76
<211> 735
<212> PRT
<213> 腺相关病毒2
<400> 76
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser
1 5 10 15
Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro
20 25 30
Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu His Ser Pro Val Glu Pro Asp Ser Ser Ser Gly Thr Gly
145 150 155 160
Lys Ala Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro
180 185 190
Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Thr Gly Ser Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr
260 265 270
Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His
275 280 285
Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp
290 295 300
Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln Val
305 310 315 320
Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu
325 330 335
Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr
340 345 350
Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp
355 360 365
Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser
370 375 380
Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser
385 390 395 400
Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu
405 410 415
Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg
420 425 430
Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr
435 440 445
Asn Thr Pro Ser Gly Thr Thr Thr Gln Ser Arg Leu Gln Phe Ser Gln
450 455 460
Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly
465 470 475 480
Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ser Ala Asp Asn Asn
485 490 495
Asn Ser Glu Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly
500 505 510
Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp
515 520 525
Asp Glu Glu Lys Phe Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys
530 535 540
Gln Gly Ser Glu Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr
545 550 555 560
Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr
565 570 575
Gly Ser Val Ser Thr Asn Leu Gln Arg Gly Asn Arg Gln Ala Ala Thr
580 585 590
Ala Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp
595 600 605
Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr
610 615 620
Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys
625 630 635 640
His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn
645 650 655
Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln
660 665 670
Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys
675 680 685
Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr
690 695 700
Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr
705 710 715 720
Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 77
<211> 736
<212> PRT
<213> 腺相关病毒9
<400> 77
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 78
<211> 736
<212> PRT
<213> 腺相关病毒6
<400> 78
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Phe Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Lys Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Ser Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
<210> 79
<211> 738
<212> PRT
<213> 非人灵长类动物腺相关病毒
<400> 79
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile
145 150 155 160
Gly Lys Lys Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln
165 170 175
Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro
180 185 190
Pro Ala Gly Pro Ser Gly Leu Gly Ser Gly Thr Met Ala Ala Gly Gly
195 200 205
Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser
210 215 220
Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val
225 230 235 240
Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His
245 250 255
Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ser Thr Asn Asp
260 265 270
Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn
275 280 285
Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn
290 295 300
Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn
305 310 315 320
Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala
325 330 335
Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln
340 345 350
Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe
355 360 365
Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn
370 375 380
Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr
385 390 395 400
Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr
405 410 415
Gln Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser
420 425 430
Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu
435 440 445
Ser Arg Thr Gln Ser Thr Gly Gly Thr Ala Gly Thr Gln Gln Leu Leu
450 455 460
Phe Ser Gln Ala Gly Pro Asn Asn Met Ser Ala Gln Ala Lys Asn Trp
465 470 475 480
Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Leu Ser
485 490 495
Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His
500 505 510
Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr
515 520 525
His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Ser Gly Val Leu Met
530 535 540
Phe Gly Lys Gln Gly Ala Gly Lys Asp Asn Val Asp Tyr Ser Ser Val
545 550 555 560
Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr
565 570 575
Glu Gln Tyr Gly Val Val Ala Asp Asn Leu Gln Gln Gln Asn Ala Ala
580 585 590
Pro Ile Val Gly Ala Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val
595 600 605
Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile
610 615 620
Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe
625 630 635 640
Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val
645 650 655
Pro Ala Asp Pro Pro Thr Thr Phe Ser Gln Ala Lys Leu Ala Ser Phe
660 665 670
Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu
675 680 685
Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr
690 695 700
Ser Asn Tyr Tyr Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Asp
705 710 715 720
Gly Thr Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg
725 730 735
Asn Leu
<210> 80
<211> 2217
<212> DNA
<213> 非人灵长类动物腺相关病毒
<400> 80
atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60
gagtggtggg acctgaaacc tggagccccg aaacccaaag ccaaccagca aaagcaggac 120
aacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180
aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 240
cagcagctcc aagcgggtga caatccgtac ctgcggtata atcacgccga cgccgagttt 300
caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgcgc agtcttccag 360
gccaaaaagc gggttctcga acctctgggc ctggttgaat cgccggttaa gacggctcct 420
ggaaagaaga gaccggtaga gccatcaccc cagcgctctc cagactcctc tacgggcatc 480
ggcaagaaag gccagcagcc cgcaaaaaag agactcaatt ttgggcagac tggcgactca 540
gagtcagtcc ccgaccctca accaatcgga gaaccaccag caggcccctc tggtctggga 600
tctggtacaa tggctgcagg cggtggcgct ccaatggcag acaataacga aggcgccgac 660
ggagtgggta gttcctcagg aaattggcat tgcgattcca catggctggg cgacagagtc 720
atcaccacca gcacccgcac ctgggccctg cccacctaca acaaccacct ctacaagcaa 780
atctccaacg ggacctcggg aggaagcacc aacgacaaca cctacttcgg ctacagcacc 840
ccctgggggt attttgactt caacagattc cactgccact tttcaccacg tgactggcag 900
cgactcatca acaacaactg gggattccgg cccaagaggc tcaacttcaa gctcttcaac 960
atccaagtca aggaggtcac gcagaatgaa ggcaccaaga ccatcgccaa taaccttacc 1020
agcacgattc aggtctttac ggactcggaa taccagctcc cgtacgtgct cggctcggcg 1080
caccagggct gcctgcctcc gttcccggcg gacgtcttca tgattcctca gtacgggtac 1140
ctgactctga acaatggcag tcaggctgtg ggccggtcgt ccttctactg cctggagtac 1200
tttccttctc aaatgctgag aacgggcaac aactttgaat tcagctacaa cttcgaggac 1260
gtgcccttcc acagcagcta cgcgcacagc cagagcctgg accggctgat gaaccctctc 1320
atcgaccagt acttgtacta cctgtcccgg actcaaagca cgggcggtac tgcaggaact 1380
cagcagttgc tattttctca ggccgggcct aacaacatgt cggctcaggc caagaactgg 1440
ctacccggtc cctgctaccg gcagcaacgc gtctccacga cactgtcgca gaacaacaac 1500
agcaactttg cctggacggg tgccaccaag tatcatctga atggcagaga ctctctggtg 1560
aatcctggcg ttgccatggc tacccacaag gacgacgaag agcgattttt tccatccagc 1620
ggagtcttaa tgtttgggaa acagggagct ggaaaagaca acgtggacta tagcagcgtg 1680
atgctaacca gcgaggaaga aataaagacc accaacccag tggccacaga acagtacggc 1740
gtggtggccg ataacctgca acagcaaaac gccgctccta ttgtaggggc cgtcaatagt 1800
caaggagcct tacctggcat ggtgtggcag aaccgggacg tgtacctgca gggtcccatc 1860
tgggccaaga ttcctcatac ggacggcaac tttcatccct cgccgctgat gggaggcttt 1920
ggactgaagc atccgcctcc tcagatcctg attaaaaaca cacctgttcc cgcggatcct 1980
ccgaccacct tcaatcaggc caagctggct tctttcatca cgcagtacag taccggccag 2040
gtcagcgtgg agatcgagtg ggagctgcag aaggagaaca gcaaacgctg gaacccagag 2100
attcagtaca cttccaacta ctacaaatct acaaatgtgg actttgctgt caatactgag 2160
ggtacttatt ccgagcctcg ccccattggc acccgttacc tcacccgtaa tctgtaa 2217
<210> 81
<211> 535
<212> PRT
<213> 非人灵长类动物腺相关病毒
<400> 81
Met Ala Ala Gly Gly Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala
1 5 10 15
Asp Gly Val Gly Ser Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp
20 25 30
Leu Gly Asp Arg Val Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro
35 40 45
Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly
50 55 60
Gly Ser Thr Asn Asp Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly
65 70 75 80
Tyr Phe Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp
85 90 95
Gln Arg Leu Ile Asn Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn
100 105 110
Phe Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly
115 120 125
Thr Lys Thr Ile Ala Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr
130 135 140
Asp Ser Glu Tyr Gln Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly
145 150 155 160
Cys Leu Pro Pro Phe Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly
165 170 175
Tyr Leu Thr Leu Asn Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe
180 185 190
Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn
195 200 205
Phe Glu Phe Ser Tyr Asn Phe Glu Asp Val Pro Phe His Ser Ser Tyr
210 215 220
Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln
225 230 235 240
Tyr Leu Tyr Tyr Leu Ser Arg Thr Gln Ser Thr Gly Gly Thr Ala Gly
245 250 255
Thr Gln Gln Leu Leu Phe Ser Gln Ala Gly Pro Asn Asn Met Ser Ala
260 265 270
Gln Ala Lys Asn Trp Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val
275 280 285
Ser Thr Thr Leu Ser Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Gly
290 295 300
Ala Thr Lys Tyr His Leu Asn Gly Arg Asp Ser Leu Val Asn Pro Gly
305 310 315 320
Val Ala Met Ala Thr His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser
325 330 335
Ser Gly Val Leu Met Phe Gly Lys Gln Gly Ala Gly Lys Asp Asn Val
340 345 350
Asp Tyr Ser Ser Val Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr
355 360 365
Asn Pro Val Ala Thr Glu Gln Tyr Gly Val Val Ala Asp Asn Leu Gln
370 375 380
Gln Gln Asn Ala Ala Pro Ile Val Gly Ala Val Asn Ser Gln Gly Ala
385 390 395 400
Leu Pro Gly Met Val Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro
405 410 415
Ile Trp Ala Lys Ile Pro His Thr Asp Gly Asn Phe His Pro Ser Pro
420 425 430
Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile
435 440 445
Lys Asn Thr Pro Val Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ala
450 455 460
Lys Leu Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val
465 470 475 480
Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro
485 490 495
Glu Ile Gln Tyr Thr Ser Asn Tyr Tyr Lys Ser Thr Asn Val Asp Phe
500 505 510
Ala Val Asn Thr Glu Gly Thr Tyr Ser Glu Pro Arg Pro Ile Gly Thr
515 520 525
Arg Tyr Leu Thr Arg Asn Leu
530 535
<210> 82
<211> 398
<212> PRT
<213> 非人灵长类动物腺相关病毒
<400> 82
Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr Val
1 5 10 15
Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp Val
20 25 30
Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser Gln
35 40 45
Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser Gln
50 55 60
Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr Asn Phe Glu Asp
65 70 75 80
Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg Leu
85 90 95
Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr Gln
100 105 110
Ser Thr Gly Gly Thr Ala Gly Thr Gln Gln Leu Leu Phe Ser Gln Ala
115 120 125
Gly Pro Asn Asn Met Ser Ala Gln Ala Lys Asn Trp Leu Pro Gly Pro
130 135 140
Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Leu Ser Gln Asn Asn Asn
145 150 155 160
Ser Asn Phe Ala Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly Arg
165 170 175
Asp Ser Leu Val Asn Pro Gly Val Ala Met Ala Thr His Lys Asp Asp
180 185 190
Glu Glu Arg Phe Phe Pro Ser Ser Gly Val Leu Met Phe Gly Lys Gln
195 200 205
Gly Ala Gly Lys Asp Asn Val Asp Tyr Ser Ser Val Met Leu Thr Ser
210 215 220
Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr Gly
225 230 235 240
Val Val Ala Asp Asn Leu Gln Gln Gln Asn Ala Ala Pro Ile Val Gly
245 250 255
Ala Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val Trp Gln Asn Arg
260 265 270
Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp
275 280 285
Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His
290 295 300
Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asp Pro
305 310 315 320
Pro Thr Thr Phe Asn Gln Ala Lys Leu Ala Ser Phe Ile Thr Gln Tyr
325 330 335
Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu
340 345 350
Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Tyr
355 360 365
Lys Ser Thr Asn Val Asp Phe Ala Val Asn Thr Glu Gly Thr Tyr Ser
370 375 380
Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
385 390 395
<210> 83
<211> 332
<212> PRT
<213> 非人灵长类动物腺相关病毒
<400> 83
Arg Thr Gly Asn Asn Phe Glu Phe Ser Tyr Asn Phe Glu Asp Val Pro
1 5 10 15
Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn
20 25 30
Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr Gln Ser Thr
35 40 45
Gly Gly Thr Ala Gly Thr Gln Gln Leu Leu Phe Ser Gln Ala Gly Pro
50 55 60
Asn Asn Met Ser Ala Gln Ala Lys Asn Trp Leu Pro Gly Pro Cys Tyr
65 70 75 80
Arg Gln Gln Arg Val Ser Thr Thr Leu Ser Gln Asn Asn Asn Ser Asn
85 90 95
Phe Ala Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly Arg Asp Ser
100 105 110
Leu Val Asn Pro Gly Val Ala Met Ala Thr His Lys Asp Asp Glu Glu
115 120 125
Arg Phe Phe Pro Ser Ser Gly Val Leu Met Phe Gly Lys Gln Gly Ala
130 135 140
Gly Lys Asp Asn Val Asp Tyr Ser Ser Val Met Leu Thr Ser Glu Glu
145 150 155 160
Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr Gly Val Val
165 170 175
Ala Asp Asn Leu Gln Gln Gln Asn Ala Ala Pro Ile Val Gly Ala Val
180 185 190
Asn Ser Gln Gly Ala Leu Pro Gly Met Val Trp Gln Asn Arg Asp Val
195 200 205
Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr Asp Gly Asn
210 215 220
Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys His Pro Pro
225 230 235 240
Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asp Pro Pro Thr
245 250 255
Thr Phe Asn Gln Ala Lys Leu Ala Ser Phe Ile Thr Gln Tyr Ser Thr
260 265 270
Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser
275 280 285
Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr Tyr Lys Ser
290 295 300
Thr Asn Val Asp Phe Ala Val Asn Thr Glu Gly Thr Tyr Ser Glu Pro
305 310 315 320
Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
325 330
<210> 84
<211> 743
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体 - AAV9变体
<400> 84
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Arg Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Thr Leu Ala Val
580 585 590
Pro Phe Lys Ala Gln Ala Gln Thr Gly Trp Val Gln Asn Gln Gly Ile
595 600 605
Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro
610 615 620
Ile Trp Ala Lys Ile Pro His Thr Asp Gly Asn Phe His Pro Ser Pro
625 630 635 640
Leu Met Gly Gly Phe Gly Met Lys His Pro Pro Pro Gln Ile Leu Ile
645 650 655
Lys Asn Thr Pro Val Pro Ala Asp Pro Pro Thr Ala Phe Asn Lys Asp
660 665 670
Lys Leu Asn Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val
675 680 685
Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro
690 695 700
Glu Ile Gln Tyr Thr Ser Asn Tyr Tyr Lys Ser Asn Asn Val Glu Phe
705 710 715 720
Ala Val Asn Thr Glu Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr
725 730 735
Arg Tyr Leu Thr Arg Asn Leu
740
<210> 85
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 肽插入物
<400> 85
Thr Leu Ala Val Pro Phe Lys
1 5
<210> 86
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 肽插入物
<400> 86
Lys Phe Pro Val Ala Leu Thr
1 5

Claims (72)

1.一种包含表达盒和任选地侧接腺相关病毒(AAV)反向末端重复序列(ITR)的多核苷酸,其中所述多核苷酸包含可操作地连接至启动子的编码肌肉LIM蛋白(MLP)或其功能变体的多核苷酸序列。
2.根据权利要求1所述的多核苷酸,其中所述启动子为心脏特异性启动子。
3.根据权利要求1或权利要求2所述的多核苷酸,其中所述启动子为肌肉特异性启动子。
4.根据权利要求1至3中任一项所述的多核苷酸,其中所述启动子为心肌细胞特异性启动子。
5.根据权利要求1至4中任一项所述的多核苷酸,其中所述启动子为MHCK7启动子。
6.根据权利要求5所述的多核苷酸,其中所述MHCK7启动子与SEQ ID NO:31具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的同一性。
7.根据权利要求1至4中任一项所述的多核苷酸,其中所述启动子为心肌肌钙蛋白T(hTNNT2)启动子。
8.根据权利要求7所述的多核苷酸,其中所述hTNNT2启动子与SEQ ID NO:32具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的同一性。
9.根据权利要求1至8中任一项所述的多核苷酸,其中所述表达盒包含所述心肌肌钙蛋白T(hTNNT2)基因的外显子1,其中任选地所述hTNNT2启动子和外显子1一起与SEQ ID NO:32具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的同一性。
10.根据权利要求1至4中任一项所述的多核苷酸,其中所述启动子为泛在启动子,任选地CMV启动子或CAG启动子。
11.根据权利要求1至10中任一项所述的多核苷酸,其中所述表达盒包含polyA信号。
12.根据权利要求11所述的多核苷酸,其中所述polyA信号为人生长激素(hGH)polyA。
13.根据权利要求1至12中任一项所述的多核苷酸,其中所述表达盒包含土拨鼠肝炎病毒转录后调控元件(WPRE),任选地WPRE(x)。
14.根据权利要求1至13中任一项所述的多核苷酸,其中所述肌肉LIM蛋白(MLP)或其功能变体为MLP。
15.根据权利要求14所述的多核苷酸,其中所述MLP为人MLP。
16.根据权利要求14或权利要求15所述的多核苷酸,其中所述MLP为MLP同种型A。
17.根据权利要求15或16所述的多核苷酸,其中所述MLP与以下具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的同一性:
MPNWGGGAKCGACEKTVYHAEEIQCNGRSFHKTCFHCMACRKALDSTTVAAHESEIYCKVCYGRRYGPKGIGYGQGAGCLSTDTGEHLGLQFQQSPKPARSVTTSNPSKFTAKFGESEKCPRCGKSVYAAEKVMGGGKPWHKTCFRCAICGKSLESTNVTDKDGELYCKVCYAKNFGPTGIGFGGLTQQVEKKE
(SEQ ID NO:1)。
18.根据权利要求14或权利要求15所述的多核苷酸,其中所述MLP为MLP同种型B。
19.根据权利要求15或18所述的多核苷酸,其中所述MLP与以下具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的同一性:
MPNWGGGAKCGACEKTVYHAEEIQCNGRSFHKTCFHCSPQSRHAQLPPATLPNSLRSLESPRSALDVASQSMLLRRLWEVASLGTRPVSAVPSVGRVWSPQMSLTKMGNFIAKFAMPKILAPRVLGLEALHNKWKRKNEEVRRFSDFLRA
(SEQ ID NO:2)。
20.根据权利要求15所述的多核苷酸,其中所述MLP与以下具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的同一性:
MPNWGGGAKCGACEKTVYHAEEIQCNGRSFHKTCFHCLC
(SEQ ID NO:3)。
21.根据权利要求15所述的多核苷酸,其中所述MLP与以下具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的同一性:
MPNWGGGAKCGACEKTVYHAEEIQCNGRSFHKTCFHCTLAQDLFP LCHLWEESGVHKC
(SEQ ID NO:4)。
22.根据权利要求1至21中任一项所述的多核苷酸,其中编码MLP的所述多核苷酸序列为富含半胱氨酸和甘氨酸的蛋白质3(CSRP3)多核苷酸。
23.根据权利要求22所述的多核苷酸,其中所述CSRP3多核苷酸为人CSRP3多核苷酸。
24.根据权利要求1至23中任一项所述的多核苷酸,其中编码MLP的所述多核苷酸序列与以下具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的同一性:
ATGCCAAACTGGGGCGGAGGCGCAAAATGTGGAGCCTGTGAAAAGACCGTCTACCATGCAGAAGAAATCCAGTGCAATGGAAGGAGTTTCCACAAGACGTGTTTCCACTGCATGGCCTGCAGGAAGGCTCTTGACAGCACGACAGTCGCGGCTCATGAGTCGGAGATCTACTGCAAGGTGTGCTATGGGCGCAGATATGGCCCCAAAGGGATCGGGTATGGACAAGGCGCTGGCTGTCTCAGCACAGACACGGGCGAGCATCTCGGCCTGCAGTTCCAACAGTCCCCAAAGCCGGCACGCTCAGTTACCACCAGCAACCCTTCCAAATTCACTGCGAAGTTTGGAGAGTCCGAGAAGTGCCCTCGATGTGGCAAGTCAGTCTATGCTGCTGAGAAGGTTATGGGAGGTGGCAAGCCTTGGCACAAGACCTGTTTCCGCTGTGCCATCTGTGGGAAGAGTCTGGAGTCCACAAATGTCACTGACAAAGATGGGGAACTTTATTGCAAAGTTTGCTATGCCAAAAATTTTGGCCCCACGGGTATTGGGTTTGGAGGCCTTACACAACAAGTGGAAAAGAAAGAA
(SEQ ID NO:5)。
25.根据权利要求1至24中任一项所述的多核苷酸,其中编码MLP的所述多核苷酸序列与以下具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的同一性:
ATGCCCAATTGGGGTGGAGGAGCTAAATGTGGAGCTTGTGAAAAAACAGTTTATCATGCTGAAGAAATTCAATGTAATGGAAGATCTTTTCATAAAACATGTTTTCATTGTATGGCTTGTAGAAAAGCACTTGATTCTACAACTGTTGCAGCACATGAAAGTGAAATCTATTGTAAAGTATGTTATGGAAGAAGATATGGACCAAAAGGAATTGGATATGGACAAGGAGCAGGATGTCTTTCTACAGATACTGGAGAACATTTGGGATTGCAATTTCAACAAAGTCCTAAACCAGCTAGATCTGTTACAACAAGTAATCCATCAAAATTTACTGCTAAATTTGGAGAATCCGAAAAATGTCCTAGATGTGGAAAATCAGTATATGCTGCTGAAAAAGTTATGGGAGGTGGAAAACCATGGCATAAGACATGTTTTAGATGTGCAATTTGTGGTAAATCTTTGGAATCTACAAATGTTACAGATAAAGATGGAGAATTGTATTGTAAAGTTTGTTATGCTAAAAATTTTGGACCTACAGGTATAGGATTTGGAGGTTTGACACAACAAGTTGAAAAAAAAGAA
(SEQ ID NO:7)。
26.根据权利要求1至25中任一项所述的多核苷酸,其中所述多核苷酸包含至少约2.4kb、至多约2.6kb、或约2.4kb至约2.6kb之间。
27.根据权利要求1至26中任一项所述的多核苷酸,其中所述多核苷酸包含至少约3.0kb、至多约3.3kb、或约3.0kb至约3.3kb之间。
28.根据权利要求1至27中任一项所述的多核苷酸,其中所述多核苷酸包含至少约2.4kb、至少约2.6kb、至少约3.0kb、至少约3.3kb、至少约3.5kb、至少约3.7kb、至少约3.9kb、至少约4.1kb、或至少约4.3kb。
29.根据权利要求1至28中任一项所述的多核苷酸,其中所述多核苷酸包含至少约2.6kb、至少约3.0kb、至多约3.3kb、至多约3.5kb、至多约3.7kb、至多约3.9kb、至多约4.1kb、至多约4.3kb、或至多约4.5kb。
30.根据权利要求1至29中任一项所述的多核苷酸,其中所述表达盒与SEQ ID NO:8-11中的任何一个具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的同一性。
31.根据权利要求1至30中任一项所述的多核苷酸,其中所述多核苷酸与SEQ ID NO:12-15中的任何一个具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的同一性。
32.根据权利要求1至31中任一项所述的多核苷酸,其中所述表达盒侧接5'和3'反向末端重复序列(ITR),任选地AAV2 ITR,任选地与SEQ IDNO:20-26中的任何一个具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的同一性的ITR。
33.根据权利要求1至32中任一项所述的多核苷酸,其中所述多核苷酸是自互补的。
34.根据权利要求1至33中任一项所述的多核苷酸,其中所述多核苷酸包含所述表达盒和所述表达盒的反向补体。
35.根据权利要求34所述的多核苷酸,其中所述表达盒和所述表达盒的所述反向补体侧接5'和3'反向末端重复序列(ITR),任选地AAV2 ITR,任选地与SEQ ID NO:23或SEQ IDNO:26具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的同一性的ITR。
36.一种基因疗法载体,所述载体包含根据权利要求1至35中任一项所述的多核苷酸。
37.根据权利要求36所述的载体,其中所述基因疗法载体为重组腺相关病毒(rAAV)载体。
38.根据权利要求37所述的载体,其中所述rAAV载体为AAV9或其功能变体。
39.根据权利要求38所述的载体,其中所述rAAV载体包含与SEQ IDNO:77中的任何一个具有90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的同一性的衣壳蛋白。
40.根据权利要求37所述的载体,其中所述rAAV载体为AAVrh10或其功能变体。
41.根据权利要求40所述的载体,其中所述rAAV载体包含与SEQ IDNO:79中的任何一个具有90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的同一性的衣壳蛋白。
42.根据权利要求37所述的载体,其中所述rAAV载体为AAV6或其功能变体。
43.根据权利要求42所述的载体,其中所述rAAV载体包含与SEQ IDNO:78中的任何一个具有90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的同一性的衣壳蛋白。
44.根据权利要求37所述的载体,其中所述rAAV载体为AAVrh74或其功能变体。
45.根据权利要求44所述的载体,其中所述rAAV载体包含与SEQ IDNO:80中的任何一个具有90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的同一性的衣壳蛋白。
46.根据权利要求36至45中任一项所述的载体,其中所述rAAV载体为自互补的AAV载体。
47.一种在有此需要的受试者中治疗和/或预防疾病或病症的方法,所述方法包括向所述受试者施用根据权利要求35至46中任一项所述的载体。
48.根据权利要求47所述的方法,其中所述疾病或病症为心脏病症。
49.根据权利要求47或48所述的方法,其中所述疾病或病症为心力衰竭。
50.根据权利要求47至49中任一项所述的方法,其中所述疾病或病症为肥厚型心肌病。
51.根据权利要求47至49中任一项所述的方法,其中所述疾病或病症为扩张型心肌病。
52.根据权利要求47至51中任一项所述的方法,其中所述受试者为哺乳动物。
53.根据权利要求52所述的方法,其中所述受试者为灵长类动物。
54.根据权利要求53所述的方法,其中所述受试者为人。
55.根据权利要求45至54中任一项所述的方法,其中相对于编码具有SEQ ID NO:1序列的人MLP的人CSRP3,所述受试者在所述CSRP3基因中具有引起选自C58G、L44P、S54R、E55G和/或K69R的氨基酸取代的突变。
56.根据权利要求47至55中任一项所述的方法,其中所述载体通过静脉内注射、心内注射、心内输注和/或心导管插入术来施用。
57.根据权利要求47至56中任一项所述的方法,其中所述施用使MLP表达增加至少约5%。
58.根据权利要求47至56中任一项所述的方法,其中所述施用使MLP表达增加至少约30%。
59.根据权利要求47至56中任一项所述的方法,其中所述施用使MLP表达增加至少约70%。
60.根据权利要求47至56中任一项所述的方法,其中所述施用使MLP表达增加约5%至约10%。
61.根据权利要求47至56中任一项所述的方法,其中所述施用使MLP表达增加约30%至约50%。
62.根据权利要求47至56中任一项所述的方法,其中所述施用使MLP表达增加约70%至约100%。
63.根据权利要求47至62中任一项所述的方法,其中所述方法治疗和/或预防所述疾病或病症。
64.一种药物组合物,所述药物组合物包含根据权利要求36至46中任一项所述的载体。
65.一种试剂盒,所述试剂盒包括根据权利要求34至46中任一项所述的载体或根据权利要求64所述的药物组合物和任选地使用说明书。
66.根据权利要求36至46中任一项所述的组合物用于任选地根据权利要求47至63中任一项所述的方法治疗疾病或病症的用途。
67.根据权利要求36至46中任一项所述的组合物,其用于任选地根据权利要求47至63中任一项所述的方法治疗疾病或病症。
68.一种表达肌肉LIM蛋白(MLP)或其功能变体的方法,所述方法包括使细胞与根据权利要求36至46中任一项的所述载体接触。
69.根据权利要求68所述的方法,其中所述细胞为心肌细胞。
70.根据权利要求69所述的方法,其中所述心肌细胞为人心肌细胞。
71.根据权利要求68至70中任一项所述的方法,其中所述启动子为MHCK7启动子并且其中所述MLP的表达水平比用具有hTNNT2启动子的载体转导的细胞中MLP的表达水平高至少2倍。
72.根据权利要求68至70中任一项所述的方法,其中所述启动子为MHCK7启动子并且其中所述MLP的表达水平比用具有hTNNT2启动子的载体转导的细胞中MLP的表达水平高2倍至高10倍。
CN202180057650.8A 2020-08-05 2021-08-03 Csrp3(富含半胱氨酸和甘氨酸的蛋白质3)基因疗法 Pending CN116234916A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063061727P 2020-08-05 2020-08-05
US63/061,727 2020-08-05
PCT/US2021/044412 WO2022031756A1 (en) 2020-08-05 2021-08-03 Csrp3 (cysteine and glycine rich protein 3) gene therapy

Publications (1)

Publication Number Publication Date
CN116234916A true CN116234916A (zh) 2023-06-06

Family

ID=80118758

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180057650.8A Pending CN116234916A (zh) 2020-08-05 2021-08-03 Csrp3(富含半胱氨酸和甘氨酸的蛋白质3)基因疗法

Country Status (11)

Country Link
US (1) US20230257431A1 (zh)
EP (1) EP4192962A1 (zh)
JP (1) JP2023536618A (zh)
KR (1) KR20230042468A (zh)
CN (1) CN116234916A (zh)
AU (1) AU2021321410A1 (zh)
BR (1) BR112023001336A2 (zh)
CA (1) CA3184983A1 (zh)
IL (1) IL300187A (zh)
MX (1) MX2023000994A (zh)
WO (1) WO2022031756A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MX2023001615A (es) 2020-08-07 2023-03-08 Spacecraft Seven Llc Genoterapia con placofilina-2 (pkp2) mediante el uso de vector de aav.
WO2023159190A1 (en) * 2022-02-18 2023-08-24 Ginkgo Bioworks, Inc. Gene therapy for arrhythmogenic cardiomyopathy
WO2023178337A2 (en) * 2022-03-18 2023-09-21 University Of Florida Research Foundation, Incorporated Methods and compositions for treating rbm20 related cardiomyopathy with a viral vector

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK2176283T3 (en) 2007-07-14 2017-02-13 Univ Iowa Res Found METHODS AND COMPOSITIONS FOR TREATMENT OF BRAIN DISEASES
EP3044318B1 (en) 2013-09-13 2019-05-01 California Institute of Technology Selective recovery
PE20170260A1 (es) 2014-05-02 2017-04-12 Genzyme Corp Vectores de aav para la terapia genica de la retina y el snc
ES2869284T3 (es) 2015-12-11 2021-10-25 California Inst Of Techn Péptidos de diana para dirigir virus adenoasociados (AAV)
US20210260215A1 (en) * 2018-06-08 2021-08-26 University Of Florida Research Foundation, Incorporated Aav cardiac gene therapy for cardiomyopathy

Also Published As

Publication number Publication date
MX2023000994A (es) 2023-03-01
US20230257431A1 (en) 2023-08-17
AU2021321410A1 (en) 2023-04-06
BR112023001336A2 (pt) 2023-02-14
KR20230042468A (ko) 2023-03-28
IL300187A (en) 2023-03-01
JP2023536618A (ja) 2023-08-28
WO2022031756A1 (en) 2022-02-10
EP4192962A1 (en) 2023-06-14
CA3184983A1 (en) 2022-02-10

Similar Documents

Publication Publication Date Title
CN105408352B (zh) 通过双重aav载体有效递送大基因
KR20230043869A (ko) Aav 벡터를 사용한 플라코필린-2(pkp2) 유전자 요법
KR20200051011A (ko) 변형된 폐쇄-종결된 dna(cedna)
KR102240180B1 (ko) 다중 벡터 시스템 및 이의 용도
US8298818B2 (en) Self-complementary adeno-associated virus having a truncated CMV-chicken β-actin promoter
CN116234916A (zh) Csrp3(富含半胱氨酸和甘氨酸的蛋白质3)基因疗法
KR20200111726A (ko) 무세포 합성으로부터 수득된 폐쇄 말단 DNA 벡터 및 ceDNA 벡터를 수득하는 방법
JP2024059727A (ja) Cns変性のための遺伝子治療法
KR20210090619A (ko) 대칭인 변형된 역말단반복을 포함하는 변형된 폐쇄형 DNA(ceDNA)
KR20200124250A (ko) 폐쇄-말단 dna (cedna) 벡터를 사용한 이식유전자의 제어된 발현
KR20230019402A (ko) 프로그래뉼린 연관 신경변성 질환 또는 장애의 치료를 위한 아데노-연관 바이러스 (aav) 시스템
KR20230043123A (ko) Glut1 발현을 위한 아데노-연관 바이러스 벡터 및 이의 사용
CN114402075A (zh) 乌谢尔综合征(ush2a)的基因疗法
RU2761879C1 (ru) Вакцина на основе AAV5 для индукции специфического иммунитета к вирусу SARS-CoV-2 и/или профилактики коронавирусной инфекции, вызванной SARS-CoV-2
RU2742837C1 (ru) Кодон-оптимизированная нуклеиновая кислота, которая кодирует белок SMN1, и ее применение
CN116685329A (zh) 核酸构建体及其用于治疗脊髓性肌肉萎缩症的用途
US20220226507A1 (en) Optimized gene therapy targeting retinal cells
CN116368228A (zh) 用于治疗眼部疾病的组合物和方法
KR20220007601A (ko) 치료제 투여를 위한 조성물 및 방법
KR20230039669A (ko) eEF1A2용 유전자 요법 벡터 및 이의 용도
RU2800026C2 (ru) МОДИФИЦИРОВАННАЯ ДНК С ЗАМКНУТЫМИ КОНЦАМИ (зкДНК)
RU2816963C2 (ru) МОДИФИЦИРОВАННАЯ ДНК С ЗАМКНУТЫМИ КОНЦАМИ (зкДНК), СОДЕРЖАЩАЯ СИММЕТРИЧНЫЕ МОДИФИЦИРОВАННЫЕ ИНВЕРТИРОВАННЫЕ КОНЦЕВЫЕ ПОВТОРЫ
CN115244181A (zh) 阿司匹林化合物在增加核酸表达中的新型用途
CN117836420A (zh) 重组tert编码病毒基因组和运载体
WO2023205767A2 (en) B-cell lymphoma 2–associated anthanogene 3 (bag3) gene therapy using aav vector

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination