CN109563512A - 用于治疗Dysferlin肌病的截短Dysferlin - Google Patents

用于治疗Dysferlin肌病的截短Dysferlin Download PDF

Info

Publication number
CN109563512A
CN109563512A CN201780050284.7A CN201780050284A CN109563512A CN 109563512 A CN109563512 A CN 109563512A CN 201780050284 A CN201780050284 A CN 201780050284A CN 109563512 A CN109563512 A CN 109563512A
Authority
CN
China
Prior art keywords
leu
glu
pro
asp
ala
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201780050284.7A
Other languages
English (en)
Inventor
M·L·赫希
R·B·萨顿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Texas Polytechnic University System
University of North Carolina at Chapel Hill
Texas A&M University System
University of North Carolina System
Texas Tech University System
Original Assignee
Texas Polytechnic University System
University of North Carolina System
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Texas Polytechnic University System, University of North Carolina System filed Critical Texas Polytechnic University System
Publication of CN109563512A publication Critical patent/CN109563512A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4707Muscular dystrophy
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P21/00Drugs for disorders of the muscular or neuromuscular system
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4716Muscle proteins, e.g. myosin, actin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14051Methods of production or purification of viral material
    • C12N2750/14052Methods of production or purification of viral material relating to complementing cells and packaging systems for producing virus or viral particles
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • General Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Neurology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Physical Education & Sports Medicine (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Orthopedic Medicine & Surgery (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Virology (AREA)
  • Environmental Sciences (AREA)
  • Epidemiology (AREA)
  • Animal Husbandry (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

本发明涉及截短的dysferlin核酸和蛋白质,包含该核酸的载体(例如腺相关病毒载体)和使用该载体以将dysferlin递送至细胞或受试者并治疗dysferlin肌病的方法。

Description

用于治疗Dysferlin肌病的截短Dysferlin
优先权声明
本申请要求2016年6月17日提交的美国临时申请序列号62/351,701的权益,其全部内容通过引用并入本文。
技术领域
本发明涉及截短的dysferlin核酸和蛋白质、包含该核酸的载体(例如腺相关病毒(AAV)载体)和使用该载体以将dysferlin递送至细胞或受试者并治疗dysferlin肌病(dysferlinopathy)的方法。
背景技术
dysferlin肌病是一种肌营养不良症,不管临床表现为何,其均是由dysferlin基因的突变引起的。个体之间dysferlin肌病的症状显著不同。最常见的与dysferlin肌病有关的临床表现包括肢带肌营养不良症(LGMD2B)、Miyoshi肌病、胫骨前发作的远端型肌病(DMAT)、近远端型肌无力、假代谢性肌病和高肌酸激酶血症。最常见的是,患者在生命的第二个十年中远端肌肉无力,在随后的十年内远端运动功能丧失。患者通常需要轮椅来提供不同程度的全身控制进行运动。由于dysferlin肌病经常被误诊,所以尚未确定其发病率。迄今为止,没有有效的治疗方法可以减缓肌肉功能的丧失或者逆转/改善营养不良的表型。
Dysferlin是参与维持膜的完整性的囊泡和膜相关蛋白。Dysferlin表现出钙敏感域,其可能在膜损伤时触发细胞内信号传导修复网络。人们认为,含有dysferlin的细胞内囊泡向膜损伤部位输送,并且通常情况下囊泡融合使得膜保持完整。尽管尚未很好的表征出dysferlin的功能,但在缺乏dysferlin的情况下,肌肉膜更容易受到轻度压力的影响。
Dysferlin蛋白的编码序列>6.5kb,超过了单个腺相关病毒(AAV)载体衣壳的包装能力,从而不能通过简单的AAV介导的基因添加策略来治疗dysferlin肌病。因此,已经研究出了创造性的细胞内基因构建方法,用于AAV介导的dysferlin递送,其依赖于携带必须由宿主酶组装的转基因DNA片段的多个衣壳。这种“超大AAV基因疗法”尚未在临床中得到验证,并且实质上在几个水平上效率较低。对“超大”AAV转导dysferlin进行的先有尝试遇到了困难,难以得到可检测水平的体内恢复的dysferlin。
本发明通过提供可以包装在单个AAV中的截短的杂合dysferlin基因克服了本领域的各种缺点,并且已经证明其在体内是有效的。
发明内容
本发明提供了截短的dysferlin多肽和编码该多肽的多核苷酸。截短的多肽保留了野生型dysferlin的至少一部分生物活性,并且由于相对于野生型多核苷酸长度减少,多核苷酸能够被包装到病毒基因组和病毒载体中。
本发明的一个方面涉及编码截短的哺乳动物dysferlin多肽的多核苷酸,其中所述多肽的每个C2D和C2F结构域的至少大部分(substantial portion)被删除。本发明进一步涉及包含本发明的多核苷酸的表达盒、载体(例如,病毒载体)和重组病毒颗粒(例如,AAV颗粒),以及包含本发明的多核苷酸、表达盒或载体的转化细胞和转基因动物。还提供了药物制剂,其包含在药学上可接受的载体中的本发明的病毒颗粒。
本发明的其他方面涉及截短的哺乳动物dysferlin多肽,其中所述多肽的每个C2D和C2F结构域的至少大部分被删除。
本发明的又一方面提供了产生重组AAV颗粒的方法,包括向允许AAV复制的细胞提供:(a)重组AAV模板,其包含(i)本发明的多核苷酸或表达盒,和(ii)反向末端重复(ITR);(b)包含Rep编码序列和Cap编码序列的多核苷酸;在足以复制和包装重组AAV模板的条件下;由此在细胞中产生重组AAV颗粒。
本发明的又一方面涉及将dysferlin递送至细胞的方法,包括使细胞与本发明的重组病毒颗粒(例如,AAV颗粒)接触,从而将dysferlin递送至细胞。
本发明的另一方面涉及向哺乳动物受试者施用dysferlin的方法,包括向哺乳动物受试者施用已与本发明的重组病毒颗粒(例如,AAV颗粒)接触的细胞,从而向哺乳动物受试者施用dysferlin。
本发明的又一方面涉及治疗有需要的哺乳动物受试者的dysferlin肌病的方法,包括向哺乳动物受试者施用已与本发明的重组病毒颗粒(例如,AAV颗粒)接触的细胞,从而治疗dysferlin肌病。
本发明的另一方面涉及向哺乳动物受试者施用dysferlin的方法,包括向哺乳动物受试者施用本发明的重组病毒颗粒(例如,AAV颗粒),从而向哺乳动物受试者施用dysferlin。
本发明的另一方面涉及治疗有需要的哺乳动物受试者的dysferlin肌病的方法,包括向哺乳动物受试者施用本发明的重组病毒颗粒(例如,AAV颗粒),从而治疗dysferlin肌病。
本发明的另一方面涉及本发明的重组病毒颗粒(例如,AAV颗粒)用于向细胞递送dysferlin的用途。
本发明的另一方面涉及与本发明的重组病毒颗粒(例如,AAV颗粒)接触的细胞用于向哺乳动物受试者递送dysferlin的用途。
本发明的又一方面涉及本发明的重组病毒颗粒(例如,AAV颗粒)用于向哺乳动物受试者递送dysferlin的用途。
本发明的又一方面涉及本发明的重组病毒颗粒(例如,AAV颗粒)用于治疗哺乳动物受试者的dysferlin疾病的用途。
本发明的另一方面涉及本发明的重组病毒颗粒(例如,AAV颗粒)用于制造向细胞递送dysferlin的药物的用途。
本发明的另一方面涉及与本发明的重组病毒颗粒(例如,AAV颗粒)接触的细胞用于制造向哺乳动物受试者递送dysferlin的药物的用途。
本发明的又一方面涉及本发明的重组病毒颗粒(例如,AAV颗粒)用于制造向哺乳动物受试者递送dysferlin的药物的用途。
本发明的又一方面涉及本发明的重组病毒颗粒(例如,AAV颗粒)用于制造治疗哺乳动物受试者的dysferlin肌病的药物的用途。
在本发明下文描述中将更详细地阐述本发明的这些和其他方面。
附图说明
图1A-1D示出了纳米Dysferlin(Nano-Dysferlin)的设计及其在哺乳动物细胞中的表达。(图1A)人dysferlin同种型8,产生纳米Dysferlin的亲本cDNA,含有C2A、C2B、C2C、FerA、Dysf、C2D、C2E、C2F、C2G和大小为6,240nt的跨膜结构域。纳米Dysferlin缺少C2D、C2E和C2F结构域,使cDNA大小减小至4,356nt。(图1B)转染的c2c12小鼠成肌细胞的蛋白质印迹分析显示可溶性蛋白裂解物不含纳米Dysferlin或全长dysferlin。相比之下,膜相关蛋白裂解物含有dysferlin和纳米Dysferlin两者。(图1C)HeLa细胞中的免疫荧光成像显示了dysferlin和纳米Dysferlin的相似细胞内分布。比例尺,20μm。(图1D)如通过在低质粒剂量(0.5mg)、中等质粒剂量(1mg)或高质粒剂量(1.5mg)下的alamar Blue吸光度测量得到的,在dysferlin缺陷型患者细胞中纳米Dysferlin没有显示出显著的毒性。使用0.5%次氯酸钠作为阳性杀伤阳性对照。图中示出了平均值+SD。
图2A-2D示出了使用弱启动子的完整AAV转导比使用强启动子的片段AAV更有效。(图2A)基于启动子和多聚腺苷酸化(polyA)序列设计了两种大小不同的纳米DysferlinAAV-ITR盒。JeT-Nano-Dysferlin的大小为4,849nt,而CMV-Nano-Dysferlin的大小为5,597nt。(图2B)在293细胞中转染并用指定的抗体染色后在(图2A)中描绘的构建体(连同dysferlin和GFP对照)的蛋白质印迹。(图2C)通过碱性凝胶电泳和SYBR金染色分析AAV病毒包装。图中观察到JeT-Nano-Dysferlin盒的完整包装,而对于CMV-Nano-Dysferlin盒,观察到片段化包装(数字表示在每个CsCl梯度级分中发现的包装的基因组)。(图2D)用指定的AAV载体按每个细胞的指定量治疗的293细胞的蛋白质印迹分析。
图3A-3D示出了在肌内注射后AAV-Nano-Dysferlin显著改善肌肉组织学。(图3A)对BLA/J dysferlin缺陷小鼠的TA肌肉对侧注射AAV1-CMV-GFP或AAV1-JeT-Nano-Dysferlin。在处死前40小时腹膜内施用伊文思蓝染料。将伊文思蓝染料阳性纤维归一化为总纤维。匹配对统计分析显示,与对侧对照相比,AAV1-JeT-Nano-Dysferlin治疗的TA中伊文思蓝染料阳性纤维显著减少。(图3B)除了用AAV1-JeT-Nano-Dysferlin治疗的那一块肌肉外,在所有肌肉中作为肌肉更新的标志物的中心有核纤维均减少,统计分析显示纳米Dysferlin治疗的肌肉的中心成核显著减少(p=0.0125)。(图3C)代表性图像显示AAV1-JeT-Nano-Dysferlin注射的肌肉中肌肉组织学得到改善,其比BLA/J dysferlin缺陷肌肉更类似于WT肌肉。比例尺,40μm。(图3D)Romeo dysferlin抗体IF染色显示内源性dysferlin和纳米Dysferlin之间的不同分布类型。纳米Dysferlin的大约30%的纤维染色呈阳性(总纤维n=455)。比例尺,40μm。图中示出了平均值+SD。
图4A-4C示出了全身注射后AAV-Nano-Dysferlin能改善运动机能。(图4A)与AAV9-JeT-Nano-Dysferlin治疗的小鼠相比,在AAV9-CMV-GFP治疗的小鼠中发现肌酸激酶活性更高。(图4B)与AAV9-CMV-GFP治疗的小鼠相比,注射AAV9JeT-Nano-Dysferlin的BLA/J小鼠的站立表现(Rearing performance)在1小时评估中显著改善。(图4C)通过与AAV9CMV-GFP对照小鼠经过1小时的持续站立比较所表现出的,随时间的站立分析证明AAV9-JeT-Nano-Dysferlin治疗的小鼠具有增加的耐力。图中示出了平均值+SD。
图5A-5E示出了全身注射后AAV-Nano-Dysferlin对肌肉组织学的影响。(图5A)与GFP治疗的肌肉相比,在纳米Dysferlin治疗的肌肉中,中心有核纤维(其存在表明再生和更新)没有显著减少,但有减少趋势(p=0.0835)。(图5B)在注射AAV9-JeT-Nano-Dysferlin的小鼠臀肌中,伊文思蓝染料全肌吸收测定(肌肉损伤的量度)显著降低(p=0.037)。(图5C)伊文思蓝染料阳性纤维组织学的代表性图像显示与AAV9-CMV-GFP治疗的对照相比,AAV9-JeT-Nano-Dysferlin治疗的肌肉的肌肉损伤显著降低。统计分析显示,在AAV9-JeT-Nano-Dysferlin治疗的小鼠的臀肌中,伊文思蓝染料阳性纤维几乎显著减少(p=0.056)。比例尺,100μm。(图5D)从臀肌WGA凝集素染色的肌肉切片获得最小Feret直径(纤维大小的量度),通过非配对t检验测得的治疗之间具有显著差异(p<0.0001)。(图5E)疏水性和带负电荷的脂质的油红O染色(箭头);该代表性图像显示各治疗之间的显著差异。比例尺,300μm。图中示出了平均值+SD。
图6A-6C示出了其他数据。(图6A)对IV治疗的小鼠中测量水平活动量,在最初的30分钟内各治疗之间没有差异(p=0.58),而在最后30分钟的观察中,纳米Dysferlin治疗小鼠具有不显著的(p=0.13)但趋势增大的水平活动量。(图6B)在臀肌和腰肌中进行H&E染色,并分析归一化为总纤维的总中心成核,在各治疗之间没有发现采用该方法测量的中心成核存在差异。图中示出了平均值+SD。
图7示出了纤维尺寸分布。通过运行ImageJ协议对WGA凝集素标记的臀大肌肌肉切片测量最小Feret直径(肌肉纤维大小的伪影弹性度量)。纳米Dysferlin治疗的小鼠纤维尺寸分布(n=610)显示出比GFP治疗的小鼠纤维尺寸分布(n=619)更大的纤维尺寸,与野生型未治疗的分布(n=467)相比,显示了部分校正。示出了范围中的总和。比例尺=100μm。
图8示出了通过免疫荧光检测的纳米Dysferlin。使用dysferlin抗体、Hoechst核染色和麦胚凝集素膜染色对来自所示小鼠的臀肌进行免疫荧光染色。我们注意到纳米Dysferlin位置遍布整个膜和细胞质,而内源性dysferlin仅仅位于膜上。大约10%的肌肉纤维染色为纳米Dysferlin阳性(总纤维n=441)。比例尺,100μm。
图9A-9B示出了通过RT-PCR进行的检测。(图9A)在肌内治疗的胫骨肌肌肉中观察到纳米Dysferlin的预期RT-QPCR扩增子,而在其对侧对照中也观察到较弱的信号,但在阴性对照中没有观察到,这表明载体从注射部位渗漏。由于扩增子的尺寸,PCR样品用Exo-SapIt处理以去除引物二聚体,为了对在臀肌中的纳米Dysferlin进行RT-QPCR也进行了该操作(图9B),图中示出了信号,确认了单次全身注射后近8个月转录mRNA的存在。
具体实施方式
下文将参考附图对本发明进行描述,附图中示出了本发明的优选实施例。但是本发明可以以很多种不同的形式表现,其不应理解为是对本发明阐述的各实施例的限制。相反,提供这些实施例是为了使本公开彻底和完整,并且将本发明的范围完全传达给本领域技术人员。
除非另外定义,否则本文使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的含义相同的含义。这里在本发明的描述中使用的术语仅用于描述特定实施例的目的,而不旨在限制本发明。本文提及的所有出版物、专利申请、专利和其他参考文献的全部内容通过引用并入本文。
除非另外特别指出,否则本文仅通过单链,从5’至3'方向,从左至右呈现核苷酸序列。核苷酸和氨基酸在本文中以IUPAC-IUB生物化学命名委员会推荐的方式表示,或(对于氨基酸)由单字母代码或三字母代码表示,两者均符合37C.F.R.§1.822和惯用法。参见,例如,PatentIn User Manual,99-102(1990年11月)(美国专利商标局)。
除非另有说明,否则可以采用本领域中本领域技术人员公知的标准方法构建重组AAV(rAAV)构建体、表达AAV Rep和/或Cap序列包装载体以及瞬时和稳定转染的包装细胞。这些技术是本领域技术人员已知的。参见,例如,SAMBROOK et al.MOLECULAR CLONING:ALABORATORY MANUAL 2nd Ed.(Cold Spring Harbor,NY,1989);AUSUBEL et al.CURRENTPROTOCOLS IN MOLECULAR BIOLOGY(Green Publishing Associates,Inc.和John Wiley&Sons,Inc.,纽约)。
此外,本发明还设想了在本发明的一些实施例中,可排除或省略本文所述的任何特征或特征组合。
为了进一步说明,例如,如果说明书指出特定氨基酸可以选自A、G、I、L和/或V,则该描述还表明所述氨基酸可以选自这些氨基酸的任何子集,例如A、G、I或L;A、G、I或V;A或G;仅L;等等,如同每个这样的子组合都在本文中明确描述出来一样。此外,这种描述还表明可以放弃一种或多种指定的氨基酸。例如,在特定的实施例中,所述氨基酸不是A、G或I;不是A;不是G或V;等等,如同每种可能的放弃都在本文中明确描述出来一样。
定义
下面的术语在本文的说明书和所附权利要求中使用。
单数形式的“一”和“一个”也包括复数形式,除非上下文另有明确说明。
此外,当提及可测量的值(例如多核苷酸或多肽序列的长度、剂量、时间、温度等)时,术语“约”意指包括20%、10%、5%、1%、0.5%或者甚至0.1%的规定值。
又如本文所使用的,“和/或”是指并且包括一个或多个相关所列项目的任何和所有可能的组合,以及当在替代方式(“或”)中解释时缺少的组合。
如本文所使用的,过渡性短语“基本上由……组成”应被解释为涵盖所列举的材料或步骤以及不会实质上影响本发明的基本和新颖性特征的那些材料或步骤(例如,产生dysferlin)。因此,本文使用的术语“基本上由……组成”不应被解释为等同于“包括”。
本文使用的术语“细小病毒”包括细小病毒科,包括自主复制的细小病毒和依赖病毒。自主细小病毒包括细小病毒属、红细胞病毒、浓核病毒属、重复病毒属(Iteravirus)和康特拉病毒属(Contravirus)。示例性的自主细小病毒包括但不限于小鼠的细小病毒、牛细小病毒、犬细小病毒、鸡细小病毒、猫泛白细胞减少症病毒、猫细小病毒、鹅细小病毒、H1细小病毒、美洲家鸭细小病毒、蛇细小病毒和B19病毒。其他自主细小病毒是本领域技术人员已知的。参见,例如,FIELDS et al.VIROLOGY,volume 2,chapter 69(4th ed.,Lippincott-Raven Publishers)。
依赖病毒属包含腺相关病毒(AAV),包括但不限于AAV 1型、AAV 2型、AAV 3型(包括3A型和3B型)、AAV 4型、AAV 5型、AAV 6型、AAV 7型、AAV 8型、AAV 9型、AAV 10型、AAV 11型、AAV 12型、AAV 13型、鸟AAV、牛AAV、犬AAV、山羊AAV、蛇AAV、马AAV和绵羊AAV。参见,例如,FIELDS et al.VIROLOGY,volume 2,chapter 69(4th ed.,Lippincott-RavenPublishers);以及表1。
如本文所使用的,术语“腺相关病毒”(AAV)包括但不限于AAV 1型、AAV 2型、AAV 3型(包括3A型和3B型)、AAV 4型、AAV 5型、AAV 6型、AAV 7型、AAV 8型、AAV 9型、AAV 10型、AAV 11型、AAV 12型、AAV 13型、蛇AAV、鸟AAV、牛AAV、犬AAV、马AAV、绵羊AAV、山羊AAV、虾AAV以及现在已知或未来发现的任何其他AAV。参见,例如,FIELDS et al.VIROLOGY,volume2,chapter 69(4th ed.,Lippincott-Raven Publishers)。已经鉴定了许多相对较新的AAV血清型和进化枝(参见,例如,Gao et al.(2004)J.Virol.78:6381;Moris et al.(2004)Virol.33-:375;和表1)。
表1
本发明的AAV颗粒和基因组可以来自任何AAV。各种血清型的AAV的基因组序列以及天然ITR、Rep蛋白和衣壳亚基的序列是本领域已知的。这些序列可以在文献中或在诸如GenBank的公共数据库中找到。参见,例如,GenBank登记号NC_002077、NC_001401、NC_001729、NC_001863、NC_001829、NC_001862、NC_000883、NC_001701、NC_001510、NC_006152、NC_006261、AF063497、U89790、AF043303、AF028705、AF028704、J02275、J01901、J02275、X01457、AF288061、AH009962、AY028226、AY028223、AY631966、AX753250、EU285562、NC_001358、NC_001540、AF513851、AF513852和AY530579,其公开内容通过用于并入本文,用于教导AAV核酸和氨基酸序列。参见,例如,Bantel-Schaal et al.(1999)J.Virol.73:939;Chiorini et al.(1997)J.Virol.71:6823;Chiorini et al.(1999)J.Virol.73:1309;Gaoet al.(2002)Proc.Nat.Acad.Sci.USA 99:11854;Moris et al.(2004)Virol.33-:375-383;Mori et al.(2004)Virol.330:375;Muramatsu et al.(1996)Virol.221:208;Ruffing et al.(1994)J.Gen.Virol.75:3385;Rutledge et al.(1998)J.Virol.72:309;Schmidt et al.(2008)J.Virol.82:8911;Shade et al.,(1986)J.Virol.58:921;Srivastava et al.(1983)J.Virol.45:555;Xiao et al.(1999)J.Virol.73:3994;国际专利公开WO 00/28061、WO 99/61601、WO 98/11244;以及美国专利第6,156,303号;其公开内容通过引用并入本文,用于教导AAV核酸和氨基酸序列。同样参见表1。AAV1、AAV2和AAV3ITR序列的早期描述记载于Xiao,X.,(1996),“Characterization of Adeno-associatedvirus(AAV)DNA replication and integration,”,宾夕法尼亚州匹兹堡匹兹堡大学博士论文论文(其全文并入本文)。
本文所用的术语“向性”是指病毒进入细胞,任选地并且优选地接着表达(例如,转录以及任选地翻译)细胞中病毒基因组携带的序列,例如用于重组病毒,表达异源核苷酸序列。本领域技术人员将理解,在不存在反式作用因子的情况下,例如对于诱导型启动子或其他调节的核酸序列,不能启动来自病毒基因组的异源核酸序列的转录。在AAV的情况下,来自病毒基因组的基因表达可以来自稳定整合的细小病毒,来自非整合的附加体,以及可以在细胞内获取病毒的任何其他形式。
如本文所使用的,通过AAV进行细胞“转导”是指AAV介导遗传物质转移进入细胞。参见,例如,FIELDS et al.VIROLOGY,volume 2,chapter 69(3d ed.,Lippincott-RavenPublishers)。
术语“5’部分”和“3’部分”是用于定义两个或更多个元素之间的空间关系的相对术语。因此,例如,多核苷酸的“3’部分”表示多核苷酸的一段在另一段的下游。术语“3’部分”并不旨在表示该片段必须位于多核苷酸的3’末端,或者甚至必须位于多核苷酸的3’端半序列上,但是它可以位于其上。同样地,多核苷酸的“5’部分”表示多核苷酸的一段在另一段的上游。术语“5’部分”并不旨在表示该片段必须位于多核苷酸的5’末端,或者甚至必须位于多核苷酸的5’端半序列上,但是它可以位于其上。
除非另有说明,如本文所用的,术语“多肽”包括肽和蛋白质两者。
如本文所使用的,术语“截短的多肽”是指野生型多肽中存在的一个或多个氨基酸残基被删除的多肽。该被删除的残基可以在N-端、C-端、内部或它们的任意组合。
“多核苷酸”是核苷酸碱基的序列,并且可以是RNA、DNA或DNA-RNA杂合序列(包括天然存在的和非天然存在的核苷酸),并且可以是单链或双链DNA序列。
如本文所使用的,术语“序列同一性”具有本领域的标准含义。如本领域所知的,许多不同的程序可用于鉴定多核苷酸或多肽是否与已知序列具有序列同一性或相似性。可以使用本领域已知的标准技术确定序列同一性或相似性,包括但不限于Smith&Waterman的局部序列一致性算法(Adv.Appl.Math.2:482(1981)),Needleman&Wunsch的序列一致性比对算法(J.Mol.Biol.48:443(1970)),Pearson&Lipman的搜索相似性方法(Proc.Natl.Acad.Sci.USA 85:2444(1988)),这些算法的计算机化执行(Wisconsin遗传软件包(the Wisconsin Genetics Software Package)中的GAP、BESTFIT、FASTA和TFASTA,Genetics Computer Group,575 Science Drive,麦迪逊,WI),Devereux等描述的最佳拟合序列程序(Nucl.Acid Res.12:387(1984)),优选地使用默认设置,或通过检查。
有用的算法的示例是PILEUP。PILEUP使用渐进的成对比对从一组相关序列创建多序列比对。它还可以绘制显示用于创建对齐的聚类关系的树。PILEUP使用简化的Feng&Doolittle,J.Mol.Evol.35:351(1987)的渐进比对方法;该方法与Higgins&Sharp,CABIOS5:151(1989)所描述的方法类似。
有用算法的另一个例子是在Altschul et al.,J.Mol.Biol.215:403(1990)和Karlin et al.,Proc.Natl.Acad.Sci.USA 90:5873(1993)描述的BLAST算法。一种特别有用的BLAST程序是WU-BLAST-2程序,该程序得自Altschul et al.,Meth.Enzymol.,266:460(1996);blast.wustl/edu/blast/README.html。WU-BLAST-2使用多个搜索参数,优选地将其设置为默认值。所述参数是动态值,并且由程序本身根据特定序列的组成和正在搜索目标序列的特定数据库的组成来建立;但是,可以调整这些值以增加灵敏度。
另一种有用的算法是依据Altschul et al.,Nucleic Acids Res.25:3389(1997)的有缺口的BLAST。
氨基酸序列同一性百分比值由匹配的相同残基的数量除以比对区域中“较长”序列的残基总数确定。所述“较长”序列是在比对区域中具有最多实际残基的序列(忽略由WU-Blast-2引入的以最大化比对得分的缺口)。
以类似的方式,核酸序列同一性百分比定义为候选序列中核苷酸残基与本文具体公开的多核苷酸中的核苷酸相同的百分比。
比对可以包括在待比对的序列中引入的缺口。另外,对于含有比本文具体公开的多核苷酸更多或更少的核苷酸的序列,应当理解,在一个实施例中,序列同一性的百分比将基于相对于核苷酸总数的相同核苷酸的数目来确定。因此,例如,在一个实施例中,将使用较短序列中的核苷酸数目确定比本文具体公开的序列短的序列的序列同一性。在同一性百分比计算中,相对权重未分配给序列变异的各种表现形式,例如插入、删除、替换等。
在一个实施例中,仅对同一性进行肯定评分(+1),包括缺口在内的所有形式的序列变化被赋予值“0”,这免去了对如下所述的用于序列相似性计算的加权标度或参数的需要。例如,可以通过将匹配的相同残基的数量除以比对区域中“较短”序列的残基总数并乘以100来计算序列同一性百分比。“较长”序列是在比对区域中具有最多实际残基的序列。
如本文所使用的,“分离的”核苷酸(例如,“分离的DNA”或“分离的RNA”)是指分离的或基本上不含天然存在的生物体或病毒的至少一些其他组分的核苷酸,例如,通常发现的与所述核苷酸相关的细胞或病毒结构组分或其他多肽或核酸。
同样的,“分离的”多肽是指分离的或基本上不含天然存在的生物体或病毒的至少一些其他组分的多肽,例如,通常发现的与所述多肽相关的细胞或病毒结构组分或其他多肽或核酸。
“治疗性多肽”是可缓解或减轻由在细胞或受试者中缺乏蛋白质或蛋白质有缺陷导致的症状的多肽。或者,“治疗性多肽”是另外给予受试者益处的多肽,例如抗癌作用或移植存活性的改善。
如本文所使用的,应用于多核苷酸或多肽序列的术语“经修饰的”是指由于一个或多个缺失、添加、取代或其任意组合而与野生型序列不同的序列。
如本文所使用的,“分离”或“纯化”(或语法等同表示)病毒载体,是指病毒载体至少部分与起始材料中的至少一些其他组分分离。
术语“治疗(treat)”、“治疗(treating)”或“的治疗(treatment of)”(及其语法变体)是指受试者病情的严重程度降低、至少部分得到改善或稳定,和/或是指部分缓解、减轻、减少或者稳定至少一种临床症状和/或延缓疾病或病症的发展。
术语“预防(prevent)”、“预防(preventing)”和“的预防(prevention of)”(及其语法变体)是指防止和/或延缓受试者疾病、病症和/或临床症状的发作,和/或降低相对于没有采用本发明方法的情况下发生的疾病、病症和/或临床症状的发作的严重程度。预防可以是完全的,例如完全不再出现疾病、病症和/或临床症状。预防也可以是部分的,使得受试者的疾病、病症和/或临床症状的发生率和/或发作的严重程度低于未采用本发明的情况。
如本文所使用的,“治疗有效”量是足以为受试者提供一些改善或益处的量。或者说,“治疗有效”量是对受试者的至少一种临床症状提供一些缓解、减轻或者减弱或稳定的量。本领域技术人员将理解,治疗效果不需要是彻底的或治愈的,只要对受试者有一些益处即可。
本文所使用的“预防有效”量是相对于在没有本发明方法的情况下足以预防和/或延迟受试者的疾病、病症和/或临床症状的发作和/或减少和/或延迟受试者的疾病、病症和/或临床症状的发病严重程度的量。本领域技术人员将理解,预防水平不需要是彻底的,只要对受试者有一些益处即可。
术语“异源核苷酸序列”和“异源核酸”在本文中可以互换使用,是指非天然存在于病毒中的序列。在一些实施例中,异源核酸包含开放阅读框,其编码目标多肽或目标非翻译RNA(例如,用于递送至细胞或受试者)。
如本文所使用的,术语“病毒载体”、“载体”或“基因递送载体”指的是能用作核酸递送载体的病毒(例如,AAV)颗粒,其包含包装在病毒粒子中的载体基因组(例如,病毒DNA[vDNA])。或者,在某些情况下,术语“载体”可用于指单独的载体基因组/vDNA或指质粒。
本发明的病毒载体还可以是双链AAV颗粒,如国际专利公开WO 01/92551(其公开内容通过引用整体并入本文)中所描述的。因此,在一些实施例中,可以包装双链(双链体)基因组。
“rAAV载体基因组”或“rAAV基因组”是包含一种或多种异源核酸序列的AAV基因组(即,vDNA)。rAAV载体通常仅需要顺式145个碱基ITR来产生病毒。通常,rAAV载体基因组仅保留一个或多个ITR序列,以便使能被载体有效包装的转基因的大小最大化。结构和非结构蛋白编码序列可以反式提供(例如,从载体(例如质粒),或通过将序列稳定整合到包装细胞中)。在本发明的实施例中,rAAV载体基因组包含至少一个ITR序列(例如,AAV ITR序列),任选地两个ITR(例如,两个AAV ITR),其通常位于载体基因组的5’端和3’端并且侧接异源核酸,但不需要与其邻接。所述ITR可以彼此相同或不同。
“AAV反向末端重复”或“AAV ITR”可以来自任何AAV,包括但不限于血清型1、2、3a、3b、4、5、6、7、8、9、10、11或13,蛇AAV、鸟AAV、牛AAV、犬AAV、马AAV、绵羊AAV、山羊AAV、虾AAV或任何其他现在已知或以后发现的AAV(参见,例如,表1)。只要末端重复介导所需功能,例如,复制、病毒包装、整合和/或原病毒拯救等,AAV ITR不需要具有天然末端重复序列(例如,天然AAV ITR序列可通过插入、删除、截短和/或错义突变来改变)。
本发明的病毒载体还可以是“靶向的”病毒载体(例如,具有定向向性)和/或“杂合”AAV(即,其中病毒ITR和病毒衣壳来自不同的AAV),如在国际专利公开WO 00/28004和Chao et al.,(2000)Mol.Therapy 2:619中描述的。
此外,所述病毒衣壳或基因组元件可包含其他修饰,包括插入、删除和/或取代。
本文使用的术语“模板”或“底物”是指可以复制以产生AAV病毒DNA的多核苷酸序列。为了产生载体,所述模板通常嵌入较大的核苷酸序列或构建体中,包括但不限于质粒、裸DNA载体、细菌人工染色体(BAC)、酵母人工染色体(YAC)或病毒载体(例如,腺病毒、疱疹病毒、埃-巴二氏病毒(Epstein-Barr Virus)、AAV、杆状病毒、逆转录病毒载体等)。或者,可以将模板稳定地掺入包装细胞的染色体中。
如本文所使用的,AAV“Rep编码序列”表示编码介导病毒复制和新病毒颗粒产生的AAV非结构蛋白的核酸序列。所述AAV复制基因和蛋白质已描述于例如Fields et al.,Virology,volume 2,chapters 69&70(4th ed.,Lippincott-Raven Publishers)中。
所述“Rep编码序列”不需要编码所有的AAV Rep蛋白。例如,对于AAV,Rep编码序列不需要编码所有四种AAV Rep蛋白(Rep78、Rep 68、Rep52和Rep40),事实上,一般认为AAV5仅表达剪接的Rep68和Rep40蛋白。在代表性实施例中,Rep编码序列至少编码病毒基因组复制和包装成新病毒粒子所必需的那些复制蛋白。Rep编码序列通常编码至少一种大Rep蛋白(即Rep78/68)和一种小Rep蛋白(即Rep52/40)。在特定实施例中,Rep编码序列编码AAVRep78蛋白、AAV Rep52和/或Rep40蛋白。在其他实施例中,Rep编码序列编码Rep68、Rep52和/或Rep40蛋白。在又一个实施例中,Rep编码序列编码Rep68和Rep52蛋白、Rep68和Rep40蛋白、Rep78和Rep52蛋白,或Rep78和Rep40蛋白。
如本文所使用的,术语“大Rep蛋白”是指Rep68和/或Rep78。要求保护的本发明的大Rep蛋白可以是野生型或合成的。野生型大Rep蛋白可以来自任何AAV,包括但不限于血清型1、2、3a、3b、4、5、6、7、8、9、10、11或13或任何其他现在已知或以后发现的AAV(参见,例如,表1)。合成的大Rep蛋白可以通过插入、删除、截短和/或错义突变而改变。
本领域技术人员将进一步理解,复制蛋白不必由相同的多核苷酸编码。例如,对于AAV,p19启动子可以是灭活的,并且是从一种多核苷酸表达的大Rep蛋白以及是从不同的多核苷酸表达的小Rep蛋白。然而,通常,从单一构建体表达复制蛋白将更方便。在一些系统中,病毒启动子(例如,AAV p19启动子)可能不被细胞识别,因此有必要从单独的表达盒表达大Rep蛋白和小Rep蛋白。在其他情况下,可能需要分别表达大Rep和小Rep蛋白,即在单独的转录控制元件和/或翻译控制元件的控制下。例如,需要控制大Rep蛋白的表达,以降低大Rep蛋白与小Rep蛋白的比例。在昆虫细胞的情况下,下调大Rep蛋白(例如Rep78/68)的表达以避免对细胞的毒性是有利的(参见,例如,Urabe et al.,(2002)Human Gene Therapy13:1935)。
如本文所使用的,AAV“Cap编码序列”编码形成功能性AAV衣壳的结构蛋白(即,能包装DNA并感染靶细胞)。通常,Cap编码序列将编码所有AAV衣壳亚基,但是只要产生功能性衣壳,可以不编码所有衣壳亚基。通常但非必要地,Cap编码序列将存在于单个核酸分子上。
BERNARD N.FIELDS et al.,VIROLOGY,volume 2,chapters 69&70(4th ed.,Lippincott-Raven Publishers)中更详细地描述了AAV的衣壳结构。
如本文关于多肽结构域所使用的术语“大部分”(substantial portion)是指结构域中的大多数氨基酸残基(即,至少50%),例如,至少约80%或更多的残基,例如,至少85%、90%或95%的残基。关于被删除的大部分结构域,该结构域的剩余残基保留野生型结构域的生物活性的至少约20%,例如,小于约15%、10%或5%的生物活性。关于存在的大部分结构域,该结构域的残基保留野生型结构域的生物活性的至少约70%,例如,至少约80%、90%或95%的生物活性。
截短的Dysferlin多核苷酸和多肽
本发明提供了截短的dysferlin多肽和编码该多肽的多核苷酸。截短的多肽保留了野生型dysferlin的至少一部分生物活性,并且由于相对于野生型多核苷酸其长度减少,多核苷酸能够被包装到病毒基因组和病毒载体中。在某些实施例中,所述截短的多肽保留野生型dysferlin的至少约20%的生物活性,例如,至少约20%、30%、40%、50%、60%、70%、80%或90%或更高。所述保留的生物活性是肌膜完整性的维持,其可采用本领域公知的和本文公开的技术测量。
本发明的一个方面涉及编码截短的哺乳动物dysferlin多肽的多核苷酸,其中所述多肽的每个C2D和C2F结构域的至少大部分被删除。在一些实施例中,多肽的C2E结构域的至少大部分也被删除。在一些实施例中,多肽的C2B、C2C和C2D结构域中的一个或多个的至少大部分也被删除。所述删除可以是结构域的一些或全部被删除,例如,结构域的80%、85%、90%、95%或更多。所述删除可以在结构域的N端边界、结构域的C端边界、结构域的内部或它们的任意组合。
在某些实施例中,所述多核苷酸编码截短的dysferlin多肽,该多肽包含C2A、C2C、FerA、DysF、C2G和TM结构域的至少大部分,基本上由或由C2A、C2C、FerA、DysF、C2G和TM结构域的至少大部分组成。在某些实施例中,所述多核苷酸编码截短的dysferlin多肽,该多肽包含C2A、C2B、C2C、FerA、DysF、C2G和TM结构域的至少大部分,例如,每个结构域的大部分,例如所述结构域的80%、85%、90%、95%或更多,基本上由或由C2A、C2B、C2C、FerA、DysF、C2G和TM结构域的至少大部分组成,例如,每个结构域的大部分,例如所述结构域的80%、85%、90%、95%或更多。在某些实施例中,所述多核苷酸编码截短的dysferlin多肽,该多肽包含C2A、FerA、DysF、C2G和TM结构域的至少大部分,基本上由或由C2A、FerA、DysF、C2G和TM结构域的至少大部分组成。
在某些实施例中,编码截短的dysferlin的多核苷酸具有约5kb或更短的长度,例如约4.5kb、4kb或更短。在一些实施例中,所述多核苷酸是非天然存在的多核苷酸。
在一些实施例中,所述多核苷酸编码截短的dysferlin多肽,该多肽是哺乳动物dysferlin多肽,例如人dysferlin多肽。
所述dysferlin的核苷酸和氨基酸序列是本领域公知的,并且可以在数据库(例如GenBank)中找到。例如,在登记号AF075575.1下发现人dysferlin核苷酸序列,在登记号NP_003485.1下发现人dysferlin氨基酸序列。其他哺乳动物dysferlin氨基酸序列包括大鼠(NP_001101339.1)、小鼠(AAG17046.2)、牛(NP_001095960.1)、山羊(XP_013822998.1)、马(XP_008534159.1)、绵羊(XP_014949936.1)和狗(XP_003432282.1)。
所述dysferlin多肽的结构域结构是本领域公知的。如图1A所示,dysferlin包含以下结构域:C2A、C2B、C2C、FerA、DysF、C2D、C2E、C2F、C2G和TM。每个结构域的确切边界可能因直向同源物和变体而不同。人dysferlin中每个结构域的近似氨基酸范围表2中示出(氨基酸基于SEQ ID NO:11编号)。所列出的结构域边界可以在多达约20个残基上不同,例如约5、10、15或20个残基。
表2
结构域 氨基酸大小范围
C2A 1-124
C2B 219-352
C2C 366-515
FerA 670-782
DysF 864-1097
C2D 1137-1281
C2E 1314-1465
C2F 1579-1696
C2G 1789-1994
TM 2045-2067
在一些实施例中,所述多核苷酸是:
(a)包含与SEQ ID NOS:1-5中的任何一个至少80%相同(例如,至少约80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同)的序列的多核苷酸;
(b)包含与SEQ ID NOS:6-10中的任何一个至少80%相同(例如,至少约80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同)的编码多肽的序列的多核苷酸;或者
(c)由于密码子简并性而与(a)或(b)的多核苷酸的不同的多核苷酸。
在一些实施例中,所述多核苷酸是:
(a)包含与SEQ ID NOS:1-5中的任何一个相同的序列的多核苷酸;
(b)包含与SEQ ID NOS:6-10中的任何一个相同的编码多肽的序列的多核苷酸;或者
(c)由于密码子简并性而与(a)或(b)的多核苷酸的不同的多核苷酸。
本发明的另一方面是包含本发明的多核苷酸的表达盒。所述表达盒可以进一步包含增强截短的dysferlin多肽表达的元件。在一些实施例中,所述多核苷酸与启动子可操作地连接,例如通用启动子或肌肉特异性启动子或肌肉优选启动子。
本发明还提供了一种载体,例如,病毒载体,其包含本发明的多核苷酸或表达盒。所述病毒载体可以是细小病毒载体,例如AAV载体。本发明还提供了包含本发明的多核苷酸或表达盒的重组细小病毒颗粒(例如,重组AAV颗粒)。下面进一步讨论病毒载体和病毒颗粒。例如,由于存在修饰的衣壳蛋白,与野生型颗粒相比,所述病毒颗粒具有改变的向性。改变的趋向性可以是,但不限于,增加的肌肉靶向和/或降低的肝靶向。
本发明的其他方面涉及包含本发明的多核苷酸、表达盒和/或载体的转化细胞。
本发明的又一方面涉及包含本发明的多核苷酸、表达盒、载体和/或转化细胞的转基因动物。在一些实施例中,所述转基因动物是非人动物,例如非人哺乳动物,例如实验动物,例如小鼠、大鼠、狗或猴。在一些实施例中,所述动物是疾病的模型。
本发明的另一方面涉及截短的哺乳动物dysferlin多肽,其中所述多肽的每个C2D和C2F结构域的至少大部分被删除。在一些实施例中,所述多肽的C2E结构域的至少大部分也被删除。在一些实施例中,所述多肽的C2B、C2C和C2D结构域中的一个或多个的至少大部分也被删除。本发明的截短的多肽保留野生型dysferlin的至少一种生物活性(例如,维持肌肉完整性)的至少约20%,例如,至少一种生物活性的至少约20%、30%、40%、50%、60%、70%、80%、90%或更多。在一些实施例中,所述多肽是非天然存在的多肽。
在某些实施例中,所述多肽包含C2A、C2C、FerA、DysF、C2G和TM结构域的至少大部分,基本上由或由C2A、C2C、FerA、DysF、C2G和TM结构域的至少大部分组成。在某些实施例中,所述多肽包含C2A、C2B、C2C、FerA、DysF、C2G和TM结构域的至少大部分,基本上由或由C2A、C2B、C2C、FerA、DysF、C2G和TM结构域的至少大部分组成。在某些实施例中,所述多肽包含C2A、FerA、DysF、C2G和TM结构域的至少大部分,基本上由或由C2A、FerA、DysF、C2G和TM结构域的至少大部分组成。
在一些实施例中,所述dysferlin多肽是哺乳动物dysferlin多肽,例如人dysferlin多肽。
在一些实施例中,所述多肽是:
(a)由多核苷酸编码的多肽,该多核苷酸包含与SEQ ID NOS:1-5中的任何一个至少80%相同(例如,至少约80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同)的序列;或者
(b)包含与SEQ ID NOS:6-10中的任何一个至少80%相同(例如,至少约80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同)的序列的多肽。
在一些实施例中,所述多肽是:
(a)由多核苷酸编码的多肽,该多核苷酸包含与SEQ ID NOS:1-5中的任何一个相同的序列;或者
(b)包含与SEQ ID NOS:6-10中的任何一个相同的序列的多肽。
产生病毒载体的方法
本发明还提供了生成病毒载体的方法。在一个具体实施例中,本发明提供了一种产生重组AAV颗粒的方法,包括向允许AAV复制的细胞提供:(a)重组AAV模板,其包含(i)本发明的多核苷酸或表达盒,和(ii)ITR;(b)包含Rep编码序列和Cap编码序列的多核苷酸;在足以复制和包装重组AAV模板的条件下;由此在细胞中产生重组AAV颗粒。足以复制和包装重组AAV模板的条件可以是,例如,存在足以复制AAV模板并衣壳化成AAV衣壳的AAV序列(例如,AAV rep序列和AAV cap序列)和来自腺病毒和/或疱疹病毒的辅助序列。在特定实施例中,所述AAV模板包含两个AAV ITR序列,其位于本发明的多核苷酸的5’和3’,但它们不需要与其直接邻接。
在一些实施例中,所述重组AAV模板包含如国际专利公开WO 01/92551中所述的不会被Rep解析以制备双链AAV载体的ITR。
在一定条件下提供AAV模板、AAV rep和cap序列,使得包含包装在AAV衣壳内的AAV模板的病毒载体能在细胞中产生。该方法可以进一步包括从细胞中收集病毒载体的步骤。可以从培养基中和/或通过裂解细胞收集病毒载体。
所述细胞可以是能自由进行AAV病毒复制的细胞。可以使用本领域已知的任何合适的细胞。在特定实施例中,所述细胞是哺乳动物细胞(例如,灵长类动物或人类细胞)。作为替换,所述细胞可以是提供从复制缺陷型辅助病毒中缺失的功能的反式互补包装细胞系,例如293细胞或其他E1a反式互补细胞。
可以通过本领域已知的任何方法提供AAV复制和衣壳序列。现有方案中通常在单个质粒上表达AAV rep/cap基因。AAV复制和包装序列不需要一起提供,尽管这样做可能很方便。AAV rep和/或cap序列可以由任何病毒或非病毒载体提供。例如,rep/cap序列可以由杂合腺病毒或疱疹病毒载体提供(例如,插入缺失的腺病毒载体的E1a或E3区)。EBV载体也可用于表达AAV cap和rep基因。该方法的一个优点是EBV载体是附加型的,但在整个连续细胞分裂过程中将保持高拷贝数(即作为染色体外元件稳定整合到细胞中),称为“基于EBV的核附加体”,参见Margolski,(1992)Curr.Top.Microbiol.Immun.158:67)。
作为进一步的替换方案,rep/cap序列可以稳定地掺入细胞内。
一般来说,AAV rep/cap序列不会侧接TR,以防止这些序列的拯救和/或包装。
可以使用本领域已知的任何方法将AAV模板提供给细胞。例如,模板可以由非病毒(例如质粒)或病毒载体提供。在特定实施例中,所述AAV模板由疱疹病毒或腺病毒载体提供(例如,插入缺失的腺病毒的E1a或E3区)。作为另一个例子,Palombo et al.,(1998)J.Virology72:5025描述了携带侧翼为AAV TR的报告基因的杆状病毒载体。EBV载体也可用于递送模板,如上面关于rep/cap基因的描述。
在另一个代表性实施例中,所述AAV模板由复制型rAAV病毒提供。在其他实施例中,包含AAV模版的AAV原病毒能稳定整合到细胞的染色体中。
为了提高病毒滴度,通常向细胞提供能促进生产性AAV感染的辅助病毒功能(例如,腺病毒或疱疹病毒)。AAV复制所需的辅助病毒序列是本领域已知的。通常,这些序列由辅助腺病毒或疱疹病毒载体提供。作为替换,所述腺病毒或疱疹病毒序列可由另一种非病毒或病毒载体提供,例如作为携带了能促进有效AAV生产的所有辅助基因的非感染性腺病毒小质粒,如Ferrari et al.,(1997)Nature Med.3:1295和美国专利第6,040,183号和第6,093,570号所描述的。
此外,所述辅助病毒功能可由具有嵌入到染色体中或作为稳定的染色体外元件维持的辅助序列的包装细胞提供。一般来说,所述辅助病毒序列不能被包装进AAV病毒粒子中,例如不能被ITR侧接。
本领域技术人员将会理解,在单个辅助构建体上提供AAV复制和衣壳序列以及辅助病毒序列(例如腺病毒序列)是有利的。该辅助构建体可以是非病毒或病毒构建体。作为一个非限制性说明,所述辅助构建体可以是包含AAV rep/cap基因的杂合腺病毒或杂合疱疹病毒。
在一个特定实施例中,AAV rep/cap序列和腺病毒辅助序列由单个腺病毒辅助载体提供。该载体还包含AAV模板。可将AAV rep/cap序列和/或AAV模板插入腺病毒的缺失区(例如E1a或E3区)。
在另一个实施例中,AAV rep/cap序列和腺病毒辅助序列由单个腺病毒辅助载体提供。根据该实施例,所述AAV模板可以作为质粒模板提供。
在另一个说明性实施例中,AAV rep/cap序列和腺病毒辅助序列由单个腺病毒辅助载体提供,并且所述AAV模板作为原病毒被整合到细胞中。或者,所述AAV模板由作为染色体外元件维持在细胞内的EBV载体提供(例如,作为基于EBV的核附加体)。
在进一步的示例性实施例中,所述AAV rep/cap序列和腺病毒辅助序列由单个腺病毒辅助体提供。所述AAV模板作为单独的复制型病毒载体提供。例如,所述AAV模板可以由AAV颗粒或第二重组腺病毒颗粒提供。
根据前述方法,杂合腺病毒载体通常包含足以用于腺病毒复制和包装(即,腺病毒末端重复序列和PAC序列)的腺病毒5’和3’顺式序列。所述AAV rep/cap序列和AAV模板(如果存在的话)嵌入腺病毒骨架中,并且侧接5'和3'顺式序列,从而可以将这些序列包装进腺病毒衣壳中。如上所述,所述腺病毒辅助序列和AAV rep/cap序列通常不被ITR侧接,使得这些序列未被包装到AAV病毒粒子中。
Zhang et al.,((2001)Gene Ther.18:704-12)描述了包含腺病毒和AAV rep和cap基因的嵌合辅助子。
疱疹病毒也可以在AAV包装方法中用作辅助病毒。编码AAV Rep蛋白的杂合疱疹病毒可以有利地促进可扩大的AAV载体生产方案。已经描述了表达AAV-2rep和cap基因的杂合单纯疱疹病毒I型(HSV-1)载体(Conway et al.,(1999)Gene Ther.6:986和WO 00/17377)。
作为进一步的替换方案,可以使用杆状病毒载体在昆虫细胞中生成本发明的病毒载体,以递送rep/cap基因和AAV模板,例如Urabe et al.,(2002)Human Gene Ther.13:1935-43所描述的。
可通过本领域已知的任何方法获得不含污染辅助病毒的AAV载体原种。例如,AAV和辅助病毒能够很容易地根据大小进行区分。根据对肝素底物的亲和力,AAV也可以与辅助病毒分离(Zolotukhin et al.(1999)Gene Therapy 6:973)。可使用缺失的复制缺陷型辅助病毒,这样任何污染性辅助病毒不具有复制能力。作为进一步的替换方案,可以使用缺乏晚期基因表达的腺病毒辅助体,因为仅需要腺病毒早期基因表达来介导AAV的包装。晚期基因表达缺陷的腺病毒突变体是本领域已知的(例如,ts100K和ts149腺病毒突变体)。
重组病毒载体
本发明的病毒载体可用于将编码dysferlin的多核苷酸递送至体外、离体和体内细胞。特别地,所述病毒载体可以有利地用于将多核苷酸递送或转移至动物,包括哺乳动物、细胞。
本领域技术人员将会理解,编码dysferlin的多核苷酸可以与合适的控制序列可操作地结合起来。例如,所述编码dysferlin的多核苷酸可以与表达控制元件(比如转录/翻译控制信号、复制起点、聚腺苷酸化信号、内部核糖体进入位点(IRES)、启动子和/或增强子等)可操作地结合。
本领域技术人员将理解,根据所期望的水平和组织特异性表达,可以使用各种启动子/增强子元件。根据所期望的表达模式,启动子/增强子可以是组成型或诱导型的。所述启动子/增强子可以是天然的或外源的,可以是天然的或合成的序列。采用外源的时,这表示在引入转录起始区的野生型宿主中不存在引入转录起始区。
在具体实施例中,所述启动子/增强子元件可以是待治疗的靶细胞或受试者天生的。在代表性实施例中,所述启动子/增强子元件可以是编码dysferlin的多核苷酸天生的。所述启动子/增强子元件通常是经过选择的,使其可以在目标靶细胞中起作用。此外,在具体实施例中,所述启动子/增强子元件是哺乳动物启动子/增强子元件。所述启动子/增强子元件可以是组成型或诱导型的。在一些实施例中,所述启动子是肌肉特异性或优选的(包括心肌、骨骼肌和/或平滑肌特异性或优选的)启动子。
诱导型表达控制元件在希望对异源核酸序列过表达进行调控的那些应用中通常是有利的。用于基因递送的诱导型启动子/增强子元件可以是组织特异性或组织优选的启动子/增强子元件,并且包括肌肉特异性或肌肉优选的(包括心肌、骨骼肌和/或平滑肌特异性的或优选的)启动子/增强子元件。其他诱导型启动子/增强子元件包括激素诱导型和金属诱导型元件。示例性的诱导型启动子/增强子元件包括但不限于Tet开/关元件、RU486诱导型启动子、蜕皮激素诱导型启动子、雷帕霉素诱导型启动子和金属硫蛋白启动子。
在其中编码dysferlin的多核苷酸被转录然后在靶细胞中被翻译的实施例中,通常包含特异性起始信号来有效翻译插入的蛋白质编码序列。这些外源翻译控制序列(包括ATG起始密码子和邻近序列)可以有多种来源,天然的和合成的都可以。
根据本发明所述的病毒载体提供了用于将编码dysferlin的多核苷酸递送进入各种细胞中(包括分裂和非分裂细胞)的方法。所述病毒载体可用于将编码dysferlin的多核苷酸递送至体外细胞,例如,以在体外产生多肽或用于离体基因治疗。所述病毒载体还可用在将编码dysferlin的多核苷酸递送至有需要的受试者(例如)以表达dysferlin的方法中。通过这种方式,dysferlin可以在受试者体内产生。所述受试者应当需要dysferlin,因为受试者缺乏该种多肽。此外,该方法可以实施,因为在受试者体内产生dysferlin可以产生一些有益效果。
所述的病毒载体也可用于在培养的细胞或受试者中产生dysferlin(例如,利用所述受试者作为生物反应器以产生所述多肽)。
一般而言,本发明的病毒载体可用于递送编码dysferlin的多核苷酸以治疗和/或预防任何疾病状态,对于所述疾病递送dysferlin是有益的。在一些实施例中,所述疾病状态是dysferlin肌病和/或与dysferlin肌病相关的任何症状。如本文所使用的,术语“dysferlin疾病(dysferlinopathy)”是指与dysferlin的异常表达相关的任何疾病、紊乱或病症。最常见的与dysferlin肌病有关的临床表现包括肢带肌营养不良症(LGMD2B)、Miyoshi肌病、胫骨前发作的远端型肌病(DMAT)、近远端型肌无力、假代谢性肌病和高肌酸激酶血症。
根据本发明的病毒载体可用于诊断和筛选方法中,通过这些方法dysferlin可瞬时地或稳定地在细胞培养系统中或者作为替换在转基因动物模型中表达。
本发明的病毒载体也可用于多种非治疗性用途,包括但不限于用于各种方案中来评估基因打靶、清除率、转录、翻译等等,这对本领域技术人员而言是显而易见的。该病毒载体也可用于评估安全性(传播性、毒性、免疫原性等)。例如,这些数据被美国食品和药物管理局视为在评估临床疗效之前的监管批准过程的一部分。
受试者、药物制剂和施用方式
根据本发明的病毒载体和衣壳可用于兽医和医学应用中。合适的受试者包括禽类和哺乳动物。本文所用的术语“鸟”包括但不限于鸡、鸭、鹅、鹌鹑、火鸡、野鸡、鹦鹉、长尾小鹦鹉等。本文所用的术语“哺乳动物”包括但不限于人、非人灵长类动物、牛、绵羊、山羊、马、猫、犬、兔类动物等。人受试者包括新生儿、婴儿、青少年和成人。所述受试者可以是需要本发明的方法的,即已被诊断为患有或疑似患有dysferlin肌病。
在具体的实施例中,本发明提供了药物组合物,其包含在药学上可接受的载体中的本发明的病毒载体和/或衣壳,以及任选的其他药用制剂、药物制剂、稳定剂、缓冲剂、载体、佐剂、稀释剂等。用于注射时,所述载体通常是液体。对于其他给药方法,载体可以是固体或液体。对于吸入给药,载体将是可吸入的,并且任选地可为固体或液体颗粒形式。
“药学上可接受的”是指没有毒性或其他不良效应的材料,即该材料可以施用给受试者而不会引起任何不希望的生物学效应。
本发明的一个方面是将编码dysferlin多核苷酸转移或递送至体外细胞的方法。根据适用于特定靶细胞的标准转导方法,可以以合适的感染复数将病毒载体引入细胞。根据靶细胞类型和数量以及特定的病毒载体,施用病毒载体的滴度可以不同,并且可以由本领域技术人员确定而无需过多实验。在代表性实施例中,将至少约103个感染单位,更优选至少约105个感染单位引入细胞。
所述病毒载体引入其中的细胞可以是任何类型的,包括但不限于肌细胞(例如骨骼肌细胞、心肌细胞、平滑肌细胞和/或隔膜肌细胞)。在代表性的实施例中,所述细胞可以是任何祖细胞。作为进一步的可能方案,所述细胞可以是干细胞(例如肌肉干细胞)。此外,所述细胞可以来自如上所述的任何来源的物种。
为了将修饰的细胞施用给受试者,可将病毒载体引入体外细胞。在具体的实施例中,所述细胞已经从受试者体内移出,病毒载体被引入其中,然后将细胞重新施用到受试者体内。从受试者体内移出细胞以进行离体操作,接着将其放回受试者体内的方法是本领域已知的(参见例如美国专利第5,399,346号)。作为替换方案,可以将重组病毒载体引入来自供体受试者的细胞中,引入培养的细胞中或者引入来自任何其他合适来源的细胞中,并将所述细胞施用给有需要的受试者(即“受体”受试者)。
用于离体基因递送的合适细胞如上文所述。施用给受试者的细胞剂量将随受试者的年龄、状况和种族以及细胞类型、细胞表达的核酸、施用模式等有所变化。通常,施用在药学上可接受的载体中的每一剂量时将有至少约102至约108个细胞或至少约103至约106个细胞被施用。在具体的实施例中,用病毒载体转导的细胞以治疗有效量或预防有效量与药物载体组合施用给受试者。
本发明的又一方面是将病毒载体施用给受试者的方法。可以采用本领域已知的任何手段将本发明的病毒载体和/或衣壳施用给有需要的人类受试者或有需要的动物。任选地,所述病毒载体和/或衣壳是在药学上可接受的载体中以治疗有效剂量或预防有效剂量递送。
待施用给受试者的病毒载体和/或衣壳的剂量取决于施用模式、待治疗和/或要预防的疾病或病症、个体受试者的状况、具体的病毒载体或衣壳,以及待递送的核酸等等,并且它们可以以常规方式确定。达到治疗效果的示例性剂量是滴度为至少约105、106、107、108、109、1010、1011、1012、1013、1014、1015、1016、1017、1018个转导单位,任选地约108-1015个转导单位。
在具体的实施例中,所述施用可以超过一次(例如,2次、3次、4次或更多次施用),以在各种时间间隔的时间段(例如每小时、每天、每周、每月、每年等等)实现期望的基因表达水平。
示例性的施用模式包括口服、直肠、经粘膜、鼻内、吸入(例如采用气雾剂)、含服(例如舌下)、阴道、鞘内、眼内、透皮、内皮内(intraendothelial)、子宫内(或卵内)、肠胃外(例如,静脉内、皮下、皮内、颅内、肌肉内[包括施用至骨骼肌、隔膜肌和/或心肌]、胸膜内、大脑内和关节内)、局部(例如,施用至皮肤和粘膜表面,包括气道表面,和经皮施用)、淋巴内等,以及直接组织或器官注射(例如,施用至肝、眼睛[包括玻璃体内和视网膜下]、骨骼肌、心肌、膈肌或大脑)。
施用可以是在受试者的任何部位,包括但不限于选自由脑、骨骼肌、平滑肌、心脏、膈膜、气道上皮、肝脏、肾脏、脾脏、胰腺、皮肤和眼睛组成的组中的部位。
根据本发明的施用至骨骼肌包括但不限于施用至四肢的骨骼肌(例如,上臂、下臂、大腿和/或小腿)、背部、颈部、头部(例如,舌头)、胸部、腹部、骨盆/会阴,和/或手指。合适的骨骼肌包括但不限于小指外展肌(手上)、小趾外展肌(足部)、外展拇趾(指)肌、第五趾(指)展肌(abductor ossis metatarsi quinti)、拇短展肌、拇长展肌、内收短肌、拇收肌、长收肌、大收肌、拇内收肌、肘肌、前斜角肌(anterior scalene)、膝关节肌、肱二头肌、股二头肌、肱肌、肱桡肌、颊肌、喙肱肌、皱眉肌、三角肌、口角降肌、降下唇肌、二腹肌、背侧骨间肌(手上)、背侧骨间肌(足部)、桡侧腕短伸肌、桡侧腕长伸肌、尺侧腕伸肌、小指(趾)伸肌、指(趾)伸肌、趾(指)短伸肌、趾(指)长伸肌、拇短伸肌、拇长伸肌、食指伸肌、拇短伸肌、拇长伸肌、桡侧腕屈肌、尺侧腕屈肌、小指短屈肌(手上)、小趾短屈肌(足部)、趾(指)短屈肌、趾(指)长屈肌、指(趾)深屈肌、指(趾)浅屈肌、拇短屈肌、拇长屈肌、拇短屈肌、拇长屈肌、额肌、腓肠肌、颏舌骨肌、臀大肌、臀中肌、臀小肌、股薄肌、颈髂肋肌、腰髂肋肌、胸髂肋肌、髂肌、下孖肌、下斜肌、下直肌、闪下肌、棘间肌、横突间肌、翼外肌、外直肌、背阔肌、提口角肌、提上唇肌、上唇鼻翼提肌、提上睑肌、肩胛提肌、长回旋肌、头最长肌、颈最长肌、胸最长肌、头长肌、颈长肌、蝴状肌(手上)、蝴状肌(足部)、咬肌、翼内肌、内直肌、中斜角肌、多裂肌、下颂舌骨肌、头下斜肌、头上斜肌、闭孔外肌、闭孔内肌、枕肌、肩胛舌骨肌、小指对掌肌、拇指(趾)对掌肌、眼轮匝肌、口轮匝肌、骨间掌侧肌、掌短肌、掌长肌、耻骨肌、胸大肌、胸小肌、腓骨短肌、腓骨长肌、第三腓骨肌、梨状肌、骨间足底肌、跖肌、颈阔肌、胭肌、后斜角肌、旋前方肌、旋前圆肌、腰大肌、股方肌、足底方肌、头前直肌、头侧直肌、头后大直肌、头后小直肌、股直肌、大菱形肌、小菱形肌、笑肌、缝匠肌、小斜角肌、半膜肌、头半棘肌、颈半棘肌、胸半棘肌、半腱肌、前锯肌、短回旋肌、比目鱼肌、头棘肌、颈棘肌、胸棘肌、头夹肌、颈夹肌、胸锁乳突肌、胸骨舌骨肌、胸骨甲状肌、茎舌骨肌、锁骨下肌、肩胛下肌、上孖肌、上斜肌、上直肌、旋后肌、闪上肌、颞肌、阔筋膜张肌、大圆肌、小圆肌、胸肌、甲状舌骨肌、胫骨前肌、胫骨后肌、斜方肌、肱三头肌、股中间肌、股外侧肌、股内侧肌、颧大肌和颧小肌和本领域已知的任何其它合适的骨骼肌。
所述病毒载体可以通过静脉内施用、动脉内施用、腹膜内施用、肢体灌注(任选地,腿和/或臂的隔离肢体灌注;参见,例如,Arruda et al.,(2005)Blood 105:3458-3464),和/或直接肌内注射。在特定实施例中,通过肢体灌注(任选地分离肢体灌注(例如,通过静脉内施用或关节内施用))将病毒载体和/或衣壳施用给受试者(例如,患有dysferlin肌病的受试者)的四肢(手臂和/或腿)。在本发明的实施例中,本发明的病毒载体和/或衣壳可以有利地施用而无需采用“流体动力学”技术。现有技术载体的组织递送(例如,至肌肉)通常通过流体动力学技术(例如,大体积静脉内/静脉内施用)来增强,其增加脉管系统中的压力并提高载体穿过内皮细胞屏障的能力。在特定的实施例中,本发明的病毒载体和/或衣壳可以在不使用流体动力学技术(例如,大体积输注和/或升高的血管内压力(例如,大于正常的收缩压,例如,血管内压力比正常收缩压增加小于或等于5%、10%、15%、20%、25%)的情况下施用。这些方法可以减少或避免与水动力学技术相关的副作用,例如水肿、神经损伤和/或筋膜室综合征。
施用至心肌包括施用至左心房、右心房、左心室、右心室和/或隔膜。所述病毒载体和/或衣壳可通过静脉内施用、动脉内施用(如主动脉内施用)、直接心脏注射(例如,注射到左心房、右心房、左心室、右心室)和/或或冠状动脉灌注。
施用至膈肌可以是通过任何合适的方法,包括静脉内施用、动脉内施用,和/或腹膜内施用。
施用至平滑肌可以是通过任何合适的方法,包括静脉内施用、动脉内施用,和/或腹膜内施用。在一个实施例中,施用可以施用至存在于平滑肌中、平滑肌附近和/或平滑肌上的内皮细胞。
递送至靶组织可还通过递送包含所述病毒载体和/或衣壳的贮库来实现。在代表性实施例中,将包含病毒载体和/或衣壳的贮库植入骨骼肌、心肌和/或膈肌组织中,或者可以使所述组织与包含病毒载体和/或衣壳的膜或其他基质接触。这类可植入基质或底物的示例在美国专利第7,201,898号中有所描述。
在具体实施例中,根据本发明的病毒载体施用于骨骼肌、膈肌和/或心肌(例如,以治疗和/或预防dysferlin肌病)。
在代表性的实施例中,本发明用于治疗和/或预防骨骼肌、心肌和/或膈肌的病症。
在代表性实施例中,本发明提供治疗和/或预防有需要的受试者的dysferlin肌病的方法,该方法包括:向哺乳动物受试者施用治疗有效量或预防有效量的本发明的病毒载体,其中所述病毒载体包含编码dysferlin、mini-dysferlin或micro-dysferlin的多核苷酸。在特定实施例中,所述病毒载体可以如本文其他地方所述的施用于骨骼肌、膈肌和/或心肌。
注射剂可以制备成常规形式,可以是液体溶液或悬浮液,适于在注射前溶解或悬浮在液体中的固体形式,或者是乳液。作为替换方案,本发明的病毒载体和/或病毒衣壳可以局部施用,而不用全身施用,例如,以贮库或缓释制剂施用。此外,所述病毒载体和/或病毒衣壳可以附着于可手术植入的基质上进行递送(例如,如美国专利公开号2004-0013645中所描述的)。
上文已经描述了本发明,其将在下面的实施例中得到更详细地解释,包含在本发明中的这些实施例仅用于说明目的,它们不用于对本发明进行限制。
实施例1
截短的dysferlin
制备若干截短的人dysferlin克隆体。序列和结构域如下所述。残基编号基于人dysferlin同种型8(NP_003485.1)(SEQ ID NO:11)。克隆体的氨基酸序列的比对显示在表3中(SEQ ID NO:6-11)。每个克隆体在体外细胞中表达并且证明了产生dysferlin多肽。
野生型人dysferlin(同种型8)(SEQ ID NO:11)
[C2A,1:124];[125:218];[C2B,219:352];[353:365];[C2C,366:515];[516:669];
[FerA,670:782];[783:863];[DysF,864:1097];[1098:1136];[C2D,1137:1281];
[1282:1313];[C2E,1314:1465];[1466:1578];[C2F,1579:1696];[1697:1788];
[C2G,1789:1994];[1995:2044];[TM,2045:2067];[2068:2080]
野生型dysferlin结构域汇总:C2A、C2B、C2C、FerA、DysF、C2D、C2E、C2F、C2G、TM
克隆_318无Flag(433)(SEQ ID NO:6)
[C2A,1:124];[147:155];[157:166];[172:180];[187:192];[199:205];[C2B,222:352];
[353:365];[C2C,366:515];[566:619];[FerA,670:782];[831:863];[DysF-a,864:891];
[DysF-b,942:1097][1098:1104][1282:1313];[C2E,1314:1465];[1496:1517];
[1523:1532];[1538:1548];[C2F,1579:1696];[1718];[1724:1741];[1747:1765];
[C2G,1792:1994];[2000:2003];[2018:2030];[2036:2044];[TM,2045:2067];
[2068:2080]
克隆_318结构域汇总:C2A、C2B、C2C、FerA、DysF*、C2E、C2F、C2G、TM
克隆_431无Flag(431)(SEQ ID NO:7)
[C2A,1:124];[125:218];[C2B,219:352];[353:365];[C2C,366:515];[516:669];
[FerA,670:782];[783:863];[DysF,864:1097];[1098:1136];[C2G,1789:1823];
[C2G*,1824:1836=TKGAFGDMLDTP-];[C2G,1837:(C1884A):1994];
[1995:2044];[TM,2045:2067];[2068:2080]
克隆_431结构域汇总:C2A、C2B、C2C、FerA、DysF、C2G*、TM
克隆_430无Flag(430)(SEQ ID NO:8)
[C2A,1:124];[125:218];[357:365];[C2C,366:515];[516:669];[FerA,670:782];
[783:863];[DysF,864:1097];[1098:1136];[C2G,1789:(C1884A):1994];[1995:2044];
[TM,2045:2067];[2068:2080]
克隆_430结构域汇总:C2A、C2C、FerA、DysF、C2G、TM
克隆_342无Flag(426)(SEQ ID NO:9)
[C2A,1:124];[125:218];[C2C,366:515];[516:669];[FerA,670:782];[783:863];
[DysF,864:1097];[1098:1136];[C2F,1579:1696];[1697:1788];
[C2G,1789:(C1884A):1994];[1995:2044];[TM,2045:2067];[2068:2080]
克隆_342结构域汇总:C2A、C2C、FerA、DysF、C2F、C2G、TM
克隆_425无Flag(425)(之前为341)(SEQ ID NO:10)
[C2A,1:124];[125:218];[C2B,219:352];[353:365];[C2C,366:515];[516:669];
[FerA,670:782];[783:863];[DysF,864:1097];[1098:1136];
[C2G,1789:(C1884A):1994];[1995:2044];[TM,2045:2067];[2068:2080]
克隆_425结构域汇总:C2A、C2B、C2C、FerA、DysF、C2G、TM
*-表示所述结构域范围相对于野生型结构域范围的中断。
表3(分别为SEQ ID NOS:11、6、7、8、9、10)
实施例2
截短的dysferlin的体内作用
在构建更小的dysferlin基因的在先实验中忽视了以下事实:由于不适当的截短,部分折叠的蛋白质结构域可能掩盖了更小基因的任何治疗价值。为了改善这个问题,合理定义dysferlin的每个结构域,我们仔细观察了C2结构域的结构特点。dysferlin中的七个C2结构域中的每个由八个预测b链、C2结构域拓扑结构、Ca2+结合位点的完整性以及(如果适用的话)在结构域的核心中的疏水堆积的连续性定义(表2)。构建纳米Dysferlin的总体理念基于三个规则。首先,在所有构建体中ferlin家族成员FerA和DysF的核心特征保持完整。其次,在所有构建体中保留了跨膜区C2G的第一个C2A结构域和C2结构域。第三,多个串联C2结构域单独贡献整体膜亲合力。鉴于这些规则,随后训练C2结构域识别折叠结构域和将其与其他可能的折叠结构域连接起来的柔性接头。这三条规则构建了紧凑的、潜在的治疗dysferlin变体(纳米Dysferlin(克隆425)),据预测其能被有效包装到单个AAV衣壳(开放阅读框[ORF]4,356nt)中。
纳米Dysferlin在哺乳动物细胞中的表达
纳米Dysferlin是基于野生型(WT)dysferlin同种型8cDNA(6,240nt),其包含结构域C2A-C2B-C2C-FerADysF-C2D-C2E-C2F-C2G-TM(图1A)。最初,进行膜相关或可溶性蛋白质裂解物的蛋白质印迹以确定在C2C12成肌细胞中转染后的纳米Dysferlin分布。对于这些实验,全长dysferlin和GFP表达盒分别用作阳性和阴性对照。结果表明,纳米Dysferlin以其预期大小(160kDa)生成单链,并且与其母体分子dysferlin一样,纳米Dysferlin是膜和膜囊泡相关蛋白(图1B)。在转染的人HeLa细胞中的纳米Dysferlin的免疫荧光证明蛋白质分布和丰度与野生型dysferlin类似,都分布在整个细胞中,与在膜囊泡中类似,如先前已经报道过的(Han et al.,J.Clin.Invest.117:1805(2007);Bansa et al.Nature 423:168(2003))(图1C)。在dysferlin患者成肌细胞中的体外毒性实验中,在递增的质粒DNA的转染剂量下,纳米Dysferlin或dysferlin过表达后通过alamar Blue显示没有毒性(图1D)。
使用弱启动子的完整AAV转导比使用强启动子的片段AAV更有效率
为找到用于体内研究的最有效的疗法,评价了具有较强CMV启动子的片段AAV与具有较小弱JeT启动子的完整AAV的纳米Dysferlin(Nano-Dysferlin)蛋白质的产生。CMV-Nano-Dysferlin的盒大小为5,597nt,而JeT Nano-Dysferlin的大小理论上为4,849nt,在AAV衣壳包装的容量内(et al.,Gene 297:21(2002))(图2A)。为了确定质粒环境中每个盒的纳米Dysferlin蛋白质的产生,在HEK293细胞转染后进行蛋白质印迹。如所预期的,与小JeT启动子相比,较大的CMV启动子产生多大约15倍的纳米Dysferlin(etal.,Gene 297:21(2002))(图2B)。在给定的现有AAV包装条件下,假设5.6kb的CMV-Nano-Dysferlin盒将产生片段AAV,而较小的JeT盒可以在AAV2衣壳中包装为4.85kb的完整基因组。为了研究这一点,通过碱性凝胶电泳分离衣壳包装的DNA物种,然后用SYBR金染色。对于更小的JeT盒观察到预期尺寸的单个DNA物种,而从较大的CMV启动子表达的纳米Dysferlin能实现尺寸范围在约3.5-4.5kb内(远小于预期的5.6-kb基因组)的异源DNA物种的包装(图2C)。与完整AAV相比,片段AAV转导的效率显著降低5至100倍(Hirschet al.,Mol.Ther.21:2205(2013);Hirsch et al.,PLoS ONE 4:e7705(2009))。为确定CMV启动子(比JeT启动子强得多(图2))是否可以克服片段AAV的效率降低,在递增的剂量下进行转导后通过蛋白质印迹测定纳米Dysferlin的丰度。尽管启动子强度的差异有利于CMV,但当以递增剂量施用时,与片段AAV2-CMV-Nano-Dysferlin相比,完整的AAV2-JeT-Nano-Dysferlin载体转导显示出优异的蛋白质产量(图2D)。考虑到包装转基因DNA的定义性质(图2C)、增大的完整AAV载体转导的效率(图2D)、设想的全身临床静脉内(IV)施用,和潜在的临床上在高剂量下对载体不期望的免疫应答,我们选择更高效率的完整的基于JeT-Nano-Dysferlin的载体进行剩下的体外研究。
AAV-Nano-Dysferlin肌肉注射后改善肌肉完整性
接下来,由于AAV1衣壳具有广泛的肌肉转导能力,使用AAV1衣壳肌肉注射后进行A盲法试验考察AAV-Nano-Dysferlin的安全性和效力。向6周龄dysferlin缺陷型(BLA/J)小鼠的TA注射AAV1-JeT-Nano-Dysferlin,其对侧腿注射AAV1-CMV-GFP作为对照。在第9周,处死前40小时,小鼠腹膜内注射伊文思蓝染料(结合纤维内白蛋白的肌肉损伤标志物),帮助检测在受损的肌肉纤维的肌膜中的断裂(Matsudaet al.,J.Biochem.118:959(1995))。根据截面中归一化至总纤维的阳性纤维计数,在个别BLA/J小鼠之间观察到AAV1-GFP对照肌肉的伊文思蓝染料阳性纤维中有变化,这表明遗传上相同的小鼠中疾病严重程度不同(图3A,“GFP”)。如先前报道的,这与人dysferlin肌病患者的早期疾病变异性一致(Nguyen etal.,Hum.Mutat.26:165(2005))。尽管小鼠之间采用对照载体治疗的TA之间出现基线的变化,在每只小鼠中,与每只小鼠的对侧GFP对照相比,每块用AAV1-JeT-Nano-Dysferlin治疗的肌肉经证实具有更少的伊文思蓝染料阳性纤维(图3A)。总的来说,通过配对双尾t检验表明经治疗和对照肌肉的小鼠群之间存在显著差异,p=0.005(图3A)。通过切片的H&E染色测定中心成核(肌肉再生的标志物,由其间接表明肌肉纤维更新)的数量。数据表明,与内部AAV1-GFP对照相比,除了注射了AAV1-Jet-Nano-Dysferlin的TA肌肉,所有TA肌肉的中心成核均减少(图3B;双尾t检验,p=0.0125)。经AAV治疗的肌肉也表现出明显改善的组织学(图3C)。免疫荧光在大约30%的肌肉纤维中检测到纳米Dysferlin;但是,与从内源性dysferlin观察到的肌膜优势相比,其在每个肌肉纤维中的分布更加分散。这是一种常见的但令人费解的观察结果,与针对dysferlin缺陷型小鼠的dysferlin基因添加研究的报道一致(Lostal et al.,Hum.Mol.Genet.19:1897(2010);Sondergaard et al.,Ann.Clin.Transl.Neurol.2:256(2015);Grose et al.,WPLoS ONE 7:e39233(2012))(图3D)。
AAV-Nano-Dysferlin全身注射后能改善运动机能
Dysferlin肌病的BLA/J小鼠模型与人类病症不同,在大约12个月龄大时,根据运动挑战和捕获敏感性测试,显著表现出的仅仅是轻度的运动缺陷(Nagy et al.,Physiol.Rep.5:e13173(2017))。一直以来,人类dysferlin肌病通常在12岁之后变得明显,在较小年龄具有正常或甚至增强的运动能力。在模拟诊断时间和随后的人治疗窗口的试验中,用AAV9-JeT-NanoDysferlin(n=6)或AAV9-CMV-GFP对照载体(n=4)以剂量1e11个病毒基因组对BLA/J小鼠进行全身治疗。在第39周测量AAV9-Nano-Dysferlin群的血液肌酸激酶活性(通常在肌营养不良症中升高的标志物)(Cabaniss(1990).Creatine kinase.InClinical Methods:The History,Third Edition,H.K.Walker,W.D.Hall,and J.W.Hurst,eds.(Butterworths)),通过非配对t检验和Welch校正表现出非显著的降低但趋势是降低(p值=0.13)(图4A)。基于先前发现的老年BLA/J小鼠随时间延长减少站立(利用两个后肢站立并将爪子/头悬在空中的能力)的发现,在43周龄时,观察该群的站立活动,大致在注射后5个半月(Nagy et al.,Physiol.Rep.5:e13173(2017))。通过t检验和Welch校正,这些数据表明仅注射AAV9-JeT-Nano-Dysferlin的小鼠的总站立数显著增加,1小时内平均>200次以上(P=0.037)(图4B)。此外,重复测量并通过ANOVA分析时,随时间延长的站立表现分析表明注射AAV9-Jet-Nano-Dysferlin的小鼠没有疲劳并且保持恒定水平的站立,而注射AAV9-CMV-GFP的小鼠的表现随时间减少(p=0.039)(图4C)。在第一个30分钟,水平活动量显示无显著差异(p=0.58);但是在评价的最后30分钟,通过t检验,在纳米Dysferlin治疗的小鼠中观察到非显著的(p=0.13)但趋势为增大的水平活动量。与C56B7小鼠相比,在BLA/J dysferlin肌病小鼠模型中观察到这种早期“疲劳”的倾向(Nagyet al.,Physiol.Rep.5:e13173(2017))。
AAV-Nano-Dysferlin在全身注射后改善肌肉完整性
在第54周将上述用于测试运动机能中所描述的全身治疗组群处死,大约为在4.5月龄的单次注射后8个月。在安乐死之前施用伊文思蓝染料,并且进行全肌测定分析和按组织结构以纤维并纤维(fiber-by-fiber)的方式单独分析染料吸收(受损肌肉的指示)(Matsudaet al.,J.Biochem.118:959(1995))。使用臀肌和腰肌进行全肌伊文思蓝染色测定,在之前的工作中已确定臀肌和腰肌在BLA/J小鼠中受影响最大(Nagyet al.,Physiol.Rep.5:e13173(2017))。在该测定中,较高的吸光度表明增加的染料吸收增加和更大的肌肉损伤(Matsudaet al.,J.Biochem.118:959(1995))。我们之前的研究认为在BLA/J小鼠模型中臀肌受影响最大(Nagyet al.,Physiol.Rep.5:e13173(2017)),通过t检验和Welch校正,与对照相比,由AAV9-JeT-Nano-Dysferlin治疗的小鼠的伊文思蓝染料吸收显著更低(P=0.037)(图5B)。同时,腰肌的分析表明,通过t检验和Welch校正,与对照相比(n=4),由AAV9-JeT-Nano-Dysferlin治疗的小鼠的伊文思蓝染料全肌有不显著的降低趋势(p=0.11)(图6A-6B)。为确认伊文思蓝染料全肌分析,根据组织结构对伊文思蓝染料阳性纤维直接计数并归一化至总纤维数,AAV9-Jet-Nano-Dysferlin治疗的肌肉表现出相当显著(p=0.056)的伊文思蓝染料阳性纤维的降低(图5C)。中心核纤维(肌肉再生和更新的指示)也表明在AAV9-Jet-Nano-Dysferlin治疗的臀肌中具有不显著但强烈的降低趋势(p=0.0835)(图5A)。也对总中心核纤维/总纤维进行了评估,并且发现各治疗之间具有非显著差异(图6A-6B)。作为肌肉纤维健康的其他测量,通过最小Feret直径从麦胚凝集素(WGA)的凝集素染色的肌肉切片测量了臀肌纤维尺寸(Briguetet al.,Neuromuscul.Disord.14:675(2004)),并用ImageJ进行分析。以前的研究发现,与野生型遗传背景小鼠相比,dysferlin缺失小鼠肌肉的变异性增加,平均纤维尺寸减小(Bansal et al.,Nature 423:168(2003))。本发明的结果发现来自AAV9-Jet-Nano-Dysferlin全身治疗的小鼠的肌肉纤维比GFP治疗小鼠的肌肉纤维显著更大(P<0.0001)(图5D),纤维尺寸分布图表明AAV9-Jet-Nano-dysferlin治疗的组群中钟形曲线右移(图7)。由于在先前的研究中观察到臀肌中显著的脂肪浸润(Nagyet al.,Physiol.Rep.5:e13173(2017)),对臀肌肌肉切片进行脂质油红染色,观察到染色的急剧减少,这表明在AAV9-Jet-NanoDysferlin治疗的小鼠臀肌中脂质积累较低。为了确定臀肌中纳米Dysferlin产生使得完整性得到改善的程度,进行蛋白质印迹;然而,通过该测定,纳米Dysferlin低于检测限,并且这些印迹是阴性的。这是在免疫荧光染色之后对肌肉切片进行的,其中麦胚凝集素用于对肌肉肌膜进行染色。表达明显存在于大约10%的肌肉纤维中(纳米Dysferlin总纤维,n=256;未治疗总纤维,n=185)(图8)。同样通过RT-qPCR确定治疗小鼠臀肌中存在纳米Dysferlin(图9A-9B)。纳米Dysferlin似乎偏爱分布于肌膜,一些蛋白质明显分布于整个胞质溶胶中,类似于IM注射(图3)和几个在先的报道(Lostalet al.,Hum.Mol.Genet.19:1897(2010);Sondergaardet al.,Ann.Clin.Transl.Neurol.2:256(2015);Grose et al.,WPLoS ONE 7:e39233(2012))。
讨论
AAV介导的基因疗法目前被认为是治疗比如杜氏肌营养不良(DMD)和dysferlin肌病的有希望的方法(Lostalet al.,Hum.Mol.Genet.19:1897(2010);Sondergaardet al.,Ann.Clin.Transl.Neurol.2:256(2015);Hirschet al.,Mol.Ther.21:2205(2013);Groseet al.,WPLoS ONE 7:e39233(2012))。然而,这两种肌肉消耗性疾病主要在于AAV载体的原发性缺陷:病毒衣壳太小而不能包装全长cDNA来实现简单的基因添加策略(Pryadkinaetal.,Mol.Ther.Methods Clin.Dev.2:15009(2015))。为了克服这一限制,我们和其他人已经研究了多种将大的基因部分递送至细胞核的AAV衣壳的能力,其中宿主DNA损伤应答介导了对大基因重建的可能性(Wuet al.,Mol.Ther.18:80(2010);Hirschet al.,Mol.Ther.21:2205(2013);Donget al.,Mol Ther.18:87(2010);Laiet al.,Mol Ther.18:75(2010))。尽管有趣,与带有完整转基因基因组的单AAV颗粒,用于AAV大基因递送的这些DNA修复依赖的多载体形式(Hirsch et al.,Mol Ther.18:6(2010))具有显著降低的转导效率(Hirschet al.,Mol.Ther.21:2205(2013);Hirsch et al.,PLoS ONE 4:e7705(2009))。不同于单颗粒AAV基因添加策略(其在理论上依赖于感染单个细胞的一个颗粒),AAV超大基因转导效率非常低,特别是当全身递送时(Hirschet al.,Mol.Ther.21:2205(2013);Hirsch et al.,PLoS ONE 4:e7705(2009))。这主要是由于:(1)需要单个细胞核中有几种不同的待脱壳载体基因组,和(2)在非分裂细胞中低效的同源介导的修复,如肌肉纤维偏向非同源末端连接,从而产生异常的非功能性和潜在免疫原性的转基因产物。由于超大AAV转导方法的效率降低,需要更高的有效剂量(与单颗粒AAV转导相比)(Hirschet al.,Mol.Ther.21:2205(2013))。在许多情况下,增加病毒剂量会因为产生了不希望的免疫并发症并导致治疗失败而使问题恶化。另外,目前对仅需要单一AAV载体转导的其他肌肉疾病的临床级AAV载体制剂的产品滴度是对能够治疗的患者数量的严重限制。尽管AAV大基因转导有两个主要问题,但是dysferlin缺陷型小鼠的临床前数据已使得开始招募患有dysferlin肌病的患者的进行1期临床试验并建议患者使用AAV超大转导治疗dysferlin肌病(Groseet al.,WPLoS ONE 7:e39233(2012))。值得注意的是,这将是临床上成功的依赖于单个细胞的多载体转导和对肌肉纤维中同源介导的修复的患者DNA损伤响应能力的第一个AAV试验。为了向患有dysferlin肌病的患者提供替代治疗策略,我们接着配套了DMD社区和合理设计的纳米Dysferlin,一种紧凑的dysferlin样的开放阅读框,适合单个AAV载体基因组的包装和转导。
一般地,C2结构域是可以结合到磷脂膜的内叶的模块化蛋白结构域(Davletovetal.,J.Biol.Chem.268:26386(1993))。大多数C2结构域以Ca2+依赖性方式与膜结合,但有一些不是。野生型dysferlin具有7个串联C2结构域,每个结构域由长接头分开(Abdullahetal.,Biophys.J.106:382(2014))。我们构建更紧凑的dysferlin蛋白的中心假设是多个串联C2结构域单独提供整个蛋白质的膜结合亲和力。因此,必然存在一个点,在该点更少的结构域仍然结合膜并且仍然提供它们的功能,但是可以通过适合完整AAV包装提供治疗益处。该策略意味着要了解C2结构域的构成。已经有其他尝试来使dysferlin的整体大小最小化(Ghoshet al.,Hum.Gene Ther.22:77(2011));然而,这些实验是在没有深入了解C2结构域的结构的情况下进行的。没有明确的结构域定义,甚至单一折叠结构域的折叠无意截断都可能错误折叠整个蛋白质,从而导致退化,丧失功能,或者甚至聚集。在测试了几种构建体之后,我们发现保留的氨基末端C2结构域(C2A、C2B和C2C以及它们的结构域间连接体(除了FerA、DysF、C2G))和跨膜结构域使得在dysferlin缺陷型小鼠模型中出现针对dysferlin功能缺失的分子校正。
AAV的转基因DNA的包装限制(<5kb)不仅妨碍全长dysferlin cDNA的包装,还限制了我们进行纳米Dysferlin表达的启动子大小。对包装的AAV基因组的检查清楚地证明,从JeT启动子(4,849nt)表达的纳米Dysferlin被包装为单一物种;与此相反,使用CMV(5,597nt)时,异源DNA物种被壳体包裹,该范围的大小从3到5kb(et al.,Gene 297:21(2002))(图2C)。当与JeT启动子相比时,即使CMV启动子的表达增加>10倍,该片段AAV载体的效率低于AAV单载体转导(图2B和2D)。
在先前的实验中,我们已经证明,片段AAV超大基因转导优于或类似于AAV大基因转导的其它方法,其通常被称为“双载体”方案(由Pryadkinaet al.,Mol.Ther.MethodsClin.Dev.2:15009(2015);Hirschet al.,Mol Ther.18:6(2010);Hirschet al.,MolTher.21:2205(2013)进行了综述)。在我们发表的文献中研究了片段AAV和双AAV转导效率,完整AAV的效率仍然比依赖于单个AAV载体转导包装的AAV衣壳高5至100倍。
因此,我们对于体内分析的关注点在于对JeT-Nano-Dysferlin进行单个AAV载体转导。这里我们努力的局限性是JeT启动子很小,正如包装完整基因组所需要的,但在性质上相对较弱且普遍存在,这对于骨骼肌疗法递送的IV不是理想的(et al.,Gene297:21(2002))(图2A-2D)。目前,小肌肉特异性启动子C2-27和C5-12尚在研究中,其被假设为在AAV背景下与纳米Dysferlin结合时能实现完整基因组包装,同时很可能在肌肉中具有显著增强的转录活性(Liet al.,Nat.Biotechnol.17:241(1999))。
AAV1-JeT-Nano-Dysferlin直接对侧施用至dysferlin缺陷型骨骼肌在每只测试小鼠中均得到增加的肌肉完整性,正如通过减少的伊文思蓝染料纤维染色所确定的,除一只小鼠外所有小鼠均测试其中心核纤维(图3A-3B)。这种对侧小鼠内部比较是重要的,因为动物之间的dysferlin表型(图3A-3B,黑条)是变化的,这可能是由于环境背景(即,特定小鼠的个体活动增加)。除了这种在疾病的严重性中小鼠内部的变异性,结果清楚地证明了增加的完整性和显著改善的肌肉表型纳米,这是纳米Dysferlin的结果,通过免疫荧光检验(IF)在大约30%的经治疗纤维中是显而易见的(图3C)。有趣的是,我们注意到基因递送后的纳米Dysferlin分布不是主要限于肌膜上,如在WT小鼠中观察到的天然dysferlin的分布(图3D)。这一结果是令人费解的,并且并非仅针对纳米Dysferlin,因为采用多载体方法的WT dysferlin的修复也会导致细胞内分布异常,如以前的报告所证明的(Lostalet al.,Hum.Mol.Genet.19:1897(2010);Grose et al.,WPLoS ONE 7:e39233(2012))。我们推测这种异常分布的原因是由于dysferlin(或纳米Dysferlin)修复到终末分化的肌肉纤维,因为已有建议在分化期间调节dysferlin;然而,也存在其他理论,例如每个纤维丰度的改变。
奇怪的是,人类患者dysferlin肌病发病一般在青少年时期,并且是在以前无症状且常常运动的个人中。报告表明,其原因可能与这一时期细胞呼吸从氧化主导到糖酵解主导的代谢转换有关(Armstronget al.,Pediatr.Exerc.Sci.21:130(2009);Stephensetal.,Int.J.Sport Nutr.Exerc.Metab.16:166(2006);Tayloret al.,Mol.Cell.Biochem.174:321(1997);Timmonset al.,Appl.Physiol.Nutr.Metab.32:416(2007);Timmonset al.,J.Appl.Physiol.94:278(2003))。这与BLA/J dysferlin缺陷型小鼠在15周龄开始出现肌营养不良表型一致(Nagyet al.,Physiol.Rep.5:e13173(2017))。事实上,研究发现,dysferlin缺陷型BLA/J小鼠和原代人成肌细胞都出现葡萄糖和脂质摄取/代谢受损(Keller(2014)Thesis(Berlin:Berlin))。此外,先前的报道表明脂质积累是在人和BLA/J小鼠dysferlin肌病中观察到的特征,但尚未见于其他肌营养不良症(比如)的报道中,例如钙蛋白酶病(calpainopathy)、DMD和强直性肌营养不良症(Groundset al.,Am.J.Pathol.184:1668(2014))。与该思路一致,我们以前的研究发现,在BLA/J小鼠的臀肌和腰肌(BLA/J小鼠模型中最易受影响的肌肉)中肌细胞外脂质增加,并且在臀肌的MRI图像中明显可见脂肪浸润(Nagyet al.,Physiol.Rep.5:e13173(2017))。在本研究中对H&E染色的肌肉切片进行分析后,各种治疗之间的潜在脂肪浸润差异变得明显。为了确认这一点,我们对脂质进行了油红O染色,表明在AAV9Jet-Nano-Dysferlin治疗的小鼠中脂肪浸润急剧减少(图5E)。
本文设计的实验试图通过采用单剂量的AAV9-JeT-Nano-Dysferlin,对已经证实患有进行性肌肉肌病的6月龄动物进行全身治疗来模拟可能的临床情况。盲法实验的结果表明,用AAV9-Jet-Nano-Dysferlin治疗的BLA/J小鼠在1小时评估期间平均站立200次以上,总计几乎是对照治疗小鼠活动量的两倍。在以前的工作中,我们观察到,与WT小鼠相比,站立缺陷随时间延长增加,这表明在BLA/J小鼠中疲劳的早期发作(Nagyet al.,Physiol.Rep.5:e13173(2017))。本文的工作与AAV9-JetNano-Dysferlin的治疗效果一致,因为当随时间经过进行分析时,经过治疗的小鼠表现表明强烈的疲劳校正并证实了与WT小鼠具有相似的站立水平,如我们之前的研究中所观察到的(Nagyet al.,Physiol.Rep.5:e13173(2017))。本研究对于未来治疗的运动评估的一个额外收获是,考虑到BLA/J小鼠观察到的“疲劳”,适当地设计运动实验,将活动量测试的时间延长至超过60分钟,可以暴露dysferlin肌病的该类模型中存在的更强更严重的缺陷。这仍有待在未来的研究中进行测试(图4C)。
使用全肌测定法(图5B)通过常规伊文思蓝染料组织学对伊文思蓝染料摄取进行的死后分析(图5C)、中心成核纤维(图5A)和通过Feret直径进行的半自动纤维尺寸分析(图5D和7)一致表明在最受影响的BLA/J肌肉组——臀肌中,采用AAV9-Jet-Nano-Dysferlin治疗的BLA/J小鼠具有增加的肌肉完整性(Nagyet al.,Physiol.Rep.5:e13173(2017)),其中通过免疫荧光检验,对于纳米Dysferlin,大约10%的肌肉纤维染色呈阳性(图8),这与一点点dysferlin(或在该种情况下为纳米Dysferlin)对维持肌肉完整性大有帮助的观点一致(Lostalet al.,Hum.Mol.Genet.19:1897(2010))。不论是dysferlin缺陷型患者成肌细胞或者不限制BLA/J模型中的生产,我们没有在本文的示例中发现纳米Dysferlin或AAV载体转导的毒性。然而,我们再次注意到普遍存在的JeT启动子相对较弱,得到可检测但较低水平的纳米Dysferlin。
我们需要采用更强的并且有肌肉限制性的启动子进行进一步的实验以确认这一点。此外,我们注意到由C2D、E和F结构域的删除产生了一个新表位,根据患者突变的性质,这提供了纳米Dysferlin特异性细胞介导的免疫反应的可能。由于各种可能的突变,这与将微型或小型肌营养不良蛋白施用于DMD患者或者甚至将全长dysferlin施用至dysferlin肌病患者的情况类似。除了这些标准的治疗关注点,纳米Dysferlin代表了仅有的能恢复dysferlin缺陷型小鼠的运动机能的单个AAV载体适宜的dysferlin变体,并且代表了临床上治疗dysferlin肌病的有吸引力的备选方法。
材料和方法
研究设计:该研究设计用于产生用于dysferlin肌病的AAV治疗剂。为了测试这一点,使用AAV技术创建了纳米dysferlin(缩短的类似dysferlin的分子)并测试了其在体内的功能。由于临床上相关的表型特征,选择使用目前最佳的dysferlin肌病动物模型,BLA/J小鼠。在治疗类型方面,处理者对所有小鼠实验均以盲法进行,并且仅在统计分析后才对结果进行非盲处理。基于BLA/J模型的早期特征确定实验终点和初始治疗时间(Nagyet al.,Physiol.Rep.5:e13173(2017))。在至少2分开的两天重复体外实验,每次最小重复次数为3。以指定的重复次数和持续时间进行一次动物实验。对于肌肉内实验,对同窝仔畜施用随机分配的治疗用于对侧对照。对于全身实验,对小鼠随机分配各种治疗。执行所有动物互动和数据收集的研究人员均以盲法进行。显著性α设定在常规的0.05。在G-Power 3.1.9.2软件中进行站立行为表现测定的后hoc分析,使用组均值得到1.77的效应值,并且通过合并标准差方程估计每组内的标准偏差,具有0.76的功效(1-b误差概率)。由于没有接受纳米Dysferlin注射,将一只小鼠从肌肉内实验中剔除,证据为靶标TA肌肉中没有墨汁。在全身实验中,由于比所有其他纳米Dysferlin治疗小鼠的站立表现中值的一半还低,将一只纳米Dysferlin治疗的小鼠作为异常值剔除。该排除并未引起所有进行实验的p值的重大变化。
设计纳米Dysferlin:纳米Dysferlin基因是基于野生型dysferlin同种型8cDNA(6,240nt),其包含结构域C2A-C2BC2C-FerA-DysF-C2D-C2E-C2F-C2G-TM。野生型结构域均按照以下可用的一级序列进行定义。对表2中的每个C2结构域进行分析,以获取预测的B链内容、可能的Ca2+-结合残基、C2结构域的拓扑结构、整个C2结构域的长度,和结构域核心的疏水性包装的连续性。一旦完成这些,通过定义每个C2结构域从N-端接头到C-端接头的切除位点可以在计算机上编辑dysferlin。除蛋白质的短细胞外部分外,所有缩短的蛋白质构建体都保留了C2A结构域、FerA结构域、DysF结构域、C2G结构域和跨膜螺旋。所有其他C2结构域都是非必要的。最后,通过GenScript组装与新蛋白质相对应的基因,并对密码子进行优化以进行人类合成。纳米Dysferlin本身具有C2A-C2B-C2CFerA-DysF-C2G-TM结构域,总长度为4,356nt。
细胞系和培养基:使用HeLa细胞进行免疫荧光分析并在补充有10%西格玛胎牛血清(FBS)(F7524)和1%青霉素/链霉素抗生素的DMEM中培养。携带dysferlin外显子44:c.4882G>A HMZ,p.G1628R纯合突变的永生化人类患者“ER”成肌细胞从E.Gallardo博士获得,并在补充有15%西格玛FBS(F7524)、2mM Life Technologies(生命技术公司)的Glutamax(35050)和Invivogen的100mg/mL Primocin(ant-pm-1)的Promocell SkeletalMuscle Cell Growth Medium Kit(Promocell骨骼肌生长培养基套装)(C-23060)中培养。从ATCC(CRL1772)获得C2C12成肌细胞,并在补充有10%西格玛FBS(F7524)和1%青霉素/链霉素抗生素的DMEM中培养。用于蛋白质印迹和AAV载体产生的HEK293细胞从ATCC(CRL1573)获得,并在补充有10%西格玛FBS(F7524)和1%青霉素/链霉素抗生素的DMEM中培养。
质粒和病毒产生:纳米Dysferlin核苷酸序列由GenScript基于我们的氨基酸序列提交及其人密码子优化算法生成。PCR亚克隆在30ORF上添加3X FLAG标签,并在NcoI和XhoI位点将纳米Dysferlin序列移入pSJG-JeT-GFP-synpolyA自互补质粒(北卡罗来纳大学[UNC]S.Gray博士的友善礼物)。然后用KpnI和MluI切下该盒,并将末端变成平端,然后克隆到pTReGFP(单链AAV质粒)的平端KpnI/SphI位点(Zolotukhinet al.,J.Virol.70:4646(1996))。然后通过测序确定所得到的质粒上AAV2-反向末端重复序列之间的区域。对于这些实验,使用phpaTRSK-CMV-GFP产生GFP对照AAV载体(McCartyet al.,Gene Ther.8:1248(2001))。通过三重转染法在HEK293细胞中产生病毒(Griegeret al.,Nat.Protoc.1:1412(2006))。该方法使用pXR1、pXR2和pXR9质粒以及pXX680辅助体(R.J.Samulski博士的友善礼物)。所有载体制备物的滴度由Southern斑点印迹法确定并通过qPCR证实。当适用时,包装的基因组物种通过由碱性凝胶电泳和SYBR金染色证实(Griegeret al.,Nat.Protoc.1:1412(2006))。
纳米Dysferlin肌内和全身施用:对于肌内实验,图3A-3D中示出了数据,在6周龄时将AAV1Nano-Dysferlin或AAV1-CMV-GFP肌内注射到对侧TA肌肉中一次。使用BD 8毫米31号针头对异氟烷镇静小鼠的每个TA注射含2%墨汁的50μl总体积(5e10总病毒基因组)(America Master Tech Cat:STIIN25)。对于全身实验,使用BD 8毫米31号针头在4.5月龄通过尾静脉施用一次AAV9-JeT-Nano-Dysferlin(n=6)或AAV9-CMV-GFP(n=4),总体积为200μl(2e11总病毒基因组)。
蛋白质印迹:如产品方案中是描述的,使用Lipofectamine 3000(ThermoFisherCat:L3000001)对C2C12小鼠成肌细胞进行CMV野生型dysferlin转染48小时后,首先通过蛋白质印迹测试CMV纳米Dysferlin质粒。使用哺乳动物蛋白质提取试剂(MPER;ThermoScientific Cat:78501)提取用于总蛋白质裂解物蛋白质印迹的蛋白质。通过Mem-PERPlus Membrane Protein Extraction kit(Mem-PER Plus膜蛋白提取套装)(ThermoFisherCat:89842)获得分离的细胞质和膜相关蛋白质裂解物。对于肌肉内和静脉内实验,收集肌肉并进行哺乳动物蛋白质提取试剂方案(ThermoFisher Cat:78501)。随后将所有蛋白质裂解物变性,加入到4X NuPage溶液中(ThermoFisher Cat:NP0008),最终浓度为5%β-巯基乙醇,并在预制的4%–12%BIS-TRIS梯度凝胶(ThermoFisher Cat:NP0321)上电泳。所有dysferlin和纳米Dysferlin检测实验均使用Romeo一抗(Abcam Cat:124684),浓度为1:2,000,然后是第二抗兔HRP抗体(Abcam Cat:ab6721),浓度为1:10,000。使用Sirius化学发光试剂盒(Advansta Cat:K-12043-D20)进行所有印迹,并且通过Amersham A600成像仪对印迹进行成像。
毒性测定:将由Jain Foundation提供的Dysferlin缺陷型(ER)人类患者细胞接种于24孔板中,并在补充有15%西格玛FBS(F7524)、2mM Life Technologies(生命技术公司)的Glutamax(35050)和Invivogen的100mg/mL Primocin(ant-pm-1)的Promocell SkeletalMuscle Cell Growth Medium Kit(Promocell骨骼肌生长培养基套装)(C-23060)中培养。采用推荐方案使用Lipofectamine 3000进行转染时,有大约70%的细胞融合。低剂量、中等剂量和高剂量由0.5mg、1mg和1.5mg的pCMV-GFP、pCMV-Nano-Dysferlin或pCMV-dysferlinDNA质粒组成。转染后24小时更换细胞培养基,转染后48小时向每个孔板中加入50μlalamar Blue细胞活力试剂;根据每个产品方案进行读数。转染后72小时从每个孔中取出100μl培养基,置于荧光平板读数器中进行分析。
动物和动物护理:所有用于体内实验的受试者是具有C57BL/67背景的总计15只BLA/J小鼠,均是从最初来自Jackson Laboratory的小鼠培育出的。肌肉内实验使用相同数量的雄性和雌性同窝仔畜。静脉实验两组均使用三只雌性,纳米Dysferlin组使用两只雄性,对照组使用一只雄性。受试者分组饲养在通风笼中,可自由饮水和吃鼠粮。饲养室保持12L:12D的昼夜节律,早上7点开灯。所有测试程序严格遵守“Guide for the Care and Useof Laboratory Animals(实验动物护理和使用指南)”(Institute of Laboratory AnimalResources(实验动物资源研究所),National Research Council(国家研究委员会),1996)并经UNC的Institutional Animal Care and Use Committee(研究所动物护理和使用委员会)批准。
伊文思蓝染料测定:处死小鼠之前40小时,以5mL/g体重向小鼠腹膜内注射伊文思蓝染料(10mg/mL)。在处死小鼠前的最后一天将小鼠饲养在新环境中,以加重相对轻度的免疫缺陷表型。对于阳性纤维计数测定,在整个肌肉上相隔至少500mm的7个位置横向切下10mm厚的肌肉。利用荧光显微镜检查术,对总纤维数计数并与阳性纤维进行比较。对于伊文思蓝染料吸光度测定,将肌肉片按重量归一化并置于Eppendorf管中。加入1mL甲酰胺并在55℃下温育2小时。将样品在12,000rpm离心2分钟以除去碎片,并将上清液加入到96孔板中,每片肌肉制备三份。用平板读数器在620nm下测定吸光度。一只静脉注射小鼠没有注射伊文思蓝染料,其用于对免疫荧光染色进行定量。
H&E中心成核:如上所述,肌肉切片由UNC Histology Core(UNC组织结构学中心)进行H&E染色。如先有文献中评估的,按每mm2面积计算中心成核纤维数(Lostal et al.,PLoS ONE 7:e38036(2012))。此外,还评估了中心成核数对比按照总中心核计数的总完整纤维数(Duddyet al.,Skelet.Muscle 5:16(2015))。
油红O染色:如上文所述,肌肉切片由UNC Histology Core(UNC组织结构学中心)进行油红O染色。
纤维尺寸分析:肌肉切片用WGA凝集素染色,并在ImageJ上首先通过分割RGB通道,再使用绿色通道“find edges”(边缘检测)功能进行分析。然后应用自动Huang阈值并使用binary选项下的open(开操作)功能,设定count=“4”,进行10次迭代(黑色背景)。接着使用binary选项下的fill holes(填充小洞)功能,手动关闭保持“open”的纤维边缘。接着使用分析颗粒功能,并将最小Feret直径测量值转换为微米。
免疫荧光检测:通过浸入液氮冷却的异戊烷将来自肌内和静脉内组群的肌肉组织急冻在处于最佳切割温度(OCT)的Sakura TissueTek Cryomolds(REF4557)中。然后使用Leica CM3050-S低温恒温器将组织切成10mm薄片并在80℃下储存。然后将组织在室温下在湿度室中解冻。将解冻组织在4%低聚甲醛/4%蔗糖溶液中固定15分钟。然后用WGA-Alexa488缀合物以50mg/mL的浓度在室温下对组织染色10分钟。使用10%BSA来阻断组织,并且在37℃下以1:200稀释度使用Abcam ab124684抗dysferlin抗体2小时。二抗山羊抗兔594(Life Technologies(A11037))以1:1,000稀释度使用。室温下以1:10,000稀释度使用Hoechst染色剂(H3569)5分钟。安装盖玻片并在奥林巴斯IX-83荧光显微镜下成像。
免疫荧光纤维计数:对于肌内实验,使用ImageJ细胞计数器和多点分析工具基于纤维轮廓手动计算总纤维中上述背景染色的纳米Dysferlin纤维的数目。在纳米Dysferlin及其对侧GFP对照中都进行该程序。然后还扣除GFP对照“假阳性”以估计近似的纳米dysferlin表达。值得一提的是,载体系统性脱落是采用AAV的常见现象,可能是由于对对侧腿的转导。对于全身实验,由于预期的较弱染色,一只经治疗的小鼠未注射伊文思蓝染料。在这种情况下,WGA染色的轮廓被用于确定总纤维数,将其用于归一化观察到的总阳性纤维数。使用在无处理对照小鼠中观察到的阳性纤维来扣除“假阳性”。
肌酸激酶测定:将从下颌下静脉抽取的血液(约200μL)置于EDTA管中并以1,500rpm离心10分钟,分离血液固体。使用肌酸激酶活性比色测定试剂盒(Abcam Cat:155-901)按照方案说明处理血浆。在Perkins比色板读数器中测量样品。
站立行为测定:以5分钟的间隔在60分钟内对小鼠用两腿站起(称为站立)的次数进行定量。在装有光电管的开放式自动场(41cm×41cm×30cm;Versamax系统,AccuscanInstruments)中评价新环境中的站立。活动室本身被放置在配有风扇和室内灯的消音容器中。
水平活动行为测定:以5分钟的间隔在60分钟内对小鼠的水平活动量进行定量。在装有光电管的开放式自动场(41cm×41cm×30cm;Versamax系统,Accuscan Instruments)中评价新环境中的水平活动量。活动室本身被放置在配有风扇和室内灯的消音容器中。
纤维尺寸分析:肌肉切片用WGA凝集素染色,并在ImageJ上首先通过分割RGB通道,再使用绿色通道“find edges”(边缘检测)功能进行分析。然后应用自动Huang阈值并使用binary选项下的open(开操作)功能,设定count=“4”,进行10次迭代(黑色背景)。接着使用binary选项下的fill holes(填充小洞)功能,手动关闭保持“open”的纤维边缘。接着使用分析颗粒功能,并将最小Feret直径测量值转换为微米(Briguetet al.,Neuromusculardisorders:NMD 14:675(2004);Bansal et al.,Nature 423:168(2003)。
RT-PCR检测:将从待评估的小鼠肌肉上提取的组织立即储存在干冰中,然后在1.5ml外延管中储存在-80℃的冰箱中。将Trizol试剂(Thermo Fisher:15596026)加入样品中,然后使其解冻。机械均化后,按每个产品方案进行裂解和相分离。然后按产品方案使用Qiagen RNeasy Fibrous Tissue Kit(Qiagen RNeasy纤维组织试剂盒)(Cat No./ID:74704)纯化RNA。进行逆转录,并使用从Roche UPL引物设计文库获得的引物ccgacacgcctacctgag(SEQ ID NO:13)和ccggcactaaaatcgtcag(SEQ ID NO:14)产生60个核苷酸扩增子。用Exo-Sap-it PCR Cleanup Reagent(Exo-Sap-it PCR纯化试剂)(ThermoFisher 78200.200)处理样品,在2%琼脂糖凝胶上电泳,随后进行成像。
以上内容是对本发明的说明,而不应被解释为对其进行限制。本发明由所附权利要求以及本发明所包含的所述权利要求的等同权利要求限定。
序列表
<110> 北卡罗来纳大学教堂山分校
得克萨斯理工大学系统
M•L•赫希
R•B•萨顿
<120> 用于治疗Dysferlin肌病的截短Dysferlin
<130> 5470-780WO
<150> US 62/351,701
<151> 2016-06-17
<160> 14
<170> SIPOSequenceListing 1.0
<210> 1
<211> 4500
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(4500)
<223> 克隆_318 无 Flag (433)
<400> 1
atgctgaggg tgttcatcct gtatgctgag aacgtgcaca cacccgacac tgatattagc 60
gacgcctact gctccgccgt gtttgctgga gtgaagaaaa gaaccaaggt gatcaaaaac 120
tctgtgaatc ccgtgtggaa cgaagggttc gagtgggatc tgaagggaat tcctctggac 180
caggggagtg agctgcacgt ggtggtgaaa gatcatgaaa caatgggcag aaaccggttt 240
ctgggagaag ctaaggtgcc actgagggag gtgctggcta ctccaagcct gtccgcttct 300
ttcaatgctc ctctgctgga cactaagaaa cagccaaccg gagcttctct ggtgctgcag 360
gtgtcttaca ccgacctgga tgtggtggcc gacactggcg aggaagacac cgaggatcag 420
ggactgacac ctttcctgga ccagagcgga ggaccaagaa agctgccatc ccggggcatc 480
aagcgcaaaa ggagcattcg cgtgcaggtg atcgagggga ggcagctgcc tggcgtgaac 540
atcaagccag tggtgaaagt gaccgccgct ggacagacca agagaacacg gattcacaaa 600
gggaactctc ccctgttcaa tgagacactg ttctttaatc tgtttgatag tccaggcgaa 660
ctgttcgacg agcccatctt tattacagtg gtggatagtc gcagcctgag gactgacgct 720
ctgctgggcg agtttcgcat ggatgtggga accatctata gagaaccacg gcatgcctac 780
ctgaggaaat ggctgctgct gagcgaccca gacgatttct ccgctggagc tagaggatac 840
ctgaagacat ctctgtgcgt gctgggacct ggggatgaag ccccactgga gcggaaggac 900
ccttctgaag acaaagagga tatcgaaagt aacctgctga gaccaaccgg agtggctctg 960
aggggagctc acttctgtct gaaagtgttt cgcgctgagg atctgcctca gatggacgat 1020
gccgtgatgg acaatgtgaa gcagatcttc ggctttgaga gcaacaagaa aaatctggtg 1080
gaccctttcg tggaagtgag ctttgccgga aagatgctgt gctccaagat cctggagaaa 1140
actgctaacc cacagtggaa ccagaatatt accctgcctg ccatgttccc aagcatgtgt 1200
gagaagatgc gcatcaggat cattgactgg gataggctga cccacaatga cattgtggct 1260
actacctacc tgtccatgtc taagatttcc gcccctggag gagagatcga ggaagagcca 1320
gctggagctg tgaagcctag caaagcctcc gatctggacg attatctggg gtttctggag 1380
cacagtgaac agaaagtgga ggatctgcct gccgacgata tcctgcgcgt ggaaaagtat 1440
ctgaggagac ggaaatacag cctgtttgcc gctttctact ccgctacaat gctgcaggac 1500
gtggacgatg ccattcagtt cgaggtgtcc atcgggaacc atcgcatcga gacccagaat 1560
cagctgctgg gcatcgccga caggctggaa gctggactgg agcaggtgca cctggccctg 1620
aaggctcagt gctctaccga ggacgtggat agtctggtgg ctcagctgac agacgaactg 1680
atcgccggat gtagccagcc actgggggat attcacgaga caccctccgc cactcatctg 1740
gaccagtatc tgtaccagct gagaacccac catctgagcc agatcacaga ggccgctctg 1800
gctctgaagc tgggccattc cgaactgcca gctgctctgg agcaggctga agactggctg 1860
ctgaggctga gggctctgaa actgcagacc atcttcctga agtacccaat ggagaaagtg 1920
cccggcgccc gcatgcctgt gcagattagg gtgaagctgt ggtttggact gtctgtggac 1980
gagaaggaat ttaaccagtt cgctgaaggg aaactgagtg tgttcgccga gacctacgag 2040
aacgaaacta agctggccct ggtgatggat gccggccatc tgtctttcgt ggaagaggtg 2100
tttgagaacc agactcgcct gccaggcgga cagtggatct atatgagtga caactacacc 2160
gatgtgaatg gcgagaaggt gctgcctaaa gacgatattg aatgtccact gggatggaag 2220
tgggaggacg aagagtggag caccgatctg aaccgggctg tggacgaaca gggctgggag 2280
tactccatca caattccccc tgagcgcaag ccaaaacact gggtgcccgc cgaaaaaatg 2340
tattacaccc atagaaggag gagatgggtc aggctgagaa ggagggatct gtctcagatg 2400
gaggccctga agagacatag gcaggctgag gctgaaggag agggatggga gtatgctagc 2460
ctgtttggct ggaagttcca cctggaatac agaaaaaccg acgcctttag gagaaggagg 2520
tggaggagaa ggatggagcc actggaaaaa acacctgcca ttcaccatat ccccggattc 2580
gaggtgcagg aaacaagccg gatcctggac gaatccgagg acactgatct gccttatcct 2640
ccaccccagc gcgaggctaa catttacatg gtgcctcaga atatcaaacc agccctgcag 2700
cgcactgcta tcgagattct ggcctggggc ctgaggaaca tgaagtctta ccagctggcc 2760
aatatctcta gtcctagtct ggtggtggag tgcggagggc agaccgtgca gagctgtgtg 2820
atcagaaacc tgcggaagaa ccccaatttc gacatttgca ctctgtttat ggaggtgatg 2880
ctgcctagag aagagctgta ctgtcctcca attaccgtga aggtgatcga taatagacag 2940
tttggaagga ggccagtggt gggacagtgc accatccgga gcctggagtc cttcctgtgt 3000
gacccttata gcgctgaaag cccttcccca cagggaggac ctgacgatgt gtctctgctg 3060
agtccaggcg aggacgtgct gatcgatatt gacgataagg aacccgagaa ggactttgat 3120
actctgaaag tgtacgatac ccagctggag aacgtggaag ccttcgaggg gaataccttc 3180
aagctgtaca ggggcaaaac cgatccatcc gtgattgggg agtttaaggg cctgctcgtg 3240
agaatctaca ttgtgcgggc cttcgggctg cagcctaagg atccaaacgg caaatgtgac 3300
ccctatatca agatttccat cggaaagaaa tctgtgagtg accaggataa ttacatcccc 3360
tgcacactgg aacctgtgtt tgggaagatg ttcgagctga cttgtaccct gcctctggaa 3420
aaggacctga aaatcactct gtatgactac gatctgctga gcaaggatga aaaaattggg 3480
gagaccgtgg tggacctgga gaacagactg ctgtccaagt tcggagctag atgcggactg 3540
ccacagacat actgtgtgtc tggccctaat cagtggcgcg accagctgac tcaggacaaa 3600
gaatacagca ttgaggaaat cgaggctgga agaatcccaa acccagagga aaggctggcc 3660
ctgcatgtgc tgcagcagca gggcctggtg cccgaacacg tgaaagctct gggacgccca 3720
gggccaccct ttaacatcac ccctagacgg gcccgcaggt tctttctgcg ctgcatcatt 3780
tggaatacta gggatgtgat cctggacgat ctgtctctga ccggagagaa gatgagtgac 3840
atttatgtga aaggctggat gatcggattt gaggaacaca agcagaaaac agatgtgcat 3900
tacagatctc tggggggcga gggcaacttc aattggcggt tcatctttcc attcgactat 3960
ctgcccgctg aacaagtgtg taccattgcc aagaaagatg ctttctggcg cctggacaag 4020
acagagagca aaattcctgc cagggtggtg ttccagatct gggacaacga taagtttagc 4080
ttcgacgatt ttctgggatc cctgcagctg gatctgaatc ggatgcctaa gccagccaaa 4140
accgctaaga aatgctctct ggaccagctg gacgatgcct tccatccaga atggtttgtg 4200
agtctgttcg agcagaagac tgtgaaaggc tggtggccct gtgtggctga ggaaggagag 4260
aagaaaatcc tggccgggaa gctggaaatg accctggaga ttgtggctga aagaccagct 4320
ggaccaagac ggcccgatac atcttttctg tggttcacca gtaaattcat cctgtggcgc 4380
aggtttagat gggccatcat tctgtttatc attctgttca ttctgctgct gtttctggct 4440
attttcatct atgcctttcc taactacgcc gctatgaagc tggtgaaacc attcagctga 4500
<210> 2
<211> 4284
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(4284)
<223> 克隆_431 无 Flag (431)
<400> 2
atgctgcgag tctttattct gtatgccgaa aacgtccaca cccccgacac cgacatctct 60
gatgcttact gctccgccgt ctttgccggg gtcaagaaaa ggaccaaagt gatcaagaac 120
agtgtgaatc ctgtctggaa cgagggattc gaatgggatc tgaagggcat tccactggac 180
caggggtcag aactgcacgt ggtcgtgaaa gaccatgaga caatgggaag gaaccgcttc 240
ctgggcgaag caaaggtgcc tctgcgagag gtcctggcaa ctccatctct gagtgccagc 300
ttcaacgctc ccctgctgga tactaagaaa cagcctaccg gggcaagcct ggtgctgcag 360
gtctcctata cacctctgcc aggagcagtg cctctgttcc cacctccaac tccactggaa 420
cccagcccta ccctgccaga cctggatgtc gtggccgaca ctggcgggga ggaagacacc 480
gaggatcagg gcctgacagg ggatgaagct gagccctttc tggaccagtc aggaggcccc 540
ggagcaccta ccacacccag aaagctgcca agcagacccc ctccacacta ccccggcatc 600
aagcgaaaac gatcagcacc aaccagccgg aagctgctgt ccgacaaacc tcaggatttt 660
cagatccgcg tgcaggtcat tgagggccga cagctgcctg gggtcaacat caagccagtc 720
gtgaaagtga ctgccgctgg acagactaag agaaccagga ttcataaagg caactccccc 780
ctgttcaatg agaccctgtt ctttaatctg tttgattctc ccggcgaact gttcgacgag 840
cctatcttta ttactgtcgt ggatagcaga tccctgagga ccgacgctct gctgggagaa 900
ttcagaatgg acgtgggcac tatctatcgc gagccccgac acgcctacct gaggaaatgg 960
ctgctgctgt ctgatcctga cgattttagt gccggagctc gcggctacct gaagacctct 1020
ctgtgcgtgc tgggaccagg ggatgaagca ccactggaga ggaaggaccc atcagaggac 1080
aaagaagata tcgagagcaa cctgctgcga cccaccggag tcgcactgcg gggcgcccac 1140
ttctgtctga aagtgtttcg cgctgaggac ctgccccaga tggacgatgc agtgatggat 1200
aatgtcaagc agatcttcgg ctttgaaagc aacaagaaaa atctggtgga ccccttcgtg 1260
gaggtctcct ttgccgggaa gatgctgtgc tctaagatcc tggagaaaac agccaaccct 1320
cagtggaacc agaatattac tctgccagct atgttcccca gcatgtgtga gaaaatgcgc 1380
atccgaatca ttgactggga tagactgaca cacaatgata ttgtggccac tacctatctg 1440
tctatgagta agatctccgc tccaggggga gagattgagg aagagcccgc aggcgccgtg 1500
aagccttcta aagccagtga cctggacgat tacctggggt ttctgcctac attcggacca 1560
tgctatatca acctgtacgg gtccccccgg gagtttactg gattcccaga tccctacaca 1620
gaactgaata ctggaaaggg cgagggggtg gcttatcggg gcagactgct gctgagtctg 1680
gagaccaagc tggtcgaaca ttcagagcag aaagtggaag acctgcccgc cgacgatatc 1740
ctgagagtgg agaagtatct gcggagaagg aaatacagtc tgtttgcagc cttctattca 1800
gccaccatgc tgcaggatgt cgacgatgct atccagttcg aggtgagcat tgggaactac 1860
ggaaataagt ttgacatgac atgcctgcct ctggcaagta caactcagta ttcacgggcc 1920
gtcttcgatg ggtgtcacta ctattacctg ccctggggaa acgtgaagcc cgtcgtggtc 1980
ctgagctcct actgggaaga catctcccac cgcattgaga cacagaatca gctgctggga 2040
atcgccgatc ggctggaagc tggcctggag caggtgcatc tggcactgaa ggcccagtgc 2100
tcaaccgaag acgtggatag cctggtcgct cagctgacag acgagctgat cgcaggctgt 2160
tctcagcctc tgggggacat tcacgagacc ccaagtgcca cacatctgga tcagtatctg 2220
taccagctga gaacacacca tctgagtcag atcactgaag ctgcactggc tctgaagctg 2280
ggccactcag agctgcctgc cgctctggaa caggcagagg actggctgct gaggctgcga 2340
gctctggcag aagagcctca gaactctctg ccagacatcg tgatttggat gctgcaggga 2400
gataagaggg tggcctacca gcgcgtccca gctcatcagg tgctgttcag tcgccgaggc 2460
gctaactact gcggaaagaa ttgtggcaaa ctgcagacca tctttctgaa gtatcctatg 2520
gagaaagtgc ctggcgcccg aatgccagtg cagattcggg tcaagctgtg gttcgggctg 2580
agcgtggacg aaaaggagtt taatcagttc gccgaaggaa aactgtccgt ctttgctgag 2640
acatacgaaa acgagactaa gctggccctg gtgggcaatt gggggaccac aggactgacc 2700
tatcccaagt tcagcgacgt gacaggcaag atcaaactgc ctaaagattc cttccggcca 2760
tctgcagggt ggacatgggc aggagactgg tttgtgtgcc ctgaaaagac tctgctgcac 2820
gacatggatg ccgggcatct gtccttcgtg gaagaggtct ttgagaacca gactagactg 2880
ccaggcgggc agtggatcta tatgtctgac aactacaccg atgtcaatgg cgagaaggtg 2940
ctgccaaaag acgatattga atgtcccctg gggtggaagt gggaggacga agagtggtct 3000
accgatctga atcgggctgt ggacgaacag ggctgggagt acagtatcac aattccccct 3060
gaaagaaagc ccaaacactg ggtgcctgcc gagaaaatgt attacaccca tcgaagaagg 3120
cgatgggtga ggctgcgacg gagagacctg agccagatgg aggccctgaa gcgacaccga 3180
caggcagaag ctgagggaga aggctgggaa tacgcatccc tgtttggctg gaagttccat 3240
ctggagtatc gcaaaactga tgccttcagg cgccgacgat ggagaaggcg aatggaacca 3300
ctggagaaga ccggacctgc agccgtcttt gctctggaag gggcactggg aggcgtgatg 3360
gacgataaaa gcgaggactc aatgagcgtg tccaccctgt cctttggcct gttcccaaag 3420
gcactgggaa ggccaggacc acccttcaac atcacacccc gacgggctag aaggttcttt 3480
ctgagatgca tcatttggaa tactagggac gtgactaaag gtgcttttgg tgatatgtta 3540
gatactcctg atatctacgt gaaagggtgg atgattggat tcgaagagca caagcagaaa 3600
acagacgtgc attatcgctc tctgggggga gaaggaaact ttaattggcg gttcatcttt 3660
ccattcgatt acctgcccgc agagcaggtg gctaccattg caaagaaaga tgccttctgg 3720
agactggaca agacagagag caaaatccct gccagggtgg tcttccagat ttgggacaac 3780
gataagtttt ctttcgacga ttttctgggc agtctgcagc tggacctgaa taggatgcct 3840
aagccagcca aaaccgctaa gaaagcatca ctggatcagc tggacgatgc ctttcaccct 3900
gaatggtttg tgagcctgtt cgagcagaag acagtcaaag gctggtggcc atgtgtggca 3960
gaagagggcg agaagaaaat cctggccggg aaactggaaa tgactctgga gattgtggct 4020
gagtctgaac atgaagagag acccgcaggg cagggaaggg acgaacccaa catgaatcct 4080
aagctggagg accccagacg acctgatacc tcctttctgt ggttcacctc tccttacaag 4140
acaatgaaat tcatcctgtg gcggagattt cgctgggcca tcattctgtt tatcattctg 4200
ttcattctgc tgctgtttct ggctatcttc atctacgcat ttccaaacta cgctgcaatg 4260
aagctggtga aacccttcag ctga 4284
<210> 3
<211> 3873
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(3873)
<223> 克隆_430 无 Flag (430)
<400> 3
atgctgcgag tctttattct gtatgccgaa aacgtccaca cccccgacac cgacatctct 60
gatgcttact gctccgccgt ctttgccggg gtcaagaaaa ggaccaaagt gatcaagaac 120
agtgtgaatc ctgtctggaa cgagggattc gaatgggatc tgaagggcat tccactggac 180
caggggtcag aactgcacgt ggtcgtgaaa gaccatgaga caatgggaag gaaccgcttc 240
ctgggcgaag caaaggtgcc tctgcgagag gtcctggcaa ctccatctct gagtgccagc 300
ttcaacgctc ccctgctgga tactaagaaa cagcctaccg gggcaagcct ggtgctgcag 360
gtctcctata cacctctgcc aggagcagtg cctctgttcc cacctccaac tccactggaa 420
cccagcccta ccctgccaga cctggatgtc gtggccgaca ctggcgggga ggaagacacc 480
gaggatcagg gcctgacagg ggatgaagct gagccctttc tggaccagtc aggaggcccc 540
ggagcaccta ccacacccag aaagctgcca agcagacccc ctccacacta ccccggcatc 600
aagcgaaaac gatcagcacc aaccagccgg aagctgctgt ccgacaaacc tcagccatca 660
gaggacaaag aagatatcga gagcaacctg ctgcgaccca ccggagtcgc actgcggggc 720
gcccacttct gtctgaaagt gtttcgcgct gaggacctgc cccagatgga cgatgcagtg 780
atggataatg tcaagcagat cttcggcttt gaaagcaaca agaaaaatct ggtggacccc 840
ttcgtggagg tctcctttgc cgggaagatg ctgtgctcta agatcctgga gaaaacagcc 900
aaccctcagt ggaaccagaa tattactctg ccagctatgt tccccagcat gtgtgagaaa 960
atgcgcatcc gaatcattga ctgggataga ctgacacaca atgatattgt ggccactacc 1020
tatctgtcta tgagtaagat ctccgctcca gggggagaga ttgaggaaga gcccgcaggc 1080
gccgtgaagc cttctaaagc cagtgacctg gacgattacc tggggtttct gcctacattc 1140
ggaccatgct atatcaacct gtacgggtcc ccccgggagt ttactggatt cccagatccc 1200
tacacagaac tgaatactgg aaagggcgag ggggtggctt atcggggcag actgctgctg 1260
agtctggaga ccaagctggt cgaacattca gagcagaaag tggaagacct gcccgccgac 1320
gatatcctga gagtggagaa gtatctgcgg agaaggaaat acagtctgtt tgcagccttc 1380
tattcagcca ccatgctgca ggatgtcgac gatgctatcc agttcgaggt gagcattggg 1440
aactacggaa ataagtttga catgacatgc ctgcctctgg caagtacaac tcagtattca 1500
cgggccgtct tcgatgggtg tcactactat tacctgccct ggggaaacgt gaagcccgtc 1560
gtggtcctga gctcctactg ggaagacatc tcccaccgca ttgagacaca gaatcagctg 1620
ctgggaatcg ccgatcggct ggaagctggc ctggagcagg tgcatctggc actgaaggcc 1680
cagtgctcaa ccgaagacgt ggatagcctg gtcgctcagc tgacagacga gctgatcgca 1740
ggctgttctc agcctctggg ggacattcac gagaccccaa gtgccacaca tctggatcag 1800
tatctgtacc agctgagaac acaccatctg agtcagatca ctgaagctgc actggctctg 1860
aagctgggcc actcagagct gcctgccgct ctggaacagg cagaggactg gctgctgagg 1920
ctgcgagctc tggcagaaga gcctcagaac tctctgccag acatcgtgat ttggatgctg 1980
cagggagata agagggtggc ctaccagcgc gtcccagctc atcaggtgct gttcagtcgc 2040
cgaggcgcta actactgcgg aaagaattgt ggcaaactgc agaccatctt tctgaagtat 2100
cctatggaga aagtgcctgg cgcccgaatg ccagtgcaga ttcgggtcaa gctgtggttc 2160
gggctgagcg tggacgaaaa ggagtttaat cagttcgccg aaggaaaact gtccgtcttt 2220
gctgagacat acgaaaacga gactaagctg gccctggtgg gcaattgggg gaccacagga 2280
ctgacctatc ccaagttcag cgacgtgaca ggcaagatca aactgcctaa agattccttc 2340
cggccatctg cagggtggac atgggcagga gactggtttg tgtgccctga aaagactctg 2400
ctgcacgaca tggatgccgg gcatctgtcc ttcgtggaag aggtctttga gaaccagact 2460
agactgccag gcgggcagtg gatctatatg tctgacaact acaccgatgt caatggcgag 2520
aaggtgctgc caaaagacga tattgaatgt cccctggggt ggaagtggga ggacgaagag 2580
tggtctaccg atctgaatcg ggctgtggac gaacagggct gggagtacag tatcacaatt 2640
ccccctgaaa gaaagcccaa acactgggtg cctgccgaga aaatgtatta cacccatcga 2700
agaaggcgat gggtgaggct gcgacggaga gacctgagcc agatggaggc cctgaagcga 2760
caccgacagg cagaagctga gggagaaggc tgggaatacg catccctgtt tggctggaag 2820
ttccatctgg agtatcgcaa aactgatgcc ttcaggcgcc gacgatggag aaggcgaatg 2880
gaaccactgg agaagaccgg acctgcagcc gtctttgctc tggaaggggc actgggaggc 2940
gtgatggacg ataaaagcga ggactcaatg agcgtgtcca ccctgtcctt tggcctgttc 3000
ccaaaggcac tgggaaggcc aggaccaccc ttcaacatca caccccgacg ggctagaagg 3060
ttctttctga gatgcatcat ttggaatact agggacgtga ttctggacga tctgagcctg 3120
accggggaga agatgtccga tatctacgtg aaagggtgga tgattggatt cgaagagcac 3180
aagcagaaaa cagacgtgca ttatcgctct ctggggggag aaggaaactt taattggcgg 3240
ttcatctttc cattcgatta cctgcccgca gagcaggtgg ctaccattgc aaagaaagat 3300
gccttctgga gactggacaa gacagagagc aaaatccctg ccagggtggt cttccagatt 3360
tgggacaacg ataagttttc tttcgacgat tttctgggca gtctgcagct ggacctgaat 3420
aggatgccta agccagccaa aaccgctaag aaagcatcac tggatcagct ggacgatgcc 3480
tttcaccctg aatggtttgt gagcctgttc gagcagaaga cagtcaaagg ctggtggcca 3540
tgtgtggcag aagagggcga gaagaaaatc ctggccggga aactggaaat gactctggag 3600
attgtggctg agtctgaaca tgaagagaga cccgcagggc agggaaggga cgaacccaac 3660
atgaatccta agctggagga ccccagacga cctgatacct cctttctgtg gttcacctct 3720
ccttacaaga caatgaaatt catcctgtgg cggagatttc gctgggccat cattctgttt 3780
atcattctgt tcattctgct gctgtttctg gctatcttca tctacgcatt tccaaactac 3840
gctgcaatga agctggtgaa acccttcagc tga 3873
<210> 4
<211> 4476
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(4476)
<223> 克隆_342 无 Flag (426)
<400> 4
atgctgagag tctttattct gtacgctgaa aacgtgcata cccctgatac cgacattagt 60
gacgcttatt gctccgctgt gttcgccggc gtcaagaaac gcacaaaagt gatcaagaac 120
agcgtgaatc ctgtctggaa cgaggggttc gaatgggatc tgaagggaat cccactggac 180
cagggctccg aactgcacgt ggtcgtgaaa gaccatgaga caatgggcag gaaccgcttc 240
ctgggagagg ctaaggtgcc tctgcgggaa gtcctggcaa caccatctct gagtgcaagc 300
ttcaacgccc ccctgctgga tactaagaaa cagcctaccg gcgcttcact ggtgctgcag 360
gtcagctata cccctctgcc aggagcagtg ccactgttcc cacctccaac tccactggaa 420
ccaagcccta ccctgcccga cctggatgtc gtggccgaca ctggcgggga ggaagacacc 480
gaggatcagg ggctgacagg agatgaagcc gagccttttc tggaccagag cggcggacca 540
ggagctccaa ccacacctcg caagctgcca tctcgacccc ctccacatta ccccggaatc 600
aagcgaaaac ggtcagcccc aactagccgc aagctgctga gtgacaaacc tcagtcaaac 660
ctgctgcgac caaccggggt cgctctgcga ggagcacact tctgcctgaa agtgtttcgg 720
gccgaggacc tgccccagat ggacgatgct gtgatggata atgtcaagca gatcttcgga 780
ttcgaatcta acaagaaaaa tctggtggat cctttcgtgg aggtctcctt tgccggcaag 840
atgctgtgct ctaagattct ggagaaaact gcaaacccac agtggaacca gaatatcacc 900
ctgccagcca tgttcccctc tatgtgtgag aaaatgagaa ttaggatcat tgactgggat 960
agactgaccc acaatgacat cgtggcaact acctatctga gcatgtccaa gattagcgcc 1020
cctgggggag agatcgagga agagcctgct ggcgcagtga agccatctaa agccagtgac 1080
ctggacgatt acctgggctt tctgcctact ttcgggccat gttatatcaa cctgtacggg 1140
agcccaagag agtttaccgg attcccagat ccctacacag agctgaatac tggcaagggg 1200
gaaggagtgg cttatcgcgg ccgactgctg ctgagtctgg agaccaagct ggtcgagcac 1260
tcagaacaga aagtggaaga cctgccagcc gacgatatcc tgagggtgga gaagtatctg 1320
cggagaagga aatacagcct gtttgccgct ttctattccg caacaatgct gcaggatgtc 1380
gacgatgcca ttcagttcga ggtgtctatc ggcaactacg ggaataagtt tgacatgact 1440
tgcctgcctc tggctagcac aactcagtat tccagagcag tcttcgatgg atgtcactac 1500
tattacctgc cctggggcaa cgtgaagcct gtcgtggtcc tgagctccta ctgggaggac 1560
attagccata gaatcgaaac ccagaatcag ctgctgggaa tcgcagatag gctggaggca 1620
ggactggaac aggtgcacct ggctctgaag gcacagtgct ccacagaaga cgtggattct 1680
ctggtcgccc agctgactga cgagctgatt gctggatgtt ctcagcctct gggcgacatc 1740
cacgagaccc caagtgccac acatctggat cagtatctgt accagctgag gacacaccat 1800
ctgagtcaga tcactgaagc agccctggcc ctgaagctgg gccattcaga gctgcccgct 1860
gcactggagc aggctgaaga ctggctgctg cggctgagag ccctggctga agagccacag 1920
aacagcctgc ccgacatcgt gatttggatg ctgcaggggg ataagcgggt ggcataccag 1980
agagtccctg cacaccaggt gctgttctcc cgccgaggag ctaactactg cgggaagaat 2040
tgtggaaaac tgcagaccat ttttctgaag tatcctatgg agaaagtgcc aggagcccga 2100
atgcccgtgc agatccgggt caagctgtgg ttcggcctga gcgtggacga aaaggagttt 2160
aatcagttcg cagaggggaa actgtccgtc tttgccgaaa catacgaaaa cgagactaag 2220
ctggccctgg tgggaaattg gggcaccaca gggctgacct atcccaagtt ctccgacgtg 2280
acaggcaaga tcaaactgcc aaaagattcc ttcagaccct ctgctggctg gacttgggca 2340
ggggactggt ttgtgtgccc agaaaagacc ctgctgcacg acatggatgc cggccatctg 2400
agtttcgtgg aagaggtctt tgagaaccag accaggctgc caggaggaca gtggatctac 2460
atgtcagaca actacacaga tgtcaatgga gagaaggtgc tgcccaaaga cgatatcgag 2520
tgtcctctgg gctggaagtg ggaagacgaa gagtggtcta cagatctgaa tcgcgcagtg 2580
gacgagcagg gctgggaata cagtatcact attccccctg aacggaagcc taaacactgg 2640
gtgccagccg agaaaatgta ttacacccat cgaagaaggc gatgggtgcg cctgcgacgg 2700
agagacctgt ctcagatgga ggccctgaag aggcatcgac aggcagaagc agagggagaa 2760
ggatgggaat acgctagtct gtttggctgg aagttccacc tggagtatcg gaaaacagat 2820
gcattcaggc gccgacgatg gagaaggcga atggagcctc tggaaaaaac tgggccagcc 2880
gctgtctttg ccctggaagg agctctggga ggcgtgatgg acgataagag cgaggactct 2940
atgagtgtgt caactctgtc cttcggcctg gtcaggatct acattgtgcg cgcctttggg 3000
ctgcagccaa aggatcccaa cggaaaatgc gacccctaca tcaaaatttc catcggcaag 3060
aaaagcgtct ccgaccagga taattatatc ccctgcaccc tggagcctgt gtttgggaag 3120
atgttcgaac tgacttgtac cctgcctctg gagaaggacc tgaaaattac cctgtatgac 3180
tacgatctgc tgtccaagga cgagaaaatc ggggaaacag tggtcgatct ggagaacaga 3240
ctgctgtcta agttcggagc tagatgcgga ctgccacaga cctattgtgt gtcaggacct 3300
aatcagtgga gagatcagct gaggcccagc cagctgctgc acctgttctg tcagcagcat 3360
agggtgaagg cccctgtcta ccgaacagat agagtgatgt ttcaggacaa agagtatagc 3420
attgaagaga tcgaagccgg ccgcattcct aacccacacc tgggacccgt cgaagagcga 3480
ctggctctgc atgtgctgca gcagcaggga ctggtgccag agcacgtcga atctagaccc 3540
ctgtacagtc ctctgcagcc agacatcgag cagggcaagc tgcagatgtg ggtggatctg 3600
ttccccaaag cactgggaag gcctggccca ccctttaaca ttacaccccg acgggccaga 3660
aggttctttc tgcgctgcat catttggaat acccgggacg tgatcctgga cgatctgtct 3720
ctgacaggcg agaagatgag tgatatctac gtgaaaggat ggatgatcgg cttcgaagag 3780
cacaagcaga aaaccgacgt gcattatcgc agcctggggg gagaagggaa ctttaattgg 3840
cggttcattt ttccattcga ttacctgccc gctgagcagg tggccacaat cgctaagaaa 3900
gatgcattct ggagactgga caagactgag tccaaaattc ccgccagggt ggtcttccag 3960
atctgggaca acgataagtt ttcattcgac gattttctgg gcagcctgca gctggacctg 4020
aatcgcatgc ccaagcctgc aaaaacagcc aagaaagctt cactggatca gctggacgat 4080
gcctttcatc cagagtggtt tgtgagcctg ttcgaacaga agactgtcaa aggatggtgg 4140
ccatgcgtgg ctgaagaggg agagaagaaa attctggcag ggaaactgga gatgaccctg 4200
gaaatcgtgg ccgagagcga acacgaagag agacctgctg gacagggcag ggacgaaccc 4260
aacatgaatc ctaagctgga ggaccccaga cgacctgata ccagttttct gtggttcacc 4320
tcaccataca agacaatgaa attcattctg tggcggagat ttcggtgggc catcattctg 4380
tttatcattc tgttcatcct gctgctgttt ctggccattt tcatctatgc ttttccaaac 4440
tacgcagcca tgaagctggt gaaacccttc tcctga 4476
<210> 5
<211> 4287
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> misc_feature
<222> (1)..(4287)
<223> 克隆_425 无 Flag (425)
<400> 5
atgctgcgag tctttattct gtatgccgaa aacgtccaca cccccgacac cgacatctct 60
gatgcttact gctccgccgt ctttgccggg gtcaagaaaa ggaccaaagt gatcaagaac 120
agtgtgaatc ctgtctggaa cgagggattc gaatgggatc tgaagggcat tccactggac 180
caggggtcag aactgcacgt ggtcgtgaaa gaccatgaga caatgggaag gaaccgcttc 240
ctgggcgaag caaaggtgcc tctgcgagag gtcctggcaa ctccatctct gagtgccagc 300
ttcaacgctc ccctgctgga tactaagaaa cagcctaccg gggcaagcct ggtgctgcag 360
gtctcctata cacctctgcc aggagcagtg cctctgttcc cacctccaac tccactggaa 420
cccagcccta ccctgccaga cctggatgtc gtggccgaca ctggcgggga ggaagacacc 480
gaggatcagg gcctgacagg ggatgaagct gagccctttc tggaccagtc aggaggcccc 540
ggagcaccta ccacacccag aaagctgcca agcagacccc ctccacacta ccccggcatc 600
aagcgaaaac gatcagcacc aaccagccgg aagctgctgt ccgacaaacc tcaggatttt 660
cagatccgcg tgcaggtcat tgagggccga cagctgcctg gggtcaacat caagccagtc 720
gtgaaagtga ctgccgctgg acagactaag agaaccagga ttcataaagg caactccccc 780
ctgttcaatg agaccctgtt ctttaatctg tttgattctc ccggcgaact gttcgacgag 840
cctatcttta ttactgtcgt ggatagcaga tccctgagga ccgacgctct gctgggagaa 900
ttcagaatgg acgtgggcac tatctatcgc gagccccgac acgcctacct gaggaaatgg 960
ctgctgctgt ctgatcctga cgattttagt gccggagctc gcggctacct gaagacctct 1020
ctgtgcgtgc tgggaccagg ggatgaagca ccactggaga ggaaggaccc atcagaggac 1080
aaagaagata tcgagagcaa cctgctgcga cccaccggag tcgcactgcg gggcgcccac 1140
ttctgtctga aagtgtttcg cgctgaggac ctgccccaga tggacgatgc agtgatggat 1200
aatgtcaagc agatcttcgg ctttgaaagc aacaagaaaa atctggtgga ccccttcgtg 1260
gaggtctcct ttgccgggaa gatgctgtgc tctaagatcc tggagaaaac agccaaccct 1320
cagtggaacc agaatattac tctgccagct atgttcccca gcatgtgtga gaaaatgcgc 1380
atccgaatca ttgactggga tagactgaca cacaatgata ttgtggccac tacctatctg 1440
tctatgagta agatctccgc tccaggggga gagattgagg aagagcccgc aggcgccgtg 1500
aagccttcta aagccagtga cctggacgat tacctggggt ttctgcctac attcggacca 1560
tgctatatca acctgtacgg gtccccccgg gagtttactg gattcccaga tccctacaca 1620
gaactgaata ctggaaaggg cgagggggtg gcttatcggg gcagactgct gctgagtctg 1680
gagaccaagc tggtcgaaca ttcagagcag aaagtggaag acctgcccgc cgacgatatc 1740
ctgagagtgg agaagtatct gcggagaagg aaatacagtc tgtttgcagc cttctattca 1800
gccaccatgc tgcaggatgt cgacgatgct atccagttcg aggtgagcat tgggaactac 1860
ggaaataagt ttgacatgac atgcctgcct ctggcaagta caactcagta ttcacgggcc 1920
gtcttcgatg ggtgtcacta ctattacctg ccctggggaa acgtgaagcc cgtcgtggtc 1980
ctgagctcct actgggaaga catctcccac cgcattgaga cacagaatca gctgctggga 2040
atcgccgatc ggctggaagc tggcctggag caggtgcatc tggcactgaa ggcccagtgc 2100
tcaaccgaag acgtggatag cctggtcgct cagctgacag acgagctgat cgcaggctgt 2160
tctcagcctc tgggggacat tcacgagacc ccaagtgcca cacatctgga tcagtatctg 2220
taccagctga gaacacacca tctgagtcag atcactgaag ctgcactggc tctgaagctg 2280
ggccactcag agctgcctgc cgctctggaa caggcagagg actggctgct gaggctgcga 2340
gctctggcag aagagcctca gaactctctg ccagacatcg tgatttggat gctgcaggga 2400
gataagaggg tggcctacca gcgcgtccca gctcatcagg tgctgttcag tcgccgaggc 2460
gctaactact gcggaaagaa ttgtggcaaa ctgcagacca tctttctgaa gtatcctatg 2520
gagaaagtgc ctggcgcccg aatgccagtg cagattcggg tcaagctgtg gttcgggctg 2580
agcgtggacg aaaaggagtt taatcagttc gccgaaggaa aactgtccgt ctttgctgag 2640
acatacgaaa acgagactaa gctggccctg gtgggcaatt gggggaccac aggactgacc 2700
tatcccaagt tcagcgacgt gacaggcaag atcaaactgc ctaaagattc cttccggcca 2760
tctgcagggt ggacatgggc aggagactgg tttgtgtgcc ctgaaaagac tctgctgcac 2820
gacatggatg ccgggcatct gtccttcgtg gaagaggtct ttgagaacca gactagactg 2880
ccaggcgggc agtggatcta tatgtctgac aactacaccg atgtcaatgg cgagaaggtg 2940
ctgccaaaag acgatattga atgtcccctg gggtggaagt gggaggacga agagtggtct 3000
accgatctga atcgggctgt ggacgaacag ggctgggagt acagtatcac aattccccct 3060
gaaagaaagc ccaaacactg ggtgcctgcc gagaaaatgt attacaccca tcgaagaagg 3120
cgatgggtga ggctgcgacg gagagacctg agccagatgg aggccctgaa gcgacaccga 3180
caggcagaag ctgagggaga aggctgggaa tacgcatccc tgtttggctg gaagttccat 3240
ctggagtatc gcaaaactga tgccttcagg cgccgacgat ggagaaggcg aatggaacca 3300
ctggagaaga ccggacctgc agccgtcttt gctctggaag gggcactggg aggcgtgatg 3360
gacgataaaa gcgaggactc aatgagcgtg tccaccctgt cctttggcct gttcccaaag 3420
gcactgggaa ggccaggacc acccttcaac atcacacccc gacgggctag aaggttcttt 3480
ctgagatgca tcatttggaa tactagggac gtgattctgg acgatctgag cctgaccggg 3540
gagaagatgt ccgatatcta cgtgaaaggg tggatgattg gattcgaaga gcacaagcag 3600
aaaacagacg tgcattatcg ctctctgggg ggagaaggaa actttaattg gcggttcatc 3660
tttccattcg attacctgcc cgcagagcag gtggctacca ttgcaaagaa agatgccttc 3720
tggagactgg acaagacaga gagcaaaatc cctgccaggg tggtcttcca gatttgggac 3780
aacgataagt tttctttcga cgattttctg ggcagtctgc agctggacct gaataggatg 3840
cctaagccag ccaaaaccgc taagaaagca tcactggatc agctggacga tgcctttcac 3900
cctgaatggt ttgtgagcct gttcgagcag aagacagtca aaggctggtg gccatgtgtg 3960
gcagaagagg gcgagaagaa aatcctggcc gggaaactgg aaatgactct ggagattgtg 4020
gctgagtctg aacatgaaga gagacccgca gggcagggaa gggacgaacc caacatgaat 4080
cctaagctgg aggaccccag acgacctgat acctcctttc tgtggttcac ctctccttac 4140
aagacaatga aattcatcct gtggcggaga tttcgctggg ccatcattct gtttatcatt 4200
ctgttcattc tgctgctgtt tctggctatc ttcatctacg catttccaaa ctacgctgca 4260
atgaagctgg tgaaaccctt cagctga 4287
<210> 6
<211> 1499
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> DOMAIN
<222> (1)..(1499)
<223> 318 无 flag (433)
<400> 6
Met Leu Arg Val Phe Ile Leu Tyr Ala Glu Asn Val His Thr Pro Asp
1 5 10 15
Thr Asp Ile Ser Asp Ala Tyr Cys Ser Ala Val Phe Ala Gly Val Lys
20 25 30
Lys Arg Thr Lys Val Ile Lys Asn Ser Val Asn Pro Val Trp Asn Glu
35 40 45
Gly Phe Glu Trp Asp Leu Lys Gly Ile Pro Leu Asp Gln Gly Ser Glu
50 55 60
Leu His Val Val Val Lys Asp His Glu Thr Met Gly Arg Asn Arg Phe
65 70 75 80
Leu Gly Glu Ala Lys Val Pro Leu Arg Glu Val Leu Ala Thr Pro Ser
85 90 95
Leu Ser Ala Ser Phe Asn Ala Pro Leu Leu Asp Thr Lys Lys Gln Pro
100 105 110
Thr Gly Ala Ser Leu Val Leu Gln Val Ser Tyr Thr Asp Leu Asp Val
115 120 125
Val Ala Asp Thr Gly Glu Glu Asp Thr Glu Asp Gln Gly Leu Thr Pro
130 135 140
Phe Leu Asp Gln Ser Gly Gly Pro Arg Lys Leu Pro Ser Arg Gly Ile
145 150 155 160
Lys Arg Lys Arg Ser Ile Arg Val Gln Val Ile Glu Gly Arg Gln Leu
165 170 175
Pro Gly Val Asn Ile Lys Pro Val Val Lys Val Thr Ala Ala Gly Gln
180 185 190
Thr Lys Arg Thr Arg Ile His Lys Gly Asn Ser Pro Leu Phe Asn Glu
195 200 205
Thr Leu Phe Phe Asn Leu Phe Asp Ser Pro Gly Glu Leu Phe Asp Glu
210 215 220
Pro Ile Phe Ile Thr Val Val Asp Ser Arg Ser Leu Arg Thr Asp Ala
225 230 235 240
Leu Leu Gly Glu Phe Arg Met Asp Val Gly Thr Ile Tyr Arg Glu Pro
245 250 255
Arg His Ala Tyr Leu Arg Lys Trp Leu Leu Leu Ser Asp Pro Asp Asp
260 265 270
Phe Ser Ala Gly Ala Arg Gly Tyr Leu Lys Thr Ser Leu Cys Val Leu
275 280 285
Gly Pro Gly Asp Glu Ala Pro Leu Glu Arg Lys Asp Pro Ser Glu Asp
290 295 300
Lys Glu Asp Ile Glu Ser Asn Leu Leu Arg Pro Thr Gly Val Ala Leu
305 310 315 320
Arg Gly Ala His Phe Cys Leu Lys Val Phe Arg Ala Glu Asp Leu Pro
325 330 335
Gln Met Asp Asp Ala Val Met Asp Asn Val Lys Gln Ile Phe Gly Phe
340 345 350
Glu Ser Asn Lys Lys Asn Leu Val Asp Pro Phe Val Glu Val Ser Phe
355 360 365
Ala Gly Lys Met Leu Cys Ser Lys Ile Leu Glu Lys Thr Ala Asn Pro
370 375 380
Gln Trp Asn Gln Asn Ile Thr Leu Pro Ala Met Phe Pro Ser Met Cys
385 390 395 400
Glu Lys Met Arg Ile Arg Ile Ile Asp Trp Asp Arg Leu Thr His Asn
405 410 415
Asp Ile Val Ala Thr Thr Tyr Leu Ser Met Ser Lys Ile Ser Ala Pro
420 425 430
Gly Gly Glu Ile Glu Glu Glu Pro Ala Gly Ala Val Lys Pro Ser Lys
435 440 445
Ala Ser Asp Leu Asp Asp Tyr Leu Gly Phe Leu Glu His Ser Glu Gln
450 455 460
Lys Val Glu Asp Leu Pro Ala Asp Asp Ile Leu Arg Val Glu Lys Tyr
465 470 475 480
Leu Arg Arg Arg Lys Tyr Ser Leu Phe Ala Ala Phe Tyr Ser Ala Thr
485 490 495
Met Leu Gln Asp Val Asp Asp Ala Ile Gln Phe Glu Val Ser Ile Gly
500 505 510
Asn His Arg Ile Glu Thr Gln Asn Gln Leu Leu Gly Ile Ala Asp Arg
515 520 525
Leu Glu Ala Gly Leu Glu Gln Val His Leu Ala Leu Lys Ala Gln Cys
530 535 540
Ser Thr Glu Asp Val Asp Ser Leu Val Ala Gln Leu Thr Asp Glu Leu
545 550 555 560
Ile Ala Gly Cys Ser Gln Pro Leu Gly Asp Ile His Glu Thr Pro Ser
565 570 575
Ala Thr His Leu Asp Gln Tyr Leu Tyr Gln Leu Arg Thr His His Leu
580 585 590
Ser Gln Ile Thr Glu Ala Ala Leu Ala Leu Lys Leu Gly His Ser Glu
595 600 605
Leu Pro Ala Ala Leu Glu Gln Ala Glu Asp Trp Leu Leu Arg Leu Arg
610 615 620
Ala Leu Lys Leu Gln Thr Ile Phe Leu Lys Tyr Pro Met Glu Lys Val
625 630 635 640
Pro Gly Ala Arg Met Pro Val Gln Ile Arg Val Lys Leu Trp Phe Gly
645 650 655
Leu Ser Val Asp Glu Lys Glu Phe Asn Gln Phe Ala Glu Gly Lys Leu
660 665 670
Ser Val Phe Ala Glu Thr Tyr Glu Asn Glu Thr Lys Leu Ala Leu Val
675 680 685
Met Asp Ala Gly His Leu Ser Phe Val Glu Glu Val Phe Glu Asn Gln
690 695 700
Thr Arg Leu Pro Gly Gly Gln Trp Ile Tyr Met Ser Asp Asn Tyr Thr
705 710 715 720
Asp Val Asn Gly Glu Lys Val Leu Pro Lys Asp Asp Ile Glu Cys Pro
725 730 735
Leu Gly Trp Lys Trp Glu Asp Glu Glu Trp Ser Thr Asp Leu Asn Arg
740 745 750
Ala Val Asp Glu Gln Gly Trp Glu Tyr Ser Ile Thr Ile Pro Pro Glu
755 760 765
Arg Lys Pro Lys His Trp Val Pro Ala Glu Lys Met Tyr Tyr Thr His
770 775 780
Arg Arg Arg Arg Trp Val Arg Leu Arg Arg Arg Asp Leu Ser Gln Met
785 790 795 800
Glu Ala Leu Lys Arg His Arg Gln Ala Glu Ala Glu Gly Glu Gly Trp
805 810 815
Glu Tyr Ala Ser Leu Phe Gly Trp Lys Phe His Leu Glu Tyr Arg Lys
820 825 830
Thr Asp Ala Phe Arg Arg Arg Arg Trp Arg Arg Arg Met Glu Pro Leu
835 840 845
Glu Lys Thr Pro Ala Ile His His Ile Pro Gly Phe Glu Val Gln Glu
850 855 860
Thr Ser Arg Ile Leu Asp Glu Ser Glu Asp Thr Asp Leu Pro Tyr Pro
865 870 875 880
Pro Pro Gln Arg Glu Ala Asn Ile Tyr Met Val Pro Gln Asn Ile Lys
885 890 895
Pro Ala Leu Gln Arg Thr Ala Ile Glu Ile Leu Ala Trp Gly Leu Arg
900 905 910
Asn Met Lys Ser Tyr Gln Leu Ala Asn Ile Ser Ser Pro Ser Leu Val
915 920 925
Val Glu Cys Gly Gly Gln Thr Val Gln Ser Cys Val Ile Arg Asn Leu
930 935 940
Arg Lys Asn Pro Asn Phe Asp Ile Cys Thr Leu Phe Met Glu Val Met
945 950 955 960
Leu Pro Arg Glu Glu Leu Tyr Cys Pro Pro Ile Thr Val Lys Val Ile
965 970 975
Asp Asn Arg Gln Phe Gly Arg Arg Pro Val Val Gly Gln Cys Thr Ile
980 985 990
Arg Ser Leu Glu Ser Phe Leu Cys Asp Pro Tyr Ser Ala Glu Ser Pro
995 1000 1005
Ser Pro Gln Gly Gly Pro Asp Asp Val Ser Leu Leu Ser Pro Gly Glu
1010 1015 1020
Asp Val Leu Ile Asp Ile Asp Asp Lys Glu Pro Glu Lys Asp Phe Asp
1025 1030 1035 1040
Thr Leu Lys Val Tyr Asp Thr Gln Leu Glu Asn Val Glu Ala Phe Glu
1045 1050 1055
Gly Asn Thr Phe Lys Leu Tyr Arg Gly Lys Thr Asp Pro Ser Val Ile
1060 1065 1070
Gly Glu Phe Lys Gly Leu Leu Val Arg Ile Tyr Ile Val Arg Ala Phe
1075 1080 1085
Gly Leu Gln Pro Lys Asp Pro Asn Gly Lys Cys Asp Pro Tyr Ile Lys
1090 1095 1100
Ile Ser Ile Gly Lys Lys Ser Val Ser Asp Gln Asp Asn Tyr Ile Pro
1105 1110 1115 1120
Cys Thr Leu Glu Pro Val Phe Gly Lys Met Phe Glu Leu Thr Cys Thr
1125 1130 1135
Leu Pro Leu Glu Lys Asp Leu Lys Ile Thr Leu Tyr Asp Tyr Asp Leu
1140 1145 1150
Leu Ser Lys Asp Glu Lys Ile Gly Glu Thr Val Val Asp Leu Glu Asn
1155 1160 1165
Arg Leu Leu Ser Lys Phe Gly Ala Arg Cys Gly Leu Pro Gln Thr Tyr
1170 1175 1180
Cys Val Ser Gly Pro Asn Gln Trp Arg Asp Gln Leu Thr Gln Asp Lys
1185 1190 1195 1200
Glu Tyr Ser Ile Glu Glu Ile Glu Ala Gly Arg Ile Pro Asn Pro Glu
1205 1210 1215
Glu Arg Leu Ala Leu His Val Leu Gln Gln Gln Gly Leu Val Pro Glu
1220 1225 1230
His Val Lys Ala Leu Gly Arg Pro Gly Pro Pro Phe Asn Ile Thr Pro
1235 1240 1245
Arg Arg Ala Arg Arg Phe Phe Leu Arg Cys Ile Ile Trp Asn Thr Arg
1250 1255 1260
Asp Val Ile Leu Asp Asp Leu Ser Leu Thr Gly Glu Lys Met Ser Asp
1265 1270 1275 1280
Ile Tyr Val Lys Gly Trp Met Ile Gly Phe Glu Glu His Lys Gln Lys
1285 1290 1295
Thr Asp Val His Tyr Arg Ser Leu Gly Gly Glu Gly Asn Phe Asn Trp
1300 1305 1310
Arg Phe Ile Phe Pro Phe Asp Tyr Leu Pro Ala Glu Gln Val Cys Thr
1315 1320 1325
Ile Ala Lys Lys Asp Ala Phe Trp Arg Leu Asp Lys Thr Glu Ser Lys
1330 1335 1340
Ile Pro Ala Arg Val Val Phe Gln Ile Trp Asp Asn Asp Lys Phe Ser
1345 1350 1355 1360
Phe Asp Asp Phe Leu Gly Ser Leu Gln Leu Asp Leu Asn Arg Met Pro
1365 1370 1375
Lys Pro Ala Lys Thr Ala Lys Lys Cys Ser Leu Asp Gln Leu Asp Asp
1380 1385 1390
Ala Phe His Pro Glu Trp Phe Val Ser Leu Phe Glu Gln Lys Thr Val
1395 1400 1405
Lys Gly Trp Trp Pro Cys Val Ala Glu Glu Gly Glu Lys Lys Ile Leu
1410 1415 1420
Ala Gly Lys Leu Glu Met Thr Leu Glu Ile Val Ala Glu Arg Pro Ala
1425 1430 1435 1440
Gly Pro Arg Arg Pro Asp Thr Ser Phe Leu Trp Phe Thr Ser Lys Phe
1445 1450 1455
Ile Leu Trp Arg Arg Phe Arg Trp Ala Ile Ile Leu Phe Ile Ile Leu
1460 1465 1470
Phe Ile Leu Leu Leu Phe Leu Ala Ile Phe Ile Tyr Ala Phe Pro Asn
1475 1480 1485
Tyr Ala Ala Met Lys Leu Val Lys Pro Phe Ser
1490 1495
<210> 7
<211> 1427
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> DOMAIN
<222> (1)..(1427)
<223> 431 无 Flag (431)
<400> 7
Met Leu Arg Val Phe Ile Leu Tyr Ala Glu Asn Val His Thr Pro Asp
1 5 10 15
Thr Asp Ile Ser Asp Ala Tyr Cys Ser Ala Val Phe Ala Gly Val Lys
20 25 30
Lys Arg Thr Lys Val Ile Lys Asn Ser Val Asn Pro Val Trp Asn Glu
35 40 45
Gly Phe Glu Trp Asp Leu Lys Gly Ile Pro Leu Asp Gln Gly Ser Glu
50 55 60
Leu His Val Val Val Lys Asp His Glu Thr Met Gly Arg Asn Arg Phe
65 70 75 80
Leu Gly Glu Ala Lys Val Pro Leu Arg Glu Val Leu Ala Thr Pro Ser
85 90 95
Leu Ser Ala Ser Phe Asn Ala Pro Leu Leu Asp Thr Lys Lys Gln Pro
100 105 110
Thr Gly Ala Ser Leu Val Leu Gln Val Ser Tyr Thr Pro Leu Pro Gly
115 120 125
Ala Val Pro Leu Phe Pro Pro Pro Thr Pro Leu Glu Pro Ser Pro Thr
130 135 140
Leu Pro Asp Leu Asp Val Val Ala Asp Thr Gly Gly Glu Glu Asp Thr
145 150 155 160
Glu Asp Gln Gly Leu Thr Gly Asp Glu Ala Glu Pro Phe Leu Asp Gln
165 170 175
Ser Gly Gly Pro Gly Ala Pro Thr Thr Pro Arg Lys Leu Pro Ser Arg
180 185 190
Pro Pro Pro His Tyr Pro Gly Ile Lys Arg Lys Arg Ser Ala Pro Thr
195 200 205
Ser Arg Lys Leu Leu Ser Asp Lys Pro Gln Asp Phe Gln Ile Arg Val
210 215 220
Gln Val Ile Glu Gly Arg Gln Leu Pro Gly Val Asn Ile Lys Pro Val
225 230 235 240
Val Lys Val Thr Ala Ala Gly Gln Thr Lys Arg Thr Arg Ile His Lys
245 250 255
Gly Asn Ser Pro Leu Phe Asn Glu Thr Leu Phe Phe Asn Leu Phe Asp
260 265 270
Ser Pro Gly Glu Leu Phe Asp Glu Pro Ile Phe Ile Thr Val Val Asp
275 280 285
Ser Arg Ser Leu Arg Thr Asp Ala Leu Leu Gly Glu Phe Arg Met Asp
290 295 300
Val Gly Thr Ile Tyr Arg Glu Pro Arg His Ala Tyr Leu Arg Lys Trp
305 310 315 320
Leu Leu Leu Ser Asp Pro Asp Asp Phe Ser Ala Gly Ala Arg Gly Tyr
325 330 335
Leu Lys Thr Ser Leu Cys Val Leu Gly Pro Gly Asp Glu Ala Pro Leu
340 345 350
Glu Arg Lys Asp Pro Ser Glu Asp Lys Glu Asp Ile Glu Ser Asn Leu
355 360 365
Leu Arg Pro Thr Gly Val Ala Leu Arg Gly Ala His Phe Cys Leu Lys
370 375 380
Val Phe Arg Ala Glu Asp Leu Pro Gln Met Asp Asp Ala Val Met Asp
385 390 395 400
Asn Val Lys Gln Ile Phe Gly Phe Glu Ser Asn Lys Lys Asn Leu Val
405 410 415
Asp Pro Phe Val Glu Val Ser Phe Ala Gly Lys Met Leu Cys Ser Lys
420 425 430
Ile Leu Glu Lys Thr Ala Asn Pro Gln Trp Asn Gln Asn Ile Thr Leu
435 440 445
Pro Ala Met Phe Pro Ser Met Cys Glu Lys Met Arg Ile Arg Ile Ile
450 455 460
Asp Trp Asp Arg Leu Thr His Asn Asp Ile Val Ala Thr Thr Tyr Leu
465 470 475 480
Ser Met Ser Lys Ile Ser Ala Pro Gly Gly Glu Ile Glu Glu Glu Pro
485 490 495
Ala Gly Ala Val Lys Pro Ser Lys Ala Ser Asp Leu Asp Asp Tyr Leu
500 505 510
Gly Phe Leu Pro Thr Phe Gly Pro Cys Tyr Ile Asn Leu Tyr Gly Ser
515 520 525
Pro Arg Glu Phe Thr Gly Phe Pro Asp Pro Tyr Thr Glu Leu Asn Thr
530 535 540
Gly Lys Gly Glu Gly Val Ala Tyr Arg Gly Arg Leu Leu Leu Ser Leu
545 550 555 560
Glu Thr Lys Leu Val Glu His Ser Glu Gln Lys Val Glu Asp Leu Pro
565 570 575
Ala Asp Asp Ile Leu Arg Val Glu Lys Tyr Leu Arg Arg Arg Lys Tyr
580 585 590
Ser Leu Phe Ala Ala Phe Tyr Ser Ala Thr Met Leu Gln Asp Val Asp
595 600 605
Asp Ala Ile Gln Phe Glu Val Ser Ile Gly Asn Tyr Gly Asn Lys Phe
610 615 620
Asp Met Thr Cys Leu Pro Leu Ala Ser Thr Thr Gln Tyr Ser Arg Ala
625 630 635 640
Val Phe Asp Gly Cys His Tyr Tyr Tyr Leu Pro Trp Gly Asn Val Lys
645 650 655
Pro Val Val Val Leu Ser Ser Tyr Trp Glu Asp Ile Ser His Arg Ile
660 665 670
Glu Thr Gln Asn Gln Leu Leu Gly Ile Ala Asp Arg Leu Glu Ala Gly
675 680 685
Leu Glu Gln Val His Leu Ala Leu Lys Ala Gln Cys Ser Thr Glu Asp
690 695 700
Val Asp Ser Leu Val Ala Gln Leu Thr Asp Glu Leu Ile Ala Gly Cys
705 710 715 720
Ser Gln Pro Leu Gly Asp Ile His Glu Thr Pro Ser Ala Thr His Leu
725 730 735
Asp Gln Tyr Leu Tyr Gln Leu Arg Thr His His Leu Ser Gln Ile Thr
740 745 750
Glu Ala Ala Leu Ala Leu Lys Leu Gly His Ser Glu Leu Pro Ala Ala
755 760 765
Leu Glu Gln Ala Glu Asp Trp Leu Leu Arg Leu Arg Ala Leu Ala Glu
770 775 780
Glu Pro Gln Asn Ser Leu Pro Asp Ile Val Ile Trp Met Leu Gln Gly
785 790 795 800
Asp Lys Arg Val Ala Tyr Gln Arg Val Pro Ala His Gln Val Leu Phe
805 810 815
Ser Arg Arg Gly Ala Asn Tyr Cys Gly Lys Asn Cys Gly Lys Leu Gln
820 825 830
Thr Ile Phe Leu Lys Tyr Pro Met Glu Lys Val Pro Gly Ala Arg Met
835 840 845
Pro Val Gln Ile Arg Val Lys Leu Trp Phe Gly Leu Ser Val Asp Glu
850 855 860
Lys Glu Phe Asn Gln Phe Ala Glu Gly Lys Leu Ser Val Phe Ala Glu
865 870 875 880
Thr Tyr Glu Asn Glu Thr Lys Leu Ala Leu Val Gly Asn Trp Gly Thr
885 890 895
Thr Gly Leu Thr Tyr Pro Lys Phe Ser Asp Val Thr Gly Lys Ile Lys
900 905 910
Leu Pro Lys Asp Ser Phe Arg Pro Ser Ala Gly Trp Thr Trp Ala Gly
915 920 925
Asp Trp Phe Val Cys Pro Glu Lys Thr Leu Leu His Asp Met Asp Ala
930 935 940
Gly His Leu Ser Phe Val Glu Glu Val Phe Glu Asn Gln Thr Arg Leu
945 950 955 960
Pro Gly Gly Gln Trp Ile Tyr Met Ser Asp Asn Tyr Thr Asp Val Asn
965 970 975
Gly Glu Lys Val Leu Pro Lys Asp Asp Ile Glu Cys Pro Leu Gly Trp
980 985 990
Lys Trp Glu Asp Glu Glu Trp Ser Thr Asp Leu Asn Arg Ala Val Asp
995 1000 1005
Glu Gln Gly Trp Glu Tyr Ser Ile Thr Ile Pro Pro Glu Arg Lys Pro
1010 1015 1020
Lys His Trp Val Pro Ala Glu Lys Met Tyr Tyr Thr His Arg Arg Arg
1025 1030 1035 1040
Arg Trp Val Arg Leu Arg Arg Arg Asp Leu Ser Gln Met Glu Ala Leu
1045 1050 1055
Lys Arg His Arg Gln Ala Glu Ala Glu Gly Glu Gly Trp Glu Tyr Ala
1060 1065 1070
Ser Leu Phe Gly Trp Lys Phe His Leu Glu Tyr Arg Lys Thr Asp Ala
1075 1080 1085
Phe Arg Arg Arg Arg Trp Arg Arg Arg Met Glu Pro Leu Glu Lys Thr
1090 1095 1100
Gly Pro Ala Ala Val Phe Ala Leu Glu Gly Ala Leu Gly Gly Val Met
1105 1110 1115 1120
Asp Asp Lys Ser Glu Asp Ser Met Ser Val Ser Thr Leu Ser Phe Gly
1125 1130 1135
Leu Phe Pro Lys Ala Leu Gly Arg Pro Gly Pro Pro Phe Asn Ile Thr
1140 1145 1150
Pro Arg Arg Ala Arg Arg Phe Phe Leu Arg Cys Ile Ile Trp Asn Thr
1155 1160 1165
Arg Asp Val Thr Lys Gly Ala Phe Gly Asp Met Leu Asp Thr Pro Asp
1170 1175 1180
Ile Tyr Val Lys Gly Trp Met Ile Gly Phe Glu Glu His Lys Gln Lys
1185 1190 1195 1200
Thr Asp Val His Tyr Arg Ser Leu Gly Gly Glu Gly Asn Phe Asn Trp
1205 1210 1215
Arg Phe Ile Phe Pro Phe Asp Tyr Leu Pro Ala Glu Gln Val Ala Thr
1220 1225 1230
Ile Ala Lys Lys Asp Ala Phe Trp Arg Leu Asp Lys Thr Glu Ser Lys
1235 1240 1245
Ile Pro Ala Arg Val Val Phe Gln Ile Trp Asp Asn Asp Lys Phe Ser
1250 1255 1260
Phe Asp Asp Phe Leu Gly Ser Leu Gln Leu Asp Leu Asn Arg Met Pro
1265 1270 1275 1280
Lys Pro Ala Lys Thr Ala Lys Lys Ala Ser Leu Asp Gln Leu Asp Asp
1285 1290 1295
Ala Phe His Pro Glu Trp Phe Val Ser Leu Phe Glu Gln Lys Thr Val
1300 1305 1310
Lys Gly Trp Trp Pro Cys Val Ala Glu Glu Gly Glu Lys Lys Ile Leu
1315 1320 1325
Ala Gly Lys Leu Glu Met Thr Leu Glu Ile Val Ala Glu Ser Glu His
1330 1335 1340
Glu Glu Arg Pro Ala Gly Gln Gly Arg Asp Glu Pro Asn Met Asn Pro
1345 1350 1355 1360
Lys Leu Glu Asp Pro Arg Arg Pro Asp Thr Ser Phe Leu Trp Phe Thr
1365 1370 1375
Ser Pro Tyr Lys Thr Met Lys Phe Ile Leu Trp Arg Arg Phe Arg Trp
1380 1385 1390
Ala Ile Ile Leu Phe Ile Ile Leu Phe Ile Leu Leu Leu Phe Leu Ala
1395 1400 1405
Ile Phe Ile Tyr Ala Phe Pro Asn Tyr Ala Ala Met Lys Leu Val Lys
1410 1415 1420
Pro Phe Ser
1425
<210> 8
<211> 1290
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> DOMAIN
<222> (1)..(1290)
<223> 430 (无 Flag) (430)
<400> 8
Met Leu Arg Val Phe Ile Leu Tyr Ala Glu Asn Val His Thr Pro Asp
1 5 10 15
Thr Asp Ile Ser Asp Ala Tyr Cys Ser Ala Val Phe Ala Gly Val Lys
20 25 30
Lys Arg Thr Lys Val Ile Lys Asn Ser Val Asn Pro Val Trp Asn Glu
35 40 45
Gly Phe Glu Trp Asp Leu Lys Gly Ile Pro Leu Asp Gln Gly Ser Glu
50 55 60
Leu His Val Val Val Lys Asp His Glu Thr Met Gly Arg Asn Arg Phe
65 70 75 80
Leu Gly Glu Ala Lys Val Pro Leu Arg Glu Val Leu Ala Thr Pro Ser
85 90 95
Leu Ser Ala Ser Phe Asn Ala Pro Leu Leu Asp Thr Lys Lys Gln Pro
100 105 110
Thr Gly Ala Ser Leu Val Leu Gln Val Ser Tyr Thr Pro Leu Pro Gly
115 120 125
Ala Val Pro Leu Phe Pro Pro Pro Thr Pro Leu Glu Pro Ser Pro Thr
130 135 140
Leu Pro Asp Leu Asp Val Val Ala Asp Thr Gly Gly Glu Glu Asp Thr
145 150 155 160
Glu Asp Gln Gly Leu Thr Gly Asp Glu Ala Glu Pro Phe Leu Asp Gln
165 170 175
Ser Gly Gly Pro Gly Ala Pro Thr Thr Pro Arg Lys Leu Pro Ser Arg
180 185 190
Pro Pro Pro His Tyr Pro Gly Ile Lys Arg Lys Arg Ser Ala Pro Thr
195 200 205
Ser Arg Lys Leu Leu Ser Asp Lys Pro Gln Pro Ser Glu Asp Lys Glu
210 215 220
Asp Ile Glu Ser Asn Leu Leu Arg Pro Thr Gly Val Ala Leu Arg Gly
225 230 235 240
Ala His Phe Cys Leu Lys Val Phe Arg Ala Glu Asp Leu Pro Gln Met
245 250 255
Asp Asp Ala Val Met Asp Asn Val Lys Gln Ile Phe Gly Phe Glu Ser
260 265 270
Asn Lys Lys Asn Leu Val Asp Pro Phe Val Glu Val Ser Phe Ala Gly
275 280 285
Lys Met Leu Cys Ser Lys Ile Leu Glu Lys Thr Ala Asn Pro Gln Trp
290 295 300
Asn Gln Asn Ile Thr Leu Pro Ala Met Phe Pro Ser Met Cys Glu Lys
305 310 315 320
Met Arg Ile Arg Ile Ile Asp Trp Asp Arg Leu Thr His Asn Asp Ile
325 330 335
Val Ala Thr Thr Tyr Leu Ser Met Ser Lys Ile Ser Ala Pro Gly Gly
340 345 350
Glu Ile Glu Glu Glu Pro Ala Gly Ala Val Lys Pro Ser Lys Ala Ser
355 360 365
Asp Leu Asp Asp Tyr Leu Gly Phe Leu Pro Thr Phe Gly Pro Cys Tyr
370 375 380
Ile Asn Leu Tyr Gly Ser Pro Arg Glu Phe Thr Gly Phe Pro Asp Pro
385 390 395 400
Tyr Thr Glu Leu Asn Thr Gly Lys Gly Glu Gly Val Ala Tyr Arg Gly
405 410 415
Arg Leu Leu Leu Ser Leu Glu Thr Lys Leu Val Glu His Ser Glu Gln
420 425 430
Lys Val Glu Asp Leu Pro Ala Asp Asp Ile Leu Arg Val Glu Lys Tyr
435 440 445
Leu Arg Arg Arg Lys Tyr Ser Leu Phe Ala Ala Phe Tyr Ser Ala Thr
450 455 460
Met Leu Gln Asp Val Asp Asp Ala Ile Gln Phe Glu Val Ser Ile Gly
465 470 475 480
Asn Tyr Gly Asn Lys Phe Asp Met Thr Cys Leu Pro Leu Ala Ser Thr
485 490 495
Thr Gln Tyr Ser Arg Ala Val Phe Asp Gly Cys His Tyr Tyr Tyr Leu
500 505 510
Pro Trp Gly Asn Val Lys Pro Val Val Val Leu Ser Ser Tyr Trp Glu
515 520 525
Asp Ile Ser His Arg Ile Glu Thr Gln Asn Gln Leu Leu Gly Ile Ala
530 535 540
Asp Arg Leu Glu Ala Gly Leu Glu Gln Val His Leu Ala Leu Lys Ala
545 550 555 560
Gln Cys Ser Thr Glu Asp Val Asp Ser Leu Val Ala Gln Leu Thr Asp
565 570 575
Glu Leu Ile Ala Gly Cys Ser Gln Pro Leu Gly Asp Ile His Glu Thr
580 585 590
Pro Ser Ala Thr His Leu Asp Gln Tyr Leu Tyr Gln Leu Arg Thr His
595 600 605
His Leu Ser Gln Ile Thr Glu Ala Ala Leu Ala Leu Lys Leu Gly His
610 615 620
Ser Glu Leu Pro Ala Ala Leu Glu Gln Ala Glu Asp Trp Leu Leu Arg
625 630 635 640
Leu Arg Ala Leu Ala Glu Glu Pro Gln Asn Ser Leu Pro Asp Ile Val
645 650 655
Ile Trp Met Leu Gln Gly Asp Lys Arg Val Ala Tyr Gln Arg Val Pro
660 665 670
Ala His Gln Val Leu Phe Ser Arg Arg Gly Ala Asn Tyr Cys Gly Lys
675 680 685
Asn Cys Gly Lys Leu Gln Thr Ile Phe Leu Lys Tyr Pro Met Glu Lys
690 695 700
Val Pro Gly Ala Arg Met Pro Val Gln Ile Arg Val Lys Leu Trp Phe
705 710 715 720
Gly Leu Ser Val Asp Glu Lys Glu Phe Asn Gln Phe Ala Glu Gly Lys
725 730 735
Leu Ser Val Phe Ala Glu Thr Tyr Glu Asn Glu Thr Lys Leu Ala Leu
740 745 750
Val Gly Asn Trp Gly Thr Thr Gly Leu Thr Tyr Pro Lys Phe Ser Asp
755 760 765
Val Thr Gly Lys Ile Lys Leu Pro Lys Asp Ser Phe Arg Pro Ser Ala
770 775 780
Gly Trp Thr Trp Ala Gly Asp Trp Phe Val Cys Pro Glu Lys Thr Leu
785 790 795 800
Leu His Asp Met Asp Ala Gly His Leu Ser Phe Val Glu Glu Val Phe
805 810 815
Glu Asn Gln Thr Arg Leu Pro Gly Gly Gln Trp Ile Tyr Met Ser Asp
820 825 830
Asn Tyr Thr Asp Val Asn Gly Glu Lys Val Leu Pro Lys Asp Asp Ile
835 840 845
Glu Cys Pro Leu Gly Trp Lys Trp Glu Asp Glu Glu Trp Ser Thr Asp
850 855 860
Leu Asn Arg Ala Val Asp Glu Gln Gly Trp Glu Tyr Ser Ile Thr Ile
865 870 875 880
Pro Pro Glu Arg Lys Pro Lys His Trp Val Pro Ala Glu Lys Met Tyr
885 890 895
Tyr Thr His Arg Arg Arg Arg Trp Val Arg Leu Arg Arg Arg Asp Leu
900 905 910
Ser Gln Met Glu Ala Leu Lys Arg His Arg Gln Ala Glu Ala Glu Gly
915 920 925
Glu Gly Trp Glu Tyr Ala Ser Leu Phe Gly Trp Lys Phe His Leu Glu
930 935 940
Tyr Arg Lys Thr Asp Ala Phe Arg Arg Arg Arg Trp Arg Arg Arg Met
945 950 955 960
Glu Pro Leu Glu Lys Thr Gly Pro Ala Ala Val Phe Ala Leu Glu Gly
965 970 975
Ala Leu Gly Gly Val Met Asp Asp Lys Ser Glu Asp Ser Met Ser Val
980 985 990
Ser Thr Leu Ser Phe Gly Leu Phe Pro Lys Ala Leu Gly Arg Pro Gly
995 1000 1005
Pro Pro Phe Asn Ile Thr Pro Arg Arg Ala Arg Arg Phe Phe Leu Arg
1010 1015 1020
Cys Ile Ile Trp Asn Thr Arg Asp Val Ile Leu Asp Asp Leu Ser Leu
1025 1030 1035 1040
Thr Gly Glu Lys Met Ser Asp Ile Tyr Val Lys Gly Trp Met Ile Gly
1045 1050 1055
Phe Glu Glu His Lys Gln Lys Thr Asp Val His Tyr Arg Ser Leu Gly
1060 1065 1070
Gly Glu Gly Asn Phe Asn Trp Arg Phe Ile Phe Pro Phe Asp Tyr Leu
1075 1080 1085
Pro Ala Glu Gln Val Ala Thr Ile Ala Lys Lys Asp Ala Phe Trp Arg
1090 1095 1100
Leu Asp Lys Thr Glu Ser Lys Ile Pro Ala Arg Val Val Phe Gln Ile
1105 1110 1115 1120
Trp Asp Asn Asp Lys Phe Ser Phe Asp Asp Phe Leu Gly Ser Leu Gln
1125 1130 1135
Leu Asp Leu Asn Arg Met Pro Lys Pro Ala Lys Thr Ala Lys Lys Ala
1140 1145 1150
Ser Leu Asp Gln Leu Asp Asp Ala Phe His Pro Glu Trp Phe Val Ser
1155 1160 1165
Leu Phe Glu Gln Lys Thr Val Lys Gly Trp Trp Pro Cys Val Ala Glu
1170 1175 1180
Glu Gly Glu Lys Lys Ile Leu Ala Gly Lys Leu Glu Met Thr Leu Glu
1185 1190 1195 1200
Ile Val Ala Glu Ser Glu His Glu Glu Arg Pro Ala Gly Gln Gly Arg
1205 1210 1215
Asp Glu Pro Asn Met Asn Pro Lys Leu Glu Asp Pro Arg Arg Pro Asp
1220 1225 1230
Thr Ser Phe Leu Trp Phe Thr Ser Pro Tyr Lys Thr Met Lys Phe Ile
1235 1240 1245
Leu Trp Arg Arg Phe Arg Trp Ala Ile Ile Leu Phe Ile Ile Leu Phe
1250 1255 1260
Ile Leu Leu Leu Phe Leu Ala Ile Phe Ile Tyr Ala Phe Pro Asn Tyr
1265 1270 1275 1280
Ala Ala Met Lys Leu Val Lys Pro Phe Ser
1285 1290
<210> 9
<211> 1491
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> DOMAIN
<222> (1)..(1491)
<223> 342 无 Flag (426)
<400> 9
Met Leu Arg Val Phe Ile Leu Tyr Ala Glu Asn Val His Thr Pro Asp
1 5 10 15
Thr Asp Ile Ser Asp Ala Tyr Cys Ser Ala Val Phe Ala Gly Val Lys
20 25 30
Lys Arg Thr Lys Val Ile Lys Asn Ser Val Asn Pro Val Trp Asn Glu
35 40 45
Gly Phe Glu Trp Asp Leu Lys Gly Ile Pro Leu Asp Gln Gly Ser Glu
50 55 60
Leu His Val Val Val Lys Asp His Glu Thr Met Gly Arg Asn Arg Phe
65 70 75 80
Leu Gly Glu Ala Lys Val Pro Leu Arg Glu Val Leu Ala Thr Pro Ser
85 90 95
Leu Ser Ala Ser Phe Asn Ala Pro Leu Leu Asp Thr Lys Lys Gln Pro
100 105 110
Thr Gly Ala Ser Leu Val Leu Gln Val Ser Tyr Thr Pro Leu Pro Gly
115 120 125
Ala Val Pro Leu Phe Pro Pro Pro Thr Pro Leu Glu Pro Ser Pro Thr
130 135 140
Leu Pro Asp Leu Asp Val Val Ala Asp Thr Gly Gly Glu Glu Asp Thr
145 150 155 160
Glu Asp Gln Gly Leu Thr Gly Asp Glu Ala Glu Pro Phe Leu Asp Gln
165 170 175
Ser Gly Gly Pro Gly Ala Pro Thr Thr Pro Arg Lys Leu Pro Ser Arg
180 185 190
Pro Pro Pro His Tyr Pro Gly Ile Lys Arg Lys Arg Ser Ala Pro Thr
195 200 205
Ser Arg Lys Leu Leu Ser Asp Lys Pro Gln Ser Asn Leu Leu Arg Pro
210 215 220
Thr Gly Val Ala Leu Arg Gly Ala His Phe Cys Leu Lys Val Phe Arg
225 230 235 240
Ala Glu Asp Leu Pro Gln Met Asp Asp Ala Val Met Asp Asn Val Lys
245 250 255
Gln Ile Phe Gly Phe Glu Ser Asn Lys Lys Asn Leu Val Asp Pro Phe
260 265 270
Val Glu Val Ser Phe Ala Gly Lys Met Leu Cys Ser Lys Ile Leu Glu
275 280 285
Lys Thr Ala Asn Pro Gln Trp Asn Gln Asn Ile Thr Leu Pro Ala Met
290 295 300
Phe Pro Ser Met Cys Glu Lys Met Arg Ile Arg Ile Ile Asp Trp Asp
305 310 315 320
Arg Leu Thr His Asn Asp Ile Val Ala Thr Thr Tyr Leu Ser Met Ser
325 330 335
Lys Ile Ser Ala Pro Gly Gly Glu Ile Glu Glu Glu Pro Ala Gly Ala
340 345 350
Val Lys Pro Ser Lys Ala Ser Asp Leu Asp Asp Tyr Leu Gly Phe Leu
355 360 365
Pro Thr Phe Gly Pro Cys Tyr Ile Asn Leu Tyr Gly Ser Pro Arg Glu
370 375 380
Phe Thr Gly Phe Pro Asp Pro Tyr Thr Glu Leu Asn Thr Gly Lys Gly
385 390 395 400
Glu Gly Val Ala Tyr Arg Gly Arg Leu Leu Leu Ser Leu Glu Thr Lys
405 410 415
Leu Val Glu His Ser Glu Gln Lys Val Glu Asp Leu Pro Ala Asp Asp
420 425 430
Ile Leu Arg Val Glu Lys Tyr Leu Arg Arg Arg Lys Tyr Ser Leu Phe
435 440 445
Ala Ala Phe Tyr Ser Ala Thr Met Leu Gln Asp Val Asp Asp Ala Ile
450 455 460
Gln Phe Glu Val Ser Ile Gly Asn Tyr Gly Asn Lys Phe Asp Met Thr
465 470 475 480
Cys Leu Pro Leu Ala Ser Thr Thr Gln Tyr Ser Arg Ala Val Phe Asp
485 490 495
Gly Cys His Tyr Tyr Tyr Leu Pro Trp Gly Asn Val Lys Pro Val Val
500 505 510
Val Leu Ser Ser Tyr Trp Glu Asp Ile Ser His Arg Ile Glu Thr Gln
515 520 525
Asn Gln Leu Leu Gly Ile Ala Asp Arg Leu Glu Ala Gly Leu Glu Gln
530 535 540
Val His Leu Ala Leu Lys Ala Gln Cys Ser Thr Glu Asp Val Asp Ser
545 550 555 560
Leu Val Ala Gln Leu Thr Asp Glu Leu Ile Ala Gly Cys Ser Gln Pro
565 570 575
Leu Gly Asp Ile His Glu Thr Pro Ser Ala Thr His Leu Asp Gln Tyr
580 585 590
Leu Tyr Gln Leu Arg Thr His His Leu Ser Gln Ile Thr Glu Ala Ala
595 600 605
Leu Ala Leu Lys Leu Gly His Ser Glu Leu Pro Ala Ala Leu Glu Gln
610 615 620
Ala Glu Asp Trp Leu Leu Arg Leu Arg Ala Leu Ala Glu Glu Pro Gln
625 630 635 640
Asn Ser Leu Pro Asp Ile Val Ile Trp Met Leu Gln Gly Asp Lys Arg
645 650 655
Val Ala Tyr Gln Arg Val Pro Ala His Gln Val Leu Phe Ser Arg Arg
660 665 670
Gly Ala Asn Tyr Cys Gly Lys Asn Cys Gly Lys Leu Gln Thr Ile Phe
675 680 685
Leu Lys Tyr Pro Met Glu Lys Val Pro Gly Ala Arg Met Pro Val Gln
690 695 700
Ile Arg Val Lys Leu Trp Phe Gly Leu Ser Val Asp Glu Lys Glu Phe
705 710 715 720
Asn Gln Phe Ala Glu Gly Lys Leu Ser Val Phe Ala Glu Thr Tyr Glu
725 730 735
Asn Glu Thr Lys Leu Ala Leu Val Gly Asn Trp Gly Thr Thr Gly Leu
740 745 750
Thr Tyr Pro Lys Phe Ser Asp Val Thr Gly Lys Ile Lys Leu Pro Lys
755 760 765
Asp Ser Phe Arg Pro Ser Ala Gly Trp Thr Trp Ala Gly Asp Trp Phe
770 775 780
Val Cys Pro Glu Lys Thr Leu Leu His Asp Met Asp Ala Gly His Leu
785 790 795 800
Ser Phe Val Glu Glu Val Phe Glu Asn Gln Thr Arg Leu Pro Gly Gly
805 810 815
Gln Trp Ile Tyr Met Ser Asp Asn Tyr Thr Asp Val Asn Gly Glu Lys
820 825 830
Val Leu Pro Lys Asp Asp Ile Glu Cys Pro Leu Gly Trp Lys Trp Glu
835 840 845
Asp Glu Glu Trp Ser Thr Asp Leu Asn Arg Ala Val Asp Glu Gln Gly
850 855 860
Trp Glu Tyr Ser Ile Thr Ile Pro Pro Glu Arg Lys Pro Lys His Trp
865 870 875 880
Val Pro Ala Glu Lys Met Tyr Tyr Thr His Arg Arg Arg Arg Trp Val
885 890 895
Arg Leu Arg Arg Arg Asp Leu Ser Gln Met Glu Ala Leu Lys Arg His
900 905 910
Arg Gln Ala Glu Ala Glu Gly Glu Gly Trp Glu Tyr Ala Ser Leu Phe
915 920 925
Gly Trp Lys Phe His Leu Glu Tyr Arg Lys Thr Asp Ala Phe Arg Arg
930 935 940
Arg Arg Trp Arg Arg Arg Met Glu Pro Leu Glu Lys Thr Gly Pro Ala
945 950 955 960
Ala Val Phe Ala Leu Glu Gly Ala Leu Gly Gly Val Met Asp Asp Lys
965 970 975
Ser Glu Asp Ser Met Ser Val Ser Thr Leu Ser Phe Gly Leu Val Arg
980 985 990
Ile Tyr Ile Val Arg Ala Phe Gly Leu Gln Pro Lys Asp Pro Asn Gly
995 1000 1005
Lys Cys Asp Pro Tyr Ile Lys Ile Ser Ile Gly Lys Lys Ser Val Ser
1010 1015 1020
Asp Gln Asp Asn Tyr Ile Pro Cys Thr Leu Glu Pro Val Phe Gly Lys
1025 1030 1035 1040
Met Phe Glu Leu Thr Cys Thr Leu Pro Leu Glu Lys Asp Leu Lys Ile
1045 1050 1055
Thr Leu Tyr Asp Tyr Asp Leu Leu Ser Lys Asp Glu Lys Ile Gly Glu
1060 1065 1070
Thr Val Val Asp Leu Glu Asn Arg Leu Leu Ser Lys Phe Gly Ala Arg
1075 1080 1085
Cys Gly Leu Pro Gln Thr Tyr Cys Val Ser Gly Pro Asn Gln Trp Arg
1090 1095 1100
Asp Gln Leu Arg Pro Ser Gln Leu Leu His Leu Phe Cys Gln Gln His
1105 1110 1115 1120
Arg Val Lys Ala Pro Val Tyr Arg Thr Asp Arg Val Met Phe Gln Asp
1125 1130 1135
Lys Glu Tyr Ser Ile Glu Glu Ile Glu Ala Gly Arg Ile Pro Asn Pro
1140 1145 1150
His Leu Gly Pro Val Glu Glu Arg Leu Ala Leu His Val Leu Gln Gln
1155 1160 1165
Gln Gly Leu Val Pro Glu His Val Glu Ser Arg Pro Leu Tyr Ser Pro
1170 1175 1180
Leu Gln Pro Asp Ile Glu Gln Gly Lys Leu Gln Met Trp Val Asp Leu
1185 1190 1195 1200
Phe Pro Lys Ala Leu Gly Arg Pro Gly Pro Pro Phe Asn Ile Thr Pro
1205 1210 1215
Arg Arg Ala Arg Arg Phe Phe Leu Arg Cys Ile Ile Trp Asn Thr Arg
1220 1225 1230
Asp Val Ile Leu Asp Asp Leu Ser Leu Thr Gly Glu Lys Met Ser Asp
1235 1240 1245
Ile Tyr Val Lys Gly Trp Met Ile Gly Phe Glu Glu His Lys Gln Lys
1250 1255 1260
Thr Asp Val His Tyr Arg Ser Leu Gly Gly Glu Gly Asn Phe Asn Trp
1265 1270 1275 1280
Arg Phe Ile Phe Pro Phe Asp Tyr Leu Pro Ala Glu Gln Val Ala Thr
1285 1290 1295
Ile Ala Lys Lys Asp Ala Phe Trp Arg Leu Asp Lys Thr Glu Ser Lys
1300 1305 1310
Ile Pro Ala Arg Val Val Phe Gln Ile Trp Asp Asn Asp Lys Phe Ser
1315 1320 1325
Phe Asp Asp Phe Leu Gly Ser Leu Gln Leu Asp Leu Asn Arg Met Pro
1330 1335 1340
Lys Pro Ala Lys Thr Ala Lys Lys Ala Ser Leu Asp Gln Leu Asp Asp
1345 1350 1355 1360
Ala Phe His Pro Glu Trp Phe Val Ser Leu Phe Glu Gln Lys Thr Val
1365 1370 1375
Lys Gly Trp Trp Pro Cys Val Ala Glu Glu Gly Glu Lys Lys Ile Leu
1380 1385 1390
Ala Gly Lys Leu Glu Met Thr Leu Glu Ile Val Ala Glu Ser Glu His
1395 1400 1405
Glu Glu Arg Pro Ala Gly Gln Gly Arg Asp Glu Pro Asn Met Asn Pro
1410 1415 1420
Lys Leu Glu Asp Pro Arg Arg Pro Asp Thr Ser Phe Leu Trp Phe Thr
1425 1430 1435 1440
Ser Pro Tyr Lys Thr Met Lys Phe Ile Leu Trp Arg Arg Phe Arg Trp
1445 1450 1455
Ala Ile Ile Leu Phe Ile Ile Leu Phe Ile Leu Leu Leu Phe Leu Ala
1460 1465 1470
Ile Phe Ile Tyr Ala Phe Pro Asn Tyr Ala Ala Met Lys Leu Val Lys
1475 1480 1485
Pro Phe Ser
1490
<210> 10
<211> 1428
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<221> DOMAIN
<222> (1)..(1428)
<223> 341/Nano-Dysferlin (425)
<400> 10
Met Leu Arg Val Phe Ile Leu Tyr Ala Glu Asn Val His Thr Pro Asp
1 5 10 15
Thr Asp Ile Ser Asp Ala Tyr Cys Ser Ala Val Phe Ala Gly Val Lys
20 25 30
Lys Arg Thr Lys Val Ile Lys Asn Ser Val Asn Pro Val Trp Asn Glu
35 40 45
Gly Phe Glu Trp Asp Leu Lys Gly Ile Pro Leu Asp Gln Gly Ser Glu
50 55 60
Leu His Val Val Val Lys Asp His Glu Thr Met Gly Arg Asn Arg Phe
65 70 75 80
Leu Gly Glu Ala Lys Val Pro Leu Arg Glu Val Leu Ala Thr Pro Ser
85 90 95
Leu Ser Ala Ser Phe Asn Ala Pro Leu Leu Asp Thr Lys Lys Gln Pro
100 105 110
Thr Gly Ala Ser Leu Val Leu Gln Val Ser Tyr Thr Pro Leu Pro Gly
115 120 125
Ala Val Pro Leu Phe Pro Pro Pro Thr Pro Leu Glu Pro Ser Pro Thr
130 135 140
Leu Pro Asp Leu Asp Val Val Ala Asp Thr Gly Gly Glu Glu Asp Thr
145 150 155 160
Glu Asp Gln Gly Leu Thr Gly Asp Glu Ala Glu Pro Phe Leu Asp Gln
165 170 175
Ser Gly Gly Pro Gly Ala Pro Thr Thr Pro Arg Lys Leu Pro Ser Arg
180 185 190
Pro Pro Pro His Tyr Pro Gly Ile Lys Arg Lys Arg Ser Ala Pro Thr
195 200 205
Ser Arg Lys Leu Leu Ser Asp Lys Pro Gln Asp Phe Gln Ile Arg Val
210 215 220
Gln Val Ile Glu Gly Arg Gln Leu Pro Gly Val Asn Ile Lys Pro Val
225 230 235 240
Val Lys Val Thr Ala Ala Gly Gln Thr Lys Arg Thr Arg Ile His Lys
245 250 255
Gly Asn Ser Pro Leu Phe Asn Glu Thr Leu Phe Phe Asn Leu Phe Asp
260 265 270
Ser Pro Gly Glu Leu Phe Asp Glu Pro Ile Phe Ile Thr Val Val Asp
275 280 285
Ser Arg Ser Leu Arg Thr Asp Ala Leu Leu Gly Glu Phe Arg Met Asp
290 295 300
Val Gly Thr Ile Tyr Arg Glu Pro Arg His Ala Tyr Leu Arg Lys Trp
305 310 315 320
Leu Leu Leu Ser Asp Pro Asp Asp Phe Ser Ala Gly Ala Arg Gly Tyr
325 330 335
Leu Lys Thr Ser Leu Cys Val Leu Gly Pro Gly Asp Glu Ala Pro Leu
340 345 350
Glu Arg Lys Asp Pro Ser Glu Asp Lys Glu Asp Ile Glu Ser Asn Leu
355 360 365
Leu Arg Pro Thr Gly Val Ala Leu Arg Gly Ala His Phe Cys Leu Lys
370 375 380
Val Phe Arg Ala Glu Asp Leu Pro Gln Met Asp Asp Ala Val Met Asp
385 390 395 400
Asn Val Lys Gln Ile Phe Gly Phe Glu Ser Asn Lys Lys Asn Leu Val
405 410 415
Asp Pro Phe Val Glu Val Ser Phe Ala Gly Lys Met Leu Cys Ser Lys
420 425 430
Ile Leu Glu Lys Thr Ala Asn Pro Gln Trp Asn Gln Asn Ile Thr Leu
435 440 445
Pro Ala Met Phe Pro Ser Met Cys Glu Lys Met Arg Ile Arg Ile Ile
450 455 460
Asp Trp Asp Arg Leu Thr His Asn Asp Ile Val Ala Thr Thr Tyr Leu
465 470 475 480
Ser Met Ser Lys Ile Ser Ala Pro Gly Gly Glu Ile Glu Glu Glu Pro
485 490 495
Ala Gly Ala Val Lys Pro Ser Lys Ala Ser Asp Leu Asp Asp Tyr Leu
500 505 510
Gly Phe Leu Pro Thr Phe Gly Pro Cys Tyr Ile Asn Leu Tyr Gly Ser
515 520 525
Pro Arg Glu Phe Thr Gly Phe Pro Asp Pro Tyr Thr Glu Leu Asn Thr
530 535 540
Gly Lys Gly Glu Gly Val Ala Tyr Arg Gly Arg Leu Leu Leu Ser Leu
545 550 555 560
Glu Thr Lys Leu Val Glu His Ser Glu Gln Lys Val Glu Asp Leu Pro
565 570 575
Ala Asp Asp Ile Leu Arg Val Glu Lys Tyr Leu Arg Arg Arg Lys Tyr
580 585 590
Ser Leu Phe Ala Ala Phe Tyr Ser Ala Thr Met Leu Gln Asp Val Asp
595 600 605
Asp Ala Ile Gln Phe Glu Val Ser Ile Gly Asn Tyr Gly Asn Lys Phe
610 615 620
Asp Met Thr Cys Leu Pro Leu Ala Ser Thr Thr Gln Tyr Ser Arg Ala
625 630 635 640
Val Phe Asp Gly Cys His Tyr Tyr Tyr Leu Pro Trp Gly Asn Val Lys
645 650 655
Pro Val Val Val Leu Ser Ser Tyr Trp Glu Asp Ile Ser His Arg Ile
660 665 670
Glu Thr Gln Asn Gln Leu Leu Gly Ile Ala Asp Arg Leu Glu Ala Gly
675 680 685
Leu Glu Gln Val His Leu Ala Leu Lys Ala Gln Cys Ser Thr Glu Asp
690 695 700
Val Asp Ser Leu Val Ala Gln Leu Thr Asp Glu Leu Ile Ala Gly Cys
705 710 715 720
Ser Gln Pro Leu Gly Asp Ile His Glu Thr Pro Ser Ala Thr His Leu
725 730 735
Asp Gln Tyr Leu Tyr Gln Leu Arg Thr His His Leu Ser Gln Ile Thr
740 745 750
Glu Ala Ala Leu Ala Leu Lys Leu Gly His Ser Glu Leu Pro Ala Ala
755 760 765
Leu Glu Gln Ala Glu Asp Trp Leu Leu Arg Leu Arg Ala Leu Ala Glu
770 775 780
Glu Pro Gln Asn Ser Leu Pro Asp Ile Val Ile Trp Met Leu Gln Gly
785 790 795 800
Asp Lys Arg Val Ala Tyr Gln Arg Val Pro Ala His Gln Val Leu Phe
805 810 815
Ser Arg Arg Gly Ala Asn Tyr Cys Gly Lys Asn Cys Gly Lys Leu Gln
820 825 830
Thr Ile Phe Leu Lys Tyr Pro Met Glu Lys Val Pro Gly Ala Arg Met
835 840 845
Pro Val Gln Ile Arg Val Lys Leu Trp Phe Gly Leu Ser Val Asp Glu
850 855 860
Lys Glu Phe Asn Gln Phe Ala Glu Gly Lys Leu Ser Val Phe Ala Glu
865 870 875 880
Thr Tyr Glu Asn Glu Thr Lys Leu Ala Leu Val Gly Asn Trp Gly Thr
885 890 895
Thr Gly Leu Thr Tyr Pro Lys Phe Ser Asp Val Thr Gly Lys Ile Lys
900 905 910
Leu Pro Lys Asp Ser Phe Arg Pro Ser Ala Gly Trp Thr Trp Ala Gly
915 920 925
Asp Trp Phe Val Cys Pro Glu Lys Thr Leu Leu His Asp Met Asp Ala
930 935 940
Gly His Leu Ser Phe Val Glu Glu Val Phe Glu Asn Gln Thr Arg Leu
945 950 955 960
Pro Gly Gly Gln Trp Ile Tyr Met Ser Asp Asn Tyr Thr Asp Val Asn
965 970 975
Gly Glu Lys Val Leu Pro Lys Asp Asp Ile Glu Cys Pro Leu Gly Trp
980 985 990
Lys Trp Glu Asp Glu Glu Trp Ser Thr Asp Leu Asn Arg Ala Val Asp
995 1000 1005
Glu Gln Gly Trp Glu Tyr Ser Ile Thr Ile Pro Pro Glu Arg Lys Pro
1010 1015 1020
Lys His Trp Val Pro Ala Glu Lys Met Tyr Tyr Thr His Arg Arg Arg
1025 1030 1035 1040
Arg Trp Val Arg Leu Arg Arg Arg Asp Leu Ser Gln Met Glu Ala Leu
1045 1050 1055
Lys Arg His Arg Gln Ala Glu Ala Glu Gly Glu Gly Trp Glu Tyr Ala
1060 1065 1070
Ser Leu Phe Gly Trp Lys Phe His Leu Glu Tyr Arg Lys Thr Asp Ala
1075 1080 1085
Phe Arg Arg Arg Arg Trp Arg Arg Arg Met Glu Pro Leu Glu Lys Thr
1090 1095 1100
Gly Pro Ala Ala Val Phe Ala Leu Glu Gly Ala Leu Gly Gly Val Met
1105 1110 1115 1120
Asp Asp Lys Ser Glu Asp Ser Met Ser Val Ser Thr Leu Ser Phe Gly
1125 1130 1135
Leu Phe Pro Lys Ala Leu Gly Arg Pro Gly Pro Pro Phe Asn Ile Thr
1140 1145 1150
Pro Arg Arg Ala Arg Arg Phe Phe Leu Arg Cys Ile Ile Trp Asn Thr
1155 1160 1165
Arg Asp Val Ile Leu Asp Asp Leu Ser Leu Thr Gly Glu Lys Met Ser
1170 1175 1180
Asp Ile Tyr Val Lys Gly Trp Met Ile Gly Phe Glu Glu His Lys Gln
1185 1190 1195 1200
Lys Thr Asp Val His Tyr Arg Ser Leu Gly Gly Glu Gly Asn Phe Asn
1205 1210 1215
Trp Arg Phe Ile Phe Pro Phe Asp Tyr Leu Pro Ala Glu Gln Val Ala
1220 1225 1230
Thr Ile Ala Lys Lys Asp Ala Phe Trp Arg Leu Asp Lys Thr Glu Ser
1235 1240 1245
Lys Ile Pro Ala Arg Val Val Phe Gln Ile Trp Asp Asn Asp Lys Phe
1250 1255 1260
Ser Phe Asp Asp Phe Leu Gly Ser Leu Gln Leu Asp Leu Asn Arg Met
1265 1270 1275 1280
Pro Lys Pro Ala Lys Thr Ala Lys Lys Ala Ser Leu Asp Gln Leu Asp
1285 1290 1295
Asp Ala Phe His Pro Glu Trp Phe Val Ser Leu Phe Glu Gln Lys Thr
1300 1305 1310
Val Lys Gly Trp Trp Pro Cys Val Ala Glu Glu Gly Glu Lys Lys Ile
1315 1320 1325
Leu Ala Gly Lys Leu Glu Met Thr Leu Glu Ile Val Ala Glu Ser Glu
1330 1335 1340
His Glu Glu Arg Pro Ala Gly Gln Gly Arg Asp Glu Pro Asn Met Asn
1345 1350 1355 1360
Pro Lys Leu Glu Asp Pro Arg Arg Pro Asp Thr Ser Phe Leu Trp Phe
1365 1370 1375
Thr Ser Pro Tyr Lys Thr Met Lys Phe Ile Leu Trp Arg Arg Phe Arg
1380 1385 1390
Trp Ala Ile Ile Leu Phe Ile Ile Leu Phe Ile Leu Leu Leu Phe Leu
1395 1400 1405
Ala Ile Phe Ile Tyr Ala Phe Pro Asn Tyr Ala Ala Met Lys Leu Val
1410 1415 1420
Lys Pro Phe Ser
1425
<210> 11
<211> 2080
<212> PRT
<213> 智人(Homo sapiens)
<400> 11
Met Leu Arg Val Phe Ile Leu Tyr Ala Glu Asn Val His Thr Pro Asp
1 5 10 15
Thr Asp Ile Ser Asp Ala Tyr Cys Ser Ala Val Phe Ala Gly Val Lys
20 25 30
Lys Arg Thr Lys Val Ile Lys Asn Ser Val Asn Pro Val Trp Asn Glu
35 40 45
Gly Phe Glu Trp Asp Leu Lys Gly Ile Pro Leu Asp Gln Gly Ser Glu
50 55 60
Leu His Val Val Val Lys Asp His Glu Thr Met Gly Arg Asn Arg Phe
65 70 75 80
Leu Gly Glu Ala Lys Val Pro Leu Arg Glu Val Leu Ala Thr Pro Ser
85 90 95
Leu Ser Ala Ser Phe Asn Ala Pro Leu Leu Asp Thr Lys Lys Gln Pro
100 105 110
Thr Gly Ala Ser Leu Val Leu Gln Val Ser Tyr Thr Pro Leu Pro Gly
115 120 125
Ala Val Pro Leu Phe Pro Pro Pro Thr Pro Leu Glu Pro Ser Pro Thr
130 135 140
Leu Pro Asp Leu Asp Val Val Ala Asp Thr Gly Gly Glu Glu Asp Thr
145 150 155 160
Glu Asp Gln Gly Leu Thr Gly Asp Glu Ala Glu Pro Phe Leu Asp Gln
165 170 175
Ser Gly Gly Pro Gly Ala Pro Thr Thr Pro Arg Lys Leu Pro Ser Arg
180 185 190
Pro Pro Pro His Tyr Pro Gly Ile Lys Arg Lys Arg Ser Ala Pro Thr
195 200 205
Ser Arg Lys Leu Leu Ser Asp Lys Pro Gln Asp Phe Gln Ile Arg Val
210 215 220
Gln Val Ile Glu Gly Arg Gln Leu Pro Gly Val Asn Ile Lys Pro Val
225 230 235 240
Val Lys Val Thr Ala Ala Gly Gln Thr Lys Arg Thr Arg Ile His Lys
245 250 255
Gly Asn Ser Pro Leu Phe Asn Glu Thr Leu Phe Phe Asn Leu Phe Asp
260 265 270
Ser Pro Gly Glu Leu Phe Asp Glu Pro Ile Phe Ile Thr Val Val Asp
275 280 285
Ser Arg Ser Leu Arg Thr Asp Ala Leu Leu Gly Glu Phe Arg Met Asp
290 295 300
Val Gly Thr Ile Tyr Arg Glu Pro Arg His Ala Tyr Leu Arg Lys Trp
305 310 315 320
Leu Leu Leu Ser Asp Pro Asp Asp Phe Ser Ala Gly Ala Arg Gly Tyr
325 330 335
Leu Lys Thr Ser Leu Cys Val Leu Gly Pro Gly Asp Glu Ala Pro Leu
340 345 350
Glu Arg Lys Asp Pro Ser Glu Asp Lys Glu Asp Ile Glu Ser Asn Leu
355 360 365
Leu Arg Pro Thr Gly Val Ala Leu Arg Gly Ala His Phe Cys Leu Lys
370 375 380
Val Phe Arg Ala Glu Asp Leu Pro Gln Met Asp Asp Ala Val Met Asp
385 390 395 400
Asn Val Lys Gln Ile Phe Gly Phe Glu Ser Asn Lys Lys Asn Leu Val
405 410 415
Asp Pro Phe Val Glu Val Ser Phe Ala Gly Lys Met Leu Cys Ser Lys
420 425 430
Ile Leu Glu Lys Thr Ala Asn Pro Gln Trp Asn Gln Asn Ile Thr Leu
435 440 445
Pro Ala Met Phe Pro Ser Met Cys Glu Lys Met Arg Ile Arg Ile Ile
450 455 460
Asp Trp Asp Arg Leu Thr His Asn Asp Ile Val Ala Thr Thr Tyr Leu
465 470 475 480
Ser Met Ser Lys Ile Ser Ala Pro Gly Gly Glu Ile Glu Glu Glu Pro
485 490 495
Ala Gly Ala Val Lys Pro Ser Lys Ala Ser Asp Leu Asp Asp Tyr Leu
500 505 510
Gly Phe Leu Pro Thr Phe Gly Pro Cys Tyr Ile Asn Leu Tyr Gly Ser
515 520 525
Pro Arg Glu Phe Thr Gly Phe Pro Asp Pro Tyr Thr Glu Leu Asn Thr
530 535 540
Gly Lys Gly Glu Gly Val Ala Tyr Arg Gly Arg Leu Leu Leu Ser Leu
545 550 555 560
Glu Thr Lys Leu Val Glu His Ser Glu Gln Lys Val Glu Asp Leu Pro
565 570 575
Ala Asp Asp Ile Leu Arg Val Glu Lys Tyr Leu Arg Arg Arg Lys Tyr
580 585 590
Ser Leu Phe Ala Ala Phe Tyr Ser Ala Thr Met Leu Gln Asp Val Asp
595 600 605
Asp Ala Ile Gln Phe Glu Val Ser Ile Gly Asn Tyr Gly Asn Lys Phe
610 615 620
Asp Met Thr Cys Leu Pro Leu Ala Ser Thr Thr Gln Tyr Ser Arg Ala
625 630 635 640
Val Phe Asp Gly Cys His Tyr Tyr Tyr Leu Pro Trp Gly Asn Val Lys
645 650 655
Pro Val Val Val Leu Ser Ser Tyr Trp Glu Asp Ile Ser His Arg Ile
660 665 670
Glu Thr Gln Asn Gln Leu Leu Gly Ile Ala Asp Arg Leu Glu Ala Gly
675 680 685
Leu Glu Gln Val His Leu Ala Leu Lys Ala Gln Cys Ser Thr Glu Asp
690 695 700
Val Asp Ser Leu Val Ala Gln Leu Thr Asp Glu Leu Ile Ala Gly Cys
705 710 715 720
Ser Gln Pro Leu Gly Asp Ile His Glu Thr Pro Ser Ala Thr His Leu
725 730 735
Asp Gln Tyr Leu Tyr Gln Leu Arg Thr His His Leu Ser Gln Ile Thr
740 745 750
Glu Ala Ala Leu Ala Leu Lys Leu Gly His Ser Glu Leu Pro Ala Ala
755 760 765
Leu Glu Gln Ala Glu Asp Trp Leu Leu Arg Leu Arg Ala Leu Ala Glu
770 775 780
Glu Pro Gln Asn Ser Leu Pro Asp Ile Val Ile Trp Met Leu Gln Gly
785 790 795 800
Asp Lys Arg Val Ala Tyr Gln Arg Val Pro Ala His Gln Val Leu Phe
805 810 815
Ser Arg Arg Gly Ala Asn Tyr Cys Gly Lys Asn Cys Gly Lys Leu Gln
820 825 830
Thr Ile Phe Leu Lys Tyr Pro Met Glu Lys Val Pro Gly Ala Arg Met
835 840 845
Pro Val Gln Ile Arg Val Lys Leu Trp Phe Gly Leu Ser Val Asp Glu
850 855 860
Lys Glu Phe Asn Gln Phe Ala Glu Gly Lys Leu Ser Val Phe Ala Glu
865 870 875 880
Thr Tyr Glu Asn Glu Thr Lys Leu Ala Leu Val Gly Asn Trp Gly Thr
885 890 895
Thr Gly Leu Thr Tyr Pro Lys Phe Ser Asp Val Thr Gly Lys Ile Lys
900 905 910
Leu Pro Lys Asp Ser Phe Arg Pro Ser Ala Gly Trp Thr Trp Ala Gly
915 920 925
Asp Trp Phe Val Cys Pro Glu Lys Thr Leu Leu His Asp Met Asp Ala
930 935 940
Gly His Leu Ser Phe Val Glu Glu Val Phe Glu Asn Gln Thr Arg Leu
945 950 955 960
Pro Gly Gly Gln Trp Ile Tyr Met Ser Asp Asn Tyr Thr Asp Val Asn
965 970 975
Gly Glu Lys Val Leu Pro Lys Asp Asp Ile Glu Cys Pro Leu Gly Trp
980 985 990
Lys Trp Glu Asp Glu Glu Trp Ser Thr Asp Leu Asn Arg Ala Val Asp
995 1000 1005
Glu Gln Gly Trp Glu Tyr Ser Ile Thr Ile Pro Pro Glu Arg Lys Pro
1010 1015 1020
Lys His Trp Val Pro Ala Glu Lys Met Tyr Tyr Thr His Arg Arg Arg
1025 1030 1035 1040
Arg Trp Val Arg Leu Arg Arg Arg Asp Leu Ser Gln Met Glu Ala Leu
1045 1050 1055
Lys Arg His Arg Gln Ala Glu Ala Glu Gly Glu Gly Trp Glu Tyr Ala
1060 1065 1070
Ser Leu Phe Gly Trp Lys Phe His Leu Glu Tyr Arg Lys Thr Asp Ala
1075 1080 1085
Phe Arg Arg Arg Arg Trp Arg Arg Arg Met Glu Pro Leu Glu Lys Thr
1090 1095 1100
Gly Pro Ala Ala Val Phe Ala Leu Glu Gly Ala Leu Gly Gly Val Met
1105 1110 1115 1120
Asp Asp Lys Ser Glu Asp Ser Met Ser Val Ser Thr Leu Ser Phe Gly
1125 1130 1135
Val Asn Arg Pro Thr Ile Ser Cys Ile Phe Asp Tyr Gly Asn Arg Tyr
1140 1145 1150
His Leu Arg Cys Tyr Met Tyr Gln Ala Arg Asp Leu Ala Ala Met Asp
1155 1160 1165
Lys Asp Ser Phe Ser Asp Pro Tyr Ala Ile Val Ser Phe Leu His Gln
1170 1175 1180
Ser Gln Lys Thr Val Val Val Lys Asn Thr Leu Asn Pro Thr Trp Asp
1185 1190 1195 1200
Gln Thr Leu Ile Phe Tyr Glu Ile Glu Ile Phe Gly Glu Pro Ala Thr
1205 1210 1215
Val Ala Glu Gln Pro Pro Ser Ile Val Val Glu Leu Tyr Asp His Asp
1220 1225 1230
Thr Tyr Gly Ala Asp Glu Phe Met Gly Arg Cys Ile Cys Gln Pro Ser
1235 1240 1245
Leu Glu Arg Met Pro Arg Leu Ala Trp Phe Pro Leu Thr Arg Gly Ser
1250 1255 1260
Gln Pro Ser Gly Glu Leu Leu Ala Ser Phe Glu Leu Ile Gln Arg Glu
1265 1270 1275 1280
Lys Pro Ala Ile His His Ile Pro Gly Phe Glu Val Gln Glu Thr Ser
1285 1290 1295
Arg Ile Leu Asp Glu Ser Glu Asp Thr Asp Leu Pro Tyr Pro Pro Pro
1300 1305 1310
Gln Arg Glu Ala Asn Ile Tyr Met Val Pro Gln Asn Ile Lys Pro Ala
1315 1320 1325
Leu Gln Arg Thr Ala Ile Glu Ile Leu Ala Trp Gly Leu Arg Asn Met
1330 1335 1340
Lys Ser Tyr Gln Leu Ala Asn Ile Ser Ser Pro Ser Leu Val Val Glu
1345 1350 1355 1360
Cys Gly Gly Gln Thr Val Gln Ser Cys Val Ile Arg Asn Leu Arg Lys
1365 1370 1375
Asn Pro Asn Phe Asp Ile Cys Thr Leu Phe Met Glu Val Met Leu Pro
1380 1385 1390
Arg Glu Glu Leu Tyr Cys Pro Pro Ile Thr Val Lys Val Ile Asp Asn
1395 1400 1405
Arg Gln Phe Gly Arg Arg Pro Val Val Gly Gln Cys Thr Ile Arg Ser
1410 1415 1420
Leu Glu Ser Phe Leu Cys Asp Pro Tyr Ser Ala Glu Ser Pro Ser Pro
1425 1430 1435 1440
Gln Gly Gly Pro Asp Asp Val Ser Leu Leu Ser Pro Gly Glu Asp Val
1445 1450 1455
Leu Ile Asp Ile Asp Asp Lys Glu Pro Leu Ile Pro Ile Gln Glu Glu
1460 1465 1470
Glu Phe Ile Asp Trp Trp Ser Lys Phe Phe Ala Ser Ile Gly Glu Arg
1475 1480 1485
Glu Lys Cys Gly Ser Tyr Leu Glu Lys Asp Phe Asp Thr Leu Lys Val
1490 1495 1500
Tyr Asp Thr Gln Leu Glu Asn Val Glu Ala Phe Glu Gly Leu Ser Asp
1505 1510 1515 1520
Phe Cys Asn Thr Phe Lys Leu Tyr Arg Gly Lys Thr Gln Glu Glu Thr
1525 1530 1535
Glu Asp Pro Ser Val Ile Gly Glu Phe Lys Gly Leu Phe Lys Ile Tyr
1540 1545 1550
Pro Leu Pro Glu Asp Pro Ala Ile Pro Met Pro Pro Arg Gln Phe His
1555 1560 1565
Gln Leu Ala Ala Gln Gly Pro Gln Glu Cys Leu Val Arg Ile Tyr Ile
1570 1575 1580
Val Arg Ala Phe Gly Leu Gln Pro Lys Asp Pro Asn Gly Lys Cys Asp
1585 1590 1595 1600
Pro Tyr Ile Lys Ile Ser Ile Gly Lys Lys Ser Val Ser Asp Gln Asp
1605 1610 1615
Asn Tyr Ile Pro Cys Thr Leu Glu Pro Val Phe Gly Lys Met Phe Glu
1620 1625 1630
Leu Thr Cys Thr Leu Pro Leu Glu Lys Asp Leu Lys Ile Thr Leu Tyr
1635 1640 1645
Asp Tyr Asp Leu Leu Ser Lys Asp Glu Lys Ile Gly Glu Thr Val Val
1650 1655 1660
Asp Leu Glu Asn Arg Leu Leu Ser Lys Phe Gly Ala Arg Cys Gly Leu
1665 1670 1675 1680
Pro Gln Thr Tyr Cys Val Ser Gly Pro Asn Gln Trp Arg Asp Gln Leu
1685 1690 1695
Arg Pro Ser Gln Leu Leu His Leu Phe Cys Gln Gln His Arg Val Lys
1700 1705 1710
Ala Pro Val Tyr Arg Thr Asp Arg Val Met Phe Gln Asp Lys Glu Tyr
1715 1720 1725
Ser Ile Glu Glu Ile Glu Ala Gly Arg Ile Pro Asn Pro His Leu Gly
1730 1735 1740
Pro Val Glu Glu Arg Leu Ala Leu His Val Leu Gln Gln Gln Gly Leu
1745 1750 1755 1760
Val Pro Glu His Val Glu Ser Arg Pro Leu Tyr Ser Pro Leu Gln Pro
1765 1770 1775
Asp Ile Glu Gln Gly Lys Leu Gln Met Trp Val Asp Leu Phe Pro Lys
1780 1785 1790
Ala Leu Gly Arg Pro Gly Pro Pro Phe Asn Ile Thr Pro Arg Arg Ala
1795 1800 1805
Arg Arg Phe Phe Leu Arg Cys Ile Ile Trp Asn Thr Arg Asp Val Ile
1810 1815 1820
Leu Asp Asp Leu Ser Leu Thr Gly Glu Lys Met Ser Asp Ile Tyr Val
1825 1830 1835 1840
Lys Gly Trp Met Ile Gly Phe Glu Glu His Lys Gln Lys Thr Asp Val
1845 1850 1855
His Tyr Arg Ser Leu Gly Gly Glu Gly Asn Phe Asn Trp Arg Phe Ile
1860 1865 1870
Phe Pro Phe Asp Tyr Leu Pro Ala Glu Gln Val Cys Thr Ile Ala Lys
1875 1880 1885
Lys Asp Ala Phe Trp Arg Leu Asp Lys Thr Glu Ser Lys Ile Pro Ala
1890 1895 1900
Arg Val Val Phe Gln Ile Trp Asp Asn Asp Lys Phe Ser Phe Asp Asp
1905 1910 1915 1920
Phe Leu Gly Ser Leu Gln Leu Asp Leu Asn Arg Met Pro Lys Pro Ala
1925 1930 1935
Lys Thr Ala Lys Lys Cys Ser Leu Asp Gln Leu Asp Asp Ala Phe His
1940 1945 1950
Pro Glu Trp Phe Val Ser Leu Phe Glu Gln Lys Thr Val Lys Gly Trp
1955 1960 1965
Trp Pro Cys Val Ala Glu Glu Gly Glu Lys Lys Ile Leu Ala Gly Lys
1970 1975 1980
Leu Glu Met Thr Leu Glu Ile Val Ala Glu Ser Glu His Glu Glu Arg
1985 1990 1995 2000
Pro Ala Gly Gln Gly Arg Asp Glu Pro Asn Met Asn Pro Lys Leu Glu
2005 2010 2015
Asp Pro Arg Arg Pro Asp Thr Ser Phe Leu Trp Phe Thr Ser Pro Tyr
2020 2025 2030
Lys Thr Met Lys Phe Ile Leu Trp Arg Arg Phe Arg Trp Ala Ile Ile
2035 2040 2045
Leu Phe Ile Ile Leu Phe Ile Leu Leu Leu Phe Leu Ala Ile Phe Ile
2050 2055 2060
Tyr Ala Phe Pro Asn Tyr Ala Ala Met Lys Leu Val Lys Pro Phe Ser
2065 2070 2075 2080
<210> 12
<211> 6911
<212> DNA
<213> 智人(Homo sapiens)
<400> 12
tcgaccgccc agccaggtgc aaaatgccgt gtcattggga gactccgcag ccggagcatt 60
agattacagc tcgacggagc tcgggaaggg cggcgggggt ggaagatgag cagaagcccc 120
tgttctcgga acgccggctg acaagcgggg tgagcgcagg cggggcgggg acccagccta 180
gcccactgga gcagccgggg gtggcccgtt cccctttaag agcaactgct ctaagccagg 240
agccagagat tcgagccggc ctcgcccagc cagccctctc cagcgagggg acccacaagc 300
ggcgcctcgg ccctcccgac ctttccgagc cctctttgcg ccctgggcgc acggggccct 360
acacgcgcca agcatgctga gggtcttcat cctctatgcc gagaacgtcc acacacccga 420
caccgacatc agcgatgcct actgctccgc ggtgtttgca ggggtgaaga agagaaccaa 480
agtcatcaag aacagcgtga accctgtatg gaatgaggga tttgaatggg acctcaaggg 540
catccccctg gaccagggct ctgagcttca tgtggtggtc aaagaccatg agacgatggg 600
gaggaacagg ttcctggggg aagccaaggt cccactccga gaggtcctcg ccacccctag 660
tctgtccgcc agcttcaatg cccccctgct ggacaccaag aagcagccca caggggcctc 720
gctggtcctg caggtgtcct acacaccgct gcctggagct gtgcccctgt tcccgccccc 780
tactcctctg gagccctccc cgactctgcc tgacctggat gtagtggcag acacaggagg 840
agaggaagac acagaggacc agggactcac tggagatgag gcggagccat tcctggatca 900
aagcggaggc ccgggggctc ccaccacccc aaggaaacta ccttcacgtc ctccgcccca 960
ctaccccggg atcaaaagaa agcgaagtgc gcctacatct agaaagctgc tgtcagacaa 1020
accgcaggat ttccagatca gggtccaggt gatcgagggg cgccagctgc cgggggtgaa 1080
catcaagcct gtggtcaagg ttaccgctgc agggcagacc aagcggacgc ggatccacaa 1140
gggaaacagc ccactcttca atgagactct tttcttcaac ttgtttgact ctcctgggga 1200
gctgtttgat gagcccatct ttatcacggt ggtagactct cgttctctca ggacagatgc 1260
tctcctcggg gagttccgga tggacgtggg caccatttac agagagcccc ggcacgccta 1320
tctcaggaag tggctgctgc tctcagaccc tgatgacttc tctgctgggg ccagaggcta 1380
cctgaaaaca agcctttgtg tgctggggcc tggggacgaa gcgcctctgg agagaaaaga 1440
cccctctgaa gacaaggagg acattgaaag caacctgctc cggcccacag gcgtagccct 1500
gcgaggagcc cacttctgcc tgaaggtctt ccgggccgag gacttgccgc agatggacga 1560
tgccgtgatg gacaacgtga aacagatctt tggcttcgag agtaacaaga agaacttggt 1620
ggaccccttt gtggaggtca gctttgcggg gaaaatgctg tgcagcaaga tcttggagaa 1680
gacggccaac cctcagtgga accagaacat cacactgcct gccatgtttc cctccatgtg 1740
cgaaaaaatg aggattcgta tcatagactg ggaccgcctg actcacaatg acatcgtggc 1800
taccacctac ctgagtatgt cgaaaatctc tgcccctgga ggagaaatag aagaggagcc 1860
tgcaggtgct gtcaagcctt cgaaagcctc agacttggat gactacctgg gcttcctccc 1920
cacttttggg ccctgctaca tcaacctcta tggcagtccc agagagttca caggcttccc 1980
agacccctac acagagctca acacaggcaa gggggaaggt gtggcttatc gtggccggct 2040
tctgctctcc ctggagacca agctggtgga gcacagtgaa cagaaggtgg aggaccttcc 2100
tgcggatgac atcctccggg tggagaagta ccttaggagg cgcaagtact ccctgtttgc 2160
ggccttctac tcagccacca tgctgcagga tgtggatgat gccatccagt ttgaggtcag 2220
catcgggaac tacgggaaca agttcgacat gacctgcctg ccgctggcct ccaccactca 2280
gtacagccgt gcagtctttg acgggtgcca ctactactac ctaccctggg gtaacgtgaa 2340
acctgtggtg gtgctgtcat cctactggga ggacatcagc catagaatcg agactcagaa 2400
ccagctgctt gggattgctg accggctgga agctggcctg gagcaggtcc acctggccct 2460
gaaggcgcag tgctccacgg aggacgtgga ctcgctggtg gctcagctga cggatgagct 2520
catcgcaggc tgcagccagc ctctgggtga catccatgag acaccctctg ccacccacct 2580
ggaccagtac ctgtaccagc tgcgcaccca tcacctgagc caaatcactg aggctgccct 2640
ggccctgaag ctcggccaca gtgagctccc tgcagctctg gagcaggcgg aggactggct 2700
cctgcgtctg cgtgccctgg cagaggagcc ccagaacagc ctgccggaca tcgtcatctg 2760
gatgctgcag ggagacaagc gtgtggcata ccagcgggtg cccgcccacc aagtcctctt 2820
ctcccggcgg ggtgccaact actgtggcaa gaattgtggg aagctacaga caatctttct 2880
gaaatatccg atggagaagg tgcctggcgc ccggatgcca gtgcagatac gggtcaagct 2940
gtggtttggg ctctctgtgg atgagaagga gttcaaccag tttgctgagg ggaagctgtc 3000
tgtctttgct gaaacctatg agaacgagac taagttggcc cttgttggga actggggcac 3060
aacgggcctc acctacccca agttttctga cgtcacgggc aagatcaagc tacccaagga 3120
cagcttccgc ccctcggccg gctggacctg ggctggagat tggttcgtgt gtccggagaa 3180
gactctgctc catgacatgg acgccggtca cctgagcttc gtggaagagg tgtttgagaa 3240
ccagacccgg cttcccggag gccagtggat ctacatgagt gacaactaca ccgatgtgaa 3300
cggggagaag gtgcttccca aggatgacat tgagtgccca ctgggctgga agtgggaaga 3360
tgaggaatgg tccacagacc tcaaccgggc tgtcgatgag caaggctggg agtatagcat 3420
caccatcccc ccggagcgga agccgaagca ctgggtccct gctgagaaga tgtactacac 3480
acaccgacgg cggcgctggg tgcgcctgcg caggagggat ctcagccaaa tggaagcact 3540
gaaaaggcac aggcaggcgg aggcggaggg cgagggctgg gagtacgcct ctctttttgg 3600
ctggaagttc cacctcgagt accgcaagac agatgccttc cgccgccgcc gctggcgccg 3660
tcgcatggag ccactggaga agacggggcc tgcagctgtg tttgcccttg agggggccct 3720
gggcggcgtg atggatgaca agagtgaaga ttccatgtcc gtctccacct tgagcttcgg 3780
tgtgaacaga cccacgattt cctgcatatt cgactatggg aaccgctacc atctacgctg 3840
ctacatgtac caggcccggg acctggctgc gatggacaag gactcttttt ctgatcccta 3900
tgccatcgtc tccttcctgc accagagcca gaagacggtg gtggtgaaga acacccttaa 3960
ccccacctgg gaccagacgc tcatcttcta cgagatcgag atctttggcg agccggccac 4020
agttgctgag caaccgccca gcattgtggt ggagctgtac gaccatgaca cttatggtgc 4080
agacgagttt atgggtcgct gcatctgtca accgagtctg gaacggatgc cacggctggc 4140
ctggttccca ctgacgaggg gcagccagcc gtcgggggag ctgctggcct cttttgagct 4200
catccagaga gagaagccgg ccatccacca tattcctggt tttgaggtgc aggagacatc 4260
aaggatcctg gatgagtctg aggacacaga cctgccctac ccaccacccc agagggaggc 4320
caacatctac atggttcctc agaacatcaa gccagcgctc cagcgtaccg ccatcgagat 4380
cctggcatgg ggcctgcgga acatgaagag ttaccagctg gccaacatct cctcccccag 4440
cctcgtggta gagtgtgggg gccagacggt gcagtcctgt gtcatcagga acctccggaa 4500
gaaccccaac tttgacatct gcaccctctt catggaagtg atgctgccca gggaggagct 4560
ctactgcccc cccatcaccg tcaaggtcat cgataaccgc cagtttggcc gccggcctgt 4620
ggtgggccag tgtaccatcc gctccctgga gagcttcctg tgtgacccct actcggcgga 4680
gagtccatcc ccacagggtg gcccagacga tgtgagccta ctcagtcctg gggaagacgt 4740
gctcatcgac attgatgaca aggagcccct catccccatc caggaggaag agttcatcga 4800
ttggtggagc aaattctttg cctccatagg ggagagggaa aagtgcggct cctacctgga 4860
gaaggatttt gacaccctga aggtctatga cacacagctg gagaatgtgg aggcctttga 4920
gggcctgtct gacttttgta acaccttcaa gctgtaccgg ggcaagacgc aggaggagac 4980
agaagatcca tctgtgattg gtgaatttaa gggcctcttc aaaatttatc ccctcccaga 5040
agacccagcc atccccatgc ccccaagaca gttccaccag ctggccgccc agggacccca 5100
ggagtgcttg gtccgtatct acattgtccg agcatttggc ctgcagccca aggaccccaa 5160
tggaaagtgt gatccttaca tcaagatctc catagggaag aaatcagtga gtgaccagga 5220
taactacatc ccctgcacgc tggagcccgt atttggaaag atgttcgagc tgacctgcac 5280
tctgcctctg gagaaggacc taaagatcac tctctatgac tatgacctcc tctccaagga 5340
cgaaaagatc ggtgagacgg tcgtcgacct ggagaacagg ctgctgtcca agtttggggc 5400
tcgctgtgga ctcccacaga cctactgtgt ctctggaccg aaccagtggc gggaccagct 5460
ccgcccctcc cagctcctcc acctcttctg ccagcagcat agagtcaagg cacctgtgta 5520
ccggacagac cgtgtaatgt ttcaggataa agaatattcc attgaagaga tagaggctgg 5580
caggatccca aacccacacc tgggcccagt ggaggagcgt ctggctctgc atgtgcttca 5640
gcagcagggc ctggtcccgg agcacgtgga gtcacggccc ctctacagcc ccctgcagcc 5700
agacatcgag caggggaagc tgcagatgtg ggtcgaccta tttccgaagg ccctggggcg 5760
gcctggacct cccttcaaca tcaccccacg gagagccaga aggtttttcc tgcgttgtat 5820
tatctggaat accagagatg tgatcctgga tgacctgagc ctcacggggg agaagatgag 5880
cgacatttat gtgaaaggtt ggatgattgg ctttgaagaa cacaagcaaa agacagacgt 5940
gcattatcgt tccctgggag gtgaaggcaa cttcaactgg aggttcattt tccccttcga 6000
ctacctgcca gctgagcaag tctgtaccat tgccaagaag gatgccttct ggaggctgga 6060
caagactgag agcaaaatcc cagcacgagt ggtgttccag atctgggaca atgacaagtt 6120
ctcctttgat gattttctgg gctccctgca gctcgatctc aaccgcatgc ccaagccagc 6180
caagacagcc aagaagtgct ccttggacca gctggatgat gctttccacc cagaatggtt 6240
tgtgtccctt tttgagcaga aaacagtgaa gggctggtgg ccctgtgtag cagaagaggg 6300
tgagaagaaa atactggcgg gcaagctgga aatgaccttg gagattgtag cagagagtga 6360
gcatgaggag cggcctgctg gccagggccg ggatgagccc aacatgaacc ctaagcttga 6420
ggacccaagg cgccccgaca cctccttcct gtggtttacc tccccataca agaccatgaa 6480
gttcatcctg tggcggcgtt tccggtgggc catcatcctc ttcatcatcc tcttcatcct 6540
gctgctgttc ctggccatct tcatctacgc cttcccgaac tatgctgcca tgaagctggt 6600
gaagcccttc agctgaggac tctcctgccc tgtagaaggg gccgtggggt cccctccagc 6660
atgggactgg cctgcctcct ccgcccagct cggcgagctc ctccagacct cctaggcctg 6720
attgtcctgc cagggtgggc agacagacag atggaccggc ccacactccc agagttgcta 6780
acatggagct ctgagatcac cccacttcca tcatttcctt ctcccccaac ccaacgcttt 6840
tttggatcag ctcagacata tttcagtata aaacagttgg aaccacaaaa aaaaaaaaaa 6900
aaaaaaaaaa a 6911
<210> 13
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> primer_bind
<222> (1)..(18)
<223> 引物
<400> 13
ccgacacgcc tacctgag 18
<210> 14
<211> 19
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<221> primer_bind
<222> (1)..(19)
<223> 引物
<400> 14
ccggcactaa aatcgtcag 19

Claims (39)

1.编码截短的哺乳动物dysferlin多肽的多核苷酸,其中所述多肽的每个C2D和C2F结构域的至少大部分被删除。
2.根据权利要求1所述的多核苷酸,其中所述多肽的C2E结构域的至少大部分被删除。
3.根据权利要求1或2所述的多核苷酸,其中所述多肽包含C2A、C2C、FerA、DysF、C2G和TM结构域中的至少大部分。
4.根据权利要求1-3中任一项所述的多核苷酸,其中所述多肽包含C2A、C2B、C2C、FerA、DysF、C2G和TM结构域中的至少大部分。
5.根据权利要求1-4中任一项所述的多核苷酸,其中所述dysferlin多肽是人dysferlin多肽。
6.根据权利要求1-5中任一项所述的多核苷酸,其中所述多核苷酸为:
(a)包含与SEQ ID NOS:1-5中的任何一个至少80%相同的序列的多核苷酸;
(b)包含与SEQ ID NOS:6-10中的任何一个至少80%相同的编码多肽的序列的多核苷酸;或
(c)由于密码子简并性而与(a)或(b)的多核苷酸的不同的多核苷酸。
7.根据权利要求1-6中任一项所述的多核苷酸,其中所述多核苷酸为:
(a)包含与SEQ ID NOS:1-5中的任何一个相同的序列的多核苷酸;
(b)包含与SEQ ID NOS:6-10中的任何一个相同的编码多肽的序列的多核苷酸;或者
(c)由于密码子简并性而与(a)或(b)的多核苷酸的不同的多核苷酸。
8.包含权利要求1-7中任一项所述的多核苷酸的表达盒。
9.根据权利要求8所述的表达盒,其中所述多核苷酸可操作地连接至启动子。
10.一种载体,包含权利要求1-7中任一项所述的多核苷酸或者权利要求8或9中所述的表达盒。
11.根据权利要求10所述的载体,其中所述载体是病毒载体。
12.根据权利要求11所述的载体,其中所述载体是腺相关病毒(AAV)载体。
13.一种转化细胞,其包含权利要求1-7中任一项所述的多核苷酸、权利要求8或9所述的表达盒,和/或权利要求10-12中任一项所述的载体。
14.一种转基因动物,其包含权利要求1-7中任一项所述的多核苷酸、权利要求8或9所述的表达盒、权利要求10-12中任一项所述的载体,和/或权利要求13所述的转化细胞。
15.截短的哺乳动物dysferlin多肽,其中所述多肽的每个C2D和C2F结构域的至少大部分被删除。
16.根据权利要求15所述的多肽,其中所述多肽的C2E结构域的至少大部分被删除。
17.根据权利要求15或16所述的多肽,其中所述多肽包含C2A、C2C、FerA、DysF、C2G和TM结构域中的至少大部分。
18.根据权利要求15-17中任一项所述的多肽,其中所述多肽包含C2A、C2B、C2C、FerA、DysF、C2G和TM结构域中的至少大部分。
19.根据权利要求15-18中任一项所述的多肽,其中所述dysferlin多肽是人dysferlin多肽。
20.根据权利要求15-19中任一项所述的多肽,其中所述多肽为:
(a)由多核苷酸编码的多肽,该多核苷酸包含与SEQ ID NOS:1-5中的任何一个至少80%相同的序列;或者
(b)包含与SEQ ID NOS:6-10中的任何一个至少80%相同的序列的多肽。
21.根据权利要求15-20中任一项所述的多肽,其中所述多肽为:
(a)由多核苷酸编码的多肽,该多核苷酸包含与SEQ ID NOS:1-5中的任何一个相同的序列;或者
(b)包含与SEQ ID NOS:6-10中的任何一个相同的序列的多肽。
22.一种重组AAV颗粒,包含权利要求1-7中任一项所述的多核苷酸或者权利要求8或9中所述的表达盒。
23.一种产生重组AAV颗粒的方法,包括向允许AAV复制的细胞提供:
(a)重组AAV模板,包含(i)权利要求1-7中任一项所述的多核苷酸或者权利要求8或9中所述的表达盒,和(ii)反向末端重复(ITR);
(b)包含Rep编码序列和Cap编码序列的多核苷酸;
在足以复制和包装重组AAV模板的条件下;
由此在细胞中产生重组AAV颗粒。
24.根据权利要求23所述的方法,其中所述Rep编码序列和Cap编码序列不能包装到重组AAV颗粒中。
25.根据权利要求23或24所述的方法,其中Rep编码序列和/或Cap编码序列由质粒提供。
26.根据权利要求23或24所述的方法,其中Rep编码序列和/或Cap编码序列由病毒载体提供。
27.根据权利要求26所述的方法,其中所述病毒载体选自由腺病毒载体、疱疹病毒载体、埃-巴二氏病毒载体和杆状病毒载体组成的组。
28.根据权利要求23-27中任一项所述的方法,其中所述Rep编码序列稳定整合到所述细胞中。
29.根据权利要求23-28中任一项所述的方法,其中所述Cap编码序列稳定整合到所述细胞中。
30.根据权利要求23-29中任一项所述的方法,其中重组AAV模板由质粒或病毒载体提供或作为原病毒稳定整合到细胞中。
31.将dysferlin递送至细胞的方法,包括使细胞与权利要求22的重组AAV颗粒接触,从而将dysferlin递送至细胞。
32.根据权利要求31所述的方法,其中所述细胞选自由平滑肌细胞、骨骼肌细胞、心肌细胞、生殖细胞、祖细胞和干细胞组成的组。
33.向哺乳动物受试者施用dysferlin的方法,包括向哺乳动物受试者施用已与权利要求22的重组AAV颗粒接触的细胞,从而向哺乳动物受试者施用dysferlin。
34.治疗有需要的哺乳动物受试者的dysferlin肌病的方法,包括向哺乳动物受试者施用已与权利要求22的重组AAV颗粒接触的细胞,从而治疗dysferlin肌病。
35.向哺乳动物受试者施用dysferlin的方法,包括向哺乳动物受试者施用权利要求22的重组AAV颗粒,从而向哺乳动物受试者施用dysferlin。
36.治疗有需要的哺乳动物受试者的dysferlin肌病的方法,包括向哺乳动物受试者施用权利要求22的重组AAV颗粒,从而治疗dysferlin肌病。
37.根据权利要求33-36中任一项所述的方法,其中所述受试者是人类受试者。
38.根据权利要求35-37中任一项所述的方法,其中AAV颗粒通过选自以下组中的途径施用,所述组由口服、直肠、经粘膜、透皮、吸入、静脉内、皮下、皮内、颅内、肌内、内皮内、关节内施用和局部肢体灌注组成。
39.根据权利要求35-37中任一项所述的方法,其中将AAV颗粒施用于选自由骨骼肌、平滑肌、心脏和膈肌组成的组中的部位。
CN201780050284.7A 2016-06-17 2017-06-16 用于治疗Dysferlin肌病的截短Dysferlin Pending CN109563512A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662351701P 2016-06-17 2016-06-17
US62/351,701 2016-06-17
PCT/US2017/037822 WO2017218866A1 (en) 2016-06-17 2017-06-16 Truncated dysferlin for treatment of dysferlinopathy

Publications (1)

Publication Number Publication Date
CN109563512A true CN109563512A (zh) 2019-04-02

Family

ID=60663818

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780050284.7A Pending CN109563512A (zh) 2016-06-17 2017-06-16 用于治疗Dysferlin肌病的截短Dysferlin

Country Status (11)

Country Link
US (1) US20200010521A1 (zh)
EP (1) EP3472320A4 (zh)
JP (1) JP7202895B2 (zh)
KR (1) KR20190028389A (zh)
CN (1) CN109563512A (zh)
AU (1) AU2017285423A1 (zh)
BR (1) BR112018076127A2 (zh)
CA (1) CA3027149A1 (zh)
IL (1) IL263577A (zh)
RU (1) RU2019100990A (zh)
WO (1) WO2017218866A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023519762A (ja) * 2020-05-13 2023-05-12 リサーチ インスティチュート アット ネイションワイド チルドレンズ ホスピタル ジスフェリン二重ベクターを用いた遺伝子治療
EP4086276A1 (en) * 2021-05-03 2022-11-09 Université d'Aix-Marseille Composition for treating dysferlinopathy

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000011157A1 (en) * 1998-08-25 2000-03-02 The General Hospital Corporation Dysferlin, a gene mutated in distal myopathy and limb girdle muscular dystrophy
WO2007089632A2 (en) * 2006-01-27 2007-08-09 The University Of North Carolina At Chapel Hill Heparin and heparan sulfate binding chimeric vectors
WO2007124148A2 (en) * 2006-04-21 2007-11-01 The University Of North Carolina At Chapel Hill Treatment of connective tissue disorders
WO2009016326A2 (fr) * 2007-07-26 2009-02-05 Genethon Vecteurs viraux adéno-associés pour l'expression de la dysferline
RU2527073C2 (ru) * 2012-12-24 2014-08-27 Общество с ограниченной ответственностью "НекстГен" Кодон-оптимизированная кднк, кодирующая дисферлин человека, генно-инженерная конструкция, рекомбинантный аденовирус и фармацевтическая композиция для лечения дисферлинопатий

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000011157A1 (en) * 1998-08-25 2000-03-02 The General Hospital Corporation Dysferlin, a gene mutated in distal myopathy and limb girdle muscular dystrophy
WO2007089632A2 (en) * 2006-01-27 2007-08-09 The University Of North Carolina At Chapel Hill Heparin and heparan sulfate binding chimeric vectors
WO2007124148A2 (en) * 2006-04-21 2007-11-01 The University Of North Carolina At Chapel Hill Treatment of connective tissue disorders
WO2009016326A2 (fr) * 2007-07-26 2009-02-05 Genethon Vecteurs viraux adéno-associés pour l'expression de la dysferline
RU2527073C2 (ru) * 2012-12-24 2014-08-27 Общество с ограниченной ответственностью "НекстГен" Кодон-оптимизированная кднк, кодирующая дисферлин человека, генно-инженерная конструкция, рекомбинантный аденовирус и фармацевтическая композиция для лечения дисферлинопатий

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
BILAL A. AZAKIR等: "Modular Dispensability of Dysfeilin C2 Domains Reveals Rational Design for Mini-dysferlin Molecules", 《JOURNAL OF BIOLOGICAL CHEMISTRY》 *
TELMO LLANGA等: "630. AAV transduction of a truncated dysferlin Improves Dysferlinopathy", 《MOLECULAR THERAPY》 *

Also Published As

Publication number Publication date
US20200010521A1 (en) 2020-01-09
EP3472320A4 (en) 2020-04-08
KR20190028389A (ko) 2019-03-18
RU2019100990A (ru) 2020-07-17
RU2019100990A3 (zh) 2020-11-18
IL263577A (en) 2019-01-31
CA3027149A1 (en) 2017-12-21
JP7202895B2 (ja) 2023-01-12
AU2017285423A1 (en) 2019-01-03
JP2019517816A (ja) 2019-06-27
EP3472320A1 (en) 2019-04-24
BR112018076127A2 (pt) 2019-03-26
WO2017218866A1 (en) 2017-12-21

Similar Documents

Publication Publication Date Title
US11547765B2 (en) Optimized mini-dystrophin genes and expression cassettes and their use
RU2751953C2 (ru) Модифицированные капсидные белки для улучшения доставки парвовирусных векторов
CN102918152B (zh) 用于治疗莱伯氏先天性黑蒙-1(lca1)的raav-鸟苷酸环化酶组合物及方法
CN108348621A (zh) 用于基因治疗的经修饰的弗里德赖希共济失调基因及载体
CN108697774A (zh) 治疗mps i-相关失明的aav-idua载体
JP2019502378A (ja) 眼疾患のための遺伝子療法
CN109415730A (zh) 优化的cln1基因和表达盒以及它们的应用
CN111088285A (zh) 携带atp7b基因表达框及变异体的aav载体及应用
IL301955A (en) Therapeutic delivery of an adeno-related protein-related protein (FKRP) virus for the treatment of dystroglycanopathy disorders, including limb girdle 21
CN109563512A (zh) 用于治疗Dysferlin肌病的截短Dysferlin
AU2020279387A1 (en) UBE3A genes and expression cassettes and their use
CA3189657A1 (en) Methods and compositions for treatment of fragile x syndrome
EP3963073A1 (en) Optimized sumf1 genes and expression cassettes and their use
CN110475573A (zh) 用于减少肌脂蛋白表达以及预防和治疗肌营养不良症和心肌病的组合物及其使用方法
WO2022147490A1 (en) Optimized fukutin-related proteins (fkrp) and methods of use

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination