CN114276419B - 肌肉高亲和性的新型腺相关病毒衣壳蛋白及其应用 - Google Patents

肌肉高亲和性的新型腺相关病毒衣壳蛋白及其应用 Download PDF

Info

Publication number
CN114276419B
CN114276419B CN202111659608.1A CN202111659608A CN114276419B CN 114276419 B CN114276419 B CN 114276419B CN 202111659608 A CN202111659608 A CN 202111659608A CN 114276419 B CN114276419 B CN 114276419B
Authority
CN
China
Prior art keywords
gly
pro
asn
ala
ser
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111659608.1A
Other languages
English (en)
Other versions
CN114276419A (zh
Inventor
杨晨
赵锴
陈晨
杜增民
吴侠
蒋威
闫梦迪
程诚
宁秦洁
薛华清
程欣怡
张然
赵阳
凌菲香
王慧
王利群
郑静
肖啸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Mianyi Biotechnology Co ltd
Original Assignee
Shanghai Mianyi Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Mianyi Biotechnology Co ltd filed Critical Shanghai Mianyi Biotechnology Co ltd
Priority to CN202111659608.1A priority Critical patent/CN114276419B/zh
Publication of CN114276419A publication Critical patent/CN114276419A/zh
Priority to PCT/CN2022/135804 priority patent/WO2023124740A1/zh
Application granted granted Critical
Publication of CN114276419B publication Critical patent/CN114276419B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P21/00Drugs for disorders of the muscular or neuromuscular system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P29/00Non-central analgesic, antipyretic or antiinflammatory agents, e.g. antirheumatic agents; Non-steroidal antiinflammatory drugs [NSAID]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P9/00Drugs for disorders of the cardiovascular system
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P9/00Drugs for disorders of the cardiovascular system
    • A61P9/04Inotropic agents, i.e. stimulants of cardiac contraction; Drugs for heart failure
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P9/00Drugs for disorders of the cardiovascular system
    • A61P9/10Drugs for disorders of the cardiovascular system for treating ischaemic or atherosclerotic diseases, e.g. antianginal drugs, coronary vasodilators, drugs for myocardial infarction, retinopathy, cerebrovascula insufficiency, renal arteriosclerosis
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • C07K14/01DNA viruses
    • C07K14/015Parvoviridae, e.g. feline panleukopenia virus, human parvovirus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • C12N15/864Parvoviral vectors, e.g. parvovirus, densovirus

Abstract

本发明涉及具有肌肉高亲和性的新型腺相关病毒(AAV)衣壳蛋白、编码该衣壳蛋白的核酸分子、包含该衣壳蛋白的AAV载体及其应用,以及包含该AAV载体的药物。本发明的新型AAV衣壳蛋白具有良好的肌肉组织亲和性,利用该衣壳蛋白构建的AAV载体和药物可送递治疗性基因用于治疗各种疾病。

Description

肌肉高亲和性的新型腺相关病毒衣壳蛋白及其应用
技术领域
本公开涉及具有肌肉高亲和性的新型腺相关病毒(AAV)衣壳蛋白、编码该衣壳蛋白的核酸分子、包含该衣壳蛋白的AAV载体及其应用,以及包含该AAV载体的药物。
背景技术
近年来,基因治疗蓬勃发展。作为在治疗性基因传递方面非常有前景的载体,腺相关病毒(AAV)在各种器官组织的高转导效率、长期治疗效果和低致病性的特性使其在基因治疗领域具有明显的优势(Chengwen Li,R Jude Samulski,Engineering adeno-associated virus vectors for gene therapy,Nat Rev Genet 2020,21(4):255-272)。AAV广泛应用于靶向各种器官组织例如眼睛、骨骼肌、肝脏、中枢神经系统来治疗多种疾病。例如在2017年底,Spark Therapeutics生产的基于AAV2的基因治疗药物“Luxturna”已被美国食品药品监督管理局(FDA)批准用以治疗患有RPE65突变的Leber先天性黑蒙病。在2019年5月,FDA批准了基于AAV9的药物Zolgensma用以治疗脊髓性肌萎缩,这是一种由SMN基因突变引起的神经肌肉疾病。杜氏肌营养不良是一种较为常见的X染色体肌营养不良蛋白(dystrophin)基因突变引起的以肌肉萎缩、呼吸运动功能渐行性丧失为代表的肌肉退行性疾病,主要在男性中发病,发病率约为1/3500~5000。目前基因治疗工具已经在许多临床试验中得以运用,这些基因疗法利用AAV作为载体治疗多种遗传型肌肉疾病(例如肢带型肌营养不良和杜氏肌营养不良等),取得了显著的治疗效果。
尽管AAV载体已经在临床上取得了早期治疗效果,但人们对其转导效率、靶向性及免疫反应等潜在问题的担忧也有所增加,比如人类患者对全身性AAV疗法的耐受性。近期在研究用功能性MTM1表达的AAV8载体治疗X染色体连锁肌管肌病(XLMTM)的试验(NCT03199469)中有三名儿童不幸死亡(Wilson JM,Flotte TR.Moving Forward AfterTwo Deaths in a Gene Therapy Trial of Myotubular Myopathy.Hum Gene Ther.2020,31(13-14):695-696)。虽然死亡原因仍在调查中,但野生型AAV对于肌肉组织的感染效率相对于其他组织器官(如肝脏)较低,使得AAV在肌肉疾病的治疗剂量下在其他组织器官中的富集度较高,从而引发一些脱靶副作用的问题。
此外,针对AAV病毒引发的免疫反应,包括针对AAV衣壳和递送基因蛋白产物的中和抗体(Nab)、由CD4+和CD8+等T细胞为主介导的针对受AAV转导的靶细胞的细胞免疫反应,这些也是限制AAV相关应用的主要因素。
研究显示,AAV载体的组织亲嗜性及细胞转化效率主要由其衣壳决定。不同的衣壳决定了不同的AAV具有不同的组织亲嗜性及转化效率。为改善AAV的组织感染效率和减轻免疫反应,可以采用例如DNA混编(DNA shuffling)、易错PCR、定点突变以及肽段插入或替换的方法来改造AAV衣壳,由此产生新的AAV血清型。
因此,为了实现更好的治疗效果,期望对AAV衣壳蛋白进行合适的改造,获得具有器官(例如肌肉)特异性的新型腺相关病毒载体。
发明内容
为了解决上述技术问题,本发明人进行了大量研究并出乎预料地发现,将AAVHH67衣壳蛋白(SEQ ID NO:2,其描述于例如US 9402921 B2)的VP1和VP2的N端第1至(188~203)位替换为AAV9衣壳蛋白(SEQ ID NO:4)相应位置的氨基酸时,所获得的新型AAV衣壳蛋白能够高效递送基因及其蛋白产物至肌肉组织。
因此,在第一方面,本公开提供一种AAV衣壳蛋白,其中,所述AAV衣壳蛋白通过将AAVHH67衣壳蛋白的VP1和VP2的N端第1至N位替换为AAV9衣壳蛋白的VP1和VP2的N端第1至N位构建而成,所述AAVHH67衣壳蛋白的氨基酸序列如SEQ ID NO:2所示,所述AAV9衣壳蛋白的氨基酸序列如SEQ ID NO:4所示,所述N为188至203之间的整数。
在一个实施方式中,N为188、189、190、191、192、193、194、195、196、197、198、199、200、201、202或203。
在一个优选实施方式中,N为188、193或203。
在一个实施方式中,上述AAV衣壳蛋白的氨基酸序列与SEQ ID NO:6、SEQ ID NO:8或SEQ ID NO:10所示的氨基酸序列具有至少98%的同一性。
在一个实施方式中,上述AAV衣壳蛋白的氨基酸序列如SEQ ID NO:6、SEQ ID NO:8或SEQ ID NO:10所示。
与AAV9和AAVHH67相比,本公开通过对AAV9和AAVHH67衣壳蛋白进行杂交重构而获得的新型AAV衣壳蛋白具有更优异的心脏及肌肉感染效率。
在第二方面,本公开提供一种核酸分子,其编码根据第一方面所述的AAV衣壳蛋白。
在一个实施方式中,上述核酸分子的核苷酸序列与SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9所示的核苷酸序列具有至少70%的同一性。
在一个优选实施方式中,上述核酸分子的核苷酸序列与SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9所示的核苷酸序列具有至少75%、80%、85%、90%、95%或99%的同一性。
在一个实施方式中,上述核酸分子包含SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9所示的核苷酸序列。
在一个优选实施方式中,上述核酸分子的核苷酸序列如SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9所示。
在第三方面,本公开提供一种AAV载体,其包含根据第一方面所述的AAV衣壳蛋白和病毒基因组。
在一个实施方式中,病毒基因组是天然的AAV基因组或人工重组的病毒基因组。
在一个优选实施方式中,病毒基因组编码报告蛋白和治疗性蛋白中的一种以上。
在一个优选实施方式中,治疗性蛋白是用于治疗心脏疾病或肌肉疾病的蛋白质。
在第四方面,本公开提供根据第三方面所述的AAV载体在制备用于治疗心脏疾病或肌肉疾病的药物中的应用。
在一个优选实施方式中,肌肉疾病是由于肌肉功能下降、肌肉消耗或肌肉退化而引起的肌肉疾病。
在一个优选实施方式中,肌肉疾病选自:杜氏肌营养不良(DMD)、Emery-Dreifuss肌营养不良(EDMD)、Walker-Warburg综合征、肢带肌营养不良(LGMD)、X染色体连锁肌管肌病(XLMTM)、还原体肌病(Reducing body myopathy)、X染色体连锁肌病伴体位性肌肉萎缩(XMPMA)、X染色体连锁肩胛骨肌病(X-SPM)、面肩胛肱型肌营养不良症(FSHD)、重症肌无力(MG)、先天性肌无力综合症(CMD)、肌少症(sarcopenia)、恶病质、肌萎缩性侧索硬化症(ALS),以及I型和II型肌强直性营养不良。
在一个优选实施方式中,心脏疾病选自:充血性心衰、先天性心衰、缺血性心肌病、肥厚性心肌病和风湿性心脏病。
在第五方面,本公开提供一种药物,其包含:根据第三方面所述的AAV载体和赋形剂。
在一个实施方式中,赋形剂包括盐、有机物和表面活性剂。
本公开的AAV载体和药物能够高效地、系统地将治疗性蛋白质递送到全身各部位的多种肌肉中,可应用于各种需要系统性全身肌肉递送的相关肌肉疾病的预防、诊断和治疗或用于疫苗。
在第六方面,本公开提供一种治疗心脏疾病或肌肉疾病的方法,包括向有需要的受试者施用治疗有效量的根据第五方面所述的药物。
在一个实施方式中,药物通过全身途径或局部途径施用,例如静脉内施用、肌内施用、心脏内施用、皮下施用、经口施用、局部接触、腹膜内施用和病灶内施用。
在一个优选实施方式中,药物通过全身途径或局部途径施用于心脏和/或肌肉。
附图说明
图1A示出了根据本公开的三个实施方式的新型AAV衣壳蛋白:AAVT69、AAVT70、AAVT71。AAVT69通过将AAVHH67衣壳蛋白(SEQ ID NO:2)的VP1和VP2的N端第1至203位替换为AAV9衣壳蛋白(SEQ ID NO:4)的VP1和VP2的N端第1至203位构建而成;AAVT70通过将AAVHH67衣壳蛋白的VP1和VP2的N端第1至193位替换为AAV9衣壳蛋白的VP1和VP2的N端第1至193位构建而成;AAVT71通过将AAVHH67衣壳蛋白的VP1和VP2的N端第1至188位替换为AAV9衣壳蛋白的VP1和VP2的N端第1至188位构建而成。
图1B示出了AAV9、HH67(AAVHH67)、AAVT69、AAVT70和AAVT71的产量。病毒基因组定量采用qPCR。病毒衣壳蛋白采用银染定量。n=3批样品每组。
图2A示出了AAV5、AAV8、AAV9、AAVT69、AAVT70和AAVT71对未分化的C2C12成肌细胞的转导效率。用包装GFP基因的上述AAV血清型感染C2C12成肌细胞,感染复数MOI为1×105vg/细胞。AAV处理48h后拍照。上层:GFP荧光;下层:明场。比例尺=100μm。
图2B显示了图2A中GFP阳性成肌细胞的百分比定量结果,通过计算GFP信号面积与细胞总面积的比值而获得。n=5孔细胞每组,***p<0.001,单项方差分析。
图2C示出了AAV5、AAV8、AAV9、AAVT69、AAVT70和AAVT71对C2C12成肌细胞分化后的肌管的转导效率。在分化培养基(DMEM+4%马血清)中培养C2C12成肌细胞72h后,以感染复数MOI为1×105vg/细胞加入AAV,48h后拍照。上层:GFP荧光;下层:明场。比例尺=100μm。
图2D显示了图2C中GFP阳性肌管的百分比定量结果,通过计算GFP信号阳性的肌管面积与细胞总面积的比值而获得。n=5孔细胞每组,***p<0.001,单项方差分析。
图3A和图3B展示了C57BL/6小鼠尾静脉注射4×1013vg/kg包装GFP基因的图示AAV病毒血清型21天后,进行全身的GFP信号(图3A)和各种肌肉的GFP/DAPI共染色(图3B)的成像结果。比例尺100μm。肌肉名称如下:腓肠肌(GA);四头肌(QU);背最长肌(LON);胸锁乳突肌(ST);肱三头肌(TRI);舌头(TON)。
图3C显示了图3B中各种肌肉感染效率的定量统计结果,由GFP信号面积与肌肉总横切面积比值计算而得。n=3只小鼠每组,**p<0.01,***p<0.001,单项方差分析。
图3D展示了图示AAV血清型对于I类肌肉(以比目鱼肌(SO)为代表)和II类肌肉(以胫骨前肌(TA)为代表)的感染能力。
图3E显示了图3D中各种肌肉感染效率的定量统计结果。n=3只小鼠每组,***p<0.001,单项方差分析。
图4A显示了C57BL/6小鼠尾静脉注射1×1013和4×1013vg/kg包装GFP基因的图示AAV病毒血清型21天后,进行心脏的GFP/DAPI共染色的成像结果。比例尺=100μm。
图4B显示了图4A中各AAV血清型对心肌细胞感染效率的定量统计结果,由GFP信号面积与心肌横切面积比值计算而得。n=3只小鼠每组,*p<0.05,**p<0.01,***p<0.001,单项方差分析。
图4C显示了各AAV血清型在1×1013或4×1013vg/kg剂量下对于小鼠的肝、肺和肾的GFP基因递送能力。比例尺=100μm。
图4D显示了图4C中GFP阳性细胞百分比的定量统计结果。n=3只小鼠每组,*p<0.05,**p<0.01,***p<0.001,单项方差分析。
图5A和图5B展示了mdx雄性小鼠尾静脉注射3×1013vg/kg包装GFP基因的图示AAV病毒血清型21天后,进行全身的GFP信号(图5A)和各种肌肉的GFP/DAPI共染色(图5B)的成像结果。比例尺=200μm。肌肉名称如下:腓肠肌(GA);四头肌(QU);背最长肌(LON);肱三头肌(TRI);肋间肌(INT);舌头(TON)。
图5C显示了图5A中各种肌肉感染效率的定量统计结果,由GFP信号面积与肌肉总横切面积的比值计算而得。n=3只小鼠每组,**p<0.01,***p<0.001,单项方差分析。
图5D展示了各AAV血清型对mdx雄性小鼠心肌细胞的感染能力。
图5E显示了图5D中各AAV血清型感染效率的定量统计结果。n=3只小鼠每组,**p<0.01,单项方差分析。
图6显示了AAVT69衣壳蛋白的氨基酸序列(SEQ ID NO:6)。
图7显示了AAVT70衣壳蛋白的氨基酸序列(SEQ ID NO:8)。
图8显示了AAVT71衣壳蛋白的氨基酸序列(SEQ ID NO:10)。
具体实施方式
除非另有定义,否则本文使用的所有技术和科学术语具有与本公开所属领域的普通技术人员的通常理解相同的含义。
除非另有说明,否则本文列出的核酸或多核苷酸序列是单链形式,方向是从5'至3',从左至右。本文提供的核苷酸和氨基酸采用IUPACIUB生化命名委员会建议的格式,对于氨基酸采用单字母代码或三字母代码。
除非另有说明,“多核苷酸”是“核酸”的同义词,指任何长度的核苷酸的聚合形式,包括脱氧核糖核苷酸或核糖核苷酸,它们的混合序列或类似物。多核苷酸可以包括修饰的核苷酸,例如甲基化或加帽的核苷酸和核苷酸类似物。
在本文中,术语“包含”、“具有”、“包括”和“含有”应被解释为开放式术语(即意味着“包括但不限于”)。
在本文中,术语“患者”和“受试者”可互换使用并且以其常规意义使用,指患有或容易患有可通过施用本公开的药物进行预防或治疗的病症的生物体,并且包括人和非人动物(例如,啮齿动物或其他哺乳动物)。
在一个实施方式中,受试者是非人动物(例如,黑猩猩和其他猿和猴物种;农场动物,如牛、绵羊、猪、山羊和马;家养哺乳动物,例如狗和猫;实验动物包括啮齿类动物,如小鼠、大鼠和豚鼠;禽类,包括家禽、野禽和猎禽,如鸡、火鸡和其他鸡类、鸭、鹅等)。在一个实施方式中,受试者是哺乳动物。在一个实施方式中,受试者是人。
在本文中,术语“治疗”包括:(1)抑制病状、疾病或者病症,即,阻止、减少或者延迟疾病的发展或其复发或者其至少一种临床或者亚临床症状的发展;或者(2)缓解疾病,即,引起病状、疾病或者病症或者其临床或者亚临床症状中的至少一种消退。
在本文中,术语“治疗有效量”指产生施用它要达到的治疗效果的剂量。例如,适用于治疗肌肉疾病的药物的治疗有效量可为能够预防或改善与该肌肉疾病相关的一种或多种症状的量。
在本文中,术语“改善”指与疾病有关的症状的改善,并且可以指至少一种衡量或定量该症状的参数的改善。
在本文中,术语“预防”病状、疾病或者病症包括:预防、延迟或者减少受试者中发展的病状、疾病或者病症的至少一种临床或者亚临床症状出现的发生率和/或可能性,该受试者可能患有或易患该病状、疾病或者病症但尚未经历或者表现出该病状、疾病或者病症的临床或亚临床症状。
在本文中,术语“局部施用”或“局部途径”是指具有局部作用的给药。
在本文中,术语“转导”、“转染”和“转化”是指将外源核酸递送到宿主细胞中,然后多核苷酸产物的转录和翻译的过程,该过程包括使用重组病毒将外源多核苷酸引入宿主细胞。
在本文中,术语“基因送递”指的是将外源多核苷酸引入细胞来进行基因传递,包括靶向、结合、摄取、转运、复制子整合和表达。
在本文中,术语“基因表达”或“表达”是指基因转录、翻译和翻译后修饰产生基因的RNA或蛋白产物的过程。
在本文中,术语“感染”是指包含多核苷酸组分的病毒或病毒颗粒将多核苷酸递送至细胞中并产生其RNA和蛋白质产物的过程,也可指病毒在宿主细胞中的复制过程。
在本文中,术语“靶向”是指病毒优先进入一些细胞或组织,然后进一步在细胞中表达病毒基因组或重组转基因携带的序列。
在本文中,与多核苷酸相关的“重组”意味着该多核苷酸是一个通过多步克隆步骤构建的不同于天然多核苷酸的合成产物,亦或是将两个或以上多核苷酸片段连接组合而成的杂交合成产物。重组病毒是包含重组多核苷酸的病毒颗粒。
在本文中,术语“载体”指封装多核苷酸的一个或一系列大分子,其促进多核苷酸在体外或体内递送至靶细胞。载体的种类包括但不限于质粒、病毒载体、脂质体和其他基因递送载体。待递送的多核苷酸有时被称为“转基因”,包括但不限于某些蛋白质或合成多肽(其可以增强、抑制、削弱、保护、触发或预防某些生物学和生理功能)的编码序列、疫苗开发中感兴趣的编码序列(例如表达适于在哺乳动物中引发免疫应答的蛋白质、多肽或肽的多核苷酸)、RNAi组分(例如,shRNA、siRNA、snRNA、microRNA、核酶、反义寡核苷酸和反义多核苷酸,它们可以敲低以异常方式激活的任何内源基因或侵入宿主细胞的外源基因)或可选的生物标记。病毒或细菌的多核苷酸是本领域已知的。RNAi组分通常与其靶基因在序列上具有60-100%的同一性,并导致相应的蛋白质产物减少至少30%(如30%、40%、50%、60%、70%、80%、90%或100%)。
在本文中,“病毒颗粒”是指病毒的衣壳蛋白包装天然的或人工合成的病毒基因组形成的功能性病毒单位,其功能包括感染或转导组织器官及细胞、将病毒基因组递送至组织器官及细胞内并表达出相应的核酸及蛋白产物。
在本文中,术语“多肽”和“蛋白质”在本文中同义地是指由20个以上的氨基酸组成的聚合物。这些术语还涵盖合成或人工氨基酸聚合物。
在本文中,术语“反向末端重复(ITR)”包括形成发夹结构并用作顺式元件以介导病毒复制、包装和整合的任何AAV病毒末端重复或合成序列。本文的ITR包括但不限于来自1-11型AAV(禽类AAV、牛AAV、犬AAV、马AAV和绵羊AAV的末端重复序列)。此外,AAV末端重复序列不必具有天然末端重复序列,只要该末端重复序列可用于病毒复制、包装和整合即可。
在本文中,术语“腺相关病毒(AAV)”或“腺相关病毒(AAV)血清型”包括天然AAV衣壳蛋白(例如,天然的1-11型AAV、禽AAV、牛AAV、犬AAV、马AAV和绵羊AAV的衣壳蛋白)和其他人工改造的AAV衣壳蛋白(例如,人工改造的1-11型AAV、禽AAV、牛AAV、犬AAV、马AAV和绵羊AAV的衣壳蛋白)。不同AAV血清型的基因组序列、ITR序列、Rep和Cap蛋白在本领域内是已知的。这些序列可以在文献或在公共数据库查找,例如GenBank数据库,如GenBank(R)登录号NC 002077、NC 001401、NC 001729、NC 001863、NC 001829、NC 001862、NC 000883、NC001701、NC 001510、AF063497、U89790、AF043303、AF028705、AF028704、J02275、JO1901、J02275、XO1457、AF288061、AHO09962、AY028226、AY028223、NC 001358、NC 001540、AF513851、AF513852、AY530579、AY631965、AY631966;其内容通过引用整体并入本文;以及例如Srivistava等,J.Virol(1983)45:555;Chiorini等,J.Virol(1998)71:6823;Chiorini等,J.Virol(1999)73:1309;Bantel-Schaal等,J.Virol(1999)73:939;Xiao等,J.Virol(1999)73:3994;Muramatsu等,Virology(1996)221:208;WO 00/28061;WO 99/61601;WO98/11244;US 6156303。
本领域技术人员已知,AAV衣壳由总共60个病毒蛋白(VP)分子组成,是三种重叠基因产物VP1、VP2和VP3的混合物(T.P.等,Adeno-associated virus capsidassembly is divergent and stochastic.Nat Commun 12,1642,2021)。VP3序列在所有VP之间共享。VP2比VP3长约57aa,VP2的N端区域被称为VP1/VP2公共区域,VP1比VP2长约137aa。VP2和VP3蛋白在VP1蛋白内部的起始密码子处经历转录和翻译过程。VP1序列包括VP2和VP3序列。本公开提供了AAV衣壳的VP1蛋白的氨基酸序列。
氨基酸的保守性替换是本领域已知的。在一个实施方式中,本公开的AAV衣壳蛋白在以下同一组中的氨基酸可进行保守性替换:a)甘氨酸和丙氨酸;b)缬氨酸、异亮氨酸、亮氨酸和脯氨酸;c)天冬氨酸和谷氨酸;d)天冬酰胺和谷氨酰胺;e)丝氨酸、苏氨酸赖氨酸、精氨酸和组氨酸;f)苯丙氨酸、色氨酸和酪氨酸;g)蛋氨酸和半胱氨酸。在一些实施方式中,上述不同组的氨基酸之间的非保守性替换也是允许的。
在一个实施方式中,本公开的重组AAV衣壳蛋白通过将AAVHH67衣壳蛋白(SEQ IDNO:2)的VP1和VP2的N端第1至203位替换为AAV9衣壳蛋白(SEQ ID NO:4)的VP1和VP2的N端第1至203位构建而成,命名为AAVT69(SEQ ID NO:6)。
在一个实施方式中,本公开的重组AAV衣壳蛋白通过将AAVHH67衣壳蛋白(SEQ IDNO:2)的VP1和VP2的N端第1至193位替换为AAV9衣壳蛋白(SEQ ID NO:4)的VP1和VP2的N端第1至193位构建而成,命名为AAVT70(SEQ ID NO:8)。
在一个实施方式中,本公开的重组AAV衣壳蛋白通过将AAVHH67衣壳蛋白(SEQ IDNO:2)的VP1和VP2的N端第1至188位替换为AAV9衣壳蛋白(SEQ ID NO:4)的VP1和VP2的N端第1至188位构建而成,命名为AAVT71(SEQ ID NO:10)。
本公开的重组衣壳蛋白在体内和体外具有高肌肉转导效率,可用来包装和生产含有天然的或人工合成的病毒基因组的AAV载体,从而进行研究或治疗。
在一个实施方式中,本公开的AAV载体可以装载外源多核苷酸用于将基因递送到靶细胞中。本公开的AAV载体可用于在体外或体内将核酸递送至组织器官及细胞中。本公开的AAV载体优先进行肌肉特异性的基因递送而其他器官的脱靶传递相对较少。
本发明人出人意料地发现,本公开的AAV载体对于野生型小鼠和mdx小鼠达到了比AAV9和HH67更优异的心脏及肌肉感染效率,有效感染肌肉的类型也更加广泛。
在一个实施方式中,本公开的AAV载体对于其他组织器官如肝、肺和肾的感染能力显著弱于野生型如AAV9,表明本公开的AAV载体具有更好的心肌、骨骼肌特异靶向性,有较高的潜力应用于肌肉和心脏相关疾病。
在一些实施方式中,本公开的AAV载体和药物可适用于治疗肌肉和心脏相关疾病,包括但不限于以下示例:杜氏肌营养不良(DMD)、Emery-Dreifuss肌营养不良(EDMD)、Walker-Warburg综合征、肢带肌营养不良(LGMD)、X染色体连锁肌管肌病(XLMTM)、还原体肌病(Reducing body myopathy)、X染色体连锁肌病伴体位性肌肉萎缩(XMPMA)、X染色体连锁肩胛骨肌病(X-SPM)、面肩胛肱型肌营养不良症(FSHD)、重症肌无力(MG)、先天性肌无力综合症(CMD)、肌少症(sarcopenia)、恶病质、肌萎缩性侧索硬化症(ALS),以及I型和II型肌强直性营养不良;充血性心衰、先天性心衰、缺血性心肌病、肥厚性心肌病和风湿性心脏病等。
在一些实施方式中,本公开的AAV载体和药物可以递送治疗性蛋白用于治疗上述心脏和肌肉疾病,可递送的治疗性蛋白包括但不限于:囊性纤维化跨膜调节蛋白(CFTR)、肌营养不良蛋白(包括截短的形式,称为微型肌营养不良蛋白或微肌营养不良蛋白,参见例如Vincent等,Nat Genet(1993)5:130;US 2003017131;Wang等,Proc Natl Acad Sci USA(2000)97:13714-9;Harper等,Nat Med(2002)8:253-61);微型凝集素、整联蛋白β1、层粘连蛋白β2、肌聚糖α和β、肌节蛋白、突触核蛋白、促性腺激素、微型促卵磷脂、Lamin A/C、四个半LIM结构域蛋白1(FHL1)、卵泡抑素、SOD1或SOD2、全长或显性负性肌生长抑制素;血管生成因子(例如VEGF,血管生成素1或2)和血管生成抑制剂(例如内皮抑素和血管抑制素);抗炎多肽(例如,抗炎白细胞介素4、10、11和13,全长和显性突变体Ikappa B、Pinch和ILK基因);凝血因子(例如凝血因子VIII,凝血因子IX,凝血因子X);血影蛋白、酪氨酸羟化酶、芳香族L-氨基酸脱羧酶、瘦素和瘦素受体;神经营养因子(例如BDNF、GDNF、NGF、信号量、Slit1、2和3、FGF7、10和22)以及相应的神经营养蛋白受体;LDL受体、脂蛋白脂肪酶、肾上腺素能受体α和β、B球蛋白、C球蛋白;胰岛素样生长因子,例如IGF-1和IGF-2;腺苷脱氨酶和骨形态发生蛋白超家族(例如BMP1、2、4、6、7和TGF-β,RANKL)。
在一些实施方式中,本公开的AAV载体和药物可适用于治疗需要向肌肉中进行给药或基因递送(例如疫苗,抗体类药物,可溶性受体或其他核酸蛋白类药物的递送)的疾病,可递送的多肽或蛋白包括但不限于Aflibercept(由Rengeron Pharmaceuticals生产的具有抗血管生成作用的重组VEGF可溶性受体);重组白介素1、18和TNF-α拮抗可溶性受体;激活素II型可溶性受体;抗体或单链抗体,包括但不限于抗VEGF抗体(例如贝伐单抗,雷珠单抗和Brolucizumab)、抗硬化蛋白抗体(例如Romosozumab和Blosozumab)、抗RANKL抗体(例如Denosumab)、抗补体成分C5抗体(例如Ravulizumab和Eculizumab)、抗PD-1抗体(例如Nivolumab、Pembrolizumab和Cemiplimab)、PD-L1抗体(例如Avelumab和Atezolizumab)、抗CTLA-4抗体(例如Ipilimumab)、抗CGRP抗体(例如Fremanezumab、Galcanezumab和Erenumab)、抗HER2抗体(例如Trastuzumab和Pertuzumab)、抗EGFR抗体(例如Cetuximab、Panitumumab和Necitumumab)、针对促炎细胞因子的抗体及其受体(例如Sarilumab、Siltuximab、Tocilizumab、Canakinumab、Golimumab、Certolizumab、Adalimumab、Infliximab、Daclizumab和Basiliximab);修饰的酶,例如Cethrin(可从BioAxoneBioSciences Inc.获得的神经保护药物用于治疗脊髓损伤);可产生疫苗的抗原或抗原片段(例如冠状病毒病2019(COVID 2019)或严重急性呼吸系统综合症(SARS)冠状病毒的刺突蛋白,甲、乙、丙型肝炎和人免疫缺陷病毒(HIV)的包膜蛋白,多种肿瘤细胞免疫原,例如MAGE抗原,HER2,ErbB2,粘蛋白抗原和雌激素受体)。疫苗可以引发保护性免疫反应预防某些疾病的发作。以肌内注射为代表的将抗体或疫苗递送到受试者体内的方法是本领域技术人员已知的。
在一些实施方式中,本公开的AAV载体应用于需要标记特定细胞(如肌肉细胞)的情况,例如研究实验。
在一个实施方式中,本公开的AAV载体包含报告蛋白,其用于指示或标记被病毒成功感染的细胞。
在一些实施方式中,除了编码治疗性蛋白质的序列外,可递送的异源多核苷酸还包含调控元件,如转录/翻译控制信号、复制起点、聚腺苷酸化信号、内部核糖体进入位点(IRES)或2A信号(例如P2A、T2A、F2A)、启动子和增强子(例如,例如CMV启动子或具有脊椎动物β-肌动蛋白、β-球蛋白或β-球蛋白调节元件的其他杂CMV启动子、EF1启动子、泛素启动子、T7启动子、SV40启动子、VP16或VP64启动子)。启动子和增强子的使用取决于它们的组织特异性表达谱。启动子和增强子可以被化学药品或激素(例如强力霉素或他莫昔芬)诱导,以确保在特定时间点的进行基因表达。此外,启动子和增强子可以是天然或人工或嵌合序列,即原核或真核序列。
在一些实施方式中,调控元件可以是组织特异性或组织嗜性启动子/增强子元件,包括但不限于:骨骼肌特异性启动子(例如,MCK,HSA,肌生成素启动子)和对各种类型的肌肉细胞具有特异性的启动子。
在一些实施方式中,野生型和改造的AAV病毒颗粒通过三质粒转染法在HEK293细胞中生产,之后纯化和富集的过程包括去除细胞残渣和核酸杂质、过滤浓缩、超速离心、层析柱纯化等步骤。
在一个实施方式中,AAV的生产采用本领域人员所熟知的三质粒转染法,基本步骤如下:通过将编码报告基因蛋白产物或治疗用途的重组蛋白的顺向质粒、AAV Rep/Cap质粒、pHelper质粒共转染至HEK293细胞中,来生产本发明中的AAV载体;在后续的纯化和富集步骤中,去除核酸杂质采用核酸酶或化学沉淀法;超速离心方法包括氯化铯或碘克沙醇密度梯度离心;层析方法包括但不限于亲和层析、阴离子层析、阳离子层析、硫酸肝素柱层析等。
AAV生产的纯化过程中涉及的试剂、材料和化学药品包括但不限于:用于细胞培养的化学物质或试剂(例如,细胞培养基的成分,包括牛、马、山羊、鸡或其他脊椎动物血清、谷氨酰胺、葡萄糖、蔗糖、丙酮酸纳、酚红;抗生素,例如青霉素、卡那霉素、链霉素、四环素);用于细胞裂解、多核苷酸沉淀或超速离心的化学物质或试剂(例如Triton X-100、NP-40、脱氧胆酸钠、十二烷基硫酸钠、杜灭芬溴化物、十二烷酰基水杨糖酸钠、氯化钠、氯化镁、氯化钙、氯化钡、硫酸镁、磷酸氢钠、磷酸氢二钠、磷酸氢钾、磷酸氢二钾、硝酸盐、氯化钾、氯化铵、过硫酸铵、硫酸铵、PEG-20、PEG-40、PEG-400、PEG-2000、PEG-6000、PEG-8000、PEG-20000、Tris-HCl、Tris-乙酸盐、氯化锰、磷酸盐、碳酸氢盐、氯化铯、甲醇、乙醇、甘油、碘克沙醇、异丙醇、丁醇、苯甲酸酶、DNase I、RNase);用于AAV纯化和收集的亲和柱材料(例如AAVX亲和树脂、硫酸肝素蛋白聚糖和粘蛋白树脂、与AAV特异性抗体相关的其他材料);离子交换色谱材料和洗涤缓冲液中包含的酸、碱和有机物(例如盐酸、硫酸、乙酸、甲酸、硝酸、尿素、丙酮、氯仿、乙腈、三氟乙酸、氢氧化钠、氢氧化钾、氢氧化钡、氢氧化铵、Tris碱或其他有机胺、泊洛沙姆188、吐温20、吐温40、吐温80、盐酸胍)。
本领域技术人员可以使用已知的标准方法来生产重组和合成的多肽或其蛋白质、生产抗体或抗原结合片段、改变核酸序列、生产转化细胞、构建重组AAV突变体、改造衣壳蛋白、包装表达AAV Rep和/或Cap序列的载体,以及瞬时或稳定转染包装细胞。这些技术是本领域技术人员已知的。参见例如,分子克隆(MOLECULAR CLONING):实验室手册(ALABORATORY MANUAL),第二版,(冷泉港,纽约州,1989年);F.M.AUSUBEL等,CURRENTPROTOCOLS IN MOLECULAR BIOLOGY(Green Publishing Associates,Inc.and JohnWiley&Sons,Inc.,纽约)。
在一个实施方式中,由AAV载体递送的外源多核苷酸编码充当报告子的多肽(即报告蛋白)。报告蛋白用于指示被AAV成功感染的细胞。这些报告蛋白包括但不限于绿色荧光蛋白(GFP)、β-半乳糖苷酶、碱性磷酸酶、荧光素酶和氯霉素乙酰转移酶。
在一个实施方式中,本公开的AAV载体或转基因表达盒或基因递送系统被制成药物制剂(例如,注射剂、片剂、胶囊剂、散剂)施用于人或其他哺乳动物。该药物制剂还包含其他成分,例如药物辅料、水溶性或有机溶剂(例如水、甘油、乙醇、甲醇、异丙醇、氯仿、苯酚或聚乙二醇)、盐(例如氯化钠、氯化钾、磷酸盐、乙酸盐、碳酸氢盐、Tris-HCl和Tris-乙酸盐)、延缓溶解试剂(例如石蜡)、表面活性剂、抗微生物剂、脂质体、脂质复合物、免疫抑制剂(例如可的松、泼尼松、环孢霉素)、非甾体抗炎药(NSAID,例如阿司匹林、布洛芬、对乙酰氨基酚)微球、硬质基质、半固体载体、纳米球或纳米颗粒。此外,药物制剂可以通过吸入、全身或局部(例如,静脉内、肌内、心脏内、皮下、经口、腹膜内和病灶内)的给药方式以单剂量或多剂量递送。
下面结合附图和实施例对本公开作进一步详细的说明。以下实施例仅用于说明本公开而不用于限制本公开的范围。实施例中未注明具体条件的实验方法,系按照本领域已知的常规条件,或按照制造厂商所建议的条件进行操作。
实施例
实施例1.AAVT69、AAVT70和AAVT71衣壳蛋白的构建和病毒产量测试
用AAV9的VP1和VP2的N端序列(分别为氨基酸1至203位、1至193位、1至188位)替换掉AAVHH67的相应区域的氨基酸序列,并与AAVHH67衣壳蛋白的后续氨基酸序列(分别为AAVHH67衣壳蛋白的氨基酸204至736位、194至736位、189至736位)连接,这样杂交重组出的新型AAV血清型,分别命名为为AAVT69、AAVT70和AAVT71(图1A)。
为了研究杂交改造对于新型病毒产量的影响,将携带GFP基因的顺向质粒、AAVRep/Cap质粒、pHelper质粒和PEI共转染至2L悬浮培养的HEK293细胞中,细胞密度为5×106细胞/mL,转染48-72小时后加入0.01~1%Triton X-100、150~600mM氯化钠(NaCl)、0.5~3.2mM杜灭芬,离心去除细胞残渣并浓缩体积后,将上清液通过AAVX亲和层析柱,用平衡液(含Tris-盐酸或Tris-醋酸、氯化钠、氯化镁、泊洛沙姆188,pH=7.4)冲洗平衡后,分别用醋酸和尿素水溶液洗脱病毒,将洗脱液合并,进行碘克沙醇超速离心(65000rpm,2.5小时)。抽取病毒层溶液并换液至磷酸盐缓冲液中进行定量分析。通过qPCR对病毒基因组进行定量,通过银染对病毒颗粒衣壳蛋白进行定量。
如图1B所示,新型AAV血清型的产量与AAV9和AAVHH67相当,并无明显下降,说明如此构建的新型AAVT69、AAVT70和AAVT71衣壳蛋白可以正常生产病毒颗粒。
实施例2.测定AAVT69、AAVT70和AAVT71对肌肉细胞系的感染效率
为研究新型AAV血清型对肌肉细胞系的转导效率,将包装了GFP基因的各种AAV血清型以1×105vg/细胞的感染复数分别加入未分化的C2C12成肌细胞和C2C12分化72小时的肌管细胞中。
如图2A至图2D所示,AAV5感染了12.79%的C2C12成肌细胞及41.2%的C2C12分化后的肌管细胞;AAV8和AAV9对C2C12成肌细胞和C2C12分化后的肌管细胞的感染比例在60~70%。出乎预料地,AAVT69、AAVT70和AAVT71可分别感染85.33%、82.95%和84.44%的C2C12成肌细胞,以及86.3%、75.88%、83.74%的C2C12分化后的肌管细胞,远高于野生型AAV5、AAV8或AAV9。
综上,AAVT69、AAVT70和AAVT71对肌肉细胞系的感染能力显著优于野生型AAV。
实施例3.测定AAVT69、AAVT70和AAVT71对小鼠骨骼肌和心肌的靶向性
为进一步研究新型AAV血清型在体内对肌肉的转导效率,向C57BL/6小鼠尾静脉注射4×1013vg/kg的包装GFP基因的病毒颗粒,注射21天后观察GFP荧光在全身肌肉的分布。结果发现,注射AAV9血清型的小鼠并未有肉眼可见的GFP绿色荧光,而在注射AAVT69和AAVT71血清型的小鼠双腿及背部肌肉中明显可见有GFP的绿色荧光(图3A)。
接下来,取出各种肌肉组织进行GFP和DAPI共染色。结果发现,注射AAVT69和AAVT71的小鼠在腓肠肌、四头肌、背最长肌、胸锁乳突肌和肱三头肌的GFP信号荧光强度和GFP阳性信号肌肉细胞的比例均显著高于AAV9(图3B和图3C);在腓肠肌、背最长肌和胸锁乳突肌的GFP信号荧光强度和GFP阳性信号肌肉细胞的比例均显著高于AAVHH67。总体上,AAVT69和AAVT71对肌肉组织的转导效率明显高于AAV9和AAVHH67。
本领域公知,根据血流量、能量代谢方式、收缩速率和疲劳耐受性,肌肉可分为I类肌肉(慢肌,有氧代谢为主)和II类肌肉(快肌,糖酵解代谢为主)。为了研究各种AAV血清型对上述两类肌肉的感染效率,挑选了胫骨前肌(II类肌肉为主,占比>80%)和比目鱼肌(I类肌肉为主,占比>80%),检测GFP荧光信号(图3D)。结果显示,AAVT69、AAVT70和AAVT71分别可以有效转导高达90.05%、84.39%、87.97%的胫骨前肌和73.39%、69.23%、73.59%的比目鱼肌肉细胞(图3E),这显著优于AAV9,也高于AAVHH67。
此外,还发现AAVT69和AAVT71在不同注射剂量(1×1013或4×1013vg/kg)下对心肌细胞(心脏)的感染效率均明显优于AAV9,也优于AAVHH67(图4A)。AAVT69和AAVT71的GFP阳性心肌细胞比AAV9高20~30个百分点(图4B)。
上述结果表明,AAVT69、AAVT70和AAVT71对于全身肌肉组织的转导效率整体优于AAV9和AAVHH67。
此外,还研究了各AAV血清型对其他组织器官(如肝、肺和肾)的GFP基因递送效率。结果显示,AAVT69和AAVT71对肝、肺和肾的转导效率均低于AAV9(图4C和图4D)。
由此可见,与目前最常用于全身肌肉基因递送的AAV9相比,AAVT69、AAVT70和AAVT71不仅对于骨骼肌和心肌的感染效率更高,还对潜在脱靶组织如肝、肺、肾的感染更低,具有更优异的肌肉和心脏特异靶向性,也有望降低潜在的不良反应。
实施例4.AAVT69和AAVT71对mdx小鼠的肌肉感染效率
在本实施例中,利用mdx小鼠模型(一种常用的杜氏肌营养不良模型鼠),研究了AAVT69和AAVT71对杜氏肌营养不良症的作用。给mdx雄性小鼠尾静脉注射3×1013vg/kg包装GFP基因的各AAV病毒颗粒,注射14天后观察GFP荧光在全身肌肉的分布。结果显示,与AAV9和AAVHH67相比,AAVT69和AAVT71在双腿及背部肌肉有更加明显可见的GFP绿色荧光信号(图5A)。
对各种肌肉(腓肠肌,四头肌,背最长肌,肱三头肌和肋间肌)进行GFP和DAPI共染色,结果显示AAVT69和AAVT71所递送的GFP在这些肌肉组织中的整体表达优于AAV9和AAVHH67(图5B和图5C)。
此外,还发现T69对于mdx小鼠心肌细胞的基因递送效率也显著优于AAV9和AAVHH67(图5D和图5E)。
上述结果提供了更加确凿的证据表明AAVT69和AAVT71对于mdx小鼠心肌和骨骼肌的强大感染能力。
本公开中提及的所有出版物、专利申请、专利、核酸和氨基酸序列以及其他参考文献均通过引用全文的方式并入本文。
虽然通过参照本公开的某些优选实施方式,已经对本公开进行了图示和描述,但本领域的普通技术人员应该明白,以上内容是结合具体的实施方式对本公开所作的进一步详细说明,不能认定本公开的具体实施只局限于这些说明。本领域技术人员可以在形式上和细节上对其作各种改变,包括做出若干简单推演或替换,而不偏离本公开的精神和范围。
序列表
<110> 上海勉亦生物科技有限公司
<120> 肌肉高亲和性的新型腺相关病毒衣壳蛋白及其应用
<130> PCNCNN21E449G
<160> 10
<170> PatentIn version 3.5
<210> 1
<211> 2208
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAVHH67编码核酸序列
<400> 1
atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60
gagtggtggg acctgaaacc tggagccccg aaacccaaag ccaaccagca aaagcaggac 120
aacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180
aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aagcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300
caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaaaaaga gggttctcga acctctcggt ctggttgagg aaggcgctaa gacggctcct 420
ggaaagaaac gtccggtaga gcagtcgcca caagagccag actcctcctc gggcatcggc 480
aagacaggcc agcagcccgc cagaaaaaga ctaaatttcg gtcagactgg cgactcagag 540
tcagttccag accctcaacc tctcggagaa cctccagcaa cccccgctgc tgtgggacct 600
aatacaatgg cttcaggtgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660
gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720
accaccagca cccgcacctg ggccttgccc acctacaaca accacctcta caagcaaatc 780
tccagtgaaa ctgcaggtag taccaacgac aacacctact tcggctacag caccccctgg 840
gggtattttg actttaacag attccactgc cacttctcac cacgtgactg gcagcgactc 900
atcaacaaca attggggatt ccggcccaag agactcaact tcaaactctt caacatccaa 960
gtcaaggagg tcacgacgaa tgacggcgtt acgaccatcg ctaataacct taccagcacg 1020
gttcaagtct tctcggactc ggagtaccag ctgccgtacg tcctcggctc tgcgcaccag 1080
ggctgcctcc ctccgttccc ggcggacgtg ttcatgattc cgcagtacgg ctacctaacg 1140
ctcaacaatg gcagccaggc agtgggacgg tcatcctttt actgcctgga atatttccca 1200
tcgcagatgc tgagaacggg caataacttt accttcagct acaccttcga ggacgtgcct 1260
ttccacagca gctacgcgca cagccagagc ctggaccggc tgatgaatcc tctcatcgac 1320
cagtacctgt acttcctgaa cagaactcag aatcagtccg gaagtgccca aaacaaggac 1380
ttgctgttta gccgtgggtc tccagctggc atgtctgttc agcccaaaaa ctggctacct 1440
ggaccctgtt atcggcagca gcgcgtttct aaaacaaaaa cagacaacaa caacagcaac 1500
tttacctgga ctggtgcttc aaaatataac ctcaatgggc gtgaatccat catcaaccct 1560
ggcactgcta tggcctcaca caaagacgac aaagacaagt tctttcccat gagcggtgtc 1620
atgatttttg gaaaagagag cgccggagct tcaaacactg cattggacaa tgtcatgatt 1680
acagacgaag aggaaatcaa agccactaac cccgtggcca ccgaaagatt tgggaccgtg 1740
gcagtcaatc tccagagcag cagcacagac cctgcgaccg gagatgtgca tgttatggga 1800
gccttacctg gaatggtgtg gcaagataga gacgtgtacc tgcagggtcc catttgggcc 1860
aaaattcctc acacagatgg acactttcac ccgtctcctc ttatgggcgg ctttggactc 1920
aagaacccgc ctcctcagat cctcatcaaa aacacgcctg ttcctgcgaa tcctccggca 1980
gagttttcgg ctacaaagtt tgcttcattc atcacccagt attccacagg acaagtgagc 2040
gtggagattg aatgggagct gcagaaagaa aacagcaagc gctggaatcc cgaagtgcag 2100
tacacatcca attatgcaaa atctgccaac gttgatttca ctgtggacaa caatggactt 2160
tatactgagc ctcgccccat tggcacacgt ttcctcaccc gtcccctg 2208
<210> 2
<211> 736
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> AAVHH67衣壳蛋白氨基酸序列
<400> 2
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asn Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Thr Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Thr Pro Ala Ala Val Gly Pro Asn Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Glu Thr Ala Gly Ser Thr Asn Asp Asn Thr
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Phe Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Lys Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Ser Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys Asn Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Phe Leu Thr Arg Pro Leu
725 730 735
<210> 3
<211> 2208
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV9编码核酸序列
<400> 3
atggctgccg atggttatct tccagattgg ctcgaggaca accttagtga aggaattcgc 60
gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120
aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgac 180
aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300
caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420
ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 480
aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540
tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600
cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 660
gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga cagagtcatc 720
accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 780
tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840
tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga ctggcagcga 900
ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 960
caggtcaaag aggttacgga caacaatgga gtcaagacca tcgccaataa ccttaccagc 1020
acggtccagg tcttcacgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac 1080
gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta cgggtatctg 1140
acgcttaatg atggaagcca ggccgtgggt cgttcgtcct tttactgcct ggaatatttc 1200
ccgtcgcaaa tgctaagaac gggtaacaac ttccagttca gctacgagtt tgagaacgta 1260
cctttccata gcagctacgc tcacagccaa agcctggacc gactaatgaa tccactcatc 1320
gaccaatact tgtactatct ctcaaagact attaacggtt ctggacagaa tcaacaaacg 1380
ctaaaattca gtgtggccgg acccagcaac atggctgtcc agggaagaaa ctacatacct 1440
ggacccagct accgacaaca acgtgtctca accactgtga ctcaaaacaa caacagcgaa 1500
tttgcttggc ctggagcttc ttcttgggct ctcaatggac gtaatagctt gatgaatcct 1560
ggacctgcta tggccagcca caaagaagga gaggaccgtt tctttccttt gtctggatct 1620
ttaatttttg gcaaacaagg aactggaaga gacaacgtgg atgcggacaa agtcatgata 1680
accaacgaag aagaaattaa aactactaac ccggtagcaa cggagtccta tggacaagtg 1740
gccacaaacc accagagtgc ccaagcacag gcgcagaccg gctgggttca aaaccaagga 1800
atacttccgg gtatggtttg gcaggacaga gatgtgtacc tgcaaggacc catttgggcc 1860
aaaattcctc acacggacgg caactttcac ccttctccgc tgatgggagg gtttggaatg 1920
aagcacccgc ctcctcagat cctcatcaaa aacacacctg tacctgcgga tcctccaacg 1980
gccttcaaca aggacaagct gaactctttc atcacccagt attctactgg ccaagtcagc 2040
gtggagatcg agtgggagct gcagaaggaa aacagcaagc gctggaaccc ggagatccag 2100
tacacttcca actattacaa gtctaataat gttgaatttg ctgttaatac tgaaggtgta 2160
tatagtgaac cccgccccat tggcaccaga tacctgactc gtaatctg 2208
<210> 4
<211> 736
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> AAV9衣壳蛋白氨基酸序列
<400> 4
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn
260 265 270
Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg
275 280 285
Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn
290 295 300
Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile
305 310 315 320
Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn
325 330 335
Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu
340 345 350
Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro
355 360 365
Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp
370 375 380
Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe
385 390 395 400
Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu
405 410 415
Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu
420 425 430
Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser
435 440 445
Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser
450 455 460
Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro
465 470 475 480
Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn
485 490 495
Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn
500 505 510
Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys
515 520 525
Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly
530 535 540
Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile
545 550 555 560
Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser
565 570 575
Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln
580 585 590
Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn
690 695 700
Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val
705 710 715 720
Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu
725 730 735
<210> 5
<211> 2208
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAVT69编码核酸序列
<400> 5
atggctgccg atggttatct tccagattgg ctcgaggaca accttagtga aggaattcgc 60
gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120
aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgac 180
aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300
caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420
ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 480
aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540
tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600
cttacaatgg cttcaggtgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660
gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720
accaccagca cccgcacctg ggccttgccc acctacaaca accacctcta caagcaaatc 780
tccagtgaaa ctgcaggtag taccaacgac aacacctact tcggctacag caccccctgg 840
gggtattttg actttaacag attccactgc cacttctcac cacgtgactg gcagcgactc 900
atcaacaaca attggggatt ccggcccaag agactcaact tcaaactctt caacatccaa 960
gtcaaggagg tcacgacgaa tgacggcgtt acgaccatcg ctaataacct taccagcacg 1020
gttcaagtct tctcggactc ggagtaccag ctgccgtacg tcctcggctc tgcgcaccag 1080
ggctgcctcc ctccgttccc ggcggacgtg ttcatgattc cgcagtacgg ctacctaacg 1140
ctcaacaatg gcagccaggc agtgggacgg tcatcctttt actgcctgga atatttccca 1200
tcgcagatgc tgagaacggg caataacttt accttcagct acaccttcga ggacgtgcct 1260
ttccacagca gctacgcgca cagccagagc ctggaccggc tgatgaatcc tctcatcgac 1320
cagtacctgt acttcctgaa cagaactcag aatcagtccg gaagtgccca aaacaaggac 1380
ttgctgttta gccgtgggtc tccagctggc atgtctgttc agcccaaaaa ctggctacct 1440
ggaccctgtt atcggcagca gcgcgtttct aaaacaaaaa cagacaacaa caacagcaac 1500
tttacctgga ctggtgcttc aaaatataac ctcaatgggc gtgaatccat catcaaccct 1560
ggcactgcta tggcctcaca caaagacgac aaagacaagt tctttcccat gagcggtgtc 1620
atgatttttg gaaaagagag cgccggagct tcaaacactg cattggacaa tgtcatgatt 1680
acagacgaag aggaaatcaa agccactaac cccgtggcca ccgaaagatt tgggaccgtg 1740
gcagtcaatc tccagagcag cagcacagac cctgcgaccg gagatgtgca tgttatggga 1800
gccttacctg gaatggtgtg gcaagataga gacgtgtacc tgcagggtcc catttgggcc 1860
aaaattcctc acacagatgg acactttcac ccgtctcctc ttatgggcgg ctttggactc 1920
aagaacccgc ctcctcagat cctcatcaaa aacacgcctg ttcctgcgaa tcctccggca 1980
gagttttcgg ctacaaagtt tgcttcattc atcacccagt attccacagg acaagtgagc 2040
gtggagattg aatgggagct gcagaaagaa aacagcaagc gctggaatcc cgaagtgcag 2100
tacacatcca attatgcaaa atctgccaac gttgatttca ctgtggacaa caatggactt 2160
tatactgagc ctcgccccat tggcacacgt ttcctcaccc gtcccctg 2208
<210> 6
<211> 736
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> AAVT69衣壳蛋白氨基酸序列
<400> 6
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Glu Thr Ala Gly Ser Thr Asn Asp Asn Thr
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Phe Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Lys Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Ser Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys Asn Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Phe Leu Thr Arg Pro Leu
725 730 735
<210> 7
<211> 2208
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAVT70编码核酸序列
<400> 7
atggctgccg atggttatct tccagattgg ctcgaggaca accttagtga aggaattcgc 60
gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120
aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgac 180
aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300
caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420
ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 480
aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540
tcagtcccag accctcaacc aatcggagaa cctcccgcaa cccccgctgc tgtgggacct 600
aatacaatgg cttcaggtgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660
gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720
accaccagca cccgcacctg ggccttgccc acctacaaca accacctcta caagcaaatc 780
tccagtgaaa ctgcaggtag taccaacgac aacacctact tcggctacag caccccctgg 840
gggtattttg actttaacag attccactgc cacttctcac cacgtgactg gcagcgactc 900
atcaacaaca attggggatt ccggcccaag agactcaact tcaaactctt caacatccaa 960
gtcaaggagg tcacgacgaa tgacggcgtt acgaccatcg ctaataacct taccagcacg 1020
gttcaagtct tctcggactc ggagtaccag ctgccgtacg tcctcggctc tgcgcaccag 1080
ggctgcctcc ctccgttccc ggcggacgtg ttcatgattc cgcagtacgg ctacctaacg 1140
ctcaacaatg gcagccaggc agtgggacgg tcatcctttt actgcctgga atatttccca 1200
tcgcagatgc tgagaacggg caataacttt accttcagct acaccttcga ggacgtgcct 1260
ttccacagca gctacgcgca cagccagagc ctggaccggc tgatgaatcc tctcatcgac 1320
cagtacctgt acttcctgaa cagaactcag aatcagtccg gaagtgccca aaacaaggac 1380
ttgctgttta gccgtgggtc tccagctggc atgtctgttc agcccaaaaa ctggctacct 1440
ggaccctgtt atcggcagca gcgcgtttct aaaacaaaaa cagacaacaa caacagcaac 1500
tttacctgga ctggtgcttc aaaatataac ctcaatgggc gtgaatccat catcaaccct 1560
ggcactgcta tggcctcaca caaagacgac aaagacaagt tctttcccat gagcggtgtc 1620
atgatttttg gaaaagagag cgccggagct tcaaacactg cattggacaa tgtcatgatt 1680
acagacgaag aggaaatcaa agccactaac cccgtggcca ccgaaagatt tgggaccgtg 1740
gcagtcaatc tccagagcag cagcacagac cctgcgaccg gagatgtgca tgttatggga 1800
gccttacctg gaatggtgtg gcaagataga gacgtgtacc tgcagggtcc catttgggcc 1860
aaaattcctc acacagatgg acactttcac ccgtctcctc ttatgggcgg ctttggactc 1920
aagaacccgc ctcctcagat cctcatcaaa aacacgcctg ttcctgcgaa tcctccggca 1980
gagttttcgg ctacaaagtt tgcttcattc atcacccagt attccacagg acaagtgagc 2040
gtggagattg aatgggagct gcagaaagaa aacagcaagc gctggaatcc cgaagtgcag 2100
tacacatcca attatgcaaa atctgccaac gttgatttca ctgtggacaa caatggactt 2160
tatactgagc ctcgccccat tggcacacgt ttcctcaccc gtcccctg 2208
<210> 8
<211> 736
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> AAVT70衣壳蛋白氨基酸序列
<400> 8
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro
180 185 190
Ala Thr Pro Ala Ala Val Gly Pro Asn Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Glu Thr Ala Gly Ser Thr Asn Asp Asn Thr
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Phe Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Lys Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Ser Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys Asn Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Phe Leu Thr Arg Pro Leu
725 730 735
<210> 9
<211> 2208
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> AAVT71编码核酸序列
<400> 9
atggctgccg atggttatct tccagattgg ctcgaggaca accttagtga aggaattcgc 60
gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120
aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgac 180
aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300
caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420
ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 480
aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540
tcagtcccag accctcaacc actcggagaa cctccagcaa cccccgctgc tgtgggacct 600
aatacaatgg cttcaggtgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660
gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggatgggcga cagagtcatc 720
accaccagca cccgcacctg ggccttgccc acctacaaca accacctcta caagcaaatc 780
tccagtgaaa ctgcaggtag taccaacgac aacacctact tcggctacag caccccctgg 840
gggtattttg actttaacag attccactgc cacttctcac cacgtgactg gcagcgactc 900
atcaacaaca attggggatt ccggcccaag agactcaact tcaaactctt caacatccaa 960
gtcaaggagg tcacgacgaa tgacggcgtt acgaccatcg ctaataacct taccagcacg 1020
gttcaagtct tctcggactc ggagtaccag ctgccgtacg tcctcggctc tgcgcaccag 1080
ggctgcctcc ctccgttccc ggcggacgtg ttcatgattc cgcagtacgg ctacctaacg 1140
ctcaacaatg gcagccaggc agtgggacgg tcatcctttt actgcctgga atatttccca 1200
tcgcagatgc tgagaacggg caataacttt accttcagct acaccttcga ggacgtgcct 1260
ttccacagca gctacgcgca cagccagagc ctggaccggc tgatgaatcc tctcatcgac 1320
cagtacctgt acttcctgaa cagaactcag aatcagtccg gaagtgccca aaacaaggac 1380
ttgctgttta gccgtgggtc tccagctggc atgtctgttc agcccaaaaa ctggctacct 1440
ggaccctgtt atcggcagca gcgcgtttct aaaacaaaaa cagacaacaa caacagcaac 1500
tttacctgga ctggtgcttc aaaatataac ctcaatgggc gtgaatccat catcaaccct 1560
ggcactgcta tggcctcaca caaagacgac aaagacaagt tctttcccat gagcggtgtc 1620
atgatttttg gaaaagagag cgccggagct tcaaacactg cattggacaa tgtcatgatt 1680
acagacgaag aggaaatcaa agccactaac cccgtggcca ccgaaagatt tgggaccgtg 1740
gcagtcaatc tccagagcag cagcacagac cctgcgaccg gagatgtgca tgttatggga 1800
gccttacctg gaatggtgtg gcaagataga gacgtgtacc tgcagggtcc catttgggcc 1860
aaaattcctc acacagatgg acactttcac ccgtctcctc ttatgggcgg ctttggactc 1920
aagaacccgc ctcctcagat cctcatcaaa aacacgcctg ttcctgcgaa tcctccggca 1980
gagttttcgg ctacaaagtt tgcttcattc atcacccagt attccacagg acaagtgagc 2040
gtggagattg aatgggagct gcagaaagaa aacagcaagc gctggaatcc cgaagtgcag 2100
tacacatcca attatgcaaa atctgccaac gttgatttca ctgtggacaa caatggactt 2160
tatactgagc ctcgccccat tggcacacgt ttcctcaccc gtcccctg 2208
<210> 10
<211> 736
<212> PRT
<213> 人工序列(Artificial Sequence)
<220>
<223> AAVT71衣壳蛋白氨基酸序列
<400> 10
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro
20 25 30
Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro
115 120 125
Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly
145 150 155 160
Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Ala Thr Pro Ala Ala Val Gly Pro Asn Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Glu Thr Ala Gly Ser Thr Asn Asp Asn Thr
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Phe Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Lys Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Ser Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys Asn Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Phe Leu Thr Arg Pro Leu
725 730 735

Claims (15)

1.AAV衣壳蛋白,其中,所述AAV衣壳蛋白的氨基酸序列如SEQ ID NO:6、SEQ ID NO:8或SEQ ID NO:10所示。
2.核酸分子,其中,所述核酸分子编码权利要求1所述的AAV衣壳蛋白。
3.根据权利要求2所述的核酸分子,其中,所述核酸分子包含SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9所示的核苷酸序列。
4.根据权利要求3所述的核酸分子,其中,所述核酸分子的核苷酸序列如SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9所示。
5.AAV载体,其包含:权利要求1所述的AAV衣壳蛋白和病毒基因组。
6.根据权利要求5所述的AAV载体,其中,所述病毒基因组是天然的AAV基因组或人工重组的病毒基因组。
7.根据权利要求5所述的AAV载体,其中,所述病毒基因组编码报告蛋白和治疗性蛋白中的一种以上。
8.权利要求5-7中任一项所述的AAV载体在制备用于治疗心脏疾病或肌肉疾病的药物中的应用。
9.根据权利要求8所述的应用,其中,所述肌肉疾病是由于肌肉功能下降、肌肉消耗或肌肉退化而引起的肌肉疾病。
10.根据权利要求8所述的应用,其中,所述肌肉疾病选自:杜氏肌营养不良(DMD)、Emery-Dreifuss肌营养不良(EDMD)、Walker-Warburg综合征、肢带肌营养不良(LGMD)、X染色体连锁肌管肌病(XLMTM)、还原体肌病(Reducing body myopathy)、X染色体连锁肌病伴体位性肌肉萎缩(XMPMA)、X染色体连锁肩胛骨肌病(X-SPM)、面肩胛肱型肌营养不良症(FSHD)、重症肌无力(MG)、先天性肌无力综合症(CMD)、肌少症(sarcopenia)、肿瘤恶病质、肌萎缩性侧索硬化症(ALS),以及I型和II型肌强直性营养不良。
11.根据权利要求8所述的应用,其中,所述心脏疾病选自:充血性心衰、先天性心衰、缺血性心肌病、肥厚性心肌病和风湿性心脏病。
12.药物,其包含:权利要求5-7中任一项所述的AAV载体和赋形剂。
13.根据权利要求12所述的药物,其中,所述药物通过全身途径或局部途径施用。
14.根据权利要求12所述的药物,其中,所述药物通过静脉内施用、肌内施用、心脏内施用、皮下施用、经口施用、局部接触、腹膜内施用和病灶内施用。
15.根据权利要求12所述的药物,其中,所述药物通过全身途径或局部途径施用于心脏和/或肌肉。
CN202111659608.1A 2021-12-30 2021-12-30 肌肉高亲和性的新型腺相关病毒衣壳蛋白及其应用 Active CN114276419B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202111659608.1A CN114276419B (zh) 2021-12-30 2021-12-30 肌肉高亲和性的新型腺相关病毒衣壳蛋白及其应用
PCT/CN2022/135804 WO2023124740A1 (zh) 2021-12-30 2022-12-01 肌肉高亲和性的新型腺相关病毒衣壳蛋白及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111659608.1A CN114276419B (zh) 2021-12-30 2021-12-30 肌肉高亲和性的新型腺相关病毒衣壳蛋白及其应用

Publications (2)

Publication Number Publication Date
CN114276419A CN114276419A (zh) 2022-04-05
CN114276419B true CN114276419B (zh) 2023-11-17

Family

ID=80878981

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111659608.1A Active CN114276419B (zh) 2021-12-30 2021-12-30 肌肉高亲和性的新型腺相关病毒衣壳蛋白及其应用

Country Status (2)

Country Link
CN (1) CN114276419B (zh)
WO (1) WO2023124740A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114276419B (zh) * 2021-12-30 2023-11-17 上海勉亦生物科技有限公司 肌肉高亲和性的新型腺相关病毒衣壳蛋白及其应用

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105247044A (zh) * 2013-05-31 2016-01-13 加利福尼亚大学董事会 腺相关病毒变体及其使用方法
WO2019006418A2 (en) * 2017-06-30 2019-01-03 Intima Bioscience, Inc. ADENO-ASSOCIATED VIRAL VECTORS FOR GENE THERAPY
CN111876432A (zh) * 2020-07-29 2020-11-03 舒泰神(北京)生物制药股份有限公司 一组肝靶向新型腺相关病毒的获得及其应用
CN113121652A (zh) * 2021-04-19 2021-07-16 上海信致医药科技有限公司 视网膜和肌肉高亲和性腺相关病毒衣壳蛋白及相关应用
CN113121655A (zh) * 2021-04-19 2021-07-16 上海信致医药科技有限公司 眼部和肌肉特异靶向型腺相关病毒载体及其应用
CN113383010A (zh) * 2018-09-28 2021-09-10 沃雅戈治疗公司 具有经工程化改造的启动子的共济蛋白表达构建体及其使用方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009137006A2 (en) * 2008-04-30 2009-11-12 The University Of North Carolina At Chapel Hill Directed evolution and in vivo panning of virus vectors
EP3795581A3 (en) * 2011-08-24 2021-06-09 The Board of Trustees of the Leland Stanford Junior University New avv capsid proteins for nucleic acid transfer
PE20190401A1 (es) * 2016-07-26 2019-03-13 Biomarin Pharm Inc Novedosas proteinas de la capside del virus adenoasociado
AU2019249890A1 (en) * 2018-04-05 2020-09-24 Association Institut De Myologie Hybrid recombinant adeno-associated virus serotype between AAV9 and AAVrh74 with reduced liver tropism
TW202039859A (zh) * 2018-11-30 2020-11-01 美商艾夫西斯公司 Aav病毒載體及其用途
CN114276419B (zh) * 2021-12-30 2023-11-17 上海勉亦生物科技有限公司 肌肉高亲和性的新型腺相关病毒衣壳蛋白及其应用

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105247044A (zh) * 2013-05-31 2016-01-13 加利福尼亚大学董事会 腺相关病毒变体及其使用方法
WO2019006418A2 (en) * 2017-06-30 2019-01-03 Intima Bioscience, Inc. ADENO-ASSOCIATED VIRAL VECTORS FOR GENE THERAPY
CN111511375A (zh) * 2017-06-30 2020-08-07 因提玛生物科学公司 用于基因治疗的腺相关病毒载体
CN113383010A (zh) * 2018-09-28 2021-09-10 沃雅戈治疗公司 具有经工程化改造的启动子的共济蛋白表达构建体及其使用方法
CN111876432A (zh) * 2020-07-29 2020-11-03 舒泰神(北京)生物制药股份有限公司 一组肝靶向新型腺相关病毒的获得及其应用
CN113121652A (zh) * 2021-04-19 2021-07-16 上海信致医药科技有限公司 视网膜和肌肉高亲和性腺相关病毒衣壳蛋白及相关应用
CN113121655A (zh) * 2021-04-19 2021-07-16 上海信致医药科技有限公司 眼部和肌肉特异靶向型腺相关病毒载体及其应用

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HH67.2, a Promising Novel Adeno- Associated Virus (AAV) Vector, Shows Improved Muscle Specificity and Infectivity Compared To AAV9;Carrie B. Martin等;Molecular Therapy;第23卷;S128 *

Also Published As

Publication number Publication date
CN114276419A (zh) 2022-04-05
WO2023124740A1 (zh) 2023-07-06

Similar Documents

Publication Publication Date Title
CN113121652B (zh) 视网膜和肌肉高亲和性腺相关病毒衣壳蛋白及相关应用
CN104470945B (zh) 高转导效率的rAAV载体、组合物及其使用方法
RU2020113681A (ru) Капсиды вариантов аденоассоциированных вирусов и методы их применения
CN113121655B (zh) 眼部和肌肉特异靶向型腺相关病毒载体及其应用
CN113795574A (zh) 具有降低的肝向性和增加的肌肉转导的AAV9和AAVrh74之间的肽修饰的杂合重组腺相关病毒血清型
CN113121651B (zh) 低中和抗体腺相关病毒衣壳蛋白
CN111876432B (zh) 一组肝靶向新型腺相关病毒的获得及其应用
CN113584043B (zh) 用于治疗视网膜疾病和癌症的转基因表达盒
CN113563430B (zh) 用于治疗眼部疾病的基因递送系统及其应用
CN113480615B (zh) 高视网膜亲和性的新型腺相关病毒衣壳蛋白及其应用
WO2022222869A1 (zh) 重组腺相关病毒及其应用
CN113564187A (zh) 基于aav的抗血管生成基因递送系统及其用途
CN113121653B (zh) 肌肉和视网膜特异性的新型腺相关病毒衣壳蛋白
CN114516901B (zh) 一种神经系统高亲和性的aav载体及其应用
CN113121654B (zh) 腺相关病毒衣壳蛋白及包含其的腺相关病毒载体
CN114276419B (zh) 肌肉高亲和性的新型腺相关病毒衣壳蛋白及其应用
WO2023124741A1 (zh) 用于治疗肌营养不良症的转基因表达盒
CN112961220B (zh) 腺相关病毒衣壳蛋白及包含其的腺相关病毒载体
CN114457086A (zh) 白介素1受体拮抗蛋白的表达盒以及基于aav的基因递送系统
CN115160410A (zh) 新型肌肉高效亲和腺相关病毒血清型及相关应用
CN114686448A (zh) 具有肝脏特异靶向性的纯化的腺相关病毒及其应用
CN114591921A (zh) 腺相关病毒的纯化方法和洗脱液
WO2023005906A1 (zh) 新型腺相关病毒血清型介导的血管生成抑制剂及其应用
CN117003833A (zh) 肝脏特异性的腺相关病毒血清型及应用
WO2022232575A1 (en) Compositions comprising adeno-associated virus chimera capsid proteins and methods of using the same

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant