CN116390934A - 功能性aav衣壳的高通量工程化 - Google Patents

功能性aav衣壳的高通量工程化 Download PDF

Info

Publication number
CN116390934A
CN116390934A CN202180058369.6A CN202180058369A CN116390934A CN 116390934 A CN116390934 A CN 116390934A CN 202180058369 A CN202180058369 A CN 202180058369A CN 116390934 A CN116390934 A CN 116390934A
Authority
CN
China
Prior art keywords
seq
capsid polypeptide
amino acid
capsid
aav
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180058369.6A
Other languages
English (en)
Inventor
弗朗索瓦·维格纳尔特
托马斯·帕卡德
大卫·杰弗里·赫斯
凯文·克里斯多佛·斯坦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shape Therapy Co
Original Assignee
Shape Therapy Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shape Therapy Co filed Critical Shape Therapy Co
Publication of CN116390934A publication Critical patent/CN116390934A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/02Libraries contained in or displayed by microorganisms, e.g. bacteria or animal cells; Libraries contained in or displayed by vectors, e.g. plasmids; Libraries containing only microorganisms or vectors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0008Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0008Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition
    • A61K48/0025Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition wherein the non-active part clearly interacts with the delivered nucleic acid
    • A61K48/0041Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition wherein the non-active part clearly interacts with the delivered nucleic acid the non-active part being polymeric
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14123Virus like particles [VLP]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14142Use of virus, viral particle or viral elements as a vector virus or viral particle as vehicle, e.g. encapsulating small organic molecule

Abstract

本文公开了能够组装成病毒颗粒并且具有提高的对例如CNS组织的组织嗜性的工程化AAV VP衣壳多肽。使用本文所述的高通量发现系统对所述衣壳进行工程化。在某些实施方案中,本文提供了在对应于SEQ ID NO:1中的残基581至残基589的残基中具有至少一个突变的重组腺相关病毒(AAV)VP衣壳多肽。

Description

功能性AAV衣壳的高通量工程化
1.相关申请的交叉引用
本申请要求2020年5月26日提交的美国临时专利申请第63/030,038号;2020年11月30日提交的美国临时专利申请第63/119,554号;2021年1月7日提交的美国临时专利申请第63/134,885号;和2021年4月28日提交的美国临时专利申请第63/181,037号的权益和优先权,所述美国临时专利申请以引用方式整体并入。
2.序列表
本申请含有具XX序列的序列表,所述序列表通过EFS-Web提交并且特此以引用方式整体并入本文。于XXXX创建的所述ASCII副本命名为45736WO_sequencelisting.txt并且大小为XXX字节。
3.背景技术
重组腺相关病毒(rAAV)为基因疗法的体内递送提供了领先的平台。目前的临床试验采用数量有限的AAV衣壳,主要来自天然存在的人或灵长类动物血清型,如AAV1、AAV2、AAV5、AAV6、AAV8、AAV9、AAVrh.10、AAV4rh.74和AAVhu.67。这些衣壳通常提供对目标组织的次优靶向,这既是由于对目标组织的感染性差,也是由于竞争性的肝脏嗜性。增加剂量以确保感染所需组织可导致剂量依赖性肝脏毒性。此外,使用天然存在的衣壳对免疫记忆提出了挑战-免疫前的患者群体被排除在治疗之外,并且对先前未经免疫的患者重复给药往往是不可能的。因此,需要用于基因疗法的另外AAV衣壳,特别地是赋予rAAV对特定组织的高感染性和低肝脏嗜性的衣壳。
4.发明内容
我们设计了一种用于高通量工程化对各种组织具有改变的嗜性的功能性AAV衣壳的系统,并使用该系统鉴定了具有增加或减少的肝脏嗜性,以及增加的对靶组织(如肝脏或中枢神经系统(CNS)组织)的嗜性的衣壳变体。
本文提供了一种具有与SEQ ID NO:1至少70%同一的氨基酸序列的工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽,其中所述工程化AAV VP衣壳多肽相较于SEQ ID NO:1在从对应于SEQ ID NO:1的残基581的残基至对应于SEQ ID NO:1的残基589的残基的区域,包括端点在内,中具有至少一个突变,其中所述工程化AAV VP衣壳多肽能够组装成重组AAV病毒体(rAAV),其中与具有SEQ ID NO:1的野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述至少一个突变赋予所述rAAV较高的对中枢神经系统(CNS)组织的嗜性,并且其中所述工程化AAV VP衣壳多肽不具有SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ IDNO:7和SEQ ID NO:8中任一者的序列。在某些实施方案中,所述工程化AAV VP衣壳多肽具有SEQ ID NO:2的序列并且其中Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自任何氨基酸。
此外,本文提供了具有SEQ ID NO:2的氨基酸序列的工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽,其中氨基酸残基Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自A、R、N、D、C、E、Q、G、H、I、L、K、M、F、P、S、T、W、Y和V,其中所述工程化AAV VP衣壳多肽能够组装成重组AAV病毒体(rAAV),并且其中所述工程化AAV VP衣壳多肽不具有SEQID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ IDNO:8中任一者的序列。在某些实施方案中,与具有SEQ ID NO:1的野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述rAAV具有较高的对中枢神经系统(CNS)组织的嗜性。
5.附图说明
参考以下描述和附图将更好地理解本发明的这些和其他特征、方面和优点,在附图中:
图1是高通量AAV衣壳工程化系统的示意图。
图2A提供了已显示与靶细胞相互作用的已知AAV衣壳的关键残基的侧视图(上图)和顶视图(下图)。图2B示出了实施例1中描述的AAV衣壳文库的突出特征,显示出引入多样性的区域,其中残基编号对应于AAV5 VP1中的氨基酸编号。
图3是一张凝胶照片,显示了在用PS-DNA酶消化后有效去除线性插入片段和线性质粒骨架(“BB”),富集“松弛形式”(“RF”)环状物种以进行高效的后续细菌转化。
图4是高通量AAV衣壳工程化系统的示意图。左侧柱形图显示了AAV衣壳文库在不同制备阶段的大小,追踪了文库从理论多样性、合成衣壳基因、总克隆变体到所测序组装病毒的大小(误差条表示从NGS测序分析中预测的最小/最大多样性)。将汇集的病毒文库注射到非人灵长类动物中,并在足以确保稳定转导的一段时间后,对动物实施安乐死,并收获组织。从组织中纯化DNA(1),并且(2)附加独特分子标识符(UMI)。添加核酸外切酶I以消化过量的含UMI的引物(3)。后续PCR扩增添加测序索引/组织条形码和衔接子用于下一代测序(NGS)测序。添加UMI可以对组织中的衣壳变体进行高分辨率频率分析。
图5A至图5C示出了用于使来自文库的rAAV产量最大化的包装方法,其中图5A比较了标准三重转染(上图)与本文中使用的双质粒顺式包装方法(下图),并且图5B显示了使用这两种转染方法的野生型AAV5的相对产量。图5C是肝脏标本中UMI分布的实例,显示一次(单个UMI)发现大多数衣壳变体。然而,衣壳变体的一个子集在给定组织中富集并且具有增加的UMI数,与它们在靶组织中增加的频率相对应。
图6A至图6B是热图和统计分析,显示了通过病毒组装和组织转导的阶段进行的明确功能选择。图6A是在高通量系统从组装前、组装病毒到肝脏转导的各个阶段制备的热图。对于组装前热图,将衣壳变体文库克隆到质粒中并转化到电感受态细菌中。对所得文库进行测序,并测量每个位置处的氨基酸多样性,低水平的位置变异可能是由综合误差引起的。随后组装成病毒显示出明显的氨基酸残基/位置偏差,突出了病毒组装的选择。肝脏转导病毒显示出更大的AA残基/位置选择模式,与明显有利/不利的变体。请注意,对这些热图各自根据它们各自的输入频率进行归一化。图6B是统计分析表(ANOVA),显示在三个肝脏样本中,氨基酸残基分布和残基位置显著改变,但样本间变异不显著。
图7A至图7B显示了对多个样本之间重复观察到的(高UMI)衣壳变体的分析。图7A是示出两个肝脏样本中重叠变体鉴定计数的维恩图:在两个样本中观察到约38%的具有>10个UMI的变体。图7B是显示位置氨基酸分布的热图,示出了重复观察到的衣壳变体的强选择残基/位置。
图8是基于机器学习的衣壳变体聚类的示意图。该实例利用衣壳变体序列,对其使用机器学习算法来绘制感染肝脏的衣壳之间的相似性。然后,该输出可用于告知候选变体的选择,以选择性地靶向目标组织。
图9示出了静脉内施用于非人灵长类动物(NHP)后,文库整体感染皮层的相对水平高于肝脏的性能实例。从肝脏和皮层分离DNA,并使用qPCR(左)或液滴数字PCR(ddPCR)(右)来量化从各自组织回收的病毒基因组。根据这些量化方法,文库整体具有相对于肝脏约2倍增加的CNS靶向性。
图10示出了强调静电势的AAV5衣壳的野生型晶体结构,以及通过本文所述的方法获得的两个实例性重组VP1衣壳变体。
图11A至图11D显示了维恩图和分析表,描绘了针对三种不同测序分析过滤器在仅肝脏组织、肝脏和脑皮层组织以及仅皮层组织中发现的独特序列变体的数量。对从肝脏或皮层组织样本回收的病毒基因组衣壳变体进行新一代测序。附加独特分子标识符(UMI)作为本文所述的分子回收过程的一部分。这增加了组织中存在给定衣壳变体的置信度,并且可与丰度相关联。图11A显示了维恩图,其中应用的测序分析过滤器为每各不同衣壳序列变体,4个或更多个不同UMI(在本文中也称为“计数”)。图11B显示了维恩图,其中应用的测序分析过滤器为50个或更多个UMI。图11C显示了维恩图,其中应用的测序分析过滤器为100个或更多个不同UMI。图11D显示了在仅皮层中发现的衣壳序列变体群体中UMI分布的直方图分析,其中应用的测序分析过滤器为如图11B所示的50个或更多个UMI。
图12显示的热图显示了本公开rAAV5衣壳多肽序列中的归一化氨基酸残基频率,以及它们如何在变体从组装前到组装后到CNS转导子集的过程中富集。热图的x轴指示581-589区域中的位置,并且y轴包括所有氨基酸残基。
图13显示了机器学习(ML)模型性能验证的实例。在CNS和非CNS组织中发现了不同的变体,也在两者中发现了一些共有变体(左图)。随机森林(RF)ML模型在预测CNS靶向性方面表现出良好的性能。在高预测类别概率值下,ML模型可以从非CNS靶向性变体序列解析CNS靶向性(中间图,右图)。
图14示出了对模型输出概率有贡献的前20个位置特征(左图)。沙普利加和解释(SHAP)值可用于询问特征对模型预测的相对贡献。可以在组织靶向性和非靶向性变体之间进一步比较这些特征。右侧是具有KRLQQMETM(SEQ ID NO:1117)序列的CNS变体模型,代表预测增加CNS靶向性的一些特征。
图15显示了从两个NHP跨所有组织类型回收的本公开的rAAV5变体,所述组织类型包括皮肤、肝脏、肺、心脏、脾脏、淋巴结、甲状腺、骨骼肌、骨髓、乳腺、肾上腺、结肠、坐骨神经(周围神经)和许多CNS组织(前脑皮层、枕叶皮层、颞叶皮层、丘脑、下丘脑、黑质、海马DG、海马CA1、海马CA3、小脑和脊髓)。组织样本的分析使得能够富集特定变体的有利特性(例如,在第一组织中富集,而在一个或多个其他组织中富集)。应用机器学习算法来发现组织嗜性的决定因素。
图16显示rAAV5变体包括大多数存在于CNS中的变体,以及在黑质中发现的变体,黑质是大脑的一个亚区域,在帕金森病中尤其受影响。此外,图16显示机器学习模型在预测高CNS特异性的决定因素方面表现出良好的性能(右)。
图17显示rAAV5变体包括存在于肌肉组织中的变体,包括靶向心脏(心脏组织)和骨骼组织而对肝脏组织去靶向(de-target)的变体(左图)。此外,图17显示机器学习模型在预测肝脏去靶向性的决定因素方面表现出良好的性能(右图)。
图18A显示了相较于所有其他分析组织在CNS组织中氨基酸位置频率的热图。图18B显示了相较于所有其他分析组织在肝脏组织中氨基酸位置频率的热图。图18C显示了相较于所有其他分析组织在骨骼肌组织中氨基酸位置频率的热图。图18D显示了相较于所有其他分析组织在心脏组织中氨基酸位置频率的热图。图18E显示了相较于所有其他分析组织在肺组织中氨基酸位置频率的热图。图18F显示了相较于所有其他分析组织在脾脏组织中氨基酸位置频率的热图。图18G显示了相较于所有其他分析组织在淋巴结组织中氨基酸位置频率的热图。图18H显示了相较于所有其他分析组织在骨髓组织中氨基酸位置频率的热图。图18I显示了相较于所有其他分析组织在乳腺组织中氨基酸位置频率的热图。图18J显示了相较于所有其他分析组织在皮肤组织中氨基酸位置频率的热图。图18K显示了相较于所有其他分析组织在肾上腺组织中氨基酸位置频率的热图。图18L显示了相较于所有其他分析组织在甲状腺组织中氨基酸位置频率的热图。图18M显示了相较于所有其他分析组织在结肠组织中氨基酸位置频率的热图。图18N显示了相较于所有其他分析组织在坐骨神经组织中氨基酸位置频率的热图。图18O显示了相较于所有其他分析组织在脊髓组织中氨基酸位置频率的热图。
图19A显示了NGS数据的生物信息学预处理的各个步骤的结果。显示了通过过滤器的48个单独样本的逐步读取计数。图19B显示了CNS/非CNS变体序列的位置比较。
图20A显示了通过本文所述的方法分析的周围和CNS组织样本的实例。图20B显示了相较于非CNS变体从CNS变体回收的前1000个机器学习预测/过滤的变体中的氨基酸位置丰度。
图21A显示了如下两种ML模型的平均预测CNS概率的集成的实例:随机森林(RF)和基于直方图的梯度提升树(HGB)。两种ML模型的CNS靶向概率输出显示出良好的一致性。图21B显示了所有CNS变体的平均CNS靶向概率的分布。
图22显示了机器学习模型性能验证的实例。基于直方图的梯度提升树(HGB)(上图)和随机森林(RF)(下图)机器学习模型在预测CNS靶向性方面表现出良好的性能。在高预测类别概率值下,两种机器学习模型从非CNS靶向性中解析CNS靶向性。
图23显示了一组前20个位置特征如何促成模型输出概率。使用沙普利加和解释(SHAP)值来询问特征对模型预测的相对贡献。可以在组织靶向性和非靶向性变体之间进一步比较这些特征(如图24A至图24C所示)。
图24A、图24B和图24C显示了对一组排名靠前的预测位置特征的比较。如果发现特征对HGB和RF模型都重要,则选择这些特征。显示了相较于随机2%CNS变体,前1000个机器学习预测的CNS变体中的特征的概述。
图25显示了在靶向肝脏组织的序列的机器学习分析中一组对模型输出概率有贡献的前20个位置特征。
图26A、图26B和图26C显示了在靶向肝脏组织的序列的机器学习分析中排名靠前的预测位置特征的比较。在组织靶向性和非靶向性变体之间比较特征。
图27显示了在为肝脏去靶向性的序列的机器学习分析中一组对模型输出概率有贡献的前20个位置特征。
图28A和图28B显示了肝脏去靶向性变体的排名靠前的预测位置特征的比较。
图29显示了在靶向肌肉组织的序列的机器学习分析中一组对模型输出概率有贡献的前20个位置特征。
图30A至图30B显示了在靶向肌肉组织的序列的机器学习分析中排名靠前的预测位置特征的比较。在组织靶向性和非靶向性变体之间比较特征。
6.具体实施方式
除非另有描述,否则本文中使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常所理解的含义。
除非另有说明,否则无论何时叙述一个范围,该范围都包括所叙述的端点。例如,SEQ ID NO:1的从氨基酸残基581至氨基酸残基589的区域包括氨基酸残基581和589。
“同源性”或“同一性”或“相似性”可以指两个肽之间或两个核酸分子之间的序列相似性。同源性可以通过比较各序列中可为比较目的来比对的位置而确定。当所比较序列中的位置可以被相同的碱基或氨基酸占据时,那么这些分子在那个位置上可以是同源的。序列之间的同源性程度可随着序列共有的匹配或同源位置的数目而变化。“无关”或“非同源的”序列与本公开的序列中之一共有小于40%的同一性,或替代地小于25%的同一性。同源性可以指序列与参考序列的同一性%。实际上,任何特定序列是否可以与本文所述的任何序列(其可以对应于本文所述的特定核酸序列)至少50%、60%、70%、80%、85%、90%、92%、95%、96%、97%、98%或99%同一,这种特定的多肽序列可以常规地使用已知的计算机程序,如Bestfit程序(Wisconsin Sequence Analysis Package,Version 8for Unix,Genetics Computer Group,University Research Park,575Science Drive,Madison,Wis.53711)来确定。当使用Bestfit或任何其他序列比对程序来确定特定序列是否与参考序列例如95%同一时,可以设置参数,使得在参考序列全长上计算同一性百分比,并且可以允许序列同源性中的空位高达总参考序列的5%。在两个或更多个核酸或多肽序列的上下文中,术语“同一性”百分比或“同源性”百分比是指当如使用下述序列比较算法(例如,BLASTP和BLASTN或本领域技术人员可用的其他算法)之一或通过目测检查比较和比对最大对应性时两个或更多个序列或子序列具有特定百分比的相同核苷酸或氨基酸残基。根据应用,“同一性”百分比可以存在于被比较序列的一个区域中,例如,存在于功能结构域中,或者,存在于要比较的两个序列的全长中。对于序列比较,通常一个序列充当与测试序列进行比较的参考序列。当使用序列比较算法时,将测试序列和参考序列输入计算机中,指定子序列坐标,并在必要时指定和序列算法程序参数。然后序列比较算法基于指定程序参数计算测试序列相对于参考序列的序列同一性百分比。出于本文的目的,使用描述于Altschul等人,J.Mol.Biol.215:403-410(1990)中的BLAST算法执行同一性和序列相似性百分比。用于执行BLAST分析的软件可通过National Center for Biotechnology Information(www.ncbi.nlm.nih.gov/)公开获得。
在一些情况下,参考序列(查询序列,例如,本公开的序列)和主题序列之间的同一性,也称为全局序列比对,可以使用FASTDB计算机程序来确定。在一些实施方案中,在FASTDB氨基酸比对中使用的可狭义地解释同一性的具体实施方案的参数可以包括:评分方案=PAM(接受的突变的百分比)0,k-tuple=2,错配罚分=1,连接罚分=20,随机分组长度=0,截止值评分=1,窗口大小=序列长度,空位罚分=5,空位大小罚分=0.05,窗口大小=500或主题序列长度,以较短者为准。根据该实施方案,如果主题序列可以由于N末端或C末端缺失而不是由于内部缺失而比查询序列更短,则可以对结果进行手动校正,以将FASTDB程序在计算全局同一性百分比时不考虑主题序列的N末端和C末端截短的事实纳入考虑。对于在N末端和C末端处截短的主题序列,相对于查询序列,可以通过计算可以横向于主题序列的N末端和C末端的查询序列的残基的数量(残基可以不与相应的主题残基匹配/对齐)将其作为查询序列的总碱基的百分比来校正同一性百分比。残基是否可以匹配/对齐的确定可以通过FASTDB序列比对的结果来确定。然后,可以从FASTDB程序使用指定参数计算的同一性百分比中减去该百分比,以得到最终的同一性百分比评分。该最终同一性百分比评分可以用于本实施方案的目的。在一些情况下,为了手动调整同一性百分比评分的目的,可以只考虑主题序列的N末端和C末端的残基,这些残基可以不与查询序列匹配/对齐。也就是说,对于该手动校正,可以只考虑在主题序列的最远N末端和C末端残基之外的查询残基位置。例如,可以将90个残基的主题序列与100个残基的查询序列比对,以确定同一性百分比。缺失发生在主题序列的N末端处,并因此FASTDB比对不显示N末端处的前10个残基的匹配/比对。10个未配对的残基表示序列的10%(N末端和C末端处未匹配的残基数/查询序列中的残基总数),因此可以从FASTDB程序计算的同一性百分比评分中减去10%。如果剩下的90个残基完全匹配,那么最终同一性百分比可以是90%。在另一实例中,90个残基的主题序列可以与100个残基的查询序列进行比较。这一次,缺失可以是内部缺失,因此在主题序列的N末端或C末端可以没有与查询不匹配/对齐的残基。在这种情况下,不能手动校正FASTDB计算的同一性百分比。同样,只有主题序列的N末端和C末端之外的残基位置(如FASTDB比对中显示的)可以手动校正,这些位置可以不与查询序列匹配/对齐。
如本文所用,rAAV对组织的“嗜性”定义为给定rAAV优先感染给定细胞或组织的能力。经改变或工程化的嗜性包括对所需组织的靶向能力增强或降低,相应地对靶组织的感染增加或减少。
在本公开全文中为简单起见,病毒衣壳蛋白通常称为“VP”。当引用AAV5 VP1位置符号时,病毒衣壳蛋白称为VP1。在所有情况下,本文公开的病毒衣壳序列和突变应理解为与衣壳蛋白的所有同种型(VP1、VP2和VP3)有关,因为这些同种型的混合物组装形成病毒体。位置氨基酸残基名称“581-589”与VP1多肽的翻译起始点有关,应根据VP2和VP3的相对起始位点进行相应调整。应当理解,当描述在特定氨基酸残基位置具有突变的任何特定VP1序列时,本公开必然还涵盖VP2和VP3中的相应突变。例如,在581-589区的氨基酸残基中具有一个或多个突变的VP1衣壳蛋白的任何共有序列或特定序列也涵盖在对应于VP1 581-589区的氨基酸残基的VP2和VP3中氨基酸残基区域中具有所述一个或多个突变的VP2和VP3衣壳蛋白。例如,VP1(SEQ ID NO:1)的581至589区域的氨基酸残基对应于VP2(SEQ ID NO:1115)的445至453区域的氨基酸残基和VP3(SEQ ID NO:1116)的389至397区域的氨基酸残基。
应当理解,本公开包括编码本文公开的任何序列的多核苷酸序列。例如,如果提供氨基酸序列,则本公开还涵盖编码所述氨基酸序列的多核苷酸序列。
应当理解,另外的实施方案包括VP1、VP2、VP3或它们的任何组合中不改变所需性质(例如,特定的组织嗜性)或影响病毒组装的突变,如本文所述。
如本文所用,“组织嗜性”是指具有本公开的工程化VP衣壳多肽的病毒感染给定组织或在给定组织中富集或积聚的偏好。当用作相对术语并取决于本文描述其的上下文时,组织嗜性是指具有第一衣壳多肽的给定rAAV病毒体在第一组织中的组织嗜性相较于第二组织增加或减少并且/或者是指具有第一衣壳多肽的给定rAAV病毒体相较于具有第二衣壳多肽的rAAV病毒体的组织嗜性增加或减少。在一些实施方案中,第一组织可以是一组组织。在一些实施方案中,第二组织可以是一组组织。例如,第一组织可以是CNS组织,包括前脑皮层、枕叶皮层、颞叶皮层、丘脑、下丘脑、黑质、海马DG、海马CA1、海马CA3和小脑,并且第二组织可以是非CNS组织,由肝脏、骨骼肌、心脏、肺、脾脏、淋巴结、骨髓、乳腺、皮肤、肾上腺、甲状腺、结肠、坐骨神经和脊髓组织共同组成。再如,第一组织可以是肝脏组织,并且第二组织可以是非肝脏组织,由CNS组织、骨骼肌、心脏、肺、脾脏、淋巴结、骨髓、乳腺、皮肤、肾上腺、甲状腺、结肠、坐骨神经和脊髓组织共同组成。
如本文所用,AAV衣壳多肽上下文中的词语“重组”可互换地指“工程化”或“变体”AAV衣壳多肽。如本文所用,AAV病毒体(缩写为rAAV)上下文中的词语“重组”是指重组病毒颗粒。所述rAAV病毒体由可以包括本文公开的工程化AAV5 VP衣壳多肽的衣壳制成。
6.1.衣壳工程化方法
本文公开了一种用于高通量工程化具有修饰功能的工程化AAV衣壳的系统,所述修饰功能包括对所需组织的感染性增加或减少,如肝脏嗜性增加或减少,或对中枢神经系统(CNS)的靶向性增加。该过程的一般示意图示于图1中,然而,应当理解,本公开还涵盖对本领域普通技术人员所理解的方法的合理变化或扩展。如图1所示,该方法可以从产生理论多样性为5x1011个独特序列变体的衣壳文库开始。较高或更低的理论多样性也涵盖在本文中。例如,衣壳文库的理论多样性可以为约1x10^3至约1x10^20。然后可以将该文库克隆到质粒中,转化到细菌中,随后筛选文库质粒以在生产细胞系中进行生产性病毒体组装。然后可以将组装的病毒体静脉内施用到非人灵长类动物(NHP)中。在足以分布、感染和稳定转导的一段时间后,可以牺牲NHP,收获器官,并且可以通过深度测序确定每个组织中AAV衣壳的序列。
图2A提供了原型AAV病毒体表面的侧视图(上图)和俯视图(下图),鉴定了已知AAV衣壳一包括AAV2、AAV5、AAV6和AAV9-的残基,这些残基已在研究文献中显示与靶细胞相互作用。这些与靶标相互作用的残基对应于AAV5 VP1衣壳蛋白中的氨基酸581-589。
图2B显示了文库质粒的突出元件,示出了位于AAV ITR之间的rep和cap编码序列。在实施例1中进一步描述的所示实施方案中,将变异引入AAV5cap蛋白的各残基581-589(“文库变体区域”)。将20种天然氨基酸各自引入9个位置中的每一者,得到理论文库多样性为209(20^9;大约5x1011)个独特序列变体。
工程化的目标区域最有可能与靶细胞受体相互作用,并且在不破坏病毒体组装的情况下对变化相对耐受。与添加突出于病毒体3倍对称轴上方的非结构化肽的早期方法不同,当前方法引入了改变结合口袋特征的序列多样性。此外,这种方法可能会改变受体结合三聚体的总体结构,从而改变结合口袋外的变构相互作用(例如,AAVR PKD1)。引入的多样性是非随机的,从而减少了随机文库的错义和移码。
通过将编码衣壳变体的多核苷酸克隆到包装的病毒基因组中(在ITR之间),具有变体衣壳的重组病毒体携带具有其同源突变的多核苷酸,因此可以通过对包装的病毒或感染细胞进行测序来鉴定提供所需功能的独特变体。
在一些实施方案中,衣壳是选自以下的衣壳:AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、AAV13、AAV14、AAV15和AAV16、AAV.rh8、AAV.rh10、AAV.rh20、AAV.rh39、AAV.Rh74、AAV.RHM4-1、AAV.hu37、AAV.Anc80、AAV.Anc80L65、AAV.7m8、AAV.PHP.B、AAV2.5、AAV2tYF、AAV3B、AAV.LK03、AAV.HSC 1、AAV.HSC2、AAV.HSC3、AAV.HSC4、AAV.HSC5、AAV.HSC6、AAV.HSC7、AAV.HSC8、AAV.HSC9、AAV.HSC10、AAV.HSC11、AAV.HSC12、AAV.HSC13、AAV.HSC14、AAV.HSC15、AAV.HSC16或AAVhu68(描述于WO2020/033842,其以引用方式整体并入本文)。hu68衣壳描述于WO2018/160582,其以引用方式整体并入本文。
此类衣壳可以包含对应于AAV5 VP1的581-589区的区域,因此本文涵盖具有所需组织嗜性、具有组装能力以及表现出各种其他所需性状的类似工程化VP衣壳。因此,在与AAV5 VP1的581至589区相对应的区域中具有突变的本文公开的任何一种工程化AAV5 VP衣壳多肽可以插入本文所述的任何其他AAV衣壳的相应区域中并且本公开涵盖此类变体。
在一些实施方案中,衣壳是AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV 10、AAV11、AAV 12、AAV 13、AAV 14、AAV 15和AAV 16、AAV.rh8、AAV.rh10、AAV.rh20、AAV.rh39、AAV.Rh74、AAV.RHM4-1、AAV.hu37、AAV.Anc80、AAV.Anc80L65、AAV.7m8、AAV.PHP.B、AAV2.5、AAV2tYF、AAV3B、AAV.LK03、AAV.HSC 1、AAV.HSC2、AAV.HSC3、AAV.HSC4、AAV.HSC5、AAV.HSC6、AAV.HSC7、AAV.HSC8、AAV.HSC9、AAV.HSC10、AAV.HSC11、AAV.HSC12、AAV.HSC13、AAV.HSC14、AAV.HSC15、AAV.HSC16或AAVhu68的衍生物、修饰或假型。
在一些实施方案中,衣壳蛋白是来自两种或更多种选自以下的血清型的衣壳蛋白的嵌合体:AAV1、AAV2、rAAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV 10、AAV11、AAV 12、AAV13、AAV 14、AAV 15和AAV 16、AAV.rh8、AAV.rh10、AAV.rh20、AAV.rh39、AAV.Rh74、AAV.RHM4-1、AAV.hu37、AAV.Anc80、AAV.Anc80L65、AAV.7m8、AAV.PHP.B、AAV2.5、AAV2tYF、AAV3B、AAV.LK03、AAV.HSC 1、AAV.HSC2、AAV.HSC3、AAV.HSC4、AAV.HSC5、AAV.HSC6、AAV.HSC7、AAV.HSC8、AAV.HSC9、AAV.HSC10、AAV.HSC11、AAV.HSC12、AAV.HSC13、AAV.HSC14、AAV.HSC15和AAV.HSC16(描述于WO2020/033842,其以引用方式整体并入本文)。在某些实施方案中,衣壳是rh32.33衣壳,其描述于美国专利第8,999,678号,该专利以引用方式整体并入本文。
此类衣壳可以包含对应于AAV5 VP1的581-589的区域,因此本文涵盖具有所需组织嗜性、具有组装能力以及表现出各种其他所需性状的类似工程化VP衣壳。
6.2.编码VP的多核苷酸、载体和载体文库
因此,在第一方面,提供了多核苷酸。多核苷酸编码腺相关病毒(AAV)VP1衣壳多肽,所述多肽具有SEQ ID NO:2的氨基酸序列,其中Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自20种天然存在的氨基酸-使用标准的单字母代码-A、R、N、D、C、E、Q、G、H、I、L、K、M、F、P、S、T、W、Y和V。所述多肽包括天然AAV5衣壳的至少一个突变,因此不具有SEQ ID NO:1的序列。此外,所述多肽不具有SEQ ID NO:3、SEQ ID NO:NO:4、SEQID NO:5、SEQ ID NO:6、SEQ ID NO:7或SEQ ID NO:8的序列。
在一些实施方案中,多核苷酸编码AAV VP1衣壳多肽,所述多肽相对于SEQ ID NO:1在581-589区域之外的氨基酸残基处还包含一个或多个突变,其中所得重组衣壳能够形成组装的病毒体,所述组装的病毒体表现出所需的组织靶向性。
在另一方面,提供了一种能够在原核细胞中复制的载体,其中所述载体包含上文刚刚描述的多核苷酸。在典型的实施方案中,所述载体是编码具有复制能力的AAV基因组的质粒。
在另一方面,提供了一种文库。所述文库包含多个包含编码AAV衣壳的多核苷酸的载体。在一些实施方案中,所述载体是质粒,并且所述多个质粒包含多个不同的编码AAV VP的多核苷酸。
在各个文库实施方案中,SEQ ID NO:2的Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9中的至少一者是不变的。此类不变残基在本文中也称为“框架”残基。框架残基可能有助于衣壳组装成功能性病毒体或感染特定靶细胞或组织的能力。
在一些文库实施方案中,SEQ ID NO:2的Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9中的一个残基是不变的。在具体实施方案中,不变残基是AAV5 VP1中VP1一级氨基酸序列内该位置处的天然氨基酸。在具体实施方案中,不变残基是AAV5 VP1中该位置处的天然氨基酸以外的氨基酸。在一些实施方案中,SEQ ID NO:2的Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9中的两者是不变的。在具体实施方案中,各不变残基是AAV5VP1中对应位置处的天然氨基酸。在具体实施方案中,各不变残基是AAV5VP1中对应位置处的天然氨基酸以外的氨基酸。在一些实施方案中,SEQ ID NO:2的Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9中的三者是不变的。在具体实施方案中,各不变残基是AAV5VP1中对应位置处的天然氨基酸。在具体实施方案中,各不变残基是AAV5 VP1中对应位置处的天然氨基酸以外的氨基酸。在一些实施方案中,SEQ ID NO:2的Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9中的四者是不变的。在具体实施方案中,各不变残基是AAV5 VP1中对应位置处的天然氨基酸。在具体实施方案中,各不变残基是AAV5 VP1中对应位置处的天然氨基酸以外的氨基酸。在一些实施方案中,SEQ ID NO:2的Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9中的五者是不变的。在具体实施方案中,各不变残基是AAV5 VP1中对应位置处的天然氨基酸。在具体实施方案中,各不变残基是AAV5 VP1中对应位置处的天然氨基酸以外的氨基酸。在一些实施方案中,SEQ ID NO:2的Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9中的六者是不变的。在具体实施方案中,各不变残基是AAV5 VP1中对应位置处的天然氨基酸。在具体实施方案中,各不变残基是AAV5 VP1中对应位置处的天然氨基酸以外的氨基酸。
在具体实施方案中,rAAV VP1衣壳在位置587(Xaa7)处不是A、C、D、E、F、G、H、I、K、M、P、Q、R、V、W或Y。在一些实施方案中,位置587可以是N、S或T。在具体实施方案中,rAAV VP1衣壳在位置582(Xaa2)处不是G、V、L或I。
在各个实施方案中,文库编码至少1x109种不同的AAV VP衣壳多肽、至少2.5x109种不同的AAV VP衣壳多肽、至少5x109种不同的AAV VP衣壳多肽、至少7.5x109种不同的AAV VP衣壳多肽、至少1x1010种不同的AAV VP衣壳多肽、至少2.5x1010种不同的AAV VP衣壳多肽、至少5x1010种不同的AAV VP衣壳多肽、至少7.5x1010种不同的AAV VP衣壳多肽、至少1x1011种不同的AAV VP衣壳多肽、至少2.5x1011种不同的AAV VP衣壳多肽,或至少5x1011种不同的AAV VP衣壳多肽。
在另一方面,提供了包含所述载体的原核细胞。在一些实施方案中,原核细胞是大肠杆菌(E.coli)细胞并且载体是质粒。
在相关方面,提供了文库,所述文库包含多个大肠杆菌细胞,其中所述多个细胞包含多个质粒,其中所述多个质粒包含多个不同的编码AAV VP的多核苷酸。
在各个文库实施方案中,SEQ ID NO:2的Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9中的至少一者是不变的。
在一些文库实施方案中,SEQ ID NO:2的Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9中的一者是不变的。在具体实施方案中,不变残基是AAV5 VP1中VP1一级氨基酸序列内该位置处的天然氨基酸。在具体实施方案中,不变残基是AAV5 VP1中该位置处的天然氨基酸以外的氨基酸。在一些实施方案中,SEQ ID NO:2的Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9中的两者是不变的。在具体实施方案中,各不变残基是AAV5 VP1中对应位置处的天然氨基酸。在具体实施方案中,各不变残基是AAV5VP1中对应位置处的天然氨基酸以外的氨基酸。在一些实施方案中,SEQ ID NO:2的Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9中的三者是不变的。在具体实施方案中,各不变残基是AAV5VP1中对应位置处的天然氨基酸。在具体实施方案中,各不变残基是AAV5 VP1中对应位置处的天然氨基酸以外的氨基酸。在一些实施方案中,SEQ ID NO:2的Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9中的四者是不变的。在具体实施方案中,各不变残基是AAV5 VP1中对应位置处的天然氨基酸。在具体实施方案中,各不变残基是AAV5 VP1中对应位置处的天然氨基酸以外的氨基酸。在一些实施方案中,SEQ ID NO:2的Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9中的五者是不变的。在具体实施方案中,各不变残基是AAV5 VP1中对应位置处的天然氨基酸。在具体实施方案中,各不变残基是AAV5 VP1中对应位置处的天然氨基酸以外的氨基酸。在一些实施方案中,SEQ ID NO:2的Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9中的六者是不变的。在具体实施方案中,各不变残基是AAV5 VP1中对应位置处的天然氨基酸。在具体实施方案中,各不变残基是AAV5 VP1中对应位置处的天然氨基酸以外的氨基酸。
在一些实施方案中,文库编码至少1x109种不同的AAV VP衣壳多肽、至少2.5x109种不同的AAV VP衣壳多肽、至少5x109种不同的AAV VP衣壳多肽、至少7.5x109种不同的AAV VP衣壳多肽、至少1x1010种不同的AAV VP衣壳多肽、至少5x1010种不同的AAV VP衣壳多肽、至少7.5x1010种不同的AAV VP衣壳多肽、至少1x1011种不同的AAV VP衣壳多肽、至少2.5x1011种不同的AAV VP衣壳多肽,或至少5x1011种不同的AAV VP衣壳多肽。
6.3.VP多肽、肽库
在另一方面,提供了AAV VP1衣壳多肽。所述多肽具有SEQ ID NO:2的氨基酸序列,其中Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自A、R、N、D、C、E、Q、G、H、I、L、K、M、F、P、S、T、W、Y和V。所述多肽相较于天然AAV VP1包括至少一个突变,因此不具有SEQ ID NO:1的序列。此外,所述多肽不具有SEQ ID NO:3、SEQ ID NO:NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7或SEQ ID NO:8的序列。
在一些实施方案中,所述多肽相对于SEQ ID NO:1在581-589区域之外的氨基酸残基处还包含一个或多个突变,其中所得重组衣壳能够形成组装的病毒体,所述组装的病毒体表现出所需的组织靶向性。
在另一方面,提供了文库,所述文库包含多个如上文刚刚描述的多肽,所述多个多肽具有不同的一级氨基酸序列。
在各个文库实施方案中,SEQ ID NO:2的Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9中的至少一者是不变的。
在一些文库实施方案中,SEQ ID NO:2的Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9中的一者是不变的。此类不变残基在本文中也称为“框架”残基。在具体实施方案中,不变残基是AAV5 VP1中VP1一级氨基酸序列内该位置处的天然氨基酸。在具体实施方案中,不变残基是AAV5 VP1中该位置处的天然氨基酸以外的氨基酸。在一些实施方案中,SEQ ID NO:2的Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9中的两者是不变的。在具体实施方案中,各不变残基是AAV5 VP1中对应位置处的天然氨基酸。在具体实施方案中,各不变残基是AAV5 VP1中对应位置处的天然氨基酸以外的氨基酸。在一些实施方案中,SEQID NO:2的Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9中的三者是不变的。在具体实施方案中,各不变残基是AAV5 VP1中对应位置处的天然氨基酸。在具体实施方案中,各不变残基是AAV5 VP1中对应位置处的天然氨基酸以外的氨基酸。在一些实施方案中,SEQ IDNO:2的Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9中的四者是不变的。在具体实施方案中,各不变残基是AAV5 VP1中对应位置处的天然氨基酸。在具体实施方案中,各不变残基是AAV5 VP1中对应位置处的天然氨基酸以外的氨基酸。在一些实施方案中,SEQ IDNO:2的Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9中的五者是不变的。在具体实施方案中,各不变残基是AAV5 VP1中对应位置处的天然氨基酸。在具体实施方案中,各不变残基是AAV5VP1中对应位置处的天然氨基酸以外的氨基酸。在一些实施方案中,SEQ ID NO:2的Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9中的六者是不变的。在具体实施方案中,各不变残基是AAV5 VP1中对应位置处的天然氨基酸。在具体实施方案中,各不变残基是AAV5 VP1中对应位置处的天然氨基酸以外的氨基酸。
在一些实施方案中,文库包含至少1x109种不同的AAV VP衣壳多肽、至少2.5x109种不同的AAV VP衣壳多肽、至少5x109种不同的AAV VP衣壳多肽、至少7.5x109种不同的AAV VP衣壳多肽、至少1x1010种不同的AAV VP衣壳多肽、至少2.5x1010种不同的AAV VP衣壳多肽、至少5x1010种不同的AAV VP衣壳多肽、至少7.5x1010种不同的AAV VP衣壳多肽、至少1x1011种不同的AAV VP衣壳多肽、至少2.5x1011种不同的AAV VP衣壳多肽,或至少5x1011种不同的AAV VP衣壳多肽。
在某些实施方案中,文库包含至少约1x105至至少约5x1011种不同的AAV VP衣壳多肽。在某些实施方案中,文库包含至少约1x105、至少约2x105、至少约3x105、至少约4x105、至少约5x105、至少约6x105、至少约7x105、至少约8x105、至少约9x105、至少约1x106、至少约2x106、至少约3x106、至少约4x106、至少约5x106、至少约6x106、至少约7x106、至少约8x106、至少约9x106、至少约1x107、至少约2x107、至少约3x107、至少约4x107、至少约5x107、至少约6x107、至少约7x107、至少约8x107、至少约9x107、至少约1x108、至少约2x108、至少约3x108、至少约4x108、至少约5x108、至少约6x108、至少约7x108、至少约8x108、至少约9x108、至少约1x109、至少约2x109、至少约3x109、至少约4x109、至少约5x109、至少约6x109、至少约7x109、至少约8x109、至少约9x109、至少约1x1010、至少约2x1010、至少约3x1010、至少约4x1010、至少约5x1010、至少约6x1010、至少约7x1010、至少约8x1010、至少约9x1010、至少约1x1011、至少约2x1011、至少约3x1011、至少约4x1011,或至少约5x1011种AAV VP衣壳多肽。
在某些实施方案中,本文提供了一种重组腺相关病毒AAV VP1衣壳多肽,所述多肽在SEQ ID NO:1中的581至残基589区域,包括端点在内,的残基中具有至少一个突变,其中与具有野生型AAV5VP1衣壳多肽的野生型AAV病毒体相比,所述突变赋予具有所述AAV VP1衣壳多肽的AAV病毒体在非肝脏组织中相较于肝脏组织中至少约两倍增加的积聚,并且其中AAV VP1衣壳多肽不具有SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ IDNO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。
6.4.rAAV病毒体,病毒体文库
在另一方面,提供了重组AAV病毒体(rAAV)。病毒体包含如上文所述的AAV VP衣壳多肽。
在一些实施方案中,与具有天然AAV5 VP1衣壳多肽(SEQ ID NO:1)的rAAV相比,所述rAAV具有增加的对灵长类动物和人肝脏的嗜性。在一些实施方案中,与具有天然AAV5VP1衣壳多肽(SEQ ID NO:1)的rAAV相比,所述rAAV具有增强的组装能力,或者表现出更大的病毒体稳定性。
在一些实施方案中,与具有天然AAV5 VP1衣壳多肽(SEQ ID NO:1)的rAAV相比,所述rAAV具有降低的对人肝脏的嗜性。
在一些实施方案中,与具有天然AAV5 VP1衣壳多肽(SEQ ID NO:1)的rAAV相比,所述rAAV在静脉内施用后具有增强的穿过血脑屏障的能力。
在这些实施方案的某些中,与具有天然AAV5 VP1衣壳多肽(SEQ ID NO:1)的rAAV相比,所述rAAV在静脉内、鞘内、脑室内或脑池内施用后具有增强的感染选自海马、齿状回、大脑皮层、颞叶皮层、枕叶皮层、丘脑、前脑、黑质、下丘脑和小脑的一个或多个脑区的能力。
在一些实施方案中,与具有天然AAV5 VP1衣壳多肽(SEQ ID NO:1)的rAAV相比,所述rAAV在静脉内、鞘内、脑室内或脑池内施用后具有增强的感染选自海马、齿状回、大脑皮层、颞叶皮层、枕叶皮层、丘脑、前脑、黑质、下丘脑和小脑的一个或多个脑区的能力,并且还具有降低的对所有非CNS组织的嗜性,包括对心脏组织去靶向。
在一些实施方案中,与具有天然AAV5 VP1衣壳多肽(SEQ ID NO:1)的rAAV相比,所述rAAV在玻璃体内注射后具有增强的感染人视网膜细胞的能力。
在一些实施方案中,与具有VP1衣壳多肽的具有天然AAV5 VP1衣壳多肽(SEQ IDNO:1)的rAAV相比,所述rAAV在静脉内施用后具有增强的感染人骨骼肌的能力。
在一些实施方案中,与具有天然AAV5衣壳多肽(SEQ ID NO:1)的rAAV相比,所述rAAV在静脉内施用后具有增强的感染选自以下的组织的能力:脂肪、肾上腺、主动脉、脑(包括海马:齿状回、CA1和CA3;小脑、尾状核、壳核、中脑、脑桥、下丘脑、皮层-包括枕叶、颞叶和前脑;黑质和丘脑)、骨髓、盲肠、结肠、背根神经节、十二指肠、附睾、食管、眼睛、胆囊、心脏、回肠、空肠、肾脏、肺、淋巴结、乳腺、卵巢、胰腺、甲状旁腺、周围神经、垂体、前列腺、唾液腺、精囊、骨骼肌、皮肤、脊髓、脾脏、胃、睾丸、胸腺、甲状腺、气管、膀胱、子宫和阴道。
此外,提供了编码本文所述的rAAV衣壳VP蛋白的多核苷酸序列。
在另一方面,提供了包含多个如上文所述的rAAV的文库。所述多个rAAV包含多个具有不同一级氨基酸序列的VP衣壳多肽。
在各个文库实施方案中,SEQ ID NO:2的Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9中的至少一者是不变的。
在一些文库实施方案中,SEQ ID NO:2的Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9中的一者是不变的。此类不变残基在本文中也称为“框架”残基。在具体实施方案中,不变残基是AAV5 VP1中VP1一级氨基酸序列内该位置处的天然氨基酸。在具体实施方案中,不变残基是AAV5 VP1中该位置处的天然氨基酸以外的氨基酸。在一些实施方案中,SEQ ID NO:2的Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9中的两者是不变的。在具体实施方案中,各不变残基是AAV5 VP1中对应位置处的天然氨基酸。在具体实施方案中,各不变残基是AAV5 VP1中对应位置处的天然氨基酸以外的氨基酸。在一些实施方案中,SEQID NO:2的Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9中的三者是不变的。在具体实施方案中,各不变残基是AAV5 VP1中对应位置处的天然氨基酸。在具体实施方案中,各不变残基是AAV5 VP1中对应位置处的天然氨基酸以外的氨基酸。在一些实施方案中,SEQ IDNO:2的Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9中的四者是不变的。在具体实施方案中,各不变残基是AAV5 VP1中对应位置处的天然氨基酸。在具体实施方案中,各不变残基是AAV5 VP1中对应位置处的天然氨基酸以外的氨基酸。在一些实施方案中,SEQ IDNO:2的Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9中的五者是不变的。在具体实施方案中,各不变残基是AAV5 VP1中对应位置处的天然氨基酸。在具体实施方案中,各不变残基是AAV5VP1中对应位置处的天然氨基酸以外的氨基酸。在一些实施方案中,SEQ ID NO:2的Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9中的六者是不变的。在具体实施方案中,各不变残基是AAV5VP1中对应位置处的天然氨基酸。在具体实施方案中,各不变残基是AAV5 VP1中对应位置处的天然氨基酸以外的氨基酸。
在一些实施方案中,文库包含至少1x109种不同的AAV VP衣壳多肽、至少2.5x109种不同的AAV VP衣壳多肽、至少5x109种不同的AAV VP衣壳多肽、至少7.5x109种不同的AAV VP衣壳多肽、至少1x1010种不同的AAV VP衣壳多肽、至少2.5x1010种不同的AAV VP衣壳多肽、至少5x1010种不同的AAV VP衣壳多肽、至少7.5x1010种不同的AAV VP衣壳多肽、至少1x1011种不同的AAV VP衣壳多肽、至少2.5x1011种不同的AAV VP衣壳多肽,或至少5x1011种不同的AAV VP衣壳多肽。
6.5.药物组合物
在另一方面,提供了药物组合物。所述药物组合物包含如上文所述的rAAV和药学上可接受的载体。
药物组合物可以包含第一活性成分。第一活性成分可以包含如本文所述的病毒载体和/或如本文所述的任何有效载荷。药物组合物可以配制成单位剂型。药物组合物可以包含药学上可接受的赋形剂、稀释剂或载体。药物组合物可以包含第二、第三或第四活性成分-例如用以促进增强的基因置换、RNA编辑、DNA编辑或成像。
本文所述的药物组合物可以包含赋形剂。赋形剂可以包括冷冻防腐剂,如DMSO、甘油、聚乙烯吡咯烷酮(PVP)或它们的任何组合。赋形剂可以包括冷冻防腐剂,如蔗糖、海藻糖、淀粉,这些中的任一者的盐,这些中的任一者的衍生物,或它们的任何组合。赋形剂可以包括pH剂(以最大程度地减少组合物组分的氧化或降解)、稳定剂(以防止组合物组分的改性或降解)、缓冲剂(以增强温度稳定性)、增溶剂(以增加蛋白溶解度),或它们的任何组合。赋形剂可以包括表面活性剂、糖、氨基酸、抗氧化剂、盐、非离子表面活性剂、增溶剂、甘油三酸酯、醇或它们的任何组合。赋形剂可以包括碳酸钠、乙酸盐、柠檬酸盐、磷酸盐,聚乙二醇(PEG)、人血清白蛋白(HSA)、山梨糖醇、蔗糖、海藻糖、聚山梨醇酯80、磷酸钠、蔗糖、磷酸二钠、甘露醇、聚山梨醇酯20、组氨酸、柠檬酸盐、白蛋白、氢氧化钠、甘氨酸、柠檬酸钠、海藻糖、精氨酸、乙酸钠、乙酸盐、HCl、依地酸二钠、卵磷脂、甘油、黄原胶、大豆异黄酮、聚山梨醇酯80、乙醇、水,替普瑞酮(teprenone)或它们的任何组合。
本文提供的组合物和方法可以利用药物组合物。通篇描述的组合物可以配制成药物并用于治疗经诊断患有疾病的有需要的人或哺乳动物。在一些情况下,可以预防性地使用药物组合物。
本文提供的组合物可用于本文提供的方法中。本文提供的任何所提供组合物可用于本文提供的方法中。在一些情况下,一种方法包括至少部分地预防、减少、改善并且/或者治疗疾病或疾患,或疾病或疾患的症状。受试者可以是人或非人。受试者可以是哺乳动物(例如,大鼠、小鼠、牛、狗、猪、羊、马)。受试者可以是脊椎动物或无脊椎动物。受试者可以是实验动物。受试者可以是患者。受试者可能罹患疾病。受试者可能展现疾病的症状。受试者可能没有展现疾病的症状,但仍然患有疾病。受试者可以接受照护者的医疗护理(例如,受试者住院并由医师治疗)。
6.6.治疗或检测方法
在一些方面,本公开提供了使用具有本文公开的任何一种工程化AAV VP衣壳多肽序列的rAAV病毒体的治疗方法。在一些方面,本公开提供了使用具有本文公开的任何一种工程化AAV VP衣壳多肽序列的rAAV病毒体的检测方法。所述方法包括向有需要的受试者施用有效量的药物组合物,所述药物组合物包含具有本文公开的任何一种AAV VP衣壳多肽序列的rAAV病毒体。rAAV病毒体衣壳包裹(encapsidate)任何有效载荷,包括本文公开的那些有效载荷。
在一些实施方案中,有效量为至少1x108个病毒基因组/剂量。在一些实施方案中,有效量为至少5x108个病毒基因组/剂量、7.5x108个病毒基因组/剂量、至少1x109个病毒基因组/剂量、至少2.5x109个病毒基因组/剂量、至少5x109个病毒基因组/剂量。
在一些实施方案中,有效量为至少1x1011个病毒基因组/kg患者体重、至少5x1011个病毒基因组/kg、至少1x1012个病毒基因组/kg、至少5x1012个病毒基因组/kg、至少1x1013个病毒基因组/kg、至少1x1014个病毒基因组/kg,或至少5x1014
在一些实施方案中,rAAV病毒体通过全身施用途径施用,包括肠内施用途径和肠胃外施用途径。可以静脉内施用rAAV病毒体。在一些实施方案中,可以肌肉内施用rAAV。在一些实施方案中,可以腹膜内施用rAAV。在一些实施方案中,可以局部施用rAAV。在一些实施方案中,可以口服施用rAAV。在具体实施方案中,静脉内施用rAAV病毒体。在一些实施方案中,鞘内施用rAAV。在一些实施方案中,通过脑室内注射来施用rAAV。在一些实施方案中,通过脑池内施用来施用rAAV。在一些实施方案中,通过玻璃体内注射来施用rAAV。
在各个实施方案中,患者罹患下表1中列出的疾患之一。在具体实施方案中,患者罹患表1中列出的疾患之一,并且rAAV包括与表1中所列疾患相关的转基因产物。
在一些实施方案中,具有本文公开的任何工程化AAV VP衣壳多肽序列的本公开的rAAV病毒体包含载体基因组,所述载体基因组包含治疗性多核苷酸或有效载荷。在另外的实施方案中,所述有效载荷可以处于引导受感染人细胞中的表达的调控序列的控制下。在一些实施方案中,有效载荷包含编码任何可遗传编码的有效载荷,如RNA(例如,指导RNA)、阻抑tRNA、转基因或基因组修饰实体的治疗性多核苷酸。
在一些实施方案中,治疗性多核苷酸编码指导RNA、tRNA、阻抑tRNA、siRNA、miRNA、mRNA、shRNA、环状RNA或反义寡核苷酸(ASO)、核酶、DNA酶(DNAzyme)、适体或它们的任何组合。在一些实施方案中,治疗性多核苷酸编码线性治疗性多核苷酸或环状治疗性多核苷酸。
在一些实施方案中,治疗性多核苷酸编码治疗性蛋白质(转基因)。在具体实施方案中,转基因编码选自表1的适合修饰的靶标或转基因产物的蛋白质。
Figure BDA0004113558700000271
/>
Figure BDA0004113558700000281
/>
Figure BDA0004113558700000291
/>
Figure BDA0004113558700000301
/>
Figure BDA0004113558700000311
/>
Figure BDA0004113558700000321
在一些实施方案中,治疗性多核苷酸编码治疗性RNA。在一些实施方案中,治疗性多核苷酸编码RNA,如用于基因组编辑或RNA编辑的指导RNA(包括工程化或合成的指导RNA)。
在一些实施方案中,治疗性多核苷酸编码tRNA或修饰的tRNA(工程化或合成的tRNA)。例如,tRNA或修饰的tRNA可以是阻抑tRNA。阻抑tRNA可以被设计成具有识别终止密码子如任何提前终止密码子(蛋白石、赭石或琥珀终止密码子)的反密码子区域。
在一些实施方案中,治疗性多核苷酸(例如,治疗性RNA、tRNA或基因组修饰实体)可以靶向表1中列出的基因或与神经疾病、帕金森氏病、阿尔茨海默氏病、Tau蛋白病、斯塔加特病、α-1抗胰蛋白酶缺乏症、杜兴氏肌营养不良、雷特综合征、囊性纤维化或任何遗传疾病相关的任何基因。在一些实施方案中,靶向基因可以是ABCA4、AAT、SERPINA1、SERPINA1E342K、HEXA、LRRK2、SNCA、DMD、APP、Tau、GBA、PINK1、RAB7A、CFTR、ALAS 1、ATP7B、ATP7B G1226R、HFE C282Y、LIPAc.894G>A、PCSK9起始位点或SCNN1A起始位点,这些中任一者的片段,或它们的任何组合。在一些实施方案中,治疗性多核苷酸是基因疗法有效载荷(例如,转基因),因此,其本身可以是表1中列出的基因之一或与神经疾病、帕金森氏病、阿尔茨海默氏病、Tau蛋白病、斯塔加特病、α-1抗胰蛋白酶缺乏症、杜兴氏肌营养不良、雷特综合征、囊性纤维化或任何遗传疾病相关的任何基因。在一些实施方案中,转基因可以是ABCA4、AAT、SERPINA1、SERPINA1E342K、HEXA、LRRK2、SNCA、DMD、APP、Tau、GBA、PINK1、RAB7A、CFTR、ALAS1、ATP7B、ATP7B G1226R、HFE C282Y、LIPA c.894G>A、PCSK9起始位点或SCNN1A起始位点,这些中任一者的片段,或它们的任何组合。
在一些实施方案中,治疗性多核苷酸编码基因组修饰实体。例如,基因组修饰实体可以是DNA编辑酶、RNA编辑酶、转录激活物或转录阻抑物。DNA编辑酶可以是任何DNA编辑酶,包括任何CRISPR/Cas系统、大范围核酸酶、锌指核酸酶(ZFN)、TALE核酸酶(TALEN和megaTALEN)。CRISPR/Cas系统可以是Cas3、Cas8、Cas10、Cas9、Cas4、Cas12或Cas13。RNA编辑酶可以是ADAR。在一些实施方案中,ADAR是人ADAR1或人ADAR2。转录激活物可以是VP64。转录阻抑物可以是KRAB。此类基因组修饰实体可以靶向表1中列出的任何基因进行编辑。
在一些实施方案中,本公开提供了具有工程化AAV VP衣壳多肽的rAAV病毒体,其中所述病毒体衣壳包裹本文公开的治疗性有效载荷中的任一者或它们的组合。在一些实施方案中,治疗性有效载荷的多个拷贝被衣壳包裹。
在一些实施方案中,治疗性多核苷酸是能够充当同源性模板用于同源定向修复的多核苷酸。
在一些实施方案中,具有本文公开的任何工程化AAV VP衣壳多肽序列的本公开的rAAV病毒体包含载体基因组,所述载体基因组包含可检测多核苷酸或有效载荷。在另外的实施方案中,所述有效载荷可以处于引导受感染人细胞中的表达的调控序列的控制下。可检测多核苷酸的实例包括但不限于任何可遗传编码的可检测部分。例如,可遗传编码的可检测部分可以是荧光蛋白,如EGFP、GFP、YFP、RFP、CFP或它们的任何变体。在一些实施方案中,本公开提供了具有工程化AAV VP衣壳多肽的rAAV病毒体,其中所述病毒体衣壳包裹本文公开的可检测有效载荷中的任一者或它们的组合。在一些实施方案中,可检测有效载荷的多个拷贝被衣壳包裹。
在一些实施方案中,本公开提供了具有工程化AAV VP衣壳多肽的rAAV病毒体,其中所述病毒体衣壳包裹本文公开的治疗性有效载荷和可检测有效载荷中的任一者或它们的组合。例如,具有工程化AAV VP衣壳多肽的本公开的rAAV可以衣壳包裹转基因和荧光蛋白。再如,具有工程化AAV VP衣壳多肽的本公开的rAAV可以衣壳包裹治疗性RNA(例如,指导RNA)和荧光蛋白。
6.7.体内选定的VP多肽
在另一方面,提供了使用本文所述的方法鉴定的工程化(同义地,重组)腺相关病毒(AAV)VP衣壳多肽。
在一些实施方案中,工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽具有与SEQID NO:1至少70%同一的氨基酸序列,其中工程化AAV VP衣壳多肽相较于SEQ ID NO:1在SEQ ID NO:1的从残基581至残基589的区域,包括端点在内,中具有至少一个取代,其中衣壳多肽能够组装成重组AAV病毒体(rAAV),并且其中VP衣壳多肽不具有SEQ ID NO:3、SEQID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。
在一些实施方案中,工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽具有与SEQID NO:1至少70%同一的氨基酸序列,其中工程化AAV VP衣壳多肽相较于SEQ ID NO:1在SEQ ID NO:1的从残基581至残基589的区域,包括端点在内,中具有至少一个取代,其中衣壳多肽能够组装成重组AAV病毒体(rAAV),其中与具有SEQ ID NO:1的AAV5 VP衣壳多肽的rAAV病毒体相比,所述至少一个取代赋予所述rAAV较高的对中枢神经系统(CNS)组织的嗜性,并且其中VP衣壳多肽不具有SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。
在具体实施方案中,工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽具有与SEQID NO:1的序列至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%同一的氨基酸序列。
在一些实施方案中,AAV VP衣壳多肽具有SEQ ID NO:2的氨基酸序列,其中Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自任何氨基酸,其中衣壳多肽能够组装成重组AAV病毒体(rAAV),并且其中VP衣壳多肽不具有SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列,任选地在VP衣壳多肽的别处具有另外的突变。
在一些实施方案中,AAV VP衣壳多肽具有SEQ ID NO:2的氨基酸序列,其中Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自任何氨基酸,其中衣壳多肽能够组装成重组AAV病毒体(rAAV),其中与具有SEQ ID NO:1的AAV5 VP衣壳多肽的rAAV病毒体相比,所述至少一个取代赋予所述rAAV较高的对中枢神经系统(CNS)组织的嗜性,并且其中VP衣壳多肽不具有SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ IDNO:7和SEQ ID NO:8中任一者的序列,任选地在VP衣壳多肽的别处具有另外的突变。
在一些实施方案中,工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽具有SEQ IDNO:2的氨基酸序列,其中氨基酸残基Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自A、R、N、D、C、E、Q、G、H、I、L、K、M、F、P、S、T、W、Y和V;其中工程化AAV VP衣壳多肽能够组装成重组AAV病毒体(rAAV);并且其中rAAV VP衣壳多肽不具有SEQ ID NO:l、SEQID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。
在一些实施方案中,工程化VP衣壳多肽的残基58l至残基589的区域,包括端点在内,具有与SEQ ID NO:7118-SEQ ID NO:10,117中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%同一的序列。
在具体实施方案中,工程化VP衣壳多肽的残基581至残基589的区域,包括端点在内,具有与SEQ ID NO:7118-SEQ ID NO:10,117中任一者同一的序列。
在一些实施方案中,工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽是工程化AAV5衣壳蛋白,其中工程化AAV VP5衣壳多肽相较于SEQ ID NO:1在SEQ ID NO:1的从残基581至残基589的区域,包括端点在内,中具有至少一个取代;其中衣壳多肽能够组装成重组AAV病毒体(rAAV);其中与具有SEQ ID NO:1的AAV5 VP衣壳多肽的rAAV病毒体相比,所述至少一个取代赋予所述rAAV较高的对中枢神经系统(CNS)组织的嗜性,并且其中VP衣壳多肽不具有SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列,任选地在VP蛋白的别处具有另外的突变。
在一些实施方案中,AAV VP衣壳多肽具有SEQ ID NO:2的氨,基酸序列,其中Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自A、R、N、D、C、E、Q、G、H、I、L、K、M、F、P、S、T、W、Y和V;并且其中多肽不具有SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。
在一些实施方案中,工程化AAV VP衣壳多肽包含由下式表示的多肽序列:(A)-(X)-(B)
其中:
(A)是SEQ ID NO:47438(VAYNVGGQMATNNQSSTTAP SEQ ID NO:2的残基561-580)的多肽序列;
(X)是包含SEQ ID NO:2的氨基酸残基Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9的多肽序列;并且
(B)是SEQ ID NO:47439(SEQ ID NO:2的残基590-609IVPGSVWMERDVYLQGPIWA)的多肽序列;
其中Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自A、R、N、D、C、E、Q、G、H、I、L、K、M、F、P、S、T、W、Y和V;并且其中衣壳多肽能够组装成重组AAV病毒体(rAAV);并且;
其中多肽不具有SEQ ID NO:l、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ IDNO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。
在一些实施方案中,工程化AAV VP衣壳多肽包含由下式表示的多肽序列:(A)-(X)-(B),其中:
(A)是SEQ ID NO:47438(SEQ ID NO:2的残基561-580VAYNVGGQMATNNQSSTTAP)的多肽序列;
(X)是选自表8(SEQ ID NO:115-1114)或表1 0(SEQ ID NO:7118-8117)中的多肽的列表的多肽序列,所述多肽序列赋予重组AAV病毒体(rAAV)CNS组织嗜性;并且
(B)是SEQ ID NO:47439(SEQ ID NO:2的残基590-609(IVPGSVWMERDVYLQGPIWA))的多肽序列;并且
其中衣壳多肽能够组装成rAAV,并且,
衣壳不具有SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。
在一些实施方案中,工程化AAV VP衣壳多肽赋予CNS组织嗜性,其中CNS组织选自由以下组成的组:海马:(齿状回,CA1和CA3);小脑、下丘脑、皮层:(枕叶、颞叶和前脑);黑质、丘脑,以及它们的任何组合。
在一些实施方案中,工程化AAV VP衣壳多肽包含由下式表示的多肽序列:(A)-(X)-(B),其中:
(A)是SEQ ID NO:47438(SEQ ID NO:2的残基:(561-580VAYNVGGQMATNNQSSTTAP))的多肽序列;
(X)是选自SEQ ID NO:115-1114或SEQ ID NO:1118-47437的多肽的多肽序列,所述多肽序列赋予重组AAV病毒体(rAAV)相应的组织嗜性;并且
(B)是SEQ ID NO:47439(SEQ ID NO:2的残基590-609(IVPGSVWMERDVYLQGPIWA))的多肽序列;并且
其中衣壳多肽能够组装成rAAV,并且,
衣壳不具有SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。
下文描述的是工程突变的AAV5 VP1多肽序列,其赋予稳定或改进的病毒体组装、组织嗜性或两者。在一些实施方案中,本公开提供了与SEQ ID NO:1具有不超过98.7%序列同源性的AAV5 VP1衣壳多肽,其中所述AAV5衣壳多肽在从对应于SEQ ID NO:1的581的位置至对应于589的位置的区域中具有至少一个突变。
本文还涵盖由工程化AAV5 VP2衣壳多肽和工程化AAV5 VP3衣壳多肽组成的rAAV,所述多肽在对应于AAV5 VP1581至589区域中的氨基酸的AAV5 VP2(氨基酸残基445至453)和AAV5 VP3(氨基酸残基389-397)中的区域处具有实施例的表(例如,表7、10、12、14、16、18、20、22、24、26、28、30、32、34、36、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85和86)中公开的序列。
6.7.1.体内选定的赋予增加的肝脏嗜性的VP多肽
在各个实施方案中,本公开提供了一种能够形成组装的病毒体的突变VP多肽,与包含SEQ ID NO:1的AAV5 VP1衣壳多肽的病毒体相比,所述病毒体表现出增加的对肝脏组织的嗜性。肝脏组织嗜性由相对于给定氨基酸残基在施用于NHP的总病毒文库的频率而言该给定氨基酸残基出现在对应于SEQ ID NO:1(推及于SEQ ID NO:2)的位置581至位置589的指定位置的频率决定。
在一些实施方案中,Xaa1选自A、G、K、M、N、Q、R、S或T。
在一些实施方案中,Xaa1选自A、K、M或T。
在一些实施方案中,Xaa1为K。
在另外的实施方案中,Xaa2选自A、C、H、I、K、S、T或V。
在一些实施方案中,Xaa2选自A、S、T或V。
在一些实施方案中,Xaa2为T。
在另外的实施方案中,Xaa3选自A、G、H、K、M,N、Q、R、S、T或V。
在一些实施方案中,Xaa3选自A、M或T。
在一些实施方案中,Xaa3为A或T。
在另外的实施方案中,Xaa4选自L、M,P、Q、R、T或W。
在一些实施方案中,Xaa4选自L、P、Q或T。
在一些实施方案中,Xaa4为P。
在另外的实施方案中,Xaa5选自F、H、I、K、M,T或Y。
在一些实施方案中,Xaa5选自H、I或Y。
在一些实施方案中,Xaa5为Y。
在另外的实施方案中,Xaa6选自E、G、H、L、M,N、Q、T或W。
在一些实施方案中,Xaa6选自N或Q。
在一些实施方案中,Xaa6为N。
在另外的实施方案中,Xaa7选自A、C、G、H、L、M,R或S。
在一些实施方案中,Xaa7选自A、C、H或M。
在一些实施方案中,Xaa7为A。
在另外的实施方案中,Xaa8选自A、C、D、F、G、H、M,Q、S、V、W或Y。
在一些实施方案中,Xaa8选自G、M,Q或S。
在一些实施方案中,Xaa8为G。
在另外的实施方案中,Xaa9选自A、C、E、G、H、M,N、P、Q、S、V或W。
在一些实施方案中,Xaa9选自E、G或P。
在一些实施方案中,Xaa9为G。
在具体实施方案中,工程化(重组)衣壳多肽的Xaa1-Xaa9序列选自表2中提供的氨基酸序列。
在一些实施方案中,当与AAV5野生型衣壳和相应病毒体相比时,工程化AAV衣壳和相应病毒体表现出增加的肝脏嗜性。当与包含SEQ ID NO:1的AAV5 VP1衣壳多肽的病毒体相比时,此增加的嗜性可以在约1.5、2.0、2.5、3.0、3.5、4.0、4.5、5.0、5.5、6.0、6.5、7.0、7.5、8.0、8.5、9.0、9.5至约10.0倍的范围内。
Figure BDA0004113558700000421
/>
Figure BDA0004113558700000431
6.7.2.体内选定的能够组装成rAAV的工程化VP多肽
在各个优选的实施方案中,本公开的突变(工程化,重组)VP衣壳多肽能够形成组装的病毒体,并且在一些情况下在与包含SEQ ID NO:1的AAV5 VP1衣壳多肽的病毒体相比时表现出相似或提高的稳定性。
分析相对于给定氨基酸残基出现在整个质粒文库中的指定位置的频率而言该给定氨基酸残基出现在组装的纯化病毒中对应于SEQ ID NO:1(推及于SEQ ID NO:2)的位置581至位置589的所述指定位置的频率,以确定优先病毒组装的衣壳的序列规则。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,所述多肽与野生型AAV5 VP衣壳多肽相比可以表现出相似或提高的稳定性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中Xaa1选自A、D、E、G、L、M,N、Q、S、T或V,或者Xaa1选自A、D、E、M或T。在一些实施方案中,Xaa1为E;或Xaa2选自A、C、D、E、G、H、I、N、P、Q、S、T或V,或Xaa2选自A、S、T或V,或Xaa2为A;或者其中Xaa3选自A、D、E、G、H、M,N、Q、S、T或V,或Xaa3选自D、E、N、Q或T,或Xaa3为D或T;或者其中Xaa4选自A、D、E、G、H、N、P、Q、S或T,或Xaa4选自D、E、P或Q,或Xaa4为E;或者其中Xaa5选自A、C、D、E、G、H、N、Q、S、T或Y,或Xaa5选自D、E、N、Q或T,或Xaa5为N;或者其中Xaa6选自A、D、E、G、H、N、P、Q、S或T,或Xaa6选自D、N或Q,或Xaa6为D;或者其中Xaa7选自A、C、D、E、G、H、N、Q、S或T,或Xaa7选自A、D、E或G,或Xaa7为A;或者其中Xaa8选自A、C、D、E、G、H、N、Q、S或T,或Xaa8包括A、D、G或S,或Xaa8为G;或者其中Xaa9选自A、D、E、G、H、N、P、Q、S或T,或Xaa9选自A、D、G或P,或Xaa9为G。
在各个实施方案中,VP多肽能够形成组装的病毒体,并且在一些情况下在与包含SEQ ID NO:1的AAV5 VP1衣壳多肽的病毒体相比时表现出相似或提高的稳定性。
在一些实施方案中,Xaa1选自A、D、E、G、L、M,N、Q、S、T或V。
在一些实施方案中,Xaa1选自A、D、E、M或T。在一些实施方案中,Xaa1为E。
在一些实施方案中,Xaa2选自A、C、D、E、G、H、I、N、P、Q、S、T或V。在一些实施方案中,Xaa2选自A、S、T或V。在一些实施方案中,Xaa2为A。
在一些实施方案中,Xaa3选自A、D、E、G、H、M,N、Q、S、T或V。在一些实施方案中,Xaa3选自D、E、N、Q或T。在一些实施方案中,Xaa3为D或T。
在一些实施方案中,Xaa4选自A、D、E、G、H、N、P、Q、S或T。在一些实施方案中,Xaa4选自D、E、P或Q。在一些实施方案中,Xaa4为E。
在一些实施方案中,Xaa5选自A、C、D、E、G、H、N、Q、S、T或Y。在一些实施方案中,Xaa5选自D、E、N、Q或T。在一些实施方案中,Xaa5为N。
在一些实施方案中,Xaa6选自A、D、E、G、H、N、P、Q、S或T。在一些实施方案中,Xaa6选自D、N或Q。在一些实施方案中,Xaa6为D。
在一些实施方案中,Xaa7选自A、C、D、E、G、H、N、Q、S或T。在一些实施方案中,Xaa7选自A、D、E或G。在一些实施方案中,Xaa7为A。
在一些实施方案中,Xaa8选自A、C、D、E、G、H、N、Q、S或T。在一些实施方案中,Xaa8包括A、D、G或S。在一些实施方案中,Xaa8为G。
在一些实施方案中,Xaa9选自A、D、E、G、H、N、P、Q、S或T。在一些实施方案中,Xaa9选自A、D、G或P。在一些实施方案中,Xaa9为G。
6.7.3.体内选定的能够组装成rAAV病毒体并且表现出降低的肝脏嗜性的突变VP多肽
本公开提供了具有VP衣壳多肽的AAV5病毒体,所述VP衣壳多肽在具有与靶细胞相互作用的残基的区域中具有至少一个突变,其中与野生型VP衣壳多肽相比,所述至少一个突变赋予降低的肝脏组织嗜性。在一些实施方案中,本文提供了与SEQ ID NO:1具有至少80%序列同源性的AAV5 VP1衣壳多肽,其中所述AAV5 VP1衣壳多肽在从对应于SEQ ID NO:1的581的位置至对应于589的位置的区域中具有至少一个突变,并且其中所述至少一个突变驱动降低的肝脏嗜性。
分析相对于给定氨基酸残基出现在形成组装病毒的变体中的指定位置的频率而言该给定氨基酸残基出现在肝脏中未鉴定的变体中对应于SEQ ID NO:1(推及于SEQ IDNO:2)的位置581至位置589的所述指定位置的频率,以确定优先对肝脏组织去靶向的衣壳的一组序列规则。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,所述多肽与野生型AAV5 VP衣壳多肽相比表现出降低的肝脏组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VPl多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中Xaa1不是K,或Xaa1不是A、K、M或T,或Xaa1不是A、G、K、M,N、Q、R、S或T;或者其中Xaa2不是T,或Xaa2不是A、S、T或V,或Xaa2不是A、C、H、I、K、S、T或V;或者其中Xaa3不是A或T,或Xaa3不是A、M或T,或Xaa3不是A、G、H、K、M,N、Q、R、S、T或V;或者其中Xaa4不是P,或者其中Xaa4不是L、P、Q或T,或Xaa4不是L、M,P、Q、R、T或W;或者其中Xaa5不是Y,或Xaa5不是H、I或Y,或Xaa5不是F、H、I、K、M,T或Y;或者其中Xaa6不是N,或Xaa6不是N或Q,或Xaa6不是E、G、H、L、M,N、Q、T或W;或者其中Xaa7不是A,或Xaa7不是A、C、H或M,或Xaa7不是A、C、G、H、L、M,R或S;或者其中Xaa8不是G,或Xaa8不是G、M,Q或S,或Xaa8不是A、C、D、F、G、H、M,Q、S、V、W或Y;或者其中Xaa9不是G,或Xaa9不是E、G或P,或Xaa9不是A、C、E、G、H、M,N、P、Q、S、V或W。
在某些实施方案中,Xaa1不是K,并且其中VP衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。
在某些实施方案中,Xaa1不是A、K、M或T,并且其中VP衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。
在某些实施方案中,Xaa1不是A、G、K、M,N、Q、R、S或T,并且其中VP衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。
在某些实施方案中,Xaa2不是T,并且其中VP衣壳能够形成组装的病毒体,与包含SEQ ID NO:l的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。
在某些实施方案中,Xaa2不是A、S、T或V,并且其中VP衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。
在某些实施方案中,Xaa2不是A、C、H、I、K、S、T或V,并且其中VP衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。
在某些实施方案中,Xaa3不是A或T,并且其中VP衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。
在某些实施方案中,Xaa3不是A、M或T,并且其中VP衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。
在某些实施方案中,Xaa3不是A、G、H、K、M,N、Q、R、S、T或V,并且其中VP衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。
在某些实施方案中,Xaa4不是P,并且其中VP衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。
在某些实施方案中,其中Xaa4不是L、P、Q或T,并且其中VP衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。
在某些实施方案中,Xaa4不是L、M,P、Q、R、T或W,并且其中VP衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。
在某些实施方案中,Xaa5不是Y,并且其中VP衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。
在某些实施方案中,Xaa5不是H、I或Y,并且其中VP衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。
在某些实施方案中,Xaa5不是F、H、I、K、M,T或Y,并且其中VP衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。
在某些实施方案中,Xaa6不是N,并且其中VP衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。
在某些实施方案中,Xaa6不是N或Q,并且其中VP衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。
在某些实施方案中,Xaa6不是E、G、H、L、M,N、Q、T或W,并且其中VP衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。
在某些实施方案中,Xaa7不是A,并且其中VP衣壳能够形成组装的病毒体,与包含SEQ ID NO:l的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。
在某些实施方案中,Xaa7不是A、C、H或M,并且其中VP衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。
在某些实施方案中,Xaa7不是A、C、G、H、L、M、R或S,并且其中VP衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。
在某些实施方案中,Xaa8不是G,并且其中VP衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。
在某些实施方案中,Xaa8不是G、M、Q或S,并且其中VP衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。
在某些实施方案中,Xaa8不是A、C、D、F、G、H、M、Q、S、V、W或Y,并且其中VP衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。
在某些实施方案中,Xaa9不是G,并且其中VP衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。
在某些实施方案中,Xaa9不是E、G或P,并且其中VP衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。
在某些实施方案中,Xaa9不是A、C、E、G、H、M、N、P、Q、S、V或W,并且其中VP衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。
本公开涵盖变体VP衣壳,与SEQ ID NO:1的AAV5 VP1衣壳相比,所述变体VP衣壳具有增加的对以下组织中任一者的组织嗜性:脂肪、肾上腺、主动脉、脑(包括海马:齿状回、CA1和CA3;小脑、尾状核、壳核、中脑、脑桥、下丘脑、皮层-包括枕叶、颞叶和前脑;黑质和丘脑)、骨髓、盲肠、结肠、背根神经节、十二指肠、附睾、食管、眼睛、胆囊、心脏、回肠、空肠、肾脏、肺、淋巴结、乳腺、卵巢、胰腺、甲状旁腺、周围神经、垂体、前列腺、唾液腺、精囊、骨骼肌、皮肤、脊髓、脾脏、胃、睾丸、胸腺、甲状腺、气管、膀胱、子宫和阴道的组织。
6.7.4.体内选定的对肝脏组织去靶向的突变VP多肽
A.位置频率规则
在本章节中,除非另外说明,否则分析相对于给定氨基酸残基出现在所有其他所收获组织(CNS(前脑皮层、枕叶皮层、颞叶皮层、丘脑、下丘脑、黑质、海马DG、海马CA1、海马CA3、小脑)、骨骼肌、心脏、肺、脾脏、淋巴结、骨髓、乳腺、皮肤、肾上腺、甲状腺、结肠、坐骨神经和脊髓组织、肝脏)中鉴定的变体中指定位置的频率而言该给定氨基酸残基出现在非肝脏中鉴定的变体中对应于SEQ ID NO:1(推及于SEQ ID NO:2)的位置581至位置589的所述指定位置的频率,以确定优先对肝脏组织去靶向的衣壳的一组序列规则。来自体内数据的位置频率规则的确定详细描述于实施例4中。参考实施例4中的表6B,和SEQ ID NO:2(AAV5VP1),以下氨基酸可以由此以任何组合在Xaa1-Xaa9任何一个或多个位置处独立地突变,以提供与野生型AAV5 VP1衣壳(SEQ ID NO:1)相比具有降低的肝脏嗜性的VP1衣壳,其中肝脏嗜性在此是指对肝脏转导具有确定性的特性,而不是对所有其他所收获组织转导具有确定性的特性。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,所述多肽与野生型AAV5 VP衣壳多肽相比表现出降低的肝脏组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中Xaa1不包括K;或Xaa1不包括A、K、M或T;或Xaa1不包括A、G、K、M、N、Q、R、S或T;或Xaa2不包括T;或Xaa2不包括A、S、T或V;或Xaa2不包括A、C、H、I、K、S、T或V;或Xaa3不包括A或T;或Xaa3不包括A、M或T;或Xaa3不包括A、G、H、K、M、N、Q、R、S、T或V;或Xaa4不包括P;或Xaa4不包括L、P、Q或T;或Xaa4不包括L、M、P、Q、R、T或W;或Xaa5不包括Y;或Xaa5不包括H、I或Y;或Xaa5不包括F、H、I、K、M、T或Y;或Xaa6不包括N;或Xaa6不包括N或Q;或Xaa6不包括E、G、H、L、M、N、Q、T或W;或Xaa7不包括A;或Xaa7不包括A、C、H或M;或Xaa7不包括A、C、G、H、L、M、R或S;或Xaa8不包括G;或Xaa8不包括G、M、Q或S;或Xaa8不包括A、C、D、F、G、H、M、Q、S、V、W或Y;或Xaa9不包括G;或Xaa9不包括E、G或P;或Xaa9不包括A、C、E、G、H、M、N、P、Q、S、V或W。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出降低的肝脏组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变选自以下规则。在一些实施方案中,Xaa1不包括K。在一些实施方案中,Xaa1不包括A、K、M或T。在一些实施方案中,Xaa1不包括A、G、K、M、N、Q、R、S或T。在一些实施方案中,Xaa2不包括T。在一些实施方案中,Xaa2不包括A、S、T或V。在一些实施方案中,Xaa2不包括A、C、H、I、K、S、T或V。在一些实施方案中,Xaa3不包括A或T。在一些实施方案中,Xaa3不包括A、M或T。在一些实施方案中,Xaa3不包括A、G、H、K、M、N、Q、R、S、T或V。在一些实施方案中,Xaa4不包括P。在一些实施方案中,Xaa4不包括L、P、Q或T。在一些实施方案中,Xaa4不包括L、M、P、Q、R、T或W。在一些实施方案中,Xaa5不包括Y。在一些实施方案中,Xaa5不包括H、I或Y。在一些实施方案中,Xaa5不包括F、H、I、K、M、T或Y。在一些实施方案中,Xaa6不包括N。在一些实施方案中,Xaa6不包括N或Q。在一些实施方案中,Xaa6不包括E、G、H、L、M、N、Q、T或W。在一些实施方案中,Xaa7不包括A。在一些实施方案中,Xaa7不包括A、C、H或M。在一些实施方案中,Xaa7不包括A、C、G、H、L、M、R或S。在一些实施方案中,Xaa8不包括G。在一些实施方案中,Xaa8不包括G、M、Q或S。在一些实施方案中,Xaa8不包括A、C、D、F、G、H、M、Q、S、V、W或Y。在一些实施方案中,Xaa9不包括G。在一些实施方案中,Xaa9不包括E、G或P。在一些实施方案中,Xaa9不包括A、C、E、G、H、M、N、P、Q、S、V或W。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出降低的肝脏组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VPl多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变选自以下规则:Xaa1不包括A、K、M或T,Xaa2不包括,Xaa3不包括A或T,Xaa4不包括P,Xaa5不包括Y,Xaa6不包括N,Xaa7不包括A,Xaa8不包括G,并且Xaa9不包括G。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出降低的肝脏组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变如下:Xaa1不包括A、K、M或T,或Xaa2不包括,或Xaa3不包括A或T,或Xaa4不包括P,或Xaa5不包括Y,或Xaa6不包括N,或Xaa7不包括A,或Xaa8不包括G,或Xaa9不包括G,或它们的任何组合。
B.ML规则
对于本段中描述的以下一组规则,使用体内数据和两个ML模型(描述于实施例21)确定工程化AAV5 VP1衣壳多肽的581至589区域中每个位置处的有利生物物理特性和有利氨基酸残基。本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与具有野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述组装的病毒体表现出降低的肝脏组织嗜性,其中工程化AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ IDNO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中Xaa1选自位置Xaa1处低溶解性的氨基酸(例如,Xaa1选自D或P);或者其中Xaa1选自位置Xaa1处低可突变性的氨基酸(例如,Xaa1选自C、K或L);或者其中Xaa2选自位置Xaa2处低溶解性的氨基酸(例如,Xaa2选自N、K、P、E或D);或者其中Xaa2选自位置Xaa2处低亲疏水性的氨基酸(例如,Xaa2选自D、E、R、K、H、N或Q);或者其中Xaa2选自位置Xaa2处低电荷的氨基酸(例如,Xaa2选自D或E);或者其中Xaa2选自位置Xaa2处高总潜在氢键数的氨基酸(例如,Xaa2选自H、N、Q、D、E或R);或者其中Xaa2选自位置Xaa2处中等体积的氨基酸(例如,Xaa2选自D、E、V、P、N或T);或者其中Xaa3选自位置Xaa3处低溶解性的氨基酸(例如,Xaa3选自P或D);或者其中Xaa4选自位置Xaa4处中等体积的氨基酸(例如,Xaa4选自D、E、V、P、N或T);或者其中Xaa5选自位置Xaa5处低溶解性的氨基酸(例如,Xaa5选自N、P、E或D);或者其中Xaa8选自位置Xaa8处低溶解性的氨基酸(例如,Xaa8选自K或Q);或者其中Xaa8选自位置Xaa8处低亲疏水性的氨基酸(例如,Xaa8选自K或R);或者其中Xaa8选自位置Xaa8处高表面可接近性的氨基酸(例如,Xaa8选自E、R或K);或它们的任何组合。
在一些实施方案中,Xaa1选自位置Xaa1处低溶解性的氨基酸。在一些实施方案中,Xaa1选自D或P。在一些实施方案中,Xaa1选自位置Xaa1处低可突变性的氨基酸。在一些实施方案中,Xaa1选自C、K或L。在一些实施方案中,Xaa2选自位置Xaa2处低溶解性的氨基酸。在一些实施方案中,Xaa2选自N、K、P、E或D。在一些实施方案中,Xaa2选自位置Xaa2处低亲疏水性的氨基酸。在一些实施方案中,Xaa2选自D、E、R、K、H、N或Q。在一些实施方案中,Xaa2选自位置Xaa2处低电荷的氨基酸。在一些实施方案中,Xaa2选自D、E。在一些实施方案中,Xaa2选自位置Xaa2处高总潜在氢键数的氨基酸。在一些实施方案中,Xaa2选自H、N、Q、D、E或R。在一些实施方案中,Xaa2选自位置Xaa2处中等体积的氨基酸。在一些实施方案中,Xaa2选自D、E、V、P、N或T。在一些实施方案中,Xaa3选自位置Xaa3处低溶解性的氨基酸。在一些实施方案中,Xaa3选自P或D。在一些实施方案中,Xaa4选自位置Xaa4处中等体积的氨基酸。在一些实施方案中,Xaa4选自D、E、V、P、N或T。在一些实施方案中,Xaa5选自位置Xaa5处低溶解性的氨基酸。在一些实施方案中,Xaa5选自N、P、E或D。在一些实施方案中,Xaa8选自位置Xaa8处低溶解性的氨基酸。在一些实施方案中,Xaa8选自K或Q。在一些实施方案中,Xaa8选自位置Xaa8处低亲疏水性的氨基酸。在一些实施方案中,Xaa8选自K或R。在一些实施方案中,Xaa8选自位置Xaa8处高表面可接近性的氨基酸。在一些实施方案中,Xaa8选自E、R或K。
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:46438-SEQ ID NO:47437的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动肝脏去靶向组织嗜性。
6.7.5.体内选定的赋予增加的肝脏嗜性的突变VP多肽
本公开提供了具有VP衣壳多肽的AAV5病毒体,所述VP衣壳多肽在具有与靶细胞(例如,目标靶肝脏组织中的靶肝脏细胞)相互作用的残基的区域中具有至少一个突变,其中与野生型VP衣壳多肽相比,所述至少一个突变赋予增加的肝脏组织嗜性。在一些实施方案中,本文提供了与SEQ ID NO:1具有至少80%序列同源性的AAV5 VP1衣壳多肽,其中所述AAV5 VP1衣壳多肽在从对应于SEQ ID NO:1的581的位置至对应于589的位置的区域中具有至少一个突变,并且其中所述至少一个突变驱动增加的肝脏嗜性。以下序列规则和序列也适用于对应于AAV5 VP1氨基酸残基581至589的AAV5 VP2(氨基酸残基445至453;VP2序列显示于SEQ ID NO:1115)和AAV5 VP3(氨基酸残基389至397;VP3序列显示于SEQ ID NO:1116)中的区域。因此,本公开涵盖在对应于581至589区域的AAV5 VP1氨基酸残基的VP2和VP3区域中具有一个或多个突变的AAV5 VP2衣壳多肽和AAV5 VP3衣壳多肽,其中所述一个或多个突变与以下章节中的规则或顺序相称。
A.位置频率规则
在本章节中,除非另外说明,否则分析相对于给定氨基酸残基出现在所有其他所收获组织(CNS(前脑皮层、枕叶皮层、颞叶皮层、丘脑、下丘脑、黑质、海马DG、海马CA1、海马CA3、小脑)、骨骼肌、心脏、肺、脾脏、淋巴结、骨髓、乳腺、皮肤、肾上腺、甲状腺、结肠、坐骨神经和脊髓组织)中鉴定的变体中指定位置的频率而言该给定氨基酸残基出现在肝脏中鉴定的变体中对应于SEQ ID NO:1(推及于SEQ ID NO:2)的位置581至位置589的所述指定位置的频率,以确定优先靶向肝脏组织的衣壳的一组序列规则。来自体内数据的位置频率规则的确定详细描述于实施例4中。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的肝脏组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID N0:2中的58l的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中Xaa1选自A、G、K、M、N、Q、R、S或T,或者
Xaa1选自A、K、Q或R,或Xaa1为K;或者其中Xaa2选自A、C、I、K、S、T或V,或Xaa2选自A、K、S或T,或Xaa2为A;或者其中Xaa3选自A、G、I、K、M、Q、R、S、T或V,或Xaa3选自A、K、Q、S或T,或Xaa3选自K、Q或T,或Xaa3为K;或者其中Xaa4选自A、I、K、L、P、Q、R、S、T或V,或Xaa4选自K、I、S或V,或Xaa4为K;或Xaa5选自F、I、L、M、T、V或Y,或者其中Xaa5选自F、L或Y,或Xaa5为F;或Xaa6选自F、H、M、N、Q、S或Y,或者其中Xaa6选自M或N,或Xaa6为N;或Xaa7选自A、C、K、M、Q或S,或者其中Xaa7选自A、C或S,或Xaa7为S;或者其中Xaa8选自A、C、F、G、M、Q或S,或Xaa8选自A、C、M或S,或Xaa8为C;或者其中Xaa9选自E、F、L、Q、R或Y,或Xaa9选自L、Q或R,或Xaa9为R。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的肝脏组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变选自以下规则。在一些实施方案中,Xaa1选自A、G、K、M、N、Q、R、S或T。在一些实施方案中,Xaa1选自A、K、Q或R。在一些实施方案中,Xaa1为K。在一些实施方案中,Xaa2选自A、C、I、K、S、T或V。在一些实施方案中,选自A、K、S或T,或Xaa2为A。在一些实施方案中,其中Xaa3选自A、G、I、K、M、Q、R、S、T或V,或Xaa3选自A、K、Q、S或T。在一些实施方案中,Xaa3选自K、Q或T。在一些实施方案中,Xaa3为K。在一些实施方案中,Xaa4选自A、I、K、L、P、Q、R、S、T或V。在一些实施方案中,Xaa4选自K、I、S或V。在一些实施方案中,Xaa4为K。在一些实施方案中,Xaa5选自F、I、L、M、T、V或Y。在一些实施方案中,Xaa5选自F、L或Y,或Xaa5为F。在一些实施方案中,Xaa6选自F、H、M、N、Q、S或Y。在一些实施方案中,其中Xaa6选自M或N,或Xaa6为N。在一些实施方案中,Xaa7选自A、C、K、M、Q或S。在一些实施方案中,Xaa7选自A、C或S,或Xaa7为S。在一些实施方案中,Xaa8选自A、C、F、G、M、Q或S。在一些实施方案中,Xaa8选自A、C、M或S,或Xaa8为C。在一些实施方案中,Xaa9选自E、F、L、Q、R或Y。在一些实施方案中,Xaa9选自L、Q或R,或Xaa9为R。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的肝脏组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变选自以下规则:Xaa1选自A、G、K、M、N、Q、R、S或T,Xaa2选自A、C、I、K、S、T或V,Xaa3选自A、G、I、K、M、Q、R、S、T或V,Xaa4选自A、I、K、L、P、Q、R、S、T或V,Xaa5选自F、I、L、M、T、V或Y,Xaa6选自F、H、M、N、Q、S或Y,Xaa7选自A、C或S,Xaa8选自A、C、F、G、M、Q或S,并且Xaa9选自E、F、L、Q、R或Y。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的肝脏组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变如下:Xaa1选自A、G、K、M、N、Q、R、S或T,或Xaa2选自A、C、I、K、S、T或V,或Xaa3选自A、G、I、K、M、Q、R、S、T或V,或Xaa4选自A、I、K、L、P、Q、R、S、T或V,或Xaa5选自F、I、L、M、T、V或Y,或Xaa6选自F、H、M、N、Q、S或Y,或Xaa7选自A、C或S,或Xaa8选自A、C、F、G、M、Q或S,或Xaa9选自E、F、L、Q、R或Y,或它们的任何组合。
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:43438-SEQ ID NO:44437的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的肝脏组织嗜性。
B.ML规则
对于本段中描述的以下一组规则,使用体内数据和两个ML模型(描述于实施例20)确定工程化AAV5 VP1衣壳多肽的581至589区域中每个位置处的有利生物物理特性和有利氨基酸残基。本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与具有野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述组装的病毒体表现出增加的肝脏组织嗜性,其中工程化AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ IDNO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中Xaa1选自高表面可接近性的氨基酸(例如,Xaa1选自K、R或E);或者其中Xaa1选自低亲疏水性的氨基酸(例如,Xaa1选自K、R);或者其中Xaa1选自低氨基酸可突变性的氨基酸(例如,Xaa1选自H、P、K或R);或者其中Xaa1选自低氨基酸溶解性的氨基酸(例如,Xaa1选自Q、K、R);或者其中Xaa2选自高表面可接近性的氨基酸(例如,Xaa2选自E、R或K);或者其中Xaa2选自低亲疏水性的氨基酸(例如,Xaa2选自K、R);或者其中Xaa2选自高氨基酸体积的氨基酸(例如,Xaa2选自S、L、I、A、R或K);或者其中Xaa3选自高可突变性的氨基酸(例如,Xaa3选自N、I、A、M、E或D);或者其中Xaa3选自低溶解性的氨基酸(例如,Xaa3选自N、K、R或E);或者其中Xaa4选自低亲疏水性的氨基酸(例如,Xaa4选自K或R);或者其中Xaa4选自高氨基酸体积的氨基酸(例如,Xaa4选自K、R、I或L);或者其中Xaa5选自中等氨基酸溶解性的氨基酸(例如,Xaa5选自H或T);或者其中Xaa8选自低表面可接近性的氨基酸(例如,Xaa8选自V或C);或者其中Xaa8选自低平均柔性指数的氨基酸(例如,Xaa8选自W、V、M、A、F、L、H或C);或它们的任何组合。
在一些实施方案中,Xaa1选自高表面可接近性的氨基酸。在一些实施方案中,Xaa1选自K、R或E。在一些实施方案中,Xaa1选自低亲疏水性的氨基酸。在一些实施方案中,Xaa1选自K或R。在一些实施方案中,Xaa1选自低氨基酸可突变性的氨基酸。在一些实施方案中,Xaa1选自H、P、K或R。在一些实施方案中,Xaa1选自低氨基酸溶解性的氨基酸。在一些实施方案中,Xaa1选自Q、K或R。在一些实施方案中,Xaa2选自高表面可接近性的氨基酸。在一些实施方案中,Xaa2选自E、R或K。在一些实施方案中,Xaa2选自低亲疏水性的氨基酸。在一些实施方案中,Xaa2选自K或R。在一些实施方案中,Xaa2选自高氨基酸体积的氨基酸。在一些实施方案中,Xaa2选自S、L、I、A、R或K。在一些实施方案中,Xaa3选自高可突变性的氨基酸。在一些实施方案中,Xaa3选自N、I、A、M、E或D。在一些实施方案中,Xaa3选自低溶解性的氨基酸。在一些实施方案中,Xaa3选自N、K、R或E。在一些实施方案中,Xaa4选自低亲疏水性的氨基酸。在一些实施方案中,Xaa4选自K、R。在一些实施方案中,Xaa4选自高氨基酸体积的氨基酸。在一些实施方案中,Xaa4选自K、R、I或L。在一些实施方案中,Xaa5选自中等氨基酸溶解性的氨基酸。在一些实施方案中,Xaa5选自H、T。在一些实施方案中,Xaa8选自低表面可接近性的氨基酸。在一些实施方案中,Xaa8选自V或C。在一些实施方案中,Xaa8选自低平均柔性指数的氨基酸。在一些实施方案中,Xaa8选自W、V、M、A、F、L、H或C。
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:44438-SEQ ID NO:45437的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的肝脏组织嗜性。
C.富集的肝脏序列
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:45438-SEQ ID NO:46437的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的肝脏组织嗜性。
6.7.6.体内选定的赋予增加的中枢神经系统嗜性的突变VP多肽,基于位置频率的规则和ML规则
本公开提供了具有VP衣壳多肽的AAV5病毒体,所述VP衣壳多肽在具有与靶细胞(例如,目标靶CNS组织中的靶CNS细胞)相互作用的残基的区域中具有至少一个突变,其中与野生型VP衣壳多肽相比,所述至少一个突变赋予增加的CNS组织嗜性。在一些实施方案中,本文提供了与SEQ ID NO:1具有至少80%序列同源性的AAV5VP1衣壳多肽,其中所述AAV5 VP1衣壳多肽在从对应于SEQ ID NO:1的581的位置至对应于589的位置的区域中具有至少一个突变,并且其中所述至少一个突变驱动增加的中枢神经系统嗜性。以下序列规则和序列也适用于对应于AAV5 VP1氨基酸残基581至589的AAV5VP2(氨基酸残基445至453;VP2序列显示于SEQ ID NO:1115)和AAV5 VP3(氨基酸残基389至397;VP3序列显示于SEQ IDNO:1116)中的区域。因此,本公开涵盖在对应于581至589区域的AAV5 VP1氨基酸残基的VP2和VP3区域中具有一个或多个突变的AAV5 VP2衣壳多肽和AAV5 VP3衣壳多肽,其中所述一个或多个突变与以下章节中的规则或顺序相称。
A.位置频率规则
在本章节中,除非另外说明,否则分析相对于给定氨基酸残基出现在所有其他所收获组织(肝脏、骨骼肌、心脏、肺、脾脏、淋巴结、骨髓、乳腺、皮肤、肾上腺、甲状腺、结肠、坐骨神经和脊髓组织)中鉴定的变体中指定位置的频率而言该给定氨基酸残基出现在中枢神经系统(前脑皮层、枕叶皮层、颞叶皮层、丘脑、下丘脑、黑质、海马DG、海马CA1、海马CA3、小脑)中鉴定的变体中对应于SEQ ID NO:1(推及于SEQ ID NO:2)的位置581至位置589的所述指定位置的频率,以确定优先靶向中枢神经系统组织的衣壳的一组序列规则。来自体内数据的位置频率规则的确定详细描述于实施例5中。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的中枢神经系统组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中Xaa1选自A、C、K、M、Q、R、T或W,或Xaa1选自K、Q、R或W,或Xaa1为K;或Xaa2选自F、I、K、R、T或W,或Xaa2选自F、I、R或T,或Xaa2为R;或Xaa3选自A、H、N、R或W,或Xaa3选自A、R或W,或Xaa3为R;或Xaa4选自E、G、I、M、Q或R,或Xaa4选自E、M或R,或Xaa4为R;或Xaa5选自C、G、K、I、M或R,或Xaa5选自K、I或R,或Xaa5为I;或Xaa6选自I、K、L、P、Q、R、Y,或Xaa6选自K、R或Y,或Xaa6为R;或Xaa7选自D、I、K、R、V或W,或Xaa7选自I、R或V,或Xaa7为V;或Xaa8选自C、G、H、K、L或V,或Xaa8选自H、K或V,或Xaa8为H;或Xaa9选自I、K、L、R或V,或Xaa9选自I、K或R,或Xaa9为R。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的中枢神经系统组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变选自以下规则。在一些实施方案中,Xaa1选自A、C、K、M、Q、R、T或W。在一些实施方案中,Xaa1选自K、Q、R或W。在一些实施方案中,Xaa1为K。在一些实施方案中,Xaa2选自F、I、K、R、T或W。在一些实施方案中,Xaa2选自F、I、R或T。在一些实施方案中,Xaa2为R。在一些实施方案中,Xaa3选自A、H、N、R或W。在一些实施方案中,Xaa3选自A、R或W。在一些实施方案中,Xaa3为R。在一些实施方案中,Xaa4选自E、G、I、M、Q或R。在一些实施方案中,Xaa4选自E、M或R。在一些实施方案中,Xaa4为R。在一些实施方案中,Xaa5选自C、G、K、I、M或R。在一些实施方案中,Xaa5选自K、I或R。在一些实施方案中,Xaa5为I。在一些实施方案中,Xaa6选自I、K、L、P、Q、R、Y。在一些实施方案中,Xaa6选自K、R或Y。在一些实施方案中,Xaa6为R。在一些实施方案中,Xaa7选自D、I、K、R、V或W。在一些实施方案中,Xaa7选自I、R或V。在一些实施方案中,Xaa7为V。在一些实施方案中,Xaa8选自C、G、H、K、L或V。在一些实施方案中,Xaa8选自H、K或V。在一些实施方案中,Xaa8为H。在一些实施方案中,Xaa9选自I、K、L、R或V。在一些实施方案中,Xaa9选自I、K或R。在一些实施方案中,Xaa9为R。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的中枢神经系统组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变选自以下规则:Xaa1选自A、C、K、M、Q、R、T或W,Xaa2选自F、I、K、R、T或W,Xaa3选自A、H、N、R或W,Xaa4选自E、G、I、M、Q或R,Xaa5选自C、G、K、I、M或R,Xaa6选自I、K、L、P、Q、R、Y,Xaa7选自D、I、K、R、V或W,Xaa8选自C、G、H、K、L或V,并且Xaa9选自I、K、L、R或V。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的中枢神经系统组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变如下:Xaa1选自A、C、K、M、Q、R、T或W,Xaa2选自F、I、K、R、T或W,Xaa3选自A、H、N、R或W,Xaa4选自E、G、I、M、Q或R,Xaa5选自C、G、K、I、M或R,Xaa6选自I、K、L、P、Q、R、Y,Xaa7选自D、I、K、R、V或W,Xaa8选自C、G、H、K、L或V,Xaa9选自I、K、L、R或V,或它们的任何组合。
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:7118-SEQ ID NO:8117的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的中枢神经系统组织嗜性。
B.ML规则
对于本章节后续段落中描述的以下一组规则,使用体内数据和两个ML模型(描述于实施例19)确定工程化AAV5 VP1衣壳多肽的581至589区域中每个位置处的有利生物物理特性和有利氨基酸残基。本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与具有野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述组装的病毒体表现出增加的中枢神经系统组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中Xaa1选自低氨基酸溶解性的氨基酸(例如,Xaa1选自K、R或Q);或者其中Xaa1选自低氨基酸亲疏水性的氨基酸(例如,Xaa1选自K或R);或者其中Xaa1选自高平均氨基酸柔性指数的氨基酸(例如,Xaa1选自D、E、R、K、G、I、N、Q或S);或者其中Xaa1选自氢键供体的氨基酸(例如,Xaa1选自K或R);或者其中Xaa1选自氨基酸可突变性的氨基酸(例如,Xaa1选自K、R、P或H);或者其中Xaa2选自低氨基酸溶解性的氨基酸(例如,Xaa2选自R、K、Q或S);或者其中Xaa2选自低氨基酸亲疏水性的氨基酸(例如,Xaa2选自R、K、D、E、N、Q、H、P、Y、W、S或T);或者其中Xaa2选自高氨基酸电荷的氨基酸(例如,Xaa2选自R、K或H);或者其中Xaa3选自高氨基酸溶解性的氨基酸(例如,Xaa3选自A、M、V、W、L或I);或者其中Xaa5选自高氨基酸溶解性的氨基酸(例如,Xaa5选自C、M、V、W、L或I);或者其中Xaa5选自高亲疏水性的氨基酸(例如,Xaa5选自M、V或I);或者其中Xaa5选自低平均氨基酸柔性指数的氨基酸(例如,Xaa5选自M、W、F或C);或者其中Xaa8选自高氨基酸溶解性的氨基酸(例如,Xaa8选自H、V或I);或它们的任何组合。
在一些实施方案中,Xaa1选自低氨基酸溶解性的氨基酸。在一些实施方案中,Xaa1选自K、R、Q。在一些实施方案中,Xaa1选自低氨基酸亲疏水性的氨基酸。在一些实施方案中,Xaa1选自K或R。在一些实施方案中,Xaa1选自高平均氨基酸柔性指数的氨基酸。在一些实施方案中,Xaa1选自D、E、R、K、G、I、N、Q或S。在一些实施方案中,Xaa1选自高氢键供体的氨基酸。在一些实施方案中,Xaa1选自K或R。在一些实施方案中,Xaa1选自氨基酸可突变性的氨基酸。在一些实施方案中,Xaa1选自K、R、P或H。在一些实施方案中,Xaa2选自低氨基酸溶解性的氨基酸。在一些实施方案中,Xaa2选自R、K、Q或S。在一些实施方案中,Xaa2选自低氨基酸亲疏水性的氨基酸。在一些实施方案中,Xaa2选自R、K、D、E、N、Q、H、P、Y、W、S或T。在一些实施方案中,Xaa2选自高氨基酸电荷的氨基酸。在一些实施方案中,Xaa2选自R、K、H。在一些实施方案中,Xaa3选自高氨基酸溶解性的氨基酸。在一些实施方案中,Xaa3选自A、M、V、W、L或I。在一些实施方案中,Xaa5选自高氨基酸溶解性的氨基酸。在一些实施方案中,Xaa5选自C、M、V、W、L或I。在一些实施方案中,Xaa5选自高亲疏水性的氨基酸。在一些实施方案中,Xaa5选自M、V或I。在一些实施方案中,Xaa5选自低平均氨基酸柔性指数的氨基酸。在一些实施方案中,Xaa5选自M、W、F或C。在一些实施方案中,Xaa8选自高氨基酸溶解性的氨基酸。在一些实施方案中,Xaa8选自H、V或I。
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的58l的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:8118-SEQ ID NO:9117的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的CNS组织嗜性。
C.富集的CNS序列
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:9118-SEQ ID NO:10117的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的CNS组织嗜性。
6.7.7.体内选定的赋予增加的脾脏嗜性的突变VP多肽
本公开提供了具有VP衣壳多肽的AAV5病毒体,所述VP衣壳多肽在具有与靶细胞(例如,目标靶脾脏组织中的靶脾脏细胞)相互作用的残基的区域中具有至少一个突变,其中与野生型VP衣壳多肽相比,所述至少一个突变赋予增加的脾脏组织嗜性。在一些实施方案中,本文提供了与SEQ ID NO:1具有至少80%序列同源性的AAV5 VP1衣壳多肽,其中所述AAV5 VP1衣壳多肽在从对应于SEQ ID NO:1的581的位置至对应于589的位置的区域中具有至少一个突变,并且其中所述至少一个突变驱动增加的脾脏嗜性。以下序列规则和序列也适用于对应于AAV5 VP1氨基酸残基581至589的AAV5 VP2(氨基酸残基445至453;VP2序列显示于SEQ ID NO:1115)和AAV5 VP3(氨基酸残基389至397;VP3序列显示于SEQ ID NO:1116)中的区域。因此,本公开涵盖在对应于58l至589区域的AAV5 VP1氨基酸残基的VP2和VP3区域中具有一个或多个突变的AAV5 VP2衣壳多肽和AAV5 VP3衣壳多肽,其中所述一个或多个突变与以下章节中的规则或顺序相称。
A.位置频率规则
在本章节中,除非另外说明,否则分析相对于给定氨基酸残基出现在所有其他所收获组织(CNS(前脑皮层、枕叶皮层、颞叶皮层、丘脑、下丘脑、黑质、海马DG、海马CA1、海马CA3、小脑)、肝脏、骨骼肌、心脏、肺、淋巴结、骨髓、乳腺、皮肤、肾上腺、甲状腺、结肠、坐骨神经和脊髓组织)中鉴定的变体中指定位置的频率而言该给定氨基酸残基出现在脾脏中鉴定的变体中对应于SEQ ID NO:1(推及于SEQ ID NO:2)的位置581至位置589的所述指定位置的频率,以确定优先靶向脾脏组织的衣壳的一组序列规则。来自体内数据的位置频率规则的确定详细描述于实施例6中。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的脾脏组织嗜性,其中工程化变体AAV5 VP1衣壳多肽序列具有一个或多个突变,其中Xaa1选自C、F、H、I、L、P、W或Y,或Xaa1选自C、F、P、W或Y,或Xaa1选自P、W或Y,或Xaa1为P;或Xaa2选自D、E、L、N、P、R或W,或Xaa2选自D、E或W,或Xaa2为D;或Xaa3选自C、D、E、P或W,或Xaa3选自D、P或W,或Xaa3为P;或Xaa4选自C、F、G、H、R、W或Y,或Xaa4选自C、H或W,或Xaa4为C;或Xaa5选自A、D、E、G、P、R或W,或Xaa5选自D、E、G或P,或Xaa5为D;或Xaa6选自A、C、D、E、K、R、W,或Xaa6选自C、K或R,或Xaa6为K;或Xaa7选自F、L、P、R、W、Y,或Xaa7选自L、P或W,或Xaa7为P;或Xaa8选自E、I、K、L、P、R或T,或Xaa8选自P、R或K,或Xaa8为K;或Xaa9选自C、H、M、T、V或W,或Xaa9选自C、T或V,或Xaa9为V。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的脾脏组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变选自以下规则。在一些实施方案中,Xaa1选自C、F、H、I、L、P、W或Y。在一些实施方案中,Xaa1选自C、F、P、W或Y。在一些实施方案中,Xaa1选自P、W或Y。在一些实施方案中,Xaa1为P。在一些实施方案中,Xaa2选自D、E、L、N、P、R或W。在一些实施方案中,Xaa2选自D、E或W。在一些实施方案中,Xaa2为D。在一些实施方案中,Xaa3选自C、D、E、P或W。在一些实施方案中,Xaa3选自D、P或W。在一些实施方案中,Xaa3为P。在一些实施方案中,Xaa4选自C、F、G、H、R、W或Y。在一些实施方案中,Xaa4选自C、H或W。在一些实施方案中,Xaa4为C。在一些实施方案中,Xaa5选自A、D、E、G、P、R或W。在一些实施方案中,Xaa5选自D、E、G或P。在一些实施方案中,Xaa5为D。在一些实施方案中,Xaa6选自A、C、D、E、K、R、W。在一些实施方案中,Xaa6选自C、K或R。在一些实施方案中,Xaa6为K。在一些实施方案中,Xaa7选自F、L、P、R、W、Y。在一些实施方案中,Xaa7选自L、P或W。在一些实施方案中,Xaa7为P。在一些实施方案中,Xaa8选自E、I、K、L、P、R或T。在一些实施方案中,Xaa8选自P、R或K。在一些实施方案中,Xaa8为K。在一些实施方案中,Xaa9选自C、H、M、T、V或W。在一些实施方案中,Xaa9选自C、T或V。在一些实施方案中,Xaa9为V。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的脾脏组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变选自以下规则:Xaa1选自C、F、H、I、L、P、W或Y,Xaa2选自D、E、L、N、P、R或W,Xaa3选自C、D、E、P或W,Xaa4选自C、F、G、H、R、W或Y,Xaa5选自A、D、E、G、P、R或W,Xaa6选自A、C、D、E、K、R、W,Xaa7选自F、L、P、R、W、Y,Xaa8选自E、I、K、L、P、R或T,并且Xaa9选自C、H、M、T、V或W。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的脾脏组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变如下:Xaa1选自C、F、H、I、L、P、W或Y,Xaa2选自D、E、L、N、P、R或W,Xaa3选自C、D、E、P或W,Xaa4选自C、F、G、H、R、W或Y,Xaa5选自A、D、E、G、P、R或W,Xaa6选自A、C、D、E、K、R、W,Xaa7选自F、L、P、R、W、Y,Xaa8选自E、I、K、L、P、R或T,Xaa9选自C、H、M、T、V或W,或它们的任何组合。
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:37438-SEQ ID NO:38437的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的脾脏组织嗜性。
B.ML规则
对于本段中描述的以下一组规则,使用体内数据和两个ML模型(描述于实施例42)确定工程化AAV5 VP1衣壳多肽的581至589区域中每个位置处的有利生物物理特性和有利氨基酸残基。本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与具有野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述组装的病毒体表现出增加的脾脏组织嗜性,其中工程化AAV5 VP衣壳多肽序列具有一个或多个突变,其中工程化AAV5 VP1衣壳多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中Xaa1选自低溶解性的氨基酸(例如,Xaa1选自D或P);或者其中Xaa1选自高溶解性的氨基酸(例如,Xaa1选自F、I、L);或者其中Xaa1选自低亲疏水性的氨基酸(例如,Xaa1选自Y或P);或者其中Xaa1选自低可突变性的氨基酸(例如,Xaa1选自C、K或P);或者其中Xaa2选自低溶解性的氨基酸(例如,Xaa2选自D、Q或R);或者其中Xaa2选自低亲疏水性的氨基酸(例如,Xaa2选自D、E、R、K、H、N或Q);或者其中Xaa2选自低电荷的氨基酸(例如,Xaa2选自D或E);或者其中Xaa2选自低体积的氨基酸(例如,Xaa2选自T、N、P或D);或者其中Xaa2选自高平均柔性的氨基酸(例如,Xaa2选自D、E、R、P、G、Q或S);或者其中Xaa3选自低溶解性的氨基酸(例如,Xaa3选自D、E、P或N);或者其中Xaa3选自低亲疏水性的氨基酸(例如,Xaa3选自D、E、H、N、Q或P);或者其中Xaa4选自低亲疏水性的氨基酸(例如,Xaa4选自K或R);或者其中Xaa5选自低溶解性的氨基酸(例如,Xaa5选自D、E、P或N);或者其中Xaa5选自高平均柔性的氨基酸(例如,Xaa5选自D、E、R、P、G、Q或S);或者其中Xaa6选自低可突变性的氨基酸(例如,Xaa6选自C);或者其中Xaa8选自高表面可接近性的氨基酸(例如,Xaa8选自E、R或K);或者其中Xaa8选自低溶解性的氨基酸(例如,Xaa8选自E、P、R、K、N或Q);或者其中Xaa8选自中等体积的氨基酸(例如,Xaa8选自E、D、R、K、V、P、M、I、L、H、N、Q或T);或者其中Xaa9选自中等摩尔质量的氨基酸(例如,Xaa9选自E、D、K、M、I、L、H或N);或它们的任何组合。
在一些实施方案中,Xaa1选自低溶解性的氨基酸。在一些实施方案中,Xaa1选自D或P。在一些实施方案中,Xaa1选自高溶解性的氨基酸。在一些实施方案中,Xaa1选自F、I或L。在一些实施方案中,Xaa1选自低亲疏水性的氨基酸。在一些实施方案中,Xaa1选自Y或P。在一些实施方案中,Xaa1选自低可突变性的氨基酸。在一些实施方案中,Xaa1选自C、K或P。在一些实施方案中,Xaa2选自低溶解性的氨基酸。在一些实施方案中,Xaa2选自D、Q或R。在一些实施方案中,Xaa2选自低亲疏水性的氨基酸。在一些实施方案中,Xaa2选自D、E、R、K、H、N或Q。在一些实施方案中,Xaa2选自低电荷的氨基酸。在一些实施方案中,Xaa2选自D或E。在一些实施方案中,Xaa2选自低体积的氨基酸。在一些实施方案中,Xaa2选自T、N、P或D。在一些实施方案中,Xaa2选自高平均柔性的氨基酸。在一些实施方案中,Xaa2选自D、E、R、P、G、Q或S。在一些实施方案中,Xaa3选自低溶解性的氨基酸。在一些实施方案中,Xaa3选自D、E、P或N。在一些实施方案中,Xaa3选自低亲疏水性的氨基酸。在一些实施方案中,Xaa3选自D、E、H、N、Q或P。在一些实施方案中,Xaa4选自低亲疏水性的氨基酸。在一些实施方案中,Xaa4选自K或R。在一些实施方案中,Xaa5选自低溶解性的氨基酸。在一些实施方案中,Xaa5选自D、E、P或N。在一些实施方案中,Xaa5选自高平均柔性的氨基酸。在一些实施方案中,Xaa5选自D、E、R、P、G、Q或S。在一些实施方案中,Xaa6选自低可突变性的氨基酸。在一些实施方案中,Xaa6选自C。在一些实施方案中,Xaa8选自高表面可接近性的氨基酸。在一些实施方案中,Xaa8选自E、R或K。在一些实施方案中,Xaa8选自低溶解性的氨基酸。在一些实施方案中,Xaa8选自E、P、R、K、N或Q。在一些实施方案中,Xaa8选自中等体积的氨基酸。在一些实施方案中,Xaa8选自E、D、R、K、V、P、M、I、L、H、N、Q或T。在一些实施方案中,Xaa9选自中等摩尔质量的氨基酸。在一些实施方案中,Xaa9选自E、D、K、M、I、L、H或N。
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:38438-SEQ ID NO:39437的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的脾脏组织嗜性。
C.富集的脾脏序列
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:39438-SEQ ID NO:40437的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的脾脏组织嗜性。
6.7.8.体内选定的赋予增加的肾上腺嗜性的突变VP多肽
本公开提供了具有VP衣壳多肽的AAV5病毒体,所述VP衣壳多肽在具有与靶细胞(例如,目标靶肾上腺组织中的靶肾上腺细胞)相互作用的残基的区域中具有至少一个突变,其中与野生型VP衣壳多肽相比,所述至少一个突变赋予增加的肾上腺组织嗜性。在一些实施方案中,本文提供了与SEQ ID NO:l具有至少80%序列同源性的AAV5 VP1衣壳多肽,其中所述AAV5 VP1衣壳多肽在从对应于SEQ ID NO:1的581的位置至对应于589的位置的区域中具有至少一个突变,并且其中所述至少一个突变驱动增加的肾上腺嗜性。以下序列规则和序列也适用于对应于AAV5 VP1氨基酸残基581至589的AAV5 VP2(氨基酸残基445至453;VP2序列显示于SEQ ID NO:111 5)和AAV5 VP3(氨基酸残基389至397;VP3序列显示于SEQID NO:1116)中的区域。因此,本公开涵盖在对应于581至589区域的AAV5 VP1氨基酸残基的VP2和VP3区域中具有一个或多个突变的AAV5 VP2衣壳多肽和AAV5 VP3衣壳多肽,其中所述一个或多个突变与以下章节中的规则或顺序相称。
A.位置频率规则
在本章节中,除非另外说明,否则分析相对于给定氨基酸残基出现在所有其他所收获组织(CNS(前脑皮层、枕叶皮层、颞叶皮层、丘脑、下丘脑、黑质、海马DG、海马CA1、海马CA3、小脑)、肝脏、骨骼肌、心脏、肺、脾脏、淋巴结、骨髓、乳腺、皮肤、甲状腺、结肠、坐骨神经和脊髓组织)中鉴定的变体中指定位置的频率而言该给定氨基酸残基出现在肾上腺中鉴定的变体中对应于SEQ ID NO:1(推及于SEQ ID NO:2)的位置581至位置589的所述指定位置的频率,以确定优先靶向肾上腺组织的衣壳的一组序列规则。来自体内数据的位置频率规则的确定详细描述于实施例7中。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的肾上腺组织嗜性,其中工程化变体AAV5VP1衣壳多肽序列具有一个或多个突变,其中Xaa1选自A、C、K、Q、R、S或T,或Xaa1选自C、K或R,或Xaa1为C;或Xaa2选自A、C、I、S、T或V,或Xaa2选自A、V或T,或Xaa2为V;或Xaa3选自A、F、G、K、M、Q、R、T或V,或Xaa3选自A、G或M,或Xaa3为M;或Xaa4选自A、K、M、Q、R或V,或Xaa4选自A、R或K,或Xaa4为K;或Xaa5选自F、I、L、M、R、T、V或Y,或Xaa5选自R、V或Y,或Xaa5为V;或Xaa6选自G、H、M、N、R或S,或Xaa6选自H或N,或Xaa6为N;或Xaa7选自A、H、K、Q、R、S或V,或Xaa7选自H、Q或V,或Xaa7为H;或Xaa8选自A、G、H、M、Q或S,或Xaa8选自A、G、M或S,或Xaa8为S;或Xaa9选自A、E、N、P、R、S或Y,或Xaa9选自P或E,或Xaa9为P。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的肾上腺组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变选自以下规则。在一些实施方案中,Xaa1选自A、C、K、Q、R、S或T。在一些实施方案中,Xaa1选自C、K或R。在一些实施方案中,Xaa1为C。在一些实施方案中,Xaa2选自A、C、I、S、T或V。在一些实施方案中,Xaa2选自A、V或T。在一些实施方案中,Xaa2为V。在一些实施方案中,Xaa3选自A、F、G、K、M、Q、R、T或V。在一些实施方案中,Xaa3选自A、G或M。在一些实施方案中,Xaa3为M。在一些实施方案中,Xaa4选自A、K、M、Q、R或V。在一些实施方案中,Xaa4选自A、R或K。在一些实施方案中,Xaa4为K。在一些实施方案中,Xaa5选自F、I、L、M、R、T、V或Y。在一些实施方案中,Xaa5选自R、V或Y。在一些实施方案中,Xaa5为V。在一些实施方案中,Xaa6选自G、H、M、N、R或S。在一些实施方案中,Xaa6选自H或N。在一些实施方案中,Xaa6为N。在一些实施方案中,Xaa7选自A、H、K、Q、R、S或V。在一些实施方案中,Xaa7选自H、Q或V。在一些实施方案中,Xaa7为H。在一些实施方案中,Xaa8选自A、G、H、M、Q或S。在一些实施方案中,Xaa8选自A、G、M或S。在一些实施方案中,Xaa8为S。在一些实施方案中,Xaa9选自A、E、N、P、R、S或Y。在一些实施方案中,Xaa9选自P或E。在一些实施方案中,Xaa9为P。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的肾上腺组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变选自以下规则:Xaa1选自A、C、K、Q、R、S或T,Xaa2选自A、C、I、S、T或V,Xaa3选自A、F、G、K、M、Q、R、T或V,Xaa4选自A、K、M、Q、R或V,Xaa5选自F、I、L、M、R、T、V或Y,Xaa6选自G、H、M、N、R或S,Xaa7选自A、H、K、Q、R、S或V,Xaa8选自A、G、H、M、Q或S,并且Xaa9选自A、E、N、P、R、S或Y。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的肾上腺组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变如下:Xaa1选自A、C、K、Q、R、S或T,Xaa2选自A、C、I、S、T或V,Xaa3选自A、F、G、K、M、Q、R、T或V,Xaa4选自A、K、M、Q、R或V,Xaa5选自F、I、L、M、R、T、V或Y,Xaa6选自G、H、M、N、R或S,Xaa7选自A、H、K、Q、R、S或V,Xaa8选自A、G、H、M、Q或S,Xaa9选自A、E、N、P、R、S或Y,或它们的任何组合。
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:1118-SEQ IDNO:2117的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的肾上腺组织嗜性。
B.ML规则
对于本段中描述的以下一组规则,使用体内数据和两个ML模型(描述于实施例31)确定工程化AAV5 VP1衣壳多肽的581至589区域中每个位置处的有利生物物理特性和有利氨基酸残基。本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与具有野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述组装的病毒体表现出增加的肾上腺组织嗜性,其中工程化AAV5 VP衣壳多肽序列具有一个或多个突变,其中工程化AAV5 VP1衣壳多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中Xaa1选自Xaa1处低摩尔质量的氨基酸(例如,Xaa1选自V、P、S或C);或者其中Xaa1选自低亲疏水性的氨基酸(例如,Xaa1选自T、S、W或Y);或者其中Xaa2选自低亲疏水性的氨基酸(例如,Xaa2选自R);或者其中Xaa2选自低可突变性的氨基酸(例如,Xaa2选自C);或者其中Xaa2选自低溶解性的氨基酸(例如,Xaa2选自K);或者其中Xaa3选自低平均柔性的氨基酸(例如,Xaa3选自W、M或F);或者其中Xaa3选自高溶解性的氨基酸(例如,Xaa3选自M);或者其中Xaa4选自高表面可接近性的氨基酸(例如,Xaa4选自K或R);或者其中Xaa4选自高平均柔性的氨基酸(例如,Xaa4选自K、I或N);或者其中Xaa5选自中等可突变性的氨基酸(例如,Xaa5选自R或H);或者其中Xaa5选自高goldman engelmansteitz的氨基酸(例如,Xaa5选自V或L);或者其中Xaa5选自低亲疏水性的氨基酸(例如,Xaa5选自R);或者其中Xaa5选自高体积的氨基酸(例如,Xaa5选自Y、R或F);或者其中Xaa6选自高溶解性的氨基酸(例如,Xaa6选自Y、V、M、A或C);或者其中Xaa7选自中等可突变性的氨基酸(例如,Xaa7选自V、H或R);或者其中Xaa7选自低溶解性的氨基酸(例如,Xaa7选自R);或者其中Xaa8选自高平均柔性的氨基酸(例如,Xaa8选自K、I或N);或者其中Xaa8选自高摩尔质量的氨基酸(例如,Xaa8选自R或Y);或者其中Xaa9选自高可突变性的氨基酸(例如,Xaa9选自N);或它们的任何组合。
在一些实施方案中,Xaa1选自低摩尔质量的氨基酸。在一些实施方案中,Xaa1选自V、P、S或C。在一些实施方案中,Xaa1选自低亲疏水性的氨基酸。在一些实施方案中,Xaa1选自T、S、W或Y。在一些实施方案中,Xaa2选自低亲疏水性的氨基酸。在一些实施方案中,Xaa2选自R。在一些实施方案中,Xaa2选自低可突变性的氨基酸。在一些实施方案中,Xaa2选自C。在一些实施方案中,Xaa2选自低溶解性的氨基酸。在一些实施方案中,Xaa2选自K。在一些实施方案中,Xaa3选自低平均柔性的氨基酸。在一些实施方案中,Xaa3选自W、M或F。在一些实施方案中,Xaa3选自高溶解性的氨基酸。在一些实施方案中,Xaa3选自M。在一些实施方案中,Xaa4选自高表面可接近性的氨基酸。在一些实施方案中,Xaa4选自K或R。在一些实施方案中,Xaa4选自高平均柔性的氨基酸。在一些实施方案中,Xaa4选自K、I或N。在一些实施方案中,Xaa5选自中等可突变性的氨基酸。在一些实施方案中,Xaa5选自R、H。在一些实施方案中,Xaa5选自高goldman engelman steitz的氨基酸。在一些实施方案中,Xaa5选自V、L。在一些实施方案中,Xaa5选自低亲疏水性的氨基酸。在一些实施方案中,Xaa5选自R。在一些实施方案中,Xaa5选自高体积的氨基酸。在一些实施方案中,Xaa5选自Y、R或F。在一些实施方案中,Xaa6选自高溶解性的氨基酸。在一些实施方案中,Xaa6选自Y、V、M、A或C。在一些实施方案中,Xaa7选自中等可突变性的氨基酸。在一些实施方案中,Xaa7选自V、H或R。在一些实施方案中,Xaa7选自低溶解性的氨基酸。在一些实施方案中,Xaa7选自R。在一些实施方案中,Xaa8选自高平均柔性的氨基酸。在一些实施方案中,Xaa8选自K、I或N。在一些实施方案中,Xaa8选自高摩尔质量的氨基酸。在一些实施方案中,Xaa8选自R或Y。在一些实施方案中,Xaa9选自高可突变性的氨基酸。在一些实施方案中,Xaa9选自N。
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:2118-SEQ ID NO:3117的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的肾上腺组织嗜性。
C.富集的肾上腺序列
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:3118-SEQ ID NO:4117的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的肾上腺组织嗜性。
6.7.9.体内选定的赋予增加的坐骨神经嗜性的突变VP多肽
本公开提供了具有VP衣壳多肽的AAV5病毒体,所述VP衣壳多肽在具有与靶细胞(例如,目标靶坐骨神经组织中的靶坐骨神经细胞)相互作用的残基的区域中具有至少一个突变,其中与野生型VP衣壳多肽相比,所述至少一个突变赋予增加的坐骨神经组织嗜性。在一些实施方案中,本文提供了与SEQ ID NO:1具有至少80%序列同源性的AAV5 VP1衣壳多肽,其中所述AAV5 VP1衣壳多肽在从对应于SEQ ID NO:1的581的位置至对应于589的位置的区域中具有至少一个突变,并且其中所述至少一个突变驱动增加的坐骨神经嗜性。以下序列规则和序列也适用于对应于AAV5 VP1氨基酸残基581至589的AAV5 VP2(氨基酸残基445至453;VP2序列显示于SEQ ID NO:111 5)和AAV5 VP3(氨基酸残基389至397;VP3序列显示于SEQ ID NO:1116)中的区域。因此,本公开涵盖在对应于581至589区域的AAV5 VP1氨基酸残基的VP2和VP3区域中具有一个或多个突变的AAV5 VP2衣壳多肽和AAV5 VP3衣壳多肽,其中所述一个或多个突变与以下章节中的规则或顺序相称。
A.位置频率规则
在本章节中,除非另外说明,否则分析相对于给定氨基酸残基出现在所有其他所收获组织(CNS(前脑皮层、枕叶皮层、颞叶皮层、丘脑、下丘脑、黑质、海马DG、海马CA1、海马CA3、小脑)、肝脏、骨骼肌、心脏、肺、脾脏、淋巴结、骨髓、乳腺、皮肤、肾上腺、甲状腺、结肠和脊髓组织)中鉴定的变体中指定位置的频率而言该给定氨基酸残基出现在坐骨神经中鉴定的变体中对应于SEQ ID NO:1(推及于SEQ ID NO:2)的位置581至位置589的所述指定位置的频率,以确定优先靶向坐骨神经组织的衣壳的一组序列规则。来自体内数据的位置频率规则的确定详细描述于实施例8中。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的坐骨神经组织嗜性,其中工程化变体AAV5VP1衣壳多肽序列具有一个或多个突变,其中Xaa1选自C、G、K、M、Q、R或Y,或Xaa1选自C、R或Q,或Xaa1为C;或Xaa2选自A、C、F、I、Q、T或V,或Xaa2选自A、C或I,或Xaa2为A;或Xaa3选自A、F、I、M、R、S或T,或Xaa3选自F、M、R或S,或Xaa3为R;或Xaa4选自E、N、T、Q或V,或Xaa4选自E、T或V,或Xaa4为T;或Xaa5选自F、H、Q、S、V或Y,或Xaa5选自F、V或Y,或Xaa5为V;或Xaa6选自K、M、N、Q、S或V,或Xaa6选自M、N或S,或Xaa6为N;或Xaa7选自K、M、Q、R或T,或Xaa7选自M、Q或T,或Xaa7为M;或Xaa8选自A、G、H、Q、S或V,或Xaa8选自H或S,或Xaa8为H;或Xaa9选自C、E、I、K或R,或Xaa9选自C、I或K,或Xaa9为I。
本文是能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的坐骨神经组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变选自以下规则。在一些实施方案中,Xaa1选自C、G、K、M、Q、R或Y。在一些实施方案中,Xaa1选自C、R或Q。在一些实施方案中,Xaa1为C。在一些实施方案中,Xaa2选自A、C、F、I、Q、T或V。在一些实施方案中,Xaa2选自A、C或I。在一些实施方案中,Xaa2为A。在一些实施方案中,Xaa3选自A、F、I、M、R、S或T。在一些实施方案中,Xaa3选自F、M、R或S。在一些实施方案中,Xaa3为R。在一些实施方案中,Xaa4选自E、N、T、Q或V。在一些实施方案中,Xaa4选自E、T或V。在一些实施方案中,Xaa4为T。在一些实施方案中,Xaa5选自F、H、Q、S、V或Y。在一些实施方案中,Xaa5选自F、V或Y。在一些实施方案中,Xaa5为V。在一些实施方案中,Xaa6选自K、M、N、Q、S或V。在一些实施方案中,Xaa6选自M、N或S。在一些实施方案中,Xaa6为N。在一些实施方案中,Xaa7选自K、M、Q、R或T。在一些实施方案中,Xaa7选自M、Q或T。在一些实施方案中,Xaa7为M。在一些实施方案中,Xaa8选自A、G、H、Q、S或V。在一些实施方案中,Xaa8选自H或S。在一些实施方案中,Xaa8为H。在一些实施方案中,Xaa9选自C、E、I、K或R。在一些实施方案中,Xaa9选自C、I或K。在一些实施方案中,Xaa9为I。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的坐骨神经组织嗜性,其中工程化变体AAV5VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变选自以下规则:Xaa1选自C、G、K、M、Q、R或Y,Xaa2选自A、C、F、I、Q、T或V,Xaa3选自A、F、I、M、R、S或T,Xaa4选自E、N、T、Q或V,Xaa5选自F、H、Q、S、V或Y,Xaa6选自K、M、N、Q、S或V,Xaa7选自K、M、Q、R或T,Xaa8选自A、G、H、Q、S或V和Xaa9选自C、E、I、K或R。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的坐骨神经组织嗜性,其中工程化变体AAV5VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变如下:Xaa1选自C、G、K、M、Q、R或Y,Xaa2选自A、C、F、I、Q、T或V,Xaa3选自A、F、I、M、R、S或T,Xaa4选自E、N、T、Q或V,Xaa5选自F、H、Q、S、V或Y,Xaa6选自K、M、N、Q、S或V,Xaa7选自K、M、Q、R或T,Xaa8选自A、G、H、Q、S或V,Xaa9选自C、E、I、K或R,或它们的任何组合。
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:26118-SEQ ID NO:26990的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的坐骨神经组织嗜性。
B.ML规则
对于本段中描述的以下一组规则,使用体内数据和两个ML模型(描述于实施例38)确定工程化AAV5 VP1衣壳多肽的581至589区域中每个位置处的有利生物物理特性和有利氨基酸残基。本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与具有野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述组装的病毒体表现出增加的坐骨神经组织嗜性,其中工程化AAV5 VP衣壳多肽序列具有一个或多个突变,其中工程化AAV5 VP1衣壳多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中Xaa1选自高平均柔性的氨基酸(例如,Xaa1选自G或R);或者其中Xaa1选自低溶解性的氨基酸(例如,Xaa1选自R或Q);或者其中Xaa1选自低可突变性的氨基酸(例如,Xaa1选自C、L、F、Y、R、K、P或H);或者其中Xaa1选自高体积的氨基酸(例如,Xaa1选自Y、F);或者其中Xaa2选自高表面可接近性的氨基酸(例如,Xaa2选自E、R或K);或者其中Xaa3选自中等可突变性的氨基酸(例如,Xaa3选自H或R);或者其中Xaa3选自中等平均柔性的氨基酸(例如,Xaa3选自V或Y);或者其中Xaa4选自高可突变性的氨基酸(例如,Xaa4选自N);或者其中Xaa4选自高平均柔性的氨基酸(例如,Xaa4选自I、N、G或R);或者其中Xaa4选自低溶解性的氨基酸(例如,Xaa4选自N);或者其中Xaa6选自低可突变性的氨基酸(例如,Xaa6选自C、L、F或Y);或者其中Xaa6选自高体积的氨基酸(例如,Xaa6选自K、M、I或L);或者其中Xaa7选自低可突变性的氨基酸(例如,Xaa7选自L、F或Y);或者其中Xaa7选自中等摩尔质量的氨基酸(例如,Xaa7选自D、I、L或N);或者其中Xaa8选自高表面可接近性的氨基酸(例如,Xaa8选自S、Y、T、D、P、H或N);或者其中Xaa9选自低可突变性的氨基酸(例如,Xaa9选自C、H、R);或者其中Xaa9选自中等溶解性的氨基酸(例如,Xaa9选自Q、T或C);或者其中Xaa9选自低表面可接近性的氨基酸(例如,Xaa9选自C);或它们的任何组合。
在一些实施方案中,Xaa1选自高平均柔性的氨基酸。在一些实施方案中,Xaa1选自G或R。在一些实施方案中,Xaa1选自低溶解性的氨基酸。在一些实施方案中,Xaa1选自R或Q。在一些实施方案中,Xaa1选自低可突变性的氨基酸。在一些实施方案中,Xaa1选自C、L、F、Y、R、K、P或H。在一些实施方案中,Xaa1选自高体积的氨基酸。在一些实施方案中,Xaa1选自Y或F。在一些实施方案中,Xaa2选自高表面可接近性的氨基酸。在一些实施方案中,Xaa2选自E、R或K。在一些实施方案中,Xaa3选自中等可突变性的氨基酸。在一些实施方案中,Xaa3选自H或R。在一些实施方案中,Xaa3选自中等平均柔性的氨基酸。在一些实施方案中,Xaa3选自V或Y。在一些实施方案中,Xaa4选自高可突变性的氨基酸。在一些实施方案中,Xaa4选自N。在一些实施方案中,Xaa4选自高平均柔性的氨基酸。在一些实施方案中,Xaa4选自I、N、G或R。在一些实施方案中,Xaa4选自低溶解性的氨基酸。在一些实施方案中,Xaa4选自N。在一些实施方案中,Xaa6选自低可突变性的氨基酸。在一些实施方案中,Xaa6选自C、L、F或Y。在一些实施方案中,Xaa6选自高体积的氨基酸。在一些实施方案中,Xaa6选自K、M、I或L。在一些实施方案中,Xaa7选自低可突变性的氨基酸。在一些实施方案中,Xaa7选自L、F或Y。在一些实施方案中,Xaa7选自中等摩尔质量的氨基酸。在一些实施方案中,Xaa7选自D、I、L或N。在一些实施方案中,Xaa8选自高表面可接近性的氨基酸。在一些实施方案中,Xaa8选自S、Y、T、D、P、H或N。在一些实施方案中,Xaa9选自低可突变性的氨基酸。在一些实施方案中,Xaa9选自C、H或R。在一些实施方案中,Xaa9选自中等溶解性的氨基酸。在一些实施方案中,Xaa9选自Q、T或C。在一些实施方案中,Xaa9选自低表面可接近性的氨基酸。在一些实施方案中,Xaa9选自C。
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:26991-SEQ ID NO:27990的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的坐骨神经组织嗜性。
C.富集的坐骨神经序列
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:27991-SEQ ID NO:28990的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的坐骨神经组织嗜性。
6.7.10.体内选定的赋予增加的骨骼肌嗜性的突变VP多肽
本公开提供了具有VP衣壳多肽的AAV5病毒体,所述VP衣壳多肽在具有与靶细胞(例如,目标靶骨骼肌组织中的靶骨骼肌细胞)相互作用的残基的区域中具有至少一个突变,其中与野生型VP衣壳多肽相比,所述至少一个突变赋予增加的骨骼肌组织嗜性。在一些实施方案中,本文提供了与SEQ ID NO:1具有至少80%序列同源性的AAV5 VP1衣壳多肽,其中所述AAV5 VP1衣壳多肽在从对应于SEQ ID NO:1的581的位置至对应于589的位置的区域中具有至少一个突变,并且其中所述至少一个突变驱动增加的骨骼肌嗜性。以下序列规则和序列也适用于对应于AAV5 VP1氨基酸残基581至589的AAV5 VP2(氨基酸残基445至453;VP2序列显示于SEQ ID NO:111 5)和AAV5 VP3(氨基酸残基389至397;VP3序列显示于SEQID NO:1116)中的区域。因此,本公开涵盖在对应于581至589区域的AAV5 VP1氨基酸残基的VP2和VP3区域中具有一个或多个突变的AAV5 VP2衣壳多肽和AAV5 VP3衣壳多肽,其中所述一个或多个突变与以下章节中的规则或顺序相称。
A.位置频率规则
在本章节中,除非另外说明,否则分析相对于给定氨基酸残基出现在所有其他所收获组织(CNS(前脑皮层、枕叶皮层、颞叶皮层、丘脑、下丘脑、黑质、海马DG、海马CA1、海马CA3、小脑)、肝脏、心脏、肺、脾脏、淋巴结、骨髓、乳腺、皮肤、肾上腺、甲状腺、结肠、坐骨神经和脊髓组织)中鉴定的变体中指定位置的频率而言该给定氨基酸残基出现在骨骼肌中鉴定的变体中对应于SEQ ID NO:1(推及于SEQ ID NO:2)的位置581至位置589的所述指定位置的频率,以确定优先靶向骨骼肌组织的衣壳的一组序列规则。来自体内数据的位置频率规则的确定详细描述于实施例9中。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的骨骼肌组织嗜性,其中工程化变体AAV5VP1衣壳多肽序列具有一个或多个突变,其中Xaa1选自A、E、H、M、P、Q或S,或Xaa1选自P或Q,或Xaa1为Q;或Xaa2选自F、H、I、T或V,或Xaa2选自T或V,或Xaa2为V;或Xaa3选自A、G、I、K、M、Q、R、S、T或V,或Xaa3选自A、L、P、R或T,或Xaa3选自L、P或T,或Xaa3为P;或Xaa4选自D、E、G、P或S,或Xaa4选自D、E或S,或Xaa4为E;或Xaa5选自H、L、M、P或V,或Xaa5选自L、M或V,或Xaa5为L;或Xaa6选自E、H、N或P,或Xaa6为P;或Xaa7选自A、H、N、Q或T,或Xaa7为H;或Xaa8选自I、K、M、P或W,或Xaa8选自I、P或W,或Xaa8为P;或Xaa9选自A、I、M、P或V,或Xaa9选自A、M或P,或Xaa9为M。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的骨骼肌组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变选自以下规则。在一些实施方案中,Xaa1选自A、E、H、M、P、Q或S。在一些实施方案中,Xaa1选自P或Q。在一些实施方案中,Xaa1为Q。在一些实施方案中,Xaa2选自F、H、I、T或V。在一些实施方案中,Xaa2选自T或V。在一些实施方案中,Xaa2为V。在一些实施方案中,Xaa3选自A、G、I、K、M、Q、R、S、T或V。在一些实施方案中,Xaa3选自A、L、P、R或T。在一些实施方案中,Xaa3选自L、P或T。在一些实施方案中,Xaa3为P。在一些实施方案中,Xaa4选自D、E、G、P或S。在一些实施方案中,Xaa4选自D、E或S。在一些实施方案中,Xaa4为E。在一些实施方案中,Xaa5选自H、L、M、P或V。在一些实施方案中,Xaa5选自L、M或V。在一些实施方案中,Xaa5为L。在一些实施方案中,Xaa6选自E、H、N或P。在一些实施方案中,Xaa6为P。在一些实施方案中,Xaa7选自A、H、N、Q或T。在一些实施方案中,Xaa7为H。在一些实施方案中,Xaa8选自I、K、M、P或W。在一些实施方案中,Xaa8选自I、P或W。在一些实施方案中,Xaa8为P。在一些实施方案中,Xaa9选自A、I、M、P或V。在一些实施方案中,Xaa9选自A、M或P。在一些实施方案中,Xaa9为M。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的骨骼肌组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变选自以下规则:Xaa1选自A、E、H、M、P、Q或S,Xaa2选自F、H、I、T或V,Xaa3选自A、G、I、K、M、Q、R、S、T或V,Xaa4选自D、E、G、P或S,Xaa5选自H、L、M、P或V,Xaa6选自E、H、N或P,Xaa7选自A、H、N、Q或T,Xaa8选自I、K、M、P或W,并且Xaa9选自A、I、M、P或V。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的骨骼肌组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变如下:Xaa1选自A、E、H、M、P、Q或S,Xaa2选自F、H、I、T或V,Xaa3选自A、G、I、K、M、Q、R、S、T或V,Xaa4选自D、E、G、P或S,Xaa5选自H、L、M、P或V,Xaa6选自E、H、N或P,Xaa7选自A、H、N、Q或T,Xaa8选自I、K、M、P或W,Xaa9选自A、I、M、P或V,或它们的任何组合。
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:28991-SEQ ID NO:29990的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的骨骼肌组织嗜性。
B.ML规则
对于本段中描述的以下一组规则,使用体内数据和两个ML模型(描述于实施例39)确定工程化AAV5 VP1衣壳多肽的581至589区域中每个位置处的有利生物物理特性和有利氨基酸残基。本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与具有野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述组装的病毒体表现出增加的骨骼肌组织嗜性,其中工程化AAV5 VP衣壳多肽序列具有一个或多个突变,其中工程化AAV5 VP1衣壳多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中Xaa1选自高平均柔性的氨基酸(例如,Xaa1选自G或R);或者其中Xaa1选自低平均柔性的氨基酸(例如,Xaa1选自W、M、F或H);或者其中Xaa1选自高摩尔质量的氨基酸(例如,Xaa1选自R、F或W);或者其中Xaa2选自低亲疏水性的氨基酸(例如,Xaa2选自K或R);或者其中Xaa2选自低可突变性的氨基酸(例如,Xaa2选自C、R或H);或者其中Xaa2选自高平均柔性的氨基酸(例如,Xaa2选自G或R);或者其中Xaa3选自高平均柔性的氨基酸(例如,Xaa3选自G或R);或者其中Xaa4选自高亲水性的氨基酸(例如,Xaa4选自D、E、R、K或N);或者其中Xaa4选自低可突变性的氨基酸(例如,Xaa4选自C、R、H);或者其中Xaa5选自低摩尔质量的氨基酸(例如,Xaa5选自A);或者其中Xaa5选自低平均柔性的氨基酸(例如,Xaa5选自A或L);或者其中Xaa5选自高可突变性的氨基酸(例如,Xaa5选自D、A或E);或者其中Xaa6选自低平均柔性的氨基酸(例如,Xaa6选自W、M或F);或者其中Xaa6选自低可突变性的氨基酸(例如,Xaa6选自C);或者其中Xaa6选自高摩尔质量的氨基酸(例如,Xaa6选自W);或者其中Xaa7选自低goldman engelman steitz的氨基酸(例如,Xaa7选自R);或者其中Xaa7选自高平均柔性的氨基酸(例如,Xaa7选自D、R、P、G或S);或者其中Xaa7选自高可突变性的氨基酸(例如,Xaa7选自R、H或N);或者其中Xaa7选自低溶解性的氨基酸(例如,Xaa7选自R或Q);或者其中Xaa8选自高亲水性的氨基酸(例如,Xaa8选自D、E、R、K或N);或者其中Xaa9选自低可突变性的氨基酸(例如,Xaa9选自Y、F或L);或它们的任何组合。
在一些实施方案中,Xaa1选自高平均柔性的氨基酸。在一些实施方案中,Xaa1选自G或R。在一些实施方案中,Xaa1选自低平均柔性的氨基酸。在一些实施方案中,Xaa1选自W、M、F或H。在一些实施方案中,Xaa1选自高摩尔质量的氨基酸。在一些实施方案中,Xaa1选自R、F或W。在一些实施方案中,Xaa2选自低亲疏水性的氨基酸。在一些实施方案中,Xaa2选自K或R。在一些实施方案中,Xaa2选自低可突变性的氨基酸。在一些实施方案中,Xaa2选自C、R或H。在一些实施方案中,Xaa2选自高平均柔性的氨基酸。在一些实施方案中,Xaa2选自G或R。在一些实施方案中,Xaa3选自高平均柔性的氨基酸。在一些实施方案中,Xaa3选自G或R。在一些实施方案中,Xaa4选自高亲水性的氨基酸。在一些实施方案中,Xaa4选自D、E、R、K或N。在一些实施方案中,Xaa4选自低可突变性的氨基酸。在一些实施方案中,Xaa4选自C、R或H。在一些实施方案中,Xaa5选自低摩尔质量的氨基酸。在一些实施方案中,Xaa5选自A。在一些实施方案中,Xaa5选自低平均柔性的氨基酸。在一些实施方案中,Xaa5选自A或L。在一些实施方案中,Xaa5选自高可突变性的氨基酸。在一些实施方案中,Xaa5选自D、A或E。在一些实施方案中,Xaa6选自低平均柔性的氨基酸。在一些实施方案中,Xaa6选自W、M或F。在一些实施方案中,Xaa6选自低可突变性的氨基酸。在一些实施方案中,Xaa6选自C。在一些实施方案中,Xaa6选自高摩尔质量的氨基酸。在一些实施方案中,Xaa6选自W。在一些实施方案中,Xaa7选自低goldman engelman steitz的氨基酸。在一些实施方案中,Xaa7选自R。在一些实施方案中,Xaa7选自高平均柔性的氨基酸。在一些实施方案中,Xaa7选自D、R、P、G或S。在一些实施方案中,Xaa7选自高可突变性的氨基酸。在一些实施方案中,Xaa7选自R、H或N。在一些实施方案中,Xaa7选自低溶解性的氨基酸。在一些实施方案中,Xaa7选自R或Q。在一些实施方案中,Xaa8选自高亲水性的氨基酸。在一些实施方案中,Xaa8选自D、E、R、K或N。在一些实施方案中,Xaa9选自低可突变性的氨基酸。在一些实施方案中,Xaa9选自Y、F或L。
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:29991-SEQ ID NO:30990的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的骨骼肌组织嗜性。
C.富集的骨骼肌序列
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:30991-SEQ ID NO:31990的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的骨骼肌组织嗜性。
6.7.11.体内选定的赋予增加的脊髓嗜性的突变VP多肽
本公开提供了具有VP衣壳多肽的AAV5病毒体,所述VP衣壳多肽在具有与靶细胞(例如,目标靶脊髓组织中的靶脊髓细胞)相互作用的残基的区域中具有至少一个突变,其中与野生型VP衣壳多肽相比,所述至少一个突变赋予增加的CNS组织嗜性。在一些实施方案中,本文提供了与SEQ ID NO:1具有至少80%序列同源性的AAV5VP1衣壳多肽,其中所述AAV5 VP1衣壳多肽在从对应于SEQ ID NO:1的581的位置至对应于589的位置的区域中具有至少一个突变,并且其中所述至少一个突变驱动增加的脊髓嗜性。以下序列规则和序列也适用于对应于AAV5 VP1氨基酸残基581至589的AAV5 VP2(氨基酸残基445至453;VP2序列显示于SEQ ID NO:1115)和AAV5 VP3(氨基酸残基389至397;VP3序列显示于SEQ ID NO:1116)中的区域。因此,本公开涵盖在对应于581至589区域的AAV5 VP1氨基酸残基的VP2和VP3区域中具有一个或多个突变的AAV5 VP2衣壳多肽和AAV5 VP3衣壳多肽,其中所述一个或多个突变与以下章节中的规则或顺序相称。
A.位置频率规则
在本章节中,除非另外说明,否则分析相对于给定氨基酸残基出现在所有其他所收获组织(CNS(前脑皮层、枕叶皮层、颞叶皮层、丘脑、下丘脑、黑质、海马DG、海马CA1、海马CA3、小脑)、肝脏、骨骼肌、心脏、肺、脾脏、淋巴结、骨髓、乳腺、皮肤、肾上腺、甲状腺、结肠和坐骨神经组织)中鉴定的变体中指定位置的频率而言该给定氨基酸残基出现在脊髓中鉴定的变体中对应于SEQ ID NO:l(推及于SEQ ID NO:2)的位置581至位置589的所述指定位置的频率,以确定优先靶向脊髓组织的衣壳的一组序列规则。来自体内数据的位置频率规则的确定详细描述于实施例10中。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的脊髓组织嗜性,其中工程化变体AAV5 VP1衣壳多肽序列具有一个或多个突变,其中Xaa1选自A、C、K、Q、R、S或W,或Xaa1选自K、R或W,或Xaa1为K;或Xaa2选自H、I、K、L、T、V或W,或Xaa2选自H、I或T,或Xaa2为I;或Xaa3选自C、F、G、H、I、K、N或R,或Xaa3选自F、I或R,或Xaa3为I;或Xaa4选自I、M、Q、S或V,或Xaa4选自I、M或V,或Xaa4为V;或Xaa5选自H、K、Q、T、W或Y,或Xaa5选自T、W或Y,或Xaa5为Y;或Xaa6选自H、L、N、Q、R、W或Y,或Xaa6选自L、N、R或Y,或Xaa6为Y;或Xaa7选自D、H、P、Q或R,或Xaa7为R;或Xaa8选自D、F、L、S、T或Y,或Xaa8选自S、T或Y,或Xaa8为T;或Xaa9选自C、I、N、P、R、S或Y,或Xaa9选自I、P或R,或Xaa9为I。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的脊髓组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变选自以下规则。在一些实施方案中,Xaa1选自A、C、K、Q、R、S或W。在一些实施方案中,Xaa1选自K、R或W。在一些实施方案中,Xaa1为K。在一些实施方案中,Xaa2选自H、I、K、L、T、V或W。在一些实施方案中,Xaa2选自H、I或T。在一些实施方案中,Xaa2为I。在一些实施方案中,Xaa3选自C、F、G、H、I、K、N或R。在一些实施方案中,Xaa3选自F、I或R。在一些实施方案中,Xaa3为I。在一些实施方案中,Xaa4选自I、M、Q、S或V。在一些实施方案中,Xaa4选自I、M或V。在一些实施方案中,Xaa4为V。在一些实施方案中,Xaa5选自H、K、Q、T、W或Y。在一些实施方案中,Xaa5选自T、W或Y。在一些实施方案中,Xaa5为Y。在一些实施方案中,Xaa6选自H、L、N、Q、R、W或Y。在一些实施方案中,Xaa6选自L、N、R或Y。在一些实施方案中,Xaa6为Y。在一些实施方案中,Xaa7选自D、H、P、Q或R。在一些实施方案中,Xaa7为R。在一些实施方案中,Xaa8选自D、F、L、S、T或Y。在一些实施方案中,Xaa8选自S、T或Y。在一些实施方案中,Xaa8为T。在一些实施方案中,Xaa9选自C、I、N、P、R、S或Y。在一些实施方案中,Xaa9选自I、P或R。在一些实施方案中,Xaa9为I。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的脊髓组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变选自以下规则:Xaa1选自A、C、K、Q、R、S或W,Xaa2选自H、I、K、L、T、V或W,Xaa3选自C、F、G、H、I、K、N或R,Xaa4选自I、M、Q、S或V,Xaa5选自H、K、Q、T、W或Y,Xaa6选自H、L、N、Q、R、W或Y,Xaa7选自D、H、P、Q或R,Xaa8选自D、F、L、S、T或Y,并且Xaa9选自C、I、N、P、R、S或Y。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的脊髓组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变如下:Xaa1选自A、C、K、Q、R、S或W,Xaa2选自H、I、K、L、T、V或W,Xaa3选自C、F、G、H、I、K、N或R,Xaa4选自I、M、Q、S或V,Xaa5选自H、K、Q、T、W或Y,Xaa6选自H、L、N、Q、R、W或Y,Xaa7选自D、H、P、Q或R,Xaa8选自D、F、L、S、T或Y,Xaa9选自C、I、N、P、R、S或Y,或它们的任何组合。
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:34991-SEQ ID NO:35437的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的脊髓组织嗜性。
B.ML规则
对于本段中描述的以下一组规则,使用体内数据和两个ML模型(描述于实施例41)确定工程化AAV5 VP1衣壳多肽的581至589区域中每个位置处的有利生物物理特性和有利氨基酸残基。本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与具有野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述组装的病毒体表现出增加的脊髓组织嗜性,其中工程化AAV5 VP衣壳多肽序列具有一个或多个突变,其中工程化AAV5 VP1衣壳多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中Xaa1选自高体积的氨基酸(例如,Xaa1选自F、W或Y);或者其中Xaa1选自低可突变性的氨基酸(例如,Xaa1选自Y、F、L或C);或者其中Xaa1选自高溶解性的氨基酸(例如,Xaa1选自W、F、I或L);或者其中Xaa1选自低平均柔性的氨基酸(例如,Xaa1选自F、M或W);或者其中Xaa2选自低亲疏水性的氨基酸(例如,Xaa2选自P或Y);或者其中Xaa3选自低亲水性的氨基酸(例如,Xaa3选自Y、W、V、M、F、I或L);或者其中Xaa3选自高溶解性的氨基酸(例如,Xaa3选自W、F、I或L);或者其中Xaa6选自高体积的氨基酸(例如,Xaa6选自W、R、K、M、I或L);或者其中Xaa6选自高摩尔质量的氨基酸(例如,Xaa6选自W);或者其中Xaa8选自高摩尔质量的氨基酸(例如,Xaa8选自W、E、K、M、H或Q);或者其中Xaa8选自高体积的氨基酸(例如,Xaa8选自W、K、M、I或L);或者其中Xaa8选自高goldman engelman steitz的氨基酸(例如,Xaa8选自V或L);或者其中Xaa9选自高亲疏水性的氨基酸(例如,Xaa9选自V或I);或者其中Xaa9选自高溶解性的氨基酸(例如,Xaa9选自W、F、I或L);或它们的任何组合。
在一些实施方案中,Xaa1选自高体积的氨基酸。在一些实施方案中,Xaa1选自F、W或Y。在一些实施方案中,Xaa1选自低可突变性的氨基酸。在一些实施方案中,Xaa1选自Y、F、L或C。在一些实施方案中,Xaa1选自高溶解性的氨基酸。在一些实施方案中,Xaa1选自W、F、I或L。在一些实施方案中,Xaa1选自低平均柔性的氨基酸。在一些实施方案中,Xaa1选自F、M或W。在一些实施方案中,Xaa2选自低亲疏水性的氨基酸。在一些实施方案中,Xaa2选自P或Y。在一些实施方案中,Xaa3选自低亲水性的氨基酸。在一些实施方案中,Xaa3选自Y、W、V、M、F、I或L。在一些实施方案中,Xaa3选自高溶解性的氨基酸。在一些实施方案中,Xaa3选自W、F、I、L。在一些实施方案中,Xaa6选自高体积的氨基酸。在一些实施方案中,Xaa6选自W、R、K、M、I或L。在一些实施方案中,Xaa6选自高摩尔质量的氨基酸。在一些实施方案中,Xaa6选自W。在一些实施方案中,Xaa8选自高摩尔质量的氨基酸。在一些实施方案中,Xaa8选自W、E、K、M、H或Q。在一些实施方案中,Xaa8选自高体积的氨基酸。在一些实施方案中,Xaa8选自W、K、M、I、L。在一些实施方案中,Xaa8选自高goldman engelman steitz的氨基酸。在一些实施方案中,Xaa8选自V或L。在一些实施方案中,Xaa9选自高亲疏水性的氨基酸。在一些实施方案中,Xaa9选自V或I。在一些实施方案中,Xaa9选自高溶解性的氨基酸。在一些实施方案中,Xaa9选自W、F、I或L。
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:35438-SEQ ID NO:36437的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的脊髓组织嗜性。
C.富集的脊髓序列
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:36438-SEQ ID NO:37437的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的脊髓组织嗜性。
6.7.12.体内选定的赋予增加的乳腺嗜性的突变VP多肽
本公开提供了具有VP衣壳多肽的AAV5病毒体,所述VP衣壳多肽在具有与靶细胞(例如,目标靶乳腺组织中的靶乳腺细胞)相互作用的残基的区域中具有至少一个突变,其中与野生型VP衣壳多肽相比,所述至少一个突变赋予增加的乳腺组织嗜性。在一些实施方案中,本文提供了与SEQ ID NO:1具有至少80%序列同源性的AAV5 VP1衣壳多肽,其中所述AAV5 VP1衣壳多肽在从对应于SEQ ID NO:1的581的位置至对应于589的位置的区域中具有至少一个突变,并且其中所述至少一个突变驱动增加的乳腺嗜性。以下序列规则和序列也适用于对应于AAV5 VP1氨基酸残基581至589的AAV5 VP2(氨基酸残基445至453;VP2序列显示于SEQ ID NO:1115)和AAV5 VP3(氨基酸残基389至397;VP3序列显示于SEQ ID NO:1116)中的区域。因此,本公开涵盖在对应于581至589区域的AAV5 VP1氨基酸残基的VP2和VP3区域中具有一个或多个突变的AAV5 VP2衣壳多肽和AAV5 VP3衣壳多肽,其中所述一个或多个突变与以下章节中的规则或顺序相称。
A.位置频率规则
在本章节中,除非另外说明,否则分析相对于给定氨基酸残基出现在所有其他所收获组织(CNS(前脑皮层、枕叶皮层、颞叶皮层、丘脑、下丘脑、黑质、海马DG、海马CA1、海马CA3、小脑)、肝脏、骨骼肌、心脏、肺、脾脏、淋巴结、骨髓、皮肤、肾上腺、甲状腺、结肠、坐骨神经和脊髓组织)中鉴定的变体中指定位置的频率而言该给定氨基酸残基出现在乳腺中鉴定的变体中对应于SEQ ID NO:1(推及于SEQ ID NO:2)的位置581至位置589的所述指定位置的频率,以确定优先靶向乳腺组织的衣壳的一组序列规则。来自体内数据的位置频率规则的确定详细描述于实施例11中。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的乳腺组织嗜性,其中工程化变体AAV5 VP1衣壳多肽序列具有一个或多个突变,其中Xaa1选自C、K、M、Q、R或Y,或Xaa1选自C、Q或R,或Xaa1为C;或Xaa2选自A、F、I、K、S、T或V,或Xaa2选自A、S或V,或Xaa2为V;或Xaa3选自A、F、G、I、K、L、R、T或Y,或Xaa3选自F、G、K、R或Y,或Xaa3选自F、K或Y,或Xaa3为F;或Xaa4选自A、I、K、Q、R或T,或Xaa4选自A、I或R,或Xaa4为I;或Xaa5选自I、L、M、Q、R、T、V或Y,或Xaa5选自I、M或Y,或Xaa5为Y;或Xaa6选自H、N、S或V,或Xaa6为H;或Xaa7选自A、H、I、N、S或Y,或Xaa7为N或S,或Xaa7为N;或Xaa8选自A、C、D、G、H、M、Q或S,或Xaa8选自G、M或Q,或Xaa8为G;或Xaa9选自A、E、L、W或Y,或Xaa9选自A、L或W,或Xaa9为A。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的乳腺组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变选自以下规则。在一些实施方案中,Xaa1选自C、K、M、Q、R或Y。在一些实施方案中,Xaa1选自C、Q或R。在一些实施方案中,Xaa1为C。在一些实施方案中,Xaa2选自A、F、I、K、S、T或V。在一些实施方案中,Xaa2选自A、S或V。在一些实施方案中,Xaa2为V。在一些实施方案中,Xaa3选自A、F、G、I、K、L、R、T或Y。在一些实施方案中,Xaa3选自F、G、K、R或Y。在一些实施方案中,Xaa3选自F、K或Y。在一些实施方案中,Xaa3为F。在一些实施方案中,Xaa4选自A、I、K、Q、R或T。在一些实施方案中,Xaa4选自A、I或R。在一些实施方案中,Xaa4为I。在一些实施方案中,Xaa5选自I、L、M、Q、R、T、V或Y。在一些实施方案中,Xaa5选自I、M或Y。在一些实施方案中,Xaa5为Y。在一些实施方案中,Xaa6选自H、N、S或V。在一些实施方案中,Xaa6为H。在一些实施方案中,Xaa7选自A、H、I、N、S或Y。在一些实施方案中,Xaa7为N或S。在一些实施方案中,Xaa7为N。在一些实施方案中,Xaa8选自A、C、D、G、H、M、Q或S。在一些实施方案中,Xaa8选自G、M或Q。在一些实施方案中,Xaa8为G。在一些实施方案中,Xaa9选自A、E、L、W或Y。在一些实施方案中,Xaa9选自A、L或W。在一些实施方案中,Xaa9为A。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的乳腺组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变选自以下规则:Xaa1选自C、K、M、Q、R或Y,Xaa2选自A、F、I、K、S、T或V,Xaa3选自A、F、G、I、K、L、R、T或Y,Xaa4选自A、I、K、Q、R或T,Xaa5选自I、L、M、Q、R、T、V或Y,Xaa6选自H、N、S或V,Xaa7选自A、H、I、N、S或Y,Xaa8选自A、C、D、G、H、M、Q或S,并且Xaa9选自A、E、L、W或Y。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的乳腺组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变如下:Xaa1选自C、K、M、Q、R或Y,Xaa2选自A、F、I、K、S、T或V,Xaa3选自A、F、G、I、K、L、R、T或Y,Xaa4选自A、I、K、Q、R或T,Xaa5选自I、L、M、Q、R、T、V或Y,Xaa6选自H、N、S或V,Xaa7选自A、H、I、N、S或Y,Xaa8选自A、C、D、G、H、M、Q或S,Xaa9选自A、E、L、W或Y,或它们的任何组合。
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:22118-SEQ ID NO:23117的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的乳腺组织嗜性。
B.ML规则
对于本段中描述的以下一组规则,使用体内数据和两个ML模型(描述于实施例36)确定工程化AAV5 VP1衣壳多肽的581至589区域中每个位置处的有利生物物理特性和有利氨基酸残基。本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与具有野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述组装的病毒体表现出增加的乳腺组织嗜性,其中工程化AAV5 VP衣壳多肽序列具有一个或多个突变,其中工程化AAV5 VP1衣壳多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中Xaa1选自低表面可接近性的氨基酸(例如,Xaa1选自C);或者其中Xaa1选自中等摩尔质量的氨基酸(例如,Xaa1选自C);或者其中Xaa2选自高表面可接近性的氨基酸(例如,Xaa2选自D、N或Q);或者其中Xaa2选自低亲疏水性的氨基酸(例如,Xaa2选自D、E、R、K、H、N或Q);或者其中Xaa3选自高平均柔性的氨基酸(例如,Xaa3选自D、E、R、P、G或S);或者其中Xaa3选自中等可突变性的氨基酸(例如,Xaa3选自R或H);或者其中Xaa4选自高可突变性的氨基酸(例如,Xaa4选自M、I、Q或T);或者其中Xaa4选自高溶解性的氨基酸(例如,Xaa4选自W、F、I或L);或者其中Xaa4选自高表面可接近性的氨基酸(例如,Xaa4选自E、R或K);或者其中Xaa5选自高溶解性的氨基酸(例如,Xaa5选自W、F、I或L);或者其中Xaa5选自低可突变性的氨基酸(例如,Xaa5选自Y、F或L);或者其中Xaa6选自高亲疏水性的氨基酸(例如,Xaa6选自V、I或L);或者其中Xaa6选自中等摩尔质量的氨基酸(例如,Xaa6选自D、I、L或N);或者其中Xaa8选自低表面可接近性的氨基酸(例如,Xaa8选自C);或者其中Xaa8选自低可突变性的氨基酸(例如,Xaa8选自C、R或H);或者其中Xaa9选自中等可突变性的氨基酸(例如,Xaa9选自R或H);或它们的任何组合。
在一些实施方案中,Xaa1选自低表面可接近性的氨基酸。在一些实施方案中,Xaa1选自C。在一些实施方案中,Xaa1选自中等摩尔质量的氨基酸。在一些实施方案中,Xaa1选自C。在一些实施方案中,Xaa2选自高表面可接近性的氨基酸。在一些实施方案中,Xaa2选自D、N或Q。在一些实施方案中,Xaa2选自低亲疏水性的氨基酸。在一些实施方案中,Xaa2选自D、E、R、K、H、N或Q。在一些实施方案中,Xaa3选自高平均柔性的氨基酸。在一些实施方案中,Xaa3选自D、E、R、P、G或S。在一些实施方案中,Xaa3选自中等可突变性的氨基酸。在一些实施方案中,Xaa3选自R或H。在一些实施方案中,Xaa4选自高可突变性的氨基酸。在一些实施方案中,Xaa4选自M、I、Q或T。在一些实施方案中,Xaa4选自高溶解性的氨基酸。在一些实施方案中,Xaa4选自W、F、I或L。在一些实施方案中,Xaa4选自高表面可接近性的氨基酸。在一些实施方案中,Xaa4选自E、R或K。在一些实施方案中,Xaa5选自高溶解性的氨基酸。在一些实施方案中,Xaa5选自W、F、I或L。在一些实施方案中,Xaa5选自低可突变性的氨基酸。在一些实施方案中,Xaa5选自Y、F或L。在一些实施方案中,Xaa6选自高亲疏水性的氨基酸。在一些实施方案中,Xaa6选自V、I或L。在一些实施方案中,Xaa6选自中等摩尔质量的氨基酸。在一些实施方案中,Xaa6选自D、I、L或N。在一些实施方案中,Xaa8选自低表面可接近性的氨基酸。在一些实施方案中,Xaa8选自C。在一些实施方案中,Xaa8选自低可突变性的氨基酸。在一些实施方案中,Xaa8选自C、R或H。在一些实施方案中,Xaa9选自中等可突变性的氨基酸。在一些实施方案中,Xaa9选自R或H。
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:23118-SEQ ID NO:24117的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的乳腺组织嗜性。
C.富集的乳腺序列
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:24118-SEQ ID NO:25117的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的乳腺组织嗜性。
6.7.13.体内选定的赋予增加的肺嗜性的突变VP多肽
本公开提供了具有VP衣壳多肽的AAV5病毒体,所述VP衣壳多肽在具有与靶细胞(例如,目标靶肺组织中的靶肺细胞)相互作用的残基的区域中具有至少一个突变,其中与野生型VP衣壳多肽相比,所述至少一个突变赋予增加的肺组织嗜性。在一些实施方案中,本文提供了与SEQ ID NO:1具有至少80%序列同源性的AAV5 VP1衣壳多肽,其中所述AAV5VP1衣壳多肽在从对应于SEQ ID NO:1的581的位置至对应于589的位置的区域中具有至少一个突变,并且其中所述至少一个突变驱动增加的肺嗜性。以下序列规则和序列也适用于对应于AAV5 VP1氨基酸残基581至589的AAV5 VP2(氨基酸残基445至453;VP2序列显示于SEQ ID NO:1115)和AAV5 VP3(氨基酸残基389至397;VP3序列显示于SEQ ID NO:1116)中的区域。因此,本公开涵盖在对应于581至589区域的AAV5 VP1氨基酸残基的VP2和VP3区域中具有一个或多个突变的AAV5 VP2衣壳多肽和AAV5VP3衣壳多肽,其中所述一个或多个突变与以下章节中的规则或顺序相称。
A.位置频率规则
在本章节中,除非另外说明,否则分析相对于给定氨基酸残基出现在所有其他所收获组织(CNS(前脑皮层、枕叶皮层、颞叶皮层、丘脑、下丘脑、黑质、海马DG、海马CA1、海马CA3、小脑)、肝脏、骨骼肌、心脏、脾脏、淋巴结、骨髓、乳腺、皮肤、肾上腺、甲状腺、结肠、坐骨神经和脊髓组织)中鉴定的变体中指定位置的频率而言该给定氨基酸残基出现在肺中鉴定的变体中对应于SEQ ID NO:1(推及于SEQ ID NO:2)的位置581至位置589的所述指定位置的频率,以确定优先靶向肺组织的衣壳的一组序列规则。来自体内数据的位置频率规则的确定详细描述于实施例12中。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的肺组织嗜性,其中工程化变体AAV5 VP1衣壳多肽序列具有一个或多个突变,其中Xaa1选自A、E、K、M、Q、R、S或T,或Xaa1选自A、E或Q,或Xaa1为E;或Xaa2选自A、I、K、S、T或V,或Xaa2选自S、T或V,或Xaa2为T;或Xaa3选自A、E、K、M、Q、R、S、T或V,或Xaa3选自A、K、R或S,或Xaa3为R;或Xaa4选自M、P、R、S或T,或Xaa4选自P、Q或T,或Xaa4为Q;或Xaa5选自I、K、L、M、T、V或Y,或Xaa5选自L、M或Y,或Xaa5为L;或Xaa6选自D、G、H、M、N、R或S,或Xaa6选自H或N,或Xaa6为N;或Xaa7选自A、K、M、Q或R,或Xaa7选自A、K或R,或Xaa7为R;或Xaa8选自A、F、G、S、W或Y,或Xaa8选自A、F或G,或Xaa8为F;或Xaa9选自A、E、G、P、R或Y,或Xaa9选自G、P或R,或Xaa9为G。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的肺组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变选自以下规则。在一些实施方案中,Xaa1选自A、E、K、M、Q、R、S或T。在一些实施方案中,Xaa1选自A、E或Q。在一些实施方案中,Xaa1为E。在一些实施方案中,Xaa2选自A、I、K、S、T或V。在一些实施方案中,Xaa2选自S、T或V。在一些实施方案中,Xaa2为T。在一些实施方案中,Xaa3选自A、E、K、M、Q、R、S、T或V。在一些实施方案中,Xaa3选自A、K、R或S。在一些实施方案中,Xaa3为R。在一些实施方案中,Xaa4选自M、P、R、S或T。在一些实施方案中,Xaa4选自P、Q或T。在一些实施方案中,Xaa4为Q。在一些实施方案中,Xaa5选自I、K、L、M、T、V或Y。在一些实施方案中,Xaa5选自L、M或Y。在一些实施方案中,Xaa5为L。在一些实施方案中,Xaa6选自D、G、H、M、N、R或S。在一些实施方案中,Xaa6选自H或N。在一些实施方案中,Xaa6为N。在一些实施方案中,Xaa7选自A、K、M、Q或R。在一些实施方案中,Xaa7选自A、K或R。在一些实施方案中,Xaa7为R。在一些实施方案中,Xaa8选自A、F、G、S、W或Y。在一些实施方案中,Xaa8选自A、F或G。在一些实施方案中,Xaa8为F。在一些实施方案中,Xaa9选自A、E、G、P、R或Y。在一些实施方案中,Xaa9选自G、P或R。在一些实施方案中,Xaa9为G。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的肺组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变选自以下规则:Xaa1选自A、E、K、M、Q、R、S或T,Xaa2选自A、I、K、S、T或V,Xaa3选自A、E、K、M、Q、R、S、T或V,Xaa4选自M、P、R、S或T,Xaa5选自I、K、L、M、T、V或Y,Xaa6选自D、G、H、M、N、R或S,Xaa7选自A、K、M、Q或R,Xaa8选自A、F、G、S、W或Y,并且Xaa9选自A、E、G、P、R或Y。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的肺组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变如下:Xaa1选自A、E、K、M、Q、R、S或T,Xaa2选自A、I、K、S、T或V,Xaa3选自A、E、K、M、Q、R、S、T或V,Xaa4选自M、P、R、S或T,Xaa5选自I、K、L、M、T、V或Y,Xaa6选自D、G、H、M、N、R或S,Xaa7选自A、K、M、Q或R,Xaa8选自A、F、G、S、W或Y,Xaa9选自A、E、G、P、R或Y,或它们的任何组合。
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:16118-SEQ ID NO:17117的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的肺组织嗜性。
B.ML规则
对于本段中描述的以下一组规则,使用体内数据和两个ML模型(描述于实施例37)确定工程化AAV5 VP1衣壳多肽的581至589区域中每个位置处的有利生物物理特性和有利氨基酸残基。本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与具有野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述组装的病毒体表现出增加的肺组织嗜性,其中工程化AAV5 VP衣壳多肽序列具有一个或多个突变,其中工程化AAV5 VP1衣壳多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中Xaa1选自高可突变性的氨基酸(例如,Xaa1选自D、E、M、A、I、Q或T);或者其中Xaa2选自高摩尔质量的氨基酸(例如,Xaa2选自F);或者其中Xaa2选自低可突变性的氨基酸(例如,Xaa2选自Y、F或L);或者其中Xaa3选自低可突变性的氨基酸(例如,Xaa3选自K、V、P或H);或者其中Xaa3选自低亲疏水性的氨基酸(例如,Xaa3选自K或R);或者其中Xaa4选自低可突变性的氨基酸(例如,Xaa4选自K或P);或者其中Xaa4选自高平均柔性的氨基酸(例如,Xaa4选自D、E、P或S);或者其中Xaa5选自低平均柔性的氨基酸(例如,Xaa5选自W、M或F);或者其中Xaa5选自高溶解性的氨基酸(例如,Xaa5选自W、F、I或L);或者其中Xaa6选自中等可突变性的氨基酸(例如,Xaa6选自R或H);或者其中Xaa6选自高表面可接近性的氨基酸(例如,Xaa6选自T);或者其中Xaa7选自低可突变性的氨基酸(例如,Xaa7选自C);或者其中Xaa7选自高溶解性的氨基酸(例如,Xaa7选自W、V、M、F、I或L);或者其中Xaa8选自高可突变性的氨基酸(例如,Xaa8选自D、E、M、A、I、Q或T);或者其中Xaa8选自低亲疏水性的氨基酸(例如,Xaa8选自R或K);或者其中Xaa9选自高平均柔性的氨基酸(例如,Xaa9选自R或G);或它们的任何组合。
在一些实施方案中,Xaa1选自高可突变性的氨基酸。在一些实施方案中,Xaa1选自D、E、M、A、I、Q或T。在一些实施方案中,Xaa2选自高摩尔质量的氨基酸。在一些实施方案中,Xaa2选自F。在一些实施方案中,Xaa2选自低可突变性的氨基酸。在一些实施方案中,Xaa2选自Y、F或L。在一些实施方案中,Xaa3选自低可突变性的氨基酸。在一些实施方案中,Xaa3选自K、V、P或H。在一些实施方案中,Xaa3选自低亲疏水性的氨基酸。在一些实施方案中,Xaa3选自K或R。在一些实施方案中,Xaa4选自低可突变性的氨基酸。在一些实施方案中,Xaa4选自K或P。在一些实施方案中,Xaa4选自高平均柔性的氨基酸。在一些实施方案中,Xaa4选自D、E、P或S。在一些实施方案中,Xaa5选自低平均柔性的氨基酸。在一些实施方案中,Xaa5选自W、M或F。在一些实施方案中,Xaa5选自高溶解性的氨基酸。在一些实施方案中,Xaa5选自W、F、I或L。在一些实施方案中,Xaa6选自中等可突变性的氨基酸。在一些实施方案中,Xaa6选自R或H。在一些实施方案中,Xaa6选自高表面可接近性的氨基酸。在一些实施方案中,Xaa6选自T。在一些实施方案中,Xaa7选自低可突变性的氨基酸。在一些实施方案中,Xaa7选自C。在一些实施方案中,Xaa7选自高溶解性的氨基酸。在一些实施方案中,Xaa7选自W、V、M、F、I或L。在一些实施方案中,Xaa8选自高可突变性的氨基酸。在一些实施方案中,Xaa8选自D、E、M、A、I、Q或T。在一些实施方案中,Xaa8选自低亲疏水性的氨基酸。在一些实施方案中,Xaa8选自R或K。在一些实施方案中,Xaa9选自高平均柔性的氨基酸。在一些实施方案中,Xaa9选自R或G。
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:17118-SEQ ID NO:18117的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的肺组织嗜性。
C.富集的肺序列
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:18118-SEQ ID NO:19117的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的肺组织嗜性。
6.7.14.体内选定的赋予增加的心脏嗜性的突变VP多肽
本公开提供了具有VP衣壳多肽的AAV5病毒体,所述VP衣壳多肽在具有与靶细胞(例如,目标靶心脏组织中的靶心脏细胞)相互作用的残基的区域中具有至少一个突变,其中与野生型VP衣壳多肽相比,所述至少一个突变赋予增加的心脏组织嗜性。在一些实施方案中,本文提供了与SEQ ID NO:1具有至少80%序列同源性的AAV5 VP1衣壳多肽,其中所述AAV5 VP1衣壳多肽在从对应于SEQ ID NO:1的581的位置至对应于589的位置的区域中具有至少一个突变,并且其中所述至少一个突变驱动增加的心脏嗜性。以下序列规则和序列也适用于对应于AAV5 VP1氨基酸残基581至589的AAV5 VP2(氨基酸残基445至453;VP2序列显示于SEQ ID NO:1115)和AAV5 VP3(氨基酸残基389至397;VP3序列显示于SEQ ID NO:1116)中的区域。因此,本公开涵盖在对应于581至589区域的AAV5 VP1氨基酸残基的VP2和VP3区域中具有一个或多个突变的AAV5 VP2衣壳多肽和AAV5 VP3衣壳多肽,其中所述一个或多个突变与以下章节中的规则或顺序相称。在一些实施方案中,“心脏”和“心脏的”在本文中可以互换使用。
A.位置频率规则
在本章节中,除非另外说明,否则分析相对于给定氨基酸残基出现在所有其他所收获组织(CNS(前脑皮层、枕叶皮层、颞叶皮层、丘脑、下丘脑、黑质、海马DG、海马CA1、海马CA3、小脑)、肝脏、骨骼肌、肺、脾脏、淋巴结、骨髓、乳腺、皮肤、肾上腺、甲状腺、结肠、坐骨神经和脊髓组织)中鉴定的变体中指定位置的频率而言该给定氨基酸残基出现在心脏中鉴定的变体中对应于SEQ ID NO:1(推及于SEQ ID NO:2)的位置581至位置589的所述指定位置的频率,以确定优先靶向心脏组织的衣壳的一组序列规则。来自体内数据的位置频率规则的确定详细描述于实施例13中。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的心脏组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中Xaa1选自I、K、L、M、T或V,或Xaa1选自K或L,或Xaa1为K;或Xaa2选自A、C、G、I、K或S,或Xaa2选自A、C或S,或Xaa2为A;或Xaa3选自A、D、E、G、K、M或V,或Xaa3选自E或V,或Xaa3为E;或Xaa4选自F、H、R、T、W或Y,或Xaa4选自F、R或T,或Xaa4为R;或Xaa5选自F、L、M或R,或Xaa5为L;或Xaa6选自A、H、N、W或Y,或Xaa6选自H、N或Y,或Xaa6为H;或Xaa7选自A、C、E、F、K或T,或Xaa7选自C、F或T,或Xaa7为F;或Xaa8选自A、C、M、S或T,或Xaa8选自C、M或S,或Xaa8为C;或Xaa9选自A、D、G或P,或Xaa9选自A或G,或Xaa9为A。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的心脏组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变选自以下规则。在一些实施方案中,Xaa1选自I、K、L、M、T或V。在一些实施方案中,Xaa1选自K或L。在一些实施方案中,Xaa1为K。在一些实施方案中,Xaa2选自A、C、G、I、K或S。在一些实施方案中,Xaa2选自A、C或S。在一些实施方案中,Xaa2为A。在一些实施方案中,Xaa3选自A、D、E、G、K、M或V。在一些实施方案中,Xaa3选自E或V。在一些实施方案中,Xaa3为E。在一些实施方案中,Xaa4选自F、H、R、T、W或Y。在一些实施方案中,Xaa4选自F、R或T。在一些实施方案中,Xaa4为R。在一些实施方案中,Xaa5选自F、L、M或R。在一些实施方案中,Xaa5为L。在一些实施方案中,Xaa6选自A、H、N、W或Y。在一些实施方案中,Xaa6选自H、N或Y。在一些实施方案中,Xaa6为H。在一些实施方案中,Xaa7选自A、C、E、F、K或T。在一些实施方案中,Xaa7选自C、F或T。在一些实施方案中,Xaa7为F。在一些实施方案中,Xaa8选自A、C、M、S或T。在一些实施方案中,Xaa8选自C、M或S。在一些实施方案中,Xaa8为C。在一些实施方案中,Xaa9选自A、D、G或P。在一些实施方案中,Xaa9选自A或G。在一些实施方案中,Xaa9为A。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的心脏组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变选自以下规则:Xaa1选自I、K、L、M、T或V,Xaa2选自A、C、G、I、K或S,Xaa3选自A、D、E、G、K、M或V,Xaa4选自F、H、R、T、W或Y,Xaa5选自F、L、M或R,Xaa6选自A、H、N、W或Y,Xaa7选自A、C、E、F、K或T,Xaa8选自A、C、M、S或T,并且Xaa9选自A、D、G或P。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的心脏组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变如下:Xaa1选自I、K、L、M、T或V,Xaa2选自A、C、G、I、K或S,Xaa3选自A、D、E、G、K、M或V,Xaa4选自F、H、R、T、W或Y,Xaa5选自F、L、M或R,Xaa6选自A、H、N、W或Y,Xaa7选自A、C、E、F、K或T,Xaa8选自A、C、M、S或T,Xaa9选自A、D、G或P,或它们的任何组合。
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:13118-SEQ ID NO:14117的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的心脏组织嗜性。
B.ML规则
对于本段中描述的以下一组规则,使用体内数据和两个ML模型(描述于实施例34)确定工程化AAV5 VP1衣壳多肽的581至589区域中每个位置处的有利生物物理特性和有利氨基酸残基。本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与具有野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述组装的病毒体表现出增加的心脏组织嗜性,其中工程化AAV5 VP衣壳多肽序列具有一个或多个突变,其中工程化AAV5 VP1衣壳多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中Xaa1选自低溶解性的氨基酸(例如,Xaa1选自N或E);或者其中Xaa1选自低亲疏水性的氨基酸(例如,Xaa1选自H、N、Q、P、Y、D或E);或者其中Xaa1选自高可突变性的氨基酸(例如,Xaa1选自A或E);或者其中Xaa2选自高亲疏水性的氨基酸(例如,Xaa2选自V或I);或者其中Xaa2选自中等可突变性的氨基酸(例如,Xaa2选自V);或者其中Xaa2选自中等体积的氨基酸(例如,Xaa2选自V、E或Q);或者其中Xaa2选自高溶解性的氨基酸(例如,Xaa2选自V或M);或者其中Xaa3选自低溶解性的氨基酸(例如,Xaa3选自R或Q);或者其中Xaa4选自低表面可接近性的氨基酸(例如,Xaa4选自C);或者其中Xaa4选自高溶解性的氨基酸(例如,Xaa4选自C);或者其中Xaa4选自低电荷的氨基酸(例如,Xaa4选自D、E、Y、W、V、P、M、A、G、F、I、L、N、Q、S、T或C);或者其中Xaa4选自高亲疏水性的氨基酸(例如,Xaa4选自C);或者其中Xaa5选自高表面可接近性的氨基酸(例如,Xaa5选自D、E、R、K、N或Q);或者其中Xaa5选自低溶解性的氨基酸(例如,Xaa5选自D);或者其中Xaa6选自低可突变性的氨基酸(例如,Xaa6选自C);或者其中Xaa6选自低溶解性的氨基酸(例如,Xaa6选自D);或者其中Xaa8选自高表面可接近性的氨基酸(例如,Xaa8选自D或N);或者其中Xaa8选自高平均柔性的氨基酸(例如,Xaa8选自D、R、P、G或S);或者其中Xaa9选自中等摩尔质量的氨基酸(例如,Xaa9选自N、D、L或I);或它们的任何组合。
在一些实施方案中,Xaa1选自低溶解性的氨基酸。在一些实施方案中,Xaa1选自N或E。在一些实施方案中,Xaa1选自低亲疏水性的氨基酸。在一些实施方案中,Xaa1选自H、N、Q、P、Y、D或E。在一些实施方案中,Xaa1选自高可突变性的氨基酸。在一些实施方案中,Xaa1选自A或E。在一些实施方案中,Xaa2选自高亲疏水性的氨基酸。在一些实施方案中,Xaa2选自V或I。在一些实施方案中,Xaa2选自中等可突变性的氨基酸。在一些实施方案中,Xaa2选自V。在一些实施方案中,Xaa2选自中等体积的氨基酸。在一些实施方案中,Xaa2选自V、E或Q。在一些实施方案中,Xaa2选自高溶解性的氨基酸。在一些实施方案中,Xaa2选自V或M。在一些实施方案中,Xaa3选自低溶解性的氨基酸。在一些实施方案中,Xaa3选自R或Q。在一些实施方案中,Xaa4选自低表面可接近性的氨基酸。在一些实施方案中,Xaa4选自C。在一些实施方案中,Xaa4选自高溶解性的氨基酸。在一些实施方案中,Xaa4选自C。在一些实施方案中,Xaa4选自低电荷的氨基酸。在一些实施方案中,Xaa4选自D、E、Y、W、V、P、M、A、G、F、I、L、N、Q、S、T或C。在一些实施方案中,Xaa4选自高亲疏水性的氨基酸。在一些实施方案中,Xaa4选自C。在一些实施方案中,Xaa5选自高表面可接近性的氨基酸。在一些实施方案中,Xaa5选自D、E、R、K、N或Q。在一些实施方案中,Xaa5选自低溶解性的氨基酸。在一些实施方案中,Xaa5选自D。在一些实施方案中,Xaa6选自低可突变性的氨基酸。在一些实施方案中,Xaa6选自C。在一些实施方案中,Xaa6选自低溶解性的氨基酸。在一些实施方案中,Xaa6选自D。在一些实施方案中,Xaa8选自高表面可接近性的氨基酸。在一些实施方案中,Xaa8选自D或N。在一些实施方案中,Xaa8选自高平均柔性的氨基酸。在一些实施方案中,Xaa8选自D、R、P、G或S。在一些实施方案中,Xaa9选自中等摩尔质量的氨基酸。在一些实施方案中,Xaa9选自N、D、L或I。
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:14118-SEQ ID NO:15117的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的心脏组织嗜性。
C.富集的心脏序列
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:15118-SEQ ID NO:16117的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的心脏组织嗜性。
6.7.15.体内选定的赋予增加的结肠嗜性的突变VP多肽
本公开提供了具有VP衣壳多肽的AAV5病毒体,所述VP衣壳多肽在具有与靶细胞(例如,目标靶结肠组织中的靶结肠细胞)相互作用的残基的区域中具有至少一个突变,其中与野生型VP衣壳多肽相比,所述至少一个突变赋予增加的结肠组织嗜性。在一些实施方案中,本文提供了与SEQ ID NO:1具有至少80%序列同源性的AAV5 VP1衣壳多肽,其中所述AAV5 VP1衣壳多肽在从对应于SEQ ID NO:1的581的位置至对应于589的位置的区域中具有至少一个突变,并且其中所述至少一个突变驱动增加的结肠嗜性。以下序列规则和序列也适用于对应于AAV5 VP1氨基酸残基581至589的AAV5 VP2(氨基酸残基445至453;VP2序列显示于SEQ ID NO:1115)和AAV5 VP3(氨基酸残基389至397;VP3序列显示于SEQ ID NO:1116)中的区域。因此,本公开涵盖在对应于581至589区域的AAV5 VP1氨基酸残基的VP2和VP3区域中具有一个或多个突变的AAV5 VP2衣壳多肽和AAV5 VP3衣壳多肽,其中所述一个或多个突变与以下章节中的规则或顺序相称。
A.位置频率规则
在本章节中,除非另外说明,否则分析相对于给定氨基酸残基出现在所有其他所收获组织(CNS(前脑皮层、枕叶皮层、颞叶皮层、丘脑、下丘脑、黑质、海马DG、海马CA1、海马CA3、小脑)、肝脏、骨骼肌、心脏、肺、脾脏、淋巴结、骨髓、乳腺、皮肤、肾上腺、甲状腺、坐骨神经和脊髓组织)中鉴定的变体中指定位置的频率而言该给定氨基酸残基出现在结肠中鉴定的变体中对应于SEQ ID NO:1(推及于SEQ ID NO:2)的位置581至位置589的所述指定位置的频率,以确定优先靶向结肠组织的衣壳的一组序列规则。来自体内数据的位置频率规则的确定详细描述于实施例14中。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的结肠组织嗜性,其中工程化变体AAV5 VP1衣壳多肽序列具有一个或多个突变,其中Xaa1选自C、F、H、N、P、W或Y,或Xaa1选自F、P或W,或Xaa1为P;或Xaa2选自D、E、F、L或P,或Xaa2选自D、E、L或P,或Xaa2为P;或Xaa3选自C、F、H、I、L、P或Y,或Xaa3选自C、H或P,或Xaa3为P;或Xaa4选自C、D、E、N或P,或Xaa4选自C、D或E,或Xaa4为C;或Xaa5选自D、E、G、P或W,或Xaa5选自G、P或W,或Xaa5为P;或Xaa6选自C、K、R或V,或Xaa6选自K或R,或Xaa6为R;或Xaa7选自D、M、P或V,或Xaa7为P;或Xaa8选自D、I、K、L、P、R或V,或Xaa8选自K、P或R,或Xaa8为P;或Xaa9选自C、H、I、K、L、M或W,或Xaa9选自I、L或M,或Xaa9为I。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的结肠组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变选自以下规则。在一些实施方案中,Xaa1选自C、F、H、N、P、W或Y。在一些实施方案中,Xaa1选自F、P或W。在一些实施方案中,Xaa1为P。在一些实施方案中,Xaa2选自D、E、F、L或P。在一些实施方案中,Xaa2选自D、E、L或P。在一些实施方案中,Xaa2为P。在一些实施方案中,Xaa3选自C、F、H、I、L、P或Y。在一些实施方案中,Xaa3选自C、H或P。在一些实施方案中,Xaa3为P。在一些实施方案中,Xaa4选自C、D、E、N或P。在一些实施方案中,Xaa4选自C、D或E。在一些实施方案中,Xaa4为C。在一些实施方案中,Xaa5选自D、E、G、P或W。在一些实施方案中,Xaa5选自G、P或W。在一些实施方案中,Xaa5为P。在一些实施方案中,Xaa6选自C、K、R或V。在一些实施方案中,Xaa6选自K或R。在一些实施方案中,Xaa6为R。在一些实施方案中,Xaa7选自D、M、P或V。在一些实施方案中,Xaa7为P。在一些实施方案中,Xaa8选自D、I、K、L、P、R或V。在一些实施方案中,Xaa8选自K、P或R。在一些实施方案中,Xaa8为P。在一些实施方案中,Xaa9选自C、H、I、K、L、M或W。在一些实施方案中,Xaa9选自I、L或M。在一些实施方案中,Xaa9为I。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的结肠组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变选自以下规则:Xaa1选自C、F、H、N、P、W或Y,Xaa2选自D、E、F、L或P,Xaa3选自C、F、H、I、L、P或Y,Xaa4选自C、D、E、N或P,Xaa5选自D、E、G、P或W,Xaa6选自C、K、R或V,Xaa7选自D、M、P或V,Xaa8选自D、I、K、L、P、R或V,并且Xaa9选自C、H、I、K、L、M或W。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的结肠组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变如下:Xaa1选自C、F、H、N、P、W或Y,Xaa2选自D、E、F、L或P,Xaa3选自C、F、H、I、L、P或Y,Xaa4选自C、D、E、N或P,Xaa5选自D、E、G、P或W,Xaa6选自C、K、R或V,Xaa7选自D、M、P或V,Xaa8选自D、I、K、L、P、R或V,Xaa9选自C、H、I、K、L、M或W,或它们的任何组合。
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:10118-SEQ ID NO:11117的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的结肠组织嗜性。
B.ML规则
对于本段中描述的以下一组规则,使用体内数据和两个ML模型(描述于实施例33)确定工程化AAV5 VP1衣壳多肽的581至589区域中每个位置处的有利生物物理特性和有利氨基酸残基。本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与具有野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述组装的病毒体表现出增加的结肠组织嗜性,其中工程化AAV5 VP衣壳多肽序列具有一个或多个突变,其中工程化AAV5 VP1衣壳多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中Xaa1选自高摩尔质量的氨基酸(例如,Xaa1选自Y或W);或者其中Xaa1选自高溶解性的氨基酸(例如,Xaa1选自W、F、I或L);或者其中Xaa2选自低溶解性的氨基酸(例如,Xaa2选自D);或者其中Xaa2选自低可突变性的氨基酸(例如,Xaa2选自P或K);或者其中Xaa2选自中等摩尔质量的氨基酸(例如,Xaa2选自D、E、N、K、M、Q、I或L);或者其中Xaa2选自低亲疏水性的氨基酸(例如,Xaa2选自D、E、R、K、H、N或Q);或者其中Xaa3选自低可突变性的氨基酸(例如,Xaa3选自K、V、P或C);或者其中Xaa3选自高溶解性的氨基酸(例如,Xaa3选自W、F、I或L);或者其中Xaa5选自高平均柔性的氨基酸(例如,Xaa5选自S、P、G、R、E或D);或者其中Xaa5选自高表面可接近性的氨基酸(例如,Xaa5选自D或N);或者其中Xaa6选自低亲疏水性的氨基酸(例如,Xaa6选自R);或者其中Xaa6选自低可突变性的氨基酸(例如,Xaa6选自Y、R、F或L);或者其中Xaa6选自低溶解性的氨基酸(例如,Xaa6选自R或Q);或者其中Xaa6选自高表面可接近性的氨基酸(例如,Xaa6选自E、R或K);或者其中Xaa6选自高平均柔性的氨基酸(例如,Xaa6选自G或R);或者其中Xaa8选自低溶解性的氨基酸(例如,Xaa8选自D);或它们的任何组合。
在一些实施方案中,Xaa1选自高摩尔质量的氨基酸。在一些实施方案中,Xaa1选自Y或W。在一些实施方案中,Xaa1选自高溶解性的氨基酸。在一些实施方案中,Xaa1选自W、F、I或L。在一些实施方案中,Xaa2选自低溶解性的氨基酸。在一些实施方案中,Xaa2选自D。在一些实施方案中,Xaa2选自低可突变性的氨基酸。在一些实施方案中,Xaa2选自P、K。在一些实施方案中,Xaa2选自中等摩尔质量的氨基酸。在一些实施方案中,Xaa2选自D、E、N、K、M、Q、I或L。在一些实施方案中,Xaa2选自低亲疏水性的氨基酸。在一些实施方案中,Xaa2选自D、E、R、K、H、N或Q。在一些实施方案中,Xaa3选自低可突变性的氨基酸。在一些实施方案中,Xaa3选自K、V、P或C。在一些实施方案中,Xaa3选自高溶解性的氨基酸。在一些实施方案中,Xaa3选自W、F、I或L。在一些实施方案中,Xaa5选自高平均柔性的氨基酸。在一些实施方案中,Xaa5选自S、P、G、R、E或D。在一些实施方案中,Xaa5选自高表面可接近性的氨基酸。在一些实施方案中,Xaa5选自D或N。在一些实施方案中,Xaa6选自低亲疏水性的氨基酸。在一些实施方案中,Xaa6选自R。在一些实施方案中,Xaa6选自低可突变性的氨基酸。在一些实施方案中,Xaa6选自Y、R、F或L。在一些实施方案中,Xaa6选自低溶解性的氨基酸。在一些实施方案中,Xaa6选自R或Q。在一些实施方案中,Xaa6选自高表面可接近性的氨基酸。在一些实施方案中,Xaa6选自E、R或K。在一些实施方案中,Xaa6选自高平均柔性的氨基酸。在一些实施方案中,Xaa6选自G或R。在一些实施方案中,Xaa8选自低溶解性的氨基酸。在一些实施方案中,Xaa8选自D。
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:11118-SEQ ID NO:12117的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的结肠组织嗜性。
C.富集的结肠序列
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:12118-SEQ ID NO:13117的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的结肠组织嗜性。
6.7.16.体内选定的赋予增加的甲状腺嗜性的突变VP多肽
本公开提供了具有VP衣壳多肽的AAV5病毒体,所述VP衣壳多肽在具有与靶细胞(例如,目标靶甲状腺组织中的靶甲状腺细胞)相互作用的残基的区域中具有至少一个突变,其中与野生型VP衣壳多肽相比,所述至少一个突变赋予增加的甲状腺组织嗜性。在一些实施方案中,本文提供了与SEQ ID NO:1具有至少80%序列同源性的AAV5 VP1衣壳多肽,其中所述AAV5 VP1衣壳多肽在从对应于SEQ ID NO:1的581的位置至对应于589的位置的区域中具有至少一个突变,并且其中所述至少一个突变驱动增加的甲状腺嗜性。以下序列规则和序列也适用于对应于AAV5 VP1氨基酸残基581至589的AAV5 VP2(氨基酸残基445至453;VP2序列显示于SEQ ID NO:1115)和AAV5 VP3(氨基酸残基389至397;VP3序列显示于SEQ IDNO:1116)中的区域。因此,本公开涵盖在对应于581至589区域的AAV5 VP1氨基酸残基的VP2和VP3区域中具有一个或多个突变的AAV5 VP2衣壳多肽和AAV5 VP3衣壳多肽,其中所述一个或多个突变与以下章节中的规则或顺序相称。
A.位置频率规则
在本章节中,除非另外说明,否则分析相对于给定氨基酸残基出现在所有其他所收获组织(CNS(前脑皮层、枕叶皮层、颞叶皮层、丘脑、下丘脑、黑质、海马DG、海马CA1、海马CA3、小脑)、肝脏、骨骼肌、心脏、肺、脾脏、淋巴结、骨髓、乳腺、皮肤、肾上腺、结肠、坐骨神经和脊髓组织)中鉴定的变体中指定位置的频率而言该给定氨基酸残基出现在甲状腺中鉴定的变体中对应于SEQ ID NO:1(推及于SEQ ID NO:2)的位置581至位置589的所述指定位置的频率,以确定优先靶向甲状腺组织的衣壳的一组序列规则。来自体内数据的位置频率规则的确定详细描述于实施例15中。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的甲状腺组织嗜性,其中工程化变体AAV5VP1衣壳多肽序列具有一个或多个突变,其中Xaa1选自A、K、M、N、Q或R,或Xaa1选自K、N或Q,或Xaa1为K;或Xaa2选自A、F、K、L、M、T、V或W,或Xaa2选自F、V或W,或Xaa2为W;或Xaa3选自A、I、K、R、S、T、V或W,或Xaa3选自A、R或T,或Xaa3为R;或Xaa4选自A、D、E、I、P或V,或Xaa4选自A、E或I,或Xaa4为A;或Xaa5选自F、I、M、Q、V或Y,或Xaa5为M、V、Y,或Xaa5为M;或Xaa6选自H、M、N或Y,或Xaa6为N;或Xaa7选自H、I、N、Q、S或W,或Xaa7选自H、I或N,或Xaa7为H;或Xaa8选自A、D、F、Q、S或Y,或Xaa8选自A、F或S,或Xaa8为F;或Xaa9选自A、Q、S或Y,或Xaa9选自A或S,或Xaa9为A。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的甲状腺组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变选自以下规则。在一些实施方案中,Xaa1选自A、K、M、N、Q或R。在一些实施方案中,Xaa1选自K、N或Q。在一些实施方案中,Xaa1为K。在一些实施方案中,Xaa2选自A、F、K、L、M、T、V或W。在一些实施方案中,Xaa2选自F、V或W。在一些实施方案中,Xaa2为W。在一些实施方案中,Xaa3选自A、I、K、R、S、T、V或W。在一些实施方案中,Xaa3选自A、R或T。在一些实施方案中,Xaa3为R。在一些实施方案中,Xaa4选自A、D、E、I、P或V。在一些实施方案中,Xaa4选自A、E或I。在一些实施方案中,Xaa4为A。在一些实施方案中,Xaa5选自F、I、M、Q、V或Y。在一些实施方案中,Xaa5为M、V、Y。在一些实施方案中,Xaa5为M。在一些实施方案中,Xaa6选自H、M、N或Y。在一些实施方案中,Xaa6为N。在一些实施方案中,Xaa7选自H、I、N、Q、S或W。在一些实施方案中,Xaa7选自H、I或N。在一些实施方案中,Xaa7为H。在一些实施方案中,Xaa8选自A、D、F、Q、S或Y。在一些实施方案中,Xaa8选自A、F或S。在一些实施方案中,Xaa8为F。在一些实施方案中,Xaa9选自A、Q、S或Y。在一些实施方案中,Xaa9选自A或S。在一些实施方案中,Xaa9为A。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的甲状腺组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变选自以下规则:Xaa1选自A、K、M、N、Q或R,Xaa2选自A、F、K、L、M、T、V或W,Xaa3选自A、I、K、R、S、T、V或W,Xaa4选自A、D、E、I、P或V,Xaa5选自F、I、M、Q、V或Y,Xaa6选自H、M、N或Y,Xaa7选自H、I、N、Q、S或W,Xaa8选自A、D、F、Q、S或Y,并且Xaa9选自A、Q、S或Y。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的甲状腺组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变如下:Xaa1选自A、K、M、N、Q或R,Xaa2选自A、F、K、L、M、T、V或W,Xaa3选自A、I、K、R、S、T、V或W,Xaa4选自A、D、E、I、P或V,Xaa5选自F、I、M、Q、V或Y,Xaa6选自H、M、N或Y,Xaa7选自H、I、N、Q、S或W,Xaa8选自A、D、F、Q、S或Y,Xaa9选自A、Q、S或Y,或它们的任何组合。
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:40438-SEQ ID NO:41437的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的甲状腺组织嗜性。
B.ML规则
对于本段中描述的以下一组规则,使用体内数据和两个ML模型(描述于实施例43)确定工程化AAV5 VP1衣壳多肽的581至589区域中每个位置处的有利生物物理特性和有利氨基酸残基。本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与具有野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述组装的病毒体表现出增加的甲状腺组织嗜性,其中工程化AAV5 VP衣壳多肽序列具有一个或多个突变,其中工程化AAV5 VP1衣壳多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中Xaa1选自高可突变性的氨基酸(例如,Xaa1选自N);或者其中Xaa2选自低表面可接近性的氨基酸(例如,Xaa2选自F、G或M);或者其中Xaa3选自高溶解性的氨基酸(例如,Xaa3选自F);或者其中Xaa3选自低可突变性的氨基酸(例如,Xaa3选自Y、F、L或C);或者其中Xaa3选自中等摩尔质量的氨基酸(例如,Xaa3选自D、E、R、K、V、P、M、I、L、N、Q、T或C);或者其中Xaa3选自低表面可接近性的氨基酸(例如,Xaa3选自V、I、L或C);或者其中Xaa4选自高goldman engelman steitz的氨基酸(例如,Xaa4选自L或V);或者其中Xaa4选自低表面可接近性的氨基酸(例如,Xaa4选自V、M、A、G、F、I或L);或者其中Xaa4选自低摩尔质量的氨基酸(例如,Xaa4选自D、A、G、I、L或N);或者其中Xaa5选自高溶解性的氨基酸(例如,Xaa5选自C、L、F、M、V或Y);或者其中Xaa5选自低溶解性的氨基酸(例如,Xaa5选自D);或者其中Xaa5选自低平均柔性的氨基酸(例如,Xaa5选自F、M或W);或者其中Xaa6选自低平均柔性的氨基酸(例如,Xaa6选自F、M或W);或者其中Xaa7选自高可突变性的氨基酸(例如,Xaa7选自N);或者其中Xaa7选自低体积的氨基酸(例如,Xaa7选自P、N或T);或者其中Xaa8选自低平均柔性的氨基酸(例如,Xaa8选自F、M或W);或者其中Xaa8选自低表面可接近性的氨基酸(例如,Xaa8选自M、G或F);或者其中Xaa9选自低可突变性的氨基酸(例如,Xaa9选自R、K、P、H或C);或者其中Xaa9选自低亲疏水性的氨基酸(例如,Xaa9选自R);或它们的任何组合。
在一些实施方案中,Xaa1选自高可突变性的氨基酸。在一些实施方案中,Xaa1选自N。在一些实施方案中,Xaa2选自低表面可接近性的氨基酸。在一些实施方案中,Xaa2选自F、G或M。在一些实施方案中,Xaa3选自高溶解性的氨基酸。在一些实施方案中,Xaa3选自F。在一些实施方案中,Xaa3选自低可突变性的氨基酸。在一些实施方案中,Xaa3选自Y、F、L或C。在一些实施方案中,Xaa3选自中等摩尔质量的氨基酸。在一些实施方案中,Xaa3选自D、E、R、K、V、P、M、I、L、N、Q、T或C。在一些实施方案中,Xaa3选自低表面可接近性的氨基酸。在一些实施方案中,Xaa3选自V、I、L或C。在一些实施方案中,Xaa4选自高goldman engelman steitz的氨基酸。在一些实施方案中,Xaa4选自L或V。在一些实施方案中,Xaa4选自低表面可接近性的氨基酸。在一些实施方案中,Xaa4选自V、M、A、G、F、I或L。在一些实施方案中,Xaa4选自低摩尔质量的氨基酸。在一些实施方案中,Xaa4选自D、A、G、I、L或N。在一些实施方案中,Xaa5选自高溶解性的氨基酸。在一些实施方案中,Xaa5选自C、L、F、M、V或Y。在一些实施方案中,Xaa5选自低溶解性的氨基酸。在一些实施方案中,Xaa5选自D。在一些实施方案中,Xaa5选自低平均柔性的氨基酸。在一些实施方案中,Xaa5选自F、M或W。在一些实施方案中,Xaa6选自低平均柔性的氨基酸。在一些实施方案中,Xaa6选自F、M或W。在一些实施方案中,Xaa7选自高可突变性的氨基酸。在一些实施方案中,Xaa7选自N。在一些实施方案中,Xaa7选自低体积的氨基酸。在一些实施方案中,Xaa7选自P、N或T。在一些实施方案中,Xaa8选自低平均柔性的氨基酸。在一些实施方案中,Xaa8选自F、M或W。在一些实施方案中,Xaa8选自低表面可接近性的氨基酸。在一些实施方案中,Xaa8选自M、G或F。在一些实施方案中,Xaa9选自低可突变性的氨基酸。在一些实施方案中,Xaa9选自R、K、P、H或C。在一些实施方案中,Xaa9选自低亲疏水性的氨基酸。在一些实施方案中,Xaa9选自R。
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:41438-SEQ ID NO:42437的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的甲状腺组织嗜性。
C.富集的甲状腺序列
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:42438-SEQ ID NO:43437的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的甲状腺组织嗜性。
6.7.17.体内选定的赋予增加的淋巴结嗜性的突变VP多肽
本公开提供了具有VP衣壳多肽的AAV5病毒体,所述VP衣壳多肽在具有与靶细胞(例如,目标靶淋巴结组织中的靶淋巴结细胞)相互作用的残基的区域中具有至少一个突变,其中与野生型VP衣壳多肽相比,所述至少一个突变赋予增加的淋巴结组织嗜性。在一些实施方案中,本文提供了与SEQ ID NO:1具有至少80%序列同源性的AAV5 VP1衣壳多肽,其中所述AAV5 VPl衣壳多肽在从对应于SEQ ID NO:l的58l的位置至对应于589的位置的区域中具有至少一个突变,并且其中所述至少一个突变驱动增加的淋巴结嗜性。以下序列规则和序列也适用于对应于AAV5 VP1氨基酸残基581至589的AAV5 VP2(氨基酸残基445至453;VP2序列显示于SEQ ID NO:1115)和AAV5 VP3(氨基酸残基389至397;VP3序列显示于SEQ IDNO:1116)中的区域。因此,本公开涵盖在对应于581至589区域的AAV5 VP1氨基酸残基的VP2和VP3区域中具有一个或多个突变的AAV5 VP2衣壳多肽和AAV5 VP3衣壳多肽,其中所述一个或多个突变与以下章节中的规则或顺序相称。
A.位置频率规则
在本章节中,除非另外说明,否则分析相对于给定氨基酸残基出现在所有其他所收获组织(CNS(前脑皮层、枕叶皮层、颞叶皮层、丘脑、下丘脑、黑质、海马DG、海马CA1、海马CA3、小脑)、肝脏、骨骼肌、心脏、肺、脾脏、骨髓、乳腺、皮肤、肾上腺、甲状腺、结肠、坐骨神经和脊髓组织)中鉴定的变体中指定位置的频率而言该给定氨基酸残基出现在淋巴结中鉴定的变体中对应于SEQ ID NO:1(推及于SEQ ID NO:2)的位置581至位置589的所述指定位置的频率,以确定优先靶向淋巴结组织的衣壳的一组序列规则。来自体内数据的位置频率规则的确定详细描述于实施例16中。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的淋巴结组织嗜性,其中工程化变体AAV5VP1衣壳多肽序列具有一个或多个突变,其中Xaa1选自A、D、E、Q、S或T,或Xaa1选自D、E或T,或Xaa1为E;或Xaa2选自A、H、I、S、T或V,或Xaa2选自I、T或V,或Xaa2为V;或Xaa3选自A、E、H、I、T或V,或Xaa3选自A、I、T或V,或Xaa3为T;或Xaa4选自A、D、E或P,或Xaa4选自D或E,或Xaa4为E;或Xaa5选自I、L、M、V或Y,或Xaa5选自I、L、V或Y,或Xaa5为L;或Xaa6选自D、E、I、N或Q,或Xaa6选自D、E或I,或Xaa6为D;或Xaa7选自A、E、G、Q或V,或Xaa7为A、Q或V,或Xaa7为V;或Xaa8选自F、G、M或W,或Xaa8选自F或W,或Xaa8为W;或Xaa9选自I、P、T或Y,或Xaa9为I或P。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的淋巴结组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变选自以下规则。在一些实施方案中,Xaa1选自A、D、E、Q、S或T。在一些实施方案中,Xaa1选自D、E或T。在一些实施方案中,Xaa1为E。在一些实施方案中,Xaa2选自A、H、I、S、T或V。在一些实施方案中,Xaa2选自I、T或V。在一些实施方案中,Xaa2为V。在一些实施方案中,Xaa3选自A、E、H、I、T或V。在一些实施方案中,Xaa3选自A、I、T或V。在一些实施方案中,Xaa3为T。在一些实施方案中,Xaa4选自A、D、E或P。在一些实施方案中,Xaa4选自D或E。在一些实施方案中,Xaa4为E。在一些实施方案中,Xaa5选自I、L、M、V或Y。在一些实施方案中,Xaa5选自I、L、V或Y。在一些实施方案中,Xaa5为L。在一些实施方案中,Xaa6选自D、E、I、N或Q。在一些实施方案中,Xaa6选自D、E或I。在一些实施方案中,Xaa6为D。在一些实施方案中,Xaa7选自A、E、G、Q或V。在一些实施方案中,Xaa7为A、Q或V。在一些实施方案中,Xaa7为V。在一些实施方案中,Xaa8选自F、G、M或W。在一些实施方案中,Xaa8选自F或W。在一些实施方案中,Xaa8为W。在一些实施方案中,Xaa9选自I、P、T或Y。在一些实施方案中,Xaa9为I或P。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的淋巴结组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变选自以下规则:Xaa1选自A、D、E、Q、S或T,Xaa2选自A、H、I、S、T或V,Xaa3选自A、E、H、I、T或V,Xaa4选自A、D、E或P,Xaa5选自I、L、M、V或Y,Xaa6选自D、E、I、N或Q,Xaa7选自A、E、G、Q或V,Xaa8选自F、G、M或W,并且Xaa9选自I、P、T或Y。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的淋巴结组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变如下:Xaa1选自A、D、E、Q、S或T,Xaa2选自A、H、I、S、T或V,Xaa3选自A、E、H、I、T或V,Xaa4选自A、D、E或P,Xaa5选自I、L、M、V或Y,Xaa6选自D、E、I、N或Q,Xaa7选自A、E、G、Q或V,Xaa8选自F、G、M或W,Xaa9选自I、P、T或Y,或它们的任何组合。
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:19118-SEQ ID NO:20117的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的淋巴结组织嗜性。
B.ML规则
对于本段中描述的以下一组规则,使用体内数据和两个ML模型(描述于实施例35)确定工程化AAV5 VP1衣壳多肽的581至589区域中每个位置处的有利生物物理特性和有利氨基酸残基。本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与具有野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述组装的病毒体表现出增加的淋巴结组织嗜性,其中工程化AAV5 VP衣壳多肽序列具有一个或多个突变,其中工程化AAV5 VP1衣壳多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中Xaa1选自高平均柔性的氨基酸(例如,Xaa1选自D、E、P、G、Q、S或R);或者其中Xaa1选自高氢键供体的氨基酸(例如,Xaa1选自R);或者其中Xaa1选自高摩尔质量的氨基酸(例如,Xaa1选自Y、W、R或F);或者其中Xaa2选自低溶解性的氨基酸(例如,Xaa2选自N或E);或者其中Xaa3选自低平均柔性的氨基酸(例如,Xaa3选自W、M或F);或者其中Xaa3选自低可突变性的氨基酸(例如,Xaa3选自R、H、K、P、Y、F、L或C);或者其中Xaa4选自低可突变性的氨基酸(例如,Xaa4选自C);或者其中Xaa5选自高可突变性的氨基酸(例如,Xaa5选自N);或者其中Xaa5选自中等摩尔质量的氨基酸(例如,Xaa5选自D、I、L或N);或者其中Xaa6选自高摩尔质量的氨基酸(例如,Xaa6选自Y、W、R或F);或者其中Xaa6选自高平均柔性的氨基酸(例如,Xaa6选自G或R);或者其中Xaa7选自高平均柔性的氨基酸(例如,Xaa7选自D、E、K、P、I、N、Q或S);或者其中Xaa7选自低溶解性的氨基酸(例如,Xaa7选自N、E);或者其中Xaa8选自低溶解性的氨基酸(例如,Xaa8选自N、E或D);或者其中Xaa8选自中等可突变性的氨基酸(例如,Xaa8选自R或H);或者其中Xaa9选自低可突变性的氨基酸(例如,Xaa9选自P或K);或者其中Xaa9选自高平均柔性的氨基酸(例如,Xaa9选自D、E、P或S);或者其中Xaa9选自高溶解性的氨基酸(例如,Xaa9选自M或V);或它们的任何组合。
在一些实施方案中,Xaa1选自高平均柔性的氨基酸。在一些实施方案中,Xaa1选自D、E、P、G、Q、S或R。在一些实施方案中,Xaa1选自高氢键供体的氨基酸。在一些实施方案中,Xaa1选自R。在一些实施方案中,Xaa1选自高摩尔质量的氨基酸。在一些实施方案中,Xaa1选自Y、W、R或F。在一些实施方案中,Xaa2选自低溶解性的氨基酸。在一些实施方案中,Xaa2选自N或E。在一些实施方案中,Xaa3选自低平均柔性的氨基酸。在一些实施方案中,Xaa3选自W、M或F。在一些实施方案中,Xaa3选自低可突变性的氨基酸。在一些实施方案中,Xaa3选自R、H、K、P、Y、F、L或C。在一些实施方案中,Xaa4选自低可突变性的氨基酸。在一些实施方案中,Xaa4选自C。在一些实施方案中,Xaa5选自高可突变性的氨基酸。在一些实施方案中,Xaa5选自N。在一些实施方案中,Xaa5选自中等摩尔质量的氨基酸。在一些实施方案中,Xaa5选自D、I、L或N。在一些实施方案中,Xaa6选自高摩尔质量的氨基酸。在一些实施方案中,Xaa6选自Y、W、R或F。在一些实施方案中,Xaa6选自高平均柔性的氨基酸。在一些实施方案中,Xaa6选自G、R。在一些实施方案中,Xaa7选自高平均柔性的氨基酸。在一些实施方案中,Xaa7选自D、E、K、P、I、N、Q或S。在一些实施方案中,Xaa7选自低溶解性的氨基酸。在一些实施方案中,Xaa7选自N或E。在一些实施方案中,Xaa8选自低溶解性的氨基酸。在一些实施方案中,Xaa8选自N、E或D。在一些实施方案中,Xaa8选自中等可突变性的氨基酸。在一些实施方案中,Xaa8选自R或H。在一些实施方案中,Xaa9选自低可突变性的氨基酸。在一些实施方案中,Xaa9选自P或K。在一些实施方案中,Xaa9选自高平均柔性的氨基酸。在一些实施方案中,Xaa9选自D、E、P或S。在一些实施方案中,Xaa9选自高溶解性的氨基酸。在一些实施方案中,Xaa9选自M或V。
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:20118-SEQ ID NO:21117的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的淋巴结组织嗜性。
C.富集的淋巴结序列
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID N0:21118-SEQ ID N0:22117的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的淋巴结组织嗜性。
6.7.18.体内选定的赋予增加的皮肤嗜性的突变VP多肽
本公开提供了具有VP衣壳多肽的AAV5病毒体,所述VP衣壳多肽在具有与靶细胞(例如,目标靶皮肤组织中的靶皮肤细胞)相互作用的残基的区域中具有至少一个突变,其中与野生型VP衣壳多肽相比,所述至少一个突变赋予增加的皮肤组织嗜性。在一些实施方案中,本文提供了与SEQ ID NO:1具有至少80%序列同源性的AAV5 VP1衣壳多肽,其中所述AAV5 VP1衣壳多肽在从对应于SEQ ID NO:1的581的位置至对应于589的位置的区域中具有至少一个突变,并且其中所述至少一个突变驱动增加的皮肤嗜性。以下序列规则和序列也适用于对应于AAV5 VP1氨基酸残基581至589的AAV5 VP2(氨基酸残基445至453;VP2序列显示于SEQ ID NO:1115)和AAV5 VP3(氨基酸残基389至397;VP3序列显示于SEQ ID NO:1116)中的区域。因此,本公开涵盖在对应于58l至589区域的AAV5 VP1氨基酸残基的VP2和VP3区域中具有一个或多个突变的AAV5 VP2衣壳多肽和AAV5 VP3衣壳多肽,其中所述一个或多个突变与以下章节中的规则或顺序相称。
A.位置频率规则
在本章节中,除非另外说明,否则分析相对于给定氨基酸残基出现在所有其他所收获组织(CNS(前脑皮层、枕叶皮层、颞叶皮层、丘脑、下丘脑、黑质、海马DG、海马CA1、海马CA3、小脑)、肝脏、骨骼肌、心脏、肺、脾脏、淋巴结、骨髓、乳腺、肾上腺、甲状腺、结肠、坐骨神经和脊髓组织)中鉴定的变体中指定位置的频率而言该给定氨基酸残基出现在皮肤中鉴定的变体中对应于SEQ ID NO:1(推及于SEQ ID NO:2)的位置581至位置589的所述指定位置的频率,以确定优先靶向皮肤组织的衣壳的一组序列规则。来自体内数据的位置频率规则的确定详细描述于实施例17中。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的皮肤组织嗜性,其中工程化变体AAV5 VP1衣壳多肽序列具有一个或多个突变,其中Xaa1选自A、C、K、Q、R或T,或Xaa1选自C、K或R,或Xaa1为C;或Xaa2选自A、C、I、S、T或V,或Xaa2选自A、S、T或V,或Xaa2为V;或Xaa3选自A、C、F、G、M、Q、S或V,或Xaa3选自A、C、F、M或Q,或Xaa3为C;或Xaa4选自C、K、L、P、R或W,或Xaa4选自L、P或R,或Xaa4为R;或Xaa5选自F、H、I、M、V或Y,或Xaa5选自M、V或Y,或Xaa5为Y;或Xaa6选自F、H、I、M、N、Q或S,或Xaa6选自M、N或Q,或Xaa6为N;或Xaa7选自A、H、K、M、N、R或V,或Xaa7为A、H、K或R,或Xaa7为K;或Xaa8选自A、F、G、H、S或Y,或Xaa8选自A、F或S,或Xaa8为S;或Xaa9选自A、E、G、P、Q、R或S,或Xaa9选自A、Q或S,或Xaa9为A。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的皮肤组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变选自以下规则。在一些实施方案中,Xaa1选自A、C、K、Q、R或T。在一些实施方案中,Xaa1选自C、K或R。在一些实施方案中,Xaa1为C。在一些实施方案中,Xaa2选自A、C、I、S、T或V。在一些实施方案中,Xaa2选自A、S、T或V。在一些实施方案中,Xaa2为V。在一些实施方案中,Xaa3选自A、C、F、G、M、Q、S或V。在一些实施方案中,Xaa3选自A、C、F、M或Q。在一些实施方案中,Xaa3为C。在一些实施方案中,Xaa4选自C、K、L、P、R或W。在一些实施方案中,Xaa4选自L、P或R。在一些实施方案中,Xaa4为R。在一些实施方案中,Xaa5选自F、H、I、M、V或Y。在一些实施方案中,Xaa5选自M、V或Y。在一些实施方案中,Xaa5为Y。在一些实施方案中,Xaa6选自F、H、I、M、N、Q或S。在一些实施方案中,Xaa6选自M、N或Q。在一些实施方案中,Xaa6为N。在一些实施方案中,Xaa7选自A、H、K、M、N、R或V。在一些实施方案中,Xaa7为A、H、K或R。在一些实施方案中,Xaa7为K。在一些实施方案中,Xaa8选自A、F、G、H、S或Y。在一些实施方案中,Xaa8选自A、F或S。在一些实施方案中,Xaa8为S。在一些实施方案中,Xaa9选自A、E、G、P、Q、R或S。在一些实施方案中,Xaa9选自A、Q或S。在一些实施方案中,Xaa9为A。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的皮肤组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变选自以下规则:Xaa1选自A、C、K、Q、R或T,Xaa2选自A、C、I、S、T或V,Xaa3选自A、C、F、G、M、Q、S或V,Xaa4选自C、K、L、P、R或W,Xaa5选自F、H、I、M、V或Y,Xaa6选自F、H、I、M、N、Q或S,Xaa7选自A、H、K、M、N、R或V,Xaa8选自A、F、G、H、S或Y,并且Xaa9选自A、E、G、P、Q、R或S。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的皮肤组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VPl多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变如下:Xaa1选自A、C、K、Q、R或T,Xaa2选自A、C、I、S、T或V,Xaa3选自A、C、F、G、M、Q、S或V,Xaa4选自C、K、L、P、R或W,Xaa5选自F、H、I、M、V或Y,Xaa6选自F、H、I、M、N、Q或S,Xaa7选自A、H、K、M、N、R或V,Xaa8选自A、F、G、H、S或Y,Xaa9选自A、E、G、P、Q、R或S,或它们的任何组合。
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:31991-SEQ ID NO:32990的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的皮肤组织嗜性。
B.ML规则
对于本段中描述的以下一组规则,使用体内数据和两个ML模型(描述于实施例40)确定工程化AAV5 VP1衣壳多肽的581至589区域中每个位置处的有利生物物理特性和有利氨基酸残基。本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与具有野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述组装的病毒体表现出增加的皮肤组织嗜性,其中工程化AAV5 VP衣壳多肽序列具有一个或多个突变,其中工程化AAV5 VP1衣壳多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中Xaa1选自低表面可接近性的氨基酸(例如,Xaa1选自C);或者其中Xaa1选自低体积的氨基酸(例如,Xaa1选自C);或者其中Xaa1选自低可突变性的氨基酸(例如,Xaa1选自C);或者其中Xaa2选自高表面可接近性的氨基酸(例如,Xaa2选自R或K);或者其中Xaa2选自高平均柔性的氨基酸(例如,Xaa2选自K、I或N);或者其中Xaa2选自低可突变性的氨基酸(例如,Xaa2选自P或K);或者其中Xaa3选自高亲疏水性的氨基酸(例如,Xaa3选自I或V);或者其中Xaa4选自低可突变性的氨基酸(例如,Xaa4选自L、F或Y);或者其中Xaa4选自低平均柔性的氨基酸(例如,Xaa4选自W、H、F或M);或者其中Xaa5选自高平均柔性的氨基酸(例如,Xaa5选自G、R、K、I或N);或者其中Xaa6选自高平均柔性的氨基酸(例如,Xaa6选自G、R、K、I或N);或者其中Xaa8选自高表面可接近性的氨基酸(例如,Xaa8选自M、G或F);或者其中Xaa8选自低平均柔性的氨基酸(例如,Xaa8选自H、F、M或W);或者其中Xaa8选自低可突变性的氨基酸(例如,Xaa8选自L、F、Y);或者其中Xaa9选自高平均柔性的氨基酸(例如,Xaa9选自D、E、R、K、P或G);或者其中Xaa9选自高可突变性的氨基酸(例如,Xaa9选自D、E、R、V、A或H);或它们的任何组合。
在一些实施方案中,Xaa1选自低表面可接近性的氨基酸。在一些实施方案中,Xaa1选自C。在一些实施方案中,Xaa1选自低体积的氨基酸。在一些实施方案中,Xaa1选自C。在一些实施方案中,Xaa1选自低可突变性的氨基酸。在一些实施方案中,Xaa1选自C。在一些实施方案中,Xaa2选自高表面可接近性的氨基酸。在一些实施方案中,Xaa2选自R或K。在一些实施方案中,Xaa2选自高平均柔性的氨基酸。在一些实施方案中,Xaa2选自K、I或N。在一些实施方案中,Xaa2选自低可突变性的氨基酸。在一些实施方案中,Xaa2选自P或K。在一些实施方案中,Xaa3选自高亲疏水性的氨基酸。在一些实施方案中,Xaa3选自I或V。在一些实施方案中,Xaa4选自低可突变性的氨基酸。在一些实施方案中,Xaa4选自L、F或Y。在一些实施方案中,Xaa4选自低平均柔性的氨基酸。在一些实施方案中,Xaa4选自W、H、F或M。在一些实施方案中,Xaa5选自高平均柔性的氨基酸。在一些实施方案中,Xaa5选自G、R、K、I或N。在一些实施方案中,Xaa6选自高平均柔性的氨基酸。在一些实施方案中,Xaa6选自G、R、K、I或N。在一些实施方案中,Xaa8选自高表面可接近性的氨基酸。在一些实施方案中,Xaa8选自M、G或F。在一些实施方案中,Xaa8选自低平均柔性的氨基酸。在一些实施方案中,Xaa8选自H、F、M或W。在一些实施方案中,Xaa8选自低可突变性的氨基酸。在一些实施方案中,Xaa8选自L、F或Y。在一些实施方案中,Xaa9选自高平均柔性的氨基酸。在一些实施方案中,Xaa9选自D、E、R、K、P或G。在一些实施方案中,Xaa9选自高可突变性的氨基酸。在一些实施方案中,Xaa9选自D、E、R、V、A或H。
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:32991-SEQ ID NO:33990的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的皮肤组织嗜性。
C.富集的皮肤序列
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:33991-SEQ ID NO:34990的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的皮肤组织嗜性。
6.7.19.体内选定的赋予增加的骨髓嗜性的突变VP多肽
本公开提供了具有VP衣壳多肽的AAV5病毒体,所述VP衣壳多肽在具有与靶细胞(例如,目标靶骨髓组织中的靶骨髓细胞)相互作用的残基的区域中具有至少一个突变,其中与野生型VP衣壳多肽相比,所述至少一个突变赋予增加的骨髓组织嗜性。在一些实施方案中,本文提供了与SEQ ID NO:1具有至少80%序列同源性的AAV5 VP1衣壳多肽,其中所述AAV5 VP1衣壳多肽在从对应于SEQ ID NO:1的581的位置至对应于589的位置的区域中具有至少一个突变,并且其中所述至少一个突变驱动增加的骨髓嗜性。以下序列规则和序列也适用于对应于AAV5 VP1氨基酸残基581至589的AAV5 VP2(氨基酸残基445至453;VP2序列显示于SEQ ID NO:1115)和AAV5 VP3(氨基酸残基389至397;VP3序列显示于SEQ ID NO:1116)中的区域。因此,本公开涵盖在对应于581至589区域的AAV5 VP1氨基酸残基的VP2和VP3区域中具有一个或多个突变的AAV5 VP2衣壳多肽和AAV5 VP3衣壳多肽,其中所述一个或多个突变与以下章节中的规则或顺序相称。
A.位置频率规则
在本章节中,除非另外说明,否则分析相对于给定氨基酸残基出现在所有其他所收获组织(CNS(前脑皮层、枕叶皮层、颞叶皮层、丘脑、下丘脑、黑质、海马DG、海马CA1、海马CA3、小脑)、肝脏、骨骼肌、心脏、肺、脾脏、淋巴结、乳腺、皮肤、肾上腺、甲状腺、结肠、坐骨神经和脊髓组织)中鉴定的变体中指定位置的频率而言该给定氨基酸残基出现在骨髓中鉴定的变体中对应于SEQ ID NO:1(推及于SEQ ID NO:2)的位置581至位置589的所述指定位置的频率,以确定优先靶向骨髓组织的衣壳的一组序列规则。来自体内数据的位置频率规则的确定详细描述于实施例18中。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的骨髓组织嗜性,其中工程化变体AAV5 VP1衣壳多肽序列具有一个或多个突变,其中Xaa1选自A、E、G、Q、S或T,或Xaa1选自A、E或T,或Xaa1为E;或Xaa2选自A、I、Q、S、T、V或Y,或Xaa2选自A、S、T,或Xaa2为A;或Xaa3选自A、G、I、M、Q、S或T,或Xaa3选自A、Q或T,或Xaa3为Q;或Xaa4选自A、E、P、Q、T或V,或Xaa4选自A、P或Q,或Xaa4为Q;或Xaa5选自F、I、L、M、Q、V或Y,或Xaa5选自F、V或Y,或Xaa5为V;或Xaa6选自F、I、N、Q、S或V,或Xaa6选自I、N、Q或S,或Xaa6为S;或Xaa7选自A、C、M、S或V,或Xaa7为A、C或V,或Xaa7为C;或Xaa8选自A、C、D、G、M、S或Y,或Xaa8选自A、M、S或Y,或Xaa8为M;或Xaa9选自D、E、G、L、P、S或Y,或Xaa9选自D、E或P,或Xaa9为P。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的骨髓组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变选自以下规则。在一些实施方案中,Xaa1选自A、E、G、Q、S或T。在一些实施方案中,Xaa1选自A、E或T。在一些实施方案中,Xaa1为E。在一些实施方案中,Xaa2选自A、I、Q、S、T、V或Y。在一些实施方案中,Xaa2选自A、S、T。在一些实施方案中,Xaa2为A。在一些实施方案中,Xaa3选自A、G、I、M、Q、S或T。在一些实施方案中,Xaa3选自A、Q或T。在一些实施方案中,Xaa3为Q。在一些实施方案中,Xaa4选自A、E、P、Q、T或V。在一些实施方案中,Xaa4选自A、P或Q。在一些实施方案中,Xaa4为Q。在一些实施方案中,Xaa5选自F、I、L、M、Q、V或Y。在一些实施方案中,Xaa5选自F、V或Y。在一些实施方案中,Xaa5为V。在一些实施方案中,Xaa6选自F、I、N、Q、S或V。在一些实施方案中,Xaa6选自I、N、Q或S。在一些实施方案中,Xaa6为S。在一些实施方案中,Xaa7选自A、C、M、S或V。在一些实施方案中,Xaa7为A、C或V。在一些实施方案中,Xaa7为C。在一些实施方案中,Xaa8选自A、C、D、G、M、S或Y。在一些实施方案中,Xaa8选自A、M、S或Y。在一些实施方案中,Xaa8为M。在一些实施方案中,Xaa9选自D、E、G、L、P、S或Y。在一些实施方案中,Xaa9选自D、E或P。在一些实施方案中,Xaa9为P。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的骨髓组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变选自以下规则:Xaa1选自A、E、G、Q、S或T,Xaa2选自A、I、Q、S、T、V或Y,Xaa3选自A、G、I、M、Q、S或T,Xaa4选自A、E、P、Q、T或V,Xaa5选自F、I、L、M、Q、V或Y,Xaa6选自F、I、N、Q、S或V,Xaa7选自A、C、M、S或V,Xaa8选自A、C、D、G、M、S或Y,并且Xaa9选自D、E、G、L、P、S或Y。
本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与野生型AAV5 VP衣壳多肽相比,所述组装的病毒体表现出增加的骨髓组织嗜性,其中工程化变体AAV5 VP衣壳多肽序列具有一个或多个突变,其中VP1多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中所述一个或多个突变如下:Xaa1选自A、E、G、Q、S或T,Xaa2选自A、I、Q、S、T、V或Y,Xaa3选自A、G、I、M、Q、S或T,Xaa4选自A、E、P、Q、T或V,Xaa5选自F、I、L、M、Q、V或Y,Xaa6选自F、I、N、Q、S或V,Xaa7选自A、C、M、S或V,Xaa8选自A、C、D、G、M、S或Y,Xaa9选自D、E、G、L、P、S或Y,或它们的任何组合。
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:4118-SEQ ID NO:5117的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的骨髓组织嗜性。
B.ML规则
对于本段中描述的以下一组规则,使用体内数据和两个ML模型(描述于实施例32)确定工程化AAV5 VP1衣壳多肽的581至589区域中每个位置处的有利生物物理特性和有利氨基酸残基。本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与具有野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述组装的病毒体表现出增加的骨髓组织嗜性,其中工程化AAV5 VP衣壳多肽序列具有一个或多个突变,其中工程化AAV5 VP1衣壳多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中Xaa1选自高亲疏水性的氨基酸(例如,Xaa1选自V、I或L);或者其中Xaa1选自低可突变性的氨基酸(例如,Xaa1选自Y、L、F或C);或者其中Xaa2选自低亲疏水性的氨基酸(例如,Xaa2选自Y或W);或者其中Xaa2选自高摩尔质量的氨基酸(例如,Xaa2选自W);或者其中Xaa2选自低表面可接近性的氨基酸(例如,Xaa2选自W或A);或者其中Xaa2选自低亲水性的氨基酸(例如,Xaa2选自W);或者其中Xaa2选自低可突变性的氨基酸(例如,Xaa2选自C);或者其中Xaa2选自低平均柔性的氨基酸(例如,Xaa2选自W、M或F);或者其中Xaa5选自低平均柔性的氨基酸(例如,Xaa5选自W、M或F);或者其中Xaa6选自低平均柔性的氨基酸(例如,Xaa6选自W、M或F);或者其中Xaa6选自低可突变性的氨基酸(例如,Xaa6选自Y、F、L或C);或者其中Xaa6选自高溶解性的氨基酸(例如,Xaa6选自W、F、I或L);或者其中Xaa7选自低表面可接近性的氨基酸(例如,Xaa7选自C);或者其中Xaa7选自高表面可接近性的氨基酸(例如,Xaa7选自D或N);或者其中Xaa7选自低可突变性的氨基酸(例如,Xaa7选自C);或者其中Xaa7选自高溶解性的氨基酸(例如,Xaa7选自C);或者其中Xaa7选自低溶解性的氨基酸(例如,Xaa7选自D);或者其中Xaa8选自低电荷的氨基酸(例如,Xaa8选自D或E);或者其中Xaa8选自高可突变性的氨基酸(例如,Xaa8选自D、E、A或T);或者其中Xaa9选自高摩尔质量的氨基酸(例如,Xaa9选自H或F);或者其中Xaa9选自低可突变性的氨基酸(例如,Xaa9选自Y、F或L);或它们的任何组合。
在一些实施方案中,Xaa1选自高亲疏水性的氨基酸。在一些实施方案中,Xaa1选自V、I或L。在一些实施方案中,Xaa1选自低可突变性的氨基酸。在一些实施方案中,Xaa1选自Y、L、F或C。在一些实施方案中,Xaa2选自低亲疏水性的氨基酸。在一些实施方案中,Xaa2选自Y或W。在一些实施方案中,Xaa2选自高摩尔质量的氨基酸。在一些实施方案中,Xaa2选自W。在一些实施方案中,Xaa2选自低表面可接近性的氨基酸。在一些实施方案中,Xaa2选自W或A。在一些实施方案中,Xaa2选自低亲水性的氨基酸。在一些实施方案中,Xaa2选自W。在一些实施方案中,Xaa2选自低可突变性的氨基酸。在一些实施方案中,Xaa2选自C。在一些实施方案中,Xaa2选自低平均柔性的氨基酸。在一些实施方案中,Xaa2选自W、M或F。在一些实施方案中,Xaa5选自低平均柔性的氨基酸。在一些实施方案中,Xaa5选自W、M或F。在一些实施方案中,Xaa6选自低平均柔性的氨基酸。在一些实施方案中,Xaa6选自W、M或F。在一些实施方案中,Xaa6选自低可突变性的氨基酸。在一些实施方案中,Xaa6选自Y、F、L或C。在一些实施方案中,Xaa6选自高溶解性的氨基酸。在一些实施方案中,Xaa6选自W、F、I或L。在一些实施方案中,Xaa7选自低表面可接近性的氨基酸。在一些实施方案中,Xaa7选自C。在一些实施方案中,Xaa7选自高表面可接近性的氨基酸。在一些实施方案中,Xaa7选自D或N。在一些实施方案中,Xaa7选自低可突变性的氨基酸。在一些实施方案中,Xaa7选自C。在一些实施方案中,Xaa7选自高溶解性的氨基酸。在一些实施方案中,Xaa7选自C。在一些实施方案中,Xaa7选自低溶解性的氨基酸。在一些实施方案中,Xaa7选自D。在一些实施方案中,Xaa8选自低电荷的氨基酸。在一些实施方案中,Xaa8选自D或E。在一些实施方案中,Xaa8选自高可突变性的氨基酸。在一些实施方案中,Xaa8选自D、E、A或T。在一些实施方案中,Xaa9选自高摩尔质量的氨基酸。在一些实施方案中,Xaa9选自H或F。在一些实施方案中,Xaa9选自低可突变性的氨基酸。在一些实施方案中,Xaa9选自Y、F或L。
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:5118-SEQ ID NO:6117的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的骨髓组织嗜性。
C.富集的骨髓序列
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:6118-SEQ ID NO:7117的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的骨髓组织嗜性。
6.7.20.体内选定的赋予增加的骨骼肌嗜性或心肌嗜性的突变VP多肽
A.ML规则
对于本段中描述的以下一组规则,使用体内数据和两个ML模型(描述于实施例22)确定工程化AAV5 VP1衣壳多肽的581至589区域中每个位置处的有利生物物理特性和有利氨基酸残基。本文公开了能够形成组装的病毒体的工程化AAV5 VP衣壳多肽,与具有野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述组装的病毒体表现出增加的骨骼肌组织嗜性或心肌组织嗜性,其中工程化AAV5 VP衣壳多肽序列具有一个或多个突变,其中工程化AAV5VP1衣壳多肽序列在从对应于SEQ ID NO:2中的581的位置至对应于SEQ ID NO:2中的589的位置的区域中具有所述一个或多个突变,并且其中Xaa1选自低溶解性的氨基酸(例如,Xaa1选自D、E、R、K、P、N或Q);或者其中Xaa1选自低亲疏水性的氨基酸(例如,Xaa1选自D、E、R、K、Q、N、Y或P);或者其中Xaa1选自高表面可接近性的氨基酸(例如,Xaa1选自E、R或K);或者其中Xaa2选自高亲疏水性的氨基酸(例如,Xaa2选自V、I、F、L或C);或者其中Xaa2选自低可突变性的氨基酸(例如,Xaa2选自R、V、I、H或C);或者其中Xaa2选自中等体积的氨基酸(例如,Xaa2选自E、V或Q);或者其中Xaa3选自低溶解性的氨基酸(例如,Xaa3选自D、R或Q);或者其中Xaa4选自低溶解性的氨基酸(例如,Xaa4选自D、E、P或N);或者其中Xaa4选自低电荷的氨基酸(例如,Xaa4选自D或E);或者其中Xaa5选自低氨基酸溶解性的氨基酸(例如,Xaa5选自D、E、R、K、N或Q);或者其中Xaa8选自低溶解性的氨基酸(例如,Xaa8选自D、E、K、P或N);或者其中Xaa8选自高柔性指数的氨基酸(例如,Xaa8选自Q、S、P、E或D);或者其中Xaa8选自高表面可接近性的氨基酸(例如,Xaa8选自S、D、P、N、E、R或K);或它们的任何组合。
在一些实施方案中,Xaa1选自低溶解性的氨基酸。在一些实施方案中,Xaa1选自D、E、R、K、P、N或Q。在一些实施方案中,Xaa1选自低亲疏水性的氨基酸。在一些实施方案中,Xaa1选自D、E、R、K、Q、N、Y或P。在一些实施方案中,Xaa1选自高表面可接近性的氨基酸。在一些实施方案中,Xaa1选自E、R或K。在一些实施方案中,Xaa2选自高亲疏水性的氨基酸。在一些实施方案中,Xaa2选自V、I、F、L或C。在一些实施方案中,Xaa2选自低可突变性的氨基酸。在一些实施方案中,Xaa2选自R、V、I、H或C。在一些实施方案中,Xaa2选自中等体积的氨基酸。在一些实施方案中,Xaa2选自E、V或Q。在一些实施方案中,Xaa3选自低溶解性的氨基酸。在一些实施方案中,Xaa3选自D、R或Q。在一些实施方案中,Xaa4选自低溶解性的氨基酸。在一些实施方案中,Xaa4选自D、E、P或N。在一些实施方案中,Xaa4选自低电荷的氨基酸。在一些实施方案中,Xaa4选自D或E。在一些实施方案中,Xaa5选自低氨基酸溶解性的氨基酸。在一些实施方案中,Xaa5选自D、E、R、K、N或Q。在一些实施方案中,Xaa8选自低溶解性的氨基酸。在一些实施方案中,Xaa8选自D、E、K、P或N。在一些实施方案中,Xaa8选自高柔性指数的氨基酸。在一些实施方案中,Xaa8选自Q、S、P、E或D。在一些实施方案中,Xaa8选自高表面可接近性的氨基酸。在一些实施方案中,Xaa8选自S、D、P、N、E、R或K。
在一些实施方案中,本文提供了AAV5 VP衣壳多肽,所述多肽在从对应于AAV5 VP1的581的位置至对应于589的位置的区域中具有至少一个突变并且与选自SEQ ID NO:25118-SEQ ID NO:26117的任何序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少99%或100%序列同一性,其中所述至少一个突变驱动增加的骨骼肌组织嗜性和心肌组织嗜性。
1.1.编号的实施方案
本文公开了许多组合物和方法。这些组合物和方法的具体实例性实施方案在下文公开。以下实施方案列举了本文公开的特征的组合的非限制性排列。还设想了特征组合的其他排列。特别地,这些编号的实施方案中的每一者被设想为依赖于每个先前或随后的编号实施方案或与之相关,而与它们所列出的顺序无关。
在另一方面,提供了以下实施方案。对前述实施方案的所有数字参考是指在同一小节内如此编号的实施方案。在又一方面,提供了包含以下编号实施方案的重组或工程化VP衣壳多肽的rAAV,以及使用包含所述rAAV的药物组合物治疗有需要的受试者的方法。
A系列实施方案
在A系列实施方案中,“重组”腺相关(AAV)VP1衣壳多肽与“工程化”腺相关(AAV)VP1衣壳多肽同义。
1.一种具有SEQ ID NO:2的氨基酸序列的重组腺相关病毒(AAV)VP1衣壳多肽,其中Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自A、R、N、D、C、E、Q、G、H、I、L、K、M、F、P、S、T、W、Y和V;并且其中所述多肽不具有SEQ ID NO:1、SEQ ID NO:3、SEQ IDNO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。2.一种重组腺相关病毒(AAV)VP1衣壳多肽,所述多肽在对应于SEQ ID NO:l中残基581至残基589的残基中具有至少一个突变,其中所述突变赋予相较于第二组织对第一组织的组织嗜性,并且其中AAV VP1衣壳多肽不具有SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。3.如实施方案2所述的重组AAVVP1衣壳多肽,其中所述AAV VP1衣壳多肽是AAV5 VP1衣壳多肽。4.如实施方案1-3中任一项所述的重组AAV VP1衣壳多肽,其中对应于SEQ ID NO:1的残基581-589处的残基的特定顺序导致特定的组织嗜性。5.如实施方案1-4中任一项所述的重组AAV VP1衣壳多肽,其中所述第一组织选自脂肪、肾上腺、主动脉、脑(包括海马:齿状回、CAl和CA3;小脑、尾状核、壳核、中脑、脑桥、下丘脑、皮层-包括枕叶、颞叶和前脑;黑质和丘脑)、骨髓、盲肠、结肠、背根神经节、十二指肠、附睾、食管、眼睛、胆囊、心脏、回肠、空肠、肾脏、肺、淋巴结、乳腺、卵巢、胰腺、甲状旁腺、周围神经、垂体、前列腺、唾液腺、精囊、骨骼肌、皮肤、脊髓、脾脏、胃、睾丸、胸腺、甲状腺、气管、膀胱、子宫和阴道;其中所述第二组织选自:脂肪、肾上腺、主动脉、脑(包括海马:齿状回、CA1和CA3;小脑、尾状核、壳核、中脑、脑桥、下丘脑、皮层-包括枕叶、颞叶和前脑;黑质和丘脑)、骨髓、盲肠、结肠、背根神经节、十二指肠、附睾、食管、眼睛、胆囊、心脏、回肠、空肠、肾脏、肺、淋巴结、乳腺、卵巢、胰腺、甲状旁腺、周围神经、垂体、前列腺、唾液腺、精囊、骨骼肌、皮肤、脊髓、脾脏、胃、睾丸、胸腺、甲状腺、气管、膀胱、子宫和阴道;并且其中所述第一组织和所述第二组织是不同的。6.如实施方案2-4中任一项所述的重组AAVVP1衣壳多肽,其中与具有SEQ ID NO:1的VP1衣壳多肽的rAAV相比,所述rAAV在静脉内施用后具有增强的感染选自以下的组织的能力:脂肪、肾上腺、主动脉、脑(包括海马:齿状回、CA1和CA3;小脑、尾状核、壳核、中脑、脑桥、下丘脑、皮层-包括枕叶、颞叶和前脑;黑质和丘脑)、骨髓、盲肠、结肠、背根神经节、十二指肠、附睾、食管、眼睛、胆囊、心脏、回肠、空肠、肾脏、肺、淋巴结、乳腺、卵巢、胰腺、甲状旁腺、周围神经、垂体、前列腺、唾液腺、精囊、骨骼肌、皮肤、脊髓、脾脏、胃、睾丸、胸腺、甲状腺、气管、膀胱、子宫和阴道。7.如实施方案2-6中任一项所述的重组AAV VP1衣壳多肽,其中所述rAAV表现出在第一组织中相较于第二组织约1.0005倍至约1000倍增加的积聚。8.如实施方案2-6中任一项所述的重组AAV VP1衣壳多肽,其中所述rAAV表现出在第一组织中相较于第二组织至少约1.0005倍、至少约两倍、至少约三倍、至少约四倍、至少约五倍、至少约十倍、至少约二十倍、至少约50倍、至少约75倍、至少约100倍、至少约1000倍增加的积聚。9.如前述实施方案中任一项所述的重组衣壳多肽,所述重组衣壳多肽在581-589区域之外的氨基酸残基处还包含一个或多个突变,其中在581-589区域之外的氨基酸残基处的所述一个或多个突变赋予改进的可制造性、改进的病毒组装、提高的组织靶向性/嗜性,或它们的任何组合。10.如实施方案1-9中任一项所述的重组AAV VP1衣壳多肽,其中Xaa1选自A、G、K、M、N、Q、R、S或T。11.如前述实施方案中任一项所述的重组衣壳多肽,其中Xaa1选自A、K、M或T。12.如前述实施方案中任一项所述的重组衣壳多肽,其中Xaa1为K。13.如前述实施方案中任一项所述的重组衣壳多肽,其中Xaa2选自A、C、H、I、K、S、T或V。14.如前述实施方案中任一项所述的重组衣壳多肽,其中Xaa2选自A、S、T或V。15.如前述实施方案中任一项所述的重组衣壳多肽,其中Xaa2为T。16.如前述实施方案中任一项所述的重组衣壳多肽,其中Xaa3选自A、G、H、K、M、N、Q、R、S、T或V。17.如前述实施方案中任一项所述的重组衣壳多肽,其中Xaa3选自A、M或T。18.如前述实施方案中任一项所述的重组衣壳多肽,其中Xaa3包括A或T。19.如前述实施方案中任一项所述的重组衣壳多肽,其中Xaa4选自L、M、P、Q、R、T或W。20.如前述实施方案中任一项所述的重组衣壳多肽,其中Xaa4选自L、P、Q或T。21.如前述实施方案中任一项所述的重组衣壳多肽,其中Xaa4为P;22.如前述实施方案中任一项所述的重组衣壳多肽,其中Xaa5选自F、H、I、K、M、T或Y。23.如前述实施方案中任一项所述的重组衣壳多肽,其中Xaa5选自H、I或Y。24.如前述实施方案中任一项所述的重组衣壳多肽,其中Xaa5为Y。25.如前述实施方案中任一项所述的重组衣壳多肽,其中Xaa6选自E、G、H、L、M、N、Q、T或W。26.如前述实施方案中任一项所述的重组衣壳多肽,其中Xaa6选自N或Q。27.如前述实施方案中任一项所述的重组衣壳多肽,其中Xaa6为N。28.如前述实施方案中任一项所述的重组衣壳多肽,其中Xaa7选自A、C、G、H、L、M、R或S。29.如前述实施方案中任一项所述的重组衣壳多肽,其中Xaa7选自A、C、H或M。30.如前述实施方案中任一项所述的重组衣壳多肽,其中Xaa7为A。31.如前述实施方案中任一项所述的重组衣壳多肽,其中Xaa8选自A、C、D、F、G、H、M、Q、S、V、W或Y。32.如前述实施方案中任一项所述的重组衣壳多肽,其中Xaa8选自G、M、Q或S。33.如前述实施方案中任一项所述的重组衣壳多肽,其中Xaa8为G。34.如前述实施方案中任一项所述的重组衣壳多肽,其中Xaa9选自A、C、E、G、H、M、N、P、Q、S、V或W。35.如前述实施方案中任一项所述的重组衣壳多肽,其中Xaa9选自E、G或P。36.如前述实施方案中任一项所述的重组衣壳多肽,其中Xaa9为G。37.如实施方案1-9中任一项所述的重组衣壳多肽,其中Xaa1选自A、D、E、G、L、M、N、Q、S、T或V。38.如实施方案37所述的重组衣壳多肽,其中Xaa1选自A、D、E、M或T。39.如实施方案37所述的重组衣壳多肽,其中Xaa1为E。40.如实施方案37-39中任一项所述的重组衣壳多肽,其中Xaa2选自A、C、D、E、G、H、I、N、P、Q、S、T或V。41.如实施方案37-40中任一项所述的重组衣壳多肽,其中Xaa2选自A、S、T或V。42.如实施方案37-41中任一项所述的重组衣壳多肽,其中Xaa2为A。43.如实施方案37-42中任一项所述的重组衣壳多肽,其中Xaa3选自A、D、E、G、H、M、N、Q、S、T或V。44.如实施方案37-43中任一项所述的重组衣壳多肽,其中Xaa3选自D、E、N、Q或T。45如实施方案37-44中任一项所述的重组衣壳多肽,其中Xaa3为D或T。46.如实施方案37-45中任一项所述的重组衣壳多肽,其中Xaa4选自A、D、E、G、H、N、P、Q、S或T。47.如实施方案37-46中任一项所述的重组衣壳多肽,其中Xaa4选自D、E、P或Q。48.如实施方案37-47中任一项所述的重组衣壳多肽,其中Xaa4为E。49.如实施方案37-48中任一项所述的重组衣壳多肽,其中Xaa5选自A、C、D、E、G、H、N、Q、S、T或Y。50.如实施方案37-49中任一项所述的重组衣壳多肽,其中Xaa5选自D、E、N、Q或T。51.如实施方案37-50中任一项所述的重组衣壳多肽,其中Xaa5为N。52.如实施方案37-51中任一项所述的重组衣壳多肽,其中Xaa6选自A、D、E、G、H、N、P、Q、S或T。53.如实施方案37-52中任一项所述的重组衣壳多肽,其中Xaa6选自D、N或Q。54.如实施方案37-53中任一项所述的重组衣壳多肽,其中Xaa6为D。55.如实施方案37-54中任一项所述的重组衣壳多肽,其中Xaa7选自A、C、D、E、G、H、N、Q、S或T。56.如实施方案37-55中任一项所述的重组衣壳多肽,其中Xaa7选自A、D、E或G。57.如实施方案37-56中任一项所述的重组衣壳多肽,其中Xaa7为A。58.如实施方案37-57中任一项所述的重组衣壳多肽,其中Xaa8选自A、C、D、E、G、H、N、Q、S或T。59.如实施方案37-58中任一项所述的重组衣壳多肽,其中Xaa8包括A、D、G或S。60.如实施方案37-59中任一项所述的重组衣壳多肽,其中Xaa8为G。61.如实施方案37-60中任一项所述的重组衣壳多肽,其中Xaa9选自A、D、E、G、H、N、P、Q、S或T。62.如实施方案37-61中任一项所述的重组衣壳多肽,其中Xaa9选自A、D、G或P。63.如实施方案37-62中任一项所述的重组衣壳多肽,其中Xaa9为G。64.一种实施方案1-36中任一项所述的重组衣壳多肽与实施方案37-63中任一项所述的重组衣壳多肽组合的重组衣壳多肽,其中所述VP1衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5VP1衣壳多肽的病毒体相比,所述组装的病毒体表现出增加的对肝脏组织的嗜性。65.如实施方案1所述的重组衣壳多肽,其中Xaa1不是K,并且其中所述VP1衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。66.如实施方案1所述的重组衣壳多肽,其中Xaa1不是A、K、M或T,并且其中所述VP1衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。67.如实施方案1所述的重组衣壳多肽,其中Xaa1不是A、G、K、M、N、Q、R、S或T,并且其中所述VP1衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。68.如实施方案1或实施方案65-67中任一项所述的重组衣壳多肽,其中Xaa2不是T,并且其中所述VP1衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。69.如实施方案1或实施方案65-68中任一项所述的重组衣壳多肽,其中Xaa2不是A、S、T或V,并且其中所述VP1衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。70.如实施方案1或实施方案65-69中任一项所述的重组衣壳多肽,其中Xaa2不是A、C、H、I、K、S、T或V,并且其中所述VP1衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。71.如实施方案1或实施方案65-70中任一项所述的重组衣壳多肽,其中Xaa3不是A或T,并且其中所述VP1衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。72.如实施方案1或实施方案65-71中任一项所述的重组衣壳多肽,Xaa3不是A、M或T,并且其中所述VP1衣壳能够形成组装的病毒体,与包含SEQ IDNO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。73.如实施方案1或实施方案65-72中任一项所述的重组衣壳多肽,其中Xaa3不是A、G、H、K、M、N、Q、R、S、T或V,并且其中所述VP1衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。74.如实施方案1或实施方案65-73中任一项所述的重组衣壳多肽,其中Xaa4不是P,并且其中所述VP1衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。75.如实施方案1或实施方案65-74中任一项所述的重组衣壳多肽,其中Xaa4不是L、P、Q或T,并且其中所述VP1衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。76.如实施方案l或实施方案65-75中任一项所述的重组衣壳多肽,其中Xaa4不是L、M、P、Q、R、T或W,并且其中所述VP1衣壳能够形成组装的病毒体,与包含SEQ IDNO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。77.如实施方案1或实施方案65-76中任一项所述的重组衣壳多肽,其中Xaa5不是Y,并且其中所述VP1衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。78.如实施方案1或实施方案65-77中任一项所述的重组衣壳多肽,其中Xaa5不是H、I或Y,并且其中所述VP1衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。79.如实施方案1或实施方案65-78中任一项所述的重组衣壳多肽,其中Xaa5不是F、H、I、K、M、T或Y,并且其中所述VP1衣壳能够形成组装的病毒体,与包含SEQID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。80.如实施方案1或实施方案65-79中任一项所述的重组衣壳多肽,其中Xaa6不是N,并且其中所述VP1衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。81.如实施方案1或实施方案65-80中任一项所述的重组衣壳多肽,其中Xaa6不是N或Q,并且其中所述VP1衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。82.如实施方案1或实施方案65-81中任一项所述的重组衣壳多肽,其中Xaa6不是E、G、H、L、M、N、Q、T或W,并且其中所述VP1衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。83.如实施方案1或实施方案65-82中任一项所述的重组衣壳多肽,其中Xaa7不是A,并且其中所述VP1衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。84.如实施方案l或实施方案65-83中任一项所述的重组衣壳多肽,其中Xaa7不是A、C、H或M,并且其中所述VP1衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。85.如实施方案1或实施方案65-84中任一项所述的重组衣壳多肽,其中Xaa7不是A、C、G、H、L、M、R或S,并且其中所述VP1衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。86.如实施方案1或实施方案65-85中任一项所述的重组衣壳多肽,其中Xaa8不是G,并且其中所述VP1衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。87.如实施方案1或实施方案65-86中任一项所述的重组衣壳多肽,其中Xaa8不是G、M、Q或S,并且其中所述VP1衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VPl衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。88.如实施方案1或实施方案65-87中任一项所述的重组衣壳多肽,其中Xaa8不是A、C、D、F、G、H、M、Q、S、V、W或Y,并且其中所述VP1衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。89.如实施方案1或实施方案65-88中任一项所述的重组衣壳多肽,Xaa9不是G,并且其中所述VP1衣壳能够形成组装的病毒体,与包含SEQ IDNO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。90.如实施方案1或实施方案65-89中任一项所述的重组衣壳多肽,其中Xaa9不是E、G或P,并且其中所述VP1衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。91.如实施方案l或实施方案65-90中任一项所述的重组衣壳多肽,其中Xaa9不是A、C、E、G、H、M、N、P、Q、S、V或W,并且其中所述VP1衣壳能够形成组装的病毒体,与包含SEQ ID NO:1的AAV5 VP1衣壳的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。92.一种实施方案65-91中任一项所述的重组衣壳多肽与实施方案37-63中任一项所述的重组衣壳多肽组合的重组衣壳多肽,其中所述VP1衣壳能够形成组装的病毒体,与包含SEQ ID NO:l的AAV5 VP1衣壳多肽的病毒体相比,所述组装的病毒体表现出降低的对肝脏组织的嗜性。93.一种重组腺相关病毒(AAV)VP1衣壳多肽,所述多肽具有对应于SEQ ID NO:2中的残基581至残基589的至少一个残基,其中所述至少一个残基为:Xaa1,并且Xaa1选自A、G、K、M、N、Q、R、S或T;Xaa2,并且Xaa2选自A、C、H、I、K、S、T或V;Xaa3,并且Xaa3选自A、G、H、K、M、N、Q、R、S、T或V;Xaa4,并且Xaa4选自L、M、P、Q、R、T或W;Xaa5,并且Xaa5选自F、H、I、K、M、T或Y;Xaa6,并且Xaa6选自E、G、H、L、M、N、Q、T或W;Xaa7,并且Xaa7选自A、C、G、H、L、M、R或S;Xaa8,并且Xaa8选自A、C、D、F、G、H、M、Q、S、V、W或Y;Xaa9,并且Xaa9选自A、C、E、G、H、M、N、P、Q、S、V或W;或它们的任何组合,其中所述AAV VP1衣壳多肽能够表现出对肝脏组织的组织嗜性。94.一种重组腺相关病毒AAV VP1衣壳多肽,所述多肽在SEQ ID NO:1中的581至残基589区域的残基中具有至少一个突变,其中与AAV5VP1相比,所述突变赋予在非肝脏组织中相较于肝脏组织中至少约两倍增加的积聚,并且其中所述AAV VP1衣壳多肽不具有SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。95.如实施方案94所述的重组AAVVP1衣壳多肽,其中所述突变赋予在非肝脏组织中相较于肝脏组织中至少约三倍、至少约四倍、至少约五倍、至少约十倍、至少约二十倍、至少约五十倍、至少约75倍、至少约100倍增加的积聚。96.如实施方案94所述的重组AAV VP1衣壳多肽,其中所述突变赋予在非肝脏组织中相较于肝脏组织中约1.0005倍至约1000倍增加的积聚。97.如前述实施方案中任一项所述的重组衣壳多肽,所述重组衣壳多肽相对于SEQ ID NO:1在581-589区域之外的氨基酸残基处还包含一个或多个突变,其中所得重组衣壳能够形成组装的病毒体,所述组装的病毒体表现出所需的组织靶向性/嗜性。98.如实施方案97所述的重组衣壳多肽,其中在581-589区域之外的氨基酸残基处的所述一个或多个突变赋予改进的可制造性、改进的病毒组装、提高的组织靶向性/嗜性,或它们的任何组合。99.一种能够在原核细胞中复制的载体,其中所述载体包含编码前述实施方案中任一项所述的重组衣壳多肽的多核苷酸。100.如实施方案99所述的载体,其中所述载体是质粒。101.一种包含多个实施方案100所述的质粒的文库,所述多个质粒包含多个不同的编码AAV VP1的多核苷酸。102.如实施方案101所述的质粒文库,其中所述文库编码至少1x109个不同的AAV VP1衣壳多肽。103.如实施方案102所述的质粒文库,其中所述文库编码至少5x109个不同的AAV VP1衣壳多肽。104.如实施方案103所述的质粒文库,其中所述文库编码至少1x1010个不同的AAV VP1衣壳多肽。105.如实施方案104所述的质粒文库,其中所述文库编码至少5x1 010个不同的AAV VP1衣壳多肽。106.如实施方案105所述的质粒文库,其中所述文库编码至少7.5x1010个不同的AAV VP1衣壳多肽。107.如实施方案106所述的质粒文库,其中所述文库编码至少1x1 011个不同的AAV VP1衣壳多肽。108.如实施方案107所述的质粒文库,其中所述文库编码至少2.5x1011个不同的AAV VP1衣壳多肽。109.如实施方案108所述的质粒文库,其中所述文库编码至少5x1 011个不同的AAV VP1衣壳多肽。110.一种包含实施方案100所述的载体的原核细胞。111.如实施方案110所述的原核细胞,其中所述原核细胞是大肠杆菌细胞并且所述载体是质粒。112.一种包含多个实施方案111所述的大肠杆菌细胞的文库,其中所述多个细胞包含多个质粒,其中所述多个质粒包含多个不同的编码AAV VP1的多核苷酸。113.一种包含多个实施方案1-98中任一项所述的多肽的文库,所述多个多肽具有不同的一级氨基酸序列。114.实施方案113的文库,其中所述文库包含至少约1×105至至少约5×1011个不同的AAV VP1衣壳多肽。115.一种重组AAV病毒体(rAAV),所述病毒体包含实施方案1-98中任一项所述的AAV VP1衣壳多肽。116.如实施方案115所述的rAAV病毒体,其中与具有含SEQ ID NO:1序列的VP1衣壳多肽的rAAV相比,所述rAAV具有降低的对人肝脏的嗜性。117.如实施方案115或实施方案116所述的rAAV病毒体,其中与具有含SEQ ID NO:1序列的VP1衣壳多肽的rAAV相比,所述rAAV在静脉内施用后具有增强的穿过血脑屏障的能力。118.如实施方案115-117中任一项所述的rAAV病毒体,其中与具有含SEQ ID NO:1序列的VP1衣壳多肽的rAAV相比,所述rAAV在静脉内、鞘内、脑室内或脑池内施用后具有增强的感染选自海马、齿状回、大脑皮层、颞叶皮层、枕叶皮层、丘脑、前脑、黑质、下丘脑和小脑的一个或多个脑区的能力。119.如实施方案115-118中任一项所述的rAAV病毒体,其中与具有含SEQ ID NO:1序列的VP1衣壳多肽的rAAV相比,所述rAAV在玻璃体内注射后具有增强的感染人视网膜细胞的能力。120.如实施方案115-119中任一项所述的rAAV病毒体,其中与具有含SEQ ID NO:1序列的VP1衣壳多肽的rAAV相比,所述rAAV在静脉内施用后具有增强的感染人骨骼肌的能力。121.如实施方案115和117-120中任一项所述的rAAV病毒体,其中与具有含SEQ ID NO:1序列的VP1衣壳多肽的rAAV相比,所述rAAV具有增加的对人肝脏的嗜性。122.如实施方案115、116或121所述的rAAV病毒体,其中与具有SEQ ID NO:1的VP1衣壳多肽的rAAV相比,所述rAAV在静脉内施用后具有增强的感染选自以下的组织的能力:脂肪、肾上腺、主动脉、脑(包括海马:齿状回、CA1和CA3;小脑、尾状核、壳核、中脑、脑桥、下丘脑、皮层-包括枕叶、颞叶和前脑;黑质和丘脑)、骨髓、盲肠、结肠、背根神经节、十二指肠、附睾、食管、眼睛、胆囊、心脏、回肠、空肠、肾脏、肺、淋巴结、乳腺、卵巢、胰腺、甲状旁腺、周围神经、垂体、前列腺、唾液腺、精囊、骨骼肌、皮肤、脊髓、脾脏、胃、睾丸、胸腺、甲状腺、气管、膀胱、子宫和阴道。123.如实施方案115-122中任一项所述的rAAV病毒体,其中所述病毒体还包含载体基因组,所述载体基因组包含编码以下任一项的治疗性多核苷酸:选自指导RNA或tRNA的治疗性RNA,或编码处于引导受感染人细胞中转基因表达的调控序列控制下的蛋白质。124.如实施方案123所述的rAAV病毒体,其中所述转基因编码选自表1的转基因产物的蛋白质。125一种包含多个实施方案115-124中任一项所述的rAAV病毒体的文库,其中所述多个rAAV病毒体包含多个具有不同一级氨基酸序列的VP1衣壳多肽。126.如实施方案125所述的文库,其中所述文库包含至少约1x105至至少约5x1011个不同的AAV VP1衣壳多肽不同的AAV VP1衣壳多肽。127.一种药物组合物,所述药物组合物包含实施方案123或实施方案124所述的rAAV和药学上可接受的载体。128.一种治疗方法,所述方法包括:向有需要的患者施用有效量的实施方案127所述的药物组合物。129.如实施方案128所述的方法,其中所述rAAV的所述有效量小于野生型rAAV的有效量。130.如实施方案128所述的方法,其中所述rAAV的所述有效量小于在对应于SEQID NO:1的残基581至残基589的位置处缺乏一个或多于一个突变的其他方面相当的rAAV的有效量。131.如实施方案128-130中任一项所述的方法,其中与所述野生型rAAV、所述其他方面相当的rAAV或两者的所述有效量相比,所述的所述有效量在所述患者中引起更低的毒性。132.如实施方案128所述的方法,其中所述有效量为至少1x105个病毒基因组/kg患者体重至5x1014个病毒基因组/kg。133.如实施方案128-132中任一项所述的方法,其中静脉内施用所述rAAV。134.如实施方案128-132中任一项所述的方法,其中鞘内施用所述rAAV。135.如实施方案128-132中任一项所述的方法,其中通过脑池内施用来施用所述rAAV。136.如实施方案128-132中任一项所述的方法,其中通过玻璃体内注射来施用所述rAAV。137.一种鉴定赋予对所需组织的嗜性的AAV VP1衣壳多肽的方法,所述方法包括:将实施方案101-109或112-144或125-126中任一项所述的文库的等分试样施用于非人灵长类动物;以及鉴定已感染所述所需组织的rAAV的AAV衣壳序列的序列。138.如实施方案137所述的方法,其中静脉内施用所述文库等分试样。139.如实施方案137所述的方法,其中鞘内施用所述文库等分试样。140.如实施方案137所述的方法,其中通过脑池内施用来施用所述文库等分试样。141.如实施方案137所述的方法,其中通过脑室内注射来施用所述文库等分试样。142.一种配制在病毒体中的实施方案123-124中任一项所述的治疗性多核苷酸的方法,所述方法包括:用编码实施方案1-98中任一项所述的重组衣壳多肽的质粒转染细胞以及用编码所述治疗性多核苷酸的质粒转染所述细胞,其中在转染后,所述细胞产生所述病毒体,所述病毒体内包装有所述治疗性多核苷酸。143.一种的组合物,所述组合物包含含有实施方案1-98中任一项所述的重组衣壳多肽的AAV病毒体,所述病毒体内包装有实施方案123-124中任一项所述的治疗性多核苷酸。144.一种重组AAV VP1衣壳多肽,所述重组AAV VP1衣壳多肽具有表8(SEQ ID NO:115-1114)中列举的VP1衣壳突变中的任一者,并且其中所述VP1衣壳多肽不具有SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。145.一种重组AAV VP1衣壳多肽,所述重组AAV VP1衣壳多肽具有表8(SEQ ID NO:115-1114)中列举的VP1衣壳突变中的任一者,其中所述突变赋予相较于第二组织对第一组织的组织嗜性,并且其中所述AAV VP1衣壳多肽不具有SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。146.如实施方案145所述的重组AAV VP1衣壳多肽,其中与包含AAV5 VP1(SEQ ID NO:1)的rAAV的积聚相比,所述突变赋予包含所述突变VP1蛋白的rAAV在非肝脏组织中相较于肝脏组织中至少约两倍增加的积聚,其中所述突变rAAV和所述AAV5rAAV各自以相同的滴度静脉内施用,并且其中所述VP1衣壳多肽不具有SEQ ID NO:1、SEQ ID NO:3、SEQID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。147.一种组合物,所述组合物包含含有实施方案144-146中任一项所述的重组衣壳多肽的AAV病毒体,所述AAV病毒体内包装有编码以下任一项的治疗性多核苷酸:选自指导RNA或tRNA的治疗性RNA,或编码处于引导受感染人细胞中转基因表达的调控序列控制下的蛋白质。
[403]B系列实施方案-CNS嗜性衣壳
1.一种工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽,所述工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽具有与SEQ ID NO:1至少70%同一的氨基酸序列,
其中所述工程化AAV VP衣壳多肽相较于SEQ ID NO:1在从对应于SEQ ID NO:1的残基581的残基至对应于SEQ ID NO:1的残基589的残基的区域,包括端点在内,中具有至少一个突变,
其中所述工程化AAV VP衣壳多肽能够组装成重组AAV病毒体(rAAV),
其中与具有SEQ ID NO:1的野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述至少一个突变赋予所述rAAV较高的对中枢神经系统(CNS)组织的嗜性,并且
其中所述工程化AAV VP衣壳多肽不具有SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。2.如实施方案1所述的工程化AAV VP衣壳多肽,其中所述工程化AAV VP衣壳多肽具有SEQ ID NO:2的序列,并且其中Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自任何氨基酸。3.一种工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽,所述工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽具有SEQ ID NO:2的氨基酸序列,
其中氨基酸残基Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自A、R、N、D、C、E、Q、G、H、I、L、K、M、F、P、S、T、W、Y和V,
其中所述工程化AAV VP衣壳多肽能够组装成重组AAV病毒体(rAAV),并且
其中所述工程化AAV VP衣壳多肽不具有SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。4.如实施方案3所述的工程化AAV VP衣壳多肽,其中与具有SEQ ID NO:1的野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述rAAV具有较高的对中枢神经系统(CNS)组织的嗜性。5.如实施方案1-2中任一项所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有与SEQ ID NO:7118-SEQ ID NO:10117中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。6.如实施方案4所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有SEQ ID NO:7118-SEQ ID NO:10117中任一者的序列。7.如实施方案3所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:2的Xaa1至Xaa9区具有与SEQ ID NO:7118-SEQ ID NO:10117中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。8.如实施方案6所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:2的Xaa1至Xaa9区域具有SEQ ID NO:7118-SEQ ID NO:10117中任一者的序列。9.如实施方案2-3中任一项所述的工程化AAV VP衣壳多肽,其中:
Xaa1选自由A、C、K、M、Q、R、T和W组成的组;或者
Xaa2选自由F、I、K、R、T和W组成的组;或者
Xaa3选自由A、H、N、R和W组成的组;或者
Xaa4选自由E、G、I、M、Q和R组成的组;或者
Xaa5选自由C、G、K、I、M和R组成的组;或者
Xaa6选自由I、K、L、P、Q、R和Y组成的组;或者
Xaa7选自由D、I、K、R、V和W组成的组;或者
Xaa8选自由C、G、H、K、L和V组成的组;或者
Xaa9选自由I、K、L、R和V组成的组;或者
它们的任何组合。
10.如实施方案5所述的工程化AAV VP衣壳多肽,其中Xaa1选自K、Q、R或W。11.如实施方案5所述的工程化AAV VP衣壳多肽,其中Xaa2选自F、I、R或T。12.如实施方案5所述的工程化AAV VP衣壳多肽,其中Xaa3选自A、R或W。13.如实施方案5所述的工程化AAV VP衣壳多肽,其中Xaa4选自E、M或R。14.如实施方案5所述的工程化AAV VP衣壳多肽,其中Xaa5选自K、I或R。15.如实施方案5所述的工程化AAV VP衣壳多肽,其中Xaa6选自K、R或Y。16.如实施方案5所述的工程化AAV VP衣壳多肽,其中Xaa7选自I、R或V。17.如实施方案5所述的工程化AAV VP衣壳多肽,其中Xaa8选自H、K或V。18.如实施方案5所述的工程化AAV VP衣壳多肽,其中Xaa9选自I、K或R。19.如实施方案5所述的工程化AAV VP衣壳多肽,其中Xaa1为K。20.如实施方案5所述的工程化AAV VP衣壳多肽,其中Xaa2为R。21.如实施方案5所述的工程化AAVVP衣壳多肽,其中Xaa3为R。22.如实施方案5所述的工程化AAV VP衣壳多肽,其中Xaa4为R。23.如实施方案5所述的工程化AAV VP衣壳多肽,其中Xaa5为I。24.如实施方案5所述的工程化AAV VP衣壳多肽,其中Xaa6为R。25.如实施方案5所述的工程化AAV VP衣壳多肽,其中Xaa7为V。26.如实施方案5所述的工程化AAV VP衣壳多肽,其中Xaa8为H。27.如实施方案5所述的工程化AAV VP衣壳多肽,其中Xaa9为R。28.如实施方案1-8中任一项所述的工程化AAVVP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有与SEQ ID NO:7118-SEQ ID NO:8117中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少98%或至少99%同一的序列。29.如实施方案27所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:1的从残基581至残基589的区域具有SEQ ID NO:7118-SEQ ID NO:8117中任一者的序列。30.如实施方案2-3中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有低氨基酸溶解性。31.如实施方案25所述的工程化AAV VP衣壳多肽,其中Xaa1选自K、R或Q。32.如实施方案2-3中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有低氨基酸亲疏水性。33.如实施方案27所述的工程化AAV VP衣壳多肽,其中Xaa1选自K或R。34.如实施方案2-3中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有高平均氨基酸柔性指数。35.如实施方案29所述的工程化AAV VP衣壳多肽,其中Xaa1选自D、E、R、K、G、I、N、Q或S。36.如实施方案2-3中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有高氢键供体。37.如实施方案31所述的工程化AAV VP衣壳多肽,其中Xaa1选自K、R。38.如实施方案2-3中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有低氨基酸可突变性。39.如实施方案33所述的工程化AAV VP衣壳多肽,其中Xaa1选自K、R、P或H。40.如实施方案2-3中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有低氨基酸溶解性。41.如实施方案35所述的工程化AAV VP衣壳多肽,其中Xaa2选自R、K、Q或S。42.如实施方案2-3中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有低氨基酸亲疏水性。43.如实施方案37所述的工程化AAV VP衣壳多肽,其中Xaa2选自R、K、D、E、N、Q、H、P、Y、W、S或T。44.如实施方案2-3中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有高氨基酸电荷。45.如实施方案39所述的工程化AAV VP衣壳多肽,其中Xaa2选自R、K或H。46.如实施方案2-3中任一项所述的工程化AAV VP衣壳多肽,其中Xaa3具有高氨基酸溶解性。47.如实施方案41所述的工程化AAV VP衣壳多肽,其中Xaa3选自A、M、V、W、L或I。48.如实施方案2-3中任一项所述的工程化AAV VP衣壳多肽,其中Xaa5具有高氨基酸溶解性。49.如实施方案43所述的工程化AAV VP衣壳多肽,其中Xaa5选自C、M、V、W、L或I。50.如实施方案2-3中任一项所述的工程化AAV VP衣壳多肽,其中Xaa5具有高亲疏水性。51.如实施方案45所述的工程化AAV VP衣壳多肽,其中Xaa5选自M、V或I。52.如实施方案2-3中任一项所述的工程化AAV VP衣壳多肽,其中Xaa5具有低平均氨基酸柔性指数。53.如实施方案47所述的工程化AAV VP衣壳多肽,其中Xaa5选自M、W、F或C。54.如实施方案2-3中任一项所述的工程化AAV VP衣壳多肽,其中Xaa8具有高氨基酸溶解性。55.如实施方案49所述的工程化AAV VP衣壳多肽,其中Xaa8选自H、V或I。56.如实施方案29-54中任一项所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域包括端点在内具有与SEQ ID NO:8118-SEQ ID NO:9117中任一者具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。57.如实施方案25-50中任一项所述的工程化AAVVP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域包括端点在内具有SEQ ID NO:8118-SEQ ID NO:9117中任一者的序列。58.如实施方案1-56中任一项所述的工程化AAV VP衣壳多肽,其中所述CNS组织选自前脑皮层、枕叶皮层、颞叶皮层、丘脑、下丘脑、黑质、海马DG、海马CA1、海马CA3、小脑以及它们的任何组合。59.如实施方案1-57中任一项所述的工程化AAV VP衣壳多肽,其中对CNS组织的嗜性被测量为所述rAAV病毒体在CNS组织中相较于非CNS组织中的相对积聚,其中所述非CNS组织由肝脏、骨骼肌、心脏、肺、脾脏、淋巴结、骨髓、乳腺、皮肤、肾上腺、甲状腺、结肠、坐骨神经和脊髓共同组成。60.如实施方案1-58中任一项所述的工程化AAV VP衣壳多肽,其中所述较高的组织嗜性是在CNS组织中相较于非CNS组织中1.0005倍至约1000倍增加的积聚。61.如实施方案59所述的工程化AAV VP衣壳多肽,其中所述较高的组织嗜性是在CNS组织中相较于非CNS组织中至少约1.0005倍、至少约两倍、至少约三倍、至少约四倍、至少约五倍、至少约十倍、至少约二十倍、至少约50倍、至少约75倍、至少约100倍或至少约1000倍增加的积聚。
[404]C系列实施方案-肝脏去靶向性衣壳
1.一种工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽,所述工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽具有与SEQ ID NO:1至少70%同一的氨基酸序列,
其中所述工程化AAV VP衣壳多肽相较于SEQ ID NO:1在从对应于SEQ ID NO:1的残基581的残基至对应于SEQ ID NO:1的残基589的残基的区域,包括端点在内,中具有至少一个突变,
其中所述工程化AAV VP衣壳多肽能够组装成重组AAV病毒体(rAAV),
其中与具有SEQ ID NO:1的野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述至少一个突变赋予所述rAAV较高的对非肝脏组织的嗜性,并且
其中所述工程化AAV VP衣壳多肽不具有SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。2.如实施方案1所述的工程化AAV VP衣壳多肽,其中所述工程化AAV VP衣壳多肽具有SEQ ID NO:2的序列,并且其中Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自任何氨基酸。3.一种工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽,所述工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽具有SEQ ID NO:2的氨基酸序列,
其中氨基酸残基Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自A、R、N、D、C、E、Q、G、H、I、L、K、M、F、P、S、T、W、Y和V,
其中所述工程化AAV VP衣壳多肽能够组装成重组AAV病毒体(rAAV),并且
其中所述工程化AAV VP衣壳多肽不具有SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。4.如实施方案3所述的工程化AAV VP衣壳多肽,其中与具有SEQ ID NO:1的野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述rAAV具有较高的对非肝脏组织的嗜性。5.如实施方案1所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有与SEQ ID NO:46438-SEQ ID NO:47437中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少98%、或至少99%同一的序列。6.如实施方案5所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有SEQ ID NO:46438-SEQ ID NO:47437中任一者的序列。7.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:2的Xaa1至Xaa9区的序列具有与SEQ ID NO:46438-SEQ ID NO:47437中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。8.如实施方案7所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:2的Xaa1至Xaa9区域具有SEQ IDNO:46438-SEQ ID NO:47437中任一者的序列。9.如实施方案2-4中任一项所述的工程化AAVVP衣壳多肽,其中:
Xaa1不包括A、G、K、M、N、Q、R、S或T;或者
Xaa2不包括A、C、I、K、S、T或V;或者
Xaa3不包括A、G、I、K、M、Q、R、S、T或V;或者
Xaa4不包括A、I、K、L、P、Q、R、S、T或V;或者
Xaa5不包括F、I、L、M、T、V或Y;或者
Xaa6不包括F、H、M、N、Q、S或Y;或者
Xaa7不包括A、C、K、M、Q或S;或者
Xaa8不包括A、C、F、G、M、Q或S;或者
Xaa9不包括E、F、L、Q、R或Y;或者
它们的任何组合。
10.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa1不包括A、K、Q或R。11.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa2不包括A、K、S或T。12.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa3不包括A、K、Q、S或T。13.如实施方案9所述的工程化AAVVP衣壳多肽,其中Xaa4不包括K、I、S或V。14.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa5不包括F、L或Y。15.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa6不包括M或N。16.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa7不包括A、C或S。17.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa8不包括A、C、M或S。18.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa9不包括L、Q或R。19.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa1不包括K。20.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa2不包括A。21.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa3不包括K、Q或T。22.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa3不包括K。23.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa4不包括K。24.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa5不包括F。25.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa6不包括N。26.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa7不包括S。27.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa8不包括C。28.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa9不包括R。29.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有低溶解性。30.如实施方案29所述的工程化AAV VP衣壳多肽,其中Xaa1选自D和P。31.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有低可突变性。32.如实施方案31所述的工程化AAV VP衣壳多肽,其中Xaa1选自Xaa1选自C、K和L。33.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有低溶解性。34.如实施方案33所述的工程化AAV VP衣壳多肽,其中Xaa2选自Xaa2选自N、K、P、E和D。35.如实施方案2-4中任一项所述的工程化AAVVP衣壳多肽,其中Xaa2具有低亲疏水性。36.如实施方案35所述的工程化AAV VP衣壳多肽,其中Xaa2选自Xaa2选自D、E、R、K、H、N和Q。37.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有低电荷。38.如实施方案37所述的工程化AAV VP衣壳多肽,其中Xaa2选自D和E。39.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有高总潜在氢键数。40.如实施方案39所述的工程化AAV VP衣壳多肽,其中Xaa2选自H、N、Q、D、E和R。41.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有中等体积。42.如实施方案41所述的工程化AAV VP衣壳多肽,其中Xaa2选自D、E、V、P、N和T。43.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa3具有低溶解性。44.如实施方案43所述的工程化AAV VP衣壳多肽,其中Xaa3选自P和D。45.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa4具有中等体积。46.如实施方案45所述的工程化AAV VP衣壳多肽,其中Xaa4选自D、E、V、P、N和T。47.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa5具有低溶解性。48.如实施方案47所述的工程化AAV VP衣壳多肽,其中Xaa5选自N、P、E和D。49.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa8具有低溶解性。50.如实施方案49所述的工程化AAV VP衣壳多肽,其中Xaa8选自K和Q。51.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa8具有低亲疏水性。52.如实施方案51所述的工程化AAV VP衣壳多肽,其中Xaa8选自K和R。53.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa8具有高表面可接近性。54.如实施方案53所述的工程化AAV VP衣壳多肽,其中Xaa8选自E、R和K。55.如实施方案1-54中任一项所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域包括端点在内具有与SEQ ID NO:46438-SEQ ID NO:47437中任一者具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。56.如实施方案55所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域包括端点在内具有SEQ ID NO:46438-SEQ ID NO:47437中任一者的序列。57.如实施方案1-56中任一项所述的工程化AAV VP衣壳多肽,其中对非肝脏组织的嗜性被测量为所述rAAV病毒体在非肝脏组织中相较于肝脏组织中的相对积聚,其中所述非肝脏组织组织由CNS组织、骨骼肌、心脏、肺、脾脏、淋巴结、骨髓、乳腺、皮肤、肾上腺、甲状腺、结肠、坐骨神经和脊髓共同组成。58.如实施例57所述的工程化AAV VP衣壳多肽,其中所述CNS组织选自前脑皮层、枕叶皮层、颞叶皮层、丘脑、下丘脑、黑质、海马DG、海马CA1、海马CA3、小脑以及它们的任何组合。59.如实施例57-58中任一项所述的工程化AAV VP衣壳多肽,其中所述较高的组织嗜性是在非肝脏组织中相较于肝脏组织中1.0005倍至约1000倍增加的积聚。60.如实施方案59所述的工程化AAV VP衣壳多肽,其中所述较高的组织嗜性是在非肝脏组织中相较于肝脏组织中至少约1.0005倍、至少约两倍、至少约三倍、至少约四倍、至少约五倍、至少约十倍、至少约二十倍、至少约50倍、至少约75倍、至少约100倍或至少约1000倍增加的积聚。
[405]D系列实施方案-肝脏嗜性衣壳
1.一种工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽,所述工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽具有与SEQ ID NO:1至少70%同一的氨基酸序列,
其中所述工程化AAV VP衣壳多肽相较于SEQ ID NO:1在从对应于SEQ ID NO:1的残基581的残基至对应于SEQ ID NO:1的残基589的残基的区域,包括端点在内,中具有至少一个突变,
其中所述工程化AAV VP衣壳多肽能够组装成重组AAV病毒体(rAAV),
其中与具有SEQ ID NO:1的野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述至少一个突变赋予所述rAAV较高的对肝脏组织的嗜性,并且
其中所述工程化AAV VP衣壳多肽不具有SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。2.如实施方案1所述的工程化AAV VP衣壳多肽,其中所述工程化AAV VP衣壳多肽具有SEQ ID NO:2的序列,并且其中Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自任何氨基酸。3.一种工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽,所述工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽具有SEQ ID NO:2的氨基酸序列,
其中氨基酸残基Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自A、R、N、D、C、E、Q、G、H、I、L、K、M、F、P、S、T、W、Y和V,
其中所述工程化AAV VP衣壳多肽能够组装成重组AAV病毒体(rAAV),并且
其中所述工程化AAV VP衣壳多肽不具有SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。4.如实施方案3所述的工程化AAV VP衣壳多肽,其中与具有SEQ ID NO:1的野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述rAAV具有较高的对肝脏组织的嗜性。5.如实施方案1所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有与SEQ ID NO:43438-SEQ ID NO:46437中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。6.如实施方案5所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有SEQ ID NO:43438-SEQ ID NO:46437中任一者的序列。7.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:2的Xaa1至Xaa9区具有与SEQ ID NO:43438-SEQ ID NO:46437中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。8.如实施方案7所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:2的Xaa1至Xaa9区域具有SEQ ID NO:43438-SEQ IDNO:46437中任一者的序列。9.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中:
Xaa1选自由A、G、K、M、N、Q、R、S和T组成的组;或者
Xaa2选自由A、C、I、K、S、T和V组成的组;或者
Xaa3选自由A、G、I、K、M、Q、R、S、T和V组成的组;或者
Xaa4选自由A、I、K、L、P、Q、R、S、T和V组成的组;或者
Xaa5选自由F、I、L、M、T、V和Y组成的组;或者
Xaa6选自由F、H、M、N、Q、S和Y组成的组;或者
Xaa7选自由A、C、K、M、Q和S组成的组;或者
Xaa8选自由A、C、F、G、M、Q和S组成的组;或者
Xaa9选自由E、F、L、Q、R和Y组成的组;或者
它们的任何组合。
10.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa1选自A、K、Q和R。11.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa1为K。12.如实施方案9所述的工程化AAVVP衣壳多肽,其中Xaa2选自A、K、S和T。13.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa2为A。14.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa3选自A、K、Q、S和T。15.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa3选自K、Q和T。16.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa3为K。17.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa4选自K、I、S和V。18.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa4为K。19.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa5选自F、L和Y。20.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa5为F。21.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa6选自M和N。22.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa6为N。23.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa7选自A、C和S。24.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa7为S。25.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa8选自A、C、M和S。26.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa8为C。27.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa9选自L、Q和R。28.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa9为R。29.如实施方案1-28中任一项所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有与SEQ ID NO:43438-SEQ ID NO:44437中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。30.如实施方案29所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:1的从残基581至残基589的区域具有SEQ ID NO:43438-SEQ ID NO:44437中任一者的序列。31.如实施方案2-4中任一项所述的工程化AAVVP衣壳多肽,其中Xaa1具有高表面可接近性。32.如实施方案31所述的工程化AAV VP衣壳多肽,其中Xaa1选自K、R和E。33.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有低亲疏水性(<-3.5)。34.如实施方案33所述的工程化AAV VP衣壳多肽,其中Xaa1选自K和R。35.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有低氨基酸可突变性。36.如实施方案35所述的工程化AAV VP衣壳多肽,其中Xaa1选自H、P、K和R。37.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有低氨基酸溶解性。38.如实施方案37所述的工程化AAV VP衣壳多肽,其中Xaa1选自Q、K和R。39.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有高表面可接近性。
40.如实施方案39所述的工程化AAV VP衣壳多肽,其中Xaa2选自E、R和K。41.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有低亲疏水性。42.如实施方案41所述的工程化AAV VP衣壳多肽,其中Xaa2选自K和R。43.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有高氨基酸体积。44.如实施方案43所述的工程化AAV VP衣壳多肽,其中Xaa2选自S、L、I、A、R和K。45.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa3具有高可突变性。46.如实施方案45所述的工程化AAV VP衣壳多肽,其中Xaa3选自N、I、A、M、E和D。47.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa3具有低溶解性。48.如实施方案47所述的工程化AAV VP衣壳多肽,其中Xaa3选自N、K、R和E。49.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa4具有低亲疏水性。50.如实施方案49所述的工程化AAV VP衣壳多肽,其中Xaa4选自K和R。51.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa4具有高氨基酸体积。52.如实施方案51所述的工程化AAV VP衣壳多肽,其中Xaa4选自K、R、I和L。53.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa5具有中等氨基酸溶解性。54.如实施方案53所述的工程化AAV VP衣壳多肽,其中Xaa5选自H和T。55.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa8具有低表面可接近性。56.如实施方案55所述的工程化AAV VP衣壳多肽,其中Xaa8选自V和C。57.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa8具有低平均柔性指数。58.如实施方案57所述的工程化AAV VP衣壳多肽,其中Xaa8选自W、V、M、A、F、L、H和C。59.如实施方案1-58中任一项所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域包括端点在内具有与SEQ ID NO:44438-SEQ ID NO:45437中任一者具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。60.如实施方案59所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域包括端点在内具有SEQ ID NO:44438-SEQ ID NO:45437中任一者的序列。61.如实施方案1-60中任一项所述的工程化AAV VP衣壳多肽,其中对肝脏组织的嗜性被测量为所述rAAV病毒体在肝脏组织中相较于非肝脏组织中的相对积聚,其中所述非肝脏组织由CNS、骨骼肌、心脏、肺、脾脏、淋巴结、骨髓、乳腺、皮肤、肾上腺、甲状腺、结肠、坐骨神经和脊髓共同组成。62.如实施方案61所述的工程化AAV VP衣壳多肽,其中所述CNS组织选自前脑皮层、枕叶皮层、颞叶皮层、丘脑、下丘脑、黑质、海马DG、海马CA1、海马CA3、小脑以及它们的任何组合。63.如实施方案61-62中任一项所述的工程化AAV VP衣壳多肽,其中所述较高的组织嗜性是在肝脏组织中相较于非肝脏组织中1.0005倍至约1000倍增加的积聚。64.如实施方案63所述的工程化AAV VP衣壳多肽,其中所述较高的组织嗜性是在肝脏组织中相较于非肝脏组织中至少约1.0005倍、至少约两倍、至少约三倍、至少约四倍、至少约五倍、至少约十倍、至少约二十倍、至少约50倍、至少约75倍、至少约100倍或至少约1000倍增加的积聚。
[406]E系列实施方案-肾上腺嗜性衣壳
1.一种工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽,所述工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽具有与SEQ ID NO:1至少70%同一的氨基酸序列,
其中所述工程化AAV VP衣壳多肽相较于SEQ ID NO:1在从对应于SEQ ID NO:1的残基581的残基至对应于SEQ ID NO:1的残基589的残基的区域,包括端点在内,中具有至少一个突变,
其中所述工程化AAV VP衣壳多肽能够组装成重组AAV病毒体(rAAV),
其中与具有SEQ ID NO:1的野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述至少一个突变赋予所述rAAV较高的对肾上腺组织的嗜性,并且
其中所述工程化AAV VP衣壳多肽不具有SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。2.如实施方案1所述的工程化AAV VP衣壳多肽,其中所述工程化AAV VP衣壳多肽具有SEQ ID NO:2的序列,并且其中Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自任何氨基酸。3.一种工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽,所述工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽具有SEQ ID NO:2的氨基酸序列,
其中氨基酸残基Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自A、R、N、D、C、E、Q、G、H、I、L、K、M、F、P、S、T、W、Y和V,
其中所述工程化AAV VP衣壳多肽能够组装成重组AAV病毒体(rAAV),并且
其中所述工程化AAV VP衣壳多肽不具有SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。4.如实施方案3所述的工程化AAV VP衣壳多肽,其中与具有SEQ ID NO:l的野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述rAAV具有较高的对肾上腺组织的嗜性。5.如实施方案1所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有与SEQ ID NO:1118-SEQ ID NO:4117中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。6.如实施方案5所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有SEQ ID NO:1118-SEQ ID NO:4117中任一者的序列。7.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:2的Xaa1至Xaa9区域具有与SEQ ID NO:1118-SEQ ID NO:4117中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。8.如实施方案7所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:2的Xaa1至Xaa9区域具有SEQ ID NO:1118-SEQ ID NO:4117中任一者的序列。9.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中:
Xaa1选自由A、C、K、Q、R、S和T组成的组;或者
Xaa2选自由A、C、I、S、T和V组成的组;或者
Xaa3选自由A、F、G、K、M、Q、R、T和V组成的组;或者
Xaa4选自由A、K、M、Q、R和V组成的组;或者
Xaa5选自由F、I、L、M、R、T、V和Y组成的组;或者
Xaa6选自由G、H、M、N、R和S组成的组;或者
Xaa7选自由A、H、K、Q、R、S和V组成的组;或者
Xaa8选自由A、G、H、M、Q和S组成的组;或者
Xaa9选自由A、E、N、P、R、S和Y组成的组;或者
它们的任何组合。10.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa1选自C、K和R。11.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa1为C。12.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa2选自A、V和T。13.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa2为V。14.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa3选自A、G和M。15.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa3为M。16.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa4选自A、R和K。17.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa4为K。18.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa5选自R、V和Y。19.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa5为V。20.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa6选自H和N。21.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa6为N。22.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa7选自H、Q和V。23.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa7为H。24.如实施方案9所述的工程化AAVVP衣壳多肽,其中Xaa8选自A、G、M和S。25.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa8为S。26.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa9选自P和E。27.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa9为P。28.如实施方案1-27中任一项所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有与SEQ ID NO:1118-SEQ ID NO:2117中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。29.如实施方案28所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:1的从残基581至残基589的区域具有SEQ ID NO:1118-SEQ ID NO:2117中任一者的序列。30.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有低摩尔质量。31.如实施方案30所述的工程化AAV VP衣壳多肽,其中Xaa1选自V、P、S和C。32.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有低亲疏水性。33.如实施方案X所述的工程化AAV VP衣壳多肽,其中Xaa1选自T、S、W和Y。34.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有低亲疏水性。35.如实施方案34所述的工程化AAV VP衣壳多肽,其中Xaa2为R。36.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有低可突变性。37.如实施方案36所述的工程化AAV VP衣壳多肽,其中Xaa2为C。38.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有低溶解性。39.如实施方案38所述的工程化AAV VP衣壳多肽,其中Xaa2为K。40.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa3具有低平均柔性。41.如实施方案40所述的工程化AAV VP衣壳多肽,其中Xaa3选自W、M和F。42.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa3具有高溶解性。43.如实施方案42所述的工程化AAV VP衣壳多肽,其中Xaa3为M。44.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa4具有高表面可接近性。45.如实施方案44所述的工程化AAV VP衣壳多肽,其中Xaa4选自K和R。46.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa4具有高平均柔性。47.如实施方案46所述的工程化AAV VP衣壳多肽,其中Xaa4选自K、I和N。
48.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa5具有中等可突变性。49.如实施方案48所述的工程化AAV VP衣壳多肽,其中Xaa5选自R和H。50.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa5具有高goldman engelmansteitz。51.如实施方案50所述的工程化AAV VP衣壳多肽,其中Xaa5选自V和L。52.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa5具有低亲疏水性。53.如实施方案52所述的工程化AAV VP衣壳多肽,其中Xaa5为R。54.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa5具有高体积。
55.如实施方案54所述的工程化AAV VP衣壳多肽,其中Xaa5选自Y、R和F。56.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa6具有高溶解性。57.如实施方案56所述的工程化AAV VP衣壳多肽,其中Xaa6选自Y、V、M、A和C。58.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa7具有中等可突变性。59.如实施方案58所述的工程化AAV VP衣壳多肽,其中Xaa7选自V、H和R。60.如实施方案2-4中任一项所述的工程化AAVVP衣壳多肽,其中Xaa7具有低溶解性。61.如实施方案59所述的工程化AAV VP衣壳多肽,其中Xaa7为R。62.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa8具有高平均柔性。64.如实施方案62所述的工程化AAV VP衣壳多肽,其中Xaa8选自K、I和N。65.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa8具有高摩尔质量。66.如实施方案65所述的工程化AAV VP衣壳多肽,其中Xaa8选自R和Y。67.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa9具有高可突变性。68.如实施方案X所述的工程化AAVVP衣壳多肽,其中Xaa9为N。69.如实施方案1-68中任一项所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域包括端点在内具有与SEQ IDNO:2118-SEQ ID NO:3117中任一者具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。70.如实施方案69所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域包括端点在内具有SEQ ID NO:2118-SEQ ID NO:3117中任一者的序列。71.如实施方案1-70中任一项所述的工程化AAV VP衣壳多肽,其中对肾上腺组织的嗜性被测量为所述rAAV病毒体在肾上腺组织中相较于非肾上腺组织中的相对积聚,其中所述非肾上腺组织由CNS、肝脏、骨骼肌、心脏、肺、脾脏、淋巴结、骨髓、乳腺、皮肤、甲状腺、结肠、坐骨神经和脊髓共同组成。72.如实施例71所述的工程化AAV VP衣壳多肽,其中所述CNS组织选自前脑皮层、枕叶皮层、颞叶皮层、丘脑、下丘脑、黑质、海马DG、海马CA1、海马CA3、小脑以及它们的任何组合。
73.如实施方案71-72中任一项所述的工程化AAV VP衣壳多肽,其中所述较高的组织嗜性是在肾上腺组织中相较于非肾上腺组织中1.0005倍至约1000倍增加的积聚。74.如实施方案73所述的工程化AAV VP衣壳多肽,其中所述较高的组织嗜性是在肾上腺组织中相较于非肾上腺组织中至少约1.0005倍、至少约两倍、至少约三倍、至少约四倍、至少约五倍、至少约十倍、至少约二十倍、至少约50倍、至少约75倍、至少约100倍或至少约1000倍增加的积聚。
[407]F系列实施方案-骨髓嗜性衣壳
1.一种工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽,所述工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽具有与SEQ ID NO:1至少70%同一的氨基酸序列,
其中所述工程化AAV VP衣壳多肽相较于SEQ ID NO:1在从对应于SEQ ID NO:1的残基581的残基至对应于SEQ ID NO:1的残基589的残基的区域,包括端点在内,中具有至少一个突变,
其中所述工程化AAV VP衣壳多肽能够组装成重组AAV病毒体(rAAV),
其中与具有SEQ ID NO:1的野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述至少一个突变赋予所述rAAV较高的对骨髓组织的嗜性,并且
其中所述工程化AAV VP衣壳多肽不具有SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。2.如实施方案1所述的工程化AAV VP衣壳多肽,其中所述工程化AAV VP衣壳多肽具有SEQ ID NO:2的序列,并且其中Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自任何氨基酸。3.一种工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽,所述工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽具有SEQ ID NO:2的氨基酸序列,
其中氨基酸残基Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自A、R、N、D、C、E、Q、G、H、I、L、K、M、F、P、S、T、W、Y和V,
其中所述工程化AAV VP衣壳多肽能够组装成重组AAV病毒体(rAAV),并且
其中所述工程化AAV VP衣壳多肽不具有SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。4.如实施方案3所述的工程化AAV VP衣壳多肽,其中与具有SEQ ID NO:1的野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述rAAV具有较高的对骨髓组织的嗜性。5.如实施方案1所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有与SEQ ID NO:4118-SEQ ID NO:7117中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。6.如实施方案5所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有SEQ ID NO:4118-SEQ ID NO:7117中任一者的序列。7.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:2的Xaa1至Xaa9区域具有与SEQ ID NO:4118-SEQ ID NO:7117中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%、至少98%或至少99%同一的序列。8.如实施方案7所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:2的Xaa1至Xaa9区域具有SEQ ID NO:4118-SEQ ID NO:7117中任一者的序列。9.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中:
Xaa1选自由A、E、G、Q、S和T组成的组;或者
Xaa2选自由A、I、Q、S、T、V和Y组成的组;或者
Xaa3选自由A、G、I、M、Q、S和T组成的组;或者
Xaa4选自由A、E、P、Q、T和V组成的组;或者
Xaa5选自由F、I、L、M、Q、V和Y组成的组;或者
Xaa6选自由F、I、N、Q、S和V组成的组;或者
Xaa7选自由A、C、M、S和V组成的组;或者
Xaa8选自由A、C、D、G、M、S和Y组成的组;或者
Xaa9选自由D、E、G、L、P、S和Y组成的组;或者
它们的任何组合。10.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa1选自A、E和T。11.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa1为E。12.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa2选自A、S和T。13.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa2为A。14.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa3选自A、Q和T。15.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa3为Q。16.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa4选自A、P和Q。17.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa4为Q。18.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa5选自F、V和Y。19.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa5为V。20.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa6选自I、N、Q和S。21.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa6为S。22.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa7为A、C和V。23.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa7为C。24.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa8选自A、M、S和Y。25.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa8为M。26.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa9选自D、E和P。27.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa9为P。28.如实施方案1-27中任一项所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有与SEQ ID NO:4118-SEQ ID NO:5117中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。29.如实施方案28所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:1的从残基581至残基589的区域具有SEQ ID NO:4118-SEQ ID NO:5117中任一者的序列。30.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有高亲疏水性。31.如实施方案30所述的工程化AAV VP衣壳多肽,其中Xaa1选自V、I和L。32.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有低可突变性。33.如实施方案32所述的工程化AAV VP衣壳多肽,其中Xaa1选自Y、L、F和C。34.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有低亲疏水性。35.如实施方案34所述的工程化AAV VP衣壳多肽,其中Xaa2选自Y和W。36.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有高摩尔质量。37.如实施方案36所述的工程化AAV VP衣壳多肽,其中Xaa2为W。38.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有低表面可接近性。39.如实施方案38所述的工程化AAV VP衣壳多肽,其中Xaa2选自W和A。40.如实施方案2-4中任一项所述的工程化AAVVP衣壳多肽,其中Xaa2具有低亲水性。41.如实施方案40所述的工程化AAV VP衣壳多肽,其中Xaa2为W。42.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有低可突变性。43.如实施方案42所述的工程化AAV VP衣壳多肽,其中Xaa2为C。44.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有低平均柔性。45.如实施方案44所述的工程化AAV VP衣壳多肽,其中Xaa2选自W、M和F。46.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa5具有低平均柔性。47.如实施方案46所述的工程化AAV VP衣壳多肽,其中Xaa5选自W、M和F。48.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa6具有低平均柔性。
49.如实施方案48所述的工程化AAV VP衣壳多肽,其中Xaa6选自W、M和F。50.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa6具有低可突变性。51.如实施方案50所述的工程化AAV VP衣壳多肽,其中Xaa6选自Y、F、L和C。52.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa6具有高溶解性。53.如实施方案52所述的工程化AAV VP衣壳多肽,其中Xaa6选自W、F、I和L。54.如实施方案2-4中任一项所述的工程化AAVVP衣壳多肽,其中Xaa7具有低表面可接近性。55.如实施方案54所述的工程化AAV VP衣壳多肽,其中Xaa7为C。56.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa7具有高表面可接近性。57.如实施方案56所述的工程化AAV VP衣壳多肽,其中Xaa7选自D和N。
58.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa7具有低可突变性。
59.如实施方案58所述的工程化AAV VP衣壳多肽,其中Xaa7为C。
60.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa7具有高溶解性。
61.如实施方案60所述的工程化AAV VP衣壳多肽,其中Xaa7为C。
62.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa7具有低溶解性。
63.如实施方案X所述的工程化AAV VP衣壳多肽,其中Xaa7为D。
64.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa8具有低电荷。
65.如实施方案64所述的工程化AAV VP衣壳多肽,其中Xaa8选自D和E。
66.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa8具有高可突变性。
67.如实施方案66所述的工程化AAV VP衣壳多肽,其中Xaa8选自D、E、A和T。
68.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa9具有高摩尔质量。
69.如实施方案68所述的工程化AAV VP衣壳多肽,其中Xaa9选自H和F。
70.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa9具有低可突变性。
71.如实施方案X所述的工程化AAV VP衣壳多肽,其中Xaa9选自Y、F和L。
72.如实施方案1-71中任一项所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域包括端点在内具有与SEQ ID NO:5118-SEQ IDNO:6117中任一者具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
73.如实施方案72所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域包括端点在内具有SEQ ID NO:5118-SEQ ID NO:6117中任一者的序列。
74.如实施方案1-73中任一项所述的工程化AAV VP衣壳多肽,其中对骨髓组织的嗜性被测量为所述rAAV病毒体在骨髓组织中相较于非骨髓组织中的相对积聚,其中所述非骨髓组织由CNS、肝脏、骨骼肌、心脏、肺、脾脏、淋巴结、乳腺、皮肤、肾上腺、甲状腺、结肠、坐骨神经和脊髓共同组成。
75.如实施方案74所述的工程化AAV VP衣壳多肽,其中所述CNS组织选自前脑皮层、枕叶皮层、颞叶皮层、丘脑、下丘脑、黑质、海马DG、海马CA1、海马CA3、小脑以及它们的任何组合。
76.如实施方案74-75中任一项所述的工程化AAV VP衣壳多肽,其中所述较高的组织嗜性是在骨髓组织中相较于非骨髓组织中1.0005倍至约1000倍增加的积聚。
77.如实施方案76所述的工程化AAV VP衣壳多肽,其中所述较高的组织嗜性是在骨髓组织中相较于非骨髓组织中至少约1.0005倍、至少约两倍、至少约三倍、至少约四倍、至少约五倍、至少约十倍、至少约二十倍、至少约50倍、至少约75倍、至少约100倍或至少约1000倍增加的积聚。
[408]G系列实施方案-结肠嗜性衣壳
1.一种工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽,所述工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽具有与SEQ ID NO:1至少70%同一的氨基酸序列,
其中所述工程化AAV VP衣壳多肽相较于SEQ ID NO:1在从对应于SEQ ID NO:1的残基581的残基至对应于SEQ ID NO:1的残基589的残基的区域,包括端点在内,中具有至少一个突变,
其中所述工程化AAV VP衣壳多肽能够组装成重组AAV病毒体(rAAV),
其中与具有SEQ ID NO:l的野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述至少一个突变赋予所述rAAV较高的对结肠组织的嗜性,并且
其中所述工程化AAV VP衣壳多肽不具有SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。2.如实施方案1所述的工程化AAV VP衣壳多肽,其中所述工程化AAV VP衣壳多肽具有SEQ ID NO:2的序列,并且其中Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自任何氨基酸。3.一种工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽,所述工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽具有SEQ ID NO:2的氨基酸序列,
其中氨基酸残基Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自A、R、N、D、C、E、Q、G、H、I、L、K、M、F、P、S、T、W、Y和V,
其中所述工程化AAV VP衣壳多肽能够组装成重组AAV病毒体(rAAV),并且
其中所述工程化AAV VP衣壳多肽不具有SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。4.如实施方案3所述的工程化AAV VP衣壳多肽,其中与具有SEQ ID NO:1的野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述rAAV具有较高的对结肠组织的嗜性。
5.如实施方案1所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有与SEQ ID NO:10118-SEQ ID NO:13117中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
6.如实施方案5所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有SEQ ID NO:10118-SEQ ID NO:13117中任一者的序列。
7.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:2的Xaa1至Xaa9区域具有与SEQ ID NO:10118-SEQ ID NO:13117中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
8.如实施方案7所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:2的Xaa1至Xaa9区域具有SEQ ID NO:10118-SEQ ID NO:13117中任一者的序列。
9.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中:
Xaa1选自由C、F、H、N、P、W和Y组成的组;或者
Xaa2选自由D、E、F、L和P组成的组;或者
Xaa3选自由C、F、H、I、L、P和Y组成的组;或者
Xaa4选自由C、D、E、N和P组成的组;或者
Xaa5选自由D、E、G、P和W组成的组;或者
Xaa6选自由C、K、R和V组成的组;或者
Xaa7选自由D、M、P和V组成的组;或者
Xaa8选自由D、I、K、L、P、R和V组成的组;或者
Xaa9选自由C、H、I、K、L、M和W组成的组;或者
它们的任何组合。
10.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa1选自F、P和W。
11.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa1为P。
12.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa2选自D、E、L和P。
13.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa2为P。
14.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa3选自C、H和P。
15.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa3为P。
16.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa4选自C、D和E。
17.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa4为C。
18.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa5选自G、P和W。
19.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa5为P。
20.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa6选自K和R。
21.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa6为R。
22.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa7为P。
23.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa8选自K、P和R。
24.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa8为P。
25.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa9选自I、L和M。
26.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa9为I。
27.如实施方案1-26中任一项所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有与SEQ ID NO:10118-SEQID NO:11117中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
28.如实施方案27所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:1的从残基581至残基589的区域具有SEQ ID NO:10118-SEQ ID NO:11117中任一者的序列。
29.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有高摩尔质量。
30.如实施方案29所述的工程化AAV VP衣壳多肽,其中Xaa1选自Y、W。
31.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有高溶解性。
32.如实施方案3l所述的工程化AAV VP衣壳多肽,其中Xaa1选自W、F、I和L。
33.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有低溶解性。
34.如实施方案33所述的工程化AAV VP衣壳多肽,其中Xaa2为D。
35.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有低可突变性。
36.如实施方案35所述的工程化AAV VP衣壳多肽,其中Xaa2选自P和K。
37.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有中等摩尔质量。
38.如实施方案37所述的工程化AAV VP衣壳多肽,其中Xaa2选自D、E、N、K、M、Q、I和L。
39.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有低亲疏水性。
40.如实施方案39所述的工程化AAV VP衣壳多肽,其中Xaa2选自D、E、R、K、H、N和Q。
41.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa3具有低可突变性。
42.如实施方案41所述的工程化AAV VP衣壳多肽,其中Xaa3选自K、V、P和C。
43.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa3具有高溶解性。
44.如实施方案43所述的工程化AAV VP衣壳多肽,其中Xaa3选自W、F、I和L。
45.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa5具有高平均柔性。
46.如实施方案45所述的工程化AAV VP衣壳多肽,其中Xaa5选自S、P、G、R、E和D。
47.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa5具有高表面可接近性。
48.如实施方案47所述的工程化AAV VP衣壳多肽,其中Xaa5选自D和N。
49.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa6具有低亲疏水性。
50.如实施方案49所述的工程化AAV VP衣壳多肽,其中Xaa6选自R。
51.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa6具有低可突变性。
52.如实施方案51所述的工程化AAV VP衣壳多肽,其中Xaa6选自Y、R、F和L。
53.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa6具有低溶解性。
54.如实施方案53所述的工程化AAV VP衣壳多肽,其中Xaa6选自R和Q。
55.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa6具有高表面可接近性。
56.如实施方案55所述的工程化AAV VP衣壳多肽,其中Xaa6选自E、R、K。
57.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa6具有高平均柔性。
58.如实施方案57所述的工程化AAV VP衣壳多肽,其中Xaa6选自G和R。
59.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa8具有低溶解性。
60.如实施方案59所述的工程化AAV VP衣壳多肽,其中Xaa8为D。
61.如实施方案1-60中任一项所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域包括端点在内具有与SEQ ID NO:11118-SEQ IDNO:12117中任一者具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
62.如实施方案61所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域包括端点在内具有SEQ ID NO:11118-SEQ ID NO:12117中任一者的序列。
63.如实施方案1-62中任一项所述的工程化AAV VP衣壳多肽,其中对结肠组织的嗜性被测量为所述rAAV病毒体在结肠组织中相较于非结肠组织中的相对积聚,其中所述非结肠组织由CNS、肝脏、骨骼肌、心脏、肺、脾脏、淋巴结、骨髓、乳腺、皮肤、肾上腺、甲状腺、坐骨神经和脊髓共同组成。
64.如实施方案63所述的工程化AAV VP衣壳多肽,其中所述CNS组织选自前脑皮层、枕叶皮层、颞叶皮层、丘脑、下丘脑、黑质、海马DG、海马CA1、海马CA3、小脑以及它们的任何组合。
65.如实施方案63-64中任一项所述的工程化AAV VP衣壳多肽,其中所述较高的组织嗜性是在结肠组织中相较于非结肠组织中1.0005倍至约1000倍增加的积聚。
66.如实施方案65所述的工程化AAV VP衣壳多肽,其中所述较高的组织嗜性是在结肠组织中相较于非结肠组织中至少约1.0005倍、至少约两倍、至少约三倍、至少约四倍、至少约五倍、至少约十倍、至少约二十倍、至少约50倍、至少约75倍、至少约100倍或至少约1000倍增加的积聚。
[409]H系列实施方案-心脏嗜性衣壳
1.一种工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽,所述工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽具有与SEQ ID NO:1至少70%同一的氨基酸序列,
其中所述工程化AAV VP衣壳多肽相较于SEQ ID NO:1在从对应于SEQ ID NO:1的残基581的残基至对应于SEQ ID NO:1的残基589的残基的区域,包括端点在内,中具有至少一个突变,
其中所述工程化AAV VP衣壳多肽能够组装成重组AAV病毒体(rAAV),
其中与具有SEQ ID NO:1的野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述至少一个突变赋予所述rAAV较高的对心脏组织的嗜性,并且
其中所述工程化AAV VP衣壳多肽不具有SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。2.如实施方案1所述的工程化AAV VP衣壳多肽,其中所述工程化AAV VP衣壳多肽具有SEQ ID NO:2的序列,并且其中Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自任何氨基酸。3.一种工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽,所述工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽具有SEQ ID NO:2的氨基酸序列,
其中氨基酸残基Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自A、R、N、D、C、E、Q、G、H、I、L、K、M、F、P、S、T、W、Y和V,
其中所述工程化AAV VP衣壳多肽能够组装成重组AAV病毒体(rAAV),并且
其中所述工程化AAV VP衣壳多肽不具有SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。4.如实施方案3所述的工程化AAV VP衣壳多肽,其中与具有SEQ ID NO:1的野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述rAAV具有较高的对心脏组织的嗜性。
5.如实施方案1所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有与SEQ ID NO:13118-SEQ ID NO:16117中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
6.如实施方案5所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有SEQ ID NO:13118-SEQ ID NO:16117中任一者的序列。
7.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:2的Xaa1至Xaa9区域具有与SEQ ID NO:13118-SEQ ID NO:16117中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
8.如实施方案7所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:2的Xaa1至Xaa9区域具有SEQ ID NO:13118-SEQ ID NO:16117中任一者的序列。
9.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中:
Xaa1选自由I、K、L、M、T和V组成的组;或者
Xaa2选自由A、C、G、I、K和S组成的组;或者
Xaa3选自由A、D、E、G、K、M和V组成的组;或者
Xaa4选自由F、H、R、T、W和Y组成的组;或者
Xaa5选自由F、L、M和R组成的组;或者
Xaa6选自由A、H、N、W和Y组成的组;或者
Xaa7选自由A、C、E、F、K和T组成的组;或者
Xaa8选自由A、C、M、S和T组成的组;或者
Xaa9选自由A、D、G和P组成的组;或者
它们的任何组合。
10.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa1选自K和L。
11.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa1为K。
12.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa2选自A、C和S。
13.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa2为A。
14.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa3选自E和V。
15.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa3为E。
16.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa4选自F、R和T。
17.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa4为R。
18.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa5为L。
19.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa6选自H、N和Y。
20.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa6为H。
21.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa7选自C、F和T。
22.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa7为F。
23.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa8选自C、M和S。
24.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa8为C。
25.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa9选自A和G。
26.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa9为A。
27.如实施方案1-26中任一项所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有与SEQ ID NO:13118-SEQID NO:14117中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
28.如实施方案27所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:1的从残基581至残基589的区域具有SEQ ID NO:13118-SEQ ID NO:14117中任一者的序列。
29.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有低溶解性。
30.如实施方案29所述的工程化AAV VP衣壳多肽,其中Xaa1选自N和E。
31.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有低亲疏水性。
32.如实施方案31所述的工程化AAV VP衣壳多肽,其中Xaa1选自H、N、Q、P、Y、D和E。
33.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有高可突变性。
34.如实施方案33所述的工程化AAV VP衣壳多肽,其中Xaa1选自A和E。
35.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有高亲疏水性。
36.如实施方案35所述的工程化AAV VP衣壳多肽,其中Xaa2选自V和I。
37.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有中等可突变性。
38.如实施方案37所述的工程化AAV VP衣壳多肽,其中Xaa2为V。
39.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有中等体积。
40.如实施方案39所述的工程化AAV VP衣壳多肽,其中Xaa2选自V、E和Q。
41.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有高溶解性。
42.如实施方案41所述的工程化AAV VP衣壳多肽,其中Xaa2选自V和M。
43.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa3具有低溶解性。
44.如实施方案43所述的工程化AAV VP衣壳多肽,其中Xaa3选自R和Q。
45.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa4具有低表面可接近性。
46.如实施方案45所述的工程化AAV VP衣壳多肽,其中Xaa4为C。
47.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa4具有高溶解性。
48.如实施方案47所述的工程化AAV VP衣壳多肽,其中Xaa4为C。
49.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa4具有低电荷。
50.如实施方案49所述的工程化AAV VP衣壳多肽,其中Xaa4选自D、E、Y、W、V、P、M、A、G、F、I、L、N、Q、S、T和C。
51.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa4具有高亲疏水性。
52.如实施方案51所述的工程化AAV VP衣壳多肽,其中Xaa4为C。
53.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa5具有高表面可接近性。
54.如实施方案53所述的工程化AAV VP衣壳多肽,其中Xaa5选自D、E、R、K、N和Q。
55.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa5具有低溶解性。
56.如实施方案55所述的工程化AAV VP衣壳多肽,其中Xaa5为D。
57.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa6具有低可突变性。
58.如实施方案57所述的工程化AAV VP衣壳多肽,其中Xaa6为C。
59.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa6具有低溶解性。
60.如实施方案59所述的工程化AAV VP衣壳多肽,其中Xaa6为D。
61.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa8具有高表面可接近性。
62.如实施方案61所述的工程化AAV VP衣壳多肽,其中Xaa8选自D和N。
63.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa8具有高平均柔性。
64.如实施方案63所述的工程化AAV VP衣壳多肽,其中Xaa8选自D、R、P、G和S。
65.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa9具有中等摩尔质量。
66.如实施方案65所述的工程化AAV VP衣壳多肽,其中Xaa9选自N、D、L和I。
67.如实施方案1-66中任一项所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域包括端点在内具有与SEQ ID NO:14118-SEQ IDNO:15117中任一者具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
68.如实施方案67所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域包括端点在内具有SEQ ID NO:14118-SEQ ID NO:15117中任一者的序列。
69.如实施方案1-68中任一项所述的工程化AAV VP衣壳多肽,其中对心脏组织的嗜性被测量为所述rAAV病毒体在心脏组织中相较于非心脏组织中的相对积聚,其中所述非心脏组织由CNS、肝脏、骨骼肌、肺、脾脏、淋巴结、骨髓、乳腺、皮肤、肾上腺、甲状腺、结肠、坐骨神经和脊髓共同组成。
70.如实施方案69所述的工程化AAV VP衣壳多肽,其中所述CNS组织选自前脑皮层、枕叶皮层、颞叶皮层、丘脑、下丘脑、黑质、海马DG、海马CA1、海马CA3、小脑以及它们的任何组合。
71.如实施方案69-70中任一项所述的工程化AAV VP衣壳多肽,其中所述较高的组织嗜性是在心脏组织中相较于非心脏组织中1.0005倍至约1000倍增加的积聚。
72.如实施方案71所述的工程化AAV VP衣壳多肽,其中所述较高的组织嗜性是在心脏组织中相较于非心脏组织中至少约1.0005倍、至少约两倍、至少约三倍、至少约四倍、至少约五倍、至少约十倍、至少约二十倍、至少约50倍、至少约75倍、至少约100倍或至少约1000倍增加的积聚。
[410]I系列实施方案-肺嗜性衣壳
1.一种工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽,所述工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽具有与SEQ ID NO:1至少70%同一的氨基酸序列,
其中所述工程化AAV VP衣壳多肽相较于SEQ ID NO:1在从对应于SEQ ID NO:1的残基581的残基至对应于SEQ ID NO:1的残基589的残基的区域,包括端点在内,中具有至少一个突变,
其中所述工程化AAV VP衣壳多肽能够组装成重组AAV病毒体(rAAV),
其中与具有SEQ ID NO:1的野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述至少一个突变赋予所述rAAV较高的对肺组织的嗜性,并且
其中所述工程化AAV VP衣壳多肽不具有SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。2.如实施方案1所述的工程化AAV VP衣壳多肽,其中所述工程化AAV VP衣壳多肽具有SEQ ID NO:2的序列,并且其中Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自任何氨基酸。3.一种工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽,所述工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽具有SEQ ID NO:2的氨基酸序列,
其中氨基酸残基Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自A、R、N、D、C、E、Q、G、H、I、L、K、M、F、P、S、T、W、Y和V,
其中所述工程化AAV VP衣壳多肽能够组装成重组AAV病毒体(rAAV),并且
其中所述工程化AAV VP衣壳多肽不具有SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。
4.如实施方案3所述的工程化AAV VP衣壳多肽,其中与具有SEQ ID NO:1的野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述rAAV具有较高的对肺组织的嗜性。
5.如实施方案1所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有与SEQ ID NO:16118-SEQ ID NO:19117中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
6.如实施方案5所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有SEQ ID NO:16118-SEQ ID NO:19117中任一者的序列。
7.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:2的Xaa1至Xaa9区域具有与SEQ ID NO:1 6118-SEQ ID NO:19117中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
8.如实施方案7所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:2的Xaa1至Xaa9区域具有SEQ ID NO:16118-SEQ ID NO:19117中任一者的序列。
9.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中:
Xaa1选自由A、E、K、M、Q、R、S和T组成的组;或者
Xaa2选自由A、I、K、S、T和V组成的组;或者
Xaa3选自由A、E、K、M、Q、R、S、T和V组成的组;或者
Xaa4选自由M、P、R、S和T组成的组;或者
Xaa5选自由I、K、L、M、T、V和Y组成的组;或者
Xaa6选自由D、G、H、M、N、R和S组成的组;或者
Xaa7选自由A、K、M、Q和R组成的组;或者
Xaa8选自由A、F、G、S、W和Y组成的组;或者
Xaa9选自由A、E、G、P、R和Y组成的组;或者
它们的任何组合。
10.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa1选自A、E和Q。
11.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa1为E。
12.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa2选自S、T和V。
13.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa2为T。
14.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa3选自A、K、R和S。
15.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa3为R。
16.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa4选自P、Q和T。
17.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa4为Q。
18.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa5选自L、M和Y。
19.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa5为L。
20.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa6选自H和N。
21.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa6为N。
22.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa7选自A、K和R。
23.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa7为R。
24.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa8选自A、F和G。
25.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa8为F。
26.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa9选自G、P和R。
27.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa9为G。
28.如实施方案1-27中任一项所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有与SEQ ID NO:16118-SEQID NO:17117中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
29.如实施方案28所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:1的从残基581至残基589的区域具有SEQ ID NO:16118-SEQ ID NO:17117中任一者的序列。
30.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有高可突变性。
31.如实施方案30所述的工程化AAV VP衣壳多肽,其中Xaa1选自D、E、M、A、I、Q和T。
32.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有高摩尔质量。
33.如实施方案32所述的工程化AAV VP衣壳多肽,其中Xaa2为F。
34.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有低可突变性。
35.如实施方案34所述的工程化AAV VP衣壳多肽,其中Xaa2选自Y、F和L。
36.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa3具有低可突变性。
37.如实施方案36所述的工程化AAV VP衣壳多肽,其中Xaa3选自K、V、P和H。
38.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa3具有低亲疏水性。
39.如实施方案38所述的工程化AAV VP衣壳多肽,其中Xaa3选自K和R。
40.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa4具有低可突变性。
41.如实施方案40所述的工程化AAV VP衣壳多肽,其中Xaa4选自K和P。
42.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa4具有高平均柔性。
43.如实施方案42所述的工程化AAV VP衣壳多肽,其中Xaa4选自D、E、P和S。
44.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa5具有低平均柔性。
45.如实施方案44所述的工程化AAV VP衣壳多肽,其中Xaa5选自W、M和F。
46.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa5具有高溶解性。
47.如实施方案46所述的工程化AAV VP衣壳多肽,其中Xaa5选自W、F、I和L。
48.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa6具有中等可突变性。
49.如实施方案48所述的工程化AAV VP衣壳多肽,其中Xaa6选自R和H。
50.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa6具有高表面可接近性。
51.如实施方案50所述的工程化AAV VP衣壳多肽,其中Xaa6选自T。
52.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa7具有低可突变性。
53.如实施方案52所述的工程化AAV VP衣壳多肽,其中Xaa7为C。
54.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa7具有高溶解性。
55.如实施方案54所述的工程化AAV VP衣壳多肽,其中Xaa7选自W、V、M、F、I和L。
56.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa8具有高可突变性。
57.如实施方案56所述的工程化AAV VP衣壳多肽,其中Xaa8选自D、E、M、A、I、Q和T。
58.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa8具有低亲疏水性。
59.如实施方案58所述的工程化AAV VP衣壳多肽,其中Xaa8选自R和K。
60.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa9具有高平均柔性。
61.如实施方案60所述的工程化AAV VP衣壳多肽,其中Xaa9选自R和G。
62.如实施方案1-61中任一项所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域包括端点在内具有与SEQ ID NO:17118-SEQ IDNO:18117中任一者具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
63.如实施方案62所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域包括端点在内具有SEQ ID NO:17118-SEQ ID NO:18117中任一者的序列。
64.如实施方案1-63中任一项所述的工程化AAV VP衣壳多肽,其中对肺组织的嗜性被测量为所述rAAV病毒体在肺组织中相较于非肺组织中的相对积聚,其中所述非肺组织由CNS、肝脏、骨骼肌、脾脏、淋巴结、骨髓、乳腺、皮肤、肾上腺、甲状腺、结肠、坐骨神经和脊髓共同组成。
65.如实施方案64所述的工程化AAV VP衣壳多肽,其中所述CNS组织选自前脑皮层、枕叶皮层、颞叶皮层、丘脑、下丘脑、黑质、海马DG、海马CA1、海马CA3、小脑以及它们的任何组合。
66.如实施方案64-65中任一项所述的工程化AAV VP衣壳多肽,其中所述较高的组织嗜性是在肺组织中相较于非肺组织中1.0005倍至约1000倍增加的积聚。
67.如实施方案66所述的工程化AAV VP衣壳多肽,其中所述较高的组织嗜性是在肺组织中相较于非肺组织中至少约1.0005倍、至少约两倍、至少约三倍、至少约四倍、至少约五倍、至少约十倍、至少约二十倍、至少约50倍、至少约75倍、至少约100倍或至少约1000倍增加的积聚。
[411]J系列实施方案-淋巴结嗜性衣壳
1.一种工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽,所述工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽具有与SEQ ID NO:1至少70%同一的氨基酸序列,
其中所述工程化AAV VP衣壳多肽相较于SEQ ID NO:1在从对应于SEQ ID NO:1的残基581的残基至对应于SEQ ID NO:1的残基589的残基的区域,包括端点在内,中具有至少一个突变,
其中所述工程化AAV VP衣壳多肽能够组装成重组AAV病毒体(rAAV),
其中与具有SEQ ID NO:1的野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述至少一个突变赋予所述rAAV较高的对淋巴结组织的嗜性,并且
其中所述工程化AAV VP衣壳多肽不具有SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。2.如实施方案1所述的工程化AAV VP衣壳多肽,其中所述工程化AAV VP衣壳多肽具有SEQ ID NO:2的序列,并且其中Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自任何氨基酸。3.一种工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽,所述工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽具有SEQ ID NO:2的氨基酸序列,
其中氨基酸残基Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自A、R、N、D、C、E、Q、G、H、I、L、K、M、F、P、S、T、W、Y和V,
其中所述工程化AAV VP衣壳多肽能够组装成重组AAV病毒体(rAAV),并且
其中所述工程化AAV VP衣壳多肽不具有SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。4.如实施方案3所述的工程化AAV VP衣壳多肽,其中与具有SEQ ID NO:l的野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述rAAV具有较高的对淋巴结组织的嗜性。5.如实施方案1所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有与SEQ ID NO:19118-SEQ ID NO:22117中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。6.如实施方案5所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有SEQ ID NO:19118-SEQ ID NO:22117中任一者的序列。7.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:2的Xaa1至Xaa9区域具有与SEQ ID NO:19118-SEQ ID NO:22117中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。8.如实施方案7所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:2的Xaa1至Xaa9区域具有SEQ ID NO:19118-SEQ IDNO:22117中任一者的序列。9.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中:
Xaa1选自由A、D、E、Q、S和T组成的组;或者
Xaa2选自由A、H、I、S、T和V组成的组;或者
Xaa3选自由A、E、H、I、T和V组成的组;或者
Xaa4选自由A、D、E和P组成的组;或者
Xaa5选自由I、L、M、V和Y组成的组;或者
Xaa6选自由D、E、I、N和Q组成的组;或者
Xaa7选自由A、E、G、Q和V组成的组;或者
Xaa8选自由F、G、M和W组成的组;或者
Xaa9选自由I、P、T和Y组成的组;或者
它们的任何组合。
10.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa1选自D、E和T。
11.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa1为E。
12.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa2选自I、T和V。
13.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa2为V。
14.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa3选自A、I、T和V。
15.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa3为T。
16.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa4选自D和E。
17.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa4为E。
18.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa5选自I、L、V和Y。
19.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa5为L。
20.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa6选自D、E和I。
21.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa6为D。
22.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa7为A、Q或V。
23.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa7为V。
24.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa8选自F和W。
25.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa8为W。
26.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa9为I或P。
27.如实施方案1-26中任一项所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有与SEQ ID NO:19118-SEQID NO:20117中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
28.如实施方案27所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:1的从残基581至残基589的区域具有SEQ ID NO:19118-SEQ ID NO:20117中任一者的序列。
29.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有高平均柔性。
30.如实施方案29所述的工程化AAV VP衣壳多肽,其中Xaa1选自D、E、P、G、Q、S和R。
31.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有高氢键供体。
32.如实施方案31所述的工程化AAV VP衣壳多肽,其中Xaa1为R。
33.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有高摩尔质量。
34.如实施方案33所述的工程化AAV VP衣壳多肽,其中Xaa1选自Y、W、R和F。
35.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有低溶解性。
36.如实施方案35所述的工程化AAV VP衣壳多肽,其中Xaa2选自N和E。
37.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa3具有低平均柔性。
38.如实施方案37所述的工程化AAV VP衣壳多肽,其中Xaa3选自W、M和F。
39.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa3具有低可突变性。
40.如实施方案39所述的工程化AAV VP衣壳多肽,其中Xaa3选自R、H、K、P、Y、F、L和C。
41.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa4具有低可突变性。
42.如实施方案41所述的工程化AAV VP衣壳多肽,其中Xaa4为C。
43.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa5具有高可突变性。
44.如实施方案43所述的工程化AAV VP衣壳多肽,其中Xaa5为N。
45.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa5具有中等摩尔质量。
46.如实施方案45所述的工程化AAV VP衣壳多肽,其中Xaa5选自D、I、L和N。
47.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa6具有高摩尔质量。
48.如实施方案47所述的工程化AAV VP衣壳多肽,其中Xaa6选自Y、W、R和F。
49.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa6具有高平均柔性。
50.如实施方案49所述的工程化AAV VP衣壳多肽,其中Xaa6选自G和R。
51.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa7具有高平均柔性。
52.如实施方案51所述的工程化AAV VP衣壳多肽,其中Xaa7选自D、E、K、P、I、N、Q和S。
53.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa7具有低溶解性。
54.如实施方案53所述的工程化AAV VP衣壳多肽,其中Xaa7选自N和E。
55.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa8具有低溶解性。
56.如实施方案55所述的工程化AAV VP衣壳多肽,其中Xaa8选自N、E和D。
57.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa8具有中等可突变性。
58.如实施方案57所述的工程化AAV VP衣壳多肽,其中Xaa8选自R和H。
59.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa9具有低可突变性。
60.如实施方案59所述的工程化AAV VP衣壳多肽,其中Xaa9选自P和K。
61.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa9具有高平均柔性。
62.如实施方案61所述的工程化AAV VP衣壳多肽,其中Xaa9选自D、E、P和S。
63.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa9具有高溶解性。
64.如实施方案63所述的工程化AAV VP衣壳多肽,其中Xaa9选自M和V。
65.如实施方案1-64中任一项所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域包括端点在内具有与SEQ ID NO:20118-SEQ IDNO:21117中任一者具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
66.如实施方案65所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域包括端点在内具有SEQ ID NO:20118-SEQ ID NO:21117中任一者的序列。
67.如实施方案1-66中任一项所述的工程化AAV VP衣壳多肽,其中对淋巴结组织的嗜性被测量为所述rAAV病毒体在淋巴结组织中相较于非淋巴结组织中的相对积聚,其中所述非淋巴结组织由CNS、肝脏、骨骼肌、心脏、肺、脾脏、骨髓、乳腺、皮肤、肾上腺、甲状腺、结肠、坐骨神经和脊髓共同组成。
68.如实施方案67所述的工程化AAV VP衣壳多肽,其中所述CNS组织选自前脑皮层、枕叶皮层、颞叶皮层、丘脑、下丘脑、黑质、海马DG、海马CA1、海马CA3、小脑以及它们的任何组合。
69.如实施方案67-68中任一项所述的工程化AAV VP衣壳多肽,其中所述较高的组织嗜性是在淋巴结组织中相较于非淋巴结组织中1.0005倍至约1000倍增加的积聚。
70.如实施方案69所述的工程化AAV VP衣壳多肽,其中所述较高的组织嗜性是在淋巴结组织中相较于非淋巴结组织中至少约1.0005倍、至少约两倍、至少约三倍、至少约四倍、至少约五倍、至少约十倍、至少约二十倍、至少约50倍、至少约75倍、至少约100倍或至少约1000倍增加的积聚。
[412]K系列实施方案-乳腺嗜性衣壳
1.一种工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽,所述工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽具有与SEQ ID NO:1至少70%同一的氨基酸序列,
其中所述工程化AAV VP衣壳多肽相较于SEQ ID NO:1在从对应于SEQ ID NO:1的残基581的残基至对应于SEQ ID NO:1的残基589的残基的区域,包括端点在内,中具有至少一个突变,
其中所述工程化AAV VP衣壳多肽能够组装成重组AAV病毒体(rAAV),
其中与具有SEQ ID NO:1的野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述至少一个突变赋予所述rAAV较高的对乳腺组织的嗜性,并且
其中所述工程化AAV VP衣壳多肽不具有SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。2.如实施方案1所述的工程化AAV VP衣壳多肽,其中所述工程化AAV VP衣壳多肽具有SEQ ID NO:2的序列,并且其中Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自任何氨基酸。3.一种工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽,所述工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽具有SEQ ID NO:2的氨基酸序列,
其中氨基酸残基Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自A、R、N、D、C、E、Q、G、H、I、L、K、M、F、P、S、T、W、Y和V,
其中所述工程化AAV VP衣壳多肽能够组装成重组AAV病毒体(rAAV),并且
其中所述工程化AAV VP衣壳多肽不具有SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。4.如实施方案3所述的工程化AAV VP衣壳多肽,其中与具有SEQ ID NO:1的野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述rAAV具有较高的对乳腺组织的嗜性。
5.如实施方案1所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有与SEQ ID NO:22118-SEQ ID NO:25117中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
6.如实施方案5所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有SEQ ID NO:22118-SEQ ID NO:25117中任一者的序列。
7.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:2的Xaa1至Xaa9区域具有与SEQ ID NO:22118-SEQ ID NO:25117中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
8.如实施方案7所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:2的Xaa1至Xaa9区域具有SEQ ID NO:22118-SEQ ID NO:25117中任一者的序列。
9.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中:
Xaa1选自由C、K、M、Q、R和Y组成的组;或者
Xaa2选自由A、F、I、K、S、T和V组成的组;或者
Xaa3选自由A、F、G、I、K、L、R、T和Y组成的组;或者
Xaa4选自由A、I、K、Q、R和T组成的组;或者
Xaa5选自由I、L、M、Q、R、T、V和Y组成的组;或者
Xaa6选自由H、N、S和V组成的组;或者
Xaa7选自由A、H、I、N、S和Y组成的组;或者
Xaa8选自由A、C、D、G、H、M、Q和S组成的组;或者
Xaa9选自由A、E、L、W和Y组成的组;或者
它们的任何组合。
10.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa1选自C、Q和R。
11.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa1为C。
12.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa2选自A、S和V。
13.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa2为V。
14.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa3选自F、G、K、R和Y。
15.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa3选自F、K和Y。
16.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa3为F。
17.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa4选自A、I和R。
18.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa4为I。
19.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa5选自I、M和Y。
20.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa5为Y。
21.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa6为H。
22.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa7为N或S。
23.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa7为N。
24.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa8选自G、M和Q。
25.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa8为G。
26.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa9选自A、L和W。
27.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa9为A。
28.如实施方案1-27中任一项所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有与SEQ ID NO:22118-SEQID NO:23117中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
29.如实施方案28所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:1的从残基581至残基589的区域具有SEQ ID NO:22118-SEQ ID NO:23117中任一者的序列。
30.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有低表面可接近性。
31.如实施方案30所述的工程化AAV VP衣壳多肽,其中Xaa1为C。
32.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有中等摩尔质量。
33.如实施方案32所述的工程化AAV VP衣壳多肽,其中Xaa1为C。
34.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有高表面可接近性。
35.如实施方案34所述的工程化AAV VP衣壳多肽,其中Xaa2选自D、N和Q。
36.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有低亲疏水性。
37.如实施方案36所述的工程化AAV VP衣壳多肽,其中Xaa2选自D、E、R、K、H、N和Q。
38.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa3具有高平均柔性。
39.如实施方案38所述的工程化AAV VP衣壳多肽,其中Xaa3选自D、E、R、P、G和S。
40.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa3具有中等可突变性。
41.如实施方案40所述的工程化AAV VP衣壳多肽,其中Xaa3选自R和H。
42.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa4具有高可突变性。
43.如实施方案42所述的工程化AAV VP衣壳多肽,其中Xaa4选自M、I、Q和T。
44.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa4具有高溶解性。
45.如实施方案44所述的工程化AAV VP衣壳多肽,其中Xaa4选自W、F、I和L。
46.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa4具有高表面可接近性。
47.如实施方案46所述的工程化AAV VP衣壳多肽,其中Xaa4选自E、R和K。
48.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa5具有高溶解性。
49.如实施方案48所述的工程化AAV VP衣壳多肽,其中Xaa5选自W、F、I和L。
50.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa5具有低可突变性。
51.如实施方案50所述的工程化AAV VP衣壳多肽,其中Xaa5选自Y、F和L。
52.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa6具有高亲疏水性。
53.如实施方案52所述的工程化AAV VP衣壳多肽,其中Xaa6选自V、I和L。
54.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa6具有中等摩尔质量。
55.如实施方案54所述的工程化AAV VP衣壳多肽,其中Xaa6选自D、I、L和N。
56.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa8具有低表面可接近性。
57.如实施方案56所述的工程化AAV VP衣壳多肽,其中Xaa8为C。
58.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa8具有低可突变性。
59.如实施方案58所述的工程化AAV VP衣壳多肽,其中Xaa8选自C、R和H。
60.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa8具有中等可突变性。
61.如实施方案60所述的工程化AAV VP衣壳多肽,其中Xaa9选自R和H。
62.如实施方案1-61中任一项所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域包括端点在内具有与SEQ ID NO:23118-SEQ IDNO:24117中任一者具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
63.如实施方案62所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域包括端点在内具有SEQ ID NO:23118一SEQ ID NO:24117中任一者的序列。
64.如实施方案1-63中任一项所述的工程化AAV VP衣壳多肽,其中对乳腺组织的嗜性被测量为所述rAAV病毒体在乳腺组织中相较于非乳腺组织中的相对积聚,其中所述非乳腺组织由CNS、肝脏、骨骼肌、心脏、肺、脾脏、淋巴结、骨髓、皮肤、肾上腺、甲状腺、结肠、坐骨神经和脊髓共同组成。
65.如实施方案65所述的工程化AAV VP衣壳多肽,其中所述CNS组织选自前脑皮层、枕叶皮层、颞叶皮层、丘脑、下丘脑、黑质、海马DG、海马CA1、海马CA3、小脑以及它们的任何组合。
66.如实施方案64-65中任一项所述的工程化AAV VP衣壳多肽,其中所述较高的组织嗜性是在乳腺组织中相较于非乳腺组织中1.0005倍至约1000倍增加的积聚。
67.如实施方案66所述的工程化AAV VP衣壳多肽,其中所述较高的组织嗜性是在乳腺组织中相较于非乳腺组织中至少约1.0005倍、至少约两倍、至少约三倍、至少约四倍、至少约五倍、至少约十倍、至少约二十倍、至少约50倍、至少约75倍、至少约100倍或至少约1000倍增加的积聚。
[413]L系列实施方案-骨骼肌或心肌嗜性衣壳
1.一种工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽,所述工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽具有与SEQ ID NO:1至少70%同一的氨基酸序列,
其中所述工程化AAV VP衣壳多肽相较于SEQ ID NO:1在从对应于SEQ ID NO:1的残基581的残基至对应于SEQ ID NO:1的残基589的残基的区域,包括端点在内,中具有至少一个突变,
其中所述工程化AAV VP衣壳多肽能够组装成重组AAV病毒体(rAAV),
其中与具有SEQ ID NO:1的野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述至少一个突变赋予所述rAAV较高的对骨骼肌组织或心肌组织的嗜性,并且
其中所述工程化AAV VP衣壳多肽不具有SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。2.如实施方案1所述的工程化AAV VP衣壳多肽,其中所述工程化AAV VP衣壳多肽具有SEQ ID NO:2的序列,并且其中Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自任何氨基酸。3.一种工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽,所述工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽具有SEQ ID NO:2的氨基酸序列,
其中氨基酸残基Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自A、R、N、D、C、E、Q、G、H、I、L、K、M、F、P、S、T、W、Y和V,
其中所述工程化AAV VP衣壳多肽能够组装成重组AAV病毒体(rAAV),并且
其中所述工程化AAV VP衣壳多肽不具有SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。4.如实施方案3所述的工程化AAV VP衣壳多肽,其中与具有SEQ ID NO:1的野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述rAAV具有较高的对骨骼肌组织或心肌组织的嗜性。
5.如实施方案1所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有与SEQ ID NO:25118-SEQ ID NO:26117中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
6.如实施方案5所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有SEQ ID NO:25118-SEQ ID NO:26117中任一者的序列。
7.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:2的Xaa1至Xaa9区域具有与SEQ ID NO:25118-SEQ ID NO:26117中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
8.如实施方案7所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:2的Xaa1至Xaa9区域具有SEQ ID NO:25118-SEQ ID NO:26117中任一者的序列。
9.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有低溶解性。
10.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa1选自D、E、R、K、P、N和Q。
11.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有低亲疏水性。
12.如实施方案11所述的工程化AAV VP衣壳多肽,其中Xaa1选自D、E、R、K、Q、N、Y、P。
13.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有高表面可接近性。
14.如实施方案13所述的工程化AAV VP衣壳多肽,其中Xaa1选自E、R和K。
15.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有高亲疏水性。
16.如实施方案15所述的工程化AAV VP衣壳多肽,其中Xaa2选自V、I、F、L和C。
17.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有低可突变性。
18.如实施方案17所述的工程化AAV VP衣壳多肽,其中Xaa2选自R、V、I、H和C。
19.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有中等体积。
20.如实施方案19所述的工程化AAV VP衣壳多肽,其中Xaa2选自E、V和Q。
21.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa3具有低溶解性。
22.如实施方案21所述的工程化AAV VP衣壳多肽,其中Xaa3选自D、R和Q。
23.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa4具有低溶解性。
24.如实施方案23所述的工程化AAV VP衣壳多肽,其中Xaa4选自D、E、P和N。
25.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa4具有低电荷。
26.如实施方案25所述的工程化AAV VP衣壳多肽,其中Xaa4选自D和E。
27.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa5具有低氨基酸溶解性。
28.如实施方案27所述的工程化AAV VP衣壳多肽,其中Xaa5选自D、E、R、K、N、Q。
29.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa8具有低溶解性。
30.如实施方案29所述的工程化AAV VP衣壳多肽,其中Xaa8选自D、E、K、P和N。
31.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa8具有高柔性指数。
32.如实施方案31所述的工程化AAV VP衣壳多肽,其中Xaa8选自Q、S、P、E和D。
33.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa8具有高表面可接近性。
34.如实施方案33所述的工程化AAV VP衣壳多肽,其中Xaa8选自S、D、P、N、E、R和K。
35.如实施方案1-34中任一项所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域包括端点在内具有与SEQ ID NO:25118-SEQ IDNO:26117中任一者具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
36.如实施方案35所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域包括端点在内具有SEQ ID NO:25118一SEQ ID NO:26117中任一者的序列。
37.如实施方案1-36中任一项所述的工程化AAV VP衣壳多肽,其中对骨骼肌组织或心肌组织的嗜性被测量为所述rAAV病毒体在骨骼肌组织或心肌组织中相较于非骨骼肌组织或非心肌组织中的相对积聚,其中所述非骨骼肌组织或非心肌组织由CNS、肝脏、肺、脾脏、淋巴结、骨髓、乳腺、皮肤、肾上腺、甲状腺、结肠、坐骨神经和脊髓共同组成。
38.如实施方案37所述的工程化AAV VP衣壳多肽,其中所述CNS组织选自前脑皮层、枕叶皮层、颞叶皮层、丘脑、下丘脑、黑质、海马DG、海马CA1、海马CA3、小脑以及它们的任何组合。
39.如实施方案37-38中任一项所述的工程化AAV VP衣壳多肽,其中所述较高的组织嗜性是在骨骼肌组织或心肌组织中相较于非骨骼肌组织或非心肌组织中1.0005倍至约1000倍增加的积聚。
40.如实施方案39所述的工程化AAV VP衣壳多肽,其中所述较高的组织嗜性是在骨骼肌组织或心肌组织中相较于非骨骼肌组织或非心肌组织中至少约1.0005倍、至少约两倍、至少约三倍、至少约四倍、至少约五倍、至少约十倍、至少约二十倍、至少约50倍、至少约75倍、至少约100倍或至少约1000倍增加的积聚。
[414]M系列实施方案-坐骨神经嗜性衣壳
1.一种工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽,所述工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽具有与SEQ ID NO:1至少70%同一的氨基酸序列,
其中所述工程化AAV VP衣壳多肽相较于SEQ ID NO:1在从对应于SEQ ID NO:1的残基581的残基至对应于SEQ ID NO:1的残基589的残基的区域,包括端点在内,中具有至少一个突变,
其中所述工程化AAV VP衣壳多肽能够组装成重组AAV病毒体(rAAV),
其中与具有SEQ ID NO:1的野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述至少一个突变赋予所述rAAV较高的对坐骨神经组织的嗜性,并且
其中所述工程化AAV VP衣壳多肽不具有SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。2.如实施方案1所述的工程化AAV VP衣壳多肽,其中所述工程化AAV VP衣壳多肽具有SEQ ID NO:2的序列,并且其中Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自任何氨基酸。3.一种工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽,所述工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽具有SEQ ID NO:2的氨基酸序列,
其中氨基酸残基Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自A、R、N、D、C、E、Q、G、H、I、L、K、M、F、P、S、T、W、Y和V,
其中所述工程化AAV VP衣壳多肽能够组装成重组AAV病毒体(rAAV),并且
其中所述工程化AAV VP衣壳多肽不具有SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。4.如实施方案3所述的工程化AAV VP衣壳多肽,其中与具有SEQ ID NO:1的野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述rAAV具有较高的对坐骨神经组织的嗜性。5.如实施方案1所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有与SEQ ID NO:26118-SEQ ID NO:28990中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
6.如实施方案5所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有SEQ ID NO:26118-SEQ ID NO:28990中任一者的序列。
7.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:2的Xaa1至Xaa9区域具有与SEQ ID NO:26118-SEQ ID NO:28990中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
8.如实施方案7所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:2的Xaa1至Xaa9区域具有SEQ ID NO:26118-SEQ ID NO:28990中任一者的序列。
9.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中:
Xaa1选自由C、G、K、M、Q、R和Y组成的组;或者
Xaa2选自由A、C、F、I、Q、T和V组成的组;或者
Xaa3选自由A、F、I、M、R、S和T组成的组;或者
Xaa4选自由E、N、T、Q和V组成的组;或者
Xaa5选自由F、H、Q、S、V和Y组成的组;或者
Xaa6选自由K、M、N、Q、S和V组成的组;或者
Xaa7选自由K、M、Q、R和T组成的组;或者
Xaa8选自由A、G、H、Q、S和V组成的组;或者
Xaa9选自由C、E、I、K和R组成的组;或者
它们的任何组合。
10.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa1选自C、R和Q。
11.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa1为C。
12.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa2选自A、C和I。
13.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa2为A。
14.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa3选自F、M、R和S。
15.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa3为R。
16.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa4选自E、T和V。
17.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa4为T。
18.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa5选自F、V和Y。
19.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa5为V。
20.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa6选自M、N和S。
21.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa6为N。
22.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa7选自M、Q和T。
23.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa7为M。
24.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa8选自H和S。
25.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa8为H。
26.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa9选自C、I和K。
27.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa9为I。
28.如实施方案1-27中任一项所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有与SEQ ID NO:26118-SEQID NO:26990中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
29.如实施方案28所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:1的从残基581至残基589的区域具有SEQ ID NO:26118-SEQ ID NO:26990中任一者的序列。
30.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有高平均柔性。
31.如实施方案30所述的工程化AAV VP衣壳多肽,其中Xaa1选自G和R。
32.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有低溶解性。
33.如实施方案32所述的工程化AAV VP衣壳多肽,其中Xaa1选自R和Q。
34.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有低可突变性。
35.如实施方案34所述的工程化AAV VP衣壳多肽,其中Xaa1选自C、L、F、Y、R、K、P和H。
36.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有高体积。
37.如实施方案36所述的工程化AAV VP衣壳多肽,其中Xaa1选自Y和F。
38.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有高表面可接近性。
39.如实施方案38所述的工程化AAV VP衣壳多肽,其中Xaa2选自E、R和K。
40.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa3具有中等可突变性。
41.如实施方案40所述的工程化AAV VP衣壳多肽,其中Xaa3选自H和R。
42.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa3具有中等平均柔性。
43.如实施方案42所述的工程化AAV VP衣壳多肽,其中Xaa3选自V和Y。
44.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa4具有高可突变性。
45.如实施方案44所述的工程化AAV VP衣壳多肽,其中Xaa4为N。
46.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa4具有高平均柔性。
47.如实施方案46所述的工程化AAV VP衣壳多肽,其中Xaa4选自I、N、G和R。
48.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa4具有低溶解性。
49.如实施方案48所述的工程化AAV VP衣壳多肽,其中Xaa4为N。
50.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa6具有低可突变性。
51.如实施方案50所述的工程化AAV VP衣壳多肽,其中Xaa6选自C、L、F和Y。
52.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa6具有高体积。
53.如实施方案52所述的工程化AAV VP衣壳多肽,其中Xaa6选自K、M、I和L。
54.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa7具有低可突变性。
55.如实施方案54所述的工程化AAV VP衣壳多肽,其中Xaa7选自L、F和Y。
56.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa7具有中等摩尔质量。
57.如实施方案56所述的工程化AAV VP衣壳多肽,其中Xaa7选自D、I、L和N。
58.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa8具有高表面可接近性。
59.如实施方案58所述的工程化AAV VP衣壳多肽,其中Xaa8选自S、Y、T、D、P、H和N。
60.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa9具有低可突变性。
61.如实施方案60所述的工程化AAV VP衣壳多肽,其中Xaa9选自C、H和R。
62.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa9具有中等溶解性。
63.如实施方案62所述的工程化AAV VP衣壳多肽,其中Xaa9选自Q、T和C。
64.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa9具有低表面可接近性。
65.如实施方案64所述的工程化AAV VP衣壳多肽,其中Xaa9为C。
66.如实施方案1-65中任一项所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域包括端点在内具有与SEQ ID NO:26991-SEQ IDNO:27990中任一者具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
67.如实施方案66所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域包括端点在内具有SEQ ID NO:26991-SEQ ID NO:27990中任一者的序列。
68.如实施方案1-67中任一项所述的工程化AAV VP衣壳多肽,其中对坐骨神经组织的嗜性被测量为所述rAAV病毒体在坐骨神经组织中相较于非坐骨神经组织中的相对积聚,其中所述非坐骨神经组织由CNS、肝脏、骨骼肌、心脏、肺、脾脏、淋巴结、骨髓、乳腺、皮肤、肾上腺、甲状腺、结肠和脊髓共同组成。
69.如实施方案68中任一项所述的工程化AAV VP衣壳多肽,其中所述CNS组织选自前脑皮层、枕叶皮层、颞叶皮层、丘脑、下丘脑、黑质、海马DG、海马CA1、海马CA3、小脑以及它们的任何组合。
70.如实施方案68-69中任一项所述的工程化AAV VP衣壳多肽,其中所述较高的组织嗜性是在坐骨神经组织中相较于非坐骨神经组织中1.0005倍至约1000倍增加的积聚。
71.如实施方案70所述的工程化AAV VP衣壳多肽,其中所述较高的组织嗜性是在坐骨神经组织中相较于非坐骨神经组织中至少约1.0005倍、至少约两倍、至少约三倍、至少约四倍、至少约五倍、至少约十倍、至少约二十倍、至少约50倍、至少约75倍、至少约100倍或至少约1000倍增加的积聚。
[415]N系列实施方案-骨骼肌嗜性衣壳
1.一种工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽,所述工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽具有与SEQ ID NO:1至少70%同一的氨基酸序列,
其中所述工程化AAV VP衣壳多肽相较于SEQ ID NO:1在从对应于SEQ ID NO:1的残基581的残基至对应于SEQ ID NO:1的残基589的残基的区域,包括端点在内,中具有至少一个突变,
其中所述工程化AAV VP衣壳多肽能够组装成重组AAV病毒体(rAAV),
其中与具有SEQ ID NO:1的野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述至少一个突变赋予所述rAAV较高的对骨骼肌组织的嗜性,并且
其中所述工程化AAV VP衣壳多肽不具有SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。2.如实施方案1所述的工程化AAV VP衣壳多肽,其中所述工程化AAV VP衣壳多肽具有SEQ ID NO:2的序列,并且其中Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自任何氨基酸。3.一种工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽,所述工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽具有SEQ ID NO:2的氨基酸序列,
其中氨基酸残基Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自A、R、N、D、C、E、Q、G、H、I、L、K、M、F、P、S、T、W、Y和V,
其中所述工程化AAV VP衣壳多肽能够组装成重组AAV病毒体(rAAV),并且
其中所述工程化AAV VP衣壳多肽不具有SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。4.如实施方案3所述的工程化AAV VP衣壳多肽,其中与具有SEQ ID NO:1的野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述rAAV具有较高的对骨骼肌组织的嗜性。5.如实施方案1中任一项所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有与SEQ ID NO:28991-SEQ ID NO:31990中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。6.如实施方案5所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有SEQ ID NO:28991-SEQ ID NO:31990中任一者的序列。7.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:2的Xaa1至Xaa9区域具有与SEQ ID NO:28991-SEQ ID NO:31990中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
8.如实施方案7所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:2的Xaa1至Xaa9区域具有SEQ ID NO:28991-SEQ ID NO:31990中任一者的序列。
9.如实施方案X-Y中任一项所述的工程化AAV VP衣壳多肽,其中:
Xaa1选自由A、E、H、M、P、Q和S组成的组;或者
Xaa2选自由F、H、I、T和V组成的组;或者
Xaa3选自由A、G、I、K、M、Q、R、S、T和V组成的组;或者
Xaa4选自由D、E、G、P和S组成的组;或者
Xaa5选自由H、L、M、P和V组成的组;或者
Xaa6选自由E、H、N和P组成的组;或者
Xaa7选自由A、H、N、Q和T组成的组;或者
Xaa8选自由I、K、M、P和W组成的组;或者
Xaa9选自由A、I、M、P和V组成的组;或者
它们的任何组合。
10.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa1选自P和Q。
11.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa1为Q。
12.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa2选自T和V。
13.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa2为V。
14.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa3选自A、L、P、R和T。
15.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa3选自L、P和T。
16.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa3为P。
17.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa4选自D、E和S。
18.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa4为E。
19.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa5选自L、M和V。
20.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa5为L。
21.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa6为P。
22.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa7为H。
23.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa8选自I、P和W。
24.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa8为P。
25.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa9选自A、M和P。
26.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa9为M。
27.如实施方案1-26中任一项所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有与SEQ ID NO:28991-SEQID NO:29990中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
28.如实施方案27所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:1的从残基581至残基589的区域具有SEQ ID NO:28991-SEQ ID NO:29990中任一者的序列。
29.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有高平均柔性。
30.如实施方案29所述的工程化AAV VP衣壳多肽,其中Xaa1选自G和R。
31.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有低平均柔性。
32.如实施方案31所述的工程化AAV VP衣壳多肽,其中Xaa1选自W、M、F和H。
33.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有高摩尔质量。
34.如实施方案33所述的工程化AAV VP衣壳多肽,其中Xaa1选自R、F和W。
35.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有低亲疏水性。
36.如实施方案35所述的工程化AAV VP衣壳多肽,其中Xaa2选自K和R。
37.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有低可突变性。
38.如实施方案37所述的工程化AAV VP衣壳多肽,其中Xaa2选自C、R和H。
39.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有高平均柔性。
40.如实施方案39所述的工程化AAV VP衣壳多肽,其中Xaa2选自G和R。
41.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa3具有高平均柔性。
42.如实施方案41所述的工程化AAV VP衣壳多肽,其中Xaa3选自G和R。
43.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa4具有高亲水性。
44.如实施方案43所述的工程化AAV VP衣壳多肽,其中Xaa4选自D、E、R、K和N。
45.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa4具有低可突变性。
46.如实施方案45所述的工程化AAV VP衣壳多肽,其中Xaa4选自C、R和H。
47.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa5具有低摩尔质量。
48.如实施方案47所述的工程化AAV VP衣壳多肽,其中Xaa5为A。
49.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa5具有低平均柔性。
50.如实施方案49所述的工程化AAV VP衣壳多肽,其中Xaa5选自A和L。
51.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa5具有高可突变性。
52.如实施方案51所述的工程化AAV VP衣壳多肽,其中Xaa5选自D、A和E。
53.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa6具有低平均柔性。
54.如实施方案53所述的工程化AAV VP衣壳多肽,其中Xaa6选自W、M和F。
55.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa6具有低可突变性。
56.如实施方案55所述的工程化AAV VP衣壳多肽,其中Xaa6为C。
57.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa6具有高摩尔质量。
58.如实施方案57所述的工程化AAV VP衣壳多肽,其中Xaa6为W。
59.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa7具有低goldman engelman steitz。
60.如实施方案59所述的工程化AAV VP衣壳多肽,其中Xaa7为R。
61.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa7具有高平均柔性。
62.如实施方案61所述的工程化AAV VP衣壳多肽,其中Xaa7选自D、R、P、G和S。
63.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa7具有高可突变性。
64.如实施方案63所述的工程化AAV VP衣壳多肽,其中Xaa7选自R、H和N。
65.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa7具有低溶解性。
66.如实施方案65所述的工程化AAV VP衣壳多肽,其中Xaa7选自R和Q。
67.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa8具有高亲水性。
68.如实施方案67所述的工程化AAV VP衣壳多肽,其中Xaa8选自D、E、R、K和N。
69.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa9具有低可突变性。
70.如实施方案69所述的工程化AAV VP衣壳多肽,其中Xaa9选自Y、F和L。
71.如实施方案1-70中任一项所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域包括端点在内具有与SEQ ID NO:29991-SEQ IDNO:30990中任一者具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
72.如实施方案71所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域包括端点在内具有SEQ ID NO:29991-SEQ ID NO:30990中任一者的序列。
73.如实施方案1-72中任一项所述的工程化AAV VP衣壳多肽,其中对骨骼肌组织的嗜性被测量为所述rAAV病毒体在骨骼肌组织中相较于非骨骼肌组织中的相对积聚,其中所述非骨骼肌组织由CNS、肝脏、心脏、肺、脾脏、淋巴结、骨髓、乳腺、皮肤、肾上腺、甲状腺、结肠、坐骨神经和脊髓共同组成。
74.如实施方案73所述的工程化AAV VP衣壳多肽,其中所述CNS组织选自前脑皮层、枕叶皮层、颞叶皮层、丘脑、下丘脑、黑质、海马DG、海马CA1、海马CA3、小脑以及它们的任何组合。
75.如实施方案73和74中任一项所述的工程化AAV VP衣壳多肽,其中所述较高的组织嗜性是在骨骼肌组织中相较于非骨骼肌组织中1.0005倍至约1000倍增加的积聚。
76.如实施方案75所述的工程化AAV VP衣壳多肽,其中所述较高的组织嗜性是在骨骼肌组织中相较于非骨骼肌组织中至少约1.0005倍、至少约两倍、至少约三倍、至少约四倍、至少约五倍、至少约十倍、至少约二十倍、至少约50倍、至少约75倍、至少约100倍或至少约1000倍增加的积聚。
[416]O系列实施方案-皮肤嗜性衣壳
1.一种工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽,所述工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽具有与SEQ ID NO:1至少70%同一的氨基酸序列,
其中所述工程化AAV VP衣壳多肽相较于SEQ ID NO:1在从对应于SEQ ID NO:1的残基581的残基至对应于SEQ ID NO:1的残基589的残基的区域,包括端点在内,中具有至少一个突变,
其中所述工程化AAV VP衣壳多肽能够组装成重组AAV病毒体(rAAV),
其中与具有SEQ ID NO:1的野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述至少一个突变赋予所述rAAV较高的对皮肤组织的嗜性,并且
其中所述工程化AAV VP衣壳多肽不具有SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。2.如实施方案1所述的工程化AAV VP衣壳多肽,其中所述工程化AAV VP衣壳多肽具有SEQ ID NO:2的序列,并且其中Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自任何氨基酸。3.一种工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽,所述工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽具有SEQ ID NO:2的氨基酸序列,
其中氨基酸残基Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自A、R、N、D、C、E、Q、G、H、I、L、K、M、F、P、S、T、W、Y和V,
其中所述工程化AAV VP衣壳多肽能够组装成重组AAV病毒体(rAAV),并且
其中所述工程化AAV VP衣壳多肽不具有SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。4.如实施方案3所述的工程化AAV VP衣壳多肽,其中与具有SEQ ID NO:1的野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述rAAV具有较高的对皮肤组织的嗜性。5.如实施方案1所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有与SEQ ID NO:31991-SEQ ID NO:34990中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
6.如实施方案5所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有SEQ ID NO:31991-SEQ ID NO:34990中任一者的序列。
7.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:2的Xaa1至Xaa9区域具有与SEQ ID NO:3l 99l-SEQ ID NO:34990中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
8.如实施方案7所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:2的Xaa1至Xaa9区域具有SEQ ID NO:31991-SEQ ID NO:34990中任一者的序列。
9.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中:
Xaa1选自由A、C、K、Q、R和T组成的组;或者
Xaa2选自由A、C、I、S、T和V组成的组;或者
Xaa3选自由A、C、F、G、M、Q、S和V组成的组;或者
Xaa4选自由C、K、L、P、R和W组成的组;或者
Xaa5选自由F、H、I、M、V和Y组成的组;或者
Xaa6选自由F、H、I、M、N、Q和S组成的组;或者
Xaa7选自由A、H、K、M、N、R和V组成的组;或者
Xaa8选自由A、F、G、H、S和Y组成的组;或者
Xaa9选自由A、E、G、P、Q、R和S组成的组;或者
它们的任何组合。
10.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa1选自C、K和R。
11.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa1为C。
12.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa2选自A、S、T和V。
13.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa2为V。
14.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa3选自A、C、F、M和Q。
15.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa3为C。
16.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa4选自L、P和R。
17.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa4为R。
18.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa5选自M、V和Y。
19.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa5为Y。
20.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa6选自M、N和Q。
21.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa6为N。
22.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa7为A、H、K或R。
23.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa7为K。
24.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa8选自A、F和S。
25.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa8为S。
26.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa9选自A、Q和S。
27.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa9为A。
28.如实施方案1-27中任一项所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有与SEQ ID NO:31991-SEQID NO:32990中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
29.如实施方案28所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:1的从残基581至残基589的区域具有SEQ ID NO:31991-SEQ ID NO:32990中任一者的序列。
30.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有低表面可接近性。
31.如实施方案30所述的工程化AAV VP衣壳多肽,其中Xaa1为C。
32.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有低体积。
33.如实施方案32所述的工程化AAV VP衣壳多肽,其中Xaa1为C。
34.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有低可突变性。
35.如实施方案34所述的工程化AAV VP衣壳多肽,其中Xaa1为C。
36.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有高表面可接近性。
37.如实施方案36所述的工程化AAV VP衣壳多肽,其中Xaa2选自R和K。
38.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有高平均柔性。
39.如实施方案38所述的工程化AAV VP衣壳多肽,其中Xaa2选自K、I和N。
40.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有低可突变性。
41.如实施方案40所述的工程化AAV VP衣壳多肽,其中Xaa2选自P和K。
42.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa3具有高亲疏水性。
43.如实施方案42所述的工程化AAV VP衣壳多肽,其中Xaa3选自I和V。
44.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa4具有低可突变性。
45.如实施方案44所述的工程化AAV VP衣壳多肽,其中Xaa4选自L、F和Y。
46.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa4具有低平均柔性。
47.如实施方案46所述的工程化AAV VP衣壳多肽,其中Xaa4选自W、H、F和M。
48.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa5具有高平均柔性。
49.如实施方案48所述的工程化AAV VP衣壳多肽,其中Xaa5选自G、R、K、I和N。
50.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa6具有高平均柔性。
51.如实施方案50所述的工程化AAV VP衣壳多肽,其中Xaa6选自G、R、K、I和N。
52.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa8具有高表面可接近性。
53.如实施方案52所述的工程化AAV VP衣壳多肽,其中Xaa8选自M、G和F。
54.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa8具有低平均柔性。
55.如实施方案54所述的工程化AAV VP衣壳多肽,其中Xaa8选自H、F、M和W。
56.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa8具有低可突变性。
57.如实施方案56所述的工程化AAV VP衣壳多肽,其中Xaa8选自L、F和Y。
58.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa9具有高平均柔性。
59.如实施方案58所述的工程化AAV VP衣壳多肽,其中Xaa9选自D、E、R、K、P和G。
60.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa9具有高可突变性。
61.如实施方案60所述的工程化AAV VP衣壳多肽,其中Xaa9选自D、E、R、V、A和H。
62.如实施方案1-61中任一项所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域包括端点在内具有与SEQ ID NO:32991-SEQ IDNO:33990中任一者具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
63.如实施方案62所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域包括端点在内具有SEQ ID NO:32991-SEQ ID NO:33990中任一者的序列。
64.如实施方案1-61中任一项所述的工程化AAV VP衣壳多肽,其中对皮肤组织的嗜性被测量为所述rAAV病毒体在皮肤组织中相较于非皮肤组织中的相对积聚,其中所述非皮肤组织由CNS、肝脏、骨骼肌、心脏、肺、脾脏、淋巴结、骨髓、乳腺、肾上腺、甲状腺、结肠、坐骨神经和脊髓共同组成。
65.如实施方案64所述的工程化AAV VP衣壳多肽,其中所述CNS组织选自前脑皮层、枕叶皮层、颞叶皮层、丘脑、下丘脑、黑质、海马DG、海马CA1、海马CA3、小脑以及它们的任何组合。
66.如实施方案64-65中任一项所述的工程化AAV VP衣壳多肽,其中所述较高的组织嗜性是在皮肤组织中相较于非皮肤组织中1.0005倍至约1000倍增加的积聚。
67.如实施方案66所述的工程化AAV VP衣壳多肽,其中所述较高的组织嗜性是在皮肤组织中相较于非皮肤组织中至少约1.0005倍、至少约两倍、至少约三倍、至少约四倍、至少约五倍、至少约十倍、至少约二十倍、至少约50倍、至少约75倍、至少约100倍或至少约1000倍增加的积聚。
[417]P系列实施方案-脊髓嗜性衣壳
1.一种工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽,所述工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽具有与SEQ ID NO:1至少70%同一的氨基酸序列,
其中所述工程化AAV VP衣壳多肽相较于SEQ ID NO:1在从对应于SEQ ID NO:1的残基581的残基至对应于SEQ ID NO:1的残基589的残基的区域,包括端点在内,中具有至少一个突变,
其中所述工程化AAV VP衣壳多肽能够组装成重组AAV病毒体(rAAV),
其中与具有SEQ ID NO:1的野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述至少一个突变赋予所述rAAV较高的对脊髓组织的嗜性,并且
其中所述工程化AAV VP衣壳多肽不具有SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。2.如实施方案1所述的工程化AAV VP衣壳多肽,其中所述工程化AAV VP衣壳多肽具有SEQ ID NO:2的序列,并且其中Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自任何氨基酸。3.一种工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽,所述工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽具有SEQ ID NO:2的氨基酸序列,
其中氨基酸残基Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自A、R、N、D、C、E、Q、G、H、I、L、K、M、F、P、S、T、W、Y和V,
其中所述工程化AAV VP衣壳多肽能够组装成重组AAV病毒体(rAAV),并且
其中所述工程化AAV VP衣壳多肽不具有SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。4.如实施方案3所述的工程化AAV VP衣壳多肽,其中与具有SEQ ID NO:1的野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述rAAV具有较高的对脊髓组织的嗜性。5.如实施方案1所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有与SEQ ID NO:34991-SEQ ID NO:37437中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。6.如实施方案5所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有SEQ ID NO:34991-SEQ ID NO:37437中任一者的序列。7.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:2的Xaa1至Xaa9区具有与SEQ ID NO:34991-SEQ ID NO:37437中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
8.如实施方案7所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:2的Xaa1至Xaa9区域具有SEQ ID NO:34991-SEQ ID NO:37437中任一者的序列。
9.如实施方案X-Y中任一项所述的工程化AAV VP衣壳多肽,其中:
Xaa1选自由A、C、K、Q、R、S和W组成的组;或者
Xaa2选自由H、I、K、L、T、V和W组成的组;或者
Xaa3选自由C、F、G、H、I、K、N和R组成的组;或者
Xaa4选自由I、M、Q、S和V组成的组;或者
Xaa5选自由H、K、Q、T、W和Y组成的组;或者
Xaa6选自由H、L、N、Q、R、W和Y组成的组;或者
Xaa7选自由D、H、P、Q和R组成的组;或者
Xaa8选自由D、F、L、S、T和Y组成的组;或者
Xaa9选自由C、I、N、P、R、S和Y组成的组;或者
它们的任何组合。
10.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa1选自K、R和W。
11.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa1为K。
12.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa2选自H、I和T。
13.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa2为I。
14.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa3选自F、I和R。
15.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa3为I。
16.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa4选自I、M和V。
17.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa4为V。
18.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa5选自T、W和Y。
19.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa5为Y。
20.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa6选自L、N、R和Y。
21.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa6为Y。
22.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa7为R。
23.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa8选自S、T和Y。
24.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa8为T。
25.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa9选自I、P和R。
26.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa9为I。
27.如实施方案1-26中任一项所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有与SEQ ID NO:34991-SEQID NO:35437中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
28.如实施方案27所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:1的从残基581至残基589的区域具有SEQ ID NO:34991-SEQ ID NO:35437中任一者的序列。
29.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有高体积。
30.如实施方案29所述的工程化AAV VP衣壳多肽,其中Xaa1选自F、W和Y。
31.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有低可突变性。
32.如实施方案31所述的工程化AAV VP衣壳多肽,其中Xaa1选自Y、F、L和C。
33.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有高溶解性。
34.如实施方案33所述的工程化AAV VP衣壳多肽,其中Xaa1选自W、F、I和L。
35.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有低平均柔性。
36.如实施方案35所述的工程化AAV VP衣壳多肽,其中Xaa1选自F、M和W。
37.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有低亲疏水性。
38.如实施方案37所述的工程化AAV VP衣壳多肽,其中Xaa2选自P和Y。
39.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa3具有低亲水性。
40.如实施方案39所述的工程化AAV VP衣壳多肽,其中Xaa3选自Y、W、V、M、F、I和L。
41.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa3具有高溶解性。
42.如实施方案41所述的工程化AAV VP衣壳多肽,其中Xaa3选自W、F、I和L。
43.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa6具有高体积。
44.如实施方案43所述的工程化AAV VP衣壳多肽,其中Xaa6选自W、R、K、M、I和L。
45.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa6具有高摩尔质量。
46.如实施方案45所述的工程化AAV VP衣壳多肽,其中Xaa6选自W。
47.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa8具有高摩尔质量。
48.如实施方案47所述的工程化AAV VP衣壳多肽,其中Xaa8选自W、E、K、M、H和Q。
49.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa8具有高体积。
50.如实施方案49所述的工程化AAV VP衣壳多肽,其中Xaa8选自W、K、M、I和L。
51.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa8具有高goldman engelman steitz。
52.如实施方案51所述的工程化AAV VP衣壳多肽,其中Xaa8选自V和L。
53.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa9具有高亲疏水性。
54.如实施方案53所述的工程化AAV VP衣壳多肽,其中Xaa9选自V和I。
55.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa9具有高溶解性。
56.如实施方案55所述的工程化AAV VP衣壳多肽,其中Xaa9选自W、F、I和L。
57.如实施方案1-56中任一项所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域包括端点在内具有与SEQ ID NO:35438-SEQ IDNO:36437中任一者具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
58.如实施方案57所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域包括端点在内具有SEQ ID NO:35438-SEQ ID NO:36437中任一者的序列。
59.如实施方案1-58中任一项所述的工程化AAV VP衣壳多肽,其中对脊髓组织的嗜性被测量为所述rAAV病毒体在脊髓组织中相较于非脊髓组织中的相对积聚,其中所述非脊髓组织由CNS、肝脏、骨骼肌、心脏、肺、脾脏、淋巴结、骨髓、乳腺、皮肤、肾上腺、甲状腺、结肠和坐骨神经共同组成。
60.如实施方案59所述的工程化AAV VP衣壳多肽,其中所述CNS组织选自前脑皮层、枕叶皮层、颞叶皮层、丘脑、下丘脑、黑质、海马DG、海马CA1、海马CA3、小脑以及它们的任何组合。
61.如实施方案59-60中任一项所述的工程化AAV VP衣壳多肽,其中所述较高的组织嗜性是在脊髓组织中相较于非脊髓组织中1.0005倍至约1000倍增加的积聚。
62.如实施方案61所述的工程化AAV VP衣壳多肽,其中所述较高的组织嗜性是在脊髓组织中相较于非脊髓组织中至少约1.0005倍、至少约两倍、至少约三倍、至少约四倍、至少约五倍、至少约十倍、至少约二十倍、至少约50倍、至少约75倍、至少约100倍或至少约1000倍增加的积聚。
[418]Q系列实施方案-脾脏嗜性衣壳
1.一种工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽,所述工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽具有与SEQ ID NO:1至少70%同一的氨基酸序列,
其中所述工程化AAV VP衣壳多肽相较于SEQ ID NO:1在从对应于SEQ ID NO:1的残基581的残基至对应于SEQ ID NO:1的残基589的残基的区域,包括端点在内,中具有至少一个突变,
其中所述工程化AAV VP衣壳多肽能够组装成重组AAV病毒体(rAAV),
其中与具有SEQ ID NO:1的野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述至少一个突变赋予所述rAAV较高的对脾脏组织的嗜性,并且
其中所述工程化AAV VP衣壳多肽不具有SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。2.如实施方案1所述的工程化AAV VP衣壳多肽,其中所述工程化AAV VP衣壳多肽具有SEQ ID NO:2的序列,并且其中Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自任何氨基酸。3.一种工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽,所述工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽具有SEQ ID NO:2的氨基酸序列,
其中氨基酸残基Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自A、R、N、D、C、E、Q、G、H、I、L、K、M、F、P、S、T、W、Y和V,
其中所述工程化AAV VP衣壳多肽能够组装成重组AAV病毒体(rAAV),并且
其中所述工程化AAV VP衣壳多肽不具有SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。4.如实施方案3所述的工程化AAV VP衣壳多肽,其中与具有SEQ ID NO:1的野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述rAAV具有较高的对脾脏组织的嗜性。5.如实施方案1所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有与SEQ ID NO:37438-SEQ ID NO:40437中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。6.如实施方案5所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有SEQ ID NO:37438-SEQ ID NO:40437中任-者的序列。
7.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:2的Xaa1至Xaa9区域具有与SEQ ID NO:37438-SEQ ID NO:40437中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
8.如实施方案7所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:2的Xaa1至Xaa9区域具有SEQ ID NO:37438-SEQ ID NO:40437中任一者的序列。
9.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中:
Xaa1选自由C、F、H、I、L、P、W和Y组成的组;或者
Xaa2选自由D、E、L、N、P、R和W组成的组;或者
Xaa3选自由C、D、E、P和W组成的组;或者
Xaa4选自由C、F、G、H、R、W和Y组成的组;或者
Xaa5选自由以下组成的组:A、D、E、G、P、R和W;或者
Xaa6选自由A、C、D、E、K、R和W组成的组;或者
Xaa7选自由F、L、P、R、W和Y组成的组;或者
Xaa8选自由E、I、K、L、P、R和T组成的组;或者
Xaa9选自由C、H、M、T、V和W组成的组;或者
它们的任何组合。
10.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa1选自C、F、P、W和Y。
11.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa1选自P、W和Y。
12.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa1为P。
13.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa2选自D、E和W。
14.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa2为D。
15.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa3选自D、P和W。
16.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa3为P。
17.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa4选自C、H和W。
18.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa4为C。
19.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa5选自D、E、G和P。
20.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa5为D。
21.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa6选自C、K和R。
22.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa6为K。
23.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa7选自L、P和W。
24.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa7为P。
25.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa8选自P、R和K。
26.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa8为K。
27.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa9选自C、T和V。
28.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa9为V。
29.如实施方案1-28中任一项所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有与SEQ ID NO:37438-SEQID NO:38437中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
30.如实施方案29所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:1的从残基581至残基589的区域具有SEQ ID NO:37438-SEQ ID NO:38437中任一者的序列。
31.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有低溶解性。
32.如实施方案31所述的工程化AAV VP衣壳多肽,其中Xaa1选自D和P。
33.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有高溶解性。
34.如实施方案33所述的工程化AAV VP衣壳多肽,其中Xaa1选自F、I和L。
35.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有低亲疏水性。
36.如实施方案35所述的工程化AAV VP衣壳多肽,其中Xaa1选自Y和P。
37.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有低可突变性。
38.如实施方案37所述的工程化AAV VP衣壳多肽,其中Xaa1选自C、K和P。
39.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有低溶解性。
40.如实施方案39所述的工程化AAV VP衣壳多肽,其中Xaa2选自D、Q和R。
41.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有低亲疏水性。
42.如实施方案41所述的工程化AAV VP衣壳多肽,其中Xaa2选自D、E、R、K、H、N和Q。
43.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有低电荷。
44.如实施方案43所述的工程化AAV VP衣壳多肽,其中Xaa2选自D和E。
45.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有低体积。
46.如实施方案45所述的工程化AAV VP衣壳多肽,其中Xaa2选自T、N、P和D。
47.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有高平均柔性。
48.如实施方案47所述的工程化AAV VP衣壳多肽,其中Xaa2选自D、E、R、P、G、Q和S。
49.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa3具有低溶解性。
50.如实施方案49所述的工程化AAV VP衣壳多肽,其中Xaa3选自D、E、P和N。
51.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa3具有低亲疏水性。
52.如实施方案51所述的工程化AAV VP衣壳多肽,其中Xaa3选自D、E、H、N、Q和P。
53.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa4具有低亲疏水性。
54.如实施方案53所述的工程化AAV VP衣壳多肽,其中Xaa4选自K和R。
55.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa5具有低溶解性。
56.如实施方案55所述的工程化AAV VP衣壳多肽,其中Xaa5选自D、E、P和N。
57.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa5具有高平均柔性。
58.如实施方案57所述的工程化AAV VP衣壳多肽,其中Xaa5选自D、E、R、P、G、Q和S。
59.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa6具有低可突变性。
60.如实施方案59所述的工程化AAV VP衣壳多肽,其中Xaa6选自C。
61.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa8具有高表面可接近性。
62.如实施方案61所述的工程化AAV VP衣壳多肽,其中Xaa8选自E、R和K。
63.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa8具有低溶解性。
64.如实施方案63所述的工程化AAV VP衣壳多肽,其中Xaa8选自E、P、R、K、N、Q。
65.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa8具有中等体积。
66.如实施方案65所述的工程化AAV VP衣壳多肽,其中Xaa8选自E、D、R、K、V、P、M、I、L、H、N、Q和T。
67.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa9具有中等摩尔质量。
68.如实施方案67所述的工程化AAV VP衣壳多肽,其中Xaa9选自E、D、K、M、I、L、H、N。
69.如实施方案1-68中任一项所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域包括端点在内具有与SEQ ID NO:38438-SEQ IDNO:39437中任一者具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
70.如实施方案69所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域包括端点在内具有SEQ ID NO:38438-SEQ ID NO:39437中任一者的序列。
71.如实施方案1-70中任一项所述的工程化AAV VP衣壳多肽,其中对脾脏组织的嗜性被测量为所述rAAV病毒体在脾脏组织中相较于非脾脏组织中的相对积聚,其中所述非脾脏组织由CNS、肝脏、骨骼肌、心脏、肺、淋巴结、骨髓、乳腺、皮肤、肾上腺、甲状腺、结肠、坐骨神经和脊髓共同组成。
72.如实施方案71所述的工程化AAV VP衣壳多肽,其中所述CNS组织选自前脑皮层、枕叶皮层、颞叶皮层、丘脑、下丘脑、黑质、海马DG、海马CA1、海马CA3、小脑以及它们的任何组合。
73.如实施方案71-72中任一项所述的工程化AAV VP衣壳多肽,其中所述较高的组织嗜性是在脾脏组织中相较于非脾脏组织中1.0005倍至约1000倍增加的积聚。
74.如实施方案73所述的工程化AAV VP衣壳多肽,其中所述较高的组织嗜性是在脾脏组织中相较于非脾脏组织中至少约1.0005倍、至少约两倍、至少约三倍、至少约四倍、至少约五倍、至少约十倍、至少约二十倍、至少约50倍、至少约75倍、至少约100倍或至少约1000倍增加的积聚。
[419]R系列实施方案-甲状腺嗜性衣壳
1.一种工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽,所述工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽具有与SEQ ID NO:1至少70%同一的氨基酸序列,
其中所述工程化AAV VP衣壳多肽相较于SEQ ID NO:1在从对应于SEQ ID NO:1的残基581的残基至对应于SEQ ID NO:1的残基589的残基的区域,包括端点在内,中具有至少一个突变,
其中所述工程化AAV VP衣壳多肽能够组装成重组AAV病毒体(rAAV),
其中与具有SEQ ID NO:1的野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述至少一个突变赋予所述rAAV较高的对甲状腺组织的嗜性,并且
其中所述工程化AAV VP衣壳多肽不具有SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。2.如实施方案1所述的工程化AAV VP衣壳多肽,其中所述工程化AAV VP衣壳多肽具有SEQ ID NO:2的序列,并且其中Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自任何氨基酸。3.一种工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽,所述工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽具有SEQ ID NO:2的氨基酸序列,
其中氨基酸残基Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自A、R、N、D、C、E、Q、G、H、I、L、K、M、F、P、S、T、W、Y和V,
其中所述工程化AAV VP衣壳多肽能够组装成重组AAV病毒体(rAAV),并且
其中所述工程化AAV VP衣壳多肽不具有SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。4.如实施方案3所述的工程化AAV VP衣壳多肽,其中与具有SEQ ID NO:1的野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述rAAV具有较高的对甲状腺组织的嗜性。5.如实施方案1所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有与SEQ ID NO:40438-SEQ ID NO:43437中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。6.如实施方案5所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有SEQ ID NO:40438-SEQ ID NO:43437中任一者的序列。7.如实施方案2-4所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:2的Xaa1至Xaa9区域具有与SEQ IDNO:40438-SEQ ID NO:43437中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。8.如实施方案7所述的工程化AAVVP衣壳多肽,其中SEQ ID NO:2的Xaa1至Xaa9区域具有SEQ ID NO:40438-SEQ ID NO:43437中任一者的序列。
9.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中:
Xaa1选自由A、K、M、N、Q或R组成的组;或者
Xaa2选自由A、F、K、L、M、T、V或W组成的组;或者
Xaa3选自由A、I、K、R、S、T、V或W组成的组;或者
Xaa4选自由A、D、E、I、P或V组成的组;或者
Xaa5选自由F、I、M、Q、V或Y组成的组;或者
Xaa6选自由H、M、N或Y组成的组;或者
Xaa7选自由H、I、N、Q、S或W组成的组;或者
Xaa8选自由A、D、F、Q、S或Y组成的组;或者
Xaa9选自由A、Q、S或Y组成的组;或者
它们的任何组合。
10.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa1选自K、N和Q。
11.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa1为K。
12.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa2选自F、V和W。
13.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa2为W。
14.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa3选自A、R和T。
15.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa3为R。
16.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa4选自A、E和I。
17.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa4为A。
18.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa5为M、V或Y。
19.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa5为M。
20.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa6为N。
21.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa7选自H、I和N。
22.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa7为H。
23.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa8选自A、F和S。
24.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa8为F。
25.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa9选自A和S。
26.如实施方案9所述的工程化AAV VP衣壳多肽,其中Xaa9为A。
27.如实施方案1-26中任一项所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有与SEQ ID NO:40438-SEQID NO:41437中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
28.如实施方案27所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:1的从残基581至残基589的区域具有SEQ ID NO:40438-SEQ ID NO:41437中任一者的序列。
29.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有高可突变性。
30.如实施方案29所述的工程化AAV VP衣壳多肽,其中Xaa1为N。
31.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有低表面可接近性。
32.如实施方案31所述的工程化AAV VP衣壳多肽,其中Xaa2选自F、G和M。
33.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa3具有高溶解性。
34.如实施方案33所述的工程化AAV VP衣壳多肽,其中Xaa3选自F。
35.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa3具有低可突变性。
36.如实施方案35所述的工程化AAV VP衣壳多肽,其中Xaa3选自Y、F、L和C。
37.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa3具有中等摩尔质量。
38.如实施方案37所述的工程化AAV VP衣壳多肽,其中Xaa3选自D、E、R、K、V、P、M、I、L、N、Q、T和C。
39.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa3具有低表面可接近性。
40.如实施方案39所述的工程化AAV VP衣壳多肽,其中Xaa3选自V、I、L和C。
41.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa4具有高goldman engelman steitz。
42.如实施方案41所述的工程化AAV VP衣壳多肽,其中Xaa4选自L和V。
43.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa4具有低表面可接近性。
44.如实施方案43所述的工程化AAV VP衣壳多肽,其中Xaa4选自V、M、A、G、F、I和L。
45.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa4具有低摩尔质量。
46.如实施方案45所述的工程化AAV VP衣壳多肽,其中Xaa4选自D、A、G、I、L和N。
47.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa5具有高溶解性。
48.如实施方案47所述的工程化AAV VP衣壳多肽,其中Xaa5选自C、L、F、M、V和Y。
49.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa5具有低溶解性。
50.如实施方案49所述的工程化AAV VP衣壳多肽,其中Xaa5选自D。
51.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa5具有低平均柔性。
52.如实施方案51所述的工程化AAV VP衣壳多肽,其中Xaa5选自F、M和W。
53.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa6具有低平均柔性。
54.如实施方案53所述的工程化AAV VP衣壳多肽,其中Xaa6选自F、M和W。
55.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa7具有高可突变性。
56.如实施方案55所述的工程化AAV VP衣壳多肽,其中Xaa7选自N。
57.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa7具有低体积。
58.如实施方案57所述的工程化AAV VP衣壳多肽,其中Xaa7选自P、N和T。
59.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa8具有低平均柔性。
60.如实施方案59所述的工程化AAV VP衣壳多肽,其中Xaa8选自F、M和W。
61.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa8具有低表面可接近性。
62.如实施方案61所述的工程化AAV VP衣壳多肽,其中Xaa8选自M、G和F。
63.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa9具有低可突变性。
64.如实施方案63所述的工程化AAV VP衣壳多肽,其中Xaa9选自R、K、P、H和C。
65.如实施方案2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa9具有低亲疏水性。
66.如实施方案65所述的工程化AAV VP衣壳多肽,其中Xaa9选自R。
67.如实施方案1-66中任一项所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域包括端点在内具有与SEQ ID NO:41438-SEQ IDNO:42437中任一者具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
68.如实施方案67所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域包括端点在内具有SEQ ID NO:41438-SEQ ID NO:42437中任一者的序列。
69.如实施方案1-68中任一项所述的工程化AAV VP衣壳多肽,其中对甲状腺组织的嗜性被测量为所述rAAV病毒体在甲状腺组织中相较于非甲状腺组织中的相对积聚,其中所述非甲状腺组织由CNS、肝脏、骨骼肌、心脏、肺、脾脏、淋巴结、骨髓、乳腺、皮肤、肾上腺、结肠、坐骨神经和脊髓共同组成。
70.如实施方案69所述的工程化AAV VP衣壳多肽,其中所述CNS组织选自前脑皮层、枕叶皮层、颞叶皮层、丘脑、下丘脑、黑质、海马DG、海马CA1、海马CA3、小脑以及它们的任何组合。
71.如实施方案69-70中任一项所述的工程化AAV VP衣壳多肽,其中所述较高的组织嗜性是在甲状腺组织中相较于非甲状腺组织中1.0005倍至约1000倍增加的积聚。
72.如实施方案71所述的工程化AAV VP衣壳多肽,其中所述较高的组织嗜性是在甲状腺组织中相较于非甲状腺组织中至少约1.0005倍、至少约两倍、至少约三倍、至少约四倍、至少约五倍、至少约十倍、至少约二十倍、至少约50倍、至少约75倍、至少约100倍或至少约1000倍增加的积聚。
S系列实施方案
1.一种工程化腺相关病毒(AAV)VP衣壳多肽,所述工程化腺相关病毒(AAV)VP衣壳多肽具有SEQ ID NO:2的氨基酸序列,
其中氨基酸残基Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自A、R、N、D、C、E、Q、G、H、I、L、K、M、F、P、S、T、W、Y和V;
其中所述衣壳多肽能够组装成重组AAV病毒体(rAAV);并且
其中多肽不具有SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ IDNO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。
2.一种工程化腺相关病毒(AAV)VP衣壳多肽,所述多肽在对应于SEQ ID NO:1中的残基581至残基589的残基中具有至少一个突变,其中所述衣壳多肽能够组装成重组AAV病毒体(rAAV),并且其中所述多肽突变赋予所述重组rAAV对第一组织相较于第二组织的组织嗜性,并且其中所述AAV VP衣壳多肽不具有SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。
3.一种工程化AAV VP衣壳多肽,所述工程化AAV VP衣壳多肽包含由下式表示的多肽序列:(A)-(X)-(B)
其中:
(A)是SEQ ID NO:47438(VAYNVGGQMATNNQSSTTAP SEQ ID NO:2的残基561-580)的多肽序列;
(X)是包含SEQ ID NO:2的氨基酸残基Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9的多肽序列;并且
(B)是SEQ ID NO:47439(SEQ ID NO:2的残基590-609IVPGSVWMERDVYLQGPIWA)的多肽序列;
其中Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自A、R、N、D、C、E、Q、G、H、I、L、K、M、F、P、S、T、W、Y和V;并且
其中所述衣壳多肽能够组装成重组AAV病毒体(rAAV);并且;
其中多肽不具有SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ IDNO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。
4.如实施方案3所述的工程化AAV VP衣壳多肽,所述工程化AAV VP衣壳多肽包含由下式表示的多肽序列:(A)-(X)-(B),其中:
(A)是SEQ ID NO:47438(SEQ ID NO:2的残基561-580VAYNVGGQMATNNQSSTTAP)的多肽序列;
(X)是选自表8(SEQ ID NO:115-1114)或表10(SEQ ID NO:7118-8117)中的多肽的列表的多肽序列,所述多肽序列赋予重组AAV病毒体(rAAV)CNS组织嗜性;并且1
(B)是SEQ ID NO:47439(SEQ ID NO:2的残基590-609(IVPGSVWMERDVYLQGPIWA))的多肽序列;并且
其中衣壳多肽能够组装成rAAV,并且,
衣壳不具有SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。
5.如实施方案4所述的工程化AAV VP衣壳多肽,其中CNS组织选自由以下组成的组:海马:(齿状回,CA1和CA3);小脑、下丘脑、皮层:(枕叶、颞叶和前脑);黑质、丘脑,以及它们的任何组合。
6.如实施方案3所述的重组AAV VP衣壳多肽,所述工程化AAV VP衣壳多肽包含由下式表示的多肽序列:(A)-(X)-(B),其中:
(A)是SEQ ID NO:47438(SEQ ID NO:2的残基:(561-580VAYNVGGQMATNNQSSTTAP))的多肽序列;
(X)是选自SEQ ID NO:115-1114或1118-47437的多肽中任一者的多肽序列,所述多肽序列赋予重组AAV病毒体(rAAV)相应的组织嗜性;并且
(B)是SEQ ID NO:47439(SEQ ID NO:2的残基590-609(IVPGSVWMERDVYLQGPIWA))的多肽序列;并且
其中衣壳多肽能够组装成rAAV,并且,
所述衣壳不具有SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ IDNO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。7.如前述实施方案中任一项所述的工程化AAV VP衣壳多肽,其中所述AAV VP衣壳多肽为AAV5 VP1衣壳多肽。8.如前述实施方案中任一项所述的工程化AAV VP衣壳多肽,其中所述衣壳赋予重组AAV病毒体(rAAV)增加的对选自以下组织的任何组织的组织靶向性:
脂肪、肾上腺、主动脉、脑(包括海马:齿状回、CA1和CA3;小脑、尾状核、壳核、中脑、脑桥、下丘脑、皮层-包括枕叶、颞叶和前脑;黑质、丘脑,以及它们的任何组合)、骨髓、盲肠、结肠、背根神经节、十二指肠、附睾、食管、眼睛、胆囊、心脏、回肠、空肠、肾脏、肺、淋巴结、乳腺、卵巢、胰腺、甲状旁腺、周围神经、垂体、前列腺、唾液腺、精囊、骨骼肌、皮肤、脊髓、脾脏、胃、睾丸、胸腺、甲状腺、气管、膀胱、子宫和阴道的组织,
相较于包含具有以下序列中任一者的衣壳的对照病毒体而言:SEQ ID NO:1、SEQID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8。9.如实施方案2所述的工程化AAV VP衣壳多肽,其中所述rAAV表现出在第一组织中相较于第二组织中约1.0005倍至约1000倍增加的积聚。10.如实施方案9所述的工程化AAV VP衣壳多肽,其中所述rAAV表现出在第一组织中相较于第二组织中至少约1.0005倍、至少约两倍、至少约三倍、至少约四倍、至少约五倍、至少约十倍、至少约二十倍、至少约50倍、至少约75倍、至少约100倍或至少约1000倍增加的积聚。11.如实施方案1或3-8中任一项所述的工程化AAV VP衣壳多肽,其中所述rAAV表现出在组织中约1.0005倍至约1000倍增加的积聚。12.如实施方案11所述的工程化AAV VP衣壳多肽,其中所述rAAV表现出在组织中至少约1.0005倍、至少约两倍、至少约三倍、至少约四倍、至少约五倍、至少约十倍、至少约二十倍、至少约50倍、至少约75倍、至少约100倍或至少约1000倍增加的积聚。13.如实施方案1-3或6-12中任一项所述的工程化AAV VP衣壳多肽,其中至少一个突变残基是:
Xaa1和Xaa1选自A、G、K、M、N、Q、R、S或T;
Xaa2和Xaa2选自A、C、H、I、K、S、T或V;
Xaa3和Xaa3选自A、G、H、K、M、N、Q、R、S、T或V;
Xaa4和Xaa4选自L、M、P、Q、R、T或W;
Xaa5和Xaa5选自F、H、I、K、M、T或Y;
Xaa6和Xaa6选自E、G、H、L、M、N、Q、T或W;
Xaa7和Xaa7选自A、C、G、H、L、M、R或S;
Xaa8和Xaa8选自A、C、D、F、G、H、M、Q、S、V、W或Y;
Xaa9和Xaa9选自A、C、E、G、H、M、N、P、Q、S、V或W;
或它们的任何组合,
其中所述衣壳多肽能够组装成重组AAV病毒体(rAAV),并且其中所述rAAV能够表现出对肝脏组织的组织嗜性。
14.如实施方案1-12中任一项所述的工程化AAV VP衣壳多肽,其中:
Xaa1不包括A、G、K、M、N、Q、R、S或T;
Xaa2不包括A、C、H、I、K、S、T或V;
Xaa3不包括A、G、H、K、M、N、Q、R、S、T或V;
Xaa4不包括L、M、P、Q、R、T或W;
Xaa5不包括F、H、I、K、M、T或Y;
Xaa6不包括E、G、H、L、M、N、Q、T或W;
Xaa7不包括A、C、G、H、L、M、R或S。
Xaa8不包括A、C、D、F、G、H、M、Q、S、V、W或Y;
Xaa9不包括A、C、E、G、H、M、N、P、Q、S、V或W。
或它们的任何组合,
其中与具有含SEQ ID NO:1序列的VP1衣壳多肽的rAAV相比,所述衣壳多肽能够组装成重组AAV病毒体(rAAV)并且表现出更少的对肝脏组织的靶向性或嗜性。15.如前述实施方案中任一项所述的工程化AAV VP衣壳多肽,所述多肽具有至少一个对应于SEQ ID NO:2中残基581至残基589的残基,其中:
Xaa1为A、D、E、G、L、M、N、Q、S、T或V;
Xaa2为A、C、D、E、G、H、I、N、P、Q、S、T或V;
Xaa3为A、D、E、G、H、M、N、Q、S、T或V;
Xaa4为A、D、E、G、H、N、P、Q、S或T;
Xaa5为A、C、D、E、G、H、N、Q、S、T或Y;
Xaa6为A、D、E、G、H、N、P、Q、S或T;
Xaa7为A、C、D、E、G、H、N、Q、S或T;
Xaa8为A、C、D、E、G、H、N、Q、S或T;
Xaa9为A、D、E、G、H、N、P、Q、S或T;
或它们的任何组合,
其中所述衣壳多肽能够组装成重组AAV病毒体(rAAV)。
16.如前述实施方案中任一项所述的重组衣壳多肽,所述重组衣壳多肽还在581-589区域之外的氨基酸残基处包含一个或多个突变或取代,其中在581-589区域之外的氨基酸残基处的一个或多个突变或取代赋予改进的可制造性、改进的病毒组装、提高的组织靶向性/嗜性,或它们的任何组合。17.一种编码实施方案1-16所述的任何重组腺相关病毒(AAV)VP衣壳多肽的多核苷酸。18.一种重组AAV病毒体(rAAV),所述病毒体包含实施方案1-15中任一项所述的AAV VP衣壳多肽。19.如实施方案18所述的rAAV病毒体,其中与具有含SEQ ID NO:l序列的VP1衣壳多肽的rAAV相比,所述rAAV具有降低的对人肝脏的嗜性。20.如实施方案18或实施方案19所述的rAAV病毒体,其中与具有含SEQ ID NO:1序列的VP1衣壳多肽的rAAV相比,所述rAAV在静脉内施用后具有增强的穿过血脑屏障的能力。21.如实施方案18-20中任一项所述的rAAV病毒体,其中与具有含SEQ ID NO:1序列的VP1衣壳多肽的rAAV相比,所述rAAV在静脉内、鞘内、脑室内或脑池内施用后具有增强的感染选自海马、齿状回、大脑皮层、颞叶皮层、枕叶皮层、丘脑、前脑、黑质、下丘脑和小脑的一个或多个脑区的能力。
22.如实施方案18-21中任一项所述的rAAV病毒体,其中与具有含SEQ ID NO:1序列的VP1衣壳多肽的rAAV相比,所述rAAV在玻璃体内注射后具有增强的感染人视网膜细胞的能力。
23.如实施方案18中任一项所述的rAAV病毒体,其中与具有含SEQ ID NO:1序列的VP1衣壳多肽的rAAV相比,所述rAAV在静脉内施用后具有增强的感染人骨骼肌的能力。
24.如实施方案18中任一项所述的rAAV病毒体,其中与具有含SEQ ID NO:1序列的VP1衣壳多肽的rAAV相比,所述rAAV具有增加的对人肝脏的嗜性。25.如实施方案18-24中任一项所述的rAAV病毒体,其中所述病毒体还包含载体基因组,所述载体基因组包含编码以下任一项的治疗性多核苷酸:选自指导RNA或tRNA的治疗性RNA,或编码处于引导受感染人细胞中转基因表达的调控序列控制下的蛋白质。26.如实施方案25所述的rAAV病毒体,其中所述转基因编码选自表1的转基因产物的蛋白质。27.一种组合物,所述组合物包含含有实施方案1-16中任一项所述的工程化衣壳多肽的AAV病毒体,所述AAV病毒体内包装有实施方案25所述的治疗性多核苷酸。28.一种组合物,所述组合物包含含有实施方案1-16中任一项所述的工程化衣壳多肽的AAV病毒体,所述AAV病毒体内包装有编码以下任一项的治疗性多核苷酸:选自指导RNA或tRNA的治疗性RNA,或编码处于引导受感染人细胞中转基因表达的调控序列控制下的蛋白质。29.如实施方案18-26中任一项所述的rAAV病毒体,其中所述病毒体还包含载体基因组,所述载体基因组包含编码以下任一项的治疗性多核苷酸:选自指导RNA或tRNA的治疗性RNA,或编码处于引导受感染人细胞中转基因表达的调控序列控制下的蛋白质。30.如实施方案29所述的rAAV病毒体,其中所述转基因编码选自表1的转基因产物的蛋白质。
31.一种药物组合物,所述药物组合物包含实施方案29或实施方案30所述的rAAV和药学上可接受的载体。32.一种治疗方法,所述方法包括:
向有需要的患者施用有效量的实施方案31所述的药物组合物。33.如实施方案32所述的方法,其中所述rAAV的所述有效量小于野生型rAAV的有效量。34.如实施方案32所述的方法,其中所述rAAV的所述有效量小于在对应于SEQ ID NO:1的残基581至残基589的位置处缺乏一个或多于一个突变或取代的其他方面相当的rAAV的有效量。35.如实施方案34所述的方法,其中与所述野生型rAAV、所述其他方面相当的rAAV或两者的所述有效量相比,所述rAAV的所述有效量在所述患者中引起更低的毒性。
36.如实施方案32所述的方法,其中所述有效量为至少1x105个病毒基因组/kg患者体重至5x1014个病毒基因组/kg。
37.如实施方案32-36中任一项所述的方法,其中静脉内施用所述rAAV。
38.如实施方案32-36中任一项所述的方法,其中鞘内施用所述rAAV。
39.如实施方案32-36中任一项所述的方法,其中通过脑池内施用来施用所述rAAV。
40.如实施方案32-36中任一项所述的方法,其中通过玻璃体内注射来施用所述rAAV。
41.如实施方案18-26或29-30中任一项所述的rAAV病毒体,所述rAAV病毒体用于治疗患者的疾病。
42.根据实施方案41使用的rAAV病毒体,所述rAAV病毒体用于治疗表1中的任何疾病。
43.根据实施方案41使用的rAAV病毒体,所述rAAV病毒体用于治疗CNS疾病。
44.根据实施方案43使用的rAAV病毒体,其中所述CNS疾病选自表1中列出的疾患。
45.根据实施方案43或44使用的rAAV病毒体,其中所述工程化AAV VP衣壳多肽包含表8(SEQ ID NO:115-1114)、表10(SEQ ID NO:7118-8117)、表39(SEQ ID NO:8118-9117)或表74(SEQ ID NO:9118-10117)中列举的突变中的任一者。
46.根据实施方案45使用的rAAV病毒体,其中所述工程化VP1衣壳多肽不具有SEQID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ IDNO:8中任一者的序列。
47.根据实施方案42使用的rAAV病毒体,其中所述病毒体包含编码来自表1中列出的任何靶标的靶标的治疗性多核苷酸。
T系列实施方案-AAV5
1.如本文描述的实施方案中任一项所述的工程化AAV VP衣壳多肽,其中所述工程化AAV VP衣壳多肽是工程化AAV5 VP衣壳多肽。
2.如实施方案1所述的工程化AAV VP衣壳多肽,其中所述突变是取代。
U系列实施方案-组装
1.如本文描述的实施方案中任一项所述的工程化AAV VP衣壳多肽,其中:
Xaa1选自由A、D、E、G、L、M、N、Q、S、T或V组成的组;或者
Xaa2选自由A、C、D、E、G、H、I、N、P、Q、S、T或V组成的组;或者
Xaa3选自由A、D、E、G、H、M、N、Q、S、T或V组成的组;或者
Xaa4选自由A、D、E、G、H、N、P、Q、S或T组成的组;或者
Xaa5选自由A、C、D、E、G、H、N、Q、S、T或Y组成的组;或者
Xaa6选自由A、D、E、G、H、N、P、Q、S或T组成的组;或者
Xaa7选自由A、C、D、E、G、H、N、Q、S或T组成的组;或者
Xaa8选自由A、C、D、E、G、H、N、Q、S或T组成的组;或者
Xaa9选自由A、D、E、G、H、N、P、Q、S或T组成的组;或者
它们的任何组合。
2.如实施方案l所述的工程化AAV VP衣壳多肽,其中Xaa1为A、D、E、M或T。
3.如实施方案l所述的工程化AAV VP衣壳多肽,其中Xaa1为E。
4.如实施方案1所述的工程化AAV VP衣壳多肽,其中Xaa2为A、S、T或V。
5.如实施方案1所述的工程化AAV VP衣壳多肽,其中Xaa2为A。
6.如实施方案1所述的工程化AAV VP衣壳多肽,其中Xaa3为D、E、N、Q或T。
7.如实施方案l所述的工程化AAV VP衣壳多肽,其中Xaa3为D或T。
8.如实施方案1所述的工程化AAV VP衣壳多肽,其中Xaa4为D、E、P或Q。
9.如实施方案1所述的工程化AAV VP衣壳多肽,其中Xaa4为E。
10.如权利要求X-Y中任一项所述的工程化AAV VP衣壳多肽,其中Xaa5为D、E、N、Q或T。
11.如实施方案1所述的工程化AAV VP衣壳多肽,其中Xaa5为N。
12.如实施方案1所述的工程化AAV VP衣壳多肽,其中Xaa6为D、N或Q。
13.如实施方案1所述的工程化AAV VP衣壳多肽,其中Xaa6为D。
14.如权利要求X-Y中任一项所述的工程化AAV VP衣壳多肽,其中Xaa7为A、D、E或G。
15.如实施方案1所述的工程化AAV VP衣壳多肽,其中Xaa7为A。
16.如权利要求X-Y中任一项所述的工程化AAV VP衣壳多肽,其中Xaa8为A、D、G或S。
17.如实施方案1所述的工程化AAV VP衣壳多肽,其中Xaa8为G。
18.如实施方案1所述的工程化AAV VP衣壳多肽,其中Xaa9为A、D、G或P。
19.如实施方案1所述的工程化AAV VP衣壳多肽,其中Xaa9为G。
V系列实施方案-重组AAV病毒体
1.一种重组AAV病毒体(rAAV),所述重组AAV病毒体(rAAV)包含:
本文描述的实施方案所述的组装成衣壳的工程化AAV VP衣壳多肽;和
有效载荷,
其中所述工程化AAV VP衣壳多肽衣壳包裹所述有效载荷。
2.如实施方案1所述的重组rAAV,其中所述有效载荷包含治疗性多核苷酸,任选地其中所述治疗性多核苷酸编码转基因或基因组修饰实体。
3.如实施方案2所述的rAAV,其中所述治疗性多核苷酸编码指导RNA、tRNA、阻抑tRNA、siRNA、miRNA、mRNA、shRNA、环状RNA或反义寡核苷酸(ASO)、核酶、DNA酶、适体或它们的任何组合。
4.如实施方案3所述的rAAV,其中所述治疗性多核苷酸编码线性治疗性多核苷酸或环状治疗性多核苷酸。
5.如实施方案2所述的rAAV,其中所述转基因选自表1。
6.如实施方案2所述的rAAV,其中所述基因组修饰实体包含CRISPR/Cas系统、作用于RNA的腺苷脱氨酶(ADAR)酶、转录激活物或转录阻抑物。
7.如实施方案6所述的rAAV,其中所述CRISPR/Cas系统包括Cas3、Cas8、Cas10、Cas9、Cas4、Cas12或Cas13。
8.如实施方案6所述的rAAV,其中所述ADAR是人ADAR1或人ADAR2。
9.如实施方案6所述的rAAV,其中所述转录激活物是VP64。
10.如实施方案6所述的rAAV,其中所述转录阻抑物是KRAB。
11.一种药物组合物,所述药物组合物包含实施方案1-10中任一项所述的rAAV病毒体和药学上可接受的载体。
12.一种治疗方法,所述方法包括向有需要的受试者施用治疗有效量的实施方案11所述的药物组合物。
13.如实施方案12所述的药物组合物,所述药物组合物用于治疗有需要的受试者,其中所述用途包括向受试者施用治疗有效量的如实施方案11所述的药物组合物。
14.如实施方案1-10中任一项所述的rAAV病毒体,所述rAAV病毒体用于制造用于治疗有需要的受试者的药物,所述治疗通过施用治疗有效量的所述药物来实现。
15.如实施方案12-14中任一项所述的方法或用途,其中所述rAAV病毒体的所述治疗有效量小于衣壳包裹相同有效载荷的具有SEQ ID NO:1的野生型AAV5 VP衣壳多肽的rAAV病毒体的治疗有效量,其中具有所述SEQ ID NO:1的野生型AAV5 VP衣壳多肽的所述rAAV病毒体通过相同的施用途径施用。
16.如实施方案12-15中任一项所述的方法或用途,其中与衣壳包裹相同有效载荷的具有SEQ ID NO:1的野生型AAV5 VP衣壳多肽的rAAV病毒体的治疗有效量相比,所述rAAV病毒体的所述治疗有效量在所述受试者中引起较低的毒性,其中具有所述SEQ ID NO:1的野生型AAV5 VP衣壳多肽的所述rAAV病毒体通过相同的施用途径施用。
17.如实施方案12-16中任一项所述的方法或用途,其中所述治疗有效量为至少1x105个病毒基因组/kg受试者体重至5x1014个病毒基因组/kg受试者体重。
18.如实施方案12-17中任一项所述的方法或用途,其中通过全身施用来施用所述rAAV病毒体。
19.如实施方案18所述的方法或用途,其中所述全身施用是静脉内施用、肌肉内施用、腹膜内施用或口服施用。
20.如实施方案12-19中任一项所述的方法或用途,其中所述受试者是人类或非人类动物。
21.如实施方案12-20中任一项所述的方法或用途,其中所述受试者患有疾病。
22.如实施方案21所述的方法或用途,其中所述疾病是神经系统疾患。
23.如实施方案22所述的方法,其中所述神经系统疾患是AADC缺乏症、阿尔茨海默氏病、tau蛋白病、突触核蛋白病、贝登氏病、MPS-IIIB、伴有GBA1突变的额颞叶痴呆(PD-GBA)、神经性戈谢氏病、戈谢病2型、卡纳万病、帕金森氏病、泰萨克斯病、亨廷顿氏病、波托基-卢普斯基综合征、肌萎缩侧索硬化症、唐氏综合征、圣菲利波病A型、圣菲利波病B型或雷特综合征。
24.如实施方案23所述的方法,其中所述痴呆是额颞叶痴呆(FTD)。
W系列实施方案
1.如本文公开的实施方案中任一项所述的方法或用途,其中所述疾病选自表1。
2.如本文公开的实施方案中任一项所述的方法或用途,其中所述rAAV VP1衣壳的位置587处(Xaa7)不是A、C、D、E、F、G、H、I、K、M、P、Q、R、V、W或Y。
3.如本文公开的实施方案中任一项所述的方法或用途,其中所述rAAV VP1衣壳的位置587处可以是N、S或T。
4.如本文公开的实施方案中任一项所述的方法或用途,其中所述rAAV VP1衣壳的位置582处(Xaa2)不是G、V、L或I。
5.如本文公开的实施方案中任一项所述的方法或用途,其中所述rAAV VP1衣壳包含581-589(Xaa1-Xaa9)区域之外的一个或多个突变,其中所述rAAV VP1衣壳能够组装并表现出所需的组织嗜性。
1.2.实施例
以下是用于实施本发明的具体实施方案的实例。这些实施例仅为了说明目的提供而并非旨在以任何方式限制本发明的范围。已经努力确保关于所使用的数值(例如用量、温度等)的准确性,但当然也应允许一些实验误差和偏差。
除非另外指示,否则将采用本领域技术范围内的蛋白质化学、生物化学、重组DNA技术和药理学的常规方法来实施本发明。文献中充分说明了此类技术。
实施例1
高通量衣壳工程化系统
此实施例描述了本文公开的高通量衣壳工程化系统和方法以发现工程化组织嗜性AAV变体。所述高通量衣壳工程化系统在图1中示意。如图1所示,在组装前阶段,本文所述的方法允许产生含有AAV衣壳基因变体的质粒文库,所述变体在衣壳基因编码序列的特定位置具有大量多样性。使用本文所述的2质粒系统将此变体文库组装成病毒,然后将组装的病毒直接注射到非人灵长类动物(NHP)中以进行体内选择。收获组织并将组织转导衣壳基因用独特分子标识符和条形码标记。使这些变体序列/UMI/条形码参数化并使用机器学习算法鉴定特定组织靶向性/去靶向性衣壳的确定性特征。“去靶向”在本文中可以称为相对于特定组织而言的“保留”。例如,肝脏去靶向或肝脏保留在本文中都可用于指优先表现出对肝脏组织的归巢减少的变体或变体特性。
本文所述的方法允许克隆具有大量多样性的AAV衣壳基因的合成寡核苷酸变体。使用本文所述的2质粒系统将此变体文库组装成病毒,然后将组装的病毒直接注射到非人灵长类动物中以进行体内选择。该过程如下进行,但应当理解,对这些方法的合理且科学标准的修改涵盖在本文中。对文库模板进行初次PCR扩增(8-10个循环),并使用柱纯化DNA(池文库)。任选地,从文库池中进行第二次8循环扩增。使用合适的柱纯化DNA。接下来,使用NEBBsaI HF-V2进行消化(文库-3小时;主链-2小时+1小时小牛肠碱性磷酸酶)并使用柱纯化DNA。将所得消化物以3:1比率合并,在16℃下用NEB T4连接酶连接,并在第二天早上添加更多的ATP(1μM)和T4连接酶。“连接酶循环”进行20次。连接酶循环是指每个“循环”在16℃下10秒,随后在25℃下30秒。将连接酶热灭活,并添加更多的ATP(1μM)。在37℃下添加PS-DNA酶持续2小时以消化线性(未连接)物种,富集松弛形式(rf)环状DNA(图3)。使用柱纯化DNA,并在水中洗脱DNA。通过执行许多(>100)电穿孔反应来大规模转化电感受态重组酶缺陷细菌以整合文库质粒。通过在37℃下液体振荡培养过夜,使用抗生素选择来选择转化的细菌。通过在抗生素选择性琼脂平板上铺板有限稀释的转化细菌来确认转化效率并测量文库覆盖率。使用Megaprep试剂盒制备文库质粒DNA用于测序和转染从而进行病毒生产。通过“双重转染”生产病毒体:将病毒生产者真核细胞系(例如,HEK293)与腺病毒源性“辅助”基因质粒和文库质粒的混合物共转染。在接下来的3-7天使用密度离心或FPLC方法纯化来自细胞/悬浮液的病毒。将来自病毒体的DNA扩增用于组装体的NGS测序分析。任选地,可以用具有组装能力的变体重复克隆。将纯化的文库病毒以1-5x1013个病毒基因组/kg的剂量范围静脉内施用于NHP。4-6周后收获组织并对文库变体进行测序。
收获组织并将转导衣壳基因用独特分子标识符和条形码标记。使这些变体序列/UMI/条形码参数化并使用机器学习算法鉴定特定组织靶向性/去靶向性衣壳的确定性特征。
图2A提供了已显示与靶细胞相互作用的已知AAV衣壳的关键残基的侧视图(上图)和俯视图(下图)。图2B示出了实施例1中描述的AAV衣壳文库的突出特征,显示出引入多样性的区域,其中残基编号对应于AAV5 VP1中的氨基酸编号。文库质粒包括AAV ITR之间的不变的rep和多样化的cap编码序列(顺式包装方法)。
如上文所述,质粒安全DNA酶(PS-DNA酶)用于在连接后去除线性DNA。使用这种线性选择性DNA酶酶降解未连接的DNA可最大限度地提高转化效率,从而最大限度地提高文库多样性。图3是显示在用PS-DNA酶消化后有效去除线性插入片段和线性质粒骨架(“BB”)的凝胶照片。在该方法的一个实例中,质粒文库产生的总效率为4.23x109个菌落形成单位/μg质粒DNA。
图4是实施例1中描述的高通量AAV衣壳工程化系统的示意图。直方图显示了AAV衣壳文库在不同制备阶段的大小,追踪了文库从理论多样性、合成衣壳基因、总克隆变体到所测序组装病毒的大小(误差条表示从NGS测序分析中预测的最小/最大多样性)。将汇集的病毒文库注射到非人灵长类动物体内,经过一段足以确保稳定转导的时间后,将动物安乐死,并收获组织。从组织中纯化DNA(1),并且(2)附加独特分子标识符(UMI)。添加核酸外切酶I以消化过量的含UMI的引物(3)。后续PCR扩增添加测序索引/组织条形码和衔接子用于测序。添加UMI可以对组织中的衣壳变体进行高分辨率频率分析。
图5A示出了用于使来自文库的rAAV产量最大化的包装方法,其中图5A比较了标准三重转染(上图)与实施例1中使用的双质粒顺式包装方法(下图),并且图5B显示了使用这两种转染方法的野生型AAV5的相对产量。图5C是肝脏标本中UMI分布的实例,显示一次(单个UMI)发现大多数衣壳变体。然而,衣壳变体的一个子集在给定组织中富集并且可能具有增加的UMI数,与它们在靶组织中增加的频率相对应。
实施例2
NHP中AAV5变体的鉴定和分析
此实施例描述了使用实施例1中描述的一般方法发现的组织靶向性AAV5衣壳变体的鉴定和分析。为了鉴定优先感染特定组织(嗜性)的变体,在非人灵长类动物(NHP)中评估基于AAV5的变体衣壳文库的生物分布。根据Primate Products,LLC标准操作程序和授权的兽医标准进行生物分布调查。在文库剂量注射之前,进行了一项研究前活动计划,以对NHP临床病理学、一般健康和AAV5血清阴性进行基准测试。基于针对AAV5的抗体的血清阴性选择研究动物。
NHP接受1-5x1013个病毒基因组/kg之间的剂量范围内的基于AAV5的衣壳文库的IV推注注射。将最终稀释的基于AAV5的衣壳文库样本混合并转移到无菌注射器中进行静脉内施用,剂量体积为5mL/kg。使用基于AAV5的衣壳文库的常见移液和转移技术进行剂量准备。从基于AAV5的衣壳文库的稀释储备液的普通储备液中,根据每只动物各自的体重分别制备剂量体积,以便以每公斤为基础向每只动物递送等量的载体。
第1天文库注射后,每天进行两次临床观察(第1-29天)并每周检查体重。在第29天,根据Primate Products,LLC标准安乐死程序对所有研究动物实施安乐死并进行组织收集。
收集了各种各样的组织,包括:肾上腺、主动脉、骨与骨髓、脑(小脑)、脑(海马,齿状回)、脑(海马,CA1)、脑(海马,CA3)、脑(下丘脑)、脑(皮层,颞叶)、脑(皮层,前脑)、脑(皮层,枕叶)、脑(黑质)、脑(丘脑)、盲肠、结肠、十二指肠、附睾、食管、眼睛、胆囊、心脏、回肠、空肠、肾脏、肝脏、肺、淋巴结、乳腺、卵巢、胰腺、甲状旁腺、周围神经(坐骨神经)、垂体、前列腺、唾液腺、精囊、骨骼肌、皮肤、脊髓、脾脏、胃、睾丸、胸腺、甲状腺、气管、膀胱、子宫和阴道。将组织作为两个1cm3的块(或整个器官)收集并保存在液氮中。肝脏专门以五个1cm3块收集。对于大脑,从如上述列表中所指出的每个区域收集两个1cm3块,但较小的区域除外,它们是完整收集的。
图8是基于机器学习的衣壳变体聚类的示意图。该实例利用衣壳变体序列,对其使用机器学习算法来绘制感染肝脏的衣壳之间的相似性。然后,该输出可用于告知候选变体的选择,以选择性地靶向目标组织。
图9示出了静脉内施用于NHP后,文库整体感染皮层的相对水平高于肝脏的性能实例。从肝脏和皮层分离DNA,并使用qPCR(左)或液滴数字PCR(ddPCR)(右)来量化从各自组织回收的病毒基因组。根据这些量化方法,文库整体具有相对于肝脏约2倍增加的CNS靶向性。
图11A至图11D显示了维恩图和分析表,描绘了针对三种不同测序分析过滤器在仅肝脏组织、肝脏和皮层组织以及仅皮层组织中发现的独特序列变体的数量。对从肝脏或皮层组织样本回收的病毒基因组衣壳变体进行新一代测序。附加独特分子标识符(UMI)作为本文所述的分子回收过程的一部分。这增加了组织中存在给定衣壳变体的置信度,并且可与丰度相关联。图11A显示了维恩图,其中应用的测序分析过滤器为每各不同衣壳序列变体4个或更多个不同UMI--在本文中也称为“计数”。图11B显示了维恩图,其中应用的测序分析过滤器为50个或更多个UMI。图11C显示了维恩图,其中应用的测序分析过滤器为100个或更多个不同UMI。图11D显示了在仅皮层中发现的衣壳序列变体群体中UMI分布的直方图分析,其中应用的测序分析过滤器为如图11B所示的50个或更多个UMI。
实施例3
在病毒中功能性组装的AAV5变体
此实施例描述了使用实施例1-实施例2中描述的方法和系统发现的组装成病毒体的工程化AAV5变体。在如实施例1中描述的文库病毒的产生和纯化之后,评估AAV5文库病毒的组装。通过对跨越变体区域的扩增子的NGS测量衣壳变体的组成。分析相对于给定氨基酸残基出现在文库质粒中的指定位置的频率而言该给定氨基酸残基出现在对应于SEQ IDNO:1(推及于SEQ ID NO:2)的位置581至位置589的所述指定位置的频率,以确定优选病毒组装的序列规则。参考下文表3,和SEQ ID NO:2,以下氨基酸可以在Xaa1-Xaa9任何一个或多个位置处以任何组合独立地突变,以提供能够组装的AAV VP1衣壳。此外,可以允许Xaa1-Xaa9区域之外的一个或多个突变,只要衣壳仍然能够组装即可。
Figure BDA0004113558700002971
/>
Figure BDA0004113558700002981
实施例4
具有肝脏组织靶向性的AAV5变体和具有肝脏去靶向特性的AAV5变体
此实施例描述了使用实施例1-实施例2中描述的方法和系统发现的在肝脏中具有组织嗜性的工程化AAV5变体和优先对肝脏组织去靶向的AAV5变体。
图6A至图6B是热图和统计分析,显示了通过病毒组装和肝脏中的组织转导进行的明确功能选择。图6A是在实施例1-2中描述的高通量系统从组装前、组装病毒到肝脏转导的各个阶段制备的热图。因此,图6A(右)示出了除以所有组装病毒所有肝脏转导变体的有利位置残基的热图。对于组装前热图,将衣壳变体文库克隆到质粒中并转化到电感受态细菌中。对所得文库进行测序,并测量每个位置处的氨基酸多样性,低水平的位置变异可能是由综合误差引起的。随后组装成病毒显示出明显的氨基酸残基/位置偏差,突出了病毒组装的选择。肝脏转导病毒显示出更大的AA残基/位置选择模式,具有明显有利/不利的变体。对这些热图各自根据它们各自的输入频率进行了归一化。图6B是统计分析表(ANOVA),显示在三个肝脏样本中,氨基酸残基分布和残基位置显著改变,但样本间变异不显著。
图7A至图7B示出了对多个样本之间重复观察到的(高UMI)衣壳变体的分析。图7A是示出两个肝脏样本中重叠变体鉴定计数的维恩图:在两个样本中观察到约38%的具有>10个UMI的变体。图7B是显示位置氨基酸分布的热图,示出重复观察到的衣壳变体的强选择残基/位置。
图10提供了结构图解,左边的图解代表野生型AAV5[SEQ NO:1]的晶体结构(PDB:6JCT,来自Zhang等人Nat Commun.2019年8月21日;10(1):3760),指向3重对称轴。中间和右边的图解代表从NHP肝脏回收的变体,所述变体的581-589残基用NPAMFNCDY(中图,氨基酸SEQ ID NO:112)和KLTAHIYAL(右图,氨基酸SEQ ID NO:114)置换。这些图解使用PyMOL产生以置换变体序列,并根据预测的静电电荷进行着色,以突出从同一组织回收的肝脏变体之间的电荷差异。
分析相对于给定氨基酸残基出现在形成组装病毒的变体中的指定位置的频率而言该给定氨基酸残基出现在肝脏中鉴定的变体中对应于SEQ ID NO:1(推及于SEQ ID NO:2)的位置581至位置589的所述指定位置的频率,以确定优先靶向肝脏组织的衣壳的一组序列规则。参考下文表4,和SEQ ID NO:2(AAV5 VP1),以下氨基酸可以在Xaa1-Xaa9任何一个或多个位置处以任何组合独立地突变,以提供与野生型AAV5 VP1衣壳(SEQ ID NO:1)相比具有增强的肝脏嗜性的VP1衣壳,其中肝脏嗜性在此是指优选肝脏转导的特性,而不是优选病毒体组装的特性。此外,可以允许Xaa1-Xaa9区域之外的一个或多个突变,只要衣壳仍然能够组装并表现出所需的肝脏靶向性特性即可。
Figure BDA0004113558700002991
Figure BDA0004113558700003001
分析相对于给定氨基酸残基出现在形成组装病毒的变体中的指定位置的频率而言该给定氨基酸残基出现在肝脏中未鉴定的变体中对应于SEQ ID NO:1(推及于SEQ IDNO:2)的位置581至位置589的所述指定位置的频率,以确定优选肝脏去靶向的一组序列规则。参考下文表5和AAV5 VP1(SEQ ID NO:2),以下氨基酸可以以任何组合独立地排除,以提供能够组装并且与野生型AAV5 VP1衣壳(SEQ ID NO:1)相比较少靶向肝脏组织(“肝脏保留”或“肝脏去靶向”)的AAV VP1衣壳,其中肝脏去靶向性在此是指在具有降低的肝脏转导的病毒中优选的特性,而不是优选病毒体组装的特性。此外,可以允许Xaa1-Xaa9区域之外的一个或多个突变,只要衣壳仍然能够组装并表现出所需特征即可。
Figure BDA0004113558700003011
分析肝脏、CNS、骨骼肌、心脏、肺、脾脏、淋巴结、骨髓、乳腺、皮肤、肾上腺、甲状腺、结肠、坐骨神经和脊髓组织以鉴定AAV5 VP1 581-589区域中驱动肝脏嗜性的氨基酸残基。结果显示于图18B中,该图显示了相较于所有其他分析组织在肝脏组织中AAV5 VP1的581至589区域中各氨基酸的位置频率,其中衣壳多肽具有SEQ ID NO:2的序列。位置(“Xaan”,n=1-9)在x轴上表示并且氨基酸残基在y轴上表示。特定位置的特定氨基酸残基的频率在热图中作为强度表示。较深的方块表示特定氨基酸在特定位置的频率较高,较浅的方块表示特定氨基酸在特定位置的频率较低。
比较相对于给定氨基酸残基出现在所有其他分析组织中鉴定的变体中的指定位置的频率而言该给定氨基酸残基出现在肝脏中鉴定的变体中对应于SEQ ID NO:1(推及于SEQ ID NO:2)的位置581至位置589的所述指定位置的频率,以确定优选肝脏靶向的一组序列规则。参考下文表6A,和SEQ ID NO:2(AAV5 VP1),以下氨基酸由此可以在Xaa1-Xaa9任何一个或多个位置处以任何组合独立地突变,以提供与野生型AAV5 VP1衣壳(SEQ ID NO:1)相比具有增强的肝脏嗜性的VP1衣壳,其中肝脏嗜性在此是指优选肝脏转导的特性,而不是优选转导所有其他所收获组织的特性。
Figure BDA0004113558700003021
/>
Figure BDA0004113558700003031
参考下文表6B,和SEQ ID NO:2(AAV5 VP1),以下氨基酸可以由此以任何组合在Xaa1-Xaa9任何一个或多个位置处独立地突变,以提供与野生型AAV5 VP1衣壳(SEQ ID NO:1)相比具有降低的肝脏嗜性的VP1衣壳,其中肝脏嗜性在此是指对肝脏转导具有确定性的特性,而不是对所有其他所收获组织转导具有确定性的特性。
Figure BDA0004113558700003032
/>
Figure BDA0004113558700003041
下文表7提供了在肝脏组织中发现并且符合表6中提供的一种或多种规则的变体AAV VP1衣壳多肽的581至589区域的序列。因此,本公开提供了由具有SEQ ID NO:2的工程化AAV5 VP1衣壳多肽组成的rAAV,其中Xaa1至Xaa9区域是SEQ ID NO:43438-SEQ ID NO:44437中的任一者,如表7中所公开。本文还涵盖由工程化AAV5 VP2衣壳多肽和工程化AAV5VP3衣壳多肽组成的rAAV,所述多肽在对应于AAV5 VP1 581至589区域中的氨基酸的AAV5VP2(氨基酸残基445至453)和AAV5 VP3(氨基酸残基389-397)中的区域处具有下文表中公开的序列。
表7
驱动肝脏组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700003051
/>
Figure BDA0004113558700003061
/>
Figure BDA0004113558700003071
/>
Figure BDA0004113558700003081
/>
Figure BDA0004113558700003091
/>
Figure BDA0004113558700003101
/>
Figure BDA0004113558700003111
实施例5
在CNS中具有组织嗜性的AAV5变体
此实施例描述了使用实施例1-实施例2中描述的方法和系统发现的在CNS中具有组织嗜性的工程化AAV5变体。
表8是1000个变体(CNS变体)的列表,这些变体在两个皮层测序样本中具有最高的归一化UMI计数,但在两个肝脏测序样本中不存在。该列表的最低纳入标准包括在两个质量过滤的皮层NGS数据集中存在;并且排除标准是在两个独立的肝脏测序样本中检测到给定的变体。在对四个数据集进行分析后,符合这些标准的变体总数为2108。然后对两个单独的皮层NGS数据集的UMI计数进行独立归一化,接着根据两个独立归一化的UMI计数的总和对变体序列进行排序(最大可能=200%),前1000名在此处列出(SEQ ID NO:115-SEQ ID NO:1114)。变体残基在位置581-589处。
表8
Figure BDA0004113558700003112
/>
Figure BDA0004113558700003121
/>
Figure BDA0004113558700003131
/>
Figure BDA0004113558700003141
/>
Figure BDA0004113558700003151
/>
Figure BDA0004113558700003161
/>
Figure BDA0004113558700003171
/>
Figure BDA0004113558700003181
/>
Figure BDA0004113558700003191
/>
Figure BDA0004113558700003201
/>
Figure BDA0004113558700003211
/>
Figure BDA0004113558700003221
/>
Figure BDA0004113558700003231
/>
Figure BDA0004113558700003241
/>
Figure BDA0004113558700003251
/>
Figure BDA0004113558700003261
/>
Figure BDA0004113558700003271
/>
Figure BDA0004113558700003281
/>
Figure BDA0004113558700003291
分析CNS(前脑皮层、枕叶皮层、颞叶皮层、丘脑、下丘脑、黑质、海马DG、海马CA1、海马CA3、小脑)、肝脏、骨骼肌、心脏、肺、脾脏、淋巴结、骨髓、乳腺、皮肤、肾上腺、甲状腺、结肠、坐骨神经和脊髓组织,以鉴定AAV5 VP1 581-589区域中驱动CNS嗜性的氨基酸残基。结果显示于图18B中,该图显示了相较于所有其他分析组织在CNS组织中AAV5 VP1的581至589区域中各氨基酸的位置频率,其中衣壳多肽具有SEQ ID NO:2的序列。位置(“Xaan”,n=1-9)在x轴上表示并且氨基酸残基在y轴上表示。特定位置的特定氨基酸残基的频率在热图中作为强度表示。较深的方块表示特定氨基酸在特定位置的频率较高,较浅的方块表示特定氨基酸在特定位置的频率较低。
分析相对于给定氨基酸残基出现在所有其他所收获组织中鉴定的变体中的指定位置的频率而言该给定氨基酸残基出现在CNS中鉴定的变体中对应于SEQ ID NO:1(推及于SEQ ID NO:2)的位置581至位置589的所述指定位置的频率,以确定优先靶向CNS组织的衣壳的一组序列规则。参考下文表9,和SEQ ID NO:2(AAV5 VP1),以下氨基酸由此可以在Xaa1-Xaa9任何一个或多个位置处以任何组合独立地突变,以提供与野生型AAV5 VP1衣壳(SEQ ID NO:1)相比具有增强的CNS嗜性的VP1衣壳,其中CNS嗜性在此是指优选CNS转导的特性,而不是优选转导所有其他所收获组织的特性。
Figure BDA0004113558700003292
/>
Figure BDA0004113558700003301
下文表10提供了在CNS组织中发现并且符合表9中提供的一种或多种规则的变体AAV VP1衣壳多肽的581至589区域的序列。因此,本公开提供了由具有SEQ ID NO:2的工程化AAV5 VP1衣壳多肽组成的rAAV,其中Xaa1至Xaa9区域是SEQ ID NO:7118-SEQ ID NO:8117中的任一者,如表10中所公开。本文还涵盖由工程化AAV5VP2衣壳多肽和工程化AAV5VP3衣壳多肽组成的rAAV,所述多肽在对应于AAV5 VP1 581至589区域中的氨基酸的AAV5VP2(氨基酸残基445至453)和AAV5 VP3(氨基酸残基389-397)中的区域处具有下文表中公开的序列。
表10
驱动CNS组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700003311
/>
Figure BDA0004113558700003321
/>
Figure BDA0004113558700003331
/>
Figure BDA0004113558700003341
/>
Figure BDA0004113558700003351
/>
Figure BDA0004113558700003361
/>
Figure BDA0004113558700003371
实施例6
在脾脏中具有组织嗜性的AAV5变体
此实施例描述了使用实施例1-实施例2中描述的方法和系统发现的在脾脏中具有组织嗜性的工程化AAV5变体。
分析CNS、肝脏、骨骼肌、心脏、肺、脾脏、淋巴结、骨髓、乳腺、皮肤、肾上腺、甲状腺、结肠、坐骨神经和脊髓组织以鉴定AAV5VP1 581-589区域中驱动脾脏嗜性的氨基酸残基。结果显示于图18F中,该图显示了相较于所有其他分析组织在脾脏组织中AAV5 VP1的581至589区域中每个氨基酸的位置频率,其中衣壳多肽具有SEQ ID NO:2的序列。位置(“Xaan”,n=1-9)在x轴上表示并且氨基酸残基在y轴上表示。特定位置的特定氨基酸残基的频率在热图中作为强度表示。较深的方块表示特定氨基酸在特定位置的频率较高,较浅的方块表示特定氨基酸在特定位置的频率较低。
分析相对于给定氨基酸残基出现在所有其他所收获组织中鉴定的变体中的指定位置的频率而言该给定氨基酸残基出现在脾脏中鉴定的变体中对应于SEQ ID NO:1(推及于SEQ ID NO:2)的位置581至位置589的所述指定位置的频率,以确定优先靶向脾脏组织的衣壳的一组序列规则。参考下文表11,和SEQ ID NO:2(AAV5 VP1),以下氨基酸由此可以在Xaa1-Xaa9任何一个或多个位置处以任何组合独立地突变,以提供与野生型AAV5 VP1衣壳(SEQ ID NO:1)相比具有增强的脾脏嗜性的VP1衣壳,其中脾脏嗜性在此是指优选脾脏转导的特性,而不是优选转导所有其他所收获组织的特性。
Figure BDA0004113558700003381
Figure BDA0004113558700003391
下文表12提供了在脾脏组织中发现并且符合表11中提供的一种或多种规则的变体AAV VP1衣壳多肽的581至589区域的序列。因此,本公开提供了由具有SEQ ID NO:2的工程化AAV5 VP1衣壳多肽组成的rAAV,其中Xaa1至Xaa9区域是SEQ ID NO:37438-SEQ ID NO:38437中的任一者,如表12中所公开。本文还涵盖由工程化AAV5 VP2衣壳多肽和工程化AAV5VP3衣壳多肽组成的rAAV,所述多肽在对应于AAV5 VP1 581至589区域中的氨基酸的AAV5VP2(氨基酸残基445至453)和AAV5 VP3(氨基酸残基389-397)中的区域处具有下文表中公开的序列。
表12驱动脾脏组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700003392
/>
Figure BDA0004113558700003401
/>
Figure BDA0004113558700003411
/>
Figure BDA0004113558700003421
/>
Figure BDA0004113558700003431
/>
Figure BDA0004113558700003441
/>
Figure BDA0004113558700003451
实施例7
在肾上腺中具有组织嗜性的AAV5变体
此实施例描述了使用实施例1-实施例2中描述的方法和系统发现的在肾上腺中具有组织嗜性的工程化AAV5变体。
分析CNS、肝脏、骨骼肌、心脏、肺、脾脏、淋巴结、骨髓、乳腺、皮肤、肾上腺、甲状腺、结肠、坐骨神经和脊髓组织以鉴定AAV5 VP1 581-589区域中驱动肾上腺嗜性的氨基酸残基。结果显示于图18K中,该图显示了相较于所有其他分析组织在肾上腺组织中AAV5 VP1的581至589区域中每个氨基酸的位置频率,其中衣壳多肽具有SEQ ID NO:2的序列。位置(“Xaan”,n=1-9)在x轴上表示并且氨基酸残基在y轴上表示。特定位置的特定氨基酸残基的频率在热图中作为强度表示。较深的方块表示特定氨基酸在特定位置的频率较高,较浅的方块表示特定氨基酸在特定位置的频率较低。
分析相对于给定氨基酸残基出现在所有其他所收获组织中鉴定的变体中的指定位置的频率而言该给定氨基酸残基出现在肾上腺中鉴定的变体中对应于SEQ ID NO:1(推及于SEQ ID NO:2)的位置581至位置589的所述指定位置的频率,以确定优先靶向肾上腺组织的衣壳的一组序列规则。参考下文表13,和SEQ ID NO:2(AAV5 VP1),以下氨基酸由此可以在Xaa1-Xaa9任何一个或多个位置处以任何组合独立地突变,以提供与野生型AAV5 VP1衣壳(SEQ ID NO:1)相比具有增强的肾上腺嗜性的VP1衣壳,其中肾上腺嗜性在此是指优选肾上腺转导的特性,而不是优选转导所有其他所收获组织的特性。
Figure BDA0004113558700003461
/>
Figure BDA0004113558700003471
下文表14提供了在肾上腺组织中发现并且符合表13中提供的一种或多种规则的变体AAV VP1衣壳多肽的581至589区域的序列。因此,本公开提供了由具有SEQ ID NO:2的工程化AAV5 VP1衣壳多肽组成的rAAV,其中Xaa1至Xaa9区域是SEQ ID NO:1118-SEQ IDNO:2117中的任一者,如表14中所公开。本文还涵盖由工程化AAV5 VP2衣壳多肽和工程化AAV5 VP3衣壳多肽组成的rAAV,所述多肽在对应于AAV5 VP1 581至589区域中的氨基酸的AAV5VP2(氨基酸残基445至453)和AAV5 VP3(氨基酸残基389-397)中的区域处具有下文表中公开的序列。
表14驱动肾上腺组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700003481
/>
Figure BDA0004113558700003491
/>
Figure BDA0004113558700003501
/>
Figure BDA0004113558700003511
/>
Figure BDA0004113558700003521
/>
Figure BDA0004113558700003531
/>
Figure BDA0004113558700003541
实施例8
在坐骨神经中具有组织嗜性的AAV5变体
此实施例描述了使用实施例1-实施例2中描述的方法和系统发现的在坐骨神经中具有组织嗜性的工程化AAV5变体。
分析CNS、肝脏、骨骼肌、心脏、肺、脾脏、淋巴结、骨髓、乳腺、皮肤、肾上腺、甲状腺、结肠、坐骨神经和脊髓组织以鉴定AAV5VP1 581-589区域中驱动坐骨神经嗜性的氨基酸残基。结果显示于图18N中,该图显示了相较于所有其他分析组织在坐骨神经组织中AAV5 VP1的581至589区域中每个氨基酸的位置频率,其中衣壳多肽具有SEQ ID NO:2的序列。位置(“Xaan”,n=1-9)在x轴上表示并且氨基酸残基在y轴上表示。特定位置的特定氨基酸残基的频率在热图中作为强度表示。较深的方块表示特定氨基酸在特定位置的频率较高,较浅的方块表示特定氨基酸在特定位置的频率较低。
分析相对于给定氨基酸残基出现在所有其他所收获组织中鉴定的变体中的指定位置的频率而言该给定氨基酸残基出现在坐骨神经中鉴定的变体中对应于SEQ ID NO:1(推及于SEQ ID NO:2)的位置581至位置589的所述指定位置的频率,以确定优先靶向坐骨神经组织的衣壳的一组序列规则。参考下文表15,和SEQ ID NO:2(AAV5VP1),以下氨基酸由此可以在Xaa1-Xaa9任何一个或多个位置处以任何组合独立地突变,以提供与野生型AAV5VP1衣壳(SEQ ID NO:1)相比具有增强的坐骨神经嗜性的VP1衣壳,其中坐骨神经嗜性在此是指优选坐骨神经转导的特性,而不是优选转导所有其他所收获组织的特性。
Figure BDA0004113558700003551
Figure BDA0004113558700003561
下文表16提供了在坐骨神经组织中发现并且符合表15中提供的一种或多种规则的变体AAV VP1衣壳多肽的581至589区域的序列。因此,本公开提供了由具有SEQ ID NO:2的工程化AAV5 VP1衣壳多肽组成的rAAV,其中Xaa1至Xaa9区域是SEQ ID NO:26118-SEQ IDNO:26990中的任一者,如表16中所公开。本文还涵盖由工程化AAV5 VP2衣壳多肽和工程化AAV5 VP3衣壳多肽组成的rAAV,所述多肽在对应于AAV5 VP1 581至589区域中的氨基酸的AAV5VP2(氨基酸残基445至453)和AAV5 VP3(氨基酸残基389-397)中的区域处具有下文表中公开的序列。
表16
驱动坐骨神经组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700003571
/>
Figure BDA0004113558700003581
/>
Figure BDA0004113558700003591
/>
Figure BDA0004113558700003601
/>
Figure BDA0004113558700003611
/>
Figure BDA0004113558700003621
实施例9
在骨骼肌中具有组织嗜性的AAV5变体
此实施例描述了使用实施例1-实施例2中描述的方法和系统发现的在骨骼肌中具有组织嗜性的工程化AAV5变体。
分析CNS、肝脏、骨骼肌、心脏、肺、脾脏、淋巴结、骨髓、乳腺、皮肤、肾上腺、甲状腺、结肠、坐骨神经和脊髓组织以鉴定AAV5VP1 581一589区域中驱动骨骼肌嗜性的氨基酸残基。结果显示于图18C中,该图显示了相较于所有其他分析组织在骨骼肌组织中AAV5VP1的581至589区域中每个氨基酸的位置频率,其中衣壳多肽具有SEQ ID NO:2的序列。位置(“Xaan”,n=1-9)在x轴上表示并且氨基酸残基在y轴上表示。特定位置的特定氨基酸残基的频率在热图中作为强度表示。较深的方块表示特定氨基酸在特定位置的频率较高,较浅的方块表示特定氨基酸在特定位置的频率较低。
分析相对于给定氨基酸残基出现在所有其他所收获组织中鉴定的变体中的指定位置的频率而言该给定氨基酸残基出现在骨骼肌中鉴定的变体中对应于SEQ ID NO:1(推及于SEQ ID NO:2)的位置581至位置589的所述指定位置的频率,以确定优先靶向骨骼肌组织的衣壳的一组序列规则。参考下文表17,和SEQ ID NO:2(AAV5 VP1),以下氨基酸由此可以在Xaa1-Xaa9任何一个或多个位置处以任何组合独立地突变,以提供与野生型AAV5 VP1衣壳(SEQ ID NO:1)相比具有增强的骨骼肌嗜性的VP1衣壳,其中骨骼肌嗜性在此是指优选骨骼肌转导的特性,而不是优选转导所有其他所收获组织的特性。
Figure BDA0004113558700003631
Figure BDA0004113558700003641
下文表18提供了在骨骼肌组织中发现并且符合表17中提供的一种或多种规则的变体AAV VP1衣壳多肽的581至589区域的序列。因此,本公开提供了由具有SEQ ID NO:2的工程化AAV5 VP1衣壳多肽组成的rAAV,其中Xaa1至Xaa9区域是SEQ ID NO:28991-SEQ IDNO:29990中的任一者,如表18中所公开。本文还涵盖由工程化AAV5 VP2衣壳多肽和工程化AAV5 VP3衣壳多肽组成的rAAV,所述多肽在对应于AAV5 VP1 581至589区域中的氨基酸的AAV5VP2(氨基酸残基445至453)和AAV5 VP3(氨基酸残基389-397)中的区域处具有下文表中公开的序列。
表18
驱动骨骼肌组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700003651
/>
Figure BDA0004113558700003661
/>
Figure BDA0004113558700003671
/>
Figure BDA0004113558700003681
/>
Figure BDA0004113558700003691
/>
Figure BDA0004113558700003701
/>
Figure BDA0004113558700003711
实施例10
在脊髓中具有组织嗜性的AAV5变体
此实施例描述了使用实施例1-实施例2中描述的方法和系统发现的在脊髓中具有组织嗜性的工程化AAV5变体。
分析CNS、肝脏、骨骼肌、心脏、肺、脾脏、淋巴结、骨髓、乳腺、皮肤、肾上腺、甲状腺、结肠、坐骨神经和脊髓组织以鉴定AAV5VP1 581-589区域中驱动脊髓嗜性的氨基酸残基。结果显示于图18O中,该图显示了相较于所有其他分析组织在脊髓组织中AAV5 VP1的581至589区域中每个氨基酸的位置频率,其中衣壳多肽具有SEQ ID NO:2的序列。位置(“Xaan”,n=1-9)在x轴上表示并且氨基酸残基在y轴上表示。特定位置的特定氨基酸残基的频率在热图中作为强度表示。较深的方块表示特定氨基酸在特定位置的频率较高,较浅的方块表示特定氨基酸在特定位置的频率较低。
分析相对于给定氨基酸残基出现在所有其他所收获组织中鉴定的变体中的指定位置的频率而言该给定氨基酸残基出现在脊髓中鉴定的变体中对应于SEQ ID NO:1(推及于SEQ ID NO:2)的位置581至位置589的所述指定位置的频率,以确定优先靶向脊髓组织的衣壳的一组序列规则。参考下文表19,和SEQ ID NO:2(AAV5 VP1),以下氨基酸由此可以在Xaa1-Xaa9任何一个或多个位置处以任何组合独立地突变,以提供与野生型AAV5 VP1衣壳(SEQ ID NO:1)相比具有增强的脊髓嗜性的VP1衣壳,其中脊髓嗜性在此是指优选脊髓转导的特性,而不是优选转导所有其他所收获组织的特性。
Figure BDA0004113558700003721
下文表20提供了在脊髓组织中发现并且符合表19中提供的一种或多种规则的变体AAV VP1衣壳多肽的581至589区域的序列。因此,本公开提供了由具有SEQ ID NO:2的工程化AAV5 VP1衣壳多肽组成的rAAV,其中Xaa1至Xaa9区域是SEQ ID NO:34991-SEQ ID NO:35437中的任一者,如表20中所公开。本文还涵盖由工程化AAV5 VP2衣壳多肽和工程化AAV5VP3衣壳多肽组成的rAAV,所述多肽在对应于AAV5 VP1 581至589区域中的氨基酸的AAV5VP2(氨基酸残基445至453)和AAV5 VP3(氨基酸残基389-397)中的区域处具有下文表中公开的序列。
表20
驱动脊髓组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700003731
/>
Figure BDA0004113558700003741
/>
Figure BDA0004113558700003751
/>
Figure BDA0004113558700003761
实施例11
在乳腺中具有组织嗜性的AAV5变体
此实施例描述了使用实施例1-实施例2中描述的方法和系统发现的在乳腺中具有组织嗜性的工程化AAV5变体。
分析CNS、肝脏、骨骼肌、心脏、肺、脾脏、淋巴结、骨髓、乳腺、皮肤、肾上腺、甲状腺、结肠、坐骨神经和脊髓组织以鉴定AAV5VP1 581-589区域中驱动乳腺嗜性的氨基酸残基。结果显示于图18I中,该图显示了相较于所有其他分析组织在乳腺组织中AAV5 VP1的581至589区域中每个氨基酸的位置频率,其中衣壳多肽具有SEQ ID NO:2的序列。位置(“Xaan”,n=1-9)在x轴上表示并且氨基酸残基在y轴上表示。特定位置的特定氨基酸残基的频率在热图中作为强度表示。较深的方块表示特定氨基酸在特定位置的频率较高,较浅的方块表示特定氨基酸在特定位置的频率较低。
分析相对于给定氨基酸残基出现在所有其他所收获组织中鉴定的变体中的指定位置的频率而言该给定氨基酸残基出现在乳腺中鉴定的变体中对应于SEQ ID NO:1(推及于SEQ ID NO:2)的位置581至位置589的所述指定位置的频率,以确定优先靶向乳腺组织的衣壳的一组序列规则。参考下文表21,和SEQ ID NO:2(AAV5 VP1),以下氨基酸由此可以在Xaa1-Xaa9任何一个或多个位置处以任何组合独立地突变,以提供与野生型AAV5 VP1衣壳(SEQ ID NO:1)相比具有增强的乳腺嗜性的VP1衣壳,其中乳腺嗜性在此是指优选乳腺转导的特性,而不是优选转导所有其他所收获组织的特性。
Figure BDA0004113558700003771
下文表22提供了在乳腺组织中发现并且符合表21中提供的一种或多种规则的变体AAV VP1衣壳多肽的581至589区域的序列。因此,本公开提供了由具有SEQ ID NO:2的工程化AAV5 VP1衣壳多肽组成的rAAV,其中Xaa1至Xaa9区域是SEQ ID NO:22118-SEQ ID NO:23117中的任一者,如表22中所公开。本文还涵盖由工程化AAV5 VP2衣壳多肽和工程化AAV5VP3衣壳多肽组成的rAAV,所述多肽在对应于AAV5 VP1 581至589区域中的氨基酸的AAV5VP2(氨基酸残基445至453)和AAV5 VP3(氨基酸残基389-397)中的区域处具有下文表中公开的序列。
表22
驱动乳腺组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700003781
Figure BDA0004113558700003791
/>
Figure BDA0004113558700003801
/>
Figure BDA0004113558700003811
/>
Figure BDA0004113558700003821
/>
Figure BDA0004113558700003831
/>
Figure BDA0004113558700003841
实施例12
在肺中具有组织嗜性的AAV5变体
此实施例描述了使用实施例1-实施例2中描述的方法和系统发现的在肺中具有组织嗜性的工程化AAV5变体。
分析CNS、肝脏、骨骼肌、心脏、肺、脾脏、淋巴结、骨髓、乳腺、皮肤、肾上腺、甲状腺、结肠、坐骨神经和脊髓组织以鉴定AAV5VP1 581-589区域中驱动肺嗜性的氨基酸残基。结果显示于图18E中,该图显示了相较于所有其他分析组织在肺组织中AAV5 VP1的581至589区域中每个氨基酸的位置频率,其中衣壳多肽具有SEQ ID NO:2的序列。位置(“Xaan”,n=1-9)在x轴上表示并且氨基酸残基在y轴上表示。特定位置的特定氨基酸残基的频率在热图中作为强度表示。较深的方块表示特定氨基酸在特定位置的频率较高,较浅的方块表示特定氨基酸在特定位置的频率较低。
分析相对于给定氨基酸残基出现在所有其他所收获组织中鉴定的变体中的指定位置的频率而言该给定氨基酸残基出现在肺中鉴定的变体中对应于SEQ ID NO:1(推及于SEQ ID NO:2)的位置581至位置589的所述指定位置的频率,以确定优先靶向肺组织的衣壳的一组序列规则。参考下文表23,和SEQ ID NO:2(AAV5 VP1),以下氨基酸由此可以在Xaa1-Xaa9任何一个或多个位置处以任何组合独立地突变,以提供与野生型AAV5 VP1衣壳(SEQID NO:1)相比具有增强的肺嗜性的VP1衣壳,其中肺嗜性在此是指优选肺转导的特性,而不是优选转导所有其他所收获组织的特性。
Figure BDA0004113558700003851
/>
Figure BDA0004113558700003861
下文表24提供了在肺组织中发现并且符合表23中提供的一种或多种规则的变体AAV VP1衣壳多肽的581至589区域的序列。因此,本公开提供了由具有SEQ ID NO:2的工程化AAV5 VP1衣壳多肽组成的rAAV,其中Xaa1至Xaa9区域是SEQ ID NO:16118-SEQ ID NO:17117中的任一者,如表24中所公开。本文还涵盖由工程化AAV5 VP2衣壳多肽和工程化AAV5VP3衣壳多肽组成的rAAV,所述多肽在对应于AAV5 VP1 581至589区域中的氨基酸的AAV5VP2(氨基酸残基445至453)和AAV5 VP3(氨基酸残基389-397)中的区域处具有下文表中公开的序列。
表24
驱动肺组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700003871
/>
Figure BDA0004113558700003881
/>
Figure BDA0004113558700003891
/>
Figure BDA0004113558700003901
/>
Figure BDA0004113558700003911
/>
Figure BDA0004113558700003921
/>
Figure BDA0004113558700003931
实施例13
在心脏中具有组织嗜性的AAV5变体
此实施例描述了使用实施例1-实施例2中描述的方法和系统发现的在心脏中具有组织嗜性的工程化AAV5变体。
分析CNS、肝脏、骨骼肌、心脏、肺、脾脏、淋巴结、骨髓、乳腺、皮肤、肾上腺、甲状腺、结肠、坐骨神经和脊髓组织以鉴定AAV5VP1 581-589区域中驱动心脏嗜性的氨基酸残基。结果显示于图18D中,该图显示了相较于所有其他分析组织在心脏组织中AAV5 VP1的581至589区域中每个氨基酸的位置频率,其中衣壳多肽具有SEQ ID NO:2的序列。位置(“Xaan”,n=1-9)在x轴上表示并且氨基酸残基在y轴上表示。特定位置的特定氨基酸残基的频率在热图中作为强度表示。较深的方块表示特定氨基酸在特定位置的频率较高,较浅的方块表示特定氨基酸在特定位置的频率较低。
分析相对于给定氨基酸残基出现在所有其他所收获组织中鉴定的变体中的指定位置的频率而言该给定氨基酸残基出现在心脏中鉴定的变体中对应于SEQ ID NO:1(推及于SEQ ID NO:2)的位置581至位置589的所述指定位置的频率,以确定优先靶向心脏组织的衣壳的一组序列规则。参考下文表25,和SEQ ID NO:2(AAV5 VP1),以下氨基酸由此可以在Xaa1-Xaa9任何一个或多个位置处以任何组合独立地突变,以提供与野生型AAV5 VP1衣壳(SEQ ID NO:1)相比具有增强的心脏嗜性的VP1衣壳,其中心脏嗜性在此是指优选心脏转导的特性,而不是优选转导所有其他所收获组织的特性。
Figure BDA0004113558700003941
Figure BDA0004113558700003951
下文表26提供了在心脏组织中发现并且符合表25中提供的一种或多种规则的变体AAV VP1衣壳多肽的581至589区域的序列。因此,本公开提供了由具有SEQ ID NO:2的工程化AAV5 VP1衣壳多肽组成的rAAV,其中Xaa1至Xaa9区域是SEQ ID NO:13118-SEQ ID NO:14117中的任一者,如表26中所公开。本文还涵盖由工程化AAV5 VP2衣壳多肽和工程化AAV5VP3衣壳多肽组成的rAAV,所述多肽在对应于AAV5 VP1 581至589区域中的氨基酸的AAV5VP2(氨基酸残基445至453)和AAV5 VP3(氨基酸残基389-397)中的区域处具有下文表中公开的序列。
表26
驱动心脏组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700003961
/>
Figure BDA0004113558700003971
/>
Figure BDA0004113558700003981
/>
Figure BDA0004113558700003991
/>
Figure BDA0004113558700004001
/>
Figure BDA0004113558700004011
/>
Figure BDA0004113558700004021
实施例14
在结肠中具有组织嗜性的AAV5变体
此实施例描述了使用实施例1-实施例2中描述的方法和系统发现的在结肠中具有组织嗜性的工程化AAV5变体。
分析CNS、肝脏、骨骼肌、心脏、肺、脾脏、淋巴结、骨髓、乳腺、皮肤、肾上腺、甲状腺、结肠、坐骨神经和脊髓组织以鉴定AAV5VP1 581-589区域中驱动结肠嗜性的氨基酸残基。结果显示于图18M中,该图显示了相较于所有其他分析组织在结肠组织中AAV5 VP1的581至589区域中每个氨基酸的位置频率,其中衣壳多肽具有SEQ ID NO:2的序列。位置(“Xaan”,n=1-9)在x轴上表示并且氨基酸残基在y轴上表示。特定位置的特定氨基酸残基的频率在热图中作为强度表示。较深的方块表示特定氨基酸在特定位置的频率较高,较浅的方块表示特定氨基酸在特定位置的频率较低。
分析相对于给定氨基酸残基出现在所有其他所收获组织中鉴定的变体中的指定位置的频率而言该给定氨基酸残基出现在结肠中鉴定的变体中对应于SEQ ID NO:1(推及于SEQ ID NO:2)的位置581至位置589的所述指定位置的频率,以确定优先靶向结肠组织的衣壳的一组序列规则。参考下文表27,和SEQ ID NO:2(AAV5 VP1),以下氨基酸由此可以在Xaa1-Xaa9任何一个或多个位置处以任何组合独立地突变,以提供与野生型AAV5 VP1衣壳(SEQ ID NO:1)相比具有增强的结肠嗜性的VP1衣壳,其中结肠嗜性在此是指优选结肠转导的特性,而不是优选转导所有其他所收获组织的特性。
Figure BDA0004113558700004031
下文表28提供了在结肠组织中发现并且符合表27中提供的一种或多种规则的变体AAV VP1衣壳多肽的581至589区域的序列。因此,本公开提供了由具有SEQ ID NO:2的工程化AAV5 VP1衣壳多肽组成的rAAV,其中Xaa1至Xaa9区域是SEQ ID NO:10118-SEQ ID NO:11117中的任一者,如表28中所公开。本文还涵盖由工程化AAV5 VP2衣壳多肽和工程化AAV5VP3衣壳多肽组成的rAAV,所述多肽在对应于AAV5 VP1 581至589区域中的氨基酸的AAV5VP2(氨基酸残基445至453)和AAV5 VP3(氨基酸残基389-397)中的区域处具有下文表中公开的序列。
表28
驱动结肠组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700004041
/>
Figure BDA0004113558700004051
/>
Figure BDA0004113558700004061
/>
Figure BDA0004113558700004071
/>
Figure BDA0004113558700004081
/>
Figure BDA0004113558700004091
/>
Figure BDA0004113558700004101
实施例15
在甲状腺中具有组织嗜性的AAV5变体
此实施例描述了使用实施例1一实施例2中描述的方法和系统发现的在甲状腺中具有组织嗜性的工程化AAV5变体。
分析CNS、肝脏、骨骼肌、心脏、肺、脾脏、淋巴结、骨髓、乳腺、皮肤、肾上腺、甲状腺、结肠、坐骨神经和脊髓组织以鉴定AAV5 VP1 581-589区域中驱动甲状腺嗜性的氨基酸残基。结果显示于图18L中,该图显示了相较于所有其他分析组织在甲状腺组织中AAV5 VP1的581至589区域中每个氨基酸的位置频率,其中衣壳多肽具有SEQ ID NO:2的序列。位置(“Xaan”,n=1-9)在x轴上表示并且氨基酸残基在y轴上表示。特定位置的特定氨基酸残基的频率在热图中作为强度表示。较深的方块表示特定氨基酸在特定位置的频率较高,较浅的方块表示特定氨基酸在特定位置的频率较低。
分析相对于给定氨基酸残基出现在所有其他所收获组织中鉴定的变体中的指定位置的频率而言该给定氨基酸残基出现在甲状腺中鉴定的变体中对应于SEQ ID NO:1(推及于SEQ ID NO:2)的位置581至位置589的所述指定位置的频率,以确定优先靶向甲状腺组织的衣壳的一组序列规则。参考下文表29,和SEQ ID NO:2(AAV5 VP1),以下氨基酸由此可以在Xaa1-Xaa9任何一个或多个位置处以任何组合独立地突变,以提供与野生型AAV5 VP1衣壳(SEQ ID NO:1)相比具有增强的甲状腺嗜性的VP1衣壳,其中甲状腺嗜性在此是指优选甲状腺转导的特性,而不是优选转导所有其他所收获组织的特性。
Figure BDA0004113558700004111
/>
Figure BDA0004113558700004121
下文表30提供了在甲状腺组织中发现并且符合表29中提供的一种或多种规则的变体AAV VP1衣壳多肽的581至589区域的序列。因此,本公开提供了由具有SEQ ID NO:2的工程化AAV5 VP1衣壳多肽组成的rAAV,其中Xaa1至Xaa9区域是SEQ ID NO:40438-SEQ IDNO:41437中的任一者,如表30中所公开。本文还涵盖由工程化AAV5 VP2衣壳多肽和工程化AAV5 VP3衣壳多肽组成的rAAV,所述多肽在对应于AAV5 VP1 58l至589区域中的氨基酸的AAV5VP2(氨基酸残基445至453)和AAV5 VP3(氨基酸残基389-397)中的区域处具有下文表中公开的序列。
表30
驱动甲状腺组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700004131
/>
Figure BDA0004113558700004141
/>
Figure BDA0004113558700004151
/>
Figure BDA0004113558700004161
/>
Figure BDA0004113558700004171
/>
Figure BDA0004113558700004181
实施例16
在淋巴结中具有组织嗜性的AAV5变体
此实施例描述了使用实施例1-实施例2中描述的方法和系统发现的在淋巴结中具有组织嗜性的工程化AAV5变体。
分析CNS、肝脏、骨骼肌、心脏、肺、脾脏、淋巴结、骨髓、乳腺、皮肤、肾上腺、甲状腺、结肠、坐骨神经和脊髓组织以鉴定AAV5 VP1 581-589区域中驱动淋巴结嗜性的氨基酸残基。结果显示于图18G中,该图显示了相较于所有其他分析组织在淋巴结组织中AAV5 VP1的581至589区域中每个氨基酸的位置频率,其中衣壳多肽具有SEQ ID NO:2的序列。位置(“Xaan”,n=1-9)在x轴上表示并且氨基酸残基在y轴上表示。特定位置的特定氨基酸残基的频率在热图中作为强度表示。较深的方块表示特定氨基酸在特定位置的频率较高,较浅的方块表示特定氨基酸在特定位置的频率较低。
分析相对于给定氨基酸残基出现在所有其他所收获组织中鉴定的变体中的指定位置的频率而言该给定氨基酸残基出现在淋巴结中鉴定的变体中对应于SEQ ID NO:1(推及于SEQ ID NO:2)的位置581至位置589的所述指定位置的频率,以确定优先靶向淋巴结组织的衣壳的一组序列规则。参考下文表31,和SEQ ID NO:2(AAV5 VP1),以下氨基酸由此可以在Xaa1-Xaa9任何一个或多个位置处以任何组合独立地突变,以提供与野生型AAV5 VP1衣壳(SEQ ID NO:1)相比具有增强的淋巴结嗜性的VP1衣壳,其中淋巴结嗜性在此是指优选淋巴结转导的特性,而不是优选转导所有其他所收获组织的特性。
Figure BDA0004113558700004191
/>
Figure BDA0004113558700004201
下文表32提供了在淋巴结组织中发现并且符合表31中提供的一种或多种规则的变体AAV VP1衣壳多肽的581至589区域的序列。因此,本公开提供了由具有SEQ ID NO:2的工程化AAV5 VP1衣壳多肽组成的rAAV,其中Xaa1至Xaa9区域是SEQ ID NO:19118-SEQ IDNO:20中的任一者,如表32中所公开。本文还涵盖由工程化AAV5 VP2衣壳多肽和工程化AAV5VP3衣壳多肽组成的rAAV,所述多肽在对应于AAV5 VP1 581至589区域中的氨基酸的AAV5VP2(氨基酸残基445至453)和AAV5 VP3(氨基酸残基389-397)中的区域处具有下文表中公开的序列。
表32
驱动淋巴结组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列3
Figure BDA0004113558700004211
/>
Figure BDA0004113558700004221
/>
Figure BDA0004113558700004231
/>
Figure BDA0004113558700004241
/>
Figure BDA0004113558700004251
/>
Figure BDA0004113558700004261
/>
Figure BDA0004113558700004271
实施例17
在皮肤中具有组织嗜性的AAV5变体
此实施例描述了使用实施例1-实施例2中描述的方法和系统发现的在皮肤中具有组织嗜性的工程化AAV5变体。
分析CNS、肝脏、骨骼肌、心脏、肺、脾脏、淋巴结、骨髓、乳腺、皮肤、肾上腺、甲状腺、结肠、坐骨神经和脊髓组织以鉴定AAV5VP1 581-589区域中驱动皮肤嗜性的氨基酸残基。结果显示于图18J中,该图显示了相较于所有其他分析组织在皮肤组织中AAV5 VP1的581至589区域中每个氨基酸的位置频率,其中衣壳多肽具有SEQ ID NO:2的序列。位置(“Xaan”,n=1-9)在x轴上表示并且氨基酸残基在y轴上表示。特定位置的特定氨基酸残基的频率在热图中作为强度表示。较深的方块表示特定氨基酸在特定位置的频率较高,较浅的方块表示特定氨基酸在特定位置的频率较低。
分析相对于给定氨基酸残基出现在所有其他所收获组织中鉴定的变体中的指定位置的频率而言该给定氨基酸残基出现在皮肤中鉴定的变体中对应于SEQ ID NO:1(推及于SEQ ID NO:2)的位置581至位置589的所述指定位置的频率,以确定优先靶向皮肤组织的衣壳的一组序列规则。参考下文表33,和SEQ ID NO:2(AAV5 VP1),以下氨基酸由此可以在Xaa1-Xaa9任何一个或多个位置处以任何组合独立地突变,以提供与野生型AAV5 VP1衣壳(SEQ ID NO:1)相比具有增强的皮肤嗜性的VP1衣壳,其中皮肤嗜性在此是指优选皮肤转导的特性,而不是优选转导所有其他所收获组织的特性。
Figure BDA0004113558700004281
Figure BDA0004113558700004291
下文表34提供了在皮肤组织中发现并且符合表33中提供的一种或多种规则的变体AAV VP1衣壳多肽的581至589区域的序列。因此,本公开提供了由具有SEQ ID NO:2的工程化AAV5 VP1衣壳多肽组成的rAAV,其中Xaa1至Xaa9区域是SEQ ID NO:31991-SEQ ID NO:32990中的任一者,如表34中所公开。本文还涵盖由工程化AAV5 VP2衣壳多肽和工程化AAV5VP3衣壳多肽组成的rAAV,所述多肽在对应于AAV5 VPl 58l至589区域中的氨基酸的AAV5VP2(氨基酸残基445至453)和AAV5 VP3(氨基酸残基389-397)中的区域处具有下文表中公开的序列。
表34
驱动皮肤组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700004301
/>
Figure BDA0004113558700004311
/>
Figure BDA0004113558700004321
/>
Figure BDA0004113558700004331
/>
Figure BDA0004113558700004341
/>
Figure BDA0004113558700004351
/>
Figure BDA0004113558700004361
实施例18
在骨髓中具有组织嗜性的AAV5变体
此实施例描述了使用实施例1-实施例2中描述的方法和系统发现的在骨髓中具有组织嗜性的工程化AAV5变体。
分析CNS、肝脏、骨骼肌、心脏、肺、脾脏、淋巴结、骨髓、乳腺、皮肤、肾上腺、甲状腺、结肠、坐骨神经和脊髓组织以鉴定AAV5VP1 581-589区域中驱动骨髓嗜性的氨基酸残基。结果显示于图18H中,该图显示了相较于所有其他分析组织在骨髓组织中AAV5 VP1的581至589区域中每个氨基酸的位置频率,其中衣壳多肽具有SEQ ID NO:2的序列。位置(“Xaan”,n=1-9)在x轴上表示并且氨基酸残基在y轴上表示。特定位置的特定氨基酸残基的频率在热图中作为强度表示。较深的方块表示特定氨基酸在特定位置的频率较高,较浅的方块表示特定氨基酸在特定位置的频率较低。
分析相对于给定氨基酸残基出现在所有其他所收获组织中鉴定的变体中的指定位置的频率而言该给定氨基酸残基出现在骨髓中鉴定的变体中对应于SEQ ID NO:1(推及于SEQ ID NO:2)的位置581至位置589的所述指定位置的频率,以确定优先靶向骨髓组织的衣壳的一组序列规则。参考下文表35,和SEQ ID NO:2(AAV5 VP1),以下氨基酸由此可以在Xaa1-Xaa9任何一个或多个位置处以任何组合独立地突变,以提供与野生型AAV5 VP1衣壳(SEQ ID NO:1)相比具有增强的骨髓嗜性的VP1衣壳,其中骨髓嗜性在此是指优选骨髓转导的特性,而不是优选转导所有其他所收获组织的特性。
Figure BDA0004113558700004371
下文表36提供了在骨髓组织中发现并且符合表35中提供的一种或多种规则的变体AAV VP1衣壳多肽的581至589区域的序列。因此,本公开提供了由具有SEQ ID NO:2的工程化AAV5 VP1衣壳多肽组成的rAAV,其中Xaa1至Xaa9区域是SEQ ID NO:4118-SEQ ID NO:5117中的任一者,如表36中所公开。本文还涵盖由工程化AAV5 VP2衣壳多肽和工程化AAV5VP3衣壳多肽组成的rAAV,所述多肽在对应于AAV5 VP1 581至589区域中的氨基酸的AAV5VP2(氨基酸残基445至453)和AAV5 VP3(氨基酸残基389-397)中的区域处具有下文表中公开的序列。
表36
驱动骨髓组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700004381
/>
Figure BDA0004113558700004391
/>
Figure BDA0004113558700004401
/>
Figure BDA0004113558700004411
/>
Figure BDA0004113558700004421
/>
Figure BDA0004113558700004431
/>
Figure BDA0004113558700004441
实施例19
如通过机器学习鉴定的在CNS中具有组织嗜性的AAV5变体
此实施例描述了如通过机器学习方法鉴定的展现CNS组织嗜性的工程化AAV5变体的优选特性。
首先,对来自CNS组织的测序数据进行生物信息学预处理。生物信息学预处理步骤的概述如下。首先,将原始NGS配对末端读数合并,进行质量过滤(>Q30avg)和基数校正(fastp)。接下来,去除<150nt的读段(读取长度)。使用变体区域5’和3’上恒定序列的模糊匹配来确保读段的准确对齐(对齐、模糊对齐)。去除带有终止密码子的读段(终止)。使用另外的相关过滤器选择变体用于后续分析(例如,“去重”-显示在给定样本中检测到的独特UMI-var对的数量)。最后,将经过滤的变体移动到本公开的机器学习管道中。图19A显示了NGS数据的生物信息学预处理的各个步骤的结果。显示了通过过滤器的48个单独样本的逐步读取计数。图19B显示了CNS/非CNS变体序列的位置比较。位置1-9是指AAV5 VP1(SEQ IDNO:2)的581-589位置。
考虑到实验设计,开发了另外的过滤器。首先,由于文库的设计使得单个氨基酸残基由单个密码子编码,因此每个变体氨基酸序列应由大致一个核苷酸序列表示。因此,给定核苷酸序列的测序读段的数量应与编码氨基酸序列的读段的数量大致匹配(给定核苷酸序列的测序读段与其编码的氨基酸序列的比率应约等于1)。因此,在一些情况下,消除了此比率<0.9的DNA变体。此外,由于在文库制备和测序过程中可能出现许多误差,因此在对测序读段进行去重后仅存在一次的DNA变体被消除。
最后,由于从组织中分离出的变体序列必须在文库制备过程中进行扩增,因此起始材料中变体核苷酸序列的丰度应与其扩增后的丰度成正比例。因此,与由于PCR或测序误差产生的变体序列相比,起始材料中的变体序列应显示更大的扩增。因此,比较去重前后核苷酸序列的测序读段比率产生了双峰分布,较高比率的组可能代表起始群体中的变体,而较低比率的变体组可能是由PCR/测序误差造成。因此,作为任选的严格过滤器,在一些实施方案中,去除了低比率组变体。
图20A显示了通过本文所述的方法分析的周围和CNS组织样本的实例。图20B显示了相较于非CNS变体从CNS回收的前1000个预测的/过滤的变体中的氨基酸位置丰度。机器学习过程的概述如下。经过滤的变体被二进制分类为对于靶组织存在(1)/不存在(0):在靶组织/非靶组织两者中都发现的变体(“共有”变体)被指定为不存在(0)。每个9aa变体序列表示为144个特征向量,每个位置由16个生物物理特性组成(下文表37)。将特征化变体输入到2个独立ML模型中:随机森林(RF)和基于直方图的梯度提升树(HGB)。训练和测试是通过交叉验证完成的,并且对组织存在/不存在的所有预测是在模型训练中未使用的保留数据上进行的(图22)。为每个训练样本分配权重以校正类别不平衡。通过两个模型之间的一致性来评估机器学习性能(图21A-图21B),并以两个模型的平均预测概率作为预测。输出排名靠前的预测变体。提取促成组织靶向性/去靶向性的重要特征(图23和图24A至图24C)作为沙普利加和解释(Shapley Additive Explanations,SHAP)值,表示个别特征对模型输出的贡献。
为了适应从组织回收的变体的潜在稀疏采样,我们通过变体序列的特征化将模型集中在生物物理特性上。在该实施方案中,表37中列出的生物物理特性用于为每个变体构建144个特征向量作为ML的输入。在表37中,氨基酸生物物理特征源自以下氨基酸特性。“电荷”是指氨基酸侧链作为酸或碱的静电性能,在中性pH的水性溶剂中具有正电荷或负电荷。“磷酸化”是指氨基酸残基的官能团是否可以具有作为翻译后修饰添加的磷酸基团。“离子键”是指氨基酸残基侧链参与静电相互作用的能力。“氢键(Hydrogen_bond)”是指氨基酸残基侧链参与氢键的能力,“氢键供体(hbond_donor)”是指在中性pH条件下可以将氢原子提供给氢键的氨基酸残基侧链原子的数目,而“氢键受体(h-bond_acceptor)”是指在中性pH条件下可以接受氢键中的供体氢原子的氨基酸残基侧链原子的数目,并且“总潜在氢键(total_potential_h_bond)”是指可以参与氢键的氨基酸残基侧链原子的数目。“摩尔质量(Mol_mass)”是氨基酸残基的预测分子量,单位为道尔顿。“体积”是指给定氨基酸残基在水溶液中的预测体积,改编自Zamyatnin,A.A.,Protein volume in solution,Prog.Biophys.Mol.Biol.,24:107-123(1972)。“亲疏水性”表示给定氨基酸残基侧链的疏水(排斥水)或亲水(吸引水)特性,并且这些值改编自Kyte,J.和Doolittle,R.F.,J.Mol.Biol.,157:105-132(1982)。“Goldman_engelman_steitz”是疏水性的一种特殊度量,因为它是指α螺旋中的氨基酸残基从非水性条件到水的自由能转移,并且个别氨基酸的值(kcal/残基)改编自Engelman,D.M.、Steitz,T.A.和Goldman A.,Annu.Rev.Biophys.Chem.,15:321-353(1986)。“柔性”是指多肽中氨基酸残基的对称/非对称分布,改编自Bhaskaran,R.&Ponnuswamy,P.R.,Int.J.Peptide and Protein Res.,32:4:241-255(1988)。“可突变性”是指给定氨基酸残基在进化间隔内发生变化的概率,并且是根据一个残基被另一个残基置换的相对频率来计算,在这种情况下,丙氨酸任意设置为“100”,如改编自Dayhoff,M.O.,Schwartz,R.M.,&Orcutt,B.C.Atlas of ProteinSequence and Structure,Vo1.5,增刊3(1978)。另见万维网上的参考资料,网址为:imgt.org/IMGTeducation/Aide-memoire/_UK/aminoacids/charge/and imgt.org/IMGTeducation/Aide-memoire/_UK/aminoacids/abbreviation.html#refs,其中每一者以引用方式整体并入本文。
表37-用于表征变体氨基酸的生物物理特性
Figure BDA0004113558700004471
/>
Figure BDA0004113558700004481
下文描述了AAV5 VP1衣壳多肽的581至589区域中各位置处的有利生物物理特性和有利氨基酸残基,它们与如通过机器学习预测的较高的CNS组织嗜性概率相关。表38中描述的任何以下机器学习衍生的位置氨基酸偏好可以单独存在或彼此组合存在或与实施例5,表9中观察和描述的任何氨基酸偏好组合存在。
Figure BDA0004113558700004491
下文表39提供了表现出CNS组织嗜性并且符合表38中提供的一种或多种规则的变体AAV VP1衣壳多肽的581至589区域的序列。因此,本公开提供了由具有SEQ ID NO:2的工程化AAV5 VP1衣壳多肽组成的rAAV,其中Xaa1至Xaa9区域是SEQ ID NO:8118一SEQ ID NO:9117中的任一者,如表39中所公开。本文还涵盖由工程化AAV5 VP2衣壳多肽和工程化AAV5VP3衣壳多肽组成的rAAV,所述多肽在对应于AAV5 VP1 581至589区域中的氨基酸的AAV5VP2(氨基酸残基445至453)和AAV5 VP3(氨基酸残基389-397)中的区域处具有下文表中公开的序列。
表39
驱动CNS组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700004501
/>
Figure BDA0004113558700004511
/>
Figure BDA0004113558700004521
/>
Figure BDA0004113558700004531
/>
Figure BDA0004113558700004541
/>
Figure BDA0004113558700004551
/>
Figure BDA0004113558700004561
实施例20
如通过机器学习鉴定的在肝脏中具有组织嗜性的工程化AAV5变体
此实施例描述了如通过机器学习方法鉴定的展现肝脏组织嗜性的工程化AAV5变体的优选特性。进行如实施例19和图19至图22中描述的相同生物信息学预处理、机器学习方法和分析以确定展现肝脏组织嗜性的工程化AAV5变体的优选特性。图25显示了一组对模型输出概率有贡献的前20个位置特征。沙普利加和解释(SHAP)值可用于询问特征对模型预测的相对贡献。如图26A至图26C所示,在组织靶向性和非靶向性变体之间进一步比较了这些特征。图26A至图26C显示了排名靠前的预测位置特征的比较。如果发现特征对HGB和RF模型都重要,则选择这些特征。显示了相较于随机2%肝脏变体,前1000个ML预测的肝脏变体中的特征的概述。
下文描述了AAV5 VP衣壳多肽的581至589区域中各位置处的有利生物物理特性和有利氨基酸残基,它们与较高的肝脏组织嗜性概率相关。表40中描述的任何以下机器学习衍生的位置氨基酸偏好可以单独存在或彼此组合存在或与实施例4,表6中观察和描述的任何氨基酸偏好组合存在。下文表40中列出了从两个ML模型(HGB和RF)中提取的前30个重要的肝脏嗜性特征之间共有的位置特征的概述。
Figure BDA0004113558700004571
/>
Figure BDA0004113558700004581
下文表41提供了表现出肝脏组织嗜性并且符合表40中提供的一种或多种规则的变体AAV VP1衣壳多肽的581至589区域的序列。因此,本公开提供了由具有SEQ ID NO:2的工程化AAV5 VP1衣壳多肽组成的rAAV,其中Xaa1至Xaa9区域是SEQ ID NO:44438-SEQ IDNO:45437中的任一者,如表41中所公开。本文还涵盖由工程化AAV5 VP2衣壳多肽和工程化AAV5 VP3衣壳多肽组成的rAAV,所述多肽在对应于AAV5 VP1 581至589区域中的氨基酸的AAV5VP2(氨基酸残基445至453)和AAV5 VP3(氨基酸残基389-397)中的区域处具有下文表中公开的序列。
表41
驱动肝脏组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700004591
/>
Figure BDA0004113558700004601
/>
Figure BDA0004113558700004611
/>
Figure BDA0004113558700004621
/>
Figure BDA0004113558700004631
/>
Figure BDA0004113558700004641
/>
Figure BDA0004113558700004651
实施例21
如通过机器学习鉴定的具有肝脏去靶向组织嗜性的AAV5变体
此实施例描述了如通过机器学习方法鉴定的展现肝脏去靶向组织嗜性的工程化AAV5变体的优选特性。进行如实施例19和图19至图22中描述的相同生物信息学预处理、机器学习方法和分析以确定展现肝脏去靶向组织嗜性的工程化AAV5变体的优选特性。图27显示了一组对模型输出概率有贡献的前20个位置特征。沙普利加和解释(SHAP)值可用于询问特征对模型预测的相对贡献。如图28A至图28B所示,在组织靶向性和非靶向性变体之间进一步比较了这些特征。图28A至图28B显示了排名靠前的预测位置特征的比较。如果发现特征对HGB和RF模型都重要,则选择这些特征。显示了相较于随机2%肝脏去靶向性变体,前1000个ML预测的肝脏去靶向性变体中的特征的概述。
下文描述了AAV5 VP1衣壳多肽的581至589区域中各位置处的有利生物物理特性和有利氨基酸残基,它们与较高的肝脏去靶向组织嗜性概率相关。任何以下机器学习衍生的位置氨基酸偏好描述于表42中。下文表42中列出了从两个ML模型(HGB和RF)中提取的前30个重要的肝脏嗜性特征之间共有的位置特征的概述。
Figure BDA0004113558700004661
下文表43提供了表现出肝脏去靶向组织嗜性并且符合表42中提供的一种或多种规则的变体AAV VP1衣壳多肽的581至589区域的序列。因此,本公开提供了由具有SEQ IDNO:2的工程化AAV5VP1衣壳多肽组成的rAAV,其中Xaa1至Xaa9区域是SEQ ID NO:46438-SEQID NO:47437中的任一者,如表43中所公开。本文还涵盖由工程化AAV5 VP2衣壳多肽和工程化AAV5 VP3衣壳多肽组成的rAAV,所述多肽在对应于AAV5 VP1 581至589区域中的氨基酸的AAV5 VP2(氨基酸残基445至453)和AAV5 VP3(氨基酸残基389-397)中的区域处具有下文表中公开的序列。
表43
驱动肝脏去靶向组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700004671
/>
Figure BDA0004113558700004681
/>
Figure BDA0004113558700004691
/>
Figure BDA0004113558700004701
/>
Figure BDA0004113558700004711
/>
Figure BDA0004113558700004721
/>
Figure BDA0004113558700004731
实施例22
如通过机器学习鉴定的具有骨骼肌或心肌组织嗜性的AAV5变体
此实施例描述了如通过机器学习方法鉴定的展现骨骼肌组织嗜性或心肌组织嗜性的工程化AAV5变体的优选特性。进行如实施例19和图19至图22中描述的相同生物信息学预处理、机器学习方法和分析以确定展现骨骼肌组织嗜性或心肌组织嗜性的工程化AAV5变体的优选特性。图29显示了一组对模型输出概率有贡献的前20个位置特征。沙普利加和解释(SHAP)值可用于询问特征对模型预测的相对贡献。如图30A至图30B所示,在组织靶向性和非靶向性变体之间进一步比较了这些特征。图30A至图30B显示了排名靠前的预测位置特征的比较。如果发现特征对HGB和RF模型都重要,则选择这些特征。显示了相较于随机2%肌肉变体,前1000个ML预测的骨骼肌或心肌变体中的特征的概述。
下文描述了AAV5 VP1衣壳多肽的581至589区域中各位置处的有利生物物理特性和有利氨基酸残基,它们与较高的骨骼肌组织嗜性或心肌组织嗜性概率相关。任何以下机器学习衍生的位置氨基酸偏好描述于表44中。下文表44中列出了从两个ML模型(HGB和RF)中提取的前30个重要的骨骼肌组织嗜性或心肌组织嗜性特征之间共有的位置特征的概述。
Figure BDA0004113558700004741
下文表45提供了表现出骨骼组织嗜性或肌肉组织嗜性并且符合表44中提供的一种或多种规则的变体AAV VP1衣壳多肽的581至589区域的序列。因此,本公开提供了由具有SEQ ID NO:2的工程化AAV5 VP1衣壳多肽组成的rAAV,其中Xaa1至Xaa9区域是SEQ ID NO:25118-SEQ ID NO:26117中的任一者,如表45中所公开。本文还涵盖由工程化AAV5 VP2衣壳多肽和工程化AAV5 VP3衣壳多肽组成的rAAV,所述多肽在对应于AAV5 VP1 581至589区域中的氨基酸的AAV5 VP2(氨基酸残基445至453)和AAV5 VP3(氨基酸残基389-397)中的区域处具有下文表中公开的序列。
表45
驱动骨骼组织嗜性或肌肉组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700004751
/>
Figure BDA0004113558700004761
/>
Figure BDA0004113558700004771
/>
Figure BDA0004113558700004781
/>
Figure BDA0004113558700004791
/>
Figure BDA0004113558700004801
/>
Figure BDA0004113558700004811
实施例23
用衣壳包裹治疗性有效载荷的AAV5源性病毒体治疗神经系统疾病或疾患
此实施例描述了用具有本文公开的任何一种工程化CNS嗜性变体AAV5 VP衣壳多肽的变体AAV5源性病毒体治疗神经系统疾病或疾患,其中变体AAV5病毒体衣壳包裹治疗性有效载荷。将编码AAV Rep、AAV5源性变体Cap和辅助蛋白的多核苷酸序列以及治疗性有效载荷在细胞中转染以产生变体AAV5病毒体,其中编码变体AAV5Cap的多核苷酸序列在从对应于VP1衣壳多肽中的581的位置至对应于589的位置的区域中包含至少一个突变,并且其中编码变体AAV5Cap的多核苷酸序列编码SEQ ID NO:7118-SEQ ID NO:10117中任一者的氨基酸序列。治疗性有效载荷是靶向由与神经系统疾病或疾患有关的基因编码的mRNA的指导RNA,或转基因。将衣壳包裹有效载荷的变体AAV5病毒体施用于受试者。受试者是人类或非人类动物。施用途径是全身施用途径。全身施用途径是静脉内施用。与衣壳包裹治疗性有效载荷的野生型AAV5病毒体相比,衣壳包裹治疗性有效载荷的变体AAV5病毒体在施用于受试者后表现出增强的CNS组织嗜性。在施用于受试者时,与衣壳包裹治疗性有效载荷的野生型AAV5病毒体相比,施用较低剂量的衣壳包裹治疗性有效载荷的变体AAV5病毒体。在施用于受试者后,神经系统疾病或疾患的至少一种症状得到缓解或受试者得到治愈。
实施例24
用衣壳包裹治疗性有效载荷的AAV5源性病毒体治疗阿尔茨海默氏病
此实施例描述了用具有本文公开的任何一种工程化CNS嗜性变体AAV5 VP衣壳多肽的变体AAV5源性病毒体治疗阿尔茨海默氏病,其中变体AAV5病毒体衣壳包裹治疗性有效载荷。将编码AAV Rep、AAV5源性变体Cap和辅助蛋白的多核苷酸序列以及治疗性有效载荷在细胞中转染以产生变体AAV5病毒体,其中编码变体AAV5Cap的多核苷酸序列在从对应于VP1衣壳多肽中的581的位置至对应于589的位置的区域中包含至少一个突变,并且其中编码变体AAV5Cap的多核苷酸序列编码SEQ ID NO:7118-SEQ ID NO:10117中任一者的氨基酸序列。每个这种变体都对所有非CNS组织去靶向,包括对心脏组织去靶向。治疗性有效载荷是靶向由与阿尔茨海默氏病有关的基因编码的mRNA的指导RNA,或转基因。指导RNA所靶向的mRNA是由编码淀粉样前体蛋白(APP)、α-突触核蛋白(SNCA)、Tau蛋白(MAPT)或载脂蛋白E(ApoE)的基因编码的mRNA。转基因是编码淀粉样前体蛋白(APP)、α-突触核蛋白(SNCA)、Tau蛋白(MAPT)或载脂蛋白E(ApoE)的基因。将衣壳包裹有效载荷的变体AAV5病毒体施用于受试者。受试者是人类或非人类动物。施用途径是全身施用途径。全身施用途径是静脉内施用。与衣壳包裹治疗性有效载荷的野生型AAV5病毒体相比,衣壳包裹治疗性有效载荷的变体AAV5病毒体在施用于受试者后表现出增强的CNS组织嗜性。在施用于受试者时,与衣壳包裹治疗性有效载荷的野生型AAV5病毒体相比,施用较低剂量的衣壳包裹治疗性有效载荷的变体AAV5病毒体。在施用于受试者后,阿尔茨海默氏病的至少一种症状得到缓解或受试者得到治愈。
实施例25
用衣壳包裹治疗性有效载荷的AAV5源性病毒体治疗帕金森氏病
此实施例描述了用具有本文公开的任何一种工程化CNS嗜性变体AAV5 VP衣壳多肽的变体AAV5源性病毒体治疗帕金森氏病,其中变体AAV5病毒体衣壳包裹治疗性有效载荷。将编码AAV Rep、AAV5源性变体Cap和辅助蛋白的多核苷酸序列以及治疗性有效载荷在细胞中转染以产生变体AAV5病毒体,其中编码变体AAV5Cap的多核苷酸序列在从对应于VP1衣壳多肽中的581的位置至对应于589的位置的区域中包含至少一个突变,并且其中编码变体AAV5Cap的多核苷酸序列编码SEQ ID NO:7118-SEQ ID NO:10117中任一者的氨基酸序列。治疗性有效载荷是靶向由与帕金森氏病有关的基因编码的mRNA的指导RNA,或转基因。指导RNA所靶向的mRNA是由编码富亮氨酸重复激酶2(LRRK2)的基因编码的mRNA。转基因是LRRK2;GBAl;GBA1+α-突触核蛋白;AADC;GDNF;神经秩蛋白;GAD;NTN;hFOXG1;hKCNQ2;hFMR1;抗Tau/miRNA;EPM2A或EPM2B。将衣壳包裹有效载荷的变体AAV5病毒体施用于受试者。受试者是人类或非人类动物。施用途径是全身施用途径。全身施用途径是静脉内施用。与衣壳包裹治疗性有效载荷的野生型AAV5病毒体相比,衣壳包裹治疗性有效载荷的变体AAV5病毒体在施用于受试者后表现出增强的CNS组织嗜性。在施用于受试者时,与衣壳包裹治疗性有效载荷的野生型AAV5病毒体相比,施用较低剂量的衣壳包裹治疗性有效载荷的变体AAV5病毒体。在施用于受试者后,帕金森氏病的至少一种症状得到缓解或受试者得到治愈。
实施例26
用衣壳包裹治疗性有效载荷的AAV5源性病毒体治疗Tau蛋白病
此实施例描述了用具有本文公开的任何一种工程化CNS嗜性变体AAV5 VP衣壳多肽的变体AAV5源性病毒体治疗Tau蛋白病,其中变体AAV5病毒体衣壳包裹治疗性有效载荷。将编码AAV Rep、AAV5源性变体Cap和辅助蛋白的多核苷酸序列以及治疗性有效载荷在细胞中转染以产生变体AAV5病毒体,其中编码变体AAV5Cap的多核苷酸序列在从对应于VP1衣壳多肽中的581的位置至对应于589的位置的区域中包含至少一个突变,并且其中编码变体AAV5Cap的多核苷酸序列编码SEQ ID NO:7118-SEQ ID NO:10117中任一者的氨基酸序列。治疗性有效载荷是靶向由与Tau蛋白病有关的基因编码的mRNA的指导RNA,或转基因。指导RNA所靶向的mRNA是由编码Tau蛋白的基因(MAPT)编码的mRNA。转基因是MAPT。将衣壳包裹有效载荷的变体AAV5病毒体施用于受试者。受试者是人类或非人类动物。施用途径是全身施用途径。全身施用途径是静脉内施用。与衣壳包裹治疗性有效载荷的野生型AAV5病毒体相比,衣壳包裹治疗性有效载荷的变体AAV5病毒体在施用于受试者后表现出增强的CNS组织嗜性。在施用于受试者时,与衣壳包裹治疗性有效载荷的野生型AAV5病毒体相比,施用较低剂量的衣壳包裹治疗性有效载荷的变体AAV5病毒体。在施用于受试者后,Tau蛋白病的至少一种症状得到缓解或受试者得到治愈。
实施例27
用衣壳包裹治疗性有效载荷的AAV5源性病毒体治疗α-1抗胰蛋白酶缺乏症(AATD)
此实施例描述了用具有本文公开的任何一种工程化CNS嗜性变体AAV5 VP衣壳多肽的变体AAV5源性病毒体治疗AATD,其中变体AAV5病毒体衣壳包裹治疗性有效载荷。将编码AAV Rep、AAV5源性变体Cap和辅助蛋白的多核苷酸序列以及治疗性有效载荷在细胞中转染以产生变体AAV5病毒体,其中编码变体AAV5Cap的多核苷酸序列在从对应于VP1衣壳多肽中的581的位置至对应于589的位置的区域中包含至少一个突变,并且其中编码变体AAV5Cap的多核苷酸序列编码SEQ ID NO:43438-SEQ ID NO:46437中任一者的氨基酸序列。治疗性有效载荷是靶向由与AATD有关的基因编码的mRNA的指导RNA,或转基因。指导RNA所靶向的mRNA是由编码SERPINA1的基因编码的mRNA。转基因是SERPINA1。将衣壳包裹有效载荷的变体AAV5病毒体施用于受试者。受试者是人类或非人类动物。施用途径是全身施用途径。全身施用途径是静脉内施用。与衣壳包裹治疗性有效载荷的野生型AAV5病毒体相比,衣壳包裹治疗性有效载荷的变体AAV5病毒体在施用于受试者后表现出增强的CNS组织嗜性。在施用于受试者时,与衣壳包裹治疗性有效载荷的野生型AAV5病毒体相比,施用较低剂量的衣壳包裹治疗性有效载荷的变体AAV5病毒体。在施用于受试者后,AATD的至少一种症状得到缓解或受试者得到治愈。
实施例28
用衣壳包裹治疗性有效载荷的AAV5源性病毒体治疗囊性纤维化
此实施例描述了用具有本文公开的任何一种工程化CNS嗜性变体AAV5 VP衣壳多肽的变体AAV5源性病毒体治疗囊性纤维化,其中变体AAV5病毒体衣壳包裹治疗性有效载荷。将编码AAV Rep、AAV5源性变体Cap和辅助蛋白的多核苷酸序列以及治疗性有效载荷在细胞中转染以产生变体AAV5病毒体,其中编码变体AAV5 Cap的多核苷酸序列在从对应于VP1衣壳多肽中的581的位置至对应于589的位置的区域中包含至少一个突变,并且其中编码变体AAV5 Cap的多核苷酸序列编码SEQ ID NO:16118-SEQ ID NO:19117中任一者的氨基酸序列。治疗性有效载荷是靶向由与囊性纤维化有关的基因编码的mRNA的指导RNA,或转基因。指导RNA所靶向的mRNA是由编码CFTR的基因编码的mRNA。转基因是CFTR。将衣壳包裹有效载荷的变体AAV5病毒体施用于受试者。受试者是人类或非人类动物。施用途径是全身施用途径。全身施用途径是静脉内施用。与衣壳包裹治疗性有效载荷的野生型AAV5病毒体相比,衣壳包裹治疗性有效载荷的变体AAV5病毒体在施用于受试者后表现出增强的CNS组织嗜性。在施用于受试者时,与衣壳包裹治疗性有效载荷的野生型AAV5病毒体相比,施用较低剂量的衣壳包裹治疗性有效载荷的变体AAV5病毒体。在施用于受试者后,囊性纤维化的至少一种症状得到缓解或受试者得到治愈。
实施例29
用衣壳包裹治疗性有效载荷的AAV5源性病毒体治疗杜兴氏肌营养不良
此实施例描述了用具有本文公开的任何一种工程化CNS嗜性变体AAV5 VP衣壳多肽的变体AAV5源性病毒体治疗杜兴氏肌营养不良,其中变体AAV5病毒体衣壳包裹治疗性有效载荷。将编码AAV Rep、AAV5源性变体Cap和辅助蛋白的多核苷酸序列以及治疗性有效载荷在细胞中转染以产生变体AAV5病毒体,其中编码变体AAV5Cap的多核苷酸序列在从对应于VP1衣壳多肽中的581的位置至对应于589的位置的区域中包含至少一个突变,并且其中编码变体AAV5Cap的多核苷酸序列编码SEQ ID NO:25118-SEQ ID NO:26117、SEQ ID NO:28991-SEQ ID NO:31990或SEQ ID NO:13118-SEQ ID NO:16117中任一者的氨基酸序列。治疗性有效载荷是靶向由与杜兴氏肌营养不良有关的基因编码的mRNA的指导RNA,或转基因。指导RNA所靶向的mRNA是由编码DMD的基因编码的mRNA。转基因是DMD。将衣壳包裹有效载荷的变体AAV5病毒体施用于受试者。受试者是人类或非人类动物。施用途径是全身施用途径。全身施用途径是静脉内施用。与衣壳包裹治疗性有效载荷的野生型AAV5病毒体相比,衣壳包裹治疗性有效载荷的变体AAV5病毒体在施用于受试者后表现出增强的CNS组织嗜性。在施用于受试者时,与衣壳包裹治疗性有效载荷的野生型AAV5病毒体相比,施用较低剂量的衣壳包裹治疗性有效载荷的变体AAV5病毒体。在施用于受试者后,杜兴氏肌营养不良的至少一种症状得到缓解或受试者得到治愈。
实施例30
用衣壳包裹治疗性有效载荷的AAV5源性病毒体治疗额颞叶痴呆
此实施例描述了用具有本文公开的任何一种工程化CNS嗜性变体AAV5 VP衣壳多肽的变体AAV5源性病毒体治疗额颞叶痴呆(FTD),其中变体AAV5病毒体衣壳包裹治疗性有效载荷。将编码AAV Rep、AAV5源性变体Cap和辅助蛋白的多核苷酸序列以及治疗性有效载荷在细胞中转染以产生变体AAV5病毒体,其中编码变体AAV5 Cap的多核苷酸序列在从对应于VP1衣壳多肽中的581的位置至对应于589的位置的区域中包含至少一个突变,并且其中编码变体AAV5Cap的多核苷酸序列编码SEQ ID NO:7118-SEQ ID NO:10117中任一者的氨基酸序列。治疗性有效载荷是靶向由与FTD有关的基因编码的mRNA的指导RNA,或转基因。指导RNA所靶向的mRNA是由编码颗粒蛋白前体的基因编码的mRNA。转基因是颗粒蛋白前体。将衣壳包裹有效载荷的变体AAV5病毒体施用于受试者。受试者是人类或非人类动物。施用途径是全身施用途径。全身施用途径是静脉内施用。与衣壳包裹治疗性有效载荷的野生型AAV5病毒体相比,衣壳包裹治疗性有效载荷的变体AAV5病毒体在施用于受试者后表现出增强的CNS组织嗜性。在施用于受试者时,与衣壳包裹治疗性有效载荷的野生型AAV5病毒体相比,施用较低剂量的衣壳包裹治疗性有效载荷的变体AAV5病毒体。在施用于受试者后,FTD的至少一种症状得到缓解或受试者得到治愈。
实施例31
如通过机器学习鉴定的具有肾上腺组织嗜性的AAV5变体
此实施例描述了如通过机器学习方法鉴定的展现肾上腺组织嗜性的工程化AAV5变体的优选特性。进行如实施例19和图19至图22中描述的相同生物信息学预处理、机器学习方法和分析以确定展现肾上腺组织嗜性的工程化AAV5变体的优选特性。
下文描述了AAV5 VP衣壳多肽的581至589区域中各位置处的有利生物物理特性和有利氨基酸残基,它们与较高的肾上腺组织嗜性概率相关。表46中描述的任何以下机器学习衍生的位置氨基酸偏好可以单独存在或彼此组合存在或与实施例7,表13中观察和描述的任何氨基酸偏好组合存在。下文表46中列出了从ML模型中提取的排名靠前的重要肾上腺嗜性特征之间共有的位置特征的概述。
Figure BDA0004113558700004881
/>
Figure BDA0004113558700004891
下文表47提供了表现出肾上腺组织嗜性并且符合表46中提供的一种或多种规则的变体AAV VP1衣壳多肽的581至589区域的序列。因此,本公开提供了由具有SEQ ID NO:2的工程化AAV5 VP1衣壳多肽组成的rAAV,其中Xaa1至Xaa9区域是SEQ ID NO:2118-SEQ IDNO:3117中的任一者,如表47中所公开。本文还涵盖由工程化AAV5 VP2衣壳多肽和工程化AAV5 VP3衣壳多肽组成的rAAV,所述多肽在对应于AAV5 VP1 581至589区域中的氨基酸的AAV5VP2(氨基酸残基445至453)和AAV5 VP3(氨基酸残基389-397)中的区域处具有下文表中公开的序列。
表47
驱动肾上腺组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700004901
/>
Figure BDA0004113558700004911
/>
Figure BDA0004113558700004921
/>
Figure BDA0004113558700004931
/>
Figure BDA0004113558700004941
/>
Figure BDA0004113558700004951
/>
Figure BDA0004113558700004961
实施例32
如通过机器学习鉴定的具有骨髓组织嗜性的AAV5变体
此实施例描述了如通过机器学习方法鉴定的展现骨髓组织嗜性的工程化AAV5变体的优选特性。进行如实施例19和图19至图22中描述的相同生物信息学预处理、机器学习方法和分析以确定展现骨髓组织嗜性的工程化AAV5变体的优选特性。
下文描述了AAV5 VP衣壳多肽的581至589区域中各位置处的有利生物物理特性和有利氨基酸残基,它们与较高的骨髓组织嗜性概率相关。表48中描述的任何以下机器学习衍生的位置氨基酸偏好可以单独存在或彼此组合存在或与实施例18,表35中观察和描述的任何氨基酸偏好组合存在。下文表48中列出了从ML模型中提取的排名靠前的重要骨髓嗜性特征之间共有的位置特征的概述。
Figure BDA0004113558700004971
/>
Figure BDA0004113558700004981
/>
Figure BDA0004113558700004991
下文表49提供了表现出骨髓组织嗜性并且符合表48中提供的一种或多种规则的变体AAV VP1衣壳多肽的581至589区域的序列。因此,本公开提供了由具有SEQ ID NO:2的工程化AAV5 VP1衣壳多肽组成的rAAV,其中Xaa1至Xaa9区域是SEQ ID NO:5118-SEQ IDNO:6117中的任一者,如表49中所公开。本文还涵盖由工程化AAV5 VP2衣壳多肽和工程化AAV5 VP3衣壳多肽组成的rAAV,所述多肽在对应于AAV5 VP1 581至589区域中的氨基酸的AAV5VP2(氨基酸残基445至453)和AAV5 VP3(氨基酸残基389-397)中的区域处具有下文表中公开的序列。
表49
驱动骨髓组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700005001
/>
Figure BDA0004113558700005011
/>
Figure BDA0004113558700005021
/>
Figure BDA0004113558700005031
/>
Figure BDA0004113558700005041
/>
Figure BDA0004113558700005051
/>
Figure BDA0004113558700005061
实施例33
如通过机器学习鉴定的具有结肠组织嗜性的AAV5变体
此实施例描述了如通过机器学习方法鉴定的展现结肠组织嗜性的工程化AAV5变体的优选特性。进行如实施例19和图19至图22中描述的相同生物信息学预处理、机器学习方法和分析以确定展现结肠组织嗜性的工程化AAV5变体的优选特性。
下文描述了AAV5 VP衣壳多肽的581至589区域中各位置处的有利生物物理特性和有利氨基酸残基,它们与较高的结肠组织嗜性概率相关。表50中描述的任何以下机器学习衍生的位置氨基酸偏好可以单独存在或彼此组合存在或与实施例14,表27中观察和描述的任何氨基酸偏好组合存在。下文表50中列出了从ML模型中提取的排名靠前的重要结肠嗜性特征之间共有的位置特征的概述。
Figure BDA0004113558700005062
/>
Figure BDA0004113558700005071
下文表51提供了表现出结肠组织嗜性并且符合表50中提供的一种或多种规则的变体AAV VP1衣壳多肽的581至589区域的序列。因此,本公开提供了由具有SEQ ID NO:2的工程化AAV5 VP1衣壳多肽组成的rAAV,其中Xaa1至Xaa9区域是SEQ ID NO:11118-SEQ IDNO:12117中的任一者,如表51中所公开。本文还涵盖由工程化AAV5 VP2衣壳多肽和工程化AAV5 VP3衣壳多肽组成的rAAV,所述多肽在对应于AAV5 VP1 581至589区域中的氨基酸的AAV5VP2(氨基酸残基445至453)和AAV5 VP3(氨基酸残基389-397)中的区域处具有下文表中公开的序列。
表51
驱动结肠组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700005081
/>
Figure BDA0004113558700005091
/>
Figure BDA0004113558700005101
/>
Figure BDA0004113558700005111
/>
Figure BDA0004113558700005121
/>
Figure BDA0004113558700005131
/>
Figure BDA0004113558700005141
实施例34
如通过机器学习鉴定的具有心脏组织嗜性的AAV5变体
此实施例描述了如通过机器学习方法鉴定的展现心脏组织嗜性的工程化AAV5变体的优选特性。进行如实施例19和图19至图22中描述的相同生物信息学预处理、机器学习方法和分析以确定展现心脏组织嗜性的工程化AAV5变体的优选特性。
下文描述了AAV5 VP衣壳多肽的581至589区域中各位置处的有利生物物理特性和有利氨基酸残基,它们与较高的心脏组织嗜性概率相关。表52中描述的任何以下机器学习衍生的位置氨基酸偏好可以单独存在或彼此组合存在或与实施例13,表25中观察和描述的任何氨基酸偏好组合存在。下文表52中列出了从ML模型中提取的排名靠前的重要心脏嗜性特征之间共有的位置特征的概述。
Figure BDA0004113558700005151
/>
Figure BDA0004113558700005161
下文表53提供了表现出心脏组织嗜性并且符合表52中提供的一种或多种规则的变体AAV VP1衣壳多肽的581至589区域的序列。因此,本公开提供了由具有SEQ ID NO:2的工程化AAV5 VP1衣壳多肽组成的rAAV,其中Xaa1至Xaa9区域是SEQ ID NO:14118-SEQ IDNO:15117中的任一者,如表53中所公开。本文还涵盖由工程化AAV5 VP2衣壳多肽和工程化AAV5 VP3衣壳多肽组成的rAAV,所述多肽在对应于AAV5 VP1 581至589区域中的氨基酸的AAV5VP2(氨基酸残基445至453)和AAV5 VP3(氨基酸残基389-397)中的区域处具有下文表中公开的序列。
表53
驱动心脏组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700005171
/>
Figure BDA0004113558700005181
/>
Figure BDA0004113558700005191
/>
Figure BDA0004113558700005201
/>
Figure BDA0004113558700005211
/>
Figure BDA0004113558700005221
/>
Figure BDA0004113558700005231
实施例35
如通过机器学习鉴定的具有淋巴结组织嗜性的AAV5变体
此实施例描述了如通过机器学习方法鉴定的展现淋巴结组织嗜性的工程化AAV5变体的优选特性。进行如实施例19和图19至图22中描述的相同生物信息学预处理、机器学习方法和分析以确定展现淋巴结组织嗜性的工程化AAV5变体的优选特性。
下文描述了AAV5 VP衣壳多肽的581至589区域中各位置处的有利生物物理特性和有利氨基酸残基,它们与较高的淋巴结组织嗜性概率相关。表54中描述的任何以下机器学习衍生的位置氨基酸偏好可以单独存在或彼此组合存在或与实施例16,表31中观察和描述的任何氨基酸偏好组合存在。下文表54中列出了从ML模型中提取的排名靠前的重要淋巴结嗜性特征之间共有的位置特征的概述。
Figure BDA0004113558700005241
/>
Figure BDA0004113558700005251
下文表55提供了表现出淋巴结组织嗜性并且符合表54中提供的一种或多种规则的变体AAV VP1衣壳多肽的581至589区域的序列。因此,本公开提供了由具有SEQ ID NO:2的工程化AAV5 VP1衣壳多肽组成的rAAV,其中Xaa1至Xaa9区域是SEQ ID NO:20118-SEQ IDNO:21117中的任一者,如表55中所公开。本文还涵盖由工程化AAV5 VP2衣壳多肽和工程化AAV5 VP3衣壳多肽组成的rAAV,所述多肽在对应于AAV5 VP1 581至589区域中的氨基酸的AAV5VP2(氨基酸残基445至453)和AAV5 VP3(氨基酸残基389-397)中的区域处具有下文表中公开的序列。
表55
驱动淋巴结组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700005261
/>
Figure BDA0004113558700005271
/>
Figure BDA0004113558700005281
/>
Figure BDA0004113558700005291
/>
Figure BDA0004113558700005301
/>
Figure BDA0004113558700005311
/>
Figure BDA0004113558700005321
实施例36
如通过机器学习鉴定的具有乳腺组织嗜性的AAV5变体
此实施例描述了如通过机器学习方法鉴定的展现乳腺组织嗜性的工程化AAV5变体的优选特性。进行如实施例19和图19至图22中描述的相同生物信息学预处理、机器学习方法和分析以确定展现乳腺组织嗜性的工程化AAV5变体的优选特性。
下文描述了AAV5 VP衣壳多肽的581至589区域中各位置处的有利生物物理特性和有利氨基酸残基,它们与较高的乳腺组织嗜性概率相关。表56中描述的任何以下机器学习衍生的位置氨基酸偏好可以单独存在或彼此组合存在或与实施例11,表21中观察和描述的任何氨基酸偏好组合存在。下文表56中列出了从ML模型中提取的排名靠前的重要乳腺嗜性特征之间共有的位置特征的概述。
Figure BDA0004113558700005322
/>
Figure BDA0004113558700005331
下文表57提供了表现出乳腺组织嗜性并且符合表56中提供的一种或多种规则的变体AAV VP1衣壳多肽的581至589区域的序列。因此,本公开提供了由具有SEQ ID NO:2的工程化AAV5 VP1衣壳多肽组成的rAAV,其中Xaa1至Xaa9区域是SEQ ID NO:23118-SEQ IDNO:24117中的任一者,如表57中所公开。本文还涵盖由工程化AAV5 VP2衣壳多肽和工程化AAV5 VP3衣壳多肽组成的rAAV,所述多肽在对应于AAV5 VP1 581至589区域中的氨基酸的AAV5 VP2(氨基酸残基445至453)和AAV5 VP3(氨基酸残基389-397)中的区域处具有下文表中公开的序列。
表57
驱动乳腺组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700005341
/>
Figure BDA0004113558700005351
/>
Figure BDA0004113558700005361
/>
Figure BDA0004113558700005371
/>
Figure BDA0004113558700005381
/>
Figure BDA0004113558700005391
/>
Figure BDA0004113558700005401
实施例37
如通过机器学习鉴定的具有肺组织嗜性的AAV5变体
此实施例描述了如通过机器学习方法鉴定的展现肺组织嗜性的工程化AAV5变体的优选特性。进行如实施例19和图19至图22中描述的相同生物信息学预处理、机器学习方法和分析以确定展现肺组织嗜性的工程化AAV5变体的优选特性。
下文描述了AAV5 VP衣壳多肽的581至589区域中各位置处的有利生物物理特性和有利氨基酸残基,它们与较高的肺组织嗜性概率相关。表58中描述的任何以下机器学习衍生的位置氨基酸偏好可以单独存在或彼此组合存在或与实施例12,表23中观察和描述的任何氨基酸偏好组合存在。下文表58中列出了从ML模型中提取的排名靠前的重要肺嗜性特征之间共有的位置特征的概述。
Figure BDA0004113558700005411
/>
Figure BDA0004113558700005421
下文表59提供了表现出肺组织嗜性并且符合表58中提供的一种或多种规则的变体AAV VP1衣壳多肽的581至589区域的序列。因此,本公开提供了由具有SEQ ID NO:2的工程化AAV5 VP1衣壳多肽组成的rAAV,其中Xaa1至Xaa9区域是SEQ ID NO:17118-SEQ ID NO:1 8117中的任一者,如表59中所公开。本文还涵盖由工程化AAV5 VP2衣壳多肽和工程化AAV5 VP3衣壳多肽组成的rAAV,所述多肽在对应于AAV5 VP1 581至589区域中的氨基酸的AAV5 VP2(氨基酸残基445至453)和AAV5 VP3(氨基酸残基389-397)中的区域处具有下文表中公开的序列。
表59
驱动肺组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700005431
/>
Figure BDA0004113558700005441
/>
Figure BDA0004113558700005451
/>
Figure BDA0004113558700005461
/>
Figure BDA0004113558700005471
/>
Figure BDA0004113558700005481
/>
Figure BDA0004113558700005491
实施例38
如通过机器学习鉴定的具有坐骨神经组织嗜性的AAV5变体
此实施例描述了如通过机器学习方法鉴定的展现坐骨神经组织嗜性的工程化AAV5变体的优选特性。进行如实施例19和图19至图22中描述的相同生物信息学预处理、机器学习方法和分析以确定展现坐骨神经组织嗜性的工程化AAV5变体的优选特性。
下文描述了AAV5 VP衣壳多肽的581至589区域中各位置处的有利生物物理特性和有利氨基酸残基,它们与较高的坐骨神经组织嗜性概率相关。表60中描述的任何以下机器学习衍生的位置氨基酸偏好可以单独存在或彼此组合存在或与实施例8,表15中观察和描述的任何氨基酸偏好组合存在。下文表60中列出了从ML模型中提取的排名靠前的重要坐骨神经嗜性特征之间共有的位置特征的概述。
Figure BDA0004113558700005501
/>
Figure BDA0004113558700005511
下文表61提供了表现出坐骨神经组织嗜性并且符合表60中提供的一种或多种规则的变体AAV VP1衣壳多肽的581至589区域的序列。因此,本公开提供了由具有SEQ ID NO:2的工程化AAV5 VP1衣壳多肽组成的rAAV,其中Xaa1至Xaa9区域是SEQ ID NO:26991-SEQID NO:27990中的任一者,如表61中所公开。本文还涵盖由工程化AAV5 VP2衣壳多肽和工程化AAV5 VP3衣壳多肽组成的rAAV,所述多肽在对应于AAV5 VP1 581至589区域中的氨基酸的AAV5VP2(氨基酸残基445至453)和AAV5 VP3(氨基酸残基389-397)中的区域处具有下文表中公开的序列。
表61
驱动坐骨神经组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700005521
/>
Figure BDA0004113558700005531
/>
Figure BDA0004113558700005541
/>
Figure BDA0004113558700005551
/>
Figure BDA0004113558700005561
/>
Figure BDA0004113558700005571
/>
Figure BDA0004113558700005581
实施例39
如通过机器学习鉴定的具有骨骼肌组织嗜性的AAV5变体
此实施例描述了如通过机器学习方法鉴定的展现骨骼肌组织嗜性的工程化AAV5变体的优选特性。进行如实施例19和图19至图22中描述的相同生物信息学预处理、机器学习方法和分析以确定展现骨骼肌组织嗜性的工程化AAV5变体的优选特性。
下文描述了AAV5 VP衣壳多肽的581至589区域中各位置处的有利生物物理特性和有利氨基酸残基,它们与较高的骨骼肌组织嗜性概率相关。表62中描述的任何以下机器学习衍生的位置氨基酸偏好可以单独存在或彼此组合存在或与实施例9,表17中观察和描述的任何氨基酸偏好组合存在。下文表62中列出了从ML模型中提取的排名靠前的重要骨骼肌嗜性特征之间共有的位置特征的概述。
Figure BDA0004113558700005582
/>
Figure BDA0004113558700005591
/>
Figure BDA0004113558700005601
下文表63提供了表现出骨骼肌组织嗜性并且符合表62中提供的一种或多种规则的变体AAV VP1衣壳多肽的581至589区域的序列。因此,本公开提供了由具有SEQ ID NO:2的工程化AAV5 VP1衣壳多肽组成的rAAV,其中Xaa1至Xaa9区域是SEQ ID NO:29991-SEQ IDNO:30990中的任一者,如表63中所公开。本文还涵盖由工程化AAV5 VP2衣壳多肽和工程化AAV5 VP3衣壳多肽组成的rAAV,所述多肽在对应于AAV5 VP1 581至589区域中的氨基酸的AAV5VP2(氨基酸残基445至453)和AAV5 VP3(氨基酸残基389-397)中的区域处具有下文表中公开的序列。
表63
驱动骨骼肌组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700005611
/>
Figure BDA0004113558700005621
/>
Figure BDA0004113558700005631
/>
Figure BDA0004113558700005641
/>
Figure BDA0004113558700005651
/>
Figure BDA0004113558700005661
/>
Figure BDA0004113558700005671
实施例40
如通过机器学习鉴定的具有皮肤组织嗜性的AAV5变体
此实施例描述了如通过机器学习方法鉴定的展现皮肤组织嗜性的工程化AAV5变体的优选特性。进行如实施例19和图19至图22中描述的相同生物信息学预处理、机器学习方法和分析以确定展现皮肤组织嗜性的工程化AAV5变体的优选特性。
下文描述了AAV5 VP衣壳多肽的581至589区域中各位置处的有利生物物理特性和有利氨基酸残基,它们与较高的皮肤组织嗜性概率相关。表64中描述的任何以下机器学习衍生的位置氨基酸偏好可以单独存在或彼此组合存在或与实施例17,表33中观察和描述的任何氨基酸偏好组合存在。下文表64中列出了从ML模型中提取的排名靠前的重要皮肤嗜性特征之间共有的位置特征的概述。
Figure BDA0004113558700005672
/>
Figure BDA0004113558700005681
/>
Figure BDA0004113558700005691
下文表65提供了表现出皮肤组织嗜性并且符合表64中提供的一种或多种规则的变体AAV VP1衣壳多肽的581至589区域的序列。因此,本公开提供了由具有SEQ ID NO:2的工程化AAV5 VP1衣壳多肽组成的rAAV,其中Xaa1至Xaa9区域是SEQ ID NO:32991-SEQ IDNO:33990中的任一者,如表65中所公开。本文还涵盖由工程化AAV5 VP2衣壳多肽和工程化AAV5 VP3衣壳多肽组成的rAAV,所述多肽在对应于AAV5 VP1 58l至589区域中的氨基酸的AAV5VP2(氨基酸残基445至453)和AAV5 VP3(氨基酸残基389-397)中的区域处具有下文表中公开的序列。
表65
驱动皮肤组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700005692
/>
Figure BDA0004113558700005701
/>
Figure BDA0004113558700005711
/>
Figure BDA0004113558700005721
/>
Figure BDA0004113558700005731
/>
Figure BDA0004113558700005741
/>
Figure BDA0004113558700005751
实施例41
如通过机器学习鉴定的具有脊髓组织嗜性的AAV5变体
此实施例描述了如通过机器学习方法鉴定的展现脊髓组织嗜性的工程化AAV5变体的优选特性。进行如实施例19和图19至图22中描述的相同生物信息学预处理、机器学习方法和分析以确定展现脊髓组织嗜性的工程化AAV5变体的优选特性。
下文描述了AAV5 VP衣壳多肽的581至589区域中各位置处的有利生物物理特性和有利氨基酸残基,它们与较高的脊髓组织嗜性概率相关。表66中描述的任何以下机器学习衍生的位置氨基酸偏好可以单独存在或彼此组合存在或与实施例10,表19中观察和描述的任何氨基酸偏好组合存在。下文表66中列出了从ML模型中提取的排名靠前的重要脊髓嗜性特征之间共有的位置特征的概述。
Figure BDA0004113558700005761
/>
Figure BDA0004113558700005771
下文表67提供了表现出脊髓组织嗜性并且符合表66中提供的一种或多种规则的变体AAV VP1衣壳多肽的581至589区域的序列。因此,本公开提供了由具有SEQ ID NO:2的工程化AAV5 VP1衣壳多肽组成的rAAV,其中Xaa1至Xaa9区域是SEQ ID NO:35438-SEQ IDNO:36437中的任一者,如表67中所公开。本文还涵盖由工程化AAV5 VP2衣壳多肽和工程化AAV5 VP3衣壳多肽组成的rAAV,所述多肽在对应于AAV5 VP1 581至589区域中的氨基酸的AAV5VP2(氨基酸残基445至453)和AAV5 VP3(氨基酸残基389-397)中的区域处具有下文表中公开的序列。
表67
驱动脊髓组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700005781
/>
Figure BDA0004113558700005791
/>
Figure BDA0004113558700005801
/>
Figure BDA0004113558700005811
/>
Figure BDA0004113558700005821
/>
Figure BDA0004113558700005831
/>
Figure BDA0004113558700005841
实施例42
如通过机器学习鉴定的具有脾脏组织嗜性的AAV5变体
此实施例描述了如通过机器学习方法鉴定的展现脾脏组织嗜性的工程化AAV5变体的优选特性。进行如实施例19和图19至图22中描述的相同生物信息学预处理、机器学习方法和分析以确定展现脾脏组织嗜性的工程化AAV5变体的优选特性。
下文描述了AAV5 VP衣壳多肽的581至589区域中各位置处的有利生物物理特性和有利氨基酸残基,它们与较高的脾脏组织嗜性概率相关。表68中描述的任何以下机器学习衍生的位置氨基酸偏好可以单独存在或彼此组合存在或与实施例6,表11中观察和描述的任何氨基酸偏好组合存在。下文表68中列出了从ML模型中提取的排名靠前的重要脾脏嗜性特征之间共有的位置特征的概述。
Figure BDA0004113558700005851
/>
Figure BDA0004113558700005861
下文表69提供了表现出脾脏组织嗜性并且符合表68中提供的一种或多种规则的变体AAV VP1衣壳多肽的581至589区域的序列。因此,本公开提供了由具有SEQ ID NO:2的工程化AAV5 VP1衣壳多肽组成的rAAV,其中Xaa1至Xaa9区域是SEQ ID NO:38438-SEQ IDNO:39437中的任一者,如表69中所公开。本文还涵盖由工程化AAV5 VP2衣壳多肽和工程化AAV5 VP3衣壳多肽组成的rAAV,所述多肽在对应于AAV5 VP1 581至589区域中的氨基酸的AAV5 VP2(氨基酸残基445至453)和AAV5 VP3(氨基酸残基389-397)中的区域处具有下文表中公开的序列。
表69
驱动脾脏组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700005871
/>
Figure BDA0004113558700005881
/>
Figure BDA0004113558700005891
/>
Figure BDA0004113558700005901
/>
Figure BDA0004113558700005911
/>
Figure BDA0004113558700005921
实施例43
如通过机器学习鉴定的具有甲状腺组织嗜性的AAV5变体
此实施例描述了如通过机器学习方法鉴定的展现甲状腺组织嗜性的工程化AAV5变体的优选特性。进行如实施例19和图19至图22中描述的相同生物信息学预处理、机器学习方法和分析以确定展现甲状腺组织嗜性的工程化AAV5变体的优选特性。
下文描述了AAV5 VP衣壳多肽的581至589区域中各位置处的有利生物物理特性和有利氨基酸残基,它们与较高的甲状腺组织嗜性概率相关。表70中描述的任何以下机器学习衍生的位置氨基酸偏好可以单独存在或彼此组合存在或与实施例15,表29中观察和描述的任何氨基酸偏好组合存在。下文表70中列出了从ML模型中提取的排名靠前的重要甲状腺嗜性特征之间共有的位置特征的概述。
Figure BDA0004113558700005931
/>
Figure BDA0004113558700005941
下文表71提供了表现出甲状腺组织嗜性并且符合表70中提供的一种或多种规则的变体AAV VP1衣壳多肽的581至589区域的序列。因此,本公开提供了由具有SEQ ID NO:2的工程化AAV5 VP1衣壳多肽组成的rAAV,其中Xaa1至Xaa9区域是SEQ ID NO:41438-SEQ IDNO:42437中的任一者,如表71中所公开。本文还涵盖由工程化AAV5 VP2衣壳多肽和工程化AAV5 VP3衣壳多肽组成的rAAV,所述多肽在对应于AAV5 VP1 581至589区域中的氨基酸的AAV5VP2(氨基酸残基445至453)和AAV5 VP3(氨基酸残基389-397)中的区域处具有下文表中公开的序列。
表71
驱动甲状腺组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700005951
/>
Figure BDA0004113558700005961
/>
Figure BDA0004113558700005971
/>
Figure BDA0004113558700005981
/>
Figure BDA0004113558700005991
/>
Figure BDA0004113558700006001
实施例44
用衣壳包裹治疗性有效载荷的AAV5源性病毒体治疗雷特综合征
此实施例描述了用具有本文公开的任何一种工程化CNS嗜性变体AAV5 VP衣壳多肽的变体AAV5源性病毒体治疗雷特综合征,其中变体AAV5病毒体衣壳包裹治疗性有效载荷。将编码AAV Rep、AAV5源性变体Cap和辅助蛋白的多核苷酸序列以及治疗性有效载荷在细胞中转染以产生变体AAV5病毒体,其中编码变体AAV5Cap的多核苷酸序列在从对应于VP1衣壳多肽中的581的位置至对应于589的位置的区域中包含至少一个突变,并且其中编码变体AAV5Cap的多核苷酸序列编码SEQ ID NO:7118-SEQ ID NO:10117中任一者的氨基酸序列。治疗性有效载荷是靶向由与雷特综合征有关的基因编码的mRNA的指导RNA、靶向与雷特综合征有关的基因中的提前终止密码子(PTC)的阻抑tRNA,或转基因。指导RNA所靶向的mRNA是由编码MECP2的基因编码的mRNA。阻抑tRNA靶向MECP2中的PTC。转基因是MECP2。将衣壳包裹有效载荷的变体AAV5病毒体施用于受试者。受试者是人类或非人类动物。施用途径是全身施用途径。全身施用途径是静脉内施用。与衣壳包裹治疗性有效载荷的野生型AAV5病毒体相比,衣壳包裹治疗性有效载荷的变体AAV5病毒体在施用于受试者后表现出增强的CNS组织嗜性。在施用于受试者时,与衣壳包裹治疗性有效载荷的野生型AAV5病毒体相比,施用较低剂量的衣壳包裹治疗性有效载荷的变体AAV5病毒体。在施用于受试者后,雷特综合征的至少一种症状得到缓解或受试者得到治愈。
实施例45
富集变体的测定
此实施例示出了在以下各组织中富集变体的测定:肾上腺、骨髓、CNS组织、结肠、心脏、肺、淋巴结、乳腺、骨骼肌或心肌、坐骨神经、骨骼肌、皮肤、脊髓、脾脏和甲状腺。
衣壳变体可以根据观察到的其丰度进行分析。在如实施例19中所述过滤之后,基于动物之间、或组织切片、或CNS区域或测序样本之间的重复观察数量对变体进行评分。这导致变体频率的分布,并且可以通过统计方法相对于所有其他变体的观察频率分布根据变体的观察数量对变体进行排名。
此外,组织内的变体“富集”可以使用以下等式或该等式的变型来计算:
Figure BDA0004113558700006011
其中VAR是对于所有m个组织中所有n个变体,组织根据k中变体j的UMI计数。
如同观察数量,这导致各组织内变体富集频率的分布,并且可以通过统计方法相对于所有其他变体的富集频率分布根据变体的富集对变体进行排名。
然后可以将得到的观察和富集相对评分求和,或取平均值,或以其他方式作积分运算,并且可以根据此以积分法运算的观察/富集评分对变体进行排名以鉴定可能感染给定组织的候选物。
为了基于以积分法运算的观察和富集评分生成各组织中存在的衣壳变体的列表,优先考虑观察到的变体。根据以积分法运算的评分对变体进行排名,并且包括排名靠前的最多1000个变体。
各组织的富集序列描述于下文表中。本文还涵盖由工程化AAV5 VP2衣壳多肽和工程化AAV5 VP3衣壳多肽组成的rAAV,所述多肽在对应于AAV5 VP1 581至589区域中的氨基酸的AAV5 VP2(氨基酸残基445至453)和AAV5 VP3(氨基酸残基389-397)中的区域处具有下文表中公开的序列。
表72
驱动肾上腺组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700006031
/>
Figure BDA0004113558700006041
/>
Figure BDA0004113558700006051
/>
Figure BDA0004113558700006061
/>
Figure BDA0004113558700006071
/>
Figure BDA0004113558700006081
/>
Figure BDA0004113558700006091
表73
驱动骨髓组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700006092
/>
Figure BDA0004113558700006101
/>
Figure BDA0004113558700006111
/>
Figure BDA0004113558700006121
/>
Figure BDA0004113558700006131
/>
Figure BDA0004113558700006141
/>
Figure BDA0004113558700006151
表74
驱动CNS组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700006161
/>
Figure BDA0004113558700006171
/>
Figure BDA0004113558700006181
/>
Figure BDA0004113558700006191
/>
Figure BDA0004113558700006201
/>
Figure BDA0004113558700006211
/>
Figure BDA0004113558700006221
表75
驱动结肠组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700006222
/>
Figure BDA0004113558700006231
/>
Figure BDA0004113558700006241
/>
Figure BDA0004113558700006251
/>
Figure BDA0004113558700006261
/>
Figure BDA0004113558700006271
/>
Figure BDA0004113558700006281
表76
驱动心脏组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700006282
/>
Figure BDA0004113558700006291
/>
Figure BDA0004113558700006301
/>
Figure BDA0004113558700006311
/>
Figure BDA0004113558700006321
/>
Figure BDA0004113558700006331
/>
Figure BDA0004113558700006341
表77
驱动肺组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700006342
/>
Figure BDA0004113558700006351
/>
Figure BDA0004113558700006361
/>
Figure BDA0004113558700006371
/>
Figure BDA0004113558700006381
/>
Figure BDA0004113558700006391
/>
Figure BDA0004113558700006401
表78
驱动淋巴结组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700006411
/>
Figure BDA0004113558700006421
/>
Figure BDA0004113558700006431
/>
Figure BDA0004113558700006441
/>
Figure BDA0004113558700006451
/>
Figure BDA0004113558700006461
/>
Figure BDA0004113558700006471
表79
驱动乳腺组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700006472
/>
Figure BDA0004113558700006481
/>
Figure BDA0004113558700006491
/>
Figure BDA0004113558700006501
/>
Figure BDA0004113558700006511
/>
Figure BDA0004113558700006521
/>
Figure BDA0004113558700006531
表80
驱动坐骨神经组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700006532
/>
Figure BDA0004113558700006541
/>
Figure BDA0004113558700006551
/>
Figure BDA0004113558700006561
/>
Figure BDA0004113558700006571
/>
Figure BDA0004113558700006581
/>
Figure BDA0004113558700006591
表81
驱动骨骼肌组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700006592
/>
Figure BDA0004113558700006601
/>
Figure BDA0004113558700006611
/>
Figure BDA0004113558700006621
/>
Figure BDA0004113558700006631
/>
Figure BDA0004113558700006641
/>
Figure BDA0004113558700006651
表82
驱动皮肤组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700006661
/>
Figure BDA0004113558700006671
/>
Figure BDA0004113558700006681
/>
Figure BDA0004113558700006691
/>
Figure BDA0004113558700006701
/>
Figure BDA0004113558700006711
/>
Figure BDA0004113558700006721
表83
驱动脊髓组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700006722
/>
Figure BDA0004113558700006731
/>
Figure BDA0004113558700006741
/>
Figure BDA0004113558700006751
/>
Figure BDA0004113558700006761
/>
Figure BDA0004113558700006771
/>
Figure BDA0004113558700006781
表84
驱动脾脏组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700006782
/>
Figure BDA0004113558700006791
/>
Figure BDA0004113558700006801
/>
Figure BDA0004113558700006811
/>
Figure BDA0004113558700006821
/>
Figure BDA0004113558700006831
表85
驱动甲状腺组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700006841
/>
Figure BDA0004113558700006851
/>
Figure BDA0004113558700006861
/>
Figure BDA0004113558700006871
/>
Figure BDA0004113558700006881
/>
Figure BDA0004113558700006891
表86
驱动肝脏组织嗜性的AAV5 VP1衣壳多肽中581至589区域的序列
Figure BDA0004113558700006892
/>
Figure BDA0004113558700006901
/>
Figure BDA0004113558700006911
/>
Figure BDA0004113558700006921
/>
Figure BDA0004113558700006931
/>
Figure BDA0004113558700006941
/>
Figure BDA0004113558700006951
实施例46
用衣壳包裹治疗性有效载荷的AAV5源性病毒体治疗脊髓性肌萎缩症(SMA)
此实施例描述了用具有本文公开的任何一种工程化CNS嗜性变体AAV5 VP衣壳多肽的变体AAV5源性病毒体治疗脊髓性肌萎缩症(SMA),其中变体AAV5病毒体衣壳包裹治疗性有效载荷。将编码AAVRep、AAV5源性变体Cap和辅助蛋白的多核苷酸序列以及治疗性有效载荷在细胞中转染以产生变体AAV5病毒体,其中编码变体AAV5Cap的多核苷酸序列在从对应于VP1衣壳多肽中的581的位置至对应于589的位置的区域中包含至少一个突变,并且其中编码变体AAV5Cap的多核苷酸序列编码SEQ ID NO:34991-SEQ ID NO:37437中任一者的氨基酸序列。治疗性有效载荷是靶向由与SMA有关的基因编码的mRNA的指导RNA,或转基因。指导RNA所靶向的mRNA是由编码运动神经元存活(SMN)蛋白的基因编码的mRNA。转基因是SMN。将衣壳包裹有效载荷的变体AAV5病毒体施用于受试者。受试者是人类或非人类动物。施用途径是全身施用途径。全身施用途径是静脉内施用。与衣壳包裹治疗性有效载荷的野生型AAV5病毒体相比,衣壳包裹治疗性有效载荷的变体AAV5病毒体在施用于受试者后表现出增强的脊髓嗜性。在施用于受试者时,与衣壳包裹治疗性有效载荷的野生型AAV5病毒体相比,施用较低剂量的衣壳包裹治疗性有效载荷的变体AAV5病毒体。在施用于受试者后,SMA的至少一种症状得到缓解或受试者得到治愈。
2.某些序列
>AAV5
VP1,来自Chiorini等人,J.Virol.73(2):1309-1319(1999)
Figure BDA0004113558700006971
/>
Figure BDA0004113558700006981
>AAV5文库支架
Figure BDA0004113558700006982
/>
Figure BDA0004113558700006991
Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8、Xaa9
Figure BDA0004113558700006992
Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自A、R、N、D、C、E、Q、G、H、I、L、K、M、F、P、S、T、W、Y和V
SEQ ID NO:3
Figure BDA0004113558700006993
/>
Figure BDA0004113558700007001
Xaa5
Figure BDA0004113558700007002
/>
Figure BDA0004113558700007011
其中Xaa5为V(Y585V)
SEQ ID NO:4
Figure BDA0004113558700007012
/>
Figure BDA0004113558700007021
Xaa7
Figure BDA0004113558700007022
其中Xaa7为T(L587T)
SEQ ID NO:5
Figure BDA0004113558700007023
/>
Figure BDA0004113558700007031
其中Xaa1为T(A581T)
SEQ ID NO:6
Figure BDA0004113558700007041
Figure BDA0004113558700007051
Xaa
Figure BDA0004113558700007052
其中Xaa2为A(T582A)
SEQ ID NO:7
Figure BDA0004113558700007053
/>
Figure BDA0004113558700007061
Xaa4
Figure BDA0004113558700007062
其中Xaa4为A(T584A)
SEQ ID NO:8
Figure BDA0004113558700007063
/>
Figure BDA0004113558700007071
Xaa5
Figure BDA0004113558700007072
/>
Figure BDA0004113558700007081
其中Xaa5为V(Y585V)并且Xaa7为T(L587T)
SEQ ID NO:9ATGTYNLQE(AAV5 VP1衣壳的581-589唾液酸结合区,和Xaa1-Xaa9的参考)
SEQ ID NO:111(图10,中间变体DNA)AATCCAGCTATGTTCAATTGCGATTAC
SEQ ID NO:112(图10,中间变体;氨基酸)NPAMFNCDY
SEQ ID NO:113(图10,右边变体,DNA)AAGTTGACCGCCCACATCTACGCCTTG
SEQ ID NO:114(图10,右边变体;氨基酸)KLTAHIYAL
SEQ ID NO:115-1114(表8,其中列出的AA代表SEQ ID NO:2的Xaa1-Xaa9)
AAV5 VP2序列(SEQ ID NO:1115)
Figure BDA0004113558700007082
Figure BDA0004113558700007091
AAV5 VP3序列(SEQ ID NO:1116)
Figure BDA0004113558700007092
3.等效方案及以引用方式的并入
本文所引用的所有参考文献出于所有目的以引用方式并入,其程度就如同具体地且个别地指出各个别出版物、数据库条目(例如,Genbank序列或GeneID条目)、专利申请或专利以引用方式整体并入。申请人意在依据37 C.F.R.§1.57(b)(1)将此以引用方式并入的声明与每一个别出版物、数据库条目(例如,Genbank序列或GeneID条目)、专利申请或专利相关联,其中每一者都遵照37 C.F.R.§1.57(b)(2)明确标识,即使所述引用与专门的以引用方式并入的声明不直接相邻。在说明书中包含专门的以引用方式并入的声明(如果有的话)不会以任何方式削弱这个以引用方式并入的一般声明。本文引用参考文献并不意味着承认该参考文献是相关的现有技术,也不构成对这些出版物或文件的内容或日期的任何承认。
虽然已参考优选实施方案和各种替代实施方案特别地显示和描述了本发明,但是相关领域技术人员应了解,可在不脱离本发明的精神和范围的情况下在其中进行形式和细节的各种改变。

Claims (87)

1.一种工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽,所述工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽具有与SEQ ID NO:1至少70%同一的氨基酸序列,
其中所述工程化AAV VP衣壳多肽相较于SEQ ID NO:1在从对应于SEQ ID NO:1的残基581的残基至对应于SEQ ID NO:1的残基589的残基的区域,包括端点在内,中具有至少一个突变,
其中所述工程化AAV VP衣壳多肽能够组装成重组AAV病毒体(rAAV),
其中与具有SEQ ID NO:1的野生型AAV5 VP衣壳多肽的rAAV病毒体相比,所述至少一个突变赋予所述rAAV较高的对中枢神经系统(CNS)组织的嗜性,并且
其中所述工程化AAV VP衣壳多肽不具有SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。
2.如权利要求1所述的工程化AAV VP衣壳多肽,其中所述工程化AAV VP衣壳多肽具有SEQ ID NO:2的序列,并且其中Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自任何氨基酸。
3.一种工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽,所述工程化腺相关病毒(AAV)病毒蛋白(VP)衣壳多肽具有SEQ ID NO:2的氨基酸序列,
其中氨基酸残基Xaa1、Xaa2、Xaa3、Xaa4、Xaa5、Xaa6、Xaa7、Xaa8和Xaa9各自独立地选自A、R、N、D、C、E、Q、G、H、I、L、K、M、F、P、S、T、W、Y和V,
其中所述工程化AAV VP衣壳多肽能够组装成重组AAV病毒体(rAAV),并且
其中所述工程化AAV VP衣壳多肽不具有SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQID NO:5、SEQ ID NO:6、SEQ ID NO:7和SEQ ID NO:8中任一者的序列。
4.如权利要求3所述的工程化AAV VP衣壳多肽,其中与具有SEQ ID NO:1的野生型AAV5VP衣壳多肽的rAAV病毒体相比,所述rAAV具有较高的对中枢神经系统(CNS)组织的嗜性。
5.如权利要求1-2中任一项所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有与SEQ ID NO:7118-SEQ ID NO:10117中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
6.如权利要求5所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有SEQ ID NO:7118-SEQ ID NO:10117中任一者的序列。
7.如权利要求3-4中任一项所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:2的Xaa1至Xaa9区域具有与SEQ ID NO:7118-SEQ ID NO:10117中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
8.如权利要求7所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:2的Xaa1至Xaa9区域具有SEQ ID NO:7118-SEQ ID NO:10117中任一者的序列。
9.如权利要求2-4中任一项所述的工程化AAV VP衣壳多肽,其中:
Xaa1选自由A、C、K、M、Q、R、T和W组成的组;或者
Xaa2选自由F、I、K、R、T和W组成的组;或者
Xaa3选自由A、H、N、R和W组成的组;或者
Xaa4选自由E、G、I、M、Q和R组成的组;或者
Xaa5选自由C、G、K、I、M和R组成的组;或者
Xaa6选自由I、K、L、P、Q、R和Y组成的组;或者
Xaa7选自由D、I、K、R、V和W组成的组;或者
Xaa8选自由C、G、H、K、L和V组成的组;或者
Xaa9选自由I、K、L、R和V组成的组;或者
它们的任何组合。
10.如权利要求9所述的工程化AAV VP衣壳多肽,其中Xaa1选自K、Q、R和W。
11.如权利要求9所述的工程化AAV VP衣壳多肽,其中Xaa2选自F、I、R和T。
12.如权利要求9所述的工程化AAV VP衣壳多肽,其中Xaa3选自A、R和W。
13.如权利要求9所述的工程化AAV VP衣壳多肽,其中Xaa4选自E、M和R。
14.如权利要求9所述的工程化AAV VP衣壳多肽,其中Xaa5选自K、I和R。
15.如权利要求9所述的工程化AAV VP衣壳多肽,其中Xaa6选自K、R和Y。
16.如权利要求9所述的工程化AAV VP衣壳多肽,其中Xaa7选自I、R和V。
17.如权利要求9所述的工程化AAV VP衣壳多肽,其中Xaa8选自H、K和V。
18.如权利要求9所述的工程化AAV VP衣壳多肽,其中Xaa9选自I、K和R。
19.如权利要求9所述的工程化AAV VP衣壳多肽,其中Xaa1为K。
20.如权利要求9所述的工程化AAV VP衣壳多肽,其中Xaa2为R。
21.如权利要求9所述的工程化AAV VP衣壳多肽,其中Xaa3为R。
22.如权利要求9所述的工程化AAV VP衣壳多肽,其中Xaa4为R。
23.如权利要求9所述的工程化AAV VP衣壳多肽,其中Xaa5为I。
24.如权利要求9所述的工程化AAV VP衣壳多肽,其中Xaa6为R。
25.如权利要求9所述的工程化AAV VP衣壳多肽,其中Xaa7为V。
26.如权利要求9所述的工程化AAV VP衣壳多肽,其中Xaa8为H。
27.如权利要求9所述的工程化AAV VP衣壳多肽,其中Xaa9为R。
28.如权利要求1-27中任一项所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域,包括端点在内,具有与SEQ ID NO:7118-SEQ ID NO:8117中任一者至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
29.如权利要求28所述的工程化AAV VP衣壳多肽,其中SEQ ID NO:1的从残基581至残基589的区域具有SEQ ID NO:7118-SEQ ID NO:8117中任一者的序列。
30.如权利要求2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有低氨基酸溶解性。
31.如权利要求30所述的工程化AAV VP衣壳多肽,其中Xaa1选自K、R和Q。
32.如权利要求2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有低氨基酸亲疏水性。
33.如权利要求32所述的工程化AAV VP衣壳多肽,其中Xaa1选自K和R。
34.如权利要求2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有高平均氨基酸柔性指数。
35.如权利要求34所述的工程化AAV VP衣壳多肽,其中Xaa1选自D、E、R、K、G、I、N、Q和rS。
36.如权利要求2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有高氢键供体。
37.如权利要求36所述的工程化AAV VP衣壳多肽,其中Xaa1选自K和R。
38.如权利要求2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa1具有低氨基酸可突变性。
39.如权利要求38所述的工程化AAV VP衣壳多肽,其中Xaa1选自K、R、P和H。
40.如权利要求2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有低氨基酸溶解性。
41.如权利要求40所述的工程化AAV VP衣壳多肽,其中Xaa2选自R、K、Q和S。
42.如权利要求2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有低氨基酸亲疏水性。
43.如权利要求42所述的工程化AAV VP衣壳多肽,其中Xaa2选自R、K、D、E、N、Q、H、P、Y、W、S和r T。
44.如权利要求2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa2具有高氨基酸电荷。
45.如权利要求44所述的工程化AAV VP衣壳多肽,其中Xaa2选自R、K和H。
46.如权利要求2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa3具有高氨基酸溶解性。
47.如权利要求46所述的工程化AAV VP衣壳多肽,其中Xaa3选自A、M、V、W、L和I。
48.如权利要求2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa5具有高氨基酸溶解性。
49.如权利要求48所述的工程化AAV VP衣壳多肽,其中Xaa5选自C、M、V、W、L和I。
50.如权利要求2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa5具有高亲疏水性。
51.如权利要求50所述的工程化AAV VP衣壳多肽,其中Xaa5选自M、V和I。
52.如权利要求2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa5具有低平均氨基酸柔性指数。
53.如权利要求52所述的工程化AAV VP衣壳多肽,其中Xaa5选自M、W、F和C。
54.如权利要求2-4中任一项所述的工程化AAV VP衣壳多肽,其中Xaa8具有高氨基酸溶解性。
55.如权利要求54所述的工程化AAV VP衣壳多肽,其中Xaa8选自H、V和I。
56.如权利要求30-55中任一项所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域包括端点在内具有与SEQ ID NO:8118-SEQ ID NO:9117中任一者具有至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少95%、至少97%或至少99%同一的序列。
57.如权利要求56所述的工程化AAV VP衣壳多肽,其中从对应于残基581的残基至对应于残基589的残基的区域包括端点在内具有SEQ ID NO:8118-SEQ ID NO:9117中任一者的序列。
58.如权利要求1-57中任一项所述的工程化AAV VP衣壳多肽,其中CNS组织选自前脑皮层、枕叶皮层、颞叶皮层、丘脑、下丘脑、黑质、海马DG、海马CA1、海马CA3、小脑以及它们的任何组合。
59.如权利要求1-58中任一项所述的工程化AAV VP衣壳多肽,其中对CNS组织的嗜性被测量为所述rAAV病毒体在CNS组织中相较于非CNS组织中的相对积聚,其中所述非CNS组织由肝脏、骨骼肌、心脏、肺、脾脏、淋巴结、骨髓、乳腺、皮肤、肾上腺、甲状腺、结肠、坐骨神经和脊髓共同组成。
60.如权利要求1-59中任一项所述的工程化AAV VP衣壳多肽,其中所述较高的组织嗜性是在CNS组织中相较于非CNS组织中1.0005倍至约1000倍增加的积聚。
61.如权利要求60所述的工程化AAV VP衣壳多肽,其中所述较高的组织嗜性是在CNS组织中相较于非CNS组织中至少约1.0005倍、至少约两倍、至少约三倍、至少约四倍、至少约五倍、至少约十倍、至少约二十倍、至少约50倍、至少约75倍、至少约100倍或至少约1000倍增加的积聚。
62.如权利要求1-61中任一项所述的工程化AAV VP衣壳多肽,其中所述工程化AAV VP衣壳多肽是工程化AAV5 VP衣壳多肽。
63.如权利要求1-61中任一项所述的工程化AAV VP衣壳多肽,其中所述突变是取代。
64.一种重组AAV病毒体(rAAV),所述重组AAV病毒体(rAAV)包含:
组装成衣壳的权利要求1-63中任一项所述的工程化AAV VP衣壳多肽;和
有效载荷,
其中所述工程化AAV VP衣壳多肽衣壳包裹所述有效载荷。
65.如权利要求64所述的重组rAAV,其中所述有效载荷包含治疗性多核苷酸,任选地其中所述治疗性多核苷酸编码转基因或基因组修饰实体。
66.如权利要求65所述的rAAV,其中所述治疗性多核苷酸编码指导RNA、tRNA、阻抑tRNA、siRNA、miRNA、mRNA、shRNA、环状RNA或反义寡核苷酸(ASO)、核酶、DNA酶、适体或它们的任何组合。
67.如权利要求65所述的rAAV,其中所述治疗性多核苷酸编码线性治疗性多核苷酸或环状治疗性多核苷酸。
68.如权利要求65所述的rAAV,其中所述转基因选自表1。
69.如权利要求65所述的rAAV,其中所述基因组修饰实体包含CRISPR/Cas系统、作用于RNA的腺苷脱氨酶(ADAR)酶、转录激活物或转录阻抑物。
70.如权利要求69所述的rAAV,其中所述CRISPR/Cas系统包括Cas3、Cas8、Cas10、Cas9、Cas4、Cas12或Cas13。
71.如权利要求69所述的rAAV,其中所述ADAR是人ADAR1或人ADAR2。
72.如权利要求69所述的rAAV,其中所述转录激活物是VP64。
73.如权利要求69所述的rAAV,其中所述转录阻抑物是KRAB。
74.一种药物组合物,所述药物组合物包含权利要求64-73中任一项所述的rAAV病毒体和药学上可接受的载体。
75.一种治疗方法,所述方法包括向有需要的受试者施用治疗有效量的权利要求74所述的药物组合物。
76.如权利要求74所述的药物组合物,所述药物组合物用于治疗有需要的受试者,其中所述用途包括向所述受试者施用治疗有效量的如权利要求74所述的药物组合物。
77.如权利要求64-73中任一项所述的rAAV病毒体,所述rAAV病毒体用于制造用于治疗有需要的受试者的药物,所述治疗通过施用治疗有效量的所述药物来实现。
78.如权利要求75-77中任一项所述的方法,其中所述rAAV病毒体的所述治疗有效量小于衣壳包裹相同有效载荷的具有SEQ ID NO:1的野生型AAV5 VP衣壳多肽的rAAV病毒体的治疗有效量,其中具有所述SEQ ID NO:1的野生型AAV5 VP衣壳多肽的所述rAAV病毒体通过相同的施用途径施用。
79.如权利要求75-78中任一项所述的方法,其中与衣壳包裹相同有效载荷的具有SEQID NO:1的野生型AAV5 VP衣壳多肽的rAAV病毒体的治疗有效量相比,所述rAAV病毒体的所述治疗有效量在所述受试者中引起较低的毒性,其中具有所述SEQ ID NO:1的野生型AAV5VP衣壳多肽的所述rAAV病毒体通过相同的施用途径施用。
80.如权利要求75-79中任一项所述的方法,其中所述治疗有效量为至少1x 105个病毒基因组/kg受试者体重至5x 1014个病毒基因组/kg受试者体重。
81.如权利要求75-80中任一项所述的方法,其中通过全身施用来施用所述rAAV病毒体。
82.如权利要求81所述的方法,其中所述全身施用是静脉内施用、肌肉内施用、腹膜内施用或口服施用。
83.如权利要求75-82中任一项所述的方法,其中所述受试者是人类或非人类动物。
84.如权利要求75-83中任一项所述的方法,其中所述受试者患有疾病。
85.如权利要求84所述的方法,其中所述疾病是神经系统疾患。
86.如权利要求85所述的方法,其中所述神经系统疾患是AADC缺乏症、阿尔茨海默氏病、tau蛋白病、突触核蛋白病、贝登氏病、MPS-IIIB、伴有GBA1突变的额颞叶痴呆(PD-GBA)、神经性戈谢氏病、戈谢病2型、卡纳万病、帕金森氏病、泰萨克斯病、亨廷顿氏病、波托基-卢普斯基综合征、肌萎缩侧索硬化症、唐氏综合征、圣菲利波病A型、圣菲利波病B型或雷特综合征。
87.如权利要求86所述的方法,其中所述痴呆是额颞叶痴呆(FTD)。
CN202180058369.6A 2020-05-26 2021-05-26 功能性aav衣壳的高通量工程化 Pending CN116390934A (zh)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US202063030038P 2020-05-26 2020-05-26
US63/030,038 2020-05-26
US202063119554P 2020-11-30 2020-11-30
US63/119,554 2020-11-30
US202163134885P 2021-01-07 2021-01-07
US63/134,885 2021-01-07
US202163181037P 2021-04-28 2021-04-28
US63/181,037 2021-04-28
PCT/US2021/034329 WO2021242909A1 (en) 2020-05-26 2021-05-26 High throughput engineering of functional aav capsids

Publications (1)

Publication Number Publication Date
CN116390934A true CN116390934A (zh) 2023-07-04

Family

ID=78722738

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180058369.6A Pending CN116390934A (zh) 2020-05-26 2021-05-26 功能性aav衣壳的高通量工程化

Country Status (7)

Country Link
US (1) US20230048732A1 (zh)
EP (1) EP4158037A1 (zh)
JP (1) JP2023529315A (zh)
CN (1) CN116390934A (zh)
AU (1) AU2021282257A1 (zh)
CA (1) CA3173450A1 (zh)
WO (1) WO2021242909A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021230987A1 (en) 2020-05-13 2021-11-18 Voyager Therapeutics, Inc. Redirection of tropism of aav capsids
TW202346599A (zh) 2022-02-08 2023-12-01 美商航海家醫療公司 Aav衣殼變異體及其用途
WO2023152229A1 (en) * 2022-02-09 2023-08-17 Teitur Trophics Aps Novel peptides
WO2024006741A1 (en) 2022-06-28 2024-01-04 Voyager Therapeutics, Inc. Aav capsid variants and uses thereof
WO2024011112A1 (en) 2022-07-06 2024-01-11 Voyager Therapeutics, Inc. Aav capsid variants and uses thereof

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2525067T3 (es) 2005-04-07 2014-12-17 The Trustees Of The University Of Pennsylvania Método de incremento de la función de un vector de AAV
CA2907799A1 (en) * 2013-05-31 2014-12-04 The Regents Of The University Of California Adeno-associated virus variants and methods of use thereof
EP3049527A4 (en) * 2013-09-26 2017-08-16 University of Florida Research Foundation, Inc. Synthetic combinatorial aav capsid library for targeted gene therapy
JP6842410B2 (ja) * 2014-10-03 2021-03-17 ユニバーシティ オブ マサチューセッツ 新規の高効率ライブラリーにより同定されるaavベクター
US20180230489A1 (en) * 2015-10-28 2018-08-16 Voyager Therapeutics, Inc. Regulatable expression using adeno-associated virus (aav)
SG11201808812RA (en) * 2016-04-15 2018-11-29 Univ Pennsylvania Novel aav8 mutant capsids and compositions containing same
RS65241B1 (sr) 2017-02-28 2024-03-29 Univ Pennsylvania Vektor adeno-asociranih virusa (aav) iz podgrupe f i njegove upotrebe
EP3676373A4 (en) * 2017-08-28 2021-06-09 The Regents of The University of California CAPSID VARIANTS OF ADENO-ASSOCIATED VIRUSES AND METHOD OF USING THEREOF
CN112567027A (zh) 2018-08-10 2021-03-26 再生生物股份有限公司 用于重组aav生产的可扩展方法

Also Published As

Publication number Publication date
EP4158037A1 (en) 2023-04-05
CA3173450A1 (en) 2021-12-02
WO2021242909A1 (en) 2021-12-02
AU2021282257A1 (en) 2022-12-01
JP2023529315A (ja) 2023-07-10
US20230048732A1 (en) 2023-02-16

Similar Documents

Publication Publication Date Title
CN116390934A (zh) 功能性aav衣壳的高通量工程化
JP7406783B2 (ja) パルボウイルスベクターの高められた送達のための改変キャプシドタンパク質
US7465583B2 (en) Duplexed parvovirus vectors
JP7069426B2 (ja) ユートロフィン遺伝子を標的とした筋ジストロフィーの治療方法
CN111836649A (zh) 腺相关病毒变异衣壳和其使用方法
KR20220007056A (ko) 뇌에서 증진된 특이성을 갖는 바이러스 조성물
EP3294891B1 (en) Polynucleotides, vectors and methods for insertion and expression of transgenes
CN114269926A (zh) Aav工程化
US20230051611A1 (en) Altering tissue tropism of adeno-associated viruses
US20220298500A1 (en) Compositions for regulating and self-inactivating enzyme expression and methods for modulating off-target activity of enzymes
CN115023242A (zh) 腺相关病毒载体变体
KR20230051208A (ko) 신규 aav 캡시드 및 이를 함유하는 조성물
CN111718420B (zh) 一种用于基因治疗的融合蛋白及其应用
JP7371954B2 (ja) ヒト肝臓への遺伝子導入のためのアデノ随伴ウイルスビリオン
JP7142815B2 (ja) ヒト肝臓への遺伝子導入のためのアデノ随伴ウイルスビリオン
US20230053353A1 (en) Targeting transfer rna for the suppression of nonsense mutations in messenger rna
JP2021097617A (ja) オルニチントランスカルバミラーゼ欠損症の治療用アデノ随伴ウイルスビリオン
CN111718418B (zh) 一种增强基因编辑的融合蛋白及其应用
US11981967B2 (en) Engineering AAV
WO2020187272A1 (zh) 一种用于基因治疗的融合蛋白及其应用
Jain Factors affecting AAV production: Mutagenesis of AAV2 rep and AAV transgenes
WO2023147558A2 (en) Crispr methods for correcting bag3 gene mutations in vivo
CN117836420A (zh) 重组tert编码病毒基因组和运载体

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination