CN117716038A

CN117716038A - 编码fix蛋白的密码子优化核酸

Info

Publication number: CN117716038A
Application number: CN202280017566.8A
Authority: CN
Inventors: A·V·普罗科菲耶夫; P·M·格绍维奇; A·N·斯特雷科娃; N·A·斯皮里纳; T·E·舒加娃; D·V·莫洛佐夫
Original assignee: Biocard Jsc
Current assignee: Biocard Jsc
Priority date: 2021-03-05
Filing date: 2022-03-05
Publication date: 2024-03-15
Also published as: CO2023011679A2; ECSP23067213A; EP4288549A1; US20240076691A1; CR20230429A; IL305679A; AU2022230548A1; MX2023010350A; UY39659A; BR112023018003A2; MA62371A1; TW202246505A; JP2024509224A; AR125041A1; WO2022186734A1; CA3212809A1; KR20230154067A; CL2023002629A1

Abstract

本申请涉及遗传学、基因疗法和分子生物学的领域。更具体地，本发明涉及编码FIX(凝血因子IX)蛋白的分离的密码子优化核酸、基于其的表达盒和载体、以及用于提高FIX基因在目标细胞中的表达的基于AAV5(腺相关病毒血清型5)的重组病毒及其用途。

Description

编码FIX蛋白的密码子优化核酸

技术领域

背景技术

基因疗法是现代医学有前途的领域之一。其主要涉及开发治疗遗传性疾病的有效解决方案，因为只有基因疗法方法才能特别地影响这些疾病的病因。在大量遗传性疾病中，与止血障碍相关的一组病理是最常见的。

血友病是与血浆凝血因子缺乏或明显不足相关的X连锁疾病；其特征在于凝血障碍，凝血障碍在临床上表现为自发性或诱发性的、经常不受控制的、出血进入关节、肌肉和内脏器官等等的形式。

血友病B由血浆凝血因子IX的缺乏或不足引起。在大多数病例中，该疾病具有家族史，但在一些病例中发现了散发性突变。绝大多数患有血友病的患者是男性，在女性中也存在确诊的血友病病例，但他们极为罕见。凝血因子IX(FIX，克雷司马斯因子)是丝氨酸蛋白酶酶原，其在Ca²⁺和膜磷脂存在下水解因子X分子中的精氨酸-异亮氨酸键以形成活化的因子X(FXa)。因子IXa的催化效率在辅因子(即活化的凝血因子VIII(FVIIIa))结合时提高。

因子IX在肝中作为无活性前体蛋白产生，其在内质网和高尔基体中被加工，在那里它经历多个不同类型的翻译后修饰，并在前肽的蛋白水解裂解后分泌到血流中。凝血级联系统中的因子IX在通过活化因子XI(内源性途径)或活化因子VII(外源性途径)的蛋白水解裂解后被活化，形成通过二硫键连接的两条多肽链。活化因子IX通常经由缓慢结合抗凝血酶III、微管连接蛋白2、蛋白Z依赖性蛋白酶抑制剂和内吞性肝细胞受体缓慢去活化，以及被中性粒细胞弹性蛋白酶降解。

目前采用替代疗法。在1966年开发了低温沉淀技术后，注册了第一种来源于供体血浆的凝血因子产品。在20世纪80年代，发现血浆来源的凝血因子产物可被病毒(HIV、丙型肝炎)感染，并且其导致大约20,000名患者被感染。这一事实为开发血浆产品生产中病毒消除和灭活的方法以及产生新的非血浆产品的方法提供了动力。向血浆来源产品(血浆来源的pdFIX)的生产过程中并入热处理步骤；这使得能够消除产品感染。在改善生产血浆来源产品的方法的同时，进行了使用重组DNA技术开发凝血因子的研究。在该技术的基础上，在1997年生产并注册了重组凝血因子IX(rFIX)产品。用于生产治疗产品的重组DNA技术使得能够显著降低产品的病毒污染风险。目前，血友病的替代疗法治疗产品是血浆来源产品和重组产品；但是，它们具有许多缺点。

生产血浆来源产品的主要问题是需要大量血浆。此外，尽管自20世纪80年代后期以来没有在使用pdFIX时感染患者的病例，但这些治疗产品的制造商理论上不能排除它们被病毒感染的可能性。

目前用于治疗血友病的FIX治疗产品的主要缺点包括以下：

·患者通过血浆来源产品被病毒感染的理论可能性；

·血浆来源产品和重组产品的高免疫原性；

·重组产品的效力较低(与血浆来源产品相比)；

·凝血因子的血液循环期短；

·需要频繁的静脉输注(每周2-3次)；

·终身替代疗法缺乏广泛可用性。

与现有的疗法选择相比，将基因疗法治疗产品用于因子IX基因转导是一种全新的且有前途的方法：通过静脉内输注施用的基因疗法治疗产品恢复患者体内凝血因子的产生。

使用病毒载体(诸如基于AAV的载体)将目标基因递送到生物体的细胞中是主要的基因疗法方法之一。

腺相关病毒(AAV)是一种小型(20nm)的独立复制缺陷型的无包膜病毒。已经在人和灵长类动物中描述了许多不同的AAV血清型。腺相关病毒基因组由大约4,700个核苷酸长的(+或-)单链DNA(ssDNA)构成。在基因组DNA分子的末端，容纳有末端反向重复(ITR)。基因组包含两个开放阅读框(ORF)Rep和Cap，其包含编码各种蛋白产物的几个替代性阅读框。rep产物对AAV复制是必需的，而三种衣壳蛋白(VP1、VP2和VP3)以及其他替代性产物由Cap基因编码。VP1、VP2和VP3以1:1:10的比率存在以形成二十面体衣壳(Xie Q等人,Theatomic structure of adeno-associated virus(AAV-2),a vector for human genetherapy.Proc Natl Acad Sci USA,2002；99:10405-10410)。在重组AAV(rAAV)载体生产期间，将侧翼为ITR的表达盒包装到AAV衣壳中。AAV复制所需的基因不包含在盒中。重组AAV被认为是用于体内基因转移的最安全和最广泛使用的病毒载体之一。载体可感染多种组织类型的细胞，以提供强大和持久的转基因表达。它们也是非致病性的，并具有低免疫原性概况(High KA等人,“rAAV human trial experience”Methods Mol Biol.2011；807:429-57)。

在开发有效基因疗法的领域中研究的迫切目的之一是对载体中目的基因进行密码子优化以实现目的基因的最大表达水平，这又将允许使用较低剂量的载体来实现显著的作用。

遗传密码的特性之一是简并性，即不同密码子(三核苷酸)编码相同氨基酸的能力。翻译成相同氨基酸的此类密码子称为同义密码子。在天然序列中，在进化过程中随机选择同义密码子之一，但同义密码子的使用频率是不同的：每种氨基酸具有或多或少优选的密码子。密码子优化是广泛用于增强蛋白分子生产的技术，其提供了合适的同义密码子之一对于蛋白序列中的每个氨基酸的合理映射。密码子优化的常见原理之一涉及使用最频繁的密码子，而之后引入了其他方法，诸如协调化(再现密码子使用频率的分布)，但它们并不总是提高生产率。除密码子频率外，序列GC含量(鸟嘌呤和胞嘧啶对序列总长度的比率)可影响生产效率，特别地，显示高GC含量与哺乳动物细胞中提高的mRNA水平相关(GrzegorzKudla等人,High Guanine and Cytosine Content Increases mRNA Levels inMammalian Cells,2006年6月,第4卷,第6期,e180,第933-942页)。进一步值得注意的是，mRNA的稳定二级结构元件(即具有低自由折叠能的那些)可降低效率。

目的基因序列的密码子优化的不同变体可导致以下(与野生型基因相比)：

a)目的基因的表达水平将略微提高；

b)目的基因的表达水平将显著提高；

c)目的基因的表达水平将保持在大致相同的水平；

d)目的基因的表达水平将降低。

由此，需要产生FIX基因的密码子优化序列，以提高FIX基因在目标细胞中的表达并产生基于其的基因疗法治疗产品。

发明内容

本组发明的作者发现，与编码凝血因子IX的野生型基因(hFIX-wt)相比，具有SEQID NO:2(hFIXco-v1)或SEQ ID NO:4(hFIXco-v2)的核苷酸序列的编码FIX蛋白(凝血因子IX)的根据本发明的密码子优化核酸出乎意料地显示出提高的FIX基因表达水平和提高至数倍的凝血因子IX蛋白生产水平。具有SEQ ID NO:2(hFIXco-v1)和SEQ ID NO:4(hFIXco-v2)的核苷酸序列的根据本发明的密码子优化核酸的这些变体包含在基于其的表达盒和载体中，以及包含在基于AAV5(腺相关病毒血清型5)的重组病毒中。

发明简述

在一方面，本发明涉及分离的密码子优化核酸，其编码具有SEQ ID NO:1的氨基酸序列的FIX(凝血因子IX)蛋白，并且其包括选自以下的核苷酸序列：SEQ ID NO:2或SEQ IDNO:4。

在一方面，本发明涉及包括上述密码子优化核酸的表达盒。

在一些实施方案中，表达盒在5’端至3’端方向上包括以下元件：

左侧(第一)ITR(反向末端重复)；

TTR启动子(甲状腺素运载蛋白启动子)；

hBG1基因的内含子(人β珠蛋白基因的携带内含子的片段)；

上述密码子优化核酸；

hGH1多聚腺苷酸化信号(人生长激素基因多聚腺苷酸化信号)；

右侧(第二)ITR。

在一些实施方案中，表达盒包括选自以下的核苷酸序列：SEQ ID NO:3或SEQ IDNO:5。

在一方面，本发明涉及包含上述密码子优化核酸或上述表达盒的任一种的表达载体。

在一方面，本发明涉及用于提高目标细胞中FIX基因表达的分离的基于AAV-5(腺相关病毒血清型5)的重组病毒，其包含上述密码子优化核酸或上述表达盒的任一种。

在一些实施方案中，基于AAV5的重组病毒具有包含AAV5蛋白VP1的衣壳。

在一些实施方案中，基于AAV5的重组病毒具有包含具有SEQ ID NO:11的氨基酸序列的AAV5蛋白VP1的衣壳。

在一些实施方案中，基于AAV5的重组病毒具有包含AAV5蛋白VP1的衣壳，所述AAV5蛋白VP1具有含一个或多个点突变的SEQ ID NO:11的氨基酸序列。

在一些实施方案中，基于AAV5的重组病毒具有包含具有SEQ ID NO:14的氨基酸序列的AAV5蛋白VP1的衣壳。

在一些实施方案中，基于AAV5的重组病毒具有包含AAV5蛋白VP1的衣壳，所述AAV5蛋白VP1具有SEQ ID NO:11的氨基酸序列或含一个或多个点突变的SEQ ID NO:11的氨基酸序列，并且表达盒在5’端至3’端方向上包括以下元件：

左侧(第一)ITR(反向末端重复)；

TTR启动子(甲状腺素运载蛋白启动子)；

hBG1基因的内含子(人β珠蛋白基因的携带内含子的片段)；

上述密码子优化核酸；

hGH1多聚腺苷酸化信号(人生长激素基因多聚腺苷酸化信号)；

右侧(第二)ITR。

在一些实施方案中，基于AAV5的重组病毒具有包含AAV5蛋白VP1的衣壳，所述AAV5蛋白VP1具有SEQ ID NO:11的氨基酸序列或含一个或多个点突变的SEQ ID NO:11的氨基酸序列，并且表达盒包含选自SEQ ID NO:3或SEQ ID NO:5的核苷酸序列。

在一些实施方案中，基于AAV5的重组病毒具有包含AAV5蛋白VP1的衣壳，所述AAV5蛋白VP1具有含一个或多个点突变的SEQ ID NO:11的氨基酸序列，其是SEQ ID NO:14的氨基酸序列。

在一方面，本发明涉及用于将FIX基因递送至目标细胞的药物组合物，其包含与一种或多种药学上可接受的赋形剂组合的上述基于AAV5的重组病毒的任一种。

在一方面，本发明涉及上述基于AAV5的重组病毒的的任一种或上述组合物用于将FIX基因递送至目标细胞的用途。

在一方面，本发明涉及上述基于AAV5的重组病毒的任一种或上述组合物用于向患有血友病B和/或不具有FIX基因的完全功能性拷贝的受试者提供FIX蛋白的用途。

在一方面，本发明涉及上述基于AAV5的重组病毒的任一种或上述组合物用于在患有血友病B的受试者中治疗血友病B的用途。

在一方面，本发明涉及向患有血友病B的受试者提供FIX蛋白的方法，所述方法包括将治疗有效量的上述基于AAV5的重组病毒的任一种或上述组合物施用到有需要的受试者的细胞中。

在一方面，本发明涉及将FIX基因递送至患有血友病B的受试者的目标细胞的方法，所述方法包括将上述基于AAV5的重组病毒的任一种或上述组合物施用到该受试者的细胞中。

在一方面，本发明涉及在受试者中治疗血友病B的方法，所述方法包括将治疗有效量的上述基于AAV5的重组病毒的任一种或上述组合物施用到患有血友病B的受试者中。

附图说明

图1是质粒pAAV-hFIXco-v1和pAAV-hFIXco-v2的图解，所述质粒意在产生具有分别包含人凝血因子IX(FIX)基因hFIXco-v1和hFIXco-v2的密码子优化序列的表达盒的AAV载体，其中

hFIXco-v1是人凝血因子IX基因的密码子优化序列(变体No.1)；

hFIXco-v2是人凝血因子IX基因的密码子优化序列(变体No.2)；

AmpR是提供对氨苄青霉素的抗性的β-内酰胺酶基因；

pUC起点是细菌中的pUC复制起点；

ITR是反向末端重复；

TTR启动子是甲状腺素运载蛋白基因启动子(甲状腺素运载蛋白启动子)；

多聚A是多聚腺苷酸化信号序列，用于提高mRNA稳定性；

HBG内含子是人β珠蛋白内含子。

图2是显示在用携带野生型FIX基因的AAV5-FIX病毒产物(AAV5-hFIX-wt)、用携带密码子优化基因hFIXco-v1的AAV5-FIX产物(AAV5-hFIXco-v1)和用携带密码子优化基因hFIXco-v2的AAV5-FIX产物(AAV5-hFIXco-v2)转导细胞后7天，Huh7细胞中FIX基因的表达水平的图(AAV-FIX产物中FIX基因的所有变体均含有天然存在的Padua,R338L突变)。*——p值<0.05。使用带Dunnett检验的双因素ANOVA进行统计分析。

图3是显示在用携带野生型FIX基因的AAV5-FIX病毒产物(AAV5-hFIX-wt)、用携带密码子优化基因hFIXco-v1的AAV5-FIX产物(AAV5-hFIXco-v1)和用携带密码子优化基因hFIXco-v2的AAV5-FIX产物(AAV5-hFIXco-v2)转导Huh7细胞后7天，培养液中的FIX蛋白浓度的图(AAV-FIX产物中FIX基因的所有变体均含有天然存在的Padua,R338L突变)。未转导的Huh7细胞用作对照物。***——p值<0.001。使用带Dunnett检验的双因素ANOVA进行统计分析。

图4是显示在用携带野生型FIX基因的AAV5-FIX病毒产物(AAV5-hFIX-wt)、用携带密码子优化基因hFIXco-v1的AAV5-FIX产物(AAV5-hFIXco-v1)和用携带密码子优化基因hFIXco-v2的AAV5-FIX产物(AAV5-hFIXco-v2)转导Huh7细胞后7天，培养液中的FIX蛋白活性的图(AAV-FIX产物中FIX基因的所有变体均含有天然存在的Padua,R338L突变)。未转导的Huh7细胞用作对照物。***——p值<0.001。使用带Dunnett检验的双因素ANOVA进行统计分析。

图5是显示在静脉内施用携带野生型FIX基因的AAV5-FIX产物(AAV5-hFIX-wt)和携带密码子优化基因hFIXco-v1的AAV5-FIX产物(AAV5-hFIXco-v1)后，实验动物血浆中凝血因子IX蛋白含量的图(AAV-FIX产物中FIX基因的所有版本均含有天然存在的Padua,R338L突变)。平均值±标准偏差(n＝10)。***——p值<0.001；**——p值<0.01；*——p值<0.05。使用带Dunnett检验的单因素ANOVA进行统计分析。

图6是显示在静脉内施用携带野生型FIX基因的AAV5-FIX产物(AAV5-hFIX-wt)和携带密码子优化基因hFIXco-v2的AAV5-FIX产物(AAV5-hFIXco-v2)后，实验动物血浆中凝血因子IX蛋白含量的图(AAV-FIX产物中FIX基因的所有版本均含有天然存在的Padua,R338L突变)。平均值±标准偏差(n＝10)。***——p值<0.001；**——p值<0.01；*——p值<0.05。使用带Dunnett检验的单因素ANOVA进行统计分析。

定义和一般方法

除非本文中另行定义，否则结合本发明使用的所有技术和科学术语将具有与本领域技术人员通常理解的相同含义。

此外，除非上下文另行要求，否则单数术语应包括复数术语，并且复数术语应包括单数术语。通常，本文中描述的细胞培养、分子生物学、免疫学、微生物学、遗传学、分析化学、有机合成化学、医学和药物化学以及蛋白和核酸的杂交和化学的分类和方法是本领域技术人员公知且广泛使用的。酶反应和纯化方法根据制造商的指南进行，如本领域中常见的或者如本文中描述的。

“分离的”意指从天然状态改变或取出。例如，天然存在于动物中的核酸或肽不是“分离的”，但与其天然状态的共存材料部分或完全分开的相同核酸或肽是“分离的”。分离的核酸或蛋白可以基本上纯化的形式存在，或可存在于非天然环境(例如遗传修饰的细胞)中。

术语“天然存在的”、“天然的”或“野生型”用于描述可在自然界中发现的不同于人工产生的物体。例如，可从自然界的来源中分离，并且未通过实验室人员有意修饰的，存在于生物体(包括病毒)中的蛋白或核苷酸序列是天然存在的。

术语“基因组”是指生物体的完整遗传材料。

如在本说明书和所附权利要求中所用的，除非上下文另行规定，否则词语“包括(include)”和“包含(comprise)”或其变体，诸如“具有(having)”、“包括(includes)”、“包括(including)”、“包含(comprises)”或“包含(comprising)”将理解为暗示包括所述整数或整数组，但不排除任何其他整数或整数组。

蛋白(肽)

本说明书中使用的术语“肽”、“多肽”和“蛋白”可互换使用，并且它们是指由通过肽键共价连接的氨基酸残基组成的化合物。蛋白或肽必须含有至少两个氨基酸，并且对可构成蛋白或肽序列的氨基酸的最大数量未设限制。多肽包括包含通过肽键彼此连接的两个或更多个氨基酸的任何肽或蛋白。如在本说明书中所用的，该术语是指在本领域中通常也被称为例如肽、寡肽和寡聚物的短链，和在本领域中通常被称为蛋白(其中存在许多类型)的较长链二者。“多肽”尤其包括例如生物学活性片段、基本上同源的多肽、寡肽、同二聚体、异二聚体、多肽的变体、修饰的多肽、衍生物、类似物、融合蛋白。多肽包括天然肽、重组肽、合成肽或其组合。

核酸分子

在本说明书中可互换使用的术语“核酸”、“核酸序列(nucleic sequence)”、“核酸序列(nucleic acid sequence)”、“多核苷酸”、“寡核苷酸”、“多核苷酸序列”和“核苷酸序列”意指修饰或未修饰的核苷酸的精确序列，其确定核酸的片段或区域、含有或不含有非天然核苷酸、并且是双链DNA或RNA、单链DNA或RNA、或所述DNA的转录产物。

如本说明书中所用的，多核苷酸包括作为非限制性实例的通过本领域可用的任何手段获得的所有核酸序列，所述任何手段包括作为非限制性实例的重组手段，即，使用普通克隆技术和PCR等等，从重组文库或细胞基因组克隆核酸序列，以及合成手段。

在此还应包括的是，本发明不涉及处于其天然染色体环境中，即处于天然状态的核苷酸序列。本发明的序列已经被分离和/或纯化，即它们例如通过拷贝被直接或间接取样，它们的环境已经至少部分地进行修饰。由此，在此还应提及通过重组遗传学，借助例如宿主细胞获得或通过化学合成获得的分离的核酸。

除非另行说明，否则术语核苷酸序列包括其互补体。由此，具有特定序列的核酸应理解为包括具有其互补序列的其互补链的核酸。

腺相关病毒(AAV)

细小病毒科(Parvoviridae)的病毒是小型的含有DNA的动物病毒。细小病毒科可分为两个亚科：其成员感染脊椎动物的细小病毒亚科(Parvovirinae)、以及其成员感染昆虫的浓核病毒亚科(Densovirinae)。至2006年，已经描述了腺相关病毒的11种血清型(Mori,S.等人,2004,“Two novel adeno-associated viruses from cynomolgus monkey:pseudotypingcharacterization of capsid protein”,Virology,Т.330(2):375-83)。所有已知的血清型均可感染来自多种组织类型的细胞。组织特异性由衣壳蛋白血清型决定；因此，通过分配所需的血清型构建基于腺相关病毒的载体。关于细小病毒和细小病毒科的其他成员的进一步信息在文献中描述(Kenneth I.Berns,《Parvoviridae:The Virusesand Their Replication》,Fields Virology(第3版,1996)中的第69章)。

所有已知AAV血清型的基因组结构非常相似。AAV的基因组是长度小于大约5,000个核苷酸(nt)的线性单链DNA分子。反向末端重复(ITR)在非结构蛋白(Rep)和结构蛋白(Cap)复制的独特编码核苷酸序列的侧翼。Cap基因编码形成衣壳的VP蛋白(VP1、VP2和VP3)。末端的145个核苷酸是自互补的，并且其被组织使得可以形成能量稳定的分子内双链体，其形成T形发夹。此类发夹结构作为病毒DNA复制的起点起作用，充当细胞DNA聚合酶复合物的引物。在哺乳动物细胞中的野生型AAV(wtAAV)感染之后，Rep基因(例如Rep78和Rep52)分别使用P5启动子和P19启动子进行表达，并且两种Rep蛋白在病毒基因组的复制中均具有一定的功能。Rep开放阅读框(Rep ORF)中的剪接事件导致实际上四种Rep蛋白(例如Rep78、Rep68、Rep52和Rep40)的表达。但是，已经显示编码Rep78和Rep52蛋白的未剪接mRNA对于哺乳动物细胞中的AAV载体生产是足够的。

载体

本文中使用的术语“载体”意指能够转运与其连接的另一核酸的核酸分子。此外，术语“载体”在本文中是指能够转运核酸的病毒颗粒。

如在本说明书中使用的，术语“表达”定义为由其启动子驱动的特定核苷酸序列的转录和/或翻译。

用途

“基因疗法”是将基因插入到受试者的细胞和/或组织中以治疗疾病，通常为遗传性疾病，其中缺陷型突变等位基因被功能性等位基因替代。

“治疗(treat)”、“治疗(treating)”和“治疗(treatment)”是指缓解或消除生物病症和/或其伴随症状中的至少一种的方法。如本文中所用，“缓解”疾病、病症或状况意指降低疾病、病症或状况的症状的严重程度和/或发生频率。进一步地，本文中提及“治疗”包括提及治愈性、姑息性和预防性治疗。

在一方面，治疗的受试者或患者是哺乳动物，优选人受试者。所述受试者可以是任何年龄的雄性或雌性。

术语“病症”意指将受益于用本发明的化合物的治疗的任何状况。

“疾病”是受试者的健康状态，其中受试者无法维持体内稳态，并且其中如果疾病没有改善，则受试者的健康继续恶化。

术语“受试者”、“患者”、“个体”等在本说明书中可互换使用，并且它们是指适合于本说明书中描述的方法的任何动物。在某些非限制性实施方案中，受试者、患者或个体是人。所述受试者可以是任何年龄的雄性或雌性。

“治疗有效量”或“有效量”是指所施用的治疗剂的量，其将在一定程度上缓解所治疗疾病的一种或多种症状。

具体实施方式

核酸

在一方面，本发明涉及分离的密码子优化核酸，其编码具有氨基酸序列MQRVNMIMAESPGLITICLLGYLLSAECTVFLDHENANKILNRPKRYNSGKLEEFVQGNLERECMEEKCSFEEAREVFENTERTTEFWKQYVDGDQCESNPCLNGGSCKDDINSYECWCPFGFEGKNCELDVTCNIKNGRCEQFCKNSADNKVVCSCTEGYRLAENQKSCEPAVPFPCGRVSVSQTSKLTRAETVFPDVDYVNSTEAETILDNITQSTQSFNDFTRVVGGEDAKPGQFPWQVVLNGKVDAFCGGSIVNEKWIVTAAHCVETGVKITVVAGEHNIEETEHTEQKRNVIRIIPHHNYNAAINKYNHDIALLELDEPLVLNSYVTPICIADKEYTNIFLKFGSGYVSGWGRVFHKGRSALVLQYLRVPLVDRATCLLSTKFTIYNNMFCAGFHEGGRDSCQGDSGGPHVTEVEGTSFLTGIISWGEECAMKGKYGIYTKVSRYVNWIKEKTKLT(SEQID NO:1)的FIX蛋白(凝血因子IX)，并且其包括选自以下的核苷酸序列：ATGCAGCGGGTCAACATGATCATGGCGGAGTCGCCGGGCCTGATCACGATCTGCCTCCTCGGGTACCTGCTCTCCGCCGAGTGCACCGTGTTCCTGGACCACGAGAACGCCAACAAGATCCTCAACCGGCCCAAGCGCTACAACTCCGGCAAGCTGGAGGAGTTCGTGCAGGGGAACCTCGAGCGCGAGTGCATGGAGGAGAAGTGCTCGTTCGAGGAGGCGCGGGAGGTGTTCGAGAACACCGAGCGCACCACGGAGTTCTGGAAGCAGTACGTGGACGGGGACCAGTGCGAGTCGAACCCGTGCCTCAACGGGGGGTCGTGCAAGGACGACATCAACTCGTACGAGTGCTGGTGCCCCTTCGGCTTCGAGGGCAAGAACTGCGAGCTGGACGTGACCTGCAACATCAAGAACGGGCGCTGCGAGCAGTTCTGCAAGAACAGCGCCGACAACAAGGTGGTCTGCTCCTGCACCGAGGGGTACCGCCTCGCGGAGAACCAGAAGTCCTGCGAGCCGGCCGTGCCCTTCCCCTGCGGCCGCGTGTCCGTCAGCCAGACGTCGAAGCTGACGCGCGCCGAGACCGTCTTCCCGGACGTGGACTACGTGAACTCGACGGAGGCCGAGACCATCCTGGACAACATCACCCAGAGCACCCAGTCCTTCAACGACTTCACGCGGGTGGTCGGCGGCGAGGACGCCAAGCCCGGGCAGTTCCCGTGGCAGGTCGTCCTCAACGGGAAGGTCGACGCGTTCTGCGGCGGGAGCATCGTGAACGAGAAGTGGATCGTGACCGCCGCGCACTGCGTCGAGACGGGCGTGAAGATCACCGTGGTGGCCGGGGAGCACAACATCGAGGAGACGGAGCACACCGAGCAGAAGCGGAACGTGATCCGCATCATCCCGCACCACAACTACAACGCCGCCATCAACAAGTACAACCACGACATCGCGCTCCTCGAGCTGGACGAGCCGCTGGTCCTCAACTCCTACGTCACGCCGATCTGCATCGCCGACAAGGAGTACACGAACATCTTCCTGAAGTTCGGGAGCGGCTACGTCTCGGGCTGGGGCCGCGTGTTCCACAAGGGGCGCAGCGCGCTCGTGCTCCAGTACCTGCGGGTCCCCCTGGTCGACCGCGCGACCTGCCTCCTCTCCACGAAGTTCACGATCTACAACAACATGTTCTGCGCGGGGTTCCACGAGGGCGGCCGGGACAGCTGCCAGGGCGACAGCGGGGGCCCGCACGTGACGGAGGTGGAGGGCACGAGCTTCCTGACCGGGATCATCTCGTGGGGCGAGGAGTGCGCGATGAAGGGGAAGTACGGCATCTACACCAAGGTCAGCCGGTACGTGAACTGGATCAAGGAGAAGACGAAGCTGACG(SEQ ID NO:2)或

ATGCAGCGGGTGAACATGATCATGGCCGAGTCCCCAGGCCTGATTACCATCTGTCTGCTGGGCTACCTGCTGAGCGCCGAATGCACCGTGTTTCTGGACCACGAGAACGCCAACAAGATCCTGAACCGCCCTAAGCGGTACAACTCCGGCAAGCTGGAGGAGTTTGTGCAGGGCAATCTGGAGCGGGAGTGTATGGAGGAGAAGTGCAGCTTCGAGGAGGCCAGGGAGGTGTTCGAGAACACCGAGAGGACCACCGAGTTCTGGAAGCAGTATGTGGACGGCGACCAGTGCGAGTCTAATCCTTGTCTGAATGGCGGGAGCTGCAAGGACGACATCAACAGCTACGAGTGCTGGTGCCCTTTCGGCTTCGAGGGCAAGAATTGCGAGCTGGACGTGACCTGCAACATCAAGAACGGCCGGTGTGAGCAGTTCTGCAAGAACAGCGCCGACAACAAGGTGGTGTGCTCCTGCACCGAGGGATACAGGCTGGCCGAGAATCAGAAGAGCTGTGAGCCCGCCGTGCCATTCCCCTGTGGCAGAGTGTCTGTGAGCCAGACCAGCAAGCTGACCAGAGCCGAGACCGTGTTTCCAGACGTGGACTACGTGAACAGCACCGAGGCCGAGACCATCCTGGATAATATCACCCAGTCCACCCAGAGCTTCAACGACTTCACCAGAGTGGTGGGAGGCGAGGATGCCAAGCCAGGACAGTTTCCCTGGCAGGTGGTGCTGAATGGCAAGGTGGACGCCTTCTGCGGAGGCAGCATCGTGAACGAGAAGTGGATTGTGACCGCAGCCCACTGCGTGGAGACTGGCGTGAAGATTACCGTGGTCGCCGGCGAGCACAATATCGAAGAGACCGAGCACACCGAGCAGAAGCGCAACGTGATCCGGATCATCCCTCACCACAACTACAACGCAGCCATCAACAAGTACAACCACGACATCGCCCTGCTGGAGCTGGACGAGCCACTGGTGCTGAACTCTTACGTGACCCCTATCTGCATCGCCGACAAGGAGTACACCAACATCTTCCTGAAGTTCGGCAGCGGCTACGTGAGCGGATGGGGCAGAGTGTTTCACAAGGGCAGGAGCGCCCTGGTGCTGCAGTATCTGAGAGTGCCACTGGTGGACAGAGCTACCTGCCTGCTGAGCACCAAGTTCACCATCTACAACAACATGTTCTGCGCCGGCTTCCACGAGGGGGGAAGAGACTCTTGCCAGGGCGATTCCGGCGGACCACACGTGACCGAAGTGGAGGGCACCAGCTTCCTGACCGGCATCATCTCCTGGGGCGAGGAATGCGCCATGAAGGGCAAGTACGGCATCTACACCAAGGTGAGCAGGTACGTGAACTGGATCAAGGAGAAGACCAAGCTGACC(SEQ ID NO:4)。

“分离的”核酸分子是从至少一种核酸分子-杂质(前者通常在核酸酶核酸的天然来源中与其结合)中鉴定并分离的核酸分子。分离的核酸分子不同于其在天然条件下发现的形式或集合。由此，分离的核酸分子不同于天然条件下存在于细胞中的核酸分子。但是，分离的核酸分子包括位于其中核酸酶正常表达的细胞中的核酸分子，例如，如果核酸分子具有不同于其在天然条件下在细胞中的定位的染色体定位。

通过对具有以下核苷酸序列的野生型核酸进行密码子优化来获得上述密码子优化核酸：ATGCAGCGCGTGAACATGATCATGGCAGAATCACCAGGCCTCATCACCATCTGCCTTTTAGGATATCTACTCAGTGCTGAATGTACAGTTTTTCTTGATCATGAAAACGCCAACAAAATTCTGAATCGGCCAAAGAGGTATAATTCAGGTAAATTGGAAGAGTTTGTTCAAGGGAACCTTGAGAGAGAATGTATGGAAGAAAAGTGTAGTTTTGAAGAAGCACGAGAAGTTTTTGAAAACACTGAAAGAACAACTGAATTTTGGAAGCAGTATGTTGATGGAGATCAGTGTGAGTCCAATCCATGTTTAAATGGCGGCAGTTGCAAGGATGACATTAATTCCTATGAATGTTGGTGTCCCTTTGGATTTGAAGGAAAGAACTGTGAATTAGATGTAACATGTAACATTAAGAATGGCAGATGCGAGCAGTTTTGTAAAAATAGTGCTGATAACAAGGTGGTTTGCTCCTGTACTGAGGGATATCGACTTGCAGAAAACCAGAAGTCCTGTGAACCAGCAGTGCCATTTCCATGTGGAAGAGTTTCTGTTTCACAAACTTCTAAGCTCACCCGTGCTGAGACTGTTTTTCCTGATGTGGACTATGTAAATTCTACTGAAGCTGAAACCATTTTGGATAACATCACTCAAAGCACCCAATCATTTAATGACTTCACTCGGGTTGTTGGTGGAGAAGATGCCAAACCAGGTCAATTCCCTTGGCAGGTTGTTTTGAATGGTAAAGTTGATGCATTCTGTGGAGGCTCTATCGTTAATGAAAAATGGATTGTAACTGCTGCCCACTGTGTTGAAACTGGTGTTAAAATTACAGTTGTCGCAGGTGAACATAATATTGAGGAGACAGAACATACAGAGCAAAAGCGAAATGTGATTCGAATTATTCCTCACCACAACTACAATGCAGCTATTAATAAGTACAACCATGACATTGCCCTTCTGGAACTGGACGAACCCTTAGTGCTAAACAGCTACGTTACACCTATTTGCATTGCTGACAAGGAATACACGAACATCTTCCTCAAATTTGGATCTGGCTATGTAAGTGGCTGGGGAAGAGTCTTCCACAAAGGGAGATCAGCTTTAGTTCTTCAGTACCTTAGAGTTCCACTTGTTGACCGAGCCACATGTCTTCTATCTACAAAGTTCACCATCTATAACAACATGTTCTGTGCTGGCTTCCATGAAGGAGGTAGAGATTCATGTCAAGGAGATAGTGGGGGACCCCATGTTACTGAAGTGGAAGGGACCAGTTTCTTAACTGGAATTATTAGCTGGGGTGAAGAGTGTGCAATGAAAGGCAAATATGGAATATATACCAAGGTATCCCGGTATGTCAACTGGATTAAGGAAAAAACAAAGCTCACT(SEQ ID NO:17)。

作为具有SEQ ID NO:17的核苷酸序列的编码FIX蛋白的野生型核酸的密码子优化的结果，获得了许多密码子优化核酸，进一步测试了其与对照(具有SEQ ID NO:17的野生型核酸)相比的蛋白产生水平。

与野生型相比，所有密码子优化核酸均显示出提高的FIX蛋白产生水平；此外，具有SEQ ID NO:2的核苷酸序列的本发明的密码子优化核酸(hFIXco-v1)和具有SEQ ID NO:4的核苷酸序列的本发明的密码子优化核酸(hFIXco-v2)出乎意料地显示出最佳结果，特别是与野生型相比提高的FIX基因表达水平、提高至数倍的FIX蛋白产生水平(参见实施例2、3和4)。

表达盒.表达载体.

在一方面，本发明涉及包含编码FIX蛋白(凝血因子IX)的上述密码子优化核酸的表达盒。

本文中使用的术语“表达……的盒”或“表达盒”特别是指在适当的背景下能够引起包含在所述表达盒中的编码目的多肽的多核苷酸表达的DNA片段。当引入宿主细胞时，表达盒尤其能够参与细胞机制，以将编码目的多肽的多核苷酸转录为RNA，所述RNA随后通常进一步被加工并最终翻译为目的多肽。表达盒可以包含在表达载体中。

本发明的表达盒包含启动子作为元件。本文中使用的术语“启动子”特别是指促进与启动子可操作地连接的多核苷酸的转录的DNA元件。启动子可进一步形成启动子/增强子元件的一部分。尽管“启动子”与“增强子”元件之间的物理边界并不总是清楚的，术语“启动子”通常是指核酸分子上RNA聚合酶和/或任何相关因子与之结合并且转录在此起始的位点。增强子在时间以及空间上增强启动子活性。本领域已知在广泛范围的细胞类型中具有转录活性的许多启动子。启动子可分为两类，组成性起作用的那些，和通过诱导或去阻遏来调节的那些。这两类均适于蛋白表达。用于在真核细胞并且特别是在哺乳动物细胞中高水平产生多肽的启动子应该是很强的，并优选在广泛范围的细胞类型中有活性。能够在许多细胞类型中驱动表达的强组成型启动子在本领域中是公知的，并因此在本文中无需对其进行详细描述。根据本发明的思想，优选使用TTR启动子。TTR启动子或TTR启动子/增强子特别适合作为本发明的表达盒中的启动子。根据本发明的一个实施方案，TTR启动子用于本发明的表达盒中。

在本发明的一些实施方案中，表达盒在5’端至3’端方向上包括以下元件：

左侧(第一)ITR(反向末端重复)；

TTR启动子(甲状腺素运载蛋白启动子)；

hBG1基因的内含子(人β珠蛋白基因的携带内含子的片段)；

编码FIX蛋白(凝血因子IX)的上述密码子优化核酸；

hGH1多聚腺苷酸化信号(人生长激素基因多聚腺苷酸化信号)；

右侧(第二)ITR。

在本发明的一些实施方案中，左侧(第一)ITR具有以下核酸序列：Cctgcaggcagctgcgcgctcgctcgctcactgaggccgcccgggcgtcgggcgacctttggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcactaggggttcct(SEQ ID NO:6)。

在本发明的一些实施方案中，TTR启动子具有以下核酸序列：tcgagcttgggctgcaggtcgagggcactgggaggatgttgagtaagatggaaaactactgatgacccttgcagagacagagtattaggacatgtttgaacaggggccggcgatcagcaggtagctctagaggatccccgtctgtctgcacatttcgtagagcgagtgttccgatactctaatctccctaggcaaggttcatatttgtgtaggttacttattctccttttgttgactaagtcaataatcagaatcagcaggtttggagtcagcttggcagggatcagcagcctgggttggaaggagggggtataaaagccccttcaccaggagaagccgtcacacagatccacaagctcctgacaggaagct(SEQ ID NO:7)。

在本发明的一些实施方案中，hBG1基因的内含子具有以下核酸序列：cgaatcccggccgggaacggtgcattggaacgcggattccccgtgccaagagtgacgtaagtaccgcctatagagtctataggcccacaaaaaatgctttcttcttttaatatacttttttgtttatcttatttctaatactttccctaatctctttctttcagggcaataatgatacaatgtatcatgcctctttgcaccattctaaagaataacagtgataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgtaagaggtttcatattgctaatagcagctacaatccagctaccattctgcttttattttatggttgggataaggctggattattctgagtccaagctaggcccttttgctaatcatgttcatacctcttatcttcctcccacagctcctgggcaacgtgctggtctgtgtgctggcccatcactttggcaaagaattgggat(SEQ ID NO:8)。

在本发明的一些实施方案中，hGH1多聚腺苷酸化信号具有以下核酸序列：acgggtggcatccctgtgacccctccccagtgccCctcctggccctggaagttgccactccagtgcccaccagccttgtcctaataaaattaagttgcatcattttgtctgactaggtgtccttctataatattatggggtggaggggggtggtatggagcaaggggcaagttgggaagacaacctgtagggcctgcggggtctattgggaaccaagctggagtgcagtggcacaatcttggctcactgcaatctccgcctcctgggttcaagcgattctcctgcctcagcctcccgagttgttgggattccaggcatgcatgaccaggctcagctaatttttgtttttttggtagagacggggtttcaccatattggccaggctggtctccaactcctaatctcaggtgatctacccaccttggcctcccaaattgctgggattacaggcgtgaaccactgctcccttccctgtcctt(SEQ ID NO:9)。

在本发明的一些实施方案中，右侧(第二)ITR具有以下核酸序列：aggaacccctagtgatggagttggccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccgggctttgcccgggcggcctcagtgagcgagcgagcgcgcagctgcctgcagg(SEQ ID NO:10)。

在本发明的一些实施方案中，表达盒包括选自以下的核苷酸序列：cctgcaggcagctgcgcgctcgctcgctcactgaggccgcccgggcgtcgggcgacctttggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcactaggggttcctgcggccgcacgcgtgccgccaccATGGtcgagcttgggctgcaggtcgagggcactgggaggatgttgagtaagatggaaaactactgatgacccttgcagagacagagtattaggacatgtttgaacaggggccggcgatcagcaggtagctctagaggatccccgtctgtctgcacatttcgtagagcgagtgttccgatactctaatctccctaggcaaggttcatatttgtgtaggttacttattctccttttgttgactaagtcaataatcagaatcagcaggtttggagtcagcttggcagggatcagcagcctgggttggaaggagggggtataaaagccccttcaccaggagaagccgtcacacagatccacaagctcctgacaggaagctctaggtgactctcttaaggtagcctccgcggattcgaatcccggccgggaacggtgcattggaacgcggattccccgtgccaagagtgacgtaagtaccgcctatagagtctataggcccacaaaaaatgctttcttcttttaatatacttttttgtttatcttatttctaatactttccctaatctctttctttcagggcaataatgatacaatgtatcatgcctctttgcaccattctaaagaataacagtgataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgtaagaggtttcatattgctaatagcagctacaatccagctaccattctgcttttattttatggttgggataaggctggattattctgagtccaagctaggcccttttgctaatcatgttcatacctcttatcttcctcccacagctcctgggcaacgtgctggtctgtgtgctggcccatcactttggcaaagaattgggattcgaacatCGATATGCAGCGGGTCAACATGATCATGGCGGAGTCGCCGGGCCTGATCACGATCTGCCTCCTCGGGTACCTGCTCTCCGCCGAGTGCACCGTGTTCCTGGACCACGAGAACGCCAACAAGATCCTCAACCGGCCCAAGCGCTACAACTCCGGCAAGCTGGAGGAGTTCGTGCAGGGGAACCTCGAGCGCGAGTGCATGGAGGAGAAGTGCTCGTTCGAGGAGGCGCGGGAGGTGTTCGAGAACACCGAGCGCACCACGGAGTTCTGGAAGCAGTACGTGGACGGGGACCAGTGCGAGTCGAACCCGTGCCTCAACGGGGGGTCGTGCAAGGACGACATCAACTCGTACGAGTGCTGGTGCCCCTTCGGCTTCGAGGGCAAGAACTGCGAGCTGGACGTGACCTGCAACATCAAGAACGGGCGCTGCGAGCAGTTCTGCAAGAACAGCGCCGACAACAAGGTGGTCTGCTCCTGCACCGAGGGGTACCGCCTCGCGGAGAACCAGAAGTCCTGCGAGCCGGCCGTGCCCTTCCCCTGCGGCCGCGTGTCCGTCAGCCAGACGTCGAAGCTGACGCGCGCCGAGACCGTCTTCCCGGACGTGGACTACGTGAACTCGACGGAGGCCGAGACCATCCTGGACAACATCACCCAGAGCACCCAGTCCTTCAACGACTTCACGCGGGTGGTCGGCGGCGAGGACGCCAAGCCCGGGCAGTTCCCGTGGCAGGTCGTCCTCAACGGGAAGGTCGACGCGTTCTGCGGCGGGAGCATCGTGAACGAGAAGTGGATCGTGACCGCCGCGCACTGCGTCGAGACGGGCGTGAAGATCACCGTGGTGGCCGGGGAGCACAACATCGAGGAGACGGAGCACACCGAGCAGAAGCGGAACGTGATCCGCATCATCCCGCACCACAACTACAACGCCGCCATCAACAAGTACAACCACGACATCGCGCTCCTCGAGCTGGACGAGCCGCTGGTCCTCAACTCCTACGTCACGCCGATCTGCATCGCCGACAAGGAGTACACGAACATCTTCCTGAAGTTCGGGAGCGGCTACGTCTCGGGCTGGGGCCGCGTGTTCCACAAGGGGCGCAGCGCGCTCGTGCTCCAGTACCTGCGGGTCCCCCTGGTCGACCGCGCGACCTGCCTCCTCTCCACGAAGTTCACGATCTACAACAACATGTTCTGCGCGGGGTTCCACGAGGGCGGCCGGGACAGCTGCCAGGGCGACAGCGGGGGCCCGCACGTGACGGAGGTGGAGGGCACGAGCTTCCTGACCGGGATCATCTCGTGGGGCGAGGAGTGCGCGATGAAGGGGAAGTACGGCATCTACACCAAGGTCAGCCGGTACGTGAACTGGATCAAGGAGAAGACGAAGCTGACGTGATGAAgatctacgggtggcatccctgtgacccctccccagtgccCctcctggccctggaagttgccactccagtgcccaccagccttgtcctaataaaattaagttgcatcattttgtctgactaggtgtccttctataatattatggggtggaggggggtggtatggagcaaggggcaagttgggaagacaacctgtagggcctgcggggtctattgggaaccaagctggagtgcagtggcacaatcttggctcactgcaatctccgcctcctgggttcaagcgattctcctgcctcagcctcccgagttgttgggattccaggcatgcatgaccaggctcagctaatttttgtttttttggtagagacggggtttcaccatattggccaggctggtctccaactcctaatctcaggtgatctacccaccttggcctcccaaattgctgggattacaggcgtgaaccactgctcccttccctgtccttctgattttgtaggtaaccacgtgcggaccgagcggccgcaggaacccctagtgatggagttggccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccgggctttgcccgggcggcctcagtgagcgagcgagcgcgcagctgcctgcagg(SEQ IDNO:3)

或

cctgcaggcagctgcgcgctcgctcgctcactgaggccgcccgggcgtcgggcgacctttggtcgcccggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcactaggggttcctgcggccgcacgcgtgccgccaccATGGtcgagcttgggctgcaggtcgagggcactgggaggatgttgagtaagatggaaaactactgatgacccttgcagagacagagtattaggacatgtttgaacaggggccggcgatcagcaggtagctctagaggatccccgtctgtctgcacatttcgtagagcgagtgttccgatactctaatctccctaggcaaggttcatatttgtgtaggttacttattctccttttgttgactaagtcaataatcagaatcagcaggtttggagtcagcttggcagggatcagcagcctgggttggaaggagggggtataaaagccccttcaccaggagaagccgtcacacagatccacaagctcctgacaggaagctctaggtgactctcttaaggtagcctccgcggattcgaatcccggccgggaacggtgcattggaacgcggattccccgtgccaagagtgacgtaagtaccgcctatagagtctataggcccacaaaaaatgctttcttcttttaatatacttttttgtttatcttatttctaatactttccctaatctctttctttcagggcaataatgatacaatgtatcatgcctctttgcaccattctaaagaataacagtgataatttctgggttaaggcaatagcaatatttctgcatataaatatttctgcatataaattgtaactgatgtaagaggtttcatattgctaatagcagctacaatccagctaccattctgcttttattttatggttgggataaggctggattattctgagtccaagctaggcccttttgctaatcatgttcatacctcttatcttcctcccacagctcctgggcaacgtgctggtctgtgtgctggcccatcactttggcaaagaattgggattcgaacatcgatataaATGCAGCGGGTGAACATGATCATGGCCGAGTCCCCAGGCCTGATTACCATCTGTCTGCTGGGCTACCTGCTGAGCGCCGAATGCACCGTGTTTCTGGACCACGAGAACGCCAACAAGATCCTGAACCGCCCTAAGCGGTACAACTCCGGCAAGCTGGAGGAGTTTGTGCAGGGCAATCTGGAGCGGGAGTGTATGGAGGAGAAGTGCAGCTTCGAGGAGGCCAGGGAGGTGTTCGAGAACACCGAGAGGACCACCGAGTTCTGGAAGCAGTATGTGGACGGCGACCAGTGCGAGTCTAATCCTTGTCTGAATGGCGGGAGCTGCAAGGACGACATCAACAGCTACGAGTGCTGGTGCCCTTTCGGCTTCGAGGGCAAGAATTGCGAGCTGGACGTGACCTGCAACATCAAGAACGGCCGGTGTGAGCAGTTCTGCAAGAACAGCGCCGACAACAAGGTGGTGTGCTCCTGCACCGAGGGATACAGGCTGGCCGAGAATCAGAAGAGCTGTGAGCCCGCCGTGCCATTCCCCTGTGGCAGAGTGTCTGTGAGCCAGACCAGCAAGCTGACCAGAGCCGAGACCGTGTTTCCAGACGTGGACTACGTGAACAGCACCGAGGCCGAGACCATCCTGGATAATATCACCCAGTCCACCCAGAGCTTCAACGACTTCACCAGAGTGGTGGGAGGCGAGGATGCCAAGCCAGGACAGTTTCCCTGGCAGGTGGTGCTGAATGGCAAGGTGGACGCCTTCTGCGGAGGCAGCATCGTGAACGAGAAGTGGATTGTGACCGCAGCCCACTGCGTGGAGACTGGCGTGAAGATTACCGTGGTCGCCGGCGAGCACAATATCGAAGAGACCGAGCACACCGAGCAGAAGCGCAACGTGATCCGGATCATCCCTCACCACAACTACAACGCAGCCATCAACAAGTACAACCACGACATCGCCCTGCTGGAGCTGGACGAGCCACTGGTGCTGAACTCTTACGTGACCCCTATCTGCATCGCCGACAAGGAGTACACCAACATCTTCCTGAAGTTCGGCAGCGGCTACGTGAGCGGATGGGGCAGAGTGTTTCACAAGGGCAGGAGCGCCCTGGTGCTGCAGTATCTGAGAGTGCCACTGGTGGACAGAGCTACCTGCCTGCTGAGCACCAAGTTCACCATCTACAACAACATGTTCTGCGCCGGCTTCCACGAGGGGGGAAGAGACTCTTGCCAGGGCGATTCCGGCGGACCACACGTGACCGAAGTGGAGGGCACCAGCTTCCTGACCGGCATCATCTCCTGGGGCGAGGAATGCGCCATGAAGGGCAAGTACGGCATCTACACCAAGGTGAGCAGGTACGTGAACTGGATCAAGGAGAAGACCAAGCTGACCtgaagatctacgggtggcatccctgtgacccctccccagtgccCctcctggccctggaagttgccactccagtgcccaccagccttgtcctaataaaattaagttgcatcattttgtctgactaggtgtccttctataatattatggggtggaggggggtggtatggagcaaggggcaagttgggaagacaacctgtagggcctgcggggtctattgggaaccaagctggagtgcagtggcacaatcttggctcactgcaatctccgcctcctgggttcaagcgattctcctgcctcagcctcccgagttgttgggattccaggcatgcatgaccaggctcagctaatttttgtttttttggtagagacggggtttcaccatattggccaggctggtctccaactcctaatctcaggtgatctacccaccttggcctcccaaattgctgggattacaggcgtgaaccactgctcccttccctgtccttctgattttgtaggtaaccacgtgcggaccgagcggccgcaggaacccctagtgatggagttggccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccgggctttgcccgggcggcctcagtgagcgagcgagcgcgcagctgcctgcagg(SEQ ID NO:5)。

在一方面，本发明涉及包括上述密码子优化核酸或上述表达盒的任一种的表达载体。

在本发明的一些实施方案中，载体是质粒，即另外的DNA区段可连接至其中的环状双链DNA片段。

在本发明的一些实施方案中，载体是病毒载体，其中另外的DNA区段可以连接到病毒基因组中。

在本发明的一些实施方案中，载体能够在引入它们的宿主细胞中自主复制(例如具有细菌复制起点的细菌载体和附加型哺乳动物载体)。在本发明的其他实施方案中，载体(例如非附加型哺乳动物载体)可以在引入宿主细胞后整合到宿主细胞的基因组中，并由此与宿主基因一起复制。此外，某些载体能够指导与它们可操作地连接的基因的表达。此类载体在本文中称为“重组表达载体”(或简称为“表达载体”)。

表达载体包括质粒、逆转录病毒、腺病毒、腺相关病毒(AAV)、植物病毒(诸如花椰菜花叶病毒、烟草花叶病毒)、粘粒、YAC、EBV衍生的附加体等等。DNA分子可以连接到载体中，使得载体内的转录和翻译控制序列发挥它们调节DNA的转录和翻译的预期功能。可以选择与所用的表达宿主细胞相容的表达载体和表达控制序列。可以通过标准方法(例如互补限制性位点的连接，或者如果不存在限制性位点，则平端连接)，将DNA分子引入到表达载体中。

重组表达载体还可以编码促进目的蛋白从宿主细胞分泌的前导肽(或信号肽)。可以将目的蛋白的基因克隆到载体中，使得信号肽与目的蛋白的氨基末端框内连接。前导肽(或信号肽)可以是免疫球蛋白前导肽或其他前导肽(即非免疫球蛋白前导肽)。

除了本发明的FIX基因外，本发明的载体的重组表达可以携带控制宿主细胞中FIX基因表达的调控序列。本领域技术人员将理解的是，表达载体的设计，包括调控序列的选择，可取决于诸如待转化的宿主细胞的选择、所需蛋白的表达水平等因素。哺乳动物中表达宿主细胞的优选控制序列包括确保哺乳动物细胞中高水平的蛋白表达的病毒元件，诸如衍生自以下的启动子和/或增强子：逆转录病毒LTR、巨细胞病毒(CMV)(诸如CMV启动子/增强子)、猿猴病毒40(SV40)(诸如SV40启动子/增强子)、腺病毒(例如主要晚期启动子腺病毒(AdMLP))、多瘤病毒以及强哺乳动物启动子，诸如TTR启动子、天然免疫球蛋白启动子或肌动蛋白启动子。

术语“控制序列”是指在特定宿主生物体中表达可操作地连接的编码序列所需的DNA序列。适于原核生物的控制序列例如为启动子、任选的操纵子序列和核糖体结合位点。已知真核细胞包括启动子、多聚腺苷酸化信号和增强子。

在本说明书中使用的术语“启动子”或“转录调控序列”或“调控序列”是指核酸片段，其控制一个或多个编码序列的转录，并且其相对于从编码序列的转录起始位点的转录方向，就读取方向而言位于上游，并且在结构上通过DNA依赖性RNA聚合酶的结合位点、转录起始位点和任何其他DNA序列(包括但不限于转录因子结合位点、阻遏蛋白和激活蛋白结合位点、以及本领域技术人员已知的直接或间接与所述启动子一起调节转录水平的任何其他核苷酸序列)的存在来鉴定。“组成型”启动子是在典型生理和发育条件下在大多数组织中有活性的启动子。“诱导型”启动子受到生理或发育调节(例如在化学诱导剂的影响下)的启动子。“组织特异性”启动子仅在特定类型的组织或细胞中是有活性的。

本文中使用的术语“增强子(enhancers)”或“增强子(enhancer)”可以是指与编码重组产物的DNA序列相邻定位的DNA序列。增强子元件通常位于启动子元件的5’方向，或可位于编码DNA序列(例如转录或翻译成一种或多种重组产物的DNA序列)的下游或内部。因此，增强子元件可位于编码重组产物的DNA序列上游或所述序列下游的100个碱基对、200个碱基对或300个或更多碱基对处。增强子元件可以提高从DNA序列表达的重组产物的量至高于与单个启动子元件相关的表达水平。本领域的普通技术人员容易获得多个增强子元件。

除上述基因和调控序列外，本发明的重组表达载体可以携带另外的序列，诸如调节载体在宿主细胞中的复制的序列(例如复制起点)和选择标记基因。选择标记基因促进载体已引入其中的宿主细胞的选择(参见例如美国专利号4,399,216、4,634,665和5,179,017)。例如，选择标记基因通常赋予载体已引入其中的宿主细胞对药剂(诸如G418、氨苄青霉素、潮霉素或甲氨蝶呤)的抗性。例如，选择标记基因包括二氢叶酸还原酶(DHFR)基因(用于在甲氨蝶呤选择/扩增期间的dhfr-宿主细胞中)、neo基因(用于G418选择)和谷氨酸合成酶基因。

本说明书中使用的术语“表达控制序列”是指实现与其连接的编码序列的表达和加工所需的多核苷酸序列。表达控制序列包括适当的转录起始、终止、启动子和增强子序列；有效的RNA加工信号，诸如剪接和多聚腺苷酸化信号；稳定细胞质mRNA的序列；增强翻译效率的序列(即Kozak共有序列)；增强蛋白稳定性的序列；以及在需要时，增强蛋白分泌的序列。此类控制序列的性质根据宿主生物体而不同；在原核生物中，此类控制序列通常包括核糖体结合位点的启动子和转录终止序列；在真核生物中，通常，此类控制序列包括启动子和转录终止序列。术语“控制序列”至少包括其存在对于表达和加工是必需的所有组分，并且还可以包括其存在是有利的另外的组分，例如前导序列和融合伴侣序列。

本文中使用的术语“可操作地连接”是指多核苷酸(或多肽)元件以功能关系形式的连接。当核酸与另一核酸序列以功能关系条件存在时，核酸是“可操作地连接的”。例如，如果转录调控序列影响所述编码序列的转录，则它与编码序列可操作地连接。术语“可操作地连接”意指连接的DNA序列通常是连续的，并且在有必要连接两个蛋白编码区的情况下也是连续的并且存在于阅读框中。

在本发明的一个实施方案中，“表达载体”涉及包含一种或多种目的多核苷酸序列、目的基因或“转基因”(其侧翼为细小病毒序列或反向末端重复(ITR)序列)的载体。

本发明的盒和载体均不包含编码腺相关病毒的非结构蛋白(Rep)和结构蛋白(Cap)的基因的核苷酸序列。

基于AAV5(腺相关病毒血清型5)的重组病毒

在一方面，本发明涉及用于提高目标细胞中的FIX基因表达的分离的基于AAV5(腺相关病毒血清型5)的重组病毒，所述重组病毒包含上述密码子优化核酸或上述表达盒的任一种。

本说明书中使用的术语“基于AAV的重组病毒”(或“基于AAV的病毒样颗粒”或“AAV重组病毒株”或“AAV重组载体”或“rAAV载体”)是指包裹在AAV衣壳内的上述表达盒(或上述表达载体)。

在其他替代产物中，Cap基因编码3种衣壳蛋白(VP1、VP2和VP3)。VP1、VP2和VP3以1:1:10的比率存在，以形成二十面体衣壳(Xie Q等人,The atomic structure of adeno-associated virus(AAV-2),a vector for human gene therapy.Proc Natl Acad SciUSA,2002；99:10405-10410)。这些基因的转录从单个启动子p40开始。相应蛋白(VP1、VP2和VP3)的分子量分别为87、72和62kDa。所有三种蛋白均翻译自单一的mRNA。在转录后，前mRNA可以以两种不同的方式剪接，其中较长或较短的内含子被切除以形成各种核苷酸长度的mRNA。

在产生基于AAV(rAAV)的重组病毒期间，将侧翼为ITR的表达盒包装到AAV衣壳中。如上文提及的，AAV复制所需的基因不包括在盒中。

表达盒DNA以大约3000个核苷酸长的单链DNA分子(ssDNA)的形式包装到病毒衣壳中。一旦细胞被病毒感染，单链DNA就转化为双链DNA (dsDNA)的形式。dsDNA仅可被细胞的蛋白使用，其将本发明的一种或多种基因转录为RNA。

在本发明的一些实施方案中，基于AAV5的重组病毒具有包含AAV5蛋白VP1的衣壳。

在本发明的一些实施方案中，基于AAV5的重组病毒具有包含AAV5蛋白VP1的衣壳，所述AAV5蛋白VP1具有以下氨基酸序列：

MSFVDHPPDWLEEVGEGLREFLGLEAGPPKPKPNQQHQDQARGLVLPGYNYLGPGNGLD

RGEPVNRADEVAREHDISYNEQLEAGDNPYLKYNHADAEFQEKLADDTSFGGNLGKAVFQ

AKKRVLEPFGLVEEGAKTAPTGKRIDDHFPKRKKARTEEDSKPSTSSDAEAGPSGSQQLQIP

AQPASSLGADTMSAGGGGPLGDNNQGADGVGNASGDWHCDSTWMGDRVVTKSTRTWV

LPSYNNHQYREIKSGSVDGSNANAYFGYSTPWGYFDFNRFHSHWSPRDWQRLINNYWGFR

PRSLRVKIFNIQVKEVTVQDSTTTIANNLTSTVQVFTDDDYQLPYVVGNGTEGCLPAFPPQV

FTLPQYGYATLNRDNTENPTERSSFFCLEYFPSKMLRTGNNFEFTYNFEEVPFHSSFAPSQNL

FKLANPLVDQYLYRFVSTNNTGGVQFNKNLAGRYANTYKNWFPGPMGRTQGWNLGSGVN

RASVSAFATTNRMELEGASYQVPPQPNGMTNNLQGSNTYALENTMIFNSQPANPGTTATYL

EGNMLITSESETQPVNRVAYNVGGQMATNNQSSTTAPATGTYNLQEIVPGSVWMERDVYL

QGPIWAKIPETGAHFHPSPAMGGFGLKHPPPMMLIKNTPVPGNITSFSDVPVSSFITQYSTGQ

VTVEMEWELKKENSKRWNPEIQYTNNYNDPQFVDFAPDSTGEYRTTRPIGTRYLTRPL(SEQ ID NO:11)。

在本发明的一些实施方案中，基于AAV5的重组病毒具有包含AAV5蛋白VP2的衣壳。

在本发明的一些实施方案中，基于AAV5的重组病毒具有包含AAV5蛋白VP2的衣壳，所述AAV5蛋白VP2具有以下氨基酸序列：

TAPTGKRIDDHFPKRKKARTEEDSKPSTSSDAEAGPSGSQQLQIPAQPASSLGADTMSAGGG

GPLGDNNQGADGVGNASGDWHCDSTWMGDRVVTKSTRTWVLPSYNNHQYREIKSGSVD

GSNANAYFGYSTPWGYFDFNRFHSHWSPRDWQRLINNYWGFRPRSLRVKIFNIQVKEVTV

QDSTTTIANNLTSTVQVFTDDDYQLPYVVGNGTEGCLPAFPPQVFTLPQYGYATLNRDNTE

NPTERSSFFCLEYFPSKMLRTGNNFEFTYNFEEVPFHSSFAPSQNLFKLANPLVDQYLYRFVS

TNNTGGVQFNKNLAGRYANTYKNWFPGPMGRTQGWNLGSGVNRASVSAFATTNRMELE

GASYQVPPQPNGMTNNLQGSNTYALENTMIFNSQPANPGTTATYLEGNMLITSESETQPVN

RVAYNVGGQMATNNQSSTTAPATGTYNLQEIVPGSVWMERDVYLQGPIWAKIPETGAHFHP

SPAMGGFGLKHPPPMMLIKNTPVPGNITSFSDVPVSSFITQYSTGQVTVEMEWELKKENSKRWNPEIQYTNNYNDPQFVDFAPDSTGEYRTTRPIGTRYLTRPL(SEQ ID NO:12)。

在本发明的一些实施方案中，基于AAV5的重组病毒具有包含AAV5蛋白VP3的衣壳。

在本发明的一些实施方案中，基于AAV5的重组病毒具有包含AAV5蛋白VP3的衣壳，所述AAV5蛋白VP3具有以下氨基酸序列：

MSAGGGGPLGDNNQGADGVGNASGDWHCDSTWMGDRVVTKSTRTWVLPSYNNHQYRE

IKSGSVDGSNANAYFGYSTPWGYFDFNRFHSHWSPRDWQRLINNYWGFRPRSLRVKIFNIQ

VKEVTVQDSTTTIANNLTSTVQVFTDDDYQLPYVVGNGTEGCLPAFPPQVFTLPQYGYATL

NRDNTENPTERSSFFCLEYFPSKMLRTGNNFEFTYNFEEVPFHSSFAPSQNLFKLANPLVDQ

YLYRFVSTNNTGGVQFNKNLAGRYANTYKNWFPGPMGRTQGWNLGSGVNRASVSAFATT

NRMELEGASYQVPPQPNGMTNNLQGSNTYALENTMIFNSQPANPGTTATYLEGNMLITSES

ETQPVNRVAYNVGGQMATNNQSSTTAPATGTYNLQEIVPGSVWMERDVYLQGPIWAKIPET

GAHFHPSPAMGGFGLKHPPPMMLIKNTPVPGNITSFSDVPVSSFITQYSTGQVTVEMEWELKKENSKRWNPEIQYTNNYNDPQFVDFAPDSTGEYRTTRPIGTRYLTRPL(SEQ ID NO:13)。

在本发明的一些实施方案中，基于AAV5的重组病毒具有包含AAV5蛋白VP1、VP2和VP3的衣壳。

在本发明的一些实施方案中，基于AAV5的重组病毒具有衣壳，所述衣壳包含具有SEQ ID NO:11的氨基酸序列的蛋白VP1、具有SEQ ID NO:12的氨基酸序列的VP2、和具有SEQID NO:13的氨基酸序列的VP3。

在本发明的一些实施方案中，基于AAV5的重组病毒具有包含AAV5蛋白VP1的衣壳，所述AAV5蛋白VP1具有含一个或多个点突变的SEQ ID NO:11的氨基酸序列。

在本发明的一些实施方案中，基于AAV5的重组病毒具有包含AAV5蛋白VP1的衣壳，所述AAV5蛋白VP1具有在野生型AAV5 VP1(SEQ ID NO:11)的位置S2A和T711S处包括氨基酸置换的氨基酸序列，并具有以下氨基酸序列：

MAFVDHPPDWLEEVGEGLREFLGLEAGPPKPKPNQQHQDQARGLVLPGYNYLGPGNGLD

RGEPVNRADEVAREHDISYNEQLEAGDNPYLKYNHADAEFQEKLADDTSFGGNLGKAVFQ

AKKRVLEPFGLVEEGAKTAPTGKRIDDHFPKRKKARTEEDSKPSTSSDAEAGPSGSQQLQIP

AQPASSLGADTMSAGGGGPLGDNNQGADGVGNASGDWHCDSTWMGDRVVTKSTRTWV

LPSYNNHQYREIKSGSVDGSNANAYFGYSTPWGYFDFNRFHSHWSPRDWQRLINNYWGFR

PRSLRVKIFNIQVKEVTVQDSTTTIANNLTSTVQVFTDDDYQLPYVVGNGTEGCLPAFPPQV

FTLPQYGYATLNRDNTENPTERSSFFCLEYFPSKMLRTGNNFEFTYNFEEVPFHSSFAPSQNL

FKLANPLVDQYLYRFVSTNNTGGVQFNKNLAGRYANTYKNWFPGPMGRTQGWNLGSGVN

RASVSAFATTNRMELEGASYQVPPQPNGMTNNLQGSNTYALENTMIFNSQPANPGTTATYL

EGNMLITSESETQPVNRVAYNVGGQMATNNQSSTTAPATGTYNLQEIVPGSVWMERDVYL

QGPIWAKIPETGAHFHPSPAMGGFGLKHPPPMMLIKNTPVPGNITSFSDVPVSSFITQYSTGQ

VTVEMEWELKKENSKRWNPEIQYTNNYNDPQFVDFAPDSTGEYRSTRPIGTRYLTRPL(SEQ ID NO:14)。

在本发明的一些实施方案中，基于AAV5的重组病毒具有包含AAV5蛋白VP2的衣壳，所述AAV5蛋白VP2具有含一个或多个点突变的SEQ ID NO:12的氨基酸序列。

在本发明的一些实施方案中，基于AAV5的重组病毒具有包含AAV5蛋白VP2的衣壳，所述AAV5蛋白VP2具有在野生型AAV5 VP2(SEQ ID NO:12)的位置T575S处包括氨基酸置换的氨基酸序列，并具有以下氨基酸序列：

TAPTGKRIDDHFPKRKKARTEEDSKPSTSSDAEAGPSGSQQLQIPAQPASSLGADTMSAGGG

GPLGDNNQGADGVGNASGDWHCDSTWMGDRVVTKSTRTWVLPSYNNHQYREIKSGSVD

GSNANAYFGYSTPWGYFDFNRFHSHWSPRDWQRLINNYWGFRPRSLRVKIFNIQVKEVTV

QDSTTTIANNLTSTVQVFTDDDYQLPYVVGNGTEGCLPAFPPQVFTLPQYGYATLNRDNTE

NPTERSSFFCLEYFPSKMLRTGNNFEFTYNFEEVPFHSSFAPSQNLFKLANPLVDQYLYRFVS

TNNTGGVQFNKNLAGRYANTYKNWFPGPMGRTQGWNLGSGVNRASVSAFATTNRMELE

GASYQVPPQPNGMTNNLQGSNTYALENTMIFNSQPANPGTTATYLEGNMLITSESETQPVN

RVAYNVGGQMATNNQSSTTAPATGTYNLQEIVPGSVWMERDVYLQGPIWAKIPETGAHFHP

SPAMGGFGLKHPPPMMLIKNTPVPGNITSFSDVPVSSFITQYSTGQVTVEMEWELKKENSKRWNPEIQYTNNYNDPQFVDFAPDSTGEYRSTRPIGTRYLTRPL(SEQ ID NO:15)。

在本发明的一些实施方案中，基于AAV5的重组病毒具有包含AAV5蛋白VP3的衣壳，所述AAV5蛋白VP3具有含一个或多个点突变的SEQ ID NO:13的氨基酸序列。

在本发明的一些实施方案中，基于AAV5的重组病毒具有包含AAV5蛋白VP3的衣壳，所述AAV5蛋白VP3具有在野生型AAV5 VP3(SEQ ID NO:13)的位置T519S处包括氨基酸置换的氨基酸序列，并具有以下氨基酸序列：

MSAGGGGPLGDNNQGADGVGNASGDWHCDSTWMGDRVVTKSTRTWVLPSYNNHQYRE

IKSGSVDGSNANAYFGYSTPWGYFDFNRFHSHWSPRDWQRLINNYWGFRPRSLRVKIFNIQ

VKEVTVQDSTTTIANNLTSTVQVFTDDDYQLPYVVGNGTEGCLPAFPPQVFTLPQYGYATL

NRDNTENPTERSSFFCLEYFPSKMLRTGNNFEFTYNFEEVPFHSSFAPSQNLFKLANPLVDQ

YLYRFVSTNNTGGVQFNKNLAGRYANTYKNWFPGPMGRTQGWNLGSGVNRASVSAFATT

NRMELEGASYQVPPQPNGMTNNLQGSNTYALENTMIFNSQPANPGTTATYLEGNMLITSES

ETQPVNRVAYNVGGQMATNNQSSTTAPATGTYNLQEIVPGSVWMERDVYLQGPIWAKIPET

GAHFHPSPAMGGFGLKHPPPMMLIKNTPVPGNITSFSDVPVSSFITQYSTGQVTVEMEWELKKENSKRWNPEIQYTNNYNDPQFVDFAPDSTGEYRSTRPIGTRYLTRPL(SEQ ID NO:16)。

在本发明的一些实施方案中，基于AAV5的重组病毒具有衣壳，所述衣壳包含具有含一个或多个点突变的SEQ ID NO:11的氨基酸序列的蛋白VP1、具有含一个或多个点突变的SEQ ID NO:12的氨基酸序列的VP2、和具有含一个或多个点突变的SEQ ID NO:13的氨基酸序列的VP3。

在本发明的一些实施方案中，基于AAV5的重组病毒具有衣壳，所述衣壳包含具有SEQ ID NO:14的氨基酸序列的蛋白VP1、具有SEQ ID NO:15的氨基酸序列的VP2、和具有SEQID NO:16的氨基酸序列的VP3。

短语“多个点突变”是指两个、三个、四个、五个、六个、七个、八个、九个或十个点置换。

特别优选的实施方案包括性质上保守的置换(突变)，即发生在根据其侧链加入的氨基酸家族内的置换。特别地，氨基酸通常分为四个家族：(1)酸性氨基酸为天冬氨酸和谷氨酸；(2)碱性氨基酸为赖氨酸、精氨酸、组氨酸；(3)非极性氨基酸为丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、蛋氨酸、色氨酸，以及(4)不带电荷的极性氨基酸为甘氨酸、天冬酰胺、谷氨酰胺、半胱氨酸、丝氨酸、苏氨酸、酪氨酸。苯丙氨酸、色氨酸和酪氨酸有时被分类为芳族氨基酸。例如，可以合理地预测，将亮氨酸单独置换为异亮氨酸或缬氨酸、将天冬氨酸单独置换为谷氨酸、将苏氨酸单独置换为丝氨酸、或将氨基酸类似地保守置换为结构相关的氨基酸将不会对生物活性具有重大影响。例如，目的多肽可包括至多大约5-10个保守或非保守氨基酸置换，只要分子的所需功能保持完整即可。

使用氨基酸置换的AAV5蛋白VP1、VP2或VP3的序列中的点突变变体是用另一氨基酸残基置换AAV5蛋白VP1、VP2或VP3中的至少一个氨基酸残基。

保守置换显示在表A中的“优选置换”下。

在本发明的一些实施方案中，基于AAV5的重组病毒具有包含AAV5蛋白VP1的衣壳，所述AAV5蛋白VP1具有SEQ ID NO:11的氨基酸序列或含一个或多个点突变的SEQ ID NO:11的氨基酸序列，并且表达盒在5’端至3’端方向上包括以下元件：

左侧(第一)ITR(反向末端重复)；

TTR启动子(甲状腺素运载蛋白启动子)；

hBG1基因的内含子(人β珠蛋白基因的携带内含子的片段)；

上述密码子优化核酸；

hGH1多聚腺苷酸化信号(人生长激素基因多聚腺苷酸化信号)；

右侧(第二)ITR。

在本发明的一些实施方案中，基于AAV5的重组病毒具有衣壳，所述衣壳包含具有SEQ ID NO:11的氨基酸序列的AAV5蛋白VP1、具有SEQ ID NO:12的氨基酸序列的AAV5蛋白VP2、和具有SEQ ID NO:13的氨基酸序列的AAV5蛋白VP3，并且表达盒在5’端至3’端方向上包括以下元件：

左侧(第一)ITR(反向末端重复)；

TTR启动子(甲状腺素运载蛋白启动子)；

hBG1基因的内含子(人β珠蛋白基因的携带内含子的片段)；

上述密码子优化核酸；

hGH1多聚腺苷酸化信号(人生长激素基因多聚腺苷酸化信号)；

右侧(第二)ITR。

在本发明的一些实施方案中，基于AAV5的重组病毒具有衣壳，所述衣壳包含具有含一个或多个点突变的SEQ ID NO:11的氨基酸序列的AAV5蛋白VP1、具有含一个或多个点突变的SEQ ID NO:12的氨基酸序列的AAV5蛋白VP2、和具有含一个或多个点突变的SEQ IDNO:13的氨基酸序列的AAV5蛋白VP3，并且表达盒在5’端至3’端方向上包括以下元件：

左侧(第一)ITR(反向末端重复)；

TTR启动子(甲状腺素运载蛋白启动子)；

hBG1基因的内含子(人β珠蛋白基因的携带内含子的片段)；

上述密码子优化核酸；

hGH1多聚腺苷酸化信号(人生长激素基因多聚腺苷酸化信号)；

右侧(第二)ITR。

在本发明的一些实施方案中，基于AAV5的重组病毒具有衣壳，所述衣壳包含具有SEQ ID NO:14的氨基酸序列的AAV5蛋白VP1、具有SEQ ID NO:15的氨基酸序列的AAV5蛋白VP2、和具有SEQ ID NO:16的氨基酸序列的AAV5蛋白VP3，并且表达盒在5’端至3’端方向上包括以下元件：

左侧(第一)ITR(反向末端重复)；

TTR启动子(甲状腺素运载蛋白启动子)；

hBG1基因的内含子(人β珠蛋白基因的携带内含子的片段)；

上述密码子优化核酸；

hGH1多聚腺苷酸化信号(人生长激素基因多聚腺苷酸化信号)；

右侧(第二)ITR。

在本发明的一些实施方案中，基于AAV5的重组病毒具有衣壳，所述衣壳包含具有SEQ ID NO:11的氨基酸序列或含一个或多个点突变的SEQ ID NO:11的氨基酸序列的AAV5蛋白VP1，并且表达盒包括选自以下的核苷酸序列：SEQ ID NO:3或SEQ ID NO:5。

在本发明的一些实施方案中，基于AAV5的重组病毒具有衣壳，所述衣壳包含具有SEQ ID NO:11的氨基酸序列的蛋白VP1、具有SEQ ID NO:12的氨基酸序列的VP2、和具有SEQID NO:13的氨基酸序列的VP3，并且表达盒包括选自以下的核苷酸序列：SEQ ID NO:3或SEQID NO:5。

在本发明的一些实施方案中，基于AAV5的重组病毒具有衣壳，所述衣壳包含具有含一个或多个点突变的SEQ ID NO:11的氨基酸序列的蛋白VP1、具有含一个或多个点突变的SEQ ID NO:12的氨基酸序列的VP2、和具有含一个或多个点突变的SEQ ID NO:13的氨基酸序列的VP3，并且表达盒包括选自以下的核苷酸序列：SEQ ID NO:3或SEQ ID NO:5。

在本发明的一些实施方案中，基于AAV5的重组病毒具有衣壳，所述衣壳包含具有SEQ ID NO:14的氨基酸序列的蛋白VP1、具有SEQ ID NO:15的氨基酸序列的VP2和具有SEQID NO:16的氨基酸序列的VP3，并且表达盒包括选自以下的核苷酸序列：SEQ ID NO:3或SEQID NO:5。

药物组合物

在一方面，本发明涉及用于将递送FIX基因至目标细胞的药物组合物，其包括与一种或多种药学上可接受的赋形剂组合的上述基于AAV5的重组病毒的任一种。

上述组合物中的活性物质以有效量存在，例如以生物有效量存在。

在特定实施方案中，本发明涉及包含在药学上可接受的载体中或在其他药剂、助剂、稀释剂等等中的本发明的基于AAV5的重组病毒的药物组合物。对于注射，载体将通常为液体载体。对于其他施用方法，载体可以是固体或液体，诸如无菌无热原水或无菌无热原磷酸盐缓冲盐水溶液。对于吸入施用，载体是可吸入的，并优选为固体或液体颗粒形式。作为注射介质，优选使用含有注射溶液剂常用的添加剂(诸如稳定剂、盐或盐水和/或缓冲液)的水。

“药物组合物”意指包含上述本发明的基于AAV5的重组病毒和至少一种选自以下的组分的组合物：药学上可接受的和药理学相容的赋形剂，诸如填充剂、溶剂、稀释剂、载体、助剂、分布剂、递送剂、防腐剂、稳定剂、乳化剂、悬浮剂、增稠剂、延长递送控制剂，其选择和比例取决于施用的类型和途径以及剂量。本发明的药物组合物及其制备方法对本领域技术人员将无疑是显而易见的。药物组合物应优选按照GMP(良好生产规范)要求制造。组合物可包含缓冲组合物、张力剂、稳定剂和增溶剂。

“药学上可接受的”意指不具有生物学或其他负面副作用的材料，例如，可以将该材料施用于受试者而不引起任何不期望的生物学效应。由此，此类药物组合物可用于例如离体转染细胞，或用于将本发明的基于AAV5的重组病毒体内直接施用于受试者。

术语“赋形剂”在本文中用于描述除上述本发明的成分之外的任何成分。这些是无机或有机性质的物质，其用于药物生产/制造中，以给予药物产品必要的物理化学特性。

“稳定剂”是指提供活性剂的物理和/或化学稳定性的赋形剂或者两种或更多种赋形剂的混合物。

术语“缓冲液”、“缓冲组合物”、“缓冲剂”是指能够通过其酸-碱共轭组分的作用来抵抗pH变化的溶液，其使rAAV5载体产品能够抵抗pH变化。通常，药物组合物优选具有在4.0至8.0范围内的pH。所用缓冲液的实例包括但不限于乙酸盐、磷酸盐、柠檬酸盐、组氨酸、琥珀酸盐等缓冲溶液。

如果活性剂在例如2-8℃的储存温度下，在指定的保质期期间保持其物理稳定性和/或化学稳定性和/或生物活性，则药物组合物是“稳定的”。优选地，活性剂保持物理和化学稳定性二者，以及生物活性。基于加速或自然老化条件下的稳定性测试结果来调整贮存期。

根据本发明的药物组合物可以以现成制剂形式，以单一单位剂量或多个单一单位剂量的形式来制造、包装或广泛销售。本文中使用的术语“单一单位剂量”是指含有预定量的活性成分的药物组合物的离散量。活性成分的量通常等于待在受试者中施用的活性成分的剂量，或此类剂量的方便部分，例如此类剂量的一半或三分之一。

用途

在一方面，本发明涉及上述基于AAV5的重组病毒的任一种或上述组合物用于将FIX基因递送至目标细胞的用途。

在一方面，本发明涉及将FIX基因递送至患有血友病B的受试者的目标细胞的方法，所述方法包括将上述基于AAV5的重组病毒的任一种或上述组合物施用到受试者的细胞中。

血友病B是指由凝血因子IX(FIX)不足或完全缺乏引起的遗传性凝血障碍。血友病B的患病率为大约40,000名新生男孩中1例。凝血因子不足伴随着关节、肌肉和内脏器官中的自发性或诱发性出血。

缺乏FIX基因的完全功能性拷贝是指基因组中FIX基因的所有拷贝的失活突变或缺失，其导致FIX基因功能的丧失或缺陷。

受试者是指适于本说明书中提供的技术的任何动物。在某些非限制性实施方案中，受试者是人。所述受试者可以是任何年龄的雄性或雌性。

需要将FIX基因递送至目标细胞的受试者、或需要提供FIX蛋白的受试者是指患有血友病B的受试者，或患有凝血因子IX不足的受试者，或在FIX基因中具有导致FIX基因功能丧失或缺陷的失活突变或缺失的受试者。

示例性施用模式包括局部应用、鼻内、吸入、经粘膜、经皮、肠内(例如口服、直肠)、肠胃外(例如静脉内、皮下、皮内、肌内)施用，以及直接组织或器官注射。

可以以常规形式，作为液体溶液或悬浮液、适于在注射前在液体中制备溶液或悬浮液的固体形式或作为乳液制备注射剂。备选地，可以以局部而非全身方式施用上述本发明的基于AAV5的重组病毒，例如在储库或缓释制剂中。

将基于AAV5的重组病毒以有效量引入生物体中。基于AAV5的重组病毒优选以生物有效量引入生物体中。重组病毒的“生物有效”量是足以引起转导和核酸序列在细胞中表达的量。如果将病毒体内施用于细胞(例如如下文所述，将病毒施用于受试者)，则病毒载体的“生物有效”量是足以引起转导和核酸序列在目标细胞中表达的量。

上述本发明的基于AAV5的重组病毒的剂量将取决于施用模式、特定的病毒载体，并且它们可以以常规方式来确定。用于实现治疗效果的示例性剂量为每千克至少大约10⁵、10⁶、10⁷、10⁸、10⁹、10¹⁰、10¹¹、10¹²、10¹³、10¹⁴、10¹⁵、10¹⁶个转导单位或更多，优选大约10⁹至10¹⁵个转导单位，再更优选10¹⁴个转导单位的病毒滴度。

施用上述本发明的基于AAV5的重组病毒的细胞可以是任何类型的细胞，包括但不限于上皮细胞(例如皮肤、呼吸道和肠道上皮细胞)、肝细胞、肌细胞、胰腺细胞(包括胰岛细胞)、肝细胞、脾细胞、成纤维细胞、内皮细胞等等。

上述本发明的基于AAV5的重组病毒不用于修饰人生殖系细胞的遗传完整性。

实施例

提供以下实施例以更好地理解本发明。这些实施例仅用于说明的目的，并且不应解释为以任何方式限制本发明的范围。

本说明书中引用的所有出版物、专利和专利申请均通过引用并入本文。尽管为了清楚理解的目的，已通过说明和实例的方式对前述发明进行了相当详细的描述，但根据本发明的教导，对本领域普通技术人员将显而易见的是可以在不偏离所附实施方案的精神或范围的情况下对其作出某些变化和修改。

材料和一般方法

重组DNA技术

如Sambrook,J等人,Molecular cloning:A laboratory manual；Cold SpringHarbor Laboratory Press,Cold Spring Harbor,New York,1989中所述，使用标准方法来操作DNA。根据制造商的方案使用分子生物学试剂。简而言之，在选择性抗生素压力下生长(使得质粒不会在细胞群体中丢失)的大肠杆菌细胞中产生质粒DNA用于进一步操作。我们使用商业试剂盒从细胞中分离质粒DNA，测量浓度，并将其用于通过限制性核酸内切酶处理或PCR扩增进行克隆。使用连接酶将DNA片段彼此连接，并转化到细菌细胞中用于选择克隆和进一步生产。通过限制性图谱和完整的Sanger测序确认所有所得遗传构建体。

基因合成

所需基因区段制备自通过化学合成制得的寡核苷酸。侧翼为独特的限制性位点的300至1000bp长的基因区段通过使寡核苷酸相互重叠地复性，随后从边界引物进行PCR扩增来收集。作为结果，产生了包括所需片段的片段混合物。将片段在限制性位点处克隆到中间载体中，其后通过DNA测序确定亚克隆片段的DNA序列。

DNA序列确定

通过Sanger测序来确定DNA序列。在SnapGene Viewer 4.2或更高版本中分析DNA和蛋白序列并处理序列数据，用于进行序列创建、映射、分析、注释和说明。

培养细胞培养物

实验使用HEK293(人胚胎肾克隆293)和HUH7(人肝细胞癌)细胞系。将用于产生AAV的悬浮的HEK293细胞在标准条件下在37℃和5％ CO₂下，在不含FBS和抗生素的完全培养基上培养。在标准条件下在37℃和5％ CO₂下，在补充有10％ FBS、抗生素/抗真菌剂的完全DMEM培养基上培养用于测试AAV产物效力的贴壁HUH7细胞。在达到80-90％汇合度时对HUH7细胞进行传代培养。TrypLE Select酶(10×)用于解离细胞单层。使用台盼蓝染色和一次性细胞计数室，使用自动Countess II计数器评估细胞活力。

AAV重组载体的病毒颗粒的组装和纯化

使用HEK293生产细胞组装包含FIX基因的密码子优化变体(hFIXco-v1和hFIXco-v2)的AAV病毒颗粒，所述HEK293生产细胞用如下3种质粒转染：

分别包含用于表达hFIXco-v1和hFIXco-v2转基因的AAV表达盒的质粒pAAV-hFIXco-v1和pAAV-hFIXco-v2(图1)；

用于表达AAV5血清型Cap基因和AAV2血清型Rep基因的质粒。每个基因使用可变阅读框编码几种蛋白产物；

用于表达AAV衣壳的组装和包装所需的Ad5(腺病毒血清型5)基因的质粒。

72小时后，将细胞裂解，并使用过滤、色谱法和超速离心方法纯化和浓缩病毒颗粒。用对重组病毒基因组的区域特异性的引物和样品，通过定量PCR确定病毒颗粒的滴度，并表示为每1mL的病毒基因组拷贝数。

细胞培养物的转导

将HUH7细胞系以10,000个细胞/cm²的密度预接种到12孔板的孔中。在细胞附着到粘性基底上之后，以500,000vg/细胞的MOI引入AAV制剂。如上所述，在转导后第7天，通过ELISA确定培养液中FIX蛋白的含量和活性，并通过逆转录-定量PCR确定细胞中凝血因子IX基因的表达水平。在6个独立实验中进行涉及评估培养液中FIX蛋白水平的研究。在3个独立实验中进行涉及评估分泌的FIX蛋白的活性和细胞中凝血因子IX基因表达水平的研究。将完整细胞用作阴性对照。

确定凝血因子IX基因表达水平

通过逆转录-定量PCR确定转导(或转染)后细胞培养物中的FIX基因表达水平。简而言之，使用RNeasy Plus mini试剂盒(Qiagen)根据制造商的方案从细胞沉淀物中分离RNA。使用GoScript试剂盒(Promega)根据制造商的方案进行逆转录；特别地，初始取样500ng的RNA用于逆转录反应，使用随机和寡聚dT引物产生cDNA；在逆转录后，用无菌水将cDNA的体积调节至50μl。在StepOne仪器(Applied Biosystems)上使用TaqMan技术，使用qPCRmix-HS HighRox反应混合物(Eurogene)根据制造商的方案进行定量PCR。我们选择了目标基因(FIX)和管家基因(GAPDH)的特异性引物和探针。使用携带相应基因的质粒DNA(plDNA)的样品绘制标准曲线。为了绘制每个标准曲线，准备7个标准样品。一系列稀释：每个反应从2千万个至200个拷贝的plDNA(稀释因子为1:10)。对每个测试样品，分析在三次技术重复中进行，并包括进行RT minus对照(以测试研究的RNA样品中没有DNA污染)和阴性对照。确定mRNA表达水平的结果以下列形式呈现：将样品中的目标基因mRNA拷贝数相对于GAPDH基因mRNA拷贝数归一化。

通过ELISA确定凝血因子IX蛋白的水平

使用商业试剂盒，通过非竞争性固相酶免疫测定(ELISA)的夹心法评估通过目标AAV5-FIX候选物进行HUH7转导后培养液中凝血因子IX蛋白的含量，以及引入目标病毒产物后动物血浆中凝血因子IX蛋白的含量。简而言之，将在稀释缓冲液中稀释的培养液和血浆样品引入用对凝血因子IX特异性的一抗敏化的96孔板孔中。在同一板上装载用于绘制校准曲线的标准品、阳性对照和阴性对照。将板在室温下温育2小时。在引入生物素化抗体、链霉抗生物素蛋白过氧化物酶缀合物溶液和TMB之前，用洗涤缓冲液洗涤板孔。引入含有针对因子IX的特异性生物素化检测抗体的溶液，并将板在室温下温育1小时。随后将链霉抗生物素蛋白过氧化物酶缀合物溶液添加到所得复合物中，并将板在室温下温育30分钟。引入TMB溶液以使酶反应可视化。在达到所需程度的染色强度后，向所有孔中加入终止溶液以终止反应。然后测量板孔中溶液的光密度。考虑到样品的初步稀释，通过校准曲线确定测试样品中凝血因子IX的浓度。

确定凝血因子IX蛋白的活性

凝血因子IX是维生素K依赖性的，并且通过细胞培养合成因子IX的活性形式需要在生长培养基中存在维生素K。在这方面，在HUH7的转导期间，将浓度为500ng/ml的维生素K1添加到完全生长培养基的组成中。

使用商业试剂盒，通过显色法评估用目标产物转导HUH7后培养液中凝血因子IX蛋白的活性。

简而言之，将在Tris-BSA反应缓冲液中稀释的培养液样品、标准品和对照溶液引入96孔板孔中。随后向其中加入试剂1(FX-FVIII)。在37℃的温度下温育2分钟后，引入试剂2(活化剂)。将板在37℃的温度下温育3分钟。随后将试剂3(显色底物)引入板孔中，并将板温育2分钟。随后加入20％乙酸溶液以终止反应。所得FXa水解显色底物，由此导致对硝基苯胺的释放，其量(通过光密度检测)与样品中的因子IX(FIX)浓度成正比。

实验动物的体内研究

实验在C57BL/6小鼠(6-8周龄的雄性)上进行。将产品通过单次静脉内注射到尾静脉中的方式施用于动物。将不含AAV的缓冲溶液施用到阴性对照组的动物中。在施用产品前在注射当天，并随后在施用产品后的第7、14、21、28、35和42天收集血浆。

实施例1.使用密码子优化算法修改FIX基因序列

我们开发的产品是携带表达盒的腺相关病毒血清型5(AAV5)的修饰重组衣壳的悬浮液，所述表达盒编码在肝组织特异性甲状腺素运载蛋白(TTR)启动子的控制下的人凝血因子IX(hFIX)基因。

采用的野生型核酸是编码具有天然存在的R338L突变(称为Padua突变)的野生型人凝血因子IX的核酸，并包括SEQ ID NO:17的核苷酸序列。将给定的野生型核酸用作对照。

此外，为了提高表达效率，使用密码子优化算法对凝血因子IX基因的天然序列进行修改。

具有SEQ ID NO:17的核苷酸序列的凝血因子IX的野生型核酸的密码子优化导致产生了许多密码子优化核酸，在基于AAV5的产品中进一步测试了这些密码子优化核酸与对照(具有SEQ ID NO:17的野生型核酸)相比的凝血因子IX蛋白表达水平和活性。

与野生型相比，所有密码子优化核酸均显示出凝血因子IX蛋白产生水平的提高；进一步地，与野生型相比，大多数密码子优化核酸显示出凝血因子IX蛋白产生水平的略微提高，并且仅有具有SEQ ID NO:2(hFIXco-v1)和SEQ ID NO:4(hFIXco-v2)的核苷酸序列的根据本发明的核酸的两种密码子优化变体出乎意料地显示出最佳结果，特别是提高的凝血因子IX基因的表达水平和提高至数倍的凝血因子IX蛋白产生水平，该事实又导致了包含SEQ ID NO:2(hFIXco-v1)或SEQ ID NO:4(hFIXco-v2)的基于AAV5的产品提高的活性(参见实施例2、3和4)。

与具有SEQ ID NO:17的核苷酸序列的野生型核酸相比，具有SEQ ID NO:2和SEQID NO:4的核苷酸序列的密码子优化核酸对哺乳动物细胞具有提高的密码子适应指数(用于评估序列的密码子使用频率的标准量度)。

具有SEQ ID NO:2和SEQ ID NO:4的核苷酸序列的密码子优化核酸在以下实施例中分别被称为hFIXco-v1和hFIXco-v2。

实施例2.包含具有重组密码子优化的凝血因子IX基因的变体(hFIXco-v1和hFIXco-v2)的AAV表达盒的遗传构建体的组装

意在用于产生具有包含凝血因子IX基因的密码子优化变体(SEQ ID NO:2或SEQID NO:4)的表达盒的AAV5病毒载体的目标质粒pAAV-hFIXco-v1或pAAV-hFIXco-v2(图1)通过使用限制性酶连接酶克隆方法，分别用从通过化学合成生成的寡核苷酸从头合成的凝血因子IX基因的密码子优化序列和TTR启动子连续替换原始构建体pAAV-GFP中经修饰的绿色荧光蛋白序列和CMV启动子来产生。

最终的载体含有在重组AAV基因组中表达和组装基因的所有必需元件：

1)在衣壳化到病毒衣壳中的序列末端的ITR；

2)用于表达目标基因的元件(启动子、增强子、内含子、Kozak序列、转基因、多聚腺苷酸化位点)；

3)细菌复制起点和抗生素抗性基因以在细菌细胞中产生质粒DNA。

实施例3.产生表达凝血因子IX的病毒产物

目标质粒pAAV-hFIXco-v1和pAAV-hFIXco-v2(图1)与产生重组AAV病毒颗粒所必需的其他质粒(参见上文)一起用于产生携带凝血因子IX基因的密码子优化版本(分别为hFIXco-v1和hFIXco-v2)的AAV5-hFIXco-v1和AAV5-hFIXco-v2产品。生物加工导致了包含具有凝血因子IX基因的密码子优化变体(hFIXco-v1和hFIXco-v2)的表达盒的重组AAV5-hFIXco-v1和AAV5-hFIXco-v2病毒颗粒。使用安全且不会改变AAV特性的标准缓冲液和赋形剂制备用于体外和体内研究的纯化的AAV5-hFIXco-v1和AAV5-hFIXco-v2产品。使用上述技术进一步产生包含具有天然存在的凝血因子IX基因(包括天然存在的R338L突变的野生型基因，参见实施例1)的表达盒的AAV5-hFIX-wt产品以用作参考产品。

实施例4.测试AAV5-hFIXco-v1和AAV5-hFIXco-v2产品的体外性能在动物测试前，体外测试了纯化的AAV5-hFIXco-v1和AAV5-hFIXco-v2产品。使用HUH7贴壁细胞系进行实验(图2、3和4)。将该细胞系的细胞以10,000个细胞/cm²的密度接种到12孔板的孔中。在细胞附着到粘性基底上之后，以500,000vg/细胞的MOI引入AAV制剂。如上所述，在转导后第7天，通过ELISA确定培养液中FIX蛋白的含量和活性，并通过逆转录-定量PCR确定细胞中凝血因子IX基因的表达水平。所有样品一式三份运行。将完整细胞用作阴性对照。

已经显示，我们开发的携带凝血因子IX基因的密码子优化版本(hFIXco-v1和hFIXco-v2)的AAV5-hFIXco-v1和AAV5-hFIXco-v2产品提供了凝血因子IX转基因向细胞中的有效递送，并确保了目标蛋白的产生，这些事实通过定量实时PCR、ELISA和凝血因子IX蛋白的活性分析的数据证实(图2、3和4)。在这方面，当使用包含凝血因子IX基因的密码子优化序列的AAV5-hFIXco-v1和AAV5-hFIXco-v2产品时，与使用具有凝血因子IX基因的天然存在版本的产品(AAV5-hFIX-wt)相比，AAV5-hFIXco-v1产品的凝血因子IX基因表达水平为1.8倍，而AAV5-hFIXco-v2产品的凝血因子IX基因表达水平为2.8倍(图2)。此外，当使用包含凝血因子IX基因的密码子优化序列的AAV5-hFIXco-v1和AAV5-hFIXco-v2产品时，与使用具有凝血因子IX基因的天然存在版本的产品(AAV5-hFIX-wt)相比，AAV5-hFIXco-v1产品的凝血因子IX蛋白产生水平为1.6倍，而AAV5-hFIXco-v2产品的凝血因子IX蛋白产生水平为2.1倍(图3)。还应注意的是，当使用包含凝血因子IX基因的密码子优化序列的AAV5-hFIXco-v1和AAV5-hFIXco-v2产品时，与使用具有凝血因子IX基因的天然存在版本的产品(AAV5-hFIX-wt)相比，AAV5-hFIXco-v1产品的凝血因子IX蛋白活性水平为2.1倍，而AAV5-hFIXco-v2产品的凝血因子IX蛋白活性水平为2.9倍(图4)。

实施例5.测试AAV5-hFIXco-v1和AAV5-hFIXco-v2产品的体内性能AAV5-hFIXco-v1和AAV5-hFIXco-v2产品的体内研究使用C57BL/6系实验室小鼠。研究中使用的AAV产品剂量为4×10¹¹VG/小鼠。不含AAV的对照溶液用作阴性对照。将产品通过单次静脉内注射到尾静脉中的方式施用于动物。在施用产品前在注射当天，并随后在施用产品后的第7、14、21、28、35和42天收集血浆。如上所述，通过ELISA确定血浆样品中凝血因子IX蛋白的水平。

体内研究已显示，与使用具有凝血因子IX基因的天然存在版本的产品(AAV5-hFIX-wt)相比，使用包含凝血因子IX基因的密码子优化序列hFIXco-v1的AAV5-hFIXco-v1产品在产品施用后第21天和第28天显示出显著更高的动物血液中凝血因子IX蛋白水平(为2.2至2.3倍)(图4A)。与使用具有凝血因子FIX基因的天然存在版本的产品(AAV5-hFIX-wt)相比，在使用包含凝血因子IX基因的密码子优化序列hFIXco-v2的AAV5-hFIXco-v2产品的情况下，在产品施用后第14、21、28、35和42天观察到显著更高的动物血液中凝血因子IX蛋白水平(为1.8至2.5倍)(图5)。

由此，我们开发的携带凝血因子IX基因的密码子优化版本的基于AAV5的重组病毒(AAV5-hFIXco-v1或AAV5-hFIXco-v2)相对于具有凝血因子IX基因的天然存在版本的AAV5载体具有优势，并且具有用于血友病B的基因疗法的潜力。

<110> LLC "ANABION"

<120> 编码FIX蛋白的密码子优化核酸

<150> RU2021105703

<151> 2021-03-05

<160> 17

<170> BiSSAP 1.3.6

<210> 1

<211> 461

<212> PRT

<213> 天然序列

<220>

<223> 具有R338L突变的重组凝血因子IX蛋白的氨基酸序列

<400> 1

Met Gln Arg Val Asn Met Ile Met Ala Glu Ser Pro Gly Leu Ile Thr

1 5 10 15

Ile Cys Leu Leu Gly Tyr Leu Leu Ser Ala Glu Cys Thr Val Phe Leu

20 25 30

Asp His Glu Asn Ala Asn Lys Ile Leu Asn Arg Pro Lys Arg Tyr Asn

35 40 45

Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg Glu Cys

50 55 60

Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe Glu Asn

65 70 75 80

Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly Asp Gln

85 90 95

Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp Asp Ile

100 105 110

Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys Asn Cys

115 120 125

Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu Gln Phe

130 135 140

Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr Glu Gly

145 150 155 160

Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val Pro Phe

165 170 175

Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr Arg Ala

180 185 190

Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu Ala Glu

195 200 205

Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn Asp Phe

210 215 220

Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe Pro Trp

225 230 235 240

Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly Ser Ile

245 250 255

Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu Thr Gly

260 265 270

Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu Thr Glu

275 280 285

His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His His Asn

290 295 300

Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu Leu Glu

305 310 315 320

Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile Cys Ile

325 330 335

Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser Gly Tyr

340 345 350

Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala Leu Val

355 360 365

Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys Leu Leu

370 375 380

Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly Phe His

385 390 395 400

Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro His Val

405 410 415

Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser Trp Gly

420 425 430

Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys Val Ser

435 440 445

Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr

450 455 460

<210> 2

<211> 1383

<212> DNA

<213> 人工序列

<220>

<223> 编码重组凝血因子IX的密码子优化核酸(hFIXco-v1变体)

<400> 2

atgcagcggg tcaacatgat catggcggag tcgccgggcc tgatcacgat ctgcctcctc 60

gggtacctgc tctccgccga gtgcaccgtg ttcctggacc acgagaacgc caacaagatc 120

ctcaaccggc ccaagcgcta caactccggc aagctggagg agttcgtgca ggggaacctc 180

gagcgcgagt gcatggagga gaagtgctcg ttcgaggagg cgcgggaggt gttcgagaac 240

accgagcgca ccacggagtt ctggaagcag tacgtggacg gggaccagtg cgagtcgaac 300

ccgtgcctca acggggggtc gtgcaaggac gacatcaact cgtacgagtg ctggtgcccc 360

ttcggcttcg agggcaagaa ctgcgagctg gacgtgacct gcaacatcaa gaacgggcgc 420

tgcgagcagt tctgcaagaa cagcgccgac aacaaggtgg tctgctcctg caccgagggg 480

taccgcctcg cggagaacca gaagtcctgc gagccggccg tgcccttccc ctgcggccgc 540

gtgtccgtca gccagacgtc gaagctgacg cgcgccgaga ccgtcttccc ggacgtggac 600

tacgtgaact cgacggaggc cgagaccatc ctggacaaca tcacccagag cacccagtcc 660

ttcaacgact tcacgcgggt ggtcggcggc gaggacgcca agcccgggca gttcccgtgg 720

caggtcgtcc tcaacgggaa ggtcgacgcg ttctgcggcg ggagcatcgt gaacgagaag 780

tggatcgtga ccgccgcgca ctgcgtcgag acgggcgtga agatcaccgt ggtggccggg 840

gagcacaaca tcgaggagac ggagcacacc gagcagaagc ggaacgtgat ccgcatcatc 900

ccgcaccaca actacaacgc cgccatcaac aagtacaacc acgacatcgc gctcctcgag 960

ctggacgagc cgctggtcct caactcctac gtcacgccga tctgcatcgc cgacaaggag 1020

tacacgaaca tcttcctgaa gttcgggagc ggctacgtct cgggctgggg ccgcgtgttc 1080

cacaaggggc gcagcgcgct cgtgctccag tacctgcggg tccccctggt cgaccgcgcg 1140

acctgcctcc tctccacgaa gttcacgatc tacaacaaca tgttctgcgc ggggttccac 1200

gagggcggcc gggacagctg ccagggcgac agcgggggcc cgcacgtgac ggaggtggag 1260

ggcacgagct tcctgaccgg gatcatctcg tggggcgagg agtgcgcgat gaaggggaag 1320

tacggcatct acaccaaggt cagccggtac gtgaactgga tcaaggagaa gacgaagctg 1380

acg 1383

<210> 3

<211> 3122

<212> DNA

<213> 人工序列

<220>

<223> 具有密码子优化的重组凝血因子IX基因的表达盒(变体AAV5-hFIXco-v1)

<400> 3

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60

ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120

aggggttcct gcggccgcac gcgtgccgcc accatggtcg agcttgggct gcaggtcgag 180

ggcactggga ggatgttgag taagatggaa aactactgat gacccttgca gagacagagt 240

attaggacat gtttgaacag gggccggcga tcagcaggta gctctagagg atccccgtct 300

gtctgcacat ttcgtagagc gagtgttccg atactctaat ctccctaggc aaggttcata 360

tttgtgtagg ttacttattc tccttttgtt gactaagtca ataatcagaa tcagcaggtt 420

tggagtcagc ttggcaggga tcagcagcct gggttggaag gagggggtat aaaagcccct 480

tcaccaggag aagccgtcac acagatccac aagctcctga caggaagctc taggtgactc 540

tcttaaggta gcctccgcgg attcgaatcc cggccgggaa cggtgcattg gaacgcggat 600

tccccgtgcc aagagtgacg taagtaccgc ctatagagtc tataggccca caaaaaatgc 660

tttcttcttt taatatactt ttttgtttat cttatttcta atactttccc taatctcttt 720

ctttcagggc aataatgata caatgtatca tgcctctttg caccattcta aagaataaca 780

gtgataattt ctgggttaag gcaatagcaa tatttctgca tataaatatt tctgcatata 840

aattgtaact gatgtaagag gtttcatatt gctaatagca gctacaatcc agctaccatt 900

ctgcttttat tttatggttg ggataaggct ggattattct gagtccaagc taggcccttt 960

tgctaatcat gttcatacct cttatcttcc tcccacagct cctgggcaac gtgctggtct 1020

gtgtgctggc ccatcacttt ggcaaagaat tgggattcga acatcgatat gcagcgggtc 1080

aacatgatca tggcggagtc gccgggcctg atcacgatct gcctcctcgg gtacctgctc 1140

tccgccgagt gcaccgtgtt cctggaccac gagaacgcca acaagatcct caaccggccc 1200

aagcgctaca actccggcaa gctggaggag ttcgtgcagg ggaacctcga gcgcgagtgc 1260

atggaggaga agtgctcgtt cgaggaggcg cgggaggtgt tcgagaacac cgagcgcacc 1320

acggagttct ggaagcagta cgtggacggg gaccagtgcg agtcgaaccc gtgcctcaac 1380

ggggggtcgt gcaaggacga catcaactcg tacgagtgct ggtgcccctt cggcttcgag 1440

ggcaagaact gcgagctgga cgtgacctgc aacatcaaga acgggcgctg cgagcagttc 1500

tgcaagaaca gcgccgacaa caaggtggtc tgctcctgca ccgaggggta ccgcctcgcg 1560

gagaaccaga agtcctgcga gccggccgtg cccttcccct gcggccgcgt gtccgtcagc 1620

cagacgtcga agctgacgcg cgccgagacc gtcttcccgg acgtggacta cgtgaactcg 1680

acggaggccg agaccatcct ggacaacatc acccagagca cccagtcctt caacgacttc 1740

acgcgggtgg tcggcggcga ggacgccaag cccgggcagt tcccgtggca ggtcgtcctc 1800

aacgggaagg tcgacgcgtt ctgcggcggg agcatcgtga acgagaagtg gatcgtgacc 1860

gccgcgcact gcgtcgagac gggcgtgaag atcaccgtgg tggccgggga gcacaacatc 1920

gaggagacgg agcacaccga gcagaagcgg aacgtgatcc gcatcatccc gcaccacaac 1980

tacaacgccg ccatcaacaa gtacaaccac gacatcgcgc tcctcgagct ggacgagccg 2040

ctggtcctca actcctacgt cacgccgatc tgcatcgccg acaaggagta cacgaacatc 2100

ttcctgaagt tcgggagcgg ctacgtctcg ggctggggcc gcgtgttcca caaggggcgc 2160

agcgcgctcg tgctccagta cctgcgggtc cccctggtcg accgcgcgac ctgcctcctc 2220

tccacgaagt tcacgatcta caacaacatg ttctgcgcgg ggttccacga gggcggccgg 2280

gacagctgcc agggcgacag cgggggcccg cacgtgacgg aggtggaggg cacgagcttc 2340

ctgaccggga tcatctcgtg gggcgaggag tgcgcgatga aggggaagta cggcatctac 2400

accaaggtca gccggtacgt gaactggatc aaggagaaga cgaagctgac gtgatgaaga 2460

tctacgggtg gcatccctgt gacccctccc cagtgcccct cctggccctg gaagttgcca 2520

ctccagtgcc caccagcctt gtcctaataa aattaagttg catcattttg tctgactagg 2580

tgtccttcta taatattatg gggtggaggg gggtggtatg gagcaagggg caagttggga 2640

agacaacctg tagggcctgc ggggtctatt gggaaccaag ctggagtgca gtggcacaat 2700

cttggctcac tgcaatctcc gcctcctggg ttcaagcgat tctcctgcct cagcctcccg 2760

agttgttggg attccaggca tgcatgacca ggctcagcta atttttgttt ttttggtaga 2820

gacggggttt caccatattg gccaggctgg tctccaactc ctaatctcag gtgatctacc 2880

caccttggcc tcccaaattg ctgggattac aggcgtgaac cactgctccc ttccctgtcc 2940

ttctgatttt gtaggtaacc acgtgcggac cgagcggccg caggaacccc tagtgatgga 3000

gttggccact ccctctctgc gcgctcgctc gctcactgag gccgggcgac caaaggtcgc 3060

ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagcgcgca gctgcctgca 3120

gg 3122

<210> 4

<211> 1383

<212> DNA

<213> 人工序列

<220>

<223> 编码重组凝血因子IX的密码子优化核酸(hFIXco-v2变体)

<400> 4

atgcagcggg tgaacatgat catggccgag tccccaggcc tgattaccat ctgtctgctg 60

ggctacctgc tgagcgccga atgcaccgtg tttctggacc acgagaacgc caacaagatc 120

ctgaaccgcc ctaagcggta caactccggc aagctggagg agtttgtgca gggcaatctg 180

gagcgggagt gtatggagga gaagtgcagc ttcgaggagg ccagggaggt gttcgagaac 240

accgagagga ccaccgagtt ctggaagcag tatgtggacg gcgaccagtg cgagtctaat 300

ccttgtctga atggcgggag ctgcaaggac gacatcaaca gctacgagtg ctggtgccct 360

ttcggcttcg agggcaagaa ttgcgagctg gacgtgacct gcaacatcaa gaacggccgg 420

tgtgagcagt tctgcaagaa cagcgccgac aacaaggtgg tgtgctcctg caccgaggga 480

tacaggctgg ccgagaatca gaagagctgt gagcccgccg tgccattccc ctgtggcaga 540

gtgtctgtga gccagaccag caagctgacc agagccgaga ccgtgtttcc agacgtggac 600

tacgtgaaca gcaccgaggc cgagaccatc ctggataata tcacccagtc cacccagagc 660

ttcaacgact tcaccagagt ggtgggaggc gaggatgcca agccaggaca gtttccctgg 720

caggtggtgc tgaatggcaa ggtggacgcc ttctgcggag gcagcatcgt gaacgagaag 780

tggattgtga ccgcagccca ctgcgtggag actggcgtga agattaccgt ggtcgccggc 840

gagcacaata tcgaagagac cgagcacacc gagcagaagc gcaacgtgat ccggatcatc 900

cctcaccaca actacaacgc agccatcaac aagtacaacc acgacatcgc cctgctggag 960

ctggacgagc cactggtgct gaactcttac gtgaccccta tctgcatcgc cgacaaggag 1020

tacaccaaca tcttcctgaa gttcggcagc ggctacgtga gcggatgggg cagagtgttt 1080

cacaagggca ggagcgccct ggtgctgcag tatctgagag tgccactggt ggacagagct 1140

acctgcctgc tgagcaccaa gttcaccatc tacaacaaca tgttctgcgc cggcttccac 1200

gaggggggaa gagactcttg ccagggcgat tccggcggac cacacgtgac cgaagtggag 1260

ggcaccagct tcctgaccgg catcatctcc tggggcgagg aatgcgccat gaagggcaag 1320

tacggcatct acaccaaggt gagcaggtac gtgaactgga tcaaggagaa gaccaagctg 1380

acc 1383

<210> 5

<211> 3123

<212> DNA

<213> 人工序列

<220>

<223> 具有重组凝血因子IX的密码子优化基因的表达盒(变体AAV5-hFIXco-v2)

<400> 5

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60

ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120

aggggttcct gcggccgcac gcgtgccgcc accatggtcg agcttgggct gcaggtcgag 180

ggcactggga ggatgttgag taagatggaa aactactgat gacccttgca gagacagagt 240

attaggacat gtttgaacag gggccggcga tcagcaggta gctctagagg atccccgtct 300

gtctgcacat ttcgtagagc gagtgttccg atactctaat ctccctaggc aaggttcata 360

tttgtgtagg ttacttattc tccttttgtt gactaagtca ataatcagaa tcagcaggtt 420

tggagtcagc ttggcaggga tcagcagcct gggttggaag gagggggtat aaaagcccct 480

tcaccaggag aagccgtcac acagatccac aagctcctga caggaagctc taggtgactc 540

tcttaaggta gcctccgcgg attcgaatcc cggccgggaa cggtgcattg gaacgcggat 600

tccccgtgcc aagagtgacg taagtaccgc ctatagagtc tataggccca caaaaaatgc 660

tttcttcttt taatatactt ttttgtttat cttatttcta atactttccc taatctcttt 720

ctttcagggc aataatgata caatgtatca tgcctctttg caccattcta aagaataaca 780

gtgataattt ctgggttaag gcaatagcaa tatttctgca tataaatatt tctgcatata 840

aattgtaact gatgtaagag gtttcatatt gctaatagca gctacaatcc agctaccatt 900

ctgcttttat tttatggttg ggataaggct ggattattct gagtccaagc taggcccttt 960

tgctaatcat gttcatacct cttatcttcc tcccacagct cctgggcaac gtgctggtct 1020

gtgtgctggc ccatcacttt ggcaaagaat tgggattcga acatcgatat aaatgcagcg 1080

ggtgaacatg atcatggccg agtccccagg cctgattacc atctgtctgc tgggctacct 1140

gctgagcgcc gaatgcaccg tgtttctgga ccacgagaac gccaacaaga tcctgaaccg 1200

ccctaagcgg tacaactccg gcaagctgga ggagtttgtg cagggcaatc tggagcggga 1260

gtgtatggag gagaagtgca gcttcgagga ggccagggag gtgttcgaga acaccgagag 1320

gaccaccgag ttctggaagc agtatgtgga cggcgaccag tgcgagtcta atccttgtct 1380

gaatggcggg agctgcaagg acgacatcaa cagctacgag tgctggtgcc ctttcggctt 1440

cgagggcaag aattgcgagc tggacgtgac ctgcaacatc aagaacggcc ggtgtgagca 1500

gttctgcaag aacagcgccg acaacaaggt ggtgtgctcc tgcaccgagg gatacaggct 1560

ggccgagaat cagaagagct gtgagcccgc cgtgccattc ccctgtggca gagtgtctgt 1620

gagccagacc agcaagctga ccagagccga gaccgtgttt ccagacgtgg actacgtgaa 1680

cagcaccgag gccgagacca tcctggataa tatcacccag tccacccaga gcttcaacga 1740

cttcaccaga gtggtgggag gcgaggatgc caagccagga cagtttccct ggcaggtggt 1800

gctgaatggc aaggtggacg ccttctgcgg aggcagcatc gtgaacgaga agtggattgt 1860

gaccgcagcc cactgcgtgg agactggcgt gaagattacc gtggtcgccg gcgagcacaa 1920

tatcgaagag accgagcaca ccgagcagaa gcgcaacgtg atccggatca tccctcacca 1980

caactacaac gcagccatca acaagtacaa ccacgacatc gccctgctgg agctggacga 2040

gccactggtg ctgaactctt acgtgacccc tatctgcatc gccgacaagg agtacaccaa 2100

catcttcctg aagttcggca gcggctacgt gagcggatgg ggcagagtgt ttcacaaggg 2160

caggagcgcc ctggtgctgc agtatctgag agtgccactg gtggacagag ctacctgcct 2220

gctgagcacc aagttcacca tctacaacaa catgttctgc gccggcttcc acgagggggg 2280

aagagactct tgccagggcg attccggcgg accacacgtg accgaagtgg agggcaccag 2340

cttcctgacc ggcatcatct cctggggcga ggaatgcgcc atgaagggca agtacggcat 2400

ctacaccaag gtgagcaggt acgtgaactg gatcaaggag aagaccaagc tgacctgaag 2460

atctacgggt ggcatccctg tgacccctcc ccagtgcccc tcctggccct ggaagttgcc 2520

actccagtgc ccaccagcct tgtcctaata aaattaagtt gcatcatttt gtctgactag 2580

gtgtccttct ataatattat ggggtggagg ggggtggtat ggagcaaggg gcaagttggg 2640

aagacaacct gtagggcctg cggggtctat tgggaaccaa gctggagtgc agtggcacaa 2700

tcttggctca ctgcaatctc cgcctcctgg gttcaagcga ttctcctgcc tcagcctccc 2760

gagttgttgg gattccaggc atgcatgacc aggctcagct aatttttgtt tttttggtag 2820

agacggggtt tcaccatatt ggccaggctg gtctccaact cctaatctca ggtgatctac 2880

ccaccttggc ctcccaaatt gctgggatta caggcgtgaa ccactgctcc cttccctgtc 2940

cttctgattt tgtaggtaac cacgtgcgga ccgagcggcc gcaggaaccc ctagtgatgg 3000

agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga ccaaaggtcg 3060

cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc agctgcctgc 3120

agg 3123

<210> 6

<211> 130

<212> DNA

<213> 人工序列

<220>

<223> 左侧（第一）ITR（反向末端重复）

<400> 6

cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcgtcg ggcgaccttt 60

ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120

aggggttcct 130

<210> 7

<211> 372

<212> DNA

<213> 天然序列

<220>

<223> TTR启动子序列(甲状腺素运载蛋白启动子)

<400> 7

tcgagcttgg gctgcaggtc gagggcactg ggaggatgtt gagtaagatg gaaaactact 60

gatgaccctt gcagagacag agtattagga catgtttgaa caggggccgg cgatcagcag 120

gtagctctag aggatccccg tctgtctgca catttcgtag agcgagtgtt ccgatactct 180

aatctcccta ggcaaggttc atatttgtgt aggttactta ttctcctttt gttgactaag 240

tcaataatca gaatcagcag gtttggagtc agcttggcag ggatcagcag cctgggttgg 300

aaggaggggg tataaaagcc ccttcaccag gagaagccgt cacacagatc cacaagctcc 360

tgacaggaag ct 372

<210> 8

<211> 493

<212> DNA

<213> 天然序列

<220>

<223> hBG1基因的内含子（人β珠蛋白基因的携带内含子的片段）

<400> 8

cgaatcccgg ccgggaacgg tgcattggaa cgcggattcc ccgtgccaag agtgacgtaa 60

gtaccgccta tagagtctat aggcccacaa aaaatgcttt cttcttttaa tatacttttt 120

tgtttatctt atttctaata ctttccctaa tctctttctt tcagggcaat aatgatacaa 180

tgtatcatgc ctctttgcac cattctaaag aataacagtg ataatttctg ggttaaggca 240

atagcaatat ttctgcatat aaatatttct gcatataaat tgtaactgat gtaagaggtt 300

tcatattgct aatagcagct acaatccagc taccattctg cttttatttt atggttggga 360

taaggctgga ttattctgag tccaagctag gcccttttgc taatcatgtt catacctctt 420

atcttcctcc cacagctcct gggcaacgtg ctggtctgtg tgctggccca tcactttggc 480

aaagaattgg gat 493

<210> 9

<211> 479

<212> DNA

<213> 天然序列

<220>

<223> hGH1多聚腺苷酸化信号（人生长激素基因的多聚腺苷酸化信号）

<400> 9

acgggtggca tccctgtgac ccctccccag tgcccctcct ggccctggaa gttgccactc 60

cagtgcccac cagccttgtc ctaataaaat taagttgcat cattttgtct gactaggtgt 120

ccttctataa tattatgggg tggagggggg tggtatggag caaggggcaa gttgggaaga 180

caacctgtag ggcctgcggg gtctattggg aaccaagctg gagtgcagtg gcacaatctt 240

ggctcactgc aatctccgcc tcctgggttc aagcgattct cctgcctcag cctcccgagt 300

tgttgggatt ccaggcatgc atgaccaggc tcagctaatt tttgtttttt tggtagagac 360

ggggtttcac catattggcc aggctggtct ccaactccta atctcaggtg atctacccac 420

cttggcctcc caaattgctg ggattacagg cgtgaaccac tgctcccttc cctgtcctt 479

<210> 10

<211> 141

<212> DNA

<213> 人工序列

<220>

<223> 右侧（第二）ITR

<400> 10

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60

ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120

gagcgcgcag ctgcctgcag g 141

<210> 11

<211> 724

<212> PRT

<213> 天然序列

<220>

<223> 野生型AAV5衣壳蛋白VP1的天然序列

<400> 11

Met Ser Phe Val Asp His Pro Pro Asp Trp Leu Glu Glu Val Gly Glu

1 5 10 15

Gly Leu Arg Glu Phe Leu Gly Leu Glu Ala Gly Pro Pro Lys Pro Lys

20 25 30

Pro Asn Gln Gln His Gln Asp Gln Ala Arg Gly Leu Val Leu Pro Gly

35 40 45

Tyr Asn Tyr Leu Gly Pro Gly Asn Gly Leu Asp Arg Gly Glu Pro Val

50 55 60

Asn Arg Ala Asp Glu Val Ala Arg Glu His Asp Ile Ser Tyr Asn Glu

65 70 75 80

Gln Leu Glu Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp

85 90 95

Ala Glu Phe Gln Glu Lys Leu Ala Asp Asp Thr Ser Phe Gly Gly Asn

100 105 110

Leu Gly Lys Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro Phe

115 120 125

Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Thr Gly Lys Arg Ile

130 135 140

Asp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp Ser

145 150 155 160

Lys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser Gln

165 170 175

Gln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp Thr

180 185 190

Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly Ala

195 200 205

Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr Trp

210 215 220

Met Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu Pro

225 230 235 240

Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val Asp

245 250 255

Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr

260 265 270

Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp Gln

275 280 285

Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg Val

290 295 300

Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser Thr

305 310 315 320

Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp

325 330 335

Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly Cys

340 345 350

Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly Tyr

355 360 365

Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser Ser

370 375 380

Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly Asn

385 390 395 400

Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser Ser

405 410 415

Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val Asp

420 425 430

Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val Gln

435 440 445

Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn Trp

450 455 460

Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser Gly

465 470 475 480

Val Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met Glu

485 490 495

Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met Thr

500 505 510

Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met Ile

515 520 525

Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu Glu

530 535 540

Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn Arg

545 550 555 560

Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser Ser

565 570 575

Thr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val Pro

580 585 590

Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp

595 600 605

Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala Met

610 615 620

Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys Asn

625 630 635 640

Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val Ser

645 650 655

Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met Glu

660 665 670

Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln

675 680 685

Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro Asp

690 695 700

Ser Thr Gly Glu Tyr Arg Thr Thr Arg Pro Ile Gly Thr Arg Tyr Leu

705 710 715 720

Thr Arg Pro Leu

<210> 12

<211> 588

<212> PRT

<213> 天然序列

<220>

<223> 野生型AAV5衣壳蛋白VP2的天然序列

<400> 12

Thr Ala Pro Thr Gly Lys Arg Ile Asp Asp His Phe Pro Lys Arg Lys

1 5 10 15

Lys Ala Arg Thr Glu Glu Asp Ser Lys Pro Ser Thr Ser Ser Asp Ala

20 25 30

Glu Ala Gly Pro Ser Gly Ser Gln Gln Leu Gln Ile Pro Ala Gln Pro

35 40 45

Ala Ser Ser Leu Gly Ala Asp Thr Met Ser Ala Gly Gly Gly Gly Pro

50 55 60

Leu Gly Asp Asn Asn Gln Gly Ala Asp Gly Val Gly Asn Ala Ser Gly

65 70 75 80

Asp Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Val Thr Lys

85 90 95

Ser Thr Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Gln Tyr Arg

100 105 110

Glu Ile Lys Ser Gly Ser Val Asp Gly Ser Asn Ala Asn Ala Tyr Phe

115 120 125

Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His Ser

130 135 140

His Trp Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Tyr Trp Gly

145 150 155 160

Phe Arg Pro Arg Ser Leu Arg Val Lys Ile Phe Asn Ile Gln Val Lys

165 170 175

Glu Val Thr Val Gln Asp Ser Thr Thr Thr Ile Ala Asn Asn Leu Thr

180 185 190

Ser Thr Val Gln Val Phe Thr Asp Asp Asp Tyr Gln Leu Pro Tyr Val

195 200 205

Val Gly Asn Gly Thr Glu Gly Cys Leu Pro Ala Phe Pro Pro Gln Val

210 215 220

Phe Thr Leu Pro Gln Tyr Gly Tyr Ala Thr Leu Asn Arg Asp Asn Thr

225 230 235 240

Glu Asn Pro Thr Glu Arg Ser Ser Phe Phe Cys Leu Glu Tyr Phe Pro

245 250 255

Ser Lys Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Thr Tyr Asn Phe

260 265 270

Glu Glu Val Pro Phe His Ser Ser Phe Ala Pro Ser Gln Asn Leu Phe

275 280 285

Lys Leu Ala Asn Pro Leu Val Asp Gln Tyr Leu Tyr Arg Phe Val Ser

290 295 300

Thr Asn Asn Thr Gly Gly Val Gln Phe Asn Lys Asn Leu Ala Gly Arg

305 310 315 320

Tyr Ala Asn Thr Tyr Lys Asn Trp Phe Pro Gly Pro Met Gly Arg Thr

325 330 335

Gln Gly Trp Asn Leu Gly Ser Gly Val Asn Arg Ala Ser Val Ser Ala

340 345 350

Phe Ala Thr Thr Asn Arg Met Glu Leu Glu Gly Ala Ser Tyr Gln Val

355 360 365

Pro Pro Gln Pro Asn Gly Met Thr Asn Asn Leu Gln Gly Ser Asn Thr

370 375 380

Tyr Ala Leu Glu Asn Thr Met Ile Phe Asn Ser Gln Pro Ala Asn Pro

385 390 395 400

Gly Thr Thr Ala Thr Tyr Leu Glu Gly Asn Met Leu Ile Thr Ser Glu

405 410 415

Ser Glu Thr Gln Pro Val Asn Arg Val Ala Tyr Asn Val Gly Gly Gln

420 425 430

Met Ala Thr Asn Asn Gln Ser Ser Thr Thr Ala Pro Ala Thr Gly Thr

435 440 445

Tyr Asn Leu Gln Glu Ile Val Pro Gly Ser Val Trp Met Glu Arg Asp

450 455 460

Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro Glu Thr Gly Ala

465 470 475 480

His Phe His Pro Ser Pro Ala Met Gly Gly Phe Gly Leu Lys His Pro

485 490 495

Pro Pro Met Met Leu Ile Lys Asn Thr Pro Val Pro Gly Asn Ile Thr

500 505 510

Ser Phe Ser Asp Val Pro Val Ser Ser Phe Ile Thr Gln Tyr Ser Thr

515 520 525

Gly Gln Val Thr Val Glu Met Glu Trp Glu Leu Lys Lys Glu Asn Ser

530 535 540

Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Asn Asn Tyr Asn Asp Pro

545 550 555 560

Gln Phe Val Asp Phe Ala Pro Asp Ser Thr Gly Glu Tyr Arg Thr Thr

565 570 575

Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu

580 585

<210> 13

<211> 532

<212> PRT

<213> 天然序列

<220>

<223> 野生型AAV5衣壳蛋白VP3的天然序列

<400> 13

Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly Ala

1 5 10 15

Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr Trp

20 25 30

Met Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu Pro

35 40 45

Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val Asp

50 55 60

Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr

65 70 75 80

Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp Gln

85 90 95

Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg Val

100 105 110

Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser Thr

115 120 125

Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp

130 135 140

Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly Cys

145 150 155 160

Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly Tyr

165 170 175

Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser Ser

180 185 190

Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly Asn

195 200 205

Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser Ser

210 215 220

Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val Asp

225 230 235 240

Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val Gln

245 250 255

Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn Trp

260 265 270

Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser Gly

275 280 285

Val Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met Glu

290 295 300

Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met Thr

305 310 315 320

Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met Ile

325 330 335

Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu Glu

340 345 350

Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn Arg

355 360 365

Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser Ser

370 375 380

Thr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val Pro

385 390 395 400

Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp

405 410 415

Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala Met

420 425 430

Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys Asn

435 440 445

Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val Ser

450 455 460

Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met Glu

465 470 475 480

Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln

485 490 495

Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro Asp

500 505 510

Ser Thr Gly Glu Tyr Arg Thr Thr Arg Pro Ile Gly Thr Arg Tyr Leu

515 520 525

Thr Arg Pro Leu

530

<210> 14

<211> 724

<212> PRT

<213> 人工序列

<220>

<223> 包含S2A和T711S置换的修饰的AAV5衣壳VP1蛋白

<400> 14

Met Ala Phe Val Asp His Pro Pro Asp Trp Leu Glu Glu Val Gly Glu

1 5 10 15

Gly Leu Arg Glu Phe Leu Gly Leu Glu Ala Gly Pro Pro Lys Pro Lys

20 25 30

Pro Asn Gln Gln His Gln Asp Gln Ala Arg Gly Leu Val Leu Pro Gly

35 40 45

Tyr Asn Tyr Leu Gly Pro Gly Asn Gly Leu Asp Arg Gly Glu Pro Val

50 55 60

Asn Arg Ala Asp Glu Val Ala Arg Glu His Asp Ile Ser Tyr Asn Glu

65 70 75 80

Gln Leu Glu Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp

85 90 95

Ala Glu Phe Gln Glu Lys Leu Ala Asp Asp Thr Ser Phe Gly Gly Asn

100 105 110

Leu Gly Lys Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro Phe

115 120 125

Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Thr Gly Lys Arg Ile

130 135 140

Asp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp Ser

145 150 155 160

Lys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser Gln

165 170 175

Gln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp Thr

180 185 190

Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly Ala

195 200 205

Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr Trp

210 215 220

Met Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu Pro

225 230 235 240

Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val Asp

245 250 255

Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr

260 265 270

Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp Gln

275 280 285

Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg Val

290 295 300

Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser Thr

305 310 315 320

Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp

325 330 335

Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly Cys

340 345 350

Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly Tyr

355 360 365

Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser Ser

370 375 380

Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly Asn

385 390 395 400

Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser Ser

405 410 415

Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val Asp

420 425 430

Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val Gln

435 440 445

Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn Trp

450 455 460

Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser Gly

465 470 475 480

Val Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met Glu

485 490 495

Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met Thr

500 505 510

Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met Ile

515 520 525

Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu Glu

530 535 540

Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn Arg

545 550 555 560

Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser Ser

565 570 575

Thr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val Pro

580 585 590

Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp

595 600 605

Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala Met

610 615 620

Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys Asn

625 630 635 640

Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val Ser

645 650 655

Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met Glu

660 665 670

Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln

675 680 685

Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro Asp

690 695 700

Ser Thr Gly Glu Tyr Arg Ser Thr Arg Pro Ile Gly Thr Arg Tyr Leu

705 710 715 720

Thr Arg Pro Leu

<210> 15

<211> 588

<212> PRT

<213> 人工序列

<220>

<223> 包含T575S置换的修饰的AAV5衣壳VP2蛋白

<400> 15

Thr Ala Pro Thr Gly Lys Arg Ile Asp Asp His Phe Pro Lys Arg Lys

1 5 10 15

Lys Ala Arg Thr Glu Glu Asp Ser Lys Pro Ser Thr Ser Ser Asp Ala

20 25 30

Glu Ala Gly Pro Ser Gly Ser Gln Gln Leu Gln Ile Pro Ala Gln Pro

35 40 45

Ala Ser Ser Leu Gly Ala Asp Thr Met Ser Ala Gly Gly Gly Gly Pro

50 55 60

Leu Gly Asp Asn Asn Gln Gly Ala Asp Gly Val Gly Asn Ala Ser Gly

65 70 75 80

Asp Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Val Thr Lys

85 90 95

Ser Thr Arg Thr Trp Val Leu Pro Ser Tyr Asn Asn His Gln Tyr Arg

100 105 110

Glu Ile Lys Ser Gly Ser Val Asp Gly Ser Asn Ala Asn Ala Tyr Phe

115 120 125

Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His Ser

130 135 140

His Trp Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Tyr Trp Gly

145 150 155 160

Phe Arg Pro Arg Ser Leu Arg Val Lys Ile Phe Asn Ile Gln Val Lys

165 170 175

Glu Val Thr Val Gln Asp Ser Thr Thr Thr Ile Ala Asn Asn Leu Thr

180 185 190

Ser Thr Val Gln Val Phe Thr Asp Asp Asp Tyr Gln Leu Pro Tyr Val

195 200 205

Val Gly Asn Gly Thr Glu Gly Cys Leu Pro Ala Phe Pro Pro Gln Val

210 215 220

Phe Thr Leu Pro Gln Tyr Gly Tyr Ala Thr Leu Asn Arg Asp Asn Thr

225 230 235 240

Glu Asn Pro Thr Glu Arg Ser Ser Phe Phe Cys Leu Glu Tyr Phe Pro

245 250 255

Ser Lys Met Leu Arg Thr Gly Asn Asn Phe Glu Phe Thr Tyr Asn Phe

260 265 270

Glu Glu Val Pro Phe His Ser Ser Phe Ala Pro Ser Gln Asn Leu Phe

275 280 285

Lys Leu Ala Asn Pro Leu Val Asp Gln Tyr Leu Tyr Arg Phe Val Ser

290 295 300

Thr Asn Asn Thr Gly Gly Val Gln Phe Asn Lys Asn Leu Ala Gly Arg

305 310 315 320

Tyr Ala Asn Thr Tyr Lys Asn Trp Phe Pro Gly Pro Met Gly Arg Thr

325 330 335

Gln Gly Trp Asn Leu Gly Ser Gly Val Asn Arg Ala Ser Val Ser Ala

340 345 350

Phe Ala Thr Thr Asn Arg Met Glu Leu Glu Gly Ala Ser Tyr Gln Val

355 360 365

Pro Pro Gln Pro Asn Gly Met Thr Asn Asn Leu Gln Gly Ser Asn Thr

370 375 380

Tyr Ala Leu Glu Asn Thr Met Ile Phe Asn Ser Gln Pro Ala Asn Pro

385 390 395 400

Gly Thr Thr Ala Thr Tyr Leu Glu Gly Asn Met Leu Ile Thr Ser Glu

405 410 415

Ser Glu Thr Gln Pro Val Asn Arg Val Ala Tyr Asn Val Gly Gly Gln

420 425 430

Met Ala Thr Asn Asn Gln Ser Ser Thr Thr Ala Pro Ala Thr Gly Thr

435 440 445

Tyr Asn Leu Gln Glu Ile Val Pro Gly Ser Val Trp Met Glu Arg Asp

450 455 460

Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro Glu Thr Gly Ala

465 470 475 480

His Phe His Pro Ser Pro Ala Met Gly Gly Phe Gly Leu Lys His Pro

485 490 495

Pro Pro Met Met Leu Ile Lys Asn Thr Pro Val Pro Gly Asn Ile Thr

500 505 510

Ser Phe Ser Asp Val Pro Val Ser Ser Phe Ile Thr Gln Tyr Ser Thr

515 520 525

Gly Gln Val Thr Val Glu Met Glu Trp Glu Leu Lys Lys Glu Asn Ser

530 535 540

Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Asn Asn Tyr Asn Asp Pro

545 550 555 560

Gln Phe Val Asp Phe Ala Pro Asp Ser Thr Gly Glu Tyr Arg Ser Thr

565 570 575

Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu

580 585

<210> 16

<211> 532

<212> PRT

<213> 人工序列

<220>

<223> 包含T519S置换的修饰的AAV5衣壳VP3蛋白

<400> 16

Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly Ala

1 5 10 15

Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr Trp

20 25 30

Met Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu Pro

35 40 45

Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val Asp

50 55 60

Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr

65 70 75 80

Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp Gln

85 90 95

Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg Val

100 105 110

Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser Thr

115 120 125

Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp

130 135 140

Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly Cys

145 150 155 160

Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly Tyr

165 170 175

Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser Ser

180 185 190

Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly Asn

195 200 205

Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser Ser

210 215 220

Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val Asp

225 230 235 240

Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val Gln

245 250 255

Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn Trp

260 265 270

Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser Gly

275 280 285

Val Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met Glu

290 295 300

Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met Thr

305 310 315 320

Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met Ile

325 330 335

Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu Glu

340 345 350

Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn Arg

355 360 365

Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser Ser

370 375 380

Thr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val Pro

385 390 395 400

Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp

405 410 415

Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala Met

420 425 430

Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys Asn

435 440 445

Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val Ser

450 455 460

Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met Glu

465 470 475 480

Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln

485 490 495

Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro Asp

500 505 510

Ser Thr Gly Glu Tyr Arg Ser Thr Arg Pro Ile Gly Thr Arg Tyr Leu

515 520 525

Thr Arg Pro Leu

530

<210> 17

<211> 1383

<212> DNA

<213> 天然序列

<220>

<223> 编码具有突变R338L的野生型重组凝血因子IX（hFIX-wt）的核酸

<400> 17

atgcagcgcg tgaacatgat catggcagaa tcaccaggcc tcatcaccat ctgcctttta 60

ggatatctac tcagtgctga atgtacagtt tttcttgatc atgaaaacgc caacaaaatt 120

ctgaatcggc caaagaggta taattcaggt aaattggaag agtttgttca agggaacctt 180

gagagagaat gtatggaaga aaagtgtagt tttgaagaag cacgagaagt ttttgaaaac 240

actgaaagaa caactgaatt ttggaagcag tatgttgatg gagatcagtg tgagtccaat 300

ccatgtttaa atggcggcag ttgcaaggat gacattaatt cctatgaatg ttggtgtccc 360

tttggatttg aaggaaagaa ctgtgaatta gatgtaacat gtaacattaa gaatggcaga 420

tgcgagcagt tttgtaaaaa tagtgctgat aacaaggtgg tttgctcctg tactgaggga 480

tatcgacttg cagaaaacca gaagtcctgt gaaccagcag tgccatttcc atgtggaaga 540

gtttctgttt cacaaacttc taagctcacc cgtgctgaga ctgtttttcc tgatgtggac 600

tatgtaaatt ctactgaagc tgaaaccatt ttggataaca tcactcaaag cacccaatca 660

tttaatgact tcactcgggt tgttggtgga gaagatgcca aaccaggtca attcccttgg 720

caggttgttt tgaatggtaa agttgatgca ttctgtggag gctctatcgt taatgaaaaa 780

tggattgtaa ctgctgccca ctgtgttgaa actggtgtta aaattacagt tgtcgcaggt 840

gaacataata ttgaggagac agaacataca gagcaaaagc gaaatgtgat tcgaattatt 900

cctcaccaca actacaatgc agctattaat aagtacaacc atgacattgc ccttctggaa 960

ctggacgaac ccttagtgct aaacagctac gttacaccta tttgcattgc tgacaaggaa 1020

tacacgaaca tcttcctcaa atttggatct ggctatgtaa gtggctgggg aagagtcttc 1080

cacaaaggga gatcagcttt agttcttcag taccttagag ttccacttgt tgaccgagcc 1140

acatgtcttc tatctacaaa gttcaccatc tataacaaca tgttctgtgc tggcttccat 1200

gaaggaggta gagattcatg tcaaggagat agtgggggac cccatgttac tgaagtggaa 1260

gggaccagtt tcttaactgg aattattagc tggggtgaag agtgtgcaat gaaaggcaaa 1320

tatggaatat ataccaaggt atcccggtat gtcaactgga ttaaggaaaa aacaaagctc 1380

act 1383

Claims

1.编码具有SEQ ID NO:1的氨基酸序列的FIX(凝血因子IX)蛋白的分离的密码子优化核酸，所述核酸包含选自以下的核苷酸序列：SEQ ID NO:2或SEQ ID NO:4。

2.包含如权利要求1中所要求保护的密码子优化核酸的表达盒。

3.如权利要求2中所要求保护的表达盒，其在5’端至3’端方向上包括以下元件：

左侧(第一)ITR(反向末端重复)；

TTR启动子(甲状腺素运载蛋白启动子)；

hBG1基因的内含子(人β珠蛋白基因的携带内含子的片段)；

如权利要求1中所要求保护的密码子优化核酸；

hGH1多聚腺苷酸化信号(人生长激素基因多聚腺苷酸化信号)；

右侧(第二)ITR。

4.如权利要求3中所要求保护的表达盒，其包含选自以下的核苷酸序列：SEQ ID NO:3或SEQ ID NO:5。

5.包含如权利要求1中所要求保护的密码子优化核酸或如权利要求2至4任一项中所要求保护的表达盒的表达载体。

6.用于提高目标细胞中的FIX基因表达的分离的基于AAV5(腺相关病毒血清型5)的重组病毒，所述重组病毒包含如权利要求1中所要求保护的密码子优化核酸或如权利要求2至4任一项中所要求保护的表达盒。

7.如权利要求6中所要求保护的基于AAV5的重组病毒，其中衣壳包含AAV5蛋白VP1。

8.如权利要求7中所要求保护的基于AAV5的重组病毒，其中衣壳包含具有SEQ ID NO:11的氨基酸序列的AAV5蛋白VP1。

9.如权利要求7中所要求保护的基于AAV5的重组病毒，其中衣壳包含具有含一个或多个点突变的SEQ ID NO:11的氨基酸序列的AAV5蛋白VP1。

10.如权利要求9中所要求保护的基于AAV5的重组病毒，其中衣壳包含具有SEQ ID NO:14的氨基酸序列的AAV5蛋白VP1。

11.如权利要求6至10任一项中所要求保护的基于AAV5的重组病毒，其中衣壳包含具有SEQ ID NO:11的氨基酸序列或含一个或多个点突变的SEQ ID NO:11的氨基酸序列的AAV5蛋白VP1，并且所述表达盒在5’端至3’端方向上包含以下元件：

左侧(第一)ITR(反向末端重复)；

TTR启动子；

hBG1基因的内含子(人β珠蛋白基因的携带内含子的片段)；

如权利要求1中所要求保护的密码子优化核酸；

hGH1多聚腺苷酸化信号(人生长激素基因多聚腺苷酸化信号)；

右侧(第二)ITR。

12.如权利要求11中所要求保护的基于AAV5的重组病毒，其中衣壳包含具有SEQ IDNO:11的氨基酸序列或含一个或多个点突变的SEQ ID NO:11的氨基酸序列的AAV5蛋白VP1，并且所述表达盒包含选自SEQ ID NO:3或SEQ ID NO:5的核苷酸序列。

13.如权利要求11至12任一项中所要求保护的基于AAV5的重组病毒，其中所述具有含一个或多个点突变的SEQ ID NO:11的氨基酸序列的AAV5蛋白VP1是SEQ ID NO:14的氨基酸序列。

14.用于将FIX基因递送至目标细胞的药物组合物，所述药物组合物包含与一种或多种药学上可接受的赋形剂组合的如权利要求6至13任一项中所要求保护的基于AAV5的重组病毒。

15.如权利要求6至13中所要求保护的基于AAV5的重组病毒或如权利要求14中所要求保护的组合物用于将FIX基因递送至目标细胞的用途。

16.如权利要求6至13任一项中所要求保护的基于AAV5的重组病毒或如权利要求14中所要求保护的组合物用于向患有血友病B和/或不具有FIX基因的完全功能性拷贝的受试者提供FIX蛋白的用途。

17.如权利要求6至13任一项中所要求保护的基于AAV5的重组病毒或如权利要求14中所要求保护的组合物用于在患有血友病B的受试者中治疗血友病B的用途。

18.向患有血友病B的受试者提供FIX蛋白的方法，所述方法包括将治疗有效量的如权利要求6至13中所要求保护的基于AAV5的重组病毒或如权利要求14中所要求保护的组合物施用到所述有需要的受试者的细胞中。

19.将FIX基因递送至患有血友病B的受试者的目标细胞的方法，所述方法包括将如权利要求6至13任一项中所要求保护的基于AAV5的重组病毒或如权利要求14中所要求保护的组合物施用到所述受试者的细胞中。

20.在受试者中治疗血友病B的方法，所述方法包括将治疗有效量的如权利要求6至13任一项中所要求保护的基于AAV5的重组病毒或如权利要求14中所要求保护的组合物施用到患有血友病B的受试者中。