CN112739818A

CN112739818A - 编码因子ix的核苷酸

Info

Publication number: CN112739818A
Application number: CN201980062207.2A
Authority: CN
Inventors: A·纳斯瓦尼; J·麦金托什
Original assignee: UCL Business Ltd
Current assignee: UCL Business Ltd
Priority date: 2018-08-20
Filing date: 2019-08-20
Publication date: 2021-04-30
Also published as: WO2020039183A1; MX2021001901A; JP2021533799A; IL280973A; BR112021002998A2; EP3810770A1; KR20210049129A; SG11202101560QA; CA3109579A1; AU2019323747A1

Abstract

本发明涉及包含因子IX核苷酸序列的多核苷酸，其中因子IX核苷酸序列包含编码因子IX蛋白或其片段的编码序列，并且其中编码序列的一部分不是野生型的。本发明还涉及包含含有本发明的多核苷酸的重组基因组的病毒颗粒，包含所述多核苷酸或病毒颗粒的组合物，以及所述多核苷酸、病毒颗粒或组合物的方法和用途。

Description

编码因子IX的核苷酸

发明领域

本发明涉及包含编码因子IX的核苷酸序列的多核苷酸，包含该多核苷酸的病毒颗粒以及利用该多核苷酸的治疗。

发明背景

B型血友病(一种X连锁的威胁生命的出血性疾病)影响1：30,000的男性。目前的治疗涉及频繁静脉注射(每周2-3次)因子IX(FIX)蛋白。这种治疗在止血方面非常有效，但其不是治愈性的，而且非常昂贵(每位患者每年150,000英镑)，因此使得其是世界上大多数B型血友病患者所无法承受的。B型血友病的基因疗法通过在将因子IX基因的功能拷贝转移到患病患者后因子IX的持续的内源性产生而提供了治愈的潜力。

本申请涉及用于治疗B型血友病的基因治疗方法，其涉及施用包含编码因子IX的多核苷酸的载体。这样的基因治疗方法可避免频繁静脉注射因子IX的需要。但是，提供有效的基因治疗载体(即允许高水平的因子IX表达和高活性的因子IX的表达的载体)是困难的。

发明概述

本申请证明了对包含因子IX核苷酸序列的多核苷酸的各种修饰能够帮助改善表达的因子IX多肽的表达水平和活性。例如，本申请证明了以下能够改善包含因子IX核苷酸序列的多核苷酸治疗B型血友病的功效：

·使用经密码子优化的序列；

·保留因子IX多肽的未经密码子优化的一部分；

·包括内含子或内含子片段；

·`提供在内含子或内含子片段侧翼的未经密码子优化的序列；

·使用功能获得突变；

·使用特定的启动子；和/或

·保持单链形式的包含所述核苷酸的AAV基因组。

这些修饰提供了这样的因子IX序列，其是高表达的并且其编码高活性的因子IX多肽或其片段。如实施例所证明的，本发明的多核苷酸以比其他编码因子IX的多核苷酸(例如WO16/075473中公开的那些)更高水平的表达和提供总体因子IX活性。

因此，在本发明的第一方面，提供了包含因子IX核苷酸序列的多核苷酸，其中因子IX核苷酸序列包含编码因子IX蛋白或其片段的编码序列，并且其中编码序列的一部分不是野生型的。

在本发明的第二方面，提供了包含因子IX核苷酸序列的多核苷酸，其中所述因子IX核苷酸序列包含编码因子IX蛋白或其片段的编码序列，并且所述编码序列包含：(i)与SEQ ID NO：1至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列；(ii)与SEQ ID NO：15至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

在本发明的第三方面，提供了包含因子IX核苷酸序列的多核苷酸，其中所述因子IX核苷酸序列编码因子IX蛋白或其片段，并与SEQ ID NO：5具有至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％的同一性。

在本发明的第四方面，提供了包含重组基因组的病毒颗粒，所述重组基因组包含本发明的多核苷酸。

在本发明的第五方面，提供了包含本发明的多核苷酸或病毒颗粒和药学上可接受的赋形剂的组合物。

在本发明的第六方面，提供了一种治疗方法，其包括向患者施用有效量的本发明的多核苷酸或病毒颗粒。

在本发明的第七方面，提供了本发明的多核苷酸、病毒颗粒或组合物在制备用于治疗方法的药物中的用途。

在第八方面，本发明的多核苷酸、病毒颗粒或组合物用于以由包含SEQ ID NO：12的因子IX核苷酸序列和SEQ ID NO：7的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽，从而治疗疾病。

在第九方面，本发明的多核苷酸、病毒颗粒或组合物通过以由包含SEQ ID NO：12的因子IX核苷酸序列和SEQ ID NO：7的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽来治疗疾病。

在第十方面，提供了一种以由包含SEQ ID NO：12的因子IX核苷酸序列和SEQ IDNO：7的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽的方法，包括向患者施用本发明的多核苷酸、病毒颗粒或组合物。

在第十一方面，提供了一种通过以由包含SEQ ID NO：12的因子IX核苷酸序列和SEQ ID NO：7的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽来治疗疾病的方法，包括向患者施用本发明的多核苷酸、病毒颗粒或组合物。

在第十二方面，提供了本发明的多核苷酸、病毒颗粒或组合物用于以由包含SEQID NO：12的因子IX核苷酸序列和SEQ ID NO：7的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽的用途，从而治疗疾病。

在第十三方面，提供了本发明的多核苷酸、病毒颗粒或组合物用于通过以由包含SEQ ID NO：12的因子IX核苷酸序列和SEQ ID NO：7的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽来治疗疾病的用途。

在第十四方面，本发明的多核苷酸、病毒颗粒或组合物用于以由包含SEQ ID NO：18的因子IX核苷酸序列和SEQ ID NO：6的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽，从而治疗疾病。

在第十五方面，本发明的多核苷酸、病毒颗粒或组合物用于通过以由包含SEQ IDNO：18的因子IX核苷酸序列和SEQ ID NO：6的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽来治疗疾病。

在第十六方面，提供了一种以由包含SEQ ID NO：18的因子IX核苷酸序列和SEQ IDNO：6的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽的方法，包括将本发明的多核苷酸、病毒颗粒或组合物施用至患者。

在第十七方面，提供了一种通过以由包含SEQ ID NO：18的因子IX核苷酸序列和SEQ ID NO：6的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽来治疗疾病的方法，包括将本发明的多核苷酸、病毒颗粒或组合物施用至患者。

在第十八方面，提供了本发明的多核苷酸、病毒颗粒或组合物用于以由包含SEQID NO：18的因子IX核苷酸序列和SEQ ID NO：6的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽的用途，从而治疗疾病。

在第十九方面，提供了本发明的多核苷酸、病毒颗粒或组合物用于通过以由包含SEQ ID NO：18的因子IX核苷酸序列和SEQ ID NO：6的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽来治疗疾病的用途。

在第二十方面，本发明的多核苷酸、病毒颗粒或组合物用于通过表达具有比由包含SEQ ID NO：12的因子IX核苷酸序列和SEQ ID NO：7的转录调节元件的病毒颗粒和/或包含SEQ ID NO：18的因子IX核苷酸序列和SEQ ID NO：6的转录调节元件的病毒颗粒表达的因子IX的活性更高的因子IX活性的因子IX蛋白或其片段来治疗疾病。

在第二十一方面，提供了一种通过表达具有比由包含SEQ ID NO：12的因子IX核苷酸序列和SEQ ID NO：7的转录调节元件的病毒颗粒和/或包含SEQ ID NO：18的因子IX核苷酸序列和SEQ ID NO：6的转录调节元件的病毒颗粒表达的因子IX的活性更高的因子IX活性的因子IX蛋白或其片段来治疗疾病的方法，包括向患者施用有效量的本发明的多核苷酸、病毒颗粒或组合物。

在第二十二方面，提供了本发明的多核苷酸、病毒颗粒或组合物用于通过表达具有比由包含SEQ ID NO：12的因子IX核苷酸序列和SEQ ID NO：7的转录调节元件的病毒颗粒和/或包含SEQ ID NO：18的因子IX核苷酸序列和SEQ ID NO：6的转录调节元件的病毒颗粒表达的因子IX的活性更高的因子IX活性的因子IX蛋白或其片段来治疗疾病的用途。

在第二十三方面，本发明的多核苷酸、病毒颗粒或组合物用于在患有B型血友病的患者中获得至少20％的稳定的因子IX活性水平。

在第二十四方面，提供了一种在患有B型血友病的患者中实现至少20％的稳定的因子IX活性水平的方法，包括将有效量的本发明的多核苷酸、病毒颗粒或组合物施用至患者。

在第二十五方面，提供了本发明的多核苷酸、病毒颗粒或组合物用于在患有B型血友病的患者中获得至少20％的稳定的因子IX活性水平的用途。

在第二十六方面，提供了用于治疗B型血友病的本发明的多核苷酸、病毒颗粒或组合物，包括以在患者中有效实现至少20％的稳定的因子IX活性水平的剂量向患者施用多核苷酸、病毒颗粒或组合物。

在第二十七方面，提供了一种治疗B型血友病的方法，包括以在患者中有效实现至少20％的稳定的因子IX活性水平的剂量向患者施用多核苷酸、病毒颗粒或组合物。

在第二十八方面，提供了本发明的多核苷酸、病毒颗粒或组合物在治疗B型血友病中的用途，包括以在患者中有效实现至少20％的稳定的因子IX活性水平的剂量向患者施用多核苷酸、病毒颗粒或组合物。

附图说明

图1—FIX转基因盒ssLP1.FIXco、ssHLP2.TI-codop-FIX-GoF(HTFG)和ssHLP2.TI-ACNP-FIX-GoF(HTAG)的示意图。ITR＝反向末端重复序列；HLP2和LP1分别是SEQ ID NO：6和7的转录调节元件；E＝外显子；T1＝截短的内含子1A；WT＝野生型；CO＝密码子优化的；ACNP＝本发明的经密码子优化的序列。

图2—用AAV2/Mut C载体进行HUH7转导的结果-实验1；(A)显示上清液中FIX抗原的水平；(B)显示使用细胞裂解物中存在的载体基因组数目标准化后的FIX抗原水平；误差棒代表n＝2的平均值±SD。1e3＝1×10³；5e3＝5×10³；1e4＝1×10⁴；MOI＝感染复数。

图3—用AAV2/Mut C载体进行HUH7转导的结果-实验2，显示上清液中FIX抗原的水平。误差棒代表n＝3的平均值±SD。1e3＝1×10³；5e3＝5×10³；1e4＝1×10⁴，MOI＝感染复数。

图4—用AAV2/Mut C载体进行HUH7转导的结果-实验2；A)显示上清液中FIX抗原的水平；(B)显示使用细胞裂解物中存在的载体基因组数目标准化后的FIX抗原水平。误差棒代表n＝3的平均值±SD。1e3＝1×10³；5e3＝5×10³；1e4＝1×10⁴；MOI＝感染复数。

图5—MOI 5×10³的HUA7细胞AAV2/Mut C转导的组合数据(来自实验1和2)。误差棒代表n＝12的平均值±SD。通过学生T检验，P＝0.001。5e3＝5×10³；MOI＝感染复数。

图6—在用AAV2/Mut C载体进行HUH7转导后，显示了MOI 1×10³、5×10³和1×10⁴的FIX的活性(实验1)。误差棒代表n＝2个重复孔的平均值±SD。1e3＝1×10³；5e3＝5×10³；1e4＝1×10⁴；MOI＝感染复数。

图7—在用AAV2/Mut C载体进行HUH7转导后，显示了FIX的活性(实验2)。误差棒代表n＝3的平均值±SD。1e3＝1×10³；5e3＝5×10³；1e4＝1×10⁴；MOI＝感染复数。

图8—在使用AAV2/Mut C载体进行HUH7转导后，显示了FIX的活性(实验3)。误差棒代表n＝3的平均值±SD。1e3＝1×10³；5e3＝5×10³；1e4＝1×10⁴；MOI＝感染复数。

图9—在使用AAV2/Mut C载体进行HUH7转导后显示的显示MOI 5×10³的FIX的活性的组合数据(来自实验1和2；图6和7)。误差棒代表n＝12的平均值±SD。5e3＝5×10³；MOI＝感染复数。使用学生T检验确定统计显著性(p＝0.0195)。

图10—施用AAV2/8.LP1.FIXco和AAV2/8.HLP2.HTFG后，鼠血浆中人FIX的标准化水平(实验3)。将FIX:Ag水平标准化至载体拷贝数/细胞。误差棒代表n＝4只小鼠的平均值±SD。P值<0.05(学生T检验)

图11—C57BL/6小鼠中FIX的替代密码子优化的比较(实验4)。给小鼠注射含有ssHLP2.HTFG、ssHLP2.HTAG或scLP1.FIXco的AAV2/8载体(对照)。注射后3周评估FIX抗原(A)的水平(ssHLP2.HTAG和sc.LP1.FIXco之间的P＝0.0007，ssHLP2.HTAG和ssHLP2.HTFG之间的p＝0.0198)。将抗原水平标准化至载体基因组(B)(ssHLP2.HTAG和sc.LP1.FIXco之间的p＝0.0009，ssHLP2.HTAG和ssHLP2.HTFG之间的p＝0.0039)。n＝4只小鼠。使用单向ANOVA(多重比较)确定P值。

图12—C57BL/6小鼠中FIX的替代密码子优化的比较(实验4)。给小鼠注射含有ssHLP2.HTFG、ssHLP2.HTAG或scLP1.FIXco的AAV2/8载体(对照)。注射后3周评估FIX活性水平。n＝4只小鼠。ssHLP2.HTAG和scLP1.FIXco之间的P＝0.0008，ssHLP2.HTAG和ssHLP2.HTFG之间的p＝0.01。使用单向ANOVA(多重比较)确定p值。

图13—因子IX结构的示意图。示意图上方的数字代表完整的因子IX多肽中的氨基酸位置，包括信号肽和前肽区(由SEQ ID NO：9编码)。示意图下方的代表成熟因子IX中的等同氨基酸位置(对应于SEQ ID NO：19中的编码序列的部分)。

图14—序列表。

图15—两名接受包含ssHLP2.HTAG的AAV2/Mut C载体的B型血友病患者中的平均因子IX活性。两名血友病患者施用4.5×10¹¹vg/kg的包含ssHLP2.HTAG的AAV2/Mut C载体。在施用后0-55周期间定期评估因子IX活性水平。如通过使用SynthASil^TM试剂盒的一阶段凝血测定法评估的，患者在52周时实现了40.5+/-4.5％的稳定的平均因子IX活性水平。在载体施用(输注)后第6-12周还向患者施用预防性泼尼松龙。“FIX：C(％)”描述了FIX活动水平；参见左y轴。“ALT(IU/L)”描述了丙氨酸转氨酶水平；参见右y轴。

详细描述

一般定义

除非另有定义，否则本文使用的技术和科学术语具有与本发明所属领域的技术人员通常理解的含义相同的含义。

通常，术语“包含”旨在意指包含但不限于。例如，短语“包含因子IX核苷酸序列的多核苷酸”应被解释为意指该多核苷酸具有因子IX核苷酸序列，但是该多核苷酸可以包含另外的核苷酸。

在本发明的一些实施方案中，单词“包含”被替换为短语“由……组成”。术语“由……组成”旨在是限制性的。例如，短语“由因子IX核苷酸序列组成的多核苷酸”应被理解为意指该多核苷酸具有因子IX核苷酸序列而没有另外的核苷酸。

术语“蛋白质”和“多肽”在本文可互换使用，并且是指任何长度的氨基酸的聚合物链。

为了本发明的目的，为了确定两个序列(例如两个多核苷酸或两个多肽序列)的同一性百分比，将这些序列进行比对以用于最佳比较目的(例如，可以在第一序列中引入缺口以用于与第二序列的最佳比对)。然后比较核苷酸位置上的核苷酸残基。当第一序列中的位置被与第二序列中相应位置相同的核苷酸残基占据时，则核苷酸在该位置是相同的。两个序列之间的同一性百分比是所述序列共有的相同位置的数量的函数(即，同一性％＝相同位置的数量/参考序列中的总位置数量×100)。

通常，序列比较是在参考序列的长度上进行的。例如，如果用户希望确定给定(“测试”)序列是否与SEQ ID NO：5是95％相同的，则SEQ ID NO：5是参考序列。例如，为了评估序列是否与SEQ ID NO：5(参考序列的实例)至少80％相同，本领域技术人员将在SEQ ID NO：5的长度上进行比对，并鉴定测试序列中有多少位置与SEQ ID NO：5的位置相同。如果至少80％的位置相同，则测试序列与SEQ ID NO：5至少80％相同。如果序列比SEQ ID NO：5短，则缺口或缺失位置应视为不相同的位置。

本领域技术人员知道可用于确定两个序列之间的同源性或同一性的不同计算机程序。例如，可以使用数学算法来完成序列的比较和两个序列之间的同一性百分比的确定。在一个实施方案中，使用Needleman和Wunsch(1970)算法确定两个氨基酸或核酸序列之间的同一性百分比，该算法已被并入Accelrys GCG软件包的GAP程序中(可在http://www.accelrys.com/products/gcg/获得)，使用Blosum 62矩阵或PAM250矩阵，以及16、14、12、10、8、6或4的缺口权重和1、2、3、4、5或6的长度权重。

为了本发明的目的，术语“片段”是指序列的连续部分。例如，50个核苷酸的SEQ IDNO：5的片段是指SEQ ID NO：5的50个连续核苷酸。

多核苷酸

一方面，本发明提供了包含因子IX核苷酸序列的多核苷酸，其中因子IX核苷酸序列包含编码因子IX蛋白或其片段的编码序列，并且其中因子IX核苷酸序列的一部分不是野生型的。

多核苷酸可还包含一种或多种以下特征。多核苷酸可以包含未经密码子优化的部分。多核苷酸可以包含内含子或内含子片段。多核苷酸可在对应于野生型因子IX的密码子384的密码子中包含突变。

术语“多核苷酸”是指任意长度的核苷酸、脱氧核糖核苷酸、核糖核苷酸或其类似物的聚合形式。例如，多核苷酸可以包含DNA(脱氧核糖核苷酸)或RNA(核糖核苷酸)。多核苷酸可以由DNA组成。多核苷酸可以是mRNA。由于多核苷酸可以包含RNA或DNA，因此所有对T(胸腺嘧啶)核苷酸的引用都可以用U(尿嘧啶)取代。

因子IX核苷酸序列

多核苷酸包含因子IX核苷酸序列。因子IX核苷酸序列包含编码因子IX蛋白或其片段的编码序列。

“编码序列”是编码多核苷酸并且排除非编码区如内含子的序列。编码序列可以被非编码核苷酸(例如内含子)中断，但是只有编码多肽的核苷酸应被认为是编码序列的一部分。例如，编码因子IX蛋白的编码序列将包含编码形成由该编码序列表达的因子IX蛋白的一部分的氨基酸的任何密码子，而与那些密码子在序列上是连续的还是被一个或多个非编码核苷酸分隔开无关。换句话说，包含被非编码核苷酸区段中断的编码核苷酸区段的多核苷酸将被视为包含由紧接并列的非连续编码区段组成(即减去非编码区段)的“编码序列”。然而，在本文中，终止密码子将被认为是全长编码序列的一部分。

术语“编码……的序列”是指包含编码所编码的多肽的密码子的核苷酸序列。例如，编码因子IX蛋白或其片段的核苷酸序列包含编码因子IX蛋白或其片段的氨基酸序列的密码子。SEQ ID NO：5中提供了合适的核苷酸序列。

下表描述了编码每个氨基酸的密码子：

相应的RNA密码子将包含U来取代上表中的T。

本发明的一方面提供了包含因子IX核苷酸序列的多核苷酸，其中因子IX核苷酸序列编码因子IX蛋白或其片段，并且与SEQ ID NO：5具有至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％的同一性。任选地，因子IX核苷酸序列包含编码序列，并且该编码序列的一部分是经密码子优化的。

通常，因子IX核苷酸序列可以与SEQ ID NO：5的至少1200、至少1350或至少1650个核苷酸的片段至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。因子IX核苷酸序列可以与SEQ ID NO：5的至少1200、至少1350或至少1650个核苷酸的连续片段至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。因子IX核苷酸序列可以与SEQ ID NO：5至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。例如，因子IX核苷酸序列可以与SEQ ID NO：5至少98％相同。

因子IX蛋白或其片段

多核苷酸包含因子IX核苷酸序列，所述因子IX核苷酸序列包含编码因子IX蛋白或其片段的编码序列。

野生型因子IX是一种丝氨酸蛋白酶，其形成凝血级联的一部分。缺乏或突变的因子IX可导致减少的血液凝结和B型血友病疾病。典型的野生型因子IX多肽由SEQ ID NO：9(有时称为因子IX

B)或SEQ ID NO：19编码。替代的野生型因子IX多肽在密码子194处不同于由SEQ ID NO：9编码的多肽，例如密码子194可以编码苏氨酸(“Malmo A”)而不是丙氨酸。

最初表达为前体“未成熟”形式的因子IX(例如SEQ ID NO：16的因子IX)包含疏水性信号肽(SEQ ID NO：16的氨基酸1-28)、前肽区(SEQ ID NO：16的氨基酸29-46)和成熟的多肽区域，如图13所示。因子IX的成熟(酶原)形式缺少疏水性信号肽和前肽区。术语“成熟因子IX”是指不包含疏水性信号肽或前肽区的因子IX多肽，例如SEQ ID NO：8。

在凝结过程中，单链酶原形式被因子XIa或因子VI Ia裂解，以产生活性的双链形式(因子IXa)，其中两条链通过二硫桥相连。活化的形式可以催化因子X中的精氨酸-异亮氨酸键的水解以形成因子Xa。野生型因子IX被凝血酶抑制。野生型因子IX蛋白具有四个蛋白结构域，即Gla结构域、EGF结构域的两个串联拷贝以及负责催化裂解的C端胰蛋白酶样肽酶结构域。

术语“因子IX蛋白”是指因子IX的单链酶原形式、活化的双链形式及其变体，并且可以指成熟的因子IX多肽或包含前肽区和/或信号肽区域的因子IX多肽。

优选地，因子IX片段的长度为至少200、至少250、至少300、200至461、250至461或300至461个氨基酸。在一个实施方案中，因子IX蛋白或其片段包含：

a)与SEQ ID NO：8至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列；或者

b)与SEQ ID NO：8的至少200、至少250、至少300、200至415、250至415或300至415个氨基酸的片段至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

在一个实施方案中，因子IX蛋白或其片段与SEQ ID NO：16至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同；或与SEQ ID NO：16的长度为至少200、至少250、至少300、200至461、250至461或300至461个氨基酸的片段至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。在一个实施方案中，因子IX蛋白或其片段与SEQ ID NO：16至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同；或与SEQ ID NO：16的长度为至少300或300至461个氨基酸的片段至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。因子IX蛋白或其片段可以具有SEQ ID NO：16或SEQ ID NO：8的序列。

优选地，因子IX蛋白或其片段是功能性的。功能性因子IX蛋白或片段是对因子X中的精氨酸-异亮氨酸键进行水解以形成因子Xa的蛋白或片段。

确定由因子IX核苷酸序列编码的因子IX蛋白或片段是否是功能性的在本领域技术人员的能力范围内。本领域技术人员仅需要表达因子IX核苷酸序列，并测试表达的蛋白质是否有活性。例如，本领域技术人员可以制备包含与可操作的启动子连接的因子IX核苷酸序列的本发明的病毒颗粒，并在适合于表达因子IX蛋白或其片段的条件下用病毒颗粒转导细胞。可以使用生色测定法(例如实施例3中描述的活性测定法)分析表达的因子IX蛋白或其片段的活性。

例如，合适的生色测定法如下所述。因子IX与凝血酶、磷脂、钙、凝血酶活化的因子VIII和因子XIa混合。在这些条件下，因子XIa激活因子IX以形成因子IXa，并且因子IXa的活性可以催化生色底物(SXa-11)的裂解，以产生pNA。可以通过确定在405nm处的吸光度来测量生成的pNA的水平，并且这与样品中因子IX的活性成比例。

通过使用标准ELISA测定法(例如实施例4中所述的测定法)测量样品中的因子IX的浓度，然后将活性除以因子IX浓度，可以将活性标准化以补偿样品中不同浓度的因子IX。例如，与因子IX结合的抗体可以与平板结合。可以将包含未知浓度的因子IX的样品通过平板。可以将与因子IX结合的第二种检测抗体施加至平板，并洗掉任何多余的物质。保留(即未洗掉的)的检测抗体将与因子IX结合。检测抗体可以与酶例如辣根过氧化物酶连接。可以通过测量检测抗体的量来测量与平板上的因子IX结合的检测抗体的水平。例如，如果检测抗体与辣根过氧化物酶连接，则辣根过氧化物酶可以催化从底物(例如TMB(3,3',5,5'-四甲基联苯胺))生成蓝色反应产物，并可以通过在450nm处的吸光度检测蓝色产物的水平。蓝色产物的水平与洗涤步骤后保留的检测抗体的量(其与样品中因子IX的量成比例)成比例。

任选地，因子IX蛋白或其片段的活性高于由SEQ ID NO：9、SEQ ID NO：19或SEQ IDNO：12编码的因子IX多肽的活性。任选地，使用对因子IX具有特异性的生色底物(即可以被因子IXa改变以提供生色信号的底物)来测量活性。合适的生色底物是SXa-11。

在一个实施方案中，因子IX蛋白或其片段在对应于野生型因子IX的位置384的位置处包含突变。例如，野生型因子IX的位置384(从信号肽的起始处(即对应于SEQ ID NO：16的氨基酸384的位置)开始编号)是精氨酸残基(R384)，但是这可以被不同的残基取代。在一个实施方案中，R384被小的疏水氨基酸取代。例如，小的疏水氨基酸可以是丙氨酸、异亮氨酸、亮氨酸、缬氨酸或甘氨酸。优选地，因子IX蛋白或其片段在对应于野生型因子IX的位置384的位置处包含亮氨酸，如SEQ ID NO：16所示。

与野生型序列的位置384相对应的位置处的突变可能导致功能获得(GoF)突变，导致功能亢进的因子IX。表达在位置384处包含突变的因子IX蛋白的优点是蛋白质量的相对较小增加导致整体蛋白质活性的较大增加。

确定给定的多肽是否在对应于位置384的位置处具有突变在本领域技术人员的能力范围内。本领域技术人员仅需要将多肽序列的序列与野生型(前体，未成熟)因子IX多肽的序列进行比对，并确定与后者的第384个残基对齐的前者的残基是否为精氨酸。如果不是，则该多肽在对应于野生型因子IX的位置384的位置处具有突变。可以使用诸如上述的Needleman和Wunsch算法的任何合适的算法来执行比对。

编码序列的一部分不是野生型的

编码序列的一部分可以不是野生型的。编码野生型因子IX的核苷酸序列由SEQ IDNO：9表示，并且包含与SEQ ID NO：9不同的部分的编码序列包含非野生型的部分(条件是这样的部分也与也被认为是野生型的其他因子IX编码序列(例如前述的Malmo A变体)不同)。

在一个实施方案中，编码序列的非野生型的部分是经密码子优化的。为了鉴定编码序列是否包含经密码子优化的部分，可以将编码序列与SEQ ID NO：9进行比对。如果序列的任何部分与SEQ ID NO：9不相同，则用户然后应该确定它们是否经密码子优化，即，它们是否包含至少一个已经被偏好的密码子(即TTC、CTG、ATC、GTG、GTC、AGC、CCC、ACC、GCC、TAC、CAC、CAG、AAC、AAA、AAG、GAC、TGC、AGG、GGC和GAG之一)取代的密码子。如果非野生型的部分包含至少一个已经被偏好的密码子取代的密码子，则其是经密码子优化的。优选地，编码序列的连续部分是经密码子优化的。然而，在一些实施方案中，经密码子优化的编码序列的部分可以分离在编码序列的2、3、4或5个区域上。任选地，未经密码子优化的编码序列的部分分离在编码序列的少于3或少于2个区域上。可以通过用在特定器官或特定生物体中偏好(即反映密码子偏好)的其他密码子(所谓的偏好的密码子)取代密码子来对核苷酸序列进行密码子优化。这样的密码子优化改善了特定器官或特定生物体中核苷酸序列的表达。例如，如果核苷酸序列是针对人肝脏进行密码子优化的，则对该核苷酸序列进行修饰以增加人肝脏中所偏好的密码子的数量。本领域技术人员将理解，密码子优化序列可不需要改变每个密码子，因为在某些位置可能已经存在“偏好的密码子”。

这样的密码子优化可能受到其他因素的影响。例如，可以看出CpG的存在对表达有不利影响，因此，如果在某些位置使用偏好的密码子将CpG引入序列中，则用户可以决定不使用偏好的密码子；这仍然将被认为是经密码子优化的。在一个实施方案中，以C核苷酸结尾的偏好的密码子将不包括在经密码子优化的编码序列的部分中，其中序列中的下一个密码子以G开头。例如，密码子CTC编码亮氨酸。在序列中的下一个密码子以G开头，例如为密码子GTT时，则CTC不应当用于编码亮氨酸。

本申请公开了某些密码子对于在人肝脏中的表达是偏好的，并且降低编码序列的CpG含量同时保持这些偏好的密码子的高比例改善编码序列的表达。偏好的密码子是TTC、CTG、ATC、GTG、GTC、AGC、CCC、ACC、GCC、TAC、CAC、CAG、AAC、AAA、AAG、GAC、TGC、AGG、GGC和GAG。

在一个实施方案中，经密码子优化的编码序列的部分是针对在肝脏(任选地，人肝脏)中的表达进行密码子优化的。针对在肝脏中的表达进行密码子优化的编码序列的部分可能包含较高比例的在肝脏中偏好的密码子，例如偏好的密码子TTC、CTG、ATC、GTG、GTC、AGC、CCC、ACC、GCC、TAC、CAC、CAG、AAC、AAA、AAG、GAC、TGC、AGG、GGC和GAG。

在一个实施方案中，以下密码子在编码序列的非野生型或经密码子优化的部分中集体过度呈现：TTC、CTG、ATC、GTG、GTC、AGC、CCC、ACC、GCC、TAC、CAC、CAG、AAC、AAA、AAG、GAC、TGC、AGG、GGC和GAG。“集体过度呈现”是指编码序列中经密码子优化的或非野生型的部分中偏好密码子的总数高于野生型因子IX核苷酸序列(例如SEQ ID NO：9或SEQ ID NO：19)的相应部分中偏好密码子的总数。

在一个优选的实施方案中，与野生型因子IX核苷酸序列(例如SEQ ID NO：9的序列)的相应部分相比，在经密码子优化的编码序列的部分中，以下密码子的频率更高：TTC、CTG、ATC、GTG、GTC、AGC、CCC、ACC、GCC、TAC、CAC、CAG、AAC、AAA、AAG、GAC、TGC、AGG、GGC和GAG。任选地，以下密码子在经密码子优化的编码序列的部分中集体过度呈现，除非它们的存在导致CpG：TTC、CTG、ATC、GTG、GTC、AGC、CCC、ACC、GCC、TAC、CAC、CAG、AAC、AAA、AAG、GAC、TGC、AGG、GGC和GAG。任选地，经密码子优化的编码序列的部分包含至少40％、至少45％、至少50％、至少55％、至少60％或至少65％、至少70％或至少73％的选自以下的密码子：TTC、CTG、ATC、GTG、GTC、AGC、CCC、ACC、GCC、TAC、CAC、CAG、AAC、AAA、AAG、GAC、TGC、AGG、GGC和GAG。

在下表中将本发明的多核苷酸(HLP2.T1-ACNP-FIX-GoF)的经密码子优化的部分中的密码子使用与野生型因子IX核苷酸序列(SEQ ID NO：9)的相应区段中的密码子使用进行比较。

表1

在该区域中SEQ ID NO：9中的偏好的密码子的总数是120(序列的30％)。另一方面，HTAG的经密码子优化的部分中的偏好的密码子的总数为293(密码子的73％)。

确定多核苷酸的给定部分是否包含偏好的密码子是简单的。为了确定在核苷酸序列的一部分中使用的每个密码子的频率，本领域技术人员仅需要将该部分的序列输入到查看密码子使用并审查结果的一种容易获得的算法中。或者，用户可以简单地对它们进行计数。

下表列出了与SEQ ID NO：9的相应区域相比在HTAG的经密码子优化的部分中被取代的密码子。

表2

在一个实施方案中，在编码序列的经密码子优化的部分中：

a)与参考野生型因子IX序列相比，至少1、至少2、至少4或至少5个编码苯丙氨酸的密码子被TTC取代；

b)至少60％、至少65％或至少70％的编码苯丙氨酸的密码子是TTC；

c)至少60％、至少65％或至少70％的编码苯丙氨酸的密码子是TTC，其余是TTT；和/或

d)编码苯丙氨酸的密码子是TTC，除非下一个密码子以G开头。

例如，当提及至少1个密码子A被至少1个密码子B取代时，这是指与野生型序列(例如SEQ ID NO：9)相比，在至少1个位置处密码子A被密码子B取代。为了确定是否发生了这样的取代，只需要将测试序列与野生型因子IX序列进行比对，并查看哪些密码子是不同的。如果对应于野生型因子IX的密码子A的测试序列中的至少一个密码子是测试序列中的密码子B，则至少一个密码子A已被密码子B取代。例如，如果测试序列中的第一个密码子是TTT和野生型因子IX序列中的第一个密码子是TTC，该测试序列包含至少1个被TTT取代的密码子TTC。

在一个实施方案中，在经密码子优化的编码序列的部分中：

a)与参考野生型因子IX序列相比，至少5、至少10、至少15或至少16个编码亮氨酸的密码子被CTG取代；

b)至少90％或至少94％的编码亮氨酸的密码子是CTG；和/或

c)至少90％或至少94％的编码亮氨酸的密码子是CTG，其余是CTC。

在一个实施方案中，在经密码子优化的编码序列的部分中：

a)与参考野生型因子IX序列相比，至少5、至少10、至少11或至少12个编码异亮氨酸的密码子被ATC取代；

b)与参考野生型因子IX序列相比，至少一个ATC密码子被ATT取代，其中下一个密码子以G开头；

c)至少60％、至少70％或至少75％的编码异亮氨酸的密码子是ATC；

d)至少60％、至少70％或至少75％的编码异亮氨酸的密码子是ATC，其余是ATT；和/或

e)编码异亮氨酸的密码子是ATC，除非下一个密码子以G开头。

在一个实施方案中，在经密码子优化的编码序列的部分中：

a)与参考野生型因子IX序列相比，至少10、至少15、至少20或至少25个编码缬氨酸的密码子被GTG取代；

b)与参考野生型因子IX序列相比，至少1个编码缬氨酸的密码子被GTC取代；

c)至少80％、至少90％或至少95％的编码缬氨酸的密码子是GTG；和/或

d)至少80％、至少90％或至少95％的编码缬氨酸的密码子是GTG，其余是GTC。

在一个实施方案中，在经密码子优化的编码序列的部分中：

a)与参考野生型因子IX序列相比，至少5、至少10、至少12或至少13个编码丝氨酸的密码子被AGC取代；

b)与参考野生型因子IX序列相比，至少1、至少2或至少4个编码丝氨酸的密码子被TCT取代，其中下一个密码子以G开头；

c)至少60％、至少65％或至少70％的编码丝氨酸的密码子是AGC；和/或

d)至少60％、至少65％或至少70％的编码丝氨酸的密码子是AGC，其余是TCT或TCC。

在一个实施方案中，在经密码子优化的编码序列的部分中：

a)与参考野生型因子IX序列相比，至少1、至少2或至少5个编码脯氨酸的密码子被CCC取代；

b)与参考野生型因子IX序列相比，至少1个编码脯氨酸的密码子被CCT取代，其中下一个密码子以G开头；

c)至少50％、至少55％或至少60％的编码脯氨酸的密码子是CCC；

d)50％、至少55％或至少60％的编码脯氨酸的密码子为CCC，其余是CCA或CCT；和/或

e)编码脯氨酸的密码子是CCC，除非下一个密码子以G开头。

在一个实施方案中，在经密码子优化的编码序列的部分中：

a)与参考野生型因子IX序列相比，至少6、至少7、至少8或至少10个编码苏氨酸的密码子被ACC取代；

b)与参考野生型因子IX序列相比，至少1或至少2个编码苏氨酸的密码子被ACT取代，其中下一个密码子以G开头；

c)至少45％、至少50％或至少55％的编码苏氨酸的密码子是ACC；

d)至少45％、至少50％或至少55％的编码苏氨酸的密码子是ACC，其余是ACT；和/或

e)编码苏氨酸的密码子是ACC，除非下一个密码子以G开头。

在一个实施方案中，在经密码子优化的编码序列的部分中：

a)与参考野生型因子IX序列相比，至少1、至少2、至少3或至少4个编码丙氨酸的密码子被GCC取代；

b)与参考野生型因子IX序列相比，至少1、至少2或至少3个编码丙氨酸的密码子被GCT取代，其中下一个密码子以G开头；

c)至少35％、至少40％或至少43％的编码丙氨酸的密码子是GCC；

d)至少35％、至少40％或至少45％的编码丙氨酸的密码子是GCC，其余是GCT；和/或

e)编码丙氨酸的密码子是GCC，除非下一个密码子以G开头。

在一个实施方案中，在经密码子优化的编码序列的部分中：

a)与参考野生型因子IX序列相比，至少1或至少2个编码酪氨酸的密码子被TAC取代；

b)与参考野生型因子IX序列相比，至少1个TAC密码子被TAT取代，其中下一个密码子以G开头；

c)至少40％、至少45％或至少48％的编码酪氨酸的密码子是TAC；

d)至少40％、至少45％或至少48％的编码酪氨酸的密码子是TAC，其余是TAT；和/或

e)编码酪氨酸的密码子是TAC，除非下一个密码子以G开头。

在一个实施方案中，在经密码子优化的编码序列的部分中：

a)与参考野生型因子IX序列相比，至少1个编码组氨酸的密码子被CAC取代；

b)至少50％、至少60％或至少65％的编码组氨酸的密码子是CAC；

c)至少50％、至少60％或至少65％的编码组氨酸的密码子是CAC，其余是CAT；和/或

d)编码组氨酸的密码子是CAC，除非下一个密码子以G开头。

在一个实施方案中，在经密码子优化的编码序列的部分中：

a)与参考野生型因子IX序列相比，至少1、至少2、至少4或至少5个编码谷氨酰胺的密码子被CAG取代；

b)与参考野生型因子IX序列相比，至少1个CAG密码子被CAA取代；

c)至少80％、至少85％或至少90％的编码谷氨酰胺的密码子是CAG；和/或

d)至少80％、至少85％或至少90％的编码谷氨酰胺的密码子是CAG，其余是CAA。

在一个实施方案中，在经密码子优化的编码序列的部分中：

a)与参考野生型因子IX序列相比，至少1、至少2、至少4或至少5个编码天冬酰胺的密码子被AAC取代；

b)至少60％、至少65％或至少70％的编码天冬酰胺的密码子是AAC；

c)至少60％、至少65％或至少70％的编码天冬酰胺的密码子是AAC，其余是AAT；和/或

d)编码天冬酰胺的密码子是AAC，除非下一个密码子以G开头。

在一个实施方案中，在经密码子优化的编码序列的部分中：

a)与参考野生型因子IX序列相比，至少5、至少7、至少8或至少9个编码赖氨酸的密码子被AAG取代；

b)与参考野生型因子IX序列相比，至少1个AAG密码子被AAA取代。

c)至少80％、至少90％或至少95％的编码赖氨酸的密码子是AAG；和/或

d)至少80％、至少90％或至少95％的编码赖氨酸的密码子是AAG，其余的是AAA。

在一个实施方案中，在经密码子优化的编码序列的部分中：

a)与参考野生型因子IX序列相比，至少1、至少2、至少3或至少4个编码天冬氨酸的密码子被GAC取代；

b)与参考野生型因子IX序列相比，其中至少1个GAC密码子被GAT取代，其中下一个密码子以G开头；

c)至少45％、至少50％或至少60％的编码天冬氨酸的密码子是GAC；

d)至少45％、至少50％或至少60％的编码天冬氨酸的密码子是GAC，其余是GAT；和/或

e)编码天冬氨酸的密码子是GAC，除非下一个密码子以G开头。

在一个实施方案中，在经密码子优化的编码序列的部分中：

a)与参考野生型因子IX序列相比，至少15、至少20、至少25或至少26个编码谷氨酸的密码子被GAG取代；

b)至少80％、至少90％或至少95％的编码谷氨酸的密码子是GAG；和/或

c)至少80％、至少90％或至少95％的编码谷氨酸的密码子是GAG和其余的是GAA。

在一个实施方案中，在经密码子优化的编码序列的部分中：

a)与参考野生型因子IX序列相比，至少5、至少6、至少7或至少8个编码半胱氨酸的密码子被TGC取代；

b)与参考野生型因子IX序列相比，至少1个TGC密码子被TGT取代，其中下一个密码子以G开头；

c)至少40％、至少50％或至少55％的编码半胱氨酸的密码子是TGC；

d)至少40％、至少50％或至少55％的编码半胱氨酸的密码子是TGC，其余是TGT；和/或

e)编码半胱氨酸的密码子是TGC，除非下一个密码子以G开头。

在一个实施方案中，在经密码子优化的编码序列的部分中，在经密码子优化的编码序列的部分中，编码色氨酸的密码子是TGG。

在一个实施方案中，在经密码子优化的编码序列的部分中：

a)与参考野生型因子IX序列相比，至少5、至少8、至少10或至少11个编码精氨酸的密码子被AGG取代；

b)与参考野生型因子IX序列相比，至少1个编码精氨酸的密码子被AGA取代；

c)至少60％、至少70％或至少75％的编码精氨酸的密码子是AGG；和/或

d)至少60％、至少70％或至少75％的编码精氨酸的密码子是AGG，其余是AGA。

优选地，至少60％、至少70％或至少75％的编码精氨酸的密码子是AGG。

在一个实施方案中，在经密码子优化的编码序列的部分中：

a)与参考野生型因子IX序列相比，至少5、至少10、至少12或至少13个编码甘氨酸的密码子被GGC取代；

b)与参考野生型因子IX序列相比，至少5、至少6、至少7或至少8个编码甘氨酸的密码子被GGG取代，其中下一个密码子以G开头。

c)至少50％、至少55％或至少60％的编码甘氨酸的密码子是GGC；

d)至少50％、至少55％或至少60％的编码甘氨酸的密码子是GGC，其余的是GGG；和/或

e)编码甘氨酸的密码子是GGC，除非下一个密码子以G开头。

在一个实施方案中，经密码子优化的编码序列的部分包含编码苯丙氨酸、亮氨酸、异亮氨酸、缬氨酸、丝氨酸、脯氨酸、苏氨酸、丙氨酸、酪氨酸、组氨酸、谷氨酰胺、天冬酰胺、赖氨酸、天冬氨酸、谷氨酸、半胱氨酸、色氨酸、精氨酸和甘氨酸的密码子。

在一个实施方案中，经密码子优化的编码序列的部分包含编码苯丙氨酸、亮氨酸、异亮氨酸、缬氨酸、丝氨酸、脯氨酸、苏氨酸、丙氨酸、酪氨酸、组氨酸、谷氨酰胺、天冬酰胺、赖氨酸、天冬氨酸、谷氨酸、半胱氨酸、色氨酸、精氨酸和甘氨酸的密码子，并且在密码子优化的部分中：

a)与参考野生型因子IX序列相比，至少5个编码苯丙氨酸的密码子被TTC取代；

b)与参考野生型因子IX序列相比，至少16个编码亮氨酸的密码子被CTG取代；

c)与参考野生型因子IX序列相比，至少12个编码异亮氨酸的密码子被ATC取代；

d)与参考野生型因子IX序列相比，至少25个编码缬氨酸的密码子被GTG取代；

e)与参考野生型因子IX序列相比，至少13个编码丝氨酸的密码子被AGC取代；

f)与参考野生型因子IX序列相比，至少5个编码脯氨酸的密码子被CCC取代；

g)与参考野生型因子IX序列相比，至少10个编码苏氨酸的密码子被ACC取代；

h)与参考野生型因子IX序列相比，至少4个编码丙氨酸的密码子被GCC取代；

i)与参考野生型因子IX序列相比，至少2个编码酪氨酸的密码子被TAC取代；

j)与参考野生型因子IX序列相比，至少1个编码组氨酸的密码子被CAC取代；

k)与参考野生型因子IX序列相比，至少5个编码谷氨酰胺的密码子被CAG取代；

l)与参考野生型因子IX序列相比，至少5个编码天冬酰胺的密码子被AAC取代；

m)与参考野生型因子IX序列相比，至少9个编码赖氨酸的密码子被AAG取代；

n)与参考野生型因子IX序列相比，至少4个编码天冬氨酸的密码子被GAC取代；

o)与参考野生型因子IX序列相比，至少26个编码谷氨酸的密码子被GAG取代；

p)与参考野生型因子IX序列相比，至少8个编码半胱氨酸的密码子被TGC取代；

q)编码色氨酸的密码子是TGG；

r)与参考野生型因子IX序列相比，至少11个编码精氨酸的密码子被AGG取代；和

s)与参考野生型因子IX序列相比，至少13个编码甘氨酸的密码子被GGC取代。

a)至少70％的编码苯丙氨酸的密码子是TTC；

b)至少94％的编码亮氨酸的密码子是CTG；

c)至少75％的编码异亮氨酸的密码子是ATC；

d)至少95％的编码缬氨酸的密码子是GTG；

e)至少70％的编码丝氨酸的密码子是AGC；

f)至少60％的编码脯氨酸的密码子是CCC；

g)至少55％的编码苏氨酸的密码子是ACC；

h)至少43％的编码丙氨酸的密码子是GCC；

i)至少48％的编码酪氨酸的密码子是TAC；

j)至少65％的编码组氨酸的密码子是CAC；

k)至少90％的编码谷氨酰胺的密码子是CAG；

l)至少70％的编码天冬酰胺的密码子是AAC；

m)至少95％的编码赖氨酸的密码子是AAG；

n)至少60％的编码天冬氨酸的密码子是GAC；

o)至少95％的编码谷氨酸的密码子是GAG；

p)至少55％的编码半胱氨酸的密码子是TGC；

q)编码色氨酸的密码子是TGG；

r)至少75％的编码精氨酸的密码子是AGG；和

s)至少60％的编码甘氨酸的密码子是GGC。

a)至少70％的编码苯丙氨酸的密码子是TTC，其余是TTT；

b)至少94％的编码亮氨酸的密码子是CTG，其余是CTC；

c)至少75％的编码异亮氨酸的密码子是ATC，其余是ATT；

d)至少95％的编码缬氨酸的密码子是GTG；

e)至少70％的编码丝氨酸的密码子是AGC；

f)至少60％的编码脯氨酸的密码子是CCC，其余是CCA或CCT；

g)至少55％的编码苏氨酸的密码子是ACC，其余是ACT；

h)至少43％的编码丙氨酸的密码子是GCC，其余是GCT；

i)至少48％的编码酪氨酸的密码子是TAC，其余是TAT；

j)至少65％的编码组氨酸的密码子是CAC，其余的是CAT；

k)至少90％的编码谷氨酰胺的密码子是CAG，其余的是CAA；

l)至少70％的编码天冬酰胺的密码子是AAC，其余的是AAT；

m)至少95％的编码赖氨酸的密码子是AAG，其余的是AAA；

n)至少60％的编码天冬氨酸的密码子是GAC，其余是GAT；

o)至少95％的编码谷氨酸的密码子是GAG，其余的是GAA；

p)至少55％的编码半胱氨酸的密码子是TGC，其余的是TGT；

q)编码色氨酸的密码子是TGG；

r)至少75％的编码精氨酸的密码子是AGG，其余是AGA；和

s)至少60％的编码甘氨酸的密码子是GGC，其余是GGG。

参考野生型因子IX序列是SEQ ID NO：9或SEQ ID NO：19。

经密码子优化的部分可以对应于编码部分或全部因子IX蛋白的序列。例如，因子IX蛋白可以是全长编码序列(诸如编码SEQ ID NO：8或SEQ ID NO：16的序列)或其变体，并且整个编码序列可以是经密码子优化的。因此，本文中提及“编码序列的一部分是经密码子优化的”应理解为是指“编码序列的至少一部分是经密码子优化的”。然而，在一些实施方案中，编码序列的一部分未经密码子优化，例如，编码序列的一部分未经密码子优化以用于在肝脏中表达。在一些实施方案中，经密码子优化的编码序列的部分的长度为至少800、至少900、至少1100、少于1500、少于1300、少于1200、800至1500、900至1300、1100至1200或约1191个核苷酸。

在一个实施方案中，经密码子优化的编码序列的部分包含外显子3或外显子3的至少10、至少15、至少20、少于25、10至25、15至25或20至25个核苷酸的部分。在另一个实施方案中，经密码子优化的编码序列的部分包含外显子4或外显子4的至少80、至少90、至少100、少于114、80至114、90至114或100至114个核苷酸的部分。在另一个实施方案中，经密码子优化的编码序列的部分包含外显子5或外显子5的至少90、至少100、至少110、少于129、90至129、100至129或110至129个核苷酸的部分。在另一个实施方案中，经密码子优化的编码序列的部分包含外显子6或外显子6的至少150、至少180、至少200、少于203、150至203、180至203或200至203个核苷酸的部分。在另一个实施方案中，经密码子优化的编码序列的部分包含外显子7或外显子7的至少70、至少80、至少90、至少100、少于115、70至115、80至115、90至115或100至115个核苷酸的部分。在另一个实施方案中，经密码子优化的编码序列的部分包含外显子8或外显子8的至少400、至少450、至少500、少于548、400至548、450至548或500至548个核苷酸的部分。

外显子3包含野生型因子IX(例如SEQ ID NO：9的因子IX)的核苷酸253-277或非野生型因子IX核苷酸序列中的相应序列。外显子4包含野生型因子IX(例如SEQ ID NO：9的因子IX)的核苷酸278-391或非野生型因子IX核苷酸序列中的相应序列。外显子5包含野生型因子IX(例如SEQ ID NO：9的因子IX)的核苷酸392-520或非野生型因子IX核苷酸序列中的相应序列。外显子6包含野生型因子IX(例如SEQ ID NO：9的因子IX)的核苷酸521-723或非野生型因子IX核苷酸序列中的相应序列。外显子7包含野生型因子IX(例如SEQ ID NO：9的因子IX)的核苷酸724-838或非野生型因子IX核苷酸序列中的相应序列。外显子8包含野生型因子IX(例如SEQ ID NO：9的因子IX)的核苷酸839-1386或非野生型因子IX核苷酸序列中的相应序列。

优选地，外显子3的至少20个核苷酸的部分、外显子4的至少100个核苷酸的部分、外显子5的至少110个核苷酸的部分、外显子6的至少180个核苷酸的部分、外显子7的100个核苷酸的部分和外显子8的至少500个核苷酸的部分是经密码子优化的。经密码子优化的编码序列的部分可以包含外显子3、外显子4、外显子5、外显子6、外显子7和外显子8。在一个实施方案中，经密码子优化的编码序列的部分包含外显子3、外显子4、外显子5、外显子6、外显子7和外显子8。

在一个实施方案中，经密码子优化的编码序列的部分包含外显子2的一部分，并且外显子2的该部分的长度为少于160、少于150、少于100、少于75、少于60、至少20、至少30、至少40、至少50、20至160、30至150、30至100、40至75或约56个核苷酸。外显子2包含野生型因子IX(例如SEQ ID NO：9的因子IX)的核苷酸89-252或非野生型因子IX核苷酸序列中的相应序列。在优选的实施方案中，经密码子优化的编码序列的部分包含长度为30至100个核苷酸的外显子2的一部分。

确定编码因子IX蛋白或其片段的序列的一部分是否对应于例如野生型因子IX的外显子8在本领域技术人员的能力范围内。本领域技术人员仅需要使用合适的比对算法(例如上文所述的Needleman和Wunsch的算法)将编码因子IX蛋白或其片段的序列与外显子8进行序列比对，并确定是否至少部分的核苷酸序列与SEQ ID NO：9的外显子8(如上文所述，SEQ ID NO：9的外显子8由SEQ ID NO：9的核苷酸839-1386组成)具有大于90％、大于95％或大于98％的同一性。

如上文所讨论的，提供包含部分或全部经密码子优化的编码序列的多核苷酸序列可以确保编码的多肽以高水平表达。在一个实施方案中，与参考野生型因子IX序列相比，由因子IX核苷酸序列编码的多肽在人肝细胞中以更高的水平表达。参考野生型因子IX序列可以是SEQ ID NO：9。在一个实施方案中，与由包含SEQ ID NO：12的因子IX核苷酸序列和SEQID NO：7的转录调节元件的核苷酸序列编码的多肽相比，由因子IX核苷酸序列编码的多肽在人肝细胞中以更高的水平表达。在一个实施方案中，由包含SEQ ID NO：18的因子IX核苷酸序列和SEQ ID NO：6的转录调节元件的核苷酸序列编码的多肽相比，由因子IX核苷酸序列编码的多肽在人肝细胞中以更高的水平表达。

在一个实施方案中，由因子IX核苷酸序列编码的多肽在人肝细胞中以由包含SEQID NO：12或SEQ ID NO：18的因子IX核苷酸序列和SEQ ID NO：7或SEQ ID NO：6的转录调节元件的核苷酸序列编码的多肽的至少1.5倍、至少2倍、至少2.5倍或至少3倍的水平表达。任选地，由因子IX核苷酸序列编码的多肽在人肝细胞中以由包含SEQ ID NO：12的因子IX核苷酸序列和SEQ ID NO：7的转录调节元件的核苷酸序列编码的多肽的至少1.5倍、至少2倍、至少2.5倍或至少3倍的水平表达。任选地，由因子IX核苷酸序列编码的多肽在人肝细胞中以由包含SEQ ID NO：18的因子IX核苷酸序列和SEQ ID NO：6的转录调节元件的核苷酸序列编码的多肽的至少1.5倍、至少2倍、至少2.5倍或至少3倍的水平表达。

在一个方面，本发明的多核苷酸、病毒颗粒或组合物用于以由包含SEQ ID NO：12的因子IX核苷酸序列和SEQ ID NO：7的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽，从而治疗疾病。在一个方面，本发明的多核苷酸、病毒颗粒或组合物用于通过以由包含SEQ ID NO：12的因子IX核苷酸序列和SEQ ID NO：7的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽来治疗疾病。在一个方面，提供了一种以由包含SEQ ID NO：12的因子IX核苷酸序列和SEQ ID NO：7的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽的方法，包括向患者施用本发明的多核苷酸、病毒颗粒或组合物。在一个方面，提供了一种通过以由包含SEQ ID NO：12的因子IX核苷酸序列和SEQ ID NO：7的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽来治疗疾病的方法，包括向患者施用本发明的多核苷酸、病毒颗粒或组合物。在一个方面，提供了本发明的多核苷酸、病毒颗粒或组合物用于以由包含SEQ ID NO：12的因子IX核苷酸序列和SEQ ID NO：7的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽的用途，从而治疗疾病。在一个方面，提供了用于通过以由包含SEQ ID NO：12的因子IX核苷酸序列和SEQ ID NO：7的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽来治疗疾病的用途。在一个实施方案中，表达由因子IX核苷酸序列编码的多肽包括向患者施用本发明的多核苷酸、病毒颗粒或组合物。

在一个方面，本发明的多核苷酸、病毒颗粒或组合物用于以由包含SEQ ID NO：18的因子IX核苷酸序列和SEQ ID NO：6的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽，从而治疗疾病。在一个方面，本发明的多核苷酸、病毒颗粒或组合物用于通过以由包含SEQ ID NO：18的因子IX核苷酸序列和SEQ ID NO：6的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽来治疗疾病。在一个方面，提供了一种以由包含SEQ ID NO：18的因子IX核苷酸序列和SEQ ID NO：6的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽的方法，包括将本发明的多核苷酸、病毒颗粒或组合物施用至患者。在一个方面，提供了一种通过以由包含SEQ ID NO：18的因子IX核苷酸序列和SEQ ID NO：6的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽来治疗疾病的方法，包括将本发明的多核苷酸、病毒颗粒或组合物施用至患者。在一个方面，提供了本发明的多核苷酸、病毒颗粒或组合物用于以由包含SEQ ID NO：18的因子IX核苷酸序列和SEQ ID NO：6的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽的用途，从而治疗疾病。在一个方面，提供了本发明的多核苷酸、病毒颗粒或组合物用于通过以由包含SEQ ID NO：18的因子IX核苷酸序列和SEQ ID NO：6的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽来治疗疾病的用途。在一个实施方案中，表达由因子IX核苷酸序列编码的多肽包括向患者施用本发明的多核苷酸、病毒颗粒或组合物。任选地，该疾病是血友病，例如B型血友病。

本领域技术人员可以通过用包含因子IX核苷酸序列的病毒颗粒转导宿主细胞，以及用包含参考序列的载体转导一些细胞，来确定因子IX核苷酸序列是否以比参考序列更高的水平表达。可以在适于表达由因子IX核苷酸序列编码的因子IX蛋白或其片段的条件下培养细胞，并且可以比较表达的因子IX蛋白的水平。可以使用诸如标题为“因子IX蛋白或其片段”的章节中描述的ELISA来评估表达的因子IX蛋白的水平。合适的宿主细胞包括培养的人肝细胞，例如Huh 7细胞。

如上文所讨论的，CpG(即CG二核苷酸)的存在可能降低表达效率。这是因为CpG可能被甲基化，并且它们的甲基化可能导致基因沉默，从而降低表达。因此，与参考野生型因子IX序列的相应部分相比，经密码子优化的编码序列的部分优选包含减少数量的CpG。在一个优选的实施方案中，经密码子优化的编码序列的部分包含少于40、少于20、少于10、少于5或少于1个CpG。优选地，经密码子优化的编码序列的部分不含CpG，即不包含(包含0个)CG二核苷酸。

在一个实施方案中，经密码子优化的编码序列的部分与SEQ ID NO：1的至少800、至少900、至少1100、少于1191、少于1100、少于1000、800至1191、900至1191或约1191个核苷酸的片段至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。在一个实施方案中，经密码子优化的编码序列的部分与SEQ ID NO：1至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。在一个实施方案中，经密码子优化的编码序列的部分与SEQ ID NO：1的900至1191个核苷酸的片段至少95％相同。在一个实施方案中，经密码子优化的编码序列的部分与SEQ ID NO：1至少95％或至少98％相同。

本发明提供了包含因子IX核苷酸序列的多核苷酸，其中所述因子IX核苷酸序列包含编码因子IX蛋白或其片段的编码序列，并且所述编码序列包含与SEQ ID NO：1至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列和与SEQ ID NO：15至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。任选地，与SEQ ID NO：1至少95％、至少98％、至少99％、至少99.5％或至少99.8％相同的序列是经密码子优化的。

未经密码子优化的编码序列的部分

在一个实施方案中，因子IX核苷酸序列包含未经密码子优化的部分。未经密码子优化的部分可以是连续的部分。包括未经密码子优化的部分可以改善编码序列的表达，因为未经密码子优化的部分可以与编码序列的其他部分例如内含子或内含子片段有益地相互作用。例如，因子IX核苷酸序列可以包含内含子或内含子片段，并且在这样的情况下，用野生型因子IX序列侧接内含子或内含子片段可以帮助确保正确的剪接。

与野生型序列相比，未经密码子优化的部分未被修饰以包括更多数量的偏好的密码子。例如，未经密码子优化的部分可以包括与野生型序列相似数量的偏好密码子。未经密码子优化的部分可包含少于50％的密码子TTC、CTG、ATC、GTG、GTC、AGC、CCC、ACC、GCC、TAC、CAC、CAG、AAC、AAA、AAG、GAC、TGC、AGG、GGC和GAG。任选地，未经密码子优化的部分包含少于50％、少于45％或少于40％的选自以下的密码子：TTC、CTG、ATC、GTG、GTC、AGC、CCC、ACC、GCC、TAC、CAC、CAG、AAC、AAA、AAG、GAC、TGC、AGG、GGC和GAG。

任选地，未经密码子优化的部分未经密码子优化以用于在人肝细胞中表达。在一个实施方案中，未经密码子优化的部分包含与SEQ ID NO：9的相应部分基本上相同数量的偏好密码子。例如，未经密码子优化的部分可以包含作为SEQ ID NO：9的相应部分的偏好密码子的数量的至少90％。

任选地，未经密码子优化的部分的长度为至少100、至少150、至少170、至少190、少于250、少于225、少于200或约195个核苷酸。

如下文更详细讨论的，因子IX核苷酸序列可包含内含子或内含子片段。在这样的情况下，内含子或内含子片段的侧翼可以是未经密码子优化的部分，即未经密码子优化的部分的一些可以与内含子或内含子片段的3'末端相邻，和未经密码子优化的部分的一些可以与内含子或内含子片段的5'末端相邻。内含子或内含子片段可以在外显子1和外显子2之间。在这样的情况下，包括未经密码子优化的部分是有利的，该部分包含外显子1的一部分和外显子2的一部分。

任选地，未经密码子优化的部分包含外显子1或外显子1的至少60、至少70、至少80、60至88、70至88或80至88个连续核苷酸的部分。外显子1包含野生型因子IX(例如SEQ IDNO：9的因子IX)的核苷酸1-88或非野生型因子IX核苷酸序列中的相应序列。外显子1的一部分可以编码信号肽区和前肽区。任选地，未经密码子优化的部分包含或不包含信号肽和/或前肽区。外显子1还可以在5'端包含29个核苷酸的附加非编码片段。如果因子IX核苷酸序列包含内含子或内含子片段，则优选的是，未经密码子优化的部分包括与内含子或内含子片段相邻的外显子1的一部分。例如，如果内含子或内含子片段在外显子1和外显子2之间，则优选的是，未经密码子优化的部分包含对应于SEQ ID NO：9的核苷酸80-88、70-88、60-88、40-88或20-88的外显子1的部分。

任选地，未经密码子优化的部分包括外显子2的至少50、至少75、至少80、至少90、至少100、少于140、少于120、50至140、75至120或约107个核苷酸的部分。例如，如果内含子或内含子片段位于外显子1和外显子2之间，则优选的是，未经密码子优化的部分包含对应于SEQ ID NO：9的核苷酸89-100、89-120、89-140、89-160、89-180或89-196的外显子2的一部分。

未经密码子优化的部分可包含CpG。例如，未经密码子优化的部分可包含与SEQ IDNO：9的相应部分相同数目的CpG。未经密码子优化的部分每100个核苷酸可包含至少1、至少1.5或至少2个CpG。未经密码子优化的部分可以包含至少1、至少2、至少3、1至5、2至5或约5个CpG。

未经密码子优化的部分可以与SEQ ID NO：15或SEQ ID NO：2的至少100、至少150、至少175、少于195、少于190或少于180的片段至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。未经密码子优化的部分可以与SEQ ID NO：15或SEQ ID NO：2至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。例如，未经密码子优化的部分可以与SEQ IDNO：15或SEQ ID NO：2至少98％相同。

未经密码子优化的部分可以是野生型的。SEQ ID NO：9是野生型因子IX核苷酸编码序列的实例。因此，未经密码子优化的部分可以与SEQ ID NO：9的相应部分至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。

因子IX核苷酸序列可包含内含子或内含子片段

因子IX核苷酸序列可包含中断编码序列的内含子或内含子片段。内含子是在表达过程中被切除的核苷酸序列，并且不构成编码序列的一部分。

基因组野生型因子IX核苷酸序列包含内含子，所述内含子中断因子IX编码序列。内含子的存在可以帮助保持野生型因子IX的高水平表达。因此，在本发明的因子IX核苷酸序列中包含内含子或内含子的至少一个片段可能是有利的。例如，因子IX核苷酸序列可以包含与野生型因子IX中的内含子1相对应的内含子或内含子片段。适当地，内含子是野生型因子IX的内含子1A的片段，例如SEQ ID NO：3。已经发现，截短内含子1的序列导致因子IX核苷酸序列的表达增加。认为内含子1的截短以形成内含子1A可以缺失内含子中的抑制子元件。内含子1序列的截短还导致因子IX核苷酸序列更短，这允许在基因治疗实施方案中将因子IX核苷酸序列更有效地包装到病毒递送系统中。

内含子片段可以少于500、少于400、少于350、少于300、至少100、至少200、至少250、至少290、100至500、200至400、250至350或约299个核苷酸。内含子片段可以与SEQ IDNO：3的至少100、至少200、至少250或至少290个核苷酸的片段至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。内含子或内含子片段可以与SEQ ID NO：3至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。例如，内含子或内含子片段可以与SEQ ID NO：3至少95％或至少98％相同。

优选地，内含子或内含子片段中断因子IX核苷酸序列中未经密码子优化的部分，即内含子在未经密码子优化的部分的5'和在未经密码子优化的部分的3'。如果紧接在内含子的3'和5'或靠近内含子的3'和5'区段的核苷酸是未经密码子优化的，则该内含子由未经密码子优化的序列“侧接”。“靠近内含子”是指在内含子的1、2、3、4、5、6、7、8、9或10个核苷酸以内。如上文所讨论的，用未经密码子优化的核苷酸序列侧接内含子或内含子片段可以帮助确保正确的剪接。任选地，内含子或内含子片段侧接未经密码子优化的至少60、至少70、至少80、至少90或至少100个核苷酸。例如，如果紧接在内含子的3'端的40个核苷酸和紧接在内含子的5'端的20个核苷酸是未经密码子优化的，或者如果紧接在内含子的3'端的30个核苷酸和紧接在内含子的5'端的30个核苷酸是未经密码子优化的，则该内含子侧接未经密码子优化的60个核苷酸。任选地，内含子或内含子片段在5'端侧接未经密码子优化的110至120个核苷酸(例如紧接在内含子的5'端)，和在3'端侧接未经密码子优化的100至110个核苷酸(例如紧接在内含子的3'端)。

内含子或内含子片段可以位于与因子IX核苷酸序列的外显子1和外显子2相对应的编码序列的部分之间。如果内含子或内含子片段对应于野生型因子IX中的内含子1的片段，则优选的是，内含子或内含子片段在对应于因子IX核苷酸序列的外显子1和外显子2的编码序列的部分之间。

多核苷酸还可以包含转录调节元件

多核苷酸可以包含转录调节元件。

在一个实施方案中，转录调节元件与SEQ ID NO：6至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。在一个实施方案中，多核苷酸包含与SEQ ID NO：6至少98％、至少99％、至少99.5％、至少99.8％或100％相同的转录调节元件。任选地，多核苷酸包含SEQ ID NO：6的转录调节元件。

可以使用任何适当的转录调节元件，例如HLP2、HLP1、LP1、HCR-hAAT、ApoE-hAAT和LSP，它们都是肝脏特异性的转录调节元件。在以下参考文献中更详细地描述了这些转录调节元件：HLP1:McIntosh J.等人,Blood 2013Apr 25,121(17):3335-44；LP1:Nathwani等人,Blood.2006April1,107(7):2653–2661；HCR-hAAT:Miao等人,Mol Ther.2000；1:522-532；ApoE-hAAT:Okuyama等人,Human Gene Therapy,7,637-645(1996)；和LSP:Wang等人,Proc Natl Acad Sci U S A.1999March 30,96(7):3906–3910。HLP2转录调节元件具有SEQID NO：6的序列。

转录调节元件可包含启动子和/或增强子，例如来自HLP2、HLP1、LP1、HCR-hAAT、ApoE-hAAT和LSP的启动子元件和/或增强子元件。这些转录调节元件中的每一个都包含启动子、增强子和任选地其他核苷酸。

在一个实施方案中，转录调节元件包含增强子，其是人载脂蛋白E(ApoE)肝基因座控制区(HCR；Miao等人(2000),Molecular Therapy1(6):522)或其片段。在一个实施方案中，转录调节元件包含HCR增强子的片段，该片段是长度为至少80、至少90、至少100、少于192、80至192、90至192、100至250或117至192个核苷酸的片段。任选地，HCR增强子的片段的长度为100至250个核苷酸。

合适的HCR增强子片段描述于SEQ ID NO：13中。任选地，转录调节元件包含长度为至少80、至少90、至少100、少于192、80至192、90至192、100至250、117至192个核苷酸的增强子，并且该增强子包含与SEQ ID NO：13至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的多核苷酸序列。任选地，转录调节元件包含长度为117至192个核苷酸的增强子，并且该增强子包含与SEQ ID NO：13至少98％、至少99％、至少99.5％、至少99.8％或100％相同的多核苷酸序列。

任选地，转录调节元件包含与SEQ ID NO：13的至少90、至少100或至少110个核苷酸的片段至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的增强子。任选地，多核苷酸包含与SEQ ID NO：13至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的增强子。任选地，多核苷酸包含与SEQ ID NO：13至少98％、至少99％、至少99.5％、至少99.8％或100％相同的增强子。任选地，多核苷酸包含SEQ ID NO：13的增强子。

在一个实施方案中，转录调节元件包含启动子，其是人α-1抗胰蛋白酶启动子(A1AT；Miao等人(2000),Molecular Therapy1(6):522)或其片段。任选地，A1AT启动子的片段的长度是至少100、至少120、至少150、至少180、少于255、100至255、150至225、150至300、180至255个核苷酸。任选地，A1AT启动子的片段的长度为150至300个核苷酸。

合适的A1AT启动子片段在SEQ ID NO：14中描述。任选地，转录调节元件包含长度为至少100、至少120、至少150、至少180、少于255、100至255、150 300或180 255个核苷酸的启动子，并且该启动子包含与SEQ ID NO：14至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的多核苷酸序列。任选地，转录调节元件包含长度为180至255个核苷酸的启动子，并且该启动子包含与SEQ ID NO：14至少98％、至少99％、至少99.5％、至少99.8％或100％相同的多核苷酸序列。任选地，多核苷酸包含与SEQ ID NO：14的至少100、至少120或至少150个核苷酸的片段至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的启动子。任选地，多核苷酸包含与SEQ ID NO：14至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的启动子。任选地，多核苷酸包含与SEQ ID NO：14至少98％、至少99％、至少99.5％、至少99.8％或100％相同的启动子。任选地，多核苷酸包含SEQ ID NO：14的启动子。

如果多核苷酸打算在肝脏中表达，则启动子可以是肝脏特异性启动子。任选地，启动子是人肝脏特异性启动子。一般而言，“肝脏特异性启动子”是在肝细胞中提供更高水平表达的启动子。例如，本领域技术人员可以通过比较肝细胞(例如Huh 7细胞)中多核苷酸的表达与来自其他组织的细胞中多核苷酸的表达来确定启动子是否是肝脏特异性启动子。如果与来自其他组织的细胞相比，肝细胞中的表达水平更高，则该启动子是肝脏特异性启动子。

功能获得突变

因子IX蛋白或其片段可包含功能获得突变。功能获得突变是增加因子IX蛋白或其片段的活性的突变。例如，功能获得突变可以产生具有与野生型因子IX(例如由SEQ ID NO：9或SEQ ID NO：19编码的因子IX)相比至少1.5倍、至少2倍、至少2.5倍、至少3倍、至少4倍、至少5倍、至少6倍、至少6.5倍、至少7倍、至少7.5倍或至少8倍或更高活性的因子IX蛋白或其片段。

因子IX蛋白或其片段可在对应于野生型因子IX的位置384(对应于SEQ ID NO：9的密码子384或由SEQ ID NO：9编码的未成熟多肽的氨基酸384)的位置处包含突变。在对应于野生型因子IX的位置384的位置处的突变可以是功能获得突变。例如，用亮氨酸取代精氨酸384可以导致活性的显著增加。

因子IX蛋白是否在对应于因子IX中的位置384的位置处包含突变，可以通过使用合适的算法(例如上文所述的Needleman和Wunsch的算法)将因子IX蛋白与SEQ ID NO：16进行比对，并确定与氨基酸384(其为SEQ ID NO：16中的亮氨酸)对齐的氨基酸是否为精氨酸残基来确定。如果与SEQ ID NO：16的氨基酸384对齐的氨基酸不是精氨酸残基，则因子IX蛋白在对应于野生型因子IX的位置384的位置处具有突变。

可以通过比较包含突变的因子IX蛋白的活性与除了假定的功能获得突变之外相同的参考因子IX蛋白的活性来确定突变是否是功能获得突变。这两种蛋白质的相对活性可以使用生色测定法(例如在“因子IX蛋白质或其片段”标题下讨论的那些)来确定。如果包含突变的因子IX蛋白的活性高于参考蛋白的活性，则该突变是功能获得突变。

因此，因子IX核苷酸序列可以包含在对应于因子IX中的位置384的位置处编码突变的密码子。例如，因子IX核苷酸序列可包含在对应于野生型因子IX的位置384的位置处编码氨基酸的密码子，该氨基酸是小的疏水性氨基酸。小的疏水性氨基酸可以是丙氨酸、亮氨酸、异亮氨酸、甘氨酸或缬氨酸。例如，小的疏水性氨基酸可以是丙氨酸或亮氨酸。优选地，小的疏水性氨基酸是亮氨酸。

在对应于野生型因子IX的位置384的位置处编码突变的密码子可以是编码亮氨酸的密码子例如CTX，其中X是任何核苷酸。优选地，X是C或G。在对应于野生型因子IX的位置384的位置处编码氨基酸的密码子可以是CTC，例如在SEQ ID NO：4中。在替代实施方案中，在对应于野生型因子IX的位置384的位置处编码氨基酸的密码子是TTG或CTG，例如在SEQID NO：11或SEQ ID NO：26中。例如，本文中对SEQ ID NO：1的引用可以由对SEQ ID NO：26或11的相应部分的引用取代。换句话说，SEQ ID NO：1可以在核苷酸957(C)处用G取代，或在核苷酸955(C)和957(C)处分别用T和G取代。

多核苷酸可包含与SEQ ID NO：5的至少1200、至少1350或至少1650个核苷酸的片段至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的因子IX序列。例如，因子IX核苷酸序列可以与SEQ ID NO：5至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。

适当地，

(i)因子IX核苷酸序列包含与SEQ ID NO：1至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列；和(ii)因子IX核苷酸序列包含在对应于野生型因子IX的位置384的位置处编码氨基酸的密码子，其中在对应于野生型因子IX的位置384的位置处编码氨基酸的密码子编码亮氨酸。

适当地，

(i)因子IX核苷酸序列包含与SEQ ID NO：1至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的编码序列；

(ii)因子IX核苷酸序列包含在对应于野生型因子IX的位置384的位置处编码氨基酸的密码子，其中在对应于野生型因子IX的位置384的位置处编码氨基酸的密码子编码亮氨酸；和

(iii)多核苷酸包含与SEQ ID NO：13至少98％、至少99％、至少99.5％、至少99.8％或100％相同的增强子元件。

适当地，

(iii)多核苷酸包含与SEQ ID NO：14至少98％、至少99％、至少99.5％、至少99.8％或100％相同的启动子元件。

适当地，

(i)因子IX核苷酸序列包含与SEQ ID NO：1至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列；

(iii)多核苷酸包含与SEQ ID NO：6至少98％、至少99％、至少99.5％、至少99.8％或100％相同的转录调节元件。

适当地，

(ii)因子IX核苷酸序列包含与SEQ ID NO：2至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列；和

(iii)因子IX核苷酸序列包含在对应于野生型因子IX的位置384的位置处编码氨基酸的密码子，其中在对应于野生型因子IX的位置384的位置处编码氨基酸的密码子编码亮氨酸。

适当地，因子IX核苷酸序列包含内含子或内含子片段，并且内含子片段与SEQ IDNO：3至少98％、至少99％、至少99.5％、至少99.8％或100％相同。

包含多核苷酸的病毒颗粒

本发明还提供了包含重组基因组的病毒颗粒，所述重组基因组包含本发明的多核苷酸。为了本发明的目的，术语“病毒颗粒”是指病毒体的全部或部分。例如，病毒颗粒包含重组基因组，并且还可以包含衣壳。病毒颗粒可以是基因治疗载体。在本文中，术语“病毒颗粒”和“载体”可互换使用。为了本申请的目的，“基因治疗”载体是可用于基因治疗的病毒颗粒，即包含在施用后在宿主细胞中表达转基因(例如因子IX核苷酸序列)所需的所有功能元件的病毒颗粒。

合适的病毒颗粒包括细小病毒、逆转录病毒、慢病毒或单纯疱疹病毒。细小病毒可以是腺相关病毒(AAV)。病毒颗粒优选是重组腺相关病毒(AAV)载体或慢病毒载体。更优选地，病毒颗粒是AAV病毒颗粒。术语AAV和rAAV在本文可互换使用。

所有已知的AAV血清型的基因组组织非常相似。AAV的基因组是线性的单链DNA分子，其长度少于约5,000个核苷酸。反向末端重复序列(ITR)位于非结构复制(Rep)蛋白和结构(VP)蛋白的独特编码核苷酸序列的侧翼。VP蛋白(VP1、VP2和VP3)形成衣壳。末端145nt是自互补的并且被组织成使得可以形成T形发夹的能量稳定的分子内双链体得以形成。这些发夹结构用作病毒DNA复制的起点，用作细胞DNA聚合酶复合物的引物。在哺乳动物细胞中野生型(wt)AAV感染后，分别从P5启动子和P19启动子表达Rep基因(即编码Rep78和Rep52蛋白)，并且两种Rep蛋白在病毒基因组的复制中均具有功能。Rep ORF中的剪接事件导致实际上四种Rep蛋白(即Rep78、Rep68、Rep52和Rep40)的表达。然而，已经显示，哺乳动物细胞中编码Rep78和Rep52蛋白的未剪接的mRNA足以用于产生AAV载体。在昆虫细胞中，Rep78和Rep52蛋白也足以用于产生AAV载体。

本发明的重组病毒基因组可以包含ITR。本发明的AAV载体仅使用一个ITR发挥作用是可能的。因此，病毒基因组包含至少一个ITR，但更通常地，包含两个ITR(通常在病毒基因组的任一端，即一个在5'端和一个在3'端)。在多核苷酸和ITR的一个或多个之间可能存在插入序列。可将本发明的多核苷酸掺入位于两个规则的ITR之间或位于用两个D区改造的ITR的任一侧的病毒颗粒中。

可在本发明中用于产生AAV载体的AAV序列可以衍生自任何AAV血清型的基因组。通常，AAV血清型在氨基酸和核酸水平上具有显著同源性的基因组序列，提供遗传功能的相同集合，产生基本上在物理和功能上等同的病毒体，并通过实际上相同的机制复制和组装。对于各种AAV血清型的基因组序列和基因组相似性的概述，参见例如GenBank登录号U89790；GenBank登录号J01901；GenBank登录号AF043303；GenBank登录号AF085716；Chiorini等人,1997；Srivastava等人,1983；Chiorini等人,1999；Rutledge等人,1998；和Wu等人,2000。AAV血清型1、2、3、3B、4、5、6、7、8、9、10、11或12可用于本发明。当用于产生基因治疗载体时，来自AAV血清型的序列可以被突变或工程化。

任选地，AAV载体包含衍生自AAV1、AAV2、AAV4和/或AAV6的ITR序列。优选地，ITR序列是AAV2 ITR序列。在本文中，术语AAVx/y是指包含来自AAVx(其中x是AAV血清型的编号)的一些组分和来自AAVy(其中y是相同或不同血清型的编号)的一些组分的病毒颗粒。例如，AAV2/8载体可以包含病毒基因组的一部分，包括来自AAV2株的ITR，和来自AAV8株的衣壳。

在一个实施方案中，病毒颗粒是包含衣壳的AAV病毒颗粒。AAV衣壳通常由三种蛋白VP1、VP2和VP3形成。VP1的氨基酸序列包括VP2的序列。VP1的不形成VP2的一部分的部分被称为VP1unique或VP1U。VP2的氨基酸序列包括VP3的序列。VP2的不形成VP3的一部分的部分被称为VP2unique或VP2U。优选地，衣壳是AAV5衣壳或Mut C衣壳。Mut C衣壳可以与SEQID NO：10具有至少96％、至少98％、至少99％、至少99.5％、至少99.8％或100％的同一性。AAV衣壳可以与SEQ ID NO：17具有至少96％、至少98％、至少99％，99.5％、至少99.8％或100％的同一性。在替代实施方案中，衣壳具有SEQ ID NO：17的VP2U和/或VP3和与SEQ IDNO：20、SEQ ID NO：21、SEQ ID NO：22、SEQ ID NO：23、SEQ ID NO：24或SEQ ID NO：25具有至少96％、至少98％、至少99％、至少99.5％、至少99.8％或100％的同一性的VP1U。

本发明的病毒颗粒可以是“杂合”颗粒，其中病毒ITR和病毒衣壳来自不同的细小病毒，例如不同的AAV血清型。优选地，病毒ITR和衣壳来自AAV的不同血清型，在这样的情况下，这样的病毒颗粒被称为跨衣壳的或假型的。类似地，细小病毒可具有“嵌合”衣壳(例如，包含来自不同细小病毒(优选不同AAV血清型)的序列)或“靶向”衣壳(例如，定向嗜性)。

在一些实施方案中，重组AAV基因组包含完整的ITR，其包含功能性末端分辨位点(TRS)。这样的AAV基因组可以包含一个或两个可分辨的ITR，即包含功能性TRS的ITR，在其上可发生位点特异性切刻以生成游离的3'羟基，其可用作DNA聚合酶解旋和复制ITR的底物。优选地，重组基因组是单链的(即，它以单链形式包装到病毒颗粒中)。任选地，重组基因组不以自身互补的构型包装，即，基因组不包含具有在病毒颗粒中退火的基本上自身互补部分的单个共价连接的多核苷酸链。替代地，重组基因组可以以“单体双链体”形式包装。WO2011/122950中描述了“单体双链体”。基因组可以包装为在病毒颗粒中退火的两个基本上互补但非共价连接的多核苷酸。

病毒颗粒还可以包含多聚A序列。多聚A序列可以位于编码功能性因子IX蛋白的核苷酸序列的下游。多聚A序列可以是牛生长激素多聚A序列(bGHpA)。多聚A序列的长度可以为250至270个核苷酸。

本发明的病毒颗粒任选地在宿主细胞中高表达。例如，在Huh7细胞中转导后，病毒颗粒表达具有比由包含SEQ ID NO：12的因子IX核苷酸序列和SEQ ID NO：7的转录调节元件的病毒颗粒和/或包含SEQ ID NO：18的因子IX核苷酸序列和SEQ ID NO：6的转录调节元件的病毒颗粒表达的因子IX蛋白的活性更高的因子IX活性的因子IX蛋白或其片段。

任选地，在转导到Huh7细胞群体中之后，病毒颗粒表达具有比由转导到可比较的Huh7细胞群体中的包含SEQ ID NO：12的因子IX核苷酸序列和SEQ ID NO：7的转录调节元件的可比较的病毒颗粒表达的因子IX的活性更高的因子IX活性的因子IX蛋白或其片段。任选地，在转导到Huh7细胞群体中之后，病毒颗粒表达具有比由转导到可比较的Huh7细胞群体中的包含SEQ ID NO：18的因子IX核苷酸序列和SEQ ID NO：6的转录调节元件的可比较的病毒颗粒表达的因子IX的活性更高的因子IX活性的因子IX蛋白或其片段。

一方面，本发明的多核苷酸、病毒颗粒或组合物用于通过表达具有比由包含SEQID NO：12的因子IX核苷酸序列和SEQ ID NO：7的转录调节元件的病毒颗粒和/或包含SEQID NO：18的因子IX核苷酸序列和SEQ ID NO：6的转录调节元件的病毒颗粒表达的因子IX的活性更高的因子IX活性的因子IX蛋白或其片段来治疗疾病。在一个方面，提供了一种通过表达具有比由包含SEQ ID NO：12的因子IX核苷酸序列和SEQ ID NO：7的转录调节元件的病毒颗粒和/或包含SEQ ID NO：18的因子IX核苷酸序列和SEQ ID NO：6的转录调节元件的病毒颗粒表达的因子IX的活性更高的因子IX活性的因子IX蛋白或其片段来治疗疾病的方法，包括向患者施用有效量的本发明的多核苷酸、病毒颗粒或组合物。在一个方面，提供了本发明的多核苷酸、病毒颗粒或组合物用于通过表达具有比由包含SEQ ID NO：12的因子IX核苷酸序列和SEQ ID NO：7的转录调节元件的病毒颗粒和/或包含SEQ ID NO：18的因子IX核苷酸序列和SEQ ID NO：6的转录调节元件的病毒颗粒表达的因子IX的活性更高的因子IX活性的因子IX蛋白或其片段来治疗疾病的用途。任选地，包含SEQ ID NO：12的因子IX核苷酸序列和SEQ ID NO：7的转录调节元件的病毒颗粒和/或包含SEQ ID NO：18的因子IX核苷酸序列和SEQ ID NO：6的转录调节元件的病毒颗粒是可比较的病毒颗粒。任选地，表达因子IX蛋白或其片段包括向患者施用本发明的多核苷酸、病毒颗粒或组合物。任选地，疾病是血友病，例如B型血友病。

在这样的实施方案中，术语“可比较的病毒颗粒”是指与本发明的AAV病毒颗粒相同的病毒颗粒，除了可比较的病毒颗粒包含不同的因子IX核苷酸序列和不同的转录调节元件(SEQ ID NO：12和SEQ ID NO：7或SEQ ID NO：18和SEQ ID NO：6)。任选地，使用生色测定法例如上述的生色测定法评估活性。但是，在这样的情况下，该活性未针对因子IX浓度进行标准化，因此该活性是表达水平以及因子IX蛋白的固有活性的函数。

组合物、方法和用途

在本发明的另一方面，提供了一种组合物，其包含本发明的多核苷酸或载体/病毒颗粒和药学上可接受的赋形剂。

药学上可接受的赋形剂可以包含载体、稀释剂和/或其他药物、药剂或佐剂等。任选地，药学上可接受的赋形剂包括盐溶液。任选地，药学上可接受的赋形剂包括人血清白蛋白。

本发明还提供了用于治疗方法的本发明的多核苷酸、载体/病毒颗粒或组合物。任选地，治疗方法包括向患者施用有效量的本发明的多核苷酸或载体/病毒颗粒。

本发明还提供了一种治疗方法，该方法包括向患者施用有效量的本发明的多核苷酸或载体/病毒颗粒。

本发明还提供了本发明的多核苷酸、载体/病毒颗粒或组合物在制备用于治疗方法的药物中的用途。任选地，治疗方法包括向患者施用有效量的本发明的多核苷酸或载体/病毒颗粒。任选地，治疗方法是基因疗法。“基因疗法”涉及施用本发明的载体/病毒颗粒，其能够在施用其的宿主中表达转基因(例如因子IX核苷酸序列)。

任选地，治疗方法是治疗凝血病诸如血友病(例如，A或B型血友病)或VanWillebrands病的方法。优选地，凝血病的特征在于增加的出血和/或减少的凝血。任选地，治疗方法是治疗血友病例如B型血友病的方法。在一些实施方案中，患者是患有B型血友病的患者。任选地，患者具有针对因子IX的抗体或抑制剂。任选地，多核苷酸和/或载体/病毒颗粒是静脉内施用的。任选地，多核苷酸和/或载体/病毒颗粒用于仅施用至患者一次(即单剂量)。

当在上文所述的方法中“治疗”B型血友病时，这意味着血友病的一种或多种症状得到改善。这并不意味着血友病的症状得到完全治疗，从而使血友病症状不再存在于患者中，尽管在某些方法中可能是这样的情况。治疗方法可能导致B型血友病的一种或多种症状不如治疗前严重。任选地，相对于预先施用的情况，该治疗方法导致患者血液中循环因子IX的量/浓度和/或给定体积的患者血液内可检测到的因子IX活性的总体水平和/或患者血液中因子IX的比活性(活性/因子IX蛋白质的量)的增加。

“治疗有效量”是指在所需的剂量和时间段内有效实现所需治疗结果(例如提高受试者中功能性因子IX的水平(以导致功能性因子IX以足以缓解B型血友病的症状的水平的产生))的量。

任选地，以少于1×10¹¹、少于1×10¹²、少于5×10¹²、少于2×10¹²、少于1.5×10¹²、少于3×10¹²、少于1×10¹³，少于2×10¹³或少于3×10¹³的载体基因组/千克患者体重的剂量施用载体/病毒颗粒。任选地，以至少4.5×10¹¹或4.5×10¹¹至1×10¹²的载体基因组/千克患者体重(vg/kg)的剂量施用多核苷酸、病毒颗粒或组合物。任选地，以少于5×10¹¹vg/kg的剂量施用多核苷酸、病毒颗粒或组合物。任选地，以4.5×10¹¹vg/kg至5×10¹¹vg/kg或4.5×10¹¹vg/kg至4.9×10¹¹vg/kg的剂量施用多核苷酸、病毒颗粒或组合物。任选地，所施用的多核苷酸或病毒颗粒是由哺乳动物细胞产生的，和/或具有由于使用哺乳动物病毒载体生产细胞而产生的特征，并与昆虫病毒载体生产细胞(例如杆状病毒系统)中产生的载体区分开。

任选地，使用定量PCR滴定载体基因组实现给定剂量的载体/病毒颗粒(在载体基因组的数量方面定量的)的施用。原则上，可以将qPCR引物设计为结合对于野生型基因组不常见的重组载体基因组的任何部分，但是建议不使用非常靠近ITR的引物模板序列，因为这样做可导致夸大的载体基因组滴度测量。任选地，利用针对启动子区域例如转基因盒(有时也称为转基因表达盒)的启动子区域的引物，通过定量聚合酶链反应(qPCR)对载体基因组进行定量。

进行qPCR的方法是本领域技术人员已知的。使用实时PCR循环仪和SYBR Green(ThermoFisher Scientific)等DNA结合染料，可以实时检测新生双链扩增子的扩增。然后可以将已知数量的qPCR模板遗传物质(例如启动子区域)进行连续稀释以创建标准曲线，并从标准曲线内插样品载体基因组滴度。

任选地，选择所施用的载体/病毒颗粒的剂量，使得受试者以非血友病健康受试者的因子IX活性的10％-90％、20％-80％、30％-70％、25％-50％、20％-150％、30％-140％、40％-130％、50％-120％、60％-110％或70％-100％的活性表达因子IX。任选地，以在患有B型血友病的患者中有效实现至少20％的稳定的因子IX活性水平的剂量施用多核苷酸、病毒颗粒或组合物。任选地，以在患有B型血友病的患者中有效实现至少25％的稳定的因子IX活性水平的剂量施用多核苷酸、病毒颗粒或组合物。任选地，以在患有B型血友病的患者中有效实现至少30％的稳定的因子IX活性水平的剂量施用多核苷酸、病毒颗粒或组合物。任选地，以在患有B型血友病的患者中有效实现至少35％的稳定的因子IX活性水平的剂量施用多核苷酸、病毒颗粒或组合物。任选地，以在患有B型血友病的患者中有效实现至少或约40％的稳定的因子IX活性水平的剂量施用多核苷酸、病毒颗粒或组合物。

在一个方面，本发明的多核苷酸、病毒颗粒或组合物用于在患有B型血友病的患者中实现至少20％的稳定的因子IX活性水平。在一个方面，提供了一种在患有B型血友病的患者中实现至少20％的稳定的因子IX活性水平的方法，包括将有效量的本发明的多核苷酸、病毒颗粒或组合物施用至患者。在另一方面，提供了本发明的多核苷酸、病毒颗粒或组合物用于在患有B型血友病的患者中获得至少20％的稳定的因子IX活性水平的用途。在另一方面，提供了用于治疗B型血友病的本发明的多核苷酸、病毒颗粒或组合物，包括以在患者中有效实现至少20％的稳定的因子IX活性水平的剂量向患者施用多核苷酸、病毒颗粒或组合物。在另一方面，提供了一种治疗B型血友病的方法，包括以在患者中有效实现至少20％的稳定的因子IX活性水平的剂量向患者施用多核苷酸、病毒颗粒或组合物。在另一方面，提供了本发明的多核苷酸、病毒颗粒或组合物在治疗B型血友病中的用途，包括以在患者中有效实现至少20％的稳定的因子IX活性水平的剂量向患者施用多核苷酸、病毒颗粒或组合物。任选地，治疗B型血友病或实现稳定的因子IX的活性水平包括向患者施用本发明的多核苷酸、病毒颗粒或组合物。任选地，为了实现稳定的因子IX活性水平，例如至少20％、至少30％或至少40％的稳定的因子IX活性水平，以少于5×10¹¹vg/kg或4.5×10¹¹vg/kg至4.9×10¹¹vg/kg的剂量施用多核苷酸、病毒颗粒或组合物。任选地，所施用的多核苷酸或病毒颗粒是由哺乳动物细胞产生的和/或具有因使用哺乳动物病毒载体生产细胞而产生的特征，并与昆虫病毒载体生产细胞(例如杆状病毒系统)中产生的载体区分开。

至少X％(例如至少20％)的因子IX活性水平是指正常因子IX水平范围的至少X％(例如20％)的因子IX活性水平。本领域技术人员将容易理解提及正常因子IX活性水平的百分比(其是在常规临床实践中参考国际标准确定的)的含义。合并的正常(健康)人血浆具有约5μg/ml的因子IX浓度。

术语“稳定的因子IX活性水平”是指在至少5周的连续时间内保持在或高于一定水平的因子IX活性水平。在一些实施方案中，因子IX活性水平在至少10、至少15、至少20、至少30、至少40或至少50周的连续时间内保持在或高于某一水平。例如，如果活性水平在至少5周的连续时间内保持在至少20％，则患者具有至少20％的稳定的因子IX活动水平。在这样的例子中，因子IX活性水平在至少5周后可以继续为至少20％，因此在至少10、至少15、至少20、至少30或至少40或至少50周的累积连续期间内保持至少20％。任选地，如果因子IX活性水平在至少20周的连续时间内保持在或高于某一水平，则患者具有稳定的因子IX活性水平。任选地，用多核苷酸、病毒颗粒或组合物施用的患者可以具有至少20％、至少25％、至少30％或至少35％的稳定的因子IX活性水平。任选地，用多核苷酸、病毒颗粒或组合物施用的患者可以具有至少或约40％的稳定的因子IX活性水平。

任选地，从多核苷酸、病毒颗粒或组合物施用的至少10周、至少15周、至少20周、至少30周、至少40周或至少50周后，因子IX活性水平是稳定的。例如，当从用多核苷酸、病毒颗粒或组合物施用至患者的至少10周后，患者具有至少20％的稳定的因子IX活性水平时，则存在在开始施用至少10周后连续至少5周、至少10周、至少15周、至少20周、至少30周或至少40周或至少50周的持续时间内保持至少20％的至少20％的因子IX活性水平。任选地，患者在从多核苷酸、病毒颗粒或组合物施用的至少10周后具有稳定的因子IX活性水平，并且因子IX活性水平在至少20周或至少40周(在从施用的最初至少10周后)的连续时间内保持在或高于一定水平。任选地，施用的至少10周、至少15周、至少20周、至少30周或至少40周后，稳定的因子IX活性水平可以为至少20％、至少25％、至少30％或至少35％。任选地，施用的至少10周、至少15周、至少20周、至少30周或至少40周后，稳定的因子IX活性水平可以为至少或约40％。在一些实施方案中，在多核苷酸、病毒颗粒或组合物的施用的至少10周后患者具有至少20％的稳定的因子IX活性水平，并且因子IX活性水平在至少20周或至少40周(在从施用的最初至少10周后)的连续时间内保持在至少20％。在一些实施方案中，在多核苷酸、病毒颗粒或组合物的施用的至少10周后患者具有至少40％的稳定的因子IX活性水平，并且因子IX活性水平在至少20周或至少40周(在从施用的最初至少10周后)的连续时间内保持在至少40％。

任选地，在多核苷酸、病毒颗粒或组合物的施用后至少10、至少20、至少30、至少40或至少50周的时间点，因子IX活性水平在或高于某个水平(例如20％，25％，30％，35％或40％)。例如，在多核苷酸、病毒颗粒或组合物的施用后约10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51或52周的时间点，因子IX的活性水平在或高于某个水平(例如20％、25％、30％、35％或40％)。任选地，在施用多核苷酸、病毒颗粒或组合物后约10周的时间点，因子IX活性水平为至少20％。任选地，在施用多核苷酸、病毒颗粒或组合物后约10周的时间点，因子IX活性水平为至少25％。任选地，在施用多核苷酸、病毒颗粒或组合物后约10周的时间点，因子IX活性水平为至少40％。任选地，在施用多核苷酸、病毒颗粒或组合物后约20周的时间点，因子IX活性水平为至少20％。任选地，在施用多核苷酸、病毒颗粒或组合物后约20周的时间点，因子IX活性水平为至少25％。任选地，在施用多核苷酸、病毒颗粒或组合物后约20周的时间点，因子IX活性水平为至少或约40％。任选地，在施用多核苷酸、病毒颗粒或组合物后约52周的时间点，因子IX活性水平为至少20％。任选地，在施用多核苷酸、病毒颗粒或组合物后约52周的时间点，因子IX活性水平为至少25％。任选地，在施用多核苷酸、病毒颗粒或组合物后约52周的时间点，因子IX活性水平为至少或约40％。

当因子IX活性水平在施用多核苷酸、病毒颗粒或组合物后至少10、至少20、至少30、至少40或至少50周的时间点在或高于某个水平(例如20％、25％、30％、35％或40％)时，因子IX活性水平也可以是稳定的。在其中因子IX活性水平也是稳定的此类实施方案中，至少5周(或至少10、至少15、至少20、至少30或至少40或至少50周)的连续时间可以紧接在多核苷酸、病毒颗粒或组合物的施用后至少10、至少20、至少30、至少40或至少50周的时间点之前、包含在其中或紧接在之后。任选地，在施用多核苷酸、病毒颗粒或组合物后约10周的时间点，因子IX活性水平为至少20％，并且因子IX活性水平在紧接该时间点之后的至少40周的连续时间内保持至少20％。任选地，在施用多核苷酸、病毒颗粒或组合物后约10周的时间点，因子IX活性水平为至少25％，并且因子IX活性水平在紧接该时间点之后的至少40周的连续时间内保持至少25％。任选地，在施用多核苷酸、病毒颗粒或组合物后约10周的时间点，因子IX活性水平为至少40％，并且因子IX活性水平在紧接该时间点之后的至少40周的连续时间内保持至少40％。任选地，在施用多核苷酸、病毒颗粒或组合物后约52周的时间点，因子IX活性水平为至少20％，并且因子IX活性水平在紧接该时间点之后的至少40周的连续时间内保持至少20％。任选地，在施用多核苷酸、病毒颗粒或组合物后约52周的时间点，因子IX活性水平为至少25％，并且因子IX活性水平在紧接该时间点之后的至少40周的连续时间内保持至少25％。任选地，在施用多核苷酸、病毒颗粒或组合物后约52周的时间点，因子IX活性水平为至少40％，并且因子IX活性水平在紧接该时间点之后的至少40周的连续时间内保持至少40％。

在诸如人患者的患者中，因子IX活性可以通过从患者采集血液样品或通过对从患者采集的血液样品执行测定法来进行测量。

任选地，可以使用凝血测定法来测量因子IX活性水平。任选地，凝血结测定法是一阶段凝血测定法。任选地，凝血测定法(例如一阶段凝血分析)使用SynthASil^TM试剂盒。在一个实例中，合适的凝血测定法(一阶段凝血测定法)如下文所述。

由于因子IX是凝血级联的一部分，因此具有增强的活性的因子IX多肽将比具有较低活性的因子IX多肽更快地催化血液凝结。将因子IX多肽与贫血小板血浆混合，并在37℃下孵育。然后添加磷脂和接触活化途径活化剂，例如SynthASil^TM APTT(活化的部分促凝血酶原激酶时间)试剂。然后添加钙，并且用户测量发生凝结所花费的时间。凝结形成可以使用分光光度法或电磁钢球法进行评估。例如，当混合物的光密度超过一定阈值或当混合物已经充分凝结以改变磁球的运动(这由传感器检测)时，可以认为已经发生凝结形成。

任选地，使用SynthASil^TM一阶段凝血测定试剂盒测量因子IX活性，以确定血液样品中的因子IX活性。

任选地，患者是使用具有比由包含(i)SEQ ID NO：4或5的因子IX核苷酸序列和(ii)SEQ ID NO：6的转录调节元件的病毒颗粒表达的因子IX的活性更低的活性的因子IX难治的患者。任选地，患者是使用以比由包含(i)SEQ ID NO：4或5的因子IX核苷酸序列和(ii)SEQ ID NO：6的转录调节元件的核苷酸序列编码的水平更低的水平表达的因子IX多肽难治的患者。如实施例中所示，包含(i)SEQ ID NO：4或5的因子IX核苷酸序列和(ii)SEQ ID NO：6的转录调节元件的病毒颗粒以更高的水平表达因子IX多肽，并且与从其他因子IX核苷酸序列表达的多肽相比，所述多肽具有更高的活性。因此，包含(i)SEQ ID NO：4或5的因子IX核苷酸序列和(ii)SEQ ID NO：6的转录调节元件的病毒颗粒可用于治疗需要较高水平的因子IX、较低剂量的病毒颗粒或难以从包含替代因子IX核苷酸序列的病毒颗粒表达因子IX的患者，例如失去部分肝脏因此从肝细胞表达高水平的因子IX核苷酸序列的能力较弱的患者。

任选地，该方法或用途包括类固醇的预防性共同施用，即向患者施用适当剂量的类固醇。共同施用可以是伴随的，即患者在接受一定剂量的本发明的多核苷酸、载体或组合物的同时接受一定剂量的类固醇。或者，可在将本发明的多核苷酸、载体或组合物施用至患者之前或之后施用类固醇。任选地，在向患者施用本发明的多核苷酸、载体或组合物后6至12周施用类固醇。

任选地，类固醇选自泼尼松、贝他米松、泼尼松龙、曲安西龙、甲基泼尼松龙和地塞米松。任选地，类固醇是泼尼松龙。

序列表

表3

实施例

在以下实施例中，用携带FIX转基因盒ssLP1、FIXco(本文的FIXco)、ssHLP2.TI-codop-FIX-GoF(本文的HTFG)和ssHLP2.TI-ACNP-FIX-GoF(本文的HTAG)的重组AAV进行实验。SsHLP2.TI-codop-FIX-GoF是WO2016/075473中公开的ssHLP2.TI-codop-FIX构建体的被修改为在编码的FIX多肽的位置384处编码亮氨酸(L)而不是精氨酸(R)的形式。这些盒在图1中示出。ssLP1.FIXco包含经完全密码子优化的FIX编码序列(SEQ ID NO：12)，其5'之前是SV40内含子，其表达由LP1启动子(SEQ ID NO：7)驱动。ssHLP2.TI-codop-FIX-GoF和ssHLP2.TI-ACNP-FIX-GoF共有在FIX编码序列的5'具有较短的HLP2转录调节元件(SEQ IDNO：6)的结构，该编码序列被天然内含子1A的截短形式中断，并且其中外显子1和外显子2核苷酸序列的一部分为野生型(未经密码子优化)，其余编码序列是经密码子优化的(对于HTFG为SEQ ID NO：18，和对于HTAG为SEQ ID NO：5)。经密码子优化的部分的核苷酸序列在各自的两个构建体之间不同。与ssLP1.FIXco编码的野生型FIX蛋白不同，ssHLP2.TI-codop-FIX-GoF和ssHLP2.TI-ACNP-FIX-GoF编码在FIX多肽的位置384处具有精氨酸(R)至亮氨酸(L)的取代的过度活性FIX。

实施例1-方法

AAV载体产生和定量

1.AAV载体原液是通过人胚胎肾脏(HEK293)细胞与由载体基因组质粒、腺病毒辅助质粒和包含AAV Rep和Cap(AAV8或AAVMut C)功能的包装质粒组成的质粒的组合的标准三重质粒转染制备的。由于重组AAV颗粒包含基于AAV2的基因组，以及来自血清型8的衣壳或包含来自两种血清型的部分的合成衣壳(“Mut C”；SEQ ID NO：10)，因此将它们称为“假型”。

2.通过使用碘克沙醇的密度梯度离心纯化载体。

3.通过使用针对启动子区域的引物的qPCR滴定载体基因组。

体外转导和FIX表达的检测

1.将HUH7细胞以每孔5×10⁵个细胞接种在12孔板中。

2.然后用丝裂霉素C刺激细胞1小时，然后用携带编码FIX的转基因盒的AAV颗粒转导。

3.转导后五天，收集上清液，并使用市售ELISA试剂盒(Stago Asserachrom IX：Ag试剂盒Ref#00943)分析FIX的水平。使用来自Quadratech的市售生色试剂盒(Biophen FIX(6)试剂盒Ref#221806)分析FIX的活性。

4.根据制造商的说明，使用Qiagen DNeasy血液和组织试剂盒(Ref#69506)提取载体基因组DNA，并通过qPCR进行定量。

体内FIX检测

1.通过尾静脉向成年C57BL/6小鼠注射5×10¹⁰个携带编码FIX的转基因盒的AAV颗粒的载体基因组(vg)(每组n＝4)。

2.注射后两周麻醉小鼠，并通过心脏穿刺收集血液，将其添加到柠檬酸钠(1/10稀释)中，并在4℃下以3000xg离心15分钟以收集血浆，将其冷冻在-80℃以用于分析。

3.收获肝脏并在液氮中速冻，然后保存在-80℃下用于DNA提取(Qiagen DNeasy血液和组织试剂盒，Ref#69506)以用于载体基因组分析。

4.使用FIX ELISA试剂盒(Stago Asserachrom IX：Ag试剂盒REF 00943)测定鼠血浆中存在的FIX的水平。使用来自Quadratech的市售生色试剂盒(Biophen FIX(6)试剂盒Ref#221806)测定人FIX的活性。

实施例2-使用ELISA分析体外FIX转基因表达

在标准细胞培养条件下培养HUH7(人肝细胞)细胞。FIX转基因通过用丝裂霉素C处理HUH7细胞1小时，然后用假型ssAAV2/Mut C转导来表达。首先通过除AAV辅助和包装质粒以外还用重组载体基因组质粒转染HEK293细胞并再培养48小时来产生AAV颗粒。通过密度梯度离心和碘克沙醇从HEK293细胞纯化ssAAV2/Mut C载体。使用针对转基因表达盒的启动子区域的引物通过qPCR对载体基因组进行滴定。通过测量转导后5天的FIX水平，比较FIX表达盒以确定它们在体外表达FIX转基因的相对能力。被评估的载体是ssAAV2/MutC.HLP2.TI-codop-FIX-GoF和ssAAV2/Mut C.HLP2.TI-ACNP-FIX-GoF。通过使用市售的ELISA试剂盒(Stago Asserachrom IX：Ag试剂盒Ref#00943)分析培养上清液中的FIX水平。在两个单独的实验中(参见图2B和4B)，使用Qiagen DNeasy血液和组织试剂盒(Ref#69506)收获HUH7细胞DNA后，将FIX表达水平(如使用HUH7培养细胞的上清液的ELISA测定得出的)针对每个细胞的载体基因组拷贝数进行标准化。

用1×10³个载体基因组(vg)的MOI的ssAAV2/Mut C.HLP2.TI-codop-FIX-GoF和ssAAV2/Mut C.HLP2.TI-ACNP-FIX-GoF转导后5天，FIX水平在ssAAV2/Mut C.HLP2.TI-ACNP-FIX-GoF转导的HUH7细胞中比在ssAAV2/Mut C.HLP2.TI-codop-FIX-GoF转导的HUH7细胞中更高(n＝2；图2A、3和4A)。类似地，当在MOI增加(5×10³和1×10⁴)的HUH7细胞中进行相同的FIX表达测定时，FIX水平在ssAAV2/Mut C.HLP2.TI-ACNP-FIX-GoF转导的细胞中比在ssAAV2/Mut C.HLP2.TI-codop-FIX-GoF转导的细胞中更高(n＝2；图2A、3和4A)。当针对每个细胞的病毒载体基因组拷贝数对FIX表达水平进行标准化时，在测试的三个MOI(1×10³、5×10³和1×10⁴)的每个中，相对于ssAAV2/MutC.HLP2.TI-codop-FIX-GoF，ssAAV2/MutC.HLP2.TI-ACNP-FIX-GoF转导的HUH7细胞中的FIX水平始终较高(n＝2；图2B和4B)。当将来自图2、3和4的实验的5×10³转导数据组合时，相对于ssAAV2/Mut C.HLP2.TI-codop-FIX-GoF，显示了来自ssAAV2/Mut C.HLP2.TI-ACNP-FIX-GoF的明显优异表达(图5)。

实施例3-体外FIX转基因活性的分析

通过收获HUH7细胞上清液并使用BIOPHEN Factor IX试剂盒(Quadratech#221806、#222101、#223201)来评估FIX活性。在体外比较部分密码子优化的FIX转基因(HLP2.TI-codop-FIX-GoF和HLP2.TI-ACNP-FIX-GoF)，以确定(MOI为1×10³、5×10³和1×10⁴)的HUH7细胞的ssAAV2/Mut C转导后的相对FIX活性。转导后5天从HUH7细胞分离上清液，并使用BIOPHEN Factor IX试剂盒测定FIX活性。无论MOI如何，在由ssAAV2/MutC.HLP2.TI-ACNP-FIX-GoF转导的细胞衍生的上清液中观察到更高的平均FIX活性(图6-8)。当将来自图6和7的实验的5×10³转导数据组合时，相对于ssAAV2/MutC.HLP2.TI-codop-FIX-GoF，显示了来自ssAAV2/Mut C.HLP2.TI-ACNP-FIX-GoF的明显优异表达(图9)。

实施例4-使用ELISA分析体内FIX转基因表达

在使用5×10¹⁰个假型ssAAV2/8载体的载体基因组(vg)通过尾静脉注射进行转导后，FIX转基因在C57Bl/6小鼠中表达。首先通过除AAV辅助和包装质粒以外还用重组载体基因组质粒转染HEK293细胞并再培养48小时来产生AAV颗粒。通过密度梯度离心和碘克沙醇从HEK293细胞纯化ssAAV2/8载体。使用针对转基因表达盒的启动子区域的引物通过qPCR对载体基因组进行滴定。比较FIX表达盒LP1.FIXco、HLP2.TI-codop-FIX-GoF和HLP2.TI-ACNP-FIX-GoF，以确定它们表达FIX转基因的相对能力。

在涉及ssAAV2/8.HLP2.TI-codop-FIX-GoF和ssAAV2/8.LP1.FIXco的第一个实验中，给药后2周，通过心脏穿刺从经麻醉的小鼠收集血液。随后，通过添加柠檬酸钠(1/10稀释)分离血浆，并在4℃以3000×g离心15分钟。使用FIX ELISA试剂盒(Stago AsserachromIX：Ag试剂盒Ref#00943)测定FIX的循环水平。

在收获小鼠肝脏后，将FIX表达水平针对每个细胞的载体基因组拷贝数进行标准化。相对于ssAAV2/8.LP1.FIXco，使用ssAAV2/8.HLP2.TI-codop-FIX-GoF转导后，标准化的FIX表达水平被确定为显著更高(p<0.05)(n＝4只小鼠；图10)。

在进一步的实验中，在体内比较部分密码子优化的FIX转基因(HLP2.TI-codop-FIX-GoF和HLP2.TI-ACNP-FIX-GoF)，以确定使用ssAAV2/8的C57Bl/6小鼠转导后的相对FIX表达。同时，在用scAAV2/8.LP1.FIXco载体转导C57Bl/6小鼠后确定FIX表达。给药后3周从小鼠分离血浆，并使用ELISA测定法测定FIX抗原水平。在用scAAV2/8.LP1.FIXco转导的小鼠中平均FIX表达水平最低，而在用ssAAV2/8.HLP2.TI-codop-FIX-GoF转导的小鼠中水平更高(n＝4只小鼠；图11A)。用ssAAV2/8.HLP2.TI-ACNP-FIX-GoF转导的小鼠比用ssAAV2/8.HLP2.TI-codop-FIX-GoF转导的小鼠具有显著更高的FIX表达(n＝4只小鼠；图11A)。当针对每个细胞的病毒载体基因组拷贝数对FIX表达水平进行标准化时，FIX表达的趋势得以保持，从而ssAAV2/8.HLP2.TI-ACNP-FIX-GoF产生的FIX比ssAAV2/8.HLP2.TI-codop-FIX-GoF和scAAV2/8.LP1.FIXco明显更多(n＝4；图11B)。此外，ssAAV2/8.HLP2.TI-codop-FIX-GoF比scAAV2/8.LP1.FIXco表现出更高的FIX表达(n＝4只小鼠；图11B)。

实施例5-体内FIX转基因活性的分析

BIOPHEN因子IX试剂盒(Quadratech#221806，#222101，#223201)是用于使用手动生色法测量人柠檬酸血浆或IX浓缩物中的因子IX活性的生色测定法。

在存在凝血酶、磷脂和钙的情况下，在测定中以恒定浓度和过量提供的第一因子XIa将存在于测试样品中的FIX活化为FIXa，其与也以恒定浓度和过量提供的凝血酶活化的因子VIII：C、磷脂(PLP)和钙形成酶复合物，其将测定系统中存在的X因子活化为Xa因子。该活性与因子IX的量(其是限制因素)直接相关。然后，通过其在因子Xa生色底物(SXa-11)上的比活性来精确测量生成的因子Xa。因子Xa裂解底物并释放pNA。产生的pNA的量与因子IXa活性直接成比例。最后，在测定的样品中的因子IX的量与所产生的因子Xa活性之间存在直接关系，该活性通过释放的pNA的量来测量，该释放的pNA的量通过405nm处的显色测定。

在体内比较部分密码子优化的FIX转基因(HLP2.TI-codop-FIX-GoF和HLP2.TI-ACNP-FIX-GoF)，以确定在用ssAAV2/8进行C57Bl/6小鼠转导后的相对FIX活性。同时，用scAAV2/8.LP1.FIXco转导C57Bl/6小鼠后测定FIX活性。给药后3周从小鼠分离血浆，并使用BIOPHEN Factor IX试剂盒测定FIX活性。在用scAAV2/8.LP1.FIXco转导的小鼠中，平均FIX活性最低，而在用ssAAV2/8.HLP2.TI-codop-FIX-GoF转导的小鼠中，活性更高(n＝4只小鼠；图12)。用ssAAV2/8.HLP2.TI-ACNP-FIX-GoF转导的小鼠比用ssAAV2/8.HLP2.TI-codop-FIX-GoF转导的小鼠具有明显更高的FIX活性(n＝4只小鼠；图12)。

实施例6

两名B型血友病患者用4.5×10¹¹vg/kg的含有ssHLP2.HTAG的AAV2/Mut C载体治疗。两名患者均已知在筛查时患有严重的B型血友病，其中内源性FIX活性<1％。患者1在基线接受预防治疗，并在研究的前四天持续这样。接受含有ssHLP2.HTAG的AAV2/Mut C载体的单次输注的4周内，两名患者实现>30％的FIX活性水平。如通过使用SynthASil^TM试剂盒的一阶段凝血测定法评估的，患者在52周时实现了40.5+/-4.5％的稳定的因子IX活性水平。在第6至12周期间施用预防性类固醇(泼尼松龙)。

两名患者均未经历过自发性或长期出血事件。患者1在治疗后第10周因右手指割伤而具有外伤性出血。重要的是，患者不需要任何外源性凝血因子，并且事件在同一天解决。事件发生时患者的FIX活性被测量为38％。

本文所述的发明还涉及以下方面：

1.一种包含因子IX核苷酸序列的多核苷酸，其中所述因子IX核苷酸序列包含编码因子IX蛋白或其片段的编码序列，并且其中所述编码序列的一部分不是野生型的。

2.方面1的多核苷酸，其中所述编码序列的非野生型部分是经密码子优化的。

3.一种包含因子IX核苷酸序列的多核苷酸，其中所述因子IX核苷酸序列包含编码因子IX蛋白或其片段的编码序列，并且所述编码序列包括：

(i)与SEQ ID NO：1至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列；和

(ii)与SEQ ID NO：15至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

4.方面3的多核苷酸，其中与SEQ ID NO：1至少95％、至少98％、至少99％、至少99.5％或至少99.8％相同的序列是经密码子优化的。

5.一种包含因子IX核苷酸序列的多核苷酸，其中所述因子IX核苷酸序列编码因子IX蛋白或其片段，并且与SEQ ID NO：5具有至少97％、至少98％、至少99％、至少99.5％、至少99.8％或100％的同一性。

6.方面5的多核苷酸，其中所述因子IX核苷酸序列包含编码序列，并且所述编码序列的一部分是经密码子优化的。

7.前述方面中任一项的多核苷酸，其中所述多核苷酸包含DNA或RNA。

8.方面2、4、6或7中任一项的多核苷酸，其中经密码子优化的编码序列的部分是连续部分。

9.方面2、4、6、7或8的多核苷酸，其中经密码子优化的编码序列的部分是针对在人肝中的表达而进行密码子优化的。

10.前述方面中任一项的多核苷酸，其中由因子IX核苷酸序列编码的多肽在人肝细胞中以比参考野生型因子IX核苷酸序列更高的水平表达。

11.方面2、4、6或7中任一项的多核苷酸，其中经密码子优化的编码序列的部分的长度为至少800、至少900、至少1100、少于1500、少于1300、少于1200、800至1500、900至1300、1100至1200或约1191个核苷酸。

12.方面2、4或6-11中任一项的多核苷酸，其中经密码子优化的编码序列的部分包含以下的1、2、3、4、5种或全部：

a)外显子3或外显子3的至少10、至少15、至少20、少于25、10至25、15至25或20至25个核苷酸的部分；

b)外显子4或外显子4的至少80、至少90、至少100、少于114、80至114、90至114、100至114的核苷酸的部分；

c)外显子5或外显子5的至少90、至少100、至少110、少于129、90至129、100至129或110至129个核苷酸的部分；

d)外显子6或外显子6的至少150、至少180、至少200、少于203、150至203、180至203或200至203个核苷酸的部分；

e)外显子7或外显子7的至少70、至少80、至少90、至少100、少于115、70至115、80至115、90至115或100至115个核苷酸的部分；和/或

f)外显子8或外显子8的至少400、至少450、至少500、少于548、400至548、450至548或500至548个核苷酸的部分。

13.方面12的多核苷酸，其中经密码子优化的编码序列的部分包含a)、b)、c)、d)、e)和f)。

14.方面12或方面13的多核苷酸，其中经密码子优化的编码序列的部分包含外显子3的至少20个核苷酸的部分、外显子4的至少100个核苷酸的部分、外显子5的至少110个核苷酸的部分、外显子6的至少180个核苷酸、外显子7的至少100个核苷酸的部分和外显子8的至少500个核苷酸的部分。

15.方面12-14中任一项的多核苷酸，其中经密码子优化的编码序列的部分包含外显子3、外显子4、外显子5、外显子6、外显子7和外显子8。

16.方面2、4或6-15中任一项的多核苷酸，其中经密码子优化的编码序列的部分包含外显子2的一部分，外显子2的该部分的长度为少于160、少于150、少于100、少于75、少于60、至少20、至少30、至少40、至少50、20至160、30至150、30至100、40至75或约56个核苷酸。

17.方面2、4或6-16中任一项的多核苷酸，其中经密码子优化的编码序列的部分包含长度为30至100个核苷酸的外显子2的一部分。

18.方面2、4或6-17中任一项的多核苷酸，其中与参考野生型因子IX序列的相应部分相比，经密码子优化的编码序列的部分包含减少数量的CpG。

19.方面18的多核苷酸，其中经密码子优化的编码序列的部分包含少于40、少于20、少于18、少于10、少于5或少于1个CpG。

20.方面18或19的多核苷酸，其中经密码子优化的编码序列的部分不含CpG。

21.方面2、4或6-20中任一项的多核苷酸，其中在经密码子优化的编码序列的部分中，至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％或至少73％的密码子选自：

a)TTC；

b)CTG；

c)ATC；

d)GTG；

e)GTC；

f)AGC；

g)CCC；

h)ACC；

i)GCC；

j)TAC；

k)CAC；

l)CAG；

m)AAC；

n)AAA；

o)AAG；

p)GAC；

q)TGC；

r)AGG；

s)GGC；和

t)GAG。

22.方面2、4或6-21中任一项的多核苷酸，其中在经密码子优化的编码序列的部分中：

d)编码苯丙氨酸的密码子是TTC，除非下一个密码子以G开头。

23.方面2、4或6-22中任一项的多核苷酸，其中在经密码子优化的编码序列的部分中：

b)至少90％或至少94％的编码亮氨酸的密码子是CTG；和/或

24.方面2、4、6-23中任一项的多核苷酸，其中在经密码子优化的编码序列的部分中：

e)编码异亮氨酸的密码子是ATC，除非下一个密码子以G开头。

25.方面2、4或6-24中任一项的多核苷酸，其中在经密码子优化的编码序列的部分中：

26.方面2、4或6-25中任一项的多核苷酸，其中在经密码子优化的编码序列的部分中：

27.方面2、4或6-26中任一项的多核苷酸，其中在经密码子优化的编码序列的部分中：

e)编码脯氨酸的密码子是CCC，除非下一个密码子以G开头。

28.方面2、4或6-27中任一项的多核苷酸，其中在经密码子优化的编码序列的部分中：

e)编码苏氨酸的密码子是ACC，除非下一个密码子以G开头。

29.方面2、4或6-28中任一项的多核苷酸，其中在经密码子优化的编码序列的部分中：

e)编码丙氨酸的密码子是GCC，除非下一个密码子以G开头。

30.方面2、4或6-29中任一项的多核苷酸，其中在经密码子优化的编码序列的部分中：

e)编码酪氨酸的密码子是TAC，除非下一个密码子以G开头。

31.方面2、4或6-30中任一项的多核苷酸，其中在经密码子优化的编码序列的部分中：

d)编码组氨酸的密码子是CAC，除非下一个密码子以G开头。

32.方面2、4或6-31中任一项的多核苷酸，其中在经密码子优化的编码序列的部分中：

33.方面2、4或6-32中任一项的多核苷酸，其中在经密码子优化的编码序列的部分中：

d)编码天冬酰胺的密码子是AAC，除非下一个密码子以G开头。

34.方面2、4或6-33中任一项的多核苷酸，其中在经密码子优化的编码序列的部分中：

35.方面2、4或6-34中任一项的多核苷酸，其中在经密码子优化的编码序列的部分中：

e)编码天冬氨酸的密码子是GAC，除非下一个密码子以G开头。

36.方面2、4或6-35中任一项的多核苷酸，其中在经密码子优化的编码序列的部分中：

37.方面2、4或6-36中任一项的多核苷酸，其中在经密码子优化的编码序列的部分中：

e)编码半胱氨酸的密码子是TGC，除非下一个密码子以G开头。

38.方面2、4或6-37中任一项的多核苷酸，其中在经密码子优化的编码序列的部分中，编码色氨酸的密码子是TGG。

39.方面2、4或6-38中任一项的多核苷酸，其中在经密码子优化的编码序列的部分中：

40.方面2、4或6-39中任一项的多核苷酸，其中在经密码子优化的编码序列的部分中：

e)编码甘氨酸的密码子是GGC，除非下一个密码子以G开头。

41.方面2、4或6-40中任一项的多核苷酸，其中经密码子优化的编码序列的部分包含编码苯丙氨酸、亮氨酸、异亮氨酸、缬氨酸、丝氨酸、脯氨酸、苏氨酸、丙氨酸、酪氨酸、组氨酸、谷氨酰胺、天冬酰胺、赖氨酸、天冬氨酸、谷氨酸、半胱氨酸、色氨酸、精氨酸和甘氨酸的密码子。

42.方面2、4或6-41中任一项的多核苷酸，其中经密码子优化的编码序列的部分包含编码苯丙氨酸、亮氨酸、异亮氨酸、缬氨酸、丝氨酸、脯氨酸、苏氨酸、丙氨酸、酪氨酸、组氨酸、谷氨酰胺、天冬酰胺、赖氨酸、天冬氨酸、谷氨酸、半胱氨酸、色氨酸、精氨酸和甘氨酸的密码子，并且在密码子优化的部分中：

q)编码色氨酸的密码子是TGG；

43.方面2、4或6-42中任一项的多核苷酸，其中经密码子优化的编码序列的部分包含编码苯丙氨酸、亮氨酸、异亮氨酸、缬氨酸、丝氨酸、脯氨酸、苏氨酸、丙氨酸、酪氨酸、组氨酸、谷氨酰胺、天冬酰胺、赖氨酸、天冬氨酸、谷氨酸、半胱氨酸、色氨酸、精氨酸和甘氨酸的密码子，并且在密码子优化的部分中：

a)至少70％的编码苯丙氨酸的密码子是TTC；

b)至少94％的编码亮氨酸的密码子是CTG；

c)至少75％的编码异亮氨酸的密码子是ATC；

d)至少95％的编码缬氨酸的密码子是GTG；

e)至少70％的编码丝氨酸的密码子是AGC；

f)至少60％的编码脯氨酸的密码子是CCC；

g)至少55％的编码苏氨酸的密码子是ACC；

h)至少43％的编码丙氨酸的密码子是GCC；

i)至少48％的编码酪氨酸的密码子是TAC；

j)至少65％的编码组氨酸的密码子是CAC；

k)至少90％的编码谷氨酰胺的密码子是CAG；

l)至少70％的编码天冬酰胺的密码子是AAC；

m)至少95％的编码赖氨酸的密码子是AAG；

n)至少60％的编码天冬氨酸的密码子是GAC；

o)至少95％的编码谷氨酸的密码子是GAG；

p)至少55％的编码半胱氨酸的密码子是TGC；

q)编码色氨酸的密码子是TGG；

r)至少75％的编码精氨酸的密码子是AGG；和

s)至少60％的编码甘氨酸的密码子是GGC。

44.方面2、4或6-43中任一项的多核苷酸，其中经密码子优化的编码序列的部分包含编码苯丙氨酸、亮氨酸、异亮氨酸、缬氨酸、丝氨酸、脯氨酸、苏氨酸、丙氨酸、酪氨酸、组氨酸、谷氨酰胺、天冬酰胺、赖氨酸、天冬氨酸、谷氨酸、半胱氨酸、色氨酸、精氨酸和甘氨酸的密码子，并且在密码子优化的部分中：

a)至少70％的编码苯丙氨酸的密码子是TTC，其余是TTT；

b)至少94％的编码亮氨酸的密码子是CTG，其余是CTC；

c)至少75％的编码异亮氨酸的密码子是ATC，其余是ATT；

d)至少95％的编码缬氨酸的密码子是GTG；

e)至少70％的编码丝氨酸的密码子是AGC；

f)至少60％的编码脯氨酸的密码子是CCC，其余是CCA或CCT；

g)至少55％的编码苏氨酸的密码子是ACC，其余是ACT；

h)至少43％的编码丙氨酸的密码子是GCC，其余是GCT；

i)至少48％的编码酪氨酸的密码子是TAC，其余是TAT；

j)至少65％的编码组氨酸的密码子是CAC，其余的是CAT；

k)至少90％的编码谷氨酰胺的密码子是CAG，其余的是CAA；

l)至少70％的编码天冬酰胺的密码子是AAC，其余的是AAT；

m)至少95％的编码赖氨酸的密码子是AAG，其余的是AAA；

n)至少60％的编码天冬氨酸的密码子是GAC，其余是GAT；

o)至少95％的编码谷氨酸的密码子是GAG，其余的是GAA；

p)至少55％的编码半胱氨酸的密码子是TGC，其余的是TGT；

q)编码色氨酸的密码子是TGG；

r)至少75％的编码精氨酸的密码子是AGG，其余是AGA；和

s)至少60％的编码甘氨酸的密码子是GGC，其余是GGG。

45.方面10-44中任一项的多核苷酸，其中所述参考野生型因子IX序列是SEQ IDNO：9或SEQ ID NO：19。

46.方面2、4或6-45中任一项的多核苷酸，其中经密码子优化的编码序列的部分与SEQ ID NO：1的至少800、至少900、至少1100、少于1191、少于1100、少于1000、800至1191、900至1191或约1191个核苷酸的片段至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。

47.方面46的多核苷酸，其中经密码子优化的编码序列的部分与SEQ ID NO：1至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。

48.方面46或47的多核苷酸，其中经密码子优化的编码序列的部分与SEQ ID NO：1的900至1191个核苷酸的片段至少95％相同。

49.方面46-48中任一项的多核苷酸，其中经密码子优化的编码序列的部分与SEQID NO：1至少95％或至少98％相同。

50.前述方面中任一项的多核苷酸，其中所述编码序列包含未经密码子优化的部分。

51.方面50的多核苷酸，其中所述未经密码子优化的部分是至少100、至少150、至少170、至少190、少于250、少于225、少于200或约195个核苷酸。

52.方面50或51中任一项的多核苷酸，其中未经密码子优化的部分包含外显子1或外显子1的至少60、至少70、至少80、60至88、70至88或80至88个核苷酸。

53.方面50-52中任一项的多核苷酸，其中所述未经密码子优化的部分包含外显子2的至少50、至少75、至少80、至少90、至少100、少于140、少于120、50至140、75至120或约107个核苷酸的部分。

54.方面50-53中任一项的多核苷酸，其中所述未经密码子优化的部分包含CpG。

55.方面54的多核苷酸，其中未经密码子优化的部分每100个核苷酸包含至少1或至少2个CpG。

56.方面50-55中任一项的多核苷酸，其中未经密码子优化的部分包含选自以下的少于50％、少于45％、少于40％或少于35％的密码子：

a)TTC；

b)CTG；

c)ATC；

d)GTG；

e)GTC；

f)AGC；

g)CCC；

h)ACC；

i)GCC；

j)TAC；

k)CAC；

l)CAG；

m)AAC；

n)AAA；

o)AAG；

p)GAC；

q)TGC；

r)AGG；

s)GGC；和

t)GAG。

57.方面50-56中任一项的多核苷酸，其中所述未经密码子优化的部分与SEQ IDNO：15的至少100、至少150、至少175、少于195、少于190或少于180个核苷酸的片段至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。

58.方面57的多核苷酸，其中所述未经密码子优化的部分与SEQ ID NO：15至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。

59.方面50-58中任一项的多核苷酸，其中未经密码子优化的部分是野生型。

60.方面50-59中任一项的多核苷酸，其中所述未经密码子优化的部分与SEQ IDNO：15至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。

61.前述方面中任一项的多核苷酸，其中所述多核苷酸还包含中断编码序列的内含子或内含子片段。

62.方面61的多核苷酸，其中所述内含子或内含子片段是野生型因子IX内含子的一部分。

63.方面61或62的多核苷酸，其中所述内含子片段是少于500、少于400、少于350、少于300、至少100、至少200、至少250、至少290、100至500、200至400、250至350或约299个核苷酸。

64.方面61-63中任一项的多核苷酸，其中内含子片段与SEQ ID NO：3的至少100、至少200、至少250或至少290个核苷酸的片段至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。

65.方面61-64中任一项的多核苷酸，其中所述内含子或内含子片段与SEQ ID NO：3至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。

66.方面65的多核苷酸，其中所述内含子或内含子片段与SEQ ID NO：3至少95％或至少98％相同。

67.方面61-66中任一项的多核苷酸，其中所述内含子或内含子片段中断未经密码子优化的部分。

68.方面67的多核苷酸，其中所述内含子或内含子片段侧接未经密码子优化的至少60、至少70、至少80、至少90或至少100个核苷酸。

69.方面68的多核苷酸，其中所述内含子或内含子片段侧接在5'端的未经密码子优化的110至120个核苷酸和在3'端的未经密码子优化的100至110个核苷酸。

70.方面61-69中任一项的多核苷酸，其中所述内含子或内含子片段位于外显子1和外显子2之间。

71.方面61-70中任一项的多核苷酸，其中所述内含子或所述内含子片段是天然内含子1的片段(内含子1a)。

72.前述方面中任一项的多核苷酸，其中所述多核苷酸还包含转录调节元件。

73.方面72的多核苷酸，其中所述转录调节元件包含肝脏特异性启动子。

74.方面72或方面73的多核苷酸，其中所述转录调节元件包含A1AT启动子或A1AT启动子的片段。

75.方面74的多核苷酸，其中A1AT启动子的片段的长度为至少100、至少120、至少150、至少180、少于255、100至255、150至225、150至300或180至255个核苷酸。

76.方面75的多核苷酸，其中A1AT启动子的片段的长度为150至300个核苷酸。

77.方面72-76中任一项的多核苷酸，其中所述转录调节元件包含增强子。

78.方面77的多核苷酸，其中所述增强子是HCR增强子或HCR增强子的片段。

79.方面78的多核苷酸，其中所述HCR增强子的片段的长度为至少80、至少90、至少100、少于192、80至192、90至192、100至250或117至192个核苷酸。

80.方面79的多核苷酸，其中所述HCR增强子的片段的长度为100至250个核苷酸。

81.方面72-80中任一项的多核苷酸，其中所述转录调节元件与SEQ ID NO：6至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同。

82.方面81的多核苷酸，其中所述转录调节元件具有SEQ ID NO：6的序列。

83.前述方面中任一项的多核苷酸，其中所述多核苷酸包含与SEQ ID NO：13至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的增强子。

84.前述方面中任一项的多核苷酸，其中所述多核苷酸包含与SEQ ID NO：13至少98％、至少99％、至少99.5％、至少99.8％或100％相同的增强子。

85.前述方面中任一项的多核苷酸，其中所述多核苷酸包含SEQ ID NO：13的增强子。

86.前述方面中任一项的多核苷酸，其中所述多核苷酸包含与SEQ ID NO：14至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的增强子。

87.前述方面中任一项的多核苷酸，其中所述多核苷酸包含与SEQ ID NO：14至少98％、至少99％、至少99.5％、至少99.8％或100％相同的启动子。

88.前述方面中任一项的多核苷酸，其中所述多核苷酸包含SEQ ID NO：14的启动子。

89.前述方面中任一项的多核苷酸，其中所述因子IX核苷酸序列在对应于野生型因子IX的密码子384的位置处包含编码氨基酸的密码子，并且其中对应于野生型因子IX的密码子384的位置处的编码氨基酸的密码子编码丙氨酸或亮氨酸。

90.方面89的多核苷酸，其中在对应于野生型因子IX的位置384的位置处的编码氨基酸的密码子是CTX，其中X是任何核苷酸。

91.前述方面中任一项的多核苷酸，其中所述多核苷酸包含与SEQ ID NO：5的至少1200、至少1350或至少1650个核苷酸的片段至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的因子IX核苷酸序列。

92.前述方面中任一项的多核苷酸，其中所述多核苷酸包含与SEQ ID NO：5至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的因子IX核苷酸序列。

93.前述方面中任一项的多核苷酸，其中：

(i)因子IX核苷酸序列包含与SEQ ID NO：1至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列；和(ii)因子IX核苷酸序列包含在对应于野生型因子IX的位置384的位置处的编码氨基酸的密码子，其中在对应于野生型因子IX的位置384的位置处的编码氨基酸的密码子编码亮氨酸。

94.前述方面中任一项的多核苷酸，其中：

(ii)因子IX核苷酸序列包含在对应于野生型因子IX的位置384的位置处的编码氨基酸的密码子，其中在对应于野生型因子IX的位置384的位置处的编码氨基酸的密码子编码亮氨酸；和

(iii)多核苷酸包含与SEQ ID NO：14至少98％、至少99％、至少99.5％、至少99.8％或100％相同的启动子元件和/或与SEQ ID NO：13至少98％、至少99％、至少99.5％、至少99.8％或100％相同的增强子元件。

95.前述方面中任一项的多核苷酸，其中：

96.前述方面中任一项的多核苷酸，其中：

(ii)因子IX核苷酸序列包含与SEQ ID NO：2的相应部分至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列；和(iii)因子IX核苷酸序列包含在对应于野生型因子IX的位置384的位置处的编码氨基酸的密码子，其中在对应于野生型因子IX的位置384的位置处的编码氨基酸的密码子编码亮氨酸。

97.方面95或96中任一项的多核苷酸，其中所述因子IX核苷酸序列包含内含子或内含子片段，并且所述内含子片段与SEQ ID NO：3至少98％、至少99％、至少99.5％、至少99.8％或100％相同。

98.前述方面中任一项的多核苷酸，其中：

(i)因子IX核苷酸序列包含编码序列，并且该编码序列的一部分未经密码子优化；和

(ii)因子IX核苷酸序列包含在对应于野生型因子IX的位置384的位置处的编码氨基酸的密码子，其中在对应于野生型因子IX的位置384的位置处的编码氨基酸的密码子编码亮氨酸。

99.前述方面中任一项的多核苷酸，其中由因子IX核苷酸序列编码的多肽在人肝细胞中以与由包含SEQ ID NO：12的因子IX核苷酸序列和SEQ ID NO：7的转录调节元件的核苷酸序列编码的多肽相比更高的水平表达。

100.前述方面中任一项的多核苷酸，其中由因子IX核苷酸序列编码的多肽在人肝细胞中以与由包含SEQ ID NO：18的因子IX核苷酸序列和SEQ ID NO：6的转录调节元件的核苷酸序列编码的多肽相比更高的水平表达。

101.前述方面中任一项的多核苷酸，其中由因子IX核苷酸序列编码的多肽在人肝细胞中以由包含SEQ ID NO：12或SEQ ID NO：18的因子IX核苷酸序列和SEQ ID NO：7或SEQID NO：6的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达。

102.一种病毒颗粒，其包含重组基因组，所述重组基因组包含前述方面中任一项的多核苷酸。

103.方面102的病毒颗粒，其是AAV、腺病毒或慢病毒颗粒。

104.方面103的病毒颗粒，其是AAV病毒颗粒。

105.方面102-104中任一项的病毒颗粒，其中所述重组基因组还包含：

a)AAV2 ITR；

b)多聚A序列；

c)复制起点；和/或

d)两个可分辨的ITR。

106.方面105的病毒颗粒，其中所述重组基因组是单链的和/或包含两个可分辨的ITR。

107.方面102-106中任一项的病毒颗粒，其中所述病毒颗粒包含选自以下的衣壳：

(i)与SEQ ID NO：10具有至少96％、至少98％、至少99％、至少99.5％、至少99.8％同一性或100％同一性的衣壳；

(ii)与SEQ ID NO：17具有至少96％、至少98％、至少99％、99.5％、至少99.8％或100％同一性的衣壳；

(iii)AAVMutC；和

(iv)AAV5。

108.方面102-107中任一项的病毒颗粒，其中在转导到Huh7细胞中后，所述病毒颗粒表达具有比由包含SEQ ID NO：12的因子IX核苷酸序列和SEQ ID NO：7的转录调节元件的病毒颗粒和/或包含SEQ ID NO：18的因子IX核苷酸序列和SEQ ID NO：6的转录调节元件的病毒颗粒表达的因子IX的活性更高的因子IX活性的因子IX蛋白或其片段。

109.方面108的病毒颗粒，其中所述活性是使用对因子Xa具有特异性的生色底物测量的。

110.前述方面中任一项的多核苷酸或病毒颗粒，其中因子IX蛋白片段的长度为至少200、至少250、至少300、200至415、250至415或300至415个氨基酸。

111.前述方面中任一项的多核苷酸或病毒颗粒，其中因子IX蛋白或其片段包含：

a)与SEQ ID NO：8至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列；或

b)与长度为至少200、至少250、至少300、200至415、250至415或300至415个氨基酸的SEQ ID NO：8的片段至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的序列。

112.一种组合物，其包含前述方面中任一项的多核苷酸或病毒颗粒和药学上可接受的赋形剂。

113.用于治疗方法的前述方面中任一项的多核苷酸、病毒颗粒或组合物。

114.方面113使用的多核苷酸、病毒颗粒或组合物，其中治疗方法包括向患者施用有效量的方面1-112中任一项的多核苷酸、组合物或病毒颗粒。

115.一种治疗方法，包括向患者施用有效量的方面1-112中任一项的多核苷酸、组合物或病毒颗粒。

116.方面1-112中任一项的多核苷酸、病毒颗粒或组合物在制备用于治疗方法的药物中的用途。

117.方面116的用途，其中所述治疗方法包括向患者施用有效量的方面1-112中任一项的多核苷酸、组合物或病毒颗粒。

118.方面113-117中任一项的多核苷酸、病毒颗粒、组合物、用途或方法，其中所述治疗方法是治疗血友病的方法。

119.方面118的多核苷酸、病毒颗粒、组合物、用途或方法，其中所述血友病是B型血友病。

120.方面119的多核苷酸、病毒颗粒、组合物、用途或方法，其中所述患者具有针对因子IX的抗体或抑制剂。

121.方面1-112中任一项的多核苷酸、病毒颗粒或组合物，其用于以由包含SEQ IDNO：12的因子IX核苷酸序列和SEQ ID NO：7的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽，从而治疗疾病。

122.方面1-112中任一项的多核苷酸、病毒颗粒或组合物，其用于通过以由包含SEQ ID NO：12的因子IX核苷酸序列和SEQ ID NO：7的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽来治疗疾病。

123.一种以由包含SEQ ID NO：12的因子IX核苷酸序列和SEQ ID NO：7的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽的方法，包括向患者施用方面1-112中任一项的多核苷酸、病毒颗粒或组合物。

124.一种通过以由包含SEQ ID NO：12的因子IX核苷酸序列和SEQ ID NO：7的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽来治疗疾病的方法，包括向患者施用方面1-112中任一项的多核苷酸、病毒颗粒或组合物。

125.方面1-112中任一项的多核苷酸、病毒颗粒或组合物用于以由包含SEQ IDNO：12的因子IX核苷酸序列和SEQ ID NO：7的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽的用途，从而治疗疾病。

126.方面1-112中任一项的多核苷酸、病毒颗粒或组合物用于通过以由包含SEQID NO：12的因子IX核苷酸序列和SEQ ID NO：7的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽来治疗疾病的用途。

127.方面1-112中任一项的多核苷酸、病毒颗粒或组合物，其用于以由包含SEQ IDNO：18的因子IX核苷酸序列和SEQ ID NO：6的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽，从而治疗疾病。

128.方面1-112中任一项的多核苷酸、病毒颗粒或组合物，其用于通过以由包含SEQ ID NO：18的因子IX核苷酸序列和SEQ ID NO：6的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽来治疗疾病。

129.一种以由包含SEQ ID NO：18的因子IX核苷酸序列和SEQ ID NO：6的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽的方法，包括向患者施用方面1-112中任一项的多核苷酸、病毒颗粒或组合物。

130.一种通过以由包含SEQ ID NO：18的因子IX核苷酸序列和SEQ ID NO：6的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽来治疗疾病的方法，包括向患者施用方面1-112中任一项的多核苷酸、病毒颗粒或组合物。

131.方面1-112中任一项的多核苷酸、病毒颗粒或组合物用于以由包含SEQ IDNO：18的因子IX核苷酸序列和SEQ ID NO：6的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽的用途，从而治疗疾病。

132.方面1-112中任一项的多核苷酸、病毒颗粒或组合物用于通过以由包含SEQID NO：18的因子IX核苷酸序列和SEQ ID NO：6的转录调节元件的核苷酸序列编码的多肽的至少2倍或至少3倍的水平表达由因子IX核苷酸序列编码的多肽来治疗疾病的用途。

133.方面121-122、125-128或131-132中任一项的多核苷酸、病毒颗粒或组合物或用途，其中表达由因子IX核苷酸序列编码的多肽包括向患者施用方面1-112中任一项的多核苷酸、病毒颗粒或组合物。

134.方面1-112中任一项的多核苷酸、病毒颗粒或组合物，其用于通过表达具有比由包含SEQ ID NO：12的因子IX核苷酸序列和SEQ ID NO：7的转录调节元件的病毒颗粒和/或包含SEQ ID NO：18的因子IX核苷酸序列和SEQ ID NO：6的转录调节元件的病毒颗粒表达的因子IX的活性更高的因子IX活性的因子IX蛋白或其片段来治疗疾病。

135.一种通过表达具有比由包含SEQ ID NO：12的因子IX核苷酸序列和SEQ IDNO：7的转录调节元件的病毒颗粒和/或包含SEQ ID NO：18的因子IX核苷酸序列和SEQ IDNO：6的转录调节元件的病毒颗粒表达的因子IX的活性更高的因子IX活性的因子IX蛋白或其片段来治疗疾病的方法，包括向患者施用有效量的方面1-112中任一项的多核苷酸、病毒颗粒或组合物。

136.方面1-112中任一项的多核苷酸、病毒颗粒或组合物用于通过表达具有比由包含SEQ ID NO：12的因子IX核苷酸序列和SEQ ID NO：7的转录调节元件的病毒颗粒和/或包含SEQ ID NO：18的因子IX核苷酸序列和SEQ ID NO：6的转录调节元件的病毒颗粒表达的因子IX的活性更高的因子IX活性的因子IX蛋白或其片段来治疗疾病的用途。

137.方面134或136中任一项的多核苷酸、病毒颗粒或组合物或用途，其中表达因子IX蛋白或其片段包括向患者施用方面1-112中任一项的多核苷酸、病毒颗粒或组合物。

138.方面121-122、124-128、130-137中任一项的多核苷酸、病毒颗粒或组合物、治疗方法或用途，其中所述疾病是血友病。

139.方面138的多核苷酸、病毒颗粒或组合物、治疗方法或用途，其中所述疾病是b型血友病。

140.方面1-112中任一项的多核苷酸、病毒颗粒或组合物，其用于在患有B型血友病的患者中获得至少20％的稳定的因子IX活性水平。

141.一种在患有B型血友病的患者中实现至少20％的稳定的因子IX活性水平的方法，其包括向患者施用有效量的方面1-112中任一项的多核苷酸、病毒颗粒或组合物。

142.方面1-112中任一项的多核苷酸、病毒颗粒或组合物在患有B型血友病的患者中获得至少20％的稳定的因子IX活性水平的用途。

143.方面1-112中任一项的多核苷酸、病毒颗粒或组合物，其用于治疗B型血友病，包括以在患者中有效地获得至少20％的稳定的因子IX活性水平的剂量向患者施用多核苷酸、病毒颗粒或组合物。

144.一种治疗B型血友病的方法，其包括以在患者中有效地获得至少20％的稳定的因子IX活性水平的剂量向患者施用方面1-112中任一项的多核苷酸、病毒颗粒或组合物。

145.方面1-112中任一项的多核苷酸、病毒颗粒或组合物在治疗B型血友病中的用途，包括以在患者中有效地获得至少20％的稳定的因子IX活性水平的剂量向患者施用多核苷酸、病毒颗粒或组合物。

146.方面140、142、143或145的多核苷酸、病毒颗粒或组合物或用途，其中治疗B型血友病或实现稳定的因子IX活性水平包括向患者施用方面1-112中任一项的多核苷酸、病毒颗粒或组合物。

147.方面141、144、146-148中任一项的多核苷酸、病毒颗粒或组合物、方法或用途，其中所述因子IX活性水平在施用多核苷酸、病毒颗粒或组合物的至少10周、至少15周、至少20周、至少30周、至少40周或至少50周后是稳定的。

148.方面123、124、129、130、133、135、137-147中任一项的多核苷酸、病毒颗粒或组合物、方法或用途，其中所述患者是使用具有比由包含(i)SEQ ID NO：4或5的因子IX核苷酸序列和(ii)SEQ ID NO：6的转录调节元件的病毒颗粒表达的因子IX的活性更低的活性的因子IX难治的患者。

149.方面123、124、129、130、133、135、137-148中任一项的多核苷酸、病毒颗粒或组合物、方法或用途，其中所述患者是使用以比由包含(i)SEQ ID NO：4或5的因子IX核苷酸序列和(ii)SEQ ID NO：6的转录调节元件的核苷酸序列编码的水平更低的水平表达的因子IX多肽难治的患者。

150.方面121-149中任一项的多核苷酸、病毒颗粒或组合物、方法或用途，其中以在患有B型血友病的患者中有效实现至少20％的稳定的因子IX活性水平的剂量施用所述多核苷酸、病毒颗粒或组合物。

151.方面121-150中任一项的多核苷酸、病毒颗粒或组合物、方法或用途，其中以至少4.5×10¹¹vg/kg的剂量，或少于5×10¹¹vg/kg的剂量，或4.5×10¹¹至1×10¹²vg/kg的剂量，或4.5×10¹¹vg/kg至4.9×10¹¹vg/kg的剂量施用所述多核苷酸、病毒颗粒或组合物。

152.方面151的多核苷酸、病毒颗粒或组合物、方法或用途，其中所述剂量通过使用qPCR定量载体基因组的数量来确定，任选地，其中qPCR使用结合启动子区域的引物，任选地，其中所述启动子区域是转基因盒的启动子区域。

153.方面121-152中任一项的多核苷酸、病毒颗粒或组合物、方法或用途，其中所施用的多核苷酸或病毒颗粒是由哺乳动物细胞产生的和/或具有因使用哺乳动物病毒载体生产细胞而产生并与昆虫病毒载体生产细胞(例如杆状病毒系统)中产生的载体区分开的特征。

154.方面140-153中任一项的多核苷酸、病毒颗粒或组合物、方法或用途，其中稳定的因子IX活性水平是至少25％或至少30％的稳定的因子IX活性水平。

155.方面140-154中任一项的多核苷酸、病毒颗粒或组合物、方法或用途，其中稳定的因子IX活性水平是至少35％的稳定的因子IX活性水平。

156.方面140-155中任一项的多核苷酸、病毒颗粒或组合物、方法或用途，其中稳定的因子IX活性水平为至少或约40％。

157.方面140-156中任一项的多核苷酸、病毒颗粒或组合物、方法或用途，其中在施用所述多核苷酸、病毒颗粒或组合物后至少50周或约52周的时间点，因子IX活性水平为至少20％。

158.方面157的多核苷酸、病毒颗粒或组合物、方法或用途，其中因子IX活性水平在紧接所述时间点之前至少40周的连续时间保持至少20％。

159.方面140-156中任一项的多核苷酸、病毒颗粒或组合物、方法或用途，其中在施用所述多核苷酸、病毒颗粒或组合物后至少50周或约52周的时间点，因子IX活性水平为至少25％。

160.方面159的多核苷酸、病毒颗粒或组合物、方法或用途，其中因子IX活性水平在紧接所述时间点之前至少40周的连续时间保持至少25％。

161.方面140-156中任一项的多核苷酸、病毒颗粒或组合物、方法或用途，其中在施用所述多核苷酸、病毒颗粒或组合物后至少50周或约52周的时间点，因子IX活性为至少或约40％。

162.方面161的多核苷酸、病毒颗粒或组合物、方法或用途，其中因子IX活性水平在紧接所述时间点之前至少40周的连续时间保持至少40％。

163.方面140-162中任一项的多核苷酸、病毒颗粒或组合物、方法或用途，其中使用凝血测定法测量因子IX活性以确定来自患者的血液样品中的因子IX活性，任选地，其中所述凝血测定法使用SynthASil^TM试剂盒。

164.方面140-162中任一项的多核苷酸、病毒颗粒或组合物、方法或用途，其中通过从患者采集血液样品并使用凝血测定法测量因子IX活性以确定血液样品中的因子IX活性，任选地，其中所述凝血测定法使用SynthASil^TM试剂盒。

165.方面163或164的多核苷酸、病毒颗粒或组合物、方法或用途，其中所述凝血测定法是一阶段凝血测定法，任选地，其中一阶段凝血测定法使用SynthASil^TM试剂盒。

166.方面113-165中任一项的多核苷酸、病毒颗粒或组合物、方法或用途，其中所述方法或用途包括类固醇的共同施用。

167.方面166的多核苷酸、病毒颗粒或组合物、方法或用途，其中所述类固醇是泼尼松龙。

序列表

<110> UCL商业有限责任公司

<120> 编码因子IX的核苷酸

<130> N411562WO

<150> GB1813528.5

<151> 2018-08-20

<150> US16/105,583

<151> 2018-08-20

<160> 26

<170> PatentIn version 3.5

<210> 1

<211> 1191

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 1

gaggagaagt gcagctttga ggaggccagg gaggtgtttg agaacactga gaggaccact 60

gagttctgga agcagtatgt ggatggggac cagtgtgaga gcaacccctg cctgaatggg 120

ggcagctgca aggatgacat caacagctat gagtgctggt gcccctttgg ctttgagggc 180

aagaactgtg agctggatgt gacctgcaac atcaagaatg gcagatgtga gcagttctgc 240

aagaactctg ctgacaacaa ggtggtgtgc agctgcactg agggctacag gctggctgag 300

aaccagaaga gctgtgagcc tgctgtgcca ttcccatgtg gcagagtgtc tgtgagccag 360

accagcaagc tgaccagggc tgaggctgtg ttccctgatg tggactatgt gaacagcact 420

gaggctgaaa ccatcctgga caacatcacc cagagcaccc agagcttcaa tgacttcacc 480

agggtggtgg ggggggagga tgccaagcct ggccagttcc cctggcaagt ggtgctgaat 540

ggcaaggtgg atgccttctg tgggggcagc attgtgaatg agaagtggat tgtgactgct 600

gcccactgtg tggagactgg ggtgaagatc actgtggtgg ctggggagca caacattgag 660

gagactgagc acactgagca gaagaggaat gtgatcagga tcatccccca ccacaactac 720

aatgctgcca tcaacaagta caaccatgac attgccctgc tggagctgga tgagcccctg 780

gtgctgaaca gctatgtgac ccccatctgc attgctgaca aggagtacac caacatcttc 840

ctgaagtttg gctctggcta tgtgtctggc tggggcaggg tgttccacaa gggcaggtct 900

gccctggtgc tgcagtacct gagggtgccc ctggtggaca gggccacctg cctgctcagc 960

accaagttca ccatctacaa caacatgttc tgtgctggct tccatgaggg gggcagggac 1020

agctgccagg gggactctgg gggcccccat gtgactgagg tggagggcac cagcttcctg 1080

actggcatca tcagctgggg ggaggagtgt gccatgaagg gcaagtatgg catctacacc 1140

aaagtctcca gatatgtgaa ctggatcaag gagaagacca agctgacctg a 1191

<210> 2

<211> 494

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 2

atgcagcgcg tgaacatgat catggcagaa tcaccaggcc tcatcaccat ctgcctttta 60

ggatatctac tcagtgctga atgtacaggt ttgtttcctt ttttaaaata cattgagtat 120

gcttgccttt tagatataga aatatctgat gctgtcttct tcactaaatt ttgattacat 180

gatttgacag caatattgaa gagtctaaca gccagcacgc aggttggtaa gtactgtggg 240

aacatcacag attttggctc catgccctaa agagaaattg gctttcagat tatttggatt 300

aaaaacaaag actttcttaa gagatgtaaa attttcatga tgttttcttt tttgctaaaa 360

ctaaagaatt attcttttac atttcagttt ttcttgatca tgaaaacgcc aacaaaattc 420

tgaatcggcc aaagaggtat aattcaggta aattggaaga gtttgttcaa gggaaccttg 480

agagagaatg tatg 494

<210> 3

<211> 299

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 3

gtttgtttcc ttttttaaaa tacattgagt atgcttgcct tttagatata gaaatatctg 60

atgctgtctt cttcactaaa ttttgattac atgatttgac agcaatattg aagagtctaa 120

cagccagcac gcaggttggt aagtactgtg ggaacatcac agattttggc tccatgccct 180

aaagagaaat tggctttcag attatttgga ttaaaaacaa agactttctt aagagatgta 240

aaattttcat gatgttttct tttttgctaa aactaaagaa ttattctttt acatttcag 299

<210> 4

<211> 1386

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 4

atgcagcgcg tgaacatgat catggcagaa tcaccaggcc tcatcaccat ctgcctttta 60

ggatatctac tcagtgctga atgtacagtt tttcttgatc atgaaaacgc caacaaaatt 120

ctgaatcggc caaagaggta taattcaggt aaattggaag agtttgttca agggaacctt 180

gagagagaat gtatggagga gaagtgcagc tttgaggagg ccagggaggt gtttgagaac 240

actgagagga ccactgagtt ctggaagcag tatgtggatg gggaccagtg tgagagcaac 300

ccctgcctga atgggggcag ctgcaaggat gacatcaaca gctatgagtg ctggtgcccc 360

tttggctttg agggcaagaa ctgtgagctg gatgtgacct gcaacatcaa gaatggcaga 420

tgtgagcagt tctgcaagaa ctctgctgac aacaaggtgg tgtgcagctg cactgagggc 480

tacaggctgg ctgagaacca gaagagctgt gagcctgctg tgccattccc atgtggcaga 540

gtgtctgtga gccagaccag caagctgacc agggctgagg ctgtgttccc tgatgtggac 600

tatgtgaaca gcactgaggc tgaaaccatc ctggacaaca tcacccagag cacccagagc 660

ttcaatgact tcaccagggt ggtggggggg gaggatgcca agcctggcca gttcccctgg 720

caagtggtgc tgaatggcaa ggtggatgcc ttctgtgggg gcagcattgt gaatgagaag 780

tggattgtga ctgctgccca ctgtgtggag actggggtga agatcactgt ggtggctggg 840

gagcacaaca ttgaggagac tgagcacact gagcagaaga ggaatgtgat caggatcatc 900

ccccaccaca actacaatgc tgccatcaac aagtacaacc atgacattgc cctgctggag 960

ctggatgagc ccctggtgct gaacagctat gtgaccccca tctgcattgc tgacaaggag 1020

tacaccaaca tcttcctgaa gtttggctct ggctatgtgt ctggctgggg cagggtgttc 1080

cacaagggca ggtctgccct ggtgctgcag tacctgaggg tgcccctggt ggacagggcc 1140

acctgcctgc tcagcaccaa gttcaccatc tacaacaaca tgttctgtgc tggcttccat 1200

gaggggggca gggacagctg ccagggggac tctgggggcc cccatgtgac tgaggtggag 1260

ggcaccagct tcctgactgg catcatcagc tggggggagg agtgtgccat gaagggcaag 1320

tatggcatct acaccaaagt ctccagatat gtgaactgga tcaaggagaa gaccaagctg 1380

acctga 1386

<210> 5

<211> 1685

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 5

atgcagcgcg tgaacatgat catggcagaa tcaccaggcc tcatcaccat ctgcctttta 60

ggatatctac tcagtgctga atgtacaggt ttgtttcctt ttttaaaata cattgagtat 120

gcttgccttt tagatataga aatatctgat gctgtcttct tcactaaatt ttgattacat 180

gatttgacag caatattgaa gagtctaaca gccagcacgc aggttggtaa gtactgtggg 240

aacatcacag attttggctc catgccctaa agagaaattg gctttcagat tatttggatt 300

aaaaacaaag actttcttaa gagatgtaaa attttcatga tgttttcttt tttgctaaaa 360

ctaaagaatt attcttttac atttcagttt ttcttgatca tgaaaacgcc aacaaaattc 420

tgaatcggcc aaagaggtat aattcaggta aattggaaga gtttgttcaa gggaaccttg 480

agagagaatg tatggaggag aagtgcagct ttgaggaggc cagggaggtg tttgagaaca 540

ctgagaggac cactgagttc tggaagcagt atgtggatgg ggaccagtgt gagagcaacc 600

cctgcctgaa tgggggcagc tgcaaggatg acatcaacag ctatgagtgc tggtgcccct 660

ttggctttga gggcaagaac tgtgagctgg atgtgacctg caacatcaag aatggcagat 720

gtgagcagtt ctgcaagaac tctgctgaca acaaggtggt gtgcagctgc actgagggct 780

acaggctggc tgagaaccag aagagctgtg agcctgctgt gccattccca tgtggcagag 840

tgtctgtgag ccagaccagc aagctgacca gggctgaggc tgtgttccct gatgtggact 900

atgtgaacag cactgaggct gaaaccatcc tggacaacat cacccagagc acccagagct 960

tcaatgactt caccagggtg gtgggggggg aggatgccaa gcctggccag ttcccctggc 1020

aagtggtgct gaatggcaag gtggatgcct tctgtggggg cagcattgtg aatgagaagt 1080

ggattgtgac tgctgcccac tgtgtggaga ctggggtgaa gatcactgtg gtggctgggg 1140

agcacaacat tgaggagact gagcacactg agcagaagag gaatgtgatc aggatcatcc 1200

cccaccacaa ctacaatgct gccatcaaca agtacaacca tgacattgcc ctgctggagc 1260

tggatgagcc cctggtgctg aacagctatg tgacccccat ctgcattgct gacaaggagt 1320

acaccaacat cttcctgaag tttggctctg gctatgtgtc tggctggggc agggtgttcc 1380

acaagggcag gtctgccctg gtgctgcagt acctgagggt gcccctggtg gacagggcca 1440

cctgcctgct cagcaccaag ttcaccatct acaacaacat gttctgtgct ggcttccatg 1500

aggggggcag ggacagctgc cagggggact ctgggggccc ccatgtgact gaggtggagg 1560

gcaccagctt cctgactggc atcatcagct ggggggagga gtgtgccatg aagggcaagt 1620

atggcatcta caccaaagtc tccagatatg tgaactggat caaggagaag accaagctga 1680

cctga 1685

<210> 6

<211> 334

<212> DNA

<213> 人工序列

<220>

<223> 合成调节元件

<400> 6

ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60

tgaccttgga gctggggcag aggtcagaca cctctctggg cccatgccac ctccaactgg 120

acacaggacg ctgtggtttc tgagccaggg ggcgactcag atcccagcca gtggacttag 180

cccctgtttg ctcctccgat aactggggtg accttggtta atattcacca gcagcctccc 240

ccgttgcccc tctggatcca ctgcttaaat acggacgagg acagggccct gtctcctcag 300

cttcaggcac caccactgac ctgggacagt gaat 334

<210> 7

<211> 447

<212> DNA

<213> 人工序列

<220>

<223> 合成调节元件

<400> 7

ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60

tgaccttgga gctggggcag aggtcagaga cctctctggg cccatgccac ctccaacatc 120

cactcgaccc cttggaattt cggtggagag gagcagaggt tgtcctggcg tggtttaggt 180

agtgtgagag gggaatgact cctttcggta agtgcagtgg aagctgtaca ctgcccaggc 240

aaagcgtccg ggcagcgtag gcgggcgact cagatcccag ccagtggact tagcccctgt 300

ttgctcctcc gataactggg gtgaccttgg ttaatattca ccagcagcct cccccgttgc 360

ccctctggat ccactgctta aatacggacg aggacagggc cctgtctcct cagcttcagg 420

caccaccact gacctgggac agtgaat 447

<210> 8

<211> 415

<212> PRT

<213> 智人

<400> 8

Tyr Asn Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg

1 5 10 15

Glu Cys Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe

20 25 30

Glu Asn Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly

35 40 45

Asp Gln Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp

50 55 60

Asp Ile Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys

65 70 75 80

Asn Cys Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu

85 90 95

Gln Phe Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr

100 105 110

Glu Gly Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val

115 120 125

Pro Phe Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr

130 135 140

Arg Ala Glu Ala Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu

145 150 155 160

Ala Glu Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn

165 170 175

Asp Phe Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe

180 185 190

Pro Trp Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly

195 200 205

Ser Ile Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu

210 215 220

Thr Gly Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu

225 230 235 240

Thr Glu His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His

245 250 255

His Asn Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu

260 265 270

Leu Glu Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile

275 280 285

Cys Ile Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser

290 295 300

Gly Tyr Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala

305 310 315 320

Leu Val Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys

325 330 335

Leu Leu Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly

340 345 350

Phe His Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro

355 360 365

His Val Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser

370 375 380

Trp Gly Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys

385 390 395 400

Val Ser Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr

405 410 415

<210> 9

<211> 1386

<212> DNA

<213> 智人

<400> 9

atgcagcgcg tgaacatgat catggcagaa tcaccaggcc tcatcaccat ctgcctttta 60

ggatatctac tcagtgctga atgtacagtt tttcttgatc atgaaaacgc caacaaaatt 120

ctgaatcggc caaagaggta taattcaggt aaattggaag agtttgttca agggaacctt 180

gagagagaat gtatggaaga aaagtgtagt tttgaagaag cacgagaagt ttttgaaaac 240

actgaaagaa caactgaatt ttggaagcag tatgttgatg gagatcagtg tgagtccaat 300

ccatgtttaa atggcggcag ttgcaaggat gacattaatt cctatgaatg ttggtgtccc 360

tttggatttg aaggaaagaa ctgtgaatta gatgtaacat gtaacattaa gaatggcaga 420

tgcgagcagt tttgtaaaaa tagtgctgat aacaaggtgg tttgctcctg tactgaggga 480

tatcgacttg cagaaaacca gaagtcctgt gaaccagcag tgccatttcc atgtggaaga 540

gtttctgttt cacaaacttc taagctcacc cgtgctgagg ctgtttttcc tgatgtggac 600

tatgtaaatt ctactgaagc tgaaaccatt ttggataaca tcactcaaag cacccaatca 660

tttaatgact tcactcgggt tgttggtgga gaagatgcca aaccaggtca attcccttgg 720

caggttgttt tgaatggtaa agttgatgca ttctgtggag gctctatcgt taatgaaaaa 780

tggattgtaa ctgctgccca ctgtgttgaa actggtgtta aaattacagt tgtcgcaggt 840

gaacataata ttgaggagac agaacataca gagcaaaagc gaaatgtgat tcgaattatt 900

cctcaccaca actacaatgc agctattaat aagtacaacc atgacattgc ccttctggaa 960

ctggacgaac ccttagtgct aaacagctac gttacaccta tttgcattgc tgacaaggaa 1020

tacacgaaca tcttcctcaa atttggatct ggctatgtaa gtggctgggg aagagtcttc 1080

cacaaaggga gatcagcttt agttcttcag taccttagag ttccacttgt tgaccgagcc 1140

acatgtcttc gatctacaaa gttcaccatc tataacaaca tgttctgtgc tggcttccat 1200

gaaggaggta gagattcatg tcaaggagat agtgggggac cccatgttac tgaagtggaa 1260

gggaccagtt tcttaactgg aattattagc tggggtgaag agtgtgcaat gaaaggcaaa 1320

tatggaatat ataccaaggt atcccggtat gtcaactgga ttaaggaaaa aacaaagctc 1380

acttaa 1386

<210> 10

<211> 736

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 10

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro

20 25 30

Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Asp Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Val Gly

145 150 155 160

Lys Ser Gly Lys Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro

180 185 190

Ala Ala Pro Thr Ser Leu Gly Ser Asn Thr Met Ala Ser Gly Gly Gly

195 200 205

Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr

260 265 270

Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His

275 280 285

Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp

290 295 300

Gly Phe Arg Pro Lys Lys Leu Ser Phe Lys Leu Phe Asn Ile Gln Val

305 310 315 320

Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu

325 330 335

Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr

340 345 350

Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp

355 360 365

Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser

370 375 380

Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser

385 390 395 400

Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Thr Phe Glu

405 410 415

Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg

420 425 430

Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg Thr

435 440 445

Gln Gly Thr Thr Ser Gly Thr Thr Asn Gln Ser Arg Leu Leu Phe Ser

450 455 460

Gln Ala Gly Pro Gln Ser Met Ser Leu Gln Ala Arg Asn Trp Leu Pro

465 470 475 480

Gly Pro Cys Tyr Arg Gln Gln Arg Leu Ser Lys Thr Ala Asn Asp Asn

485 490 495

Asn Asn Ser Asn Phe Pro Trp Thr Ala Ala Ser Lys Tyr His Leu Asn

500 505 510

Gly Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys

515 520 525

Asp Asp Glu Glu Lys Phe Phe Pro Met His Gly Asn Leu Ile Phe Gly

530 535 540

Lys Glu Gly Thr Thr Ala Ser Asn Ala Glu Leu Asp Asn Val Met Ile

545 550 555 560

Thr Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln

565 570 575

Tyr Gly Thr Val Ala Asn Asn Leu Gln Ser Ser Asn Thr Ala Pro Thr

580 585 590

Thr Arg Thr Val Asn Asp Gln Gly Ala Leu Pro Gly Met Val Trp Gln

595 600 605

Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His

610 615 620

Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu

625 630 635 640

Lys His Pro Pro Pro Gln Ile Met Ile Lys Asn Thr Pro Val Pro Ala

645 650 655

Asn Pro Pro Thr Thr Phe Ser Pro Ala Lys Phe Ala Ser Phe Ile Thr

660 665 670

Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln

675 680 685

Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn

690 695 700

Tyr Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val

705 710 715 720

Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu

725 730 735

<210> 11

<211> 1386

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 11

atgcagaggg tgaacatgat catggctgag agccctggcc tgatcaccat ctgcctgctg 60

ggctacctgc tgtctgctga gtgcactgtg ttcctggacc atgagaatgc caacaagatc 120

ctgaacaggc ccaagagata caactctggc aagctggagg agtttgtgca gggcaacctg 180

gagagggagt gcatggagga gaagtgcagc tttgaggagg ccagggaggt gtttgagaac 240

actgagagga ccactgagtt ctggaagcag tatgtggatg gggaccagtg tgagagcaac 300

ccctgcctga atgggggcag ctgcaaggat gacatcaaca gctatgagtg ctggtgcccc 360

tttggctttg agggcaagaa ctgtgagctg gatgtgacct gcaacatcaa gaatggcaga 420

tgtgagcagt tctgcaagaa ctctgctgac aacaaggtgg tgtgcagctg cactgagggc 480

tacaggctgg ctgagaacca gaagagctgt gagcctgctg tgccattccc atgtggcaga 540

gtgtctgtga gccagaccag caagctgacc agggctgagg ctgtgttccc tgatgtggac 600

tatgtgaaca gcactgaggc tgaaaccatc ctggacaaca tcacccagag cacccagagc 660

ttcaatgact tcaccagggt ggtggggggg gaggatgcca agcctggcca gttcccctgg 720

caagtggtgc tgaatggcaa ggtggatgcc ttctgtgggg gcagcattgt gaatgagaag 780

tggattgtga ctgctgccca ctgtgtggag actggggtga agatcactgt ggtggctggg 840

gagcacaaca ttgaggagac tgagcacact gagcagaaga ggaatgtgat caggatcatc 900

ccccaccaca actacaatgc tgccatcaac aagtacaacc atgacattgc cctgctggag 960

ctggatgagc ccctggtgct gaacagctat gtgaccccca tctgcattgc tgacaaggag 1020

tacaccaaca tcttcctgaa gtttggctct ggctatgtgt ctggctgggg cagggtgttc 1080

cacaagggca ggtctgccct ggtgctgcag tacctgaggg tgcccctggt ggacagggcc 1140

acctgcctgt tgagcaccaa gttcaccatc tacaacaaca tgttctgtgc tggcttccat 1200

gaggggggca gggacagctg ccagggggac tctgggggcc cccatgtgac tgaggtggag 1260

ggcaccagct tcctgactgg catcatcagc tggggggagg agtgtgccat gaagggcaag 1320

tatggcatct acaccaaagt ctccagatat gtgaactgga tcaaggagaa gaccaagctg 1380

acctga 1386

<210> 12

<211> 1386

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 12

atgcagaggg tgaacatgat catggctgag agccctggcc tgatcaccat ctgcctgctg 60

ggctacctgc tgtctgctga gtgcactgtg ttcctggacc atgagaatgc caacaagatc 120

ctgaacaggc ccaagagata caactctggc aagctggagg agtttgtgca gggcaacctg 180

gagagggagt gcatggagga gaagtgcagc tttgaggagg ccagggaggt gtttgagaac 240

actgagagga ccactgagtt ctggaagcag tatgtggatg gggaccagtg tgagagcaac 300

ccctgcctga atgggggcag ctgcaaggat gacatcaaca gctatgagtg ctggtgcccc 360

tttggctttg agggcaagaa ctgtgagctg gatgtgacct gcaacatcaa gaatggcaga 420

tgtgagcagt tctgcaagaa ctctgctgac aacaaggtgg tgtgcagctg cactgagggc 480

tacaggctgg ctgagaacca gaagagctgt gagcctgctg tgccattccc atgtggcaga 540

gtgtctgtga gccagaccag caagctgacc agggctgagg ctgtgttccc tgatgtggac 600

tatgtgaaca gcactgaggc tgaaaccatc ctggacaaca tcacccagag cacccagagc 660

ttcaatgact tcaccagggt ggtggggggg gaggatgcca agcctggcca gttcccctgg 720

caagtggtgc tgaatggcaa ggtggatgcc ttctgtgggg gcagcattgt gaatgagaag 780

tggattgtga ctgctgccca ctgtgtggag actggggtga agatcactgt ggtggctggg 840

gagcacaaca ttgaggagac tgagcacact gagcagaaga ggaatgtgat caggatcatc 900

ccccaccaca actacaatgc tgccatcaac aagtacaacc atgacattgc cctgctggag 960

ctggatgagc ccctggtgct gaacagctat gtgaccccca tctgcattgc tgacaaggag 1020

tacaccaaca tcttcctgaa gtttggctct ggctatgtgt ctggctgggg cagggtgttc 1080

cacaagggca ggtctgccct ggtgctgcag tacctgaggg tgcccctggt ggacagggcc 1140

acctgcctga ggagcaccaa gttcaccatc tacaacaaca tgttctgtgc tggcttccat 1200

gaggggggca gggacagctg ccagggggac tctgggggcc cccatgtgac tgaggtggag 1260

ggcaccagct tcctgactgg catcatcagc tggggggagg agtgtgccat gaagggcaag 1320

tatggcatct acaccaaagt ctccagatat gtgaactgga tcaaggagaa gaccaagctg 1380

acctga 1386

<210> 13

<211> 117

<212> DNA

<213> 人工序列

<220>

<223> 合成增强子元件

<400> 13

ccctaaaatg ggcaaacatt gcaagcagca aacagcaaac acacagccct ccctgcctgc 60

tgaccttgga gctggggcag aggtcagaca cctctctggg cccatgccac ctccaac 117

<210> 14

<211> 185

<212> DNA

<213> 人工序列

<220>

<223> 合成启动子元件

<400> 14

gggcgactca gatcccagcc agtggactta gcccctgttt gctcctccga taactggggt 60

gaccttggtt aatattcacc agcagcctcc cccgttgccc ctctggatcc actgcttaaa 120

tacggacgag gacagggccc tgtctcctca gcttcaggca ccaccactga cctgggacag 180

tgaat 185

<210> 15

<211> 195

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 15

atgcagcgcg tgaacatgat catggcagaa tcaccaggcc tcatcaccat ctgcctttta 60

ggatatctac tcagtgctga atgtacagtt tttcttgatc atgaaaacgc caacaaaatt 120

ctgaatcggc caaagaggta taattcaggt aaattggaag agtttgttca agggaacctt 180

gagagagaat gtatg 195

<210> 16

<211> 461

<212> PRT

<213> 智人

<400> 16

Met Gln Arg Val Asn Met Ile Met Ala Glu Ser Pro Gly Leu Ile Thr

1 5 10 15

Ile Cys Leu Leu Gly Tyr Leu Leu Ser Ala Glu Cys Thr Val Phe Leu

20 25 30

Asp His Glu Asn Ala Asn Lys Ile Leu Asn Arg Pro Lys Arg Tyr Asn

35 40 45

Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg Glu Cys

50 55 60

Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe Glu Asn

65 70 75 80

Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly Asp Gln

85 90 95

Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp Asp Ile

100 105 110

Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys Asn Cys

115 120 125

Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu Gln Phe

130 135 140

Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr Glu Gly

145 150 155 160

Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val Pro Phe

165 170 175

Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr Arg Ala

180 185 190

Glu Ala Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu Ala Glu

195 200 205

Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn Asp Phe

210 215 220

Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe Pro Trp

225 230 235 240

Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly Ser Ile

245 250 255

Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu Thr Gly

260 265 270

Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu Thr Glu

275 280 285

His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His His Asn

290 295 300

Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu Leu Glu

305 310 315 320

Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile Cys Ile

325 330 335

Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser Gly Tyr

340 345 350

Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala Leu Val

355 360 365

Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys Leu Leu

370 375 380

Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly Phe His

385 390 395 400

Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro His Val

405 410 415

Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser Trp Gly

420 425 430

Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys Val Ser

435 440 445

Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr

450 455 460

<210> 17

<211> 724

<212> PRT

<213> 腺相关病毒5

<400> 17

Met Ser Phe Val Asp His Pro Pro Asp Trp Leu Glu Glu Val Gly Glu

1 5 10 15

Gly Leu Arg Glu Phe Leu Gly Leu Glu Ala Gly Pro Pro Lys Pro Lys

20 25 30

Pro Asn Gln Gln His Gln Asp Gln Ala Arg Gly Leu Val Leu Pro Gly

35 40 45

Tyr Asn Tyr Leu Gly Pro Gly Asn Gly Leu Asp Arg Gly Glu Pro Val

50 55 60

Asn Arg Ala Asp Glu Val Ala Arg Glu His Asp Ile Ser Tyr Asn Glu

65 70 75 80

Gln Leu Glu Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp

85 90 95

Ala Glu Phe Gln Glu Lys Leu Ala Asp Asp Thr Ser Phe Gly Gly Asn

100 105 110

Leu Gly Lys Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro Phe

115 120 125

Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Thr Gly Lys Arg Ile

130 135 140

Asp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp Ser

145 150 155 160

Lys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser Gln

165 170 175

Gln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp Thr

180 185 190

Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly Ala

195 200 205

Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr Trp

210 215 220

Met Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu Pro

225 230 235 240

Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val Asp

245 250 255

Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr

260 265 270

Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp Gln

275 280 285

Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg Val

290 295 300

Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser Thr

305 310 315 320

Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp

325 330 335

Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly Cys

340 345 350

Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly Tyr

355 360 365

Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser Ser

370 375 380

Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly Asn

385 390 395 400

Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser Ser

405 410 415

Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val Asp

420 425 430

Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val Gln

435 440 445

Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn Trp

450 455 460

Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser Gly

465 470 475 480

Val Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met Glu

485 490 495

Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met Thr

500 505 510

Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met Ile

515 520 525

Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu Glu

530 535 540

Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn Arg

545 550 555 560

Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser Ser

565 570 575

Thr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val Pro

580 585 590

Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp

595 600 605

Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala Met

610 615 620

Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys Asn

625 630 635 640

Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val Ser

645 650 655

Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met Glu

660 665 670

Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln

675 680 685

Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro Asp

690 695 700

Ser Thr Gly Glu Tyr Arg Thr Thr Arg Pro Ile Gly Thr Arg Tyr Leu

705 710 715 720

Thr Arg Pro Leu

<210> 18

<211> 1685

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 18

atgcagcgcg tgaacatgat catggcagaa tcaccaggcc tcatcaccat ctgcctttta 60

ggatatctac tcagtgctga atgtacaggt ttgtttcctt ttttaaaata cattgagtat 120

gcttgccttt tagatataga aatatctgat gctgtcttct tcactaaatt ttgattacat 180

gatttgacag caatattgaa gagtctaaca gccagcacgc aggttggtaa gtactgtggg 240

aacatcacag attttggctc catgccctaa agagaaattg gctttcagat tatttggatt 300

aaaaacaaag actttcttaa gagatgtaaa attttcatga tgttttcttt tttgctaaaa 360

ctaaagaatt attcttttac atttcagttt ttcttgatca tgaaaacgcc aacaaaattc 420

tgaatcggcc aaagaggtat aattcaggta aattggaaga gtttgttcaa gggaaccttg 480

agagagaatg tatggaggag aagtgttctt tcgaggaggc gagagaggtt ttcgagaata 540

ctgagcgaac aaccgaattc tggaaacaat atgtggatgg cgaccaatgt gaatctaatc 600

cctgcctcaa cggtggctca tgcaaagacg atatcaacag ctacgagtgt tggtgcccct 660

ttggtttcga gggaaagaat tgcgagcttg atgtaacctg taacattaag aatgggcgct 720

gcgaacagtt ttgcaagaac agcgccgaca ataaggtcgt ctgcagttgt accgaaggct 780

ataggcttgc agagaatcag aagagttgcg agcctgctgt gccgttccca tgtggcagag 840

tcagtgtgtc ccaaactagc aagctgacaa gagcagaagc cgttttcccc gatgtggact 900

acgtgaattc cactgaagcc gaaacgatcc tggacaatat cacacagagc actcagtctt 960

tcaacgactt cacacgggtt gtgggaggag aggacgccaa acccggccag tttccttggc 1020

aagtcgttct taacggcaag gtcgacgcct tttgtggagg gagtattgtg aacgagaaat 1080

ggattgtcac cgctgctcat tgtgttgaaa ctggggtgaa aatcactgtt gtcgcaggag 1140

agcacaatat cgaagagaca gaacacaccg agcagaaacg caacgttatt cggatcattc 1200

cacatcacaa ctacaatgct gccatcaaca agtacaacca cgacattgcg ctgctggagt 1260

tggatgaacc tctcgtgctc aactcctatg tgaccccaat ctgcatagca gataaggagt 1320

ataccaacat cttcctgaag tttgggtcag gttatgtgtc aggctgggga cgagtgtttc 1380

ataaagggag atcagcactg gtgttgcagt atctgcgcgt accactggtg gatcgggcta 1440

cttgcctgct aagcacaaaa ttcaccatct acaacaacat gttttgtgcc ggttttcacg 1500

aaggcggcag ggacagctgt cagggagatt ccggagggcc tcatgtcaca gaggtcgagg 1560

gcacctcctt tctcactggg attataagct ggggagaaga atgcgccatg aaagggaagt 1620

acggcatata cacgaaagtg tctagatacg tgaattggat taaggaaaag accaaactga 1680

cgtga 1685

<210> 19

<211> 1248

<212> DNA

<213> 智人

<400> 19

tataattcag gtaaattgga agagtttgtt caagggaacc ttgagagaga atgtatggaa 60

gaaaagtgta gttttgaaga agcacgagaa gtttttgaaa acactgaaag aacaactgaa 120

ttttggaagc agtatgttga tggagatcag tgtgagtcca atccatgttt aaatggcggc 180

agttgcaagg atgacattaa ttcctatgaa tgttggtgtc cctttggatt tgaaggaaag 240

aactgtgaat tagatgtaac atgtaacatt aagaatggca gatgcgagca gttttgtaaa 300

aatagtgctg ataacaaggt ggtttgctcc tgtactgagg gatatcgact tgcagaaaac 360

cagaagtcct gtgaaccagc agtgccattt ccatgtggaa gagtttctgt ttcacaaact 420

tctaagctca cccgtgctga ggctgttttt cctgatgtgg actatgtaaa ttctactgaa 480

gctgaaacca ttttggataa catcactcaa agcacccaat catttaatga cttcactcgg 540

gttgttggtg gagaagatgc caaaccaggt caattccctt ggcaggttgt tttgaatggt 600

aaagttgatg cattctgtgg aggctctatc gttaatgaaa aatggattgt aactgctgcc 660

cactgtgttg aaactggtgt taaaattaca gttgtcgcag gtgaacataa tattgaggag 720

acagaacata cagagcaaaa gcgaaatgtg attcgaatta ttcctcacca caactacaat 780

gcagctatta ataagtacaa ccatgacatt gcccttctgg aactggacga acccttagtg 840

ctaaacagct acgttacacc tatttgcatt gctgacaagg aatacacgaa catcttcctc 900

aaatttggat ctggctatgt aagtggctgg ggaagagtct tccacaaagg gagatcagct 960

ttagttcttc agtaccttag agttccactt gttgaccgag ccacatgtct tcgatctaca 1020

aagttcacca tctataacaa catgttctgt gctggcttcc atgaaggagg tagagattca 1080

tgtcaaggag atagtggggg accccatgtt actgaagtgg aagggaccag tttcttaact 1140

ggaattatta gctggggtga agagtgtgca atgaaaggca aatatggaat atataccaag 1200

gtatcccggt atgtcaactg gattaaggaa aaaacaaagc tcacttaa 1248

<210> 20

<211> 724

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 20

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Glu Val Gly Glu

1 5 10 15

Gly Leu Arg Glu Phe Leu Gly Leu Glu Ala Gly Pro Pro Lys Pro Lys

20 25 30

Pro Asn Gln Gln His Gln Asp Gln Ala Arg Gly Leu Val Leu Pro Gly

35 40 45

Tyr Asn Tyr Leu Gly Pro Gly Asn Gly Leu Asp Arg Gly Glu Pro Val

50 55 60

Asn Arg Ala Asp Glu Val Ala Arg Glu His Asp Ile Ser Tyr Asn Glu

65 70 75 80

Gln Leu Glu Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala Asp

85 90 95

Ala Glu Phe Gln Glu Lys Leu Ala Asp Asp Thr Ser Phe Gly Gly Asn

100 105 110

Leu Gly Lys Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro Phe

115 120 125

Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Thr Gly Lys Arg Ile

130 135 140

Asp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp Ser

145 150 155 160

Lys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser Gln

165 170 175

Gln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp Thr

180 185 190

Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly Ala

195 200 205

Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr Trp

210 215 220

Met Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu Pro

225 230 235 240

Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val Asp

245 250 255

Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr

260 265 270

Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp Gln

275 280 285

Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg Val

290 295 300

Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser Thr

305 310 315 320

Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp

325 330 335

Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly Cys

340 345 350

Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly Tyr

355 360 365

Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser Ser

370 375 380

Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly Asn

385 390 395 400

Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser Ser

405 410 415

Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val Asp

420 425 430

Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val Gln

435 440 445

Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn Trp

450 455 460

Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser Gly

465 470 475 480

Val Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met Glu

485 490 495

Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met Thr

500 505 510

Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met Ile

515 520 525

Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu Glu

530 535 540

Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn Arg

545 550 555 560

Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser Ser

565 570 575

Thr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val Pro

580 585 590

Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp

595 600 605

Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala Met

610 615 620

Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys Asn

625 630 635 640

Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val Ser

645 650 655

Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met Glu

660 665 670

Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln

675 680 685

Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro Asp

690 695 700

Ser Thr Gly Glu Tyr Arg Thr Thr Arg Pro Ile Gly Thr Arg Tyr Leu

705 710 715 720

Thr Arg Pro Leu

<210> 21

<211> 725

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 21

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser

1 5 10 15

Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro

20 25 30

Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Asn Tyr Leu Gly Pro Gly Asn Gly Leu Asp Arg Gly Glu Pro

50 55 60

Val Asn Arg Ala Asp Glu Val Ala Arg Glu His Asp Ile Ser Tyr Asn

65 70 75 80

Glu Gln Leu Glu Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Lys Leu Ala Asp Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Lys Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro

115 120 125

Phe Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Thr Gly Lys Arg

130 135 140

Ile Asp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp

145 150 155 160

Ser Lys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser

165 170 175

Gln Gln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp

180 185 190

Thr Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly

195 200 205

Ala Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr

210 215 220

Trp Met Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu

225 230 235 240

Pro Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val

245 250 255

Asp Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly

260 265 270

Tyr Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp

275 280 285

Gln Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg

290 295 300

Val Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser

305 310 315 320

Thr Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr

325 330 335

Asp Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly

340 345 350

Cys Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly

355 360 365

Tyr Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser

370 375 380

Ser Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly

385 390 395 400

Asn Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser

405 410 415

Ser Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val

420 425 430

Asp Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val

435 440 445

Gln Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn

450 455 460

Trp Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser

465 470 475 480

Gly Val Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met

485 490 495

Glu Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met

500 505 510

Thr Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met

515 520 525

Ile Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu

530 535 540

Glu Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn

545 550 555 560

Arg Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser

565 570 575

Ser Thr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val

580 585 590

Pro Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile

595 600 605

Trp Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala

610 615 620

Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys

625 630 635 640

Asn Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val

645 650 655

Ser Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met

660 665 670

Glu Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile

675 680 685

Gln Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro

690 695 700

Asp Ser Thr Gly Glu Tyr Arg Thr Thr Arg Pro Ile Gly Thr Arg Tyr

705 710 715 720

Leu Thr Arg Pro Leu

725

<210> 22

<211> 725

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 22

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser

1 5 10 15

Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro

20 25 30

Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Arg Ala Asp Glu Val Ala Arg Glu His Asp Ile Ser Tyr Asn

65 70 75 80

Glu Gln Leu Glu Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Lys Leu Ala Asp Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Lys Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro

115 120 125

Phe Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Thr Gly Lys Arg

130 135 140

Ile Asp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp

145 150 155 160

Ser Lys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser

165 170 175

Gln Gln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp

180 185 190

Thr Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly

195 200 205

Ala Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr

210 215 220

Trp Met Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu

225 230 235 240

Pro Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val

245 250 255

Asp Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly

260 265 270

Tyr Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp

275 280 285

Gln Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg

290 295 300

Val Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser

305 310 315 320

Thr Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr

325 330 335

Asp Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly

340 345 350

Cys Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly

355 360 365

Tyr Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser

370 375 380

Ser Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly

385 390 395 400

Asn Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser

405 410 415

Ser Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val

420 425 430

Asp Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val

435 440 445

Gln Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn

450 455 460

Trp Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser

465 470 475 480

Gly Val Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met

485 490 495

Glu Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met

500 505 510

Thr Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met

515 520 525

Ile Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu

530 535 540

Glu Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn

545 550 555 560

Arg Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser

565 570 575

Ser Thr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val

580 585 590

Pro Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile

595 600 605

Trp Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala

610 615 620

Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys

625 630 635 640

Asn Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val

645 650 655

Ser Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met

660 665 670

Glu Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile

675 680 685

Gln Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro

690 695 700

Asp Ser Thr Gly Glu Tyr Arg Thr Thr Arg Pro Ile Gly Thr Arg Tyr

705 710 715 720

Leu Thr Arg Pro Leu

725

<210> 23

<211> 725

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 23

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser

1 5 10 15

Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro

20 25 30

Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Lys Leu Ala Asp Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Lys Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro

115 120 125

Phe Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Thr Gly Lys Arg

130 135 140

Ile Asp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp

145 150 155 160

Ser Lys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser

165 170 175

Gln Gln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp

180 185 190

Thr Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly

195 200 205

Ala Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr

210 215 220

Trp Met Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu

225 230 235 240

Pro Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val

245 250 255

Asp Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly

260 265 270

Tyr Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp

275 280 285

Gln Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg

290 295 300

Val Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser

305 310 315 320

Thr Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr

325 330 335

Asp Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly

340 345 350

Cys Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly

355 360 365

Tyr Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser

370 375 380

Ser Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly

385 390 395 400

Asn Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser

405 410 415

Ser Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val

420 425 430

Asp Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val

435 440 445

Gln Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn

450 455 460

Trp Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser

465 470 475 480

Gly Val Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met

485 490 495

Glu Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met

500 505 510

Thr Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met

515 520 525

Ile Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu

530 535 540

Glu Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn

545 550 555 560

Arg Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser

565 570 575

Ser Thr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val

580 585 590

Pro Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile

595 600 605

Trp Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala

610 615 620

Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys

625 630 635 640

Asn Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val

645 650 655

Ser Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met

660 665 670

Glu Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile

675 680 685

Gln Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro

690 695 700

Asp Ser Thr Gly Glu Tyr Arg Thr Thr Arg Pro Ile Gly Thr Arg Tyr

705 710 715 720

Leu Thr Arg Pro Leu

725

<210> 24

<211> 725

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 24

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser

1 5 10 15

Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro

20 25 30

Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro

115 120 125

Phe Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Thr Gly Lys Arg

130 135 140

Ile Asp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp

145 150 155 160

Ser Lys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser

165 170 175

Gln Gln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp

180 185 190

Thr Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly

195 200 205

Ala Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr

210 215 220

Trp Met Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu

225 230 235 240

Pro Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val

245 250 255

Asp Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly

260 265 270

Tyr Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp

275 280 285

Gln Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg

290 295 300

Val Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser

305 310 315 320

Thr Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr

325 330 335

Asp Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly

340 345 350

Cys Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly

355 360 365

Tyr Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser

370 375 380

Ser Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly

385 390 395 400

Asn Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser

405 410 415

Ser Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val

420 425 430

Asp Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val

435 440 445

Gln Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn

450 455 460

Trp Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser

465 470 475 480

Gly Val Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met

485 490 495

Glu Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met

500 505 510

Thr Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met

515 520 525

Ile Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu

530 535 540

Glu Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn

545 550 555 560

Arg Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser

565 570 575

Ser Thr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val

580 585 590

Pro Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile

595 600 605

Trp Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala

610 615 620

Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys

625 630 635 640

Asn Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val

645 650 655

Ser Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met

660 665 670

Glu Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile

675 680 685

Gln Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro

690 695 700

Asp Ser Thr Gly Glu Tyr Arg Thr Thr Arg Pro Ile Gly Thr Arg Tyr

705 710 715 720

Leu Thr Arg Pro Leu

725

<210> 25

<211> 725

<212> PRT

<213> 人工序列

<220>

<223> 合成多肽

<400> 25

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser

1 5 10 15

Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro

20 25 30

Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Thr Gly Lys Arg

130 135 140

Ile Asp Asp His Phe Pro Lys Arg Lys Lys Ala Arg Thr Glu Glu Asp

145 150 155 160

Ser Lys Pro Ser Thr Ser Ser Asp Ala Glu Ala Gly Pro Ser Gly Ser

165 170 175

Gln Gln Leu Gln Ile Pro Ala Gln Pro Ala Ser Ser Leu Gly Ala Asp

180 185 190

Thr Met Ser Ala Gly Gly Gly Gly Pro Leu Gly Asp Asn Asn Gln Gly

195 200 205

Ala Asp Gly Val Gly Asn Ala Ser Gly Asp Trp His Cys Asp Ser Thr

210 215 220

Trp Met Gly Asp Arg Val Val Thr Lys Ser Thr Arg Thr Trp Val Leu

225 230 235 240

Pro Ser Tyr Asn Asn His Gln Tyr Arg Glu Ile Lys Ser Gly Ser Val

245 250 255

Asp Gly Ser Asn Ala Asn Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly

260 265 270

Tyr Phe Asp Phe Asn Arg Phe His Ser His Trp Ser Pro Arg Asp Trp

275 280 285

Gln Arg Leu Ile Asn Asn Tyr Trp Gly Phe Arg Pro Arg Ser Leu Arg

290 295 300

Val Lys Ile Phe Asn Ile Gln Val Lys Glu Val Thr Val Gln Asp Ser

305 310 315 320

Thr Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Thr

325 330 335

Asp Asp Asp Tyr Gln Leu Pro Tyr Val Val Gly Asn Gly Thr Glu Gly

340 345 350

Cys Leu Pro Ala Phe Pro Pro Gln Val Phe Thr Leu Pro Gln Tyr Gly

355 360 365

Tyr Ala Thr Leu Asn Arg Asp Asn Thr Glu Asn Pro Thr Glu Arg Ser

370 375 380

Ser Phe Phe Cys Leu Glu Tyr Phe Pro Ser Lys Met Leu Arg Thr Gly

385 390 395 400

Asn Asn Phe Glu Phe Thr Tyr Asn Phe Glu Glu Val Pro Phe His Ser

405 410 415

Ser Phe Ala Pro Ser Gln Asn Leu Phe Lys Leu Ala Asn Pro Leu Val

420 425 430

Asp Gln Tyr Leu Tyr Arg Phe Val Ser Thr Asn Asn Thr Gly Gly Val

435 440 445

Gln Phe Asn Lys Asn Leu Ala Gly Arg Tyr Ala Asn Thr Tyr Lys Asn

450 455 460

Trp Phe Pro Gly Pro Met Gly Arg Thr Gln Gly Trp Asn Leu Gly Ser

465 470 475 480

Gly Val Asn Arg Ala Ser Val Ser Ala Phe Ala Thr Thr Asn Arg Met

485 490 495

Glu Leu Glu Gly Ala Ser Tyr Gln Val Pro Pro Gln Pro Asn Gly Met

500 505 510

Thr Asn Asn Leu Gln Gly Ser Asn Thr Tyr Ala Leu Glu Asn Thr Met

515 520 525

Ile Phe Asn Ser Gln Pro Ala Asn Pro Gly Thr Thr Ala Thr Tyr Leu

530 535 540

Glu Gly Asn Met Leu Ile Thr Ser Glu Ser Glu Thr Gln Pro Val Asn

545 550 555 560

Arg Val Ala Tyr Asn Val Gly Gly Gln Met Ala Thr Asn Asn Gln Ser

565 570 575

Ser Thr Thr Ala Pro Ala Thr Gly Thr Tyr Asn Leu Gln Glu Ile Val

580 585 590

Pro Gly Ser Val Trp Met Glu Arg Asp Val Tyr Leu Gln Gly Pro Ile

595 600 605

Trp Ala Lys Ile Pro Glu Thr Gly Ala His Phe His Pro Ser Pro Ala

610 615 620

Met Gly Gly Phe Gly Leu Lys His Pro Pro Pro Met Met Leu Ile Lys

625 630 635 640

Asn Thr Pro Val Pro Gly Asn Ile Thr Ser Phe Ser Asp Val Pro Val

645 650 655

Ser Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Thr Val Glu Met

660 665 670

Glu Trp Glu Leu Lys Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile

675 680 685

Gln Tyr Thr Asn Asn Tyr Asn Asp Pro Gln Phe Val Asp Phe Ala Pro

690 695 700

Asp Ser Thr Gly Glu Tyr Arg Thr Thr Arg Pro Ile Gly Thr Arg Tyr

705 710 715 720

Leu Thr Arg Pro Leu

725

<210> 26

<211> 1386

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 26

atgcagaggg tgaacatgat catggctgag agccctggcc tgatcaccat ctgcctgctg 60

ggctacctgc tgtctgctga gtgcactgtg ttcctggacc atgagaatgc caacaagatc 120

ctgaacaggc ccaagagata caactctggc aagctggagg agtttgtgca gggcaacctg 180

gagagggagt gcatggagga gaagtgcagc tttgaggagg ccagggaggt gtttgagaac 240

actgagagga ccactgagtt ctggaagcag tatgtggatg gggaccagtg tgagagcaac 300

ccctgcctga atgggggcag ctgcaaggat gacatcaaca gctatgagtg ctggtgcccc 360

tttggctttg agggcaagaa ctgtgagctg gatgtgacct gcaacatcaa gaatggcaga 420

tgtgagcagt tctgcaagaa ctctgctgac aacaaggtgg tgtgcagctg cactgagggc 480

tacaggctgg ctgagaacca gaagagctgt gagcctgctg tgccattccc atgtggcaga 540

gtgtctgtga gccagaccag caagctgacc agggctgagg ctgtgttccc tgatgtggac 600

tatgtgaaca gcactgaggc tgaaaccatc ctggacaaca tcacccagag cacccagagc 660

ttcaatgact tcaccagggt ggtggggggg gaggatgcca agcctggcca gttcccctgg 720

caagtggtgc tgaatggcaa ggtggatgcc ttctgtgggg gcagcattgt gaatgagaag 780

tggattgtga ctgctgccca ctgtgtggag actggggtga agatcactgt ggtggctggg 840

gagcacaaca ttgaggagac tgagcacact gagcagaaga ggaatgtgat caggatcatc 900

ccccaccaca actacaatgc tgccatcaac aagtacaacc atgacattgc cctgctggag 960

ctggatgagc ccctggtgct gaacagctat gtgaccccca tctgcattgc tgacaaggag 1020

tacaccaaca tcttcctgaa gtttggctct ggctatgtgt ctggctgggg cagggtgttc 1080

cacaagggca ggtctgccct ggtgctgcag tacctgaggg tgcccctggt ggacagggcc 1140

acctgcctgc tgagcaccaa gttcaccatc tacaacaaca tgttctgtgc tggcttccat 1200

gaggggggca gggacagctg ccagggggac tctgggggcc cccatgtgac tgaggtggag 1260

ggcaccagct tcctgactgg catcatcagc tggggggagg agtgtgccat gaagggcaag 1320

tatggcatct acaccaaagt ctccagatat gtgaactgga tcaaggagaa gaccaagctg 1380

acctga 1386

Claims

1.一种包含因子IX核苷酸序列的多核苷酸，其中：

(i)因子IX核苷酸序列包含编码因子IX蛋白或其片段的编码序列；

(ii)编码序列的一部分是经密码子优化的；

(iii)经密码子优化的编码序列的部分的长度为至少1100个核苷酸；

(iv)在经密码子优化的部分中，至少60％的密码子选自TTC、CTG、ATC、GTG、GTC、AGC、CCC、ACC、GCC、TAC、CAC、CAG、AAC、AAA、AAG、GAC、TGC、AGG、GGC和GAG；

(v)与SEQ ID NO：9的相应部分相比，经密码子优化的部分包含减少数量的CpG；

(vi)所述多核苷酸还包含转录调节元件，所述转录调节元件包含：

(a)A1AT启动子或A1AT启动子的片段；和/或

(b)HCR增强子或HCR增强子的片段；和

(vii)因子IX核苷酸序列在对应于野生型因子IX的位置384的位置处包含编码亮氨酸的密码子。

2.前述权利要求的多核苷酸，其中经密码子优化的编码序列的部分是经密码子优化以用于在人肝中表达。

3.前述权利要求中任一项的多核苷酸，其中：

(i)由因子IX核苷酸序列编码的多肽在人肝细胞中以与参考野生型因子IX核苷酸序列相比更高的水平表达；和/或

(ii)经密码子优化的编码序列的部分的长度为至少800、至少900、至少1100、少于1500、少于1300、少于1200、800至1500、900至1300、1100至1200或约1191个核苷酸；和/或

(iii)经密码子优化的编码序列的部分包含以下的1、2、3、4、5种或全部：

b)外显子4或外显子4的至少80、至少90、至少100、少于114、80至114、90至114或100至114的核苷酸的部分；

f)外显子8或外显子8的至少400、至少450、至少500、少于548、400至548、450至548或500至548个核苷酸的部分；和/或

(iv)经密码子优化的编码序列的部分包含外显子3的至少20个核苷酸的部分、外显子4的至少100个核苷酸的部分、外显子5的至少110个核苷酸的部分、外显子6的至少180个核苷酸、外显子7的至少100个核苷酸的部分和外显子8的至少500个核苷酸的部分；和/或

(v)经密码子优化的编码序列的部分包含外显子3、外显子4、外显子5、外显子6、外显子7和外显子8；和/或

(vi)经密码子优化的编码序列的部分包含外显子2的一部分，外显子2的该部分的长度为少于160、少于150、少于100、少于75、少于60、至少20、至少30、至少40、至少50、20至160、30至150、30至100、40至75或约56个核苷酸；和/或

(vii)经密码子优化的编码序列的部分包含长度为30至100个核苷酸的外显子2的一部分。

4.前述权利要求中任一项的多核苷酸，其中：

(i)经密码子优化的编码序列的部分包含少于40、少于20、少于18、少于10、少于5或少于1个CpG；和/或

(ii)经密码子优化的编码序列的部分不含CpG。

5.前述权利要求中任一项的多核苷酸，其中在经密码子优化的编码序列的部分中：

(i)a)与参考野生型因子IX序列相比，至少1、至少2、至少4或至少5个编码苯丙氨酸的密码子被TTC取代；

d)编码苯丙氨酸的密码子是TTC，除非下一个密码子以G开头；和/或

(ii)a)与参考野生型因子IX序列相比，至少5、至少10、至少15或至少16个编码亮氨酸的密码子被CTG取代；

b)至少90％或至少94％的编码亮氨酸的密码子是CTG；和/或

c)至少90％或至少94％的编码亮氨酸的密码子是CTG，其余是CTC；和/或

(iii)a)与参考野生型因子IX序列相比，至少5、至少10、至少11或至少12个编码异亮氨酸的密码子被ATC取代；

e)编码异亮氨酸的密码子是ATC，除非下一个密码子以G开头；和/或

(iv)a)与参考野生型因子IX序列相比，至少10、至少15、至少20或至少25个编码缬氨酸的密码子被GTG取代；

d)至少80％、至少90％或至少95％的编码缬氨酸的密码子是GTG，其余是GTC；和/或

(v)a)与参考野生型因子IX序列相比，至少5、至少10、至少12或至少13个编码丝氨酸的密码子被AGC取代；

d)至少60％、至少65％或至少70％的编码丝氨酸的密码子是AGC，其余是TCT或TCC；和/或

(vi)a)与参考野生型因子IX序列相比，至少1、至少2或至少5个编码脯氨酸的密码子被CCC取代；

e)编码脯氨酸的密码子是CCC，除非下一个密码子以G开头；和/或

(vii)a)与参考野生型因子IX序列相比，至少6、至少7、至少8或至少10个编码苏氨酸的密码子被ACC取代；

e)编码苏氨酸的密码子是ACC，除非下一个密码子以G开头；和/或

(viii)a)与参考野生型因子IX序列相比，至少1、至少2、至少3或至少4个编码丙氨酸的密码子被GCC取代；

e)编码丙氨酸的密码子是GCC，除非下一个密码子以G开头；和/或

(ix)a)与参考野生型因子IX序列相比，至少1或至少2个编码酪氨酸的密码子被TAC取代；

e)编码酪氨酸的密码子是TAC，除非下一个密码子以G开头；和/或

(x)a)与参考野生型因子IX序列相比，至少1个编码组氨酸的密码子被CAC取代；

d)编码组氨酸的密码子是CAC，除非下一个密码子以G开头；和/或

(xi)a)与参考野生型因子IX序列相比，至少1、至少2、至少4或至少5个编码谷氨酰胺的密码子被CAG取代；

d)至少80％、至少85％或至少90％的编码谷氨酰胺的密码子是CAG，其余是CAA；和/或

(xii)a)与参考野生型因子IX序列相比，至少1、至少2、至少4或至少5个编码天冬酰胺的密码子被AAC取代；

e)编码天冬酰胺的密码子是AAC，除非下一个密码子以G开头；和/或

(xiii)a)与参考野生型因子IX序列相比，至少5、至少7、至少8或至少9个编码赖氨酸的密码子被AAG取代；

b)与参考野生型因子IX序列相比，至少1个AAG密码子被AAA取代；

d)至少80％、至少90％或至少95％的编码赖氨酸的密码子是AAG，其余的是AAA；和/或

(xiv)a)与参考野生型因子IX序列相比，至少1、至少2、至少3或至少4个编码天冬氨酸的密码子被GAC取代；

e)编码天冬氨酸的密码子是GAC，除非下一个密码子以G开头；和/或

(xv)a)与参考野生型因子IX序列相比，至少15、至少20、至少25或至少26个编码谷氨酸的密码子被GAG取代；

c)至少80％、至少90％或至少95％的编码谷氨酸的密码子是GAG和其余的是GAA；和/或

(xvi)a)与参考野生型因子IX序列相比，至少5、至少6、至少7或至少8个编码半胱氨酸的密码子被TGC取代；

e)编码半胱氨酸的密码子是TGC，除非下一个密码子以G开头；和/或

(xvii)编码色氨酸的密码子是TGG；和/或

(xviii)a)与参考野生型因子IX序列相比，至少5、至少8、至少10或至少11个编码精氨酸的密码子被AGG取代；

d)至少60％、至少70％或至少75％的编码精氨酸的密码子是AGG，其余是AGA；和/或

(xix)a)与参考野生型因子IX序列相比，至少5、至少10、至少12或至少13个编码甘氨酸的密码子被GGC取代；

b)与参考野生型因子IX序列相比，至少5、至少6、至少7或至少8个编码甘氨酸的密码子被GGG取代，其中下一个密码子以G开头；

e)编码甘氨酸的密码子是GGC，除非下一个密码子以G开头。

6.前述权利要求中任一项的多核苷酸，其中经密码子优化的编码序列的部分包含编码苯丙氨酸、亮氨酸、异亮氨酸、缬氨酸、丝氨酸、脯氨酸、苏氨酸、丙氨酸、酪氨酸、组氨酸、谷氨酰胺、天冬酰胺、赖氨酸、天冬氨酸、谷氨酸、半胱氨酸、色氨酸、精氨酸和甘氨酸的密码子，并且在密码子优化的部分中：

q)编码色氨酸的密码子是TGG；

7.前述权利要求中任一项的多核苷酸，其中经密码子优化的编码序列的部分包含编码苯丙氨酸、亮氨酸、异亮氨酸、缬氨酸、丝氨酸、脯氨酸、苏氨酸、丙氨酸、酪氨酸、组氨酸、谷氨酰胺、天冬酰胺、赖氨酸、天冬氨酸、谷氨酸、半胱氨酸、色氨酸、精氨酸和甘氨酸的密码子，并且在密码子优化的部分中：

a)至少70％的编码苯丙氨酸的密码子是TTC；

b)至少94％的编码亮氨酸的密码子是CTG；

c)至少75％的编码异亮氨酸的密码子是ATC；

d)至少95％的编码缬氨酸的密码子是GTG；

e)至少70％的编码丝氨酸的密码子是AGC；

f)至少60％的编码脯氨酸的密码子是CCC；

g)至少55％的编码苏氨酸的密码子是ACC；

h)至少43％的编码丙氨酸的密码子是GCC；

i)至少48％的编码酪氨酸的密码子是TAC；

j)至少65％的编码组氨酸的密码子是CAC；

k)至少90％的编码谷氨酰胺的密码子是CAG；

l)至少70％的编码天冬酰胺的密码子是AAC；

m)至少95％的编码赖氨酸的密码子是AAG；

n)至少60％的编码天冬氨酸的密码子是GAC；

o)至少95％的编码谷氨酸的密码子是GAG；

p)至少55％的编码半胱氨酸的密码子是TGC；

q)编码色氨酸的密码子是TGG；

r)至少75％的编码精氨酸的密码子是AGG；和

s)至少60％的编码甘氨酸的密码子是GGC。

8.前述权利要求中任一项的多核苷酸，其中经密码子优化的编码序列的部分包含编码苯丙氨酸、亮氨酸、异亮氨酸、缬氨酸、丝氨酸、脯氨酸、苏氨酸、丙氨酸、酪氨酸、组氨酸、谷氨酰胺、天冬酰胺、赖氨酸、天冬氨酸、谷氨酸、半胱氨酸、色氨酸、精氨酸和甘氨酸的密码子，并且在密码子优化的部分中：

a)至少70％的编码苯丙氨酸的密码子是TTC，其余是TTT；

b)至少94％的编码亮氨酸的密码子是CTG，其余是CTC；

c)至少75％的编码异亮氨酸的密码子是ATC，其余是ATT；

d)至少95％的编码缬氨酸的密码子是GTG；

e)至少70％的编码丝氨酸的密码子是AGC；

f)至少60％的编码脯氨酸的密码子是CCC，其余是CCA或CCT；

g)至少55％的编码苏氨酸的密码子是ACC，其余是ACT；

h)至少43％的编码丙氨酸的密码子是GCC，其余是GCT；

i)至少48％的编码酪氨酸的密码子是TAC，其余是TAT；

j)至少65％的编码组氨酸的密码子是CAC，其余的是CAT；

k)至少90％的编码谷氨酰胺的密码子是CAG，其余的是CAA；

l)至少70％的编码天冬酰胺的密码子是AAC，其余的是AAT；

m)至少95％的编码赖氨酸的密码子是AAG，其余的是AAA；

n)至少60％的编码天冬氨酸的密码子是GAC，其余是GAT；

o)至少95％的编码谷氨酸的密码子是GAG，其余的是GAA；

p)至少55％的编码半胱氨酸的密码子是TGC，其余的是TGT；

q)编码色氨酸的密码子是TGG；

r)至少75％的编码精氨酸的密码子是AGG，其余是AGA；和

s)至少60％的编码甘氨酸的密码子是GGC，其余是GGG。

9.权利要求4-8中任一项的多核苷酸，其中所述参考野生型因子IX序列是SEQ ID NO：9或SEQ ID NO：19。

10.前述权利要求中任一项的多核苷酸，其中所述转录调节元件包含肝脏特异性启动子。

11.前述权利要求中任一项的多核苷酸，其中A1AT启动子的片段是：

(i)至少100、至少120、至少150、至少180、少于255、100至255、150至225、150至300或180至255个核苷酸的长度；和/或

(ii)150至300个核苷酸的长度。

12.前述权利要求中任一项的多核苷酸，其中HCR增强子的片段是：

(i)至少80、至少90、至少100、少于192、80至192、90至192、100至250或117至192个核苷酸的长度；和/或

(ii)100至250个核苷酸的长度。

13.前述权利要求中任一项的多核苷酸，其中：

(i)转录调节元件与SEQ ID NO：6至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同；和/或

(ii)转录调节元件具有SEQ ID NO：6的序列。

14.前述权利要求中任一项的多核苷酸，其中：

(i)多核苷酸包含与SEQ ID NO：13至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的增强子；和/或

(ii)多核苷酸包含与SEQ ID NO：13至少98％、至少99％、至少99.5％、至少99.8％或100％相同的增强子；和/或

(iii)多核苷酸包含SEQ ID NO：13的增强子；和/或

(iv)多核苷酸包含与SEQ ID NO：14至少80％、至少85％、至少90％、至少95％、至少98％、至少99％、至少99.5％、至少99.8％或100％相同的启动子；和/或

(v)多核苷酸包含与SEQ ID NO：14至少98％、至少99％、至少99.5％、至少99.8％或100％相同的启动子；和/或

(vi)多核苷酸包含SEQ ID NO：14的启动子。

15.前述权利要求中任一项的多核苷酸，其中在对应于野生型因子IX的位置384的位置处编码氨基酸的密码子是CTX，其中X是任何核苷酸，任选地，其中X是C或G。

16.一种包含因子IX核苷酸序列的多核苷酸，其中所述因子IX核苷酸序列包含编码因子IX蛋白或其片段的编码序列，并且其中所述编码序列的一部分不是野生型的。

17.一种病毒颗粒，其包含重组基因组，所述重组基因组包含前述权利要求中任一项的多核苷酸。

18.权利要求17的病毒颗粒：

(i)其是AAV、腺病毒或慢病毒病毒颗粒；和/或

(ii)其是AAV病毒颗粒；和/或

(iii)其中所述重组基因组还包含：

a)AAV2 ITR；

b)多聚A序列；

c)复制起点；和/或

d)两个可分辨的ITR；和/或

(iv)其中所述重组基因组是单链的。

19.权利要求17或18的病毒颗粒，其中在转导到Huh7细胞中后，所述病毒颗粒表达具有比由包含SEQ ID NO：12的因子IX核苷酸序列和SEQ ID NO：7的转录调节元件的病毒颗粒表达的因子IX的活性更高的因子IX活性的因子IX蛋白或其片段。

20.前述权利要求中任一项的多核苷酸或病毒颗粒，其中所述因子IX片段的长度为至少200、至少250、至少300、200至415、250至415或300至415个氨基酸。

21.一种组合物，其包含前述权利要求中任一项的多核苷酸或病毒颗粒和药学上可接受的赋形剂。

22.前述权利要求中任一项的多核苷酸、病毒颗粒或组合物，其用于治疗方法。

23.根据权利要求22使用的多核苷酸、病毒颗粒或组合物，其中所述治疗方法包括向患者施用有效量的权利要求1-21中任一项的多核苷酸、病毒颗粒或组合物。

24.权利要求22或23的多核苷酸、病毒颗粒或组合物，其中：

(i)所述治疗方法是治疗血友病的方法；和/或

(ii)所述治疗方法是治疗B型血友病的方法；和/或

(iii)所述患者具有针对因子IX的抗体或抑制剂。

25.权利要求1-21中任一项的多核苷酸、病毒颗粒或组合物，其用于在患有B型血友病的患者中实现至少20％的稳定的因子IX活性水平，任选地，其中实现稳定的因子IX活性水平包括向患者施用权利要求1-21中任一项的多核苷酸、病毒颗粒或组合物。

26.权利要求1-21中任一项的多核苷酸、病毒颗粒或组合物，其用于治疗B型血友病，包括以在患者中有效地获得至少20％的稳定的因子IX活性水平的剂量向患者施用所述多核苷酸、病毒颗粒或组合物。

27.根据权利要求25或26使用的多核苷酸、病毒颗粒或组合物，其中：

(a)所述因子IX活性水平在所述多核苷酸、病毒颗粒或组合物施用的至少10周、至少15周、至少20周、至少30周、至少40周或至少50周后是稳定的；

(b)所述患者是使用具有比由包含(i)SEQ ID NO：4或5的因子IX核苷酸序列和(ii)SEQID NO：6的转录调节元件的病毒颗粒表达的因子IX的活性更低的活性的因子IX难治的患者；

(c)所述患者是使用以比由包含(i)SEQ ID NO：4或5的因子IX核苷酸序列和(ii)SEQID NO：6的转录调节元件的核苷酸序列编码的水平更低的水平表达的因子IX多肽难治的患者；

(d)以在患有B型血友病的患者中有效实现至少20％的稳定的因子IX活性水平的剂量施用所述多核苷酸、病毒颗粒或组合物；

(e)以至少4.5×10¹¹vg/kg的剂量，或少于5×10¹¹vg/kg的剂量，或4.5×10¹¹至1×10¹²vg/kg的剂量，或4.5×10¹¹vg/kg至4.9×10¹¹vg/kg的剂量施用所述多核苷酸、病毒颗粒或组合物，任选地，其中所述剂量是通过使用qPCR定量载体基因组的数量来确定的，任选地，其中qPCR使用结合启动子区域的引物，任选地，其中所述启动子区域是转基因盒的启动子区域；

(f)所施用的多核苷酸或病毒颗粒是由哺乳动物细胞产生的和/或具有因使用哺乳动物病毒载体生产细胞而产生并与昆虫病毒载体生产细胞(例如杆状病毒系统)中产生的载体区分开的特征；

(g)稳定的因子IX活性水平是至少25％或至少30％的稳定的因子IX活性水平，任选地，其中稳定的因子IX活性水平是至少35％的稳定的因子IX活性水平，任选地，其中稳定的因子IX活性水平是至少或约40％；

(h)在施用所述多核苷酸、病毒颗粒或组合物后至少50周或约52周的时间点，因子IX活性水平为至少20％，任选地，其中因子IX活性水平在紧接所述时间点之前至少40周的连续时间保持至少20％；

(i)在施用所述多核苷酸、病毒颗粒或组合物后至少50周或约52周的时间点，因子IX活性水平为至少25％，任选地，其中因子IX活性水平在紧接所述时间点之前至少40周的连续时间保持至少25％；

(j)在施用所述多核苷酸、病毒颗粒或组合物后至少50周或约52周的时间点，因子IX活性为至少或约40％，任选地，其中因子IX活性水平在紧接所述时间点之前至少40周的连续时间保持至少40％；

(k)使用凝血测定法测量因子IX活性以确定来自患者的血液样品中的因子IX活性，任选地，其中所述凝血测定法使用SynthASil^TM试剂盒；

(l)通过从患者采集血液样品并使用凝血测定法测量因子IX活性以确定血液样品中的因子IX活性，任选地，其中所述凝血测定法使用SynthASil^TM试剂盒；

(m)所述凝血测定法是一阶段凝血测定法，任选地，其中一阶段凝血测定法使用SynthASil^TM试剂盒；和/或

(n)所述用途包括类固醇的共同施用，任选地，其中所述类固醇是泼尼松龙。