CN117947041A

CN117947041A - 编码重组补体因子h多肽的核酸分子及用途

Info

Publication number: CN117947041A
Application number: CN202311406851.1A
Authority: CN
Inventors: 宁威; 曹其来; 姜军; 耿鹏; 理查德·伍兹; 梁帅怡; 廖成
Original assignee: Shanghai Ruihongdi Pharmaceutical Co ltd
Current assignee: Shanghai Ruihongdi Pharmaceutical Co ltd
Priority date: 2022-10-28
Filing date: 2023-10-27
Publication date: 2024-04-30

Abstract

本公开涉及编码重组补体因子H多肽的核酸分子及用途。具体而言，本公开涉及编码重组补体因子H多肽的核酸分子、载体、重组腺相关病毒载体、重组腺相关病毒颗粒、宿主细胞，包含核酸分子、载体、重组腺相关病毒载体或重组腺相关病毒颗粒的药物组合物，以及医药用途、治疗方法，重组腺相关病毒颗粒的制备方法。本公开中的核酸分子编码的重组补体因子H多肽具有补体调节活性，尤其涉及补体旁路途径调节活性。

Description

编码重组补体因子H多肽的核酸分子及用途

技术领域

本公开涉及编码重组补体因子H多肽的核酸分子及其用途，具体地，所述重组补体因子H多肽具有补体调节活性尤其是补体旁路途径调节活性。本公开还涉及编码重组补体因子H多肽的核酸分子、载体、重组腺相关病毒载体、重组腺相关病毒颗粒、宿主细胞、包含核酸分子、载体、重组腺相关病毒载体或重组腺相关病毒颗粒的药物组合物，以及医药用途、治疗方法，重组腺相关病毒颗粒的制备方法。

背景技术

补体是一种存在于人和脊椎动物血清及组织液中，可介导免疫应答和炎症反应的一种血清蛋白质。补体系统是由一系列约40种蛋白质分子组成，有着精密调控机制的蛋白质反应系统。补体系统的主要作用是参与外源病原体的定靶和清除，诱导与病原体相关的和调节的酶级联反应，一旦触发，就会以裂解结束并保护宿主参与免疫复合物和细胞碎片的排除以及增强细胞免疫，在多种自身免疫、炎症等疾病的病理学过程中扮演着十分重要的角色。

补体因子H(Complement Factor H，CFH)是一种含唾液酸的糖蛋白，在血浆中浓度很高(500μg/mL),在旁路途径中起着非常重要的作用。成熟的CFH有1213个氨基酸组成，约155kDa，参与了微生物防御、免疫复合物处理和细胞程序性死亡。CFH参与C3转移酶、C3b的裂解或取代B因子结合C3b，使C3b受到抑制，从而阻断替代途径，同时还作为Ⅰ因子的辅助因子促进Ⅰ因子降解C3b。CFH是一个由20个短同源重复序列(Short consensus repeats，SCR)构成的类似串珠状的结构,这些SCR按从N端到C端的顺序分别命名为SCR1至SCR20，每个SCR由约60个氨基酸组成，在空间结构上高度相似。CFH与固定在细胞表面的C3b结合后，能粘附到细胞表面，抑制C3bBb的形成。

许多疾病的发生与补体功能异常，特别是补体的过度激活有关。其中，年龄相关性黄斑变性(age-related macuLar degeneration，AMD)又称为老年性黄斑变性。AMD是视网膜最重要的中心区域黄斑区发生紧张性病变，导致中心视力的下降甚至丧失。AMD临床表现分为干性(非渗出性或萎缩性)和湿性(新生血管性或渗出性):干性AMD以脉络膜下玻璃膜疣沉积和地图状萎缩形成为主要特点，而湿性AMD则以脉络膜新生血管为突出特征。所有的AMD都是从干性开始的。有些人(约10％)继续发展为湿性AMD，大约85％的AMD患者只有干性AMD。更多的研究表明，CFH基因的突变与干性AMD密切相关，例如发生在第402号氨基酸上，即Y402H，这个突变不仅与AMD相关，也与早期黄斑病变有关。研究表明与湿性AMD相比，CFHY402H多态性与干性AMD有更强的相关性。CFH蛋白上402位酪氨酸变为组氨酸(Y402H)会导致带正电荷组氨酸取代疏水酪氨酸，从而影响CFH与肝素、C-反应蛋白(C-reactiveprotein,CRP)结合，降低CFH对C3b的亲和力，对补体系统激活的抑制减弱，导致补体成分C3b和C5b-9(膜攻击复合体)产生增多，C5b-9沉积于视网膜色素上皮细胞基底层，可导致黄斑区萎缩及血管内皮损伤，进而血管阻塞，进一步发展新生血管形成，AMD发生。(ToomeyC.,Rickman C.etc.Complement factor H in AMD:Bridging genetic associations andpathobiology.Progress in Retinal and Eye Research)

综上所述，由于CFH与补体相关的疾病的发生、发展密切相关，开发活性更强的CFH药物，从而针对性的治疗与补体相关的疾病，是目前亟需解决的重要问题。

发明内容

本公开提供了编码重组补体因子H多肽的核酸分子、载体、重组腺相关病毒载体、重组腺相关病毒(rAAV)颗粒、宿主细胞、药物组合物，及医药用途、治疗方法和制备方法。

重组补体因子H(CFH)多肽

在一方面，本公开提供了重组补体因子H多肽。在一些实施方案中，重组补体因子H多肽从N末端向C末端依次包括：第二结构域和第三结构域，所述第二结构域与所述第三结构域可操作地连接。

在一些实施方案中，本公开提供了一种重组补体因子H多肽，其从N末端向C末端依次包括第一结构域，与所述第一结构域可操作地连接的第二结构域，以及与所述第二结构域可操作地连接的第三结构域。

构成补体因子H(Complement Factor H，CFH)的短同源重复序列从N末端向C末端的顺序，依次被命名为SCR1～SCR20(SCR1、SCR2、SCR3、SCR4、SCR5、SCR6、SCR7、SCR8、SCR9、SCR10、SCR11、SCR12、SCR13、SCR14、SCR15、SCR16、SCR17、SCR18、SCR19、SCR20，如图1所示)，本公开中的第一结构域、第二结构域、第三结构域分别包括来自于SCR1～SCR20中的任意一个或多个SCR结构域。

在一些实施方案中，所述第一结构域包含来自补体因子H的短同源重复序列SCR1、SCR 2、SCR 3、SCR 4中的一个或任意2个、3个、4个SCR。一些具体实施方案中，所述第一结构域包含一个或多个(例如，2、3、4个)SCR1、和/或一个或多个(例如，2、3、4个)SCR2、和/或一个或多个(例如，2、3、4个)SCR3、和/或一个或多个(例如，2、3、4个)SCR4。

在一些具体实施方案中，所述第一结构域包括：

SCR1、SCR2、SCR3和SCR4中的任意1个；

SCR1和SCR2；

SCR1和SCR3；

SCR1和SCR4；

SCR2和SCR3；

SCR2和SCR4；

SCR3和SCR4；

SCR1、SCR2和SCR3(即，SCR(1-3))；

SCR1、SCR2和SCR4；

SCR1、SCR3和SCR4；

SCR2、SCR3和SCR4；或

SCR1、SCR2、SCR3和SCR4(即，SCR(1-4))。

在一些实施方案中，所述第二结构域包含来自补体因子H的短同源重复序列SCR17、SCR 18、SCR 19、SCR 20中的一个或任意2个、3个、4个SCR。一些具体实施方案中，所述第一结构域包含一个或多个(例如，2、3、4个)SCR17、和/或一个或多个(例如，2、3、4个)SCR18、和/或一个或多个(例如，2、3、4个)SCR19、和/或一个或多个(例如，2、3、4个)SCR20。

在一些具体实施方案中，所述第二结构域包括：

SCR17、SCR18、SCR19和SCR20中的任意1个；

SCR17和SCR18；

SCR17和SCR19；

SCR17和SCR20；

SCR18和SCR19；

SCR18和SCR20；

SCR19和SCR20(即，SCR(19-20))；

SCR17、SCR18和SCR19；

SCR17、SCR18和SCR20；

SCR17、SCR19和SCR20；

SCR18、SCR19和SCR20(即，SCR(18-20))；或

SCR17、SCR18、SCR19和SCR20(即，SCR(17-20))。

在一些实施方案中，所述第三结构域包含来自补体因子H的短同源重复序列SCR6、SCR7、SCR8中的一个或任意2个、3个SCR。一些具体实施方案中，所述第一结构域包含一个或多个(例如，2、3、4个)SCR6、和/或一个或多个(例如，2、3、4个)SCR7、和/或一个或多个(例如，2、3、4个)SCR8。

在一些具体实施方案中，所述第三结构域包括：

SCR6、SCR7、SCR8中的任意1个；

SCR6和SCR7(即，SCR(6-7))；

SCR6和SCR8；

SCR7和SCR8(即，SCR(7-8))；或

SCR6、SCR7和SCR8(即，SCR(6-8))。

在一些实施方案中，第一结构域选自如下1)-2)中的任一项或其任意组合：1)SCR(1-3)，2)SCR(1-4)。在一些具体的实施方案中，第一结构域为SCR(1-4)。

在一些实施方案中，第二结构域选自如下3)-5)中的任一项或其任意组合：3)SCR(17-20)，4)SCR(18-20)，5)SCR(19-20)。在一些具体的实施方案中，第二结构域为SCR(18-20)。

在一些实施方案中，第三结构域选自如下6)-9)中的任意一项或其任意组合：6)SCR7，7)SCR(6-7)，8)SCR(6-8)，9)SCR(7-8)。在一些具体的实施方案中，第三结构域为SCR(6-8)。

在一些具体的实施方案中，提供重组补体因子H多肽，包括如下任意一种的组合：

(1)SCR(1-4)，SCR(17-20)，和SCR7；

(2)SCR(1-4)，SCR(18-20)，和SCR7；

(3)SCR(1-4)，SCR(19-20)，和SCR7；

(4)SCR(1-4)，SCR(17-20)，和SCR(6-7)；

(5)SCR(1-4)，SCR(18-20)，和SCR(6-7)；

(6)SCR(1-4)，SCR(19-20)，和SCR(6-7)；

(7)SCR(1-4)，SCR(17-20)，和SCR(7-8)；

(8)SCR(1-4)，SCR(18-20)，和SCR(7-8)；

(9)SCR(1-4)，SCR(19-20)，和SCR(7-8)；

(10)SCR(1-4)，SCR(17-20)，和SCR(6-8)；

(11)SCR(1-4)，SCR(19-20)，和SCR(6-8)；

(12)SCR(1-3)，SCR(17-20)，和SCR7；

(13)SCR(1-3)，SCR(18-20)，和SCR7；

(14)SCR(1-3)，SCR(19-20)，和SCR7；

(15)SCR(1-3)，SCR(17-20)，和SCR(6-7)；

(16)SCR(1-3)，SCR(18-20)，和SCR(6-7)；

(17)SCR(1-3)，SCR(19-20)，和SCR(6-7)；

(18)SCR(1-3)，SCR(17-20)，和SCR(7-8)；

(19)SCR(1-3)，SCR(18-20)，和SCR(7-8)；

(20)SCR(1-3)，SCR(19-20)，和SCR(7-8)；

(21)SCR(1-3)，SCR(17-20)，和SCR(6-8)；

(22)SCR(1-3)，SCR(18-20)，和SCR(6-8)；

(23)SCR(1-3)，SCR(19-20)，和SCR(6-8)；

(24)SCR(1-4)，SCR(18-20)，和SCR(6-8)。

在一些具体的实施方案中，前述重组补体因子H多肽从N末端向C末端的方向包括：SCR(1-4)，与SCR(1-4)可操作地连接的SCR(18-20)，以及与SCR(18-20)可操作地连接的SCR(6-8)。

在本公开中，第一结构域、第二结构域和第三结构域选自天然来源的CFH彼此独立地为野生型CFH或其功能变体。相应地，构成第一结构域、第二结构域和第三结构域的每个SCR彼此独立地来自于野生型CFH或其功能变体。示例性地，CFH的功能变体包括但不限于在野生型CFH的基础上进一步突变获得的突变体，修饰物(例如，糖基化修饰、PEG化修饰、生物素化修饰、磷酸化修饰等等)，片段，截短体，缀合物或融合蛋白等等。

在一些实施方案中，每个SCR彼此独立地选自野生型SCR或SCR突变体。

在一些实施方案中，每个SCR彼此独立地选自糖基化的SCR、去除或降低糖基化的SCR。

在一些实施方案中，重组补体因组H多肽包含如下至少一个如下所述位点的氨基酸突变：第439位，第1077位；所述突变的位点为相对于SEQ ID NO:13所示序列的自然计数位点。相对于SEQ ID NO:13所示序列中按自然计数的第439位的氨基酸也即相对于SEQ IDNO:35所示序列中按自然计数的第13位的氨基酸，相对于SEQ ID NO:13所示序列中按自然计数的第1077位的氨基酸也即相对于SEQ ID NO:36所示序列中按自然计数的第50位的氨基酸。

在一些实施方案中，第439位和/或第1077位的氨基酸突变能够降低或去除重组补体因子H多肽的糖基化。

在一些具体的实施方案中，重组补体因子H多肽包含SCR8，且所述SCR8在相对于SEQ ID NO:13所示序列的自然计数位点的第439位存在突变。也即，SCR8在相对于SEQ IDNO:35所示序列的自然计数位点的第13位存在突变。

在一些具体的实施方案中，相对于SEQ ID NO:13所示序列中按自然计数的第439位的氨基酸突变为如下任意一种氨基酸：丙氨酸(A)，缬氨酸(V)，异亮氨酸(I)，亮氨酸(L)，甲硫氨酸(M)，甘氨酸(G)，丝氨酸(S)，苏氨酸(T)，谷氨酰胺(Q)，精氨酸(R)，赖氨酸(K)，天冬氨酸(D)，谷氨酸(E)。

在一些具体的实施方案中，相对于SEQ ID NO:13所示序列中按自然计数的第439位的氨基酸存在如下任意一种突变：N439A，N439V，N439I，N439L，N439M，N439G，N439S，N439T，N439Q，N439R，N439K，N439D，N439E。

在一些具体的实施方案中，重组补体因子H多肽包含SCR18，且所述SCR18在相对于SEQ ID NO:13所示序列的自然计数位点的第1077位存在突变。也即，SCR18在相对于SEQ IDNO:36所示序列的自然计数位点的第50位存在突变。

在一些具体的实施方案中，相对于SEQ ID NO:13所示序列中按自然计数的第1077位的氨基酸突变为丙氨酸(A)，缬氨酸(V)，异亮氨酸(I)，亮氨酸(L)，甲硫氨酸(M)，甘氨酸(G)，丝氨酸(S)，苏氨酸(T)，谷氨酰胺(Q)，精氨酸(R)，赖氨酸(K)，天冬氨酸(D)，或谷氨酸(E)。在一些具体的实施方案中，相对于SEQ ID NO:13所示序列中按自然计数的第1077位氨基酸存在突变1077Q。

在一些具体的实施方案中，相对于SEQ ID NO:13所示序列中按自然计数的第1077位氨基酸存在如下任意一种突变：N1077A，N1077V，N1077I，N1077L，N1077M，N1077G，N1077S，N1077T，N1077Q，N1077R，N1077K，N1077D，N1077E。在一些具体的实施方案中，相对于SEQ ID NO:13所示序列中按自然计数的第1077位氨基酸存在突变N1077Q。

示例性地，SCR(18-20)包含如SEQ ID NO:2所示序列，其第50位的氨基酸X选自天冬酰胺(N)，丙氨酸(A)，缬氨酸(V)，异亮氨酸(I)，亮氨酸(L)，甲硫氨酸(M)，甘氨酸(G)，丝氨酸(S)，苏氨酸(T)，谷氨酰胺(Q)，精氨酸(R)，赖氨酸(K)，天冬氨酸(D)，或谷氨酸(E)。其中，SEQ ID NO:2所示序列的第50位的氨基酸位点对应于SEQ ID NO:13所示序列中第1077位的氨基酸位点。

在一些实施方案中，在糖基化的SCR(18-20)中，对应于SEQ ID NO:2所示序列的第50位的氨基酸为天冬酰胺(N)；在去除/降低糖基化的SCR(18-20)中，对应于SEQ ID NO:2所示序列的第50位的氨基酸为丙氨酸(A)，缬氨酸(V)，异亮氨酸(I)，亮氨酸(L)，甲硫氨酸(M)，甘氨酸(G)，丝氨酸(S)，苏氨酸(T)，谷氨酰胺(Q)，精氨酸(R)，赖氨酸(K)，天冬氨酸(D)，或谷氨酸(E)。

在一些具体的实施方案中，糖基化的SCR(18-20)包含如SEQ ID NO:3所示序列。去除/降低糖基化的SCR(18-20)在相对于SEQ ID NO:3所示序列按自然计数的第50位氨基酸存在突变50Q，50A，50V，50I，50L，50M，50G，50S，50T，50R，50K，50D或50E。

在一些具体的实施方案中，糖基化的SCR18包含如SEQ ID NO:36所示序列。去除/降低糖基化的SCR18在相对于SEQ ID NO:36所示序列按自然计数的第50位氨基酸存在突变50Q，50A，50V，50I，50L，50M，50G，50S，50T，50R，50K，50D或50E。

在一些具体的实施方案中，去除/降低糖基化的SCR(18-20)包含如SEQ ID NO:4所示序列。

相应地，本公开中用于形成第二结构域的SCR(18-20)是包含糖基化位点的野生型SCR(18-20)，也即糖基化的SCR(18-20)；或者SCR(18-20)是包含去除/降低糖基化的氨基酸突变的SCR(18-20)突变体，也即，去除/降低糖基化的SCR(18-20)。

示例性地，SCR(6-8)包含如SEQ ID NO:5所示序列，其第135位的氨基酸X选自天冬酰胺(N)，丙氨酸(A)，缬氨酸(V)，异亮氨酸(I)，亮氨酸(L)，甲硫氨酸(M)，甘氨酸(G)，丝氨酸(S)，苏氨酸(T)，谷氨酰胺(Q)，精氨酸(R)，赖氨酸(K)，天冬氨酸(D)，或谷氨酸(E)。其中，SEQ ID NO:5所示序列的第135位的氨基酸位点对应于SEQ ID NO:13所示序列中第439位的氨基酸位点。

在一些实施方案中，在糖基化的SCR(6-8)中，对应于SEQ ID NO:5所示序列的第50位的氨基酸为天冬酰胺(N)；在去除/降低糖基化的SCR(18-20)中，对应于SEQ ID NO:5所示序列的第50位的氨基酸为丙氨酸(A)，缬氨酸(V)，异亮氨酸(I)，亮氨酸(L)，甲硫氨酸(M)，甘氨酸(G)，丝氨酸(S)，苏氨酸(T)，谷氨酰胺(Q)，精氨酸(R)，赖氨酸(K)，天冬氨酸(D)，或谷氨酸(E)。

在一些具体的实施方案中，糖基化的SCR(6-8)包含如SEQ ID NO:6所示序列。去除/降低糖基化的SCR(6-8)在相对于SEQ ID NO:6所示序列中按自然计数的第135位氨基酸存在突变135Q，135A，135V，135I，135L，135M，135G，135S，135T，135R，135K，135D或135E。

在一些具体的实施方案中，糖基化的SCR8包含如SEQ ID NO:35所示序列。去除/降低糖基化的SCR8在相对于SEQ ID NO:35所示序列按自然计数的第13位氨基酸存在突变13Q，13A，13V，13I，13L，13M，13G，13S，13T，13R，13K，13D或13E。

相应地，本公开中用于形成第三结构域的SCR(6-8)是包含糖基化位点的野生型SCR(6-8)，也即糖基化的SCR(6-8)；或者SCR(6-8)是包含去除/降低糖基化的氨基酸突变的SCR(6-8)突变体，也即，去除/降低糖基化的SCR(6-8)。

需要说明的是，对于构成重组补体因子H多肽的任意一个SCR而言，选择野生型SCR或SCR突变体、糖基化的SCR或去除/降低糖基化的SCR，由SCR最终构建得到的多肽的CFH活性决定，本公开对各SCR的类型不进行限制性限定。

在本公开中，第一结构域与第二结构域直接连接，或通过第一连接子间接与第二结构域间接连接。

在本公开中，第二结构域与第三结构域直接连接，或通过第二连接子与第三结构域间接连接。

示例性地，前述重组补体因子H多肽从N末端向C末端具有如下任一项所示的结构：

第一结构域-第一连接子-第二结构域-第二连接子-第三结构域；

第一结构域-第一连接子-第二结构域-第三结构域；

第一结构域-第二结构域-第二连接子-第三结构域；或，

第一结构域-第一连接子-第二结构域-第二连接子-第三结构域。

在本公开中，第一连接子与第二连接子可以相同或不同。

在一些实施方案中，第一连接子和第二连接子彼此独立地选自：

(R₁)_m或(R₁)_n-(R₃)_x-(R₄)_t-(R₃)_x-(R₁)_n；

其中，m为1-20的任一整数(例如，1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20)；n为1-8的任一整数(例如，1、2、3、4、5、6、7或8)；

R₁为(Z₁)_r，r选自1-8的任一整数(例如，1、2、3、4、5、6、7或8)，每一个Z₁各自独立地选自Gly(G)、Ala(A)、Ser(S)、Pro(P)、Asn(N)、Tyr(Y)、或Thr(T)；

x为0-4的任一整数(例如，0、1、2、3或4)，若存在，R₃为Ala(A)；

t为1-8的任一整数(例如，1、2、3、4、5、6、7或8)，R₄为Glu-Ala-Ala-Ala-Lys(EAAAK)。

示例性地，R₁为G，G₂，G₃，G₄，GS，ASGS，GGNGT，YGNGT，S，S₂，S₃，S₄，G₂S，G₃S，G₄S，G₂SS，G₃SSS，G₄SS等等。

示例性地，R₃为不存在或A、A₂、A₃或A₄。

示例性地，R₄为EAAAK、(EAAAK)₂、(EAAAK)₃、(EAAAK)₄等等。

在一些具体的实施方案中，(R₁)_m选自(G)_m、(GS)_m、(G₂S)_m、(G₃S)_m、(G₄S)_m、(GAP)_m、(ASGS)_m、(G_pS_q)_m、(GGNGT)_m或(YGNGT)_m；其中，m选自1-20的任一整数；p选自1-7的任一整数(例如1，2，3，4，5，6或7)，q选自1-7的任一整数(例如1，2，3，4，5，6或7)，且p+q≤8(例如2，3，4，5，6，7或8)；

在一些具体的实施方案中，(R₁)_m选自(G)_m，其中，m选自1-8的任一整数(例如，m选自1、2、3、4、5、6、7或8)。

在一些具体的实施方案中，(R₁)_n选自(G)_n、(GAP)_n、(ASGS)_n、(G_pS_q)_n、(GGNGT)_n、(YGNGT)n；其中，n选自1-8的任一整数；p选自1-7的任一整数(例如1，2，3，4，5，6或7)，q选自1-7的任一整数(例如1，2，3，4，5，6或7)，且p+q≤8(例如2，3，4，5，6，7或8)。

在一些具体的实施方案中，(R₁)_n-(R₃)_x-(R₄)_t-(R₃)_x-(R₁)_n选自(R₁)_n-A-(EAAAK)_t-A-(R₁)_n或(R₁)_n-(EAAAK)_t-(R₁)_n；其中，n选自1-8的任一整数，t为1-6的任一整数(例如，1，2，3，4，5或6)，x选自0-4的任一整数。

在一些具体的实施方案中，(R₁)_n-(R₃)_x-(R₄)_t-(R₃)_x-(R₁)_n选自(G_pS_q)_n-A-(EAAAK)_t-A-(G_pS_q)_n或(G_pS_q)_n-(EAAAK)_t-(G_pS_q)_n，其中，n选自1-8的任一整数，t为1-6的任一整数；p选自1-7的任一整数，q选自1-7的任一整数，且p+q≤8。

示例性地，(R₁)_n为(G₄S)_n；其中，n为1-8的任一整数(例如1、2、3、4、5、6、7或8)。进一步地，(R₁)_n-(R₃)_x-(R₄)_t-(R₃)_x-(R₁)_n为(G₄S)_n-A-(EAAAK)_t-A-(G₄S)_n或(G₄S)_n-(EAAAK)_t-(G₄S)_n；其中，n为1-6中的任一整数(例如1、2、3、4、5或6)，t为1-6的任一整数(例如1、2、3、4、5或6)。

示例性地，第一连接子和第二连接子彼此独立地选自如下所示氨基酸序列的连接子：(G₄S)₄，(G₄S)₃，(G₄S)₂，G₄S，(G₄)₄，(G₄)₃，(G₄)₂，G₄，G₄SA(EAAAK)₂AG₄S，(G₄S)₂A(EAAAK)₂A(G₄S)₂，(G₄S)₃A(EAAAK)₂A(G₄S)₃，G₄S(EAAAK)₂G₄S，(G₄S)₂(EAAAK)₂(G₄S)₂，(G₄S)₃(EAAAK)₂(G₄S)₃，GS；GAP；ASGS，GGNGT，(GGNGT)₂，(GGNGT)₃，(GGNGT)₄，YGNGT，(YGNGT)₂，(YGNGT)₃，(YGNGT)₄。

在一些具体的实施方案中，第一连接子为(G₄S)₃，第二连接子为(G₄S)₃；或者，第一连接子为G₄SA(EAAAK)₂AG₄S，第二连接子为G₄SA(EAAAK)₂AG₄S；或者，第一连接子为(G₄S)₃，第二连接子为G₄SA(EAAAK)₂AG₄S；或者，第一连接子为G₄SA(EAAAK)₂AG₄S，第二连接子为(G₄S)₃。

连接子的氨基酸序列编号如下所示：

序列	SEQ ID NO:	序列	SEQ ID NO:
				(G₃S)_m	60	S₄	72
(G₄S)_m	61	A₄	73
				(ASGS)_m	62	(G₄)₄	74
(GGNGT)_m	63	(G₄)₃	75
				(YGNGT)_m	64	(G₄)₂	76
G₂SS	65	G₄	77
				G₃SSS	66	G₄SA(EAAAK)₂AG₄S	78
G₄SS	67	(G₄S)₂A(EAAAK)₂A(G₄S)₂	79
				EAAAK	68	(G₄S)₃A(EAAAK)₂A(G₄S)₃	80
(EAAAK)₂	69	G₄S(EAAAK)₂G₄S	81
				(EAAAK)₃	70	(G₄S)₂(EAAAK)₂(G₄S)₂	82
(EAAAK)₄	71	(G₄S)₃(EAAAK)₂(G₄S)₃	83

在一些实施方案中，前述重组补体因子H多肽从N末端向C末端具有如下式(I)所示的结构：

第一结构域-第一连接子-第二结构域-第二连接子-第三结构域式(I)，

其中，第一结构域选自SCR(1-3)或SCR(1-4)，第二结构域选自SCR(17-20)、SCR(18-20)或SCR(19-20)，第三结构域选自SCR7、SCR(6-7)、SCR(6-8)或SCR(7-8)；

第一连接子和第二连接子彼此独立地选自如下任意一种：(R₁)_m或(R₁)_n-(R₃)_x-(R₄)_t-(R₃)_x-(R₁)_n

其中，m为1-20的任一整数，n为1-8的任一整数；

R₁为(Z₁)_r，r选自1-8的任一整数，每一个Z₁各自独立地选自Gly(G)、Ala(A)、Ser(S)、Pro(P)、Asn(N)、Tyr(Y)、或Thr(T)；

x为0-4的任一整数，若存在，R₃为Ala(A)；

t为1-8的任一整数，R₄为Glu-Ala-Ala-Ala-Lys(EAAAK)。

在一些具体的实施方案中，前述重组补体因子H多肽从N末端向C末端具有如下任意一种结构：

第一结构域-(G₄S)_m-第二结构域-(G₄S)_m-第三结构域式(I-1)；或者，

第一结构域-(G₄S)_n(EAAAK)_t(G₄S)_n-第二结构域-(G₄S)_n(EAAAK)_t(G₄S)_n-第三结构域式(I-2)；或者，

第一结构域-(G₄S)_nA(EAAAK)_tA(G₄S)_n-第二结构域-(G₄S)_nA(EAAAK)_tA(G₄S)_n-第三结构域式(I-3)；

其中，第一结构域、第二结构域、第三结构域选自前述(1)-(24)任一项所示的组合，m选自1-20的任一整数，n为1-8的任一整数，t选自1-6的任一整数。

SCR(1-4)-(G₄S)_m-SCR(18-20)-(G₄S)_m-SCR(6-8)，

或者，

SCR(1-4)-(G₄S)_n(EAAAK)_t(G₄S)_n-SCR(18-20)-(G₄S)_n(EAAAK)_t(G₄S)_n-SCR(6-8)；

或者，

SCR(1-4)-(G₄S)_nA(EAAAK)_tA(G₄S)_n-SCR(18-20)-(G₄S)_nA(EAAAK)_tA(G₄S)_n-SCR(6-8)；其中，SCR(18-20)为糖基化的、去除糖基化的或降低糖基化的；

m选自1-20的任一整数，n为1-8的任一整数，t选自1-6的任一整数。

SCR(1-4)-(G₄S)_m-SCR(18-20)-(G₄S)_m-SCR(6-8)，

或者，

SCR(1-4)-(G₄S)_n(EAAAK)_t(G₄S)_n-SCR(18-20)-(G₄S)_n(EAAAK)_t(G₄S)_n-SCR(6-8)，

或者，

m选自1-8的任一整数，n为1-6的任一整数，t选自1-6的任一整数。

SCR(1-4)-(G₄S)₃-SCR(18-20)-(G₄S)₃-SCR(6-8)，或者，

SCR(1-4)-G₄SA(EAAAK)₂AG₄S-SCR(18-20)-G₄SA(EAAAK)₂AG₄S-SCR(6-8)。

SCR(1-4)-(G₄S)₃-糖基化的SCR(18-20)-(G₄S)₃-SCR(6-8)，或者，

SCR(1-4)-G₄SA(EAAAK)₂AG₄S-去除/降低糖基化的SCR(18-20)-G₄SA(EAAAK)₂AG₄S-SCR(6-8)。

在一些具体的实施方案中，去除/降低糖基化的SCR(18-20)包括50Q的氨基酸突变，所述突变的位点为相对于SEQ ID NO:2所示序列的自然计数位点。

在一些实施方案中，各SCR结构域的示例性氨基酸序列如下所示：

>SCR(1-4)

EDCNELPPRRNTEILTGSWSDQTYPEGTQAIYKCRPGYRSLGNVIMVCRKGEWVALNPLRKCQKRPCGHPGDTPFGTFTLTGGNVFEYGVKAVYTCNEGYQLLGEINYRECDTDGWTNDIPICEVVKCLPVTAPENGKIVSSAMEPDREYHFGQAVRFVCNSGYKIEGDEEMHCSDDGFWSKEKPKCVEISCKSPDVINGSPISQKIIYKENERFQYKCNMGYEYSERGDAVCTESGWRPLPSCEE

(SEQ ID NO:1)

>SCR(18-20)

其中，X选自N，Q，A，V，I，L，M，G，S，T，R，K，D，E。

>糖基化的SCR(18-20)

>去糖基化的SCR(18-20)(N50Q)

>SCR(6-8)

其中，X选自N，Q，A，V，I，L，M，G，S，T，R，K，D，E。

>糖基化的SCR(6-8)

>去除/降低糖基化的SCR(6-8)

>SCR(1-3)

EDCNELPPRRNTEILTGSWSDQTYPEGTQAIYKCRPGYRSLGNVIMVCRKGEWVALNPLRKCQKRPCGHPGDTPFGTFTLTGGNVFEYGVKAVYTCNEGYQLLGEINYRECDTDGWTNDIPICEVVKCLPVTAPENGKIVSSAMEPDREYHFGQAVRFVCNSGYKIEGDEEMHCSDDGFWSKEKPKCVE

(SEQ ID NO:7)

>SCR(17-20)

TDCLSLPSFENAIPMGEKKDVYKAGEQVTYTCATYYKMDGASNVTCINSRWTGRPTCRDTSCVNPPTVQNAYIVSRQMSKYPSGERVRYQCRSPYEMFGDEEVMCLNGNWTEPPQCKDSTGKCGPPPPIDNGDITSFPLSVYAPASSVEYQCQNLYQLEGNKRITCRNGQWSEPPKCLHPCVISREIMENYNIALRWTAKQKLYSRTGESVEFVCKRGYRLSSRSHTLRTTCWDGKLEYPTCAK

(SEQ ID NO:8)

>SCR(19-20)

STGKCGPPPPIDNGDITSFPLSVYAPASSVEYQCQNLYQLEGNKRITCRNGQWSEPPKCLHPCVISREIMENYNIALRWTAKQKLYSRTGESVEFVCKRGYRLSSRSHTLRTTCWDGKLEYPTCAK

(SEQ ID NO:9)

>SCR7

RKCYFPYLENGYNQNYGRKFVQGKSIDVACHPGYALPKAQTTVTCMENGWSPTPRCIR

(SEQ ID NO:10)

>SCR(6-7)

KPCDYPDIKHGGLYHENMRRPYFPVAVGKYYSYYCDEHFETPSGSYWDHIHCTQDGWSPAVPCLRKCYFPYLENGYNQNYGRKFVQGKSIDVACHPGYALPKAQTTVTCMENGWSPTPRCIR

(SEQ ID NO:11)

>SCR(7-8)

RKCYFPYLENGYNQNYGRKFVQGKSIDVACHPGYALPKAQTTVTCMENGWSPTPRCIRVKTCSKSSIDIENGFISESQYTYALKEKAKYQCKLGYVTADGETSGSITCGKDGWSAQPTCIK

(SEQ ID NO:12)

>SCR8

>SCR18

在一些具体的实施方案中，前述重组补体因子H多肽包含SEQ ID NO:14-15、19、23、26任一项所示的氨基酸序列；或与SEQ ID NO:14-15、19、23、26任一项所示序列具有至少80％序列同一性(例如，80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％等)，且具有补体因子H活性和/或补体调节活性的氨基酸序列。

其中，SEQ ID NO:13所示序列中第1077位的氨基酸位点在对应SEQ ID NO:15所示序列的氨基酸位点为318位。也即，SEQ ID NO:15所示序列中重组补体因子H多肽包含如下去除糖基化的氨基酸突变:318Q。

在一些实施方案中，重组补体因子H多肽中包含信号肽，或不包含信号肽。在一些实施方案中，信号肽的添加适用于重组补体因子H多肽的分泌。在一些实施方案中，信号肽的添加适用于重组补体因子H多肽的翻译后修饰(例如，糖基化、硫酸化等等)。在一些实施方案中，信号肽的添加适用于重组补体因子H多肽的定位。在另外的实施方案中，信号肽的添加还可以用于实现其他信号肽功能，本公开对此不进行限制性限定。本领域技术人员应当理解，重组补体因子H多肽中可以不包含信号肽而不改变其期望的补体因子H活性和/或补体调节活性。

在一些具体的实施方案中，重组补体因子H多肽中包含信号肽，所述信号肽位于所述重组补体因子H多肽的N末端。信号肽具有广泛的序列来源，均能实现其功能。作为非限制性示例，信号肽包含来源于如下所示蛋白的氨基酸序列：CD33信号肽、CD8信号肽、CD16信号肽、CFH信号肽等。示例性地，信号肽包含如SEQ ID NO:27或28所示的氨基酸序列。包含信号肽的重组补体因子H多肽包含SEQ ID NO:29-32任一项所示的氨基酸序列；或与SEQ ID NO:29-32任一项所示序列具有至少80％序列同一性(例如，80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％等)，且具有补体因子H活性和/或补体调节活性的氨基酸序列。

在一些实施方案中，前述重组补体因子H多肽与野生型CFH相比，具有提高的CFH活性。例如，与野生型CFH相比，重组补体因子H多肽具有如下至少一种提高的CFH活性：

(a)与C-反应蛋白(CRP)结合活性，(b)与C3b和/或其片段结合活性，(c)与肝素结合活性，(d)与唾液酸结合活性，(e)与细胞表面补体受体(例如，CR3、CD11b/CD18或integrinαM/integrinβ2等)结合活性，(f)与糖胺聚糖结合活性，(g)与丙二醛(Malondialdehyde，MDA)结合活性，(h)与病原体结合活性，(j)补体因子I切割C3b辅因子活性，(k)C3和C5替代途径转化酶衰变加速活性，(l)补体调节活性，包括补体旁路途径调节活性，更具体为抑制补体激活的活性。

在一些具体的实施方案中，重组补体因子H多肽与野生型CFH相比，具有提高的补体调节活性，更具体为提高的抑制补体激活的活性。

在又一方面，本公开提供了一种重组补体因子H多肽，其相对野生型CFH包含第1077位和/或第439位的氨基酸突变，所述突变的位点为相对于SEQ ID NO:13所示序列的自然计数位点。

在一些实施方案中，所述突变去除/降低重组补体因子H多肽的糖基化。

在一些实施方案中，重组补体因子H多肽包含第1077位的氨基酸突变，其中所述突变的位点为相对于SEQ ID NO:13所示序列的自然计数位点。

在一些具体的实施方案中，重组补体因子H多肽在相对于SEQ ID NO:13所示序列中按自然计数的第1077位的氨基酸突变为丙氨酸(A)，缬氨酸(V)，异亮氨酸(I)，亮氨酸(L)，甲硫氨酸(M)，甘氨酸(G)，丝氨酸(S)，苏氨酸(T)，谷氨酰胺(Q)，精氨酸(R)，赖氨酸(K)，天冬氨酸(D)，或谷氨酸(E)。在一些具体的实施方案中，重组补体因子H多肽在相对于SEQ ID NO:13所示序列中按自然计数的第1077位氨基酸存在如下突变：1077Q。

在一些具体的实施方案中，重组补体因子H多肽在相对于SEQ ID NO:13所示序列中按自然计数的第1077位氨基酸存在如下任意一种突变：N1077A，N1077V，N1077I，N1077L，N1077M，N1077G，N1077S，N1077T，N1077Q，N1077R，N1077K，N1077D，N1077E。在一些具体的实施方案中，重组补体因子H多肽在相对于SEQ ID NO:13所示序列中按自然计数的第1077位氨基酸存在如下突变：N1077Q。

需要说明的是，相对于SEQ ID NO:13的氨基酸突变(1077Q)对应于SEQ ID NO:2所示氨基酸序列中按自然计数的第50位的氨基酸残基。

在一些实施方案中，本公开提供包含SCR18的重组补体因子H多肽，其是去糖基化修饰的；在一些具体实施方案中，在相对于本公开的SEQ ID NO:2的自然计数的第50位氨基酸存在去糖基化突变；在一些具体实施方案中，在相对于本公开的SEQ ID NO:2的自然计数的第50位氨基酸存在50Q的突变。

在一些实施方案中，重组补体因子H多肽包含第439位的氨基酸突变，其中所述突变的位点为相对于SEQ ID NO:13所示序列的自然计数位点。

在一些具体的实施方案中，重组补体因子H多肽在相对于SEQ ID NO:13所示序列中按自然计数的第439位的氨基酸突变为如下任意一种氨基酸：丙氨酸(A)，缬氨酸(V)，异亮氨酸(I)，亮氨酸(L)，甲硫氨酸(M)，甘氨酸(G)，丝氨酸(S)，苏氨酸(T)，谷氨酰胺(Q)，精氨酸(R)，赖氨酸(K)，天冬氨酸(D)，谷氨酸(E)。

在一些具体的实施方案中，重组补体因子H多肽在相对于SEQ ID NO:13所示序列中按自然计数的第439位的氨基酸存在如下任意一种突变：N439A，N439V，N439I，N439L，N439M，N439G，N439S，N439T，N439Q，N439R，N439K，N439D，N439E。

在一些实施方案中，重组补体因子H多肽同时包含第439位与第1077位的氨基酸突变，其中所述突变的位点为相对于SEQ ID NO:13所示序列的自然计数位点。

在一些具体的实施方案中，前述重组补体因子H多肽包含SEQ ID NO:15、22-26任一项所示的氨基酸序列；或与SEQ ID NO:15、22-26任一项所示序列具有至少80％序列同一性(例如，80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％等)，且具有补体因子H活性和/或补体调节活性的氨基酸序列。

核酸分子及载体

在一些实施方案中，本公开提供了核酸分子，其包含编码重组补体因子H(CFH)多肽的转基因。

在本公开的上下文中，转基因是指目标基因，其包含编码目标蛋白的核苷酸序列。在一些实施方案中，转基因包含编码本公开中任意一种重组补体因子H(CFH)多肽的核苷酸序列。在另外一些实施方案中，转基因包含编码补体因子H活性和/或补体调节活性的其他重组补体因子H(CFH)多肽的核苷酸序列。

在一些实施方案中，转基因编码的重组补体因子H多肽包含如SEQ ID NO:14-26、33-34中任一项所示的氨基酸序列。在一些实施方案中，转基因编码的重组补体因子H多肽包含如SEQ ID NO:14-15、19、22-26、33-34中任一项所示的氨基酸序列。在一些实施方案中，转基因编码的重组补体因子H多肽包含如SEQ ID NO:14-15、19、23、26中任一项所示的氨基酸序列。在一些实施方案中，转基因编码的重组补体因子H多肽包含如SEQ ID NO:15、22-26中任一项所示的氨基酸序列。

在一些实施方案中，转基因包含如SEQ ID NO:41-55任一项所示的核苷酸序列。在一些实施方案中，转基因包含与SEQ ID NO:41-55任一项所示的核苷酸序列相比具有至少50％(例如，至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少97％、至少99％)序列同一性，且编码具有补体因子H活性和/或补体调节活性的多肽的核苷酸序列。

在一些实施方案中，转基因包含如SEQ ID NO:42-43、45-46、48-49、51-52、54-55任一项所示的核苷酸序列。在一些实施方案中，转基因包含与SEQ ID NO:42-43、45-46、48-49、51-52、54-55任一项所示的核苷酸序列相比具有至少50％(例如，至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少97％、至少99％)序列同一性，且编码具有补体因子H活性和/或补体调节活性的多肽的核苷酸序列。

在一些实施方案中，核酸分子可以是分离的多核苷酸，或核酸构建体。在一些实施方案中，核酸分子包含编码重组CFH多肽的转基因。在一些实施方案中，核酸分子中还包括其他核酸序列。示例性地，核酸分子中包含具有调控转基因表达的调控元件。

在一些实施方案中，核酸分子包含编码重组CFH多肽的转基因，以及与所述转基因可操作地连接的至少一个调控元件。

在本公开中，调控元件包括但不限于用于转录起始和/或终止的序列、启动子和/或增强子序列、有效的RNA处理信号(例如剪接和聚腺苷酸化信号)、稳定细胞质mRNA的序列、增强翻译效率的序列(例如，Kozak共有序列)、增强蛋白质稳定性的序列和/或增强蛋白质加工和/或分泌的序列。示例性调控元件包括但不限于启动子、增强子、内含子、内源性miRNA、转录后调控元件(PRE)、聚腺苷酸化(PolyA)信号序列、上游增强子(USE)。

在一些具体的实施方案中，调控元件选自启动子、增强子、翻译调控元件、内含子、非翻译区、转录后调控元件、polyA序列中的至少一种。示例性地，核酸分子中包含如下任意一组的调控元件：

(1)启动子；(2)启动子、增强子；(3)启动子、增强子、翻译调控元件；(4)启动子、增强子、翻译调控元件、非翻译区；(5)启动子、增强子、翻译调控元件、非翻译区、转录后调控元件；(6)启动子、增强子、翻译调控元件、非翻译区、转录后调控元件、polyA序列；(7)启动子、增强子、翻译调控元件、非翻译区、转录后调控元件、polyA序列、内含子；(8)启动子、增强子、翻译调控元件；(4)启动子、增强子、翻译调控元件、非翻译区、polyA序列；(9)启动子、增强子、翻译调控元件、转录后调控元件；(10)启动子、增强子、翻译调控元件、转录后调控元件、polyA序列。

在一些具体的实施方案中，核酸分子中包含启动子。示例性地，启动子选自巨细胞病毒(CMV)启动子、劳氏肉瘤病毒(RSV)启动子、MMT启动子、CBh启动子、EFS启动子、PGK启动子、SV40启动子、Ubi启动子、EF-1(例如，EF-1a)启动子、U6启动子、鸡beta-肌动蛋白启动子、CAG启动子、RPE65启动子、视蛋白启动子或任意组合，例如CMV启动子。

在一些具体的实施方案中，核酸分子中进一步包含增强子。示例性地，所述增强子选自Ubi、CMV、RSV增强子或其任意组合。例如，所述增强子是CMV增强子。

在一些具体的实施方案中，核酸分子中进一步包含翻译调控元件。示例性地，翻译调控元件为Kozak序列。示例性地，所述Kozak序列位于转基因的上游，例如Kozak序列位于非翻译区与编码重组CFH多肽的转基因之间，或位于内含子与编码重组CFH多肽的转基因之间等。

在一些具体的实施方案中，核酸分子进一步包含非翻译区。其中，非翻译区包括5’UTR和3’UTR的至少一种。

在一些具体的实施方案中，核酸分子进一步包含转录后调控元件，示例性地，转录后调控元件选自WPRE、HPRE或其组合。例如，转录后调控元件为WPRE序列。

在一些具体的实施方案中，核酸分子进一步包含polyA序列。示例性地，所述polyA选自PA75 polyA、SV40 polyA、hGH polyA、BGH polyA、rbGlob polyA或其任意组合。例如sv40polyA序列。

在一些具体的实施方案中，核酸分子具有如下任意一种结构：

1)5’-启动子-转基因-3’；

2)5’-增强子-启动子-转基因-3’；

3)5’-增强子-启动子-翻译调控元件-转基因-转录后调控元件-polyA序列-3’；

4)5’-增强子-启动子-5’UTR-翻译调控元件-转基因-3’UTR-转录后调控元件-polyA序列-3’；

5)5’-CMV启动子-编码重组CFH多肽的转基因-3’；

6)5’-CMV增强子-CMV启动子-编码重组CFH多肽的转基因-3’；

7)5’-CMV增强子-CMV启动子-Kozak序列-编码重组CFH多肽的转基因-WPRE序列-sv40polyA序列-3’；

8)5’-CMV增强子-CMV启动子-5’UTR-Kozak序列-编码重组CFH多肽的转基因-3’UTR-WPRE序列-sv40polyA序列-3’；

其中，“-”表示直接连接或间接。

在一些实施方案中，本公开提供了载体，其包含本公开提供的任意一种的核酸分子。

在一些实施方案中，所述载体是质粒或病毒载体。在一些实施方案中，所述病毒选自腺伴随病毒(AAV)、辅助物依赖性腺病毒、逆转录病毒、单纯疱疹病毒、慢病毒、痘病毒、日本血凝病毒-脂质体(HVJ)复合物、Moloney鼠白血病病毒、和基于HIV的病毒。

在一些实施方案中，本公开提供的病毒载体中包含(i)编码重组CFH多肽的转基因，以及(ii)调控元件与(iii)反向末端重复(ITR)中的至少一种。

在一些实施方案中，本公开提供的病毒载体为重组腺相关病毒载体，其包含(i)编码重组CFH多肽的转基因，以及(ii)调控元件与(iii)反向末端重复(ITR)中的至少一种。

在一些实施方案中，所述反向末端重复区(ITR)包括5’ITR和/或3’ITR。

在一些具体的实施方案中，所述5’ITR和/或3’ITR源自AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV9.47、AAV9(hu14)、AAV10、AAV11、AAV12、AAVrh8、AAVrh10、AAV-DJ或AAV-DJ8；例如，源自AAV2、AAV9。

在一些实施方案中，载体中的调控元件包括如下一种或多种：增强子、启动子、非翻译区、翻译调控元件、转录后调控元件、polyA序列。

在一些具体实施方案中，所述启动子选自CMV启动子、RSV启动子、MMT启动子、CBh启动子、EFS启动子、PGK启动子、SV40启动子、Ubi启动子、EF-1(例如，EF-1a)启动子、U6启动子、鸡beta-肌动蛋白启动子、CAG启动子、RPE65启动子、视蛋白启动子(例如，PR1.7启动子)，或任意组合。例如，所述启动子为CMV启动子。

在一些具体的实施方案中，所述增强子选自Ubi、CMV、RSV增强子或其任意组合。例如，所述增强子是CMV增强子。

在一些具体的实施方案中，所述翻译调控元件为Kozak序列。示例性地，所述Kozak序列位于转基因的上游，例如Kozak序列位于非翻译区与编码重组CFH多肽的转基因之间，或位于内含子与编码重组CFH多肽的转基因之间等。

在一些具体的实施方案中，所述非翻译区包括5’UTR和3’UTR的至少一种。例如，非翻译区包括5’UTR和3’UTR。

在一些具体的实施方案中，所述转录后调控元件选自WPRE、HPRE或其组合。例如，转录后调控元件为WPRE序列。

在一些具体的实施方案中，所述polyA序列。选自PA75 polyA、SV40 polyA、hGHpolyA、BGH polyA、rbGlob polyA或其任意组合。例如sv40polyA序列。

在本公开中，重组腺相关病毒载体可以是载体质粒或载体颗粒。

在一些实施方案中，重组腺相关病毒载体为载体颗粒，其进一步包含衣壳蛋白。衣壳蛋白内部包装有核酸序列(也即，载体基因组)，其中，载体基因组中包含本公开提供的任意一种的核酸分子。

在一些实施方案中，衣壳蛋白选自以下血清型：AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10或它们的变体；

在一些实施方案中，所述衣壳蛋白具有包含SEQ ID NO:59所示的氨基酸序列，或与SEQ ID NO:59具有至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少99％序列一致性的氨基酸序列。

病毒颗粒或AAV颗粒

在一些实施方案中，本公开提供了病毒颗粒，其包含本公开任意一种的核酸分子，和衣壳蛋白。

在一些实施方案中，病毒颗粒为腺相关病毒(AAV)颗粒。AAV颗粒包含AAV衣壳，和本公开中任意一种的核酸分子、载体或载体基因组(病毒基因组)。

在本公开中，包裹核酸分子的衣壳蛋白包含或源自任何天然或重组AAV血清型，包括但不限于：PHP.B、PHP.A、AAV1、AAV2、AAV2G9、AAV3、AAV3a、AAV3b、AAV3-3、AAV4、AAV4-4、AAV5、AAV6、AAV6.1、AAV6.2、AAV6.1.2、AAV7、AAV7.2、AAV8、AAV9、AAV9.11、AAV9.13、AAV9.16、AAV9.24、AAV9.45、AAV9.47、AAV9.61、AAV9.68、AAV9.84、AAV9.9、AAV10、AAV11、AAV12、AAV16.3、AAV24.1、AAV27.3、AAV42.12、AAV42-1b、AAV42-2、AAV42-3a、AAV42-3b、AAV42-4、AAV42-5a、AAV42-5b、AAV42-6b、AAV42-8、AAV42-10、AAV42-11、AAV42-12、AAV42-13、AAV42-15、AAV42-aa、AAV43-1、AAV43-12、AAV43-20、AAV43-21、AAV43-23、AAV43-25、AAV43-5、AAV44.1、AAV44.2、AAV44.5、AAV223.1、AAV223.2、AAV223.4、AAV223.5、AAV223.6、AAV223.7、AAV1-7/rh.48、AAV1-8/rh.49、AAV2-15/rh.62、AAV2-3/rh.61、AAV2-4/rh.50、AAV2-5/rh.51、AAV3.1/hu.6、AAV3.1/hu.9、AAV3-9/rh.52、AAV3-11/rh.53、AAV4-8/r11.64、AAV4-9/rh.54、AAV4-19/rh.55、AAV5-3/rh.57、AAV5-22/rh.58、AAV7.3/hu.7、AAV16.8/hu.10、AAV16.12/hu.11、AAV29.3/bb.1、AAV29.5/bb.2、AAV106.1/hu.37、AAV114.3/hu.40、AAV127.2/hu.41、AAV127.5/hu.42、AAV128.3/hu.44、AAV130.4/hu.48、AAV145.1/hu.53、AAV145.5/hu.54、AAV145.6/hu.55、AAV161.10/hu.60、AAV161.6/hu.61、AAV33.12/hu.17、AAV33.4/hu.15、AAV33.8/hu.16、AAV52/hu.19、AAV52.1/hu.20、AAV58.2/hu.25、AAVA3.3、AAVA3.4、AAVA3.5、AAVA3.7、AAVC1、AAVC2、AAVC5、AAV-DJ、AAV-DJ8、AAVF3、AAVF5、AAVH2、AAVrh.72、AAVhu.8、AAVrh.68、AAVrh.70、AAVpi.1、AAVpi.3、AAVpi.2、AAVrh.60、AAVrh.44、AAVrh.65、AAVrh.55、AAVrh.47、AAVrh.69、AAVrh.45、AAVrh.59、AAVhu.12、AAVH6、AAVLK03、AAVH-1/hu.1、AAVH-5/hu.3、AAVLG-10/rh.40、AAVLG-4/rh.38、AAVLG-9/hu.39、AAVN721-8/rh.43、AAVCh.5、AAVCh.5R1、AAVcy.2、AAVcy.3、AAVcy.4、AAVcy.5、AAVCy.5R1、AAVCy.5R2、AAVCy.5R3、AAVCy.5R4、AAVcy.6、AAVhu.1、AAVhu.2、AAVhu.3、AAVhu.4、AAVhu.5、AAVhu.6、AAVhu.7、AAVhu.9、AAVhu.10、AAVhu.11、AAVhu.13、AAVhu.15、AAVhu.16、AAVhu.17、AAVhu.18、AAVhu.20、AAVhu.21、AAVhu.22、AAVhu.23.2、AAVhu.24、AAVhu.25、AAVhu.27、AAVhu.28、AAVhu.29、AAVhu.29R、AAVhu.31、AAVhu.32、AAVhu.34、AAVhu.35、AAVhu.37、AAVhu.39、AAVhu.40、AAVhu.41、AAVhu.42、AAVhu.43、AAVhu.44、AAVhu.44R1、AAVhu.44R2、AAVhu.44R3、AAVhu.45、AAVhu.46、AAVhu.47、AAVhu.48、AAVhu.48R1、AAVhu.48R2、AAVhu.48R3、AAVhu.49、AAVhu.51、AAVhu.52、AAVhu.54、AAVhu.55、AAVhu.56、AAVhu.57、AAVhu.58、AAVhu.60、AAVhu.61、AAVhu.63、AAVhu.64、AAVhu.66、AAVhu.67、AAVhu.68、AAVhu.14/9、AAVhu.t19、AAVrh.2、AAVrh.2R、AAVrh.8、AAVrh.8R、AAVrh.10、AAVrh.12、AAVrh.13、AAVrh.13R、AAVrh.14、AAVrh.17、AAVrh.18、AAVrh.19、AAVrh.20、AAVrh.21、AAVrh.22、AAVrh.23、AAVrh.24、AAVrh.25、AAVrh.31、AAVrh.32、AAVrh.33、AAVrh.34、AAVrh.35、AAVrh.36、AAVrh.37、AAVrh.37R2、AAVrh.38、AAVrh.39、AAVrh.40、AAVrh.46、AAVrh.48、AAVrh.48.1、AAVrh.48.1.2、AAVrh.48.2、AAVrh.49、AAVrh.51、AAVrh.52、AAVrh.53、AAVrh.54、AAVrh.56、AAVrh.57、AAVrh.58、AAVrh.61、AAVrh.64、AAVrh.64R1、AAVrh.64R2、AAVrh.67、AAVrh.73、AAVrh.74、AAVrh8R、AAVrh8R A586R突变体、AAVrh8R R533A突变体、AAAV、BAAV、山羊AAV、牛AAV、绵羊AAV、AAVhE1.1、AAVhEr1.5、AAVhER1.14、AAVhEr1.8、AAVhEr1.16、AAVhEr1.18、AAVhEr1.35、AAVhEr1.7、AAVhEr1.36、AAVhEr2.29、AAVhEr2.4、AAVhEr2.16、AAVhEr2.30、AAVhEr2.31、AAVhEr2.36、AAVhER1.23、AAVhEr3.1、AAV2.5T、AAV-PAEC、AAV-LK01、AAV-LK02、AAV-LK03、AAV-LK04、AAV-LK05、AAV-LK06、AAV-LK07、AAV-LK08、AAV-LK09、AAV-LK10、AAV-LK11、AAV-LK12、AAV-LK13、AAV-LK14、AAV-LK15、AAV-LK16、AAV-LK17、AAV-LK18、AAV-LK19、AAV-PAEC2、AAV-PAEC4、AAV-PAEC6、AAV-PAEC7、AAV-PAEC8、AAV-PAEC11、AAV-PAEC12、AAV-2-pre-miRNA-101、AAV-8h、AAV-8b、AAV-h、AAV-b、AAV SM 10-2、AAVShuffle 100-1、AAVShuffle 100-3、AAV Shuffle 100-7、AAV Shuffle10-2、AAVShuffle 10-6、AAV Shuffle10-8、AAV Shuffle 100-2、AAV SM 10-1、AAV SM 10-8、AAVSM 100-3、AAV SM 100-10、BNP61 AAV、BNP62 AAV、BNP63AAV、AAVrh.50、AAVrh.43、AAVrh.62、AAVrh.48、AAVhu.19、AAVhu.11、AAVhu.53、AAV4-8/rh.64、AAVLG-9/hu.39、AAV54.5/hu.23、AAV54.2/hu.22、AAV54.7/hu.24、AAV54.1/hu.21、AAV54.4R/hu.27、AAV46.2/hu.28、AAV46.6/hu.29、AAV128.1/hu.43、真型(true type)AAV(ttAAV)、UPENNAAV 10、日本AAV 10血清型、AAVCBr-7.1、AAV CBr-7.10、AAV CBr-7.2、AAV CBr-7.3、AAVCBr-7.4、AAV CBr-7.5、AAV CBr-7.7、AAV CBr-7.8、AAV CBr-B7.3、AAV CBr-B7.4、AAVCBr-E1、AAV CBr-E2、AAV CBr-E3、AAVCBr-E4、AAV CBr-E5、AAV CBr-e5、AAV CBr-E6、AAVCBr-E7、AAV CBr-E8、AAV CHt-1、AAVCHt-2、AAV CHt-3、AAV CHt-6.1、AAV CHt-6.10、AAVCHt-6.5、AAV CHt-6.6、AAV CHt-6.7、AAV CHt-6.8、AAV CHt-P1、AAV CHt-P2、AAV CHt-P5、AAV CHt-P6、AAV CHt-P8、AAV CHt-P9、AAV CKd-1、AAV CKd-10、AAV CKd-2、AAV CKd-3、AAVCKd-4、AAV CKd-6、AAV CKd-7、AAVCKd-8、AAV CKd-B1、AAV CKd-B2、AAV CKd-B3、AAV CKd-B4、AAV CKd-B5、AAV CKd-B6、AAVCKd-B7、AAV CKd-B8、AAV CKd-H1、AAV CKd-H2、AAV CKd-H3、AAV CKd-H4、AAV CKd-H5、AAVCKd-H6、AAV CKd-N3、AAV CKd-N4、AAV CKd-N9、AAV CLg-F1、AAV CLg-F2、AAV CLg-F3、AAVCLg-F4、AAV CLg-F5、AAV CLg-F6、AAV CLg-F7、AAV CLg-F8、AAV CLv-1、AAV CLv1-1、AAVClv1-10、AAV CLv1-2、AAV CLv-12、AAV CLv1-3、AAV CLv-13、AAV CLv1-4、AAV Clv1-7、AAVClv1-8、AAV Clv1-9、AAV CLv-2、AAV CLv-3、AAV CLv-4、AAV CLv-6、AAV CLv-8、AAV CLv-D1、AAV CLv-D2、AAV CLv-D3、AAV CLv-D4、AAV CLv-D5、AAV CLv-D6、AAV CLv-D7、AAV CLv-D8、AAV CLv-E1、AAV CLv-K1、AAV CLv-K3、AAV CLv-K6、AAV CLv-L4、AAV CLv-L5、AAV CLv-L6、AAV CLv-M1、AAV CLv-M11、AAV CLv-M2、AAV CLv-M5、AAV CLv-M6、AAV CLv-M7、AAVCLv-M8、AAV CLv-M9、AAV CLv-R1、AAV CLv-R2、AAV CLv-R3、AAV CLv-R4、AAV CLv-R5、AAVCLv-R6、AAV CLv-R7、AAV CLv-R8、AAV CLv-R9、AAV CSp-1、AAV CSp-10、AAV CSp-11、AAVCSp-2、AAV CSp-3、AAV CSp-4、AAV CSp-6、AAV CSp-7、AAVCSp-8、AAV CSp-8.10、AAV CSp-8.2、AAV CSp-8.4、AAV CSp-8.5、AAV CSp-8.6、AAV CSp-8.7、AAV CSp-8.8、AAV CSp-8.9、AAV CSp-9、AAV.hu.48R3、AAV.VR-355、AAV3B、AAV4、AAV5、AAVF1/HSC1、AAVF11/HSC11、AAVF12/HSC12、AAVF13/HSC13、AAVF14/HSC14、AAVF15/HSC15、AAVF16/HSC16、AAVF17/HSC17、AAVF2/HSC2、AAVF3/HSC3、AAVF4/HSC4、AAVF5/HSC5、AAVF6/HSC6、AAVF7/HSC7、AAVF8/HSC8、AAVF9/HSC9、PHP.B(AAV-PHP.B)、PHP.A(AAV.PHP.A)、G2B-26、G2B-13、TH1.1-32、TH1.1-35、AAVPHP.B2、AAVPHP.B3、AAVPHP.N/PHP.B-DGT、AAVPHP.B-EST、AAVPHP.B-GGT、AAVPHP.B-ATP、AAVPHP.B-ATT-T、AAVPHP.B-DGT-T、AAVPHP.B-GGT-T、AAVPHP.B-SGS、AAVPHP.B-AQP、AAVPHP.B-QQP、AAVPHP.B-SNP(3)、AAVPHP.B-SNP、AAVPHP.B-QGT、AAVPHP.B-NQT、AAVPHP.B-EGS、AAVPHP.B-SGN、AAVPHP.B-EGT、AAVPHP.B-DST、AAVPHP.B-DST、AAVPHP.B-STP、AAVPHP.B-PQP、AAVPHP.B-SQP、AAVPHP.B-QLP、AAVPHP.B-TMP、AAVPHP.B-TTP、AAVPHP.S/G2A12、AAVG2A15/G2A3、AAVG2B4、AAVG2B5、AAVDJ8以及其变体。

在一些实施方案中，所述AAV衣壳可以是经修饰或突变的，例如含有Y252F、Y272F、Y444F、Y500F、Y700F、Y704F、Y730F、Y275F、Y281F、Y508F、Y576F、Y612G、Y673F和Y720F中的一个或多个突变；例如含有F129L、D418E、K531E、L584F、V598A和H642N中的一个或多个突变；例如在AAV2的252、272、444、500、700、704和730位Tyr残基中的至少一个被例如Phe残基取代；例如在AAV2衣壳中含有N587A、E548A或N708A突变；例如在AAV9衣壳中含有T446F突变；例如在AAV衣壳中含有V708K突变；例如所述AAV衣壳是经由390-627位氨基酸(VP1编号)中具有突变的AAV9衣壳文库产生的。

本公开全文引入WO2018232055(例如其表1)、WO2005033321、WO2015168666、WO2015121501、WO2015038958、WO2016065001、WO2016130589、WO2016049230、WO2016134375、WO2017100671、WO2017083722、WO2017015102、WO2017058892、WO2017066764、US9546112、US7198951、US9233131、US6156303、US9624274、US9475845、US8734809、US20130224836、US20140359799、US20150315612、US20150376240、US20150159173、US20150376607、US20150238550、US20160369298、US20160361439、US20170145405，以及NPulicherla等(MolecularTherapy19(6):1070-1078(2011))中的AAV衣壳。一些具体实施方案中，本公开所使用的AAV衣壳是上述现有技术中的AAV2和AAV9衣壳。

在一些实施方案中，所述AAV衣壳是经工程化改造的，例如是来自两种或更多种亲本血清型的杂合AAV衣壳。例如，所述AAV衣壳可以是AAV2G9，其包含来自AAV2和AAV9的序列。此处全文引入US20160017005中AAV2G9的序列。

在一些实施方案中，所述AAV衣壳是AAV2或AAV9衣壳。

在一些实施方案中，除编码目标多肽的核酸分子，AAV颗粒可以包含任何天然存在的和/或重组的AAV衣壳的核苷酸序列或变体的全部或部分载体基因组。

在一些实施方案中，AAV颗粒的病毒基因组中包括至少一个ITR区和至少一个有效负载区。在一些实施方案中，病毒基因组具有两个ITR。这两个ITR位于有效负载区的5’一侧和3’一侧。

在本公开的上下文，有效负载区包含编码目标多肽的核苷酸序列。

在一些实施方案中，AAV颗粒可以是复制缺陷的(例如其在载体基因组中缺乏编码功能性Rep和Cap蛋白的序列)。一些具体实施方案中，所述复制缺陷性AAV颗粒可以缺乏大多数或全部亲本编码序列，并且基本上仅携带一个或两个AAV ITR序列以及用于递送至细胞、组织、器官或生物体的感兴趣的核酸。

在一些实施方案中，AAV颗粒可以是重组AAV(rAAV)颗粒。

在一些实施方案中，AAV颗粒可以选自单链AAV颗粒(例如ssAAV)、自身互补AAV颗粒(例如scAAV)。通过跳过第二链合成，scAAV在细胞中实现快速表达。

在一些实施方案中，AAV颗粒包裹有核酸分子，所述核酸分子编码的重组补体因子H多肽包含SEQ ID NO:14-26、33-34中任一项所示的氨基酸序列。在一些实施方案中，AAV颗粒包裹有核酸分子，所述核酸分子编码的重组补体因子H多肽包含如SEQ ID NO:14-15、19、22-26、34中任一项所示的氨基酸序列。在一些实施方案中，AAV颗粒包裹有核酸分子，所述核酸分子编码的重组补体因子H多肽包含如SEQ ID NO::14-15、19、23、26中任一项所示的氨基酸序列。

在一些实施方案中，AAV颗粒包裹有核酸，所述核酸分子包含SEQ ID NO:41-55任一所示的序列。在一些实施方案中，核酸分子包含与SEQ ID NO:41-55任一项所示的核苷酸序列相比具有至少50％(例如，至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少97％、至少99％)序列同一性，且编码具有补体因子H活性和/或补体调节活性的多肽的核苷酸序列。

在一些实施方案中，AAV颗粒的衣壳蛋白具有包含SEQ ID NO:59所示的氨基酸序列，或与SEQ ID NO:59具有至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少99％序列一致性的氨基酸序列。

调控元件

本公开前述任一项的核酸分子或AAV颗粒的载体基因组(或病毒基因组)包含至少一种调控元件，使得有效负载区中的目的基因(例如重组补体因子H多肽)能够复制、转录和翻译。

在一些实施方案中，所述调控元件包括但不限于用于转录起始和/或终止的序列、启动子和/或增强子序列、有效的RNA处理信号(例如剪接和聚腺苷酸化信号)、稳定细胞质mRNA的序列、增强翻译效率的序列(例如，Kozak共有序列)、增强蛋白质稳定性的序列和/或增强蛋白质加工和/或分泌的序列。示例性调控元件包括但不限于启动子、增强子、内含子、内源性miRNA、转录后调控元件(PRE)、聚腺苷酸化(PolyA)信号序列、上游增强子(USE)。

在一些实施方案中，下述调控元件(例如启动子)驱动有效负载区在靶组织(例如受试者的眼内)中表达一段时间。例如，1、2、3、4、5、6、7天，1、2、3、4周，1、2、3、4、5、6、7、8、9、10、11、12个月，1、2、3、4、5、6、7、8、9、10、20、30、40、50、60年或以上。又例如，1-2周、1-3周、1-4周、1-2个月、1-4个月、1-6个月、2-6个月、3-6个月、3-9个月、4-8个月、6-12个月、1-2年、1-5年、2-5年、3-6年、3-8年、4-8年、5-10年、10-20年、10-30年、20-40年、20-50年，或受试者终生。

启动子

本公开前述任一项的核酸分子或AAV颗粒的载体基因组中可以包含启动子。启动子包括但不限于物种特异性、诱导型、组织特异性或细胞周期特异性的启动子。在一些实施方案中，启动子是靶组织特异性的或向性的，例如是能在眼组织中表达有效负载的启动子。在一些实施方案中，启动子可以是病毒启动子、植物启动子、哺乳动物启动子、人启动子等等。

在一些实施方案中，启动子包括但不限于CMV、CBA(包括衍生物CAG、CBh等)、EF-1α、PGK、UBC、RSV、EFS、EF1、GUSB(hGBp)、UCOE(HNRPA2B1-CBX3的启动子)、NSE、Synapsin、MeCP2、MeP418、MeP426、VMD2、MRHO、TRE、Ac5、Polyhedrin、CaMKIIa、Gall、TEF1、GDS、ADHl、Ubi、GFAP或PKG启动子，以及可选自神经丝轻(NFL)启动子、神经丝重(NFH)启动子、SCN8A启动子、共济蛋白(FXN)启动子(或称FRDA启动子)、H1启动子、RNA pol III启动子(例如U6或H1)、小核RNA(ULB或ULA)启动子。一些实施方案中，启动子为肝脏或骨骼肌启动子，肝启动子例如为人α-1-抗胰蛋白酶(hAAT)和甲状腺素结合球蛋白(TBG)，骨骼肌启动子例如为结蛋白、MCK或合成的C5-12。

在一些实施方案中，所述启动子选自CMV、CAG、CBh、EFS、EF1(例如EF-1α)、PGK、SV40、Ubi、RSV或其任意组合。

在一些实施方案中，本公开的启动子为CMV启动子，CMV启动子序列为SEQ ID NO:39所示。在一些示例的实施方案中，载体中包含两个启动子，例如是CMV和CBA启动子，又例如是EF1α启动子和CMV启动子，或前述启动子的任意两两组合。

在一些实施方案中，启动子为组织特异性表达元件，可将表达限制于某些细胞类型，包括不限于肌肉特异性启动子、B细胞启动子、单核细胞启动子、白细胞启动子、巨噬细胞启动子、胰腺腺泡细胞启动子、内皮细胞启动子、肺组织启动子、星形胶质细胞启动子或神经系统启动子，其可用于将表达限于神经元、星形胶质细胞或少突胶质细胞。

在一些实施方案中，启动子是前述启动子的截短体或变体，长度小于1kb，例如为200-300、200-400、300-400、200-500、200-600或以上长度。

在一些实施方案中，启动子可以是相同或不同的起始或亲本启动子的两种或更多种组分的组合，例如CMV和CBA。

增强子

本公开前述任一项的核酸分子或AAV颗粒的载体基因组中可以包含增强子。增强子包括但不限于物种特异性、诱导型、组织特异性或细胞周期特异性的增强子。

在一些实施方案中，增强子是靶组织特异性的或向性的，例如是能在神经组织中调控有效负载区表达的增强子。在一些实施方案中，增强子可以是或源自病毒增强子、植物增强子、哺乳动物增强子、人增强子。

在一些实施方案中，所述增强子可位于启动子的上游或下游，与启动子可操作的连接。当所述增强子存在时，较之所述增强子不存在时，对目的基因(例如重组CFH多肽)的表达增强至少20％、至少50％、至少80％、至少100％、至少数倍(包括1、2、3、4、5、6、7、8、9、10倍或以上)。

在一些实施方案中，所述增强子包括但不限于EF-lα、Ubc、humanb-actin、CAG、TRE、Ac5、Polyhedrin、CaMKIIa、Gall、TEF1、GDS、ADH1、Ubi和α-1-antitrypsin(hAAT)，或以上增强子的变体、片段，或任意组合。在一些实施方案中，所述增强子选自Ubi、IRBP、RSV或CMV增强子，或其变体、片段，或任意组合。

在一些实施方案中，所述增强子包含或为SEQ ID NO:38所示的增强子或其变体或片段。

内含子

本公开前述任一项的核酸分子或AAV颗粒的载体基因组还可以包含内含子或其部分片段。在一些实施方案中，所述内含子包括但不限于MVM(67-97bp)、F.IX截短的内含子1(约300bp)、β-球蛋白SD/免疫球蛋白重链剪接受体(约250bp)、腺病毒剪接供体/免疫球蛋白剪接受体(约500bp)、SV40晚期剪接供体/剪接受体(19S/16S)(180bp)和杂合腺病毒剪接供体/IgG剪接受体(约230bp)、hemoglobin内含子、hybrid内含子、β-globin内含子，或以上内含子的变体或片段。

在一些实施方案中，所述内含子的长度为100-800个核苷酸，例如约100、约200、约300、约400、约500、约600个核苷酸，又例如为200-250、200-300、100-200、300-500、500-600、400-600、100-200个核苷酸。

在一些实施方案中，本公开技术方案中的内含子选自hybrid intron、β-globinintron。

翻译调控元件

本公开前述任一项的核酸分子或AAV颗粒的载体基因组可以包含翻译调控元件。示例性地，翻译调控元件为Kozak序列。此外，翻译调控元件还可以包含其他类型的元件，例如，核糖体进入位点(IRES)等。

非翻译区(UTR)

本公开前述任一项的核酸分子或AAV颗粒的载体基因组可以包含非翻译区(UTR)，所述UTR选自5’UTR和/或3’UTR，以调节(例如，增减或降低)多核苷酸稳定性和蛋白质产生。通常情况下，5’UTR在转录起始位点开始并在起始密码子处终止，3’UTR在终止密码子后立即开始从到转录终止信号为止。所述UTR可以是野生型、其变体或人工UTR。

在一些实施方案中，5’UTR包括Kozak序列。另一些实施方案中，5’UTR不包括Kozak序列。

在一些实施方案中，5’UTR包含如SEQ ID NO:40所示的核苷酸序列或其变体、片段。

在一些实施方案中，3’UTR富含AU。一些实施方案中，3’UTR选自：I类ARE，例如但不限于c-Myc和MyoD，在富含U的区域内包含数个AUUUA基序的分散拷贝；II类ARE，例如但不限于GM-CSF和TNF-a，拥有两个或多个重叠的UUAUUUA(U/A)(U/A)九聚体；III类ARES，例如但不限于c-Jun和肌形成蛋白

在一些实施方案中，3’UTR可以包括寡聚(dT)序列，用于模板化添加聚腺苷酸化序列(PolyA)。

在一些实施方案中，3’UTR包含如SEQ ID NO:56所示的核苷酸序列或其变体、片段。

聚腺苷酸化序列(PolyA)

本公开前述任一项的核酸分子或AAV颗粒的载体基因组中可以包含编码PolyA的序列，所述PolyA可以是野生型、其变体或经修饰的PolyA，以进行蛋白质翻译。

在一些实施方案中，所述编码PolyA的序列位于有效负载区编码序列的3’端与3’ITR的5’端之间。

在一些实施方案中，所述编码PolyA的序列长度为0-500个核苷酸，例如约75、约100、约110、约120、约150、约160、约200、约300个核苷酸，又例如50-100、50-150、50-160、50-200、60-100、60-150、60-160、60-200、70-100、70-150、70-160、70-200、80-100、80-150、80-160、80-200、90-100、90-150、90-160、90-200。

在一些实施方案中，所述编码PolyA可以编码连续的PolyA或不连续的PolyA，。当编码不连续的PolyA时，所述编码序列可被其他核苷酸中断或分离开。例如，所述polyA具有至少两个60个腺苷酸的片段，所述至少两个60个腺苷酸片段被包含10-90个核苷酸的序列分离开。

在一些实施方案中，本公开技术方案中的编码PolyA的序列或polyA选自β-globinpolyA、SV40 polyA、bGH polyA、PA75 polyA、MeCP2 polyA、RDH1polyA、BGH polyA、SPA49polyA、sNRP-TK65 polyA、sNRP polyA、TK65 polyA，或以上PolyA的变体或片段。

在一些实施方案中，所述polyA选自PA75 polyA、SV40 polyA、hGH polyA、BGHpolyA、rbGlob polyA或其任意组合。

在一些实施方案中，本公开技术方案中polyA序列为SEQ ID NO:58所示的SV40polyA序列或其变体或片段。

此处全文引入WO2016005324、WO2016005004、WO2016091391、WO2019036513、WO2020074642中的polyA或其编码序列，其均可用于本公开技术方案中。

转录后调控元件(PRE)

本公开前述任一项的核酸分子或AAV颗粒的载体基因组中可以包含转录后调控元件，以利于转基因的转录后加工，mRNA的核输出等。

在一些实施方案中，转录后调控元件选自WPRE、HPRE或其组合。

在一些实施方案中，所述转录后调控元件为土拨鼠肝炎病毒转录后调节元件WPRE。

在一些实施方案中，WPRE序列包含如SEQ ID NO:57所示的核苷酸序列或其变体、片段。

反向末端重复(ITR)

本公开前述任一项的核酸分子或AAV颗粒的载体基因组包含至少一个ITR，例如具有两个ITR，分别位于5’和3’端的有效负载区的侧翼。

在一些实施方案中，ITR具有复制起点功能。

在一些实施方案中，ITR包含可以互补和对称排列的序列区。

在一些实施方案中，ITR可以由天然存在的多核苷酸序列或重组衍生的多核苷酸序列组成。

在一些实施方案中，ITR可以源自与衣壳相同或不同的血清型。一些实施方案中，5’ITR和3’ITR可以源自相同的血清型，也可以源自不同的血清型。例如，5’ITR和3’ITR均来自AAV2，或均来自AAV9。

在一些实施方案中，每个ITR的长度可以是约100至约150个核苷酸，例如，是100-105个核苷酸、106-110个核苷酸、111-115个核苷酸、116-120个核苷酸、121-125个核苷酸、126-130个核苷酸、131-135个核苷酸、136-140个核苷酸、141-145个核苷酸或146-150个核苷酸。在一个实施方案中，ITR的长度是140-142个核苷酸，例如是141个核苷酸。ITR长度的非限制性实例是长度为102、140、141、142、145个核苷酸，以及与它们具有至少95％同一性的核苷酸。

填充序列

本公开前述任一项的核酸分子或AAV颗粒的载体基因组可以包含填充序列，使得载体基因组的长度为包装的最佳大小，例如使得载体基因组的长度为约2.3kb、约4.6kb、约4.7kb或约5.1kb。

在一些实施方案中，所述载体基因组为单链或双链基因组，包装后的AAV颗粒为ssAAV或scAAV。

在一些实施方案中，一个载体基因组中可以含有一个或多个(例如1、2、3、4、5、6、7、8、9、10个)填充序列。

在一些实施方案中，填充序列可以位于多个调控元件之间或之内，例如两个内含子之间、5’ITR序列的3’处、5’ITR序列的5’处、3’ITR序列的5’处、3’ITR序列的3’处，以及启动子、内含子、增强子、polyA、多克隆位点(MCS)区、外显子等区域之前或之后。

rAAV颗粒的生产或制备方法

在一些实施方案中，本公开提供生产、制备和/或修饰rAAV颗粒的方法。此处全文引入WO200028004、WO200123001、WO2004112727、WO 2005005610、WO2005072364、WO2013123503、WO2015191508和US20130195801中的rAAV颗粒生产、制备和/或修饰方法。所述rAAV颗粒可以具有增强递送效率的特性，能进行有效包装，能以高频率和最小的毒性成功地感染靶细胞(例如哺乳动物或人细胞)。

在一些实施方案中，rAAV颗粒的生产方法，包括使用本公开提供的任意一种核酸分子、包含核酸分子的重组腺相关病毒载体制备rAAV颗粒的步骤。

在一些实施方案中，提供了rAAV颗粒的生产方法，包括将本公开任意的核酸分子、载体基因组(或病毒基因组)或载体包装至AAV衣壳中。

在一些具体实施方案中，包括以下步骤：1)用杆状病毒载体和病毒构建体载体和/或AAV有效负载构建体载体共转染感受态细菌细胞，2)分离所得的病毒构建体表达载体和AAV有效负载构建表达载体并分别转染病毒复制细胞，3)分离并纯化所得的有效负载和包含病毒构建体表达载体或AAV有效负载构建体表达载体的病毒构建体颗粒，4)用AAV有效负载和包含病毒构建体表达载体或AAV有效负载构建体表达载体的病毒构建体颗粒两者共感染病毒复制细胞，以及5)收获和纯化包含病毒基因组的AAV颗粒。

在一些实施方案中，提供了rAAV颗粒的生产方法，包括以下步骤：

1)将本公开任意核酸或载体基因组(或病毒基因组)或载体，和表达Rep和Cap基因的构建体以及辅助构建体(以实现辅助功能)同时共转染哺乳动物细胞(例如HEK293细胞)；

2)收获并纯化包含病毒基因组的rAAV颗粒。

在一些实施方案中，前述rAAV颗粒的病毒基因组任选地编码选择标志物。选择标志物可以包括细胞表面标志物，例如在细胞表面上表达的任何蛋白质，包括但不限于受体CD标志物、凝集素、整联蛋白或其截短形式。

在一些实施方案中，提供AAV生产系统，用于生产本公开中rAAV颗粒，其中，所述生产系统包含：

a)本公开任意一种核酸分子，或包含核酸分子的载体、或载体基因组(或病毒基因组)；

b)编码AAV衣壳的第二核酸分子；

c)用于将所述核酸分子包装至所述AAV衣壳的第三核酸分子。

其中，第三核酸分子具有足够的AAV rep功能和辅助功能，以允许将a)中的核酸分子、载体、载体基因组(或病毒基因组)或载体包装到AAV衣壳中。

所述AAV衣壳选自前述本公开任意的AAV衣壳，例如AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV9.47、AAV9(hu14)、AAV10、AAV11、AAV12、AAVrh8、AAVrh10、AAV-DJ或AAV-DJ8。

在一些具体实施方案中，足够的AAV rep功能和辅助功能通过包装细胞提供，所述包装细胞可以包含pHelper、pRC9、pGOI这三种质粒。

在一些实施方案中，Rep基因编码调节功能的非结构蛋白，例如AAV基因组的复制，可以选自Rep78、Rep68、Rep52、Rep40。Rep78和Rep68通常从p5启动子转录，而Rep52和Rep40通常从p19启动子转录。Cap基因编码组装形成病毒壳体壳体的结构蛋白VP1、VP2和/或VP3。Cap基因通常从p40启动子转录。

在一些实施方案中，提供上述AAV生产系统生产的rAAV颗粒。

宿主细胞及制备方法

在一些实施方案中，本公开进一步提供了宿主细胞，包含上述任一种核酸分子、载体、重组腺相关病毒载体。示例性地，宿主细胞可为分离细胞，例如体外培养的细胞。如下所述，宿主细胞可用于生成rAAV病毒颗粒。宿主细胞用于生成rAAV病颗粒时，将其称为“包装细胞”。在一些实施方案中，宿主细胞经前述任一种稳定地遗传修饰。在其它实施方案中，宿主细胞经前述任一种暂时地遗传修饰。

使用确定技术，包括但不限于电穿孔、磷酸钙沉淀、脂质体介导的转染等，稳定或暂时地将前述任一种引入宿主细胞中。为了稳定转化，前述任一种通常将进一步包括可选标记，例如几种众所周知的可选标记的任一种，例如新霉素抗性等。

通过将前述任一种引入多种细胞的任一种，例如哺乳动物细胞，包括(例如)鼠科动物细胞和灵长类动物细胞(例如，人类细胞)中生成主题宿主细胞。适合的哺乳动物细胞包括但不限于原代细胞和细胞系，其中适合的细胞系包括但不限于293细胞、COS细胞、HeLa细胞、Vero细胞、3T3小鼠成纤维细胞、C3H10T1/2成纤维细胞、CHO细胞等。适合宿主细胞的非限制性实例包括(例如)HeLa细胞(例如美国模式培养物保藏所(ATCC)No.CCL-2)、CHO细胞(例如，ATCC No.CRL9618、CCL61、CRL9096)、293细胞(例如，ATCC No.CRL-1573)、Vero细胞、NIH3T3细胞(例如，ATCC No.CRL-1658)、Huh-7细胞、BHK细胞(例如，ATCC No.CCL10)、PC12细胞(ATCC No.CRL1721)、COS细胞、COS-7细胞(ATCC No.CRL1651)、RAT1细胞、小鼠L细胞(ATCC No.CCLI.3)、人胚肾(HEK)细胞(ATCC No.CRL1573)、HLHepG2细胞等。也可使用杆状病毒感染产生AAV的昆虫细胞例如Sf9细胞制备主题宿主细胞(见，例如，美国专利No.7,271,002；美国专利公布12/297,958)。

在一些实施方案中，除包含如上所述编码变异AAV衣壳蛋白的核苷酸序列的核酸外，经遗传修饰的主题宿主细胞还包括包含编码一种或多种AAV rep蛋白的核苷酸序列的核酸。在其它实施方案中，宿主细胞进一步包含rAAV载体。可使用宿主细胞生成rAAV病毒体。例如，在美国专利公布No.2005/0053922和美国专利公布No.2009/0202490中描述了生成rAAV病毒体的方法。

药物组合物

在一些实施方案中，本公开提供了药物组合物，包括前述重组补体因子H多肽、核酸分子、载体、重组腺相关病毒载体、重组腺相关病毒颗粒中的至少一种。

在一些实施方案中，药物组合物中还包括一种或多种药学上可接受的辅料。

在一些具体实施方案中，药物组合物单位计量中可含有0.01至99重量％的重组补体因子H多肽，或药物组合物单位剂量中含有的重组补体因子H多肽的量为0.1-2000mg(例如1-1000mg)。

在一些具体实施方案中，药物组合物可以为冻干制剂或可注射溶液。

医药用途及预防或治疗方法

本公开提供了前述重组补体因子H多肽、核酸分子、载体、重组腺相关病毒载体、重组腺相关病毒颗粒、宿主细胞或药物组合物的医药用途、预防或治疗疾病的方法。

在一些实施方案中，前述重组补体因子H多肽、核酸分子、载体、重组腺相关病毒载体、重组腺相关病毒颗粒、宿主细胞或药物组合物，其用于如下至少一种：

(i)抑制补体激活，或制备用于抑制补体激活的药物；

(ii)用于预防或治疗与补体相关的疾病，或制备用于预防或治疗与补体相关的疾病的药物；

(iii)用于治疗患有将受益于补体激活被抑制的疾病的受试者，或制备用于治疗患有将受益于补体激活被抑制的疾病的受试者的药物。

在一些实施方案中，与补体相关的疾病选自视网膜病变。例如，黄斑变性、视网膜色素上皮(retinal pigment epithelium，RPE)变性、脉络膜视网膜变性、光感受器变性等。

在一些具体的实施方案中，视网膜病变选自黄斑变性。

在一些具体的实施方案中，视网膜病变为年龄相关性黄斑变性。示例性地，年龄相关性黄斑变性选自干性AMD或湿性AMD。

在一些实施方案中，本公开提供了一种预防或治疗与补体相关的疾病的方法，包括向受试者施用前述重组补体因子H多肽、核酸分子、载体、重组腺相关病毒载体、重组腺相关病毒颗粒、重组宿主细胞或药物组合物。

在一些实施方案中，本公开提供了一种用于抑制细胞内补体激活的方法，其包括将所述细胞与前述重组补体因子H多肽、核酸分子、载体、重组腺相关病毒载体、重组腺相关病毒颗粒、重组宿主细胞或药物组合物相接触。

在一些实施方案中，细胞为体外细胞或体内细胞。在一些实施方案中，细胞在受试者体内。在一些实施方案中，受试者具有如下至少一种特性：

补体活性失调，更具体为补体过度激活；

患有与补体相关的疾病；

患有将受益于补体激活被抑制的疾病。

在一些实施方案中，与补体相关的疾病或将受益于补体激活被抑制的疾病选自视网膜病变。例如，黄斑变性、视网膜色素上皮(retinal pigment epithelium，RPE)变性、脉络膜视网膜变性、光感受器变性等。

在一些具体的实施方案中，视网膜病变选自黄斑变性。

定义

为了更容易理解本公开，以下具体定义了某些技术和科学。除非在本公开中另有明确定义，本公开使用的所有其它技术和科学都具有本公开所属领域的一般技术人员通常理解的含义。

除非上下文另外清楚要求，否则在整个说明书和权利要求书中，应将词语“包含”、“具有”、“包括”等理解为具有包含意义，而不是排他性或穷举性意义；也即，“包括但不仅限于”的意义。

本公开所用氨基酸三字母代码和单字母代码如J.biol.chem，243，p3558(1968)中所述。

“任选”或“任选地”意味着随后所描述地事件或环境可以但不必发生，该说明包括该事件或环境发生或不发生的场合。

“受试者”、“患者”意指哺乳动物，尤其灵长类动物，尤其是人。

“约”、“大约”是指数值在由本领域一般技术人员所测定的具体值的可接受误差范围内，所述数值部分取决于怎样测量或测定(即测量体系的限度)。例如，“约”可意味着在1内或超过1的标准差。或者，“约”或“基本上包含”可意味着至多20％的范围，例如1％至15％之间、在1％至10％之间、在1％至5％之间、在0.5％至5％之间、在0.5％至1％之间变化，本公开中，数字或数值范围之前有术语“约”的每种情况也包括给定数的实施方案。除非另外说明，否则当具体值在本申请和权利要求中出现时，“约”或“基本上包含”的含义应该假定为在该具体值的可接受误差范围内。

如本公开所使用的，术语“多肽”、“肽”或“蛋白”可互换使用，其指氨基酸残基的聚合物，或多个氨基酸残基聚合物的集合体。这些术语应用于其中的一个或多个氨基酸残基为对应的天然存在的氨基酸的人造化学模拟物的氨基酸聚合物，以及天然存在的氨基酸聚合物和非天然存在的氨基酸聚合物。多肽序列通常记述为多肽序列的左手端为氨基末端(N末端、N端)；多肽序列的右手端为羧基末端(C末端、C端)。

如本公开所使用的，“补体因子H”(Complement Factor H,CFH)又称“因子H”、“FH”等，其具有补体调节活性尤其是补体旁路途径调节活性。本公开中的CFH可以是天然来源的野生型CFH或其功能变体。CFH序列可获取于GenBank、UniProt等。示例性地，天然来源指来自任何脊椎动物来源，包括哺乳动物如灵长类(例如人)和其他物种(例如，小鼠、大鼠、豚鼠、兔子、狗、猪、羊等)等。在一些实施方案中，CFH为哺乳动物CFH。在一些实施方案中，CFH为人CFH；示例性地，人CFH在Genbank:NP_000177.2中所示出。

在本公开中，“重组补体因子H多肽”也可称为“重组CFH多肽”、“重组CFH蛋白”、“CFH截短体”、“CFH截短体蛋白”、“具有补体因子H活性的多肽”、“具有CFH活性的多肽”、“具有补体抑制活性的多肽”等等。

如本公开所使用的，“CFH的功能变体”包括野生型CFH的同系物、片段、截短体、突变体、修饰物等，CFH的功能变体与野生型CFH相比，具有提高的、降低的或维持的CFH活性。

如本公开所使用的，术语“修饰”包括但不限于PEG化修饰、糖基化修饰、生物素化修饰、磷酸化修饰等等。

如本公开所使用的，术语“突变体”是指相对于“野生型”，或者“相比较的”多肽，在一个或多个(例如，若干个)位置处包含改变(即，取代、插入和/或缺失)的多肽。其中，取代是指用不同的核苷酸或氨基酸置换占用一个位置的核苷酸或氨基酸。缺失是指去除占据某一位置的核苷酸或氨基酸。插入是指在邻接并且紧随占据位置的核苷酸或氨基酸之后添加核苷酸或氨基酸。

如本公开所使用的，“SCR”(Short consensus repeats，SCR)是指来自于补体因子H(Complement Factor H，CFH)的短同源重复序列，其也被称为“短共有重复序列”、“补体调节蛋白重复序列结构域”。以“SCR(1-4)”或“SCR1-4”的表述为例，其含义为“SCR1至SCR4的片段”。其它数字的类似表示含义与此相同。

术语“可操作地连接”或“可操作的连接”或“可操作连接”是指两个或更多个生物学序列以使其处于以目的方式作用的方式连接，无论是否存在间隔区(也称接头、连接子、连接序列)。当用于多肽时，该术语表示多肽序列以使所连接的产物具有目的生物学功能的方式连接，两条序列间可以存在或不存在间隔区。例如，可将抗体可变区可操作地连接至恒定区，以形成具有抗原结合活性的稳定产物。所述术语还可用于多核苷酸。例如，当编码多肽的多核苷酸可操作地连接至调控序列(例如启动子、增强子、沉默子序列等)时，该术语表示所述多核苷酸序列以允许所述多肽由所述多核苷酸调控表达的方式连接。

如本公开所使用的，术语“连接子”是指多肽连接子、非肽连接子及其组合。在一些实施方案中，本公开中的“连接子”为多肽连接子，其具有在两个结构域之间起连接作用的氨基酸链。例如，连接子为富含甘氨酸和/或丝氨酸的柔性连接子(Flexible Linker)，刚性α螺旋连接子(例如，(EAAAK)n，n≤6)，或由柔性连接子(Flexible Linker)与刚性连接子(rigid Linker)组成的半刚性连接子(semi-regid Linker)。

“同源性”是指两个多核苷酸序列之间或两个多肽之间的序列相似性。当两个比较序列中的位置均被相同碱基或氨基酸单体亚基占据时，例如如果两个DNA分子的每一个位置都被腺嘌呤占据时，那么所述分子在该位置是同源的。两个序列之间的同源性百分率是两个序列共有的匹配或同源位置数除以比较的位置数×100的函数。例如，在序列最佳比对时，如果两个序列中的10个位置有6个匹配或同源，那么两个序列为60％同源；如果两个序列中的100个位置有95个匹配或同源，那么两个序列为95％同源。通常，当比对两个序列时进行比较以给出最大百分比同源性。例如，可以通过BLAST算法执行比较，其中选择算法的参数以在各个参考序列的整个长度上给出各个序列之间的最大匹配。以下参考文献涉及经常用于序列分析的BLAST算法：BLAST算法(BLAST ALGORITHMS):Altschul，S.F.等人，(1990)J.Mol.Biol.215:403-410；Gish，W.等人，(1993)Nature Genet.3:266-272；Madden，T.L.等人，(1996)Meth.Enzymol.266:131-141；Altschul，S.F.等人，(1997)Nucleic AcidsRes.25:3389-3402；Zhang，J.等人，(1997)Genome Res.7:649-656。其他如NCBI BLAST提供的常规BLAST算法也为本领域技术人员所熟知。

如本公开所使用的，术语“表达”包括涉及RNA产生及蛋白产生的任何步骤，包括但不限于：转录、转录后修饰、翻译、翻译后修饰和分泌。

“载体”、“表达载体”与“表达构建体”同义并指用于导入与其可操作联合的特定基因并指导其在靶细胞中表达的DNA分子，包括作为自主复制核酸结构的载体以及掺入到其所导入的宿主细胞的基因组中的载体。本文的表达载体包含表达盒，允许转录大量稳定的mRNA。一旦表达载体在靶细胞内，就通过细胞转录和/或翻译体系生成基因编码的核糖核酸分子或蛋白质。

“AAV”载体或“rAAV载体”指腺相关病毒(AAV)载体或重组AAV(rAAV)载体，其包含非AAV来源的多核苷酸序列(即，与AAV异源的多核苷酸，如编码治疗性转基因(例如，阿柏西普)的核酸序列)，通常是用于细胞的基因转化的感兴趣的序列。通常，异源多核苷酸的翼侧是至少一个，通常是两个AAV反向末端重复序列(ITR)。术语rAAV载体包括rAAV载体颗粒和rAAV载体质粒两者。rAAV载体可以是单链的(ssAAV)或自身互补的(scAAV)。“AAV病毒”或“rAAV载体颗粒”指由至少一种AAV衣壳蛋白(通常是通过野生型AAV的所有衣壳蛋白)和多核苷酸rAAV载体组成的病毒颗粒。如果颗粒包含异源多核苷酸(即，野生型AAV基因组之外的多核苷酸，如待向哺乳动物细胞递送的转基因)，则其通常称为“rAAV载体颗粒”或简称为“rAAV载体”。因此，生产rAAV颗粒必然包括生产rAAV载体，因为这样的载体包含在rAAV颗粒内。

“宿主细胞”、“宿主细胞系”和“宿主细胞培养物”可交换使用并指已引入外源核酸的细胞，包括这类细胞的后代。宿主细胞包括“转化体”和“经转化的细胞”，其包括初始转化的细胞和自其衍生的后代(不考虑传代数)。后代在核酸内含物上可能与亲本细胞不完全相同，但可以含有突变。本文中包括具有与原始转化细胞中所筛选或选择的功能或生物学活性相同的功能或生物学活性的突变后代。

“施用”、“给予”和“处理”当应用于动物、人、实验受试者、细胞、组织、器官或生物流体时，是指外源性药物、治疗剂、诊断剂或组合物与动物、人、受试者、细胞、组织、器官或生物流体的接触。“施用”、“给予”和“处理”可以指例如治疗、药物代谢动力学、诊断、研究和实验方法。细胞的处理包括试剂与细胞的接触，以及试剂与流体的接触，其中所述流体与细胞接触。“施用”、“给予”和“处理”还意指通过试剂、诊断、结合组合物或通过另一种细胞体外和离体处理例如细胞。“施用”、“处理”当应用于人、兽医学或研究受试者时，是指治疗处理、预防或预防性措施，研究和诊断应用。

如本公开所使用的，术语“预防”是指在对象中对于本文所提及的疾病或病症保持一定时间段的健康。应理解的是，所述时间段取决于所施用的药物化合物的量以及本说明书中其他地方讨论的对象的个体因素。还应理解，预防可能不在用本公开化合物治疗的所有对象中是有效的。但是，该术语优选地要求有效地预防同生群或群体的统计学显著部分的患有本文所述的疾病或病症或其伴随症状的对象。优选地，在这种情况下，设想了对象的同生群或群体，其通常，即，如果没有根据本公开的预防措施，将发展出本文所指的疾病或病症。本领域技术人员可以使用本说明书中其他地方讨论的各种众所周知的统计评估工具来确定一部分是否在统计上是有意义的。

如本公开所使用的，“治疗”意指给予受试者内用或外用治疗剂，诸如包含本公开的任一种多肽、包含多肽的组合物，所述受试者确诊患有、疑似患有、易感于一种或多种疾病症状，而已知所述治疗剂对这些症状具有治疗作用。通常，在受治疗受试者或群体中以有效缓解一种或多种疾病症状的量给予治疗剂，无论是通过诱导这类症状退化还是抑制这类症状发展到任何临床不可测量的程度。

如本公开所使用的，“有效量”包含足以改善或预防医学病症的症状或病症的量。有效量还意指足以允许或促进诊断的量。用于特定受试者或兽医学受试者的有效量可依据以下因素而变化：如待治疗的病症、受试者的总体健康情况、给药的方法途径和剂量以及副作用严重性。有效量可以是避免显著副作用或毒性作用的最大剂量或给药方案。

如本公开所使用的，“与补体相关的疾病”没有特别限制，只要它是与补体相关的疾病或病症即可。在一些实施方案中，与补体相关的疾病包括由于补体失调导致的疾病或病症。在一些实施方案中，补体失调为补体过度激活。

如本公开所使用的，术语“补体过度激活”涉及在给定情况下在时间和、或幅度上超过补体激活的正常水平的补体激活。在一些实施方案中，不适当的补体激活是在给定情况下，补体激活超过、优选显著超过健康参照、优选明显健康对象的补体激活程度。在一些实施方案中，不适当的补体激活是引起患者疾病症状的补体激活。

如本公开所使用，术语“药学上可接受的辅料”又称“药物学可接受的载体”是指在药物生产领域中广泛采用的辅助物料。使用辅料的主要目的在于提供一种使用安全、性质稳定和/或具有特定功能性的药物组合物，还在于提供一种方法，以便在为受试者施用药物之后，活性成分能够以所期望的速率溶出，或者促进活性成分在接受给药的受试者体内得到有效吸收。药学上可接受的辅料可以是具有惰性的填充剂，也可以是为药用组合物提供某种功能(例如稳定组合物的整体pH值或防止组合物中活性成分的降解)的功效成分。药学上可接受的辅料的非限制性实例包括但不限于粘合剂、助悬剂、乳化剂、稀释剂(或填充剂)、成粒剂、胶粘剂、崩解剂、润滑剂、抗粘着剂、助流剂、润湿剂、胶凝剂、吸收延迟剂、溶解抑制剂、增强剂、吸附剂、缓冲剂、螯合剂、防腐剂、着色剂、矫味剂、甜味剂等。

附图说明

图1示出了CFH全长蛋白的结构示意图(引用自Mihály Józsi et al.,TrendsImmunol.2015Jun；36(6):374-84.)，其包括从SCR1至SCR20的20个SCR。

图2示出了部分CFH截短体(CFH-13、CFH-25、CFH-37、CFH-48、CFH-79、CFH-81、CFH-84)的结构示意图。

图3示出了CFH-01(2.5mg/mL)、CFH-79(2.5mg/mL)、CFH-84(2.5mg/mL)给药后，小鼠CNV模型光斑渗透改善结果。

图4示出了AAV包装质粒示意图。

图5A-5C分别示出了密码子优化序列后CFH截短体蛋白的蛋白表达量检测结果，与MAA-BSA的亲和力检测结果，以及与C3b的亲和力检测结果。

具体实施方式

以下结合实施例用于进一步描述本公开，但这些实施例并非限制本公开的范围。

本公开实施例或测试例中未注明具体条件的实验方法，通常按照常规条件，或按照原料或商品制造厂商所建议的条件。参见Sambrook等，分子克隆，实验室手册，冷泉港实验室；当代分子生物学方法，Ausubel等著，Greene出版协会，Wiley Interscience，NY。未注明具体来源的试剂，为市场购买的常规试剂。

实施例1.补体因子H(CFH)截短体的构建和制备

补体因子H(CFH)全长蛋白共有20个短同源重复序列(short consensus repeat，SCR)，如图1所示。本公开对CFH全长蛋白进行截短体的设计，包括不同SCR的组合、不同连接子(linker)的使用、糖基化位点的改造。

1、设计具有不同SCR组合的CFH截短体

如图2和表1所示，针对不同的SCR组合进行了设计，CFH截短体中保留了具有C3b结合的功能区，即SCR1-4和SCR19-20，以及AMD疾病相关的突变Y402所在的SCR7。选择了柔性(G₄S)₃和半刚性G₄S-A(EAAAK)₂A-G₄S作为连接子。

表1.部分CFH截短体蛋白结构

(注：斜体为linker；*表示糖基化)

表1中CFH全长及CFH截短体的序列为如下所示，其中单下划线部分为连接子，部分为CFH截短体上连接的His标签，部分为去糖基化的氨基酸突变位点。

>CFH-01

>CFH-79

>CFH-84

>CFH-13

>CFH-25

>CFH-48

>CFH-49(无his tag)

>CFH-49

>CFH-77

EDCNELPPRRNTEILTGSWSDQTYPEGTQAIYKCRPGYRSLGNVIMVCRKGEWVALNPLRKCQKRPCGHPGDTPFGTFTLTGGNVFEYGVKAVYTCNEGYQLLGEINYRECDTDGWTNDIPICEVVKCLPVTAPENGKIVSSAMEPDREYHFGQAVRFVCNSGYKIEGDEEMHCSDDGFWSKEKPKCVEISCKSPDVINGSPISQKIIYKENERFQYKCNMGYEYSERGDAVCTESGWRPLPSCEEGGGGSGGGGSGGGGSKPCDYPDIKHGGLYHENMRRPYFPVAVGKYYSYYCDEHFETPSGSYWDHIHCTQDGWSPAVPCLRKCYFPYLENGYNQNYGRKFVQGKSIDVACHPGYALPKAQTTVTCMENGWSPTPRCIRVKTCSKSSIDIENGFISESQYTYALKEKAKYQCKLGYVTADGETSGSITCGKDGWSAQPTCIKGGGGSGGG GSGGGGSTSCVNPPTVQNAYIVSRQMSKYPSGERVRYQCRSPYEMFGDEEVMCLNGNWTEPPQCKDSTGKCGPPPPIDNGDITSFPLSVYAPASSVEYQCQNLYQLEGNKRITCRNGQWSEPPKCLHPCVISREIMENYNIALRWTAKQKLYSRTGESVEFVCKRGYRLSSRSHTLRTTCWDGKLEYPTCAK

(SEQ ID NO:21)

>CFH-78

>CFH-80

>CFH-81

>CFH-82

>CFH-83

>CFH-37.1

EDCNELPPRRNTEILTGSWSDQTYPEGTQAIYKCRPGYRSLGNVIMVCRKGEW

VALNPLRKCQKRPCGHPGDTPFGTFTLTGGNVFEYGVKAVYTCNEGYQLLGEI

NYRECDTDGWTNDIPICEVVKCLPVTAPENGKIVSSAMEPDREYHFGQAVRFV

CNSGYKIEGDEEMHCSDDGFWSKEKPKCVEISCKSPDVINGSPISQKIIYKENER

FQYKCNMGYEYSERGDAVCTESGWRPLPSCEEKSCDNPYIPNGDYSPLRIKHRT

GDEITYQCRNGFYPATRGNTAKCTSTGWIPAPRCTLKPCDYPDIKHGGLYHEN

MRRPYFPVAVGKYYSYYCDEHFETPSGSYWDHIHCTQDGWSPAVPCLRKCYFP

YLENGYNQNYGRKFVQGKSIDVACHPGYALPKAQTTVTCMENGWSPTPRCIR

VKTCSKSSIDIENGFISESQYTYALKEKAKYQCKLGYVTADGETSGSITCGKDG

WSAQPTCIKGGGGSAEAAAKEAAAKAGGGGSIPCSQPPQIEHGTINSSRSSQESY

AHGTKLSYTCEGGFRISEENETTCYMGKWSSPPQCEGLPCKSPPEISHGVVAHM

SDSYQYGEEVTYKCFEGFGIDGPAIAKCLGEKWSHPPSCIKTDCLSLPSFENAIP

MGEKKDVYKAGEQVTYTCATYYKMDGASNVTCINSRWTGRPTCRDTSCVNPP

TVQNAYIVSRQMSKYPSGERVRYQCRSPYEMFGDEEVMCLNGNWTEPPQCKD

STGKCGPPPPIDNGDITSFPLSVYAPASSVEYQCQNLYQLEGNKRITCRNGQWSE

PPKCLHPCVISREIMENYNIALRWTAKQKLYSRTGESVEFVCKRGYRLSSRSHT

LRTTCWDGKLEYPTCAKGGGGS

(SEQ ID NO:33)

>CFH-73

EDCNELPPRRNTEILTGSWSDQTYPEGTQAIYKCRPGYRSLGNVIMVCRKGEW

VALNPLRKCQKRPCGHPGDTPFGTFTLTGGNVFEYGVKAVYTCNEGYQLLGEI

NYRECDTDGWTNDIPICEVVKCLPVTAPENGKIVSSAMEPDREYHFGQAVRFV

CNSGYKIEGDEEMHCSDDGFWSKEKPKCVEISCKSPDVINGSPISQKIIYKENER

FQYKCNMGYEYSERGDAVCTESGWRPLPSCEEKSCDNPYIPNGDYSPLRIKHRT

GDEITYQCRNGFYPATRGNTAKCTSTGWIPAPRCTLKPCDYPDIKHGGLYHEN

MRRPYFPVAVGKYYSYYCDEHFETPSGSYWDHIHCTQDGWSPAVPCLRKCYFP

YLENGYNQNYGRKFVQGKSIDVACHPGYALPKAQTTVTCMENGWSPTPRCIR

VKTCSKSSIDIENGFISESQYTYALKEKAKYQCKLGYVTADGETSGSITCGKDG

WSAQPTCIKGGGGSAEAAAKEAAAKAGGGGSIPCSQPPQIEHGTINSSRSSQESY

AHGTKLSYTCEGGFRISEENETTCYMGKWSSPPQCEGLPCKSPPEISHGVVAHM

SDSYQYGEEVTYKCFEGFGIDGPAIAKCLGEKWSHPPSCIKTDCLSLPSFENAIP

MGEKKDVYKAGEQVTYTCATYYKMDGASNVTCINSRWTGRPTCRDTSCVNPP

TVQNAYIVSRQMSKYPSGERVRYQCRSPYEMFGDEEVMCLNGNWTEPPQCKD

STGKCGPPPPIDNGDITSFPLSVYAPASSVEYQCQNLYQLEGNKRITCRNGQWSE

PPKCLHPCVISREIMENYNIALRWTAKQKLYSRTGESVEFVCKRGYRLSSRSHT

LRTTCWDGKLEYPTCAK

(SEQ ID NO:34)上述的CFH截短体蛋白在N末端设计有信号肽。在本实施中，CFH截短体蛋白在N末端直接连接CD33信号肽：MPLLLLLPLLWAGALAM(SEQ ID NO:27)。下述序列中波浪线部分为信号肽。

>连接CD33信号肽的CFH-79

>连接CD33信号肽的CFH-84

在另外的实施方案中，CFH截短体蛋白在N末端还可以连接补体因子H(CFH)信号肽：MRLLAKIICLMLWAICVA(SEQ ID NO:28)。

>连接CFH信号肽的CFH-79

>连接CFH信号肽的CFH-84

2、CFH截短体蛋白的重组表达、制备和检测

在CFH-84的核酸序列的5’端添加EcoRI酶切位点，在3’端添加Hind III酶切位点，克隆到pTT5载体，获得表达质粒。将表达质粒进行抽提，并转染Expi293细胞，分泌的上清通过Heparin肝素亲和柱(购自博格隆，AA0261)纯化，分别用100mM,200mM,300mM,500mM和1M的NaCl进行洗脱，经过SDS-PAGE检测收集200mM NaCl的洗脱产物，经过SEC-HPLC检测，确认为目的蛋白CFH-84。将CFH-84蛋白透析后保存在20mM Tris,500mM NaCl,pH8.0的溶液中。

用同样的方法，分别制备表达CFH-77、CFH-78、CFH-79、CFH-80、CFH-81、CFH-82、CFH-83核酸序列的质粒，转染Expi293细胞，纯化，洗脱，经SEC-HPLC检测检测蛋白浓度。

构建带有His标签克隆：CFH-13、CFH-48、CFH-49，His标签的引入是便于筛选与C3b结合活性较高的克隆(检测用Anti-His抗体)。经SEC-HPLC检测蛋白浓度。

其中，SEC-HPLC检测纯度的方法为：用PBS,pH7.2,10％IPA作为流动相，用Waters的分子筛(XBridge Protein BEH SEC Column,3.5μm,7.8mm X 300mm)，分别取30μL样品，浓度为1mg/mL上样分析。

CFH截短体蛋白产量的检测方法为：将1L HEK293细胞培养液最终表达纯化之后的蛋白，通过NanoDrop(Thermo Scientifics)检测A280吸收，得到蛋白的浓度，乘以蛋白的最终体积，最后得到的蛋白总量毫克数，即为蛋白的产量。

CFH截短体的产量、纯度检测结果如表2所示，CFH-79、CFH-84的蛋白产量、纯度优于其他克隆。

表2CFH截短体的产量、纯度对比

编号	是否带His标签	产量(mg/L)	纯度
				CFH-13	是	1.5	90％
CFH-25	是	7.2	88％
				CFH-48	是	10.7	83％
CFH-49	是	11.8	74％
				CFH-79	否	10.8	91％
CFH-84	否	17	92％

实施例2.CFH截短体的蛋白产量比较

对CFH-78、CFH-80、CFH-84的蛋白产量进行检测，检测方法：1L HEK293细胞培养液最终表达纯化之后的蛋白，通过NanoDrop(Thermo Scientifics)检测A280吸收，得到蛋白的浓度，乘以蛋白的最终体积，最后得到的蛋白总量毫克数，即为蛋白的产量。

CFH-78、CFH-80、CFH-84号分子的蛋白产量检测结果如表3所示。结果显示，CFH-84的蛋白产量高于CFH-80。实验结果表明，CFH-84分子内的半刚性连接子G₄S-A(EAAAK)₂A-G₄S能够提高CFH截短体的蛋白产量。

表3.CFH截短体的产量对比

编号	是否带His标签	产量(mg/L)
			CFH-78	否	5.7
CFH-80	否	5.8
			CFH-84	否	17

实施例3.CFH截短体蛋白与C3b的亲和力检测

CFH最重要的作用就是对C3b具有负调控作用，具体来说，与固定在细胞表面的C3b结合后，能粘附到细胞表面，抑制C3bBb的形成。CFH与C3b主要通过两个结合位点相互作用，分别位于SCR1-4(结合完整的C3b)和SCR19-20(结合C3d部分)。使用ELISA实验检测CFH-48、CFH-49与C3b的结合，CFH-48、CFH-49号分子带有His标签，His标签的引入是便于筛选与C3b结合活性较高的克隆(检测用Anti-His抗体)。

1、实验方法

1)包被：用1×Elisa包被液(Solarbio,C1055)稀释包被抗体，C3b(CompTech，A114)浓度为6μg/mL，100μL/孔，4℃孵育过夜；

2)封闭：甩掉板中液体，以1×PBST清板5次后甩干液体，1％ BSA(PBST洗液稀释)，100μL/孔，室温封闭1h；

3)上样：甩掉板中液体，以1×PBST清板5次后甩干液体，加入梯度稀释的CFH蛋白，蛋白起始浓度为40nM/20nM,2倍梯度稀释，11个稀释度，以1％ BSA稀释，100μL/孔加入，室温孵育2h(22℃)；

4)加入抗His标签抗体(Proteintech,HRP-66005)：甩掉板中液体，以1×PBST清板5次后甩干液体，加入1：5000稀释的CFH抗体，1％ BSA稀释，100μL/孔，室温孵育1h小时

5)显影：甩掉板中液体，以1×PBST清板5次后甩干液体，显影液提前平衡到室温，1：1配置完后，100μL/孔加入，置37℃避光放置5-30分钟，观察颜色出现明显梯度。

6)检测：50μL/孔加入终止液，于30min内测定450nm波长。

CFH-48、CFH-49与C3b的结合能力检测结果如表4所示。其中，与CFH-48相比，CFH-49对SCR的顺序进行了颠倒。实验结果显示，对SCR的顺序颠倒后，C3b结合活性提高了10倍，因此选择颠倒SCR顺序的CFH-49分子进行改造。

表4.CFH截短体与C3b的结合能力检测

编号	是否带His标签	C3b结合EC₅₀(nM)
			CFH-48	是	2.157
CFH-49	是	0.1998

实施例4.CFH截短体蛋白与C3b的亲和力检测

原理与方法与实施例3相同，唯一区别是使用的抗体不同，本实施例使用抗CFHSCR19的抗体(Biolegend，518503)通过Elisa的方法可以鉴定CFH截短体与CFH全长相比和C3b的结合能力，从而分析CFH-79和CFH-84的体外活性是否可以优于CFH-01全长。其中，CFH-01为不带有His标签的全长CFH蛋白。

实验结果如表5所示，CFH-79、CFH-84与C3b的结合能力分别是CFH全长的1.7倍和1.1倍，说明本公开中的CFH-79、CFH-84具有优异的C3b结合能力。

表5.CFH蛋白与C3b的结合能力检测结果

蛋白编号	是否带His标签	EC₅₀(nM)	相对全长CFH提高倍数
				CFH-01	否	60	/
CFH-79	否	35	1.7
				CHF-84	否	54	1.1

实施例5.CFH截短体与MAA-BSA的亲和力检测

丙二醛(Malondialdehyde，MDA)是一种常见的脂质过氧化产物，可在包括AMD在内的许多病理过程中积聚。丙二醛-乙醛-蛋白加合物(Malondialdehyde-acetaldehyde-BSAadduct,MAA-BSA)是MDA在体内的一种常见存在形式；CFH为主要的MDA结合蛋白，SCR7和SCR20是CFH和MDA/MAA的结合位点。CFH是血浆中主要的MDA结合蛋白，CFH与可溶性MAA-BSA的结合具有相似的效率。因此，通过检测CFH截短体蛋白与MAA-BSA的亲和力，能够模拟血浆内与MDA结合的效率，从而比较CFH截短体蛋白相较于全长CFH-01的体外活性。其中，CFH-01为不带有His标签的全长CFH蛋白。

1、实验方法

1)包被：用1×Elisa包被液(Solarbio,C1055)稀释(1：5000)包被抗体(Biolegend，518503，结合CFH蛋白SCR19,适用于所有带SCR19的CFH蛋白)，MAA-BSA浓度为2μg/mL，100μL/孔，4℃孵育过夜；(96孔板，Greiner bio-one，GN650061)

3)上样：甩掉板中液体，以1×PBST清板5次后甩干液体，加入梯度稀释的CFH蛋白，蛋白起始浓度为40nM,2倍梯度稀释，11个稀释度，以1％ BSA稀释，100μL/孔加入，室温孵育2h(22℃)；

4)加入CFH抗体(Biolegend，518503)：甩掉板中液体，以1×PBST清板5次后甩干液体，加入1：5000稀释的CFH抗体，1％ BSA稀释，100μL/孔，室温孵育1h小时

6)检测：50μL/孔加入终止液，于30min内测定450nm波长。

2、实验结果

如表6所示，CFH-80蛋白、CFH-83蛋白和CFH-84蛋白与MAA-BSA的结合能力都显著优于CFH-01全长蛋白(WT，不带His标签，由近岸公司合成，方法同CFH-79和CFH-84)。CFH-80、CFH-83与CFH-84均具有颠倒的SCR顺序，以及去糖基化的第二结构域，实验结果说明CFH分子中的SCR顺序颠倒，及第二结构域去糖基化后，CFH蛋白可以获得明显提高的与MAA-BSA的结合能力。

与CFH-77蛋白相比，CFH-79蛋白中具有颠倒的SCR排列顺序。实验结果显示，CFH-79与MAA-BSA的结合能力显著优于CFH-77，说明SCR顺序颠倒可以有效提高CFH截短体的体外活性。

CHF-83蛋白中的第一结构域与第二结构域由柔性连接子(G₄S)₃进行连接，第二结构域与第三结构域由半刚性连接子G₄S-A(EAAAK)₂A-G₄S进行连接。实验结果显示，CHF-83蛋白与MAA-BSA的结合能力显著优于CFH-01全长蛋白，说明CFH截短体中可以选择不同的第一连接子与第二连接子进行连接。

表6.CFH蛋白与MAA-BSA的结合能力检测结果

蛋白编号	是否带His标签	EC₅₀(nM)	相对全长CFH提高倍数
				CFH-01	否	8.45	/
CFH-77	否	3.73	2.3
				CFH-80	否	0.67	12.6
CHF-83	否	1.70	5.0
				CHF-84	否	1.50	5.6

实施例6.CFH截短体与MAA-BSA的亲和力检测

使用实施例5中提供的MAA-BSA的亲和力检测方法，对CFH-77、CFH-79、CFH-82与MAA-BSA的结合能力进行检测。

CFH-77、CFH-79、CFH-82与MAA-BSA的结合能力检测结果如表7所示。实验结果显示，CFH-79与MAA-BSA的结合活性相对CFH-77的提高倍数为8.2，CFH-82与MAA-BSA的结合活性相对CFH-77的提高倍数为4.2。与CFH-77蛋白相比，CFH-79分子中具有颠倒的SCR排列顺序，说明SCR顺序颠倒可以有效提高CFH截短体的体外活性。与CFH-77蛋白相比，CFH-82在第二结构域中均具有突变的糖基化位点(对应SEQ ID NO:2所示序列中第50位的氨基酸突变：N50Q)，说明CFH截短体中第二结构域的去糖基化能够提高CFH截短体的体外活性。

表7.CFH蛋白与MAA-BSA的结合能力检测结果

蛋白编号	是否带His标签	相对CFH-77提高倍数
			CFH-77	否	/
CFH-79	否	8.2
			CFH-82	否	4.2

实施例7.CFH截短体抑制酵母多糖诱导的血清旁路补体途径激活能力检测

酵母多糖Zymosan是一种来自酵母细胞壁的碳水化合物，是研究补体活化的必要试剂。CFH可以抑制在Zymosan诱导之下对血清的旁路补体途径激活，而抑制效果可以通过C3b的降解来衡量。本实施例作为CFH蛋白补体作用方面的药效筛选实验，检测CFH截短体蛋白对酵母多糖诱导的血清旁路补体途径激活的抑制作用。具体可以通过对C3b的含量的检测从而反应CFH截短体以及全长分子对Zymosan诱导的血清旁路补体途径的抑制效果。

1、实验方法

1)包被:100μg/mL zymosan(Sigma-Aldrich，Z4250-250MG)包被于384孔板，50μL/孔，ELISA包被液(Solarbio,C1055)稀释，4℃过夜孵育；

2)封闭：甩掉板中液体，PBST洗板5次后甩干，2％BSA封闭，50μL/孔，室温封闭1h；

3)洗板：PBST洗板5次后甩干，后使用VBSMG(Veronal Buffered Saline with Mg⁺⁺and EGTA，Tiandz，Inc.25-08020)缓冲液洗1次后甩干；

4)上样：加入使用VBSMG缓冲液稀释一定比例的正常人血清(Factor H-depletedhuman serum，Complement Technology，A337)，25μL/孔，室温反应1h；

5)终止：加入EDTA终止反应，终浓度为20mM；

6)加一抗：PBST洗板5次后甩干，分别加入浓度为5μg/mL的生物素-人C3b的一抗(小鼠抗人C3b抗体，ThermoFisher，A39257；Biotin，ThermoFisher，A39257)，15μL/孔，室温孵育1h，抗体使用2％ BSA溶液稀释；

7)加二抗：PBST洗板5次后甩干，加入用2％ BSA溶液稀释的Streptavidin(HRP)二抗，50μL/孔，室温孵育1h；

8)显影和检测：PBST洗板5次后甩干，加入显影液(显影液A和B液提前平衡到室温，1：1配置)，50μL/孔，室温避光反应，10分钟后加入终止液，50μL/孔，测定450nm波长。

2、实验结果

如表8所示，EC₅₀表示是C3b浓度降低的活性，从而说明了CFH通过Zymosan诱导抑制了对补体旁路途径激活。CFH-79蛋白和CFH-84蛋白抑制酵母多糖诱导的血清旁路补体途径的能力都显著优于CFH全长蛋白，分别是全长活性的5.2倍和5倍，大大提高了对补体旁路途径激活的抑制。

与CFH-77蛋白相比，CFH-79具有颠倒的SCR顺序；与CFH-82相比，CHF-84具有颠倒的SCR顺序。实验结果显示，SCR排列顺序颠倒后，CFH截短体对补体旁路途径激活的抑制能力显著提高。

CFH-82、CFH-84蛋白的第二结构域中均具有糖基化位点的突变(对应SEQ ID NO:2所示序列中第50位的氨基酸突变：N50Q)。实验结果显示，CFH-82、CFH-84蛋白的对补体旁路途径的抑制活性相较CFH全长有显著提高，说明第二结构域的去糖基化可以明显提升CFH截短体抑制补体旁路途径激活的能力。

表8.CFH蛋白抑制酵母多糖诱导的血清旁路补体途径激活的能力检测结果

实施例8.CFH截短体蛋白在CNV模型小鼠的体内药效实验

本实施例针对CFH-79蛋白、CFH-84蛋白对激光光凝诱导的小鼠脉络膜新生血管药效进行检测，使用CFH-01(CFH全长蛋白，近岸蛋白公司合成)作为阳性对照。激光诱导脉络膜新生血管(Laser-induced choroidal neovascularization，CNV)小鼠模型已广泛应用于渗出性年龄相关性黄斑变性(AMD)的研究。这个活体实验模型依靠激光损伤穿透Bruch膜，导致视网膜下血管脉络膜募集。给药前和给药后分别对每眼光斑渗透评分，在给药7-10天以后，可以通过三级光斑的比例以及光斑渗透改善率，考察CFH-79、CFH-84分子相对全长CFH-01对于小鼠光斑渗透率的改善效果。

1、实验方法

1)造模和给药：在造模前，对小鼠(购自上海吉辉实验动物饲养有限公司，种数与品系C57BL/6J小鼠)进行一般眼科检查，将眼前节、眼底无明显异常的小鼠纳入试验。采用双眼眼底激光诱导脉络膜新生血管(Laser-induced choroidal neovascularization，CNV)造模，计划每眼光凝数(每眼重度荧光光斑个数)为3个。具体来说，首先进行散瞳，即动物双眼各滴0.5％复方托吡卡胺滴眼液1～2滴；之后进行麻醉--先肌肉注射舒泰50(50mg/kg，50mg/mL)，再肌肉注射盐酸赛拉嗪注射液(2mg/mL，1mg/kg)对动物进行全身麻醉；最后是激光，即动物实验眼滴卡波姆滴眼液，眼前放置眼底激光镜，看清眼底，距离视盘约1.5-2PD处围绕视乳头进行光凝。激光参数为：波长532nm，功率200mW，光斑直径50μm，曝光时间100ms。激光后动物双眼涂氧氟沙星眼膏，动物苏醒前放保温毯上维持体温，做好人员看护，苏醒后放回笼中。7天以后挑选有中、重度荧光渗漏光斑的小鼠入组，根据光斑渗漏平均分进行分组，分为4组，每组6只。按照表9中的分组进行给药。具体来说，将麻醉后的小鼠侧卧于操作台上，用聚维酮碘棉球消毒眶周皮肤，用生理盐水冲洗结膜囊，充分暴露眼球，选择眼睛颞上或鼻上角巩膜缘后1～2mm为注射进针处。用一次性胰岛素针与巩膜成小角度行巩膜穿刺，形成通道，更换33G微量注射器刺入玻璃体腔给药，停顿10秒后缓慢拔针，用无菌棉球轻压进针口10秒，涂氧氟沙星眼膏(每天2次，连续3天)。动物苏醒前放保温毯上维持体温，做好人员看护，苏醒后放回笼中。

表9.CNV模型小鼠的给药方案

注：所有小鼠在造模后即刻(D0，只进行FP)、D7和D10进行眼底照相(FundusPhotography，FP)和眼底血管荧光造影(Fundus Fluorescein Angiography，FFA)检查。即在激光光凝和给药后，通过视网膜成像显微镜采用FFA来确定光斑渗漏的情况并进行评级。眼底荧光血管造影检测前，小鼠需要静脉注射给予荧光素钠注射液(10％，0.02mL/只)。FFA每2-5分钟采集影响，通过影像进行光斑荧光渗漏评级，从而对比给药前后小鼠光斑渗透是否得到改善。

2)分析指标：对比造影早期(1.5min内)、晚期(大于3min)的FFA图片，根据造影晚期激光光斑有无荧光渗漏判断是否有CNV生成，根据荧光渗漏程度对小鼠CNV程度进行评级，并计算各级渗漏光斑的比率及光斑渗漏平均分。

光斑荧光渗漏评级标准为：0级(无荧光渗漏)，1级(轻度荧光渗漏，渗漏面积为激光光斑大小的1％～50％)，2级(中度荧光渗漏，渗漏面积为激光光斑大小的50％～100％)，3级(重度荧光渗漏，渗漏面积大于激光光斑大小)。

各级光斑比率(％)＝对应级别光斑总数/4种光斑总数(即有效光斑数)×100％；

光斑渗漏平均分＝[(0级光斑数×0)+(1级光斑数×1)+(2级光斑数×2)+(3级光斑数×3)]/4种光斑总数(即有效光斑数)，其中，有效光斑是指其附近无严重视网膜前、下出血且在荧光造影中能完整显示的光斑。

3)数据处理：采用统计学软件SPSS13.0对数据进行处理。所有统计分析采用双尾分析，统计学水平设在p≤0.05。计算不同组别动物的光斑渗漏平均分、各级荧光渗漏光斑比率等指标的均值(Mean)和标准差(SD)。

2、实验结果

如图3所示，CFH-01全长蛋白与本公开的CFH-79蛋白和CFH-84蛋白在给药后第7天和第10天对于小鼠CNV模型光斑渗透改善率都有明显的作用。

给药7天和10天后，所有的实验组CFH-01、CFH-79和CFH-84都相对于对照组PBS有明显的三级光斑数减少的趋势，给药10天后，实验组CFH-84(2.5mg/mL)三级光斑全部消失(表10)。CFH-01和CFH-84都相对于对照组PBS有明显的光斑渗透率有明显改善，并且CFH-84(2.5mg/mL)具有高于CFH-01(2.5mg/mL)的平均改善率(表11)。

表10.第0、7、10天的三级光斑数量及比例

表11.第0、7、10天的光斑渗透平均改善率

蛋白编号(样品浓度)	第7天平均改善率	第10天平均改善率
			CFH-01(2.5mg/mL)	39.37	48.79
CHF-84(2.5mg/mL)	50.51	55.47
			PBS，pH7.2	10.07	19.81

实施例9.AAV递送的CFH基因表达盒的结构

本实施例提供的表达载体含有表达CFH截短体的核酸分子，其结构从5’端至3’端含有：CMV增强子、CMV启动子、X.laevis beta-globin 5’UTR、Kozak序列(gccacc)、CFH截短体编码序列、X.laevis beta-globin 3’UTR、WPRE以及SV40 polyA，其中：CMV增强子的核酸序列如SEQ ID NO:38所示，CMV启动子核酸序列如SEQ ID NO:39所示，X.laevis beta-globin 5’UTR的核酸序列如SEQ ID NO:40所示，Kozak序列如下所示、CFH截短体的编码序列如下所示：SEQ ID NO:41-43分别对应CFH-79的野生型序列、CFH-79密码子优化序列1与CFH-79密码子优化序列2；SEQ ID NO:44-46分别对应CFH-84的野生型序列、CFH-84的密码子优化序列1与CFH-84的密码子优化序列2；SEQ ID NO:47-49分别对应CFH-37.1的野生型序列、CFH-37.1的密码子优化序列1、CFH-37.1的密码子优化序列2；SEQ ID NO:50-52分别对应CFH-73的野生型序列、CFH-73的密码子优化序列1、CFH-73的密码子优化序列2；SEQ IDNO:53-55分别对应CFH-82的野生型序列、CFH-82的密码子优化序列1、CFH-82的密码子优化序列2、X.laevis beta-globin 3’UTR序列如SEQ ID NO:56所示、WPRE序列如SEQ ID NO:57所示、SV40 polyA序列如SEQ ID NO:58所示，衣壳蛋白序列如SEQ ID NO:59所示。

CMV增强子序列：

CGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCC

CCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGG

GACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGG

CAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGAC

GGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCC

TACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATG

SEQ ID NO:38CMV启动子序列：

TGCTGATGCGGTTTTGGCAGTACACCAATGGGCGTGGATAGCGGTTTGACTC

ACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGG

CACCAAAATCAACGGGACTTTCCAAAATGTCGTAATAACCCCGCCCCGTTGA

CGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTCG

TTTAGTGAACCGTCAGATCGCCTGGAGAGGCCATCCACGCTGTTTTGACCTC

CATAGTGGACACCGGGACCGATCCAGCCTCCGCGTCTCAGGGGAAGCTT

SEQ ID NO:39X.laevis beta-globin 5’UTR序列：

CTTGTTCTTTTTGCAGAAGCTCAGAATAAACGCTCAACTTTGG

SEQ ID NO:40Kozak序列：

GCCACC CFH-79的野生型序列：

ATGAGACTTCTAGCAAAGATTATTTGCCTTATGTTATGGGCTATTTGTGTAGCA

GAAGATTGCAATGAACTTCCTCCAAGAAGAAATACAGAAATTCTGACAGGTT

CCTGGTCTGACCAAACATATCCAGAAGGCACCCAGGCTATCTATAAATGCCGC

CCTGGATATAGATCTCTTGGAAATGTAATAATGGTATGCAGGAAGGGAGAATG

GGTTGCTCTTAATCCATTAAGGAAATGTCAGAAAAGGCCCTGTGGACATCCT

GGAGATACTCCTTTTGGTACTTTTACCCTTACAGGAGGAAATGTGTTTGAATA

TGGTGTAAAAGCTGTGTATACATGTAATGAGGGGTATCAATTGCTAGGTGAGA

TTAATTACCGTGAATGTGACACAGATGGATGGACCAATGATATTCCTATATGTG

AAGTTGTGAAGTGTTTACCAGTGACAGCACCAGAGAATGGAAAAATTGTCA

GTAGTGCAATGGAACCAGATCGGGAATACCATTTTGGACAAGCAGTACGGTT

TGTATGTAACTCAGGCTACAAGATTGAAGGAGATGAAGAAATGCATTGTTCA

GACGATGGTTTTTGGAGTAAAGAGAAACCAAAGTGTGTGGAAATTTCATGCA

AATCCCCAGATGTTATAAATGGATCTCCTATATCTCAGAAGATTATTTATAAGG

AGAATGAACGATTTCAATATAAATGTAACATGGGTTATGAATACAGTGAAAGA

GGAGATGCTGTATGCACTGAATCTGGATGGCGTCCGTTGCCTTCATGTGAAGA

AGGCGGCGGAGGATCTGGCGGCGGCGGCAGCGGCGGCGGAGGCAGCACCT

CCTGTGTGAATCCGCCCACAGTACAAAATGCTTATATAGTGTCGAGACAGATG

AGTAAATATCCATCTGGTGAGAGAGTACGTTATCAATGTAGGAGCCCTTATGA

AATGTTTGGGGATGAAGAAGTGATGTGTTTAAATGGAAACTGGACGGAACCA

CCTCAATGCAAAGATTCTACAGGAAAATGTGGGCCCCCTCCACCTATTGACA

ATGGGGACATTACTTCATTCCCGTTGTCAGTATATGCTCCAGCTTCATCAGTTG

AGTACCAATGCCAGAACTTGTATCAACTTGAGGGTAACAAGCGAATAACATG

TAGAAATGGACAATGGTCAGAACCACCAAAATGCTTACATCCGTGTGTAATAT

CCCGAGAAATTATGGAAAATTATAACATAGCATTAAGGTGGACAGCCAAACA

GAAGCTTTATTCGAGAACAGGTGAATCAGTTGAATTTGTGTGTAAACGGGGA

TATCGTCTTTCATCACGTTCTCACACATTGCGAACAACATGTTGGGATGGGAA

ACTGGAGTATCCAACTTGTGCAAAAGGCGGCGGAGGATCTGGCGGCGGCGG

CAGCGGCGGCGGAGGCAGCAAACCTTGTGATTATCCAGACATTAAACATGGA

GGTCTATATCATGAGAATATGCGTAGACCATACTTTCCAGTAGCTGTAGGAAA

ATATTACTCCTATTACTGTGATGAACATTTTGAGACTCCGTCAGGAAGTTACTG

GGATCACATTCATTGCACACAAGATGGATGGTCGCCAGCAGTACCATGCCTC

AGAAAATGTTATTTTCCTTATTTGGAAAATGGATATAATCAAAATTATGGAAGA

AAGTTTGTACAGGGTAAATCTATAGACGTTGCCTGCCATCCTGGCTACGCTCT

TCCAAAAGCGCAGACCACAGTTACATGTATGGAGAATGGCTGGTCTCCTACT

CCCAGATGCATCCGTGTCAAAACATGTTCCAAATCAAGTATAGATATTGAGAA

TGGGTTTATTTCTGAATCTCAGTATACATATGCCTTAAAAGAAAAAGCGAAAT

ATCAATGCAAACTAGGATATGTAACAGCAGATGGTGAAACATCAGGATCAATT

ACATGTGGGAAAGATGGATGGTCAGCTCAACCCACGTGCATTAAA

SEQ ID NO:41

CFH-79的密码子优化序列1：

ATGAGACTGCTGGCCAAGATCATCTGCCTGATGCTGTGGGCCATCTGCGTGG

CCGAGGACTGCAACGAGCTGCCCCCTAGAAGAAACACCGAGATCCTGACCG

GCAGCTGGAGCGATCAGACCTACCCCGAGGGCACCCAAGCCATCTACAAGT

GCAGACCCGGCTACAGAAGCCTGGGCAACGTGATCATGGTGTGCAGAAAGG

GCGAGTGGGTGGCCCTGAACCCCCTGAGAAAGTGTCAGAAGAGACCCTGCG

GCCACCCCGGCGACACCCCCTTCGGCACCTTCACCCTGACCGGCGGCAACG

TGTTCGAGTACGGCGTGAAGGCCGTGTACACCTGCAACGAGGGCTATCAGCT

GCTGGGCGAGATCAACTACAGAGAGTGCGACACCGACGGCTGGACCAACGA

CATCCCCATCTGCGAGGTGGTGAAGTGCCTGCCCGTGACCGCCCCCGAGAAC

GGCAAGATCGTGAGCAGCGCCATGGAGCCCGACAGAGAGTACCACTTCGGC

CAAGCCGTGAGATTCGTGTGCAACAGCGGCTACAAGATCGAGGGCGATGAG

GAGATGCACTGCAGCGACGACGGCTTCTGGAGCAAGGAGAAGCCCAAGTGC

GTGGAGATCAGCTGCAAGAGCCCCGACGTGATCAACGGCTCCCCCATCAGCC

AAAAGATCATCTACAAGGAGAACGAGAGATTTCAGTACAAGTGCAACATGG

GCTACGAGTACAGCGAAAGAGGCGACGCCGTGTGCACCGAGTCCGGCTGGC

GGCCTCTCCCCTCCTGCGAAGAGGGGGGGGGGGGCAGCGGCGGGGGCGGG

AGCGGCGGGGGCGGCTCCACAAGCTGCGTGAACCCCCCCACCGTGCAGAAC

GCCTACATCGTGAGCAGACAGATGAGCAAGTACCCTAGCGGCGAGAGAGTG

AGATATCAGTGCAGAAGCCCCTACGAGATGTTCGGCGACGAAGAGGTGATGT

GCCTGAACGGCAACTGGACCGAGCCCCCTCAGTGCAAAGATAGCACCGGCA

AGTGCGGCCCCCCTCCCCCCATCGACAACGGCGACATCACAAGCTTCCCCCT

GAGCGTGTACGCCCCCGCTAGCAGCGTGGAGTATCAGTGTCAGAACCTGTAT

CAGCTGGAGGGCAACAAGAGAATCACCTGCAGAAACGGGCAGTGGAGCGA

GCCCCCCAAATGTCTCCATCCCTGCGTGATCAGCAGAGAGATCATGGAGAAC

TACAACATCGCCCTGAGATGGACCGCCAAGCAGAAGCTGTACAGCAGAACC

GGCGAGAGCGTGGAGTTCGTGTGCAAGAGAGGCTACAGACTGAGCAGCAG

AAGCCACACCCTGAGAACCACCTGTTGGGACGGCAAGCTCGAGTACCCCAC

CTGCGCCAAGGGGGGGGGCGGCAGCGGCGGGGGGGGCAGCGGGGGGGGCG

GGTCCAAACCCTGCGACTACCCCGACATCAAGCACGGCGGCCTGTACCACG

AGAACATGAGAAGACCCTACTTCCCCGTGGCCGTGGGCAAGTACTACAGCTA

CTACTGCGACGAGCACTTCGAGACCCCTAGCGGCAGCTACTGGGACCACATC

CACTGCACCCAAGACGGCTGGAGCCCCGCTGTGCCCTGCCTCAGAAAGTGC

TACTTCCCCTACCTGGAGAACGGGTACAATCAGAACTACGGCAGAAAGTTCG

TGCAAGGCAAGAGCATCGACGTGGCCTGCCACCCCGGCTACGCCCTGCCCA

AGGCTCAGACCACCGTGACCTGCATGGAGAATGGCTGGAGCCCTACCCCTAG

ATGCATCAGAGTGAAGACCTGCAGCAAGAGCAGCATCGACATCGAGAACGG

CTTCATCAGCGAGAGCCAATACACCTACGCCCTGAAGGAGAAGGCCAAGTAT

CAGTGCAAGCTGGGCTACGTGACCGCCGACGGCGAGACAAGCGGCAGCATC

ACCTGCGGCAAGGATGGCTGGAGCGCTCAGCCCACCTGCATCAAG

SEQ ID NO:42

CFH-79的密码子优化序列2：

ATGAGACTGCTGGCCAAGATCATCTGCCTGATGCTGTGGGCCATCTGCGTGG

CTGAAGATTGCAACGAGCTGCCACCAAGAAGAAATACCGAGATCCTGACCG

GCAGCTGGTCCGACCAGACATACCCCGAGGGCACCCAGGCTATCTACAAGTG

CCGGCCTGGATATAGAAGCCTGGGCAACGTGATCATGGTGTGCAGAAAAGGC

GAATGGGTGGCTCTGAACCCTCTGCGGAAGTGCCAGAAGCGGCCATGTGGC

CACCCTGGCGATACACCGTTCGGCACCTTCACCCTGACAGGCGGCAATGTGT

TCGAGTACGGCGTGAAGGCTGTGTACACATGCAATGAGGGCTACCAGCTGCT

GGGGGAGATTAACTACCGGGAATGCGACACCGACGGATGGACCAACGACAT

CCCCATTTGTGAAGTGGTGAAATGCCTGCCTGTGACCGCCCCTGAGAACGGC

AAAATCGTGTCCAGCGCCATGGAACCTGATAGAGAGTACCACTTTGGCCAGG

CCGTGCGGTTTGTGTGCAACAGCGGCTACAAGATCGAGGGAGATGAAGAAA

TGCACTGCAGCGACGACGGCTTCTGGTCCAAGGAGAAGCCTAAGTGCGTCG

AGATCAGCTGCAAGAGCCCCGATGTGATCAACGGCAGTCCTATTTCCCAGAA

AATCATCTACAAGGAAAACGAGAGATTCCAGTACAAGTGCAACATGGGCTAT

GAGTATTCTGAACGGGGCGACGCCGTTTGCACGGAGAGCGGCTGGAGACCT

CTGCCTTCTTGCGAGGAGGGCGGCGGCGGAAGCGGCGGCGGCGGAAGCGG

TGGAGGCGGCTCTACCTCCTGCGTGAACCCTCCTACAGTGCAAAACGCCTAC

ATCGTGTCTAGACAGATGAGCAAATACCCTAGCGGCGAGCGGGTGCGGTACC

AGTGTAGATCTCCCTACGAGATGTTCGGCGACGAGGAAGTGATGTGCCTGAA

TGGAAACTGGACAGAGCCCCCCCAGTGCAAGGACAGCACCGGAAAGTGTG

GACCTCCACCCCCTATCGACAACGGCGACATCACCAGCTTCCCCCTGAGCGT

GTACGCCCCTGCCAGCAGCGTTGAATATCAATGTCAGAATCTGTACCAGCTGG

AAGGCAACAAGAGAATCACCTGTAGAAACGGCCAGTGGAGCGAGCCTCCCA

AGTGCCTGCACCCCTGCGTGATCAGCCGGGAAATCATGGAAAACTACAACAT

CGCCCTGAGATGGACCGCTAAGCAAAAGCTGTACAGCAGAACAGGAGAGAG

CGTCGAGTTCGTGTGCAAGAGAGGCTATAGACTGTCTAGCCGCAGCCACACC

CTGCGCACCACATGTTGGGACGGCAAGCTGGAATACCCCACATGTGCCAAGG

GCGGCGGAGGTTCTGGCGGCGGCGGATCTGGAGGCGGAGGCTCTAAACCTT

GCGACTACCCAGATATCAAACACGGCGGCCTGTATCACGAGAACATGCGGAG

ACCTTACTTTCCTGTGGCCGTGGGCAAGTACTACAGCTACTACTGCGATGAGC

ACTTCGAGACACCCAGCGGGAGCTACTGGGATCACATCCATTGTACCCAGGA

CGGATGGTCTCCGGCCGTCCCCTGCCTGAGAAAGTGCTACTTCCCCTACCTG

GAAAATGGCTACAACCAGAACTACGGCAGAAAGTTCGTGCAGGGGAAAAGC

ATCGACGTGGCCTGCCACCCCGGCTACGCCCTCCCTAAGGCCCAGACCACCG

TGACCTGTATGGAAAACGGCTGGAGCCCTACCCCTAGGTGCATCAGAGTGAA

GACCTGTAGCAAGTCCAGCATTGACATCGAGAACGGATTCATCAGCGAGAGC

CAGTATACATACGCACTTAAAGAGAAGGCCAAGTACCAGTGCAAGCTGGGCT

ACGTGACCGCCGACGGCGAAACCAGCGGCTCAATCACATGCGGCAAAGACG

GCTGGTCCGCCCAACCTACATGTATCAAG

SEQ ID NO:43

CFH-84的野生型序列：

ATGAGACTTCTAGCAAAGATTATTTGCCTTATGTTATGGGCTATTTGTGTAGCA

GAAGATTGCAATGAACTTCCTCCAAGAAGAAATACAGAAATTCTGACAGGTT

CCTGGTCTGACCAAACATATCCAGAAGGCACCCAGGCTATCTATAAATGCCGC

CCTGGATATAGATCTCTTGGAAATGTAATAATGGTATGCAGGAAGGGAGAATG

GGTTGCTCTTAATCCATTAAGGAAATGTCAGAAAAGGCCCTGTGGACATCCT

GGAGATACTCCTTTTGGTACTTTTACCCTTACAGGAGGAAATGTGTTTGAATA

TGGTGTAAAAGCTGTGTATACATGTAATGAGGGGTATCAATTGCTAGGTGAGA

TTAATTACCGTGAATGTGACACAGATGGATGGACCAATGATATTCCTATATGTG

AAGTTGTGAAGTGTTTACCAGTGACAGCACCAGAGAATGGAAAAATTGTCA

GTAGTGCAATGGAACCAGATCGGGAATACCATTTTGGACAAGCAGTACGGTT

TGTATGTAACTCAGGCTACAAGATTGAAGGAGATGAAGAAATGCATTGTTCA

GACGATGGTTTTTGGAGTAAAGAGAAACCAAAGTGTGTGGAAATTTCATGCA

AATCCCCAGATGTTATAAATGGATCTCCTATATCTCAGAAGATTATTTATAAGG

AGAATGAACGATTTCAATATAAATGTAACATGGGTTATGAATACAGTGAAAGA

GGAGATGCTGTATGCACTGAATCTGGATGGCGTCCGTTGCCTTCATGTGAAGA

AGGAGGAGGCGGCAGCGCCGAGGCCGCCGCTAAAGAAGCTGCCGCCAAGG

CTGGCGGCGGCGGCTCTACCTCCTGTGTGAATCCGCCCACAGTACAAAATGC

TTATATAGTGTCGAGACAGATGAGTAAATATCCATCTGGTGAGAGAGTACGTT

ATCAATGTAGGAGCCCTTATGAAATGTTTGGGGATGAAGAAGTGATGTGTTTA

AATGGACAATGGACGGAACCACCTCAATGCAAAGATTCTACAGGAAAATGTG

GGCCCCCTCCACCTATTGACAATGGGGACATTACTTCATTCCCGTTGTCAGTAT

ATGCTCCAGCTTCATCAGTTGAGTACCAATGCCAGAACTTGTATCAACTTGAG

GGTAACAAGCGAATAACATGTAGAAATGGACAATGGTCAGAACCACCAAAAT

GCTTACATCCGTGTGTAATATCCCGAGAAATTATGGAAAATTATAACATAGCAT

TAAGGTGGACAGCCAAACAGAAGCTTTATTCGAGAACAGGTGAATCAGTTG

AATTTGTGTGTAAACGGGGATATCGTCTTTCATCACGTTCTCACACATTGCGA

ACAACATGTTGGGATGGGAAACTGGAGTATCCAACTTGTGCAAAAGGAGGA

GGCGGCAGCGCCGAGGCCGCCGCTAAAGAAGCTGCCGCCAAGGCTGGCGGC

GGCGGCTCTAAACCTTGTGATTATCCAGACATTAAACATGGAGGTCTATATCAT

GAGAATATGCGTAGACCATACTTTCCAGTAGCTGTAGGAAAATATTACTCCTAT

TACTGTGATGAACATTTTGAGACTCCGTCAGGAAGTTACTGGGATCACATTCA

TTGCACACAAGATGGATGGTCGCCAGCAGTACCATGCCTCAGAAAATGTTAT

TTTCCTTATTTGGAAAATGGATATAATCAAAATTATGGAAGAAAGTTTGTACA

GGGTAAATCTATAGACGTTGCCTGCCATCCTGGCTACGCTCTTCCAAAAGCGC

AGACCACAGTTACATGTATGGAGAATGGCTGGTCTCCTACTCCCAGATGCATC

CGTGTCAAAACATGTTCCAAATCAAGTATAGATATTGAGAATGGGTTTATTTCT

GAATCTCAGTATACATATGCCTTAAAAGAAAAAGCGAAATATCAATGCAAACT

AGGATATGTAACAGCAGATGGTGAAACATCAGGATCAATTACATGTGGGAAA

GATGGATGGTCAGCTCAACCCACGTGCATTAAA

SEQ ID NO:44

CFH-84的密码子优化序列1：

ATGAGACTGCTGGCCAAGATCATCTGCCTGATGCTGTGGGCCATCTGCGTGGCCGAGGACTGCAACGAGCTGCCCCCTAGAAGAAACACCGAGATCCTGACCGGCAGCTGGAGCGATCAGACCTACCCCGAGGGCACCCAAGCCATCTACAAGTGCAGACCCGGCTACAGAAGCCTGGGCAACGTGATCATGGTGTGCAGAAAGGGCGAGTGGGTGGCCCTGAACCCCCTGAGAAAATGCCAAAAGAGACCCTGCGGCCACCCCGGCGACACCCCCTTCGGCACCTTCACCCTGACCGGCGGCAACGTGTTCGAGTACGGCGTGAAGGCCGTGTACACCTGCAACGAGGGCTATCAGCTGCTGGGCGAGATCAACTACAGAGAGTGCGACACCGACGGCTGGACCAACGACATCCCCATCTGCGAGGTGGTGAAGTGCCTGCCCGTGACCGCCCCCGAGAACGGCAAGATCGTGAGCAGCGCCATGGAGCCCGACAGAGAGTACCACTTCGGCCAAGCCGTGAGATTCGTGTGCAACAGCGGCTACAAGATCGAGGGCGACGAAGAGATGCACTGCAGCGACGACGGCTTCTGGAGCAAGGAGAAGCCCAAGTGCGTGGAGATCAGCTGCAAGAGCCCCGACGTGATCAACGGCAGCCCCATCTCCCAAAAGATCATCTACAAGGAGAACGAGAGATTTCAGTACAAGTGCAACATGGGCTACGAGTATAGCGAGAGAGGCGACGCCGTCTGTACCGAATCCGGCTGGAGACCCCTCCCCTCCTGTGAGGAGGGCGGCGGGGGCAGCGCCGAGGCTGCCGCTAAAGAGGCCGCTGCCAAGGCCGGCGGGGGGGGGAGCACATCCTGCGTCAACCCCCCCACCGTGCAGAACGCCTACATCGTGAGCAGACAGATGAGCAAGTACCCTAGCGGCGAGAGAGTGAGATATCAGTGCAGAAGCCCCTACGAGATGTTCGGCGACGAAGAGGTGATGTGCCTGAATGGGCAGTGGACCGAGCCCCCTCAGTGCAAGGACAGCACCGGCAAGTGCGGCCCTCCCCCTCCCATCGACAACGGCGACATCACAAGCTTCCCCCTGAGCGTGTACGCCCCCGCTAGCAGCGTGGAGTATCAGTGTCAGAACCTGTATCAGCTGGAGGGCAACAAGAGAATCACCTGCAGAAACGGGCAGTGGAGCGAGCCCCCCAAGTGCCTGCACCCCTGCGTGATCAGCAGAGAGATCATGGAGAACTACAACATCGCCCTGAGATGGACCGCCAAGCAGAAGCTGTACAGCAGAACCGGCGAGAGCGTGGAGTTCGTGTGCAAGAGAGGCTACAGACTGAGCAGCAGAAGCCACACCCTGAGAACCACCTGTTGGGACGGGAAGCTGGAGTACCCTACCTGCGCCAAGGGCGGCGGGGGGAGCGCCGAGGCTGCCGCTAAGGAGGCCGCTGCCAAGGCCGGCGGGGGCGGCAGCAAGCCCTGCGACTACCCCGACATCAAGCACGGCGGCCTGTACCACGAGAACATGAGAAGACCCTACTTCCCCGTGGCCGTGGGCAAGTACTACAGCTACTACTGCGACGAGCACTTCGAGACCCCTAGCGGCAGCTACTGGGACCACATCCACTGCACCCAAGATGGCTGGAGCCCTGCCGTGCCCTGCCTGAGAAAGTGCTACTTCCCCTACCTGGAGAACGGGTACAATCAGAACTACGGCAGAAAGTTCGTGCAAGGCAAGAGCATCGACGTGGCCTGCCACCCCGGCTACGCCCTGCCCAAGGCTCAGACCACCGTGACCTGCATGGAGAACGGCTGGAGCCCCACCCCTAGATGCATCAGAGTGAAGACCTGCAGCAAGAGCAGCATCGACATCGAGAACGGCTTCATCAGCGAGAGCCAATACACCTACGCCCTGAAGGAGAAGGCCAAGTATCAGTGCAAGCTGGGCTACGTGACCGCCGACGGCGAGACAAGCGGCAGCATCACCTGCGGCAAGGACGGCTGGAGCGCTCAGCCCACCTGCATCAAG

SEQ ID NO:45

CFH-84的密码子优化序列2：

ATGCGGCTGCTGGCCAAGATCATCTGCCTGATGCTGTGGGCCATCTGTGTGGCCGAAGATTGCAATGAGCTGCCCCCAAGAAGAAATACCGAGATCCTGACAGGATCTTGGTCTGACCAGACCTACCCTGAAGGCACACAGGCCATCTACAAATGCAGACCTGGATACAGGTCTCTCGGAAATGTGATCATGGTCTGCCGGAAGGGCGAGTGGGTGGCCCTGAATCCTCTGAGAAAATGCCAAAAACGCCCTTGCGGCCA

CCCCGGCGACACCCCCTTCGGCACCTTCACCCTGACCGGCGGAAACGTGTTC

GAATACGGCGTGAAGGCCGTCTACACCTGCAACGAGGGCTACCAGCTGCTG

GGCGAGATCAACTATAGAGAGTGCGATACCGACGGCTGGACCAACGACATCC

CTATCTGCGAAGTGGTGAAATGTCTGCCCGTGACAGCTCCTGAGAACGGCAA

GATCGTGTCCAGCGCCATGGAACCTGATAGGGAGTACCATTTCGGCCAGGCC

GTGCGGTTTGTGTGCAACAGCGGATACAAGATCGAGGGCGATGAGGAAATG

CACTGCAGCGACGACGGCTTCTGGAGCAAAGAGAAGCCCAAGTGCGTCGAA

ATCTCGTGCAAGAGCCCTGACGTGATCAATGGTTCCCCTATTAGTCAGAAGAT

CATCTACAAGGAGAACGAGCGATTTCAATACAAGTGTAACATGGGCTACGAG

TACAGCGAAAGAGGTGACGCCGTTTGTACCGAGAGCGGCTGGCGGCCTCTG

CCTAGCTGTGAAGAGGGCGGCGGCGGCAGCGCCGAGGCCGCCGCTAAGGAA

GCCGCCGCTAAGGCCGGAGGCGGCGGCAGCACCAGTTGCGTGAACCCTCCC

ACCGTGCAAAACGCCTACATCGTGTCCCGGCAGATGTCCAAGTACCCTTCTG

GAGAGCGGGTTAGATACCAGTGCAGAAGCCCATACGAGATGTTCGGCGATGA

GGAAGTGATGTGTCTGAACGGCCAGTGGACCGAGCCCCCCCAGTGCAAAGA

CAGCACCGGCAAGTGCGGCCCTCCTCCTCCAATCGACAACGGCGACATCAC

AAGTTTCCCACTGAGCGTGTACGCCCCGGCTTCTTCTGTCGAGTATCAGTGCC

AAAACCTGTACCAGCTGGAAGGCAACAAGAGAATCACCTGCAGAAACGGAC

AGTGGTCCGAGCCTCCAAAGTGCCTGCACCCTTGCGTGATCTCTCGGGAAAT

CATGGAGAACTATAACATCGCCCTGAGATGGACAGCCAAGCAGAAGCTGTAT

AGCCGGACCGGCGAGAGCGTGGAATTCGTGTGCAAGCGGGGCTATAGACTG

AGCTCCCGGAGCCACACACTGAGAACTACATGCTGGGATGGCAAGCTGGAAT

ACCCCACATGCGCCAAAGGCGGAGGCGGCTCAGCTGAGGCTGCCGCCAAGG

AAGCCGCCGCAAAGGCCGGCGGAGGCGGCAGCAAGCCTTGCGACTACCCCG

ATATTAAGCACGGTGGTCTTTACCACGAGAACATGAGAAGACCTTACTTTCCT

GTGGCTGTGGGCAAGTATTACAGCTACTACTGCGACGAGCACTTCGAGACAC

CTAGCGGCAGCTACTGGGACCACATCCACTGTACACAGGACGGCTGGAGCCC

CGCCGTGCCCTGTCTGAGAAAGTGCTACTTCCCTTACCTGGAAAACGGATAC

AACCAGAACTACGGCAGAAAATTCGTGCAGGGCAAAAGCATCGACGTGGCA

TGTCACCCTGGCTACGCCCTCCCCAAGGCTCAGACAACCGTGACCTGCATGG

AAAATGGTTGGAGCCCCACCCCTAGATGCATCAGAGTGAAGACCTGTAGCAA

GTCCAGCATCGACATTGAGAACGGATTCATCTCTGAAAGCCAGTACACCTAC

GCCCTGAAGGAGAAGGCTAAATACCAGTGCAAGCTGGGCTACGTGACAGCC

GACGGAGAAACCAGCGGCAGCATCACCTGTGGCAAGGATGGCTGGAGCGCC

CAGCCTACATGTATCAAG

SEQ ID NO:46

CFH-37.1的野生型序列：

ATGAGACTTCTAGCAAAGATTATTTGCCTTATGTTATGGGCTATTTGTGTAGCA

GAAGATTGCAATGAACTTCCTCCAAGAAGAAATACAGAAATTCTGACAGGTT

CCTGGTCTGACCAAACATATCCAGAAGGCACCCAGGCTATCTATAAATGCCGC

CCTGGATATAGATCTCTTGGAAATGTAATAATGGTATGCAGGAAGGGAGAATG

GGTTGCTCTTAATCCATTAAGGAAATGTCAGAAAAGGCCCTGTGGACATCCT

GGAGATACTCCTTTTGGTACTTTTACCCTTACAGGAGGAAATGTGTTTGAATA

TGGTGTAAAAGCTGTGTATACATGTAATGAGGGGTATCAATTGCTAGGTGAGA

TTAATTACCGTGAATGTGACACAGATGGATGGACCAATGATATTCCTATATGTG

AAGTTGTGAAGTGTTTACCAGTGACAGCACCAGAGAATGGAAAAATTGTCA

GTAGTGCAATGGAACCAGATCGGGAATACCATTTTGGACAAGCAGTACGGTT

TGTATGTAACTCAGGCTACAAGATTGAAGGAGATGAAGAAATGCATTGTTCA

GACGATGGTTTTTGGAGTAAAGAGAAACCAAAGTGTGTGGAAATTTCATGCA

AATCCCCAGATGTTATAAATGGATCTCCTATATCTCAGAAGATTATTTATAAGG

AGAATGAACGATTTCAATATAAATGTAACATGGGTTATGAATACAGTGAAAGA

GGAGATGCTGTATGCACTGAATCTGGATGGCGTCCGTTGCCTTCATGTGAAGA

AAAATCATGTGATAATCCTTATATTCCAAATGGTGACTACTCACCTTTAAGGAT

TAAACACAGAACTGGAGATGAAATCACGTACCAGTGTAGAAATGGTTTTTAT

CCTGCAACCCGGGGAAATACAGCAAAATGCACAAGTACTGGCTGGATACCTG

CTCCGAGATGTACCTTGAAACCTTGTGATTATCCAGACATTAAACATGGAGGT

CTATATCATGAGAATATGCGTAGACCATACTTTCCAGTAGCTGTAGGAAAATAT

TACTCCTATTACTGTGATGAACATTTTGAGACTCCGTCAGGAAGTTACTGGGA

TCACATTCATTGCACACAAGATGGATGGTCGCCAGCAGTACCATGCCTCAGA

AAATGTTATTTTCCTTATTTGGAAAATGGATATAATCAAAATTATGGAAGAAAG

TTTGTACAGGGTAAATCTATAGACGTTGCCTGCCATCCTGGCTACGCTCTTCC

AAAAGCGCAGACCACAGTTACATGTATGGAGAATGGCTGGTCTCCTACTCCC

AGATGCATCCGTGTCAAAACATGTTCCAAATCAAGTATAGATATTGAGAATGG

GTTTATTTCTGAATCTCAGTATACATATGCCTTAAAAGAAAAAGCGAAATATCA

ATGCAAACTAGGATATGTAACAGCAGATGGTGAAACATCAGGATCAATTACAT

GTGGGAAAGATGGATGGTCAGCTCAACCCACGTGCATTAAAGGAGGAGGCG

GCAGCGCCGAGGCCGCCGCTAAAGAAGCTGCCGCCAAGGCTGGCGGCGGCG

GCTCTATTCCATGTTCACAACCACCTCAGATAGAACACGGAACCATTAATTCA

TCCAGGTCTTCACAAGAAAGTTATGCACATGGGACTAAATTGAGTTATACTTG

TGAGGGTGGTTTCAGGATATCTGAAGAAAATGAAACAACATGCTACATGGGA

AAATGGAGTTCTCCACCTCAGTGTGAAGGCCTTCCTTGTAAATCTCCACCTG

AGATTTCTCATGGTGTTGTAGCTCACATGTCAGACAGTTATCAGTATGGAGAA

GAAGTTACGTACAAATGTTTTGAAGGTTTTGGAATTGATGGGCCTGCAATTGC

AAAATGCTTAGGAGAAAAATGGTCTCACCCTCCATCATGCATAAAAACAGAT

TGTCTCAGTTTACCTAGCTTTGAAAATGCCATACCCATGGGAGAGAAGAAGG

ATGTGTATAAGGCGGGTGAGCAAGTGACTTACACTTGTGCAACATATTACAAA

ATGGATGGAGCCAGTAATGTAACATGCATTAATAGCAGATGGACAGGAAGGC

CAACATGCAGAGACACCTCCTGTGTGAATCCGCCCACAGTACAAAATGCTTA

TATAGTGTCGAGACAGATGAGTAAATATCCATCTGGTGAGAGAGTACGTTATC

AATGTAGGAGCCCTTATGAAATGTTTGGGGATGAAGAAGTGATGTGTTTAAAT

GGAAACTGGACGGAACCACCTCAATGCAAAGATTCTACAGGAAAATGTGGG

CCCCCTCCACCTATTGACAATGGGGACATTACTTCATTCCCGTTGTCAGTATAT

GCTCCAGCTTCATCAGTTGAGTACCAATGCCAGAACTTGTATCAACTTGAGG

GTAACAAGCGAATAACATGTAGAAATGGACAATGGTCAGAACCACCAAAATG

CTTACATCCGTGTGTAATATCCCGAGAAATTATGGAAAATTATAACATAGCATT

AAGGTGGACAGCCAAACAGAAGCTTTATTCGAGAACAGGTGAATCAGTTGA

ATTTGTGTGTAAACGGGGATATCGTCTTTCATCACGTTCTCACACATTGCGAA

CAACATGTTGGGATGGGAAACTGGAGTATCCAACTTGTGCAAAAGGGGGGG

GCGGCAGC

SEQ ID NO:47

CFH-37.1的密码子优化序列1：

ATGAGACTGCTGGCCAAGATCATCTGCCTGATGCTGTGGGCCATCTGCGTGG

CCGAGGACTGCAACGAGCTGCCCCCTAGAAGAAACACCGAGATCCTGACCG

GCAGCTGGAGCGATCAGACCTACCCCGAGGGCACCCAAGCCATCTACAAGT

GCAGACCCGGCTACAGAAGCCTGGGCAACGTGATCATGGTGTGCAGAAAGG

GCGAGTGGGTGGCCCTGAACCCCCTGAGAAAGTGTCAGAAGAGACCCTGCG

GCCACCCCGGCGACACCCCCTTCGGCACCTTCACCCTGACCGGCGGCAACG

TGTTCGAGTACGGCGTGAAGGCCGTGTACACCTGCAACGAGGGCTATCAGCT

GCTGGGCGAGATCAACTACAGAGAGTGCGACACCGACGGCTGGACCAACGA

CATCCCCATCTGCGAGGTGGTGAAGTGCCTGCCCGTGACCGCCCCCGAGAAC

GGCAAGATCGTGAGCAGCGCCATGGAGCCCGACAGAGAGTACCACTTCGGC

CAAGCCGTGAGATTCGTGTGCAACAGCGGCTACAAGATCGAGGGCGACGAG

GAGATGCACTGCAGCGACGACGGCTTCTGGAGCAAGGAGAAGCCCAAGTGC

GTGGAGATCAGCTGCAAGAGCCCTGACGTCATCAACGGCAGCCCCATCAGC

CAAAAAATCATCTACAAGGAGAACGAGAGATTTCAGTACAAGTGCAACATG

GGCTACGAGTACAGCGAGAGAGGCGACGCCGTGTGCACCGAGAGCGGCTGG

AGACCCCTGCCTAGCTGCGAGGAGAAGAGCTGCGACAACCCCTACATCCCC

AACGGCGACTACAGCCCCCTGAGAATCAAGCACAGAACCGGCGACGAGATC

ACCTATCAGTGCAGAAACGGCTTCTACCCCGCCACAAGAGGCAACACCGCC

AAGTGCACAAGCACCGGCTGGATCCCCGCCCCTAGATGCACCCTGAAGCCCT

GCGACTACCCTGACATCAAGCACGGCGGCCTGTACCACGAGAACATGAGAA

GACCCTACTTCCCCGTGGCCGTGGGCAAGTACTACAGCTACTACTGCGACGA

GCACTTCGAGACCCCTAGCGGCAGCTACTGGGACCACATCCACTGCACCCAA

GATGGCTGGAGCCCTGCCGTGCCCTGCCTGCGGAAGTGCTACTTCCCCTACC

TCGAGAACGGCTATAATCAGAACTACGGCAGAAAGTTCGTGCAAGGCAAGA

GCATCGACGTGGCCTGCCACCCCGGCTACGCCCTGCCCAAGGCTCAGACCAC

CGTGACCTGCATGGAAAATGGCTGGAGCCCCACCCCTAGATGCATCAGAGTG

AAGACCTGCAGCAAGAGCAGCATCGACATTGAGAACGGCTTCATCAGCGAG

AGCCAATACACCTACGCCCTGAAGGAGAAGGCCAAGTATCAGTGCAAGCTG

GGCTACGTGACCGCCGACGGCGAGACAAGCGGCAGCATCACCTGCGGCAAG

GACGGCTGGAGCGCCCAACCCACCTGCATTAAGGGGGGCGGGGGCAGCGCC

GAAGCCGCCGCTAAAGAGGCCGCCGCTAAGGCCGGCGGCGGGGGCAGCATC

CCTTGTAGCCAACCCCCTCAGATCGAGCACGGCACCATCAACAGCAGCAGA

AGCAGCCAAGAGAGCTACGCCCACGGCACCAAGCTGAGCTACACCTGCGAG

GGCGGCTTCAGAATCAGCGAGGAGAATGAGACCACCTGCTACATGGGGAAA

TGGAGCAGCCCTCCTCAGTGCGAAGGCCTGCCTTGTAAGAGCCCCCCCGAGA

TCAGCCACGGCGTGGTGGCCCACATGAGCGACAGCTATCAGTACGGCGAAG

AGGTGACCTACAAATGCTTCGAGGGCTTCGGCATCGACGGCCCCGCCATCGC

CAAGTGCCTGGGCGAGAAGTGGAGCCACCCCCCTAGCTGCATCAAGACCGA

CTGCCTGAGCCTGCCTAGCTTCGAGAACGCCATCCCCATGGGCGAGAAGAAG

GACGTGTACAAGGCCGGCGAGCAAGTGACCTACACCTGCGCCACCTACTAC

AAGATGGACGGCGCTAGCAACGTCACATGCATCAATAGCCGGTGGACCGGCA

GACCCACCTGCAGAGACACAAGCTGCGTGAACCCCCCTACCGTGCAGAACG

CCTACATCGTGAGCAGACAGATGAGCAAGTACCCTAGCGGCGAGAGAGTGA

GATATCAGTGCAGAAGCCCCTACGAGATGTTCGGGGATGAAGAGGTGATGTG

CCTGAACGGCAACTGGACCGAGCCCCCTCAGTGTAAAGACAGCACCGGCAA

GTGCGGGCCTCCCCCTCCCATCGACAACGGCGACATCACAAGCTTCCCCCTG

AGCGTGTACGCCCCCGCTAGCAGCGTGGAGTATCAGTGTCAGAACCTGTATC

AGCTGGAGGGCAACAAGAGAATCACCTGCAGAAATGGGCAGTGGAGCGAG

CCTCCTAAGTGCCTGCACCCCTGCGTGATCAGCAGAGAGATCATGGAGAACT

ACAACATCGCCCTGAGATGGACCGCCAAGCAGAAGCTGTACAGCCGGACCG

GCGAGAGCGTGGAGTTCGTGTGCAAGAGAGGCTACAGACTGAGCAGCAGA

AGCCACACCCTGAGAACCACCTGCTGGGACGGCAAGCTGGAGTACCCCACC

TGCGCCAAGGGGGGGGGCGGCAGC

SEQ ID NO:48

CFH-37.1的密码子优化序列2：

ATGCGCCTGCTGGCCAAAATCATCTGCCTGATGCTGTGGGCCATCTGCGTGGC

TGAAGATTGTAACGAGCTGCCTCCACGGCGGAACACCGAGATCCTGACCGGT

AGCTGGAGCGATCAGACCTACCCCGAAGGCACCCAGGCCATCTACAAATGCC

GCCCCGGCTACCGGAGCCTGGGCAATGTGATCATGGTGTGCAGAAAGGGCG

AATGGGTGGCCCTGAACCCTCTGCGGAAGTGTCAGAAAAGACCCTGCGGCC

ACCCCGGCGACACCCCTTTCGGAACCTTCACCCTGACAGGTGGCAACGTGTT

CGAGTACGGCGTGAAGGCCGTGTACACCTGCAACGAGGGCTATCAGCTGCTG

GGCGAGATTAACTACAGAGAGTGCGACACCGATGGCTGGACAAACGACATC

CCCATCTGCGAAGTGGTGAAATGTCTTCCTGTTACAGCCCCTGAGAACGGGA

AGATCGTGTCCTCCGCAATGGAGCCTGATAGAGAATACCACTTCGGCCAGGC

CGTGCGGTTCGTGTGCAATAGCGGCTACAAGATTGAAGGCGATGAGGAAATG

CACTGTTCTGACGACGGCTTTTGGAGCAAGGAGAAGCCTAAGTGCGTGGAA

ATCAGCTGTAAAAGCCCCGACGTCATCAACGGAAGCCCTATCTCTCAGAAGA

TCATCTACAAGGAGAACGAGAGATTTCAGTACAAGTGTAATATGGGATACGA

GTACAGCGAACGGGGCGACGCCGTTTGCACAGAAAGCGGCTGGCGGCCTCT

GCCTTCTTGCGAGGAAAAAAGCTGCGACAACCCCTACATCCCAAACGGGGA

CTACTCTCCCCTGCGGATCAAGCACCGGACCGGCGATGAGATCACGTATCAG

TGCCGAAACGGCTTCTACCCTGCCACCAGAGGCAATACCGCCAAGTGCACTA

GCACCGGGTGGATCCCCGCCCCTAGATGCACACTGAAGCCCTGCGATTACCC

TGACATCAAGCACGGCGGACTGTATCACGAGAACATGAGAAGACCTTACTTT

CCTGTGGCCGTGGGCAAATACTACAGCTACTACTGCGACGAGCACTTCGAGA

CCCCTAGCGGAAGCTACTGGGACCACATCCACTGCACCCAAGACGGCTGGTC

CCCCGCTGTTCCTTGTCTGAGAAAGTGCTACTTCCCATACCTGGAGAACGGCT

ATAACCAGAATTACGGCAGAAAATTCGTGCAGGGCAAGAGCATCGACGTGG

CCTGCCACCCTGGCTACGCCCTGCCTAAGGCCCAGACCACCGTGACATGTAT

GGAAAATGGCTGGTCTCCTACACCTAGATGCATCAGGGTGAAGACATGCAGC

AAGAGCTCTATCGATATCGAAAATGGCTTCATCTCCGAAAGCCAGTACACCTA

CGCCCTGAAGGAAAAGGCCAAGTACCAGTGCAAGCTGGGATACGTGACCGC

CGACGGCGAAACAAGCGGCAGCATCACCTGTGGCAAGGACGGCTGGTCCGC

TCAGCCCACCTGCATCAAAGGAGGAGGCGGCAGCGCCGAGGCCGCCGCTAA

AGAAGCTGCCGCCAAGGCTGGCGGCGGCGGCTCTATCCCTTGCAGCCAGCCT

CCTCAAATCGAGCACGGAACCATTAATTCCTCTAGAAGCAGCCAAGAGAGCT

ACGCCCACGGCACCAAGCTGAGCTATACATGCGAGGGAGGATTTAGAATCAG

CGAGGAGAACGAAACCACGTGCTACATGGGCAAGTGGAGCAGCCCCCCACA

GTGTGAAGGCCTGCCTTGCAAAAGCCCTCCAGAAATCAGCCATGGCGTGGTC

GCTCATATGAGCGACAGCTACCAGTACGGCGAGGAGGTGACATACAAGTGCT

TCGAGGGCTTCGGCATCGACGGCCCCGCCATCGCCAAGTGCCTAGGCGAGA

AATGGAGTCACCCGCCTTCTTGTATCAAGACCGACTGCCTGTCCCTGCCAAG

TTTCGAGAACGCTATCCCTATGGGCGAGAAGAAGGACGTGTACAAGGCCGGC

GAGCAGGTGACCTACACCTGCGCCACATATTACAAGATGGACGGAGCCAGCA

ACGTGACATGTATCAATTCCAGATGGACCGGAAGACCAACATGTCGGGACAC

CAGCTGTGTGAACCCGCCTACAGTGCAAAACGCCTACATCGTGTCTAGACAG

ATGTCTAAGTACCCCAGCGGCGAAAGAGTGCGGTACCAGTGCAGAAGCCCTT

ATGAGATGTTCGGCGACGAGGAAGTGATGTGCCTCAACGGCAACTGGACCG

AGCCTCCTCAGTGCAAGGATAGCACCGGCAAGTGCGGCCCTCCCCCTCCTAT

CGATAACGGCGACATCACAAGCTTCCCCCTGTCTGTGTATGCCCCTGCTAGCT

CCGTGGAGTACCAATGCCAGAACCTGTACCAGCTGGAGGGAAACAAGCGGA

TTACATGCAGAAACGGACAGTGGTCTGAGCCACCGAAGTGTCTGCACCCCTG

TGTCATCTCACGCGAGATTATGGAAAACTACAACATCGCCCTGAGATGGACC

GCCAAGCAAAAGCTGTACAGCAGAACCGGAGAATCCGTGGAATTCGTCTGC

AAGAGAGGCTACCGGCTGTCCAGCCGGTCCCACACCCTGAGAACAACCTGC

TGGGATGGCAAGCTGGAATATCCTACCTGCGCCAAGGGCGGCGGAGGAAGC

SEQ ID NO:49

CFH-73的野生型序列：

ATGAGACTTCTAGCAAAGATTATTTGCCTTATGTTATGGGCTATTTGTGTAGCAGAAGA

TTGCAATGAACTTCCTCCAAGAAGAAATACAGAAATTCTGACAGGTTCCTGGTCTGA

CCAAACATATCCAGAAGGCACCCAGGCTATCTATAAATGCCGCCCTGGATATAGATCT

CTTGGAAATGTAATAATGGTATGCAGGAAGGGAGAATGGGTTGCTCTTAATCCATTAA

GGAAATGTCAGAAAAGGCCCTGTGGACATCCTGGAGATACTCCTTTTGGTACTTTTA

CCCTTACAGGAGGAAATGTGTTTGAATATGGTGTAAAAGCTGTGTATACATGTAATGA

GGGGTATCAATTGCTAGGTGAGATTAATTACCGTGAATGTGACACAGATGGATGGAC

CAATGATATTCCTATATGTGAAGTTGTGAAGTGTTTACCAGTGACAGCACCAGAGAAT

GGAAAAATTGTCAGTAGTGCAATGGAACCAGATCGGGAATACCATTTTGGACAAGCA

GTACGGTTTGTATGTAACTCAGGCTACAAGATTGAAGGAGATGAAGAAATGCATTGT

TCAGACGATGGTTTTTGGAGTAAAGAGAAACCAAAGTGTGTGGAAATTTCATGCAAA

TCCCCAGATGTTATAAATGGATCTCCTATATCTCAGAAGATTATTTATAAGGAGAATGA

ACGATTTCAATATAAATGTAACATGGGTTATGAATACAGTGAAAGAGGAGATGCTGTA

TGCACTGAATCTGGATGGCGTCCGTTGCCTTCATGTGAAGAAAAATCATGTGATAATC

CTTATATTCCAAATGGTGACTACTCACCTTTAAGGATTAAACACAGAACTGGAGATGA

AATCACGTACCAGTGTAGAAATGGTTTTTATCCTGCAACCCGGGGAAATACAGCAAA

ATGCACAAGTACTGGCTGGATACCTGCTCCGAGATGTACCTTGAAACCTTGTGATTAT

CCAGACATTAAACATGGAGGTCTATATCATGAGAATATGCGTAGACCATACTTTCCAG

TAGCTGTAGGAAAATATTACTCCTATTACTGTGATGAACATTTTGAGACTCCGTCAGG

AAGTTACTGGGATCACATTCATTGCACACAAGATGGATGGTCGCCAGCAGTACCATG

CCTCAGAAAATGTTATTTTCCTTATTTGGAAAATGGATATAATCAAAATTATGGAAGAA

AGTTTGTACAGGGTAAATCTATAGACGTTGCCTGCCATCCTGGCTACGCTCTTCCAAA

AGCGCAGACCACAGTTACATGTATGGAGAATGGCTGGTCTCCTACTCCCAGATGCAT

CCGTGTCAAAACATGTTCCAAATCAAGTATAGATATTGAGAATGGGTTTATTTCTGAA

TCTCAGTATACATATGCCTTAAAAGAAAAAGCGAAATATCAATGCAAACTAGGATATG

TAACAGCAGATGGTGAAACATCAGGATCAATTACATGTGGGAAAGATGGATGGTCAG

CTCAACCCACGTGCATTAAAGGAGGAGGCGGCAGCGCCGAGGCCGCCGCTAAAGA

AGCTGCCGCCAAGGCTGGCGGCGGCGGCTCTATTCCATGTTCACAACCACCTCAGAT

AGAACACGGAACCATTAATTCATCCAGGTCTTCACAAGAAAGTTATGCACATGGGAC

TAAATTGAGTTATACTTGTGAGGGTGGTTTCAGGATATCTGAAGAAAATGAAACAAC

ATGCTACATGGGAAAATGGAGTTCTCCACCTCAGTGTGAAGGCCTTCCTTGTAAATC

TCCACCTGAGATTTCTCATGGTGTTGTAGCTCACATGTCAGACAGTTATCAGTATGGA

GAAGAAGTTACGTACAAATGTTTTGAAGGTTTTGGAATTGATGGGCCTGCAATTGCA

AAATGCTTAGGAGAAAAATGGTCTCACCCTCCATCATGCATAAAAACAGATTGTCTC

AGTTTACCTAGCTTTGAAAATGCCATACCCATGGGAGAGAAGAAGGATGTGTATAAG

GCGGGTGAGCAAGTGACTTACACTTGTGCAACATATTACAAAATGGATGGAGCCAGT

AATGTAACATGCATTAATAGCAGATGGACAGGAAGGCCAACATGCAGAGACACCTCC

TGTGTGAATCCGCCCACAGTACAAAATGCTTATATAGTGTCGAGACAGATGAGTAAAT

ATCCATCTGGTGAGAGAGTACGTTATCAATGTAGGAGCCCTTATGAAATGTTTGGGGA

TGAAGAAGTGATGTGTTTAAATGGAAACTGGACGGAACCACCTCAATGCAAAGATT

CTACAGGAAAATGTGGGCCCCCTCCACCTATTGACAATGGGGACATTACTTCATTCCC

GTTGTCAGTATATGCTCCAGCTTCATCAGTTGAGTACCAATGCCAGAACTTGTATCAA

CTTGAGGGTAACAAGCGAATAACATGTAGAAATGGACAATGGTCAGAACCACCAAA

ATGCTTACATCCGTGTGTAATATCCCGAGAAATTATGGAAAATTATAACATAGCATTAA

GGTGGACAGCCAAACAGAAGCTTTATTCGAGAACAGGTGAATCAGTTGAATTTGTGT

GTAAACGGGGATATCGTCTTTCATCACGTTCTCACACATTGCGAACAACATGTTGGGA

TGGGAAACTGGAGTATCCAACTTGTGCAAAA

SEQ ID NO:50CFH-73的密码子优化序列1：

ATGAGACTGCTGGCCAAGATCATCTGCCTGATGCTGTGGGCCATCTGCGTGGCCGA

GGACTGCAACGAGCTGCCCCCTAGAAGAAACACCGAGATCCTGACCGGCAGCTG

GAGCGATCAGACCTACCCCGAGGGCACCCAAGCCATCTACAAGTGCAGACCCGGC

TACAGAAGCCTGGGCAACGTGATCATGGTGTGCAGAAAGGGCGAGTGGGTGGCC

CTGAACCCCCTCAGAAAATGTCAGAAGAGACCCTGCGGCCACCCCGGCGACACCC

CCTTCGGCACCTTCACCCTGACCGGCGGCAACGTGTTCGAGTACGGCGTGAAGGC

CGTGTACACCTGCAACGAGGGCTATCAGCTGCTGGGCGAGATCAACTACAGAGAG

TGCGACACCGACGGCTGGACCAACGACATCCCCATCTGCGAGGTGGTGAAGTGCC

TGCCCGTGACCGCCCCCGAGAACGGCAAGATCGTGAGCAGCGCCATGGAGCCCG

ACAGAGAGTACCACTTCGGCCAAGCCGTGAGATTCGTGTGCAACAGCGGCTACAA

GATCGAGGGCGATGAGGAGATGCACTGCAGCGACGACGGCTTCTGGAGCAAGGA

GAAGCCCAAGTGCGTGGAGATCAGCTGCAAGAGCCCCGACGTGATCAACGGCAG

CCCCATTAGCCAAAAGATCATCTACAAGGAGAACGAGAGATTTCAGTACAAGTGC

AACATGGGCTACGAGTACAGCGAGAGAGGCGACGCCGTGTGCACCGAGAGCGGC

TGGAGACCCCTGCCTAGCTGCGAGGAGAAGAGCTGCGACAACCCCTACATCCCCA

ACGGCGACTACAGCCCCCTGAGAATCAAGCACAGAACCGGCGATGAGATCACCTA

TCAGTGCAGAAATGGCTTCTACCCCGCCACAAGAGGCAACACCGCCAAGTGCACA

AGCACCGGCTGGATCCCCGCCCCTAGATGCACCCTGAAGCCCTGCGACTACCCCG

ACATCAAGCACGGCGGCCTGTACCACGAGAACATGAGAAGACCCTACTTCCCCGT

GGCCGTGGGCAAGTACTACAGCTACTACTGCGACGAGCACTTCGAGACCCCTAGC

GGCAGCTACTGGGACCACATCCACTGCACCCAAGACGGCTGGAGCCCCGCTGTGC

CCTGCCTGAGAAAATGCTACTTCCCCTACCTGGAAAACGGCTACAATCAGAACTAC

GGCAGAAAGTTCGTGCAAGGCAAGAGCATCGACGTGGCCTGCCACCCCGGCTAC

GCCCTGCCCAAGGCTCAGACCACCGTGACCTGCATGGAGAACGGCTGGTCCCCCA

CCCCTAGATGCATCAGAGTGAAGACCTGCAGCAAGAGCAGCATCGACATCGAGAA

CGGCTTCATCAGCGAGAGCCAATACACCTACGCCCTGAAGGAGAAGGCCAAGTAT

CAGTGCAAGCTGGGCTACGTGACCGCCGACGGCGAGACAAGCGGCTCCATCACCT

GCGGCAAAGATGGGTGGTCCGCTCAGCCTACCTGCATCAAGGGCGGGGGCGGCTC

CGCCGAGGCCGCTGCCAAGGAGGCCGCCGCTAAGGCCGGGGGGGGCGGCAGCAT

TCCCTGTAGCCAACCCCCTCAGATCGAGCACGGCACCATCAACAGCAGCAGAAGC

AGCCAAGAGAGCTACGCCCACGGCACCAAGCTGAGCTACACCTGCGAGGGCGGC

TTCAGAATCAGCGAGGAAAACGAGACCACCTGCTACATGGGCAAGTGGAGCAGC

CCCCCTCAGTGCGAGGGGCTCCCCTGTAAGTCCCCCCCCGAGATCAGCCACGGCG

TGGTGGCCCACATGAGCGACAGCTATCAGTACGGCGAAGAGGTGACCTACAAGTG

TTTCGAGGGCTTCGGCATCGACGGCCCCGCCATCGCCAAGTGCCTGGGCGAGAAG

TGGAGCCATCCCCCTAGCTGCATCAAGACCGACTGCCTGAGCCTGCCTAGCTTCGA

GAACGCCATCCCCATGGGCGAGAAGAAGGACGTGTACAAGGCCGGCGAGCAAGT

GACCTACACATGTGCCACCTACTACAAGATGGACGGCGCTAGCAACGTGACATGCA

TCAATAGCAGATGGACCGGCAGACCCACCTGCAGAGACACAAGCTGCGTGAACCC

CCCCACCGTGCAGAACGCCTACATCGTGAGCAGACAGATGAGCAAGTACCCTAGC

GGCGAGAGAGTGAGATATCAGTGTCGGAGCCCCTACGAGATGTTCGGCGACGAAG

AGGTGATGTGCCTGAACGGCAACTGGACCGAGCCCCCTCAATGCAAGGACAGCAC

CGGCAAGTGCGGCCCCCCTCCTCCCATCGACAACGGCGACATCACAAGCTTCCCC

CTGAGCGTGTACGCCCCCGCTAGCAGCGTGGAGTATCAGTGTCAGAACCTGTATCA

GCTGGAGGGCAACAAGAGAATCACCTGCAGAAACGGGCAGTGGAGCGAGCCTCC

TAAGTGTCTGCACCCCTGCGTGATCAGCAGAGAGATCATGGAGAACTACAACATC

GCCCTGAGATGGACCGCCAAGCAGAAGCTGTACAGCCGGACCGGCGAGAGCGTG

GAGTTCGTGTGCAAGAGAGGCTACAGACTGAGCAGCAGAAGCCATACCCTGAGA

ACCACCTGCTGGGACGGCAAGCTGGAGTACCCCACCTGCGCCAAG

SEQ ID NO:51CFH-73的密码子优化序列2：

ATGCGCCTGCTGGCCAAAATCATCTGCCTGATGCTGTGGGCCATCTGCGTGGCTGA

AGATTGTAACGAGCTGCCTCCACGGCGGAACACCGAGATCCTGACCGGTAGCTGG

AGCGATCAGACCTACCCCGAAGGCACCCAGGCCATCTACAAATGCCGCCCCGGCT

ACCGGAGCCTGGGCAATGTGATCATGGTGTGCAGAAAGGGCGAATGGGTGGCCCT

GAACCCTCTGCGGAAGTGTCAGAAAAGACCCTGCGGCCACCCCGGCGACACCCC

TTTCGGAACCTTCACCCTGACAGGTGGCAACGTGTTCGAGTACGGCGTGAAGGCC

GTGTACACCTGCAACGAGGGCTATCAGCTGCTGGGCGAGATTAACTACAGAGAGT

GCGACACCGATGGCTGGACAAACGACATCCCCATCTGCGAAGTGGTGAAATGTCT

TCCTGTTACAGCCCCTGAGAACGGGAAGATCGTGTCCTCCGCAATGGAGCCTGATA

GAGAATACCACTTCGGCCAGGCCGTGCGGTTCGTGTGCAATAGCGGCTACAAGATT

GAAGGCGATGAGGAAATGCACTGTTCTGACGACGGCTTTTGGAGCAAGGAGAAG

CCTAAGTGCGTGGAAATCAGCTGTAAAAGCCCCGACGTCATCAACGGAAGCCCTA

TCTCTCAGAAGATCATCTACAAGGAGAACGAGAGATTTCAGTACAAGTGTAATATG

GGATACGAGTACAGCGAACGGGGCGACGCCGTTTGCACAGAAAGCGGCTGGCGG

CCTCTGCCTTCTTGCGAGGAAAAAAGCTGCGACAACCCCTACATCCCAAACGGGG

ACTACTCTCCCCTGCGGATCAAGCACCGGACCGGCGATGAGATCACGTATCAGTGC

CGAAACGGCTTCTACCCTGCCACCAGAGGCAATACCGCCAAGTGCACTAGCACCG

GGTGGATCCCCGCCCCTAGATGCACACTGAAGCCCTGCGATTACCCTGACATCAAG

CACGGCGGACTGTATCACGAGAACATGAGAAGACCTTACTTTCCTGTGGCCGTGG

GCAAATACTACAGCTACTACTGCGACGAGCACTTCGAGACCCCTAGCGGAAGCTA

CTGGGACCACATCCACTGCACCCAAGACGGCTGGTCCCCCGCTGTTCCTTGTCTGA

GAAAGTGCTACTTCCCATACCTGGAGAACGGCTATAACCAGAATTACGGCAGAAAA

TTCGTGCAGGGCAAGAGCATCGACGTGGCCTGCCACCCTGGCTACGCCCTGCCTA

AGGCCCAGACCACCGTGACATGTATGGAAAATGGCTGGTCTCCTACACCTAGATGC

ATCAGGGTGAAGACATGCAGCAAGAGCTCTATCGATATCGAAAATGGCTTCATCTC

CGAAAGCCAGTACACCTACGCCCTGAAGGAAAAGGCCAAGTACCAGTGCAAGCT

GGGATACGTGACCGCCGACGGCGAAACAAGCGGCAGCATCACCTGTGGCAAGGA

CGGCTGGTCCGCTCAGCCCACCTGCATCAAAGGAGGAGGCGGCAGCGCCGAGGC

CGCCGCTAAAGAAGCTGCCGCCAAGGCTGGCGGCGGCGGCTCTATCCCTTGCAGC

CAGCCTCCTCAAATCGAGCACGGAACCATTAATTCCTCTAGAAGCAGCCAAGAGA

GCTACGCCCACGGCACCAAGCTGAGCTATACATGCGAGGGAGGATTTAGAATCAG

CGAGGAGAACGAAACCACGTGCTACATGGGCAAGTGGAGCAGCCCCCCACAGTG

TGAAGGCCTGCCTTGCAAAAGCCCTCCAGAAATCAGCCATGGCGTGGTCGCTCATA

TGAGCGACAGCTACCAGTACGGCGAGGAGGTGACATACAAGTGCTTCGAGGGCTT

CGGCATCGACGGCCCCGCCATCGCCAAGTGCCTAGGCGAGAAATGGAGTCACCCG

CCTTCTTGTATCAAGACCGACTGCCTGTCCCTGCCAAGTTTCGAGAACGCTATCCC

TATGGGCGAGAAGAAGGACGTGTACAAGGCCGGCGAGCAGGTGACCTACACCTG

CGCCACATATTACAAGATGGACGGAGCCAGCAACGTGACATGTATCAATTCCAGAT

GGACCGGAAGACCAACATGTCGGGACACCAGCTGTGTGAACCCGCCTACAGTGC

AAAACGCCTACATCGTGTCTAGACAGATGTCTAAGTACCCCAGCGGCGAAAGAGT

GCGGTACCAGTGCAGAAGCCCTTATGAGATGTTCGGCGACGAGGAAGTGATGTGC

CTCAACGGCAACTGGACCGAGCCTCCTCAGTGCAAGGATAGCACCGGCAAGTGCG

GCCCTCCCCCTCCTATCGATAACGGCGACATCACAAGCTTCCCCCTGTCTGTGTATG

CCCCTGCTAGCTCCGTGGAGTACCAATGCCAGAACCTGTACCAGCTGGAGGGAAA

CAAGCGGATTACATGCAGAAACGGACAGTGGTCTGAGCCACCGAAGTGTCTGCAC

CCCTGTGTCATCTCACGCGAGATTATGGAAAACTACAACATCGCCCTGAGATGGAC

CGCCAAGCAAAAGCTGTACAGCAGAACCGGAGAATCCGTGGAATTCGTCTGCAAG

AGAGGCTACCGGCTGTCCAGCCGGTCCCACACCCTGAGAACAACCTGCTGGGATG

GCAAGCTGGAATATCCTACCTGCGCCAAG

SEQ ID NO:52CFH-82的野生型序列：

ATGAGACTTCTAGCAAAGATTATTTGCCTTATGTTATGGGCTATTTGTGTAGCAGAA

GATTGCAATGAACTTCCTCCAAGAAGAAATACAGAAATTCTGACAGGTTCCTGGTC

TGACCAAACATATCCAGAAGGCACCCAGGCTATCTATAAATGCCGCCCTGGATATAG

ATCTCTTGGAAATGTAATAATGGTATGCAGGAAGGGAGAATGGGTTGCTCTTAATCC

ATTAAGGAAATGTCAGAAAAGGCCCTGTGGACATCCTGGAGATACTCCTTTTGGTA

CTTTTACCCTTACAGGAGGAAATGTGTTTGAATATGGTGTAAAAGCTGTGTATACAT

GTAATGAGGGGTATCAATTGCTAGGTGAGATTAATTACCGTGAATGTGACACAGAT

GGATGGACCAATGATATTCCTATATGTGAAGTTGTGAAGTGTTTACCAGTGACAGC

ACCAGAGAATGGAAAAATTGTCAGTAGTGCAATGGAACCAGATCGGGAATACCAT

TTTGGACAAGCAGTACGGTTTGTATGTAACTCAGGCTACAAGATTGAAGGAGATGA

AGAAATGCATTGTTCAGACGATGGTTTTTGGAGTAAAGAGAAACCAAAGTGTGTG

GAAATTTCATGCAAATCCCCAGATGTTATAAATGGATCTCCTATATCTCAGAAGATTA

TTTATAAGGAGAATGAACGATTTCAATATAAATGTAACATGGGTTATGAATACAGTG

AAAGAGGAGATGCTGTATGCACTGAATCTGGATGGCGTCCGTTGCCTTCATGTGAA

GAAGGAGGAGGCGGCAGCGCCGAGGCCGCCGCTAAAGAAGCTGCCGCCAAGGCT

GGCGGCGGCGGCTCTAAACCTTGTGATTATCCAGACATTAAACATGGAGGTCTATAT

CATGAGAATATGCGTAGACCATACTTTCCAGTAGCTGTAGGAAAATATTACTCCTATT

ACTGTGATGAACATTTTGAGACTCCGTCAGGAAGTTACTGGGATCACATTCATTGC

ACACAAGATGGATGGTCGCCAGCAGTACCATGCCTCAGAAAATGTTATTTTCCTTAT

TTGGAAAATGGATATAATCAAAATTATGGAAGAAAGTTTGTACAGGGTAAATCTATA

GACGTTGCCTGCCATCCTGGCTACGCTCTTCCAAAAGCGCAGACCACAGTTACATG

TATGGAGAATGGCTGGTCTCCTACTCCCAGATGCATCCGTGTCAAAACATGTTCCA

AATCAAGTATAGATATTGAGAATGGGTTTATTTCTGAATCTCAGTATACATATGCCTT

AAAAGAAAAAGCGAAATATCAATGCAAACTAGGATATGTAACAGCAGATGGTGAA

ACATCAGGATCAATTACATGTGGGAAAGATGGATGGTCAGCTCAACCCACGTGCAT

TAAAGGAGGAGGCGGCAGCGCCGAGGCCGCCGCTAAAGAAGCTGCCGCCAAGGC

TGGCGGCGGCGGCTCTACCTCCTGTGTGAATCCGCCCACAGTACAAAATGCTTATA

TAGTGTCGAGACAGATGAGTAAATATCCATCTGGTGAGAGAGTACGTTATCAATGT

AGGAGCCCTTATGAAATGTTTGGGGATGAAGAAGTGATGTGTTTAAATGGACAATG

GACGGAACCACCTCAATGCAAAGATTCTACAGGAAAATGTGGGCCCCCTCCACCT

ATTGACAATGGGGACATTACTTCATTCCCGTTGTCAGTATATGCTCCAGCTTCATCA

GTTGAGTACCAATGCCAGAACTTGTATCAACTTGAGGGTAACAAGCGAATAACATG

TAGAAATGGACAATGGTCAGAACCACCAAAATGCTTACATCCGTGTGTAATATCCC

GAGAAATTATGGAAAATTATAACATAGCATTAAGGTGGACAGCCAAACAGAAGCTT

TATTCGAGAACAGGTGAATCAGTTGAATTTGTGTGTAAACGGGGATATCGTCTTTCA

TCACGTTCTCACACATTGCGAACAACATGTTGGGATGGGAAACTGGAGTATCCAAC

TTGTGCAAAA

SEQ ID NO:53CFH-82的密码子优化序列1：

ATGAGACTGCTGGCCAAGATCATCTGCCTGATGCTGTGGGCCATCTGCGTGGCCGA

GGACTGCAACGAGCTGCCCCCTAGAAGAAACACCGAGATCCTGACCGGCAGCTG

GAGCGATCAGACCTACCCCGAGGGCACCCAAGCCATCTACAAGTGCAGACCCGGC

TACAGAAGCCTGGGCAACGTGATCATGGTGTGCAGAAAGGGCGAGTGGGTGGCC

CTGAACCCCCTCAGAAAATGTCAGAAGAGACCCTGCGGCCACCCCGGCGACACCC

CCTTCGGCACCTTCACCCTGACCGGCGGCAACGTGTTCGAGTACGGCGTGAAGGC

CGTGTACACCTGCAACGAGGGCTATCAGCTGCTGGGCGAGATCAACTACAGAGAG

TGCGACACCGACGGCTGGACCAACGACATCCCCATCTGCGAGGTGGTGAAGTGCC

TGCCCGTGACCGCCCCCGAGAACGGCAAGATCGTGAGCAGCGCCATGGAGCCCG

ACAGAGAGTACCACTTCGGCCAAGCCGTGAGATTCGTGTGCAACAGCGGCTACAA

GATCGAGGGGGACGAAGAGATGCACTGCAGCGACGACGGCTTCTGGAGCAAGGA

GAAGCCCAAGTGCGTGGAGATCAGCTGCAAGAGCCCCGACGTGATCAACGGCAG

CCCTATCAGCCAAAAGATCATCTACAAGGAGAACGAGAGATTTCAGTACAAGTGC

AACATGGGCTACGAGTACAGCGAGAGAGGGGATGCCGTCTGCACAGAGAGCGGG

TGGAGACCCCTGCCCTCCTGCGAAGAGGGCGGGGGGGGCAGCGCCGAAGCCGCT

GCCAAGGAGGCCGCTGCCAAAGCCGGGGGCGGGGGCTCCAAACCTTGCGACTAC

CCCGACATCAAGCACGGCGGCCTGTACCACGAGAACATGAGAAGACCCTACTTCC

CCGTGGCCGTGGGCAAGTACTACAGCTACTACTGCGACGAGCACTTCGAGACCCC

TAGCGGCAGCTACTGGGACCACATCCACTGCACCCAAGACGGCTGGTCCCCCGCC

GTGCCCTGCCTGAGAAAGTGCTACTTCCCCTACCTGGAGAACGGCTACAATCAGA

ACTACGGCAGAAAGTTCGTGCAAGGCAAGAGCATCGACGTGGCCTGCCACCCCG

GCTACGCCCTGCCCAAGGCTCAGACCACCGTGACCTGCATGGAAAACGGCTGGAG

CCCCACCCCTAGATGCATCAGAGTGAAGACCTGCAGCAAGAGCAGCATCGACATC

GAGAACGGCTTCATCAGCGAGAGCCAATACACCTACGCCCTGAAGGAGAAGGCCA

AGTATCAGTGCAAGCTGGGCTACGTGACCGCCGACGGCGAGACCTCCGGCAGCAT

CACCTGTGGGAAAGACGGCTGGTCCGCTCAGCCTACCTGCATTAAGGGCGGCGGG

GGCTCCGCTGAGGCCGCCGCTAAGGAGGCTGCCGCCAAAGCCGGCGGGGGCGGC

TCCACAAGCTGCGTGAACCCCCCCACCGTGCAGAACGCCTACATCGTGAGCAGAC

AGATGAGCAAGTACCCTAGCGGCGAGAGAGTGAGATATCAGTGCAGAAGCCCCTA

CGAGATGTTCGGCGACGAAGAGGTGATGTGCCTGAACGGGCAATGGACCGAACCT

CCCCAATGCAAGGATAGCACCGGGAAATGCGGCCCCCCTCCCCCCATCGACAACG

GCGACATCACAAGCTTCCCCCTGAGCGTGTACGCCCCCGCTAGCAGCGTGGAGTAT

CAGTGTCAGAACCTGTATCAGCTGGAGGGCAACAAGAGAATCACCTGCAGAAAC

GGGCAGTGGAGCGAGCCCCCCAAATGCCTCCATCCCTGCGTGATCAGCAGAGAGA

TCATGGAGAACTACAACATCGCCCTGAGATGGACCGCCAAGCAGAAGCTGTACAG

CAGAACCGGCGAGAGCGTGGAGTTCGTGTGCAAGAGAGGCTACAGACTGAGCAG

CAGAAGCCACACCCTGAGAACCACCTGCTGGGACGGCAAGCTGGAGTACCCCAC

CTGCGCCAAG

SEQ ID NO:54CFH-82的密码子优化序列2：

ATGAGACTGCTGGCCAAAATCATCTGTCTGATGCTGTGGGCCATCTGCGTGG

CCGAAGATTGCAACGAGCTGCCACCAAGAAGGAACACCGAGATACTGACAG

GCAGCTGGTCTGATCAGACCTACCCTGAGGGCACCCAGGCCATCTATAAGTG

CCGGCCCGGCTACCGGAGCCTGGGCAACGTGATCATGGTGTGCAGAAAGGG

AGAGTGGGTGGCCCTGAACCCCCTGCGGAAGTGCCAAAAAAGACCCTGCGG

CCACCCCGGCGATACCCCGTTCGGCACATTCACCCTGACCGGAGGCAACGTG

TTCGAGTACGGCGTGAAAGCCGTGTACACTTGTAATGAGGGCTACCAGCTGC

TCGGAGAGATCAACTACAGAGAGTGCGACACCGACGGCTGGACCAACGACA

TCCCCATCTGTGAAGTGGTGAAGTGCCTGCCTGTGACCGCGCCTGAAAACGG

CAAGATCGTGTCCAGCGCCATGGAACCCGATAGAGAATACCATTTTGGCCAA

GCCGTGAGATTCGTGTGCAACTCAGGCTACAAGATCGAGGGCGATGAGGAA

ATGCACTGTAGCGACGACGGCTTCTGGAGCAAGGAAAAGCCCAAGTGTGTT

GAGATCAGCTGCAAGAGCCCGGACGTGATTAACGGTAGCCCTATCTCTCAGA

AAATCATCTACAAGGAAAACGAGCGGTTCCAGTACAAGTGCAATATGGGCTA

CGAATACTCTGAGAGAGGCGACGCCGTCTGCACCGAGAGCGGATGGCGGCC

TCTGCCTAGCTGCGAGGAAGGTGGCGGCGGCAGCGCCGAGGCCGCCGCTAA

AGAGGCCGCTGCCAAGGCCGGAGGCGGCGGGTCCAAGCCCTGTGACTACCC

CGACATCAAGCACGGCGGCCTGTACCACGAGAACATGCGGCGGCCTTACTTC

CCTGTGGCCGTGGGCAAATACTACTCCTATTACTGCGACGAGCACTTCGAGA

CACCTAGCGGCTCCTATTGGGACCACATCCACTGTACACAGGACGGCTGGAG

CCCTGCCGTGCCTTGCCTGAGAAAGTGTTACTTTCCTTACCTGGAAAATGGCT

ATAACCAAAACTACGGCAGAAAGTTCGTGCAGGGCAAGTCTATCGACGTGGC

TTGTCACCCTGGCTATGCCCTGCCCAAGGCCCAGACCACCGTGACCTGCATG

GAAAATGGCTGGAGCCCTACACCACGCTGCATCCGGGTGAAGACCTGCAGC

AAGAGCAGCATCGACATCGAGAATGGATTTATCAGCGAGAGCCAGTACACCT

ACGCCCTGAAGGAGAAAGCCAAATACCAGTGCAAGCTGGGATACGTGACCG

CTGATGGCGAGACATCTGGATCTATCACCTGCGGAAAGGACGGCTGGTCTGC

TCAGCCTACATGCATCAAGGGCGGCGGCGGCAGCGCCGAGGCAGCCGCCAA

GGAAGCCGCCGCTAAGGCCGGCGGCGGCGGAAGCACATCCTGTGTCAACCC

TCCTACCGTCCAGAACGCCTACATCGTGTCCAGACAGATGAGCAAGTACCCC

AGCGGCGAAAGAGTGAGATACCAGTGCCGTAGCCCTTATGAGATGTTCGGCG

ACGAGGAAGTGATGTGCCTCAACGGACAGTGGACAGAGCCTCCTCAGTGTA

AAGACAGCACCGGCAAATGCGGCCCTCCCCCACCTATTGACAACGGAGATAT

CACCTCCTTCCCCCTGAGCGTTTACGCCCCTGCTTCTTCTGTGGAATACCAAT

GTCAGAATCTGTACCAGCTGGAAGGCAACAAGCGGATTACCTGCCGGAACG

GACAGTGGAGCGAGCCCCCAAAGTGTCTGCACCCATGCGTGATCTCCAGGG

AAATCATGGAGAACTACAACATCGCCCTGAGATGGACCGCCAAGCAGAAGC

TGTACAGCAGAACCGGCGAGAGCGTGGAATTCGTGTGCAAGAGAGGCTACA

GACTGAGCTCTAGAAGCCACACCCTGAGAACAACATGCTGGGATGGCAAGT

TAGAATACCCTACATGCGCTAAA

SEQ ID NO:55

X.laevis beta-globin 3’UTR序列：

GTCTAGAAACCAGCCTCAAGAACACCCGAATGGAGTCTCTAAGCTACATAAT

ACCAACTTACACTTTACAAAATGTTGTCCCCCAAAATGTAGCCATTCGTATCT

GCTCCTAATAAAAAGAAAGTTTCTTCAC

SEQ ID NO:56

WPRE序列：

AATCAACCTCTGGATTACAAAATTTGTGAAAGATTGACTGGTATTCTTAACTA

TGTTGCTCCTTTTACGCTATGTGGATACGCTGCTTTAATGCCTTTGTATCATGCT

ATTGCTTCCCGTATGGCTTTCATTTTCTCCTCCTTGTATAAATCCTGGTTGCTGT

CTCTTTATGAGGAGTTGTGGCCCGTTGTCAGGCAACGTGGCGTGGTGTGCAC

TGTGTTTGCTGACGCAACCCCCACTGGTTGGGGCATTGCCACCACCTGTCAG

CTCCTTTCCGGGACTTTCGCTTTCCCCCTCCCTATTGCCACGGCGGAACTCAT

CGCCGCCTGCCTTGCCCGCTGCTGGACAGGGGCTCGGCTGTTGGGCACTGAC

AATTCCGTGGTGTTGTCGGGGAAATCATCGTCCTTTCCTTGGCTGCTCGCCTG

TGTTGCCACCTGGATTCTGCGCGGGACGTCCTTCTGCTACGTCCCTTCGGCCC

TCAATCCAGCGGACCTTCCTTCCCGCGGCCTGCTGCCGGCTCTGCGGCCTCT

TCCGCGTCTTCGCCTTCGCCCTCAGACGAGTCGGATCTCCCTTTGGGCCGCCT

CCCCGC

SEQ ID NO:57SV40 polyA序列：

CCTAGGTAAGATACATTGATGAGTTTGGACAAACCACAACTAGAATGCAGTG

AAAAAAATGCTTTATTTGTGAAATTTGTGATGCTATTGCTTTATTTGTAACCAT

TATAAGCTGCAATAAACAAGTTATCGATAGATCT

SEQ ID NO:58衣壳蛋白序列：

MAADGYLPDWLEDTLSEGIRQWWKLKPGPPPPKPAERHKDDSRGLVLPGYKY

LGPFNGLDKGEPVNEADAAALEHDKAYDRQLDSGDNPYLKYNHADAEFQERL

KEDTSFGGNLGRAVFQAKKRVLEPLGLVEEPVKTAPGKKRPVEHSPVEPDSSSG

TGKAGQQPARKRLNFGQTGDADSVPDPQPLGQPPAAPSGLGTNTMATGSGAPM

ADNNEGADGVGNSSGNWHCDSTWMGDRVITTSTRTWALPTYNNHLYKQISSQ

SGASNDNHYFGYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLF

NIQVKEVTQNDGTTTIANNLTSTVQVFTDSEYQLPYVLGSAHQGCLPPFPADVF

MVPQYGYLTLNNGSQAVGRSSFYCLEYFPSQMLRTGNNFTFSYTFEDVPFHSSY

AHSQSLDRLMNPLIDQYLYYLSRTNTPSGTTTQSRLQFSQAGASDIRDQSRNWL

PGPCYRQQRVSKTSADNNNSEYSWTGATKYHLNGRDSLVNPGPAMASHKDDE

EKFFPQSGVLIFGKQGSEKTNVDIEKVMITDEEEIRTTNPVATEQYGSVSTNLQR

GNLALGDTTRPARQAATADVNTQGVLPGMVWQDRDVYLQGPIWAKIPHTDGH

FHPSPLMGGFGLKHPPPQILIKNTPVPANPSTTFSAAKFASFITQYSTGQVSVEIE

WELQKENSKRWNPEIQYTSNYNKSINVDFTVDTNGVYSEPRPIGTRYLTRNL

SEQ ID NO:59

实施例10.密码子优化序列表达CFH截短体蛋白的蛋白产量及活性测定

本实施例通过检测蛋白表达量以及蛋白活性，对实施例9中编码CFH截短体蛋白的密码子优化序列进行测定。

将含有不同CFH截短体蛋白密码子优化序列的PTT5质粒转染ARPE-19细胞，并将上清液收集后，用于CFH表达量与活性的检测。将待测样品进行浓度梯度稀释，分别与结合在固相载体表面的特定浓度的CFH(SCR-19)抗体、C3b以及MAA共孵育，通过免疫吸附法检测各样品蛋白之间的浓度以及活性的大小。

密码子优化序列编码CFH截短体蛋白的蛋白表达量结果如图5A所示，与MAA-BSA的亲和力测定结果如图5B所示，与C3b的亲和力测定结果如图5C所示。图5A-5C中，73-wt，73-opt-2，79-wt，79-opt-1，79-opt-2，82-wt，82-opt-1，82-opt-2，84-wt，84-opt-1，84-opt-2，37-opt-2依次表示CFH-73的野生型序列，CFH-73的密码子优化序列2；CFH-79的野生型序列，CFH-79的密码子优化序列1，CFH-79的密码子优化序列2；CFH-82的野生型序列，CFH-82的密码子优化序列1，CFH-82的密码子优化序列2；CFH-84的野生型序列，CFH-84的密码子优化序列1，CFH-84的密码子优化序列2；CFH-37.1的密码子优化序列2。

结果显示，与野生型序列编码的CFH截短体蛋白相比，经过密码子优化后的CFH截短体的蛋白产量，以及与MAA-BSA、C3b的结合活性均显著提高。并且，CFH-79、CFH-82的密码子优化序列编码CFH截短体蛋白与MAA-BSA、C3b的结合活性，明显高于CFH-73、CFH-82、CFH-37.1的密码子优化序列。

实施例11.表达载体的构建

构建表达盒，通过酶切、连接、转化和克隆筛选鉴定等常规分子生物学操作构建了表达CFH截短体蛋白基因的AAV包装质粒(示例如图4)，其结构依次包括：CMV增强子、启动子、5’UTR、Kozak序列(gccacc)、CFH截短体蛋白、3’UTR、WPRE以及SV40polyA，表达盒两侧是反向末端重复序列(ITR)。

实施例12.AAV病毒制备与纯化

本实施例中用于递送基因表达盒的AAV外壳的氨基酸序列如SEQ ID NO:59所示。将AAV的Rep及Cap蛋白表达质粒、辅助质粒和实施例11构建的表达载体，共转染HEK293细胞包装制备出重组腺相关病毒，转染48h后，收获细胞和培养上清，使用碘克沙醇超速梯度离心纯化AAV病毒(参见Martin Lock,et al.Rapid,Simple,and Versatile Manufacturingof Recombinant Adeno-Associated Viral Vectors at Scale.HUMAN GENE THERAPY,2010.21:1259-1271)，得到重组腺相关病毒载体后，使用实时荧光定量PCR测量病毒滴度。

Claims

1.一种核酸分子，其包含编码重组补体因子H(CFH)多肽的转基因，其中，所述重组补体因子H多肽从N末端向C末端依次包括第一结构域，与所述第一结构域可操作地连接的第二结构域，以及与所述第二结构域可操作地连接的第三结构域；

所述第一结构域包含来自补体因子H的短同源重复序列(SCR)1、2、3、4中的一个或多个，

所述第二结构域包含来自补体因子H的短同源重复序列(SCR)17、18、19、20中的一个或多个，

所述第三结构域包含来自补体因子H的短同源重复序列(SCR)6、7、8中的一个或多个。

优选地，所述第一结构域选自如下1)-2)中的任一项或其任意组合：1)SCR(1-3)，2)SCR(1-4)，

所述第二结构域选自如下3)-5)中的任一项或其任意组合：3)SCR(17-20)，4)SCR(18-20)，5)SCR(19-20)；

所述第三结构域选自如下6)-9)中的任意一项或其任意组合：6)SCR7，7)SCR(6-7)，8)SCR(6-8)，9)SCR(7-8)；

优选地，所述重组补体因子H多肽从N末端向C末端依次包括：SCR(1-4)，与所述SCR(1-4)可操作地连接的SCR(18-20)，与所述SCR(18-20)可操作地连接的SCR(6-8)。

2.根据权利要求1所述的核酸分子，其中，所述重组补体因子H多肽是糖基化的、去除糖基化的或降低糖基化的；

优选地，所述重组补体因子H多肽包含降低或去除糖基化的突变；

优选地，所述降低或去除糖基化的突变选自如下至少一个：第439位或第1077位，所述氨基酸突变位点是相对于SEQ ID NO:13所示序列的自然顺序位点；

更优选地，所述降低或去除糖基化的突变为1077Q。

3.根据权利要求1或2所述的核酸分子，其中，所述第一结构域通过第一连接子与所述第二结构域可操作地连接，和/或，所述第二结构域通过第二连接子与所述第三结构域可操作地连接，所述第一连接子与所述第二连接子相同或不同；

优选地，所述第一连接子与所述第二连接子彼此独立地选自：

1)(G)_m、(GS)_m、(G₂S)_m、(G₃S)_m、(G₄S)_m、(GAP)_m、(ASGS)_m、(G_pS_q)_m、(GGNGT)_m、(YGNGT)_m、(G_pS_q)_nA(EAAAK)_tA(G_pS_q)_n或(G_pS_q)_n(EAAAK)_t(G_pS_q)_n；其中，m选自1-20的任一整数，n为1-8的任一整数；p选自1-7的任一整数，q选自1-7的任一整数，且p+q≤8；t选自1-6的任一整数；

2)所述第一连接子与所述第二连接子彼此独立地选自(G₄S)_m、

(G₄S)_nA(EAAAK)_tA(G₄S)_n或(G₄S)_nA(EAAAK)_tA(G₄S)_n；其中，m选自1-8的任一整数，n为1-6的任一整数，t选自1-6的任一整数；或，

3)(G₄S)₃，G₄SA(EAAAK)₂AG₄S或G₄S(EAAAK)₂G₄S；

优选地，所述第一连接子为(G₄S)₃，所述第二连接子为(G₄S)₃；或者，所述第一连接子为G₄SA(EAAAK)₂AG₄S，所述第二连接子为G₄S(EAAAK)₂G₄S；或者，所述第一连接子为(G₄S)₃，所述第二连接子为G₄S(EAAAK)₂G₄S；或者，所述第一连接子为G₄SA(EAAAK)₂AG₄S，所述第二连接子为(G₄S)₃。

4.根据权利要求1-3任一项所述的核酸分子，所述重组补体因子H多肽从N末端向C末端具有如下式(I)所示的结构：

第一连接子和第二连接子彼此独立地选自如下任意一种：

(G)_m、(GS)_m、(G₂S)_m、(G₃S)_m、(G₄S)_m、(GAP)_m、(ASGS)_m、(G_pS_q)_m、(GGNGT)_m、(YGNGT)_m、(G_pS_q)_nA(EAAAK)_tA(G_pS_q)_n或(G_pS_q)_n(EAAAK)_t(G_pS_q)_n；

其中，m选自1-20的任一整数，n为1-8的任一整数；p选自1-7的任一整数，q选自1-7的任一整数，且p+q≤8；t选自1-6的任一整数；

优选地，所述重组补体因子H多肽从N末端向C末端具有如下任意一种结构：

SCR(1-4)-(G₄S)_m-SCR(18-20)-(G₄S)_m-SCR(6-8)，

SCR(1-4)-(G₄S)_nA(EAAAK)_tA(G₄S)_n-SCR(18-20)-(G₄S)_nA(EAAAK)_tA(G₄S)_n-SC R(6-8)，

SCR(1-4)-(G₄S)_m-SCR(18-20)-(G₄S)_nA(EAAAK)_tA(G₄S)_n-SCR(6-8)；

其中m选自1-8的任一整数，n为1-6的任一整数，t选自1-6的任一整数；

更优选具有如下任意一种结构：

SCR(1-4)-(G₄S)₃-SCR(18-20)-(G₄S)₃-SCR(6-8)，或者，

SCR(1-4)-G₄SA(EAAAK)₂AG₄S-SCR(18-20)-G₄SA(EAAAK)₂AG₄S-SCR(6-8)；

优选地，所述重组补体因子H多肽包含选自SEQ ID NO:14-15、19、23、26任一项所示的氨基酸序列；或与SEQ ID NO:14-15、19、23、26任一项所示序列相比具有至少80％序列同一性的氨基酸序列；

优选地，所述重组补体因子H多肽包含信号肽或不包含信号肽，所述重组补体因子H多肽包含位于其N末端的信号肽；

优选地，所述信号肽包含如SEQ ID NO:27或28所示的氨基酸序列；

优选地，包含所述信号肽的重组补体因子H多肽包含选自SEQ ID NO:29-32任一项所示的氨基酸序列。

5.根据权利要求1-9任一项所述的核酸分子，其中，所述重组补体因子H多肽具有补体因子H活性，和/或补体调节活性；

优选地，所述补体调节活性为补体旁路途径调节活性；

优选地，所述补体调节活性为抑制补体激活的活性；

优选地，所述重组补体因子H多肽与野生型补体因子H相比，具有提高的补体因子H活性，和/或提高的补体调节活性。

6.一种核酸分子，其包含编码重组补体因子H多肽的转基因，其中，所述转基因包含如SEQ ID NO:41-55任一项所示的核苷酸序列，或与SEQ ID NO:41-55任一项所示的核苷酸序列相比具有至少50％序列同一性的核苷酸序列；

优选地，所述转基因包含如SEQ ID NO:42-43、45-46、48-49、51-52、54-55任一项所示的核苷酸序列，或与SEQ ID NO:42-43、45-46、48-49、51-52、54-55任一项所示的核苷酸序列相比具有至少50％序列同一性的核苷酸序列；

优选地，所述转基因包含如SEQ ID NO:41-46任一项所示的核苷酸序列，或与SEQ IDNO:41-46任一项所示的核苷酸序列相比具有至少50％序列同一性的核苷酸序列。

7.根据权利要求1-6任一项所述的核酸分子，其进一步包含与所述转基因可操作地连接的一种或多种的调控元件；

优选地，所述调控元件选自启动子、增强子、翻译调控元件、内含子、非翻译区、转录后调控元件、polyA序列；

优选地，所述增强子是CMV增强子，所述启动子是CMV启动子，所述翻译调控元件为Kozak序列，所述polyA序列为sv40 polyA序列，所述非翻译区包括5’UTR和3’UTR中的至少一种，所述转录后调控元件为WPRE序列。

8.根据权利要求1-7任一项所述的核酸分子，其为DNA或RNA，优选为cDNA或mRNA。

9.一种载体，所述载体包含权利要求1-8中任一项所述的核酸分子；

优选地，所述载体是质粒、慢病毒载体、腺病毒载体、重组腺相关病毒(rAAV)载体，或逆转录病毒载体；

更优选地，所述载体是重组腺相关病毒载体。

10.一种重组腺相关病毒载体，其包含(i)所示的转基因，以及与(i)所示的转基因可操作地连接的(ii)、(iii)或其组合：

(i)编码重组补体因子H多肽的转基因，所述转基因如权利要求1-8任一项中所定义；

(ii)调控元件；

(iii)反向末端重复(ITR)；

优选地，所述(ii)调控元件包括如下的一种或多种：

1)增强子，优选CMV增强子；

2)启动子，优选CMV启动子；

3)非翻译区，优选5’UTR和3’UTR；

4)翻译调控元件，优选Kozak序列；

5)转录后调控元件，优选WPRE序列；

6)polyA序列，优选sv40polyA序列。

11.重组腺相关病毒(rAAV)颗粒，其包含权利要求1-8中任一项所述的核酸分子或如权利要求10所述的重组腺相关病毒载体，和衣壳蛋白；

优选地，所述衣壳蛋白选自以下血清型：AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV9.47、AAV9(hu14)、AAV10、AAV11、AAV12、AAVrh8、AAVrh10、AAV-DJ或AAV-DJ8；

更优选地，所述衣壳蛋白包含SEQ ID NO:59所示的氨基酸序列，或与SEQ ID NO:59具有至少80％序列同一性的氨基酸序列。

12.一种重组腺相关病毒颗粒的制备方法，其包括使用如权利要求1-8任一项所述的核酸分子或如权利要求10所述的重组腺相关病毒载体制备重组腺相关病毒颗粒的步骤；

优选地，所述制备方法包括将所述核酸分子包装至AAV衣壳内的步骤；

优选地，所述AAV衣壳选自AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV9.47、AAV9(hu14)、AAV10、AAV11、AAV12、AAVrh8、AAVrh10、AAV-DJ或AAV-DJ8。

13.一种宿主细胞，其中，所述宿主细胞表达如权利要求1-8任一项所述的核酸分子，如权利要求9所述的载体，或如权利要求10所述的重组腺相关病毒载体。

14.一种药物组合物，其中，所述药物组合物包括如下至少一种：如权利要求1-8任一项所述的核酸分子，如权利要求9所述的载体，如权利要求10所述的重组腺相关病毒载体，或如权利要求11所述的重组腺相关病毒颗粒；

优选地，所述药物组合物还包括一种或多种药学上可接受地辅料。

15.如权利要求1-8任一项所述的核酸分子，如权利要求9所述的载体，如权利要求10所述的重组腺相关病毒载体，或如权利要求11所述的重组腺相关病毒颗粒在如下(i)-(iii)至少一项中的用途：

(i)抑制补体激活，或制备用于抑制补体激活的药物；

(iii)用于治疗患有将受益于补体激活被抑制的疾病的受试者，或制备用于治疗患有将受益于补体激活被抑制的疾病的受试者的药物；

优选地，所述与补体相关的疾病为视网膜病变；

更优选地，所述视网膜病变为黄斑变性；

更优选地，所述视网膜病变为年龄相关性黄斑变性(AMD)。