CN115151648A

CN115151648A - 用于治疗cdkl5缺陷障碍的基因疗法

Info

Publication number: CN115151648A
Application number: CN202180013079.XA
Authority: CN
Inventors: 谢里尔·琳内·法伊夫-马里奇; 马修·斯科特·富勒; 玛格丽特·卡罗琳·赖特; 罗蕾莱·伊万娜·斯托伊卡; 斯图尔特·克雷格; 肖恩·克里斯托弗·多尔蒂
Original assignee: Altraginx Pharmaceuticals
Current assignee: Altraginx Pharmaceuticals
Priority date: 2020-02-14
Filing date: 2021-02-11
Publication date: 2022-10-04
Also published as: BR112022015921A2; MX2022009982A; KR20220140537A; EP4103724A1; CA3164714A1; US20230054144A1; WO2021163322A1; TW202144577A; JP2023514204A; IL294781A; AU2021218703A1

Abstract

本披露提供了腺相关病毒载体、重组腺相关病毒(rAAV)、及其在用于治疗CDKL5缺陷障碍(CDD)的基因疗法中使用的方法。还提供了药物组合物，这些药物组合物包含本发明的rAAV和药学上可接受的载剂或赋形剂。这些药物组合物可用于治疗由CDKL突变引起的CDD的基因疗法中。

Description

用于治疗CDKL5缺陷障碍的基因疗法

相关申请的交叉引用

本申请要求于2020年2月14日提交的美国临时专利申请号62/976,483；以及于2020年10月12日提交的美国临时专利申请号63/090,492的权益和优先权，出于所有目的，其披露内容通过引用以其全文特此并入。

序列表

本申请包含序列表，该序列表已以ASCII格式电子提交，并通过引用以其全文特此并入。所述ASCII副本创建于2021年2月8日，名为ULP-007WO_SL.txt，大小为80,765字节。

技术领域

本披露总体上涉及重组腺相关病毒载体、重组腺相关病毒、及其在用于治疗CDKL5缺陷障碍的基因疗法中使用的方法。

背景技术

CDKL5缺陷障碍(CDD)是由CDKL5基因突变引起的罕见神经发育性疾病，该神经发育性疾病可以表现为广泛的临床症状，严重程度差异较大。CDD的标志包括婴儿期发病难治性癫痫、发育延迟、智力残疾、视力损伤、语言缺乏、肌张力低下、运动功能障碍、睡眠紊乱、胃肠功能障碍和呼吸困难。虽然罕见，但据信发生率为40,000-60,000名活产婴儿中大约1名，从而使其成为遗传性癫痫中最常见的形式之一。

CDKL5基因编码对正常大脑发育和功能必不可少的细胞周期蛋白依赖性激酶样5(CDKL5)蛋白。CDKL5蛋白参与大脑中神经元的形成、生长和迁移。其在大脑中广泛表达，主要存在于神经元和树突中，在细胞增殖、神经元迁移、轴突生长、树突状形态发生和突触发育中发挥作用。

CDD由CDKL5基因中的病原性变体引起，这些病原性变体包括缺失、截短、剪接变体和错义突变。参见Olson等人，2019，Pediatric Neurology[小儿神经病学]97：18-25。这些变体可以减少功能性CDKL5蛋白的量和/或降低其在神经元中的活性。已发现超过150种CDKL5基因突变可引起CDD。参见Del Rosso等人，2017，The EuroBiotech Journal[欧洲生物技术杂志]1(2)：122-127。

迄今为止，没有解决CDD(即CDKL5缺陷)的根本原因的治疗。目前，由于严重的运动和智力残疾，CDD患者通常需要24/7护理。此外，CDD患者经历的癫痫发作通常无法用现有的抗癫痫药物得到良好控制。因此，迫切需要解决疾病(功能性CDKL5缺陷)的根本原因的治疗方法。

本发明经由形成腺相关病毒载体来解决这一需要，这些载体介导编码功能性CDKL5的基因向患有CDD的患者的转移。本发明还描述了将编码功能性CDKL5的基因递送至患有CDD的患者的重组腺相关病毒(rAAV)的形成。

发明内容

本发明提供了组合物及其用于基因疗法的方法。更特别地，本文提供了重组腺相关病毒(rAAV)，其包含腺相关病毒(AAV)衣壳和包装在其中的用于治疗CDD的载体基因组。

在一方面，本披露提供了重组腺相关病毒(rAAV)，其包含AAV衣壳、和包装在其中的载体基因组，其中所述载体基因组包含：(a)启动子序列和(b)CDKL5或其同种型、或其功能性片段或功能性变体的部分或完全编码序列。

在另一方面，本披露提供了重组腺相关病毒(rAAV)，其包含AAV衣壳、和包装在其中的载体基因组，其中所述载体基因组包含：(a)5’-末端反向重复序列(5’-ITR)序列；(b)启动子序列；(c)CDKL5或其同种型、或其功能性片段或功能性变体的部分或完全编码序列；和(d)3’-末端反向重复序列(3’-ITR)序列。

在又另一方面，本披露提供了rAAV，其包含AAV衣壳、和包装在其中的载体基因组，其中所述载体基因组包含：(a)5’-ITR序列；(b)启动子序列；(c)CDKL5或其同种型、或其功能性片段或功能性变体的部分或完全编码序列；(d)聚腺苷酸化信号序列；和(e)3’-ITR序列。

在又另一方面，本披露提供了rAAV，其包含AAV衣壳、和包装在其中的载体基因组，其中所述载体基因组包含：(a)5’-ITR序列；(b)增强子序列；(c)启动子序列；(d)内含子序列；(e)CDKL5或其同种型、或其功能性片段或功能性变体的部分或完全编码序列；(f)聚腺苷酸化信号序列；和(g)3’-ITR序列。

在一个实施方案中，CDKL5的部分或完全编码序列是野生型编码序列。在替代实施方案中，CDKL5的部分或完全编码序列是密码子优化的编码序列。在一个示例性实施方案中，CDKL5的部分或完全编码序列经密码子优化以在人中表达。在一些实施方案中，CDKL5的部分或完全编码序列包含与选自SEQ ID NO：1-8的序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更多同一性的序列。

在一些实施方案中，本披露提供了rAAV，其包含AAV衣壳和包装在其中的载体基因组，其中所述载体基因组包含：(a)启动子序列和(b)CDKL5的编码序列，该编码序列包含与选自SEQ ID NO：1、2、3、4、5、6、7和8的序列具有至少95％同一性的序列。

在一些实施方案中，CDKL5由SEQ ID NO：1所示的野生型编码序列编码。在另一个实施方案中，可以使用比如SEQ ID NO：2所示的编码序列等编码序列表达CDKL5的变体或替代性天然同种型。在某些实施方案中，CDKL5由密码子优化的编码序列编码。在一些实施方案中，CDKL5由与SEQ ID NO：1或SEQ ID NO：2所示的野生型编码序列具有小于80％同一性的密码子优化的编码序列编码。在一些示例性实施方案中，CDKL5由选自SEQ ID NO：3-8的密码子优化的编码序列编码。在一些实施方案中，CDKL5由与选自SEQ ID NO：3-8的序列具有至少80％同一性的密码子优化的编码序列编码。在一些实施方案中，CDKL5由与选自SEQID NO：3-8的序列具有至少90％同一性的密码子优化的编码序列编码。在一些实施方案中，CDKL5由与选自SEQ ID NO：3-8的序列具有至少95％同一性的密码子优化的编码序列编码。在一些实施方案中，CDKL5的编码序列在3’末端处可以进一步包含终止密码子(TGA、TAA、或TAG)。在一些实施方案中，表达的CDKL5蛋白包含SEQ ID NO：9的氨基酸序列或由其组成。在一些实施方案中，表达的CDKL5蛋白包含SEQ ID NO：10的氨基酸序列或由其组成。

在一些实施方案中，启动子是神经元特异性启动子。在一个实施方案中，神经元特异性启动子选自人突触蛋白1(SYN1)启动子、小鼠钙/钙调蛋白依赖性蛋白激酶II(CaMKII)启动子、大鼠微管蛋白αI(Ta1)启动子、大鼠神经元特异性烯醇化酶(NSE)启动子、人神经元特异性烯醇化酶(ENO2)启动子、人血小板源性生长因子β链(PDGF)启动子、人BM88启动子、和神经元烟碱受体β2(CHRNB2)启动子。

在示例性实施方案中，神经元特异性启动子是SYN1启动子(例如，人SYN1启动子)。在一个实施方案中，SYN1启动子(例如，人SYN1启动子)具有包含SEQ ID NO：12或由其组成的核酸序列。

在一些实施方案中，启动子选自鸡β-肌动蛋白(CBA)启动子、巨细胞病毒(CMV)即早期基因启动子、甲状腺素转运蛋白(TTR)启动子、甲状腺素结合球蛋白(TBG)启动子、和α-1抗胰蛋白酶(A1AT)启动子。

在示例性实施方案中，启动子是CBA启动子。在一个实施方案中，CBA启动子具有包含SEQ ID NO：13或由其组成的核酸序列。

在一些实施方案中，启动子示基因特异性内源性启动子。在一个实施方案中，启动子包含天然基因启动子元件。在示例性实施方案中，启动子是CDKL5基因特异性内源性启动子，该CDKL5基因特异性内源性启动子包含至少15个连续核苷酸的核苷酸序列，该核苷酸序列与SEQ ID NO：14的相等长度区域具有至少95％同一性。

在一些实施方案中，经包装的载体基因组包含5’-ITR序列和/或3’-ITR序列。在某些实施方案中，5’-ITR序列来自AAV2。在一些实施方案中，3’-ITR序列来自AAV2。在一些实施方案中，5’-ITR序列和/或3’-ITR序列来自AAV2。在一些实施方案中，5’-ITR序列和/或3’-ITR序列包含SEQ ID NO：11或由其组成。在其他实施方案中，5’-ITR序列和/或3’-ITR序列来自非AAV2来源。

在一些实施方案中，经包装的载体基因组包含聚腺苷酸化信号序列。在一个实施方案中，聚腺苷酸化信号序列选自SV40聚腺苷酸化信号序列、牛生长激素(BGH)聚腺苷酸化信号序列和兔β珠蛋白聚腺苷酸化信号序列。在示例性实施方案中，聚腺苷酸化信号序列是SV40聚腺苷酸化信号序列。在一个实施方案中，SV40聚腺苷酸化信号序列包含SEQ ID NO：15或由其组成。

在一些实施方案中，经包装的载体基因组包含共有科扎克(Kozak)序列。在一个实施方案中，共有科扎克序列是GCCGCCACC(SEQ ID NO：16)。在某些实施方案中，共有科扎克序列位于CDKL5的编码序列的上游。

在一些实施方案中，经包装的载体基因组包含一个或多个增强子序列。在一个实施方案中，增强子选自巨细胞病毒(CMV)即早期基因增强子、甲状腺素转运蛋白增强子(enTTR)、鸡β-肌动蛋白(CBA)增强子、En34增强子、和载脂蛋白E(ApoE)增强子。在示例性实施方案中，增强子是CMV增强子(例如，CMV即早期基因增强子)。在一个实施方案中，CMV增强子(例如，CMV即早期基因增强子)具有包含SEQ ID NO：17或由其组成的序列。在某些实施方案中，增强子位于启动子序列的上游。

在一些实施方案中，经包装的载体基因组包含一个或多个内含子序列。在一个实施方案中，内含子选自SV40小T内含子、兔血红蛋白亚基β(rHBB)内含子、人β珠蛋白IVS2内含子、β-珠蛋白/IgG嵌合内含子、和hFIX内含子。在一个示例性实施方案中，内含子是SV40小T内含子。在一个实施方案中，SV40小T内含子序列包含SEQ ID NO：18或由其组成。

在一些实施方案中，AAV衣壳来自血清型1、2、3、4、5、6、7、8、9、10、11、12、rh10、hu37的AAV(即，AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV9、AAV10、AAV11、AAV12、AAVrh10、AAVhu37)，或其工程化的变体。在示例性实施方案中，AAV衣壳是AAV血清型9(AAV9)衣壳、AAV9变体衣壳、AAV血清型8(AAV8)衣壳、AAV8变体衣壳、或AAV血清型hu37(AAVhu37)衣壳。

在一些方面，本披露提供了编码CDKL5的新颖密码子优化的核酸序列。在一个实施方案中，编码CDKL5的密码子优化的核酸序列与SEQ ID NO：1或SEQ ID NO：2所示的野生型编码序列具有小于80％同一性。在一些实施方案中，编码CDKL5的密码子优化的核酸序列与选自SEQ ID NO：3-8的序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更多同一性。在一些实施方案中，本披露提供了核酸序列，这些核酸序列与SEQ ID NO：1或SEQ ID NO：2所示的野生型编码序列具有小于80％同一性，并且与选自SEQ ID NO：3-8的序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更多同一性。在示例性实施方案中，本披露提供了编码CDKL5的核酸序列，其选自选自SEQ ID NO：3-8的序列。进一步提供了SEQ ID NO：3-8所示的核酸序列的片段，这些片段编码具有功能性CDKL5活性的多肽。在一些实施方案中，编码CDKL5的核酸序列在3’末端处可以进一步包含终止密码子(TGA、TAA、或TAG)。

在一些方面，本披露提供了用于治疗CDD的新颖载体基因组构建体。在一些实施方案中，本披露提供了编码CDKL5的载体基因组构建体(即，多核苷酸)，该载体基因组构建体与选自SEQ ID NO：19-20的核酸序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更多同一性。在一个实施方案中，本披露提供了多核苷酸，其包含与SEQ ID NO：19具有至少95％同一性的核酸序列。在一个实施方案中，本披露提供了多核苷酸，该多核苷酸的核酸序列包含SEQ ID NO：19或由其组成。在一个实施方案中，本披露提供了多核苷酸，其包含与SEQ IDNO：20具有至少95％同一性的核酸序列。在另一个实施方案中，本披露提供了多核苷酸，该多核苷酸的核酸序列包含SEQ ID NO：20或由其组成。

在某些实施方案中，本披露提供了重组腺相关病毒(rAAV)，其可用作治疗CDD的基因疗法的药剂，其中所述rAAV包含AAV衣壳和包装在其中的如本文所述的载体基因组。在一些实施方案中，AAV衣壳来自血清型1、2、3、4、5、6、7、8、9、10、11、12、rh10、hu37的AAV(即，AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV9、AAV10、AAV11、AAV12、AAVrh10、AAVhu37)，或其工程化的变体。在示例性实施方案中，AAV衣壳是AAV血清型9(AAV9)衣壳、AAV9变体衣壳、AAV血清型8(AAV8)衣壳、AAV8变体衣壳、或AAV血清型hu37(AAVhu37)衣壳。

在某些实施方案中，本披露提供了可用于治疗CDKL5缺陷障碍(CDD)的rAAV，其中所述rAAV包含AAV衣壳和包装在其中的载体基因组，并且其中所述载体基因组包含：(a)启动子序列和(b)CDKL5或其同种型、或其功能性片段或功能性变体的部分或完全编码序列。在一些实施方案中，CDKL5的编码序列包含与选自SEQ ID NO：1-8的序列具有至少95％同一性的序列。

在某些实施方案中，本披露提供了可用于治疗CDKL5缺陷障碍(CDD)的rAAV，其中所述rAAV包含AAV衣壳和包装在其中的载体基因组，并且其中所述载体基因组包含：(a)5’-ITR序列；(b)启动子序列；(c)CDKL5的编码序列，该编码序列包含与选自SEQ ID NO：1-8的序列具有至少95％同一性的序列；(d)聚腺苷酸化信号序列；和(e)3’-ITR序列。

在某些实施方案中，本披露提供了可用于治疗CDKL5缺陷障碍(CDD)的rAAV，其中所述rAAV包含AAV9衣壳和包装在其中的载体基因组，并且其中所述载体基因组包含：(a)5’-ITR序列；(b)启动子序列；(c)CDKL5的编码序列，该编码序列包含与选自SEQ ID NO：1-8的序列具有至少95％同一性的序列；(d)聚腺苷酸化信号序列；和(e)3’-ITR序列。

在某些实施方案中，本披露提供了可用于治疗CDKL5缺陷障碍(CDD)的rAAV，其中所述rAAV包含AAV9衣壳和包装在其中的载体基因组，并且其中所述载体基因组包含：(a)AAV2 5’-ITR序列；(b)SYN1启动子序列(例如，人SYN1启动子序列)；(c)CDKL5的编码序列，该编码序列包含与选自SEQ ID NO：1-8的序列具有至少95％同一性的序列；(d)SV40聚腺苷酸化信号序列；和(e)AAV23’-ITR序列。在示例性实施方案中，CDKL5的编码序列包含SEQ IDNO：1或由其组成。

在某些实施方案中，本披露提供了可用于治疗CDKL5缺陷障碍(CDD)的rAAV，其中所述rAAV包含AAV9衣壳和包装在其中的载体基因组，并且其中所述载体基因组包含：(a)5’-ITR序列；(b)增强子序列；(c)启动子序列；(d)内含子序列；(e)CDKL5的编码序列，该编码序列包含与选自SEQ ID NO：1-8的序列具有至少95％同一性的序列；(f)聚腺苷酸化信号序列；和(g)3’-ITR序列。

在某些实施方案中，本披露提供了可用于治疗CDKL5缺陷障碍(CDD)的rAAV，其中所述rAAV包含AAV9衣壳和包装在其中的载体基因组，并且其中所述载体基因组包含：(a)AAV2 5’-ITR序列；(b)CMV增强子序列(例如，CMV即早期基因序列)；(c)CBA启动子序列；(d)SV40小T内含子序列；(e)CDKL5的编码序列，该编码序列包含与选自SEQ ID NO：1-8的序列具有至少95％同一性的序列；(f)SV40聚腺苷酸化信号序列；和(g)AAV2 3’-ITR序列。在示例性实施方案中，CDKL5的编码序列包含SEQ ID NO：1或由其组成。

在一些方面，本披露提供了本文披露的rAAV用于治疗CDD的用途，其中该rAAV包括AAV衣壳和包装在其中的载体基因组。在一些实施方案中，rAAV含有经包装的基因组，该经包装的基因组包含以下作为可操作地连接的组分：5’-ITR、启动子序列、CDKL5或其同种型或其功能性片段或功能性变体的部分或完全编码序列、和3’-ITR。在一些实施方案中，经包装的基因组还包含以下元件中的至少一种：(a)启动子序列上游的增强子序列、(b)启动子下游的内含子、和(c)3’-ITR上游的聚腺苷酸化序列。在一个示例性实施方案中，rAAV含有经包装的基因组，该经包装的基因组包含以下作为可操作地连接的组分：AAV2 5’-ITR序列、SYN1启动子(例如，人SYN1启动子)、CDKL5的编码序列、SV40聚腺苷酸化信号序列、和AAV2 3’-ITR。在一些实施方案中，CDKL5的编码序列包含与选自SEQ ID NO：1-8的序列具有至少95％同一性的序列。在一些实施方案中，衣壳是AAV9衣壳。

本披露进一步涉及包含本文披露的rAAV的药物组合物。在一些实施方案中，药物组合物包含药学上可接受的载剂或赋形剂。在一些实施方案中，包含rAAV的药物组合物被配制用于皮下、肌内、皮内、腹膜内、鞘内、脑室内、或静脉内施用。在示例性实施方案中，药物组合物被配制用于鞘内施用。

在又另一方面，本披露提供了在人受试者中治疗CDD的方法，该方法包括向该人受试者施用治疗有效量的本文披露的至少一种rAAV。在一个实施方案中，本披露提供了治疗CDD的方法，该方法包括施用包括AAV衣壳和包装在其中的载体基因组的rAAV，其中该载体基因组包含CDKL5或其同种型或其功能性片段或功能性变体的部分或完全编码序列。在一些实施方案中，该方法可进一步包括在施用rAAV之前施用IgG降解蛋白酶(例如，酿脓链球菌(Streptococcus pyogenes)IdeS或马链球菌(Streptococcus equi)IdeZ)。在一些实施方案中，本披露提供了在人受试者中治疗CDKL5缺陷障碍(CDD)的方法，该方法包括施用治疗有效量的本文披露的至少一种rAAV，其中已经向该人受试者施用了IgG降解蛋白酶。

在又另一方面，本披露提供了在人受试者中治疗CNS障碍的方法，该方法包括首先向该受试者施用皮质类固醇，随后施用治疗有效量的经设计用于治疗所述CNS障碍的至少一种rAAV，其中将该rAAV通过鞘内、脑室内、或经由大脑池内递送施用。在一些实施方案中，本披露提供了在人受试者中治疗CDKL5缺陷障碍(CDD)的方法，该方法包括向人受试者施用治疗有效量的重组腺相关病毒(rAAV)，其中所述rAAV包含AAV衣壳和包装在其中的载体基因组，其中所述载体基因组包含启动子序列和CDKL5的编码序列，并且其中已经向该人受试者施用了皮质类固醇。在一个实施方案中，皮质类固醇选自泼尼松龙、泼尼松、地塞米松、氢化可的松、曲安西龙、甲泼尼龙、布地奈德、倍他米松、和地夫可特。在示例性实施方案中，皮质类固醇是泼尼松龙。在一个实施方案中，CNS障碍选自CDD、快乐木偶综合征(Angelmansyndrome)、巴滕病(Batten disease)、克拉伯病(Krabbe disease)、帕金森病、阿尔茨海默病、脊髓性肌萎缩(SMA)I、II、III、和IV型、X连锁肌小管肌病、弗里德希氏共济失调(Friedrich’s Ataxia)、卡纳万病(Canavan’s)、肌萎缩侧索硬化(ALS)、肾上腺脑白质营养不良、亨廷顿病、雷特综合征、和脊髓小脑性共济失调。在示例性实施方案中，CNS障碍是CDD，并且rAAV包含可用于治疗本文所述的CDD的rAAV。

在某些实施方案中，本披露提供了在人受试者中治疗CDD的方法，该方法包括向经诊断具有至少一种CDKL5突变的人受试者施用治疗有效量的本文披露的至少一种rAAV。在一个实施方案中，本披露提供了在经诊断具有至少一种CDKL5突变的人受试者中治疗CDD的方法，该方法包括施用包括AAV衣壳和包装在其中的载体基因组的rAAV，其中该载体基因组包含CDKL5或其同种型或其功能性片段或功能性变体的部分或完全编码序列。在一些实施方案中，CDKL5的编码序列选自SEQ ID NO：1-8。在一些实施方案中，衣壳是AAV9衣壳。

在一些实施方案中，将rAAV通过皮下、肌内、皮内、腹膜内、鞘内、脑室内、静脉内、或经由大脑池内递送施用。在示例性实施方案中，将rAAV通过鞘内施用。在另一个示例性实施方案中，将rAAV通过经由大脑池施用。在一些实施方案中，将rAAV以约1x10¹¹至约1x10¹⁴个基因组拷贝(GC)/kg的剂量施用。在进一步的实施方案中，将rAAV以约1x10¹²至约1x10¹³个基因组拷贝(GC)/kg的剂量施用。在一些实施方案中，施用单剂量的rAAV。在其他实施方案中，施用多剂量的rAAV。

在一些方面，本文提供了包含本文披露的重组核酸分子、AAV载体、或rAAV的宿主细胞。在特定的实施方案中，宿主细胞可以适合AAV的繁殖。在某些实施方案中，宿主细胞选自HeLa、Cos-7、HEK293、A549、BHK、Vero、RD、HT-1080、ARPE-19、和MRC-5细胞。

本披露的以下部分描述了本发明的这些和其他方面和特征。

附图说明

参考以下附图可以更全面地理解本发明。

图1是显示在SYN启动子的控制下包含CDKL5的编码序列的第一示例性经包装的载体基因组构建体的示意图。图中使用的缩写：ITR-末端反向重复；hSyn-人突触蛋白1启动子；SV40聚(A)信号-SV40聚腺苷酸化信号。

图2是显示在鸡β-肌动蛋白(CBA)启动子的控制下包含CDKL5的编码序列的第二示例性经包装的载体基因组构建体的示意图。图中使用的缩写：ITR-末端反向重复；CMV-巨细胞病毒；SV40聚(A)信号-SV40聚腺苷酸化信号。

图3是显示在用质粒DNA转染Neuro2a细胞后人CDKL5过表达时的磷酸-EB2(pEB2)水平变化的图像。当人CDKL5在这些细胞中过表达时，CDKL5的下游靶标EB2显示增加的磷酸化。左侧两个分图代表未处理的细胞。右侧两个分图代表在CBA启动子的控制下用人CDKL5转染的细胞。

图4是显示脑室内给药rAAV9-CBA-eGFP(左侧分图)或rAAV9-SYN-eGFP(右侧分图)的CDKL5缺陷小鼠中增强型绿色荧光蛋白(eGFP)的分布的图像。两种载体在海马区和纹状体区都产生了高水平eGFP，并且在皮层和小脑中都产生了较少数量的eGFP阳性细胞。

图5是显示使用内源性CDKL5启动子以及CBA和SYN启动子在Neuro2a细胞中表达绿色荧光蛋白(GFP)和hCDKL5质粒的图像。内源性CDKL5启动子驱动hCDKL5以介于CBA和SYN启动子中间的水平在这些细胞中表达。图像从左到右(顶部四个分图)显示如下：未转染、用CBA-GFP转染、用SYN-GFP转染、以及用内源性CDKL5启动子和eGFP(Endo-eGFP)转染。关于底部四个分图，这些图像从左到右显示如下：未转染、用CBA-hCDKL5转染、用SYN-hCDKL5转染、以及用内源性CDKL5启动子和hCDKL5(Endo-hCDKL5)转染。

图6A分图是显示如通过荧光RNAScope检测到的hCDKL5 mRNA在经由脑室内途径给药rAAV9-CBA-hCDKL5(图6A的左侧分图图像)或rAAV9-SYN-hCDKL5(图6A的右侧分图图像)的CDKL5缺陷小鼠中的分布的图像。图6B分图是来自RNAScope原位杂交的代表性图像，该图像显示了如通过荧光RNAScope检测到的hCDKL5 mRNA在经由脑室内途径给药rAAV9-CBA-hCDKL5(方块5和6)或rAAV9-SYN-hCDKL5(方块7和8)的CDKL5缺陷小鼠中的分布。经由脑室内途径给药媒介物的CDKL5敲除(KO)小鼠显示在方块3和4中。未给药任何媒介物或任一载体(初始)的CDKL5野生型(WT)小鼠显示在方块1和2中。

图7是蛋白质印迹，显示在单次脑室内注射rAAV9-SYN-hCDKL5或rAAV9-CBA-hCDKL5(1.6e12载体基因组(vg))给药后2周，从Cdkl5敲除小鼠额叶皮层分离的CDKL5蛋白和磷酸化EB2(pEB2)的水平。与媒介物治疗的对照相比，经治疗的小鼠显示出增加的CDKL5水平。CDKL5下游靶标EB2的磷酸化证实了CDKL5充当功能性激酶。

图8是条形图，显示了在非人灵长类动物(NHP)受试者通过腰椎鞘内注射施用rAAV9-CBA-eGFP(CBA-eGFP)或rAAV9-SYN-eGFP(SYN-eGFP)后2周，其CNS和外周组织中每μg的组织DNA中载体基因组拷贝数的定量。两种载体在每个组织中产生相似数量的载体基因组。在每组条形图中，CBA-eGFP显示为左侧条形图(或在髓质的情况下为中间条形图)，而SYN-eGFP显示为右侧条形图。

图9是显示在NHP受试者通过腰椎鞘内注射施用rAAV9-CBA-eGFP(左侧3个分图)或rAAV9-SYN-eGFP(右侧3个分图)后2周，对eGFP免疫染色的大脑组织的代表性明视野显微镜图像的图像。来自给药rAAV9-CBA-eGFP的受试者的eGFP阳性细胞具有星形细胞/胶质细胞形态(底部左侧分图)，而来自给药rAAV9-SYN-eGFP的受试者的eGFP阳性细胞具有神经元形态(底部右侧分图)。

图10A-10C显示了展示在给药后大约3个月在CDKL5缺陷小鼠大脑的不同区域(额叶皮层：图10A；海马：图10B；和脑干：图10C)中使用蛋白质印迹定量的CDKL5的量的图。给药后3个月，观察到经治疗的小鼠大脑中的人CDKL5蛋白的适度持续增加(额叶皮层和脑干中20％-30％的WT水平，海马中为35％-70％)。

图11A-11D显示了表明与媒介物治疗的对照同窝小鼠(CDD-PBS)相比，rAAV9-SYN-hCDKL5治疗的小鼠(SYN-hCDKL5)在学习、记忆和运动功能任务上表现更好的图。在焦虑样行为(图11A)、运动功能(图11B)、协调(图11C)、以及学习和记忆的正常化(图11D)方面看到了改善。

图12是条形图，表明了在头低足高位(Trendelenburg position)鞘内(IT)递送(UX055-18-0001)8.06x10¹³个载体基因组(vg)或大脑池内(CM)递送(UX055-19-0002)7.76x10¹³个rAAV9-SYN-eGFP的vg后两周，1-2岁雌性非人灵长类动物(NHP)中CNS中每μg的DNA的基因组拷贝(GC)。该图表明大脑池内递送导致各种大脑组织(包括顶叶(10X)、纹状体(10X)和丘脑(8X))中NHP CNS中的载体基因组的量增加。收集本图中提供的数据作为两项独立研究的一部分。

图13A是条形图，表明了在第-4天至第28天施用与不施用1mg/kg泼尼松龙(通过经口管饲)的情况下，在头低足高位大脑池内(CM)递送(UX055-19-003)7.92x10¹³个rAAV9-SYN-CDKL5的vg后四周，1岁雌性非人灵长类动物(NHP)中CNS中每μg的DNA的基因组拷贝(GC)。该图表明，增加数目的载体基因组(通过qPCR测量)存在于施用泼尼松龙的NHP中的各种大脑组织中，包括在纹状体(20X)、海马(5X)、髓质(6X)、和小脑(5X)中的增加。图13B显示了来自相同NHP的含有枕叶皮层的大脑和小脑的较大切片，这些切片通过针对载体的探针使用BaseScope分析(原位杂交)检查。分图1和3代表来自未施用泼尼松龙的NHP的切片，而分图2和4代表来自施用泼尼松龙的NHP的切片。从每个NHP的一个完整半冠状切片中计算具有至少一个载体基因组的细胞的数量，并在图像中添加箭头以标记每个阳性细胞来辅助可视化。图13C是显示与没有用泼尼松龙治疗的那些NHP相比，在用泼尼松龙治疗的NHP中含有至少一个载体基因组的细胞数目的图。总体而言，与没有用泼尼松龙治疗的NHP相比，用泼尼松龙治疗的NHP中含有至少一个载体基因组的细胞数目有增加的趋势，但是，动物与动物之间存在显著差异。在非泼尼松龙组中注意到一个具有极高载体基因组阳性细胞数目的异常NHP。

具体实施方案

本发明提供了一系列用于治疗应用的新颖药剂和组合物。本发明的核酸序列、载体、重组病毒和相关组合物可用于改善、预防或治疗如本文所述的CDKL5缺陷障碍(CDD)。

除非另有说明，技术术语均按惯例使用。分子生物学中常用术语的定义可以在以下中找到：Benjamin Lewin，Genes V[基因V]，由Oxford University Press[牛津大学出版社]出版，1994(ISBN 0-19-854287-9)；Kendrew等人(编辑.)，The Encyclopedia ofMolecular Biology[分子生物学百科全书]，由Blackwell Science Ltd.[布莱克威尔科学公司]出版，1994(ISBN 0-632-02182-9)；和Robert A.Meyers(编辑)，Molecular Biologyand Biotechnology：a Comprehensive Desk Reference[分子生物学和生物技术：综合案头参考]，由VCH Publishers[VCH出版公司]出版，1995(ISBN 1-56081-569-8)。

为便于查阅本披露的各个实施方案，提供以下对特定术语的解释：

腺相关病毒(AAV)：一种小的、复制缺陷的、无包膜的病毒，可感染人和其他一些灵长类动物。AAV已知不会引起疾病并引发非常温和的免疫应答。利用AAV的基因疗法载体可以感染分裂细胞和休眠细胞，并且能以染色体外状态持续存在而不整合到宿主细胞的基因组中。这些特征使AAV成为一种有吸引力的基因疗法病毒载体。目前有12种公认的AAV血清型(AAV1-12)。

施用(Administration/Administer)：通过任何有效途径向受试者提供或给予比如治疗剂(例如，重组AAV)等药剂。示例性的施用途径包括但不限于注射(比如皮下、肌内、皮内、腹膜内、鞘内、脑室内、或静脉内施用)、口服、胆管腔内、舌下、直肠、透皮、鼻内、阴道和吸入途径。

编码序列：″编码序列″意指当可操作地连接到适当的调节序列时在体外或体内编码多肽的核苷酸序列。编码序列可包括或可不包括在编码区之前和之后的区，例如5’非翻译(5’UTR)和3’非翻译(3’UTR)序列，以及单个编码区段(外显子)之间的间插序列(内含子)。

密码子优化的：″密码子优化的″核酸是指已被改变的核酸序列，使得密码子对于在特定系统(比如特定物种或物种组)中的表达是最佳的。例如，可以优化核酸序列以在哺乳动物细胞或特定哺乳动物物种(比如人细胞)中表达。密码子优化不会改变编码蛋白质的氨基酸序列。

增强子：通过增加启动子的活性来增加转录速率的核酸序列。

内含子：基因中不包含蛋白质编码信息的一段DNA。内含子在信使RNA翻译之前去除。

末端反向重复(ITR)：有效复制所需的腺相关病毒基因组中的对称核酸序列。ITR序列位于AAV DNA基因组的每一端。ITR充当病毒DNA合成的复制起点，并且是用于产生AAV整合载体的必需顺式组分。

分离的：″分离的″生物组分(比如核酸分子、蛋白质、病毒或细胞)已与生物体的细胞或组织中的其他生物组分或生物体本身(其中组分天然地存在，如其他染色体和染色体外DNA和RNA、蛋白质和细胞)基本分离或纯化。已″分离″的核酸分子和蛋白质包括通过标准纯化方法纯化的那些。此术语还包括通过在宿主细胞中重组表达制备的核酸分子和蛋白质以及化学合成的核酸分子和蛋白质。

可操作地连接：当第一核酸序列被放置成与第二核酸序列有功能关系时，该第一核酸序列与该第二核酸序列可操作地连接。例如，如果启动子影响编码序列的转录或表达，则该启动子与该编码序列可操作地连接。通常，可操作地连接的DNA序列是连续的，并且在需要连接两个蛋白质编码区时，在同一阅读框中。

药学上可接受的载剂：可用于本披露的药学上可接受的载剂(媒介物)是常规的。Remington′s Pharmaceutical Sciences[雷明顿制药科学](E.W.Martin，MackPublishing Co.[麦克出版公司]，Easton，Pa.[宾夕法尼亚州伊斯顿]，第15版(1975))描述了适用于一种或多种治疗性化合物、分子或药剂的药物递送的组合物和配制剂。

一般而言，载剂的性质将取决于所采用的特定施用方式。例如，肠胃外配制剂通常包含可注射流体，其包括药学上和生理学上可接受的流体，比如水、生理盐水、平衡盐溶液、葡萄糖水溶液、甘油等作为媒介物。对于固体组合物，例如粉末、丸剂、片剂或胶囊形式)，常规的无毒固体载剂可以包括例如药物级的甘露醇、乳糖、淀粉或硬脂酸镁。除了生物中性载剂之外，要施用的药物组合物可含有少量无毒辅助物质，比如润湿剂或乳化剂、防腐剂和pH缓冲剂等，例如乙酸钠或脱水山梨糖醇单月桂酸酯。

预防、治疗或改善疾病：″预防″疾病(比如CDD)是指抑制疾病的全面发展。″治疗″是指在疾病或病理病症(比如CDD)开始发展后改善其体征或症状的治疗性干预。″改善″是指疾病(比如CDD)体征或症状的数量或严重程度的降低。

启动子：指导/启动核酸(例如基因)转录的DNA区域。启动子包括靠近转录起始位点的必要核酸序列。许多启动子序列是本领域技术人员已知的，并且甚至人工核酸分子中不同启动子序列的组合也是可能的。如本文所用，基因特异性内源性启动子是指调节内源性目的基因表达的天然启动子元件。在一个实施方案中，CDKL5基因特异性内源性启动子调节CDKL5基因的表达。

纯化的：术语″纯化的″并不要求绝对纯度；相反，它旨在作为一个相对术语。因此，例如，纯化的肽、蛋白质、病毒或其他活性化合物是从天然相关蛋白质和其他污染物中完全或部分分离的肽、蛋白质、病毒或其他活性化合物。在某些实施方案中，术语″基本上纯化的″是指已从细胞、细胞培养基或其他粗制剂中分离并进行分级以除去初始制剂的各种组分(比如蛋白质、细胞碎片和其他组分)的肽、蛋白质、病毒或其他活性化合物。

重组：重组核酸分子是一种具有非天然存在的序列或具有通过人工组合两个在其他情况下分离的序列片段而制成的序列的核酸分子。这种人工组合可以通过化学合成或通过核酸分子的分离片段的人工操作(比如通过基因工程技术)来实现。

类似地，重组病毒是包含非天然存在的或通过至少两个不同来源的序列的人工组合制成的序列(比如基因组序列)的病毒。术语″重组″还包括仅通过添加、取代或缺失天然核酸分子、蛋白质或病毒的一部分而改变的核酸、蛋白质和病毒。如本文所用，″重组AAV″是指其中包装了比如编码CDKL5的重组核酸分子的重组核酸分子的AAV颗粒。

序列同一性：两个或更多个核酸序列或两个或更多个氨基酸序列之间的同一性或相似性以序列之间的同一性或相似性表示。序列同一性可以用同一性百分比来衡量；百分比越高，序列越相同。序列相似性可以用百分比相似性来衡量(考虑到保守的氨基酸取代)；百分比越高，序列越相似。当使用标准方法比对时，核酸或氨基酸序列的同源物或直系同源物具有相对高程度的序列同一性/相似性。当直系同源蛋白质或cDNA衍生自更密切相关的物种(比如人和小鼠序列)时，与亲缘关系更远的物种(比如人和线虫序列)相比，这种同源性更显著。

用于比较的序列比对方法是本领域熟知的。各种程序和对准算法描述于：Smith和Waterman，Adv.Appl.Math.[应用数学进展]2：482，1981；Needleman和Wunsch，J.Mol.Biol.[分子生物学杂志]48：443，1970；Pearson和Lipman，Proc.Natl.Acad.Sci.USA[美国科学院院刊]85：2444，1988；Higgins和Sharp，Gene[基因]，73：237-44，1988；Higgins和Sharp，CABIOS5：151-3，1989；Corpet等人，Nuc.Acids Res.[核酸研究]16：10881-90，1988；Huang等人Computer Appls.in the Biosciences[计算机在生物科学中的应用]8，155-65，1992；以及Pearson等人，Meth.Mol.Rio.[数学分子比]24：307-31，1994；Altschul等人，J.Mol.Biol.[分子生物学杂志]215：403-10，1990给出了序列比对方法和同源性计算的详细考虑。

NCBI基本局部比对搜索工具(BLAST)(Altschul等人，J.Mol.Biol.[分子生物学杂志]215：403-10，1990)可从几个来源获得，包括美国国家生物信息中心(NCBI)和互联网上，用于与序列分析程序blastp、blasm、blastx、tblastn和tblastx结合使用。更多信息可以在NCBI网站上找到。

血清型：一组密切相关的微生物(比如病毒)，以特征抗原组来区分。

填充序列：指包含在较大核酸分子(比如载体)中的核苷酸序列，通常用于在两个核酸特征之间(比如启动子和编码序列之间)产生所需的间距，或延长核酸分子，使其具有所期望的长度。填充序列不包含蛋白质编码信息并且可以是未知/合成来源和/或与较大核酸分子内的其他核酸序列无关。

受试者：活的多细胞脊椎动物生物体，这一类别包括人和非人哺乳动物。在一些实施方案中，受试者是人。在一个实施方案中，人受试者是成人受试者，即大于18岁的人受试者。在一个实施方案中，人受试者是小儿受试者，即年龄在0-18岁(含)之间的人受试者。在一些实施方案中，已经向受试者(例如，人受试者)施用了皮质类固醇。在一些实施方案中，已经向受试者(例如，人受试者)施用了IgG降解蛋白酶。在一些实施方案中，已经向受试者(例如，人受试者)施用了皮质类固醇，并且也已经施用了IgG降解蛋白酶。

合成的：在实验室中通过人工方式产生，例如合成的核酸可以在实验室中化学合成。

非翻译区(UTR)：典型的mRNA在编码区的上游和下游分别含有5′非翻译区(5′UTR)和3′非翻译区(3′UTR)(参见Mignone F.等人，(2002)Genome Biol[基因组生物学]3：REVIEWS0004)。

治疗有效量：一定量的特定药物或治疗剂(例如，重组AAV)足以在用药剂治疗的受试者或细胞中实现所期望的效果。药剂的有效量将取决于几个因素，包括但不限于被治疗的受试者或细胞，以及治疗性组合物的施用方式。

载体：载体是允许插入外源核酸而不破坏载体在宿主细胞中复制和/或整合的能力的核酸分子。载体可包括允许其在宿主细胞中复制的核酸序列，比如复制起点。载体还可包括一种或多种选择标记基因和其他遗传元件。表达载体是包含必要的调控序列以允许插入的一个或多个基因的转录和翻译的载体。在本文的一些实施方案中，载体是AAV载体。

除非另外解释，本文所用的全部技术术语和科学术语具有与本披露所属领域的普通技术人员通常所理解的相同意义。除非上下文另外清楚指出，单数术语″一个(a)″、″一种(an)″、″该(the)″包含复数指代。″包含A或B″意指包括A或B、或A和B。进一步应理解，对于核酸或多肽给出的所有碱基大小或氨基酸大小以及所有分子量或分子量值是近似的，并提供用于说明。虽然与本文描述的那些方法和材料类似或等同的方法和材料可以用于本披露的实践或测试，但是以下描述合适的方法和材料。所有的公开物、专利申请、专利、以及本文提及的其他参考文献通过引用以其全文并入。在有矛盾的情况下，将以本说明书(包括术语的解释)为准。此外，材料、方法和实施例仅为说明性的并且不旨在是限制性的。

重组AAV(rAAV)：

本发明提供了组合物及其用于基因疗法的方法。更特别地，本文提供了重组腺相关病毒(rAAV)，其包含腺相关病毒(AAV)衣壳、和包装在其中的用于治疗CDD的载体基因组。

在一方面，本披露提供了重组腺相关病毒(rAAV)，其中所述rAAV包含AAV衣壳、和包装在其中的载体基因组，其中所述载体基因组包含：(a)启动子序列；和(b)CDKL5或其同种型、或其功能性片段或功能性变体的部分或完全编码序列。在示例性实施方案中，编码序列包含与选自SEQ ID NO：1-8的序列具有至少95％同一性的序列。

在一些实施方案中，经包装的载体基因组可进一步包含如本文所述的5’-ITR序列、增强子、内含子、共有科扎克序列、聚腺苷酸化信号、和/或3’-ITR序列。在一些实施方案中，重组载体可以进一步包含一个或多个填充核酸序列。在一个实施方案中，填充核酸序列位于内含子和CDKL5的部分或完全编码序列之间。

在本文所述的各实施方案中，rAAV包含AAV衣壳。AAV衣壳可以来自血清型1、2、3、4、5、6、7、8、9、10、11、12、rh10、hu37的AAV(即AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12、AAVrh10、AAVhu37)，以及从人和非人灵长类动物组织中分离出的超过100种变体中的任何一种。参见，例如Choi等人，2005，Curr Gene Ther.[当代基因治疗]5：299-310，2005和Gao等人，2005，Curr Gene Ther.[当代基因治疗]5：285-297。

除上述衣壳外，已被工程化以具有一种或多种有益的治疗特性(例如，提高对选定组织的靶向性、提高逃避免疫反应的能力、减少对中和抗体的刺激等)的变体AAV衣壳也包括在本发明范围内。此类工程化的变体衣壳的非限制性实施例描述于美国专利号9,506,083、9,585,971、9,587,282、9,611,302、9,725,485、9,856,539、9,909,142、9,920,097、10,011,640、10,081,659、10,179,176、10,202,657、10,214,566、10,214,785、10,266,845、10,294,281、10,301,648、10,385,320、和10,392,632中，以及描述于PCT公开号WO/2017/165859、WO/2018/022905、WO/2018/156654、WO/2018/222503、和WO/2018/226602中，其披露内容通过引用并入本文。

在某些在示例性实施方案中，根据本发明施用的rAAV包含AAV9衣壳。AAV9衣壳是由多种AAV9 vp蛋白组成的自组装AAV衣壳。AAV9 vp蛋白典型地表达为由SEQ ID NO：21的核酸序列或与其具有至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少97％、至少99％同一性的序列编码的选择性剪接变体，该序列编码SEQ ID NO：22的vp1氨基酸序列(GenBank登录号：AAS99264)。这些剪接变体产生SEQ ID NO：22的长度不同的蛋白质。如本文所用，AAV9变体包括例如WO/2016/049230、美国专利号8,927,514、美国专利公开号2015/0344911和美国专利号8,734,809中描述的那些。

如本文所指示，在一些实施方案中，根据本发明施用的rAAV可以包含AAV9衣壳。然而，在其他实施方案中，选择另一种AAV衣壳。组织特异性由衣壳类型决定。转导合适靶标(例如肝、肌肉、肺或CNS)的AAV血清型可被选作AAV病毒载体衣壳的来源，包括例如AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV6.2、AAV7、AAV8、AAV9、AAVrh10、AAVrh64R1、AAVrh64R2、AAVrh8。参见，例如，美国专利公开号2007/0036760；美国专利公开号2009/0197338；和EP1310571。还参见WO 2003/042397(AAV7和其他猿猴AAV)、美国专利号7282199和7790449(AAV8)。此外，尚未发现的AAV或基于其的重组AAV可用作AAV衣壳的来源。这些文献还描述了可被选择用于产生AAV的其他AAV，并通过引用并入本文。在一些实施方案中，用于在病毒载体中使用的AAV衣壳可以通过诱变(即通过插入、缺失或取代)上述AAV衣壳之一或其编码核酸来产生。在一些实施方案中，AAV衣壳是嵌合的，包含来自上述AAV衣壳蛋白中的两个或三个或四个或更多个的结构域。在一些实施方案中，AAV衣壳是来自两种或三种不同AAV或重组AAV的Vp1、Vp2和Vp3单体的嵌合体。在一些实施方案中，rAAV组合物包含上述衣壳中的多于一个。

末端反向重复(ITR)：

在一些实施方案中，rAAV包含含有AAV ITR序列的经包装的载体基因组，当AAV和腺病毒辅助功能以反式提供时，AAV ITR序列既起载体DNA复制起点作用，又起载体基因组的包装信号作用。此外，ITR是大Rep蛋白单链核酸内切的靶，从复制中间体拆分单个基因组。

在一些实施方案中，5’-ITR序列来自AAV2。在一些实施方案中，3’-ITR序列来自AAV2。在一些实施方案中，5’-ITR序列和3’-ITR序列来自AAV2。在一些实施方案中，5’-ITR序列和/或3’-ITR序列来自AAV2并且包含SEQ ID NO：11或由其组成。在其他实施方案中，5’-ITR序列和/或3’-ITR序列来自非AAV2来源。

启动子：

在本文所述的各个方面，rAAV包含经包装的载体基因组，该载体基因组包含有助于驱动和调节CDKL5表达的启动子序列。在示例性实施方案中，启动子序列位于5′-ITR序列与CDKL5的部分或完全编码序列之间。在一些实施方案中，启动子序列位于增强子序列的下游。在一些实施方案中，启动子序列位于内含子序列的上游。

在示例性实施方案中，神经元特异性启动子是SYN1启动子(例如，人SYN1启动子)。在一个实施方案中，SYN1启动子(例如，人SYN1启动子)与SEQ ID NO：12具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更多同一性。在示例性实施方案中，SYN1启动子(例如，人SYN1启动子)包含SEQ ID NO：12或由其组成。

在示例性实施方案中，启动子是CBA启动子。在一个实施方案中，CBA启动子包含SEQ ID NO：13或由其组成。

在一些实施方案中，启动子示基因特异性内源性启动子。在一个实施方案中，启动子包含天然基因启动子元件。在一些说明性实施方案中，本文所述的经包装的基因组包含CDKL5基因特异性内源性启动子，该CDKL5基因特异性内源性启动子包含至少15个连续核苷酸的核苷酸序列，该核苷酸序列与SEQ ID NO：14的相等长度区域具有至少95％同一性。在某些实施方案中，本文所述的经包装的基因组包含CDKL5基因特异性内源性启动子，该CDKL5基因特异性内源性启动子包含至少约15个连续核苷酸(例如，约30、约45、约60、约70、约80、约90、约100、约110、约120、约130、约140、约150、约160、约170、约180、约190、约200、约210、约220、约230、约240、约250、约260、约270、约280、约290、约300、约325、约350、约375、约400、约425、约450、约475、约500、约525、约550、约575、约600、约625、约650、约675、约700、约800、约900、约1000、约1100、约1200、约1300、约1400、或约1500个)的核苷酸序列，该核苷酸序列与SEQ ID NO：14的相等长度区域具有至少95％同一性。在一些说明性实施方案中，本文所述的经包装的基因组包含CDKL5基因特异性内源性启动子，该CDKL5基因特异性内源性启动子包含至少15个连续核苷酸的核苷酸序列，该核苷酸序列与SEQ ID NO：14的相等长度区域具有100％同一性。

其他载体元件：

除启动子和CDKL5的编码序列外，经包装的基因组可含有其他合适的转录起始、终止、增强子序列和有效的RNA加工信号。如下文进一步详述的，此类序列包括剪接和聚腺苷酸化(聚A)信号、增强表达的调节元件、稳定细胞质mRNA的序列、增强翻译效率的序列(即科扎克共有序列)和增强蛋白质稳定性的序列。

在一些实施方案中，rAAV含有包含一个或多个增强子序列的经包装的载体基因组。在一个实施方案中，增强子选自巨细胞病毒即早期基因(CMV)增强子、甲状腺素转运蛋白增强子(enTTR)、鸡β-肌动蛋白(CBA)增强子、En34增强子、和ApoE增强子。在示例性实施方案中，增强子是CMV增强子(例如，CMV即早期基因增强子)。在一个实施方案中，CMV增强子(例如，CMV即早期基因增强子)包含SEQ ID NO：17或由其组成。

在一些实施方案中，rAAV含有包含一个或多个内含子序列的经包装的载体基因组。在一个实施方案中，内含子选自SV40小T内含子、兔血红蛋白亚基β(rHBB)内含子、人β珠蛋白IVS2内含子、β-珠蛋白/IgG嵌合内含子、和hFIX内含子。在一个示例性实施方案中，内含子是SV40小T内含子。在一个实施方案中，SV40小T内含子序列包含SEQ ID NO：18或由其组成。

在一些实施方案中，rAAV含有包含共有科扎克序列的经包装的载体基因组。在一些实施方案中，共有科扎克序列位于内含子序列的下游。在一个实施方案中，共有科扎克序列是GCCGCCACC(SEQ ID NO：16)。

在一些实施方案中，rAAV含有包含聚腺苷酸化信号序列的经包装的载体基因组。在一个实施方案中，聚腺苷酸化信号序列选自牛生长激素(BGH)聚腺苷酸化信号序列、SV40聚腺苷酸化信号序列、兔β珠蛋白聚腺苷酸化信号序列、和CDKL5基因特异性内源性聚腺苷酸化信号序列。在示例性实施方案中，聚腺苷酸化信号序列是SV40聚腺苷酸化信号序列。在一个实施方案中，SV40聚腺苷酸化信号序列包含SEQ ID NO：15或由其组成。

CDKL5多肽和多核苷酸：

如本文所述，本发明的方面提供了包括经包装的基因组的重组载体，该经包装的基因组包含启动子序列和CDKL5或其同种型或其功能性片段或功能性变体的部分或完全编码序列。

在一个实施方案中，CDKL5的部分或完全编码序列是野生型编码序列。如本文所用，术语″野生型″是指与自然界中存在的生物聚合物(例如，多肽序列或多核苷酸序列)相同的生物聚合物(例如，多肽序列或多核苷酸序列)。

在替代实施方案中，CDKL5的部分或完全编码序列是密码子优化的编码序列。在一个实施方案中，CDKL5的部分或完全编码序列经密码子优化以在人中表达。

在本文所述的各实施方案中，提供了含有经包装的基因组的载体，该经包装的基因组包含CDKL5的编码序列。与本文所述的载体一起递送的多肽涵盖可用于治疗哺乳动物(包括人)的CDKL5多肽。

在一些实施方案中，用本文所述的载体表达的多肽是CDKL5同种型2(SEQ ID NO：9，GenBank登录号NP_001310218.1，960个氨基酸)或其功能性片段或功能性变体。在一些实施方案中，用本文所述的载体表达的多肽是CDKL5同种型2，并且包含SEQ ID NO：9或由其组成。在一个实施方案中，CDKL5同种型2多肽由SEQ ID NO：1所示的野生型编码序列编码。在替代性实施方案中，CDKL5同种型2多肽由密码子优化的编码序列编码。在一些实施方案中，CDKL5同种型2多肽由与SEQ ID NO：1所示的野生型编码序列具有小于80％同一性的密码子优化的编码序列编码。在一些示例性实施方案中，CDKL5同种型2多肽由选自SEQ ID NO：3-5的密码子优化的编码序列编码。在一些实施方案中，CDKL5同种型2的编码序列在3’末端处可以进一步包含终止密码子(TGA、TAA、或TAG)。

在一些实施方案中，用本文所述的载体表达的多肽是CDKL5同种型1(SEQ ID NO：10，GenBank登录号NP_001032420.1，1030个氨基酸)或其功能性片段或功能性变体。在一些实施方案中，用本文所述的载体表达的多肽是CDKL5同种型1，并且包含SEQ ID NO：10或由其组成。在一个实施方案中，CDKL5同种型1多肽由SEQ ID NO：2所示的野生型编码序列编码。在替代性实施方案中，CDKL5同种型1多肽由密码子优化的编码序列编码。在一些实施方案中，CDKL5同种型1多肽由与SEQ ID NO：2所示的野生型编码序列具有小于80％同一性的密码子优化的编码序列编码。在一些示例性实施方案中，CDKL5同种型1多肽由选自SEQ IDNO：6-8的密码子优化的编码序列编码。在一些实施方案中，CDKL5同种型1的编码序列在3’末端处可以进一步包含终止密码子(TGA、TAA、或TAG)。

在各种方面，本发明可用于递送本文所述的CDKL5多肽的片段、变体、同种型或融合物。

在一些实施方案中，本发明可用于递送CDKL5多肽的片段，这些片段包含至少50个、至少100个、至少150个、至少200个、至少250个、至少300个、至少350个、至少400个、至少450个、至少500个、至少550个、或至少600个氨基酸残基，并且保留与全长多肽相关的一种或多种活性(例如，在CDKL5的情况下的激酶活性)。此类片段可通过本领域常规且众所周知的重组技术获得。此外，可以通过本领域技术人员已知的常规体外测定来测试此类片段的活性。例如，CDKL5活性可以通过如Lin等人，2005，Human Mol Genet[人类分子遗传学]14(24)：3775-86中所述的体外自磷酸化激酶测定来测定。简而言之，可以将500μg的异位表达的FLAG-标记的CDKL5与5μg的M2结合的琼脂糖一起温育4h。可以将珠粒用TLB洗涤三次，并且用激酶缓冲液(25mM HEPES，pH 7.4、10mM MgCl₂、10mM MnCl₂、10mM二硫苏糖醇、0.2mM钒酸钠和10mM硝基苯磷酸盐)洗涤两次。然后可以将FLAG肽用于洗脱CDKL5。然后可以将生成的珠粒重悬于30μl的添加有100μM ATP、5μCi的[γ-³²P]-ATP(NEN)和底物的激酶缓冲液中。激酶测定可在30℃下进行15min，并通过添加SDS-PAGE蛋白上样缓冲液终止。

在一些方面，本披露还提供了编码上述多肽片段的核酸分子。

在一些实施方案中，本发明可用于递送CDKL5多肽的变体。在一些实施方案中，变体多肽可与野生型治疗性多肽，例如SEQ ID NO：9的野生型CDKL5同种型2多肽或SEQ IDNO：10的野生型CDKL5同种型1多肽具有至少80％(例如，80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、99.5％、99.6％、99.7％、99.8％、99.9％、或100％)同一性。在一些实施方案中，与相应的野生型多肽相比，变体治疗性多肽可具有至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个、至少21个、至少22个、至少23个、至少至少24个、至少25个、至少26个、至少27个、至少28个、至少29个、至少30个、至少31个、至少32个、至少33个、至少34个、至少35个、至少36个、至少37个、至少38个、至少39个、或至少40个不同残基。此类变体可通过本领域常规且众所周知的重组技术获得。此外，可以通过本领域技术人员已知的常规体外测定来测试此类变体的激酶活性。有关CDKL5激酶活性测定的说明，参见例如，Lin等人，2005，Human Mol Genet[人类分子遗传学]14(24)：3775-86。

在一些方面，本披露还提供了编码上述治疗性多肽变体的核酸分子。

新颖密码子优化的序列：

在一些方面，本披露提供了编码CDKL5同种型2的新颖密码子优化的核酸序列。在一个实施方案中，编码CDKL5同种型2的密码子优化的核酸序列与SEQ ID NO：1所示的野生型编码序列具有小于80％同一性。在一些实施方案中，编码CDKL5同种型2的密码子优化的核酸序列与SEQ ID NO：3-5具有至少80％(例如，80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、99.5％、99.6％、99.7％、99.8％、99.9％、或100％)同一性。在一些实施方案中，编码CDKL5同种型2的密码子优化的核酸序列与选自SEQ ID NO：3-5的序列具有100％同一性。在一些实施方案中，本披露提供了核酸序列，这些核酸序列与SEQ ID NO：1所示的野生型编码序列具有小于80％同一性，并且与SEQ ID NO：3-5具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更多同一性。在示例性实施方案中，本披露提供了编码CDKL5同种型2的核酸序列，该核酸序列选自SEQ ID NO：3-5。进一步提供了SEQ ID NO：3-5所示的核酸序列的片段，这些片段编码具有功能性CDKL5活性的多肽。在一些实施方案中，编码CDKL5同种型2的核酸序列在3’末端处可以进一步包含终止密码子(TGA、TAA、或TAG)。

在一些方面，本披露提供了编码CDKL5同种型1的新颖密码子优化的核酸序列。在一个实施方案中，编码CDKL5同种型1的密码子优化的核酸序列与SEQ ID NO：2所示的野生型编码序列具有小于80％同一性。在一些实施方案中，编码CDKL5同种型1的密码子优化的核酸序列与SEQ ID NO：6-8具有至少80％(例如，80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、99.5％、99.6％、99.7％、99.8％、99.9％、或100％)同一性。在一些实施方案中，编码CDKL5同种型1的密码子优化的核酸序列与选自SEQ ID NO：6-8的序列具有100％同一性。在一些实施方案中，本披露提供了核酸序列，这些核酸序列与SEQ ID NO：2所示的野生型编码序列具有小于80％同一性，并且与选自SEQ ID NO：6-8的序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或更多同一性。在示例性实施方案中，本披露提供了编码CDKL5同种型1的核酸序列，该核酸序列选自SEQ ID NO：6-8。进一步提供了SEQ ID NO：6-8所示的核酸序列的片段，这些片段编码具有功能性CDKL5活性的多肽。在一些实施方案中，编码CDKL5同种型1的核酸序列在3’末端处可以进一步包含终止密码子(TGA、TAA、或TAG)。

包含重组核酸分子的宿主细胞：

在一些方面，本文提供了包含本文披露的重组核酸分子、病毒载体(例如AAV载体)或rAAV的宿主细胞。在特定的实施方案中，宿主细胞可以适合AAV的繁殖。

可以使用比如细菌、酵母、昆虫、哺乳动物细胞等多种宿主细胞。在一些实施方案中，宿主细胞可以是适合于产生重组AAV(rAAV)的细胞(或细胞系)，例如HeLa、Cos-7、HEK293、A549、BHK、Vero、RD、HT-1080、ARPE-19或MRC-5细胞。

可以使用本领域已知的任何合适的方法将重组核酸分子或载体递送到宿主细胞培养物中。在一些实施方案中，产生了具有插入其基因组中的重组核酸分子或载体的稳定宿主细胞系。在一些实施方案中，产生稳定的宿主细胞系，其含有本文所述的rAAV载体。将rAAV载体转染至宿主培养物后，可以通过比如抗生素选择、荧光激活细胞分选、蛋白质印迹、基于PCR的检测、荧光原位杂交(如Nakai等人，Nature Genetics[自然遗传学](2003)34，297-302；Philpott等人，Journal of Virology[病毒学杂志](2002)76(11)：5411-5421和Howden等人，J Gene Med[基因药物杂志]2008；10：42-50中所述)等多种方法测定rAAV进入宿主基因组的整合。此外，稳定细胞系可以根据比如在Clark，Kidney International[国际肾脏杂志]第61卷(2002)：S9-S15，和Yuan等人，Human Gene Therapy[人基因疗法]2011年5月；22(5)：613-24中所述的那些方案等本领域众所周知的方案建立。

用于基因疗法的重组AAV：

AAV属于细小病毒科(Parvoviridae)和依赖病毒属(Dependovirus)。AAV是一种小型无包膜病毒，其包装线性单链DNA基因组。AAV DNA的有义链和反义链都以相同的频率包装到AAV衣壳中。

AAV基因组的特征是两个末端反向重复(ITR)，它们位于两个开放阅读框(ORF)的侧翼。例如，在AAV2基因组中，ITR的前125个核苷酸是回文，它自身折叠以最大化碱基配对并形成T形发夹结构。ITR的其他20个碱基，称为D序列，保持未配对状态。ITR是对AAV DNA复制很重要的顺式作用序列；ITR是复制起点，并作为DNA聚合酶合成第二链的引物。在此合成过程中形成的双链DNA，称为复制型单体，用于第二轮自引发复制并形成复制型二聚体。这些双链中间体通过链置换机制进行处理，产生用于包装的单链DNA和用于转录的双链DNA。位于ITR内的是Rep结合元件和末端解离位点(TRS)。在AAV复制过程中，病毒调节蛋白Rep使用这些特征来处理双链中间体。除了在AAV复制中的作用外，ITR对于AAV基因组包装、转录、非许可条件下的负调节和位点特异性整合也必不可少(Days和Berns，Clin Microbiol Rev[临床微生物学评论]21(4)：583-593，2008)。

AAV的左侧ORF包含Rep基因，其编码四种蛋白质-Rep78、Rep68、Rep52和Rep40。右侧ORF包含Cap基因，其产生三种病毒衣壳蛋白(VP1、VP2和VP3)。AAV衣壳包含60个病毒衣壳蛋白，它们排列成二十面体对称。VP1、VP2和VP3以1∶1∶10的摩尔比存在(Daya和Berns，ClinMicrobiol Rev[临床微生物学评论]21(4)：583-593，2008)。

AAV是目前基因治疗中最常用的病毒之一。尽管AAV会感染人和其他一些灵长类动物，但它已知不会引起疾病并引发非常温和的免疫应答。利用AAV的基因疗法载体可以感染分裂细胞和休眠细胞，并且以染色体外状态持续存在而不整合到宿主细胞的基因组中。由于AAV的有利特征，本披露考虑将AAV用于本文披露的重组核酸分子和方法。

AAV具有基因疗法载体的几个令人期望的特征，包括结合并进入靶细胞、进入细胞核的能力，在细胞核中长时间表达的能力以及低毒性。然而，AAV基因组的小尺寸限制了可以掺入的异源DNA的大小。为了尽量最小化这个问题，已经构建了不编码Rep和整合效率元件(IEE)的AAV载体。ITR被保留，因为它们是包装所需的顺式信号(Daya和Berns，ClinMicrobiol Rev[临床微生物评论]，21(4)：583-593，2008)。

生产适用于基因疗法的rAAV的方法是本领域众所周知的(参见，例如，美国专利申请号2012/0100606；2012/0135515；2011/0229971；和2013/0072548；和Ghosh等人，GeneTher[基因疗法]13(4)：321-329，2006)，并且可以与本文披露的重组核酸分子和方法一起使用。

在一些方面，本披露提供了本文披露的rAAV用于治疗CDKL5缺陷障碍(CDD)的用途，其中该rAAV包括AAV衣壳和包装在其中的载体基因组。在一些实施方案中，rAAV含有经包装的基因组，该经包装的基因组按5’至3’顺序包含以下作为可操作地连接的组分：5’-ITR、启动子序列、CDKL5或其功能性片段或功能性变体的部分或完全编码序列、和3’-ITR。在一些实施方案中，CDKL5的编码序列选自SEQ ID NO：1-8或与其具有至少95％同一性的序列。

在示例性实施方案中，CDKL5的编码序列包含SEQ ID NO：1或由其组成。在一些实施方案中，启动子序列选自SEQ ID NO：12-14。在示例性实施方案中，启动子序列包含SEQID NO：12或由其组成。在一些实施方案中，衣壳是AAV9衣壳。在一些实施方案中，衣壳是AAV8衣壳。在一些实施方案中，衣壳是AAV9变体衣壳。在一些实施方案中，5’-ITR序列和/或3’-ITR序列来自AAV2。在一些实施方案中，5’-ITR序列和/或3’-ITR序列包含SEQ ID NO：11或由其组成。

在示例性实施方案中，CDKL5的编码序列包含SEQ ID NO：2或由其组成。在一些实施方案中，启动子序列选自SEQ ID NO：12-14。在示例性实施方案中，启动子序列包含SEQID NO：12或由其组成。在一些实施方案中，衣壳是AAV9衣壳。在一些实施方案中，衣壳是AAV8衣壳。在一些实施方案中，衣壳是AAV9变体衣壳。在一些实施方案中，5’-ITR序列和/或3’-ITR序列来自AAV2。在一些实施方案中，5’-ITR序列和/或3’-ITR序列包含SEQ ID NO：11或由其组成。

在示例性实施方案中，CDKL5的编码序列包含SEQ ID NO：3或由其组成。在一些实施方案中，启动子序列选自SEQ ID NO：12-14。在示例性实施方案中，启动子序列包含SEQID NO：12或由其组成。在一些实施方案中，衣壳是AAV9衣壳。在一些实施方案中，衣壳是AAV8衣壳。在一些实施方案中，衣壳是AAV9变体衣壳。在一些实施方案中，5’-ITR序列和/或3’-ITR序列来自AAV2。在一些实施方案中，5’-ITR序列和/或3’-ITR序列包含SEQ ID NO：11或由其组成。

在示例性实施方案中，CDKL5的编码序列包含SEQ ID NO：4或由其组成。在一些实施方案中，启动子序列选自SEQ ID NO：12-14。在示例性实施方案中，启动子序列包含SEQID NO：12或由其组成。在一些实施方案中，衣壳是AAV9衣壳。在一些实施方案中，衣壳是AAV8衣壳。在一些实施方案中，衣壳是AAV9变体衣壳。在一些实施方案中，5’-ITR序列和/或3’-ITR序列来自AAV2。在一些实施方案中，5’-ITR序列和/或3’-ITR序列包含SEQ ID NO：11或由其组成。

在示例性实施方案中，CDKL5的编码序列包含SEQ ID NO：5或由其组成。在一些实施方案中，启动子序列选自SEQ ID NO：12-14。在示例性实施方案中，启动子序列包含SEQID NO：12或由其组成。在一些实施方案中，衣壳是AAV9衣壳。在一些实施方案中，衣壳是AAV8衣壳。在一些实施方案中，衣壳是AAV9变体衣壳。在一些实施方案中，5’-ITR序列和/或3’-ITR序列来自AAV2。在一些实施方案中，5’-ITR序列和/或3’-ITR序列包含SEQ ID NO：11或由其组成。

在示例性实施方案中，CDKL5的编码序列包含SEQ ID NO：6或由其组成。在一些实施方案中，启动子序列选自SEQ ID NO：12-14。在示例性实施方案中，启动子序列包含SEQID NO：12或由其组成。在一些实施方案中，衣壳是AAV9衣壳。在一些实施方案中，衣壳是AAV8衣壳。在一些实施方案中，衣壳是AAV9变体衣壳。在一些实施方案中，5’-ITR序列和/或3’-ITR序列来自AAV2。在一些实施方案中，5’-ITR序列和/或3’-ITR序列包含SEQ ID NO：11或由其组成。

在示例性实施方案中，CDKL5的编码序列包含SEQ ID NO：7或由其组成。在一些实施方案中，启动子序列选自SEQ ID NO：12-14。在示例性实施方案中，启动子序列包含SEQID NO：12或由其组成。在一些实施方案中，衣壳是AAV9衣壳。在一些实施方案中，衣壳是AAV8衣壳。在一些实施方案中，衣壳是AAV9变体衣壳。在一些实施方案中，5’-ITR序列和/或3’-ITR序列来自AAV2。在一些实施方案中，5’-ITR序列和/或3’-ITR序列包含SEQ ID NO：11或由其组成。

在示例性实施方案中，CDKL5的编码序列包含SEQ ID NO：8或由其组成。在一些实施方案中，启动子序列选自SEQ ID NO：12-14。在示例性实施方案中，启动子序列包含SEQID NO：12或由其组成。在一些实施方案中，衣壳是AAV9衣壳。在一些实施方案中，衣壳是AAV8衣壳。在一些实施方案中，衣壳是AAV9变体衣壳。在一些实施方案中，5’-ITR序列和/或3’-ITR序列来自AAV2。在一些实施方案中，5’-ITR序列和/或3’-ITR序列包含SEQ ID NO：11或由其组成。

图1提供了显示用于表达CDKL5的示例性经包装的载体基因组构建体的示意图，该示意图以5’至3’的顺序显示了：5’-ITR、SYN1启动子、CDKL5编码序列、SV40聚腺苷酸化信号序列、和3’-ITR。这一示例性经包装的载体基因组构建体的3,828bp序列提供于SEQ ID NO：19中。

图2提供了显示用于表达CDKL5的示例性经包装的载体基因组构建体的另一示意图，该示意图以5’至3’的顺序显示了：5’-ITR、CMV增强子(例如，CMV即早期基因增强子)、CBA启动子、SV40小T内含子、CDKL5编码序列、SV40聚腺苷酸化信号序列、和3’-ITR。这一示例性经包装的载体基因组构建体的4,057bp序列提供于SEQ ID NO：20中。

药物组合物：

在一些方面，本披露提供了包含本发明的rAAV(例如，用于递送CDKL5的rAAV)和药学上可接受的载剂或赋形剂的药物组合物。在一些实施方案中，包含本发明的rAAV(例如，用于递送CDKL5的rAAV)的药物组合物被配制用于皮下、肌内、皮内、腹膜内、鞘内、脑室内、静脉内、或大脑池内施用。在示例性实施方案中，药物组合物被配制用于鞘内施用。在另一个示例性实施方案中，药物组合物被配制用于大脑池内施用。

在一些实施方案中，rAAV在适合输注人受试者的缓冲液/载剂中配制。缓冲液/载剂应包括防止rAAV粘附在输液管上，但不会干扰rAAV体内结合活性的组分。各种合适的溶液可能包括以下中的一个或多个：缓冲盐水、表面活性剂和生理上相容的盐或盐的混合物(其离子强度被调节至相等于约100mM氯化钠(NaCl)至约250mM氯化钠)、或被调节至相等离子浓度的生理上相容的盐。pH值可以在6.5到8.5、或7到8.5、或7.5到8的范围内。合适的表面活性剂或表面活性剂的组合可选自泊洛沙姆，即由聚氧丙烯10(聚(环氧丙烷))的中心疏水链和侧翼的两个聚氧乙烯(聚(环氧乙烷))亲水链构成的非离子三嵌段共聚物、SOLUTOLHS 15(Macrogol-15羟基硬脂酸酯)、LABRASOL(聚氧辛酸甘油酯)、聚氧10油基醚、TWEEN(聚氧乙烯脱水山梨糖醇脂肪酸酯)、乙醇和聚乙二醇。

在示例性实施方案中，rAAV在包含NaCl(例如，200mM NaCl)、MgCl₂(例如，1mMMgCl₂)、Tris(例如，20mM Tris)(pH 8.0)、和泊洛沙姆188(例如，0.005％或0.01％泊洛沙姆188)的溶液中配制。

在一些实施方案中，rAAV在包含至少一种二元或多元醇的药物组合物中配制。在一个实施方案中，二元或多元醇是选自由聚乙二醇、丙二醇和山梨糖醇组成的组的一种或多种醇。

在示例性实施方案中，rAAV在包含山梨糖醇的药物组合物中配制。在一个实施方案中，山梨糖醇以0.5wt％至20wt％的范围存在于配制剂中。在一个实施方案中，山梨糖醇以1wt％至10wt％的范围存在于配制剂中。在一个实施方案中，山梨糖醇以约1wt％、约2wt％、约3wt％、约4wt％、约5wt％、约6wt％、约7wt％、约8wt％、约9wt％、或约10wt％存在于配制剂中。

在示例性实施方案中，rAAV在包含5wt％的山梨糖醇和泊洛沙姆188(例如，0.005％或0.01％泊洛沙姆188)的药物组合物中配制。

治疗CDKL5缺陷障碍(CDD)的方法：

在又另一方面，本披露提供了在人受试者中治疗CDKL5缺陷障碍(CDD)的方法，该方法包括向该人受试者施用治疗有效量的本文披露的至少一种rAAV。

在一个实施方案中，本披露提供了治疗CDD的方法，该方法包括施用包括AAV衣壳和包装在其中的载体基因组的rAAV，其中该载体基因组包含CDKL5或其功能性片段或功能性变体的部分或完全编码序列。在一些实施方案中，CDKL5的编码序列选自SEQ ID NO：1-8或与其具有至少95％同一性的序列。在示例性实施方案中，CDKL5的编码序列包含SEQ IDNO：1或由其组成。在一些实施方案中，启动子序列选自SEQ ID NO：12-14。在示例性实施方案中，启动子序列包含SEQ ID NO：12或由其组成。在一些实施方案中，衣壳是AAV9衣壳。

在某些实施方案中，本披露提供了在人受试者中治疗CDD的方法，该方法包括向经诊断具有至少一种CDKL5突变的人受试者施用治疗有效量的本文披露的至少一种rAAV。CDKL5中的病原性突变的非限制性列表描述于Hector等人，2017，Neurol Genet[神经基因]3(6)：e200中、Russo等人，2009，Neurogenetics[神经遗传学]10(3)：241-50中、和莱顿开放变异数据库(LOVD)全球CDKL5变异组(Leiden Open Variation Database(LOVD)GlobalVariome for CDKL5)处。

在一个实施方案中，本披露提供了在经诊断具有至少一种CDKL5突变的人受试者中治疗CDD的方法，该方法包括施用包括AAV衣壳和包装在其中的载体基因组的rAAV，其中该载体基因组包含CDKL5或其功能性片段或功能性变体的部分或完全编码序列。在一些实施方案中，CDKL5的编码序列选自SEQ ID NO：1-8或与其具有至少95％同一性的序列。在示例性实施方案中，CDKL5的编码序列包含SEQ ID NO：1或由其组成。在一些实施方案中，启动子序列选自SEQ ID NO：12-14。在示例性实施方案中，启动子序列包含SEQ ID NO：12或由其组成。在一些实施方案中，衣壳是AAV9衣壳。

可以使用任何合适的方法或途径来施用本文所述的rAAV或含有rAAV的组合物。施用途径包括，例如，皮下、皮内、腹膜内、鞘内、脑室内、静脉内、大脑池内、和其他肠胃外施用途径。在示例性实施方案中，将rAAV通过鞘内施用。在另一个示例性实施方案中，将rAAV通过经由大脑池施用。

在一个实施方案中，rAAV可以经由脑池鞘内途径施用。在另一个实施方案中，rAAV可以经由腰椎鞘内途径施用。在一些实施方案中，可以使用自动鞘内注射器施用rAAV。例如，利用CSF动力学、生理脉动和体积位移的注射器可用于鞘内递送rAAV。用于在本发明的方法中使用一种可能的注射器的一个实施例是Alcyone生命科学公司正在开发的Pulsar^TM智能鞘内递送平台。

施用的特定剂量对于每个患者可以是均一剂量，例如，1.0x10¹¹-1.0x10¹⁴个病毒基因组拷贝(GC)/患者。可替代地，患者的剂量可以根据患者的大致体重或表面积进行调整。确定合适剂量的其他因素可包括要治疗或预防的疾病或病症，疾病的严重程度，施用途径，以及患者的年龄、性别和医学病症。确定合适的治疗剂量所需的计算的进一步细化由本领域技术人员常规地进行，尤其是根据本文披露的剂量信息和测定。剂量也可以通过使用已知的用以确定剂量的测定结合适当的剂量-应答数据来确定。当监测疾病的进展时，也可以调整个体患者的剂量。

在一些实施方案中，将rAAV以例如约1.0x10¹¹个基因组拷贝/千克患者体重(GC/kg)至约1x10¹⁴GC/kg、约5x10¹¹个基因组拷贝/千克患者体重(GC/kg)至约5x10¹³GC/kg，或约1x10¹²至约1x10¹³GC/kg的剂量施用，如通过qPCR或数字液滴PCR(ddPCR)测量。在一些实施方案中，将rAAV以约1x10¹²至约1x10¹³个基因组拷贝(GC)/kg的剂量施用。在一些实施方案中，将rAAV以约1.1x10¹¹、约1.3x10¹¹、约1.6x10¹¹、约1.9x10¹¹、约2x10¹¹、约2.5x10¹¹、约3.0x10¹¹、约3.5x10¹¹、约4.0x10¹¹、约4.5x10¹¹、约5.0x10¹¹、约5.5x10¹¹、约6.0x10¹¹、约6.5x10¹¹、约7.0x10¹¹、约7.5x10¹¹、约8.0x10¹¹、约8.5x10¹¹、约9.0x10¹¹、约9.5x10¹¹、约1.0x10¹²、约1.5x10¹²、约2.0x10¹²、约2.5x10¹²、约3.0x10¹²、约3.5x10¹²、约4.0x10¹²、约4.5x10¹²、约5.0x10¹²、约5.5x10¹²、约6.0x10¹²、约6.5x10¹²、约7.0x10¹²、约7.5x10¹²、约8.0x10¹²、约8.5x10¹²、约9.0x10¹²、约9.5x10¹²、约1.0x10¹³、约1.5x10¹³、约2.0x10¹³、约2.5x10¹³、约3.0x10¹³、约3.5x10¹³、约4.0x10¹³、约4.5x10¹³、约5.0x10¹³、约5.5x10¹³、约6.0x10¹³、约6.5x10¹³、约7.0x10¹³、约7.5x10¹³、约8.0x10¹³、约8.5x10¹³、约9.0x10¹³、约9.5x10¹³个基因组拷贝(GC)/kg的剂量施用。rAAV可以根据所期望治疗结果的需要以单剂量或多剂量(比如2、3、4、5、6、7、8、9、10或更多个剂量)施用。

在一些实施方案中，根据本发明的治疗CDD的方法可进一步包含在施用本文所述的rAAV之前施用IgG降解蛋白酶。因此，本披露提供了治疗CDD的方法，该方法包括首先施用IgG降解蛋白酶，随后施用包括AAV衣壳和包装在其中的载体基因组的rAAV，其中该载体基因组包含CDKL5或其功能性片段或功能性变体的部分或完全编码序列。

在一些实施方案中，根据本发明的治疗CDD的方法在已经施用了IgG降解蛋白酶的人受试者上进行。

可用于本发明的蛋白酶的实施例包括，例如但不限于WO/2020/016318和/或WO/2020/159970中描述的那些，包括例如来自酿脓链球菌、马链球菌、犬支原体(Mycoplasmacanis)、停乳链球菌(Streptococcus agalactiae)、假豕链球菌(Streptococcuspseudoporcinus)、或恶臭假单胞菌(Pseudomonasputida)的半胱氨酸蛋白酶。

在某些实施方案中，IgG降解蛋白酶是来自酿脓链球菌(SEQ ID NO：23)的IdeS或与SEQ ID NO：23具有至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、或至少99％同一性的蛋白酶。在一些实施方案中，蛋白酶是SEQ ID NO：23的工程化的变体。工程化的IdeS蛋白酶的实施例描述于WO/2020/016318和美国专利公开号20180023070和20180037962中。在一些实施方案中，工程化的IdeS变体相对于SEQ ID NO：20可以具有1个、2个、3个、4个、5个、或更多个氨基酸修饰。

在某些实施方案中，IgG降解蛋白酶是来自马链球菌(SEQ ID NO：24)的IdeZ或与SEQ ID NO：24具有至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％、或至少99％同一性的蛋白酶。在一些实施方案中，蛋白酶是SEQ ID NO：24的工程化的变体。工程化的IdeZ蛋白酶的实施例描述于WO/2020/016318中。在一些实施方案中，工程化的IdeZ变体相对于SEQ ID NO：21可以具有1个、2个、3个、4个、5个或更多个氨基酸修饰。

可用于本发明的其他蛋白酶包括，例如但不限于，来自猪链球菌(Streptococcussuis)、豕链球菌(Streptococcus porcinus)、和马链球菌的IgdE酶，描述于WO/2017/134274中。

在一些实施方案中，IgG降解蛋白酶可以包封在脂质体、纳米颗粒、脂质纳米颗粒(LNP)、聚合物、微粒、微胶囊、胶束或细胞外囊泡中或与其复合。

包括使用皮质类固醇的治疗CNS障碍的方法：

本发明诸位发明人已经出人意料地观察到，在施用rAAV之前施用皮质类固醇泼尼松龙导致多个脑组织中存在的载体基因组的数目增加。不受理论的束缚，假设皮质类固醇用以减少CNS组织中的炎症，这允许rAAV渗透到深部CNS组织中，否则在没有皮质类固醇施用的情况下将不可到达这些深部CNS组织。因此，在又另一方面，本披露提供了在人受试者中治疗CNS障碍的方法，该方法包括首先向该受试者施用皮质类固醇，随后施用治疗有效量的经设计用于治疗所述CNS障碍的至少一种rAAV，其中将该rAAV通过鞘内、脑室内、或经由大脑池内递送施用。还提供了在人受试者中治疗CNS障碍的方法，该方法包括施用治疗有效量的经设计用于治疗所述CNS障碍的至少一种rAAV，其中已经向该受试者施用了皮质类固醇；任选地，将该rAAV通过鞘内、脑室内、或经由大脑池内递送施用。

在根据该方面的各种实施方案中，皮质类固醇可以选自泼尼松龙、泼尼松、地塞米松、氢化可的松、曲安西龙、甲泼尼龙、布地奈德、倍他米松、和地夫可特。在示例性实施方案中，皮质类固醇是泼尼松龙。

在根据该方面的各种实施方案中，在施用rAAV前至少约12小时向受试者施用皮质类固醇。在另一个实施方案中，在施用rAAV前至少约24小时向受试者施用皮质类固醇。在又另一实施方案中，在施用rAAV前至少约2天向受试者施用皮质类固醇。在又另一实施方案中，在施用rAAV前至少约3天、4天、5天、6天、7天、或更多天向受试者施用皮质类固醇。在又另一实施方案中，在施用rAAV前至少约7天、14天、21天、或更多天向受试者施用皮质类固醇。在又另一实施方案中，在施用rAAV前至少约1个月、至少约2个月、或至少约3个月向受试者施用皮质类固醇。

在一个实施方案中，在施用rAAV前施用皮质类固醇一次。在另一个实施方案中，在施用rAAV前施用皮质类固醇两次。在又另一实施方案中，在施用rAAV前施用皮质类固醇3次、4次、5次、或更多次。

可通过任何途径向人受试者施用皮质类固醇，包括但不限于口服、静脉内、皮内、经皮、皮下、肌内、吸入(例如，经由气溶胶)、口腔(例如，舌下)、局部(即，皮肤和粘膜表面，包括气道表面)、鞘内、关节内、胸膜内、大脑内、动脉内、腹膜内或鼻内施用。在示例性实施方案中，口服施用皮质类固醇。

在某些实施方案中，以mg/kg受试者体重为单位测量皮质类固醇的剂量。在其他实施方案中，以施用至受试者的每剂量mg为单位测量皮质类固醇的剂量。剂量的任何测量都可以与本发明的组合物和方法结合使用，并且剂量单位可以通过本领域的标准方法进行转换。

在某些实施方案中，可以约1mg至约1000mg的剂量施用皮质类固醇。在一些实施方案中，以约3mg至约300mg的剂量施用皮质类固醇。在一些实施方案中，以约5mg至约150mg的剂量施用皮质类固醇。在一些实施方案中，以约10mg至约100mg的剂量施用皮质类固醇。在一些实施方案中，以约15mg至约80mg的剂量施用皮质类固醇。在一些实施方案中，以约20mg至约60mg的剂量施用皮质类固醇。

在某些实施方案中，可以约1mg、约2mg、约3mg、约4mg、约5mg、约6mg、约7mg、约8mg、约9mg、约10mg、约11mg、约12mg、约13mg、约14mg、约15mg、约16mg、约17mg、约18mg、约19mg、约20mg、约21mg、约22mg、约23mg、约24mg、约25mg、约26mg、约27mg、约28mg、约29mg、约30mg、约31mg、约32mg、约33mg、约34mg、约35mg、约36mg、约37mg、约38mg、约39mg、约40mg、约45mg、约50mg、约55mg、约60mg、约65mg、约70mg、约75mg、约80mg、约85mg、约90mg、约95mg、约100mg、约150mg、约200mg、约250mg、约300mg、约350mg、约400mg、约450mg、约500mg、约600mg、约700mg、约800mg、约900mg、或约1000mg的剂量施用皮质类固醇。

在某些实施方案中，可以约0.1mg/kg至约100mg/kg的受试者体重的剂量施用皮质类固醇。在一些实施方案中，以约0.2mg/kg至约10mg/kg的剂量施用抗CD19抗体。在一些实施方案中，以约0.5mg/kg至约5mg/kg的剂量施用抗CD19抗体。在一些实施方案中，以约0.2mg/kg、约0.3mg/kg、约0.4mg/kg、约0.5mg/kg、约0.6mg/kg、约0.7mg/kg、约0.8mg/kg、约0.9mg/kg、约1mg/kg、约1.1mg/kg、约1.2mg/kg、约1.3mg/kg、约1.4mg/kg、约1.5mg/kg、约2mg/kg、约3mg/kg、约4mg/kg、约5mg/kg、或约10mg/kg的受试者体重的剂量施用抗CD19抗体。

在一些实施方案中，可以在施用rAAV之前施用皮质类固醇总共至少1天、至少2天、至少3天、至少4天、至少5天、至少6天、至少7天、至少8天、至少9天、至少10天、或更多天。例如，在某些示例性实施方案中，在施用rAAV之前，以1mg/kg/天施用皮质类固醇5天。

在一些实施方案中，可以1mg/kg/天施用皮质类固醇4周，其中第一次给药发生在施用rAAV前5天。在一些实施方案中，可以1mg/kg/天施用皮质类固醇4周，其中第一次给药发生在施用rAAV前5天，随后逐渐减少皮质类固醇，再持续4周。

根据该方面的方法可用于治疗基因疗法可能适合的任何CNS障碍。在一些实施方案中，CNS障碍选自CDD、快乐木偶综合征、巴滕病、克拉伯病、帕金森病、阿尔茨海默病、脊髓性肌萎缩(SMA)I、II、III、和IV型、X连锁肌小管肌病、弗里德希氏共济失调、卡纳万病、肌萎缩侧索硬化(ALS)、肾上腺脑白质营养不良、亨廷顿病、雷特综合征、和脊髓小脑性共济失调。在示例性实施方案中，CNS障碍是CDD。在另一个示例性实施方案中，用于在根据该方面的方法中使用的rAAV包含本文所述的可用于治疗CDD的rAAV。例如，rAAV可以包含AAV衣壳(例如，AAV9衣壳)和包装在其中的载体基因组，其中所述载体基因组包含：(a)启动子序列(例如，SYN1启动子序列，例如人SYN1启动子序列)；和(b)CDKL5或其同种型、或其功能性片段或功能性变体的部分或完全编码序列。在一些实施方案中，编码序列包含与选自SEQ IDNO：1-8的序列具有至少95％同一性的序列。

在整个说明书中，在组合物被描述为具有、包括或包含具体组分的情况下，或在工艺和方法被描述为具有、包括、或包含具体步骤的情况下，考虑到另外地，存在本发明的组合物，其基本上由或由叙述的组分组成，并且存在根据本发明的工艺和方法，其基本上由或由叙述的加工步骤组成。

在本披露中，当元件或组分被称为包括在和/或选自所列举的元件或组分的列表中时，应理解该元件或组分可以是所列举的元件或组分中的任何一个，或元件或组分可以从由两个或更多个该元件或组分组成的组中选择。

此外，应当理解，本文描述的组合物或方法的要素和/或特征可以以多种方式组合而不脱离本发明的精神和范围，无论是本文明确的还是隐含的。例如，当提及特定化合物时，除非从上下文另有理解，否则该化合物可用于本发明组合物的各种实施方案和/或本发明方法中。换句话说，在本披露中，已经以能够编写和绘制清晰简洁的应用的方式描述和描绘了实施方案，但是意图是并且将理解实施方案可以在不脱离本披露教导和一个或多个发明的情况下以各种方式组合或分离。例如，应当理解，这里描述和描绘的所有特征可以适用于这里描述和描绘的一个或多个发明的所有方面。

应当理解，除非从上下文和使用中另有理解，否则表述″至少一个″单独地包括表述之后所列举的对象中的每一个以及所列举的对象中的两个或更多个的各种组合。除非根据上下文另有理解，否则与三个或更多个列举的对象相关的表述″和/或″应被理解为具有相同的含义。

应理解术语″包括(include、includes、including)″、″具有(have、has、having)″、″包含(contain、contains或containing)″的使用，包括其语法等价物通常作为开放式和非限制性的，例如，不排除另外的未列举的元件或步骤，除非另有明确说明或从上下文中理解。

如果术语″约″的使用在数量值之前，则本发明还包括特定数量值本身，除非另有特别说明。如本文所用，除非另有说明或推断，术语″约″是指标称值的±10％变化。

应当理解，只要本发明保持可操作，步骤的顺序或执行某些动作的顺序是无关紧要的。此外，可以同时进行两个或更多个步骤或动作。

此处使用的任何和所有示例或示例性语言，例如″比如″或″包括″仅旨在更好地说明本发明，除非声明，否则不对本发明的范围构成限制。说明书中的语言不应当被解释为指示任何未要求保护的要素为实践本发明所必需的。

实施例

通过参考以下实施例将更容易理解现在在总体上描述的本披露，这些实施例仅被包括用于说明本披露的某些方面和实施方案的目的，并不旨以任何方式在限制本披露的范围。

实施例1：

本实施例的目的是证明将CBA-hCDKL5质粒递送至Neuro2a(小鼠神经母细胞瘤)细胞导致CDKL5表达增加，并且随后导致CDKL5的下游靶标EB2(微管相关蛋白RP/EB家族成员2)的磷酸化增加。

在本实施例中，Neuro2a细胞用含有人CDKL5 cDNA上游的CBA启动子的质粒瞬时转染48小时或不转染。将细胞固定并使用抗CDKL5抗体和抗磷酸-EB2抗体进行免疫细胞化学。使用Zeiss Axio Imager M2荧光显微镜进行成像。

如图3所示，表达高水平hCDKL5的Neuro2a细胞显示磷酸化EB2蛋白(CDKL5的下游靶标)水平升高。这表明将CDKL5递送至Neuro2a细胞可对比如EB2等CDKL5靶标的活性产生积极影响。

实施例2：

本实施例的目的是证明增强型绿色荧光蛋白(eGFP)在rAAV9-CBA-eGFP或rAAV9-SYN-eGFP治疗的Cdkl5 KO小鼠的各种CNS组织中的表达。

在本实施例中，向CDKL5缺陷小鼠给药(1)包含AAV9衣壳和包含CBA启动子和eGFP编码序列的载体基因组的rAAV[rAAV9-CBA-eGFP]或(2)包含AAV9衣壳和包含SYN启动子和eGFP编码序列的载体基因组的rAAV[rAAV9-SYN-eGFP]。通过脑室内(ICV)注射向小鼠施用rAAV。在给药后2-4周取回组织用于分析。将大脑固定、切片和免疫染色用于检测eGFP。

如图4所示，在给药小鼠大脑的多个区域(包括海马、纹状体、额叶皮层、和小脑)中检测到eGFP。所有小鼠在海马体和纹状体中具有最高浓度的eGFP。给药rAAV9-CBA-eGFP的小鼠在皮层中具有较少的细胞，并且在小脑中具有略微更多的细胞；给药rAAV9-SYN-eGFP的小鼠在小脑中具有较少的细胞，并且在皮层中具有略微更多的细胞。

本实施例证明通过ICV注射施用rAAV9-CBA-eGFP和rAAV9-SYN-eGFP在海马和纹状体细胞中产生高水平的eGFP蛋白，而在皮层和小脑细胞中产生较低水平的eGFP蛋白。

实施例3：

本实施例的目的是证明人突触蛋白(SYN)启动子、组成型启动子(CBA)、或内源性CDKL5启动子都可以驱动CDKL5蛋白在Neuro2a细胞中的表达。

在本实施例中，Neuro2a细胞用表达eGFP或hCDKL5的质粒瞬时转染48小时。将未转导的Neuro2a细胞用作对照。将细胞固定并使用抗CDKL5抗体进行免疫细胞化学。使用ZeissAxio Imager M2荧光显微镜进行成像。

如图5所示，与使用CBA启动子的最高表达水平和来自SYN启动子的较低表达水平相比，hCDKL5和eGFP以中等水平在使用内源性CDKL5启动子(分别为Endo-hCDKL5和Endo-eGFP)的转染的Neuro2a细胞中表达。本实施例表明位于人CDKL5转录起始位点(即内源性CDKL5启动子)上游的核苷酸能够驱动eGFP和hCDKL5在Neuro2a细胞中的表达。

实施例4：

本实施例的目的是证明将rAAV9-SYN-hCDKL5和rAAV9-CBA-hCDKL5递送至CDKL5缺陷小鼠的CSF导致hCDKL5 mRNA和cDNA在整个大脑中的稳固分布。

在本实施例中，向CDKL5缺陷小鼠给药(1)包含AAV9衣壳和包含CBA启动子和hCDKL5编码序列的载体基因组的rAAV[rAAV9-CBA-hCDKL5]或(2)包含AAV9衣壳和包含SYN启动子和hCDKL5编码序列的载体基因组的rAAV[rAAV9-SYN-hCDKL5]。通过脑室内(ICV)注射向小鼠给药。在给药后2周或3个月取回组织。通过RNAScope原位杂交将大脑固定、切片和处理，以检测hCDKL5 mRNA和cDNA以及Rbfox3 mRNA(神经元标记)。

如图6A所示，两种载体在海马区和纹状体区均产生高水平的hCDKL5。共标记证实两种载体也在整个皮层的神经元中表达hCDKL5(图6B)。如图6B所示，通过ICV注射用rAAV9-CBA-hCDKL5(图6B的方块5)或rAAV9-SYN-hCDKL5(图6B的方块7)治疗的小鼠在海马、纹状体和皮层中具有hCDKL5mRNA和cDNA。注意到两个载体之间总体分布的相似性，并且两个载体驱动神经元中的表达，如图6B显示了与神经元标记Rbfox3的共标记。图6B的方块6显示了由rAAV9-CBA-hCDKL5载体和神经元标记Rbfox3表达的hCDKL5的共标记。图6B的方块8显示了由rAAV9-SYN-hCDKL5载体和神经元标记Rbfox3表达的hCDKL5的共标记。

本实施例中显示的数据表明，通过ICV注射施用rAAV9-CBA-hCDKL5和rAAV9-SYN-hCDKL5载体导致整个海马、纹状体和额叶皮层的神经元中产生hCDKL5 mRNA和cDNA。

实施例5：

本实施例的目的是证明AAV9-SYN-hCDKL5和AAV9-CBA-hCDKL5 rAAV可以将功能性CDKL5蛋白递送至小鼠大脑。

在本实施例中，CDKL5缺陷小鼠通过脑室内(ICV)注射给药rAAV9-CBA-hCDKL5或rAAV9-SYN-hCDKL5，并且给药后2周取回组织。对大脑进行微切割，且将额叶皮层均质化并在蛋白质印迹上运行，该蛋白质印迹用针对CDKL5、pEB2和β-微管蛋白的抗体进行探测。

如图7所示，与媒介物对照相比，用rAAV9-SYN-hCDKL5或rAAV9-CBA-hCDKL5治疗的CDKL5缺陷小鼠表现出增加的CDKL5蛋白以及磷酸化EB2(pEB2)蛋白水平。CDKL5下游靶标EB2的磷酸化证实了递送的CDKL5充当功能性激酶。

实施例6：

本实施例的目的是证明AAV9-CBA-eGFP和AAV9-SYN-eGFP在腰椎鞘内递送后能够在非人灵长类动物(NHP)大脑中转导细胞。

在本实施例中，通过腰椎鞘内注射向年轻雌性NHP受试者(n＝2/载体)施用rAAV9-CBA-eGFP或rAAV9-SYN-eGFP。在给药后两周，取回多种组织用于通过定量PCR进行载体基因组定量。

在经处理的NHP的CNS和外周组织中量化了1x10³与1x10⁷个拷贝之间的vg/μg组织DNA。如图8所示，rAAV9-CBA-eGFP和rAAV9-SYN-eGFP施用在不同组织之间产生了相似的拷贝数。

本实施例显示通过鞘内递送施用rAAV9-CBA-eGFP和rAAV9-SYN-eGFP在所分析的所有大脑和外周区域中产生了载体基因组，其中载体之间的广泛生物分布没有区别。

实施例7：

本实施例的目的是证明，在NHP皮层中，AAV9-CBA-eGFP主要在具有胶质细胞形态的细胞中驱动表达，而AAV9-SYN-eGFP主要在具有神经元形态的细胞中驱动表达。

在本实施例中，通过腰椎鞘内注射向年轻雌性NHP受试者(n＝2/载体)施用rAAV9-CBA-eGFP或rAAV9-SYN-eGFP。在给药后两周，将取回，固定，切片，并且通过自由浮动显色检测对eGFP进行免疫染色。

在同时给药用rAAV9-CBA-eGFP和rAAV9-SYN-eGFP的NHP受试者的大脑切片中检测到eGFP阳性细胞。eGFP阳性细胞最常单独出现，但有时会以团簇形式出现。如图9所示，来自给药rAAV9-CBA-eGFP的NHP受试者的eGFP阳性细胞具有多种形态，尽管大多数具有带有宽树枝状和小细胞体的胶质细胞的外观，这表明CBA启动子在星形胶质细胞(即非神经元细胞)中优先表达eGFP有效载荷。同时，来自给药rAAV9-SYN-eGFP的NHP受试者的eGFP阳性细胞具有带有圆形细胞体及较小树状分枝的神经元的外观，这表明SYN启动子在所需靶细胞类型(即，神经元)中更有效的表达eGFP有效载荷。

通过鞘内给药施用rAAV9-CBA-eGFP主要产生eGFP阳性星形胶质细胞，而施用rAAV9-SYN-eGFP主要产生eGFP阳性神经元。本实施例中的数据表明，在非人灵长类动物，相对于组成型CBA启动子，SYN启动子可以有利于CDKL5在神经元细胞中的递送和表达。

实施例8：

本实施例的目的是证明将rAAV9-SYN-hCDKL5递送至幼年CDKL5缺陷小鼠的CSF可以改善学习、记忆和运动功能。

在本实施例中，在SYN启动子(图1中示出的经包装的基因组，SEQ ID NO：19，3,828bp)的控制下，通过脑室内(ICV)注射将包含AAV9衣壳和表达人CDKL5基因的载体基因组的单次高剂量(1.6e12 vg/小鼠)的重组AAV注射至3-5周龄(早期有症状)之间的幼年雄性及雌性CDKL5缺陷小鼠的CSF中。一旦小鼠达到2-3个月大(成年)，它们就会进行一系列行为测试。在行为测试之后，收集大脑用于CDKL5蛋白表达的蛋白质印迹分析。

来自多个大脑区的微切割组织的蛋白质印迹分析表明，给药后大约3个月，经治疗的小鼠大脑中的人CDKL5蛋白的适度持续增加(额叶皮层和脑干中20％-30％的WT水平，海马中为35％-70％)。参见图10A-10C，其显示了展示在CDKL5缺陷小鼠大脑的不同区域(额叶皮层：图10A；海马：图10B；和脑干：图10C)中定量的CDKL5的量的图。并且如图11A-11D所示，经rAAV9-SYN-hCDKL5治疗的雄性和雌性小鼠表现出焦虑样行为(图11A)、运动功能(图11B)和协调(图11C)以及学习和记忆的正常化的改善(图11D)。

在本实施例中突出显示的发现表明，当经由rAAV9-SYN-hCDKL5递送至幼年有症状的CDKL5缺陷小鼠时，即使是中等水平的功能性CDKL5也可导致大脑功能显著改善。

实施例9：

本实施例的目的是证明与腰椎鞘内施用相比，通过大脑池内施用途径施用载体颗粒可以增加rAAV9-SYN-eGFP向非人灵长类动物(NHP)的几个CNS区的递送。

在本实施例中，年轻雌性NHP受试者通过腰椎鞘内(IT)注射(n＝2)(数据取自上述实施例6)或通过大脑池内(CM)施用(n＝3)(本实施例9中新生成的数据)施用rAAV9-SYN-eGFP。在给药期间和给药完成后将所有NHP置于头低足高位15min。在给药后两周，取回多种组织用于通过定量PCR进行载体基因组定量。图12是条形图，表明了在头低足高位鞘内(IT)递送(UX055-18-0001)8.06x1013个载体基因组(vg)或大脑池内(CM)递送(UX055-19-0002)7.76x1013个rAAV9-SYN-eGFP的vg后两周，1-2岁雌性非人灵长类动物(NHP)中CNS中每μg的DNA的基因组拷贝(GC)。该图表明大脑池内递送导致各种大脑组织(包括顶叶(10X)、纹状体(10X)和丘脑(8X))中NHP CNS中的载体基因组的量增加。收集本图中提供的数据作为两项独立研究的一部分。

在经处理的NHP的大脑和脊髓组织中量化了1x10³与1x10⁶个拷贝之间的vg/μg组织DNA。如图12所示，相比于在许多CNS组织中进行腰椎鞘内递送，向大脑池施用rAAV9-SYN-eGFP产生更高的拷贝数。

在本实施例中突出显示的发现表明，向NHP中的几个CNS区增加rAAV递送可经由大脑池内施用途径来实现。

实施例10：

本实施例的目的是证明泼尼松龙惊人地增加了在大脑池内注射后递送至NHP中许多CNS区的rAAV9-SYN-hCDKL5(UX055-19-003)载体基因组的数量。

在本实施例中，年轻雌性NHP受试者通过大脑池内(CM)施用以头低足高位施用rAAV9-SYN-hCDKL5(具有(n＝3)或不具有泼尼松龙(n＝3))。泼尼松龙治疗组中的NHP在rAAV9-SYN-hCDKL5给药前4天开始通过经口管饲接受单次每日剂量1mg/kg的泼尼松龙，并持续到研究结束。在给药后四周，从大脑的一半取回各种组织用于通过定量PCR进行载体基因组量化，并将大脑的另一半进行冠向切片用于分析使用原位杂交转导的细胞的数量。将探针设计为与载体DNA特异性结合，并且将苏木精复染用于观察单个细胞。

在经处理的NHP的大脑区、脊髓和背根神经节(DRG)中量化了1x10³与1x10⁶个拷贝之间的vg/μg组织DNA。如图13A所示，与在许多CNS组织中单独施用rAAV9-SYN-hCDKL5相比，预处理及持续的泼尼松龙与rAAV9-SYN-hCDKL5组合施用至大脑池时出人意料地产生更高的拷贝数。由于没有预料到转导的增加，这些结果令人惊讶。

如图13B所示，对含有枕叶皮层和小脑的切片的BaseScope(原位杂交)分析表明，在用泼尼松龙处理的NHP中转导的细胞数量有增加的趋势(分图2和4)，然而，在非泼尼松龙组中观察到具有一个异常值NHP的显著的动物间差异(分图1和3)。如图13C所示，在非泼尼松龙组中注意到一个具有极高载体基因体阳性细胞数目的异常值NHP。

不受理论束缚，假设泼尼松龙抑制先天免疫系统的能力可能有助于这一发现，和/或泼尼松龙抑制炎症的能力可能允许rAAV渗透到更深的大脑中，导致观察到的通过载体基因组拷贝数测量的转导增加。

在本实施例中突出显示的发现表明，当在rAAV施用之前和施用期间给予皮质类固醇泼尼松龙时，可以实现向NHP中的几个CNS区增加rAAV递送。

编号的实施方案

本文披露的实施方案包括如在本披露的编号的实施方案中提供的实施方案P1至P53。

实施方案P1：一种重组腺相关病毒(rAAV)，其中所述rAAV包含AAV衣壳和包装在其中的载体基因组，其中所述载体基因组包含：

(a)启动子序列；以及

(b)CDKL5的编码序列，其中所述编码序列包含与SEQ ID NO：1-8具有至少95％同一性的序列。

实施方案P2：根据实施方案P1所述的rAAV，其中该AAV衣壳来自血清型1、2、3、4、5、6、7、8、9、10、11、12、rh10或hu37的AAV。

实施方案P3：根据实施方案P2所述的rAAV，其中该AAV衣壳来自AAV9。

实施方案P4：根据实施方案P2所述的rAAV，其中该AAV衣壳来自AAV8。

实施方案P5：根据实施方案P1所述的rAAV，其中该AAV衣壳是AAV9变体衣壳。

实施方案P6：根据实施方案P1-P5中任一项所述的rAAV，其中该启动子是神经元特异性启动子。

实施方案P7：根据实施方案P6所述的rAAV，其中该神经元特异性启动子选自人突触蛋白1(SYN1)启动子、小鼠钙/钙调蛋白依赖性蛋白激酶II(CaMKII)启动子、大鼠微管蛋白αI(Ta1)启动子、大鼠神经元特异性烯醇化酶(NSE)启动子、人神经元特异性烯醇化酶(ENO2)启动子、人血小板源性生长因子β链(PDGF)启动子、人BM88启动子、和神经元烟碱受体β2(CHRNB2)启动子。

实施方案P8：根据实施方案P7所述的rAAV，其中该神经元特异性启动子是SYN1启动子。

实施方案P9：根据实施方案P8所述的rAAV，其中该SYN1启动子序列包含SEQ IDNO：12。

实施方案P10：根据实施方案P8所述的rAAV，其中该SYN1启动子序列由SEQ ID NO：12组成。

实施方案P11：根据实施方案P1-P5中任一项所述的rAAV，其中该启动子选自鸡β-肌动蛋白(CBA)启动子、巨细胞病毒(CMV)即早期基因启动子、甲状腺素转运蛋白(TTR)启动子、甲状腺素结合球蛋白(TBG)启动子、和α-1抗胰蛋白酶(A1AT)启动子。

实施方案P12：根据实施方案P11所述的rAAV，其中该启动子是CBA启动子。

实施方案P13：根据实施方案P12所述的rAAV，其中该CBA启动子序列包含SEQ IDNO：13。

实施方案P14：根据实施方案P12所述的rAAV，其中该CBA启动子序列由SEQ ID NO：13组成。

实施方案P15：根据实施方案P1-P5中任一项所述的rAAV，其中该启动子是CDKL5基因特异性内源性启动子。

实施方案P16：根据实施方案P15所述的rAAV，其中该CDKL5基因特异性内源性启动子包含至少15个连续核苷酸的核苷酸序列，该核苷酸序列与SEQ ID NO：14的相等长度区域具有至少95％同一性。

实施方案P17：根据实施方案P1-P16中任一项所述的rAAV，其中该载体基因组进一步包含5’-ITR序列。

实施方案P18：根据实施方案P1-P17中任一项所述的rAAV，其中该载体基因组进一步包含3’-ITR序列。

实施方案P19：根据实施方案P17-P18中任一项所述的rAAV，其中该5’-ITR序列和/或该3’-ITR序列来自AAV2。

实施方案P20：根据实施方案P19所述的rAAV，其中该5’-ITR序列和该3’-ITR序列包含SEQ ID NO：11或由其组成。

实施方案P21：根据实施方案P17-P18中任一项所述的rAAV，其中该5’-ITR序列和/或该3’-ITR序列来自非AAV2来源。

实施方案P22：根据实施方案P1-P21中任一项所述的rAAV，其中该载体基因组进一步包含聚腺苷酸化信号序列。

实施方案P23：根据实施方案P22所述的rAAV，其中该聚腺苷酸化信号序列选自SV40聚腺苷酸化信号序列、牛生长激素(BGH)聚腺苷酸化信号序列和兔β珠蛋白聚腺苷酸化信号序列。

实施方案P24：根据实施方案P23所述的rAAV，其中该聚腺苷酸化信号序列是SV40聚腺苷酸化信号序列。

实施方案P25：根据实施方案P24所述的rAAV，其中该SV40聚腺苷酸化信号序列包含SEQ ID NO：15或由其组成。

实施方案P26：根据实施方案P1-P25中任一项所述的rAAV，其中该载体基因组进一步包含一个或多个增强子序列。

实施方案P27：根据实施方案P26所述的rAAV，其中该增强子选自巨细胞病毒(CMV)即早期基因增强子、甲状腺素转运蛋白增强子(enTTR)、鸡β-肌动蛋白(CBA)增强子、En34增强子、和载脂蛋白E(ApoE)增强子。

实施方案P28：根据实施方案P27所述的rAAV，其中该增强子是CMV增强子。

实施方案P29：根据实施方案P28所述的rAAV，其中该增强子序列包含SEQ ID NO：17或由其组成。

实施方案P30：根据实施方案P26-P29所述的rAAV，其中该增强子位于启动子序列的上游。

实施方案P31：根据实施方案P1-P30中任一项所述的rAAV，其中该载体基因组进一步包含一个或多个内含子序列。

实施方案P32：根据实施方案P31所述的rAAV，其中该内含子选自SV40小T内含子、兔血红蛋白亚基β(rHBB)内含子、人β珠蛋白IVS2内含子、β-珠蛋白/IgG嵌合内含子、或hFIX内含子。

实施方案P33：根据实施方案P32所述的rAAV，其中该内含子是SV40小T内含子。

实施方案P34：根据实施方案P33所述的rAAV，其中该SV40小T内含子序列包含SEQID NO：18或由其组成。

实施方案P35：一种组合物，其包含根据前述实施方案中任一项所述的rAAV、和药学上可接受的载剂。

实施方案P36：一种在人受试者中治疗CDKL5缺陷障碍(CDD)的方法，该方法包括向该人受试者施用治疗有效量的根据实施方案P1-P34中任一项所述的rAAV或根据实施方案P35所述的组合物。

实施方案P37：根据实施方案P36所述的方法，其中将该rAAV或该组合物通过皮下、肌内、皮内、腹膜内、鞘内、脑室内、静脉内、或大脑池内施用。

实施方案P38：根据实施方案P37所述的方法，其中将该rAAV或该组合物通过鞘内施用。

实施方案P39：根据实施方案P37所述的方法，其中将该rAAV或该组合物通过大脑池内施用。

实施方案P40：根据实施方案P37-P39中任一项所述的方法，其中将该rAAV以约1x10¹¹至约1x10¹⁴个基因组拷贝(GC)/kg的剂量施用。

实施方案P41：一种在人受试者中治疗CDKL5缺陷障碍(CDD)的方法，该方法包括首先向该人受试者施用皮质类固醇，随后施用治疗有效量的重组腺相关病毒(rAAV)，其中所述rAAV包含AAV衣壳和包装在其中的载体基因组，其中所述载体基因组包含启动子序列和CDKL5的编码序列。

实施方案P42：一种在人受试者中治疗CDKL5缺陷障碍(CDD)的方法，该方法包括首先向该人受试者施用皮质类固醇，随后施用治疗有效量的根据实施方案P1-P34中任一项所述的rAAV或根据实施方案P35所述的组合物。

实施方案P43：根据实施方案P41-P42中任一项所述的方法，其中该皮质类固醇选自泼尼松龙、泼尼松、地塞米松、氢化可的松、曲安西龙、甲泼尼龙、布地奈德、倍他米松、和地夫可特。

实施方案P44：根据实施方案P43所述的方法，其中该皮质类固醇是泼尼松龙。

实施方案P45：一种在人受试者中治疗CDKL5缺陷障碍(CDD)的方法，该方法包括首先向该人受试者施用IgG降解蛋白酶，随后施用治疗有效量的根据实施方案P1-P34中任一项所述的rAAV或根据实施方案P35所述的组合物。

实施方案P46：根据实施方案P45所述的方法，其中该IgG降解蛋白酶是酿脓链球菌的IdeS或其工程化的变体。

实施方案P47：根据实施方案P45所述的方法，其中该IgG降解蛋白酶是马链球菌的IdeZ或其工程化的变体。

实施方案P48：一种多核苷酸，其包含与SEQ ID NO：19具有至少95％同一性的核酸序列。

实施方案P49：一种多核苷酸，其包含SEQ ID NO：19。

实施方案P50：一种多核苷酸，其由SEQ ID NO：19组成。

实施方案P51：一种多核苷酸，其包含与SEQ ID NO：20具有至少95％同一性的核酸序列。

实施方案P52：一种多核苷酸，其包含SEQ ID NO：20。

实施方案P53：一种多核苷酸，其由SEQ ID NO：20组成。

通过引用并入

本文提及的每个专利文献和科学文章的全部披露内容出于所有目的通过引用并入。

等同物

在不脱离本披露的精神或基本特征的情况下，本披露可以以其他特定形式实施。因此，前述实施方案在所有方面都被认为是说明性的而不是限制本文描述的披露内容。不同实施方案的各种结构元件和各种披露的方法步骤可以以各种组合和排列来使用，并且所有此类变型都被认为是本披露的形式。因此，本披露的范围由所附权利要求而不是由前述说明书来指示，并且在权利要求的等效含义和范围内的所有变化旨在包含在其中。

序列表

<110> 阿尔特拉吉尼克斯制药公司

<120> 用于治疗CDKL5缺陷障碍的基因疗法

<130> XCH/HOLI/GOODW-23232

<140>

<141>

<150> 63/090,492

<151> 2020-10-12

<150> 62/976,483

<151> 2020-02-14

<160> 24

<170> PatentIn 3.5版

<210> 1

<211> 2880

<212> DNA

<213> 智人

<400> 1

atgaagattc ctaacattgg taatgtgatg aataaatttg agatccttgg ggttgtaggt 60

gaaggagcct atggagttgt acttaaatgc agacacaagg aaacacatga aattgtggcg 120

atcaagaaat tcaaggacag tgaagaaaat gaagaagtca aagaaacgac tttacgagag 180

cttaaaatgc ttcggactct caagcaggaa aacattgtgg agttgaagga agcatttcgt 240

cggaggggaa agttgtactt ggtgtttgag tatgttgaaa aaaatatgct cgaattgctg 300

gaagaaatgc caaatggagt tccacctgag aaagtaaaaa gctacatcta tcagctaatc 360

aaggctattc actggtgcca taagaatgat attgtccatc gagatataaa accagaaaat 420

ctcttaatca gccacaatga tgtcctaaaa ctgtgtgact ttggttttgc tcgtaatctg 480

tcagaaggca ataatgctaa ttacacagag tacgttgcca ccagatggta tcggtcccca 540

gaactcttac ttggcgctcc ctatggaaag tccgtggaca tgtggtcggt gggctgtatt 600

cttggggagc ttagcgatgg acagccttta tttcctggag aaagtgaaat tgaccaactt 660

tttactattc agaaggtgct aggaccactt ccatctgagc agatgaagct tttctacagt 720

aatcctcgct tccatgggct ccggtttcca gctgttaacc atcctcagtc cttggaaaga 780

agataccttg gaattttgaa tagtgttcta cttgacctaa tgaagaattt actgaagttg 840

gacccagctg acagatactt gacagaacag tgtttgaatc accctacatt tcaaacccag 900

agacttctgg atcgttctcc ttcaaggtca gcaaaaagaa aaccttacca tgtggaaagc 960

agcacattgt ctaatagaaa ccaagccggc aaaagtactg ctttgcagtc tcaccacaga 1020

tctaacagca aggacatcca gaacctgagt gtaggcctgc cccgggctga cgaaggtctc 1080

cctgccaatg aaagcttcct aaatggaaac cttgctggag ctagtcttag tccactgcac 1140

accaaaacct accaagcaag cagccagcct gggtctacca gcaaagatct caccaacaac 1200

aacataccac accttcttag cccaaaagaa gccaagtcaa aaacagagtt tgattttaat 1260

attgacccaa agccttcaga aggcccaggg acaaagtacc tcaagtcaaa cagcagatct 1320

cagcagaacc gccactcatt catggaaagc tctcaaagca aagctgggac actgcagccc 1380

aatgaaaagc agagtcggca tagctatatt gacacaattc cccagtcctc taggagtccc 1440

tcctacagga ccaaggccaa aagccatggg gcactgagtg actccaagtc tgtgagcaac 1500

ctttctgaag ccagggccca aattgcggag cccagtacca gtaggtactt cccatctagc 1560

tgcttagact tgaattctcc caccagccca acccccacca gacacagtga cacgagaact 1620

ttgctcagcc cttctggaag aaataaccga aatgagggaa cgctggactc acgtcgaacc 1680

acaaccagac attctaagac gatggaggaa ttgaagctgc cggagcacat ggacagtagc 1740

cattcccatt cactgtctgc acctcacgaa tctttttctt atggactggg ctacaccagc 1800

cccttttctt cccagcaacg tcctcatagg cattctatgt atgtgacccg tgacaaagtg 1860

agagccaagg gcttggatgg aagcttgagc atagggcaag ggatggcagc tagagccaac 1920

agcctgcaac tcttgtcacc ccagcctgga gaacagctcc ctccagagat gactgtggca 1980

agatcttcgg tcaaagagac ctccagagaa ggcacctctt ccttccatac acgccagaag 2040

tctgagggtg gagtgtatca tgacccacac tctgatgatg gcacagcccc caaagaaaat 2100

agacacctat acaatgatcc tgtgccaagg agagttggta gcttttacag agtgccatct 2160

ccacgtccag acaattcttt ccatgaaaat aatgtgtcaa ctagagtttc ttctctacca 2220

tcagagagca gttctggaac caaccactca aaaagacaac cagcattcga tccatggaaa 2280

agtcctgaaa atattagtca ttcagagcaa ctcaaggaaa aagagaagca aggatttttc 2340

aggtcaatga aaaagaaaaa gaagaaatct caaacagtac ccaattccga cagccctgat 2400

cttctgacgt tgcagaaatc cattcattct gctagcactc caagcagcag accaaaggag 2460

tggcgccccg agaagatctc agatctgcag acccaaagcc agccattaaa atcactgcgc 2520

aagttgttac atctctcttc ggcctcaaat cacccggctt cctcagatcc ccgcttccag 2580

cccttaacag ctcaacaaac caaaaattcc ttctcagaaa ttcggattca ccccctgagc 2640

caggcctctg gcgggagcag caacatccgg caggaacccg caccgaaggg caggccagcc 2700

ctccagctgc caggtcagat ggatcctggt tggcatgtgt cctctgtgac caggagtgcc 2760

acagagggcc cttcctactc tgaacagctg ggtgccaaaa gtgggccaaa tgggcacccc 2820

tataacagaa caaatcgctc acgaatgcca aatctgaatg atttaaaaga gacagccttg 2880

<210> 2

<211> 3090

<212> DNA

<213> 智人

<400> 2

atgaagattc ctaacattgg taatgtgatg aataaatttg agatccttgg ggttgtaggt 60

gaaggagcct atggagttgt acttaaatgc agacacaagg aaacacatga aattgtggcg 120

atcaagaaat tcaaggacag tgaagaaaat gaagaagtca aagaaacgac tttacgagag 180

cttaaaatgc ttcggactct caagcaggaa aacattgtgg agttgaagga agcatttcgt 240

cggaggggaa agttgtactt ggtgtttgag tatgttgaaa aaaatatgct cgaattgctg 300

gaagaaatgc caaatggagt tccacctgag aaagtaaaaa gctacatcta tcagctaatc 360

aaggctattc actggtgcca taagaatgat attgtccatc gagatataaa accagaaaat 420

ctcttaatca gccacaatga tgtcctaaaa ctgtgtgact ttggttttgc tcgtaatctg 480

tcagaaggca ataatgctaa ttacacagag tacgttgcca ccagatggta tcggtcccca 540

gaactcttac ttggcgctcc ctatggaaag tccgtggaca tgtggtcggt gggctgtatt 600

cttggggagc ttagcgatgg acagccttta tttcctggag aaagtgaaat tgaccaactt 660

tttactattc agaaggtgct aggaccactt ccatctgagc agatgaagct tttctacagt 720

aatcctcgct tccatgggct ccggtttcca gctgttaacc atcctcagtc cttggaaaga 780

agataccttg gaattttgaa tagtgttcta cttgacctaa tgaagaattt actgaagttg 840

gacccagctg acagatactt gacagaacag tgtttgaatc accctacatt tcaaacccag 900

agacttctgg atcgttctcc ttcaaggtca gcaaaaagaa aaccttacca tgtggaaagc 960

agcacattgt ctaatagaaa ccaagccggc aaaagtactg ctttgcagtc tcaccacaga 1020

tctaacagca aggacatcca gaacctgagt gtaggcctgc cccgggctga cgaaggtctc 1080

cctgccaatg aaagcttcct aaatggaaac cttgctggag ctagtcttag tccactgcac 1140

accaaaacct accaagcaag cagccagcct gggtctacca gcaaagatct caccaacaac 1200

aacataccac accttcttag cccaaaagaa gccaagtcaa aaacagagtt tgattttaat 1260

attgacccaa agccttcaga aggcccaggg acaaagtacc tcaagtcaaa cagcagatct 1320

cagcagaacc gccactcatt catggaaagc tctcaaagca aagctgggac actgcagccc 1380

aatgaaaagc agagtcggca tagctatatt gacacaattc cccagtcctc taggagtccc 1440

tcctacagga ccaaggccaa aagccatggg gcactgagtg actccaagtc tgtgagcaac 1500

ctttctgaag ccagggccca aattgcggag cccagtacca gtaggtactt cccatctagc 1560

tgcttagact tgaattctcc caccagccca acccccacca gacacagtga cacgagaact 1620

ttgctcagcc cttctggaag aaataaccga aatgagggaa cgctggactc acgtcgaacc 1680

acaaccagac attctaagac gatggaggaa ttgaagctgc cggagcacat ggacagtagc 1740

cattcccatt cactgtctgc acctcacgaa tctttttctt atggactggg ctacaccagc 1800

cccttttctt cccagcaacg tcctcatagg cattctatgt atgtgacccg tgacaaagtg 1860

agagccaagg gcttggatgg aagcttgagc atagggcaag ggatggcagc tagagccaac 1920

agcctgcaac tcttgtcacc ccagcctgga gaacagctcc ctccagagat gactgtggca 1980

agatcttcgg tcaaagagac ctccagagaa ggcacctctt ccttccatac acgccagaag 2040

tctgagggtg gagtgtatca tgacccacac tctgatgatg gcacagcccc caaagaaaat 2100

agacacctat acaatgatcc tgtgccaagg agagttggta gcttttacag agtgccatct 2160

ccacgtccag acaattcttt ccatgaaaat aatgtgtcaa ctagagtttc ttctctacca 2220

tcagagagca gttctggaac caaccactca aaaagacaac cagcattcga tccatggaaa 2280

agtcctgaaa atattagtca ttcagagcaa ctcaaggaaa aagagaagca aggatttttc 2340

aggtcaatga aaaagaaaaa gaagaaatct caaacagtac ccaattccga cagccctgat 2400

cttctgacgt tgcagaaatc cattcattct gctagcactc caagcagcag accaaaggag 2460

tggcgccccg agaagatctc agatctgcag acccaaagcc agccattaaa atcactgcgc 2520

aagttgttac atctctcttc ggcctcaaat cacccggctt cctcagatcc ccgcttccag 2580

cccttaacag ctcaacaaac caaaaattcc ttctcagaaa ttcggattca ccccctgagc 2640

caggcctctg gcgggagcag caacatccgg caggaacccg caccgaaggg caggccagcc 2700

ctccagctgc cagacggtgg atgtgatggc agaagacaga gacaccattc tggaccccaa 2760

gatagacgct tcatgttaag gacgacagaa caacaaggag aatacttctg ctgtggtgac 2820

ccaaagaagc ctcacactcc gtgcgtccca aaccgagccc ttcatcgtcc aatctccagt 2880

cctgctccct atccagtact ccaggtccga ggcacttcca tgtgcccgac actccaggtc 2940

cgaggcactg atgctttcag ctgcccaacc cagcaatccg ggttctcttt cttcgtgaga 3000

cacgttatga gggaagccct gattcacagg gcccaggtaa accaagctgc gctcctgaca 3060

taccatgaga atgcggcact gacgggcaag 3090

<210> 3

<211> 2880

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /备注="人工序列描述：合成多核苷酸"

<400> 3

atgaagattc ctaatattgg gaatgtgatg aataagtttg agattctggg ggtggtgggg 60

gagggggctt atggggtggt gctgaagtgt aggcataagg agacacatga gattgtggct 120

attaagaagt ttaaggattc tgaggagaat gaggaggtga aggagacaac actgagggag 180

ctgaagatgc tgaggacact gaagcaggag aatattgtgg agctgaagga ggcttttagg 240

aggaggggga agctgtatct ggtgtttgag tatgtggaga agaatatgct ggagctgctg 300

gaggagatgc ctaatggggt gcctcctgag aaggtgaagt cttatattta tcagctgatt 360

aaggctattc attggtgtca taagaatgat attgtgcata gggatattaa gcctgagaat 420

ctgctgattt ctcataatga tgtgctgaag ctgtgtgatt ttgggtttgc taggaatctg 480

tctgagggga ataatgctaa ttatacagag tatgtggcta caaggtggta taggtctcct 540

gagctgctgc tgggggctcc ttatgggaag tctgtggata tgtggtctgt ggggtgtatt 600

ctgggggagc tgtctgatgg gcagcctctg tttcctgggg agtctgagat tgatcagctg 660

tttacaattc agaaggtgct ggggcctctg ccttctgagc agatgaagct gttttattct 720

aatcctaggt ttcatgggct gaggtttcct gctgtgaatc atcctcagtc tctggagagg 780

aggtatctgg ggattctgaa ttctgtgctg ctggatctga tgaagaatct gctgaagctg 840

gatcctgctg ataggtatct gacagagcag tgtctgaatc atcctacatt tcagacacag 900

aggctgctgg ataggtctcc ttctaggtct gctaagagga agccttatca tgtggagtct 960

tctacactgt ctaataggaa tcaggctggg aagtctacag ctctgcagtc tcatcatagg 1020

tctaattcta aggatattca gaatctgtct gtggggctgc ctagggctga tgaggggctg 1080

cctgctaatg agtcttttct gaatgggaat ctggctgggg cttctctgtc tcctctgcat 1140

acaaagacat atcaggcttc ttctcagcct gggtctacat ctaaggatct gacaaataat 1200

aatattcctc atctgctgtc tcctaaggag gctaagtcta agacagagtt tgattttaat 1260

attgatccta agccttctga ggggcctggg acaaagtatc tgaagtctaa ttctaggtct 1320

cagcagaata ggcattcttt tatggagtct tctcagtcta aggctgggac actgcagcct 1380

aatgagaagc agtctaggca ttcttatatt gatacaattc ctcagtcttc taggtctcct 1440

tcttatagga caaaggctaa gtctcatggg gctctgtctg attctaagtc tgtgtctaat 1500

ctgtctgagg ctagggctca gattgctgag ccttctacat ctaggtattt tccttcttct 1560

tgtctggatc tgaattctcc tacatctcct acacctacaa ggcattctga tacaaggaca 1620

ctgctgtctc cttctgggag gaataatagg aatgagggga cactggattc taggaggaca 1680

acaacaaggc attctaagac aatggaggag ctgaagctgc ctgagcatat ggattcttct 1740

cattctcatt ctctgtctgc tcctcatgag tctttttctt atgggctggg gtatacatct 1800

cctttttctt ctcagcagag gcctcatagg cattctatgt atgtgacaag ggataaggtg 1860

agggctaagg ggctggatgg gtctctgtct attgggcagg ggatggctgc tagggctaat 1920

tctctgcagc tgctgtctcc tcagcctggg gagcagctgc ctcctgagat gacagtggct 1980

aggtcttctg tgaaggagac atctagggag gggacatctt cttttcatac aaggcagaag 2040

tctgaggggg gggtgtatca tgatcctcat tctgatgatg ggacagctcc taaggagaat 2100

aggcatctgt ataatgatcc tgtgcctagg agggtggggt ctttttatag ggtgccttct 2160

cctaggcctg ataattcttt tcatgagaat aatgtgtcta caagggtgtc ttctctgcct 2220

tctgagtctt cttctgggac aaatcattct aagaggcagc ctgcttttga tccttggaag 2280

tctcctgaga atatttctca ttctgagcag ctgaaggaga aggagaagca ggggtttttt 2340

aggtctatga agaagaagaa gaagaagtct cagacagtgc ctaattctga ttctcctgat 2400

ctgctgacac tgcagaagtc tattcattct gcttctacac cttcttctag gcctaaggag 2460

tggaggcctg agaagatttc tgatctgcag acacagtctc agcctctgaa gtctctgagg 2520

aagctgctgc atctgtcttc tgcttctaat catcctgctt cttctgatcc taggtttcag 2580

cctctgacag ctcagcagac aaagaattct ttttctgaga ttaggattca tcctctgtct 2640

caggcttctg gggggtcttc taatattagg caggagcctg ctcctaaggg gaggcctgct 2700

ctgcagctgc ctgggcagat ggatcctggg tggcatgtgt cttctgtgac aaggtctgct 2760

acagaggggc cttcttattc tgagcagctg ggggctaagt ctgggcctaa tgggcatcct 2820

tataatagga caaataggtc taggatgcct aatctgaatg atctgaagga gacagctctg 2880

<210> 4

<211> 2880

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /备注="人工序列描述：合成多核苷酸"

<400> 4

atgaagattc caaatattgg gaatgtgatg aataagtttg agattctggg ggtggtgggg 60

gagggggcat atggggtggt gctgaagtgt aggcataagg agacacatga gattgtggca 120

attaagaagt ttaaggattc agaggagaat gaggaggtga aggagacaac actgagggag 180

ctgaagatgc tgaggacact gaagcaggag aatattgtgg agctgaagga ggcatttagg 240

aggaggggga agctgtatct ggtgtttgag tatgtggaga agaatatgct ggagctgctg 300

gaggagatgc caaatggggt gccaccagag aaggtgaagt catatattta tcagctgatt 360

aaggcaattc attggtgtca taagaatgat attgtgcata gggatattaa gccagagaat 420

ctgctgattt cacataatga tgtgctgaag ctgtgtgatt ttgggtttgc aaggaatctg 480

tcagagggga ataatgcaaa ttatacagag tatgtggcaa caaggtggta taggtcacca 540

gagctgctgc tgggggcacc atatgggaag tcagtggata tgtggtcagt ggggtgtatt 600

ctgggggagc tgtcagatgg gcagccactg tttccagggg agtcagagat tgatcagctg 660

tttacaattc agaaggtgct ggggccactg ccatcagagc agatgaagct gttttattca 720

aatccaaggt ttcatgggct gaggtttcca gcagtgaatc atccacagtc actggagagg 780

aggtatctgg ggattctgaa ttcagtgctg ctggatctga tgaagaatct gctgaagctg 840

gatccagcag ataggtatct gacagagcag tgtctgaatc atccaacatt tcagacacag 900

aggctgctgg ataggtcacc atcaaggtca gcaaagagga agccatatca tgtggagtca 960

tcaacactgt caaataggaa tcaggcaggg aagtcaacag cactgcagtc acatcatagg 1020

tcaaattcaa aggatattca gaatctgtca gtggggctgc caagggcaga tgaggggctg 1080

ccagcaaatg agtcatttct gaatgggaat ctggcagggg catcactgtc accactgcat 1140

acaaagacat atcaggcatc atcacagcca gggtcaacat caaaggatct gacaaataat 1200

aatattccac atctgctgtc accaaaggag gcaaagtcaa agacagagtt tgattttaat 1260

attgatccaa agccatcaga ggggccaggg acaaagtatc tgaagtcaaa ttcaaggtca 1320

cagcagaata ggcattcatt tatggagtca tcacagtcaa aggcagggac actgcagcca 1380

aatgagaagc agtcaaggca ttcatatatt gatacaattc cacagtcatc aaggtcacca 1440

tcatatagga caaaggcaaa gtcacatggg gcactgtcag attcaaagtc agtgtcaaat 1500

ctgtcagagg caagggcaca gattgcagag ccatcaacat caaggtattt tccatcatca 1560

tgtctggatc tgaattcacc aacatcacca acaccaacaa ggcattcaga tacaaggaca 1620

ctgctgtcac catcagggag gaataatagg aatgagggga cactggattc aaggaggaca 1680

acaacaaggc attcaaagac aatggaggag ctgaagctgc cagagcatat ggattcatca 1740

cattcacatt cactgtcagc accacatgag tcattttcat atgggctggg gtatacatca 1800

ccattttcat cacagcagag gccacatagg cattcaatgt atgtgacaag ggataaggtg 1860

agggcaaagg ggctggatgg gtcactgtca attgggcagg ggatggcagc aagggcaaat 1920

tcactgcagc tgctgtcacc acagccaggg gagcagctgc caccagagat gacagtggca 1980

aggtcatcag tgaaggagac atcaagggag gggacatcat catttcatac aaggcagaag 2040

tcagaggggg gggtgtatca tgatccacat tcagatgatg ggacagcacc aaaggagaat 2100

aggcatctgt ataatgatcc agtgccaagg agggtggggt cattttatag ggtgccatca 2160

ccaaggccag ataattcatt tcatgagaat aatgtgtcaa caagggtgtc atcactgcca 2220

tcagagtcat catcagggac aaatcattca aagaggcagc cagcatttga tccatggaag 2280

tcaccagaga atatttcaca ttcagagcag ctgaaggaga aggagaagca ggggtttttt 2340

aggtcaatga agaagaagaa gaagaagtca cagacagtgc caaattcaga ttcaccagat 2400

ctgctgacac tgcagaagtc aattcattca gcatcaacac catcatcaag gccaaaggag 2460

tggaggccag agaagatttc agatctgcag acacagtcac agccactgaa gtcactgagg 2520

aagctgctgc atctgtcatc agcatcaaat catccagcat catcagatcc aaggtttcag 2580

ccactgacag cacagcagac aaagaattca ttttcagaga ttaggattca tccactgtca 2640

caggcatcag gggggtcatc aaatattagg caggagccag caccaaaggg gaggccagca 2700

ctgcagctgc cagggcagat ggatccaggg tggcatgtgt catcagtgac aaggtcagca 2760

acagaggggc catcatattc agagcagctg ggggcaaagt cagggccaaa tgggcatcca 2820

tataatagga caaataggtc aaggatgcca aatctgaatg atctgaagga gacagcactg 2880

<210> 5

<211> 2880

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /备注="人工序列描述：合成多核苷酸"

<400> 5

atgaagatac caaatatagg taatgtaatg aataagtttg aaatactagg tgtagtaggt 60

gaaggtgcat atggtgtagt actaaagtgt aggcataagg aaacacatga aatagtagca 120

ataaagaagt ttaaggattc agaagaaaat gaagaagtaa aggaaacaac actaagggaa 180

ctaaagatgc taaggacact aaagcaagaa aatatagtag aactaaagga agcatttagg 240

aggaggggta agctatatct agtatttgaa tatgtagaaa agaatatgct agaactacta 300

gaagaaatgc caaatggtgt accaccagaa aaggtaaagt catatatata tcaactaata 360

aaggcaatac attggtgtca taagaatgat atagtacata gggatataaa gccagaaaat 420

ctactaatat cacataatga tgtactaaag ctatgtgatt ttggttttgc aaggaatcta 480

tcagaaggta ataatgcaaa ttatacagaa tatgtagcaa caaggtggta taggtcacca 540

gaactactac taggtgcacc atatggtaag tcagtagata tgtggtcagt aggttgtata 600

ctaggtgaac tatcagatgg tcaaccacta tttccaggtg aatcagaaat agatcaacta 660

tttacaatac aaaaggtact aggtccacta ccatcagaac aaatgaagct attttattca 720

aatccaaggt ttcatggtct aaggtttcca gcagtaaatc atccacaatc actagaaagg 780

aggtatctag gtatactaaa ttcagtacta ctagatctaa tgaagaatct actaaagcta 840

gatccagcag ataggtatct aacagaacaa tgtctaaatc atccaacatt tcaaacacaa 900

aggctactag ataggtcacc atcaaggtca gcaaagagga agccatatca tgtagaatca 960

tcaacactat caaataggaa tcaagcaggt aagtcaacag cactacaatc acatcatagg 1020

tcaaattcaa aggatataca aaatctatca gtaggtctac caagggcaga tgaaggtcta 1080

ccagcaaatg aatcatttct aaatggtaat ctagcaggtg catcactatc accactacat 1140

acaaagacat atcaagcatc atcacaacca ggttcaacat caaaggatct aacaaataat 1200

aatataccac atctactatc accaaaggaa gcaaagtcaa agacagaatt tgattttaat 1260

atagatccaa agccatcaga aggtccaggt acaaagtatc taaagtcaaa ttcaaggtca 1320

caacaaaata ggcattcatt tatggaatca tcacaatcaa aggcaggtac actacaacca 1380

aatgaaaagc aatcaaggca ttcatatata gatacaatac cacaatcatc aaggtcacca 1440

tcatatagga caaaggcaaa gtcacatggt gcactatcag attcaaagtc agtatcaaat 1500

ctatcagaag caagggcaca aatagcagaa ccatcaacat caaggtattt tccatcatca 1560

tgtctagatc taaattcacc aacatcacca acaccaacaa ggcattcaga tacaaggaca 1620

ctactatcac catcaggtag gaataatagg aatgaaggta cactagattc aaggaggaca 1680

acaacaaggc attcaaagac aatggaagaa ctaaagctac cagaacatat ggattcatca 1740

cattcacatt cactatcagc accacatgaa tcattttcat atggtctagg ttatacatca 1800

ccattttcat cacaacaaag gccacatagg cattcaatgt atgtaacaag ggataaggta 1860

agggcaaagg gtctagatgg ttcactatca ataggtcaag gtatggcagc aagggcaaat 1920

tcactacaac tactatcacc acaaccaggt gaacaactac caccagaaat gacagtagca 1980

aggtcatcag taaaggaaac atcaagggaa ggtacatcat catttcatac aaggcaaaag 2040

tcagaaggtg gtgtatatca tgatccacat tcagatgatg gtacagcacc aaaggaaaat 2100

aggcatctat ataatgatcc agtaccaagg agggtaggtt cattttatag ggtaccatca 2160

ccaaggccag ataattcatt tcatgaaaat aatgtatcaa caagggtatc atcactacca 2220

tcagaatcat catcaggtac aaatcattca aagaggcaac cagcatttga tccatggaag 2280

tcaccagaaa atatatcaca ttcagaacaa ctaaaggaaa aggaaaagca aggttttttt 2340

aggtcaatga agaagaagaa gaagaagtca caaacagtac caaattcaga ttcaccagat 2400

ctactaacac tacaaaagtc aatacattca gcatcaacac catcatcaag gccaaaggaa 2460

tggaggccag aaaagatatc agatctacaa acacaatcac aaccactaaa gtcactaagg 2520

aagctactac atctatcatc agcatcaaat catccagcat catcagatcc aaggtttcaa 2580

ccactaacag cacaacaaac aaagaattca ttttcagaaa taaggataca tccactatca 2640

caagcatcag gtggttcatc aaatataagg caagaaccag caccaaaggg taggccagca 2700

ctacaactac caggtcaaat ggatccaggt tggcatgtat catcagtaac aaggtcagca 2760

acagaaggtc catcatattc agaacaacta ggtgcaaagt caggtccaaa tggtcatcca 2820

tataatagga caaataggtc aaggatgcca aatctaaatg atctaaagga aacagcacta 2880

<210> 6

<211> 3090

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /备注="人工序列描述：合成多核苷酸"

<400> 6

atgaagattc ctaatattgg gaatgtgatg aataagtttg agattctggg ggtggtgggg 60

gagggggctt atggggtggt gctgaagtgt aggcataagg agacacatga gattgtggct 120

attaagaagt ttaaggattc tgaggagaat gaggaggtga aggagacaac actgagggag 180

ctgaagatgc tgaggacact gaagcaggag aatattgtgg agctgaagga ggcttttagg 240

aggaggggga agctgtatct ggtgtttgag tatgtggaga agaatatgct ggagctgctg 300

gaggagatgc ctaatggggt gcctcctgag aaggtgaagt cttatattta tcagctgatt 360

aaggctattc attggtgtca taagaatgat attgtgcata gggatattaa gcctgagaat 420

ctgctgattt ctcataatga tgtgctgaag ctgtgtgatt ttgggtttgc taggaatctg 480

tctgagggga ataatgctaa ttatacagag tatgtggcta caaggtggta taggtctcct 540

gagctgctgc tgggggctcc ttatgggaag tctgtggata tgtggtctgt ggggtgtatt 600

ctgggggagc tgtctgatgg gcagcctctg tttcctgggg agtctgagat tgatcagctg 660

tttacaattc agaaggtgct ggggcctctg ccttctgagc agatgaagct gttttattct 720

aatcctaggt ttcatgggct gaggtttcct gctgtgaatc atcctcagtc tctggagagg 780

aggtatctgg ggattctgaa ttctgtgctg ctggatctga tgaagaatct gctgaagctg 840

gatcctgctg ataggtatct gacagagcag tgtctgaatc atcctacatt tcagacacag 900

aggctgctgg ataggtctcc ttctaggtct gctaagagga agccttatca tgtggagtct 960

tctacactgt ctaataggaa tcaggctggg aagtctacag ctctgcagtc tcatcatagg 1020

tctaattcta aggatattca gaatctgtct gtggggctgc ctagggctga tgaggggctg 1080

cctgctaatg agtcttttct gaatgggaat ctggctgggg cttctctgtc tcctctgcat 1140

acaaagacat atcaggcttc ttctcagcct gggtctacat ctaaggatct gacaaataat 1200

aatattcctc atctgctgtc tcctaaggag gctaagtcta agacagagtt tgattttaat 1260

attgatccta agccttctga ggggcctggg acaaagtatc tgaagtctaa ttctaggtct 1320

cagcagaata ggcattcttt tatggagtct tctcagtcta aggctgggac actgcagcct 1380

aatgagaagc agtctaggca ttcttatatt gatacaattc ctcagtcttc taggtctcct 1440

tcttatagga caaaggctaa gtctcatggg gctctgtctg attctaagtc tgtgtctaat 1500

ctgtctgagg ctagggctca gattgctgag ccttctacat ctaggtattt tccttcttct 1560

tgtctggatc tgaattctcc tacatctcct acacctacaa ggcattctga tacaaggaca 1620

ctgctgtctc cttctgggag gaataatagg aatgagggga cactggattc taggaggaca 1680

acaacaaggc attctaagac aatggaggag ctgaagctgc ctgagcatat ggattcttct 1740

cattctcatt ctctgtctgc tcctcatgag tctttttctt atgggctggg gtatacatct 1800

cctttttctt ctcagcagag gcctcatagg cattctatgt atgtgacaag ggataaggtg 1860

agggctaagg ggctggatgg gtctctgtct attgggcagg ggatggctgc tagggctaat 1920

tctctgcagc tgctgtctcc tcagcctggg gagcagctgc ctcctgagat gacagtggct 1980

aggtcttctg tgaaggagac atctagggag gggacatctt cttttcatac aaggcagaag 2040

tctgaggggg gggtgtatca tgatcctcat tctgatgatg ggacagctcc taaggagaat 2100

aggcatctgt ataatgatcc tgtgcctagg agggtggggt ctttttatag ggtgccttct 2160

cctaggcctg ataattcttt tcatgagaat aatgtgtcta caagggtgtc ttctctgcct 2220

tctgagtctt cttctgggac aaatcattct aagaggcagc ctgcttttga tccttggaag 2280

tctcctgaga atatttctca ttctgagcag ctgaaggaga aggagaagca ggggtttttt 2340

aggtctatga agaagaagaa gaagaagtct cagacagtgc ctaattctga ttctcctgat 2400

ctgctgacac tgcagaagtc tattcattct gcttctacac cttcttctag gcctaaggag 2460

tggaggcctg agaagatttc tgatctgcag acacagtctc agcctctgaa gtctctgagg 2520

aagctgctgc atctgtcttc tgcttctaat catcctgctt cttctgatcc taggtttcag 2580

cctctgacag ctcagcagac aaagaattct ttttctgaga ttaggattca tcctctgtct 2640

caggcttctg gggggtcttc taatattagg caggagcctg ctcctaaggg gaggcctgct 2700

ctgcagctgc ctgatggggg gtgtgatggg aggaggcaga ggcatcattc tgggcctcag 2760

gataggaggt ttatgctgag gacaacagag cagcaggggg agtatttttg ttgtggggat 2820

cctaagaagc ctcatacacc ttgtgtgcct aatagggctc tgcataggcc tatttcttct 2880

cctgctcctt atcctgtgct gcaggtgagg gggacatcta tgtgtcctac actgcaggtg 2940

agggggacag atgctttttc ttgtcctaca cagcagtctg ggttttcttt ttttgtgagg 3000

catgtgatga gggaggctct gattcatagg gctcaggtga atcaggctgc tctgctgaca 3060

tatcatgaga atgctgctct gacagggaag 3090

<210> 7

<211> 3090

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /备注="人工序列描述：合成多核苷酸"

<400> 7

atgaagattc caaatattgg gaatgtgatg aataagtttg agattctggg ggtggtgggg 60

gagggggcat atggggtggt gctgaagtgt aggcataagg agacacatga gattgtggca 120

attaagaagt ttaaggattc agaggagaat gaggaggtga aggagacaac actgagggag 180

ctgaagatgc tgaggacact gaagcaggag aatattgtgg agctgaagga ggcatttagg 240

aggaggggga agctgtatct ggtgtttgag tatgtggaga agaatatgct ggagctgctg 300

gaggagatgc caaatggggt gccaccagag aaggtgaagt catatattta tcagctgatt 360

aaggcaattc attggtgtca taagaatgat attgtgcata gggatattaa gccagagaat 420

ctgctgattt cacataatga tgtgctgaag ctgtgtgatt ttgggtttgc aaggaatctg 480

tcagagggga ataatgcaaa ttatacagag tatgtggcaa caaggtggta taggtcacca 540

gagctgctgc tgggggcacc atatgggaag tcagtggata tgtggtcagt ggggtgtatt 600

ctgggggagc tgtcagatgg gcagccactg tttccagggg agtcagagat tgatcagctg 660

tttacaattc agaaggtgct ggggccactg ccatcagagc agatgaagct gttttattca 720

aatccaaggt ttcatgggct gaggtttcca gcagtgaatc atccacagtc actggagagg 780

aggtatctgg ggattctgaa ttcagtgctg ctggatctga tgaagaatct gctgaagctg 840

gatccagcag ataggtatct gacagagcag tgtctgaatc atccaacatt tcagacacag 900

aggctgctgg ataggtcacc atcaaggtca gcaaagagga agccatatca tgtggagtca 960

tcaacactgt caaataggaa tcaggcaggg aagtcaacag cactgcagtc acatcatagg 1020

tcaaattcaa aggatattca gaatctgtca gtggggctgc caagggcaga tgaggggctg 1080

ccagcaaatg agtcatttct gaatgggaat ctggcagggg catcactgtc accactgcat 1140

acaaagacat atcaggcatc atcacagcca gggtcaacat caaaggatct gacaaataat 1200

aatattccac atctgctgtc accaaaggag gcaaagtcaa agacagagtt tgattttaat 1260

attgatccaa agccatcaga ggggccaggg acaaagtatc tgaagtcaaa ttcaaggtca 1320

cagcagaata ggcattcatt tatggagtca tcacagtcaa aggcagggac actgcagcca 1380

aatgagaagc agtcaaggca ttcatatatt gatacaattc cacagtcatc aaggtcacca 1440

tcatatagga caaaggcaaa gtcacatggg gcactgtcag attcaaagtc agtgtcaaat 1500

ctgtcagagg caagggcaca gattgcagag ccatcaacat caaggtattt tccatcatca 1560

tgtctggatc tgaattcacc aacatcacca acaccaacaa ggcattcaga tacaaggaca 1620

ctgctgtcac catcagggag gaataatagg aatgagggga cactggattc aaggaggaca 1680

acaacaaggc attcaaagac aatggaggag ctgaagctgc cagagcatat ggattcatca 1740

cattcacatt cactgtcagc accacatgag tcattttcat atgggctggg gtatacatca 1800

ccattttcat cacagcagag gccacatagg cattcaatgt atgtgacaag ggataaggtg 1860

agggcaaagg ggctggatgg gtcactgtca attgggcagg ggatggcagc aagggcaaat 1920

tcactgcagc tgctgtcacc acagccaggg gagcagctgc caccagagat gacagtggca 1980

aggtcatcag tgaaggagac atcaagggag gggacatcat catttcatac aaggcagaag 2040

tcagaggggg gggtgtatca tgatccacat tcagatgatg ggacagcacc aaaggagaat 2100

aggcatctgt ataatgatcc agtgccaagg agggtggggt cattttatag ggtgccatca 2160

ccaaggccag ataattcatt tcatgagaat aatgtgtcaa caagggtgtc atcactgcca 2220

tcagagtcat catcagggac aaatcattca aagaggcagc cagcatttga tccatggaag 2280

tcaccagaga atatttcaca ttcagagcag ctgaaggaga aggagaagca ggggtttttt 2340

aggtcaatga agaagaagaa gaagaagtca cagacagtgc caaattcaga ttcaccagat 2400

ctgctgacac tgcagaagtc aattcattca gcatcaacac catcatcaag gccaaaggag 2460

tggaggccag agaagatttc agatctgcag acacagtcac agccactgaa gtcactgagg 2520

aagctgctgc atctgtcatc agcatcaaat catccagcat catcagatcc aaggtttcag 2580

ccactgacag cacagcagac aaagaattca ttttcagaga ttaggattca tccactgtca 2640

caggcatcag gggggtcatc aaatattagg caggagccag caccaaaggg gaggccagca 2700

ctgcagctgc cagatggggg gtgtgatggg aggaggcaga ggcatcattc agggccacag 2760

gataggaggt ttatgctgag gacaacagag cagcaggggg agtatttttg ttgtggggat 2820

ccaaagaagc cacatacacc atgtgtgcca aatagggcac tgcataggcc aatttcatca 2880

ccagcaccat atccagtgct gcaggtgagg gggacatcaa tgtgtccaac actgcaggtg 2940

agggggacag atgcattttc atgtccaaca cagcagtcag ggttttcatt ttttgtgagg 3000

catgtgatga gggaggcact gattcatagg gcacaggtga atcaggcagc actgctgaca 3060

tatcatgaga atgcagcact gacagggaag 3090

<210> 8

<211> 3090

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /备注="人工序列描述：合成多核苷酸"

<400> 8

atgaagatac caaatatagg taatgtaatg aataagtttg aaatactagg tgtagtaggt 60

gaaggtgcat atggtgtagt actaaagtgt aggcataagg aaacacatga aatagtagca 120

ataaagaagt ttaaggattc agaagaaaat gaagaagtaa aggaaacaac actaagggaa 180

ctaaagatgc taaggacact aaagcaagaa aatatagtag aactaaagga agcatttagg 240

aggaggggta agctatatct agtatttgaa tatgtagaaa agaatatgct agaactacta 300

gaagaaatgc caaatggtgt accaccagaa aaggtaaagt catatatata tcaactaata 360

aaggcaatac attggtgtca taagaatgat atagtacata gggatataaa gccagaaaat 420

ctactaatat cacataatga tgtactaaag ctatgtgatt ttggttttgc aaggaatcta 480

tcagaaggta ataatgcaaa ttatacagaa tatgtagcaa caaggtggta taggtcacca 540

gaactactac taggtgcacc atatggtaag tcagtagata tgtggtcagt aggttgtata 600

ctaggtgaac tatcagatgg tcaaccacta tttccaggtg aatcagaaat agatcaacta 660

tttacaatac aaaaggtact aggtccacta ccatcagaac aaatgaagct attttattca 720

aatccaaggt ttcatggtct aaggtttcca gcagtaaatc atccacaatc actagaaagg 780

aggtatctag gtatactaaa ttcagtacta ctagatctaa tgaagaatct actaaagcta 840

gatccagcag ataggtatct aacagaacaa tgtctaaatc atccaacatt tcaaacacaa 900

aggctactag ataggtcacc atcaaggtca gcaaagagga agccatatca tgtagaatca 960

tcaacactat caaataggaa tcaagcaggt aagtcaacag cactacaatc acatcatagg 1020

tcaaattcaa aggatataca aaatctatca gtaggtctac caagggcaga tgaaggtcta 1080

ccagcaaatg aatcatttct aaatggtaat ctagcaggtg catcactatc accactacat 1140

acaaagacat atcaagcatc atcacaacca ggttcaacat caaaggatct aacaaataat 1200

aatataccac atctactatc accaaaggaa gcaaagtcaa agacagaatt tgattttaat 1260

atagatccaa agccatcaga aggtccaggt acaaagtatc taaagtcaaa ttcaaggtca 1320

caacaaaata ggcattcatt tatggaatca tcacaatcaa aggcaggtac actacaacca 1380

aatgaaaagc aatcaaggca ttcatatata gatacaatac cacaatcatc aaggtcacca 1440

tcatatagga caaaggcaaa gtcacatggt gcactatcag attcaaagtc agtatcaaat 1500

ctatcagaag caagggcaca aatagcagaa ccatcaacat caaggtattt tccatcatca 1560

tgtctagatc taaattcacc aacatcacca acaccaacaa ggcattcaga tacaaggaca 1620

ctactatcac catcaggtag gaataatagg aatgaaggta cactagattc aaggaggaca 1680

acaacaaggc attcaaagac aatggaagaa ctaaagctac cagaacatat ggattcatca 1740

cattcacatt cactatcagc accacatgaa tcattttcat atggtctagg ttatacatca 1800

ccattttcat cacaacaaag gccacatagg cattcaatgt atgtaacaag ggataaggta 1860

agggcaaagg gtctagatgg ttcactatca ataggtcaag gtatggcagc aagggcaaat 1920

tcactacaac tactatcacc acaaccaggt gaacaactac caccagaaat gacagtagca 1980

aggtcatcag taaaggaaac atcaagggaa ggtacatcat catttcatac aaggcaaaag 2040

tcagaaggtg gtgtatatca tgatccacat tcagatgatg gtacagcacc aaaggaaaat 2100

aggcatctat ataatgatcc agtaccaagg agggtaggtt cattttatag ggtaccatca 2160

ccaaggccag ataattcatt tcatgaaaat aatgtatcaa caagggtatc atcactacca 2220

tcagaatcat catcaggtac aaatcattca aagaggcaac cagcatttga tccatggaag 2280

tcaccagaaa atatatcaca ttcagaacaa ctaaaggaaa aggaaaagca aggttttttt 2340

aggtcaatga agaagaagaa gaagaagtca caaacagtac caaattcaga ttcaccagat 2400

ctactaacac tacaaaagtc aatacattca gcatcaacac catcatcaag gccaaaggaa 2460

tggaggccag aaaagatatc agatctacaa acacaatcac aaccactaaa gtcactaagg 2520

aagctactac atctatcatc agcatcaaat catccagcat catcagatcc aaggtttcaa 2580

ccactaacag cacaacaaac aaagaattca ttttcagaaa taaggataca tccactatca 2640

caagcatcag gtggttcatc aaatataagg caagaaccag caccaaaggg taggccagca 2700

ctacaactac cagatggtgg ttgtgatggt aggaggcaaa ggcatcattc aggtccacaa 2760

gataggaggt ttatgctaag gacaacagaa caacaaggtg aatatttttg ttgtggtgat 2820

ccaaagaagc cacatacacc atgtgtacca aatagggcac tacataggcc aatatcatca 2880

ccagcaccat atccagtact acaagtaagg ggtacatcaa tgtgtccaac actacaagta 2940

aggggtacag atgcattttc atgtccaaca caacaatcag gtttttcatt ttttgtaagg 3000

catgtaatga gggaagcact aatacatagg gcacaagtaa atcaagcagc actactaaca 3060

tatcatgaaa atgcagcact aacaggtaag 3090

<210> 9

<211> 960

<212> PRT

<213> 智人

<400> 9

Met Lys Ile Pro Asn Ile Gly Asn Val Met Asn Lys Phe Glu Ile Leu

1 5 10 15

Gly Val Val Gly Glu Gly Ala Tyr Gly Val Val Leu Lys Cys Arg His

20 25 30

Lys Glu Thr His Glu Ile Val Ala Ile Lys Lys Phe Lys Asp Ser Glu

35 40 45

Glu Asn Glu Glu Val Lys Glu Thr Thr Leu Arg Glu Leu Lys Met Leu

50 55 60

Arg Thr Leu Lys Gln Glu Asn Ile Val Glu Leu Lys Glu Ala Phe Arg

65 70 75 80

Arg Arg Gly Lys Leu Tyr Leu Val Phe Glu Tyr Val Glu Lys Asn Met

85 90 95

Leu Glu Leu Leu Glu Glu Met Pro Asn Gly Val Pro Pro Glu Lys Val

100 105 110

Lys Ser Tyr Ile Tyr Gln Leu Ile Lys Ala Ile His Trp Cys His Lys

115 120 125

Asn Asp Ile Val His Arg Asp Ile Lys Pro Glu Asn Leu Leu Ile Ser

130 135 140

His Asn Asp Val Leu Lys Leu Cys Asp Phe Gly Phe Ala Arg Asn Leu

145 150 155 160

Ser Glu Gly Asn Asn Ala Asn Tyr Thr Glu Tyr Val Ala Thr Arg Trp

165 170 175

Tyr Arg Ser Pro Glu Leu Leu Leu Gly Ala Pro Tyr Gly Lys Ser Val

180 185 190

Asp Met Trp Ser Val Gly Cys Ile Leu Gly Glu Leu Ser Asp Gly Gln

195 200 205

Pro Leu Phe Pro Gly Glu Ser Glu Ile Asp Gln Leu Phe Thr Ile Gln

210 215 220

Lys Val Leu Gly Pro Leu Pro Ser Glu Gln Met Lys Leu Phe Tyr Ser

225 230 235 240

Asn Pro Arg Phe His Gly Leu Arg Phe Pro Ala Val Asn His Pro Gln

245 250 255

Ser Leu Glu Arg Arg Tyr Leu Gly Ile Leu Asn Ser Val Leu Leu Asp

260 265 270

Leu Met Lys Asn Leu Leu Lys Leu Asp Pro Ala Asp Arg Tyr Leu Thr

275 280 285

Glu Gln Cys Leu Asn His Pro Thr Phe Gln Thr Gln Arg Leu Leu Asp

290 295 300

Arg Ser Pro Ser Arg Ser Ala Lys Arg Lys Pro Tyr His Val Glu Ser

305 310 315 320

Ser Thr Leu Ser Asn Arg Asn Gln Ala Gly Lys Ser Thr Ala Leu Gln

325 330 335

Ser His His Arg Ser Asn Ser Lys Asp Ile Gln Asn Leu Ser Val Gly

340 345 350

Leu Pro Arg Ala Asp Glu Gly Leu Pro Ala Asn Glu Ser Phe Leu Asn

355 360 365

Gly Asn Leu Ala Gly Ala Ser Leu Ser Pro Leu His Thr Lys Thr Tyr

370 375 380

Gln Ala Ser Ser Gln Pro Gly Ser Thr Ser Lys Asp Leu Thr Asn Asn

385 390 395 400

Asn Ile Pro His Leu Leu Ser Pro Lys Glu Ala Lys Ser Lys Thr Glu

405 410 415

Phe Asp Phe Asn Ile Asp Pro Lys Pro Ser Glu Gly Pro Gly Thr Lys

420 425 430

Tyr Leu Lys Ser Asn Ser Arg Ser Gln Gln Asn Arg His Ser Phe Met

435 440 445

Glu Ser Ser Gln Ser Lys Ala Gly Thr Leu Gln Pro Asn Glu Lys Gln

450 455 460

Ser Arg His Ser Tyr Ile Asp Thr Ile Pro Gln Ser Ser Arg Ser Pro

465 470 475 480

Ser Tyr Arg Thr Lys Ala Lys Ser His Gly Ala Leu Ser Asp Ser Lys

485 490 495

Ser Val Ser Asn Leu Ser Glu Ala Arg Ala Gln Ile Ala Glu Pro Ser

500 505 510

Thr Ser Arg Tyr Phe Pro Ser Ser Cys Leu Asp Leu Asn Ser Pro Thr

515 520 525

Ser Pro Thr Pro Thr Arg His Ser Asp Thr Arg Thr Leu Leu Ser Pro

530 535 540

Ser Gly Arg Asn Asn Arg Asn Glu Gly Thr Leu Asp Ser Arg Arg Thr

545 550 555 560

Thr Thr Arg His Ser Lys Thr Met Glu Glu Leu Lys Leu Pro Glu His

565 570 575

Met Asp Ser Ser His Ser His Ser Leu Ser Ala Pro His Glu Ser Phe

580 585 590

Ser Tyr Gly Leu Gly Tyr Thr Ser Pro Phe Ser Ser Gln Gln Arg Pro

595 600 605

His Arg His Ser Met Tyr Val Thr Arg Asp Lys Val Arg Ala Lys Gly

610 615 620

Leu Asp Gly Ser Leu Ser Ile Gly Gln Gly Met Ala Ala Arg Ala Asn

625 630 635 640

Ser Leu Gln Leu Leu Ser Pro Gln Pro Gly Glu Gln Leu Pro Pro Glu

645 650 655

Met Thr Val Ala Arg Ser Ser Val Lys Glu Thr Ser Arg Glu Gly Thr

660 665 670

Ser Ser Phe His Thr Arg Gln Lys Ser Glu Gly Gly Val Tyr His Asp

675 680 685

Pro His Ser Asp Asp Gly Thr Ala Pro Lys Glu Asn Arg His Leu Tyr

690 695 700

Asn Asp Pro Val Pro Arg Arg Val Gly Ser Phe Tyr Arg Val Pro Ser

705 710 715 720

Pro Arg Pro Asp Asn Ser Phe His Glu Asn Asn Val Ser Thr Arg Val

725 730 735

Ser Ser Leu Pro Ser Glu Ser Ser Ser Gly Thr Asn His Ser Lys Arg

740 745 750

Gln Pro Ala Phe Asp Pro Trp Lys Ser Pro Glu Asn Ile Ser His Ser

755 760 765

Glu Gln Leu Lys Glu Lys Glu Lys Gln Gly Phe Phe Arg Ser Met Lys

770 775 780

Lys Lys Lys Lys Lys Ser Gln Thr Val Pro Asn Ser Asp Ser Pro Asp

785 790 795 800

Leu Leu Thr Leu Gln Lys Ser Ile His Ser Ala Ser Thr Pro Ser Ser

805 810 815

Arg Pro Lys Glu Trp Arg Pro Glu Lys Ile Ser Asp Leu Gln Thr Gln

820 825 830

Ser Gln Pro Leu Lys Ser Leu Arg Lys Leu Leu His Leu Ser Ser Ala

835 840 845

Ser Asn His Pro Ala Ser Ser Asp Pro Arg Phe Gln Pro Leu Thr Ala

850 855 860

Gln Gln Thr Lys Asn Ser Phe Ser Glu Ile Arg Ile His Pro Leu Ser

865 870 875 880

Gln Ala Ser Gly Gly Ser Ser Asn Ile Arg Gln Glu Pro Ala Pro Lys

885 890 895

Gly Arg Pro Ala Leu Gln Leu Pro Gly Gln Met Asp Pro Gly Trp His

900 905 910

Val Ser Ser Val Thr Arg Ser Ala Thr Glu Gly Pro Ser Tyr Ser Glu

915 920 925

Gln Leu Gly Ala Lys Ser Gly Pro Asn Gly His Pro Tyr Asn Arg Thr

930 935 940

Asn Arg Ser Arg Met Pro Asn Leu Asn Asp Leu Lys Glu Thr Ala Leu

945 950 955 960

<210> 10

<211> 1030

<212> PRT

<213> 智人

<400> 10

Met Lys Ile Pro Asn Ile Gly Asn Val Met Asn Lys Phe Glu Ile Leu

1 5 10 15

Gly Val Val Gly Glu Gly Ala Tyr Gly Val Val Leu Lys Cys Arg His

20 25 30

Lys Glu Thr His Glu Ile Val Ala Ile Lys Lys Phe Lys Asp Ser Glu

35 40 45

Glu Asn Glu Glu Val Lys Glu Thr Thr Leu Arg Glu Leu Lys Met Leu

50 55 60

Arg Thr Leu Lys Gln Glu Asn Ile Val Glu Leu Lys Glu Ala Phe Arg

65 70 75 80

Arg Arg Gly Lys Leu Tyr Leu Val Phe Glu Tyr Val Glu Lys Asn Met

85 90 95

Leu Glu Leu Leu Glu Glu Met Pro Asn Gly Val Pro Pro Glu Lys Val

100 105 110

Lys Ser Tyr Ile Tyr Gln Leu Ile Lys Ala Ile His Trp Cys His Lys

115 120 125

Asn Asp Ile Val His Arg Asp Ile Lys Pro Glu Asn Leu Leu Ile Ser

130 135 140

His Asn Asp Val Leu Lys Leu Cys Asp Phe Gly Phe Ala Arg Asn Leu

145 150 155 160

Ser Glu Gly Asn Asn Ala Asn Tyr Thr Glu Tyr Val Ala Thr Arg Trp

165 170 175

Tyr Arg Ser Pro Glu Leu Leu Leu Gly Ala Pro Tyr Gly Lys Ser Val

180 185 190

Asp Met Trp Ser Val Gly Cys Ile Leu Gly Glu Leu Ser Asp Gly Gln

195 200 205

Pro Leu Phe Pro Gly Glu Ser Glu Ile Asp Gln Leu Phe Thr Ile Gln

210 215 220

Lys Val Leu Gly Pro Leu Pro Ser Glu Gln Met Lys Leu Phe Tyr Ser

225 230 235 240

Asn Pro Arg Phe His Gly Leu Arg Phe Pro Ala Val Asn His Pro Gln

245 250 255

Ser Leu Glu Arg Arg Tyr Leu Gly Ile Leu Asn Ser Val Leu Leu Asp

260 265 270

Leu Met Lys Asn Leu Leu Lys Leu Asp Pro Ala Asp Arg Tyr Leu Thr

275 280 285

Glu Gln Cys Leu Asn His Pro Thr Phe Gln Thr Gln Arg Leu Leu Asp

290 295 300

Arg Ser Pro Ser Arg Ser Ala Lys Arg Lys Pro Tyr His Val Glu Ser

305 310 315 320

Ser Thr Leu Ser Asn Arg Asn Gln Ala Gly Lys Ser Thr Ala Leu Gln

325 330 335

Ser His His Arg Ser Asn Ser Lys Asp Ile Gln Asn Leu Ser Val Gly

340 345 350

Leu Pro Arg Ala Asp Glu Gly Leu Pro Ala Asn Glu Ser Phe Leu Asn

355 360 365

Gly Asn Leu Ala Gly Ala Ser Leu Ser Pro Leu His Thr Lys Thr Tyr

370 375 380

Gln Ala Ser Ser Gln Pro Gly Ser Thr Ser Lys Asp Leu Thr Asn Asn

385 390 395 400

Asn Ile Pro His Leu Leu Ser Pro Lys Glu Ala Lys Ser Lys Thr Glu

405 410 415

Phe Asp Phe Asn Ile Asp Pro Lys Pro Ser Glu Gly Pro Gly Thr Lys

420 425 430

Tyr Leu Lys Ser Asn Ser Arg Ser Gln Gln Asn Arg His Ser Phe Met

435 440 445

Glu Ser Ser Gln Ser Lys Ala Gly Thr Leu Gln Pro Asn Glu Lys Gln

450 455 460

Ser Arg His Ser Tyr Ile Asp Thr Ile Pro Gln Ser Ser Arg Ser Pro

465 470 475 480

Ser Tyr Arg Thr Lys Ala Lys Ser His Gly Ala Leu Ser Asp Ser Lys

485 490 495

Ser Val Ser Asn Leu Ser Glu Ala Arg Ala Gln Ile Ala Glu Pro Ser

500 505 510

Thr Ser Arg Tyr Phe Pro Ser Ser Cys Leu Asp Leu Asn Ser Pro Thr

515 520 525

Ser Pro Thr Pro Thr Arg His Ser Asp Thr Arg Thr Leu Leu Ser Pro

530 535 540

Ser Gly Arg Asn Asn Arg Asn Glu Gly Thr Leu Asp Ser Arg Arg Thr

545 550 555 560

Thr Thr Arg His Ser Lys Thr Met Glu Glu Leu Lys Leu Pro Glu His

565 570 575

Met Asp Ser Ser His Ser His Ser Leu Ser Ala Pro His Glu Ser Phe

580 585 590

Ser Tyr Gly Leu Gly Tyr Thr Ser Pro Phe Ser Ser Gln Gln Arg Pro

595 600 605

His Arg His Ser Met Tyr Val Thr Arg Asp Lys Val Arg Ala Lys Gly

610 615 620

Leu Asp Gly Ser Leu Ser Ile Gly Gln Gly Met Ala Ala Arg Ala Asn

625 630 635 640

Ser Leu Gln Leu Leu Ser Pro Gln Pro Gly Glu Gln Leu Pro Pro Glu

645 650 655

Met Thr Val Ala Arg Ser Ser Val Lys Glu Thr Ser Arg Glu Gly Thr

660 665 670

Ser Ser Phe His Thr Arg Gln Lys Ser Glu Gly Gly Val Tyr His Asp

675 680 685

Pro His Ser Asp Asp Gly Thr Ala Pro Lys Glu Asn Arg His Leu Tyr

690 695 700

Asn Asp Pro Val Pro Arg Arg Val Gly Ser Phe Tyr Arg Val Pro Ser

705 710 715 720

Pro Arg Pro Asp Asn Ser Phe His Glu Asn Asn Val Ser Thr Arg Val

725 730 735

Ser Ser Leu Pro Ser Glu Ser Ser Ser Gly Thr Asn His Ser Lys Arg

740 745 750

Gln Pro Ala Phe Asp Pro Trp Lys Ser Pro Glu Asn Ile Ser His Ser

755 760 765

Glu Gln Leu Lys Glu Lys Glu Lys Gln Gly Phe Phe Arg Ser Met Lys

770 775 780

Lys Lys Lys Lys Lys Ser Gln Thr Val Pro Asn Ser Asp Ser Pro Asp

785 790 795 800

Leu Leu Thr Leu Gln Lys Ser Ile His Ser Ala Ser Thr Pro Ser Ser

805 810 815

Arg Pro Lys Glu Trp Arg Pro Glu Lys Ile Ser Asp Leu Gln Thr Gln

820 825 830

Ser Gln Pro Leu Lys Ser Leu Arg Lys Leu Leu His Leu Ser Ser Ala

835 840 845

Ser Asn His Pro Ala Ser Ser Asp Pro Arg Phe Gln Pro Leu Thr Ala

850 855 860

Gln Gln Thr Lys Asn Ser Phe Ser Glu Ile Arg Ile His Pro Leu Ser

865 870 875 880

Gln Ala Ser Gly Gly Ser Ser Asn Ile Arg Gln Glu Pro Ala Pro Lys

885 890 895

Gly Arg Pro Ala Leu Gln Leu Pro Asp Gly Gly Cys Asp Gly Arg Arg

900 905 910

Gln Arg His His Ser Gly Pro Gln Asp Arg Arg Phe Met Leu Arg Thr

915 920 925

Thr Glu Gln Gln Gly Glu Tyr Phe Cys Cys Gly Asp Pro Lys Lys Pro

930 935 940

His Thr Pro Cys Val Pro Asn Arg Ala Leu His Arg Pro Ile Ser Ser

945 950 955 960

Pro Ala Pro Tyr Pro Val Leu Gln Val Arg Gly Thr Ser Met Cys Pro

965 970 975

Thr Leu Gln Val Arg Gly Thr Asp Ala Phe Ser Cys Pro Thr Gln Gln

980 985 990

Ser Gly Phe Ser Phe Phe Val Arg His Val Met Arg Glu Ala Leu Ile

995 1000 1005

His Arg Ala Gln Val Asn Gln Ala Ala Leu Leu Thr Tyr His Glu

1010 1015 1020

Asn Ala Ala Leu Thr Gly Lys

1025 1030

<210> 11

<211> 145

<212> DNA

<213> 腺相关病毒2

<400> 11

ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60

cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120

gccaactcca tcactagggg ttcct 145

<210> 12

<211> 448

<212> DNA

<213> 智人

<400> 12

agtgcaagtg ggttttagga ccaggatgag gcggggtggg ggtgcctacc tgacgaccga 60

ccccgaccca ctggacaagc acccaacccc cattccccaa attgcgcatc ccctatcaga 120

gagggggagg ggaaacagga tgcggcgagg cgcgtgcgca ctgccagctt cagcaccgcg 180

gacagtgcct tcgcccccgc ctggcggcgc gcgccaccgc cgcctcagca ctgaaggcgc 240

gctgacgtca ctcgccggtc ccccgcaaac tccccttccc ggccaccttg gtcgcgtccg 300

cgccgccgcc ggcccagccg gaccgcacca cgcgaggcgc gagatagggg ggcacgggcg 360

cgaccatctg cgctgcggcg ccggcgactc agcgctgcct cagtctgcgg tgggcagcgg 420

aggagtcgtg tcgtgcctga gagcgcag 448

<210> 13

<211> 276

<212> DNA

<213> 原鸡（Gallus）物种

<400> 13

tcgaggtgag ccccacgttc tgcttcactc tccccatctc ccccccctcc ccacccccaa 60

ttttgtattt atttattttt taattatttt atgcagcgat gggggcgggg gggggggggg 120

cgcgcgccag gcggggcggg gcggggcgag gggcggggcg gggcgaggcg gagaggtgcg 180

gcggcagcca atcagagcgg cgcgctccga aagtttcctt ttatggcgag gcggcggcgg 240

cggcggccct ataaaaagcg aagcgcgcgg cgggcg 276

<210> 14

<211> 1654

<212> DNA

<213> 智人

<400> 14

tgcgaagccc tctgttgttg cctctgactc cattttccct ctttgctaat tcattgctcc 60

tacctgtaaa attttctaat atgcttccac tttcatttcc tcatcaaata ttcaccgtta 120

tgaaaaagaa aatcctattg gcttggtatc aagtggccaa actgagcatg ctgctacata 180

ttgttaccag attcactaca ggaatagatt aagtggattt tatcccaaat atctatttcc 240

tattacagta ctgcatcttt ctaatttggt ggcagctatg acctcataca ctgcctattt 300

tccgtgcttt tcctaaccag aagagaccct atttttctcc tttgcttgtt aaagcgaaaa 360

taattatgca gctttccata gatttgtccc caatgtcttt ttaaaaaaat tttttttctt 420

tattttctaa aagtagcatt ggaaatgtta tctccttcaa tttcatcacc tcttcatcct 480

ccttggaaac ccgatccatg gtgggtatta agatctttac atttgtactg gttgggcgat 540

gacttcattg ctttcaagcc agctggggga tcttgtgtgg cagagcatcg gaccgaagcg 600

gaggtgtggg tcgttgctgc tgctgctgct gctactgctg caacagctct ttgcacgcgc 660

ccagctgctg tgtaaggaat cctcaggctg ctaggtcttt gcgcctaact cacccaaggg 720

accgcaagct gctggatgag tgtacgtgtg agtgtgtgtt gtgtgtgtgc atatgtgcgt 780

gtgtgtgtgc acacgcagcg gcaacagttg ggcagcagca gcaatggact tcgatatcat 840

ttttaccaac aacagagata aaccatcctc catcctgtat ttctcagctc ccgccccgag 900

tatgttctcc ccctcttctc cgacttcccc caccccagcc cccggcacgg gtccctccgg 960

agggagggca gggtagctgc gctgcaggca ggattccctc ttttttccgc agtgacaggc 1020

ggattccggg gcctcctcgc cacctcctac ccccgcagcc acccctttct cagtcacgat 1080

ctccccaccc caccaccgtc gaccctctcc ctgcttcccc gctctacccc ccggcgtcga 1140

ctccaggctc gggccccgcc cctctcagcc tctccagccc aggttgctag ggcttggcgg 1200

ggcaaccaaa cctggcgtgc caggaggcgc ggcgcgcgcg tgagcgcgca ggcgagcttg 1260

tataaggaac cagcgttctt cggcttcgga gactcgagca cgagcggcgc gagcccgaac 1320

cccaggacaa gcgcttcctc ctcattggct cctaccagaa gggggcgggg taaaggcggg 1380

atcgggcaaa acctgaggtg ctttcccatt ggtccgaacg ggccggctgg ggcggggcag 1440

ttagcaaaat aggctgcgcg ttcgcttctg ctagagggcg gggccggagg tttcgattag 1500

ttgtctctgc cgctggggaa ggtaaagcgg cgacggcgtc ctcaggagct gtggggtccc 1560

ctgctagaag tgggggactc ggcggggtga gtagtcgcgc cgccacccgc ccgccaagcc 1620

ttcttaccct tacatcggcc ccgcgtccac ccag 1654

<210> 15

<211> 198

<212> DNA

<213> 未知

<220>

<221> 来源

<223> /备注="未知描述：SV40聚腺苷酸化信号序列"

<400> 15

gatccagaca tgataagata cattgatgag tttggacaaa ccacaactag aatgcagtga 60

aaaaaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac cattataagc 120

tgcaataaac aagttaacaa caacaattgc attcatttta tgtttcaggt tcagggggag 180

gtgtgggagg ttttttag 198

<210> 16

<211> 9

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /备注="人工序列描述：合成寡核苷酸"

<400> 16

gccgccacc 9

<210> 17

<211> 304

<212> DNA

<213> 巨细胞病毒物种

<400> 17

cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 60

gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 120

atgggtggac tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 180

aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 240

catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 300

catg 304

<210> 18

<211> 95

<212> DNA

<213> 未知

<220>

<221> 来源

<223> /备注="未知描述：SV40内含子序列"

<400> 18

gctctaaggt aaatataaaa tttttaagtg tataatgtgt taaactactg attctaattg 60

tttctctctt ttagattcca acctttggaa ctgat 95

<210> 19

<211> 3828

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /备注="人工序列描述：合成多核苷酸"

<400> 19

ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60

cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120

gccaactcca tcactagggg ttcctagtgc aagtgggttt taggaccagg atgaggcggg 180

gtgggggtgc ctacctgacg accgaccccg acccactgga caagcaccca acccccattc 240

cccaaattgc gcatccccta tcagagaggg ggaggggaaa caggatgcgg cgaggcgcgt 300

gcgcactgcc agcttcagca ccgcggacag tgccttcgcc cccgcctggc ggcgcgcgcc 360

accgccgcct cagcactgaa ggcgcgctga cgtcactcgc cggtcccccg caaactcccc 420

ttcccggcca ccttggtcgc gtccgcgccg ccgccggccc agccggaccg caccacgcga 480

ggcgcgagat aggggggcac gggcgcgacc atctgcgctg cggcgccggc gactcagcgc 540

tgcctcagtc tgcggtgggc agcggaggag tcgtgtcgtg cctgagagcg caggccgcca 600

ccatgaagat tcctaacatt ggtaatgtga tgaataaatt tgagatcctt ggggttgtag 660

gtgaaggagc ctatggagtt gtacttaaat gcagacacaa ggaaacacat gaaattgtgg 720

cgatcaagaa attcaaggac agtgaagaaa atgaagaagt caaagaaacg actttacgag 780

agcttaaaat gcttcggact ctcaagcagg aaaacattgt ggagttgaag gaagcatttc 840

gtcggagggg aaagttgtac ttggtgtttg agtatgttga aaaaaatatg ctcgaattgc 900

tggaagaaat gccaaatgga gttccacctg agaaagtaaa aagctacatc tatcagctaa 960

tcaaggctat tcactggtgc cataagaatg atattgtcca tcgagatata aaaccagaaa 1020

atctcttaat cagccacaat gatgtcctaa aactgtgtga ctttggtttt gctcgtaatc 1080

tgtcagaagg caataatgct aattacacag agtacgttgc caccagatgg tatcggtccc 1140

cagaactctt acttggcgct ccctatggaa agtccgtgga catgtggtcg gtgggctgta 1200

ttcttgggga gcttagcgat ggacagcctt tatttcctgg agaaagtgaa attgaccaac 1260

tttttactat tcagaaggtg ctaggaccac ttccatctga gcagatgaag cttttctaca 1320

gtaatcctcg cttccatggg ctccggtttc cagctgttaa ccatcctcag tccttggaaa 1380

gaagatacct tggaattttg aatagtgttc tacttgacct aatgaagaat ttactgaagt 1440

tggacccagc tgacagatac ttgacagaac agtgtttgaa tcaccctaca tttcaaaccc 1500

agagacttct ggatcgttct ccttcaaggt cagcaaaaag aaaaccttac catgtggaaa 1560

gcagcacatt gtctaataga aaccaagccg gcaaaagtac tgctttgcag tctcaccaca 1620

gatctaacag caaggacatc cagaacctga gtgtaggcct gccccgggct gacgaaggtc 1680

tccctgccaa tgaaagcttc ctaaatggaa accttgctgg agctagtctt agtccactgc 1740

acaccaaaac ctaccaagca agcagccagc ctgggtctac cagcaaagat ctcaccaaca 1800

acaacatacc acaccttctt agcccaaaag aagccaagtc aaaaacagag tttgatttta 1860

atattgaccc aaagccttca gaaggcccag ggacaaagta cctcaagtca aacagcagat 1920

ctcagcagaa ccgccactca ttcatggaaa gctctcaaag caaagctggg acactgcagc 1980

ccaatgaaaa gcagagtcgg catagctata ttgacacaat tccccagtcc tctaggagtc 2040

cctcctacag gaccaaggcc aaaagccatg gggcactgag tgactccaag tctgtgagca 2100

acctttctga agccagggcc caaattgcgg agcccagtac cagtaggtac ttcccatcta 2160

gctgcttaga cttgaattct cccaccagcc caacccccac cagacacagt gacacgagaa 2220

ctttgctcag cccttctgga agaaataacc gaaatgaggg aacgctggac tcacgtcgaa 2280

ccacaaccag acattctaag acgatggagg aattgaagct gccggagcac atggacagta 2340

gccattccca ttcactgtct gcacctcacg aatctttttc ttatggactg ggctacacca 2400

gccccttttc ttcccagcaa cgtcctcata ggcattctat gtatgtgacc cgtgacaaag 2460

tgagagccaa gggcttggat ggaagcttga gcatagggca agggatggca gctagagcca 2520

acagcctgca actcttgtca ccccagcctg gagaacagct ccctccagag atgactgtgg 2580

caagatcttc ggtcaaagag acctccagag aaggcacctc ttccttccat acacgccaga 2640

agtctgaggg tggagtgtat catgacccac actctgatga tggcacagcc cccaaagaaa 2700

atagacacct atacaatgat cctgtgccaa ggagagttgg tagcttttac agagtgccat 2760

ctccacgtcc agacaattct ttccatgaaa ataatgtgtc aactagagtt tcttctctac 2820

catcagagag cagttctgga accaaccact caaaaagaca accagcattc gatccatgga 2880

aaagtcctga aaatattagt cattcagagc aactcaagga aaaagagaag caaggatttt 2940

tcaggtcaat gaaaaagaaa aagaagaaat ctcaaacagt acccaattcc gacagccctg 3000

atcttctgac gttgcagaaa tccattcatt ctgctagcac tccaagcagc agaccaaagg 3060

agtggcgccc cgagaagatc tcagatctgc agacccaaag ccagccatta aaatcactgc 3120

gcaagttgtt acatctctct tcggcctcaa atcacccggc ttcctcagat ccccgcttcc 3180

agcccttaac agctcaacaa accaaaaatt ccttctcaga aattcggatt caccccctga 3240

gccaggcctc tggcgggagc agcaacatcc ggcaggaacc cgcaccgaag ggcaggccag 3300

ccctccagct gccaggtcag atggatcctg gttggcatgt gtcctctgtg accaggagtg 3360

ccacagaggg cccttcctac tctgaacagc tgggtgccaa aagtgggcca aatgggcacc 3420

cctataacag aacaaatcgc tcacgaatgc caaatctgaa tgatttaaaa gagacagcct 3480

tgtaagatcc agacatgata agatacattg atgagtttgg acaaaccaca actagaatgc 3540

agtgaaaaaa atgctttatt tgtgaaattt gtgatgctat tgctttattt gtaaccatta 3600

taagctgcaa taaacaagtt aacaacaaca attgcattca ttttatgttt caggttcagg 3660

gggaggtgtg ggaggttttt tagaggaacc cctagtgatg gagttggcca ctccctctct 3720

gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgacctttgg 3780

tcgcccggcc tcagtgagcg agcgagcgcg cagagaggga gtggccaa 3828

<210> 20

<211> 4057

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /备注="人工序列描述：合成多核苷酸"

<400> 20

ttggccactc cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc 60

cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag agagggagtg 120

gccaactcca tcactagggg ttcctcgtta cataacttac ggtaaatggc ccgcctggct 180

gaccgcccaa cgacccccgc ccattgacgt caataatgac gtatgttccc atagtaacgc 240

caatagggac tttccattga cgtcaatggg tggactattt acggtaaact gcccacttgg 300

cagtacatca agtgtatcat atgccaagta cgccccctat tgacgtcaat gacggtaaat 360

ggcccgcctg gcattatgcc cagtacatga ccttatggga ctttcctact tggcagtaca 420

tctacgtatt agtcatcgct attaccatgc gtcgaggtga gccccacgtt ctgcttcact 480

ctccccatct cccccccctc cccaccccca attttgtatt tatttatttt ttaattattt 540

tatgcagcga tgggggcggg gggggggggg gcgcgcgcca ggcggggcgg ggcggggcga 600

ggggcggggc ggggcgaggc ggagaggtgc ggcggcagcc aatcagagcg gcgcgctccg 660

aaagtttcct tttatggcga ggcggcggcg gcggcggccc tataaaaagc gaagcgcgcg 720

gcgggcggct ctaaggtaaa tataaaattt ttaagtgtat aatgtgttaa actactgatt 780

ctaattgttt ctctctttta gattccaacc tttggaactg atgccgccac catgaagatt 840

cctaacattg gtaatgtgat gaataaattt gagatccttg gggttgtagg tgaaggagcc 900

tatggagttg tacttaaatg cagacacaag gaaacacatg aaattgtggc gatcaagaaa 960

ttcaaggaca gtgaagaaaa tgaagaagtc aaagaaacga ctttacgaga gcttaaaatg 1020

cttcggactc tcaagcagga aaacattgtg gagttgaagg aagcatttcg tcggagggga 1080

aagttgtact tggtgtttga gtatgttgaa aaaaatatgc tcgaattgct ggaagaaatg 1140

ccaaatggag ttccacctga gaaagtaaaa agctacatct atcagctaat caaggctatt 1200

cactggtgcc ataagaatga tattgtccat cgagatataa aaccagaaaa tctcttaatc 1260

agccacaatg atgtcctaaa actgtgtgac tttggttttg ctcgtaatct gtcagaaggc 1320

aataatgcta attacacaga gtacgttgcc accagatggt atcggtcccc agaactctta 1380

cttggcgctc cctatggaaa gtccgtggac atgtggtcgg tgggctgtat tcttggggag 1440

cttagcgatg gacagccttt atttcctgga gaaagtgaaa ttgaccaact ttttactatt 1500

cagaaggtgc taggaccact tccatctgag cagatgaagc ttttctacag taatcctcgc 1560

ttccatgggc tccggtttcc agctgttaac catcctcagt ccttggaaag aagatacctt 1620

ggaattttga atagtgttct acttgaccta atgaagaatt tactgaagtt ggacccagct 1680

gacagatact tgacagaaca gtgtttgaat caccctacat ttcaaaccca gagacttctg 1740

gatcgttctc cttcaaggtc agcaaaaaga aaaccttacc atgtggaaag cagcacattg 1800

tctaatagaa accaagccgg caaaagtact gctttgcagt ctcaccacag atctaacagc 1860

aaggacatcc agaacctgag tgtaggcctg ccccgggctg acgaaggtct ccctgccaat 1920

gaaagcttcc taaatggaaa ccttgctgga gctagtctta gtccactgca caccaaaacc 1980

taccaagcaa gcagccagcc tgggtctacc agcaaagatc tcaccaacaa caacatacca 2040

caccttctta gcccaaaaga agccaagtca aaaacagagt ttgattttaa tattgaccca 2100

aagccttcag aaggcccagg gacaaagtac ctcaagtcaa acagcagatc tcagcagaac 2160

cgccactcat tcatggaaag ctctcaaagc aaagctggga cactgcagcc caatgaaaag 2220

cagagtcggc atagctatat tgacacaatt ccccagtcct ctaggagtcc ctcctacagg 2280

accaaggcca aaagccatgg ggcactgagt gactccaagt ctgtgagcaa cctttctgaa 2340

gccagggccc aaattgcgga gcccagtacc agtaggtact tcccatctag ctgcttagac 2400

ttgaattctc ccaccagccc aacccccacc agacacagtg acacgagaac tttgctcagc 2460

ccttctggaa gaaataaccg aaatgaggga acgctggact cacgtcgaac cacaaccaga 2520

cattctaaga cgatggagga attgaagctg ccggagcaca tggacagtag ccattcccat 2580

tcactgtctg cacctcacga atctttttct tatggactgg gctacaccag ccccttttct 2640

tcccagcaac gtcctcatag gcattctatg tatgtgaccc gtgacaaagt gagagccaag 2700

ggcttggatg gaagcttgag catagggcaa gggatggcag ctagagccaa cagcctgcaa 2760

ctcttgtcac cccagcctgg agaacagctc cctccagaga tgactgtggc aagatcttcg 2820

gtcaaagaga cctccagaga aggcacctct tccttccata cacgccagaa gtctgagggt 2880

ggagtgtatc atgacccaca ctctgatgat ggcacagccc ccaaagaaaa tagacaccta 2940

tacaatgatc ctgtgccaag gagagttggt agcttttaca gagtgccatc tccacgtcca 3000

gacaattctt tccatgaaaa taatgtgtca actagagttt cttctctacc atcagagagc 3060

agttctggaa ccaaccactc aaaaagacaa ccagcattcg atccatggaa aagtcctgaa 3120

aatattagtc attcagagca actcaaggaa aaagagaagc aaggattttt caggtcaatg 3180

aaaaagaaaa agaagaaatc tcaaacagta cccaattccg acagccctga tcttctgacg 3240

ttgcagaaat ccattcattc tgctagcact ccaagcagca gaccaaagga gtggcgcccc 3300

gagaagatct cagatctgca gacccaaagc cagccattaa aatcactgcg caagttgtta 3360

catctctctt cggcctcaaa tcacccggct tcctcagatc cccgcttcca gcccttaaca 3420

gctcaacaaa ccaaaaattc cttctcagaa attcggattc accccctgag ccaggcctct 3480

ggcgggagca gcaacatccg gcaggaaccc gcaccgaagg gcaggccagc cctccagctg 3540

ccaggtcaga tggatcctgg ttggcatgtg tcctctgtga ccaggagtgc cacagagggc 3600

ccttcctact ctgaacagct gggtgccaaa agtgggccaa atgggcaccc ctataacaga 3660

acaaatcgct cacgaatgcc aaatctgaat gatttaaaag agacagcctt gtaagatcca 3720

gacatgataa gatacattga tgagtttgga caaaccacaa ctagaatgca gtgaaaaaaa 3780

tgctttattt gtgaaatttg tgatgctatt gctttatttg taaccattat aagctgcaat 3840

aaacaagtta acaacaacaa ttgcattcat tttatgtttc aggttcaggg ggaggtgtgg 3900

gaggtttttt agaggaaccc ctagtgatgg agttggccac tccctctctg cgcgctcgct 3960

cgctcactga ggccgcccgg gcaaagcccg ggcgtcgggc gacctttggt cgcccggcct 4020

cagtgagcga gcgagcgcgc agagagggag tggccaa 4057

<210> 21

<211> 2211

<212> DNA

<213> 腺相关病毒9

<400> 21

atggctgccg atggttatct tccagattgg ctcgaggaca accttagtga aggaattcgc 60

gagtggtggg ctttgaaacc tggagcccct caacccaagg caaatcaaca acatcaagac 120

aacgctcgag gtcttgtgct tccgggttac aaataccttg gacccggcaa cggactcgac 180

aagggggagc cggtcaacgc agcagacgcg gcggccctcg agcacgacaa ggcctacgac 240

cagcagctca aggccggaga caacccgtac ctcaagtaca accacgccga cgccgagttc 300

caggagcggc tcaaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360

gccaaaaaga ggcttcttga acctcttggt ctggttgagg aagcggctaa gacggctcct 420

ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcctccgc gggtattggc 480

aaatcgggtg cacagcccgc taaaaagaga ctcaatttcg gtcagactgg cgacacagag 540

tcagtcccag accctcaacc aatcggagaa cctcccgcag ccccctcagg tgtgggatct 600

cttacaatgg cttcaggtgg tggcgcacca gtggcagaca ataacgaagg tgccgatgga 660

gtgggtagtt cctcgggaaa ttggcattgc gattcccaat ggctggggga cagagtcatc 720

accaccagca cccgaacctg ggccctgccc acctacaaca atcacctcta caagcaaatc 780

tccaacagca catctggagg atcttcaaat gacaacgcct acttcggcta cagcaccccc 840

tgggggtatt ttgacttcaa cagattccac tgccacttct caccacgtga ctggcagcga 900

ctcatcaaca acaactgggg attccggcct aagcgactca acttcaagct cttcaacatt 960

caggtcaaag aggttacgga caacaatgga gtcaagacca tcgccaataa ccttaccagc 1020

acggtccagg tcttcacgga ctcagactat cagctcccgt acgtgctcgg gtcggctcac 1080

gagggctgcc tcccgccgtt cccagcggac gttttcatga ttcctcagta cgggtatctg 1140

acgcttaatg atggaagcca ggccgtgggt cgttcgtcct tttactgcct ggaatatttc 1200

ccgtcgcaaa tgctaagaac gggtaacaac ttccagttca gctacgagtt tgagaacgta 1260

cctttccata gcagctacgc tcacagccaa agcctggacc gactaatgaa tccactcatc 1320

gaccaatact tgtactatct ctcaaagact attaacggtt ctggacagaa tcaacaaacg 1380

ctaaaattca gtgtggccgg acccagcaac atggctgtcc agggaagaaa ctacatacct 1440

ggacccagct accgacaaca acgtgtctca accactgtga ctcaaaacaa caacagcgaa 1500

tttgcttggc ctggagcttc ttcttgggct ctcaatggac gtaatagctt gatgaatcct 1560

ggacctgcta tggccagcca caaagaagga gaggaccgtt tctttccttt gtctggatct 1620

ttaatttttg gcaaacaagg aactggaaga gacaacgtgg atgcggacaa agtcatgata 1680

accaacgaag aagaaattaa aactactaac ccggtagcaa cggagtccta tggacaagtg 1740

gccacaaacc accagagtgc ccaagcacag gcgcagaccg gctgggttca aaaccaagga 1800

atacttccgg gtatggtttg gcaggacaga gatgtgtacc tgcaaggacc catttgggcc 1860

aaaattcctc acacggacgg caactttcac ccttctccgc tgatgggagg gtttggaatg 1920

aagcacccgc ctcctcagat cctcatcaaa aacacacctg tacctgcgga tcctccaacg 1980

gccttcaaca aggacaagct gaactctttc atcacccagt attctactgg ccaagtcagc 2040

gtggagatcg agtgggagct gcagaaggaa aacagcaagc gctggaaccc ggagatccag 2100

tacacttcca actattacaa gtctaataat gttgaatttg ctgttaatac tgaaggtgta 2160

tatagtgaac cccgccccat tggcaccaga tacctgactc gtaatctgta a 2211

<210> 22

<211> 736

<212> PRT

<213> 腺相关病毒9

<400> 22

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro

20 25 30

Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly

145 150 155 160

Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro

180 185 190

Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly

195 200 205

Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn

260 265 270

Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg

275 280 285

Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn

290 295 300

Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile

305 310 315 320

Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn

325 330 335

Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu

340 345 350

Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro

355 360 365

Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp

370 375 380

Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe

385 390 395 400

Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu

405 410 415

Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu

420 425 430

Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser

435 440 445

Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser

450 455 460

Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro

465 470 475 480

Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn

485 490 495

Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn

500 505 510

Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys

515 520 525

Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly

530 535 540

Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile

545 550 555 560

Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser

565 570 575

Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln

580 585 590

Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln

595 600 605

Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His

610 615 620

Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met

625 630 635 640

Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala

645 650 655

Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr

660 665 670

Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln

675 680 685

Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn

690 695 700

Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val

705 710 715 720

Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu

725 730 735

<210> 23

<211> 310

<212> PRT

<213> 酿脓链球菌（Streptococcus pyogenes）

<400> 23

Asp Ser Phe Ser Ala Asn Gln Glu Ile Arg Tyr Ser Glu Val Thr Pro

1 5 10 15

Tyr His Val Thr Ser Val Trp Thr Lys Gly Val Thr Pro Pro Ala Asn

20 25 30

Phe Thr Gln Gly Glu Asp Val Phe His Ala Pro Tyr Val Ala Asn Gln

35 40 45

Gly Trp Tyr Asp Ile Thr Lys Thr Phe Asn Gly Lys Asp Asp Leu Leu

50 55 60

Cys Gly Ala Ala Thr Ala Gly Asn Met Leu His Trp Trp Phe Asp Gln

65 70 75 80

Asn Lys Asp Gln Ile Lys Arg Tyr Leu Glu Glu His Pro Glu Lys Gln

85 90 95

Lys Ile Asn Phe Asn Gly Glu Gln Met Phe Asp Val Lys Glu Ala Ile

100 105 110

Asp Thr Lys Asn His Gln Leu Asp Ser Lys Leu Phe Glu Tyr Phe Lys

115 120 125

Glu Lys Ala Phe Pro Tyr Leu Ser Thr Lys His Leu Gly Val Phe Pro

130 135 140

Asp His Val Ile Asp Met Phe Ile Asn Gly Tyr Arg Leu Ser Leu Thr

145 150 155 160

Asn His Gly Pro Thr Pro Val Lys Glu Gly Ser Lys Asp Pro Arg Gly

165 170 175

Gly Ile Phe Asp Ala Val Phe Thr Arg Gly Asp Gln Ser Lys Leu Leu

180 185 190

Thr Ser Arg His Asp Phe Lys Glu Lys Asn Leu Lys Glu Ile Ser Asp

195 200 205

Leu Ile Lys Lys Glu Leu Thr Glu Gly Lys Ala Leu Gly Leu Ser His

210 215 220

Thr Tyr Ala Asn Val Arg Ile Asn His Val Ile Asn Leu Trp Gly Ala

225 230 235 240

Asp Phe Asp Ser Asn Gly Asn Leu Lys Ala Ile Tyr Val Thr Asp Ser

245 250 255

Asp Ser Asn Ala Ser Ile Gly Met Lys Lys Tyr Phe Val Gly Val Asn

260 265 270

Ser Ala Gly Lys Val Ala Ile Ser Ala Lys Glu Ile Lys Glu Asp Asn

275 280 285

Ile Gly Ala Gln Val Leu Gly Leu Phe Thr Leu Ser Thr Gly Gln Asp

290 295 300

Ser Trp Asn Gln Thr Asn

305 310

<210> 24

<211> 349

<212> PRT

<213> 马链球菌（Streptococcus equi）

<400> 24

Met Lys Thr Ile Ala Tyr Pro Asn Lys Pro His Ser Leu Ser Ala Gly

1 5 10 15

Leu Leu Thr Ala Ile Ala Ile Phe Ser Leu Ala Ser Ser Asn Ile Thr

20 25 30

Tyr Ala Asp Asp Tyr Gln Arg Asn Ala Thr Glu Ala Tyr Ala Lys Glu

35 40 45

Val Pro His Gln Ile Thr Ser Val Trp Ser Lys Gly Val Thr Pro Leu

50 55 60

Thr Pro Glu Gln Phe Arg Tyr Asn Asn Glu Asp Val Ile His Ala Pro

65 70 75 80

Tyr Leu Ala His Gln Gly Trp Tyr Asp Ile Thr Lys Ala Phe Asp Gly

85 90 95

Lys Asp Asn Leu Leu Cys Gly Ala Ala Thr Ala Gly Asn Met Leu His

100 105 110

Trp Trp Phe Asp Gln Asn Lys Thr Glu Ile Glu Ala Tyr Leu Ser Lys

115 120 125

His Pro Glu Lys Gln Lys Ile Ile Phe Asn Asn Gln Glu Leu Phe Asp

130 135 140

Leu Lys Ala Ala Ile Asp Thr Lys Asp Ser Gln Thr Asn Ser Gln Leu

145 150 155 160

Phe Asn Tyr Phe Arg Asp Lys Ala Phe Pro Asn Leu Ser Ala Arg Gln

165 170 175

Leu Gly Val Met Pro Asp Leu Val Leu Asp Met Phe Ile Asn Gly Tyr

180 185 190

Tyr Leu Asn Val Phe Lys Thr Gln Ser Thr Asp Val Asn Arg Pro Tyr

195 200 205

Gln Asp Lys Asp Lys Arg Gly Gly Ile Phe Asp Ala Val Phe Thr Arg

210 215 220

Gly Asp Gln Thr Thr Leu Leu Thr Ala Arg His Asp Leu Lys Asn Lys

225 230 235 240

Gly Leu Asn Asp Ile Ser Thr Ile Ile Lys Gln Glu Leu Thr Glu Gly

245 250 255

Arg Ala Leu Ala Leu Ser His Thr Tyr Ala Asn Val Ser Ile Ser His

260 265 270

Val Ile Asn Leu Trp Gly Ala Asp Phe Asn Ala Glu Gly Asn Leu Glu

275 280 285

Ala Ile Tyr Val Thr Asp Ser Asp Ala Asn Ala Ser Ile Gly Met Lys

290 295 300

Lys Tyr Phe Val Gly Ile Asn Ala His Gly His Val Ala Ile Ser Ala

305 310 315 320

Lys Lys Ile Glu Gly Glu Asn Ile Gly Ala Gln Val Leu Gly Leu Phe

325 330 335

Thr Leu Ser Ser Gly Lys Asp Ile Trp Gln Lys Leu Ser

340 345

Claims

1.一种重组腺相关病毒(rAAV)，其中所述rAAV包含AAV衣壳和包装在其中的载体基因组，其中所述载体基因组包含：

(a)启动子序列；以及

(b)CDKL5的编码序列，其中所述编码序列包含与选自SEQ ID NO：1、2、3、4、5、6、7和8的序列具有至少95％同一性的序列。

2.根据权利要求1所述的rAAV，其中该AAV衣壳来自血清型1、2、3、4、5、6、7、8、9、10、11、12、rh10或hu37的AAV。

3.根据权利要求2所述的rAAV，其中该AAV衣壳来自AAV9。

4.根据权利要求2所述的rAAV，其中该AAV衣壳来自AAV8。

5.根据权利要求1所述的rAAV，其中该AAV衣壳是AAV9变体衣壳。

6.根据权利要求1-5中任一项所述的rAAV，其中该启动子是神经元特异性启动子。

7.根据权利要求6所述的rAAV，其中该神经元特异性启动子选自人突触蛋白1(SYN1)启动子、小鼠钙/钙调蛋白依赖性蛋白激酶II(CaMKII)启动子、大鼠微管蛋白αI(Ta1)启动子、大鼠神经元特异性烯醇化酶(NSE)启动子、人神经元特异性烯醇化酶(ENO2)启动子、人血小板源性生长因子β链(PDGF)启动子、人BM88启动子、和神经元烟碱受体β2(CHRNB2)启动子。

8.根据权利要求7所述的rAAV，其中该神经元特异性启动子是人SYN1启动子。

9.根据权利要求8所述的rAAV，其中该人SYN1启动子具有包含SEQ ID NO：12的核酸序列。

10.根据权利要求8所述的rAAV，其中该人SYN1启动子具有由SEQ ID NO：12组成的核酸序列。

11.根据权利要求1-5中任一项所述的rAAV，其中该启动子选自鸡β-肌动蛋白(CBA)启动子、巨细胞病毒(CMV)即早期基因启动子、甲状腺素转运蛋白(TTR)启动子、甲状腺素结合球蛋白(TBG)启动子、和α-1抗胰蛋白酶(A1AT)启动子。

12.根据权利要求11所述的rAAV，其中该启动子是CBA启动子。

13.根据权利要求12所述的rAAV，其中该CBA启动子具有包含SEQ ID NO：13的核酸序列。

14.根据权利要求12所述的rAAV，其中该CBA启动子具有由SEQ ID NO：13组成的核酸序列。

15.根据权利要求1-5中任一项所述的rAAV，其中该启动子是CDKL5基因特异性内源性启动子。

16.根据权利要求15所述的rAAV，其中该CDKL5基因特异性内源性启动子包含至少15个连续核苷酸的核苷酸序列，该核苷酸序列与SEQ ID NO：14的相等长度区域具有至少95％同一性。

17.根据权利要求1-16中任一项所述的rAAV，其中该载体基因组进一步包含5’-ITR序列。

18.根据权利要求1-17中任一项所述的rAAV，其中该载体基因组进一步包含3’-ITR序列。

19.根据权利要求17-18中任一项所述的rAAV，其中该5’-ITR序列和/或该3’-ITR序列来自AAV2。

20.根据权利要求19所述的rAAV，其中该5’-ITR序列和该3’-ITR序列包含SEQ ID NO：11或由其组成。

21.根据权利要求17-18中任一项所述的rAAV，其中该5’-ITR序列和/或该3’-ITR序列来自非AAV2来源。

22.根据权利要求1-21中任一项所述的rAAV，其中该载体基因组进一步包含聚腺苷酸化信号序列。

23.根据权利要求22所述的rAAV，其中该聚腺苷酸化信号序列选自SV40聚腺苷酸化信号序列、牛生长激素(BGH)聚腺苷酸化信号序列和兔β珠蛋白聚腺苷酸化信号序列。

24.根据权利要求23所述的rAAV，其中该聚腺苷酸化信号序列是SV40聚腺苷酸化信号序列。

25.根据权利要求24所述的rAAV，其中该SV40聚腺苷酸化信号序列包含SEQ ID NO：15或由其组成。

26.根据权利要求1-25中任一项所述的rAAV，其中该载体基因组进一步包含一个或多个增强子序列。

27.根据权利要求26所述的rAAV，其中该增强子选自巨细胞病毒(CMV)即早期基因增强子、甲状腺素转运蛋白增强子(enTTR)、鸡β-肌动蛋白(CBA)增强子、En34增强子、和载脂蛋白E(ApoE)增强子。

28.根据权利要求27所述的rAAV，其中该增强子是CMV即早期基因增强子。

29.根据权利要求28所述的rAAV，其中该增强子具有包含SEQ ID NO：17或由其组成的序列。

30.根据权利要求26-29中任一项所述的rAAV，其中该增强子位于该启动子序列的上游。

31.根据权利要求1-30中任一项所述的rAAV，其中该载体基因组进一步包含一个或多个内含子序列。

32.根据权利要求31所述的rAAV，其中该内含子选自SV40小T内含子、兔血红蛋白亚基β(rHBB)内含子、人β珠蛋白IVS2内含子、β-珠蛋白/IgG嵌合内含子、和hFIX内含子。

33.根据权利要求32所述的rAAV，其中该内含子是SV40小T内含子。

34.根据权利要求33所述的rAAV，其中该SV40小T内含子具有包含SEQID NO：18或由其组成的序列。

35.一种组合物，该组合物包含根据前述权利要求中任一项所述的rAAV、和药学上可接受的载剂。

36.一种在人受试者中治疗CDKL5缺陷障碍(CDD)的方法，该方法包括向该人受试者施用治疗有效量的根据权利要求1-34中任一项所述的rAAV或根据权利要求35所述的组合物。

37.根据权利要求36所述的方法，其中将该rAAV或该组合物通过皮下、肌内、皮内、腹膜内、鞘内、脑室内、静脉内、或经由大脑池内递送施用。

38.根据权利要求37所述的方法，其中将该rAAV或该组合物通过鞘内施用。

39.根据权利要求37所述的方法，其中将该rAAV或该组合物经由大脑池内递送施用。

40.根据权利要求37-39中任一项所述的方法，其中将该rAAV以约1×10¹¹至约1×10¹⁴个基因组拷贝(GC)/kg的剂量施用。

41.一种在人受试者中治疗CDKL5缺陷障碍(CDD)的方法，该方法包括首先向该人受试者施用皮质类固醇，随后施用治疗有效量的重组腺相关病毒(rAAV)，其中所述rAAV包含AAV衣壳和包装在其中的载体基因组，其中所述载体基因组包含启动子序列和CDKL5的编码序列。

42.一种在人受试者中治疗CDKL5缺陷障碍(CDD)的方法，该方法包括向人受试者施用治疗有效量的重组腺相关病毒(rAAV)，

其中所述rAAV包含AAV衣壳和包装在其中的载体基因组，

其中所述载体基因组包含启动子序列和CDKL5的编码序列，并且

其中已经向该人受试者施用了皮质类固醇。

43.一种在人受试者中治疗CDKL5缺陷障碍(CDD)的方法，该方法包括首先向该人受试者施用皮质类固醇，随后施用治疗有效量的根据权利要求1-34中任一项所述的rAAV或根据权利要求35所述的组合物。

44.一种在人受试者中治疗CDKL5缺陷障碍(CDD)的方法，该方法包括施用治疗有效量的根据权利要求1-34中任一项所述的rAAV或根据权利要求35所述的组合物，其中已经向该人受试者施用了皮质类固醇。

45.根据权利要求41-44中任一项所述的方法，其中该皮质类固醇选自泼尼松龙、泼尼松、地塞米松、氢化可的松、曲安西龙、甲泼尼龙、布地奈德、倍他米松、和地夫可特。

46.根据权利要求45所述的方法，其中该皮质类固醇是泼尼松龙。

47.一种在人受试者中治疗CDKL5缺陷障碍(CDD)的方法，该方法包括首先向该人受试者施用IgG降解蛋白酶，随后施用治疗有效量的根据权利要求1-34中任一项所述的rAAV或根据权利要求35所述的组合物。

48.一种在人受试者中治疗CDKL5缺陷障碍(CDD)的方法，该方法包括施用治疗有效量的根据权利要求1-34中任一项所述的rAAV或根据权利要求35所述的组合物，其中已经向该人受试者施用了IgG降解蛋白酶。

49.根据权利要求47或48所述的方法，其中该IgG降解蛋白酶是酿脓链球菌的IdeS或其工程化的变体。

50.根据权利要求47或48所述的方法，其中该IgG降解蛋白酶是马链球菌的IdeZ或其工程化的变体。

51.一种多核苷酸，该多核苷酸包含与SEQ ID NO：19的序列具有至少95％同一性的核酸序列。

52.一种多核苷酸，该多核苷酸包含与SEQ ID NO：19的序列具有至少95％同一性的核酸序列。

53.一种多核苷酸，该多核苷酸的核酸序列包含SEQ ID NO：19。

54.一种多核苷酸，该多核苷酸的核酸序列由SEQ ID NO：19组成。

55.一种多核苷酸，该多核苷酸包含与SEQ ID NO：20具有至少95％同一性的核酸序列。

56.一种多核苷酸，该多核苷酸的核酸序列包含SEQ ID NO：20。

57.一种多核苷酸，该多核苷酸的核酸序列由SEQ ID NO：20组成。