CN116390935A

CN116390935A - 核酸构建体、病毒载体和病毒颗粒

Info

Publication number: CN116390935A
Application number: CN202180068819.XA
Authority: CN
Inventors: S·M·代德尔韦尔德雷; T·克雷默; C·西佩基; B·N·瓦莱特; 徐美瑜
Original assignee: UCB Biopharma SRL
Current assignee: UCB Biopharma SRL
Priority date: 2020-10-09
Filing date: 2021-10-07
Publication date: 2023-07-04
Also published as: EP4225782A1; MX2023003994A; CL2023000785A1; IL301255A; ECSP23024245A; KR20230083335A; CA3195052A1; TW202229321A; US20230365652A1; BR112023004874A2; WO2022074105A1; JP2023544264A; CO2023002727A2; AR123756A1; PE20230987A1; AU2021358413A1

Abstract

本发明涉及包含编码GAT‑1的转基因的核酸构建体、病毒载体和病毒颗粒；和此类病毒颗粒用于治疗由SLC6A1损伤介导的疾病的用途。

Description

核酸构建体、病毒载体和病毒颗粒

技术领域

本发明属于用于治疗和/或预防与溶质载体家族6成员1(SLC6A1)功能损失相关的疾病例如肌阵挛失张力癫痫(MAE)、MAE样和其他癫痫适应症例如Lennox-Gastaut综合征以及自闭症谱系障碍和精神分裂症的核酸构建体、病毒载体和病毒颗粒的领域。

背景技术

迄今为止，已有数千个基因与神经发育障碍相关并且借助于临床基因测试，日益增多的综合征由突变基因而非其临床特征来定义。基因SLC6A1的破坏已鉴定为大范围的神经发育障碍的显著原因，包括自闭症谱系障碍(ASD)、智力残疾(ID)和不同类型和严重程度的癫痫。SLC6A1编码GAT-1，其为在中枢神经系统中表达的γ-胺基丁酸(GABA)转运子家族的成员(

S.和Gether U.2012.Br JPharmacol 167:256-278)。SLC6A1基因首先克隆于1990年(Guastella J.等人,1990.Science 249:1303-1306)并且属于一个由20个旁系同源物组成的家族。由这些基因中的13个编码的蛋白质展现超过80％序列同一性并且其中六个能够以不同程度的底物特异性转运GABA。

GAT-1在哺乳动物中枢神经系统中广泛并且专一地表达，主要在成人大脑中额叶皮质中表达(Gamazon E.R.等人,2018.Nat Genet 50:956-967)。不同于其他GABA转运蛋白，GAT-1几乎专一地表达于GABA能(GABAergic)轴突末端和星形胶质细胞中。在发育中的大脑中，GABA发挥兴奋作用，但后来成为中枢神经系统中的主要抑制性神经传递素。GABA能抑制的发作对于抗衡神经元兴奋至关重要，并且当显著破坏时，其对大脑发育产生负面影响，并且导致注意力和认知缺陷以及癫痫。

GAT-1蛋白质由12个跨膜结构域构成，所述跨膜结构域聚集在一起以形成单链转运蛋白。GABA转运蛋白的主要功能为降低胞外空间中的GABA浓度(Scimemi A.2014.FrontCell Neurosci 8)。此任务通过将GABA跨细胞膜的易位与钠和氯化物的电化学梯度的耗散偶联来实现(图1)。通过使这些离子与GABA以固定比率(1GABA:2Na⁺:1Cl^-)移动跨膜，GAT-1产生化学计量电流(Lester H.A.等人,1994.Annual Review of Pharmacology andToxicology 34:219-249)。在其余时，在GABA能神经元的突触前末端中，钠和氯离子的驱动力迫使这些离子从胞外空间向细胞质移动，因此在相同方向上携带GABA。GABA跨膜的易位相对较快，使得GABA在其释放之后几毫秒内从胞外空间移除(Isaacson等人,1993.Neuron10:165-175)。除了调节GABA的转运外，GAT-1还用作离子通道，并且产生不以化学计量方式偶联至GABA跨膜的移动的两种离子电流。第一种为通过结合至GAT-1的GABA活化的钠内向电流(Risso等人,1996.J Physiol 490:691-702)。第二种为渗漏电流，其甚至在不存在GABA的情况下可被检测到，并且在体外由锂和铯等碱离子介导(MacAulay等人,2002.JPhysiol(Lond)544:447-458)。最后，在不存在GABA的情况下，GAT-1产生钠依赖性电容电流(Mager等人,1993.Neuron 10:177-188)。经由这些电流的协调激活，GAT-1激活可产生局部分流(即，膜电阻的改变)或膜去极化。

存在编码三种GAT-1同种型的人类SLC6A1的五种主要剪接变体，所述变体在外显子三至五的交替使用中彼此不同。转录物ENST00000287766为SLC6A1的最长同种型并且被视为典型的(Hunt等人,2018.Database(Oxford)2018，https://academic.oup.com/database/article/doi/10.1093/database/bay119/5255129)。因此，大部分基因变体映射至其序列中。由于缺乏晶体结构，GAT-1的确切拓朴结构尚不清楚。GAT-1的同源性建模(基于LeuTAa的晶体结构，LeuTAa为一种来自阿氏产水菌Aquifex aeolicus的原核同源亮氨酸转运蛋白，与GAT-1具有20-25％的序列同源性)允许鉴定对跨膜结构域1、3、6、8中的底物和钠结合所必需的残基和在输送过程中构象转变所必需的其他残基(

S.和GetherU.2012.Br J Pharmacol 167:256-278)。

然而，如在许多其他神经发育障碍相关基因的情况下，SLC6A1内的患者变体沿着其序列广泛分布(Johannesen等人,2018.Epilepsia59:389-402)。在患者中已观察到两种类型的变体：(i)终止所遗传的两种SLC6A1基因等位基因中的一种的蛋白质产生的蛋白质截短变体和(ii)蛋白质的关键区域(例如GABA结合位点和跨膜结构域)中的错义变体。

因此，SLC6A1病症的预期分子病理机制为功能丧失或单倍体不足。疾病模型由野生型和GAT-1-/-小鼠两者中的实验以及对来自具有SLC6A1突变的个体的重组GAT-1蛋白质的研究支持。然而，单倍体不足导致临床表现的机制尚不清楚。最近，实验证据显示，癫痫患者中鉴定的SLC6A1变体减少体外GABA转运(Mattison等人,2018；Cai等人,2019.Epilepsia59:e135-e141)。其他证据表明SLC6A1突变还可引起受损的蛋白质迁移(Cai等人,2019.Experimental Neurology320:112973)。

目前尚无SLC6A1遗传病症的特异性动物模型。杂合(Het)GAT-1基因敲除小鼠看起来表型正常，尽管GABA再摄取能力大大减弱。先前已开发并且部分表征功能性GAT-1KO小鼠(Chiu等人,2005.Neurosci 25:3234-3245；Cope等人,2009.Nature Medicine 15:1392-1398；Jensen等人,2003.Neurophysiology 90:2690-2701；Lester等人,1994.AnnualReview of Pharmacology and Toxicology 34:219-249)。完全KO动物展现出失神发作、持续颤抖、步态异常、力量和活动性降低以及焦虑行为(Chiu等人,2005.Neurosci 25:3234-3245；Cope等人,2009.Nature Medicine 15:1392-1398)。这些表型与SLC6A1病症的一些临床表现匹配，所述临床表现包括失神发作、活动性和认知障碍(Johannesen等人,2018.Epilepsia 59:389-402)。

丙戊酸本身或与诸如氨己烯酸(vigabatrine)的其他抗癫痫药组合地显示阳性结果(Johannesen等人,2018.Epilepsia 59:389-402)。小分子或伴侣蛋白疗法还被视为理论上似乎合理的选择方案以增强现有GAT-1蛋白质的活性，但迄今为止尚未成功。这些干预均不能解决与GAT-1损伤相关的多种临床表现背后的全部或甚至一小部分病理特征。因此，对于改善SLC6A1相关病症的治疗选择，仍有明显的医疗需求未得到满足。

发明内容

本发明通过借助于基因疗法提供野生型SLC6A1基因的健康拷贝来解决以上鉴定的需求，该野生型SLC6A1基因可在经转导的细胞中经受内源性调节机制并且能够将GAT-1转运蛋白功能恢复至“正常”范围。

本发明可概述如下：

实施方案1：一种核酸构建体，其包含编码以下的转基因：

i.γ丁酸(GABA)转运蛋白1(GAT-1)，其包含SEQ ID NO:18、19、20；或

ii.与SEQ ID NO:18、19或20具有至少95％或96％或97％或98％或99％或99.5％序列同一性并且保留作为GAT-1的功能性的序列；或

iii.天然存在的变体，其参考SEQ ID NO:18包含一个或多个突变，所述突变优选选自：Ala2Thr；Asp165Tyr；Arg277Ser；Ile434Met；Arg579His；Gly5Ser；Arg172Cys；Arg277Cys；Ser470Cys；Pro580Ser；Asp10Asn；Arg172His；Arg277Pro；Ile471Val；Pro587Ala；Gly11Arg；Phe174Tyr；Ser280Cys；Gly476Ser；Ala589Val；Ile13Thr；Ser178Asn；Asn310Ser；Arg479Gln；Ile599Val；Glu16Lys；Asn181Asp；Tyr317His；Lys497Asn；Glu19Gly；Asn181Lys；Ile321Val；Phe502Tyr；Pro21Thr；Arg195His；Ser328Leu；Ile506Val；Lys33Glu；Met197Leu；Met332Val；Ala509Val；Val34Leu；Asp202Glu；Val337Ile；Thr520Met；Asp40Asn；Lys206Glu；His347Arg；Gly535Val；Met1的缺失；Glu411之后的终止密码子；Asp43Glu；Arg211Cys；Ala354Val；Leu547Phe；Lys76Asn；Ile220Val；Leu375Met；Met552Ile；Asn77Asp；Ile220Asn；Ile377Val；Met555Val；Ile84Phe；Ala221Thr；Ile405Val；Thr558Asn；Phe87Leu；Val240Ala；Val409Met；Arg566His；Ile91Val；Phe242Val；Leu415Ile；Gln572Arg；Val142Ile；Tyr246Cys；Arg417Cys；Pro573Thr；Thr156Asn；Arg257Cys；Arg417His；Pro573Ser；Thr158Pro；Arg257His；Arg419Cys；Ser574Asn；Asp165Asn；Thr260Met；Arg419His；或Val578Ile。

实施方案2：实施方案1的核酸构建体，其中所述转基因为溶质载体家族6成员1(SLC6A1)基因，其中所述转基因优选包含：

i.SEQ ID NO:15、26、27、28或29，优选SEQ ID NO:15或

ii.与SEQ ID NO:15、26、27、28或29具有至少95％或96％或97％或98％或99％或99.5％序列同一性的序列。

实施方案3：实施方案1或2中任一项的核酸构建体，其进一步包含可操作地连接至所述转基因的启动子，其中所述启动子优选包含：

a.SEQ ID NO:1或优选在5'至3'方向上可操作地连接至SEQ ID NO:2的SEQ IDNO:1；或

b.SEQ ID NO:3；或

c.SEQ ID NO:4；或

d.SEQ ID NO:5或SEQ ID NO:35或SEQ ID NO:6或优选在5'至3'方向上可操作地连接至SEQ ID NO:6的SEQ ID NO:35；或

e.SEQ ID NO:7；或优选在5'至3'方向上可操作地连接至SEQ ID NO:34的SEQ IDNO:7；或

f.SEQ ID NO:8；或

g.SEQ ID NO:9；或

h.SEQ ID NO:10；或

i.SEQ ID NO:11或在5'至3'方向上可操作地连接至SEQ ID NO:12的SEQ ID NO:11或优选在5'至3'方向上可操作地连接至SEQ ID NO:12的SEQ ID NO:11，其中SEQ ID NO:12在5'至3'方向上可操作地连接至SEQ ID NO:13；或

j.SEQ ID NO:14。

实施方案4：前述实施方案中任一项的核酸构建体，其中所述构建体包含多腺苷酸化信号序列，优选为包含SEQ ID NO:17的多腺苷酸化信号序列。

实施方案5：一种病毒载体，其包含前述实施方案中任一项的核酸构建体，其中所述病毒载体进一步包含位于所述核酸构建体5'和/或3'处的反向末端重复序列(ITR)，优选5'ITR和3'ITR。

实施方案6：实施方案5的病毒载体，其中所述5'ITR和/或所述3'ITR包含天然腺相关病毒(AAV)的ITR，例如AAV2的ITR。

实施方案7：实施方案5或6中任一项的病毒载体，其中所述5'ITR包含SEQ ID NO:22和/或所述3'ITR包含SEQ ID NO:23。

实施方案8：一种病毒颗粒，其包含实施方案1至4中任一项的核酸构建体或实施方案5至7中任一项的病毒载体。

实施方案9：实施方案8的病毒颗粒，其中所述病毒颗粒至少包含来自AAV的VP1衣壳蛋白，其中所述衣壳蛋白优选包含AAV2、AAV5、AAV6、AAV8、AAV9(例如包含SEQ ID NO:25)、AAV10、AAV-真型(AAVtt，例如包含SEQ ID NO:24)或其组合。

实施方案10：实施方案9的病毒颗粒，其中所述衣壳蛋白来自AAVtt并且优选包含SEQ ID NO:24或其与SEQ ID NO:24至少98.5％、优选99％或99.5％相同。

实施方案11：一种病毒载体，其包含含有编码以下的转基因的核酸构建体：

i.γ丁酸(GABA)转运蛋白1(GAT-1)，其包含SEQ ID NO:18、19、20；或

iii.天然存在的变体，其参考SEQ ID NO:18包含一个或多个突变，所述突变优选选自：Ala2Thr；Asp165Tyr；Arg277Ser；Ile434Met；Arg579His；Gly5Ser；Arg172Cys；Arg277Cys；Ser470Cys；Pro580Ser；Asp10Asn；Arg172His；Arg277Pro；Ile471Val；Pro587Ala；Gly11Arg；Phe174Tyr；Ser280Cys；Gly476Ser；Ala589Val；Ile13Thr；Ser178Asn；Asn310Ser；Arg479Gln；Ile599Val；Glu16Lys；Asn181Asp；Tyr317His；Lys497Asn；Glu19Gly；Asn181Lys；Ile321Val；Phe502Tyr；Pro21Thr；Arg195His；Ser328Leu；Ile506Val；Lys33Glu；Met197Leu；Met332Val；Ala509Val；Val34Leu；Asp202Glu；Val337Ile；Thr520Met；Asp40Asn；Lys206Glu；His347Arg；Gly535Val；Met1的缺失；Glu411之后的终止密码子；Asp43Glu；Arg211Cys；Ala354Val；Leu547Phe；Lys76Asn；Ile220Val；Leu375Met；Met552Ile；Asn77Asp；Ile220Asn；Ile377Val；Met555Val；Ile84Phe；Ala221Thr；Ile405Val；Thr558Asn；Phe87Leu；Val240Ala；Val409Met；Arg566His；Ile91Val；Phe242Val；Leu415Ile；Gln572Arg；Val142Ile；Tyr246Cys；Arg417Cys；Pro573Thr；Thr156Asn；Arg257Cys；Arg417His；Pro573Ser；Thr158Pro；Arg257His；Arg419Cys；Ser574Asn；Asp165Asn；Thr260Met；Arg419His；或Val578Ile；

其中所述病毒载体进一步包含可操作地连接至所述转基因的启动子，其中所述启动子优选包含SEQ ID NO:4或SEQ ID NO:14；其中所述病毒载体中所包含的核酸构建体包含多腺苷酸化信号序列，优选包含SEQ ID NO:17的多腺苷酸化信号序列；并且其中所述病毒载体进一步包含位于所述核酸构建体5'和/或3'侧翼处的反向末端重复序列(ITR)，优选5'ITR和3'ITR。

实施方案12：一种病毒载体，其包含含有转基因的核酸构建体，所述转基因为溶质载体家族6成员1(SLC6A1)基因，其中所述转基因优选包含：

i.SEQ ID NO:15、26、27、28或29，更优选SEQ ID NO:15；

ii.或与SEQ ID NO:15、26、27、28或29具有至少95％或96％或97％或98％或99％或99.5％序列同一性的序列。

其中所述病毒载体进一步包含可操作地连接至所述转基因的启动子，其中所述启动子优选包含SEQ ID NO:4或SEQ ID NO:14；其中所述病毒载体中所包含的核酸构建体包含多腺苷酸化信号序列，优选包含SEQ ID NO:17的多腺苷酸化信号序列，并且其中所述病毒载体进一步包含位于所述核酸构建体5'和/或3'侧翼处的反向末端重复序列(ITR)，优选5'ITR和3'ITR。

实施方案13：实施方案11或12中任一项的病毒载体，其中所述转基因编码包含SEQID NO:18的γ丁酸(GABA)转运蛋白1(GAT-1)。

实施方案14：实施方案11至13中任一项的病毒载体，其中所述多腺苷酸化信号序列包含SEQ ID NO:17。

实施方案15：一种病毒颗粒，其包含实施方案11至14中任一项的病毒载体。

实施方案16：实施方案15的病毒颗粒，其中所述病毒颗粒至少包含来自AAV的VP1衣壳蛋白，其中所述衣壳蛋白优选包含AAV2、AAV5、AAV6、AAV8、AAV9(例如包含SEQ ID NO:25)、AAV10、AAV-真型(AAVtt)或其组合。

实施方案17：实施方案16的病毒颗粒，其中所述衣壳蛋白来自AAV9并且优选包含SEQ ID NO:25或AAVtt并且优选包含SEQ ID NO:24或其与SEQ ID NO:24至少98.5％、优选99％或99.5％相同。

实施方案18：一种质粒，其包含实施方案1至4中任一项的核酸构建体或实施方案5至7或11至14中任一项的病毒载体。

实施方案19：一种宿主细胞，其用于产生实施方案8至10或15至17中任一项的病毒颗粒。

实施方案20：实施方案18的宿主细胞，其中所述宿主细胞包含：

a.实施方案1至4中任一项的核酸构建体或实施方案5至7或11至14中任一项的病毒载体；

b.编码AAV rep和/或cap基因的核酸构建体，优选质粒，其不携带ITR序列；和任选地

c.包含病毒辅助基因的核酸构建体，例如质粒或病毒。

实施方案21：一种产生实施方案8至10或15至17中任一项的病毒颗粒的方法，所述方法包括以下步骤：

a.在培养基中培养实施方案19或20中任一项的宿主细胞；和

b.从所述宿主细胞培养基和/或在所述宿主细胞内部收获所述病毒颗粒。

实施方案22：一种药物组合物，其包含实施方案1至4中任一项的核酸构建体或实施方案5至7或11至14中任一项的病毒载体或实施方案8至10或15至17中任一项的病毒颗粒，以及一种或多种药学上可接受的赋形剂、稀释剂或承载体。

实施方案23：实施方案8至10或15至17中任一项的病毒颗粒，其用于疗法中。

实施方案24：实施方案8至10或15至17中任一项的病毒颗粒，其用于治疗和/或预防以SLC6A1单倍体不足为特征的疾病，其中所述疾病优选包括伴有认知、运动行为共病的单基因癫痫、早发发育性和癫痫性脑病、癫痫性脑病、儿童期发作癫痫综合征、肌阵挛失张力癫痫(MAE)、MEA样和其他癫痫适应症，例如Lennox Gastaut综合征以及自闭症谱系障碍和精神分裂症或与GABA摄取受损相关的疾病或其组合。

实施方案25：实施方案23或24中任一项的病毒颗粒，其用于恢复GAT-1功能和/或降低癫痫频率。

实施方案26：实施方案8至10或15至17中任一项的病毒颗粒，其中所述疾病与患者中导致病理性GAT-1变体的至少一种突变相关，其中所述病理性GAT-1变体包含突变或突变组合。

实施方案27：实施方案26的病毒颗粒，其中所述突变参考SEQ ID NO:18，包括R44W、R44Q、R50L、D52E、D52V、F53S、S56F、G63S、N66D、G75R、G79R、G79V、F92S、G94E、G105S、Q106R、G112V、Y140C、C173Y、G232V、F270S、R277H、A288V、S295L、G297R、A305T、G307R、V323I、A334P、V342M、A357V、G362R、L366V、A367T、F385L、G393S、S456R、S459R、M487T、V511L、G550R或其组合。

实施方案28：一种用于治疗和/或预防以SLC6A1单倍体不足为特征的疾病的方法，其中所述疾病优选包括伴有认知、运动行为共病的单基因癫痫、早发发育性和癫痫性脑病、癫痫性脑病、儿童期发作癫痫综合征、肌阵挛失张力癫痫(MAE)、MEA样和其他癫痫适应症，例如Lennox Gastaut综合征以及自闭症谱系障碍和精神分裂症或与GABA摄取受损相关的疾病或其组合，所述方法包括向有需要的受试者施用实施方案8至10或14至16中任一项的病毒颗粒。

实施方案29：实施方案28的方法，其中所述方法用于恢复GAT-1功能和/或降低癫痫频率。

实施方案30：实施方案28或29中任一项的方法，其中所述疾病与患者中导致病理性GAT-1变体的至少一种突变相关，其中所述病理性GAT-1变体包含突变或突变组合。

实施方案31：实施方案30的方法，其中所述突变参考SEQ ID NO:18，包括R44W、R44Q、R50L、D52E、D52V、F53S、S56F、G63S、N66D、G75R、G79R、G79V、F92S、G94E、G105S、Q106R、G112V、Y140C、C173Y、G232V、F270S、R277H、A288V、S295L、G297R、A305T、G307R、V323I、A334P、V342M、A357V、G362R、L366V、A367T、F385L、G393S、S456R、S459R、M487T、V511L、G550R或其组合。

附图简述

图1：草图说明SLC6A1编码的GAT-1转运蛋白和其功能。GAT-1为调节胞外GABA的摄取的溶质载体蛋白质。GAT-1的化学计算学：抑制性神经传递素GABA的一个分子与两个钠阳离子和一个氯离子一起沿着电化学梯度共同转运。

图2：人类、猴和小鼠GAT-1序列的蛋白质序列比对(根据SEQ ID NO:18的人类变体)。比对显示三个物种中的高序列同一性。

图3：经设计的构建体的示意性草图。在附图中，一般而言“prom”＝启动子并且所分析的各种启动子如底部所示(CAG、EF1a、PGK和UcB)；“INT”意指内含子并且“EX”意指外显子，“h”或“m”分别＝人类和小鼠，SV40意指多腺苷酸化序列SV40；“tag”＝HA或myc标签，位于具有CAG启动子的构建体的N端或C端。

图4：AD-HEK293细胞经不同普遍存在的启动子驱动的hSLC6A1和mSLC6A1质粒转染。放大区段展示GAT-1被转运至预期细胞定位。

图5：A：被不同神经元特异性启动子驱动的mSLC6A1质粒转染的Neuro-2A细胞。B：放大区段展示GAT-1被转运至预期细胞定位。

图6：AD-HEK293细胞中的(A)HA标记的和(B)Myc标记的mSLC6A1和hSLC6A1的蛋白质印迹分析。示出各条件下的两个技术重复。还使用抗SLC6A1抗体检测(C)表位标记的蛋白质。C＝对照，1＝CAG-HA-hSLC6A1，2＝CAG-hSLC6A1-Myc，3＝CAG-Myc-hSLC6A1，4＝CAG-Myc-mSLC6A1，5＝CAG-mSLC6A1-Myc，H＝人类脑裂解物，M＝小鼠脑裂解物。

图7：(A)设计的构建体的示意性草图。在附图中，“h”＝人类，WT＝野生型，p＝蛋白质，IRES＝内部核糖体进入位点，tagRFP＝标记红色荧光蛋白，SV40＝来自猿猴病毒40的多腺苷酸化序列；(B)经转染的COS-7细胞中的氚化[³H]GABA摄取分析。结果显示为平均值+SD并且标准化至CAG-hSLC6A1-WT-IRES-tagRFP构建体。

图8：经转染的SHSY-5Y细胞中的氚化[³H]GABA摄取分析。细胞被含有AAV ITR(pAAV)的质粒转染，其中hSLC6A1表达由不同启动子驱动。结果显示为平均值+SD并且标准化至CAG-hSLC6A1-WT-IRES-tagRFP构建体。

图9：iPSCs衍生的NGN2神经元中的慢病毒转导。每个条件仅使用用于可视化GAT-1的通道显示一个代表性图像。

图10：(A)通过qPCR使用标准化至二倍体小鼠基因组的绝对数目的SV40pA(猿猴病毒40的多聚A信号)对病毒基因组拷贝进行绝对定量。结果显示为中位数+四分位数范围。(B)RNA表达分析。数据显示为针对所有组的平均表达按比例调整的相对表达。结果显示为几何平均值+几何SD。

图11：通过蛋白质印迹对来自右额叶皮质的样品进行蛋白质分析。小图A、C和E：表示测试的不同构建体中的GAT-1表达(n＝5)的蛋白质印迹。来自“对照AAV9”组和媒介物-PBS对照组的小鼠在所有三个图中相同。小图B、D和F为相应蛋白质印迹的定量数据，GAPDH用作上样对照和用于各GAT-1条带强度的标准化。结果显示为平均值+SD。将“对照AAV9”组用作按比例调整组。小图G：表示放置在一起的3种构建体的HA和GAPDH表达(上样对照)的蛋白质印迹。小图H：小图G中所示的蛋白质印迹重复两次并且对各样品数据进行定量，取平均值并且在此显示。结果显示为平均值+SD。

图12：在来自小鼠脑的矢状切片中针对GFAP(星形胶质细胞)、NeuN(神经元)和HA(人类GAT-1)的三重免疫标记。AF＝Alexa Fluor。

图13：在来自小鼠海马体的矢状切片中针对GFAP(星形胶质细胞)、NeuN(神经元)和HA(人类GAT-1)的三重免疫标记。AF＝Alexa Fluor。

图14：在来自小鼠大脑皮质的矢状切片中针对GFAP(星形胶质细胞)、NeuN(神经元)和HA(人类GAT-1)的三重免疫标记。AF＝Alexa Fluor。

图15：注射有媒介物-PBS(n＝11)、AAV9-PGK-HA-hSCL6A1(n＝8)、AAV9-ENDO-HA-hSCL6A1(n＝13)和AAV9-hDLX-HA-hSCL6A1(n＝9)的SLC6A1^+/S295L小鼠中的SWD的平均数目。在注射6周之后，在1pm与6pm之间的5个小时时间内持续7个连续日分析SWD。组之间的差异通过非参数单向ANOVA(Kruskal-Wallis检验)，随后Dunn事后多重比较检验(**p＜0.01；***p＜0.001；ns，不显著)来进行分析。

图16：(A)通过qPCR使用标准化至二倍体小鼠基因组的绝对数目的SV40pA(猿猴病毒40的多聚A信号)对病毒基因组拷贝进行绝对定量

结果显示为平均值+SD。组之间的差异(n＝10-15)通过非参数单向ANOVA(Kruskal-Wallis检验)，随后Dunn事后多重比较检验来进行分析。组之间未观察到显著差异。(B)人类SLC6A1的RNA表达分析。数据显示为针对所有组的平均表达按比例调整的相对表达。结果显示为几何平均值+几何SD。组之间的差异(n＝10-15)通过非参数单向ANOVA(Kruskal-Wallis检验)，随后Dunn事后多重比较检验(**p＜0.01；***p＜0.001；ns，不显著)来进行分析。

图17：通过蛋白质印迹对来自半内侧额叶皮质的样品进行蛋白质分析。小图A、B和C：表示来自所研究的不同病毒载体、PBS对照组和WT(野生型)组(n＝7-10)的GAT-1(SLC6A1)蛋白质表达的蛋白质印迹。来自WT(野生型)组和HET(SLC6A1^+/S295L小鼠)组的小鼠在所有三个图中相同。小图D、E和F为相应蛋白质印迹的定量数据，GAPDH用作上样对照并且用于各GAT-1条带强度的标准化。结果显示为平均值+SD。将WT组用作按比例调整组。小图G和H：表示放置在一起的3种病毒载体的HA和GAPDH表达(上样对照)的蛋白质印迹。小图I：小图G和小图H中表示的蛋白质印迹的合并定量。GAPDH用作上样对照并且用于各GAT-1条带强度的标准化。结果显示为平均值+SD。将PGK组用作按比例调整组用于比较启动子。数据使用单向ANOVA，随后Tukey多重比较检验(*p＜0.01，**p＜0.001，***p＜0.0001)来进行分析。

发明详述

现将参照特定的非限制性方面和其实施方案并且参考某些附图和实例描述本发明。

除非另外指示，否则技术术语根据其常见含义使用。如果向某些术语传递特定含义，则将在使用所述术语的上下文中给出术语的定义。

除非另外明确规定，否则当参考单数名词使用不定冠词或定冠词，例如“一个”、“一种”或“该”时，这包括该名词的复数。

如本文所用，术语“包含”不排除其他元素。出于本公开内容的目的，认为术语“由…组成”为术语“包含”的一个优选实施方案。

如本文所用，术语“治疗”、“医治”和其类似术语是指获得所要的药理学和/或生理学效果。该效果在完全或部分预防疾病或其症状方面可以是预防性的，和/或在部分或完全治愈疾病和/或可归因于该疾病的不良影响方面可以是治疗性的。因此疗法涵盖哺乳动物尤其人类的疾病的任何疗法，并且包括：(a)预防可能易患该疾病、但尚未诊断出患有该疾病的受试者(即人类)中出现该疾病；(b)抑制该疾病，即阻滞其发展；以及(c)缓解该疾病，即促使该疾病消退。

本发明提供一种核酸构建体，其包含编码以下的转基因：包含SEQ ID NO:18、19、20的γ丁酸(GABA)转运蛋白1(GAT-1)，或与SEQ ID NO:18、19或20具有至少95％序列同一性并且保留作为GAT-1的功能性的序列。

如本文所用，术语“转基因”是指核酸分子(或简称核酸并且在本文中可互换地使用)、编码用作基因疗法中的活性成分的基因产物的DNA或cDNA。基因产物可以是一种或多种肽或蛋白质。

在一个实施方案中，转基因为溶质载体家族6成员1(SLC6A1)基因。

SLC6A1基因位于SLC6A11基因(编码另一类型的GABA转运蛋白)与HRH1基因(编码组胺受体H1)之间的染色体3的短臂中(GRCh38基因组坐标：3:10,992,733-11,039,24810,992,748-11,039,247)。SLC6A1基因为约46.5千碱基(Kb)长并且包含18个外显子(https://www.ncbi.nlm.nih.gov/gene/6529)。存在产生人类GAT-1的3种剪接同种型(a,b和c)的五种主要变体，所述变体在外显子三至五的交替使用中彼此不同。对应于编码序列部分CDS的转录物ENST00000287766为人类SLC6A1的最长同种型并且被视为典型的(Hunt等人,2018)(图2)并且包含SEQ ID NO:15。因此，大部分基因变体映射至此序列中。已知遗传变体包括：包含SEQ ID NO:26的变体2，包含SEQ ID NO:27的变体3，包含SEQ ID NO:28的变体4和包含SEQ ID NO:29的变体5。

具体地，根据本发明的核酸构建体包含编码GAT-1、优选编码人类GAT-1的转基因，其中该转基因包含SEQ ID NO:15、26、27、28或29，更优选SEQ ID NO:15。

如本文所用，术语“GAT-1”是指γ丁酸(GABA)转运蛋白1(GAT-1)(也被称为GABA转运蛋白1；MAE；GAT1；GABATR；GABATHG(Uniprot编码：P30531)。GAT-1蛋白质由12个跨膜结构域构成，所述跨膜结构域聚集在一起以形成单链转运蛋白。人类SLC6A1的五种剪接变体产生GAT-1的三种剪接同种型：包含SEQ ID NO:18(被视为典型序列)的同种型a，其由分别包含SEQ ID NO:15和26的剪接变体1或2编码；包含SEQ ID NO:19的同种型b，其由包含SEQ IDNO:27的剪接变体3编码；和包含SEQ ID NO:20的同种型c，其由分别包含SEQ ID NO:28和29的剪接变体4或5编码。如本文所用，术语GAT-1是指本文所描述的GAT-1的所有变体和同种型(除非另外规定)。

因此，在一个实施方案中，核酸构建体包含编码γ丁酸(GABA)转运蛋白1(GAT-1)的转基因，所述γ丁酸(GABA)转运蛋白1(GAT-1)包含：

i.SEQ ID NO:18、19、20；或

ii.与SEQ ID NO:18或19或20具有至少95％或96％或97％或98％或99％或99.5％序列同一性并且保留作为GAT-1的功能性的序列；或

其中该转基因为溶质载体家族6成员1(SLC6A1)基因，其优选包含SEQ ID NO:15、26、27、28或29，更优选SEQ ID NO:15；或与SEQ ID NO:15、26、27、28或29具有至少95％或96％或97％或98％或99％或99.5％序列同一性的序列。

术语“核酸”和“多核苷酸”或“核苷酸序列”可互换使用以指由单体核苷酸构成或包含单体核苷酸的任何分子。核酸可以是寡核苷酸或多核苷酸。核苷酸序列可以是DNA或RNA。核苷酸序列可经化学修饰或人工修饰。核苷酸序列包括肽核酸(PNA)、吗啉和锁核酸(LNA)以及乙二醇核酸(GNA)和苏糖核酸(TNA)。这些序列中的每一个与天然存在的DNA或RNA的区别在于分子主链的变化。此外，可使用硫代磷酸酯核苷酸。其他脱氧核苷酸类似物包括可用于本发明的核苷酸中的甲基膦酸酯、氨基磷酸酯、二硫代磷酸酯、N3'P5'-氨基磷酸酯、以及寡核糖核苷酸硫代磷酸酯和其2'-0-烯丙基类似物和2'-0-甲基核糖核苷酸甲基膦酸酯。

此外，术语“核酸构建体”是指由使用重组DNA技术产生的非天然存在的核酸。尤其，核酸构建体是已被修饰以含有核酸序列区段的核酸分子，所述区段以自然界中不存在的方式合并或并接。

在特定实施方案中，所述核酸构建体包含编码核酸序列的全部或片段(至少1000、1100、1500、2000、2500或至少1500个核苷酸)，该编码核酸序列与GAT-1的天然存在或重组功能变体的编码序列具有至少70％、80％、90％、95％、99％或100％同一性。天然存在的GAT-1变体包括人类、灵长类动物、鼠类或其他哺乳动物已知的GAT-1，通常为包含SEQ IDNO:18、19或20的人类GAT-1。

如本文所用，术语“片段”是指参考序列的连续部分。例如，长度至少为1000个核苷酸的SEQ ID NO:18或19或20的片段是指SEQ ID NO:18或19或20的50或100或200或500或1000等个连续核苷酸。

如本文所用的术语“功能变体”或“天然存在的变体”是指已相对于参考序列经修饰但保留该参考序列的功能的核酸或氨基酸序列。例如，SLC6A1的功能变体保留编码GAT-1的能力。类似地，GAT-1的功能变体保留参考GAT-1的活性。参考SEQ ID NO:18，GAT-1的天然存在的变体显示于表3中并且参考SEQ ID NO:18包含一个或多个优选选自以下的突变：Ala2Thr；Asp165Tyr；Arg277Ser；Ile434Met；Arg579His；Gly5Ser；Arg172Cys；Arg277Cys；Ser470Cys；Pro580Ser；Asp10Asn；Arg172His；Arg277Pro；Ile471Val；Pro587Ala；Gly11Arg；Phe174Tyr；Ser280Cys；Gly476Ser；Ala589Val；Ile13Thr；Ser178Asn；Asn310Ser；Arg479Gln；Ile599Val；Glu16Lys；Asn181Asp；Tyr317His；Lys497Asn；Glu19Gly；Asn181Lys；Ile321Val；Phe502Tyr；Pro21Thr；Arg195His；Ser328Leu；Ile506Val；Lys33Glu；Met197Leu；Met332Val；Ala509Val；Val34Leu；Asp202Glu；Val337Ile；Thr520Met；Asp40Asn；Lys206Glu；His347Arg；Gly535Val；Met1的缺失；Glu411之后的终止密码子；Asp43Glu；Arg211Cys；Ala354Val；Leu547Phe；Lys76Asn；Ile220Val；Leu375Met；Met552Ile；Asn77Asp；Ile220Asn；Ile377Val；Met555Val；Ile84Phe；Ala221Thr；Ile405Val；Thr558Asn；Phe87Leu；Val240Ala；Val409Met；Arg566His；Ile91Val；Phe242Val；Leu415Ile；Gln572Arg；Val142Ile；Tyr246Cys；Arg417Cys；Pro573Thr；Thr156Asn；Arg257Cys；Arg417His；Pro573Ser；Thr158Pro；Arg257His；Arg419Cys；Ser574Asn；Asp165Asn；Thr260Met；Arg419His；或Val578Ile。

在一个优选实施方案中，该核酸构建体包含编码人类GAT-1的转基因，其中所述人类GAT-1包含SEQ ID NO:18或19或20，例如包含SEQ ID NO:15的转基因；或由与SEQ ID NO:15具有至少75％、至少80％或至少90％、至少95％或至少99％同一性的核苷酸序列组成的所述转基因的变体。在一个实施方案中，所述转基因的变体包含i)编码包含SEQ ID NO:18或19或20的GAT-1的一部分的核苷酸序列；或ii)与SEQ ID NO:15具有至少75％、至少80％或至少90％、至少95％或至少99％同一性并且保留与人类GAT-1基本上相同的GAT-1活性的核苷酸序列；或iii)天然存在的变体，其参考SEQ ID NO:18包含一个或多个优选选自以下的突变：Ala2Thr；Asp165Tyr；Arg277Ser；Ile434Met；Arg579His；Gly5Ser；Arg172Cys；Arg277Cys；Ser470Cys；Pro580Ser；Asp10Asn；Arg172His；Arg277Pro；Ile471Val；Pro587Ala；Gly11Arg；Phe174Tyr；Ser280Cys；Gly476Ser；Ala589Val；Ile13Thr；Ser178Asn；Asn310Ser；Arg479Gln；Ile599Val；Glu16Lys；Asn181Asp；Tyr317His；Lys497Asn；Glu19Gly；Asn181Lys；Ile321Val；Phe502Tyr；Pro21Thr；Arg195His；Ser328Leu；Ile506Val；Lys33Glu；Met197Leu；Met332Val；Ala509Val；Val34Leu；Asp202Glu；Val337Ile；Thr520Met；Asp40Asn；Lys206Glu；His347Arg；Gly535Val；Met1的缺失；Glu411之后的终止密码子；Asp43Glu；Arg211Cys；Ala354Val；Leu547Phe；Lys76Asn；Ile220Val；Leu375Met；Met552Ile；Asn77Asp；Ile220Asn；Ile377Val；Met555Val；Ile84Phe；Ala221Thr；Ile405Val；Thr558Asn；Phe87Leu；Val240Ala；Val409Met；Arg566His；Ile91Val；Phe242Val；Leu415Ile；Gln572Arg；Val142Ile；Tyr246Cys；Arg417Cys；Pro573Thr；Thr156Asn；Arg257Cys；Arg417His；Pro573Ser；Thr158Pro；Arg257His；Arg419Cys；Ser574Asn；Asp165Asn；Thr260Met；Arg419His；或Val578Ile。

如本文所用，术语“序列同一性”或“同一性”是指在两个多核苷酸或多肽序列比对的位置中匹配的数目(相同核酸或氨基酸残基)。序列同一性通过在对序列进行比对以最大化重叠和相同同时最小化序列间隙的情况下比较所述序列而确定。具体地，取决于两个序列的长度，可使用多种数学全域或局域比对算法中的任一种来确定序列同一性。类似长度的序列优选使用全局比对算法(例如，Needleman和Wunsch算法；Needleman和Wunsch,1970,J Mol Biol.；48(3):443-53)进行比对，其在整个长度上最佳地比对序列，而基本上不同长度的序列优选使用局域比对算法(例如，Smith和Waterman算法(Smith和Waterman,1981,JTheor Biol.；91(2):379-80)或Altschul算法(Altschul SF等人,1997,Nucleic AcidsRes.；25(17):3389-402.；Altschul SF等人,2005,Bioinformatics.；21(8):1451-6)进行比对。用于确定核酸或氨基酸序列同一性百分比的目的的比对可以以本领域中的技能内的各种方式实现，例如使用可在例如http://blast.ncbi.nlm.nih.gov/或http://www.ebi.ac.uk/Tools/emboss/的网际网站上获得的公开可用的电脑软件。本领域技术人员可测定用于测量比对的适当参数，包括用于实现所比较序列的全长内的最大比对所需的任何算法。出于本文的目的，核酸或氨基酸序列同一性％值是指使用逐对序列比对程序EMBOSS Needle产生的值，所述程序EMBOSS Needle使用Needleman-Wunsch算法来产生两个序列的最佳全域比对，其中所有搜寻参数均设定成预设值，即打分矩阵＝BLOSUM62，空位开口＝10，空位延伸＝0.5，末端空位罚分＝假，末端空位开口＝10，和末端空位延伸＝0.5。

根据本发明的核酸构建体包含转基因和至少适合于其例如在宿主中例如在宿主细胞中表达的核酸元件。

例如，所述核酸构建体包含编码GAT-1的转基因和相关宿主中GAT-1的表达所需的一个或多个控制序列。一般而言，核酸构建体包含转基因(例如编码GAT-1的转基因)和表达GAT-1所需的转基因之前(5'非编码序列)和之后(3'非编码序列)的调节序列。

因此，在特定实施方案中，所述核酸构建体至少包含(i)编码GAT-1的转基因和ii)可操作地连接至所述转基因的启动子。优选地，转基因在启动子的控制下。

如本文所用，术语“启动子”是指引导其可操作地连接的核酸的转录的调节元件。启动子可调节可操作地连接的核酸的转录速率和效率两者。启动子还可以可操作地连接至其它调节元件，所述调节元件增强(“强化子”)或抑制(“抑制子”)核酸的启动子依赖性转录。这些调节元件包括但不限于转录因子结合位点、抑制子和活化子蛋白结合位点，和本领域技术人员已知的并且直接或间接起作用以调控启动子的转录的量的任何其他核苷酸序列，包括例如衰减子、强化子和沉默子。启动子位于与其可操作地连接的基因或编码序列的转录起始位点附近、在相同链上并且在DNA序列上游(朝向有义链的5'区)。启动子可以是约100至1000个碱基对长。启动子中的位置相对于特定基因的转录起始位点指定(即，上游位置为从-1计数返回的负数值，例如，-100为上游100个碱基对的位置)。

如本文所用，术语“在5'至3'方向上可操作地连接”或简单地“可操作地连接”是指两个或更多个核苷酸序列以功能关系连接，其允许所述两个或更多个序列中的每一个执行其正常功能。通常，术语可操作地连接用于指例如启动子的调节元件和编码感兴趣的蛋白质的转基因的并置。例如，启动子与转基因之间的可操作连接允许启动子起作用以驱动转基因在合适的表达系统中(例如在细胞中)的5'表达。

通常，此类启动子可以是组织或细胞类型特异性启动子，或器官特异性启动子，或对多个器官具有特异性的启动子，或全身性或普遍存在的启动子。

如本文所用，术语“普遍存在的启动子”更具体地是指在多种不同细胞或组织中，例如在神经元和星形胶质细胞两者中具有活性的启动子。

适用于跨中枢神经系统表达转基因的启动子的实例包括：鸡β肌动蛋白(CBA)启动子(Miyazaki 1989,Gene 79:269-277)、CAG启动子(Niwa 1991,Gene 108:193-199)、延伸因子1α启动子(EF1α)(Nakai1998,Blood 91:4600-4607)、人类突触蛋白1基因启动子(hSyn)(Kugler S.等人,Gene Ther.2003.10(4):337-47)或磷酸甘油酸激酶1启动子(PGK1)(Hannan 1993,Gene 130:233-239)、甲基CPG结合蛋白2(MECP2)启动子(Adachi等人,Hum.Mol.Genetics.2005；14(23):3709-3722)、人类神经元特异性烯醇酶(NSE)启动子(Twyman,R.M.和E.A.Jones(1997).J Mol Neurosci 8(1):63-73))、钙/钙调蛋白依赖性蛋白质激酶II(CAMKII)启动子(Nathanson,J.L.等人,(2009).Neuroscience 161(2):441-450)和人类泛素C(UBC)启动子(Schorpp,M.等人,(1996).Nucleic Acids Res 24(9):1787-1788)。

在一个实施方案中，所述启动子包含SEQ ID NO:1，或优选在5'至3'方向上可操作地连接至SEQ ID NO:2的SEQ ID NO:1。

在一个实施方案中，所述启动子包含SEQ ID NO:3。

在一个优选实施方案中，所述启动子包含SEQ ID NO:4。

在一个实施方案中，所述启动子包含SEQ ID NO:5或SEQ ID NO:35或SEQ ID NO:6或优选在5'至3'方向上可操作地连接至SEQ ID NO:6的SEQ ID NO:35。

在一个实施方案中，所述启动子包含SEQ ID NO:7或优选在5'至3'方向上可操作地连接至SEQ ID NO:34的SEQ ID NO:7。

在一个实施方案中，所述启动子包含SEQ ID NO:8。

在一个实施方案中，所述启动子包含SEQ ID NO:9。

在一个实施方案中，所述启动子包含SEQ ID NO:10。

在一个实施方案中，所述启动子包含SEQ ID NO:11或优选在5'至3'方向上可操作地连接至SEQ ID NO:12的SEQ ID NO:11或优选在5'至3'方向上可操作地连接至SEQ IDNO:12的SEQ ID NO:11，其中SEQ ID NO:12在5'至3'方向上可操作地连接至SEQ ID NO:13。

在另一个优选实施方案中，所述启动子包含SEQ ID NO:14。

在替代实施方案中，核酸构建体至少包含(i)编码GAT-1的转基因和可操作地连接至所述转基因的启动子，其中所述启动子与以下至少90％、91％、92％、93％、94％、95％、96％、97％、98％、99％相同：

a.SEQ ID NO:1或在5'至3'方向上可操作地连接至SEQ ID NO:2的SEQ ID NO:1；或

b.SEQ ID NO:3；或

c.SEQ ID NO:4；或

e.SEQ ID NO:7或优选在5'至3'方向上可操作地连接至SEQ ID NO:34的SEQ IDNO:7；或

f.SEQ ID NO:8；或

g.SEQ ID NO:9；或

h.SEQ ID NO:10；或

i.SEQ ID NO:11或优选地在5'至3'方向上可操作地连接至SEQ ID NO:12的SEQID NO:11或优选在5'至3'方向上可操作地连接至SEQ ID NO:12的SEQ ID NO:11，其中SEQID NO:12在5'至3'方向上可操作地连接至SEQ ID NO:13；或

j.SEQ ID NO:14。

用于本发明的核酸构建体中的启动子可以是本文所描述的启动子的功能变体或片段。本文所描述的启动子的功能变体或片段可在保留对应非变体或全长启动子的特征的意义上具有功能性。因此，本文所描述的启动子的功能变体或片段保留驱动所述功能变体或片段可操作地连接的转基因转录的能力，由此驱动由所述转基因编码的GAT-1的表达。本文所描述的启动子的功能变体或片段可保留针对特定组织类型的特异性。例如，本文所描述的启动子的功能变体或片段可对CNS细胞具有特异性，例如内源hSLC6A1启动子。本文所描述的启动子的功能变体或片段可特异性地驱动神经元和/或星形胶质细胞中GAT-1的表达。

本发明中所用的启动子可包含“最小序列”，其应理解为具有足够长度的启动子的核苷酸序列并且其包含充当启动子(即能够驱动所述启动子可操作地连接的转基因的转录)的所需元件，由此驱动GAT-1的表达。

本发明的核酸构建体中所用的最小启动子可以是例如包含SEQ ID NO:1的启动子CAG或包含SEQ ID NO:5的EF1a启动子或包含SEQ ID NO:11的hDLX启动子。

本发明中所描述的启动子可包含一个或多个内含子。如本文所用，术语“内含子”是指基因内非编码核苷酸序列。通常，内含子在基因转录期间从DNA转录成信使RNA(mRNA)，但在其翻译之前通过剪接从mRNA转录物中切除。

本发明中所用的启动子可以包含本文所描述的内含子的功能变体或片段。本文中所描述的内含子的功能变体或片段可在保留对应非变体或全长内含子的特征的意义上具有功能性。因此，本文所描述的内含子的功能变体或片段是非编码的。本文所描述的内含子的功能变体或片段还可保留从DNA转录为mRNA的能力和/或通过剪接从mRNA切除的能力。

可掺入本发明中使用的启动子中的内含子可来自天然非编码区或经工程改造。

本发明中使用的内含子可以是a)嵌合内含子CBA/RbG内含子，其包含SEQ ID NO:2或其功能变体或片段或由其组成，所述其功能变体或片段与SEQ ID NO:2具有至少90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、99.5％或99.9％同一性；b)EF1a内含子，其包含SEQ ID NO:6或其功能变体或片段或由其组成，所述其功能变体或片段与SEQ IDNO:6具有至少90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、99.5％或99.9％同一性；或c)MECP2内含子，包含SEQ ID NO:34或其功能变体或片段或由其组成，所述其功能变体或片段与SEQ ID NO:34具有至少90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、99.5％或99.9％同一性；或d)hDLX内含子，其包含SEQ ID NO:13或其功能变体或片段或由其组成，所述其功能变体或片段与SEQ ID NO:13具有至少90％、91％、92％、93％、94％、95％、96％、97％、98％、99％、99.5％或99.9％同一性。

在一些实施方案中，本文所描述的启动子和/或内含子可与非表达外显子序列组合。非表达外显子序列不能够产生转录物而可能侧接内含子序列以提供剪接位点。

可替代地，用于本发明的启动子可以是化学诱导性启动子。如本文所用，化学诱导性启动子为通过向所述有需要的受试者体内施用化学诱导剂调节的启动子。合适的化学诱导性启动子的实例包括(不限于)四环素/米诺环素诱导性启动子(Chtarto 2003,NeurosciLett.352:155-158)或雷帕霉素诱导型系统(Sanftner 2006,Mol Ther.13:167-174)。

根据本发明的核酸构建体可进一步具有3'非翻译区，其通常含有多腺苷酸化信号序列和/或转录终止子。

如本文所用，术语“多腺苷酸化信号序列”(或本文中均可互换使用的“多腺苷酸化位点”或“多聚(A)信号”)是指在基因的3'非翻译区域(3'UTR)内的特异性识别序列，其转录为前体mRNA分子并且引导基因转录的终止。多腺苷酸化信号序列充当新形成的前体mRNA在其3'端的核酸内切酶裂解信号，并且用于添加至仅由腺嘌呤碱基组成的RNA延伸物的此3'端(多腺苷酸化过程；多聚(A)尾)。多腺苷酸化信号序列对于mRNA的核输出、翻译和稳定性是重要的。在本发明的上下文中，多腺苷酸化信号序列是可在哺乳动物细胞中指引哺乳动物基因和/或病毒基因多腺苷酸化的识别序列。

多腺苷酸化信号序列信号通常由以下组成：a)共有序列AAUAAA，其已显示为3'端裂解和前信使RNA(前mRNA)的多腺苷酸化以及促进下游转录终止所需的；和b)AAUAAA上游和下游的其他元件，其控制AAUAAA作为多聚(A)信号的利用效率。哺乳动物基因中这些基序存在相当大的变化性。

在一个实施方案中，任选地与上文或下文所描述的各种实施方案的一个或多个特征组合，本发明的核酸构建体的多腺苷酸化信号序列为哺乳动物基因或病毒基因的多腺苷酸化信号序列。合适的多腺苷酸化信号尤其包括SV40早期多腺苷酸化信号、SV40晚期多腺苷酸化信号、HSV胸苷激酶多腺苷酸化信号、鱼精蛋白基因多腺苷酸化信号、腺病毒5EIb多腺苷酸化信号、生长激素多腺苷酸化信号、PBGD多腺苷酸化信号、电脑模拟设计的多腺苷酸化信号(合成)等。

在一个特定实施方案中，核酸构建体包含编码以下的转基因：包含SEQ ID NO:18、19、20的γ丁酸(GABA)转运蛋白1(GAT-1)；或与SEQ ID NO:18、19或20具有至少95％或96％或97％或98％或99％或99.5％序列同一性并且保留作为GAT-1的功能性的序列，其中所述核酸构建体进一步包含可操作地连接至所述转基因的启动子，其中所述启动子优选包含：SEQ ID NO:1或优选在5'至3'方向上可操作地连接至SEQ ID NO:2的SEQ ID NO:1；或SEQID NO:3；或SEQ ID NO:4；或SEQ ID NO:5或SEQ ID NO:35或SEQ ID NO:6或优选在5'至3'方向上可操作地连接至SEQ ID NO:6的SEQ ID NO:35；或SEQ ID NO:7；或SEQ ID NO:8；或SEQ ID NO:9；或SEQ ID NO:10；或SEQ ID NO:11或在5'至3'方向上可操作地连接至SEQ IDNO:12的SEQ ID NO:11或优选在5'至3'方向上可操作地连接至SEQ ID NO:12的SEQ ID NO:11，其中SEQ ID NO:12在5'至3'方向上可操作地连接至SEQ ID NO:13；或SEQ ID NO:14；其中所述核酸构建体进一步包含多腺苷酸化信号序列，优选包含SV40多腺苷酸化信号序列，更优选包含含有SEQ ID NO:17的多腺苷酸化信号序列。优选地，转基因是溶质载体家族6成员1(SLC6A1)基因，其包含SEQ ID NO:15、26、27、28或29，更优选包含SEQ ID NO:15。

在一个最优选实施方案中，核酸构建体包含编码以下的转基因：包含SEQ ID NO:18、19、20的γ丁酸(GABA)转运蛋白1(GAT-1)；或与SEQ ID NO:18、19或20具有至少95％或96％或97％或98％或99％或99.5％序列同一性并且保留作为GAT-1的功能性的序列，其中所述核酸构建体进一步包含可操作地连接至所述转基因的启动子，其中所述启动子优选包含SEQ ID NO:4或SEQ ID NO:14；其中所述核酸构建体进一步包含多腺苷酸化信号序列，优选包含SV40多腺苷酸化信号序列，更优选包含含有SEQ ID NO:17的多腺苷酸化信号序列；其中所述转基因为溶质载体家族6成员1(SLC6A1)基因，其包含SEQ ID NO:15、26、27、28或29，更优选包含SEQ ID NO:15。

在一个实施方案中，提供一种核酸构建体，其包含编码γ丁酸(GABA)转运蛋白1(GAT-1)并且保留作为GAT-1的功能性的转基因，其中所述核酸构建体进一步包含可操作地连接至所述转基因的启动子，其中所述启动子优选包含SEQ ID NO:4或SEQ ID NO:14；其中所述核酸构建体进一步包含多腺苷酸化信号序列。

在一个实施方案中，提供一种核酸构建体，其包含编码γ丁酸(GABA)转运蛋白1(GAT-1)并且保留作为GAT-1的功能性的转基因，其中所述核酸构建体进一步包含可操作地连接至所述转基因的启动子，其中所述启动子优选包含SEQ ID NO:4或SEQ ID NO:14；其中所述核酸构建体进一步包含多腺苷酸化信号序列，优选包含SV40多腺苷酸化信号序列，更优选包含含有SEQ ID NO:17的多腺苷酸化信号序列。

在另一个实施方案中，编码γ丁酸(GABA)转运蛋白1(GAT-1)并且保留作为GAT-1的功能性的转基因进一步包含可操作地连接至所述转基因的启动子，其中所述启动子优选包含SEQ ID NO:4或SEQ ID NO:14；其中所述核酸构建体进一步包含多腺苷酸化信号序列，优选包含SV40多腺苷酸化信号序列，更优选包含含有SEQ ID NO:17的多腺苷酸化信号序列；并且其中编码γ丁酸(GABA)转运蛋白1(GAT-1)的转基因参考SEQ ID NO:18包含一个或多个突变，优选地选自以下的一个或多个突变：Ala2Thr；Asp165Tyr；Arg277Ser；Ile434Met；Arg579His；Gly5Ser；Arg172Cys；Arg277Cys；Ser470Cys；Pro580Ser；Asp10Asn；Arg172His；Arg277Pro；Ile471Val；Pro587Ala；Gly11Arg；Phe174Tyr；Ser280Cys；Gly476Ser；Ala589Val；Ile13Thr；Ser178Asn；Asn310Ser；Arg479Gln；Ile599Val；Glu16Lys；Asn181Asp；Tyr317His；Lys497Asn；Glu19Gly；Asn181Lys；Ile321Val；Phe502Tyr；Pro21Thr；Arg195His；Ser328Leu；Ile506Val；Lys33Glu；Met197Leu；Met332Val；Ala509Val；Val34Leu；Asp202Glu；Val337Ile；Thr520Met；Asp40Asn；Lys206Glu；His347Arg；Gly535Val；Met1的缺失；Glu411之后的终止密码子；Asp43Glu；Arg211Cys；Ala354Val；Leu547Phe；Lys76Asn；Ile220Val；Leu375Met；Met552Ile；Asn77Asp；Ile220Asn；Ile377Val；Met555Val；Ile84Phe；Ala221Thr；Ile405Val；Thr558Asn；Phe87Leu；Val240Ala；Val409Met；Arg566His；Ile91Val；Phe242Val；Leu415Ile；Gln572Arg；Val142Ile；Tyr246Cys；Arg417Cys；Pro573Thr；Thr156Asn；Arg257Cys；Arg417His；Pro573Ser；Thr158Pro；Arg257His；Arg419Cys；Ser574Asn；Asp165Asn；Thr260Met；Arg419His；Val578Ile。

核酸构建体还可包含其他调节元件，例如强化子序列、内含子、微小RNA靶向序列、促进DNA片段插入载体内的多连接子序列和/或剪接信号序列。

本发明进一步提供一种病毒载体，其包含如本文所描述的核酸构建体。

术语“病毒载体”通常是指如本文所公开的病毒颗粒的核酸部分，其可包装于衣壳中以形成病毒颗粒用于递送至宿主例如患者中。

本发明的病毒载体通常至少包含(i)核酸构建体，其包括转基因和适用于其在宿主中表达的核酸元件；和(ii)病毒基因组的全部或一部分，例如病毒基因组的至少反向末端重复序列。

如本文所用，术语“反向末端重复序列(ITR)”是指位于病毒的5'端(5'ITR)的核苷酸序列和位于病毒的3'端(3'ITR)的核苷酸序列，其含有回文序列并且可以折叠以形成在DNA复制起始期间充当引物的T形发夹结构。它们还是整合至宿主基因组中的病毒基因组所需的；用于从宿主基因组补救；以及用于将病毒核酸衣壳化为成熟病毒体。ITR是顺式用于载体基因组复制和将其包装至病毒颗粒中所需的。

在一个实施方案中，根据本发明的病毒载体包含病毒的5'ITR和3'ITR。

在一个实施方案中，病毒载体包含病毒的5'ITR和3'ITR，所述病毒独立地选自：细小病毒(具体地，腺相关病毒)、腺病毒、α病毒、逆转录病毒(具体地，γ逆转录病毒和慢病毒)、疱疹病毒和SV40；在一个优选实施方案中，病毒为腺相关病毒(AAV)、腺病毒(Ad)或慢病毒。更优选地为AAV。

在一个实施方案中，病毒载体包含AAV的5'ITR和3'ITR。

AAV作为一种用于人类基因疗法的潜在载体引起了人们极大关注。病毒的有利特性包括其与任何人类疾病的关联的缺乏，其能够感染分裂和非分裂细胞，以及可感染来源于不同组织的广泛细胞系。AAV基因组由含有4681个碱基的线性单链DNA分子构成(Berns和Bohenzky,1987,Advances in Virus Research(Academic Press,Inc.)32:243-307)。基因组包括每个末端处的反向末端重复序列(ITR)，其顺式充当DNA复制起点并且充当病毒的包装信号。ITR的长度为大约145bp。

本发明的病毒载体中的AAV ITR可具有野生型核苷酸序列或可通过一个或多个核苷酸的插入、缺失或取代而改变，其与已知AAV ITR相比通常具有不超过5、4、3、2或1个核苷酸插入、缺失或取代。AAV载体的反向末端重复序列(ITR)的血清型可选自任何已知人类或非人类AAV血清型。

在特定实施方案中，病毒载体可通过使用任何AAV血清型的ITR来进行。已知AAVITR包括(但不限于)AAV1、AAV2、AAV3(包括3A和3B型)、AAV-LK03、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10(AAVrh10)、AAV11、AAV12、禽类AAV、牛AAV、犬AAV、马AAV、绵羊AAV。还包括从灵长类动物大脑鉴定的重组血清型，例如Rec2和Rec3。

可替代地，本发明的病毒载体可包含合成5'ITR和/或3'ITR。

在一个实施方案中，上述核酸构建体包含于所述病毒载体中，所述病毒载体进一步包含血清型AAV2的AAV的5'ITR和3'ITR。在一个特定实施方案中，病毒载体包含血清型AAV2的AAV的5'ITR和3'ITR，优选SEQ ID NO:15和/或16，或与SEQ ID NO:15和/或16具有至少80％或至少90％同一性的序列。

在一个实施方案中，病毒载体包含如本文所描述的核酸构建体，其中所述病毒载体进一步包含位于所述核酸构建体5'和/或3'侧翼处的反向末端重复序列(ITR)，优选5'ITR和3'ITR。

在一个实施方案中，5'ITR和/或3'ITR包含天然腺相关病毒(AAV)的ITR，例如AAV2的ITR。

在一个优选实施方案中，5'ITR包含SEQ ID NO:22和/或3'ITR包含SEQ ID NO:23。

在一个特定实施方案中，病毒载体包含含有编码GAT-1的转基因的核酸构建体，所述GAT-1包含：

i.SEQ ID NO:18、19、20；或

ii.与SEQ ID NO:18、19或20具有至少95％或96％或97％或98％或99％或99.5％序列同一性并且保留作为GAT-1的功能性的序列；

其中核酸构建体进一步包含可操作地连接至所述转基因的启动子，其中所述启动子优选包含：

b.SEQ ID NO:3；或

c.SEQ ID NO:4；或

f.SEQ ID NO:8；或

g.SEQ ID NO:9；或

h.SEQ ID NO:10；或

j.SEQ ID NO:14；

其中所述核酸构建体进一步包含多腺苷酸化信号序列，优选包含SV40多腺苷酸化信号序列，更优选包含含有SEQ ID NO:17的多腺苷酸化信号序列；并且其中所述病毒载体进一步包含位于所述核酸构建体5'和/或3'侧翼处的反向末端重复序列(ITR)，优选5'ITR和3'ITR。

因此，在一个优选实施方案中，病毒载体包含含有编码GAT-1的转基因的核酸构建体，所述GAT-1包含：

a)SEQ ID NO:18、19、20；或

b)与SEQ ID NO:18、19或20具有至少95％或96％或97％或98％或99％或99.5％序列同一性并且保留作为GAT-1的功能性的序列；或

c)天然存在的变体，其参考SEQ ID NO:18包含一个或多个突变，所述突变优选选自：Ala2Thr；Asp165Tyr；Arg277Ser；Ile434Met；Arg579His；Gly5Ser；Arg172Cys；Arg277Cys；Ser470Cys；Pro580Ser；Asp10Asn；Arg172His；Arg277Pro；Ile471Val；Pro587Ala；Gly11Arg；Phe174Tyr；Ser280Cys；Gly476Ser；Ala589Val；Ile13Thr；Ser178Asn；Asn310Ser；Arg479Gln；Ile599Val；Glu16Lys；Asn181Asp；Tyr317His；Lys497Asn；Glu19Gly；Asn181Lys；Ile321Val；Phe502Tyr；Pro21Thr；Arg195His；Ser328Leu；Ile506Val；Lys33Glu；Met197Leu；Met332Val；Ala509Val；Val34Leu；Asp202Glu；Val337Ile；Thr520Met；Asp40Asn；Lys206Glu；His347Arg；Gly535Val；Met1的缺失；Glu411之后的终止密码子；Asp43Glu；Arg211Cys；Ala354Val；Leu547Phe；Lys76Asn；Ile220Val；Leu375Met；Met552Ile；Asn77Asp；Ile220Asn；Ile377Val；Met555Val；Ile84Phe；Ala221Thr；Ile405Val；Thr558Asn；Phe87Leu；Val240Ala；Val409Met；Arg566His；Ile91Val；Phe242Val；Leu415Ile；Gln572Arg；Val142Ile；Tyr246Cys；Arg417Cys；Pro573Thr；Thr156Asn；Arg257Cys；Arg417His；Pro573Ser；Thr158Pro；Arg257His；Arg419Cys；Ser574Asn；Asp165Asn；Thr260Met；Arg419His；或Val578Ile；

其中所述核酸构建体进一步包含可操作地连接至所述转基因的启动子，其中所述启动子优选包含：

b.SEQ ID NO:3；或

c.SEQ ID NO:4；或

f.SEQ ID NO:8；或

g.SEQ ID NO:9；或

h.SEQ ID NO:10；或

j.SEQ ID NO:14；

其中所述核酸构建体进一步包含多腺苷酸化信号序列，优选包含SV40多腺苷酸化信号序列，更优选包含含有SEQ ID NO:17的多腺苷酸化信号序列；并且其中所述病毒载体进一步包含位于所述核酸构建体5'和/或3'侧翼处的反向末端重复序列(ITR)，优选5'ITR和3'ITR；其中所述5'ITR包含SEQ ID NO:22和/或所述3'ITR包含SEQ ID NO:23。更优选地，转基因是溶质载体家族6成员1(SLC6A1)基因，其包含SEQ ID NO:15、26、27、28或29，更优选包含SEQ ID NO:15。

在一个优选实施方案中，本发明提供一种病毒载体，其包含含有编码以下的转基因的核酸构建体：

i.γ丁酸(GABA)转运蛋白1(GAT-1)，其包含SEQ ID NO:18、19、20；或

其中所述病毒载体进一步包含可操作地连接至所述转基因的启动子，其中所述启动子优选包含SEQ ID NO:4或SEQ ID NO:14；其中所述病毒载体中所包含的核酸构建体包含多腺苷酸化信号序列，并且其中所述病毒载体进一步包含位于所述核酸构建体5'和/或3'侧翼处的反向末端重复序列(ITR)，优选5'ITR和3'ITR。更优选地，转基因编码包含SEQID NO:18的γ丁酸(GABA)转运蛋白1(GAT-1)。

i.γ丁酸(GABA)转运蛋白1(GAT-1)，其包含SEQ ID NO:18、19、20；或

其中所述病毒载体进一步包含可操作地连接至所述转基因的启动子，其中所述启动子优选包含SEQ ID NO:4或SEQ ID NO:14；其中所述病毒载体中所包含的核酸构建体包含多腺苷酸化信号序列，优选包含SEQ ID NO:17的多腺苷酸化信号序列，并且其中所述病毒载体进一步包含位于所述核酸构建体5'和/或3'侧翼处的反向末端重复序列(ITR)，优选5'ITR和3'ITR。更优选地，转基因编码包含SEQ ID NO:18的γ丁酸(GABA)转运蛋白1(GAT-1)。

在一个优选实施方案中，本发明提供一种病毒载体，其包含含有转基因的核酸构建体，所述转基因为溶质载体家族6成员1(SLC6A1)基因，其中所述转基因优选包含：

i.SEQ ID NO:15、26、27、28或29，更优选SEQ ID NO:15；

其中所述病毒载体进一步包含可操作地连接至所述转基因的启动子，其中所述启动子优选包含SEQ ID NO:4或SEQ ID NO:14；其中所述病毒载体中所包含的核酸构建体包含多腺苷酸化信号序列，优选包含SEQ ID NO:17的多腺苷酸化信号序列，并且其中所述病毒载体进一步包含位于所述核酸构建体5'和/或3'侧翼处的反向末端重复序列(ITR)，优选5'ITR和3'ITR。更优选地，转基因编码包含SEQ IDNO:18的γ丁酸(GABA)转运蛋白1(GAT-1)。

转基因编码γ丁酸(GABA)转运蛋白1(GAT-1)并且保留作为GAT-1的功能性，其中核酸构建体进一步包含可操作地连接至所述转基因的启动子，其中所述启动子优选包含SEQ ID NO:4或SEQ ID NO:14；其中所述核酸构建体进一步包含多腺苷酸化信号序列，优选包含SV40多腺苷酸化信号序列，更优选包含含有SEQ ID NO:17的多腺苷酸化信号序列；其中编码γ丁酸(GABA)转运蛋白1(GAT-1)的转基因参考SEQ ID NO:18包含一个或多个突变，优选地选自以下的一个或多个突变：Ala2Thr；Asp165Tyr；Arg277Ser；Ile434Met；Arg579His；Gly5Ser；Arg172Cys；Arg277Cys；Ser470Cys；Pro580Ser；Asp10Asn；Arg172His；Arg277Pro；Ile471Val；Pro587Ala；Gly11Arg；Phe174Tyr；Ser280Cys；Gly476Ser；Ala589Val；Ile13Thr；Ser178Asn；Asn310Ser；Arg479Gln；Ile599Val；Glu16Lys；Asn181Asp；Tyr317His；Lys497Asn；Glu19Gly；Asn181Lys；Ile321Val；Phe502Tyr；Pro21Thr；Arg195His；Ser328Leu；Ile506Val；Lys33Glu；Met197Leu；Met332Val；Ala509Val；Val34Leu；Asp202Glu；Val337Ile；Thr520Met；Asp40Asn；Lys206Glu；His347Arg；Gly535Val；Met1的缺失；Glu411之后的终止密码子；Asp43Glu；Arg211Cys；Ala354Val；Leu547Phe；Lys76Asn；Ile220Val；Leu375Met；Met552Ile；Asn77Asp；Ile220Asn；Ile377Val；Met555Val；Ile84Phe；Ala221Thr；Ile405Val；Thr558Asn；Phe87Leu；Val240Ala；Val409Met；Arg566His；Ile91Val；Phe242Val；Leu415Ile；Gln572Arg；Val142Ile；Tyr246Cys；Arg417Cys；Pro573Thr；Thr156Asn；Arg257Cys；Arg417His；Pro573Ser；Thr158Pro；Arg257His；Arg419Cys；Ser574Asn；Asp165Asn；Thr260Met；Arg419His；Val578Ile。

本发明进一步提供一种病毒颗粒，其包含如本文中所描述的核酸构建体或病毒载体。

如本文所用，术语“病毒颗粒”涉及一种感染性并且通常复制缺陷型病毒颗粒，其包含(i)包装在其中的病毒载体(任选地包含含有转基因的核酸构建体)和(ii)衣壳。

在优选实施方案中，衣壳由腺相关病毒的衣壳蛋白形成。

腺相关病毒的病毒衣壳的蛋白质包括衣壳蛋白VP1、VP2和VP3。各种AAV血清型的衣壳蛋白序列之间的差异引起不同细胞表面受体用于进入细胞的用途。与替代性胞内加工途径组合，这产生每种AAV血清型的不同组织向性。

通常，AAV病毒在其血清型方面被提及。血清型对应于AAV的变体亚种，其由于衣壳表面抗原的表达谱具有独特反应性，这可用于将其与其他变体亚种区分开来。AAV血清型包括AAV1、AAV2、AAV3(包括A和B)、AAV-LK03、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10(AAVrh10)或AAV11或其组合，还包括从灵长类动物大脑鉴定的重组血清型，例如Rec2和Rec3。在本发明的病毒颗粒中，衣壳可衍生自任何AAV血清型和血清型组合(例如来自AAV的VP1和来自不同血清型的VP2和/或VP3)。

在特定实施方案中，用于根据本发明的病毒颗粒的衣壳蛋白的AAV血清型的实例包括AAV2、AAV5、AAV8、AAV9、AAV2-retro或AAVtt。

因此，在一个实施方案中，根据本发明的病毒颗粒至少包含来自AAV的VP1衣壳蛋白，其中所述衣壳蛋白优选包含AAV2、AAV5、AAV6、AAV8、AAV9(例如包含SEQ ID NO:25的AAV9.hu14)、AAV10、AAV-真型(AAVtt，例如包含SEQ ID NO:24)或其组合。

AAVtt详细描述于Tordo等人,Brain.2018；141(7):2014-2031和WO 2015/121501，其以全文引用的方式并入本文中。

AAV血清型和变体的综述可见于Choi等人(Curr Gene Ther.2005；5(3)；299-310)和Wu等人(Molecular Therapy.2006；14(3),316-327)中。

在一个优选实施方案中，病毒颗粒包含来自AAVtt的衣壳蛋白并且优选包含SEQID NO:24或其与SEQ ID NO:24至少98.5％、优选99％或99.5％相同。

在另一个优选实施方案中，病毒颗粒包含来自AAV9的衣壳蛋白并且优选包含SEQID NO:25或其与SEQ ID NO:25至少98.5％、优选99％或99.5％相同。

用于本发明的AAV基因组或包括ITR序列、rep或cap基因的AAV基因组的元件可衍生自AAV全基因组序列的以下登录号：腺相关病毒1NC_002077，AF063497；腺相关病毒2NC_001401；腺相关病毒3NC_001729；腺相关病毒3B NC_001863；腺相关5病毒4NC_001829；腺相关病毒5Y18065,5AF085716；腺相关病毒6NC_001862；禽类AAV ATCC VR-865AY186198、AY629583、NC_004828；禽类AAV株DA-1NC_006263、AY629583；牛AAV NC_005889、AY388617。

AAV病毒还可在分化枝或克隆方面被提及。这是指天然衍生的AAV病毒的系统发育关系，并且通常是指可追溯至共同祖先并且包括其所有后代的AAV病毒的系统发育群。另外，AAV病毒可在特定分离株，即自然界中发现的特定AAV病毒的基因分离株方面被提及。

术语基因分离株描述与其他天然存在的AAV病毒进行有限基因混合的AAV病毒的群体，由此在基因层面上定义可识别的独特群体。可用于本发明的AAV分化枝和分离株的实例包括：

·分化枝A:AAV1 NC_002077,AF063497,AAV6 NC_001862,Hu.48AY530611,Hu43AY530606,Hu 44AY530607,Hu 46AY530609；

·分化枝B:Hu.19AY530584,Hu.20AY530586,Hu 23AY530589,Hu22 AY530588,Hu24 AY530590,Hu21 AY530587,Hu27AY530592,Hu28 AY530593,Hu 29AY530594,Hu63AYS30624,Hu64AY530625,Hul3 AY530578,Hu56 AY530618,Hu57 AY530619,Hu49AY530612,Hu58 25AY530620,Hu34 AY530598,Hu35 AY530599,AAV2 NC_001401,Hu45 AY530608,Hu47AY530610,Hu51AY530613,Hu52 AY530614,Hu T41 AY695378,Hu S17 AY695376,Hu T88AY695375,Hu T71 AY695374,HuT70 AY695373,Hu T40AY695372,Hu T32 AY695371,Hu T17AY695370,Hu LG15AY695377；

·分化枝C:Hu9 AY530629,HulO AY530576,Hull AY530577,Hu53 AY530615,Hu55AY530617,Hu54 AY530616,Hu7 AY530628,Hul8 AY530583,Hul5 AY530580,Hul6AY530581,Hu25 AY530591,Hu60 AY530622,Ch5 AY243021,Hu3 AY530595,Hul AY530575,Hu4AY530602Hu2,AY530585,Hu61 AY530623；

·分化枝D:Rh62 AY530573,Rh48 AY530561,Rh54 AY530567,Rh55 AY530568,C5y2 AY243020,AAV7 AF513851,Rh35 AY243000,Rh37 AY242998,Rh36 AY242999,Cy6AY243016,Cy4 AY243018,Cy3 AY243019,Cy5 AY243017,Rhl3 AY243013；

·分化枝E:Rh38 AY530558,Hu66 AY530626,Hu42 AY530605,Hu67 AY530627,Hu40 AY530603,Hu41 AY530604,Hu37 AY530600,Rh40 10AY530559,Rh2 AY243007,BblAY243023,Bb2 AY243022,RhlO AY243015,Hul7 AY530582,Hub AY530621,Rh25 AY530557,Pi2 AY530554,Pil AY530553,Pi3 AY530555,Rh57 AY530569,Rh50AY530563,Rh49AY530562,Hu39 AY530601,Rh58 AY530570,Rhbl AY530572,Rh52AY530565,Rh53AY530566,Rh51 AY530564,Rh64AY530574,Rh43 15AY530560,AAV8 AF513852,Rh8AY242997,Rhl AY530556；和

·分化枝F:Hu 14(AAV9)AY530579,Hu31 AY530596,Hu32AY530597；ClonalIsolate AAV5 Y18065,AF085716,AAV 3NC_001729,AAV 3B NC_001863,AAV4 15NC_001829,Rh34AY243001,Rh33 AY243002,Rh32 AY243003。

本领域技术人员可基于其公知常识选择用于本发明的适当的AAV的血清型、变体、分化枝、克隆或分离株。然而，应理解，本发明还涵盖尚未鉴定或表征的其他血清型的AAV基因组的使用。

本发明涵盖在相同载体内来自不同AAV血清型、分化枝、克隆或分离株的衣壳蛋白序列的使用。本发明还涵盖将一种血清型的基因组包装至另一血清型的衣壳中，即假型包装。嵌合、改组或衣壳修饰的衍生物可经选择以提供一个或多个所需功能。因此，与包含天然存在的AAV衣壳(例如AAV2的AAV衣壳)的AAV病毒载体相比，这些衍生物可呈现增加的基因递送效率、降低的免疫原性(体液或细胞)、改变的向性范围和/或改良的特定细胞类型靶向。增加的基因递送效率可受细胞表面处改良的受体或共受体结合、改良的内化、改良的细胞内和至细胞核中的迁移、改良的病毒颗粒的脱壳和改良的单链基因组至双链形式的转化影响。增加的效率还可涉及改变的向性范围或特定细胞群体靶向，使得载体剂量不被施用至不需要其的组织来稀释。

嵌合衣壳蛋白包括通过天然存在的AAV血清型的两个或更多个衣壳编码序列之间的重组产生的那些嵌合衣壳蛋白。这可例如通过标记补救方法执行，其中一种血清型的非感染性衣壳序列被不同血清型的衣壳5序列共转染，并且使用定向选择来选择具有所需特性的衣壳序列。不同血清型的衣壳序列可通过细胞内的同源重组来改变，以产生新型嵌合衣壳蛋白。

嵌合衣壳蛋白还包括通过工程改造衣壳蛋白序列以在两种或更多种衣壳蛋白之间，例如在不同血清型的两种或更多种衣壳蛋白之间转移特定衣壳蛋白结构域、表面环或特定氨基酸残基所产生的那些嵌合衣壳蛋白。改组或嵌合衣壳蛋白还可通过DNA改组或通过易错PCR产生。可通过以下方式产生混合型AAV衣壳基因：将相关AAV基因的序列例如编码多种不同血清型的衣壳蛋白的那些序列随机分割并且随后在自引发聚合酶反应中重组所述片段，其还可在序列同源性区域中引起交叉。可筛选以此方式通过改组数种血清型的衣壳基因产生的混合型AAV基因文库以鉴定具有所需功能性的病毒克隆。类似地，易错PCR可用于随机突变AAV衣壳基因以产生不同变体文库，其可随后根据所需特性选择。

衣壳基因的序列还可被遗传修饰以相对于天然野生型序列引入特定缺失、取代或插入。具体地，衣壳基因可以通过将不相关蛋白质或肽的序列插入衣壳编码序列的开放阅读框架内或衣壳编码序列的N端和/或C端处进行修饰。不相关蛋白质或肽可有利地是充当特定细胞类型的配体的蛋白质或肽，由此赋予改良的与靶细胞的结合或改善病毒颗粒靶向特定细胞群体的特异性。不相关蛋白质还可以是作为生产过程的一部分帮助纯化病毒颗粒的蛋白质，即表位或亲和标签。插入位点通常将被选择以不干扰病毒颗粒的其他功能，例如病毒颗粒的内化、迁移。本领域技术人员可基于其公知常识鉴定适用于插入的位点。特定位点公开于上文提及的Choi等人中。

在一些实施方案中，根据本发明的病毒颗粒可通过将来源于特定AAV血清型的AAV载体/基因组的病毒载体或工程改造病毒载体包装在由对应于相同特定血清型的AAV的天然Cap蛋白质形成的病毒颗粒中来制备。然而，已开发出几种技术来修饰和改善天然存在的病毒颗粒的结构和功能特性。(Bünning H等人,J Gene Med 2008；10:717-733)。因此，在另一个实施方案中，根据本发明的病毒颗粒包含含有侧接给定AAV血清型的ITR的编码GAT-1的转基因的核酸构建体，其被包装至例如：a)由衍生自相同或不同AAV血清型的衣壳蛋白构成的病毒颗粒，例如AAV2 ITR和AAV9衣壳蛋白；AAV2 ITR和AAVtt衣壳蛋白；b)由来自不同AAV血清型或突变体的衣壳蛋白的混合物构成的镶嵌病毒颗粒，例如AAV2 ITR与由两种或更多种AAV血清型的蛋白形成的衣壳；c)由已通过不同AAV血清型或变体之间的结构域交换截短的衣壳蛋白构成的嵌合病毒颗粒，例如AAV2 ITR与具有AAV3结构域的AAV5衣壳蛋白；或d)病毒颗粒，其经工程改造以展示选择性结合结构域，使得能够与靶细胞特异性受体进行严格相互作用。

靶向CNS的基于AAV的基因疗法已综述于Pignataro D,Sucunza D,Rico AJ等人,JNeural Transm 2018；125:575-589中。更具体地，可选择和/或工程改造AAV颗粒以至少靶向脑和CNS的神经元和小神经胶质细胞。

在特定实施方案中，用于根据本发明的AAV病毒颗粒的衣壳蛋白的AAV血清型的实例包括AAV2、AAV5、AAV6、AAV8、AAV9(例如包含SEQ ID NO:25)、AAV10、AAV-真型(AAVtt，例如包含SEQ ID NO:24)或其组合。在更优选实施方案中，所述衣壳蛋白的AAV血清型选自AAV9或AAVtt血清型。

还被命名为AAV2-真型衣壳的AAVtt衣壳描述于例如WO2015/121501中。在一个实施方案中，AAVtt VP1衣壳蛋白包含至少一个相对于野生型AAV VP1衣壳蛋白的氨基酸取代，其位置与AAV2蛋白序列(NCBI参考序列：YP_680426.1)中的以下位置中的一个或多个对应：125、151、162、312、457、492、499、533、546、548、585，588和/或593，更具体地，AAVtt包含相对于野生型AAV2 VP1衣壳蛋白(NCBI参考序列：YP_680426.1)的以下氨基酸取代中的一个或多个：V125I、V151A、A162S、T205S、N312S、Q457M、S492A、E499D、F533Y、G546D、E548G、R585S、R588T和/或A593S。在一个特定实施方案中，AAVtt在位置457、492、499和533处包含相对于野生型AAV2 VP1衣壳蛋白的四个或更多个突变。

在一个特定实施方案中，任选地与本文所描述的各种实施方案的一个或多个特征组合，病毒颗粒包含如上文所描述的病毒载体，其优选地包含核酸构建体，所述核酸构建体包含编码γ丁酸(GABA)转运蛋白1(GAT-1)的转基因，所述γ丁酸(GABA)转运蛋白1(GAT-1)包含i)SEQ ID NO:18、19、20；或ii)与SEQ ID NO:18、19或20具有至少95％或96％或97％或98％或99％或99.5％序列同一性并且保留作为GAT-1的功能性的序列；或iii)天然存在的变体，其参考SEQ ID NO:18包含一个或多个突变，所述突变优选选自：Ala2Thr；Asp165Tyr；Arg277Ser；Ile434Met；Arg579His；Gly5Ser；Arg172Cys；Arg277Cys；Ser470Cys；Pro580Ser；Asp10Asn；Arg172His；Arg277Pro；Ile471Val；Pro587Ala；Gly11Arg；Phe174Tyr；Ser280Cys；Gly476Ser；Ala589Val；Ile13Thr；Ser178Asn；Asn310Ser；Arg479Gln；Ile599Val；Glu16Lys；Asn181Asp；Tyr317His；Lys497Asn；Glu19Gly；Asn181Lys；Ile321Val；Phe502Tyr；Pro21Thr；Arg195His；Ser328Leu；Ile506Val；Lys33Glu；Met197Leu；Met332Val；Ala509Val；Val34Leu；Asp202Glu；Val337Ile；Thr520Met；Asp40Asn；Lys206Glu；His347Arg；Gly535Val；Met1的缺失；Glu411之后的终止密码子；Asp43Glu；Arg211Cys；Ala354Val；Leu547Phe；Lys76Asn；Ile220Val；Leu375Met；Met552Ile；Asn77Asp；Ile220Asn；Ile377Val；Met555Val；Ile84Phe；Ala221Thr；Ile405Val；Thr558Asn；Phe87Leu；Val240Ala；Val409Met；Arg566His；Ile91Val；Phe242Val；Leu415Ile；Gln572Arg；Val142Ile；Tyr246Cys；Arg417Cys；Pro573Thr；Thr156Asn；Arg257Cys；Arg417His；Pro573Ser；Thr158Pro；Arg257His；Arg419Cys；Ser574Asn；Asp165Asn；Thr260Met；Arg419His；或Val578Ile；并且包含AAV9血清型或AAVtt血清型的衣壳蛋白，优选包含SEQ ID NO:24或与SEQ ID NO:24具有至少95％、96％、97％、98％、优选98.5％、更优选99％或99.5％同一性的氨基酸序列的AAVtt血清型的衣壳蛋白。

在另一个实施方案中，病毒颗粒包含含有核酸构建体的病毒载体，所述核酸构建体包含编码γ丁酸(GABA)转运蛋白1(GAT-1)的转基因，所述γ丁酸(GABA)转运蛋白1(GAT-1)包含i)SEQ ID NO:18、19、20；或ii)与SEQ ID NO:18、19或20具有至少95％或96％或97％或98％或99％或99.5％序列同一性并且保留作为GAT-1的功能性的序列；或iii)天然存在的变体，其参考SEQ ID NO:18包含一个或多个选自以下的突变：Ala2Thr；Asp165Tyr；Arg277Ser；Ile434Met；Arg579His；Gly5Ser；Arg172Cys；Arg277Cys；Ser470Cys；Pro580Ser；Asp10Asn；Arg172His；Arg277Pro；Ile471Val；Pro587Ala；Gly11Arg；Phe174Tyr；Ser280Cys；Gly476Ser；Ala589Val；Ile13Thr；Ser178Asn；Asn310Ser；Arg479Gln；Ile599Val；Glu16Lys；Asn181Asp；Tyr317His；Lys497Asn；Glu19Gly；Asn181Lys；Ile321Val；Phe502Tyr；Pro21Thr；Arg195His；Ser328Leu；Ile506Val；Lys33Glu；Met197Leu；Met332Val；Ala509Val；Val34Leu；Asp202Glu；Val337Ile；Thr520Met；Asp40Asn；Lys206Glu；His347Arg；Gly535Val；Met1的缺失；Glu411之后的终止密码子；Asp43Glu；Arg211Cys；Ala354Val；Leu547Phe；Lys76Asn；Ile220Val；Leu375Met；Met552Ile；Asn77Asp；Ile220Asn；Ile377Val；Met555Val；Ile84Phe；Ala221Thr；Ile405Val；Thr558Asn；Phe87Leu；Val240Ala；Val409Met；Arg566His；Ile91Val；Phe242Val；Leu415Ile；Gln572Arg；Val142Ile；Tyr246Cys；Arg417Cys；Pro573Thr；Thr156Asn；Arg257Cys；Arg417His；Pro573Ser；Thr158Pro；Arg257His；Arg419Cys；Ser574Asn；Asp165Asn；Thr260Met；Arg419His；Val578Ile；并且包含AAV9血清型或AAVtt血清型的衣壳蛋白，优选包含SEQ ID NO:24或与SEQ ID NO:24具有至少95％、96％、97％、98％、优选98.5％、更优选99％或99.5％同一性的氨基酸序列的AAVtt血清型的衣壳蛋白。

在另一个特定实施方案中，任选地与上文或下文所描述的各种实施方案的一个或多个特征组合，病毒颗粒包含如上文所描述的病毒载体，其优选地包含核酸构建体，所述核酸构建体包含编码γ丁酸(GABA)转运蛋白1(GAT-1)的转基因，所述γ丁酸(GABA)转运蛋白1(GAT-1)包含i)SEQ ID NO:18、19、20；或ii)与SEQ ID NO:18、19或20具有至少95％或96％或97％或98％或99％或99.5％序列同一性并且保留作为GAT-1的功能性的序列；或iii)天然存在的变体，其参考SEQ ID NO:18包含一个或多个突变，所述突变优选选自：Ala2Thr；Asp165Tyr；Arg277Ser；Ile434Met；Arg579His；Gly5Ser；Arg172Cys；Arg277Cys；Ser470Cys；Pro580Ser；Asp10Asn；Arg172His；Arg277Pro；Ile471Val；Pro587Ala；Gly11Arg；Phe174Tyr；Ser280Cys；Gly476Ser；Ala589Val；Ile13Thr；Ser178Asn；Asn310Ser；Arg479Gln；Ile599Val；Glu16Lys；Asn181Asp；Tyr317His；Lys497Asn；Glu19Gly；Asn181Lys；Ile321Val；Phe502Tyr；Pro21Thr；Arg195His；Ser328Leu；Ile506Val；Lys33Glu；Met197Leu；Met332Val；Ala509Val；Val34Leu；Asp202Glu；Val337Ile；Thr520Met；Asp40Asn；Lys206Glu；His347Arg；Gly535Val；Met1的缺失；Glu411之后的终止密码子；Asp43Glu；Arg211Cys；Ala354Val；Leu547Phe；Lys76Asn；Ile220Val；Leu375Met；Met552Ile；Asn77Asp；Ile220Asn；Ile377Val；Met555Val；Ile84Phe；Ala221Thr；Ile405Val；Thr558Asn；Phe87Leu；Val240Ala；Val409Met；Arg566His；Ile91Val；Phe242Val；Leu415Ile；Gln572Arg；Val142Ile；Tyr246Cys；Arg417Cys；Pro573Thr；Thr156Asn；Arg257Cys；Arg417His；Pro573Ser；Thr158Pro；Arg257His；Arg419Cys；Ser574Asn；Asp165Asn；Thr260Met；Arg419His；或Val578Ile，并且包含AAV9血清型或AAVtt血清型的衣壳蛋白，优选包含SEQ ID NO:25或与SEQ ID NO:25具有至少95％、96％、97％、98％、优选98.5％、更优选99％或99.5％同一性的氨基酸序列的AAV 9血清型的衣壳蛋白。

在另一个实施方案中，病毒颗粒包含含有核酸构建体的病毒载体，所述核酸构建体包含编码γ丁酸(GABA)转运蛋白1(GAT-1)的转基因，所述γ丁酸(GABA)转运蛋白1(GAT-1)包含i)SEQ ID NO:18、19、20；或ii)与SEQ ID NO:18、19或20具有至少95％或96％或97％或98％或99％或99.5％序列同一性并且保留作为GAT-1的功能性的序列；或iii)天然存在的变体，其参考SEQ ID NO:18包含一个或多个选自以下的突变：Ala2Thr；Asp165Tyr；Arg277Ser；Ile434Met；Arg579His；Gly5Ser；Arg172Cys；Arg277Cys；Ser470Cys；Pro580Ser；Asp10Asn；Arg172His；Arg277Pro；Ile471Val；Pro587Ala；Gly11Arg；Phe174Tyr；Ser280Cys；Gly476Ser；Ala589Val；Ile13Thr；Ser178Asn；Asn310Ser；Arg479Gln；Ile599Val；Glu16Lys；Asn181Asp；Tyr317His；Lys497Asn；Glu19Gly；Asn181Lys；Ile321Val；Phe502Tyr；Pro21Thr；Arg195His；Ser328Leu；Ile506Val；Lys33Glu；Met197Leu；Met332Val；Ala509Val；Val34Leu；Asp202Glu；Val337Ile；Thr520Met；Asp40Asn；Lys206Glu；His347Arg；Gly535Val；Met1的缺失；Glu411之后的终止密码子；Asp43Glu；Arg211Cys；Ala354Val；Leu547Phe；Lys76Asn；Ile220Val；Leu375Met；Met552Ile；Asn77Asp；Ile220Asn；Ile377Val；Met555Val；Ile84Phe；Ala221Thr；Ile405Val；Thr558Asn；Phe87Leu；Val240Ala；Val409Met；Arg566His；Ile91Val；Phe242Val；Leu415Ile；Gln572Arg；Val142Ile；Tyr246Cys；Arg417Cys；Pro573Thr；Thr156Asn；Arg257Cys；Arg417His；Pro573Ser；Thr158Pro；Arg257His；Arg419Cys；Ser574Asn；Asp165Asn；Thr260Met；Arg419His；Val578Ile；并且包含AAV9血清型或AAVtt血清型的衣壳蛋白，优选包含SEQ ID NO:25或与SEQ ID NO:25具有至少95％、96％、97％、98％、优选98.5％、更优选99％或99.5％同一性的氨基酸序列的AAV 9血清型的衣壳蛋白。

在一个优选实施方案中，病毒颗粒包含核酸构建体，其包含：

A)编码人类GAT-1的转基因；其中所述转基因包含SEQ ID NO:15、26、27、28或29，优选SEQ ID NO:15或编码人类GAT-1的序列，其中人类GAT-1包含i)SEQ ID NO:18、19或20；或ii)与SEQ ID NO:18、19或20具有至少95％或96％或97％或98％或99％或99.5％序列同一性并且保留作为GAT-1的功能性的序列；或iii)天然存在的变体，其参考SEQ ID NO:18包含一个或多个如表3中所示的突变；

B)可操作地连接至所述转基因的启动子；其中所述启动子包含CAG启动子或UbC启动子或PGK启动子或EF1a启动子或MECP2启动子或hNSE启动子或hSyn启动子或CamKII启动子或hDLX启动子或内源性人类SLC6A1启动子；其中所述启动子优选包含：

b.SEQ ID NO:3；或

c.SEQ ID NO:4；或

e.SEQ ID NO:7；或优选在5'至3'方向上可操作地连接至SEQ ID NO:34的SEQ IDNO:7；

f.SEQ ID NO:8；或

g.SEQ ID NO:9；或

h.SEQ ID NO:10；或

j.SEQ ID NO:14；

C)多腺苷酸化信号序列，优选SV40多腺苷酸化信号序列，更优选包含SEQ ID NO:17或与SEQ ID NO:17具有至少95％、96％、97％、98％、优选98.5％、更优选99％或99.5％同一性的序列或由其组成；

其中所述病毒颗粒优选包含AAVtt的衣壳蛋白，并且更优选包含SEQ ID NO:24或与SEQ ID NO:24具有至少95％、96％、97％、98％、优选98.5％、更优选99％或99.5％同一性的序列；其中所述核酸构建体包含于病毒载体中，所述病毒载体进一步包含5'ITR和3'ITR序列，优选腺相关病毒的5'ITR和3'ITR序列，更优选5'ITR和3'ITR序列，并且其中5'ITR和3'ITR序列中的每一个独立地包含序列SEQ ID NO:22或23或与SEQ ID NO:22和/或23具有至少80％或至少90％同一性的序列或由其组成，其中优选地5'ITR包含SEQ ID NO:22和/或3'ITR包含SEQ ID NO:23。

在另一个优选实施方案中，病毒颗粒包含核酸构建体，其包含：

A)编码人类GAT-1的转基因；其中所述转基因包含SEQ ID NO:15、26、27、28或29，优选SEQ ID NO:15；

B)可操作地连接至所述转基因的启动子；其中所述启动子包含PGK启动子或内源性人类SLC6A1启动子；其中所述启动子优选包含SEQ ID NO:4或SEQ ID NO:14；

C)多腺苷酸化信号序列；

其中所述病毒颗粒优选包含AAVtt的衣壳蛋白，并且更优选包含SEQ ID NO:24或与SEQ ID NO:24具有至少95％、96％、97％、98％、优选98.5％、更优选99％或99.5％同一性的序列；其中所述核酸构建体包含于病毒载体中，所述病毒载体进一步包含5'ITR和3'ITR序列，优选腺相关病毒的5'ITR和3'ITR序列，更优选5'ITR和3'ITR序列；并且其中5'ITR和3'ITR序列中的每一个独立地包含序列SEQ ID NO:22或23或与SEQ ID NO:22和/或23具有至少80％或至少90％同一性的序列或由其组成，其中优选地5'ITR包含SEQ ID NO:22和/或3'ITR包含SEQ ID NO:23。

A)编码人类GAT-1的转基因；其中所述转基因包含SEQ ID NO:15、26、27、28或29，优选SEQ ID NO:15或编码人类GAT-1的序列，其中人类GAT-1包含i)SEQ ID NO:18、19、20；或ii)与SEQ ID NO:18、19或20具有至少95％或96％或97％或98％或99％或99.5％序列同一性并且保留作为GAT-1的功能性的序列；或iii)天然存在的变体，其参考SEQ ID NO:18包含一个或多个如表3中所示的突变；

b.SEQ ID NO:3；或

c.SEQ ID NO:4；或

f.SEQ ID NO:8；或

g.SEQ ID NO:9；或

h.SEQ ID NO:10；或

j.SEQ ID NO:14；

其中所述病毒颗粒优选包含AAV9的衣壳蛋白，并且更优选包含SEQ ID NO:25或与SEQ ID NO:25具有至少95％、96％、97％、98％、优选98.5％、更优选99％或99.5％同一性的序列；其中所述核酸构建体包含于病毒载体中，所述病毒载体进一步包含5'ITR和3'ITR序列，优选腺相关病毒的5'ITR和3'ITR序列，更优选5'ITR和3'ITR序列；并且其中5'ITR和3'ITR序列中的每一个独立地包含序列SEQ ID NO:22或23或与SEQ ID NO:22和/或23具有至少80％或至少90％同一性的序列或由其组成，其中优选地5'ITR包含SEQ ID NO:22和/或3'ITR包含SEQ ID NO:23。

C)多腺苷酸化信号序列；

A)编码人类GAT-1的转基因；其中所述转基因包含SEQ ID NO:15、26、27、28或29，优选SEQ ID NO:15或与SEQ ID NO:15、26、27、28或29具有至少95％或96％或97％或98％或99％或99.5％序列同一性的序列；或

B)编码人类GAT-1的转基因，其中人类GAT-1包含i)SEQ ID NO:18、19或20；或ii)与SEQ ID NO:18、19或20具有至少95％或96％或97％或98％或99％或99.5％序列同一性并且保留作为GAT-1的功能性的序列；或iii)天然存在的变体，其参考SEQ ID NO:18包含一个或多个突变，所述突变优选选自：Ala2Thr；Asp165Tyr；Arg277Ser；Ile434Met；Arg579His；Gly5Ser；Arg172Cys；Arg277Cys；Ser470Cys；Pro580Ser；Asp10Asn；Arg172His；Arg277Pro；Ile471Val；Pro587Ala；Gly11Arg；Phe174Tyr；Ser280Cys；Gly476Ser；Ala589Val；Ile13Thr；Ser178Asn；Asn310Ser；Arg479Gln；Ile599Val；Glu16Lys；Asn181Asp；Tyr317His；Lys497Asn；Glu19Gly；Asn181Lys；Ile321Val；Phe502Tyr；Pro21Thr；Arg195His；Ser328Leu；Ile506Val；Lys33Glu；Met197Leu；Met332Val；Ala509Val；Val34Leu；Asp202Glu；Val337Ile；Thr520Met；Asp40Asn；Lys206Glu；His347Arg；Gly535Val；Met1的缺失；Glu411之后的终止密码子；Asp43Glu；Arg211Cys；Ala354Val；Leu547Phe；Lys76Asn；Ile220Val；Leu375Met；Met552Ile；Asn77Asp；Ile220Asn；Ile377Val；Met555Val；Ile84Phe；Ala221Thr；Ile405Val；Thr558Asn；Phe87Leu；Val240Ala；Val409Met；Arg566His；Ile91Val；Phe242Val；Leu415Ile；Gln572Arg；Val142Ile；Tyr246Cys；Arg417Cys；Pro573Thr；Thr156Asn；Arg257Cys；Arg417His；Pro573Ser；Thr158Pro；Arg257His；Arg419Cys；Ser574Asn；Asp165Asn；Thr260Met；Arg419His；或Val578Ile；

其中所述病毒颗粒包含AAVtt的衣壳蛋白，其优选包含SEQ ID NO:24或与SEQ IDNO:24具有至少95％、96％、97％、98％、优选98.5％、更优选99％或99.5％同一性的序列。

其中所述病毒颗粒包含AAV9的衣壳蛋白，其优选包含SEQ ID NO:25或与SEQ IDNO:25具有至少95％、96％、97％、98％、优选98.5％、更优选99％或99.5％同一性的序列。

重组AAV病毒颗粒的产生在本领域中通常已知并且已描述于例如US 5,173,414和US5,139,941；WO 92/01070、WO 93/03769、Lebkowski等人,(1988)Molec.Cell.Biol.8:3988-3996；Vincent等人,(1990)Vaccines 90(Cold Spring Harbor Laboratory Press)；Carter,B.J.(1992)Current Opinion in Biotechnology 3:533-539；Muzyczka,N.(1992)Current Topics in Microbiol.and Immunol.158:97-129；和Kotin,R.M.(1994)HumanGene Therapy 5:793-801。

如上文所描述的携带病毒载体和核酸构建体的病毒颗粒的产生可借助于常规方法和方案进行，所述方法和方案考虑针对待产生的病毒颗粒的实际实施方案所选择的结构特征加以选择。

简而言之，病毒颗粒可在用待包装的核酸构建体或病毒载体转染的宿主细胞中，更具体地在特定产生病毒的细胞(包装细胞)中，在辅助载体或病毒或其他DNA构建体的存在下产生。

如本文所用的术语“包装细胞”是指可经本发明的核酸构建体或病毒载体转染并且以反式提供病毒载体的完整复制和包装所需的所有缺失功能的细胞或细胞系。通常，包装细胞以组成性或诱导性方式表达所述缺失病毒功能中的一种或多种。所述包装细胞可以是黏附或悬浮细胞。

典型地，产生病毒颗粒的方法包括以下步骤：

a)在培养基中培养包含如上文所描述的核酸构建体或病毒载体的包装细胞；和

b)从所述细胞培养物上清液和/或在所述细胞内部收获所述病毒颗粒。

常规方法可用于产生病毒颗粒，其包括用携带编码GAT-1的转基因的核酸构建体或表达载体(例如质粒)；编码rep和cap基因但不携带ITR序列的核酸构建体(例如AAV辅助质粒)；和提供AAV复制所需的腺病毒功能的第三核酸构建体(例如质粒)进行瞬时细胞共转染。AAV复制所需的病毒基因在本文中被称为病毒辅助基因。通常，AAV复制所需的所述基因为腺病毒辅助基因，例如E1A、E1B、E2a、E4或VA RNA。优选地，腺病毒辅助基因为Ad5或Ad2血清型的腺病毒辅助基因。

还可例如通过用重组杆状病毒的组合感染昆虫细胞来进行根据本发明的AAV颗粒的大规模生产(Urabe等人,Hum.Gene Ther.2002；13:1935-1943)。SF9细胞被分别表达待包装的AAV rep、AAV cap和AAV载体的两种或三种杆状病毒载体共感染。重组杆状病毒载体将提供病毒复制和/或包装所需的病毒辅助基因功能。Smith等人2009(Molecular Therapy,vol.17,no.11,第1888-1896页)进一步描述用于昆虫细胞中AAV颗粒的大规模生产的双重杆状病毒表达系统。

合适的培养基将是本领域技术人员已知的。构成此类培养基的成分可取决于待培养细胞的类型而变化。除营养组成以外，摩尔渗透压浓度和pH值被视为培养基的重要参数。细胞生长培养基包含本领域技术人员熟知的多种成分，包括氨基酸、维生素、有机和无机盐、碳水化合物来源、脂质、微量元素(仅举几例，CuS04、FeS04、Fe(N03)3、ZnS04)，各成分以支持体外培养细胞(即细胞存活和生长)的量存在。成分还可包括不同辅助物质，例如缓冲物质(如碳酸氢钠、Hepes、Tris或类似性能缓冲液)、氧化稳定剂、抵消机械应力的稳定剂、蛋白酶抑制剂、动物生长因子、植物水解产物、抗结块剂、消泡剂。细胞生长培养基的特征和组成取决于特定细胞需求而变化。市售细胞生长培养基的实例为：MEM(最低基础培养基)、BME(基础Eagle培养基)DMEM(Dulbecco改良Eagle培养基)、Iscoves DMEM(Iscoves改良Dulbecco培养基)、GMEM、RPMI 1640、Leibovitz L-15、McCoy培养基199、Ham(Ham培养基)F10和衍生物，Ham F12、DMEM/F12等。

根据本发明使用的病毒载体的构建和产生的进一步指导可见于Viral Vectorsfor Gene Therapy,Methods and Protocols.Series:Methods in Molecular Biology,Vol.737.Merten和Al-Rubeai(Eds.)；2011Humana Press(Springer)；GeneTherapy.M.Giacca.2010Springer-Verlag；Heilbronn R.和Weger S.Viral Vectors forGene Transfer:Current Status of Gene Therapeutics.In:Drug Delivery,Handbookof Experimental Pharmacology 197；M.

(Ed.).2010Springer-Verlag；pp.143-170；Adeno-Associated Virus:Methods and Protocols.R.O.Snyder和P.Moulllier(Eds).2011Humana Press(Springer)；Bünning H.等人，Recentdevelopments in adeno-associated virus technology.J.Gene Med.2008；10:717-733；Adenovirus:Methods and Protocols.M.Chillón和A.Bosch(Eds.)；第3版.2014HumanaPress(Springer)。

本发明还涉及包含如上文所描述的核酸构建体或编码GAT-1的病毒载体的宿主细胞。更具体地，根据本发明的宿主细胞是特异性产生病毒的细胞，还被命名为包装细胞，其在辅助载体或病毒或其他DNA构建体的存在下被如上文所描述的核酸构建体或病毒载体转染，并且以反式提供病毒颗粒的完整复制和包装所需的所有缺失功能。所述包装细胞可以是黏附或悬浮细胞。

例如，所述包装细胞可以是真核细胞，例如哺乳动物细胞，包括猿猴、人类、犬和啮齿动物细胞。人类细胞的实例为PER.C6细胞(WO01/38362)、MRC-5(ATCC CCL-171)、WI-38(ATCC CCL-75)、HEK-293细胞(ATCC CRL-1573)、HeLa细胞(ATCC CCL2)和胚胎恒河猴肺细胞(ATCC CL-160)。非人类灵长类细胞的实例为Vero细胞(ATCC CCL81)、COS-1细胞(ATCCCRL-1650)或COS-7细胞(ATCC CRL-1651)。犬细胞的实例为MDCK细胞(ATCC CCL-34)。啮齿动物细胞的实例为仓鼠细胞，例如BHK21-F、HKCC细胞或CHO细胞。

作为哺乳动物来源的替代方案，用于产生病毒颗粒的包装细胞可衍生自禽类来源，例如鸡、鸭、鹅、鹌鹑或野鸡。禽类细胞系的实例包括禽类胚胎干细胞(WO01/85938和WO03/076601)、永生化鸭视网膜细胞(WO2005/042728)，和禽类胚胎干细胞源性细胞，包括鸡细胞(WO2006/108846)或鸭细胞，例如EB66细胞系(WO2008/129058和WO2008/142124)。

在另一个实施方案中，细胞可以是允许杆状病毒感染和复制的任何包装细胞。在一个特定实施方案中，所述细胞为昆虫细胞，例如SF9细胞(ATCC CRL-1711)、Sf21细胞(IPLB-Sf21)、MG1细胞(BTI-TN-MG1)或High Five^TM细胞(BTI-TN-5B1-4)。

因此，在一个特定实施方案中，任选地与上文或下文所描述的各种实施方案的一个或多个特征组合，宿主细胞包含：

a.包含编码如本文所描述的人类GAT-1的转基因的核酸构建体或病毒载体，

b.编码AAV rep和/或cap基因的核酸构建体，例如质粒，其不携带ITR序列；和任选地

c.包含病毒辅助基因的核酸构建体，例如质粒或病毒。

在另一方面中，本发明涉及被本文中所描述的病毒颗粒转导的宿主细胞，并且如本文所用的术语“宿主细胞”是指对感兴趣的病毒感染敏感并且能够体外培养的任何细胞系。

在一个其他方面中，本发明因此提供一种包含核酸构建体的质粒，所述核酸构建体包含：

A)编码人类GAT-1的转基因；其中所述转基因包含SEQ ID NO:15、26、27、28或29，优选SEQ ID NO:15或编码人类GAT-1的序列，其中人类GAT-1包含i)SEQ ID NO:18、19或20；或ii)与SEQ ID NO:18、19或20具有至少95％或96％或97％或98％或99％或99.5％序列同一性并且保留作为GAT-1的功能性的序列；或iii)天然存在的变体，其参考SEQ ID NO:18包含一个或多个突变，所述突变优选选自：Ala2Thr；Asp165Tyr；Arg277Ser；Ile434Met；Arg579His；Gly5Ser；Arg172Cys；Arg277Cys；Ser470Cys；Pro580Ser；Asp10Asn；Arg172His；Arg277Pro；Ile471Val；Pro587Ala；Gly11Arg；Phe174Tyr；Ser280Cys；Gly476Ser；Ala589Val；Ile13Thr；Ser178Asn；Asn310Ser；Arg479Gln；Ile599Val；Glu16Lys；Asn181Asp；Tyr317His；Lys497Asn；Glu19Gly；Asn181Lys；Ile321Val；Phe502Tyr；Pro21Thr；Arg195His；Ser328Leu；Ile506Val；Lys33Glu；Met197Leu；Met332Val；Ala509Val；Val34Leu；Asp202Glu；Val337Ile；Thr520Met；Asp40Asn；Lys206Glu；His347Arg；Gly535Val；Met1的缺失；Glu411之后的终止密码子；Asp43Glu；Arg211Cys；Ala354Val；Leu547Phe；Lys76Asn；Ile220Val；Leu375Met；Met552Ile；Asn77Asp；Ile220Asn；Ile377Val；Met555Val；Ile84Phe；Ala221Thr；Ile405Val；Thr558Asn；Phe87Leu；Val240Ala；Val409Met；Arg566His；Ile91Val；Phe242Val；Leu415Ile；Gln572Arg；Val142Ile；Tyr246Cys；Arg417Cys；Pro573Thr；Thr156Asn；Arg257Cys；Arg417His；Pro573Ser；Thr158Pro；Arg257His；Arg419Cys；Ser574Asn；Asp165Asn；Thr260Met；Arg419His；或Val578Ile；

b.SEQ ID NO:3；或

c.SEQ ID NO:4；或

e.SEQ ID NO:7；或优选在5'至3'方向上可操作地连接至SEQ IDNO:34的SEQ IDNO:7；或

f.SEQ ID NO:8；或

g.SEQ ID NO:9；或

h.SEQ ID NO:10；或

j.SEQ ID NO:14；

C)多腺苷酸化信号序列；

其中所述核酸构建体包含于病毒载体中，所述病毒载体进一步包含5'ITR和3'ITR序列，优选腺相关病毒的5'ITR和3'ITR序列，更优选5'ITR和3'ITR序列；并且其中5'ITR和3'ITR序列中的每一个独立地包含序列SEQ ID NO:22或23或与SEQ ID NO:22和/或23具有至少80％或至少90％同一性的序列或由其组成，其中优选地5'ITR包含SEQ ID NO:22和/或3'ITR包含SEQ ID NO:23。

优选地，多腺苷酸化序列为SV40多腺苷酸化信号序列，更优选包含SEQ ID NO:17或与SEQ ID NO:17具有至少95％、96％、97％、98％、优选98.5％、更优选99％或99.5％同一性的序列或由其组成。

在本发明的另一方面中，提供一种用于产生病毒颗粒的宿主细胞，其中所述病毒颗粒包含核酸构建体，所述核酸构建体包含：

b.SEQ ID NO:3；或

c.SEQ ID NO:4；或

f.SEQ ID NO:8；或

g.SEQ ID NO:9；或

h.SEQ ID NO:10；或

j.SEQ ID NO:14；

C)多腺苷酸化信号序列；

在此方面的一个实施方案中，宿主细胞进一步包含：

a.编码AAV rep和/或cap基因的核酸构建体，优选质粒，其不携带ITR序列；和任选地

b.包含病毒辅助基因的核酸构建体，例如质粒或病毒；

其中所述AAV rep和/或cap基因编码i)AAVtt的衣壳蛋白，并且更优选包含SEQ IDNO:24或与SEQ ID NO:24具有至少95％、96％、97％、98％、优选98.5％、更优选99％或99.5％同一性的序列；或ii)AAV9的衣壳蛋白，并且更优选包含SEQ ID NO:25或与SEQ IDNO:25具有至少95％、96％、97％、98％、优选98.5％、更优选99％或99.5％同一性的序列。

在本发明的另一方面中，提供一种产生病毒颗粒的方法，所述方法包括以下步骤：

a.培养包含核酸构建体的宿主细胞；和

b.从所述宿主细胞培养基和/或在所述宿主细胞内部收获所述病毒颗粒；

其中核酸构建体包含：

b.SEQ ID NO:3；或

c.SEQ ID NO:4；或

f.SEQ ID NO:8；或

g.SEQ ID NO:9；或

h.SEQ ID NO:10；或

j.SEQ ID NO:14；

C)多腺苷酸化信号序列；

本发明的另一方面涉及一种药物组合物，其包含与一种或多种药学上可接受的赋形剂、稀释剂或承载体组合的本文中所描述的核酸构建体或病毒载体或病毒颗粒或宿主细胞。

如本文所用，术语“药学上可接受”意指经监管机构或公认药典(例如欧洲药典)批准用于动物和/或人类。术语“赋形剂”是指与治疗剂一起施用的稀释剂、佐剂、承载体或媒介物。

任何合适的药学上可接受的承载体、稀释剂或赋形剂可用于制备药物组合物(参见例如Remington:The Science and Practice of Pharmacy,Alfonso R.Gennaro(编辑)Mack Publishing Company,1997年4月)。药物组合物在制造和储存条件下通常无菌并且稳定。药物组合物可配制为溶液(例如，盐水、右旋糖溶液或缓冲溶液或其他药学上可接受的无菌流体)、微乳液、脂质体或适合于容纳高产物浓度的其他有序结构(例如，微粒或纳米粒子)。承载体可以是含有例如水、乙醇、多元醇(例如，丙三醇、丙二醇和液体聚乙二醇等)和其合适的混合物的溶剂或分散介质。适当的流动性可以例如通过使用诸如卵磷脂的包衣、通过在分散液的情况下维持所需粒径和通过使用表面活性剂来维持。在许多情况下，在组合物中将优选包括等张剂，例如糖、多元醇(例如甘露醇、山梨糖醇)或氯化钠。

优选地，所述药物组合物被配制为溶液，更优选配制为任选缓冲的盐水溶液。补充的活性化合物还可并入本发明的药物组合物中。例如，可以在加拿大药剂师协会的医药和专业纲要(CPS)中找到关于另外的治疗剂的共同施用的指南。

在一个实施方案中，药物组合物是适用于脑实质内、大脑内、静脉内或鞘内施用的组合物。这些药物组合物仅为示例性的并且不限制适用于其他肠胃外和非肠胃外施用途径的药物组合物。本文所描述的药物组合物可以以单一单位剂量或以多剂量形式包装。

在本发明的一个优选实施方案中，提供一种药物组合物，其包含病毒颗粒以及一种或多种药学上可接受的赋形剂、稀释剂或承载体，其中所述病毒颗粒包含核酸构建体，所述核酸构建体包含：

k.SEQ ID NO:1或优选在5'至3'方向上可操作地连接至SEQ ID NO:2的SEQ IDNO:1；或

l.SEQ ID NO:3；或

m.SEQ ID NO:4；或

n.SEQ ID NO:5或SEQ ID NO:35或SEQ ID NO:6或优选在5'至3'方向上可操作地连接至SEQ ID NO:6的SEQ ID NO:35；或

o.SEQ ID NO:7；或优选在5'至3'方向上可操作地连接至SEQ ID NO:34的SEQ IDNO:7；或

p.SEQ ID NO:8；或

q.SEQ ID NO:9；或

r.SEQ ID NO:10；或

s.SEQ ID NO:11或在5'至3'方向上可操作地连接至SEQ ID NO:12的SEQ ID NO:11或优选在5'至3'方向上可操作地连接至SEQ ID NO:12的SEQ ID NO:11，其中SEQ ID NO:12在5'至3'方向上可操作地连接至SEQ ID NO:13；或

t.SEQ ID NO:14；

C)多腺苷酸化信号序列；

优选地，多腺苷酸化信号序列是SV40多腺苷酸化信号序列，更优选包含SEQ IDNO:17或与SEQ ID NO:17具有至少95％、96％、97％、98％、优选98.5％、更优选99％或99.5％同一性的序列或由其组成。

在另一个优选实施方案中，提供一种药物组合物，其包含与一种或多种药学上可接受的赋形剂、稀释剂或承载体组合的病毒颗粒，其中所述病毒颗粒包含核酸构建体，所述核酸构建体包含：

C)多腺苷酸化信号序列；

在另一个优选实施方案中，提供一种药物组合物，其包含与一种或多种药学上可接受的赋形剂、稀释剂或承载体组合的病毒颗粒，所述病毒颗粒包含核酸构建体，所述核酸构建体包含：

b.SEQ ID NO:3；或

c.SEQ ID NO:4；或

d.SEQ ID NO:5或SEQ ID NO:35或优选在5'至3'方向上可操作地连接至SEQ IDNO:6的SEQ ID NO:35；或

f.SEQ ID NO:8；或

g.SEQ ID NO:9；或

h.SEQ ID NO:10；或

j.SEQ ID NO:14；

C)多腺苷酸化信号序列；

在其他实施方案中，药物组合物包含与一种或多种药学上可接受的赋形剂、稀释剂或承载体组合的如本文所描述的病毒载体或核酸构建体。

本发明的其他方面提供用于疗法中的本文所描述的病毒颗粒、病毒载体或核酸构建体。

在一个方面中，本发明提供一种病毒颗粒或一种包含与一种或多种药学上可接受的赋形剂、稀释剂或承载体组合的所述病毒颗粒的药物组合物，所述病毒颗粒包含核酸构建体，所述核酸构建体包含：

A)编码人类GAT-1的转基因，其中所述转基因包含SEQ ID NO:15、26、27、28或29，优选SEQ ID NO:15或编码人类GAT-1的序列，其中人类GAT-1包含i)SEQ ID NO:18、19或20；或ii)与SEQ ID NO:18、19或20具有至少95％或96％或97％或98％或99％或99.5％序列同一性并且保留作为GAT-1的功能性的序列；或iii)天然存在的变体，其参考SEQ ID NO:18包含一个或多个突变，所述突变优选选自：Ala2Thr；Asp165Tyr；Arg277Ser；Ile434Met；Arg579His；Gly5Ser；Arg172Cys；Arg277Cys；Ser470Cys；Pro580Ser；Asp10Asn；Arg172His；Arg277Pro；Ile471Val；Pro587Ala；Gly11Arg；Phe174Tyr；Ser280Cys；Gly476Ser；Ala589Val；Ile13Thr；Ser178Asn；Asn310Ser；Arg479Gln；Ile599Val；Glu16Lys；Asn181Asp；Tyr317His；Lys497Asn；Glu19Gly；Asn181Lys；Ile321Val；Phe502Tyr；Pro21Thr；Arg195His；Ser328Leu；Ile506Val；Lys33Glu；Met197Leu；Met332Val；Ala509Val；Val34Leu；Asp202Glu；Val337Ile；Thr520Met；Asp40Asn；Lys206Glu；His347Arg；Gly535Val；Met1的缺失；Glu411之后的终止密码子；Asp43Glu；Arg211Cys；Ala354Val；Leu547Phe；Lys76Asn；Ile220Val；Leu375Met；Met552Ile；Asn77Asp；Ile220Asn；Ile377Val；Met555Val；Ile84Phe；Ala221Thr；Ile405Val；Thr558Asn；Phe87Leu；Val240Ala；Val409Met；Arg566His；Ile91Val；Phe242Val；Leu415Ile；Gln572Arg；Val142Ile；Tyr246Cys；Arg417Cys；Pro573Thr；Thr156Asn；Arg257Cys；Arg417His；Pro573Ser；Thr158Pro；Arg257His；Arg419Cys；Ser574Asn；Asp165Asn；Thr260Met；Arg419His；或Val578Ile；

B)可操作地连接至所述转基因的启动子；其中所述启动子包含CAG启动子、UbC启动子、PGK启动子、EF1a启动子、MECP2启动子、hNSE启动子、hSyn启动子、CamKII启动子、hDLX启动子或内源性人类SLC6A1启动子；其中所述启动子优选包含：

b.SEQ ID NO:3；或

c.SEQ ID NO:4；或

f.SEQ ID NO:8；或

g.SEQ ID NO:9；或

h.SEQ ID NO:10；或

j.SEQ ID NO:14；

C)多腺苷酸化信号序列；

其中所述病毒颗粒优选包含以下的衣壳蛋白：

1.AAVtt，并且更优选包含SEQ ID NO:24或与SEQ ID NO:24具有至少95％、96％、97％、98％、优选98.5％、更优选99％或99.5％同一性的序列；或

2.AAV9，并且更优选包含SEQ ID NO:25或与SEQ ID NO:25具有至少95％、96％、97％、98％、优选98.5％、更优选99％或99.5％同一性的序列；

其中所述核酸构建体包含于病毒载体中，所述病毒载体进一步包含5'ITR和3'ITR序列，优选腺相关病毒的5'ITR和3'ITR序列，更优选5'ITR和3'ITR序列；并且其中5'ITR和3'ITR序列中的每一个独立地包含序列SEQ ID NO:22或23或与SEQ ID NO:22和/或23具有至少80％或至少90％同一性的序列或由其组成，其中优选地5'ITR包含SEQ ID NO:22和/或3'ITR包含SEQ ID NO:23；其中病毒颗粒或包含病毒颗粒的药物组合物用于疗法中。

优选地，在疗法中的用途是用于治疗肌阵挛失张力癫痫症(MAE)、MEA样和其他癫痫症适应症，例如Lennox Gastaut综合征以及自闭症谱系障碍和精神分裂症或与GABA摄取受损相关的疾病或其组合。

在一个优选实施方案中，本发明提供一种病毒颗粒或一种包含与一种或多种药学上可接受的赋形剂、稀释剂或承载体组合的病毒颗粒的药物组合物，所述病毒颗粒包含核酸构建体，所述核酸构建体包含：

b.SEQ ID NO:3；或

c.SEQ ID NO:4；或

f.SEQ ID NO:8；或

g.SEQ ID NO:9；或

h.SEQ ID NO:10；或

j.SEQ ID NO:14；

C)多腺苷酸化信号序列；

其中所述病毒颗粒优选包含以下的衣壳蛋白：

其中所述核酸构建体包含于病毒载体中，所述病毒载体进一步包含5'ITR和3'ITR序列，优选腺相关病毒的5'ITR和3'ITR序列，更优选5'ITR和3'ITR序列；并且其中5'ITR和3'ITR序列中的每一个独立地包含序列SEQ ID NO:22或23或与SEQ ID NO:22和/或23具有至少80％或至少90％同一性的序列或由其组成，其中优选地5'ITR包含SEQ ID NO:22和/或3'ITR包含SEQ ID NO:23；其中病毒颗粒或包含病毒颗粒的药物组合物用于治疗由SLC6A1损伤导致的疾病，所述疾病包括单基因癫痫，例如伴有认知、运动行为共病的单基因癫痫；早发发育性和癫痫性脑病；癫痫性脑病；儿童期发作癫痫综合征；肌阵挛失张力癫痫(MAE)；MEA样和其他癫痫适应症；例如Lennox Gastaut综合征以及自闭症谱系障碍和精神分裂症或与GABA摄取受损相关的疾病或其组合。

在一个优选实施方案中，本发明提供一种病毒颗粒或一种包含与一种或多种药学上可接受的赋形剂、稀释剂或承载体组合的所述病毒颗粒的药物组合物，所述病毒颗粒包含核酸构建体，所述核酸构建体包含：

B)可操作地连接至所述转基因的启动子；其中所述启动子包含PGK启动子，优选包含SEQ ID NO:4，或内源性人类SLC6A1启动子，优选包含SEQ ID NO:14；

C)多腺苷酸化信号序列；

其中所述病毒颗粒优选包含以下的衣壳蛋白：

3.AAVtt，并且更优选包含SEQ ID NO:24或与SEQ ID NO:24具有至少95％、96％、97％、98％、优选98.5％、更优选99％或99.5％同一性的序列；或

4.AAV9，并且更优选包含SEQ ID NO:25或与SEQ ID NO:25具有至少95％、96％、97％、98％、优选98.5％、更优选99％或99.5％同一性的序列；

其中所述核酸构建体包含于病毒载体中，所述病毒载体进一步包含5'ITR和3'ITR序列，优选腺相关病毒的5'ITR和3'ITR序列，更优选5'ITR和3'ITR序列；并且其中5'ITR和3'ITR序列中的每一个独立地包含序列SEQ ID NO:22或23或与SEQ ID NO:22和/或23具有至少80％或至少90％同一性的序列或由其组成，其中优选地5'ITR包含SEQ ID NO:22和/或3'ITR包含SEQ ID NO:23；其中病毒颗粒或包含所述病毒颗粒的药物组合物用于治疗由SLC6A1损伤导致的疾病，所述疾病包括单基因癫痫，例如伴有认知、运动行为共病的单基因癫痫；早发发育性和癫痫性脑病；癫痫性脑病；儿童期发作癫痫综合征；肌阵挛失张力癫痫(MAE)；MEA样和其他癫痫适应症，例如Lennox Gastaut综合征以及自闭症谱系障碍和精神分裂症或与GABA摄取受损相关的疾病或其组合。

在另一个优选实施方案中，本发明提供一种病毒颗粒或一种包含与一种或多种药学上可接受的赋形剂、稀释剂或承载体组合的病毒颗粒的药物组合物，其中所述病毒颗粒包含核酸构建体，所述核酸构建体包含：

B)可操作地连接至所述转基因的启动子；

C)多腺苷酸化信号序列；

其中所述病毒颗粒优选包含以下的衣壳蛋白：

其中所述核酸构建体包含于病毒载体中，所述病毒载体进一步包含5'ITR和3'ITR序列；其中病毒颗粒或包含所述病毒颗粒的药物组合物用于治疗由SLC6A1损伤导致的疾病，所述疾病包含单基因癫痫，例如伴有认知、运动行为共病的单基因癫痫；早发发育性和癫痫性脑病；癫痫性脑病；儿童期发作癫痫综合征；肌阵挛失张力癫痫(MAE)；MEA样和其他癫痫适应症，例如Lennox Gastaut综合征以及自闭症谱系障碍和精神分裂症或与GABA摄取受损相关的疾病或其组合。

在另一方面中，本发明提供一种用于治疗以下疾病的方法：单基因癫痫，例如伴有认知、运动行为共病的单基因癫痫；早发发育性和癫痫性脑病；癫痫性脑病；儿童期发作癫痫综合征；肌阵挛失张力癫痫(MAE)；MEA样和其他癫痫适应症，例如Lennox Gastaut综合征以及自闭症谱系障碍和精神分裂症或与GABA摄取受损相关的疾病或其组合，所述方法包括向受试者施用治疗有效量的病毒颗粒或包含与一种或多种药学上可接受的赋形剂、稀释剂或承载体组合的病毒颗粒的药物组合物，所述病毒颗粒包含核酸构建体，所述核酸构建体包含：

A)编码人类GAT-1的转基因，其中所述转基因包含SEQ ID NO:15、26、27、28或29，优选SEQ ID NO:15或编码人类GAT-1的序列，其中人类GAT-1包含i)SEQ ID NO:18、19或20；或ii)与SEQ ID NO:18、19或20具有至少95％或96％或97％或98％或99％或99.5％序列同一性并且保留作为GAT-1的功能性的序列；或iii)天然存在的变体，其参考SEQ ID NO:18包含一个或多个突变，所述突变优选选自：Ala2Thr；Asp165Tyr；Arg277Ser；Ile434Met；Arg579His；Gly5Ser；Arg172Cys；Arg277Cys；Ser470Cys；Pro580Ser；Asp10Asn；Arg172His；Arg277Pro；Ile471Val；Pro587Ala；Gly11Arg；Phe174Tyr；Ser280Cys；Gly476Ser；Ala589Val；Ile13Thr；Ser178Asn；Asn310Ser；Arg479Gln；Ile599Val；Glu16Lys；Asn181Asp；Tyr317His；Lys497Asn；Glu19Gly；Asn181Lys；Ile321Val；Phe502Tyr；Pro21Thr；Arg195His；Ser328Leu；Ile506Val；Lys33Glu；Met197Leu；Met332Val；Ala509Val；Val34Leu；Asp202Glu；Val337Ile；Thr520Met；Asp40Asn；Lys206Glu；His347Arg；Gly535Val；Met1的缺失；Glu411之后的终止密码子；Asp43Glu；Arg211Cys；Ala354Val；Leu547Phe；Lys76Asn；Ile220Val；Leu375Met；Met552Ile；Asn77Asp；Ile220Asn；Ile377Val；Met555Val；Ile84Phe；Ala221Thr；Ile405Val；Thr558Asn；Phe87Leu；Val240Ala；Val409Met；Arg566His；Ile91Val；Phe242Val；Leu415Ile；Gln572Arg；Val142Ile；Tyr246Cys；Arg417Cys；Pro573Thr；Thr156Asn；Arg257Cys；Arg417His；Pro573Ser；Thr158Pro；Arg257His；Arg419Cys；Ser574Asn；Asp165Asn；Thr260Met；Arg419His；或Val578Ile；和

b.SEQ ID NO:3；或

c.SEQ ID NO:4；或

e.SEQ ID NO:7；或优选在5'至3'方向上可操作地连接至SEQ ID NO:34的SEQ IDNO:7；SEQ ID NO:8；或

f.SEQ ID NO:9；或

g.SEQ ID NO:10；或

h.SEQ ID NO:11或在5'至3'方向上可操作地连接至SEQ ID NO:12的SEQ ID NO:11或优选在5'至3'方向上可操作地连接至SEQ ID NO:12的SEQ ID NO:11，其中SEQ ID NO:12在5'至3'方向上可操作地连接至SEQ ID NO:13；或

i.SEQ ID NO:14；和

C)多腺苷酸化信号序列；

优选地，多腺苷酸化信号序列为SV40多腺苷酸化信号序列，更优选包含SEQ IDNO:17或与SEQ ID NO:17具有至少95％、96％、97％、98％、优选98.5％、更优选99％或99.5％同一性的序列或由其组成。

在一个优选实施方案中，本发明提供一种用于治疗以下疾病的方法：单基因癫痫，例如伴有认知、运动行为共病的单基因癫痫；早发发育性和癫痫性脑病；癫痫性脑病；儿童期发作癫痫综合征；肌阵挛失张力癫痫(MAE)；MEA样和其他癫痫适应症，例如LennoxGastaut综合征以及自闭症谱系障碍和精神分裂症或与GABA摄取受损相关的疾病或其组合，所述方法包括向受试者施用治疗有效量的病毒颗粒或包含与一种或多种药学上可接受的赋形剂、稀释剂或承载体组合的病毒颗粒的药物组合物，所述病毒颗粒包含核酸构建体，所述核酸构建体包含：

C)多腺苷酸化信号序列；

其中所述病毒颗粒优选包含以下的衣壳蛋白：

在另一个优选实施方案中，本发明提供一种用于治疗以下疾病的方法：单基因癫痫，例如伴有认知、运动行为共病的单基因癫痫；早发发育性和癫痫性脑病；癫痫性脑病；儿童期发作癫痫综合征；肌阵挛失张力癫痫(MAE)；MEA样和其他癫痫适应症，例如LennoxGastaut综合征以及自闭症谱系障碍和精神分裂症或与GABA摄取受损相关的疾病或其组合，所述方法包括向受试者施用治疗有效量的病毒颗粒或包含与一种或多种药学上可接受的赋形剂、稀释剂或承载体组合的病毒颗粒的药物组合物，所述病毒颗粒包含核酸构建体，所述核酸构建体包含：

A)编码人类GAT-1的转基因；其中所述转基因包含SEQ ID NO:15、26、27、28或29，优选SEQ ID NO:15或编码人类GAT-1的序列，其中人类GAT-1包含i)SEQ ID NO:18、19或20；或ii)与SEQ ID NO:18、19或20具有至少95％或96％或97％或98％或99％或99.5％序列同一性并且保留作为GAT-1的功能性的序列；或iii)天然存在的变体，其参考SEQ ID NO:18包含一个或多个突变，所述突变优选选自：Ala2Thr；Asp165Tyr；Arg277Ser；Ile434Met；Arg579His；Gly5Ser；Arg172Cys；Arg277Cys；Ser470Cys；Pro580Ser；Asp10Asn；Arg172His；Arg277Pro；Ile471Val；Pro587Ala；Gly11Arg；Phe174Tyr；Ser280Cys；Gly476Ser；Ala589Val；Ile13Thr；Ser178Asn；Asn310Ser；Arg479Gln；Ile599Val；Glu16Lys；Asn181Asp；Tyr317His；Lys497Asn；Glu19Gly；Asn181Lys；Ile321Val；Phe502Tyr；Pro21Thr；Arg195His；Ser328Leu；Ile506Val；Lys33Glu；Met197Leu；Met332Val；Ala509Val；Val34Leu；Asp202Glu；Val337Ile；Thr520Met；Asp40Asn；Lys206Glu；His347Arg；Gly535Val；Met1的缺失；Glu411之后的终止密码子；Asp43Glu；Arg211Cys；Ala354Val；Leu547Phe；Lys76Asn；Ile220Val；Leu375Met；Met552Ile；Asn77Asp；Ile220Asn；Ile377Val；Met555Val；Ile84Phe；Ala221Thr；Ile405Val；Thr558Asn；Phe87Leu；Val240Ala；Val409Met；Arg566His；Ile91Val；Phe242Val；Leu415Ile；Gln572Arg；Val142Ile；Tyr246Cys；Arg417Cys；Pro573Thr；Thr156Asn；Arg257Cys；Arg417His；Pro573Ser；Thr158Pro；Arg257His；Arg419Cys；Ser574Asn；Asp165Asn；Thr260Met；Arg419His；或Val578Ile；和

B)可操作地连接至所述转基因的启动子；和

C)多腺苷酸化信号序列；

其中所述病毒颗粒优选包含以下的衣壳蛋白：

其中所述核酸构建体包含于病毒载体中，所述病毒载体进一步包含5'ITR和3'ITR序列。

如本文中可互换使用的术语“受试者”或“患者”是指哺乳动物。可受益于所公开的治疗或用于疗法中的方法的哺乳动物物种包括但不限于人类、非人类灵长类动物，例如猿；黑猩猩；猴和红毛猩猩，家养动物，包括狗和猫，以及家畜，例如马、牛、猪、绵羊和山羊，或其他哺乳动物物种，包括但不限于小鼠、大鼠、豚鼠、兔、仓鼠等。优选地，术语“受试者”或“患者”是指人类受试者或人类患者并且甚至更优选地，所述人类受试者或人类患者为新生儿、婴儿、儿童或青少年。

“治疗有效量”是指一定量的病毒颗粒(包含转基因)，任选地在药物制剂内，或包含此类病毒颗粒的药物制剂的量，其在向哺乳动物或患者或受试者施用时实现所需治疗结果，例如以下治疗结果中的一种或多种：

·不同癫痫类型(例如失神、失张力/“跌落发作”、肌阵挛癫痫、全身性癫痫、单纯部分癫痫、发热性癫痫、婴儿痉挛或其组合)的显著减少；

·无癫痫发作的显著实现；

·发育延迟、语言受损、注意力不足过动症(ADHD)、刻板动作、自闭症和共济失调特征的显著减少。

在另一方面中，本发明提供病毒颗粒或包含与一种或多种药学上可接受的赋形剂、稀释剂或承载体组合的病毒颗粒的药物组合物在制备用于治疗以下疾病的药物中的用途：单基因癫痫，例如伴有认知、运动行为共病的单基因癫痫；早发发育性和癫痫性脑病；癫痫性脑病；儿童期发作癫痫综合征；肌阵挛失张力癫痫(MAE)；MEA样和其他癫痫适应症，例如Lennox Gastaut综合征以及自闭症谱系障碍和精神分裂症或与GABA摄取受损相关的疾病或其组合；其中所述病毒颗粒包含核酸构建体，所述核酸构建体包含：

b.SEQ ID NO:3；或

c.SEQ ID NO:4；或

f.SEQ ID NO:8；或

g.SEQ ID NO:9；或

h.SEQ ID NO:10；或

j.SEQ ID NO:14；和

C)多腺苷酸化信号序列；

在一个优选实施方案中，提供病毒颗粒或包含与一种或多种药学上可接受的赋形剂、稀释剂或承载体组合的病毒颗粒的药物组合物在制备用于治疗以下疾病的药物中的用途：单基因癫痫，例如伴有认知、运动行为共病的单基因癫痫；早发发育性和癫痫性脑病；癫痫性脑病；儿童期发作癫痫综合征；肌阵挛失张力癫痫(MAE)；MEA样和其他癫痫适应症，例如Lennox Gastaut综合征以及自闭症谱系障碍和精神分裂症或与GABA摄取受损相关的疾病或其组合；其中所述病毒颗粒包含核酸构建体，所述核酸构建体包含：

C)多腺苷酸化信号序列；

其中所述病毒颗粒优选包含以下的衣壳蛋白：

在另一个实施方案中，提供病毒颗粒或包含与一种或多种药学上可接受的赋形剂、稀释剂或承载体组合的病毒颗粒的药物组合物在制备用于治疗以下疾病的药物中的用途：单基因癫痫，例如伴有认知、运动行为共病的单基因癫痫；早发发育性和癫痫性脑病；癫痫性脑病；儿童期发作癫痫综合征；肌阵挛失张力癫痫(MAE)；MEA样和其他癫痫适应症，例如Lennox Gastaut综合征以及自闭症谱系障碍和精神分裂症或与GABA摄取受损相关的疾病或其组合；其中所述病毒颗粒包含核酸构建体，所述核酸构建体包含：

B)可操作地连接至所述转基因的启动子；和

C)多腺苷酸化信号序列；

其中所述病毒颗粒优选包含以下的衣壳蛋白：

以上方法和用途尤其适合于治疗伴有认知、运动行为共病的单基因癫痫；早发发育性和癫痫性脑病；癫痫性脑病；儿童期发作癫痫综合征；肌阵挛失张力癫痫(MAE)；MEA样和其他癫痫适应症，例如Lennox Gastaut综合征以及自闭症谱系障碍和精神分裂症或与GABA摄取受损相关的疾病或其组合。

在优选实施方案中，本文所公开的方法和用途优选还用于恢复GAT-1功能，更优选在GABA能突触处和/或沿轴突或神经纤维网或星形胶质细胞恢复GAT-1功能。

在另一个优选实施方案中，本文所公开的方法和用途优选还用于降低癫痫频率或用于恢复GAT-1功能并且降低癫痫频率。

如本文所用，还可通过已知基因突变来鉴定由SLC6A1损伤引起的疾病，其导致单基因癫痫，例如伴有认知、运动行为共病的单基因癫痫；早发发育性和癫痫性脑病；癫痫性脑病；儿童期发作癫痫综合征；肌阵挛失张力癫痫(MAE)；MEA样和其他癫痫适应症；例如Lennox Gastaut综合征以及自闭症谱系障碍和精神分裂症或与GABA摄取受损相关的疾病或其组合。

在一个实施方案中，由SLC6A1损伤引起的疾病与患者中的至少一种突变相关并且导致病理性GAT-1变体，其中所述病理性GAT-1变体包含突变或突变组合。

如本文所用，术语“病理性GAT-1变体”意指在患者样品中发现并且经由几种数据收集方法(包括临床测试、研究)鉴定，并且被报导与病理性表型相关的GAT-1变体，所述病理性表型例如为以下中的任一种：伴有认知、运动行为共病的单基因癫痫；早发发育性和癫痫性脑病；癫痫性脑病；儿童期发作癫痫综合征；肌阵挛失张力癫痫(MAE)；MEA样和其他癫痫适应症；例如Lennox Gastaut综合征以及自闭症谱系障碍和精神分裂症或与GABA摄取受损相关的疾病或其组合。

在一个优选实施方案中，所述突变参考SEQ ID NO:18包含一种或多种选自以下的突变：R44W、R44Q、R50L、D52E、D52V、F53S、S56F、G63S、N66D、G75R、G79R、G79V、F92S、G94E、G105S、Q106R、G112V、Y140C、C173Y、G232V、F270S、R277H、A288V、S295L、G297R、A305T、G307R、V323I、A334P、V342M、A357V、G362R、L366V、A367T、F385L、G393S、S456R、S459R、M487T、V511L、G550R或其组合。

这些突变还说明于下文实施例部分中的表2A和表2B中。

因此，在一个实施方案中，提供一种病毒颗粒或一种包含与一种或多种药学上可接受的赋形剂、稀释剂或承载体组合的病毒颗粒的药物组合物，其中所述病毒颗粒包含核酸构建体，所述核酸构建体包含：

B)可操作地连接至所述转基因的启动子；

C)多腺苷酸化信号序列；

其中所述病毒颗粒优选包含i)AAVtt的衣壳蛋白，并且更优选包含SEQ ID NO:24或与SEQ ID NO:24具有至少95％、96％、97％、98％、优选98.5％、更优选99％或99.5％同一性的序列；或ii)AAV9的衣壳蛋白，并且更优选包含SEQ ID NO:25或与SEQ ID NO:25具有至少95％、96％、97％、98％、优选98.5％、更优选99％或99.5％同一性的序列；

其中所述核酸构建体包含于病毒载体中，所述病毒载体进一步包含5'ITR和3'ITR序列；其中所述病毒颗粒或包含所述病毒颗粒的药物组合物用于治疗由SLC6A1损伤引起的疾病，所述疾病包括：单基因癫痫，例如伴有认知、运动行为共病的单基因癫痫；早发发育性和癫痫性脑病；癫痫性脑病；儿童期发作癫痫综合征；肌阵挛失张力癫痫(MAE)；MEA样和其他癫痫适应症，例如Lennox Gastaut综合征以及自闭症谱系障碍和精神分裂症或与GABA摄取受损相关的疾病或其组合；其中所述疾病由SLC6A1损伤引起与患者中的至少一种突变相关并且导致病理性GAT-1变体，其中所述病理性GAT-1变体包含突变或突变组合，并且其中所述突变参考SEQ ID NO:18优选包含一种或多种选自以下的突变：R44W、R44Q、R50L、D52E、D52V、F53S、S56F、G63S、N66D、G75R、G79R、G79V、F92S、G94E、G105S、Q106R、G112V、Y140C、C173Y、G232V、F270S、R277H、A288V、S295L、G297R、A305T、G307R、V323I、A334P、V342M、A357V、G362R、L366V、A367T、F385L、G393S、S456R、S459R、M487T、V511L、G550R或其组合。

在另一个实施方案中，病毒颗粒或药物组合物包含与一种或多种药学上可接受的赋形剂、稀释剂或承载体组合的病毒颗粒，其中所述病毒颗粒包含核酸构建体，所述核酸构建体包含：

B)可操作地连接至所述转基因的启动子，其中所述启动子为PGK启动子，优选包含SEQ ID NO:4，或内源性人类SLC6A1启动子，优选包含SEQ ID NO:14；

C)多腺苷酸化信号序列；

其中所述病毒颗粒优选包含i)AAVtt的衣壳蛋白，并且更优选包含SEQ ID NO:24或与SEQ ID NO:24具有至少95％、96％、97％、98％、优选98.5％、更优选99％或99.5％同一性的序列；或ii)AAV9的衣壳蛋白，并且更优选包含SEQ ID NO:25或与SEQ ID NO:25具有至少95％、96％、97％、98％、优选98.5％、更优选99％或99.5％同一性的序列；其中所述核酸构建体包含于病毒载体中，所述病毒载体进一步包含5'ITR和3'ITR序列；其中所述病毒颗粒或包含所述病毒颗粒的药物组合物用于治疗由SLC6A1损伤引起的疾病，所述疾病包括：单基因癫痫，例如伴有认知、运动行为共病的单基因癫痫；早发发育性和癫痫性脑病；癫痫性脑病；儿童期发作癫痫综合征；肌阵挛失张力癫痫(MAE)；MEA样和其他癫痫适应症，例如Lennox Gastaut综合征以及自闭症谱系障碍和精神分裂症或与GABA摄取受损相关的疾病或其组合；其中所述由SLC6A1损伤引起的疾病与患者中的至少一种突变相关并且导致病理性GAT-1变体，其中所述病理性GAT-1变体包含突变或突变组合，并且其中所述突变参考SEQID NO:18优选包含一种或多种选自以下的突变：R44W、R44Q、R50L、D52E、D52V、F53S、S56F、G63S、N66D、G75R、G79R、G79V、F92S、G94E、G105S、Q106R、G112V、Y140C、C173Y、G232V、F270S、R277H、A288V、S295L、G297R、A305T、G307R、V323I、A334P、V342M、A357V、G362R、L366V、A367T、F385L、G393S、S456R、S459R、M487T、V511L、G550R或其组合。

在另一个实施方案中，本发明提供一种用于治疗以下疾病的方法：单基因癫痫，例如伴有认知、运动行为共病的单基因癫痫，早发发育性和癫痫性脑病，癫痫性脑病，儿童期发作癫痫综合征，肌阵挛失张力癫痫(MAE)；MEA样和其他癫痫适应症，例如Lennox Gastaut综合征以及自闭症谱系障碍和精神分裂症或与GABA摄取受损相关的疾病或其组合，所述方法包括向受试者施用治疗有效量的病毒颗粒或包含与一种或多种药学上可接受的赋形剂、稀释剂或承载体组合的病毒颗粒的药物组合物，所述病毒颗粒包含核酸构建体，所述核酸构建体包含：

A)编码人类GAT-1的转基因；其中所述转基因包含SEQ ID NO:15、26、27、28或29，优选SEQ ID NO:15或编码人类GAT-1的序列，其中人类GAT-1包含i)SEQ ID NO:18、19或20；或ii)与SEQ ID NO:18、19或20具有至少95％或96％或97％或98％或99％或99.5％序列同一性并且保留作为GAT-1的功能性的序列；

B)可操作地连接至所述转基因的启动子；

C)多腺苷酸化信号序列；

其中所述核酸构建体包含于病毒载体中，所述病毒载体进一步包含5'ITR和3'ITR序列；其中所述由SLC6A1损伤引起的疾病与患者中的至少一种突变相关并且导致病理性GAT-1变体，其中所述病理性GAT-1变体包含突变或突变组合，并且其中所述突变参考SEQID NO:18优选包含一种或多种选自以下的突变：R44W、R44Q、R50L、D52E、D52V、F53S、S56F、G63S、N66D、G75R、G79R、G79V、F92S、G94E、G105S、Q106R、G112V、Y140C、C173Y、G232V、F270S、R277H、A288V、S295L、G297R、A305T、G307R、V323I、A334P、V342M、A357V、G362R、L366V、A367T、F385L、G393S、S456R、S459R、M487T、V511L、G550R或其组合。

在另一个实施方案中，本发明提供一种用于治疗以下疾病的方法：单基因癫痫，例如伴有认知、运动行为共病的单基因癫痫；早发发育性和癫痫性脑病；癫痫性脑病；儿童期发作癫痫综合征；肌阵挛失张力癫痫(MAE)；MEA样和其他癫痫适应症，例如Lennox Gastaut综合征以及自闭症谱系障碍和精神分裂症或与GABA摄取受损相关的疾病或其组合，所述方法包括向受试者施用治疗有效量的病毒颗粒或包含与一种或多种药学上可接受的赋形剂、稀释剂或承载体组合的病毒颗粒的药物组合物，所述病毒颗粒包含核酸构建体，所述核酸构建体包含：

C)多腺苷酸化信号序列；

本文所描述的治疗方法和在治疗中的用途可与丙戊酸盐和迄今已知的任何和所有其他潜在抗癫痫药物(AED)以及基于神经调节的治疗(迷走神经刺激、大脑深度刺激)和产酮饮食或类似者组合施用。

包括施用本发明的病毒颗粒或其进一步包含一种或多种药学上可接受的赋形剂、稀释剂或承载体的组合物的疗法的剂量可根据不同参数确定，尤其根据待治疗的患者的年龄、体重和病况；施用途径；和所需方案。医师将能够确定任何特定患者的所需施用途径和剂量。

本发明的核酸构建体、病毒载体、病毒颗粒或药物组合物可任选地通过目的特异性的施用装置的使用施用至患者的脑和/或脑脊髓液(CSF)。向脑的递送可选自大脑内递送、脑实质内递送、皮质内递送、海马体内递送、壳核内递送、小脑内递送和其组合。向CSF的递送可选自小脑延髓池内递送、鞘内递送、脑室内(ICV)递送和其组合。向患者的脑和/或脑脊髓液(CSF)的递送可通过注射进行。向脑的注射可选自大脑内注射、脑实质内注射、皮质内递送、海马体内递送、壳核内注射、小脑内递送和其组合。向CSF的递送可选自小脑延髓池内注射、鞘内注射、脑室内(ICV)注射和其组合。

本发明的核酸构建体、载体、病毒载体或药物组合物的剂量可以以单次剂量提供，但可在载体可能尚未靶向正确区域的情况下重复。治疗优选单次注射，但可考虑重复注射，例如在未来数年内重复注射和/或用不同AAV血清型重复注射。

本发明中所包括的序列显示于表1中：

表1

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

现将参照附图中示出的实施方案，借助于实施例进一步描述本发明。

实施例

实施例1：构建体设计、产生和克隆

本研究中使用的质粒通过重组DNA技术构建。AAV顺式主链质粒是从头合成的并且含有两个AAV反向末端重复序列(ITR)、卡那霉素抗性盒、原核复制起点和SV40多腺苷酸化序列。用方便的克隆限制位点从头合成编码GAT-1的同种型a的人类和小鼠SLC6A1 DNA序列(分别包含SEQ ID NO:15和31(或16))。使用方便的限制性位点从头合成个体启动子。从Integrated DNA Technologies^TM(Coralville,IA,USA)将人类流感血细胞凝集素(HA)或Myc标签(分别根据SEQ ID NO:33和32编码)合成为寡核苷酸并且如图3中所指示插入于氨基或羧基末端处。对人类和小鼠SLC6A1基因测试了四种不同的启动子。

实施例2：评估不同启动子下的SLC6A1表达

细胞培养

人源性AD-HEK293(Agilent Technologies^TM,Santa Clara,CA,USA)和小鼠源性Neuro-2A(ATCC^TM,Manassas,VA)细胞系在DMEM+10％ FBS+1％青霉素/链霉素(均来自Thermo Fisher Scientific^TM,Waltham,MA,USA)中传代。如先前描述通过向生长培养基中补充10μM视黄酸(MilliporeSigma^TM,Burlington,MA,USA)使Neuro-2A细胞分化72小时(Tremblay,R.G.等人,Differentiation of mouse Neuro 2A cells into dopamineneurons.J Neurosci Methods 186,60-67,doi:10.1016/j.jneumeth.2009.11.004(2010))。根据制造商的方案使用Lipofectamine 2000(Thermo Fisher Scientific^TM,Waltham,MA,USA)转染细胞。还包括不具有质粒的对照转染。

免疫荧光和显微术

成像实验在装备有20×物镜和Hamamatsu Orca 4闪光冷却单色相机(HamamatsuPhotonics KK^TM,Hamamatsu City,Japan)的Zeiss Axio Observer 7落射荧光显微镜(CarlZeiss AG^TM,Oberkochen,Germany)上进行。经转染的AD-HEK293和Neuro-2A细胞用4％多聚甲醛(Electron Microscopy Sciences,Hatfield,PA,19440)固定，并且用1:100的初级抗体兔单克隆抗GAT-1(Abcam^TM,Cambridge,MA,USA)或用1:100的兔多克隆抗GAT-1(CellSignalling Technology^TM,Danvers,MA,USA)进行染色。随后在成像之前用1:1,000的与Alexa Fluor 488或568缀合的山羊抗兔二级抗体对细胞进行染色。

如图4中所示，所有经转染的细胞均显示普遍存在的EF1a、PGK、UBC和CAG启动子控制下小鼠和人类转基因的稳健表达。使用CAG启动子观察到最强表达，如所预期的，使用PGK启动子观察到较低表达。

还分析了由不同神经元特异性启动子和CAG普遍存在的启动子驱动的mSLC6A1质粒转染的Neuro-2A转染细胞。如图5中所示，所有启动子均导致小鼠SLC6A1的表达；如所预期的，与强的和普遍存在的CAG启动子相比，神经元特异性启动子较弱。经转染的AD-HEK293和Neuro-2A的放大图像显示，从这些质粒表达的SLC6A1如所预期地定位至质膜(图4和5B)。

蛋白质印迹分析

根据制造商说明书，在含有1X Halt蛋白酶和磷酸酶抑制剂混合物(ThermoFisher Scientific^TM,Waltham,MA,USA)的1X细胞裂解缓冲液(Cell SignalingTechnology^TM,Danvers,MA,USA)中收获经转染的AD-HEK 293细胞。将补充有10％还原剂的十二烷基硫酸锂(LDS)样品缓冲液(均来自Thermo Fisher Scientific^TM,Waltham,MA,US)添加至蛋白质裂解物中直至1×最终浓度。样品通过1D SDS-PAGE凝胶电泳解析。对于各个样品，每个泳道装载30μg蛋白。使用半干式转移设备(Bio-Rad Laboratories^TM,HerculesCA)将蛋白质转移至硝酸纤维素膜(Li-Cor Biosciences^TM,Lincoln,NE,USA)。在转移之后，膜在室温下在封闭溶液(Li-Cor Biosciences^TM,Lincoln,NE,USA)中孵育1小时。膜随后与含有初级抗体的封闭溶液在4℃下孵育过夜。以下初级抗体用于此分析：1:1,000的兔单克隆抗GAT-1(Abcam^TM,Cambridge,MA,USA)、1:1,000的兔多克隆抗GAT-1(Cell SignallingTechnology^TM,Danvers,MA,USA)、1,1000的兔多克隆抗c-myc(MilliporeSigma^TM,Burlington,MA,USA)、1:1,000的兔单克隆抗HA(Cell Signalling Technology^TM,Danvers,MA,USA)、1:1,000的小鼠单克隆抗GAPDH(Thermo Fisher Scientific^TM,Waltham,MA,US)、1:1,000的兔单克隆抗GAPDH(Cell Signalling Technology^TM,Danvers,MA,USA)。膜用PBST溶液洗涤三次，放置于含有适用于在室温下在远红光谱上持续1小时的检测的IRDye 800CW或680LT山羊抗小鼠或山羊抗鸡二级抗体(1:15,000；Li-Cor Biosciences^TM,Lincoln,NE,USA)的封闭溶液中。使用Li-Cor Odyssey CLx远红成像器(Li-Cor Biosciences^TM,Lincoln,NE,USA)可视化蛋白质。

SLC6A1为具有12个跨膜结构域的膜蛋白并且被糖基化(Bennett,E.R.和B.I.Kanner.J Biol Chem.272,1203-1210,(1997))。在还原条件下SLC6A1单体的分子质量预测为约70kDa并且蛋白质通过蛋白质印迹检测为二聚体和高分子质量聚集体，这可能是由于其膜拓朴学和翻译后修饰。这与文献中对于SLC6A1所检测到的条带模式一致(Bennett,E.R.和B.I.Kanner.J Biol Chem.272,1203-1210,(1997))。在一些条件下在约28kDA的较低分子量处检测到的额外条带可能是SLC6A1的降解产物。使用GAPDH的检测作为上样对照。这些结果显示，通过由CAG启动子驱动的N端和C端标记的构建体实现稳健表达(图6)。当在人类和小鼠样品的脑裂解物(标记为H和M的图C泳道)中使用抗SLC6A1抗体检测所述蛋白时，还获得类似结果。

实施例3：病原性、可能病原性和天然存在的变体鉴定和分析

ClinVar数据库(https://www.ncbi.nlm.nih.gov/clinvar/)是一个可免费获取的关于人类变异和表型之间的关系的报导的公共档案，并且带有支持证据，其用于使用搜索术语“SLC6A1”和“病原性”或“可能病原性”以鉴定SLC6A1基因变体。病原性变体的列表由发表在科学同行综述文献中的突变补充，并且从PubMed(https://pubmed.ncbi.nlm.nih.gov/)搜索使用搜索术语“SLC6A1和突变”进行手动管理并且由作者将其定义为病原性，以鉴定ClinVar中未报导的其他SLC6A1病原性变体。

随后鉴定GAT-1蛋白质中由氨基酸变化产生的病原性和可能病原性变体(表2A)。通过读框移位或缺失氨基酸或导致产生终止密码子的突变产生的其他病原性变体显示于表2B中。

表2A

/>

表2B

除氨基酸变化所致的突变之外，可发生其他突变。所鉴定的一种类型的突变为涉及核苷酸的插入或缺失的突变，其中改变的碱基对的数目不可被三整除，由此引起新氨基酸的产生(读框移位，如表2B中的fs指示)。如果突变破坏正确读框，则突变之后的整个DNA序列将被不正确地读取。更具体地，如表2B中所指示的A358fs意指参考SEQ ID NO:18的位置358的丙氨酸由于核苷酸的读框移位而变化，产生具有不正确氨基酸序列的异常蛋白质产物。

所鉴定的另一类型的突变为移除蛋白质中的一个或多个氨基酸残基的DNA水平上的突变。此类型的突变在表2B中指示为缺失(del)。例如，F174del意指移除参考SEQ ID NO:18的位置174的苯丙氨酸，并且蛋白质将短1个氨基酸并且缺失Phe174。

最后，所鉴定的另一类型的突变为引入终止密码子(由表2B中的星号(*)指示)，其在本文中报导为例如C74*，此意指参考SEQ ID NO:18在位置74处的半胱氨酸处停止蛋白质翻译并且蛋白质将从此位置向前截短。

健康群体中天然存在的变体来源于gnomAD(基因组聚集数据库-https://gnomad.broadinstitute.org/v2.1.1)，其为一个公开可用的对照数据集，含有来自使用查询术语“SLC6A1”的无关个体的60,146个样品的遗传信息。从对照数据集提取的变体包括错义，引起氨基酸变化，开始损失变体(导致AUG起始密码子的损失的DNA序列中的点突变，引起GAT-1的减少或消除)和终止获得变体(DNA序列中的点突变，其产生新的终止密码子，最终引起GAT-1的减少)。产生氨基酸变化的天然存在的变体报导于表3中。

表3

/>

实施例4：病毒颗粒产生

AAV产生

含有AAV2 Rep序列接着为AAV9.hu14(以下称为AAV9)或AAV-真型(以下称为AAVtt)衣壳序列(其氨基酸序列分别为SEQ ID NO:24和25)的反式质粒通过ATUM^TM(Newark,CA,USA)从头合成。AAV辅助质粒pALD-X80购自Aldevron,LLC^TM(Fargo,ND,USA)。

通过三重转染方法产生非复制AAV载体。在烧瓶中以3.0E+05-3.5E+05个细胞/毫升的接种密度使用Expi293表达培养基(Thermo Fisher^TM,Waltham,MA,USA)每3至4天传代Expi293细胞(Thermo Fisher^TM,Waltham,MA,USA)。在实验开始之前的最后传代中，细胞在2×1,000mL摇瓶中以每病毒制剂220mL的总工作体积以3.5E+05个细胞/毫升传代。使用Vi-Cell Blu(Beckman Coulter^TM,Pasadena,CA,USA)计算活细胞密度。在转染前一天，以1.5E+06个细胞/毫升接种摇瓶。

如下为每个烧瓶创建转染复合物：在1.5mL OptiPRO无血清培养基(ThermoFisher^TM,Waltham,MA,USA)中稀释1mg/mL的180μL聚乙烯亚胺(PEI)MAX(PolysciencesInc^TM,Warrington,PA,USA)，在设定8下涡旋震荡四次并且在室温下孵育5分钟。分别地，在1.5mL OptiPRO无血清培养基中稀释20μg顺式质粒(CAG-hSLC6A1)、30μg Rep/Cap质粒(AAV9或AAV-tt)和40μg辅助质粒(pALD-X80)，在设定8下涡旋震荡四次并且在室温下孵育5分钟。然后将这些两种混合物合并，在设定8下涡旋震荡四次并且在室温下孵育15分钟。随后将转染复合物添加至含有细胞的摇瓶中。在37℃下在以125rpm的恒定搅拌下将细胞与转染混合物一起培养。

在96小时之后，烧瓶用AAV裂解缓冲液加标至1×最终浓度(150mM NaCl、120mMTris-HCl[pH＝8.0]、2mM MgCl2、0.1％ Triton X-100)和Benzonase(MilliporeSigma^TM,Burlington,MA,USA)至50U/mL最终浓度。在37℃下在以125rpm的恒定搅拌下孵育此混合物1小时。通过在23℃下在2,250×g下离心20分钟使混合物澄清。样品储存在-80℃下直至进一步分析。

AAV效价测定

从-80℃移出每个样品并且使其在室温下解冻15分钟。一旦将样品解冻，将其短暂涡旋震荡并且离心一分钟。在此之后，将10μL样品添加至96孔PCR板的个体孔中，与10×DNA酶缓冲液、50U DNA酶和无DNA酶水(均来自Promega^TM,Madison,WI,USA)组合至每个孔中的总体积为100μL。

随后将板转移至Bio-Rad^TM(Hercules,CA,USA)热循环仪并且在37℃下加热30分钟，随后冷却至4℃。随后如表4中所描述连续稀释样品。

表4

五(5)μL稀释液D2、D3、D4和D5与20μL ddPCR主混合物混合至最终浓度为1X，所述主混合物由Supermix for Probes(无dUTP；Bio-Rad^TM,Hercules,CA,USA)、正向引物GATCCAGACATGATAAGATACATTG、反向引物GCAATAGCATCACAAATTTCAC、探针6-Fam/Zen/3'IBFQ:TGGACAAACCACAACTAGAATGCA和无DNA酶水组成。每个样品在96孔PCR板中一式两份地操作。

用箔片覆盖物热密封板，进行脉冲涡旋震荡，并且以1,000×g离心5分钟。将板放置于Bio-Rad^TMQX-200液滴产生器中并且根据制造商说明书产生液滴。

在液滴产生之后，使用箔片覆盖物热密封板并且放置于经程序化以运行表5中所描述的循环的Bio-Rad^TM热循环器中。

表5

完成后，将板放置于Bio-Rad^TMQX200液滴中用于根据制造商说明书进行液滴读取。载体基因组的浓度(VG/mL)使用下式进行定量：

VG/ML:X＝[(aY)(1000/b)]D

其中：

X为VG/mL；

a为ddPCR反应物体积(25μl)；

Y为每微升拷贝中的ddPCR读出；

b为ddPCR中的稀释剂载体的体积(5μL)；

D为施加至测试材料的总稀释度。

测定验收准则如下定义：

重复之间的％CV必须为≤15％；如果＞15％，则可省略一个离群值。如果省略一个离群值并且％CV保持＞15％，则需要重复测定。内部稀释％CV需要≤20％并且报导的稀释度需要至少两次连续稀释。如果％CV＞20％，则可省略稀释度，只要所报导的稀释度为至少两次连续稀释。如果平均稀释度仍＞20％，则需要重复测定。每个反应孔需要具有≥1,000个可接受的液滴。如果＜10,000个液滴，则从分析中排除孔。

通过AAV衣壳ELISA定量病毒颗粒

使用针对AAV9和AAV2设计的AAV滴定ELISA试剂盒(PROGEN^TMBiotechnik GmbH,Heidelberg,Germany)，根据制造商说明书确定每个构建体的病毒颗粒效价。对于AAV9，将小鼠单克隆ADK9抗体用于捕获与检测步骤两者。对于AAVTT，将A20R单克隆抗体用于捕获和检测步骤两者。在各步骤之间使用Molecular Devices^TM(San Jose,CA,USA)AquaMax 4000微孔板洗涤器在所提供的1×测定缓冲液(ASSB)中进行洗涤。用MolecularDevices^TMSpectraMax M5e酶标仪检测样品。从标准曲线内推衣壳效价并且报导于表6中。

表6

通过ddPCR获得的病毒基因组效价和通过ELISA获得的衣壳效价指示可成功地产生AAV9和AAVTT病毒颗粒，所述病毒颗粒包含病毒载体，所述病毒载体具有包含可操作地连接至人类SLC6A1转基因的CAG启动子的核酸。

实施例5：突变形式的SLC6A1的体外GABA摄取

产生包含CAG启动子的表达hSLC6A1-WT序列或稍后所描述的突变形式的不同工具质粒(病原性变体：S295L、A288V、F270S，还参见实施例3)。所有质粒经由内部核糖体进入位点(IRES)系统编码荧光蛋白(tagRFP)，允许表达2种独立蛋白质(图7A)。后者允许确认在条件之间类似的转染水平。

将COS7细胞(猴纤维母细胞样细胞系)接种在闪烁微量板上并且使用Lipofectamine 2000并且遵循制造商说明书使用上文所描述的工具质粒转染。在转染后2天，用落射荧光显微镜检查基于tagRFP报导基因的转染水平。所有转染条件均类似(数据未示出)。随后将COS7细胞提交至GABA摄取测定。简而言之，将细胞洗涤并且在37℃下用特异性GAT-1抑制剂(CI-966(Tocris,Cat No 1296)，最终浓度为1％DMSO中100μM)或单独用媒介物(1％ DMSO)处理10分钟。细胞随后在37℃下用氚化和冷的GABA([3H]GABA 10μCi/ml和15μMGABA最终浓度)的混合物处理10分钟并且在使用Microbeta仪器(PerkinElmer)定量放射活性之前，使用1mM冷GABA停止反应。

如图7B中所示，相比于野生型SLC6A1，所描述的SLC6A1的病原性变体在功能性GABA摄取测定中显示出显著减少。

实施例6：不同启动子下的SLC6A1介导的GABA摄取

使用Lipofectamine 3000并且按照制造商说明书，用实施例1中所描述的构建体转染SH-SY5Y细胞(人类神经母细胞瘤细胞系)。阳性对照由编码与tagRFP荧光蛋白同时作为阴性对照(以及缺乏hSLC6A1序列的匹配质粒)一起表达的处于CAG启动子的控制下hSLC6A1的质粒组成。转染后2天，SH-SY5Y细胞经测试用于GABA摄取测定的ICC分析。简而言之，ICC分析如下进行：将细胞用4％多聚甲醛固定并且用1:250的初级抗体兔单克隆抗GAT-1(Ref:ab177483；Abcam^TM,Cambridge,MA,USA)染色。然后在成像之前用1:1,000的与AlexaFluor 488缀合的山羊抗兔二级抗体对细胞进行染色。基于荧光细胞的数目估计转染水平并且显示于表7中。对于GABA摄取测定，细胞预先接种在闪烁微量板上。转染后2天，将细胞洗涤并且在37℃下用特异性GAT-1抑制剂(CI-966(Tocris,Cat No 1296)，最终浓度为0.8％ DMSO中的100μM)或单独用媒介物(0.8％ DMSO)处理10分钟。细胞随后在37℃下用氚化与冷的GABA([3H]GABA 8μCi/ml和15μM GABA最终浓度)的混合物处理10分钟并且在使用Microbeta仪器(PerkinElmer)定量放射活性之前，使用1mM冷GABA停止反应。

如表7中所示，构建体与基于GAT-1免疫染色的不同pAAV转染水平相关。另外，所有启动子引起功能性GAT-1蛋白质的表达，显示为[3H]GABA的摄取，当细胞用媒介物处理时存在并且当细胞用GAT-1抑制剂处理时抑制(图8)。

表7

实施例7：LVV主链中的Prom-hSLC6A1构建体的体外筛选

将携带DOX-诱导型NGN2表达的基因编辑iPSC细胞系分化成iPSC衍生的神经元(BIONi010-C-13细胞系)。在此方案中，NGN2转录因子通过多西环素诱导9天以引发神经元分化。在体外(DIV)21天，在感兴趣的不同启动子的控制下，用表达hSLC6A1的慢病毒载体的连续稀释液转导iPSC衍生的NGN2神经元。在DIV28，ICC分析如下进行：将细胞用2％多聚甲醛固定并且用1:250的初级抗体兔单克隆抗GAT-1(Ref:ab177483；Abcam^TM,Cambridge,MA,USA)染色。随后在成像之前用1:1000的与Alexa Fluor 568缀合的山羊抗兔二级抗体对细胞进行染色。使用经验参数用InCell分析仪6000仪器进行成像。在图9中显示了具有针对每个图像调适的设定和参数的代表性图像。将信号与非转导细胞进行比较允许可视化与iPSC衍生的NGN2神经元(一种非永生化细胞系的基于人类的细胞系统)中的内源性GAT-1相比较的hSLC6A1在不同启动子下的转录和表达。

实施例8：所选盒的体外和体内表达

选择四种病毒载体用于进一步研究并且各自通过不同启动子表征。CAG启动子(CAG)、PGK启动子(PGK)、hDLX启动子(hDLX)和天然存在和内源性SLC6A1启动子(本文中称为ENDO)用于驱动人类SLC6A1表达。构建体经工程改造以用于待表达为在N端具有HA标签的SLC6A1蛋白质。由hSyn-eGFP-NLS组成的病毒载体用作对照(在本文中称为“对照AAV9”)。将所选病毒载体包装于AAV9中并且在体外和体内测试。所有体内实验均根据比利时法律按照动物实验伦理委员会发布的指南进行。所述实验根据欧洲委员会委员指令(2010/63/EU)进行。进行所有努力以使动物痛苦降至最低。

小鼠原发性皮质神经元细胞由E17小鼠胚胎的皮质组织制备。皮质组织在37℃下使用木瓜蛋白酶解离30分钟并且在补充有B27补充剂2％、GlutaMAX-I 1mM和青霉素-链霉素50单位/毫升的Neurobasal^TM培养基中维持培养。每周更换一半培养基。在分裂DIV 7时，神经元细胞用不同AAV9载体以2MOI(2.5E+6GC/细胞和5.0E+5GC/细胞)转导。用“对照AAV9”评估转导水平并且水平在两种MOI条件下均较高(MOI或感染倍率为药剂(例如病毒)与感染标靶(例如细胞)的比率)。在DIV 13下，固定细胞并且针对不同标记物染色。首先，通过测量与GAT-1染色(1:200；Ref:ab177483；Abcam^TM,Cambridge,MA,USA)共定位的阳性抗HA染色(1:100；Ref:2367S,Cell Signaling Technology)来证明SLC6A1转基因的表达。在所有病毒载体中观察到共定位。其次，利用抗MAP2作为泛神经元标记物(1:5000；Ref:ab5392；Abcam^TM,Cambridge,MA,USA)、抗GABA(2.5μg/mL；Ref:A2052；Sigma)以鉴定GABA能神经元以及抗GFAP(1:5000；Ref:ab7260；Abcam^TM,Cambridge,MA,USA)以鉴定星形胶质细胞来进行复染。结果(数据未示出)证实hDLX启动子驱动主要在GABA能神经元中的表达。相比之下，PGK和ENDO启动子驱动星形胶质细胞和神经元细胞类型内的表达，其至少在GABA能神经元中驱动表达。与PGK启动子相比，ENDO启动子显示出对GABA能神经元的较好细胞特异性，并且还导致与未转导细胞(在对照条件下为野生型，无病毒载体)中观察到的GAT-1的内源性表达更加一致的表达模式。通过CAG启动子的表达引起强表达和对体外神经元网路发育的MOI依赖性负面影响。

通过如表8中所述在产后第1天将病毒载体两侧注射至C57BL/6J雄性小鼠中的侧脑室中，研究包装于AAV9中的四种所选择的病毒载体的体内表达。

表8

对两组其他小鼠注射媒介物-PBS或“对照AAV9”作为对照。

在注射之后5周内，对所有动物组(媒介物-PBS、对照AAV9、AAV9-CAG-HA-hSLC6A1、AAV9-PGK-HA-hSLC6A1、AAV9-hDLX-HA-hSLC6A1和AAV9-ENDO-HA-hSLC6A1)进行生命评估(临床体征、不良影响、体重增加和死亡率)。一周一次监测体重差异以便评定小鼠的整体健康状况。在最后一次评估之前，注射不同病毒载体的不同组中的体重增加无显著差异。注射AAV9-CAG-HA-hSLC6A1的小鼠在5周监测过程中显示存活率降低(20％存活率)。达到人道终点，并且在注射后第三周至第四周对小鼠实施安乐死。在5周监测过程中，注射AAV9-PGK-HA-hSLC6A1的小鼠还显示出稍微降低的存活率(85％存活率)，但不显示任何临床毒性体征。关于其他组，注射媒介物-PBS、对照AAV9、AAV9-hDLX-HA-hSLC6A1或AAV9-ENDO-HA-hSLC6A1的对照小鼠均未显示出任何发病体征。

在注射后5周时，动物根据欧洲委员会委员指导(2010/63/EU)在异氟醚麻醉下用PBS灌注。收获大脑，解剖并且提交用于生物化学分析，即DNA/RNA从左额叶皮质和海马体提取，而蛋白质从匹配右额叶皮质提取。简而言之，使用AllPrep微型试剂盒(Qiagen^TM,80204)遵循制造商说明进行DNA/RNA提取，并且包括用于RNA提取的DNA酶处理。使用Precellys 24仪器(Bertin Technologies)使组织在RLT Plus缓冲液(补充有β-巯基乙醇)中裂解。测量DNA浓度并且针对所有样品将其调节至20ng/μl。随后，使用对SV40多聚A信号(存在于所有AAV盒中)具有特异性的引物/探针将40ng提供至qPCR。使用

试剂盒(tataabiocenter,A106P25)对小鼠基因组的量进行分析。/>

经高度优化并且对gDNA的非转录基因座具有特异性，所述基因座存在于每单倍体正常基因组恰好一个拷贝中。对于SV40p和/>

两者，使用标准曲线法来测定绝对拷贝数。使用试剂盒High Capacity cDNA RT试剂盒+RNA酶抑制剂(Applied Biosystems cat n°4374966)对500ng RNA进行逆转录(RT)PCR。随后，将所获得的cDNA提交至SV40多聚A信号qPCR，以及两个参考基因用于将结果进行标准化。测定相对表达并且针对所有组的平均值按比例调整。对于蛋白质提取，使用Precellys 24仪器(Bertin Technologies)和冷却系统在RIPA缓冲液(Pierce,89900)中裂解组织，所述缓冲液包括2x浓缩蛋白酶和磷酸酶抑制剂混合物(Cell Signaling Technology,#5872)。将样品静置在冰上30min，离心并且收集上清液作为最终蛋白质提取物。使用BCA蛋白质测定试剂盒(Pierce,23227)测定蛋白质浓度，并且将10μg蛋白质与Laemli缓冲液和β-巯基乙醇混合并且在30℃下孵育20分钟，随后进行SDS-Page。将凝胶转移至硝酸纤维膜中并且随后提交至标准WB程序。简而言之，膜在封闭溶液(Ref:927-50000；Li-Cor)中在4℃下孵育1小时。初级抗体由兔单克隆抗GAT-1(1:2000；Ref:ab177483；Abcam^TM,Cambridge,MA,USA)、小鼠单克隆抗HA(1:1000；Ref:2367S,CellSignaling Technology)和小鼠单克隆抗GAPDH(1:10000；Ref:G8795,Sigma)组成。所用二级抗体为/>

680RD驴抗小鼠IgG二级抗体(1:20000；Ref:926-68072,Li-Cor)和

800CW驴抗兔IgG二级抗体(1:20000；Ref:926-32213,Li-Cor)。

如图10小图A中所示，在DNA提取物中检测到每二倍体小鼠基因组的显著病毒基因组拷贝，证明不同病毒载体之间的高效和均匀AAV9转导。包含PGK启动子的病毒载体具有略微降低的转导水平。RNA表达分析揭露转基因在所分析的所有病毒载体中的表达(图10，小图B)。相对比较允许在用于SV40pA mRNA表达的病毒载体中对启动子强度进行总体排序。与具有SLC6A1转基因的病毒载体相比，对照AAV9构建体产生高水平表达。其中包含PGK和ENDO启动子的病毒载体(其中后者更多地表达于海马体中)显示高于hDLX启动子的表达。

蛋白质分析证实DNA和RNA结果，其中相比于对照组(注射有媒介物-PBS的未经转导的动物或注射有对照AAV9的经转导的动物)，包含PGK和ENDO启动子的病毒载体在组织水平下显著过度表达GAT-1(图11)。启动子PGK和ENDO引起GAT-1蛋白质表达的类似水平，而hDLX启动子显示较低但仍可检测的表达。

通过免疫组织化学分析来自注射有AAV9-PGK-HA-hSLC6A1、AAV9-hDLX-HA-hSLC6A1和AAV9-ENDO-HA-hSLC6A1的其他小鼠的脑样品。新鲜冷冻切片(12μm厚；矢状)由QPS Austria(Austria)的恒冷箱切片机生成，并且在-80℃下储存。所有后续孵育步骤均在室温下进行。使用以下方案对小鼠脑切片进行三重免疫荧光标记：切片用在含0.3％Triton X-100的PBS中稀释的NeuN(1:2,000；Abcam,ab177487)、GFAP(1:2,000；SySy,173006)和生物素缀合的HA(1:5,000；Biolegend,901505)初级抗体一起在潮湿腔室中孵育过夜。在孵育之后，将切片用PBS洗涤3次，接着用抗鸡Alexa Fluor 488和抗兔Alexa Fluor546二级抗体和链霉亲和素缀合的Alexa Fluor 647(全部在PBS中以1:1,000稀释；全部来自Thermo Fisher)一起孵育1小时。随后，其用DAPI复染以标记细胞核并且用PBS洗涤3次。将所述切片最终用Prolong Gold抗荧光衰减封固剂(Life Technologies)进行封固，并且施加盖玻片。使用具有20x物镜的AxioScan Z1玻片扫描器(Zeiss)获得染色切片的数字图像。对HA的免疫标记用于研究从不同启动子过度表达的人类SLC6A1的分布，所述启动子包括PGK、人类DLX和SLC6A1内源性启动子。

在整个脑部中检测到在3种不同启动子的作用下经由HA-标签标记检测的GAT-1蛋白质表达，主要在纹状体、海马体、大脑皮质、下丘脑、苍白球和隔膜中(图12，小图C、F和I)。对于PGK启动子，还在髓质和大脑核中观察到HA-标签标记(图12，小图C)。

根据启动子，还在海马体中观察到具有略微不同模式的GAT-1表达。对于所有3种启动子，在构成齿状回和海马体的分子层以及起层的神经元投射中观察到HA-标签染色(图13，小图C、F和I)。另外，hDLX启动子引起GAT-1在海马角3(CA3)中的表达(图13)，而PGK和ENDO启动子引起GAT-1在GFAP+星形胶质细胞中的表达(图13，小图C和I)。

在大脑皮质的神经纤维网中观察到GAT-1表达(图14，小图C、F和I)。具体地，PGK和ENDO启动子引起还用GFAP标记的星形胶质细胞中GAT-1的表达。

还对所选择组织进行病理性安全性评估。

在研究的体内阶段之后，将脑纵向分裂成两个半球并且将一个半球用于病理性检查。将半脑以及脊髓、背根神经节、肝脏、肾脏、脾脏、胸腺和眼睛在10％中性缓冲福尔马林中固定，包埋于石蜡中，加工成蜡块，以大约5uM厚度切片并且用苏木精和伊红(H&E)染色。

来自n＝28只小鼠的一系列组织(脑部(7个横向切片(Bolon等人,Toxicol Pathol2018年6月；46(4):372-402.doi:10.1177/0192623318772484)、具有背根神经节的脊髓(6个横向或纵向切片；颈部、胸部和腰部)、肝脏(2个切片；左侧和尾状叶)、肾脏(2个切片；左侧和右侧器官)、脾脏(1个切片)、胸腺(1个切片)和眼睛(2个切片；左侧和右侧器官))通过光学显微术进行评估。

未在脑部、脊髓/背根神经节、肾脏或眼睛内鉴定出特定于治疗组的发现(这些野生型小鼠中视网膜色素上皮的色素沉着排除脂褐质/色素含量的评定)。

在脑部中注意到若干变化，其被视为尸检时机械(程序)损伤或由以暗神经元假影为特征的注射程序的结果，有时伴有结构破坏。

在肝脏内，施用对照AAV9的多个动物具有最小的弥漫性肝细胞空泡形成，主要在中间区区域内，其还在施用病毒载体AAV9-CAG-HA-hSLC6A1、AAV9-PGK-HA-hSLC6A1或AAV9-hDLX-HA-hSLC6A1的个体动物中观察到。

还在施用病毒载体AAV9-CAG-HA-hSLC6A1或AAV9-PGK-HA-hSLC6A1的一些动物的肝脏内注意到增加的有丝分裂图(直至轻微严重程度)(并且偶尔在肾中-未记录)。

最后，来自注射有病毒载体AAV9-CAG-HA-hSLC6A1和AAV9-PGK-HA-hSLC6A1的治疗组的两只动物还呈现最小肝细胞单细胞坏死。

认为其他发现(例如最小炎性细胞浸润、充血和局灶性坏死)处于预期正常背景变化的范围内并且不认为与病毒载体有关。施用AAV9-ENDO-HA-hSLC6A1的动物具有与正常背景范围一致的肝脏形态。

在脾脏内，施用病毒载体AAV9-CAG-HA-hSLC6A1、AAV9-PGK-HA-hSLC6A1或AAV9-ENDO-HA-hSLC6A1的个体动物具有最低至轻微的髓外造血水平。这被认为可能反映此组织内预期造血细胞含量的测试物相关的减少(在对照动物中记录为适度的)。

实施例9：转基因SLC6A1疾病小鼠模型中所选病毒载体的体内评估

为了评估所选病毒载体的功效，生成再现人类SLC6A1单倍体不足介导的癫痫的转基因小鼠模型。所用模型为在C57BL/6J背景下的基因敲入(KI)小鼠模型，所述模型携带在Shanghai Model Organisms产生的SLC6A1基因中的S295L点突变(SLC6A1^+/S295L)。S295L突变已在体外功能性验证，导致GAT-1的完全功能丧失。据信突变发生于已显示具有病原性突变的区域中并且发现于患有失神发作和发育迟缓的患者中(https://slc6a1connect.org/)。所有体内实验均根据比利时法律按照动物实验伦理委员会发布的指南进行。所述实验根据欧洲委员会委员指令(2010/63/EU)进行。进行所有努力以使动物痛苦降至最低。

如表9中所描述在产后第1天用3种病毒载体(AAV9-PGK-HA-hSLC6A1、AAV9-hDLX-HA-hSLC6A1和AAV9-ENDO-HA-hSLC6A1)中的一种两侧注射至杂合KI(SLC6A1^+/S295L)和野生型同胎仔畜(SLC6A1^+/+)雄性小鼠的侧脑室中。

表9

来自每个基因型的一组额外小鼠注射有媒介物-PBS以用作对照。在注射后3周的疗程内一周一次监测临床体征并且在注射后第3周至第7周每日监测临床体征，以便评估小鼠的整体健康状况。在注射后7周，通过生物化学分析、组织病理学、免疫组织化学和转基因表达对脑部、血浆和器官收集进行最终评估。

直到最后一次评估，注射不同病毒载体的不同组中的体重增加无显著差异。在随访期期间(注射后第3至7周)未观察到死亡率。

注射后六周，进行1周的体内无线EEG(脑电图)视频遥测记录以评估癫痫发生。注射后5周，将SLC6A1^+/S295L小鼠手术植入皮下遥测发射器和皮质EEG电极。手术在无菌(sterile/aseptic)条件下进行。将麻醉小鼠(氧中的异氟醚-诱导：2l/min下的5％，维持1.5l/min下的2.5-1.5％)放置在带有加热垫的立体定向框架中，在前额叶皮质的颅骨表面(在前囟上)钻孔用于记录电极，在小脑的颅骨表面(在顶枕点(lambda)后面)钻孔用于参考电极。此后，将开源仪器(OSI)A3028S2ECoG发射器植入背部皮下，其中连接的电线从皮下一直延伸至颅骨，其中记录电极和参考电极通过每个孔并且定位至脑实质中约0.5mm。每个电极用螺钉(塑胶螺钉)固定在适当位置。整个组装用氰基丙烯酸酯和补齿水泥保持在原位，形成小圆形头盖，并且背部用尼龙可吸收缝合材料封闭。术后用药和疼痛管理包括术前剂量后24小时的第二次卡洛芬剂量(10mg/kg)。手术后，小鼠在温暖的室内恢复2-3小时。对于体内无线EEG视频遥测记录，将小鼠分组饲养(2-3只小鼠/笼)。将小鼠笼置于Faraday围栏中以方便记录。每天一次对植入小鼠进行福利监测持续2周。每天对小鼠进行称重持续4天，其后每周一次称重。所有记录均在特意设计的具有温度和湿度控制的记录室中进行，以便减少环境干扰并且改善发射信号的接收。信号是从植入的发射器传输至放置于Faraday围栏内部的无线电。来自一个记录通道的EEG信号在256Hz下数字化(带通滤波器：0.3-80Hz)。棘波放电(SWD)(失神发作的典型特征)用内部自动癫痫发作检测软件进行分析。SWD检测算法基于事件持续时间分析(＞2s)、条带频率分析(5-9Hz)和特定基本谐波频率的识别。通过算法检测的每个SWD由至少一名经验丰富的观察者以盲法进行确认。最初在未注射病毒载体的转基因系SLC6A1^+/S295L中观察到一段高SWD发生期(从1pm至6pm，5小时)。因此，在此时间段内对不同病毒载体和对照组进行EEG分析。归因于以下组中EEG信号中出现技术假影，共有4只动物从分析中排除：AAV9-PGK-HA-hSLC6A1(10个中的2个)和AAV9-ENDO-HA-hSLC6A1(15个中的2个)。还从AAV9-hDLX-HA-hSLC6A1组中的分析移除额外2只动物(11个中的2个)；一个在EEG中显示假影，并且另一个未经转导(在脑组织中未检测到病毒基因组拷贝，如下文所提及)。组之间的差异通过非参数单向ANOVA(Kruskal-Wallis检验)，随后Dunn事后多重比较检验来进行分析(**p＜0.01)。

如图15中所说明，与对照组相比，注射有AAV9-PGK-HA-hSLC6A1或AAV9-ENDO-HA-hSLC6A1的SLC6A1^+/S295L小鼠在SWD发生高峰时期连续7天内记录的每天SWD平均数目分别显著减少97％和93％。与对照组相比，注射有AAV9-hDLX-HA-hSLC6A1的SLC6A1^+/S295L小鼠中的SWD数目减少未在此实验中达到统计显著性。

此外，对来自注射有不同病毒载体的动物的脑组织进行生物化学分析。遵循与实施例8中所描述相同的方法，在注射后7周处死动物。收集尾侧皮质并且进行DNA/RNA提取，并且使用与实施例8中所描述的相同的方法，将匹配的半内侧额叶皮质用于蛋白质提取。

如图16A中所示，在DNA提取物中检测到每二倍体小鼠基因组的显著病毒基因组拷贝，证明所用的不同病毒载体之间的高效和均匀AAV9转导(除AAV9-hDLX组中显示无病毒转导的一只动物之外)。图16B显示所有AAV9转导组中的mRNA表达。对于SLC6A1表达，在PGK启动子与ENDO启动子之间未观察到显著差异。另一方面，与其他组相比，hDLX启动子显示出显著降低的mRNA表达。

蛋白质分析证实，与其WT同胎仔畜相比，SLC6A1^+/S295L小鼠(图中称为HET)中的GAT-1表达如所预期显著降低(图17，小图D、E和F)。如图17所示，蛋白质印迹凝胶和附图显示，与注射媒介物的SLC6A1^+/S295L小鼠(图中称为HET)相比，注射AAV9后SLC6A1^+/S295L小鼠中的GAT-1表达显著增加。对于所有所用病毒载体，观察到GAT-1的过度表达。PGK启动子相对于野生型(WT)水平增加表达，而ENDO启动子在挽救单倍体不足方面表达出与WT相似的表达水平。hDLX启动子也显示相对于SLC6A1^+/S295L小鼠的增加的表达。类似于在实施例8中在WT动物中观察到的结果，当观察HA信号时，可比较启动子的强度。如之前所观察的，在SLC6A1^+/S295L小鼠中PGK启动子显示出最强蛋白质表达，随后为ENDO和hDLX启动子。

序列表

<110> UCB生物制药有限责任公司

<120> 核酸构建体、病毒载体和病毒颗粒

<130> PF0300-WO

<150> US 63/089,817

<151> 2020-10-09

<160> 35

<170> PatentIn version 3.5

<210> 1

<211> 582

<212> DNA

<213> 人工序列

<220>

<223> CAG启动子

<400> 1

cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 60

gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 120

atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 180

aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 240

catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 300

catgcgtcga ggtgagcccc acgttctgct tcactctccc catctccccc ccctccccac 360

ccccaatttt gtatttattt attttttaat tattttatgc agcgatgggg gcgggggggg 420

ggggggcgcg cgccaggcgg ggcggggcgg ggcgaggggc ggggcggggc gaggcggaga 480

ggtgcggcgg cagccaatca gagcggcgcg ctccgaaagt ttccttttat ggcgaggcgg 540

cggcggcggc ggccctataa aaagcgaagc gcgcggcggg cg 582

<210> 2

<211> 1011

<212> DNA

<213> 人工序列

<220>

<223> 嵌合内含子

<400> 2

ggagtcgctg cgttgccttc gccccgtgcc ccgctccgcg ccgcctcgcg ccgcccgccc 60

cggctctgac tgaccgcgtt actcccacag gtgagcgggc gggacggccc ttctccctcc 120

gggctgtaat tagcgcttgg tttaatgacg gctcgtttct tttctgtggc tgcgtgaaag 180

ccttaaaggg ctccgggagg gcctttgtgc gggggggagc ggctcggggg gtgcgtgcgt 240

gtgtgtgtgc gtggggagcg ccgcgtgcgg cccgcgctgc ccggcggctg tgagcgctgc 300

gggcgcggcg cggggctttg tgcgctccgc gtgtgcgcga ggggagcgcg ggccgggggc 360

ggtgccccgc ggtgcggggg ggctgcgagg ggaacaaagg ctgcgtgcgg ggtgtgtgcg 420

tgggggggtg agcagggggt gtgggcgcgg cggtcgggct gtaacccccc cctggcaccc 480

ccctccccga gttgctgagc acggcccggc ttcgggtgcg gggctccgtg cggggcgtgg 540

cgcggggctc gccgtgccgg gcggggggtg gcggcaggtg ggggtgccgg gcggggcggg 600

gccgcctcgg gccggggagg gctcggggga ggggcgcggc ggccccggag cgccggcggc 660

tgtcgaggcg cggcgagccg cagccattgc cttttatggt aatcgtgcga gagggcgcag 720

ggacttcctt tgtcccaaat ctggcggagc cgaaatctgg gaggcgccgc cgcaccccct 780

ctagcgggcg cgggcgaagc ggtgcggcgc cggcaggaag gaaatgggcg gggagggcct 840

tcgtgcgtcg ccgcgccgcc gtccccttct ccatctccag cctcggggct gccgcagggg 900

gacggctgcc ttcggggggg acggggcagg gcggggttcg gcttctggcg tgtgaccggc 960

ggctttagag cctctgctaa ccatgttcat gccttcttct ttttcctaca g 1011

<210> 3

<211> 1210

<212> DNA

<213> 人工序列

<220>

<223> UCB启动子

<400> 3

ggcctccgcg ccgggttttg gcgcctcccg cgggcgcccc cctcgtcacg gcgagcgctg 60

ccacgtcaga cgaagggcgc aggagcgtcc tgatccttcc gcccggacgc tcaggacagc 120

ggcccgctgc tcataagact cggccttaga accccagtat cagcagaagg acattttagg 180

acgggacttg ggtgactcta gggcactggt tttctttcca gagagcggaa caggcgagga 240

aaagtagtcc cttctcggcg attctgcgga gggatctccg tggggcggtg aacgccgatg 300

attatataag gacgcgccgg gtgtggcaca gctagttccg tcgcagccgg gatttgggtc 360

gcggttcttg tttgtggatc gctgtgatcg tcacttggtg agtagcgggc tgctgggctg 420

gccggggctt tcgtggccgc cgggccgctc ggtgggacgg aagcgtgtgg agagaccgcc 480

aagggctgta gtctgggtcc gcgagcaagg ttgccctgaa ctgggggttg gggggagcgc 540

agcaaaatgg cggctgttcc cgagtcttga atggaagacg cttgtgaggc gggctgtgag 600

gtcgttgaaa caaggtgggg ggcatggtgg gcggcaagaa cccaaggtct tgagcccttc 660

gctaatgcgg gaaagctctt attcgggtga gatgggctgg gcaccatctg gggaccctga 720

cgtgaagttt gtcactgact ggagaactcg gtttgtcgtc tgttgcgggg gcggcagtta 780

tggcggtgcc gttgggcagt gcacccgtac ctttgggagc gcgcgccctc gtcgtgtcgt 840

gacgtcaccc gttctgttgg cttataatgc agggtggggc cacctgccgg taggtgtgcg 900

gtaggctttt ctccgtcgca ggacgcaggg ttcgggccta gggtaggctc tcctgaatcg 960

acaggcgccg gacctctggt gaggggaggg ataagtgagg cgtcagtttc tttggtcggt 1020

tttatgtacc tatcttctta agtagctgaa gctccggttt tgaactatgc gctcggggtt 1080

ggcgagtgtg ttttgtgaag ttttttaggc accttttgaa atgtaatcat ttgggtcaat 1140

atgtaatttt cagtgttaga cttgtaaatt gtccgctaaa ttctggccgt ttttggcttt 1200

tttgttagac 1210

<210> 4

<211> 390

<212> DNA

<213> 人工序列

<220>

<223> PGK启动子

<400> 4

accggtaggc gccaaccggc tccgttcttt ggtggcccct tcgcgccacc ttctactcct 60

cccctagtca ggaagttccc ccccgccccg cagctcgcgt cgtgcaggac gtgacaaatg 120

gaagtagcac gtctcactag tctcgtgcag atggacagca ccgctgagca atggaagcgg 180

gtaggccttt ggggcagcgg ccaatagcag ctttgctcct tcgctttctg ggctcagagg 240

ctgggaaggg gtgggtccgg gggcgggctc aggggcgggc tcaggggcgg ggcgggcgcc 300

cgaaggtcct ccggaggccc ggcattctgc acgcttcaaa agcgcacgtc tgccgcgctg 360

ttctcctctt cctcatctcc gggcctttcg 390

<210> 5

<211> 1179

<212> DNA

<213> 人工序列

<220>

<223> EF1a启动子加内含子

<400> 5

ggctccggtg cccgtcagtg ggcagagcgc acatcgccca cagtccccga gaagttgggg 60

ggaggggtcg gcaattgaac cggtgcctag agaaggtggc gcggggtaaa ctgggaaagt 120

gatgtcgtgt actggctccg cctttttccc gagggtgggg gagaaccgta tataagtgca 180

ctagtcgccg tgaacgttct ttttcgcaac gggtttgccg ccagaacaca ggtaagtgcc 240

gtgtgtggtt cccgcgggcc tggcctcttt acgggttatg gcccttgcgt gccttgaatt 300

acttccacct ggctgcagta cgtgattctt gatcccgagc ttcgggttgg aagtgggtgg 360

gagagttcgt ggccttgcgc ttaaggagcc ccttcgcctc gtgcttgagt tgtggcctgg 420

cctgggcgct ggggccgccg cgtgcgaatc tggtggcacc ttcgcgcctg tctcgctgct 480

ttcgataagt ctctagccat ttaaaatttt tgatgacctg ctgcgacgct ttttttctgg 540

caagatagtc ttgtaaatgc gggccaagat cagcacactg gtatttcggt ttttggggcc 600

gcgggcggcg acggggcccg tgcgtcccag cgcacatgtt cggcgaggcg gggcctgcga 660

gcgcggccac cgagaatcgg acgggggtag tctcaagctg cccggcctgc tctggtgcct 720

ggcctcgcgc cgccgtgtat cgccccgccc tgggcggcaa ggctggcccg gtcggcacca 780

gttgcgtgag cggaaagatg gccgcttccc ggccctgctg cagggagcac aaaatggagg 840

acgcggcgct cgggagagcg ggcgggtgag tcacccacac aaaggaaaag ggcctttccg 900

tcctcagccg tcgcttcatg tgactccacg gagtaccggg cgccgtccag gcacctcgat 960

tagttctcca gcttttggag tacgtcgtct ttaggttggg gggaggggtt ttatgcgatg 1020

gagtttcccc acactgagtg ggtggagact gaagttaggc cagcttggca cttgatgtaa 1080

ttctccttgg aatttgccct ttttgagttt ggatcttggt tcattctcaa gcctcagaca 1140

gtggttcaaa gtttttttct tccatttcag gtgtcgtga 1179

<210> 6

<211> 939

<212> DNA

<213> 人工序列

<220>

<223> EF1a内含子

<400> 6

gtaagtgccg tgtgtggttc ccgcgggcct ggcctcttta cgggttatgg cccttgcgtg 60

ccttgaatta cttccacctg gctgcagtac gtgattcttg atcccgagct tcgggttgga 120

agtgggtggg agagttcgtg gccttgcgct taaggagccc cttcgcctcg tgcttgagtt 180

gtggcctggc ctgggcgctg gggccgccgc gtgcgaatct ggtggcacct tcgcgcctgt 240

ctcgctgctt tcgataagtc tctagccatt taaaattttt gatgacctgc tgcgacgctt 300

tttttctggc aagatagtct tgtaaatgcg ggccaagatc agcacactgg tatttcggtt 360

tttggggccg cgggcggcga cggggcccgt gcgtcccagc gcacatgttc ggcgaggcgg 420

ggcctgcgag cgcggccacc gagaatcgga cgggggtagt ctcaagctgc ccggcctgct 480

ctggtgcctg gcctcgcgcc gccgtgtatc gccccgccct gggcggcaag gctggcccgg 540

tcggcaccag ttgcgtgagc ggaaagatgg ccgcttcccg gccctgctgc agggagcaca 600

aaatggagga cgcggcgctc gggagagcgg gcgggtgagt cacccacaca aaggaaaagg 660

gcctttccgt cctcagccgt cgcttcatgt gactccacgg agtaccgggc gccgtccagg 720

cacctcgatt agttctccag cttttggagt acgtcgtctt taggttgggg ggaggggttt 780

tatgcgatgg agtttcccca cactgagtgg gtggagactg aagttaggcc agcttggcac 840

ttgatgtaat tctccttgga atttgccctt tttgagtttg gatcttggtt cattctcaag 900

cctcagacag tggttcaaag tttttttctt ccatttcag 939

<210> 7

<211> 229

<212> DNA

<213> 人工序列

<220>

<223> MECP2启动子

<400> 7

agctgaatgg ggtccgcctc ttttccctgc ctaaacagac aggaactcct gccaattgag 60

ggcgtcaccg ctaaggctcc gccccagcct gggctccaca accaatgaag ggtaatctcg 120

acaaagagca aggggtgggg cgcgggcgcg caggtgcagc agcacacagg ctggtcggga 180

gggcggggcg cgacgtctgc cgtgcggggt cccggcatcg gttgcgcgc 229

<210> 8

<211> 1317

<212> DNA

<213> 人工序列

<220>

<223> hNSE启动子

<400> 8

atgcagctgg acctaggaga gaagcaggag aggaagatcc agcacaaaaa atccgaagct 60

aaaaacagga cacagagatg ggggaagaaa agagggcaga gtgaggcaaa aagagactga 120

agagatgagg gtggccgcca ggcactttag ataggggaga ggctttattt acctctgttt 180

gttttttttt tttttttttt tttttttttt ttgcgaggta gtcttgctta gtctccaggc 240

tggagtgcag tggcacaatc tcagctcact gcaacttcca cctcctgggt tcaagcaatt 300

ctcctgcctc agcctcccga gtagctggga ctacaggcgc atgcaaccgc gcctggctaa 360

tttttgtatt tttagtagaa acggggtttc accacgttag ccaggatggt ctggatctcc 420

tgacctcgtg atctgcccgc ctccgccttc caaagtgctg ggattacagg ggtgagccac 480

agcgcctggt ccctatttac ttctgtcttc tacctccagg agatcaaaga cgctggcctt 540

cagacctgat cagactccca ggggcagcca ccacatgtat gacagagaac agaggatgcc 600

tgtttttgcc ccaaagctgg aaattcatca caacctgagg cccaggatct gctctgtgcc 660

ggtcctctgg gcagtgtggg gtgcagaatg gggtgcctag gcctgagcgt tgcctggagc 720

ctaggccggg ggccgccctc gggcaggcgt gggtgagagc caagaccgcg tgggccgcgg 780

ggtgctggta ggagtggttg gagagacttg cgaaggcggc tggggtgttc ggatttccaa 840

taaagaaaca gagtgatgct cctgtgtctg accgggtttg tgagacattg aggctgtctt 900

gggcttcact ggcagtgtgg gccttcgtac ccgggctaca ggggtgcggc tctgcctgtt 960

actgtcgagt gggtcgggcc gtgggtatga gcgcttgtgt gcgctggggc caggtcgtgg 1020

gtgcccccac ccttccccca tcctcctccc ttccccactc caccctcgtc ggtcccccac 1080

ccgcgctcgt acgtgcgcct ccgccggcag ctcctgactc atcgggggct ccgggtcaca 1140

tgcgcccgcg cggccctata ggcgcctcct ccgcccgccg cccgggagcc gcagccgccg 1200

ccgccactgc cactcccgct ctctcagcgc cgccgtcgcc accgccaccg ccaccgccac 1260

taccaccgag atctgcgatc taagtaagct tggcattccg gtactgttgg taaagcc 1317

<210> 9

<211> 448

<212> DNA

<213> 人工序列

<220>

<223> hSyn启动子

<400> 9

agtgcaagtg ggttttagga ccaggatgag gcggggtggg ggtgcctacc tgacgaccga 60

ccccgaccca ctggacaagc acccaacccc cattccccaa attgcgcatc ccctatcaga 120

gagggggagg ggaaacagga tgcggcgagg cgcgtgcgca ctgccagctt cagcaccgcg 180

gacagtgcct tcgcccccgc ctggcggcgc gcgccaccgc cgcctcagca ctgaaggcgc 240

gctgacgtca ctcgccggtc ccccgcaaac tccccttccc ggccaccttg gtcgcgtccg 300

cgccgccgcc ggcccagccg gaccgcacca cgcgaggcgc gagatagggg ggcacgggcg 360

cgaccatctg cgctgcggcg ccggcgactc agcgctgcct cagtctgcgg tgggcagcgg 420

aggagtcgtg tcgtgcctga gagcgcag 448

<210> 10

<211> 1289

<212> DNA

<213> 人工序列

<220>

<223> CamKII启动子

<400> 10

cattatggcc ttaggtcact tcatctccat ggggttcttc ttctgatttt ctagaaaatg 60

agatgggggt gcagagagct tcctcagtga cctgcccagg gtcacatcag aaatgtcaga 120

gctagaactt gaactcagat tactaatctt aaattccatg ccttgggggc atgcaagtac 180

gatatacaga aggagtgaac tcattagggc agatgaccaa tgagtttagg aaagaagagt 240

ccagggcagg gtacatctac accacccgcc cagccctggg tgagtccagc cacgttcacc 300

tcattatagt tgcctctctc cagtcctacc ttgacgggaa gcacaagcag aaactgggac 360

aggagcccca ggagaccaaa tcttcatggt ccctctggga ggatgggtgg ggagagctgt 420

ggcagaggcc tcaggagggg ccctgctgct cagtggtgac agataggggt gagaaagcag 480

acagagtcat tccgtcagca ttctgggtct gtttggtact tcttctcacg ctaaggtggc 540

ggtgtgatat gcacaatggc taaaaagcag ggagagctgg aaagaaacaa ggacagagac 600

agaggccaag tcaaccagac caattcccag aggaagcaaa gaaaccatta cagagactac 660

aagggggaag ggaaggagag atgaattagc ttcccctgta aaccttagaa cccagctgtt 720

gccagggcaa cggggcaata cctgtctctt cagaggagat gaagttgcca gggtaactac 780

atcctgtctt tctcaaggac catcccagaa tgtggcaccc actagccgtt accatagcaa 840

ctgcctcttt gccccactta atcccatccc gtctgttaaa agggccctat agttggaggt 900

gggggaggta ggaagagcga tgatcacttg tggactaagt ttgttcgcat ccccttctcc 960

aaccccctca gtacatcacc ctgggggaac agggtccact tgctcctggg cccacacagt 1020

cctgcagtat tgtgtatata aggccagggc aaagaggagc aggttttaaa gtgaaaggca 1080

ggcaggtgtt ggggaggcag ttaccggggc aacgggaaca gggcgtttcg gaggtggttg 1140

ccatggggac ctggatgctg acgaaggctc gcgaggctgt gagcagccac agtgccctgc 1200

tcagaagccc caagctcgtc agtcaagccg gttctccgtt tgcactcagg agcacgggca 1260

ggcgagtggc ccctagttct gggggcagc 1289

<210> 11

<211> 541

<212> DNA

<213> 人工序列

<220>

<223> hDLX启动子

<400> 11

ttcagaatgt tatgcactca cagtggtttg gcatgcatct ggtgaatttt ttttaacgaa 60

aaattagtgt tggtttcgat gtatggtagc attctcccta acgtaatttg aataattcag 120

caaagcccca ctaccagctg tacttctgca gcctcttcca ttcttttcag cattataatt 180

ttggttaatt ttcaatttta ggtcctacgt ctctgcaatt tgtgtatgaa taacagaata 240

atttccctct tttgtttcgc ctttcctgtt cctgaatcta aataaagatg gctttttagt 300

attaaaagtg gaagaaaatt acaggtaatt atctttgacg gtaaaaacgc tgtaatcagc 360

gggctacatg aaaaattact ctaattatgg ctgcatttaa gagaatggaa aaaaaccttc 420

ttgtggataa aaaccttaaa ttgtccccaa tgtctgcttc aaattggatg gcactgcagc 480

tggaggcttt gttcagaatt gatcctgggg agctacgaac ccaaagtttc acagtaggaa 540

g 541

<210> 12

<211> 49

<212> DNA

<213> 人工序列

<220>

<223> pB Globin

<400> 12

ctgggcataa aagtcagggc agagccatct attgcttaca tttgcttct 49

<210> 13

<211> 133

<212> DNA

<213> 人工序列

<220>

<223> hDLX内含子

<400> 13

gtaagtatca aggttacaag acaggtttaa ggagaccaat agaaactggg cttgtcgaga 60

cagagaagac tcttgcgttt ctgataggca cctattggtc ttactgacat ccactttgcc 120

tttctctcca cag 133

<210> 14

<211> 1296

<212> DNA

<213> 人工序列

<220>

<223> 内源性hSLC6A1启动子

<400> 14

agaatccctc aaacctcaag aactgagaga agggtgtctg gggctcctgc caccatccct 60

gtttcccttt taagtaatct gtttccccat ctgtccatcc atacacacag ccacttgtgt 120

ctccatgacc aaccgctggc agtggaaggg tgtccttccc acccccactc ttacacacac 180

tcccagctgg tacccagagc ctggtcaccc caggccaggc ctgtgtttcc aggtgtaacg 240

ggcagcagac gctgccctag gactagagca gggagggggc acgggcccac cccaacccac 300

agcgacccac agagggcgaa aagaggacga ccgcagagag aaacggaaag gacaggccaa 360

cggaagcagt actgcaaggc tggaaggaga aaagccagga ggggagtgct tgctgtgaaa 420

gacagggaga cagagaccaa gacggacagg cagacaggct ggtgacccag gatgaggccg 480

gaaagagcca tcaaaggaag gagaaggaag gagagagatt ggagcgggac ggcggggcag 540

gcgagggaag gagggggtgg ggagagggag ggaggaagag aggggagaaa gagggaggaa 600

gagaggggag aaggagggag aagagagcgg gagaatgcga gaggaaagaa gggagagggg 660

aggcgtagaa ggggagagga ggtgaaggga aaaggagaga gcctgctggc ggcgaagctg 720

caagaggcag ctgcggaggg agcgcgcggc gggcctgggg gagcgctggg cgggggcggg 780

cggtgcgggc agggctatac ccgagctggg cgggctccgg gcgccgcggg ccctgccctc 840

cccctccatc cctccggact cgctcccccc tcctctccct tccccgcgac cctccgcccg 900

ccctcggaag accgagacag cggagaggtt gcgggtgagc tgcgctgagc ccaggagccg 960

aggagtcggg agcgcagtag cgctgagccc gagcccgagc ggccccgcgt cccgagcgca 1020

tcggagcggc cgagccgccc ggatgcagcg cctgtcccgg gcagcgcagc cccggccgca 1080

ggatctcacc cagggtggca gaaggaggcc ttctggagct gacccacccc cgacgaccat 1140

cagggtgagg caactccaag gtcctactct ctttctgtgc ctgttaccca ccccgtcctc 1200

ctagggtgcc cttgagccgc aaaactgctg tccacgtgga ccgggggtga catcgcacgt 1260

ccatctgcca ggacccctgc gtccaaattc cgagac 1296

<210> 15

<211> 1800

<212> DNA

<213> 人工序列

<220>

<223> 人类SLC6A1

<400> 15

atggcgacca acggcagcaa ggtggccgac gggcagatct ccaccgaggt cagcgaggcc 60

cctgtggcca atgacaagcc caaaaccttg gtggtcaagg tgcagaagaa ggcggcagac 120

ctccccgacc gggacacgtg gaagggccgc ttcgacttcc tcatgtcctg tgtgggctat 180

gccatcggcc tgggcaacgt ctggaggttc ccctatctct gcgggaaaaa tggtggggga 240

gccttcctga tcccctattt cctgacactc atctttgcgg gggtcccact cttcctgctg 300

gagtgctccc tgggccagta cacctccatc ggggggctag gggtatggaa gctggctcct 360

atgttcaagg gcgtgggcct tgcggctgct gtgctatcat tctggctgaa catctactac 420

atcgtcatca tctcctgggc catttactac ctgtacaact ccttcaccac gacactgccg 480

tggaaacagt gcgacaaccc ctggaacaca gaccgctgct tctccaacta cagcatggtc 540

aacactacca acatgaccag cgctgtggtg gagttctggg agcgcaacat gcatcagatg 600

acggacgggc tggataagcc aggtcagatc cgctggccac tggccatcac gctggccatc 660

gcctggatcc ttgtgtattt ctgtatctgg aagggtgttg gctggactgg aaaggtggtc 720

tacttttcag ccacataccc ctacatcatg ctgatcatcc tgttcttccg tggagtgacg 780

ctgcccgggg ccaaggaggg catcctcttc tacatcacac ccaacttccg caagctgtct 840

gactccgagg tgtggctgga tgcggcaacc cagatcttct tctcatacgg gctgggcctg 900

gggtccctga tcgctctcgg gagctacaac tctttccaca acaatgtcta cagggactcc 960

atcatcgtct gctgcatcaa ttcgtgcacc agcatgttcg caggattcgt catcttctcc 1020

atcgtgggct tcatggccca tgtcaccaag aggtccattg ctgatgtggc ggcctcaggc 1080

cccgggctgg cgttcctggc atacccagag gcggtgaccc agctgcctat ctccccactc 1140

tgggccatcc tcttcttctc catgctgttg atgctgggca ttgacagcca gttctgcact 1200

gtggagggct tcatcacagc cctggtggat gagtacccca ggctcctccg caaccgcaga 1260

gagctcttca ttgctgctgt ctgcatcatc tcctacctga tcggtctctc taacatcact 1320

caggggggta tttatgtctt caaactcttt gactactact ctgccagtgg catgagcctg 1380

ctgttcctcg tgttctttga atgtgtctct atttcctggt tttacggtgt caaccgattc 1440

tatgacaata tccaagagat ggttggatcc aggccctgca tctggtggaa actctgctgg 1500

tctttcttca caccaatcat tgtggcgggc gtgttcattt tcagtgctgt gcagatgacg 1560

ccactcacca tgggaaacta tgttttcccc aagtggggcc agggtgtggg ctggctgatg 1620

gctctgtctt ccatggtcct catccccggg tacatggcct acatgttcct caccttaaag 1680

ggctccctga agcagcgcat ccaagtcatg gtccagccca gcgaagacat cgttcgccca 1740

gagaatggtc ctgagcagcc ccaggcgggc agctccacca gcaaggaggc ctacatctag 1800

<210> 16

<211> 1800

<212> DNA

<213> 人工序列

<220>

<223> 小鼠SLC6A1

<400> 16

atggcgactg acaacagcaa ggtggctgat gggcagatct ctactgaggt cagcgaggcc 60

cctgtggcca gcgacaagcc caaaaccctg gtagtcaagg tgcagaagaa ggccggggac 120

ctccctgacc gggacacatg gaagggacgc ttcgacttcc tcatgtcctg cgtgggctat 180

gccatcggcc tgggcaatgt gtggaggttc ccttacctct gtgggaaaaa cggtggcggg 240

gccttcctaa tcccatattt cctgacgctc atctttgcgg gtgttcctct cttccttttg 300

gagtgctccc taggccagta cacctccatt gggggcctgg gcgtatggaa gctggcgccc 360

atgttcaagg gtgtgggcct cgcggcagct gtgctgtcct tctggctgaa catctactac 420

atcgtcatca tctcctgggc catctactac ctgtacaact ccttcaccac gaccctgcca 480

tggaaacagt gtgacaaccc gtggaacact gaccgctgct tctccaacta cagcctggtc 540

aataccacca acatgaccag cgccgtggtg gagttctggg agcgcaacat gcaccagatg 600

acagatggac tggacaagcc aggacagatc cgctggcctc tggccatcac actggccatt 660

gcctgggtgc tcgtgtattt ctgcatctgg aagggtgttg gttggactgg aaaggtggtc 720

tacttctcag ccacgtaccc ctacatcatg cttatcatcc tgttcttccg tggagtgacg 780

cttcccgggg ccaaggaggg gatcctcttc tacatcacac ccaacttccg aaagctgtct 840

gattctgagg tgtggcttga cgccgccacc cagatcttct tctcctacgg gctgggcctg 900

gggtccctga ttgctctggg aagctacaac tctttccaca acaatgtgta cagggactcc 960

atcatcgttt gctgcatcaa ctcctgcacc agcatgtttg ccggattcgt catcttctcc 1020

atcgtgggct tcatggctca tgtcaccaag aggtccatag ctgatgtggc agcctcaggc 1080

ccggggctgg cattcttggc gtaccctgag gctgtgacac agctacccat ctctcccctc 1140

tgggctatcc tcttcttctc catgctgctg atgctgggca ttgacagcca gttctgtacc 1200

gtggagggct tcatcactgc cctggtggac gagtacccca gacttctccg caatcgccgt 1260

gaactcttca ttgctgccgt gtgcatcgtg tcctacctga ttggcctgtc taacatcacc 1320

cagggtggca tttatgtctt caaactgttt gattattact ctgccagcgg catgagcttg 1380

ctgttcctgg ttttcttcga gtgtgtctcc atttcctggt tttatggtgt caaccggttc 1440

tatgacaaca tccaggagat ggttggctcc aggccctgca tctggtggaa gctgtgctgg 1500

tcctttttca cacccatcat tgtggcgggc gtgtttctct tcagtgctgt gcagatgaca 1560

ccactcacca tgggaagcta tgttttcccc aagtggggcc agggcgtggg ctggctcatg 1620

gctctgtcct ccatggtgct catccccggg tacatggctt acatgttcct caccctgaag 1680

ggctccctga agcagcgtct ccaggtcatg attcagccca gtgaagatat tgtgcgccct 1740

gagaatggcc ctgagcagcc gcaggctggc agctcagcca gcaaggaggc ctacatctag 1800

<210> 17

<211> 135

<212> DNA

<213> 人工序列

<220>

<223> SV40多聚A

<400> 17

gatccagaca tgataagata cattgatgag tttggacaaa ccacaactag aatgcagtga 60

aaaaaatgct ttatttgtga aatttgtgat gctattgctt tatttgtaac cattataagc 120

tgcaataaac aagtt 135

<210> 18

<211> 599

<212> PRT

<213> 人工序列

<220>

<223> 人类GAT-1同种型a

<400> 18

Met Ala Thr Asn Gly Ser Lys Val Ala Asp Gly Gln Ile Ser Thr Glu

1 5 10 15

Val Ser Glu Ala Pro Val Ala Asn Asp Lys Pro Lys Thr Leu Val Val

20 25 30

Lys Val Gln Lys Lys Ala Ala Asp Leu Pro Asp Arg Asp Thr Trp Lys

35 40 45

Gly Arg Phe Asp Phe Leu Met Ser Cys Val Gly Tyr Ala Ile Gly Leu

50 55 60

Gly Asn Val Trp Arg Phe Pro Tyr Leu Cys Gly Lys Asn Gly Gly Gly

65 70 75 80

Ala Phe Leu Ile Pro Tyr Phe Leu Thr Leu Ile Phe Ala Gly Val Pro

85 90 95

Leu Phe Leu Leu Glu Cys Ser Leu Gly Gln Tyr Thr Ser Ile Gly Gly

100 105 110

Leu Gly Val Trp Lys Leu Ala Pro Met Phe Lys Gly Val Gly Leu Ala

115 120 125

Ala Ala Val Leu Ser Phe Trp Leu Asn Ile Tyr Tyr Ile Val Ile Ile

130 135 140

Ser Trp Ala Ile Tyr Tyr Leu Tyr Asn Ser Phe Thr Thr Thr Leu Pro

145 150 155 160

Trp Lys Gln Cys Asp Asn Pro Trp Asn Thr Asp Arg Cys Phe Ser Asn

165 170 175

Tyr Ser Met Val Asn Thr Thr Asn Met Thr Ser Ala Val Val Glu Phe

180 185 190

Trp Glu Arg Asn Met His Gln Met Thr Asp Gly Leu Asp Lys Pro Gly

195 200 205

Gln Ile Arg Trp Pro Leu Ala Ile Thr Leu Ala Ile Ala Trp Ile Leu

210 215 220

Val Tyr Phe Cys Ile Trp Lys Gly Val Gly Trp Thr Gly Lys Val Val

225 230 235 240

Tyr Phe Ser Ala Thr Tyr Pro Tyr Ile Met Leu Ile Ile Leu Phe Phe

245 250 255

Arg Gly Val Thr Leu Pro Gly Ala Lys Glu Gly Ile Leu Phe Tyr Ile

260 265 270

Thr Pro Asn Phe Arg Lys Leu Ser Asp Ser Glu Val Trp Leu Asp Ala

275 280 285

Ala Thr Gln Ile Phe Phe Ser Tyr Gly Leu Gly Leu Gly Ser Leu Ile

290 295 300

Ala Leu Gly Ser Tyr Asn Ser Phe His Asn Asn Val Tyr Arg Asp Ser

305 310 315 320

Ile Ile Val Cys Cys Ile Asn Ser Cys Thr Ser Met Phe Ala Gly Phe

325 330 335

Val Ile Phe Ser Ile Val Gly Phe Met Ala His Val Thr Lys Arg Ser

340 345 350

Ile Ala Asp Val Ala Ala Ser Gly Pro Gly Leu Ala Phe Leu Ala Tyr

355 360 365

Pro Glu Ala Val Thr Gln Leu Pro Ile Ser Pro Leu Trp Ala Ile Leu

370 375 380

Phe Phe Ser Met Leu Leu Met Leu Gly Ile Asp Ser Gln Phe Cys Thr

385 390 395 400

Val Glu Gly Phe Ile Thr Ala Leu Val Asp Glu Tyr Pro Arg Leu Leu

405 410 415

Arg Asn Arg Arg Glu Leu Phe Ile Ala Ala Val Cys Ile Ile Ser Tyr

420 425 430

Leu Ile Gly Leu Ser Asn Ile Thr Gln Gly Gly Ile Tyr Val Phe Lys

435 440 445

Leu Phe Asp Tyr Tyr Ser Ala Ser Gly Met Ser Leu Leu Phe Leu Val

450 455 460

Phe Phe Glu Cys Val Ser Ile Ser Trp Phe Tyr Gly Val Asn Arg Phe

465 470 475 480

Tyr Asp Asn Ile Gln Glu Met Val Gly Ser Arg Pro Cys Ile Trp Trp

485 490 495

Lys Leu Cys Trp Ser Phe Phe Thr Pro Ile Ile Val Ala Gly Val Phe

500 505 510

Ile Phe Ser Ala Val Gln Met Thr Pro Leu Thr Met Gly Asn Tyr Val

515 520 525

Phe Pro Lys Trp Gly Gln Gly Val Gly Trp Leu Met Ala Leu Ser Ser

530 535 540

Met Val Leu Ile Pro Gly Tyr Met Ala Tyr Met Phe Leu Thr Leu Lys

545 550 555 560

Gly Ser Leu Lys Gln Arg Ile Gln Val Met Val Gln Pro Ser Glu Asp

565 570 575

Ile Val Arg Pro Glu Asn Gly Pro Glu Gln Pro Gln Ala Gly Ser Ser

580 585 590

Thr Ser Lys Glu Ala Tyr Ile

595

<210> 19

<211> 421

<212> PRT

<213> 人工序列

<220>

<223> 人类GAT-1同种型b

<400> 19

Met Val Asn Thr Thr Asn Met Thr Ser Ala Val Val Glu Phe Trp Glu

1 5 10 15

Arg Asn Met His Gln Met Thr Asp Gly Leu Asp Lys Pro Gly Gln Ile

20 25 30

Arg Trp Pro Leu Ala Ile Thr Leu Ala Ile Ala Trp Ile Leu Val Tyr

35 40 45

Phe Cys Ile Trp Lys Gly Val Gly Trp Thr Gly Lys Val Val Tyr Phe

50 55 60

Ser Ala Thr Tyr Pro Tyr Ile Met Leu Ile Ile Leu Phe Phe Arg Gly

65 70 75 80

Val Thr Leu Pro Gly Ala Lys Glu Gly Ile Leu Phe Tyr Ile Thr Pro

85 90 95

Asn Phe Arg Lys Leu Ser Asp Ser Glu Val Trp Leu Asp Ala Ala Thr

100 105 110

Gln Ile Phe Phe Ser Tyr Gly Leu Gly Leu Gly Ser Leu Ile Ala Leu

115 120 125

Gly Ser Tyr Asn Ser Phe His Asn Asn Val Tyr Arg Asp Ser Ile Ile

130 135 140

Val Cys Cys Ile Asn Ser Cys Thr Ser Met Phe Ala Gly Phe Val Ile

145 150 155 160

Phe Ser Ile Val Gly Phe Met Ala His Val Thr Lys Arg Ser Ile Ala

165 170 175

Asp Val Ala Ala Ser Gly Pro Gly Leu Ala Phe Leu Ala Tyr Pro Glu

180 185 190

Ala Val Thr Gln Leu Pro Ile Ser Pro Leu Trp Ala Ile Leu Phe Phe

195 200 205

Ser Met Leu Leu Met Leu Gly Ile Asp Ser Gln Phe Cys Thr Val Glu

210 215 220

Gly Phe Ile Thr Ala Leu Val Asp Glu Tyr Pro Arg Leu Leu Arg Asn

225 230 235 240

Arg Arg Glu Leu Phe Ile Ala Ala Val Cys Ile Ile Ser Tyr Leu Ile

245 250 255

Gly Leu Ser Asn Ile Thr Gln Gly Gly Ile Tyr Val Phe Lys Leu Phe

260 265 270

Asp Tyr Tyr Ser Ala Ser Gly Met Ser Leu Leu Phe Leu Val Phe Phe

275 280 285

Glu Cys Val Ser Ile Ser Trp Phe Tyr Gly Val Asn Arg Phe Tyr Asp

290 295 300

Asn Ile Gln Glu Met Val Gly Ser Arg Pro Cys Ile Trp Trp Lys Leu

305 310 315 320

Cys Trp Ser Phe Phe Thr Pro Ile Ile Val Ala Gly Val Phe Ile Phe

325 330 335

Ser Ala Val Gln Met Thr Pro Leu Thr Met Gly Asn Tyr Val Phe Pro

340 345 350

Lys Trp Gly Gln Gly Val Gly Trp Leu Met Ala Leu Ser Ser Met Val

355 360 365

Leu Ile Pro Gly Tyr Met Ala Tyr Met Phe Leu Thr Leu Lys Gly Ser

370 375 380

Leu Lys Gln Arg Ile Gln Val Met Val Gln Pro Ser Glu Asp Ile Val

385 390 395 400

Arg Pro Glu Asn Gly Pro Glu Gln Pro Gln Ala Gly Ser Ser Thr Ser

405 410 415

Lys Glu Ala Tyr Ile

420

<210> 20

<211> 421

<212> PRT

<213> 人工序列

<220>

<223> 人类GAT-1同种型c

<400> 20

Met Val Asn Thr Thr Asn Met Thr Ser Ala Val Val Glu Phe Trp Glu

1 5 10 15

Arg Asn Met His Gln Met Thr Asp Gly Leu Asp Lys Pro Gly Gln Ile

20 25 30

Arg Trp Pro Leu Ala Ile Thr Leu Ala Ile Ala Trp Ile Leu Val Tyr

35 40 45

Phe Cys Ile Trp Lys Gly Val Gly Trp Thr Gly Lys Val Val Tyr Phe

50 55 60

Ser Ala Thr Tyr Pro Tyr Ile Met Leu Ile Ile Leu Phe Phe Arg Gly

65 70 75 80

Val Thr Leu Pro Gly Ala Lys Glu Gly Ile Leu Phe Tyr Ile Thr Pro

85 90 95

Asn Phe Arg Lys Leu Ser Asp Ser Glu Val Trp Leu Asp Ala Ala Thr

100 105 110

Gln Ile Phe Phe Ser Tyr Gly Leu Gly Leu Gly Ser Leu Ile Ala Leu

115 120 125

Gly Ser Tyr Asn Ser Phe His Asn Asn Val Tyr Arg Asp Ser Ile Ile

130 135 140

Val Cys Cys Ile Asn Ser Cys Thr Ser Met Phe Ala Gly Phe Val Ile

145 150 155 160

Phe Ser Ile Val Gly Phe Met Ala His Val Thr Lys Arg Ser Ile Ala

165 170 175

Asp Val Ala Ala Ser Gly Pro Gly Leu Ala Phe Leu Ala Tyr Pro Glu

180 185 190

Ala Val Thr Gln Leu Pro Ile Ser Pro Leu Trp Ala Ile Leu Phe Phe

195 200 205

Ser Met Leu Leu Met Leu Gly Ile Asp Ser Gln Phe Cys Thr Val Glu

210 215 220

Gly Phe Ile Thr Ala Leu Val Asp Glu Tyr Pro Arg Leu Leu Arg Asn

225 230 235 240

Arg Arg Glu Leu Phe Ile Ala Ala Val Cys Ile Ile Ser Tyr Leu Ile

245 250 255

Gly Leu Ser Asn Ile Thr Gln Gly Gly Ile Tyr Val Phe Lys Leu Phe

260 265 270

Asp Tyr Tyr Ser Ala Ser Gly Met Ser Leu Leu Phe Leu Val Phe Phe

275 280 285

Glu Cys Val Ser Ile Ser Trp Phe Tyr Gly Val Asn Arg Phe Tyr Asp

290 295 300

Asn Ile Gln Glu Met Val Gly Ser Arg Pro Cys Ile Trp Trp Lys Leu

305 310 315 320

Cys Trp Ser Phe Phe Thr Pro Ile Ile Val Ala Gly Val Phe Ile Phe

325 330 335

Ser Ala Val Gln Met Thr Pro Leu Thr Met Gly Asn Tyr Val Phe Pro

340 345 350

Lys Trp Gly Gln Gly Val Gly Trp Leu Met Ala Leu Ser Ser Met Val

355 360 365

Leu Ile Pro Gly Tyr Met Ala Tyr Met Phe Leu Thr Leu Lys Gly Ser

370 375 380

Leu Lys Gln Arg Ile Gln Val Met Val Gln Pro Ser Glu Asp Ile Val

385 390 395 400

Arg Pro Glu Asn Gly Pro Glu Gln Pro Gln Ala Gly Ser Ser Thr Ser

405 410 415

Lys Glu Ala Tyr Ile

420

<210> 21

<211> 6922

<212> DNA

<213> 人工序列

<220>

<223> AAV9 hu14

<400> 21

agaaaaactc atcgagcatc aaatgaaatt gcaatttatt catatcagga ttatcaatac 60

catatttttg aaaaagccgt ttctgtaatg aaggagaaaa ctcaccgagg cagttccata 120

ggatggcaag atcctggtat cggtctgcga ttccgactcg tccaacatca atacaaccta 180

ttaatttccc ctcgtcaaaa ataaggttat caagtgagaa atcaccatga gtgacgactg 240

aatccggtga gaatggcaaa agtttatgca tttctttcca gacttgttca acaggccagc 300

cattacgctc gtcatcaaaa tcactcgcat caaccaaacc gttattcatt cgtgattgcg 360

cctgagcgag gcgaaatacg cgatcgctgt taaaaggaca attacaaaca ggaatcgagt 420

gcaaccggcg caggaacact gccagcgcat caacaatatt ttcacctgaa tcaggatatt 480

cttctaatac ctggaacgct gtttttccgg ggatcgcagt ggtgagtaac catgcatcat 540

caggagtacg gataaaatgc ttgatggtcg gaagtggcat aaattccgtc agccagttta 600

gtctgaccat ctcatctgta acatcattgg caacgctacc tttgccatgt ttcagaaaca 660

actctggcgc atcgggcttc ccatacaagc gatagattgt cgcacctgat tgcccgacat 720

tatcgcgagc ccatttatac ccatataaat cagcatccat gttggaattt aatcgcggcc 780

tcgacgtttc ccgttgaata tggctcatat tcttcctttt tcaatattat tgaagcattt 840

atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa 900

taggggtcag tgttacaacc aattaaccaa ttctgaacat tatcgcgagc ccatttatac 960

ctgaatatgg ctcataacac cccttgtttg cctggcggca gtagcgcggt ggtcccacct 1020

gaccccatgc cgaactcaga agtgaaacgc cgtagcgccg atggtagtgt ggggactccc 1080

catgcgagag tagggaactg ccaggcatca aataaaacga aaggctcagt cgaaagactg 1140

ggcctttcgc ccgggctaat tagggggtgt cgcccttcgc tgaagtcctg tattagaggt 1200

cacgtgagtg ttttgcgaca ttttgcgaca ccatgtggtc acgctgggta tttaagcccg 1260

agtgagcacg cagggtctcc attttgaagc gggaggtttg aacgcgcagc cgccatgccg 1320

gggttttacg agattgtgat taaggtcccc agcgaccttg acgagcatct gcccggcatt 1380

tctgacagct ttgtgaactg ggtggccgag aaggaatggg agttgccgcc agattctgac 1440

atggatctga atctgattga gcaggcaccc ctgaccgtgg ccgagaagct gcagcgcgac 1500

tttctgacgg aatggcgccg tgtgagtaag gccccggagg cccttttctt tgtgcaattt 1560

gagaagggag agagctactt ccacatgcac gtgctcgtgg aaaccaccgg ggtgaaatcc 1620

atggttttgg gacgtttcct gagtcagatt cgcgaaaaac tgattcagag aatttaccgc 1680

gggatcgagc cgactttgcc aaactggttc gcggtcacaa agaccagaaa tggcgccgga 1740

ggcgggaaca aggtggtgga tgagtgctac atccccaatt acttgctccc caaaacccag 1800

cctgagctcc agtgggcgtg gactaatatg gaacagtatt taagcgcctg tttgaatctc 1860

acggagcgta aacggttggt ggcgcagcat ctgacgcacg tgtcgcagac gcaggagcag 1920

aacaaagaga atcagaatcc caattctgat gcgccggtga tcagatcaaa aacttcagcc 1980

aggtacatgg agctggtcgg gtggctcgtg gacaagggga ttacctcgga gaagcagtgg 2040

atccaggagg accaggcctc atacatctcc ttcaatgcgg cctccaactc gcggtcccaa 2100

atcaaggctg ccttggacaa tgcgggaaag attatgagcc tgactaaaac cgcccccgac 2160

tacctggtgg gccagcagcc cgtggaggac atttccagca atcggattta taaaattttg 2220

gaactaaacg ggtacgatcc ccaatatgcg gcttccgtct ttctgggatg ggccacgaaa 2280

aagttcggca agaggaacac catctggctg tttgggcctg caactaccgg gaagaccaac 2340

atcgcggagg ccatagccca cactgtgccc ttctacgggt gcgtaaactg gaccaatgag 2400

aactttccct tcaacgactg tgtcgacaag atggtgatct ggtgggagga ggggaagatg 2460

accgccaagg tcgtggagtc ggccaaagcc attctcggag gaagcaaggt gcgcgtggac 2520

cagaaatgca agtcctcggc ccagatagac ccgactcccg tgatcgtcac ctccaacacc 2580

aacatgtgcg ccgtgattga cgggaactca acgaccttcg aacaccagca gccgttgcaa 2640

gaccggatgt tcaaatttga actcacccgc cgtctggatc atgactttgg gaaggtcacc 2700

aagcaggaag tcaaagactt tttccggtgg gcaaaggatc acgtggttga ggtggagcat 2760

gaattctacg tcaaaaaggg tggagccaag aaaagacccg cccccagtga cgcagatata 2820

agtgagccca aacgggtgcg cgagtcagtt gcgcagccat cgacgtcaga cgcggaagct 2880

tcgatcaact acgcaggaca ggtaccaaaa caaatgttct cgtcacgtgg gcatgaatct 2940

gatgctgttt ccctgcagac aatgcgagag actgaatcag aattcaaata tctgcttcac 3000

tcacggtgtc aaagactgtt tagagtgctt tcccgtgtca gaatctcaac ccgtttctgt 3060

cgtcaaaaag gcgtatcaga aactgtgcta cattcatcac atcatgggaa aggtgccaga 3120

cgcttgcact gcttgcgacc tggtcaatgt ggacttggat gactgtgttt ctgaacaata 3180

aatgacttaa accaggtatg gctgccgatg gttatcttcc agattggctc gaggacaacc 3240

ttagtgaagg aattcgcgag tggtgggctt tgaaacctgg agcccctcaa cccaaggcaa 3300

atcaacaaca tcaagacaac gctcgaggtc ttgtgcttcc gggttacaaa taccttggac 3360

ccggcaacgg actcgacaag ggggagccgg tcaacgcagc agacgcggcg gccctcgagc 3420

acgacaaggc ctacgaccag cagctcaagg ccggagacaa cccgtacctc aagtacaacc 3480

acgccgacgc cgagttccag gagcggctca aagaagatac gtcttttggg ggcaacctcg 3540

ggcgagcagt cttccaggcc aaaaagaggc ttcttgaacc tcttggtctg gttgaggaag 3600

cggctaagac ggctcctgga aagaagaggc ctgtagagca gtctcctcag gaaccggact 3660

cctccgcggg tattggcaaa tcgggtgcac agcccgctaa aaagagactc aatttcggtc 3720

agactggcga cacagagtca gtcccagacc ctcaaccaat cggagaacct cccgcagccc 3780

cctcaggtgt gggatctctt acaatggctt caggtggtgg cgcaccagtg gcagacaata 3840

acgaaggtgc cgatggagtg ggtagttcct cgggaaattg gcattgcgat tcccaatggc 3900

tgggggacag agtcatcacc accagcaccc gaacctgggc cctgcccacc tacaacaatc 3960

acctctacaa gcaaatctcc aacagcacat ctggaggatc ttcaaatgac aacgcctact 4020

tcggctacag caccccctgg gggtattttg acttcaacag attccactgc cacttctcac 4080

cacgtgactg gcagcgactc atcaacaaca actggggatt ccggcctaag cgactcaact 4140

tcaagctctt caacattcag gtcaaagagg ttacggacaa caatggagtc aagaccatcg 4200

ccaataacct taccagcacg gtccaggtct tcacggactc agactatcag ctcccgtacg 4260

tgctcgggtc ggctcacgag ggctgcctcc cgccgttccc agcggacgtt ttcatgattc 4320

ctcagtacgg gtatctgacg cttaatgatg gaagccaggc cgtgggtcgt tcgtcctttt 4380

actgcctgga atatttcccg tcgcaaatgc taagaacggg taacaacttc cagttcagct 4440

acgagtttga gaacgtacct ttccatagca gctacgctca cagccaaagc ctggaccgac 4500

taatgaatcc actcatcgac caatacttgt actatctctc aaagactatt aacggttctg 4560

gacagaatca acaaacgcta aaattcagtg tggccggacc cagcaacatg gctgtccagg 4620

gaagaaacta catacctgga cccagctacc gacaacaacg tgtctcaacc actgtgactc 4680

aaaacaacaa cagcgaattt gcttggcctg gagcttcttc ttgggctctc aatggacgta 4740

atagcttgat gaatcctgga cctgctatgg ccagccacaa agaaggagag gaccgtttct 4800

ttcctttgtc tggatcttta atttttggca aacaaggaac tggaagagac aacgtggatg 4860

cggacaaagt catgataacc aacgaagaag aaattaaaac tactaacccg gtagcaacgg 4920

agtcctatgg acaagtggcc acaaaccacc agagtgccca agcacaggcg cagaccggct 4980

gggttcaaaa ccaaggaata cttccgggta tggtttggca ggacagagat gtgtacctgc 5040

aaggacccat ttgggccaaa attcctcaca cggacggcaa ctttcaccct tctccgctga 5100

tgggagggtt tggaatgaag cacccgcctc ctcagatcct catcaaaaac acacctgtac 5160

ctgcggatcc tccaacggcc ttcaacaagg acaagctgaa ctctttcatc acccagtatt 5220

ctactggcca agtcagcgtg gagatcgagt gggagctgca gaaggaaaac agcaagcgct 5280

ggaacccgga gatccagtac acttccaact attacaagtc taataatgtt gaatttgctg 5340

ttaatactga aggtgtatat agtgaacccc gccccattgg caccagatac ctgactcgta 5400

atctgtaatt gcttgttaat caataaaccg tttaattcgt ttcagttgaa ctttggtctc 5460

tgcgcgtcaa aagggcgaca caaaatttat tctaaatgca taataaatac tgataacatc 5520

ttatagtttg tattatattt tgtattatcg ttgacatgta taattttgat atcaaaaact 5580

gattttccct ttattatttt cgagatttat tttcttaatt ctctttaaca aactagaaat 5640

attgtatata caaaaaatca taaataatag atgaatagtt taattatagg tgttcatcaa 5700

tcgaaaaagc aacgtatctt atttaaagtg cgttgctttt ttctcattta taaggttaaa 5760

taattctcat atatcaagca aagtgacagg cgcccttaaa tattctgaca aatgctcttt 5820

ccctaaactc cccccataaa aaaacccgcc gaagcgggtt tttacgttat ttgcggatta 5880

acgattactc gttatcagaa ccgcccaggg ggcccgagct taagactggc cgtcgtttta 5940

caacacagaa agagtttgta gaaacgcaaa aaggccatcc gtcaggggcc ttctgcttag 6000

tttgatgcct ggcagttccc tactctcgcc ttccgcttcc tcgctcactg actcgctgcg 6060

ctcggtcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc 6120

cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag 6180

gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca 6240

tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca 6300

ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg 6360

atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag 6420

gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt 6480

tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca 6540

cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg 6600

cggtgctaca gagttcttga agtggtgggc taactacggc tacactagaa gaacagtatt 6660

tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc 6720

cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg 6780

cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg 6840

gaacgacgcg cgcgtaactc acgttaaggg attttggtca tgagcttgcg ccgtcccgtc 6900

aagtcagcgt aatgctctgc tt 6922

<210> 22

<211> 128

<212> DNA

<213> 人工序列

<220>

<223> 5' ITR

<400> 22

aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg ctcactgagg 60

ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca gtgagcgagc 120

gagcgcgc 128

<210> 23

<211> 128

<212> DNA

<213> 人工序列

<220>

<223> 3' ITR

<400> 23

gcgcgctcgc tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgacctttgg 60

tcgcccggcc tcagtgagcg agcgagcgcg cagagaggga gtggccaact ccatcactag 120

gggttcct 128

<210> 24

<211> 735

<212> PRT

<213> 人工序列

<220>

<223> AAV真型

<400> 24

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Thr Leu Ser

1 5 10 15

Glu Gly Ile Arg Gln Trp Trp Lys Leu Lys Pro Gly Pro Pro Pro Pro

20 25 30

Lys Pro Ala Glu Arg His Lys Asp Asp Ser Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Glu Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Arg Gln Leu Asp Ser Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Ile Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Pro Val Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Glu His Ser Pro Ala Glu Pro Asp Ser Ser Ser Gly Thr Gly

145 150 155 160

Lys Ser Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Ala Asp Ser Val Pro Asp Pro Gln Pro Leu Gly Gln Pro Pro

180 185 190

Ala Ala Pro Ser Gly Leu Gly Thr Asn Thr Met Ala Ser Gly Ser Gly

195 200 205

Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ser

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Thr Trp Met Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Ser Gln Ser Gly Ala Ser Asn Asp Asn His Tyr

260 265 270

Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe His

275 280 285

Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn Trp

290 295 300

Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn Ile Gln Val

305 310 315 320

Lys Glu Val Thr Gln Asn Asp Gly Thr Thr Thr Ile Ala Asn Asn Leu

325 330 335

Thr Ser Thr Val Gln Val Phe Thr Asp Ser Glu Tyr Gln Leu Pro Tyr

340 345 350

Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala Asp

355 360 365

Val Phe Met Val Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly Ser

370 375 380

Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro Ser

385 390 395 400

Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe Glu

405 410 415

Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp Arg

420 425 430

Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser Arg Thr

435 440 445

Asn Thr Pro Ser Gly Thr Thr Thr Met Ser Arg Leu Gln Phe Ser Gln

450 455 460

Ala Gly Ala Ser Asp Ile Arg Asp Gln Ser Arg Asn Trp Leu Pro Gly

465 470 475 480

Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Ala Ala Asp Asn Asn

485 490 495

Asn Ser Asp Tyr Ser Trp Thr Gly Ala Thr Lys Tyr His Leu Asn Gly

500 505 510

Arg Asp Ser Leu Val Asn Pro Gly Pro Ala Met Ala Ser His Lys Asp

515 520 525

Asp Glu Glu Lys Tyr Phe Pro Gln Ser Gly Val Leu Ile Phe Gly Lys

530 535 540

Gln Asp Ser Gly Lys Thr Asn Val Asp Ile Glu Lys Val Met Ile Thr

545 550 555 560

Asp Glu Glu Glu Ile Arg Thr Thr Asn Pro Val Ala Thr Glu Gln Tyr

565 570 575

Gly Ser Val Ser Thr Asn Leu Gln Ser Gly Asn Thr Gln Ala Ala Thr

580 585 590

Ser Asp Val Asn Thr Gln Gly Val Leu Pro Gly Met Val Trp Gln Asp

595 600 605

Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His Thr

610 615 620

Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu Lys

625 630 635 640

His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala Asn

645 650 655

Pro Ser Thr Thr Phe Ser Ala Ala Lys Phe Ala Ser Phe Ile Thr Gln

660 665 670

Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln Lys

675 680 685

Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn Tyr

690 695 700

Asn Lys Ser Val Asn Val Asp Phe Thr Val Asp Thr Asn Gly Val Tyr

705 710 715 720

Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu

725 730 735

<210> 25

<211> 736

<212> PRT

<213> 人工序列

<220>

<223> AAV9

<400> 25

Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser

1 5 10 15

Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Gln Pro

20 25 30

Lys Ala Asn Gln Gln His Gln Asp Asn Ala Arg Gly Leu Val Leu Pro

35 40 45

Gly Tyr Lys Tyr Leu Gly Pro Gly Asn Gly Leu Asp Lys Gly Glu Pro

50 55 60

Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp

65 70 75 80

Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Lys Tyr Asn His Ala

85 90 95

Asp Ala Glu Phe Gln Glu Arg Leu Lys Glu Asp Thr Ser Phe Gly Gly

100 105 110

Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Leu Leu Glu Pro

115 120 125

Leu Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg

130 135 140

Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ala Gly Ile Gly

145 150 155 160

Lys Ser Gly Ala Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr

165 170 175

Gly Asp Thr Glu Ser Val Pro Asp Pro Gln Pro Ile Gly Glu Pro Pro

180 185 190

Ala Ala Pro Ser Gly Val Gly Ser Leu Thr Met Ala Ser Gly Gly Gly

195 200 205

Ala Pro Val Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser Ser

210 215 220

Ser Gly Asn Trp His Cys Asp Ser Gln Trp Leu Gly Asp Arg Val Ile

225 230 235 240

Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu

245 250 255

Tyr Lys Gln Ile Ser Asn Ser Thr Ser Gly Gly Ser Ser Asn Asp Asn

260 265 270

Ala Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg

275 280 285

Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn

290 295 300

Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile

305 310 315 320

Gln Val Lys Glu Val Thr Asp Asn Asn Gly Val Lys Thr Ile Ala Asn

325 330 335

Asn Leu Thr Ser Thr Val Gln Val Phe Thr Asp Ser Asp Tyr Gln Leu

340 345 350

Pro Tyr Val Leu Gly Ser Ala His Glu Gly Cys Leu Pro Pro Phe Pro

355 360 365

Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asp

370 375 380

Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe

385 390 395 400

Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Ser Tyr Glu

405 410 415

Phe Glu Asn Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu

420 425 430

Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Ser

435 440 445

Lys Thr Ile Asn Gly Ser Gly Gln Asn Gln Gln Thr Leu Lys Phe Ser

450 455 460

Val Ala Gly Pro Ser Asn Met Ala Val Gln Gly Arg Asn Tyr Ile Pro

465 470 475 480

Gly Pro Ser Tyr Arg Gln Gln Arg Val Ser Thr Thr Val Thr Gln Asn

485 490 495

Asn Asn Ser Glu Phe Ala Trp Pro Gly Ala Ser Ser Trp Ala Leu Asn

500 505 510

Gly Arg Asn Ser Leu Met Asn Pro Gly Pro Ala Met Ala Ser His Lys

515 520 525

Glu Gly Glu Asp Arg Phe Phe Pro Leu Ser Gly Ser Leu Ile Phe Gly

530 535 540

Lys Gln Gly Thr Gly Arg Asp Asn Val Asp Ala Asp Lys Val Met Ile

545 550 555 560

Thr Asn Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr Glu Ser

565 570 575

Tyr Gly Gln Val Ala Thr Asn His Gln Ser Ala Gln Ala Gln Ala Gln

580 585 590

Thr Gly Trp Val Gln Asn Gln Gly Ile Leu Pro Gly Met Val Trp Gln

595 600 605

Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His

610 615 620

Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Met

625 630 635 640

Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala

645 650 655

Asp Pro Pro Thr Ala Phe Asn Lys Asp Lys Leu Asn Ser Phe Ile Thr

660 665 670

Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln

675 680 685

Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr Ser Asn

690 695 700

Tyr Tyr Lys Ser Asn Asn Val Glu Phe Ala Val Asn Thr Glu Gly Val

705 710 715 720

Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Asn Leu

725 730 735

<210> 26

<211> 4417

<212> DNA

<213> 人工序列

<220>

<223> 人类SLC6A1 转录物变体2 (同种型a)

<400> 26

gccctcggaa gaccgagaca gcggagaggt tgcgggtgag ctgcgctgag cccaggagcc 60

gaggagtcgg gagcgcagta gcgctgagcc cgagcccgag cggccccgcg tcccgagcgc 120

atcggagcgg ccgagccgcc cggatgcagc gcctgtcccg ggcagcgcag ccccggccgc 180

aggatctcac ccagggtggc agaaggaggc cttctggagc tgacccaccc ccgacgacca 240

tcagggtgcc cttgagccgc aaaactgctg tccacgtgga ccgggggtga catcgcacgt 300

ccatctgcca ggacccctgc gtccaaattc cgagacatgg cgaccaacgg cagcaaggtg 360

gccgacgggc agatctccac cgaggtcagc gaggcccctg tggccaatga caagcccaaa 420

accttggtgg tcaaggtgca gaagaaggcg gcagacctcc ccgaccggga cacgtggaag 480

ggccgcttcg acttcctcat gtcctgtgtg ggctatgcca tcggcctggg caacgtctgg 540

aggttcccct atctctgcgg gaaaaatggt gggggagcct tcctgatccc ctatttcctg 600

acactcatct ttgcgggggt cccactcttc ctgctggagt gctccctggg ccagtacacc 660

tccatcgggg ggctaggggt atggaagctg gctcctatgt tcaagggcgt gggccttgcg 720

gctgctgtgc tatcattctg gctgaacatc tactacatcg tcatcatctc ctgggccatt 780

tactacctgt acaactcctt caccacgaca ctgccgtgga aacagtgcga caacccctgg 840

aacacagacc gctgcttctc caactacagc atggtcaaca ctaccaacat gaccagcgct 900

gtggtggagt tctgggagcg caacatgcat cagatgacgg acgggctgga taagccaggt 960

cagatccgct ggccactggc catcacgctg gccatcgcct ggatccttgt gtatttctgt 1020

atctggaagg gtgttggctg gactggaaag gtggtctact tttcagccac atacccctac 1080

atcatgctga tcatcctgtt cttccgtgga gtgacgctgc ccggggccaa ggagggcatc 1140

ctcttctaca tcacacccaa cttccgcaag ctgtctgact ccgaggtgtg gctggatgcg 1200

gcaacccaga tcttcttctc atacgggctg ggcctggggt ccctgatcgc tctcgggagc 1260

tacaactctt tccacaacaa tgtctacagg gactccatca tcgtctgctg catcaattcg 1320

tgcaccagca tgttcgcagg attcgtcatc ttctccatcg tgggcttcat ggcccatgtc 1380

accaagaggt ccattgctga tgtggcggcc tcaggccccg ggctggcgtt cctggcatac 1440

ccagaggcgg tgacccagct gcctatctcc ccactctggg ccatcctctt cttctccatg 1500

ctgttgatgc tgggcattga cagccagttc tgcactgtgg agggcttcat cacagccctg 1560

gtggatgagt accccaggct cctccgcaac cgcagagagc tcttcattgc tgctgtctgc 1620

atcatctcct acctgatcgg tctctctaac atcactcagg ggggtattta tgtcttcaaa 1680

ctctttgact actactctgc cagtggcatg agcctgctgt tcctcgtgtt ctttgaatgt 1740

gtctctattt cctggtttta cggtgtcaac cgattctatg acaatatcca agagatggtt 1800

ggatccaggc cctgcatctg gtggaaactc tgctggtctt tcttcacacc aatcattgtg 1860

gcgggcgtgt tcattttcag tgctgtgcag atgacgccac tcaccatggg aaactatgtt 1920

ttccccaagt ggggccaggg tgtgggctgg ctgatggctc tgtcttccat ggtcctcatc 1980

cccgggtaca tggcctacat gttcctcacc ttaaagggct ccctgaagca gcgcatccaa 2040

gtcatggtcc agcccagcga agacatcgtt cgcccagaga atggtcctga gcagccccag 2100

gcgggcagct ccaccagcaa ggaggcctac atctagggtg ggggccactc accgacccga 2160

cactctcacc ccccgacctg gctgagtgcg accaccactt gatgtctgag gataccttcc 2220

atctcaacct acctcgagtg gcgagtccag acaccatcac cacgcagaga ggggaggtgg 2280

gaggacagtt agacccctgg gtgggccctg ccgtgggcaa ggatacccgg tggcttctgg 2340

cacctggcgg gctggtgacc tttttaatcc aggccccatc agcatcccac gatcggcctt 2400

ggtaaccgcc gcggtagatc atttttatcc cgccagggag tgtgatgcag gaagaccaca 2460

tgcgctcctg gcttttaaac ctgttcctga ctgttctctt actgccgaaa cccttgactg 2520

ttatctcgga ctttgcagga gttcctttcc ctccgaacgc tgctccatgc acaggaaaag 2580

ggcattttgt acaatgggga cttcccggga acgcttgctc ttaagtacca gaagccggcg 2640

gagctctggc tttcgtgttt ttggttttct ccttcccaag gcagctggat tgaaaaaaca 2700

aaacaaaaca aaaaaaccca ggggcgtcag tcgatattcc cagggccgct tctcctgcag 2760

tctgtggagc gtccttgtcc ccgccgccgg aatgaatgag cattctgcag cccgatgtcc 2820

ctgtcccctc ctcgccgggc cattctgatt ggacctggcc cagtgcaatc tgtccagaca 2880

agccctgctt gctggaaaac tgccacaagc acaattgatc tctttttatc gccattccag 2940

gggcctcagg tcctactggg gaaacttcct ataccggagc tccagtttct cttaagctgc 3000

ccaatttcac agagtacaaa atagttgtag gggaaatcaa ggtgaaggat ctgtccgaca 3060

gtcaagacgg atccacagta atctttcggt ctccttaaac taccaccctc gctgccaccc 3120

accccaagct gctgccgcct caccttcctt gaaatttctc agcgggagtc tcctcactgc 3180

cactaaaatc cacccagccc actaactgag gagctagtgt taatccagag aaccccccgc 3240

aatgtgcttc cgagattcag actgcttcat tgggaagtat gatttgttcc tttctggaat 3300

tgggctccgt ggtggcggcg gcacttcaag caaagacagt ttcttgcaag ctccagtagc 3360

tccgcgtgtc tcatttgcca ggaagatggg ttcccacgta gcaaatcgta cattgtgccc 3420

tgtagctcct tagctagtta gctcacaagc cgtgttttat gactaatcct taataactat 3480

ggtaaataac tgtgactgtg gggtttttaa tctcttgtca ttctcatcca aaagtgacca 3540

gcataccagt tcttgcaata agatattacc ctcagaatat taagcacatt attgtagaga 3600

aaaaaaaata tgtgtacaca tatgaacgca caacatgcac attcatcctc acatgtggca 3660

cgtaaggtct catttgatat tgtgtaggaa atctgaagcc ttttcctgag gtcatctgta 3720

aaatagtctc attgccaagg catccccagt gccagctggt gaatccatga tcaaaatgca 3780

tacgtattgt taaatgataa ggtttagaat gacaggaacc catcactgtg tctcatggtc 3840

ccacttcccc atctgtgtgt gaattccttt agactaaggg caggaagact tccagctttc 3900

tctttgttct tcaatgtgaa actgagacca agtctctcta agacaaatgc agtgtattta 3960

atgtttgtaa gcaattctaa gtgagatgtt tggcaagaaa tcccctaact gatttccatc 4020

caaacctacc ttatagagca caatattaag tgttgtacaa ttactgtgag aactgtgaat 4080

atgtgtaact tttttttagt atttgcccgg ggggaaaaag atattgtatt atcatatatg 4140

cttttttgca ataaggattt attctcagaa caccaagtaa atctatctct atataaaaaa 4200

tatatgtaat atatacatat tcaaagtata tacagagcct gttttaaaaa atacagtatt 4260

atttagtaaa attatctgtt ctatggacca aatgtaaaat atttataaat gaagatgcat 4320

tttaaatgtc tataaatggt gtcataacta gagcacgggc gttatgtaag tttctaagaa 4380

tttagaggat aaataataaa ggttctatga tatacaa 4417

<210> 27

<211> 4227

<212> DNA

<213> 人工序列

<220>

<223> 人类SLC6A1 转录物变体3 (同种型b)

<400> 27

gccctcggaa gaccgagaca gcggagaggt tgcgggtgag ctgcgctgag cccaggagcc 60

gaggagtcgg gagcgcagta gcgctgagcc cgagcccgag cggccccgcg tcccgagcgc 120

atcggagcgg ccgagccgcc cggatgcagc gcctgtcccg ggcagcgcag ccccggccgc 180

aggatctcac ccagggtggc agaaggaggc cttctggagc tgacccaccc ccgacgacca 240

tcagggtgcc cttgagccgc aaaactgctg tccacgtgga ccgggggtga catcgcacgt 300

ccatctgcca ggacccctgc gtccaaattc cgagacatgg cgaccaacgg cagcaaggtg 360

gccgacgggc agatctccac cgaggagcct tcctgatccc ctatttcctg acactcatct 420

ttgcgggggt cccactcttc ctgctggagt gctccctggg ccagtacacc tccatcgggg 480

ggctaggggt atggaagctg gctcctatgt tcaagggcgt gggccttgcg gctgctgtgc 540

tatcattctg gctgaacatc tactacatcg tcatcatctc ctgggccatt tactacctgt 600

acaactcctt caccacgaca ctgccgtgga aacagtgcga caacccctgg aacacagacc 660

gctgcttctc caactacagc atggtcaaca ctaccaacat gaccagcgct gtggtggagt 720

tctgggagcg caacatgcat cagatgacgg acgggctgga taagccaggt cagatccgct 780

ggccactggc catcacgctg gccatcgcct ggatccttgt gtatttctgt atctggaagg 840

gtgttggctg gactggaaag gtggtctact tttcagccac atacccctac atcatgctga 900

tcatcctgtt cttccgtgga gtgacgctgc ccggggccaa ggagggcatc ctcttctaca 960

tcacacccaa cttccgcaag ctgtctgact ccgaggtgtg gctggatgcg gcaacccaga 1020

tcttcttctc atacgggctg ggcctggggt ccctgatcgc tctcgggagc tacaactctt 1080

tccacaacaa tgtctacagg gactccatca tcgtctgctg catcaattcg tgcaccagca 1140

tgttcgcagg attcgtcatc ttctccatcg tgggcttcat ggcccatgtc accaagaggt 1200

ccattgctga tgtggcggcc tcaggccccg ggctggcgtt cctggcatac ccagaggcgg 1260

tgacccagct gcctatctcc ccactctggg ccatcctctt cttctccatg ctgttgatgc 1320

tgggcattga cagccagttc tgcactgtgg agggcttcat cacagccctg gtggatgagt 1380

accccaggct cctccgcaac cgcagagagc tcttcattgc tgctgtctgc atcatctcct 1440

acctgatcgg tctctctaac atcactcagg ggggtattta tgtcttcaaa ctctttgact 1500

actactctgc cagtggcatg agcctgctgt tcctcgtgtt ctttgaatgt gtctctattt 1560

cctggtttta cggtgtcaac cgattctatg acaatatcca agagatggtt ggatccaggc 1620

cctgcatctg gtggaaactc tgctggtctt tcttcacacc aatcattgtg gcgggcgtgt 1680

tcattttcag tgctgtgcag atgacgccac tcaccatggg aaactatgtt ttccccaagt 1740

ggggccaggg tgtgggctgg ctgatggctc tgtcttccat ggtcctcatc cccgggtaca 1800

tggcctacat gttcctcacc ttaaagggct ccctgaagca gcgcatccaa gtcatggtcc 1860

agcccagcga agacatcgtt cgcccagaga atggtcctga gcagccccag gcgggcagct 1920

ccaccagcaa ggaggcctac atctagggtg ggggccactc accgacccga cactctcacc 1980

ccccgacctg gctgagtgcg accaccactt gatgtctgag gataccttcc atctcaacct 2040

acctcgagtg gcgagtccag acaccatcac cacgcagaga ggggaggtgg gaggacagtt 2100

agacccctgg gtgggccctg ccgtgggcaa ggatacccgg tggcttctgg cacctggcgg 2160

gctggtgacc tttttaatcc aggccccatc agcatcccac gatcggcctt ggtaaccgcc 2220

gcggtagatc atttttatcc cgccagggag tgtgatgcag gaagaccaca tgcgctcctg 2280

gcttttaaac ctgttcctga ctgttctctt actgccgaaa cccttgactg ttatctcgga 2340

ctttgcagga gttcctttcc ctccgaacgc tgctccatgc acaggaaaag ggcattttgt 2400

acaatgggga cttcccggga acgcttgctc ttaagtacca gaagccggcg gagctctggc 2460

tttcgtgttt ttggttttct ccttcccaag gcagctggat tgaaaaaaca aaacaaaaca 2520

aaaaaaccca ggggcgtcag tcgatattcc cagggccgct tctcctgcag tctgtggagc 2580

gtccttgtcc ccgccgccgg aatgaatgag cattctgcag cccgatgtcc ctgtcccctc 2640

ctcgccgggc cattctgatt ggacctggcc cagtgcaatc tgtccagaca agccctgctt 2700

gctggaaaac tgccacaagc acaattgatc tctttttatc gccattccag gggcctcagg 2760

tcctactggg gaaacttcct ataccggagc tccagtttct cttaagctgc ccaatttcac 2820

agagtacaaa atagttgtag gggaaatcaa ggtgaaggat ctgtccgaca gtcaagacgg 2880

atccacagta atctttcggt ctccttaaac taccaccctc gctgccaccc accccaagct 2940

gctgccgcct caccttcctt gaaatttctc agcgggagtc tcctcactgc cactaaaatc 3000

cacccagccc actaactgag gagctagtgt taatccagag aaccccccgc aatgtgcttc 3060

cgagattcag actgcttcat tgggaagtat gatttgttcc tttctggaat tgggctccgt 3120

ggtggcggcg gcacttcaag caaagacagt ttcttgcaag ctccagtagc tccgcgtgtc 3180

tcatttgcca ggaagatggg ttcccacgta gcaaatcgta cattgtgccc tgtagctcct 3240

tagctagtta gctcacaagc cgtgttttat gactaatcct taataactat ggtaaataac 3300

tgtgactgtg gggtttttaa tctcttgtca ttctcatcca aaagtgacca gcataccagt 3360

tcttgcaata agatattacc ctcagaatat taagcacatt attgtagaga aaaaaaaata 3420

tgtgtacaca tatgaacgca caacatgcac attcatcctc acatgtggca cgtaaggtct 3480

catttgatat tgtgtaggaa atctgaagcc ttttcctgag gtcatctgta aaatagtctc 3540

attgccaagg catccccagt gccagctggt gaatccatga tcaaaatgca tacgtattgt 3600

taaatgataa ggtttagaat gacaggaacc catcactgtg tctcatggtc ccacttcccc 3660

atctgtgtgt gaattccttt agactaaggg caggaagact tccagctttc tctttgttct 3720

tcaatgtgaa actgagacca agtctctcta agacaaatgc agtgtattta atgtttgtaa 3780

gcaattctaa gtgagatgtt tggcaagaaa tcccctaact gatttccatc caaacctacc 3840

ttatagagca caatattaag tgttgtacaa ttactgtgag aactgtgaat atgtgtaact 3900

tttttttagt atttgcccgg ggggaaaaag atattgtatt atcatatatg cttttttgca 3960

ataaggattt attctcagaa caccaagtaa atctatctct atataaaaaa tatatgtaat 4020

atatacatat tcaaagtata tacagagcct gttttaaaaa atacagtatt atttagtaaa 4080

attatctgtt ctatggacca aatgtaaaat atttataaat gaagatgcat tttaaatgtc 4140

tataaatggt gtcataacta gagcacgggc gttatgtaag tttctaagaa tttagaggat 4200

aaataataaa ggttctatga tatacaa 4227

<210> 28

<211> 4156

<212> DNA

<213> 人工序列

<220>

<223> 人类SLC6A1 转录物变体4 (同种型c)

<400> 28

gccctcggaa gaccgagaca gcggagaggt tgcgggtgag ctgcgctgag cccaggagcc 60

gaggagtcgg gagcgcagta gcgctgagcc cgagcccgag cggccccgcg tcccgagcgc 120

atcggagcgg ccgagccgcc cggatgcagc gcctgtcccg ggcagcgcag ccccggccgc 180

aggatctcac ccagggtggc agaaggaggc cttctggagc tgacccaccc ccgacgacca 240

tcagggtgag gcaactccaa ggtcctactc tctttctgtg cctgttaccc accccgtcct 300

cctagggtgc ccttgagccg caaaactgct gtccacgtgg accgggggtg acatcgcacg 360

tccatctgcc aggacccctg cgtccaaatt ccgagacatg gcgaccaacg gcagcaaggt 420

ggccgacggg cagatctcca ccgaggcgtg ggccttgcgg ctgctgtgct atcattctgg 480

ctgaacatct actacatcgt catcatctcc tgggccattt actacctgta caactccttc 540

accacgacac tgccgtggaa acagtgcgac aacccctgga acacagaccg ctgcttctcc 600

aactacagca tggtcaacac taccaacatg accagcgctg tggtggagtt ctgggagcgc 660

aacatgcatc agatgacgga cgggctggat aagccaggtc agatccgctg gccactggcc 720

atcacgctgg ccatcgcctg gatccttgtg tatttctgta tctggaaggg tgttggctgg 780

actggaaagg tggtctactt ttcagccaca tacccctaca tcatgctgat catcctgttc 840

ttccgtggag tgacgctgcc cggggccaag gagggcatcc tcttctacat cacacccaac 900

ttccgcaagc tgtctgactc cgaggtgtgg ctggatgcgg caacccagat cttcttctca 960

tacgggctgg gcctggggtc cctgatcgct ctcgggagct acaactcttt ccacaacaat 1020

gtctacaggg actccatcat cgtctgctgc atcaattcgt gcaccagcat gttcgcagga 1080

ttcgtcatct tctccatcgt gggcttcatg gcccatgtca ccaagaggtc cattgctgat 1140

gtggcggcct caggccccgg gctggcgttc ctggcatacc cagaggcggt gacccagctg 1200

cctatctccc cactctgggc catcctcttc ttctccatgc tgttgatgct gggcattgac 1260

agccagttct gcactgtgga gggcttcatc acagccctgg tggatgagta ccccaggctc 1320

ctccgcaacc gcagagagct cttcattgct gctgtctgca tcatctccta cctgatcggt 1380

ctctctaaca tcactcaggg gggtatttat gtcttcaaac tctttgacta ctactctgcc 1440

agtggcatga gcctgctgtt cctcgtgttc tttgaatgtg tctctatttc ctggttttac 1500

ggtgtcaacc gattctatga caatatccaa gagatggttg gatccaggcc ctgcatctgg 1560

tggaaactct gctggtcttt cttcacacca atcattgtgg cgggcgtgtt cattttcagt 1620

gctgtgcaga tgacgccact caccatggga aactatgttt tccccaagtg gggccagggt 1680

gtgggctggc tgatggctct gtcttccatg gtcctcatcc ccgggtacat ggcctacatg 1740

ttcctcacct taaagggctc cctgaagcag cgcatccaag tcatggtcca gcccagcgaa 1800

gacatcgttc gcccagagaa tggtcctgag cagccccagg cgggcagctc caccagcaag 1860

gaggcctaca tctagggtgg gggccactca ccgacccgac actctcaccc cccgacctgg 1920

ctgagtgcga ccaccacttg atgtctgagg ataccttcca tctcaaccta cctcgagtgg 1980

cgagtccaga caccatcacc acgcagagag gggaggtggg aggacagtta gacccctggg 2040

tgggccctgc cgtgggcaag gatacccggt ggcttctggc acctggcggg ctggtgacct 2100

ttttaatcca ggccccatca gcatcccacg atcggccttg gtaaccgccg cggtagatca 2160

tttttatccc gccagggagt gtgatgcagg aagaccacat gcgctcctgg cttttaaacc 2220

tgttcctgac tgttctctta ctgccgaaac ccttgactgt tatctcggac tttgcaggag 2280

ttcctttccc tccgaacgct gctccatgca caggaaaagg gcattttgta caatggggac 2340

ttcccgggaa cgcttgctct taagtaccag aagccggcgg agctctggct ttcgtgtttt 2400

tggttttctc cttcccaagg cagctggatt gaaaaaacaa aacaaaacaa aaaaacccag 2460

gggcgtcagt cgatattccc agggccgctt ctcctgcagt ctgtggagcg tccttgtccc 2520

cgccgccgga atgaatgagc attctgcagc ccgatgtccc tgtcccctcc tcgccgggcc 2580

attctgattg gacctggccc agtgcaatct gtccagacaa gccctgcttg ctggaaaact 2640

gccacaagca caattgatct ctttttatcg ccattccagg ggcctcaggt cctactgggg 2700

aaacttccta taccggagct ccagtttctc ttaagctgcc caatttcaca gagtacaaaa 2760

tagttgtagg ggaaatcaag gtgaaggatc tgtccgacag tcaagacgga tccacagtaa 2820

tctttcggtc tccttaaact accaccctcg ctgccaccca ccccaagctg ctgccgcctc 2880

accttccttg aaatttctca gcgggagtct cctcactgcc actaaaatcc acccagccca 2940

ctaactgagg agctagtgtt aatccagaga accccccgca atgtgcttcc gagattcaga 3000

ctgcttcatt gggaagtatg atttgttcct ttctggaatt gggctccgtg gtggcggcgg 3060

cacttcaagc aaagacagtt tcttgcaagc tccagtagct ccgcgtgtct catttgccag 3120

gaagatgggt tcccacgtag caaatcgtac attgtgccct gtagctcctt agctagttag 3180

ctcacaagcc gtgttttatg actaatcctt aataactatg gtaaataact gtgactgtgg 3240

ggtttttaat ctcttgtcat tctcatccaa aagtgaccag cataccagtt cttgcaataa 3300

gatattaccc tcagaatatt aagcacatta ttgtagagaa aaaaaaatat gtgtacacat 3360

atgaacgcac aacatgcaca ttcatcctca catgtggcac gtaaggtctc atttgatatt 3420

gtgtaggaaa tctgaagcct tttcctgagg tcatctgtaa aatagtctca ttgccaaggc 3480

atccccagtg ccagctggtg aatccatgat caaaatgcat acgtattgtt aaatgataag 3540

gtttagaatg acaggaaccc atcactgtgt ctcatggtcc cacttcccca tctgtgtgtg 3600

aattccttta gactaagggc aggaagactt ccagctttct ctttgttctt caatgtgaaa 3660

ctgagaccaa gtctctctaa gacaaatgca gtgtatttaa tgtttgtaag caattctaag 3720

tgagatgttt ggcaagaaat cccctaactg atttccatcc aaacctacct tatagagcac 3780

aatattaagt gttgtacaat tactgtgaga actgtgaata tgtgtaactt ttttttagta 3840

tttgcccggg gggaaaaaga tattgtatta tcatatatgc ttttttgcaa taaggattta 3900

ttctcagaac accaagtaaa tctatctcta tataaaaaat atatgtaata tatacatatt 3960

caaagtatat acagagcctg ttttaaaaaa tacagtatta tttagtaaaa ttatctgttc 4020

tatggaccaa atgtaaaata tttataaatg aagatgcatt ttaaatgtct ataaatggtg 4080

tcataactag agcacgggcg ttatgtaagt ttctaagaat ttagaggata aataataaag 4140

gttctatgat atacaa 4156

<210> 29

<211> 4095

<212> DNA

<213> 人工序列

<220>

<223> 人类SLC6A1 转录物变体5 (同种型c)

<400> 29

gccctcggaa gaccgagaca gcggagaggt tgcgggtgag ctgcgctgag cccaggagcc 60

gaggagtcgg gagcgcagta gcgctgagcc cgagcccgag cggccccgcg tcccgagcgc 120

atcggagcgg ccgagccgcc cggatgcagc gcctgtcccg ggcagcgcag ccccggccgc 180

aggatctcac ccagggtggc agaaggaggc cttctggagc tgacccaccc ccgacgacca 240

tcagggtgcc cttgagccgc aaaactgctg tccacgtgga ccgggggtga catcgcacgt 300

ccatctgcca ggacccctgc gtccaaattc cgagacatgg cgaccaacgg cagcaaggtg 360

gccgacgggc agatctccac cgaggcgtgg gccttgcggc tgctgtgcta tcattctggc 420

tgaacatcta ctacatcgtc atcatctcct gggccattta ctacctgtac aactccttca 480

ccacgacact gccgtggaaa cagtgcgaca acccctggaa cacagaccgc tgcttctcca 540

actacagcat ggtcaacact accaacatga ccagcgctgt ggtggagttc tgggagcgca 600

acatgcatca gatgacggac gggctggata agccaggtca gatccgctgg ccactggcca 660

tcacgctggc catcgcctgg atccttgtgt atttctgtat ctggaagggt gttggctgga 720

ctggaaaggt ggtctacttt tcagccacat acccctacat catgctgatc atcctgttct 780

tccgtggagt gacgctgccc ggggccaagg agggcatcct cttctacatc acacccaact 840

tccgcaagct gtctgactcc gaggtgtggc tggatgcggc aacccagatc ttcttctcat 900

acgggctggg cctggggtcc ctgatcgctc tcgggagcta caactctttc cacaacaatg 960

tctacaggga ctccatcatc gtctgctgca tcaattcgtg caccagcatg ttcgcaggat 1020

tcgtcatctt ctccatcgtg ggcttcatgg cccatgtcac caagaggtcc attgctgatg 1080

tggcggcctc aggccccggg ctggcgttcc tggcataccc agaggcggtg acccagctgc 1140

ctatctcccc actctgggcc atcctcttct tctccatgct gttgatgctg ggcattgaca 1200

gccagttctg cactgtggag ggcttcatca cagccctggt ggatgagtac cccaggctcc 1260

tccgcaaccg cagagagctc ttcattgctg ctgtctgcat catctcctac ctgatcggtc 1320

tctctaacat cactcagggg ggtatttatg tcttcaaact ctttgactac tactctgcca 1380

gtggcatgag cctgctgttc ctcgtgttct ttgaatgtgt ctctatttcc tggttttacg 1440

gtgtcaaccg attctatgac aatatccaag agatggttgg atccaggccc tgcatctggt 1500

ggaaactctg ctggtctttc ttcacaccaa tcattgtggc gggcgtgttc attttcagtg 1560

ctgtgcagat gacgccactc accatgggaa actatgtttt ccccaagtgg ggccagggtg 1620

tgggctggct gatggctctg tcttccatgg tcctcatccc cgggtacatg gcctacatgt 1680

tcctcacctt aaagggctcc ctgaagcagc gcatccaagt catggtccag cccagcgaag 1740

acatcgttcg cccagagaat ggtcctgagc agccccaggc gggcagctcc accagcaagg 1800

aggcctacat ctagggtggg ggccactcac cgacccgaca ctctcacccc ccgacctggc 1860

tgagtgcgac caccacttga tgtctgagga taccttccat ctcaacctac ctcgagtggc 1920

gagtccagac accatcacca cgcagagagg ggaggtggga ggacagttag acccctgggt 1980

gggccctgcc gtgggcaagg atacccggtg gcttctggca cctggcgggc tggtgacctt 2040

tttaatccag gccccatcag catcccacga tcggccttgg taaccgccgc ggtagatcat 2100

ttttatcccg ccagggagtg tgatgcagga agaccacatg cgctcctggc ttttaaacct 2160

gttcctgact gttctcttac tgccgaaacc cttgactgtt atctcggact ttgcaggagt 2220

tcctttccct ccgaacgctg ctccatgcac aggaaaaggg cattttgtac aatggggact 2280

tcccgggaac gcttgctctt aagtaccaga agccggcgga gctctggctt tcgtgttttt 2340

ggttttctcc ttcccaaggc agctggattg aaaaaacaaa acaaaacaaa aaaacccagg 2400

ggcgtcagtc gatattccca gggccgcttc tcctgcagtc tgtggagcgt ccttgtcccc 2460

gccgccggaa tgaatgagca ttctgcagcc cgatgtccct gtcccctcct cgccgggcca 2520

ttctgattgg acctggccca gtgcaatctg tccagacaag ccctgcttgc tggaaaactg 2580

ccacaagcac aattgatctc tttttatcgc cattccaggg gcctcaggtc ctactgggga 2640

aacttcctat accggagctc cagtttctct taagctgccc aatttcacag agtacaaaat 2700

agttgtaggg gaaatcaagg tgaaggatct gtccgacagt caagacggat ccacagtaat 2760

ctttcggtct ccttaaacta ccaccctcgc tgccacccac cccaagctgc tgccgcctca 2820

ccttccttga aatttctcag cgggagtctc ctcactgcca ctaaaatcca cccagcccac 2880

taactgagga gctagtgtta atccagagaa ccccccgcaa tgtgcttccg agattcagac 2940

tgcttcattg ggaagtatga tttgttcctt tctggaattg ggctccgtgg tggcggcggc 3000

acttcaagca aagacagttt cttgcaagct ccagtagctc cgcgtgtctc atttgccagg 3060

aagatgggtt cccacgtagc aaatcgtaca ttgtgccctg tagctcctta gctagttagc 3120

tcacaagccg tgttttatga ctaatcctta ataactatgg taaataactg tgactgtggg 3180

gtttttaatc tcttgtcatt ctcatccaaa agtgaccagc ataccagttc ttgcaataag 3240

atattaccct cagaatatta agcacattat tgtagagaaa aaaaaatatg tgtacacata 3300

tgaacgcaca acatgcacat tcatcctcac atgtggcacg taaggtctca tttgatattg 3360

tgtaggaaat ctgaagcctt ttcctgaggt catctgtaaa atagtctcat tgccaaggca 3420

tccccagtgc cagctggtga atccatgatc aaaatgcata cgtattgtta aatgataagg 3480

tttagaatga caggaaccca tcactgtgtc tcatggtccc acttccccat ctgtgtgtga 3540

attcctttag actaagggca ggaagacttc cagctttctc tttgttcttc aatgtgaaac 3600

tgagaccaag tctctctaag acaaatgcag tgtatttaat gtttgtaagc aattctaagt 3660

gagatgtttg gcaagaaatc ccctaactga tttccatcca aacctacctt atagagcaca 3720

atattaagtg ttgtacaatt actgtgagaa ctgtgaatat gtgtaacttt tttttagtat 3780

ttgcccgggg ggaaaaagat attgtattat catatatgct tttttgcaat aaggatttat 3840

tctcagaaca ccaagtaaat ctatctctat ataaaaaata tatgtaatat atacatattc 3900

aaagtatata cagagcctgt tttaaaaaat acagtattat ttagtaaaat tatctgttct 3960

atggaccaaa tgtaaaatat ttataaatga agatgcattt taaatgtcta taaatggtgt 4020

cataactaga gcacgggcgt tatgtaagtt tctaagaatt tagaggataa ataataaagg 4080

ttctatgata tacaa 4095

<210> 30

<211> 6946

<212> DNA

<213> 人工序列

<220>

<223> AAV真型DNA序列

<400> 30

tttcaatatt attgaagcat ttatcagggt tattgtctca tgagcggata catatttgaa 60

tgtatttaga aaaataaaca aataggggtc agtgttacaa ccaattaacc aattctgaac 120

attatcgcga gcccatttat acctgaatat ggctcataac accccttgtt tgcctggcgg 180

cagtagcgcg gtggtcccac ctgaccccat gccgaactca gaagtgaaac gccgtagcgc 240

cgatggtagt gtggggactc cccatgcgag agtagggaac tgccaggcat caaataaaac 300

gaaaggctca gtcgaaagac tgggcctttc gcccgggcta attagggggt gtcgcccttc 360

gctgaagtcc tgtattagag gtcacgtgag tgttttgcga cattttgcga caccatgtgg 420

tcacgctggg tatttaagcc cgagtgagca cgcagggtct ccattttgaa gcgggaggtt 480

tgaacgcgca gccgccatgc cggggtttta cgagattgtg attaaggtcc ccagcgacct 540

tgacgagcat ctgcccggca tttctgacag ctttgtgaac tgggtggccg agaaggaatg 600

ggagttgccg ccagattctg acatggatct gaatctgatt gagcaggcac ccctgaccgt 660

ggccgagaag ctgcagcgcg actttctgac ggaatggcgc cgtgtgagta aggccccgga 720

ggcccttttc tttgtgcaat ttgagaaggg agagagctac ttccacatgc acgtgctcgt 780

ggaaaccacc ggggtgaaat ccatggtttt gggacgtttc ctgagtcaga ttcgcgaaaa 840

actgattcag agaatttacc gcgggatcga gccgactttg ccaaactggt tcgcggtcac 900

aaagaccaga aatggcgccg gaggcgggaa caaggtggtg gatgagtgct acatccccaa 960

ttacttgctc cccaaaaccc agcctgagct ccagtgggcg tggactaata tggaacagta 1020

tttaagcgcc tgtttgaatc tcacggagcg taaacggttg gtggcgcagc atctgacgca 1080

cgtgtcgcag acgcaggagc agaacaaaga gaatcagaat cccaattctg atgcgccggt 1140

gatcagatca aaaacttcag ccaggtacat ggagctggtc gggtggctcg tggacaaggg 1200

gattacctcg gagaagcagt ggatccagga ggaccaggcc tcatacatct ccttcaatgc 1260

ggcctccaac tcgcggtccc aaatcaaggc tgccttggac aatgcgggaa agattatgag 1320

cctgactaaa accgcccccg actacctggt gggccagcag cccgtggagg acatttccag 1380

caatcggatt tataaaattt tggaactaaa cgggtacgat ccccaatatg cggcttccgt 1440

ctttctggga tgggccacga aaaagttcgg caagaggaac accatctggc tgtttgggcc 1500

tgcaactacc gggaagacca acatcgcgga ggccatagcc cacactgtgc ccttctacgg 1560

gtgcgtaaac tggaccaatg agaactttcc cttcaacgac tgtgtcgaca agatggtgat 1620

ctggtgggag gaggggaaga tgaccgccaa ggtcgtggag tcggccaaag ccattctcgg 1680

aggaagcaag gtgcgcgtgg accagaaatg caagtcctcg gcccagatag acccgactcc 1740

cgtgatcgtc acctccaaca ccaacatgtg cgccgtgatt gacgggaact caacgacctt 1800

cgaacaccag cagccgttgc aagaccggat gttcaaattt gaactcaccc gccgtctgga 1860

tcatgacttt gggaaggtca ccaagcagga agtcaaagac tttttccggt gggcaaagga 1920

tcacgtggtt gaggtggagc atgaattcta cgtcaaaaag ggtggagcca agaaaagacc 1980

cgcccccagt gacgcagata taagtgagcc caaacgggtg cgcgagtcag ttgcgcagcc 2040

atcgacgtca gacgcggaag cttcgatcaa ctacgcagac aggtaccaaa acaaatgttc 2100

tcgtcacgtg ggcatgaatc tgatgctgtt tccctgcaga caatgcgaga gaatgaatca 2160

gaattcaaat atctgcttca ctcacggaca gaaagactgt ttagagtgct ttcccgtgtc 2220

agaatctcaa cccgtttctg tcgtcaaaaa ggcgtatcag aaactgtgct acattcatca 2280

tatcatggga aaggtgccag acgcttgcac tgcctgcgat ctggtcaatg tggatttgga 2340

tgactgcatc tttgaacaat aaatgattta aatcaggtat ggctgccgat ggttatcttc 2400

cagattggct cgaggacact ctctctgaag gaataagaca gtggtggaag ctcaaacctg 2460

gcccaccacc accaaagccc gcagagcggc ataaggacga cagcaggggt cttgtgcttc 2520

ctgggtacaa gtacctcgga cccttcaacg gactcgacaa gggagagccg gtcaacgagg 2580

cagacgccgc ggccctcgag cacgacaaag cctacgaccg gcagctcgac agcggagaca 2640

acccgtacct caagtacaac cacgccgacg cggagtttca ggagcgcctt aaagaagata 2700

cgtcttttgg gggcaacctc ggacgagcag tcttccaggc gaaaaagagg atccttgaac 2760

ctctgggcct ggttgaggaa cctgttaaga cggctccggg aaaaaagagg ccggtagagc 2820

actctcctgc cgagccagac tcctcctcgg gaaccggaaa gagcggccag cagcctgcaa 2880

gaaaaagatt gaattttggt cagactggag acgcagactc agtacctgac ccccagcctc 2940

tcggacagcc accagcagcc ccctctggtc tgggaactaa tacgatggct agcggcagtg 3000

gcgcaccaat ggcagacaat aacgagggcg ccgacggagt gggtaattcc tcgggaaatt 3060

ggcattgcga ttccacatgg atgggcgaca gagtcatcac caccagcacc cgaacctggg 3120

ccctgcccac ctacaacaac cacctctaca aacaaatttc cagccaatca ggagcctcga 3180

acgacaatca ctactttggc tacagcaccc cttgggggta ttttgacttc aacagattcc 3240

actgccactt ttcaccacgt gactggcaaa gactcatcaa caacaactgg ggattccgac 3300

ccaagagact cagcttcaag ctctttaaca ttcaagtcaa agaggtcacg cagaatgacg 3360

gtacgacgac gattgccaat aaccttacca gcacggttca ggtgtttact gactcggagt 3420

accagctccc gtacgtcctc ggctcggcgc atcaaggatg cctcccgccg ttcccagcag 3480

acgtcttcat ggtgccacag tatggatacc tcaccctgaa caacgggagt caggcagtag 3540

gacgctcttc attttactgc ctggagtact ttccttctca gatgctgcgt accggaaaca 3600

actttacctt cagctacact tttgaggacg ttcctttcca cagcagctac gctcacagcc 3660

agagtctgga ccgtctcatg aatcctctca tcgaccagta cctgtattac ttgagcagaa 3720

caaacactcc aagtggaacc accacgatgt caaggcttca gttttctcag gccggagcga 3780

gtgacattcg ggaccagtct aggaactggc ttcctggacc ctgttaccgc cagcagcgag 3840

tatcaaagac agccgcggat aacaacaaca gtgactactc gtggactgga gctaccaagt 3900

accacctcaa tggcagagac tctctggtga atccgggccc ggccatggca agccacaagg 3960

acgatgaaga aaagtacttt cctcagagcg gggttctcat ctttgggaag caagactcag 4020

gcaaaacaaa tgtggacatt gaaaaggtca tgattacaga cgaagaggaa atcaggacaa 4080

ccaatcccgt ggctacggag cagtatggtt ctgtatctac caacctccag agcggcaaca 4140

cccaagcagc taccagcgat gtcaacacac aaggcgttct tccaggcatg gtctggcagg 4200

acagagatgt gtaccttcag gggcccatct gggcaaagat tccacacacg gacggacatt 4260

ttcacccctc tcccctcatg ggtggattcg gacttaaaca ccctcctcca cagattctca 4320

tcaagaacac cccggtacct gcgaatcctt cgaccacctt cagtgcggca aagtttgctt 4380

ccttcatcac acagtactcc acgggacagg tcagcgtgga gatcgagtgg gagctgcaga 4440

aggaaaacag caaacgctgg aatcccgaaa ttcagtacac ttccaactac aacaagtctg 4500

ttaatgtgga ctttactgtg gacactaatg gcgtgtattc agagcctcgc cccattggca 4560

ccagatacct gactcgtaat ctgtaattgc ttgttaatca ataaaccgtt taattcgttt 4620

cagttgaact ttggtctctg cgcgtcaaaa gggcgacaca aaatttattc taaatgcata 4680

ataaatactg ataacatctt atagtttgta ttatattttg tattatcgtt gacatgtata 4740

atttttctag agcggccgca gatctcagct ggatatcaaa aactgatttt ccctttatta 4800

ttttcgagat ttattttctt aattctcttt aacaaactag aaatattgta tatacaaaaa 4860

atcataaata atagatgaat agtttaatta taggtgttca tcaatcgaaa aagcaacgta 4920

tcttatttaa agtgcgttgc ttttttctca tttataaggt taaataattc tcatatatca 4980

agcaaagtga caggcgccct taaatattct gacaaatgct ctttccctaa actcccccca 5040

taaaaaaacc cgccgaagcg ggtttttacg ttatttgcgg attaacgatt actcgttatc 5100

agaaccgccc agggggcccg agcttaagac tggccgtcgt tttacaacac agaaagagtt 5160

tgtagaaacg caaaaaggcc atccgtcagg ggccttctgc ttagtttgat gcctggcagt 5220

tccctactct cgccttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg 5280

cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat 5340

aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc 5400

gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc 5460

tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga 5520

agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt 5580

ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg 5640

taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc 5700

gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg 5760

gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc 5820

ttgaagtggt gggctaacta cggctacact agaagaacag tatttggtat ctgcgctctg 5880

ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc 5940

gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct 6000

caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga cgcgcgcgta 6060

actcacgtta agggattttg gtcatgagct tgcgccgtcc cgtcaagtca gcgtaatgct 6120

ctgcttttag aaaaactcat cgagcatcaa atgaaactgc aatttattca tatcaggatt 6180

atcaatacca tatttttgaa aaagccgttt ctgtaatgaa ggagaaaact caccgaggca 6240

gttccatagg atggcaagat cctggtatcg gtctgcgatt ccgactcgtc caacatcaat 6300

acaacctatt aatttcccct cgtcaaaaat aaggttatca agtgagaaat caccatgagt 6360

gacgactgaa tccggtgaga atggcaaaag tttatgcatt tctttccaga cttgttcaac 6420

aggccagcca ttacgctcgt catcaaaatc actcgcatca accaaaccgt tattcattcg 6480

tgattgcgcc tgagcgaggc gaaatacgcg atcgctgtta aaaggacaat tacaaacagg 6540

aatcgagtgc aaccggcgca ggaacactgc cagcgcatca acaatatttt cacctgaatc 6600

aggatattct tctaatacct ggaacgctgt ttttccgggg atcgcagtgg tgagtaacca 6660

tgcatcatca ggagtacgga taaaatgctt gatggtcgga agtggcataa attccgtcag 6720

ccagtttagt ctgaccatct catctgtaac atcattggca acgctacctt tgccatgttt 6780

cagaaacaac tctggcgcat cgggcttccc atacaagcga tagattgtcg cacctgattg 6840

cccgacatta tcgcgagccc atttataccc atataaatca gcatccatgt tggaatttaa 6900

tcgcggcctc gacgtttccc gttgaatatg gctcatattc ttcctt 6946

<210> 31

<211> 1800

<212> DNA

<213> 人工序列

<220>

<223> 小鼠SLC6A1

<400> 31

atggcgactg acaacagcaa ggtggctgat gggcagatct ctactgaggt cagcgaggcc 60

cctgtggcca gcgacaagcc caaaaccctg gtagtcaagg tgcagaagaa ggccggggac 120

ctccctgacc gggacacatg gaagggacgc ttcgacttcc tcatgtcctg cgtgggctat 180

gccatcggcc tgggcaatgt gtggaggttc ccttacctct gtgggaaaaa cggtggcggg 240

gccttcctaa tcccatattt cctgacgctc atctttgcgg gtgttcctct cttccttttg 300

gagtgctccc taggccagta cacctccatt gggggcctgg gcgtatggaa gctggcgccc 360

atgttcaagg gtgtgggcct cgcggcagct gtgctgtcct tctggctgaa catctactac 420

atcgtcatca tctcctgggc catctactac ctgtacaact ccttcaccac gaccctgcca 480

tggaaacagt gtgacaaccc gtggaacact gaccgctgct tctccaacta cagcctggtc 540

aataccacca acatgaccag cgccgtggtg gagttctggg agcgcaacat gcaccagatg 600

acagatggac tggacaagcc aggacagatc cgctggcctc tggccatcac actggccatt 660

gcctgggtgc tcgtgtattt ctgcatctgg aagggtgttg gttggactgg aaaggtggtc 720

tacttctcag ccacgtaccc ctacatcatg cttatcatcc tgttcttccg tggagtgacg 780

cttcccgggg ccaaggaggg gatcctcttc tacatcacac ccaacttccg aaagctgtct 840

gattctgagg tgtggcttga cgccgccacc cagatcttct tctcctacgg gctgggcctg 900

gggtccctga ttgctctggg aagctacaac tctttccaca acaatgtgta cagggactcc 960

atcatcgttt gctgcatcaa ctcctgcacc agcatgtttg ccggattcgt catcttctcc 1020

atcgtgggct tcatggctca tgtcaccaag aggtccatag ctgatgtggc agcctcaggc 1080

ccggggctgg cattcttggc gtaccctgag gctgtgacac agctacccat ctctcccctc 1140

tgggctatcc tcttcttctc catgctgctg atgctgggca ttgacagcca gttctgtacc 1200

gtggagggct tcatcactgc cctggtggac gagtacccca gacttctccg caatcgccgt 1260

gaactcttca ttgctgccgt gtgcatcgtg tcctacctga ttggcctgtc taacatcacc 1320

cagggtggca tttatgtctt caaactgttt gattattact ctgccagcgg catgagcttg 1380

ctgttcctgg ttttcttcga gtgtgtctcc atttcctggt tttatggtgt caaccggttc 1440

tatgacaaca tccaggagat ggttggctcc aggccctgca tctggtggaa gctgtgctgg 1500

tcctttttca cacccatcat tgtggcgggc gtgtttctct tcagtgctgt gcagatgaca 1560

ccactcacca tgggaagcta tgttttcccc aagtggggcc agggcgtggg ctggctcatg 1620

gctctgtcct ccatggtgct catccccggg tacatggctt acatgttcct caccctgaag 1680

ggctccctga agcagcgtct ccaggtcatg attcagccca gtgaagatat tgtgcgccct 1740

gagaatggcc ctgagcagcc gcaggctggc agctcagcca gcaaggaggc ctacatctag 1800

<210> 32

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> Myc标签

<400> 32

gagcagaaac tcatctcaga agaggatctg 30

<210> 33

<211> 27

<212> DNA

<213> 人工序列

<220>

<223> HA标签

<400> 33

tacccttacg atgtaccgga ttacgca 27

<210> 34

<211> 2000

<212> DNA

<213> 人工序列

<220>

<223> MECP2内含子

<400> 34

gcgctccctc ctctcggaga gagggctgtg gtaaaacccg tccggaaatt ggccgccgct 60

gccgccaccg ccgccgccgc cgccgcgccg agcggaggag gaggaggagg cgaggaggag 120

agactgtgag tgggaccgcc aaggccgcgg gcggggaccc ttgctggggg gcgggtaggg 180

gcgggacgtg gcgcgggagg ggcccgcggg gtcgggcgac acggctggcg gttggcgtcc 240

ctcctctcta ccctccccct ccctctgccg ccggtggtgg ctttctccac tcgtctcccg 300

caatcgcgag cgacggttct cagcgcgatc tccctggagc caccttcgat tgacgccctc 360

ccgctgcccg ccccatctgt gcgcatccta ggccccagct gtgcaagcgc ccttgtcgtc 420

tgggcttcgc cagttggggc tgcgcgcgct cctgcccttc ttggggcttt gggcctcggc 480

actgtcgcgc gcccgcggtc ccggcctctc cctggatcgc gctgtcccct tctccctcgc 540

gcgcccccac tcccgttact tgctcccccc tcacacacac agactggcgc gcgtgcgcag 600

tccatctccc gttgggagag tgcgccacaa gggctcctga gctcttaccc ccatctctgg 660

gttttgctcc ctcctcctcc tctcccattc cgtgactttt tgcccccact gcaagcgagt 720

cggtccatca gctccattcc ccacttggca ggaacaagtt gagggttatt gtccacccac 780

aaaaaggact agacattttg ttcctaggtc ccacaactca tcataaagag ttggttgtag 840

ttctcatcag gaaccgtggg caagggactg tgcgttcctc agcactcgaa gctcttccgt 900

gagaccttgc ccgcagggtg ctctggttct ttggggttgc tgtgctgtgg cttcggaatt 960

tgagcgtctt cccaccctcc ctcccctccc ttcgccagcg ttctgtctac aagaaagaat 1020

aggcaggtgt ccttggatat cgtagttgct aatcgcctat acactgttct attacacctt 1080

tctgctaagg atagggtttt tggttttggt tttggttttg ttccccaccc tccagtttgg 1140

tttagttttg gttttggcat ttagggtttt ttggggggga gtaatatctt gtggtaaaga 1200

cccatctgac ccaagatacc ttttttctca tactggaacc ctaggcagca gttgctattt 1260

ccctgagtta gcaatagttt tacagtattt tgaggccttt tgtccataat tctcacggaa 1320

tccctcaggg atcagattag ctgctgttgg gatcaggaaa ttgggttaca ccgctgaaat 1380

ctcttgctgg ggcccttgtt ttgaattgga aagtcaggag gctggaacga aggctcacaa 1440

gttaacagtg ccagctgctc ttccagaagc cctggattca gtcccaccaa tccatcgcgg 1500

gtcacaacca tctgtaactt cagtcccaag gggtccgaag ccctcttctg gctttgccct 1560

attattttat ttatcttatc tgtttttgtc ttgtcatctg gcaagcccag ggggccattg 1620

ggtgcaactt ataaactgac ttctgtatct taagaagcca accatacagt gcttacattc 1680

cagaaaaaaa atctgccact ttaacagcac tagaactagg gtttagagaa gtatcataaa 1740

ggtcaaatat ctttgaccaa tatcaccagc aacctaaagc tgttaagaaa tctttgggcc 1800

ccagcttgac ccaaggatac agtatcctag ggaagttacc aaaatcagag atagtatgca 1860

gcagccaggg gtctcatgtg tggcactcaa gctcacctat actcactact gtgcagacag 1920

ctgtgttctc tgtaatactt acatatttgt ttaatacttc agggaggaaa agtcagaaga 1980

ccaggatctc cagggcctca 2000

<210> 35

<211> 231

<212> DNA

<213> 人工序列

<220>

<223> EF1a启动子

<400> 35

ggctccggtg cccgtcagtg ggcagagcgc acatcgccca cagtccccga gaagttgggg 60

ggaggggtcg gcaattgaac cggtgcctag agaaggtggc gcggggtaaa ctgggaaagt 120

gatgtcgtgt actggctccg cctttttccc gagggtgggg gagaaccgta tataagtgca 180

ctagtcgccg tgaacgttct ttttcgcaac gggtttgccg ccagaacaca g 231

Claims

1.一种核酸构建体，其包含编码以下的转基因：

i.γ丁酸(GABA)转运蛋白1(GAT-1)，其包含SEQ ID NO:18、19、20；或

2.权利要求1的核酸构建体，其中所述转基因为溶质载体家族6成员1(SLC6A1)基因，其中所述转基因优选包含：

i.SEQ ID NO:15、26、27、28或29，优选SEQ ID NO:15；

3.权利要求1或2中任一项的核酸构建体，其进一步包含可操作地连接至所述转基因的启动子，其中所述启动子优选包含：

a.SEQ ID NO:1，或优选地在5’至3’方向上可操作地连接至SEQ ID NO:2的SEQ ID NO:1；或

b.SEQ ID NO:3；或

c.SEQ ID NO:4；或

d.SEQ ID NO:5或SEQ ID NO:35或SEQ ID NO:6，或优选地在5’至3’方向上可操作地连接至SEQ ID NO:6的SEQ ID NO:35；或

e.SEQ ID NO:7；或优选地在5’至3’方向上可操作地连接至SEQ ID NO:34的SEQ IDNO:7；或

f.SEQ ID NO:8；或

g.SEQ ID NO:9；或

h.SEQ ID NO:10；或

i.SEQ ID NO:11，或在5’至3’方向上可操作地连接至SEQ ID NO:12的SEQ ID NO:11，或优选地在5’至3’方向上可操作地连接至SEQ ID NO:12的SEQ ID NO:11，其中SEQ ID NO:12在5’至3’方向上可操作地连接至SEQ ID NO:13；或

j.SEQ ID NO:14。

4.前述权利要求中任一项的核酸构建体，其中所述构建体包含多腺苷酸化信号序列，优选包含SEQ ID NO:17的多腺苷酸化信号序列。

5.一种病毒载体，其包含前述权利要求中任一项的核酸构建体，其中所述病毒载体进一步包含位于所述核酸构建体5'和/或3'侧翼处的反向末端重复序列(ITR)，优选5'ITR和3'ITR。

6.权利要求5的病毒载体，其中所述5'ITR和/或所述3'ITR包含天然腺相关病毒(AAV)的ITR，例如AAV2的ITR。

7.权利要求5或6中任一项的病毒载体，其中所述5'ITR包含SEQ ID NO:22和/或所述3'ITR包含SEQ ID NO:23。

8.一种病毒颗粒，其包含权利要求1至4中任一项的核酸构建体或权利要求5至7中任一项的病毒载体。

9.权利要求8的病毒颗粒，其中所述病毒颗粒至少包含来自AAV的VP1衣壳蛋白，其中所述衣壳蛋白优选包含AAV2、AAV5、AAV6、AAV8、AAV9(例如包含SEQ ID NO:25)、AAV10、AAV-真型(AAVtt)或其组合。

10.权利要求9的病毒颗粒，其中所述衣壳蛋白来自AAVtt并且优选包含SEQ ID NO:24或其与SEQ ID NO:24至少98.5％、优选99％或99.5％相同。

11.一种病毒载体，其包含含有编码以下的转基因的核酸构建体：

i.γ丁酸(GABA)转运蛋白1(GAT-1)，其包含SEQ ID NO:18、19、20；或

其中所述病毒载体进一步包含可操作地连接至所述转基因的启动子，其中所述启动子优选包含SEQ ID NO:4或SEQ ID NO:14；其中所述病毒载体中所包含的核酸构建体包含多腺苷酸化信号序列；并且其中所述病毒载体进一步包含位于所述核酸构建体5'和/或3'侧翼处的反向末端重复序列(ITR)，优选5'ITR和3'ITR。

12.一种病毒载体，其包含含有转基因的核酸构建体，所述转基因为溶质载体家族6成员1(SLC6A1)基因，其中所述转基因优选包含：

i.SEQ ID NO:15、26、27、28或29，更优选SEQ ID NO:15

ii.或与SEQ ID NO:15、26、27、28或29具有至少95％或96％或97％或98％或99％或99.5％序列同一性的序列，

其中所述病毒载体进一步包含可操作地连接至所述转基因的启动子，其中所述启动子优选包含SEQ ID NO:4或SEQ ID NO:14；其中所述病毒载体中所包含的核酸构建体包含多腺苷酸化信号序列，并且其中所述病毒载体进一步包含位于所述核酸构建体5'和/或3'侧翼处的反向末端重复序列(ITR)，优选5'ITR和3'ITR。

13.权利要求11或12中任一项的病毒载体，其中所述转基因编码包含SEQ ID NO:18的γ丁酸(GABA)转运蛋白1(GAT-1)。

14.权利要求11至13中任一项的病毒载体，其中所述多腺苷酸化信号序列包含SEQ IDNO:17。

15.一种病毒颗粒，其包含权利要求11至14中任一项的病毒载体。

16.权利要求15的病毒颗粒，其中所述病毒颗粒至少包含来自AAV的VP1衣壳蛋白，其中所述衣壳蛋白优选包含AAV2、AAV5、AAV6、AAV8、AAV9(例如包含SEQ ID NO:25)、AAV10、AAV-真型(AAVtt)或其组合。

17.权利要求16的病毒颗粒，其中所述衣壳蛋白来自AAV9并且优选包含SEQ ID NO:25或AAVtt，并且优选包含SEQ ID NO:24或其与SEQ ID NO:24至少98.5％、优选99％或99.5％相同。

18.一种质粒，其包含权利要求1至4中任一项的核酸构建体或权利要求5至7或11至14中任一项的病毒载体。

19.一种宿主细胞，其用于产生权利要求8至10或15至17中任一项的病毒颗粒。

20.权利要求19的宿主细胞，其中所述宿主细胞包含：

a.权利要求1至4中任一项的核酸构建体或权利要求5至7或11至14中任一项的病毒载体；

c.包含病毒辅助基因的核酸构建体，例如质粒或病毒。

21.一种产生权利要求8至10或15至17中任一项的病毒颗粒的方法，所述方法包括以下步骤：

a.在培养基中培养权利要求18或19中任一项的宿主细胞；和

b.从宿主细胞培养基和/或在宿主细胞内部收获所述病毒颗粒。

22.一种药物组合物，其包含权利要求1至4中任一项的核酸构建体或权利要求5至7或11至14中任一项的病毒载体或权利要求8至10或15至17中任一项的病毒颗粒，以及一种或多种药学上可接受的赋形剂、稀释剂或承载体。

23.权利要求8至10或15至17中任一项的病毒颗粒，其用于疗法中。

24.权利要求8至10或15至17中任一项的病毒颗粒，其用于治疗和/或预防以SLC6A1单倍体不足为特征的疾病，其中所述疾病优选包括伴有认知、运动行为共病的单基因癫痫、早发发育性和癫痫性脑病、癫痫性脑病、儿童期发作癫痫综合征、肌阵挛失张力癫痫(MAE)、MEA样和其他癫痫适应症，例如Lennox Gastaut综合征以及自闭症谱系障碍和精神分裂症或与GABA摄取受损相关的疾病或其组合。

25.权利要求23或24中任一项的病毒颗粒，其用于恢复GAT-1功能和/或降低癫痫频率。

26.权利要求8至10或15至17中任一项的病毒颗粒，其中所述疾病与患者中导致病理性GAT-1变体的至少一种突变相关，其中所述病理性GAT-1变体包含突变或突变组合。

27.权利要求26的病毒颗粒，其中所述突变参考SEQ ID NO:18，包括R44W、R44Q、R50L、D52E、D52V、F53S、S56F、G63S、N66D、G75R、G79R、G79V、F92S、G94E、G105S、Q106R、G112V、Y140C、C173Y、G232V、F270S、R277H、A288V、S295L、G297R、A305T、G307R、V323I、A334P、V342M、A357V、G362R、L366V、A367T、F385L、G393S、S456R、S459R、M487T、V511L、G550R或其组合。

28.一种用于治疗和/或预防以SLC6A1单倍体不足为特征的疾病的方法，其中所述疾病优选包括伴有认知、运动行为共病的单基因癫痫；早发发育性和癫痫性脑病；癫痫性脑病；儿童期发作癫痫综合征；肌阵挛失张力癫痫(MAE)；MEA样和其他癫痫适应症，例如LennoxGastaut综合征以及自闭症谱系障碍和精神分裂症或与GABA摄取受损相关的疾病或其组合，伴或不伴自闭症和/或精神分裂症，所述方法包括向有需要的受试者施用权利要求8至10或15至17中任一项的病毒颗粒。

29.权利要求28的方法，其中所述方法用于恢复GAT-1功能和/或降低癫痫频率。

30.权利要求28或29中任一项的方法，其中所述疾病与患者中导致病理性GAT-1变体的至少一种突变相关，其中所述病理性GAT-1变体包含突变或突变组合。

31.权利要求30的方法，其中所述突变参考SEQ ID NO:18，包括R44W、R44Q、R50L、D52E、D52V、F53S、S56F、G63S、N66D、G75R、G79R、G79V、F92S、G94E、G105S、Q106R、G112V、Y140C、C173Y、G232V、F270S、R277H、A288V、S295L、G297R、A305T、G307R、V323I、A334P、A367T、V342M、A357V、G362R、L366V、F385L、G393S、S456R、S459R、M487T、V511L、G550R或其组合。