CN113301909A - Htt阻遏物及其应用 - Google Patents

Htt阻遏物及其应用 Download PDF

Info

Publication number
CN113301909A
CN113301909A CN202080009478.4A CN202080009478A CN113301909A CN 113301909 A CN113301909 A CN 113301909A CN 202080009478 A CN202080009478 A CN 202080009478A CN 113301909 A CN113301909 A CN 113301909A
Authority
CN
China
Prior art keywords
zfp
protein
mhtt
sequence
arg
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080009478.4A
Other languages
English (en)
Inventor
G·凯瑞
M·齐奥克
V·乔
B·费利斯
S·弗洛里奇
D·克拉缇
J·米勒
D·帕斯乔恩
E·瑞巴
B·泽特勒
L·张
H·S·张
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Takeda Pharmaceutical Co Ltd
Sangamo Therapeutics Inc
Original Assignee
Shire Human Genetics Therapies Inc
Sangamo Therapeutics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shire Human Genetics Therapies Inc, Sangamo Therapeutics Inc filed Critical Shire Human Genetics Therapies Inc
Publication of CN113301909A publication Critical patent/CN113301909A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • C07K14/4703Inhibitors; Suppressors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • A61P25/14Drugs for disorders of the nervous system for treating abnormal movements, e.g. chorea, dyskinesia
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/09Fusion polypeptide containing a localisation/targetting motif containing a nuclear localisation signal
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • C07K2319/81Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor containing a Zn-finger domain for DNA binding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Wood Science & Technology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Neurology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Virology (AREA)
  • Toxicology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Psychology (AREA)
  • Microbiology (AREA)
  • Neurosurgery (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Epidemiology (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

本文公开了HTT阻遏物以及使用该HTT阻遏物的方法和组合物。本文公开了用于诊断、预防和/或治疗亨廷顿氏病的方法和组合物。特别地,本文提供了用于修饰(例如调节表达)HD HTT等位基因以预防或治疗亨廷顿氏病的方法和组合物,其包含mHTT阻遏物(其阻遏mHTT转录物并因此也阻遏mHTT蛋白表达)。

Description

HTT阻遏物及其应用
相关申请的交叉引用
本申请要求2019年1月15日提交的美国临时申请第62/792,701号的权益,其公开通过引用其全文纳入本文。
序列表
本申请包含以ASCII格式电子提交的序列表并通过引用其全部内容纳入本文。所述ASCII拷贝创建于2020年1月3日,命名为8327-018740_SL.txt,并且大小为22,157字节。
技术领域
本公开涉及诊断和治疗亨廷顿氏病的领域。
背景技术
亨廷顿氏病(HD),也称为亨廷顿氏舞蹈病(Huntington’s Chorea),是一种运动、认知和精神障碍的进行性紊乱。该疾病发作的平均年龄是35-44岁,但在约10%的情况中,发作在21岁之前发生,并且疾病诊断后的平均寿命是15-18年。患病率是每100,000西欧血统人约3-7人。
亨廷顿氏病是在九十年代早期首个表征的三核苷酸重复序列扩增病症的示例(参见Di Prospero和Fischbeck(2005)Nature Reviews Genetics6:756-765)。这些病症涉及3个核苷酸组不稳定重复序列的局部扩增并可能会导致其中保留扩增的重复序列的基因的功能丧失、获得毒性功能或两者。三核苷酸重复序列可位于基因的任何部分,包括非编码和编码基因区。位于编码区内的重复序列通常涉及重复的谷氨酰胺编码三联体(CAG)或丙氨酸编码三联体(CGA)。非编码序列内的扩增的重复序列区域可能会导致基因的异常表达,而编码区内的扩增的重复序列(也称作密码子重复病症(codon reiteration disorder))可能会导致错误折叠和蛋白质聚集。与异常蛋白质相关的病理生理的确切原因常常是未知的。通常,在经历三核苷酸扩增的野生型基因中,这些区域在正常群体中包含可变数量的重复序列,但在患病群体中,重复序列的数量可以从倍增增加到重复序列数量的对数级增加。在HD中,重复序列被插入编码大胞质蛋白亨廷顿蛋白(HTT)的基因的N末端编码区。正常的HTT等位基因包含15-24个CAG重复序列(SEQ ID NO:23中所公开的“CAG”重复序列),而包含36个或更多个重复序列的等位基因有可能被认为是潜在的HD致病等位基因并且增加患此疾病的风险。包含36-39个重复序列的等位基因被认为是不完全外显(penetrant)的,并且具有这些等位基因的个体可能或可能不发展出疾病(或在以后的生活中可能发展出症状),而包含40个重复序列或更多个重复序列的等位基因被认为是完全外显的。事实上,从没有包含具有如此之多个重复序列的HD等位基因的人被报道为无症状者。常常发现具有青少年HD发作(年龄<21岁)的那些个体具有60或更多个CAG重复序列。除了CAG重复序列的增加以外,还已经证明HD可涉及重复序列内的+1和+2个移码,因此该区域将编码多聚丝氨酸多肽(在+1移码的情况下,由AGC重复序列编码)踪迹,而不是多聚谷氨酰胺(Davies和Rubinsztein(2006)Journal of Medical Genetics43:893-896)。在HD中,突变的HTT(mHTT)等位基因通常遗传自一个亲本,作为显性性状。如果另一个亲本不患该疾病,则HD患者的任何子女都有50%的可能性发展出疾病。在一些情况中,亲本可能有中间HD等位基因并且可能是无症状的,但是由于重复序列扩增,子女显示出该疾病。此外,HD等位基因还可以显示出一种预知现象,其中由于精子发生过程中重复序列区域的不稳定性质,在数代人中观察到严重性增加或发病年龄降低。
此外,HTT中的三核苷酸扩增导致纹状体中棘γ-氨基丁酸(GABA)投射神经元中的神经元丧失,并且新皮质中也发生神经元丧失。相比包含物质P并投射至内部苍白球的神经元,包含脑啡肽并投射至外部苍白球(globus pallidum)的中棘神经元的相关性更高。亨廷顿氏病患者中受大幅影响的其它脑区域包括:黑质,皮层3、5和6,海马体的CA1区,顶叶的角回,小脑的浦肯野细胞(Purkinje cell),下丘脑的外侧管状核和丘脑的中央束旁(centromedialparafascicular)复合体(Walker(2007)Lancet 369:218-228)。
对正常HTT蛋白的作用了解甚少,但可能与神经发生、程序性细胞死亡和囊泡运输有关。此外,有证据表明野生型HTT刺激脑源性神经营养因子(BDNF)的产生,所述BDNF是纹状体神经元的促生存因子。已经证明在HD的小鼠模型中HD的进展与BDNF表达降低相关联(Zuccato等(2005)Pharmacological Research 52(2):133-139),并且在HD小鼠模型中通过重组腺相关病毒(rAAV)载体介导的基因递送来递送BDNF或神经胶质细胞系源性神经营养因子(GDNF)可以保护纹状体神经元(Kells等(2004)Molecular Therapy 9(5):682-688)。
当前,HD的诊断和治疗选择非常有限。在诊断方面,改变的(突变)HTT(mHTT)水平与疾病负荷评分显著相关,并且可溶性mHTT物质的浓度随疾病进展增加。然而,难以定量患者CNS中的低丰度mHTT,这既限制了体内HD神经病理学作用的研究,又排除对降低HTT的药物的靶接合的证明。参见例如,Wild等(2014)J Neurol Neurosurg Psychiatry 85:e4。
对于治疗,一些设计成预防蛋白质聚集相关毒性的潜在方法已经在体外模型中显示出降低这些毒性,所述蛋白质聚集通过延伸的多聚谷氨酰胺束(tract)发生,诸如伴侣蛋白的过表达或化合物格尔德霉素诱导的热休克反应。其它治疗靶向细胞凋亡在疾病临床表现中的作用。例如,在其中一亲本包含HD等位基因而另一亲本具有胱天蛋白酶1的显性负等位基因的一对小鼠的后代中,已经在动物模型中证明了胱天蛋白酶活性的阻断减缓疾病症状。此外,通过胱天蛋白酶切割mHTT可能在疾病的致病性中起作用。发现相较于携带非胱天蛋白酶抗性突变HTT等位基因的小鼠,携带胱天蛋白酶-6抗性突变HTT的转基因小鼠保持正常的神经元功能并且不发展纹状体神经退行性发生(参见Graham等(2006)Cell 125:1179-1191)。靶向细胞凋亡途径成员的分子也已显示出对症状的减缓作用。例如,已经证明抑制胱天蛋白酶活性的化合物zVAD-fmk和米诺环素(minocycline)减缓小鼠中的疾病表现。瑞马西胺(remacemide)药物也已经用于小型HD人体试验,因为该化合物被认为将阻止突变HTT与NDMA受体结合,从而预防对神经细胞产生毒性作用。然而,在这些试验中,没有观察到神经元功能在统计学上的显著改善。此外,亨廷顿研究小组使用辅酶Q进行了随机双盲研究。虽然在用辅酶Q10治疗的患者中观察到疾病进展趋于缓慢的趋势,但是总功能能力的下降率没有显著变化。(Di Prospero和Fischbeck(2005)Nature Reviews Genetics 6:756-765)。
包含来自锌指蛋白(“ZFP”)的DNA结合结构域、TAL效应物结构域(“TALEs”)和CRISPR/Cas转录因子系统(包括Cas和/或Cfp1系统)的重组转录因子和核酸酶具有调节内源基因的基因表达的能力。参见例如,美国专利号9,045,763;9,005,973;8,956,828;8,945,868;8,586,526;6,534,261;6,599,692;6,503,717;6,689,558;7,067,317;7,262,054;7,888,121;7,972,854;7,914,796;7,951,925;8,110,379;8,409,861;美国专利公开号2003/0232410;2005/0208489;2005/0026157;2005/0064474;2006/0063231;2008/0159996;2010/00218264;2012/0017290;2011/0265198;2013/0137104;2013/0122591;2013/0177983,2013/0177960,2015/0335708;和2015/0056705;Perez-Pinera等(2013)Nature Methods 10:973-976;Piatek等(2015)Plant Biotechnology J.13(4):578-89,doi:10.1111/pbi.12284),其公开通过引用其全文纳入本文用于所有目的。例如,美国专利号9,234,016;9,943,565;8,841,260;9,499,597;以及美国专利公开号2018/0200332;2017/0096460;2017/0035839;2016/0296605和2019/0322711涉及调节HD等位基因如HTT的表达的DNA结合蛋白。美国专利公开号2015/0335708涉及修饰中棘神经元的方法。
此外,靶向的核酸酶基于阿尔古(Argonaute)系统(例如,来自嗜热链球菌(T.thermophilus),称作‘TtAgo’,参见Swarts等(2014)Nature 507(7491):258-261)开发,其也可具有用于基因组编辑和基因治疗的潜力。使用包含锌指蛋白的这些工程改造转录因子的临床试验表明这些新型转录因子能够治疗多种疾病。(参见例如,Yu等(2006)FASEBJ.20:479-481)。核酸酶介导的切割涉及使用工程改造的核酸酶诱导靶DNA序列中的双链断裂(DSB)或切口(nick),因此通过错误出现过程(error born process)如非同源末端连接(NHEJ)修复断裂或使用修复模板(同源定向修复或DHA)进行修复可导致敲除基因或插入感兴趣的序列(靶向整合)。在不存在外部提供的修复模板(例如“供体”或“转基因”)的情况下引入双链断裂通常用于经由细胞NHEJ途径所引入的突变(插入和/或缺失称之为“插入缺失”)来使靶基因失活。
然而,仍然需要用于诊断、研究、治疗和/或预防亨廷顿氏病的方法,包括表现出广泛递送至大脑的方式。
发明内容
本文公开了用于诊断、预防和/或治疗亨廷顿氏病的方法和组合物。特别地,本文提供了用于修饰(例如调节表达)HD HTT等位基因以预防或治疗亨廷顿氏病的方法和组合物,其包含mHTT阻遏物(其阻遏mHTT转录物并因此也阻遏mHTT蛋白表达)。本文所述的组合物(mHTT阻遏物)在对象中提供治疗益处,例如通过在对象中减少细胞死亡、减少细胞凋亡、增加细胞功能(代谢)和/或减少运动缺陷。因此,本文描述了与mHTT基因的CAG重复序列结构域结合的非天然产生的锌指蛋白(ZFP),该锌指蛋白包含4、5或6个锌指结构域,顺序为如本文所述的F1至F4、F1至F5或F1至F6,包括包含记作45643、46025、45294、45723或33074的ZFP的识别螺旋区域的ZFP。在某些实施方式中,本文提供了记作45294或45723的ZFP,其包含如表1的单行中所示顺序的识别螺旋区域。还描述了人工转录因子(ZFP-TF),其包含与转录阻遏结构域(例如KRAB、KOX等)可操作地连接的这些ZFP,并且任选地包含其它元件,例如核定位信号(NLS)和/或驱动ZFP-TF编码序列表达的启动子(例如组成型启动子,如CMV启动子)(例如,ZFP-TF包含记作45294或45723的ZFP,进一步包含编码转录阻遏结构域的序列,并且任选地包含编码NLS的序列和/或驱动ZFP-TF表达的启动子)。在某些实施方式中,本文提供了一种或多种ZFP-TF(蛋白质和/或多核苷酸形式),其具有如表3的单行中所示的氨基酸序列或核苷酸序列(特定阻遏物)。
本文公开了一种锌指蛋白转录因子(ZFP-TF),其包含记作45294或45723的锌指蛋白(ZFP)或包含如表3中所示的ZFP-TF的氨基酸序列。还描述了编码本文所述的一种或多种ZFP-TF的一种或多种多核苷酸,其中该一种或多种多核苷酸可以编码一种或多种相同和/或不同的ZFP-TF,任选地其中该一种或多种多核苷酸包含一个或多个rAAV载体(例如包含编码一种或多种ZFP-TF的序列的rAAV,所述ZFP-TF包含记作45294或45723的ZFP),或者其中rAAV载体包含具有如表3中所示的序列的多核苷酸,任选其中一种或多种rAAV载体进一步包含其它元件,例如编码核定位信号(NLS)的序列和任选的驱动ZFP-TF表达的启动子,例如组成型启动子(例如CMV)。本文还描述了一种药物组合物,其包含本文所述的一种或多种ZFP-TF、一种或多种多核苷酸和/或一种或多种rAAV载体。还提供了修饰细胞(例如大脑中、任选地在纹状体中的神经元细胞)或对象中的HTT基因(例如突变HTT(mHTT)基因)表达的方法,所述方法包括向对象的细胞给予细胞本文所述的一种或多种ZFP-TF、一种或多种多核苷酸、一种或多种rAAV载体和/或药物组合物。还提供了治疗和/或预防有此需要的对象中的亨廷顿氏病(HD)的方法,所述方法包括给予有此需要的对象本文所述的一种或多种ZFP-TF、一种或多种多核苷酸、一种或多种rAAV载体和/或药物组合物,任选地,其中所述一种或多种ZFP-TF、多核苷酸、rAAV载体和/或药物组合物双侧给药至对象的纹状体。还提供了本文所述的一种或多种ZFP-TF、一种或多种多核苷酸、一种或多种rAAV载体和/或药物组合物在阻遏有此需要的对象中突变HTT(mHTT)的表达中的应用。HD的治疗和/或预防可以涉及减少对象中的mHTT聚集物和/或运动缺陷。此外,在本文所述的任一方法或应用中,一种或多种ZFP-TF、一种或多种多核苷酸、一种或多种rAAV载体和/或药物组合物可以任何剂量递送至对象的大脑,任选地双侧递送至对象的纹状体,所述剂量包括但不限于每个纹状体1×107至1×1015(或其间的任何数值)的载体基因组(vg)的剂量。
因此,在一个方面,提供了工程改造(非天然产生)的mHTT阻遏物。所述阻遏物可以包含调节HD等位基因(例如mHTT)表达的系统(例如锌指蛋白、TAL效应物(TALE)蛋白或CRISPR/dCas-TF)。工程改造的锌指蛋白或TALE是非天然产生的锌指蛋白或TALE蛋白,其DNA结合结构域(例如识别螺旋或RVD)已(例如通过选择和/或合理设计)被改为与预先选择好的靶位点结合。本文所述的任何锌指蛋白可以包括1、2、3、4、5、6或更多个锌指,各锌指具有识别螺旋,其与所选序列(例如基因)中的亚靶位点(target subsite)结合。类似地,本文所述的任何TALE蛋白可以包括任意数量的TALE RVD。在一些实施方式中,至少一个RVD具有非特异性DNA结合性。在一些实施方式中,至少一个识别螺旋(或RVD)是非天然产生的。在某些实施方式中,所述阻遏物包含与转录阻遏结构域可操作地连接的DNA结合结构域(ZFP、TALE、单向导RNA),以创建人工转录因子(阻遏物)。任选地,人工阻遏物包含其它组分,包括但不限于核定位信号(NLS)。在一些实施方式中,这些人工TF(例如ZFP-TF、CRISPR/dCas-TF或TALE-TF)包括在与DNA结合时允许多聚化的蛋白相互作用结构域(或“二聚化结构域”)。
在某些实施方式中,本文所述的锌指蛋白(ZFP)、CRISPR/Cas系统的Cas蛋白或TALE蛋白的位置可作为融合蛋白的一部分与调控结构域(或功能结构域)操作性地连接。例如,功能结构域可以是转录激活结构域、转录阻遏结构域和/或核酸酶(切割)结构域。通过选择激活结构域或阻遏结构域并与DNA结合结构域一起使用,这这样的分子可以用于激活或阻遏基因表达。在一些实施方式中,提供了这样的分子,其包含本文所述的靶向mHTT的ZFP、dCas或TALE,它们与可用于下调突变HTT表达的转录阻遏结构域融合。在一些实施方式中,提供了这样的融合蛋白,其包含靶向野生型HTT等位基因的ZFP、CRISPR/Cas或TALE,它们与可上调野生型HTT等位基因的转录激活结构域融合。在某些实施方式中,调控结构域的活性通过外源性小分子或配体调节,因此在不存在外源性配体的情况下,与细胞转录机制结构的相互作用不会发生,而在另一些实施方式中,外源性小分子或配体防止相互作用。这类外部配体控制ZFP-TF、CRISPR/Cas-TF或TALE-TF与转录机制结构相互作用的程度。一个或多个调控结构域可以操作性地连接一个或多个ZFP、dCas或TALE的任何部分,包括在一个或多个ZFP、dCas或TALE之间,在一个或多个ZFP、dCas或TALE的外部及其任意组合。本文所述的任何融合蛋白均可以配制成药物组合物。
在一些实施方式中,本文所述的工程改造的DNA结合结构域的位置可作为融合蛋白的一部分与核酸酶(切割)结构域操作性地连接。在一些实施方式中,核酸酶包括Ttago核酸酶。在另一些实施方式中,核酸酶系统如CRISPR/Cas系统可以利用特定的单向导RNA来使核酸酶靶向DNA中的靶位置。在某些实施方式中,这类核酸酶和核酸酶融合物可以用于靶向干细胞如诱导型多潜能干细胞(iPSC)、人胚胎干细胞(hESC细胞)、间充质干细胞(MSC)或神经元干细胞中的突变HTT等位基因,其中核酸酶融合物的活性将产生包含野生型数量的CAG重复序列的HTT等位基因。因此,本文所述的任何HTT(例如mHTT)阻遏物还可以包含二聚化结构域和/或功能结构域(例如转录激活结构域、转录阻遏结构域或核酸酶结构域)。在某些实施方式中,提供了包含修饰的细胞(例如干细胞)的药物组合物。在某些实施方式中,阻遏物包含ZFP,该ZFP包含如表1的单行中所示顺序的识别螺旋区域。还提供了如表3所示的ZFP-TF(阻遏物)(如表3中所标示,每行一种阻遏物)。还提供了一种组合物,其包含一种或多种融合分子(例如包含表1的ZFP的ZFP-TF和/或如表3所示的ZFP-TF)。
在又一个方面,提供了一种多核苷酸,其编码本文所述的一种或多种DNA结合蛋白和/或融合分子(例如人工转录因子)。在某些实施方式中,所述多核苷酸携带于病毒(例如AAV或Ad)载体和/或非病毒(例如质粒或mRNA载体或适体)载体上。还提供了一种药物组合物,其包含这些多核苷酸(例如rAAV载体)的宿主细胞和/或包含本文所述的多核苷酸、蛋白质和/或宿主细胞。在某些实施方式中,所述多核苷酸包含至少一个表3(第2列)所示的序列。还提供了包含这些多核苷酸中的一种或多种的组合物。
在另一些方面,本发明包括供体核酸向靶细胞的递送。供体可以在递送编码核酸酶的核酸之前、之后、或同时递送。供体核酸可包含整合在细胞基因组、例如内源性基因座内的外源性序列(转基因)。在一些实施方式中,供体可包含全长基因或其片段,其侧接于与靶切割位点同源的区域。在一些实施方式中,供体缺少同源性区域,并且通过与同源性无关的机制(即NHEJ)被整合在靶基因座内。供体可包含任何核酸序列,例如这样的核酸,当作为底物用于核酸酶诱导的双链断裂的同源定向修复时,其会导致在内源性染色体基因座处发生供体特异性缺失,或者(或此外)会产生内源性基因座的新等位基因形式。在一些方面,供体核酸是寡核苷酸,其中整合导致基因修正事件或靶向性缺失。
在一些实施方式中,编码DNA结合蛋白和/或人工转录因子(例如ZFP-TF)的多核苷酸是mRNA。在一些方面,mRNA可以经化学修饰(参见例如,Kormann,等(2011)NatureBiotechnology 29(2):154-157)。在另一些方面,mRNA可包含ARCA帽(参见美国专利号7,074,596和8,153,773)。在其它实施方式中,mRNA可包含未经修饰和经修饰的核苷酸的混合物(参见美国专利公开号2012/0195936)。
在又一个方面,提供了包含本文所述的一种或多种多核苷酸的基因递送载体。在某些实施方式中,载体是腺病毒载体(例如,Ad5/F35载体),或慢病毒载体(LV),包括有整合能力的或整合缺陷型慢病毒载体,或AAV载体(AAV),也称为重组腺相关病毒载体(rAAV)。在某些实施方式中,AAV载体是AAV6或AAV9载体。AAV载体可包含如表3的单行中所示的一种或多种多核苷酸(SEQ ID NO:13-17的任意一种或多种)。在某些实施方式中,AAV载体可带有天然存在的衣壳序列或人工工程改造的衣壳序列。因此,本文还提供了腺病毒(Ad)载体、LV或重组腺相关病毒载体(rAAV),其包含编码至少一种核酸酶(ZFN或TALEN)和/或用于靶向整合至靶基因内的供体序列的序列。在某些实施方式中,Ad载体是嵌合Ad载体,例如Ad5/F35载体。在某些实施方式中,慢病毒载体是整合酶缺陷型慢病毒载体(IDLV)或有整合能力的慢病毒载体。在某些实施方式中,载体是带VSV-G包膜或带其它包膜的假型化载体。
此外,还提供了包含核酸和/或蛋白质(例如ZFP、Cas或TALE)和/或融合分子(例如包含ZFP、Cas或TALE的人工转录因子)的药物组合物。例如,某些组合物包括核酸,该核酸包含编码本文所述的ZFP、Cas或TALE之一的序列,与调控序列可操作地连接,与药学上可接受的运载体或稀释剂组合,其中调控序列允许所述核酸在细胞中表达。在某些实施方式中,所编码的ZFP、CRISPR/Cas或TALE对HD HTT等位基因具有特异性。在一些实施方式中,药物组合物包含调节HD mHTT等位基因的ZFP、CRISPR/Cas或TALE和调节神经营养因子的ZFP、CRISPR/Cas或TALE。基于蛋白质的组合物包含本文所述的一种或多种ZFP、CRISPR/Cas或TALE和药学上可接受的运载体或稀释剂。在某些实施方式中,药物组合物包含用于阻遏HTT的表3的一种或多种蛋白质和/或多核苷酸。在某些实施方式中,包含本文所述的AAV载体的药物组合物包含1×107至5×1015vg(或其间的任何数值)、更优选1×107至1×1011vg(或其间的任何数值)、更优选1×108和1×1010vg(或其间的任何数值)的AAV-ZFP-TF。在某些实施方式中,AAV载体以每个纹状体1×108至1×1010(或其间的任何数值)vg的剂量给药,包括但不限于每个纹状体3e8、3e9或3e10、9.2e9、3.1e10或9.2e10 vg。纹状体内给药可以给药至单个半球,或者优选(以相同或不同剂量)双侧给药。在又一个方面,还提供了分离细胞,其包含本文所述的任何蛋白质、多核苷酸和/或组合物。
在另一个方面,本文描述了修饰细胞(例如对象的大脑、如纹状体中的体外或体内的神经元细胞)中的HTT基因表达的方法,所述方法包括给予细胞本文所述的一种或多种蛋白质、多核苷酸、药物组合物和/或细胞。(例如包含本文所述的AAV ZFP-TF的药物组合物的)给药可以在疾病症状发作之前和/或之后以任何剂量(例如1×107至5×1015AAV vg(或其间的任何数值))进行。给药可以一次性或者以任意间隔重复进行,重复给药可以是相同或不同剂量。HTT基因可包含至少一种野生型和/或突变HTT等位基因。在某些实施方式中,HTT表达被阻遏,例如其中与野生型的表达相比,突变HTT(mHTT)的表达被优先阻遏。在本文所述的一种或多种ZFP-TF给药后,HTT的阻遏(包括mHTT的选择性阻遏)可持续数天、数周、数月或数年。在某些实施方式中,在单次给药后,(与野生型HTT相比的)mHTT的选择性阻遏持续6个月或更多。
在另一个方面,本文提供了使用本文所述的方法和组合物(蛋白质、多核苷酸和/或细胞)治疗和/或预防亨廷顿氏病的方法。在一些实施方式中,该方法涉及这样的组合物,其中多核苷酸和/或蛋白质可以使用病毒载体、非病毒载体(例如,质粒)和/或其组合来递送。药物组合物也可以使用标准技术递送至对象。在一些实施方式中,该方法涉及这样的组合物,其包含含有ZFP或TALE的干细胞群,或者用本发明的ZFN、TALEN、Ttago或CRISPR/Cas核酸酶系统进行了改变。对象可包含至少一种突变和/或野生型HTT等位基因。
在再又一个方面,本文描述了使用rAAV(例如衣壳AAV9或AAV6)载体将一种或多种HTT(例如mHTT)的阻遏物递送至对象大脑的方法。可以通过包括使用套管在内的任何合适的方式(例如颅内注射)递送至任何大脑区域,例如纹状体(例如硬膜;纹状体内注射包括立体定向纹状体内注射)。向大脑(例如纹状体)内的给药可以给药至单个半球,或者可以是双侧给药(例如当双侧给药时,以相同或不同剂量)。在一些实施方式中,递送通过直接注射至鞘内空间内来进行。在其它实施方式中,递送通过静脉内注射来进行。rAAV载体为对象的大脑提供阻遏物的广泛递送,包括通过顺向和逆向轴突运输至未直接给予载体的大脑区域(例如递送至纹状体),藉此递送至其它结构,如前脑、后脑皮质、黑质、丘脑等。在某些实施方式中,对象是人,并且在另一些实施方式中,对象是非人哺乳动物。在某些实施方式中,将表3的一种或多种蛋白质和/或多核苷酸(或包含这些蛋白质和/或多核苷酸的药物组合物)递送至对象。可以使用如表3所示的任何一种阻遏物或阻遏物的组合(例如以任意方式组合的1、2、3、4或5种阻遏物)。
因此,在另一些方面,本文描述了预防和/或治疗对象中的HD的方法,所述方法包括给予对象至少一种突变HTT(mHTT)等位基因的阻遏物。阻遏物可以多核苷酸形式(例如使用病毒(例如AAV)和/或非病毒载体(例如质粒和/或mRNA))、蛋白质形式和/或通过本文所述的药物组合物(例如包含本文所述的一种或多种多核苷酸、一种或多种AAV载体、一种或多种融合分子和/或一种或多种细胞的药物组合物)来给药。在某些实施方式中,将阻遏物给药至对象的CNS(例如纹状体)。阻遏物可提供治疗益处,包括但不限于:减少患有HD的对象的HD神经元中mHTT聚集物的形成(包括在不影响核聚集的情况下减少mHTT聚集);减少神经元或神经元群(例如HD神经元或HD神经元群)中的细胞死亡;和/或减少HD对象中的运动缺陷(例如抱握(clasping)、舞蹈病、平衡问题等)。在某些实施方式中,通过将表3的一种或多种蛋白质和/或多核苷酸(或包含这些蛋白质和/或多核苷酸的药物组合物)递送至对象来阻遏突变HTT表达。
在本文所述的任一方法中,突变HTT等位基因的阻遏物可以是ZFP-TF,例如包含与突变HTT等位基因和转录阻遏结构域(例如KOX、KRAB等)特异性结合的ZFP的融合蛋白。在某些实施方式中,ZFP-TF包含具有如表1的单行中所示的ZFP的识别螺旋区域的ZFP,包括具有如表3所示的氨基酸序列或由如表3所示的多核苷酸编码的ZFP-TF阻遏物。在另一些实施方式中,突变HTT等位基因的阻遏物可以是TALE-TF或CRISPR/Cas-TF,其中Cas蛋白中的核酸酶结构域已经失活,以使蛋白质不再切割DNA。在又一些实施方式中,阻遏物可包含一种或多种核酸酶(例如ZFN、TALEN和/或CRISPR/Cas系统),其通过切割突变HTT等位基因并由此使其失活来阻遏突变HTT等位基因。在某些实施方式中,核酸酶通过非同源末端连接(NHEJ)和随后的核酸酶切割来引入插入和/或缺失(“indel”)。在一些实施方式中,两种核酸酶切割CAG扩增区域,以使该区域中产生大块缺失。
在另一些实施方式中,核酸酶(通过同源性或非同源性引导的方法)引入供体序列,其中供体整合将突变HTT等位基因失活。
在本文所述的任一方法中,阻遏物可作为蛋白质、多核苷酸、或蛋白质和多核苷酸的任意组合递送至对象(例如大脑)。在某些实施方式中,阻遏物用AAV(例如AAV9或AAV6)载体递送。在另一些实施方式中,阻遏物的至少一种组分(例如CRISPR/Cas系统的sgRNA)以RNA形式递送。在另一些实施方式中,阻遏物用本文所述的任意表达构建体的组合来递送,例如一种阻遏物(或其部分)在一种表达构建体(例如AAV,如AAV9或AAV6)上,另一种阻遏物(或其部分)在另外一种表达构建体(rAAV或其它病毒或非病毒构建体)上。
此外,在本文所述的任一方法中,阻遏物可以提供所需效果的任意浓度(剂量)递送。如本文所示,HTT阻遏可以在体内通过对象中的低至1VG/细胞的暴露量来实现。在优选的实施方式中,阻遏物使用10,000~500,000载体基因组/细胞(或其间的任何数值)的重组腺相关病毒载体来递送。在某些实施方式中,阻遏物使用MOI为250至10,000(或其间的任何数值)的慢病毒载体来递送。在另一些实施方式中,阻遏物使用150~1,500ng/100,000细胞(或其间的任何数值)的质粒构建体来递送。在另一些实施方式中,阻遏物使用0.003~1,500ng/100,000细胞(或其间的任何数值)的mRNA来递送。在一些实施方式中,为每个动物(对象)计算AAV剂量。例如,本文所述的AAV载体可包含1×107至5×1015vg(或其间的任何数值)、更优选1×107至1×1013vg(或其间的任何数值)、更优选1×108和1×1013vg(或其间的任何数值)的AAV-ZFP-TF。纹状体内给药可以给药至单个半球,或者优选(以相同或不同剂量)双侧给药。例如,在一些实施方式中,阻遏物以约9e9 VG/小鼠、或约9e9 VG/小鼠至3e10VG/小鼠、或约3e10 VG/小鼠至9e10 VG/小鼠递送。在一些实施方式中,AAV剂量少于9e9VG/小鼠(例如6e8 VG/小鼠或更少),在另一些实施方式中,AAV剂量大于9e10 VG/小鼠。
在本文所述的任一方法中,本文所述的组合物和方法可以在对象的一个或多个HD神经元中实现约70%或更高、约75%或更高、约85%或更高、约90%或更高、约92%或更高、或约95%或更高的突变HTT等位基因表达阻遏。此外,本文所述的组合物和方法与对照相比,可以在HTT(例如mHTT)阻遏方面(相比于脱靶位点的阻遏)实现至少50%、优选50%-90%(或其间的任何数值)、更预选高于90%的选择性。
在其它方面,本文所述的发明包括一种或多种HTT调节性转录因子,例如包含一种或多种锌指蛋白(ZFP TF)、TALE(TALE-TF)和CRISPR/Cas-TFs、例如ZFP-TF、TALE-TF或CRISPR/Cas-TF的HTT调节性转录因子。在某些实施方式中,HTT调节性转录因子可阻遏对象的一个或多个HD神经元中突变HTT等位基因的表达。阻遏可以是与对象的未处理的(例如野生型)神经元相比,对象的一个或多个HD神经元中突变HTT等位基因的约70%或更高、约75%或更高、约85%或更高、约90%或更高、约92%或更高、或约95%或更高的阻遏。在某些实施方式中,HTT调节性转录因子可用于实现本文所述的一种或多种方法。在某些实施方式中,ZFP-TF包含如表3所示的mHTT阻遏物的氨基酸序列。
在一些实施方式中,治疗功效使用用于分析显性临床症状的统一亨廷顿氏病评分量表(UHDRS)(亨廷顿氏病研究小组(1996)Mov Disord11(2):136-142)来测定。在另一些实施方式中,患者中的功效使用PET和MRI成像来测定。在一些实施方式中,用突变HTT调节性转录因子进行的治疗预防了显性临床症状的任何进一步发展,并且预防了神经元功能的任何进一步损失。在另一些实施方式中,用突变HTT调节性转录因子进行的治疗改善了临床症状(例如用已知的测量方法、如抱握行为、旋转杆分析等确定的运动功能),并且改善了神经元功能。
还提供了一种试剂盒,其包含本文所述的一种或多种HTT调节物(例如阻遏物)、和/或包含HTT调节物的组分和/或编码HTT调节物(或其组分)的多核苷酸。该试剂盒还可以包含细胞(例如神经元)、试剂(例如用于对例如CSF中的mHTT蛋白质进行检测和/或定量)和/或包括本文所述的方法在内的使用说明书。
基于本公开内容整体,这些和其它方面对于本领域技术人员而言将是显而易见的。
附图说明
图1显示指定的ZFP-TF的蛋白质(氨基酸)序列(SEQ ID NO:18-22)的比对。也参见表3。
图2A和图2B是显示在导入指定的ZFP-TF后的相对HTT表达(wtHTT和mHTT)的图。图2A显示在以mRNA形式导入指定的ZFP-TF或对照(GFP或模拟)后的人神经干细胞(NSC)中包含17个CAG重复序列(CAG 17示于每一对柱的左柱)(SEQ ID NO:23中所公开的“CAG”重复序列)或48个CAG重复序列(CAG 48示于每一对柱的右柱)(SEQ ID NO:23中所公开的“CAG”重复序列)的HTT的表达。对于各ZFP而言,最左边的一对柱显示将1500ng的mRNA转染至细胞内时的结果;左起第二对柱显示将300ng的mRNA转染至细胞内时的结果;右起第二对柱显示将150ng的mRNA转染至细胞内时的结果,而最右边的一对柱显示将15ng的mRNA转染至细胞内时的结果。图2B的上图显示用编码指定的ZFP-TF或对照(如图2A所示)的rAAV6载体转染后21天的HD神经元(具有图2A中指定的CAG重复序列)中的相对HTT表达。每一对柱(CAG17(17个SEQ ID NO:23中所公开的“CAG”重复序列)和CAG48(48个SEQ ID NO:23中所公开的“CAG”重复序列))的rAAV MOI示于图下部(从左到右的柱表示500K、300K、100K、10K和双重复)。图2B的下图显示指定条件下的ZFP-TF拷贝数。使用ZFP-TF(45643和46025)的结果被框出。
图3显示以低(3E10)或高(9E10)剂量用携带指定的ZFP-TF和GFP对照(GFP)的rAAV以及载剂和无注射对照进行治疗的对象体内的突变或野生型HTT的相对表达水平。显示了携带敲入(knock-in)的CAG重复序列(KI CAG48)(48个SEQ ID NO:23中所公开的“CAG”重复序列)的Q50小鼠中的突变HTT(KI等位基因Q50)表达的阻遏。
图4显示由4种指定的ZFP在HD神经元中进行的脱靶调节的微阵列分析结果。无阴影的区域表示脱靶表达为对照的50-90%。有阴影的区域表示脱靶表达水平高于对照的90%。交叉阴影的格子(45294、45643和45723的第1列)表示脱靶表达低于对照的50%。如所示,ZFP-TF的特异性从最具特异性到最不具特异性排列如下:46025>45723>45643>45294。
脱靶位点的称谓是基因缩写名称(例如,SRPX是指含Sushi重复序列的蛋白质、X连接的基因(Sushi-Repeat Containing Protein,X-linked gene),等等)。
图5A和图5B是显示在给予指定剂量的ZFP 45643mRNA(ng)后的编码野生型HTT(CAG18(18个SEQ ID NO:23中所公开的“CAG”重复序列))或突变HTT(mHTT(CAG45(45个SEQID NO:23中所公开的“CAG”重复序列)))的指定mRNA的相对表达的图。各条件(剂量)下的左(白色)柱显示HTT mRNA表达,右(黑色)柱显示mHTT表达。图5A显示指定的ZFP mRNA剂量下的成纤维细胞中的结果。图5B显示神经元中的结果(mRNA表达,记作GFP表达的百分比)。
图6显示神经元(上图)和成纤维细胞(下图)中的ZFP-TF 45643的脱靶分析。无阴影的区域表示脱靶阻遏小于或等于对照的2倍阻遏。阴影的区域表示与对照相比调节没有变化。交叉阴影的格子(显示神经元中的sprx靶标的第1列以及第1-5列(成纤维细胞中的SPRX、TTC12、MAB211.1、STC1和CNK5R2靶位点))表示脱靶阻遏大于2倍。
图7显示描述以指定剂量用编码GFP或ZFP-TF 45643的rAAV载体治疗后11周的对照(未治疗)和经治疗的Q175小鼠纹状体中野生型和mHTT表达的图,该小鼠是HD啮齿动物模型,携带人突变亨廷顿等位基因的敲入等位基因。左侧的图显示突变体(mHTT)的相对表达,右侧的图显示野生型HTT(wtHTT)的相对表达。如所示,在所有剂量的ZFP-TF治疗的动物中都可见mHTT的显著和优先阻遏。
图8显示描述以指定剂量用编码GFP或ZFP-TF 45643的AAV载体治疗后11周的对照(未治疗)和经治疗的Q175小鼠的纹状体中的病毒基因组拷贝数/细胞和mHTT mRNA水平的图。左侧的图显示指定条件下的病毒基因组拷贝数/细胞,右侧的图显示指定条件下的mHTTmRNA水平,以GFP水平的百分比表示。在所有剂量的ZFP-TF治疗的动物中可见mHTT mRNA水平的显著阻遏,包括低至1VG/细胞的暴露量。
图9显示描述以指定剂量用携带GFP或ZFP-TF 45643的rAAV载体治疗后11周(左图)和33周(右图)的Q175小鼠的大脑指定区域(纹状体、皮质前脑和皮质后脑)中的可溶性mHTT蛋白(%GFP治疗)的图。大脑各区域的柱从左到右表示:GFP 5.5e10 VG/小鼠;编码ZFP-TF 45643的rAAV载体9.2e9 VG/小鼠;编码ZFP-TF 45643的rAAV载体3.1e10 VG/小鼠;以及编码ZFP-TF 45643的rAAV载体9.2e10 VG/小鼠。单次给予编码ZFP-TF 45643的rAAV载体后,可溶性mHTT的剂量依赖性显著降低持续了33周。
图10显示描述以指定剂量用携带GFP或ZFP-TF 45643的AAV载体治疗后的R6/2HD小鼠的大脑指定区域(纹状体、皮质前脑和皮质后脑)中的可溶性mHTT蛋白(%GFP治疗)的图。大脑各区域的柱从左到右表示:GFP5.5e10 VG/小鼠;编码ZFP-TF 45643的rAAV载体9.2e9 VG/小鼠;编码ZFP-TF 45643的rAAV载体3.1e10 VG/小鼠;以及编码ZFP-TF 45643的rAAV载体9.2e10 VG/小鼠。ZFP-TF显著减少了重症R6/2HD小鼠模型中可溶性mHTT蛋白的产生。
图11显示了以指定剂量给予编码ZFP-TF 45643的rAAV载体后的Q175和R6/2小鼠中的mHTT核聚集的图。左图显示Q175对象中的转基因阳性神经元(点数/转基因阳性神经元数)中的mHTT核聚集物右图显示指定条件下的所有神经元中的mHTT核聚集物(点数/神经元数)。ZFP-TF给药减少了Q175和R6/2对象中的mHTT核聚集物。
图12是描述在指定条件下单次给药并在给药后8周进行分析的12月龄Q175小鼠的纹状体神经元中野生型(wtHTT)和突变体(mHTT)mRNA的相对表达的图。
图13是描述在指定的治疗条件下给药后8周和16周的12月龄Q175小鼠中的核周聚集物(以载剂的百分比表示)的图。在12月龄Q175小鼠中进行治疗时,ZFP-TF 45643产生了核周mHTT聚集物。
图14显示描述在指定的治疗条件下R6/2小鼠的运动功能的图。左图显示旋转杆表现测试的结果,该测试测定对象可以在旋转杆上停留多长时间。右图显示在指定年龄(以周龄为单位)在指定条件下表现出抱握行为的小鼠的百分比。
具体实施方式
本文公开了用于广泛CNS递送用于检测、监测疾病进展、治疗和/或预防亨廷顿氏病(HD)的组合物的组合物和方法。特别地,本文所述的组合物和方法使用AAV9载体来递送mHTT阻遏物,其提供功能性mHTT阻遏物的超出递送位点的扩散。该mHTT阻遏物(例如mHTT调节性转录因子,例如包含锌指蛋白(ZFP TF)、TALE(TALE-TF)或CRISPR/Cas-TF、如阻遏突变HTT等位基因表达的ZFP-TF、TALE-TF或CRISPR/Cas-TF的mHTT调节性转录因子)例如通过减少HD神经元中HTT的聚集、通过增加HD神经元能量(例如增加ATP水平)、通过减少HD神经元中的细胞凋亡和/或通过减少HD对象中的运动缺陷,来修饰CNS以减少或消除HD的影响和/或症状。
概述
除非另有说明,本方法的实施以及本文所述组合物的制备与应用采用本领域技术范围内的分子生物学、生物化学、染色质结构与分析、计算化学、细胞培养、重组DNA与相关领域的常规技术。这些技术在文献中已有充分描述。参见例如,Sambrook等,MOLECULARCLONING:A LABORATORY MANUAL(《分子克隆:实验室手册》)第2版,冷泉港实验室出版社(Cold Spring Harbor Laboratory Press),1989以及第3版,2001;Ausubel等,CURRENT方案IN MOLECULAR BIOLOGY(《新编分子生物学实验指南》),纽约约翰韦利父子公司(JohnWiley&Sons,New York)1987及定期更新;METHODS IN ENZYMOLOGY(《酶学方法》)丛书,圣迭戈学术出版社(Academic Press,San Diego);Wolffe,CHROMATIN STRUCTURE ANDFUNCTION(《染色质结构与功能》),第3版,学术出版社,圣迭戈,1998;METHODS INENZYMOLOGY(《酶学方法》),第304卷,“Chromatin(染色质)”(P.M.Wassarman和A.P.Wolffe编),学术出版社,圣迭戈,1999;和METHODS IN MOLECULAR BIOLOGY(《分子生物学方法》),第119卷,“Chromatin方案(染色质方法)”(P.B.Becker编),托托瓦的休玛纳出版社(HumanaPress,Totowa),1999。
定义
术语"核酸","多核苷酸"和"寡核苷酸"互换使用并指脱氧核糖核苷酸或核糖核甘酸聚合物,可以是直链或环状构型的,是单链或双链形式的。出于本公开目的,这些术语不意在限制聚合物的长度。所述术语可涵盖天然核苷酸的已知类似物,以及在碱基、糖和/或磷酸部分(例如,硫代磷酸酯主链)经修饰的核苷酸。一般而言,具体核苷酸的类似物具有相同的碱基配对特异性;即,A的类似物将与T进行碱基配对。
术语“多肽”、“肽”和“蛋白质”在本文中可互换使用,指氨基酸残基的聚合物。该术语还应用于其中一种或多种氨基酸是对应的天然产生的氨基酸的化学类似物或经修饰的衍生物的氨基酸聚合物。
"结合"指大分子之间(例如蛋白质与核酸之间)的序列特异性、非共价相互作用。只要相互作用作为整体为序列特异性,不要求结合相互作用的所有组分都是序列特异性(例如,与DNA主链中的磷酸残基接触)。这样的相互作用通常表征为解离常数(Kd)是10-6M-1或更低。“亲和力”指结合的强度:增加的结合亲和力性与较低的Kd关联。
"结合蛋白"是能与另一分子非共价结合的蛋白质。结合蛋白能够结合至,例如,DNA分子(DNA结合蛋白)、RNA分子(RNA结合蛋白)和/或蛋白质分子(蛋白质结合蛋白)。在蛋白质结合蛋白的情况中,其可与自身结合(形成同型二聚体、同型三聚体等)和/或其可与一种或多种不同蛋白的一个或多个分子结合。结合蛋白可具有多于一种类型的结合活性。例如,锌指蛋白具有DNA结合、RNA结合和蛋白结合活性。
锌指“DNA结合蛋白”(或结合结构域)是能以序列特异性方式通过一个或多个锌指结合DNA的蛋白质或较大蛋白质内的结构域,锌指是通过锌离子配位稳定其结构的结合结构域内氨基酸序列的区域。术语锌指DNA结合蛋白常缩写为锌指蛋白或ZFP。
“TALE DNA结合结构域”或“TALE”是包含一种或多种TALE重复结构域/单元的多肽。重复结构域涉及TALE与其关联靶DNA序列的结合。单个“重复单元”(也称作“重复”)通常长33-35个氨基酸,并且与天然产生的TALE蛋白中的其它TALE重复序列显示至少一些序列同源性。参见例如,美国专利号8,586,526。
“TtAgo”是原核阿尔古(Argonaute)蛋白质,认为其参与基因沉默。TtAgo源自嗜热细菌(Thermus thermophilus)。参见例如,Swarts等(2014)Nature 507(7491):258-261;G.Sheng等(2013)Proc.Natl.Acad.Sci.U.S.A.111:652)。“TtAgo系统”是所需的全部组分,其包括例如用于被TtAgo酶切割的向导DNA。“重组”表示两种多核苷酸之间交换遗传信息的过程,包括但不限于通过非同源末端连接(NHEJ)和同源性重组的供体捕获。就本公开的目的而言,“同源重组(HR)”指发生这种交换的特定形式,例如在修复细胞内双链断裂期间通过同源定向修复机制发生。该过程要求核苷酸序列同源性,利用“供体”分子模板修复“靶”分子(即,经历双链断裂的分子),该过程也称作“非交叉基因转化”或“短段基因转化”,因为其导致遗传信息从供体向靶转移。不希望受限于任何特定理论,这种转移可以涉及断裂的靶与供体间形成的异双链体DNA的错配修正,和/或采用供体再合成将成为部分靶的遗传信息的“合成依赖性链退火”,和/或相关过程。这种专门的HR通常导致靶分子序列的改变,从而供体多核苷酸的部分或全部序列被纳入靶多核苷酸中。
锌指结合结构域和TALE DNA结合结构域可经“工程改造”,以结合预定的核苷酸序列,例如,通过对天然产生的锌指蛋白的识别螺旋区域的工程改造(改变一个或多个氨基酸)或通过对TALE蛋白的RVD进行工程改造。因此,经工程改造的锌指蛋白或TALE是非天然产生的蛋白质。用于工程改造锌指蛋白或TALE的方法的非限制性示例是设计和选择。经“设计”的锌指蛋白或TALE是非天然产生的蛋白质,其设计/组成主要来自于合理标准。设计的合理标准包括应用替代法则和计算机算法来处理现有ZFP设计和结合数据的数据库存储信息中的信息。“选择的”锌指蛋白或TALE是不存在于自然界中的蛋白质,其产生的结果主要来自经验过程,例如噬菌体展示、相互作用阱或杂交体选择。参见例如,美国专利号5,605,806;6,140,081;6,453,242;6,746,838;7,241,573;6,866,997;7,241,574和6,534,261;也参见国际专利公开号WO 03/016496。
术语“序列”指任意长度的核苷酸序列,可以是DNA或RNA;可以是直链、环状或支链且可以是单链或双链。术语“供体序列”指插入基因组的核苷酸序列。供体序列可以是任意长度,例如长度为2-10,000个核苷酸(或其间或其上的任意整数值),优选长度为100-1,000个核苷酸(或其间的任意整数),更优选长度为200-500个核苷酸。
"靶位点"或"靶序列"是限定结合分子将结合的核酸部分的核酸序列,前提是存在结合的充分条件。
“外源性”分子是通常不存在于细胞内的分子,但可通过一种或多种遗传、生化或其它方法导入细胞。“正常存在于细胞中”相对于细胞的具体发育阶段和环境条件确定。因此,例如,仅在肌肉的胚胎发育期间存在的分子对于成体肌肉细胞是外源性分子。类似地,相对于非热激的细胞,通过热激诱导的分子是外源性分子。例如,外源性分子可以包括功能失常的内源性分子的功能性形式或者正常功能的内源性分子的功能失常形式。
外源性分子可以是小分子或大分子等,小分子如由组合化学方法所产生,大分子如蛋白质、核酸、碳水化合物、脂质、糖蛋白、脂蛋白、多糖、上述分子的任何经修饰衍生物,或者是包含一种或多种上述分子的任何复合物。核酸包括DNA和RNA,其可以是单链或双链的;可以是直链、支链或环状的;并且可以具有任何长度。核酸包括能够形成双链体的那些,以及形成三链体的核酸。参见,例如美国专利号5,176,996和5,422,251。蛋白质可包括但不限于,DNA结合蛋白、转录因子、染色质重构因子、甲基化DNA结合蛋白、聚合酶、甲基化酶、脱甲基酶、乙酰基转移酶、脱乙酰酶、激酶、磷酸酶、整合酶、重组酶、连接酶、拓扑异构酶、旋转酶和解旋酶。
外源性分子可以是与内源性分子同一类型的分子,例如外源性蛋白或核酸。例如,外源性核酸可以包括感染性病毒基因组、引入细胞内的质粒或附加体,或包含通常不存在于细胞内的染色体。本领域技术人员已知将外源性分子导入细胞内的方法,包括但不限于脂质介导的转移(即脂质体,包括中性和阳离子脂质)、电转导、直接注射、细胞融合、粒子轰击、磷酸钙共沉淀、DEAE-葡聚糖介导的转移和病毒载体介导的转移。外源性分子也可以是与内源性分子相同类型但源自与该细胞来源不同物种的分子。例如,可将人核酸序列引入原始源自小鼠或仓鼠的细胞系。
不同的是,“内源性”分子是通常存在于特定环境条件下特定发育阶段的特定细胞中的分子。例如,内源性核酸可以包括染色体、线粒体基因组、叶绿体或其它细胞器,或天然产生的附加型核酸。其它内源性分子可包括蛋白质,例如,转录因子和酶。
“融合”分子是其中两个或更多个亚基分子相连(优选共价相连)的分子。亚基分子可以是相同化学类型的分子,也可以是不同化学类型的分子。第一类型的融合分子的示例可包括但不限于,融合蛋白(例如,ZFP或TALE DNA结合结构域与一种或多种活化结构域之间的融合)和融合核酸(例如,编码上文所述的融合蛋白的核酸)。第二类融合分子的示例包括但不限于:形成三链体的核酸与多肽之间的融合体,以及小沟结合子与核酸之间的融合体。该术语还包括其中多核苷酸组分与多肽组分相关联以形成功能性分子(例如,CRISPR/Cas系统,其中单一向导RNA与功能结构域相关联以调节基因表达)。
细胞内融合蛋白的表达可由融合蛋白递送入细胞造成或通过向细胞递送编码融合蛋白的多核苷酸而引起,其中所述多核苷酸被转录,转录本经翻译产生所述融合蛋白。细胞中蛋白质的表达也可涉及反式剪接、多肽切割和多肽连接。用于将多核苷酸和多肽递送至细胞的方法在本公开内容中的他处呈现。
“多聚化结构域”(也称为“二聚化结构域”或“蛋白质相互作用结构域”)是在ZFPTF或TALE TF的氨基、羧基或氨基和羧基末端区域掺入的结构域。这些结构域允许多个ZFPTF或TALE TF单元的多聚化,以使较大段的三核苷酸重复序列结构域相对于具有野生型长度数的较短段更优先被多聚化的ZFP TF或TALE TF结合。多聚化结构域的例子包括亮氨酸拉链。多聚化结构域也可以由小分子来调控,其中多聚化结构域呈现适当的构象,从而仅在小分子或外部配体的存在下才允许与另一个多聚化结构域相互作用。如此,外源性配体可用于调控这些结构域的活性。
就本公开的目的而言,“基因”包括编码基因产物(见前文)的DNA区域,以及调节基因产物生成的DNA区域,不论这类调节序列是否毗邻编码和/或转录序列。因此,基因包括但不必限于,启动子序列、终止子、翻译调节序列,例如核糖体结合位点和内部核糖体进入位点、增强子、沉默子、绝缘子、边界元件、复制起点、基质连接位点和基因座控制区域。
“基因表达”指将基因所含信息转化成基因产物。基因产物可以是基因的直接转录产物(例如,mRNA、tRNA、rRNA、反义RNA、核糖酶、结构RNA或任何其它类型的RNA)或通过mRNA翻译产生的蛋白质。基因产物还包括经修饰的RNA,通过如下加工修饰,例如加帽、聚腺苷酸化、甲基化,和编辑,以及通过如下加工修饰的蛋白质,例如,甲基化、乙酰化、磷酸化、泛素化、ADP-核糖基化、豆蔻酰化和糖基化。
基因表达的“调控”指基因活性的改变。表达的调控可包括但不限于,基因活化和基因阻遏。基因组编辑(例如,切割,改变,失活,随机突变)可以用于调控表达。基因失活指相较于没有包含本文所述的ZFP或TALE的细胞,基因表达的任何减少。因此,基因失活可以是部分或完全的。
“感兴趣的区域”是需要结合外源性分子的细胞染色质的任意区域,例如,基因或者基因内或与之毗邻的非编码序列。结合可以是出于靶向DNA切割和/或靶向重组的目的。感兴趣的区域可以存在于例如染色体,附加体,细胞器基因组(例如,线粒体、叶绿体),或感染性病毒基因组中。感兴趣的区域可处于基因的编码区中,转录的非编码区域例如前导序列、尾随序列或内含子中,或非转录区域中编码区的上游或下游。感兴趣的区域可如单一核苷酸对一样小,或长达2,000个核苷酸对,或任意整数值的核苷酸对。
“真核”细胞可包括但不限于,真菌细胞(例如酵母)、植物细胞、动物细胞、哺乳动物细胞和人细胞(例如,T细胞)。
涉及两个或更多个组分(例如序列元件)的并置,所述组分设置成组分都可正常发挥作用并允许组分中至少一种能介导施加于至少一种其它组分上的作用时,术语“操作性相连”和“操作性连接的”(或“操作地连接”)互换使用。例如,若转录调节序列控制编码序列响应一种或多种转录调节因子存在与否时的转录水平,则所述转录调节序列如启动子与所述编码序列操作性连接。转录调节序列一般与编码序列以顺式操作性地连接,但无需紧邻该序列。例如,增强子是操作性地连接编码序列的转录调节序列,尽管它们是不连续的。
对于融合多肽,术语“操作性连接”可指各组分在与其它组分的连接中所发挥的功能与其在未连接时的功能相同。例如,对于其中的ZFP或TALE DNA结合结构域与活化结构域融合的融合多肽,如果在该融合多肽中,ZFP或TALE DNA结合结构域部分能够结合其靶位点和/或其结合位点,同时所述活化结构域能够上调基因表达,那么所述ZFP或TALE DNA结合结构域和活化结构域是操作性连接的。与能够调控基因表达的结构域融合的ZFP统称为“ZFP-TF”或“锌指转录因子”,而与能够调控基因表达的结构域融合的TALE统称为“TALE-TF”或“TALE转录因子”。在其中ZFP DNA结合结构域与切割结构域融合的融合多肽(“ZFN”或“锌指核酸酶”)的情况中,如果在所述融合多肽中,所述ZFP DNA结合结构域部分能结合其靶位点和/或其结合位点,同时切割结构域能切割靶位点附近的DNA,那么所述ZFP DNA结合结构域和切割结构域是操作性连接的。在其中TALE DNA结合结构域与切割结构域融合的融合多肽(“TALEN”或“TALE核酸酶”)的情况中,如果在所述融合多肽中,所述TALE DNA结合结构域部分能结合其靶位点和/或其结合位点,同时切割结构域能切割靶位点附近的DNA,那么所述TALE DNA结合结构域和切割结构域是操作性连接的。对于其中Cas DNA结合结构域与活化结构域融合的融合多肽,如果在该融合多肽中,Cas DNA结合结构域部分能够结合其靶位点和/或其结合位点,同时所述活化结构域能够上调基因表达,那么所述Cas DNA结合结构域和活化结构域是操作性连接的。在其中Cas DNA结合结构域与切割结构域融合的融合多肽的情况中,如果在所述融合多肽中,所述Cas DNA结合结构域部分能结合其靶位点和/或其结合位点,同时切割结构域能切割靶位点附近的DNA,那么所述Cas DNA结合结构域和切割结构域是操作性连接的。
蛋白质、多肽或核酸的“功能性片段(或功能片段)”是序列与全长蛋白质、多肽或核酸不相同但保留全长蛋白质、多肽或核酸的相同功能的蛋白质、多肽或核酸。功能性片段可具有比相应的天然分子更多、更少或相同数量的残基,和/或可含有1个或多个氨基酸或核苷酸取代。用于确定核酸功能(例如,编码功能、与另一核酸杂交的能力)的方法是本领域熟知的。类似地,用于确定蛋白质功能的方法也是为本领域熟知的。例如,可测定多肽的DNA结合功能,例如通过滤膜结合、电泳迁移率改变或免疫沉淀试验。DNA切割可通过凝胶电泳分析。参见Ausubel等,同上。可测定蛋白质与另一蛋白质相互作用的能力,例如,通过共免疫沉淀、双杂交试验或互补分析,既可以是遗传的也可以是生化的。参见例如,Fields,等(1989)Nature 340:245-246;美国专利号5,585,245和国际专利公开号WO 98/44350。
“载体”能将基因序列转移至靶细胞。“载体构建体”、“表达载体”和“基因转移载体”通常指能指导感兴趣基因表达并能将基因序列转移至靶细胞的核酸构建体。因此,该术语包括克隆和表达载体,以及整合载体。该术语包括病毒和非病毒载体,包括但不限于质粒、mRNA、AAV(本文中也称为“重组AAV”或“rAAV”)、腺病毒载体(Ad)、慢病毒载体(例如IDLV)等。
“报告基因”或“报告序列”指的是产生这样蛋白质产物的任何序列,所述蛋白质产物容易被检测,其在常规试验中并非必需但是优选的。合适的报告基因包括但不限于,编码介导抗生素抗性(例如氨苄青霉素抗性,新霉素抗性,G418抗性,嘌呤霉素抗性)的蛋白质的序列,编码有色或荧光或发光蛋白(例如绿色荧光蛋白,增强型绿色荧光蛋白,红色荧光蛋白,荧光素酶)的序列,和介导增强的细胞生长和/或基因扩增的蛋白质(例如,二氢叶酸还原酶)。表位标签包括,例如,一个或多个拷贝的FLAG、His、myc、Tap、HA或任何可检测的氨基酸序列。“表达标签”包括编码可操作性地连接至所需基因序列以监测感兴趣的基因的表达的报告物的序列。
DNA结合结构域
本文公开的方法利用组合物,例如HTT调节性转录因子,其包含与HTT基因中的靶序列特异性结合的DNA结合结构域,特别是与包含多个三核苷酸重复的突变HTT等位基因(mHTT)结合的DNA结合结构域。本文公开的组合物和方法中可使用任何多核苷酸或多肽DNA结合结构域,例如DNA结合蛋白(例如ZFP或TALE)或DNA结合多核苷酸(例如单向导RNA)。在某些实施方式中,DNA结合结构域与包含SEQ ID NO:6的核苷酸的9~28(或其间的任何数值,包括10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26或27)个连续拷贝的靶位点结合。
在某些实施方式中,mHTT调节性转录因子或其中的DNA结合结构域包含锌指蛋白。靶位点选择;用于设计和构建融合蛋白(及其编码多核苷酸)的ZFP和方法是本领域技术人员已知的,并且详细描述于美国专利号6,140,081;5,789,538;6,453,242;6,534,261;5,925,523;6,007,988;6,013,453;6,200,759;国际专利公开号WO 95/19431;WO 96/06166;WO 98/53057;WO 98/54311;WO 00/27878;WO 01/60970;WO 01/88197;WO 02/099084;WO98/53058;WO 98/53059;WO 98/53060;WO 02/016536;和WO03/016496。
在某些实施方式中,ZFP可选择性地与突变HTT等位基因或野生型HTT序列结合。HTT靶位点通常包括至少一个锌指,但可以包括多个锌指(例如2、3、4、5、6或更多个指)。参见例如,美国专利号9,234,016;9,943,565;8,841,260;9,499,597和美国专利公开号2015/0335708;2018/0200332;2017/0096460;2017/0035839;2016/0296605;2019/0322711。ZFP通常包括至少三个指。某些ZFP包括4、5或6个指,而一些ZFP包括7、8、9、10、11或12个指。包括三个指的ZFP通常识别包括9或10个核苷酸的靶位点;包括四个指的ZFP通常识别包括12-14个核苷酸的靶位点;而具有六个指的ZFP能识别包括18-21个核苷酸的靶位点。ZFP也可以是包括一个或多个调控结构域的融合蛋白,所述结构域可以是转录活化或阻遏结构域。在一些实施方式中,融合蛋白包含连接在一起的两个ZFP DNA结合结构域。因此,这些锌指蛋白可包括8、9、10、11、12或更多个指。在一些实施方式中,两个DNA结合结构域通过可延伸的柔性接头连接,因而一个DNA结合结构域包含4、5或6个锌指,而第二个DNA结合结构域包含额外的4、5或5个锌指。在一些实施方式中,接头是标准指间接头,以使指阵列包含一个包括8、9、10、11、12或更多个指的DNA结合结构域。在另一些实施方式中,接头是非典型接头,例如柔性接头。DNA结合结构域与至少一个调控结构域融合,并且可以被认为是“ZFP-ZFP-TF”结构。这些实施方式的具体例可称为“ZFP-ZFP-KOX”和“ZFP-KOX-ZFP-KOX”,其中,“ZFP-ZFP-KOX”包含通过柔性接头连接并与KOX阻遏物融合的两个DNA结合结构域,“ZFP-KOX-ZFP-KOX”中的两个ZFP-KOX融合蛋白通过接头融合在一起。
或者,DNA结合结构域可衍生自核酸酶。例如,寻靶内切核酸酶和兆核酸酶的识别序列例如I-SceI、I-CeuI、PI-PspI、PI-Sce、I-SceIV、I-CsmI、I-PanI、I-SceII、I-PpoI、I-SceIII、I-CreI、I-TevI、I-TevII和I-TevIII是已知的。还参见美国专利第5,420,032号;美国专利第6,833,252号;Belfort等(1997)Nucleic Acids Res.25:3379–3388;Dujon等(1989)Gene 82:115–118;Perler等(1994)Nucleic Acids Res.22,1125–1127;Jasin(1996)Trends Genet.12:224–228;Gimble等(1996)J.Mol.Biol.263:163–180;Argast等(1998)J.Mol.Biol.280:345–353和新英格兰生物实验室公司(New England Biolabs)产品目录。此外,归巢内切核酸酶和兆核酸酶的DNA结合特异性可被工程改造以结合非天然靶位点。参见例如Chevalier等(2002)Molec.Cell10:895-905;Epinat等(2003)Nucleic AcidsRes.31:2952-2962;Ashworth等(2006)Nature 441:656-659;Paques等(2007)CurrentGene Therapy 7:49-66;美国专利公开号2007/0117128。
“双手(Two handed)”锌指蛋白是这样的蛋白质,其中两簇锌指DNA结合结构域通过介于中间的氨基酸分隔,从而使两个锌指结构域与两个不连续的靶位点结合。双手类型的锌指结合蛋白的示例是SIP1,其中四个锌指的簇位于蛋白质的氨基末端,而三个锌指的簇位于羧基末端(参见,Remacle等(1999)EMBO Journal 18(18):5073-5084)。这些蛋白质中锌指的各个簇能够结合独特的靶序列,并且两个靶序列之间的间隔可以囊括许多核苷酸。双手ZFP可包含例如与一个或两个ZFP融合的功能结构域。因此,将显而易见的是,功能结构域可以连接至一个或两个ZFP的外部(参见图1C),或者可以位于ZFP之间(连接两个ZFP)(参见图4)。
靶向HTT的ZFP公开于表1以及美国专利号9,234,016;8,841,260;6,534,261;美国专利公开号2017/0096460;2015/0056705;2015/0335708;2019/0322711,其通过引用其全文纳入本文用于所有目的。该表中的第一列是ZFP的内部参比名称(数量),与表2第1列中的相同名称相对应。“F”指代指,“F”之后的数字是指哪个锌指(例如“F1”代指指1)。
表1:靶向HTT的锌指蛋白
Figure BDA0003164619740000281
这些蛋白质的靶位点的序列和位置在表2中公开。与ZFP识别螺旋接触的靶位点中的核苷酸以大写字母表示;不接触的核苷酸以小写字母表示。
表2:人和小鼠HTT上的靶位点
SBS号 靶位点
45643 agCAGCAGcaGCAGCAGCAgcagcagca(SEQ ID NO:6)
46025 agCAGCAGCAGcaGCAGCAgcagcagca(SEQ ID NO:6)
45294 caGCAGCAGCAGCAGCAgcagcagcagc(SEQ ID NO:11)
45723 agCAGCAGcaGCAGCAgcagcagcagca(SEQ ID NO:6)
33074 CAGCAGcaGCAGCAgCAGCAG(SEQ ID NO:12)
本文所述的ZFP-TF还可以包含一个或多个突变外部识别螺旋区域(例如针对骨架区域),包括美国专利公开号2018/0087072中所述的突变。
在某些实施方式中,DNA结合结构域包含天然产生或工程改造(非天然产生)的TAL效应物(TALE)DNA结合结构域。参见例如,美国专利号8,586,526,其通过引用其全文纳入本文。
已知黄单胞菌属(Xanthomona)的植物病原菌在重要农作物中导致很多疾病。黄单胞菌属的病原性取决于保守的I II型分泌(T3S)系统,该系统向植物细胞内注入超过25种不同的效应物蛋白。这些注射的蛋白质包括模仿植物转录活化剂并操纵植物转录组的转录活化剂样效应物(TALE)(参见Kay等,(2007)Science 318:648-651)。这些蛋白质含有DNA结合结构域和转录活化结构域。最为充分表征的TALE之一是来自野油菜黄单胞菌辣椒斑点病致病变种(Xanthomonas campestris pv.vesicatoria)的AvrBs3(参见Bonas等(1989)MolGen Genet 218:127-136和国际专利公开号WO2010/079430)。TALE含有串联重复的集中化结构域,各重复含有约34个氨基酸,它们是这些蛋白质的DNA结合特异性的关键。此外,它们含有核定位序列和酸性转录激活结构域(综述参见S.Schornack等(2006)J Plant Physiol163(3):256-272)。此外,在致植物病细菌烟草青枯菌(Ralstonia solanacearum)中,已在烟草青枯菌生物变型1菌株GMI1000和生物变型4菌株RS1000中发现两个基因,称为brg11和hpx17,其与黄单胞菌属(Xanthomonas)的AvrBs3家族具有同源性(参见Heuer等(2007)Appland Envir Micro 73(13):4379-4384)。这些基因在核苷酸序列上彼此具有98.9%的同一性,但区别为hpx17重复结构域中的1,575bp缺失。然而,两种基因产物均与黄单胞菌属的AvrBs3家族蛋白质具有低于40%序列相同性。
这些TALE的特异性取决于串联重复中存在的序列。重复序列包含约102个碱基对,且所述重复序列彼此通常为91-100%同源(Bonas等,(1989)Mol Gen Genet 218:127-136)。重复的多态性通常位于12和13位,并且似乎在位置12和13的高可变双残基的种类与TALE靶序列中连续核苷酸的种类之间存在一一对应(参见Moscou和Bogdanove,(2009)Science 326:1501以及Boch等(2009)Science 326:1509-1512)。实验上,已确定用于这些TALE的DNA识别的编码,因此位于位置12与13的HD序列导致对于胞嘧啶(C)的结合,NG结合至T,NI结合至A、C、G或T,NN结合至A或G,且NG结合至T。这些DNA结合重复序列已被组装成具有新的组合和重复序列数量的蛋白质,以制造能够与新序列相互作用的人工转录因子。此外,美国专利号8,586,526和美国专利公开号2013/0196373描述了具有N-帽多肽、C-帽多肽(例如+63、+231或+278)和/或新型(非典型)RVD的TALE,其通过引用其全文纳入本文。
示例性的TALE描述于美国专利公开号2013/0253040,其通过引用其全文纳入本文。
在某些实施方式中,DNA结合结构域包含二聚化和/或多聚化结构域,例如卷曲螺旋(CC)和二聚化锌指(DZ)。参见美国专利公开号2013/0253040。
在又一些实施方式中,DNA结合结构域包含CRISPR/Cas系统的单向导RNA,例如美国专利公开号2015/0056705中所述的sgRNA。
最近出现了令人信服的证据,表明在古细菌和许多细菌中存在RNA介导的基因组防御途径,并假设该途径与真核RNAi途径平行(其综述参见Godde和Bickerton(2006)J.Mol.Evol.62:718-729;Lillestol等(2006)Archaea2:59-72;Makarova等(2006)Biol.Direct 1:7;Sorek等(2008)Nat.Rev.Microbiol.6:181-186)。有人提出,被称为CRISPR-Cas系统或原核RNAi(pRNAi)的途径来自两个进化上且通常在物理上有联系的基因位点:编码该系统的RNA组分的CRISPR(规律成簇的间隔短回文重复序列)基因座,以及编码蛋白质的Cas(CRISPR相关)基因座(Jansen等.(2002)Mol.Microbiol.43:1565-1575;Makarova等.(2002)Nucleic Acids Res.30:482-496;Makarova等.(2006)Biol.Direct 1:7;Haft等.(2005)PLoS Comput.Biol.1:e60)。微生物宿主中的CRISPR基因座包含CRISPR-相关(Cas)基因以及能够对CRISPR介导的核酸切割的特异性进行编程的非编码RNA元件的组合。单个Cas蛋白与真核RNAi机制的蛋白质组分没有显著的序列相似性,但具有类似的预测功能(例如,RNA结合、核酸酶、解旋酶等)(Makarova等(2006)Biol.Direct1:7)。CRISPR相关(Cas)基因往往与CRISPR重复序列-间隔物阵列相关联。已经描述了四十多种不同的Cas蛋白家族。在这些蛋白质家族中,Cas1似乎在不同的CRISPR/Cas系统中无处不在。cas基因和重复序列结构的特定组合已被用于定义8种CRISPR亚型(Ecoli、Ypest、Nmeni、Dvulg、Tneap、Hmari、Apern和Mtube),其中一些与编码重复序列相关未知蛋白(RAMP)的其它基因模块相关联。一个基因组中可能出现不止一种CRISPR亚型。CRISPR/Cas亚型的零星分布表明,该系统在微生物进化过程中受到水平基因转移的影响。
最初在酿脓链球菌(S.pyogenes)中描述的II型CRISPR是最充分表征的系统之一,并且以4个连续步骤进行靶向DNA双链断裂。首先,从CRISPR基因座转录两个非编码RNA:前-crRNA阵列和tracrRNA。第二,tracrRNA与前-crRNA的重复序列区域杂交,并介导前-crRNA加工成包含单个间隔物序列的成熟crRNA,其中在Cas9蛋白存在的情况下,通过双链特异性RNase III进行加工。第三,成熟的crRNA:tracrRNA复合物通过沃森-克里克碱基配对指导Cas至靶DNA,其位于crRNA上的间隔子和原型间隔子邻近基序(PAM)旁边的靶DNA上的原型间隔子之间,所述PAM是靶标识别的额外要求。此外,tracrRNA也必须存在,因为它与crRNA的3’末端碱基配对,这种关联触发Cas9活性。最后,Cas9介导靶DNA的切割,以在原型间隔子内产生双链断裂。CRISPR/Cas系统活性包括3步:(i)通过称作“适应”的过程将外来DNA序列插入CRISPR阵列,以防止未来的攻击,(ii)表达相关蛋白质,以及表达和处理所述阵列,然后(iii)采用外来核酸进行RNA介导的干扰。因此,在细菌细胞中,有多个所谓的“Cas”蛋白涉及到CRISPR/Cas系统的天然功能。
II型CRISPR系统已在许多不同的细菌中被发现。Fonfara等人((2013)Nuc AcidRes 42(4):2377-2590)对公开可用的基因组进行BLAST搜索,在347种细菌中发现了Cas9直系同源物。此外,该小组证明了使用来自酿脓链球菌(S.pyogenes)、变形链球菌(S.mutans)、嗜热链球菌(S.therophilus)、空肠弯曲菌(C.jejuni)、脑膜炎奈瑟菌(N.meningitides)、多杀性巴氏杆菌(P.multocida)和新凶手弗朗西丝菌(F.novicida)的Cas9直系同源物对DNA靶标进行体外CRISPR/Cas切割。因此,术语“Cas9”是指包含DNA结合结构域和两个核酸酶结构域的RNA引导的DNA核酸酶,其中编码Cas9的基因可以源自任何合适的细菌。
Cas9蛋白具有至少两个核酸酶结构域:一个核酸酶结构域与HNH核酸内切酶类似,而另一个类似于Ruv核酸内切酶结构域。HNH型结构域似乎负责切割与crRNA互补的DNA链,而Ruv结构域切割非互补链。Cas 9核酸酶可以进行工程改造,使得只有一个核酸酶结构域具有功能,从而创建Cas切口酶(参见Jinek等(2012)Science 337:816)。切口酶可以通过酶的催化结构域中氨基酸的特定突变来产生,或者通过截断部分或全部结构域使其不再具有功能来产生。由于Cas 9包含两个核酸酶结构域,因此可以在任一结构域上采用这种方法。通过使用两种这样的Cas 9切口酶,可以在靶DNA中实现双链断裂。切口酶将分别切割DNA的一条链,使用两种切口酶将产生双链断裂。
通过使用包含通常由crRNA和tracrRNA退火形成的发夹的工程改造“单向导RNA”(sgRNA),可避免对crRNA-tracrRNA复合物的需求(参见Jinek等(2012)Science 337:816和Cong等(2013)Science 339(6121):819-823,Sciencexpress/10.1126/science.1231143)。在热原链球菌(S.pyrogenes)中,当Cas相关RNA和靶DNA之间形成双链RNA:DNA异二聚体时,工程改造的tracrRNA:crRNA融合物或sgRNA会引导Cas9切割靶DNA。该系统包含Cas9蛋白和含有PAM序列的工程改造sgRNA,已用于RNA引导的基因组编辑(参见Ramalingam(2013)Genome Biol.14(2):107),并且已在体内用于斑马鱼胚胎基因组编辑(参见Hwang等(2013)Nature Biotechnology 31(3):227),其编辑效率类似于ZFN和TALEN。
CRISPR基因座的主要产物似乎是包含入侵者靶向序列的短RNA,根据它们在该途径中的假设作用被称为向导RNA或原核沉默RNA(psiRNA)(Makarova等(2006)Biol.Direct1:7;Hale等(2008)RNA 14:2572-2579)。RNA分析表明,CRISPR基因座转录本在重复序列内被切割以释放约60至70nt的RNA中间体,其中包含单个入侵者靶向序列和侧翼重复序列片段(Tang等(2002)Proc.Natl.Acad.Sci.99:7536-7541;Tang等(2005)Mol.Microbiol.55:469-481;Lillestol等(2006)Archaea 2:59-72;Brouns等(2008)Science 321:960-964;Hale等(2008)RNA 14:2572-2579)。在古细菌极端嗜热古细菌(Pyrococcus furiosus)中,这些中间体RNA被进一步加工成丰富、稳定的约35至45nt的成熟psiRNA(Hale等(2008)RNA14:2572-2579)。
通过使用包含通常由crRNA和tracrRNA退火形成的发夹的工程改造“单向导RNA”(sgRNA),可避免对crRNA-tracrRNA复合物的需求(参见Jinek等(2012)Science 337:816和Cong等(2013)Science 339(6121):819-823,Sciencexpress/10.1126/science.1231143)。在热原链球菌(S.pyrogenes)中,当Cas相关RNA和靶DNA之间形成双链RNA:DNA异二聚体时,工程改造的tracrRNA:crRNA融合物或sgRNA会引导Cas9切割靶DNA。该系统包含Cas9蛋白和含有PAM序列的工程改造sgRNA,已用于RNA引导的基因组编辑(参见Ramalingam(2013)Genome Biol.14(2):107),并且已在体内用于斑马鱼胚胎基因组编辑(参见Hwang等(2013)Nature Biotechnology 31(3):227),其编辑效率类似于ZFN和TALEN。
嵌合或sgRNA可以被工程改造成包含与任何所需靶标互补的序列。在一些实施方式中,引导序列的长度为约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75或更多个核苷酸或更长。在一些实施方式中,引导序列的长度小于约75、50、45、40、35、30、25、20、15、12或更少个核苷酸。在一些实施方式中,RNA包含与靶标互补的22个碱基,形式为G[n19],然后是NGG或NAG形式的原型间隔物相邻基序(PAM),用于酿脓链球菌(S.pyogenes)CRISPR/Cas系统。因此,在一个方法中,sgRNA可通过利用感兴趣的基因中已知的ZFN靶标进行设计,方法是:(i)将ZFN异二聚体的识别序列与相关基因组(人、小鼠或特定植物物种)的参比序列进行比对;(ii)鉴定ZFN半位点之间的间隔物区域;(iii)确定最靠近间隔物区域的基序G[N20]GG的位置(当不止一个这样的基序与间隔物重叠时,选择相对于间隔物居中的基序);(iv)使用该基序作为sgRNA的核心。该方法有利地依赖于经证实的核酸酶靶标。或者,可以将sgRNA设计成靶向任何感兴趣的区域,只需鉴定符合式G[n20]GG的合适靶序列。与互补区一起,sgRNA可以包含额外的核苷酸以延伸到sgRNA的tracrRNA部分的尾部区域(参见Hsu等(2013)Nature Biotech doi:10.1038/nbt.2647)。尾部可以是+67至+85个核苷酸,或其间的任何数字,优选长度为+85个核苷酸。也可以使用截短的sgRNA,“tru-gRNA”(参见Fu等(2014)Nature Biotech 32(3):279)。在tru-gRNA中,互补区的长度减少至17或18个核苷酸。
此外,也可以采用替代的PAM序列,其中使用酿脓链球菌(S.pyogenes)Cas9,PAM序列可以是NAG来代替NGG(Hsu(2013)Nature Biotech31:827-832,doi:10.1038/nbt.2647)。其它PAM序列也可以包括那些缺少初始G的序列(Sander和Joung(2014)Nature Biotech 32(4):347)。除了酿脓链球菌(S.pyogenes)编码的Cas9 PAM序列之外,可以使用其它PAM序列,该序列对来自其它细菌来源的Cas9蛋白具有特异性。例如,如下所示的PAM序列(改编自Sander和Joung,同上,以及Esvelt等(2013)Nat Meth10(11):1116)对这些Cas9蛋白具有特异性:
Figure BDA0003164619740000341
因此,可以根据以下指南选择用于酿脓链球菌(S.pyogenes)CRISPR/Cas系统的合适靶序列:[n17、n18、n19或n20](G/A)G。或者,PAM序列可以遵循指南G[n17、n18、n19、n20](G/A)G。对于源自非酿脓链球菌(S.pyogenes)的细菌的Cas9,可以使用相同的指南,其中替代PAM被替换为酿脓链球菌(S.pyogenes)PAM序列。
最优选的是选择具有最高的特异性可能性的靶序列,以避免潜在的脱靶序列。这些不需要的脱靶序列可以通过考虑以下属性来鉴定:i)靶序列的相似性,该靶序列之后是已知与所采用的Cas9蛋白起作用的PAM序列;ii)与所需靶序列的错配少于三个的类似靶序列;iii)与ii)中类似的靶序列,其中错配均位于PAM远端区域而不是PAM近端区域(有证据表明,与PAM直接相邻或接近的1-5个核苷酸、有时称为“种子”区域(Wu等(2014)NatureBiotech 32:670-676,doi:10.1038/nbt2889)对识别最为关键,因此在种子区域具有错配的推定脱靶位点可能最不可能被sg RNA识别);以及iv)相似的靶序列,其中错配不连续间隔或间隔大于四个核苷酸(Hsu et al.(2014)Cell 157(6):1262-78)。因此,通过对使用任何CRIPSR/Cas系统的基因组中潜在脱靶位点的数量进行分析,使用上述这些标准,可以鉴定出sgRNA的合适靶序列。
在一些实施方式中,使用CRISPR-Cpf1系统。在弗朗西斯氏菌种(Francisellaspp)中鉴定的CRISPR-Cpf1系统是2型CRISPR-Cas系统,其在人细胞中介导稳健的DNA干扰。尽管功能性保守,Cpf1和Cas9在许多方面不同,包括在其向导RNA和底物特异性上(参见Fagerlund等,(2015)Genom Bio 16:251)。Cas9和Cpf1蛋白之间主要的区别在于Cpf1并不利用tracrRNA,并且因此仅需要crRNA。FnCpf1 crRNA长度为42–44个核苷酸(19个核苷酸的重复以及23–25个核苷酸的间隔子),并且包含单一的茎环,其耐受维持二级结构的序列变化。此外,Cpf1 crRNA明显短于Cas9所需的约100个核苷酸的工程改造sgRNA,并且FnCpfl的PAM要求是置换链上的5'-TTN-3'和5'-CTA-3'。尽管Cas9和Cpf1都在靶DNA中产生双链断裂,Cas9使用其RuvC-和HNH-样结构域以在向导RNA的种子序列内产生钝端切口,然而Cpf1使用RuvC-样结构域以产生种子外的错位切口。因为Cpf1产生的错位切口远离关键的种子区域,NHEJ将不会破坏靶位点,因此保证Cpf1可以继续切割相同位点直到所需的HDR重组事件发生。因此,在本文所述的方法和组合物中,应当理解的是,术语“Cas”包括Cas9和Cpf1蛋白。因此,本文所用“CRISPR/Cas系统”指CRISPR/Cas和/或CRISPR/Cpf1系统,同时包括核酸酶、切口酶和/或转录因子系统。
在一些实施方式中,可以使用其它Cas蛋白。一些示例性Cas蛋白包括Cas9、Cpf1(也称为Cas12a)、C2c1、C2c2(也称为also Cas13a)、C2c3、Cas1、Cas2、Cas4、CasX和CasY;并且包括其工程改造和天然变体(Burstein等(2017)Nature 542:237-241)例如HF1/spCas9(Kleinstiver等(2016)Nature 529:490-495;Cebrian-Serrano和Davies(2017)MammGenome28(7):247-261);分割型Cas9系统(Zetsche等(2015)Nat Biotechnol33(2):139-142)、基于内含蛋白-外显蛋白系统的反式剪接Cas9(Troung等(2015)Nucl Acid Res 43(13):6450-8);mini-SaCas9(Ma等(2018)ACS Synth Biol 7(4):978-985)。因此,在本文所述的方法和组合物中,应当理解的是,术语“Cas”包括所有Cas变体蛋白,无论是天然的还是工程改造的。
在某些实施方式中,Cas蛋白可为天然产生的Cas蛋白的“功能性衍生物”。天然序列多肽的“功能性衍生物”是与天然序列多肽具有共同定性生物性质的化合物。“功能性衍生物”包括但不限于天然序列的片段或天然序列多肽的衍生物及其片段,前提是它们与相应的天然序列多肽具有共同的生物活性。本文设想的生物活性是功能性衍生物将DNA底物水解成片段的能力。术语“衍生物”涵盖多肽的氨基酸序列变体,共价修饰形式,和其融合体。在一些方面,功能性衍生物可以包含天然存在的Cas蛋白的单一生物学特性。在另一些方面,功能性衍生物可以包含天然存在的Cas蛋白的生物学特性的一个子集。Cas多肽的合适衍生物或其片段包括但不限于Cas蛋白的突变体、融合体、共价修饰形式或其片段。包括Cas蛋白或其片段的Cas蛋白以及Cas蛋白或其片段的衍生物可获自细胞或通过化学合成或通过这两种方法的组合获得。所述细胞可以是天然产生Cas蛋白的细胞,或天然产生Cas蛋白并经遗传工程改造的细胞,所述遗传工程改造使所述细胞以较高表达水平产生内源性Cas蛋白或从外源引入的核酸产生Cas蛋白,其中所述核酸编码与内源性Cas相同或不同的Cas。在一些情况中,细胞天然不产生Cas蛋白,但是经遗传工程改造以产生Cas蛋白。
靶向特定基因的示例性CRISPR/Cas核酸酶系统公开于例如美国专利公开号2015/0056705中。
因此,核酸酶包含DNA结合结构域,该DNA结合结构域与切割DNA的核酸酶结构域联用,特异性地结合期望将供体(转基因)插入其中的任何基因中的靶位点。
融合分子
DNA结合结构域可以与任何其它分子(例如,多肽)融合以用于本文所述的方法中。在某些实施方式中,该方法采用包含至少一种DNA结合分子(例如ZFP、TALE或单向导RNA)和异源调控(功能)结构域(或其功能片段)的融合分子。
在某些实施方式中,功能结构域包含转录调控结构域。常见结构域包括,例如,转录因子结构域(活化剂,阻遏物,共活化剂,共阻遏物),沉默子,癌基因(例如myc,jun,fos,myb,max,mad,rel,ets,bcl,myb,mos家族成员等);DNA修复酶及其相关因子和修饰物;DNA重排酶及其相关因子和修饰物;染色质相关蛋白质及其修饰物(例如激酶,乙酰酶和脱乙酰酶);和DNA修饰酶(例如甲基转移酶,拓扑异构酶,解旋酶,连接酶,激酶,磷酸酶,聚合酶,核酸内切酶)及其相关因子和修饰物。参见例如,美国专利公开号2013/0253040,其通过引用其全文纳入本文。
用于实现活化的合适结构域包括HSV VP16活化结构域(参见例如,Hagmann等(1997)J.Virol.71:5952-5962),核激素受体(参见例如,Torchia等(1998)Curr.Opin.Cell.Biol.10:373-383);核因子κB的p65亚基(Bitko和Barik(1998)J.Virol.72:5610-5618和Doyle和Hunt(1997)Neuroreport8:2937-2942);Liu等(1998)Cancer Gene Ther.5:3-28),或人工嵌合功能结构域,如VP64(Beerli等(1998)Proc.Natl.Acad.Sci.USA95:14623-33),和降解决定子(degron)(Molinari等(1999)EMBOJ.18:6439-6447)。其它示例性活化结构域包括,Oct 1、Oct-2A、Sp1、AP-2和CTF1(Seipel等(1992)EMBO J.11:4961-4968)以及p300、CBP、PCAF、SRC1 PvALF、AtHD2A和ERF-2。参见例如Robyr等(2000)Mol.Endocrinol.14:329-347;Collingwood等(1999)J.Mol.Endocrinol.23:255-275;Leo等(2000)Gene 245:1-11;Manteuffel-Cymborowska(1999)Acta Biochim.Pol.46:77-89;McKenna等(1999)J.Steroid Biochem.Mol.Biol.69:3-12;Malik等(2000)Trends Biochem.Sci.25:277-283;和Lemon等(1999)Curr.Opin.Genet.Dev.9:499-504。其它示例性活化结构域包括但不限于,OsGAI,HALF-1,C1,AP1,ARF-5,-6,-7和-8,CPRF1,CPRF4,MYC-RP/GP,和TRAB1。参见例如,Ogawa等.(2000)Gene 245:21-29;Okanami等.(1996)Genes Cells 1:87-99;Goff等.(1991)Genes Dev.5:298-309;Cho等.(1999)Plant Mol.Biol.40:419-429;Ulmason等.(1999)Proc.Natl.Acad.Sci.USA96:5844-5849;Sprenger-Haussels等.(2000)Plant J.22:1-8;Gong等.(1999)Plant Mol.Biol.41:33-44;和Hobo等.(1999)Proc.Natl.Acad.Sci.USA96:15,348-15,353。
示例性的阻遏结构域包括但不限于,KRAB A/B,KOX,TGF-β-诱导型早期基因(TIEG),v-erbA,SID,MBD2,MBD3,DNMT家族成员(例如,DNMT1,DNMT3A,DNMT3B),Rb和MeCP2。参见例如,Bird等.(1999)Cell99:451-454;Tyler等.(1999)Cell 99:443-446;Knoepfler等.(1999)Cell99:447-450;和Robertson等.(2000)Nature Genet.25:338-342。其它示例性阻遏结构域包括但不限于ROM2和AtHD2A。参见例如,Chem等.(1996)Plant Cell 8:305-321;和Wu等.(2000)Plant J.22:19-27。
通过本领域技术人员熟知的克隆和生物化学偶联方法构建融合分子。融合分子包括DNA结合结构域和功能结构域(例如,转录激活或阻遏结构域)。融合分子还任选地包含核定位信号(例如,来自SV40介质T-抗原)和表位标签(例如,FLAG和血细胞凝集素)。设计融合蛋白(及其编码核酸),从而翻译阅读框保留于融合体的组分间。
一方面,功能结构域(或其功能性片段)多肽组分与另一方面非蛋白质DNA结合结构域(例如,抗生素、嵌入剂、小沟结合剂、核酸)之间的融合通过本领域技术人员已知的生物化学偶联法构建。参见例如,皮尔斯化学公司(Pierce Chemical Compan)(伊利诺伊州罗克福德)产品目录。已描述用于生成小沟结合剂与多肽之间的融合的方法和组合物。Mapp等.(2000)Proc.Natl.Acad.Sci.USA 97:3930-3935。
融合分子可用药学上可接受的运载体/载剂配制,如本领域技术人员已知。参见例如,《雷明顿药物科学》(Remington’s Pharmaceutical Sciences),第17版,1985;和共有的国际专利公开号WO 00/42219。
融合分子的功能性组分/结构域可选自任何多种不同的组分,一旦该融合分子通过其DNA结合结构域结合至靶序列,所述组分即能影响基因转录。因此,功能性组分可包括但不限于,各种转录因子结构域,例如活化物、阻遏物、共活化物、共阻遏物,和沉默子。
在某些实施方式中,融合分子包含一个或多个ZFP-TF(阻遏物),其中ZFP与转录阻遏结构域可操作地连接。阻遏结构域的非限制性示例包括KOX(KRAB)结构域等。还可以包括其它元件,例如NLS,并且可以在锌指结构域之间和/或ZFP和阻遏结构域(和/或任何其它元件)之间使用任何接头。编码这些ZFP-TF阻遏物的多核苷酸还可以进一步包括其它元件,例如驱动ZFP-TF表达的启动子、增强子、绝缘子等。
表3显示包含本文所述ZFP的示例性ZFP-TF的多核苷酸和氨基酸序列(在第一列中通过名称标识)。识别螺旋区域序列(表1)在表3中加下划线;NLS肽以粗体显示,阻遏结构域以斜体显示。
表3:ZFP-TF的核苷酸案氨基酸序列
Figure BDA0003164619740000391
Figure BDA0003164619740000401
Figure BDA0003164619740000411
Figure BDA0003164619740000421
Figure BDA0003164619740000431
Figure BDA0003164619740000441
编码本文所述阻遏物的多核苷酸可以使用任何合适的表达载体来递送,包括但不限于病毒(例如AAV、Ad等)和非病毒载体(例如mRNA、质粒、小环等)。表达载体可以包括其它元件,例如核定位信号(NLS)和/或驱动阻遏物表达的启动子(例如组成型启动子,如CMV启动子)。一种或多种相同或不同形式(例如,病毒和/或非病毒载体)的多核苷酸(例如,表达载体)可以递送给对象并且可以配制在一种或多种药物组合物中。本文所述的多核苷酸可以附加地(在染色体外)维持和/或可以在递送后稳定地整合到细胞中。
在某些实施方式中,融合蛋白包含一个DNA结合结构域和一个核酸酶结构域,以创建功能实体,其能够通过其工程改造的(ZFP或TALE)DNA结合结构域识别其预期的核酸靶标并创建核酸酶(例如锌指核酸酶或TALE核酸酶),通过核酸酶活性导致DNA在DNA结合位点附近被切割。
因此,本文所述的方法和组合物应用面广,并且可涉及任何感兴趣的核酸酶。核酸酶的非限制性示例包括兆核酸酶、TALEN和锌指核酸酶。核酸酶可包含异源性DNA结合结构域和切割结构域(例如,锌指核酸酶;TALEN;具有异源性切割结构域的兆核酸酶DNA结合结构域),或者替代地,天然产生的核酸酶的DNA结合结构域可被改变以结合至选择的靶位点(例如,以经工程改造以结合不同于关联结合位点的位点的兆核酸酶)。
核酸酶结构域可以源自任何核酸酶,例如任何核酸内切酶或核酸外切酶。可与本文所述的HTT DNA结合结构域融合的合适核酸酶(切割)结构域的非限制性示例包括来自任何限制酶的结构域,例如IIS型限制酶(例如,FokI)。在某些实施方式中,切割结构域是需要二聚化才能有切割活性的切割半结构域。参见例如,美国专利号8,586,526;8,409,861和7,888,121,通过引用其全文纳入本文。一般而言,若融合蛋白包含切割半结构域,则需要两种融合蛋白供于切割。或者,可使用包含两个切割半结构域的单个蛋白。这两个切割半结构域可衍生自同一核酸内切核酸酶(或其功能性片段),或各切割半结构域可衍生自不同的核酸内切核酸酶(或其功能性片段)。此外,优选两种融合蛋白的靶位点相对彼此布置,从而这两种融合蛋白与其各自靶位点的结合使切割半结构域彼此处于允许切割半结构域形成功能性切割结构域(例如,通过二聚化)的空间定位。
核酸酶结构域也可以源自具有切割活性的任何兆核酸酶(归巢核酸内切酶)结构域,也可以与本文所述的核酸酶一起使用,包括但不限于I-SceI、I-CeuI、PI-PspI、PI-Sce、I-SceIV、I-CsmI、I-PanI、I-SceII、I-PpoI、I-SceIII、I-CreI、I-TevI、I-TevII和I-TevIII。
在某些实施方式中,核酸酶包括紧凑型TALEN(cTALEN)。存在单链融合蛋白,其将TALE DNA结合结构域与TevI核酸酶结构域相连。该融合蛋白可以作为通过TALE区域定位的切口酶,或可以产生双链断裂,这取决于该TALE DNA结合结构域相对于兆核酸酶(例如TevI)核酸酶结构域所位于的位置(参见Beurdeley等(2013)Nat Comm:41762DOI:10.1038/ncomms2782)。在其它实施方式中,TALE-核酸酶是兆TAL。这些兆TAL核酸酶包含TALE DNA结合结构域和兆核酸酶切割结构域的融合蛋白。兆核酸酶切割结构域作为单体具有活性,且不需要二聚化获得活性。(参见Boissel等(2013)Nucl Acid Res 42(4):2591-601,doi:10.1093/nar/gkt1224)。
此外,兆核酸酶的核酸酶结构域还可具有DNA结合功能性。任何TALEN都可与其它TALEN(例如一种或多种TALEN(cTALEN或FokI-TALEN)与一种或多种兆TALE)和/或ZFN联用。
此外,切割结构域与野生型相比可包括一种或多种改变,例如形成减少或消除脱靶切割效应的专性异二聚体。参见例如,美国专利号7,914,796;8,034,598和8,623,618,通过引用其全文纳入本文。
本文所述的核酸酶可在双链靶标(例如,基因)中产生双链或单链断裂。单链断裂(“切口”)的产生描述于例如美国专利号8,703,489中,其通过引用纳入本文,其描述了核酸酶结构域之一的催化结构域的突变如何导致切口酶。
核酸酶(切割)结构域或切割半结构域可以是蛋白质的任何部分,其保留了切割活性,或保留了多聚化(例如,二聚化)以形成功能性切割结构域的能力。
或者,核酸酶可利用称为“分裂-酶(split-enzyme)”的技术(参见例如,美国专利公开号2009/0068164)在核酸靶位点处体内组装。这类分裂酶的组分可在另外的表达构建体上表达,或者可以连接于单独的组分相互分开的某一开放读框中,例如,组分由自切割2A肽或IRES序列分开。组分可以是单独的锌指结合结构域或兆核酸酶核酸结合结构域的结构域。
可在使用前筛选核酸酶的活性,例如,在如在美国专利公开号2009/0111119中所述的基于酵母的染色体系统中。使用本领域已知的方法可以容易地设计核酸酶表达构建体。
融合蛋白的表达可以在组成型启动子或诱导型启动子的控制下,例如半乳糖激酶启动子,其在棉子糖和/或半乳糖的存在下被激活(去阻遏)并在葡萄糖的存在下被阻遏。在某些实施方式中,启动子自我调控融合蛋白的表达,例如通过包含高亲和力结合位点。参见例如,美国专利号9,624,498。
递送
可以通过任何合适的方式将蛋白质和/或多核苷酸(例如HTT阻遏物)和包含本文所述的蛋白质和/或多核苷酸的组合物递送至靶细胞,包括例如通过注射蛋白质、经由mRNA和/或使用表达构建体(例如质粒、慢病毒载体、AAV体、Ad载体等)。在优选的实施方式中,阻遏物用AAV9或AAV6递送。
递送含本文所述的锌指蛋白的蛋白质的方法见述于,例如,美国专利号6,453,242;6,503,717;6,534,261;6,599,692;6,607,882;6,689,558;6,824,978;6,933,113;6,979,539;7,013,219和7,163,824,其全部公开内容通过引用其全文的方式纳入本文。
可采用任何载体系统,包括但不限于,质粒载体、逆转录病毒载体、慢病毒载体、腺病毒载体、痘病毒载体、疱疹病毒载体和腺相关病毒载体等。还参见例如,美国专利号8,586,526;6,534,261;6,607,882;6,824,978;6,933,113;6,979,539;7,013,219和7,163,824,其通过引用其全文的方式纳入本文。此外,显而易见的是,这些载体中的任一种可以包含一种或多种DNA结合蛋白编码序列。因此,当一种或多种HTT阻遏物被导入细胞中时,编码蛋白质组分的序列和/或多核苷酸组分可携带在相同载体或不同载体上。当使用多个载体时,每个载体可包含编码一个或多个HTT阻遏物或其组分的序列。
可采用常规的基于病毒和非病毒的转基因方法来将编码工程改造HTT阻遏物的核酸导入细胞(例如,哺乳动物细胞)和靶组织中。此类方法还可用于在体外给予细胞编码此类阻遏物(或其组分)的核酸。在某些实施方式中,给予的编码阻遏物的核酸用于体内或离体基因治疗应用。非病毒载体递送系统包括DNA质粒、裸核酸和与递送载剂(例如脂质体或泊洛沙姆(poloxamer))复合的核酸。病毒载体递送系统包括DNA和RNA病毒,其在递送至细胞后具有附加型或整合的基因组。基因治疗操作的综述见于Anderson(1992)Science 256:808-813;Nabel和Felgner(1993)TIBTECH11:211-217;Mitani和Caskey(1993)TIBTECH 11:162-166;Dillon(1993)TIBTECH 11:167-175;Miller(1992)Nature 357:455-460;VanBrunt(1988)Biotechnology 6(10):1149-1154;Vigne(1995)Restorative Neurology andNeuroscience 8:35-36;Kremer和Perricaudet(1995)British Medical Bulletin51(1):31-44;Haddada等(1995)Current Topics in Microbiology and Immunology Doerfler和
Figure BDA0003164619740000471
(编);和Yu等(1994)Gene Therapy 1:13-26。
核酸的非病毒递送方法包括电穿孔、脂质转染、显微注射、基因枪、病毒颗粒、脂质体、免疫脂质体、聚阳离子或脂质:核酸偶联物、裸DNA、裸RNA、人工病毒粒,和试剂增强的DNA摄取。利用例如Sonitron 2000系统(Rich-Mar)的声孔效应也可用于递送核酸。在一个优选实施方式中,一种或多种核酸以mRNA形式递送。还优选采用加帽的mRNA来增加翻译效率和/或mRNA稳定性。尤其优选ARCA(防倒转帽类似物)帽或其变化形式。参见美国专利号7,074,596和8,153,773,其通过引用纳入本文。
其它示例性的核酸递送系统包括Amaxa生物系统公司(德国科隆)、迈克赛特公司(Maxcyte,Inc.)(马里兰州罗克韦尔)、BTX分子递送系统公司(马萨诸塞州霍利斯顿)和哥白尼治疗公司(Copernicus Therapeutics Inc.)(参见例如美国专利号6,008,336)提供的那些。脂质转染描述于例如,美国专利号5,049,386、4,946,787和4,897,355,并且脂质转染试剂市售可得(例如,TransfectamTM、LipofectinTM和LipofectamineTMRNAiMAX)。适于多核苷酸的高效受体-识别脂质转染的阳离子和中性脂质包括Felgner、国际专利公开号WO 91/17424和WO 91/16024的那些。可以递送至细胞(离体给予)或靶组织(体内给予)。
脂质:核酸复合物(包括靶向的脂质体,例如免疫脂质复合物)的制备是本领域技术人员熟知的(参见例如,Crystal(1995)Science 270:404-410;Blaese等(1995)CancerGene Ther.2:291-297;Behr等(1994)Bioconjugate Chem.5:382-389;Remy等(1994)Bioconjugate Chem.5:647-654;Gao等(1995)Gene Therapy 2:710-722;Ahmad等(1992)Cancer Res.52:4817-4820;美国专利号4,186,183;4,217,344;4,235,871;4,261,975;4,485,054;4,501,728;4,774,085;4,837,028;和4,946,787)。
递送的其它方法包括将待被递送的核酸包装到EnGeneIC递送载体(EDV)中。采用双特异性抗体将这些EDV被特异性递送至靶组织,其中,所述抗体的一个臂对靶组织具有特异性,而另一个臂对EDV具有特异性。抗体将EDV带至靶细胞表面,然后EDV通过内吞作用进入细胞。一旦进入细胞,内容物即被释放(参见MacDiarmid等(2009)NatureBiotechnology27(7):643)。
使用基于RNA或DNA病毒的系统递送编码经工程改造的ZFP、TALE或CRISPR/Cas系统的核酸利用高度演化的过程来将病毒靶向身体中特定的细胞并且将该病毒负载物(payload)运输至核。病毒载体可直接给予患者(体内)或其可用于体外处理细胞,并将经修饰的细胞给予患者(离体)。用于递送ZFP、TALE或CRISPR/Cas系统的常规的基于病毒的系统包括但不限于,用于基因传递的逆转录病毒、慢病毒、腺病毒、腺相关、牛痘和单纯性疱疹病毒载体。宿主基因组中的整合可采用逆转录病毒、慢病毒和腺相关病毒基因传递方法进行,通常导致插入的转基因的长期表达。此外,已在许多不同的细胞类型和靶组织中观察到了高转导功效。
逆转录病毒的趋性可通过引入外来包膜蛋白、扩大靶细胞的潜在靶群体来改变。慢病毒载体是能够转导或感染非分裂细胞的逆转录病毒载体,并且通常产生高病毒效价。逆转录病毒转基因系统的选择取决于靶组织。逆转录病毒载体包含顺式作用的长末端重复,其具有包装长达6-10kb的外来序列的能力。最小的顺式作用LTR足以用于载体的复制和包装,其随后用于将治疗基因整合进入靶细胞,以提供永久的转基因表达。广泛应用的逆转录病毒载体包括基于鼠白血病病毒(MuLV)、长臂猿白血病病毒(GaLV)、类人猿免疫缺陷型病毒(SIV)、人类免疫缺陷型病毒(HIV),及其组合的那些(参见例如,Buchscher等.(1992)J.Virol.66:2731-2739;Johann等.(1992)J.Virol.66:1635-1640;Sommerfelt等.(1990)Virol.176:58-59;Wilson等.(1989)J.Virol.63:2374-2378;Miller等.(1991)J.Virol.65:2220-2224;国际专利公开号WO 94/026877)。
在其中优选瞬时表达的应用中,可采用基于腺病毒的系统。基于腺病毒的载体能够在许多细胞类型中获得极高的转导效率,并且不需要细胞分裂。采用这种载体,已获得了高效价和高水平的表达。该载体可在相对简单的系统中大量产生。腺相关病毒(“AAV”)载体也用于用靶核酸转导细胞,例如,用于核酸和肽的体外生成,以及用于体内和离体基因治疗法(参见例如,West等,Virology 160:38-47;美国专利号4,797,368;国际专利公开号WO93/24641;Kotin(1994)Human Gene Therapy 5:793-801;Muzyczka(1994)J.Clin.Invest.94:1351。重组AAV载体的构建描述于多个公开文本中,包括美国专利号5,173,414;Tratschin等(1985)Mol.Cell.Biol.5:3251-3260;Tratschin等(1984)Mol.Cell.Biol.4:2072-2081;Hermonat和Muzyczka(1984)PNAS 81:6466-6470;和Samulski等(1989)J.Virol.63:03822-3828。
目前有至少六种病毒载体法可用于临床试验中的基因传递,其采用通过将基因插入辅助细胞系来产生转导剂进行涉及缺陷型载体的互补的方法。
pLASN和MFG-S是已用于临床试验的逆转录病毒载体的示例(Dunbar等(1995)Blood 85:3048-305;Kohn等(1995)Nat.Med.1:1017-102;Malech等(1997)PNAS 94(22):12133-12138)。PA317/pLASN是用于基因治疗试验的第一治疗载体。(Blaese等(1995)Science 270:475-480)。已在MFG-S包装的载体中观察到50%或更高的转导效率。(Ellem等(1997)Immunol Immunother.44(1):10-20;Dranoff等(1997)Hum.Gene Ther.1:111-2。
重组腺相关病毒载体(rAAV)是一种具有前景的替代性基因递送系统,其基于缺陷型和非病原性细小病毒腺相关2型病毒。全部载体源自仅保留侧接转基因表达盒的AAV145bp反向末端重复序列的质粒。高效的基因转移和稳定的转基因递送是该载体系统的关键特征,这归因于向转导的细胞的基因组的整合。(Wagner等(1998)Lancet 351(9117):1702-3;Kearns等(1996)Gene Ther.9:748-55)。根据本发明也可使用其它AAV血清型,包括AAV1、AAV3、AAV4、AAV5、AAV6、AAV8、AAV 8.2、AAV9和AAV rh10和假型AAV,如AAV2/8、AAV2/5和AAV2/6。在优选的实施方式中,使用AAV9或AAV6衣壳。
复制缺陷型重组腺病毒载体(Ad)可以高效价生成,并且容易地感染多种不同的细胞类型。大多数腺病毒载体是经工程改造的,从而转基因替代了Ad E1a、E1b和/或E3基因;随后该复制缺陷型载体在提供缺失反式基因功能的人293细胞中传播。Ad载体可体内转导多种类型的组织,包括不分裂的、分化的细胞,例如发现于肝、肾和肌肉中的那些。传统的Ad载体具有较大携载能力。临床试验中Ad载体应用的一个示例涉及用于采用肌内注射进行抗肿瘤免疫的多核苷酸治疗(Sterman等.(1998)Hum.Gene Ther.7:1083-9)。临床试验中用于转基因的腺病毒载体的应用的其它示例包括Rosenecker等.(1996)Infection 24(1):5-10;Sterman等.(1998)Hum.Gene Ther.9(7):1083-1089;Welsh等.(1995)Hum.GeneTher.2:205-18;Alvarez等.(1997)Hum.Gene Ther.5:597-613;Topf等.(1998)GeneTher.5:507-513;Sterman等.(1998)Hum.Gene Ther.7:1083-1089。
采用包装细胞来形成能够感染宿主细胞的病毒颗粒。所述细胞包括293细胞,其包装腺病毒,和ψ2细胞或PA317细胞,其包装逆病毒。用于基因治疗的病毒载体通常由将核酸载体包装成病毒颗粒的生产细胞系产生。所述载体通常包含包装和后续整合进入宿主(若可行)所需的最小病毒序列,其它病毒序列被编码待表达的蛋白质的表达盒所替代。失去的病毒功能通过包装细胞系以反式提供。例如,如果存在AAV复制蛋白,则用于基因治疗的AAV载体通常仅加工来自AAV基因组的反向末端重复(ITR)序列,其为包装和整合进入宿主基因组所需。病毒基因组被反式补充至细胞系中,其包含编码其它AAV基因(即rep和cap)但缺乏ITR序列的辅助质粒。所述细胞系也用腺病毒(作为辅助物)感染。辅助病毒促进AAV基因组的复制和从辅助质粒表达AAV基因。因为缺乏ITR序列,辅助质粒不以显著的量包装。腺病毒的污染可通过,例如,热处理(相比AAV,腺病毒对热处理更为敏感)来减少。
在许多基因治疗应用中,希望将基因治疗载体以高趋性递送至特定组织类型。因此,病毒载体可经修饰以通过将配体表达成与病毒包衣蛋白融合的位于病毒外表面上的蛋白来具有针对给定细胞类型的趋性。选择对于已知存在于感兴趣的细胞类型上的受体具有亲和性的配体。例如,Han等(1995),Proc.Natl.Acad.Sci.USA 92:9747-9751(1995),报道了莫洛尼鼠白血病病毒可经修饰以表达融合至gp70的人调蛋白,并且该重组病毒感染表达人表皮生长因子受体的某些人乳腺癌细胞。该原理可延伸至其它病毒-靶细胞对,其中靶细胞表达受体,并且病毒表达包含针对该细胞表面受体的配体的融合蛋白。例如,丝状噬菌体可经工程改造以显示对于几乎任何所选细胞受体具有特异性结合亲和力的抗体片段(例如,FAB或Fv)。尽管上文描述主要应用至病毒载体,相同的原理可应用至非病毒载体。所述载体可经工程改造以包含特定的摄取序列,其有利于被特定靶细胞摄取。
基因治疗载体可通过给予个体患者来体内递送,通常通过全身性给予(例如,静脉内、腹膜内、肌内、皮下,或颅内输注,包括直接注射至大脑内)或局部施用,如下所述。或者,载体可离体递送至细胞,例如来自个体患者的外植的细胞(例如,淋巴细胞、骨髓抽出物、组织活检物)或通用供体造血干细胞,然后将所述细胞再植入患者,通常在选择已引入载体的细胞之后进行。
在某些实施方式中,本文所述的组合物(例如多核苷酸和/或蛋白质)直接体内递送。组合物(细胞、多核苷酸和/或蛋白质)可以直接给药至中枢神经系统(CNS),包括但不限于直接注射到大脑或脊髓中。可以靶向大脑的一个或多个区域,包括但不限于海马体、黑质、梅纳特基底核(NBM)、纹状体和/或皮质。代替CNS递送或者除CNS递送之外,组合物可以全身给药(例如静脉内、腹膜内、心内、肌肉内、鞘内、皮下和/或颅内输注)。用于将本文所述的组合物直接递送至对象(包括直接递送至CNS中)的方法和组合物包括但不限于经由针组件的直接注射(例如,立体定向注射)。此类方法描述于例如美国专利号7,837,668;8,092,429,涉及向大脑递送组合物(包括表达载体),也描述于美国专利公开号2006/0239966,通过引用其全文纳入本文。
给予的有效量可因患者而异并根据给药方式和给药部位而变化。因此,有效量可由本领域普通技术人员确定。在给予足够时间来表达阻遏物后(例如通常为4-15天),分析治疗性多肽的血清或其它组织水平并与给药前的初始水平进行比较,这将确定给药量是太低、在正确的范围内、还是过高。在某些实施方式中,当使用病毒载体如AAV时,给药剂量为1×107至5×1015vg/ml(或其间的任何数值),更优选1×1011至1×1014vg/ml(或其间的任何数值),更优选1×1012至1×1013vg/ml(或其间的任何数值)。AAV剂量也可以按对象的每公斤或每个纹状体来给药,包括1×107至5×1015vg/kg或vg/纹状体(或其间的任何数值),更优选1×107至1×1013vg/kg或vg/纹状体(或其间的任何数值),更优选1×108至1×1012vg/kg或vg/纹状体(或其间的任何数值)的任何剂量。
为了使用重组腺相关病毒(rAAV)载体将ZFP直接递送至人脑,可采用每个纹状体为1×107-5×1015vg/mL(或其间的任何数值,包括例如1×1011至1×1014vg/ml之间的任何数值或1×1012至1×1013vg/mL之间的任何数值)载体基因组的剂量范围。剂量范围为1×107至5×1015vg/kg或vg/纹状体(或其间的任何数值),更优选1×107至1×1013vg/kg或vg/纹状体(或其间的任何数值),更优选1×108至1×1012vg/kg或vg/纹状体(或其间的任何数值)。如所述,其它大脑结构和不同递送方案的剂量可能会有所不同。将rAAV载体直接递送至大脑的方法是本领域已知的。例如,参见美国专利号9,089,667;9,050,299;8,337,458;8,309,355;7,182,944;6,953,575;和6,309,634。
用于诊断、研究或用于基因治疗(例如,通过重新输注转染的细胞进入宿主生物体)的离体细胞转染是本领域技术人员熟知的。在一个优选实施方式中,细胞从对象机体分离,用至少一种HTT阻遏物或其组分转染,并重新输注回对象机体(例如,患者)。在一个优选实施方式中,使用AAV9来递送一种或多种HTT阻遏物的核酸。在另一些实施方式中,以mRNA的形式来递送一种或多种HTT阻遏物的核酸。还优选采用加帽的mRNA来增加翻译效率和/或mRNA稳定性。尤其优选ARCA(防倒转帽类似物)帽或其变化形式。参见美国专利号7,074,596和8,153,773,通过引用其全文的方式纳入本文。合适于离体转染的多种细胞类型是本领域技术人员熟知的(参见例如,Freshney等.,《动物细胞培养,基础技术手册》(Culture ofAnimal Cells,AManual of Basic Technique)(第三版.1994))本文所引的参考内容是关于讨论如何分离和培养来自患者的细胞)。
在一个实施方式中,细胞转染和基因治疗的离体方案中采用干细胞。采用干细胞的好处是,它们可以体外分化成其它细胞类型,或可被导入哺乳动物(例如细胞的供体),在此其将接植入骨髓。使用细胞因子如GM-CSF、IFN-γ和TNF-α在体外将CD34+细胞分化为临床上重要的免疫细胞类型的方法是已知的(参见Inaba等(1992)J.Exp.Med.176:1693-1702)。
采用已知方法分离干细胞用于转导和分化。例如,干细胞也可通过骨髓细胞用结合不需要细胞的抗体筛选而从骨髓细胞中分离,所述细胞例如CD4+和CD8+(T细胞)、CD45+(panB细胞)、GR-1(粒细胞)和Iad(分化抗原呈递细胞)(参见Inaba等.(1992)J.Exp.Med.176:1693-1702)。
在一些实施方式中,可采用已经修饰的干细胞。例如,可将被制成抗凋亡的神经元干细胞用作治疗性组合物,其中所述干细胞还包含本发明的ZFP TF。对于凋亡的抗性可来自于,例如,通过采用BAX-或BAK特异性TALEN或ZFN敲除干细胞中的BAX和/或BAK(参见,美国专利申请号8,597,912),或干扰胱冬酶的那些,同样采用例如胱冬酶6特异性ZFN。这些细胞可以用已知调控突变型或野生型HTT的ZFP TF或TALE TF转染。
也可将包含治疗性ZFP核酸的载体(例如,逆转录病毒、腺病毒、脂质体等)直接给予生物体用于体内细胞转导。或者,可给予裸DNA。给予通过常用于引入分子并最终与血液或组织细胞接触的任何常规途径进行,包括但不限于,注射、输注、局部施用和电穿孔。合适的给予所述核酸的方法可得且为本领域技术人员熟知,并且,尽管可利用超过一种途径给予特定组合物,某特定途径通常能提供比另一途径更直接和更有效的反应。
用于将DNA导入造血干细胞的方法公开于,例如,美国专利号5,928,638。可用于将转基因引入造血干细胞(例如,CD34+细胞)的载体包括腺病毒35型。
合适于将转基因引入免疫细胞(例如,T细胞)的载体包括非整合型慢病毒载体。参见例如Naldini等.(1996)Proc.Natl.Acad.Sci.USA93:11382-11388;Dull等.(1998)J.Virol.72:8463-8471;Zuffery等.(1998)J.Virol.72:9873-9880;Follenzi等.(2000)Nature Genetics 25:217-222。
药学上可接受的运载体部分地由所给予的特定组合物以及用于给予组合物的特定方法确定。因此,有多种合适的药物组合物制剂可用,如下所述(参见例如,《雷明顿药物科学》(Remington’s Pharmaceutical Sciences);第17版,1989)。
如上所述,公开的方法和组合物可用于任何类型的细胞,包括但不限于,原核细胞、真菌细胞、古细菌细胞、植物细胞、昆虫细胞、动物细胞、脊椎动物细胞、哺乳动物细胞和人细胞。用于蛋白质表达的合适的细胞系是本领域技术人员已知的,并且可包括但不限于COS、CHO(例如,CHO-S、CHO-K1、CHO-DG44、CHO-DUXB11)、VERO、MDCK、WI38、V79、B14AF28-G3、BHK、HaK、NS0、SP2/0-Ag14、HeLa、HEK293(例如,HEK293-F、HEK293-H、HEK293-T)、perC6、昆虫细胞例如草地贪夜蛾(Spodoptera fugiperda)(Sf),和真菌细胞例如酵母(Saccharomyces)、毕赤酵母(Pichia)和裂殖酵母(Schizosaccharomyces)。也可采用这些细胞系的子代、变体和衍生物。在一个优选实施方式中,所述方法和组合物直接递送至大脑细胞,例如纹状体中。
应用
本文所述的HTT结合分子(例如ZFP、TALE、CRISPR/Cas系统、Ttago等)和编码它们的核酸可用于多种应用。这些应用包括治疗方法,其中将HTT结合分子(包括编码DNA结合蛋白的核酸)给予对象(例如AAV,如AAV9)并用于在对象内调节靶基因(进而是蛋白质)的表达。调节可以是阻遏的形式,例如阻遏导致HD疾病状态的mHTT。或者,当内源性细胞基因的表达激活或表达增加可以改善疾病状态时,调节可以是激活的形式。在又一些实施方式中,调节可以是切割(例如通过一种或多种核酸酶),例如用于使突变HTT基因失活。如上所述,对于此类应用,将HTT结合分子或更典型地编码它们的核酸与药学上可接受的载体一起配制成药物组合物。
HTT结合分子或编码它们的载体,单独或与其它合适的成分(例如脂质体、纳米颗粒或本领域已知的其它成分)组合,可制成气雾剂制剂(即,它们可被“雾化”)以便通过吸入给药。气雾剂制剂可以放入加压的可接受的推进剂中,例如二氯二氟甲烷、丙烷、氮气等。适用于例如通过静脉内、肌肉内、皮内和皮下途径胃肠外给药的制剂包括:水性和非水性等渗无菌注射溶液,其可包含抗氧化剂、缓冲剂、抑菌剂以及使得制剂与预期接受者的血液等渗的溶质;水性和非水性无菌悬浮液,其可包含助悬剂、增溶剂、增稠剂、稳定剂和防腐剂。组合物可以例如通过静脉输注、口服、局部、腹膜内、膀胱内、颅内或鞘内给药。化合物的制剂可以存在于单位剂量或多剂量密封容器中,例如安瓿和小瓶。注射液和悬浮液可以由前述种类的无菌粉剂、颗粒剂和片剂制备。
给予患者的剂量应足以长时间在患者中产生有益治疗反应。剂量取决于所采用的特定HTT结合分子的功效和Kd、靶细胞、患者的状况,以及待治疗患者的体重或表面积。剂量大小也可由伴随具体患者的特定化合物或载体给药的任何不良副作用的存在、性质、和程度来决定。
可以通过多种方式测量有益的治疗反应。例如,可以测量亨廷顿相关的运动障碍的改善,如不自主的抽搐或扭动,肌肉问题,如僵硬或肌肉挛缩(肌张力障碍),眼球运动缓慢或异常,步态、姿势和平衡受损,言语表达困难或吞咽和随意运动的损害。也可以监测其它损伤,例如认知和精神障碍,以寻找与治疗相关的改善迹象。UHDRS量表可用于量化疾病的临床特征。其它生物标志物测量也可用于确定结果,包括测量CSF中的mHTT。
对于出现症状前的患者,治疗尤其重要,因为它提供了在HD中发生广泛神经变性之前治疗疾病的机会。这种损害在上述明显症状出现之前就开始了。HD病理主要涉及突变HTT在纹状体中棘神经元中的毒性作用。这些中棘神经元表达高水平的磷酸二酯酶10A(PDE10A),其调控涉及基因转录因子、神经递质受体和电压门控通道的cAMP和cGMP信号级联反应(Niccolini等(2015)Brain 138:3016-3029),并且已知PDE10A在HD小鼠中的表达降低,对人类的验尸研究也有相同发现。最近,已经开发了作为PDE10A酶的配体的正电子发射断层扫描(PET)配体(例如11C-IMA107,参见例如Niccolini等,同上;18FMNI-659,参见例如Russell等(2014)JAMA Neurol 71(12):1520-1528),并且这些分子已被用于评估出现症状前的HD患者。研究表明,HD患者中的PDE10A水平甚至在症状出现之前就已经改变。因此,可以在治疗之前、期间和之后通过PET评估PDE10A水平,以测量本发明组合物的治疗功效。“治疗功效”可以指临床和分子测量的改善,也可以指保护患者免受中棘神经元功能的任何进一步下降或棘神经元丢失的增加,或与HD相关的明显临床表现的进一步发展。
下述实施例涉及本公开的示例性实施方式,其中HTT调节物包括锌指蛋白。显而易见的是,这仅用于示例目的,可以使用其它HTT调节物(例如阻遏物),包括但不限于TALE-TF、CRISPR/Cas系统、其它的ZFP、ZFN、TALEN、其它的CRISPR/Cas系统(例如Cfp系统)、归巢核酸内切酶(兆核酸酶)与工程改造的DNA结合结构域。
实施例
实施例1:mHTT阻遏物
基本上如美国专利号9,234,016;8,841,260;6,534,261;美国专利公开号2019/0322711;2017/0096460;2015/0056705;2015/0335708和2019/0322711中所述将锌指蛋白工程改造成靶向mHTT。表1显示这些ZFP的DNA结合结构域的识别螺旋,而表2显示这些ZFP的靶序列。评估ZFP并显示与其靶位点结合。
将ZFP与KOX阻遏结构域可操作地连接以形成阻遏HTT的ZFP-TF。表3显示指定的ZFP-TF阻遏物的氨基酸和核苷酸序列。
将ZFP TF转录物转染至人类细胞(例如来自HD患者的细胞)中,并使用实时qRT-PCR监测HTT和mHTT转录物的表达。发现所有ZFP-TF在选择性阻遏突变HTT表达方面都是有效的。ZFP-TF在以mRNA形式在重组病毒载体(包括Ad载体、慢病毒载体和/或AAV载体(例如AAV9或AAV6))中配制为质粒时,是功能性阻遏物。
实施例2:体外研究
在HD患者成纤维细胞和干细胞衍生神经元中评估了表1和3中所示的ZFP-TF相对于wtHTT等位基因选择性阻遏mHTT转录的能力。
简而言之,用编码表3的ZFP-TF或GFP的mRNA以0-1500ng(1500、300、150或15ng)转染人神经元干细胞(CAG17或CAG48(17和48个SEQ ID NO:23中所公开的”CAG”重复序列)),并在24小时后通过qPCR测量wtHTT和mHTT水平。此外,用携带表3的ZFP-TF编码序列或GFP的AAV6转导HD神经元,MOI为10K至500K(500K、300K、100K或10K)。
如图2所示,ZFP-TF显著阻遏了mHTT表达,同时对野生型HTT的阻遏最小。
选择ZFP-TF 45643进行进一步研究,并将转基因mRNA瞬时转染到HD患者成纤维细胞中,以评估转基因蛋白阻遏mHTT和wtHTT基因转录的能力。用编码rAAV9-ZFP-TF 45643转基因或GFP的0-1000ng mRNA以及该水平的wtHTT和mHTT mRNA转染GM02151成纤维细胞(CAG18或CAG 45(18或45个SEQ ID NO:23中所公开的“CAG”重复序列)),并在24小时后通过qPCR测量wtHTT和mHTT mRNA的水平。
来自6个独立实验(单向ANOVA和Dunnett多重比较检验)的数据的荟萃分析表明,在转染≥0.3ng的转基因mRNA的细胞中mHTT mRNA显著减少(与GFP转染细胞相比,p<0.001)且wtHTT mRNA没有显著减少。参见图5。这些结果在两个其它HD成纤维细胞系GM04723(CAG15或CAG 67(15或67个SEQ ID NO:23中所公开的“CAG”重复序列))和ND30259(CAG21或CAG38(21或38个SEQ ID NO:23中所公开的“CAG”重复序列)中得到证实。
为了评估神经元中mHTT的阻遏,将HD患者ES细胞(GENEA020;CAG17或CAG 48(17或48个SEQ ID NO:23中所公开的“CAG”重复序列))分化为神经元,用0、15、150或300ng编码ZFP-TF 45643转基因或GFP的mRNA瞬时转染,并在48小时后通过qPCR测量wtHTT和mHTTmRNA的水平。用编码ZFP-TF 45643转基因的mRNA转染的神经元的mHTT mRNA比用等量的表达GFP的mRNA转染的细胞少约90%。wtHTT mRNA的水平在所有治疗组中都没有变化。参见图5。
此外,在将rAAV9-ZFP-TF 45643转导至源自HD患者ES细胞的神经元(GENEA020;CAG 17/48(SEQ ID NO:23中所公开的“CAG”重复序列))17天后,检查了对mHTT和wtHTT转录的阻遏。用rAAV9-ZFP-TF 45643以5e4、1e5、5e5、5e6或1e7 vg/细胞转导细胞,17天后通过qPCR测量转基因mRNA、wtHTT和mHTT mRNA的水平。转基因mRNA/细胞的水平基于转导的细胞数量进行估算,并以剂量依赖性方式从2增加至123个拷贝/细胞。尽管转基因mRNA呈剂量依赖性增加,但mHTT和wtHTT mRNA的水平在所有剂量下都相等。mHTT的水平比模拟或AAV9-GFP转导的细胞低约75%,而wtHTT mRNA的水平不受影响。
综上所述,这些结果表明,本文所述的ZFP-TF蛋白质选择性地靶向mHTT等位基因中扩增的CAG重复序列。此外,结果表明低水平的转基因表达足以实现对mHTT的最大阻遏。
实施例3:特异性
对于靶向和脱靶位点,使用微阵列分析在体外在HD患者细胞中评估全基因组选择性。还通过qPCR分析分析了脱靶基因的一个子集。
如图4和6所示,对于列出的脱靶位点,通过qPCR分析确定,ZF-TF对其靶位点表现出高度的特异性。
实施例4:体内研究
在两种HD小鼠模型、即重症R6/2模型和更具进行性的Q175模型中评估了rAAV9-ZFP-TF 45643的体内药理学。参见例如Crook&Housman(2011)Neuron 69:423-435。在一些研究中,rAAV9-ZFP-TF 45643在疾病症状发作前给药,而在其他研究中,在疾病发作后给药。在所有这些研究中,主要终点是mHTT表达的阻遏。此外,在一些研究中还评估了rAAV9-ZFP-TF45643对运动和认知功能的影响。
在老年Q175小鼠模型中评估了rAAV9-ZFP-TF 45643对mHTT mRNA和蛋白质聚集物的影响。52/53周龄的Q175小鼠通过立体定向纹状体内注射给予载剂、rAAV9-ZFP-TF 45643(3e8、3e9或3e10 VG/纹状体)或rAAV9-GFP(3e8、3e9或3e10 VG/纹状体)。参见图13。术后8周收集组织用于qPCR分析,术后8或16周收集组织用于IHC分析。
此外,用rAAV9-ZFP-TF 45643处理导致转基因mRNA的剂量依赖性增加和mHTTmRNA的剂量依赖性减少。参见图7和8。对野生型小鼠HTT的影响与在rAAV9-GFP治疗组中观察到的相似。与载剂或rAAV9-GFP处理的纹状体相比,rAAV9-ZFP-TF 45643处理的纹状体中的细胞质mHTT蛋白聚集物减少。在任何治疗组中均未观察到对核聚集物的影响。因此,在Q175小鼠模型中疾病发作后给药时,rAAV9-ZFP-TF 45643可以阻遏mHTT转录并降低细胞质mHTT聚集物的水平。
在年轻Q175小鼠中评估了rAAV9-ZFP-TF 45643对mHTT mRNA、可溶性mHTT蛋白和mHTT聚集物的影响。5周龄的Q175小鼠通过立体定向双侧纹状体内注射给予rAAV9-ZFP-TF45643(9.2e9、3.1e10、9.2e10 VG/小鼠)或rAAV9-GFP(5.5e10 VG/小鼠)。术后11周收集组织用于qPCR、ELISA和IHC分析。
治疗后33周,在Q175小鼠中评估了rAAV9-ZFP-TF 45643对mHTT mRNA、可溶性mHTT蛋白和mHTT聚集物的影响。5周龄的Q175小鼠通过立体定向双侧纹状体内注射给予rAAV9-ZFP-TF 45643(9.2e9、3.1e10、9.2e10 VG/小鼠)或rAAV9-GFP(5.5e10 VG/小鼠)。在16/17、26/27和36/37周龄时评估运动功能(如Carter(1999)J Neurosci.19(8):3248-3257中所述的开放场地、rotamex、锥形平衡木),并在28-35周龄时评估认知功能(FR5/PR)。术后33周(38周龄)收集组织用于qPCR、ELISA和IHC分析。在研究结束时,对备用小鼠(每组4-6只)的大脑进行组织病理学处理。
在R6/2小鼠中评估了rAAV9-ZFP-TF 45643对mHTT mRNA、可溶性mHTT蛋白和mHTT聚集物的影响。4周龄的R6/2小鼠通过立体定向双侧纹状体内注射给予rAAV9-ZFP-TF45643(9.2e9、3.1e10、9.2e10 VG/小鼠)或rAAV9-GFP(5.5e10 VG/小鼠)。在5、7、9和11周龄时评估运动功能。术后7周(11周龄)收集组织用于qPCR、ELISA和IHC分析。
如图7-13所示,结果表明纹状体内注射rAAV9-ZFP-TF 45643阻遏了表达转基因蛋白的细胞中mHTT的合成。特别是图7和图8显示,在所有ZFP-TF剂量下对mHTT的统计学显著的选择性阻遏(野生型HTT表达水平没有降低)。图9显示在治疗后11周的纹状体和皮质前脑中、以及治疗后33周的纹状体、皮质前脑和皮质后脑中,用ZFP-TF(所有剂量)治疗的对象中可溶性mHTT蛋白显著减少。图10显示在以高剂量(9.2×1012vg)治疗8周后,在纹状体中可溶性mHTT显著减少。图11显示在表达GFP对照或ZFP-TF(所有剂量)的神经元中mHTT蛋白聚集物(与GFP对照相比)显著减少。图12和13显示用本文所述的AAV ZFP-TF治疗的对象中mHTT表达的显著阻遏。
此外,图14显示与对照相比,治疗对象的运动功能有明显改善。
使用本文所述的任何ZFP-TF(包含记作46025、45294、45723或33074的ZFP的ZFP-TF)均获得了类似的体内结果。
在体外,在HD患者细胞中,本文所述的ZFP-TF阻遏mHTT等位基因的转录,而对wtHTT等位基因或其它含CAG重复序列的基因没有显著影响。在2种不同的HD小鼠模型中的体内研究表明,在疾病症状发作之前或之后给予的rAAV9-ZFP-TF 45643的单次纹状体中(纹状体内)给药可有效阻遏mHTT mRNA和蛋白质的合成长达33周。
本文中提及的所有专利、专利申请和出版物均通过引用其全文纳入本文用于所有目的。
尽管出于理解清楚的目的,本发明通过说明和示例的方式提供了一些细节,但本领域技术人员可理解在不偏离本发明的精神或范围的情况下可实施各种改变和改进。因此,上述说明和实施例不应理解为是限制性的。
序列表
<110> 桑格摩生物治疗股份有限公司(SANGAMO THERAPEUTICS, INC.)
夏尔人类遗传治疗公司(SHIRE HUMAN GENETIC THERAPIES, INC.)
<120> HTT阻遏物及其应用
<130> 8327-018740
<140>
<141>
<150> 62/792,701
<151> 2019-01-15
<160> 23
<170> PatentIn version 3.5
<210> 1
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成肽
<400> 1
Gln Ser Gly Asp Leu Thr Arg
1 5
<210> 2
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成肽
<400> 2
Lys His Gly Asn Leu Ser Glu
1 5
<210> 3
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成肽
<400> 3
Lys Arg Cys Asn Leu Arg Cys
1 5
<210> 4
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成肽
<400> 4
Cys Pro Ser His Leu Thr Arg
1 5
<210> 5
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成肽
<400> 5
Arg Gln Phe Asn Arg His Gln
1 5
<210> 6
<211> 28
<212> DNA
<213> 未知
<220>
<223> 未知的描述: 人或小鼠HTT序列
<400> 6
agcagcagca gcagcagcag cagcagca 28
<210> 7
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成肽
<400> 7
Ser Pro Glu Gln Leu Ser Arg
1 5
<210> 8
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成肽
<400> 8
Gln Trp Ser Thr Arg Lys Arg
1 5
<210> 9
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成肽
<400> 9
Lys Gln Gly Asn Leu Val Glu
1 5
<210> 10
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成肽
<400> 10
Arg Ser Asp Asn Leu Ser Glu
1 5
<210> 11
<211> 28
<212> DNA
<213> 未知
<220>
<223> 未知的描述: 人或小鼠HTT序列
<400> 11
cagcagcagc agcagcagca gcagcagc 28
<210> 12
<211> 21
<212> DNA
<213> 未知
<220>
<223> 未知的描述: 人或小鼠HTT序列
<400> 12
cagcagcagc agcagcagca g 21
<210> 13
<211> 825
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成多核苷酸
<400> 13
atggccccca agaaaaagcg gaaagtgggc atccacgggg tacccgccgc tatggctgag 60
aggcccttcc agtgtcgaat ctgcatgcgt aagtttgccc agtccggcga cctgacccgc 120
cataccaaga tacacacggg cgagaagccc ttccagtgtc gaatctgcat gcgtaacttc 180
agtcagtccg gcgacctgac ccgccacatc cgcacccaca ccggcgagaa gccttttgcc 240
tgtgacattt gtgggaggaa atttgcccag tccggcgacc tgacccgcca taccaagata 300
cacacgccga acccgcaccg ccgcaccgac ccgtcccaca agcccttcca gtgtcgaatc 360
tgcatgcgta acttcagtaa gcacggcaac ctgtccgagc acatccgcac ccacaccggc 420
gagaagcctt ttgcctgtga catttgtggg aggaaatttg ccaagcgctg taacctgcgc 480
tgtcatacca agatacacct gcgccaaaaa gatgcggccc ggggatccgg catggatgct 540
aagtcactaa ctgcctggtc ccggacactg gtgaccttca aggatgtatt tgtggacttc 600
accagggagg agtggaagct gctggacact gctcagcaga tcgtgtacag aaatgtgatg 660
ctggagaact ataagaacct ggtttccttg ggttatcagc ttactaagcc agatgtgatc 720
ctccggttgg agaagggaga agagccctgg ctggtggaga gagaaattca ccaagagacc 780
catcctgatt cagagactgc atttgaaatc aaatcatcag tttaa 825
<210> 14
<211> 827
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成多核苷酸
<400> 14
atggccccca agaaaaagcg gaaagtgggc atccacgggg tacccgccgc tatggctgag 60
aggcccttcc agtgtcgaat ctgcatgcgt aacttcagtt gtccgtccca cctgacccgc 120
cacatccgca cccacaccgg cgagaagcct tttgcctgtg acatttgtgg gaggaaattt 180
gcccagtccg gcgacctgac ccgccatacc aagatacaca cgcctaatcc tcatcgccgc 240
actgatccca gccataagcc cttccagtgt cgaatctgca tgcgtaactt cagtaagcac 300
ggcaacctgt ccgagcacat ccgcacccac accggcgaga agccttttgc ctgtgacatt 360
tgtgggagga aatttgccaa gcgctgtaac ctgcgctgtc ataccaagat acacacgggc 420
tcccaatccc ccttccagtg tcgaatctgc atgcgtaagt ttgcccgcca gttcaaccgc 480
caccagcata ccaagataca cctgcgccaa aaagatgcgg cccggggatc cggcatggat 540
gctaagtcac taactgcctg gtcccggaca ctggtgacct tcaaggatgt atttgtggac 600
ttcaccaggg aggagtggaa gctgctggac actgctcagc agatcgtgta cagaaatgtg 660
atgctggaga actataagaa cctggtttcc ttgggttatc agcttactaa gccagatgtg 720
atcctccggt tggagaaggg agaagagccc tggctggtgg agagagaaat tcaccaagag 780
acccatcctg attcagagac tgcatttgaa atcaaatcat cagttta 827
<210> 15
<211> 800
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成多核苷酸
<400> 15
atggccccca agaaaaagcg gaaagtgggc atccacgggg tacccgccgc tatggctgag 60
aggcccttcc agtgtcgaat ctgcatgcgt aacttcagtt gtccgtccca cctgacccgc 120
cacatccgca cccacaccgg cgagaagcct tttgcctgtg acatttgtgg gaggaaattt 180
gcccagtccg gcgacctgac ccgccatacc aagatacaca cgggcgagaa gcccttccag 240
tgtcgaatct gcatgcgtaa cttcagttgt ccgtcccacc tgacccgcca catccgcacc 300
cacaccggcg agaagccttt tgcctgtgac atttgtggga ggaaatttgc ccagtccggc 360
gacctgaccc gccataccaa gatacacacg ggatctcaga agcccttcca gtgtcgaatc 420
tgcatgcgta agtttgccca gtccggcgac ctgacccgcc ataccaagat acacctgcgc 480
caaaaagatg cggcccgggg atccggcatg gatgctaagt cactaactgc ctggtcccgg 540
acactggtga ccttcaagga tgtatttgtg gacttcacca gggaggagtg gaagctgctg 600
gacactgctc agcagatcgt gtacagaaat gtgatgctgg agaactataa gaacctggtt 660
tccttgggtt atcagcttac taagccagat gtgatcctcc ggttggagaa gggagaagag 720
ccctggctgg tggagagaga aattcaccaa gagacccatc ctgattcaga gactgcattt 780
gaaatcaaat catcagttta 800
<210> 16
<211> 740
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成多核苷酸
<400> 16
atggccccca agaaaaagcg gaaagtgggc atccacgggg tacccgccgc tatggctgag 60
aggcccttcc agtgtcgaat ctgcatgcgt aacttcagtt ccccggagca gctgtcccgc 120
cacatccgca cccacaccgg cgagaagcct tttgcctgtg acatttgtgg gaggaaattt 180
gcccagtggt ccacccgcaa gcgccatacc aagatacaca cgccgaaccc gcaccgccgc 240
accgacccgt cccacaagcc cttccagtgt cgaatctgca tgcgtaactt cagtaagcag 300
ggcaacctgg tggagcacat ccgcacccac accggcgaga agccttttgc ctgtgacatt 360
tgtgggagga aatttgccaa gcgctgtaac ctgcgctgtc ataccaagat acacctgcgc 420
caaaaagatg cggcccgggg atccggcatg gatgctaagt cactaactgc ctggtcccgg 480
acactggtga ccttcaagga tgtatttgtg gacttcacca gggaggagtg gaagctgctg 540
gacactgctc agcagatcgt gtacagaaat gtgatgctgg agaactataa gaacctggtt 600
tccttgggtt atcagcttac taagccagat gtgatcctcc ggttggagaa gggagaagag 660
ccctggctgg tggagagaga aattcaccaa gagacccatc ctgattcaga gactgcattt 720
gaaatcaaat catcagttta 740
<210> 17
<211> 922
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述: 合成多核苷酸
<400> 17
atgcccccaa gaaaaagcgg aaagtgggca tccacggggt acccgccgct atggctgaga 60
ggcccttcca gtgtcgaatc tgcatgcgta acttcagtcg ctccgacaac ctgtccgagc 120
acatccgcac ccacaccggc gagaagcctt ttgcctgtga catttgtggg aggaaatttg 180
ccaagcgctg taacctgcgc tgtcatacca agatacacac gcatcccagg gcacctattc 240
ccaagccctt ccagtgtcga atctgcatgc gtaacttcag tcagtccggc gacctgaccc 300
gccacatccg cacccacacc ggcgagaagc cttttgcctg tgacatttgt gggaggaaat 360
ttgcccagtc cggcgacctg acccgccata ccaagataca cacgccgaac ccgcaccgcc 420
gcaccgaccc gtcccacaag cccttccagt gtcgaatctg catgcgtaac ttcagtcgct 480
ccgacaacct gtccgagcac atccgcaccc acaccggcga gaagcctttt gcctgtgaca 540
tttgtgggag gaaatttgcc aagcgctgta acctgcgctg tcataccaag atacacctgc 600
gccaaaaaga tgcggcccgg ggatccggca tggatgctaa gtcactaact gcctggtccc 660
ggacactggt gaccttcaag gatgtatttg tggacttcac cagggaggag tggaagctgc 720
tggacactgc tcagcagatc gtgtacagaa atgtgatgct ggagaactat aagaacctgg 780
tttccttggg ttatcagctt actaagccag atgtgatcct ccggttggag aagggagaag 840
agccctggct ggtggagaga gaaattcacc aagagaccca tcctgattca gagactgcat 900
ttgaaatcaa atcatcagtt ta 922
<210> 18
<211> 274
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成多肽
<400> 18
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Met Ala Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Lys Phe
20 25 30
Ala Gln Ser Gly Asp Leu Thr Arg His Thr Lys Ile His Thr Gly Glu
35 40 45
Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser Gly
50 55 60
Asp Leu Thr Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala
65 70 75 80
Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Ser Gly Asp Leu Thr Arg
85 90 95
His Thr Lys Ile His Thr Pro Asn Pro His Arg Arg Thr Asp Pro Ser
100 105 110
His Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Lys His
115 120 125
Gly Asn Leu Ser Glu His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
130 135 140
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Lys Arg Cys Asn Leu Arg
145 150 155 160
Cys His Thr Lys Ile His Leu Arg Gln Lys Asp Ala Ala Arg Gly Ser
165 170 175
Gly Met Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr
180 185 190
Phe Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu
195 200 205
Asp Thr Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr
210 215 220
Lys Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile
225 230 235 240
Leu Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile
245 250 255
His Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser
260 265 270
Ser Val
<210> 19
<211> 275
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成多肽
<400> 19
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Met Ala Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
20 25 30
Ser Cys Pro Ser His Leu Thr Arg His Ile Arg Thr His Thr Gly Glu
35 40 45
Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Ser Gly
50 55 60
Asp Leu Thr Arg His Thr Lys Ile His Thr Pro Asn Pro His Arg Arg
65 70 75 80
Thr Asp Pro Ser His Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn
85 90 95
Phe Ser Lys His Gly Asn Leu Ser Glu His Ile Arg Thr His Thr Gly
100 105 110
Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Lys Arg
115 120 125
Cys Asn Leu Arg Cys His Thr Lys Ile His Thr Gly Ser Gln Ser Pro
130 135 140
Phe Gln Cys Arg Ile Cys Met Arg Lys Phe Ala Arg Gln Phe Asn Arg
145 150 155 160
His Gln His Thr Lys Ile His Leu Arg Gln Lys Asp Ala Ala Arg Gly
165 170 175
Ser Gly Met Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val
180 185 190
Thr Phe Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu
195 200 205
Leu Asp Thr Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn
210 215 220
Tyr Lys Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val
225 230 235 240
Ile Leu Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu
245 250 255
Ile His Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys
260 265 270
Ser Ser Val
275
<210> 20
<211> 266
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成多肽
<400> 20
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Met Ala Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
20 25 30
Ser Cys Pro Ser His Leu Thr Arg His Ile Arg Thr His Thr Gly Glu
35 40 45
Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Ser Gly
50 55 60
Asp Leu Thr Arg His Thr Lys Ile His Thr Gly Glu Lys Pro Phe Gln
65 70 75 80
Cys Arg Ile Cys Met Arg Asn Phe Ser Cys Pro Ser His Leu Thr Arg
85 90 95
His Ile Arg Thr His Thr Gly Glu Lys Pro Phe Ala Cys Asp Ile Cys
100 105 110
Gly Arg Lys Phe Ala Gln Ser Gly Asp Leu Thr Arg His Thr Lys Ile
115 120 125
His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Lys
130 135 140
Phe Ala Gln Ser Gly Asp Leu Thr Arg His Thr Lys Ile His Leu Arg
145 150 155 160
Gln Lys Asp Ala Ala Arg Gly Ser Gly Met Asp Ala Lys Ser Leu Thr
165 170 175
Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp Val Phe Val Asp Phe
180 185 190
Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile Val Tyr
195 200 205
Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu Val Ser Leu Gly Tyr
210 215 220
Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu Glu Lys Gly Glu Glu
225 230 235 240
Pro Trp Leu Val Glu Arg Glu Ile His Gln Glu Thr His Pro Asp Ser
245 250 255
Glu Thr Ala Phe Glu Ile Lys Ser Ser Val
260 265
<210> 21
<211> 246
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成多肽
<400> 21
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Met Ala Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
20 25 30
Ser Ser Pro Glu Gln Leu Ser Arg His Ile Arg Thr His Thr Gly Glu
35 40 45
Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Trp Ser
50 55 60
Thr Arg Lys Arg His Thr Lys Ile His Thr Pro Asn Pro His Arg Arg
65 70 75 80
Thr Asp Pro Ser His Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn
85 90 95
Phe Ser Lys Gln Gly Asn Leu Val Glu His Ile Arg Thr His Thr Gly
100 105 110
Glu Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Lys Arg
115 120 125
Cys Asn Leu Arg Cys His Thr Lys Ile His Leu Arg Gln Lys Asp Ala
130 135 140
Ala Arg Gly Ser Gly Met Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg
145 150 155 160
Thr Leu Val Thr Phe Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu
165 170 175
Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile Val Tyr Arg Asn Val Met
180 185 190
Leu Glu Asn Tyr Lys Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys
195 200 205
Pro Asp Val Ile Leu Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val
210 215 220
Glu Arg Glu Ile His Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe
225 230 235 240
Glu Ile Lys Ser Ser Val
245
<210> 22
<211> 307
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述: 合成多肽
<400> 22
Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala
1 5 10 15
Ala Met Ala Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe
20 25 30
Ser Arg Ser Asp Asn Leu Ser Glu His Ile Arg Thr His Thr Gly Glu
35 40 45
Lys Pro Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Lys Arg Cys
50 55 60
Asn Leu Arg Cys His Thr Lys Ile His Thr His Pro Arg Ala Pro Ile
65 70 75 80
Pro Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Gln Ser
85 90 95
Gly Asp Leu Thr Arg His Ile Arg Thr His Thr Gly Glu Lys Pro Phe
100 105 110
Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Gln Ser Gly Asp Leu Thr
115 120 125
Arg His Thr Lys Ile His Thr Pro Asn Pro His Arg Arg Thr Asp Pro
130 135 140
Ser His Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Arg
145 150 155 160
Ser Asp Asn Leu Ser Glu His Ile Arg Thr His Thr Gly Glu Lys Pro
165 170 175
Phe Ala Cys Asp Ile Cys Gly Arg Lys Phe Ala Lys Arg Cys Asn Leu
180 185 190
Arg Cys His Thr Lys Ile His Leu Arg Gln Lys Asp Ala Ala Arg Gly
195 200 205
Ser Gly Met Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val
210 215 220
Thr Phe Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu
225 230 235 240
Leu Asp Thr Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn
245 250 255
Tyr Lys Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val
260 265 270
Ile Leu Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu
275 280 285
Ile His Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys
290 295 300
Ser Ser Val
305
<210> 23
<211> 201
<212> DNA
<213> 智人(Homo sapiens)
<220>
<221> misc_feature
<222> (1)..(201)
<223> 该序列可涵盖15-67个"cag"重复单元
<220>
<223> 取代和优选实施方式的详细描述参见提交的说明书
<400> 23
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 60
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 120
cagcagcagc agcagcagca gcagcagcag cagcagcagc agcagcagca gcagcagcag 180
cagcagcagc agcagcagca g 201

Claims (16)

1.一种锌指蛋白转录因子ZFP-TF,其包含记作45294或45723的锌指蛋白ZFP或包含如表3中所示的ZFP-TF的氨基酸序列。
2.一种多核苷酸,其编码权利要求1所述的ZFP-TF。
3.一种rAAV载体,其包含一种或多种权利要求2所述的多核苷酸,其中所述ZFP-TF包含记作45294或45723的ZFP,或者其中所述rAAV载体包含具有如表3中所示的序列的多核苷酸。
4.如权利要求3所述的rAAV载体,其中所述ZFP-TF包含记作45294或45723的ZFP,并且进一步包含编码核定位信号NLS的序列和任选的驱动ZFP-TF表达的启动子,例如组成型启动子如CMV。
5.一种药物组合物,其包含前述权利要求中任一项所述的一种或多种ZFP-TF、一种或多种多核苷酸和/或一种或多种rAAV载体。
6.一种修饰细胞中的HTT基因表达的方法,该方法包括给予细胞前述权利要求中任一项所述的一种或多种ZFP-TF、一种或多种多核苷酸、一种或多种rAAV载体和/或药物组合物。
7.如权利要求6所述的方法,其中所述HTT基因是突变HTT基因、即mHTT基因。
8.如权利要求6或7所述的方法,其中,所述细胞是神经元细胞。
9.如权利要求8所述的方法,其中所述神经元细胞在大脑中。
10.如权利要求8或9所述的方法,其中所述神经元细胞在大脑的纹状体中。
11.一种治疗和/或预防有此需要的对象中的亨廷顿氏病的方法,所述方法包括给予有此需要的对象前述权利要求中任一项所述的一种或多种ZFP-TF、一种或多种多核苷酸、一种或多种rAAV载体和/或药物组合物,任选地,其中所述一种或多种ZFP-TF、多核苷酸、rAAV载体和/或药物组合物双侧给药至对象的纹状体。
12.前述权利要求中任一项所述的一种或多种ZFP-TF、一种或多种多核苷酸、一种或多种rAAV载体和/或药物组合物在阻遏有此需要的对象中突变HTT、即mHTT的表达中的应用。
13.如权利要求12所述的应用,其中在所述对象中治疗亨廷顿氏病。
14.如权利要求12或13所述的应用,其中所述对象中的mHTT聚集物和/或运动缺陷有所减少。
15.如权利要求12~14中任一项所述的应用,其中所述一种或多种ZFP-TF、一种或多种多核苷酸、一种或多种rAAV载体和/或药物组合物递送至对象的大脑,任选地双侧递送至对象的纹状体。
16.如权利要求15所述的应用,其中所述一种或多种rAAV载体以每个纹状体1×107至1×1015的载体基因组(vg)的剂量双侧给药至纹状体。
CN202080009478.4A 2019-01-15 2020-01-15 Htt阻遏物及其应用 Pending CN113301909A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962792701P 2019-01-15 2019-01-15
US62/792,701 2019-01-15
PCT/US2020/013661 WO2020150338A1 (en) 2019-01-15 2020-01-15 Htt repressors and uses thereof

Publications (1)

Publication Number Publication Date
CN113301909A true CN113301909A (zh) 2021-08-24

Family

ID=71614037

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080009478.4A Pending CN113301909A (zh) 2019-01-15 2020-01-15 Htt阻遏物及其应用

Country Status (5)

Country Link
US (1) US20220064237A1 (zh)
EP (1) EP3911349A4 (zh)
JP (1) JP2022517988A (zh)
CN (1) CN113301909A (zh)
WO (1) WO2020150338A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115487315A (zh) * 2022-04-20 2022-12-20 暨南大学 治疗亨廷顿病的药物

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11421007B2 (en) 2018-04-18 2022-08-23 Sangamo Therapeutics, Inc. Zinc finger protein compositions for modulation of huntingtin (Htt)

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7972854B2 (en) * 2004-02-05 2011-07-05 Sangamo Biosciences, Inc. Methods and compositions for targeted cleavage and recombination
EP2213731B1 (en) * 2006-05-25 2013-12-04 Sangamo BioSciences, Inc. Variant foki cleavage half-domains
EP2461819A4 (en) * 2009-07-28 2013-07-31 Sangamo Biosciences Inc METHODS AND COMPOSITIONS FOR TREATING TRI-NUCLEOTIDE REPEAT DISORDERS
CN105934524A (zh) * 2013-11-11 2016-09-07 桑格摩生物科学股份有限公司 用于治疗亨廷顿氏病的方法和组合物
BR112016025849A2 (pt) * 2014-05-08 2017-10-17 Chdi Foundation Inc métodos e composições para o tratamento da doença de huntington
EA037993B1 (ru) * 2015-09-23 2021-06-21 Сангамо Терапьютикс, Инк. Репрессоры htt и их применение
GB2544270A (en) * 2015-11-05 2017-05-17 Fundació Centre De Regulació Genòmica Nucleic acids, peptides and methods
US11421007B2 (en) * 2018-04-18 2022-08-23 Sangamo Therapeutics, Inc. Zinc finger protein compositions for modulation of huntingtin (Htt)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115487315A (zh) * 2022-04-20 2022-12-20 暨南大学 治疗亨廷顿病的药物

Also Published As

Publication number Publication date
EP3911349A1 (en) 2021-11-24
EP3911349A4 (en) 2023-01-18
JP2022517988A (ja) 2022-03-11
US20220064237A1 (en) 2022-03-03
WO2020150338A1 (en) 2020-07-23

Similar Documents

Publication Publication Date Title
US11110154B2 (en) Methods and compositions for treating Huntington&#39;s Disease
EP3119878B1 (en) Methods and compositions for regulation of zinc finger protein expression
JP7381476B2 (ja) 希少疾患の処置のための方法および組成物
CN108285491B (zh) 治疗亨廷顿氏病的方法和组合物
US20200109406A1 (en) Engineered genetic modulators
JP7292204B2 (ja) タウモジュレーターならびにその送達のための方法および組成物
US20200101133A1 (en) Methods and compositions for modulation of tau proteins
US20220064237A1 (en) Htt repressors and uses thereof
RU2789459C2 (ru) Модуляторы тау и способы и композиции для их доставки

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
TA01 Transfer of patent application right

Effective date of registration: 20211206

Address after: California, USA

Applicant after: Sangamo Therapeutics, Inc.

Applicant after: Takeda Pharmaceutical Industry Co., Ltd

Address before: California, USA

Applicant before: Sangamo Therapeutics, Inc.

Applicant before: Shire human genetic therapy

TA01 Transfer of patent application right
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination