CN116096895A - 用于治疗庞贝氏病和溶酶体紊乱的包含肝特异性启动子的治疗性腺相关病毒 - Google Patents

用于治疗庞贝氏病和溶酶体紊乱的包含肝特异性启动子的治疗性腺相关病毒 Download PDF

Info

Publication number
CN116096895A
CN116096895A CN202080093548.9A CN202080093548A CN116096895A CN 116096895 A CN116096895 A CN 116096895A CN 202080093548 A CN202080093548 A CN 202080093548A CN 116096895 A CN116096895 A CN 116096895A
Authority
CN
China
Prior art keywords
seq
sequence
nucleic acid
gaa
polypeptide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080093548.9A
Other languages
English (en)
Inventor
迈克尔·W·奥卡拉汉
阿基尔·弗朗索瓦斯
迈克尔·罗伯茨
胡安·曼努埃尔·伊格莱西亚斯
安娜·特雷蒂亚科娃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Asklepios Biopharmaceutical Inc
Original Assignee
Asklepios Biopharmaceutical Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Asklepios Biopharmaceutical Inc filed Critical Asklepios Biopharmaceutical Inc
Publication of CN116096895A publication Critical patent/CN116096895A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2408Glucanases acting on alpha -1,4-glucosidic bonds
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0058Nucleic acids adapted for tissue specific expression, e.g. having tissue specific promoters as part of a contruct
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/475Growth factors; Growth regulators
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/575Hormones
    • C07K14/62Insulins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/78Connective tissue peptides, e.g. collagen, elastin, laminin, fibronectin, vitronectin or cold insoluble globulin [CIG]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/0102Alpha-glucosidase (3.2.1.20)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2810/00Vectors comprising a targeting moiety
    • C12N2810/50Vectors comprising as targeting moiety peptide derived from defined protein
    • C12N2810/80Vectors comprising as targeting moiety peptide derived from defined protein from vertebrates
    • C12N2810/85Vectors comprising as targeting moiety peptide derived from defined protein from vertebrates mammalian
    • C12N2810/851Vectors comprising as targeting moiety peptide derived from defined protein from vertebrates mammalian from growth factors; from growth regulators
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/008Vector systems having a special element relevant for transcription cell type or tissue specific enhancer/promoter combination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/38Vector systems having a special element relevant for transcription being a stuffer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/42Vector systems having a special element relevant for transcription being an intron or intervening sequence for splicing and/or stability of RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/50Vector systems having a special element relevant for transcription regulating RNA stability, not being an intron, e.g. poly A signal

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Endocrinology (AREA)
  • Virology (AREA)
  • Diabetes (AREA)
  • Plant Pathology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Epidemiology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)

Abstract

包含rAVV基因组的重组AAV(rAAV)载体,所述rAVV基因组含有异源核酸,所述异源核酸编码溶酶体蛋白(例如酸性α‑葡萄糖苷酶(GAA)多肽)以及任选地编码可操作地连接至肝特异性启动子(LSP)的靶向序列(例如IGF2靶向肽)和/或任选地编码信号肽,使GAA多肽能够从肝脏中分泌并靶向至溶酶体。具体的实施方式涉及编码α‑葡萄糖苷酶(GAA)多肽的重组AAV(rAAV)载体,所述载体具有肝分泌信号肽和结合人阳离子非依赖甘露糖‑6‑磷酸受体(CI‑MPR)或IGF2受体的IGF2靶向肽,使GAA多肽恰当地亚细胞定位至溶酶体。还涵盖了用rAAV载体治疗溶酶体疾病(例如糖原贮积病II型(GSD II)疾病和/或庞贝氏病)的细胞和方法。

Description

用于治疗庞贝氏病和溶酶体紊乱的包含肝特异性启动子的治疗性腺相关病毒
序列表
根据35 U.S.C.§119(e),本发明要求2019年11月19日提交的美国临时申请62/937,556、2019年11月19日提交的美国临时申请62/937,583和2020年5月12日提交的美国临时申请63/023,570的权益,以引用的方式将其各自内容以其整体并入本文。
序列表
本申请包含序列表,所述序列表已以ASCII格式电子提交并且以引用的方式将其整体并入本文。所述ASCII副本创建于2020年11月17日,命名为046192-096600WOPTSL.txt,并且大小为840,179字节。
技术领域
本发明涉及用于溶酶体酶(例如α-葡萄糖苷酶(GAA)多肽)的靶向易位的腺相关病毒(AAV)颗粒、病毒体和载体,以及用于治疗溶酶体贮积疾病和紊乱(例如庞贝氏病)的方法。
背景技术
超过四十种溶酶体贮积病(LSD)由溶酶体中一种或多种溶酶体酶的缺乏直接或间接引起。用于LSD的酶替代疗法正在积极进行中。治疗通常需要LSD蛋白以M6P依赖性方式被摄取并递送至多种细胞类型的溶酶体。一种可能的方法涉及纯化LSD蛋白并对其进行修饰以将碳水化合物部分与M6P结合。由于与位于细胞表面的M6P受体相互作用,此经修饰的材料可比未经修饰的LSD蛋白更有效地被细胞摄取。
作为酶疗法的替代或辅助,治疗GSD-II的基因疗法的可行性已经被研究(Amalfitano,A.等,(1999)Proc.Natl.Acad.Sci.USA 96:8861-8866;Ding,E.等,(2002)Mol.Ther.5:436-446;Fraites,T.J.等,(2002)Mol.Ther.5:571-578;Tsujino,S.等,(1998)Hum.Gene Ther.9:1609-1616)。
然而,用于治疗溶酶体贮积病的基因(特别是溶酶体蛋白和酶)的病毒或AAV递送具有挑战。通常,哺乳动物溶酶体酶在细胞溶质中合成并穿过ER,在ER中它们被N-连接的高甘露糖型碳水化合物糖基化。在高尔基体中,高甘露糖碳水化合物通过添加将溶酶体蛋白靶向至溶酶体的甘露糖-6-磷酸(M6P)而被修饰在这些蛋白上。经M6P修饰的蛋白质通过与两个M6P受体中的任一个的相互作用而被递送至溶酶体。然而,用于酶替代疗法的重组产生的蛋白质经常缺乏将它们靶向至溶酶体所需的M6P的添加,因此,经常需要向患者给予和/或频繁输注高剂量的重组产生的酶。
酸性α-葡萄糖苷酶(GAA)是一种溶酶体酶,所述溶酶体酶水解麦芽糖和其它线性低聚糖(包括糖原的外部分支)中的α-1,4连接,从而分解溶酶体中的过量糖原(Hirschhorn等,(2001)The Metabolic and Molecular Basis of Inherited Disease,Scriver等编著,(2001),McGraw-Hill:New York,第3389-3420页)。像其它哺乳动物的溶酶体酶一样,GAA在细胞溶质中合成,并穿过ER,在ER中被N-连接的高甘露糖型碳水化合物糖基化。在高尔基体中,高甘露糖碳水化合物通过添加将溶酶体蛋白靶向至溶酶体的甘露糖-6-磷酸(M6P)而被修饰在这些蛋白上。经M6P修饰的蛋白通过与两个M6P受体中的任意一个的相互作用而被递送至溶酶体。最有利的修饰形式是将两个M6P添加至高甘露糖碳水化合物。
溶酶体中GAA活性不足引发庞贝氏病,该病也被称为酸性麦芽糖酶缺乏症(AMD)、糖原贮积病II型(GSDII)、II型糖原症或GAA缺乏症。由于编码GAA的基因中的多种错义和无义突变,出现酶活性降低。因此,糖原在患有庞贝氏病的患者的所有细胞的溶酶体中累积。特别是,糖原累积在心肌和骨骼肌、肝和其它组织的溶酶体中最为明显。累积的糖原最终损害肌肉功能。在最严重的庞贝氏病形式中,由于心肺的衰竭而在两岁之前出现死亡。
因此存在对庞贝氏病的有效治疗的需求。庞贝氏病的酶替代疗法需要重组GAA蛋白,所述重组GAA蛋白将被给予并被受试者中的肌肉和肝细胞摄取,它随后在该处以M6P依赖的方式转运至那些细胞中的溶酶体。然而,尽管酶疗法已证明对严重的婴幼儿GSD II的合理的功效,但GAA酶疗法的益处因需要频繁输注以及受试者产生针对重组hGAA蛋白的抑制物或中和抗体而受到限制(Amalfitano,A.等,(2001)Genet.In Med.3:132-138)。
基因疗法不仅具有治愈遗传紊乱的潜力,而且还有助于使用病毒对获得性和退化性疾病进行长期的非侵入性治疗。一种基因治疗载体是腺相关病毒(AAV)。AAV本身是需要用于有效复制的辅助病毒的非致病性依赖性细小病毒。由于其安全性和简便性,AAV已被用作基因治疗的病毒载体。AAV具有广泛的宿主和细胞类型向性(tropism),能够转导分裂细胞和非分裂细胞。
然而,就报告经历糖血症(glycaemia)的患者而言,GAA多肽的AAV递送对于在肝中实现充分表达和/或递送至溶酶体的方面具有一些挑战。
特别是,在人类受试者中,由于细胞中的非特异更新,编码GAA多肽的rAAV载体的给予已导致许多患者经历低血糖症或变得高血糖(参见例如Byrne等,A study on thesafety and efficacy of Reveglucosidease alfa in patients with late-onsetPompe disease;Orphanet J.of Rare diseases;2017;12:144)。
因此,本领域存在对在体外和体内产生溶酶体多肽(如GAA,包括GAA的修饰)的改进方法的需求,例如用以治疗溶酶体多肽缺陷。此外,存在对改善的来自肝的分泌以及改善的GAA对溶酶体的靶向的需求,以帮助减轻来自GAA多肽过表达的任何副作用,并降低低血糖症的风险。此外,存在对引起GAA和其它溶酶体多肽全身性递送至受影响的组织和器官的方法的需求。特别地,仍然存在对如下的需求:用于向受试者给予GAA蛋白并将GAA蛋白靶向至患者的溶酶体,同时减少任何潜在副作用的更有效方法。
发明内容
本文所述的技术大体上涉及用于治疗溶酶体贮积疾病和紊乱(例如但不限于庞贝氏病)的基因治疗构建体、方法和组合物。更具体地,该技术涉及被配置用于将溶酶体酶(例如GAA多肽)递送至受试者、并且更具体地用于将溶酶体酶(例如GAA多肽)递送至受试者的肝脏(在其中将其靶向至溶酶体并从肝细胞中分泌)的腺相关(AAV)病毒体。
具体而言,本文描述的是靶向性病毒载体,例如,使用rAAV载体作为示例性实例,所述病毒载体包含含有反向末端重复序列(ITR)的核苷酸序列、启动子、异源基因、poly-A尾和可能用于治疗溶酶体贮积病的其它调节元件,例如本文表5A或表6A中列出的那些,其中,所述异源基因为溶酶体酶(例如GAA),并且其中,所述载体(例如rAAV)可以以治疗有效剂量给予至患者,将其递送至合适的组织和/或器官以表达异源溶酶体酶基因以及治疗疾病(例如庞贝氏病)。
本发明的方面教导了在构建和使用方面的某些益处,这些益处产生了下文描述的示例性优点。
因此,在本文所述的具体实施方式中,rAAV载体包含含有反向末端重复序列(ITR)的核苷酸序列、以及位于ITR之间的肝特异性启动子(LSP)、编码酸性α-葡萄糖苷酶(GAA)蛋白的异源核酸序列、poly-A尾和可能用于治疗庞贝氏病的其它调节元件,并且其中,表达GAA蛋白的rAAV可以以治疗有效剂量给予至患者,将其递送至适当的组织和/或器官以表达编码该GAA蛋白的异源基因来治疗患有庞贝氏病的受试者。
更具体地,AAV病毒体或基因组包含选自本文表4中列出的任意启动子的LSP、或其功能变体或功能片段,或选自SEQ ID NO:86、SEQ ID NO:91-SEQ ID NO:96或SEQ ID NO:146-SEQ ID NO:150的任意的LSP或其功能变体或功能片段,其使溶酶体蛋白(例如GAA蛋白)能够优先地在肝脏中表达。在一些实施方式中,肝特异性启动子虽然在肝脏中优先地表达hGAA蛋白,但也可以在另一感兴趣的组织(例如肌肉、或CNS、或肌肉和CNS组织)中一定程度地表达hGAA。在一些实施方式中,经表达的溶酶体酶(例如GAA蛋白)可以被配置为具有靶向序列的GAA融合蛋白(例如本文公开的将GAA蛋白靶向至溶酶体的IGF2靶向肽)和/或可以与信号肽(SP)融合,所述GAA蛋白由肝脏中的rAAV基因组表达,其在肝脏中分泌并被哺乳动物细胞、特别是肌肉细胞的溶酶体摄取。
在本文描述的组合物和方法的一些实施方式中,本文公开的rAAV载体在其基因组中包含:5'和3'AAV反向末端重复(ITR)序列,以及位于5'和3'ITR之间的肝特异性启动子(LSP),所述肝特异性启动子可操作地连接至编码α-葡萄糖苷酶(GAA)多肽的异源核酸序列,其中,所述肝特异性启动子(LSP)包含选自以下所列举的任意的启动子的核酸序列:SEQID NO:86(CRM 0412)、SEQ ID NO:91(SP0412)或SEQ ID NO:92(SP0422)、SEQ ID NOS:93(SP0239)、SEQ ID NO:94(SP0265,也被称为SP131_A1)、SEQ ID NO:95(SP0240)或SEQ IDNO:96(SP0246)、或SEQ ID NO:146(SP0265-UTR)、SEQ ID NO:147(SP0239-UTR)、SEQ IDNO:148(SP0240-UTR)、SEQ ID NO:149(SP0246-UTR)或SEQ ID NO:150(SP0131-A1-UTR)或其功能片段或变体,或选自SEQ ID NO:270-SEQ ID NO:341或SEQ ID NO:342-SEQ ID NO:430的任意的LSP、或其功能片段或变体。在一些实施方式中,GAA多肽不会融合至IGF2靶向序列或信号序列中的任一者融合。在一些实施方式中,GAA多肽融合至本文公开的信号序列和/或本文公开的IGF2靶向序列。
在本文描述的组合物和方法的一些实施方式中,本文公开的rAAV载体在其基因组中包含:5'和3'AAV反向末端重复(ITR)序列,以及位于5'和3'ITR之间的肝特异性启动子(LSP),所述肝特异性启动子可操作地连接至编码融合多肽的异源核酸序列,所述融合多肽包含(i)分泌信号肽,和/或IGF2靶向肽;以及(ii)α-葡萄糖苷酶(GAA)多肽,其中,所述肝特异性启动子(LSP)选自本文表4中所列举的任意启动子、或其功能变体或功能片段,或选自SEQ ID NO:86、SEQ ID NO:91-SEQ ID NO:96或SEQ ID NO:146-SEQ ID NO:150的任意的LSP、或其功能变体或功能片段。
在一些实施方式中,本文公开的rAAV载体在其基因组中包含:5'和3'AAV反向末端重复序列(ITR),以及位于5'和3'ITR之间的编码融合多肽的异源核酸序列,所述融合多肽包含(i)分泌信号肽(也被称为前导肽)以及(ii)α-葡萄糖苷酶(GAA)多肽,其中,所述异源核酸可操作地连接至肝特异性启动子(LSP),所述肝特异性启动子选自本文表4中所列举的任意启动子、或其功能变体或功能片段,或选自SEQ ID NO:86、SEQ ID NO:91-SEQ ID NO:96或SEQ ID NO:146-SEQ ID NO:150的任意的LSP、或其功能变体或功能片段,或选自本文表4的任意的LSP、或其功能变体或功能片段。示例性的前导序列包括但不限于如本文所公开的固有的GAA前导序列、AAT序列、IL2(1-3)、IL2前导序列(IL2wt)、经修饰的IL2前导序列(IL2mut)、纤连蛋白(FN1)信号序列、或IgG前导序列或其功能变体。在一些实施方式中,AAV载体包含位于LSP和前导序列之间的Kozak序列。
在一些实施方式中,本文公开的rAAV载体在其基因组中包含:5'和3'AAV反向末端重复序列(ITR),以及位于5'和3'ITR之间的编码融合多肽的异源核酸序列,所述融合多肽包含(i)IGF2靶向肽以及(ii)α-葡萄糖苷酶(GAA)多肽,其中,所述异源核酸可操作地连接至肝特异性启动子(LSP),所述肝特异性启动子选自本文表4中所列举的任意启动子、或其功能变体或功能片段,或选自SEQ ID NO:86、SEQ ID NO:91-SEQ ID NO:96或SEQ ID NO:146-SEQ ID NO:150的任意的LSP、或其功能变体或功能片段。
在进一步的实施方式中,本文公开的rAAV载体在其基因组中包含:5'和3'AAV反向末端重复序列(ITR),以及位于5'和3'ITR之间的编码α-葡萄糖苷酶(GAA)多肽(即,其中GAA多肽未融合至异源信号肽(或前导序列)融合,或未融合至如本文所述的IGF2靶向序列)的异源核酸序列,其中,所述异源核酸可操作地连接至肝特异性启动子(LSP),所述肝特异性启动子选自本文表4中所列举的任意启动子、或其功能变体或功能片段,或选自SEQ ID NO:86、SEQ ID NO:91-SEQ ID NO:96或SEQ ID NO:146-SEQ ID NO:150的任意的LSP、或其功能变体或功能片段。
在一些实施方式中,rAAV载体包含肝特异性衣壳(例如选自WO2019/241324中公开的XL32和XL32.1的肝特异性衣壳,通过引用的方式将其整体并入本文)。在一些实施方式中,rAAV载体为AAV8载体、或包含至少一种AAV8衣壳蛋白(例如,VP1、VP2或VP3中的至少一种来自AAV8血清型)的单倍体AAV载体、或WO2019/241324(通过引用的方式将其整体并入本文)中公开的AAVXL32或AAVXL32.1,并且在一些实施方式中,AAV载体为包含至少两种AAV8衣壳蛋白的单倍体AAV载体。在一些实施方式中,AAV载体包含在WO2019241324A1或国际专利申请PCT/US2019/036676中公开的衣壳,通过引用的方式将它们整体并入本文。在一些实施方式中,AAV载体包含由核酸AAV衣壳编码序列编码的衣壳,所述核酸AAV衣壳编码序列与WO2019241324A1中公开的SEQ ID NO:1-SEQ ID NO:3中任一项的核苷酸序列或与(b)与编码WO2019241324A1中公开的SEQ ID NO:4-SEQ ID NO:6中任一项的核苷酸序列至少90%相同。在一些实施方式中,AAV衣壳包含与WO2019241324A1中公开的SEQ ID NO:4-SEQ ID NO:6中的任一项至少90%相同的氨基酸序列,以及AAV颗粒包含本发明的AAV载体基因组和AAV衣壳。
在一些实施方式中,rAAV载体包含衣壳蛋白,使得该AAV载体能够转导肝细胞,并且在一些实施方式中,rAAV载体包含衣壳蛋白,使得该AAV载体能够转导肌肉和肝细胞。
被涵盖的用于方法和组合物中的示例性LSP为SP0412(SEQ ID NO:91)或其功能变体。在替代实施方式中,LSP可以选自以下中的任一项:SEQ ID NO:86(CRM 0412)、SEQ IDNO:91(SP0412)或SEQ ID NO:92(SP0422)、SEQ ID NO:93(SP0239)、SEQ ID NO:94(SP0265,也被称为SP131_A1)、SEQ ID NO:95(SP0240)或SEQ ID NO:96(SP0246)、或SEQ ID NO:146(SP0265-UTR)、SEQ ID NO:147(SP0239-UTR)、SEQ ID NO:148(SP0240-UTR)、SEQ ID NO:149(SP0246-UTR)或SEQ ID NO:150(SP0131-A1-UTR)、或其功能片段或变体。
在本文描述的组合物和方法的一些实施方式中,分泌信号肽选自下述中的任一种:AAT信号肽、纤连蛋白信号肽(FN1)、GAA信号肽、固有的GAA前导序列、AAT序列、IL2(1-3)、IL2前导序列(IL2wt)、经修饰的IL2前导序列(IL2mut)、或IgG前导序列、或其具有分泌信号活性的功能变体。
在本文描述的组合物和方法的一些实施方式中,α-葡萄糖苷酶(GAA)多肽在GAA多肽的N-末端连接至IGF2靶向肽。在一些实施方式中,IGF2靶向肽连接至人酸性α-葡萄糖苷酶(GAA)多肽(SEQ ID NO:10)的第70位氨基酸处的N-末端(即,连接至人酸性α-葡萄糖苷酶(GAA)多肽的第70-952位残基的N-末端),或连接至与SEQ ID NO:10的第70-952位氨基酸具有至少85%序列同一性的GAA多肽。在替代实施方式中,IGF2靶向肽连接至人酸性α-葡萄糖苷酶(GAA)多肽(SEQ ID NO:10)的第40位氨基酸处的N-末端(即,连接至人酸性α-葡萄糖苷酶(GAA)多肽的第40-952位残基的N-末端),或连接至与SEQ ID NO:10的第40-952位氨基酸具有至少85%序列同一性的GAA多肽。在本文描述的组合物和方法的一些实施方式中,GAA多肽由野生型GAA核酸序列(例如,SEQ ID NO:11或SEQ ID NO:72)编码,或者可为密码子优化的GAA核酸序列,例如,用以降低受试者中的固有免疫应答、减少CpG岛和/或在体内增加表达中的任一种。示例性的密码子优化的GAA核酸序列包括但不限于SEQ ID NO:73、SEQ IDNO:74、SEQ ID NO:75、SEQ ID NO:76和SEQ ID NO:182。
在本文公开的方法和组合物的一些实施方式中,重组AAV载体包含肝特异性启动子(LSP),例如但不限于,肝特异性启动子选自本文表4中的任一种或其功能变体、或其功能变体。被涵盖以在方法和组合物中使用的示例性LSP包括SP0412及其功能变体。在替代实施方式中,LSP可包含选自如本文所公开的SP0422、SP0131A1、SP0239、SP0240或SP0246中任一项的核酸序列,或其功能变体。例如,肝特异性启动子可以包含选自SEQ ID NO:86(CRM0412)、SEQ ID NO:91(SP0412)或SEQ ID NO:92(SP0422)中任一项的核酸序列,或其功能变体或功能片段。在替代的实施方式中,肝特异性启动子可以包含选自于以下中的任一项的核酸序列:SEQ ID NO:93(SP0239)、SEQ ID NO:94(SP0265,也称为SP131_A1)、SEQ ID NO:95(SP0240)或SEQ ID NO:96(SP0246)、或SEQ ID NO:146(SP0265-UTR)、SEQ ID NO:147(SP0239-UTR)、SEQ ID NO:148(SP0240-UTR)、SEQ ID NO:149(SP0246-UTR)、或SEQ ID NO:150(SP0131-A1-UTR)。在本文公开的组合物和方法的一些实施方式中,肝特异性启动子包括肝特异性顺式调节元件(CRE)、合成型肝特异性顺式调节模块(CRM)或合成型肝特异性启动子,所述合成型肝特异性启动子包含如先前在临时申请62,937,556的表4A或表4B中公开的选自SEQ ID NO:270-SEQ ID NO:341(最小LSP,其可以包括CRM)或SEQ ID NO:342-SEQID NO:430(示例性的合成型LSP)中的任一项的启动子序列、或其功能片段或功能变体,通过引用的方式将其整体涵盖于本文中。这些肝特异性启动子元件可以包括最小肝特异性启动子(参见例如,SEQ ID NO:86、SEQ ID NO:270-SEQ ID NO:341)或肝特异性近端启动子(参见例如,SEQ ID NO:91-SEQ ID NO:96、SEQ ID NO:146-SEQ ID NO:150和SEQ ID NO:342-SEQ ID NO:430)。例如,SEQ ID NO:86(CRM 0412)、SEQ ID NO:91(SP0412)或SEQ IDNO:92(SP0422)、或其功能变体或功能片段。
在本文公开的方法和组合物的一些实施方式中,重组AAV载体包含肝特异性启动子(LSP),例如但不限于,肝特异性启动子选自于以下中的任一项:SEQ ID NO:86、SEQ IDNO:91-SEQ ID NO:96、SEQ ID NO:146-SEQ ID NO:150、SEQ ID NO:370-SEQ ID NO:430、或其功能变体或功能片段。
例如,本文表4中公开的肝特异性启动子的功能变体或功能片段,或选自SEQ IDNO:86、SEQ ID NO:91-SEQ ID NO:96或SEQ ID NO:146-SEQ ID NO:150或SEQ ID NO:370-SEQ ID NO:430或其功能变体或功能片段中的任意的LSP与原始的未经修饰的参考序列具有至少约75%的序列同一性、或至少约80%的序列同一性、至少约90%的序列同一性、至少约95%的序列同一性、至少约98%的序列同一性,并且还具有相应的未经修饰的启动子序列的至少35%的启动子活性、或至少约45%的启动子活性、或至少约50%的启动子活性、或至少约60%的启动子活性、或至少约75%的启动子活性、或至少约80%的启动子活性、或至少约85%的启动子活性、或至少约90%的启动子活性、或至少约95%的启动子活性。
例如,SEQ ID NO:92(SP0422)或SEQ ID NO:91(SP0412)的功能变体或功能片段与SEQ ID NO:92或SEQ ID NO:91具有至少约75%的序列同一性、或与SEQ ID NO:92或SEQ IDNO:91具有至少约80%的序列同一性、与SEQ ID NO:92或SEQ ID NO:91具有至少约90%的序列同一性、与SEQ ID NO:92或SEQ ID NO:91具有至少约95%的序列同一性、与SEQ IDNO:92或SEQ ID NO:91或原始的未经修饰的序列具有至少约98%的序列同一性,并且还具有SEQ ID NO:92或SEQ ID NO:91各自的相应的未经修饰的启动子序列的至少35%的启动子活性、或至少约45%的启动子活性、或至少约50%的启动子活性、或至少约60%的启动子活性、或至少约75%的启动子活性、或至少约80%的启动子活性、至少约85%的启动子活性、或至少约90%的启动子活性、或至少约95%的启动子活性。
功能片段是启动子的一部分,该片段具有未经截短的启动子的至少35%、或至少约45%、或至少约50%、或至少约75%、或至少约80%、或至少约85%、或至少约90%。在一些实施方式中,功能片段包含未经修饰的启动子序列的连续部分。虽然在本文的实施例中公开了TTR(SEQ ID NO:431)作为示例性LSP,但本领域普通技术人员可以将TTR启动子(SEQID NO:431)替换为在本文表4中列出的任何一种或多种肝特异性启动子,例如,包含至少SEQ ID NO:92(SP0422)或SEQ ID NO:91(SP0412)或者SEQ ID NO:92(SP0422)或SEQ IDNO:91(SP0412)的功能变体或片段的核酸序列,或包含SEQ ID NO:93(SP0239)、SEQ ID NO:94(SP131_A1)、SEQ ID NO:95(SP0240)、SEQ ID NO:96(SP0246)、或SEQ ID NO:146(SP0265-UTR)、SEQ ID NO:147(SP0239-UTR)、SEQ ID NO:148(SP0240-UTR)、SEQ ID NO:149(SP0246-UTR)或SEQ ID NO:150(SP0131-A1-UTR)、或选自SEQ ID NO:270-SEQ ID NO:341或SEQ ID NO:342-SEQ ID NO:430的任何序列、或其功能变体或功能片段中的任一者的核酸序列。在一些实施方式中,LSP虽然在肝脏中优先表达hGAA蛋白,但也可以在另一感兴趣的组织例如肌肉或CNS或肌肉和CNS组织中一定程度地表达hGAA。
在本文公开的方法和组合物的一些实施方式中,重组AAV载体包含编码如本文公开的野生型GAA多肽(wtGAA)或经修饰的GAA多肽的异源核酸序列,其中,GAA多肽的一个或多个氨基酸被修饰(例如H199R、R223H、H201L修饰)。在本文公开的方法和组合物的一些实施方式中,重组AAV载体包含编码GAA多肽的异源核酸序列,所述核酸序列为人GAA基因或人密码子优化的GAA基因(coGAA)或经修饰的GAA核酸序列,所述经修饰的GAA核酸序列经密码子优化并编码包含选自H199R、R223H、H201L中的一种或多种修饰的经修饰的GAA多肽。在本文公开的方法和组合物的所有方面,编码GAA多肽的核酸序列针对以下任一项或多项进行密码子优化:增强体内表达、减少CpG岛或降低固有的免疫应答。在本文公开的方法和组合物的所有方面,对编码GAA多肽的核酸序列进行密码子优化以减少CpG岛并降低固有的免疫应答。在一些实施方式中,编码野生型GAA多肽的核酸序列包含如在SEQ ID NO:182中公开以及在本文中描述的修饰。
本文技术的另一方面涉及药物组合物,该药物组合物包含本文公开的任何重组AAV载体组合物和药学上可接受的运载体。
本文技术的另一方面涉及包含核酸序列的组合物,所述核酸序列以如下顺序包含:5'ITR、肝特异性启动子(LSP)以及3'ITR,所述肝特异性启动子可操作地连接至包含编码经修饰的GAA多肽的核酸的核酸序列,所述经修饰的GAA多肽包含选自H199R、R223H、H201L中的一种或多种的修饰。在一个方面,所述核酸序列任选地进一步包含编码位于LSP和编码GAA多肽的核酸之间的前导序列(或信号序列)的核酸序列,其中的前导序列选自本文公开的以下中的任一种:固有的GAA前导序列、AAT序列、IL2(1-3)、IL2前导序列(IL2wt)、经修饰的IL2前导序列(IL2mut)、纤连蛋白(FN1)或IgG前导序列或它们的功能变体。在一些实施方式中,所述核酸序列任选地进一步包含位于LSP和前导序列之间的kozak序列。在一些实施方式中,所述核酸序列任选地进一步包含位于前导序列和编码GAA多肽的核酸之间的IGF2靶向肽。在一些实施方式中,所述核酸序列任选地进一步包含位于编码GAA多肽和polyA序列的核酸的3'端的3'UTR。在一些实施方式中,优选地在LSP和kozak序列之间,所述核酸序列任选地进一步包含LSP的3'端和编码GAA多肽的核酸的5'端的内含子序列。rAAV载体或rAAV基因组的示例性构建体在图5A-图5G中示出。
本文技术的另一方面涉及包含核酸序列的组合物,所述核酸序列包含5’ITR、肝特异性启动子(LSP)、polyA序列和3’ITR序列,所述肝特异性启动子可操作地连接至编码经修饰的GAA多肽的核酸序列,所述经修饰的GAA多肽包含选自如下的一种或多种修饰:H199R、R223H、H201L,其中polyA序列可以是全长或截短的polyA信号序列。本文技术的另一个方面涉及包含核酸序列的组合物,所述核酸序列包含5’ITR、肝特异性启动子(LSP)、全长polyA序列、末端重复序列和3’ITR序列,所述肝特异性启动子可操作地连接至编码经修饰的GAA多肽的核酸序列,所述经修饰的GAA多肽包含选自以下的一种或多种修饰:H199R、R223H、H201L,其中核酸缺少AAV P5启动子序列。
本文技术的另一方面涉及包含核酸序列的组合物,所述核酸序列包含:可操作地连接至如下的核酸序列的肝特异性启动子(LSP),所述核酸序列按以下顺序包含(a)编码分泌信号肽的核酸,(b)编码IGF2靶向肽的核酸,以及(c)编码GAA多肽的核酸。
本文技术的另一方面涉及一种组合物,该组合物包含重组腺相关病毒(rAAV)载体基因组的核酸序列,该核酸序列包含:(a)5'和3'AAV反向末端重复(ITR)核酸序列,以及(b)位于5'和3'ITR序列之间的异源核酸序列,所述异源核酸序列编码包含分泌信号肽和α-葡萄糖苷酶(GAA)多肽的多肽,其中,所述异源核酸可操作地连接至如上所述的肝特异性启动子。示例性肝特异性启动子为SP0412或SP0422或其功能变体。在一些实施方式中,用于本文公开的方法和组合物中的肝特异性启动子包括肝特异性顺式调节元件(CRE)、合成型肝特异性顺式调节模块(CRM)或如本文表4中公开的合成型肝特异性启动子。
在本文公开的方法和组合物的一些实施方式中,所述核酸序列包含编码GAA多肽的异源核酸序列,其中,所述核酸序列为人GAA基因或人密码子优化的GAA基因(coGAA)或经修饰的GAA核酸序列。在本文公开的方法和组合物的一些实施方式中,所述核酸序列包含异源核酸序列,所述异源核酸序列是为了以下的任一种或多种的密码子优化的(coGAA)GAA基因:增强体内表达、减少CpG岛或降低固有免疫应答。在本文公开的方法和组合物的一些实施方式中,所述核酸序列包含异源核酸序列,所述异源核酸序列为密码子优化的(coGAA)GAA基因,以减少CpG岛并降低固有免疫应答。
在本文公开的方法和组合物的一些实施方式中,所述核酸序列包含编码GAA多肽的异源核酸序列,所述异源核酸序列选自于以下中的任一项:SEQ ID NO:11(全长hGAA)、SEQ ID NO:55(Dwight cDNA)、SEQ ID NO:56(hGAAΔ1-66)或SEQ ID NO:182(modGAA、H199R、R223H),或编码具有SEQ ID NO:170(modGAA;H199R,R223H)、SEQ ID NO:171(modGAA;H199R,R223H,H201L)的氨基酸序列的GAA多肽的核酸序列,或编码与SEQ ID NO:11、SEQ ID NO:55、SEQ ID NO:56或SEQ ID NO:182中的任一项具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的GAA多肽的核酸序列。
在本文公开的方法和组合物的一些实施方式中,所述核酸序列包含编码GAA多肽的异源核酸序列,其中编码GAA多肽的核酸选自SEQ ID NO:74(密码子优化的1)、SEQ IDNO:75(密码子优化的2)和SEQ ID NO:76(密码子优化的3)或SEQ ID NO:182(modGAA、H199R、R223H)中的任一项,或与SEQ ID NO:74、SEQ ID NO:75、SEQ ID NO:76或SEQ ID NO:182中的任一项具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的核酸序列。
本文技术的另一方面涉及本文公开的rAAV和核酸组合物在治疗疾病的方法中的用途。具体而言,本文技术的一个方面涉及本文公开的rAAV载体组合物和核酸组合物在治疗患有糖原贮积病II型(GSD II、庞贝氏病、酸性麦芽糖酶缺乏症)或患有α-葡萄糖苷酶(GAA)多肽缺乏症的患者的方法中的用途,所述方法包括向受试者给予本文公开的任意的重组AAV载体或rAAV基因组或核酸序列。在本文公开的方法的一些实施方式中,所表达的GAA多肽从受试者的肝脏分泌,并且分泌的GAA被骨骼肌组织、心肌组织、膈肌组织或它们的组合摄取,其中对分泌的GAA的摄取引起组织中的溶酶体糖原贮备的减少。在所公开的方法的一些实施方式中,重组AAV载体或rAAV基因组或核酸序列通过任何合适的给予方法而被给予至受试者,所述给予方法例如但不限于选自以下任一项的给予方法:肌内、皮下、椎管内、脑池内、鞘内、静脉内给予。在一些实施方式中,本文公开的药物组合物可以用于本文公开的方法中。
本文技术的另一方面涉及细胞,所述细胞包含本文公开的rAAV组合物、rAAV基因组组合物或核酸组合物中的任一种或多种。在一些实施方式中,细胞是人细胞、或非人细胞哺乳动物细胞、或昆虫细胞。
本文技术的另一方面涉及宿主动物,所述宿主动物包含本文公开的rAAV组合物、rAAV基因组组合物或核酸组合物中的任一种或多种。在一些实施方式中,宿主动物是哺乳动物、非人哺乳动物或人。
本文技术的另一方面涉及包含至少一个细胞的宿主动物,所述细胞包含本文所公开的rAAV组合物、rAAV基因组组合物或核酸组合物中的任一种或多种。在一些实施方式中,包含此类经修饰的细胞的宿主动物是哺乳动物、非人哺乳动物或人。
在一些实施方式中,本文公开了药物制剂,所述药物制剂包含本文公开的rAAV载体、编码rAAV基因组的核酸以及药学上可接受的运载体。
本发明的方面教导了在构建和使用方面的某些益处,这些益处产生了下文描述的示例性优点。从以下更详细的描述中,结合附图,本发明各方面的其它特征和优点将变得显而易见,所述附图以示例的方式示出了本发明各方面的原理。
附图说明
本申请文件包含至少一幅彩色附图。具有彩色附图的本专利申请公开文本副本将根据请求并支付必要的费用后由专利局提供。附图说明了本发明的各个方面。在此类附图中:
图1是示出如下的图:根据至少一个实施方式,如在全血中测量的,不同的AAV血清型AAV3b、AAV3ST、AAV8和AAV9的x轴以及每个二倍体基因组的载体基因组的y轴。
图2是示出如下的图:根据至少一个实施方式,如在左肝叶、中肝叶和右肝叶中测量的,不同的AAV血清型AAV3b、AAV3ST、AAV8和AAV9的x轴以及每个二倍体基因组的载体基因组的y轴。
图3A-图3B是用于产生用在本文公开的方法和组合物中的rAAV载体的示例性质粒。图3A是根据至少一个实施方式,用于在生产细胞系(例如pro-10细胞系)中产生rAAV载体的pAAV-LSPhGAA质粒的质粒图谱的示意图,其中,所述质粒包含5'ITR、LSP、hGAA核酸序列、3'UTR、polyA序列和3'ITR,其中,所述ITR来自AAV2。图3B示出了图3A的质粒图谱的示意图的更详细的图谱。
图4A-图4G是将hGAA用作被表达的示例性溶酶体蛋白的、本文公开的具有靶向肽的rAAV基因组的示例性核酸构建体的示意图。图4A示出了rAAV基因组的核酸构建体,所述核酸构建体包含5'ITR、肝特异性启动子(LSP)以及3'ITR,所述肝特异性启动子可操作地连接至编码分泌信号肽(SS)、靶向肽(TP)和人GAA(hGAA)多肽的异源核酸,。图4B示出了本文公开的rAAV基因组的示例性核酸构建体,所述核酸构建体包含与图4A相同的元件,并且额外包含位于hGAA多肽的3'端和3'-ITR的5'端的至少一个polyA信号。图4C示出了本文公开的rAAV基因组的示例性核酸构建体,所述核酸构建体包含与图4B相同的元件,不同之处在于其包含位于启动子3'端的内含子序列。图4D示出了本文公开的rAAV基因组的示例性核酸构建体,所述核酸构建体包含与图4C相同的元件,不同之处在于其包含位于hGAA多肽核酸序列的3'端并位于poly A序列之前的胶原蛋白稳定性(CS)序列和/或3'UTR序列。图4E示出了本文公开的rAAV基因组的示例性核酸构建体,所述核酸构建体包含与图4D相同的元件,不同之处在于其还包含编码具有至少1个氨基酸的间隔区的核酸,所述编码间隔区的核酸位于编码hGAA多肽的核酸和编码靶向肽(TP)(例如IGF2靶向肽)的核酸之间。图4F示出了本文公开的rAAV基因组的示例性核酸构建体,所述核酸构建体包含与图4E相同的元件,其中启动子是肝启动子,内含子序列选自MVM或HBB2内含子序列,分泌信号肽选自FN1信号肽(例如,hFN1、ratFN1)、AAT信号肽或hGAA信号肽中的任一种;靶向肽为本文公开的IGF2靶向肽,以及所述至少一个polyA序列选自hGHpA或synPA polyA序列。图4G示出了本文公开的rAAV基因组的示例性核酸构建体,所述核酸构建体包含与图4F相同的元件,不同之处在于其中IGF2靶向肽为选自SEQ ID NO:2(IGF2Δ2-7)、SEQ ID NO:3(IGF2Δ1-7)或SEQ ID NO:4(IGF2V43M)的核酸序列。
图5A-图5G示出了rAAV基因组的示例性核酸构建体。图5A是示例性rAAV基因组的简图,所述rAAV基因组包含5'ITR、可操作地连接至编码hGAA多肽的核酸的肝特异性启动子、polyA序列(例如,hGHpA、synPA、RBG或SV40polyA序列中的任一种或多种)以及3'ITR。图5B是示例性rAAV基因组的简图,所述rAAV基因组包含:5'ITR,可操作地连接至编码信号分泌肽(例如,选自FN1、AAT或同源GAA信号肽、IL2、mutIL2、IgG中的任一种)的核酸的肝特异性启动子,编码人GAA多肽的核酸和polyA序列以及3'ITR。图5C是示例性rAAV基因组的简图,所述rAAV基因组包含:5'ITR,可操作地连接至内含子序列(例如,MVM、SV40或HBB2内含子序列)的肝特异性启动子,编码信号分泌肽(例如,选自FN1、AAT或同源GAA信号肽、IL2、mutIL2、IgG中的任一种)的核酸,编码人GAA多肽的核酸和polyA序列以及3'ITR。图5D是与图5C相似的构建体的简图,其包括位于编码GAA的核酸的3'端与至少一个polyA序列(例如,hGHpA和/或synPA polyA序列)之间的胶原蛋白稳定性(CS)序列或3'UTR。在一些实施方式中,所述构建体包含本文公开的CS序列和3'UTR序列二者。在一些实施方式中,可以通过本文公开的3'UTR序列替换CS序列。在图5A-图5D中,示例性的肝特异性启动子可选自本文表4中公开的那些中的任一种,并且包括但不限于SEQ ID NO:86、SEQ ID NO:91-SEQ ID NO:96或SEQ ID NO:146-SEQ ID NO:150,或与SEQ ID NO:86、SEQ ID NO:91-SEQ ID NO:96或SEQID NO:146-SEQ ID NO:150具有至少85%序列同一性的序列。图5E是AAV载体的一个实施方式的简图,所述AAV载体用于本文公开的方法和组合物中来治疗庞贝氏病,所述AAV载体包含位于5'ITR和3'ITR序列之间的核酸,所述核酸以5'至3'方向包含:LSP启动子、kozak序列、信号序列(图5E中被称为前导序列)、编码hGAA的核酸以及polyA序列。在一些实施方式中,前导序列可以选自如下中的任一种:固有的GAA前导序列、IL2前导序列(IL2wt)、经修饰的IL2前导序列(IL2mut)或IgG前导序列、或其功能变体;并且hGAA序列可以选自共有hGAA核酸序列、或至少具有H201L突变或本文公开的其它修饰(例如H199R、R223H)的hGAA核酸。图5F是用于本文公开的方法和组合物中来治疗庞贝氏病的AAV载体的另一实施方式的简图,所述AAV载体以5'至3'的方向包含:肝特异性启动子、内含子序列、kozak序列、信号序列(也被称为前导序列)、IGF2靶向肽序列(在图5F中被称为“GILT”)、编码hGAA的核酸、任选的3'UTR序列、以及poly A序列,该图示出了不同的实施方式,例如,启动子可以选自本文公开的任何LSP(例如具有不同表达水平的LSP,如高表达水平的LSP(LSP-H)、中等表达水平的LSP(LSP-M)或低表达水平的LSP(LSP-L));内含子序列可选自HBB2、MVM、SV40等内含子序列;前导序列可选自以下中的任一项:固有的GAA前导序列、AAT序列(在图5F中被称为A1AT)、IL2(1-3)、IL2前导序列(IL2wt)、经修饰的IL2前导序列(IL2mut)、纤连蛋白(FN1,在图5F中被称为FBN)、或IgG前导序列或它们的功能变体;IGF2靶向肽序列选自本文所述的任何IGF2靶向肽(例如,WT IGF2(SEQ ID NO:1)、Δ2-7、V43M(SEQ ID NO:9)、Δ2-7V43M或它们的功能变体);并且hGAA核酸序列如本文公开的经密码子优化(例如C1-10,其还可任选地包含至少H201L突变和/或本文所公开的其它修饰(例如H199R、R223H)),以及polyA序列选自例如RBG或SV40polyA。命名为LSP-H、M-LSP和LSP-L的LSP代表肝特异性启动子,其主要且优先在肝脏中表达hGAA,但可以在一种或多种其它组织(例如肌肉中)表达hGAA。此类LSP使得能够在肝脏中表达以供全身分泌和肌肉细胞摄取,以及使得能够在肌肉组织中进行的一些表达。图5G示出了用于本文公开的治疗庞贝氏病的方法和组合物中的AAV载体构建体的不同实施方式的简图,其中的构建体1(上子图)示出了rAAV载体构建体,所述rAAV载体构建体以5'至3'的方向包含5'ITR、AAV P5启动子、肝特异性启动子(LSP)、hGAA核酸序列、截短的polyA序列(t-pA)以及3'ITR;并且构建体2(下子图)示出了示例性rAAV载体构建体,其中去除了P5AAV启动子片段,所述构建体以5'至3'的方向包含5'ITR、肝特异性启动子(LSP)、hGAA核酸序列、全长polyA序列(fl-pA)、反义方向的终止子序列和(有义方向的)3'ITR。
图6示出了用以生成如本文公开的rAAV基因组的Gibson克隆技术的示意图。具体而言,进行三重连接来将3个核酸序列区块(block)连接在一起,然后可将所述区块克隆到具有启动子(例如肝特异性启动子)以及5'ITR和3'ITR的载体中以生成rAAV基因组。将Gibson克隆方法用于生成以下的rAAV基因组:SEQ ID NO:57(AAT-V43M-wtGAA(delta1-69aa));SEQ ID NO:58(ratFN1-IGF2V43M-wtGAA(delta1-69aa);SEQ ID NO:59(hFN1-IGF2V43M-wtGAA(delta1-69aa));SEQ ID NO:60(AAT-IGF2Δ2-7-wtGAA(delta 1-69));SEQ ID NO:61(FN1rat-IGFΔ2-7-wtGAA(delta 1-69));SEQ ID NO:62(hFN1-IGFΔ2-7-wtGAA(delta 1-69))。
图7示出了使用核酸序列区块(1、2和3)的Gibson克隆,生成包含AAT-V43M-wtGAA(delta1-69aa)的SEQ ID NO:57的示例性rAAV基因组。本领域普通技术人员可以容易地用本文表4中公开的任何肝特异性启动子替换TTR肝启动子,包括但不限于选自SEQ ID NO:86、SEQ ID NO:91-SEQ ID NO:96、SEQ ID NO:146-SEQ ID NO:150、或其功能变体或功能片段中的任一项的启动子。AAT-V43M-wtGAA(delta1-69aa)载体中还示出了3个氨基酸(3aa)的间隔区核酸序列(将示例性3aa序列“G-A-P”示出为SEQ ID NO:31)和填充区(stuffer)核酸序列(在图8中称为“间隔区”序列)的位置,所述间隔区核酸序列位于编码IGF2(V43M)靶向肽的核酸序列的3'端和编码wtGAA(Δ1-69)酶的核酸的5'端,所述填充区核酸序列位于poly A序列的3'端和3'ITR序列的5'端。
图8示出了使用核酸序列区块(8、2和3)的Gibson克隆,生成包含hFN1-IGFΔ2-7-wtGAA(delta 1-69)的SEQ ID NO:62的rAAV基因组。本领域普通技术人员可以容易地用本文表4中公开的任何肝特异性启动子替换TTR肝启动子,包括但不限于选自SEQ ID NO:86、SEQ ID NO:91-SEQ ID NO:96、SEQ ID NO:146-SEQ ID NO:150、或其功能变体或功能片段中的任一项的启动子。hFN1-IGFΔ2-7-wtGAA(delta 1-69)载体中还示出了3个氨基酸(3aa)的间隔区核酸序列(将示例性3aa序列“G-A-P”示出为SEQ ID NO:31)和填充区核酸序列(在图13中称为“间隔区”序列)的位置,所述间隔区核酸序列位于编码IGFΔ2-7靶向肽的核酸序列的3'端和编码wtGAA(Δ1-69)酶的核酸的5'端,所述填充区核酸序列位于poly A序列的3'端和3'ITR序列的5'端。
图9A-图9F示出了表达野生型GAA的示例性的rAAV基因组构建体的示意图。图9A示出了候选1_AAT_hIGF2-V43M_wtGAA_del1-69_Stuffer.V02(SEQ ID NO:79)的示例性rAAV基因组构建体的示意图。图9B示出了候选2_FIBrat_hIGF2-V43M_wtGAA_del1-69_Stuffer.V02(SEQ ID NO:80)的示例性rAAV基因组构建体的示意图。图9C示出了候选3_FIBhum_hIGF2-V43M_wtGAA_del1-69_Stuffer.V02(SEQ ID NO:81)的示例性rAAV基因组构建体的示意图。图9D示出了候选4_AAT_GILT_wtGAA_del1-69__Stuffer.V02(SEQ ID NO:82)的示例性rAAV基因组构建体的示意图。图9E示出了候选5_FIBrat_GILT_wtGAA_del1-69_Stuffer.V02(SEQ ID NO:83)的示例性rAAV基因组构建体的示意图。图9F示出了候选6_FIBhum_GILT_wtGAA_del1-69_Stuffer.V02(SEQ ID NO:84)的示例性rAAV基因组构建体的示意图。本领域普通技术人员可以容易地将图9A-图9F中示出的TTR肝启动子替换为任何LPS,例如本文表4中公开的任何肝特异性启动子,包括但不限于选自SEQ ID NO:86、SEQ IDNO:91-SEQ ID NO:96、或SEQ ID NO:146-SEQ ID NO:150中的任一项的启动子。此外,可以将TTR启动子替换为LSP,所述LSP可以在肝脏中以及也在至少一种其它的感兴趣的组织(例如肌肉或CNS)中优先地表达hGAA多肽,并且在一些实施方式中,可以将TTR启动子替换为可在肝脏以及肌肉和CNS组织中优先地表达hGAA多肽的LSP。在一些实施方式中,所表达的溶酶体酶(例如GAA蛋白)可以被配置为具有靶向序列(例如本文公开的将GAA蛋白靶向至溶酶体和/或融合至信号肽(SP)的IGF2靶向肽)的GAA融合蛋白,所述GAA蛋白由肝脏中的rAAV基因组表达,在肝脏中其被分泌并被哺乳动物细胞(特别是肌肉细胞)的溶酶体摄取。
由于这些仅为用于说明目的的示例性构建体,人们也可以容易地用本文公开的经密码子优化的序列或本文公开的已被修饰以减少CpG岛和/或降低固有免疫的GAA序列(参见图11B)来替换wtGAA序列。
图10示出了由示例性肝特异性启动子SP0244和SP0239驱动的小鼠中的平均体内荧光素酶表达。将所述表达水平示出为平均生物发光强度总通量(以每秒的光子计)。误差棒是平均值的标准误差。当动物只被注射盐水(n=10)时,没有检测到荧光素酶生物发光。当动物被注射包含可操作地连接至LP1启动子(n=9)的荧光素酶的构建体时,检测到了荧光素酶生物发光。为了测试示例性肝特异性启动子的活性,对动物注射包含可操作地连接至SP0244启动子(n=8)和SP0239启动子(n=10)的荧光素酶的等效构建体。启动子SP0244和SP0239显示出比对照LP1更高的体内荧光素酶表达。
图11A-图11D示出了对编码GAA多肽的核酸序列和核酸构建体(用以优化在体内通过AAV进行的GAA蛋白表达)的示例性修饰。图11A示出了野生型GAA(wtGAA)核苷酸序列的简图,其可操作地连接至本文公开的肝特异性启动子(例如具有由箭头示出的可变阅读框(alternative reading frame)和三个CpG岛的表4的LSP)。图11B示出了类似于图11A的简图,该图更详细地示出用于去除CpG岛的对编码GAA的核酸序列的修饰。图11C示出了对SEQID NO:182的wtGAA核酸序列的修饰,所述序列已被修饰以(i)减少可变阅读框、(ii)减少CpG岛的数量、以及(iii)包括对最优Kozak序列的修饰。图11D是示出用以减少可变阅读框、CpG岛的数量和对最优Kozak序列进行修饰的编码GAA多肽的核酸序列中的修饰的另一简图。
图12示出了包含用于在肝特异性启动子下表达GAA的LSP的示例性rAAV构建体的简图。LSP可以选自具有或不具有填充区序列的本文表4中公开的任何肝特异性启动子。
图13A-图13B示出了Huh 7细胞和HEPG2细胞中的包含肝特异性启动子SP0412和SP0422的构建体的GAA表达。图13A示出了Huh 7细胞中的包含肝特异性启动子SP0412(SEQID NO:91)和SP0422(SEQ ID NO:92)的构建体的GAA表达的蛋白质印迹。图13A示出与使用LP1启动子(SEQ ID NO:432)(被称为“LSP SS”)的表达相比,使用启动子412(SEQ ID NO:91)和422(SEQ ID NO:92)的hGAA的表达使得Huh 7细胞中的hGAA的表达显著更高。图13B示出了HEPG2细胞中的包含肝特异性启动子SP0412(SEQ ID NO:91)和SP0422(SEQ ID NO:92)的构建体的GAA表达的蛋白质印迹。GAA多肽由使用以下质粒生成的rAAV所表达:LSP NEW(SEQ ID NO:160)、412NEW(SEQ ID NO:159)、TTR NEW(SEQ ID NO:155)、LSP ss(具有LP-1的AAV)、412TTR、422填充区(SEQ ID NO:158)、422TTR、412填充区(SEQ ID NO:156)。图13B示出了与使用LP1启动子(SEQ ID NO:432)(被称为“LSP SS”)的表达相比,使用启动子412(SEQ ID NO:91)和422(SEQ ID NO:92)的hGAA的表达使得HepG2细胞中的hGAA表达显著更高。
上述的附图示出了本发明在至少一个示例性实施方式中的方面,在以下描述中进一步详细地定义了本发明的方面。根据一个或多个实施方式,在不同附图中由相同数字指代的本发明的特征、要素和方面表示相同、等同或相似的特征、要素或方面。
具体实施方式
本文所述的公开内容大体上涉及用于基因治疗的重组AAV(rAAV)载体和rAAV基因组的构建体,以将溶酶体蛋白(例如GAA多肽)递送至受试者。具体而言,本文描述的技术大体上涉及用于产生溶酶体蛋白(例如GAA多肽)的rAAV载体或rAAV基因组,所述GAA多肽在肝脏中表达并且有效地靶向至哺乳动物细胞(例如人心肌和骨骼肌细胞)的溶酶体。例如,该技术涉及用于转导肝细胞的rAAV载体,其中,经转导的肝细胞分泌GAA多肽,并且所分泌的GAA多肽靶向至骨骼肌组织、心肌组织、膈肌组织或它们的组合中的溶酶体。
因此,本文描述的技术的一个方面提供了包含rAAV基因组的rAAV载体,所述rAAV载体可用于产生溶酶体蛋白(例如GAA或经修饰的GAA),所述GAA更有效地从细胞(例如肝细胞)分泌,然后靶向至哺乳动物细胞(例如人的心肌和骨骼肌细胞)的溶酶体。
具体而言,在一些实施方式中,溶酶体蛋白(例如GAA多肽)由自身表达。在一些实施方式中,溶酶体蛋白作为融合蛋白表达,所述融合蛋白至少包含促进溶酶体蛋白(例如GAA多肽)从肝脏分泌的信号肽。在一些实施方式中,GAA多肽或经修饰的GAA作为融合蛋白表达,所述融合蛋白至少包含促进GAA多肽从肝脏分泌的信号肽,以及还包含使得能够有效靶向至哺乳动物细胞(例如肌肉细胞,例如人的心肌和骨骼肌细胞)中的溶酶体的靶向序列。在一些实施方式中,靶向肽是本文所述的IGF2靶向肽。
本文所述技术的一个方面涉及用于治疗疾病(例如庞贝氏病)以及进一步地用于庞贝氏病的治疗的rAAV载体,所述rAAV载体包含含有反向末端重复序列(ITR)的核苷酸序列、肝特异性启动子、异源基因、poly-A尾和可能的其它调节元件,其中,所述异源基因是GAA,并且其中,rAAV GAA可以以治疗有效剂量向患者给予,其被递送至适当的组织和/或器官以用于表达异源基因和治疗疾病。
本文所述技术的一个方面涉及一种rAAV载体,所述rAAV载体在其基因组中以5'至3'的方向包含:5'-和3'-AAV反向末端重复(ITR)序列,以及位于5'ITR和3'ITR之间的编码α-葡萄糖苷酶(GAA)多肽的异源核酸序列,其中,所述异源核酸可操作地连接至肝特异性启动子(例如本文表4中公开的肝特异性启动子)或其功能变体。本文所述技术的另一方面涉及一种rAAV载体,所述rAAV载体在其基因组中以5'至3'的方向包含如下:5'-和3'-AAV反向末端重复(ITR)序列、以及位于5'ITR和3'ITR之间的编码分泌信号肽(SS)的异源核酸序列、编码α-葡萄糖苷酶(GAA)多肽的核酸序列,其中,所述异源核酸可操作地连接至肝特异性启动子(例如本文表4中公开的肝特异性启动子)或其功能变体。
本文所述的技术的一个方面涉及一种rAAV载体,所述rAAV载体在其基因组中以5'至3'的方向包含如下:5'-和3'-AAV反向末端重复(ITR)序列,以及位于5'ITR和3'ITR之间的编码融合多肽的异源核酸序列,所述融合多肽包含(i)分泌信号肽(SS)、(ii)IGF2靶向肽、以及(iii)α-葡萄糖苷酶(GAA)多肽,其中,所述异源核酸可操作地连接至肝特异性启动子(例如本文表4中公开的肝特异性启动子)或其功能变体。
在本文所述技术的所有实施方式的所有方面中,肝特异性启动子在肝脏中优先地表达溶酶体蛋白(例如hGAA多肽)。在本文所述技术的所有实施方式的所有方面中,肝特异性启动子在肝脏以及至少一种其它感兴趣的组织(例如肌肉或CNS)中优先地表达溶酶体蛋白(例如hGAA多肽),并且在一些实施方式中,可以将LSP替换为能够在肝脏以及肌肉和CNS组织中优先地表达hGAA多肽的LSP。在本文所述技术的所有实施方式的所有方面中,在AAV载体包含靶向肌肉的至少一种衣壳蛋白的一些实施方式中,可以将肝特异性启动子替换为另一启动子(例如肌肉启动子)。
在本文公开的方法和组合物的一些实施方式中,分泌信号肽选自AAT信号肽、纤连蛋白信号肽(FN1)、GAA信号肽或它们的具有分泌信号活性的活性片段中的任一种。
在一些实施方式中,本文所述的rAAV载体来自任意血清型。在一些实施方式中,rAAV载体是AAV3b血清型,包括但不限于AAV3b265D病毒体、AAV3b265D549A病毒体、AAV3b549A病毒体、AAV3bQ263Y病毒体或AAV3bSASTG病毒体(即,包含含有Q263A/T265突变的AAV3b衣壳的病毒体)。在一些实施方式中,rAAV载体包含肝特异性衣壳,例如选自WO2019/241324中公开的XL32和XL32.1的肝特异性衣壳,通过引用的方式将其整体并入本文。在一些实施方式中,rAAV载体是WO2019/241324中公开的AAVXL32或AAVXL32.1,通过引用的方式将其整体并入本文。在一些实施方式中,rAAV载体是rAAV8载体、或是包含来自AAV8(即,VP1、VP2或VP3中的任一种或多种来自AAV8或其嵌合蛋白)的至少一种衣壳蛋白的单倍体rAAV载体。在一些实施方式中,AAV载体包含在WO2019241324A1或国际专利申请PCT/US2019/036676中公开的衣壳,通过引用的方式将它们整体并入本文。在一些实施方式中,AAV载体包含由核酸AAV衣壳编码序列编码的衣壳,所述核酸AAV衣壳编码序列与WO2019241324A1中公开的SEQ ID NO:1-SEQ ID NO:3中的任一项的核苷酸序列或(b)编码WO2019241324A1中公开的SEQ ID NO:4-SEQ ID NO:6中的任一项的核苷酸序列至少90%相同。在一些实施方式中,AAV衣壳包含与WO2019241324A1中公开的SEQ ID NO:4-SEQ ID NO:6中的任一项至少90%相同的氨基酸序列,以及AAV颗粒包含本发明的AAV衣壳和AAV载体基因组。在一些实施方式中,rAAV载体包含衣壳蛋白,使得所述AAV载体能够转导肝细胞,并且在一些实施方式中,rAAV载体包含衣壳蛋白,使得AAV载体能够转导肌肉细胞和肝细胞。在此类实施方式中,当rAAV包含能够转导肌肉细胞的衣壳蛋白时,可以将LSP替换为另一启动子(例如肌肉启动子,或在肝细胞和肌肉细胞中表达蛋白质的启动子)。
I.定义
在本文的说明书和所附权利要求书中使用以下术语:
除非本文另有说明或与上下文明显矛盾,在描述本发明的上下文中(特别是在如下权利要求的上下文中)使用的术语“一个/一种(a/an)”、“该/所述(the)”和类似的提法应解释为涵盖单数和复数两者。此外,除非另外特别说明,用于标识要素的顺序指示符(例如“第一”、“第二”、“第三”等)用于区分要素,而不指出或暗示此要素的所需的数量或受限的数量,并且不指出此类元件的特定位置或顺序。除非本文中另有指出或与上下文明显矛盾,否则本文描述的所有方法可以以任意合适的顺序施行。本文提供的任意和所有实例或示例性语言(例如,“如(such as)”)的使用,仅旨在更好地阐明本发明,而不对以其它方式请求保护的本发明的范围构成限制。本说明书中的任何语言都不应被解释为指出实施本发明必不可少的任何未请求保护的要素。
此外,在提及如多核苷酸或多肽序列的长度、剂量、时间、温度等的量的可测量值时,本文所使用的术语“约”意在涵盖所指明量的±20%、±10%、±5%、±1%、±0.5%或甚至±0.1%的变化。
还如本文所使用的,“和/或”是指并涵盖相关的列出的项中的一个或多个的任意和所有可能的组合,以及当以替代方式(“或”)解释时是指并涵盖组合的缺少。
如本文所使用的,过渡性短语“基本上由……组成”意味着权利要求的范围将被解释为涵盖权利要求中的指明的材料或步骤,以及“对所请求保护的发明的基本特性和新颖性特性没有实质影响的那些材料或步骤”。参见In re Herz,537 F.2d 549,551-52,190USPQ 461,463(CCPA 1976)(原文中强调);另请参见MPEP§2111.03。因此,当在本发明的权利要求中使用时,术语“基本上由……组成”不旨在被解释为等同于“包括(comprising)”。除非上下文另有说明,否则特别意指可以以任意组合使用本文所述发明的各种特征。
此外,本发明还考虑的是在本发明的一些实施方式中,可以排除或省略本文所述的任何特征或特征的组合。
为了进一步说明,例如,如果说明书指出特定的氨基酸可以选自A、G、I、L和/或V,则该语言还指出该氨基酸可以选自这些氨基酸的任何子集:例如A、G、I或L;A、G、I或V;A或G;只有L等,视如每个此类子组合均在本文中明确阐明。此外,此类语言还指出可以放弃一个或多个指明的氨基酸(例如,通过否定的但书)。例如,在具体的实施方式中,氨基酸不是A、G或I;不是A;不是G或V等,视如每个此类可能的放弃均在本文中明确阐明。
如本文所使用的术语“细小病毒”涵盖细小病阐明(Parvoviridae),包括自主复制细小病毒和依赖病毒。自主细小病毒包括细小病毒属(Parvovirus)、红细胞病毒属(Erythrovirus)、浓核病毒属(Densovirus)、艾特拉病毒属(Iteravirus)和艾特拉病毒属(Contravirus)的成员。示例性自主细小病毒包括但不限于小鼠微小病毒、牛细小病毒、犬细小病毒、鸡细小病毒、猫泛白细胞减少症病毒、猫细小病毒、鹅细小病毒、H1细小病毒、番鸭细小病毒、B19病毒以及目前已知或今后发现的任何其它自主细小病毒。其它自主细小病毒是本领域技术人员已知的。参见例如,BERNARD N.FIELDS等,VIROLOGY,第2卷,第69章(第4版,Lippincott-Raven Publishers)。
如本文所使用的,术语“腺相关病毒”(AAV)包括但不限于AAV 1型、AAV 2型、AAV 3型(包括3A型和3B型)、AAV 4型、AAV 5型、AAV 6型、AAV 7型、AAV 8型、AAV 9型、AAV 10型、AAV 11型、禽类AAV、牛类AAV、犬类AAV、马类AAV、羊类AAV和目前已知或今后发现的任何其它AAV。参见例如,BERNARD N.FIELDS等,VIROLOGY,第2卷,第69章(第4版,Lippincott-Raven Publishers)。已经鉴定出许多相对新的AAV血清型和进化枝(参见例如,Gao等,(2004)J.Virology 78:6381-6388;Moris等,(2004)Virology 33-:375-383);以及还参见在2019年11月19日提交的美国临时申请62,937,556中公开的表1以及国际申请WO2020/102645和WO2020/102667中的表1,将它们各自以其整体并入本文。
本领域已知自主细小病毒和AAV的多种血清型的基因组序列、以及天然反向末端重复序列(ITR)、Rep蛋白和衣壳亚基的序列。此类序列可见于文献或公共数据库(如GenBank)中。参见例如GenBank登录号NC_002077、NC_001401、NC_001729、NC_001863、NC_001829、NC_001862、NC_000883、NC_001701、NC_001510、NC_006152、NC_006261、AF063497、U89790、AF043303、AF028705、AF028704、J02275、J01901、J02275、X01457、AF288061、AH009962、AY028226、AY028223、NC_001358、NC_001540、AF513851、AF513852、AY530579;以引用的方式将其公开内容并入本文,以教导细小病毒以及AAV核酸和氨基酸序列。还参见例如,Srivistava等,(1983)J Virology 45:555;Chiarini等,(1998)J.Virology 71:6823;Chiarini等,(1999)J.Virology 73:1309;Bantel-Schaal等,(1999)J.Virology 73:939;Xiao等,(1999)J.Virology 73:3994;Muramatsu等,(1996)Virology 221:208;Shade等,(1986)J.Viral.58:921;Gao等,(2002)Proc.Nat.Acad.Sci.USA 99:11854;Morris等,(2004)Virology 33-:375-383;国际专利公开WO 00/28061,WO 99/61601,WO 98/11244;以及美国专利No.6,156,303;以引用的方式将其公开内容并入本文,以教导细小病毒以及AAV核酸和氨基酸序列。还参见在2019年11月19日提交的62,937,556中公开的表1和表5或者国际申请WO2020/102645和WO2020/102667中公开的表1,将它们各自以其整体并入本文。自主细小病毒和AAV的衣壳结构更详细地描述于BERNARD N.FIELDS等,VIROLOGY,第2卷,第69&70章(第4版,Lippincott-Raven Publishers)中。还参见AAV2的晶体结构的描述(Xie等,(2002)Proc.Nat.Acad.Sci.99:10405-10)、AAV4(Padron等,(2005)J.Viral.79:5047-58)、AAV5(Walters等,(2004)J.Viral.78:3361-71)和CPV(Xie等,(1996)J.Mal.Biol.6:497-520以及Tsao等,(1991)Science 251:1456-64)。
如本文所使用的,术语“向性”是指病毒优先进入某些细胞或组织,任选地随后在细胞中表达(如转录和任选地翻译)由病毒基因组携带的序列,例如,对于重组病毒,表达感兴趣的异源核酸。
如本文所使用的,“系统性向性”和“系统性转导”(和等同的术语)指出本发明的病毒衣壳或病毒载体对整个机体的组织(例如脑、肺、骨骼肌、心脏、肝、肾和/或胰腺)表现出向性和/或进行转导。在本发明的实施方式中,观察到对中枢神经系统(例如脑、神经元细胞等)的系统性转导。在其它实施方式中,实现了对心肌组织的系统性转导。
如本文所使用的,“选择性向性”或“特异性向性”是指将病毒载体递送至某些靶细胞和/或某些组织,和/或对某些靶细胞和/或某些组织的特异性转导。
除非另有指明,否则可以通过参考合适的对照来确定“有效转导”或“有效向性”或类似术语(例如,分别为对照的转导或向性的至少约50%、60%、70%、80%、85%、90%、95%、100%、125%、150%、175%、200%、250%、300%、350%、400%、500%或更多)。在具体的实施方式中,病毒载体对于肝细胞和肌肉细胞有效转导或具有有效向性。合适的对照将取决于多种因素,包括期望的向性和/或转导概况。
类似地,可以通过参考合适的对照来确定病毒是否对于靶组织“不能有效地转导”或“不具有有效向性”或类似术语。在具体实施方式中,病毒载体不能对肾、性腺和/或生殖细胞有效地转导(即不具有有效向性)。在具体的实施方式中,组织(例如,肾)的转导(例如,非期望的转导)是期望的靶组织(例如,肝、骨骼肌、膈肌、心肌和/或中枢神经系统的细胞)的转导水平的20%以下、10%以下、5%以下、1%以下、0.1%以下。
在本发明的一些实施方式中,包含本发明的衣壳的AAV颗粒可表现出对30种特定组织/细胞的有效转导的多重表型,以及对某些组织/细胞的极低水平的转导(例如,降低的转导)(其转导是不期望的)。
除非另有指出,如本文所使用的术语“多肽”涵盖肽和蛋白质。
“多核苷酸”为核苷酸碱基的序列,并且可以是RNA、DNA或DNA-RNA杂合序列(包括天然存在和非天然存在的核苷酸两者),但在代表性的实施方式中为单链或双链DNA序列。
术语“异源核苷酸序列”和“异源核酸分子”在本文中可互换使用,并且是指非天然存在于病毒中的核酸序列。通常,异源核酸分子或异源核苷酸序列包含编码感兴趣的非翻译的RNA和/或多肽(例如,用于递送至细胞和/或受试者)的开放阅读框。
“嵌合核酸”包含共价连接在一起来编码融合多肽的两个以上的核酸序列。核酸可以是DNA、RNA或其杂合体。
术语“融合多肽”包括通常通过肽键合共价连接在一起的两个以上的多肽。
如本文所使用的,“分离的”多核苷酸(例如,“分离的DNA”或“分离的RNA”)是指至少部分地与天然存在的有机体或病毒的至少一些其它组分分离的多核苷酸,所述其它组分例如通常被发现与多核苷酸相关联的细胞或病毒结构组分或其它多肽或核酸。在代表性的实施方式中,与初始材料相比,“分离的”核苷酸富集至少约10倍、100倍、1000倍、10,000倍或更多。
同样地,“分离的”多肽是指至少部分地与天然存在的有机体或病毒的至少一些其它组分分离的多肽,所述其它组分例如通常被发现与多肽相关联的细胞或病毒结构组分或其它多肽或核酸。在代表性的实施方式中,与初始材料相比,“分离的”多肽富集至少约10倍、100倍、1000倍、10,000倍或更多。
“分离的细胞”指与其它组分分离的细胞,所述分离的细胞通常以其天然状态与所述其它组分相关联。例如,分离的细胞可为培养基中的细胞和/或本发明的药学上可接受的运载体中的细胞。因此,分离的细胞可被递送至和/或引入至受试者中。在一些实施方式中,分离的细胞可以是从受试者中移出并如本文所述进行离体操作后返回受试者的细胞。
可以通过本文所述的任何方法生成病毒体的群。在一个实施方式中,所述群是至少101个病毒体。在一个实施方式中,所述群是至少102个病毒体、至少103个病毒体、至少104个病毒体、至少105个病毒体、至少106个病毒体、至少107个病毒体、至少108个病毒体、至少109个病毒体、至少1010个病毒体、至少1011个病毒体、至少1012个病毒体、至少1013个病毒体、至少1014个病毒体、至少1015个病毒体、至少1016个病毒体或至少1017个病毒体。病毒体的群可以是异种的或可以是同种的(例如,基本上同种的或完全同种的)。
本文所使用的术语“基本上同种的群”是指大部分相同的病毒体的群,几乎不具有乃至不具有污染的病毒体(那些不相同的)。基本上同种的群具有至少90%的相同的病毒体(例如期望的病毒体),并且可以具有至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.9%的相同的病毒体。
完全同种的病毒体的群仅包含相同的病毒体。
如本文所使用的,“分离”或“纯化”(或语法等同物)病毒载体或病毒颗粒或病毒颗粒的群意味着将该病毒载体或病毒颗粒或病毒颗粒的群至少部分地与初始材料中的至少一些其它组分分离。在代表性的实施方式中,与初始材料相比,“分离的”或“纯化的”病毒载体或病毒颗粒或病毒颗粒的群富集至少约10倍、100倍、1000倍、10,000倍或更多。
除非另有说明,否则可以通过参考合适的对照来确定“有效转导”或“有效向性”或类似术语(例如分别为对照的转导或向性的至少约10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、100%、125%、150%、175%、200%、250%、300%、350%、400%、500%或更多)。在具体的实施方式中,病毒载体对于神经元细胞和心肌细胞有效转导或具有有效向性。合适的对照将取决于多种因素,包括期望的向性和/或转导概况。
“治疗性多肽”是能够缓解、减少、预防、延迟和/或稳定由细胞或受试者中蛋白质缺乏或缺陷引起的症状的多肽,和/或是在其它方面赋予受试者益处的多肽,所述益处例如,酶替代以减少或消除疾病症状,或移植存活率的改善或免疫应答的诱导。
术语“异源核苷酸序列”和“异源核酸分子”在本文中可互换使用,并且指非天然存在于病毒中的核酸序列。通常,异源核酸分子或异源核苷酸序列包含开放阅读框,所述开放阅读编码感兴趣的多肽和/或非翻译的RNA(例如,用于递送至细胞和/或受试者),例如GAA多肽。
如本文所使用的,术语“病毒载体”、“载体”或“基因递送载体”是指作为核酸递送媒介物起作用、并且包含包装在病毒体中的载体基因组(例如病毒DNA[vDNA])的病毒(例如,AAV)颗粒。或者,在某些情况下,术语“载体”可用于指单独的载体基因组/vDNA。
“rAAV载体基因组”或“rAAV基因组”是包含一个或多个异源核酸序列的AAV基因组(即vDNA)。rAAV载体通常只需要处于顺式的反向末端重复序列(TR)以产生病毒。所有其它病毒序列都是非必需的,并且可以以反式提供(Muzyczka,(1992)Curr.TopicsMicrobiol.Immunol.158:97)。通常,rAAV载体基因组将仅保留一个或多个TR序列,以使能够被载体有效包装的转基因的大小最大化。结构蛋白和非结构蛋白编码序列可以以反式提供(例如来自载体,例如质粒;或通过将序列稳定整合到包装细胞中)。在本发明的实施方式中,rAAV载体基因组包含至少一个ITR序列(例如,AAV TR序列),任选地为两个ITR(例如两个AAV TR),其通常将位于载体基因组的5'和3'端并侧接异源核酸,但不必与其邻接。TR可以彼此相同或不同。
术语“末端重复序列”或“TR”包括任何病毒末端重复序列或形成发夹结构并起到反向末端重复序列作用的合成序列(即介导期望的功能(例如复制、病毒包装、整合和/或原病毒拯救等)的ITR)。TR可以是AAV TR或非AAV TR。例如,非AAV TR序列(例如其它细小病毒(例如犬细小病毒(CPV)、小鼠细小病毒(MVM)、人细小病毒B-19)的非AAV TR序列)或可以用作TR的任何其它合适的病毒序列(例如充当SV40复制的起点的SV40发夹),其可以通过截短、置换、缺失、插入和/或添加而被进一步修饰。此外,TR可以是部分或完全合成的,例如Samulski等的美国专利号5,478,745中所述的“双D序列”。
“AAV末端重复序列”或“AAV TR”(包括“AAV反向末端重复序列”或“AAV ITR”)可以来自任何AAV,包括但不限于血清型1、2、3、4、5、6、7、8、9、10、11或12或目前已知或今后发现的任何其它AAV。AAV末端重复序列不必具有天然的末端重复序列(例如,可以通过插入、缺失、截短和/或错义突变来改变天然的AAV TR或AAV ITR序列),只要该末端重复序列介导期望的功能(例如复制、病毒包装、整合和/或原病毒拯救等)即可。
AAV蛋白VP1、VP2和VP3是一起相互作用而形成二十面体对称的AAV衣壳的衣壳蛋白。VP1.5是美国公开号2014/0037585中描述的AAV衣壳蛋白。
本发明的病毒载体还可为国际专利公开WO 00/28004和Chao等,(2000)MolecularTherapy 2:619中描述的“靶向的”病毒载体(例如,具有指定的向性)和/或“杂合的”细小病毒(即,其中病毒TR和病毒衣壳来自不同的细小病毒)。
本发明的病毒载体可以进一步为如国际专利公开WO 01/92551(其公开内容通过引用的方式整体并入本文)中所述的双链体的细小病毒颗粒。因此,在一些实施方式中,可以将双链(双链体)基因组包装到本发明的病毒衣壳中。
此外,病毒衣壳或基因组元件可包含其它修饰,包括插入、缺失和/或置换。
本文所使用的“嵌合的”衣壳蛋白意指通过如下进行修饰的AAV衣壳蛋白(例如VP1、VP2或VP3中的任一种或多种):相对于野生型而言的衣壳蛋白的氨基酸序列中的一个或多个(例如2个、3个、4个、5个、6个、7个、8个、9个、10个等)氨基酸残基的置换,以及相对于野生型而言的氨基酸序列中的一个或多个(例如2个、3个、4个、5个、6个、7个、8个、9个、10个等)氨基酸残基的插入和/或缺失。在一些实施方式中,来自一种AAV血清型的完整或部分的结构域、功能区域、表位等可以以任意组合替代不同的AAV血清型的相应的野生型结构域、功能区域、表位等,以产生本发明的嵌合衣壳蛋白。嵌合的衣壳蛋白的产生可以根据本领域公知的方案进行,并且文献以及本文中已经描述了可被包含在本发明的衣壳中的大量的嵌合的衣壳蛋白。
如本文所使用的,术语“单倍体AAV”应意指国际申请WO2018/170310或美国申请US2018/037149中描述的AAV,通过引用的方式将它们以其整体并入本文。在一些实施方式中,病毒体的是单倍体AAV的群,在其中可以构建病毒体颗粒,其中来自于由AAV衣壳蛋白VP1、VP2和VP3所组成的组中的至少一种病毒蛋白不同于其它病毒蛋白的至少一种,该蛋白被需要以形成能够包裹AAV基因组的病毒体颗粒。对于存在的每种病毒蛋白(VP1、VP2和/或VP3),所述蛋白是相同类型(例如,都是AAV2VP1)。在一种情况下,至少一种病毒蛋白是嵌合的病毒蛋白并且其它两种病毒蛋白中的至少一种不是嵌合的。在一个实施方式中,VP1和VP2是嵌合的,并且只有VP3是非嵌合的。例如,仅来自嵌合的AAV2/8(AAV2的N-末端和AAV8的C-末端)的VP1/VP2所组成的病毒颗粒与仅来自AAV2的VP3配对;或仅嵌合的VP1/VP228m-2P3(AAV8的N-末端和AAV2的C-末端,不具有VP3起始密码子突变)与仅来自AAV2的VP3配对。在另一实施方式中,只有VP3是嵌合的,而VP1和VP2是非嵌合的。在另一实施方式中,至少一种病毒蛋白来自完全不同的血清型。例如,仅嵌合的VP1/VP2 28m-2P3与仅来自AAV3的VP3配对。在另一实例中,不存在嵌合体。
术语“杂合的”AAV载体或细小病毒是指其中病毒TR或ITR和病毒衣壳来自不同细小病毒的rAAV载体。杂合载体描述于国际专利公开WO 00/28004和Chao等,(2000)Molecular Therapy 2:619。例如,杂合AAV载体通常包含足以进行腺病毒复制和包装的腺病毒5'和3'顺式ITR序列(即,腺病毒末端重复序列和PAC序列)。
术语“多倍体AAV”是指由来自两种以上的AAV血清型的衣壳所组成的AAV载体,例如并且可以利用各个血清型进行更强的转导,而不会在某些实施方式中消除来自亲本的向性。
如本文所使用的术语“GAA”或“GAA多肽”涵盖成熟的(~76或~67kDa)GAA和前体(例如,~110kDa)GAA,以及经修饰的(例如,通过插入、缺失和/或置换而突变或截短的)GAA蛋白或其保留生物学功能的片段(即,具有天然GAA蛋白的至少一种生物学活性,例如如上定义的可以水解糖原)和GAA变体(例如,由Kunita等,(1997)Biochemica et BiophysicaActa 1362:269描述的GAA II;GAA多晶型和SNP描述于Hirschhorn,R.和Reuser,A.J.(2001)The Metabolic and Molecular Basis for Inherited Disease(Scriver,C.R.,Beaudet.A.L.,Sly,W.S.&Valle,D.编著),pp.3389-3419,McGraw-Hill,New York,参见第3403-3405页;以引用的方式将各自以其整体并入本文)。可以使用本领域中已知的任何GAA编码序列,例如参见图8和图9的编码序列;GenBank登录号NM_00152和Hoefsloot等,(1988)EMBO J.7:1697和Van Hove等,(1996)Proc.Natl.Acad.Sci.USA 93:65(人),GenBank登录号NM_008064(小鼠),以及Kunita等,(1997)Biochemica et Biophysics Acta 1362:269(鹌鹑);由于它们对GAA编码和非编码序列的教导而以引用的方式将其公开内容并入本文。
术语“阳离子非依赖甘露糖-6-磷酸受体(CI-MPR)”、“M6P/IGF-II受体”、“CI-MPR/IGF-II受体”、“IGF-II受体”或“IGF2受体”或它们的缩写在本文中可互换使用,是指结合M6P和IGF-II二者的细胞受体。
如本文所使用的,术语“靶向肽”也称为“靶向序列”,旨在指靶向特定亚细胞区室(例如哺乳动物的溶酶体)的肽。被涵盖以用于本文的靶向肽是不依赖于甘露糖-6-磷酸的溶酶体靶向肽。示例性靶向序列是本文公开的IGF2靶向肽。
术语“IGF2序列”与“IGF2靶向序列”一起使用,或者“IGF2前导序列”和“IGF2靶向肽”在本文中可互换使用,并且是指结合至细胞表面上的CI-MBR的IGF2多肽的序列。具体而言,IGF2序列是包含SEQ ID NO:5的IGF2摄取(uptake)序列的部分或在SEQ ID NO:5的氨基酸中包含修饰的肽。IGF2靶向肽是指结合至受体结构域的肽序列,所述结构域基本上由人阳离子非依赖甘露糖-6-磷酸受体(CI-MPR或CA-M6P受体)的第1508-1566位氨基酸、重复序列11-12或重复序列11组成。
术语“前导序列”在本文中可与术语“分泌信号序列”或“信号序列”或“信号肽”或其变体互换使用,并且旨在指如下的氨基酸序列:与以天然多肽所见的分泌水平相比,所述氨基酸序列发挥作用以增强(如上文所定义的)来自细胞的可操作连接的多肽(例如GAA肽或IGF2-GAA融合蛋白)的分泌。如上文所定义的,“增强的”分泌意味着细胞分泌的、由细胞合成的溶酶体多肽的相对比例增加;分泌蛋白的绝对量不必也增加。在本发明的具体实施方式中,基本上全部(即,至少95%、97%、98%、99%或更多)的GAA多肽被分泌。然而,只要与天然的GAA多肽相比分泌水平增高,就没有必要分泌基本上全部或甚至大部分的GAA多肽。示例性前导序列包括但不限于如本文所公开的固有的GAA前导序列(也被称为同源GAA前导序列)、AAT序列、IL2(1-3)、IL2前导序列(IL2wt)、经修饰的IL2前导序列(IL2mut)、纤连蛋白(FN1,也被称为FBN)或IgG前导序列或它们的功能变体。
如本文所使用的,术语“氨基酸”涵盖任何天然存在的氨基酸、其修饰形式和合成氨基酸。天然存在的左旋(L-)氨基酸在美国公开文本2018/0371496的表2中公开,该公开文本以其整体并入本文。或者,氨基酸可以是经修饰的氨基酸残基(非限制性实例示出于美国公开文本2018/0371496的表4中)和/或可以是通过翻译后修饰(例如乙酰化、酰胺化、甲酰化、羟基化、甲基化、磷酸化或硫酸化)进行修饰的氨基酸。此外,非天然存在的氨基酸可以是如Wang等,Annu Rev Biophys Biomol Struct.35:225-49(2006)中描述的“非天然”氨基酸。这些非天然氨基酸可以有利地用于将感兴趣的分子化学连接至AAV衣壳蛋白。
为了进一步说明,例如,如果说明书指出特定的氨基酸可以选自A、G、I、L和/或V,则该语言还指出该氨基酸可以选自这些氨基酸的任何子集,例如A、G、I或L;A、G、I或V;A或G;只有L等,视如每个此类子组合都在本文中明确阐明。此外,此类语言还指出可以放弃一个或多个指明的氨基酸(例如,通过否定的但书)。例如,在具体的实施方式中,氨基酸不为A、G或I;不为A;不为G或V等,视如每个此类可能的放弃都在本文中明确阐明。
术语“顺式调节元件”或“CRE”是为技术人员熟知的术语,并且意指能够调节或调控相邻基因(即顺式)的转录的核酸序列(例如增强子、启动子、绝缘子或沉默子)。CRE见于它们调节的基因附近。CRE通常通过与转录因子(TF)结合来调节基因转录,即,它们包含TF结合位点(TFBS)。单个TF可与许多CRE结合,并从而控制许多基因的表达(多效性)。CRE通常但不总是位于它们调节的基因的转录起始位点(TSS)的上游。“增强子”是增强(即上调)与它们可操作地连接的基因的转录的CRE,并且可见于它们调节的基因的上游、下游以及甚至内含子中。多个增强子可以以协调的方式来调节一个基因的转录。在这种情况下,“沉默子”涉及与被称为阻遏物的TF结合的CRE,阻遏物发挥作用来阻止或下调基因的转录。术语“沉默子”也可以指信使RNA的3'非翻译区中的区域,其结合阻遏该mRNA分子翻译的蛋白质,但这种用法不同于其在描述CRE中的用途。通常,本发明的CRE是肝特异性增强子(通常被称为肝特异性CRE,或肝特异性CRE增强子等)。在该上下文中,优选CRE位于距离转录起始位点(TSS)1500个核苷酸以下,更优选地距离TSS 1000个核苷酸以下,更优选地距离TSS 500个核苷酸以下,并且合适地距离TSS 250个、200个、150个或100个核苷酸以下。本发明的CRE优选地长度相对较短,优选长度为100个核苷酸以下,例如它们长度可为90个、80个、70个、60个核苷酸以下。
术语“顺式调节模块”或“CRM”意指由两个以上的CRE组成的功能模块;在本发明中,CRE通常是肝特异性增强子。因此,在本申请中,CRM通常包含多个肝特异性增强子CRE。通常,CRM内的多个CRE共同地(例如相加地或协同地)起作用以增强与CRM可操作地相关的基因的转录。CRM内CRE中的改组(shuffle)(即重新排序)、倒位(即反转方向)和改变间距具有保守的范围。因此,本发明的CRM的功能变体包括所引用的CRM的变体,其中它们内的CRE已经被改组和/或倒位,和/或CRE之间的间距已经改变。
如本文所使用的,短语“启动子”是指通常位于发生转录所需的待转录核酸序列上游的DNA区域,即所述DNA区域起始转录。启动子允许在其控制下的恰当激活或抑制编码序列的转录。启动子通常包含被多个TF识别和结合的特定序列。TF结合至启动子序列并引起RNA聚合酶的募集,所述RNA聚合酶是从基因的编码区合成RNA的酶。本领域已知大量的启动子。
如本文所使用的,术语“合成型启动子”涉及自然界中不存在的启动子。在该上下文中,它通常包含可操作地连接至最小(或核心)启动子或肝特异性近端启动子的本发明的合成型CRE和/或CRM。本发明的CRE和/或CRM用于增强与启动子可操作地连接的基因的肝特异性转录。合成型启动子的部分可以是天然存在的(例如最小启动子或启动子中的一个或多个CRE),但作为完整实体的合成型启动子不是天然存在的。
如本文所使用的,“最小启动子”(也称为“核心启动子”)是指自身无活性或很大程度上无活性,但在与其它转录调节元件组合时可以介导转录的短DNA片段。最小启动子序列可以源自各种不同的来源,包括原核基因和真核基因。最小启动子的实例在上文中讨论,并且包括多巴胺β-羟化酶基因最小启动子、巨细胞病毒(CMV)即刻早期基因最小启动子(CMV-MP)和疱疹胸苷激酶最小启动子(MinTK)。最小启动子通常包含转录起始位点(TSS)和直接在上游的元件、RNA聚合酶II的结合位点和一般转录因子结合位点(通常是TATA盒)。
如本文所使用的,“近端启动子”涉及最小启动子加上趋向于包含主要调节元件的基因上游的近端序列。它通常在TSS的上游延伸大约250个碱基对,并包含特定的TFBS。在本案中,近端启动子适当地是天然存在的肝特异性近端启动子,其可以与本发明的一种或多种CRE或CRM组合。然而,近端启动子可以是合成的。
在本发明的上下文中,顺式调节元件(CRE)、顺式调节模块(CRM)、启动子或其它核酸序列的“功能变体”是参考序列的变体,所述参考序列保留了以与参考序列相同的方式(例如作为肝特异性顺式调节增强子元件、肝特异性顺式调节模块或肝特异性启动子)发挥功能的能力。此类功能变体的替代术语包括“生物等效物”或“等效物”。
将理解的是,给定的顺式调节元件作为肝特异性增强子发挥功能的能力主要由序列结合与参考序列结合的相同肝特异性转录因子(TF)的能力决定。因此,在大多数情况下,顺式调节元件的功能变体将包含与参考顺式调节元件相同的TF的TFBS。优选但非必需的,功能变体的转录因子结合位点(TFBS)与参考顺式调节元件处于相同的相对位置(即顺序)。也优选但非必需的,功能变体的TFBS与参考序列的方向相同(应注意的是,TFBS在某些情况下可以以相反的方向存在,例如作为相对于参考序列中的序列的反向互补体)。优选但非必需的,功能变体的TFBS与参考序列位于相同的链上。因此,在优选的实施方式中,功能变体包含以相同的顺序、相同的方向和位于与参考序列相同的链上的用于相同TF的TFBS。还将理解的是,位于TFBS之间的序列(在某些情况下称为间隔区序列等)对顺式调节元件的功能影响较小。此类序列通常可以有相当大的不同,并且它们的长度可以改变。然而,在优选的实施方式中,间距(即相邻TFBS之间的距离)在功能变体中与它在参考序列中基本相同(例如,其差异不超过20%,优选不超过10%,更优选相同)。明显的是,在某些情况下,顺式调节增强子元件的功能变体可以以相反的方向存在,例如它可以是如上所述的顺式调节增强子元件的反向互补体、或其变体。
功能变体和参考序列之间的序列同一性水平也可以是指示物或保留的功能。顺式调节元件的TFBS中的高水平的序列同一性通常比间隔区序列(其中很少或不需要序列的任何保守性)中的序列同一性更重要。然而,将理解的是,考虑到功能性TFBS的序列不需要与共有序列完全匹配,即使在TFBS内,也可以容许相当程度的序列变异。
一种或多种TF结合至给定功能变体中的TFBS的能力可以通过本领域已知的任何相关手段来确定,包括但不限于电泳迁移测定(EMSA)、结合测定、染色质免疫沉淀(ChIP)和ChIP测序(ChIP-seq)。在优选的实施方式中,一种或多种TF结合给定的功能变体的能力由EMSA确定。进行EMSA的方法在本领域中是众所周知的。上文引用的Sambrook等中描述了合适的方法。描述此过程的许多相关文章都可用,例如Hellman和Fried,Nat Protoc.2007;2(8):1849–1861。
当涉及启动子时,术语“肝特异性”或“肝特异性表达”是指与其它组织(例如脾脏、肌肉、心脏、肺和脑)相比,顺式调节元件、顺式调节模块或启动子增强或驱动基因在肝脏中(或在源自肝脏的细胞中)以优先或主导的方式表达的能力。所述基因的表达可以处于mRNA或蛋白质的形式。在一些实施方式中,肝特异性表达使得在其它(即非肝脏)组织或细胞中的表达可忽略不计,即表达是高度肝特异性的。在一些实施方式中,虽然肝特异性启动子优先驱动在肝脏中的表达,但它也可以驱动所述基因在另一感兴趣的组织(例如肌肉)中以较低水平表达。
技术人员可以容易地评估顺式调节元件作为肝特异性顺式调节增强子元件发挥功能的能力。因此,技术人员可以容易地确定以上列举的特异性顺式调节元件的任何变体是否保持功能(即,它是如上定义的功能性变体)。例如,待评估的任何给定的顺式调节元件可以可操作地连接至最小启动子(例如,位于CMV-MP上游)并且测量了顺式调节元件驱动基因(通常是报告基因)肝特异性表达的能力。或者,可以将顺式调节增强子元件的变体置换入合成型肝特异性启动子来取代参考顺式调节增强子元件,并且可以确定由所述经修饰的启动子驱动的对肝特异性表达的作用并与未经修饰的形式经比较。类似地,技术人员可以容易地评估顺式调节模块或启动子驱动肝特异性表达的能力(例如,如以下实例中所述)。可以将由参考启动子的变体驱动的基因的表达水平与由参考序列驱动的表达水平进行比较。在一些实施方式中,当由变体启动子驱动的肝特异性表达水平是由参考启动子驱动的表达水平的至少50%、至少60%、至少70%、至少80%、至少90%或至少100%时,可以说所述变体保持了功能。可以容易地构建用于评估肝特异性表达增强的合适的核酸构建体和报告基因测定,并且下面列出的实例给出了合适的方法。
可以鉴别肝特异性,其中的基因(例如治疗性或报告基因)的表达优先或主要发生在源自肝脏的细胞中。可以定义优先或主要的表达,例如,其中源自肝脏的细胞中的表达水平显著高于在其它类型的细胞(即非肝脏来源的细胞)中的表达水平。例如,源自肝脏的细胞中的表达适当地比非肝脏细胞高至少5倍,优选比非肝脏细胞高至少10倍,并且在一些情况下它可以高50倍或更多。为方便起见,可以通过比较肝细胞系(例如源自肝脏的细胞系,如Huh7和/或HepG2细胞)或肝原代细胞中的表达水平相较于源自肾脏的细胞系(例如HEK-293)、源自宫颈组织的细胞系(例如HeLa)和/或源自肺的细胞系(例如A549)的表达水平,来适当地证实肝特异性的表达。
本发明的合成型肝特异性启动子优选适用于促进在受试者的肝脏中的表达(例如驱动转基因、优选治疗性转基因的肝特异性表达)。在一些实施方式中,本发明的肝特异性启动子适于以如下水平促进肝特异性转基因表达:比SEQ ID NO:432的LP1启动子高至少1.5倍、优选比LP1启动子高2倍、更优选比LP1启动子高3倍、还更优选比LP1启动子(SEQ IDNO:432)高5倍。这种表达在源自肝脏的细胞、例如在Huh7和/或HepG2细胞或原代肝细胞(适合的原代人肝细胞)中适当地确定。在一些实施方式中,本发明的合成型肝特异性启动子适用于在非源自肝脏的细胞(例如HEK-293、HeLa和/或A549细胞)中以比LP1启动子(SEQ IDNO:432)低至少1.5倍的水平促进基因表达。
本发明的优选的合成型肝特异性启动子适用于促进肝特异性转基因表达并且在肝细胞中具有TBG启动子(SEQ ID NO:435)活性的至少15%、20%、30%、40%、50%、60%、70%、80%、90%、100%、125%、150%、175%、200%、250%、300%、350%或400%。
本发明的合成型肝特异性启动子优选地适用于在源自肝脏的细胞中以比SEQ IDNO:433的CMV-IE启动子高至少1.5倍的水平、优选在源自肝脏的细胞(例如HEK-293、HeLa和/或A549细胞)中以比CMV启动子至少高2倍的水平促进肝特异性的表达。本文公开的合成型肝特异性启动子可以是LSP-H、LSP-M和LSP-L启动子,涉及在肝脏中的高、中和低表达,并且在一些实施方式中,LSP-H、LSP-M和LSP-L可以优先或主要在肝脏中表达蛋白质,但也可以在一个或多个其它组织(例如在肌肉和/或脑中)表达所述蛋白质。本文公开的此类LSP-H、LSP-M和LSP-L启动子可优先地在肝脏中表达蛋白质的至少90%、或至少80%、或至少70%、或至少60%、或至少50%,并且还在另一组织中(例如肌肉组织中)表达至少10%、或至少20%、或至少30%、或至少40%、或至少50%。在一些实施方式中,用于本文公开的方法和组合物(例如用于庞贝氏病或溶酶体疾病的治疗)的LSP-H、LSP-M和LSP-L启动子在肝脏中以优先或主导的方式驱动或增强基因的表达,但也可以在肌肉组织中表达至少一些的所述蛋白质。
术语“同一性”和“相同”等是指两个聚合分子之间(例如两个核酸分子之间,如两个DNA分子之间)的序列相似性。可以进行序列比对和序列同一性的确定,例如使用Altschul等,1990(J Mol Biol 215:403-10)最初描述的基本局部比对搜索工具(BLAST),例如Tatusova和Madden,1999(FEMS Microbiol Lett 174:247-250)描述的“Blast 2序列”算法。
如本文所使用的,术语“合成的”意味着核酸分子在自然界中不存在。本发明的合成型核酸表达构建体通常通过重组技术人工地产生。此类合成型核酸可包含天然存在的序列(例如启动子、增强子、内含子和其它此类调节序列),但这些存在于非天然存在的环境中。例如,合成型基因(或基因的部分)通常包含在性质上不连续的一个或多个核酸序列(嵌合序列),和/或可涵盖置换、插入和缺失及其组合。
如本文所使用的,“间隔区序列”或“间隔区”是分隔两个功能性核酸序列的核酸序列。它可以具有基本上任何序列,只要它不阻止功能性核酸序列(例如顺式调节元件)按期望发挥功能,例如,如果它包含沉默子序列、阻止期望的转录因子的结合等,则这可能发生。通常,它是非功能性的,因为它的存在只是为了将相邻的功能性核酸序列彼此间隔开。
如本文所使用的,术语“药学上可接受的”与本领域一致并且意指与药物组合物的其它成分相容并且对其受者无害。
术语“治疗(treat/treating/treatment of)”(及其语法变体)意味着受试者病症的严重程度降低、至少部分改善或稳定;和/或实现了至少一种临床症状的一些缓解、减轻、减少或稳定;和/或疾病或紊乱的进展延迟。
术语“预防(prevent/preventing/prevention)”(及其语法变体)是指相对于在不存在本发明的方法时将会发生的情况,预防和/或延迟受试者中的疾病、紊乱和/或临床症状的发作;和/或降低疾病、紊乱和/或临床症状发作的严重程度。预防可以是完全的,例如,完全不存在疾病、紊乱和/或临床症状。预防也可以是部分的,使得受试者中的疾病、紊乱和/或临床症状的发生和/或发作的严重程度实质上小于在不存在本发明时将会发生的情况。
如本文所使用的,“治疗有效”量是足以向受试者提供一些改善或益处的量。或者说,“治疗有效”量是将在受试者中的至少一种临床症状方面提供一些缓解、减轻、减少或稳定的量。本领域技术人员将理解的是,只要向受试者提供了一些益处,治疗效果不必是完全的或治愈性的。
如本文所使用的“预防有效”量是相对于在不存在本发明的方法时将会发生的情况,足以预防和/或延迟受试者中的疾病、紊乱和/或临床症状的发作;和/或足以降低和/或延迟受试者中的疾病、紊乱和/或临床症状的发作的严重程度的量。本领域技术人员将理解,只要向受试者提供了一些预防益处,预防水平不必是完全的。
短语“治疗有效量”和类似短语意指在受试者中提供期望的特定药理作用(例如在肝脏中表达治疗基因并分泌进入血浆)的剂量或血浆浓度。需要强调的是,治疗有效量可能并不总是有效地治疗本文所述的病症,即使本领域技术人员认为此剂量是治疗有效量。治疗有效量可以根据给予途径和剂型、受试者的年龄和重量、和/或所治疗的疾病或病症而不同。
术语“个体”、“受试者”和“患者”可互换使用,并且是指患有需要治疗的疾病或病症的任何个体受试者。出于本公开的目的,受试者可以是灵长类动物,优选人,或另一哺乳动物(例如狗、猫、马、猪、山羊或牛等)。
并入本文以供参考的涉及、公开或描述AAV或AAV的方面(包括含有待表达的感兴趣的基因的DNA载体)的额外专利有:美国专利号6,491,907;7,229,823;7,790,154;7,201898;7,071,172;7,892,809;7,867,484;8,889,641;9,169,494;9,169,492;9,441,206;9,409,953;以及9,447,433;9,592,247;以及9,737,618。
II.rAAV基因组元件
如本文所公开的,所述技术的一个方面涉及一种rAAV载体,所述载体包含衣壳、以及在其衣壳内的称为“rAAV载体基因组”的核苷酸序列。rAAV载体基因组(也称为“rAAV基因组”)包含多个元件,包括但不限于两个反向末端重复序列(ITR,例如5'-ITR和3'-ITR),并且位于ITR之间的为额外的元件,包括启动子、异源基因和poly-A尾。
在一些实施方式中,本文公开的rAAV基因组包含5'ITR和3'ITR序列,以及位于5'ITR和3'ITR之间的启动子(例如本文公开的肝特异性启动子序列),所述启动子可操作地连接至编码核酸(该核酸编码α-葡萄糖苷酶(GAA)多肽)的异源核酸,其中,所述异源核酸序列可任选地进一步包含以下元件中的一个或多个:内含子序列、编码分泌信号肽的核酸、编码IGF2靶向肽的核酸和poly A序列。
在一些实施方式中,本文公开的rAAV基因组包含5'ITR和3'ITR序列、以及位于5'ITR和3'ITR之间的启动子,所述启动子可操作地连接至编码分泌肽的异源核酸和编码α-葡萄糖苷酶(GAA)多肽的核酸(即,异源核酸编码包含信号肽-GAA多肽的GAA融合多肽),其中,rAAV基因组任选地进一步包含以下的一种或多种:内含子序列、胶原蛋白稳定性(CS)序列、polyA尾和编码具有至少1个氨基酸的间隔区的核酸。在一些实施方式中,本文公开的rAAV基因组包含5'ITR和3'ITR序列、以及位于5'ITR和3'ITR之间的本文公开的肝特异性启动子,所述肝特异性启动子可操作地连接至编码分泌肽(例如,FN1、AAT或GAA信号肽)的异源核酸和编码α-葡萄糖苷酶(GAA)多肽的核酸,其中,rAAV基因组任选地进一步包含以下的一种或多种:内含子序列(例如MVM或HBB2内含子序列)、胶原蛋白稳定性(CS)序列、polyA尾和编码具有至少1个氨基酸的间隔区的核酸。
在一些实施方式中,本文公开的rAAV基因组包含5'ITR和3'ITR序列、以及位于5'ITR和3'ITR之间的启动子,所述启动子可操作地连接至编码分泌肽、靶向肽和GAA多肽的异源核酸(即,异源核酸编码包含信号肽-靶向序列-GAA多肽的GAA融合多肽),其中,靶向肽是本文所述的IGF2靶向肽,并且其中,rAAV基因组可以任选地进一步包含以下的一种或多种:内含子序列、胶原蛋白稳定性(CS)序列、polyA尾和编码具有至少1个氨基酸的间隔区的核酸。
本文讨论了rAAV基因组中的各个元件。
A.α-葡萄糖苷酶(GAA)多肽
α-葡萄糖苷酶(GAA)多肽是糖苷水解酶家族31的成员。人GAA作为110kDal的前体合成(Wisselaar等,(1993)J.Biol.Chem.268(3):2223-31)。酶的成熟形式是70kDal和76kDal的单体的混合物(Wisselaar等,(1993)J.Biol.Chem.268(3):2223-31)。前体酶具有七个潜在的糖基化位点,并且其中四个保留在成熟的酶中(Wisselaar等,(1993)J.Biol.Chem.268(3):2223-31)。产生成熟的酶的蛋白切割事件发生在晚期内体中或溶酶体中(Wisselaar等,(1993)J.Biol.Chem.268(3):2223-31)。
rAAV载体基因组可以编码GAA多肽,所述GAA多肽可包括例如人GAA的第40-952位或第70-952位氨基酸残基、或较小的部分(例如第40-790位或第70-790位氨基酸残基)。
在一个实施方式中,GAA多肽可以融合至IGF2靶向序列。在一些实施方式中,IGF2靶向序列融合至第40位氨基酸或第70位氨基酸,或融合至人GAA多肽的第40或70位氨基酸的一个或两个位置内的氨基酸。在一些实施方式中,本文公开的IGF2靶向肽是细胞外受体的配体,例如IGF2靶向肽结合至人阳离子非依赖甘露糖-6-磷酸受体(CI-MPR)或IGF2受体。
成熟的70kDal和76kDal GAA多肽种类不存在C末端的160个氨基酸。然而,导致GAA活性完全丧失的某些庞贝氏病等位基因映射到该区域,例如Val949Asp(Becker等,(1998)J.Hum.Genet.62:991)。该突变体的表型指明该蛋白的C末端部分尽管不是70kDal或76kDal种类的部分,但在该蛋白的功能中发挥重要作用。也已经报道了蛋白质的C-末端部分尽管在加工过程中从该蛋白的剩余部分中切割,但仍然与主要种类有关(Moreland等,(2004年11月1日)J.Biol.Chem.,底稿404008200)。因此,C末端残基可以在该蛋白的催化活性中发挥直接作用,和/或可以参与促进该蛋白的N末端部分的适当折叠。
天然的GAA基因编码具有如下的前体多肽:信号序列和相邻的推定的跨膜结构域、三叶状(trefoil)结构域(PFAM PF00088)(其为具有约45个氨基酸的富含半胱氨酸的结构域,该结构域包含3个二硫键)(Thim(1989)FEBS Lett.250:85)、由成熟的70/76kDal多肽限定的结构域和C末端结构域。已经报道,三叶状结构域和C-末端结构域都是产生功能性GAA所必需的,并且在蛋白质折叠过程中,C-末端结构域与三叶状结构域相互作用,这可能促进了三叶状结构域中适当的二硫键的形成。
GAA多肽描述于美国专利5,962,313和6,537,785中,以引用的方式将其整体并入本文。本领域普通技术人员能够知晓分泌信号肽(SS)或靶向肽(例如IGF2靶向肽)可以融合至的GAA的特定位置。因此,一方面,本发明涉及GAA融合蛋白,其中SP或IGF2靶向肽融合至SEQ ID NO:10的人GAA的第40、68、69、70、71、72、779、787、789、790、791、792、793或796位氨基酸,或SEQ ID NO:170-SEQ ID NO:174的经修饰的GAA蛋白,或其部分。
在本文公开的方法和组合物的一些实施方式中,由AAV表达的人GAA蛋白包括SEQID NO:10的氨基酸或其片段或变体,例如从SEQ ID NO:10的第40、68、69、70、71、72、779、787、789、790、791、792、793或796位残基开始的人GAA蛋白。在本文公开的方法和组合物的一些实施方式中,由AAV表达的人GAA蛋白包含SEQ ID NO:10的氨基酸,或与SEQ ID NO:10具有至少60%、或70%、或80%、或85%、或90%、或95%、或98%、或99%同一性的蛋白质。在本文公开的方法和组合物的一些实施方式中,包含氨基酸的由AAV表达的人GAA蛋白为从SEQ ID NO:10的第40、68、69、70、71、72、779、787、789、790、791、792、793或796位残基开始的人GAA蛋白,或与其具有至少60%、或70%、或80%、或85%、或90%、或95%、或98%、或99%同一性的蛋白质。在一些实施方式中,由AAV表达的人GAA蛋白包含从SEQ ID NO:170(modGAA;H199R、R223H)或SEQ ID NO:171(modGAA;H199R、R223H、H201L)或与它们具有至少60%、或70%、或80%、85%、或90%、或95%、或98%、或99%同一性的蛋白质中的任一者的第40、68、69、70、71、72、779、787、789、790、791、792、793或796位残基开始的氨基酸。
在一些实施方式中,本领域普通技术人员能够知晓分泌信号肽(SS)或靶向肽(例如IGF2靶向肽)可以融合至的GAA的特定位置。例如,国际专利申请WO2018046774A1(将其整体并入本文)公开了分泌信号肽(SS)或靶向肽(例如IGF2靶向肽)可以附着至的截短的GAA多肽,信号肽或IGF2靶向肽可以附着至2019年11月19日提交的美国临时申请62,937,556和2019年11月15日提交的国际申请WO 2020/102667中公开的任何截短的GAA多肽或截短的经修饰的GAA多肽、GAA截短的蛋白的起始氨基酸,以引用的方式将其整体并入本文。
在一些实施方式中,由本文所述的rAAV基因组编码的GAA融合多肽可包括例如人GAA的第40-952位氨基酸残基或第70-952位残基、或较小的部分(例如第40-790位或第70-790位氨基酸残基)。在一个实施方式中,将分泌信号肽(SS)或靶向肽(例如IGF2靶向肽)融合至第40位氨基酸或融合至第70位氨基酸、或融合至第40或70位氨基酸的一个或两个位置内的氨基酸。
在一些实施方式中,包含分泌信号肽(SS)和GAA多肽以及任选的IGF2靶向肽的融合蛋白(即,SS-GAA融合多肽或SS-IGF2-GAA融合蛋白)包含人酸性α-葡萄糖苷酶(GAA)(SEQID NO:10)的第40-952位氨基酸残基或第70-952位残基。在一些实施方式中,GAA多肽的N-末端附着至SS的C-末端,并且在一些实施方式中,GAA多肽的N-末端附着至IGF2靶向肽的C-末端且IGF2靶向肽的N-末端附着至分泌信号肽的C-末端。
(i)经修饰的GAA(modGAA)
在一些实施方式中,GAA蛋白包含US2014/0186326和Moreland等,Gene,2012;491(25-30)中公开的H201L变体,通过引用的方式将它们的整体都并入本文。具体而言,将位于201位氨基酸的组氨酸(His)变为亮氨酸(L)残基,以使76kD GAA前蛋白能够快速加工成成熟的70kD GAA蛋白。
具体而言,在一些实施方式中,本文公开的融合蛋白包含SEQ ID NO:10的GAA多肽,其具有使得在N-末端70-kDa加工位点处或附近的疏水性增加的氨基酸修饰。在一些情况下,GAA肽在对应于SEQ ID NO:10的位置190-位置209的一个或多个氨基酸处被修饰。在进一步的实施方式中,多肽在对应于SEQ ID NO:10的位置195-位置209的一个或多个氨基酸处被修饰。在进一步的实施方式中,所述修饰在对应于SEQ ID NO:10的氨基酸位置200-位置204的一个或多个氨基酸处。在某些实施方式中,所述修饰在对应于SEQ ID NO:10的位置201的氨基酸处。在进一步的实施方式中,所述修饰是用更疏水的氨基酸对一个或多个氨基酸的置换。在其它实施方式中,所述修饰是一个或多个疏水性氨基酸的插入。在更进一步的实施方式中,所述疏水性氨基酸选自亮氨酸和酪氨酸,或亮氨酸或酪氨酸的保守氨基酸。
在某些实施方式中,GAA被修饰以通过用更疏水的氨基酸置换至少一个氨基酸来增加其在N-末端70-kDa加工位点处或附近的疏水性。在一些实施方式中,可以在N-末端70-kDa加工位点的上游或下游的5个氨基酸内进行置换。在某些实例中,可以在对应于SEQ IDNO:10的位置195-位置209的氨基酸处进行氨基酸置换。在其它情况下,可以在对应于SEQID NO:10的位置200-位置204的氨基酸处进行氨基酸置换。在进一步的实施方式中,经修饰的人GAA在对应于SEQ ID NO:10的氨基酸位置201的位置处含有疏水性氨基酸。在一些实施方式中,通过在N-末端70-kDa加工位点处或附近插入一个或多个疏水性氨基酸来修饰GAA。额外的修饰包括在N-末端70-kDa加工位点处或附近删除一个或多个氨基酸。
在某些实施方式中,提供了经修饰的人GAA,所述经修饰的人GAA在N-末端70-kDa加工位点的多于一个位置处或在N-末端70-kDa加工位点的5个氨基酸内包含疏水性氨基酸(天然或合成的)。在一个实施方式中,经修饰的氨基酸中的一个位于对应于SEQ ID NO:10的201位氨基酸的位置。
在多种实施方式中,疏水性氨基酸选自缬氨酸、亮氨酸、异亮氨酸、甲硫氨酸、苯丙氨酸、色氨酸、酪氨酸、半胱氨酸或丙氨酸。在进一步的实施方式中,疏水性氨基酸是亮氨酸或酪氨酸。在一些实施方式中,经修饰的人GAA包含表现出疏水特性的合成的或非天然的氨基酸。通常,经置换的氨基酸比野生型氨基酸更具疏水性,并因此增加了N-末端70-kDa加工位点处或附近的疏水性。
在一个示例性实施方式中,经修饰的GAA在对应于SEQ ID NO:10的201位氨基酸的位置处具有亮氨酸。在另一个实施方式中,经修饰的GAA在对应于SEQ ID NO:10的201位氨基酸的位置处具有酪氨酸。
在一些实施方式中,经修饰的人GAA蛋白包含具有以下修饰的多肽:在SEQ ID NO:10的氨基酸位置199处的His(H)变为精氨酸(R)(H199R)的修饰(GAA(H199R),或在SEQ IDNO:10的氨基酸位置223处的精氨酸(R)变为组氨酸(H)(R223H)的修饰(GAA(R223H)。在一些实施方式中,经修饰的人GAA蛋白包含具有以下修饰的多肽:在SEQ ID NO:10的氨基酸位置199处的His(H)变为精氨酸(R)(H199R)的修饰以及在SEQ ID NO:10的氨基酸位置223处的精氨酸(R)变为组氨酸(H)(R223H)的修饰(GAA(H199R-R223H)。在一些实施方式中,经修饰的人GAA蛋白包含SEQ ID NO:170或与SEQ ID NO:170的至少500个、550个、600个、650个、700个、750个、800个、850个或900个氨基酸具有至少80%、90%、95%或99%同源性的变体,所述经修饰的人GAA蛋白具有H199R或R223H中的至少一种修饰或两者。在一些实施方式中,GAA的同源前导序列(即,SEQ ID NO:170的第1-27位氨基酸或SEQ ID NO:175)被以下替换:本文公开的IGF2靶向肽、或SEQ ID NO:176的前导序列、或IL2野生型前导肽(SEQ ID NO:178)、经修饰的IL2前导肽(SEQ ID NO:180),或与SEQ ID NO:176、SEQ ID NO:178或SEQ IDNO:180具有至少90%序列同一性的前导肽。
在一些实施方式中,经修饰的人GAA蛋白包含SEQ ID NO:171或与SEQ ID NO:171的至少500个、550个、600个、650个、700个、750个、800个、850个或900个氨基酸具有至少80%、90%、95%或99%同源性的变体,所述经修饰的人GAA蛋白包含至少H210L的修饰。在一些实施方式中,GAA的同源前导序列(即,SEQ ID NO:170的第1-27位氨基酸或SEQ ID NO:175)被以下替换:本文公开的IGF2靶向肽、或SEQ ID NO:176的前导序列、或IL2野生型前导肽(SEQ ID NO:178)、经修饰的IL2前导肽(SEQ ID NO:180)或与SEQ ID NO:176、SEQ IDNO:178或SEQ ID NO:180具有至少90%序列同一性的前导肽。
在一些实施方式中,经修饰的人GAA蛋白包含具有选自SEQ ID NO:10的H199R、R223H或H201L中的至少一种修饰的多肽,或具有这些修饰中的至少一种的与SEQ ID NO:10的至少500个、550个、600个、650个、700个、750个、800个、850个或900个氨基酸具有至少80%、90%、95%或99%同源性的变体。在一些实施方式中,经修饰的人GAA蛋白包含含有选自SEQ ID NO:10的H199R、R223H或H201L中的至少两种修饰的多肽,或具有这些修饰中的至少两种的与SEQ ID NO:10的至少500个、550个、600个、650个、700个、750个、800个、850个或900个氨基酸具有至少80%、90%、95%或99%同源性的变体。在一些实施方式中,经修饰的人GAA蛋白包含具有SEQ ID NO:10的三种修饰H199R、R223H和H201L的多肽(GAA-H199R-H201L-R223H),或具有这三种修饰的与SEQ ID NO:10的至少500个、550个、600个、650个、700个、750个、800个、850个或900个氨基酸具有至少80%、90%、95%或99%同源性的变体。
在某些实施方式中,提供了与SEQ ID NO:10的至少500个、550个、600个、650个、700个、750个、800个、850个或900个氨基酸具有至少80%、90%、95%或99%同源性的经修饰的人GAA,并且其中,经修饰的人GAA具有在用更疏水的氨基酸所替换的N-末端70-kDa加工位点中的至少一个氨基酸。
在一些实施方式中,至少50%的经修饰的人GAA在20小时、30小时或40小时内在溶酶体中被加工成70-kDa形式。在更进一步的实施方式中,基本上所有经修饰的人GAA在55小时、65小时或75小时内在溶酶体中被加工成70-kDa形式。
在某些实施方式中,本发明的经修饰的人GAA可以通过其更快速的蛋白水解过程变为成熟的70-kDa形式或其相应变体来鉴定。在其它实施方式中,如本文所述的经修饰的人GAA可以通过产生在天然的人GAA的蛋白水解过程期间不会产生的82-kDa中间多肽来鉴定。在进一步的实施方式中,经修饰的人GAA可以通过在未修饰的人GAA的蛋白水解过程期间产生的76-kDa中间多肽的缺乏来鉴定。
在某些实施方式中,所述多肽与SEQ ID NO:10或SEQ ID NO:170-SEQ ID NO:171的至少500个氨基酸具有至少80%的同一性。在一些情况下,所述多肽与SEQ ID NO:10或SEQ ID NO:170-SEQ ID NO:171的至少500个氨基酸具有至少90%的同一性。在其它情况下,所述多肽与SEQ ID NO:10或SEQ ID NO:170-SEQ ID NO:171的至少500个氨基酸具有至少95%的同一性。
在某些实施方式中,当与未修饰的人酸性α-葡萄糖苷酶蛋白相比时,具有在氨基酸201位处修饰为疏水残基(例如H201L修饰)的GAA多肽表现出更快速的溶酶体蛋白酶加工。在一些实施方式中,至少50%的GAA前多肽在表达的20小时内被蛋白水解加工成70-kDa的成熟GAA形式。在其它实施方式中,基本上所有的GAA前多肽在表达的55小时内被蛋白水解加工成70-kDa的成熟GAA形式。
在一些实施方式中,将SEQ ID NO:10的第1-27位氨基酸的同源GAA前导肽(即MGVRHPPCSHRLLAVCALVSLATAALL,SEQ ID NO:175)替换为不同的信号肽(前导肽)。例如,GAA的同源前导肽(SEQ ID NO:175)可以被以下任一种所替换:(i)IgGl前导肽(本文中被称为“201前导肽”或“2011p”),所述IgGl前导肽具有由核酸序列SEQ ID NO:177编码的氨基酸序列MEFGLSWVFLVALLKGVQCE(SEQ ID NO:176),(ii)wtIL2 lp:由核酸序列SEQ ID NO:179编码的MYRMQLLSCIALSLALVTNS(SEQ ID NO:178),或(iii)mutIL2 lp:由核酸序列SEQ ID NO:181编码的MYRMQLLLLIALSLALVTNS(SEQ ID NO:180)。在一些实施方式中,同源GAA前导肽(SEQ ID NO:175)保持存在,并且添加了额外的信号肽,例如以下信号肽中的任一种或多种:AAT、FN1、具有由核酸序列SEQ ID NO:177编码的氨基酸序列MEFGLSWVFLVALLKGVQCE(SEQ ID NO:176)的IgG1前导肽(本文中被称为“201前导肽”或“2011p”),(ii)wtIL2 lp:由核酸序列SEQ ID NO:179编码的MYRMQLLSCIALSLALVTNS(SEQ ID NO:178),或(iii)mutIL2lp:由核酸序列SEQ ID NO:181编码的MYRMQLLLLIALSLALVTNS(SEQ ID NO:180)。
在一些实施方式中,GAA被修饰以添加或去除糖基化位点,例如N-连接的糖基化位点、O-连接的糖基化位点或两者。在某些实施方式中,糖基化位点的添加或去除通过N-末端缺失、C-末端缺失、内部缺失、随机点诱变或定点诱变来实现。在一些实施方式中,示例性GAA修饰涉及一个或多个天冬酰胺(Asn)残基的添加、或一个或多个突变以产生天冬酰胺(Asn)残基、或一个或多个天冬酰胺(Asn)残基的缺失。在某些实施方式中,存在于GAA中的N-连接和/或O-连接的糖基化位点中的所有或一些发生突变。在一些实施方式中,GAA修饰将产生与GAA的生物活性、物理结构和/或底物结合潜力有关的信息。
(ii)编码GAA的核酸
在一些实施方式中,rAAV基因组包含编码整个GAA多肽(例如,N-末端/催化结构域和C-末端结构域)的异源核酸序列,所述异源核酸序列不与异源信号序列或靶向肽融合。
在一些实施方式中,rAAV基因组包含编码分泌信号肽或IGF2靶向肽的异源核酸序列,所述异源核酸序列框内(in frame)融合至编码整个GAA多肽(例如,N-末端/催化结构域和C末端结构域)的GAA核酸序列的3′末端。例如,将编码分泌信号肽或IGF2靶向肽的异源核酸序列框内融合至编码70kDa和76kDa GAA多肽的GAA核酸序列的3′末端,当rAAV载体转导哺乳动物细胞时此两种多肽均从rAAV基因组表达。在一些实施方式中,可以通过rAA基因组中的两个启动子或通过驱动双顺反子构建体表达的一个启动子来驱动GAA核酸的表达。
在本文公开的方法和组合物的一些实施方式中,rAAV载体包含编码GAA蛋白的核酸序列,所述核酸序列是野生型GAA核酸序列,例如SEQ ID NO:11、SEQ ID NO:72或SEQ IDNO:182.。在本文公开的方法和组合物的一些实施方式中,rAAV载体包含编码GAA蛋白的核酸序列,所述核酸序列是经密码子优化的GAA核酸序列,用于(i)增强体内表达、(ii)减少CpG岛、(iii)降低固有免疫应答中的任一项或多项。被涵盖以用于本文公开的方法和rAAV组合物中的示例性的经密码子优化的GAA核酸序列可以选自以下中的任一种:SEQ ID NO:73、SEQ ID NO:74、SEQ ID NO:75、SEQ ID NO:76或SEQ ID NO:182,或与SEQ ID NO:73、SEQID NO:74、SEQ ID NO:75、SEQ ID NO:76或SEQ ID NO:182具有至少60%、或70%、或80%、85%、或90%、或95%、或98%、或99%序列同一性的核酸序列。
此外,在一些实施方式中,被涵盖以用于本文公开的方法和rAAV组合物中的GAA核酸序列进一步用以下修饰中的至少一种或多种进行修饰:(i)在一些实施方式中所有可变阅读框或至少一种或两种的去除,(ii)一个或多个CpG岛的去除,(iii)Kozak序列的修饰,(iv)翻译终止子序列的修饰,以及(v)启动子和Kozak序列之间的间隔区的去除。
例如,在一些实施方式中,rAAV组合物包含SEQ ID NO:182的hGAA核苷酸序列,或与SEQ ID NO:182具有至少60%、或70%、或80%、85%、或90%、或95%、或98%、或99%序列同一性的核酸序列,其中与GAA的野生型核酸序列相比,SEQ ID NO:182包含表1A中所示的以下元件;
表1A:modGAA核酸序列的元件。
Figure BDA0003751229800000501
Figure BDA0003751229800000511
在一些实施方式中,rAAV组合物包含SEQ ID NO:182的hGAA核苷酸序列,或与SEQID NO:182具有至少60%、或70%、或80%、85%、或90%、或95%、或98%、或99%序列同一性的核酸序列,其中hGAA核苷酸序列已被修饰为具有一系列点突变,消除了3个潜在的促炎CpG基序和大量可变阅读框(ARF),其中与GAA的野生型核酸序列相比,SEQ ID NO:182包含表1B中所示的如下点突变,其中表1B中的编号假定GAA起始密码子ATG中的“A”是第一个核苷酸。
表1B
NT# 目的 原始NT 新NT NT# 目的 原始NT 新NT
201 去除ORF T C 1212 破坏CpG C T
949 去除ORF T C 1440 去除ORF A G
957 去除ORF T C 1608 去除ORF T C
1014 去除ORF T C 2448 破坏CpG C G
1071 破坏CpG T G 2583 去除ORF T C
1203 去除ORF A G  
在一些实施方式中,SEQ ID NO:182的编码同源前导肽的核酸序列(例如,SEQ IDNO:182的核苷酸1-81)可以被编码201lp、wtIL2 lp或mutIL2 lp中的任一种的核酸序列所替换。因此,在一些实施方式中,SEQ ID NO:182的核酸残基1-81(编码GAA的同源前导肽)可以被以下的核酸序列所替换:SEQ ID NO:177(201lp)、SEQ ID NO:179(wtIL2 lp)或SEQ IDNO:181(mutIL2 lp),或与SEQ ID NO:177、SEQ ID NO:179或SEQ ID NO:181具有至少60%、或70%、或80%、85%、或90%、或95%、或98%、或99%序列同一性的核酸序列。
在一些实施方式中,rAAV载体或rAAV基因组包含编码GAA多肽的异源核酸序列,所述GAA多肽包含SEQ ID NO:170(具有同源GAA信号序列和H199R、R223H修饰的GAA多肽)或SEQ ID NO:171(具有同源GAA信号序列和H199R、H201L、R223H修饰的GAA多肽)。SEQ ID NO:170的GAA多肽由SEQ ID NO:182的核酸序列编码。因此,在一些实施方式中,rAAV载体包含编码经修饰的GAA多肽的SEQ ID NO:182的核酸,所述经修饰的GAA多肽包含H199R、R223H修饰。SEQ ID NO:171的GAA多肽由SEQ ID NO:182的核酸序列编码,其中SEQ ID NO:182的碱基对(bp)667-669由CAC变为以下的任一种:UUA、UUG、CUU、CUC、CUA、CUG(引起由组氨酸(H)至亮氨酸(L)的氨基酸变化);或其中SEQ ID NO:182的bp 668由A改变为U。因此,在一些实施方式中,rAAV载体包含SEQ ID NO:182的核酸,其中SEQ ID NO:182的bp 667-669由CAC变为以下的任一种:UUA、UUG、CUU、CUC、CUA、CUG(其将氨基酸由组氨酸(H)变为亮氨酸(L));或其中SEQ ID NO:182的bp 668由A变为U,其编码包含H199R、H201L和R223H修饰的经修饰的GAA多肽。
在一些实施方式中,rAAV载体或rAAV基因组包含编码GAA多肽的异源核酸序列,所述GAA多肽选自以下中的任一种:SEQ ID NO:172(其中的同源信号肽被替换为IgG信号序列和H199R、R223H修饰的GAA多肽)、或SEQ ID NO:173(其中的同源信号肽被替换为wtIL2信号序列和H199R、R223H修饰的GAA多肽)、SEQ ID NO:174(其中的同源信号肽被替换为mutIL3信号序列和H199R、R223H修饰的GAA多肽)。
在一些实施方式中,rAAV载体或rAAV基因组包含含有SEQ ID NO:182的异源核酸序列,其中SEQ ID NO:182的bp 1-81被替换为SEQ ID NO:177(IgG信号序列)的核酸,其编码SEQ ID NO:172的GAA多肽(具有H199R、R223H修饰的IgG前导-GAA)。在一些实施方式中,rAAV载体包含含有SEQ ID NO:182的异源核酸序列,其中SEQ ID NO:182的bp 668由A变为U并且其中SEQ ID NO:182的bp 1-81被替换为SEQ ID NO:177(IgG信号肽)的核酸,其编码SEQ ID NO:172的GAA多肽(具有H199R、H201L和R223H修饰的IgG前导-GAA)。
在一些实施方式中,rAAV载体或rAAV基因组包含含有SEQ ID NO:182的异源核酸序列,其中SEQ ID NO:182的bp 1-81被替换为SEQ ID NO:179(wt IL2信号肽)的核酸,其编码SEQ ID NO:173的GAA多肽(具有H199R、R223H修饰的wt IL2信号肽-GAA)。在一些实施方式中,rAAV载体包含含有SEQ ID NO:182的异源核酸序列,其中SEQ ID NO:182的bp 668由A变为U并且其中SEQ ID NO:182的bp 1-81被替换为SEQ ID NO:179(wt IL2信号肽)的核酸,其编码SEQ ID NO:173的GAA多肽(具有H199R、H201L和R223H修饰的wt IL2信号肽-GAA)。
在一些实施方式中,rAAV载体包含含有SEQ ID NO:182的异源核酸序列,其中SEQID NO:182的bp 1-81被替换为SEQ ID NO:181(mutIL2信号肽)的核酸,其编码SEQ ID NO:174的GAA多肽(具有H199R、R223H修饰的mutIL2信号肽-GAA)。在一些实施方式中,rAAV载体包含含有SEQ ID NO:182的异源核酸序列,其中SEQ ID NO:182的bp 668由A变为U并且其中SEQ ID NO:182的bp 1-81被替换为SEQ ID NO:181(mut IL2信号肽)的核酸,其编码SEQ IDNO:174的GAA多肽(具有H199R、H201L和R223H修饰的mut IL2信号肽-GAA)。
GAA的C-末端结构域以反式与70/76kDal种类结合而发挥功能,以生成活性GAA。催化结构域和C-末端结构域之间的边界看起来位于第791位氨基酸残基处,基于其在少于18个氨基酸的短区域中的存在,所述区域在水解酶家族31的大多数成员中不存在并且在GAA中含有4个连续的脯氨酸残基。已经报道,与成熟种类相关的C-末端结构域始于第792位氨基酸残基(Moreland等,(2004年11月1日)J.Biol.Chem.,底稿404008200)。因此,在一些实施方式中,GAA核酸序列编码除了C-末端结构域之外的整个GAA多肽。因此,在此类实施方式中,rAAV载体可以用于转导哺乳动物细胞,所述细胞将GAA的C-末端结构域作为单独的多肽来表达。
B.分泌信号肽
天然的GAA信号肽在ER中未被切割,从而引起天然GAA多肽在ER中被膜结合(Tsuji等,(1987)Biochem.Int.15(5):945-952)。可以通过用GAA的替代信号肽替换内源性GAA信号肽(和任选的相邻序列)来完成GAA的膜结合的破坏。
因此,在代表性的实施方式中,本文公开的rAAV载体和rAAV基因组进一步包含编码待转移至靶细胞的GAA多肽的异源核酸,所述核酸附着至编码代替内源性GAA信号肽的分泌信号肽的异源核酸序列。异源核酸与编码分泌信号肽的区段可操作地关联,从而使得在转录和翻译时产生融合多肽,所述多肽包含与GAA多肽可操作地关联(例如,指导其分泌)的分泌信号序列。
在一些实施方式中,AAV载体编码包含内源GAA信号肽的GAA多肽(例如,SEQ IDNO:10的第1-27位氨基酸,也被称为“固有GAA”或“同源GAA”信号肽)。在一些实施方式中,AAV载体编码包含内源GAA信号肽(例如,SEQ ID NO:10的第1-27位氨基酸,也被称为“固有GAA”或“同源GAA”信号肽)以及额外的异源(非天然)信号序列的GAA多肽。在一些实施方式中,将缺乏GAA的第1-27位氨基酸的内源信号肽的GAA多肽融合至分泌信号。在本文所述的组合物和方法的一些实施方式中,分泌信号用于辅助GAA多肽或融合多肽(例如IGF2靶向肽-GAA融合多肽)从肝细胞分泌进入血液中的一般目的,在血液中其可以转运并被靶向至哺乳动物细胞(例如本文所述的人心肌细胞和骨骼肌细胞)的溶酶体。在一些实施方式中,异源分泌信号选自以下的任一种:AAT信号肽、纤连蛋白信号肽(FN1)、GAA信号肽,或具有分泌信号活性的AAT、FN1或GAA信号肽的活性片段。
在一些实施方式中,分泌信号肽与感兴趣的多肽是异源的(即,外来的或外源的)。例如,异源分泌信号肽是纤连蛋白分泌信号肽,感兴趣的多肽不是纤连蛋白。在一些实施方式中,分泌信号肽选自以下中的任一者:AAT信号肽、纤连蛋白信号肽(FN1),或具有分泌信号活性的AAT、FN1或GAA信号肽的活性片段。在替代实施方式中,分泌信号肽与GAA非异源,即信号肽是GAA信号肽(即,天然GAA多肽的第1-27位残基)。
在一些实施方式中,SEQ ID NO:10的第1-27位氨基酸的同源GAA信号肽(即MGVRHPPCSHRLLAVCALVSLATAALL,SEQ ID NO:175)被替换为不同的或异源的前导肽。例如,GAA的同源前导肽(SEQ ID NO:175)可以被选自以下的任一种异源信号肽所替换:(i)IgGl前导肽(本文中被称为“201前导肽”或“2011p”),所述IgG1前导肽具有由核酸序列SEQ IDNO:177编码的MEFGLSWVFLVALLKGVQCE(SEQ ID NO:176)的氨基酸序列,(ii)wtIL2 lp:由核酸序列SEQ ID NO:179编码的MYRMQLLSCIALSLALVTNS(SEQ ID NO:178),或(iii)mutIL2lp:由核酸序列SEQ ID NO:181编码的MYRMQLLLLIALSLALVTNS(SEQ ID NO:180),或与SEQID NO:176、SEQ ID NO:178或SEQ ID NO:180中的任一种具有至少90%序列同一性的前导肽。
通常,分泌信号肽将位于融合多肽的氨基末端(N-末端)(即,编码分泌信号肽的核酸区段位于本文公开的rAAV载体或rAAV基因组中的编码GAA肽或GAA融合肽的异源核酸的5′端)。或者,分泌信号可以位于羧基末端或被包埋在GAA多肽或GAA融合多肽(例如,IGF2-GAA融合多肽)内,只要该分泌信号可操作地与其结合并指导感兴趣的GAA多肽或GAA融合多肽(具有或没有来自GAA多肽的信号肽的切割)从细胞中分泌即可。
分泌信号与GAA多肽或GAA融合多肽可操作地结合,将GAA多肽或GAA融合多肽靶向至分泌途径。换句话说,分泌信号与GAA多肽可操作地结合,从而使得与不存在分泌信号肽的情况相比,GAA多肽或GAA融合多肽以更高的水平(即,更大的量)从细胞中分泌。通常,与不存在分泌信号肽的附着相比,当信号肽被附着时,典型地至少约20%、30%、40%、50%、70%、80%、85%、90%、95%或更多的GAA多肽或IGF2-GAA融合多肽(单独的和/或与信号肽融合)从细胞中分泌。在其它实施方式中,基本上所有可检测的多肽(单独的和/或处于融合多肽的形式)从细胞中分泌。
短语“从细胞中分泌”指多肽可被分泌到细胞外的任何区室(例如,流体或空间)中,包括但不限于:组织间隙(interstitial space)、血液、淋巴、脑脊液、肾小管、气道通道(例如肺泡、细支气管和支气管、鼻部通道等)、胃肠道(例如食道、胃、小肠、结肠等)、眼睛中的玻璃体液和耳蜗内淋巴等。
在一个实施方式中,rAAV基因组包含异源核酸,所述异源核酸编码融合至GAA融合多肽的分泌信号肽(SP),其中GAA融合多肽包括融合至GAA多肽的靶向肽(例如IGF2靶向肽)。如本文所使用的,GAA还指上述的经修改的GAA。因此,本文公开的信号肽增加了GAA多肽或IGF2-GAA融合多肽从转导有rAAV载体或包含本文所述的rAAV基因组的细胞中分泌的功效。
因此,在一些实施方式中,本文公开的rAAV基因组包含5'ITR和3'ITR序列、以及位于5'ITR和3'ITR之间的启动子,所述启动子可操作地连接至编码分泌肽的异源核酸和编码α-葡萄糖苷酶(GAA)多肽的核酸(即,异源核酸编码包含信号肽-GAA多肽的GAA融合多肽)。
在替代实施方式中,本文公开的rAAV基因组包含5'ITR和3'ITR序列、以及位于5'ITR和3'ITR之间的启动子,所述启动子可操作地连接至编码分泌肽的异源核酸和编码α-葡萄糖苷酶(GAA)融合多肽的核酸,其中所述融合蛋白包含IGF2靶向肽和GAA多肽(即,异源核酸编码包含信号肽-IGF2-GAA多肽的GAA融合多肽)。
通常,分泌信号肽在内质网内切割,并且在一些实施方式中,分泌信号肽在分泌之前从GAA多肽切割。但是,只要GAA多肽或IGF2-GAA融合多肽从细胞中的分泌增强并且GAA多肽具有功能,切割分泌信号肽不是必须的。因此,在一些实施方式中,分泌信号肽被部分或完全保留。
在一些实施方式中,本文公开的rAAV基因组或分离的核酸包含编码嵌合多肽的核酸,所述嵌合多肽包含可操作地连接至分泌信号肽的GAA多肽,并且该嵌合多肽从转导有rAAV载体的细胞中表达和产生,并且GAA多肽从细胞中分泌。GAA多肽或GAA融合多肽(例如IGF2-GAA融合多肽)可在切割全部或部分的分泌信号肽后被分泌。或者,GAA多肽或GAA融合多肽(例如,IGF2-GAA融合多肽)可以保留分泌信号肽(即,分泌信号不被切割)。因此,在这种背景下,“GAA多肽或GAA融合多肽”可以是包含分泌肽的嵌合多肽。
本发明的分泌信号序列不限于任何特定的长度,只要它们将感兴趣的多肽导向至分泌通路。在代表性的实施方式中,信号肽的长度至少为约6、8、10、12、15、20、25、30或35个氨基酸,上至约40、50、60、75或100个氨基酸的长度或更长。
在本文公开的rAAV载体中且由rAAV基因组编码的分泌信号肽可以包含天然存在的分泌信号序列或其修饰、基本上由天然存在的分泌信号序列或其修饰组成、或由天然存在的分泌信号序列或其修饰组成。美国专利9,873,868中公开的指导从细胞分泌的大量的经分泌的蛋白和序列是本领域已知的,该专利通过引用的方式将其整体并入本文。示例性的经分泌的蛋白(及它们的分泌信号)包括但不限于:红细胞生成素、凝血因子IX、胱抑素、乳转铁蛋白、血浆蛋白酶C1抑制剂、载脂蛋白(例如APO A、C、E)、MCP-1、α-2-HS-糖蛋白、α-1-微球蛋白、补体(例如C1Q、C3)、玻连蛋白、淋巴毒素-α、天青杀素(azurocidin)、VIP、金属蛋白酶抑制剂2、磷酯酰肌醇蛋白聚糖-1(glypican-1)、胰激素、簇集蛋白、肝细胞生长因子、胰岛素、α-1-抗胰凝乳蛋白酶、生长激素、IV型胶原酶、鸟苷蛋白、备解素、脑啡肽原A、抑制素β(例如A链)、前白蛋白、血管生成素、促黄体素(例如β链)、胰岛素样生长因子结合蛋白1和2、激活剂前体多肽、纤维蛋白原(例如,β链)、胃三酰甘油脂肪酶、中期因子(midkine)、中性粒细胞防御素1、2和3、α-1-抗胰蛋白酶、基质gla-蛋白、α-类胰蛋白酶、胆盐活化的脂肪酶、胰凝乳蛋白酶原B、弹性蛋白、IGλ链V区、血小板因子4变体、嗜铬粒蛋白A、WNT-1原癌基因蛋白、抑瘤素M、β-新内啡肽-强啡肽、von Willebrand因子、血浆丝氨酸蛋白酶抑制剂、血清淀粉样A蛋白、巢蛋白、纤连蛋白、肾素、骨粘连蛋白、富组蛋白3(histatin 3)、磷脂酶A2、软骨基质蛋白、GM-CSF、基质溶解因子、神经内分泌蛋白7B2、胎盘蛋白11、凝溶胶蛋白、M-CSF、转钴胺素I、乳糖酶-根皮苷水解酶、弹性蛋白酶2B、胃蛋白酶原A、MIP1-β、催乳素、胰蛋白酶原II、胃泌素释放肽II、心钠素、分泌性碱性磷酸酶、胰α-淀粉酶、分泌粒蛋白I、β-酪蛋白、血清转铁蛋白、组织因子途径抑制剂、促卵泡素β链、凝血因子XII、生长激素释放因子、前列腺精浆蛋白、白介素(例如2、3、4、5、9、11)、抑制素(例如α链)、血管紧张素原、甲状腺球蛋白、IG重链或轻链、纤溶酶原激活物抑制剂-1、溶菌酶C、纤溶酶原激活物、抗白细胞蛋白酶(antileukoproteinase)1、富酪蛋白、纤蛋白-1、异构体(isoform)B、尿调节素、甲状腺素结合球蛋白、axonin-1、子宫内膜α-2球蛋白、干扰素(如α、β、γ)、β-2-微球蛋白、胆囊收缩素原(procholecystokinin)、胃亚蛋白酶原(progastricsin)、前列腺酸磷酸酶、骨唾液蛋白II、共脂肪酶、阿尔茨海默氏淀粉样A4蛋白、PDGF(例如A或B链)、凝血因子V、三酰基甘油脂酶、结合珠蛋白2、皮质类固醇结合球蛋白、三酰基甘油脂酶、松弛素原H2、卵泡抑素1和2、血小板糖蛋白IX、GCSF、VEGF、肝素辅因子II、抗凝血酶III、白血病抑制因子、间质胶原酶、多效生长因子、小诱导型细胞因子A1、黑色素浓缩激素、血管紧张素转化酶、胰蛋白酶抑制剂、凝血因子VIII、甲胎蛋白、α-乳清蛋白、senogelin II、κ酪蛋白、胰高血糖素、促甲状腺素β链、转钴胺素II、血小板反应蛋白1、甲状旁腺素、血管加压素和肽素、组织因子、胃动素、MPIF-1、激肽原、神经内分泌转化酶2、干细胞因子前胶原α1链、血浆激肽释放酶角化细胞生长因子,以及任何其它分泌的激素、生长因子、细胞因子、酶、凝血因子、乳蛋白、免疫球蛋白链等。
在一些实施方式中,在本文公开的rAAV载体中且由rAAV基因组编码的其它的分泌信号肽可以选自但不限于来自以下的分泌信号序列:组织蛋白酶前体酶原L(例如,GenBank登录号KHRTL,NP_037288、NP_034114、AAB81616、AAA39984、P07154、CAA68691;以引用的方式将它们的公开内容整体并入本文),以及前原α-2型胶原蛋白(例如,GenBank登录号CAA98969、CAA26320、CGHU2S、NP_000080、BAA25383、P08123;以引用的方式将它们的公开内容以其整体并入本文)以及它们的等位基因变体、修饰和功能性片段(如上文关于纤连蛋白分泌信号序列所讨论的)。对于组织蛋白酶前体酶原L(褐家鼠(Rattus norvegicus)而言,示例性的分泌信号序列包括MTPLLLLAVLCLGTALA[SEQ ID NO:27](登录号CAA68691),以及对于前原α-2型胶原蛋白(智人(Homo sapiens)而言,示例性的分泌信号序列包括MLSFVDTRTLLLLAVTLCLATC[SEQ ID NO:28](登录号CAA98969)。还涵盖更长的氨基酸序列,其包含来自组织蛋白酶前体酶原L和前原α-2型胶原蛋白或它们的功能片段的全长分泌信号序列(如上文关于纤连蛋白分泌信号序列所讨论的)。
在一些实施方式中,分泌信号肽部分地或全部地源自由肝细胞产生的经分泌的多肽。在一些实施方式中,分泌信号肽可以进一步全部或部分为合成或人工的。合成或人工的分泌信号肽在本领域中是已知的,参见例如Barash等,“Human secretory signal peptidedescription by hidden Markov model and generation of a strong artificialsignal peptide for secreted protein expression”,Biochem.Biophys.Res.Comm.294:835-42(2002);以引用的方式将其公开内容以其整体并入本文。在具体实施方式中,分泌信号肽包含以下的人工分泌信号、基本上由以下的人工分泌信号组成或由以下的人工分泌信号组成:MWWRLWWLLLLLLLLWPMVWA(SEQ ID NO:29),或其具有1个、2个、3个、4个或5个氨基酸置换(可选地,保守氨基酸置换,保守氨基酸置换是本领域已知的)的变体。
用于本文公开的方法和组合物的示例性信号肽可以选自表2中公开的任一种信号肽、或其功能变体。示例性信号肽是纤连蛋白(FN1)或AAT。在本文公开的方法和组合物的一些实施方式中,rAAV载体组合物包含编码分泌信号肽的核酸,例如编码选自以下的分泌信号肽:AAT信号肽(例如SEQ ID NO:17)、纤连蛋白信号肽(FN1)(例如SEQ ID NO:18-SEQ IDNO:21)、GAA信号肽、hIGF2信号肽(例如SEQ ID NO:22)或它们具有分泌信号活性的活性片段(例如编码与SEQ ID NO:17-SEQ ID NO:22具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的氨基酸序列的核酸)。
在本文公开的方法和组合物的一些实施方式中,编码分泌信号的核酸选自以下中的任一项:SEQ ID NO:17、SEQ ID NO:81-SEQ ID NO:21、SEQ ID NO:22-SEQ ID NO:26,或与SEQ ID NO:17或SEQ ID NO:22-SEQ ID NO:26中的任一项具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的核酸序列。
在一些实施方式中,人们可以容易地用任何信号肽来置换FN1或AAT信号肽,包括用于肝脏过表达蛋白的信号肽,或在2019年11月19日提交的62,937,556或在2019年11月15日提交的PCT/US19/61653中公开的信号肽。
纤连蛋白分泌信号肽
在一些实施方式中,分泌信号肽是纤连蛋白分泌信号肽,该术语包括天然存在的序列的修饰(如下文更详细描述)。
在一些实施方式中,分泌信号肽是纤连蛋白信号肽,例如人纤连蛋白的信号序列或来自大鼠纤连蛋白的信号序列。被涵盖以用于本文所述的rAAV基因组和rAAV载体中的纤连蛋白(FN1)信号序列和经修饰的FN1信号肽在美国专利7,071,172中公开,以引用的方式将其整体并入本文;并且在2019年11月19日提交的临时申请62/937,556的表3中公开。示例性的纤连蛋白分泌信号序列的实例包括但不限于美国专利7,071,172的表1中所列出的那些,以引用的方式将其整体并入本文。
表2:示例性的纤连蛋白(FN1)分泌信号肽
Figure BDA0003751229800000601
编码褐家鼠的纤连蛋白分泌信号序列的示例性的核苷酸序列见于GenBank登录号X15906,以引用的方式将其公开内容并入本文。作为另一说明性序列,编码人纤连蛋白1、转录变体1的分泌信号肽的核苷酸序列(登录号NM_002026、第268-345位核苷酸;登录号NM_002026的公开内容以引用的方式整体并入本文)。另一个示例性的分泌信号序列由编码非洲爪蟾纤连蛋白的分泌信号肽的核苷酸序列编码(登录号M77820,第98-190位核苷酸,登录号M77820的公开内容以引用的方式整体并入本文)。
在另一实施方式中,纤连蛋白信号序列(FN1,第208-303位核苷酸,5′-ATG
CTC AGG GGT CCG GGA CCC GGG CGG CTG CTG CTG CTA GCA GTC CTG TGC CTGGGG ACA TCG GTG CGC TGC ACC GAA ACC GGG AAG AGC AAG AGG-3′,SEQ ID NO:23)源自大鼠纤连蛋白mRNA序列(Genbank登录#X15906),并编码以下的肽信号序列:Met Leu ArgGly Pro Gly Pro Gly Arg Leu Leu Leu Leu Ala Val Leu Cys Leu Gly Thr Ser ValArg Cys Thr Glu Thr Gly Lys Ser Lys Arg(SEQ ID NO:18)。在本文公开的方法和组合物的一些实施方式中,重组AAV载体包含编码分泌信号肽的异源核酸序列,所述分泌信号肽是纤连蛋白信号肽(FN1)或其具有分泌信号活性的活性片段(例如,FN1信号肽具有SEQ IDNO:18-SEQ ID NO:21中任一项的序列,或与SEQ ID NO:18-SEQ ID NO:21中的任一项具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的氨基酸序列),并且异源核酸序列编码选自以下中的任一项的IGF2靶向肽:SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:9,或与SEQ ID NO:5-SEQ ID NO:9具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的IGF2肽。在本文公开的方法和组合物的一些实施方式中,重组AAV载体包含编码分泌信号肽的异源核酸序列,所述分泌信号肽是AAT信号肽或其具有分泌信号活性的活性片段(例如,AAT信号肽具有SEQ IDNO:17的序列,或与SEQ ID NO:17具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的氨基酸序列),并且异源核酸序列编码选自以下中的任一项的IGF2靶向肽:SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:9,或与SEQ ID NO:5-SEQ ID NO:9具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的IGF2肽。
本领域技术人员将知晓,分泌信号序列可编码位于肽酶切割位点的C-末端侧的一个、两个、三个、四个、五个或全部六个或更多个氨基酸(由↑标识)(参见例如,表2中的SEQID NO:19和SEQ ID NO:24)。本领域技术人员将知晓,切割位点的羧基末端侧的额外的氨基酸(例如1个、2个、3个、4个、5个、6个或更多个氨基酸)可以被包含在分泌信号序列中。
在本文公开的方法和组合物的一些实施方式中,重组AAV载体包含以下或由以下组成:位于5’ITR和3’ITR之间的编码分泌信号肽的异源核酸序列以及编码hGAA多肽的核酸,其中编码信号序列的核酸序列选自以下的任一种:AAT信号肽(例如SEQ ID NO:17)、纤连蛋白信号肽(FN1)(例如SEQ ID NO:18-SEQ ID NO:21)、同源GAA信号肽(SEQ ID NO:175)、hIGF2信号肽(例如SEQ ID NO:22)、IgG1前导肽(SEQ ID NO:177)、wtIL2前导肽(SEQID NO:179)、突变型IL2前导肽(SEQ ID NO:181)或它们的具有分泌信号活性的活性片段(例如编码与SEQ ID NO:17-SEQ ID NO:22、SEQ ID NO:175、SEQ ID NO:177、SEQ ID NO:179或SEQ ID NO:181具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的氨基酸序列的核酸),并且其中编码信号肽的核酸位于编码本文公开的hGAA多肽的核酸的5'端,并且其中编码信号序列和hGAA多肽的核酸可操作地连接至表4中本文公开的任何LSP或其功能变体。
在本发明的实施方式中,与本文具体公开的序列相比,功能片段具有至少约50%、70%、80%、90%或更高的分泌信号活性,或者甚至具有更高水平的分泌信号活性。
肽酶切割位点
在一些实施方式中,可将一个或多个外源肽酶切割位点插入分泌信号肽-GAA融合多肽中,例如,在分泌信号肽与GAA多肽之间。在具体的实施方式中,将自体蛋白酶(例如口蹄疫病毒2A自体蛋白酶)插入到分泌信号肽与GAA多肽或IGF2-GAA融合多肽之间。在其它实施方式中,采用可以通过添加外源蛋白酶来控制的蛋白酶识别位点(例如,胰蛋白酶的Lys-Arg识别位点、曲霉KEX2样蛋白酶的Lys-Arg识别位点、金属蛋白酶的识别位点、丝氨酸蛋白酶的识别位点等)。修饰GAA多肽以删除或灭活天然蛋白酶位点被涵盖在本文中,并在2019年11月19日提交的美国临时申请62,937,556和2019年11月15日提交的国际申请PCT/US19/61653中公开。
C.IGF2靶向肽序列
在一个实施方式中,rAAV基因组包含编码融合至GAA多肽的靶向肽(TP)的异源核酸。在一些实施方式中,靶向肽是细胞外受体的配体,其中靶向肽结合靶细胞表面上受体的细胞外结构域,并且在受体内化时,允许多肽在人溶酶体中定位。在一个实施方式中,靶向肽包含能够结合阳离子非依赖甘露糖-6-磷酸受体的尿激酶型纤溶酶原受体部分。在一些实施方式中,靶向肽并入了IGF2靶向肽的一个或多个氨基酸序列。
在一些实施方式中,本文公开的IGF2靶向肽包含细胞外受体的配体的至少一部分,例如,IGF2靶向肽结合至人阳离子非依赖甘露糖-6-磷酸受体(CI-MPR)或IGF2受体。
IGF2也以别名为人所知:11号染色体开放阅读框43、胰岛素样生长因子2、IGF-II、FLJ44734、IGF2、生长介素A和preptin。野生型人IGF2序列的mRNA对应于:
GCTTACCGCCCCAGTGAGACCCTGTGCGGCGGGGAGCTGGTGGACACCCTCCAGTTCGTCTGTGGGGACCGCGGCTTCTACTTCAGCAGGCCCGCAAGCCGaTGTGAGCCGTCGCAGCCGTGGCATCGTTGAGGAGTGCTGTTTCCGCAGCTGTGACCTGGCCCTCCTGGAGACGTACTGTGCTACCCCCGCCAAGTCCGAG(SEQ ID NO:1)。全长IGF2蛋白(包括IGF2靶向序列)由NM_000612.6的核酸序列编码,并且编码全长IGF2蛋白NP_000603.1。
成熟的人IGF2靶向肽如下所示:
Figure BDA0003751229800000631
人IGF2的编码序列也在美国专利8,492,388(参见例如图2)中公开,该专利通过引用的方式将其整体并入本文。IGF2蛋白被合成为前原蛋白,所述前原蛋白具有位于氨基末端的24个氨基酸的信号肽和羧基末端区域的89个氨基酸,这两者都在翻译后被去除,其在O'Dell等,(1998)Int.J.Biochem Cell Biol.30(7):767-71中进行了综述。成熟的蛋白具有67个氨基酸。成熟IGF2的经利什曼原虫密码子优化的版本公开于美国专利8,492,388中(参见例如8,492,388的图3)(Langford等,(1992)Exp.Parasitol.74(3):360-1))。制备包含成熟多肽的第1-7位或第2-7位氨基酸缺失(Δ1-7)、第27位残基由酪氨酸至亮氨酸(Y27L)的改变或二者均突变(Δ1-7、Y27L,或Δ2-7、Y27L)的额外的盒以产生仅对如下所述的期望的受体具有特异性的IGF2盒。因此,在一些实施方式中,IGF2靶向序列可以选自以下的任一种:被涵盖以在本文中使用的野生型、Y27L、Δ1-7、Δ2-7和Y27L-Δ1-7、Y27L-Δ2-7、V43M、Y27L-V43M、Y27L-Δ1-7-V43M、Y27L-Δ2-7-V43M IGF2变体。
用于本文的方法和组合物中的示例性IGF2靶向肽在2019年11月19日提交的美国临时申请62,937,556以及2019年11月15日提交的国际申请PCT/US19/61653和2019年11月15日提交的国际申请PCT/US19/61701中公开,各自通过引用的方式将其整体并入本文。
在一些实施方式中,用于本文的方法和组合物中的IGF2靶向肽可以具有美国申请2019/0343968中所公开的以下任一种或多种的修饰:E6R、F26S、Y27L、V43L、F48T、R495、S50I、A54R、L55R、K65R,将其整体并入本文。在一些实施方式中,除了具有选自E6R、F26S、Y27L、V43L、F48T、R495、S50I、A54R、L55R和K65R的一种或多种修饰之外,IGF2靶向肽还具有V43M修饰。在一些实施方式中,除了具有选自E6R、F26S、Y27L、V43L、F48T、R495、S50I、A54R、L55R和K65R的一种或多种修饰之外,IGF2靶向肽还具有Δ1-7或Δ2-7修饰。在一些实施方式中,IGF2靶向肽具有:Δ1-7或Δ2-7修饰,V43M修饰,以及选自E6R、F26S、Y27L、V43L、F48T、R495、S50I、A54R、L55R和K65R的一种或多种修饰。
在具体实施方式中,IGF2靶向肽包含在第43位缬氨酸处的修饰,其中缬氨酸被修饰为met(V43M),使得翻译起始在第43位氨基酸处开始。在本文中被涵盖以用作靶向肽或IGF2靶向肽的具有V43M修饰的IGF2靶向肽结合阳离子非依赖甘露糖-6-磷酸受体。在替代实施方式中,IGF2靶向肽是具有V43改变为Met的Δ1-42的IGF2(即,IGF2-Δ1-42(SEQ IDNO:8)或IGF2-V43M(SEQ ID NO:9)。
在一些实施方式中,rAAV基因组包含编码IGF2-GAA融合蛋白的核酸,其中,将编码如下的核酸融合至编码GAA蛋白的核酸的5'端,创建融合蛋白(例如,IGF2-GAA融合多肽),所述融合蛋白可被多种细胞类型摄取并转运至溶酶体:成熟的IGF2靶向肽(SEQ ID NO:5)或IGF2靶向肽变体(例如SEQ ID NO:6(IGF2-Δ2-7)、SEQ ID NO:7(IGF2-Δ1-7)、SEQ IDNO:8(IGF2--Δ1-42)、SEQ ID NO:9(IGF2-V43M)),或与SEQ ID NO:5-SEQ ID NO:9具有至少85%、或90%、或95%的序列同一性的序列。或者,可将编码前体IGF2多肽的核酸融合至GAA基因的3'端;所述前体包含在哺乳动物细胞中被切割以产生成熟的IGF2多肽的羧基末端部分,但是优选地省略IGF2靶向肽(或移至GAA基因的5'端)。与涉及糖基化的方法相比,该方法具有许多优点,包括简单性和成本效益,因为一旦分离出蛋白质,就无需进行进一步的修饰。
在一些实施方式中,被涵盖以用于本文中的IGF2靶向肽在美国专利7,785,856和9,873,868中描述,以引用的方式将它们的整体各自并入本文。
(i)IGF2的缺失突变体:
在一些实施方式中,IGF2靶向肽是2019年11月15日提交的国际申请PCT/US19/61701中公开的经修饰的或截短的IGF2靶向肽(也被称为IGF2的缺失突变体),通过引用的方式将其整体并入本文。例如,在一些实施方式中,IGF2靶向肽包含V43M修饰以及第1-42位氨基酸中的一个或多个氨基酸的任何缺失。例如,在本文公开的方法和组合物的一些实施方式中,IGF2靶向肽包含V43M并且进一步包含选自以下任一项的一个或多个缺失:SEQ IDNO:5的Δ1-3、Δ1-4、Δ1-5、Δ1-6、Δ1-8、Δ1-9、Δ1-10、Δ1-11、Δ1-12、Δ1-13、Δ1-14、Δ1-15、Δ1-16、Δ1-17、Δ1-18、Δ1-19、Δ1-20、Δ1-21、Δ1-22、Δ1-23、Δ1-24、Δ1-25、Δ1-26、Δ1-27、Δ1-28、Δ1-29、Δ1-30、Δ1-31、Δ1-32、Δ1-33、Δ1-34、Δ1-35、Δ1-36、Δ1-37、Δ1-38、Δ1-39、Δ1-40、Δ1-41或Δ1-42,并且其中SEQ ID NO:5的第43位残基是甲硫氨酸(V43M)。在本文公开的方法和组合物的一些实施方式中,IGF2靶向肽包含V43M并且进一步包含Δ1-7缺失(IGF2-Δ1-7,V43M)。
在本文公开的方法和组合物的一些实施方式中,溶酶体IGF2靶向肽进一步包含选自以下任一项的一种或多种修饰:SEQ ID NO:5的Δ2-3、Δ2-4、Δ2-5、Δ2-6、Δ2-8、Δ2-9、Δ2-10、Δ2-11、Δ2-12、Δ2-13、Δ2-14、Δ2-15、Δ2-16、Δ2-17、Δ2-18、Δ2-19、Δ2-20、Δ2-21、Δ2-22、Δ2-23、Δ2-24、Δ2-25、Δ2-26、Δ2-27、Δ2-28、Δ2-29、Δ2-30、Δ2-31、Δ2-32、Δ2-33、Δ2-34、Δ2-35、Δ2-36、Δ2-37、Δ2-38、Δ2-39、Δ2-40、Δ2-41或Δ2-42,并且其中SEQ ID NO:5的第43位残基是甲硫氨酸(V43M)。在本文公开的方法和组合物的一些实施方式中,IGF2靶向肽包含V43M并且进一步包含Δ2-7缺失(IGF2-Δ2-7,V43M)。
在一些实施方式中,用于融合至GAA-多肽的IGF2靶向肽可以包含IGF2的第8-28位和第41-61位氨基酸。在一些实施方式中,这些氨基酸段可以直接连接或通过接头分开。或者,可以在分开的多肽链上提供第8-28位和第41-61位氨基酸。在一些实施方式中,IGF2的第8-28位氨基酸或其保守置换变体可以融合至GAA多肽以从rAAV载体表达IGF2-GAA融合蛋白,并且分开的rAAV载体可以表达IGF2第41-61位氨基酸、或其保守置换变体。
为了促进IGF2靶向肽的恰当呈现和折叠,可以使用IGF2蛋白的较长部分。例如,可以使用包含第1-67位、第1-87位氨基酸残基或整个前体形式的IGF2靶向肽。
在一些实施方式中,IGF2靶向肽是编码以下任一项的IGF2靶向肽的核酸序列:SEQID NO:5的野生型成熟的人胰岛素样生长因子II(IGF2)的第1位残基随后为第8-67位残基(即SEQ ID NO:6;即IGF2-delta 2-7);SEQ ID NO:5的野生型成熟的人胰岛素样生长因子II(IGF2)的第8-67位残基(即SEQ ID NO:7;IGF2-delta 1-7)或SEQ ID NO:5的野生型成熟的人胰岛素样生长因子II(IGF2)的第43-67位残基(即,IGF2-V43M(SEQ ID NO:9)或IGF-delta 1-42(SEQ ID NO:8))。
在本文公开的方法和组合物的一些实施方式中,IGF2靶向肽是选自包含以下任一项的任意核酸序列的核酸序列:SEQ ID NO:2(即,IGF2-delta 2-7);SEQ ID NO:3(即IGF2-delta 1-7)或SEQ ID NO:4(即IGF2-V43M)或与其具有至少85%、90%、95%、96%、97%、98%或99%序列同一性的序列。
在本文公开的方法和组合物的一些实施方式中,IGF2(V43M)序列是编码以下的核酸序列:SEQ ID NO:65(IGF2Δ2-7V43M)或SEQ ID NO:66(IGFΔ1-7V43M)中任一种的IGF2(V43M)序列,或与SEQ ID NO:65具有至少85%、或90%、或95%、或96%、或97%、或98%、或99%、或100%同一性的氨基酸序列,或与SEQ ID NO:66具有至少85%、或90%、或95%、或96%、或97%、或98%、或99%、或100%同一性的氨基酸序列。
表3:编码IGF2靶向肽的示例性核酸序列:
Figure BDA0003751229800000671
在一些实施方式中,为了促进IGF2靶向肽的恰当呈现和折叠,可以使用IGF2蛋白的较长部分。例如,可以使用包含第1-67位、第1-87位氨基酸残基或整个前体形式的IGF2靶向肽。
在本文公开的方法和组合物的一些实施方式中,重组AAV包含编码信号肽-GAA(SP-GAA)融合多肽的异源核酸序列,该多肽进一步包含位于分泌信号肽(SP)和α-葡萄糖苷酶(GAA)多肽之间的IGF2靶向肽。
在本文公开的方法和组合物的一些实施方式中,重组AAV载体包含编码结合人阳离子非依赖甘露糖-6-磷酸受体(CI-MPR)或IGF2受体的IGF2靶向肽的异源核酸序列,例如异源核酸序列编码具有SEQ ID NO:5的氨基酸序列的IGF2靶向肽或包含结合至IGF2受体的SEQ ID NO:5中的至少一个氨基修饰。在一些实施方式中,重组AAV载体包含编码IGF2靶向肽的异源核酸序列,所述IGF2靶向肽具有SEQ ID NO:5中的至少一个氨基修饰,所述修饰是V43M氨基酸修饰(SEQ ID NO:8或SEQ ID NO:9)或Δ2-7(SEQ ID NO:6)或Δ1-7(SEQ IDNO:7)、或者是与SEQ ID NO:5-SEQ ID NO:9具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的IGF2肽。
在本文公开的方法和组合物的一些实施方式中,编码IGF2靶向肽的核酸选自以下中的任一项:SEQ ID NO:2(IGF2-Δ2-7)、SEQ ID NO:3(IGF2-Δ1-7)、或SEQ ID NO:4(IGF2V43M),或与SEQ ID NO:2、SEQ ID NO:3或SEQ ID NO:4中的任一项具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的核酸序列。
在本文所述的组合物和方法的一些实施方式中,IGF2靶向肽是编码以下任一项的核酸序列:SEQ ID NO:5的野生型成熟的人胰岛素样生长因子II(IGF2)的第1位残基随后为第8-67位残基(即IGF2-delta 2-7或IGF2Δ2-7;其对应于SEQ ID NO:6);SEQ ID NO:5的野生型成熟的人胰岛素样生长因子II(IGF2)的第8-67位残基(即IGF2-delta 1-7或IGF2Δ1-7,其对应于SEQ ID NO:7)或SEQ ID NO:5的野生型成熟的人胰岛素样生长因子II(IGF2)的第43-67位残基(即IGF2delta 1-42或IGF2Δ1-42,其对应于SEQ ID NO:8)。在本文所述的组合物和方法的一些实施方式中,IGF2靶向肽是具有第43位氨基酸残基的修饰的核酸序列,例如第43位残基被修饰为起始密码子(例如IGF2-V43M(对应于SEQ ID NO:9))。
在本文所述的组合物和方法的一些实施方式中,IGF2靶向肽是包含以下任一项的核酸序列:SEQ ID NO:2(即IGF2-delta 2-7);SEQ ID NO:3(即IGF2-delta 1-7)或SEQ IDNO:4(即IGF2-V43M)。
在本文所述的组合物和方法的一些实施方式中,含有GAA多肽和IGF2靶向肽的融合蛋白包含人酸性α-葡萄糖苷酶(GAA)多肽(SEQ ID NO:10)的第40-952位氨基酸残基或第70-952位残基,所述多肽附着于包含野生型成熟的人胰岛素样生长因子II(IGF2)(SEQ IDNO:5)的第1位残基随后为第8-67位残基的IGF2靶向肽(即,成熟的人IGF2(SEQ ID NO:5)的第2-7位残基不存在),其中IGF2靶向肽连接至人GAA(SEQ ID NO:10)的第70位氨基酸残基。
在本文所述的组合物和方法的一些实施方式中,含有GAA多肽和IGF2靶向肽的融合蛋白包含人酸性α-葡萄糖苷酶(GAA)多肽(SEQ ID NO:10)的第40-952位氨基酸残基或第70-952位残基,所述多肽附着于包含野生型成熟的人胰岛素样生长因子II(IGF2)(SEQ IDNO:5)的第8-67位残基的IGF2靶向肽(即成熟的人IGF2的第1-7位残基(即Y R P S E T;SEQID NO:63)不存在),其中IGF2靶向肽连接至人GAA(SEQ ID NO:10)的第70位氨基酸残基。
在本文所述的组合物和方法的一些实施方式中,含有GAA多肽和IGF2靶向肽的融合蛋白包含人酸性α-葡萄糖苷酶(GAA)多肽(SEQ ID NO:10)的第40-952位氨基酸残基或第70-952位残基,所述多肽附着于包含野生型成熟的人胰岛素样生长因子II(IGF2)(SEQ IDNO:5)的第43-67位残基的经修饰的IGF2靶向肽(其中成熟的人IGF2(SEQ ID NO:5)的第1-42位残基不存在),并且其中IGF2靶向肽连接至人GAA(SEQ ID NO:10)的第70位氨基酸残基。
在本文公开的方法和组合物的一些实施方式中,重组AAV载体包含编码IGF2肽的异源核酸序列,其中IGF2肽序列是SEQ ID NO:8或SEQ ID NO:9,或与SEQ ID NO:8或SEQ IDNO:9具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的IGF2肽。
(ii)经修饰的IGF2靶向肽和IGF2同源物
在一些实施方式中,可以对编码IGF2的核酸进行修饰以减弱其对IGFBP的亲和力,和/或降低与IGF-I受体结合的亲和力,从而增加对溶酶体的靶向并增加融合的GAA-多肽的生物利用度。
IGF2靶向肽优选地特异性地靶向并结合至M6P受体。特别有用的是在IGF2多肽中具有突变的IGF2靶向肽,其产生以高亲和力结合CI-MPR/M6P受体、而不再以明显的亲和力结合其它两个受体的蛋白。
IGF2(V43M)靶向肽优选地特异性地靶向至M6P受体。特别有用的是在IGF2多肽中具有突变的IGF2(V43M)靶向肽,其产生以高亲和力结合CI-MPR/M6P受体、而不再以明显的亲和力结合其它两个受体的蛋白。
还可以对IGF2(V43M)靶向肽进行修饰以最小化对血清IGF结合蛋白(IGFBP)(Baxter(2000)Am.J.Physiol Endocrinol Metab.,278(6):967-76)和对IGF-I受体的结合,以避免IGF2构建体的螯合(sequestration)。许多研究已经定位了IGF-1和IGF2中的结合至IGF结合蛋白所需的残基。可以对具有这些残基处的突变的构建体筛选对M6P/IGF2受体的高亲和力结合的保留、以及对IGF结合蛋白的降低的亲和力。例如,据报道,用Ser代替IGF2的Phe 26降低了IGF2对IGFBP-1和IGFBP-6的亲和力,而对与M6P/IGF2受体的结合没有影响(Bach等,(1993)J.Biol.Chem.268(13):9246-54)。其它置换(例如Ser替换Phe 19和Lys替换Glu 9)也可以是有利的。与IGF2高度保守的IGF-I的区域中的相似突变单独地或组合地引起IGF-BP结合的大幅降低(Magee等,(1999)Biochemistry 38(48):15863-70)。
还可以对IGF2靶向肽进行修饰以最小化对血清IGF结合蛋白(IGFBP)和IGF-I受体的结合,以避免IGF2构建体的螯合(sequestration)。
在一些实施方式中,IGF2靶向肽被修饰为弗林酶(furin)耐受的,即对识别Arg-X-X-Arg切割位点的弗林蛋白酶的降解耐受。此类IGF2靶向肽在美国申请22012/0213762中公开,以引用的方式将其整体并入本文。在一些实施方式中,用于本文所述的rAAV基因组中的弗林酶耐受性IGF2靶向肽在如下区域内包含突变,所述区域对应于SEQ ID NO:5(wt IGF2靶向肽)的第30-40位(例如第31-40位、第32-40位、第33-40位、第34-40位、第30-39位、第31-39位、第32-39位、第34-37位、第32-39位、第33-39位、第34-39位、第35-39位、第36-39位、第37-40位、第34-40位)氨基酸,其可以被任何其它氨基酸置换或被删除。例如,在位置34处的置换可能影响弗林酶对第一切割位点的识别。在每个识别位点内插入一个或多个额外的氨基酸可消除一个或两个弗林酶切割位点。简并位置中的一个或多个残基的缺失也可以消除两个弗林酶切割位点。
在一些实施方式中,弗林酶耐受性IGF2靶向肽在对应于SEQ ID NO:5的Arg37(R37)或Arg40(R40)的位置处含有氨基酸置换。在一些实施方式中,弗林酶耐受性IGF2靶向肽在SEQ ID NO:5的Arg37或Arg40位置处包含Lys(K)或Ala(A)置换。其它置换也是可能的,包括于第37位和第40位两者处的Lys和/或Ala突变的组合,或Lys(K)或Ala(A)以外的氨基酸置换。在一些实施方式中,被涵盖以用于本文公开的rAVV基因组中的IGF2靶向肽是IGFΔ2-7-K37、或IGFΔ2-7-K40、或IGFΔ1-7-K37、或IGFΔ1-7-K40,这表明IGF2靶向肽分别具有aa 2-7或1-7的缺失和位于第37位的Arg(R)残基变为赖氨酸(即R37K修饰)或R40K的修饰。在一些实施方式中,被涵盖以用于本文公开的rAVV基因组中的IGF2靶向肽是IGFΔ2-7-K37-K40或IGFΔ1-7-R37K-R40K,表明IGF2靶向肽具有第2-7位残基或第1-7位残基的缺失以及在第37位和第40位的R残基变为赖氨酸(R37K和R40K)的修饰。在一些实施方式中,被涵盖以用于本文公开的rAVV基因组中的IGF2靶向肽选自以下中的任一项:IGFΔ2-7-R37A、或IGFΔ2-7-R40A、或IGFΔ1-7-R37A、或IGFΔ1-7-R40A、或IGFΔ2-7-R37A-R40A、或IGFΔ1-7-R37A-R40A。在美国申请2012/0213762(以引用的方式将其整体并入本文)中公开了被涵盖以用于本文公开的rAVV基因组中的IGF2靶向肽的示例性构建体。
在一些实施方式中,适用于本发明的弗林酶耐受性IGF2靶向肽可包含额外的突变。例如,可以改变多达30%或更多的SEQ ID NO:5的残基(例如,多达1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%或更多的残基可被改变)。因此,适用于本发明的弗林酶耐受性IGF2突变蛋白可具有与SEQ ID NO:5至少70%(包括至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%)相同的氨基酸序列。
此外,由于IGF2靶向肽将M6P替换为靶向溶酶体的部分,因此本文公开的IGF2靶向肽的使用在本领域中也被称为糖基化非依赖性溶酶体靶向(GILT)。GILT技术的详细信息描述于美国申请公开号2003/0082176、2004/0006008、2004/0005309、2003/0072761、2005/0281805、2005/0244400,以及国际公开WO 03/032913、WO03/032727、WO 02/087510、WO 03/102583、WO 2005/078077,以引用的方式将其公开内容全部并入。
在2019年11月19日提交的美国临时申请62,937,556和2019年11月15日提交的PCT申请PCT/US19/61653中公开了用于本文公开的方法和组合物中的IGF2靶向肽的氨基酸序列的其它修饰,两者均通过引用的方式将其整体并入本文。
IGF2以相对高的亲和力结合至IGF2/M6P和IGF-I受体,并以较低的亲和力结合至胰岛素受体。将IGF2的第48-50位残基(Phe Arg Ser)置换为来自胰岛素的相应残基(ThrSer Ile)、或将第54-55位残基(Ala Leu)置换为来自IGF-I的相应残基(Arg Arg)引起降低的对IGF2/M6P受体的结合,但是保留了对IGF-I和胰岛素受体的结合(Sakano等,(1991)J.Biol.Chem.266(31):20626-35)。
IGF2结合至阳离子非依赖M6P受体的重复序列11。实际上,其中仅重复序列11融合至阳离子非依赖M6P受体的跨膜结构域和胞质结构域的微型受体(minireceptor)能够(以约为全长受体的亲和力的十分之一的亲和力)结合IGF2,并介导IGF2的内化和其向溶酶体的递送(Grimme等,(2000)J.Biol.Chem.275(43):33697-33703)。M6P受体的结构域11的结构是已知的(蛋白质数据库条目1GP0和1GP3;Brown等,(2002)EMBO J.21(5):1054-1062)。推定的IGF2蛋白结合位点是被认为与IGF2的疏水氨基酸相互作用的疏水口袋;IGF2的候选氨基酸包括亮氨酸8、苯丙氨酸48、丙氨酸54和亮氨酸55。尽管重复序列11对IGF2结合而言是足够的,但包含阳离子非依赖M6P受体的较大部分(例如重复序列10-13或1-15)的构建体通常以更高的亲和力以及增加的pH依赖性结合IGF2(参见例如,Linnell等,(2001)J.Biol.Chem.276(26):23986-23991)。
用Leu置换IGF2残基Tyr 27或用Phe置换Ser 26使IGF2对IGF-I受体的亲和力分别降低94倍、56倍和4倍(Torres等,(1995)J.Mol.Biol.248(2):385-401)。人IGF2第1-7位残基的缺失使得对人IGF-I受体的亲和力降低30倍,并伴随着对大鼠IGF2受体的亲和力提高12倍(Hashimoto等,(1995)J.Biol.Chem.270(30):18013-8)。IGF2的C-末端的截短(第62-67位残基)也看起来将IGF2对IGF-I受体的亲和力降低了5倍(Roth等,(1991)Biochem.Biophys.Res.Commun.181(2):907-14)。
用丝氨酸置换IGF2残基苯丙氨酸26使对IGFBP 1-5的结合降低了5-75倍(Bach等,(1993)J.Biol.Chem.268(13):9246-54)。用苏氨酸-丝氨酸-异亮氨酸替代IGF2的第48-50位残基使得对大多数IGFBP的结合降低了多于100倍(Bach,(1993)J.Biol.Chem.268(13):9246-54);然而,这些残基对于结合至阳离子非依赖甘露糖-6-磷酸受体而言也重要。破坏对IGF-I受体的结合的Y27L置换干扰了与IGFBP3和酸不稳定亚基的三元复合物的形成(Hashimoto等,(1997)J.Biol.Chem.272(44):27936-42);该三元复合物占循环中的IGF2的大部分(Yu等,(1999)J.Clin.Lab Anal.13(4):166-72)。IGF2的前六个残基的缺失也干扰IGFBP结合(Luthi等,(1992)Eur.J.Biochem.205(2):483-90)。
关于IGF-I与IGFBP的相互作用的研究另外揭示了丝氨酸置换第16位苯丙氨酸不影响二级结构,但是使IGFBP结合降低了40倍至300倍(Magee等,(1999)Biochemistry 38(48):15863-70)。将第9位谷氨酸变为赖氨酸也引起IGFBP结合的显著降低。此外,双突变第9位赖氨酸/第16位丝氨酸表现出对IGFBP的最低的亲和力。在IGF-I和IGF2的该区域之间的序列的保守性表明,当在IGF2中进行相似突变(谷氨酸12赖氨酸/苯丙氨酸19丝氨酸)时,将观察到类似的效果。
在一些实施方式中,IGF2(V43M)序列至少包含第48-55位氨基酸;至少包含第8-28位和第41-61位氨基酸;或至少包含第8-87位氨基酸,或它们的序列变体(例如,R68A)或它们的截短形式(例如,从第62位进行C-末端截短),其结合阳离子非依赖甘露糖-6-磷酸受体。
在本发明的另一实施方式中,将编码靶向肽(例如,IGF2靶向肽)的rAAV基因组在成熟的70/76kDal多肽和C-末端结构域的连接处(例如在第791位处)插入到天然GAA编码序列中。这创建了单个嵌合多肽。在一些实施方式中,蛋白酶切割位点可恰好地插入到靶向肽(例如,IGF2靶向肽)的下游。
在一个实施方式中,靶向肽(例如本文定义的IGF2靶向肽)直接融合至GAA多肽的N-或C-末端。在另一实施方式中,IGF2靶向肽通过间隔区融合至GAA多肽的N-或C-末端。在一个具体实施方式中,IGF2靶向肽通过10-25个氨基酸的间隔区融合至GAA多肽。在另一实施方式中,IGF2靶向肽通过包含甘氨酸残基的间隔区融合至GAA多肽。
在一些实施方式中,IGF2靶向肽通过至少1个、2个或3个氨基酸的间隔区融合至GAA多肽。在一些实施方式中,所述间隔区包含氨基酸GAP或Gly-Ala-Pro(SEQ ID NO:31),或与其至少50%相同的氨基酸序列。在一些实施方式中,所述间隔区是GGG、或GA、或AP、或GP、或其变体。在一些实施方式中,所述间隔区由核酸GGC GCG CCG(SEQ ID NO:30)编码。
在一些实施方式中,IGF2靶向肽通过包含螺旋结构的间隔区融合至GAA多肽。在另一具体实施方式中,IGF2靶向肽通过与序列GGGTVGDDDDK(SEQ ID NO:35)至少50%相同的间隔区融合至GAA多肽。在本文公开的方法和组合物的一些实施方式中,所述间隔区是SEQID NO:31(由SEQ ID NO:30的核酸编码)。在本文公开的方法和组合物的一些实施方式中,所述间隔区选自以下中的任一项:SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ IDNO:34或SEQ ID NO:35,或与它们具有至少85%、90%、95%、96%、97%、98%或99%序列同一性的序列。
(iii)结合至阳离子非依赖M6P受体(CI-MPR)的替代靶向肽。
在一些实施方式中,靶向肽是溶酶体靶向肽或蛋白质,或除本文公开的TGF2靶向肽之外的其它部分,所述TGF2靶向肽以不依赖于甘露糖-6-磷酸的方式结合至阳离子非依赖M6P/IGF2受体(CI-MPR)。CI-MPR还包含可用作靶向肽的至少三种不同配体的结合位点。如本文所公开的,IGF2配体主要通过与重复序列11的相互作用,在pH 7.4或约pH 7.4时以约14nM的解离常数结合至CI-MPR。CI-MPR能够结合高分子量O-糖基化的IGF2形式。因此,在一些实施方式中,可以对IGF2靶向肽进行转录后修饰以包含O-糖基化。
在替代的实施方式中,结合至CI-MPR的靶向肽为视黄酸。视黄酸以2.5nM的解离常数结合至受体。用视黄酸对阳离子非依赖M6P受体进行的亲和力光标记不干扰IGF2或M6P与受体的结合,表明视黄酸结合至受体上的不同位点。视黄酸与受体的结合改变了受体的细胞内分布(受体在细胞质囊泡中的积累量更大),并且还增强了M6P修饰的β-葡萄糖醛酸苷酶的摄取。视黄酸具有可光活化的部分,该部分可用于将其连接至治疗剂,而不干扰其结合至阳离子非依赖M6P受体的能力。
尿激酶型纤溶酶原受体(uPAR)也以9μM的解离常数结合CI-MPR。uPAR是大多数细胞类型的表面上的GPI锚定受体,在该处它作为粘附分子发挥作用,并在纤溶酶原和TGF-β的蛋白水解激活中发挥作用。uPAR对CI-M6P受体的结合将其靶向至溶酶体,从而调节其活性。因此,将uPAR的细胞外结构域或其能够结合阳离子非依赖M6P受体的部分融合至治疗剂使得该试剂能够靶向至溶酶体。
D.GAA多肽的间隔区和融合连接
当将GAA表达为具有分泌信号肽(例如,SS-GAA融合多肽)或靶向肽(即,SS-IGF2-GAA多肽双融合多肽)的融合蛋白时,信号肽或IGF2靶向肽可以直接融合至GAA多肽或可以通过接头与GAA多肽分开。氨基酸接头(在本文中也称为“间隔区”)并入不同于天然蛋白质中的该位置处出现的一个或多个氨基酸。通常可以将间隔区设计成柔性的或设计为在两个蛋白部分之间插入结构,例如α-螺旋。
因此,在本文公开的方法和组合物的一些实施方式中,重组AAV载体包含编码IGF2-GAA融合多肽的异源核酸序列,其中所述IGF2-GAA融合蛋白进一步包含间隔区,所述间隔区包含长度为至少1个氨基酸的核苷酸序列,其位于GAA多肽的N-末端和IGF2靶向肽的C-末端。在本文公开的方法和组合物的一些实施方式中,重组AAV载体包含异源核酸序列,所述异源核酸序列包含编码具有至少1个氨基酸的间隔区的核酸,该核酸位于编码IGF2靶向肽的核酸与编码GAA多肽的核酸之间。
在一个实施方式中,IGF2靶向肽直接融合至GAA多肽的N-或C-末端。在另一个实施方式中,IGF2靶向肽通过间隔区融合至GAA多肽的N-或C-末端。在一个具体实施方式中,IGF2靶向肽通过具有10-25个氨基酸的间隔区融合至GAA多肽。在另一具体实施方式中,IGF2靶向肽通过包含甘氨酸残基的间隔区融合至GAA多肽。在另一具体实施方式中,IGF2靶向肽通过包含螺旋结构的间隔区融合至GAA多肽。在另一具体实施方式中,IGF2靶向肽通过与序列GGGTVGDDDDK(SEQ ID NO:35)至少50%相同的间隔区融合至GAA多肽。
在一些实施方式中,间隔区或接头可以相对较短,例如至少1个、2个、3个、4个或5个氨基酸,或诸如序列Gly-Ala-Pro(SEQ ID NO:31)或Gly-Gly-Gly-Gly-Gly-Pro(SEQ IDNO:32);或可以较长,例如长度为5-10个氨基酸或长度为10-25个氨基酸。例如,已经描述了3-4拷贝的序列(GGGGS(SEQ ID NO:33))的柔性重复接头和2-5拷贝的序列(EAAAK(SEQ IDNO:34))的α-螺旋重复接头(Arai等,(2004)Proteins:Structure,Function andBioinformatics 57:829-838)。
还报道了在IGF2融合蛋白的背景下的另一种接头GGGTVGDDDDK(SEQ ID NO:35)的使用(DiFalco等,(1997)Biochem.J.326:407-413),并且被涵盖以进行使用。并入人血清蛋白的α-螺旋部分的接头可用于使接头区域的免疫原性最小化。
在一些实施方式中,间隔区由核酸GGC GCG CCG(SEQ ID NO:30)编码,该核酸编码包含氨基酸GAP或Gly-Ala-Pro(SEQ ID NO:31)的氨基酸间隔区。
GAA多肽中与信号肽(以生成SS-GAA融合蛋白)或与靶向肽(例如,以生成SP-IGF2-GAA双融合多肽)融合的融合连接的位点应小心地选择以促进融合蛋白中的每个多肽的恰当折叠和活性,并防止信号肽与GAA多肽的过早分离。
在一些实施方式中,将IGF2靶向肽通过包含螺旋结构的间隔区融合至GAA多肽。在另一具体的实施方式中,IGF2靶向肽通过与序列GGGTVGDDDDK(SEQ ID NO:35)至少50%相同的间隔区融合至GAA多肽。在本文公开的方法和组合物的一些实施方式中,所述间隔区是SEQ ID NO:31(由SEQ ID NO:30的核酸编码)。在本文公开的方法和组合物的一些实施方式中,所述间隔区选自以下的任一种:SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:33、SEQ IDNO:34或SEQ ID NO:35。
可以生成用于创建IGF2-GAA融合蛋白的四种示例性策略,所述策略在2019年11月19日提交的临时申请62,937,556和2019年11月15日提交的PCT/US19/61653中公开,通过引用的方式将其整体并入全文。
在一些实施方式中,靶向肽(例如,IGF2靶向肽)可以直接或通过间隔区融合至GAA的第40位氨基酸或第70位氨基酸,该位置允许蛋白质的表达、GAA蛋白的催化活性、以及被如本文实施例中所述的IGF2序列恰当靶向。或者,靶向肽(例如,IGF2靶向肽)可以在将GAA的C-末端结构域与成熟多肽分离的切割位点处或其附近融合。这允许具有内部靶向肽(例如IGF2靶向肽)的GAA蛋白的合成,根据切割位点的位置,所述蛋白任选地可被切割以将成熟多肽或C-末端结构域从靶向结构域释放。或者,成熟多肽可以在约第791位合成为融合蛋白,而不在表达构建体的开放阅读框中并入C-末端序列。
为了促进IGF2靶向肽的折叠,可以对邻近融合连接的GAA氨基酸残基进行修饰。例如,由于GAA半胱氨酸残基可能干扰靶向肽(例如IGF2靶向肽)的恰当折叠,因此可以删除末端GAA的第952位半胱氨酸,或用丝氨酸置换以容纳C-末端的靶向肽(例如IGF2靶向肽)。靶向肽(例如,IGF2靶向肽)也可以紧邻最终的Cys952之前融合。可以与最终的Cys952突变为丝氨酸一起,将倒数第二的cys938改变为脯氨酸。
E.CS序列
在本文公开的方法和组合物的一些实施方式中,重组AAV载体包含异源核酸序列,所述异源核酸序列进一步包含位于编码GAA多肽的核酸的3′端和3′ITR序列的5′端的胶原蛋白稳定性(CS)序列。在一些实施方式中,本文公开的rAAV基因组包含异源核酸序列,所述异源核酸序列可以任选地包含位于GAA基因的3′端和polyA信号的5′端的胶原蛋白稳定性序列(CS或CSS)。在一些实施方式中,可以用本文公开的3′UTR序列替换CS序列。
示例性的胶原蛋白稳定性序列包括CCCAGCCCACTTTTCCCCAA(SEQ ID NO:65)或与其具有至少85%、90%、95%、96%、97%、98%或99%序列同一性的序列。示例性的胶原蛋白稳定性序列可以具有PSPLFP(SEQ ID NO:66)的氨基酸序列或与其具有至少85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列。CS序列公开于Holick和Liebhaber,Proc.Nat.Acad.Sci.94:2410-2414,1997(参见例如图3,第5205页),以引用的方式将其整体并入本文。
F.启动子
在一些实施方式中,为实现适当水平的GAA表达,rAAV基因型包含肝特异性启动子(LSP)。LSP使得能够在肝脏中表达可操作地连接的基因,并且在一些实施方式中可以是诱导型LSP。在一个实施方式中,LSP位于5′端上游并且可操作地连接至编码GAA蛋白的异源核酸序列。示例性的肝特异性启动子在本文中公开,并且包括例如:包含SEQ ID NO:86、SEQID NO:91-SEQ ID NO:96或SEQ ID NO:146-SEQ ID NO:150的LSP,或其功能变体或功能片段;或本文表4中列出的任何LSP,或其功能片段或功能变体。在本文公开的组合物和方法的一些实施方式中,肝特异性启动子包括选自以下中的任一项的合成型肝特异性启动子、或肝特异性顺式调节元件(CRE)、合成型肝特异性顺式调节模块(CRM):本文表4中公开的SEQID NO:270-SEQ ID NO:341(具有CRM的最小LSP)或SEQ ID NO:342-SEQ ID NO:430(合成型肝特异性近端启动子)。在一些实施方式中,rAAV载体基因组可以包括一种或多种组成型启动子,例如病毒启动子或来自哺乳动物基因的启动子,它们通常积极促进转录。
(i)合成型肝特异性启动子
在本文公开的方法和组合物的一些实施方式中,所述启动子是肝特异性启动子,并且可以选自包括但不限于本文公开的表4中列出的那些启动子或其功能变体,和/或选自2019年11月19日提交的美国临时申请62,937,556的表4A和表4B中的任一种或其功能变体。
虽然甲状腺素转运蛋白启动子(TTR)(SEQ ID NO:431)和SP0412(SEQ ID NO:91)和SP0422(SEQ ID NO:92)在说明书和实施例中用作示例性肝特异性启动子(参见实施例1、实施例12和实施例13),但本领域普通技术人员可以容易地用如本文表4中公开的任何肝特异性启动子或其功能变体、和/或选自2019年11月19日提交的美国临时申请62,937,556的表4A和表4B的任何启动子或其功能变体来替换TTR。肝特异性启动子可包含本文公开的、在2019年11月19日提交的美国临时申请62,937,556的表4A和表4B中的肝特异性顺式调节元件(CRE)、合成型肝特异性顺式调节模块(CRM)或合成型肝特异性启动子,或其功能变体。
表4示出了示例性的肝特异性启动子。本文公开的相对较小尺寸的肝特异性启动子是有利的,因为它占用了最小量的载体的有效载荷。当LSP用于容量有限的载体(例如基于AAV的载体)时,这尤其重要。
表4:用于本文公开的方法和组合物中由SEQ ID NO示出的示例性LSP
Figure BDA0003751229800000801
Figure BDA0003751229800000811
Figure BDA0003751229800000821
(ii)肝特异性启动子的功能变体
在一些实施方式中,可用于本文公开的方法和组合物中的合成型肝特异性启动子是本文定义的双特异性启动子或三特异性启动子。作为说明性实例,肝双特异性启动子在肝脏和一种其它组织(例如肌肉)中具有活性。此外,肝双特异性启动子的另一说明性实例在肝脏和一种其它组织(例如脑)中具有活性。作为肝三特异性启动子的说明性实例在肝脏和两种其它组织(例如肌肉和脑)中具有活性。此外,肝三特异性启动子的另一说明性实例在肝脏和两种其它组织(例如肾脏和肌肉)中具有活性。
在一些实施方式中,与SEQ ID NO:86、SEQ ID NO:91-SEQ ID NO:96、SEQ ID NO:146-SEQ ID NO:150、SEQ ID NO:270-SEQ ID NO:430中的任一项具有至少50%、60%、70%、80%、90%或95%同一性的合成型肝特异性启动子包含源调节核酸序列(sourceregulatory nucleic acid sequence),该序列优先地在肝脏中具有活性,并且也在第二类型细胞或组织(例如肌肉或CNS)中具有较低程度的活性(例如,<50%、或约49%-40%、或约39%-30%、或约29%-20%、或约19-10%、或<10%的总表达)。
在一些实施方式中,启动子是合成型肝特异性启动子,该启动子包含顺式调节元件(CRE)CRE0051(SEQ ID NO:97)和CRE0042(SEQ ID NO:104)的组合,或其功能变体。其功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。通常,CRE可操作地连接至启动子元件。在一些优选的实施方式中,肝特异性启动子包含所述CRE或其功能变体,顺序为CRE0051(SEQ ID NO:97)、CRE0042(SEQ IDNO:104),然后是启动子元件(顺序如现有技术中的常规的以上游至下游的方向给出)。
启动子元件可以是任何合适的近端启动子或最小启动子。在一些实施方式中,启动子元件是最小启动子。当所述启动子是近端启动子时,通常优选近端启动子是肝特异性的。
在一些优选的实施方式中,启动子元件是CRE0059(SEQ ID NO:110),或其功能变体。CRE0059是如下文进一步讨论的近端启动子。
因此,在一个实施方式中,启动子包含以下调节元件:CRE0051(SEQ ID NO:97)、CRE0042(SEQ ID NO:104)和CRE0059(SEQ ID NO:110),或其功能变体。
CRE0051(SEQ ID NO:97)的功能变体是具有不同于CRE0051的序列的调节元件,但其基本上保留作为肝特异性CRE的活性。技术人员将理解的是,可以改变CRE的序列,同时保持其结合至必需转录因子(TF)以及增强表达的能力。与参考CRE相比,功能变体可以包含替换、缺失和/或插入,只要它们不会使得CRE基本上无功能。
在一些实施方式中,CRE0051的功能变体可以被视为当取代启动子中的CRE0051而进行置换时基本上保留其活性的CRE。例如,包含取代CRE0051而进行置换的CRE0051功能变体的肝启动子优选地保留其活性的80%,更优选地保留其活性的90%,更优选地保留其活性的95%,还更优选地保留其活性的100%。例如,就启动子SP0412(SEQ ID NO:91)作为实例而言,可以用CRE0051的功能变体替换SP0412中的CRE0051,并且所述启动子基本上保留其活性。在参考启动子的对照下,可以通过对合适的报告基因的表达与在等效条件下包含被置换的CRE的另外的相同启动子进行比较来评估活性的保留。
在一些实施方式中,CRE0051的功能变体包含用于与CRE0051相同的肝特异性TF的转录因子结合位点(TFBS)。CRE0051中存在的肝特异性TFBS按它们存在的顺序列出为:HNF1(SEQ ID NO:98)、HNF4(SEQ ID NO:99)、HNF3(SEQ ID NO:100)、HNF1′(SEQ ID NO:101)和HNF3′(SEQ ID NO:102),参见表5。因此CRE0051的功能变体优选地包含所有的这些TFBS。优选地,它们以与它们存在于CRE0051中相同的顺序(即以HNF1(SEQ ID NO:98)、HNF4(SEQ IDNO:99)、HNF3(SEQ ID NO:100)、HNF1′(SEQ ID NO:101)和HNF3′(SEQ ID NO:102)的顺序)存在。当顺式调节元件与启动子和基因相关联时,该顺序优选地被认为是处于从上游至下游的方向(即处于从转录起始位点(TSS)远端至TSS近端的方向)。可以在邻近的TFBS之间提供间隔区序列。在一些实施方式中,TFBS可适当地重叠,只要它们保持功能(即重叠序列均能够将它们各自的TF结合至调节表达所需的程度)。
在一些实施方式中,CRE0051(SEQ ID NO:97)的功能变体包含以下TFBS序列:GTTAATTTTTAAA(HNF1)(SEQ ID NO:98)、GTGGCCCTTGG(HNF4)(SEQ ID NO:99)、TGTTTGC(HNF3)(S EQ ID NO:100)、TGGTTAATAATCTCA(HNF1′)(SEQ ID NO:101)、然后是ACAAACA(HNF3)(SEQ ID NO:102)、与它们互补的序列、或保持了结合至它们各自的TF的能力的这些TFBS序列的功能变体。这些变体可能以与CRE0051相同的顺序(即,以上文它们被列出的顺序)存在。本领域众所周知的是存在与TFBS相关的序列变异性,并且对于给定的TFBS,通常存在共有序列,其中通常存在某种程度的偏差。可以使用位置权重矩阵(PWM)来说明有关TFBS中发生的变异的进一步信息,该矩阵表示通常在所述共有序列中的给定位置处发现的给定核苷酸所具有的频率。例如,可以在Jaspar或Transfac数据库(http://jaspar.genereg.net/和http://gene-regulation.com/pub/databases.html)中发现TF共有序列和相关的PWM的详细信息。该信息使得技术人员能够以保留并且在某些情况下甚至增强CRE功能的方式修改CRE的任何给定TFBS中的序列。
在一些实施方式中,CRE0051的功能变体包含以下序列:GTTAATFTTTAAA-Na-GTGGCCCTTGG-Nb-TGTTTGC-Nc-TGGTTAATAATCTCA-Nd-ACAAACA(SEQ ID NO:103),或与其至少70%、80%、90%、95%或99%相同的序列,其中Na、Nb、Nc和Nd代表任选的间隔区序列。当存在时,Na任选地具有10至26个核苷酸的长度,优选地具有14至22个核苷酸的长度,以及更优选地具有18个核苷酸的长度。当存在时,Nb任选地具有8至22个核苷酸的长度,优选地具有12至20个核苷酸的长度,更优选地具有16个核苷酸的长度。当存在时,Nc任选地具有1至10个核苷酸的长度,优选地具有1至5个核苷酸的长度,并且更优选地具有2个核苷酸的长度。当存在时,Nd合适地具有1至13个核苷酸的长度,优选地具有2至9个核苷酸的长度,并且更优选地具有5个核苷酸的长度。
在一些实施方式中,CRE由SEQ ID NO:98-SEQ ID NO:102或其功能变体组成。
应当注意的是,可以在双链多核苷酸的任一链上提供CRE或其功能变体并且可以以两种方向的任一种来提供CRE或其功能变体。就其而言,SEQ ID NO:97-SEQ ID NO:102的互补和反向互补序列或其功能变体落入本发明的范围内。包含根据SEQ ID NO:97或SEQ IDNO:103的序列或其功能变体的单链核酸也落入本发明的范围内。
在一些实施方式中,包含CRE0051(SEQ ID NO:97)或其功能变体的CRE或由CRE0051(SEQ ID NO:97)或其功能变体组成的CRE具有200个以下核苷酸的长度、150个以下核苷酸的长度、125个以下核苷酸的长度、或100个以下核苷酸的长度。
在一些实施方式中,包含CRE0042(SEQ ID NO:104)或其功能变体的CRE或由CRE0042(SEQ ID NO:104)或其功能变体组成的CRE具有200个以下核苷酸的长度、150个以下核苷酸的长度、125个以下核苷酸的长度、或100个以下核苷酸的长度。其功能变体可具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
CRE0042(SEQ ID NO:104)的功能变体是具有不同于CRE0042的序列的调节元件,但基本上保留了它们作为肝特异性CRE的活性。技术人员将理解的是,可以改变CRE的序列,同时保持其结合至必需转录因子(TF)和增强表达的能力。与参考CRE相比,功能变体可以包含替换、缺失和/或插入,只要它们不会使得CRE基本上无功能。
在一些实施方式中,CRE0042(SEQ ID NO:104)的功能变体可以被视为当取代启动子中的CRE0042而进行置换时基本上保留其活性的CRE。例如,包含取代CRE0042而进行置换的CRE0042功能变体的启动子优选地保留其活性的80%,更优选地保留其活性的90%,更优选地保留其活性的95%,还更优选地保留其活性的100%(与包含CRE0042(SEQ ID NO:104)的参考启动子相比)。例如,就启动子SP0412作为实例而言,可以用CRE0042的功能变体替换SP412(SEQ ID NO:91)中的CRE0042(SEQ ID NO:104),并且所述启动子基本上保留其活性。在参考启动子的对照下,可以通过对合适的报告基因的表达与在等效条件下包含被置换的CRE的另外的相同启动子进行比较来评估活性的保留。
在一些实施方式中,优选CRE0042(SEQ ID NO:104)的功能变体包含用于与CRE0042相同的肝特异性TF的TFBS。CRE0042中存在的肝特异性TFBS按它们存在的顺序列出为:HNF-3(SEQ ID NO:106)、C/EBP(SEQ ID NO:107)、HNF-4(SEQ ID NO::108)和C/EBP’(SEQ ID NO:109)。因此,CRE0042的功能变体优选地包含所有的这些TFBS。优选地,它们以与它们存在于CRE0042中相同的顺序(即以HNF-3、C/EBP、HNF-4然后是C/EBP的顺序)存在。当顺式调节元件与启动子和基因相关联时,该顺序优选地被认为是处于从上游至下游的方向(即处于从转录起始位点(TSS)远端至TSS近端的方向)。可以在邻近的TFBS之间提供间隔区序列。在一些实施方式中,TFBS可适当地重叠,只要它们保持功能(即重叠序列均能够结合它们各自的TF)。
在一些实施方式中,CRE042(SEQ ID NO:104)的功能变体包含以下的TFBS序列:GTTCAAACATG(HNF-3)(SEQ ID NO:106)、CTAATACTCTG(C/EBP)(SEQ ID NO:107)、TGCAAGGGTCAT(HNF-4)(SEQ ID NO:108)和TTACTCAACA(C/EBP)(SEQ ID NO:109)和与它们互补的序列,或保持了结合至它们各自的TF的能力的这些TFBS序列的功能变体。这些变体可能以与CRE0042相同的顺序(即,以上文它们被列出的顺序)存在。如上所述,本领域众所周知的是存在与TFBS相关的序列变异性,并且对于给定的TFBS,通常存在共有序列,其中通常存在某种程度的偏差。
在本发明的一些实施方式中,CRE0042的功能变体包含以下序列:GTTCAAACATG-Na-CTAATACTCTG-Nb-TGCAAGGGTCAT-Nc-TTACTCAACA(SEQ ID NO:105),或与其至少70%、80%、90%、95%或99%相同的序列,其中Na、Nb和Nc代表任选的间隔区序列。当存在时,Na任选地具有1至10个核苷酸的长度,优选地具有1至5个核苷酸的长度,以及更优选地具有2个核苷酸的长度。当存在时,Nb任选地具有1至10个核苷酸的长度,优选地具有2至6个核苷酸的长度,以及更优选地具有4个核苷酸的长度。当存在时,Nc任选地具有8至23个核苷酸的长度,优选地具有10至20个核苷酸的长度,以及更优选地具有15个核苷酸的长度。
在本发明的一些实施方式中,顺式调节增强子元件由CRE0042(SEQ ID NO:104)或其功能变体组成。
应当注意的是,可以在双链多核苷酸的任一链上提供CRE或其功能变体并且可以以两种方向的任一种来提供CRE或其功能变体。就其而言,SEQ ID NO:104或SEQ ID NO:105的互补和反向互补序列或其功能变体落入本发明的范围内。包含根据SEQ ID NO:104或SEQID NO:105的序列或其功能变体的单链核酸也落入本发明的范围内。
在一些实施方式中,包含CRE0042(SEQ ID NO:104)或其功能变体的CRE或由CRE0042(SEQ ID NO:104)或其功能变体组成的CRE具有200个以下核苷酸的长度、150个以下核苷酸的长度、125个以下核苷酸的长度、100个以下核苷酸的长度、或80个以下核苷酸的长度。
在一些实施方式中,包含CRE0059(SEQ ID NO:110)或其功能变体的CRE或由CRE0059(SEQ ID NO:110)或其功能变体组成的CRE具有200个以下核苷酸的长度、150个以下核苷酸的长度、125个以下核苷酸的长度、或100个以下核苷酸的长度。其功能变体可具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
如上所述,CRE0059(SEQ ID NO:110)的功能变体基本上保留了CRE00059作为肝特异性启动子元件发挥作用的能力。例如,当将CRE0059的功能变体替换入肝特异性启动子SP0412时,经修饰的启动子保留其活性的至少80%,更优选地保留其活性的至少90%,更优选地保留其活性的至少95%,并且还更优选地保留SP0412(SEQ ID NO:91)的100%的活性。适当地,CRE0059的功能变体包含与SEQ ID NO:110具有至少70%、80%、90%、95%或99%同一性的序列。
CRE0059是近端启动子并且包含在TSS上游的用于肝特异性TF(即HNFl)的TFBS。因此,CRE0059的功能变体优选地包含在TSS上游的用于HNF1的TFBS。
在一些实施方式中,CRE0059的功能变体包含与SEQ ID NO:110至少70%相同(优选与SEQ ID NO:110至少80%、90%、95%或99%相同)的序列,所述序列包含用于HNF1(SEQID NO:111)的TFBS,并包含与在所述用于HNF1的TFBS下游的SEQ ID NO:112至少80%、90%、95%或完全相同的TSS序列(被称为p1@SERPINA1或p1@AFP)。
在一些实施方式中,CRE0059的功能变体包含与SEQ ID NO:110具有至少70%、80%、90%、95%或99%同一性的序列,并且其进一步包含位于或靠近第24-36位处含有HNF1的SEQ ID NO:111的TFBS;并且其包含与位于或靠近第73-93位处的SEQ ID NO:112至少80%、90%、95%相同或完全相同的TSS序列,位置参考SEQ ID NO:110编号。在本文中,位于或靠近适当地意指在参考SEQ ID NO:110所列举位置的10个、5个、4个、3个、2个或1个核苷酸内。合适的TFBS序列是SEQ ID NO:111和SEQ ID NO:112,但可以使用替代的TFBS序列。
在一些实施方式中,包含CRE0059(SEQ ID NO:110)或其功能变体的启动子元件或由CRE0059(SEQ ID NO:110)或其功能变体组成的启动子元件具有200个以下核苷酸的长度、150个以下核苷酸的长度、125个以下核苷酸的长度、110个以下核苷酸的长度、或95个以下核苷酸的长度。
在一些实施方式中,用于本文公开的方法和组合物中的肝特异性启动子包含SEQID NO:91或其功能变体或者由SEQ ID NO:91或其功能变体组成。在一些实施方式中,功能变体可具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:91的序列的启动子被称为SP0412。在一些实施方式中特别地优选SP0412启动子。已发现该启动子强力且非常短,这在一些情况下是有益的。
a.SP0265(也称为SP131A1)及其变体
在一些实施方式中,启动子是合成型肝特异性启动子,其包含如下CRE的组合:CRE0051(SEQ ID NO:97)、CRE0058(SEQ ID NO:113)、CRE0065(SEQ ID NO:117)和CRE0066(SEQ ID NO:122)或其功能变体。通常,CRE可操作地连接至启动子元件。在一些优选的实施方式中,肝特异性启动子以CRE0051、CRE0058、CRE0065、CRE0066、然后启动子元件(以从上游至下游的方向)的顺序包含所述CRE或其功能变体。
启动子元件可以是任何合适的近端或最小启动子。在一些优选的实施方式中,启动子元件是最小启动子。当启动子是近端启动子时,通常优选近端启动子为肝特异性的。
在一些优选的实施方式中,启动子元件是CRE0052(也被称为G6PC)(SEQ ID NO:126)。CRE0052是最小启动子(也被称为核心启动子)。
在一些实施方式中,肝特异性启动子包含以下调节元件(或其功能变体):CRE0051、CRE0058、CRE0065、CRE0066、然后为CRE0052(SEQ ID NO:126)。
CRE0051(SEQ ID NO:97)的序列及其变体如上文所述。
在一些实施方式中,包含CRE0058(SEQ ID NO:113)或其功能变体的CRE或由CRE0058(SEQ ID NO:113)或其功能变体组成的CRE具有200个以下核苷酸的长度、150个以下核苷酸的长度、125个以下核苷酸的长度、100个以下核苷酸的长度、或80个以下核苷酸的长度。其功能变体可具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
CRE0058(SEQ ID NO:113)的功能变体是具有不同于CRE0058的序列的调节元件,但其基本上保留了它们作为肝特异性CRE的活性。技术人员能够理解的是,可以改变CRE的序列,同时保持其结合至必需TF和增强表达的能力。与参考CRE相比,功能变体可以包含替换、缺失和/或插入,只要它们不会使得CRE无功能。
在一些实施方式中,CRE0058(SEQ ID NO:113)的功能变体可以被视为当取代启动子中的CRE0058而进行置换时基本上保留其活性的CRE。例如,包含取代CRE0058而进行置换的CRE0058功能变体的启动子优选地保留其活性的80%,更优选地保留其活性的90%,更优选地保留其活性的95%,并且还更优选地保留其活性的100%(与包含CRE0058(SEQ ID NO:113)的参考启动子相比)。例如,就启动子SP0265(SEQ ID NO:94)作为实例而言,可以用CRE0058的功能变体替换SP0265中的CRE0058,并且所述启动子基本上保留其活性。在参考启动子的对照下,可以通过对合适的报告基因的表达与在等效条件下包含被置换的CRE的另外的相同启动子进行比较来评估活性的保留。
在一些实施方式中,优选CRE0058的功能变体(SEQ ID NO:113)包含用于与CRE0058相同的肝特异性转录因子(TF)的转录因子结合位点(TFBS)。CRE0058中存在的肝特异性TFBS按它们存在的顺序列出为:HNF4(SEQ ID NO:115)和c/EBP(SEQ ID NO:116)。因此CRE0058的功能变体优选地包含所有的这些TFBS。优选地,它们以与它们存在于CRE0058中相同的顺序(即以HNF4然后c/EBP的顺序)存在。当CRE与启动子和基因相关联时,该顺序优选地被认为是处于从上游至下游的方向(即处于从转录起始位点(TSS)远端至TSS近端的方向)。可以在邻近的TFBS之间提供间隔区序列。在一些实施方式中,TFBS可适当地重叠,只要它们保持功能(即重叠序列均能够结合它们各自的TF)。
在一些实施方式中,CRE0058(SEQ ID NO:113)的功能变体包含以下TFBS序列:CGCCCTTTGGACC(HNF4)(SEQ ID NO:115)和GACCTTTTGCAATCCTGG(c/EBP)(SEQ ID NO:116)、与它们互补的序列,或保持结合至它们各自的TF的能力的这些TFBS序列的功能变体。这些变体可能以与CRE0058相同的顺序(即,以上文它们被列出的顺序)存在。如上所述,本领域众所周知的是存在与TFBS相关的序列变异性,并且对于给定的TFBS,通常存在共有序列,其中通常存在某种程度的偏差。
在一些实施方式中,CRE0058的功能变体包含以下序列:GCGCCCTTTGGACCTTTTGCAATCCTGG(SEQ ID NO:114),或与其至少70%、80%、90%、95%或99%相同的序列。
在一些实施方式中,CRE由SEQ ID NO:113或SEQ ID NO:114或它们的功能变体组成。
应当注意的是,可以在双链多核苷酸的任一链上提供CRE或其功能变体并且可以以两种方向的任一种来提供CRE或其功能变体。就其而言,SEQ ID NO:113或SEQ ID NO:114的互补和反向互补序列或其功能变体落入本发明的范围内。包含根据SEQ ID NO:113或SEQID NO:114的序列或其功能变体的单链核酸也落入本发明的范围内。
在一些实施方式中,包含CRE0058或其功能变体的CRE或由CRE0058或其功能变体组成的CRE具有120个以下核苷酸的长度、80个以下核苷酸的长度、60个以下核苷酸的长度、或40个以下核苷酸的长度。
在一些实施方式中,包含CRE0065(SEQ ID NO:117)或其功能变体的CRE或由CRE0065(SEQ ID NO:117)或其功能变体组成的CRE具有200个以下核苷酸的长度、150个以下核苷酸的长度、125个以下核苷酸的长度、100个以下核苷酸的长度,或80个以下核苷酸的长度。其功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
CRE0065(SEQ ID NO:117)的功能变体是具有不同于CRE0065的序列的调节元件,但其基本上保留了它们作为肝特异性CRE的活性。技术人员将理解的是,可以改变CRE的序列,同时保持其结合至必需TF和增强表达的能力。与参考CRE相比,功能变体可以包含替换、缺失和/或插入,只要它们不会使得CRE无功能。
在一些实施方式中,CRE0065的功能变体可以被视为当取代启动子中的CRE0065而进行置换时,基本上保留其活性的CRE。例如,包含取代CRE0065而进行置换的CRE0065的功能变体的启动子优选地保留其活性的80%,更优选地保留其活性的90%,更优选地保留其活性的95%,并且还更优选地保留其活性的100%(与包含CRE0065的参考启动子相比)。例如,就启动子SP0265(SEQ ID NO:94)作为实例而言,可以用CRE0065的功能变体替换SP0265中的CRE0065,并且所述启动子基本上保留其活性。在参考启动子的对照下,可以通过对合适的报告基因的表达与在等效条件下包含被置换的CRE的另外的相同启动子进行比较来评估活性的保留。
在一些实施方式中,优选CRE0065的功能变体包含用于与CRE0065相同的肝特异性TF的TFBS。CRE0065中存在的肝特异性TFBS按它们存在的顺序列出为:RXRα(SEQ ID NO:119)、HNF3(SEQ ID NO:120)和HNF3(SEQ ID NO:121)。因此CRE0065的功能变体优选地包含所有的这些TFBS。优选地,它们以与它们存在于CRE0065中相同的顺序(即以RXRα、HNF3、然后HNF3的顺序)存在。当顺式调节元件与启动子和基因相关联时,该顺序优选地被认为是处于从上游至下游的方向(即处于从转录起始位点(TSS)远端至TSS近端的方向)。可以在邻近的TFBS之间提供间隔区序列。在一些实施方式中,TFBS可适当地重叠,只要它们保持功能(即重叠序列均能够结合它们各自的TF)。
在一些实施方式中,CRE0065的功能变体包含以下TFBS序列:ACTGAACCCTTGACCCCTGCCCT(RXRα)(SEQ ID NO:119)、CTGTTTGCCC(HNF3)(SEQ ID NO:120)和CTATTTGCCC(HNF3)(SEQ ID NO:121)、与它们互补的序列,或保持结合至它们各自的TF的能力的这些TFBS序列的功能变体。这些变体可能以与CRE0065相同的顺序(即,以上文它们被列出的顺序)存在。如上所述,本领域众所周知的是存在与TFBS相关的序列变异性,并且对于给定的TFBS,通常存在共有序列,其中通常存在某种程度的偏差。
在一些实施方式中,CRE0065的功能变体包含以下序列:ACTGAACCCTTGACCCCT-Na-CTGTTTGCCC-Nb-TATTTGCCC(SEQ ID NO:118),或与其至少70%、80%、90%、95%或99%相同的序列,其中Na和Nb代表任选的间隔区序列。当存在时,Na任选地具有14至30个核苷酸的长度,优选地具有18至26个核苷酸的长度,以及更优选地具有22个核苷酸的长度。当存在时,Nb任选地具有1至10个核苷酸的长度,优选地具有2至6个核苷酸的长度,以及更优选地具有4个核苷酸的长度。在一些实施方式中,CRE由SEQ ID NO:117或SEQ ID NO:118或它们的功能变体组成。
应当注意的是,可以在双链多核苷酸的任一链上提供CRE或其功能变体并且可以以两种方向的任一种来提供CRE或其功能变体。就其而言,SEQ ID NO:117或SEQ ID NO:118的互补和反向互补序列或其功能变体落入本发明的范围内。包含根据SEQ ID NO:117或SEQID NO:118的序列或其功能变体的单链核酸也落入本发明的范围内。
在一些优选的实施方式中,包含CRE0065或其功能变体的CRE或由CRE0065或其功能变体组成的CRE具有200个以下核苷酸的长度、150个以下核苷酸的长度、125个以下核苷酸的长度、90个以下核苷酸的长度、或72个以下核苷酸的长度。
在一些实施方式中,包含CRE0066(SEQ ID NO:122)或其功能变体的CRE或由CRE0066(SEQ ID NO:122)或其功能变体组成的CRE具有200个以下核苷酸的长度、150个以下核苷酸的长度、125个以下核苷酸的长度、100个以下核苷酸的长度,或80个以下核苷酸的长度。其功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
CRE0066(SEQ ID NO:122)的功能变体是具有不同于CRE0066的序列的调节元件,但其基本上保留了它们作为肝特异性CRE的活性。技术人员将理解的是,可以改变CRE的序列,同时保持其结合至必需TF和增强表达的能力。与参考CRE相比,功能变体可以包含替换、缺失和/或插入,只要它们不会使得CRE无功能。
在一些实施方式中,CRE0066的功能变体可被视为当取代启动子中的CRE0066而进行置换时基本上保留其活性的CRE。例如,包含取代CRE0066而进行置换的CRE0066的功能变体的启动子优选地保留其活性的80%,更优选地保留其活性的90%,更优选地保留其活性的95%,并且还更优选地保留其活性的100%(与包含CRE0066(SEQ ID NO:122)的参考启动子相比)。例如,就启动子SP0265(SEQ ID NO:94)作为实例而言,可以用CRE0066的功能变体替换SP0265中的CRE0066,并且所述启动子基本上保留其活性。在参考启动子的对照下,可以通过对合适的报告基因的表达与在等效条件下包含被置换的CRE的另外的相同启动子进行比较来评估活性的保留。
在一些实施方式中,优选CRE0066的功能变体包含用于与CRE0066相同的肝特异性转录因子(TF)的转录因子结合位点(TFBS)。CRE0066中存在的肝特异性TFBS按它们存在的顺序列出为:HNF4G(SEQ ID NO:124)和FOS::JUN(SEQ ID NO:125)。因此CRE0066的功能变体优选地包含所有的这些TFBS。优选地,它们以与它们存在于CRE0066中相同的顺序(即以HNF4G然后FOS::JUN的顺序)存在。当顺式调节元件与启动子和基因相关联时,该顺序优选地被认为是处于从上游至下游的方向(即处于从转录起始位点(TSS)远端至TSS近端的方向)。可以在邻近的TFBS之间提供间隔区序列。在一些实施方式中,TFBS可适当地重叠,只要它们保持功能(即重叠序列均能够结合它们各自的TF)。
在一些实施方式中,CRE0066(SEQ ID NO:122)的功能变体包含以下TFBS序列:GCAGGGCAAAGTGCA(HNF4G)(SEQ ID NO:124)和GATGACTCAG(FOS::JUN)(SEQ ID NO:125)、与它们互补的序列,或保持结合至它们各自的TF的能力的这些TFBS序列的功能变体。这些变体可能以与CRE0066相同的顺序(即,以上文它们被列出的顺序)存在。如上所述,本领域众所周知的是存在与TFBS相关的序列变异性,并且对于给定的TFBS,通常存在共有序列,其中通常存在某种程度的偏差。
在一些实施方式中,CRE0066(SEQ ID NO:122)的功能变体包含以下序列:GCAGGGCAAAGTGCA-Na-GATGACTCAG(SEQ ID NO:123),或与其至少70%、80%、90%、95%或99%相同的序列,其中Na代表任选的间隔区序列。当存在时,Na任选地具有10至28个核苷酸的长度,优选地具有14至24个核苷酸的长度,以及更优选地具有19个核苷酸的长度。
在一些实施方式中,CRE由CRE0066或其功能变体组成。
应当注意的是,可以在双链多核苷酸的任一链上提供CRE或其功能变体并且可以以两种方向的任一种来提供CRE或其功能变体。就其而言,SEQ ID NO:122或SEQ ID NO:123的互补和反向互补序列或其功能变体落入本发明的范围内。包含根据SEQ ID NO:122或SEQID NO:123的序列或其功能变体的单链核酸也落入本发明的范围内。
在一些优选的实施方式中,包含CRE0066或其功能变体的CRE或由CRE0066或其功能变体组成的CRE具有200个以下核苷酸的长度、150个以下核苷酸的长度、125个以下核苷酸的长度、100个以下核苷酸的长度、或87个以下核苷酸的长度。
在一些实施方式中,启动子包含启动子元件CRE0052(也被称为G6PC)(SEQ ID NO:126)或其功能变体或功能片段。其功能变体可具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
CRE0052(SEQ ID NO:126)的功能变体基本上保留了CRE0052作为肝特异性启动子元件发挥作用的能力。例如,当将CRE0052的功能变体替换入肝特异性启动子SP0265时,经修饰的启动子保留其活性的至少80%,更优选地保留其活性的至少90%,更优选地保留其活性的至少95%,并且还更优选地保留SP0265的100%活性。
在一个实施方式中,肝特异性启动子包含SEQ ID NO:94或其功能变体。在一些实施方式中,功能变体可具有与SEQ ID NO:94至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。具有根据SEQ ID NO:94的序列的启动子被称为SP0265(也称为SP131A1或LVR 131_A1)。在一些实施方式中,特别地优选包含SEQ ID NO:94的启动子或由SEQ ID NO:94组成的启动子。
在一些实施方式中,肝特异性启动子是SEQ ID NO:94并且包含以下组分:CRE0051(SEQ ID NO:97)、CRE0058(SEQ ID NO:113)、CRE0065(SEQ ID NO:117)、CRE0066(SEQ IDNO:122)、CRE0052(SEQ ID NO:126),或SEQ ID NO:97、SEQ ID NO:113、SEQ ID NO:117、SEQID NO:122或SEQ ID NO:126的功能变体,所述功能变体可具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
b.SP0239及其变体
在一些实施方式中,启动子是合成型肝特异性启动子,该启动子包含以下的CRE:CRE0018(SEQ ID NO:151)、CRE0051(SEQ ID NO:97)、CRE0058(SEQ ID NO:113)、CRE0065(SEQ ID NO:117)和CRE0066(SEQ ID NO:122)或它们的功能变体。通常,CRE可操作地连接至启动子元件。在一些优选的实施方式中,肝特异性启动子以CRE0018、CRE0051、CRE0058、CRE0065、CRE0066、以及随后的启动子元件(以从上游至下游的方向)的顺序包含所述CRE或其功能变体。
启动子元件可以是任何合适的近端或最小启动子。在一些优选的实施方式中,启动子元件是CRE0052(也被称为G6PC)。CRE0052是最小启动子(也被称为核心启动子)。
在一些实施方式中,肝特异性启动子包含以下元件(或其功能变体):CRE0018、CRE0051、CRE0058、CRE0065、CRE0066、然后为CRE0052。
CRE0051、CRE0058、CRE0065和CRE0066的序列和启动子元件CRE0052及它们的功能变体如上文所述。
CRE0018具有SEQ ID NO:151的序列或其功能变体或功能片段。其功能变体可具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
CRE0018(SEQ ID NO:151)的功能变体是具有不同于CRE0018的序列的调节元件,但其基本上保留了它们作为肝特异性CRE的活性。技术人员将理解的是,可以改变CRE的序列,同时保持其结合至必需TF和增强表达的能力。与参考CRE相比,功能变体可以包含替换、缺失和/或插入,只要它们不会使得CRE基本上无功能。
在一些实施方式中,CRE0018的功能变体可被视为当取代启动子中的CRE0018而进行置换时基本上保留其活性的CRE。例如,包含取代CRE0018而进行置换的CRE0018的功能变体的启动子优选地保留其活性的80%,更优选地保留其活性的90%,更优选地保留其活性的95%,并且还更优选地保留其活性的100%(与包含CRE0018的参考启动子相比)。例如,就启动子SP0239作为实例而言,可以用CRE0018的功能变体替换SP0239中的CRE0018,并且所述启动子基本上保留其活性。在参考启动子的对照下,可以通过对合适的报告基因的表达与在等效条件下包含被置换的CRE的另外的相同启动子进行比较来评估活性的保留。
在一些实施方式中,CRE0018的功能变体包含用于与CRE0018相同的肝特异性TF的TFBS。CRE0018中存在的肝特异性TFBS按它们存在的顺序列出为:IRF(SEQ ID NO:129)、NF1(SEQ ID NO:130)、HNF3(SEQ ID NO:131)、HBLF(SEQ ID NO:132)、RXRa(SEQ ID NO:133)、EF-C(SEQ ID NO:134)、NF1(SEQ ID NO:135)和c/EBP(SEQ ID NO:136)。因此CRE0018的功能变体优选地包含所有的这些TFBS。优选地,它们以与它们存在于CRE0018中相同的顺序(即以IRF、NF1、HNF3、HBLF、RXRa、EF-C、NF1、然后c/EBP的顺序)存在。当CRE与启动子和基因相关联时,该顺序优选地被认为是处于从上游至下游的方向(即处于从转录起始位点(TSS)远端至TSS近端的方向)。可以在邻近的TFBS之间提供间隔区序列。在一些实施方式中,TFBS可适当地重叠,只要它们保持功能(即重叠序列均能够结合它们各自的TF)。
在一些实施方式中,CRE0018的功能变体包含以下的TFBS序列:CTTTCACTTTC(IRF)(SEQ ID NO:129)、TCGCCAA(NF1)(SEQ ID NO:130)、TGTGTAAACA(HNF3)(SEQ ID NO:131)、TGTAAACAATA(HBLF)(SEQ ID NO:132)、CTGAACCTTTACCC(RXRa)(SEQ ID NO:133)、GTTGCCCGGCAAC(EF-C)(SEQ ID NO:134)、CAGGTCTGTGCCAAG(NF1)(SEQ ID NO:135)、TGCCAAGTGTTTG(c/EBP)(SEQ ID NO:136)、与它们互补的序列,或保持结合至SEQ ID NO:129-SEQ ID NO:136它们各自的TF的能力的这些TFBS序列的功能变体。这些变体可能以与CRE0018相同的顺序(即,以上文它们被列出的顺序)存在。如上所述,本领域众所周知的是存在与TFBS相关的序列变异性,并且对于给定的TFBS,通常存在共有序列,其中通常存在某种程度的偏差。
在本发明的一些实施方式中,CRE0018的功能变体包含如下序列:CTTTCACTTTCTCGCCAA-Na-TGTGTAAACAATA-Nb-CTGAACCTTTACCC-Nc-GTTGCCCGGCAAC-Nd-CAGGTCTGTGCCAAGTGTTTG(SEQ ID NO:128),或与其至少70%、80%、90%、95%或99%相同的序列,其中Na、Nb、Nc和Nd代表任选的间隔区序列。当存在时,Na任选地具有10至20个核苷酸的长度,优选地具有13至17个核苷酸的长度,以及更优选地具有15个核苷酸的长度。当存在时,Nb任选地具有1至10个核苷酸的长度,优选地具有1至5个核苷酸的长度,更优选地具有1个核苷酸的长度。当存在时,Nc任选地具有1至10个核苷酸的长度,优选地具有1至5个核苷酸的长度,以及更优选地具有1个核苷酸的长度。当存在时,Nd适当地具有1至10个核苷酸的长度,优选地具有2至8个核苷酸的长度,以及更优选地具有3个核苷酸的长度。
在本发明的一些实施方式中,CRE由SEQ ID NO:127或SEQ ID NO:128或它们的功能变体组成。
应当注意的是,可以在双链多核苷酸的任一链上提供CRE或其功能变体并且可以以两种方向的任一种来提供CRE或其功能变体。就其而言,SEQ ID NO:128或SEQ ID NO:129的互补和反向互补序列或其功能变体落入本发明的范围内。包含根据SEQ ID NO:128或SEQID NO:129的序列或其功能变体的单链核酸也落入本发明的范围内。
在一些实施方式中,包含CRE0018(SEQ ID NO:151)或其功能变体的CRE或由CRE0018(SEQ ID NO:151)或其功能变体组成的CRE具有200个以下核苷酸的长度、150个以下核苷酸的长度、125个以下核苷酸的长度、或103个以下核苷酸的长度。
在一个实施方式中,肝特异性启动子包含SEQ ID NO:93或其功能变体或由SEQ IDNO:93或其功能变体组成。具有根据SEQ ID NO:93的序列的启动子被称为SP0239。SP0239的功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
因此,在一些实施方式中,肝特异性启动子是SP0239(SEQ ID NO:93)并且包含以下组分:CRE0018(SEQ ID NO:151)、CRE0051(SEQ ID NO:97)、CRE0058(SEQ ID NO:113)、CRE0065(SEQ ID NO:117)和CRE0066(SEQ ID NO:122)和CRE0052(SEQ ID NO:126),或可具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列的功能变体。
c.SP0240及其变体
在一些实施方式中,启动子是合成型肝特异性启动子,该启动子包含可操作地连接至启动子元件的CRE0018。在一些优选的实施方式中,肝特异性启动子包含CRE0018,或紧邻启动子元件的上游。
启动子元件可以是任何合适的近端或最小启动子。在一些优选的实施方式中,启动子元件是CRE0006(SEQ ID NO:137)。CRE0006是肝特异性近端启动子。
在一些实施方式中,肝特异性启动子包含以下元件(或其功能变体):CRE0018,然后为CRE0006。
CRE0018的序列及其变体如上文所述。
CRE0006是近端启动子并且包含用于TSS上游的肝特异性TF的TFBS。CRE0006中存在的肝特异性TFBS按顺序列出为:HNF4(SEQ ID NO:138)、RXRa(SEQ ID NO:139)、HNF4(SEQID NO:140)、c/EBP(SEQ ID NO:141)和HNF3(SEQ ID NO:142),以及任选的p1@VTN(SEQ IDNO:143)。因此CRE0006的功能变体优选地包含这些TFBS。优选地,它们以与它们存在于CRE0006中相同的顺序(即以HNF4、c/EBP、HNF3和HNF3的顺序)存在。在一些实施方式中,TFBS重叠,只要它们保持功能(即重叠序列均能够结合它们各自的TF)。
pl@VTN(SEQ ID NO:143)表示通过基因表达的帽分析(CAGE)所确定的CRE0006中的转录起始位点(TSS)。
在一些实施方式中,CRE0006的功能变体包含与SEQ ID NO:137至少70%相同(优选与SEQ ID NO:25至少80%、90%、95%或99%相同)的序列,其包含用于HNF4、RXRa、HNF4、c/EBP和HNF3的TFBS,并且优选其包含与用于所述TFBS下游的HNF3、HNF4、RXRa、HNF4、和c/EBP的TFBS至少80%、90%、95%或完全相同的TSS序列。
在一些实施方式中,CRE0006的功能变体包含与SEQ ID NO:137具有至少70%、80%、90%、95%或99%同一性的序列,并且其进一步包含以下TFBS:位于或靠近第25-37位处的HNF4(SEQ ID NO:138)、位于或靠近第73-83位处的RXRa(SEQ ID NO:139)、位于或靠近第74-86位处的HNF4(SEQ ID NO:140)、位于或靠近第123-136位处的c/EBP(SEQ ID NO:141)和位于或靠近第129-137位处的HNF3(SEQ ID NO:142),并且其包含与位于或靠近第166-196位处的SEQ ID NO:143至少80%、90%、95%或完全相同的TSS序列,位置参考SEQID NO:137编号。在本文中,位于或靠近适当地意指在参考SEQ ID NO:137所列举位置的10个、5个、4个、3个、2个或1个核苷酸内。合适的TFBS序列是SEQ ID NO:138-SEQ ID NO:142,但可以使用替代的TFBS序列。
在一个实施方式中,肝特异性启动子包含SEQ ID NO:95或其功能变体或由SEQ IDNO:95或其功能变体组成。具有根据SEQ ID NO:95的序列的启动子被称为SP0240。SP0240的功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
d.SP0246及其变体
在一些实施方式中,启动子是合成型肝特异性启动子,该启动子包含以下CRE:CRE0051、CRE0058和CRE0065,或它们的功能变体。通常,CRE可操作地连接至启动子元件。在一些优选的实施方式中,肝特异性启动子以CRE0051、CRE0058和CRE0065和随后的启动子元件(以从上游至下游的方向)的顺序包含所述CRE或其功能变体。
启动子元件可以是任何合适的近端或最小启动子。在一些优选的实施方式中,启动子元件是CRE0052(也被称为G6PC)。CRE0052是最小启动子(也被称为核心启动子)。
在一些实施方式中,肝特异性启动子包含以下元件(或其功能变体):CRE0051、CRE0058、CRE0065,然后为CRE0052。CRE0051、CRE0058、CRE0065的序列和启动子元件CRE0052及它们的功能变体如上文所述。
在一个实施方式中,肝特异性启动子包含SEQ ID NO:96或其功能变体或由SEQ IDNO:96或其功能变体组成。具有根据SEQ ID NO:96的序列的启动子被称为SP0246。SP0246的功能变体可以具有与SEQ ID NO:96至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
e.SP0131及其变体
在一些实施方式中,启动子是合成型肝特异性启动子,该启动子包含以下CRE:CRE0058、CRE0065和CRE0066,或它们的功能变体。通常,CREs可操作地连接至启动子元件。在一些优选的实施方式中,肝特异性启动子以CRE0058、CRE0065、CRE0066和随后的启动子元件(以从上游至下游的方向)的顺序包含所述CRE或其功能变体。
启动子元件可以是任何合适的近端或最小启动子。在一些优选的实施方式中,启动子元件是CRE0052(也被称为G6PC)。CRE0052是最小启动子(也被称为核心启动子)。
CRE0058、CRE0065和CRE0066的序列以及启动子元件CRE0052及它们的功能变体如上文所述。
SEQ ID NO:141或其功能变体。具有根据SEQ ID NO:141的序列的启动子被称为SP0131。SP0131的功能变体可以具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
f.复合启动子:
在一些实施方式中,如上文所述的肝特异性启动子可操作地连接至一种或多种额外的调节序列。例如,与未可操作地连接额外的调节序列的肝特异性启动子相比,额外的调节序列可以增强表达。通常,优选额外的调节序列不会实质降低肝特异性启动子的特异性。
例如,肝特异性启动子可以可操作地连接至编码UTR(例如5'UTR和/或3'UTR)、内含子等的序列。
在一些实施方式中,肝特异性启动子可操作地连接至编码UTR(例如,5'UTR)的序列。5'UTR可以包含能够调节基因表达的多种元件。天然基因中的5'UTR从转录起始位点开始,并在编码区的起始密码子前的一个核苷酸结束。应当注意的是,本文所称的5'UTR可以是整个天然存在的5'UTR,或者它可以是天然存在的5'UTR的部分。5'UTR也可以是部分或完全合成的。在真核生物中,5'UTR具有约150nt的中等长度,但在某些情况下它们可以明显的更长。可在5'UTR中找到的调节序列包括但不限于:
蛋白质的结合位点,该结合位点可能影响mRNA的稳定性或翻译;
核糖开关;
促进或抑制翻译起始的序列;以及
5'UTR内的内含子,该内含子与基因表达和mRNA输出的调控有关。
在一些实施方式中,如上文所述的肝特异性启动子可操作地连接至编码源自CMV主要立即(immediate)基因(CMV-IE基因)的5'UTR的序列。例如,来自CMV-IE基因的5'UTR适当地包含CMV-IE基因外显子1和CMV-IE基因外显子1或其部分。在某些情况下,考虑到与5'UTR的连接,可以修饰启动子元件,例如可以去除(例如,用5'UTR替换)启动子元件中的转录起始位点(TSS)下游的序列。
CMV-IE 5'UTR在Simari等,Molecular Medicine 4:700-706,1998“Requirementsfor Enhanced Transgene Expression by Untranslated Sequences from the HumanCytomegalovirus Immediate-Early Gene”中描述,通过引用的方式将其并入本文。Simari等中讨论的CMV-IE 5'UTR序列的变体也在WO2002/031137(通过引用的方式并入)中进行了描述,并且也可以使用其中公开的调节序列。可以与启动子组合使用的其它UTR在是本领域中已知的,例如在Leppek,K.,Das,R.&Barna,M.“Functional 5′UTR mRNA structures ineukaryotic translation regulation and how to find them”.Nat Rev Mol Cell Biol19,158–174(2018)中,以引用的方式并入。
在一些实施方式中,编码5'UTR的序列包含SEQ ID NO:145或其功能变体。在一些实施方式中,功能变体可具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。SEQ ID NO:145编码CMV-IE 5’UTR。
在一些实施方式中,5’UTR包含作为蛋白质翻译起始位点(例如,在产生的mRNA中定义Kozak序列的序列)发挥功能的核酸基序。例如,在一些实施方式中,编码5’UTR的序列在其3'末端或靠近3'末端包含序列基序GCCACC(SEQ ID NO:153)。可以使用如本领域已知的其它Kozak序列或其它蛋白质翻译起始位点(例如Marilyn Kozak,“Point MutationsDefine a Sequence Flanking the AUG Initiator Codon That Modulates Translationby Eukaryotic Ribosomes”Cell,Vol.44,283-292,1986年1月31日;Marilyn Kozak“AtLeast Six Nucleotides Preceding the AUG Initiator Codon Enhance Translationin Mammalian Cells”J.Mol.Rid.(1987)196,947-950;Marilyn Kozak“An analysis of5'-noncoding sequences from 699vertebrate messenger RNAs”Nucleic AcidsResearch.Vol.15(20)1987,均通过引用的方式将它们全部并入本文)。蛋白质翻译起始位点(例如Kozak序列)优选地紧邻起始密码子定位。
在一些实施方式中,编码5'UTR的序列包含SEQ ID NO:438或其功能变体。在一些实施方式中,功能变体可具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。该5'UTR包含SEQ ID NO:153的六个核苷酸,所述六个核苷酸定义了位于CMV-IE 5'UTR的3'末端的Kozak序列。
在一些实施方式中,如上文所讨论的SP0412启动子或其变体连接至编码5'UTR的序列以提供复合启动子/5'UTR调节构建体。在此,此类复合启动子/5'UTR构建体可简称为“复合启动子”,或在某些情况下简称为“启动子”。
在一些实施方式中,复合启动子包含SEQ ID NO:92或其功能变体或由SEQ ID NO:92或其功能变体组成。在一些实施方式中,功能变体可具有与SEQ ID NO:92至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
该复合启动子包含可操作地连接至编码5'UTR的序列的SP0412,所述5'UTR来自如上讨论的CMV-IE基因(SEQ ID NO:145)和GCCACC(SEQ ID NO:153)Kozak序列。该(复合)启动子被称为SP0422(SEQ ID NO:92)。在一些实施方式中,SP0422是优选的肝特异性启动子。如上文所讨论的,5'UTR适当地包含作为蛋白质翻译起始位点(例如,定义Kozak序列的序列)发挥功能的核酸基序。在上述序列中,5'UTR在其3'末端包含序列基序GCCACC(SEQ IDNO:153),但可以省略该序列基序或可以使用替代序列。
在一些实施方式中,如上讨论的SP0265启动子或其变体连接至编码5'UTR的序列以提供复合启动子(SP0236-5UTR)。
在一些实施方式中,复合启动子包含SEQ ID NO:146或其功能变体或由SEQ IDNO:146或其功能变体组成。在一些实施方式中,功能变体可具有与SEQ ID NO:146至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
该复合启动子包含可操作地连接至5'UTR的SP0265(SEQ ID NO:94),所述5'UTR来自CMV-IE基因(SEQ ID NO:145)和GCCACC(SEQ ID NO:153)Kozak序列。该(复合)启动子被称为SP0420。在该启动子中,将CRE0052启动子元件中的TSS下游的短序列替换为来自CMV-IE的5'UTR的序列。因此,该启动子实际上包含具有对CRE0052的修饰的SP0265的次要变体,由此去除了某些序列。SP0420在一些实施方式中是优选的。如上文所讨论的,5'UTR适当地包含作为蛋白质翻译起始位点(例如,定义Kozak序列的序列)发挥功能的核酸基序。在上述序列中,5'UTR在其3'末端包含序列基序GCCACC(SEQ ID NO:153),但可以省略该序列基序或可以使用替代序列。
在一些实施方式中,如上讨论的SP0239启动子或其变体连接至编码5'UTR的序列以提供复合启动子(SP0239-UTR)。
在一些实施方式中,复合启动子包含SEQ ID NO:147或其功能变体或由SEQ IDNO:147或其功能变体组成。在一些实施方式中,功能变体可具有与SEQ ID NO:147至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
该复合启动子/5'UTR构建体包含可操作地连接至5'UTR的SP0239,所述5'UTR来自CMV-IE基因和GCCACC(SEQ ID NO:153)Kozak序列。该(复合)启动子被称为SP0421。同样,在该启动子中,将CRE0052启动子元件中的TSS下游的短序列替换为来自CMV-IE的5'UTR的序列。因此,该启动子实际上包含具有对CRE0052的修饰的SP0239的次要变体,由此去除了某些序列。SP0421在一些实施方式中是优选的。如上文所讨论的,5'UTR适当地包含作为蛋白质翻译起始位点(例如,定义Kozak序列的序列)发挥功能的核酸基序。在上述序列中,5'UTR在其3'末端包含序列基序GCCACC(SEQ ID NO:153),但可以省略该序列基序或可以使用替代序列。
在一些实施方式中,如上讨论的SP0240启动子或其变体连接至编码5'UTR的序列以提供复合启动子。
在一些实施方式中,复合启动子包含SEQ ID NO:148或其功能变体或由SEQ IDNO:148或其功能变体组成。在一些实施方式中,功能变体可具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
该复合启动子/5'UTR构建体包含可操作地连接至5'UTR的SP0240,所述5'UTR来自CMV-IE基因和GCCACC(SEQ ID NO:153)Kozak序列。该(复合)启动子被称为SP0240-UTR。同样,在该启动子中,将CRE0006启动子元件中的TSS下游的短序列替换为来自CMV-IE的5'UTR的序列。因此,该启动子实际上包含具有对CRE0006的修饰的SP0240的次要变体,由此去除了某些序列。SP0240-UTR在一些实施方式中是优选的。如上文所讨论的,5'UTR适当地包含作为蛋白质翻译起始位点(例如,定义Kozak序列的序列)发挥功能的核酸基序。在上述序列中,5'UTR在其3'末端包含序列基序GCCACC(SEQ ID NO:153),但可以省略该序列基序或可以使用替代序列。
在一些实施方式中,如上讨论的SP0246启动子或其变体连接至编码5'UTR的序列以提供复合启动子。
在一些实施方式中,复合启动子包含SEQ ID NO:149(SP0246-UTR)或其功能变体或由SEQ ID NO:149(SP0246-UTR)或其功能变体组成。在一些实施方式中,功能变体可具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
该复合启动子/5'UTR构建体包含可操作地连接至5'UTR的SP0246,所述5'UTR来自CMV-IE基因和GCCACC(SEQ ID NO:153)Kozak序列。该(复合)启动子被称为SP0246-UTR。同样,在该启动子中,将CRE0052启动子元件中的TSS下游的短序列替换为来自CMV-IE的5'UTR的序列。因此,该启动子实际上包含具有对CRE0052进行的修饰的SP0246的次要变体,由此去除了某些序列。SP0246-UTR在一些实施方式中是优选的。如上文所讨论的,5'UTR适当地包含作为蛋白质翻译起始位点(例如,定义Kozak序列的序列)发挥功能的核酸基序。在上述序列中,5'UTR在其3'末端包含序列基序GCCACC(SEQ ID NO:153),但可以省略该序列基序或可以使用替代序列。
在一些实施方式中,如上讨论的SP0131_A1启动子或其变体连接至编码5'UTR的序列以提供复合启动子。
在一些实施方式中,复合启动子包含SEQ ID NO:150(SP0131A1-UTR)或其功能变体或由SEQ ID NO:150(SP0131A1-UTR)或其功能变体组成。在一些实施方式中,功能变体可具有与其至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列。
该复合启动子/5'UTR构建体包含可操作地连接至5'UTR的SP0131,所述5'UTR来自CMV-IE基因和GCCACC(SEQ ID NO:153)Kozak序列。该(复合)启动子被称为SP0131-UTR。同样,在该启动子中,将CRE0052启动子元件中的TSS下游的短序列替换为来自CMV-IE的5'UTR的序列。因此,该启动子实际上包含具有对CRE0052进行的修饰的SP0131的次要变体,由此去除了某些序列。SP0131-UTR在一些实施方式中是优选的。如上文所讨论的,5'UTR适当地包含作为蛋白质翻译起始位点(例如,定义Kozak序列的序列)发挥功能的核酸基序。在上述序列中,5'UTR在其3'末端包含序列基序GCCACC(SEQ ID NO:153),但可以省略该序列基序或可以使用替代序列。
在一些实施方式中,肝特异性启动子是SP0412(SEQ ID NO:91)并且包含以下组分:CRE0051(SEQ ID NO:97)、CRE0067(SEQ ID NO:152)、CRE0059(SEQ ID NO:110)和Kozak序列(SEQ ID NO:153),或可具有与它们至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列的功能变体。
在一些实施方式中,肝特异性启动子是SP0422(SEQ ID NO:9)并且包含以下组分:CRE0051(SEQ ID NO:97)、CRE0067(SEQ ID NO:152)、CRE0059(SEQ ID NO:110)、CMV-IE 5'UTR(SEQ ID NO:153)和Kozak序列(SEQ ID NO:153),或可具有与它们至少60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%相同的序列的功能变体。
(iii)合成型肝特异性启动子的功能变体
在一些实施方式中,肝特异性启动子的功能变体可被视为当取代启动子中的参考启动子元件而进行置换时基本上保持其活性的启动子元件。例如,肝特异性启动子的功能变体包含本文表4中的给定启动子的功能变体、或以下所列的任何启动子:SEQ ID NO:86(CRM 0412)、SEQ ID NO:91(SP0412)或SEQ ID NO:92(SP0422)、SEQ ID NO:93(SP0239)、SEQ ID NO:94(SP0265,也被称为SP131_A1)、SEQ ID NO:95(SP0240)、或SEQ ID NO:96(SP0246)、或SEQ ID NO:146(SP0265-UTR)、SEQ ID NO:147(SP0239-UTR)、SEQ ID NO:148(SP0240-UTR)、SEQ ID NO:149(SP0246-UTR)或SEQ ID NO:150(SP0131-A1-UTR)、或它们的功能片段或变体,或选自以下中的任何LSP:SEQ ID NO:270-SEQ ID NO:341或SEQ ID NO:342-SEQ ID NO:430、或它们的功能片段或变体,其中功能变体或功能片段优选地保留未经改变的启动子的活性的至少35%、或至少40%、或至少45%、或至少50%、或至少55%、或至少60%、或至少70%或其活性的至少80%,更优选地保留其活性的至少90%,更优选地保留其活性的至少95%,以及还更优选地保留其活性的100%(与包含未经修饰的启动子元件的未经改变的启动子序列相比)。用于评估肝特异性启动子活性的合适测定在本文中公开(例如在实施例12和实施例13中)。
在一些实施方式中,本文表4中公开的肝特异性启动子、或以下所列的任何启动子的功能变体或功能片段与原始的未经修饰的序列具有至少约75%的序列同一性、或至少约80%的序列同一性、至少约90%的序列同一性、至少约95%的序列同一性、至少约98%的序列同一性,并且还具有相应的未经修饰的启动子序列的启动子活性的至少35%、或启动子活性的至少约45%、或启动子活性的至少约50%、或启动子活性的至少约60%、或启动子活性的至少约75%、或启动子活性的至少约80%、或启动子活性的至少约85%、或启动子活性的至少约90%、或启动子活性的至少约95%:SEQ ID NO:86(CRM 0412)、SEQ ID NO:91(SP0412)或SEQ ID NO:92(SP0422)、SEQ ID NO:93(SP0239)、SEQ ID NO:94(SP0265,也被称为SP131_A1)、SEQ ID NO:95(SP0240)、或SEQ ID NO:96(SP0246)、或SEQ ID NO:146(SP0265-UTR)、SEQ ID NO:147(SP0239-UTR)、SEQ ID NO:148(SP0240-UTR)、SEQ ID NO:149(SP0246-UTR)或SEQ ID NO:150(SP0131-A1-UTR),或选自SEQ ID NO:270-SEQ ID NO:341或SEQ ID NO:342-SEQ ID NO:430的任何LSP。
例如,SEQ ID NO:258(SP0412)或SEQ ID NO:92(SP0422)的功能变体或功能片段与SEQ ID NO:91(SP0412)或SEQ ID NO:92(SP0422)具有至少约75%的序列同一性,或与SEQ ID NO:91(SP0412)或SEQ ID NO:92(SP0422)具有至少约80%的序列同一性,与SEQ IDNO:91(SP0412)或SEQ ID NO:92(SP0422)具有至少约90%的序列同一性,与SEQ ID NO:91(SP0412)或SEQ ID NO:92(SP0422)具有至少约95%的序列同一性,与SEQ ID NO:91(SP0412)或SEQ ID NO:92(SP0422)或原始的未经修饰的序列具有至少约98%的序列同一性;并且还具有SEQ ID NO:91(SP0412)或SEQ ID NO:92(SP0422)的相应的未经修饰的启动子序列的启动子活性的至少35%、或启动子活性的至少约45%、或启动子活性的至少约50%、或启动子活性的至少约60%、或启动子活性的至少约75%、或启动子活性的至少约80%、或启动子活性的至少约85%、或启动子活性的至少约90%、或启动子活性的至少约95%。
在一些实施方式中,本文公开的肝特异性启动子的功能变体与未经修饰的启动子序列保持显著水平的序列同一性。合适的功能变体包含与未经修饰的启动子序列至少60%相同的序列,更优选与未经修饰的肝特异性启动子序列至少70%、80%、90%、95%或99%相同的序列。
在一些实施方式中,本文公开的肝特异性启动子的功能片段与未经修饰的启动子序列保持显著水平的序列同一性。合适的功能片段包含与未经修饰的启动子序列至少60%相同的序列,更优选与未经修饰的肝特异性启动子序列至少70%、80%、90%、95%或99%相同的序列。
在一些实施方式中,启动子元件的功能变体可以被视为当取代启动子中的参考启动子元件而进行置换时基本上保持其活性的启动子元件。例如,包含给定启动子元件的功能变体的肝特异性启动子优选地保留其活性的至少80%,更优选地保留其活性的至少90%,更优选地保留其活性的至少95%,并且还更优选地保留其活性的100%(与包含未经修饰的启动子元件的参考启动子相比)。用于评估肝特异性启动子活性的合适测定在本文中公开,例如在实施例12和实施例13中。
应当注意的是,如本文表4中公开的肝特异性启动子的序列,或选自SEQ ID NO:270-SEQ ID NO:341或SEQ ID NO:342-SEQ ID NO:430的任何LSP的序列可以被改变而不会引起活性的实质丧失。因此,下文讨论的肝特异性启动子的功能变体可以通过对如下进行修饰来制备:本文表4中公开的肝特异性启动子的序列或选自SEQ ID NO:270-SEQ ID NO:341或SEQ ID NO:342-SEQ ID NO:430的任何LSP,只要避免对肝特异性启动子的活性显著有害的修饰。鉴于本公开所提供的信息,对本文表4中公开的肝特异性启动子或选自SEQ IDNO:270-SEQ ID NO:341或SEQ ID NO:342-SEQ ID NO:430的任何LSP进行修饰以提供功能变体是简单的。此外,本公开提供了用于简单地评估任何给定的肝特异性启动子变体的功能的方法。下文讨论肝特异性启动子各自的功能变体。
在本发明的一些实施方式中,合成型肝特异性启动子包含来自由以下所组成的组中的序列:SEQ ID NO:86(CRM 0412)、SEQ ID NO:91(SP0412)或SEQ ID NO:92(SP0422)、SEQ ID NO:93(SP0239)、SEQ ID NO:94(SP0265,也被称为SP131_A1)、SEQ ID NO:95(SP0240)、或SEQ ID NO:96(SP0246)、或SEQ ID NO:146(SP0265-UTR)、SEQ ID NO:147(SP0239-UTR)、SEQ ID NO:148(SP0240-UTR)、SEQ ID NO:149(SP0246-UTR)或SEQ ID NO:150(SP0131-A1-UTR)中列出的任何启动子,或选自SEQ ID NO:270-SEQ ID NO:341或SEQID NO:342-SEQ ID NO:430的任何LSP或其任一者的功能变体。所述肝特异性启动子的任一者的功能变体适当地包含与参考合成型肝特异性启动子至少70%相同的序列,更优选与参考合成型肝特异性启动子至少80%、90%、95%或99%相同的序列。
在一些实施方式中,其功能变体可以适当地包含与表4中列出的序列的任一种至少60%、70%、80%、90%、95%或99%相同的序列。另外或备选地,表4中列出的序列的任一种的功能变体适当地包含在严格条件下与参考序列杂交的序列。表4中列出的序列的任一种的功能变体包括如下变体,其中提供的一种或多种序列已用如上定义的其功能变体所替换,和/或其中提供的序列的顺序已被改变。
在一些实施方式中,当至少一个或多个核苷酸被置换并且它基本上保持其活性时,表4中列出的肝特异性启动子序列的任一种的功能变体可以被视为肝特异性启动子。例如,包含表4中列出的肝特异性启动子序列的任一种的功能变体的肝特异性启动子优选地保留其活性的80%,更优选地保留其活性的90%,更优选地保留其活性的95%,并且还更优选地保留活性的100%(与参考启动子序列相比)。例如,如果LSP包含含有作为实例的SP0412(SEQ ID NO:91)的核酸序列,可以将SP0412(例如,SEQ ID NO:91)中的部分核苷酸替换为其功能变体,并且肝特异性SP0412启动子基本上保留了它的活性。在参考启动子的对照下,可以通过对合适的报告基因的表达与在等效条件下包含被置换的核酸的另外的相同启动子进行比较来评估活性的保留。用于评估肝特异性启动子活性的合适测定在本文中公开(例如在实施例12和实施例13中)。
在本文公开的组合物和方法的一些实施方式中,以下启动子是其具有700个、600个、500个、450个、400个、350个、300个、250个、或200个、或150个或更少核苷酸的长度的功能变体:本文表4中公开的合成型肝特异性启动子,或以下所列的任何启动子:SEQ ID NO:86(CRM 0412)、SEQ ID NO:91(SP0412)或SEQ ID NO:92(SP0422)、SEQ ID NO:93(SP0239)、SEQ ID NO:94(SP0265,也被称为SP131_A1)、SEQ ID NO:95(SP0240)、或SEQ ID NO:96(SP0246)、或SEQ ID NO:146(SP0265-UTR)、SEQ ID NO:147(SP0239-UTR)、SEQ ID NO:148(SP0240-UTR)、SEQ ID NO:149(SP0246-UTR)或SEQ ID NO:150(SP0131-A1-UTR),或选自SEQ ID NO:270-SEQ ID NO:341或SEQ ID NO:342-SEQ ID NO:430的任何LSP。
在本文公开的组合物和方法的一些实施方式中,以下启动子包含可操作地连接至最小启动子的合成型肝特异性顺式调节元件(CRE)或顺式调节模块(CRM):本文表4中公开的合成型肝特异性启动子,或以下所列的任何启动子:SEQ ID NO:86(CRM 0412)、SEQ IDNO:91(SP0412)或SEQ ID NO:92(SP0422)、SEQ ID NO:93(SP0239)、SEQ ID NO:94(SP0265,也被称为SP131_A1)、SEQ ID NO:95(SP0240)、或SEQ ID NO:96(SP0246)、或SEQ ID NO:146(SP0265-UTR)、SEQ ID NO:147(SP0239-UTR)、SEQ ID NO:148(SP0240-UTR)、SEQ ID NO:149(SP0246-UTR)或SEQ ID NO:150(SP0131-A1-UTR),或选自SEQ ID NO:270-SEQ ID NO:341或SEQ ID NO:342-SEQ ID NO:430的任何LSP。用于本发明中的合适的最小启动子的实例包括但不限于CMV-最小启动子、MinTk最小启动子和LVR_CRE0052_G6PC最小启动子(SEQID NO:126)。在具体实施方式中,最小启动子是包含SEQ ID NO:145的序列的CMV-IE启动子,该序列与SEQ ID NO:145至少60%、70%、80%、90%、95%或99%相同。用于本文公开的方法和组合物中的包含CMV-IE的示例性启动子可选自但不限于:SEQ ID NO:92(SP0422)、SEQ ID NO:146(SP0265-UTR)、SEQ ID NO:147(SP0239-UTR)、SEQ ID NO:148(SP0240-UTR)、SEQ ID NO:149(SP0246-UTR)或SEQ ID NO:150(SP0131-A1-UTR)。
在本文公开的组合物和方法的一些实施方式中,以下启动子能够将受试者肝脏中或肝细胞中的基因表达相对于LP-1启动子(SEQ ID NO:432)增高至少20%、至少40%、至少60%、至少80%、至少100%、至少200%、至少300%、至少500%、至少1000%或更多:本文表4中公开的合成型肝特异性启动子,或以下所列的任何启动子:SEQ ID NO:86(CRM 0412)、SEQ ID NO:91(SP0412)或SEQ ID NO:92(SP0422)、SEQ ID NO:93(SP0239)、SEQ ID NO:94(SP0265,也被称为SP131_A1)、SEQ ID NO:95(SP0240)、或SEQ ID NO:96(SP0246)、或SEQID NO:146(SP0265-UTR)、SEQ ID NO:147(SP0239-UTR)、SEQ ID NO:148(SP0240-UTR)、SEQID NO:149(SP0246-UTR)或SEQ ID NO:150(SP0131-A1-UTR),或选自SEQ ID NO:270-SEQID NO:341或SEQ ID NO:342-SEQ ID NO:430的任何LSP。
在本文公开的组合物和方法的一些实施方式中,以下合成型肝特异性启动子能够促进肝特异性转基因的表达并且在肝细胞中具有TTR启动子(SEQ ID NO:431)的活性的至少15%、20%、30%、40%、50%、60%、70%、80%、90%、100%、125%、150%、175%、200%、250%、300%、350%或400%:本文表4中公开的合成型肝特异性启动子,或选自SEQ ID NO:86、SEQ ID NO:91-SEQ ID NO:96、SEQ ID NO:146-SEQ ID NO:150的任何LSP启动子,或选自SEQ ID NO:270-SEQ ID NO:341或SEQ ID NO:342-SEQ ID NO:430的任何LSP。
在本文公开的组合物和方法的一些实施方式中,以下合成型肝特异性启动子能够促进肝特异性转基因的表达并且在肝细胞中具有TBG启动子(SEQ ID NO:435)的活性的至少15%、20%、30%、40%、50%、60%、70%、80%、90%、100%、125%、150%、175%、200%、250%、300%、350%或400%:本文表4中公开的合成型肝特异性启动子,或选自SEQ ID NO:86、SEQ ID NO:91-SEQ ID NO:96、SEQ ID NO:146-SEQ ID NO:150的任何LSP启动子,或选自SEQ ID NO:270-SEQ ID NO:341或SEQ ID NO:342-SEQ ID NO:430的任何LSP。
G.内含子序列
在一些实施方式中,rAAV基因型包含位于启动子序列的3′端和分泌信号肽的5'端的内含子序列。内含子序列起到增强如下的一项或多项的作用:mRNA稳定性、mRNA转运出细胞核和/或表达和/或所表达的GAA融合多肽(例如SS-GAA融合多肽或SS-IGF2-GAA多肽)的调控。在替代实施方式中,rAAV基因型不包含内含子序列。
在一些实施方式中,内含子序列是MVM内含子序列,例如但不限于SEQ ID NO:13的内含子序列或与其具有至少80%、85%、90%、95%、96%、97%、98%或99%核苷酸序列同一性的核酸序列。
在一些实施方式中,内含子序列是HBB2内含子序列,例如但不限于SEQ ID NO:14的内含子序列或与其具有至少80%、85%、90%、95%、96%、97%、98%或99%核苷酸序列同一性的核酸序列。
在本文公开的方法和组合物的一些实施方式中,重组AAV载体包含异源核酸序列,所述异源核酸序列进一步包含位于编码分泌信号肽的序列的5'端和启动子的3'端的内含子序列。在一些实施方式中,内含子序列包含MVM序列或HBB2序列,其中MVM序列包含SEQ IDNO:13的核酸序列,或与SEQ ID NO:13具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的核酸序列,并且HBB2序列包含SEQ ID NO:14的核酸序列,或与SEQ ID NO:14具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的核酸序列。
在一些实施方式中,rAAV基因型包含选自于由如下所组成的组中的内含子序列:人β珠蛋白b2(或HBB2)内含子、FIX内含子、鸡β-珠蛋白内含子和SV40内含子。在一些实施方式中,内含子任选地是经修饰的内含子,例如经修饰的HBB2内含子(参见例如,WO2018046774A1的SEQ ID NO:17)、经修饰的FIX内含子(参见例如,WO2018046774A1中的SEQ ID NO:19)、或经修饰的鸡β-珠蛋白内含子(例如参见WO2018046774A1中的SEQ ID NO:21)或WO2015/162302中公开的经修饰的HBB2或FIX内含子,以引用的方式将它们的整体并入本文。
H.poly-A
在一些实施方式中,rAAV载体基因组包含至少一个poly-A尾,所述poly-A尾位于3'端并位于在一个实施方式中编码GAA融合多肽(例如,SS-GAA融合多肽或SS-IGF2-GAA多肽)的异源核酸基因的下游。在一些实施方式中,polyA信号是如本文所定义的稳定性序列或CS序列的3'端。可以使用任何polyA序列,包括但不限于hGH polyA、synpA polyA等。在一些实施方式中,polyA是合成型polyA序列。在一些实施方式中,rAAV载体基因组包含两个polyA尾,例如hGH polyA序列和另一个polyA序列,其中间隔区核酸序列位于两个polyA序列之间。在一些实施方式中,rAAV基因组在编码GAA融合多肽(例如,SS-GAA融合多肽或SS-IGF2-GAA多肽)的核酸的3'端、或者在CS序列的3'端包含以下元件:第一polyA序列、间隔区核酸序列(100-400bp之间,或约250bp)、第二poly A序列、间隔区核酸序列和3'ITR。在一些实施方式中,第一和第二poly A序列是hGH poly A序列,并且在一些实施方式中,第一和第二poly A序列是合成型poly A序列。在一些实施方式中,第一poly A序列是hGH poly A序列,且第二poly A序列是合成型序列,反之亦然——也就是说,在替代的实施方式中,第一poly A序列是合成型poly A序列,且第二poly A序列是hGH polyA序列。示例性的poly A序列为例如SEQ ID NO:15(hGH poly A序列),或与SEQ ID NO:15具有至少80%、85%、90%、95%、96%、97%、98%或99%的核苷酸序列同一性的poly A核酸序列。在一些实施方式中,被涵盖以使用的hGHpoly序列描述于Anderson等,J.Biol.Chem 264(14);8222-8229,1989(参见例如,第8223页,第二栏,第一段),以引用的方式将其整体并入本文。
在一些实施方式中,可以对poly-A尾进行工程化以稳定从rAAV载体基因组转录的RNA转录物,包括异源基因的转录物,在一个实施方式中该转录物是GAA;并且在替代的实施方式中,可以将poly-A尾工程化以包含去稳定的元件。
在本文公开的方法和组合物的一些实施方式中,重组AAV载体包含位于编码GAA基因的核酸的3'端和3'ITR序列的5'端的至少一个polyA序列。在一些实施方式中,poly A是全长poly A(fl-polyA)序列。在一些实施方式中,polyA是参见例如图5G的截短的polyA序列。
在一个实施方式中,可以通过改变poly-A尾的长度将poly-A尾进行工程化以变成去稳定的元件。在一个实施方式中,poly-A尾可以延长或缩短。在一些实施方式中,3′端非翻译区包含GAA 3′UTR(SEQ ID NO:85)或3'UTR(SEQ ID NO:77)。
在另一实施方式中,去稳定的元件是微小RNA(miRNA),其具有沉默(阻抑翻译和促进降解)RNA转录物的能力,miRNA结合至编码异源基因的RNA转录物。在一个实施方式中,poly-A尾内的种子区域的添加或缺失可以增加或减少蛋白质的表达,例如GAA蛋白质或修饰的GAA多肽。
在另一实施方式中,种子区域也可以被工程化到位于异源基因和poly-A尾之间的3'非翻译区中。在进一步的实施方式中,去稳定剂可以是siRNA。siRNA的编码区可以被包含在rAAV载体基因组中,并通常位于下游,poly-A尾的3'端。
在本文公开的方法和组合物的所有方面,rAAV基因组也可以包含填充区DNA核酸序列。示例性的填充区DNA序列是SEQ ID NO:71,或与其具有至少80%、85%、90%、95%、96%、97%、98%或99%核苷酸序列同一性的核酸序列。如图7-图8和图9A-图9E所示,填充区序列例如位于poly A尾的3'端,并位于3'ITR序列的5'端。在一些实施方式中,填充区DNA以反向取向包含合成型多聚腺苷酸化信号。
在一些实施方式中,填充区核酸序列(也称为“间隔区”核酸片段,参见图7-图8)可以位于poly A序列和3'ITR之间(即填充区核酸序列位于poly A序列的3'端和3'ITR的5'端)(参见例如,图7-图8)。此类填充区核酸序列可为约30bp、50pb、75bp、100bp、150bp、200bp、250bp、300bp或长于300bp。在本文公开的方法和组合物的一些实施方式中,填充区核酸片段在20-50bp、50-100bp、100-200bp、200-300bp、300-500bp之间、或为20-500bp之间的任何整数。示例性的填充区(或间隔区)核酸序列包括SEQ ID NO:16、SEQ ID NO:71或SEQID NO:78,或与SEQ ID NO:16、SEQ ID NO:71或SEQ ID NO:78至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的核酸序列。
I.AAV ITR
本文公开的rAAV基因组包含具有期望特征的AAV ITR,并且可以被设计为调节并入有ITR的载体的活性和对其的细胞应答。在另一实施方式中,AAV ITR是具有期望特征的合成型AAV ITR,并且可以被设计成操纵包含一个或两个合成型ITR的载体的活性和对其的细胞应答,包括如在美国专利号9,447433中阐明的,以引用的方式将其并入本文。
在另一实施方式中,相对于天然存在的ITR(例如来自AAV2的ITR2),ITR表现出经修饰的转录活性。已知ITR2序列固有地具有启动子活性。它也固有地具有与poly(A)序列相似的终止活性。尽管相对于ITR2处于降低的水平,本发明的最小功能性ITR表现出如实施例中所示的转录活性。因此,在一些实施方式中,ITR具有转录功能。在其它实施方式中,ITR对于转录而言是缺陷的。在某些实施方式中,ITR可以充当转录绝缘子,例如,当将载体整合到宿主染色体中时,阻止载体中存在的转基因盒的转录。
本发明的一个方面涉及包含至少一个合成型AAV ITR的rAAV载体基因组,其中,相对于天然存在的AAV ITR(例如ITR2)的序列而言,ITR中的一个或多个转录因子结合位点的核苷酸序列被删除和/或置换。在一些实施方式中,它是其中一个或多个转录因子结合位点被删除和/或置换的最小功能性ITR。在一些实施方式中,至少一个转录因子结合位点被删除和/或置换,例如,至少5个或更多或者10个或更多的转录因子结合位点,例如,至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个或21个转录因子结合位点。
另一实施方式,包含本文所述的rAAV载体基因组的rAAV载体包含含有至少一个合成型AAV ITR的多核苷酸,其中,通常出现在ITR中的转录起始位点处或其附近的一个或多个CpG岛(胞嘧啶碱基紧随着鸟嘌呤碱基(CpG),其中这样排列的胞嘧啶倾向于被甲基化)被删除和/或置换。在实施方式中,CpG岛数量的缺失或减少可降低rAAV载体的免疫原性。这是由于TLR-9结合至rAAV载体DNA序列(发生在CpG岛处)的减少或完全抑制。CpG基序的甲基化引起转录沉默也是众所周知的。预期ITR中的CpG基序的去除将引起TLR-9识别的降低和/或甲基化的降低,以及因此转基因沉默的降低。在一些实施方式中,它是最小功能性ITR,其中一个或多个CpG岛被删除和/或置换。在实施方式中,已知AAV ITR2包含16个CpG岛,其中一个或多个或全部16个可以被删除。
在一些实施方式中,至少1个CpG基序被删除和/或置换,例如至少4个或更多或者8个或更多的CpG基序,例如至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个或16个CpG基序。
在另一实施方式中,合成型ITR包含表7中所列核苷酸序列之一,基本上由表7中所列核苷酸序列之一组成或由表7中所列核苷酸序列之一组成。在其它实施方式中,合成型ITR包含如下核苷酸序列,基本上由如下核苷酸序列组成或由如下核苷酸序列组成:所述核苷酸序列与表7中所列核苷酸序列的任一种至少80%相同(例如至少85%、90%、95%、96%、97%、98%或99%相同)。在一些实施方式中,ITR是Samulski等,1983,Cell,33;135-143(被称为“Samulski等,1983”,通过引用的方式将其整体并入本文)的图1中公开的序列,其在图1中公开了经修饰的ITR序列。在一些实施方式中,ITR序列包含以下核苷酸序列或由以下核苷酸序列组成:与Samulski等,1983中公开的图1中的ITR序列之一至少80%相同(例如至少85%、90%、95%、96%、97%、98%或99%相同)的核苷酸序列。在一些实施方式中,ITR包含以下核苷酸序列或由以下核苷酸序列组成:与Samulski等,1983中公开的图1的中间子图中右侧的pSM 609(其缺少9bp)的ITR序列至少80%相同(例如至少85%、90%、95%、96%、97%、98%、或99%或99.5%相同)的核苷酸序列。在一些实施方式中,ITR包含与SEQID NO:441-SEQ ID NO:444中的任一项的ITR序列至少80%相同(例如至少85%、90%、95%、96%、97%、98%、99%或99.5%相同)的核苷酸序列。在一些实施方式中,ITR序列(例如右侧ITR(或3'ITR))是SEQ ID NO:442或与SEQ ID NO:442至少80%相同(例如至少85%、90%、95%、96%、97%、98%、或99%或99.5%相同)的核苷酸序列。在一些实施方式中,ITR序列(例如左侧ITR(或5'ITR))是SEQ ID NO:441或与SEQ ID NO:441至少80%相同(例如至少85%、90%、95%、96%、97%、98%、或99%或99.5%相同)的核苷酸序列。
表7:示例性合成型ITR序列
Figure BDA0003751229800001181
Figure BDA0003751229800001191
J.示例性rAAV基因组元件:
(i)AAV-LVR412
在一些实施方式中,rAAV在其基因组中包含构建体,所述构建体以5'至3'的方向包含:5'AAV2-ITR(SEQ ID NO:161)、填充区DNA(SEQ ID NO:162)、SP0412LSP(SEQ ID NO:91)、用于Gluc的Kozak序列(SEQ ID NO:153)、编码GAA多肽的核酸序列(SEQ ID NO:182)、3'UTR(SEQ ID NO:77)、poly A序列(SEQ ID NO:164)、3'AAV-ITR序列(SEQ ID NO:165)。示例性构建体作为SEQ ID NO:154(LVR412_AskBioEU)示出。人们可以容易地将SEQ ID NO:161和SEQ ID NO:165的ITR序列改变为不同AAV血清型的任何ITR序列、或选自SEQ ID NO:441-SEQ ID NO:444中的任一种的ITR,以及使用不同的UTR序列或polyA序列分别代替SEQID NO:77和SEQ ID NO:164。
在一些实施方式中,rAAV在其基因组中包含构建体,所述构建体以5'至3'的方向包含:5'AAV2-ITR(SEQ ID NO:161)、填充区DNA(SEQ ID NO:162)、SP0412LSP(SEQ ID NO:91)、编码GAA多肽的核酸序列(SEQ ID NO:182)、3'UTR(SEQ ID NO:77)、poly A序列(SEQID NO:166)、3'AAV-ITR序列(SEQ ID NO:165)。示例性构建体作为SEQ ID NO:155(ssAAV_LVR412WT-hGAA_AskBio_CHATHAM_骨架_Ask)示出。人们可以容易地将SEQ ID NO:161和SEQID NO:165的ITR序列改变为不同AAV血清型的任何ITR序列、或选自SEQ ID NO:441-SEQ IDNO:444中的任一种的ITR,以及使用不同的UTR序列或polyA序列分别代替SEQ ID NO:77和SEQ ID NO:164。
AAV2-LVP422:
在一些实施方式中,rAAV在其基因组中包含构建体,所述构建体以5'至3'的方向包含:5'AAV2-ITR(SEQ ID NO:161)、填充区DNA、SP0422LSP(SEQ ID NO:92)、用于Gluc的Kozak序列(SEQ ID NO:153)、编码GAA多肽的核酸序列(SEQ ID NO:55)、胶原蛋白稳定性序列(SEQ ID NO:65)、poly A序列(SEQ ID NO:164)、3'AAV-ITR序列(SEQ ID NO:165)。示例性构建体作为SEQ ID NO:156(LVR412填充区)示出。人们可以容易地将SEQ ID NO:161和SEQ ID NO:165的ITR序列改变为不同AAV血清型的任何ITR序列、或选自SEQ ID NO:441-SEQ ID NO:444中的任一种的ITR,以及使用不同的胶原蛋白稳定性序列或polyA序列分别代替SEQ ID NO:65和SEQ ID NO:164。
在一些实施方式中,rAAV在其基因组中包含构建体,所述构建体以5′至3'的方向包含:5'AAV2-ITR(SEQ ID NO:161)、填充区DNA、SP0422LSP(SEQ ID NO:92)、用于Gluc的Kozak序列(SEQ ID NO:153)、编码GAA多肽的核酸序列(SEQ ID NO:182)、3'UTR序列(SEQID NO:77)、poly A序列(SEQ ID NO:164),任选地包含AATAA终止信号、3′AAV-ITR序列(SEQID NO:165)。示例性构建体作为SEQ ID NO:157(LVR422AskBio EU构建体)示出。人们可以容易地将SEQ ID NO:161和SEQ ID NO:165的ITR序列改变为不同AAV血清型的任何ITR序列、或选自SEQ ID NO:441-SEQ ID NO:444中的任一种的ITR,以及使用不同的UTR序列或polyA序列分别代替SEQ ID NO:77和SEQ ID NO:164。
人们可以容易地将SEQ ID NO:160、SEQ ID NO:159、SEQ ID NO:155、SEQ ID NO:158、SEQ ID NO:156的rAAV基因组中的ITR序列改变为不同AAV血清型的任何ITR序列、或SEQ ID NO:441-SEQ ID NO:444的ITR,以及使用如本文公开的不同的UTR序列或polyA序列。
在一些实施方式中,rAAV载体或rAAV基因组包含编码GAA多肽的异源核酸序列,所述GAA多肽包含SEQ ID NO:170(具有同源GAA信号序列以及H199R、R223H修饰的GAA多肽)或SEQ ID NO:171(具有同源GAA信号序列以及H199R、H201L和R223H修饰的GAA多肽)。SEQ IDNO:170的GAA多肽由SEQ ID NO:182的核酸序列编码。因此,在一些实施方式中,rAAV载体包含编码经修饰的GAA多肽的SEQ ID NO:182的核酸,所述经修饰的GAA多肽包含H199R、R223H修饰。SEQ ID NO:171的GAA多肽由SEQ ID NO:182的核酸序列编码,其中SEQ ID NO:182的碱基对(bp)667-669由CAC变为UUA、UUG、CUU、CUC、CUA、CUG中的任一种(引起组氨酸(H)至亮氨酸(L)的氨基酸变化);或其中SEQ ID NO:182的bp 668由A变为U(引起组氨酸(H)至亮氨酸(L)的氨基酸变化)。因此,在一些实施方式中,rAAV载体包含SEQ ID NO:182的核酸,其中SEQ ID NO:182的bp667-669由CAC变为为UUA、UUG、CUU、CUC、CUA、CUG中的任一种,或其中SEQ ID NO:182的bp 668从A变为U,其编码包含H199R、H201L和R223H修饰的经修饰的GAA多肽。
在一些实施方式中,rAAV载体或rAAV基因组包含编码GAA多肽的异源核酸序列,所述GAA多肽选自以下中的任一种:SEQ ID NO:172(其中的同源信号肽被IgG信号序列和H199R、R223H修饰所替换的GAA多肽),或与SEQ ID NO:172具有至少85%序列同一性的序列;或SEQ ID NO:173(其中的同源信号肽被wtIL2信号序列以及H199R和R223H修饰所替换的GAA多肽),或与SEQ ID NO:173具有至少85%序列同一性的序列;或SEQ ID NO:174(其中的同源信号肽被mutIL3信号序列以及H199R和R223H修饰所替换的GAA多肽),或与SEQ IDNO:174具有至少85%序列同一性的序列。
在一些实施方式中,rAAV载体或rAAV基因组包含含有SEQ ID NO:182的异源核酸序列,其中SEQ ID NO:182的bp 1-81被替换为SEQ ID NO:177(IgG信号序列)的核酸,所述异源核酸序列编码SEQ ID NO:172的GAA多肽(具有H199R和R223H修饰的IgG前导区-GAA)。在一些实施方式中,rAAV载体包含含有SEQ ID NO:182的异源核酸序列,其中SEQ ID NO:182的bp 668由A变为U,并且其中SEQ ID NO:182的bp 1-81被替换为SEQ ID NO:177(IgG信号肽)的核酸或与其具有至少85%序列同一性的序列,所述异源核酸序列编码SEQ ID NO:172的GAA多肽(具有H199R、H201L和R223H修饰的IgG前导区-GAA)。
在一些实施方式中,rAAV载体或rAAV基因组包含含有SEQ ID NO:182的异源核酸序列,其中SEQ ID NO:182的bp 1-81被替换为SEQ ID NO:179(wt IL2信号肽)的核酸或与其具有至少85%序列同一性的序列,所述异源核酸序列编码SEQ ID NO:173的GAA多肽(具有H199R、R223H修饰的wt IL2信号肽-GAA)。在一些实施方式中,rAAV载体包含含有SEQ IDNO:182的异源核酸序列,其中SEQ ID NO:182的bp 668由A变为U,并且其中SEQ ID NO:182的bp 1-81被替换为SEQ ID NO:179(wt IL2信号肽)的核酸或与其具有至少85%序列同一性的序列,所述异源核酸序列编码SEQ ID NO:173的GAA多肽(具有H199R、H201L、R223H修饰的wt IL2信号肽-GAA)。
在一些实施方式中,rAAV载体包含含有SEQ ID NO:182的异源核酸序列,其中SEQID NO:182的bp 1-81被替换为SEQ ID NO:181(mutIL2信号肽)的核酸或与其具有至少85%序列同一性的序列,所述异源核酸序列编码SEQ ID NO:174的GAA多肽(具有H199R、R223H修饰的mutIL2信号肽-GAA)。在一些实施方式中,rAAV载体包含含有SEQ ID NO:182的异源核酸序列,其中SEQ ID NO:182的bp 668由A变为U,并且其中SEQ ID NO:182的bp 1-81被替换为SEQ ID NO:181(mut IL2信号肽)的核酸或与其具有至少85%序列同一性的序列,所述异源核酸序列编码SEQ ID NO:174的GAA多肽(具有H199R、H201L和R223H修饰的mut IL2信号肽-GAA)。
III.载体和病毒体
在一个实施方式中,本文公开的rAAV载体(也被称为rAAV病毒体)包含衣壳蛋白和衣壳蛋白中的rAAV基因组。用于治疗庞贝氏病的rAAV病毒体的rAAV衣壳是2019年11月19日提交的62,937,556中公开的表1所列的衣壳中的任一种或它们的任意组合,通过引用的方式将其整体并入本文。
在一个实施方式中,用于治疗庞贝氏病的rAAV病毒体的rAAV衣壳是如国际申请WO2020/102645和WO2020/102667(它们各自以其整体并入本文)中公开的表1中列出的那些中的任一种。在一个实施方式中,用于治疗庞贝氏病的rAAV病毒体的rAAV衣壳是AAV8衣壳。在一个实施方式中,rAAV载体是rAAV8载体。
在一个实施方式中,本文公开的AAV载体(也被称为rAAV病毒体)包含来自WO2019/241324(通过引用的方式以其整体明确地并入本文)中公开的那些中的任一种的衣壳蛋白。在一些实施方式中,rAAV载体包含肝特异性衣壳,例如选自WO2019/241324(通过引用的方式以其整体并入本文)中公开的XL32和XL32.1的肝特异性衣壳。在一些实施方式中,rAAV载体是如WO2019/241324(通过引用的方式以其整体并入本文)中公开的AAVXL32或AAVXL32.1。
可以在本文所述的rAAV载体中用作AAV衣壳的示例性嵌合或变体衣壳蛋白可选自于2019年11月19日提交的美国临时申请62,937,556(通过其引用的方式明确地并入本文)的表2,或可以与目前已知或今后识别出的野生型衣壳蛋白和/或其它嵌合或变体衣壳蛋白的任意组合一起使用,并且每种均被并入本文。在一些实施方式中,被涵盖以使用的rAAV载体是嵌合载体,例如在9,012,224和US 7,892,809中公开的,以引用的方式以其整体并入本文。
在一些实施方式中,rAAV载体是如美国申请US2018/0371496和PCT/US18/22725中公开的单倍体rAAV载体,或例如2018年7月31日提交的PCT/US2018/044632和美国申请16/151,110中公开的多倍体rAAV载体,通过引用的方式以其整体各自并入本文。在一些实施方式中,rAAV载体是rAAV3载体,如9,012,224和WO 2017/106236中所公开的,通过引用的方式以其整体并入本文。
在一个具体实施方式中,rAAV是如WO2019/241324(通过引用的方式以其整体并入本文)中公开的AAVXL32或AAVXL32.1AAV载体。在一些实施方式中,rAAV载体包含在WO2019241324A1或国际专利申请PCT/US2019/036676中(通过引用的方式以其整体并入本文)公开的衣壳。在一些实施方式中,AAV载体是AAV8载体或包含AAV8衣壳蛋白的合理单倍体。在一些实施方式中,重组AAV载体是嵌合AAV载体、单倍体AAV载体、杂合AAV载体或多倍体AAV载体。在一些实施方式中,重组AAV载体是合理的单倍体载体(rational haploidvector)、镶嵌AAV载体、经化学修饰的AAV载体或来自任何AAV血清型(例如来自国际申请WO2020/102645和WO2020/102667(将它们各自以其整体并入本文)中公开的表1中公开的任何AAV血清型)的AAV载体。
在一些实施方式中,AAV载体包含由核酸AAV衣壳编码序列编码的衣壳,所述核酸AAV衣壳编码序列与WO2019241324A1中公开的SEQ ID NO:1-SEQ ID NO:3中的任一项的核苷酸序列或与(b)编码WO2019241324A1中公开的SEQ ID NO:4-SEQ ID NO:6中的任一项的核苷酸序列至少90%相同。在一些实施方式中,AAV衣壳包含与WO2019241324A1中公开的SEQ ID NO:4-SEQ ID NO:6中的任一项至少90%相同的氨基酸序列,以及AAV颗粒包含本发明的AAV载体基因组和AAV衣壳。
在一个实施方式中,本文公开的rAAV载体包含衣壳蛋白,所述衣壳蛋白与USPTO授权的专利和公开的申请的文档集中列出的以下生物学序列文件中的任意一项相关,所述文件描述了可以以与野生型衣壳蛋白和/或目前已知或今后识别出的其它嵌合或变体衣壳蛋白的任意组合并入本发明的AAV衣壳中的嵌合衣壳蛋白或变体衣壳蛋白(出于说明性目的,11486254对应于美国专利申请No.11/486,254,并且其它生物序列文件将以类似的方式解读):11486254、11932017、12172121、12302206、12308959、12679144、13036343、13121532、13172915、13583920、13668120、13673351、13679684、14006954、14149953、14192101、14194538、14225821、14468108、14516544、14603469、14680836、14695644、14878703、14956934、15191357、15284164、15368570、15371188、15493744、15503120、15660906和15675677。
在实施方式中,本发明的AAV衣壳蛋白和病毒衣壳可以是嵌合的,其中,它们可以包含来自另一种病毒的衣壳亚基的全部或部分,所述另一种病毒可选地为另一种细小病毒或AAV,例如,如国际专利公开WO00/28004中所述的,以引用的方式将其并入。在一些实施方式中,rAAV载体基因组是单链的或单体的双链体,如美国专利号8,784,799所述的,将其并入本文。
作为进一步的实施方式,本发明的AAV衣壳蛋白和病毒衣壳可以是多倍体(也称为单倍体),其中,它们可以在单个AAV衣壳中包含VP1、VP2和VP3AAV血清型的不同组合,如美国申请US2018/0371496所述的,以引用的方式将其并入。
在实施方式中,在如本文公开的庞贝氏病的治疗中有用的rAAV载体是AAV3b衣壳。被涵盖以使用的AAV3b衣壳描述于2017/106236和9,012,224和7,892,809以及2019年11月15日提交的国际申请PCT/US19/61653和国际申请WO2020/102645和WO2020/102667中,将各自以其整体并入本文。
在一些实施方式中,AAV3b衣壳包含SEQ ID NO:44。在实施方式中,用于庞贝氏病的治疗中的AAV衣壳可以是经修饰的AAV衣壳,其全部或部分地源自SEQ ID NO:44示出的AAV衣壳。在一些实施方式中,来自SEQ ID NO:44示出的AAV3b衣壳的氨基酸可以是来自不同的AAV血清型的另一种衣壳的氨基酸,或用来自不同的AAV血清型的另一种衣壳的氨基酸置换,其中,经置换和/或插入的氨基酸可以来自任何AAV血清型,并且可以包括天然存在的氨基酸或者部分或完全合成的氨基酸。
在另一实施方式中,用于庞贝氏病的治疗中的AAV衣壳是AAV3b265D衣壳。在该特定的实施方式中,通过用D265替换AAV3b衣壳的氨基酸G265,AAV3b265D衣壳包含AAV3b衣壳的二重轴环(two-fold axis loop)的氨基酸序列中的修饰。在一些实施方式中,AAV3b265D衣壳包括SEQ ID NO:46。然而,本发明的经修饰的病毒衣壳不限于SEQ ID NO:46示出的AAV衣壳。在一些实施方式中,来自SEQ ID NO:46示出的AAV3b265D的氨基酸可以是来自不同的血清型的AAV的衣壳的氨基酸,或用来自不同的血清型的AAV的衣壳的氨基酸置换,其中,经置换和/或插入的氨基酸可以来自任何AAV血清型,并且可以包括天然存在的氨基酸或者部分或完全合成的氨基酸。
在另一实施方式中,在如本文公开的庞贝氏病的治疗中有用的rAAV载体是AAV3b265D549A衣壳。在该特定实施方式中,通过用D265替换AAV3b衣壳的氨基酸G265以及用A549置换AAV3b衣壳的氨基酸T549,AAV3b265D549A衣壳包含AAV3b衣壳的二重轴环的氨基酸序列中的修饰。在一些实施方式中,AAV3b265D549A衣壳包括SEQ ID NO:50。然而,本发明的经修饰的病毒衣壳不限于SEQ ID NO:50示出的AAV衣壳。在一些实施方式中,来自SEQID NO:50示出的AAV3b265D549A的氨基酸可以是来自不同血清型的AAV的衣壳的氨基酸,或用来自不同血清型的AAV的衣壳的氨基酸置换,其中,经置换和/或插入的氨基酸可以来自任何AAV血清型,并且可以包括天然存在的氨基酸或者部分或完全合成的氨基酸。在一些实施方式中,来自AAV3bSASTG(即,包含Q263A/T265突变的AAV3b衣壳)的氨基酸可以是来自不同血清型的AAV的衣壳的氨基酸,或用来自不同血清型的AAV的衣壳的氨基酸置换,其中,经置换和/或插入的氨基酸可以来自任何AAV血清型,并且可以包括天然存在的氨基酸或者部分或完全合成的氨基酸。
在另一实施方式中,在如本文公开的庞贝氏病的治疗中有用的rAAV载体是AAV3b549A衣壳。在该特定的实施方式中,通过用A549替换AAV3b衣壳的氨基酸T549,AAV3b549A衣壳包含AAV3b衣壳的二重轴环的氨基酸序列中的修饰。在一些实施方式中,AAV3b549A衣壳包括SEQ ID NO:52。然而,本发明的经修饰的病毒衣壳不限于SEQ ID NO:52示出的AAV衣壳。在一些实施方式中,来自SEQ ID NO:52示出的AAV3b549A的氨基酸可以是来自不同血清型的AAV的衣壳的氨基酸,或用来自不同血清型的AAV的衣壳的氨基酸置换,其中,经置换和/或插入的氨基酸可以来自任何AAV血清型,并且可以包括天然存在的氨基酸或者部分或完全合成的氨基酸。
在另一实施方式中,在如本文公开的庞贝氏病的治疗中有用的rAAV载体是AAV3bQ263Y衣壳。在该特定实施方式中,通过用Y263替换AAV3b衣壳的氨基酸Q263,AAV3bQ263Y衣壳包含AAV3b衣壳的二重轴环的氨基酸序列中的修饰。在一些实施方式中,AAV3b549A衣壳包括SEQ ID NO:54。然而,本发明的经修饰的病毒衣壳不限于SEQ ID NO:54示出的AAV衣壳。在一些实施方式中,来自SEQ ID NO:54示出的AAV3bQ263Y的氨基酸可以是来自不同血清型的AAV的衣壳的氨基酸,或用来自不同血清型的AAV的衣壳的氨基酸置换,其中,经置换和/或插入的氨基酸可以来自任何AAV血清型,并且可以包括天然存在的氨基酸或者部分或完全合成的氨基酸。
在另一实施方式中,在如本文公开的庞贝氏病的治疗中有用的rAAV载体是AAV3bSASTG血清型或包含AAV3bSASTG衣壳。在该特定实施方式中,AAV3bSASTG衣壳包含氨基酸序列中的修饰以包含SASTG突变,特别是通过在AAV3b衣壳中的相似位置处引入这些修饰,将AAV3b衣壳修饰成类似于AAV2Q263A/T265亚变型(如公开于Messina EL等,Adeno-associated viral vectors based on serotype 3b use components of thefibroblast growth factor receptor signaling complex for efficienttransduction.Hum.Gene Ther.2012Oct:23(10):1031-4;Piacentino III,Valentino等,"X-linked inhibitor of apoptosis protein-mediated attenuation of apoptosis,using a novel cardiac-enhanced adeno-associated viral vector."Human genetherapy 23.6(2012):635-646,以引用的方式将两者以其整体并入本文)。因此,在一些实施方式中,在如本文公开的庞贝氏病的治疗中有用的rAAV载体是AAV3bSASTG血清型或包含含有AAV3b Q263A/T265衣壳的AAV3bSASTG衣壳。在一些实施方式中,来自AAV3bSASTG的氨基酸可以是来自不同血清型的AAV的衣壳的氨基酸,或用来自不同血清型的AAV的衣壳的氨基酸置换,其中,经置换和/或插入的氨基酸可以来自任何AAV血清型,并且可以包括天然存在的氨基酸或者部分或完全合成的氨基酸。
为了促进将其引入细胞中,在本发明中有用的rAAV载体基因组是重组核酸构建体,该构建体包括:(1)待表达的异源序列(在一个实施方式中为编码GAA多肽的多核苷酸),以及(2)促进异源基因的整合和表达的病毒序列元件。病毒序列元件可包括DNA复制和将DNA包装(例如,功能性ITR)入AAV衣壳中所需的顺式的AAV载体基因组的那些序列。在一个实施方式中,异源基因编码GAA,其对于校正患有庞贝氏病的患者中的GAA缺乏而言是有用的。在实施方式中,此类rAAV载体基因组还可包含标记物或报告基因。在实施方式中,rAAV载体基因组可以具有一个或多个AAV3b野生型(WT)顺式基因,所述基因全部或部分被置换或删除,但是保留功能性侧接的ITR序列。
在一个实施方式中,在庞贝氏病的治疗中有用的如本文公开的rAAV载体包含被AAV3b衣壳包裹的如本文公开的rAAV基因组。在一些实施方式中,在庞贝氏病的治疗中有用的如本文公开的rAAV载体包含被任意AAV3b衣壳包裹的如本文公开的rAAV基因组,所述衣壳选自:AAV3b衣壳(SEQ ID NO:44)、AAV3b265D衣壳(SEQ ID NO:46)、AAV3b ST(S663V+T492V)衣壳(SEQ ID NO:48)、AAV3b265D549A衣壳(SEQ ID NO:50)、AAV3b549A衣壳(SEQ IDNO:52)、AAV3bQ263Y衣壳(SEQ ID NO:54)或AAV3bSASTG(即Q263A/T265)衣壳。
在本文公开的方法和组合物的一些实施方式中,如本文公开的rAAV载体包含以下中的任一种的核酸序列:AAV_LVR412_EU(SEQ ID NO:154)、ssAAV_LVR412WT-hGAA_AskBio_CHATHAM(SEQ ID NO:155)、AAV-LVR412填充区(SEQ ID NO:156)、AAV_LVR422_EU(SEQ IDNO:157)、AAV-LVR422_填充区(SEQ ID NO:158)、ssAAV_LVR412_WT-hGAA CHATHAM(SEQ IDNO:159)、ssAAV_LSP_WT-hGAA-CHATHAM(SEQ ID NO:160),或与它们具有至少80%、85%、90%、95%或98%同一性的核酸序列。在本文公开的方法和组合物的一些实施方式中,包含SEQ ID NO:154-SEQ ID NO:160中的任一项的核酸序列的rAAV载体可以使wtGAA序列被本文公开的经修饰的GAA核酸序列替换。
在本文公开的方法和组合物的一些实施方式中,本文公开的rAAV载体包含以下中的任一种的核酸序列:SEQ ID NO:57(AAT-V43M-wtGAA(delta1-69aa))、SEQ ID NO:58(ratFN1-IGF2V43M-wtGAA(delta1-69aa))、SEQ ID NO:59(hFN1-IGF2V43M-wtGAA(delta1-69aa))、SEQ ID NO:60(ATT-IGF2Δ2-7-wtGAA(delta1-69))、SEQ ID NO:61(FN1rat-IGFΔ2-7-wtGAA(delta1-69))、SEQ ID NO:62(hFN1-IGFΔ2-7-wtGAA(delta1-69)),或与它们具有至少80%、85%、90%、95%或98%同一性的核酸序列。在本文公开的方法和组合物的一些实施方式中,rAAV载体包含以下的任一种的核酸序列:AAT_hIGF2-V43M_wtGAA_del1-69_Stuffer.V02(SEQ ID NO:79)、FIBrat_hIGF2-V43M_wtGAA_del1-69_Stuffer.V02(SEQ IDNO:80)、FIBhum_hIGF2-V43M_wtGAA_del1-69_Stuffer.V02(SEQ ID NO:81)、AAT_GILT_wtGAA_del1-69__Stuffer.V02(SEQ ID NO:82)、FIBrat_GILT_wtGAA_del1-69_Stuffer.V02(SEQ ID NO:83)、FIBhum_GILT_wtGAA_del1-69_Stuffer.V02(SEQ ID NO:84)或与其具有至少80%、85%、90%、95%或98%同一性的核酸序列。
在本文公开的方法和组合物的一些实施方式中,如本文公开的rAAV载体包含以下中的任一种的核酸序列:AAV_LVR412_EU(SEQ ID NO:154)、ssAAV_LVR412WT-hGAA_AskBio_CHATHAM(SEQ ID NO:155)、AAV-LVR412Stuffer(SEQ ID NO:156)、AAV_LVR422_EU(SEQ IDNO:157)、AAV-LVR422_Stuffer(SEQ ID NO:158)、ssAAV_LVR412_WT-hGAA CHATHAM(SEQ IDNO:159)、ssAAV_LSP_WT-hGAA-CHATHAM(SEQ ID NO:160),或与它们具有至少80%、85%、90%、95%或98%同一性的核酸序列。在本文公开的方法和组合物的一些实施方式中,包含SEQ ID NO:154-SEQ ID NO:160中的任一项的核酸序列的rAAV载体可以使wtGAA序列被本文公开的经修饰的GAA核酸序列替换。
IV.经优化的rAAV载体基因组
在本文公开的方法和组合物的一些实施方式中,经优化的rAAV载体基因组从本文公开的任何元件并以任意组合创建,包括编码如下的核酸序列:启动子、ITR、poly-A尾、能够增加或减少异源基因表达的元件;以及在一个实施方式中,包括对于GAA蛋白的体内表达进行密码子优化的核酸序列(即coGAA或密码子优化的GAA)、以及任选的用以降低免疫原性的一个或多个元件。此类经优化的rAAV载体基因组可随着对组织和细胞具有向性的任何AAV衣壳使用,所述rAAV载体基因组在所述组织和细胞中待转导和表达。
在一些实施方式中,rAAV基因组缺乏AAV P5启动子,该启动子通常位于如本文公开的肝特异性启动子的上游。通常,P5启动子在AAV复制期间控制AAV rep/cap蛋白的表达。在一些实施方式中,该P5启动子片段存在于如本文公开的rAAV载体中,该载体包含经预测的转录因子结合位点:例如,环状AMP应答元件结合蛋白3(CREB3),其可以被内质网(ER)/高尔基体应激激活(Sampieri 2019);激活转录因子2(ATF2),其也参与应激应答(Watson2017);核受体亚家族1组I成员2(NR1I2)(也被称为孕烷X受体[PXR]),其已知在肝脏中富含,并被孕烷类固醇、利福平和其它分子(包括地塞米松(NR1I2_HGNC)(Xing2020))激活。因此,在一些实施方式中,去除了rAAV基因组中的AAV P5启动子的片段而不影响GAA盒的预期性能。在一些实施方式中,rAAV载体还包含位于polyA信号和3’ITR之间的RNA聚合酶II终止序列。示例性终止序列是引入了两个终止密码子和一个限制性位点(例如XhoI)替换TAG的SEQ ID NO:439,并且所述终止序列紧邻地位于hGAA的最后的编码氨基酸的下游,并且紧邻地位于3'UTR的上游。
AAV3b衣壳修饰
在本文公开的方法和组合物的一些实施方式中,用于本文公开的rAAV载体中的AAV3b衣壳与如下中的任一种具有范围在例如约75%至约100%、约80%至约100%、约85%至约100%、约90%至约100%、约95%至约100%、约75%至约99%、约80%至约99%、约85%至约99%、约90%至约99%、约95%至约99%、约75%至约97%、约80%至约97%、约85%至约97%、约90%至约97%、或约95%至约97%的氨基酸同一性:AAV3b衣壳(SEQ IDNO:44)、AAV3b265D衣壳(SEQ ID NO:46)、AAV3b ST(S663V+T492V)衣壳(SEQ ID NO:48)、AAV3b265D549A衣壳(SEQ ID NO:50)、AAV3b549A衣壳(SEQ ID NO:52)、AAV3bQ263Y衣壳(SEQ ID NO:54)或AAV3bSASTG衣壳(即,包含Q263A/T265突变的AAV3b衣壳),所述衣壳在Nienaber等,Hum.Gen Ther,2012,23(10);1031-42和Piacentino III,Valentino等,"X-linked inhibitor of apoptosis protein-mediated attenuation of apoptosis,usinga novel cardiac-enhanced adeno-associated viral vector."Human gene therapy23.6(2012):635-646中公开,两者均以引用的方式整体并入本文。在该实施方式的又一方面,源自AAV3b的AAV与如下的氨基酸序列中的任一种具有范围在例如约75%至约100%、约80%至约100%、约85%至约100%、约90%至约100%、约95%至约100%、约75%至约99%、约80%至约99%、约85%至约99%、约90%至约99%、约95%至约99%、约75%至约97%、约80%至约97%、约85%至约97%、约90%至约97%或约95%至约97%的氨基酸同一性:AAV3b衣壳(SEQ ID NO:44)、AAV3b265D衣壳(SEQ ID NO:46)、AAV3b ST(S663V+T492V)衣壳(SEQ ID NO:48)、AAV3b265D549A衣壳(SEQ ID NO:50)、AAV3b549A衣壳(SEQ ID NO:52)、AAV3bQ263Y衣壳(SEQ ID NO:54)或AAV3bSASTG衣壳(即,包含Q263A/T265突变的AAV3b衣壳),所述衣壳在Nienaber等,Hum.Gen Ther,2012,23(10);1031-42和Piacentino III,Valentino等,"X-linked inhibitor of apoptosis protein-mediated attenuation ofapoptosis,using a novel cardiac-enhanced adeno-associated viral vector."Humangene therapy 23.6(2012):635-646中公开,但衣壳仍然是具有功能活性的AAV蛋白。
在本文公开的方法和组合物的一些实施方式中,AAV血清型(例如AAV3b)包含SASTG突变,如Messina EL等,Adeno-associated viral vectors based on serotype 3buse components of the fibroblast growth factor receptor signaling complex forefficient transduction.Hum.Gene Ther.2012Oct:23(10):1031-42所述,通过引用的方式将其整体并入本文。
在本文公开的方法和组合物的一些实施方式中,用于本文公开的rAAV载体中的AAV3b衣壳相对于如下的氨基酸序列中的任一种具有例如至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、15个、20个、25个、30个、35个、40个、45个或50个连续氨基酸的缺失、添加和/或置换:AAV3b衣壳(SEQ ID NO:44)、AAV3b265D衣壳(SEQ ID NO:46)、AAV3b ST(S663V+T492V)衣壳(SEQ ID NO:48)、AAV3b265D549A衣壳(SEQ ID NO:50)、AAV3b549A衣壳(SEQ ID NO:52)、AAV3bQ263Y衣壳(SEQ ID NO:54)或AAV3bSASTG衣壳(即,包含Q263A/T265突变的AAV3b衣壳)(如Nienaber等,Hum.Gen Ther,2012,23(10);1031-42中所公开的);或相对于如下的氨基酸序列中的任一种具有最多1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、15个、20个、25个、30个、35个、40个、45个或50个连续氨基酸的缺失、添加和/或置换:AAV3b衣壳(SEQ ID NO:44)、AAV3b265D衣壳(SEQ ID NO:46)、AAV3b ST(S663V+T492V)衣壳(SEQ ID NO:48)、AAV3b265D549A衣壳(SEQ ID NO:50)、AAV3b549A衣壳(SEQ ID NO:52)、AAV3bQ263Y衣壳(SEQ ID NO:54)或AAV3bSASTG衣壳(即,包含Q263A/T265突变的AAV3b衣壳)(如Nienaber等,Hum.Gen Ther,2012,23(10);1031-42中所公开的)。在又一实施方式中,用于本文公开的rAAV载体中的AAV3b衣壳相对于如下的氨基酸序列中的任一种具有例如至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、15个、20个、25个、30个、35个、40个、45个或50个连续氨基酸的缺失、添加和/或置换,但仍然是功能活性AAV:AAV3b衣壳(SEQ IDNO:44)、AAV3b265D衣壳(SEQ ID NO:46)、AAV3b ST(S663V+T492V)衣壳(SEQ ID NO:48)、AAV3b265D549A衣壳(SEQ ID NO:50)、AAV3b549A衣壳(SEQ ID NO:52)、AAV3bQ263Y衣壳(SEQ ID NO:54)或AAV3bSASTG衣壳(即,包含Q263A/T265突变的AAV3b衣壳)(如Nienaber等,Hum.Gen Ther,2012,23(10);1031-42中所公开的);或相对于如下的氨基酸序列中的任一种具有最多1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、15个、20个、25个、30个、35个、40个、45个或50个连续氨基酸的缺失、添加和/或置换,但仍然是功能活性AAV:AAV3b衣壳(SEQ ID NO:44)、AAV3b265D衣壳(SEQ ID NO:46)、AAV3b ST(S663V+T492V)衣壳(SEQ IDNO:48)、AAV3b265D549A衣壳(SEQ ID NO:50)、AAV3b549A衣壳(SEQ ID NO:52)、AAV3bQ263Y衣壳(SEQ ID NO:54)或AAV3bSASTG衣壳(即,包含Q263A/T265突变的AAV3b衣壳)(如Nienaber等,Hum.Gen Ther,2012,23(10);1031-42中所公开的)。
在本文公开的方法和组合物的一些实施方式中,用于本文公开的rAAV载体中的AAV3b衣壳与如下的氨基酸序列中的任一项具有范围在例如约75%至约100%、约80%至约100%、约85%至约100%、约90%至约100%、约95%至约100%、约75%至约99%、约80%至约99%、约85%至约99%、约90%至约99%、约95%至约99%、约75%至约97%、约80%至约97%、约85%至约97%、约90%至约97%或约95%至约97%的氨基酸同一性:AAV3b衣壳(SEQ ID NO:44)、AAV3b265D衣壳(SEQ ID NO:46)、AAV3b ST(S663V+T492V)衣壳(SEQ IDNO:48)、AAV3b265D549A衣壳(SEQ ID NO:50)、AAV3b549A衣壳(SEQ ID NO:52)、AAV3bQ263Y衣壳(SEQ ID NO:54)或AAV3bSASTG衣壳(即,包含Q263A/T265突变的AAV3b衣壳)(如Nienaber等,Hum.Gen Ther,2012,23(10);1031-42中所公开的)。在又一进一步的实施方式中,用于本文公开的rAAV载体中的AAV3b衣壳与如下的氨基酸序列中的任一项具有范围在例如约75%至约100%、约80%至约100%、约85%至约100%、约90%至约100%、约95%至约100%、约75%至约99%、约80%至约99%、约85%至约99%、约90%至约99%、约95%至约99%、约75%至约97%、约80%至约97%、约85%至约97%、约90%至约97%或约95%至约97%的氨基酸同一性,但仍是功能活性的AAV:AAV3b衣壳(SEQ ID NO:44)、AAV3b265D衣壳(SEQ ID NO:46)、AAV3b ST(S663V+T492V)衣壳(SEQ ID NO:48)、AAV3b265D549A衣壳(SEQ ID NO:50)、AAV3b549A衣壳(SEQ ID NO:52)、AAV3bQ263Y衣壳(SEQ ID NO:54)、AAV3bSASTG衣壳(即,包含Q263A/T265突变的AAV3b衣壳)(如Nienaber等,Hum.Gen Ther,2012,23(10);1031-42中所公开的)。
V.治疗方法
A.庞贝氏病
如本文公开的表达GAA蛋白的重组AAV可用于治疗庞贝氏病和其它糖原贮积病(GSD)的方法中。庞贝氏病是由分解糖原(用于供能的糖的储存形式)所需的酶--酸性α-葡萄糖苷酶(GAA)的缺乏引起的罕见的遗传性紊乱。庞贝氏病也被称为糖原贮积病II型、GSDII、II型糖原贮积病、糖原症II型、酸性麦芽糖酶缺乏症、α-1,4-葡萄糖苷酶缺乏症、弥漫性糖原性心肥大和心脏型全身性糖原增多症。糖原的增多导致全身的渐进式肌无力(肌病),并影响各种身体组织,特别是在心脏、骨骼肌、肝、呼吸系统和神经系统中。
根据疾病发作的年龄和残留的GAA活性,庞贝氏病呈现的临床表现可能有广泛差异。残留的GAA活性与糖原积累的量和组织分布以及疾病的严重程度相关。婴幼儿发作的庞贝氏病(少于正常GAA活性的1%)是最严重的形式,并且其特征是肌张力减退、全身性肌肉无力和肥厚型心肌病、以及心肌和其它肌肉组织中的大量糖原积累。由于心肺衰竭,通常在出生后一年内发生死亡。青少年发作(正常GAA活性的1%-10%)和成年发作(正常GAA活性的10%-40%)的庞贝氏病更为临床异质,在发病年龄、临床表现和疾病进展方面具有更大的变化。青少年发作的和成年发作的庞贝氏病的特征通常是没有严重的心脏累及、发病年龄较晚且疾病进展较慢,但最终呼吸肌或肢体肌肉累及导致显著的发病率和死亡率。虽然预期寿命可能会有所不同,但死亡通常是由于呼吸衰竭而导致的。
在本文公开的方法和组合物的任何实施方式中,适用于治疗庞贝氏病的GAA酶包括野生型人GAA或其保留在线性低聚糖中切割α1-4连接键的能力的片段或序列变体。在本文公开的方法和组合物的一些实施方式中,GAA蛋白由野生型GAA核酸序列(例如SEQ IDNO:11或SEQ ID NO:72)编码。在本文公开的方法和组合物的一些实施方式中,GAA蛋白由例如用于以下任一项或多项的密码子优化的GAA核酸序列编码:(1)增强的体内表达,(2)减少CpG岛,或(3)降低固有免疫应答。在本文公开的方法和组合物的一些实施方式中,GAA蛋白由密码子优化的GAA核酸序列编码,例如,选自以下任一种的任意核酸序列:SEQ ID NO:73、SEQ ID NO:74、SEQ ID NO:75、以及SEQ ID NO:76或SEQ ID NO:182,或与SEQ ID NO:73、SEQ ID NO:74、SEQ ID NO:75、SEQ ID NO:76或SEQ ID NO:182具有至少60%、或70%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的核酸序列。
在本文公开的方法和组合物的一些实施方式中,本文所述的rAAV载体转导受试者的肝,并将hGAA多肽分泌到灌注患者组织的血液中,在所述组织中在融合的IGF2-序列的帮助下,hGAA多肽被细胞摄取并转运至溶酶体,在所述溶酶体中该酶发挥作用以消除由于酶缺乏而积累在溶酶体中的物质。为了溶酶体酶替代疗法变得有效,必须将治疗的酶递送至在如下组织的合适细胞中的溶酶体,在所述组织中贮积缺陷显现。B.在离体细胞中调节GAA的水平
本文所述的核酸、载体和病毒体可用于调节细胞中的GAA的水平。该方法包括向细胞给予包含核酸的组合物的步骤,所述核酸包括插入两个AAV ITR之间的编码GAA的多核苷酸。该细胞可以来自可以向其中给予本发明的核酸的任何动物。来自患有GAA缺乏症的受试者的哺乳动物细胞(例如人、狗、猫、猪、绵羊、小鼠、大鼠、兔、牛、山羊等)是用于本发明的典型的靶细胞。在一些实施方式中,细胞是肝细胞或心肌的细胞,例如心肌细胞。
在实施方式中,本文公开了转导有rAAV载体的细胞的离体递送。在进一步的实施方式中,离体基因递送可用于将本文公开的转导有rAAV载体的细胞移植回宿主。在进一步的实施方式中,离体干细胞(例如,间充质干细胞)疗法可用于将本文公开的转导有rAAV载体的细胞移植回宿主。在另一实施方式中,合适的离体方案可以包括数个步骤。
在一些实施方式中,可从受试者收获一部分靶组织(例如,肌肉、肝组织),并且本文所述的rAAV载体用于将编码GAA的核酸转导至宿主细胞中。然后可以将这些经遗传修饰的细胞移植回宿主中。可以使用数种方法将细胞重新引入宿主中,包括静脉内注射、腹膜内注射、皮下注射或原位注射入靶组织中。如本文所述的转导或感染有rAAV载体的经修饰的离体细胞的微囊化是可在本发明中使用的另一项技术。可以根据本发明使用自体和同种异体细胞移植。
在又一实施方式中,本文公开了治疗受试者中的GAA缺乏的方法,所述方法包括以药学上可接受的辅料并以治疗有效量向受试者给予本文公开的表达GAA的细胞。在一些实施方式中,受试者是人。
C.增加受试者中的GAA活性
如本文所述的核酸、载体和病毒体可用于调节受试者(例如人类受试者或患有庞贝氏病或处于患庞贝氏病的风险中的受试者)中的功能性GAA多肽的水平。该方法包括向受试者给予包含含有如本文所述的rAAV基因组的rAAV载体的组合物,所述rAAV基因组包含插入两个AAV ITR之间的编码GAA的异源核酸,其中所述hGAA连接至本文所述的信号肽、以及可选的如本文公开的IGF2靶向肽。受试者可以是任何动物,例如哺乳动物(例如,人类、狗、猫、猪、绵羊、小鼠、大鼠、兔、牛、山羊等)是合适的受试者。本发明的方法和组合物尤其可应用至GAA缺乏的人类受试者。
此外,本文所述的核酸、载体和病毒体可以通过任何合适的方法以任何合适的制剂给予至动物(包括人类)。例如,在本文公开的方法和组合物的任何实施方式中,本文公开的rAAV载体或rAAV基因组可以被直接引入动物中,包括通过口服给予、直肠给予、经粘膜给予、鼻内给予、吸入给予(例如通过气溶胶)、颊给予(例如舌下)、阴道给予、鞘内给予、眼内给予、经皮给予、子宫内(或卵内)给予、肠胃外(例如,静脉内、皮下、皮内、肌内[包括向骨骼肌、膈肌和/或心肌的给予]、皮内、胸膜内、大脑内和关节内)给予、局部给予(例如,向皮肤和粘膜表面两者给予,包括气道表面和经皮给予)、淋巴内给予等,以及直接的组织或器官注射(例如,向肝、骨骼肌、心肌、膈肌或脑注射)或其它肠胃外途径,取决于期望的给予途径和所靶向的组织。
在一些实施方式中,由于rAAV载体或rAAV基因组包含在肝特异性启动子的控制下或可操作地连接至肝特异性启动子的编码GAA的核酸序列,因此本文公开的方法和组合物可通过静脉内或肌内注射给予,在其中rAAV载体或rAAV基因组将转运至肝脏并表达GAA蛋白。
在本文公开的方法和组合物的任何实施方式中,向肌肉的给予可以通过任何合适的方法进行,包括静脉内给予、动脉内给予和/或腹膜内给予。示例性给予方式包括口服给予、直肠给予、经粘膜给予、鼻内给予、吸入给予(例如通过气溶胶)、颊给予(例如舌下)、阴道给予、鞘内给予、眼内给予、经皮给予、子宫内(或卵内)给予、肠胃外(例如,静脉内、皮下、皮内、肌内[包括向骨骼肌、膈肌和/或心肌的给予]、皮内、胸膜内、大脑内和关节内)给予、局部给予(例如,向皮肤和粘膜表面两者给予,包括气道表面和经皮给予)、淋巴内给予等,以及直接的组织或器官注射(例如,向肝、骨骼肌、心肌、膈肌或脑注射)。在任何给定的情况下,最合适的途径将取决于所治疗和/或预防的病症的性质和严重程度以及所使用的特定载体的性质。
在本文公开的方法和组合物的任何实施方式中,根据本发明向骨骼肌给予包括但不限于向四肢(例如,上臂、下臂、大腿和/或小腿)、背部、颈部、头部(例如,舌)、胸部、腹部、骨盆/会阴和/或指/趾中的骨骼肌的给予。可被注射的合适的骨骼肌在2019年11月19日提交的美国临时申请62,937,556中公开,该申请通过引用的方式将其整体并入本文。
在本文公开的方法和组合物的任何实施方式中,将本文公开的rAAV载体和/或rAAV基因组给予至受试者的骨骼肌、肝、膈肌、肋肌和/或心肌细胞。例如,可以使用常规的注射器和针头将rAAV病毒体混悬剂注射入动物中。通过注射进行的rAAV载体和/或rAAV基因组的胃肠外给予可以通过例如团注(bolus injection)或持续输注进行。注射制剂可以以单位剂量形式存在,例如随着加入的防腐剂存在于多剂量容器或安瓿中。该组合物可以采取诸如在油性或水性溶媒中的混悬剂、溶液剂或乳剂的形式,并且可以包含用于药物制剂的试剂,例如助悬剂、稳定剂和/或分散剂。或者,本文公开的rAAV载体和/或rAAV基因组可以呈粉末形式(例如经冻干的),以在使用前与合适的溶媒(例如灭菌无热原水)一起构成。
在具体的实施方式中,可以采用多于一次的给予(例如,两次、三次、四次、五次、六次、七次、八次、九次、十次等,或更多次给予),以在各种时间间隔的时间段(如每小时、每天、每周、每月、每年等)内达到期望的基因表达水平。给药可以是单剂的或累积的(连续给药),并且可以由本领域技术人员容易地确定。例如,疾病或紊乱的治疗可以包含一次给予有效剂量的本文公开的药物组合物病毒载体。或者,疾病或紊乱的治疗可包含在一段时间内进行的有效剂量的病毒载体的多次给予,例如每天一次、每天两次、每天三次、每数天一次或每周一次。
取决于个体症状的严重程度等因素,给予时机可因个体而异。例如,可以在不确定的时间段内每六个月一次向个体给予有效剂量的本文公开的病毒载体,或者直到个体不再需要治疗为止。本领域普通技术人员将认识到,可以在整个治疗过程中监测个体的状况,并且可以相应地调节所给予的本文公开的病毒载体的有效量。
可注射剂可以以常规形式制备,作为液体溶液剂或混悬剂、注射前的适合于溶液剂或混悬剂的固体形式,或作为乳剂。或者,可以以局部而非全身的方式(例如以长效制剂或缓释制剂)给予本发明的病毒载体和/或病毒衣壳。此外,病毒载体和/或病毒衣壳可以附着到手术可植入基质而进行递送(例如,如美国专利公开号US-2004-0013645-A1中所述)。本文公开的病毒载体和/或病毒衣壳可以通过任何合适的方式给予至受试者的肺部,任选地通过给予由病毒载体和/或病毒衣壳构成的可吸入颗粒的气溶胶混悬剂,由受试者吸入所述混悬剂。可吸入颗粒可以是液体或固体。如本领域技术人员已知的,包含病毒载体和/或病毒衣壳的液体颗粒的气溶胶可以通过任何合适的方法产生,例如利用压力驱动的气溶胶雾化器或超声雾化器。参见例如,美国专利号4,501,729。包含病毒载体和/或衣壳的固体颗粒的气溶胶也可以同样地通过制药领域已知的技术用任何固体颗粒药物气溶胶发生器产生。
在一些实施方式中,本文公开的rAAV载体和/或rAAV基因组可以以足以溶解本文公开的rAAV载体的量在溶剂、乳剂或其它稀释剂中配制。在该实施方式的其它方面,本文公开的rAAV载体和/或rAAV基因组可以以如下的量在溶剂、乳剂或稀释剂中配制,例如小于约90%(v/v)、小于约80%(v/v)、小于约70%(v/v)、小于约65%(v/v)、小于约60%(v/v)、小于约55%(v/v)、小于约50%(v/v)、小于约45%(v/v)、小于约40%(v/v)、小于约35%(v/v)、小于约30%(v/v)、小于约25%(v/v)、小于约20%(v/v)、小于约15%(v/v)、小于约10%(v/v)、小于约5%(v/v)或小于约1%(v/v)。在其它方面,本文公开的rAAV载体和/或rAAV基因组可以以处于如下范围内的量包含溶剂、乳剂或其它稀释剂,例如约1%(v/v)至90%(v/v)、约1%(v/v)至70%(v/v)、约1%(v/v)至60%(v/v)、约1%(v/v)至50%(v/v)、约1%(v/v)至40%(v/v)、约1%(v/v)至30%(v/v)、约1%(v/v)至20%(v/v)、约1%(v/v)至10%(v/v)、约2%(v/v)至50%(v/v)、约2%(v/v)至40%(v/v)、约2%(v/v)至30%(v/v)、约2%(v/v)至20%(v/v)、约2%(v/v)至10%(v/v)、约4%(v/v)至50%(v/v)、约4%(v/v)至40%(v/v)、约4%(v/v)至30%(v/v)、约4%(v/v)至20%(v/v)、约4%(v/v)至10%(v/v)、约6%(v/v)至50%(v/v)、约6%(v/v)至40%(v/v)、约6%(v/v)至30%(v/v)、约6%(v/v)至20%(v/v)、约6%(v/v)至10%(v/v)、约8%(v/v)至50%(v/v)、约8%(v/v)到40%(v/v)、约8%(v/v)到30%(v/v)、约8%(v/v)至20%(v/v)、约8%(v/v)至15%(v/v)或约8%(v/v)至12%(v/v)。
在本文公开的方法和组合物的任何实施方式中,本文公开的任意血清型的rAAV载体和/或rAAV基因组包括但不限于被选自以下的任何AAV3b衣壳包裹:AAV3b衣壳(SEQ IDNO:44)、AAV3b265D衣壳(SEQ ID NO:46)、AAV3b ST(S663V+T492V)衣壳(SEQ ID NO:48)、AAV3b265D549A衣壳(SEQ ID NO:50)、AAV3b549A衣壳(SEQ ID NO:52)、AAV3bQ263Y衣壳(SEQ ID NO:54)或AAV3bSASTG衣壳(即,包含Q263A/T265突变的AAV3b衣壳),可以包含治疗有效量的治疗化合物。在实施方式中,如本文所用的但不受限的,术语“有效量”与“治疗有效量”、“有效剂量”或“治疗有效剂量”同义。在实施方式中,本文公开的用于治疗庞贝氏病的治疗化合物的有效性可以不受限制地通过观察基于与庞贝氏病相关的一个或多个临床症状和/或生理指标的个体中的改善来确定。在实施方式中,可以通过对同步治疗减少的需求来表明与庞贝氏病相关的症状的改善。
为了促进本文公开的rAAV载体和/或rAAV基因组的递送,可以将其与运载体或赋形剂混合。可能使用的运载体和赋形剂包括盐水(特别是灭菌的无热原盐水)、盐水缓冲液(例如,柠檬酸盐缓冲液、磷酸盐缓冲液、乙酸盐缓冲液和碳酸氢盐缓冲液)、氨基酸、尿素、醇、抗坏血酸、磷脂、蛋白质(例如血清白蛋白)、EDTA、氯化钠、脂质体、甘露醇、山梨糖醇和甘油。USP级运载体和赋形剂对于将病毒体递送至人类受试者特别有用。
除了前述的制剂之外,本文公开的rAAV载体和/或rAAV基因组也可以被配制成长效制剂。此类长期作用配方可以通过植入(例如皮下或肌内)或通过IM注射来给予。因此,例如,本文公开的rAAV载体和/或rAAV基因组可以用合适的聚合材料或疏水材料(例如作为可接受的油中的乳剂)或离子交换树脂或作为微溶衍生物来配制。
在本文公开的方法和组合物的任何实施方式中,该方法针对治疗受试者中的由GAA缺乏引起的庞贝氏病,其中,将本文公开的rAAV载体和/或rAAV基因组给予至患有庞贝氏病的患者,并在给予后,GAA从肝脏的细胞中分泌,并且分泌的GAA被骨骼肌组织、心肌组织、膈肌组织或它们的组合中的细胞摄取,其中,对分泌的GAA的摄取引起组织中溶酶体糖原存储的减少。在一些实施方式中,本文公开的rAAV载体和/或rAAV基因组被包裹在衣壳中,例如,被选自以下的任意AAV3b衣壳包裹:AAV3b衣壳(SEQ ID NO:44)、AAV3b265D衣壳(SEQ ID NO:46)、AAV3b ST(S663V+T492V)衣壳(SEQ ID NO:48)、AAV3b265D549A衣壳(SEQID NO:50)、AAV3b549A衣壳(SEQ ID NO:52)、AAV3bQ263Y衣壳(SEQ ID NO:54)。
在具体的实施方式中,将在药学上可接受的运载体中每剂给予至少约102至约108个细胞或至少约103至约106个细胞。在进一步的实施方式中,待给予至受试者的病毒载体和/或衣壳的剂量取决于给予方式、待治疗和/或预防的疾病或病症、个体受试者的状况、具体的病毒载体或衣壳、待递送的核酸等,并且可以用常规方式确定。用于达到治疗效果的示例性剂量是至少约105、106、107、108、109、1010、1011、1012、103、1014、1015转导单位的滴度,任选地为约108-1013转导单位。
在另一方面,本文公开了向细胞给予编码GAA的核酸的方法,该方法包括在待将核酸引入细胞并表达以产生GAA的条件下,使细胞与本文公开的rAAV载体和/或rAAV基因组接触。在一些实施方式中,细胞是经培养的细胞。在一些实施方式中,细胞是体内细胞。在一些实施方式中,细胞是哺乳动物细胞。在一些实施方式中,向细胞给予编码GAA的核酸的方法进一步包括收集分泌到细胞培养基中的GAA。
D.增加哺乳动物中的运动神经元的功能
在本文公开的方法和组合物的任何实施方式中,本文公开的rAAV载体和/或rAAV基因组在组合物和方法中有用,所述组合物和方法用于在患有庞贝氏病和/或具有不足的GAA水平的哺乳动物中增加膈神经活性。例如,本文公开的rAAV载体和/或rAAV基因组、例如被包裹在衣壳中的rAAV载体和/或rAAV基因组(例如,被选自以下的任意AAV3b衣壳包裹)可以被给予至中枢神经系统(例如神经元):AAV3b衣壳(SEQ ID NO:44)、AAV3b265D衣壳(SEQID NO:46)、AAV3b ST(S663V+T492V)衣壳(SEQ ID NO:48)、AAV3b265D549A衣壳(SEQ IDNO:50)、AAV3b549A衣壳(SEQ ID NO:52)、AAV3bQ263Y衣壳(SEQ ID NO:54)。在另一实施方式中,本文公开的编码GAA的rAAV载体和/或rAAV基因组从膈膜(或其它肌肉)向膈神经或其它运动神经元的逆向转运可引起庞贝氏病的生化性和生理性校正。这些相同的原理可以应用至其它神经退行性疾病。
在实施方式中,如表1所述的任何血清型的rAAV GAA构建体,包括AAV8或AAV3、或AAV3b(包括但不限于AAV3b血清型AAV3b265D、AAV3b265D549A、AAV3b549A、AAV3bQ263Y、AAV3bSASTG(即,包含Q263A/T265突变的AAV3b衣壳)血清型),能够减轻以下症状中的任一种或多种:(i)患者的较下的肢体(包括腿、躯干和/或手臂)的无力感,(ii)呼吸短促、运动困难、肺部感染、脊柱中的大弯曲、睡眠时呼吸困难、肝脏肿大、舌肿大和/或关节僵硬,(iii)患有庞贝氏病的患者中,与未接受相同治疗的患者相比降低例如至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%。在该实施方式的其它方面,任何血清型的AAV GAA能够减轻以下症状中的任一种或多种:(i)患者的较下的肢体(包括腿、躯干和/或手臂)的无力感,(ii)呼吸短促、运动困难、肺部感染、脊柱的大的弯曲、睡眠时呼吸困难、肝脏肿大、舌头肿大和/或关节僵硬,(iii)患有庞贝氏病的患者中,与未接受相同治疗的患者相比降低例如约10%至约100%、约20%至约100%、约30%至约100%、约40%至约100%、约50%至约100%、约60%至约100%、约70%至约100%、约80%至约100%、约10%至约90%、约20%至约90%、约30%至约90%、约40%至约90%、约50%至约90%、约60%至约90%、约70%至约90%、约10%至约80%、约20%至约80%、约30%至约80%、约40%至约80%、约50%至约80%、或约60%至约80%、约10%至约70%、约20%至约70%、约30%至约70%、约40%至约70%、或约50%至70%。
在本文公开的方法和组合物的任何实施方式中,与庞贝氏病相关的至少一种症状或与庞贝氏病相关的至少一种不良副作用减少至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%,并且与庞贝氏病有关的症状的严重程度或至少一种不良副作用减少至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%。在另一实施方式中,与庞贝氏病相关的至少一种症状或与庞贝氏病相关的至少一种不良副作用减少约10%至约100%、约20%至约100%、约30%至约100%、约40%至约100%、约50%至100%、约60%至约100%、约70%至约100%、约80%至约100%、约10%至约90%、约20%至约90%、约30%至约90%、约40%至约90%、约50%至约90%、约60%至约90%、约70%至约90%、约10%至约80%、约20%至约80%、约30%至约80%、约40%至约80%、约50%至约80%、或约60%至约80%、约10%至约70%、约20%至约70%、约30%至约70%、约40%至约70%或约50%至约70%。
E.免疫抑制
在本文公开的方法和组合物的任何实施方式中,向给予了本文公开的rAAV载体或rAAV基因组的受试者再给予免疫抑制剂。已知引起给予AAV的患者的免疫应答的免疫抑制的多种方法。本领域已知的方法包括向患者给予免疫抑制剂,例如蛋白酶体抑制剂。本领域已知的一种此类蛋白酶体抑制剂是硼替佐米,例如美国专利号9,169,492和美国专利申请号15/796,137(二者均以引用的方式并入本文)中所公开的。在另一实施方式中,免疫抑制剂可以是抗体,包括能够通过例如消除或抑制产生抗体的细胞来抑制免疫应答的多克隆抗体、单克隆抗体、scfv或其它的源自抗体的分子。在进一步的实施方式中,免疫抑制元件可以是短发夹RNA(shRNA)。在此类实施方式中,shRNA的编码区被包含在rAAV盒中,并且通常位于poly-A尾的3'端下游。shRNA可以被靶向以减少或消除免疫刺激剂的表达,所述免疫刺激剂例如细胞因子、生长因子(包括转化生长因子β1和β2、TNF和其它公众知晓的因子)。
VI.用其它溶酶体酶替换GAA。
在一些实施方式中,在本文公开的任何方法和组合物中,可以将编码GAA多肽的核酸序列置换为溶酶体酶的核酸序列。适合由本文公开的rAAV载体或rAAV基因组表达的溶酶体酶包括能够减少哺乳动物溶酶体中积累的物质或能够挽救或改善一种或多种溶酶体贮积病症状的任何酶。合适的溶酶体酶包括野生型或经修饰的溶酶体酶两者,并且可以使用重组或合成方法产生或从天然来源纯化。示例性的溶酶体酶列于表5A或表6A中。
表5A:示例性的溶酶体贮积病(LSD)和相关的酶缺陷
Figure BDA0003751229800001431
Figure BDA0003751229800001441
在本文公开的组合物和方法的一些实施方式中,一种特别优选的溶酶体酶是葡萄糖脑苷脂酶,其目前通过Genzyme重组地生产和制造并用于Gaucher's病的酶替代疗法。目前,重组酶用暴露的甘露糖残基制备,其将蛋白质特异性地靶向至巨噬细胞谱系的细胞。尽管1型Gaucher患者的主要病理是由于巨噬细胞积累葡萄糖脑苷脂,但将葡萄糖脑苷脂酶递送至其它细胞类型可能具有治疗优势。本发明使用的葡萄糖脑苷脂酶靶向至溶酶体将使试剂靶向至多种细胞类型,并且与其它制剂相比可以具有治疗优势。在本文公开的组合物和方法的一些实施方式中,在本文公开的方法中治疗的溶酶体疾病不是庞贝氏病。在本文公开的组合物和方法的一些实施方式中,由靶向载体或rAAV载体中的核酸所编码的溶酶体酶不是GAA。
虽然本发明的方法和组合物可用于产生任何治疗剂并将其递送至亚细胞区室,但本发明尤其对递送用于治疗代谢性疾病的基因产物有用。
在一些实施方式中,将用于治疗溶酶体贮积病(LSD)的溶酶体酶示于表5A中。在一些实施方式中,溶酶体酶与表6A中所示的高尔基体或ER的缺陷相关。在优选的实施方式中,将编码如本文所述的溶酶体酶的病毒载体递送至遭受相同溶酶体酶基因缺陷的患者。在替代的实施方式中,使用溶酶体酶基因的功能序列或种类变体。在进一步的实施方式中,编码能够挽救溶酶体酶基因缺陷的不同酶的基因是根据本发明的方法。
表6A:高尔基体和ER的疾病
Figure BDA0003751229800001451
在本文公开的方法和组合物的一些实施方式中,靶向载体或rAAV表达表5B或表6B的序列中的任一种的蛋白质。
表5B:示例性的溶酶体贮积病(LSD)和待通过靶向载体或rAAV载体表达的蛋白质,以及编码所述蛋白质的核酸序列。
Figure BDA0003751229800001461
Figure BDA0003751229800001471
Figure BDA0003751229800001481
Figure BDA0003751229800001491
表6B:示例性的溶酶体贮积病(LSD)和待通过靶向载体或rAAV载体表达的蛋白质,以及编码所述蛋白质的核酸序列。
Figure BDA0003751229800001492
Figure BDA0003751229800001501
VII.给予
在一些实施方式中,本文描述的技术涉及用于将本文公开的rAAV载体或rAAV基因组给予至患有溶酶体疾病或紊乱的受试者(例如给予至患有庞贝氏病的受试者)的方法和组合物。在一些实施方式中,所述方法包括给予包含rAAV载体的同源群的组合物,所述rAAV载体的同源群包含rAAV载体,其中rAAV载体是AAV3或AAV8载体,或包含来自本文公开的AAV3或AAV8的至少一种衣壳蛋白的单倍体rAAV载体。在一些实施方式中,向受试者给予如本文公开的不同rAAV载体的混合物,例如包含靶向或转导肝细胞的rAAV载体和靶向或转导肌肉细胞的rAAV载体的组合物。在示例性实施方式中,向受试者给予包含本文公开的两种或更多种不同rAAV载体的混合物的组合物,例如包含本文公开的AAV3载体和AAV8载体的组合物,其中各AAV载体包含编码可操作地连接至本文公开的LSP的GAA多肽的核酸。
在一些实施方式中,例如同时或序贯地向受试者共给予本文公开的两种或更多种不同的rAAV载体。仅出于示例性目的,可以向受试者给予包含靶向或转导肝细胞的rAAV载体的组合物,并且其中还向受试者共给予包含靶向或转导肌肉细胞的rAAV载体的组合物。在示例性实施方式中,向受试者共给予包含本文公开的rAAV载体的组合物(例如包含本文公开的AAV3载体或其变体的组合物,其包含本文公开的编码可操作地连接至LSP的GAA多肽的核酸),并且其中还向受试者共给予包含本文公开的不同rAAV载体的组合物(例如包含AAV8载体或单倍体AAV载体的组合物,其包含本文公开的编码可操作地连接至LSP的GAA多肽的核酸,或替代地,其中用不同的启动子(例如肌肉特异性启动子)替换LSP)。
待向受试者给予的本文公开的rAAV载体或rAAV基因组的剂量取决于给予方式、待治疗和/或预防的庞贝氏病或其它病症的严重性、个体受试者的状况、具体的病毒载体或衣壳和待递送的核酸等,且可以以常规方式来确定。用于达到治疗效果的示例性剂量是至少约105、106、107、108、109、1010、1011、1012、1013、1014、1015转导单位的滴度,任选地为约108至约1013转导单位的滴度。
在进一步的实施方式中,向受试者给予如本文所公开的rAAV载体或rAAV基因组引起产生具有如下的循环半衰期的GAA蛋白:2小时、3小时、4小时、5小时、6小时、7小时、8小时、9小时、10小时、11小时、12小时、13小时、14小时、15小时、16小时、17小时、18小时、19小时、20小时、21小时、22小时、23小时、1天、2天、3天、4天、5天、6天、7天、1周、2周、3周、4周、一个月、两个月、三个月、四个月或更久。
在实施方式中,将本文公开的rAAV载体或rAAV基因组给予至受试者的时间段为1天、2天、3天、4天、5天、6天、7天、8天、9天、10天、11天、12天、13天、14天、3周、4周、5周、6周、7周、8周、9周、10周、11周、12周、4个月、5个月、6个月、7个月、8个月、9个月、10个月、11个月、12个月或更久。在进一步的实施方式中,在其中停止给予的时间段为1天、2天、3天、4天、5天、6天、7天、8天、9天、10天、11天、12天、13天、14天、3周、4周、5周、6周、7周、8周、9周、10周、11周、12周、4个月、5个月、6个月、7个月、8月、9个月、10个月、11个月、12个月或更久。
在另一实施方式中,如本文公开的用于治疗庞贝氏病的rAAV载体或rAAV基因组的给予引起体重增加,例如增加至少0.5磅、至少1磅、至少1.5磅、至少2磅、至少2.5磅、至少3磅、至少3.5磅、至少4磅、至少4.5磅、至少5磅、至少5.5磅、至少6磅、至少6.5磅、至少7磅、至少7.5磅、至少8磅、至少8.5磅、至少9磅、至少9.5磅、至少10磅、至少10.5磅、至少11磅、至少11.5磅、至少12磅、至少12.5磅、至少13磅、至少13.5磅、至少14磅、至少14.5磅、至少15磅、至少20磅、至少25磅、至少30磅、至少50磅。
在另一实施方式中,如本文公开的用于治疗庞贝氏病的任何血清型的AAV GAA引起体重增加,例如增加0.5磅至50磅、0.5磅至30磅、0.5磅至25磅、0.5磅至20磅、0.5磅至15磅、0.5磅至10磅、0.5磅至7.5磅、0.5磅至5磅、1磅至15磅、1磅至10磅、1磅至7.5磅、1磅至5磅、2磅至10磅、2磅至7.5磅。
A.药物组合物
用于本文公开的给予方法中的本文公开的rAAV载体可以与药学上可接受的赋形剂(即,一种或多种药学上可接受的运载体物质和/或添加剂)(例如缓冲剂、运载体、赋形剂、稳定剂等)配制在药物组合物中。药物组合物可以以试剂盒的形式来提供。包含用于本文公开的给予方法中的本文公开的rAAV载体的药物组合物及其用途是本领域已知的。
因此,本发明的进一步方面提供了药物组合物,所述药物组合物包含用于本文公开的给予方法中的本文公开的rAAV载体。根据本公开的药物组合物中的活性成分(例如本文公开的rAAV载体)、药学上可接受的赋形剂和/或任何额外的成分的相对量可以依据特性、大小和/或被治疗的受试者的病症以及进一步依据组合物被给予的途径而有所不同。例如,该组合物可包含0.1%至99%(w/w)的活性成分。例如,组合物可包含0.1%至100%(例如5%至50%、1%至30%、5%至80%、至少80%)(w/w)的活性成分。
可以使用一种或多种赋形剂或稀释剂来配制药物组合物以:(1)增加稳定性;(2)增强细胞的转染或转导;(3)允许有效载荷缓释或迟释;(4)改变生物分布(例如,将病毒颗粒靶向至特定组织或细胞类型);(5)增强经编码的蛋白质的翻译;(6)改变经编码的蛋白质的释放曲线和/或(7)允许本发明的有效负载的可调节表达。在一些实施方式中,药学上可接受的赋形剂可以是至少95%、至少96%、至少97%、至少98%、至少99%或100%的纯度。在一些实施方式中,赋形剂被批准用于人和兽医用途。在一些实施方式中,赋形剂可由美国食品和药物管理局批准。在一些实施方式中,赋形剂可以是药物级的。在一些实施方式中,赋形剂可满足美国药典(USP)、欧洲药典(EP)、英国药典和/或国际药典的标准。如本文所使用的赋形剂包括但不限于适用于期望的特定剂型的任何和所有溶剂、分散介质、稀释剂或其它液体溶媒、分散或悬浮助剂、表面活性剂、等渗剂、增稠剂或乳化剂、防腐剂等。用于配制药物组合物的多种赋形剂和用于制备该组合物的技术是本领域已知的(参见Remington:The Science and Practice of Pharmacy,21st Edition,A.R.Gennaro,Lippincott,Williams and Wilkins,Baltimore,MD,2006;通过引用的方式将其整体并入本文)。在本公开的范围内可以考虑使用常规赋形剂介质,除非任何常规赋形剂介质可能与物质或其衍生物(例如通过以有害的方式与药物组合物的任何其它成分产生任何不期望的生物作用或别的相互作用)不相容。
用于本文公开的给予方法中的本文公开的rAAV载体可以与一种或多种其它的治疗剂、预防剂、研究剂或诊断剂联合使用。“联合”并不意味着试剂必须同时给予和/或必须配制以一同递送,尽管这些递送方法在本发明的范围内。组合物可以与一种或多种其它期望的治疗或医学程序同时给予、在此之前给予或在此之后给予。在一些实施方式中,当第二种(例如,一种或多种治疗剂)的递送开始时,第一种治疗(例如,基因治疗载体)的递送仍在发生,因此在给予方面存在着重叠。这在本文中有时被称为“同步”或“同时递送”。在其它实施方式中,一种治疗的递送在另一种治疗的递送开始之前结束。在二者中的任一情况的一些实施方式中,由于联合给予,治疗更加有效。例如,第二治疗更加有效(例如用更少的第二治疗而看到等效的效果,或者与在第一治疗不存在下给予第二治疗所能看到的相比或与第一治疗所看到的相似情况相比,第二治疗更大程度上减轻了症状)。在一些实施方式中,递送使得与紊乱相关的症状或其它参数减少,该减少大于在不存在另一种治疗的情况下递送一种治疗所观察到的。两种治疗的效果可以是部分叠加的、完全叠加的或大于叠加的。递送可以使得所递送的第一治疗的效果在递送第二治疗时仍然是可检测的。本文所述的组合物和至少一种额外的疗法可以在同一组合物或分开的组合物中同时给予、或序贯给予。对于序贯给予,可以首先给予本文所述的基因治疗载体,其次可以给予一种或多种治疗剂,或者可以颠倒给予顺序。基因治疗载体和一种或多种治疗剂可以在紊乱活跃期间或在缓解期或疾病较不活跃期间给予。基因治疗载体可以在另一治疗之前给予、与治疗同时给予、治疗后或在紊乱缓解期间给予。
当组合给予时,用于本文公开的给予方法中的本文公开的rAAV载体和一种或多种治疗剂(例如,第二或第三治疗剂)或全部可以以高于各自单独使用(例如,作为单一疗法)的量或剂量、低于各自单独使用的量或剂量或与各自单独使用的量或剂量相同的量或剂量给予。在某些实施方式中,用于本文公开的给予方法中的本文公开的rAAV载体和一种或多种治疗剂(例如,第二药剂或第三药剂)或全部的给予量或剂量低于(例如,低至少20%、至少30%、至少40%或至少50%)各自单独使用的量或剂量。在其它实施方式中,用于本文公开的给予方法中的本文公开的rAAV载体和一种或多种治疗剂(例如,第二药剂或第三药剂)或全部的产生期望的效果(例如,心血管疾病或心脏病的治疗)的量或剂量低于(例如,低至少20%、至少30%、至少40%或至少50%)各自单独使用实现相同的治疗效果所需的量或剂量。
在一些实施方式中,本文公开的rAAV载体的给予方法可以单独递送本文公开的rAVV载体,或与另外的药剂(例如本文公开的免疫调节剂)联合递送本文公开的rAVV载体。
B.免疫调节剂:
在一些实施方式中,使用本文所述的AAV载体和AAV基因组来治疗溶酶体疾病(例如庞贝氏病)的方法和组合物进一步包括给予免疫调节剂。在一些实施方式中,免疫调节剂可以在给予rAAV载体时给予、在给予rAAV载体之前给予或在给予rAAV载体之后给予。
在一些实施方式中,免疫调节剂是免疫球蛋白降解酶,例如IdeS、IdeZ、IdeS/Z、EndoS,或它们的功能变体。此类免疫球蛋白降解酶及其用途的参考文献的非限制性实例描述于US 7,666,582、US 8,133,483、US 20180037962、US 20180023070、US 20170209550、US8,889,128、WO2010/057626、US 9,707,279、US 8,323,908、US 20190345533、US20190262434和WO2020/016318,它们各自通过引用的方式将其整体并入。
在一些实施方式中,免疫调节剂是蛋白酶体抑制剂。在某些方面,蛋白酶体抑制剂是硼替佐米。在实施方式的一些方面,免疫调节剂包含硼替佐米和抗CD20抗体利妥昔单抗。在实施方式的其它方面,免疫调节剂包含硼替佐米、利妥昔单抗、甲氨蝶呤和静脉内丙种球蛋白。公开了蛋白酶体抑制剂及其与利妥昔单抗、甲氨蝶呤和静脉内丙种球蛋白的组合的此类参考文献的非限制性实例描述于US 10,028,993、US 9,592,247和US 8,809,282中,它们各自通过引用的方式将其整体并入。
在替代实施方式中,免疫调节剂是NF-kB通路的抑制剂。在实施方式的某些方面,免疫调节剂是雷帕霉素或功能变体。公开了雷帕霉素及其用途的参考文献的非限制性实例描述于US 10,071,114、US 20160067228、US 20160074531、US 20160074532、US20190076458、US 10,046,064中,将其整体并入。在实施方式的其它方面,免疫调节剂是包含免疫抑制剂的合成的纳米运载体。免疫抑制剂、偶联至合成的纳米运载体的免疫抑制剂、包含雷帕霉素的合成的纳米运载体和/或耐受性合成的纳米运载体、它们的剂量、给予和用途的参考文献的非限制性实例描述于US 20150320728、US 20180193482、US 20190142974、US 20150328333、US20160243253、US 10,039,822、US 20190076522、US 20160022650、US10,441,651、US 10,420,835、US 20150320870、US 2014035636、US 10,434,088、US 10,335,395、US 20200069659、US 10,357,483、US 20140335186、US 10,668,053、US 10,357,482、US 20160128986、US 20160128987、US 20200038462、US 20200038463,它们各自通过引用的方式将其整体并入。
在一些实施方式中,免疫调节剂是如在US20200038463、美国专利9,006,254(它们各自将其整体并入本文)中公开的包含雷帕霉素的合成的纳米运载体(ImmTORTM纳米颗粒)(Kishimoto等,2016,Nat Nanotechnol,11(10):890-899;Maldonado等,2015,PNAS,112(2):E156-165)。在一些实施方式中,免疫调节剂是经工程化的细胞,例如使用如WO2017192786(通过引用的方式将其整体并入本文)中公开的SQZ技术修饰的免疫细胞。
在一些实施方式中,免疫调节剂选自于由以下所组成的组:poly-ICLC、1018ISS、铝盐、Amplivax、AS15、BCG、CP-870、893、CpG7909、CyaA、dSLIM、GM-CSF、IC30、IC31、咪喹莫特、ImuFact IMP321、IS Patch、ISS、ISCOMATRIX、Juvlmmune、LipoVac、MF59、单磷酰脂A、Montanide IMS 1312、Montanide ISA 206、Montanide ISA 50V、Montanide ISA-51、OK-432、OM-174、OM-197-MP-EC、ONTAK、PEPTEL、载体系统、PLGA微粒、雷西莫特(resiquimod)、SRL172、病毒小体和其它病毒样颗粒、YF-17D、VEGF trap、R848、β-葡聚糖、Pam3Cys和Aquila的QS21刺激子(stimulon)。在另一进一步的实施方式中,免疫调节剂或佐剂是poly-ICLC。
在一些实施方式中,免疫调节剂是抑制细胞中固有免疫应答的小分子,例如氯喹(TLR信号传导抑制剂)和2-氨基嘌呤(PKR抑制剂),还可以与包含本文公开的至少一种rAAV的组合物联合给予。可商购的TLR信号传导抑制剂的一些非限制性实例包括BX795、氯喹、CLI-095、OxPAPC、多粘菌素B和雷帕霉素(均可从INVIVOGENTM购买得到)。此外,模式识别受体(PRR)(其参与固有免疫信号传导)的抑制剂(例如2-氨基嘌呤、BX795、氯喹和H-89)也可在包含用于本文公开的体内蛋白质表达中的本文公开的至少一种rAAV载体的组合物和方法中使用。
在一些实施方式中,rAAV载体还可以编码固有免疫的负调控因子(例如NLRX1)。因此,在一些实施方式中,rAAV载体还可以任选地编码NLRX1、NS1、NS3/4A或A46R中的一种或多种,或其任意组合。此外,在一些实施方式中,包含如本文公开的至少一种rAAV载体的组合物还可以包含固有免疫系统的合成的、经修饰的RNA编码抑制剂以避免由组织或受试者产生的固有免疫应答。
在一些实施方式中,用于本文公开的给予方法中的免疫调节剂是免疫抑制剂。如本文所使用的,术语“免疫抑制药物或试剂”旨在包括抑制或干扰正常免疫功能的药用试剂。适用于本文公开的方法的免疫抑制剂的实例包括抑制T-细胞/B-细胞共刺激通路的试剂,例如在美国专利公开号2002/0182211中公开的通过CTLA4和B7通路干扰T-细胞和B-细胞的偶联的试剂。在一个实施方式中,免疫抑制剂是环孢菌素A。其它实例包括吗替麦考酚酯、雷帕霉素和抗胸腺细胞球蛋白。在一个实施方式中,免疫抑制药物以包含如本文公开的至少一种rAAV载体的组合物给予;或可以以单独的组合物给予,但根据本文公开的给予方法与包含至少一种rAAV载体的组合物同时给予、或在此之前给予或在此之后给予。免疫抑制药物以与给予途径兼容的剂型给予,并以足以实现期望的治疗效果的剂量向受试者给予。在一些实施方式中,免疫抑制药物被瞬时给予足够的时间以诱导对本文公开的rAAV载体的耐受性。
在本文公开的方法和组合物的任何实施方式中,给予如本文公开的rAAV载体或rAAV基因组的受试者也被给予免疫抑制剂。已知多种方法引起对给予AAV的患者的免疫应答的免疫抑制。本领域已知的方法包括向患者给予免疫抑制剂(例如蛋白酶体抑制剂)。本领域已知的一种此类蛋白酶体抑制剂是例如在美国专利号9,169,492和美国专利申请号15/796,137(两者均通过引用的方式并入本文)中公开的硼替佐米。在一些实施方式中,免疫抑制剂可以是抗体,包括多克隆抗体、单克隆抗体、scfv或能够抑制免疫应答(例如通过消除或抑制产生抗体的细胞)的其它的源自抗体的分子。在进一步的实施方式中,免疫抑制元件可以是短发夹RNA(shRNA)。在此类实施方式中,shRNA的编码区被包含在rAAV盒中并且通常位于poly-A尾的3'端的下游。shRNA可以被靶向以减少或消除免疫刺激剂的表达,所述免疫刺激剂例如细胞因子、生长因子(包括转化生长因子β1和β2、TNF以及公众知晓的其它因子)。
此类免疫调节剂的使用促进了一个人在数月和/或数年期间使用多次给药(例如多次给予)的能力。这允许使用如下所讨论的多种试剂(例如编码多种基因的rAAV载体),或允许对受试者多次给予。
本文公开的技术的组合物和方法的所有方面可以在以下任意一个或多个编号的段落中定义:
1.一种重组腺相关病毒(AAV)载体,所述载体在其基因组中包含:(a)5'和3'AAV反向末端重复(ITR)序列;以及(b)位于5'和3'ITR之间的编码α-葡萄糖苷酶(GAA)多肽的异源核酸序列,其中,所述异源核酸可操作地连接至肝特异性启动子。
2.如段落1所述的重组AAV载体,其中,编码所述GAA多肽的异源核酸序列进一步包含位于编码α-葡萄糖苷酶(GAA)多肽的核酸的5'端的信号肽,或其中,编码所述GAA多肽的异源核酸序列进一步包含位于GAA多肽的N-末端的IGF2靶向肽。
3.如段落1所述的重组AAV载体,其中,编码所述GAA多肽的异源核酸序列进一步包含位于所述分泌信号肽和所述α-葡萄糖苷酶(GAA)多肽之间的IGF2靶向肽,或其中,编码所述GAA多肽的异源核酸序列进一步包含位于GAA多肽的N-末端的IGF2靶向肽。
4.如段落1-3中任一段所述的重组AAV载体,其中,所述AAV基因组以5'至3'方向包含:(a)5'ITR,(b)肝特异性启动子序列,(c)内含子序列,(d)编码分泌信号肽的核酸,(e)编码α-葡萄糖苷酶(GAA)多肽的核酸,(f)poly A序列,以及(g)3'ITR。在一些实施方式中,所述内含子序列(c)不存在。
5.如段落1-3中任一段所述的重组AAV载体,其中,所述AAV基因组以5'至3'方向包含:(a)5'ITR,(b)肝特异性启动子序列,(c)内含子序列,(d)编码IGF2靶向肽的核酸,(e)编码α-葡萄糖苷酶(GAA)多肽的核酸,(f)poly A序列,以及(g)3'ITR。在一些实施方式中,所述内含子序列(c)不存在。
6.如段落1-6中任一段所述的重组AAV载体,其中,所述AAV基因组以5'至3'方向包含:(a)5'ITR,(b)肝特异性启动子序列,(c)内含子序列,(d)编码分泌信号肽的核酸,(e)编码IGF2靶向肽的核酸,(f)编码α-葡萄糖苷酶(GAA)多肽的核酸,(g)poly A序列,以及(h)3'ITR。在一些实施方式中,所述内含子序列不存在。
7.如段落1-6中任一段所述的重组AAV载体,其中,所述分泌信号肽选自:AAT信号肽、纤连蛋白信号肽(FN1)、GAA信号肽、或它们具有分泌信号活性的活性片段。例如,编码所述分泌信号肽的核酸可以选自:AAT信号肽(例如,SEQ ID NO:17)、纤连蛋白信号肽(FN1)(例如,SEQ ID NO:18-SEQ ID NO:21)、同源GAA信号肽(SEQ ID NO:175)、hIGF2信号肽(例如,SEQ ID NO:22)、IgG1前导肽(SEQ ID NO:177)、wtIL2前导肽(SEQ ID NO:179)、突变型IL2前导肽(SEQ ID NO:181)或它们的具有分泌信号活性的活性片段,例如编码与SEQ IDNO:17-SEQ ID NO:22、SEQ ID NO:175、SEQ ID NO:177、SEQ ID NO:179或SEQ ID NO:181具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的氨基酸序列的核酸。
8.如段落1-7中任一段所述的重组AAV载体,其中,所述IGF2靶向肽结合人阳离子非依赖甘露糖-6-磷酸受体(CI-MPR)或IGF2受体。
9.如段落1-5中任一段所述的重组AAV载体,其中,所述IGF2靶向肽包含SEQ IDNO:5或包含SEQ ID NO:5中的至少一个氨基修饰,所述氨基修饰不影响与所述CI-MPR受体的结合、或减少其与一种或多种IGF结合蛋白(IGFBP,例如IGFBP1-6)的结合。
10.如段落1-9中任一段所述的重组AAV载体,其中,SEQ ID NO:5中的至少一个氨基修饰为V43M氨基酸修饰(SEQ ID NO:8或SEQ ID NO:9)或Δ2-7(SEQ ID NO:6)或Δ1-7(SEQ ID NO:7)。
11.如段落1-10中任一段所述的重组AAV载体,其中,所述肝特异性启动子为具有本文表4中或于2019年11月19日提交的临时申请62,937,556的表4A或表4B中列出的任一项序列的启动子,或其功能变体或其功能片段。
12.如段落1-10中任一段所述的重组AAV载体,其中,所述肝特异性启动子包含CRM_SP0412(SEQ ID NO:86)或SP0412(SEQ ID NO:91)或其具有SEQ ID NO:86或SEQ IDNO:91的至少60%活性的功能变体或功能片段。
13.如段落1-12中任一段所述的重组AAV载体,其中,所述肝特异性启动子选自以下的任一项:(i)SP0422(SEQ ID NO:92)或其具有SEQ ID NO:92的至少60%活性的功能变体或功能片段;(ii)CRM_SP0239(SEQ ID NO:87)或SP0239(SEQ ID NO:93)或SP0238-UTR(SEQ ID NO:147)或其具有SEQ ID NO:87、SEQ ID NO:93或SEQ ID NO:147的至少60%活性的功能变体或功能片段;(iii)CRM_SP0265(SP0131_A1)(SEQ ID NO:88)或SP0265(LVR_SP0131_A1)(SEQ ID NO:94)或SP0265-UTR(SEQ ID NO:146)或其具有SEQ ID NO:88、SEQID NO:94或SEQ ID NO:146的至少60%活性的功能变体或功能片段;(iv)CRM_SP0240(SEQID NO:89)或SP0240(SEQ ID NO:95)或SP0240-UTR(SEQ ID NO:148)或其具有SEQ ID NO:89、SEQ ID NO:95或SEQ ID NO:148的至少60%活性的功能变体或功能片段;(v)CRM_SP0246(SEQ ID NO:90)或SP0246(SEQ ID NO:96)或SP0246-UTR(SEQ ID NO:149)或其具有SEQ ID NO:90、SEQ ID NO:96或SEQ ID NO:149的至少60%活性的功能变体或功能片段。
14.如段落1-13中任一段所述的重组AAV载体,其中,所述核酸序列编码野生型GAA多肽或经修饰的GAA多肽。
15.如段落1-14中任一段所述的重组AAV载体,其中,编码所述GAA多肽的核酸序列为人GAA基因或人密码子优化的GAA基因(coGAA)或经修饰的GAA核酸序列。
16.如段落1-15中任一段所述的重组AAV载体,其中,编码所述GAA多肽的核酸序列经密码子优化以增强体内表达。
17.如段落1-16中任一段所述的重组AAV载体,其中,编码所述GAA多肽的核酸序列经密码子优化以减少CpG岛。
18.如段落1-17中任一段所述的重组AAV载体,其中,编码所述GAA多肽的核酸序列经密码子优化以降低固有免疫应答或减少CpG岛,或降低固有免疫应答并降低固有免疫应答。
19.如段落1-18中任一段所述的重组AAV载体,其中,所述核酸序列编码如下GAA多肽,所述GAA多肽包含选自SEQ ID NO:10的H201L、H199R或R233H中的至少1个、至少2个或至少所有3个氨基酸修饰。
20.如段落1-19中任一段所述的重组AAV载体,其中,经编码的多肽进一步包含间隔区,所述间隔区包含位于所述GAA多肽的氨基末端和所述IGF2靶向肽的C-末端的至少1个氨基酸的核苷酸序列。
21.如段落1-20中任一段所述的重组AAV载体,所述重组AAV载体进一步包含编码具有至少1个氨基酸的间隔区的核酸,所述核酸位于编码所述IGF2靶向肽的核酸和编码所述GAA多肽的核酸之间。
22.如段落1-21中任一段所述的重组AAV载体,所述重组AAV载体进一步包含位于编码所述GAA基因的核酸的3'端和所述3'ITR序列的5'端的至少1个polyA序列。
23.如段落1-22中任一段所述的重组AAV载体,其中,所述异源核酸序列进一步包含位于编码所述GAA多肽的核酸的3'端和所述3'ITR序列的5'端的胶原蛋白稳定性(CS)序列。
24.如段落1-23中任一段所述的重组AAV载体,所述重组AAV载体进一步包含位于编码所述GAA多肽的核酸与所述poly A序列之间的编码胶原蛋白稳定性(CS)序列的核酸。
25.如段落1-24中任一段所述的重组AAV载体,所述重组AAV载体进一步包含位于编码所述分泌信号肽的序列的5'端和所述启动子的3'端的内含子序列。
26.如段落1-25中任一段所述的重组AAV载体,其中,所述内含子序列包含MVM序列、SV40序列或HBB2序列,其中,所述MVM序列包含SEQ ID NO:13的核酸序列,或与SEQ IDNO:13具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的核酸序列,并且所述HBB2序列包含SEQ ID NO:14的核酸序列,或与SEQ ID NO:14具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的核酸序列。
27.如段落1-26中任一段所述的重组AAV载体,其中,所述ITR包含插入、缺失或置换。
28.如段落1-27中任一段所述的重组AAV载体,其中,所述ITR中的一个或多个CpG岛被去除。
29.如段落1-28中任一段所述的重组AAV载体,其中:
a.所述异源核酸序列编码分泌信号肽,所述分泌信号肽选自:
1.纤连蛋白信号肽(FN1)或其具有分泌信号活性的活性片段(例如,FN1信号肽具有SEQ ID NO:18-SEQ ID NO:21中的任一项的序列,或与SEQ ID NO:18-SEQ ID NO:21中的任一项具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的氨基酸序列),
2.AAT信号肽(例如,SEQ ID NO:17),或与SEQ ID NO:17的任一项具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的氨基酸序列;
3.hIGF2信号肽(例如,SEQ ID NO:22),或与SEQ ID NO:22的任一项具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的氨基酸序列;
4.IgGl前导肽(SEQ ID NO:177),或与SEQ ID NO:177的任一项具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的氨基酸序列;
5.wtIL2前导肽(SEQ ID NO:179),或与SEQ ID NO:179的任一项具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的氨基酸序列;
6.突变型IL2前导肽(SEQ ID NO:181),或与SEQ ID NO:181的任一项具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的氨基酸序列,以及
b.所述异源核酸序列编码如下GAA多肽,所述GAA多肽选自于由以下所组成的组中的任一项:SEQ ID NO:11、SEQ ID NO:72或SEQ ID NO:182或与SEQ ID NO:11、SEQ ID NO:72或SEQ ID NO:182具有至少60%、或70%、或80%、85%、或90%、或95%、或98%或99%序列同一性的核酸序列,以及任选地,所述核酸序列编码如下GAA多肽,所述GAA多肽具有选自SEQ ID NO:10的H201L、H199R或R233H中的至少1个、至少2个或至少所有3个氨基酸修饰。
30.如段落29所述的重组AAV载体,其中,所述异源核酸还编码选自以下中的任一项的IGF2靶向肽:SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:9,或与SEQ ID NO:5-SEQ ID NO:9具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的IGF2肽。
31.如段落1-30中任一段所述的重组AAV载体,其中,经编码的分泌信号肽为AAT信号肽或其具有分泌信号活性的活性片段(例如,AAT信号肽具有SEQ ID NO:17的序列或与SEQ ID NO:17具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的氨基酸序列),并且所述异源核酸序列编码选自以下中的任一项的IGF2靶向肽:SEQ IDNO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:9,或与SEQ ID NO:5-SEQ IDNO:9具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的IGF2肽。
32.如段落1-31中任一段所述的重组AAV载体,其中,所述IGF2靶向肽为SEQ IDNO:8或SEQ ID NO:9,或者与SEQ ID NO:8或SEQ ID NO:9具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的IGF2肽。
33.如段落1-32中任一段所述的重组AAV载体,其中,所述重组AAV载体选自以下中的任一项:嵌合AAV载体、单倍体AAV载体、杂合AAV载体、多倍体AAV载体、合理的单倍体载体、镶嵌AAV载体、经化学修饰的AAV载体或来自任意AAV血清型(例如国际申请WO2020/102645和WO2020/102667中公开的表1中列出的任意血清型)的AAV载体。
34.如段落1-33中任一段所述的重组AAV载体,其中,所述重组AAV载体包含选自于2019年11月19日提交的美国临时申请62,937,556的表1中或国际申请WO2020/102645和WO2020/102667中所列的那些所组成的组中的任一种AAV血清型的衣壳蛋白,或它们的任意组合。
35.如段落1-34中任一段所述的重组AAV载体,其中,所述AAV载体选自于由以下所组成的组中的血清型:AAV3载体、AAVXL32载体、AAVXL32.1载体、AAV8载体或包含至少一种AAV8衣壳蛋白的单倍体AAV8载体。
36.如段落1-35中任一段所述的重组AAV载体,其中,所述AAV3b血清型在衣壳蛋白中包含选自265D、549A、Q263Y中任意的一个或多个突变。
37.如段落1-36中任一段所述的重组AAV载体,其中,所述AAV3b血清型选自AAV3b265D、AAV3b265D549A、AAV3b549A或AAV3bQ263Y或AAV3bSASTG中的任一种。
38.一种重组腺相关病毒(AAV)载体,所述载体在其基因组中包含:
a.5'和3'AAV反向末端重复(ITR)序列;以及
b.位于5'和3'ITR之间的编码α-葡萄糖苷酶(GAA)多肽的异源核酸序列,其中,所述异源核酸可操作地连接至肝特异性启动子;并且
其中,所述重组AAV载体包含所述AAV8血清型或AAV3b血清型的衣壳蛋白。
39.如段落38所述的重组AAV载体,其中,所述GAA多肽进一步包含位于所述GAA多肽的N-末端的分泌信号肽。
40.如段落38-39所述的重组AAV载体,其中,所述编码GAA多肽的异源核酸序列进一步包含位于所述GAA多肽的N-末端或位于所述分泌信号肽和所述α-葡萄糖苷酶(GAA)多肽之间的IGF2靶向肽。
41.如段落38所述的重组AAV载体,其中,所述AAV基因组以5'至3'方向包含:5'ITR、肝特异性启动子序列、编码α-葡萄糖苷酶(GAA)多肽的核酸、poly A序列以及3'ITR。
42.如段落38所述的重组AAV载体,其中,所述AAV基因组以5'至3'方向包含:5'ITR、肝特异性启动子序列、编码分泌信号肽的核酸、编码α-葡萄糖苷酶(GAA)多肽的核酸、poly A序列以及3'ITR。
43.如段落38所述的重组AAV载体,其中,所述AAV基因组以5'至3'方向包含:5'ITR、肝特异性启动子序列、内含子序列、编码分泌信号肽的核酸、编码α-葡萄糖苷酶(GAA)多肽的核酸、poly A序列以及3'ITR。
44.如段落38所述的重组AAV载体,其中,所述AAV基因组以5'至3'方向包含:5'ITR、肝特异性启动子序列、内含子序列、编码分泌信号肽的核酸、编码IGF2靶向肽的核酸、编码α-葡萄糖苷酶(GAA)多肽的核酸、poly A序列以及3'ITR。
45.如段落38所述的重组AAV载体,其中,所述AAV基因组以5'至3'方向包含:5'ITR、肝特异性启动子序列、内含子序列、编码分泌信号肽的核酸、编码IGF2靶向肽的核酸、编码α-葡萄糖苷酶(GAA)多肽的核酸、3'ITR序列、poly A序列以及3'ITR。
46.如段落34-37中任一段所述的重组AAV载体,其中,所述分泌信号肽选自编码分泌信号肽的核酸,所述分泌信号肽可以选自:AAT信号肽(例如,SEQ ID NO:17)、纤连蛋白信号肽(FN1)(例如,SEQ ID NO:18-SEQ ID NO:21)、同源GAA信号肽(SEQ ID NO:175)、hIGF2信号肽(例如,SEQ ID NO:22)、IgG1前导肽(SEQ ID NO:177)、wtIL2前导肽(SEQ ID NO:179)、突变型IL2前导肽(SEQ ID NO:181)或它们的具有分泌信号活性的活性片段,例如编码与SEQ ID NO:17-SEQ ID NO:22、SEQ ID NO:175、SEQ ID NO:177、SEQ ID NO:179或SEQID NO:181具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的氨基酸序列的核酸。
47.如段落38-46中任一段所述的重组AAV载体,其中,所述IGF2靶向肽结合人阳离子非依赖甘露糖-6-磷酸受体(CI-MPR)或IGF2受体。
48.如段落38-47中任一段所述的重组AAV载体,其中,所述IGF2靶向肽包含SEQ IDNO:5或包含SEQ ID NO:5中的至少一个氨基修饰,所述氨基修饰不影响与IGF2受体的结合,或减少其与IGF结合蛋白IGFBP1-6的一种或多种的结合。
49.如段48所述的重组AAV载体,其中,SEQ ID NO:5中的至少一个氨基修饰为V43M氨基酸修饰(SEQ ID NO:8或SEQ ID NO:9)或Δ2-7(SEQ ID NO:6)或Δ1-7(SEQ ID NO:7)。
50.如段落38-49中任一段所述的重组AAV载体,其中,所述肝特异性启动子选自表4中或于2019年11月19日提交的临时申请62,937,556的表4A或表4B中列出的任一项序列,或其功能变体或其功能片段。
51.如段落38-50中任一段所述的重组AAV载体,其中,所述肝特异性启动子选自以下的任一项:CRM_SP0412(SEQ ID NO:86)或SP0412(SEQ ID NO:91)或其具有SEQ ID NO:86或SEQ ID NO:91的至少60%活性的功能变体或功能片段。
52.如段落38-50中任一段所述的重组AAV载体,其中,所述肝特异性启动子选自以下的任一项:(i)SP0422(SEQ ID NO:92)或其具有SEQ ID NO:92的至少60%活性的功能变体或功能片段;(ii)CRM_SP0239(SEQ ID NO:87)或SP0239(SEQ ID NO:93)或SP0238-UTR(SEQ ID NO:147)或其具有SEQ ID NO:87、SEQ ID NO:93或SEQ ID NO:147的至少60%活性的功能变体或功能片段;(iii)CRM_SP0265(SP0131_A1)(SEQ ID NO:88)或SP0265(LVR_SP0131_A1)(SEQ ID NO:94)或SP0265-UTR(SEQ ID NO:146)或其具有SEQ ID NO:88、SEQID NO:94或SEQ ID NO:146的至少60%活性的功能变体或功能片段;(iv)CRM_SP0240(SEQID NO:89)或SP0240(SEQ ID NO:95)或SP0240-UTR(SEQ ID NO:148)或其具有SEQ ID NO:89、SEQ ID NO:95或SEQ ID NO:148的至少60%活性的功能变体或功能片段;(v)CRM_SP0246(SEQ ID NO:90)或SP0246(SEQ ID NO:96)或SP0246-UTR(SEQ ID NO:149)或其具有SEQ ID NO:90、SEQ ID NO:96或SEQ ID NO:149的至少60%活性的功能变体或功能片段。
53.如段落38-52所述的重组AAV载体,其中,所述核酸序列编码野生型GAA多肽或经修饰的GAA多肽。
54.如段落38-53中任一段所述的重组AAV载体,其中,编码所述GAA多肽的核酸序列为人GAA基因或人密码子优化的GAA基因(coGAA)或经修饰的GAA核酸序列。
55.如段落38-54中任一段所述的重组AAV载体,其中,编码所述GAA多肽的核酸序列经密码子优化以增强体内表达。
56.如段落38-55中任一段所述的重组AAV载体,其中,编码所述GAA多肽的核酸序列经密码子优化以减少CpG岛。
57.如段落38-56中任一段所述的重组AAV载体,其中,编码所述GAA多肽的核酸序列经密码子优化以降低固有免疫应答、或减少CpG岛、或降低固有免疫应答并减少CpG岛。
58.如段落38-57中任一段所述的重组AAV载体,其中,编码所述GAA多肽的核酸序列编码包含选自SEQ ID NO:10的H201L、H199R或R233H中的至少1个、至少2个或至少所有3个氨基酸修饰的GAA多肽。
59.如段落38-58中任一段所述的重组AAV载体,其中,所述内含子序列选自MVM、HBB2或SV40内含子序列中的任一种,其中,所述MVM序列包含SEQ ID NO:13的核酸序列,或与SEQ ID NO:13具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的核酸序列,并且所述HBB2序列包含SEQ ID NO:14的核酸序列,或与SEQ ID NO:14具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的核酸序列。
60.如段落38-59中任一段所述的重组AAV载体,其中,所述ITR包含插入、缺失或置换。
61.如段落60所述的重组AAV载体,其中,所述ITR中的一个或多个CpG岛被去除。
62.如段落38-61中任一段所述的重组AAV载体,其中,所述3'ITR包含以下或由以下组成:SEQ ID NO:442或与SEQ ID NO:442至少80%相同(例如至少85%、90%、95%、96%、97%、98%、或99%、或99.5%相同)的核苷酸序列;并且所述5'ITR包含以下或由以下组成:SEQ ID NO:441或与SEQ ID NO:441至少80%相同(例如至少85%、90%、95%、96%、97%、98%、或99%、或99.5%相同)的核苷酸序列。
63.如段落38-61中任一段所述的重组AAV载体,其中,所述3'ITR包含以下或由以下组成:SEQ ID NO:165或与SEQ ID NO:165至少80%相同(例如至少85%、90%、95%、96%、97%、98%、或99%、或99.5%相同)的核苷酸序列;并且所述5'ITR包含以下或由以下组成:SEQ IDNO:161或与SEQ ID NO:161至少80%相同(例如至少85%、90%、95%、96%、97%、98%、或99%、或99.5%相同)的核苷酸序列。
64.如段落38-63中任一段所述的重组AAV载体,其中,所述分泌信号肽为纤连蛋白信号肽(FN1)或其具有分泌信号活性的活性片段(例如,FN1信号肽具有SEQ ID NO:18-SEQID NO:21中的任一项的序列,或与SEQ ID NO:18-SEQ ID NO:21具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的氨基酸序列),并且所述异源核酸序列编码选自以下任一项的IGF2靶向肽:SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ IDNO:8或SEQ ID NO:9,或与SEQ ID NO:5-SEQ ID NO:9具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的IGF2肽。
65.如段落38-64中任一段所述的重组AAV载体,其中,经编码的分泌信号肽为AAT信号肽或其具有分泌信号活性的活性片段(例如,AAT信号肽具有SEQ ID NO:17的序列或与SEQ ID NO:17具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的氨基酸序列),并且所述异源核酸序列编码选自以下任一项的IGF2靶向肽:SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:9,或与SEQ ID NO:5-SEQ ID NO:9具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的IGF2肽。
66.如段落38-65中任一段所述的重组AAV载体,其中,所述IGF2靶向肽为SEQ IDNO:8或SEQ ID NO:9,或与SEQ ID NO:8或SEQ ID NO:9具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的IGF2肽。
67.如段落38-66中任一段所述的重组AAV载体,其中,所述肝特异性启动子为CRM_SP0412(SEQ ID NO:86)或SP0412(SEQ ID NO:91),或其具有SEQ ID NO:86或SEQ ID NO:91的至少60%活性的功能变体或功能片段。
68.如段落38-66中任一段所述的重组AAV载体,其中,所述肝特异性启动子为SP0422(SEQ ID NO:92),或其具有SEQ ID NO:92的至少60%活性的功能变体或功能片段。
69.如段落38-66中任一段所述的重组AAV载体,其中,所述肝特异性启动子为CRM_SP0239(SEQ ID NO:87)或SP0239(SEQ ID NO:93)或SP0238-UTR(SEQ ID NO:147),或其具有SEQ ID NO:87、SEQ ID NO:93或SEQ ID NO:147的至少60%活性的功能变体或功能片段。
70.如段落38-66中任一段所述的重组AAV载体,其中,所述肝特异性启动子为CRM_SP0265(SP0131_A1)(SEQ ID NO:88)或SP0265(LVR_SP0131_A1)(SEQ ID NO:94)或SP0265-UTR(SEQ ID NO:146),或其具有SEQ ID NO:88、SEQ ID NO:94或SEQ ID NO:146的至少60%活性的功能变体或功能片段。
71.如段落38-66中任一段所述的重组AAV载体,其中,所述肝特异性启动子为CRM_SP0240(SEQ ID NO:89)或SP0240(SEQ ID NO:95)或SP0240-UTR(SEQ ID NO:148),或其具有SEQ ID NO:89、SEQ ID NO:95或SEQ ID NO:148的至少60%活性的功能变体或功能片段。
72.如段落38-66中任一段所述的重组AAV载体,其中,所述肝特异性启动子为CRM_SP0246(SEQ ID NO:90)或SP0246(SEQ ID NO:96)或SP0246-UTR(SEQ ID NO:149),或其具有SEQ ID NO:90、SEQ ID NO:96或SEQ ID NO:149的至少60%活性的功能变体或功能片段。
73.一种药物组合物,所述药物组合物包含处于药学上可接受的运载体中的前述段落中任一段的所述重组AAV载体。
74.一种核酸序列,所述核酸序列包含:
可操作地连接至异源核酸序列的肝特异性启动子,所述异源核酸序列编码GAA多肽,其中,所述肝特异性启动子选自表4中或于2019年11月19日提交的美国临时申请62,937,556的表4A或表4B中公开的任一种序列、或其功能变体或功能片段。
75.如段落74所述的核酸序列,其中,所述异源核酸序列按以下顺序包含:编码分泌信号肽的核酸以及编码GAA多肽的核酸。
76.如段落74所述的核酸序列,其中,所述异源核酸序列按以下顺序包含:编码分泌信号肽的核酸、编码IGF2靶向肽的核酸以及编码GAA多肽的核酸。
77.一种重组腺相关病毒(rAAV)载体基因组的核酸序列,所述核酸序列包含:
a.5'和3'AAV反向末端重复(ITR)序列;以及
b.位于5'和3'ITR之间的编码包含α-葡萄糖苷酶(GAA)多肽的多肽的异源核酸序列,其中,所述异源核酸可操作地连接至肝特异性启动子,其中,所述肝特异性启动子选自表4中或于2019年11月19日提交的美国临时申请62,937,556的表4A、或表4B中公开的任一种序列、或其功能变体或功能片段。
78.如段落75所述的核酸序列,其中,所述核酸序列编码包含分泌信号和α-葡萄糖苷酶(GAA)多肽的融合多肽。
79.如段落75所述的核酸序列,其中,所述核酸序列编码包含分泌信号、IGF2靶向肽和α-葡萄糖苷酶(GAA)多肽的融合多肽。
80.一种核酸序列,所述核酸序列包括:
可操作地连接至异源核酸序列的肝特异性启动子,所述异源核酸序列包含编码GAA多肽的核酸,其中,所述肝特异性启动子选自以下中的任一种:
i.CRM_SP0412(SEQ ID NO:86)或SP0412(SEQ ID NO:91)或其具有SEQ ID NO:86或SEQ ID NO:91的至少60%活性的功能变体或功能片段;
ii.SP0422(SEQ ID NO:92)或其具有SEQ ID NO:92的至少60%活性的功能变体或功能片段;
iii.CRM_SP0239(SEQ ID NO:87)或SP0239(SEQ ID NO:93)或SP0238-UTR(SEQ IDNO:147)或其具有SEQ ID NO:87、SEQ ID NO:93或SEQ ID NO:147的至少60%活性的功能变体或功能片段;
iv.CRM_SP0265(SP0131_A1)(SEQ ID NO:88)或SP0265(LVR_SP0131_A1)(SEQ IDNO:94)或SP0265-UTR(SEQ ID NO:146)或其具有SEQ ID NO:88、SEQ ID NO:94或SEQ IDNO:146的至少60%活性的功能变体或功能片段;
v.CRM_SP0240(SEQ ID NO:89)或SP0240(SEQ ID NO:95)或SP0240-UTR(SEQ IDNO:148)或其具有SEQ ID NO:89、SEQ ID NO:95或SEQ ID NO:148的至少60%活性的功能变体或功能片段;或
vi.CRM_SP0246(SEQ ID NO:90)或SP0246(SEQ ID NO:96)或SP0246-UTR(SEQ IDNO:149)或其具有SEQ ID NO:90、SEQ ID NO:96或SEQ ID NO:149的至少60%活性的功能变体或功能片段。
81.如段落80所述的核酸序列,其中,所述异源核酸序列按以下顺序包含:编码分泌信号的核酸以及编码α-葡萄糖苷酶(GAA)多肽的核酸。
82.如段落75所述的核酸序列,其中,所述异源核酸序列按以下顺序包含:编码分泌信号的核酸、编码IGF2靶向肽的核酸序列以及编码α-葡萄糖苷酶(GAA)多肽的核酸。
83.一种重组腺相关病毒(rAAV)载体基因组的核酸序列,所述核酸序列包含:(a)5'和3'AAV反向末端重复序列(ITR)的核酸序列,以及(b)位于5'和3’ITR序列之间的编码α-葡萄糖苷酶(GAA)多肽的、或编码包含分泌信号肽和α-葡萄糖苷酶(GAA)多肽的融合多肽的异源核酸序列,其中,所述异源核酸可操作地连接至肝特异性启动子,其中,所述肝特异性启动子选自以下中的任一种:
i.CRM_SP0412(SEQ ID NO:86)或SP0412(SEQ ID NO:91)或其具有SEQ ID NO:86或SEQ ID NO:91的至少60%活性的功能变体或功能片段;
ii.SP0422(SEQ ID NO:92)或其具有SEQ ID NO:92的至少60%活性的功能变体或功能片段;
iii.CRM_SP0239(SEQ ID NO:87)或SP0239(SEQ ID NO:93)或SP0238-UTR(SEQ IDNO:147)或其具有SEQ ID NO:87、SEQ ID NO:93或SEQ ID NO:147的至少60%活性的功能变体或功能片段;
iv.CRM_SP0265(SP0131_A1)(SEQ ID NO:88)或SP0265(LVR_SP0131_A1)(SEQ IDNO:94)或SP0265-UTR(SEQ ID NO:146)或其具有SEQ ID NO:88、SEQ ID NO:94或SEQ IDNO:146的至少60%活性的功能变体或功能片段;
v.CRM_SP0240(SEQ ID NO:89)或SP0240(SEQ ID NO:95)或SP0240-UTR(SEQ IDNO:148)或其具有SEQ ID NO:89、SEQ ID NO:95或SEQ ID NO:148的至少60%活性的功能变体或功能片段;
vi.CRM_SP0246(SEQ ID NO:90)或SP0246(SEQ ID NO:96)或SP0246-UTR(SEQ IDNO:149)或其具有SEQ ID NO:90、SEQ ID NO:96或SEQ ID NO:149的至少60%活性的功能变体或功能片段。
84.如段落74-83中任一段所述的核酸序列,其中,所述异源核酸序列编码所述GAA多肽或所述融合多肽,所述融合多肽进一步包含位于所述分泌信号肽和所述α-葡萄糖苷酶(GAA)多肽之间的IGF2靶向肽。
85.如段落74-84中任一段所述的核酸序列,其中,编码所述分泌信号的核酸选自以下中的任一项:SEQ ID NO:17、SEQ ID NO:22-SEQ ID NO:26、SEQ ID NO:175、SEQ IDNO:177、SEQ ID NO:179或SEQ ID NO:181,或与SEQ ID NO:17、或SEQ ID NO:22-SEQ IDNO:26、或SEQ ID NO:175、SEQ ID NO:177、SEQ ID NO:179或SEQ ID NO:181中的任一项具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的核酸序列。
86.如段落74-85中任一段所述的核酸序列,其中,编码所述IGF2靶向肽的核酸选自以下中的任一项:SEQ ID NO:2(IGF2-Δ2-7)、SEQ ID NO:3(IGF2-Δ1-7)、或SEQ ID NO:4(IGF2V43M),或与SEQ ID NO:2、SEQ ID NO:3或SEQ ID NO:4中的任一项具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的核酸序列。
87.如段落74-86中任一段所述的核酸序列,其中,编码所述GAA多肽的核酸序列为人GAA基因或人密码子优化的GAA基因(CoGAA)或经修饰的GAA核酸序列。
88.如段落74-87中任一段所述的核酸序列,其中,编码所述GAA多肽的核酸序列经密码子优化以增强体内表达。
89.如段落74-88中任一段所述的核酸序列,其中,编码所述GAA多肽的核酸序列经密码子优化以减少CpG岛。
90.如段落74-89中任一段所述的核酸序列,其中,编码所述GAA多肽的核酸序列经密码子优化以降低固有免疫应答、或减少CpG岛,或降低固有免疫应答并减少CpG岛。
91.如段落74-90中任一段所述的核酸序列,其中,编码所述GAA多肽的核酸序列编码包含SEQ ID NO:10的H201L修饰的GAA多肽。
92.如段落74-91中任一段所述的核酸序列,其中,编码所述GAA多肽的核酸选自以下中的任一项:SEQ ID NO:11(全长hGAA)、SEQ ID NO:55(Dwight cDNA)、SEQ ID NO:56(hGAAΔ1-66),或与SEQ ID NO:11、SEQ ID NO:55或SEQ ID NO:56中的任一项具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的核酸序列。
93.如段落74-92所述的核酸序列,其中,编码所述GAA多肽的核酸选自以下中的任一项:SEQ ID NO:74(密码子优化的1)、SEQ ID NO:75(密码子优化的2)和SEQ ID NO:76(密码子优化的3),或与SEQ ID NO:74、SEQ ID NO:75或SEQ ID NO:76中的任一项具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的核酸序列。
94.如段落74-93所述的核酸序列,其中,所述核酸选自以下中的任一项:SEQ IDNO:57(AAT-V43M-wtGAA(delta 1-69aa))、SEQ ID NO:58(ratFN1-IGF2V43M-wtGAA(delta1-69aa))、SEQ ID NO:59(hFN1-IGF2V43M-wtGAA(delta 1-69aa))、SEQ ID NO:60(AAT-IGF2Δ2-7-wtGAA(delta 1-69))、SEQ ID NO:61(FN1rat-IGFΔ2-7-wtGAA(delta 1-69))、SEQ ID NO:62(hFN1-IGFΔ2-7-wtGAA(delta 1-69))、SEQ ID NO:79(AAT_hIGF2-V43M_wtGAA_del1-69_Stuffer.V02)、SEQ ID NO:80(FIBRat_hIGF2-V43M_wtGAA_del1-69_Stuffer.V02)、SEQ ID NO:81(FIBhum_hIGF2-V43M_wtGAA_del1-69_Stuffer.V02)、SEQ IDNO:82(AAT_GILT_wtGAA_del1-69__Stuffer.V02)、SEQ ID NO:83(FIBrat_GILT_wtGAA_del1-69_Stuffer.V02)、SEQ ID NO:84(FIBhum_GILT_wtGAA_del1-69_Stuffer.V02),或与SEQ ID NO:57、SEQ ID NO:58、SEQ ID NO:59、SEQ ID NO:60、SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:79、SEQ ID NO:80、SEQ ID NO:81、SEQ ID NO:82、SEQ ID NO:83或SEQ IDNO:84具有至少80%、85%、90%、95%或98%同一性的核酸序列。
95.一种治疗患有糖原贮积病II型(GSD II、庞贝氏病、酸性麦芽糖酶缺乏症)或具有α-葡萄糖苷酶(GAA)多肽缺乏的受试者的方法,所述方法包括向所述受试者给予前述段落1-95中任一段的所述重组AAV载体、或rAAV基因组、或核酸序列中的任一种。
96.如段落95所述的方法,其中,所述GAA多肽从所述受试者的肝脏中分泌,并且分泌的GAA被骨骼肌组织、心肌组织、膈肌组织或它们的组合摄取,其中,所述分泌的GAA的摄取引起组织中溶酶体糖原贮积的减少。
97.如段落95-96中任一段所述的方法,其中,向所述受试者进行的给予选自肌内给予、皮下给予、椎管内给予、脑池内给予、鞘内给予、静脉内给予中的任一种。
98.如段落95-97中任一段所述的方法,其中,所述重组AAV载体为嵌合AAV载体、单倍体AAV载体、杂合AAV载体或多倍体AAV载体。
99.如段落95-97中任一段所述的方法,其中,所述重组AAV载体为合理的单倍体载体、镶嵌AAV载体、经化学修饰的AAV载体或来自任意AAV血清型的AAV载体。
100.如段落95-97中任一段所述的方法,其中,所述重组AAV载体为AAVXL32载体或AAVXL32.1载体或AAV8载体、或包含至少一种AAV8衣壳蛋白的单倍体AAV8载体。
101.如段落100所述的方法,其中,所述重组AAV载体为AAV8载体。
102.一种治疗患有溶酶体贮积病(LSD)的受试者的方法,所述方法包括向所述受试者给予前述段落中任一段所述的所述重组AAV载体、或rAAV基因组、或核酸序列中的任一种,其中,所述AAV载体表达选自表5B或表6B中的任意多肽的多肽。
103.如段落102所述的方法,其中,所述溶酶体贮积病(LSD)选自表5A或表6A中所列的任一种。
104.如段落102所述的方法,其中,所述重组AAV载体为嵌合AAV载体、单倍体AAV载体、杂合AAV载体或多倍体AAV载体。
105.如段落102所述的方法,其中,所述重组AAV载体为合理的单倍体载体、镶嵌AAV载体、经化学修饰的AAV载体或来自任意AAV血清型的AAV载体。
106.如段落102所述的方法,其中,所述重组AAV载体为AAVXL32载体或AAVXL32.1载体或AAV8载体、或包含至少一种AAV8衣壳蛋白的单倍体AAV8载体。
107.包含如段落74-94中任一段所述的核酸序列的细胞。
108.如段落107所述的细胞,其中,所述细胞为人的细胞。
109.如段落107-108中任一段所述的细胞,其中,所述细胞为非人细胞的哺乳动物细胞。
110.如段落107-109中任一段所述的细胞,其中,所述细胞为昆虫细胞。
111.包含如段落1-72中任一段所述的重组AAV载体的细胞。
112.包含如段落1-72中任一段所述的重组AAV载体的宿主动物。
113.如段落112所述的宿主动物,其中,所述宿主动物为哺乳动物。
114.如段落112或113所述的宿主动物,其中,所述宿主动物为非人的哺乳动物。
115.如段落113所述的宿主动物,其中,所述宿主动物为人。
116.用于如段落95-101中任一段所述的方法中的段落73所述的药物组合物。
117.包含如段落107-111中任一段所述的细胞的宿主动物。
118.包含如段落1-72中任一段所述的重组AAV载体的宿主动物。
119.如段落118所述的宿主动物,其中,所述宿主动物为哺乳动物。
120.如段落118-119所述的宿主动物,其中,所述宿主动物为非人的哺乳动物。
121.如段落119所述的宿主动物,其中,所述宿主动物为人。
实施例
仅出于说明性目的提供以下非限制性实施例,以有利于对现在所考虑的代表性实施方式的更完善理解。这些实施例仅意在作为可以利用AAV病毒体和rAAV载体的所有可能情况的子集。因此,这些实施例不应被解释为限制本申请文件中描述的任何实施方式,包括与AAV病毒体和rAAV载体和/或其方法和用途有关的实施方式。最后,AAV病毒体和载体几乎可以在期望基因递送的任何情况下使用。
实施例1:rAAV基因组的构建
使用Gibson克隆方法构建了大量的rAAV基因组。产生了以下的rAAV基因组:AAV_LVR412_EU(SEQ ID NO:154)、ssAAV_LVR412WT-hGAA_AskBio_CHATHAM(SEQ ID NO:155)、AAV-LVR412Stuffer(SEQ ID NO:156)、AAV_LVR422_EU(SEQ ID NO:157)、AAV-LVR422_Stuffer(SEQ ID NO:158)、ssAAV_LVR412_WT-hGAA CHATHAM(SEQ ID NO:159)、ssAAV_LSP_WT-hGAA-CHATHAM(SEQ ID NO:160)、SEQ ID NO:57(AAT-V43M-wtGAA(delta1-69aa))、SEQID NO:58(ratFN1-IGF2V43M-wtGAA(delta1-69aa))、SEQ ID NO:59(hFN1-IGF2V43M-wtGAA(delta1-69aa))、SEQ ID NO:60(AAT-IGF2Δ2-7-wtGAA(delta 1-69))、SEQ ID NO:61(FN1rat-IGFΔ2-7-wtGAA(delta 1-69))、SEQ ID NO:62(hFN1-IGFΔ2-7-wtGAA(delta 1-69))。虽然一些rAAV载体包含编码wtGAA多肽的核酸序列,但人们可以容易地用编码本文公开的经修饰的GAA核酸序列的核酸序列来替换wtGAA。
Gibson克隆涉及将核酸序列的区块(例如3个区块)克隆在一起。通用方案如下:将以下试剂合并到单管反应中:(i)Gibson Assembly Master Mix(核酸外切酶、DNA聚合酶、DNA连接酶、缓冲液);(ii)具有15-25bp的同源末端的DNA插入物(区块1-区块3)(参见图6);(iii)线性化的DNA骨架,其具有最外侧DNA插入物的15-25bp同源末端(参见图6)。反应在50℃下孵育15-60分钟。将反应混合物转化入感受态细胞,并铺板在卡那霉素琼脂板上。通过限制性消化和/或菌落PCR分析筛选完全组装的质粒DNA的少量制备物(miniprep),并通过DNA测序分析进行验证。对经验证的克隆进行扩增以用于大量制备物(maxiprep)的产生,并在rAAV生产细胞系中与腺病毒辅助因子XX680Kan和合适的Rep/Cap辅助因子一起瞬时转染,以产生rAAV。图6示出了用于生成示例性rAAV基因组的克隆核酸区块。
虽然图7-图9将wtGAA(Δ1-69)作为示例性的GAA酶示出,但是该核酸序列可以被技术人员容易地替换为经密码子优化的编码GAA的核酸序列,以增强体内表达、和/或减轻免疫应答、和/或减少CpG岛、和/或具有H201L修饰。因此,虽然图9A-图9E示出了具有野生型GAA(wtGAA)的示例性构建体,但人们可以容易地将编码wtGAA的核酸替换为编码本文公开的经修饰的GAA核酸序列的核酸序列(例如SEQ ID NO:182)。在图7-图8中举例说明的克隆区块中还示出了具有3个氨基酸(3aa)的间隔区核酸序列和填充区核酸序列(在图7-图8中称为“间隔区”序列)的rAAV基因组的生成,所述间隔区核酸序列位于编码IGF2(V43M)或IGF2Δ2-7靶向肽的核酸序列的3'端和编码GAA酶的核酸的5'端,所述填充区核酸序列位于polyA序列的3'端和3'ITR序列的5'端。
实施例2:rAAV载体的生成
使用rAAV生产细胞系将rAAV基因组包装入衣壳中,以生成rAAV载体。仅为证明rAAV载体构建的原理,所使用的衣壳是AAV3b衣壳。
在rAAV生产细胞系中制备rAAV:使用三重转染技术在悬浮的rAAV生产细胞系中制备rAAV,这可以扩大规模以制备临床级载体。或者,可以使用不同的质粒,例如,1)pXX680-ad辅助因子,以及2)pXR3、Rep和Cap,以及3)转基因质粒(ITR-转基因-ITR)。
根据美国专利9,441,206(以引用的方式将其整体并入本文)中描述的方法,使用rAAV生产细胞系将实施例1中生成的rAAV基因组用于生成rAAV载体。具体而言,rAAV载体或rAAV病毒体使用以下方法产生,所述方法包括:(a)向rAAV生产细胞系提供AAV表达系统;(b)在产生AAV颗粒的条件下培养细胞;以及(c)任选地分离AAV颗粒。可以用不同质粒比率的XX680、AAV rep/cap辅助因子和TR质粒来优化转染混合物体积和质粒的三重转染比率,以确定用于产生rAAV载体的最佳质粒比率。
在一些情况下,细胞在产生AAV颗粒的条件下悬浮培养。在另一实施方式中,在无动物成分的条件下培养细胞。无动物成分培养基可以是与rAAV生产细胞系相容的任何无动物成分培养基(例如,无血清培养基)。实例包括但不限于SFM4Transfx-293(Hyclone)、Ex-Cell 293(JRH Biosciences)、LC-SFM(Invitrogen)和Pro293-S(Lonza)。足以复制和包装AAV颗粒的条件可以是,例如,存在足以复制本文所述的rAAV基因组并包装入AAV衣壳中的AAV序列(例如,AAV rep序列和AAV cap序列)和来自腺病毒和/或疱疹病毒的辅助序列。
来自质粒骨架的细菌DNA序列可以在重组AAV载体的制备期间被包装到AAV衣壳中,从而通过其与TLR9的相互作用激活固有免疫系统(Akira,2006;Chadeuf,2005;Wright,2014)。可以使用多种技术来消除重组AAV制备物中的质粒骨架序列,例如具有有限可扩展性的小环(minicircle)(Schnodt,2016)。避免质粒骨架中的细菌DNA序列的另一方法是使用封闭末端线性双链DNA(其包括一系列DNA复制技术),包括但不限于专门用于制备重组AAV载体的doggy bone DNA(dbDNATM)。使用封闭末端的线性双链DNA(例如dbDNATM)消除了细菌骨架,并已被用于生产疫苗和慢病毒(Walters等,2014;Scott等,2015;Karda等,2019)并且被示出不能由DNA疫苗开发者触发TLR9应答。
因此,在替代实施方式中,用于本文公开的方法和组合物中的rAAV载体的生成可以使用封闭末端的线性双链DNA来进行,包括但不限于如美国申请2018/0037943和Karbowniczek等,Bioinsights,2017(通过引用的方式将其整体并入本文)中公开的Doggybone技术(dbDNATM)。简而言之,使用封闭末端线性双链DNA技术的用于AAV生产的质粒可包含ITR、启动子和感兴趣的基因(例如本文公开的GAA,其侧接有56bp的回文原端粒酶(protelomerase)识别序列)。对质粒进行变性,并且在Phi29 DNA聚合酶和恰当的引物存在下,Phi29启动滚环扩增(RCA),创建了原始构建体的双链cancatameric重复。当加入原端粒酶时,回文原端粒酶识别序列发生结合,并发生切割-接合反应,使得产生了单体双链(ds)线性共价封闭的DNA构建体。添加常见的限制性内切酶去除非期望的DNA质粒骨架序列并用外切核酸酶活性消化,使得产生dbDNA,可对其进行大小分级以分离编码ITR、启动子和感兴趣基因的dbDNA序列。使用封闭末端的线性双链DNA(例如dbDNATM技术)的用于产生rAAV载体的示例性质粒以如下的5'至3'的方向包含:5'-原端粒酶RS、5’ITR、LSP启动子、hGAA、3'UTR、hGH poly(A)、3’ITR、3'-原端粒酶RS(有义链),其中有义链连接至互补的反义链以形成链(ds)线性共价封闭的DNA构建体。使用封闭末端的线性双链DNA(例如doggy bone DNA(dbDNATM))作为用于制备用于本文公开的方法和组合物中的AAV载体的起始材料,消除了用于扩增包含AAV载体的质粒的细菌骨架,产物无法触发Toll样受体9(TLR9)的应答。使用封闭末端的线性双链DNA技术进行制备进一步降低了在患有庞贝氏病的患者中以1.6E13vg/kg剂量下观察到的肝酶升高的风险。
实施例3:评估rAAV载体
全血清除。图1示出了源自如下实验的结果,在所述实验中,将3×1012vg/kg的不同的AAV血清型(AAV3b、AAV3ST、AAV8、AAV9)静脉内注射到3kg的血清阴性雄性猕猴中。在给予不同的AAV血清型后60天对猕猴实施安乐死。在全血中查找载体基因组,并且结果表明AAV3b在一周内被清除并且在处死时检测不到,而当猕猴被处死时,在全血中仍可检测到AAV8和AAV9。
肝特异性载体效力:图2示出了源自如下实验的结果,在所述实验中,将3×1012vg/kg的不同的AAV血清型(AAV3b、AAV3ST、AAV8、AAV9)静脉内注射到3kg血清阴性的雄性猕猴中。在给予不同的AAV血清型后60天对猕猴实施安乐死。对每只猕猴的肝脏的三个叶中的每个叶的载体基因组进行量化。定量的限值为0.002vg/dg。根据图2中示出的结果,发现AAV3b是有效的肝脏载体。AAV3b比AAV8更具肝特异性,并且比AAV9更快地从血液中清除。AAV3ST突变没有提供任何显著的有益影响。
实施例4:测量GAA向上清液中的分泌和GAA摄取测定
测量上清液中的GAA。
因此,对实施例1生成的rAAV基因组关于GAA多肽向上清液中的分泌进行测试。如Kikuchi等中所述,可以使用4-甲基-伞形酮基-α-D-葡萄糖苷(4-MU)底物(4-MU测定法)评估上清液中的GAA的测量(Kikuchi,Tateki等,“Clinical and metabolic correction ofPompe disease by enzyme therapy in acid maltase-deficient quail.”The Journalof clinical investigation 101.4(1998):827-833)。
简而言之,rAAV生产细胞系可以用如下rAAV基因组进行转染:AAV_LVR412_EU(SEQID NO:154)、ssAAV_LVR412WT-hGAA_AskBio_CHATHAM(SEQ ID NO:155)、AAV-LVR412Stuffer(SEQ ID NO:156)、AAV_LVR422_EU(SEQ ID NO:157)、AAV-LVR422_Stuffer(SEQ ID NO:158)、ssAAV_LVR412_WT-hGAA CHATHAM(SEQ ID NO:159)、ssAAV_LSP_WT-hGAA-CHATHAM(SEQ ID NO:160)、SEQ ID NO:57(AAT-V43M-wtGAA(delta 1-69aa))、SEQ IDNO:58(ratFN1-IGF2V43M-wtGAA(delta 1-69aa))、SEQ ID NO:59(hFN1-IGF2V43M-wtGAA(delta 1-69aa))、SEQ ID NO:60(AAT-IGF2Δ2-7-wtGAA(delta 1-69))、SEQ ID NO:61(FN1rat-IGFΔ2-7-wtGAA(delta 1-69))、SEQ ID NO:62(hFN1-IGFΔ2-7-wtGAA(delta 1-69))。GAA活性基于24小时内的初始活性(t=0)的%来测量。基于荧光底物4-MU-α-葡萄糖在0、3、6和24小时的水解,对样品测定GAA酶活性。将GAA活性表示为初始活性的%,即残留活性。
或者,在收取后,通过HIC色谱法部分地纯化培养物上清液。将所有样品在电泳前都用PNGase处理。可以使用SDS-PAGE和免疫印迹法评估细胞的GAA多肽表达。
GAA摄取测定和测量组织中的GAA的摄取。
接下来,对实施例1和2中生成的rAAV基因组测试向细胞中的摄取活性的保留。例如,rAAV生产细胞系可以用如下rAAV基因组进行转染:AAV_LVR412_EU(SEQ ID NO:154)、ssAAV_LVR412WT-hGAA_AskBio_CHATHAM(SEQ ID NO:155)、AAV-LVR412Stuffer(SEQ IDNO:156)、AAV_LVR422_EU(SEQ ID NO:157)、AAV-LVR422_Stuffer(SEQ ID NO:158)、ssAAV_LVR412_WT-hGAA CHATHAM(SEQ ID NO:159)、ssAAV_LSP_WT-hGAA-CHATHAM(SEQ ID NO:160)、SEQ ID NO:57(AAT-V43M-wtGAA(delta 1-69aa))、SEQ ID NO:58(ratFN1-IGF2V43M-wtGAA(delta 1-69aa))、SEQ ID NO:59(hFN1-IGF2V43M-wtGAA(delta 1-69aa))、SEQ IDNO:60(AAT-IGF2Δ2-7-wtGAA(delta 1-69))、SEQ ID NO:61(FN1rat-IGFΔ2-7-wtGAA(delta 1-69))、SEQ ID NO:62(hFN1-IGFΔ2-7-wtGAA(delta 1-69))。
如美国专利申请US2009/0117091A1(以引用的方式将其整体并入本文)所述,4-MU测定法(如上所述)可用于评估rhGAA向哺乳动物细胞中的摄取。将实施例1和2中生成的rAAV载体或rAAV基因组在含有123mM乙酸钠(pH 4.0)和10mM 4-甲基伞形酮基α-D-葡萄糖苷酶底物(Sigma,目录号#M-9766)的20μL反应混合物中孵育。反应在37℃下孵育1小时,并用200μL缓冲液终止,该缓冲液含有267mM碳酸钠、427mM甘氨酸,pH 10.7。在96孔微量滴定板中用355nm激发和460nm过滤器测量荧光,并与源自4-甲基伞形酮(Sigma,目录号#M1381)的标准曲线进行比较。将1个GAA 4MU单位定义为每小时水解1nmol 4-甲基伞形酮。评估了示例性的rAAV基因组在成纤维细胞中的比活力,例如,AAV_LVR412_EU(SEQ ID NO:154)、ssAAV_LVR412WT-hGAA_AskBio_CHATHAM(SEQ ID NO:155)、AAV-LVR412Stuffer(SEQ IDNO:156)、AAV_LVR422_EU(SEQ ID NO:157)、AAV-LVR422_Stuffer(SEQ ID NO:158)、ssAAV_LVR412_WT-hGAA CHATHAM(SEQ ID NO:159)、ssAAV_LSP_WT-hGAA-CHATHAM(SEQ ID NO:160)、SEQ ID NO:57(AAT-V43M-wtGAA(delta 1-69aa))、SEQ ID NO:58(ratFN1-IGF2V43M-wtGAA(delta 1-69aa))、SEQ ID NO:59(hFN1-IGF2V43M-wtGAA(delta 1-69aa))、SEQ IDNO:60(AAT-IGF2Δ2-7-wtGAA(delta 1-69))、SEQ ID NO:61(FN1rat-IGFΔ2-7-wtGAA(delta 1-69))、SEQ ID NO:62(hFN1-IGFΔ2-7-wtGAA(delta 1-69))。评估IGF2-GAA融合多肽和/或SS-IGF2-GAA双融合多肽的酶活性并将其与GAA(wtGAA)多肽本身(即,没有异源信号肽或IGF2靶向肽)进行比较。
还可以进行基于细胞的摄取测定来示出加上IGF2标签的或未加标签的GAA进入靶细胞的能力。在摄取前24小时,将大鼠L6成肌细胞以每孔1×105个细胞的密度铺板在24孔板中。在实验开始时,从细胞中去除培养基并用含有实施例1和实施例2中生成的rAAV载体的0.5mL摄取培养基替换。为了示出摄取的特异性,一些孔中额外含有竞争物M6P(终浓度5mM)和/或IGF2(终浓度18μg/mL)。18小时后,从细胞中吸出培养基,并用PBS洗涤细胞4次。然后用200μL CelLytic MTM裂解缓冲液裂解细胞。使用4MU底物如上所述地对裂解物测定GAA活性。使用Pierce BCATM蛋白质测定试剂盒确定蛋白质。
尽管可以使用其它细胞系和成肌细胞系,典型的摄取实验是在CHO细胞中进行。预期GAA多肽向大鼠L6成肌细胞中的摄取将实际上不会受到添加大量摩尔过量的M6P的影响,而预期摄取会被过量的IGF2显著破坏。相比之下,预期wtGAA的摄取将通过添加过量的M6P而被显著破坏,但实际上不受与IGF2的竞争的影响。另外,预期IGF2V43M-wtGAA和IGFdelta2-7wtGAA的摄取将不会受到过量IGF2的显著影响。
实施例5:GAA在大鼠L6成肌细胞中的半衰期
用实施例1和实施例2中产生的rAAV载体在L6大鼠成肌细胞中进行如上所述(参见实施例3和实施例4)的摄取实验。18小时后,将来自转染有rAAV载体的细胞的培养基吸出,并用PBS洗涤细胞4次。此时,裂解二重复的孔(时间0)并将裂解物冷冻在-80℃下。此后每天裂解二重复的孔并储存用于分析。14天后,对所有裂解物测定GAA活性,以评估半衰期以及评估加上IGF2标签的GAA酶一旦处于细胞内是否持续存在与未加标签的GAA相似的动力学。
实施例6:摄取后GAA的加工
如Moreland等,(2005)J.Biol.Chem.,280:6780-6791和其中包含的参考文献所述,哺乳动物GAA通常在溶酶体中经历序贯的蛋白水解加工。经加工的蛋白质产生70kDa、20kDa、10kDa的一组的肽和一些较小的肽。为了确定IGF2-GAA融合多肽和/或SS-IGF2-GAA双融合多肽是否与未加标签的GAA类似地被加工,使用识别70kDa的IGF2肽和带有IGF2标签的较大中间体的单克隆抗体,通过蛋白免疫印迹分析来自上述摄取实验的裂解物的等分试样。该实验中鉴别的多肽的相似性质(profile)表明,一旦进入细胞,IGF2靶向肽就会丢失,并且IGF2-GAA多肽与未加标签的GAA相似地进行加工,这表明一旦IGF2靶向肽处于细胞内,它对GAA的行为几乎没有或没有影响。
实施例7:药物代谢动力学
可在129只野生型小鼠中测量由rAAV载体产生的IGF2-GAA融合多肽和/或SS-IGF2-GAA双融合多肽的药物代谢动力学。向129只小鼠注射实施例1和实施例2中生成的rAAV载体。在注射前以及注射后15min、30min、45min、60min、90min、120min、4小时和8小时采集血清样品。然后处死动物。通过定量蛋白质免疫印迹对血清样品进行测定。评估来自表达IGF2-GAA融合多肽或SS-IGF2-GAA双融合多肽的rAAV载体的GAA的半衰期,以确定融合IGF2的GAA多肽是否从循环中被过快地清除。
实施例8:GAA的组织半衰期
该实验的目的是确定从rAAV载体表达的IGF2-GAA融合多肽或SS-IGF2-GAA双融合多肽一旦到达其靶组织,GAA活性丧失的速率。在庞贝氏病小鼠模型中,
Figure BDA0003751229800001831
看起来在各种肌肉组织中具有约6-7天的组织半衰期(药物评价与研究中心和生物制剂评价与研究中心,药理学评价,申请号125141/0)。
用实施例1和实施例2中生成的rAAV载体注射到庞贝氏病小鼠(如Raben(1998)JBC,273:19086-19092所述的庞贝氏病小鼠模型6neo/6neo,以引用的方式将其公开内容并入本文)的颈静脉中。然后在注射后1天、5天、10天和15天处死小鼠。根据标准程序将组织样品进行均质化并测量GAA活性。来自IGF2-GAA融合多肽和/或SS-IGF2-GAA双融合多肽和未加标签的GAA的GAA活性的组织半衰期由不同组织(例如,股四头肌组织、心脏组织、膈肌组织和肝脏组织)中的衰变曲线计算,并计算每个组织的半衰期。这可以与大鼠L6成肌细胞中的半衰期进行比较,以确定一旦处于庞贝氏病小鼠的细胞内,从本文描述的rAAV载体表达的IGF2-GAA融合多肽和/或SS-IGF2-GAA双融合多肽是否表现出与未加标签的GAA相似的动力学的持续存在。此外,对IGF2-GAA融合多肽和/或SS-IGF2-GAA双融合多肽的衰变动力学的了解可有助于设计适当的给药间隔。
实施例9:IGF2-GAA融合多肽和/或SS-IGF2-GAA双融合多肽向C2C12小鼠成肌细胞的溶酶体中的摄取
用实施例1和实施例2中产生的rAAV载体转导在多聚赖氨酸包被的载玻片(BDBiosciences)上生长的C2C12小鼠成肌细胞。洗涤细胞后,然后将细胞在生长培养基中孵育1小时,然后用D-PBS洗涤4次,再在室温下用甲醇固定15分钟。以下孵育都在室温下进行,各孵育通过D-PBS中的3次洗涤分开。用0.1%triton X-100透化载玻片15分钟,然后用封闭缓冲液(D-PBS中的10%热灭活马血清(Invitrogen))封闭。将载玻片用初级小鼠单克隆抗GAA抗体3A6-1F2(封闭缓冲液中1:5,000)进行孵育,然后用二级兔抗小鼠IgG AF594缀合抗体(Invitrogen A11032,封闭缓冲液中1:200)孵育。将FITC缀合的大鼠抗小鼠LAMP-1(BDPharmingen 553793,封闭缓冲液中1:50)进行孵育。载玻片用含有DAPI的封固溶液(Invitrogen)进行封固,并用尼康Eclipse 80i显微镜观察,该显微镜配有异硫氰酸荧光素、texas红和DAPI过滤器(Chroma Technology)。图像可以用通过MetaMorph软件(Universal Imaging)控制的光度计级联相机捕获,并使用Photoshop软件(Adobe)合并。可以评估通过抗GAA抗体检测的信号与通过针对溶酶体标记物LAMP1的抗体检测的信号的共定位,以示出加上IGF2标签的GAA被递送到溶酶体。
实施例10:在庞贝氏小鼠模型中评估rAAV载体的治疗和逆转庞贝氏病病理学
实施例1中生成的rAAV载体可以在庞贝氏小鼠模型中进行评估,例如,根据Peng等“Reveglucosidase alfa(BMN 701),an IGF2-Tagged rhAcidα-Glucosidase,ImprovesRespiratory Functional Parameters in a Murine Model of Pompe Disease.”Journalof Pharmacology and Experimental Therapeutics 360.2(2017):313-323中描述的方法,以引用的方式将其整体并入本文。
任何庞贝氏小鼠模型均可用于评估rAAV载体在治疗庞贝氏病方面的效果。Raben等,JBC,1998,273(30);19086-19092中描述了一种庞贝氏小鼠模型,其描述了受破坏的GAA小鼠模型,并概括了该疾病的幼年形式和成年形式二者的关键特征。在其它情况下,可以使用庞贝氏小鼠模型(Sidman等,2008),以及具有受破坏的酸性α-葡萄糖苷酶基因的小鼠品系(B6;129-GAAtm1Rabn/J;Pompe)(Jackson Laboratory,Bar Harbor,ME)。庞贝氏病小鼠发展出与人的成年庞贝氏病相同的细胞特征和临床特征(Raben等,1998)。将动物维持在12小时的光照/黑暗循环中,无限制提供标准的啮齿动物食物和淡水。
可以向4.5-5个月龄的庞贝氏小鼠给予本文所述的rAAV载体,并在给药4周以上后评价糖原清除。进行宏观评估后,收集心脏(左心室)肌肉、股四头肌、膈肌、腰肌和比目鱼肌,称重,在液氮中快速冷冻,并在-60℃至-90℃下保存,然后进行源自糖原的葡萄糖的定量分析。使用陶瓷球将肌肉在处于冰上的缓冲液(0.2M NaOAc/0.5%NP40)中均质化。在37℃下将淀粉葡萄糖苷酶加入至澄清的裂解物,以将糖原消化成葡萄糖,用于使用过氧化物酶-葡萄糖氧化酶反应系统(Sigma-Aldrich,St.Louis,MO)进行的后续的比色检测(430nm,SpectraMax,Molecular Devices,Sunnyvale,CA)。还测量了没有淀粉葡萄糖苷酶的配对的样品,以校正收获时不处于糖原形式的内源性组织葡萄糖。葡萄糖值从六点标准曲线中推知。测得的葡萄糖浓度(mg/mL)与样品的糖原浓度成正比,并通过调整均质化步骤(每克组织添加5μL缓冲液)转换为mg糖原/g组织。
本文所述的rAAV载体对个体小鼠肌糖原水平的效果可以使用Phoenix-WinNonlinclassic PD模型(Phoenix build version 6.4,Certara,L.P.,Princeton,NJ)来评估。可以获得心脏肌肉、膈肌、四头肌、腰肌和比目鱼肌中的hGAA结果。对于药物代谢动力学分析,可以向WT小鼠给予实施例1中生成的rAAV载体,并在给药前、给药后0.083、0.5、1、2和4小时收集作为终末心脏穿刺物的血样。血浆hGAA浓度可以使用桥接电化学发光方法进行量化,LOQ为100ng/mL。简而言之,0.5μg/mL钌标记的抗rhGAA(亲和纯化的山羊多克隆抗体)和0.5μg/mL生物素标记的抗IGF2(MAB792,R&D Systems,Minneapolis,MN)可与在缓冲液[Starting Block T20(PBS);ThermoFisher Scientific,Sunnyvale,CA]中1:10稀释的K2EDTA血浆样品结合并孵育1小时,然后转移到封闭的链霉亲和素测定板(Meso ScaleDiagnostics,Rockville,MD)。孵育30分钟后,将板进行洗涤,加入1×Read Buffer T(MesoScale Diagnostics),并在SECTOR Imager 2400(Meso Scale Diagnostics)上读取电化学发光信号。hGAA浓度可以从标准曲线中推知。
或者,可以收获心脏和膈组织匀浆并使用荧光底物(4-MUG)测量rhGAA活性。
使用本文实施例1和实施例2中生成的rAAV载体产生的GAA多肽的治疗效果可以在体内与wt GAA进行比较。可以进行研究以比较实施例1中公开的rAAV载体与表达未加标签的wt GAA的载体从庞贝氏小鼠的骨骼肌组织中清除糖原的能力(例如,使用庞贝氏小鼠模型6neo/6neo动物(Raben(1998)JBC 273:19086-19092))。庞贝氏小鼠组(5只/组)接受两剂的wt GAA或实施例1中生成的rAAV载体或溶媒中的一种的IV注射。五只未经处理的动物可用作对照,并接受四次每周的盐水溶液注射。动物在第2、3和4次注射前1小时接受口服苯海拉明,5mg/kg。注射后一周处死小鼠,并收获组织(膈、心脏、肺、肝、比目鱼肌、股四头肌、腓肠肌、TA、EDL、舌)用于组织学和生化分析。组织匀浆中的糖原含量可以使用黑曲霉(A.niger)淀粉葡萄糖苷酶和Amplex Red Glucose测定试剂盒测量,并使用标准程序评估不同组织匀浆中的GAA酶水平。
组织匀浆中的糖原含量可以使用黑曲霉淀粉葡萄糖苷酶和
Figure BDA0003751229800001861
RedGlucose测定试剂盒(Invitrogen)测量,基本上如Zhu等,(2005)Biochem J.,389:619-628所述。
与IGF2-GAA rAAV(即没有分泌信号序列)相比,预期本文中所述的通过实施例1和实施例2的方法产生的rAAV载体ss-IGF2-GAA rAAV在庞贝氏小鼠模型中将具有更多的分泌以及随后的向肌肉中的摄取和更高的治疗效果,这预期比wtGAA rAAV载体(即没有异源分泌信号和IGF2靶向肽中的任一者)和/或
Figure BDA0003751229800001871
更高。进一步预期包含如本文公开的经修饰的GAA(例如包含具有H201L突变的GAA)的rAAV载体在庞贝氏小鼠模型中比包含未修饰的GAA(例如wtGAA)的rAAV在治疗上更有效。考虑到所建立的庞贝氏模型,这些结果被预期转化到临床,并与治疗庞贝氏病的治疗效果相关。
实施例11:糖原的体内清除
该实验的目的是确定在单次注射实施例1和实施例2中产生的表达IGF2-GAA融合多肽和/或SS-IGF2-GAA双融合多肽的rAAV载体后,糖原从庞贝氏小鼠的心脏组织中清除的速率。
将实施例1和实施例2中产生的rAAV载体注射到庞贝氏小鼠(如Raben(1998)JBC,273:19086-19092中所述的庞贝氏小鼠模型6neo/6neo,以引用的方式将其公开内容并入本文)的颈静脉中。于注射后1、5、10和15天处死小鼠。按照标准程序将心脏组织样品均质化并分析糖原含量。这些组织匀浆中的糖原含量使用黑曲霉淀粉葡萄糖苷酶和
Figure BDA0003751229800001872
RedGlucose测定试剂盒(Invitrogen)进行测定,基本上如Zhu等,(2005)Biochem J.,389:619-628中所述。对小鼠的心脏组织的评估可以确定,与给予其中的GAA未融合至本文所述的IGF2靶向肽和/或SS的rAAV的小鼠相比,给予实施例1和实施例2中产生的表达IGF2-GAA融合多肽和/或SS-IGF2-GAA双融合多肽的rAAV载体的小鼠中的糖原是否几乎完全清除,其中,糖原含量仅微小变化表示最小清除。
实施例12:示例性肝特异性启动子
将选自本文表4或选自本文表4中公开的那些的示例性肝特异性启动子克隆到荧光素酶报告基因的上游,随后将SV40晚期PolyA信号克隆到具有与pUC19基本相同性质的骨架的载体中。具体而言,将实验评估的启动子SP0412和SP0422克隆到构建体中以生成rAAV。将质粒的DNA制备物转染到Huh7(肝细胞癌细胞系)、HeLa(源自宫颈癌的永生细胞系)或HEK293(人胚肾细胞)中的任一种以评估转录活性。Huh-7细胞来源于JCRB细胞库(JCRB0403),HeLa和HEK293来源于ECACC细胞库。所有细胞系均根据细胞库的建议来生长和维持。
使用FuGene HD转染试剂(Promega#E2311)以1:1.1的DNA:FuGene HD比率在48孔板中三重复地进行转染。转染24小时后测量荧光素酶活性。用磷酸盐缓冲盐水(PBS)洗涤细胞,在100μL Passive Lysis Buffer(Promega#E194A)中裂解细胞并在-80℃下储存过夜。使用96孔平底实心白色Microplate FluoroNunc板(ThermoFisher#236105)按照制造商的指南使用Luciferase Reporter 1000测定系统(Promega#E4550)在10μL裂解物中量化荧光素酶的活性,并在FLUOstar Omega板读取仪(BMG Labtech)机器中量化发光。
上述荧光素酶方法在本领域中是常规的,并且类似的技术已在文献(例如在Alam和Cook,“Reporter Genes:Application to the Study of Mammalian GeneTranscription”,ANALYTICAL BIOCHEMISTRY188,245-254(1990))中广泛描述。
数据
所使用的示例性肝特异性启动子的序列在本文的表4中示出。这些合成型肝特异性启动子在肝细胞中驱动表达的能力以普遍存在的CMV_IE和CBA启动子以及已知的肝特异性启动子LP1为基准。根据本发明的所有合成型启动子在Huh7细胞中显示出比LP1启动子更高的活性(数据未被示出)。当这些启动子在非肝脏来源的HEK293和HeLa细胞中进行反向筛选时,与普遍存在的活性启动子CMV_IE和CBA相比,它们显示出可忽略不计的活性(数据未被示出)。
肝特异性启动子(即表4中列出的所有启动子)的活性也在Huh7细胞中使用基本上如上所述的材料和方法进行测试。然而,在这种情况下,将肝特异性启动子的活性与启动子TBG(SEQ ID NO:435)的活性进行比较,因为发现TBG比LP1具有更高和更一致的体外表达。应该注意的是,TBG是非常强有力的肝特异性启动子,并因此显示出低于TBG的表达的启动子可能仍然非常有用。具体而言,比TBG更短但仍表现出高水平的活性(例如SEQ ID NO:435的TBG的15%的活性、更优选的25%、50%、或75%或更高的活性)的表4中公开的肝特异性启动子或其功能变体是特别令人感兴趣的。
使用实施例2中描述的材料和方法,使用非肝脏HEK293细胞还测试了肝特异性启动子对肝细胞的特异性。与CMV-IE(SEQ ID NO:433)的活性相比,肝特异性启动子的活性被表达(TBG和LP1是肝特异性的,并因此在HEK293细胞中不是特别活化的)。图中示出在HEK293细胞中测试的肝特异性启动子的特异性的“相对活性”是被指出的启动子的活性,表示为与CMV-IE活性的比值,其中1是与CMV-IE启动子(SEQ ID NO:433)的活性相同,大于1是活性比CMV-IE高,以及小于1是活性比SEQ ID NO:433的CMV-IE启动子低。
实施例13:示例性肝特异性启动子的体内表达
选择某些肝特异性启动子作为用于体内评估的示例性肝特异性启动子。具体而言,在体内评估最小启动子CRM_SP0239(SEQ ID NO:87)和CRM_SP0412(SEQ ID NO:86)以及合成型肝特异性启动子SP0239(SEQ ID NO:93)、SP0412(SEQ ID NO:91)和SP0422(SEQ IDNO:92)(参见图10和图13A-图13B)。
AAV产生:
在体内测试了根据本发明的启动子亚群的活性。本研究中包括的合成型启动子是SP0239、SP0244、SP0412和阳性对照LP1。所使用的报告基因是fLUC-T2A-EGFP(即fLUC(萤火虫荧光素酶)),通过T2A信号(双向自切割肽)融合至mEGFP(突变的绿色荧光蛋白)。pAAV_SYNP_Luc-T2A-GFP目标载体源自pAAV ZsGreen1(从Clontech购买),其中将ZsGreen1报告基因置换为Luc-T2A-GFP双重报告基因。所有DNA质粒均根据制造商说明书使用QIAGENPlasmid Mega Kit(Qiagen#12181,德国)制备。
在145mm的经过组织培养物处理的培养皿(Greiner Bio-One Ltd#639160,UK)中用Dulbecco改良的Eagle培养基、高葡萄糖、补充有10%(v/v)胎牛血清(Sigma#F7524,UK)的GlutaMAX补充剂(Gibco(Life Technologies)#61965-059,UK)对rAAV生产细胞系进行培养,并在37℃和5%CO2下孵育。用于细胞培养的其它试剂购自Invitrogen-UK,且塑料制品购自Life Technologies。
本研究中使用的所有AAV载体在AAV9衣壳中被假型化。用其中报告基因由不同的启动子控制的质粒以及编码辅助功能的质粒(以允许病毒繁殖(pDG9))共转染rAAV生产细胞系。使用聚乙烯亚胺(PEI)(Sigma-Aldrich#764604,UK)以(1μg/μL)的原液浓度使用摩尔比为1∶3的(DNA∶PEI)对rAAV生产细胞系进行转染。
AAV纯化和滴定:
转染72小时后,裂解细胞并过滤粗裂解物,然后通过含有POROSTMCaptureSelectTM AAV Resin(Thermo Scientific,#A36739)的HPLC柱并使用
Figure BDA0003751229800001902
plus(高效液相色谱-HPLC系统(GE Healthcare,#11001313))进行纯化。
遵循QuantStudioTM 3 System Real-Time PCR(Thermo Fisher Scientific,UK)中的
Figure BDA0003751229800001901
Universal qPCR Master Mix(NEB#M3003,UK)的制造商说明,通过使用正向引物(ACGCTGGGCTACTTGATC-SEQ ID NO:445)、反向引物(CGAGGAGGAGCTATTCTTG-SEQ ID NO:446)和探针(TTTCGGGTCGTGCTCATG-SEQ ID NO:447)进行qPCR滴定以靶向LUC盒来确定载体基因组的数量,并通过QuantStudio设计和分析软件V1.4.1来分析数据。
动物程序:
远缘杂交的6周龄CD1雄性小鼠购自Charles River-UK。将它们隔离一周,然后转移到封闭的通风笼中,并将其饲养在最小疾病设施中。将它们以5只小鼠/笼来笼养,并随意喂食和喂水使其体重正常化。在进行任何实验之前,新安置的小鼠再接受一周的环境适应。此项研究是在法定的内政部的推荐、监管、伦理和许可程序下以及1986年动物(科学程序)法下进行的,并遵循伦敦大学学院的机构指导。
动物注射:
在暖箱(Thermo Fisher Scientific,UK)中,向8周龄的年轻成年雄性CD1小鼠给予AAV,所述小鼠经医用空气(21%氧气)(Abbotts Laboratories,UK)中提供的2%-4%异氟醚麻醉。使用胰岛素注射器(27G1/2in.,1.0mL(Fisher Scientific,UK))对小鼠静脉内注射入侧尾静脉。向每只小鼠注射处于终体积为200μL的生理盐水溶液中的每小鼠8E+10AAV病毒基因组的AAV载体剂量。然后在将小鼠放回它们的笼子之前,让它们恢复到正常温度。
生物发光成像
每周使小鼠经受全身生物发光成像。在适当的情况下,用医用空气(21%氧气)中提供的2%-4%异氟醚对小鼠进行麻醉,并使用胰岛素注射器(Fisher Scientific,UK)腹膜内注射300μL 15mg/mL的D-荧光素钾盐(Syd Labs#MB000102,US)。在生理盐水(Gibco#14190-094,UK)中制备D-荧光素原液。5分钟后,使用冷却的电荷耦合设备相机(IVISLumina II机器,Perkin Elmer,UK)对小鼠进行1秒至10秒间的成像。使用IVIS LuminaLiving image 4.5.5(Perkin Elmer)测量感兴趣的区域(ROI),并将ROI表示为每秒每平方厘米每球面度的光子(光子/秒/cm2/sr)。
数据
该研究的结果示于图10中。结果表示为每组中所有经测试的动物的荧光素酶生物发光强度(总通量,以每秒的光子计)的平均值。误差棒是平均值的标准误差。在“盐水”组(n=10)中,向所述动物仅注射盐水,并且未检测到荧光素酶生物发光。该组是阴性对照并且表明如果没有注射可操作地连接至启动子的荧光素酶,则不会检测到荧光素酶生物发光。在‘LP1’组(n=9)中,向所述动物注射可操作地连接至LP1启动子(SEQ ID NO:432)的荧光素酶并检测荧光素酶生物发光。该组为阳性对照,并表明荧光素酶在LP1启动子的控制下表达并可被检测到。
为了测试根据本发明的肝特异性启动子的活性,向动物注射包含处于可操作地连接至两个启动子的荧光素酶的构建体。在‘SP0244’组(n=8)中,荧光素酶可操作地连接至SP0244启动子。在‘SP0239’组(n=10)中,荧光素酶可操作地连接至SP0239启动子(SEQ IDNO:93)。
如从图10可以看出的,如通过比通用肝特异性启动子‘LP1’(SEQ ID NO:432)更高的生物发光强度所示出的,来自启动子‘SP0244’(SEQ ID NO:366)和‘SP0239’(SEQ ID NO:93)的表达最高。因此,启动子SP0244和SP0239在体内显示出高活性并且它们的活性高于LP1的活性。
在图13A和图13B中,在Huh7细胞和HEPH2细胞中从包含以下的不同LSP的不同的rAAV载体中细胞内地检测GAA的表达:LSP NEW(SEQ ID NO:160)、412NEW(SEQ ID NO:159)、TTR NEW(SEQ ID NO:155)、412-TTR、422填充区(SEQ ID NO:158)、422TTR、412填充区(SEQID NO:156),表明了使用SP0412和SP0422启动子可以由rAAV以显著的水平表达hGAA。此外,如图13A和图13B所示,任何上述AAV载体的GAA表达显著高于来自包含通用肝特异性启动子的AAV载体的GAA表达。重要的是,图13A和图13B示出了与来自包含LP1启动子(SEQ ID NO:432)(其在图13A和图13B中被称为“LSP SS”)的rAAV的hGAA表达水平相比,来自包含启动子412(SEQ ID NO:91)和启动子422(SEQ ID NO:92)的rAAV载体的hGAA表达使得hGAA在Huh7和HepG2细胞中高表达。
该实验表明了实施例12中获得的体外结果可以通过体内显著的GAA蛋白表达来实现。具有不同强度的一系列肝特异性启动子可用于本文公开的方法和组合物中,这对于在治疗环境中提供肝特异性表达的期望水平以治疗疾病(例如庞贝氏病)可以非常有用。
实施例14:庞贝氏患者的临床研究
在招募患有LOPD的成年受试者的临床研究ACT-CS101中,两组各3名受试者已被给予rAAV-LSP-hGAA。组1受试者接受1.6E12vg/kg,而组2受试者接受1.6E13vg/kg。所有受试者均已撤除酶替代疗法(ERT)(alglucosidase alfa
Figure BDA0003751229800001921
);组1受试者在rAAV-LSP-hGAA给予后继续ERT 6个月,而组2受试者在rAAV-LSP-hGAA给予时撤除ERT。AAV8-LSPhGAA的构建体示于图3B中,并且是包含AAV2ITR的感染性、非复制型重组腺相关病毒(AAV)血清型8载体,或包含衣壳8和例如来自AAV2的另一衣壳蛋白(例如,AAV2/8-LSPhGAA)的表达人酸性α-葡萄糖苷酶(hGAA)的单倍体AAV载体。
初步数据表明,截至2020年6月1日,没有符合快速报告规则的严重不良事件。报告的不良事件大多是可预期/预测的,并且严重程度为轻度至中度,短暂且可逆。
组1接受了已被所有3名受试者良好地耐受的1.6E12vg/kg,所有这些受试者现在都已达到给予后12个月,很快可获得活检数据。在组1入组的任意受试者(1.6E12vg/kg)中,未观察到天冬氨酸转氨酶(AST)或丙氨酸转氨酶(ALT)升高。所有受试者都接受了使用强的松的免疫预防,从60mg/天开始,持续4周,然后逐渐减量(5mg/周,持续11周)。组1中没有受试者表现出对衣壳或酸性α-葡萄糖苷酶(GAA)的阳性酶联免疫吸收点(ELISPOT)反应性。所有受试者都表现出了高于其各自的基线值的血清GAA浓度;然而,血清GAA浓度会随时间推移而降低。没有人需要接受ERT挽救。
组2接受了1.6E13vg/kg(2019年8月中旬、9月中旬和10月初给予)。从第46天(004)、第41天(005)和第55天(006)开始,已在组2的所有受试者中观察到了AST和ALT的无症状升高。所有受试者都接受了从60mg/天开始的使用强的松的免疫预防;然而,所有受试者都接受了增强剂量的强的松以响应AST和ALT的升高。两名受试者(004和005)接受了IV甲泼尼龙。组2中的两名受试者具有CTCAE 3级实验室升高。受试者004经历了一次ALT 3级升高(348U/L;ULN=63;5x ULN=315)和一次AST 3级升高(222U/L;ULN=41;5x ULN=205)。两种3级升高都发生在同一天,并且被首席研究员认为与ACTUS-101明确地/可能地相关。受试者5经历了一次γ-谷氨酰转移酶(GGT)3级升高(311U/L;ULN=50;5x ULN=250),首席研究员认为这可能与ACTUS-101相关,但更可能与强的松有关。所有3级升高都是短暂且无症状的。受试者004在3级实验室升高后的10天内进行了肝活检,结果显示了轻度和非特异性的炎症。该受试者还在第24周报告了脂肪瘤,这归因于类固醇给予的量大且持续时间长,脂肪瘤在此后逐渐减小。所有受试者都表现出对AAV8衣壳的阳性但不同水平的ELISPOT T细胞应答,这并不总是与所注意到的肝酶变化相一致。
进行分析可比性研究以确定所建议的制造改变对AAV8-LSPhGAA的特性、强度、质量、纯度或效力的影响或其不存在。
可以使用在Absorption Systems Boston,LLC(ASB,Medford,MA)于方法标准操作程序(SOP)下运行的合格的体外效力测定对AAV8-LSPhGAA的分析可比性进行评估,该方法是用于确定AAV8-LSPhGAA测试样品相对于参考标准的效力的体外测定。简而言之,以96孔HuH-7细胞培养板的形式(人肝细胞细胞系,Sekisui XenoTech,目录号JCRB0403)进行6天的测定,使用9点稀释方案用AAV8-LSPhGAA进行转导,并且孵育96±2小时,然后通过4-MU生物测定法测量细胞上清液中的GAA。使用PLA Software 3.0(Stegmann Systems)用平行线测定模型计算相对效力。
剂量范围研究:
GAA敲除(KO)小鼠中的剂量范围研究,该研究用于支持AAV8-LSPhGAA的药效学效果。通过尾静脉(静脉内)注射(推注)在8至12周龄时(修改1建议在机构反馈前9至12周进行)对雄性和雌性GAA KO庞贝氏小鼠(B6;129-Gaatm1Rabn/J,储存号004154,6neo)进行注射。根据Han等(2017和2019),将最少6名雄性(M)和6名雌性(F)随机分配为接受以2E11vg/kg、2E12vg/kg和2E13vg/kg给药的测试产品的一种(AAV8-LSPhGAA),并且对照组仅接受配方缓冲液(溶媒)。跟踪动物8周,然后处死以收集组织和血液。实验组和对照组对操作员保持盲态。
在生命监测中包括对死亡率的每日检查。将濒临死亡的动物从研究中移出(进行大体尸检和组织取样以进行组织病理学检查)。每2周测量所有组中的血清GAA,直到给药后8周终止。
尸检时的测量和组织收集将包括肝脏、心脏、股四头肌、胫骨前肌、膈、脑、比目鱼肌、肾脏、脾脏、肺以及其它临床测量,包括:(1)终末体重,(2)肝脏和心脏的器官重量,(3)血清(GAA活性)并在-20℃下储存以用于随后的抗GAA抗体(ADA)的测量,(4)将肝脏、心脏、比目鱼肌、股四头肌、胫骨前肌、舌、膈、脑分成数个片段。额外的测量包括:(4)血清和组织中的GAA活性以及组织中的糖原含量,通过合格的测定法测量(组织将在液氮中快速冷冻并在-80℃下储存);每次测定将收集~50mg的各指明组织的靶标,以及(5)固定在10%中性缓冲福尔马林中的组织病理学检查分析,用于如上所述的组织以及在尸检时任何观察到的眼观病变的苏木精和伊红(H&E)染色;根据需要,将组织的部分固定在戊二醛中以进行糖原染色(高碘酸-希夫染色-PAS);通过测量抗GAA抗体应答(ADA)评估对转基因产物的免疫应答;每个二倍体基因组的载体基因组拷贝数的总DNA的确定–vg/ug的DNA(在液氮中快速冷冻,然后在-80℃下储存)。
如果通过以下测量没有观察到显著的差异性,GAA KO小鼠中的剂量范围研究将支持AAV8-LSPhGAA和根据本文公开内容修饰的经修饰的AAV载体之间的体内可比性(例如,不同的LSP,hGAA序列的优化):1.由经过认证的兽医病理学家对所有收集的组织进行组织病理学检查(安全性);2.具有处于AAV8-LSPhGAA的0.80到1.25之间(80%-125%)的经修饰的AAV载体的相对活性的心脏、膈和股四头肌中的GAA活性和糖原含量(功效);3.具有处于AAV8-LSPhGAA的0.80到1.25之间(80%-125%)的经修饰的AAV载体的相对生物分布的所收集的组织中每μg DNA的载体基因组DNA(生物分布);4.抗GAA ADA无变化。
虽然本发明已经结合多个具体实施方式进行了描述和说明,但本领域技术人员将理解的是,如所描述和要求保护的,可以在不背离本文所说明的发明原理的情况下进行变化和修改。在不背离其精神或本质特征的情况下,本发明可以以其它特定形式具象化。认为所描述的实施方式在所有方面都是说明性而非限制性的。
最后,关于如本文示出和描述的本发明的示例性实施方式,将理解,包含AAV(腺相关病毒)病毒性病毒体的基因组构建体被公开并被配置用于AAV载体的递送。因为本发明的原理可以以超出所示出和描述的多种配置来实践,将理解的是本发明不以任何方式受示例性实施方式的限制,而是通常针对包括AAV(腺相关病毒)病毒性病毒体组织的基因组构建体,并且能够采取多种形式来这样做而不脱离本发明的精神和范围。
本文描述了本发明的某些实施方式,包括本发明人已知的用于实施本发明的最佳模式。当然,在阅读上述描述后,这些描述的实施方式的变化对于本领域普通技术人员而言是显而易见的。本发明人预期技术人员适当地采用此类变化,并且本发明人打算将本发明以不同于本文具体描述的方式来实践。因此,本发明包括在适用的法律允许的情况下所附权利要求中记载的主题的所有修改和等同物。此外,除非本文另有说明或与上下文明显矛盾,否则本发明涵盖上述实施方式的所有可能变型的任意组合。
本发明的替代实施方式、要素或步骤的分组不应被解释为限制性的。各组成员可被单独地提及和要求保护,或与本文公开的其它组成员任意组合而被提及和要求保护。出于方便和/或可专利性的原因,预期组中的一个或多个成员可包括在组中或从组中删除。当发生任何此类包括或删除时,本说明书被视为包含经修饰的组,从而满足所附权利要求中使用的所有马库什组的书面描述。
除非另有说明,在本说明书和权利要求中使用的表示特征、项目、量、参数、性质、期限等的所有数字应理解为在所有情况下被术语“约”修饰。如本文所使用的,术语“约”意味着如此限制的特征、项目、量、参数、性质或期限涵盖高于和低于所述特征、项目、量、参数、性质或期限的值的加减百分之十的范围。因此,除非另有相反说明,本说明书和所附权利要求书中所列的数值参数是可以变化的近似值。至少,并不是试图将等同原则的应用限制至权利要求的范围,每个数值指示至少应根据所报告的有效数字的数值并通过应用普通四舍五入技术加以解释。尽管阐述本发明的广泛范围的数值范围和值是近似值,但在具体实施例中阐述的数值范围和值被尽可能精确地报告。然而,任何数值范围或值固有地包含必然由见于其各自测试测量中的标准偏差造成的某些误差。本文中的值的数值范围的叙述仅旨在用作分别指代范围内的各单独数值的简写方法。除非本文另有说明,否则将数值范围的各单独值并入本说明书中,如同在本文中单独引用一样。类似地,如本文所使用的,除非另有相反说明,否则术语“基本上”是意在指示如此限制的特征、项目、量、参数、性质或期限的近似值的程度的术语,其涵盖本领域普通技术人员可以理解和解释的范围。
提及实施方式或实施方式的方面时的术语“可能”或“可以”的使用还随其带有“可能不”或“不能”的替代含义。就其而言,如果本说明书公开了实施方式或实施方式的方面可能或可以被包括作为本发明主题的部分,则否定性限制或排除性但书也明确表示、意指实施方式或实施方式的方面可能不会或不能被包括作为本发明主题的部分。以类似的方式,提及实施方式或实施方式的方面的术语“任选地”的使用意味着此类实施方式或实施方式的方面可被包括作为本发明主题的部分或可不被包括作为本发明主题的一部分。此类否定性限制或排除性但书是否适用将基于要求保护的主题中是否引述了否定性限制或排除性但书。
当在权利要求中使用时,无论是作为提交的还是通过修改添加的,开放式过渡术语“包含”(连同其等同的开放式过渡短语,例如“包括”、“含有”和“具有”)涵盖单独的或与未列举的主题组合的所有明确列举的要素、限制、步骤和/或特征;所指出的要素、限制和/或特征是必不可少的,但可以添加其它未指出的要素、限制和/或特征,并且仍然形成权利要求范围内的构建体。本文公开的具体实施方式可以在权利要求中使用封闭式过渡短语“由……组成”或“基本上由……组成”代替“包含”或作为“包含”的修改而被进一步限制。当在权利要求中使用时,无论是作为提交的还是通过修改添加的,封闭式过渡短语“由……组成”排除权利要求中未明确记载的任何要素、限制、步骤或特征。封闭式过渡短语“基本上由……组成”将权利要求的范围限制为明确列举的要素、限制、步骤和/或特征,以及不会实质性影响所请求保护的主题的基本和新颖的特征的任何其它要素、限制、步骤和/或特征。因此,开放式过渡短语“包含”的含义被定义为涵盖所有具体列举的要素、限制、步骤和/或特征以及任何可选的、额外的未指定的要素、限制、步骤和/或特征。封闭式过渡短语“由……组成”的含义被定义为仅包括权利要求中具体列举的那些要素、限制、步骤和/或特征,而封闭式过渡短语“基本上由……组成”的含义被定义为仅包括权利要求中具体列举的那些要素、限制、步骤和/或特征,以及对所要求保护的主题的基本和新颖的特征没有实质性影响的那些要素、限制、步骤和/或特征。因此,作为限制性情况,开放式过渡短语“包含”(连同其等同的开放式过渡短语)在其含义内包括由封闭式过渡短语“由……组成”或“基本上由……组成”指定的要求保护的主题。就其而言,本文所述的或以短语“包含”请求保护的实施方式在本文中明确地或固有地毫无疑义地被描述为、允许和用于支持短语“基本上由……组成”和“由……组成”。
虽然已经参考至少一个示例性实施方式描述了本发明的方面,但是本领域技术人员将清楚地理解,本发明不限于此。相反,本发明的范围将仅结合所附权利要求来解释,并且在此清楚的是,本发明人相信要求保护的主题是本发明。
参考文献
说明书和实施例中公开的参考文献(包括但不限于专利和专利申请、以及国际专利申请)均以引用的方式将它们的整体并入本文。
出于描述和公开的目的,将本说明书中引用和说明的所有专利、专利公开和其它出版物以引用的方式将它们的整体单独且明确地并入本文,例如,在此类出版物中描述的组合物和方法可与本发明联合使用。这些出版物仅由于它们的公开早于本申请的申请日而提供。在这一方面,任何内容都不应解释为承认本发明人由于在先的发明或任何其它原因而无权将此公开内容提前。关于这些文件的日期的所有声明或关于这些文件的内容的所有描述均基于申请人可获取的信息,而并不构成对这些文件的日期或内容的正确性的任何承认。
参考文献:
1.L Lisowski,AP Dane,K Chu,Y Zhang,SC Cunninghamm,EM Wilson,etal.Selection and evaluation of clinically relevant AAV variants in axenograft liver model Nature,506(2014),pp.382-386(LK03 and others LK0-19)
2.Grimm D,Lee JS,Wang L,Desai T,Akache B Storm TA,Kay MA.In vitro andin vivo gene therapy vector evolution via multispecies interbreeding andretargeting of adeno-associated viruses.J Virol.2008 Jun:82(12):5887-911.(AAV-DJ)
3.Powell SK,Khan N,Parker CL,Samulski RJ,Matsushima G,Gray SJ,McCownTJ.Characterization of a novel adeno-associated viral vector withpreferential oligodendrocyte tropism.Gene Ther.2016 Nov:23(11):807-814.(Olig001)
4.Tervo DG,Hwang BY,Viswanathan S,Gaj T,Lavzin M,Ritola KD,Lindo S,Michael S,Kuleshova E,Ojala D,Huang CC,Gerfen CR,Schiller J,Dudman JT,HantmanAW,Looger LL,Schaffer DV,Karpova AY.A Designer AAV Variant Permits EfficientRetrograde Access to Projection Neurons.Neuron.2016 Oct 19:92(2):372-382.(rAAV2-retro)
5.Marsic D,Govindasamy L,Currlin S,Markusic DM,Tseng YS,Herzog RW,Agbandje-McKenna M,Zolotukhin S.Vector design Tour de Force:integratingcombinatorial and rational approaches to derive novel adeno-associated virusvariants.Mol Ther.2014 Nov:22(11):1900-9.(AAV-LiC)
6.Sallach J,Di Pasquale G,Larcher F,NiehoffN,Rubsam MHuber A,Chiarini J,Almarza D,Eming SA,Ulus H,Nishimura S,Hacker UT,Ballek M,NiessenCM,Buning H.Tropism-modified AAV vectors overcome barriers to successfulcutaneous therapy.Mol Ther.2014 May:22(5):929-39.(AAV-Keral,AAV-Kera2,andAAV-Kera3)
7.Dalkara D,Byrne LC,Klimczak RR,Visel M,Yin L,Merigan WH,FlanneryJG,Schaffer DV.In vivo-directed evolution of a new adeno-associated virus fortherapeutic outer retinal gene delivery from the vitreous.Sci Transl Med.2013Jun 12:5(189):189ra76.(AAV 7m8)
8.Asuri P,Bartel MA,Vazin T,Jang JH,Wong TB,Schaffer DV.Directedevolution of adeno-associated virus for enhanced gene delivery and genetargeting in human pluripotent stem cells.Mol Ther.2012 Feb:20(2):329-38.(AAV1.9)
9.Jang JH,Koerber JT,Kim JS,Asuri P,Vazin T,Bartel M,Keung A,Kwon I,Park KI,Schaffer DV.An evolved adeno-associated viral variant enhances genedelivery and gene targeting in neural stem cells.Mol Ther.2011 Apr:19(4):667-75.doi:10.1038/mt.2010.287.(AAV r3.45)
10.Gray SJ,Blake BL,Criswell HE,Nicolson SC,Samulski RJ,McCown TJ,LiW.Directed evolution of a novel adeno-associated virus(AAV)vector thatcrosses the seizure-compromised blood-brain barrier(BBB).Mol Ther.2010 Mar:18(3):570-8(AAV clone 32 and 83)
11.Maguire CA,Gianni D,Meijer DH,Shaket LA,Wakimoto H,Rabkin SD,GaoG,Sena-Esteves M.Directed evolution of adeno-associated virus for glioma celltransduction.J Neurooncol.2010 Feb:96(3):337-47.(AAV-U87R7-C5)
12.Koerber JT,KlimczakR,Jang JH,Dalkara D,Flannery JG,SchafferDV.Molecular evolution of adeno-associated virus for enhanced glial genedelivery.Mol Ther.2009 Dec:17(12):2088-95.(AAV ShH13,AAV ShH19,AAV L1-12)
13.Li W,Zhang L,Johnson JS,Zhijian W,Grieger JC,Ping-Jie X,Drouin LM,Agbandje-McKenna M,Pickles R J,Samulski RJ.Generation of novel AAV variantsby directed evolution for improved CFTR deliver,to human ciliated airwayepithelium.Mol Ther.2009 Dec:17(12):2067-77.(AAV HAE-1,AAV HAE-2)
14.Klimczak RR,Koerber JT,Dalkara D,Flannery JG,Schaffer DV.A noveladeno-associated viral variant for efficient and selective intravitrealtransduction of rat Muller cells.PLoS One.2009 Oct 14:4(10):e7467.(AAVvariant ShH10)
15.Excoffon KJ,Koerber JT,Dickey DD,Murtha M,Keshavjee S,Kaspar BK,Zabner J,Schaffer DV.Directed evolution of adeno-associated virus to aninfectious respiratory virus.Proc Natl Acad Sci US A.2009 Mar 10:106(10):3865-70.(AAV2.5T)
16.Sellner L,Stiefelhagen M,Kleinschmidt JA,Laufs S,Wenz F,FruehaufS,Zeller WJ,Veldwijk MR.Generation of efficient human blood progenitor-targeted recombinant adeno-associated viral vectors(AAV)by applying an AAVrandom peptide library on primary human hematopoietic progenitor cells.ExpHematol.2008 Aug:36(8):957-64.(AAV LS1-4,AAV Lsm)
17.Li W,Asokan A,Wu Z,Van Dyke T,DiPrimio N,Johnson JS,GovindaswamyL,Agbandje-McKenna M,Leichtle S,Redmond DE Jr,McCown TJ,Petermann KB,Sharpless NE,Samulski RJ.Engineering and selection of shuffled AAV genomes:anew strategy for producing targeted biological nanoparticles.Mol Ther.2008Jul:16(7):1252-60.(AAVI289)
18.Charbel Issa P,De Silva SR,Lipinski DM,Singh MS,Mouravlev A,YouQ.Assessment of tropism and effectiveness of new primate-derived hybridrecombinant AAV serotypes in the mouse and primate retina.PLoS ONE.2013:8:e60361.(AAVHSC 1-17)
19.Huang W,McMurphy T,Liu X,Wang C,Cao L.Genetic Manipulation ofBrown Fat Via Oral Administration of an Engineered Recombinant Adeno-associated Viral Serotype Vector.Mol Ther.2016 Jun:24(6):1062-9.(AAV2 Rec 1-4)
20.Cronin T,Vandenberghe LH,Hantz P,et al.Efficient transduction andoptogenetic stimulation of retinal bipolar cells by a synthetic adeno-associated virus capsid and promoter.EMBO Mol Med 2014:6:1175-1190(AAV8BP2)
21.Choudhury SR,Fitzpatrick Z,Harris AF,Maitland SA,Ferreira JS,ZhangY,Ma S,Sharma RB,Gray-Edwards HL,Johnson JA,Johnson AK,Alonso LC,Punzo C,Wagner KR,Maguire CA,Katin RM,Martin DR,Sena-Esteves M.In Vivo SelectionYields AAV-B1 Capsid for CentralNervous System and Muscle Gene Therapy.MolTher.2016 Aug:24(7):1247-57.(AAV-B1)
22.Deverman BE,Pravda PL,Simpson BP,Kumar SR,Chan KY,Banerjee A,WuWL,Yang B,Huber N,Pasca SP,Gradinaru V.Cre-dependent selection yields AAVvariants for widespread gene transfer to the adult brain.Nat Biotechnol.2016Feb:34(2):204-9.doi:10.1038/nbt.3440.(AAV-PHP.B)
23.Pulicherla N,Shen S,Yadav S,Debbink K,Govindasamy L,Agbandje-McKenna M,Asokan A.Engineering liver-detargeted AAV9 vectors for cardiac andmusculoskeletal gene transfer.Mol Ther.2011 Jun:19(6):1070-8.(AAV9 derivedmutants-AAV9.45,AAV9.61,AAV9.47)
24.Yang L,Jiang J,Drouin LM,Agbandje-McKenna M,Chen C,Qiao C,Pu D,HuX,Wang DZ,Li J,Xiao X.A myocardium tropic adeno-associated virus(AA V)evolvedby DNA shuffling and in vivo selection.Proc Natl Acad Sci US A.2009 Mar 10∶106(10):3946-51.(AAVM41)
25.Korbelin J,Sieber T,Michelfelder S,Lunding L,Spies E,Hunger A,Alawi M,Rapti K,Indenbirken D,Muller OJ,Pasqualini R,Arap W,Kleinschmidt JA,Trepel M.Pulmonary Targeting of Adena-associated Viral Vectors by Next-generation Sequencing-guided Screening of RandomCapsid Displayed PeptideLibraries.Mol Ther.2016 Jun:24(6):1050-61.(AAV2 displayed peptides)
26.Geoghegan JC,Keiser NW,Okulist A,Martins I,Wilson MS,DavidsonBL.Chondroitin Sulfate is the Primary Receptor for a Peptide-Modified AAVThat Targets Brain Vascular Endothelium In Vivo.Mol Ther Nucleic Acids.2014Oct 14∶3:e202.(AAV2-GMN)
27.Varadi K,Michelfelder S,Korff T,Hecker M,Trepel M,Katus HA,Kleinschmidt JA,Muller OJ.Novel random peptide libraries displayed on AAVserotype 9 for selection ofendothelial cell-directed gene transfervectors.Gene Ther.2012 Aug:19(8):800-9.(AAV9-peptide displayed)
28.Michelfelder S,Varadi K,Raupp C,Hunger A,Korbelin J,Pahrmann C,Schrepfer S,Muller OJ,Kleinschmidt JA,Trepel M.Peptide ligands incorporatedinto the threefold spike capsid domain to re-direct gene transduction of AAV8and AAV9.in vivo.PLoS One.2011∶6(8):e23101.(AAV8 and AAV9 peptide displayed)
29.Yu CY,Yuan Z,Cao Z,Wang B,Qiao C,Li J,Xiao X.A muscle-targetingpeptide displayed on AAV2 improves muscle tropism on systemic delivery.GeneTher.2009 Aug:16(8):953-62.
30.Michelfelder S,Lee MK,deLima-Hahn E,Wilmes T,Kaul F,Muller 0,Kleinschmidt JA,Trepel M.Vectors selected from adeno-associated viral displaypeptide libraries for leukemia cell-targeted cytotoxic gene therapy.ExpHematol.2007 Dec:35(12):1766-76.
31.Muller OJ,Kaul F,Weitzman MD,Pasqualini R,Arap W,Kleinschmidt JA,Trepel M.Random peptide libraries displayed on adeno-associated virus toselect for targeted gene therapy vectors.Nat Biotechnol.2003 Sep:21(9):1040-6.
32.Grifman M,Trepel M,Speece P,Gilbert LB,Arap W,Pasqualini R,Weitzman MD.Incorporation of tumor-targeting peptides into recombinant adeno-associated virus capsids.Mol Ther.2001 Jun:3(6):964-75.
33.Anne Girod,Martin Ried,Christiane Wobus,Harald Lahm,Kristin Leike,Jurgen Kleinschmidt,Gilbert Deleage&Michael Ballek.Genetic capsidmodifications allow efficient re-targeting of adeno-associated virus type2.Nature Medicine,1052-1056(1999)
34.Bello A,Chand A,Aviles J,Soule G,Auricchio A,Kobinger GP.Noveladeno-associated viruses derived from pig tissues transduce most major organsin mice.Sci Rep.2014 Oct 22:4:6644.(AAVpo2.1,-po4,-poS,and-po6).
35.Gao G,Vandenberghe LH,Alvira MR,Lu Y,Calcedo R,Zhou X,WilsonJM.Clades of Adena-associated viruses are widely disseminated in humantissues.J Virol.2004 Jun:78(12):6381-8.(AAV rh and AAV Hu)
36.Arbetman AE,Lochrie M,Zhou S,Wellman J,Scallan C,Doroudchi MM,etal.Novel caprine adeno-associated virus(AAV)capsid(AAV-Go.1)is closelyrelated to the primate AAV-5 and has unique tropism and neutralizationproperties.J Virol.2005∶79∶15238-15245.(AAV-Go.1)
37.Lochrie MA,Tatsuno GP,Arbetman AE,Jones K,Pater C,Smith PH,etal.Adena-associated virus(AAV)capsid genes isolated from rat and mouse livergenomic DNA define two new AAV species distantly related to AAV-5.Virology.2006∶353∶68-82.(AAV-mo.1)
38.Schmidt M,Katano H,Bossis I,Chiarini JA.Cloning andcharacterization of a bovine adeno-associated virus.J Virol.2004∶78∶6509-6516.(BAAV)
39.Bossis I,Chiarini JA.Cloning of an avian adeno-associated virus(AAAV)and generation of recombinant AAAV particles.J Virol.2003∶77∶6799-6810.(AAAV)
40.Chen CL,Jensen RL,Schnepp BC,Connell MJ,Shell R,Sferra TJ,BartlettJS,Clark KR,Johnson PR.Molecular characterization of adeno-associated virusesinfecting children.J Virol.2005 Dec:79(23):14781-92.(AAV variants)
41.Sen D,Gadkari RA,Sudha G,Gabriel N,Kumar YS,Selot R,Samuel R,Rajalingam S,Ramya V,Nair SC,Srinivasan N,Srivastava A,JayandharanGR.Targeted modifications in adeno-associated virus serotype8 capsid improvesits hepatic gene transfer efficiency in vivo.Hum Gene Ther Methods.2013 Apr:24(2):104-16.(AAV8 K137R)
42.Li B,Ma W,Ling C,Van Vliet K,Huang LY,Agbandje-McKenna M,Srivastava A,Aslanidi GV.Site-Directed Mutagenesis of Surface-Exposed LysineResidues Leads to Improved Transduction by AAV2,But Not AAV8,Vectors inMurine Hepatocytes In Vivo.Hum Gene Ther Methods.2015 Dec:26(6):211-20.
43.Gabriel N,Hareendran S,Sen D,Gadkari RA,Sudha G,Selot R,Hussain M,Dhaksnamoorthy R,Samuel R,Srinivasan N,et al.Bioengineering ofAAV2 capsid atspecific serine,threonine,or lysine residues improves its transductionefficiency in vitro and in vivo.Hum Gene Ther Methods.2013 Apr:24(2):80-93.
44.Zinn E,Pacouret S,Khaychuk V,Turunen HT,Carvalho LS,Andres-MateosE,Shah S,Shelke R,Maurer AC,Plovie E,Xiao R,Vandenberghe LH.In SilicoReconstruction of the Viral Evolutionary Lineage Yields a Potent Gene TherapyVector.Cell Rep.2015 Aug 11:12(6):1056-68.(AAV Anc80L65)
45.Shen S,Horowitz ED,Troupes AN,Brown SM,Pulicherla N,Sarnulski RJ,Agbandje-McKenna M,Asokan A.Engraftrnent of a galactose receptor footprintonto adeno-associated viral capsids improves transduction efficiency.J BiolChern.2013 Oct 4:288(40):28814-23.(AAV2G9)
46.Li C,Diprirnio N,Bowles DE,Hirsch ML,Monahan PE,Asokan A,Rabinowitz J,Agbandje-McKenna M,Sarnulski RJ.Single amino acid modificationof adeno-associated virus capsid changes transduction and humoral immuneprofiles.J Virol.2012 Aug:86(15):7752-9.(AAV2265 insertion-AAV2/265D)
47.Bowles DE,McPhee SW,Li C,Gray SJ,Sarnulski JJ,Camp AS,Li J,Wang B,Monahan PE,Rabinowitz JE,et al.Phase 1 gene therapy for Duchenne musculardystrophy using a translational optimized AAV vector.Mol Ther.2012 Feb:20(2):443-55(AAV2.5)
48.Messina EL,Nienaber J,Daneshrnand M,Villarnizar N,Sarnulski J,Milano C,Bowles DE.Adena-associated viral vectors based on serotype 3b usecomponents of the fibroblast growth factor receptor signaling complex forefficient transduction.Hum.Gene Ther.2012 Oct:23(10):1031-42.(AAV3 SASTG)
49.Asokan A,Conway JC,Phillips JL,Li C,Hegge J,Sinnott R,Yadav S,DiPrirnio N,Nam HJ,Agbandje-McKenna M,McPhee S,Wolff J,SarnulskiRJ.Reengineering a receptor footprint of adeno-associated virus enablesselective and systemic gene transfer to muscle.Nat Biotechnol.2010 Jan:28(1):79-82.(AAV2i8)
50.Vance M,Llanga T,Bennett W,Woodard K,Murlidharan G,Chungfat N,Asokan A,Gilger B,Kurtzberg J,Sarnulski RJ,Hirsch ML.AAV Gene Therapy forMPS1-associated Corneal Blindness.Sci Rep.2016 Feb 22:6:22131.(AAV8G9)
51.Zhong L,Li B,Mah CS,Govindasarny L,Agbandje-McKenna M,Cooper M,Herzog RW,Zolotukhin I,Warrington KH Jr,Weigel-Van Aken KA,Hobbs JA,Zolotukhin S,Muzyczka N,Srivastava A.Next generation of adeno-associatedvirus 2 vectors:point mutations in tyrosines lead to high-efficiencytransduction at lower doses.Proc Natl Acad Sci US A.2008 Jun 3:105(22):7827-32.(AAV2 tyrosine mutants AAV2 Y-F)
52.Petrs-Silva H,Dinculescu A,Li Q,Min SH,Chiodo V,Pang JJ,Zhong L,Zolotukhin S,Srivastava A,Lewin AS,Hauswirth WW.High-efficiency transductionof the mouse retina by tyrosine-mutant AAV serotype vectors.Mol Ther.2009Mar:17(3):463-71.(AAV8 Y-F and AAV9 Y-F)
53.Qiao C,Zhang W,Yuan Z,Shin JH,Li J,Jayandharan GR,Zhong L,Srivastava A,Xiao X,Duan D.Adena-associated virus serotype 6 capsid tyrosine-to-phenylalaninemutations improve gene transfer to skeletal muscle.Hum GeneTher.2010 Oct:21(10):1343-8(AAV6 Y-F)
54.Carlon M,Toelen J,Van der Perren A,Vandenberghe LH,Reumers V,Sbragia L,Gijsbers R,Baekelandt V,Himmelreich U,Wilson JM,Deprest J,DebyserZ.Efficient gene transfer into the mouse lung by fetal intratrachealinjection of rAAV2/6.2.Mol Ther.2010 Dec:18(12):2130-8.(AAV6.2)PCTPublication No.WO2013158879A1(lysine mutants)
55.Piacentino III,Valentino,et al.″X-linked inhibitor ofapoptosisprotein-mediated attenuation of apoptosis,using a novel cardiac-enhancedadeno-associated viral vector.″Human gene therapy 23.6(2012):635-646.
56.Hirschhorn et al.(2001)“Glycogen Storage Disease Type II:AcidAlpha-glucosidase(Acid Maltase)Deficiency,”in Scriver et al.,eds.,TheMetabolic and Molecular Basis of Inherited Disease,8th Ed.,New York:McGraw-Hill,3389-3420.
57.Hermonat,P.L.,Labow,M.A.,Wright,R.,Berns,K.I.,&Muzyczka,N.(1984).Genetics of adeno-associated virus:isolation and preliminarycharacterization of adeno-associated virus type 2 mutants.Journal ofVirology,51(2),329-339.https://doi.org/10.1128/jvi.51.2.329-339.1984
58.West,M.H.,Trempe,J.P.,Tratschin,J.D.,&Carter,B.J.(1987).Geneexpression in adeno-associated virus vectors:the effects of chimeric mRNAstructure,helper virus,and adenovirus VA1 RNA.Virology,160(1),38-47.https://doi.org/10.1016/0042-6822(87)90041-9
59.Bohenzky,R.A.,&Bems,K.I.(1989).Interactions between the termini ofadeno-associated virus DNA.Journal of Molecular Biology,206(1),91-100.https://doi,org/10.1016/0022-2836(89)90526-3
60.Flotte,T.R.,Solow,R.,Owens,R.A.,Afione,S.,Zeitlin,P.L.,&Carter,B.J.(1992).Gene expression from adeno-associated virus vectors in airwayepithelial cells.American Journal of Respiratory Cell and Molecular Biology,7(3),349-356.https://doi.org/10.1165/ajrcmb/7.3.349
61.Flotte,T.R.,Afione,S.A.,Solow,R.,Drumm,M.L.,Markakis,D.,Guggino,W.B.,Zeitlin,P.L.,&Carter,B.J.(1993).Expression of the cystic fibrosistransmembrane conductance regulator from a novel adeno-associated viruspromoter.Journal of Biological Chemistry,268(5),3781-3790.
62.Flotte,T.,Carter,B.,Conrad,C.,Guggino,W.,Reynolds,T.,Rosenstein,B.,Taylor,G.,Walden,S.,&Wetzel,R.(1996).A phase I study of an adeno-associated Virus-CFTR gene vector in adult CF patients with mild lungdisease.In Human Gene Therapy(Vol.7,Issue 9,pp.1145-1159).Mary Ann LiebertInc.https://doi.org/10.1089/hum.1996.7.9-1145
63.Rubenstein,R.C.,McVeigh,U.,Flotte,T.R.,Guggino,W.B.,&Zeitlin,P.L.(1997).CFTR gene transduction in neonatal rabbits using an adeno-associatedvirus(AAV)vector.Gene Therapy,4(5),384-392.https://doi.org/10.1038/sj.gt.3300417
64.Haberman,R.P.,McCown,T.J.,&Samulski,R.J.(1998).Inducible long-termgene expression in brain with adeno-associated virus gene transfer.GeneTherapy,5(12),1604-1611.https://doi.org/10.1038/sj.gt.3300782
65.Wang,D.,Fischer,H.,Zhang,L.,Fan,P.,Ding,R.X.,&Dong,J.(1999).Efficient CFTR expression from AAV vectors packaged with promoters-Thesecond generation.Gene Therapy,6(4),667-675.https://doi.org/10.1038/sj.gt.3300856
66.Hsiao,C.D.,Hsieh,F.J.,&Tsai,H.J.(2001).Enhanced expression andstable transmission of transgenes flanked by inverted terminal repeats fromadeno-associated virus in zebrafish.Developmental Dynamics:An OfficialPublication of the American Association of Anatomists,220(4),323-336.https://doi.org/10.1002/dvdy.1113
67.Davidoff,A.M.,Ng,C.Y.C.,Zhou,J.,Spence,Y.,&Nathwani,A.C.(2003).Sexsignificantly influences transduction of murine liver by recombinant adeno-associated viral vectors through an androgen-dependent pathway.Blood,102(2),480-488.https://doi.org/10.1182/blood-2002-09-2889
68.Farris,K.D.,&Pintel,D.J.(2008).Improved splicing of adeno-associated viral(AAV)capsid protein-supplying pre-mRNAs leads to increasedrecombinant AAV vector production.Human Gene Therapy,19(12),1421-1427.https://doi.org/10.1089/hum.2008.118
69.Li,C.,Hirsch,M.,Carter,P.,Asokan,A.,Zhou,X.,Wu,Z.,&Samulski,R.J.(2009).A small regulatory element from chromosome 19 enhances liver-specificgene expression.Gene Therapy,16(1),43-51.https://doi.org/10.1038/gt.2008.134
70.Dean,J.,Plante,J.,Huggins,G.S.,Snyder,R.O.,&Aikawa,R.(2009).Roleof cyclic AMP-dependent kinase response element-binding protein inrecombinant adeno-associated virus-mediated transduction of heart musclecells.Human Gene Therapy,20(9),1005-1012.https://doi.org/10.1089/hum.2009.054
71.Ling,C.,Wang,Y.,Lu,Y.,Wang,L.,Jayandharan,G.R.,Aslanidi,G.V.,Li,B.,Cheng,B.,Ma,W.,Lentz,T.,Ling,C.,Xiao,X.,Samulski,R.J.,Muzyczka,N.,&Srivastava,A.(2015).Enhanced Transgene Expression from Recombinant Single-Stranded D-Sequence-Substituted Adeno-Associated Virus Vectors in Human CellLines In Vitro and in Murine Hepatocytes In Vivo.Journal of Virology,89(2),952-961.https://doi.org/10.1128/jvi.02581-14
72.Wang,L.,Yin,Z.,Wang,Y.,Lu,Y.,Zhang,D.,Srivastava,A.,Ling,C,Aslanidi,G.V.,&Ling,C.(2015).Productive life cycle of adeno-associated virusserotype 2 in the complete absence of a conventional polyadenylationsignal.Journal of General Virology,96(9),2780-2787.https://doi.org/10.1099/jgv.0.000229
73.Powell,S.K.,Rivera-Soto,R.,&Gray,S.J.(2015).Viral expressioncassette elements to enhance transgene target specificity and expression ingene therapy.Discovery Medicine,19(102),49-57.https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4505817/
74.Stutika,C.,Mietzsch,M.,Gogol-
Figure BDA0003751229800002031
A.,Weger,S.,Sohn,M.,Chen,W.,&Heilbronn,R.(2016).Comprehensive Small RNA-Seq of Adeno-Associated Virus(AAV)-Infected Human Cells Detects Patterns of Novel,Non-Coding AAV RNAs inthe Absence of Cellular miRNA Regulation.PloS One,11(9),e0161454,https://doi.org/10.1371/journal.pone.0161454
75.Weger,S.,Hammer,E.,Gonsior,M.,Stutika,C.,&Heilbronn,R.(2016).ARegulatory Element Near the 3′End of the Adeno-Associated Virus rep GeneInhibits Adenovirus Replication in cis by Means of p40 Promoter-AssociatedShort Transcripts.Journal of Virology,90(8),3981-3993.https://doi.org/10.1128/jvi.03120-15
76.Logan,G.J.,Dane,A.P.,Hallwirth,C.V,Smyth,C.M.,Wilkie,E.E.,Amaya,A.K.,Zhu,E.,Khandekar,N.,Ginn,S.L.,Liao,S.H.Y.,Cunningham,S.C.,Sasaki,N.,Cabanes-Creus,M.,Tam,P.P.L.,Russell,D.W.,Lisowski,L.,&Alexander,I.E.(2017).Identification of liver-specific enhancer-promoter activity in the 3’untranslated region of the wild-type AAV2 genome.Nature Genetics,49(8),1267-1273.https://doi.org/10.1038/ng.3893
77.Lu,J.,Williams,J.A.,Luke,J.,Zhang,F.,Chu,K.,&Kay,M.A.(2017).A 5’noncoding exon containing engineered intron enhances transgene expressionfrom recombinant AAV vectors in vivo.Human Gene Therapy,28(1),125-134.https://doi.org/10.1089/hum.2016.140
78.Xu,H.,Hao,S.,Zhang,J.,Chen,Z.,Wang,H.,&Guan,W.(2017).The formationand modification of chromatin-like structure of human parvovirus B19 regulateviral genome replication and RNA processing.Virus Research,232,134-138.https://doi.org/10.1016/j.virusres.2017.03.001
79.Julien,L.,Chassagne,J.,Peccate,C.,Lorain,S.,Piétri-Rouxel,F.,Danos,O.,&Benkhelifa-Ziyyat,S.(2018).RFXI and RFX3 Transcription FactorsInteract with the D Sequence of Adeno-Associated Virus Inverted TerminalRepeat and Regulate AAV Transduction.Scientific Reports,8(1).https://doi.org/10.1038/s41598-017-18604-3
80.Wilmott,P.,Lisowski,L.,Alexander,I.E.,&Logan,G.J.(2019).A User’sGuide to the Inverted Terminal Repeats of Adeno-Associated Virus.Human GeneTherapy Methods,30(6),206-213.https://doi.org/10.1089/hgtb.2019.276
81.Lu,L.,Zhang,F.,Li,Y.,Yang,A.,Guan,C.,Ding,X.,Liu,Y.,Liu,Y.,Zhang,C.-Y.,Li,L.,&Zhang,Q.(2019).Dendritic targeted mRNA expression via a cis-acting RNA UTR element.Biochemical and Biophysical Research Communications,509(2),402-406.https://doi.org/10.1016/j.bbrc.2018.12.137
82.Earley,L.F.,Conatser,L.M.,Lue,V.M.,Dobbins,A.L.,Li,C.,Hirsch,M.L.,&Samulski,R.J.(2020).Adeno-Associated Virus Serotype-Specific InvertedTerminal Repeat Sequence Role in Vector Transgene Expression.Human GeneTherapy,31(3-4),151-162.https://doi.org/10.1089/hum.2019.274

Claims (73)

1.一种重组腺相关病毒(AAV)载体,所述载体在其基因组中包含:
a.5'和3'AAV反向末端重复(ITR)序列;以及
b.位于5'和3'ITR之间的异源核酸序列,所述异源核酸序列编码包含α-葡萄糖苷酶(GAA)多肽的多肽,其中,所述异源核酸可操作地连接至选自以下任一项的肝特异性启动子:
i.CRM_SP0412(SEQ ID NO:86)或SP0412(SEQ ID NO:91)或其具有SEQ ID NO:86或SEQID NO:91的至少60%活性的功能变体或功能片段;
ii.SP0422(SEQ ID NO:92)或其具有SEQ ID NO:92的至少60%活性的功能变体或功能片段;
iii.CRM_SP0239(SEQ ID NO:87)或SP0239(SEQ ID NO:93)或SP0238-UTR(SEQ ID NO:147)或其具有SEQ ID NO:87、SEQ ID NO:93或SEQ ID NO:147的至少60%活性的功能变体或功能片段;
iv.CRM_SP0265(SP0131_A1)(SEQ ID NO:88)或SP0265(LVR_SP0131_A1)(SEQ ID NO:94)或SP0265-UTR(SEQ ID NO:146)或其具有SEQ ID NO:88、SEQ ID NO:94或SEQ ID NO:146的至少60%活性的功能变体或功能片段;
v.CRM_SP0240(SEQ ID NO:89)或SP0240(SEQ ID NO:95)或SP0240-UTR(SEQ ID NO:148)或其具有SEQ ID NO:89、SEQ ID NO:95或SEQ ID NO:148的至少60%活性的功能变体或功能片段;
vi.CRM_SP0246(SEQ ID NO:90)或SP0246(SEQ ID NO:96)或SP0246-UTR(SEQ ID NO:149)或其具有SEQ ID NO:90、SEQ ID NO:96或SEQ ID NO:149的至少60%活性的功能变体或功能片段。
2.如权利要求1所述的重组AAV载体,其中,所述异源核酸序列编码包含与所述GAA多肽融合的分泌信号的融合蛋白,或编码包含与所述GAA多肽融合的靶向肽的融合多肽,或编码包含与所述GAA多肽融合的分泌信号和靶向肽的融合蛋白。
3.如权利要求2所述的重组AAV载体,其中,所述AAV基因组以5'至3'方向包含:
a.5'ITR,
b.肝特异性启动子序列,
c.内含子序列,
d.编码分泌信号肽的核酸,
e.编码IGF2靶向肽的核酸,
f.编码α-葡萄糖苷酶(GAA)多肽的核酸,
g.poly A序列,以及
h.3'ITR。
4.如权利要求1-3中任一项所述的重组AAV载体,其中,编码分泌信号肽的核酸编码选自以下任一种的信号序列:AAT信号肽、纤连蛋白信号肽(FN1)、GAA前导序列、IL-2wt前导序列、经修饰的IL-2前导序列、IL2(1-3)前导序列、IgG前导序列、AAT前导序列或它们具有分泌信号活性的活性片段。
5.如权利要求1-3中任一项所述的重组AAV载体,其中,所述IGF2靶向肽结合人阳离子非依赖甘露糖-6-磷酸受体(CI-MPR)或IGF2受体。
6.如权利要求5所述的重组AAV载体,其中,所述IGF2靶向肽包含SEQ ID NO:5或包含结合至IGF2受体的SEQ ID NO:5中的至少一个氨基修饰。
7.如权利要求6所述的重组AAV载体,其中,SEQ ID NO:5中的所述至少一个氨基修饰为V43M氨基酸修饰(SEQ ID NO:8或SEQ ID NO:9)或Δ2-7(SEQ ID NO:6)或Δ1-7(SEQ IDNO:7)。
8.如权利要求1或2所述的重组AAV载体,其中,所述核酸序列编码野生型GAA多肽或经修饰的GAA多肽。
9.如权利要求1-8中任一项所述的重组AAV载体,其中,编码所述GAA多肽的核酸序列为人GAA基因或人密码子优化的GAA基因(coGAA)或经修饰的GAA核酸序列。
10.如权利要求1-9中任一项所述的重组AAV载体,其中,编码所述GAA多肽的核酸序列从SEQ ID NO:11进行修饰以用于以下的任意一种或多种:(i)经密码子优化以增强体内表达,(ii)减少CpG岛,(iii)STOP序列的修饰,(iv)减少可变阅读框,以及(v)降低固有免疫应答。
11.如权利要求1-10中任一项所述的重组AAV载体,其中,编码所述GAA多肽的核酸序列编码包含选自SEQ ID NO:10的H201L、H199R或R233H中的至少1个、至少2个或至少所有3个氨基酸修饰的GAA多肽。
12.如权利要求1-11中任一项所述的重组AAV载体,其中,经编码的融合多肽进一步包含间隔区,所述间隔区包含位于所述GAA多肽的氨基末端和所述IGF2靶向肽的C-末端的至少1个氨基酸的核苷酸序列。
13.如权利要求12所述的重组AAV载体,所述重组AAV载体进一步包含编码具有至少1个氨基酸的间隔区的核酸,所述核酸位于编码所述IGF2靶向肽的核酸和编码所述GAA多肽的核酸之间。
14.如权利要求1-13中任一项所述的重组AAV载体,所述重组AAV载体进一步包含位于编码所述GAA基因的核酸的3'端和所述3'ITR序列的5'端的至少1个polyA序列。
15.如权利要求1-14中任一项所述的重组AAV载体,其中,所述异源核酸序列进一步包含位于编码所述GAA多肽的核酸的3'端和所述3'ITR序列的5'端的胶原蛋白稳定性(CS)序列、或3'UTR序列、或CS和3'UTR序列。
16.如权利要求1-15所述的重组AAV载体,所述重组AAV载体进一步包含编码胶原蛋白稳定性(CS)序列、或3'UTR序列、或CS和3'UTR序列的核酸,所述核酸位于编码所述GAA多肽的核酸与所述poly A序列之间。
17.如权利要求1-16中任一项所述的重组AAV载体,所述重组AAV载体进一步包含位于编码所述分泌信号肽的序列的5'端和所述启动子的3'端的内含子序列。
18.如权利要求17所述的重组AAV载体,其中,所述内含子序列包含MVM序列或HBB2序列或SV40序列。
19.如权利要求1-18中任一项所述的重组AAV载体,其中,所述ITR包含插入、缺失或置换。
20.如权利要求19所述的重组AAV载体,其中,所述ITR中的一个或多个CpG岛被去除。
21.如权利要求1-20中任一项所述的重组AAV载体,其中,
a.编码所述分泌信号肽的核酸选自于由以下所组成的组中的任一项:
AAT信号肽(例如SEQ ID NO:17)或其具有分泌信号活性的活性片段,例如编码与SEQID NO:17-SEQ ID NO:22具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的氨基酸序列的核酸;
纤连蛋白信号肽(FN1)(例如SEQ ID NO:18-SEQ ID NO:21)或其具有分泌信号活性的活性片段,例如编码与SEQ ID NO:18-SEQ ID NO:21具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的氨基酸序列的核酸;
同源GAA信号肽(SEQ ID NO:175)或其具有分泌信号活性的活性片段,例如编码与SEQID NO:175具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的氨基酸序列的核酸;
hIGF2信号肽(例如SEQ ID NO:22)或其具有分泌信号活性的活性片段,例如编码与SEQID NO:22具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的氨基酸序列的核酸;
IgGl前导肽(SEQ ID NO:177)或其具有分泌信号活性的活性片段,例如编码与SEQ IDNO:177具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的氨基酸序列的核酸;
wtIL2前导肽(SEQ ID NO:179)或其具有分泌信号活性的活性片段,例如编码与SEQ IDNO:179具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的氨基酸序列的核酸;
突变型IL2前导肽(SEQ ID NO:181)或其具有分泌信号活性的活性片段,例如编码与SEQ ID NO:181具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的氨基酸序列的核酸;以及
b.编码所述GAA多肽的核酸选自于由以下所组成的组中的任一项:SEQ ID NO:11、SEQID NO:72或SEQ ID NO:182或与SEQ ID NO:11、SEQ ID NO:72或SEQ ID NO:182具有至少60%、或70%、或80%、85%、或90%、或95%、或98%或99%序列同一性的核酸序列。
22.如权利要求1-21中任一项所述的重组AAV载体,其中,所述IGF2靶向肽选自以下的任一项:SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:9。
23.如权利要求1-22中任一项所述的重组AAV载体,其中,编码所述IGF2靶向肽的核酸位于编码所述分泌信号肽的核酸和编码所述α-葡萄糖苷酶(GAA)多肽的核酸之间。
24.如权利要求1-23中任一项所述的重组AAV载体,其中,所述重组AAV载体为嵌合AAV载体、单倍体AAV载体、杂合AAV载体或多倍体AAV载体。
25.如权利要求1-24中任一项所述的重组AAV载体,其中,所述重组AAV载体为合理的单倍体载体、镶嵌AAV载体、经化学修饰的AAV载体或来自任意AAV血清型的AAV载体。
26.如权利要求1-25中任一项所述的重组AAV载体,其中,所述重组AAV载体选自于由以下所组成的组:AAVXL32载体、AAVXL32.1载体、AAV8载体或包含至少一种AAV8衣壳蛋白的单倍体AAV8载体。
27.如权利要求1-26中任一项所述的重组AAV载体,其中,所述血清型为AAV3b。
28.如权利要求27所述的重组AAV载体,其中,所述AAV3b血清型在衣壳蛋白中包含选自265D、549A、Q263Y中任意的一个或多个突变。
29.如权利要求28所述的重组AAV载体,其中,所述AAV3b血清型选自AAV3b265D、AAV3b265D549A、AAV3b549A或AAV3bQ263Y或AAV3bSASTG中的任一种。
30.一种重组腺相关病毒(AAV)载体,所述载体在其基因组中包含:
a.5'和3'AAV反向末端重复(ITR)序列;以及
b.位于5'和3'ITR之间的异源核酸序列,所述异源核酸序列编码包含α-葡萄糖苷酶(GAA)多肽的多肽,其中,所述异源核酸可操作地连接至肝特异性启动子,其中,所述肝特异性启动子选自以下中的任一项:
i.CRM_SP0412(SEQ ID NO:86)或SP0412(SEQ ID NO:91)或其具有SEQ ID NO:86或SEQID NO:91的至少60%活性的功能变体或功能片段;
ii.SP0422(SEQ ID NO:92)或其具有SEQ ID NO:92的至少60%活性的功能变体或功能片段;
iii.CRM_SP0239(SEQ ID NO:87)或SP0239(SEQ ID NO:93)或SP0238-UTR(SEQ ID NO:147)或其具有SEQ ID NO:87、SEQ ID NO:93或SEQ ID NO:147的至少60%活性的功能变体或功能片段;
iv.CRM_SP0265(SP0131_A1)(SEQ ID NO:88)或SP0265(LVR_SP0131_A1)(SEQ ID NO:94)或SP0265-UTR(SEQ ID NO:146)或其具有SEQ ID NO:88、SEQ ID NO:94或SEQ ID NO:146的至少60%活性的功能变体或功能片段;
v.CRM_SP0240(SEQ ID NO:89)或SP0240(SEQ ID NO:95)或SP0240-UTR(SEQ ID NO:148)或其具有SEQ ID NO:89、SEQ ID NO:95或SEQ ID NO:148的至少60%活性的功能变体或功能片段;或
vi.CRM_SP0246(SEQ ID NO:90)或SP0246(SEQ ID NO:96)或SP0246-UTR(SEQ ID NO:149)或其具有SEQ ID NO:90、SEQ ID NO:96或SEQ ID NO:149的至少60%活性的功能变体或功能片段,以及
其中,所述重组AAV载体包含选自血清型AAV3、AAV3b、AAV8的衣壳蛋白。
31.如权利要求30所述的重组AAV载体,其中,编码所述GAA多肽的异源核酸序列进一步包含编码分泌信号肽的核酸,所述核酸位于编码所述GAA多肽的核酸的5'端。
32.如权利要求31所述的重组AAV载体,其中,编码所述GAA多肽的异源核酸序列进一步包含编码靶向肽的核酸,所述核酸位于编码分泌信号肽的核酸和编码所述α-葡萄糖苷酶(GAA)多肽的核酸之间。
33.如权利要求30所述的重组AAV载体,其中,所述AAV基因组以5'至3'的方向包含:
a.5'ITR,
b.肝特异性启动子序列,
c.内含子序列,
d.编码分泌信号肽的核酸,
e.编码α-葡萄糖苷酶(GAA)多肽的核酸,
f.poly A序列,以及
g.3'ITR。
34.如权利要求30所述的重组AAV载体,其中,所述AAV基因组以5'至3'的方向包含:
a.5'ITR,
b.肝特异性启动子序列,
c.内含子序列,
d.编码靶向肽的核酸,
e.编码α-葡萄糖苷酶(GAA)多肽的核酸,
f.poly A序列,以及
g.3'ITR。
35.如权利要求30-34中任一项所述的重组AAV载体,其中,所述分泌信号肽选自以下中的任一者:AAT信号肽、纤连蛋白信号肽(FN1)、GAA前导序列、IL-2wt前导序列、经修饰的IL-2前导序列、IL2(1-3)前导序列、IgG前导序列、AAT前导序列,或它们的具有分泌信号活性的活性片段,或它们的具有分泌信号活性的活性片段。
36.如权利要求30-35中任一项所述的重组AAV载体,其中,所述靶向肽选自以下中的任一者:结合人阳离子非依赖甘露糖-6-磷酸受体(CI-MPR)或IGF2受体的IGF2靶向肽序列、或其功能变体。
37.如权利要求36所述的重组AAV载体,其中,所述IGF2靶向肽包含SEQ ID NO:5、或包含在SEQ ID NO:5中不影响与所述CI-MPR受体结合或减少与至少一种血清IGF结合蛋白(IGFBP)结合的至少一种氨基修饰、或包含与SEQ ID NO:5具有至少85%序列同一性的氨基酸序列。
38.如权利要求30-37所述的重组AAV载体,其中,所述核酸序列编码SEQ ID NO:10的野生型GAA多肽、或经修饰的GAA多肽。
39.如权利要求30-38所述的重组AAV载体,其中,所述核酸序列编码GAA多肽,所述GAA多肽包含选自SEQ ID NO:10的H201L、H199R或R233H中的至少1个、至少2个或至少所有3个氨基酸修饰。
40.如权利要求30-39中任一项所述的重组AAV载体,其中,编码所述GAA多肽的核酸序列为人GAA基因或人密码子优化的GAA基因(CoGAA)或经修饰的GAA核酸序列。
41.如权利要求30-40中任一项所述的重组AAV载体,其中,编码所述GAA多肽的核酸序列经密码子优化以减少CpG岛。
42.如段落30-41中任一项所述的重组AAV载体,其中,将编码所述GAA多肽的核酸序列进行密码子优化以降低固有免疫应答或减少CpG岛、或降低固有免疫应答和降低固有免疫应答。
43.如权利要求30-42中任一项所述的重组AAV载体,其中,所述内含子序列包含MVM序列或HBB2序列。
44.如权利要求30-43中任一项所述的重组AAV载体,其中,所述ITR包含插入、缺失或置换,或者任一个或多个CpG岛被去除。
45.如权利要求44所述的重组AAV载体,其中,所述重组AAV载体为AAVXL32或AAVXL32.1、或AAV8或包含至少一种AAV8衣壳蛋白的单倍体AAV8载体。
46.如权利要求30-45中任一项所述的重组AAV载体,其中,
a.编码所述分泌信号肽的核酸选自于由以下所组成的组中的任一项:
AAT信号肽(例如SEQ ID NO:17)或其具有分泌信号活性的活性片段,例如编码与SEQID NO:17-SEQ ID NO:22具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的氨基酸序列的核酸;
纤连蛋白信号肽(FN1)(例如SEQ ID NO:18-SEQ ID NO:21)或其具有分泌信号活性的活性片段,例如编码与SEQ ID NO:18-SEQ ID NO:21具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的氨基酸序列的核酸;
同源GAA信号肽(SEQ ID NO:175)或其具有分泌信号活性的活性片段,例如编码与SEQID NO:175具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的氨基酸序列的核酸;
hIGF2信号肽(例如SEQ ID NO:22)或其具有分泌信号活性的活性片段,例如编码与SEQID NO:22具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的氨基酸序列的核酸;
IgGl前导肽(SEQ ID NO:177)或其具有分泌信号活性的活性片段,例如编码与SEQ IDNO:177具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的氨基酸序列的核酸;
wtIL2前导肽(SEQ ID NO:179)或其具有分泌信号活性的活性片段,例如编码与SEQ IDNO:179具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的氨基酸序列的核酸;
突变型IL2前导肽(SEQ ID NO:181)或其具有分泌信号活性的活性片段,例如编码与SEQ ID NO:181具有至少约75%、或80%、或85%、或90%、或95%、或98%、或99%序列同一性的氨基酸序列的核酸;以及
b.编码所述GAA多肽的核酸选自于由以下所组成的组中的任一项:SEQ ID NO:11、SEQID NO:72或SEQ ID NO:182或与SEQ ID NO:11、SEQ ID NO:72或SEQ ID NO:182具有至少60%、或70%、或80%、85%、或90%、或95%、或98%或99%序列同一性的核酸序列;或所述核酸为编码具有选自SEQ ID NO:10的H201L、H199R或R233H中的至少1个、至少2个或至少所有3个氨基酸修饰的GAA多肽的核酸序列。
47.如权利要求30-46中任一项所述的重组AAV载体,其中,所述IGF2靶向肽选自SEQ IDNO:5、SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:9中的任一项。
48.如权利要求30-47中任一项所述的重组AAV载体,其中,所述IGF2靶向肽为SEQ IDNO:8或SEQ ID NO:9或与其具有至少85%序列同一性的功能变体。
49.一种药物组合物,所述药物组合物包含处于药学上可接受的运载体中的前述权利要求中任一项所述的重组AAV载体。
50.一种核酸序列,所述核酸序列包含:
可操作地连接至编码GAA多肽的核酸序列的肝特异性启动子,其中,所述肝特异性启动子选自以下任一项的肝特异性启动子:其中,所述肝特异性启动子选自以下中的任一项:
i.CRM_SP0412(SEQ ID NO:86)或SP0412(SEQ ID NO:91)或其具有SEQ ID NO:86或SEQID NO:91的至少60%活性的功能变体或功能片段;
ii.SP0422(SEQ ID NO:92)或其具有SEQ ID NO:92的至少60%活性的功能变体或功能片段;
iii.CRM_SP0239(SEQ ID NO:87)或SP0239(SEQ ID NO:93)或SP0238-UTR(SEQ ID NO:147)或其具有SEQ ID NO:87、SEQ ID NO:93或SEQ ID NO:147的至少60%活性的功能变体或功能片段;
iv.CRM_SP0265(SP0131_A1)(SEQ ID NO:88)或SP0265(LVR_SP0131_A1)(SEQ ID NO:94)或SP0265-UTR(SEQ ID NO:146)或其具有SEQ ID NO:88、SEQ ID NO:94或SEQ ID NO:146的至少60%活性的功能变体或功能片段;
v.CRM_SP0240(SEQ ID NO:89)或SP0240(SEQ ID NO:95)或SP0240-UTR(SEQ ID NO:148)或其具有SEQ ID NO:89、SEQ ID NO:95或SEQ ID NO:148的至少60%活性的功能变体或功能片段;或
vi.CRM_SP0246(SEQ ID NO:90)或SP0246(SEQ ID NO:96)或SP0246-UTR(SEQ ID NO:149)或其具有SEQ ID NO:90、SEQ ID NO:96或SEQ ID NO:149的至少60%活性的功能变体或功能片段。
51.一种重组腺相关病毒(rAAV)载体基因组的核酸序列,所述核酸序列包含:
a.5'和3'AAV反向末端重复(ITR)核酸序列;以及
b.位于5'和3'ITR之间的异源核酸序列,所述异源核酸序列编码包含分泌信号肽和α-葡萄糖苷酶(GAA)多肽的多肽,其中,所述异源核酸序列可操作地连接至肝特异性启动子,其中,所述肝特异性启动子选自以下任一项的肝特异性启动子:
i.SP0422(SEQ ID NO:92)或其具有SEQ ID NO:92的至少60%活性的功能变体或功能片段;
ii.CRM_SP0239(SEQ ID NO:87)或SP0239(SEQ ID NO:93)或SP0238-UTR(SEQ ID NO:147)或其具有SEQ ID NO:87、SEQ ID NO:93或SEQ ID NO:147的至少60%活性的功能变体或功能片段;
iii.CRM_SP0265(SP0131_A1)(SEQ ID NO:88)或SP0265(LVR_SP0131_A1)(SEQ ID NO:94)或SP0265-UTR(SEQ ID NO:146)或其具有SEQ ID NO:88、SEQ ID NO:94或SEQ ID NO:146的至少60%活性的功能变体或功能片段;
iv.CRM_SP0240(SEQ ID NO:89)或SP0240(SEQ ID NO:95)或SP0240-UTR(SEQ ID NO:148)或其具有SEQ ID NO:89、SEQ ID NO:95或SEQ ID NO:148的至少60%活性的功能变体或功能片段;或
v.CRM_SP0246(SEQ ID NO:90)或SP0246(SEQ ID NO:96)或SP0246-UTR(SEQ ID NO:149)或其具有SEQ ID NO:90、SEQ ID NO:96或SEQ ID NO:149的至少60%活性的功能变体或功能片段。
52.如权利要求50或51所述的核酸序列,其中,编码所述GAA多肽的异源核酸序列进一步包含位于所述分泌信号肽和所述α-葡萄糖苷酶(GAA)多肽之间的IGF2靶向肽。
53.如权利要求50-52所述的核酸序列,其中,编码所述分泌信号肽的核酸选自以下中的任一项:SEQ ID NO:17、SEQ ID NO:22-SEQ ID NO:26、SEQ ID NO:177、SEQ ID NO:179、SEQ ID NO:181,或与它们具有至少85%序列同一性的核酸。
54.如权利要求50所述的核酸序列,其中,编码所述IGF2靶向肽的核酸选自以下中的任一项:SEQ ID NO:2(IGF2-Δ2-7)、SEQ ID NO:3(IGF2-Δ1-7)或SEQ ID NO:4(IGF2 V43M),或与它们具有至少85%序列同一性的核酸。
55.如权利要求50-54所述的核酸序列,其中,编码所述GAA多肽的核酸序列为人GAA基因或人密码子优化的GAA基因(CoGAA)或经修饰的GAA核酸序列。
56.如权利要求55所述的核酸序列,其中,将编码所述GAA多肽的核酸序列从SEQ IDNO:11进行修饰以用于以下的任意一种或多种:(i)经密码子优化以增强体内表达,(ii)减少CpG岛,(iii)STOP序列的修饰,(iv)减少可变阅读框,以及(v)降低固有免疫应答。
57.如权利要求55所述的核酸序列,其中,编码所述GAA多肽的核酸序列经密码子优化以减少CpG岛、或降低固有免疫应答、或减少CpG岛并降低固有免疫应答、和/或以增强体内表达。
58.如权利要求50-57所述的核酸序列,其中,编码所述GAA多肽的核酸序列经密码子优化以增强体内表达。
59.如权利要求50-58所述的核酸序列,其中,编码所述GAA多肽的核酸选自以下中的任一项:SEQ ID NO:11(全长hGAA)、SEQ ID NO:55(Dwight cDNA)、SEQ ID NO:56(hGAAΔ1-66)或SEQ ID NO:82(mod_hGAA)或SEQ ID NO:182,与它们具有至少80%、85%、90%、95%或98%同一性的核酸序列。
60.如权利要求50-58所述的核酸序列,其中,编码所述GAA多肽的核酸选自以下中的任一项:SEQ ID NO:74(密码子优化的1)、SEQ ID NO:75(密码子优化的2)和SEQ ID NO:76(密码子优化的3)和SEQ ID NO:82(mod_hGAA),与它们具有至少80%、85%、90%、95%或98%同一性的核酸序列。
61.如权利要求50-58所述的核酸序列,其中,所述核酸编码包含选自SEQ ID NO:10的H201L、H199R或R233H中的至少1个、至少2个或至少所有3个氨基酸修饰的GAA多肽。
62.一种治疗患有糖原贮积病II型(GSD II、庞贝氏病、酸性麦芽糖酶缺乏症)或具有α-葡萄糖苷酶(GAA)多肽缺乏的受试者的方法,所述方法包括向所述受试者给予前述权利要求中任一项所述的重组AAV载体、或rAAV基因组、或核酸序列中的任一者。
63.如权利要求62所述的方法,其中,所述GAA多肽从所述受试者的肝脏中分泌,并且分泌的GAA被骨骼肌组织、心肌组织、膈肌组织或它们的组合摄取,其中,所述分泌的GAA的摄取引起组织中的溶酶体糖原贮积的减少。
64.如权利要求62所述的方法,其中,向所述受试者进行的给予选自肌内给予、皮下给予、椎管内给予、脑池内给予、鞘内给予、静脉内给予中的任一种。
65.如权利要求62所述的方法,其中,所述重组AAV载体为嵌合AAV载体、单倍体AAV载体、杂合AAV载体或多倍体AAV载体。
66.如权利要求62所述的方法,其中,所述重组AAV载体为合理的单倍体载体、镶嵌AAV载体、经化学修饰的AAV载体或来自任意AAV血清型的AAV载体。
67.如权利要求62所述的方法,其中,所述重组AAV载体为AAVXL32载体或AAVXL32.1载体或AAV8载体、或包含至少一种AAV8衣壳蛋白的单倍体AAV8载体。
68.如权利要求62所述的方法,其中,所述重组AAV载体为AAV8载体。
69.一种治疗患有溶酶体贮积症(LSD)的受试者的方法,所述方法包括向所述受试者给予前述权利要求中任一项所述的重组AAV载体、或rAAV基因组、或核酸序列中的任一者,其中,所述AAV载体表达选自于表5B或表6B中的任意多肽的多肽。
70.如权利要求69所述的方法,其中,所述溶酶体贮积症(LSD)选自表5A或表6A中所列的任一种。
71.如权利要求69所述的方法,其中,所述重组AAV载体为嵌合AAV载体、单倍体AAV载体、杂合AAV载体或多倍体AAV载体。
72.如权利要求69所述的方法,其中,所述重组AAV载体为合理的单倍体载体、镶嵌AAV载体、经化学修饰的AAV载体或来自任意AAV血清型的AAV载体。
73.如权利要求69所述的方法,其中,所述重组AAV载体为AAVXL32载体或AAVXL32.1载体或AAV8载体、或包含至少一种AAV8衣壳蛋白的单倍体AAV8载体。
CN202080093548.9A 2019-11-19 2020-11-19 用于治疗庞贝氏病和溶酶体紊乱的包含肝特异性启动子的治疗性腺相关病毒 Pending CN116096895A (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201962937583P 2019-11-19 2019-11-19
US201962937556P 2019-11-19 2019-11-19
US62/937,583 2019-11-19
US62/937,556 2019-11-19
US202063023570P 2020-05-12 2020-05-12
US63/023,570 2020-05-12
PCT/US2020/061223 WO2021102107A1 (en) 2019-11-19 2020-11-19 Therapeutic adeno-associated virus comprising liver-specific promoters for treating pompe disease and lysosomal disorders

Publications (1)

Publication Number Publication Date
CN116096895A true CN116096895A (zh) 2023-05-09

Family

ID=75981066

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080093548.9A Pending CN116096895A (zh) 2019-11-19 2020-11-19 用于治疗庞贝氏病和溶酶体紊乱的包含肝特异性启动子的治疗性腺相关病毒

Country Status (11)

Country Link
US (1) US20230038520A1 (zh)
EP (1) EP4061946A4 (zh)
JP (1) JP2023503046A (zh)
KR (1) KR20220098384A (zh)
CN (1) CN116096895A (zh)
AU (1) AU2020388634A1 (zh)
CA (1) CA3159018A1 (zh)
IL (1) IL293068A (zh)
MX (1) MX2022005916A (zh)
TW (1) TW202132570A (zh)
WO (1) WO2021102107A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200042935A (ko) * 2017-08-25 2020-04-24 오비드 테라퓨틱스 인크. 재조합 아데노-관련된 벡터들
WO2023288301A1 (en) * 2021-07-15 2023-01-19 Cornell University Engineered biomolecules for nutrient reprogramming
WO2023139496A1 (en) * 2022-01-21 2023-07-27 Pfizer Inc. Gene therapy for gaucher disease
WO2023164060A2 (en) * 2022-02-25 2023-08-31 Asklepios Biopharmaceutical, Inc. Therapeutic adeno-associated virus for treating pompe disease with long term cessation of gaa enzyme replacement therapy
WO2023172975A1 (en) * 2022-03-08 2023-09-14 University Of Massachusetts Methods of raav packaging
WO2023177885A2 (en) * 2022-03-18 2023-09-21 Asklepios Biopharmaceutical, Inc. Therapeutic adeno-associated virus using codon optimized nucleic acid encoding alpha-glucosidase (gaa) for treating pompe disease, with signal peptide modifications
WO2024055272A1 (zh) * 2022-09-16 2024-03-21 复旦大学附属中山医院 能高效表达目的基因的mRNA载体系统、其构建及应用

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1587923B1 (en) * 2003-01-22 2011-08-24 Duke University Improved constructs for expressing lysosomal polypeptides
US7521211B2 (en) * 2005-04-05 2009-04-21 Regeneron Pharmaceuticals, Inc IGF-1 and IGF-2 chimeric polypeptides and therapeutic uses thereof
CA2687141C (en) * 2007-05-22 2014-04-01 Amgen Inc. Compositions and methods for producing bioactive fusion proteins
PE20140617A1 (es) * 2011-04-22 2014-05-28 Genzyme Corp Alfa glucosidasa acida modificada con procesamiento acelerado
CN108699565B (zh) * 2015-12-11 2023-08-08 加州理工学院 用于定向腺相关病毒(aav)的靶向肽
EP3749756A4 (en) * 2018-02-05 2021-12-08 Audentes Therapeutics, Inc. ELEMENTS OF TRANSCRIPTION REGULATION AND ASSOCIATED USES
JP2021512899A (ja) * 2018-02-07 2021-05-20 リジェネロン・ファーマシューティカルズ・インコーポレイテッドRegeneron Pharmaceuticals, Inc. 治療用タンパク質送達のための方法および組成物
SG11202010533WA (en) * 2018-04-30 2020-11-27 Amicus Therapeutics Inc Gene therapy constructs and methods of use
US20220054656A1 (en) * 2018-11-16 2022-02-24 Asklepios Biopharmaceutical, Inc. Therapeutic adeno-associated virus for treating pompe disease

Also Published As

Publication number Publication date
MX2022005916A (es) 2022-08-04
US20230038520A1 (en) 2023-02-09
KR20220098384A (ko) 2022-07-12
IL293068A (en) 2022-07-01
EP4061946A1 (en) 2022-09-28
AU2020388634A1 (en) 2022-06-23
TW202132570A (zh) 2021-09-01
EP4061946A4 (en) 2024-03-06
JP2023503046A (ja) 2023-01-26
CA3159018A1 (en) 2021-05-27
WO2021102107A1 (en) 2021-05-27

Similar Documents

Publication Publication Date Title
CN116096895A (zh) 用于治疗庞贝氏病和溶酶体紊乱的包含肝特异性启动子的治疗性腺相关病毒
JP7245155B2 (ja) 酸性αグルコシダーゼ変異体及びその使用
JP7208133B2 (ja) 酸性αグルコシダーゼ変異体及びその使用
JP6066902B2 (ja) 疾患の治療のためのベクター及び配列
EP3101125A1 (en) Adenoassociated virus vectors for the treatment of mucopolysaccharidoses
JP2022180543A (ja) 酸性αグルコシダーゼ変異体及びその使用
JP2022513067A (ja) ポンペ病を処置するための治療用アデノ随伴ウイルス
US20220193261A1 (en) Compositions useful for treatment of pompe disease
JP7061067B2 (ja) クリグラー・ナジャー症候群の処置のための組成物
CA3135539A1 (en) Compositions useful in treatment of metachromatic leukodystrophy
US20220133906A1 (en) Vectors comprising a nucleic acid encoding lysosomal enzymes fused to a lysosomal teargeting sequence
US20210292789A1 (en) Treatment of mucopolysaccharidosis iva
CN111601620A (zh) 用于21-羟化酶缺乏症的腺相关病毒基因疗法
JP2021522775A (ja) 合理的なポリプロイド性アデノ随伴ウイルスベクターならびにその製造法および使用法
TW202342109A (zh) 於長期停止gaa酶替代療法治療龐貝症的治療性腺相關病毒
JP2023512043A (ja) ムコ多糖症ivaの治療
JP2024506860A (ja) ニーマンピック病a型を治療するための組成物及び方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40087843

Country of ref document: HK