CN116438312A - 编码glp-1受体激动剂融合物的病毒载体和其在治疗代谢性疾病中的用途 - Google Patents

编码glp-1受体激动剂融合物的病毒载体和其在治疗代谢性疾病中的用途 Download PDF

Info

Publication number
CN116438312A
CN116438312A CN202180072447.8A CN202180072447A CN116438312A CN 116438312 A CN116438312 A CN 116438312A CN 202180072447 A CN202180072447 A CN 202180072447A CN 116438312 A CN116438312 A CN 116438312A
Authority
CN
China
Prior art keywords
leu
sequence
viral vector
ser
pro
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180072447.8A
Other languages
English (en)
Inventor
J·M·维尔松
C·欣德雷尔
堀内真
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Pennsylvania Penn
Original Assignee
University of Pennsylvania Penn
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Pennsylvania Penn filed Critical University of Pennsylvania Penn
Publication of CN116438312A publication Critical patent/CN116438312A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/575Hormones
    • C07K14/605Glucagons
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • Endocrinology (AREA)
  • Plant Pathology (AREA)
  • Virology (AREA)
  • Microbiology (AREA)
  • Veterinary Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Physics & Mathematics (AREA)
  • Toxicology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Medicinal Preparation (AREA)

Abstract

提供了用于治疗受试者的代谢性疾病的组合物和方法。提供了一种病毒载体,所述病毒载体包含核酸分子,所述核酸分子包括编码GLP‑1受体激动剂融合蛋白的序列和指导其表达的调控序列。

Description

编码GLP-1受体激动剂融合物的病毒载体和其在治疗代谢性 疾病中的用途
背景技术
胰高血糖素样肽1(GLP-1)是在葡萄糖稳态中起重要作用的内源性肽激素。GLP-1是在胃肠(GI)道中由胰高血糖素前体蛋白的蛋白水解切割产生的肽激素。GLP-1和其它GLP-1受体激动剂具有通过增强胰岛素释放、增加胰岛素敏感性、防止β细胞损失和延迟胃排空来控制高血糖的能力。然而,GLP-1具有短的半衰期,这阻碍了其作为药物的使用。其它GLP-1受体激动剂目前在人类中用于治疗糖尿病。被工程化以通过将激动剂与具有较长半衰期的蛋白质融合来克服天然激素的短半衰期的GLP-1受体激动剂已经成为用于治疗2型糖尿病(T2DM)的重要治疗剂。
发明内容
本文提供了编码胰高血糖素样肽1(GLP-1)受体激动剂融合蛋白构建体的病毒载体。在一些实施例中,与不具有融合配偶体的GLP-1受体激动剂的载体介导的递送相比,这些病毒载体可以实现GLP-1受体激动剂在受试者中的持续表达和/或增加的循环半衰期。进一步提供了制备和使用此类病毒载体的方法。
在一方面,提供了一种病毒载体,所述病毒载体包含核酸,所述核酸包括编码融合蛋白的多核苷酸序列。所述融合蛋白包含(a)前导序列,所述前导序列包括分泌信号肽,(b)胰高血糖素样肽-1(GLP-1)受体激动剂,以及(c)融合结构域,所述融合结构域包括(i)IgGFc或其功能变体或(ii)白蛋白或其功能变体。在一个实施例中,所述载体是腺相关病毒载体。
在一个实施例中,(i)所述前导序列的所述分泌信号肽包括凝血酶信号肽;(ii)所述前导序列包括凝血酶前肽;和/或(iii)所述前导序列包括凝血酶前导序列。在另一个实施例中,所述前导序列包括IL-2前导序列。在一个实施例中,所述GLP-1受体激动剂选自SEQID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、SEQ ID NO:6和其功能变体。
在一个实施例中,所述融合结构域是人IgG4 Fc,所述人IgG4 Fc具有SEQ ID NO:11的序列或共享与其至少90%同一性的序列或其功能变体。在另一个实施例中,所述融合结构域是人白蛋白,所述人白蛋白具有SEQ ID NO:12的序列或共享与其至少90%同一性的序列或其功能变体。在一个实施例中,所述融合结构域是恒河猴IgG4 Fc,所述恒河猴IgG4Fc具有SEQ ID NO:17的序列或共享与其至少90%同一性的序列或其功能变体。
在另一方面,所述病毒载体包含AAV衣壳和包装在所述AAV衣壳中的载体基因组,所述载体基因组包括AAV反向末端重复序列(ITR)、编码所述融合蛋白的所述多核苷酸序列以及指导所述融合蛋白的表达的调控序列。
在另一方面,提供了一种适用于治疗受试者的代谢性疾病的药物组合物。所述组合物包含水性液体和如本文所述的病毒载体。在一个实施例中,所述受试者是人。
在又另一方面中,提供了如本文所述的病毒载体用于制造用于治疗患有代谢性疾病,任选地糖尿病的受试者的药物的用途。
在另一方面,提供了一种治疗患有代谢性疾病的受试者的方法。所述方法包含向所述受试者施用有效量的如本文所述的病毒载体或组合物。
根据本发明的以下详细描述,本发明的其它方面和优点将变得显而易见。
附图说明
图1A是度拉鲁肽(Dulaglutide)的示意图。
图1B是阿必鲁肽(Albiglutide)的示意图。
图2示出了体外的诱导型h度拉鲁肽(Trb)对CB7.fe度拉鲁肽(feTrb)。在用具有人凝血酶信号序列的诱导型人度拉鲁肽(TF.GT2A.度拉鲁肽(Trb))和CB7.猫科动物度拉鲁肽(feTrb)的质粒转染的HEK293细胞的培养上清液中测量GLP1-Fc融合物。在用0nM、4nM和40nM的雷帕霉素(Rapa)处理后48小时或在转染CB7.fe度拉鲁肽(feTrb)后48小时,收集上清液。GLP1-Fc通过活性形式GLP1 ELISA连同试剂盒的STD进行定量。
图3示出了GLP-1在Rag1KO(RAG1-/-)小鼠(n=5/载体)中的诱导型表达。通过肌内(I.M.或IM)递送所示载体(即,AAVrh91.TF.h度拉鲁肽(Trb)3w.rBG和AAVrh91.TF.rh度拉鲁肽(rhTrb).3w.rBG),向Rag1KO雌性小鼠施用1x 1011GC/小鼠。每周进行一次采血。进行对活性形式的GLP-1具有特异性的GLP1 ELISA。在第0天注射AAV载体,并且在AAV注射后约第14天和第15天通过口服强饲法施用雷帕霉素。
图4是pAAV.CMV.TF.GT2A.度拉鲁肽(Trb).3w.rBG的质粒图谱的示意图。
图5示出了经工程化的GLP-1构建体在小鼠体内的AAV介导的表达。
图6A示出了用于在双载体系统中使用的包括诱导型构建体的示例表达盒的示意图。
图6B示出了用于在1-载体系统中使用的包括诱导型构建体的表达盒的示意图,所述表达盒包括IRES连接子。
图7A示出了用于在1-载体系统中使用的包括诱导型构建体的表达盒的示意图,所述表达盒包括F2A切割序列连接子和具有分泌信号的人GLP1-Fc(h度拉鲁肽)。
图7B示出了GT2A切割序列的进一步详细视图,其中GT2A_V1包括SEQ ID NO:21的氨基酸序列,并且GT2A_V2包括SEQ ID NO:22的氨基酸序列。
图8示出了在HEK293细胞上清液中的恒河猴示例性治疗转基因(rhTT)的表达,如在用各种构建体转染并且用0nM、4nM和40nM的雷帕霉素处理后测量的,并且以IU/mL rhTT绘制。
图9示出了体外的诱导型人(h)和恒河猴(rh)GLP-1表达。在用包括凝血酶信号序列的诱导型h度拉鲁肽、包括2-载体系统的rh度拉鲁肽和CB7.rh度拉鲁肽的质粒转染的HEK293细胞的培养上清液中测量GLP1-Fc融合物。将细胞在第0天铺板,在第1天转染,在第2天用0nM、4nM和40nM的雷帕霉素处理,并且在第4天或转染CB7.rh度拉鲁肽(rhTrb)后48小时收集来自细胞的上清液。GLP1-Fc通过活性形式GLP1 ELISA连同试剂盒的STD进行定量。
图10A至10C示出了针对NHP1(18-128)的rhGLP1-Fc表达和抗rhGLP1-Fc ADA(抗药物抗体)检测测定的分析。图10A示出了以nM绘制的血清中的rhGLP1-Fc表达水平,如在第0至200天测量的。图10B示出了以μg/L绘制的血清中的雷帕霉素水平,如在第0至200天测量的。图10C示出了以O.D.450nm绘制的ADA检测测定的结果,如在第0至200天测量的。
图11A至11C示出了针对NHP1(18-072)的rhGLP1-Fc表达和抗rhGLP1-Fc ADA测定的分析。图11A示出了以nM绘制的血清中的rhGLP1-Fc表达水平,如在第0至200天测量的。图11B示出了以μg/L绘制的血清中的雷帕霉素水平,如在第0至200天测量的。图11C示出了以O.D.450nm绘制的ADA检测测定的结果,如在第0至200天测量的。
图12A至12C示出了针对NHP1(18-013)的rhGLP1-Fc表达和抗rhGLP1-Fc ADA测定的分析。图12A示出了以nM绘制的血清中的rhGLP1-Fc表达水平,如在第0至200天测量的。图12B示出了以μg/L绘制的血清中的雷帕霉素水平,如在第0至200天测量的。图12C示出了以O.D.450nm绘制的ADA检测测定的结果,如在第0至200天测量的。
具体实施方式
已经开发了长效GLP-1受体激动剂融合蛋白表达构建体用于在有需要的受试者(包含人)中使用。提供了一种前导序列,所述前导序列包含分泌信号肽以及旨在延长所得融合蛋白的循环时间的融合结构域。
描述了通过多种途径,并且特别是通过由如rAAV载体等重组载体介导的体内表达将这些构建体递送到有需要的受试者。还提供了在用于治疗有需要的受试者的糖尿病或代谢综合征并且增加受试者的GLP-1的半衰期的方案中使用这些构建体的方法。另外,提供了用于增强受试者的GLP-1的活性的方法。还提供了用于诱导有需要的受试者的体重减轻的方法。
GLP-1融合蛋白
胰高血糖素样肽1或GLP-1是衍生自胰高血糖素原基因的转录产物的肠降血糖素。在体内,胰高血糖素基因表达180氨基酸前多肽原,所述前多肽原经过蛋白水解加工以形成胰高血糖素,GLP-1和GLP-2的两种形式。最初的测序研究表明GLP-1具有37个氨基酸残基。然而,随后的信息显示,此肽是前肽,并且经过另外的加工以从氨基末端去除6个氨基酸以形成GLP-1(7-37),即GLP-1的活性形式。位置37处的甘氨酸也在体内转化为酰胺,以形成GLP-1(7-36)酰胺。GLP-1(7-37)和GLP-1(7-36)酰胺是具有同等效力的促胰岛素激素。因此,如本文所使用的,在本文中有用的GLP-1的生物学“活性”形式是:GLP-1-(7-37)和GLP-1-(7-36)NH2
GLP-1受体激动剂是一类模拟胰高血糖素样肽作用的抗糖尿病剂。GLP-1是在消化期间从肠道释放后影响身体的若干种天然存在的肠降血糖素化合物中的一种天然存在的肠降血糖素化合物。通过结合并激活GLP-1受体,GLP-1受体激动剂能够降低血糖水平,从而帮助T2DM患者达到血糖控制。如本文所使用的,术语“GLP-1受体激动剂”是指至少GLP-1或其功能片段、GLP-1或其功能片段的氨基酸序列变体以及GLP-1受体的其它多肽激动剂(例如,exedin-4和其变体)。本公开提供了包括GLP-1受体激动剂的一个或多个拷贝的融合蛋白,以及编码此类融合蛋白的多核苷酸和载体。在一些实施例中,融合蛋白包括编码融合蛋白的多核苷酸序列,所述融合蛋白包括(a)前导序列,所述前导序列包括分泌信号肽;(b)胰高血糖素样肽-1(GLP-1)受体激动剂;以及(c)融合结构域。在一个实施例中,GLP-1受体激动剂包括凝血酶前导序列、GLP-1受体激动剂以及IgG Fc或其功能变体。在另一个实施例中,融合蛋白包括凝血酶前导序列、GLP-1受体激动剂以及白蛋白或其功能变体。在另一个实施例中,融合蛋白包括凝血酶前导序列、GLP-1受体激动剂的两个拷贝和白蛋白或其功能变体。
在一些实施例中,GLP-1受体激动剂包含变体,所述变体可以包含与本文所述的或本领域已知的GLP-1核酸或氨基酸序列至多约10%变化,所述变体保留野生型序列的功能。如本文所使用的,“保留功能”意指核酸或氨基酸以与野生型序列相同的方式起作用,尽管不一定在同一表达或活性水平下。例如,在一个实施例中,与野生型序列相比,功能变体具有增加的表达或活性。在另一个实施例中,与野生型序列相比,功能变体具有降低的表达或活性。在一个实施例中,与野生型序列相比,功能变体的表达或活性具有10%、20%、30%、40%、50%、60%、70%、80%、90%或更大的增加或减少。
将GLP-1受体激动剂与稳定融合结构域融合的若干种人药物在本领域中是已知的。这些人药物包含阿必鲁肽、利拉鲁肽、度拉鲁肽和利西拉肽(还以其化学名称去-38-脯氨酸-艾塞那肽-4(钝尾毒蜥(Heloderma suspectum))-(1-39)-肽基五-L-赖氨酰-L-赖氨酰胺(des-38-proline-exendin-4(Heloderma suspectum)-(1–39)-peptidylpenta-L-lysyl-L-lysinamide)已知)。度拉鲁肽是二硫化物结合的同二聚体融合肽,其中每个单体由一个GLP-1类似物部分和一个IgG4 Fc区组成。Yu M等人(2018)GLP-1递送技术之战(Battle of GLP-1delivery technologies),《先进的药物递送综述(Adv.DrugDeliv.Rev)》。图1A中示出了度拉鲁肽的示意图。参见WO 2005/000892A2,所述文献通过引用并入本文。
阿必鲁肽是由与人白蛋白融合的GLP-1类似物的两个拷贝构成的重组蛋白。分子在GLP-1类似物的两个拷贝中都具有Gly8至Ala取代,以改进对DPP-4降解的抗性。图1B中示出了阿必鲁肽的示意图。
在一个实施例中,融合物包括GLP-1类似物与异源序列的组合。GLP-1类似物意指与天然人GLP-1(7-37)共享至少90%、95%、97%、98%、99%或100%同一性的多肽。在一个实施例中,与天然序列相比,GLP-1类似物具有最多1个、2个或3个氨基酸取代。天然人GLP-1(1-37)具有HDEFERHAEGTFTSDVSSYLEGQAAKEFIAWLVKGRG(SEQ ID NO:1)的序列,其中GLP-1(7-37)具有HAEGTFTSDVSSYLEGQAAKEFIAWLVKGRG(SEQ ID NO:2)的序列。在一些实施例中,令人期望的是改变天然GLP-1序列以优化其一个或多个特征。例如,在一个实施例中,与天然序列相比,GLP-1类似物含有选自A8G、G22E和R36G的一个、两个或三个氨基酸取代。这些取代已经显示出改善GLP-1的临床特征的功效,包含保护免于DPP-4失活(A8G)、增加的溶解度(G22E)以及通过用甘氨酸残基取代位置36处的精氨酸(R36G)以去除潜在的T细胞表位来降低免疫原性。在一个实施例中,GLP-1类似物是GLP-1的DPP-IV抗性变体。在一个实施例中,GLP-1类似物具有包括SEQ ID NO:3:HGEGTFTSDVSSYLEEQAAKEFIAWLVKGGG或由其组成的序列。在另一个实施例中,GLP-1类似物具有包括SEQ ID NO:4:HGEGTFTSDVSSYLEGQAAKEFIAWLVKGRG或由其组成的序列。在另一个实施例中,GLP-1受体激动剂具有包括SEQ ID NO:5:HGEGTFTSDLSKQMEEEAVRL FIEWLKNGGPSSGAPPPS或其功能变体或由其组成的序列。在一个实施例中,变体与SEQ ID NO:5共享至少90%同一性、95%同一性、97%同一性、98%同一性、99%同一性或100%同一性。在另一个实施例中,GLP-1受体激动剂具有包括SEQ ID NO:6:HGEGTFTSDLSKQMEEEAVRLFIEWLKNGGPSSGAPPSKKKKKK或其功能变体或由其组成的序列。在一个实施例中,变体与SEQ ID NO:6共享至少90%同一性、95%同一性、97%同一性、98%同一性、99%同一性或100%同一性。在一个实施例中,GLP-1类似物的多于一个拷贝存在于融合蛋白中。在另一个实施例中,GLP-1受体激动剂是GLP-1(7-37)或其DPP-IV抗性变体的两个串联拷贝。
融合蛋白可以包括前导序列,所述前导序列可以包括分泌信号肽。如本文所使用的,术语“前导序列”是指多肽的任何N末端序列。
前导序列可以源自最终打算施用的相同物种,例如,人。如本文所使用的,术语“源性”或“源自”是指序列或蛋白质来源于特定受试者物种或与来源于特定受试者物种的蛋白质或序列共享同一序列。例如,“源自”人的前导序列与如在人中表达的相同前导序列共享同一序列(或其变体,如本文所定义的)。然而,指定的核酸或氨基酸实际上不需要来源于人。本领域已知能够产生期望序列的各种技术,包含诱变类似蛋白质(例如,同源物)或人工产生核酸或氨基酸序列。“衍生的”核酸或氨基酸在其“所衍生”的物种中保留相同核酸或氨基酸的功能,而不管衍生序列的实际来源。
术语“氨基酸取代”和其同义词旨在涵盖通过用另一个取代氨基酸置换一个氨基酸来修饰氨基酸序列。取代可以是保守取代。所述取代还可以是非保守取代。关于两个氨基酸,术语保守旨在意指氨基酸共享本领域技术人员公认的共同性质。例如,具有疏水性非酸性侧链的氨基酸、具有疏水性酸性侧链的氨基酸、具有亲水性非酸性侧链的氨基酸、具有亲水性酸性侧链的氨基酸以及具有亲水性碱性侧链的氨基酸。共同性质还可以是具有疏水性侧链的氨基酸、具有脂肪族疏水性侧链的氨基酸、具有芳香族疏水性侧链的氨基酸、具有极性中性侧链的氨基酸、具有带电侧链的氨基酸、具有带电酸性侧链的氨基酸以及具有带电碱性侧链的氨基酸。天然存在的氨基酸和非天然存在的氨基酸两者在本领域中都是已知的并且可以在各实施例中用作取代氨基酸。用于置换氨基酸的方法是本领域技术人员熟知的,并且包含但不限于编码氨基酸序列的核苷酸序列的突变。在本文中提及“一个或多个”旨在涵盖例如1个、2个、3个、4个、5个、6个或更多个的单独实施例。
在一个实施例中,前导序列是人凝血酶(因子II)序列。在一个实施例中,凝血酶前导序列具有带有最多1个、2个或3个氨基酸取代的SEQ ID NO:7:MAHVRGLQLPGCLALAALCSLVHSQHVFLAPQQARSLLQRVRR或其功能变体中所示的序列。在一些实施例中,前导序列包括信号肽和前肽。在一个实施例中,前导序列的分泌信号肽包括人凝血酶信号肽。在一个实施例中,信号肽是具有最多1个、2个或3个氨基酸取代的MAHVRGLQLPGCLALAALCSLVHS(SEQ IDNO:8)或其功能变体。在另一个实施例中,前导序列包括人凝血酶前肽。在一个实施例中,前肽具有带有最多1个、2个或3个氨基酸取代的QHVFLAPQQARSLLQRVRR(SEQ ID NO:9)或其功能变体的序列。
在一个实施例中,前导序列是人IL-2序列。在一个实施例中,IL-2前导序列具有带有最多1个、2个或3个氨基酸取代的SEQ ID NO:10:MYRMQLLSCIALSLALVTNS或其功能变体中所示的序列。
在一个实施例中,期望的前导序列的功能变体包含变体,所述变体可以包含与本文所述的或本领域已知的前导核酸或氨基酸序列至多约10%变化,所述变体保留野生型序列的功能。
在一些实施例中,前肽和GLP-1肽两者的编码区被掺入到单个核酸序列中,而在前肽的编码序列与GLP-1的编码序列之间没有连接子。
融合蛋白进一步包含融合结构域。在一个实施例中,融合结构域是人IgG Fc片段或其功能变体。免疫球蛋白通常具有较长的体内循环半衰期。通过将GLP-1受体激动剂(和前导序列)与IgG Fc融合,融合蛋白的循环时间被延长,同时GLP-1的功能被保留。在另一个实施例中,融合结构域是恒河猴IgG Fc片段或其功能变体。
如本文所使用的,免疫球蛋白的Fc部分具有免疫学领域中通常给予所述术语的含义。具体地,此术语是指不含有来自抗体的两个抗原结合区(Fab片段)的抗体片段。Fc部分由来自两条重链的抗体的恒定区组成,所述两条重链通过非共价相互作用和二硫键缔合。Fc部分可以包含铰链区并且通过CH2和CH3结构域延伸到抗体的c末端。Fc部分可以进一步包含一个或多个糖基化位点。在一个实施例中,融合结构域是人IgG Fc。高度保守的四个亚类IgG1、IgG2、IgG3和IgG4在其恒定区方面,特别是在其铰链和上部CH2结构域方面有所不同。参见,Vidarsson等人,IgG亚型和同种型:从结构到效应子功能(IgG Subclasses andAllotypes:From Structure to Effector Functions),《免疫学前沿(Front Immunol.)》2014年10月;5:520,所述文献通过引用并入本文。Fc结构域可以源自任何人IgG,包含人IgG1、人IgG2、人IgG3或人IgG4。在一个实施例中,人IgG Fc是IgG4 Fc。在一个实施例中,人IgG Fc是SEQ ID NO:11:
AESKYGPPCPPCPAPEAAGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSQEDPEVQFNWYVDGVEVHNAKTKPREEQFNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKGLPSSIEKTISKAKGQPREPQVYTLPPSQEEMTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSRLTVDKSRWQEGNVFSCSVMHEALHNHYTQKSLSLSLG。在另一个实施例中,人IgG Fc与SEQ ID NO:11共享至少90%同一性、至少95%同一性、至少99%同一性或至少100%同一性。
在另一个实施例中,融合结构域是恒河猴IgG Fc。Fc结构域可以源自任何恒河猴IgG,包含恒河猴IgG1、恒河猴IgG2、恒河猴IgG3或恒河猴IgG4。在一个实施例中,恒河猴IgGFc是IgG4 Fc。在一个实施例中,恒河猴IgG Fc是SEQ ID NO:17:PPCPPCPAPE LLGGPSVFLFPPKPKDTLMI SRTPEVTCVV VDVSQEDPEVQFNWYVDGVE VHNAQTKPRE RQFNSTYRVV SVLTVTHQDWLNGKEYTCKVSNKGLPAPIE KTISKAKGQP REPQVYILPP PQEELTKNQV SLTCLVTGFYPSDIAVEWESNGQPENTYKT TPPVLDSDGS YLLYSKLTVN KSRWQPGNIFTCSVMHEALH NHYTQKSLSV SPGK。在另一个实施例中,恒河猴IgG Fc与SEQ ID NO:17共享至少90%同一性、至少95%同一性、至少99%同一性或至少100%同一性。在一个实施例中,恒河猴IgG进一步包括铰链序列。
在另一个实施例中,融合结构域是人白蛋白或其功能变体。在一个实施例中,人白蛋白是SEQ ID NO:12:
DAHKSEVAHRFKDLGEENFKALVLIAFAQYLQQCPFEDHVKLVNEVTEFAKTCVADESAENCDKSLHTLFGDKLCTVATLRETYGEMADCCAKQEPERNECFLQHKDDNPNLPRLVRPEVDVMCTAFHDNEETFLKKYLYEIARRHPYFYAPELLFFAKRYKAAFTECCQAADKAACLLPKLDELRDEGKASSAKQRLKCASLQKFGERAFKAWAVARLSQRFPKAEFAEVSKLVTDLTKVHTECCHGDLLECADDRADLAKYICENQDSISSKLKECCEKPLLEKSHCIAEVENDEMPADLPSLAADFVESKDVCKNYAEAKDVFLGMFLYEYARRHPDYSVVLLLRLAKTYETTLEKCCAAADPHECYAKVFDEFKPLVEEPQNLIKQNCELFEQLGEYKFQNALLVRYTKKVPQVSTPTLVEVSRNLGKVGSKCCKHPEAKRMPCAEDYLSVVLNQLCVLHEKTPVSDRVTKCCTESLVNRRPCFSALEVDETYVPKEFNAETFTFHADICTLSEKERQIKKQTALVELVKHKPKATKEQLKAVMDDFAAFVEKCCKADDKETCFAEEGKKLVAASQAALGL。在另一个实施例中,人白蛋白与SEQ ID NO:12共享至少90%同一性、至少95%同一性、至少99%同一性或至少100%同一性。
本公开的融合蛋白的体内功能和稳定性可以通过添加小肽连接子来优化,例如,以防止潜在地不想要的结构域相互作用或出于其它原因。另外,富含甘氨酸的连接子可以提供一些结构柔性,使得GLP-1类似物部分可以与如胰腺的β细胞等靶细胞上的GLP-1受体有效地相互作用。因此,在一个实施例中,GLP-1类似物的C末端和融合蛋白的融合结构域的N末端通过连接子融合。在一个实施例中,连接子包含具有序列GGGGSGGGGSGGGGS(SEQ IDNO:13)的富含G的肽连接子的1个、1.5个或2个重复序列。
在一个实施例中,融合蛋白包括(a)人凝血酶前导序列;(b)GLP-1(7-37)的DPP-IV抗性变体、连接子;以及(c)人IgG Fc。在一个实施例中,融合蛋白具有SEQ ID NO:14的序列或与其至少90%、至少95%、至少98%或至少99%相同的序列。
SEQ ID NO:14
MAHVRGLQLPGCLALAALCSLVHSQHVFLAPQQARSLLQRVRRHGEGTFTSDVSSYLEEQAAKEFIAWLVKGGGGGGGSGGGGSGGGGSAESKYGPPCPPCPAPEAAGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSQEDPEVQFNWYVDGVEVHNAKTKPREEQFNSTYRVVSVLTVLHQDWLNGKEYKCKVSNKGLPSSIEKTISKAKGQPREPQVYTLPPSQEEMTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSRLTVDKSRWQEGNVFSCSVMHEALHNHYTQKSLSLSLG
在一个实施例中,编码融合蛋白的序列是SEQ ID NO:15或与其至少75%、至少85%、至少90%、至少95%、至少98%或至少99%相同的序列。
SEQ ID NO:15:
atggctcacgttcgaggactgcagctgcctggatgtctggctcttgccgctctgtgtagcctggtgcacagccagcacgtgtttctggctcctcagcaagccagatcactgctgcagagagttagaaggcacggcgagggcacctttacctccgacgtgtctagctacctggaagaacaggccgccaaagagtttatcgcctggctggtcaaaggtggcggcggaggcggaggaagcggtggcggaggttcaggtggtggtggatctgccgagtctaagtacggccctccttgtcctccctgtcctgctcccgaagctgctggcggcccatccgtgtttctgttccctccaaagcctaaggacaccctgatgatcagcagaacccctgaagtgacctgcgtggtggtcgacgtgtcccaagaggatcctgaggtgcagttcaattggtacgtggacggcgtggaagtgcacaacgccaagaccaagcctagagaggaacagttcaacagcacctacagagtggtgtccgtgctgaccgtgctgcaccaggattggctgaacggcaaagagtacaagtgcaaggtgtccaacaagggcctgcctagctccatcgagaaaaccatcagcaaggccaagggccagccaagagaaccccaggtgtacacactgcctccaagccaagaggaaatgaccaagaaccaggtgtccctgacctgcctcgtgaagggcttctacccttccgatatcgccgtggaatgggagagcaatggccagcctgagaacaactacaagaccacacctcctgtgctggacagcgacggctcattcttcctgtacagcagactgaccgtggacaagagcagatggcaagagggcaacgtgttcagctgcagcgtgatgcacgaggccctgcacaaccactacacccagaagtctctgagcctgagcctgggc
在一个实施例中,融合蛋白包括(a)人凝血酶前导序列;(b)GLP-1(7-37)的DPP-IV抗性变体、连接子;以及(c)恒河猴IgG Fc。在一个实施例中,融合蛋白包括(a)恒河猴凝血酶前导序列;(b)GLP-1(7-37)的DPP-IV抗性变体、连接子;以及(c)恒河猴IgG Fc。
在一个实施例中,融合蛋白具有SEQ ID NO:37的序列或与其至少90%、至少95%、至少98%或至少99%相同的序列。
SEQ ID NO:37
MAHVRGLQLPGCLALAALCSLVHSQHVFLAPQQALSLLQRVRRHGEGTFTSDVSSYLEEQAAKEFIAWLVKGGGGGGGSGGGGSGGGGSAEFTPPCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVVVDVSQEDPEVQFNWYVDGVEVHNAQTKPRERQFNSTYRVVSVLTVTHQDWLNGKEYTCKVSNKGLPAPIEKTISKAKGQPREPQVYILPPPQEELTKNQVSLTCLVTGFYPSDIAVEWESNGQPENTYKTTPPVLDSDGSYLLYSKLTVNKSRWQPGNIFTCSVMHEALHNHYTQKSLSVSPG
在一个实施例中,编码融合蛋白的序列是SEQ ID NO:36或与其至少75%、至少85%、至少90%、至少95%、至少98%或至少99%相同的序列。
SEQ ID NO:36
atggctcacgttcgaggactgcagctgcctggatgtctggctcttgccgctctgtgtagcctggtgcacagccagcatgtgtttctggctcctcaacaagccctgagcctgctgcaaagagttagaaggcacggcgagggcaccttcacctccgacgtgtccagctacctggaagaacaggccgccaaagagtttatcgcctggctggtcaaaggcggtggtggtggcggaggatctggcggaggtggaagcggcggaggcggatctgctgagtttacacctccttgtcctccctgtcctgctcccgagctgctcggaggcccttccgtgtttctgttccctccaaagcctaaggacaccctgatgatcagcagaacccctgaagtgacctgcgtggtcgtggacgtgtcccaagaggatcctgaggtgcagttcaattggtacgtggacggcgtggaagtgcacaacgcccagacaaagcccagagagcggcagttcaacagcacctacagagtggtgtccgtgctgaccgtgacacaccaggattggctgaacggcaaagagtacacctgtaaagtctccaacaagggcctgcctgctcctatcgagaaaaccatcagcaaggccaagggccagcctagagaaccccaggtgtacatcctgcctccacctcaagaggaactgaccaagaaccaggtgtccctgacctgtctggtcaccggcttctacccttccgatatcgccgtggaatgggagagcaacggacagcccgagaacacctacaagaccacacctccagtgctggacagcgacggcagctatctgctgtactccaagctgacagtgaacaagagccggtggcagcccggcaacatcttcacctgttctgtgatgcacgaggccctgcacaaccactacacccagaagtctctgagcgtcagccctggc
在一个实施例中,融合蛋白包括(a)人凝血酶前导序列;(b)GLP-1(7-37)的DPP-IV抗性变体、连接子;以及(c)人白蛋白。在另一个实施例中,融合蛋白包括融合蛋白包括(a)人凝血酶前导序列;(b)人GLP-1(7-37)或其DPP-IV抗性变体的两个串联拷贝、连接子;以及(c)人白蛋白。
当期望前导序列、GLP-1受体激动剂或融合结构域的变体或片段时,可以使用野生型核酸序列的定点诱变来产生这些肽的编码序列。可替代地或另外,基于网络的或可商购获得的计算机程序以及基于服务的公司可以用于将氨基酸序列反向翻译为核酸编码序列,包含RNA和/或cDNA两者。参考,例如通过EMBOSS,ebi.ac.uk/Tools/st/;Gene Infinity(geneinfinity.org/sms-/sms_backtranslation.html);ExPasy(expasy.org/tools/)的backtranseq。在一个实施例中,RNA和/或cDNA编码序列被设计成在最终打算施用的受试者物种(例如,人类)中进行最佳表达。
可以使用密码子优化将编码序列设计用于最佳表达。密码子优化的编码区可以通过各种不同的方法来设计。可以使用在线可获得的方法、公开的方法或提供密码子优化服务的公司来进行此优化。例如在国际专利申请公开第WO 2015/012924号中描述了一种密码子优化方法,所述国际专利申请公开通过引用并入本文。简而言之,用同义密码子序列修饰编码产物的核酸序列。适合地,对产物的开放阅读框(ORF)的整个长度进行修饰。然而,在一些实施例中,仅ORF的片段可以被改变。通过使用这些方法中的一种方法,可以将频率应用于任何给定的多肽序列,并且产生编码多肽的经密码子优化的编码区的核酸片段。
除了本文所提供的前导序列、GLP-1受体激动剂、融合结构域和融合蛋白之外,还提供了编码这些多肽的核酸序列。在一个实施例中,提供了一种编码本文所述的GLP-1肽的核酸序列。在一些实施例中,所述核酸序列可以包含编码SEQ ID NO:1的GLP-1序列的任何核酸序列。在另一个实施例中,所述核酸序列包含包括SEQ ID NO:2的GLP-1序列的任何核酸。在另一个实施例中,所述核酸序列包含包括SEQ ID NO:3的GLP-1序列的任何核酸。在另一个实施例中,所述核酸序列包含包括SEQ ID NO:4的GLP-1序列的任何核酸。在另一个实施例中,所述核酸序列包含包括SEQ ID NO:5的GLP-1序列的任何核酸。在另一个实施例中,所述核酸序列包含包括SEQ ID NO:6的GLP-1序列的任何核酸。
在一个实施例中,提供了一种编码本文所述的GLP-1融合蛋白的核酸序列。在另一个实施例中,所述核酸序列包含编码SEQ ID NO:14的GLP-1融合蛋白的任何核酸序列。
表达盒
在另一方面,本文提供了一种表达盒,所述表达盒包括编码如本文所述的GLP-1融合蛋白的核酸。如本文所使用的,“表达盒”是指包括生物学上有用的核酸序列(例如,编码蛋白质、酶或其它有用的基因产物的基因cDNA、mRNA等)和与其可操作地连接的调控序列的核酸分子,所述调控序列指导或调节核酸序列和其基因产物的转录、翻译和/或表达。如本文所使用的,“可操作地连接的”序列包含与核酸序列邻接或非邻接的调控序列(也称为元件)以及以反式或顺式核酸序列起作用的调控序列两者。此类调控序列通常包含例如以下中的一者或多者:启动子、增强子、转录因子、转录终止子、内含子、增强翻译效率的序列(即,Kozak共有序列)、有效的RNA加工信号(如切片和聚腺苷酸化序列)、稳定细胞质mRNA的序列(例如,土拨鼠肝炎病毒(WHP)翻译后调控元件(WPRE))和TATA信号。表达盒可以含有基因序列上游(5'处)的调控序列,例如,启动子、增强子、内含子等中的一者或多者以及增强子中的一个或多个,或基因序列下游(3'处)的调控序列,例如,包括聚腺苷酸化位点的3'非翻译区(3'UTR),以及其它元件。在某些实施例中,调控序列与基因产物的核酸序列可操作地连接,其中调控序列通过插入的核酸序列,即5'非翻译区(5'UTR)与基因产物的核酸序列分离。在某些实施例中,表达盒包括一种或多种基因产物的核酸序列。在一些实施例中,表达盒可以是单顺反子表达盒或双顺反子表达盒。在其它实施例中,术语“转基因”是指来自外源的插入到靶细胞中的一个或多个DNA序列。
在一个实施例中,表达盒是指包括GLP-1构建体编码序列(例如,GLP-1融合蛋白的编码序列)、启动子的核酸分子,并且可以包含其的其它调控序列,所述盒可以被工程化到遗传元件中和/或包装到病毒载体(例如,病毒颗粒)的衣壳中。通常,用于产生病毒载体的这种表达盒含有本文所述的GLP-1构建体序列和其它表达控制序列(如本文所述的表达控制序列),所述GLP-1构建体序列侧接病毒基因组(并且被称为“载体基因组”)的包装信号。可以使用本领域已知的技术针对特定物种优化任何表达控制序列,所述技术包含例如密码子优化,如本文所述。
在某些实施例中,表达盒包含组成型启动子。在另一个实施例中,使用CB7启动子。CB7是具有巨细胞病毒增强子元件的鸡β-肌动蛋白启动子。在一些实施例中,CB7启动子具有SEQ ID NO:33的核酸序列。在一个实施例中,启动子是CMV启动子。在一些实施例中,CMV启动子是SEQ ID NO:27的核酸序列。
在另一个实施例中,使用组织特异性启动子。可替代地,可以使用其它肝脏特异性启动子,如在冷泉港的肝脏特异性基因启动子数据库(the Liver Specific GenePromoter Database,Cold Spring Harbor)(rulai.schl.edu/LSPD)中列出的肝脏特异性启动子,并且包含但不限于α1抗胰蛋白酶(A1AT);人白蛋白(Miyatake等人,《病毒学杂志(J.Virol.)》,71:5124 32(1997)),humAlb;乙型肝炎病毒核心启动子(Sandig等人,《基因疗法(Gene Ther.)》,3:1002 9(1996));TTR最小增强子/启动子,α-抗胰蛋白酶启动子,肝脏特异性启动子(LSP)(Wu等人《分子疗法(Mol Ther.)》16:280-289(2008)),TBG肝脏特异性启动子。如病毒启动子、组成型启动子、可调控启动子(参见例如,WO 2011/126808和WO2013/04943)等其它启动子或对生理学线索有应答的启动子可以用于本文所述的载体中。
在一个实施例中,启动子包括在诱导型基因表达系统中。诱导型基因调控/表达系统含有至少以下组分:与编码本文所述的GLP-1融合蛋白的转基因可操作地连接的启动子(也称为可调控启动子)、激活结构域、DNA结合结构域和锌指同源结构域结合位点。在其它实施例中,另外的组分可以包含在表达系统中,如本文进一步描述的。图4中示出了显示示例性诱导型表达系统设计的质粒。
系统包括GLP-1融合蛋白的编码序列上游的启动子。可以使用本文所述的启动子,如CMV和CB7启动子。在一个实施例中,启动子是CMV启动子,如SEQ ID NO:27中所示的启动子。在另一个实施例中,启动子是普遍存在的诱导型启动子Z12I,其包括ZFHD1和IL2最小启动子的结合位点的12个重复拷贝。参见例如,Chen等人,《人类基因疗法方法(Hum GeneTher Methods.)》2013年8月;24(4):270–278,所述文献并入本文。
表达系统包括激活结构域,所述激活结构域优选地位于DNA结合结构域的上游。在一个实施例中,激活结构域是来自NF-κB的p65亚基的羧基末端与FKBP12-雷帕霉素相关蛋白(FRAP)的FKBP12-雷帕霉素结合(FRB)结构域的融合物。在一个实施例中,激活结构域是与来自人的NF-κB的p65亚基的羧基末端融合的人FKBP12-雷帕霉素相关蛋白(FRAP)的FKBP12-雷帕霉素结合(FRB)结构域。在一个实施例中,FRB结构域具有SEQ ID NO:24中所示的氨基酸序列。在一个实施例中,FRB结构域具有由SEQ ID NO:23的核酸序列编码的SEQ IDNO:24中所示的氨基酸序列。在一个实施例中,p65亚基具有SEQ ID NO:26中所示的序列。在一个实施例中,p65亚基具有由SEQ ID NO:25的核酸序列编码的SEQ ID NO:26中所示的序列。
诱导型系统可以包括在包括融合蛋白的编码序列的单个载体中,或包括在双载体系统中。本文描述了掺入GLP1融合蛋白的2-载体(图6A)和1-载体(图6B和图7A)系统的实例。
在一个实施例中,在反式激活结构域与DNA结合结构域之间存在连接子,所述连接子可以是F2A或IRES。在一个实施例中,连接子选自IRES或2A肽。在一个实施例中,连接子是可切割的2A肽。在一个实施例中,连接子包括GT2A_V1肽,其包括SEQ ID NO:21的氨基酸序列。在一个实施例中,连接子包括GT2A_V2肽,其包括SEQ IDNO:22的氨基酸序列。在一个实施例中,选择2A肽以增加包装限制,从而允许单个载体系统。
DNA结合结构域由锌指同源结构域1(ZFHD1)与FK506结合蛋白(FKBP)的至多三个拷贝连接的DNA结合融合物构成。在存在诱导剂(例如,雷帕霉素类似物,如雷帕霉素)的情况下,DNA结合结构域和激活结构域通过其FKBP和FRB结构域的相互作用而二聚化,从而导致转基因的转录激活。在一些实施例中,ZFHD1包含在具有GT2A或IRES的框架中。在一个实施例中,ZFHD1具有SEQ ID NO:29中所示的序列。在一个实施例中,ZFHD1具有由SEQ ID NO:28的核酸序列编码的SEQ ID NO:28的序列。
表达系统被设计成具有FKBP序列的一个、两个或三个拷贝。这些在本文中称为FKBP亚基。在一个实施例中,亚基被设计成表达相同的蛋白质但具有彼此不同的核酸,以使重组最小化。例如,SEQ ID NO:30提供了FKBP的3个“摆动的”编码序列,所述编码序列中的每个序列编码SEQ ID NO:31:GVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKFDSSRDRNKPFKFMLGKQEVIRGWEEGVAQMSVGQRAKLTISPDYAYGATGHPGIIPPHATLVFDVELLKLE中所示的序列。
表达系统进一步包括锌指同源结构域结合位点。核酸分子含有至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个或12个ZFHD结合位点。在一个实施例中,表达系统含有8(八)个锌指同源结构域结合位点(结合配偶体)(8XZFHD)。然而,本发明涵盖具有锌指结合位点的二至约十二个拷贝的表达系统。ZFHD结合位点的单个拷贝的实例是:aatgatgggcgctcgagt(SEQ ID NO:32)。
在一些实施例中,在锌指同源结构域结合位点的下游存在最小IL2启动子。示例性IL2启动子示出于SEQ ID NO:10中。
此类诱导型系统在本领域中是已知的,并且包含例如由以下文献描述的雷帕霉素诱导型系统:例如,Rivera等人,用于基因表达的药理学控制的人源化系统(A humanizedsystem for pharmacologic control of gene expression),《自然医学(NatureMedicine)》第2卷,第1028-1032页(1996年9月)以及Rivera等人,在AAV介导的基因转移后灵长类动物的促红细胞生成素的长期药理学调控的表达(Long-term pharmacologicallyregulated expression of erythropoietin in primates following AAV-mediatedgene transfer),《血液(Blood)》,2005年2月15日,第105卷,第4期,这两个文献均通过引用并入本文。在一个实施例中,诱导型基因表达系统包括CMV启动子,激活结构域是与来自人的NF-κB的p65亚基的羧基末端融合的人FKBP12-雷帕霉素相关蛋白(FRAP)的FKBP12-雷帕霉素结合(FRB)结构域、GT2A肽、ZFHD1 DNA结合结构域、三个FKBP亚基、hGH poly A、8XZFHD和最小sIL2启动子。这些序列除了GLP-1融合蛋白的编码序列以及任选地其它调控序列之外。
除了启动子之外,表达盒和/或载体还可以含有其它适当的转录起始、终止、增强子序列、如剪接和聚腺苷酸化(polyA)信号等的有效RNA加工信号;稳定细胞质mRNA的序列;增强翻译效率的序列(即,Kozak共有序列);增强蛋白质稳定性的序列;以及在期望时,增强经过编码的产物的分泌的序列。合适的polyA序列的实例包含例如SV40、牛生长激素(bGH)、人生长激素(hGH)、SV40、兔β-珠蛋白(也称为兔珠蛋白polyA;RGB)、经修饰的RGB(mRGB)和TK polyA。合适的增强子的实例包含例如α-胎蛋白增强子、TTR最小启动子/增强子、LSP(TH结合球蛋白启动子/α1微球蛋白/双库尼茨抑制剂增强子)等。在一个实施例中,polyA是兔珠蛋白polyA。
这些控制序列与GLP-1构建体序列“可操作地连接”。如本文所使用的,术语“可操作地连接”是指与所关注基因邻接的表达控制序列以及以反式或在远处起作用以控制所关注基因的表达控制序列两者。
在一个实施例中,提供了rAAV,所述rAAV包含5'ITR、CB7启动子、鸡β-肌动蛋白内含子、SEQ ID NO:14的融合蛋白的编码序列、兔珠蛋白poly A和3'ITR。在另一个实施例中,rAAV包括包含CMV启动子的多核苷酸,激活结构域是与来自人的NF-κB的p65亚基的羧基末端融合的人FKBP12-雷帕霉素相关蛋白(FRAP)的FKBP12-雷帕霉素结合(FRB)结构域、GT2A肽、ZFHD1 DNA结合结构域、三个FKBP亚基、hGH poly A、8XZFHD、最小sIL2启动子、SEQ IDNO:14的GLP-1融合蛋白的编码序列和兔β球蛋白polyA。
在一个实施例中,提供了一种表达盒,所述表达盒包含多核苷酸,所述多核苷酸包括CB7启动子、鸡β-肌动蛋白内含子、SEQ ID NO:14的融合蛋白的编码序列和兔珠蛋白polyA。在一个实施例中,表达盒是发现于SEQ ID NO:34中的表达盒,或共享与其至少70%、75%、80%、85%、90%、95%、99%或100%同一性的序列。在另一个实施例中,提供了一种载体基因组,其中SEQ ID NO:34或共享与其至少70%、75%、80%、85%、90%、95%、99%或100%同一性的序列侧接5'和3'AAV ITR。
在另一个实施例中,提供了一种表达盒,所述表达盒包含多核苷酸,所述多核苷酸包括CB7启动子、鸡β-肌动蛋白内含子、SEQ ID NO:37的融合蛋白的编码序列和兔珠蛋白poly A。在一个实施例中,表达盒是发现于SEQ ID NO:35中的表达盒,或共享与其至少70%、75%、80%、85%、90%、95%、99%或100%同一性的序列。在另一个实施例中,提供了一种载体基因组,其中SEQ ID NO:35或共享与其至少70%、75%、80%、85%、90%、95%、99%或100%同一性的序列侧接5'和3'AAV ITR。
在另一个实施例中,提供了一种表达盒,所述表达盒包含多核苷酸,所述多核苷酸包括CMV启动子、与来自人的NF-κB的p65亚基的羧基末端融合的人FKBP12-雷帕霉素相关蛋白(FRAP)的FKBP12-雷帕霉素结合(FRB)结构域、GT2A肽、ZFHD1 DNA结合结构域、三个FKBP亚基、8XZFHD、最小IL2启动子、SEQ ID NO:14的GLP-1融合蛋白的编码序列和兔β珠蛋白polyA。在一个实施例中,表达盒是发现于SEQ ID NO:38中的表达盒,或共享与其至少70%、75%、80%、85%、90%、95%、99%或100%同一性的序列。在另一个实施例中,提供了一种载体基因组,其中SEQ ID NO:38或共享与其至少70%、75%、80%、85%、90%、95%、99%或100%同一性的序列侧接5'和3'AAV ITR。
在另一个实施例中,提供了一种表达盒,所述表达盒包含多核苷酸,所述多核苷酸包括CMV启动子、与来自人或恒河猴的NF-κB的p65亚基的羧基末端融合的人或恒河猴FKBP12-雷帕霉素相关蛋白(FRAP)的FKBP12-雷帕霉素结合(FRB)结构域、GT2A肽、ZFHD1DNA结合结构域、三个FKBP亚基、8XZFHD、最小IL2启动子、SEQ ID NO:37的GLP-1融合蛋白的编码序列和兔β珠蛋白polyA。在一个实施例中,表达盒是发现于SEQ ID NO:39中的表达盒,或共享与其至少70%、75%、80%、85%、90%、95%、99%或100%同一性的序列。在另一个实施例中,提供了一种载体基因组,其中SEQ ID NO:39或共享与其至少70%、75%、80%、85%、90%、95%、99%或100%同一性的序列侧接5'和3'AAV ITR。
在另一个实施例中,提供了一种表达盒,所述表达盒包含多核苷酸,所述多核苷酸包括Z12I启动子(包括12个ZFHD1位点和最小IL2启动子)、SEQ ID NO:37的GLP-1融合蛋白的编码序列和兔β珠蛋白polyA。在一个实施例中,表达盒是发现于SEQ ID NO:40中的表达盒,或共享与其至少70%、75%、80%、85%、90%、95%、99%或100%同一性的序列。在另一个实施例中,提供了一种载体基因组,其中SEQ ID NO:40或共享与其至少70%、75%、80%、85%、90%、95%、99%或100%同一性的序列侧接5'和3'AAV ITR。提供了一种第二表达盒,所述第二表达盒包含多核苷酸,所述多核苷酸包括CMV启动子、嵌合内含子、与来自人或恒河猴(或其一部分)的NF-κB的p65亚基融合的人或恒河猴FKBP12-雷帕霉素相关蛋白(FRAP)的FKBP12-雷帕霉素结合(FRB)结构域、IRES或2A肽、ZFHD1 DNA结合结构域、三个FKBP亚基、8XZFHD和polyA序列。在一个实施例中,表达盒是发现于SEQ ID NO:41中的表达盒,或共享与其至少70%、75%、80%、85%、90%、95%、99%或100%同一性的序列。在另一个实施例中,提供了一种载体基因组,其中SEQ ID NO:41或共享与其至少70%、75%、80%、85%、90%、95%、99%或100%同一性的序列侧接5'和3'AAV ITR。
病毒载体
在另一方面,提供了包含本文所述的表达盒的病毒载体。在本文所述的病毒载体的某些实施例中,病毒载体是腺相关病毒(AAV)病毒载体或重组AAV(rAAV)。如本文所使用的,术语“重组AAV”或“rAAV”是指天然存在的腺相关病毒、本领域技术人员可获得的和/或鉴于本文所述的组合物和方法可获得的腺相关病毒以及人工AAV。腺相关病毒(AAV)病毒载体是具有AAV蛋白衣壳的AAV DNase抗性颗粒,其中包装有侧接AAV反向末端重复序列(ITR)(一起称为“载体基因组”)的用于递送到靶细胞的表达盒。AAV衣壳由60个衣壳(cap)蛋白亚基VP1、VP2和VP3构成,其以二十面体对称布置,比率为大约1:1:10至1:1:20,取决于所选择的AAV。可以选择各种AAV作为如上文所鉴定的AAV病毒载体的衣壳的来源。在一个实施例中,AAV衣壳是AAVrh91衣壳或其变体。在某些实施例中,衣壳蛋白由rAAV载体名称中的术语“AAV”之后的数字或数字和字母的组合指定。除非另外指明,否则本文所述的AAV衣壳、ITR和其它所选择的AAV组分可以容易地选自任何AAV,包含但不限于鉴定为AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAVrh10、AAVhu37、AAVrh32.33、AAVAnc80、AAV10、AAV11、AAV12、AAVrh8、AAVrh74、AAV-DJ8、AAV-DJ、AAVhu.37、AAVrh.64R1和AAVhu68的AAV。参见例如,美国公开专利申请第2007-0036760-A1号;美国公开专利申请第2009-0197338-A1号;EP 1310571。还参见WO 2003/042397(AAV7和其它猿猴AAV)、美国专利7790449和美国专利7282199(AAV8)、WO 2005/033321和US 7,906,111(AAV9)和WO 2006/110689以及WO2003/042397(rh.10)、WO 2005/033321、WO 2018/160582(AAVhu68),所述文献通过引用并入本文。其它合适的AAV可以包含但不限于AAVrh90[于2020年4月28日提交的PCT/US20/30273]、AAVrh91[于2020年4月28日提交的PCT/US20/030266,现在是于2020年11月5日公开的公开WO 2020/223231]、AAVrh92、AAVrh93、AAVrh91.93[于2020年4月28日提交的PCT/US20/30281],所述文献均通过引用并入本文。其它合适的AAV包含于2019年10月21日提交的美国临时专利申请第62/924,112号和于2020年5月15日提交的美国临时专利申请第63/025,753号中描述的AAV3B变体,所述文献描述了AAV3B.AR2.01、AAV3B.AR2.02、AAV3B.AR2.03、AAV3B.AR2.04、AAV3B.AR2.05、AAV3B.AR2.06、AAV3B.AR2.07、AAV3B.AR2.08、AAV3B.AR2.10、AAV3B.AR2.11、AAV3B.AR2.12、AAV3B.AR2.13、AAV3B.AR2.14、AAV3B.AR2.15、AAV3B.AR2.16或AAV3B.AR2.17,所述文献均通过引用并入本文。还参见于2021年8月13日提交的国际专利申请第PCT/US21/45945号、于2020年8月14日提交的美国临时专利申请第63/065,616号和于2020年11月4日提交的美国临时专利申请第63/109,734号,所述专利申请全都通过引用整体并入本文。这些文档还描述了可以选择用于产生rAAV的其它AAV衣壳,并且通过引用并入。在从人或非人灵长类动物(NHP)中分离或工程化以及良好表征的AAV中,人AAV2是第一个被开发为基因转移载体的AAV;其已被广泛用于不同靶组织和动物模型中的高效基因转移实验。
如本文所使用的,关于AAV,术语“变体”意指源自已知AAV序列的任何AAV序列,包含具有保守氨基酸置换的AAV序列以及与氨基酸或核酸序列共享至少90%、至少95%、至少97%、至少99%或更高的序列同一性的AAV序列。在另一个实施例中,AAV衣壳包含变体,所述变体可以包含与任何所描述或已知的AAV衣壳序列至多约10%变化。也就是说,AAV衣壳与本文所提供的和/或本领域已知的AAV衣壳共享约90%同一性至约99.9%同一性、约95%至约99%同一性或约97%至约98%同一性。在一个实施例中,AAV衣壳与AAV衣壳共享至少95%同一性。当确定AAV衣壳的同一性百分比时,可以对任何可变蛋白质(例如,vp1、vp2或vp3)进行比较。
在一个实施例中,病毒载体是具有AAV8的衣壳或其功能变体的rAAV。在一个实施例中,病毒载体是具有AAVrh91的衣壳或其功能变体的rAAV。在一个实施例中,病毒载体是具有AAV3.AR.2.12的衣壳或其功能变体的rAAV。在一个实施例中,病毒载体是具有选自AAV9、AAVrh64R1、AAVhu37或AAVrh10的衣壳的rAAV。
在某些实施例中,提供了新型分离的AAVrh91衣壳。在SEQ ID NO:18中提供了编码AAVrh91衣壳的核酸序列,并且在SEQ ID NO:20中提供了经编码的氨基酸序列。本文提供了一种rAAV,所述rAAV包括AAVrh91(SEQ ID NO:20)的vp1、vp2和vp3中的至少一个。本文还提供了rAAV,所述rAAV包括由AAVrh91(SEQ ID NO:18)的vp1、vp2和vp3中的至少一个编码的AAV衣壳。在又另一个实施例中,在SEQ ID NO:19中提供了编码AAVrh91氨基酸序列的核酸序列,并且在SEQ ID NO:20中提供了经编码的氨基酸序列。本文还提供了rAAV,所述rAAV包括由AAVrh91eng(SEQ ID NO:19)的vp1、vp2和vp3中的至少一个编码的AAV衣壳。在某些实施例中,vp1、vp2和/或vp3是AAVrh91(SEQ ID NO:20)的全长衣壳蛋白。在其它实施例中,vp1、vp2和/或vp3具有N末端和/或C末端截短(例如,约1至约10个氨基酸的截短)。
在某些实施例中,AAVrh91衣壳由以下的一种或多种表征:(1)AAVrh91衣壳蛋白,所述AAVrh91衣壳蛋白包括:选自以下的AAVrh91 vp1蛋白的异质群体:通过由从编码SEQID NO:20的1至736的预测的氨基酸序列的核酸序列表达产生的vp1蛋白,由SEQ ID NO:18产生的vp1蛋白,或由与编码SEQ ID NO:20的1至736的预测的氨基酸序列的SEQ ID NO:18至少70%相同的核酸序列产生的vp1蛋白,选自以下的AAVrh91vp2蛋白的异质群体:通过由从编码SEQ ID NO:20的至少约氨基酸138至736的预测的氨基酸序列的核酸序列表达产生的vp2蛋白,由包括SEQ ID NO:18的至少核苷酸412至2208的序列产生的vp2蛋白,或由与编码SEQ ID NO:20的至少约氨基酸138至736的预测的氨基酸序列的SEQ ID NO:18的至少核苷酸412至2208至少70%相同的核酸序列产生的vp2蛋白,选自以下的AAVrh91 vp3蛋白的异质群体:通过由从编码SEQ ID NO:20的至少约氨基酸203至736的预测的氨基酸序列的核酸序列表达产生的vp3蛋白,由包括SEQ ID NO:18的至少核苷酸607至2208的序列产生的vp3蛋白,或由与编码SEQ ID NO:20的至少约氨基酸203至736的预测的氨基酸序列的SEQID NO:18的至少核苷酸607至2208至少70%相同的核酸序列产生的vp3蛋白;和/或(2)vp1蛋白的异质群体,所述vp1蛋白是编码SEQ ID NO:20的氨基酸序列的核酸序列的产物,vp2蛋白的异质群体,所述vp2蛋白是编码SEQ ID NO:20的至少约氨基酸138至736的氨基酸序列的核酸序列的产物,以及vp3蛋白的异质群体,所述vp3蛋白是编码SEQ ID NO:20的至少氨基酸203至736的核酸序列的产物,其中:所述vp1、vp2和vp3蛋白含有具有氨基酸修饰的亚群体,所述氨基酸修饰包括SEQ ID NO:20中的天冬酰胺-甘氨酸对中的至少两个高度脱酰胺化的天冬酰胺(N);并且任选地进一步包括包含其它脱酰胺化的氨基酸的亚群体,其中脱酰胺化引起氨基酸变化;以及(B)AAVrh91衣壳中的载体基因组,所述载体基因组包括核酸分子,所述核酸分子包括AAV反向末端重复序列和非AAV核酸序列,所述非AAV核酸序列编码与指导产物在宿主细胞中的表达的序列可操作地连接的产物。
在某些实施例中,AAVrh91衣壳由以下的一种或多种表征:(1)AAVrh91衣壳蛋白,所述AAVrh91衣壳蛋白包括:选自以下的AAVrh91 vp1蛋白的异质群体:通过由从编码SEQID NO:20的1至736的预测的氨基酸序列的核酸序列表达产生的vp1蛋白,由SEQ ID NO:19产生的vp1蛋白,或由与编码SEQ ID NO:20的1至736的预测的氨基酸序列的SEQ ID NO:19至少70%相同的核酸序列产生的vp1蛋白,选自以下的AAVrh91vp2蛋白的异质群体:通过由从编码SEQ ID NO:20的至少约氨基酸138至736的预测的氨基酸序列的核酸序列表达产生的vp2蛋白,由包括SEQ ID NO:19的至少核苷酸412至2208的序列产生的vp2蛋白,或由与编码SEQ ID NO:20的至少约氨基酸138至736的预测的氨基酸序列的SEQ ID NO:19的至少核苷酸412至2208至少70%相同的核酸序列产生的vp2蛋白,选自以下的AAVrh91 vp3蛋白的异质群体:通过由从编码SEQ ID NO:20的至少约氨基酸203至736的预测的氨基酸序列的核酸序列表达产生的vp3蛋白,由包括SEQ ID NO:19的至少核苷酸607至2208的序列产生的vp3蛋白,或由与编码SEQ ID NO:20的至少约氨基酸203至736的预测的氨基酸序列的SEQID NO:19的至少核苷酸607至2208至少70%相同的核酸序列产生的vp3蛋白;和/或(2)vp1蛋白的异质群体,所述vp1蛋白是编码SEQ ID NO:20的氨基酸序列的核酸序列的产物,vp2蛋白的异质群体,所述vp2蛋白是编码SEQ ID NO:20的至少约氨基酸138至736的氨基酸序列的核酸序列的产物,以及vp3蛋白的异质群体,所述vp3蛋白是编码SEQ ID NO:20的至少氨基酸203至736的核酸序列的产物,其中:所述vp1、vp2和vp3蛋白含有具有氨基酸修饰的亚群体,所述氨基酸修饰包括SEQ ID NO:20中的天冬酰胺-甘氨酸对中的至少两个高度脱酰胺化的天冬酰胺(N);并且任选地进一步包括包含其它脱酰胺化的氨基酸的亚群体,其中脱酰胺化引起氨基酸变化;以及(B)AAVrh91衣壳中的载体基因组,所述载体基因组包括核酸分子,所述核酸分子包括AAV反向末端重复序列和非AAV核酸序列,所述非AAV核酸序列编码与指导产物在宿主细胞中的表达的序列可操作地连接的产物。
在某些实施例中,AAVrh91 vp1、vp2和vp3蛋白含有具有氨基酸修饰的亚群体,所述氨基酸修饰包括SEQ ID NO:20中的天冬酰胺-甘氨酸对中的至少两个高度脱酰胺化的天冬酰胺(N),并且任选地进一步包括包含其它脱酰胺化的氨基酸的亚群体,其中脱酰胺化引起氨基酸变化。相对于SEQ ID NO:20的编号,在N-G对N57、N383和/或N512处观察到高水平的脱酰胺化。在其它残基中已经观察到脱酰胺化。在某些实施例中,AAVrh91可以具有其它脱酰胺化的残基,例如通常小于10%,和/或可以具有其它修饰,所述其它修饰包含磷酸化(例如,在存在的情况下,在约2%至约30%、或约2%至约20%、或约2%至约10%的范围内)(例如,在S149处)或氧化(例如,在~W22、~M211、W247、M403、M435、M471、W478、W503、~M537、~M541、~M559、~M599、M635和/或W695中的一个或多个处)。任选地,W可以氧化成犬尿氨酸。
表A-AAVrh91脱酰胺化
Figure BDA0004193520790000201
Figure BDA0004193520790000211
在某些实施例中,在所提供的如使用胰蛋白酶使用质谱所确定的范围内,在上表中鉴定的位置中的一个或多个位置中修饰AAVrh91衣壳。在某些实施例中,如本文所述的修饰位置中的一个或多个位置或N之后的甘氨酸。残基数量基于本文所提供的AAVrh91序列。参见,SEQ ID NO:20。
在某些实施例中,AAVrh91衣壳包括:vp1蛋白的异质群体,所述vp1蛋白是编码SEQID NO:20的氨基酸序列的核酸序列的产物,vp2蛋白的异质群体,所述vp2蛋白是编码SEQID NO:20的至少约氨基酸138至736的氨基酸序列的核酸序列的产物,以及vp3蛋白的异质群体,所述vp3蛋白是编码SEQ ID NO:20的至少氨基酸203至736的核酸序列的产物。
在某些实施例中,经修饰的AAVrh91核酸序列用于产生具有比天然AAVrh91衣壳脱酰胺化程度更低的衣壳的突变rAAV。此类突变rAAV可以具有降低的免疫原性和/或增加储存时的稳定性,特别是以悬浮液形式储存时的稳定性。
在一方面,提供了一种重组AAV(rAAV)。rAAV包含来自腺相关病毒rh91的AAV衣壳和包装在所述AAV衣壳中的载体基因组,所述载体基因组包括AAV反向末端重复序列(ITR)、SEQ ID NO:14的GLP-1受体激动剂的编码序列以及指导GLP-1受体激动剂表达的调控序列。
在一个实施例中,rAAV是scAAV。缩写“sc”是指自身互补的。“自身互补的AAV”是指具有其中重组AAV核酸序列携带的编码区已经被设计成形成分子内双链DNA模板的表达盒的质粒或载体。感染后,未等待细胞介导的第二条链合成,而是两条互补的半scAAV将缔合以形成易于立即复制和转录的一条双链DNA(dsDNA)。参见例如,DM McCarty等人,“自身互补的重组腺相关病毒(scAAV)载体独立于DNA合成而促进高效转导(Self-complementaryrecombinant adeno-associated virus(scAAV)vectors promote efficienttransduction independently of DNA synthesis)”,《基因疗法》,(2001年8月),第8卷,第16期,第1248-1254页。在例如美国专利第6,596,535号、第7,125,717号和第7,456,683号中描述了自身互补的AAV,所述美国专利通过引用整体并入本文。
在一个实施例中,编码本文所述的GLP-1构建体的核酸序列被工程化到任何合适的遗传元件中,例如,裸DNA、噬菌体、转座子、粘粒、RNA分子(例如,mRNA)、附加体等,所述遗传元件将其上携带的GLP-1序列转移至宿主细胞,例如,用于在包装宿主细胞中产生携带DNA或RNA的纳米颗粒、病毒载体和/或用于递送到受试者的宿主细胞。在一个实施例中,遗传元件是质粒。所选择的基因元件可以通过任何合适的方法递送,包含转染、电穿孔、脂质体递送、膜融合技术、高速DNA包被的团粒、病毒感染和原生质体融合。用于制备此类构建体的方法对于核酸操纵技术人员而言是已知的并且包含基因工程、重组工程以及合成技术。参见例如,Green和Sambrook,《分子克隆:实验室手册(Molecular Cloning:A LaboratoryManual)》,纽约市冷泉港的冷泉港实验室出版社(Cold Spring Harbor Press,ColdSpring Harbor,NY)(2012)。
如本文所使用的,术语“宿主细胞”可以指包装细胞系,其中由生产质粒产生载体(例如,重组AAV或rAAV)。在替代方案中,术语“宿主细胞”可以指期望表达本文所述的基因产物的任何靶细胞。因此,“宿主细胞”是指原核或真核细胞(例如,细菌细胞、人类细胞或昆虫细胞),所述原核或真核细胞含有通过任何方式(例如,电穿孔、磷酸钙沉淀、显微注射、转化、病毒感染、转染、脂质体递送、膜融合技术、高速DNA包被的团粒、病毒感染和原生质体融合)引入到细胞中的外源性或异源性DNA。在本文中的某些实施例中,术语“宿主细胞”是指用于体外评估本文所述的组合物的各种哺乳动物物种的细胞的培养物。在本文中的其它实施例中,术语“宿主细胞”是指用于产生和包装病毒载体或重组病毒的细胞。在另外的实施例中,术语“宿主细胞”是肠细胞、小肠细胞、胰细胞、肝脏细胞。
如本文所使用的,术语“靶细胞”是指期望表达异源性核酸序列或蛋白质的任何靶细胞。在某些实施例中,靶细胞是肝脏细胞。在其他实施例中,靶细胞是肌细胞。
在一个实施例中,提供了rAAV,所述rAAV包括包含表达盒的载体基因组,其中所述表达盒包括CMV启动子,激活结构域是与来自人的NF-κB的p65亚基的羧基末端融合的人FKBP12-雷帕霉素相关蛋白(FRAP)的FKBP12-雷帕霉素结合(FRB)结构域、GT2A_V1肽、ZFHD1DNA结合结构域、三个FKBP亚基、hGH poly A、8XZFHD、最小sIL2启动子、SEQ ID NO:14的GLP-1融合蛋白的编码序列和兔β珠蛋白polyA。在另一个实施例中,提供了rAAV,所述rAAV包括包含表达盒的载体基因组,其中所述表达盒包括CMV启动子,激活结构域是与来自人的NF-κB的p65亚基的羧基末端融合的人FKBP12-雷帕霉素相关蛋白(FRAP)的FKBP12-雷帕霉素结合(FRB)结构域、GT2A_V2肽、ZFHD1 DNA结合结构域、三个FKBP亚基、hGH poly A、8XZFHD、最小sIL2启动子、SEQ ID NO:14的GLP-1融合蛋白的编码序列和兔β珠蛋白polyA。
将表达盒包装到AAV病毒颗粒中所需的最小序列是与衣壳具有相同AAV起源或具有不同AAV起源(以产生AAV假型)的AAV 5'和3'ITR。在一个实施例中,来自AAV2的ITR序列或其删除版本(ΔITR)是为方便起见采用的,并且为了加快监管审批。然而,可以选择来自其它AAV来源的ITR。优选地,ITR的来源与Rep蛋白的来源相同,所述Rep蛋白以反式提供用于生产。通常,AAV载体的表达盒包括AAV 5'ITR、GLP-1融合蛋白编码序列和任何调控序列以及AAV 3'ITR。然而,这些元件的其它构型可以是合适的。已经描述了被称为ΔITR的5'ITR的缩短版本,其中缺失了D序列和末端解析位点(trs)。在其它实施例中,使用了全长AAV5'和3'ITR。
为了将表达盒包装到病毒粒子中,ITR是在与基因相同的构建体中顺式所需的唯一AAV组分。在一个实施例中,用于复制(rep)和/或衣壳(cap)的编码序列从AAV基因组中移除并以反式供应或由包装细胞系供应,以产生AAV载体。例如,如上所述,假型AAV可以含有来自与AAV衣壳的来源不同的来源的ITR。在一个实施例中,可以利用嵌合AAV衣壳。可以选择仍其它的AAV组分。此类AAV序列的来源在本文中有所描述并且还可以从学术、商业或公共来源分离或获得(例如,维吉尼亚州马纳萨斯的美国典型培养物保藏中心(the AmericanType Culture Collection,Manassas,VA))。AAV序列可以通过合成或其它合适的方式通过参考公开的序列(如在文献中或在如例如
Figure BDA0004193520790000231
等数据库中可获得的公开的序列)而获得。/>
用于产生和分离适合于向受试者递送的AAV病毒载体的方法在本领域中是已知的。[参见例如,美国专利7790449;美国专利7282199;WO 2003/042397;WO 2005/033321;WO2006/110689;以及US 7588772 B2]。在一个系统中,用编码侧接ITR的转基因的构建体和编码rep和cap的构建体瞬时转染生产细胞系。在第二系统中,用编码侧接ITR的转基因的构建体瞬时转染稳定供应rep和cap的包装细胞系。在这些系统的每种系统中,响应于用辅助腺病毒或疱疹病毒感染而产生AAV病毒粒子,从而需要从污染的病毒中分离rAAV。最近,已开发了不需要用辅助病毒感染来回收AAV的系统—通过所述系统还反式地提供所需辅助功能(即,腺病毒E1、E2a、VA和E4或疱疹病毒UL5、UL8、UL52和UL29,以及疱疹病毒聚合酶)。在这些较新的系统中,可以通过用编码所需辅助功能的构建体瞬时转染细胞来提供辅助功能,或者所述细胞可以被工程化成稳定地含有编码辅助功能的基因,所述基因的表达可以被控制在转录水平或转录后水平下。在又另一个系统中,通过用基于杆状病毒的载体进行感染来将侧接ITR的转基因和rep/cap基因引入到昆虫细胞中。关于这些产生系统的综述,通常参见例如Zhang等人,2009,“用于大规模重组腺相关病毒产生的腺病毒-腺相关病毒杂合体(Adenovirus-adeno-associated virus hybrid for large-scale recombinant adeno-associated virus production)”,《人类基因疗法(Human Gene Therapy)》20:922-929,所述参考文献中的每个参考文献的内容通过引用整体并入本文。在以下美国专利中也描述了制备和使用这些及其它AAV产生系统的方法,所述美国专利中的每个美国专利的内容通过引用整体并入本文:5,139,941;5,741,683;6,057,152;6,204,059;6,268,213;6,491,907;6,660,514;6,951,753;7,094,604;7,172,893;7,201,898;7,229,823和7,439,065。通常参见例如,Grieger和Samulski,2005,“腺相关病毒作为基因疗法载体:载体研发、产生及临床应用(Adeno-associated virus as a gene therapy vector:Vector development,production and clinical applications)”,《生物化学工程/生物技术进展(Adv.Biochem.Engin/Biotechnol.)》99:119-145;Buning等人,2008,“腺相关病毒载体技术的最新进展(Recent developments in adeno-associated virus vectortechnology)”,《基因医学杂志(J.Gene Med.)》10:717-733;以及下文引用的参考文献,所述参考文献中的每个参考文献通过引用整体并入本文。用于构建本发明的任何实施例的方法对于核酸操作技术人员是已知的并且包含遗传工程、重组工程以及合成技术。参见例如,Green和Sambrook等人,《分子克隆:实验室手册》,纽约市冷泉港的冷泉港实验室出版社(2012)。类似地,产生rAAV病毒粒子的方法是熟知的,并且对合适的方法的选择不是对本发明的限制。参见例如,K.Fisher等人,(1993)《病毒学杂志》,70:520-532和美国专利第5,478,745号。
本文所述的rAAV包括具有包装在内部的载体基因组的所选择的衣壳。载体基因组(或rAAV基因组)包括5'和3'AAV反向末端重复序列(ITR)、编码融合蛋白的多核苷酸序列以及指导编码融合蛋白的多核苷酸序列插入宿主细胞的基因组的调控序列。在一个实施例中,载体基因组是SEQ ID NO:16中所示的序列或共享与其至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%同一性的序列。
如本文所使用的,“载体基因组”是指包装在形成病毒颗粒的细小病毒(例如,rAAV)衣壳内部的核酸序列。此类核酸序列含有AAV反向末端重复序列(ITR)。在本文中的实例中,载体基因组至少含有从5'至3'的AAV 5'ITR、编码序列(即,转基因)和AAV 3'ITR。可以选择来自AAV2(与衣壳来源不同的AAV)或除了非全长ITR之外的ITR。在某些实施例中,ITR来自与在产生或反式补充AAV期间提供rep功能的AAV来源相同的AAV。另外,可以使用其它ITR,例如,自身互补的(scAAV)ITR。单链AAV和自身互补的(sc)AAV两者都涵盖在rAAV内。转基因是与载体序列异源的核酸编码序列,所述核酸编码序列编码多肽、蛋白质、功能性RNA分子(例如,miRNA、miRNA抑制剂)或其它所关注基因产物。核酸编码序列以允许转基因在靶组织的细胞中转录、翻译和/或表达的方式与调控组分可操作地连接。在本文中更详细地讨论了载体基因组的合适组分。在一个实例中,“载体基因组”至少含有从5'至3'的载体特异性序列、编码GLP-1构建体的核酸序列,所述核酸序列与调控控制序列(所述调控控制序列指导其在靶细胞中表达)可操作地连接,其中载体特异性序列可以是将载体基因组特异性地包装到病毒载体衣壳或包膜蛋白中的末端重复序列。例如,AAV反向末端重复序列用于包装到AAV和某些其它细小病毒衣壳中。
载体的AAV序列通常包括顺式作用的5'和3'反向末端重复序列(参见例如,B.J.Carter,《细小病毒手册(Handbook of Parvoviruses)》,P.Tijsser编辑,CRC出版社,第155 168页(1990))。ITR序列的长度为约145bp。优选地,分子中使用了编码ITR的基本上整个序列,尽管允许对这些序列进行一定程度的微小修饰。修饰这些ITR序列的能力在本领域的技术范围内。(参见例如,文本,如Sambrook等人,《分子克隆:实验室手册》,第2版,纽约的冷泉港实验室(Cold Spring Harbor Laboratory,New York)(1989);以及K.Fisher等人,《病毒学杂志》,70:520 532(1996))。在本发明中采用的此类分子的实例是含有转基因的“顺式作用”质粒,其中所选择的转基因序列和相关调控元件侧接5'和3'AAV ITR序列。在一个实施例中,ITR来自与供应衣壳的AAV不同的AAV。在一个实施例中,来自AAV2的ITR序列。然而,可以选择来自其它AAV来源的ITR。已经描述了被称为ΔITR的5'ITR的缩短版本,其中缺失了D序列和末端解析位点(trs)。在某些实施例中,载体基因组包含130个碱基对的缩短的AAV2 ITR,其中缺失了外部A元件。不希望受理论束缚,据信在使用内部(A')元件作为模板的载体DNA扩增期间,缩短的ITR回复到145个碱基对的野生型长度。在其它实施例中,使用了全长AAV 5'和3'ITR。在ITR的来源来自AAV2并且AAV衣壳来自另一个AAV来源的情况下,所得载体可以被称为假型的。然而,这些元件的其它构型可以是合适的。
任选地,本文所述的GLP-1构建体可以通过除了rAAV之外的病毒载体递送。此类其它病毒载体可以包含适合于基因疗法的任何病毒,包含但不限于腺病毒;疱疹病毒;慢病毒;逆转录病毒等。合适地,在产生这些其它载体中的一种载体时,其产生为复制缺陷型病毒载体。
“复制缺陷型病毒”或“病毒载体”是指其中含有所关注基因的表达盒包装在病毒衣壳或包膜中的合成或人工病毒颗粒,其中也包装在病毒衣壳或包膜内的任何病毒基因组序列均是复制缺陷型的;即,所述合成或人工病毒颗粒不能产生子代病毒粒子但保留了感染靶细胞的能力。在一个实施例中,病毒载体的基因组不包含编码复制所需的酶的基因(基因组可以被工程化成“无肠的(gutless)”-仅含有所关注转基因,其侧接扩增和包装人工基因组所需的信号),但是这些基因可以在产生期间供应。因此,这被认为可以安全地用于基因疗法,因为除非存在复制所需的病毒酶,否则不会发生通过子代病毒粒子进行的复制和感染。
还提供了包含本文所述的病毒载体构建体的组合物。本文所述的药物组合物被设计成用于通过任何合适的途径或不同途径的组合递送到有需要的受试者。直接递送到肝脏(任选地通过静脉内、通过肝动脉或通过移植)、口服施用途径、吸入施用途径、鼻内施用途径、气管内施用途径、动脉内施用途径、眼内施用途径、静脉内施用途径、肌内施用途径、皮下施用途径、皮内施用途径以及其它母体施用途径。本文所述的病毒载体可以以单一组合物或多种组合物的形式递送。任选地,可以递送两种或更多种不同的AAV,或多种病毒[参见例如,WO 2011/126808和WO 2013/049493]。在另一个实施例中,多种病毒可以含有不同的复制缺陷型病毒(例如,AAV和腺病毒)。在一个实施例中,施用是肌内进行的。在另一个实施例中,施用是静脉内进行的。
复制缺陷型病毒可以与生理上可接受的载体一起调配,用于基因转移和基因疗法应用。在AAV病毒载体的情况下,基因组拷贝(“GC”)的定量可以用作调配物中所含有的剂量的量度。可以使用本领域已知的任何方法来确定本发明的复制缺陷型病毒组合物的基因组拷贝(GC)数量。用于进行AAV GC数量滴定的一种方法如下:经纯化的AAV载体样品首先用DNase进行处理,以消除来自产生过程的未衣壳化的AAV基因组DNA或污染质粒DNA。然后使核酸酶抗性颗粒经受热处理,以从衣壳中释放基因组。然后使用靶向病毒基因组特定区域(通常为polyA信号)的引物/探针组通过实时PCR来定量经释放的基因组。用于确定基因组拷贝的另一种合适的方法是定量PCR(qPCR),特别是经优化的qPCR或数字液滴PCR[LockMartin等人,《人类基因疗法方法(Human Gene Therapy Methods.)》2014年4月,25(2):115-125.doi:10.1089/hgtb.2013.131,2013年12月13日编辑之前在线发布]。
而且,复制缺陷型病毒组合物可以以一定剂量单位调配以含有在约1.0x 109GC至约1.0x 1015GC的范围内的复制缺陷型病毒量。在另一个实施例中,这一量的病毒基因组可以以分剂量的形式递送。在一个实施例中,对于约70kg的平均人受试者,剂量为约1.0x1010GC至约3.0x 1014GC。在另一个实施例中,剂量约1x 109GC。例如,AAV病毒的剂量可以为约1x 1010GC、1x 1011Gc、约5X 1011GC、约1X 1012GC、约5X1012GC或约1X 1013GC。在另一个实施例中,对于人受试者,剂量为约1.0x 109GC/kg至约3.0x 1014GC/kg。在另一个实施例中,剂量约1x 109GC/kg。例如,AAV病毒的剂量可以为约1x 1010GC/kg、1x 1011GC/kg、约5X1011GC/kg、约1X 1012GC/kg、约5X 1012GC/kg或约1X 1013GC/kg。在一个实施例中,构建体可以以1μL至约100mL的体积递送。如本文所使用的,术语“剂量”或“量”可以指在治疗过程中向受试者递送的总剂量或量或以单一单位(或多单位或分剂量)施用递送的剂量或量。
可以根据所公开的方法将上文所述的重组载体递送到宿主细胞。可以将优选地悬浮于生理学相容的载体中的rAAV施用于包含人在内的期望的受试者。鉴于转移病毒所针对的适应症,本领域技术人员可以容易地选择合适的载体。例如,一种合适的载体包含盐水,其可以与各种缓冲溶液(例如,磷酸盐缓冲盐水)一起调配。其它示例性载体包含无菌盐水、乳糖、蔗糖、磷酸钙、明胶、葡聚糖、琼脂、果胶、花生油、芝麻油和水。对载体的选择不是对本发明的限制。
在另一个实施例中,组合物包含载体、稀释剂、赋形剂和/或佐剂。在某些实施例中,为了施用于人类患者,将rAAV合适地悬浮于含有盐水、表面活性剂和药学上和/或生理学上相容的盐或盐的混合物的水溶液中。合适地,将调配物调整至生理上可接受的pH,例如,在pH 6至9、或pH 6.0至7.5、或pH 6.2至7.7、或pH 6.5至7.5、pH 7.0至7.7或pH 7.2至7.8或约7.0的范围内。在某些实施例中,将调配物的pH调整至约6.0、约6.1、约6.2、约6.3、约6.4、约6.5、约6.6、约6.7、约6.8、约6.9、约7.0、约7.1、约7.2、约7.3、约7.4、约7.5、约7.6、约7.7或约7.8。在某些实施例中,可能期望的pH为约7.28至约7.32、约6.0至约7.5、约6.2至约7.7、约7.5至约7.8、约6.0、约6.1、约6.2、约6.3、约6.4、约6.5、约6.6、约6.7、约6.8、约6.9、约7.0、约7.1、约7.2、约7.3、约7.4、约7.5、约7.6、约7.7或约7.8。在某些实施例中,对于静脉内递送,可能期望的pH为约6.8至约7.2。然而,可以选择最宽范围和这些子范围内的其它pH用于其它递送途径。
任选地,除了rAAV和/或变体以及载体之外,本发明的组合物还可以含有其它常规药物成分,如防腐剂或化学稳定剂。合适的示例性防腐剂包含氯丁醇、山梨酸钾、山梨酸、二氧化硫、没食子酸丙酯、对羟基苯甲酸甲酯、乙基香草醛、甘油、苯酚和对氯苯酚。合适的化学稳定剂包含明胶和白蛋白。
如本文所使用的,“载体”包含任何和所有溶剂、分散介质、媒剂、涂层、稀释剂、抗细菌剂和抗真菌剂、等渗剂和吸收延迟剂、缓冲液、载体溶液、悬浮液、胶质物等。此类介质和药剂用于药物活性物质的用途在本领域中是熟知的。补充性活性成分也可以掺入到组合物中。短语“药学上可接受的”是指当施用于宿主时不会产生过敏或类似不良反应的分子实体和组合物。如脂质体、纳米胶囊、微颗粒、微球、脂质颗粒、囊泡等递送媒剂可以用于将本发明的组合物引入到合适的宿主细胞中。具体地,rAAV载体递送的转基因可以被调配成用于递送或包封在脂质颗粒、脂质体、囊泡、纳米球或纳米颗粒等中。
在一个实施例中,组合物包含适合于递送到受试者的最终调配物,所述组合物是例如缓冲到生理上相容的pH和盐浓度的水性液体悬浮液。任选地,调配物中存在一种或多种表面活性剂。在另一个实施例中,可以将组合物作为稀释以施用于受试者的浓缩物运输。在其它实施例中,可以在施用时将组合物冻干并重构。
可以从无毒的非离子表面活性剂中选择合适的表面活性剂或表面活性剂的组合。在一个实施例中,选择终止于伯羟基的双官能嵌段共聚物表面活性剂,例如
Figure BDA0004193520790000281
F68[BASF公司(BASF)],也被称为泊洛沙姆(Poloxamer)188,其具有中性pH,平均分子量为8400。可以选择其它表面活性剂和其它泊洛沙姆,即非离子三嵌段共聚物,所述非离子三嵌段共聚物由与聚氧乙烯(聚(环氧乙烷))的两个亲水链侧接的聚氧丙烯(聚(环氧丙烷))的中心疏水链、SOLUTOL HS 15(聚乙二醇-15羟基硬脂酸酯)、LABRASOL(聚氧辛酸甘油酯)、聚氧10油醚、TWEEN(聚氧乙烯山梨聚糖脂肪酸酯)、乙醇和聚乙二醇构成。在一个实施例中,调配物含有泊洛沙姆。这些共聚物通常以字母“P”(对于泊洛沙姆)命名,后跟三个数字:前两位数字x 100给出了聚氧丙烯核的近似分子量,并且最后一位数字x 10给出了聚氧乙烯含量的百分比。在一个实施例中,选择了泊洛沙姆188。表面活性剂可以以悬浮液的至多约0.0005%至约0.001%的量存在。
载体的剂量主要取决于如所治疗的病状、患者的年龄、体重和健康状况等因素,并且因此在患者之间可能有所不同。例如,病毒载体的治疗有效人剂量通常在约25微升至约1000微升至约100mL溶液的范围内,所述溶液含有浓度为约1x 109至1x 1016个基因组病毒载体(以治疗平均体重为70kg的受试者),包含所述范围内的整数或分数量,并且对于人类患者,优选地为1.0x 1012GC至1.0x 1013GC。本发明的组合物可以以约0.1μL至约10mL的体积递送,包含所述范围内的所有数字,这取决于待治疗区域的大小、所使用的病毒滴度、施用途径以及所述方法的期望效果。在一个实施例中,体积为约50μL。在另一个实施例中,体积为约70μL。在另一个实施例中,体积为约100μL。在另一个实施例中,体积为约125μL。在另一个实施例中,体积为约150μL。在另一个实施例中,体积为约175μL。在又另一个实施例中,体积为约200μL。在另一个实施例中,体积为约250μL。在另一个实施例中,体积为约300μL。在另一个实施例中,体积为约450μL。在另一个实施例中,体积为约500μL。在另一个实施例中,体积为约600μL。在另一个实施例中,体积为约750μL。在另一个实施例中,体积为约850μL。在另一个实施例中,体积为约1000μL。在另一个实施例中,体积为约1.5mL。在另一个实施例中,体积为约2mL。在另一个实施例中,体积为约2.5mL。在另一个实施例中,体积为约3mL。在另一个实施例中,体积为约3.5mL。在另一个实施例中,体积为约4mL。在另一个实施例中,体积为约5mL。在另一个实施例中,体积为约5.5mL。在另一个实施例中,体积为约6mL。在另一个实施例中,体积为约6.5mL。在另一个实施例中,体积为约7mL。在另一个实施例中,体积为约8mL。在另一个实施例中,体积为约8.5mL。在另一个实施例中,体积为约9mL。在另一个实施例中,体积为约9.5mL。在另一个实施例中,体积为约10mL。
在一些实施例中,在组合物中,携带编码期望转基因的核酸序列的重组腺相关病毒在调控序列的控制下的浓度令人期望地在约107和1014个载体基因组/毫升(vg/mL)(也称为基因组拷贝/mL(GC/mL))的范围内。
在一个实施例中,组合物中的rAAV的剂量为约1.0x 109GC/kg体重至约1.5x1013GC/kg。在一个实施例中,剂量为约1.0x 1010GC/kg。在一个实施例中,剂量为约1.0x1011GC/kg。在一个实施例中,剂量为约1.0x 1012GC/kg。在一个实施例中,剂量为约5.0x 1012GC/kg。在一个实施例中,剂量为约1.0x 1013GC/kg。本文所述的所有范围都包含端点。
在一个实施例中,有效剂量(所递送的总基因组拷贝)为约107至1013个载体基因组。在一个实施例中,总剂量为约108个基因组拷贝。在一个实施例中,总剂量为约109个基因组拷贝。在一个实施例中,总剂量为约1010个基因组拷贝。在一个实施例中,总剂量为约1011个基因组拷贝。在一个实施例中,总剂量为约1012个基因组拷贝。在一个实施例中,总剂量为约1013个基因组拷贝。在一个实施例中,总剂量为约1014个基因组拷贝。在一个实施例中,总剂量为约1015个基因组拷贝。
令人期望的是利用最低有效浓度的病毒以降低如毒性等不期望效果的风险。在这些范围内的仍其它剂量和施用体积可以由主治医师考虑所治疗的受试者(优选地人)的身体状态、受试者的年龄、特定病症和病症(如果进行性的话)已经发展的程度来选择。
在某些实施例中,组合物包括rAAV,所述rAAV包括诱导型GLP-1激动剂构建体。在某些实施例中,诱导剂或分子是雷帕霉素或雷帕霉素类似物。在某些实施例中,诱导剂是雷帕霉素,并且在包括rAAV的组合物之后施用至少一次或多次、至少两次或更多次、至少三次或更多次。在一些实施例中,雷帕霉素以至少约4nM至至少约40nM的剂量施用。在某些实施例中,诱导剂(即,雷帕霉素)以至少约0.1mg/kg至至少约3.0mg/kg的剂量施用。在某些实施例中,诱导剂(即,雷帕霉素)以至少约0.5mg/kg至至少约2.0mg/kg的剂量施用。
本文所述的病毒载体和其它构建体可以用于制备药物,所述药物用于将GLP-1融合蛋白构建体递送到有需要的受试者,将具有增加的半衰期的GLP-1供应到受试者,和/或用于治疗受试者的I型糖尿病、II型糖尿病或代谢综合征。因此,在另一方面,提供了一种治疗糖尿病的方法。所述方法包含向有需要的受试者施用如本文所述的组合物。在一个实施例中,组合物包含含有GLP-1融合蛋白表达盒的病毒载体,如本文所述。
如本文所使用的,术语“治疗(treatment)”或“治疗(treating)”被定义为涵盖出于改善I型糖尿病、II型糖尿病或代谢综合征的一种或多种症状的目的向受试者施用本文所述的一种或多种化合物或组合物。因此,“治疗”可以包含降低给定受试者的I型糖尿病、II型糖尿病或代谢综合征的进展、降低给定受试者的症状的严重程度、消除给定受试者的疾病症状、延迟给定受试者的疾病的进展或增加给定受试者的疗法功效中的一种或多种。
如本文所使用的,术语“缓解”是指当受试者不再表现出糖尿病的临床体征并且具有正常血糖水平时停止胰岛素治疗的能力。
在另一个实施例中,提供了一种用于治疗受试者的T2DM的方法。所述方法包含施用病毒载体,所述病毒载体包括核酸分子,所述核酸分子包括编码如本文所述的融合蛋白的序列。在一个实施例中,所述受试者是人。
在另一方面,提供了一种治疗受试者的代谢性疾病的方法。所述方法包含向有需要的受试者施用如本文所述的组合物。在一个实施例中,组合物包含含有GLP-1融合蛋白表达盒的病毒载体,如本文所述。在一个实施例中,代谢性疾病是I型糖尿病。在一个实施例中,代谢性疾病是II型糖尿病。在一个实施例中,代谢性疾病是代谢综合征。在一个实施例中,受试者是人。
在另一方面,提供了一种减轻受试者的体重的方法。所述方法包含向有需要的受试者施用如本文所述的组合物。在一个实施例中,组合物包含含有GLP-1融合蛋白表达盒的病毒载体,如本文所述。
治疗过程可以任选地涉及重复施用相同的病毒载体(例如,AAVrh91载体)或不同的病毒载体(例如,AAVrh91和AAV3B.AR2.12)。可以使用本文所述的病毒载体选择仍其它组合。任选地,本文所述的组合物可以组合在涉及其它糖尿病药物或基于蛋白质的疗法(包含例如GLP-1类似物、胰岛素、口服抗高血糖药物(磺酰脲类、双胍类、噻唑烷二酮类和α-葡糖苷酶抑制剂))的方案中。任选地,本文所述的组合物可以组合在涉及生活方式变化的方案中,包含饮食和锻炼方案。在某些实施例中,AAV载体和组合疗法是基本上同时施用的。在其它实施例中,AAV载体是首先施用的。在其它实施例中,组合疗法是首先施用的。
在一个实施例中,组合物与有效量的胰岛素组合施用。各种可商购获得的胰岛素产品在本领域中是已知的,包含但不限于鱼精蛋白锌重组人胰岛素
Figure BDA0004193520790000311
猪胰岛素锌悬浮液/>
Figure BDA0004193520790000312
甘精胰岛素/>
Figure BDA0004193520790000313
赖脯胰岛素(Lispro)(优泌乐(Humalog))、天冬胰岛素(Aspart)(诺和锐(Novolog))、赖谷胰岛素(Glulisine)(艾倍得(Apidra))、诺和灵(novolin)和Velosulin。
在一些实施例中,与用病毒载体进行治疗之前相比,本文所述的rAAV与胰岛素的组合降低了受试者的胰岛素剂量要求。此类剂量要求可以降低10%或更多、20%或更多、30%或更多、40%或更多、50%或更多、60%或更多、70%或更多、80%或更多、或90%或更多。治疗医师可以确定受试者所需的胰岛素的正确剂量。例如,可以使用胰岛素或其它疗法来治疗受试者,所述治疗医师可以在施用AAV载体后继续进行治疗。此类胰岛素或其它协同疗法可以随后根据需要继续、减少或中断。
在一个实施例中,将包括表达盒、载体基因组、rAAV的组合物或本文所述的用于基因疗法的其它组合物以单剂量/患者递送。在一个实施例中,向受试者递送治疗有效量的本文所述的组合物。如本文所使用的,“治疗有效量”是指表达盒或载体或其组合在靶细胞中递送和表达足以达到治疗目标的GLP1-Fc的量的量。治疗有效量可以由治疗医师选择,或基于先前确定的指南指导。例如,度拉鲁肽可以以0.75mg的初始剂量每周一次皮下注射。剂量可以以1.5mg增量增加以实现另外的血糖控制。在将剂量增加至每周一次3mg之前,患者应保持在每周一次1.5mg剂量持续至少4周。在将剂量增加至每周一次4.5mg之前,患者应保持在每周一次3mg剂量持续至少4周。度拉鲁肽的维持剂量可以为每周一次皮下注射0.75mg至4.5mg,其中最大剂量为每周4.5mg。可以将rAAV递送到受试者,并且然后根据需要用口服或皮下度拉鲁肽、胰岛素或其它药物补充,以达到每周0.75mg至4.5mg的期望剂量的当量。
在某些实施例中,治疗目标是改善或治疗I型糖尿病、II型糖尿病或代谢综合征的症状中的一种或多种。治疗有效量可以基于动物模型而不是人类患者来确定。在另一个实施例中,治疗目标是缓解受试者的代谢性疾病。如本文所使用的,当用于指vp衣壳蛋白时,术语“异质”或其任何语法变型是指由不相同的元件组成的群体,例如具有带有不同的经修饰的氨基酸序列的vp1、vp2或vp3单体(蛋白质)。SEQ ID NO:20提供了AAVrh91 vp1蛋白的经编码的氨基酸序列。与vp1、vp2和vp3蛋白(可替代地被称为同种型)结合使用的术语“异质的”是指衣壳内的vp1、vp2和vp3蛋白的氨基酸序列中的差异。AAV衣壳含有具有来自预测的氨基酸残基的修饰的vp1蛋白内、vp2蛋白内和vp3蛋白内的亚群体。这些亚群体至少包含某些脱酰胺化的天冬酰胺(N或Asn)残基。例如,某些亚群体包括天冬酰胺-甘氨酸对中的至少一个、两个、三个或四个高度脱酰胺化的天冬酰胺(N)位置,并且任选地进一步包括其它脱酰胺化的氨基酸,其中脱酰胺化引起氨基酸变化和其它任选的修饰。
如本文所使用的,除非另有说明,否则vp蛋白的“亚群体”是指一组vp蛋白,所述一组vp蛋白具有至少一个限定的共同特性,并且由至少一个组成员到少于参考组的所有成员组成。例如,除非另有说明,否则vp1蛋白的“亚群体”是至少一种(1)vp1蛋白,并且少于组装的AAV衣壳中的所有vp1蛋白。除非另有说明,否则vp3蛋白的“亚群体”可以是少于组装的AAV衣壳中的所有vp3蛋白的一种(1)vp3蛋白。例如,vp1蛋白可以是vp蛋白的亚群体;vp2蛋白可以是vp蛋白的单独亚群体,并且vp3是组装的AAV衣壳中的vp蛋白的仍另外的亚群体。在另一个实例中,vp1、vp2和vp3蛋白可以含有具有不同修饰的亚群体,例如,至少一种、两种、三种或四种高度脱酰胺化的天冬酰胺,例如在天冬酰胺-甘氨酸对处。
如本文所使用的,rAAV的“原液”是指rAAV的群体。尽管由于脱酰胺作用,其衣壳蛋白具有异质性,但是rAAV在原液中被预期与5共享相同的载体基因组。原液可以包含具有衣壳的rAAV,所述衣壳具有例如所选择的AAV衣壳蛋白和所选择的产生系统的特有的异质脱酰胺模式。原液可以从单个产生系统中产生,或者从产生系统的多次运行中池化。可以选择各种产生系统,包含但不限于本文所述的产生系统。如本文所使用的,术语“GLP-1构建体”、“GLP-1表达构建体”和同义词包含如本文所述的GLP-1序列与前导序列和融合结构域的组合。术语“GLP-1构建体”、“GLP-1表达构建体”和同义词可以用于指编码GLP-1融合蛋白或其表达产物的核酸序列。
在核酸序列的上下文中,术语“同一性百分比(%)”、“序列同一性”、“序列同一性百分比”或“相同百分比”是指两个序列中的碱基在比对以获得对应性时是相同的。序列同一性比较的长度可以超过基因组的全长、基因编码序列的全长或至少约100至150个核苷酸的片段,或根据需要。然而,也可能期望较小片段之间的同一性,例如至少约九个核苷酸,通常至少约20至24个核苷酸、至少约28至32个核苷酸、至少约36个或更多个核苷酸。多个序列比对程序也可用于核酸序列。此类程序的实例包含“Clustal W”、“CAP序列组装”、“BLAST”、“MAP”和“MEME”,这些程序可通过因特网上的Web服务器进行访问。此类程序的其它来源是本领域技术人员已知的。可替代地,也使用了载体NTI实用程序。本领域已知的许多算法可以用于测量核苷酸序列同一性,包含上述程序中所含有的算法。作为另一个实例,可以使用GCG 6.1版本的程序FastaTM比较多核苷酸序列。FastaTM提供了查询序列与搜索序列之间最佳重叠区的比对和序列同一性百分比。例如,核酸序列之间的序列同一性百分比可以是使用如GCG 6.1版本中所提供的采用其默认参数(字号6和评分矩阵的NOPAM系数)的FastaTM所确定的,所述程序通过引用并入本文。
术语“高度保守的”意指至少80%同一性、优选地至少90%同一性,并且更优选地超过97%同一性。通过使用本领域技术人员已知的算法和计算机程序,本领域技术人员可以容易地确定同一性。
除非由较高范围另行规定,否则应当理解,同一性百分比是同一性的最低水平,并且涵盖同一性的所有较高水平,直至与参考序列的100%同一性。除非另有说明,否则应当理解,同一性的百分比是同一性的最低水平,并且涵盖同一性的所有较高水平,直至与参考序列的100%同一性。例如,“95%同一性”和“至少95%同一性”可以互换地使用,并且包含与参考序列的95%、96%、97%、98%、99%以及直至100%同一性,以及其间的所有分数。
在氨基酸序列的上下文中,术语“同一性百分比(%)”、“序列同一性”、“序列同一性百分比”或“相同百分比”是指两个序列中的残基在比对以获得对应性时是相同的。可以容易地确定蛋白质全长、多肽、约70个氨基酸至约100个氨基酸或其肽片段或对应的核酸序列编码序列上的氨基酸序列的同一性百分比。合适的氨基酸片段的长度可以为至少约8个氨基酸,并且可以为至多约150个氨基酸。通常,当提及两种不同序列之间的“同一性”、“同源性”或“类似性”时,参考“比对”序列来确定“同一性”、“同源性”或“类似性”。“比对”序列或“比对”是指与参考序列相比,通常含有对丢失的或另外的碱基或氨基酸的校正的多个核酸序列或蛋白质(氨基酸)序列。使用多种公开或可商购获得的多序列比对程序中的任一种进行比对。序列比对程序可用于氨基酸序列,例如,“Clustal X”、“MAP”、“PIMA”、“MSA”、“BLOCKMAKER”、“MEME”和“Match-Box”程序。通常,以默认设置使用这些程序中的任何程序,尽管本领域技术人员可以根据需要改变这些设置。可替代地,本领域技术人员可以利用另一种算法或计算机程序,所述算法或计算机程序提供至少与参考算法和程序所提供的同一性或比对水平相同的同一性或比对。参见例如,J.D.Thomson等人,《核酸研究(Nucl.Acids.Res.)》,“多个序列比对的全面比较(A comprehensive comparison ofmultiple sequence alignments)”,27(13):2682-2690(1999)。
应注意的是,术语“一个(a)”或“一种(an)”是指一个或多个/一种或多种。如此,术语“一个”(或“一种”)、“一个或多个”和“至少一个”在本文可互换地使用。
词语“包括(comprise)”、“包括(comprises)”和“包括(comprising)”将被解释为是包含性而非排他性的。词语“由…组成(consist/consisting)”和其变型将被解释为是排他性的而非包含性的。虽然说明书中的各个实施例是使用“包括”语言来呈现的,但是在其它情况下,也旨在使用“由…组成”或“基本上由…组成”的语言来解释和描述相关实施例。
如本文所使用的,“患者”或“受试者”是指哺乳动物,包含人、兽医或农场动物、家畜或宠物以及通常用于临床研究的动物。在一个实施例中,这些方法和组合物的受试者是人。在另实施例中,受试者不是猫科动物。
如本文所使用的,除非另有说明,否则术语“约”意指相对于给定参考的10%(±10%,例如,±1、±2、±3、±4、±5、±6、±7、±8、±9、±10或其之间的值)的变化性。
在某些情况下,术语“E+#”或术语“e+#”用于指代指数。例如,“5E10”或“5e10”是5x1010。这些术语可以互换地使用。
如本文所使用的,术语“调控”或其变型是指组合物抑制生物通路的一个或多个组分的能力。
如本文所使用的,“疾病”、“病症”和“病状”可互换地用于指示受试者的异常状态。
除非在本说明书中另有定义,否则本文所使用的技术术语和科学术语具有与本领域的普通技术人员和参照公开文本所通常理解的相同含义,这为本领域的技术人员提供了本申请中使用的许多术语的通用指南。
在描述实施例时对“一个实施例”或“另一个实施例”的引用并不意味着所引用的实施例与另一个实施例(例如,在所引用实施例之前描述的实施例)相互排斥,除非另有明确规定。
具体实施例
1.一种病毒载体,其包括核酸,所述核酸包括编码融合蛋白的序列,所述融合蛋白包括GLP-1类似物和IgG4 Fc。
2.根据实施例1所述的病毒载体,其中所述载体是腺相关病毒载体。
3.根据实施例1或实施例2所述的病毒载体,其中所述融合蛋白进一步包括凝血酶前导序列。
4.根据实施例3所述的病毒载体,其中所述凝血酶前导序列包括具有至多1个、2个或3个氨基酸取代的SEQ ID NO:7或其功能变体的序列。
5.根据实施例1至4中任一项所述的病毒载体,其中所述融合蛋白进一步包括间隔子。
6.根据实施例1至5中任一项所述的病毒载体,其中所述融合蛋白包括人凝血酶前导序列、GLP-1类似物、间隔子和人IgG4 Fc。
7.根据实施例1至6所述的病毒载体,其中所述融合蛋白具有SEQ ID NO:14的序列或与其至少99%相同的序列。
8.根据实施例1至7中任一项所述的病毒载体,其中编码所述融合蛋白的所述序列是SEQ ID NO:15。
9.根据实施例1至8中任一项所述的病毒载体,其包括:
(a)AAV衣壳,以及
(b)包装在所述AAV衣壳中的载体基因组,所述载体基因组包括AAV反向末端重复序列(ITR)、所述融合蛋白的所述编码序列以及指导所述融合蛋白的表达的调控序列。
10.根据实施例1至9中任一项所述的病毒载体,其中所述病毒载体是具有AAV8的所述AAV衣壳或其功能变体的重组腺相关病毒(rAAV)。
11.根据实施例1至9中任一项所述的病毒载体,其中所述病毒载体是具有AAVrh91的AAV衣壳或其功能变体的rAAV。
12.根据实施例1至9中任一项所述的病毒载体,其中所述病毒载体是具有AAV3B.AR2.12的所述AAV衣壳或其功能变体的rAAV。
13.根据实施例1至9中任一项所述的病毒载体,其中所述病毒载体是具有选自以下的所述AAV衣壳或其功能变体的rAAV:AAV9、AAVrh64R1、AAVhu37或AAVrh10。
14.根据实施例1至13中任一项所述的病毒载体,其包括载体基因组,所述载体基因组包括诱导型基因表达系统、可调控启动子、编码所述融合蛋白的所述序列和聚腺苷酸化信号。
15.根据实施例9至14中任一项所述的病毒载体,其中所述AAV反向末端重复序列(ITR)是侧接所述融合蛋白编码序列和所述调控序列的AAV2 5'ITR和AAV2 3'ITR。
16.根据实施例9至15中任一项所述的病毒载体,其中所述载体基因组包括人巨细胞病毒启动子和兔珠蛋白poly A。
17.根据实施例1至16中任一项所述的病毒载体,其包括诱导型基因表达系统。
18.根据实施例17所述的病毒载体,其中所述诱导型基因表达系统包括:
(a)激活结构域,所述激活结构域包括FKBP12-雷帕霉素相关蛋白(FRAP)的反式激活结构域和FKBP12-雷帕霉素结合(FRB)结构域;
(b)DNA结合结构域,所述DNA结合结构域包括锌指同源结构域(ZFHD)和一个、两个或三个FK506结合蛋白结构域(FKBP)亚基基因;以及
(c)ZFHD结合位点的至少一个拷贝,随后是最小IL2启动子,以及
(d)可调控启动子;
其中有效量的雷帕霉素或雷帕霉素类似物的存在诱导转基因在宿主细胞中的表达。
19.根据实施例18所述的病毒载体,其中所述FKBP亚基基因序列彼此共享小于约85%同一性。
20.根据实施例18或19所述的病毒载体,其中所述FKBP亚基基因序列之一是天然FKBP基因序列。
21.根据实施例18至20中任一项所述的病毒载体,其中所述反式激活结构域包括NF-κB p65的一部分。
22.根据实施例18至21中任一项所述的病毒载体,其中所述可调控启动子是组成型启动子。
23.根据实施例18至21中任一项所述的病毒载体,其中所述可调控启动子是组织特异性启动子。
24.根据实施例18至22中任一项所述的病毒载体,其中所述可调控启动子是CMV启动子。
25.根据实施例18至24中任一项所述的病毒载体,其进一步包括IRES或2A。
26.根据实施例18至25中任一项所述的病毒载体,其进一步包括选自GT2A_V1(SEQID NO:21)或GT2A_V2(SEQ ID NO:22)的2A连接子。
27.根据实施例18至26中任一项所述的病毒载体,其包括所述ZFHD结合位点的至少8个拷贝。
28.根据实施例18至27中任一项所述的病毒载体,其中所述载体基因组包括SEQID NO:16的序列或与其至少95%至99.9%相同的序列。
29.一种病毒载体,其包括核酸分子,所述核酸分子包括:可调控启动子;激活结构域,所述激活结构域包括p65反式激活结构域和FKBP12-雷帕霉素相关蛋白(FRAP)的FKBP12-雷帕霉素结合(FRB)结构域;DNA结合结构域,所述DNA结合结构域包括锌指同源结构域(ZFHD)和三个FK506结合蛋白结合域(FKBP)亚基基因;ZFHD结合位点的8个拷贝;以及编码包括GLP-1类似物和人IgG4 Fc的融合蛋白的序列。
30.一种适用于治疗受试者的代谢性疾病的药物组合物,所述药物组合物包括水性液体和根据实施例1至20中任一项所述的病毒载体。
31.根据实施例30所述的药物组合物,其中所述融合蛋白包括人凝血酶前导序列、GLP-1类似物、间隔子和人IgG4 Fc。
32.根据实施例1至29中任一项所述的病毒载体或根据实施例30或31中任一项所述的药物组合物,其在用于治疗患有代谢性疾病的受试者的方法中使用。
33.根据实施例1至29中任一项所述的病毒载体或根据实施例29至31中任一项所述的药物组合物在制造用于治疗患有代谢性疾病的受试者的药物中的用途。
34.根据实施例32或33所述的病毒载体或用途,其中所述组合物被调配为以1x109GC/kg至5x 1013GC/kg的所述rAAV的剂量施用。
35.根据实施例32或33中任一项所述的病毒载体或用途,其中所述患者是人并且向所述患者施用1x 1010GC至1.5x 1015GC的所述rAAV的剂量。
36.根据实施例32至35中任一项所述的病毒载体或用途,其中所述rAAV是肌内或静脉内递送的。
37.一种治疗患有代谢性疾病的受试者的方法,所述方法包括向所述受试者递送重组腺相关病毒(rAAV),所述rAAV具有来自腺相关病毒rh91的AAV衣壳和包装在所述AAV衣壳中的载体基因组,所述载体基因组包括AAV反向末端重复序列(ITR)、编码包括GLP-1类似物和人IgG4 Fc的融合蛋白的序列以及指导所述融合蛋白的表达的调控序列。
38.根据实施例37所述的方法,其中向所述患者施用根据实施例1至29中任一项所述的病毒载体或根据实施例30至31中任一项所述的药物组合物。
39.根据实施例37或38所述的方法,其中向所述患者施用1x 109GC/kg至5x1013GC/kg体重的所述AAV的剂量。
40.根据实施例37至39中任一项所述的方法,其中所述rAAV是肌内或静脉内递送的。
41.根据实施例1至29、32或34至36中任一项所述的病毒载体、根据实施例30至32中任一项所述的组合物、根据任一实施例33至36所述的用途或根据实施例37至40中任一项所述的方法,其用于治疗人的糖尿病。
实例
提供以下实例来说明本发明的各个实施例。实例并非旨在以任何方式限制本发明。
胰高血糖素样肽1(GLP-1)是由胰高血糖素前蛋白在胃肠(GI)道中的蛋白水解切割产生的激素。GLP-1通过增强β细胞的胰岛素释放、增加一些组织的胰岛素敏感性、减缓胃排空(不引起低血糖症)和增加饱腹感来广泛调控葡萄糖稳态。GLP-1由于其极短的半衰期而无法有效地用作药物,但GLP-1的长效类似物已成为广泛用于治疗2型糖尿病的药物。GLP-1激动剂具有优异的安全性特征并且需要重复的、通常终生的肠胃外施用,从而使得所述激动剂成为AAV介导的基因转移的良好候选物,这可以在单次施用之后实现长期表达。GLP-1和GLP-1激动剂难以从AAV载体中表达,因为蛋白质无法在其天然背景(胰高血糖素蛋白)中表达,这需要由对小肠的L细胞具有特异性的蛋白酶进行加工。使用异源性信号肽表达GLP-1的尝试未能实现高水平的表达。提出信号肽可能无法实现可靠的表达,因为所述信号肽不导致参与受体结合的GLP-1N末端的适当加工。相反,使用前肽表达GLP-1,所述前肽被切割以产生游离GLP-1蛋白。从如凝血酶和因子IX等凝血因子中选择前肽用于GLP-1表达,因为这些前肽可以被普遍存在的蛋白酶(例如,弗林蛋白酶)切割并且是将不具有免疫原性的内源性肽。相对于单独的信号肽,凝血酶前肽将人GLP-1类似物的表达增加至少100倍。使用这一技术,已经开发了可以从AAV载体中表达的两种长效GLP-1类似物,一种长效GLP-1类似物包括IgG4 Fc融合物,并且一种长效GLP-1类似物包括白蛋白融合物,两者都携带人前肽。已经开发了用于通过施用激活GLP-1激动剂序列的转录的小分子药物来组成性地或以受控方式表达这些蛋白质的表达盒。目标产品特征被设计为单次肌内注射。在一个实施例中,单次注射包括诱导型版本,如每2-4周一次单个丸剂,其被设计成维持治疗性GLP-1激动剂水平。作为另一个实施例,单次注射包括组成型版本,其被设计成用于在一次剂量之后以治疗水平持续终生表达。将所设计产品在临床前模型中进行测试,以检查在非人类灵长动物中的药理学和安全性。开发了针对GLP-1激动剂表达和活性的测定。已经检查了安全性和药代动力学,以分析实现已知治疗浓度的能力。
这一创新允许针对2型糖尿病进行一次性、潜在的终生治疗,尤其是在3个月后单独使用二甲双胍(metformin)或其它口服剂未实现糖化血红蛋白(也称为糖化血红蛋白、血红蛋白A1c、HbA1c或A1c)目标的患者中。目前的护理标准包含长效皮下GLP-1激动剂,如利拉鲁肽(每日施用)、度拉鲁肽(每周施用)、DPP(例如,二肽基肽酶-4)IV抑制剂(PO)和塞马鲁肽(Semaglutide)PO(每日施用)。实现AAV介导的GLP-1表达的先前尝试产生显著更低的表达,或需要使用具有免疫原性并且不适于临床应用的异种前导序列。
实例1-GLP-1载体的构建
GLP-1激动剂通过腺相关病毒(AAV)表达是具有挑战性的。GLP-1通常由胰高血糖素前体蛋白表达,其需要组织特异性蛋白酶并且产生不想要的蛋白质。使用传统的异源性信号肽的表达系统产生低表达。使用具有通用蛋白酶切割位点的异源性前肽的表达系统产生可以作为T细胞的靶标的外源蛋白序列。开发了一种系统,所述系统在不引入外源蛋白序列的情况下将肝脏或肌细胞中的GLP-1表达增加约300倍。图5示出了经工程化的GLP-1构建体在小鼠体内的AAV介导的表达。小鼠接受肌内注射表达GLP-1激动剂的AAV载体与已经开发的标准IL-2信号肽或内源性前体。注射后3周通过ELISA测量血清GLP-1浓度。
更具体地,构建了载体,其中前导序列置于若干GLP-1受体激动剂氨基酸序列之一的上游,随后是融合结构域。参见例如,图4。将所得蛋白质序列回译,随后添加kozak共有序列、终止密码子和克隆位点。产生序列,并且将序列在诱导型表达系统的控制下克隆到含有CMV启动子的表达载体中。表达构建体侧接AAV2 ITR。所得质粒被称为pAAV.TF.GT2A.度拉鲁肽(trb).3w.rBG。人凝血酶-度拉鲁肽氨基酸序列示出于SEQ ID NO:14中;编码序列示出于SEQ ID NO:15中;载体基因组示于SEQ ID NO:16中。
目前可获得的诱导型构建体包含2-载体和1-载体诱导型系统。参见例如,图6A和图6B。图6A示出了用于在双载体系统中使用的包括诱导型构建体的示例表达盒的示意图。图6B示出了用于在1-载体系统中使用的包括诱导型构建体的表达盒的示意图,所述表达盒包括IRES连接子。
此外,在包括GLP1-Fc转基因的表达载体中引入GT2A肽。具有分泌信号的人GLP1-Fc(h度拉鲁肽)为954bp。对于h度拉鲁肽构建体(如上所述)在图6B所示的表达载体中的表达,用GT2A切割序列置换IRES连接子,这允许其适合于包装限制(图7A;GLP-1Fc的单诱导型盒)。GT2A肽选自包括SEQ ID NO:21的氨基酸序列的GT2A_V1肽或包括SEQ ID NO:22的氨基酸序列的GT2A_V2肽。图7A示出了用于在1-载体系统中使用的包括诱导型构建体的表达盒的示意图,所述表达盒包括F2A切割序列连接子和具有分泌信号的人GLP1-Fc(h度拉鲁肽)。
实例2–体外表达
在用具有人凝血酶信号序列的诱导型人度拉鲁肽(TF.GT2A.度拉鲁肽(Trb))和CB7.猫科动物度拉鲁肽(feTrb)的质粒转染的HEK293细胞的培养上清液中测量GLP1-Fc融合物。猫科度拉鲁肽是指这样的构建体,其中度拉鲁肽的IgG Fc部分被猫科IgG序列置换,任选地与猫科凝血酶前导序列(feTrb)组合。在用0nM、4nM和40nM的雷帕霉素(Rapa)处理后48小时或在转染CB7.fe度拉鲁肽(feTrb)后48小时,收集上清液。GLP1-Fc通过活性形式GLP1 ELISA连同试剂盒的STD进行定量。在图2中示出了三种构建体的表达。增加雷帕霉素的剂量引起GLP-1的表达增加。
此外,评估了恒河猴示例性治疗转基因(rhTT)在包括GT2A_V1或GT2A_V2肽的所设计的构建体中的表达(图6B、7A和7B)。图8示出了在HEK293细胞上清液中的恒河猴治疗转基因(rhTT)的表达,如在用包括GT2A肽的各种构建体转染并且用0nM、4nM和40nM的雷帕霉素处理后测量的,并且以IU/mL rhTT绘制。接下来,使用包括GT2A_V1和GT2A_V2肽的所设计的单个诱导型盒在体外检查人和恒河猴GLP-1Fc表达的表达。图9示出了体外的诱导型人(h)和恒河猴(rh)GLP-1表达。在用包括凝血酶信号序列的诱导型h度拉鲁肽、包括2-载体系统的rh度拉鲁肽和CB7.rh度拉鲁肽的质粒转染的HEK293细胞的培养上清液中测量GLP1-Fc融合物。将细胞在第0天铺板,在第1天转染,在第2天用0nM、4nM和40nM的雷帕霉素处理,并且在第4天或转染CB7.rh度拉鲁肽(rhTrb)后48小时收集来自细胞的上清液。GLP1-Fc通过活性形式GLP1 ELISA连同试剂盒的STD进行定量。
实例3-Rag1KO小鼠体内的中试表达
如先前所述,通过三重转染和碘克沙醇梯度纯化将以下构建体包装到AAVrh91载体中。
AAVrh91.TF.h度拉鲁肽(Trb).3w.rBG,具有人凝血酶信号
AAVrh91.TF.rh度拉鲁肽(rhTrb).3w.rBG,具有恒河猴凝血酶信号
通过IM施用途径,通过注射载体(1x 1011GC/小鼠)处理Rag1KO雌性小鼠(n=5/载体)。通过在含有5微升DPP-IV抑制剂(密理博公司(Millipore))的血清分离管中分离全血来连续收集血清,并且如上所述测定活性GLP-1表达和活性。在第0天注射载体,并且在约第14天和第15天施用雷帕霉素。图3中示出了血清活性GLP-1浓度。在雷帕霉素施用后大约1周,血清水平达到最大值。
实例4–NHP体内的长期表达研究
在这项研究中,检查了恒河猴GLP-1(rh度拉鲁肽)在非人类灵长类动物(NHP;即,恒河猴)体内的表达。表1A和1B示出了包含AAV施用和雷帕霉素施用(即,诱导)在内的研究的概况。简而言之,通过肌内注射(IM)施用NHPs1-3(AAVrh91指定的载体)–NHP1:AAVrh91.CB7.rh度拉鲁肽.rBG,以1x 1012(1e12)GC/kg的剂量;NHP2:AAVrh91.CMV.TFNc.3AAVrh91.Z12I.rh度拉鲁肽.rBG和AAVrh91.Z12I.rh度拉鲁肽.rBG,各自以5x 1012(5e12)GC/kg的剂量;以及NHP3:1x 1013(1e13)GC/kg。对于NHP2,在第21天以0.5mg/kg的剂量施用雷帕霉素,在第56天以0.5mg/kg的剂量施用雷帕霉素,并且在第126天以2.0mg/kg的剂量施用雷帕霉素。对于NHP3,在第21天以0.5mg/kg的剂量施用雷帕霉素,在第78天以0.5mg/kg的剂量施用雷帕霉素,并且在第148天以2.0mg/kg的剂量施用。
表1A.
Figure BDA0004193520790000401
Figure BDA0004193520790000411
表1B.
Figure BDA0004193520790000412
图10A至10C示出了针对NHP1(18-128)的rhGLP1-Fc表达和抗rhGLP1-Fc ADA(抗药物抗体)检测测定的分析。图10A示出了以nM绘制的血清中的rhGLP1-Fc表达水平,如在第0至200天测量的。图10B示出了以μg/L绘制的血清中的雷帕霉素水平,如在第0至200天测量的。图10C示出了以O.D.450nm绘制的ADA检测测定的结果,如在第0至200天测量的。
图11A至11C示出了针对NHP1(18-072)的rhGLP1-Fc表达和抗rhGLP1-Fc ADA测定的分析。图11A示出了以nM绘制的血清中的rhGLP1-Fc表达水平,如在第0至200天测量的。图11B示出了以μg/L绘制的血清中的雷帕霉素水平,如在第0至200天测量的。图11C示出了以O.D.450nm绘制的ADA检测测定的结果,如在第0至200天测量的。
图12A至12C示出了针对NHP1(18-013)的rhGLP1-Fc表达和抗rhGLP1-Fc ADA测定的分析。图12A示出了以nM绘制的血清中的rhGLP1-Fc表达水平,如在第0至200天测量的。图12B示出了以μg/L绘制的血清中的雷帕霉素水平,如在第0至200天测量的。图12C示出了以O.D.450nm绘制的ADA检测测定的结果,如在第0至200天测量的。
总之,已经开发了用于表达人GLP1-Fc融合物的1-载体诱导型系统。另外,证实了在Rag1KO小鼠中雷帕霉素对人GLP1-Fc的诱导。在NHP中,观察到表达猴GLP1-Fc的1-载体和2-载体诱导型载体响应于雷帕霉素并且引起血清GLP1-Fc在大于1nM下在超过20天持续时间内瞬时增加。观察到低剂量组成型表达载体提供了NHP的血清GLP1-Fc的高且持续的表达。
(序列表自由测试)
对于在数字标识符<223>下含有自由文本的序列,提供了以下信息。
Figure BDA0004193520790000421
本说明书中引用的所有文件通过引用并入本文。于2020年8月24日提交的美国临时专利申请第63/069,500号连同其序列表一起通过引用整体并入本文。随此提交的标记为“20-9429PCT_Seq_List_ST25”的序列表以及其中的序列和文本通过引用并入。虽然已经参考特定实施例描述了本发明,但是应当理解,可以在不脱离本发明的精神的情况下进行修改。此类修改旨在落入所附权利要求的范围内。
序列表
<110> 宾夕法尼亚大学受托人
(The Trustees of the University of Pennsylvania)
<120> 编码GLP-1受体激动剂融合物的病毒载体和其在治疗代谢性
疾病中的用途
<130> UPN-20-9429.PCT
<150> US 63/069,500
<151> 2020-08-24
<160> 41
<170> PatentIn 3.5版
<210> 1
<211> 37
<212> PRT
<213> 智人(Homo sapiens)
<400> 1
His Asp Glu Phe Glu Arg His Ala Glu Gly Thr Phe Thr Ser Asp Val
1 5 10 15
Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu
20 25 30
Val Lys Gly Arg Gly
35
<210> 2
<211> 31
<212> PRT
<213> 智人(Homo sapiens)
<400> 2
His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly
1 5 10 15
Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Gly
20 25 30
<210> 3
<211> 31
<212> PRT
<213> 人工序列
<220>
<223> 构建序列
<400> 3
His Gly Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Glu
1 5 10 15
Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Gly Gly
20 25 30
<210> 4
<211> 31
<212> PRT
<213> 人工序列
<220>
<223> 构建序列
<400> 4
His Gly Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly
1 5 10 15
Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Gly
20 25 30
<210> 5
<211> 39
<212> PRT
<213> 人工序列
<220>
<223> 构建序列
<400> 5
His Gly Glu Gly Thr Phe Thr Ser Asp Leu Ser Lys Gln Met Glu Glu
1 5 10 15
Glu Ala Val Arg Leu Phe Ile Glu Trp Leu Lys Asn Gly Gly Pro Ser
20 25 30
Ser Gly Ala Pro Pro Pro Ser
35
<210> 6
<211> 44
<212> PRT
<213> 人工序列
<220>
<223> 构建序列
<400> 6
His Gly Glu Gly Thr Phe Thr Ser Asp Leu Ser Lys Gln Met Glu Glu
1 5 10 15
Glu Ala Val Arg Leu Phe Ile Glu Trp Leu Lys Asn Gly Gly Pro Ser
20 25 30
Ser Gly Ala Pro Pro Ser Lys Lys Lys Lys Lys Lys
35 40
<210> 7
<211> 43
<212> PRT
<213> 智人(Homo sapiens)
<400> 7
Met Ala His Val Arg Gly Leu Gln Leu Pro Gly Cys Leu Ala Leu Ala
1 5 10 15
Ala Leu Cys Ser Leu Val His Ser Gln His Val Phe Leu Ala Pro Gln
20 25 30
Gln Ala Arg Ser Leu Leu Gln Arg Val Arg Arg
35 40
<210> 8
<211> 24
<212> PRT
<213> 智人(Homo sapiens)
<400> 8
Met Ala His Val Arg Gly Leu Gln Leu Pro Gly Cys Leu Ala Leu Ala
1 5 10 15
Ala Leu Cys Ser Leu Val His Ser
20
<210> 9
<211> 19
<212> PRT
<213> 智人(Homo sapiens)
<400> 9
Gln His Val Phe Leu Ala Pro Gln Gln Ala Arg Ser Leu Leu Gln Arg
1 5 10 15
Val Arg Arg
<210> 10
<211> 20
<212> PRT
<213> 智人(Homo sapiens)
<400> 10
Met Tyr Arg Met Gln Leu Leu Ser Cys Ile Ala Leu Ser Leu Ala Leu
1 5 10 15
Val Thr Asn Ser
20
<210> 11
<211> 229
<212> PRT
<213> 智人(Homo sapiens)
<400> 11
Ala Glu Ser Lys Tyr Gly Pro Pro Cys Pro Pro Cys Pro Ala Pro Glu
1 5 10 15
Ala Ala Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp
20 25 30
Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp
35 40 45
Val Ser Gln Glu Asp Pro Glu Val Gln Phe Asn Trp Tyr Val Asp Gly
50 55 60
Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Phe Asn
65 70 75 80
Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp
85 90 95
Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Gly Leu Pro
100 105 110
Ser Ser Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu
115 120 125
Pro Gln Val Tyr Thr Leu Pro Pro Ser Gln Glu Glu Met Thr Lys Asn
130 135 140
Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile
145 150 155 160
Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr
165 170 175
Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Arg
180 185 190
Leu Thr Val Asp Lys Ser Arg Trp Gln Glu Gly Asn Val Phe Ser Cys
195 200 205
Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu
210 215 220
Ser Leu Ser Leu Gly
225
<210> 12
<211> 585
<212> PRT
<213> 智人(Homo sapiens)
<400> 12
Asp Ala His Lys Ser Glu Val Ala His Arg Phe Lys Asp Leu Gly Glu
1 5 10 15
Glu Asn Phe Lys Ala Leu Val Leu Ile Ala Phe Ala Gln Tyr Leu Gln
20 25 30
Gln Cys Pro Phe Glu Asp His Val Lys Leu Val Asn Glu Val Thr Glu
35 40 45
Phe Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Asn Cys Asp Lys
50 55 60
Ser Leu His Thr Leu Phe Gly Asp Lys Leu Cys Thr Val Ala Thr Leu
65 70 75 80
Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala Lys Gln Glu Pro
85 90 95
Glu Arg Asn Glu Cys Phe Leu Gln His Lys Asp Asp Asn Pro Asn Leu
100 105 110
Pro Arg Leu Val Arg Pro Glu Val Asp Val Met Cys Thr Ala Phe His
115 120 125
Asp Asn Glu Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Glu Ile Ala Arg
130 135 140
Arg His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe Phe Ala Lys Arg
145 150 155 160
Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gln Ala Ala Asp Lys Ala Ala
165 170 175
Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly Lys Ala Ser
180 185 190
Ser Ala Lys Gln Arg Leu Lys Cys Ala Ser Leu Gln Lys Phe Gly Glu
195 200 205
Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gln Arg Phe Pro
210 215 220
Lys Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp Leu Thr Lys
225 230 235 240
Val His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys Ala Asp Asp
245 250 255
Arg Ala Asp Leu Ala Lys Tyr Ile Cys Glu Asn Gln Asp Ser Ile Ser
260 265 270
Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys Ser His
275 280 285
Cys Ile Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp Leu Pro Ser
290 295 300
Leu Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys Asn Tyr Ala
305 310 315 320
Glu Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Glu Tyr Ala Arg
325 330 335
Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu Ala Lys Thr
340 345 350
Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Pro His Glu
355 360 365
Cys Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val Glu Glu Pro
370 375 380
Gln Asn Leu Ile Lys Gln Asn Cys Glu Leu Phe Glu Gln Leu Gly Glu
385 390 395 400
Tyr Lys Phe Gln Asn Ala Leu Leu Val Arg Tyr Thr Lys Lys Val Pro
405 410 415
Gln Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn Leu Gly Lys
420 425 430
Val Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg Met Pro Cys
435 440 445
Ala Glu Asp Tyr Leu Ser Val Val Leu Asn Gln Leu Cys Val Leu His
450 455 460
Glu Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys Thr Glu Ser
465 470 475 480
Leu Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu Val Asp Glu Thr
485 490 495
Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe His Ala Asp
500 505 510
Ile Cys Thr Leu Ser Glu Lys Glu Arg Gln Ile Lys Lys Gln Thr Ala
515 520 525
Leu Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys Glu Gln Leu
530 535 540
Lys Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys Cys Cys Lys
545 550 555 560
Ala Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Lys Lys Leu Val
565 570 575
Ala Ala Ser Gln Ala Ala Leu Gly Leu
580 585
<210> 13
<211> 15
<212> PRT
<213> 人工序列
<220>
<223> 构建序列
<400> 13
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1 5 10 15
<210> 14
<211> 318
<212> PRT
<213> 人工序列
<220>
<223> 构建序列
<400> 14
Met Ala His Val Arg Gly Leu Gln Leu Pro Gly Cys Leu Ala Leu Ala
1 5 10 15
Ala Leu Cys Ser Leu Val His Ser Gln His Val Phe Leu Ala Pro Gln
20 25 30
Gln Ala Arg Ser Leu Leu Gln Arg Val Arg Arg His Gly Glu Gly Thr
35 40 45
Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Glu Gln Ala Ala Lys Glu
50 55 60
Phe Ile Ala Trp Leu Val Lys Gly Gly Gly Gly Gly Gly Gly Ser Gly
65 70 75 80
Gly Gly Gly Ser Gly Gly Gly Gly Ser Ala Glu Ser Lys Tyr Gly Pro
85 90 95
Pro Cys Pro Pro Cys Pro Ala Pro Glu Ala Ala Gly Gly Pro Ser Val
100 105 110
Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr
115 120 125
Pro Glu Val Thr Cys Val Val Val Asp Val Ser Gln Glu Asp Pro Glu
130 135 140
Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys
145 150 155 160
Thr Lys Pro Arg Glu Glu Gln Phe Asn Ser Thr Tyr Arg Val Val Ser
165 170 175
Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys
180 185 190
Cys Lys Val Ser Asn Lys Gly Leu Pro Ser Ser Ile Glu Lys Thr Ile
195 200 205
Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro
210 215 220
Pro Ser Gln Glu Glu Met Thr Lys Asn Gln Val Ser Leu Thr Cys Leu
225 230 235 240
Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn
245 250 255
Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser
260 265 270
Asp Gly Ser Phe Phe Leu Tyr Ser Arg Leu Thr Val Asp Lys Ser Arg
275 280 285
Trp Gln Glu Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu
290 295 300
His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Leu Gly
305 310 315
<210> 15
<211> 954
<212> DNA
<213> 人工序列
<220>
<223> 构建序列
<400> 15
atggctcacg ttcgaggact gcagctgcct ggatgtctgg ctcttgccgc tctgtgtagc 60
ctggtgcaca gccagcacgt gtttctggct cctcagcaag ccagatcact gctgcagaga 120
gttagaaggc acggcgaggg cacctttacc tccgacgtgt ctagctacct ggaagaacag 180
gccgccaaag agtttatcgc ctggctggtc aaaggtggcg gcggaggcgg aggaagcggt 240
ggcggaggtt caggtggtgg tggatctgcc gagtctaagt acggccctcc ttgtcctccc 300
tgtcctgctc ccgaagctgc tggcggccca tccgtgtttc tgttccctcc aaagcctaag 360
gacaccctga tgatcagcag aacccctgaa gtgacctgcg tggtggtcga cgtgtcccaa 420
gaggatcctg aggtgcagtt caattggtac gtggacggcg tggaagtgca caacgccaag 480
accaagccta gagaggaaca gttcaacagc acctacagag tggtgtccgt gctgaccgtg 540
ctgcaccagg attggctgaa cggcaaagag tacaagtgca aggtgtccaa caagggcctg 600
cctagctcca tcgagaaaac catcagcaag gccaagggcc agccaagaga accccaggtg 660
tacacactgc ctccaagcca agaggaaatg accaagaacc aggtgtccct gacctgcctc 720
gtgaagggct tctacccttc cgatatcgcc gtggaatggg agagcaatgg ccagcctgag 780
aacaactaca agaccacacc tcctgtgctg gacagcgacg gctcattctt cctgtacagc 840
agactgaccg tggacaagag cagatggcaa gagggcaacg tgttcagctg cagcgtgatg 900
cacgaggccc tgcacaacca ctacacccag aagtctctga gcctgagcct gggc 954
<210> 16
<211> 4931
<212> DNA
<213> 人工序列
<220>
<223> 构建序列
<400> 16
ctgcgcgctc gctcgctcac tgaggccgcc cgggcaaagc ccgggcgtcg ggcgaccttt 60
ggtcgcccgg cctcagtgag cgagcgagcg cgcagagagg gagtggccaa ctccatcact 120
aggggttcct tgtagttaat gattaacccg ccatgctact tatctacgta gccatgctct 180
agtacgcgtt cgagctcgcc ccgttacata acttacggta aatggcccgc ctggctgacc 240
gcccaacgac ccccgcccat tgacgtcaat aatgacgtat gttcccatag taacgccaat 300
agggactttc cattgacgtc aatgggtgga gtatttacgg taaactgccc acttggcagt 360
acatcaagtg tatcatatgc caagtacgcc ccctattgac gtcaatgacg gtaaatggcc 420
cgcctggcat tatgcccagt acatgacctt atgggacttt cctacttggc agtacatcta 480
cgtattagtc atcgctatta ccatggtgat gcggttttgg cagtacatca atgggcgtgg 540
atagcggttt gactcacggg gatttccaag tctccacccc attgacgtca atgggagttt 600
gttttggcac caaaatcaac gggactttcc aaaatgtcgt aacaactccg ccccattgac 660
gcaaatgggc ggtaggcgtg tacggtggga ggtctatata agcagagctc gtttagtgaa 720
ccgtcagatc gcctggagac gccatccacg ctgttttgac ctccatagaa gacaccggga 780
ccgatccagc ctccggggga tcttggtggc gtgaaactcc cgcagatctt cggccagcga 840
attccagaag ccaccatgga ctatcctgct gccaagaggg tcaagttgga ctctagaatc 900
ctctggcatg agatgtggca tgaaggcctg gaagaggcat ctcgtttgta ctttggggaa 960
aggaacgtga aaggcatgtt tgaggtgctg gagcccttgc atgctatgat ggaacggggc 1020
ccccagactc tgaaggaaac atcctttaat caggcctatg gtcgagattt aatggaggcc 1080
caagagtggt gcaggaagta catgaaatca gggaatgtca aggacctcct ccaagcctgg 1140
gacctctatt atcatgtgtt ccgacgaatc tcaaagacta gagatgagtt tcccaccatg 1200
gtgtttcctt ctgggcagat cagccaggcc tcggccttgg ccccggcccc tccccaagtc 1260
ctgccccagg ctccagcccc tgcccctgct ccagccatgg tatcagctct ggcccaggcc 1320
ccagcccctg tcccagtcct agccccaggc cctcctcagg ctgtggcccc acctgccccc 1380
aagcccaccc aggctgggga aggaacgctg tcagaggccc tgctgcagct gcagtttgat 1440
gatgaagacc tgggggcctt gcttggcaac agcacagacc cagctgtgtt cacagacctg 1500
gcatccgtcg acaactccga gtttcagcag ctgctgaacc agggcatacc tgtggccccc 1560
cacacaactg agcccatgct gatggagtac cctgaggcta taactcgcct agtgacaggg 1620
gcccagaggc cccccgaccc agctcctgct ccactggggg ccccggggct ccccaatggc 1680
ctcctttcag gagatgaaga cttctcctcc attgcggaca tggacttctc agccctgctg 1740
agtcagatca gctccggctc tggcgaaggc agaggcagcc tgcttacctg tggcgacgtg 1800
gaagagaacc ccggacctgc tgccaagagg gtcaagttgg actctagaga acgcccatat 1860
gcttgccctg tcgagtcctg cgatcgccgc ttttctcgct cggatgagct tacccgccat 1920
atccgcatcc acacaggcca gaagcccttc cagtgtcgaa tctgcatgcg taacttcagt 1980
cgtagtgacc accttaccac ccacatccgc acccacacag gcggcggccg caggaggaag 2040
aaacgcacca gcatagagac caacatccgt gtggccttag agaagagttt cttggagaat 2100
caaaagccta cctcggaaga gatcactatg attgctgatc agctcaatat ggaaaaagag 2160
gtgattcgtg tttggttctg taaccgccgc cagaaagaaa aaagaatcaa cactagagga 2220
gtgcaggtgg aaaccatctc cccaggagac gggcgcacct tccccaagcg cggccagacc 2280
tgcgtggtgc actacaccgg gatgcttgaa gatggaaaga aatttgattc ctcccgggac 2340
agaaacaagc cctttaagtt tatgctaggc aagcaggagg tgatccgagg ctgggaagaa 2400
ggggttgccc agatgagtgt gggtcagaga gccaaactga ctatatctcc agattatgcc 2460
tatggtgcca ctgggcaccc aggcatcatc ccaccacatg ccactctcgt cttcgatgtg 2520
gagcttctaa aactggaaac tagaggcgtt caggtggaaa ccatcagtcc aggggatggc 2580
cgaacttttc caaagagagg gcagacttgc gtcgtgcatt atactggtat gctggaggat 2640
gggaaaaagt tcgactcttc cagagatcgg aacaaaccat tcaaattcat gctcgggaaa 2700
caggaagtta tccgcggatg ggaggagggc gtggcccaga tgtccgtggg ccagcgcgcc 2760
aagctaacca tctccccaga ctacgcctac ggagccaccg gacaccccgg tatcataccc 2820
ccacacgcca cccttgtgtt tgacgtggaa ctgcttaagc tagagactag aggcgtgcag 2880
gtcgagacca tcagccccgg cgacggccgc acctttccca agagaggcca gacttgcgtg 2940
gtccactaca ccggcatgct ggaggacggc aagaagttcg acagcagccg cgaccgcaac 3000
aagcccttca agttcatgct gggcaaacag gaagtgatcc gcggctggga ggaaggcgtg 3060
gctcagatga gcgtggggca gcgggccaag ctgaccatca gccccgacta tgcctacggc 3120
gccaccggcc accccggcat catccccccc cacgccaccc tggtgttcga cgtggagctg 3180
ctgaagctgg agtgataagg atccccactc cagtgcccac cagccttgtc ctaataaaat 3240
taagttgcat cattttgtct gactaggtgt ccttctataa tattatgggg tggagggggg 3300
tggtttggag caaggcgcgt gctagctaat gatgggcgct cgagtaatga tgggcggtcg 3360
actaatgatg ggcgctcgag taatgatggg cgtctagcta atgatgggcg ctcgagtaat 3420
gatgggcggt cgactaatga tgggcgctcg agtaatgatg ggcgtctaga acgcgaatta 3480
attcaacatt ttgacacccc cataatattt ttccagaatt aacagtataa attgcatctc 3540
ttgttcaaga gttccctatc actctcttta atcactactc acagtaacct caactcctgc 3600
cacaagcttg aattcgccct gcagcgggaa ttgccaccat ggctcacgtt cgaggactgc 3660
agctgcctgg atgtctggct cttgccgctc tgtgtagcct ggtgcacagc cagcacgtgt 3720
ttctggctcc tcagcaagcc agatcactgc tgcagagagt tagaaggcac ggcgagggca 3780
cctttacctc cgacgtgtct agctacctgg aagaacaggc cgccaaagag tttatcgcct 3840
ggctggtcaa aggtggcggc ggaggcggag gaagcggtgg cggaggttca ggtggtggtg 3900
gatctgccga gtctaagtac ggccctcctt gtcctccctg tcctgctccc gaagctgctg 3960
gcggcccatc cgtgtttctg ttccctccaa agcctaagga caccctgatg atcagcagaa 4020
cccctgaagt gacctgcgtg gtggtcgacg tgtcccaaga ggatcctgag gtgcagttca 4080
attggtacgt ggacggcgtg gaagtgcaca acgccaagac caagcctaga gaggaacagt 4140
tcaacagcac ctacagagtg gtgtccgtgc tgaccgtgct gcaccaggat tggctgaacg 4200
gcaaagagta caagtgcaag gtgtccaaca agggcctgcc tagctccatc gagaaaacca 4260
tcagcaaggc caagggccag ccaagagaac cccaggtgta cacactgcct ccaagccaag 4320
aggaaatgac caagaaccag gtgtccctga cctgcctcgt gaagggcttc tacccttccg 4380
atatcgccgt ggaatgggag agcaatggcc agcctgagaa caactacaag accacacctc 4440
ctgtgctgga cagcgacggc tcattcttcc tgtacagcag actgaccgtg gacaagagca 4500
gatggcaaga gggcaacgtg ttcagctgca gcgtgatgca cgaggccctg cacaaccact 4560
acacccagaa gtctctgagc ctgagcctgg gctaaggtac cgatcttttt ccctctgcca 4620
aaaattatgg ggacatcatg aagccccttg agcatctgac ttctggctaa taaaggaaat 4680
ttattttcat tgcaatagtg tgttggaatt ttttgtgtct ctcactcgga aggcgcgccg 4740
atcctcgaga ctagagcatg gctacgtaga taagtagcat ggcgggttaa tcattaacta 4800
caaggaaccc ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcactga 4860
ggccgggcga ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct cagtgagcga 4920
gcgagcgcgc a 4931
<210> 17
<211> 224
<212> PRT
<213> 恒河猴(Macaca mulatta)
<400> 17
Pro Pro Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser
1 5 10 15
Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg
20 25 30
Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser Gln Glu Asp Pro
35 40 45
Glu Val Gln Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala
50 55 60
Gln Thr Lys Pro Arg Glu Arg Gln Phe Asn Ser Thr Tyr Arg Val Val
65 70 75 80
Ser Val Leu Thr Val Thr His Gln Asp Trp Leu Asn Gly Lys Glu Tyr
85 90 95
Thr Cys Lys Val Ser Asn Lys Gly Leu Pro Ala Pro Ile Glu Lys Thr
100 105 110
Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Ile Leu
115 120 125
Pro Pro Pro Gln Glu Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys
130 135 140
Leu Val Thr Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser
145 150 155 160
Asn Gly Gln Pro Glu Asn Thr Tyr Lys Thr Thr Pro Pro Val Leu Asp
165 170 175
Ser Asp Gly Ser Tyr Leu Leu Tyr Ser Lys Leu Thr Val Asn Lys Ser
180 185 190
Arg Trp Gln Pro Gly Asn Ile Phe Thr Cys Ser Val Met His Glu Ala
195 200 205
Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Val Ser Pro Gly Lys
210 215 220
<210> 18
<211> 2211
<212> DNA
<213> 腺相关病毒rh91
<400> 18
atggctgccg atggttatct tccagattgg ctcgaggaca acctctctga gggcattcgc 60
gagtggtggg cgctgaaacc tggagccccg aaacccaaag ccaaccagca aaagcaggac 120
gacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180
aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 240
cagcagctca aagcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300
caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360
gccaagaagc gggttctcga accttttggt ctggttgagg aagcagctaa gacggctcct 420
ggaaagaaac gtccggtaga gcagtcgccc caagaaccag actcctcctc gggcattggc 480
aaatcaggcc agcagcccgc caaaaagaga ctcaatttcg gtcagactgg cgactcagag 540
tcagtccccg accctcaacc tctcggagaa cctccagaaa cccccgctgc tgtgggacct 600
actacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660
gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggctgggcga cagagtcatc 720
accaccagca cccgaacctg ggcccttcct acctacaaca accacctcta caagcaaatc 780
tccagcgctt caacgggggc cagtaacgac aaccactact ttggctacag caccccctgg 840
gggtattttg atttcaacag attccactgc cacttctcac cacgtgactg gcagcgactc 900
attaacaaca actggggatt ccggcccaag agactcaact tcaagctctt caacatccag 960
gtcaaggagg tcacgacgaa tgatggcgtc acaaccatcg ctaataacct taccagcacg 1020
gttcaagtgt tctcggactc ggagtaccag ctgccgtacg tcctcggttc tgcgcaccag 1080
ggctgcctcc ctccgttccc ggcggacgta ttcatgattc ctcagtacgg ctacctaacg 1140
ctcaacaatg gcagccaggc cgtaggacgt tcatcctttt attgcctgga atatttccca 1200
tctcaaatgc tgagaacggg caacaacttt accttcagct acacctttga agatgtgcct 1260
ttccacagca gttacgcgca cagccagagc ctggacaggc taatgaatcc tctaatcgac 1320
cagtacctgt attacctaaa cagaactcag aatcaatccg gaagtgcaca aaacaaggac 1380
ttgctgttta gccgggggtc tccagctggc atgtctgttc agcccaaaaa ctggctaccc 1440
gggccctgtt accgacagca gcgtgtttct aaaacaaaaa cagacaacaa caacagcaac 1500
tttacctgga ctggtgcctc caaatacaat ctgaacggac gtgaatccat cattaaccct 1560
ggcaccgcta tggcatccca caaggacgac gaagacaaat tttttcccat gagcggtgtt 1620
atgatttttg gcaaagaaaa tgcaggagca tcaaacactg cattagacaa tgttatgatt 1680
acagatgaag aggaaattaa agctaccaac cccgtggcca ccgagagatt tggaactgtg 1740
gcagtcaatc tccaaagcag caatacagac cctgcaacag gagacgtgca tgtcatgggg 1800
gctttacctg gcatggtgtg gcaagacaga gacgtgtacc tgcagggtcc catttgggcc 1860
aagattcctc acacggatgg acactttcac ccgtctcctc ttatgggcgg ctttggactt 1920
aagcacccgc ctcctcagat cctcatcaaa aacacgcctg ttcctgcgaa tcctccggca 1980
gagttttcgg ctacaaagtt tgcttcattc atcacccagt actccacagg acaagtgagc 2040
gtggaaattg aatgggagct gcagaaagaa aacagtaagc gctggaatcc tgaagtgcag 2100
tacacctcca actacgcgaa atctgccaac gttgatttca ctgtggacaa caatggactt 2160
tatactgagc ctcgccccat tggcacccgt taccttaccc gtccccttta a 2211
<210> 19
<211> 2211
<212> DNA
<213> 腺相关病毒rh91
<220>
<221> misc_feature
<222> (1)..(2211)
<223> AAVrh.91
<400> 19
atggctgctg acggttatct tccagattgg ctcgaggaca acctttctga aggcattcgt 60
gagtggtggg ctctgaaacc tggagcccct aaacccaaag cgaaccaaca aaagcaggac 120
gacggccggg gtcttgtgct tccgggttac aaatacctcg gacccttcaa cggactcgac 180
aaaggagagc cggtcaacgc ggcggacgcg gcagccctcg aacacgacaa agcttacgac 240
cagcagctca aggccggtga caacccgtac ctccggtaca accacgccga cgccgagttt 300
caggagcgtc ttcaagaaga tacgtctttt gggggcaacc ttggcagagc agtcttccag 360
gccaaaaaga gggttcttga gccttttggt ctggttgagg aagcagctaa aacggctcct 420
ggaaagaaga ggcctgtaga gcagtctcct caggaaccgg actcatcatc tggtattggc 480
aaatcgggcc agcagcctgc caaaaaaaga ctaaatttcg gtcagactgg cgactcagag 540
tcagtccccg accctcaacc tctcggagaa cctccagaaa cccccgctgc tgtgggacct 600
actacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660
gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggctgggcga cagagtcatc 720
accaccagca cccgaacctg ggcccttcct acctacaaca accacctcta caagcaaatc 780
tccagcgctt caacgggggc cagtaacgac aaccactact ttggctacag caccccctgg 840
gggtattttg atttcaacag attccactgc cacttctcac cacgtgactg gcagcgactc 900
attaacaaca actggggatt ccggcccaag agactcaact tcaagctctt caacatccag 960
gtcaaggagg tcacgacgaa tgatggcgtc acaaccatcg ctaataacct taccagcacg 1020
gttcaagtgt tctcggactc ggagtaccag ctgccgtacg tcctcggttc tgcgcaccag 1080
ggctgcctcc ctccgttccc ggcggacgta ttcatgattc ctcagtatgg atacctcacc 1140
ctgaacaacg gaagtcaagc ggtgggacgc tcatcctttt actgcctgga gtacttccct 1200
tcgcagatgc taaggactgg aaataacttc accttcagct ataccttcga ggatgtacct 1260
tttcacagca gctacgctca cagccagagt ttggatcgct tgatgaatcc tcttattgat 1320
cagtatctgt actacctgaa cagaacgcaa aatcaatctg gaagtgcaca aaacaaggac 1380
ctgcttttta gccgggggtc tcctgctggc atgtctgttc agcccaaaaa ttggctacct 1440
gggccctgct accggcaaca gagagtttca aagactaaaa cagacaacaa caacagtaac 1500
tttacctgga caggtgccag caaatataat ctcaatggcc gcgaatcgat cattaatcca 1560
ggaaccgcta tggccagtca caaggacgat gaagacaaat ttttccctat gagcggcgtt 1620
atgatatttg gcaaagaaaa tgcaggagca agtaacactg cattagataa tgtaatgatt 1680
acggatgaag aagagattaa agctaccaat cctgtggcaa cagagagatt tggaactgtg 1740
gcagtcaact tgcagagctc aaatacagac cccgcaactg gagacgtcca tgtcatgggg 1800
gccttacctg gcatggtgtg gcaagatcgt gacgtgtacc ttcaaggacc tatctgggca 1860
aagattcctc acacggatgg acactttcat ccttctcctc tgatgggagg ctttggactg 1920
aaacatccgc ctcctcaaat cctcatcaaa aatactccgg taccggcaaa tcctccggca 1980
gagttcagcg ctacaaagtt tgcttcattt atcactcagt actccactgg acaggtcagc 2040
gtggaaattg agtgggagct acagaaagaa aacagcaaac gttggaatcc agaggtgcag 2100
tacacttcca actacgcgaa gtctgccaat gtggacttta ctgtagacaa caatggtctt 2160
tatactgaac ctcgccctat tggaacccgg tatctcacac gacccttgta a 2211
<210> 20
<211> 736
<212> PRT
<213> 腺相关病毒rh91
<400> 20
Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser
1 5 10 15
Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro
20 25 30
Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro
35 40 45
Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro
50 55 60
Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp
65 70 75 80
Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala
85 90 95
Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly
100 105 110
Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro
115 120 125
Phe Gly Leu Val Glu Glu Ala Ala Lys Thr Ala Pro Gly Lys Lys Arg
130 135 140
Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly
145 150 155 160
Lys Ser Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr
165 170 175
Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro
180 185 190
Glu Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly
195 200 205
Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala
210 215 220
Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile
225 230 235 240
Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu
245 250 255
Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His
260 265 270
Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe
275 280 285
His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn
290 295 300
Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln
305 310 315 320
Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn
325 330 335
Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro
340 345 350
Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala
355 360 365
Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly
370 375 380
Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro
385 390 395 400
Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe
405 410 415
Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp
420 425 430
Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg
435 440 445
Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser
450 455 460
Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro
465 470 475 480
Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn
485 490 495
Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn
500 505 510
Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys
515 520 525
Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly
530 535 540
Lys Glu Asn Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile
545 550 555 560
Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg
565 570 575
Phe Gly Thr Val Ala Val Asn Leu Gln Ser Ser Asn Thr Asp Pro Ala
580 585 590
Thr Gly Asp Val His Val Met Gly Ala Leu Pro Gly Met Val Trp Gln
595 600 605
Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His
610 615 620
Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu
625 630 635 640
Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala
645 650 655
Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr
660 665 670
Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln
675 680 685
Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn
690 695 700
Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu
705 710 715 720
Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu
725 730 735
<210> 21
<211> 29
<212> PRT
<213> 构建序列
<220>
<221> SITE
<222> (20)..(21)
<223> 切割
<400> 21
Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu
1 5 10 15
Glu Asn Pro Gly Pro Ala Ala Lys Arg Val Lys Leu Asp
20 25
<210> 22
<211> 33
<212> PRT
<213> 构建序列
<220>
<221> SITE
<222> (20)..(21)
<223> 切割
<400> 22
Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu
1 5 10 15
Glu Asn Pro Gly Pro Met Tyr Asp Pro Ala Ala Lys Arg Val Lys Leu
20 25 30
Asp
<210> 23
<211> 279
<212> DNA
<213> 人工序列
<220>
<223> 人FKBP12-雷帕霉素相关蛋白(FRAP)的FKBP12-雷帕霉素结合
(FRB)结构域的核酸序列
<400> 23
atggactatc ctgctgccaa gagggtcaag ttggactcta gaatcctctg gcatgagatg 60
tggcatgaag gcctggaaga ggcatctcgt ttgtactttg gggaaaggaa cgtgaaaggc 120
atgtttgagg tgctggagcc cttgcatgct atgatggaac ggggccccca gactctgaag 180
gaaacatcct ttaatcaggc ctatggtcga gatttaatgg aggcccaaga gtggtgcagg 240
aagtacatga aatcagggaa tgtcaaggac ctcctccaa 279
<210> 24
<211> 93
<212> PRT
<213> 人工序列
<220>
<223> 人FKBP12-雷帕霉素相关蛋白(FRAP)的FKBP12-雷帕霉素结合
(FRB)结构域的氨基酸序列
<400> 24
Met Asp Tyr Pro Ala Ala Lys Arg Val Lys Leu Asp Ser Arg Ile Leu
1 5 10 15
Trp His Glu Met Trp His Glu Gly Leu Glu Glu Ala Ser Arg Leu Tyr
20 25 30
Phe Gly Glu Arg Asn Val Lys Gly Met Phe Glu Val Leu Glu Pro Leu
35 40 45
His Ala Met Met Glu Arg Gly Pro Gln Thr Leu Lys Glu Thr Ser Phe
50 55 60
Asn Gln Ala Tyr Gly Arg Asp Leu Met Glu Ala Gln Glu Trp Cys Arg
65 70 75 80
Lys Tyr Met Lys Ser Gly Asn Val Lys Asp Leu Leu Gln
85 90
<210> 25
<211> 573
<212> DNA
<213> 人工序列
<220>
<223> 来自人的NF-κB的核酸序列p65亚基
<400> 25
gatgagtttc ccaccatggt gtttccttct gggcagatca gccaggcctc ggccttggcc 60
ccggcccctc cccaagtcct gccccaggct ccagcccctg cccctgctcc agccatggta 120
tcagctctgg cccaggcccc agcccctgtc ccagtcctag ccccaggccc tcctcaggct 180
gtggccccac ctgcccccaa gcccacccag gctggggaag gaacgctgtc agaggccctg 240
ctgcagctgc agtttgatga tgaagacctg ggggccttgc ttggcaacag cacagaccca 300
gctgtgttca cagacctggc atccgtcgac aactccgagt ttcagcagct gctgaaccag 360
ggcatacctg tggcccccca cacaactgag cccatgctga tggagtaccc tgaggctata 420
actcgcctag tgacaggggc ccagaggccc cccgacccag ctcctgctcc actgggggcc 480
ccggggctcc ccaatggcct cctttcagga gatgaagact tctcctccat tgcggacatg 540
gacttctcag ccctgctgag tcagatcagc tcc 573
<210> 26
<211> 191
<212> PRT
<213> 人工序列
<220>
<223> 来自人的NF-κB的氨基酸序列p65亚基
<400> 26
Asp Glu Phe Pro Thr Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala
1 5 10 15
Ser Ala Leu Ala Pro Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala
20 25 30
Pro Ala Pro Ala Pro Ala Met Val Ser Ala Leu Ala Gln Ala Pro Ala
35 40 45
Pro Val Pro Val Leu Ala Pro Gly Pro Pro Gln Ala Val Ala Pro Pro
50 55 60
Ala Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu
65 70 75 80
Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn
85 90 95
Ser Thr Asp Pro Ala Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser
100 105 110
Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr
115 120 125
Thr Glu Pro Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val
130 135 140
Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala
145 150 155 160
Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser
165 170 175
Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser
180 185 190
<210> 27
<211> 672
<212> DNA
<213> 人工序列
<220>
<223> CMV启动子
<400> 27
acgcgttcga gctcgccccg ttacataact tacggtaaat ggcccgcctg gctgaccgcc 60
caacgacccc cgcccattga cgtcaataat gacgtatgtt cccatagtaa cgccaatagg 120
gactttccat tgacgtcaat gggtggagta tttacggtaa actgcccact tggcagtaca 180
tcaagtgtat catatgccaa gtacgccccc tattgacgtc aatgacggta aatggcccgc 240
ctggcattat gcccagtaca tgaccttatg ggactttcct acttggcagt acatctacgt 300
attagtcatc gctattacca tggtgatgcg gttttggcag tacatcaatg ggcgtggata 360
gcggtttgac tcacggggat ttccaagtct ccaccccatt gacgtcaatg ggagtttgtt 420
ttggcaccaa aatcaacggg actttccaaa atgtcgtaac aactccgccc cattgacgca 480
aatgggcggt aggcgtgtac ggtgggaggt ctatataagc agagctcgtt tagtgaaccg 540
tcagatcgcc tggagacgcc atccacgctg ttttgacctc catagaagac accgggaccg 600
atccagcctc cgggggatct tggtggcgtg aaactcccgc agatcttcgg ccagcgaatt 660
ccagaagcca cc 672
<210> 28
<211> 402
<212> DNA
<213> 人工序列
<220>
<223> 锌指同源结构域(ZFHD1)的核酸序列
<400> 28
cctgctgcca agagggtcaa gttggactct agagaacgcc catatgcttg ccctgtcgag 60
tcctgcgatc gccgcttttc tcgctcggat gagcttaccc gccatatccg catccacaca 120
ggccagaagc ccttccagtg tcgaatctgc atgcgtaact tcagtcgtag tgaccacctt 180
accacccaca tccgcaccca cacaggcggc ggccgcagga ggaagaaacg caccagcata 240
gagaccaaca tccgtgtggc cttagagaag agtttcttgg agaatcaaaa gcctacctcg 300
gaagagatca ctatgattgc tgatcagctc aatatggaaa aagaggtgat tcgtgtttgg 360
ttctgtaacc gccgccagaa agaaaaaaga atcaacacta ga 402
<210> 29
<211> 134
<212> PRT
<213> 人工序列
<220>
<223> 锌指同源结构域(ZFHD1)的氨基酸序列
<400> 29
Pro Ala Ala Lys Arg Val Lys Leu Asp Ser Arg Glu Arg Pro Tyr Ala
1 5 10 15
Cys Pro Val Glu Ser Cys Asp Arg Arg Phe Ser Arg Ser Asp Glu Leu
20 25 30
Thr Arg His Ile Arg Ile His Thr Gly Gln Lys Pro Phe Gln Cys Arg
35 40 45
Ile Cys Met Arg Asn Phe Ser Arg Ser Asp His Leu Thr Thr His Ile
50 55 60
Arg Thr His Thr Gly Gly Gly Arg Arg Arg Lys Lys Arg Thr Ser Ile
65 70 75 80
Glu Thr Asn Ile Arg Val Ala Leu Glu Lys Ser Phe Leu Glu Asn Gln
85 90 95
Lys Pro Thr Ser Glu Glu Ile Thr Met Ile Ala Asp Gln Leu Asn Met
100 105 110
Glu Lys Glu Val Ile Arg Val Trp Phe Cys Asn Arg Arg Gln Lys Glu
115 120 125
Lys Arg Ile Asn Thr Arg
130
<210> 30
<211> 978
<212> DNA
<213> 人工序列
<220>
<223> FK506结合蛋白结构域(FKBP)亚基基因的核酸序列
<400> 30
ggagtgcagg tggaaaccat ctccccagga gacgggcgca ccttccccaa gcgcggccag 60
acctgcgtgg tgcactacac cgggatgctt gaagatggaa agaaatttga ttcctcccgg 120
gacagaaaca agccctttaa gtttatgcta ggcaagcagg aggtgatccg aggctgggaa 180
gaaggggttg cccagatgag tgtgggtcag agagccaaac tgactatatc tccagattat 240
gcctatggtg ccactgggca cccaggcatc atcccaccac atgccactct cgtcttcgat 300
gtggagcttc taaaactgga aactagaggc gttcaggtgg aaaccatcag tccaggggat 360
ggccgaactt ttccaaagag agggcagact tgcgtcgtgc attatactgg tatgctggag 420
gatgggaaaa agttcgactc ttccagagat cggaacaaac cattcaaatt catgctcggg 480
aaacaggaag ttatccgcgg atgggaggag ggcgtggccc agatgtccgt gggccagcgc 540
gccaagctaa ccatctcccc agactacgcc tacggagcca ccggacaccc cggtatcata 600
cccccacacg ccacccttgt gtttgacgtg gaactgctta agctagagac tagaggcgtg 660
caggtcgaga ccatcagccc cggcgacggc cgcacctttc ccaagagagg ccagacttgc 720
gtggtccact acaccggcat gctggaggac ggcaagaagt tcgacagcag ccgcgaccgc 780
aacaagccct tcaagttcat gctgggcaaa caggaagtga tccgcggctg ggaggaaggc 840
gtggctcaga tgagcgtggg gcagcgggcc aagctgacca tcagccccga ctatgcctac 900
ggcgccaccg gccaccccgg catcatcccc ccccacgcca ccctggtgtt cgacgtggag 960
ctgctgaagc tggagtga 978
<210> 31
<211> 107
<212> PRT
<213> 人工序列
<220>
<223> FK506结合蛋白结构域(FKBP)亚基基因的氨基酸序列
<400> 31
Gly Val Gln Val Glu Thr Ile Ser Pro Gly Asp Gly Arg Thr Phe Pro
1 5 10 15
Lys Arg Gly Gln Thr Cys Val Val His Tyr Thr Gly Met Leu Glu Asp
20 25 30
Gly Lys Lys Phe Asp Ser Ser Arg Asp Arg Asn Lys Pro Phe Lys Phe
35 40 45
Met Leu Gly Lys Gln Glu Val Ile Arg Gly Trp Glu Glu Gly Val Ala
50 55 60
Gln Met Ser Val Gly Gln Arg Ala Lys Leu Thr Ile Ser Pro Asp Tyr
65 70 75 80
Ala Tyr Gly Ala Thr Gly His Pro Gly Ile Ile Pro Pro His Ala Thr
85 90 95
Leu Val Phe Asp Val Glu Leu Leu Lys Leu Glu
100 105
<210> 32
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> ZFHD结合位点
<400> 32
aatgatgggc gctcgagt 18
<210> 33
<211> 665
<212> DNA
<213> 人工序列
<220>
<223> 构建序列
<400> 33
ctagtcgaca ttgattattg actagttatt aatagtaatc aattacgggg tcattagttc 60
atagcccata tatggagttc cgcgttacat aacttacggt aaatggcccg cctggctgac 120
cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata gtaacgccaa 180
tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc cacttggcag 240
tacatcaagt gtatcatatg ccaagtacgc cccctattga cgtcaatgac ggtaaatggc 300
ccgcctggca ttatgcccag tacatgacct tatgggactt tcctacttgg cagtacatct 360
acgtattagt catcgctatt accatggtcg aggtgagccc cacgttctgc ttcactctcc 420
ccatctcccc cccctcccca cccccaattt tgtatttatt tattttttaa ttattttgtg 480
cagcgatggg ggcggggggg gggggggggc gcgcgccagg cggggcgggg cggggcgagg 540
ggcggggcgg ggcgaggcgg agaggtgcgg cggcagccaa tcagagcggc gcgctccgaa 600
agtttccttt tatggcgagg cggcggcggc ggcggcccta taaaaagcga agcgcgcggc 660
gggcg 665
<210> 34
<211> 2903
<212> DNA
<213> 人工序列
<220>
<223> 构建序列
<400> 34
ctagtcgaca ttgattattg actagttatt aatagtaatc aattacgggg tcattagttc 60
atagcccata tatggagttc cgcgttacat aacttacggt aaatggcccg cctggctgac 120
cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata gtaacgccaa 180
tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc cacttggcag 240
tacatcaagt gtatcatatg ccaagtacgc cccctattga cgtcaatgac ggtaaatggc 300
ccgcctggca ttatgcccag tacatgacct tatgggactt tcctacttgg cagtacatct 360
acgtattagt catcgctatt accatggtcg aggtgagccc cacgttctgc ttcactctcc 420
ccatctcccc cccctcccca cccccaattt tgtatttatt tattttttaa ttattttgtg 480
cagcgatggg ggcggggggg gggggggggc gcgcgccagg cggggcgggg cggggcgagg 540
ggcggggcgg ggcgaggcgg agaggtgcgg cggcagccaa tcagagcggc gcgctccgaa 600
agtttccttt tatggcgagg cggcggcggc ggcggcccta taaaaagcga agcgcgcggc 660
gggcgggagt cgctgcgcgc tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc 720
gcccgccccg gctctgactg accgcgttac tcccacaggt gagcgggcgg gacggccctt 780
ctcctccggg ctgtaattag cgcttggttt aatgacggct tgtttctttt ctgtggctgc 840
gtgaaagcct tgaggggctc cgggagggcc ctttgtgcgg ggggagcggc tcggggggtg 900
cgtgcgtgtg tgtgtgcgtg gggagcgccg cgtgcggctc cgcgctgccc ggcggctgtg 960
agcgctgcgg gcgcggcgcg gggctttgtg cgctccgcag tgtgcgcgag gggagcgcgg 1020
ccgggggcgg tgccccgcgg tgcggggggg gctgcgaggg gaacaaaggc tgcgtgcggg 1080
gtgtgtgcgt gggggggtga gcagggggtg tgggcgcgtc ggtcgggctg caaccccccc 1140
tgcacccccc tccccgagtt gctgagcacg gcccggcttc gggtgcgggg ctccgtacgg 1200
ggcgtggcgc ggggctcgcc gtgccgggcg gggggtggcg gcaggtgggg gtgccgggcg 1260
gggcggggcc gcctcgggcc ggggagggct cgggggaggg gcgcggcggc ccccggagcg 1320
ccggcggctg tcgaggcgcg gcgagccgca gccattgcct tttatggtaa tcgtgcgaga 1380
gggcgcaggg acttcctttg tcccaaatct gtgcggagcc gaaatctggg aggcgccgcc 1440
gcaccccctc tagcgggcgc ggggcgaagc ggtgcggcgc cggcaggaag gaaatgggcg 1500
gggagggcct tcgtgcgtcg ccgcgccgcc gtccccttct ccctctccag cctcggggct 1560
gtccgcgggg ggacggctgc cttcgggggg gacggggcag ggcggggttc ggcttctggc 1620
gtgtgaccgg cggctctaga gcctctgcta accatgttca tgccttcttc tttttcctac 1680
agctcctggg caacgtgctg gttattgtgc tgtctcatca ttttggcaaa gaattcgccc 1740
tgcagcggga attgccacca tggctcacgt tcgaggactg cagctgcctg gatgtctggc 1800
tcttgccgct ctgtgtagcc tggtgcacag ccagcacgtg tttctggctc ctcagcaagc 1860
cagatcactg ctgcagagag ttagaaggca cggcgagggc acctttacct ccgacgtgtc 1920
tagctacctg gaagaacagg ccgccaaaga gtttatcgcc tggctggtca aaggtggcgg 1980
cggaggcgga ggaagcggtg gcggaggttc aggtggtggt ggatctgccg agtctaagta 2040
cggccctcct tgtcctccct gtcctgctcc cgaagctgct ggcggcccat ccgtgtttct 2100
gttccctcca aagcctaagg acaccctgat gatcagcaga acccctgaag tgacctgcgt 2160
ggtggtcgac gtgtcccaag aggatcctga ggtgcagttc aattggtacg tggacggcgt 2220
ggaagtgcac aacgccaaga ccaagcctag agaggaacag ttcaacagca cctacagagt 2280
ggtgtccgtg ctgaccgtgc tgcaccagga ttggctgaac ggcaaagagt acaagtgcaa 2340
ggtgtccaac aagggcctgc ctagctccat cgagaaaacc atcagcaagg ccaagggcca 2400
gccaagagaa ccccaggtgt acacactgcc tccaagccaa gaggaaatga ccaagaacca 2460
ggtgtccctg acctgcctcg tgaagggctt ctacccttcc gatatcgccg tggaatggga 2520
gagcaatggc cagcctgaga acaactacaa gaccacacct cctgtgctgg acagcgacgg 2580
ctcattcttc ctgtacagca gactgaccgt ggacaagagc agatggcaag agggcaacgt 2640
gttcagctgc agcgtgatgc acgaggccct gcacaaccac tacacccaga agtctctgag 2700
cctgagcctg ggctaaggta cctctagagt cgacccgggc ggcctcgagg acggggtgaa 2760
ctacgcctga ggatccgatc tttttccctc tgccaaaaat tatggggaca tcatgaagcc 2820
ccttgagcat ctgacttctg gctaataaag gaaatttatt ttcattgcaa tagtgtgttg 2880
gaattttttg tgtctctcac tcg 2903
<210> 35
<211> 2897
<212> DNA
<213> 人工序列
<220>
<223> 构建序列
<400> 35
ctagtcgaca ttgattattg actagttatt aatagtaatc aattacgggg tcattagttc 60
atagcccata tatggagttc cgcgttacat aacttacggt aaatggcccg cctggctgac 120
cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata gtaacgccaa 180
tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc cacttggcag 240
tacatcaagt gtatcatatg ccaagtacgc cccctattga cgtcaatgac ggtaaatggc 300
ccgcctggca ttatgcccag tacatgacct tatgggactt tcctacttgg cagtacatct 360
acgtattagt catcgctatt accatggtcg aggtgagccc cacgttctgc ttcactctcc 420
ccatctcccc cccctcccca cccccaattt tgtatttatt tattttttaa ttattttgtg 480
cagcgatggg ggcggggggg gggggggggc gcgcgccagg cggggcgggg cggggcgagg 540
ggcggggcgg ggcgaggcgg agaggtgcgg cggcagccaa tcagagcggc gcgctccgaa 600
agtttccttt tatggcgagg cggcggcggc ggcggcccta taaaaagcga agcgcgcggc 660
gggcgggagt cgctgcgcgc tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc 720
gcccgccccg gctctgactg accgcgttac tcccacaggt gagcgggcgg gacggccctt 780
ctcctccggg ctgtaattag cgcttggttt aatgacggct tgtttctttt ctgtggctgc 840
gtgaaagcct tgaggggctc cgggagggcc ctttgtgcgg ggggagcggc tcggggggtg 900
cgtgcgtgtg tgtgtgcgtg gggagcgccg cgtgcggctc cgcgctgccc ggcggctgtg 960
agcgctgcgg gcgcggcgcg gggctttgtg cgctccgcag tgtgcgcgag gggagcgcgg 1020
ccgggggcgg tgccccgcgg tgcggggggg gctgcgaggg gaacaaaggc tgcgtgcggg 1080
gtgtgtgcgt gggggggtga gcagggggtg tgggcgcgtc ggtcgggctg caaccccccc 1140
tgcacccccc tccccgagtt gctgagcacg gcccggcttc gggtgcgggg ctccgtacgg 1200
ggcgtggcgc ggggctcgcc gtgccgggcg gggggtggcg gcaggtgggg gtgccgggcg 1260
gggcggggcc gcctcgggcc ggggagggct cgggggaggg gcgcggcggc ccccggagcg 1320
ccggcggctg tcgaggcgcg gcgagccgca gccattgcct tttatggtaa tcgtgcgaga 1380
gggcgcaggg acttcctttg tcccaaatct gtgcggagcc gaaatctggg aggcgccgcc 1440
gcaccccctc tagcgggcgc ggggcgaagc ggtgcggcgc cggcaggaag gaaatgggcg 1500
gggagggcct tcgtgcgtcg ccgcgccgcc gtccccttct ccctctccag cctcggggct 1560
gtccgcgggg ggacggctgc cttcgggggg gacggggcag ggcggggttc ggcttctggc 1620
gtgtgaccgg cggctctaga gcctctgcta accatgttca tgccttcttc tttttcctac 1680
agctcctggg caacgtgctg gttattgtgc tgtctcatca ttttggcaaa gaattcgccc 1740
tgcagcggga attgccacca tggctcacgt tcgaggactg cagctgcctg gatgtctggc 1800
tcttgccgct ctgtgtagcc tggtgcacag ccagcatgtg tttctggctc ctcaacaagc 1860
cctgagcctg ctgcaaagag ttagaaggca cggcgagggc accttcacct ccgacgtgtc 1920
cagctacctg gaagaacagg ccgccaaaga gtttatcgcc tggctggtca aaggcggtgg 1980
tggtggcgga ggatctggcg gaggtggaag cggcggaggc ggatctgctg agtttacacc 2040
tccttgtcct ccctgtcctg ctcccgagct gctcggaggc ccttccgtgt ttctgttccc 2100
tccaaagcct aaggacaccc tgatgatcag cagaacccct gaagtgacct gcgtggtcgt 2160
ggacgtgtcc caagaggatc ctgaggtgca gttcaattgg tacgtggacg gcgtggaagt 2220
gcacaacgcc cagacaaagc ccagagagcg gcagttcaac agcacctaca gagtggtgtc 2280
cgtgctgacc gtgacacacc aggattggct gaacggcaaa gagtacacct gtaaagtctc 2340
caacaagggc ctgcctgctc ctatcgagaa aaccatcagc aaggccaagg gccagcctag 2400
agaaccccag gtgtacatcc tgcctccacc tcaagaggaa ctgaccaaga accaggtgtc 2460
cctgacctgt ctggtcaccg gcttctaccc ttccgatatc gccgtggaat gggagagcaa 2520
cggacagccc gagaacacct acaagaccac acctccagtg ctggacagcg acggcagcta 2580
tctgctgtac tccaagctga cagtgaacaa gagccggtgg cagcccggca acatcttcac 2640
ctgttctgtg atgcacgagg ccctgcacaa ccactacacc cagaagtctc tgagcgtcag 2700
ccctggctaa ggtacctcta gagtcgaccc gggcggcctc gaggacgggg tgaactacgc 2760
ctgaggatcc gatctttttc cctctgccaa aaattatggg gacatcatga agccccttga 2820
gcatctgact tctggctaat aaaggaaatt tattttcatt gcaatagtgt gttggaattt 2880
tttgtgtctc tcactcg 2897
<210> 36
<211> 951
<212> DNA
<213> 恒河猴(Macaca mulatta)
<220>
<221> CDS
<222> (1)..(951)
<400> 36
atg gct cac gtt cga gga ctg cag ctg cct gga tgt ctg gct ctt gcc 48
Met Ala His Val Arg Gly Leu Gln Leu Pro Gly Cys Leu Ala Leu Ala
1 5 10 15
gct ctg tgt agc ctg gtg cac agc cag cat gtg ttt ctg gct cct caa 96
Ala Leu Cys Ser Leu Val His Ser Gln His Val Phe Leu Ala Pro Gln
20 25 30
caa gcc ctg agc ctg ctg caa aga gtt aga agg cac ggc gag ggc acc 144
Gln Ala Leu Ser Leu Leu Gln Arg Val Arg Arg His Gly Glu Gly Thr
35 40 45
ttc acc tcc gac gtg tcc agc tac ctg gaa gaa cag gcc gcc aaa gag 192
Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Glu Gln Ala Ala Lys Glu
50 55 60
ttt atc gcc tgg ctg gtc aaa ggc ggt ggt ggt ggc gga gga tct ggc 240
Phe Ile Ala Trp Leu Val Lys Gly Gly Gly Gly Gly Gly Gly Ser Gly
65 70 75 80
gga ggt gga agc ggc gga ggc gga tct gct gag ttt aca cct cct tgt 288
Gly Gly Gly Ser Gly Gly Gly Gly Ser Ala Glu Phe Thr Pro Pro Cys
85 90 95
cct ccc tgt cct gct ccc gag ctg ctc gga ggc cct tcc gtg ttt ctg 336
Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu
100 105 110
ttc cct cca aag cct aag gac acc ctg atg atc agc aga acc cct gaa 384
Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu
115 120 125
gtg acc tgc gtg gtc gtg gac gtg tcc caa gag gat cct gag gtg cag 432
Val Thr Cys Val Val Val Asp Val Ser Gln Glu Asp Pro Glu Val Gln
130 135 140
ttc aat tgg tac gtg gac ggc gtg gaa gtg cac aac gcc cag aca aag 480
Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Gln Thr Lys
145 150 155 160
ccc aga gag cgg cag ttc aac agc acc tac aga gtg gtg tcc gtg ctg 528
Pro Arg Glu Arg Gln Phe Asn Ser Thr Tyr Arg Val Val Ser Val Leu
165 170 175
acc gtg aca cac cag gat tgg ctg aac ggc aaa gag tac acc tgt aaa 576
Thr Val Thr His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Thr Cys Lys
180 185 190
gtc tcc aac aag ggc ctg cct gct cct atc gag aaa acc atc agc aag 624
Val Ser Asn Lys Gly Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys
195 200 205
gcc aag ggc cag cct aga gaa ccc cag gtg tac atc ctg cct cca cct 672
Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Ile Leu Pro Pro Pro
210 215 220
caa gag gaa ctg acc aag aac cag gtg tcc ctg acc tgt ctg gtc acc 720
Gln Glu Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Thr
225 230 235 240
ggc ttc tac cct tcc gat atc gcc gtg gaa tgg gag agc aac gga cag 768
Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln
245 250 255
ccc gag aac acc tac aag acc aca cct cca gtg ctg gac agc gac ggc 816
Pro Glu Asn Thr Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly
260 265 270
agc tat ctg ctg tac tcc aag ctg aca gtg aac aag agc cgg tgg cag 864
Ser Tyr Leu Leu Tyr Ser Lys Leu Thr Val Asn Lys Ser Arg Trp Gln
275 280 285
ccc ggc aac atc ttc acc tgt tct gtg atg cac gag gcc ctg cac aac 912
Pro Gly Asn Ile Phe Thr Cys Ser Val Met His Glu Ala Leu His Asn
290 295 300
cac tac acc cag aag tct ctg agc gtc agc cct ggc taa 951
His Tyr Thr Gln Lys Ser Leu Ser Val Ser Pro Gly
305 310 315
<210> 37
<211> 316
<212> PRT
<213> 恒河猴(Macaca mulatta)
<400> 37
Met Ala His Val Arg Gly Leu Gln Leu Pro Gly Cys Leu Ala Leu Ala
1 5 10 15
Ala Leu Cys Ser Leu Val His Ser Gln His Val Phe Leu Ala Pro Gln
20 25 30
Gln Ala Leu Ser Leu Leu Gln Arg Val Arg Arg His Gly Glu Gly Thr
35 40 45
Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Glu Gln Ala Ala Lys Glu
50 55 60
Phe Ile Ala Trp Leu Val Lys Gly Gly Gly Gly Gly Gly Gly Ser Gly
65 70 75 80
Gly Gly Gly Ser Gly Gly Gly Gly Ser Ala Glu Phe Thr Pro Pro Cys
85 90 95
Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu
100 105 110
Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu
115 120 125
Val Thr Cys Val Val Val Asp Val Ser Gln Glu Asp Pro Glu Val Gln
130 135 140
Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Gln Thr Lys
145 150 155 160
Pro Arg Glu Arg Gln Phe Asn Ser Thr Tyr Arg Val Val Ser Val Leu
165 170 175
Thr Val Thr His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Thr Cys Lys
180 185 190
Val Ser Asn Lys Gly Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys
195 200 205
Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Ile Leu Pro Pro Pro
210 215 220
Gln Glu Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Thr
225 230 235 240
Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln
245 250 255
Pro Glu Asn Thr Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly
260 265 270
Ser Tyr Leu Leu Tyr Ser Lys Leu Thr Val Asn Lys Ser Arg Trp Gln
275 280 285
Pro Gly Asn Ile Phe Thr Cys Ser Val Met His Glu Ala Leu His Asn
290 295 300
His Tyr Thr Gln Lys Ser Leu Ser Val Ser Pro Gly
305 310 315
<210> 38
<211> 4545
<212> DNA
<213> 人工序列
<220>
<223> 构建序列
<400> 38
acgcgttcga gctcgccccg ttacataact tacggtaaat ggcccgcctg gctgaccgcc 60
caacgacccc cgcccattga cgtcaataat gacgtatgtt cccatagtaa cgccaatagg 120
gactttccat tgacgtcaat gggtggagta tttacggtaa actgcccact tggcagtaca 180
tcaagtgtat catatgccaa gtacgccccc tattgacgtc aatgacggta aatggcccgc 240
ctggcattat gcccagtaca tgaccttatg ggactttcct acttggcagt acatctacgt 300
attagtcatc gctattacca tggtgatgcg gttttggcag tacatcaatg ggcgtggata 360
gcggtttgac tcacggggat ttccaagtct ccaccccatt gacgtcaatg ggagtttgtt 420
ttggcaccaa aatcaacggg actttccaaa atgtcgtaac aactccgccc cattgacgca 480
aatgggcggt aggcgtgtac ggtgggaggt ctatataagc agagctcgtt tagtgaaccg 540
tcagatcgcc tggagacgcc atccacgctg ttttgacctc catagaagac accgggaccg 600
atccagcctc cgggggatct tggtggcgtg aaactcccgc agatcttcgg ccagcgaatt 660
ccagaagcca ccatggacta tcctgctgcc aagagggtca agttggactc tagaatcctc 720
tggcatgaga tgtggcatga aggcctggaa gaggcatctc gtttgtactt tggggaaagg 780
aacgtgaaag gcatgtttga ggtgctggag cccttgcatg ctatgatgga acggggcccc 840
cagactctga aggaaacatc ctttaatcag gcctatggtc gagatttaat ggaggcccaa 900
gagtggtgca ggaagtacat gaaatcaggg aatgtcaagg acctcctcca agcctgggac 960
ctctattatc atgtgttccg acgaatctca aagactagag atgagtttcc caccatggtg 1020
tttccttctg ggcagatcag ccaggcctcg gccttggccc cggcccctcc ccaagtcctg 1080
ccccaggctc cagcccctgc ccctgctcca gccatggtat cagctctggc ccaggcccca 1140
gcccctgtcc cagtcctagc cccaggccct cctcaggctg tggccccacc tgcccccaag 1200
cccacccagg ctggggaagg aacgctgtca gaggccctgc tgcagctgca gtttgatgat 1260
gaagacctgg gggccttgct tggcaacagc acagacccag ctgtgttcac agacctggca 1320
tccgtcgaca actccgagtt tcagcagctg ctgaaccagg gcatacctgt ggccccccac 1380
acaactgagc ccatgctgat ggagtaccct gaggctataa ctcgcctagt gacaggggcc 1440
cagaggcccc ccgacccagc tcctgctcca ctgggggccc cggggctccc caatggcctc 1500
ctttcaggag atgaagactt ctcctccatt gcggacatgg acttctcagc cctgctgagt 1560
cagatcagct ccggctctgg cgaaggcaga ggcagcctgc ttacctgtgg cgacgtggaa 1620
gagaaccccg gacctgctgc caagagggtc aagttggact ctagagaacg cccatatgct 1680
tgccctgtcg agtcctgcga tcgccgcttt tctcgctcgg atgagcttac ccgccatatc 1740
cgcatccaca caggccagaa gcccttccag tgtcgaatct gcatgcgtaa cttcagtcgt 1800
agtgaccacc ttaccaccca catccgcacc cacacaggcg gcggccgcag gaggaagaaa 1860
cgcaccagca tagagaccaa catccgtgtg gccttagaga agagtttctt ggagaatcaa 1920
aagcctacct cggaagagat cactatgatt gctgatcagc tcaatatgga aaaagaggtg 1980
attcgtgttt ggttctgtaa ccgccgccag aaagaaaaaa gaatcaacac tagaggagtg 2040
caggtggaaa ccatctcccc aggagacggg cgcaccttcc ccaagcgcgg ccagacctgc 2100
gtggtgcact acaccgggat gcttgaagat ggaaagaaat ttgattcctc ccgggacaga 2160
aacaagccct ttaagtttat gctaggcaag caggaggtga tccgaggctg ggaagaaggg 2220
gttgcccaga tgagtgtggg tcagagagcc aaactgacta tatctccaga ttatgcctat 2280
ggtgccactg ggcacccagg catcatccca ccacatgcca ctctcgtctt cgatgtggag 2340
cttctaaaac tggaaactag aggcgttcag gtggaaacca tcagtccagg ggatggccga 2400
acttttccaa agagagggca gacttgcgtc gtgcattata ctggtatgct ggaggatggg 2460
aaaaagttcg actcttccag agatcggaac aaaccattca aattcatgct cgggaaacag 2520
gaagttatcc gcggatggga ggagggcgtg gcccagatgt ccgtgggcca gcgcgccaag 2580
ctaaccatct ccccagacta cgcctacgga gccaccggac accccggtat cataccccca 2640
cacgccaccc ttgtgtttga cgtggaactg cttaagctag agactagagg cgtgcaggtc 2700
gagaccatca gccccggcga cggccgcacc tttcccaaga gaggccagac ttgcgtggtc 2760
cactacaccg gcatgctgga ggacggcaag aagttcgaca gcagccgcga ccgcaacaag 2820
cccttcaagt tcatgctggg caaacaggaa gtgatccgcg gctgggagga aggcgtggct 2880
cagatgagcg tggggcagcg ggccaagctg accatcagcc ccgactatgc ctacggcgcc 2940
accggccacc ccggcatcat ccccccccac gccaccctgg tgttcgacgt ggagctgctg 3000
aagctggagt gataaggatc cccactccag tgcccaccag ccttgtccta ataaaattaa 3060
gttgcatcat tttgtctgac taggtgtcct tctataatat tatggggtgg aggggggtgg 3120
tttggagcaa ggcgcgtgct agctaatgat gggcgctcga gtaatgatgg gcggtcgact 3180
aatgatgggc gctcgagtaa tgatgggcgt ctagctaatg atgggcgctc gagtaatgat 3240
gggcggtcga ctaatgatgg gcgctcgagt aatgatgggc gtctagaacg cgaattaatt 3300
caacattttg acacccccat aatatttttc cagaattaac agtataaatt gcatctcttg 3360
ttcaagagtt ccctatcact ctctttaatc actactcaca gtaacctcaa ctcctgccac 3420
aagcttgaat tcgccctgca gcgggaattg ccaccatggc tcacgttcga ggactgcagc 3480
tgcctggatg tctggctctt gccgctctgt gtagcctggt gcacagccag cacgtgtttc 3540
tggctcctca gcaagccaga tcactgctgc agagagttag aaggcacggc gagggcacct 3600
ttacctccga cgtgtctagc tacctggaag aacaggccgc caaagagttt atcgcctggc 3660
tggtcaaagg tggcggcgga ggcggaggaa gcggtggcgg aggttcaggt ggtggtggat 3720
ctgccgagtc taagtacggc cctccttgtc ctccctgtcc tgctcccgaa gctgctggcg 3780
gcccatccgt gtttctgttc cctccaaagc ctaaggacac cctgatgatc agcagaaccc 3840
ctgaagtgac ctgcgtggtg gtcgacgtgt cccaagagga tcctgaggtg cagttcaatt 3900
ggtacgtgga cggcgtggaa gtgcacaacg ccaagaccaa gcctagagag gaacagttca 3960
acagcaccta cagagtggtg tccgtgctga ccgtgctgca ccaggattgg ctgaacggca 4020
aagagtacaa gtgcaaggtg tccaacaagg gcctgcctag ctccatcgag aaaaccatca 4080
gcaaggccaa gggccagcca agagaacccc aggtgtacac actgcctcca agccaagagg 4140
aaatgaccaa gaaccaggtg tccctgacct gcctcgtgaa gggcttctac ccttccgata 4200
tcgccgtgga atgggagagc aatggccagc ctgagaacaa ctacaagacc acacctcctg 4260
tgctggacag cgacggctca ttcttcctgt acagcagact gaccgtggac aagagcagat 4320
ggcaagaggg caacgtgttc agctgcagcg tgatgcacga ggccctgcac aaccactaca 4380
cccagaagtc tctgagcctg agcctgggct aaggtaccga tctttttccc tctgccaaaa 4440
attatgggga catcatgaag ccccttgagc atctgacttc tggctaataa aggaaattta 4500
ttttcattgc aatagtgtgt tggaattttt tgtgtctctc actcg 4545
<210> 39
<211> 4539
<212> DNA
<213> 人工序列
<220>
<223> 构建序列
<400> 39
acgcgttcga gctcgccccg ttacataact tacggtaaat ggcccgcctg gctgaccgcc 60
caacgacccc cgcccattga cgtcaataat gacgtatgtt cccatagtaa cgccaatagg 120
gactttccat tgacgtcaat gggtggagta tttacggtaa actgcccact tggcagtaca 180
tcaagtgtat catatgccaa gtacgccccc tattgacgtc aatgacggta aatggcccgc 240
ctggcattat gcccagtaca tgaccttatg ggactttcct acttggcagt acatctacgt 300
attagtcatc gctattacca tggtgatgcg gttttggcag tacatcaatg ggcgtggata 360
gcggtttgac tcacggggat ttccaagtct ccaccccatt gacgtcaatg ggagtttgtt 420
ttggcaccaa aatcaacggg actttccaaa atgtcgtaac aactccgccc cattgacgca 480
aatgggcggt aggcgtgtac ggtgggaggt ctatataagc agagctcgtt tagtgaaccg 540
tcagatcgcc tggagacgcc atccacgctg ttttgacctc catagaagac accgggaccg 600
atccagcctc cgggggatct tggtggcgtg aaactcccgc agatcttcgg ccagcgaatt 660
ccagaagcca ccatggacta tcctgctgcc aagagggtca agttggactc tagaatcctc 720
tggcatgaga tgtggcatga aggcctggaa gaggcatctc gtttgtactt tggggaaagg 780
aacgtgaaag gcatgtttga ggtgctggag cccttgcatg ctatgatgga acggggcccc 840
cagactctga aggaaacatc ctttaatcag gcctatggtc gagatttaat ggaggcccaa 900
gagtggtgca ggaagtacat gaaatcaggg aatgtcaagg acctcctcca agcctgggac 960
ctctattatc atgtgttccg acgaatctca aagactagag atgagtttcc caccatggtg 1020
tttccttctg ggcagatcag ccaggcctcg gccttggccc cggcccctcc ccaagtcctg 1080
ccccaggctc cagcccctgc ccctgctcca gccatggtat cagctctggc ccaggcccca 1140
gcccctgtcc cagtcctagc cccaggccct cctcaggctg tggccccacc tgcccccaag 1200
cccacccagg ctggggaagg aacgctgtca gaggccctgc tgcagctgca gtttgatgat 1260
gaagacctgg gggccttgct tggcaacagc acagacccag ctgtgttcac agacctggca 1320
tccgtcgaca actccgagtt tcagcagctg ctgaaccagg gcatacctgt ggccccccac 1380
acaactgagc ccatgctgat ggagtaccct gaggctataa ctcgcctagt gacaggggcc 1440
cagaggcccc ccgacccagc tcctgctcca ctgggggccc cggggctccc caatggcctc 1500
ctttcaggag atgaagactt ctcctccatt gcggacatgg acttctcagc cctgctgagt 1560
cagatcagct ccggctctgg cgaaggcaga ggcagcctgc ttacctgtgg cgacgtggaa 1620
gagaaccccg gacctgctgc caagagggtc aagttggact ctagagaacg cccatatgct 1680
tgccctgtcg agtcctgcga tcgccgcttt tctcgctcgg atgagcttac ccgccatatc 1740
cgcatccaca caggccagaa gcccttccag tgtcgaatct gcatgcgtaa cttcagtcgt 1800
agtgaccacc ttaccaccca catccgcacc cacacaggcg gcggccgcag gaggaagaaa 1860
cgcaccagca tagagaccaa catccgtgtg gccttagaga agagtttctt ggagaatcaa 1920
aagcctacct cggaagagat cactatgatt gctgatcagc tcaatatgga aaaagaggtg 1980
attcgtgttt ggttctgtaa ccgccgccag aaagaaaaaa gaatcaacac tagaggagtg 2040
caggtggaaa ccatctcccc aggagacggg cgcaccttcc ccaagcgcgg ccagacctgc 2100
gtggtgcact acaccgggat gcttgaagat ggaaagaaat ttgattcctc ccgggacaga 2160
aacaagccct ttaagtttat gctaggcaag caggaggtga tccgaggctg ggaagaaggg 2220
gttgcccaga tgagtgtggg tcagagagcc aaactgacta tatctccaga ttatgcctat 2280
ggtgccactg ggcacccagg catcatccca ccacatgcca ctctcgtctt cgatgtggag 2340
cttctaaaac tggaaactag aggcgttcag gtggaaacca tcagtccagg ggatggccga 2400
acttttccaa agagagggca gacttgcgtc gtgcattata ctggtatgct ggaggatggg 2460
aaaaagttcg actcttccag agatcggaac aaaccattca aattcatgct cgggaaacag 2520
gaagttatcc gcggatggga ggagggcgtg gcccagatgt ccgtgggcca gcgcgccaag 2580
ctaaccatct ccccagacta cgcctacgga gccaccggac accccggtat cataccccca 2640
cacgccaccc ttgtgtttga cgtggaactg cttaagctag agactagagg cgtgcaggtc 2700
gagaccatca gccccggcga cggccgcacc tttcccaaga gaggccagac ttgcgtggtc 2760
cactacaccg gcatgctgga ggacggcaag aagttcgaca gcagccgcga ccgcaacaag 2820
cccttcaagt tcatgctggg caaacaggaa gtgatccgcg gctgggagga aggcgtggct 2880
cagatgagcg tggggcagcg ggccaagctg accatcagcc ccgactatgc ctacggcgcc 2940
accggccacc ccggcatcat ccccccccac gccaccctgg tgttcgacgt ggagctgctg 3000
aagctggagt gataaggatc cccactccag tgcccaccag ccttgtccta ataaaattaa 3060
gttgcatcat tttgtctgac taggtgtcct tctataatat tatggggtgg aggggggtgg 3120
tttggagcaa ggcgcgtgct agctaatgat gggcgctcga gtaatgatgg gcggtcgact 3180
aatgatgggc gctcgagtaa tgatgggcgt ctagctaatg atgggcgctc gagtaatgat 3240
gggcggtcga ctaatgatgg gcgctcgagt aatgatgggc gtctagaacg cgaattaatt 3300
caacattttg acacccccat aatatttttc cagaattaac agtataaatt gcatctcttg 3360
ttcaagagtt ccctatcact ctctttaatc actactcaca gtaacctcaa ctcctgccac 3420
aagcttgaat tcgccctgca gcgggaattg ccaccatggc tcacgttcga ggactgcagc 3480
tgcctggatg tctggctctt gccgctctgt gtagcctggt gcacagccag catgtgtttc 3540
tggctcctca acaagccctg agcctgctgc aaagagttag aaggcacggc gagggcacct 3600
tcacctccga cgtgtccagc tacctggaag aacaggccgc caaagagttt atcgcctggc 3660
tggtcaaagg cggtggtggt ggcggaggat ctggcggagg tggaagcggc ggaggcggat 3720
ctgctgagtt tacacctcct tgtcctccct gtcctgctcc cgagctgctc ggaggccctt 3780
ccgtgtttct gttccctcca aagcctaagg acaccctgat gatcagcaga acccctgaag 3840
tgacctgcgt ggtcgtggac gtgtcccaag aggatcctga ggtgcagttc aattggtacg 3900
tggacggcgt ggaagtgcac aacgcccaga caaagcccag agagcggcag ttcaacagca 3960
cctacagagt ggtgtccgtg ctgaccgtga cacaccagga ttggctgaac ggcaaagagt 4020
acacctgtaa agtctccaac aagggcctgc ctgctcctat cgagaaaacc atcagcaagg 4080
ccaagggcca gcctagagaa ccccaggtgt acatcctgcc tccacctcaa gaggaactga 4140
ccaagaacca ggtgtccctg acctgtctgg tcaccggctt ctacccttcc gatatcgccg 4200
tggaatggga gagcaacgga cagcccgaga acacctacaa gaccacacct ccagtgctgg 4260
acagcgacgg cagctatctg ctgtactcca agctgacagt gaacaagagc cggtggcagc 4320
ccggcaacat cttcacctgt tctgtgatgc acgaggccct gcacaaccac tacacccaga 4380
agtctctgag cgtcagccct ggctaaggta ccgatctttt tccctctgcc aaaaattatg 4440
gggacatcat gaagcccctt gagcatctga cttctggcta ataaaggaaa tttattttca 4500
ttgcaatagt gtgttggaat tttttgtgtc tctcactcg 4539
<210> 40
<211> 1492
<212> DNA
<213> 人工序列
<220>
<223> 构建序列
<400> 40
acgcgtgcta gctaatgatg ggcgctcgag taatgatggg cggtcgacta atgatgggcg 60
ctcgagtaat gatgggcgtc tagctaatga tgggcgctcg agtaatgatg ggcggtcgac 120
taatgatggg cgctcgagta atgatgggcg tctagctaat gatgggcgct cgagtaatga 180
tgggcggtcg actaatgatg ggcgctcgag taatgatggg cgtctagaac gcgaattaat 240
tcaacatttt gacaccccca taatattttt ccagaattaa cagtataaat tgcatctctt 300
gttcaagagt tccctatcac tctctttaat cactactcac agtaacctca actcctgcca 360
caagcttgcc ctgcagcggg aattcgccct gcagcgggaa ttgccaccat ggctcacgtt 420
cgaggactgc agctgcctgg atgtctggct cttgccgctc tgtgtagcct ggtgcacagc 480
cagcatgtgt ttctggctcc tcaacaagcc ctgagcctgc tgcaaagagt tagaaggcac 540
ggcgagggca ccttcacctc cgacgtgtcc agctacctgg aagaacaggc cgccaaagag 600
tttatcgcct ggctggtcaa aggcggtggt ggtggcggag gatctggcgg aggtggaagc 660
ggcggaggcg gatctgctga gtttacacct ccttgtcctc cctgtcctgc tcccgagctg 720
ctcggaggcc cttccgtgtt tctgttccct ccaaagccta aggacaccct gatgatcagc 780
agaacccctg aagtgacctg cgtggtcgtg gacgtgtccc aagaggatcc tgaggtgcag 840
ttcaattggt acgtggacgg cgtggaagtg cacaacgccc agacaaagcc cagagagcgg 900
cagttcaaca gcacctacag agtggtgtcc gtgctgaccg tgacacacca ggattggctg 960
aacggcaaag agtacacctg taaagtctcc aacaagggcc tgcctgctcc tatcgagaaa 1020
accatcagca aggccaaggg ccagcctaga gaaccccagg tgtacatcct gcctccacct 1080
caagaggaac tgaccaagaa ccaggtgtcc ctgacctgtc tggtcaccgg cttctaccct 1140
tccgatatcg ccgtggaatg ggagagcaac ggacagcccg agaacaccta caagaccaca 1200
cctccagtgc tggacagcga cggcagctat ctgctgtact ccaagctgac agtgaacaag 1260
agccggtggc agcccggcaa catcttcacc tgttctgtga tgcacgaggc cctgcacaac 1320
cactacaccc agaagtctct gagcgtcagc cctggctaag gtaccgatct ttttccctct 1380
gccaaaaatt atggggacat catgaagccc cttgagcatc tgacttctgg ctaataaagg 1440
aaatttattt tcattgcaat agtgtgttgg aattttttgt gtctctcact cg 1492
<210> 41
<211> 3856
<212> DNA
<213> 人工序列
<220>
<223> 构建序列
<400> 41
cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc cccgcccatt 60
gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc attgacgtca 120
atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt atcatatgcc 180
aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt atgcccagta 240
catgacctta tgggactttc ctacttggca gtacatctac gtattagtca tcgctattac 300
catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg actcacgggg 360
atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc aaaatcaacg 420
ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg gtaggcgtgt 480
acggtgggag gtctatataa gcagagctcg tttagtgaac cgtcagatcg cctggagacg 540
ccatccacgc tgttttgacc tccatagaag acaccgggac cgatccagcc tccgggggat 600
cttggtggcg tgaaactccc gcagatctgc ttcagctgga ggcactgggc aggtaagtat 660
caaggttaca agacaggttt aaggagacca atagaaactg ggcttgtcga gacagagaag 720
actcttgcgt ttctgatagg cacctattgg tcttactgac atccactttg cctttctctc 780
cacaggtgca gctgctgcag cgggaattcc agaagccacc atggactatc ctgctgccaa 840
gagggtcaag ttggactcta gaatcctctg gcatgagatg tggcatgaag gcctggaaga 900
ggcatctcgt ttgtactttg gggaaaggaa cgtgaaaggc atgtttgagg tgctggagcc 960
cttgcatgct atgatggaac ggggccccca gactctgaag gaaacatcct ttaatcaggc 1020
ctatggtcga gatttaatgg aggcccaaga gtggtgcagg aagtacatga aatcagggaa 1080
tgtcaaggac ctcctccaag cctgggacct ctattatcat gtgttccgac gaatctcaaa 1140
gactagagat gagtttccca ccatggtgtt tccttctggg cagatcagcc aggcctcggc 1200
cttggccccg gcccctcccc aagtcctgcc ccaggctcca gcccctgccc ctgctccagc 1260
catggtatca gctctggccc aggccccagc ccctgtccca gtcctagccc caggccctcc 1320
tcaggctgtg gccccacctg cccccaagcc cacccaggct ggggaaggaa cgctgtcaga 1380
ggccctgctg cagctgcagt ttgatgatga agacctgggg gccttgcttg gcaacagcac 1440
agacccagct gtgttcacag acctggcatc cgtcgacaac tccgagtttc agcagctgct 1500
gaaccagggc atacctgtgg ccccccacac aactgagccc atgctgatgg agtaccctga 1560
ggctataact cgcctagtga caggggccca gaggcccccc gacccagctc ctgctccact 1620
gggggccccg gggctcccca atggcctcct ttcaggagat gaagacttct cctccattgc 1680
ggacatggac ttctcagccc tgctgagtca gatcagctcc tagtaattcc ggttattttc 1740
caccatattg ccgtcttttg gcaatgtgag ggcccggaaa cctggccctg tcttcttgac 1800
gagcattcct aggggtcttt cccctctcgc caaaggaatg caaggtctgt tgaatgtcgt 1860
gaaggaagca gttcctctgg aagcttcttg aagacaaaca acgtctgtag cgaccctttg 1920
caggcagcgg aaccccccac ctggcgacag gtgcctctgc ggccaaaagc cacgtgtata 1980
agatacacct gcaaaggcgg cacaacccca gtgccacgtt gtgagttgga tagttgtgga 2040
aagagtcaaa tggctctcct caagcgtatt caacaagggg ctgaaggatg cccagaaggt 2100
accccattgt atgggatctg atctggggcc tcggtgcaca tgctttacat gtgtttagtc 2160
gaggttaaaa aacgtctagg ccccccgaac cacggggacg tggttttcct ttgaaaaaca 2220
cgatgataat accatggact atcctgctgc caagagggtc aagttggact ctagagaacg 2280
cccatatgct tgccctgtcg agtcctgcga tcgccgcttt tctcgctcgg atgagcttac 2340
ccgccatatc cgcatccaca caggccagaa gcccttccag tgtcgaatct gcatgcgtaa 2400
cttcagtcgt agtgaccacc ttaccaccca catccgcacc cacacaggcg gcggccgcag 2460
gaggaagaaa cgcaccagca tagagaccaa catccgtgtg gccttagaga agagtttctt 2520
ggagaatcaa aagcctacct cggaagagat cactatgatt gctgatcagc tcaatatgga 2580
aaaagaggtg attcgtgttt ggttctgtaa ccgccgccag aaagaaaaaa gaatcaacac 2640
tagaggagtg caggtggaaa ccatctcccc aggagacggg cgcaccttcc ccaagcgcgg 2700
ccagacctgc gtggtgcact acaccgggat gcttgaagat ggaaagaaat ttgattcctc 2760
ccgggacaga aacaagccct ttaagtttat gctaggcaag caggaggtga tccgaggctg 2820
ggaagaaggg gttgcccaga tgagtgtggg tcagagagcc aaactgacta tatctccaga 2880
ttatgcctat ggtgccactg ggcacccagg catcatccca ccacatgcca ctctcgtctt 2940
cgatgtggag cttctaaaac tggaaactag aggagtgcag gtggaaacca tctccccagg 3000
agacgggcgc accttcccca agcgcggcca gacctgcgtg gtgcactaca ccgggatgct 3060
tgaagatgga aagaaatttg attcctcccg ggacagaaac aagcccttta agtttatgct 3120
aggcaagcag gaggtgatcc gaggctggga agaaggggtt gcccagatga gtgtgggtca 3180
gagagccaaa ctgactatat ctccagatta tgcctatggt gccactgggc acccaggcat 3240
catcccacca catgccactc tcgtcttcga tgtggagctt ctaaaactgg aaactagagg 3300
agtgcaggtg gaaaccatct ccccaggaga cgggcgcacc ttccccaagc gcggccagac 3360
ctgcgtggtg cactacaccg ggatgcttga agatggaaag aaatttgatt cctcccggga 3420
cagaaacaag ccctttaagt ttatgctagg caagcaggag gtgatccgag gctgggaaga 3480
aggggttgcc cagatgagtg tgggtcagag agccaaactg actatatctc cagattatgc 3540
ctatggtgcc actgggcacc caggcatcat cccaccacat gccactctcg tcttcgatgt 3600
ggagcttcta aaactggaat agtaaggatc ctgcccgggt ggcatccctg tgacccctcc 3660
ccagtgcctc tcctggccct ggaagttgcc actccagtgc ccaccagcct tgtcctaata 3720
aaattaagtt gcatcatttt gtctgactag gtgtccttct ataatattat ggggtggagg 3780
ggggtggtat ggagcaaggg gcaagttggg aagacaacct gtagggcctg cggggtctat 3840
tcgggaacca agctgg 3856

Claims (30)

1.一种病毒载体,其包括核酸,所述核酸包括编码融合蛋白的序列,所述融合蛋白包括GLP-1类似物和IgG4 Fc,其中所述融合蛋白具有SEQ ID NO:14的序列或与其至少99%相同的序列。
2.根据权利要求1至7中任一项所述的病毒载体,其中编码所述融合蛋白的所述序列是SEQ ID NO:15或共享与其至少75%相同的序列。
3.根据权利要求1至8中任一项所述的病毒载体,其包括:
(a)AAV衣壳,以及
(b)包装在所述AAV衣壳中的载体基因组,所述载体基因组包括AAV反向末端重复序列(ITR)、所述融合蛋白的所述编码序列以及指导所述融合蛋白的表达的调控序列。
4.根据权利要求1至9中任一项所述的病毒载体,其中所述病毒载体是具有AAVrh91的AAV衣壳的rAAV。
5.根据权利要求1至13中任一项所述的病毒载体,其包括载体基因组,所述载体基因组包括诱导型基因表达系统、可调控启动子、编码所述融合蛋白的所述序列和聚腺苷酸化信号。
6.根据权利要求9至14中任一项所述的病毒载体,其中所述AAV反向末端重复序列(ITR)是侧接所述融合蛋白编码序列和所述调控序列的AAV2 5'ITR和AAV2 3'ITR。
7.根据权利要求9至15中任一项所述的病毒载体,其中所述载体基因组包括CB7启动子和兔珠蛋白poly A。
8.根据权利要求1至16中任一项所述的病毒载体,其包括诱导型基因表达系统。
9.根据权利要求17所述的病毒载体,其中所述诱导型基因表达系统包括:
(a)激活结构域,所述激活结构域包括反式激活结构域和FKBP12-雷帕霉素相关蛋白(FRAP)的FKBP12-雷帕霉素结合(FRB)结构域;
(b)DNA结合结构域,所述DNA结合结构域包括锌指同源结构域(ZFHD)和一个、两个或三个FK506结合蛋白结构域(FKBP)亚基基因;以及
(c)ZFHD结合位点的至少一个拷贝,随后是最小IL2启动子,以及
(d)可调控启动子;
其中有效量的雷帕霉素或雷帕霉素类似物的存在诱导转基因在宿主细胞中的表达。
10.根据权利要求18所述的病毒载体,其中所述FKBP亚基基因序列彼此共享小于约85%同一性。
11.根据权利要求18或19所述的病毒载体,其中所述FKBP亚基基因序列之一是天然FKBP基因序列。
12.根据权利要求18至20中任一项所述的病毒载体,其中所述反式激活结构域包括NF-κB p65的一部分。
13.根据权利要求18至21中任一项所述的病毒载体,其中所述可调控启动子是组成型启动子。
14.根据权利要求18至22中任一项所述的病毒载体,其中所述可调控启动子是CMV启动子。
15.根据权利要求18至24中任一项所述的病毒载体,其进一步包括IRES或2A。
16.根据权利要求18至25中任一项所述的病毒载体,其进一步包括选自GT2A_V1(SEQID NO:21)或GT2A_V2(SEQ ID NO:22)的2A连接子。
17.根据权利要求18至26中任一项所述的病毒载体,其包括所述ZFHD结合位点的至少8个拷贝。
18.根据权利要求18至27中任一项所述的病毒载体,其中所述载体基因组包括SEQ IDNO:16的序列或与其至少70%相同的序列。
19.一种病毒载体,其包括核酸分子,所述核酸分子包括:可调控启动子;激活结构域,所述激活结构域包括p65反式激活结构域和FKBP12-雷帕霉素相关蛋白(FRAP)的FKBP12-雷帕霉素结合(FRB)结构域;DNA结合结构域,所述DNA结合结构域包括锌指同源结构域(ZFHD)和三个FK506结合蛋白结合域(FKBP)亚基基因;ZFHD结合位点的8个拷贝;以及编码包括GLP-1类似物和人IgG4 Fc的融合蛋白的序列。
20.一种适用于治疗受试者的代谢性疾病的药物组合物,所述药物组合物包括水性液体和根据权利要求1至20中任一项所述的病毒载体。
21.根据权利要求1至29中任一项所述的病毒载体或根据权利要求30或31中任一项所述的药物组合物,其在用于治疗患有代谢性疾病的受试者的方法中使用。
22.一种根据权利要求1至29中任一项所述的病毒载体或根据权利要求29至31中任一项所述的药物组合物在制造用于治疗患有代谢性疾病的受试者的药物中的用途。
23.根据权利要求32或33所述的病毒载体或用途,其中所述组合物被调配为以1x109GC/kg至5x 1013GC/kg的所述rAAV的剂量施用。
24.根据权利要求32或33中任一项所述的病毒载体或用途,其中所述患者是人并且向所述患者施用1x 1010GC至1.5x 1015GC的所述rAAV的剂量。
25.根据权利要求32至35中任一项所述的病毒载体或用途,其中所述rAAV是肌内或静脉内递送的。
26.一种治疗患有代谢性疾病的受试者的方法,所述方法包括向所述受试者递送重组腺相关病毒(rAAV),所述rAAV具有来自腺相关病毒rh91的AAV衣壳和包装在所述AAV衣壳中的载体基因组,所述载体基因组包括AAV反向末端重复序列(ITR)、编码包括GLP-1类似物和人IgG4 Fc的融合蛋白的序列以及指导所述融合蛋白的表达的调控序列。
27.根据权利要求37所述的方法,其中向所述患者施用根据权利要求1至29中任一项所述的病毒载体或根据权利要求30至31中任一项所述的药物组合物。
28.根据权利要求37或38所述的方法,其中向所述患者施用1x 109GC/kg至5x1013GC/kg体重的所述AAV的剂量。
29.根据权利要求37至39中任一项所述的方法,其中所述rAAV是肌内或静脉内递送的。
30.根据权利要求1至29、32或34至36中任一项所述的病毒载体、根据权利要求30至32中任一项所述的组合物、根据任一权利要求33至36所述的用途或根据权利要求37至40中任一项所述的方法,其用于治疗人的糖尿病。
CN202180072447.8A 2020-08-24 2021-08-24 编码glp-1受体激动剂融合物的病毒载体和其在治疗代谢性疾病中的用途 Pending CN116438312A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063069500P 2020-08-24 2020-08-24
US63/069500 2020-08-24
PCT/US2021/047411 WO2022046815A1 (en) 2020-08-24 2021-08-24 Viral vectors encoding glp-1 receptor agonist fusions and uses thereof in treating metabolic diseases

Publications (1)

Publication Number Publication Date
CN116438312A true CN116438312A (zh) 2023-07-14

Family

ID=78032497

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180072447.8A Pending CN116438312A (zh) 2020-08-24 2021-08-24 编码glp-1受体激动剂融合物的病毒载体和其在治疗代谢性疾病中的用途

Country Status (9)

Country Link
US (1) US20230372539A1 (zh)
EP (1) EP4200429A1 (zh)
JP (1) JP2023543125A (zh)
CN (1) CN116438312A (zh)
AU (1) AU2021332235A1 (zh)
BR (1) BR112023003310A2 (zh)
CA (1) CA3190399A1 (zh)
MX (1) MX2023002293A (zh)
WO (1) WO2022046815A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023168411A1 (en) * 2022-03-03 2023-09-07 The Trustees Of The University Of Pennsylvania Aav vectors for delivery of glp-1 receptor agonist fusions

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5139941A (en) 1985-10-31 1992-08-18 University Of Florida Research Foundation, Inc. AAV transduction vectors
US5436146A (en) 1989-09-07 1995-07-25 The Trustees Of Princeton University Helper-free stocks of recombinant adeno-associated virus vectors
US6268213B1 (en) 1992-06-03 2001-07-31 Richard Jude Samulski Adeno-associated virus vector and cis-acting regulatory and promoter elements capable of expressing at least one gene and method of using same for gene therapy
US5869305A (en) 1992-12-04 1999-02-09 The University Of Pittsburgh Recombinant viral vector system
US5478745A (en) 1992-12-04 1995-12-26 University Of Pittsburgh Recombinant viral vector system
US6204059B1 (en) 1994-06-30 2001-03-20 University Of Pittsburgh AAV capsid vehicles for molecular transfer
US5741683A (en) 1995-06-07 1998-04-21 The Research Foundation Of State University Of New York In vitro packaging of adeno-associated virus DNA
US6093570A (en) 1995-06-07 2000-07-25 The University Of North Carolina At Chapel Hill Helper virus-free AAV production
US6548286B1 (en) 1997-04-14 2003-04-15 Cell Genesys, Inc. Methods for increasing the efficiency of recombinant AAV product
EP1080218A1 (en) 1998-05-27 2001-03-07 University of Florida Method of preparing recombinant adeno-associated virus compositions by using an iodixanol gradient
US6491907B1 (en) 1998-11-10 2002-12-10 The University Of North Carolina At Chapel Hill Recombinant parvovirus vectors and method of making
ES2308989T3 (es) 1999-08-09 2008-12-16 Targeted Genetics Corporation Aumento de la expresion de una secuencia nucleotidica heterologa a partir de vectores viricos recombinantes que contienen una secuencia que forman pares de bases intracatenarios.
WO2001091803A2 (en) 2000-06-01 2001-12-06 University Of North Carolina At Chapel Hill Methods and compounds for controlled release of recombinant parvovirus vectors
ATE520707T1 (de) 2001-11-13 2011-09-15 Univ Pennsylvania Verfahren für den nachweis und/oder die identifikation von sequenzen des adeno- assoziierten virus (aav) sowie isolation von dadurch identifizierten, neuen sequenzen
EP2359869B1 (en) 2001-12-17 2018-12-26 The Trustees Of The University Of Pennsylvania Adeno-associated virus (AAV) serotype 8 sequences, vectors containing same and uses therefor
AU2003274397A1 (en) 2002-06-05 2003-12-22 University Of Florida Production of pseudotyped recombinant aav virions
AU2004251145C1 (en) 2003-06-12 2011-04-14 Eli Lilly And Company GLP-1 analog fusion proteins
EP2298926A1 (en) 2003-09-30 2011-03-23 The Trustees of The University of Pennsylvania Adeno-associated virus (AAV) clades, sequences, vectors containing same, and uses thereof
EP3409296A1 (en) 2005-04-07 2018-12-05 The Trustees of the University of Pennsylvania Method of increasing the function of an aav vector
US7456683B2 (en) 2005-06-09 2008-11-25 Panasonic Corporation Amplitude error compensating device and quadrature skew error compensating device
WO2007120542A2 (en) 2006-03-30 2007-10-25 The Board Of Trustees Of The Leland Stanford Junior University Aav capsid library and aav capsid proteins
US9315825B2 (en) 2010-03-29 2016-04-19 The Trustees Of The University Of Pennsylvania Pharmacologically induced transgene ablation system
SG10201908848RA (en) 2010-03-29 2019-10-30 Univ Pennsylvania Pharmacologically induced transgene ablation system
FR2977562B1 (fr) 2011-07-06 2016-12-23 Gaztransport Et Technigaz Cuve etanche et thermiquement isolante integree dans une structure porteuse
WO2015012924A2 (en) 2013-04-29 2015-01-29 The Trustees Of The University Of Pennsylvania Tissue preferential codon modified expression cassettes, vectors containing same, and use thereof
SG11201907714UA (en) 2017-02-28 2019-09-27 Univ Pennsylvania Adeno-associated virus (aav) clade f vector and uses therefor
CN110964116A (zh) * 2018-09-26 2020-04-07 北京辅仁瑞辉生物医药研究院有限公司 GLP1-Fc融合蛋白及其缀合物
CN113573739A (zh) * 2019-03-08 2021-10-29 格纳西尼有限公司 Glp-1融合蛋白及其用途
MX2021013266A (es) 2019-04-29 2021-11-17 Univ Pennsylvania Nuevas capsides de aav y composiciones que las contienen.

Also Published As

Publication number Publication date
WO2022046815A1 (en) 2022-03-03
EP4200429A1 (en) 2023-06-28
CA3190399A1 (en) 2022-03-03
JP2023543125A (ja) 2023-10-13
MX2023002293A (es) 2023-05-19
BR112023003310A2 (pt) 2023-05-02
US20230372539A1 (en) 2023-11-23
AU2021332235A1 (en) 2023-03-23
WO2022046815A9 (en) 2022-05-19

Similar Documents

Publication Publication Date Title
AU2022203342A1 (en) AAV-mediated expression of anti-influenza antibodies and methods of use thereof
KR102240180B1 (ko) 다중 벡터 시스템 및 이의 용도
EP3344294A1 (en) Chimeric aav-anti-vegf for treating cancer in canines
JP2022544004A (ja) 操作された核酸調節エレメントならびにその使用方法
KR20220140537A (ko) Cdkl5 결핍 장애를 치료하기 위한 유전자 요법
CN116234916A (zh) Csrp3(富含半胱氨酸和甘氨酸的蛋白质3)基因疗法
CN117545842A (zh) SMN1和miR-23a在治疗脊髓性肌萎缩中的协同效应
CN116438312A (zh) 编码glp-1受体激动剂融合物的病毒载体和其在治疗代谢性疾病中的用途
RU2742837C1 (ru) Кодон-оптимизированная нуклеиновая кислота, которая кодирует белок SMN1, и ее применение
RU2761879C1 (ru) Вакцина на основе AAV5 для индукции специфического иммунитета к вирусу SARS-CoV-2 и/или профилактики коронавирусной инфекции, вызванной SARS-CoV-2
RU2760301C1 (ru) Вакцина на основе AAV5 для индукции специфического иммунитета к вирусу SARS-CoV-2 и/или профилактики коронавирусной инфекции, вызванной SARS-CoV-2
CN116438192A (zh) 基于aav5的sars-cov-2疫苗
KR20230039669A (ko) eEF1A2용 유전자 요법 벡터 및 이의 용도
RU2783313C1 (ru) Вакцина на основе AAV5 для индукции специфического иммунитета к вирусу SARS-CoV-2 и/или профилактики коронавирусной инфекции, вызванной SARS-CoV-2
US20230405150A1 (en) Viral vector encoding glp-1 receptor agonist fusions and uses thereof in treating metabolic diseases in felines
RU2800026C2 (ru) МОДИФИЦИРОВАННАЯ ДНК С ЗАМКНУТЫМИ КОНЦАМИ (зкДНК)
WO2023168405A2 (en) Viral vectors encoding glp-2 receptor agonist fusions and uses thereof in treating short bowel syndrome
WO2023150743A2 (en) Codon-optimized smad7 gene therapy to treat and prevent muscle wasting and to enhance muscle mass
WO2023168411A1 (en) Aav vectors for delivery of glp-1 receptor agonist fusions
CN117836420A (zh) 重组tert编码病毒基因组和运载体
KR20230128466A (ko) 안정한 세포주를 사용한 생물학적 제제의 생산을 위한엄격하게-조절된 유도성 발현 시스템
CN115244181A (zh) 阿司匹林化合物在增加核酸表达中的新型用途
WO2023168403A2 (en) Viral vectors encoding parathyroid hormone fusions and uses thereof in treating hypoparathyroidism
KR20240012480A (ko) Kcnv2 변이체 및 그것들의 사용

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination