CN115484971A - 靶向蛋白的分子 - Google Patents

靶向蛋白的分子 Download PDF

Info

Publication number
CN115484971A
CN115484971A CN202180029055.3A CN202180029055A CN115484971A CN 115484971 A CN115484971 A CN 115484971A CN 202180029055 A CN202180029055 A CN 202180029055A CN 115484971 A CN115484971 A CN 115484971A
Authority
CN
China
Prior art keywords
protein
molecule
apr
mutant
amino acids
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180029055.3A
Other languages
English (en)
Inventor
F·M·H·克拉斯
J·施米克维茨
F·罗瑟乌
E·A·A·贝尔纳尔特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Irene Therapy Co
Katholieke Universiteit Leuven
Vlaams Instituut voor Biotechnologie VIB
Original Assignee
Irene Therapy Co
Katholieke Universiteit Leuven
Vlaams Instituut voor Biotechnologie VIB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Irene Therapy Co, Katholieke Universiteit Leuven, Vlaams Instituut voor Biotechnologie VIB filed Critical Irene Therapy Co
Publication of CN115484971A publication Critical patent/CN115484971A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K7/00Peptides having 5 to 20 amino acids in a fully defined sequence; Derivatives thereof
    • C07K7/04Linear peptides containing only normal peptide links
    • C07K7/08Linear peptides containing only normal peptide links having 12 to 20 amino acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/82Translation products from oncogenes
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/106Plasmid DNA for vertebrates
    • C12N2800/107Plasmid DNA for vertebrates for mammalian

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Public Health (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Biophysics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Oncology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Zoology (AREA)
  • General Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Immunology (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Epidemiology (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明的各个方面涉及能够特异性下调蛋白的突变体或变体形式的量或生物活性的非天然存在的分子,以及其应用。

Description

靶向蛋白的分子
技术领域
本发明广义地涉及适合用于体外和体内下调蛋白的分子和组合物,可适用于各种各样的领域,包括医学或兽医领域,或农业或园艺领域。本申请还教导了制备和使用所述分子和包含所述分子的组合物的方法。
背景技术
自然界中的蛋白经常表现出序列变异,产生了此类蛋白的具有不同的氨基酸序列的变异或突变形式。在一个实例中,序列变异可以由蛋白的mRNA前体的可变剪接产生,使得最终的mRNA分子由不同亚组的蛋白编码外显子构成。在另一实例中,在蛋白的一个或多个给定氨基酸位置处的序列变异可以因对应基因的核酸序列的序列变异导致,该序列变异影响编码一个或多个所述氨基酸的一个或多个密码子。在给定基因座处的核酸序列变异可以因该基因座的多态性质所致,即,在天然群体中在该基因座处出现两个或更多个由基因决定的可变序列或等位基因;或可以是在该基因座处遗传的或重新形成的突变的结果,其中在某些情况下此类突变可以导致表型改变或与表型改变相关,诸如,有害的表型改变,更特别地疾病或病症。一个实例是原癌基因的突变,其可以使细胞的增殖失调并且导致肿瘤性疾病,诸如癌症。核酸序列变异或突变可以涵盖生殖系和体细胞变异或突变。
WO 2007/071789A1和WO2012/123419A1描述了允许靶向下调目标蛋白的技术,该技术利用基于从头设计的肽的分子(本文中称为“干扰蛋白(interferor)”),所述分子包含至少一个β-聚集序列,所述β-聚集序列定向并可以与感兴趣蛋白中相应的β-聚集倾向区(APR)相互作用。此类APR可以使用公共可获得的算法和计算机程序在蛋白序列中确定,诸如TANGO(Fernandez-Escamilla等人,Nat Biotechnol.2004,vol.22,1302-6,http://tango.embl.de/)或Zyggregator(Pawar等人,J Mol Biol.2005,vol.350,379-92;Tartaglia和Vendruscolo,Chem Soc Rev.2008,vol.37,1395-401)。
在WO 2007/071789A1和WO2012/123419A1中提议在其氨基酸序列中包含APR的感兴趣蛋白与包含与所述APR对应的β-聚集序列的干扰蛋白分子之间接触后,在所述干扰蛋白和所述感兴趣蛋白之间发生特异性的β-片层相互作用和共聚集,导致所述感兴趣蛋白的溶解度减小,并且其隔离成聚集体或包涵体,结果有效地下调或敲低了所述感兴趣蛋白的生物学功能。
发明内容
本发明至少部分地基于发明人的下列见解:蛋白中的某些氨基酸序列变异或突变可以改变所述蛋白中的β-聚集倾向区(APR)的谱,使得有可能设计特异性靶向所述蛋白的变异或突变形式以进行下调的新分子。例如,蛋白中的序列变异或突变可以改变该蛋白中业已存在的APR的氨基酸序列和/或聚集倾向性,并且APR特性的此种差异可以被利用来设计特异性地靶向该蛋白的变异或突变形式中的APR的新分子。在另一实例中,蛋白中的序列变异或突变可以引入新的(重新形成的)APR,其中如果缺少所述变异或突变,则该蛋白不包含相应的APR。例如,当包含该APR的额外氨基酸序列被插入到该蛋白中时,这可能发生,诸如通过可变剪接或通过插入突变;或当在一定程度上接近但还没有资格作为APR的氨基酸段被所述变异或突变修饰使得它可以有资格作为APR时,这可能发生。
因此,一个方面提供了能够下调蛋白的突变或变异形式的量或生物活性的非天然存在的分子,其中:
a)所述蛋白包含β-聚集倾向区(APR)并且所述APR被所述蛋白的突变或变异形式中的所述突变或变异修饰;或
b)所述突变或变异在所述蛋白的所述突变或变异形式中引入所述蛋白中不存在的重新形成的APR;
并且其中所述分子被构造成特异性地靶向所述蛋白的所述突变或变异形式中的APR。
进一步的方面提供了如本文所教导的任何分子在医药中的用途,包括人类或兽医医学,即,在治疗人或动物中的用途。进一步的方面提供了如本文所教导的任何分子在治疗由蛋白的突变或变异形式引起或与蛋白的突变或变异形式相关的疾病的方法中的用途。相关的方面提供了治疗有需要的受试者的方法,所述方法包括向所述受试者施用治疗有效量的如本文所教导的任何分子。进一步相关的方面提供了治疗患有由蛋白的突变或变异形式引起或与蛋白的突变或变异形式相关的疾病的受试者的方法,所述方法包括向所述受试者施用治疗有效量的如本文所教导的任何分子。
进一步的方面提供了包含如本文所教导的任何分子的药物组合物。
进一步的方面提供了在表达(优选内源性表达)蛋白的突变或变异形式的细胞中下调所述蛋白的突变或变异形式的量或生物活性的体外方法,所述方法包括使所述细胞接触如本文所教导的任何分子。
进一步的方面提供了在表达(优选内源性表达)蛋白的突变或变异形式的生物体中下调所述蛋白的突变或变异形式的量或生物活性的方法,所述方法包括向所述生物体施用如本文所教导的任何分子。
应当理解本发明的分子可广义地适用于许多技术领域或范围,其中优先地检测或靶向突变或变异的蛋白形式可以是感兴趣的,例如,为了检测或减少感兴趣生物体中或该生物体的病原体中突变或变异的蛋白的表达和生物活性。此类领域包括,不限于,医学和兽医实践、诊断学、研究工具,农业、园艺学、水产业等。
本发明的这些和进一步的方面以及优选实施方案记载在下面的章节和附带的权利要求中。由此附带的权利要求的主题具体地并入在本说明书中。
附图说明
图1图示了根据本发明的某些实施方案对NCI-H441肿瘤细胞系培养物筛选RAS靶向分子(‘pept-in’)。(A)对贴壁生长的(2D)NCI-H441细胞单剂量(25μM)筛选RAS靶向pept-in。在暴露于测试化合物4天后评估活力并相对于媒介物条件(30mM尿素)归一化。(B)对作为悬浮球形体培养物(3D)生长的NCI-H441细胞单剂量(25μM)筛选RAS靶向pept-in。在暴露于测试化合物5天后评估活力并相对于媒介物条件(30mM尿素)归一化。NT:未测试。误差棒表示SD。
图2图示了根据本发明的某些实施方案的RAS靶向分子(‘pept-in’)和阴性对照的剂量响应和IC50测定。以5点剂量响应方式使用从作为最高剂量的50μM开始的二分之一稀释系列(one-in-two dilution series)在贴壁生长(2D)的NCI-H441细胞上测试pept-in。在暴露于测试化合物3天后评估活力并相对于媒介物条件归一化。误差棒表示SD。
图3图示了根据本发明的某些实施方案的RAS靶向分子(‘pept-in’)在悬浮球形体培养物上的IC50。瀑布图显示了在悬浮球形体培养物上RAS靶向pept-in的中位IC50。以5点剂量响应方式使用从作为最高剂量的50μM开始的二分之一稀释系列在球形体悬浮培养物上对具有不同KRAS突变的一组细胞系测试Pept-in。在暴露于测试化合物5天后评估活力。如果适用,误差棒表示中位数的SD。
图4图示了对根据本发明的某些实施方案的RAS靶向分子(‘pept-in’)的动力学着色聚集测定。通过使用淀粉样蛋白聚集物传感器染料硫黄素T(ThT;下图面)和五聚甲酰噻吩乙酸(p-FTAA;上图面)通过进行动力学着色聚集测定研究RAS靶向pept-ins的聚集行为。利用两种染料,所有四个生物活性pept-in均显示明显的淀粉样蛋白聚集动力学,而无活性对照显示没有显著的ThT信号,且随时间推移p-FTAA信号仅有稍稍增加。
图5图示了根据本发明的某些实施方案的RAS靶向分子(‘pept-in’)对KRAS G12V的播种。重组天然KRAS G12V蛋白的播种实验利用不同的靶向KRAS的pept-in的终末期聚集物(左图面)或经超声处理的种子(右图面)进行。对此,使pept-in聚集22小时。终末期样品与重组KRAS G12V混合,并且使用ThT检测聚集动力学。这种方式揭示了这些终末期pept-in聚集物对KRAS G12V的播种能力很小。然而,在通过超声作用破坏了成熟聚集物后,形成了强力的种子,它有效地诱导KRAS G12V的聚集。
图6图示了体外翻译测定,显示了根据本发明的某些实施方案的RAS靶向分子(‘pept-in’)的靶标选择性。体外翻译测定在生物素化RAS靶向pept-in的存在下产生野生型KRAS或不同的突变KRAS。使用链霉亲和素沉降(pull-down)从翻译反应中捕获生物素化pept-in并使用Western印迹探测沉降级分中的KRAS。pept-in 04-004-N001的生物素化形式,即04-004-N011,带有来源于野生型APR的APR窗序列,预期靶向所有的RAS蛋白,不依赖于RAS蛋白的突变状态。尽管对于KRAS野生型、G12V和G12C实际观察到利用04-004-N001有效沉降,但是与G12D和G13D突变体的结合似乎不太有效。然而,使用带有含G12V突变位点的APR窗的有生物活性的pept-in的生物素化形式(04-006-N007、04-015-N026和04-033-N003),仅对G12V突变KRAS观察到沉降,以及在04-015-N026的情况下,对G12C突变KRAS观察到有沉降。
图7图示了细胞共免疫沉淀测定,显示了根据本发明的某些实施方案的RAS靶向分子(‘pept-in’)的靶标接合。生物素化pept-in的细胞靶标接合使用共免疫沉淀测定进行评估。NCI-H441细胞用25μM生物素化pept-in处理过夜,之后使用链霉亲和素-包被珠从裂解物中免疫沉淀pept-in。使用Western印迹探测沉淀级分中的KRAS。尽管此方法在来自媒介物或阴性对照肽处理条件的沉淀级分中没有产生可检测到的KRAS蛋白,但在来自用生物活性pept-in处理的NCI-H441细胞的沉淀级分中很容易检测到KRAS蛋白。
图8图示了mCherry-标记的KRAS和FITC-标记的根据本发明的某些实施方案的RAS靶向分子(‘pept-in’)之间的细胞共定位。过表达mCherry-标记的KRAS G12V的HeLa细胞用靶向RAS的FITC-标记的pept-in04-015-N001形式(04-015-N032)处理,并在初步暴露于pept-in后75min进行成像。mCherry-标记的KRAS与pept-in缔合,如出现包涵体样核周结构揭示,所述包涵体样核周结构是FITC以及mCherry两者阳性的(白色箭头)。
图9图示了根据本发明的某些实施方案的RAS靶向分子(‘pept-in’)降低KRAS蛋白的溶解度和总体水平。NCI-H441细胞用接近IC50剂量(12,5μM)和接近2XIC50剂量(25μM)处理24小时。裂解物中的不溶性蛋白通过离心收集,在Western印迹上对可溶性蛋白级分和不溶性蛋白级分两者探测KRAS。此分析显示所有生物活性的RAS靶向肽剂量依赖地增加不溶性级分中KRAS的百分比,同时媒介物和阴性对照肽处理的样品之间不溶性KRAS的百分比是相当的(A)。这些样品中总KRAS水平的定量(即,对于每种处理可溶性和不溶性级分中的KRAS水平的总和)显示在用生物活性的RAS靶向pept-in处理的样品中总KRAS水平也是剂量依赖性地减少的(B)。
图10图示了使用RASless MEF组的突变体选择性细胞功效。图表显示了来自至少三个独立实验的平均值±SD以及单个测定IC50,所述实验评估在缺少内源性K-、H-和NRAS的条件下所指示的RAS靶向pept-in对一组表达野生型(WT)、突变G12V或G12C KRAS、或V600E突变BRAF的RASless MEF的功效。
图11图示了细胞共免疫沉淀测定,显示了根据本发明的某些实施方案的RAS靶向分子(‘pept-in’)的靶标接合。生物素化pept-in的细胞靶标接合使用共免疫沉淀测定进行评估。表达KRAS野生型或突变G12V的RASless MEF。在基于RASless MEF的测定中,印迹显示04-004-衍生的生物素化pept-in与野生型和突变G12V KRAS两者均良好地沉淀。然而,G12V-选择性pept-in的生物素化形式显示优先与G12V突变KRAS蛋白结合。
图12图示了探测在用RAS靶向pept-in处理后细胞死亡和蛋白聚集的流式细胞术测定。NCI-H441肺腺癌细胞用所指示的RAS靶向pept-in和对照条件处理6、16或24小时。处理后,收集细胞并对细胞死亡(SytoxTM Blue)和蛋白聚集物(AmytrackerTM Red)进行染色,然后在流式细胞仪上分析。散点图显示Y轴上的Sytox Blue强度和X轴上的Amytracker Red强度。Hpt:处理后小时数。用所有RAS靶向pept-in处理均诱导蛋白聚集,如Amytracker Red信号增加所证明,但用对照条件处理则不诱导。此外,此聚集增加似乎导致细胞死亡,如由Sytox Blue的较慢但平行的增加所指示。
图13图示了RAS靶向pept-in减少KRAS G12V突变癌症的异种移植物模型中的肿瘤生长。人KRAS G12V突变结直肠癌SW620的异种移植物模型用来评估体内施用RAS靶向pept-in是否导致肿瘤生长的减少。一旦肿瘤达到100-150mm3,通过以20或200μg肿瘤内注射每周给药Pept-in三次。通过接受100mg/kg伊立替康(每周一次,持续3周)的阳性对照组监测模型反应。对于未治疗组,组大小为N=6,对于媒介物组N=5,对于pept-in和阳性对照组N=8。图表显示在开始治疗后第22天时肿瘤体积的箱形图。显示的图表通过单因素ANOVA证明了对于04-004-N001(200μg给药组)和04-015-N001(20g和200g给药组)肿瘤体积显著减小。
图14图示了所设计的针对ITK R29C或R29L突变体的pept-in 22-006-N001和22-018-N001在体外翻译测定中针对各自ITK突变体的选择性结合。
具体实施方式
如本文所用,单数形式“一个(a)”、“一种(an)”和“该(the)”包括单数和复数指代物,除非上下文另外明确地说明。
术语“包括(comprising)”、“包含(comprises)”和“包含有(comprised of)”如本文所用与“包括(including,includes)”或“含有(containing,contains)”同义,并且是包含性的或开放式的,并且不排除额外的未描述的成员、元件或方法步骤。该术语还涵盖“由…组成(consisting of)”和“基本上由…组成(consisting essentially of)”,它们具有专利术语中公认的含义。也就是说,关于术语“基本上由…组成”,借助于进一步的举例说明,当分子被描述为基本上由结构元件A-B-C组成时,该分子一定包括所列举的元件,并且将是开放的,还包含未列举的不会实质上影响该分子的基本和新颖特性的结构元件。因此,当元件A-B-C要形成该分子的可操作部分或主要成分时,特别是通过促进该分子与给定靶标的相互作用或对指定靶标的作用时,术语“基本上由…组成”将确保所述元件A-B-C在该分子中的存在,并且还将允许未列举的不会实质上影响该分子与所述靶标的相互作用的元件的存在。
通过终点对数值范围的描述包括各个范围内所包含的所有数值和分数,以及所述的终点。这适用于数值范围,无论它们是通过表述“从…至…”还是表述“在…和…之间”或其他表述方式引入。
术语“大约”或“大致”如本文所用当指可测量的值(诸如参数、量、时段等)时,意在涵盖所指定值的变化和从所指定值的变化,诸如所指定值的+/-10%或更小、优选+/-5%或更小、更优选+/-1%或更小、还更优选+/-0.1%或更小的变化,以及从所指定值变化+/-10%或更小、优选+/-5%或更小、更优选+/-1%或更小、还更优选+/-0.1%或更小,就此而言此类变化适于在所公开的发明中执行。要理解修饰词“大约”或“大致”所提到的值本身也具体地且优选地被公开。
而术语“一个或多个”或“至少一个”,诸如一组成员的一个或多个成员或至少一个成员,本身是清楚的,借助于进一步举例说明,该术语尤其涵盖提到所述成员中的任何一个,或所述成员中的任何两个或更多个,诸如,例如,例如,所述成员中的任何≥3、≥4、≥5、≥6或≥7个等,且至多达全部所述成员。在另一个实例中,“一个或多个”或“至少一个”可以指1、2、3、4、5、6、7或更多个。
本文中包括对发明背景的讨论以解释本发明的背景情况。这不应被认为是承认所提到的任何材料是任一权利要求的优先权日时已发表的、已知的或任何国家的普通一般知识的一部分。
在整个本公开中,各个出版物、专利和公开的专利说明书通过标识性的引用提及。在本说明书中引用的全部文件整体地通过引用并入本文。特别地,本文中这些文件的教导或章节被认为具体地通过引用而并入。
除非另外指定,否则在公开本发明时所用的所有术语,包括技术和科学术语,具有本发明所属领域中普通技术人员所普遍理解的含义。借助于进一步指导,包括术语定义以更好地理解本发明的教导。当特定的术语与本发明的具体方面或本发明的具体实施方案结合定义时,此类隐含意义或意义旨在整个本说明书中适用,即,也在本发明的其他方面或实施方案的情形下适用,除非另外限定。
在下面的段落中,本发明的不同方面或实施方案更详细地定义。如此限定的每个方面或实施方案可以与任意其他方面或实施方案组合,除非清楚地指示相反的意思。具体地,表明优选的或有利的任何特征可以与表明优选的或有利的任何其他一个或多个特征组合。
在整个本说明书中提到“一个实施方案”、“实施方案”意指结合该实施方案描述的特定的特征、结构或特性包括在本发明的至少一个实施方案中。因此,在整个本说明书中的多个地方出现短语“在一个实施方案中”或“在实施方案中”不一定全部是指相同的实施方案,而是可能不是相同的实施方案。此外,在一个或多个实施方案中,特定的特征、结构或特性可以以任何合适的方式组合,如本领域技术人员从本公开中很显然知晓的那样。此外,尽管本文描述的一些实施方案包括其他实施方案中包括的一些而不是其他的特征,但不同实施方案的特征的组合旨在包括在本发明的范围内,并且形成不同的实施方案,如本领域技术人员理解的那样。例如,在附带的权利要求中,任一个要求保护的实施方案可以以任意的组合使用。
如实验章节(举例说明了本发明的某些代表性实施方案)所确证的那样——特别地,能够特异性下调携带错义突变的人RAS蛋白但基本上不作用于野生型人RAS的分子,其中所述分子的设计利用了下列事实:所述突变改变了RAS蛋白的N-末端大多数β-聚集倾向区(APR)——本发明人现在提供了广义的教导:可以通过特异性靶向蛋白的此类变异或突变形式中的改变的或重新形成的APR来设计特异性下调蛋白的变异或突变形式的量或生物活性的分子。
特异性靶向和下调蛋白的变异或突变形式的能力可以具有特别重要的意义,其中此类变异或突变形式表现出与未修饰的蛋白截然不同的特性、功能或效应,尤其是这些特性、功能或效应使得所述蛋白的变异或突变形式对细胞或生物体的健康或生存有害。例如,“功能获得性”突变可以导致蛋白获得有害的特性、功能或效应,诸如例如但不限于它们可以:增加蛋白的活性或使得蛋白(诸如参与细胞信号传导的蛋白)组成性地激活或失调;使蛋白错误折叠以及可能诱导其他蛋白的错误折叠;阻碍蛋白的正常降解;使蛋白参与新的或更强的蛋白-蛋白相互作用;或损害蛋白的亚细胞靶向和定位;等等。此外,“显性负性”突变可以产生蛋白的突变形式,该突变形式拮抗性地作用于未修饰的蛋白。因此,此类显性负性突变不仅损害突变蛋白的功能,所述突变蛋白还阻碍或消除野生型蛋白的功能,例如通过与后者形成无活性复合物,或通过还与细胞伴侣接合或在细胞过程中如野生型蛋白那样,但不诱导此类接合的正常结果。在某些具体实例中,原癌基因中的功能获得性突变或肿瘤抑制基因中的显性负性突变可以赋予所述突变蛋白导致或促进细胞致瘤转化的潜力。
因此,在这些和更多情况下下调蛋白的变异或突变形式的量或生物活性可能有巨大价值。这样做可以例如有助于恢复表达所述突变蛋白的细胞或生物体的健康。或者,这样做可以例如减少细胞的活力或杀死细胞,其中因所述细胞表达所述突变蛋白导致所述细胞对生物体有害。因此,一个方面提供了一种非天然存在的分子,所述分子能够下调蛋白的突变或变异形式的量或生物活性,其中:
a)所述蛋白包含β-聚集倾向区(APR)并且所述APR被所述蛋白的突变或变异形式中的所述突变或变异修饰;或
b)所述突变或变异在所述蛋白的所述突变或变异形式中引入所述蛋白中不存在的重新形成的APR;
并且其中所述分子被构造成特异性地靶向所述蛋白的所述突变或变异形式中的APR。
术语“非天然存在的”一般是指不是天然形成的或在自然界中不存在的物质或实体。此类非天然存在的物质或实体可以由人使用本文所述的或本领域已知的方法制备、合成、半合成、修饰、干预或操作。借助于实例,当关于肽使用时,该术语可以特别地表示自然界中不存在的相同氨基酸序列的肽,或如果相同氨基酸序列的肽在自然界中存在,则非天然存在的肽包含不包括在天然存在的对应物中且因此区分非天然存在的肽的一个或多个额外的结构元件,诸如化学键、修饰或部分。在某些实施方案中,当关于肽使用时,该术语可以表示非天然存在的肽的氨基酸序列与天然存在的肽、多肽或蛋白所涵盖的连续氨基酸段不相同。为了避免疑问,非天然存在的肽可以完美地包含比整个肽短的氨基酸段,其中特别地包括其序列的所述氨基酸段的结构与天然存在的肽、多肽或蛋白中存在的连续氨基酸段相同。
在本公开的上下文中,短语“被构造成…的分子”意在涵盖在适宜的环境下表现出所述的结局或功能性的任何分子。因此,该短语可以被视作是诸如“适合于…的分子”、“具有…的能力的分子”、“被设计用于…的分子”、“适于…的分子”、“被制备用于…的分子”或“能够…的分子”的短语的同义词并可互换。
下调蛋白的突变或变异形式的量或生物活性的任何有意义的程度都是可想到的。因此,术语“下调”或“被下调”、或“减少”或“被减少”、或“减小”或“被减小”在适宜的情形中(诸如在实验或治疗的情形中)可以表示相对于参照的统计学显著的减小。专业技术人员能够选择这种参照。合适参照的实例可以是当暴露于“阴性对照”分子时蛋白的突变或变异形式的量或活性,所述“阴性对照”分子诸如具有相似组成但已知对蛋白的突变或变异形式没有效应的分子。例如,这种减小可以超出参照的误差容限之外(如例如,通过标准差或标准误表示,或通过其预定的倍数表示,例如,±1xSD或±2xSD,或±1xSE或±2xSE)。借助于举例说明,当与参照相比减小至少10%,诸如至少20%或至少30%,优选至少40%,诸如至少50%或至少60%,更优选至少70%,诸如至少80%或至少90%或更多,至多和包括100%减小时,蛋白的突变或变异形式的量或活性可以被认为减少。
任何现有的可获得的或常规的分离、检测和/或定量方法可以用来定量蛋白的量或生物活性,并因此用来确定其下调,例如,在细胞、细胞群、组织、器官或生物体中或在细胞、细胞群、组织、器官或生物体上的下调。在某些实例中,此类方法可以包括生物化学或细胞生物学测定方法,包括尤其是酶活性、膜通道活性、底物结合活性、基因调控活性或蛋白的细胞信号传导活性的测定。此类测定可以例如在溶液中的蛋白上、体外翻译系统中的蛋白上、天然或异源表达所述蛋白的细胞的细胞裂解物中的蛋白上、或在天然或异源表达所述蛋白的完整或透化细胞上进行。应当理解此类测定的选择将由所述蛋白的突变或变异形式所表现出的生物活性来确定。借助于实例且非限制性地,引起或促进细胞的致瘤行为的蛋白的突变或变异形式(例如,癌基因或肿瘤抑制基因的显性负性形式)的量或生物活性,诸如癌症驱动蛋白,可以通过测量转化细胞系的活力(它们的生长依赖于所述蛋白的所述突变或变异形式的致瘤活性)减小来检测和定量。在其他实例中,此类方法可以包括免疫测定法,其中分离、检测和/或定量蛋白的能力由可分离的、可检测的和/或可定量的结合剂诸如免疫结合剂(抗体)与蛋白之间的特异性结合赋予。免疫测定法包括但不限于:免疫组织化学,免疫细胞化学,流式细胞术,质谱流式细胞术,荧光激活细胞分选(FACS),荧光显微检查,使用微流体系统的基于荧光的细胞分选,基于免疫亲和吸附的技术诸如亲和色谱,磁性粒子分离,使用微流体系统的磁性激活细胞分选或基于珠粒的细胞分选,酶联免疫吸附测定(ELISA)和基于ELISPOT的技术,放射免疫测定(RIA),Western印迹等。在进一步的实例中,此类方法可以包括质谱分析法。一般来说,能够获得关于肽质量的精确信息以及还优选关于所选择的肽的碎片和/或(部分)氨基酸序列的精确信息的任何质谱(MS)技术(例如,在串联质谱,MS/MS中;或在源后衰变,TOF MS中),在本文中可用于分离、检测和/或定量蛋白。MS肽分析法可以有利地与上游肽或蛋白分离或分级分离法组合,诸如例如与色谱法和其他方法组合。可以使用用于分离、检测和/或定量蛋白的更多技术,任选地与上述分析方法中的任一个结合。此类方法包括,不限于:化学萃取分配,等电聚焦(IEF),包括毛细管等电聚焦(CIEF),毛细管等速电泳(CITP),毛细管电色谱(CEC)等,一维聚丙烯酰胺凝胶电泳(PAGE),二维聚丙烯酰胺凝胶电泳(2D-PAGE),毛细管凝胶电泳(CGE),毛细管区带电泳(CZE),胶束电动色谱(MEKC),自由流电泳(FFE)等。在更多的实例中,可以采用诸如本文所讨论的方法的任意组合。
术语“蛋白”通常涵盖包含一个或多个多肽链的大分子。术语“多肽”通常涵盖由肽键连接的氨基酸残基的线性聚合链。“肽键”、“肽连接”或“酰胺键”是当一个氨基酸的羧基与另一个氨基酸的氨基反应时在两个氨基酸之间形成的共价键,由此释放一分子水。特别是当蛋白仅由单个多肽链构成时,术语“蛋白”和“多肽”可以互换使用以表示这种蛋白。所述术语不限于任何最小长度的多肽链。基本上由或由50个或更少的(≤50)氨基酸(诸如≤45、≤40、≤35、≤30、≤25、≤20、≤15、≤10或≤5个氨基酸)组成的多肽链可以普遍地称作“肽”。在蛋白、多肽或肽的情形中,“序列”是链中氨基酸在氨基至羧基末端方向上的次序,其中在所述序列中彼此相邻的残基在所述蛋白、多肽或肽的一级结构中是连续的。该术语可以涵盖天然地、重组地、半合成地或合成地产生的蛋白、多肽或肽。在此,例如,蛋白、多肽或肽可以存在于自然界中或从自然界分离,例如,由细胞或组织天然或内源地产生或表达,且任选地从其分离;或蛋白、多肽或肽可以是重组的,即,通过重组DNA技术产生,和/或可以部分地或完全地化学或生物化学合成。不受限制地,蛋白、多肽或肽可以由合适的宿主或宿主细胞表达系统重组产生,并任选地从其分离(例如,合适的细菌、酵母、真菌、植物或动物宿主或宿主细胞表达系统),或通过无细胞翻译或无细胞转录和翻译重组产生,或通过非生物的肽、多肽或蛋白合成产生。该术语还涵盖携带一个或多个多肽链的共表达或表达后类型的修饰的蛋白、多肽或肽,诸如,不受限制地,糖基化、脂化、乙酰化、酰胺化、磷酸化、磺化、甲基化、聚乙二醇化(聚乙二醇典型地共价连接到N-末端或一个或多个Lys残基的侧链)、泛素化、类泛素化(sumoylation)、半胱氨酰化(cysteinylation)、谷胱甘肽化、甲硫氨酸氧化成甲硫氨酸亚砜或甲硫氨酸砜、信号肽去除、N-末端Met去除、酶原或激素原转变成活性形式等。这种共表达或表达后类型的修饰可以由表达所述蛋白、多肽或肽的细胞(诸如宿主细胞)体内引入(共翻译或翻译后蛋白修饰机制可以是宿主细胞天然的和/或宿主细胞可以被基因改造成包含一个或多个(另外的)共翻译或翻译后蛋白修饰功能性),或可以通过对分离的蛋白、多肽或肽的化学(例如,聚乙二醇化)和/或生物化学(例如,酶学)修饰体外引入。借助于实例且非限制地,在某些实施方案中,对化学合成的肽的N-末端处的游离α氨基的乙酰化和/或对化学合成的肽的C-末端处的游离羧基的酰胺化可以选择用于改变肽的总电荷和/或稳定得到的肽并且增强它们抵抗被外肽酶酶促降解的能力。
术语“氨基酸”涵盖天然存在的氨基酸、天然编码的氨基酸、非天然编码的氨基酸、非天然存在的氨基酸、氨基酸类似物和以类似于天然存在的氨基酸的方式发挥功能的氨基酸模拟物,它们全部都处于D-和L-立体异构体形式,条件是它们的结构允许此类立体异构形式。在本文中氨基酸通过它们的名称、它们的普遍已知的三字母符号或IUPAC-IUB生物化学命名委员会推荐的一字母符号提及。“天然编码的氨基酸”是指20个常见氨基酸或吡咯赖氨酸、吡咯烷酮-羧基-赖氨酸或硒代半胱氨酸中之一的氨基酸。20个常见氨基酸是:丙氨酸(A或Ala),半胱氨酸(C或Cys),天冬氨酸(D或Asp),谷氨酸(E或Glu),苯丙氨酸(F或Phe),甘氨酸(G或Gly),组氨酸(H或His),异亮氨酸(I或Ile),赖氨酸(K或Lys),亮氨酸(L或Leu),甲硫氨酸(M或Met),天冬酰胺(N或Asn),脯氨酸(P或Pro),谷氨酰胺(Q或Gln),精氨酸(R或Arg),丝氨酸(S或Ser),苏氨酸(T或Thr),缬氨酸(V或Val),色氨酸(W或Trp),和酪氨酸(Y或Tyr)。“非天然编码的氨基酸”是指不是20个常见氨基酸或吡咯赖氨酸、吡咯烷酮-羧基-赖氨酸或硒代半胱氨酸之一的氨基酸。该术语包括不限于通过修饰(诸如翻译后修饰)天然编码的氨基酸发生的氨基酸,但它们自身不天然地通过翻译复合物掺入到正在生长的多肽链中,非限制性的实例为N-乙酰葡萄糖胺基-L-丝氨酸、N-乙酰葡萄糖胺基-L-苏氨酸和O-磷酸酪氨酸。非天然编码的、非天然的或修饰的氨基酸的更多实例包括:2-氨基己二酸,3-氨基己二酸,β-丙氨酸,β-氨基丙酸,2-氨基丁酸,4-氨基丁酸,哌啶酸,6-氨基己酸,2-氨基庚酸,2-氨基异丁酸,3-氨基异丁酸,2-氨基庚二酸,2,4二氨基丁酸,锁链素,2,2’-二氨基庚二酸,2,3-二氨基丙酸,N-乙基甘氨酸,N-乙基天冬酰胺,高丝氨酸,高半胱氨酸,羟基赖氨酸,别-羟基赖氨酸,3-羟基脯氨酸,4-羟基脯氨酸,异锁链素,别-异亮氨酸,N-甲基甘氨酸,N-甲基异亮氨酸,6-N-甲基赖氨酸,N-甲基缬氨酸,正缬氨酸,正亮氨酸,或鸟氨酸。此类氨基酸的另一实例是瓜氨酸。还包括有氨基酸类似物,其中一个或多个单个原子已经被不同的原子、相同原子的同位素或不同的官能团替换。还包括有记载在Ellman等人,MethodsEnzymol.1991,vol.202,301-36中的非天然氨基酸和氨基酸类似物。以多种不同的方式将非天然氨基酸掺入到蛋白、多肽或肽中可以是有利的。例如,含有D-氨基酸的蛋白、多肽或肽表现出与含有L-氨基酸的对应物相比增加的体外或体内稳定性。更具体地,含有D-氨基酸的蛋白、多肽或肽可以对内源性肽酶和蛋白酶更有抗性,由此提供了该分子的改善的生物利用度和在体内延长的半衰期。
如从上下文很显然的,术语“蛋白”在本说明书中可以反复使用以特别地表示其突变或变异形式被如本文所教导的分子靶向的蛋白。在此情形中,因此该术语可以提供关于可以设想和理解所述蛋白的此类变异或突变形式的方便参照点。然而,人们可以当然设想提供在自然界中不存在的蛋白的变异或突变体,即,由人想象的蛋白,本发明的分子的一种特别期望的长处可以是区分天然存在的蛋白与它们的变体或突变体(优选它们的天然存在的变体或突变体)的能力,以及特异性地靶向后者进行下调的能力。在天然存在的蛋白的天然存在的变体或突变体导致或促进一些表型损害的情况下这可以是特别有价值的,使得它们的特异性下调可以有助于在维持参考蛋白的表达和活性的基础上恢复正常表型。或它们的特异性下调可以减小因为表达突变或变异蛋白形式而变成有害的细胞的活力或杀死所述细胞。
因此,在某些优选实施方案中,所述蛋白是天然存在的蛋白。在某些优选实施方案中,所述蛋白和靶向的所述蛋白的变体或突变体是天然存在的。借助于非限制性实例,所述蛋白可以是原核生物、真核生物或病毒的天然存在的蛋白。例如,所述蛋白可以是属于真细菌界、古细菌界、原生生物界、真菌界、植物界或动物界的生物体的天然存在的蛋白。例如,所述蛋白可以是细菌的天然存在的蛋白,所述细菌诸如更特别地是革兰氏阳性细菌(例如,球菌,诸如葡萄球菌属(Staphylococcus sp.)诸如金黄色葡萄球菌(Staphylococcusaureus),肠球菌属(Enterococcus sp.)诸如粪肠球菌(Enterococcus faecalis)或屎肠球菌(Enterococcus faecium);杆菌,诸如芽孢杆菌属(Bacillus sp.)诸如炭疽芽孢杆菌(Bacillus anthracis)),革兰氏阴性细菌(例如,大肠杆菌属(Escherichia sp.)诸如大肠埃希氏菌(Escherichia coli),耶尔森氏菌属(Yersinia sp.)诸如鼠疫耶尔森氏菌(Yersinia pestis)),螺旋体属细菌(例如,密螺旋体属(Treponema sp.)诸如梅毒螺旋体(Treponema pallidum),钩端螺旋体属(Leptospira sp.)诸如肾脏钩端螺旋体(Leptospira interrogans),疏螺旋体属(Borrelia sp.)诸如伯氏疏螺旋体(Borreliaburgdorferi)),柔膜菌目细菌(Mollicutes bacterium)(即,没有细胞壁的细菌,诸如支原体属(Mycoplasma sp.)诸如肺炎支原体(Mycoplasma pneumoniae)或生殖器支原体(Mycoplasma genitalium)),或耐酸菌(例如,分枝杆菌属(Mycobacterium sp.)诸如结核分枝杆菌(Mycobacterium tuberculosis),诺卡菌属(Nocardia sp.)诸如星形诺卡菌(Nocardia asteroides))。例如,所述蛋白可以是真菌的天然存在的蛋白,真菌包括酵母和霉菌(例如,念珠菌属(Candida sp.)诸如白色念珠菌(Candida albicans),曲霉菌属(Aspergillus sp.)诸如烟曲霉(Aspergillus fumigatus)或黄曲霉(Aspergillusflavus),球孢子菌属(Coccidioides sp.)诸如粗球孢子菌(Coccidioides immitis)或波萨达斯球孢子菌(Coccidioides posadasii),隐球菌属(Cryptococcus sp.)诸如新型隐球菌(Cryptococcus neoformans)和格特隐球菌(Cryptococcus gattii),组织浆菌属(Histoplasma sp.)诸如荚膜组织胞浆菌(Histoplasma capsulatum),肺囊虫属(Pneumocystis sp.)诸如杰氏肺囊虫(Pneumocystis jirovecii),或毛癣菌属(Trichophyton sp.)诸如须发癣菌(Trichophyton mentagrophytes))。例如,所述蛋白可以是原生生物(例如,变形体属(Plasmodium sp.)诸如恶性疟原虫(Plasmodiumfalciparum),内阿米巴属(Entamoeba sp.)诸如溶组织内阿米巴(Entamoebahistolytica),贾第虫属(Giardia sp.)诸如十二指肠贾第虫(Giardia duodenalis),弓形虫属(Toxoplasma sp.)诸如刚地弓形虫(Toxoplasma gondii),隐孢子虫属(Cryptosporidium sp.)诸如小隐孢子虫(Cryptosporidium parvum),毛滴虫属(Trichomonas sp.)诸如阴道毛滴虫(Trichomonas vaginalis),利什曼物种诸如杜氏利什曼虫(Leishmania donovani),或锥虫属(Trypanosoma sp.)诸如布氏锥虫(Trypanosomabrucei))的天然存在的蛋白。例如,所述蛋白可以是植物的天然存在的蛋白,所述植物例如是玉蜀黍、水稻、小麦、大豆、大麦、高粱、小米、燕麦、黑麦、小黑麦、荞麦、藜麦、福尼奥米(fonio)、单粒小麦、硬质小麦、马铃薯、咖啡、可可、木薯、茶、橡胶树、椰子树、油棕、甘蔗、甜菜、香蕉树、橘树、凤梨树、苹果树、梨树、柠檬树、橄榄树、花生树、青豆、莴苣、番茄、胡萝卜、西葫芦、花椰菜、油菜籽、麻风树、芥末、油蜡树、亚麻、向日葵、绿藻、黄麻、棉花、大麻类植物(或大麻(Cannabis sativa)的其他植株)、坎诺拉(canola)或烟草。例如,所述蛋白可以是动物的天然存在的蛋白,所述动物优选温血动物,更优选脊椎动物,还更优选高等动物,仍更优选哺乳动物,包括人和非人哺乳动物,诸如非人灵长类动物、啮齿类动物、犬科动物、猫科动物、马科动物、绵羊或猪,最优选人;诸如例如宠物(例如,犬,猫,兔,沙鼠,仓鼠,毛丝鼠,小鼠,大鼠,豚鼠,驴,骡子,白鼬,侏儒山羊,大肚猪;禽类宠物,诸如金丝雀,长尾小鹦鹉,鹦鹉,小鸡,火鸡;爬行动物宠物,诸如蜥蜴,蛇,陆龟和乌龟;水生宠物,诸如鱼,蛙),实验动物(例如,小鼠,大鼠,豚鼠,兔,犬,猪,猴,白鼬,绵羊),畜牧动物(例如,羊驼,爪哇野牛,野牛,骆驼,牛(奶牛),鹿,驴,大额牛,山羊,马,美洲驼,骡子,猪,小马,驯鹿,绵羊,水牛,牦牛)。例如,所述蛋白可以是病毒的天然存在的蛋白,所述病毒诸如dsDNA病毒(例如,腺病毒,疱疹病毒,痘病毒),ssDNA病毒(例如,细小病毒),dsRNA病毒(例如,呼肠弧病毒),(+)ssRNA病毒(例如,小核糖核酸病毒,披盖病毒),(-)ssRNA病毒(例如,正粘病毒,棒状病毒),ssRNA-RT(逆转录)病毒(例如,逆转录病毒),dsDNA-RT病毒(例如,嗜肝DNA病毒),或噬菌体。
因在过去几十年间出现大量基因组测序新方案,许多生物体的基因组序列已被破译,并且其蛋白编码基因被鉴定并注释在公共数据库中,诸如美国政府的国家生物技术信息中心(NCBI)Genbank(http://www.ncbi.nlm.nih.gov/)或UniProt Consortium’sUniprot/Swissprot和Uniprot/TrEMBL数据库(http://www.uniprot.org/)。这些基因组测序研究通过对个别蛋白的大量报道来补充,这些蛋白的序列也注释在上述数据库中。结果,许多生物体的基本上全部蛋白集合(蛋白质组)是已知的。此外,到目前为止具有已测序的基因组和已注释的蛋白的生物体的数目继续在增长,并且用于基因组测序和注释的工具也在进展,以使得它们容易被一般技术人员所利用。因此,许多生物体的天然存在的蛋白的序列是可利用的或可以容易地获得。
动物或植物蛋白的变异或突变形式可以是本发明技术的特别感兴趣的目标,因为这些变体或突变体可以导致或促进偏离生物体的表型的正常或健康范围的表型,后者经常是生物体的健康或存活的损害物。因此,可以希望通过下调基础的变体或突变体来缓解或对抗此类表型。下调动物中(诸如在脊椎动物中,优选在高等动物中,更优选在非人哺乳动物中)的此类蛋白变体或突变体,在畜牧学或兽医学的情形中是特别有用的。下调人中的此类蛋白变体或突变体在医学的情形中可以是特别有用的。下调植物中的此类蛋白变体或突变体在农业或园艺学的情形中可以是特别有用的。
因此,在某些优选的实施方案中,所述蛋白是动物的天然存在的蛋白。在某些优选的实施方案中,所述蛋白和所述蛋白的变体或突变体是天然存在的动物蛋白。在某些优选的实施方案中,所述蛋白是脊椎动物的天然存在的蛋白。在某些优选的实施方案中,所述蛋白和所述蛋白的变体或突变体是天然存在的脊椎动物蛋白。在某些优选的实施方案中,所述蛋白是高等动物的天然存在的蛋白。在某些优选的实施方案中,所述蛋白和所述蛋白的变体或突变体是天然存在的高等动物蛋白。在某些优选的实施方案中,所述蛋白是非人哺乳动物的天然存在的蛋白。在某些优选的实施方案中,所述蛋白和所述蛋白的变体或突变体是天然存在的非人哺乳动物蛋白。考虑到人类健康的首要重要性以及在人类受试者中医学干预的需要和价值,在某些非常优选的实施方案中,所述蛋白是天然存在的人蛋白。在某些非常优选的实施方案中,所述蛋白和所述蛋白的变体或突变体是天然存在的人蛋白。在某些优选的实施方案中,所述蛋白是植物的天然存在的蛋白。在某些优选的实施方案中,所述蛋白和所述蛋白的变体或突变体是天然存在的植物蛋白。
人基因和蛋白尤其是在上述Genbank和Uniprot数据库中广泛地进行了注释。人蛋白的已知变体和突变体(包括同种型、多态性形式、引起疾病的突变体或疾病相关的突变体等)也在其中进行了注释。可以进一步在HGNC网页(https://www.genenames.org/)查阅人类基因命名。另外,存在专用数据库,其注释人基因和蛋白中已知的引起疾病的或与疾病相关的突变。通过举例说明,人类在线孟德尔遗传数据库(Online Mendelian Inheritancein
Figure BDA0003893144820000181
https://www.omim.org/)提供了人基因、遗传病症和基础性突变的广泛目录。GWAS中央数据库(GWAS Central,https://www.gwascentral.org/)提供了通过全基因组关联分析(GWAS)确定的独特单核苷酸多态性(可以在蛋白编码序列中)与疾病或表型之间的关联性的目录。癌症中变体的临床解读数据库(CIViC,https://civicdb.org/home)提供了数据库和论坛,聚焦于癌症基因组改变的临床意义。癌症基因组图册(TCGA)计划的GDC数据门户(https://portal.gdc.cancer.gov/)收集了许多癌症类型中原发性癌症和匹配的正常样本比较的基因组学、表观基因组学、转录组学和蛋白质组学数据。癌症的体细胞突变目录(COSMIC,https://cancer.sanger.ac.uk/cosmic)编撰了关于在人类癌症中检测到的体细胞突变的数据。ICGC/TCGA全基因组学的泛癌分析联盟(Nature 2020,vol.578,82–93)最近的出版物记载了在38个肿瘤类型范围内对2,658个全癌症基因组以及它们的匹配的正常组织的综合分析;相关资源可通过https://docs.icgc.org/pcawg/处的数据门户和可视化获得。
在某些实施方案中,病原体的蛋白的变异或突变形式可以是下调的感兴趣靶标,诸如特别是在所述变异或突变改变了致病性的一个或多个方面的情况下,例如增加或扩大了致病性。因此可以希望下调基础的变体或突变体以调控(诸如减小)致病性。术语“病原体”广义地指这样的生物学实体,该实体对受试者有致病性,因此能够在受试者中引起病理状态、病况或疾病,包括可以在受试者中存在而不引起明显的疾病症状的寄生虫。病原体涵盖病毒,致病性微生物,诸如任何致病类型的细菌,原生动物,真菌(包括霉菌和酵母),原生生物(例如,疟原虫(Plasmodium),疫霉属(Phytophthora),内阿米巴(Entamoeba),贾第虫(Giardia),弓形虫(Toxoplasma),隐孢子虫(Cryptosporidium),毛滴虫(Trichomonas),利什曼原虫(Leishmania),锥虫(Trypanosoma))(寄生性微生物)和大型寄生虫诸如蠕虫(例如,线虫类如蛔虫、丝虫、钩虫、蛲虫和鞭虫,或扁虫类如绦虫和吸虫),以及外寄生虫诸如蜱虫和螨。该术语还涵盖这样的生物学实体,所述实体在免疫功能不全的宿主中表现出致病性,但在非免疫功能不全的宿主中一般可以没有致病性。植物病原体包括不限于真菌(例如,子囊菌类(Ascomycetes)、担子菌类(Basidiomycetes)、卵菌类(Oomycetes)),细菌,植原体(Phytoplasma),螺原体(Spiroplasma),病毒,线虫类,原生动物和寄生植物。
如上所述,在本文中变体或突变体相对于“蛋白”作为合适的参考点进行讨论。优选地,蛋白及其变体或突变体可以是天然存在的。有时,形容词诸如“未修饰的”、“未改变的”、“原始的”、“起始的”可以结合术语“蛋白”使用以强调蛋白与其变体或突变体之间的区别。在某些实施方案中,蛋白可以是在群体中最普遍观察到的各个基因的等位基因所编码的形式的常规含义的“野生型”蛋白。在某些实施方案中,蛋白可以是不是改变的表型(诸如疾病)的病因或不与改变的表型(诸如疾病)相关的任何形式的其表型定向含义的“野生型”蛋白。
想到这个参考点,术语蛋白的“变体”(同样可以适用于突变体)在某些实施方案中可以涵盖其氨基酸序列与蛋白的氨基酸序列基本上相同(即,很大程度但不全部相同)的蛋白或多肽,例如至少约70%相同,或至少约75%相同,或至少约80%相同,或至少约85%相同,或至少约90%相同,例如,至少91%相同,至少92%相同,至少93%相同,至少94%相同,或至少约95%相同,例如,至少96%相同,至少97%相同,至少98%相同,或至少99%相同。术语“序列同一性”关于氨基酸序列而言表示从N-末端至C-末端读取的氨基酸序列之间以百分比(%)表示的全部序列同一性程度(即,包括比较中的全部或整个氨基酸序列)。序列同一性可以使用本身已知的用于执行序列比对和确定序列同一性的合适算法确定。示例性的但非限制性的算法包括基于最初由Altschul等人,1990(J Mol Biol 215:403-10)记载的基本局部比对搜索工具(BLAST)的那些,诸如由Tatusova和Madden 1999(FEMSMicrobiol Lett 174:247-250)记载的“Blast 2序列”算法,例如使用已发表的缺省设置或其他合适的设置(诸如,例如,对于BLASTN算法:空位开放成本=5,空位延伸成本=2,错配罚分=-2,匹配奖励=1,空位x_dropoff=50,预期值=10.0,字长=28;或对于BLASTP算法:矩阵=Blosum62(Henikoff等人,1992,Proc.Natl.Acad.Sci.,89:10915-10919),空位开放成本=11,空位延伸成本=1,预期值=10.0,字长=3)。
确定特定氨基酸序列和查询氨基酸序列之间的同一性百分比的示例程序将能够使用可作为网页应用或在NCBI网址(www.ncbi.nlm.nih.gov)作为单机可执行程序(BLAST2.2.31+版本)获得的Blast 2序列(Bl2seq)算法使用合适的算法参数来比对各自从N-末端至C-末端读取的两个氨基酸序列。合适的算法参数的实例包括:矩阵=Blosum62,空位开放成本=11,空位延伸成本=1,预期值=10.0,字长=3)。如果两个比较的序列共享同一性,则输出将给出那些同一性区域作为比对序列。如果两个比较的序列不共享同一性,则输出将不给出比对序列,一旦进行比对,则将通过对其中两个序列中存在的相同氨基酸残基的位置数目计数来确定匹配数。通过将匹配数除以查询序列的长度,接着将得到的值乘以100来确定同一性百分比。同一性百分比值可以,但不一定,四舍五入至最近的十分位。例如,78.11、78.12、78.13和78.14可以向下四舍五入至78.1,而78.15、78.16、78.17、78.18和78.19可以向上四舍五入至78.2。还要注意对由Bl2seq输出的每个比对字段的详细说明已方便地包括了同一性百分比。
在某些实施方案中,变体可以表示同一蛋白的不同形式,它们通过蛋白的mRNA前体的可变剪接产生。典型地,蛋白的剪接变体与蛋白的差异可以在于在所述变体中存在或缺少在所述蛋白中各自缺少或存在的一个或多个连续氨基酸段(由外显子编码),而除该一个或多个段以外(或在该一个或多个段外部),剪接变体和蛋白的序列一般可以是相同的。换句话说,可变剪接导致在由相同mRNA前体制备的mRNA中纳入了不同的外显子组合,由此由所述mRNA编码的蛋白的不同在于与差别剪接的外显子所对应的氨基酸序列。在这种情况下,可以称作剪接变体或同种型。在某些其他实施方案中,变体可以指由相同基因的不同等位基因编码的蛋白形式,其中这些等位基因出现在天然群体中,例如,以1.0%或更高的频率出现在天然群体中。在这种情况下,可以称作等位基因变体。在某些进一步的实施方案中,变体可以指由相同mRNA编码的蛋白形式,但其中作为翻译后修饰的结果产生氨基酸变异。还在某些其他实施方案中,变体可以指与参考蛋白高度相似(例如,如上所述至少约70%或更多的相同)并由另一个基因或基因座编码的其他蛋白。在此情况下,可以称作同源物。
术语蛋白的“突变体”可以特别地表示其氨基酸序列与所述蛋白不同的蛋白形式,其中所述突变形式由与所述蛋白相同的基因或基因座编码,但其中该基因的核酸序列已经被改变从而编码所述蛋白的突变形式。在本文中对于变体和突变体考虑任何类型的序列改变,包括缺失、插入和/或置换(“缺失”是指其中核酸的一个或多个核苷酸(典型地,连续核苷酸)从所述核酸中移除(即,缺失)的突变;“插入”是指其中一个或多个核苷酸(典型地,连续核苷酸)加入(即,插入)到核酸中的突变;“置换”是指其中核酸的一个或多个核苷酸各自独立地被另一个核苷酸替换(即,置换)的突变)。借助于实例,突变可以导致蛋白中单个氨基酸或几个连续氨基酸(例如,2至10个连续氨基酸)的缺失、置换或添加,而不移动蛋白剩余部分的阅读框。在某些实施方案中,突变可以是单氨基酸置换,诸如修饰现有APR的单氨基酸置换(例如,修饰APR的序列,TANGO评分,和/或长度),或导致重新形成的APR的出现。单氨基酸置换是相对频繁发生的突变类型,原癌基因中或肿瘤抑制基因中的单氨基酸置换可以促进癌症的基因致病。或者,诸如缺失或添加的突变可以移动阅读框,这可以为突变蛋白提供在原始蛋白中不存在的氨基酸序列和/或可以导致提前终止密码子和蛋白的C-末端截短形式。蛋白的截短形式可以通常表现出显性负性效应。或者,外显子、内含子或外显子-内含子边界处的突变可以改变蛋白的mRNA前体的剪接,例如导致跳过一个或多个外显子或纳入一个或多个外显子,阅读框移动或不移动。
如本文所考虑的突变的产生还可以与细胞中的基因不稳定性或基因组重排有关或作为基因不稳定性或基因组重排的结果。此类现象在癌症的情况下是特别普遍的,包括血液系统癌症以及实体肿瘤,包括肉瘤、癌和CNS肿瘤,并且还可以在其他情况或病理状态下发生。基因组不稳定性可以涵盖基因突变、易位、拷贝数改变、缺失和DNA片段的倒位。在某些情况下,基因组重排可以导致融合基因的形成,包含融合成一个基因的正常情况下分开的多个基因或其部分。因此,在某些实施方案中,如本文所考虑的突变可以是形成编码融合蛋白的融合基因。在这样的实施方案中,蛋白的突变形式可以视作其中所述蛋白或其部分融合到另一蛋白或其部分的形式。融合基因最初在血液系统恶性肿瘤中发现,但后来发现也存在于实体肿瘤中。在癌症中发现的融合基因/蛋白的非限制性实例包括:BCR-ABL1,EWSR1-FLI1,SS18-SSX1,PML-RARA,EWSR1-ATF1,ETV6-NTRK3,PAX8-PPARG,MECT1-MAML2,TMPRSS2-ERG,TMPRSS2-ETV1,EML4-ALK,KIAA1549-BRAF,MYB-NFIB,ESRRA-C11orf20,FGFR3-TACC3,FGFR3-TACC3,PTPRK-RSPO3,EIF3E3-RSPO2和SFPQ-TFE3。在本发明的情形中,第一基因与第二基因的融合,由此形成编码融合蛋白的融合基因,是特别感兴趣的,因为融合体向第一蛋白中掺入在第二蛋白(的融合部分)中存在的任何APR/向第二蛋白掺入在第一蛋白(的融合部分)中存在的任何APR;以及任何此类的APR可以被视为仅在蛋白的突变形式中存在的重新形成的APR,因此它使得所述突变蛋白可被本发明的方式靶向。还在本发明的情形中,新的APR可以出现或现有的APR可以在第一基因和第二基因之间的融合体的精确位置处被修饰,并且不存在于第一蛋白或第二蛋白中的此类APR使得所述融合蛋白可选择性地被本发明的方式靶向。
许多基因的突变等位基因存在于群体的生殖系遗传材料中并通过所述生殖系遗传材料遗传。按惯例,当等位基因在群体中的频率小于1.0%时,该等位基因可以视作突变等位基因而不是多态性变异等位基因。突变还可以重新形成而发生。无论是事先存在的还是重新形成产生的,突变都典型地是在核酸复制、修复(例如,对由化学性或物理性伤害引起的DNA损害的修复)、有丝分裂或减数分裂期间发生的DNA序列错误的结果,或由于插入转座子或病毒序列所致。许多突变可以是沉默的,使得突变蛋白表现出与野生型蛋白的氨基酸序列差异,但蛋白功能却没有可察觉的改变。优选地,如本文所预期的突变不是沉默的,使得蛋白的一些特性、功能或效应被所述突变影响。在某些优选的实施方案中,所述突变可以是“功能获得性”突变。在某些优选的实施方案中,所述突变可以是显性负性突变。在优选的实施方案中,所述突变,诸如功能获得性或显性负性突变,对表达所述突变蛋白的细胞的功能或活力是有害的,或对携带所述突变的生物体的健康或健全是有害的。在某些实施方案中,突变可以是生殖系突变,即,在亲本的生殖细胞中存在并通过该亲本产生的配子传到子代的突变,或在亲本的生殖细胞或配子中或在受精卵中重新形成产生的突变。在某些优选的实施方案中,突变可以是体细胞突变,即,在怀孕后出现的受试者的DNA中的获得性改变。存在检测受试者中的体细胞突变的技术,诸如PCR扩增和测序或另外地对含有来自受试者的体细胞的样品中的基因进行基因分型,其中此类基因信息当需要时或为提供信息可以与该基因中受试者的生殖系序列变异进行比较。借助于实例且非限制性地,其中体细胞突变是肿瘤性疾病的病因或与肿瘤性疾病相关,突变的存在可以在含有受试者的肿瘤细胞的样品中测定,诸如肿瘤组织活检(例如,原发性或转移性肿瘤组织;例如,福尔马林固定的、石蜡包埋的肿瘤组织或快速冷冻的肿瘤组织),细针抽吸物,血液样品(‘液体’活检),或肿瘤细胞可能脱落其中的身体分泌物,诸如唾液、尿液、粪便(大便)、泪液、汗液、皮脂、乳头吸取液、导管冲洗液、脑脊液或淋巴。
如上所示,如本文所设想的变异或突变是使得在蛋白中存在的β-聚集倾向区(APR)被所述变异或突变修饰,或新的或重新形成的APR通过所述变异或突变引入至蛋白中。例如,在自然界中产生的突变或变异等位基因可以编码具有此类修饰的或新出现的APR的蛋白。
如本文所用的APR或自缔合区域表示蛋白中的连续氨基酸段,其通过形成分子间β-片层表现出自缔合的倾向性。更特别地,如在本说明书中设想的APR涵盖如通过统计学力学算法TANGO所预测或定义的区域(Fernandez-Escamilla等人,Nat Biotechnol.2004,vol.22,1302-6,该文的全部内容通过引用并入本文,具体参见1305和1306页上的方法章节,以及用于标定和检验TANGO算法的方法和数据集上的增补注释1和2;更多的背景技术还可以参见WO2007/071789;TANGO算法可通过http://tango.crg.es/公共获得)。借助于进一步的解释,但意在与Fernandez-Escamilla等人(见前)和http://tango.crg.es/的教导完全一致,TANGO算法所使用的模型被设计为预测肽和蛋白中的β-聚集,并且由涵盖无规卷曲和天然构象以及其他主要构象状态(即,β-转角,α-螺旋和β-聚集)的相空间构成。肽的每个段可以根据玻尔兹曼分布占据这些状态中的每种状态。因此,为了预测肽的自缔合区,TANGO计算相空间的配分函数。为了估计特定氨基酸序列的聚集倾向,作下列假设:(i)在有序的β-片层聚集物中,主要的二级结构是β-链。(ii)参与聚集过程的区域被完全包埋,由此付出了完全溶剂化成本和增益、完全熵并优化它们的H-键作用势(H-bond potential,即,在聚集物中形成的H-键的数目与被接受体抵消的供体基团的数目相关。过量的供体或接受体保持未被满足)。(iii)在所选择的窗中的互补电荷建立了有利的静电相互作用,并且肽内部以及窗外部的总净电荷不利于聚集。该算法通过将给定氨基酸序列的聚集倾向性评分与从相似长度的一组序列计算的平均倾向性比较来鉴定聚集倾向序列。
在某些实施方案中,具有如由TANGO预测的在5-6个残基范围内高于5%的聚集倾向性的任何段可以构成潜在聚集段(APR)。优选地,如本文所期望的APR由TANGO预测的聚集倾向性可以为≥6%、≥7%、≥8%、≥9%,优选≥10%、≥15%,更优选≥20%、≥25%,甚至更优选≥30%、≥40%,或非常优选≥50%、≥60%。优选地,被预测作为APR的段的长度(不包括减小β-片层形成倾向性的侧翼门卫残基)可以为至少6个连续氨基酸,优选6-16个连续氨基酸,诸如6、7、8、9、10、11、12、13、14、15或16个连续氨基酸。序列段的高TANGO评分典型地对应于具有高(以及动力学上有利的)β-聚集倾向性的序列。借助于说明性实例,由TANGO预测的如本文所期望的APR可以为6-12个连续氨基酸长,并且可以具有>5%的TANGO评分,优选>10%,更优选>20%或更高的TANGO评分。
在某些实施方案中,APR可以由6-16个连续氨基酸构成,诸如6、7、8、9、10、11、12、13、14、15或16个连续氨基酸,其中至少50%(例如,≥55%,≥60%,≥65%,优选≥70%,≥75%,更优选≥80%,≥85%,还更优选≥90%,≥95%)是疏水性氨基酸,并且其中存在至少一个脂肪族残基或F,并且如果仅存在一个脂肪族残基或F,则至少一个,且优选至少两个其他残基选自Y、W、A、M和T;并且其中存在不超过一个,且优选没有任何一个P、R、K、D或E残基。疏水性氨基酸尤其包括I、L、V、F、Y、W、H、M、T、K、A、C和G,优选I、L、V、F、Y、W、M、T和A。脂肪族残基尤其是I、L和V。
在所述变异或突变修饰已经存在于原始蛋白中的APR的情况下,APR的序列可以被修饰。例如,APR的一个或多个氨基酸可以被置换;或一个或多个氨基酸可以添加到APR上,诸如在APR的内部或在APR的一个或两个侧翼处;和/或可以从APR去除一个或多个氨基酸,诸如在APR的内部或在APR的一个或两个侧翼处的一个或多个氨基酸。APR的此类序列改变可以但不一定调节APR的预测的聚集倾向性,优选地被修饰的APR的聚集倾向性相对于原始APR可以增加。在某些实施方案中,当所述变异或突变修饰已经存在于原始蛋白中的APR时,仅APR的聚集倾向性可以被修饰,优选是增加的。这例如可以在所述变异或突变修饰接近所述APR(诸如邻接所述APR)的一个或多个氨基酸时发生,由此对APR的聚集倾向性有影响而不改变其序列。因此,在某些实施方案中,蛋白的突变或变异形式中的APR与该蛋白中的APR在氨基酸序列上有差异。在进一步的实施方案中,蛋白的突变或变异形式中的APR与该蛋白中的APR在聚集倾向性方面有差异。在特别优选的实施方案中,蛋白的突变或变异形式中的APR与该蛋白中的APR在氨基酸序列和聚集倾向性方面有差异,更优选具有增加的聚集倾向性。因此,在某些特别优选的实施方案中,蛋白的突变或变异形式中的APR的聚集倾向性高于该蛋白中的APR的聚集倾向性。
在所述变异或突变向所述变异或突变蛋白引入重新形成的APR(其中没有存在于原始蛋白中的对应APR)的情况下,这一般可以在含有所述APR的附加氨基酸序列插入到所述蛋白中时发生,例如通过所述蛋白的mRNA前体的可变剪接,或通过改变所述蛋白的mRNA前体的剪接模式的突变,或通过插入突变,或通过引起移码的突变,由此将新序列引入到突变蛋白中所述突变的下游,等等。这还可以在接近于所述APR但还没有资格作为APR(例如不能满足由TANGO算法对APR设定的阈值)的氨基酸段被所述变异或突变修饰使得它有资格作为APR时发生。例如,此类原始APR或APR前体的一个或多个氨基酸可以被置换;或一个或多个氨基酸可以添加到原始APR,诸如在原始APR的内部或一个或两个侧翼处;和/或一个或多个氨基酸可以从原始APR上去除,诸如在原始APR的内部或一个或两个侧翼处。
如本文所教导的分子被构造成特异性地靶向蛋白的变异或突变形式中的APR。这可以具体地表达为分子可能下调原始蛋白的量或生物活性(如果有的话)的程度相对于所述分子下调所述蛋白的变异或突变形式的量或生物活性是可忽略不计的或不明显的。在可以执行可定量测定以评估分子对蛋白的变异或突变形式的量或生物活性相对于对原始蛋白的影响的情况下,由所述分子产生的对原始蛋白的量或生物活性的减少可以(以递增优先性的次序)比由所述分子产生的对变异或突变蛋白的量或生物活性的减少小至少10倍,至少102倍,至少103倍,至少104倍,至少105倍或至少106倍。例如:当表达蛋白的变异或突变形式的细胞(其中所述细胞中所述变异或突变形式的量或生物活性可以表示为100%)与一定量的如本文所教导的特异性靶向所述变异或突变形式的分子接触时,所述细胞中所述变异或突变形式的量或生物活性可以减少到50%或更小,优选到20%或更小,更优选到10%或更小,还更优选到1%或更小,诸如在特别优选的实例中到0.1%、0.01%、0.001%或0.0001%;在另一方面,当表达所述蛋白的同一类型细胞与相同量的所述分子在相同条件下接触时,所述细胞可以保留所述蛋白的至少80%、优选至少90%、更优选至少95%、还更优选至少99%且至多达100%的量或生物活性。在治疗的情形中,靶向的特异性还可以意味着所述分子当以治疗有效和实际可行的量施用时将不导致或仅导致微小的或可耐受的归因于未修饰蛋白的下调的非期望效应。
在某些实施方案中,如本文所教导的分子被构造成与蛋白的突变或变异形式中的APR形成分子间β-片层,但基本上不与原始蛋白中的APR形成分子间β-片层(如果原始蛋白含有相应的APR)。
术语“beta-片层”、“beta-折叠片层”、“β-片层”、“β-折叠片层”是本领域中熟知的,并且凭借附加解释可互换地是指包含两个或更多个侧面通过主链氢键连接(链间氢键键接)的β-链的分子结构。β-链是典型3-10个氨基酸长的氨基酸段,主链为沿着“Z形”轨迹几乎完全延伸的构象。β-片层中的邻接氨基酸链可以以相反的方向移动(反平行β片层)或以相同的方向移动(平行β片层)或可以显示混合排列方式。当不形成β-片层时(例如,在参与β-片层前),氨基酸段可以表现出非β-链构象;例如其可以具有松散的构象。
“分子间”β-片层涉及来自两个或更多个独立分子的β-链,诸如来自两个或更多个独立的肽或含肽分子、多肽和/或蛋白质。在本公开分子的情形中,该术语特别地表示涉及来自如本文所教导的一个或多个靶向分子的一个或多个β-链和来自蛋白的变异或突变形式的一个或多个分子的一个或多个β-链的β-片层。鉴于由分子间β-片层形成所播种的共聚集被认为在本发明的分子的作用模式中具有重要作用,几十个、几百个、几千个或更多个如本文所教导的分子和蛋白的变异或突变形式的分子可以参与基础的β-片层相互作用,产生更有序的组织和结构,诸如原纤丝、原纤维和聚集物。
典型地,β-链可以由参与β-片层的分子、肽、多肽或蛋白的仅一部分(例如,由其连续氨基酸段)形成。例如,如本文所教导的分子可以包括一个或多个连续氨基酸段,这些氨基酸段与由蛋白的变异或突变形式的一个或多个分子的连续氨基酸段构成的一个或多个β-链协同地组织成参与β-片层的β-链。换言之,分子可以与蛋白的变异或突变形式形成分子间β-片层的表述典型地是指所述分子的一个或多个部分,诸如所述分子的一个或多个连续氨基酸段被设计成组织成为β-链,所述β-链可以与蛋白的变异或突变形式的分子的一个或多个连续氨基酸段(即一个或多个APR)一起参与β-片层。
来自两个或更多个独立分子的β-链联锁成β-片层因此可以形成复合物,在所述复合物中两个或更多个独立分子物理缔合或连接并且在空间上邻接。考虑到前面的解释,短语“被构造成与蛋白的突变或变异形式中的APR形成分子间β-片层的分子”还可以纳入下面的含义:能够参与或促进或诱导与蛋白的突变或变异形式中的APR生成分子间β-片层的分子;包含能够参与或促进或诱导与蛋白的突变或变异形式中的APR生成分子间β-片层的部分的分子;和包含能够参与或促进或诱导与蛋白的突变或变异形式中的APR生成分子间β-片层的连续氨基酸段的分子。
将本发明的分子表征为能够与蛋白的突变或变异形式中的APR形成分子间β-片层尤其基于WO 2007/071789A1和WO2012/123419A1中所述的机制,作为操纵“干扰子(interferor)”技术的基础。然而,β-片层构象的形成也可以通过可获得的方法通过经验评估。借助于非限制性实例,许多年来已经采用核磁共振(NMR)光谱法来表征溶液中蛋白的二级结构(Wuetrich等人,FEBS Letters.1991,vol.285,237-247综述)。
在本发明的情形中可能更直接地,分子间β-片层的形成导致所述分子与蛋白的突变或变异形式之间的相互作用,这可以通过标准方法诸如免疫共沉淀测定来定性和定量评估。此类免疫共沉淀测定的几个实例在实施例中呈现,所述实施例是关于说明性的野生型蛋白的突变形式,即,在12位突变的人RAS蛋白,即,G12突变人RAS蛋白。在一个说明性方式中,表达G12突变体或野生型RAS的细胞与用生物素标记的如本文所教导的分子接触,将细胞裂解,通过链霉亲和素-包被的珠子将所述分子(和与其结合的任何RAS蛋白)沉降,并且通过免疫测定法定量共沉淀的RAS蛋白,即定量Western印迹。在另一个说明性方式中,产生G12突变体或野生型RAS的体外翻译反应物与用生物素标记的如本文所教导的分子接触,通过链霉亲和素-包被的珠子将所述分子(和与其结合的任何RAS蛋白)沉降,并且通过免疫测定法定量共沉淀的RAS蛋白,即定量Western印迹。还在本发明的情形中,所述分子与蛋白的突变或变异形式之间的相互作用可以导致蛋白的突变或变异形式的溶解度减小,甚至在细胞中出现包含蛋白的突变或变异形式的聚集物或包涵体。这可以通过标准的免疫测定或荧光显微镜检法来分析,它们也在实施例中举例例证,所述实施例是关于说明性的野生型蛋白的突变形式,即,G12突变人RAS蛋白。在一个说明性方式中,表达G12突变体或野生型RAS的细胞与如本文所教导的分子接触,所述细胞通过非变性缓冲液裂解,并将在此缓冲液中不溶解的蛋白用强离液剂(6M尿素)处理。通过免疫测定法定量在此处理后剩余不溶解的级分中存在的RAS,即,定量Western印迹。在另一个说明性方式中,培养的哺乳动物诸如人细胞用与荧光部分(诸如标准的绿色或红色荧光蛋白)融合的G12突变体或野生型RAS转染,所述细胞用如本文所教导的分子处理,并通过荧光显微镜检法确定荧光标记的RAS的细胞定位。这些说明性测定可以根据环境来应用和适应性改动,具有下列的优势:当蛋白的突变或变异形式在核糖体中不断产生(在细胞中或体内)时所述分子可以接触蛋白的突变或变异形式。在此类还未折叠的蛋白的突变或变异形式中,被靶向的APR期望在某种程度上更可及且暴露于环境,这可以促进与所述分子的分子间相互作用。此外,在本发明的情形中,所述分子与蛋白的突变或变异形式之间的相互作用意在下调蛋白的突变或变异形式,这可以例如通过当暴露于如本文所教导的分子时,测量其生长依赖于由蛋白的突变或变异形式的存在的细胞的活力减小来检测和量化。一个这样的用于研究G12突变RAS的下调的示例性细胞系是NCI-H441肺腺癌细胞,尤其可获自美国典型培养物保藏中心(American Type CultureCollection,ATCC)(10801University Blvd.Manassas,Virginia 20110-2209,USA),登录号HTB-174TM,该细胞依赖于组成性RAS信号传导。这也在实施例中举例说明。
将本发明的分子描述为基本上不与原始蛋白(在此情况下,所述蛋白含有与所述分子所靶向的APR相应的APR)中的APR形成分子间β-片层在理解上与上文所讨论的分子靶向蛋白的突变或变异形式的特异性一致,原因在于确信与蛋白的突变或变异形式中的APR选择性形成分子间β-片层构成所述分子靶向蛋白的突变或变异形式的特异性的基础。当使用上文所述的测定或测试,诸如在培养细胞中进行的体外测定或测试,例如,免疫共沉淀测定、溶解度测量或荧光显微镜检测定以可视化聚集物,用来检测β-片层的形成时,在各个测定中可以观察到在所述分子和未修饰蛋白之间基本上缺少分子间β-片层形成作为缺少信号(即,缺少被认为“阳性”的结果或测量值),或作为存在与由阴性对照(例如,相似化学组成的分子但没有任何或仅有可忽略不计的β-片层形成特性,例如,在肽分子的情况下,乱序重排肽)所产生的信号相当或未显著高于由阴性对照所产生的信号的可定量信号,或作为存在大大低于或强度大大小于所述分子对蛋白的突变或变异形式产生的信号的可定量信号。例如,由分子对原始对比产生的所述信号(例如,与分子共沉淀的蛋白的量,不溶性对比的量或不溶性对比与可溶性蛋白相比的比例,或肉眼可见的蛋白聚集物在细胞中的数目、尺寸或荧光强度)可以(以递增的优先性次序)比由所述分子对蛋白的突变或变异形式所产生的信号低至少10倍,低至少102倍,低至少103倍,低至少104倍,低至少105倍或低至少106倍。
因此,本发明的分子被设计成诱导与其各自靶标蛋白的突变或变异形式的分子间β-片层形成,导致所述蛋白的突变或变异形式的特异性下调或敲低。基于实验观察,所述分子可以导致所靶向的突变或变异蛋白的溶解度减小和聚集。因此,在某些实施方案中,如本文教导的分子能够降低所靶向的蛋白的突变或变异形式的溶解度或诱导其聚集或包涵体形成。在本说明书的其他地方讨论了用于评估蛋白的溶解度和聚集的合适测定。
所靶向的蛋白的突变或变异形式的溶解度减小的任何有意义的程度都能想到。这在适宜的情形(诸如在实验或治疗的情形中)可以表示相对于各自的参照,在可溶性蛋白级分中存在的突变或变异蛋白的量的统计学显著的减少,或在不溶性蛋白级分中存在的突变或变异蛋白的量的统计学显著的增加,或可溶性与不溶性蛋白级分相比突变或变异蛋白的相对丰度的统计学显著的减少。技术人员能够选择此类参照,诸如尤其是在‘阴性对照’分子的存在下指示突变或变异蛋白的溶解度的参照。例如,此类溶解度的减少可以超出参照的误差限度之外(如表述的那样,例如,标准差或标准误,或其预定的倍数,例如,±1xSD或±2xSD,或±1xSE或±2xSE)。借助于举例说明,当与参照相比减少至少10%,诸如至少20%或至少30%,优选至少40%,诸如至少50%或至少60%,更优选至少70%,诸如至少80%或至少90%或更多,至多和包括100%减少(即,可溶性蛋白级分中不存在突变或变异蛋白/不溶性蛋白级分中存在所有突变或变异蛋白)时,所述突变或变异蛋白的溶解度可以被认为减小。
如前所述,β-链往往为3-10个氨基酸长。因此,在某些实施方案中,在所述分子与蛋白的突变或变异形式之间形成的分子间β-片层可以涉及所靶向的APR的至少3个(诸如至少4个或至少5个)连续氨基酸。换句话说,APR的所述至少3个、至少4个或至少5个连续氨基酸将构成参与β-片层的β-链。为了增强靶向的特异性,所述分子可以被设计成诱导β-片层,所述β-片层涉及所靶向的APR的至少6个(诸如刚好6个)、或至少7个(诸如刚好7个)、或至少8个(诸如刚好8个)、或至少9个(诸如刚好9个)、或至少10个(诸如刚好10个)连续氨基酸。涉及所述APR的11、12、13或14个连续氨基酸的β-片层也是可以想到的,但是6-10个连续氨基酸的β-链可以是优选的,因为它们允许满意的特异性,同时简化了分子的设计。
此外,在某些实施方案中,分子间β-片层可以涉及蛋白的突变或变异形式与所述蛋白之间不同的一个或多个氨基酸。换句话说,所述蛋白的突变或变异形式与原始蛋白不同的一个或多个氨基酸是参与β-片层的β-链的一部分。如果所述一个或多个氨基酸是蛋白的突变或变异形式中的APR的一部分,则尤其是这样。在所述突变或变异产生的APR包括也存在于原始蛋白中的一个或多个氨基酸但在原始蛋白中所述一个或多个氨基酸不是APR的一部分的情况下,分子间β-片层还可以涉及这样的一个或多个氨基酸。作为举例说明,人RAS蛋白中的G12V突变将野生型人RAS中预测的APR延伸到跨越2-12位,使得G12V RAS突变体中的APR跨越2-15位。在这样的情况下,不仅在12位处的突变氨基酸(V),而且在13-15位处的邻接氨基酸(GVG)可以参与β-片层形成。
在所述变异或突变修饰原始蛋白中存在的APR使得原始蛋白的突变体或变异体以及原始蛋白的各个APR在氨基酸序列和/或聚集倾向性方面有差异时,在某些实施方案中,可以适用下列中的任一项或多项:
a)所述蛋白的突变或变异形式中的APR与所述蛋白中的APR相比可以具有较高比例(比率,百分比)的疏水性氨基酸;
b)所述蛋白的突变或变异形式中的APR与所述蛋白中的APR相比可以具有较低比例的表现出低β-片层形成潜力或破坏β-片层的倾向性的氨基酸;
c)所述蛋白的突变或变异形式中的APR与所述蛋白的APR相比可以具有较低比例的带电荷氨基酸;
d)所述蛋白的突变或变异形式中的APR比所述蛋白中的APR可以长至少一个氨基酸,诸如长两个、三个或四个氨基酸。
当将蛋白的突变或变异形式中的APR与未修饰蛋白中的相应原始APR比较时也可以适用这些特征。
疏水性氨基酸,特别是脯氨酸以外的疏水性氨基酸,包括V、F、Y、W、H、M、T、K、A、C、和G。优选地,疏水性氨基酸可以为I、L、V、F、Y、W、M、T或A,更优选I、L、V、F、W、M和A。借助于实例且非限制性地,在蛋白中的APR包含至少50%或至少60%或至少70%的疏水性氨基酸的情况下,所述蛋白的突变或变异形式中的APR可以分别包含超过50%(例如,60%或更多,或70%或更多)、超过60%(例如,70%或更多,或80%或更多)或超过70%(例如,80%或更多,或90%或更多)的疏水性氨基酸。在某些实施方案中,所述蛋白的突变或变异形式中的APR可以相对于所述蛋白中的APR具有更高比例的脂肪族氨基酸,特别是I、L和/或V或F。
具有低β-片层形成潜力或破坏β-片层的倾向性的氨基酸可以是R、K、E、D、P、N、S、H、G或Q。具有特别低的β-片层形成潜力或特别高的破坏β-片层的倾向性的氨基酸可以是带电荷氨基酸,诸如R、K、D或E,或特征为高构象刚性的氨基酸,尤其是P。借助于实例且非限制性地,在蛋白中的APR包含3、2或1个具有低β-片层形成潜力或破坏β-片层的倾向性的氨基酸的情况下,所述蛋白的突变或变异形式中的APR可以分别包含2、1或0个、1或0个、或0个此类氨基酸。
蛋白中的带电荷氨基酸包括R、K、H、E和D,并且可以优选地指R、K、E或D。借助于实例且非限制性地,在蛋白中的APR包含3、2或1个带电荷氨基酸的情况下,所述蛋白的突变或变异形式中的APR可以分别包含2、1或0个、1或0个、或0个此类氨基酸。
所述突变或变异还可以影响APR的长度,并且可以优选地增加APR的长度,诸如增加一个、两个、三个或四个氨基酸。借助于实例且非限制性地,在蛋白中的APR为6或8或10个连续氨基酸长的情况下,所述蛋白的突变或变异形式中的APR可以为超过6个(例如,7至16个)、超过8个(例如,9至16个)或超过10个(例如,11至16个)氨基酸长。
考虑到前面的解释,在某些实施方案中,可以适用下列中的任一项或多项:
a)蛋白的突变或变异形式中的突变或变异可以修饰所述蛋白中的APR内的一个或多个氨基酸,所述修饰诸如置换、缺失或添加;
b)蛋白的突变或变异形式中的突变或变异可以修饰在N-末端邻接所述蛋白中的APR的1-10个连续氨基酸、优选1-4个连续氨基酸的区域内的一个或多个氨基酸,所述修饰诸如置换、缺失或添加,优选其中所述区域的至少一个氨基酸成为所述蛋白的突变或变异形式中的APR的一部分;
c)蛋白的突变或变异形式中的突变或变异可以修饰在C-末端邻接所述蛋白中的APR的1-10个连续氨基酸、优选1-4个连续氨基酸的区域内的一个或多个氨基酸,所述修饰诸如置换、缺失或添加,优选其中所述区域的至少一个氨基酸成为所述蛋白的突变或变异形式中的APR的一部分。
换句话说,所述突变或变异可以影响预期构成未修饰蛋白中的APR的连续氨基酸段的序列,诸如不限于所述段的一个或多个氨基酸(例如,非疏水性氨基酸,诸如极性或带电荷氨基酸)可以被一个或多个其他氨基酸(例如,疏水性氨基酸)置换。或者所述突变或变异可以影响在N-末端和/或在C-末端侧接或封闭未修饰蛋白中的APR的序列。典型地,在天然蛋白中,APR侧接表现出相对较低的β-片层形成潜力或破坏β-片层的倾向性(例如,通过TANGO预测或如上面所讨论的那样)的氨基酸。纳入此类‘门卫’序列的作用是以天然的特性控制APR的聚集倾向性,由此在细胞中正常表达的条件下使自聚集最小化或避免自聚集。典型地,此类侧翼门卫区可以各自独立地跨越在N-末端和C-末端邻接APR的1-10个、更典型1-6个、甚至更典型地1-4个、诸如1、2、3或4个连续氨基酸。因此,此类侧翼区内的突变或变异可以改变这些区的特征,使得蛋白的突变或变异形式中的APR延伸或突出进入以前是侧翼区或门卫区的区域中。非限制性地,当APR侧翼区的一个或多个非疏水性或疏水性较低的氨基酸被一个或多个(更多个)疏水性氨基酸,诸如一个或多个脂肪族氨基酸置换时,这可以发生。
因此,在某些实施方案中,在N-末端或C-末端邻接所述蛋白中的APR的所述区域中的突变或变异可以:
a)增加所述区域中疏水性氨基酸的比例;
b)减小所述区域中表现出低β-片层形成潜力或破坏β-片层的倾向性的氨基酸的比例;和/或
c)减小所述区域中带电荷氨基酸的比例。
本发明的分子能够诱导与蛋白的突变或变异形式形成分子间β-片层。为此,所述分子可以有利地包含可以呈现或模拟能够与所述突变或变异蛋白(更特别地,其APR)所贡献的β-链相互作用的β-链构象以便产生通过所述相互作用的β-链形成的分子间β-片层的至少一个部分。
在某些实施方案中,所述分子可以包含参与与蛋白的突变或变异形式中的APR的分子间β-片层的至少一个氨基酸段。如前面所解释的那样,β-链往往为3-10个氨基酸长。因此,在某些实施方案中,所述分子所包含的所述至少一个氨基酸段可以为至少3个,诸如至少4个或至少5个连续氨基酸长。为了增强相互作用的特异性,所述分子所包含的至少一个氨基酸段可以为至少6个(诸如刚好6个)、或至少7个(诸如刚好7个)、或至少8个(诸如刚好8个)、或至少9个(诸如刚好9个)、或至少10个(诸如刚好10个)连续氨基酸长。11、12、13或14个连续氨基酸长的氨基酸段也是可以想到包含在所述分子内,但6-10个连续氨基酸的段可以是优选的,因它们允许满意的特异性,同时简化了所述分子的设计。因此,在某些实施方案中,所述分子包含参与分子间β-片层的至少6个连续氨基酸的氨基酸段。在进一步的实施方案中,所述分子包含参与分子间β-片层的6-10个连续氨基酸的氨基酸段。
在某些优选的实施方案中,所述分子所包含的所述至少一个氨基酸段,诸如至少一个至少6个连续氨基酸或6-10个连续氨基酸的段(为简便,下文称“分子段”)可以对应参与β-片层的蛋白的突变或变异形式中的APR所包含的连续氨基酸的段(为简便,下文称“突变/变异段”)。借助于某些实例,当β-片层涉及APR的3个、4个、5个、优选6-10个、诸如6个、7个、8个、9个或10个、或甚至11个、12个、13个或14个连续氨基酸的突变/变异段时,所述分子段可以对应该突变/变异段。
所述分子段和所述突变/变异段之间的对应关系可以具体地包括:
a)所述分子段的氨基酸序列与所述突变/变异段的氨基酸序列相同的情况;
b)所述分子段的氨基酸序列与所述突变/变异段的氨基酸序列至少80%相同的情况,在此范围内该序列同一性程度与如本文所教导的分子间β-片层的形成相容——例如,在某些实施方案中,所述至少80%序列同一性可以表示当突变/变异段为6个或7个氨基酸长时,6个或7个氨基酸长的分子段与所述突变/变异段的不同在于至多1个氨基酸置换,或当突变/变异段为8-12个氨基酸长时,8-12个氨基酸长的分子段与所述突变/变异段的不同在于至多2个氨基酸置换,或当突变/变异段为13-14个氨基酸长时,13-14个氨基酸长的分子段与所述突变/变异段的不同在于至多3个氨基酸置换;
c)所述分子段的氨基酸序列与所述突变/变异段的氨基酸序列的差异为至多3个、优选至多2个、且更优选至多1个氨基酸置换的情况,在此范围内该一个或多个置换与如本文所教导的分子间β-片层的形成相容;
d)所述分子段的氨基酸序列表现出与如上述a)-c)中任一个所示的突变/变异段的氨基酸序列的序列同一性程度,并且所述分子段的所有氨基酸都是L-氨基酸的情况;
e)所述分子段的氨基酸序列表现出与如上述a)-c)中任一个所示的突变/变异段的氨基酸序列的序列同一性程度,并且所述分子段的至少一个(例如,至少2个、至少3个、至少4个、至少5个或至少6个或更多个或全部)氨基酸是D-氨基酸的情况,在此范围内一个或多个D-氨基酸的掺入与如本文所教导的分子间β-片层的形成相容;
f)所述分子段的氨基酸序列表现出与如上述a)-c)中任一个所示的突变/变异段的氨基酸序列的序列同一性程度,并且所述分子段的至少一个(例如,至少2个、至少3个、至少4个、至少5个或至少6个或更多个或全部)氨基酸被各个氨基酸的类似物替代的情况,在此范围内一个或多个类似物的掺入与如本文所教导的分子间β-片层的形成相容;或
g)所述分子段的氨基酸序列表现出与如上述a)-c)中任一个所示的突变/变异段的氨基酸序列的序列同一性程度,并且所述分子段的至少一个氨基酸是D-氨基酸以及所述分子段的至少一个氨基酸被各个氨基酸的类似物替代的情况,在此范围内一个或多个D-氨基酸以及一个或多个类似物的掺入与如本文所教导的分子间β-片层的形成相容。
优选地,所述分子段可以被设计成使得其氨基酸序列与所述突变或变异蛋白以外的各个生物体(诸如其中人突变或变异蛋白被靶向的人生物体)的蛋白中的氨基酸序列不相同,以减少或防止含有此类分子段的分子的脱靶活性。所述分子段的氨基酸序列可以容易地与该生物体的全蛋白组比对以进行此类评估。
如所提到的那样,在某些实施方案中,所述分子段的氨基酸序列与突变/变异段的氨基酸序列可以小于100%相同,例如,所述分子段序列可以与所述突变/变异段序列至少80%相同,例如,81%、82%、83%或84%相同,优选至少85%相同,例如,86%、87%、88%或89%相同,更优选至少90%相同,例如,91%、92%、93%、94%、95%、96%、97%、98%或99%相同。
在这样的实施方案中,所述分子段可以相对于所述突变/变异段(即,与其比较)包含一个或多个氨基酸添加、缺失或置换。优选地,所述分子段可以相对于所述突变/变异段包含一个或多个氨基酸置换,优选至多3个或更优选至多2个或甚至更优选至多1个氨基酸置换,诸如特别是一个或多个单氨基酸置换,优选至多3个或更优选至多2个或甚至更优选至多1个单氨基酸置换。
优选地,一个或多个氨基酸置换,特别是一个或多个单氨基酸置换可以是保守氨基酸置换。保守氨基酸置换是一个氨基酸置换成另一个具有相似特性的氨基酸。保守氨基酸置换包括下列组内的置换:缬氨酸,丙氨酸和甘氨酸;亮氨酸,缬氨酸,和异亮氨酸;天冬氨酸和谷氨酸;天冬酰胺和谷氨酰胺;丝氨酸,半胱氨酸,和苏氨酸;赖氨酸和精氨酸;以及苯丙氨酸和酪氨酸。非极性疏水氨基酸包括丙氨酸、亮氨酸、异亮氨酸、缬氨酸、脯氨酸、苯丙氨酸、色氨酸和甲硫氨酸。极性中性氨基酸包括甘氨酸、丝氨酸、苏氨酸、半胱氨酸、酪氨酸、天冬酰胺和谷氨酰胺。带正电荷的(即,碱性)氨基酸包括精氨酸、赖氨酸和组氨酸。带负电荷的(即,酸性)氨基酸包括天冬氨酸和谷氨酸。上述极性、碱性或酸性组的一个成员被相同组的另一个成员的任何置换可以被认为是保守置换。相反,非保守置换是一个氨基酸被具有不相似特性的另一个氨基酸置换。
在某些实施方案中,一个或多个氨基酸置换,特别是一个或多个单氨基酸置换,可以各自独立地利用不带电荷的氨基酸,优选利用脯氨酸以外的疏水性氨基酸,诸如利用甘氨酸(G)、丙氨酸(A)、缬氨酸(V)、亮氨酸(L)、异亮氨酸(I)、苯丙氨酸(F)、甲硫氨酸(M)和色氨酸(W)。此类置换可以增加所述分子段的β-片层诱导潜力。
在某些优选的实施方案中,所述分子段的对应于被靶向的突变或变异蛋白中的一个或多个突变的或变异的氨基酸或与被靶向的突变或变异蛋白中的一个或多个突变的或变异的氨基酸比对的一个或多个氨基酸可以与所述突变的或变异的氨基酸相同,或可以是其D-异构体或可以是其类似物,优选相同。
此外,如上文说明的那样,分子段,即,如本文所教导的分子包含的参与分子间β-片层的至少一个氨基酸段,还可以包括所述氨基酸的D-氨基酸和/或类似物。更概括地说,在某些实施方案中,所述分子的至少一个氨基酸段可以包括一个或多个D-氨基酸,或其氨基酸中的一个或多个的类似物,或一个或多个D-氨基酸和其氨基酸中的一个或多个的类似物,条件是一个或多个D-氨基酸和/或一个或多个类似物的掺入与如本文所教导的分子间β-片层的形成相容。
不受限制地,在某些实施方案中,所述分子段可以包括仅一个D-氨基酸。在某些实施方案中,所述分子段可以包括两个或更多个(例如,3、4、5、6或更多个)D-氨基酸。在某些实施方案中,构成所述分子段的约10%、约20%、约30%、约40%、约50%、约60%、约70%、约80%、约90%或100%(即,全部)的氨基酸可以是D-氨基酸。在某些实施方案中,D-氨基酸可以散布在L-氨基酸之间和/或D-氨基酸可以组织成被L-氨基酸分隔的一个或多个两个或更多个D-氨基酸的亚段。不受限制地,在某些实施方案中,所述分子段可以包括其氨基酸中仅一个的类似物。在某些实施方案中,所述分子段可以包括其氨基酸中两个或更多个(例如,3、4、5、6或更多个)的类似物。在某些实施方案中,所述分子段可以包括其氨基酸的约10%、约20%、约30%、约40%、约50%、约60%、约70%、约80%、约90%或100%(即,全部)的类似物。在某些实施方案中,氨基酸类似物可以散布在天然存在的氨基酸之间和/或氨基酸类似物可以组织成被天然存在的氨基酸分隔的一个或多个两个或更多个此类类似物的亚段。不受限制地,在某些实施方案中,所述分子段可以包括为D-氨基酸或氨基酸类似物的仅一个组成成分。在某些实施方案中,所述分子段可以包括为D-氨基酸或氨基酸类似物的两个或更多个(例如,3、4、5、6或更多个)组成成分。在某些实施方案中,所述分子段的约10%、约20%、约30%、约40%、约50%、约60%、约70%、约80%、约90%或100%(即,全部)组成成分可以是D-氨基酸或氨基酸类似物。
如已经解释的那样,所述分子段可以被设计成对应于突变/变异段,这可以特别地要求在所述分子段和所述突变/变异段之间存在特定程度的序列同一性。例如,所述分子段可以最优选地与所述突变/变异段相同,或可以与后者的差异仅为一个或多个单氨基酸置换,特别是不超过3个,优选不超过2个,更优选不超过1个单氨基酸置换。在所述分子段和所述突变/变异段之间的这样相对高程度的序列同一性目标是允许所述段缔合,尤其是通过在它们之间形成分子间β-片层。实际上已有报道在天然存在的蛋白内β-聚集区的“自缔合”是此类蛋白聚集的普遍基础机制(参见例如Fernandez-Escamilla等人,2004,见前),并且本发明的方式能够利用此机制。如还已经解释的那样,分子段和突变/变异段之间对应关系的概念确实允许在分子段中纳入各个氨基酸的D-异构体和/或类似物。
提到氨基酸类似物可以涵盖与天然编码的氨基酸具有相同或相似基本化学结构的任何化合物,即包含羧基、氨基和R部分(氨基酸残基)的有机化合物。典型地,氨基和R部分可以结合到α碳原子(即,羧基结合的碳原子)。在其他实施方案中,氨基可以结合到α碳原子以外的碳原子,例如结合到β或γ碳原子,优选结合到β碳原子。在这样的实施方案中,R部分可以结合到与氨基相同的碳原子或结合到较接近α碳原子的碳原子或结合到α碳原子本身。典型地,在羧基、氨基和R部分结合到α碳原子的情况下,α碳原子还可以结合到氢原子。典型地,在氨基和R部分结合到β碳原子的情况下,β碳原子还可以结合到氢原子。不受限制地,氨基酸类似物的R部分可以与各个天然编码的氨基酸的R基团相差一个或多个单个原子或R基团的功能基团被不同的原子替换或置换(例如,甲基被氢原子替换,或S原子被O原子替换等),被相同原子的同位素替换或置换(例如,12C被13C替换,14N被15N替换,或1H被2H替换,等等),或被不同的官能团替换或置换(例如,氢原子被甲基、乙基或丙基替换,或被另一烷基、链烯基、环烷基、环烯基、杂环基、芳基或杂芳基替换;–SH基被–OH基或–NH2基替换,等等)。氨基酸类似物与各个天然编码的氨基酸的结构差异或修饰优选保留了氨基酸在电荷和极性方面的核心特性。因此,非极性疏水性氨基酸的氨基酸类似物可以优选还具有非极性疏水性R部分;极性中性氨基酸的氨基酸类似物可以优选还具有极性中性R部分;带正电荷(碱性)氨基酸的氨基酸类似物可以优选还具有带正电荷的R部分,优选具有相同数目的带电荷基团;且带负电荷的(酸性)氨基酸的氨基酸类似物可以优选还具有带负电荷的R部分,优选具有相同数目的带电荷基团。所有氨基酸类似物均被设想为D-和L-立体异构体两者,条件是它们的结构允许这样的立体异构形式。
借助于实例且非限制性地,亮氨酸类似物可以选自由下列组成的列表:2-氨基-3,3-二甲基-丁酸(叔亮氨酸),α-甲基亮氨酸,羟基亮氨酸,2,3-脱氢-亮氨酸,N-α-甲基-亮氨酸,2-氨基-5-甲基-己酸(高亮氨酸),3-氨基-5-甲基己酸(β-高亮氨酸),2-氨基-4,4-二甲基-戊酸(4-甲基-亮氨酸,新戊基甘氨酸),4,5-脱氢-正亮氨酸,L-正亮氨酸,N-α-甲基-正亮氨酸,和6-羟基-正亮氨酸,包括它们的D-和L-立体异构体,条件是它们的结构允许这样的立体异构形式。借助于实例且非限制性地,缬氨酸类似物可以选自由下列组成的列表:c-α-甲基-缬氨酸(2,3-二甲基丁酸),2,3-脱氢-缬氨酸,3,4-脱氢-缬氨酸,3-甲基-L-异缬氨酸(甲基缬氨酸),2-氨基-3-羟基-3-甲基丁酸(羟基缬氨酸),β-高缬氨酸,和N-α-甲基-缬氨酸,包括它们的D-和L-立体异构体,条件是它们的结构允许这样的立体异构形式。借助于实例且非限制性地,甘氨酸类似物可以选自由下列组成的列表:N-α-甲基-甘氨酸(肌氨酸),环丙基甘氨酸,和环戊基甘氨酸,包括它们的D-和L-立体异构体,条件是它们的结构允许这样的立体异构形式。借助于实例且非限制性地,丙氨酸类似物可以选自由下列组成的列表:2-氨基-异丁酸(2-甲基丙氨酸),2-氨基-2-甲基丁酸(异缬氨酸),N-α-甲基-丙氨酸,c-α-甲基-丙氨酸,c-α-乙基-丙氨酸,2-氨基-2-甲基戊-4-烯酸(α-烯丙基丙氨酸),β-高丙氨酸,2-茚满基-甘氨酸,二-正丙基-甘氨酸,二-正丁基-甘氨酸,二乙基甘氨酸,(1-萘基)丙氨酸,(2-萘基)丙氨酸,环己基甘氨酸,环丙基甘氨酸,环戊基甘氨酸,金刚烷基-甘氨酸,和β-高烯丙基甘氨酸,包括它们的D-和L-立体异构体,条件是它们的结构允许这样的立体异构形式。
在某些实施方案中,所述分子可以包含刚好一个参与分子间β-片层的氨基酸段(即,刚好一个如上面所讨论的‘分子段’)。在某些优选的实施方案中,所述分子可以包含两个或更多个参与分子间β-片层的氨基酸段(即,两个或更多个如上面所讨论的‘分子段’)。例如,所述分子可是包含2-6个、优选2-5、更优选2-4个、或甚至更优选2或3个分子段。例如,所述分子可以包含刚好2个、或刚好3个、或刚好4个或刚好5个分子段,特别优选刚好2个或刚好3个分子段,甚至更优选刚好2个分子段。加入两个或更多个分子段趋于增加所述分子下调各个突变或变异蛋白和诱导各个突变或变异蛋白的聚集的有效性。因此,在优选的实施方案中,所述两个或更多个分子段将针对相同的突变或变异蛋白。然而,可以想象其中两个或更多个分子段针对不同的突变或变异蛋白的构型,并且可以提供更通用的靶向剂。
在所述分子包含如本文所教导的两个或更多个分子段的情况下,这些分子段可以各自独立地相同或不同。例如,在具有刚好2个分子段的分子中,所述2个分子段可以相同或不同;在具有刚好3个分子段的分子中,所有3个段可以相同,或各个段可以彼此不同,或2个段可以相同,且剩余的段可以不同;或在具有刚好4个分子段的分子中,所有4个段可以相同,或各个段可以彼此不同,或2个或3个段可以相同且剩余的一个或多个段可以与前者不同且任选地彼此相同。
借助于实例且非限制性地,在两个分子段被认为不同的情况下,每个分子段可以对应不同的如本文所教导的突变/变异段,诸如例如非重叠的、重叠的或巢式的、但仍然不同的突变/变异段,优选相同突变或变异蛋白的突变/变异段。在这样的实施方案中,两个分子段可以设计具有不同的基础氨基酸序列,并且可以任选地还在其他方面不同,诸如它们掺入(或不掺入)氨基酸置换、D-异构体和/或各个氨基酸的类似物的程度。或者在两个分子段被认为不同的情况下,各个分子段可以对应于相同的突变/变异段,使得所述两个分子段被设计具有相同的基础氨基酸序列,但在其他方面可以不同,诸如它们掺入(或不掺入)氨基酸置换、D-异构体和/或各个氨基酸的类似物的程度。在特别优选的实施方案中,所述两个或更多个分子段对应于相同的突变/变异段,更优选所述两个或更多个分子段在氨基酸置换方面没有差异(例如,与突变/变异段相比它们可以不掺入任何氨基酸置换或可以掺入相同的氨基酸置换),并且甚至更优选在它们掺入D-异构体和/或各个氨基酸的类似物的程度方面没有差异(例如,它们可以在相同的位置处不掺入任何D-异构体和/或类似物或可以掺入相同的D-异构体和/或类似物)。因此,在特别优选的实施方案中,所述两个或更多个分子段是相同的。
在所述分子包含两个或更多个参与分子间β-片层的氨基酸段(即,两个或更多个如上所述的“分子段”)的情况下,提到“分子间β-片层”不一定表示物理上相同的β-片层,但可以表示具有另一个突变或变异蛋白分子的另一个β-片层。例如,具有两个分子段的分子可以在同一β-片层中接合两个突变或变异蛋白分子,或在两个独立的β-片层中接合两个突变或变异蛋白分子,或初始地在两个独立的β-片层中接合两个突变或变异蛋白分子(所述两个独立的β-片层后续变成同一β-片层的一部分或由β-片层形成驱动的相同的更高级结构)。因此,特别寻求的是在突变或变异蛋白分子被靶向的APR中朝向β-链和β-片层发生构象变化,最终减少所述突变或变异蛋白分子的溶解度并导致所述突变或变异蛋白分子聚集。
在优选实施方案中,为减少包含上述一个或多个氨基酸段的分子自解离或自聚集的倾向性,甚至在暴露于它们的靶突变或变异蛋白之前(例如,在产生后或在储存期间沉淀),所述一个或多个氨基酸段可以被氨基酸围住或门控(gated),这可以减少或防止此类自缔合(也称作“门卫氨基酸”或“门卫”)。因此,在某些实施方案中,所述分子内的所述一个或多个氨基酸段各自独立地(特别是直接或紧接)在每个末端独立地侧接一个或多个氨基酸,特别是连续氨基酸,其显示低β-片层形成潜力或破坏β-片层的倾向性。典型地,此类侧翼区可以各自独立地包含1-10个、优选1-8个、更优选1-6个、或甚至更优选1-4个,诸如刚好1个、刚好2个、刚好3个或刚好4个氨基酸,特别是连续氨基酸,其具有低β-片层形成潜力或破坏β-片层的倾向性。
在某些优选的实施方案中,具有低β-片层形成潜力或破坏β-片层的倾向性的氨基酸可以是带电荷的氨基酸,诸如带正电荷的(碱性,诸如总共+1或+2个电荷)氨基酸或带负电荷的(酸性,诸如总共-1或-2个电荷)氨基酸,诸如在其R部分中含有氨基(当被质子化时为–NH3 +)或羧基(当解离时为–COO-)的氨基酸。在某些其他实施方案中,具有低β-片层形成潜力或破坏β-片层的倾向性的氨基酸可以是特征为高构象刚性的氨基酸,例如因在杂环,诸如在吡咯烷中,加入其肽键形成氨基基团所致。
因此,在某些优选的实施方案中,具有低β-片层形成潜力或破坏β-片层的倾向性的氨基酸可以是R,K,E,D,P,N,S,H,G,Q或A,包括其D-和L-立体异构体,或其类似物。在某些优选的实施方案中,具有低β-片层形成潜力或破坏β-片层的倾向性的氨基酸可以是R,K,E,D,P,N,S,H,G或Q,包括其D-和L-立体异构体,或其类似物。在某些更优选实施方案中,具有低β-片层形成潜力或破坏β-片层的倾向性的氨基酸可以是R,K,E,D或P,包括其D-和L-立体异构体,或其类似物。在某些更优选实施方案中,具有低β-片层形成潜力或破坏β-片层的倾向性的氨基酸可以是R,K,E或D,包括其D-和L-立体异构体,或其类似物。因此,在某些实施方案中,所述分子内的所述一个或多个氨基酸段在每个末端各自独立地侧接一个或多个选自由下列组成的组的氨基酸,优选1-4个连续氨基酸:R,K,E,D,P,N,S,H,G,Q,和A,其D-和L-立体异构体,以及其类似物,及其组合;或选自由下列组成的组:R,K,E,D,P,N,S,H,G,和Q,其D-和L-立体异构体,以及其类似物,及其组合;或选自由下列组成的组:R,K,E,D,和P,其D-和L-立体异构体,以及其类似物,及其组合。
借助于实例且非限制性地,精氨酸类似物,尤其是携带正电荷或可以被质子化以携带正电荷的精氨酸类似物,可以选自由下列组成的列表:2-氨基-3-脲基-丙酸,正精氨酸,2-氨基-3-胍基-丙酸,乙二醛-氢化咪唑啉酮,甲基乙二醛-氢化咪唑啉酮,N’-硝基-精氨酸,高精氨酸,ω-甲基-精氨酸,N-α-甲基-精氨酸,N,N’-二乙基-高精氨酸,刀豆氨酸,和β-高精氨酸,包括它们的D-和L-立体异构体,条件是它们的结构允许这样的立体异构形式。借助于实例且非限制性地,赖氨酸类似物,尤其是携带正电荷或可以被质子化以携带正电荷的赖氨酸类似物,可以选自由下列组成的列表:N-ε-甲酰基-赖氨酸,N-ε-甲基-赖氨酸,N-ε-i-丙基-赖氨酸,N-ε-二甲基-赖氨酸,N-ε-三甲基铵-赖氨酸,N-ε-烟酰基-赖氨酸,鸟氨酸,N-δ-甲基-鸟氨酸,N-δ-N-δ-二甲基-鸟氨酸,N-δ-i-丙基-鸟氨酸,c-α-甲基-鸟氨酸,β,β-二甲基-鸟氨酸,N-δ-甲基-N-δ-丁基-鸟氨酸,N-δ-甲基-N-δ-苯基-鸟氨酸,c-α-甲基-赖氨酸,β,β-二甲基-赖氨酸,N-α-甲基-赖氨酸,高赖氨酸,和β-高赖氨酸,包括它们的D-和L-立体异构体,条件是它们的结构允许这样的立体异构形式。借助于实例且非限制性地,谷氨酸或天冬氨酸类似物,尤其是携带负电荷或可以被解离以携带负电荷的谷氨酸或天冬氨酸类似物,可以选自由下列组成的列表:2-氨基-己二酸(高谷氨酸),2-氨基-庚二酸(2-氨基庚二酸),2-氨基-辛二酸(氨基辛二酸),和2-氨基-4-羧基-戊二酸(4-羧基谷氨酸),包括它们的D-和L-立体异构体,条件是它们的结构允许这样的立体异构形式。借助于实例且非限制性地,脯氨酸类似物可以选自由下列组成的列表:3-甲基脯氨酸,3,4-脱氢-脯氨酸,2-[(2S)-2-(肼羰基)吡咯烷-1-基]-2-氧代乙酸,β-高脯氨酸,α-甲基-脯氨酸,羟基脯氨酸,4-氧-脯氨酸,β,β-二甲基-脯氨酸,5,5-二甲基-脯氨酸,4-环己基-脯氨酸,4-苯基-脯氨酸,3-苯基-脯氨酸,和4-氨基脯氨酸,包括它们的D-和L-立体异构体,条件是它们的结构允许这样的立体异构形式。可以包括在如本文所公开的一个或多个门卫部分中的氨基酸(可能与其他氨基酸组合)的更多的非限制性实例为二氨基庚二酸。可以包括在如本文所公开的一个或多个门卫部分中的氨基酸(可能与其他氨基酸组合)的更多的非限制性实例为瓜氨酸。
借助于举例说明且非限制性地,可以侧接所述分子段的此类门卫序列或区域的实例可以各自独立地是R,K,E,D,P,A,二氨基庚二酸,瓜氨酸,RR,KK,EE,DD,PP,RK,KR,ED,DE,RRR,KKK,DDD,EEE,PPP,RRK,RKK,KKR,KRR,RKR,KRK,DDE,DEE,EED,EDD,EDE或DED等,其中任何精氨酸、赖氨酸、谷氨酸、天冬氨酸、脯氨酸或丙氨酸可以是L-或D-异构体,并且任选地其中任何精氨酸、赖氨酸、谷氨酸、天冬氨酸、脯氨酸或丙氨酸可以被其类似物置换,如在本说明书中其他地方讨论的那样。
如前所讨论的,所述分子可以包含呈现或模拟能够与由突变或变异蛋白APR所贡献的β-链相互作用的β-链构象以便导致通过所述相互作用的β-链形成分子间β-片层的至少一个部分,而在某些实施方案中,此类部分可以优选是参与分子间β-片层的氨基酸段(‘分子段’)。在某些其他实施方案中,所述部分可以是此类分子段的肽模拟物。术语“肽模拟物”是指非肽作用剂,所述非肽作用剂是相应肽的拓扑类似物。合理设计肽的肽模拟物的方法在本领域中是已知的。例如,基于硫酸化8聚肽CCK26-33的对三个肽模拟物的合理设计,以及基于11聚肽P物质的对两个肽模拟物的合理设计,以及相关的肽模拟物设计原理,记载在Horwell 1995(Trends Biotechnol 13:132-134)中。
在旨在与突变或变异蛋白APR的β-链联锁的部分外(诸如换句话说,在如到此为止所讨论的“一个或多个分子段”外)的分子的化学性质和结构相对不太重要,在此程度下,所述分子的这些剩余区段或部分不干扰或优选促进或允许上述分子间β-片层相互作用。
在某些实施方案中,在所述分子包含两个或更多个如本文所讨论的分子段(每个任选地和优选地侧接门卫区)的情况下,这些分子段连接,尤其共价连接,直接地或优选通过接头(也称作间隔基)连接。这些接头或间隔基的加入可以赋予单个分子段以更大的构象自由度和与突变或变异蛋白相互作用较少的空间位阻。任选地,除了置于分子段之间以外,接头还可以加到所述分子的第一个分子段的外部和/或最后一个分子段的外部。这加以变通地适用于仅包括一个分子段的分子,任选地和优选地侧接门卫区,其中接头可以偶联到单一分子段的一端或两端。
此类接头的性质和结构不特别地受限制。接头可以是刚性接头或柔性接头。在特定的实施方案中,接头是共价接头,获得共价键。术语“共价的”或“共价键”是指涉及两个原子间共享一个或多个电子对的化学键。接头可以是,例如,(多)肽或非肽接头,诸如非肽聚合物,诸如非生物聚合物。优选地,任何连接可以是水解稳定的连接,即,在水中在有用的pH值时基本上是稳定的,包括尤其在生理条件下,持续延长的时段,例如,持续几天。
在某些实施方案中,每个接头可以独立地选自1-20个相同或不相同单元的段,其中单元是氨基酸、单糖、核苷酸或单体。不相同的单元可以是相同性质的不相同单元(例如,不同的氨基酸,或一些共聚物)。它们还可以是不同性质的不相同单元,例如,具有氨基酸和核苷酸单元的接头,或包含两个或更多个不同的单体种类的杂聚物(共聚物)。根据具体实施方案,每个接头可以独立地由相同性质的1-10个单元构成,特别是相同性质的1-5个单元。根据特定实施方案,所述分子中存在的所有接头可以具有相同性质,或可以是相同的。
在特定实施方案中,任何一个接头可以是一个或多个氨基酸的肽或多肽接头。在某些实施方案中,所述分子中的所有接头可以是肽或多肽接头。更特别地,肽接头可以为1-20个氨基酸长,诸如优选1-10个氨基酸长,诸如更优选2-5个氨基酸长。例如,接头可以为刚好1、2、3、4、5、6、7、8、9或10个氨基酸长,诸如优选刚好2、3或4个氨基酸长。构成接头的氨基酸的性质不特别重要,只要与其连接的分子段的生物活性基本上不受损害即可。优选的接头基本上没有免疫原性和/或不易于受蛋白水解裂解。在某些实施方案中,接头可以包含预期的二级结构,诸如α-螺旋结构。然而,预期呈现柔性、无规线团结构的接头是优选的。有形成β-链的趋势的接头可能是不太优选的或可能需要避免。半胱氨酸残基可能是不太优选的或可能因它们形成分子间二硫键的能力而需要避免。碱性或酸性氨基酸残基,诸如精氨酸、赖氨酸、组氨酸、天冬氨酸和谷氨酸可能是不太优选的或可能因它们意想不到的静电相互作用而需要避免。在某些优选的实施方案中,肽接头可以包含下列,基本上由选自下列组成的组的氨基酸组成或由选自下列组成的组的氨基酸组成:甘氨酸,丝氨酸,丙氨酸,苯丙氨酸,苏氨酸,脯氨酸,及其组合,包括其D-异构体和类似物。在某些优选的实施方案中,肽接头可以包含下列,基本上由选自下列组成的组的氨基酸组成或由选自下列组成的组的氨基酸组成:甘氨酸,丝氨酸,丙氨酸,苏氨酸,脯氨酸,及其组合,包括其D-异构体和类似物。在甚至更优选的实施方案中,肽接头可以包含下列,基本上由选自下列组成的组的氨基酸组成或由选自下列组成的组的氨基酸组成:甘氨酸,丝氨酸,及其组合,包括其D-异构体和类似物。在某些实施方案中,肽接头可以仅由甘氨酸和丝氨酸残基组成。在某些实施方案中,肽接头可以仅由甘氨酸残基或其类似物,优选仅由甘氨酸残基组成。在某些实施方案中,肽接头可以仅由丝氨酸残基或其D-异构体或类似物,优选仅由丝氨酸残基组成。此类接头提供了特别良好的柔性。在某些实施方案中,接头可以基本上由或由甘氨酸和丝氨酸残基组成。在某些实施方案中,甘氨酸和丝氨酸残基可以以4:1-1:4的比率存在(按数量计),诸如约3:1,约2:1,约1:1,约1:2或约1:3的甘氨酸:丝氨酸。优选地,甘氨酸可以比丝氨酸更丰富一些,例如,4:1-1.5:1的甘氨酸:丝氨酸的比率,诸如约3:1或约2:1的甘氨酸:丝氨酸(按数量计)。在某些实施方案中,接头的N-末端和C-末端残基都是丝氨酸残基;或接头的N-末端和C-末端残基都是甘氨酸残基;或N-末端残基是丝氨酸残基,C-末端残基是甘氨酸残基;或N-末端残基是甘氨酸残基,C-末端残基是丝氨酸残基。在某些实施方案中,肽接头可以仅由脯氨酸残基或其D-异构体或类似物,优选仅由脯氨酸残基组成。借助于实例且非限制性地,如本文所期望的肽接头可以为例如PP,PPP,GS,SG,SGG,SSG,GSS,GGS,GSGS(SEQ ID NO:70),AS,SA,GF,FF,等等。
在某些实施方案中,接头可以是非肽接头。在优选的实施方案中,非肽接头可以包含,基本上由或由非肽聚合物组成。术语“非肽聚合物”当用于本文中时是指包括彼此通过不包括肽键的共价键连接的两个或更多个重复单元的生物相容聚合物。例如,非肽聚合物可以为2-200个单元长或2-100个单元长或2-50个单元长或2-45个单元长或2-40个单元长或2-35个单元长或2-30个单元长或5-25个单元长或5-20个单元长或5-15个单元长。非肽聚合物可以选自下列组成的组:聚乙二醇,聚丙二醇,乙二醇和丙二醇的共聚物,聚氧乙烯多元醇,聚乙烯醇,多糖,葡聚糖,聚乙烯基乙醚,可生物降解聚合物诸如PLA(聚(乳酸)和PLGA(聚乳酸-乙醇酸),脂质聚合物,壳多糖,透明质酸,及其组合。特别优选的是聚(乙二醇)(PEG)。另一个特别想得到的化学接头是Ttds(4,7,10-三氧杂十三烷-13-丁酰胺酸)。非肽聚合物的分子量优选的范围可以为1-100kDa,且优选1-20kDa。非肽聚合物可以是一个聚合物或不同类型的聚合物的组合。非肽聚合物具有能够结合到待被所述接头偶联的元件的反应性基团。优选地,非肽聚合物在每个末端具有反应性基团。优选地,反应性基团选自由下列组成的组:反应性醛基,丙醛基,丁醛基,马来酰亚胺基和琥珀酰亚胺衍生物。琥珀酰亚胺衍生物可以是琥珀酰亚胺基丙酸酯、羟基琥珀酰亚胺基、琥珀酰亚胺基羧甲基或琥珀酰亚胺基碳酸酯。非肽聚合物的两个末端处的反应性基团可以是相同的或不同的。在某些实施方案中,非肽聚合物的两个末端处具有反应性醛基。例如,非肽聚合物可以在一个末端处具有马来酰亚胺基,在另一末端处具有醛基、丙醛基或丁醛基。当在其两个末端处具有反应性羟基的聚乙二醇(PEG)用作非肽聚合物时,羟基可以通过已知的化学反应活化成各种反应性基团,或具有可商购的修饰的反应性基团的PEG可以用来制备蛋白缀合物。
在某些特别优选的实施方案中,所述分子的可操作组成部分,即,负责对突变或变异蛋白的效应的组成部分,可以是肽。换句话说,在此类实施方案中,形成与突变或变异蛋白APR相互作用的β-链的一个或多个分子段,任选地和优选地侧接门卫区,接头任选地和优选地置于分子间段之间,并且任选地但不太优选地添加到最外侧的分子段之外的接头全部由通过肽键共价连接的氨基酸组成(可以包括D-和L-立体异构体和氨基酸类似物)。优选地,所述分子的此类肽可操作组成部分的总长度不超过50个氨基酸,诸如不超过45、40、35、30、25或甚至20个氨基酸。所述分子的此类肽可操作组成部分可以偶联到一个或多个其他部分,它们本身可以但不一定是氨基酸、肽或多肽,并且可以发挥其他功能,诸如允许检测所述分子,当施用于受试者时增加所述分子的半衰期,增加所述分子的溶解度,增加所述分子的细胞摄取,等等,如本说明书中其他地方讨论的那样。在某些特别优选的实施方案中,所述分子是肽。优选地,此类肽的总长度不超过50个氨基酸,诸如不超过45、40、35、30、25或甚至20个氨基酸。在所述分子包含例如肽,基本上由肽组成或由肽组成的情况下,所述分子的N-末端可以被修饰,诸如例如,通过乙酰化修饰,和/或所述分子的C-末端可以被修饰,诸如例如通过酰胺化修饰。
鉴于前面的讨论,在某些实施方案中,如本文所教导的分子可以方便地表示为包含下列结构,基本上由下列结构组成或由下列结构组成:
a)NGK1-P1-CGK1,
b)NGK1-P1-CGK1-Z1-NGK2-P2-CGK2,
c)NGK1-P1-CGK1-Z1-NGK2-P2-CGK2-Z2-NGK3-P3-CGK3,或
d)NGK1-P1-CGK1-Z1-NGK2-P2-CGK2-Z2-NGK3-P3-CGK3-Z3-NGK4-P4-CGK4,
其中:
P1至P4各自独立地表示如上面所教导的氨基酸段(‘分子段’),
NGK1至NGK4和CGK1至CGK4各自独立地表示如上面所教导的门卫区,以及
Z1至Z3各自独立地表示直接键或优选如上面所教导的接头。
在此,结构a)是指仅包含一个如本文所教导的分子段的分子,而结构b)、c)和d)是指分别包含两个、三个或四个如本文所教导的分子段的分子。
在某些实施方案中,如上面所解释的那样,NGK1至NGK4和CGK1至CGK4可以各自独立地表示表现出低β-片层形成潜力或破坏β-片层的倾向性的1-4个连续氨基酸,诸如选自由下列组成的组的1-4个连续氨基酸:R,K,D,E,P,N,S,H,G,Q和A,其D-异构体和/或类似物,及其组合,优选选自由下列组成的组的1-4个连续氨基酸:R,K,D,E,P,N,S,H,G和Q,其D-异构体和/或类似物,及其组合,更优选选自由下列组成的组的1-4个连续氨基酸:R,K,D,E和P,其D-异构体和/或类似物,及其组合。在某些实施方案中,NGK1至NGK4和CGK1至CGK4可以各自独立地表示选自由下列组成的组的1-2个连续氨基酸:R,K,A和D,其D-异构体和/或类似物,及其组合,诸如NGK1至NGK4和CGK1至CGK4可以各自独立地为K,R,D,A或KK。在某些特别优选的实施方案中,NGK1至NGK4和CGK1至CGK4可以各自独立地表示选自由下列组成的组的1-2个连续氨基酸:R,K和D,其D-异构体和/或类似物,及其组合,诸如NGK1至NGK4和CGK1至CGK4可以各自独立地为K,R,D或KK。
在某些特别优选的实施方案中,每个接头独立地选自1-10个单元的段,优选1-5个单元,其中单元各自独立地为氨基酸或PEG,诸如各个接头独立地为GS,PP,AS,SA,GF,FF或GSGS(SEQ ID NO:70),或其D-异构体和/或类似物,优选各个接头独立地为GS,PP或GSGS(SEQ ID NO:70),优选GS,或其D-异构体和/或类似物。在某些优选的实施方案中,各个独立地,包括直接键代替接头。
在某些优选的实施方案中,所述分子包含下列结构的肽,基本上由下列结构的肽组成或由下列结构的肽组成:
a)Gate-Pept-Gate;
b)接头-Gate-Pept-Gate;
c)Gate-Pept-Gate-接头;
d)接头-Gate-Pept-Gate-接头;
e)Gate-Pept-Gate-(接头)-Gate-Pept-Gate;
f)接头-Gate-Pept-Gate-(接头)-Gate-Pept-Gate;
g)Gate-Pept-Gate-(接头)-Gate-Pept-Gate-接头;
h)接头-Gate-Pept-Gate-(接头)-Gate-Pept-Gate-接头;
i)Gate-Pept-Gate-(接头)-Gate-Pept-Gate-(接头)-Gate-Pept-Gate;
j)接头-Gate-Pept-Gate-(接头)-Gate-Pept-Gate-(接头)-Gate-Pept-Gate;
k)Gate-Pept-Gate-(接头)-Gate-Pept-Gate-(接头)-Gate-Pept-Gate-接头;或
l)接头-Gate-Pept-Gate-(接头)-Gate-Pept-Gate-(接头)-Gate-Pept-Gate-接头;
其中“Gate”,“Pept”,和“接头”表示通过肽键与邻近的肽元件结合的肽元件,其中肽元件从左到右的次序标志了肽中它们的N-至C-末端的组织方式;
其中“Pept”各自独立地表示上文所教导的氨基酸段(‘分子段’);
其中“Gate”各自独立地为赖氨酸(K)或D-赖氨酸或D-或L-赖氨酸类似物(优选赖氨酸),精氨酸(R)或D-精氨酸或D-或L-精氨酸类似物(优选精氨酸),天冬氨酸(D)或D-天冬氨酸或D-或L-天冬氨酸类似物(优选天冬氨酸),谷氨酸(E)或D-谷氨酸或D-或L-谷氨酸类似物(优选谷氨酸),KK,KKK,KKKK(SEQ ID NO:45),RR,RRR,RRRR(SEQ ID NO:46),DD,DDD,DDDD(SEQ ID NO:47),EE,EEE,EEEE(SEQ ID NO:48),KR,RK,KKR,KRK,RKK,RRK,RKR,KRR,KRKR(SEQ ID NO:49),KRRK(SEQ ID NO:50),RKKR(SEQ ID NO:51),DE,ED,DDE,DED,EED,EED,EDE,DEE,DEDE(SEQ ID NO:52),DEED(SEQ ID NO:53),或EDDE(SEQ ID NO:54),任选地其中所述氨基酸的任一个或多个或全部被其D-异构体或其类似物替换,包括此类类似物的L-和D-异构体;以及
其中在括号中纳入词“接头”表示所述接头各自独立地可以不存在或优选存在,并且其中“接头”各自独立地为甘氨酸(G)或D-或L-甘氨酸类似物(优选甘氨酸),丝氨酸(S)或D-丝氨酸或D-或L-丝氨酸类似物(优选丝氨酸),脯氨酸(P)或D-脯氨酸或D-或L-脯氨酸类似物(优选脯氨酸),GG,GGG,GGGG(SEQ ID NO:55),SS,SSS,SSSS(SEQ ID NO:56),GS,SG,GGS,GSG,SGG,SSG,SGS,SSG,GGGS(SEQ ID NO:57),GGSG(SEQ ID NO:58),GSGG(SEQ ID NO:59),SGGG(SEQ ID NO:60),GGSS(SEQ ID NO:61),GSSG(SEQ ID NO:62),SSGG(SEQ ID NO:63),GSGS(SEQ ID NO:70),SGSG(SEQ ID NO:64),GSGSG(SEQ ID NO:65),SGSGS(SEQ IDNO:66),PP,PPP或PPPP(SEQ ID NO:67),任选地其中所述氨基酸的任一个或多个或全部被其D-异构体或其类似物替换,包括此类类似物的L-和D-异构体。
在此类肽中,N-末端氨基酸可以被修饰,诸如乙酰化和/或C-末端氨基酸可以被修饰,诸如酰胺化。在此类肽中,可以掺入一个或多个D-氨基酸和或一个或多个氨基酸类似物,只要它们的掺入与如本文所教导的分子间β-片层的形成相容即可。
如上面已经论述的,在某些实施方案中,如本文所教导的分子可以包含一个或多个其他部分、基团、组分或组成部分,它们可以发挥其他功能或执行其他作用和活性。此类功能、作用或活性可以例如在所述分子的产生、合成、分离、纯化或配制有关的方面中、或在与它们的实验或治疗用途有关的方面中是有用的或是期望的。便利地,所述分子的可操作组成部分,即,负责对突变或变异蛋白的作用的组成部分,可以连接到一个或多个此类更多的部分、基团、组分或组成部分,优选共价连接、结合、键接或融合,直接地或通过接头连接。在此类更多的部分、基团、组分或组成部分是肽、多肽或蛋白的情况下,与所述分子的可操作组成部分连接可以优选地涉及肽键、直接键或通过肽接头。
对于所有此类添加的部分,融合体或接头的性质对于本发明不是至关重要的,只要所述部分和所述分子可以发挥它们的特异性功能即可。根据特定的实施方案,与所述分子融合的部分可以被裂解掉,例如,通过使用具有蛋白酶识别位点的接头部分。以这样的方式,所述部分和所述分子的功能可以分开,这对于较大的部分可以是特别感兴趣的,或对于其中在特定的时间点后所述部分不再需要的实施方案,例如,在使用标签的分离步骤后被裂解掉的标签,可以是特别感兴趣的。
在某些优选的实施方案中,所述分子可以包含可检测标记、允许分离所述分子的部分、增加所述分子的稳定性的部分、增加所述分子的溶解度的部分、增加所述分子的细胞摄取的部分、实现所述分子靶向细胞的部分、或其任何两个或更多个的组合。应当理解单个部分可以执行两个或更多个功能或活性。
在此,在某些实施方案中,所述分子可以包含可检测标记。术语“标记”是指可以用来提供可检测的和优选可定量的读出或特性的、并且可以附接到或制成为感兴趣实体(诸如如本文所教导的分子,诸如如本文所教导的肽)的一部分的任何原子、分子、部分或生物分子。标记可以合适地通过例如质谱的、分光光度的、光学的、比色的、磁的、光化学的、生物化学的、免疫化学的或化学的手段检测。标记包括且不限于:染料;放射性标记,诸如氢、碳、氮、氧、磷、硫、氟、氯或碘的同位素,诸如分别为2H,3H,13C,11C,14C,15N,18O,17O,31P,32P,33P,35S,18F,36Cl,125I,或131I;电子致密试剂;酶(例如,免疫测定中普遍使用的辣根过氧化物酶或碱性磷酸酶);结合部分,诸如生物素-链霉亲和素;半抗原,诸如地高辛(digoxigenin);发光的、发磷光的或发荧光的部分;质量标签;荧光染料(例如,荧光团,诸如荧光素、羧基荧光素(FAM)、四氯-荧光素、TAMRA、ROX、Cy3、Cy3.5、Cy5、Cy5.5、Texas Red等),其单独地或与可以通过荧光共振能量转移(FRET)抑制或移位发射光谱的部分组合;和荧光蛋白(例如,GFP,RFP)。某些同位素标记的分子诸如如本文所教导的肽,例如,其中掺入了放射性同位素诸如3H和14C的那些,可用于药物和/或底物组织分布测定。3H和14C同位素因它们容易制备和可检测性是特别优选的。此外,利用较重的同位素诸如2H替代可以提供某些治疗优势,所述治疗优势来自更大的代谢稳定性,例如体内半衰期增加或剂量需求减小,并且因此,在一些情况下可以是优选的。同位素标记的分子诸如肽一般可以通过执行其中容易获得的同位素标记的试剂替代非同位素标记的试剂的生产或合成方法来制备。在一些实施方案中,所述分子可以提供以允许利用另一试剂(例如,具有探针结合伴侣)检测的标签。此类标签可以是,例如:生物素,链霉亲和素,his-标签,myc标签,FLAG标签(DYKDDDDK,SEQ ID NO:68),麦芽糖,麦芽糖结合蛋白或本领域中已知的具有结合伴侣的任何其他类型的标签。在探针:结合伴侣配置中可以利用的缔合的实例可以是任意的,并且包括,例如生物素:链霉亲和素,his-标签:金属离子(例如,Ni2+),麦芽糖:麦芽糖结合蛋白等。标记的突变体或变体-靶向分子可以使它们自身适应各种各样的用途和应用,诸如非限制性地,在体外测定中的用途,包括诊断测定,其中标记的pept-in可以提供这样的原理,即,在来自受试者的生物学样品中结合并允许检测感兴趣各个突变或变异蛋白;或在体内成像中的用途,其中标记的突变体或变体-靶向pept-in在体内的分布可以通过在施用后的非侵入性成像方法来追踪。
在进一步的实施方案中,所述分子可以包含允许分离(分开,纯化)所述分子的部分。典型地,此类部分结合亲和纯化法工作,其中通过可分离的结合剂(诸如免疫结合剂(抗体))与感兴趣成分之间的特异性结合来赋予将感兴趣的特定组分与其他组分分离的能力。此类亲和纯化法包括,不限于,亲和色谱和磁性粒子分离。此类部分在本领域中是众所周知的,并且非限制性实例包括生物素(可使用利用链霉亲和素的亲和纯化法分离)、his-标签(可使用利用金属离子的亲和纯化法分离,例如,Ni2+)、麦芽糖(可使用利用麦芽糖结合蛋白的亲和纯化法分离)、谷胱甘肽S-转移酶(GST)(可使用利用谷胱甘肽的亲和纯化法分离)、或myc或FLAG标签(可分别使用利用抗-myc或抗-FLAG抗体的亲和纯化法分离)。
在进一步的实施方案中,所述分子可以包括增加所述分子的溶解度的部分。尽管可以通过加入如上所讨论的侧接所述一个或多个分子段的门卫部分来确保并控制所述分子的溶解度,原理上这可以足以防止所述分子的成熟前聚集并且将它们保持在溶液中,但进一步添加增加溶解度的部分,即,防止聚集,可以提供更容易的分子处置,并且特别地提高它们的稳定性和有效期。上面讨论的许多标记和分离标签也增加所述分子的溶解度。此外,此类增溶部分的众所周知的实例是PEG(聚乙二醇)。此部分是特别考虑的,因为它可以用作接头以及增溶部分。其他实例包括肽和蛋白或蛋白结构域,或甚至整个蛋白,例如,GFP。就此而言,应当注意到,像PEG,一个部分可以具有不同的功能或作用。例如,FLAG标签是可以用作标记的肽部分,但因其电荷密度,它也将增强增溶作用。PEG化已经被证明增加生物药物的溶解度(例如,Veronese和Mero,BioDrugs.2008;22(5):315-29)。向感兴趣分子添加肽、多肽、蛋白或蛋白结构域标签已经在本领域中广泛被记载。实例包括,但不限于,衍生自下列的肽:突触核蛋白(例如,Park等人,Protein Eng.Des.Sel.2004;17:251-260),SET(溶解度增强标签,Zhang等人,Protein Expr Purif 2004;36:207–216),硫氧还蛋白(TRX),谷胱甘肽-S-转移酶(GST),麦芽糖结合蛋白(MBP),N-利用物质(NusA),小泛素样修饰物(SUMO),泛素(Ub),二硫键C(DsbC),十七千道尔顿蛋白(Skp),噬菌体T7蛋白激酶片段(T7PK),蛋白G B1结构域,蛋白A IgG ZZ重复结构域,和细菌免疫球蛋白结合结构域(Hutt等人,J Biol Chem.;287(7):4462-9,2012)。标签的性质将取决于应用,如技术人员可以确定的那样。例如,对于本文所述的分子的转基因表达,可以设想将所述分子融合到较大结构域以防止被细胞机制成熟前降解。其他应用可以设想融合到较小的增溶标签(例如,小于30个氨基酸,或小于20个氨基酸,或甚至小于10个氨基酸)以便不会改变所述分子的特性太多。
在更多的实施方案中,所述分子可以包含增加所述分子的稳定性的部分,例如,增加所述分子的有效期,和/或所述分子的半衰期,可以涉及当施用时增加所述分子的稳定性和/或减少所述分子的清除率。此类部分可以调节所述分子的药代动力学和药效学特性。上述的标记、分离标签和增溶标签中的许多还增加所述分子的有效期或体内半衰期,并且加入D-氨基酸和/或氨基酸类似物也可以同样实现这些效应。例如,已知与白蛋白(例如,人血清白蛋白)、白蛋白结合结构域或合成的白蛋白结合肽融合提高了不同的治疗性蛋白的药代动力学和药效学(Langenheim和Chen,Endocrinol.;203(3):375-87,2009)。经常使用的另一部分是抗体的可结晶片段区(Fc)。Strohl(BioDrugs.2015,vol.29,215-39)综述了用于延长生物制品的半衰期的基于融合蛋白的策略,包括但不限于融合到人IgG Fc结构域,融合到HSA,融合到人转铁蛋白,融合到人工明胶样蛋白(GLP)等。在特定的实施方案中,所述分子不融合到琼脂珠、乳胶珠、纤维素珠、磁珠、硅珠、聚丙烯酰胺珠、微球、玻璃珠或任何固相支持物(例如,聚苯乙烯、塑料、硝酸纤维素膜、玻璃)、或NusA蛋白。然而,这些融合体是可能的,并且在具体实施方案中,它们也是能想到的。
在更多的实施方案中,所述分子可以包含增加所述分子的细胞摄取的部分。例如,所述分子可以进一步包括介导细胞穿透(或细胞易位)的序列,即,所述分子进一步通过细胞穿透序列的重组或合成附接来修饰。细胞穿透肽(CPP)或蛋白转导结构域(PTD)序列在本领域中是众所周知的。该术语一般是指能够进入细胞中的肽。此能力可以被利用用来将如本文所公开的分子递送到细胞。示例性但非限制性的CPP包括:HIV-1Tat-衍生的CPP(参见,例如,Frankel等人,1988(Science 240:70-73));触足肽或penetratin(参见,例如,Derossi等人,1994(J Biol Chem 269:10444-10450));衍生自HSV-1VP22的肽(参见,例如,Aints等人,2001(Gene Ther 8:1051-1056));转运素(transportan)(参见,例如,Pooga等人,1998(FASEB J 12:67-77));protegrin 1(PG-1)抗微生物肽SynB(Kokryakov等人,1993(FEBS Lett 327:231-236));模型两亲(MAP)肽(参见,例如,Oehlke等人,1998(BiochimBiophys Acta 1414:127-139));基于信号序列的细胞穿透肽(NLS)(参见,例如,Lin等人,1995(J Biol Chem 270:14255-14258));疏水性膜易位序列(MTS)肽(参见,例如,Lin等人,1995,见前);和多聚精氨酸、寡聚精氨酸和富含精氨酸的肽(参见,例如,Futaki等人,2001(J Biol Chem 276:5836-5840))。还普遍使用的其他细胞可穿透肽(天然肽和人工肽两者)公开在例如Sawant和Torchilin,Mol Biosyst.6(4):628-40,2010;Noguchi等人,CellTransplant.19(6):649-54,2010以及Lindgren和Langel,Methods Mol Biol.683:3-19,2011中。已经衍生自这些蛋白的载体肽显示彼此很小的序列同源性,但全部都是高度阳离子和富含精氨酸或赖氨酸。CPP可以具有任何长度。例如,CPP的长度可以小于或等于500、250、150、100、50、25、10或6个氨基酸。例如CPP的长度可以大于或等于4、5、6、10、25、50、100、150或250个氨基酸。优选地,CPP的长度可以为4-25个氨基酸。CPP的合适长度和设计容易由本领域技术人员确定。关于CPP的一般参考文献可以尤其参考“Cell penetratingpeptides:processes and applications”(编辑Ulo Langel,第1版,CRC Press 2002);Advanced Drug Delivery Reviews57:489-660(2005);Dietz&Bahr 2004(Moll CellNeurosci 27:85-131))。如本文所公开的作用剂可以与CPP直接或间接缀合,例如,借助于合适的接头,诸如但不限于基于PEG的接头。本文所述的分子可以不需要CPP来进入细胞。实际上,如实施例中所示,可能靶向细胞内蛋白,这要求所述分子被细胞摄取,并且这不需要融合到CPP就能发生。
在更多的实施方案中,所述分子可以包含实现所述分子靶向到细胞的部分。例如,所述分子可以融合到,例如,对给定靶标具有特异性的抗体、肽或小分子,尤其是对表达所述分子所针对的突变或变异蛋白的细胞有特异性,对在该细胞的表面上特异性表达的蛋白有特异性。在此类实施方案中,所述分子启动对所靶向的细胞中突变或变异蛋白的特异性下调或聚集。在某些情况下,结合结构域是化学化合物(例如,对至少一个靶蛋白有亲和性的小化合物),以及在某些其他情况下,结合结构域是多肽,在某些其他情况下,结合结构域是蛋白结构域。蛋白结合结构域是全蛋白结构的元件,它是自稳定的并且经常独立于蛋白链的其余部分折叠。结合结构域的长度从约25个氨基酸至500个和更多个氨基酸变化。许多结合结构域可以被归类于折叠,并且是可识别的、可标识的3-D结构。一些折叠在许多不同的蛋白中是那么普遍使得它们被赋予专用名称。非限制性实例是罗斯曼折叠(Rossmanfolds)、TIM桶、犰狳重复序列(armadillo repeats)、亮氨酸拉链、钙粘着蛋白结构域、死亡效应结构域、免疫球蛋白样结构域、磷酸酪氨酸结合结构域、pleckstrin同源结构域、src同源2结构域、BRCA1的BRCT结构域、G-蛋白结合结构域、Eps 15同源(EH)结构域和p53的蛋白结合结构域。抗体是特异性结合蛋白的天然原型,具有通过超变环区(所谓的互补决定区(CDR))介导的特异性。
如本文所用,术语“抗体”以其最宽泛的含义使用,并且一般是指任何免疫结合剂。该术语具体地涵盖完整的单克隆抗体、多克隆抗体、由至少两个完整抗体形成的多价(例如,2价、3价或更多价)和/或多特异性抗体(例如,双特异性或多特异性抗体)以及抗体片段(就此而言它们表现出期望的生物活性,特别地,特异性结合感兴趣抗原的能力,即,抗原结合片段)、以及此类片段的多价和/或多特异性复合物。术语“抗体”不仅包括通过包括免疫的方法生成的抗体,还包括任何多肽,例如,重组表达的多肽,其被制备以涵盖至少一个能够特异性结合感兴趣抗原上的表位的互补决定区(CDR)。因此,该术语适用于此类分子,无论它们是体外产生还是体内产生的。
抗体可以是IgA、IgD、IgE、IgG和IgM类型中的任一个,并且优选IgG型抗体。抗体可以是多克隆抗体,例如,抗血清或由其纯化的免疫球蛋白(例如,亲和纯化的)。抗体可以是单克隆抗体或单克隆抗体的混合物。单克隆抗体可以以较高的选择性和可重复性靶向特定的抗原或抗原内的特定表位。借助于实例且非限制性地,单克隆抗体可以通过首先由Kohler等人,1975(Nature 256:495)发表的杂交瘤法制备,或可以通过重组DNA法制备(例如,如见US 4,816,567)。单克隆抗体还可以使用如例如由Clackson等人,1991(Nature352:624-628)和Marks等人,1991(J Mol Biol 222:581-597)记载的技术从噬菌体抗体文库分离。
抗体结合剂可以是抗体片段。“抗体片段”包括完整抗体的一部分,包含其抗原结合区或可变区。抗体片段的实例包括Fab、Fab’、F(ab’)2、Fv和scFv片段,单结构域(sd)Fv,诸如VH结构域、VL结构域和VHH结构域;双链抗体(diabodies);线性抗体;单链抗体分子,尤其是重链抗体;和由抗体片段形成的多价和/或多特异性抗体,例如,二价抗体、三价抗体和多价抗体。上述名称Fab、Fab’、F(ab’)2、Fv、scFv等旨在具有它们的本领域公认的含义。
术语抗体包括源自来自任何动物物种的一个或多个部分或包含来自任何动物物种的一个或多个部分的抗体,动物物种优选脊椎动物物种,包括,例如,鸟类和哺乳动物。不受限制地,抗体可以是鸡的、火鸡的、鹅的、鸭的、珠鸡的、鹌鹑的或雉鸡的。还不受限制地,抗体可以是人的、鼠源的(例如,小鼠、大鼠等)、驴的、兔的、山羊的、绵羊的、豚鼠的、骆驼属动物(例如,双峰驼(Camelus bactrianus)和单峰驼(Camelus dromaderius))的、美洲驼(例如,小羊驼(Lama paccos)、大羊驼(Lama glama)或骆马(Lama vicugna))的或马的。
专业技术人员将理解抗体可以包括一个或多个氨基酸缺失、添加和/或置换(例如,保守置换),在此范围内此类改变保留了其与各自抗原的结合。抗体还可以包括对其组成的氨基酸残基的一个或多个天然或人工修饰(例如,糖基化等)。
产生多克隆抗体和单克隆抗体以及其片段的方法在本领域中是众所周知的,如用于产生重组抗体或其片段的方法(参见,例如,Harlow和Lane,“Antibodies:A LaboratoryManual”,Cold Spring Harbour Laboratory,New York,1988;Harlow和Lane,“UsingAntibodies:A Laboratory Manual”,Cold Spring Harbour Laboratory,New York,1999,ISBN 0879695447;“Monoclonal Antibodies:A Manual of Techniques”,Zola编辑,CRCPress1987,ISBN 0849364760;“Monoclonal Antibodies:A Practical Approach”,Dean&Shepherd编辑,Oxford University Press 2000,ISBN 0199637229;Methods inMolecular Biology,vol.248:“Antibody Engineering:Methods and Protocols”,Lo编辑,Humana Press 2004,ISBN 1588290921)。
在某些实施方案中,作用剂可以是
Figure BDA0003893144820000561
术语“纳米抗体
Figure BDA0003893144820000562
”是Ablynx NV(Belgium)的商标。术语“纳米抗体(Nanobody)”在本领域中是众所周知的,并且如在本文中以其最宽泛的含义使用,涵盖通过下列方法获得的免疫结合剂:(1)分离重链抗体的VHH结构域,优选衍生自骆驼科动物的重链抗体;(2)表达编码VHH结构域的核苷酸序列;(3)对天然存在的VHH结构域的“人源化”或通过表达编码此类人源化VHH结构域的核酸;(4)对来自任何动物物种的VH结构域的“骆驼化”,且特别是来自哺乳动物物种,诸如来自人类,或表达编码此类骆驼化VH结构域的核酸;(5)对如在本领域中所记载的“结构域抗体”或“dAb”的“骆驼化”,或表达编码此类骆驼化dAb的核酸;(6)使用本身已知的用于制备蛋白、多肽或其他氨基酸序列的合成或半合成技术;(7)使用本身已知的用于核酸合成的技术制备编码纳米抗体的核酸,接着表达由此获得的核酸;和/或(8)前述方法中的一种或多种的任意组合。“骆驼科动物(Camelids)”如本文中所用包括旧世界骆驼科动物(双峰驼和单峰驼)和新世界骆驼科动物(例如小羊驼、大羊驼和骆马)。
尽管一般来说,抗体样支架已经证明作为特异性结合剂良好地发挥作用,但很明显的是不强制严格遵循表现出CDR样环的刚性支架的范式。除了抗体以外,许多其他天然蛋白也介导结构域之间的特异性高亲和力相互作用。免疫球蛋白的替代物已经为设计新的结合(识别)分子提供了有吸引力的起点。如本文所用,术语支架是指可以携带改变的氨基酸或序列插入物的蛋白框架,所述氨基酸或序列插入物赋予与特定靶蛋白的结合。工程化支架和设计文库是相互依赖的过程。为了获得特异性结合剂,不得不生成支架的组合文库。通常这在DNA水平上完成,通过将在适宜的氨基酸位置处的密码子随机化,使用简并密码子或三核苷酸。目前具有广泛多样性来源和特性的大量不同的非免疫球蛋白支架用于组合文库展示。它们中的一些在大小上与抗体的scFV相当(约30kDa),而它们中的大多数小得多。基于重复蛋白的模块支架在尺寸上有所不同,取决于重复单元的数目。非限制性的实例列表包括:基于人第10个纤连蛋白III型结构域的结合剂,基于脂钙蛋白的结合剂,基于SH3结构域的结合剂,基于扭结菌素(knottin)家族成员的结合剂,基于CTLA-4的结合剂,T细胞受体,新制癌菌素,碳水化合物结合模块4-2,淀粉酶抑制肽(tendamistat),kunitz结构域抑制剂,PDZ结构域,Src同源结构域(SH2),蝎毒素,昆虫防御素A,植物同源结构域指蛋白,细菌酶TEM-1β-内酰胺酶,金黄色葡萄球菌蛋白A的Ig-结合结构域,大肠杆菌大肠杆菌素E7免疫蛋白,大肠杆菌细胞色素b562,锚蛋白重复结构域。因此,术语“抗体样蛋白支架”或“工程化蛋白支架”广义地涵盖蛋白性非免疫球蛋白特异性结合剂,典型地通过组合工程(诸如位点定向随机诱变结合噬菌体展示或其他分子选择技术)获得。通常,此类支架来自稳定的和小的可溶性单体蛋白(诸如Kunitz抑制剂或脂钙蛋白)或来自细胞表面受体的稳定折叠的膜外结构域(诸如蛋白A、纤连蛋白或锚蛋白重复区)。此类支架已经在Binz等人、Gebauer和Skerra、Gill和Damle、Skerra 2000以及Skerra 2007中进行了充分的综述,并且包括不限于亲合体(affibodies),基于葡萄球菌蛋白A的Z-结构域,58个残基的三螺旋束,在其α-螺旋中的两个上提供了界面(Nygren);工程化Kunitz结构域,基于小的(约58个残基)和稳定的二硫键交联的丝氨酸蛋白酶抑制剂,典型地为人来源(例如,LACI-D1),它可以对不同的蛋白酶特异性进行改造(Nixon和Wood);基于人纤连蛋白III的第10个细胞外结构域(10Fn3)的monobodies或adnectin,其采用了Ig-样β-夹心折叠(94个残基),具有2–3个暴露的环,但缺少中央二硫键(Koide和Koide);来自脂钙蛋白的anticalin,8链β-桶状蛋白(约180个残基)的多样化家族,其借助于在开放末端处的4个结构上可变的环天然地形成小配体的结合位点,它在人、昆虫和许多其他生物体中很丰富(Skerra 2008);DARPins,设计的锚蛋白重复结构域(166个残基),它提供了来自典型的三个重复的β-转角的刚性界面(Stumpp等人);avimers(多聚LDLR-A模块)(Silverman等人);以及富含半胱氨酸的扭结菌素肽(Kolmar)。还包括下述作为结合结构域:对给定的靶蛋白具有特异性的化合物,环状和线性肽结合剂,肽适体,多价avimer蛋白或小型模块化免疫药物,对受体或共同受体具有特异性的配体,在双杂交分析中鉴定的蛋白结合伴侣,基于生物素-抗生物素蛋白高亲和性相互作用的特异性的结合结构域,基于亲环素-FK506结合蛋白的特异性的结合结构域。还包括对特定的碳水化合物结构有亲和性的凝集素。
借助于实例,原癌基因的突变经常在癌症中发现,并且与本发明的分子融合的单克隆抗体可以被构造成特异性地结合受试者中由肿瘤细胞表达的蛋白,诸如,肿瘤抗原,优选表面肿瘤抗原。术语“肿瘤抗原”是指与正常的或非肿瘤性细胞相比,由肿瘤细胞专门地或差别表达的抗原,无论是细胞内还是在肿瘤细胞表面上(优选在肿瘤细胞表面上)。借助于实例,肿瘤抗原可以存在于肿瘤细胞中或在肿瘤细胞上,并且一般不在正常或非肿瘤细胞中或不在正常或非肿瘤细胞上(例如,仅由限制数目的正常组织表达,诸如睾丸和/或胎盘),或肿瘤抗原可以以比在正常或非肿瘤性细胞中或在正常或非肿瘤性细胞上更大的量存在于肿瘤细胞中或肿瘤细胞上,或肿瘤抗原可以以与在正常或非肿瘤性细胞中或在正常或非肿瘤性细胞上发现的不同形式存在于肿瘤细胞中或肿瘤细胞上。因此该术语包括肿瘤特异性抗原(TSA),包括肿瘤特异性膜抗原,肿瘤相关抗原(TAA),包括肿瘤相关膜抗原、肿瘤上的胚胎抗原、生长因子受体、生长因子配体等。该术语进一步包括癌症/睾丸(CT)抗原。肿瘤抗原的实例包括不限于,β-人绒毛膜促性腺激素(βHCG),糖蛋白100(gp100/Pme117),癌胚抗原(CEA),酪氨酸酶,酪氨酸酶相关蛋白1(gp75/TRP1),酪氨酸酶相关蛋白2(TRP-2),NY-BR-1,NY-CO-58,NY-ESO-1,MN/gp250,独特型,端粒酶,滑膜肉瘤X断裂点2(SSX2),粘蛋白1(MUC-1),黑色素瘤相关抗原(MAGE)家族的抗原,高分子量-黑色素瘤相关抗原(HMW-MAA),T细胞识别的黑色素瘤抗原1(MART1),肾母细胞瘤基因1(WT1),HER2/neu,间皮素(MSLN),甲胎蛋白(AFP),癌抗原125(CA-125),以及ras或p53的异常形式。肿瘤性疾病中的更多靶标包括不限于:CD37(慢性淋巴细胞性白血病),CD123(急性髓细胞样白血病),CD30(霍奇金/大细胞淋巴瘤),MET(NSCLC,胃食管癌),IL-6(NSCLC),和GITR(恶性黑色素瘤)。
在其他部分融合到所述分子的那些情况下,在特定实施方案中设想这些部分可以从所述分子移除。典型地,这通过掺入特异性蛋白酶裂解位点或等效的方式来完成。在所述部分是大蛋白的情况下尤其是这样:在这种情况下,所述部分可以在本文所述的任一个方法中使用所述分子之前被裂解掉(例如在纯化所述分子期间)。
然而,要注意靶向部分不是必需的,因为所述分子本身能够通过特异性序列识别发现它们的靶标。在备选的实施方案中,这还可以允许采用所述分子作为靶向部分,并且进一步融合到其他部分诸如药物、毒素或小分子。通过使所述分子靶向突变或变异蛋白,这些化合物可以被靶向到特定的细胞类型/小室。因此,例如,毒素可以选择性地被递送到表达突变原癌基因的癌细胞。
因为本发明利用了如通常在WO 2007/071789A1和WO2012/123419A1中记载的‘干扰子’技术,并且将此技术采用到其中蛋白的突变或变异形式包含与未修饰蛋白的APR不同的APR或包含重新合成的APR的新型特定情况中,因此应当理解WO 2007/071789A1和WO2012/123419A1关于此类‘干扰子’分子可以产生、分离、纯化、储存和配制的教导可以应用到本发明的情形中并且不需要在本文中更详细地阐明。
如提到的那样,在特定的实施方案中,所述分子的可操作组成部分可以包括肽,基本上由肽组成或由肽组成,优选所述分子的可操作组成部分可以是肽。而且,在许多实施方案中,例如,在所述分子的可操作组成部分不连接或融合到其他辅助部分或在这样的一个或多个附加部分本身是肽的情况下,整个分子可以是肽。因此,化学肽合成或重组肽或多肽生产的标准化工具和方法可以应用到本发明的分子的制备中。重组蛋白生产还可以应用于制备其中本身是蛋白的一个或多个附加部分被包括在所述分子中并通过肽键融合到所述分子的可操作组成部分的分子。
鉴于此技术已经是普遍常规的,为简化起见,本发明的分子的重组生产可以采用包含编码如本文所教导的分子的核酸和与所述核酸可操作连接的启动子的表达盒或表达载体,其中所述表达盒或表达载体被构造成在合适的宿主细胞中实现所述分子的表达,所述宿主细胞诸如细菌细胞,真菌细胞,包括酵母细胞,动物细胞,或哺乳动物细胞,包括人细胞和非人哺乳动物细胞。载体可以包括:质粒,噬菌粒,细菌噬菌体,细菌噬菌体衍生的载体,PAC,BAC,线性核酸,例如,线性DNA,或病毒载体,等等。表达载体可以自主复制的或整合的。表达载体可以含有选择标志物,例如,URA3,TRP1,以允许检测和/或选择转化细胞。可操作连接是其中调控序列和待表达序列以允许所述表达的方式连接的连接。所述启动子可以是组成性或诱导性(条件性)启动子,例如,化学调节的或物理调节的诱导性启动子。启动子的非限制性实例包括:T7,U6,H1,逆转录劳斯肉瘤病毒(RSV)LTR启动子,巨细胞病毒(CMV)启动子,金属硫蛋白启动子,腺病毒晚期启动子,SV40启动子,二氢叶酸还原酶启动子,β-肌动蛋白启动子,磷酸甘油激酶(PGK)启动子,和EF1α启动子。可以包括转录终止子和任选地转录增强子。重组核酸可以使用各种各样的方法引入到宿主细胞中,所述方法诸如直接注射、原生质体融合、氯化钙、氯化铷、氯化锂、磷酸钙、DEAE葡聚糖、阳离子脂质或脂质体、生物粒子轰击(“基因枪”法)、用病毒载体感染(例如,衍生自慢病毒、腺相关病毒(AAV)、腺病毒、逆转录病毒或抗病毒的载体)、电穿孔等。可以用于肽或多肽的小规模或大规模生产的表达系统(宿主细胞)包括不限于,微生物诸如细菌(例如,大肠杆菌,小肠结肠炎耶尔森氏菌(Yersinia enterocolitica),布鲁氏杆菌(Brucella sp.),伤寒沙门氏菌(Salmonellatymphimurium),粘质沙雷菌(Serratia marcescens)或枯草芽孢杆菌(Bacillussubtilis)),真菌细胞(例如,耶氏解脂假丝酵母(Yarrowia lipolytica),解腺嘌呤阿氏酵母(Arxula adeninivorans),嗜甲醇酵母(例如,念珠菌属(Candida)、汉森酵母属(Hansenula)、Oogataea属、毕赤酵母属(Pichia)或球拟酵母属(Torulopsis)的嗜甲醇酵母,例如,毕赤酵母(Pichia pastoris)、多形汉逊酵母(Hansenula polymorpha)、Ogataeaminuta或甲醇毕赤酵母(Pichia methanolica)),或曲霉菌属(Aspergillus)、木霉属(Trichoderma)、脉胞菌属(Neurospora)、镰刀菌属(Fusarium)或金孢子菌属(Chrysosporium)的丝状真菌,例如,黑曲霉(Aspergillus niger)、里氏木霉(Trichodermareesei),或酵母属或裂殖酵母属(Schizosaccharomyces)的酵母,例如,酿酒酵母(Saccharomyces cerevisiae),或粟酒裂殖酵母(Schizosaccharomyces pombe)),昆虫细胞系统(例如,衍生自黑腹果蝇(Drosophila melanogaster)的细胞,诸如Schneider 2细胞,衍生自粘虫草地贪夜蛾(Spodoptera frugiperda)的细胞系,诸如Sf9和Sf21细胞,或衍生自卷心菜夜蛾粉纹夜蛾(Trichoplusia ni)的细胞,诸如High Five细胞),用重组病毒表达载体(例如,烟草花叶病毒)感染或用重组质粒表达系统(例如,Ti质粒)转化的植物细胞系统。哺乳动物表达系统包括人和非人哺乳动物细胞,诸如啮齿类动物细胞,灵长类动物细胞,或人细胞。哺乳动物细胞,诸如人或非人哺乳动物细胞,可以包括原代细胞、二代、三代等细胞,或可以包括永生化细胞系,包括克隆细胞系。优选的动物细胞可以容易地在组织培养中维持和转化。人细胞的非限制性实例包括人HeLa(宫颈癌)细胞系。在组织培养实践中常见的其他人细胞系包括尤其是人胚肾293细胞(HEK细胞)、DU145(前列腺癌)、Lncap(前列腺癌)、MCF-7(乳腺癌)、MDA-MB-438(乳腺癌)、PC3(前列腺癌)、T47D(乳腺癌)、THP-1(急性髓细胞样白血病)、U87(胶质母细胞瘤)、SHSY5Y(神经母细胞瘤)或Saos-2细胞(骨癌)。灵长类动物细胞的非限制性实例是Vero(非洲绿猴Chlorocebus肾上皮细胞系)细胞,和COS细胞。啮齿类动物细胞的非限制性实例是大鼠GH3(垂体瘤)、CHO(中国仓鼠卵巢)、PC12(嗜铬细胞瘤)细胞系或小鼠MC3T3(胚胎颅顶)细胞系。
如本文中所制备的任何分子,诸如蛋白、多肽或肽可以适当地进行纯化。关于分子、肽、多肽或蛋白而言,术语“纯化的”不要求绝对纯度。实际上,它表示此类分子、肽、多肽或蛋白处于离散的环境中,其中它们相对于其他组分的丰度(方便地以质量或重量或浓度表示)大于在起始组合物或样品中的丰度,例如,在生产样品中,诸如在产生所述分子、肽、多肽或蛋白的重组宿主细胞的裂解产物或上清液中。离散的环境表示单一介质,诸如例如单一溶液、凝胶、沉淀物、冻干物等。纯化的分子、蛋白、多肽或肽可以通过已知的方法获得,包括,例如,化学合成、色谱法、制备性电泳、离心、沉淀、亲和纯化等。纯化的分子、肽、多肽或蛋白在重量上可以优选组成离散环境非溶剂含量的≥10%,更优选≥50%,诸如≥60%,还更优选≥70%,诸如≥80%,且仍更优选≥90%,诸如≥95%,≥96%,≥97%,≥98%,≥99%或甚至100%。例如,纯化的肽、多肽或蛋白在重量上可以优选组成离散环境蛋白含量的≥10%,更优选≥50%,诸如≥60%,还更优选≥70%,诸如≥80%,且仍更优选≥90%,诸如≥95%,≥96%,≥97%,≥98%,≥99%或甚至100%。蛋白含量可以,例如,通过Lowry法(Lowry等人,1951.J Biol Chem 193:265)确定,任选地如Hartree 1972(Anal Biochem48:422-427)所述。肽、多肽或蛋白的纯度可以通过HPLC确定,或通过在还原或非还原条件下的SDS-PAGE使用考马斯亮蓝或优选地使用银染色测定。
如本文所制备的任何分子,诸如蛋白、多肽或肽可以适当地保持在去离子水的溶液中,或在含有DMSO的去离子水中,例如,去离子水中50%v/v DMSO,或在水性溶液中,或在适当的缓冲液中,诸如在具有生理pH的缓冲液中,或在pH 5-9,更特别地pH 6-8,诸如在中性缓冲盐水、磷酸缓冲盐水、Tris-HCl、乙酸盐或磷酸盐缓冲液中,或在强离液剂诸如6M尿素中,以便于下游使用的分子浓度,诸如不限于约1mM-约500mM,或约1mM-约250mM,或约1mM-约100mM,或约5mM-约50mM,或约5mM-约20mM。备选地,如本文所制备的任何分子,诸如蛋白、多肽或肽可以如本领域中普遍知晓的那样被冻干。储存可以典型地在室温或低于室温(在或低于25℃),在某些实施方案中在高于0℃(非低温储存)的温度,诸如在高于0℃且不超过25℃的温度,或在某些实施方案中,低温保存可以是优选的,在0℃或更低的温度,典型地-5℃或更低,更典型地-10℃或更低,诸如-20℃或更低,-25℃或更低,-30℃或更低,或甚至在-70℃或更低或-80℃或更低,或在液氮中。
重组核酸技术可以不仅允许异源表达和分离具有多肽性质并且由核酸编码的pept-in,而且可以甚至允许将此类pept-in作为转基因施用,即,施用编码各个pept-in并且当引入至细胞中能够实现各个pept-in的表达的核酸(诸如,例如,基于DNA或基于RNA的盒、载体或构建体)。例如,在DNA构建体中,pept-in编码序列可以可操作地连接到被构造成驱动pept-in从所述DNA构建体转录和翻译的调控序列,诸如启动子和转录终止子。在RNA或mRNA构建体中,可以包括pept-in编码序列使得它可以被细胞蛋白质翻译机制翻译。在前述构建体中,pept-in编码序列将典型地前面接框内翻译起始密码子,后面接翻译终止密码子,以促进正确的翻译。因此,无论何时在本说明书中设想如本文所教导的pept-in的施用/引入/利用本文教导的pept-in的疗法,向细胞或生物体中施用/引入编码那些pept-in的核酸都包含在本公开内容中。此类施用/引入/疗法可以通常指基因疗法或基因转化或基因修饰。因此,涉及本申请的分子的所有方法和用途因此还涵盖其中将所述分子作为编码它们的核酸序列提供并且所述分子从所述核酸序列表达的方法和用途。
因此,本文还提供了编码如本文所公开的任何pept-in分子的核酸,其中此类pept-in分子具有多肽性质。特别设想的是所述核酸序列编码具有本文所述的所有特征和变化的分子,加以必要的变化。因此,编码的多肽本质上如本文所述,即,与此方面相容的对pept-in分子所提到的变化也被设想为对由所述核酸序列编码的多肽的变化。
在某些实施方案中,核酸序列是人工基因。因为核酸方面最特别地适合利用转基因表达的应用,特别设想的实施方案可以是其中核酸序列(或人工基因)融合到另一部分的那些,特别是融合到增加基因产物的溶解度和/或稳定性的部分。
在此方面中还提供了重组载体,所述重组载体包含编码如本文所述的分子的此类核酸序列。这些重组载体理想地适于作为携带细胞内感兴趣核酸序列的媒介物,在所述细胞中表达待下调的蛋白,并且在所述细胞中驱动所述核酸的表达。所述重组载体可以在细胞中作为独立的实体持续存在(例如,作为质粒),或可以整合到所述细胞的基因组中。重组载体尤其包括质粒载体、二元载体、克隆载体、表达载体、穿梭载体和病毒载体。因此,本文还涵盖其中所述分子作为具有编码所述分子的核酸序列的重组载体提供并且所述分子从所述重组载体中提供的核酸序列表达的方法和用途。因此,在本文中提供了包含编码如本文所述的分子的核酸序列、或包含含有编码此类pept-in分子的核酸序列的重组载体的细胞。所述细胞可以是原核细胞或真核细胞。在后者的情况下,它可以是酵母、藻类、植物或动物细胞(例如,昆虫、哺乳动物或人细胞)。因此,本文还涵盖其中所述分子作为含有编码所述分子的核酸序列的细胞提供,并且所述分子从所述细胞中提供的核酸序列表达的方法和用途。这可以例如是干细胞疗法中的情况。
此类转基因方式不限于医学应用。根据特定的实施方案,提供核酸编码pept-in分子的核酸而不是直接作为多肽提供可以特别适合在植物中应用。因此,在本文中提供了含有如本文所述的核酸序列、人工基因或重组载体的植物、或植物细胞、或植物种子。在本文中还设想包含此类序列的植物原生质体。
如上面所讨论的,本发明的蛋白以及它们的突变或变异形式可以是任何生物体的,具有任何结构或功能——只要蛋白的APR谱与其突变或变异形式的APR谱相比存在区别即可,这可以被利用用来设计靶向APR的分子以特异性地下调其突变或变异形式。换句话说,本发明可广泛地适用于其中蛋白的突变或变异形式可以是用于下调的感兴趣目标的任何情况。
在某些实施方案中,尤其是在人类中的医学应用中和在动物(诸如在脊椎动物中,诸如优选非人哺乳动物)中的兽医应用中,蛋白的突变或变异形式可以是疾病的病因或与疾病相关。提到由蛋白的突变或变异形式引起或与蛋白的突变或变异形式相关的疾病意在广义地涵盖其中突变或变异在疾病中至少起一部分作用的任何疾病,并且因此其中蛋白的突变或变异形式的下调可以具有治疗益处。例如,突变或变异可以单独地,或与其他因素诸如其他突变联合,是导致所述疾病的病因的原因或促进所述疾病的病因,和/或突变或变异可以单独地,或与其他因素诸如其他突变联合,是导致所述疾病的持续存在、进展、恶化、对其他治疗的耐受或复发的原因或促进所述疾病的持续存在、进展、恶化、对其他治疗的耐受或复发。
在某些优选的实施方案中,所述疾病可以是肿瘤性疾病,尤其是癌症。
术语“肿瘤性疾病”通常是指特征为肿瘤性细胞生长和增殖的任何疾病或病症,无论是良性(不侵袭周围正常组织,不形成转移)、恶变前(癌前)还是恶性(侵袭邻近组织并且能够产生转移)。术语肿瘤性疾病一般包括所有转化细胞和组织以及所有癌性细胞和组织。肿瘤性疾病或病症包括,但不限于,异常细胞生长,良性肿瘤,恶变前或癌前病灶,恶性肿瘤,和癌症。肿瘤性疾病或病症的实例为位于任何组织或器官的良性、恶变前或恶性肿瘤,诸如在前列腺、结肠、腹部、骨、乳腺、消化系统、肝脏、胰腺、腹膜、内分泌腺(肾上腺、甲状旁腺、垂体、睾丸、卵巢、胸腺、甲状腺)、眼、头颈部、神经(中枢和周围)、淋巴系统、骨盆、皮肤、软组织、脾脏、胸或泌尿生殖道。
如本文所用,术语“肿瘤”或“肿瘤组织”是指由过度细胞分裂产生的异常组织块。肿瘤或肿瘤组织包含肿瘤细胞,所述肿瘤细胞是具有异常生长特性并且没有有用的身体机能的肿瘤性细胞。肿瘤、肿瘤组织和肿瘤细胞可以是良性的、恶变前或恶性的,或可以代表没有任何癌性潜力的病灶。肿瘤或肿瘤组织还可以包含肿瘤相关的非肿瘤细胞,例如,形成血管以供应肿瘤或肿瘤组织的血管细胞。非肿瘤细胞可以被肿瘤细胞诱导复制和发育,例如,诱导肿瘤或肿瘤组织中的血管发生。
如本文所用,术语“癌症”是指特征为细胞生长失调或不受调控的恶性肿瘤。术语“癌症”包括原发性恶性细胞或肿瘤(例如,其细胞没有迁移到原始恶性肿瘤或肿瘤的部位以外的受试者身体的部位的那些)和继发性恶性细胞或肿瘤(例如,由转移产生的那些,恶性细胞或肿瘤细胞迁移到不同于原始肿瘤部位的继发部位)。术语“转移的”或“转移”通常是指癌症从一个器官或组织播散到另一个不邻接的器官或组织。肿瘤性疾病在其他不邻接的器官或组织中的出现被称作转移。
癌症的实例包括但不限于癌、淋巴瘤、胚细胞瘤、肉瘤和白血病或淋巴系统恶性肿瘤。此类癌症的更具体实例包括不限于:鳞状细胞癌(例如,上皮鳞状细胞癌),肺癌,包括小细胞肺癌、非小细胞肺癌、肺腺癌、肺的鳞癌和肺的大细胞癌,腹膜的癌症,肝细胞癌,胃癌,包括胃肠癌,胰腺癌,胶质瘤,胶质母细胞瘤,宫颈癌,卵巢癌,肝癌,膀胱癌,肝细胞瘤,乳腺癌,结肠癌,直肠癌,结直肠癌,子宫内膜癌或子宫癌,唾液腺癌,肾癌,前列腺癌,外阴癌,甲状腺癌,肝癌,肛门癌,阴茎癌,以及CNS癌,黑色素瘤,头颈部癌症,骨癌,骨髓癌,十二指肠癌,食管癌,甲状腺癌或血液系统癌症。
癌症或恶性肿瘤的其他非限制性实例包括,但不限于:急性儿童成淋巴细胞性白血病,急性成淋巴细胞性白血病,急性淋巴细胞性白血病,急性髓细胞样白血病,肾上腺皮质癌,成人(原发性)肝细胞癌,成人(原发性)肝癌,成人急性淋巴细胞性白血病,成人急性髓细胞样白血病,成人霍奇金病,成人霍奇金淋巴瘤,成人淋巴细胞性白血病,成人非霍奇金淋巴瘤,成人原发性肝癌,成人软组织肉瘤,AIDS-相关淋巴瘤,AIDS-相关恶性肿瘤,肛门癌,星形细胞瘤,胆管癌,膀胱癌,骨癌,脑干胶质瘤,脑肿瘤,乳腺癌,肾盂和尿道的癌症,中枢神经系统(原发性)淋巴瘤,中枢神经系统淋巴瘤,小脑星形细胞瘤,大脑星形细胞瘤,宫颈癌,儿童(原发性)肝细胞癌,儿童(原发性)肝癌,儿童急性成淋巴细胞性白血病,儿童急性髓细胞性白血病,儿童脑干胶质瘤,胶质母细胞瘤,儿童小脑星形细胞瘤,儿童大脑星形细胞瘤,儿童颅外生殖细胞肿瘤,儿童霍奇金病,儿童霍奇金淋巴瘤,儿童下丘脑和视通路神经胶质瘤,儿童成淋巴细胞性白血病,儿童成神经管细胞瘤,儿童非霍奇金淋巴瘤,儿童松果体和幕上原始神经外胚层肿瘤,儿童原发性肝癌,儿童横纹肌肉瘤,儿童软组织肉瘤,儿童视通路和下丘脑神经胶质瘤,慢性淋巴细胞白血病,慢性髓细胞性白血病,结肠癌,皮肤T细胞淋巴瘤,内分泌胰岛细胞癌,子宫内膜癌,室管膜瘤,上皮癌,食管癌,尤文氏肉瘤和相关肿瘤,外分泌胰腺癌,颅外生殖细胞瘤,性腺外生殖细胞肿瘤,肝外胆管癌,眼癌,女性乳腺癌,胆囊癌,胃癌,胃肠类癌肿瘤,胃肠间质瘤,生殖细胞瘤,妊娠滋养层瘤,毛细胞白血病,头颈癌,肝细胞癌,霍奇金病,霍奇金淋巴瘤,高丙种球蛋白血症,下咽癌,肠癌,眼内黑素瘤,胰岛细胞癌,胰岛细胞胰腺癌,卡波西肉瘤,肾癌,喉癌,唇和口腔癌,肝癌,肺癌,淋巴组织增生性疾病,巨球蛋白血症,男性乳腺癌,恶性间皮瘤,恶性胸腺瘤,成神经管细胞瘤,黑素瘤,间皮瘤,转移性隐匿性原发性颈部鳞癌,转移性原发性颈部鳞癌,转移性颈部鳞癌,多发性骨髓瘤,多发性骨髓瘤/浆细胞瘤,骨髓异常增生综合征,髓细胞性白血病,髓性白血病,骨髓增生病,鼻腔和鼻旁窦癌,鼻咽癌,神经母细胞瘤,妊娠期非霍奇金淋巴瘤,非黑素瘤皮肤癌,非小细胞肺癌,隐匿性原发性转移性颈部鳞癌,口咽癌,骨-/恶性纤维肉瘤,骨肉瘤/骨的恶性纤维组织细胞瘤,卵巢上皮癌,卵巢生殖细胞肿瘤,卵巢低度恶性潜能肿瘤,胰腺癌,副蛋白血症,紫癜,甲状旁腺癌,阴茎癌,嗜铬细胞瘤,垂体瘤,浆细胞瘤/多发性骨髓瘤,原发性中枢神经系统淋巴瘤,原发性肝癌,前列腺癌,直肠癌,肾细胞癌,肾盂和尿道癌,视网膜母细胞瘤,横纹肌肉瘤,唾液腺癌,结节病肉瘤,塞扎里综合征(Sezary Syndrome),皮肤癌,小细胞肺癌,小肠癌,软组织肉瘤,颈部鳞癌,胃癌,幕上原始神经外胚层和松果体肿瘤,T细胞淋巴瘤,睾丸癌,胸腺瘤,甲状腺癌,肾盂和尿道移行细胞癌,移行性肾盂和尿道癌,滋养细胞肿瘤,尿道和肾盂细胞癌,尿道癌,子宫癌,子宫肉瘤,阴道癌,视通路和下丘脑神经胶质瘤,外阴癌,Waldenstrom巨球蛋白血症和肾母细胞瘤。
在某些实施方案中,所述蛋白可以是原癌基因,且所述蛋白的突变或变异形式可以是癌基因,其导致或促进细胞的肿瘤性转化。这还涵盖其中所述蛋白是肿瘤抑制基因,并且所述蛋白的突变或变异形式促进细胞的肿瘤性转化,特别是通过功能获得或显性负性机制的情形。所述突变或变异可以是生殖系的或体细胞的。此类原癌基因或肿瘤抑制基因,以及其中的致瘤突变,是众所周知的,并且全面地注释在上面所提到的数据库中。已知的原癌基因的实例包括不限于HER-2/neu、EGFR、VEGF、PDGFR、BCR/ABL、C-KIT、KRAS、HRAS、NRAS、细胞周期蛋白D1、细胞周期蛋白E、MYC、β-连环蛋白、B-RAF、MITF、GNAS、MP2K2、IDHP、ITK、ERBB2等,它们可以是被通过所述突变产生的如整个本说明书中所解释的改变的APR可靶向的。已知的原癌基因的实例包括不限于p53、CDKN2A/CDKN2B、PTEN、pRb、BCL2、INK4a、NM23、SWI/SNF、pVHL、PARP、CIP2A、APC、CD95、ST5、YPEL3、ST7、ST14、p16、BRCA1/BRCA2和APC。在某些情况下,在肿瘤抑制基因中发生的突变可以增加APR的聚集倾向性,这驱动了癌细胞中的突变肿瘤抑制蛋白的聚集,并且因此下调所述突变肿瘤抑制蛋白(以及如果野生型肿瘤抑制蛋白也被隔离到此类聚集物中,则潜在地发生显性负性效应)。本发明的分子的目标是诱导靶突变或变异蛋白的聚集,因此可能一般不适用于此类情况,因为正常情况下不期望诱导已经聚集的突变肿瘤抑制蛋白的进一步聚集会对疾病具有有益效应。
在此,如本文所教导的分子可用于疗法。因此,一个方面提供了用于医药用途的如本文所教导的任何分子,或换句话说,用于疗法用途的如本文所教导的任何分子。如下面所讨论的那样,如本文所教导的分子可以配制成药物组合物。因此,任何提到所述分子在疗法中的用途(或此类表述的任何变化形式)也归入包含所述分子的药物组合物在疗法中的用途。
特别地,所述分子意在用于其中蛋白的突变或变异形式具有重要地位的疾病的治疗。因此,还提供了如本文所教导的任何分子在治疗由蛋白的突变或变异形式引起或与蛋白的突变或变异形式相关的疾病的方法中的用途。进一步提供了治疗有需要的受试者的方法,尤其是患有由蛋白的突变或变异形式引起或与蛋白的突变或变异形式相关的疾病的受试者,所述方法包括向所述受试者施用治疗有效量的如本文所教导的各种分子。进一步提供了如本文所教导的各种分子在制备用于治疗由蛋白的突变或变异形式引起或与蛋白的突变或变异形式相关的疾病的药物中的用途。进一步提供了如本文所教导的各种分子用于治疗由蛋白的突变或变异形式引起或与蛋白的突变或变异形式相关的疾病的用途。
提到“疗法”或“治疗”广义地涵盖治愈性和预防性治疗两者,并且该术语可以特别地指缓解或可测量到的减轻病理状况(诸如疾病或病症)的一个或多个症状或可测量的标志物。该术语涵盖基础治疗以及新辅助治疗、辅助治疗和辅助疗法。可测量到的减轻包括可测量的标志物或症状的任何统计学显著的下降。通常,该术语涵盖治愈性治疗和针对减轻疾病的症状和/或减慢疾病的进展的治疗两者。该术语涵盖对已经发生的病理状况的治疗性治疗,以及预防性或预防措施两者,其中目的是预防或减少发生病理状况的可能性。在某些实施方案中,该术语可以涉及治疗性治疗。在某些其他实施方案中,该术语可以涉及预防性治疗。在缓解期期间对慢性病理状况的治疗还可以被视作构成治疗性治疗。该术语可以涵盖离体或体内治疗,视本发明上下文的情况来定。
在整个本说明书中,术语“受试者”、“个体”或“患者”可互换使用,并且典型地和优选地表示人,但也可以涵盖非人动物,优选温血动物,甚至更优选非人哺乳动物。特别优选的是人受试者,包括两个性别和其所有年龄段。在其他实施方案中,所述受试者是作为疾病模型的实验动物或动物替代物。该术语不表示特定的年龄或性别。因此,成人和新生儿受试者,以及胎儿,无论是男性还是女性,都意在被覆盖。术语受试者进一步旨在包括转基因非人物种。
如在本文中使用的术语“需要治疗的受试者”或类似术语是指被诊断患有或患有如本文所述的疾病的受试者和/或要预防所述疾病的受试者。
术语“治疗有效量”通常表示以单个或多个剂量足以在受试者中引起药理学效应或医学反应的量,所述药理学效应或医学反应是执业医生诸如医师、临床医生、外科医生、兽医或研究人员所寻求的,可以包括尤其是减轻被治疗的疾病的症状。本发明的分子的适宜的治疗有效剂量可以由有资格的医生关于疾病的性质和严重性、以及患者的年龄和状况来确定。待施用的本文所述的分子的有效量可以取决于许多不同的因素,并且可以由本领域普通技术人员通过常规实验来确定。可以考虑的几个非限制性的因素包括活性成分的生物活性、活性成分的性质、待治疗的受试者的特征等。术语“施用”通常意指分配或应用,以及典型地包括向组织体内施用和离体施用,优选体内施用。通常,组合物可以全身或局部施用。
如前所述,突变或变异蛋白可以是肿瘤性疾病的病因或与肿瘤性疾病相关,例如,癌基因或突变的肿瘤抑制基因。因此,还提供了如本文所教导的各种分子在治疗由蛋白的突变或变异形式引起或与蛋白的突变或变异形式相关的肿瘤性疾病、特别是癌症的方法中的用途。进一步提供了治疗有需要的受试者的方法,特别是患有由蛋白的突变或变异形式引起或与蛋白的突变或变异形式相关的肿瘤性疾病、特别是癌症的受试者,所述方法包括向所述受试者施用治疗有效量的如本文所教导的任何分子。进一步提供了如本文所教导的任何分子在制备用于治疗由蛋白的突变或变异形式引起或与蛋白的突变或变异形式相关的肿瘤性疾病、特别是癌症的药物中的用途。进一步提供了如本文所教导的任何分子用于治疗由蛋白的突变或变异形式引起或与蛋白的突变或变异形式相关的肿瘤性疾病、特别是癌症的用途。
在某些实施方案中,如本文所教导的任何分子可以作为单一药剂(活性药物成分)施用或与一种或多种其他药剂组合施用,所述组合不会导致不可接受的不良反应。借助于实例,如本文所教导的两种或更多种分子可以共同施用。借助于另一实例,如本文所教导的一种或多种分子可以与不是本文所设想的分子的药剂共同施用。例如,在如本文所教导的分子具有抗癌特性的情形中,所述分子可以与已知的一种或多种抗癌疗法组合,诸如例如手术、放疗、化疗、生物疗法或其组合。术语“化疗”如本文所用被看做是广义的,并且一般涵盖使用化学物质或组合物的治疗。化疗剂可以典型地显示细胞毒或细胞生长抑制效应。在某些实施方案中,化疗剂可以是烷化剂、细胞毒性化合物、抗代谢物、植物碱、萜类物质、拓扑异构酶抑制剂或其组合。术语“生物疗法”如本文所用被看做是广义的并且一般涵盖使用生物物质或组合物的治疗,诸如生物分子,或生物作用剂,诸如病毒或细胞。在某些实施方案中,生物分子可以是肽、多肽、蛋白、核酸或小分子(诸如初级代谢产物、次级代谢产物或天然产物),或其组合。合适的生物分子的实例包括不限于:白介素,细胞因子,抗细胞因子,肿瘤坏死因子(TNF),细胞因子受体,疫苗,干扰素,酶,治疗性抗体,抗体片段,抗体样蛋白支架,或其组合。合适的生物分子的实例包括但不限于:阿地白介素,阿仑单抗,阿特珠单抗,贝伐单抗,博纳吐单抗,本妥昔单抗瑞他汀,卡托索单抗,西妥昔单抗,达雷木单抗,地尼白介素(denileukin diftitox),地诺单抗,地努妥昔单抗,埃罗妥珠单抗,吉姆单抗奥佐米星,90Y-替伊莫单抗替克西坦,艾达赛珠单抗,干扰素A,伊匹木单抗,耐昔妥珠单抗,纳武单抗,奥比妥昔单抗,奥法木单抗,奥拉单抗,帕尼单抗,帕博利珠单抗,雷莫芦单抗,利妥昔单抗,他索纳明,131I-托西莫单抗,曲妥珠单抗,Ado-曲妥珠单抗恩美(Ado-trastuzumabemtansine),及其组合。合适的溶瘤病毒的实例包括但不限于talimogene laherparepvec。抗癌疗法的更多类别包括尤其激素疗法(内分泌疗法)、免疫疗法和干细胞疗法,它们通常被认为归入生物学疗法内。合适的激素疗法的实例包括但不限于:他莫昔芬;芳香酶抑制剂,诸如阿那曲唑,依西美坦,来曲唑,及其组合;黄体生成素阻断剂,诸如戈舍瑞林,亮丙瑞林,曲普瑞林,及其组合;抗雄激素,诸如比卡鲁胺,醋酸环丙孕酮,氟他胺,及其组合;促性腺集素释放激素阻断剂,诸如地加瑞克;孕酮治疗,诸如醋酸甲羟孕酮,甲地孕酮,及其组合;及其组合。术语“免疫疗法”广义地涵盖调节受试者的免疫系统的任何治疗。具体地,该术语包括调节免疫应答的任何治疗,所述免疫应答诸如体液免疫应答、细胞介导的免疫应答、或两者。免疫疗法包括基于细胞的免疫疗法,其中免疫细胞,诸如T细胞和/或树突状细胞,被传输到患者中。该术语还包括施用调节受试者的免疫系统的物质或组合物,诸如化学化合物和/或生物分子(例如,抗体、抗原、白介素、细胞因子或其组合)。癌症免疫疗法的实例包括不限于采用单克隆抗体的治疗,例如,针对肿瘤细胞表达的蛋白的Fc-工程化单克隆抗体,免疫检查点抑制剂,预防性或治疗性癌症疫苗,过继细胞疗法,及其组合。用于抑制的免疫检查点靶标的实例包括不限于:PD-1(PD-1抑制剂的实例包括不限于帕博丽珠单抗、纳武单抗及其组合),CTLA-4(CTLA-4抑制剂的实例包括不限于伊匹木单抗、替西木单抗及其组合),PD-L1(PD-L1抑制剂的实例包括不限于阿特珠单抗),LAG3,B7-H3(CD276),B7-H4,TIM-3,BTLA,A2aR,杀伤细胞免疫球蛋白样受体(KIR),IDO,及其组合。治疗性抗癌免疫接种的另一方式包括树突状细胞疫苗。该术语广义地涵盖包含树突状细胞的疫苗,所述树突状细胞负载以期望被针对发生免疫反应的抗原。过继细胞疗法(ACT)可以指将细胞,最普遍的是免疫衍生细胞,诸如特别是细胞毒性T细胞(CTL),传输回同一患者或传输到新的受者宿主,目标是将免疫功能和特性转移到新的宿主中。如果可能,自体细胞的使用有助于受者使组织排斥和移植物抗宿主病问题最小化。例如可以采用多种策略通过改变T细胞受体(TCR)的特异性来基因修饰T细胞,例如通过引入新的具有经选择的肽特异性的TCRα和β链。备选地,嵌合抗原受体(CAR)可以用来利用大量的已经记载的受体嵌合构建体生成免疫响应细胞,诸如T细胞,对所选择的靶标(诸如恶性细胞)特异。CAR构建体的实例包括不限于:1)由对抗原特异的抗体的单链可变片段组成的CAR,例如包含与特异性抗体的VH连接的VL,通过柔性接头(例如通过CD8α铰链结构域和CD8α跨膜结构域)连接到CD3ζ或FcRγ的跨膜和细胞内信号传导结构域;和2)进一步在胞内结构域内掺入一个或多个共刺激分子(诸如CD28、OX40(CD134)或4-1BB(CD137))的细胞内结构域,或甚至包括此类共刺激胞内结构域的组合的CAR。在癌症中干细胞疗法通常的目标是替换被放疗和/或化疗破坏的骨髓干细胞,并且包括不限于自体、同基因或同种异体干细胞移植。干细胞,特别是造血干细胞,典型地获自骨髓、外周血或脐带血。抗癌作用剂的施用途径、剂量和治疗方案的细节在本领域中是已知的,例如,如“Cancer Clinical Pharmacology”(2005)Jan H.M.Schellens,HowardL.McLeod和David R.Newell编辑,Oxford University Press中所述。在某些实施方案中,设想使用如本文所教导的任何分子与MEK抑制剂(例如,司美替尼或曲美替尼)、SHP2抑制剂(例如,TNO155)、mTOR抑制剂(例如,雷帕霉素或雷帕霉素衍生物(“rapalog”),包括西罗莫司、替西罗莫司(CCI-779)、替西罗莫司(CCI-779)、依维莫司(RAD001)和ridaforolimus(AP-23573))中的一种或多种的组合疗法。任何组合疗法的活性组分可以混合或物理分开,并且可以同时或以任何次序相继地施用。
如本文所教导的任何分子可以以任何合适的或可操作的形式或格式施用给受试者。
例如,提到如本文所意指的分子可以涵盖给定的治疗上有用的化合物以及该化合物的任何药学上可接受的形式,诸如该化合物的任何加成盐、水合物或溶剂化物。术语“药学上可接受的”当在本文中尤其结合盐类、水合物、溶剂化物和赋形剂使用时,与本领域一致,意指与药物组合物的其他成分相容并且对其受者无害。药学上可接受的酸加成盐和碱加成盐意指包含所述化合物能够形成的治疗上有活性的无毒性的酸加成盐和碱加成盐形式。药学上可接受的酸加成盐可以方便地通过用合适的酸处理化合物的碱形式来获得。合适的酸包括,例如,无机酸,诸如氢卤酸,例如,盐酸或氢溴酸,硫酸,硝酸,磷酸和类似酸;或有机酸,诸如,例如,乙酸,丙酸,羟基乙酸,乳酸,丙酮酸,丙二酸,琥珀酸(即,丁二酸),马来酸,富马酸,苹果酸,酒石酸,柠檬酸,甲磺酸,乙磺酸,苯磺酸,对甲苯磺酸,环拉酸,水杨酸,对氨基水杨酸,扑酸和类似的酸。相反地,所述盐形式可以通过用合适的碱处理而转变成游离碱形式。含有酸性质子的化合物还可以通过用适宜的有机碱和无机碱处理而转变成它的无毒金属或胺加成盐形式。适宜的碱盐形式包括,例如,铵盐,碱和碱土金属盐,例如,锂,钠,钾,镁,钙盐等,铝盐,锌盐,与有机碱的盐,例如,脂肪族和芳香族伯胺、仲胺和叔胺,诸如甲胺,乙胺,丙胺,异丙胺,四个丁胺异构体,二甲胺,二乙胺,二乙醇胺,二丙胺,二异丙胺,二正丁胺,吡咯烷,哌啶,吗啉,三甲胺,三乙胺,三丙胺,奎宁环,吡啶,喹啉和异喹啉;苄星青霉素(benzathine),N-甲基-D-葡糖胺,海巴明青霉素盐,以及与氨基酸的盐,诸如,例如,与精氨酸、赖氨酸等的盐。相反地,所述盐形式可以用酸处理而转变成游离酸形式。术语溶剂化物包括该化合物能够形成的水合物和溶剂加成形式,以及其盐。此类形式的实例为,例如,水合物、乙醇化物等。
例如,所述分子可以是组合物的一部分。术语“组合物”通常是指由两个或更多个组分组成的物体,并且更具体地,特别地表示两种或更多种材料(诸如元素、分子、物质、生物分子或微生物材料)的混合物或掺和物,以及由所述组合物的材料形成的反应产物和分解产物。借助于实例,组合物可以包含如本文所教导的任何分子与一种或多种其他物质的组合。例如,组合物可以通过将如本文所教导的分子与所述一种或多种其他物质组合,诸如混合来获得。在某些实施方案中,本发明的组合物可以被构造成药物组合物。药物组合物典型地包含一种或多种药理学活性成分(具有一种或多种药理学效应的化学和/或生物活性材料)和一种或多种药学上可接受的承载体。如本文所典型地使用的组合物可以是液体、半固体或固体,并且可以包括溶液或分散液。
在此,进一步的方面提供了包含如本文所教导的任何分子的药物组合物。术语“药物组合物”和“药物制剂”可以互换使用。如本文所教导的药物组合物除了一种或多种活性物质以外可以还包含一种或多种药学上或可接受的承载体。合适的药物赋形剂取决于剂型和活性成分的性质,并且可以由技术人员选择(例如,参考Handbook of PharmaceuticalExcipients第7版2012,Rowe等人编辑)。
如本文所用,术语“承载体”或“赋形剂”可互换使用,并且广义地包括任何和所有溶剂、稀释剂、缓冲液(诸如,例如,中性缓冲盐水、磷酸缓冲盐水、或任选地,Tris-HCl、乙酸盐或磷酸盐缓冲液)、增溶剂(诸如,例如,
Figure BDA0003893144820000731
80,聚山梨酯80)、胶体、分散介质、媒介物、填料、螯合剂(诸如,例如,EDTA或谷胱甘肽)、氨基酸(诸如,例如,甘氨酸)、蛋白、崩解剂、粘合剂、润滑剂、湿润剂、乳化剂、增甜剂、着色剂、风味剂、芳香剂、增稠剂、用于实现储库效应的作用剂、包衣、抗真菌剂、防腐剂(诸如,例如,硫柳汞TM、苄醇)、抗氧化剂(诸如,例如,抗坏血酸、焦亚硫酸钠)、渗透压控制剂、吸收延缓剂、辅料、湿胀剂(诸如,例如,乳糖、甘露醇)等。此类用于配制药物和化妆组合物的介质和作用剂的使用在本领域中是众所周知的。可接受的稀释剂、承载体和赋形剂通常不会负面地影响受者的内稳态(例如,电解质平衡)。用于药物活性物质的此类介质和作用剂的使用在本领域中是众所周知的。此类材料应当是无毒性的并且应当不干扰活性物质的活性。可接受的承载体包括生物相容的、惰性的或生物可吸收的盐、缓冲剂、寡糖或多糖、聚合物、改善粘性的作用剂、防腐剂等。一个示例性的承载体是生理盐水(0.15M NaCl,pH 7.0至7.4)。另一个示例性的承载体是50mM磷酸钠,100mM氯化钠。
承载体或其他材料的准确性质将取决于施用途径。例如,药物组合物可以为肠胃外可接受的水溶液的形式,其是无热原的并且具有合适的pH、等渗性和稳定性。
药物制剂可以根据需要包含药学上可接受的辅助物质以接近生理条件,诸如pH调节和缓冲剂、防腐剂、络合剂、渗透压调节剂、湿润剂等,例如,乙酸钠、乳酸钠、磷酸钠、氢氧化钠、盐酸、苄醇、对羟基苯甲酸酯、EDTA、油酸钠、氯化钠、氯化钾、氯化钙、山梨醇酐单月桂酸酯、油酸三乙醇胺等。优选地,药物制剂的pH值在生理学pH范围内,诸如特别地制剂的pH为约5-约9.5,更优选约6-约8.5,甚至更优选约7-约7.5。
用于配制药物组合物的说明性的非限制性的承载体包括,例如,水包油或油包水乳液,加入或不加入适合于静脉内(IV)使用的有机共溶剂的水性组合物,脂质体或含有表面活性剂的囊泡,微球,微珠和微粒体,粉剂,片剂,胶囊剂,栓剂,水性混悬液,气溶胶和对于本领域普通技术人员来说显而易见的其他承载体。脂质体是人工膜囊泡,其可用作体外和体内递送媒介物。这些制剂可以具有净阳离子、阴离子或中性电荷特性,并且是体外、体内和离体递送方法所利用的有用特性。已经显示单层大泡(LUV)的尺寸范围为0.2-4.0PHI.m,其可以包封很大百分比的含有大分子的水性缓冲液。脂质体的组合物通常是磷脂,特别是高相变温度磷脂,通常结合类固醇(特别是胆固醇)的组合。其他磷脂或其他脂质也可以使用。脂质体的物理特性取决于pH、离子强度和二价阳离子的存在。
如本文意指的药物组合物可以配制用于基本上任何施用途径,诸如非限制地,经口施用(诸如,例如,经口摄取或吸入),鼻内施用(诸如,例如,鼻内吸入或鼻内粘膜涂抹),肠胃外施用(诸如,例如,皮下、静脉内(I.V.)、肌内、腹膜内或胸骨内注射或输注),透皮或透粘膜(诸如,例如,经口、舌下、鼻内)施用,局部施用,直肠,阴道或气管内滴入等。以此方式,通过所述方法和组合物可获得的治疗效应可以是,例如,全身性的、局部的、组织特异性的等,这取决于给定应用的具体需求。
例如,对于经口施用,药物组合物可以被配制成丸剂、片剂、漆涂片剂(lacqueredtablet)、包衣(例如,糖包衣)剂、颗粒剂、硬和软明胶胶囊剂、水溶液剂、醇或油溶液剂、糖浆剂、乳剂或混悬剂。在实例中,非限制性的,口服剂型的制备可以适当地通过将合适量的如本文所公开的作用剂以粉末的形式均匀地和紧密地掺混在一起,任选地还包括细碎的一种或多种固相承载体,并且将掺混物配制成丸剂、片剂或胶囊剂。示例性的但非限制性的固相承载体包括磷酸钙、硬脂酸镁、滑石、糖类(诸如,例如,葡萄糖、甘露糖、乳糖或蔗糖)、糖醇(诸如,例如,甘露醇)、糊精、淀粉、明胶、纤维素、聚乙烯吡咯烷酮、低熔点蜡和离子交换树脂。包含药物组合物的压制片剂可以通过将如本文所公开的作用剂与诸如上面所述的固相承载体均匀地和紧密地混合在一起来制备,以提供具有需要的压缩特性的混合物,然后在合适的机器中将混合物压实成所期望的形状和大小。模制片剂可以通过在合适的机器中将用惰性液体稀释剂湿润的粉末状化合物的混合物模压来制备。用于软明胶胶囊剂和栓剂的合适承载体为,例如,脂肪、蜡、半固体和液体多元醇、天然或硬化油等。
例如,对于经口或经鼻气雾剂或吸入施用,药物组合物可以利用说明性的承载体配制,诸如,例如,在含有盐水、聚乙二醇或乙二醇、DPPC、甲基纤维素的溶液中,或在与粉状分散剂的混合物中配制,进一步采用苄醇或其他合适的防腐剂、吸收促进剂来增强生物利用度、氟碳化合物、和/或本领域中已知的其他增溶剂或分散剂。用于以气雾剂或喷雾剂的形式施用的合适的药物制剂为,例如,如本文所教导的作用剂或它们的生理上可耐受的盐类在药学上可接受的溶剂中的溶液剂、混悬剂或乳剂,所述溶剂诸如乙醇或水,或此类溶剂的混合物。如果需要,所述制剂还可以另外地包含其他药物辅料,诸如表面活性剂、乳化剂和稳定剂以及推进剂。举例说明,递送可以利用一次性递送装置、雾化器、呼吸致动的粉末吸入器、雾化剂定量吸入器(MDI)或本领域中可获得的任何其他的大量雾化器递送装置。另外,还可以使用雾化帐篷或通过气管内导管的直接施用。
用于通过粘膜表面施用的承载体的实例取决于特定的途径,例如,经口、舌下、鼻内等。当经口施用时,说明性的实例包括药物级的甘露醇、淀粉、乳糖、硬脂酸镁、糖精钠、纤维素、碳酸镁等,优选甘露醇。当经鼻内施用时,说明性的实例包括聚乙二醇、磷脂、乙二醇和糖脂、蔗糖和/或甲基纤维素、含有或不含湿胀剂诸如乳糖的粉末混悬液和防腐剂(诸如苯扎氯铵)、EDTA。在特别说明性的实施方案中,磷脂1,2二棕榈酰基-sn-甘油-3-磷酸胆碱(DPPC)以约0.01-0.2%用作用于鼻内施用约0.1-3.0mg/ml浓度的本发明的化合物的等渗水性承载体。
例如,对于肠胃外施用,药物组合物可以有利地用合适的溶剂、稀释剂、增溶剂或乳化剂等配制成溶液、混悬液或乳液。合适的溶剂为,非限制性地,水,生理盐水溶液,PBS,林格氏溶液,右旋糖溶液,或Hank溶液或醇类,例如,乙醇,丙醇,甘油,另外还有糖溶液诸如葡萄糖,转化糖,蔗糖或甘露醇溶液,或备选地提到的各种溶剂的混合物。可注射溶液或混悬液可以根据已知的现有技术配制,使用合适的无毒性、肠胃外可接受的稀释剂或溶剂,诸如甘露醇,1,3-丁二醇,水,林格氏溶液或等渗氯化钠溶液,或合适的分散剂或湿润剂和混悬剂,诸如无菌的温和的不挥发油,包括合成的甘油一酯或甘油二酯,和脂肪酸,包括油酸。本发明的作用剂及其药学上可接受的盐还可以被冻干并且使用获得的冻干物,例如,用于生产注射或输注制剂。例如,用于静脉内使用的承载体的一个说明性实例包括10%USP乙醇,40%USP丙二醇或聚乙二醇600和余量的USP注射用水(WFI)的混合物。用于静脉内使用的其他说明性承载体包括10%USP乙醇和USP WFI;在USP WFI中的0.01-0.1%三乙醇胺;或在USP WFI中的0.01-0.2%二棕榈酰二磷脂酰胆碱;和1-10%鲨烯或肠胃外水包植物油乳液。用于皮下或肌内使用的承载体的说明性实例包括磷酸盐缓冲盐水(PBS)溶液,在WFI中的5%右旋糖以及0.01-0.1%三乙醇胺(在USP WFI中的5%右旋糖中或0.9%氯化钠中),或10%USP乙醇、40%丙二醇和余量为可接受的等渗溶液诸如5%右旋糖或0.9%氯化钠的1-2或1-4种混合物;或在USP WFI中的0.01-0.2%二棕榈酰二磷脂酰胆碱以及1-10%鲨烯或肠胃外水包植物油乳液。
在优选水性制剂的情况下,可以包含一种或多种表面活性剂。例如,所述组合物可以为包含至少一种合适的表面活性剂(例如,磷脂表面活性剂)的胶束分散剂的形式。磷脂的说明性实例包括二酰基磷脂酰甘油,诸如二肉豆蔻酰磷脂酰甘油(DPMG),二棕榈酰磷脂酰甘油(DPPG),和二硬脂酰磷脂酰甘油(DSPG),二酰基磷脂酰胆碱,诸如二肉豆蔻酰磷脂酰胆碱(DPMC),二棕榈酰磷脂酰胆碱(DPPC),和二硬脂酰磷脂酰胆碱(DSPC);二酰基磷脂酸,诸如二肉豆蔻酰磷脂酸(DPMA),二棕榈酰磷脂酸(DPPA),和二硬脂酰磷脂酸(DSPA);和二酰基磷脂酰乙醇胺诸如二肉豆蔻酰磷脂酰乙醇胺(DPME),二棕榈酰磷脂酰乙醇胺(DPPE)和二硬脂酰磷脂酰乙醇胺(DSPE)。典型地,在水性制剂中表面活性剂:活性物质摩尔比为约10:1-约1:10,更典型地约5:1-约1:5,然而,在水性制剂中任何有效量的表面活性剂可以用在最佳地配合感兴趣的具体目的的水性制剂中。
当以栓剂的形式经直肠施用时,这些制剂可以通过将根据本发明的化合物与合适的无刺激性赋形剂混合来制备,所述赋形剂诸如可可油、合成的甘油酯或聚乙二醇,它们在常温下为固体,但在直肠腔内液化和/或溶解以释放药物。
用于微胶囊、植入物或棒的合适承载体为,例如,乙醇酸和乳酸的共聚物。
本领域技术人员将认识到上面的描述是说明性的而非详尽的。实际上,许多其他的配制技术和药学上可接受的赋形剂和承载体溶液是本领域技术人员众所周知的,开发用于在各种各样的治疗方案中使用本文所述的特定组合物的合适的用药和治疗方案也是一样。
如本文所教导的分子的剂量或量,任选地与待施用的一种或多种其他活性化合物组合,取决于个例,并且按照惯例要适应于个体环境而改动以实现最佳效应。因此,单位剂量和方案取决于待治疗的病症的性质和严重性,以及诸如下列的因素:受试者的物种,待治疗的人或动物的性别、年龄、体重、一般健康、饮食、施用模式和时间、免疫状态和个体反应性,使用的化合物的功效、代谢稳定性和持续时间,疗法是否是快速的或长期的或预防性的,或除了本发明的作用剂以外是否施用其他活性化合物。为了优化疗效,如本文所教导的分子可以以不同的用药方案首先施用。典型地,所述分子在组织中的水平可以使用适宜的筛选测定监测作为临床测试程序的一部分,例如,以确定给定治疗方案的效力。给药频次在从业医务人员(例如,医生、兽医或护士)的技能和临床判断范围内。典型地,给药方案通过临床实验建立,所述临床实验可以建立最佳的给药参数。然而,从业医生可以根据上述因素中的一个或多个因素改变此类给药方案,例如,受试者的年龄、健康、体重、性别和医疗状态。给药频次可以根据所述治疗是预防性还是治疗性来变化。
如本文所述的分子或包含所述分子的药物组合物的毒性和疗效可以通过已知的药物程序在例如细胞培养或实验动物中确定。可以使用这些程序,例如,用于确定LD50(达到群体50%死亡的剂量)和ED50(达到群体50%治疗有效的剂量)。毒性效应和治疗效应之间的剂量比是治疗指数,其可以表述为比率LD50/ED50。表现出高治疗指数的药物组合物是优选的。在可以使用表现出毒性副作用的药物组合物的情况下,应当小心设计将此类化合物靶向到受累组织部位的递送系统以便使对正常细胞(例如,非靶细胞)的潜在损害最小化,由此减小副作用。
从细胞培养测定和动物研究获得的数据可以用于配制一定范围的剂量用于适宜的受试者。此类药物组合物的剂量通常在一定的循环浓度范围内,该范围包括具有很小或没有毒性的ED50。所述剂量可以在此范围内变化,取决于所采用的剂型和利用的施用途径。对于如本文所述使用的药物组合物,治疗有效剂量可以初步地从细胞培养测定估计。可以在动物模型中配制剂量以达到如在细胞培养中确定的包括IC50(即,达到对症状的半最大抑制的药物组合物浓度)的循环血浆浓度范围。此类信息可以用来更准确地确定在人中的有用剂量。可以测量血浆中的水平,例如,通过高效液相色谱法。
不受限制地,取决于疾病的类型和严重性,如本文所教导的分子的典型剂量(例如,典型的日剂量或典型的间歇性剂量,例如,每两天、每三天、每四天、每五天、每六天、每周、每1.5周、每两周、每三周、每月或其他的典型剂量)范围可以为每剂约10μg/kg-约100mg/kg受试者的体重,取决于上面提到的因素,例如,范围可以为每剂约100μg/kg-约100mg/kg受试者的体重,或每剂约200μg/kg-约75mg/kg受试者的体重,或每剂约500μg/kg-约50mg/kg受试者的体重,或每剂约1mg/kg-约25mg/kg受试者的体重,或每剂约1mg/kg-约10mg/kg受试者的体重,例如,可以为每剂约100μg/kg、约200μg/kg、约300μg/kg、约400μg/kg、约500μg/kg、约600μg/kg、约700μg/kg、约800μg/kg、约900μg/kg、约1.0mg/kg、约2.0mg/kg、约5.0mg/kg、约10mg/kg、约15mg/kg、约20mg/kg、约30mg/kg、约40mg/kg、约50mg/kg、约75mg/kg或约100mg/kg受试者的体重。
在特定的实施方案中,如本文所教导的分子使用持续递送系统施用,诸如(部分)植入的持续递送系统。技术人员将理解此类持续递送系统可以包括用于容纳如本文所教导的作用剂的储库、泵和输注装置(例如,管道系统)。
如已经讨论的那样,进一步的方面提供了在表达(优选内源性表达)蛋白的突变或变异形式的细胞中下调所述蛋白的突变或变异形式的量或生物活性的体外方法,所述方法包括使所述细胞接触能够下调所述蛋白的突变或变异形式的量或生物活性的非天然存在的分子,其中:
a)所述蛋白包含β-聚集倾向区(APR)并且所述APR被所述蛋白的突变或变异形式中的所述突变或变异修饰;或
b)所述突变或变异在所述蛋白的突变或变异形式中引入在所述蛋白中不存在的重新形成的APR;
并且其中所述分子被构造成特异性地靶向如本文所教导的蛋白的突变或变异形式中的APR。
术语“体外”一般表示在身体(例如,动物或人类身体)外部或身体之外的。可以使用本领域中众所周知的细胞分离和培养技术、材料和一次性用品在体外分离、维持和繁殖细胞。术语“接触(contact或contacting)”当在本文中使用时意指使一个或多个第一组分(诸如一个或多个分子、生物学实体、细胞或材料)与一个或多个第二组分(诸如一个或多个分子、生物学实体、细胞或材料)以所述第一组分可以(如果能够的话)结合或调节第二组分或所述第二组分可以(如果能够的话)结合或调节第一组分的方式合并在一起。取决于上下文,术语“接触”可以与“暴露”、“孵育”、“混合”、“反应”等同义。
在某些实施方案中,所述细胞可以是:细菌细胞,真菌细胞,包括酵母细胞或霉菌细胞,原生生物细胞,植物细胞,或动物细胞,诸如昆虫细胞、温血动物细胞、脊椎动物细胞、高等动物细胞、非人哺乳动物细胞或人细胞。
进一步的方面提供了在表达(优选内源性表达)蛋白的突变或变异形式的生物体中下调所述蛋白的突变或变异形式的量或生物活性的方法,所述方法包括向所述生物体施用能够下调所述蛋白的突变或变异形式的量或生物活性的非天然存在的分子,其中:
a)所述蛋白包含β-聚集倾向区(APR)并且所述APR被所述蛋白的突变或变异形式中的所述突变或变异修饰;或
b)所述突变或变异在所述蛋白的突变或变异形式中引入在所述蛋白中不存在的重新形成的APR;
并且其中所述分子被构造成特异性地靶向如本文所教导的蛋白的突变或变异形式中的APR。
在某些实施方案中,所述生物体可以是细菌、真菌(包括酵母或霉菌)、植物或动物。所述分子在人和非人动物中的治疗用途在说明书中其他地方更详细地讨论,而在某些实施方案中,所述方法可以是非治疗性的,例如,所述方法可以是不用于通过手术或疗法治疗人或动物身体的方法。在某些优选的实施方案中,所述生物体可以是植物。在某些优选的实施方案中,所述生物体可以是无脊椎动物或低等动物。
如本文使用的术语“植物”涵盖整株植物、植物的祖先和后代、和植物部分,包括种子、枝条、茎、叶、根(包括块茎)、花、以及组织和器官,其中这些植物或植物部分表达突变或变异蛋白形式。术语“植物细胞”或“植物”还可以涵盖悬浮培养物、愈伤组织、胚、分生组织区、配子体、孢子体、花粉和小孢子,其中这些表达所述突变或变异蛋白形式。在本发明的方法中特别有用的植物特别包括单子叶植物和双子叶植物,包括饲料或草料豆科植物、观赏植物、粮食作物、乔木或灌木。
上述概念通过下面的具体实施例举例说明和进一步解释。RAS蛋白属于小GTP酶类型的蛋白且参与调节各种各样的正常细胞过程的细胞质信号转导通路,诸如细胞生长和分裂、分化和存活。在鸟嘌呤核苷酸交换因子(GEF)和GTP酶激活蛋白(GAP)的辅助下,RAS GTP酶在GDP结合的无活性状态和GTP结合的活性状态之间循环,所述鸟嘌呤核苷酸交换因子促进激活,所述GTP酶激活蛋白通过催化GTP水解使RAS失活。一旦被激活,RAS-GTP结合并激活具有不同催化功能的众多下游效应器。三个人RAS基因(Kirsten大鼠肉瘤病毒癌基因同源物(KRAS)(根据美国政府国家生物技术信息中心(NCBI)Genbank(http:// www.ncbi.nlm.nih.gov/)以Gene ID编号3845标注),神经母细胞瘤RAS病毒癌基因同源物(NRAS)(Gene ID编号4893)和Harvey大鼠肉瘤病毒癌基因同源物(HRAS))(Gene ID编号3265)编码四个RAS蛋白,其中两个KRAS同种型来自KRAS转录物的可变RNA剪接(KRAS4A和KRAS4B)。
人野生型KRAS4A同种型氨基酸序列可以根据Genbank登录号:NP_203524.1或Swissprot/Uniprot(http://www.uniprot.org/)登录号:P01116-1(v1)标注,NP_203524.1序列在此重现如下:
MTEYKLVVVGAGGVGKSALTIQLIQNHFVDEYDPTIEDSYRKQVVIDGETCLLDILDTAGQEEYSAMRDQYMRTGEGFLCVFAINNTKSFEDIHHYREQIKRVKDSEDVPMVLVGNKCDLPSRTVDTKQAQDLARSYGIPFIETSAKTRQRVEDAFYTLVREIRQYRLKKISKEEKTPGCVKIKKCIIM(SEQ ID NO:1)。
RAS基因的某些突变可以导致产生永久激活的RAS蛋白,导致甚至在缺少输入信号的情况下有活性的细胞内信号传导,这最终可以导致或促进表达此类突变的RAS蛋白的细胞的肿瘤转化。在约27%的全部人类癌症以及多达90%的特定类型癌症中发现了RAS基因的功能获得性错义突变(在RAS基因中已经报道了超过130种不同的错义突变),验证了突变的RAS基因即使不是驱动肿瘤发生和维持的最常见癌基因也是非常常见的。在人类癌症中,KRAS是流行的突变RAS同种型(85%),而HRAS(4%)和NRAS(11%)不太频繁突变。此外,98%的突变见于三个错义突变热点之一处:G12(在G12处G12C、G12D、G12S和G12V突变是最频繁的),G13(在G13处G13C、G13D、G13R、G13S和G13V突变是最频繁的)和Q61(在Q61处Q61H、Q61K、Q61L和Q61R突变是最频繁的)。习惯上,突变的RAS被认为在GAP-介导的GTP水解方面是有缺陷的,这导致在细胞中组成性活性GTP-结合的RAS的积累。参见Hobbs等人,J CellSci.2016,vol.129,1287-92。
人RAS蛋白预期含有5个至少5个氨基酸的APR区(参见表3)。在野生型蛋白中最多见的N-末端APR(TEYKLVVVGAG,SEQ ID NO:2)的C-末端划为G12(下划线表示)。然而,某些G12错义突变,诸如特别是G12V、G12C、G12A或G12S扩大了此APR使得各个RAS突变体中的APR不仅包括12位处的突变残基,还另外地包括一个或多个后续的残基。此外,某些G13错义突变,诸如特别是G13V、G13C或G13S,扩大了此APR使得各个RAS突变体中的APR不仅包括12位处的甘氨酸,还另外地包括13位处的突变残基和任选地一个或多个后续的残基。
因此,此APR预测在G12V RAS突变体中跨越2-15位并且显示了序列TEYKLVVVGAVGVG(SEQ ID NO:3);在G12C RAS突变体中跨越2-14位并且显示了序列TEYKLVVVGACGV(SEQ ID NO:4);在G12A RAS突变体中跨越2-14位并且显示了序列TEYKLVVVGAAGV(SEQ ID NO:5);以及在G12S RAS突变体中跨越2-13位并且显示了序列TEYKLVVVGASG(SEQ ID NO:6);在G13C RAS突变体中跨越2-14位并显示了序列TEYKLVVVGAGCV(SEQ ID NO:7);在G13V RAS突变体中跨越2-15位并且显示了序列TEYKLVVVGAGVVG(SEQ ID NO:8);以及在G13S RAS突变体中跨越2-13位并且显示了序列TEYKLVVVGAGS(SEQ ID NO:9)。另外,至少在人RAS的G12或G13处的一些突变,诸如特别是G12V或G13V突变,也显著地增加相应APR的预测聚集倾向性。
已经认识到G12或G13突变人RAS蛋白中此类改变的APR谱的存在,发明人研究并且目前教导了用于允许下调G12或G13突变RAS蛋白的分子间β-片层相互作用的分子,这些分子通过特异性地靶向G12或G13突变RAS蛋白中改变的APR但不会靶向野生型RAS中未改变的对应APR来利用这些差异。不希望受限于任何假设或理论,本文中提出的数据表明这种下调可能因该分子诱导与G12或G13突变RAS蛋白的特异性共聚集的能力所致,这样降低了它们的溶解度,将它们隔离到聚集物或包涵体内(它们可能经受细胞机制的降解),并且实际上减小仍然可用于细胞内信号传导的G12或G13突变RAS蛋白的量。应当理解一旦分子被诱导或开始聚集其靶标G12或G13突变RAS蛋白,这样聚集的RAS本身可以获得促进或驱动将额外的可溶性G12或G13突变RAS蛋白包含到聚集物中的能力,即,存在的RAS聚集物可以作为“种子”发挥作用以进一步聚集所述蛋白和用于所述聚集物的生长。所述分子不显示相当的或等效的诱导与野生型RAS的共聚集和对野生型RAS的下调。这可以意味着例如即使在所述分子和野生型RAS之间发生一些分子间β-片层形成,相比较而言其后果将是可以忽略不计的,并且所述分子将不会可观察到地下调野生型RAS或将不会下调野生型RAS到这种下调将不利地消除野生型RAS的细胞内信号传导的程度。
在此,体现本发明的原理的某些分子能够下调、减少G12突变人RAS蛋白的溶解度和/或诱导G12突变人RAS蛋白的聚集或包涵体形成,并且基本上不影响野生型人RAS蛋白,其中所述分子包含β-聚集序列,所述β-聚集序列包含下列氨基酸序列的至少6个,诸如6、7、8、9或10个连续氨基酸:a)TEYKLVVVGAVGVG(SEQ ID NO:3);或b)TEYKLVVVGACGV(SEQ IDNO:4);或c)TEYKLVVVGAAGV(SEQ ID NO:5);或d)TEYKLVVVGASG(SEQ ID NO:6),包括各个序列的11位处的氨基酸。体现本发明的原理的某些分子能够下调、减少G12突变人RAS蛋白的溶解度和/或诱导G12突变人RAS蛋白的聚集或包涵体形成,并且基本上不影响野生型人RAS蛋白,其中所述分子包含β-聚集序列,所述β-聚集序列包含下列氨基酸序列的至少6个,诸如6、7、8、9或10个(或最多)连续氨基酸:a)LVVVGAVGVG(SEQ ID NO:10);或b)LVVVGACGV(SEQ ID NO:11);或c)LVVVGAAGV(SEQ ID NO:12);或d)LVVVGASG(SEQ ID NO:13),包括各个序列的7位处的氨基酸。结合G12C RAS,在所述分子中加入未受保护的半胱氨酸因在半胱氨酸残基中存在反应性–SH基团,因而可能是不太适宜的。因此,针对G12C RAS且更一般地针对包含半胱氨酸的任何APR的分子,可以在该位置处包含另一种氨基酸,诸如丝氨酸,或可以在该位置处包含以另外的方式保护的半胱氨酸,例如通过保护基团(例如,对甲基苄基、二苯基甲基、对甲氧基苄基或乙酰氨基甲基),或使其–SH基团与同一分子内或两个分子之间的另一半胱氨酸的–SH基团反应(二硫键)。因此,在某些实施方案中,在针对G12C突变人RAS的分子中,所述分子段的对应于G12C RAS的12位的氨基酸是L-丝氨酸或D-丝氨酸或丝氨酸类似物,优选L-丝氨酸。在某些其他实施方案中,在针对G12C突变人RAS的分子中,所述分子段的对应于G12C RAS的12位的氨基酸是L-半胱氨酸或D-半胱氨酸或半胱氨酸类似物,优选L-半胱氨酸,其–SH基团被保护基团保护或参与二硫键。
体现本发明的原理的某些分子能够下调、减少G13突变人RAS蛋白的溶解度和/或诱导G13突变人RAS蛋白的聚集或包涵体形成,并且基本上不影响野生型人RAS蛋白,其中所述分子包含β-聚集序列,所述β-聚集序列包含下列氨基酸序列的至少6个,诸如6、7、8、9或10个连续氨基酸:a)TEYKLVVVGAGCV(SEQ ID NO:7);或b)TEYKLVVVGAGVVG(SEQ ID NO:8);或c)TEYKLVVVGAGS(SEQ ID NO:9);包括各个序列的12位处的氨基酸。体现本发明的原理的某些分子能够下调、减少G13突变人RAS蛋白的溶解度和/或诱导G13突变人RAS蛋白的聚集或包涵体形成,并且基本上不影响野生型人RAS蛋白,其中所述分子包含β-聚集序列,所述β-聚集序列包含下列氨基酸序列的至少6个,诸如6、7、8、9或10个(或最多)连续氨基酸:a)LVVVGAGCV(SEQ ID NO:14);或b)LVVVGAGVVG(SEQ ID NO:15);或c)LVVVGAGS(SEQ ID NO:16),包括各个序列的8位处的氨基酸。
例如,G12或G13突变RAS靶向分子可以表示为包含下列结构,基本上由下列结构组成或由下列结构组成:
a)Gate-Pept-Gate;
b)接头-Gate-Pept-Gate;
c)Gate-Pept-Gate-接头;
d)接头-Gate-Pept-Gate-接头;
e)Gate-Pept-Gate-(接头)-Gate-Pept-Gate;
f)接头-Gate-Pept-Gate-(接头)-Gate-Pept-Gate;
g)Gate-Pept-Gate-(接头)-Gate-Pept-Gate-接头;
h)接头-Gate-Pept-Gate-(接头)-Gate-Pept-Gate-接头;
i)Gate-Pept-Gate-(接头)-Gate-Pept-Gate-(接头)-Gate-Pept-Gate;
j)接头-Gate-Pept-Gate-(接头)-Gate-Pept-Gate-(接头)-Gate-Pept-Gate;
k)Gate-Pept-Gate-(接头)-Gate-Pept-Gate-(接头)-Gate-Pept-Gate-接头;或
l)接头-Gate-Pept-Gate-(接头)-Gate-Pept-Gate-(接头)-Gate-Pept-Gate-接头;
其中“Gate”、“Pept”和“接头”表示通过肽键与邻近的肽元件结合的肽元件,其中肽元件的从左到右的次序标志了肽中它们的N-至C-末端的组织方式;
其中“Pept”(针对G12突变RAS)各自独立地是β-聚集序列,所述β-聚集序列包含下列氨基酸序列的至少6个,诸如6、7、8、9或10个(或最多)连续氨基酸:LVVVGAVGVG(SEQ IDNO:10);或LVVVGACGV(SEQ ID NO:11);;或LVVVGAAGV(SEQ ID NO:12);或LVVVGASG(SEQ IDNO:13),包括各个序列的7位处的氨基酸,任选地其中所述氨基酸中的任一个或多个或全部被其D-异构体或其类似物替换,包括此类类似物的L-和D-异构体(如本说明书中其他地方所解释的那样,在表示为包含半胱氨酸的任何“Pept”中半胱氨酸可以被更换为丝氨酸或通过合适的保护基团或二硫键保护);
或其中“Pept”(针对G13突变RAS)各自独立地是β-聚集序列,所述β-聚集序列包含下列氨基酸序列的至少6个,诸如6、7、8、9或10个(或最多)连续氨基酸:LVVVGAGCV(SEQ IDNO:14),或LVVVGAGVVG(SEQ ID NO:15),或LVVVGAGS(SEQ ID NO:16),包括各个序列的8位处的氨基酸,任选地其中所述氨基酸的任一个或多个或全部被其D-异构体或其类似物替换,包括此类类似物的L-和D-异构体(如本说明书中其他地方所解释的那样,在表示为包含半胱氨酸的任何“Pept”中半胱氨酸可以被更换为丝氨酸或通过合适的保护基团或二硫键保护);
其中“Gate”各自独立地为赖氨酸(K)或D-赖氨酸或D-或L-赖氨酸类似物(优选赖氨酸)、精氨酸(R)或D-精氨酸或D-或L-精氨酸类似物(优选精氨酸)、天冬氨酸(D)或D-天冬氨酸或D-或L-天冬氨酸类似物(优选天冬氨酸)、谷氨酸(E)或D-谷氨酸或D-或L-谷氨酸类似物(优选谷氨酸)、KK、KKK、KKKK(SEQ ID NO:45)、RR、RRR、RRRR(SEQ ID NO:46)、DD、DDD、DDDD(SEQ ID NO:47)、EE、EEE、EEEE(SEQ ID NO:48)、KR、RK、KKR、KRK、RKK、RRK、RKR、KRR、KRKR(SEQ ID NO:49)、KRRK(SEQ ID NO:50)、RKKR(SEQ ID NO:51)、DE、ED、DDE、DED、EED、EED、EDE、DEE、DEDE(SEQ ID NO:52)、DEED(SEQ ID NO:53)或EDDE(SEQ ID NO:54),任选地其中所述氨基酸的任一个或多个或全部被其D-异构体或其类似物替换,包括此类类似物的L-和D-异构体;以及
其中在括号中纳入词“接头”表示所述接头各自独立地可以不存在或优选存在,并且其中“接头”各自独立地为甘氨酸(G)或D-或L-甘氨酸类似物(优选甘氨酸)、丝氨酸(S)或D-丝氨酸或D-或L-丝氨酸类似物(优选丝氨酸)、脯氨酸(P)或D-脯氨酸或D-或L-脯氨酸类似物(优选脯氨酸)、GG、GGG、GGGG(SEQ ID NO:55)、SS、SSS、SSSS(SEQ ID NO:56)、GS、SG、GGS、GSG、SGG、SSG、SGS、SSG、GGGS(SEQ ID NO:57)、GGSG(SEQ ID NO:58)、GSGG(SEQ ID NO:59)、SGGG(SEQ ID NO:60)、GGSS(SEQ ID NO:61)、GSSG(SEQ ID NO:62)、SSGG(SEQ ID NO:63)、GSGS(SEQ ID NO:70)、SGSG(SEQ ID NO:64)、GSGSG(SEQ ID NO:65)、SGSGS(SEQ IDNO:66)、PP、PPP或PPPP(SEQ ID NO:67),任选地其中所述氨基酸的任一个或多个或全部被其D-异构体或其类似物替换,包括此类类似物的L-和D-异构体。
在此类肽中,N-末端氨基酸可以被修饰(诸如乙酰化)和/或C-末端氨基酸可以被修饰(诸如酰胺化)。在此类肽中,可以掺入一个或多个D-氨基酸和/或一个或多个氨基酸类似物,只要它们的掺入与如本文所教导的分子间β-片层的形成相容即可。
例如,G12V突变RAS靶向分子可以包含下列氨基酸序列的肽,基本上由下列氨基酸序列的肽组成或由下列氨基酸序列的肽组成:
a)KVVVGAVKGSKVVVGAVK(SEQ ID NO:17);或
b)KLVVVGAVKGSKLVVVGAVK(SEQ ID NO:18);或
c)KVVVGAVGKGSKVVVGAVGK(SEQ ID NO:19);或
d)KVVVGAVGVGKGSKVVVGAVGVGK(SEQ ID NO:20);
任选地其中所述氨基酸序列包含一个或多个D-氨基酸和/或其氨基酸中的一个或多个的类似物,任选地其中N-末端氨基酸被乙酰化和/或C-末端氨基酸被酰胺化。
在某些特别优选的实施方案中,所述分子包含如表7中所示的氨基酸序列的肽,基本上由所述肽组成或由所述肽组成,诸如SEQ ID NO:76、77-78、80-95、97或99-100,任选地其中所述氨基酸序列包含一个或多个D-氨基酸和/或其氨基酸中的一个或多个的类似物,任选地其中N-末端氨基酸被乙酰化和/或C-末端氨基酸被酰胺化。因此,在某些特别优选的实施方案中,所述分子包含下列氨基酸序列的肽,基本上由下列氨基酸序列的肽组成或由下列氨基酸序列的肽组成:
a)[Dap]LSVFAIKGSKLSVFAI[Dap](SEQ ID NO:79);或
b)[Dap]VVVGAVKGSKVVVGAV[Dap](SEQ ID NO:80);或
c)[Dap]VVVGAVGKGSKVVVGAVG[Dap](SEQ ID NO:81);或
d)[Dap]VVVGAVGVGKGSKVVVGAVGVG[Dap](SEQ ID NO:82);或
e)[Cit]VVVGAVKGSKVVVGAVK(SEQ ID NO:83);或
f)KVVVGAV[Cit]GSKVVVGAVK(SEQ ID NO:84);或
g)AVVVGAVKGSKVVVGAVK(SEQ ID NO:85);或
h)KVVVGAVAGSKVVVGAVK(SEQ ID NO:86);或
i)KVVVGAVKGSAVVVGAVK(SEQ ID NO:87);或
j)KVVVGAVKGSKVVVGAVA(SEQ ID NO:88);或
k)AVVVGAVKGSAVVVGAVK(SEQ ID NO:89);或
l)KVVVGAVAGSKVVVGAVA(SEQ ID NO:90);或
m)AVVVGAVAGSKVVVGAVK(SEQ ID NO:91);或
n)KVVVGAVKASKVVVGAVK(SEQ ID NO:92);或
o)KVVVGAVKGAKVVVGAVK(SEQ ID NO:93);或
p)KVVVGAVGKGFKVVVGAVGK(SEQ ID NO:94);或
q)KVVVGAVGKFFKVVVGAVGK(SEQ ID NO:95);或
r)KVVVGAVGVGKKVVVGAVGVGK(SEQ ID NO:97);
任选地其中所述氨基酸序列包含一个或多个D-氨基酸和/或其氨基酸中的一个或多个的类似物,任选地其中N-末端氨基酸被乙酰化和/或C-末端氨基酸被酰胺化(‘[Dap]’表示二氨基庚二酸,‘[Cit]’表示瓜氨酸)。
在某些实施方案中,如本文所教导的分子不是由氨基酸序列KLVVVGAVGV(SEQ IDNO:101)组成的肽。在某些实施方案中,如本文所教导的分子不是由氨基酸序列KLVVVGAVGVGKSALTI(SEQ ID NO:102)组成的肽。在某些实施方案中,如本文所教导的分子不是由氨基酸序列KLVVVGAVGVGKS(SEQ ID NO:103)组成的肽。
此类分子以及它们的效应和用途也在实施例中进行了实验性地说明。
借助于进一步举例说明且非限制性地,下面提供了人基因中的已知突变的实施例,所述突变在相应的突变蛋白中改变或添加了TANGO-预测的APR。
癌基因中改变已有APR的长度的疾病突变的实例:
GNAS(鸟嘌呤核苷酸结合蛋白G亚基α同种型短序列,Swissprot/UniProt登录号P63092序列版本1):
突变 APR起始位置 N-ter GKs APR序列 C-ter GKs 评分(%) 长度(aa)
WT 201 RCR VLTSGIF ETK 10,5573 7
R201C 200 LRC CVLTSGIF ETK 4,2066 8
R201L 199 LLR CLVLTSGIF ETK 39,345 9
上表中1-3行中的序列分别表示为SEQ ID NO:21-23。
MP2K2(双特异性有丝分裂原激活的蛋白激酶激酶2,Swissprot/UniPro登录号P36507序列版本1):
突变 APR起始位置 N-ter GKs APR序列 C-ter GKs 评分(%) 长度(aa)
WT 128 NSP YIVGFYGAFYS DGE 65,216 11
P128L 126 ECN SLYIVGFYGAFYS DGE 69,3177 13
上表中1-2行中的序列分别表示为SEQ ID NO:24-25。
IDHP(异柠檬酸脱氢酶[NADP],线粒体,Swissprot/UniProt登录号P48735序列版本2):
突变 APR起始位点 N-ter GKs APR序列 C-ter GKs 评分(%) 长度(aa)
WT 141 IRN ILGGTVF REP 4,02996 7
R140L 137 PNG TILNILGGTVF REP 28,1 11
R140W 137 PNG TIWNILGGTVF REP 23,8732 11
上表中1-3行中的序列分别表示为SEQ ID NO:26-28。
ITK(酪氨酸蛋白激酶ITK/TSK,Swissprot/UniProt登录号Q08881,序列版本1):
突变 APR起始位点 N-ter GKs APR序列 C-ter GKs 评分(%) 长度(aa)
WT 29 KVR FFVLTKASLAYFE DRH 26,0231 13
R29L 27 NFK VLFFVLTKASLAYFE DRH 43,8347 15
R29C 27 NFK VCFFVLTKASLAYFE DRH 39,996 15
上表中1-3行中的序列分别表示为SEQ ID NO:29-31。
B)癌基因中不改变APR的长度但形成错配和/或改变评分的疾病突变的实例:
BCL2(凋亡调节物Bcl-2,Swissprot/UniProt登录号P10415,序列版本2):
突变 APR起始位置 N-ter GKs APR序列 C-ter GKs 评分(%) 长度(aa)
WT 129 RGR FATVV EEL 38,5828 5
A131V 129 RGR FVTVV EEL 90,0278 5
A131G 129 RGR FGTVV EEL 6,25217 5
上表中1-3行中的序列分别表示为SEQ ID NO:34-36。
癌基因中形成重新形成的APR的疾病突变的实例:
ERBB2(受体酪氨酸蛋白激酶erbB-2,Swissprot/UniProt登录号P04626,序列版本1):
突变 APR起绐位置 N-ter GKs APR序列 C-ter GKs 评分(%) 长度(aa)
WT NA NA NA NA NA NA
A293V 288 EGR YTFGVSCV TAC 1,72107 8
上表中第2行中的序列分别表示为SEQ ID NO:37。
B-RAF(丝氨酸/苏氨酸蛋白激酶B-RAF,Swissprot/UniProt登录号P15056,序列版本4):
突变 APR起始位置 N-ter GKs APR序列 C-ter GKs 评分(%) 长度(aa)
WT NA NA NA NA NA NA
G469V 466 GSG SFVTVY KGK 47,4044 6
G469L 466 GSG SFLTVY KGK 31,7404 6
上表中2-3行中的序列分别表示为SEQ ID NO:38-39。
本申请还提供了如下面声明中所给出的各个方面和实施方案:
声明1.一种非天然存在的分子,所述分子能够下调蛋白的突变或变异形式的量或生物活性,其中:
a)所述蛋白包含β-聚集倾向区(APR)并且所述APR被所述蛋白的突变或变异形式中的突变或变异修饰;或
b)所述突变或变异在所述蛋白的突变或变异形式中引入在所述蛋白中不存在的重新形成的APR;
并且其中所述分子被构造成特异性地靶向所述蛋白的突变或变异形式中的APR。
声明2.根据声明1所述的分子,其中所述分子被构造成与所述蛋白的突变或变异形式中的APR形成分子间β-片层但基本上不与所述蛋白中的APR形成分子间β-片层。
声明3.根据声明1或2所述的分子,其中所述分子间β-片层涉及在所述蛋白的突变或变异形式与所述蛋白之间不同的一个或多个氨基酸。
声明4.根据声明1-3中任一项所述的分子,其中所述蛋白的突变或变异形式中的APR与所述蛋白的APR在氨基酸序列或聚集倾向性方面有差异,优选在氨基酸序列方面有差异,更优选在氨基酸序列和聚集倾向性方面有差异。
声明5.根据声明4所述的分子,其中所述蛋白的突变或变异形式中的APR的聚集倾向性高于所述蛋白中的APR的聚集倾向性。
声明6.根据声明4或5所述的分子,其中:
a)所述蛋白的突变或变异形式中的APR与所述蛋白中的APR相比具有较高比例的疏水性氨基酸;
b)所述蛋白的突变或变异形式中的APR与所述蛋白中的APR相比具有较低比例的表现出低β-片层形成潜力或破坏β-片层的倾向性的氨基酸;
c)所述蛋白的突变或变异形式中的APR与所述蛋白的APR相比具有较低比例的带电荷氨基酸;和/或
d)所述蛋白的突变或变异形式中的APR比所述蛋白中的APR长至少一个氨基酸,诸如长两个、三个或四个氨基酸。
声明7.根据声明4-6中任一项所述的分子,其中:
a)所述蛋白的突变或变异形式中的所述突变或变异修饰所述蛋白中的APR内的一个或多个氨基酸,所述修饰诸如置换、缺失或添加;
b)所述蛋白的突变或变异形式中的所述突变或变异修饰在N-末端邻接所述蛋白中的APR的1-10个连续氨基酸、优选1-4个连续氨基酸的区域内的一个或多个氨基酸,所述修饰诸如置换、缺失或添加,优选其中所述区域的至少一个氨基酸成为所述蛋白的突变或变异形式中的APR的一部分;和/或
c)所述蛋白的突变或变异形式中的所述突变或变异修饰在C-末端邻接所述蛋白中的APR的1-10个连续氨基酸、优选1-4个连续氨基酸的区域内的一个或多个氨基酸,所述修饰诸如置换、缺失或添加,优选其中所述区域的至少一个氨基酸成为所述蛋白的突变或变异形式中的APR的一部分。
声明8.根据声明7所述的分子,其中在N-末端或C-末端邻接所述蛋白的APR的所述区域中的所述突变或变异:
a)增加所述区域中的疏水性氨基酸的比例;
b)减少表现出低β-片层形成潜力或破坏β-片层的倾向性的氨基酸的比例;和/或
c)减少所述区域中带电荷氨基酸的比例。
声明9.根据声明1-8中任一项所述的分子,其中所述分子能够降低所述蛋白的突变或变异形式的溶解度或诱导所述蛋白的突变或变异形式的聚集或包涵体形成。
声明10.根据声明2-9中任一项所述的分子,其中所述分子包含氨基酸段,优选至少6个连续氨基酸的段,诸如6-10个连续氨基酸的段,所述氨基酸段参与与所述蛋白的突变或变异形式中的APR的分子间β-片层。
声明11.根据声明10所述的分子,其中被所述分子包含的所述段对应于所述蛋白的突变或变异形式中的APR所包含的氨基酸段,优选至少6个连续氨基酸的段,诸如6-10个连续氨基酸的段,优选其中:
a)所述分子包含的段的氨基酸序列与所述APR所包含的段相同;
b)所述分子包含的段的氨基酸序列与所述APR所包含的段的氨基酸序列至少80%相同;
c)所述分子包含的段的氨基酸序列与所述APR所包含的段的氨基酸序列的差别为至多3个、优选至多2个、且更优选至多1个氨基酸置换;
d)所述分子包含的段的氨基酸序列表现出如a)至c)中任一项所示的与所述APR所包含的段的氨基酸序列的序列同一性程度,并且所述分子段的全部氨基酸均为L-氨基酸;
e)所述分子包含的段的氨基酸序列表现出如a)至c)中任一项所示的与所述APR所包含的段的氨基酸序列的序列同一性程度,并且前者的段的至少一个氨基酸为D-氨基酸;
f)所述分子包含的段的氨基酸序列表现出如a)至c)中任一项所示的与所述APR所包含的段的氨基酸序列的序列同一性程度,并且前者的段的至少一个氨基酸被各个氨基酸的类似物替换;或
g)所述分子包含的段的氨基酸序列表现出如a)至c)中任一项所示的与所述APR所包含的段的氨基酸序列的序列同一性程度,并且前者的段的至少一个氨基酸为D-氨基酸并且前者的段的至少一个氨基酸被各个氨基酸的类似物替换。
声明12.根据声明10或11所述的分子,其中所述分子包含两个或更多个、优选两个所述氨基酸段,所述氨基酸段相同或不同。
声明13.根据声明10-12中任一项所述的分子,其中一个或多个氨基酸段各自独立地在每个末端独立地侧接一个或多个表现出低β-片层形成潜力或破坏β-片层的倾向性的氨基酸。
声明14.根据声明10-13中任一项所述的分子,其中所述分子包含下列结构,基本上由下列结构组成或由下列结构组成:
a)NGK1-P1-CGK1,
b)NGK1-P1-CGK1-Z1-NGK2-P2-CGK2,
c)NGK1-P1-CGK1-Z1-NGK2-P2-CGK2-Z2-NGK3-P3-CGK3,或
d)NGK1-P1-CGK1-Z1-NGK2-P2-CGK2-Z2-NGK3-P3-CGK3-Z3-NGK4-P4-CGK4,
其中:
P1至P4各自独立地表示如声明10-13中任一项所定义的氨基酸段,
NGK1至NGK4以及CGK1至CGK4各自独立地表示1-4个表现出低β-片层形成潜力或破坏β-片层的倾向性的连续氨基酸,诸如1-4个选自由R、K、D、E、P、N、S、H、G、Q和A、其D-异构体和/或类似物、及其组合组成的组的连续氨基酸,优选1-4个选自由R、K、D、E、P、N、S、H、G和Q、其D-异构体和/或类似物、及其组合组成的组的连续氨基酸,更优选1-4个选自由R、K、D、E和P、其D-异构体和/或类似物、及其组合组成的组的连续氨基酸,以及
Z1至Z3各自独立地表示直接键或优选接头。
声明15.根据声明1-14中任一项所述的分子,其中所述突变或变异是生殖系或体细胞突变或变异。
声明16.根据声明1-15中任一项所述的分子,其中所述蛋白的突变或变异形式是疾病的病因或与疾病相关。
声明17.根据声明16所述的分子,其中所述疾病是肿瘤性疾病,特别是癌症。
声明18.根据声明17所述的分子,其中所述蛋白是原癌基因,并且所述蛋白的突变或变异形式是癌基因。
声明19.根据声明16-18中任一项所述的分子,其用于医药用途,特别用于治疗由所述蛋白的突变或变异形式引起或与所述蛋白的突变或变异形式相关的疾病的方法。
声明19’.编码声明16-18中任一项所述的分子的核酸,其中所述分子是多肽,所述核酸用于医药用途,特别用于治疗由所述蛋白的突变或变异形式引起或与所述蛋白的突变或变异形式相关的疾病的方法。
声明20.根据声明17或18所述的分子,其用于治疗由所述蛋白的突变或变异形式引起或与所述蛋白的突变或变异形式相关的肿瘤性疾病的方法。
声明20’.编码声明17或18所述的分子的核酸,其中所述分子是多肽,所述核酸用于治疗由所述蛋白的突变或变异形式引起或与所述蛋白的突变或变异形式相关的肿瘤性疾病的方法。
声明21.一种药物组合物,包含根据声明1-18中任一项所述的分子。
声明21’.一种药物组合物,包含编码根据声明1-18中任一项所述的分子的核酸,其中所述分子是多肽。
声明22.一种在表达、优选内源性表达蛋白的突变或变异形式的细胞中下调所述蛋白的突变或变异形式的量或生物活性的体外方法,所述方法包括使所述细胞接触能够下调所述蛋白的突变或变异形式的量或生物活性的非天然存在的分子,其中:
a)所述蛋白包含β-聚集倾向区(APR)并且所述APR被所述蛋白的突变或变异形式中的所述突变或变异修饰;或
b)所述突变或变异在所述蛋白的突变或变异形式中引入在所述蛋白中不存在的重新形成的APR;
并且其中所述分子被构造成特异性地靶向所述蛋白的突变或变异形式中的APR;或
包括使所述细胞接触编码所述分子的核酸,其中所述分子是多肽。
声明23.一种在表达、优选内源性表达蛋白的突变或变异形式的生物体中下调所述蛋白的突变或变异形式的量或生物活性的方法,所述方法包括向所述生物体施用能够下调所述蛋白的突变或变异形式的量或生物学活性的非天然存在的分子,其中:
a)所述蛋白包含β-聚集倾向区(APR)并且所述APR被所述蛋白的突变或变异形式中的所述突变或变异修饰;或
b)所述突变或变异在所述蛋白的突变或变异形式中引入在所述蛋白中不存在的重新形成的APR;
并且其中所述分子被构造成特异性地靶向所述蛋白的突变或变异形式中的APR;或
包括使细胞接触编码所述分子的核酸,其中所述分子是多肽。
声明24.根据声明22或23中任一项所述的方法,其中所述分子如声明1-14中任一项所定义。
声明25.根据声明22或24中任一项所述的方法,其中所述细胞是细菌细胞、真菌细胞、原生生物细胞、植物细胞或动物细胞,所述真菌细胞包括酵母细胞或霉菌细胞,所述动物细胞包括非人哺乳动物细胞或人细胞。
声明26.根据声明23或24中任一项所述的方法,其中所述生物体是细菌、真菌、植物或动物,所述真菌包括酵母或霉菌。
尽管本发明已经结合其具体实施方案进行了描述,但鉴于下面的描述很显然许多替代方案、改动和变化对于本领域技术人员来说是显而易见的。因此,意在包括在如下附带的权利要求书的精神和广义范围内的所有这样的替代方案、改动和变化。
进一步通过下面的非限制性实施例支持本文公开的本发明的各个方面和实施方案。
实施例
实施例1-7中使用的材料和方法
RAS-特异性聚集分子(‘pept-in’)的设计
RAS家族成员蛋白的蛋白序列获自UniProt(条目:P01116(KRAS)、P01112(HRAS)和P01111(NRAS))(Nucleic Acid Res.47(2008)36,D190-5)。使用TANGO算法(Fernandez-Escamilla等人,2004,见前)分析蛋白序列以鉴定聚集倾向区(APR)。为此,使用下列的设置:温度=298K,pH=7.5,离子强度=0.10M,TANGO评分上的截止值为每个残基1分。为了评估流行的G12和G13突变对TANGO谱的影响,我们使用了包含受影响的APR的19个氨基酸(1-19)的序列片段。该序列片段在KRAS、HRAS和NRAS之间是100%保守的,使得结果适用于所有RAS同种型。人工引入突变,如上所述使用TANGO算法分析序列。
基于使用RAS野生型和RAS G12V两个序列的TANGO输出,我们使用滑动窗方式生成了6-10个氨基酸之间的所有可能的APR窗。得到的序列窗针对全人蛋白组进行交叉比较,对分子(下文中称‘pept-in’)设计仅保留与RAS蛋白唯一精确匹配的序列。
肽合成和纯化
固相肽合成
在Symphony X肽合成仪(Gyros Protein Technologies)上以50或100μmol的规模进行肽合成。Rink amide低载量树脂(100-200目),O-(1H-6-氯苯并三唑-1-基)-1,1,3,3-四甲基脲六氟磷酸酯(HCTU)和二乙醚购自Novabiochem/Merck。Fmoc保护的氨基酸(AA)和三氟乙酸(TFA)购自Fluorochem。N,N-二甲基甲酰胺(DMF),在DMF溶液中的20%哌啶,N,N-二异丙基乙胺(DIPEA),三异丙基硅烷(TIS)和二硫苏糖醇(DTT)购自Sigma-Aldrich。二氯甲烷(DCM)购自Acros Organics。所需序列的延伸通过重复循环的Fmoc去除和氨基酸的偶联来进行(根据规模的体积和浓度参见下面的表1)。首先,将树脂在DMF中溶胀2×10分钟。接着,通过暴露于20%哌啶在DMF中的溶液2×5分钟移除Fmoc保护基。然后用DMF洗涤树脂,并使用4当量AA、4当量HCTU和16当量DIPEA在DMF中进行偶联30min。在下一循环之前用DMF洗涤树脂。从第二个APR的第一个AA进行延长的Fmoc移除(2×15)分钟和双偶联(2×30分钟)直至期望序列的末端为止。然后用DMF、DCM洗涤树脂数次,然后干燥2×10分钟。最后使用含2.5%超纯水;2.5%TIS和2.5%DTT的TFA溶液从干燥的树脂裂解肽2小时。然后在冷二乙醚(对于5mL TFA溶液,35mL)中沉淀肽溶液并离心;然后弃掉液相,用15mL二乙醚洗涤肽沉淀物。离心后,将沉淀物风干30min,然后溶解在10mL水/乙腈溶液(1:1)中,在冻干仪上冷冻并冻干过夜,得到粗粉末的肽。
表1.
Figure BDA0003893144820000961
肽纯化
在装有322泵、159 UV-vis检测器和GX281收集器的Gilson系统上通过反相制备性HPLC纯化粗肽,使用获自Phenomenex的C18柱(5μm
Figure BDA0003893144820000962
250×21.2mm,ref 006-4435-P0-AX)。HPLC级水和乙腈购自VWR,TFA购自Fluorochem。盐酸胍(Gu)购自Sigma Aldrich;二甲基亚砜(DMSO)和乙酸购自Merck。溶剂A为水+0.1%TFA,溶剂B为乙腈+0.1%TFA。粗粉末以20mg/mL溶解在DMSO中,涡旋并超声处理;然后用水中的Gu+10%乙酸将溶液稀释10倍,最后在0.22μm乙酸纤维素滤器(获自Merck)上过滤。然后肽溶液以30mL/min流速使用由下列组成的梯度纯化:以15%B的7分钟平稳时间,在10分钟内从15%B至45%B洗脱,接着使用95%B洗涤柱2分钟,以15%B平衡6分钟。然后通过MALDI质谱仪分析各级分。将纯级分一起收集在玻璃小瓶中,冷冻并冻干至少2天。最后通过LCMS分析纯肽进行质量控制验证,通过UV和MS两个信号使用90%纯度作为阈值。
细胞功效筛选
在本申请中使用的细胞系列举在下面的表2中:
表2.
细胞系 供应商 Cat N°
A-427 ATCC HTB-53
A-549 ATCC CCL-185
Capan-1 CLS 300143
HCT116 BPS Bioscience 60520
LCLC-97-TM-1 CLS 300409
MIAPACA-2 ATCC CRL-1420
NCI-H1299 ATCC CRL-5803
NCI-H358 ATCC CRL-5807
NCI-H441 ATCC HTB-174
NCI-H727 ATCC CRL-5815
PA-TU-8988T DSMZ ACC 162
PANC-1 ATCC CRL-1469
DSMZ:Leibniz Institute DSMZ-German Collection of Microorganisms andCell Cultures,Inhoffenstr.7B,D-38124 Braunschweig Germany。
CLS:CLS Cell Lines Service,Dr.Eckener-Str.8,D-69214 Eppelheim,Germany(www.https://clsgmbh.de/)。
BPS Bioscience,6042 Cornerstone Court West,Suite B,San Diego,CA92121,United States(www.bpsbioscience.com)。
人肿瘤细胞系获自ATCC(即NCI-H441(HBT-174TH),NCI-H1299(CRL-5803TM),NCI-H358(CRL-5807TM),NCI-H727(CRL-5815TM),A-427(HTB-53TM),PANC-1(CRL-1469TM),HCT-116(CCL-247TM),和MIAPaCa-2(CRL-1420TM))、CLS Cell Line Service GmbH(即,Capan-1(300143),和LCLC-97TM1(300409))或Leibniz-Institut DSMZ(即PA-TU-8998T(ACC162))。表达单个RAS同种型的小鼠胚胎成纤维细胞(称为‘RASless MEF’)获自美国国家癌症研究所弗雷德里克国家实验室(Frederick National Laboratory of the NationalCancer Institute,Frederick,MD,USA)。所有细胞系均根据供应商的说明书维持。
贴壁活力测定
对于在贴壁细胞上的单剂量活力筛选,在黑色
Figure BDA0003893144820000981
F-底96孔板(Greiner)中每孔在100μL完全生长培养基中接种4000个细胞。接种后那天,用含有25μM的固定最终剂量的指定pept-in的完全生长培养基替换生长培养基。对所有试验pept-in条件均包括技术重复。处理后2天和4天,使用CellTiter Blue试剂(Promega)根据生产厂商的说明书评估活力,做如下改动:CellTiter Blue试剂在PBS中二分之一稀释。在Clariostar平板读取仪(BMG)上进行读数。利用下面的改动进行剂量响应测定:使用二分之一稀释系列使用50μM为最高终浓度以剂量响应方式测试pept-in。此外,在处理后3天使用Celltiter Glo试剂(Promega)根据生产厂商的说明书进行单次活力读数,采用下列改动:CellTiter Blue试剂在PBS中四分之一稀释。
所有测试平板包含多个正常生长和媒介物对照,以及阳性对照化合物SAH-SOS-1A(CAS no.1652561-87-9)的剂量响应的重复。
球形体活力测定
对于在球形体培养物上的单剂量活力筛选,在黑色超低附着(Ultra-LowAttachment,ULA)圆底96孔板(Corning)中每孔在75μL完全生长培养基中接种1000个细胞。接种后那天,添加含有指定的测试化合物的50μl完全生长培养基处理球状体,使得添加后的终浓度为25μM。对所有试验pept-in条件均包括技术重复。处理后5天,使用CellTiterGlo 3D试剂(Promega)根据生产厂商的说明书评估活力,做如下改动:每孔加入80μL试剂。在Clariostar平板读取仪(BMG)上进行读数。对于使用RASless MEF的剂量响应测定,细胞以1000个(G12V和G12C)或2000个(野生型和BRAF V600E)接种在含基质胶的培养基中,以便在处理开始、24小时后获得同样可看到的球形体。进行剂量响应测定,采用下列的改动:使用二分之一稀释系列使用50μM为最高终浓度以剂量响应方式测试pept-in。
所有测试平板包含多个正常生长和媒介物对照,以及阳性对照化合物SAH-SOS-1A(Merck)的剂量响应的重复。
体外着色聚集测定
使用淀粉样蛋白传感器(amyloid-sensor)染料硫黄素T(ThT)和五聚甲酰噻吩乙酸(p-FTAA)进行着色聚集测定。从6M尿素中的5mM母液在PBS中将Pept-in稀释到100μM的终浓度。在黑色半区96孔板中在37℃在Clariostar平板读取仪(BMG)上在22小时期间进行动力学测量。
KRAS聚集播种测定
在低结合试管中从6M尿素中的5mM母液将Pept-in在PBS中稀释到100μM的终浓度,并在37℃温育20小时。此溶液直接用于后续的播种测定,或使用液氮将等分试样速冻并在-80℃保存用于以后的播种测定。
对于利用成熟pept-in聚集物的播种测定,5μM成熟pept-in溶液与处于含有200mM精氨酸和谷氨酰胺的Hepes缓冲液中的1mg/ml重组突变KRAS G12V混合。在黑色384孔板(每孔30μl终体积)中使用ThT作为聚集/淀粉样蛋白传感器染料在37℃在Clariostar平板读取仪(BMG)上监测播种。
对于利用pept-in种子的播种测定,成熟pept-in溶液在PBS中三分之一稀释,并在5分钟内使用超声5秒、间隔3秒暂停的几个循环进行超声处理。下一步5μM经超声处理的pept-in溶液与处于含有200mM精氨酸和谷氨酰胺的Hepes缓冲液中的1mg/ml重组突变KRASG12V混合。在黑色384孔板(每孔30μl终体积)中使用ThT作为淀粉样蛋白传感器染料在37℃在Clariostar平板读取仪(BMG)上监测播种。
体外翻译测定
使用
Figure BDA0003893144820000991
体外蛋白质合成试剂盒(New England Biolabs)根据生产厂商的说明书进行体外翻译测定。简言之,使用PCR生成含有侧接KRAS编码序列的T7启动子和终止子序列的线性DNA片段,并使用MinElute PCR纯化试剂盒(Qiagen)纯化。随后250ng线性DNA用于体外翻译反应,在37℃在震摇(1000rpm)条件下进行体外翻译反应2小时。指示的生物素化pept-in在翻译反应物中混合,从6M尿素中的5mM母液至10μM的终浓度。在结束翻译反应后,使用链霉亲和素包被珠子(Pierce)在室温在90分钟期间从反应混合物中捕获生物素化pept-in。下一步用含有0,1%Tween 20的TBS洗涤珠子,结合的蛋白最后在处于TBS缓冲液中的1X SDS负载染料(Bio-Rad)中煮沸。使用Any kD 15孔Mini-PROTEAN凝胶(Bio-Rad)在SDS-PAGE期间解析蛋白,并在使用小鼠单克隆KRAS-特异性抗体(SC-30,Santa CruzBiotechnology)进行Western印迹后探测KRAS,KRAS在Bio-Rad Chemidoc MP成像仪上利用HRP-偶联的抗小鼠二抗进行检测。
免疫共沉淀测定
使用表达KRAS野生型或突变G12V的RASless MEF(参见其他地方)或人NCI-H441肺腺癌肿瘤细胞和N-末端生物素化的pept-in进行细胞免疫共沉淀测定。细胞以300,000个细胞的密度接种在透明的6孔板(Cellstar,Greiner)中。接种后一天,用指定的pept-in以25μM的终浓度处理细胞,并孵育20小时。下一步,细胞用NP-40裂解缓冲液(150mM NaCl,50mMTris HCl pH8,1% IGEPAL(NP40),1xHalt磷酸酶/蛋白酶抑制剂(Thermo),1U/μl通用核酸酶(Pierce))裂解,并使用链霉亲和素包被磁珠(Pierce)在室温在1小时期间捕获生物素化pept-in。用NP40裂解缓冲液洗涤珠子至少3次,之后结合的蛋白在处于NP40裂解缓冲液中的1X SDS负载染料(Bio-Rad)中煮沸。使用Any kD 15孔Mini-PROTEAN凝胶(Bio-Rad)在SDS-PAGE期间解析蛋白,并在使用兔多克隆KRAS-特异性抗体(12063-1-AP,Proteintech)进行Western印迹后探测KRAS。
流式细胞术
NCI-H441细胞以175k个细胞/孔的密度接种在12孔板中。第二天,细胞用媒介物或12,5μM RAS靶向pept-ins或阴性对照pept-in处理。在处理6、16和24小时后,细胞用PBS洗涤,并使用TrypLE Express(Thermo Fisher)脱离。经洗涤的细胞下一步使用Sytox Blue(Thermo Fisher)和Amytracker Red(Ebba Biotech AB)染色,然后在Gallios流式细胞仪(Beckman Coulter)上对它们进行分析。
细胞荧光成像
使用用携带表达N-末端被mCherry标记的KRAS G12V的构建体的慢病毒粒子转导的HeLa细胞进行荧光细胞成像。将细胞接种在黑色
Figure BDA0003893144820001001
Figure BDA0003893144820001011
F-底96孔板(Greiner)中的100μL完全生长培养基中。一天后,细胞用指示的FITC-标记的pept-in在正常生长培养基中处理20分钟,之后洗去pept-in溶液并再次更换以正常生长培养基并再孵育2小时。下一步,将细胞固定、洗涤并用核染料NucBlueTM(含有Hoechst 33342)复染。在Leica共聚焦显微镜上俘获图像。
体内SW620异种移植物模型
雌性NCr nu/nu小鼠(8-12周)在后胁部皮下接种以处于50%基质胶中的1x106个SW620肿瘤细胞。细胞注射体积为0.1mL/小鼠。当肿瘤达到100-150mm3的平均大小时,进行配对,并进行治疗。未治疗组的组大小N=6,媒介物组N=5,pept-in和阳性对照组N=8。通过每周两次游标卡尺测量监测肿瘤生长。通过以100mg/kg每周一次腹膜内给药伊立替康持续3周来监测模型反应。
实施例1:RAS-特异性聚集分子(‘pept-in’)的设计
我们使用统计学热力学算法TANGO来鉴定人RAS家族蛋白(HRAS、NRAS和KRAS)的一级氨基酸序列中的聚集倾向区(APR)。此分析显示所有3个RAS家族成员具有相同的TANGO谱,它们各自携带5个长度为至少5个氨基酸的APR,其中2个APR的TANGO评分为至少20%(表3)。如表3中所指示的给定APR的起始位置(‘起点’)对应于RAS序列中在各个聚集倾向区本身前面的第一个N-末端门卫的位置,而在本说明书中其他地方,APR的起始位置可以被指定为不含N-末端门卫。因此,例如,在表3中RAS的N-末端大多数APR被表述为以RAS的1位处的M门卫开始,而在本说明书中其他地方,此APR可以表述为以2位处的T开始。此外,在表3中,‘N-GKs’表示在N-末端邻接RAS中的预期APR的天然门卫残基,‘C-GKs’表示在C-末端邻接RAS中的预期APR的天然门卫残基,‘APR seq’表示APR序列,‘评分’意指以%计的TANGO评分,以及‘长度’表示除任何门卫以外的APR长度(aa)。
表3.RAS家族蛋白的TANGO分析。
Figure BDA0003893144820001012
Figure BDA0003893144820001021
在人癌症中RAS家族成员中的激活突变是常见的并且经常是早期事件,已有报道所有人肿瘤中的多达三分之一携带RAS家族成员之一的错义突变。超过99%的这些突变发生在所谓的热点突变位置,这些热点突变位置在RAS家族成员之间也是共享的,位于密码子12、13和61处。有趣的是,密码子12位于APR的C-末端处,密码子13则定位在紧邻APR的C末端,因此在这些位置之一处的错义突变可能改变了聚集倾向性,而且改变了聚集过程的序列选择性(表3)。为了研究前者,我们分析了一组在密码子12或13处的流行突变(在所有KRAS突变癌症中>1%)如何改变所述序列的TANGO输出(表4)。在表4中,‘评分’意指以%计的TANGO评分,‘长度’表示除任何门卫以外的APR长度(aa),‘频率’表示基于COSMIC数据库以%计在所有KRAS突变癌症中特定的G12或G13突变的频率。
表4.常见的G12或G13位突变对TANGO分析的影响。
Figure BDA0003893144820001031
在G12位处最流行的突变是G12D。此突变引入了带负电荷的天冬氨酸,TANGO将其鉴定为门卫残基,产生稍短的APR,具有增加的TANGO评分。然而,第二最流行的突变G12V对APR的影响是最突出的,因为它不仅增加了APR序列的长度而且增加了APR序列的TANGO评分。其他流行的G12突变缩短或拉长APR序列,但并不显著地改变TANGO评分。G13D突变也是非常流行的并且增加APR的聚集倾向性,但不改变其序列。因此,有可能具有对应于野生型APR的段的pept-in可以与野生型RAS相比表现出下调G13D RAS的优先性。G13V对APR的影响也是非常突出的,因为它不仅增加了APR序列的长度还增加了TANGO评分。
基于这些数据,我们选择了RAS WT和G12V APR用于设计RAS WT或G12V-选择性pept-in,作为举例说明使用干扰子技术特异性靶向G12或G13突变人RAS的可行性的实施方案。
为此,基于APR的序列我们使用了滑动窗方式生成了所有可能的6-10聚体(在本实验中,由固相合成的长度容量得知了10个氨基酸的长度限值)。下一步,将得到的‘APR窗’针对全人蛋白组比对以排除在RAS家族成员以外的其他蛋白中具有精确匹配的序列,从而限制含有这些序列的pept-in的脱靶活性。此过滤步骤得到了38个APR窗,在我们的pept-in设计中进一步采用了这些APR窗。对于该设计,我们采用了以前设计的串联重复构型(参见WO2012/123419A1),其中APR窗重复一次,并且被接头隔开。对于初始筛选文库的设计,我们包括了具有GS和PP接头两者的变体。此外,为了增加这些聚集序列的胶体稳定性,引入了门卫残基侧接pept-in中APR窗的每个重复区。选择了两个带正电荷的(精氨酸(R)和赖氨酸(K))和一个带负电荷(天冬氨酸(D))的氨基酸,并在筛选文库中引入。在表5中给出了对所得到的具有不同门卫残基和接头的pept-in模板的概述。K-APR-KGSK-APR-K模板适用于所有APR窗,而其他模板适用于长度达8个氨基酸的所有APR窗。
表5.用于筛选的pept-in设计模板的概述。
门卫残基 接头 Pept-in布局
K GS K-APR-KGSK-APR-K
R GS R-APR-RGSR-APR-R
K PP K-APR-KPPK-APR-K
D PP D-APR-DPPD-APR-D
KK PP KK-APR-KPPK-APR-KK
使用固相合成生成设计的所有pept-in,然而对于少数序列合成或纯化不能满足质量标准(纯度>95%),因此我们从进一步分析中将它们剔除。将成功进行合成和纯化的Pept-in溶解在6M尿素中至5mM母液并测试它们的生物活性。
实施例2:对RAS靶向pept-in的活性筛选
为了评估pept-in对RAS-突变肿瘤细胞的活力的活性,我们使用了贴壁的NCI-H441肺腺癌细胞,其携带KRAS中的G12V突变。为了验证该细胞系的生长确实依赖KRAS,我们使用SAH-SOS-1A作为阳性对照。SAH-SOS-1A是一种肽类化合物,其设计基于来自son ofsevenless 1的稳定螺旋,son of sevenless 1是KRAS的典型鸟嘌呤交换因子(Leshchiner等人,Proc Natl Acad Sci U S A.2015,vol.112(6),1761-6)。用SAH-SOS-1A处理NCI-H441细胞导致在暴露4天后剂量依赖的活力下降,IC50为~15μM,这与对其他细胞系报道的值一致,并确定了NCI-H441细胞系的KRAS-依赖性。我们还检测了NCI-H441细胞的尿素耐受性,并且发现在暴露4天后多达60mM的尿素对活力没有显著影响。
Pept-in以25μM(对应于30mM尿素的终浓度)的单剂量进行筛选,在暴露2天和4天后使用CellTiter Blue试剂测量活力。在暴露4天后,与媒介物处理的细胞(30mM尿素;图1A)相比,测试的所有K-APR-KGSK-APR-K pept-in中的超过一半(~52%)诱导了活力至少25%的减少。对于测试的其他模板命中率和效力相当低。对于进一步的表征,为了选择有效的命中,我们选择了在暴露4天后显示活力减少至少75%的所有pept-in。此截止值导致选择了5个pept-in,全部具有K-APR-KGSK-APR-K模板:04-004-N001,04-006-N001,04-014-N001,04-015-N001和04-033-N001。这些pept-in中之一(04-004-N001)携带了衍生自RAS的另一个APR的APR窗序列,因此存在于G12突变和野生型RAS两者中,而其他四个pept-in(04-006-N001、04-014-N001、04-015-N001和04-033-N001)携带了衍生自G12V突变并含有G12V突变位点的APR窗序列。此外,我们选择了一个无生物活性的肽(04-016-N001)在后续测定中用作阴性对照。此pept-in携带了一个7聚体APR窗,它被设计为靶向RAS G12V但不能改变NCI-H441细胞的活力。
表6中显示了前述pept-in的序列。
Figure BDA0003893144820001061
如表6中所示的pept-in 04-004-N001的氨基酸序列指派为SEQ ID NO:69,而pept-in 04-006-N001、04-014-N001、04-015-N001和04-033-N001的氨基酸序列分别表示为SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19和SEQ ID NO:20,也在本说明书中其他地方给出。表6中的‘Ac’表示N-末端乙酰化,表6中的‘NH2’表示C-末端酰胺化。
这6个pept-in被再合成和纯化以在剂量响应中测试它们减小贴壁生长(‘2D活力测定’)的NCI-H441细胞活力的效力。为此,使用从作为最高剂量的50μM开始的二分之一稀释系列以5点剂量响应方式在贴壁生长的NCI-H441细胞上测试pept-in。在暴露于测试化合物后3天使用CellTiter Glo活力测定评估活力。此分析显示5个活性化合物全部显示约10μM的IC50(图2)。
由于以前的报道已经显示KRAS突变细胞系的贴壁生长可能减弱它们对KRAS抑制或敲低的敏感性(Fujita-Sato等人,Cancer Res.2015,vol.75,2851-62;Patricelli等人,Cancer Discov.2016,vol.6,316-29;Vartanian等人,J Biol Chem.2013,vol.288,2403-13),因此我们利用在相同细胞系的悬浮球形体培养物上的筛选补充了对贴壁生长的NCI-H441细胞的筛选。为此,将NCI-H441细胞接种在超低粘附性的圆底平板中,允许形成球形体。如关于贴壁筛选,我们采用了单剂量方式,使用了25μM的每种测试pept-in。在暴露5天后使用来自Promega的CellTiter Glo 3D试剂确定球形体培养物的活力。与上述的贴壁筛选相比,使用此方式的命中率相当低(图1B)。实际上,在贴壁设置中与媒介物处理的细胞相比,测试的所有K-APR-KGSK-APR-K pept-in中超过一半诱导了至少25%的活力减小,在球形体设置中此组pept-in中仅有17%减少超过25%的活力。此外,对于测试的其他模板命中率和效力也较低。值得注意的是,在此应用与贴壁筛选相同的有效命中选择标准,即,选择显示在暴露5天后活力减少至少75%的pept-in,结果选择了与在贴壁筛选中相同的pept-in,例外是04-014-N001,它在球形体设置中不显示活性。
下一步使用悬浮球形体方式来评估四种活性pept-in对较大组的KRAS突变体和野生型肿瘤细胞系的功效。显示对这些细胞系的中位IC50的每种pept-in的瀑布图显示在图3中。
下一步使用悬浮球形体方式来评估各种形式的含有备选的门卫和/或接头部分的04-004、004-006、04-015和04-033pept-in在NCI-H441肺腺癌细胞中的功效。在暴露于每种pept-in的剂量响应5天后,使用CellTiter Glo 3D测定(Promega)确定对细胞活力的IC50。pept-in和各自的IC50值列在下面的表7中(‘Ac’表示N-末端乙酰化;‘NH2’表示C-末端酰胺化;‘[Dap]’表示二氨基庚二酸;‘[Cit]’表示瓜氨酸;L-氨基酸使用大写字母编码显示;D-氨基酸由小字母编码显示):
表7.如本文公开的各种pept-in对细胞活力的IC50
Figure BDA0003893144820001071
Figure BDA0003893144820001081
表7显示了举例说明如本文所公开的pept-in的各个实施方案的分子已经证明了对细胞活力的有说服力的IC50值,诸如下述peptin-in:在它们的一个或多个门卫段内包含一个或多个D-赖氨酸(‘k’)、二氨基庚二酸(‘[Dap]’)、瓜氨酸(‘[Cit]’)或L-丙氨酸(‘A’);在它们的接头部分内包含一个或多个L-丙氨酸(‘A’)或L-苯丙氨酸(‘F’)、或一个或多个D-丝氨酸(‘s’)或甚至不包含任何接头部分;和/或完全由D-氨基酸和甘氨酸构成。这些pept-in证明了本方式的结构灵活性集中于靶向蛋白内的聚集倾向段。
实施例3:RAS靶向pept-in是有聚集倾向的并且在体内通过直接相互作用播种对RAS的聚集
为了研究RAS靶向pept-in的聚集行为,我们使用淀粉样蛋白聚集传感器染料硫黄素T(ThT)和五聚甲酰噻吩乙酸(p-FTAA)进行了动力学着色测定。利用两种染料所有四个代表性生物活性pept-in显示了明显的淀粉样蛋白聚集动力学,而无活性对照显示没有显著的ThT信号,且随着时间推移p-FTAA信号仅有轻微的增加(图4)。
为了显示说明性的生物活性pept-in确实能够靶向并播种它们的靶蛋白KRASG12V的聚集,我们利用不同的KRAS靶向pept-in的终末期聚集物或经超声处理的种子进行播种实验。为此,使pept-in在与着色动力学测定的相同时间框内进行聚集。然后将终末期样品与重组产生的KRAS G12V混合,并且使用ThT动力学地监测聚集。这种方式揭示了这些终末期pept-in聚集物对KRAS G12V的播种能力很小。然而,在通过超声作用破坏了成熟聚集物后,形成了强力的种子,它有效地诱导KRAS G12V的聚集(图5)。
为了表明RAS靶向pept-in与RAS蛋白直接相互作用,我们设置了体外翻译测定。实际上,由于可获得的结构数据表明在天然折叠中RAS APR可能不被暴露,我们假设pept-in与它们的靶标的初始相互作用发生在核糖体处,同时蛋白正在被翻译,并短暂地暴露这些APR。为了在体外模拟这种情况,我们设计了体外翻译设置,在生物素化RAS靶向pept-in的存在下产生野生型或突变KRAS(G12V、G12C、G12D或G13D)。这允许我们进行链霉亲和素沉降以从翻译反应中捕获生物素化pept-in,并进行SDS-PAGE和Western印迹以探测沉降级分中KRAS的存在。pept-in04-004-N001的生物素化形式,即04-004-N011,携带了衍生自野生型APR的APR窗序列,预期能靶向所有RAS蛋白,不依赖于它们的突变状态。而对KRAS野生型、G12V和G12C均观察到了利用04-004-N011的有效沉降,与G12D和G13D突变体的结合似乎是不太有效的。然而使用携带了包含G12V突变位点的APR窗的生物活性pept-in的生物素化形式(04-006-N007、04-015-N026和04-033-N003)仅对G12V突变KRAS观察到了显著的沉降,并且在04-015-N026的情况下,对G12C突变KRAS有显著的沉降(图6)。
总之,这些数据表明这些说明性的RAS靶向pept-in能够与RAS蛋白直接相互作用并播种RAS蛋白的聚集,所述RAS蛋白包含对存在于所述pept-in中的APR窗的精确匹配。
实施例4:在RASless MEF系统中的突变体选择性细胞功效
使用同基因RASless小鼠胚胎成纤维细胞(MEF)小组评估对细胞功效的RAS突变体-选择性。这些MEF衍生自NRAS-和HRAS-裸鼠,其中KRAS基因也已经被floxed处理(通过ER-Cre移除)。增殖依赖于内源性KRAS基因的表达,或——如果它已经通过他莫昔芬处理被移除——则依赖于所表达的转基因。所评估的小组包括表示为转基因的常见临床KRAS变体(WT、G12V和G12C)和增殖依赖于BRAF V600E的表达的附加细胞系。后者应当是KRAS靶向剂难治的,因为它们不表达任何RAS同种型且这些细胞的增殖专门依赖于突变BRAF(它是RAS的下游)。
在暴露5天后评估RAS靶向pept-in对作为球形体生长的MEF的功效。因为04-004-N001的靶向部分是衍生自野生型RAS序列的APR窗,因此预期它将靶向所有RAS-依赖性的生长,不依赖于突变状态。然而,令人惊奇地,与表达KRAS WT和G12C的MEF(其响应类似于表达BRAF V600E的RASless MEF)相比,对于表达KRAS G12V的MEF观察到04-004-N001的显著增加的功效。
对于靶向G12V的RAS pept-in,当评估表达G12V的RASless MEF时观察到最高的功效,表明突变体选择性结合至少部分地驱动这些pept-in所展现的对突变RAS的选择性,并且可能是所述选择性的主要贡献者。数据显示在图10中。
实施例5:RAS靶向pept-in与KRAS相互作用
为了评估RAS靶向pept-in是否也能够与细胞中的(突变)KRAS蛋白相互作用,我们设置了免疫共沉淀测定。
首先,我们使用表达KRAS野生型和突变G12V的RASless MEF来评估:(i)在细胞环境中RAS靶向pept-in是否结合KRAS蛋白以及(ii)任何结合是否显示出如在实施例4中所述的体外翻译测定中所观察到的类似的G12V突变体选择性。为此,相关的MEF细胞用25μM生物素化pept-in处理过夜(16小时)。下一步,将细胞裂解,使用链霉亲和素-包被珠从裂解物中免疫沉淀pept-in。下一步使用SDS PAGE解析沉淀级分,并使用Western印迹探测KRAS蛋白的存在。结果表明04-004-衍生的生物素化pept-in在处理各个RASless MEF细胞16小时后似乎沉淀野生型和突变G12V KRAS两者。然而,利用G12V-选择性pept-in的生物素化形式处理和沉淀显示优先与G12V突变KRAS蛋白结合(图11)。
下一步,我们评估RAS靶向pept-in是否在暴露于人肿瘤细胞后显示与KRAS结合。为此,KRAS G12V突变NCI-H441肺腺癌细胞用25μM生物素化pept-in处理过夜(16小时)。下一步,将细胞裂解,使用链霉亲和素-包被珠从裂解物中免疫沉淀pept-in。下一步使用SDSPAGE解析沉淀级分,并使用Western印迹探测KRAS蛋白的存在。尽管此方法在来自媒介物或阴性对照肽处理条件的沉淀级分中没有产生可检测到的KRAS蛋白,但KRAS蛋白在来自用生物活性pept-in处理的NCI-H441细胞的沉淀级分中很容易检测到(图7)。
为了补充免疫共沉淀方式,我们还使用了细胞成像方式来显示靶标接合。为此,我们产生了过表达mCherry-标记的KRAS G12V的HeLa细胞系和RAS靶向pept-in的FITC标记形式。对这些HeLa细胞的处理表明所有生物活性的RAS靶向pept-in的FITC标记形式很容易被细胞摄取,而对阴性对照pept-in 04-016-N001的FITC标记形式的摄取则检测不到,因此解释了缺少生物活性。此外,该分析表明在进入细胞后,RAS靶向pept-in04-015-N001的FITC标记形式(04-015-N032)迅速与mCherry-标记的KRAS缔合,如出现包涵体样核周结构所揭示,在用FITC-标记的pept-in处理后75分钟所述包涵体样核周结构是FITC以及mCherry两者阳性的(图8)。
实施例6:RAS靶向pept-in驱动其在细胞中的聚集和降解
为了评估利用RAS靶向pept-in处理肿瘤细胞是否在诱导细胞死亡前诱导蛋白聚集,设计了流式细胞术测定来平行监测细胞死亡和蛋白聚集。为此,NCI-H441细胞用接近IC50剂量的RAS靶向pept-in(12,5μM)或对照条件(媒介物和阴性对照pept-in)处理6、16或24小时。处理后,收集细胞并使用SytoxTM Blue染料对细胞死亡进行染色并使用AmytrackerTM Red染料对(淀粉样蛋白样)蛋白聚集物的存在进行染色。此分析表明对于媒介物和对照pept-in处理的细胞,在实验过程期间没有观察到显著的细胞死亡或蛋白聚集。然而,在用RAS靶向pept-in处理后,很容易检测到蛋白聚集,并且随时间推移而进展。此外,蛋白聚集的这种增加与细胞死亡的缓慢增加平行,细胞死亡似乎是继发于蛋白聚集的发生(图12)。
因为关于观察到的蛋白聚集是否在影响KRAS,上述的流式细胞术测定不能提供颗粒度,我们着手在溶解度分级测定中评估KRAS聚集。为此,NCI-H441细胞用接近IC50剂量(12,5μM)和接近2XIC50剂量(25μM)处理24小时。处理后,细胞用温和的非变性缓冲液裂解,不溶于此缓冲液中的蛋白通过离心沉淀。下一步使用强离液剂(即,6M尿素)溶解不溶的蛋白。使用这种方式,淀粉样蛋白(-样)聚集物期望最终在不溶性级分中消失。使用SDS PAGE解析可溶性和不溶性级分,并在随后的Western印迹中探测KRAS和GAPDH。此分析显示所有生物活性的RAS靶向肽剂量依赖地增加不溶性级分中KRAS的百分比,而媒介物和阴性对照肽处理的样品之间不溶性KRAS的百分比是相当的,表明pept-in处理确实导致了KRAS靶蛋白的聚集。为了补充这些发现,我们还定量了这些样品中的总KRAS水平(即,对于每种处理,可溶性和不溶性级分中的KRAS水平的总和)。对这些数据的分析表明在用生物活性的RAS靶向pept-in处理的样品中总KRAS水平也是剂量依赖性地减少的(图9)。
总之,这些数据显示:在细胞中,生物活性的RAS靶向pept-in也能够与它们预期的靶蛋白KRAS相互作用并诱导其聚集,如在用所述pept-in处理后不溶性KRAS蛋白增加所证明。此外,据推测,但对具体机制不施加任何限制,作为聚集的继发后果,在用活性pept-in处理后总KRAS水平也是减小的。
实施例7:RAS靶向pept-in减少KRAS G12V突变癌症的异种移植物模型中的肿瘤生长
为了评估RAS靶向pept-in是否能够在体内减缓KRAS G12V-驱动的肿瘤的生长,使用了人KRAS G12V结直肠癌(SW620)的皮下异种移植物模型。一旦肿瘤的大小达到100-150mm3,在两周期间以两种不同的剂量(20μg和200μg)通过肿瘤内注射每周三次将pept-in直接施用到肿瘤块中。从携带G12V-选择性RAS APR窗序列的pept-in的组(04-006-、04-015-和04-033-N001),04-015-N001诱导最强的肿瘤生长减少,如在开始治疗后第22天对于20μg和200μg两个给药组平均肿瘤体积均显著减小所证明。此外,对于携带野生型RAS APR窗序列的04-004-N001观察到肿瘤生长的类似减小,然而仅对于200μg给药组是显著的(图13)。
实施例8:靶向ITK R29L和R29C突变体的pept-in
ITK(酪氨酸蛋白激酶ITK/TSK,Swissprot/UniProt登录号Q08881,序列版本1)的单氨基酸置换突变体(R29L和R29C),与野生型ITK蛋白相比,包含因突变而变长的APR,并且还展示出增加的TANGO评分(参见下表,1-3行的序列分别表示为SEQ ID NO:29-31)。
突变 APR起始位置 N-ter GKs APR序列 C-ter GKs 评分(%) 长度(aa)
WT 29 KVR FFVLTKASLAYFE DRH 26,0231 13
R29L 27 NFK VLFFVLTKASLAYFE DRH 43,8347 15
R29C 27 NFK VCFFVLTKASLAYFE DRH 39,996 15
设计分别针对R29C和R29L ITK突变体的N-末端生物素化和C-末端酰胺化的22-006-N001 AKVCFFVKGSKVCFFVK(SEQ ID NO:32)和22-018-N001 AKVLFFVKGSKVLFFVK(SEQID NO:33)。突变的氨基酸在上述序列中以粗体显示。
利用体外翻译方法评估ITK突变体相较于野生型对22-006-N001和22-018-N001pept-in的选择性结合。具体地,使用
Figure BDA0003893144820001131
体外蛋白合成试剂盒(New EnglandBiolabs)按照制造商的使用说明进行体外翻译测定。简言之,使用PCR产生含有侧接DYKDDDDK(SEQ ID NO:68)-标记的ITK编码序列的T7启动子和终止子序列的线性DNA片段,并使用MinElute PCR纯化试剂盒(Qiagen)纯化。随后将250ng线性DNA用于体外翻译反应,在37℃和振摇(1000rpm)下进行体外翻译反应2小时。将所示生物素化pept-in在翻译反应中混合,从在6M尿素中的5mM母液至10μM的终浓度。一旦完成翻译反应,使用链霉亲和素包被的珠粒(Pierce)在室温在90分钟内捕获生物素化的pept-in。然后将珠粒用含有0,1%吐温20的TBS洗涤,并且所结合的蛋白最后在TBS缓冲液中的1X SDS负载染料(Bio-Rad)中煮沸。在SDS-PAGE期间使用Any kD 15-孔Mini-PROTEAN凝胶(Bio-Rad)解析蛋白,并在Western印迹后使用兔抗-DYKDDDDK(SEQ ID NO:68)标签抗体(Cell Signaling 14793)探测ITK。
图14的柱状图中的数据显示关于每种pept-in和靶标蛋白组合针对媒介物条件归一化所产生的总蛋白结合分数。对于分别针对ITK R29C和R29L的22-006-N001和22-018-N001两者,观察到相较于野生型针对突变体的选择性结合。
序列表
<110> 艾琳治疗公司(Aelin Therapeutics)
维伯VZW公司(VIB VZW)
勒芬天主教大学(Katholieke Universiteit Leuven, K.U. Leuven R&D)
<120> 靶向蛋白的分子
<130> AEL-007-PCT
<150> EP 20158310.1
<151> 2020-02-19
<160> 103
<170> PatentIn version 3.5
<210> 1
<211> 189
<212> PRT
<213> 智人(Homo sapiens)
<400> 1
Met Thr Glu Tyr Lys Leu Val Val Val Gly Ala Gly Gly Val Gly Lys
1 5 10 15
Ser Ala Leu Thr Ile Gln Leu Ile Gln Asn His Phe Val Asp Glu Tyr
20 25 30
Asp Pro Thr Ile Glu Asp Ser Tyr Arg Lys Gln Val Val Ile Asp Gly
35 40 45
Glu Thr Cys Leu Leu Asp Ile Leu Asp Thr Ala Gly Gln Glu Glu Tyr
50 55 60
Ser Ala Met Arg Asp Gln Tyr Met Arg Thr Gly Glu Gly Phe Leu Cys
65 70 75 80
Val Phe Ala Ile Asn Asn Thr Lys Ser Phe Glu Asp Ile His His Tyr
85 90 95
Arg Glu Gln Ile Lys Arg Val Lys Asp Ser Glu Asp Val Pro Met Val
100 105 110
Leu Val Gly Asn Lys Cys Asp Leu Pro Ser Arg Thr Val Asp Thr Lys
115 120 125
Gln Ala Gln Asp Leu Ala Arg Ser Tyr Gly Ile Pro Phe Ile Glu Thr
130 135 140
Ser Ala Lys Thr Arg Gln Arg Val Glu Asp Ala Phe Tyr Thr Leu Val
145 150 155 160
Arg Glu Ile Arg Gln Tyr Arg Leu Lys Lys Ile Ser Lys Glu Glu Lys
165 170 175
Thr Pro Gly Cys Val Lys Ile Lys Lys Cys Ile Ile Met
180 185
<210> 2
<211> 11
<212> PRT
<213> 智人
<400> 2
Thr Glu Tyr Lys Leu Val Val Val Gly Ala Gly
1 5 10
<210> 3
<211> 14
<212> PRT
<213> 智人
<400> 3
Thr Glu Tyr Lys Leu Val Val Val Gly Ala Val Gly Val Gly
1 5 10
<210> 4
<211> 13
<212> PRT
<213> 智人
<400> 4
Thr Glu Tyr Lys Leu Val Val Val Gly Ala Cys Gly Val
1 5 10
<210> 5
<211> 13
<212> PRT
<213> 智人
<400> 5
Thr Glu Tyr Lys Leu Val Val Val Gly Ala Ala Gly Val
1 5 10
<210> 6
<211> 12
<212> PRT
<213> 智人
<400> 6
Thr Glu Tyr Lys Leu Val Val Val Gly Ala Ser Gly
1 5 10
<210> 7
<211> 13
<212> PRT
<213> 智人
<400> 7
Thr Glu Tyr Lys Leu Val Val Val Gly Ala Gly Cys Val
1 5 10
<210> 8
<211> 14
<212> PRT
<213> 智人
<400> 8
Thr Glu Tyr Lys Leu Val Val Val Gly Ala Gly Val Val Gly
1 5 10
<210> 9
<211> 12
<212> PRT
<213> 智人
<400> 9
Thr Glu Tyr Lys Leu Val Val Val Gly Ala Gly Ser
1 5 10
<210> 10
<211> 10
<212> PRT
<213> 智人
<400> 10
Leu Val Val Val Gly Ala Val Gly Val Gly
1 5 10
<210> 11
<211> 9
<212> PRT
<213> 智人
<400> 11
Leu Val Val Val Gly Ala Cys Gly Val
1 5
<210> 12
<211> 9
<212> PRT
<213> 智人
<400> 12
Leu Val Val Val Gly Ala Ala Gly Val
1 5
<210> 13
<211> 8
<212> PRT
<213> 智人
<400> 13
Leu Val Val Val Gly Ala Ser Gly
1 5
<210> 14
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 接头
<400> 14
Leu Val Val Val Gly Ala Gly Cys Val
1 5
<210> 15
<211> 10
<212> PRT
<213> 智人
<400> 15
Leu Val Val Val Gly Ala Gly Val Val Gly
1 5 10
<210> 16
<211> 8
<212> PRT
<213> 智人
<400> 16
Leu Val Val Val Gly Ala Gly Ser
1 5
<210> 17
<211> 18
<212> PRT
<213> 人工序列
<220>
<223> RAS pept-in
<400> 17
Lys Val Val Val Gly Ala Val Lys Gly Ser Lys Val Val Val Gly Ala
1 5 10 15
Val Lys
<210> 18
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> RAS pept-in
<400> 18
Lys Leu Val Val Val Gly Ala Val Lys Gly Ser Lys Leu Val Val Val
1 5 10 15
Gly Ala Val Lys
20
<210> 19
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> RAS pept-in
<400> 19
Lys Val Val Val Gly Ala Val Gly Lys Gly Ser Lys Val Val Val Gly
1 5 10 15
Ala Val Gly Lys
20
<210> 20
<211> 24
<212> PRT
<213> 人工序列
<220>
<223> RAS pept-in
<400> 20
Lys Val Val Val Gly Ala Val Gly Val Gly Lys Gly Ser Lys Val Val
1 5 10 15
Val Gly Ala Val Gly Val Gly Lys
20
<210> 21
<211> 7
<212> PRT
<213> 智人
<400> 21
Val Leu Thr Ser Gly Ile Phe
1 5
<210> 22
<211> 8
<212> PRT
<213> 智人
<400> 22
Cys Val Leu Thr Ser Gly Ile Phe
1 5
<210> 23
<211> 9
<212> PRT
<213> 智人
<400> 23
Cys Leu Val Leu Thr Ser Gly Ile Phe
1 5
<210> 24
<211> 11
<212> PRT
<213> 智人
<400> 24
Tyr Ile Val Gly Phe Tyr Gly Ala Phe Tyr Ser
1 5 10
<210> 25
<211> 13
<212> PRT
<213> 智人
<400> 25
Ser Leu Tyr Ile Val Gly Phe Tyr Gly Ala Phe Tyr Ser
1 5 10
<210> 26
<211> 7
<212> PRT
<213> 智人
<400> 26
Ile Leu Gly Gly Thr Val Phe
1 5
<210> 27
<211> 11
<212> PRT
<213> 智人
<400> 27
Thr Ile Leu Asn Ile Leu Gly Gly Thr Val Phe
1 5 10
<210> 28
<211> 11
<212> PRT
<213> 智人
<400> 28
Thr Ile Trp Asn Ile Leu Gly Gly Thr Val Phe
1 5 10
<210> 29
<211> 13
<212> PRT
<213> 智人
<400> 29
Phe Phe Val Leu Thr Lys Ala Ser Leu Ala Tyr Phe Glu
1 5 10
<210> 30
<211> 15
<212> PRT
<213> 智人
<400> 30
Val Leu Phe Phe Val Leu Thr Lys Ala Ser Leu Ala Tyr Phe Glu
1 5 10 15
<210> 31
<211> 15
<212> PRT
<213> 智人
<400> 31
Val Cys Phe Phe Val Leu Thr Lys Ala Ser Leu Ala Tyr Phe Glu
1 5 10 15
<210> 32
<211> 17
<212> PRT
<213> 人工序列
<220>
<223> ITK pept-in
<400> 32
Ala Lys Val Cys Phe Phe Val Lys Gly Ser Lys Val Cys Phe Phe Val
1 5 10 15
Lys
<210> 33
<211> 17
<212> PRT
<213> 人工序列
<220>
<223> ITK pept-in
<400> 33
Ala Lys Val Leu Phe Phe Val Lys Gly Ser Lys Val Leu Phe Phe Val
1 5 10 15
Lys
<210> 34
<211> 5
<212> PRT
<213> 智人
<400> 34
Phe Ala Thr Val Val
1 5
<210> 35
<211> 5
<212> PRT
<213> 智人
<400> 35
Phe Val Thr Val Val
1 5
<210> 36
<211> 5
<212> PRT
<213> 智人
<400> 36
Phe Gly Thr Val Val
1 5
<210> 37
<211> 8
<212> PRT
<213> 智人
<400> 37
Tyr Thr Phe Gly Val Ser Cys Val
1 5
<210> 38
<211> 6
<212> PRT
<213> 智人
<400> 38
Ser Phe Val Thr Val Tyr
1 5
<210> 39
<211> 6
<212> PRT
<213> 智人
<400> 39
Ser Phe Leu Thr Val Tyr
1 5
<210> 40
<211> 7
<212> PRT
<213> 智人
<400> 40
Ala Leu Thr Ile Gln Leu Ile
1 5
<210> 41
<211> 9
<212> PRT
<213> 智人
<400> 41
Gly Phe Leu Cys Val Phe Ala Ile Asn
1 5
<210> 42
<211> 5
<212> PRT
<213> 智人
<400> 42
Met Val Leu Val Gly
1 5
<210> 43
<211> 6
<212> PRT
<213> 智人
<400> 43
Ala Phe Tyr Thr Leu Val
1 5
<210> 44
<211> 10
<212> PRT
<213> 智人
<400> 44
Thr Glu Tyr Lys Leu Val Val Val Gly Ala
1 5 10
<210> 45
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 门卫区
<400> 45
Lys Lys Lys Lys
1
<210> 46
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 门卫区
<400> 46
Arg Arg Arg Arg
1
<210> 47
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 门卫区
<400> 47
Asp Asp Asp Asp
1
<210> 48
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 门卫区
<400> 48
Glu Glu Glu Glu
1
<210> 49
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 门卫区
<400> 49
Lys Arg Lys Arg
1
<210> 50
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 门卫区
<400> 50
Lys Arg Arg Lys
1
<210> 51
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 门卫区
<400> 51
Arg Lys Lys Arg
1
<210> 52
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 门卫区
<400> 52
Asp Glu Asp Glu
1
<210> 53
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 门卫区
<400> 53
Asp Glu Glu Asp
1
<210> 54
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 门卫区
<400> 54
Glu Asp Asp Glu
1
<210> 55
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 接头
<400> 55
Gly Gly Gly Gly
1
<210> 56
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 接头
<400> 56
Ser Ser Ser Ser
1
<210> 57
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 接头
<400> 57
Gly Gly Gly Ser
1
<210> 58
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 接头
<400> 58
Gly Gly Ser Gly
1
<210> 59
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 接头
<400> 59
Gly Ser Gly Gly
1
<210> 60
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 接头
<400> 60
Ser Gly Gly Gly
1
<210> 61
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 接头
<400> 61
Gly Gly Ser Ser
1
<210> 62
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 接头
<400> 62
Gly Ser Ser Gly
1
<210> 63
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 接头
<400> 63
Ser Ser Gly Gly
1
<210> 64
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 接头
<400> 64
Ser Gly Ser Gly
1
<210> 65
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> 接头
<400> 65
Gly Ser Gly Ser Gly
1 5
<210> 66
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> 接头
<400> 66
Ser Gly Ser Gly Ser
1 5
<210> 67
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 接头
<400> 67
Pro Pro Pro Pro
1
<210> 68
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> FLAG标签
<400> 68
Asp Tyr Lys Asp Asp Asp Asp Lys
1 5
<210> 69
<211> 18
<212> PRT
<213> 人工序列
<220>
<223> RAS靶向分子
<400> 69
Lys Leu Ser Val Phe Ala Ile Lys Gly Ser Lys Leu Ser Val Phe Ala
1 5 10 15
Ile Lys
<210> 70
<211> 4
<212> PRT
<213> 智人
<400> 70
Gly Ser Gly Ser
1
<210> 71
<211> 6
<212> PRT
<213> 智人
<400> 71
Leu Ser Val Phe Ala Ile
1 5
<210> 72
<211> 6
<212> PRT
<213> 智人
<400> 72
Val Val Val Gly Ala Val
1 5
<210> 73
<211> 7
<212> PRT
<213> 智人
<400> 73
Val Val Val Gly Ala Val Gly
1 5
<210> 74
<211> 7
<212> PRT
<213> 智人
<400> 74
Val Val Val Gly Ala Val Gly
1 5
<210> 75
<211> 18
<212> PRT
<213> 人工序列
<220>
<223> RAS pept-in
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> D-赖氨酸
<220>
<221> MISC_FEATURE
<222> (18)..(18)
<223> D-赖氨酸
<400> 75
Xaa Leu Ser Val Phe Ala Ile Lys Gly Ser Lys Leu Ser Val Phe Ala
1 5 10 15
Ile Xaa
<210> 76
<211> 18
<212> PRT
<213> 人工序列
<220>
<223> RAS pept-in
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> D-赖氨酸
<220>
<221> MISC_FEATURE
<222> (18)..(18)
<223> D-赖氨酸
<400> 76
Xaa Val Val Val Gly Ala Val Lys Gly Ser Lys Val Val Val Gly Ala
1 5 10 15
Val Xaa
<210> 77
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> RAS pept-in
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> D-赖氨酸
<220>
<221> MISC_FEATURE
<222> (20)..(20)
<223> D-赖氨酸
<400> 77
Xaa Val Val Val Gly Ala Val Gly Lys Gly Ser Lys Val Val Val Gly
1 5 10 15
Ala Val Gly Xaa
20
<210> 78
<211> 24
<212> PRT
<213> 人工序列
<220>
<223> RAS pept-in
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> D-赖氨酸
<220>
<221> MISC_FEATURE
<222> (24)..(24)
<223> D-赖氨酸
<400> 78
Xaa Val Val Val Gly Ala Val Gly Val Gly Lys Gly Ser Lys Val Val
1 5 10 15
Val Gly Ala Val Gly Val Gly Xaa
20
<210> 79
<211> 18
<212> PRT
<213> 人工序列
<220>
<223> RAS pept-in
<220>
<221> MOD_RES
<222> (1)..(1)
<223> Dpm
<220>
<221> MOD_RES
<222> (18)..(18)
<223> Dpm
<400> 79
Xaa Leu Ser Val Phe Ala Ile Lys Gly Ser Lys Leu Ser Val Phe Ala
1 5 10 15
Ile Xaa
<210> 80
<211> 18
<212> PRT
<213> 人工序列
<220>
<223> RAS pept-in
<220>
<221> MOD_RES
<222> (1)..(1)
<223> Dpm
<220>
<221> MOD_RES
<222> (18)..(18)
<223> Dpm
<400> 80
Xaa Val Val Val Gly Ala Val Lys Gly Ser Lys Val Val Val Gly Ala
1 5 10 15
Val Xaa
<210> 81
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> RAS pept-in
<220>
<221> MOD_RES
<222> (1)..(1)
<223> Dpm
<220>
<221> MOD_RES
<222> (20)..(20)
<223> Dpm
<400> 81
Xaa Val Val Val Gly Ala Val Gly Lys Gly Ser Lys Val Val Val Gly
1 5 10 15
Ala Val Gly Xaa
20
<210> 82
<211> 24
<212> PRT
<213> 人工序列
<220>
<223> RAS pept-in
<220>
<221> MOD_RES
<222> (1)..(1)
<223> Dpm
<220>
<221> MOD_RES
<222> (24)..(24)
<223> Dpm
<400> 82
Xaa Val Val Val Gly Ala Val Gly Val Gly Lys Gly Ser Lys Val Val
1 5 10 15
Val Gly Ala Val Gly Val Gly Xaa
20
<210> 83
<211> 18
<212> PRT
<213> 人工序列
<220>
<223> RAS pept-in
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> 瓜氨酸
<400> 83
Xaa Val Val Val Gly Ala Val Lys Gly Ser Lys Val Val Val Gly Ala
1 5 10 15
Val Lys
<210> 84
<211> 17
<212> PRT
<213> 人工序列
<220>
<223> RAS pept-in
<220>
<221> MISC_FEATURE
<222> (8)..(8)
<223> 瓜氨酸
<400> 84
Lys Val Val Val Gly Ala Val Gly Ser Lys Val Val Val Gly Ala Val
1 5 10 15
Lys
<210> 85
<211> 18
<212> PRT
<213> 人工序列
<220>
<223> RAS pept-in
<400> 85
Ala Val Val Val Gly Ala Val Lys Gly Ser Lys Val Val Val Gly Ala
1 5 10 15
Val Lys
<210> 86
<211> 18
<212> PRT
<213> 人工序列
<220>
<223> RAS pept-in
<400> 86
Lys Val Val Val Gly Ala Val Ala Gly Ser Lys Val Val Val Gly Ala
1 5 10 15
Val Lys
<210> 87
<211> 18
<212> PRT
<213> 人工序列
<220>
<223> RAS pept-in
<400> 87
Lys Val Val Val Gly Ala Val Lys Gly Ser Ala Val Val Val Gly Ala
1 5 10 15
Val Lys
<210> 88
<211> 18
<212> PRT
<213> 人工序列
<220>
<223> RAS pept-in
<400> 88
Lys Val Val Val Gly Ala Val Lys Gly Ser Lys Val Val Val Gly Ala
1 5 10 15
Val Ala
<210> 89
<211> 18
<212> PRT
<213> 人工序列
<220>
<223> RAS pept-in
<400> 89
Ala Val Val Val Gly Ala Val Lys Gly Ser Ala Val Val Val Gly Ala
1 5 10 15
Val Lys
<210> 90
<211> 18
<212> PRT
<213> 人工序列
<220>
<223> RAS pept-in
<400> 90
Lys Val Val Val Gly Ala Val Ala Gly Ser Lys Val Val Val Gly Ala
1 5 10 15
Val Ala
<210> 91
<211> 18
<212> PRT
<213> 人工序列
<220>
<223> RAS pept-in
<400> 91
Ala Val Val Val Gly Ala Val Ala Gly Ser Lys Val Val Val Gly Ala
1 5 10 15
Val Lys
<210> 92
<211> 18
<212> PRT
<213> 人工序列
<220>
<223> RAS pept-in
<400> 92
Lys Val Val Val Gly Ala Val Lys Ala Ser Lys Val Val Val Gly Ala
1 5 10 15
Val Lys
<210> 93
<211> 18
<212> PRT
<213> 人工序列
<220>
<223> RAS pept-in
<400> 93
Lys Val Val Val Gly Ala Val Lys Gly Ala Lys Val Val Val Gly Ala
1 5 10 15
Val Lys
<210> 94
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> RAS pept-in
<400> 94
Lys Val Val Val Gly Ala Val Gly Lys Gly Phe Lys Val Val Val Gly
1 5 10 15
Ala Val Gly Lys
20
<210> 95
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> RAS pept-in
<400> 95
Lys Val Val Val Gly Ala Val Gly Lys Phe Phe Lys Val Val Val Gly
1 5 10 15
Ala Val Gly Lys
20
<210> 96
<211> 16
<212> PRT
<213> 人工序列
<220>
<223> RAS pept-in
<400> 96
Lys Leu Ser Val Phe Ala Ile Lys Lys Leu Ser Val Phe Ala Ile Lys
1 5 10 15
<210> 97
<211> 22
<212> PRT
<213> 人工序列
<220>
<223> RAS pept-in
<400> 97
Lys Val Val Val Gly Ala Val Gly Val Gly Lys Lys Val Val Val Gly
1 5 10 15
Ala Val Gly Val Gly Lys
20
<210> 98
<211> 18
<212> PRT
<213> 人工序列
<220>
<223> RAS pept-in
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> D-赖氨酸
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> D-亮氨酸
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> D-丝氨酸
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> D-缬氨酸
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> D-苯丙氨酸
<220>
<221> MISC_FEATURE
<222> (6)..(6)
<223> D-丙氨酸
<220>
<221> MISC_FEATURE
<222> (7)..(7)
<223> D-异亮氨酸
<220>
<221> MISC_FEATURE
<222> (8)..(8)
<223> D-赖氨酸
<220>
<221> MISC_FEATURE
<222> (10)..(10)
<223> D-丝氨酸
<220>
<221> MISC_FEATURE
<222> (11)..(11)
<223> D-赖氨酸
<220>
<221> MISC_FEATURE
<222> (12)..(12)
<223> D-亮氨酸
<220>
<221> MISC_FEATURE
<222> (13)..(13)
<223> D-丝氨酸
<220>
<221> MISC_FEATURE
<222> (14)..(14)
<223> D-缬氨酸
<220>
<221> MISC_FEATURE
<222> (15)..(15)
<223> D-苯丙氨酸
<220>
<221> MISC_FEATURE
<222> (16)..(16)
<223> D-丙氨酸
<220>
<221> MISC_FEATURE
<222> (17)..(17)
<223> D-异亮氨酸
<220>
<221> MISC_FEATURE
<222> (18)..(18)
<223> D-赖氨酸
<400> 98
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Gly Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa
<210> 99
<211> 18
<212> PRT
<213> 人工序列
<220>
<223> RAS pept-in
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> D-赖氨酸
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> D-缬氨酸
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> D-缬氨酸
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> D-缬氨酸
<220>
<221> MISC_FEATURE
<222> (6)..(6)
<223> D-丙氨酸
<220>
<221> MISC_FEATURE
<222> (7)..(7)
<223> D-缬氨酸
<220>
<221> MISC_FEATURE
<222> (8)..(8)
<223> D-赖氨酸
<220>
<221> MISC_FEATURE
<222> (10)..(10)
<223> D-丝氨酸
<220>
<221> MISC_FEATURE
<222> (11)..(11)
<223> D-赖氨酸
<220>
<221> MISC_FEATURE
<222> (12)..(12)
<223> D-缬氨酸
<220>
<221> MISC_FEATURE
<222> (13)..(13)
<223> D-缬氨酸
<220>
<221> MISC_FEATURE
<222> (14)..(14)
<223> D-缬氨酸
<220>
<221> MISC_FEATURE
<222> (16)..(16)
<223> D-丙氨酸
<220>
<221> MISC_FEATURE
<222> (17)..(17)
<223> D-缬氨酸
<220>
<221> MISC_FEATURE
<222> (18)..(18)
<223> D-赖氨酸
<400> 99
Xaa Xaa Xaa Xaa Gly Xaa Xaa Xaa Gly Xaa Xaa Xaa Xaa Xaa Gly Xaa
1 5 10 15
Xaa Xaa
<210> 100
<211> 24
<212> PRT
<213> 人工序列
<220>
<223> RAS pept-in
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> D-赖氨酸
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> D-缬氨酸
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> D-缬氨酸
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> D-缬氨酸
<220>
<221> MISC_FEATURE
<222> (6)..(6)
<223> D-丙氨酸
<220>
<221> MISC_FEATURE
<222> (7)..(7)
<223> D-缬氨酸
<220>
<221> MISC_FEATURE
<222> (9)..(9)
<223> D-缬氨酸
<220>
<221> MISC_FEATURE
<222> (11)..(11)
<223> D-赖氨酸
<220>
<221> MISC_FEATURE
<222> (13)..(13)
<223> D-丝氨酸
<220>
<221> MISC_FEATURE
<222> (14)..(14)
<223> D-赖氨酸
<220>
<221> MISC_FEATURE
<222> (15)..(15)
<223> D-缬氨酸
<220>
<221> MISC_FEATURE
<222> (16)..(16)
<223> D-缬氨酸
<220>
<221> MISC_FEATURE
<222> (17)..(17)
<223> D-缬氨酸
<220>
<221> MISC_FEATURE
<222> (19)..(19)
<223> D-丙氨酸
<220>
<221> MISC_FEATURE
<222> (20)..(20)
<223> D-缬氨酸
<220>
<221> MISC_FEATURE
<222> (22)..(22)
<223> D-缬氨酸
<220>
<221> MISC_FEATURE
<222> (24)..(24)
<223> D-赖氨酸
<400> 100
Xaa Xaa Xaa Xaa Gly Xaa Xaa Gly Xaa Gly Xaa Gly Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Gly Xaa Xaa Gly Xaa Gly Xaa
20
<210> 101
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> 肽
<400> 101
Lys Leu Val Val Val Gly Ala Val Gly Val
1 5 10
<210> 102
<211> 17
<212> PRT
<213> 人工序列
<220>
<223> 肽
<400> 102
Lys Leu Val Val Val Gly Ala Val Gly Val Gly Lys Ser Ala Leu Thr
1 5 10 15
Ile
<210> 103
<211> 13
<212> PRT
<213> 人工序列
<220>
<223> 肽
<400> 103
Lys Leu Val Val Val Gly Ala Val Gly Val Gly Lys Ser
1 5 10

Claims (26)

1.一种非天然存在的分子,所述分子能够下调蛋白的突变或变异形式的量或生物活性,其中:
a)所述蛋白包含β-聚集倾向区(APR)并且所述APR被所述蛋白的突变或变异形式中的突变或变异修饰;或
b)所述突变或变异在所述蛋白的突变或变异形式中引入在所述蛋白中不存在的重新形成的APR;
并且其中所述分子被构造成特异性地靶向所述蛋白的突变或变异形式中的APR。
2.根据权利要求1所述的分子,其中所述分子被构造成与所述蛋白的突变或变异形式中的APR形成分子间β-片层但基本上不与所述蛋白中的APR形成分子间β-片层。
3.根据权利要求1或2所述的分子,其中所述分子间β-片层涉及在所述蛋白的突变或变异形式与所述蛋白之间不同的一个或多个氨基酸。
4.根据权利要求1-3中任一项所述的分子,其中所述蛋白的突变或变异形式中的APR与所述蛋白的APR在氨基酸序列或聚集倾向性方面有差异,优选在氨基酸序列方面有差异,更优选在氨基酸序列和聚集倾向性方面有差异。
5.根据权利要求4所述的分子,其中所述蛋白的突变或变异形式中的APR的聚集倾向性高于所述蛋白中的APR的聚集倾向性。
6.根据权利要求4或5所述的分子,其中:
a)所述蛋白的突变或变异形式中的APR与所述蛋白中的APR相比具有较高比例的疏水性氨基酸;
b)所述蛋白的突变或变异形式中的APR与所述蛋白中的APR相比具有较低比例的表现出低β-片层形成潜力或破坏β-片层的倾向性的氨基酸;
c)所述蛋白的突变或变异形式中的APR与所述蛋白的APR相比具有较低比例的带电荷氨基酸;和/或
d)所述蛋白的突变或变异形式中的APR比所述蛋白中的APR长至少一个氨基酸,诸如长两个、三个或四个氨基酸。
7.根据权利要求4-6中任一项所述的分子,其中:
a)所述蛋白的突变或变异形式中的所述突变或变异修饰所述蛋白中的APR内的一个或多个氨基酸,所述修饰诸如置换、缺失或添加;
b)所述蛋白的突变或变异形式中的所述突变或变异修饰在N-末端邻接所述蛋白中的APR的1-10个连续氨基酸、优选1-4个连续氨基酸的区域内的一个或多个氨基酸,所述修饰诸如置换、缺失或添加,优选其中所述区域的至少一个氨基酸成为所述蛋白的突变或变异形式中的APR的一部分;和/或
c)所述蛋白的突变或变异形式中的所述突变或变异修饰在C-末端邻接所述蛋白中的APR的1-10个连续氨基酸、优选1-4个连续氨基酸的区域内的一个或多个氨基酸,所述修饰诸如置换、缺失或添加,优选其中所述区域的至少一个氨基酸成为所述蛋白的突变或变异形式中的APR的一部分。
8.根据权利要求7所述的分子,其中在N-末端或C-末端邻接所述蛋白的APR的所述区域中的所述突变或变异:
a)增加所述区域中的疏水性氨基酸的比例;
b)减少表现出低β-片层形成潜力或破坏β-片层的倾向性的氨基酸的比例;和/或
c)减少所述区域中带电荷氨基酸的比例。
9.根据权利要求1-8中任一项所述的分子,其中所述分子能够降低所述蛋白的突变或变异形式的溶解度或诱导所述蛋白的突变或变异形式的聚集或包涵体形成。
10.根据权利要求2-9中任一项所述的分子,其中所述分子包含氨基酸段,优选至少6个连续氨基酸的段,诸如6-10个连续氨基酸的段,所述氨基酸段参与与所述蛋白的突变或变异形式中的APR的分子间β-片层。
11.根据权利要求10所述的分子,其中被所述分子包含的所述段对应于所述蛋白的突变或变异形式中的APR所包含的氨基酸段,优选至少6个连续氨基酸的段,诸如6-10个连续氨基酸的段,优选其中:
a)所述分子包含的段的氨基酸序列与所述APR所包含的段相同;
b)所述分子包含的段的氨基酸序列与所述APR所包含的段的氨基酸序列至少80%相同;
c)所述分子包含的段的氨基酸序列与所述APR所包含的段的氨基酸序列的差别为至多3个、优选至多2个、且更优选至多1个氨基酸置换;
d)所述分子包含的段的氨基酸序列表现出如a)至c)中任一项所示的与所述APR所包含的段的氨基酸序列的序列同一性程度,并且所述分子段的全部氨基酸均为L-氨基酸;
e)所述分子包含的段的氨基酸序列表现出如a)至c)中任一项所示的与所述APR所包含的段的氨基酸序列的序列同一性程度,并且前者的段的至少一个氨基酸为D-氨基酸;
f)所述分子包含的段的氨基酸序列表现出如a)至c)中任一项所示的与所述APR所包含的段的氨基酸序列的序列同一性程度,并且前者的段的至少一个氨基酸被各个氨基酸的类似物替换;或
g)所述分子包含的段的氨基酸序列表现出如a)至c)中任一项所示的与所述APR所包含的段的氨基酸序列的序列同一性程度,并且前者的段的至少一个氨基酸为D-氨基酸并且前者的段的至少一个氨基酸被各个氨基酸的类似物替换。
12.根据权利要求10或11所述的分子,其中所述分子包含两个或更多个、优选两个所述氨基酸段,所述氨基酸段相同或不同。
13.根据权利要求10-12中任一项所述的分子,其中一个或多个氨基酸段各自独立地在每个末端独立地侧接一个或多个表现出低β-片层形成潜力或破坏β-片层的倾向性的氨基酸。
14.根据权利要求10-13中任一项所述的分子,其中所述分子包含下列结构,基本上由下列结构组成或由下列结构组成:
a)NGK1-P1-CGK1,
b)NGK1-P1-CGK1-Z1-NGK2-P2-CGK2,
c)NGK1-P1-CGK1-Z1-NGK2-P2-CGK2-Z2-NGK3-P3-CGK3,或
d)NGK1-P1-CGK1-Z1-NGK2-P2-CGK2-Z2-NGK3-P3-CGK3-Z3-NGK4-P4-CGK4,
其中:
P1至P4各自独立地表示如权利要求10-13中任一项所定义的氨基酸段,
NGK1至NGK4以及CGK1至CGK4各自独立地表示1-4个表现出低β-片层形成潜力或破坏β-片层的倾向性的连续氨基酸,诸如1-4个选自由R、K、D、E、P、N、S、H、G、Q和A、其D-异构体和/或类似物、及其组合组成的组的连续氨基酸,优选1-4个选自由R、K、D、E、P、N、S、H、G和Q、其D-异构体和/或类似物、及其组合组成的组的连续氨基酸,更优选1-4个选自由R、K、D、E和P、其D-异构体和/或类似物、及其组合组成的组的连续氨基酸,以及
Z1至Z3各自独立地表示直接键或优选接头。
15.根据权利要求1-14中任一项所述的分子,其中所述突变或变异是生殖系或体细胞突变或变异。
16.根据权利要求1-15中任一项所述的分子,其中所述蛋白的突变或变异形式是疾病的病因或与疾病相关。
17.根据权利要求16所述的分子,其中所述疾病是肿瘤性疾病,特别是癌症。
18.根据权利要求17所述的分子,其中所述蛋白是原癌基因,并且所述蛋白的突变或变异形式是癌基因。
19.根据权利要求16-18中任一项所述的分子,其用于医药用途,特别用于治疗由所述蛋白的突变或变异形式引起或与所述蛋白的突变或变异形式相关的疾病的方法;或
编码权利要求16-18中任一项所述的分子的核酸,其中所述分子是多肽,所述核酸用于医药用途,特别用于治疗由所述蛋白的突变或变异形式引起或与所述蛋白的突变或变异形式相关的疾病的方法。
20.根据权利要求17或18所述的分子,其用于治疗由所述蛋白的突变或变异形式引起或与所述蛋白的突变或变异形式相关的肿瘤性疾病的方法;或
编码权利要求17或18所述的分子的核酸,其中所述分子是多肽,所述核酸用于治疗由所述蛋白的突变或变异形式引起或与所述蛋白的突变或变异形式相关的肿瘤性疾病的方法。
21.一种药物组合物,包含:
权利要求1-18中任一项所述的分子;或
编码权利要求1-18中任一项所述的分子的核酸,其中所述分子是多肽。
22.一种在表达、优选内源性表达蛋白的突变或变异形式的细胞中下调所述蛋白的突变或变异形式的量或生物活性的体外方法,所述方法包括使所述细胞接触能够下调所述蛋白的突变或变异形式的量或生物活性的非天然存在的分子,其中:
a)所述蛋白包含β-聚集倾向区(APR)并且所述APR被所述蛋白的突变或变异形式中的所述突变或变异修饰;或
b)所述突变或变异在所述蛋白的突变或变异形式中引入在所述蛋白中不存在的重新形成的APR;
并且其中所述分子被构造成特异性地靶向所述蛋白的突变或变异形式中的APR;或
包括使所述细胞接触编码所述分子的核酸,其中所述分子是多肽。
23.一种在表达、优选内源性表达蛋白的突变或变异形式的生物体中下调所述蛋白的突变或变异形式的量或生物活性的方法,所述方法包括向所述生物体施用能够下调所述蛋白的突变或变异形式的量或生物学活性的非天然存在的分子,其中:
a)所述蛋白包含β-聚集倾向区(APR)并且所述APR被所述蛋白的突变或变异形式中的所述突变或变异修饰;或
b)所述突变或变异在所述蛋白的突变或变异形式中引入在所述蛋白中不存在的重新形成的APR;
并且其中所述分子被构造成特异性地靶向所述蛋白的突变或变异形式中的APR;或
包括使细胞接触编码所述分子的核酸,其中所述分子是多肽。
24.根据权利要求22或23中任一项所述的方法,其中所述分子如权利要求1-14中任一项所定义。
25.根据权利要求22或24中任一项所述的方法,其中所述细胞是细菌细胞、真菌细胞、原生生物细胞、植物细胞或动物细胞,所述真菌细胞包括酵母细胞或霉菌细胞,所述动物细胞包括非人哺乳动物细胞或人细胞。
26.根据权利要求23或24中任一项所述的方法,其中所述生物体是细菌、真菌、植物或动物,所述真菌包括酵母或霉菌。
CN202180029055.3A 2020-02-19 2021-02-19 靶向蛋白的分子 Pending CN115484971A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP20158310 2020-02-19
EP20158310.1 2020-02-19
PCT/EP2021/054121 WO2021165453A1 (en) 2020-02-19 2021-02-19 Molecules targeting proteins

Publications (1)

Publication Number Publication Date
CN115484971A true CN115484971A (zh) 2022-12-16

Family

ID=69726431

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180029055.3A Pending CN115484971A (zh) 2020-02-19 2021-02-19 靶向蛋白的分子

Country Status (9)

Country Link
US (1) US20230287046A1 (zh)
EP (1) EP4106786A1 (zh)
JP (1) JP2023515124A (zh)
KR (1) KR20220143730A (zh)
CN (1) CN115484971A (zh)
AU (1) AU2021223703A1 (zh)
CA (1) CA3177489A1 (zh)
IL (1) IL295624A (zh)
WO (1) WO2021165453A1 (zh)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4816567A (en) 1983-04-08 1989-03-28 Genentech, Inc. Recombinant immunoglobin preparations
NO309798B1 (no) * 1999-04-30 2001-04-02 Targovax As Peptidblanding, samt farmasoytisk sammensetning og kreftvaksine som innbefatter peptidblandingen
BRPI0620125B1 (pt) 2005-12-22 2022-05-17 Vrije Universiteit Brussel Método para regulação de redução da função biológica de uma proteína, e método para isolar uma proteína de uma amostra
US8669418B2 (en) * 2005-12-22 2014-03-11 Vib Vzw Means and methods for mediating protein interference
CN103547296B (zh) 2011-03-11 2016-08-17 非营利性组织佛兰芒综合大学生物技术研究所 用于抑制和检测蛋白质的分子和方法
WO2016154047A2 (en) * 2015-03-20 2016-09-29 Memorial Sloan-Kettering Cancer Center Monoclonal antigen-binding proteins to intracellular oncogene products

Also Published As

Publication number Publication date
CA3177489A1 (en) 2021-08-26
US20230287046A1 (en) 2023-09-14
KR20220143730A (ko) 2022-10-25
IL295624A (en) 2022-10-01
EP4106786A1 (en) 2022-12-28
WO2021165453A1 (en) 2021-08-26
JP2023515124A (ja) 2023-04-12
AU2021223703A1 (en) 2022-08-25

Similar Documents

Publication Publication Date Title
US10844111B2 (en) Prostate specific membrane antigen binding fibronectin type III domains
JP6041799B2 (ja) Trailr2特異的多量体足場
CN114929730A (zh) 重组肽-mhc复合物结合蛋白及其生成和用途
KR20180030898A (ko) Gdf15의 활성 감소용 제제
CN114945584A (zh) 重组肽-mhc复合物结合蛋白及其生成和用途
WO2013142965A1 (en) Sh2 domain variants
JP2024012378A (ja) Bcl9ペプチドおよびそのバリアント
US20230174616A1 (en) Pd-l1 binding peptides
CN115427057A (zh) 靶向突变ras蛋白的分子
CN115484971A (zh) 靶向蛋白的分子
US20240101604A1 (en) Selective mena binding peptides
EP3145545B1 (en) Bak binding proteins
WO2018106937A1 (en) Compositions and methods for inhibition of foxp3

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40080054

Country of ref document: HK