CN117858982A - 人纤连蛋白iii型蛋白支架 - Google Patents

人纤连蛋白iii型蛋白支架 Download PDF

Info

Publication number
CN117858982A
CN117858982A CN202280057925.2A CN202280057925A CN117858982A CN 117858982 A CN117858982 A CN 117858982A CN 202280057925 A CN202280057925 A CN 202280057925A CN 117858982 A CN117858982 A CN 117858982A
Authority
CN
China
Prior art keywords
amino acid
seq
chain
acid sequence
library
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280057925.2A
Other languages
English (en)
Inventor
R·V·斯旺森
Z·德鲁齐娜
忻尧
K·奥尼尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aro Biotherapy
Original Assignee
Aro Biotherapy
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aro Biotherapy filed Critical Aro Biotherapy
Publication of CN117858982A publication Critical patent/CN117858982A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/10Libraries containing peptides or polypeptides, or derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/78Connective tissue peptides, e.g. collagen, elastin, laminin, fibronectin, vitronectin or cold insoluble globulin [CIG]
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B30/00Methods of screening libraries
    • C40B30/04Methods of screening libraries by measuring the ability to specifically bind a target molecule, e.g. antibody-antigen binding, receptor-ligand binding

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Medicinal Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Genetics & Genomics (AREA)
  • Biophysics (AREA)
  • Zoology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Toxicology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Immunology (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

基于具有替代结合表面设计的纤连蛋白III型(FN3)域的蛋白支架和支架文库、编码所述蛋白支架的分离的核酸、载体、宿主细胞、其制备方法以及作为用于治疗和诊断疾病和病症的治疗分子的用途。

Description

人纤连蛋白III型蛋白支架
相关申请
本申请要求2021年7月19日提交的美国临时申请第63/203,343号的优先权,所述申请以引用的方式整体并入本文中。
技术领域
本公开涉及纤连蛋白III型(FN3)域分子以及制备和使用所述分子的方法。
背景技术
当需要对靶分子具有高亲和力和特异性时,单克隆抗体是最广泛使用的一类治疗蛋白质。然而,非抗体蛋白质具有可被工程化以结合所需靶分子(通常称为蛋白支架)的相对明确的三维结构,由于其尺寸小、缺乏二硫键、高稳定性、以及在原核宿主中表达的能力而可能比传统抗体具有优势。这些支架典型地含有一个或多个易于进行特定或随机序列变异的区域,并且通常进行这种序列随机化以产生可从中选择所需产物的蛋白质文库。新型纯化方法易于应用;支架很容易与药物/毒素缀合,有效渗透至组织中,并且可形成多特异性结合剂(Binz和Pluckthun,Curr Opin Biotechnol,16,459-469,2005;Skerra,J MalRecognit,13,167-187,2000)。
一种这样的蛋白支架是在多种蛋白质中鉴定的纤连蛋白III型(FN3)域,其具有特征性的三级结构,其中6个环由7条β链连接。特别是三个环,FG、BC和DE环,在结构上类似于抗体的互补决定区(CDR)。这些环已被随机化以生成FN3域支架文库,以成功选择许多不同靶标的特异性结合剂,同时保留重要的生物物理特性(Getmanova等人,Chem Biol,13,549-556,2006;Hackel等人,J Mol Biol,381,1238-1252,2008;Karatan等人,Chem Biol,11,835-844,2004;Koide等人,J Mol Biol,284,1141-1151,1998;Koide等人,Proc Natl AcadSci US A,104,6632-6637,2007;Parker等人,Protein Eng Des Sel,18,435-444,2005;Xu等人,Chemistry&Biology,9,933-942,2002)。
需要替代的结合域,其可用作可促进治疗剂(例如基于寡核苷酸的治疗剂)的递送的靶向部分,或通过与靶分子结合而具有直接治疗效果。本公开提供了此类改进的蛋白质。
发明内容
在一些实施方案中,提供了包含多个纤连蛋白III型模块(FN3)域(多肽)的文库,所述文库具有包含多样化Cβ链、CD环、Dβ链、Fβ链、FG环和Gβ链的多样化C-CD-D-F-FG-G替代表面,其中所述多肽包含与SEQ ID NO:44的氨基酸序列至少80%、85%、90%或95%同一的氨基酸序列;其中与SEQ ID NO:24相比,所述多个多肽在Cβ链、CD环、Dβ链、Fβ链、FG环或Gβ链中的一者或多者或每一者中包含至少一个突变氨基酸残基,以形成具有多样化C-CD-D-F-FG-G替代表面的FN3域文库。
在一些实施方案中,提供了产生本文所述的文库的方法。
在一些实施方案中,提供了制备人纤连蛋白III型(FN3)域文库的方法,其中所述文库包含多样化C-CD-D-F-FG-G替代表面,其包含多样化Cβ链、CD环、Dβ链、Fβ链、FG环和Gβ链中的一者或多者或每一者,所述方法包含提供具有与SEQ ID NO:44的氨基酸序列至少80%、85%或90%同一的氨基酸序列的参考FN3域多肽;通过使以下任一域的至少一个残基突变将多样性引入参考FN3域多肽中:Cβ链、CD环、Dβ链、Fβ链、FG环和Gβ链残基,以形成具有多样化C-CD-D-F-FG-G替代表面的人FN3域文库。
在一些实施方案中,提供了通过本文所述的方法产生的文库。
在一些实施方案中,提供了获得包含人纤连蛋白III型模块(FN3)域的蛋白支架的方法,所述域具有特异性结合于靶分子的多样化C-CD-D-F-FG-G替代表面,所述方法包括使文库与靶分子接触或用靶分子淘选文库并分离以预定亲和力特异性结合于靶分子的蛋白支架。
在一些实施方案中,提供了获得包含纤连蛋白III型模块(FN3)域的多肽的方法,所述域具有结合或特异性结合靶分子的多样化C-CD-D-F-FG-G替代表面,所述方法包括使本文公开的文库与靶分子接触或用靶分子淘选(筛选)本文公开的文库并分离结合或特异性结合于靶分子的多肽。
具体实施方式
本文使用的术语“纤连蛋白III型(FN3)域”(FN3域)是指在包括纤连蛋白、生腱蛋白、细胞内细胞骨架蛋白、细胞因子受体和原核酶的蛋白质中频繁出现的域(Bork和Doolittle,Proc Nat Acad Sci USA 89:8990-8994,1992;Meinke等人,J Bacteriol 175:1910-1918,1993;Watanabe等人,J Biol Chem 265:15659-15665,1990)。示例性FN3域是存在于人生腱蛋白C中的15个不同的FN3域、存在于人纤连蛋白(FN)中的15个不同的FN3域、以及非天然合成的FN3域,如例如美国专利第8,278,419号中所述。各个FN3域通过域编号和蛋白质名称来指代,例如生腱蛋白的第3个FN3域(TN3),或纤连蛋白的第10个FN3域(FN10)。
本文使用的术语“替代表面”是指包含一个或多个β链和一个或多个环的FN3域一侧的表面。在一些实施方案中,替代表面是由Cβ链、CD环、Dβ链、Fβ链、FG环和Gβ链中的氨基酸形成的C-CD-D-F-FG-G表面。在一些实施方案中,替代表面包含多样化的Cβ链、CD环、Dβ链、Fβ链、FG环和Gβ链。
术语“生物样品”是指血液、组织、骨髓、痰液等。
术语“诊断试剂”是指可用于分析生物样品的任何物质,无论所述物质是作为单一物质还是与诊断试剂盒中的其它物质组合来分配。
本文使用的术语“取代(substituting)”或“取代(substituted)”或“突变(mutating)”或“突变(mutated)”是指改变、删除或插入多肽或多核苷酸序列中的一个或多个氨基酸或核苷酸以产生所述序列的变体。
如本文所用,术语“随机化(randomized)”或“随机化(diversified)”或“多样化(diversifying)”或“多样化(diversifying)”是指在多核苷酸或多肽序列中进行至少一个取代、插入或缺失。
如本文所用,“变体”是指因一种或多种修饰,例如取代、插入或缺失而与参考多肽或多核苷酸不同的多肽或多核苷酸。
本文使用的术语“特异性结合(specifically binds)”或“特异性结合(specificbinding)”是指本文所述的FN3域以约1×10-6M或更小,例如约1×10-7M或更小、约1×10-8M或更小、约1×10-9M或更小、约1×10-10M或更小、约1×10-11M或更小、约1×10-12M或更小、或约1×10-13M或更小的解离常数(KD)结合于预定抗原的能力。典型地,FN3域以比其针对非特异性抗原(例如BSA或酪蛋白)的KD小至少十倍的KD结合于预定抗原(即人PSMA),如使用例如Proteon Instrument(BioRad)通过表面等离子体共振所测量。然而,特异性结合于人PSMA的分离的FN3域可能与其它相关抗原具有交叉反应性,例如与来自其它物种(同源物),如食蟹猴(Macaca Fascicularis/cynomolgous monkey/cyno)或黑猩猩(Pantroglodytes/chimpanzee)的相同预定抗原。
本文使用的术语“靶分子”是指具有被FN3域识别的抗原或表位的蛋白质、肽、碳水化合物、脂质等。靶分子可以是天然或非天然存在的。
本文使用的术语“表位”意指FN3域特异性结合的抗原的一部分。表位通常由例如氨基酸或多糖侧链等部分的化学活性(例如极性、非极性或疏水)表面分组组成,并且可具有特定的三维结构特征以及特定的电荷特征。表位可由形成构象空间单元的连续和/或不连续的氨基酸构成。对于不连续的表位,来自抗原线性序列不同部分的氨基酸通过蛋白质分子的折叠在3维空间中非常接近。
术语“文库”是指变体的集合。文库可由多肽或多核苷酸变体组成。
本文所用的术语“稳定性”是指分子在生理条件下维持折叠状态以使其保留至少一种其正常功能活性(例如与预定抗原结合)的能力。
如本文所用,“Tencon”是指具有美国专利公开案第US2010/0216708号中所述的序列的合成纤连蛋白III型(FN3)域。
本文所用的术语“生腱蛋白C”是指具有GenBank登录号NP_002151中所示的序列的人生腱蛋白C。生腱蛋白C具有15个串联FN3域。
本文所用的“癌细胞”或“肿瘤细胞”是指体内、离体和组织培养中的癌性细胞、癌前细胞或转化细胞,其具有自发的或诱导的表型变化,所述表型变化不一定涉及新遗传物质的吸收。虽然转化可由转化病毒感染和新基因组核酸的掺入或外源核酸的摄取引起,但其也可自发地或在暴露于致癌物后发生,从而使内源基因突变。转化/癌症的示例为例如在诸如裸小鼠等合适的动物宿主体外、体内和离体的形态变化、细胞永生化、异常生长控制、病灶形成、增殖、恶性肿瘤、肿瘤特异性标记水平、侵袭性、肿瘤生长或抑制(Freshney,Culture of Animal Cells:A Manual of Basic Technique(第3版1994))。
“抑制生长”(例如指细胞,例如肿瘤细胞)是指当与治疗剂或治疗剂或药物的组合接触时,与在本领域技术人员熟知的适当对照条件下生长的相同细胞的生长相比,体外或体内细胞生长的可测量的减少。体外或体内细胞生长的抑制可以是至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、99%或100%。细胞生长的抑制可通过多种机制发生,例如通过细胞凋亡、坏死,或通过抑制细胞增殖或细胞裂解。
术语“载体”意指能够在生物系统内复制或能够在此类系统之间移动的多核苷酸。载体多核苷酸典型地含有元件,例如复制起点、聚腺苷酸化信号或选择标记,其功能是促进这些多核苷酸在生物系统中的复制或维持。此类生物系统的实例可包括细胞、病毒、动物、植物和利用能够复制载体的生物组分的重构生物系统。包含载体的多核苷酸可以是DNA或RNA分子或这些的杂合体。
术语“表达载体”意指可用于生物系统或重构生物系统中以指导由存在于表达载体中的多核苷酸序列编码的多肽的翻译。
术语“多核苷酸”意指包含通过糖-磷酸主链或其它等效共价化学共价连接的核苷酸链的分子。双链和单链DNA和RNA是多核苷酸的典型实例。
术语“多肽”或“蛋白质”意指包含至少两个通过肽键连接形成多肽的氨基酸残基的分子。小于约50个氨基酸的小多肽可称为“肽”。
本文所用的术语“与……组合”意指两种或更多种治疗剂可以混合物的形式一起施用于受试者,作为单一药剂同时施用或作为单一药剂以任何顺序相继施用。
术语“异源”意指所描述的多肽源自不同的细胞类型或不同的物种并且在自然界中不存在。
本发明的实施方案提供了特异性结合于靶分子,并且因此可广泛用于治疗和诊断应用的FN3域。FN3多肽具有包含一个或多个β链和一个或多个环的域,其可随机化以产生蛋白支架并选择以高亲和力特异性结合靶分子的蛋白支架。已发表的基于FN3的域文库是通过使顶部或底部环多样化而生成,所述区域在结构上类似于抗体可变链中的CDR,提供弯曲的结合表面。相反,高亲和力结合分子可选自本文提供的展示凹相互作用表面的FN3域文库,所述表面通过基于参考序列随机化本文提供的替代表面而生成。例如,可这样做以增加可选择高亲和力结合蛋白支架的表位和靶标的数量。在一些实施方案中,提供了编码蛋白质域或其互补核酸的多核苷酸、载体、宿主细胞以及制备和使用其的方法。本实施方案还提供了制备本文所提供的FN3域文库的方法,以及由前述构成的文库。
纤连蛋白III型域
纤连蛋白III型(FN3)域(或模块)是最初在纤连蛋白中鉴定的原型重复域,并且现在已知存在于各种动物蛋白家族中,包括细胞表面受体、细胞外基质蛋白、酶和肌肉蛋白。在结构上,FN3域的拓扑结构与免疫球蛋白样域非常相似,不同之处在于缺少二硫键。如本领域已知的,天然存在的FN3域具有β-夹心结构,其具有通过六个环(称为AB、BC、CD、DE、EF和FG环)连接的七个β链(称为A、B、C、D、E、F和G)(Bork和Doolittle,Proc Natl Acad SciUSA 89,8990-8992,1992;美国专利第6,673,901号)。三个环(BC、DE和FG环)位于FN3域的顶部,且三个环(AB、CD和EF环)位于所述域的底部。虽然FN3域构象高度保守,但不同域之间在氨基酸水平上的相似性相当低。FN3域可以是天然或非天然存在的。示例性的非天然存在的FN3域是基于存在于某种蛋白质中的所选FN3域的比对而设计的共有FN3域,并且在每个位置掺入最保守(频繁)的氨基酸以产生非天然存在的FN3域。例如,非天然存在的FN3域是基于来自人生腱蛋白C的15个FN3域的共有序列,或基于来自人纤连蛋白的15个FN3域的共有序列而设计。这些非天然存在的FN3域保留了FN3域的典型拓扑结构,并且与野生型FN3域相比可表现出改进的特性,例如改进的稳定性。示例性的非天然存在的FN3域是美国专利第2010/0216708号和美国专利第2010/0255056号中描述的Tencon和Fibcon域。然而,仍需要改进的结合分子。
对于本文所述的FN3支架,定义每个环和每个β链的氨基酸残基显示于表1中。可通过比对两个序列(一个是SEQ ID NO:44的参考序列,另一个是查询序列)来确定另一序列的下文所示的每个域/区域的残基。例如,可使用Blastp(可通过NBCI获得)对其进行比对,以使用默认设置比对两个序列。
表1.
FN3域/区域 SEQ ID NO:44
A链 1-13
AB环 14-17
B链 18-22
BC环 23-28
C链 29-37
CD环 38-43
D链 44-50
DE环 51-54
E链 55-59
EF环 60-64
F链 65-74
FG环 75-80
G链 81-90
可在以下一个或多个区域中进行FN3域的变异性,以创建文库或另一序列:Cβ链、CD环、Dβ链、Fβ链、FG环和Gβ链,其可称为“C-CD-D-F-FG-G替代表面”。
此替代表面可基于共有序列和特定位置处的突变残基而多样化,以生成可用于结合靶部分(例如细胞表面蛋白或受体或其它靶分子)的多肽文库。在一些实施方案中,文库包含多种基于SEQ ID NO:44的共有序列的蛋白质:
MLSPPSNLRVTDVTSTSVTLSWKPPAPITGYXVXYXEXXXXGEWKXVXVPGSETSYTVTGLKPGTEYXFXVXAVNGAXXGXPSQXVXVTT(SEQ ID NO:44)
其中每个X独立地是任何氨基酸。在一些实施方案中,每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸。
在一些实施方案中,可去除SEQ ID NO:44的前导甲硫氨酸。因此,在一些实施方案中,文库包含多种基于SEQ ID NO:74的共有序列的蛋白质:
LSPPSNLRVTDVTSTSVTLSWKPPAPITGYXVXYXEXXXXGEWKXVXVPGSETSYTVTGLKPGTEYXFXVXAVNGAXXGXPSQXVXVTT(SEQ ID NO:74)
其中每个X独立地是任何氨基酸。在一些实施方案中,每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸。
本文可在FN3域中描述的替代表面由每个FN3域中的非连续氨基酸段编码。例如,C-CD-D-F-FG-G表面由SEQ ID NO:44的氨基酸残基29-37、38-43、44-50、65-74、75-80和81-90形成,并且例如如表2中所示。在一些实施方案中,C-CD-D-F-FG-G表面包含SEQ ID NO:44的氨基酸残基29-37、38-43、44-50、65-74、75-80和81-90。
在一些实施方案中,本文提供了多肽,所述多肽包含SEQ ID NO:44的氨基酸序列,其中SEQ ID NO:44中的每个X独立地是任何氨基酸。在一些实施方案中,SEQ ID NO:44的每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸。
在一些实施方案中,本文提供了多肽,所述多肽包含SEQ ID NO:74的氨基酸序列,其中SEQ ID NO:74中的每个X独立地是任何氨基酸。在一些实施方案中,SEQ ID NO:74的每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸。
基于随机化替代表面的蛋白支架
在一些实施方案中,分离的蛋白支架包含含有替代表面的FN3域,其中替代表面在形成替代表面的C-CD-D-F-FG-G替代表面的区域中具有至少一个氨基酸取代。
在一些实施方案中,文库包含与SEQ ID NO:44的氨基酸序列至少或约80%、85%、90%、95%、96%、97%、98%或99%的蛋白质或多种蛋白质。
在一些实施方案中,FN3域包含与SEQ ID NO:24至少或约80%、85%、90%、95%、96%、97%、98%或99%同一的氨基酸序列。
在一些实施方案中,FN3域包含SEQ ID NO:24的氨基酸序列。
MLSPPSNLRVTDVTSTSVTLSWKPPAPITGYIVEYREKDGSGEWKEVTVPGSETSYTVTGLKPGTEYEFRVRAVNGAGEGPPSQSVTVTT
(SEQ ID NO:24)
在一些实施方案中,FN3域包含在SEQ ID NO:24的位置32、34、36、38、39、40、41、46、48、68、70、72、78、79、81、85和/或87处具有一个或多个取代的氨基酸序列。这些位置对应于下表2中所示的域,其可被突变以产生新的FN3多肽或多肽文库。
在一些实施方案中,蛋白支架或文库包含由Cβ链、CD环、Dβ链、Fβ链、FG环和Gβ链形成的C-CD-D-F-FG-G替代表面。在一些实施方案中,蛋白支架或文库包含含有Cβ链、CD环、Dβ链、Fβ链、FG环和Gβ链的C-CD-D-F-FG-G替代表面。在一些实施方案中,蛋白支架或文库包含含有Cβ链、CD环、Dβ链、Fβ链、FG环和/或β链的多样化C-CD-D-F-FG-G替代表面。
在一些实施方案中,形成C-CD-D-F-FG-G替代表面的Cβ链、CD环、Dβ链、Fβ链、FG环或Gβ链包含如表2和SEQ ID NO:45-48中所示的某些氨基酸序列。
表2.
FN3域 SEQ ID NO:44 氨基酸序列 SEQ ID NO:
C链 29-37 TGYXVXYXE 45
CD环 38-43 XXXXGE 46
D链 44-50 WKXVXVP 47
F链 65-74 TEYXFXVXAV 48
FG环 75-80 NGAXXG 49
G链 81-90 XPSQXVXVTT 50
其中每个X独立地是任何氨基酸。在一些实施方案中,每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸。
在一些实施方案中,FN3域包含具有在1、2或3个残基处具有取代的氨基酸序列TGYXVXYXE(SEQ ID NO:45)的Cβ链,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸。
在一些实施方案中,FN3域包含具有在1、2、3或4个残基处具有取代的氨基酸序列XXXXGE(SEQ ID NO:46)的CD环,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸。
在一些实施方案中,FN3域包含具有在1或2个残基处具有取代的氨基酸序列WKXVXVP(SEQ ID NO:47)的Dβ链,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸。
在一些实施方案中,FN3域包含具有在1、2或3个残基处具有取代的氨基酸序列TEYXFXVXAV(SEQ ID NO:48)的Fβ链,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸。
在一些实施方案中,FN3域包含具有在1或2个残基处具有取代的氨基酸序列NGAXXG(SEQ ID NO:49)的FG环,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸。
在一些实施方案中,FN3域包含具有在1、2或3个残基处具有取代的氨基酸序列XPSQXVXVTT(SEQ ID NO:50)的Fβ链,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸。
在一些实施方案中,文库包含多种多肽,其包含TGYXVXYXE(SEQ ID NO:45)、XXXXGE(SEQ ID NO:46)、WKXVXVP(SEQ ID NO:47)、TEYXFXVXAV(SEQ ID NO:48)、NGAXXG(SEQ ID NO:49)和XPSQXVXVTT(SEQ ID NO:50)的序列,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:1的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:2的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:3的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:4的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:5的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:6的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:7的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:8的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:9的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:10的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:11的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:12的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:13的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:14的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:15的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:16的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:17的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:18的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:19的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:20的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:21的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:22的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:23的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:24的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:25的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:26的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:27的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:28的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:29的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:30的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:31的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:32的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:33的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:34的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:35的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:36的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:37的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:38的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:39的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:40的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:41的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:42的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,文库包含一种或多种多肽,其包含与SEQ ID NO:43的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列。
在一些实施方案中,本文提供了多肽。在一些实施方案中,多肽包含与选自由以下组成的组的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列:SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42和43。在一些实施方案中,提供了包含多肽的药物组合物。
在一些实施方案中,基于本文提供的共有序列或参考序列的所得FN3域可在位于替代表面之外或之内的残基,例如本文提供的那些残基处被进一步修饰,目的是例如提高稳定性、降低免疫原性、增强结合亲和力、结合速率、解离速率、半衰期、溶解度或任何其它合适的特征。在实现此目标的一种方式中,可任选地通过使用亲本和工程化序列的三维模型分析亲本序列和各种概念性工程化产品的过程来制备支架蛋白。三维模型是普遍可用的并且为本领域技术人员所熟悉。可获得计算机程序,其说明和展示所选候选序列的可能的三维构象结构并且可测量可能的免疫原性(例如Monrovia,CA的Xencor,Inc.的Immunofilter程序)。检查这些展示允许分析残基在候选序列功能中的可能作用,例如影响支架蛋白稳定性或候选支架蛋白结合其靶分子的能力的残基。以这种方式,可从亲本序列和参考序列中选择和组合残基,从而实现所需的特征,例如改善的支架稳定性。替代地,或外加上述程序,可使用本领域已知的其它合适的工程化方法。
FN3域的理想物理特性包括高热稳定性以及热折叠和展开的可逆性。已应用若干方法来提高蛋白质和酶的表观热稳定性,包括基于与高度相似的热稳定序列比较的合理设计、稳定二硫键的设计、增加α-螺旋倾向的突变、盐桥工程化、蛋白质的表面电荷的改变、定向进化和共有序列的组成(Lehmann和Wyss,Curr Opin Biotechnol,12,371-375,2001)。高热稳定性可增加表达蛋白的产量,提高溶解度或活性,降低免疫原性,并最大限度地减少制造中对冷链的需求。
可通过进行取代并测定支架的所需特征来确定可被取代以改善FN3域的任何特征的残基。
就稳定性丧失而言,即蛋白质的“变性(denaturing)”或“变性(denaturation)”,意指赋予蛋白质功能特性的一些或全部三维构象已经丧失并伴随活性和/或溶解度丧失的过程。变性过程中被破坏的力包括分子内键,例如静电键、疏水键、范德华力、氢键和二硫键。蛋白质变性可由以下引起:施加至蛋白质或包含蛋白质的溶液的力,例如机械力(例如压缩力或剪切力)、热应力、渗透应力、pH变化、电场或磁场、电离辐射、紫外线辐射和脱水,以及化学变性剂。
蛋白质稳定性和蛋白质!能力的测量可被视为蛋白质完整性的相同或不同方面。蛋白质对由以下各者引起的变性敏感或“不稳定”:热、紫外线或电离辐射、环境渗透压和pH(如果在液体溶液中)、小孔径过滤施加的机械剪切力、紫外线辐射、电离辐射(例如伽马辐射)、化学脱水或热脱水,或任何其它可能导致蛋白质结构破坏的作用或力。可使用标准方法确定分子的稳定性。例如,可通过使用标准方法测量热熔化(“TM”)温度来确定分子的稳定性,所述温度以摄氏度(℃)为单位,在所述温度下1/2的分子展开。典型地,TM越高,分子越稳定。除了热量之外,化学环境也会改变蛋白质维持特定三维结构的能力。
在一些实施方案中,通过TM的增加所测量,FN3域表现出与工程化之前的相同域相比至少5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或95%或更多的稳定性增加。
化学变性同样可通过多种方法测量。化学变性剂包括盐酸胍、硫氰酸胍、尿素、丙酮、有机溶剂(DMF、苯、乙腈)、盐(硫酸铵、溴化锂、氯化锂、溴化钠、氯化钙、氯化钠);还原剂(例如二硫苏糖醇、β-巯基乙醇、二硝基硫苯和氢化物,例如硼氢化钠)、非离子和离子型清洁剂、酸(例如盐酸(HCl)、乙酸(CH3COOH)、卤代乙酸)、疏水性分子(例如磷脂)和靶向变性剂。变性程度的定量可依赖于功能特性的丧失,例如结合靶分子的能力,或通过物理化学特性,例如聚集倾向、以前溶剂不可接近的残基的暴露、或者二硫键的破坏或形成。
在一些实施方案中,通过使用盐酸胍作为化学变性剂所测量,多肽表现出与工程化之前的相同支架相比增加至少5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%,70%、75%、80%、85%、90%或95%或更多的稳定性。使用众所周知的方法,增加的稳定性可作为用增加浓度的盐酸胍处理后色氨酸荧光减少的函数来测量。
本文所述的FN3域可作为单体、二聚体或多聚体产生,例如作为增加价数并因此增加靶分子结合的亲合力的手段,或产生同时结合两个或更多个不同靶分子的双特异性或多特异性支架。二聚体和多聚体可通过连接单特异性、双特异性或多特异性蛋白支架来产生,例如通过包含氨基酸接头,例如含有聚甘氨酸、甘氨酸和丝氨酸、或丙氨酸和脯氨酸的接头。使用天然存在的以及人工肽接头将多肽连接成新型连接的融合多肽在文献中是众所周知的(Hallewell等人,J Biol Chem 264,5260-5268,1989;Alfthan等人,Protein Eng.8,725-731,1995;Robinson和Sauer,Biochemistry 35,109-116,1996;美国专利第5,856,456号)。
FN3域可用作双特异性分子,其中域中的第一替代表面对第一靶分子具有特异性,而同一域中的第二替代表面对第二靶分子具有特异性。
FN3域可例如通过共价相互作用掺入其它亚基。抗体恒定区的全部或一部分可连接至FN3域以赋予抗体样特性,尤其是与Fe区相关的那些特性,例如补体活性、半衰期等。例如,Fe效应功能,例如Clq结合、补体依赖性细胞毒性(CDC)、Fe受体结合、抗体依赖性细胞介导的细胞毒性(ADCC)、吞噬作用、细胞表面受体(例如B细胞受体;BCR)的下调等可通过修饰负责这些活性的Fe中的残基来提供和/或控制(关于综述;参见Strohl,Curr OpinBiotechnol.20,685-691,2009)。
额外的部分可掺入以下各者中或与以下各者缀合以获得所需特性:FN3域,例如毒素缀合物;白蛋白或白蛋白结合剂;聚乙二醇(PEG)分子,例如PEG5000或PEG20,000;不同链长的脂肪酸和脂肪酸酯,例如月桂酸酯、肉豆蔻酸酯、硬脂酸酯、花生酸酯、山萮酸酯、油酸酯、花生四烯酸酯、辛二酸、十四烷二酸、十八烷二酸、二十二烷二酸等;聚赖氨酸;辛烷;碳水化合物(葡聚糖、纤维素、寡糖或多糖)。这些部分可与蛋白质编码序列直接融合并且可通过标准克隆和表达技术产生。替代地,可使用众所周知的化学偶联方法来连所述接部分以重组产生本文所述的FN3域。在一些实施方案中,FN3与核酸分子,例如反义分子、siRNA、PMO等缀合。
可通过若干众所周知的测定来比较掺入额外部分的FN3域的功能。例如,由于Fc域和/或Fc域变体的掺入而改变的FN3域特性可如下地测定:在Fc受体结合测定中使用可溶形式的受体(例如FcγRI、FcγRII、FcγRIII或FcRn受体),或使用众所周知的基于细胞的测定来测量例如ADCC或CDC,或评估体内模型中的蛋白支架药物动力学特性
FN3域蛋白的生成和生产
在一些实施方案中,提供了制备包含替代表面的FN3域文库的方法,其中替代表面与例如本文所提供的参考FN3域相比具有至少一个氨基酸取代。在一些实施方案中,所述方法包括提供编码参考FN3域的多核苷酸;通过随机化替代表面来生成参考FN3域的多核苷酸序列文库;体外翻译文库或在宿主中表达文库。
在一些实施方案中,提供制备具有由Cβ链、CD环、Dβ链、Fβ链、FG环或Gβ链形成的多样化C-CD-D-F-FG-G替代表面的FN3多肽文库的方法,所述方法包括提供具有与SEQ ID NO:44的氨基酸序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一的氨基酸序列的参考FN3域多肽;通过使Cβ链、CD环、Dβ链、Fβ链、FG环或Gβ链中的至少一个残基突变将多样性引入共有FN3域多肽中,以形成具有多样化C-CD-D-F-FG-G替代表面的FN3域文库。
在一些实施方案中,提供制备具有包含多样化Cβ链、CD环、Dβ链、Fβ链、FG环或Gβ链的多样化C-CD-D-F-FG-G替代表面的FN3多肽文库的方法,所述方法包括提供具有与SEQ IDNO:44的氨基酸序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一的氨基酸序列的参考FN3域多肽;通过使Cβ链、CD环、Dβ链、Fβ链、FG环或Gβ链中的至少一个残基突变将多样性引入共有FN3域多肽中,以形成具有多样化C-CD-D-F-FG-G替代表面的FN3域文库。
在本文所述的制备文库的方法中,SEQ ID NO:44的Cβ链、CD环、Dβ链、Fβ链、FG环或Gβ链中的任一者中的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个残基可被突变或修饰。在一些实施方案中,突变是取代、插入或缺失。
在一些实施方案中,提供了通过本文提供的方法产生的文库。支架蛋白、其FN3域(多肽或模块)的生成例如在核酸水平上实现。在一个或多个特定残基处具有取代密码子的FN3域的文库可例如使用标准PCR克隆方法或根据美国专利第6,521,427号和美国专利第6,670,127号中所述的方法进行化学基因合成来合成。密码子可使用熟知的方法随机化,例如与设计的多样性匹配的简并寡核苷酸,或使用Kunkel诱变(Kunkel等人,MethodsEnzymol.154,367-382,1987)。
可使用随机或定义的氨基酸组在所选密码子处对文库进行随机化。例如,可使用NNK密码子生成文库中具有随机取代的变体,所述密码子编码所有20种天然存在的氨基酸。在其它多样化方案中,DVK密码子可用于编码氨基酸Ala、Trp、Tyr、Lys、Thr、Asn、Lys、Ser、Arg、Asp、Glu、Gly和Cys。替代地,NNS密码子可用于产生所有20种氨基酸残基,同时降低终止密码子的频率。密码子指定是根据众所周知的IUB代码。在一些实施方案中,在突变残基处不包括甲硫氨酸和/或半胱氨酸作为选项的情况下完成多样化。
FN3域与任何其它蛋白质一样容易出现各种物理和/或化学不稳定性,从而对下游加工产生不利影响。例如,物理和化学不稳定性可能导致聚集、降解、产物产量降低、效力丧失、免疫原性潜力增加、分子异质性和活性丧失。因此,在文库的设计过程中,可能的不稳定诱导残基和识别序列的存在可被最小化。例如,表面暴露的甲硫氨酸和色氨酸可能在储存条件下被氧化,有可能导致蛋白支架效力的损失。天冬酰胺的存在除了有助于众所周知的N-糖基化识别位点(NXS/T)之外,当随后是氨酸时,还可能会脱酰胺,有可能产生异质性(Robinson,Proc Natl Acad Sci USA,99,5283-5288,2002)。因此,这些氨基酸中的一些或全部可从用于随机化所选位置的混合物中省略或不省略。此外,可省略半胱氨酸和脯氨酸以最小化二硫桥的形成和β片层的破坏。
例如,可使用技术(http:_//www_sloning_com)合成在待多样化的位置处具有偏向氨基酸分布的FN3域文库。此技术使用预制双链三联体文库,其作为通用构建块,足以进行数千个基因合成过程。三联体文库代表构建任何所需DNA分子所需的所有可能的序列组合。
在某些位置具有所选核苷酸“简并性”的寡核苷酸的合成是本领域众所周知的,例如TRIM方法(Knappek等人,J Mal Biol 296,57-86,1999;Garrard和Renner,Gene 128,103-109,1993)。具有某些密码子组的此类核苷酸组可使用市售核苷酸或核苷试剂和装置来合成。
使用标准克隆和表达技术将文库克隆至载体中或合成文库的双链cDNA盒,以在体外表达或翻译文库。例如,顺式展示可用于将编码支架蛋白的DNA片段与编码RepA的DNA片段连接,以生成体外翻译后形成的蛋白质-DNA复合物池,其中每个蛋白质与编码其的DNA稳定缔合(美国专利第7,842,476号;Odegrip等人,Proc Natl Acad Sci U SA101,2806-2810,2004)。可使用其它方法,例如核糖体展示(Hanes和Pluckthun,Proc Natl Acad SciUSA,94,4937-4942,1997)、mRNA展示(Roberts和Szostak,Proc Natl Acad Sci USA,94,12297-12302,1997)或其它无细胞系统(美国专利第5,643,768号)。蛋白支架文库可表达为展示于例如任何合适的噬菌体表面上的融合蛋白。用于在噬菌体表面上展示融合多肽的方法是众所周知的(美国专利公开案第2011/0118144号;国际专利公开案第WO2009/085462号;美国专利第6,969,108号;美国专利第6,172,197号;美国专利第5,223,409号;美国专利第6,582,915号;美国专利第6,472,147号)。
筛选
筛选工程化蛋白质FN3域或FN3域变体文库与靶分子的特异性结合可例如通过使用顺式展示产生文库来实现,如实施例和Odegrip等人,Proc Natl Acad Sci US101,2806-2810,2004中所述,并通过本领域已知的任何方法测定文库与靶分子的特异性结合。可使用的示例性众所周知的方法是ELISA、夹心免疫测定以及竞争性和非竞争性测定(参见例如Ausubel等人编,1994,Current Protocols in Molecular Biology,第1卷,John Wiley&Sons,Inc.,New York)。FN3域可以宽范围的亲和力(KD)结合人类或其它哺乳动物蛋白质,典型地,FN3域可以等于或小于约10-7M、10-8M、10-9M、10-10M、10-11M、10-12M、10-13M、10-14M或10-15M的KD结合靶蛋白,如通过表面等离子体共振或Kinexa方法所测定,如本领域技术人员所实践。FN3域对抗原的亲和力可使用任何合适的方法以实验方式确定。(参见例如Berzofsky等人,"Antibody-Antigen Interactions,"Fundamental Immunology,Paul,W.E.编,Raven Press:New York,NY(1984);Kuby,Janis Immunology,W.H.Freeman andCompany:New York,NY(1992);以及在此描述的方法)。如果在不同条件(例如渗透压、pH)下测量,则特定FN3域-抗原相互作用的测量亲和力可能会有所不同。因此,亲和力和其它抗原结合参数(例如KD、Kon、Koff)的测量优选地用蛋白支架和抗原的标准化溶液以及标准化缓冲液(例如本文所述的缓冲液)进行。美国专利第7,842,476号和美国专利第8,679,781号中还描述了其它筛选方法,所述专利各自的全部内容特此以引用的方式并入。
核酸分子和载体
本公开提供了编码FN3的核酸,作为分离的多核苷酸或作为表达载体的部分或作为线性DNA序列的部分,包括用于体外转录/翻译的线性DNA序列、与组合物或其定向诱变剂的原核、真核或丝状噬菌体表达、分泌和/或展示相容的载体。本文公开了某些示例性多核苷酸,然而,考虑到给定表达系统中遗传密码或密码子偏好的简并性,编码本文公开的蛋白支架和蛋白支架文库的其它多核苷酸也在范围内。
本文公开的多核苷酸可通过化学合成,例如在自动多核苷酸合成仪上的固相多核苷酸合成来产生,并组装成完整的单链或双链分子。替代地,本文公开的多核苷酸可通过例如PCR的其它技术产生,随后进行常规克隆。用于产生或获得给定已知序列的多核苷酸的技术是本领域众所周知的。
本文公开的多核苷酸可包含至少一种非编码序列,例如启动子或增强子序列、内含子、聚腺苷酸化信号、促进RepA结合的顺式序列等。多核苷酸序列还可包含编码额外氨基酸的额外序列,其编码例如标记或标签序列(例如组氨酸标签或HA标签)以促进蛋白质、信号序列、融合蛋白配偶体如RepA、Fe或噬菌体外壳蛋白如pIX或pIII的纯化或检测。示例性多核苷酸包含Tac启动子的序列、编码FN3域文库和repA的序列、顺式元件和细菌复制起点(ori)。另一示例性多核苷酸包含pelB或ompA信号序列、pIII或pIX噬菌体外壳蛋白、FN3域和polyA位点。
另一实施方案是包含至少一种本文公开的多核苷酸的载体。此类载体可以是质粒载体、病毒载体、用于杆状病毒表达的载体、基于转座子的载体或适合于通过任何方式将多核苷酸引入给定生物体或遗传背景的任何其它载体。此类载体可以是包含核酸序列元件的表达载体,所述核酸序列元件可控制、调节、引起或允许由此类载体编码的多肽的表达。此类元件可包含转录增强子结合位点、RNA聚合酶起始位点、核糖体结合位点和其它促进所编码的多肽在给定表达系统中表达的位点。此类表达系统可以是本领域熟知的基于细胞的或无细胞的系统。
宿主细胞选择或宿主细胞工程化
本文公开的FN3域可任选地由细胞系、混合细胞系、永生化细胞或永生化细胞的克隆群体产生,如本领域众所周知的。参见例如Ausubel等人编,Current Protocols inMolecular Biology,John Wiley&Sons,Inc.,NY,NY(1987-2001);Sambrook等人,Molecular Cloning:A Laboratory Manual,第2版,Cold Spring Harbor,NY(1989);Harlow和Lane,Antibodies,a Laboratory Manual,Cold Spring Harbor,NY(1989);Colligan等人编,Current Protocols in Immunology,John Wiley&Sons,Inc.,NY(1994-2001);Colligan等人,Current Protocols in Protein Science,John Wiley&Sons,NY,NY,(1997-2001)。
选择用于表达的宿主细胞可以是哺乳动物来源的或可选自COS-1、COS-7、HEK293、BHK21、CHO、BSC-1、Hep G2、653、SP2/0、293、HeLa、骨髓瘤、淋巴瘤、酵母、昆虫或植物细胞,或其任何衍生物、永生化或转化细胞。替代地,宿主细胞可选自不能糖基化多肽的物种或生物体,例如原核细胞或生物体,例如BL21、BL2l(DE3)、BL21-GOLD(DE3)、XLl-Blue、JM109、HMSl 74、HMSl 74(DE3)以及任何天然或工程化的大肠杆菌属、克雷伯氏菌属或假单胞菌属菌株。
FN3域的用途
本文所描述并且通过任何上述方法产生的基于FN3域(模块)的分子的组合物可用于诊断、监测、调节、治疗、缓解人类疾病或细胞、组织、器官、体液或一般而言宿主中的特定病理,帮助预防其发生,或减少其症状。为特定目的而工程化的FN3域可用于治疗免疫介导的或免疫缺陷型疾病、代谢疾病、心血管病症或疾病;恶性疾病;神经系统病症或疾病;感染,例如细菌、病毒或寄生虫感染;或其它已知或特定的相关病况,包括肿胀、疼痛和组织坏死或纤维化。
此类方法可包括向需要此类调节、治疗、缓解、预防或减少症状、影响或机制的细胞、组织、器官、动物或患者施用有效量的组合物或药物组合物,所述组合物或药物组合物包含特异性结合靶分子的至少一个FN3域。有效量可包括每单次(例如推注)、多次或连续施用约0.001至500mg/kg的量,或达到每单次、多次或连续施用0.01-5000μg/ml血清浓度的血清浓度,或其中的任何有效范围或值,如使用本文所述或相关领域已知的已知方法进行和确定。
FN3多肽可连接至另一种治疗剂以促进治疗剂的递送。因此,FN3多肽可用于将治疗剂递送至表达FN3多肽所结合的靶标(例如CD71)的细胞。
包含基于FN3域的蛋白质的药物组合物
特异性结合修饰或未修饰的靶分子、单体、二聚体或多聚体、单特异性、双特异性或多特异性的FN3域可使用本领域熟知的用于捕获、固定、分配或沉降的分离程序来分离,并纯化至商业应用所需的程度。其还可与核酸分子或其它治疗剂结合。在一些实施方案中,核酸分子是siRNA或反义分子。
对于治疗用途,可将特异性结合靶分子的FN3域制备为药物组合物,所述药物组合物在药学上可接受的载体中含有有效量的FN3域作为活性成分。术语“载体”是指使用其来施用活性化合物的稀释剂、佐剂、赋形剂或媒剂。此类媒剂可以是液体如水和油,包括石油、动物、植物或合成来源的那些,如花生油、大豆油、矿物油、芝麻油等。例如,可使用0.4%盐水和0.3%甘氨酸。这些溶液是无菌的并且通常不含特定物质。其可通过常规的、众所周知的灭菌技术(例如过滤)来灭菌。组合物可根据需要含有接近生理条件的药学上可接受的辅助物质,例如pH调节剂和缓冲剂、稳定剂、增稠剂、润滑剂和着色剂等。此类药物制剂中的试剂的浓度可广泛变化,即从低于约0.5%,通常为或至少约1%至多达15或20%重量,并且将主要基于所需剂量、液体体积、粘度等,根据所选择的具体施用模式来选择。合适的媒剂和配制物,包括其它人蛋白质,例如人血清白蛋白描述于例如Remington:The Science andPractice of Pharmacy,第21版,Troy,D.B.编,Lipincott Williams and Wilkins,Philadelphia,PA 2006,第5部分,Pharmaceutical Manufacturing第691-1092页中,尤其参见第958-989页。
用于特异性结合靶分子的FN3域的治疗用途的施用模式可以是将药剂递送至宿主的任何合适的途径,例如肠胃外施用,例如皮内、肌内、腹膜内、静脉内或皮下、经肺;经粘膜(经口、鼻内、阴道内、经直肠);使用片剂、胶囊、溶液、粉末、凝胶、颗粒形式的配制物;并包含于注射器、植入装置、渗透泵、药筒、微型泵中;或本领域众所周知的本领域技术人员理解的其它方式。位点特异性施用可通过以下来实现:例如关节内、支气管内、腹内、囊内、软骨内、腔内、体腔内、小脑内、脑室内、结肠内、宫颈内、胃内、肝内、心内、骨内、骨盆内、心包内、腹膜内、胸膜内、前列腺内、肺内、直肠内、肾内、视网膜内、脊柱内、滑膜内、胸腔内、子宫内、血管内、膀胱内、病灶内、经阴道、经直肠、经颊、舌下、鼻内或经皮递送。
列举的实施方案
本文提供的实施方案还包括但不限于:
虽然已经概括地描述了实施方案,但在以下实施例中进一步公开了某些实施方案,所述实施例不应被解释为限制权利要求书的范围。
1.一种包含多个纤连蛋白III型模块(FN3)域(多肽)的文库,所述文库具有包含多样化Cβ链、CD环、Dβ链、Fβ链、FG环和Gβ链的多样化C-CD-D-F-FG-G替代表面,其中所述多肽包含以下氨基酸序列:
MLSPPSNLRVTDVTSTSVTLSWKPPAPITGYXVXYXEXXXXGEWKXVXVPGSETSYTVTGLKPGTEYXFXVXAVNGAXXGXPSQXVXVTT(SEQ ID NO:44)
或与SEQ ID NO:44的氨基酸序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的氨基酸序列,其中每个X独立地是任何氨基酸。
2.如实施方案1的文库,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸。
3.如实施方案1或2的文库,其中与SEQ ID NO:24相比,所述多肽在Cβ链、CD环、Dβ链、Fβ链、FG环或Gβ链中的一者或多者或每一者中包含至少一个突变氨基酸残基,以形成具有多样化C-CD-D-F-FG-G替代表面的FN3域文库。
4.如实施方案1-3中任一项的文库,其中所述多个多肽在对应于SEQ ID NO:24的位置32、34、36、38、39、40、41、46、48、68、70、72、78、79、81、85和/或87的位置处具有一个或多个突变(例如取代、插入或缺失)。
5.如实施方案1-4中任一项的文库,其中多样化Cβ链具有TGYXVXYXE(SEQ ID NO:45)的氨基酸序列,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸。
6.如实施方案1-5中任一项的文库,其中多样化CD环具有XXXXGE(SEQ ID NO:46)的氨基酸序列,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸。
7.如实施方案1-6中任一项的文库,其中多样化Dβ链具有WKXVXVP(SEQ ID NO:47)的氨基酸序列,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸。
8.如实施方案1-7中任一项的文库,其中多样化Fβ链具有TEYXFXVXAV(SEQ ID NO:48)的氨基酸序列,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸。
9.如实施方案1-8中任一项的文库,其中多样化FG环具有NGAXXG(SEQ ID NO:49)的氨基酸序列,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸。
10.如实施方案1-9中任一项的文库,其中多样化Gβ链具有氨基酸序列XPSQXVXVTT(SEQ ID NO:50),其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸。
11.如实施方案1-10中任一项的文库,其中所述文库包含氨基酸序列,所述氨基酸序列具有与选自由以下组成的组的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列:SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42和43。
12.如实施方案1-11中任一项的文库,其中:
所述多样化Cβ链具有TGYXVXYXE(SEQ ID NO:45)的氨基酸序列,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸;
所述多样化CD环具有XXXXGE(SEQ ID NO:46)的氨基酸序列,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸;
所述多样化Dβ链具有WKXVXVP(SEQ ID NO:47)的氨基酸序列,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸;
所述多样化Fβ链具有TEYXFXVXAV(SEQ ID NO:48)的氨基酸序列,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸;
所述多样化FG环具有NGAXXG(SEQ ID NO:49)的氨基酸序列,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸;并且
其中所述多样化Gβ链具有氨基酸序列XPSQXVXVTT(SEQ ID NO:50),其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸。
13.一种产生实施方案1-12中任一项的文库的方法,所述方法包括表达编码多个多肽的多核苷酸。
14.一种制备具有多样化C-CD-F-FG-G替代表面的纤连蛋白III型模块(FN3)域的文库的方法,所述替代表面包含多样化Cβ链、CD环、Fβ链、FG环和G-β链中的一者或多者或每一者,所述方法包括
a.提供具有与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43或44的氨基酸序列至少80%同一的氨基酸序列的参考FN3域多肽;和
b.通过使所述Cβ链、CD环区、Fβ链区、FG环区或G-β链区中的至少一个残基突变将多样性引入所述参考FN3域多肽中,以形成具有所述多样化C-CD-F-FG-G替代表面的所述FN3域文库,其中:
所述多样化Cβ链具有TGYXVXYXE(SEQ ID NO:45)的氨基酸序列,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸;
所述多样化CD环具有XXXXGE(SEQ ID NO:46)的氨基酸序列,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸;
所述多样化Dβ链具有WKXVXVP(SEQ ID NO:47)的氨基酸序列,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸;
所述多样化Fβ链具有TEYXFXVXAV(SEQ ID NO:48)的氨基酸序列,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸;
所述多样化FG环具有NGAXXG(SEQ ID NO:49)的氨基酸序列,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸;并且
所述多样化Gβ链具有氨基酸序列XPSQXVXVTT(SEQ ID NO:50),其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸。
15.一种通过实施方案13或14的方法产生的文库。
16.一种获得包含纤连蛋白III型模块(FN3)域的多肽的方法,所述域具有结合或特异性结合于靶分子的多样化C-CD-D-F-FG-G替代表面,所述方法包括使实施方案1-12中任一项的文库与靶分子接触并分离结合或特异性结合于靶分子的多肽。
17.一种多肽,所述多肽具有与选自由以下组成的组的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列:SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42和43。
18.一种多肽,所述多肽包含以下氨基酸序列:
MLSPPSNLRVTDVTSTSVTLSWKPPAPITGYXVXYXEXXXXGEWKXVXVPGSETSYTVTGLKPGTEYXFXVXAVNGAXXGXPSQXVXVTT(SEQ ID NO:44)
其中每个X独立地是任何氨基酸。
19.如实施方案18的多肽,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸。
20.一种多肽,所述多肽包含以下氨基酸序列:
LSPPSNLRVTDVTSTSVTLSWKPPAPITGYXVXYXEXXXXGEWKXVXVPGSETSYTVTGLKPGTEYXFXVXAVNGAXXGXPSQXVXVTT(SEQ ID NO:74)
其中每个X独立地是任何氨基酸。
21.如实施方案20的多肽,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸。
22.一种药物组合物,其包含实施方案17-21的多肽。
23.一种编码实施方案22的多肽的核酸分子。
24.一种编码实施方案1-12中任一项的多肽文库的多个核酸分子。
25.一种宿主细胞,其包含实施方案24的核酸分子。
实施例
实施例1:Fn3域人类共有序列(HumCon)的设计
纤连蛋白III型域的Prosite序列数据库比对(http://prosite.expasy.org/PDOC50853)被用作生成共有序列的起点。此比对经过编辑以删除所有非人类衍生序列,所得比对含有806个人类序列。94个位置中每个位置的主导残基用于确定候选共有序列。在两个位置(47和89)处,两个残基同样占主导地位。这些是位置47处的N和T以及位置89处的S和V。在所有其它位置,单个残基占主导地位。由于位置47和89的模糊性,生成了四个共有序列(表3)。
表3.
环设计:
环区域的长度和序列均可高度可变。虽然对806个序列进行了比对以建立共有序列,并且大多数序列在94个位置中的每个位置都含有一个残基,但某些位置由于缺失(典型地发生在环中)而含有较少的序列。因此,一些环可被缩短并产生更稳定的序列。假定的BC和CD环被鉴定为长度可变的区域。为了检验这些环可被缩短的假设,使用SEQ ID NO:2作为主链序列设计了这些区域中的一系列缺失。结果是SEQ ID NO:5-13,列于下表4中。
表4.
基因合成、表达和表征
表3和表4中的13个序列的基因设计有C末端His标签,并克隆至T5启动子控制下的表达载体中。在摇瓶中评估以mg/L培养物表示的表达产量,并通过差示扫描量热法评估解链温度(表5)。建立了SDS PAGE测定,以使用MW标准品确认单体同质性。一些克隆的行为与二聚体形成一致,推测是由于链交换所致,其可通过SDS PAGE和尺寸排阻色谱来证明。
表5.
额外优化(N末端、脯氨酸、pI)
SEQ ID NO:2被选为主要候选物,以工程化用于改进生物物理特性。设计了一系列突变,以便1)根据与其它FN3域结构的同源性建模,从预计具有β片层结构的片段中去除脯氨酸,目的是尽量减少链交换;或2)增加预测的pI值以实现简化的制造和配制物特性。这些变体的序列列于表6中。每种蛋白质在大肠杆菌中表达,通过C末端His标签进行纯化,并评估与亲本克隆(SEQ ID NO:2)相比的溶解度(可溶性蛋白质/大肠杆菌的表达)、稳定性(根据差示扫描量热法的Tm)和单体同质性(SDS-PAGE)(表7)。
表6.
表7.
文库设计-丙氨酸扫描
为了测试文库设计策略的可行性,设计了十九种突变蛋白,其中每种突变蛋白在旨在成为设计的结合界面的一部分的独特位置处编码一个丙氨酸残基。丙氨酸扫描突变体序列列于表8中。每种蛋白质在大肠杆菌中表达,通过C末端His标签纯化并表征以确保生物物理特性与亲本克隆(SEQ ID NO:24)的生物物理特性一致。评估蛋白质变体的溶解度(可溶性蛋白质的表达/L)、稳定性(根据差示扫描量热法的Tm)和单体同质性(SDS-PAGE)(表9)。
表8.
/>
表9.
/>
通过筛选与CD71的特异性结合来验证文库
使用标准分子生物学方法构建HumCon变体文库,其中由丙氨酸突变实验确认的17个位置突变为18种可能的氨基酸(除甲硫氨酸和半胱氨酸之外的所有氨基酸)。将此文库克隆至CIS展示载体中并使用本文所述的方法淘选CD71的结合剂。通过ELISA测定特异性结合剂。表10列出了成功结合于CD71靶标的文库成员。
表10.
/>
/>
本文提供的本实施例和实施方案证明,本文提供的FN3域可被生成并用于生成文库以产生可结合感兴趣的靶蛋白的分子。这些结果是无法预测的,并且因此,本文以无法预测的方式提供了分子文库、包含其的组合物以及使用其的方法。应当清楚的是,可以不同于前述说明书和实施例中具体描述的方式来实践实施方案。根据上述教导,本实施方案的许多修改和变化是可能的,并且因此在所附权利要求书的范围内。

Claims (25)

1.一种包含多个纤连蛋白III型模块(FN3)域(多肽)的文库,所述文库具有包含多样化Cβ链、CD环、Dβ链、Fβ链、FG环和Gβ链的多样化C-CD-D-F-FG-G替代表面,其中所述多肽包含以下氨基酸序列:
MLSPPSNLRVTDVTSTSVTLSWKPPAPITGYXVXYXEXXX XGEWKXVXVPGSETSYTVTGLKPGTEYXFXVXAVNGAXXGX PSQXVXVTT(SEQ ID NO:44)
或与SEQ ID NO:44的氨基酸序列具有至少80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的氨基酸序列,其中每个X独立地是任何氨基酸。
2.如权利要求1所述的文库,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸。
3.如权利要求1或2所述的文库,其中与SEQ ID NO:24相比,所述多肽在所述Cβ链、所述CD环、所述Dβ链、所述Fβ链、所述FG环或所述Gβ链中的一者或多者或每一者中包含至少一个突变氨基酸残基,以形成具有所述多样化C-CD-D-F-FG-G替代表面的所述FN3域文库。
4.如权利要求1-3中任一项所述的文库,其中所述多个多肽在对应于SEQ ID NO:24的位置32、34、36、38、39、40、41、46、48、68、70、72、78、79、81、85和/或87的位置处具有一个或多个突变(例如取代、插入或缺失)。
5.如权利要求1-4中任一项所述的文库,其中所述多样化Cβ链具有TGYXVXYXE(SEQ IDNO:45)的氨基酸序列,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸。
6.如权利要求1-5中任一项所述的文库,其中所述多样化CD环具有XXXXGE(SEQ ID NO:46)的氨基酸序列,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸。
7.如权利要求1-6中任一项所述的文库,其中所述多样化Dβ链具有WKXVXVP(SEQ IDNO:47)的氨基酸序列,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸。
8.如权利要求1-7中任一项所述的文库,其中所述多样化Fβ链具有TEYXFXVXAV(SEQ IDNO:48)的氨基酸序列,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸。
9.如权利要求1-8中任一项所述的文库,其中所述多样化FG环具有NGAXXG(SEQ ID NO:49)的氨基酸序列,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸。
10.如权利要求1-9中任一项所述的文库,其中所述多样化Gβ链具有氨基酸序列XPSQXVXVTT(SEQ ID NO:50),其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸。
11.如权利要求1-10中任一项所述的文库,其中所述文库包含氨基酸序列,所述氨基酸序列具有与选自由以下组成的组的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列:SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42和43。
12.如权利要求1-11中任一项所述的文库,其中:
所述多样化Cβ链具有TGYXVXYXE(SEQ ID NO:45)的氨基酸序列,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸;
所述多样化CD环具有XXXXGE(SEQ ID NO:46)的氨基酸序列,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸;
所述多样化Dβ链具有WKXVXVP(SEQ ID NO:47)的氨基酸序列,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸;
所述多样化Fβ链具有TEYXFXVXAV(SEQ ID NO:48)的氨基酸序列,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸;
所述多样化FG环具有NGAXXG(SEQ ID NO:49)的氨基酸序列,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸;并且
其中所述多样化Gβ链具有氨基酸序列XPSQXVXVTT(SEQ ID NO:50),其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸。
13.一种产生权利要求1-12中任一项所述的文库的方法,所述方法包括表达编码所述多个多肽的多核苷酸。
14.一种制备具有多样化C-CD-F-FG-G替代表面的纤连蛋白III型模块(FN3)域的文库的方法,所述替代表面包含多样化Cβ链、CD环、Fβ链、FG环和G-β链中的一者或多者或每一者,所述方法包括
a.提供具有与SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43或44的氨基酸序列至少80%同一的氨基酸序列的参考FN3域多肽;和
b.通过使所述Cβ链、CD环区、Fβ链区、FG环区或G-β链区中的至少一个残基突变将多样性引入所述参考FN3域多肽中,以形成具有所述多样化C-CD-F-FG-G替代表面的所述FN3域文库,其中:
所述多样化Cβ链具有TGYXVXYXE(SEQ ID NO:45)的氨基酸序列,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸;
所述多样化CD环具有XXXXGE(SEQ ID NO:46)的氨基酸序列,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸;
所述多样化Dβ链具有WKXVXVP(SEQ ID NO:47)的氨基酸序列,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸;
所述多样化Fβ链具有TEYXFXVXAV(SEQ ID NO:48)的氨基酸序列,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸;
所述多样化FG环具有NGAXXG(SEQ ID NO:49)的氨基酸序列,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸;并且
所述多样化Gβ链具有氨基酸序列XPSQXVXVTT(SEQ ID NO:50),其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸。
15.一种通过权利要求13或14所述的方法产生的文库。
16.一种获得包含纤连蛋白III型模块(FN3)域的多肽的方法,所述域具有结合或特异性结合于靶分子的多样化C-CD-D-F-FG-G替代表面,所述方法包括使权利要求1-12中任一项所述的文库与所述靶分子接触并分离结合或特异性结合于所述靶分子的所述多肽。
17.一种多肽,所述多肽具有与选自由以下组成的组的序列至少或约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一或同一的氨基酸序列:SEQ ID NO:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42和43。
18.一种多肽,所述多肽包含以下氨基酸序列:
MLSPPSNLRVTDVTSTSVTLSWKPPAPITGYXVXYXEXXX XGEWKXVXVPGSETSYTVTGLKPGTEYXFXVXAVNGAXXGX PSQXVXVTT(SEQ ID NO:44)
其中每个X独立地是任何氨基酸。
19.如权利要求18所述的多肽,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸。
20.一种多肽,所述多肽包含以下氨基酸序列:
LSPPSNLRVTDVTSTSVTLSWKPPAPITGYXVXYXEXXXX GEWKXVXVPGSETSYTVTGLKPGTEYXFXVXAVNGAXXGXP SQXVXVTT(SEQ ID NO:74)
其中每个X独立地是任何氨基酸。
21.如权利要求20所述的多肽,其中每个X独立地是除甲硫氨酸或半胱氨酸之外的任何氨基酸。
22.一种药物组合物,所述药物组合物包含权利要求17-21所述的多肽。
23.一种编码权利要求22所述的多肽的核酸分子。
24.一种编码权利要求1-12中任一项所述的多肽文库的多个核酸分子。
25.一种宿主细胞,所述宿主细胞包含权利要求24所述的核酸分子。
CN202280057925.2A 2021-07-19 2022-07-19 人纤连蛋白iii型蛋白支架 Pending CN117858982A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163203343P 2021-07-19 2021-07-19
US63/203,343 2021-07-19
PCT/US2022/037586 WO2023003874A2 (en) 2021-07-19 2022-07-19 Human fibronectin type iii protein scaffolds

Publications (1)

Publication Number Publication Date
CN117858982A true CN117858982A (zh) 2024-04-09

Family

ID=84978794

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280057925.2A Pending CN117858982A (zh) 2021-07-19 2022-07-19 人纤连蛋白iii型蛋白支架

Country Status (8)

Country Link
EP (1) EP4374005A2 (zh)
KR (1) KR20240035847A (zh)
CN (1) CN117858982A (zh)
AU (1) AU2022313151A1 (zh)
BR (1) BR112024001054A2 (zh)
CA (1) CA3224586A1 (zh)
IL (1) IL309898A (zh)
WO (1) WO2023003874A2 (zh)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7109000B2 (en) * 2001-03-08 2006-09-19 Curagen Corporation Proteins and nucleic acids encoding same
US20190316116A1 (en) * 2014-12-15 2019-10-17 Monash University Highly stable polypeptide scaffolds
WO2020169840A1 (en) * 2019-02-21 2020-08-27 Cambridge Enterprise Limited Bispecific proteins with a chimeric scaffold

Also Published As

Publication number Publication date
BR112024001054A2 (pt) 2024-04-30
WO2023003874A3 (en) 2023-03-02
EP4374005A2 (en) 2024-05-29
CA3224586A1 (en) 2023-01-26
KR20240035847A (ko) 2024-03-18
IL309898A (en) 2024-03-01
WO2023003874A2 (en) 2023-01-26
AU2022313151A1 (en) 2024-01-18

Similar Documents

Publication Publication Date Title
JP6722263B2 (ja) 選択的結合表面を有するフィブロネクチンiii型反復ベースのタンパク質スカフォールド
JP2021019595A (ja) 非天然コンセンサスアルブミン結合ドメイン
JP6356748B2 (ja) 安定したフィブロネクチンドメイン組成物、方法及び用途
CN117858982A (zh) 人纤连蛋白iii型蛋白支架
AU2017202915B2 (en) Stabilized fibronectin domain compositions, methods and uses

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication