附图简述
图1显示具有天然前导序列的SEQ ID NO:1的人VpreB1氨基酸序列、SEQ ID NO:2和3的小鼠VpreB2序列、SEQ ID NO:4的人VpreB3样序列、图11中设计为“VpreB dTail”的“三聚体”中截短的VpreB1序列(SEQ ID NO:5)的序列和具有小鼠Igκ前导序列的SEQID NO:6的人VpreB1氨基酸序列。下划线表示VpreB氨基酸序列中的前导序列。
图2显示SEQ ID NO:7的人λ5样序列、SEQ ID NO:8的人λ5序列、图11中设计为“λ5dTail”的“三聚体”中截短的λ5序列(SEQ IDNO:9)的序列和具有小鼠Igκ前导序列的SEQ ID NO:10的人λ5dTail序列。下划线表示λ5氨基酸序列中的前导序列。
图3显示为SEQ ID NO:35的人VpreB1-λ5嵌合氨基酸序列(小鼠Igκ前导序列加下划线)。
图4A和4B显示(A)SEQ ID NO:11的人Vκ样核苷酸序列和所编码的蛋白的氨基酸序列(AJ004956;SEQ ID NO:12)(天然前导序列加下划线)和(B)可能来自所有Vκ家族的Vκ样蛋白的预期的成熟氨基酸序列,每一种与AJ004956Vκ样原型序列(SEQ ID NO:12)比对具有不同长度的延伸(SEQ ID NO:13-24)。
图5A-C显示(A)SEQ ID NO:25的人JCκ核苷酸序列和所编码的蛋白的氨基酸序列(SEQ ID NO:26)(与预期的成熟JCκ蛋白相比,独特的序列加双下划线而可能的前导裂解序列加单下划线),(B)来自余下的κJ-恒定区重排的预期的JCκ-样氨基酸序列(J1-J5Cκ)(SEQ IDNO:27-31)和(C)JCκ工程化筛选优化的变体,包括具有加下划线的附加小鼠Igκ前导序列的JCκ(SEQ ID NO:32)、仅具有加下划线的附加小鼠Igκ前导序列的重组JCκ(SEQ ID NO:33)和具有加下划线的附加小鼠Igκ前导序列的预期加工的JCκ(SEQ ID NO:34)。
图6是由VpreB和λ5序列形成的替代轻链的图解说明,示例性融合多肽包含替代轻链序列和来源于V-J连接的抗体轻链结构。
图7是不同的替代轻链缺失和单链构建体的图解说明。
图8图解地说明将组合的功能多样性掺入替代轻链构建体中。
图9显示不同的示例性替代轻链构建体的基因和蛋白结构。
图10说明将功能性加入替代轻链(SLC)成分中的不同的代表性方式。
图11说明不同的三聚体和二聚体的替代轻链(SLC)构建体。
图12是不同异二聚体的替代κ轻链缺失变体的图解说明。在“全长”构建体中,Vκ样和JCκ序列分别保留C和N端延伸(尾)。在dJ变体中,JCκ的N端延伸缺失。在dVκ尾变体中,Vκ样序列的C端延伸被移除但是JCκ的N端延伸保留。在“短κ”变体中,Vκ样序列的C端尾和JCκ序列的N端延伸都保留。
图13:κ样轻链缺失和单链构建体,其可单独或与另一种蛋白例如抗体重链或其片段一起使用。
图14:将组合的功能多样性加入κ样替代轻链构建体中。红线表示附加的多样性,例如肽文库。
图15:轻链是基因重排和RNA加工的产物。
图16A示例性说明Vκ样蛋白来源于未重排的VκIV基因转录和翻译。VκIV是七十一种VL种系基因中的一种。因为存在能够产生Vκ样蛋白的另外70种VL种系基因,所以存在更多的39种κV基因和更多的31种λV基因。
图16B示例性说明JCκ是来自未重排的J和C种系的加工的RNA的产物。JCκ是四十五种JCκ种系组合中的一种。存在能够产生JCκ样蛋白的另外44种VL种系基因,与Cκ组合的更多的4种Jκ基因和与10种Cλ基因组合的4种Jλ基因(共40种)。
图17显示将功能性加入κ样替代轻链成分的图解说明。说明了双功能和三功能的结构。A:scFv限制性融合物;B:Vκ样scFv融合物;C:JCκscFv融合物;D:SLC双重融合物。
图18示例性说明替代轻链功能性尾部延伸的类型。
图19示例性说明κ样和λ样替代轻链功能嵌合体。
图20A-C示例性说明(A)替代抗体形式,(B)双功能和双特异性替代抗体形式和(C)(A)和(B)中描述的分子的克隆策略。
发明详述
A.定义
除非另外定义,本文所使用的技术和科学术语具有与本发明所属领域普通技术人员通常所理解的相同的含义。Singleton等人,Dictionary of Microbiology and Molecular Biology(微生物学和分子生物学字典)第二版,J.Wiley & Sons(New York,NY 1994)为本领域技术人员提供了对本申请中所使用的许多术语的一般指导。
本领域技术人员将识别可在本发明的实施中使用的与本文所描述的那些相似或等同的许多方法和材料。事实上,本发明决不是限于所描述的方法和材料。为了本发明的目的,下列术语定义于下文。
贯穿本申请始终,除非以其他方式清楚地说明,单数的使用包括复数。
在本申请中,除非以其他方式清楚地说明,“或”的使用包括“和/或”。
而且,术语“包括(include)”、“包括(including)”和“包括(included)是非限制的。
在本发明的背景下,术语“抗体”(Ab)被用来意指来源于V(D)J基因重组的典型重组的重链和也来源于VJ基因重组的典型重组的轻链的天然抗体或其片段。
“天然抗体”是约150,000道尔顿的异四倍体糖蛋白,由两个相同的轻(L)链和两个相同的重(H)链组成。每条轻链通过共价二硫键与重链连接,而二硫键的数目在不同免疫球蛋白同种型的重链中不同。每条重链和轻链同样具有规则间隔的链内二硫键。每条重链,至少在一个末端,具有随后有许多恒定结构域的可变结构域(VH)。每条轻链在一个末端具有可变结构域(VL)而在其另外的末端具有恒定结构域;轻链的恒定结构域与重链的第一恒定结构域对齐而轻链可变结构域与重链的可变结构域对齐。据信特定的氨基酸残基形成了轻链和重链可变结构域之间的界面,Chothia等人,J.Mol.Biol.186:651(1985);Novotny和Haber,Proc.Natl.Acad.Sci.U.S.A.82:4592(1985)。
就抗体链而言,术语“可变的”被用来意指抗体中在序列上大大不同并且参与每种特定抗体对其特定抗原的结合和特异性的抗体链的部分。这种可变性集中在轻链和重链可变结构域中称为高变区的三段中。可变结构域的更加高度保守的部分被称为框架区(FR)。天然重链和轻链的可变区每一种包括四个FR(分别是FR1、FR2、FR3和FR4),大多采用β-折叠构型,通过三个高变区连接,所述三个高变区形成连接(并且在某些实例中形成部分的)β-折叠结构的环形。每条链中的高变区通过FR靠近保持在一起并且与来自其他链的高变区一起促成抗体的抗原结合位点的形成。(参见Kabat等人,Sequences ofProteins of Immunological Interest(免疫学感兴趣的蛋白的序列),第5版.Public Health Service,National Institutes of Health,Bethesda,Md.(1991),第647-669页)。恒定结构域并不直接参与抗体与抗原的结合,但是表现出不同的效应子作用,例如抗体依赖的细胞毒性中抗体的参与。
当在本文中使用时,术语“高变区”是指负责抗原结合的抗体的氨基酸残基。高变区包含来自“互补决定区”或“CDR”的残基(即,轻链可变结构域中的30-36(L1)、46-55(L2)和86-96(L3)残基和重链可变结构域中的残基30-35(H1)、47-58(H2)和93-101(H3);MacCallum等人,J Mol Biol.262(5):732-45(1996)。
术语“框架区”是指在更加趋异的CDR区之间存在的抗体可变区的领域中公认的部分。这些框架区通常称为框架1至4(FR1、FR2、FR3和FR4)并且为在三维结构中保持在重链或轻链抗体可变区中存在的三个CDR提供支架以使CDR能够形成抗原结合表面。
取决于它们的重链的恒定区的氨基酸序列,抗体可被分为不同的类型。有五种主要类型的抗体,IgA、IgD、IgE、IgG和IgM,并且这些中的一些可被进一步分为亚型(同种型),例如IgG1、IgG2、IgG3、IgG4、IgA和IgA2。在一个优选的实施方案中,本发明的免疫粘附素的结构中使用的免疫球蛋白序列来自IgG免疫球蛋白重链结构域。对于人免疫粘附素来说,优选使用人IgG1和IgG3免疫球蛋白序列。使用IgG1的主要优点是IgG1免疫粘附素可在固定化的蛋白A上被有效纯化。然而,当为特定的免疫粘附素构建体选择Ig融合配偶体时,应当考虑其他结构和功能特性。例如,IgG3铰链更长并且更灵活,因此它可以调节当与IgG1融合时没有正确折叠或起作用的更长的“粘附素”结构域。另一个考虑可以是原子价;IgG免疫粘附素是二价的同源二聚体,然而类似于IgA和IgM的Ig亚型可分别产生基本的Ig同源二聚体单体的二聚体或五聚体结构。对于为体内应用而设计的VEGF受体Ig样结构域/免疫球蛋白嵌合体来说,由Fc区确定的药代动力学特性和效应子作用也同样重要。尽管IgG1、IgG2和IgG4都具有21天的体内半衰期,但是它们在活化补体系统上的相对功效并不同。而且,不同的免疫球蛋白具有不同数目的异型同种型。
与不同类型的免疫球蛋白相应的重链恒定结构域分别称为α、δ、ε、γ和μ。
以它们恒定结构域的氨基酸序列为基础,来自任一种脊椎动物物种的抗体的“轻链”可被指定为称为κ(kappa)(κ)和λ(lambda)(λ)的两种完全不同的类型中的一种。本文对抗体轻链的任何引用都包括κ和λ轻链两种。
“抗体片段”包括全长抗体的一部分,通常是其抗原结合或可变结构域。抗体片段的实例包括但不限于Fab、Fab’、F(ab’)2、scFv、和(scFv)2片段。
如本文所用的,术语“抗体结合区”是指能够结合抗原的免疫球蛋白或抗体可变区的一个或多个部分。通常,抗体结合区是,例如,抗体轻链(VL)(或其可变区)、抗体重链(VH)(或其可变区)、重链Fd区、组合抗体轻链和重链(或其可变区)诸如Fab、F(ab’)2、单结构域或单链抗体(scFv)或者全长抗体,诸如IgG(例如IgG1、IgG2、IgG3或IgG4亚型)、IgA1、IgA2、IgD、IgE或IgM亚型。
如本文所用的,术语“表位”是指至少约3至5个,优选地至少约5至10个或至少约5至15个氨基酸并且通常不多于约500或约1,000个氨基酸的序列,其定义了其本身或作为较大序列的一部分与响应该序列产生的抗体结合的序列。表位不限于具有与其所来源的母本蛋白的所述部分相同的序列。事实上,病毒基因组处于不断变化的状态并且表现出分离物之间相对高程度的可变性。因此,术语“表位”涵盖与天然序列相同的序列以及修改,例如对天然序列的缺失、取代和/或插入。通常,这些修饰在性质上是保守的但是同样预期非保守的修饰。术语特别包括“模拟位”,即与连续线性的天然序列不同或在天然蛋白中并不是必须存在但是功能上模拟天然蛋白上的表位的序列。术语“表位”特别包括线性和构象表位。
术语“替代轻链多肽”或“SLC多肽”本文被用来意指VpreB多肽、λ5多肽、Vκ样多肽、JCκ多肽或其变体。
术语“非替代轻链分子”或“非SLC分子”被用来意指不是SLC多肽的分子。非SLC分子可以是多肽,例如细胞因子或抗体片段。
本文中术语“VpreB”以最广泛的意义使用并且是指任何天然序列或变体VpreB多肽,特别地包括但不限于,SEQ ID NO:1的人VpreB1、SEQ ID NO:2和3的小鼠VpreB2序列、SEQ ID NO:4的人VpreB3样序列、SEQ ID NO:5的人VpreB dT和同种型,包括其剪接变体和通过翻译后修饰形成的变体、其他的哺乳动物同系物以及这种天然序列多肽的变体。
本文中术语“λ5”以最广泛的意义使用并且是指任何天然序列或变体λ5多肽,特别地包括但不限于,SEQ ID NO:6的人λ5、SEQID NO:7的人λ5样蛋白、表示为SEQ ID NO:9的人λ5dT、SEQ IDNO:10的人VpreB1氨基酸序列和它们的同种型,包括其剪接变体和通过翻译后修饰形成的变体、其他的哺乳动物同系物以及这种天然序列多肽的变体。
术语“变体VpreB多肽”和“VpreB多肽的变体”可互换使用并且本文中被定义为作为氨基酸修饰的结果在一个或多个氨基酸位点与天然序列VpreB多肽不同的多肽。如本文所定义的,所述“变体VpreB多肽”将与天然抗体λ或κ轻链序列或其片段不同。所述“变体VpreB多肽”优选保留与天然序列VpreB多肽的至少约65%、或至少约70%、或至少约75%、或至少约80%、或至少约85%、或至少约90%、或至少约95%或至少约98%的序列同一性。在另一个优选的实施方案中,所述“变体VpreB多肽”在其氨基酸序列上与天然抗体λ或κ轻链序列的同一性少于95%、或少于90%、或少于85%、或少于80%、或少于75%、或少于70%、或少于65%或少于60%。变体VpreB多肽特别包括但不限于,其中在VpreB序列的C端处非Ig样的独特尾部被部分或全部移除的VpreB多肽。
术语“变体λ5多肽”和“λ5多肽的变体”可互换使用并且本文中被定义为作为氨基酸修饰的结果在一个或多个氨基酸位点与天然序列λ5多肽不同的多肽。如本文所定义的,所述“变体λ5多肽”将与天然抗体λ或κ轻链序列或其片段不同。所述“变体λ5多肽”优选保留与天然序列λ5多肽的至少约65%、或至少约70%、或至少约75%、或至少约80%、或至少约85%、或至少约90%、或至少约95%或至少约98%的序列同一性。在另一个优选的实施方案中,所述“变体λ5多肽”在其氨基酸序列上与天然抗体λ或κ轻链序列的同一性少于95%、或少于90%、或少于85%、或少于80%、或少于75%、或少于70%、或少于65%、或少于60%。变体λ5多肽特别包括但不限于,其中在λ5序列的N端处非Ig样的独特尾部被部分或全部移除的λ5多肽。
术语“变体Vκ样多肽”和“Vκ样多肽的变体”可互换使用并且本文中被定义为作为氨基酸修饰的结果在一个或多个氨基酸位点与天然序列Vκ样多肽不同的多肽。如本文所定义的,所述“变体Vκ样多肽”将与天然抗体λ或κ轻链序列或其片段不同。所述“变体Vκ样多肽”优选保留与天然序列Vκ样多肽的至少约65%、或至少约70%、或至少约75%、或至少约80%、或至少约85%、或至少约90%、或至少约95%或至少约98%的序列同一性。在另一个优选的实施方案中,所述“变体Vκ样多肽”在其氨基酸序列上与天然抗体λ或κ轻链序列少于95%、或少于90%、或少于85%、或少于80%、或少于75%、或少于70%、或少于65%、或少于60%相同。变体Vκ样多肽特别包括但不限于,其中在Vκ样序列的C端处非Ig样的独特尾部被部分或全部移除的Vκ样多肽。
术语“变体JCκ多肽”和“JCκ多肽的变体”可互换使用并且本文中被定义为作为氨基酸修饰的结果在一个或多个氨基酸位点与天然序列JCκ多肽不同的多肽。如本文所定义的,所述“变体JCκ多肽”将与天然抗体λ或κ轻链序列或其片段不同。所述“变体JCκ多肽”优选保留与天然序列JCκ多肽的至少约65%、或至少约70%、或至少约75%、或至少约80%、或至少约85%、或至少约90%、或至少约95%或至少约98%的序列同一性。在另一个优选的实施方案中,所述“变体JCκ多肽”在其氨基酸序列上与天然抗体λ或κ轻链序列的同一性少于95%、或少于90%、或少于85%、或少于80%、或少于75%、或少于70%、或少于65%、或少于60%。变体JCκ多肽特别包括但不限于,其中在JCκ序列的N端处非Ig样的独特尾部被部分或全部移除的JCκ多肽。
百分比氨基酸序列同一性可使用序列比对程序NCBI-BLAST2来确定(Altschul等人,Nucleic acids Res.25:3389-3402(1997))。NCBI-BLAST2序列比对程序可从http://www.ncbi.nlm.nih.gov下载或以其它方式从National Institute of Health(国立卫生研究院),Bethesda,MD获得。NCBI-BLAST2使用若干个搜索参数,其中所有这些搜索参数都被设置为默认值,包括例如,未掩蔽=是,链=所有,期望发生=10,最小低复杂性长度=15/5,多程e值=0.01,多程常数=25,最终带缺口比对的下降=25和得分矩阵=BLOSUM62。
术语“VpreB序列”本文被用来意指如上文所定义的“VpreB”的序列或其片段。
术语“λ5序列”本文被用来意指如上文所定义的“λ5”的序列或其片段。
术语“Vκ样序列”本文被用来意指如上文所定义的“Vκ样”的序列或其片段。
术语“JCκ序列”本文被用来意指如上文所定义的“JCκ”的序列或其片段。
如本文所用的术语“λ样替代轻链”是指通过VpreB和λ5蛋白的非共价结合形成的二聚体。
如本文所用的术语“κ样替代轻链”是指通过Vκ样和JCκ蛋白的非共价结合形成的二聚体。
如本文所定义的术语“λ样替代轻链序列”意指包含如上文所定义的“VpreB序列”和/或“λ5序列”的任何多肽序列。如本文所定义的所述“λ样替代轻链序列”特别包括但不限于SEQ ID NO:1的人VpreB1序列、SEQ ID NO:2和3的小鼠VpreB2序列、SEQ ID NO:4的人VpreB3序列、表示为SEQ ID NO:5的人VpreB dT以及SEQ IDNO:6的人VpreB1氨基酸序列和它们的不同同种型,包括其剪接变体和通过翻译后修饰形成的变体、其他的哺乳动物物种中的同系物以及其片段或变体。术语“λ样替代轻链序列”另外包括但不限于SEQ IDNO:7的人λ5序列、SEQ ID NO:8的人λ5样序列、表示为SEQ ID NO:9的人λ5dTail、SEQ ID NO:10的人λ5dTail序列和它们的同种型,包括其剪接变体和通过翻译后修饰形成的变体、其他的哺乳动物物种中的同系物以及其片段或变体。术语“λ样替代轻链序列”另外包括包含如上文定义的VpreB和λ5序列两者的序列。
如本文所定义的术语“κ样替代轻链序列”意指包含如上文所定义的“Vκ样序列”和/或“JCκ”的任何多肽序列。如本文所定义的所述“κ样替代轻链序列”特别包括但不限于SEQ ID NO:12-24中任一种的人Vκ样序列和它们的不同同种型,包括其剪接变体和通过翻译后修饰形成的变体、其他的哺乳动物物种中的同系物以及其片段或变体。术语“κ样替代轻链序列”另外包括但不限于SEQ ID NO:12-24中任一种的人Vκ样序列、SEQ ID NO:25-35中任一种的人JCκ序列和它们的同种型,包括其剪接变体和通过翻译后修饰形成的变体、其他的哺乳动物物种中的同系物以及这种天然序列多肽的变体。术语“κ样替代轻链序列”另外包括包含如上文定义的Vκ样和JCκ序列两者的序列。
术语“替代轻链构建体”以最广泛的意义使用并且包括任何和所有另外的异质成分,包括异源氨基酸序列、核酸和与替代轻链序列轭合的其他分子,其中“轭合”定义于下文。
“替代轻链构建体”本文还称为“SurrobodyTM”或“替代抗体”并且所述两个术语可互换使用。某些SurrobodyTMλ样替代轻链构建体公开于Xu等人,Proc.Natl.Acad.Sci.USA 2008,105(31):10756-61和2008年10月2日公开的PCT公开WO 2008/118970中。同样预期的是如美国专利公开第2010-0062950号和Xu等人,J.Mol.Biol.2010,397,352-360中描述的κ样替代轻链构建体,其全部公开内容通过引用清楚地并入本文。
在本发明的多肽的背景下,相对于第一氨基酸序列的术语“异源氨基酸序列”用来意指与所述第一氨基酸序列不是天然连接的氨基酸序列,至少不以它存在于本文的替代轻链构建体中的形式。因此,相对于VpreB、λ5、Vκ样或JCκ的“异源氨基酸序列”是与天然VpreB、λ5、Vκ样或JCκ在其天然环境中不连接的任何氨基酸序列。这些包括但不限于i)与同VpreB一起在发育中的B细胞上形成替代轻链的那些λ5序列不同的λ5序列,例如氨基酸序列变体,诸如截短和/或衍生的λ5序列;ii)与同λ5一起在发育中的B细胞上形成替代轻链的那些VpreB序列不同的VpreB序列,例如氨基酸序列变体,诸如截短和/或衍生的VpreB序列;iii)与同JCκ一起在发育中的B细胞上形成κ样替代轻链的那些Vκ样序列不同的Vκ样序列,例如氨基酸序列变体,诸如截短和/或衍生的Vκ样序列和iv)与同Vκ样一起在发育中的B细胞上形成κ样替代轻链的那些JCκ序列不同的JCκ序列,例如氨基酸序列变体,诸如截短和/或衍生的JCκ序列。
相对于VpreB或λ5的“异源氨基酸序列”还包括与相应的VpreB或λ5共价结合,例如融合,的VpreB或λ5序列,包括天然序列VpreB或λ5,因为在它们的天然环境中,VpreB和λ5序列彼此并不共价结合,例如融合。相似地,相对于Vκ样或JCκ的“异源氨基酸序列”还包括与相应的Vκ样或JCκ共价结合,例如融合,的Vκ样或JCκ序列,包括天然序列Vκ样或JCκ,因为在它们的天然环境中,Vκ样或JCκ彼此并不共价结合,例如融合。异源氨基酸序列还包括但不限于,抗体序列,包括抗体及其重链序列和片段,例如诸如,抗体轻链和重链可变区序列以及抗体轻链和重链恒定区序列。
术语“轭合(conjugate)”、“轭合(conjugated)”和“轭合(conjugation)”是指共价或非共价键合的任何和所有形式,并且包括但不限于直接的基因(genetic)或化学融合,通过连接体或交联剂的偶联以及非共价结合,例如通过范德华力或通过使用亮氨酸拉链。
本文中术语“柔性连接体”被用来意指以其化学结构为基础在其预期的背景和环境下未预计在三维空间中被固定的任何连接体。
本文中术语“融合”被用来意指不同来源的氨基酸序列通过它们的编码核苷酸序列的符合读框的组合组合在一个多肽链中。术语“融合”明确地涵盖内部融合,即不同来源的氨基酸序列插入一个多肽链中,与其末端之一的融合除外。
如本文所用的,术语“肽”、“多肽”和“蛋白”都是指通过共价“肽键”连接的氨基酸的一级序列。通常,肽由几个氨基酸,通常是从约2个至约50个氨基酸组成,并且比蛋白短。如本文所定义的,术语“多肽”涵盖肽和蛋白。
术语“氨基酸”或“氨基酸序列”通常是指具有其领域内公认的定义的氨基酸,例如选自由下列组成的组的氨基酸:丙氨酸(Ala)、精氨酸(Arg)、天门冬酰胺(Asn)、天门冬氨酸(Asp)、半胱氨酸(Cys)、谷氨酰胺(Gln)、谷氨酸(Glu)、甘氨酸(Gly)、组氨酸(His)、异亮氨酸(Ile)、亮氨酸(Leu)、赖氨酸(Lys)、蛋氨酸(Met)、苯丙氨酸(Phe)、脯氨酸(Pro)、丝氨酸(Ser)、苏氨酸(Thr)、色氨酸(Trp)、酪氨酸(Tyr)和缬氨酸(Val),但是如果需要,修饰的、合成或稀有氨基酸可使用。因此,37CFR1.822(b)(4)中所列的修饰和特殊氨基酸明确包括在这一定义中并且通过引用清楚地并入本文。氨基酸可被细分为不同的亚组。因此氨基酸可被分组为具有非极性侧链(例如Ala、Cys、Ile、Leu、Met、Phe、Pro、Val);带负电荷侧链(例如Asp、Glu);带正电荷侧链(例如Arg、His、Lys)或不带电荷的极性侧链(例如Asn、Cys、Gln、Gly、His、Met、Phe、Ser、Thr、Trp和Tyr)。氨基酸还可被分组为小氨基酸(Gly、Ala);亲核氨基酸(Ser、His、Thr、Cys);疏水性氨基酸(Val、Leu、Ile、Met、Pro);芳香族氨基酸(Phe、Tyr、Trp、Asp、Glu);酰胺(Asp、Glu)和碱性氨基酸(Lys、Arg)。
术语“多核苷酸”是指核酸例如DNA分子和RNA分子及其类似物(例如使用核苷酸类似物或使用核酸化学产生的DNA或RNA)。如果需要,多核苷酸可合成制得,例如使用领域内公认的核酸化学,或酶法制得,使用例如聚合酶,并且如果需要,可被修饰。典型的修饰包括甲基化、生物素化和其他领域中已知的修饰。另外,核酸分子可以是单链或者双链的,并且如果需要,可与可检测的部分连接。
就参考多肽而言,术语“变体”是指与天然多肽相比具有至少一个氨基酸突变或修饰(即改变)的多肽。通过“氨基酸修饰”产生的变体可以通过例如取代、缺失、插入和/或化学修饰天然氨基酸序列中的至少一个氨基酸来生产。
“氨基酸修饰”是指预定的氨基酸序列的氨基酸序列中的变化。示例性的修饰包括氨基酸取代、插入和/或缺失。
指定位点的“氨基酸修饰”是指指定残基的取代或缺失或邻近指定残基的至少一个氨基酸残基的插入。插入“邻近的”指定残基意指在其一个至两个残基中插入。插入可以是向指定残基的N端或C端。
“氨基酸取代”是指在预定的氨基酸序列中用另一种不同的“替代”氨基酸残基替代至少一个现有的氨基酸残基。替代残基可以是“天然存在的氨基酸残基”(即由遗传密码编码)并且选自由下列组成的组:丙氨酸(Ala)、精氨酸(Arg)、天门冬酰胺(Asn)、天门冬氨酸(Asp)、半胱氨酸(Cys)、谷氨酰胺(Gln)、谷氨酸(Glu)、甘氨酸(Gly)、组氨酸(His)、异亮氨酸(Ile)、亮氨酸(Leu)、赖氨酸(Lys)、蛋氨酸(Met)、苯丙氨酸(Phe)、脯氨酸(Pro)、丝氨酸(Ser)、苏氨酸(Thr)、色氨酸(Trp)、酪氨酸(Tyr)和缬氨酸(Val)。使用一个或多个非天然存在的氨基段残基的取代也涵盖在本文氨基酸取代的定义中。
“非天然存在的氨基酸残基”是指除了上文列出的那些天然存在的氨基酸残基之外的残基,其在多肽链中能够与邻近的一个或多个氨基酸残基共价结合。非天然存在的氨基酸残基的实例包括正亮氨酸、鸟氨酸、正缬氨酸、高丝氨酸和其他氨基酸残基类似物,例如Ellman等人Meth.Enzym.202:301 336(1991)中描述的那些。为了产生这些非天然存在的氨基酸残基,可使用Noren等人Science 244:182(1989)和Ellman等人如上文的程序。简单地说,这些程序包括化学活化具有非天然存在的氨基酸残基的抑制剂tRNA以及之后的RNA的体外转录和翻译。
“氨基酸插入”是指将至少一个氨基酸加入预定的氨基酸序列中。尽管插入通常由一个或两个氨基酸残基的插入构成,但是本申请涵盖更大的“肽插入”,例如约三个至约五个或甚至高达约十个氨基酸残基的插入。所插入的残基可以是如上文公开的天然存在的或非天然存在的。
“氨基酸缺失”是指将至少一个氨基酸氨基从预定的氨基酸序列中除去。
术语“诱变(mutagenesis)”是指,除非另外说明,用于改变多核苷酸或多肽序列的任何领域内公认的技术。诱变的优选类型包括易错PCR诱变、饱和诱变或其他定点诱变。
“定点诱变”是本领域中的标准技术并且使用与有待被诱变(除了有限的错配之外)的单链噬菌体DNA互补的合成的寡核苷酸引物来进行,表现出所期望的诱变。简单地说,合成的寡核苷酸被用作引物以指导与单链噬菌体DNA互补的链的合成并且所得到的双链DNA被转化至噬菌体支持的宿主细菌中。将转化的细菌的培养物放入顶层琼脂,允许来自带有噬菌体的单细胞的噬斑形成。理论上,新噬斑的50%将包含具有为单链的突变形式的噬菌体;50%将具有原始序列。通过在允许准确配对的杂交但是与原始链的错配足以阻止杂交的温度下用激酶合成引物杂交来筛选感兴趣的噬斑。之后选择与探针杂交的噬斑,测序和培养并回收DNA。
术语“载体”被用来意指在细胞中能够自主复制并且可与DNA片段例如基因或多核苷酸可操作地连接以引起所连接的片段的复制的rDNA分子。能够指导编码一种或多种多肽的基因表达的载体在本文被称作“表达载体”。术语“控制序列“是指对于可操作地连接的编码序列在特定宿主生物中的表达来说必需的DNA序列。适于原核生物的控制序列例如包括启动子,任选的操纵序列,和核糖体结合位点。真核细胞已知使用启动子、多腺苷酸化信号和增强子。载体可以是质粒,质粒是指可将另外的DNA片段连接至其中的环形双链DNA环。载体可以是噬菌体载体或病毒载体,其中另外的DNA片段可被连接至病毒基因组中。适合的载体能够在它们所被引入的宿主细胞中自主复制,例如具有细菌起始点或复制的细菌载体和附加型哺乳动物载体。当引入宿主细胞中时,载体可被整合至宿主细胞基因组中,例如非附加体哺乳动物载体,并且随宿主基因组一起复制。
当核酸被置于与另一个核酸序列的功能性关系中时,其为“可操作地连接的”。例如,前序列或分泌前导的DNA可操作地连接于多肽的DNA,条件是它被表达为参与多肽的分泌的前蛋白;启动子或增强子与编码序列可操作地连接,条件是其影响序列的转录;或者核糖体结合位点可操作地连接于编码序列,条件是其被放置以便促进翻译。通常,“可操作地连接”意指被连接的DNA序列是紧接的,并且在分泌前导的实例中,是紧接的并且在阅读段中。然而,增强子并不必须是紧接的。连接通过在合适的限制性位点连接来完成。如果这些位点不存在,可根据常规实践使用合成的寡核苷酸接头或连接体。
“噬菌体展示文库”是将克隆的蛋白序列的集合表达为与噬菌体外壳蛋白的融合物的蛋白表达文库。因此,短语“噬菌体表达文库”在本文是指噬菌体(例如丝状噬菌体)的集合,其中噬菌体表达外来(通常异源的)蛋白。外来蛋白不与噬菌体所接触的其他部分相互作用(结合)。展示外来蛋白的每种噬菌体是噬菌体文库的“成员”。
术语“丝状噬菌体”是指能够在其表面展示异质多肽的病毒颗粒,并且包括但不限于f1、fd、Pf1和M13。丝状噬菌体可含有可选择的标记,例如四环素(诸如“fd-tet”)。不同的丝状噬菌体展示系统是本领域技术人员熟知的(参见例如Zacher等人,Gene 9:127-140(1980),Smith等人,Science 228:1315-1317(1985)以及Parmley和Smith Gene73:305-318(1988))。
术语“淘洗”被用来意指携带具有对靶的高亲和性和特异性的化合物(例如抗体)的噬菌体的鉴定和分离中的多轮筛选过程。
可互换使用的术语“前导序列”、“信号肽”或“分泌前导”包括包含指导为其一部分的多肽的细胞内运输的氨基酸残基的序列。多肽通常在它们的N端包含分泌前导、信号肽或前导序列。这些多肽还可包含切割位点,前导序列可在所述切割位点通过信号肽链内切酶从多肽的剩余部分切割。这些切割导致成熟多肽的产生。切割通常在分泌过程中或者在完整多肽已经被定位至适合的细胞区室之后发生。
“宿主细胞”包括可以是或者已经是用于转化核酸和/或包含编码本文所述分子的核酸的载体的受体的单独的细胞或细胞培养物。在本发明的方法中,宿主细胞可以是真核细胞,例如中国仓鼠卵巢(CHO)细胞或人胚肾(HEK)293细胞。其他适合的宿主细胞是本领域那些技术人员已知的。
B.详述
用于进行本发明的方法的技术是本领域中熟知的并且描述于标准的实验室教科书中,包括例如Ausubel等人,Current Protocols of Molecular Biology(分子生物学的现有流程),John Wiley andSons(1997);Molecular Clonina:A Laboratory Manual(分子克隆:实验室手册)第3版,J.Sambrook和D.W.Russell编辑,Cold Spring Harbor,New York,USA,Cold Spring Harbor Laboratory Press,2001;O’Brian等人,Analytical Chemistry of Bacillus Thuringiensis(苏云金杆菌的分析化学),Hickle和Fitch编辑,Am.Chem.Soc.,1990;Bacillus thuringiensis:biology,ecology and safety(苏云金杆菌:生物学、生态学和安全性),T.R.Glare和M.O’Callaghan编辑,John Wiley,2000;Antibody Phage Display,Methods and Protocols(抗体噬菌体展示),Humana Press,2001和Antibodies(抗体),G.Subramanian编辑,KluwerAcademic,2004。诱变可以例如使用定点诱变来进行(Kunkel等人,Proc.Natl.Acad.Sci USA 82:488-492(1985))。PCR扩增方法描述于美国专利第4,683,192、4,683,202、4,800,159和4,965,188以及若干教科书中,包括“PCR Technology:Principles and Applications for DNAAmplification(PCR技术:DNA扩增的原则和应用)”,H.Erlich编辑,Stockton Press,New York(1989)和PCR Protocols:A Guide to Methods and Applications(PCR流程:方法和应用的指南),Innis等人编辑Academic Press,San Diego,Calif.(1990)。
异源前导序列
人VpreB1(CAG30495)的主要同种型是145个氨基酸长度的多肽(图1中的SEQ ID NO:1),包括19个氨基酸的前导序列。相似的前导序列存在于其他VpreB多肽中。人截短的VpreB1序列(缺少天然VpreB1的C端的表征性的“尾部”),也被称为“VpreB1d Tail序列”并且表示为SEQ ID NO:5。
人λ5(CAA10962)的主要同种型是209个氨基酸长度的多肽(SEQID NO:7),包括30个氨基酸的前导序列。相似的前导序列存在于其他λ5多肽中。人截短的λ5序列(缺少天然λ5的N端的表征性的“尾部”),也被称为“λ5dTail序列”并且表示为SEQ ID NO:9。
天然人Vκ样多肽序列特别包括但不限于由显示为SEQ IDNO:11的AJ004956的多核苷酸编码的人κ样多肽(SEQ ID NO:12),包括20个氨基酸的前导序列。相似的前导序列存在于其他的Vκ样多肽中。
天然序列JCκ样多肽包括但不限于图5A中所示的AAB32987人JCκ多肽,其缺少原型前导序列(SEQ ID NO:26),包括可能的22个氨基酸的前导序列,所述22个中的15个氨基酸独特地附于典型重组的JCκ序列。相似的前导序列存在于其他的JCκ多肽中。
本发明提供用于以比从包含内源前导VpreB前导序列和/或λ5前导序列或者内源Vκ样前导序列和/或JCκ前导序列的序列产生替代轻链构建体时更高的产率产生替代轻链构建体的核酸和多肽构建体。本发明还提供了用于以比从包含VpreB和/或λ5的内源前导或者Vκ样和/或JCκ的内源前导或者没有内源前导序列的编码序列的DNA序列产生替代轻链构建体时更高的产率产生替代轻链构建体的载体、宿主细胞和方法。更高的产率是通过用本发明的异源前导序列替代至少一个内源分泌前导序列来获得的。相应地,本发明提供了包含异源前导序列的替代轻链和替代轻链构建体。
优选地,通过异源前导肽获得的表达水平是当在基本相同的条件下进行表达时,比通过使用内源前导序列获得的表达水平高至少约5%、高至少约10%、高至少约20%、高至少约30%、高至少约40%或者高至少约50%。
在本发明中,异源前导序列取代天然VpreB前导序列和/或天然λ5前导序列而融合于替代轻链多肽的氨基端,或者取代天然Vκ样前导序列和/或天然JCκ前导序列而融合于κ样替代轻链多肽的氨基端。发明人还发现与包含替代轻链序列(融合在一起或非共价结合的VpreB/λ5或Vκ样/JCκ序列)和抗体重链序列的替代轻链构建体的产生过程中的替代轻链的天然前导序列相反,某些异源前导序列的作用出人意料得好。
根据本发明,异源前导序列可以是来自高度翻译的蛋白的任何前导序列,包括抗体轻链以及人和非人哺乳动物分泌蛋白的前导序列。包括了分泌蛋白并且它们的序列可从公共数据库例如Swiss-Prot、UniProt、TrEMBL、RefSeq、Ensembl和CBI-Gene获得。此外,SPD,一个基于网络的分泌蛋白数据库是这些序列的来源,可在http://spd.cbi.pku.edu.cn获得。(参见,Chen等人,Nucleic Acids Res.,2005,33:D169-D173)。这些分泌蛋白包括但不限于抗体、细胞因子、淋巴因子、单核因子、趋化因子、多肽激素、消化酶和细胞外基质的成分。
细胞因子包括生长激素,例如人生长因子、N-甲硫氨酰人生长激素和牛生长激素;甲状旁腺激素;甲状腺素;胰岛素;胰岛素原;松弛素;松弛素原;糖蛋白激素,例如促卵泡激素(FSH)、促甲状腺激素(TSH)和黄体生成激素(LH);肝细胞生长因子;成纤维细胞生长因子;催乳素;胎盘催乳素;肿瘤坏死因子-α和-β(TNF-α和-β);米勒管抑制物质;小鼠促性腺激素相关肽;抑制素;激活素;血管内皮生长因子;整连蛋白;血小板生成素(TPO);神经生长因子,例如NGF-β;血小板生长因子;转化生长因子(TGF),例如TGF-α和TGF-β;胰岛素样生长因子-I和-II;促红细胞生成素(EPO);骨诱导因子;干扰素,例如干扰素-α、-β和-γ;集落刺激因子(CSF),例如巨噬细胞CSF(M-CSF)、粒细胞-巨噬细胞CSF(GM-CSF)和粒细胞-CSF(G-CSF);白细胞介素(IL),例如IL-1、IL-1a、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12;肿瘤坏死因子,例如TNF-α或TNF-β;MIP-1α;MIP-1β和包括LIF和试剂盒配体(KL)的其他多肽因子。
适合在本发明的构建体中使用的另外的前导序列包含在公众可获得的信号肽数据库例如SPdb信号肽数据库中,可从http://proline.bis.nus.edu.sq/spdb进入(参见Choo等人,BMCBioinformatics 2005,6:249)。
适合的异源前导序列的特别的实例包括但不限于人和非人哺乳动物白蛋白、转铁蛋白、CD36、生长激素、组织纤溶酶原活化因子(t-PA)、促红细胞生成素(EPO)和neublastin前导序列的前导序列以及来自其他分泌的人和非人蛋白的前导序列。
小鼠Igκ前导序列(METDTLLLWVLLLWVPGSTG-SEQ IDNO:36)可被用作异源前导序列。
当异源前导序列存在于i)VpreB和λ5替代轻链构建体两者中或ii)Vκ样和JCκ替代轻链构建体两者中时,i)或ii)中的每种异源前导系列可与其他的相同或者可与其他的不同。
除了来自天然蛋白的信号肽,本发明的异源前导序列包括合成的和共有的前导序列,其可以被设计以进一步提高天然存在的前导序列的性能并且特别地适用于本发明的替代轻链构建体表达所用的宿主生物体中最好的性能。
替代轻链构建体
本文中的替代轻链(SLC)构建体是以前B细胞受体(pre-BCR)为基础的,其在抗体谱的正常发育期间产生。与抗体不同,pre-BCR是三聚体,由同两个替代轻链成分VpreB和λ5配对的抗体重链组成。VpreB和λ5都是由未经历基因重排的基因编码并且在V(D)J重组开始之前在早期前B细胞中表达。pre-BCR在结构上与成熟的免疫球蛋白不同,因为它由一条重链和两个非共价结合的蛋白VpreB和λ5构成,即,它们具有三种成分,相反在抗体中具有其中的两种成分。而且,尽管VpreB与VλIg结构域同源而λ5与抗体的Cλ结构域同源,但是每一种都具有非典型的肽延伸:VpreB1在其C端具有另外21个残基;λ5在其N端具有50个氨基酸的延伸。替代抗体的设计和产生的更多细节提供于Xu等人,Proc.Natl.Acad.Sci.USA 2008,105(31):10756-61和2008年10月2日公开的PCT公开WO2008/118970中。
相似地,本文中描述的κ样替代轻链构建体是以前B细胞受体(pre-BCR)为基础的。κ样轻链是与JCκ融合基因相伴的种系VκIV基因。在这些基因的每一种中,肽延伸存在于与CDR3类似的位点周围的附近地区。当这两种蛋白在基因组水平没有显示出重新组合时,它们与重链的结合似乎是彼此互相排斥的并且与对于λ样替代轻链描述的结合类似。κ样替代轻链构建体的设计和产生的更多细节可在美国专利公开第2010-0062950号和Xu等人,J.Mol.Biol.2010,397,352-360中找到,其全部公开内容通过引用清楚地并入本文。
本发明涵盖替代轻链(SLC)多肽和包含具有替代轻链序列的SLC多肽的SLC构建体,所述替代轻链序列具有异源信号序列。在一个实施方案中,SLC构建体包含与λ5序列轭合的VpreB序列,其中所述VpreB序列和/或所述λ5序列的天然分泌前导序列被异源分泌前导序列代替。在另一个实施方案中,VpreB序列选自由天然VpreB1序列、天然VpreB2序列、天然VpreB3序列及其片段和变体组成的组。在一个另外的实施方案中,天然VpreB序列选自由SEQ ID NO:1的人VpreB1、SEQ ID NO:2和3的小鼠VpreB2、SEQ ID NO:4的人VpreB3、SEQ ID NO:5的人VpreB样多肽、SEQ ID NO:6的人VpreBdTail多肽及其片段和变体组成的组。在其他的实施方案中,λ5序列包含SEQ ID NO:7的人λ5样、SEQ ID NO:8的人λ5多肽、SEQ IDNO:9的人λ5dTail多肽中的所有或部分。
本发明还涵盖其中λ5序列和VpreB序列通过共价连接体连接的SLC构建体。在一个实施方案中,本发明提供其中λ5序列与VpreB序列非共价结合的SLC构建体。在一个另外的实施方案中,本发明涵盖其中所述VpreB序列和λ5序列的轭合物与抗体重链序列非共价结合的SLC构建体。
如本文所描述的,本发明涉及编码SLC多肽和包含SLC多肽的SLC构建体的分离的核酸分子。在一个实施方案中,本发明提供了编码包含与λ5序列融合的VpreB序列的替代轻链的核酸,其中所述VpreB序列和/或所述λ5序列的天然分泌前导序列被异源分泌前导序列代替。在另一个实施方案中,本发明提供了编码包含通过肽或多肽连接体与λ5序列连接的VpreB序列的替代轻链的核酸,其中所述VpreB序列和/或所述λ5序列的天然分泌前导序列被异源分泌前导序列代替。在一个另外的实施方案中,本发明提供了包含所述核酸的载体。在另一个实施方案中,本发明提供了用所述核酸转化的重组宿主细胞。
在另一个方面中,本发明提供了替代轻链构建体的文库。在另一个实施方案中,所述文库包含编码SLC的核酸。在一个另外的实施方案中,文库可以是展示的形式。
在一个另外的方面中,本发明涵盖κ样替代轻链多肽和包含κ样SLC多肽的SLC构建体。在一个实施方案中,本发明涉及包含与JCκ序列轭合的Vκ样序列的κ样SLC构建体,其中所述Vκ样序列和/或所述JCκ序列的天然分泌前导序列被异源分泌前导序列代替。在另一个实施方案中,Vκ样序列选自由SEQ ID NO:12-24及其片段和变体组成的组。在一个另外的实施方案中,JCκ序列选自由SEQ ID NO:26-39及其片段和变体组成的组。
在一个实施方案中,本发明涵盖κ样SLC构建体,其中所述Vκ样序列与所述JCκ序列融合。在另一个实施方案中,融合分别在所述Vκ样序列和所述JCκ序列的CDR3类似区处或周围发生。在一个实施方案中,本发明涵盖κ样SLC构建体,其中所述Vκ样序列和所述JCκ序列通过共价连接体连接。
在一个实施方案中,本发明提供了κ样SLC构建体,其中所述Vκ样序列与所述JCκ序列非共价结合。在一个实施方案中,本发明提供κ样SLC构建体,其中所述Vκ样序列和JCκ序列的轭合物与抗体重链序列非共价结合。
在一个实施方案中,本发明提供了κ样SLC构建体,其中所述分泌前导序列可以是合成序列。在一个实施方案中,本发明提供κ样SLC构建体,其中所述分泌前导序列可以是天然分泌前导序列的共有序列。
在另一个方面中,本发明提供编码κ样SLC构建体的分离的核酸。在一个实施方案中,本发明提供了编码包含与JCκ序列融合的Vκ样序列的κ样替代轻链的核酸,其中所述Vκ样序列和/或所述JCκ序列的天然分泌前导序列由异源分泌前导序列取代。在另一个实施方案中,本发明提供了编码包含通过肽或多肽连接体与JCκ序列连接的Vκ样序列的κ样替代轻链的核酸,其中所述Vκ样序列和/或所述JCκ序列的天然分泌前导序列被异源分泌前导序列代替。在一个另外的实施方案中,本发明提供了包含所述核酸的载体。在另一个实施方案中,本发明提供了用所述核酸转化的重组宿主细胞。
在一个实施方案中,本发明提供了κ样替代轻链构建体的文库。在另一个实施方案中,所述文库包含编码SLC的核酸。在一个另外的实施方案中,文库可以是展示的形式。
在一个另外的方面中,本发明提供了表达κ样SLC的方法。在一个实施方案中,本发明提供了在重组宿主细胞中表达κ样替代轻链的方法,所述方法包括用编码包含与JCκ序列共价连接的Vκ样序列的嵌合分子的核酸转化所述重组宿主细胞,其中所述Vκ样序列和/或所述JCκ序列的天然分泌前导序列被异源分泌前导序列代替。在一个另外的实施方案中,Vκ样序列通过肽或多肽连接体与JCκ序列连接。在另一个实施方案中,重组宿主细胞是真核细胞。在一个实施方案中,重组宿主细胞是中国仓鼠卵巢(CHO)细胞或人胚肾(HEK)293细胞。
在一个另外的实施方案中,本发明提供了包含表示为SEQ ID NO:6的VpreB序列的SLC构建体。在另一个实施方案中,本发明提供了包含表示为SEQ ID NO:10的λ5序列的SLC构建体。在一个实施方案中,本发明提供了包含表示为SEQ ID NO:35的多肽的SLC构建体。
λ样替代抗体的特定的实例包括其中VpreB序列(例如VpreB1、VpreB2或VpreB3序列,包括天然序列的片段和变体)与λ5序列轭合(包括天然序列的片段和变体)的多肽。这一类型的代表性融合提供于2008年10月2日公开的PCT公开WO 2008/118970中,其全部公开内容通过引用清楚地并入本文。具有异源前导序列的融合物的实例示例性说明于图3(SEQ ID NO:35)中。
在直接的融合中,通常VpreB序列(例如VpreB1、VpreB2或VpreB3序列)的C端与λ5序列的N端融合。尽管将全长的天然VpreB序列与全长的λ5序列融合是可能的(参见例如图7中的第一张图中),但是通常融合在两条多肽中的每一条中的CDR3类似位点处或周围发生。以VpreB1和λ5的类似CDR3位点为基础的代表性的融合构建体示例性说明于图6中。在这一实施方案中,融合可以在CDR3类似区的任一端的约10个氨基酸残基中或CDR3类似区的任一端的约10个氨基酸残基中的一个位点处发生。在一个优选的实施方案中,融合在天然人VpreB1序列(SEQ ID NO:1)的约氨基酸残基116-126之间和天然人λ5序列(SEQ ID NO:7)的约氨基酸残基82和93之间发生。
分别将VpreB序列或λ5序列与抗体λ轻链的CDR3区或抗体轻链的可变区融合也是可能的。其中VpreB和λ5中的仅一个被截短的另外的构建体也示于图7中。可使用抗体κ轻链序列制备相似的构建体。κ样替代轻链构建体的说明可在图12-19中找到。
在图11的右边示例性说明的是另外的直接融合物构建体。标为“SLC融合物1”的结构是四聚体,由两个二聚体组成,其中截短的V-preB1序列(缺少天然VpreB1的C端的表征性的“尾部”)与相似地截短的λ5序列的融合物与抗体重链非共价结合。标为“SLC融合物2”的结构是四聚体,由两个二聚体组成,其中截短的V-preB1序列(缺少天然VpreB1的C端的表征性的“尾部”)与抗体轻链可变区的融合物与抗体重链非共价结合。标为“SLC融合物3”的结构是四聚体,由两个二聚体组成,其中抗体轻链可变区与截短的λ5序列(缺少天然λ5的N端的表征性的“尾部”)的融合物与抗体重链非共价结合。
如上文所述,除了直接融合物,本发明的多肽构建体包括VpreB序列(包括天然序列的片段和变体)与异源序列例如λ5序列(包括天然序列的片段和变体)和/或抗体序列的非共价结合。因此,例如,全长VpreB序列可与截短的λ5序列非共价结合。可选择地,截短的VpreB序列可与全长的λ5序列非共价结合。
与抗体重链非共价结合的包含非共价结合的VpreB1和λ5序列的替代轻链构建体示于图11的左边。如不同的示例性说明所示,结构可包括例如全长VpreB1和λ5序列、与截短的λ5序列结合的全长VpreB1(“λ5dT”)、与全长λ5序列结合的截短的VpreB1序列(“VpreBdT”)以及与截短的λ5序列结合的截短的VpreB序列(“短的”)。
尽管图11示例性说明某些特定的构建体,但是本领域普通技术人员应当理解的是多种其他的构建体可以相似的方式制得并使用。例如,与图11中示例性说明的结构相反,结构可以是不对称的,在每条臂上包含不同的替代轻链序列和/或具有三聚体或五聚体的结构。
本文所有的替代轻链构建体(替代抗体)可与抗体序列结合。例如,如图9中所示,VpreB-λ5融合物可通过肽连接体与抗体重链可变区序列连接。在另一个实施方案中,VpreB-λ5融合物可与抗体重链或其包含可变区序列的片段非共价结合以形成二聚复合物。在还有另一个实施方案中,VpreB和λ5序列可与彼此以及抗体重链或其包含可变区序列的片段非共价结合,由此形成三聚复合物。包含抗体重链的示例性的构建体在图11中示例性说明。
κ样替代抗体的特定实例包括其中Vκ样序列(包括天然序列的片段和变体)与JCκ序列轭合(包括天然序列的片段和变体)的多肽。这一类型的代表性融合示例性说明于美国专利公开第2001-0062950号和Xu等人,J.Mol.Biol.2010,397,352-360,其全部公开内容通过引用清楚地并入本文。
本文的多肽构建体的特定实例包括其中Vκ样和/或JCκ序列与抗体重链或其片段结合的多肽。包含Vκ样和JCκ序列两者的特定的异源二聚构建体示例性说明于图12。如图12中所示,在本发明的κ样替代轻链构建体中,Vκ样多肽和/或JCκ多肽可分别包含在相似的抗体序列中不存在的C和N端延伸。可选择地,延伸的部分或全部可从本文的κ样替代轻链构建体移除。
其他的κ样替代轻链构建体,其可被单独使用或可被进一步衍生和/或与另外的异源序列例如抗体重链序列诸如全长抗体重链或其片段结合。
如图14中所示,尽管Vκ样多肽和/或JCκ多肽的C和N端延伸不是必须在本发明的构建体中存在,但是保留这些附属物中的至少一种的至少一部分是有利的,因为它们通过线性延伸或者例如作为筛选环状序列文库(loop library)的结果以约束的多样性的形式为产生组合的功能多样性提供了唯一的机会。此外,Vκ样多肽和/或JCκ多肽的“尾部”部分可与其他的肽和/或多肽融合,以提供多种所期望的特性,例如诸如增强的结合、另外的结合特异性、增强的pK、增加的半衰期、减少的半衰期、细胞表面锚定、细胞易位的增强、显性负活性等。特定功能的尾部延伸列于图18中。
如果需要,本发明的构建体可通过例如将来自包括已知的治疗抗体的抗体的CDR1、CDR和/或CDR3区的已知序列或序列基序掺入或附加至κ样替代轻链序列的CDR1、CDR2和/或CDR3类似区中来工程化。这允许不是抗体但是表现出相似或优于已知的治疗抗体的结合特异性和亲和性的结合特异性和亲和性的分子的产生。
由于Vκ样和JCκ基因编码可作为单独的蛋白起作用并且作为替代轻链起作用的多肽,替代样轻链可从真正的轻链工程化并且用于之前为工程化的真正的替代轻链所提出的每种应用。这可通过表达可变轻链区以包含与VpreB或Vκ样基因类似的肽延伸来完成。相似地,恒定区可被工程化以类似于λ5或JCκ基因以及它们的肽延伸。此外,任何嵌合体或异源二聚体配对组合都在本发明的范围内。
在某些实施方案中,SLC构建体包含异源氨基酸序列或非SLC多肽。在一些实施方案中,异源氨基酸序列可为本发明的构建体增加一种或多种另外的功能。SLC构建体可被设计以包括非SLC多肽。在一个实施方案中,非SLC多肽与第一SLC成分和/或第二SLC成分的融合。非SLC多肽的氨基端可与第一SLC成分的羧基端融合和/或非SLC多肽的羧基端可与第二SLC成分的氨基端融合。在另一个实施方案中,第一SLC成分是VpreB多肽或Vκ样多肽。在一个另外的实施方案中,第二SLC成分是λ5多肽或JCκ多肽。
具有另外的功能的λ样SLC构建体(包括具有所期望的结合特异性的抗体可变区序列)描述于图10中。特别地,图10示例性说明插入抗VEGF单链Fv(scFv)以产生连接VpreB和λ5的融合蛋白(图10A)。所产生的工程化的SLC受限的scFv与抗TNF抗体的重链配对。图10B描述抗VEGF scFv与VpreB的C端的融合。图10C描述抗卵白蛋白scFv与λ5的氨基端的融合。可形成具有与TNF-α和卵白蛋白两者结合的潜力的由三部分构成的蛋白复合物。图10D描述两种融合构建体(VpreB-抗VEGF scFv和λ5-抗卵白蛋白)与抗TNF-α抗体的重链组合以形成三特异性的分子。可使用这一策略构建不同的包括VpreB和λ5多肽序列的双功能和三功能构建体。此外,如图8中所描述的,组合的功能多样性可被掺入λ样SLC构建体。
具有另外的功能的κ样SLC构建体(包括具有所期望的结合特异性的抗体可变区序列)描述于图17中。特别地图17示例性说明了包括如上文所描述的Vκ样和JCκ多肽序列的多种双功能和三功能构建体。
可以二聚体或2部分的形式提供本发明的替代轻链(SLC)构建体。这一形式的实例提供于图9中,其显示VpreB-λ5融合物和抗体重链的蛋白结构(右边,从底部起第二个描述)。SLC构建体还可以三聚体或3部分的形式提供。图9显示相应于3部分的形式的VpreB、λ5和抗体重链的蛋白结构(右边,在底部描述)。
可以双功能或双特异性的形式提供本发明的替代轻链(SLC)构建体。图20显示其实例:(A)描述了替代抗体形式,而(B)描述了双功能和双特异性的替代抗体形式。如图20(B)中所示,SLC构建体可包括具有SLC多肽成份(例如VpreB、λ5、Vκ样、JCκ多肽或者其片段或变体)和非SLC分子的SLC融合多肽。在一个实施方案中,非SLC分子可以是具有某种功能的任何多肽。在另一个实施方案中,多肽可以是可提供另外的功能的细胞因子。在另一个实施方案中,非SLC多肽可以是提供另外的特异性的抗体片段。图20(C)描述示例性的SLC融合克隆策略和各自的氨基酸。斜阴影线区域代表VpreB(氨基酸120-145)和λ5(氨基酸38-92)的非免疫球蛋白尾部区。“L”表示内源前导序列而“mL”表示合成的Igκ前导序列。“融合”表示感兴趣的基因例如非SLC分子的融合位点。
替代轻链构建体的制备
编码替代轻链例如VpreB和λ5多肽或Vκ样或JCκ多肽的核酸可从天然来源例如发育中的B细胞分离和/或通过合成或半合成的方法获得。一旦这一DNA被鉴定和分离或以其他方式生产,其可被连接至用于进一步克隆或表达的可复制的载体中。
可用于表达本文的多肽的编码序列的克隆和表达载体是本领域中熟知的并且是可商业上获得的。载体成份通常包括但不限于下列中的一种或几种:信号序列、复制起点、一种或几种标记基因、增强子元件、启动子和转录终止序列。适于克隆或表达本文的载体中编码替代轻链构建体的DNA的宿主细胞是原核生物、酵母或较高级的真核生物(哺乳动物)细胞,哺乳动物细胞是优选的。
适合的哺乳动物宿主细胞系的实例包括但不限于SV40(COS-7,ATCC CRL 1651)转化的猴肾CV1系;亚克隆以便在悬浮培养基中生长的人胚肾(HEK)系293(HEK 293细胞),Graham等人,J.Gen Virol.36:59(1977));幼地鼠肾细胞(BHK,ATCC CCL 10);中国仓鼠卵巢细胞/-DHFR(CHO,Urlaub等人,Proc.Natl.Acad.Sci.USA77:4216(1980));小鼠支持细胞(TM4,Mather,Biol.Reprod.23:243-251(1980));猴肾细胞(CV1 ATCC CCL 70);非洲绿猴肾细胞(VERO-76,ATCC CRL-1587);人宫颈癌细胞(HELA,ATCC CCL 2);犬肾细胞(MDCK,ATCC CCL 34);buffalo大鼠肝细胞(BRL 3A,ATCC CRL 1442);人肺细胞(W138,ATCC CCL 75);人肝细胞(HepG2,HB 8065);小鼠乳房肿瘤(MMT 060562,ATCC CCL51);TRI细胞(Mather等人,Annals N.Y.Acad.Sci.383:44-68(1982));MRC 5细胞;FS4细胞和人肝癌系(Hep G2)。
对于在哺乳动物细胞中的使用,对表达载体的控制作用通常由病毒材料提供。因此,常规使用的启动子可来源于多瘤、腺病毒2、逆转录病毒、巨细胞病毒和猿猴病毒40(SV40)的基因组。其他的启动子例如β肌动蛋白启动子来源于异源来源。适合的启动子的实例包括但不限于SV40病毒的早期和晚期启动子(Fiers等人,Nature,273:113(1978))、人巨细胞病毒的立即早期启动子(Greenaway等人,Gene,18:355-360(1982))和通常与所期望的基因序列结合的启动子和/或控制序列,条件是这些控制序列与宿主细胞系统相容。
通过将增强子序列插入载体中来提高经由较高级真核生物的编码所需异源多肽的DNA的转录。增强子是DNA的顺式作用元件,通常约10bp至300bp,其对启动子起作用以增强其转录起始活性。增强子是相对地方向和位置依赖性的,但是优选地位于表达载体中存在的启动子序列的上游。增强子可来源于与启动子相同的来源,例如诸如来源于真核细胞病毒,例如在复制起点的后侧上的SV40增强子(bp100-270)、巨细胞病毒早期启动子增强子、在复制起点的后侧上的多瘤增强子和腺病毒增强子。
哺乳动物宿主细胞中使用的表达载体还包含多腺苷酸化位点,例如来源于病毒诸如例如SV40(早期和晚期)或HBV的那些。
复制起点可通过构建载体以包括外生源起点(如可来源于SV40或其他病毒(例如多瘤、腺病毒(Adeno)、VSV、BPV)来源的那些)来提供或可由宿主细胞提供。
表达载体通常包含编码对于用载体转化的宿主细胞的生存或生长来说必须的蛋白的可选择的标记。适合于哺乳动物细胞的可选择的标记的实例包括二氢叶酸还原酶(DHFR)、胸苷激酶(TK)和新霉素。
适合的哺乳动物表达载体是本领域中熟知的并且是可商业上获得的。因此,例如,本发明的替代轻链构建体可使用带有人巨细胞病毒(CMV)立即早期增强子/启动子区以启动DNA插入的组成型表达的pCI表达载体(Promega)在哺乳动物宿主细胞中产生。载体还可以是pTT5表达载体(National Research Council,Canada)。载体可包含作为可选择的标记的新霉素磷酸转移酶基因。
本发明的替代轻链构建体还可在细菌宿主细胞中生产。在细菌系统中使用的控制元件包括启动子和核糖体结合位点,所述启动子任选地包含操纵子序列。适合的启动子包括但不限于半乳糖(gal)、乳糖(lac)、麦芽糖、色氨酸(trp)、β-内酰胺酶启动子、噬菌体λ和T7启动子。此外,可使用合成的启动子,例如tac启动子。在细菌系统中使用的启动子通常还包含与编码Fab分子的DNA可操作地连接的Shine-Dalgamo(SD)序列。来自质粒pBR322的复制起点适于大多数革兰氏阴性细菌。
包含抗体替代轻链序列的多链构建体中的各条链的编码序列可存在于相同的表达载体中,在单独的调节序列控制下或者在单独的表达载体中,用于共转染包括真核和原核宿主的所期望的宿主细胞。因此,多个基因可使用可从Novagen商业获得的DuetTM载体共表达。
转化的宿主细胞可在不同的培养基中培养。用于培养哺乳动物宿主细胞的商业上可获得的培养基包括Ham′s F10(Sigma)、MinimalEssential Medium(基本必需培养基)((MEM),(Sigma))、RPMI-1640(Sigma)和Dulbecco′s Modified Eagle′s Medium(达尔伯克改良伊格尔培养基)((DMEM),Sigma)。此外,Ham等人,Meth.Enz.58:44(1979)和Barnes等人,Anal.Biochem.102:255(1980)中描述的培养基中的任一种可被用作所述宿主细胞的培养基。培养条件,例如温度、pH和类似条件,是之前与为表达所选择的宿主细胞一起使用的那些并且包括在制造商的说明书中或另外对于普通的技术人员来说是显而易见的。
另外的适于培养哺乳动物、细菌(例如大肠杆菌(E.coli)或其他宿主细胞的培养基同样描述于标准教科书,例如诸如Sambrook等人,如上文或Ausubel等人,同上。
在一个方面中,本发明提供在重组宿主细胞中表达替代轻链的方法。在一个实施方案中,所述方法包括提供编码SLC多肽或SLC融合多肽的核酸的步骤。在另一个实施方案中,所述方法包括用编码SLC多肽或SLC融合多肽的核酸转化或转染重组宿主细胞的步骤。在一个实施方案中,编码SLC融合多肽的核酸是包含与第二SLC序列共价连接的第一SLC序列的嵌合分子,其中所述第一SLC序列和/或所述第二SLC序列的天然分泌前导序列被异源分泌前导序列代替。第一SLC序列可以是VpreB序列、Vκ样序列或其融合多肽。第二SLC序列可以是λ5序列、JCκ序列或其融合多肽。
在一个实施方案中,VpreB序列与λ5序列共价连接,其中所述VpreB序列和/或所述λ5序列的天然分泌前导序列被异源分泌前导序列代替。在另一个实施方案中,VpreB序列与λ5序列融合。在一个另外的实施方案中,VpreB序列通过肽或多肽连接体与λ5序列连接。在一个另外的实施方案中,Vκ样序列与JCκ序列共价连接,其中所述Vκ样序列和/或所述JCκ序列的天然分泌前导序列被异源分泌前导序列代替。在一个另外的实施方案中,Vκ样序列与JCκ序列融合。在一个另外的实施方案中,Vκ样序列通过肽或多肽连接体与JCκ序列连接。
在所有的实施方案中,表达的方法包括用多于一种的编码替代轻链多肽的核酸转化或转染宿主细胞的步骤,所述替代轻链多肽包括替代轻链多肽和/或替代轻链融合多肽。
在所有的实施方案中,所述方法可进一步包含用编码抗体重链的核酸转化或转染宿主细胞的步骤。
在一个方面中,本发明提供表达具有提高的产率的替代轻链多肽和/或替代轻链融合多肽的方法。在一个实施方案中,利用异源前导序列替代天然前导序列的本发明的方法具有比不用异源前导序列代替天然前导序列的方法更高的多肽表达和产率的特征。
在一个实施方案中,重组宿主细胞是细菌细胞。在另一个实施方案中,宿主细胞是真核细胞。在一个实施方案中,重组宿主细胞是中国仓鼠卵巢(CHO)细胞或人胚肾(HEK)293细胞。
在一个方面中,本发明提供了包含本文描述的核酸的宿主细胞。在一个实施方案中,本发明提供用本文描述的至少一种核酸转化的重组宿主细胞。在一个另外的实施方案中,宿主细胞用编码SLC融合物的核酸转化,所述SLC融合物可以或可以不包括非SLC分子。
在所有的实施方案中,宿主细胞还用编码抗体重链的核酸进一步转化。
在所有的实施方案中,本发明提供包含本文描述的核酸的载体。在所有的实施方案中,宿主细胞用包含本文描述的核酸的至少一种载体转化。
纯化可通过本领域中已知的方法进行。在一个优选的实施方案中,使用Ni-NTA纯化系统(Invitrogen),替代轻链以6x带His标记的形式纯化。
κ样SLC分子可从现有的轻链V基因和轻链恒定基因工程化。如图15中所示,轻链是基因重排和RNA加工的产物。由于κ样SLC分子的成分提供来自未重排的轻链V基因和重排的轻链JC基因的替代功能,因此将来自所有其余的κ和λ轻链V基因的相似的翻译的蛋白工程化以制得Vκ样分子(图16A)以及其余的κJC重排(4种JCκ样)(图16B)和λJC重排(4种“J”x10种“恒定”=40种JCλ样)(图16B)的所有组合是可行的。与VpreB和λ5及其组合和嵌合体一起,这些工程化的分子中的每一种可为与使用Vκ样和JCκ的那些以及包含于2008年10月2日公开的PCT公开WO 2008/118970中的那些相似的目的而服务。
本发明的替代轻链可被用于构建用于预防和/或治疗疾病的分子。对于这些应用,包含替代轻链的分子通常以药物组合物的形式使用。技术和制剂通常可在Remington′s Pharmaceutical Sciences(雷明顿药学),第18版,Mack Publishing Co.(Easton,Pa.1990)中找到。还参见Wang和Hanson“Parenteral Formulations of Proteins and Peptides:Stability and Stabilizers(蛋白和肽的胃肠外制剂:稳定性和稳定剂)”Journal of Parenteral Science and Technology,Technical Report No.10,增刊42-2S(1988)。
多肽基础的药物组合物通常以冻干的制剂或水溶液的形式配制。可接受的载体、赋形剂或稳定剂在所使用的剂量和浓度下对受体无毒性的并且包括缓冲液,例如磷酸盐、柠檬酸盐和其他有机酸;抗氧化剂,包括抗坏血酸和甲硫氨酸;防腐剂(例如十八烷基二甲基苄基氯化铵;氯己双铵;苯扎氯铵;苄索氯铵;苯酚、丁醇或苯甲醇;对羟基苯甲酸烷基酯,例如对羟基苯甲酸甲酯或羟基苯甲酸丙酯;儿茶酚;间苯二酚;环己醇;3-戊醇和间甲酚);低分子量(少于约10个残基)的多肽;蛋白例如血清白蛋白、明胶或免疫球蛋白;亲水聚合物,例如聚乙烯吡咯酮;氨基酸例如甘氨酸、谷氨酸、天门冬酰胺、组氨酸、精氨酸或赖氨酸;单糖、双糖和其他碳水化合物,包括葡萄糖、甘露糖或糊精;螯合剂,例如EDTA;糖类,例如蔗糖、甘露醇、海藻糖或山梨糖醇;成盐平衡离子,例如钠;金属复合物(例如,锌蛋白复合物)和/或非离子表面活性剂,例如TWEENTM、PLURONICSTM或聚乙二醇(PEG)。
还可将分子捕获在微胶囊(例如通过凝聚技术或通过界面聚合(诸如分别地,羟甲基纤维素或明胶-微胶囊和聚(甲基丙烯酸甲酯)微胶囊)制备)、胶体药物递送系统(例如脂质体、白蛋白微球、微乳液、纳米粒子和纳米胶囊)或巨乳液中。这些技术公开于Remington′sPharmaceutical Sciences(雷明顿药学),同上中。
含有本文公开的替代轻链的分子还可配制为免疫脂质体。含有所述分子的脂质体通过本领域已知的方法制备,例如Epstein等人,Proc.Natl.Acad.Sci.USA 82:3688(1985);Hwang等人,Proc.Natl Acad.Sci.USA 77:4030(1980);美国专利第4,485,045和4,544,545号以及1997年10月23日公开的WO97/38731中所描述的。具有增加的循环时间的脂质体公开于美国专利第5,013,556号中。
特别有用的脂质体可通过反相蒸发法用包含磷脂酰胆碱、胆固醇和PEG衍生的磷脂酰乙醇胺(PEG-PE)的液体组合物来生产。脂质体通过确定孔径的过滤器挤出以产生具有所需半径的脂质体。本发明的分子的片段可经由二硫互换反应与脂质体轭合(Martin等人,J.Biol.Chem.257:286-288(1982))。化学治疗剂任选地包含在脂质体中。参见Gabizon等人,J.National Cancer Inst.81(19)1484(1989)。
对于疾病的预防或治疗,分子的适当剂量将取决于有待被治疗的感染类型、疾病的严重度和进程以及抗体是出于预防目的还是治疗目而施用。分子适合一次性或经一系列治疗施用于患者。取决于疾病的类型和严重度,约1μg/kg至约15mg/kg的抗体是用于无论例如通过一次或多次单独的施用还是通过连续输注施用于患者的典型的初始候选剂量。
包含本发明的替代轻链的分子适于在疾病的治疗或预防中使用。在一个实施方案中,本发明提供用作药物或用于治疗疾病的含替代轻链的分子。在另一个实施方案中,本发明提供包含替代轻链的分子用于制造用于治疗疾病的药剂的用途。所述分子可以是编码SLC多肽或SLC融合物的核酸。
在一个方面中,本发明提供用于在哺乳动物中治疗疾病的方法,所述方法包括向哺乳动物施用治疗有效量的包含替代轻链的分子的步骤。按照医师的指导,治疗组合物被短期(急性)或长期或间断施用。
本发明还提供了包含用于治疗、预防和/或诊断疾病的材料的试剂盒和制品。所述试剂盒包括容器和可位于容器上或与容器相关联的标签。容器可以是瓶、管型瓶、注射器或任何其他适合的容器并且可以从不同的材料例如玻璃或者塑料形成。容器装有具有如本文所描述的包含替代轻链的分子的组合物,并且可以具有无菌存取口。容器的实例包括静脉注射溶液包或有可用皮下注射针头刺穿的塞子的管型瓶。试剂盒可具有装有不同试剂例如稀释剂和缓冲液的另外的容器。标签可提供组合物的描述以及预期用途的说明书。包含所述分子的试剂盒具有用于例如细胞测定、来自细胞的多肽的纯化或免疫沉淀的用途。例如,为了蛋白的分离和纯化,试剂盒可含有结合与小珠(例如琼脂糖小珠)偶联的蛋白的包含替代轻链的分子。可提供包含用于体外(例如在ELISA或蛋白印迹中)检测和定量蛋白的分子的试剂盒。用于检测的这些分子可以与标记例如荧光剂或放射标记一起提供。
所述试剂盒具有包括作为活性剂的包含本文描述的替代轻链的分子的至少一个容器。可提供标记来指示组合物可用于治疗疾病。标记还可提供向需要治疗的受治疗者施用的说明书。所述试剂盒还可进一步包含具有药学上可接受的缓冲液例如抑菌性注射用水(BWFI)、磷酸盐缓冲盐水、林格氏溶液和葡萄糖溶液的另外的容器。最后,所述试剂盒还可含有任何适合的材料,包括其他缓冲液、稀释剂、过滤器、针头以及注射器。
本发明的更多的细节提供于下列非限制性实施例中。