本发明涉及2012年4月20日提交的标题为“Prostate-SpecificMembrane Antigen Binding Proteins And Related Compositions AndMethods”的PCT申请PCT/US12/034575,所述PCT申请要求2011年4月22日提交的美国临时专利申请61/478,449的优先权,且还涉及美国申请号61/636,557,该三个文献全部以全文引用的方式并入。
附图简述
图1是描绘先前产生的人源化Cris-7SMIP多肽的理论pI与约200种其它SMIP多肽的理论pI相比较的图。
图2A和2B说明了包含比本发明的CD3多肽高的pI的CD3结合SMIP多肽的剪接。图2A是能定量经过纯化的蛋白质的低分子量剪接段含量的SDS毛细管电泳。图2B含有剪接型CD3SMIP分子的说明。图2B中所示的序列对应于SEQ ID NO:4的氨基酸252-260、SEQ ID NO:4的243-252和SEQ ID NO:240的251-260。
图3是Cris-7小鼠VH与衍生的人源化VH序列的氨基酸序列比对。Cris7VH小鼠、H1、H2、H3、H4、H5、H6和共有序列分别对应于SEQ ID NO:45、22、24、26、28、30、32和229。
图4是Cris-7小鼠VL与衍生的人源化VL序列的氨基酸序列比对。Cris7VL小鼠、L1、L2、L3、L4和共有序列分别对应于SEQ IDNO:46、34、36、38、40和230。
图5是H3与生殖细胞系序列IGHV1-69*01和IGHV3-30*01的氨基酸序列比对。H3、IGHV1-69*01、IGHV3-30*01和共有序列分别对应于SEQ ID NO:26、43、44和331。
图6是生殖细胞系序列的VL区的Jκ区IGKV1-5*01与L1的氨基酸序列比对。所述VL区的Jκ区(IGKVI-5*01)、L1链和共有序列分别对应于SEQ ID NO:232、34和233。所列出的IGKJ1*01、IGKJ2*01、IGKJ3*01、IGKJ4*01和IGKJ5*01序列分别对应于SEQ IDNO:234-238。
图7A和7B描绘了与DRA209相比具有降低的理论pI的各种CD3结合多肽SMIP分子的氨基酸序列比对。针对DRA209、DRA219、DRA222、DRA221、DRA223、DRA224、DRA225和共有序列所列出的序列分别对应于SEQ ID NO:4的氨基酸1-423、SEQ ID NO:6的氨基酸1-423、SEQ ID NO:8的氨基酸1-423、SEQ ID NO:10的氨基酸1-423、SEQ ID NO:12的氨基酸1-423、SEQ ID NO:14的氨基酸1-426、SEQ ID NO:16和SEQ ID NO:239的氨基酸1-426。
图8是pI变体DRA233和DRA234与DRA161相比的氨基酸序列比对。针对DRA161、DRA233、DRA234和共有序列所列出的序列分别对应于SEQ ID NO:240、18、20和241。
图9是如何确定经验pI值的说明。
图10是显示DRA209SMIP和scFv的经验pI的图。
图11是显示DRA161SMIP与pI变体DRA233和DRA234相比的经验pI的图。
图12是显示用与DRA209和DRA161相同(DRA227除外)的方式结合T细胞的SMIP pI变体的图。DRA227SMIP用作对照且它不含CD3或T细胞结合域。各分子名称之后的字母“a”指示特定分子是在CHO细胞中产生且四位数是批次编号。
图13描绘了非还原型SDS-PAGE的图像,显示CD3结合SMIP构建体DRA233和DRA234与SMIP DRA161(它与DRA209共享相同的VH和VL)相比不那么倾向于破碎。
图14描绘了还原型SDS-PAGE的图像,显示CD3结合SMIP构建体DRA233和DRA234与SMIP DRA161(它与DRA209共享相同的VH和VL)相比不那么倾向于破碎。
图15是显示pI变体DRA233和DRA234主要是完整表达(例如,不进行剪接)的图和表。
图16是显示DRA161(经过纯化)的非还原型CE-SDS的图像。
图17显示了DRA234和DRA233的PK研究的数据。
图18提供了来自于如实施例14中所描述的DRA233和DRA234的WinNonLin分析的数据。
图19是DRA233和DRA234的PK估计值的表格。
图20是DRA161与DRA233(存在和不存在504小时时间点)和DRA234相比的PK参数的表格。
图21描绘了得自于使用不同的靶向CD19的同源二聚体双特异性多肽分子的靶依赖性T细胞增殖测定的结果。图21A和21B分别示出了如实施例10中所描述的CD4+T细胞增殖和CD8+T细胞增殖的结果。
图22描绘了得自于使用不同的靶向CD19的异源二聚体双特异性多肽分子的靶依赖性T细胞增殖测定的结果。图22A和22B分别示出了如实施例10中所描述的CD8+T细胞增殖和CD4+T细胞增殖的结果。
图23描绘了得自于使用不同的靶向CD19的多肽异源二聚体和同源二聚体的重定向T细胞细胞毒性测定的结果。图23A示出了同源二聚双特异性多肽TSC129a、TSC233和TSC234的结果。图23B示出了异源二聚双特异性多肽TSC127、TSC227和TSC228的结果。
图24描绘了得自于使用靶向RON的不同的双特异性多肽同源二聚体TSC275、TSC277、TSC278和TSC279的重定向T细胞细胞毒性测定的结果。
图25描绘了双特异性多肽异源二聚体和同源二聚体的T细胞结合的结果。图25A和25B示出了双特异性分子TSC228(异源二聚体)和TSC249(同源二聚体)与Jurkat细胞的剂量依赖性结合。
图26描绘了靶向PSMA的多肽同源二聚体的靶依赖性T细胞增殖的结果。图26A示出了在用TSC249处理后表达靶PSMA抗原的C4-2B细胞的结果。图26B示出了在用TSC249处理后不表达靶PSMA抗原的DU-145细胞的结果。图26C示出了当用TSC249处理经分离的T细胞时的结果。
图27描绘了得自于使用靶向PSMA的同源二聚双特异性多肽TSC194和TSC249的重定向T细胞细胞毒性测定的结果。
发明详述
本发明提供了与现有技术CD3结合多肽相比具有改良的特征的CD3结合多肽。已经通过修饰重链和/或轻链框架区和/或前铰链前铰链区中的氨基酸以降低分子的等电点而设计了本发明的分子以展现降低的等电点。在一个实施方案中,修饰是在VL区的Jκ区中进行。在一些实施方案中,修饰是通过用具有中性电荷的氨基酸取代具有正电荷的氨基酸和/或用具有负电荷的氨基酸取代具有中性电荷的氨基酸来进行。
在一些实施方案中,本发明的CD3结合多肽的理论pI比抗CD3DRA209SMIP(SEQ ID NO:4)低约0.5到2.5个单位。举例来说,DRA209的理论pI是9,而pI变体DRA219(SEQ ID NO:6)的理论pI是8.4,DRA221(SEQ ID NO:10)的理论pI是8.2,DRA222(SEQ IDNO:8)的理论pI是7.5,DRA223(SEQ ID NO:12)的理论pI是7.2,且DRA224(SEQ ID NO:14)的理论pI是6.8。在一些实施方案中,CD3结合多肽的经验等电点比多肽SEQ ID NO:4低至少1个pI单位。
令人惊讶的是,pI变体展现了改良的半衰期且在CHO细胞中表达得比DRA209更好,例如,参见以下实施例4,所述实施例描述了用于测量半衰期的方法。此外,与具有诸如DRA209结合域等其它抗CD3结合域的类似构建体相比,包含DRA222scFv的多特异性构建体展现了改良的性质(参见相关PCT公布号WO2012/145714)。
本文中所使用的章节标题仅用于组织目的,而不应被视为限制所描述的主题。本文中所引用的所有文献或文献的部分,包括但不限于专利、专利申请、论文、书籍和专著,都以全文引用的方式明确并入在此以用于任何目的。在所并入的文献或文献的部分中的一者或多者的术语定义与本申请中的术语定义相矛盾的情况下,以本申请中出现的定义为准。
除非另外指出,否则在本发明描述中,任何浓度范围、百分比范围、比率范围或整数范围都应理解为包括所述范围内的任何整数值,且当适当时,包括其分数(诸如整数的十分之一和百分之一)。除非另外指出,否则如本文中所使用,“约”意指所指示范围、值或结构的±20%。应理解,除非另外指出,否则如本文中所使用的术语“一个”和“一种”是指所枚举的组分中的“一个(种)或多个(种)”。使用代替性用词(例如“或”)应理解为意指代替物之一、两者或其任何组合。如本文中所使用,术语“包括”和“包含”以同义使用。另外,应理解,本申请对包含本文中所描述的组分(例如域或区)和取代基的各种组合的多肽的公开程度就如同个别地阐述各多肽。因而,个别多肽的特定组分的选择在本公开的范围内。
如本文中所使用,术语“结合域”或“结合区”是指能够特异性识别和结合诸如抗原、配体、受体、底物或抑制剂(例如CD3或肿瘤相关抗原,诸如RON、CD19、CD37或PSMA)等靶分子的蛋白质、多肽、寡肽或肽的域、区、部分或位点。示例性结合域包括单链抗体可变区(例如域抗体、sFv、scFv和scFab)、受体胞外域和配体(例如细胞因子、趋化因子)。在某些实施方案中,结合域包含以下各项或由以下各项组成:抗原结合位点(例如包含来自于置于交替构架区(FR)(例如任选地包含一个或多个氨基酸取代的人FR)中的抗体的可变重链序列和可变轻链序列或三个轻链互补决定区(CDR)和三个重链CDR)。已知多种用于鉴别本公开的特异性结合特定靶的结合域的测定,包括Western印迹、ELISA、噬菌体展示文库筛选和互相作用分析。如本文中所使用,CD3结合多肽可以具有“CD3结合域”和任选地存在的“第二结合域”。CD3结合域可以位于氨基或羧基末端。在某些实施方案中,CD3结合域包含来源于小鼠单克隆抗体(例如Cris-7或HuM291)的人源化scFv。举例来说,CD3结合域可以由源自于小鼠单克隆抗体的VH区和VL区构成,其中用诸如(Gly4Ser)3(SEQ IDNO:76)连接子等连接子接合VH区与VL区。在其它实施方案中,CD3结合域实质上由或由源自于小鼠单克隆抗体的人源化scFv组成。在一些实施方案中,本发明的CD3结合域包含鼠类Cris-7抗体或HuM291的重链CDR1、CDR2和CDR3以及轻链CDR1、CDR2和CDR3。
如果结合域以等于或大于105M-1的亲和力或Ka(即,特定结合相互作用的平衡缔合常数,单位是1/M)结合靶标而不显著结合测试样品中存在的其它组分,则它“特异性结合”靶标。结合域可以分类为“高亲和力”结合域和“低亲和力”结合域。“高亲和力”结合域是指具有至少107M-1、至少108M-1、至少109M-1、至少1010M-1、至少1011M-1、至少1012M-1或至少1013M-1的Ka的那些结合域。“低亲和力”结合域是指具有最多107M-1、最多106M-1、最多105M-1的Ka的那些结合域。或者,亲和力可以定义为特定结合相互作用的平衡解离常数(Kd),单位为M(例如10-5M到10-13M)。根据本公开的结合域多肽和单链多肽的亲和力可以使用常规技术容易地测定(参见例如Scatchard等(1949)Ann.N.Y.Acad.Sci.51:660;和美国专利号5,283,173、5,468,614或等效物)。
本领域中已知“CD3”为六个链的多蛋白复合物(参见例如Abbas和Lichtman,2003;Janeway等,第172和178页,1999),所述六个链是T细胞受体复合物的亚单元。在哺乳动物中,T-细胞受体复合物的CD3亚单元是CD3γ链、CD3δ链、两个CD3ε链和CD3ζ链同源二聚体。CD3γ、CD3δ和CD3ε链是含有单个免疫球蛋白域的免疫球蛋白超家族的高度相关细胞表面蛋白。CD3γ、CD3δ和CD3ε链的跨膜区带负电,这是允许这些链与带正电的T细胞受体链缔合的特征。CD3γ、CD3δ和CD3ε链的细胞内尾部各自含有称为基于免疫受体酪氨酸的活化基元或ITAM的单个保守基元,而各CD3ζ链具有三个。相信ITAM对于TCR复合物的信号传导能力是重要的。如本公开中所使用的CD3可以来自于不同的动物物种,包括人、猴子、小鼠、大鼠或其它哺乳动物。
如本文中所使用,“保守取代”在本领域中被公认为一个氨基酸取代具有相似性质的另一个氨基酸。示例性保守取代在本领域中是众所周知的(参见例如1997年3月13日公开的WO97/09433,第10页;Lehninger,Biochemistry,第二版;Worth Publishers,Inc.NY:NY(1975),第71-77页;Lewin,Genes IV,Oxford University Press,NY and CellPress,Cambridge,MA(1990),第8页)。在某些实施方案中,保守取代包括亮氨酸对丝氨酸取代。
如本文中所使用,术语“衍生物”是指在存在或不存在酶的情况下通过化学或生物学手段,例如通过糖基化、烷基化、酰化、酯形成或酰胺形成对肽的一个或多个氨基酸残基的修饰。
如本文中所使用,“源自于”指定多肽或蛋白质的多肽或氨基酸序列是指多肽的来源。在一个实施方案中,源自于特定序列的多肽或氨基酸序列具有实质上与该序列或其一部分同一的氨基酸序列,其中所述部分由至少10-20个氨基酸、至少20-30个氨基酸或至少30-50个氨基酸或至少50-150个氨基酸组成;或本领域技术人员可用其它方式鉴别它,因为在序列中具有其来源。在一个实施方案中,人源化或嵌合结合域源自于由另一个动物产生的抗体的VH和/或VL。举例来说,人源化结合域或嵌合结合域可能源自于鼠类抗体的VH和/或VL区。举例来说,可以通过用本领域中已知的方法修饰构架区来进行鼠类抗体的人源化。
源自于另一个多肽的多肽相对于起始多肽可能具有一个或多个突变,例如其一个或多个氨基酸残基经另一个氨基酸残基取代或其具有一个或多个氨基酸残基插入或缺失。多肽可能包含非天然存在的氨基酸序列。所述变体与起始多肽必然具有小于100%的序列同一性或相似性。在一个实施方案中,变体的氨基酸序列与起始多肽的氨基酸序列将具有约60%到小于100%的氨基酸序列同一性或相似性。在另一个实施方案中,变体的氨基酸序列与起始多肽的氨基酸序列将具有约75%到小于100%、约80%到小于100%、约85%到小于100%、约90%到小于100%、约95%到小于100%的氨基酸序列同一性或相似性。
如本文中所使用,除非另外规定,否则氨基酸残基在免疫球蛋白分子的可变区中的位置是根据Kabat编号规定(Kabat,Sequences ofProteins of Immunological Interest,第5版,Bethesda,MD:PublicHealth Service,National Institutes of Health(1991))进行编号,且氨基酸残基在免疫球蛋白分子的恒定区中的位置是根据EU命名法(Ward等,1995Therap.Immunol.2:77-94)进行编号。
如本文中所使用,术语“二聚体”是指由经由一种或多种形式的分子内力(包括共价键,例如二硫键;和其它相互作用,例如静电相互作用、盐桥、氢键合和疏水性相互作用)彼此缔合的两个亚单元组成且在适当条件(例如,在生理条件下,在适合表达、纯化和/或存储重组蛋白质的水溶液中,或在用于非变性和/或非还原电泳的条件下)下稳定的生物学实体。如本文中所使用的“异源二聚体”或“异源二聚体蛋白”是指由两个不同的多肽形成的二聚体。异源二聚体不包括由四个多肽(即,两个轻链和两个重链)形成的抗体。在本发明的一个实施方案中,使用包含异源二聚域的Emergent的Interceptor平台产生异源二聚体。如本文中所使用的“同源二聚体”或“同源二聚体蛋白”是指由两个同一的多肽形成的二聚体。在本发明的某些实施方案中,使用Emergent的SMIP、PIMS或Scorpion平台产生同源二聚体。
如本文中所使用,“铰链区”或“铰链”是指源自于以下的多肽:(a)跨膜蛋白(例如I型跨膜蛋白)的域间区;或(b)II型C-凝集素的茎部区(stalk region)。举例来说,铰链区可以源自于免疫球蛋白超家族成员的域间区;这个特定类别内的合适的铰链区包括(i)免疫球蛋白铰链区(举例来说,由上部区和核心区组成)或其功能变体,包括野生型和改变的免疫球蛋白铰链;和(ii)连接免疫球蛋白V样或免疫球蛋白C样结构域的区域(或其功能变体)。
“野生型免疫球蛋白铰链区”是指在抗体重链中发现的插入在CH1与CH2域之间且连接CH1与CH2域(对于IgG、IgA和IgD来说)或插入在CH1与CH3域之间且连接CH1与CH3域(对于IgE和IgM来说)的天然存在的上部和中间铰链氨基酸序列。在某些实施方案中,野生型免疫球蛋白铰链区序列是人的,且可以包含人IgG铰链区。
“改变的野生型免疫球蛋白铰链区”或“改变的免疫球蛋白铰链区”是指(a)具有最多30%氨基酸变化(例如,最多25%、20%、15%、10%或5%氨基酸取代或缺失)的野生型免疫球蛋白铰链区,或(b)野生型免疫球蛋白铰链区中长度为约5个氨基酸(例如约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个氨基酸)到最多约120个氨基酸(例如,长度为约10到约40个氨基酸或约15到约30个氨基酸或约15到约20个氨基酸或约20到约25个氨基酸),具有最多约30%氨基酸变化(例如,最多约25%、20%、15%、10%、5%、4%、3%、2%或1%氨基酸取代或缺失或其组合)且具有如PCT公布WO2011/090762和WO2011/090754中所公开的IgG核心铰链区的部分。
如本文中所使用,术语“人源化”是指通过使用基因工程技术使抗体或免疫球蛋白结合蛋白和源自于非人物种(例如小鼠或大鼠)的多肽对人具有较弱免疫原性,同时仍保留原始抗体的抗原结合性质的过程。在一些实施方案中,将抗体或免疫球蛋白结合蛋白和多肽(例如,轻链和重链可变区、Fab、scFv)的结合域人源化。可以使用称为CDR移植的技术及其变型将非人结合域人源化(Jones等,Nature 321:522(1986)),所述变型包括“改型”(Verhoeyen等,1988Science239:1534-1536;Riechmann等,1988Nature 332:323-337;Tempest等,Bio/Technol 19919:266-271)、“高嵌合”(Queen等,1989Proc Natl AcadSci USA 86:10029-10033;Co等,1991Proc Natl Acad Sci USA88:2869-2873;Co等,1992J Immunol 148:1149-1154)和“饰面”(Mark等,"Derivation of therapeutically active humanized and veneeredanti-CD18antibodies."Metcalf BW,Dalton BJ编,Cellular adhesion:molecular definition to therapeutic potential.New York:Plenum Press,1994:291-312)。如果源自于非人来源,则抗体或免疫球蛋白结合蛋白和多肽的其它区,诸如铰链区和恒定区结构域,也可以进行人源化。
“免疫球蛋白恒定区”或“恒定区”是本文中定义的术语,它是指对应于或源自于部分或所有的一个或多个恒定区结构域的肽或多肽序列。在一个实施方案中,恒定区含有源抗体的所有恒定区结构域。在一个实施方案中,恒定区包含IgG CH2和CH3域,例如IgG1CH2和CH3域。在一些实施方案中,恒定区不包含CH1域。在某些实施方案中,组成恒定亚区的恒定区结构域是人的。在一些实施方案中,本公开的融合蛋白的恒定区结构域缺乏或具有极少抗体依赖性细胞介导的细胞毒性(ADCC)和补体活化和补足依赖性细胞毒性(CDC)的效应因子功能,而保留结合一些Fc受体(诸如FcRn,即新生儿Fc受体)的能力且在体内保留相对较长的半衰期。
在其它变化方案中,本公开的融合蛋白包括保留ADCC和CDC之一或两者的所述效应因子功能的恒定域。在某些实施方案中,本公开的结合域与人IgG恒定区(例如IgG1)融合,其中所述恒定区具有一个或多个以下突变的氨基酸:位置234上的亮氨酸(L234)、位置235上的亮氨酸(L235)、位置237上的甘氨酸(G237)、位置318上的谷氨酸酯(E318)、位置320上的赖氨酸(K320)、位置322上的赖氨酸(K322)或其任何组合(根据EU进行编号)。举例来说,可以将这些氨基酸中的任何一个或多个变成丙氨酸。在另一个实施方案中,IgG Fc域(诸如IgG1)中的L234、L235、G237、E318、K320和K322(根据EU编号)各自突变成例如丙氨酸(即,分别为L234A、L235A、G237A、E318A、K320A和K322A)和任选地存在的N297A突变(即,实质上消除CH2域的糖基化)。
如这里所使用,术语“小模块式免疫药物蛋白”或“SMIP”用于指总体上如例如美国专利申请公布号2003/0133939、2003/0118592和2005/0136049中所公开的蛋白质支架,所述文献以全文引用的方式并入本文中。在本文中,实施例和公开内容全文中所描述的“SMIP分子”应理解为包含SMIP支架,例如按照从氨基到羧基末端的顺序包含第一结合域、铰链区和免疫球蛋白恒定区的结合蛋白。“CD3特异性SMIP分子”应理解为包含SMIP支架的CD3结合蛋白。
如这里所使用,术语“PIMS”用于指总体上如例如美国专利申请公布号2009/0148447中所公开的蛋白质支架,所述文献以全文引用的方式并入本文中。在本文中,实施例和公开内容全文中所描述的“PIMS分子”应理解为包含PIMS支架,例如按照从氨基到羧基末端的顺序包含免疫球蛋白恒定区、铰链区和第一结合域的结合蛋白。“CD3特异性PIMS分子”应理解为包含PIMS支架的CD3结合蛋白。
“Fc区”或“Fc域”是指对应于或源自于源抗体中负责结合细胞上的抗体受体和补体上的C1q组分的部分的多肽序列。Fc代表“结晶片段”,即容易形成蛋白质晶体的抗体片段。最初通过蛋白水解消化描述的独特蛋白质片段可以定义免疫球蛋白的总体通用结构。如文献中最初所定义,Fc片段由二硫化物连接的重链铰链区、CH2和CH3域组成。然而,近来该术语已被应用于由CH3、CH2和足以与第二个这样的链形成二硫化物连接的二聚体的铰链的至少一部分组成的单链。关于免疫球蛋白结构和功能的回顾,参见Putnam,The PlasmaProteins,第V卷(Academic Press,Inc.,1987),第49-140页;和Padlan,Mol.Immunol.31:169-217,1994。如本文中所使用,术语Fc包括天然存在的序列的变体。
如本文中所使用,“等电点”或pI是净电荷为零时的pH值。
如本文中所使用,术语“Interceptor”是用于指总体上如PCT公布WO2011/090762和WO2011/090754中所公开的单特异性或多特异性异源二聚蛋白质支架。本文中所描述的Interceptor分子应理解为包含两个非同一多肽链的CD3结合蛋白,各多肽链包含免疫球蛋白异源二聚域。界面免疫球蛋白异源二聚域是不同的。在一个实施方案中,免疫球蛋白异源二聚域包含CH1域或其衍生物。在另一个实施方案中,免疫球蛋白异源二聚域包含CL域或其衍生物。在一个实施方案中,CL域是Cκ或Cλ同种型或其衍生物。
如本文中所使用,II型C-凝集素的“茎部区”是指II型C-凝集素的细胞外域中位于C-型凝集素样结构域(CTLD;例如,类似于自然杀伤细胞受体的CTLD)与跨膜域之间的部分。举例来说,在人CD94分子(GenBank登录号AAC50291.1,PRI,1995年11月30日)中,细胞外域对应于氨基酸残基34-179,而CTLD对应于氨基酸残基61-176。因此,人CD94分子的茎部区包括氨基酸残基34-60,据发现它处在膜和CTLD之间(参见Boyington等,Immunity 10:75,1999;关于其它茎部区的描述,也参见Beavil等,Proc.Nat'l.Acad.Sci.USA89:753,1992;和Figdor等,Nature Rev.Immunol.2:77,2002)。这些II型C-凝集素还可以在茎部区与跨膜区或CTLD之间具有6到10个接合氨基酸。在另一个实施例中,233个氨基酸的人NKG2A蛋白(GenBank登录号P26715.1,PRI,2010年6月15日)具有在氨基酸71-93范围内的跨膜区和在氨基酸94-233范围内的细胞外域。CTLD由氨基酸119-231构成,且茎部区包含氨基酸99-116,两侧由五个和两个氨基酸连接。其它II型C-凝集素以及其细胞外配体结合域、域间或茎部区,和CTLD在本领域中是已知的(关于人CD23、CD69、CD72、NKG2A和NKG2D和其描述,分别参见例如GenBank登录号NP_001993.2;AAH07037.1,PRI,2006年7月15日;NP_001773.1,PRI,2010年6月20日;AAL65234.1,PRI,2002年1月17日;和CAA04925.1,PRI,2006年11月14日)。
如本文中所使用,跨膜蛋白(例如I型跨膜蛋白)的“域间区”是指跨膜蛋白的细胞外域中位于两个相邻结构域之间的部分。域间区的实例包括连接免疫球蛋白超家族成员的相邻Ig域的区域(例如,来自于IgG、IgA、IgD或IgE的免疫球蛋白铰链区;连接CD2的IgV域与IgC2域的区域;或连接CD80或CD86的IgV域与IgC域的区域)。域间区的另一个例子是连接CD22(一种结合I型唾液酸的Ig样凝集素)的非Ig域与IgC2域的区域。
“源自于”II型C-凝集素茎部区或“源自于”跨膜蛋白域间区(例如,免疫球蛋白铰链区)的多肽区是指约5到约150个氨基酸序列,其整体或一部分包括(i)野生型茎部区或域间区序列;(ii)野生型茎部区或域间区序列的片段;(iii)与(i)或(ii)具有至少80%、85%、90%或95%氨基酸序列同一性的多肽;或(iv)其中一、二、三、四或五个氨基酸具有缺失、插入、取代或其任何组合的(i)或(ii),例如一个或多个变化是取代,或一个或多个突变仅包括一个缺失。在一些实施方案中,与野生型茎部区序列,诸如源自于NKG2A、NKG2D、CD23、CD64、CD72或CD94的约8到约20、约10到约25或约15到约25个氨基酸的那些序列相比,茎部区衍生物对蛋白水解裂解更具抗性。
如本文中所使用,术语“接合氨基酸”或“接合氨基酸残基”是指多肽的两个相邻区域或结构域之间,诸如铰链与相邻免疫球蛋白恒定亚区之间,或铰链与相邻结合域之间,或连接两个免疫球蛋白可变域的肽连接子与相邻免疫球蛋白可变域之间的一个或多个(例如约2-10个)氨基酸残基。接合氨基酸可以由多肽构建体设计产生(例如,由在构建编码多肽的核酸分子期间使用限制酶位点产生的氨基酸残基)。结合域与铰链区之间的接合氨基酸在本文中称为前铰链区,例如,可由添加限制性位点到编码核苷酸序列中而产生。在一个实施方案中,前铰链区由约1、2、3、4、5、6、7、8、9、10或15个氨基酸组成。DRA209和DRA161的前铰链区序列不是鼠类Cris-7或人免疫球蛋白生殖细胞系序列的一部分。DRA209和DRA161的前铰链区是氨基酸序列RRT,而对于DRA219、DRA221、DRA222、DRA223、DRA224、DRA225、DRA228、DRA229、DRA233、DRA234、TSC249、TSC250、TSC251、TSC252、TSC295、TSC296、TSC301和TSC302,它是SSS。本发明的结合分子可能包括或可能不包括前铰链区。
如本文中所使用,短语“CH3与CH1或CL之间的连接子”是指CH3域(例如野生型CH3或突变型CH3)的C末端与CH1域或CL域(例如Ck)的N末端之间的一个或多个(例如约2-12个)氨基酸残基。
如本文中所使用,术语“有需要的患者”是指有风险罹患或正罹患能用本文中所提供的CD3结合蛋白或多肽或其组合物治疗或改善的疾病、病症或病状的患者。
如本文中所使用,术语“肽连接子”是指连接重链可变区与轻链可变区且提供与两个亚结合域的相互作用相容的间隔物功能以使得所得多肽保留对作为包含相同轻链和重链可变区的抗体的相同靶分子的特异性结合亲和力的氨基酸序列。在某些实施方案中,连接子由5到约35个氨基酸,例如约15到约25个氨基酸构成。
如本文中所使用,术语“药学上可接受的”是指当使用本领域中众所周知的途径施用时分子实体和组成在大多数受试者中不会产生过敏性或其它严重有害反应。联邦或州政府的管理机构批准的或美国药典或其它一般公认的药典中登记的供动物且更确切地说供人使用的分子实体和组成被视为是“药学上可接受的”。
如本文中所使用,术语“启动子”是指涉及结合RNA聚合酶以起始转录的DNA区域。
如本文中所使用,术语“核酸”、“核酸分子”或“聚核苷酸”是指呈单链或双链形式的脱氧核糖核苷酸或核糖核苷酸和其聚合物。除非有具体限制,否则该术语涵盖与参考核酸具有相似结合性质且以类似于天然存在的核苷酸的方式代谢的含有天然核苷酸类似物的核酸。除非另外指出,否则特定核酸序列还暗含其经保守修饰(例如简并密码子取代)的变体和互补序列以及明确指示的序列。具体地说,简并密码子取代可以通过产生一个或多个选定(或所有)密码子的第三位置经混合碱基和/或脱氧肌苷残基取代的序列来实现(Batzer等(1991)Nucleic Acid Res.19:5081;Ohtsuka等(1985)J.Biol.Chem.260:2605-2608;Cassol等(1992);Rossolini等(1994)Mol.Cell.Probes8:91-98)。术语核酸与基因、cDNA和由基因编码的mRNA可互换使用。如本文中所使用,术语“核酸”、“核酸分子”或“聚核苷酸”意在包括DNA分子(例如cDNA或基因组DNA)、RNA分子(例如mRNA)、使用核苷酸类似物产生的DNA或RNA类似物和其衍生物、片段和同源物。
术语“表达”是指由核酸编码的产物的生物合成。举例来说,在编码相关多肽的核酸区段的情况下,表达涉及将核酸区段转录到mRNA中和将mRNA翻译成一种或多种多肽。
术语“表达单元”和“表达盒”在本文中可互换使用,且表示编码相关多肽且能够在宿主细胞中表达核酸区段的核酸区段。表达单元典型地包含转录启动子、编码相关多肽的开放阅读框和转录终止子,全部呈可操作的构型。除转录启动子和终止子以外,表达单元可以进一步包括其它核酸区段,诸如增强子或聚腺苷酸化信号。
如本文中所使用,术语“表达载体”是指线性或环形核酸分子,其包含一个或多个表达单元。除一个或多个表达单元以外,表达载体还可以包括其它核酸区段,诸如一个或多个复制起点或一个或多个可选标记物。表达载体一般源自于质粒或病毒DNA,或可以含有两者的元件。
如本文中所使用,Scorpion是用于指多特异性结合蛋白支架的术语。举例来说,PCT申请公布号WO 2007/146968、美国专利申请公布号2006/0051844、PCT申请公布号WO 2010/040105、PCT申请公布号WO2010/003108和美国专利号7,166,707中公开了多特异性结合蛋白和多肽。Scorpion多肽包含两个结合域(所述结构域可以设计用于特异性结合相同或不同的靶标)、两个连接子和一个免疫球蛋白恒定亚区。PCT申请公布号WO2010/003108中描述了用于Scorpion分子的连接子。在一些实施方案中,连接子序列为约2-45个氨基酸或2-38个氨基酸或5-45个氨基酸。在一些实施方案中,连接子是抗体铰链区(例如来自于IgG)或C-凝集素茎部区。Scorpion蛋白是包含两个同一的由二硫化物键合的Scorpion多肽的同源二聚蛋白。
如本文中所使用,术语“序列同一性”是指两个或更多个聚核苷酸序列之间或者两个或更多个多肽序列之间的关系。当一个序列中的位置被比较序列的对应位置上的相同核酸碱基或氨基酸残基占据时,将所述序列称为在那个位置上“同一”。“序列同一性”百分比是通过确定两个序列中存在同一的核酸碱基或氨基酸残基的位置数以产生“同一的”位置数来计算。然后将“同一的”位置数除以比较窗中的总位置数并乘以100,以产生“序列同一性”百分比。通过在比较窗上比较两个最佳比对的序列来确定“序列同一性”百分比。核酸序列的比较窗的长度可以是例如至少20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、300、400、500、600、700、800、900或1000个或更多个核酸。多肽序列的比较窗的长度可以是例如至少20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、300个或更多个氨基酸。为了最佳比对序列以供比较,比较窗中的聚核苷酸或多肽序列部分可以包含称为空位的添加或缺失,而参考序列保持恒定。最佳比对是即使有空位的情况下也能在参考序列与比较序列之间产生最大的可能“同一的”位置数的比对。两个序列之间的“序列同一性”百分比可以使用程序版本“BLAST 2Sequences”确定,该程序版本可得自国家生物技术信息中心(截止到2004年9月1日),该程序并入了程序BLASTN(用于核苷酸序列比较)和BLASTP(用于多肽序列比较),这两个程序是基于Karlin和Altschul(Proc.Natl.Acad.Sci.USA90(12):5873-5877,1993)的算法。当利用“BLAST 2Sequences”时,参数(即,截止到2004年9月1日的缺省参数)可以用于字长(3)、开放空位罚分(11)、延伸空位罚分(1)、空位下降(50)、期望值(10)和任何其它所需参数,包括但不限于基质选项。如果两个核苷酸或氨基酸序列相对于彼此具有至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性,则该两个序列被视为具有“基本上相似的序列同一性”或“基本的序列同一性”。
如本文中所使用,“多肽”或“多肽链”是共价连接的氨基酸的单一线性和连续排列。它不包括以非线性方式,诸如经由链间二硫键连接在一起的两个多肽链(例如,轻链与重链经由二硫键连接的半免疫球蛋白分子)。多肽可以具有或形成一个或多个链内二硫键。关于如本文中所描述的多肽,提到对应于由SEQ ID NO说明的那些氨基酸残基的氨基酸残基包括所述残基的翻译后修饰。
“蛋白质”是包含一个或多个多肽链的大分子。蛋白质还可以包含非肽组分,诸如碳水化合物基团。碳水化合物和其它非肽取代基可以由产生蛋白质的细胞添加到蛋白质,并且将随细胞类型而变化。蛋白质在本文中是依据其氨基酸主链结构进行定义;一般不说明诸如碳水化合物基团等取代基,但仍然可能存在。
术语“氨基末端”(N末端)和“羧基末端”(C末端)在本文中用于表示多肽内的位置。在上下文允许的情况下,这些术语是参考特定序列或多肽部分使用以表示邻近或相对位置。举例来说,多肽内相对于参考序列位于羧基末端的某些序列位于参考序列的羧基末端附近,但未必在完整多肽的羧基末端上。
“T细胞受体”(TCR)是在T细胞表面上发现的分子,一般与CD3一起负责识别与主要组织相容性复合物(MHC)分子结合的抗原。在大部分T细胞中,它由高度可变α和β链的二硫化物连接的异源二聚体组成。在其它T细胞中,表达由可变γ和δ链组成的代替受体。TCR的各链是免疫球蛋白超家族的成员,并且拥有一个N末端免疫球蛋白可变域、一个免疫球蛋白恒定域、跨膜区和C末端的短胞质尾(参见Abbas和Lichtman,Cellular and Molecular Immunology(第5版),编者:Saunders,Philadelphia,2003;Janeway等,Immunobiology:TheImmune System in Health and Disease,第4版,Current BiologyPublications,第148、149和172页,1999)。如本公开中所使用的TCR可以来自于各种动物物种,包括人、小鼠、大鼠或其它哺乳动物。
如本文中所使用的“TCR复合物”是指由CD3链与其它TCR链缔合形成的复合物。举例来说,TCR复合物可以由CD3γ链、CD3δ链、两个CD3ε链、CD3ζ链的同源二聚体、TCRα链和TCRβ链构成。或者,TCR复合物可以由CD3γ链、CD3δ链、两个CD3ε链、CD3ζ链的同源二聚体、TCRγ链和TCRδ链构成。
如本文中所使用的“TCR复合物的组分”是指TCR链(例如TCRα、TCRβ、TCRγ或TCRδ)、CD3链(例如CD3γ、CD3δ、CD3ε或CD3ζ)或由两个或更多个TCR链或CD3链形成的复合物(例如TCRα与TCRβ的复合物、TCRγ与TCRδ的复合物、CD3ε与CD3δ的复合物、CD3γ与CD3ε的复合物,或TCRα、TCRβ、CD3γ、CD3δ和两个CD3ε链的亚TCR复合物)。
如本文中所使用的“抗体依赖性细胞介导的细胞毒性”和“ADCC”是指细胞介导的过程,其中表达FcγR的非特异性细胞毒性细胞(例如,单核细胞,诸如自然杀伤(NK)细胞和巨噬细胞)识别靶细胞上的结合抗体(或能够结合FcγR的其它蛋白质)且随后导致靶细胞溶解。原则上,具有活化FcγR的任何效应细胞都可能被触发而介导ADCC。介导ADCC的原代细胞是NK细胞,其仅表达FcγRIII,而单核细胞取决于它们的活化状态、定位或分化可以表达FcγRI、FcγRII和FcγRIII。关于造血细胞上的FcγR表达的回顾,参见例如Ravetch等,1991,Annu.Rev.Immunol.,9:457-92。
如本文中在提到多肽或蛋白质时使用的术语“具有ADCC活性”意指多肽或蛋白质(例如,包含具有CH2和CH3域的免疫球蛋白铰链区和免疫球蛋白恒定亚区,诸如源自于IgG的多肽或蛋白质(例如IgG1))能够通过结合表达Fc受体的细胞溶解型免疫效应细胞(例如NK细胞)上的细胞溶解型Fc受体(例如FcγRIII)来介导抗体依赖性细胞介导的细胞毒性(ADCC)。
如本文中所使用的“补体依赖性细胞毒性”和“CDC”是指正常血清中的组分(“补体”)与抗体或与靶抗原结合的其它C1q补体结合蛋白一起展现表达靶抗原的靶细胞的溶解的过程。补体由一组协同作用且有序排列以发挥其作用的血清蛋白组成。
如本文中所使用的术语“经典补体路径”和“经典补体系统”是同义的,并且是指活化补体的特定路径。经典路径需要抗原-抗体复合物以便以有序方式起始和参与九种主要蛋白质组分(指定为C1到C9)的活化。对于活化过程中的若干个步骤,产物是能催化后续步骤的酶。这一级联用相对较小的起始信号扩增并活化了大量补体。
如本文中关于多肽或蛋白质使用的术语“具有CDC活性”意指所述多肽或蛋白质(例如,包含具有CH2和CH3域的免疫球蛋白铰链区和免疫球蛋白恒定亚区,诸如源自于IgG的多肽或蛋白质(例如IgG1))能够通过结合C1q补体蛋白和活化经典补体系统来介导补体依赖性细胞毒性(CDC)。
如本文中所使用的“重定向T细胞细胞毒性”和“RTCC”是指T细胞介导的过程,其中使用能够特异性结合细胞毒性T细胞和靶细胞两者,且借此引发针对靶细胞的靶依赖性细胞毒性T细胞反应的多特异性蛋白将细胞毒性T细胞募集到靶细胞。
如本文中所使用,术语“治疗(treatment)”、“治疗(treating)”或“缓解”是指治疗性治疗或防范性/预防性治疗。若接受治疗的个体中的至少一种疾病症状有改善或治疗可以延迟个体中的进行性疾病的恶化或防止其它相关疾病发作,则治疗为治疗性的。
如本文中所使用,术语“转化”、“转染”和“转导”是指将核酸(例如核苷酸聚合物)转移到细胞中。如本文中所使用,术语“遗传转化”是指将DNA,尤其是重组DNA转移和并入到细胞中。转移的核酸可以经由表达载体而引入到细胞中。
如本文中所使用,术语“变体”是指不同于参考核酸或多肽,但保留其基本性质的核酸或多肽。一般来说,变体总体上密切类似于参考核酸或多肽且在许多区域中与参考核酸或多肽是同一的。举例来说,与活性部分或全长参考核酸或多肽相比,变体可以展现至少约70%、至少约80%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%序列同一性。
术语“轻链可变区”(也称为“轻链可变域”或“VL”)和“重链可变区”(也称为“重链可变域”或“VH”)分别是指来自于抗体轻链和重链的可变结合区。可变结合区由称为“互补性决定区”(CDR)和“构架区”(FR)的离散的定义明确的亚区组成。在一个实施方案中,FR被人源化。术语“CL”是指“免疫球蛋白轻链恒定区”或“轻链恒定区”,即,来自于抗体轻链的恒定区。术语“CH”是指“免疫球蛋白重链恒定区”或“重链恒定区”,取决于抗体同种型,它还可以进一步分为CH1、CH2和CH3(IgA、IgD、IgG)或CH1、CH2、CH3和CH4域(IgE、IgM)。“Fab”(抗原结合片段)是抗体中结合抗原的部分且包括重链中经由链内二硫键与轻链连接的可变区和CH1域。
本公开尤其提供了包含结合域,确切地说,包含特异性结合CD3的第一结合域的多肽和蛋白质。本公开的包含结合域的多肽和蛋白质可以包含以下各项中的一个或多个:免疫球蛋白恒定亚区、连接肽、铰链区、免疫球蛋白异源二聚域、免疫球蛋白二聚域、一个或多个接合氨基酸、标签等等。本文中进一步详细描述所公开的多肽和蛋白质的这些组分。
另外,本文中公开的CD3结合多肽和蛋白质可以呈多种不同形式中任一种的抗体或融合蛋白的形式(例如,融合蛋白可以呈SMIP蛋白、PIMS蛋白、Scorpion蛋白或Interceptor蛋白形式)。
在一些实施方案中,CD3结合多肽包含第二结合域。在一些实施方案中,CD3结合多肽从氨基到羧基末端包含CD3结合域、铰链区、恒定区和第二结合域。在其它实施方案中,CD3结合多肽从氨基到羧基末端包含第二结合域、铰链区、恒定区和CD3结合域。
根据本发明的CD3结合蛋白一般包括(a)至少一个包含如本文中所述的CD3结合域的CD3结合多肽链。在某些变化方案中,CD3结合多肽还包括(b)羧基末端连接到CD3结合域的铰链区和(c)免疫球蛋白恒定区(例如SMIP多肽)。在其它变化方案中,CD3结合多肽还包括(d)羧基末端连接到免疫球蛋白恒定亚区的第二铰链区,和(e)羧基末端连接到第二铰链区的第二结合域(例如Scorpion多肽)。在一些实施方案中,CD3结合多肽包含具有构架区、前铰链区和铰链区的CD3结合域。
在一些实施方案中,CD3结合多肽包含三个或更多个与SEQ IDNO:42相比经修饰的氨基酸,举例来说,所述修饰是用中性氨基酸取代带正电的氨基酸和/或用带负电的氨基酸取代中性氨基酸,例如在构架区和/或前铰链区中。在一些实施方案中,通过用中性氨基酸取代带正电的氨基酸和/或用带负电的氨基酸取代中性氨基酸在VH和/或VL的构架区中对至少2个、至少3个、至少4个、3-5个或3-10个氨基酸进行修饰。
在本发明的一些实施方案中,CD3结合多肽在前铰链区中包含例如能降低前铰链区或整个多肽的pI的修饰。前铰链区处于结合域与铰链区之间的接合处。举例来说,可以用序列SSS或SST置换具有序列RRT的三个氨基酸的前铰链区以降低等电点。在一些实施方案中,前铰链区与具有RRT前铰链区的CD3结合多肽相比具有降低的等电点。
在一个实施方案中,为了降低免疫原性的风险,将人生殖细胞系IgG序列中普遍存在的或人生殖细胞系序列中相同或邻近的位置上,例如在对应的人生殖细胞系IgG序列中含有的氨基酸取代到序列中。在一些实施方案中,所述人生殖细胞系IgG序列包含SEQ ID NO:43或44。
在一些实施方案中,与Cris-7VL Jκ(Jk)区小鼠序列LQIT(SEQID NO:252)相比,至少一个氨基酸修饰在VL区的Jk区内。在一些实施方案中,Jk区包含氨基酸序列VEIK(SEQ ID NO:253),例如代替LQIT(SEQ ID NO:252)。
在一些实施方案中,CD3结合多肽包含铰链区和恒定区,举例来说,CD3结合多肽可以包含(a)氨基末端连接到CD3结合域的铰链区,和(b)氨基末端连接到铰链区的免疫球蛋白恒定区(例如,PIMS多肽)。在一些实施方案中,CD3结合多肽从氨基到羧基末端包含CD3结合域、铰链区和恒定区。在一些实施方案中,CD3结合多肽从氨基到羧基末端包含恒定区、铰链区和CD3结合域。
典型地,上述形式的CD3结合多肽(SMIP、Scorpion或PIMS)能够进行同源二聚,典型地通过二硫键,经由免疫球蛋白恒定区和/或铰链区(例如,经由包含IgG CH2和CH3域的免疫球蛋白恒定区和IgG铰链区)。因而,在本发明的某些方面,两个同一的CD3结合多肽进行同源二聚,以形成二聚CD3结合蛋白。
在其它实施方案中,CD3结合多肽还包括能够与第二非同一多肽链中的不同的异源二聚域进行异源二聚的异源二聚域。在某些变化方案中,用于异源二聚的第二多肽链包括第二结合域。因此,在本发明的某些方面,两个非同一多肽链(一个包含CD3结合域且第二个任选地包含第二结合域)二聚以形成具有1到4个结合域的异源二聚蛋白质。在一些实施方案中,CD3结合多肽从氨基到羧基末端包含CD3结合域、铰链区、恒定区、异源二聚域和任选地存在的第二结合域。
在一些实施方案中,第二结合域结合靶分子或与其相互作用,且CD3结合多肽诱导T细胞细胞毒性。这可以呈非二聚体、异源二聚体或同源二聚体形式。在一些实施方案中,第二结合域结合肿瘤相关抗原或与其相互作用。在一些实施方案中,CD3结合多肽在肿瘤附近诱导T细胞溶解肿瘤细胞和/或诱导多克隆T细胞活化和扩增。
包含本发明的抗CD3结合域的多肽可以是或者包含抗体或包括有保留结合特异性的功能抗体片段或片段衍生物的抗体衍生物。在一些实施方案中,本发明包括含有可变重链域和/或轻链域的融合蛋白和其它多肽。
在本发明的一些实施方案中,CD3结合多肽包含了包含有选自SEQ ID NO:28、30、32、38和40的VH区序列或VL区序列的CD3结合域。在一些实施方案中,CD3结合域包含选自SEQ ID NO:22、24、26、28、30和32的VH区和选自SEQ ID NO:38和40的VL区。在一些实施方案中,CD3结合域包含选自SEQ ID NO:28、30和32的VH区和选自SEQ ID NO:34、36、38和40的VL区。在一些实施方案中,VH区包含SEQ ID NO:28且VL区包含SEQ ID NO:34;VH区包含SEQ ID NO:28且VL区包含SEQ ID NO:38;VH区包含SEQID NO:26且VL区包含SEQ ID NO:38;或VH区包含SEQ ID NO:26且VL区包含SEQ ID NO:34。在一些实施方案中,CD3结合多肽包含有包含重链CDR1、CDR2和CDR3以及轻链CDR1、CDR2和CDR3,且其中重链CDR3包含SEQ ID NO:51的CD3结合域。在一些实施方案中,CD3结合多肽包括有包含SEQ ID NO:49的重链CDR1、包含SEQ ID NO:50的CDR2和包含SEQ ID NO:51的CDR3,以及包含SEQ ID NO:52的轻链CDR1、包含SEQ ID NO:53的CDR2和包含SEQ ID NO:54的CDR3。
在一些实施方案中,CD3结合多肽包含选自SEQ ID NO:6、8、10、12、14、16、18和20的氨基酸序列。
本发明包括有包含二聚的单链多肽的多特异性结合蛋白,各单链多肽从氨基到羧基末端包含第一结合域、N末端连接子、免疫球蛋白恒定区、C末端连接子和本发明的CD3结合域。同样,本发明包括有包含二聚的单链多肽的多特异性结合蛋白,各单链多肽从氨基到羧基末端包含本发明的CD3结合域、N末端连接子、免疫球蛋白恒定区、C末端连接子和第一结合域。在一些实施方案中,N末端连接子可以包含免疫球蛋白铰链区或可能实质上由其组成。
在本发明的另一个方面,多特异性结合蛋白包含单链多肽,所述单链多肽从氨基到羧基末端包含第一结合域、N末端连接子、免疫球蛋白恒定区、C末端连接子和CD3结合域。同样,本发明包括多特异性结合蛋白,其从氨基到羧基末端包含CD3结合域、N末端连接子、免疫球蛋白恒定区、C末端连接子和第一结合域。
本发明包括多特异性结合蛋白,所述多特异性结合蛋白包含经由连接子域与第二结合域连接的第一结合域(例如,经由连接子与另一个scFv连接的scFv)。举例来说,本发明包括多特异性结合蛋白,其包含经由肽连接子域与CD3结合域(呈VH-连接子-VL或VL-连接子-VH取向)连接的第一结合域(呈VH-连接子-VL或VL-连接子-VH取向)。在一些实施方案中,呈scFv-连接子-scFv形式的双特异性蛋白质可以包含源自于针对T细胞抗原(诸如CD3)的抗体的可变重域和可变轻域,包括但不限于本文中所公开的可变域。隔开scFv域的连接子可以包含((Gly4)Ser)n,其中n=1-5(SEQ ID NO:74-78)。在一个实施方案中,连接子是((Gly4)Ser)3(SEQ ID NO:76)。连接子还可以包含约8-12个氨基酸。在一些实施方案中,呈这种形式(“双特异性单链抗体”)的本发明蛋白质不包含Fc区,且因此不具有Fc相关的效应功能。
本发明实质上包括任何类型的含有如本文中所描述的结合域的多肽。这包括抗体、其片段、scFv、Fab、双scFv单域抗体、双链抗体、双可变域结合蛋白和含有抗体或抗体片段的多肽。本文中描述了本发明中所包括的其它类型多肽。
在一些实施方案中,VH和VL域被用作scFv,且以允许scFv和VH/VL结合靶标的方式与其它多肽或氨基酸序列连接/融合。在一些实施方案中,如本文中所描述的VH和VL域用于抗体或其片段中。举例来说,将所述VH和VL域并入到VH和VL域在抗体中的天然位置。在一些实施方案中,本发明的CD3结合多肽是抗体,例如具有如本文中所描述的VL链和VH链。
在本发明的一个实施方案中,多特异性蛋白质是scFv二聚体或双链抗体,而不是完整抗体。双链抗体和scFv二聚体可以仅使用可变域构建而不具有Fc区。双链抗体是二价双特异性抗体,其中VH和VL域被表达在单一多肽链上,但所使用的肽连接子过短而无法允许同一链上的两个结构域配对,从而迫使所述结构域与另一个链的互补域配对且产生两个抗原结合位点(参见例如Holliger,P.等(1993)Proc.Natl.Acad.Sci.USA 90:6444-6448;Poljak,R.J.等(1994)Structure 2:1121-1123)。所述抗体结合部分在本领域中是已知的(Kontermann和Dubel编,Antibody Engineering(2001)Springer-Verlag.New York.790pp.(ISBN 3-540-41354-5)。
在本发明的一个实施方案中,多特异性蛋白质是经二硫化物稳定的双链抗体。举例来说,多特异性抗体可以包含两个独特的多肽,它们共表达以产生对2个特异性中的每一个都具有一个结合位点的共价连接的异源二聚复合物。在这个实施方案中,各Fv是通过呈VLA-VHB(第一链)和VLB-VHA(第二链)构型的一个链上的VL伴侣与第二个链上的VH伴侣缔合而形成。这可以通过两个代替羧基末端异源二聚域中的任一个加以稳定:一个链上的VEPKSC(SEQ ID NO:254)与另一个链上的FNRGEC(SEQ ID NO:255)配对,或带相反电荷的卷曲螺旋域的配对。参见例如Moore等,2011,Blood.117:4542-4551。在这个实施方案中,多特异性结合蛋白可以包含具有与第一结合域VL连接的CD3结合域VH的第一链,且第二链包含与第一结合域VH连接的CD3结合域VL,并且两个链经由二硫键在C末端连接。可以使用源自于已知抗体的可变重链和轻链,包括例如本文中所公开的可变重链和轻链来设计经二硫化物稳定的双链抗体。
在另一个实施方案中,多特异性结合蛋白是能够特异性结合第一结合位点(例如肿瘤抗原)和TCR复合物的双可变域结合蛋白。在这个实施方案中,重组蛋白包含多肽链,其中所述多肽链包含VD1-(X1)n-VD2-C--(X2)n,其中VD1是第一可变域,VD2是第二可变域,C是恒定域,X1是连接子(例如,约10到20个氨基酸长的多肽连接子),X2代表Fc区且n是0或1。参见例如美国专利号8,258,268。
在本发明的一个实施方案中,多特异性结合蛋白包含一个、两个、三个或更多个多肽链。举例来说,本发明包括多特异性蛋白质,其具有包含VH1-VL2的第一链,包含CH2-CH3-VL1-VH2的第二链和包含CH2-CH3的第三链。在这个实施方案中,VH1和VL1可以对应于第一结合域的可变域,而VH2和VL2可以对应于抗CD3可变域。或者,VH1和VL1可以对应于抗CD3可变域,而VH2和VL2可以对应于第一结合域的可变域。
在其它实施方案中,多特异性结合蛋白由包含不同的单链多肽的二聚单链多肽链(异源二聚体)构成。在这种形式(“多特异性异源二聚体”)中,各多肽链包含结合域、N末端连接子、恒定区、C末端连接子和任选地存在的另一个结合域且还包括异源二聚域。在某些变化方案中,用于异源二聚的第二多肽链包括其它结合域。因此,在本发明的某些实施方案中,异源二聚重组蛋白可以含有两个、三个或四个不同的结合域。关于一些例子和相关方法,参见PCT公布号WO2011/090762。
如上文所指出,本公开的CD3结合多肽包含特异性结合CD3的结合域。在一些变化方案中,CD3结合域能够竞争结合氨基酸序列如SEQ ID NO:41中所示的具有单链Fv(scFv)的CD3。在特定的实施方案中,CD3结合域包含(i)包含CDR HCDR1、HCDR2和HCDR3的免疫球蛋白重链可变区(VH),和(ii)包含CDR LCDR1、LCDR2和LCDR3的免疫球蛋白轻链可变区(VL)。合适的CD3结合域包括具有源自于鼠类单克隆抗体Cris-7的VL和VH区的CD3结合域(Reinherz,E.L.等(编),Leukocyte typing II.,Springer Verlag,New York,(1986)。在一些这样的实施方案中,LCDR3具有SEQ ID NO:54中所述的氨基酸序列和/或HCDR3具有SEQ ID NO:51中所述的氨基酸序列;且LCDR1和LCDR2分别任选地具有如SEQ ID NO:52和SEQ ID NO:53中所述的氨基酸序列,且HCDR1和HCDR2分别任选地具有如SEQID NO:49和SEQ ID NO:50中所述的氨基酸序列。在一些实施方案中,举例来说,LCDR1、LCDR2和LCDR3具有分别如SEQ ID NO:52、53和54中所示的氨基酸序列;和/或HCDR1、HCDR2和HCDR3具有分别如SEQ ID NO:49、50和51中所示的氨基酸序列。
可以得到本公开的结合域的示例性抗CD3抗体包括Cris-7单克隆抗体(Reinherz,E.L.等(编),Leukocyte typing II.,Springer Verlag,New York,(1986)
(VL=QVVLTQSPAIMSAFPGEKVTMTCSASSSVSYMNWYQQKSGTSPKRWIYDSSKLASGVPARFSGSGSGTSYSLTISSMETEDAATYYCQQWSRNPPTFGGGTKLQITR(SEQ ID NO:46)且
VH=QVQLQQSGAELARPGASVKMSCKASGYTFTRSTMHWVKQRPGQGLEWIGYINPSSAYTNYNQKFKDKATLTADKSSSTAYMQLSSLTSEDSAVYYCASPQVHYDYNGFPYWGQGTLVTVSA(SEQID NO:45));HuM291(Chau等(2001)Transplantation 71:941-950(VL=DIQMTQSPSSLSASVGDRVTITCSASSSVSYMNWYQQKPGKAPKRLIYDTSKLASGVPSRFSGSGSGTDFTLTISSLQPEDFATYYCQQWSSNPPTFGGGTKVEIK(SEQ ID NO:72)且
VH=QVQLVQSGAEVKKPGASVKVSCKASGYTFISYTMHWVRQAPGQGLEWMGYINPRSGYTHYNQKLKDKATLTADKSASTAYMELSSLRSEDTAVYYCARSAYYDYDGFAYWGQGTLVTVSS(SEQID O:73);BC3单克隆抗体(Anasetti等(1990)J.Exp.Med.172:1691);OKT3单克隆抗体(Ortho muliicenier Transplant Study Group(1985)N.Engl.J.Med.313:337)及其衍生物,诸如OKT3ala-ala(也称为OKT3AA-FL或OKT3FL),即在位置234和235上具有丙氨酸取代的人源化Fc变体(Herold等(2003)J.Clin.Invest.11:409);维西珠单抗(Carpenter等(2002)Blood 99:2712);G19-4单克隆抗体(Ledbetter等,1986,J.Immunol.136:3945)和145-2C11单克隆抗体(Hirsch等(1988)J.Immunol.140:3766)。示例性抗TCR抗体是BMA031单克隆抗体(Borst等(1990)Human Immunology 29:175-188)。
在一些实施方案中,结合域是包含相关靶特异性VH和VL区的单链Fv片段(scFv)。在某些实施方案中,VH和VL区是人的。
在本发明的一个实施方案中,CD3结合多肽的经验和/或理论pI比DRA209SMIP的小至少0.25、0.5、0.75、1、1.25、1.5、2、2.5或更多个单位。在一些实施方案中,本发明的CD3结合多肽的经验和/或理论pI比DRA209SMIP的小约0.25到约2.5个、0.5到约2.5个、约0.5到约2.0个、约0.5到约1.5个、约0.5到约1.25个、约0.5到约1.0个、约0.5到约0.75个、约0.75到约1.0个、约0.75到约1.25个、约0.75到约1.5个、约0.75到约2.0个、约1.0到约1.5个、约1.0到约2.0个或约1.0到约2.5个单位。在一些实施方案中,本发明的CD3多肽的经验或理论pI小于约8.9、8.8、8.7、8.6、8.5、8.4、8.3、8.2、8.1、8、7.5、7.25、7.0或6.75。在一些实施方案中,本发明的CD3多肽的经验或理论pI为约8.9、8.8、8.7、8.6、8.5、8.4、8.3、8.2、8.1、8、7.5、7.25、7.27.0、6.8或6.75。在一些实施方案中,本发明的CD3多肽的经验或理论pI为约7.9到约8.7、7.9到约8.6、8.0到约8.6、8.0到约8.5、8.0到约8.4、8.0到约8.3、8.0到约8.2、8.0到约8.1、约8.1到约8.6、约8.2到约8.6、约8.3到约8.6、约8.4到约8.6、约8.5到约8.6、约8.5到约8.3、约8.4到约8.2或约8.3到约8.1。
在某些实施方案中,CD3结合域包含或是与SEQ ID NO:41的scFv相比pI(经验和/或理论)降低至少约0.25、0.5、1、1.25、1.5、2、2.5或更多个单位的scFv。在一些实施方案中,CD3结合域包含或是pI(经验和/或理论)比SEQ ID NO:41的降低约0.25到约2.5、0.5到约2.5、约0.5到约2.0、约0.5到约1.5、约0.5到约1.25、约0.5到约1.0、约0.5到约0.75、约0.75到约1.0、约0.75到约1.25、约0.75到约1.5、约0.75到约2.0、约1.0到约1.5、约1.0到约2.0或约1.0到约2.5个单位的scFv。这样的scFv包括SEQ ID NO:6、8、10、12、14、16、18和20内所含的scFv,或与SEQ ID NO:6、8、10、12、14、16、18和20内所含的scFv的氨基酸序列具有至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、至少约99.5%或100%同一性的scFv。
在一些实施方案中,本发明的CD3结合域与SEQ ID NO:41具有约80%到约99%、约82%到约99%、约84%到约99%、约86%到约99%、约88%到约99%、约90%到约99%、约92%到约99%、约94%到约99%、约96%到约99%、约97%到约99%、约98%到约99%、约80%到约85%、约85%到约90%、约85%到约95%、约90%到约97%、约90%到约95%、约90%到约93%、约90%到约91%、约95%到约96%、约96%到约97%、约97%到约98%、约96%到约97%或约96%到约98%的同一性。
在一些实施方案中,本发明的CD3结合域是SEQ ID NO:41的变体,其中已经使氨基酸序列中的一个或多个氨基酸突变以降低结合域的pI。突变包括用一个氨基酸取代另一个氨基酸以降低结合域的pI、插入氨基酸以降低结合分子的pI和/或缺失氨基酸以降低结合域的pI。在一个实施方案中,突变是取代。在一些实施方案中,突变在可变链的构架区中。在一些实施方案中,变体中有1、2、3、4、5、6、7、8、9、10或更多个氨基酸突变。
在一个实施方案中,CD3结合域包含或是包含选自SEQ ID NO:28、30、32、38和40的重链或轻链的scFv。在另一个实施方案中,CD3结合域包含选自SEQ ID NO:22、24、26、28、30和32的VH区和选自SEQ ID NO:38和40的VL区。在另一个实施方案中,CD3结合域包含选自SEQ ID NO:28、30和32的VH区和选自SEQ ID NO:34、36、38和40的VL区。在另一个实施方案中,CD3结合域包含SEQ ID NO:28和34。在另一个实施方案中,CD3结合域包含SEQ IDNO:28和38。在另一个实施方案中,CD3结合域包含SEQ ID NO:26和38。在另一个实施方案中,CD3结合域包含SEQ ID NO:26和34。在一些实施方案中,CD3结合域包含选自SEQ ID NO:38和40的VL区和选自SEQ ID NO:22、24、26、28、30和32的VH区。在其它实施方案中,与来自于特异性结合相关靶标的单克隆抗体或其片段或衍生物(例如CD3)的CDR相比,各CDR包含不超过一个、两个或三个取代、插入或缺失。
在一些实施方案中,CD3结合域结合T细胞上的T细胞受体复合物的CD3ε亚单位或与其相互作用。在一些实施方案中,CD3结合域与Cris-7或HuM291单克隆抗体竞争结合CD3ε。
在一些实施方案中,CD3结合多肽诱导T细胞受体复合物内在化。
在一些变化方案中,结合域是包含由肽连接子接合的免疫球蛋白VL区和VH区的单链Fv(scFv)。用于接合VL区和VH区的肽连接子的使用在本领域中是众所周知的,且这一特定领域内存在许多公布。一种广泛使用的肽连接子是由3个重复的Gly-Gly-Gly-Gly-Ser(SEQ IDNO:74)氨基酸序列(Gly4Ser)3(EQ ID NO:76)组成的15聚体。在一些实施方案中,肽连接子包含SEQ ID NO:74-78中的任一个或由其组成。已经使用了其它连接子,且已经使用噬菌体展示技术以及选择性感染性噬菌体技术使连接子序列多样化和选择适当的连接子序列(Tang等,J.Biol.Chem.271,15682-15686,1996;Hennecke等,ProteinEng.11,405-410,1998)。在某些实施方案中,VH区和VL区是通过具有包含式(Gly4Ser)n的氨基酸序列的肽连接子相连,其中n=1-5(分别是SEQ ID NO:74-78)。可以通过随机突变发生优化简单连接子(例如(Gly4Ser)n)来获得其它合适的连接子。
在特定的实施方案中,结合域包含人源化免疫球蛋白VL和/或VH区。用于使免疫球蛋白VL区和VH区人源化的技术在本领域中是已知的,且论述于例如美国专利申请公布号2006/0153837中。
期望“人源化”产生免疫原性较弱、完全保留原始分子的抗原结合性质的抗体。为了保留原始抗体的所有抗原结合性质,将再产生其抗原结合位点结构的“人源化”型式。这可以通过在保留或不保留重要构架残基的情况下仅将非人CDR移植到人可变构架域和恒定区上(Jones等,Nature 321:522(1986);Verhoeyen等,Science 239:1539(1988))或通过重组整个非人可变域(以保留配体结合性质)但通过审慎地置换暴露的残基用人样表面将其“掩蔽”(以降低抗原性)(Padlan,Molec.Immunol.28:489(1991))来实现。
实质上,通过CDR移植进行人源化涉及仅将非人抗体的CDR重组到人可变区构架和人恒定区上。理论上,这将显著降低或消除免疫原性(除非存在同种异型或个体基因型差异)。然而,已经报告也可能需要保留原始抗体的一些构架残基(Reichmann等,Nature,332:323(1988);Queen等,Proc.Natl.Acad.Sci.USA,86:10,029(1989))。
需要保留的构架残基适于通过计算机模拟来鉴别。或者,可以通过比较已知的抗原结合位点结构来潜在地鉴别重要的构架残基(Padlan,Molec.Immunol.,31(3):169-217(1994),以引用的方式并入本文中)。
潜在地影响抗原结合的残基分为若干组。第一组包含具有抗原位点表面的连续残基,它们因此可以与抗原直接接触。这些残基包括氨基末端残基和与CDR相邻的残基。第二组包括可能通过接触抗体中的CDR或另一个肽链而改变CDR的结构或相对排列的残基。第三组包含具有可能影响可变域的结构完整性的隐藏侧链的氨基酸。这些组中的残基通常是在相同的位置上发现的(Padlan,1994,同上),但取决于编号系统,它们在鉴别时的位置可能不同(参见Kabat等,"Sequencesof proteins of immunological interest,第5版,发行号91-3242,U.S.Dept.Health&Human Services,NIH,Bethesda,Md.,1991)。
尽管本文中描述的一些例子涉及scFv、SMIP、Scorpion和Interceptor分子而不是抗体的人源化,但本领域中关于人源化抗体的知识适用于根据本发明的多肽。
在某些实施方案中,铰链是野生型人免疫球蛋白铰链区。在某些其它实施方案中,可以在野生型免疫球蛋白铰链区的氨基或羧基末端上添加一个或多个氨基酸残基作为融合蛋白构建体设计的一部分。举例来说,铰链氨基末端的其它接合氨基酸残基可以是“RT”、“RSS”、“TG”或“T”,或在铰链羧基末端可以是“SG”,或可将铰链缺失与添加组合,诸如在羧基末端添加具有“SG”的ΔΡ。
在某些实施方案中,铰链是改变的免疫球蛋白铰链,其中野生型免疫球蛋白铰链区中的一个或多个半胱氨酸残基经一个或多个其它氨基酸残基(例如丝氨酸或丙氨酸)取代。
示例性改变的免疫球蛋白铰链包括但不限于存在野生型人IgG1铰链中发现的一个、两个或三个半胱氨酸残基被一个、两个或三个不同的氨基酸残基(例如丝氨酸或丙氨酸)取代的免疫球蛋白人IgG1铰链区。改变的免疫球蛋白铰链可能另外存在脯氨酸被另一个氨基酸(例如丝氨酸或丙氨酸)取代。举例来说,上述改变的人IgG1铰链可以另外存在位于羧基末端的连接到野生型人IgG1铰链区的三个半胱氨酸的脯氨酸被另一个氨基酸残基(例如丝氨酸、丙氨酸)取代。在一个实施方案中,核心铰链区的脯氨酸未经取代。
在某些实施方案中,铰链多肽包含或者是与诸如野生型人IgG1铰链、野生型人IgG2铰链或野生型人IgG4铰链等野生型免疫球蛋白铰链区具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%同一性的序列。
在其它实施方案中,CD3结合多肽中存在的铰链可以是并非基于或源自于免疫球蛋白铰链的铰链(即,非野生型免疫球蛋白铰链或改变的免疫球蛋白铰链)。这样的铰链的例子包括源自于跨膜蛋白的域间区或II型C-凝集素的茎部区的具有约5到约150个氨基酸的肽,例如具有约8到25个氨基酸的肽和具有约7到18个氨基酸的肽。
在某些实施方案中,域间区或茎部区铰链具有7到18个氨基酸,且可以形成α-螺旋卷曲螺旋结构。在某些实施方案中,域间区或茎部区铰链含有0、1、2、3或4个半胱氨酸。示例性域间区或茎部区铰链是域间区或茎部区的肽片段,诸如来自于CD69、CD72、CD94、NKG2A和NKG2D的茎部区的10到150个氨基酸的片段。
在某些实施方案中,铰链序列具有约5到150个氨基酸、5到10个氨基酸、10到20个氨基酸、20到30个氨基酸、30到40个氨基酸、40到50个氨基酸、50到60个氨基酸、5到60个氨基酸、5到40个氨基酸、8到20个氨基酸或10到15个氨基酸。铰链可以主要地是挠性的,但也可以提供较多刚性特征,或可以主要含有α-螺旋结构与极少β-片状结构。铰链的长度或序列可能影响铰链直接或间接(经由另一个区或域,诸如异源二聚域)连接的结合域的结合亲和力以及铰链直接或间接连接的Fc区部分的一种或多种活性。
在某些实施方案中,铰链序列在血浆和血清中是稳定的且能抵抗蛋白水解裂解。可以使IgG1上铰链区中的第一赖氨酸突变以将蛋白水解裂解减到最少,举例来说,赖氨酸可以经甲硫氨酸、苏氨酸、丙氨酸或甘氨酸取代或缺失。
在本发明的一些实施方案中,CD3结合多肽能够与第二多肽链形成异源二聚体且包含如下铰链区:(a)氨基末端紧邻免疫球蛋白恒定区(例如,氨基末端连接到CH2域,其中免疫球蛋白恒定区包括CH2和CH3域,或氨基末端连接到CH3域,其中免疫球蛋白区包括CH3和CH4域);(b)插入在结合域(例如scFv)与免疫球蛋白异源二聚域之间且连接结合域与免疫球蛋白异源二聚域;(c)插入在免疫球蛋白异源二聚域与免疫球蛋白恒定区(例如,其中免疫球蛋白恒定区包括CH2和CH3域或CH3和CH4域)之间且连接免疫球蛋白异源二聚域与免疫球蛋白恒定区;(d)插入在免疫球蛋白恒定区与结合域之间且连接免疫球蛋白恒定区与结合域;(e)在多肽链的氨基末端;或(f)在多肽链的羧基末端。包含如本文中所描述的铰链区的多肽链能够与不同的多肽链缔合以形成本文中所提供的同源二聚或异源二聚蛋白,且所形成的二聚体将含有保留了其靶特异性和/或其特异性靶结合亲和力的结合域。
在某些实施方案中,能与另一个多肽链形成异源二聚体的多肽中存在的铰链可以是免疫球蛋白铰链,诸如野生型免疫球蛋白铰链区或其改变的免疫球蛋白铰链区。在某些实施方案中,异源二聚蛋白的一个多肽链的铰链与所述异源二聚体的另一个多肽链的对应铰链同一。在某些其它实施方案中,一个链的铰链不同于另一个链的铰链(例如,在其长度和/或序列方面)。不同的链中的不同的铰链允许对铰链所连接的结合域的结合亲和力进行不同的控制,使得异源二聚体能够结合一个结合域的靶标而略过另一个结合域的靶标。举例来说,在某些实施方案中,异源二聚蛋白在一个链中具有CD3结合域或TCR结合域,且在另一个链中具有第二结合域(诸如肿瘤抗原结合域)。在两个链中具有两个不同的铰链可以允许异源二聚体首先结合肿瘤抗原,然后结合CD3或其它TCR组分。因而,异源二聚体可以将CD3+T细胞募集到表达肿瘤抗原的细胞(例如,表达PSMA的肿瘤细胞),这又可以破坏或毁坏表达肿瘤抗原的细胞。
适合根据本发明使用的示例性铰链区示于以下表1和2中。
表1:示例性铰链区
表2:示例性铰链区(得自于H7铰链,II型C-凝集素的茎部区,或I型跨膜蛋白的域间区)
在某些实施方案中,本发明的CD3结合多肽或蛋白质可以包含“免疫球蛋白二聚域”或“免疫球蛋白异源二聚域”。
如本文中所使用的“免疫球蛋白二聚域”或“免疫球蛋白异源二聚域”是指与第二多肽链的第二免疫球蛋白域相互作用或缔合的多肽链的免疫球蛋白域,其中第一和第二免疫球蛋白异源二聚域的相互作用基本上有助于或能有效促进第一和第二多肽链的异源二聚(即,在两个不同的多肽链之间形成二聚体,这也称为“异源二聚体”或“异源二聚蛋白”)。如果在不存在第一多肽链的免疫球蛋白异源二聚域和/或第二多肽链的免疫球蛋白异源二聚域的情况下,第一和第二多肽链的二聚存在统计上显著的减少,则免疫球蛋白异源二聚域之间的相互作用“基本上有助于或能有效促进”第一和第二多肽链的异源二聚。在某些实施方案中,当第一和第二多肽链共表达时,至少60%、至少约60%到约70%、至少约70%到约80%、至少80%到约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的第一和第二多肽链与彼此形成异源二聚体。代表性免疫球蛋白异源二聚域包括免疫球蛋白CH1域、免疫球蛋白CL域(例如,Cκ或Cλ同种型)或其衍生物,包括野生型免疫球蛋白CH1和CL域和改变(或突变)的免疫球蛋白CH1和CL域,诸如本文中所提供的。
在需要由两个非同一的多肽链形成异源二聚体的情况下可以使用二聚/异源二聚域,其中一个或两个多肽链包含结合域。在某些实施方案中,本文中所描述的某些异源二聚体的一个多肽链成员不含结合域。如上文所指出,本公开的异源二聚蛋白在各多肽链中包含免疫球蛋白异源二聚域。异源二聚体的多肽链中的免疫球蛋白异源二聚域彼此不同,且因而可以差异性地进行修饰以促进两个链的异源二聚和将任一个链的同源二聚减到最少。如PCT公布号WO2011/090762中所示,本文中所提供的免疫球蛋白异源二聚域允许不同的多肽之间发生有效的异源二聚且促进所得异源二聚蛋白的纯化。
如本文中所提供,可用于促进根据本公开的两个不同的单链多肽(例如,一个短一个长)发生异源二聚的免疫球蛋白异源二聚域包括免疫球蛋白CH1和CL域,例如人CH1和CL域。在某些实施方案中,免疫球蛋白异源二聚域是野生型CH1域,诸如野生型IgG1、IgG2、IgG3、IgG4、IgA1、IgA2、IgD、IgE或IgM CH1域。在其它实施方案中,免疫球蛋白异源二聚域是分别如PCT公布No.WO2011/090762的SEQ ID NO:114、186-192和194(所述序列以引用的方式并入本文中)中所述的野生型人IgG1、IgG2、IgG3、IgG4、IgA1、IgA2、IgD、IgE或IgM CH1域。在某些实施方案中,免疫球蛋白异源二聚域是如WO2011/090762的SEQ ID NO:114(所述序列以引用的方式并入本文中)中所述的野生型人IgG1CH1域,所述序列与本申请的SEQ IDNO:80相同。
在其它实施方案中,免疫球蛋白异源二聚域是改变的免疫球蛋白CH1域,诸如改变的IgG1、IgG2、IgG3、IgG4、IgA1、IgA2、IgD、IgE或IgM CH1域。在某些实施方案中,免疫球蛋白异源二聚域是改变的人IgG1、IgG2、IgG3、IgG4、IgA1、IgA2、IgD、IgE或IgM CH1域。在其它实施方案中,在改变的免疫球蛋白CH1域中,与野生型免疫球蛋白CL域(例如人CL)一起参与形成二硫键的野生型CH1域(例如人CH1)的半胱氨酸残基缺失或被取代,使得改变的CH1域与野生型CL域之间不形成二硫键。
在某些实施方案中,免疫球蛋白异源二聚域是野生型CL域,诸如野生型Cκ域或野生型Cλ域。在特定的实施方案中,免疫球蛋白异源二聚域是分别如WO2011/090762的SEQ ID NO:112和113(所述序列以引用的方式并入本文中)中所述的野生型人Cκ或人Cλ域,所述序列分别与本申请的SEQ ID NO:81和82相同。在其它实施方案中,免疫球蛋白异源二聚域是改变的免疫球蛋白CL域,诸如改变的Cκ或Cλ域,例如,改变的人Cκ或人Cλ域。
在某些实施方案中,在改变的免疫球蛋白CL域中,与野生型免疫球蛋白CH1域(例如人CH1)一起参与形成二硫键的野生型CL域(例如人CL)的半胱氨酸残基缺失或被取代。所述改变的CL域还可以在其氨基末端包含氨基酸缺失。示例性Cκ域阐述于WO2011/090762的SEQ ID NO:141(所述序列以引用的方式并入本文中,它是本申请的SEQ ID NO:83)中,其中野生型人Cκ域的第一个精氨酸和最后一个半胱氨酸都缺失。在某些实施方案中,在改变的Ck域中,仅野生型人Ck域的最后一个半胱氨酸缺失,这是因为第一个精氨酸从野生型人Ck域中缺失可以由羧基末端具有精氨酸且连接改变的Ck域的氨基末端与另一个结构域(例如,免疫球蛋白亚区,诸如包含免疫球蛋白CH2和CH3域的亚区)的连接子提供。示例性Cλ域阐述于WO2011/090762的SEQ ID NO:140(所述序列以引用的方式并入本文中,它是本申请的SEQ ID NO:84)中,其中野生型人Cλ域的第一个精氨酸缺失且与CH1域中的半胱氨酸一起参与形成二硫键的半胱氨酸被丝氨酸取代。
在其它实施方案中,免疫球蛋白异源二聚域是与野生型Cκ域相比在Cκ-Cκ界面上可能参与形成链间氢键网络的位置上含有一个或多个氨基酸取代的改变的Cκ域。举例来说,在某些实施方案中,免疫球蛋白异源二聚域是在位置N29、N30、Q52、V55、T56、S68或T70上有一个或多个氨基酸被不同的氨基酸取代的改变的人Cκ域。氨基酸的编号是基于其在如WO2011/090762的SEQ ID NO:141(所述序列以引用的方式并入本文中,它是本申请的SEQ ID NO:83)中所述的改变的人Cκ序列中的位置。在某些实施方案中,免疫球蛋白异源二聚域是在位置N29、N30、V55或T70上有一个、两个、三个或四个氨基酸取代的改变的人Cκ域。用作上述位置上的取代物的氨基酸可以是丙氨酸或具有本体侧链部分的氨基酸残基,诸如精氨酸、色氨酸、酪氨酸、谷氨酸、谷氨酰胺或赖氨酸。可用于取代野生型人Ck序列中在上述位置(例如N30)上的氨基酸残基的其它氨基酸残基包括天冬氨酸、甲硫氨酸、丝氨酸和苯丙氨酸。示例性改变的人Cκ域阐述于WO2011/090762的SEQ ID NO:142-178中(所述序列以引用的方式并入本文中)。改变的人Cκ域是促进与CH1域进行异源二聚,但将与另一个Cκ域的同源二聚减到最少的Cκ域。代表性改变的人Cκ域阐述于WO2011/090762的SEQ ID NO:160(N29W V55A T70A)、161(N29Y V55A T70A)、202(T70E N29A N30A V55A)、167(N30RV55A T70A)、168(N30K V55A T70A)、170(N30E V55A T70A)、172(V55R N29A N30A)、175(N29W N30Y V55A T70E)、176(N29Y N30YV55A T70E)、177(N30E V55A T70E)、178(N30Y V55A T70E)、838(N30D V55A T70E)、839(N30M V55A T70E)、840(N30S V55A T70E)和841(N30F V55A T70E)中(所述序列以引用的方式并入本文中)。
在某些实施方案中,除本文中所描述的Ck域中的突变以外或作为其代替物,多肽异源二聚体的免疫球蛋白异源二聚域(例如免疫球蛋白CH1和CL域)具有突变,使得所得免疫球蛋白异源二聚域在突变位点上的氨基酸残基之间形成盐桥(即,离子相互作用)。举例来说,多肽异源二聚体的免疫球蛋白异源二聚域可以是突变的CH1域与突变的Ck域的组合。在突变的CH1域中,野生型人CH1域的位置68上的缬氨酸(V68)被具有负电荷的氨基酸残基(例如天冬氨酸或谷氨酸)取代,而第一个精氨酸和最后一个半胱氨酸缺失的突变的人Ck域的位置29上的亮氨酸(L29)被具有正电荷的氨基酸残基(例如赖氨酸、精氨酸或组氨酸)取代。所得突变CH1域中具有负电荷的氨基酸残基与所得突变Ck域中具有正电荷的氨基酸残基之间的电荷-电荷相互作用形成盐桥,所述盐桥能使突变的CH1和Ck域之间的异源二聚界面稳定。或者,野生型CH1的V68可以被具有正电荷的氨基酸残基取代,而第一个精氨酸和最后一个半胱氨酸缺失的突变人Ck域的L29可以被具有负电荷的氨基酸残基取代。V68被具有正电荷或负电荷的氨基酸取代的示例性突变CH1序列阐述于WO2011/090762的SEQ IDNO:844和845中(所述序列以引用的方式并入本文中)。L29被具有正电荷或负电荷的氨基酸取代的示例性突变Ck序列阐述于WO2011/090762的SEQ ID NO:842和843中(所述序列以引用的方式并入本文中)。
除CH1域的V68和Ck域的L29中的突变以外或作为其代替方案,除人CH1域的V68和人Ck域的L29以外的位置也可以被具有相反电荷的氨基酸取代以便在氨基酸之间产生离子相互作用。所述位置可以通过任何合适的方法来鉴别,包括随机突变发生;分析CH1-Ck配对的晶体结构,这是用于鉴别CH1-Ck界面上的氨基酸残基且使用一组标准(例如,参与离子相互作用的倾向性、与潜在伴侣残基的邻近程度等等)在CH1-Ck界面上的氨基酸残基中进一步鉴别合适的位置。
在某些实施方案中,本公开的多肽异源二聚体仅含有一对免疫球蛋白异源二聚域。举例来说,多肽异源二聚体的第一个链可以包含CH1域作为免疫球蛋白异源二聚域,而第二个链可以包含CL域(例如Cκ或Cλ)作为免疫球蛋白异源二聚域。或者,第一个链可以包含CL域(例如Cκ或Cλ)作为免疫球蛋白异源二聚域,而第二个链可以包含CH1域作为免疫球蛋白异源二聚域。如本文中所述,第一个和第二个链的免疫球蛋白异源二聚域能够缔合以形成本公开的异源二聚蛋白。
在某些其它实施方案中,本公开的异源二聚蛋白可以具有两对免疫球蛋白异源二聚域。举例来说,异源二聚体的第一个链可以包含两个CH1域,而第二个链可以具有两个CL域,该两个CL域与第一个链的两个CH1域缔合。或者,第一个链可以包含两个CL域,而第二个链可以具有两个CH1域,该两个CH1域与第一个链的两个CL域缔合。在某些实施方案中,第一个多肽链包含CH1域和CL域,而第二个多肽链包含CL域和CH1域。该CL域和CH1域分别与第一个多肽链的CH1域和CL域缔合。
在异源二聚蛋白仅包含一个异源二聚配对(例如,各链中有一个免疫球蛋白异源二聚域)的实施方案中,各链的免疫球蛋白异源二聚域可以位于该链的免疫球蛋白恒定亚区的氨基末端。或者,各链中的免疫球蛋白异源二聚域可以位于该链的免疫球蛋白恒定亚区的羧基末端。
在异源二聚蛋白包含两个异源二聚配对(例如,各链中有两个免疫球蛋白异源二聚域)的实施方案中,各链中的两个免疫球蛋白异源二聚域都可以位于该链的免疫球蛋白恒定亚区的氨基末端。或者,各链中的两个免疫球蛋白异源二聚域可以都位于该链的免疫球蛋白恒定亚区的羧基末端。在其它实施方案中,各链中的一个免疫球蛋白异源二聚域可以位于该链的免疫球蛋白恒定亚区的氨基末端,而另一个免疫球蛋白异源二聚域可以位于该链的免疫球蛋白恒定亚区的羧基末端。换句话说,在那些实施方案中,免疫球蛋白恒定亚区是插入在各链的两个免疫球蛋白异源二聚域之间。
如本文中所指示,在某些实施方案中,本公开的CD3结合多肽(例如小模块式免疫药物蛋白)(SMIP)、同源二聚体双特异性治疗剂(例如,Scorpion)、异源二聚体单特异性和多特异性治疗剂(例如,Interceptor)在各多肽链中包含免疫球蛋白恒定区。术语“恒定区”与恒定亚区和免疫球蛋白恒定区在本文中可互换使用。包括免疫球蛋白恒定区可以减缓由两个CD3结合多肽链形成的同源二聚和异源二聚蛋白在施用到受试者之后从循环中清除。
通过突变或其它改变,免疫球蛋白恒定区还使得能够相对容易地调节二聚多肽效应功能(例如,ADCC、ADCP、CDC、补体固定和Fc受体结合),如本领域中已知和本文中所描述,所述二聚多肽效应功能可以取决于所治疗的疾病而增加或降低。
在某些实施方案中,本公开的多肽同源二聚体和异源二聚体的多肽链之一或两者的免疫球蛋白恒定区应能够介导这些效应功能中的一种或多种。
在其它实施方案中,与对应的野生型免疫球蛋白恒定区相比,在本公开的多肽同源二聚体和异源二聚体的多肽链之一或两者的免疫球蛋白恒定区中,这些效应功能中的一种或多种被降低或缺乏。举例来说,单特异性CD3结合多肽以及包含第二结合域(例如,设计用于引发重定向T细胞毒性(RTCC))的CD3结合多肽的免疫球蛋白恒定区相对于对应的野生型免疫球蛋白恒定区具有降低的效应功能或无效应功能是特别有用的。在一个实施方案中,恒定区经修饰以便不固定补体。恒定区还可以经修饰以便不结合一种或多种Fcγ受体,诸如CD16、CD32和CD64。
本公开的CD3结合多肽中存在的免疫球蛋白恒定亚区可以由以下各项构成或源自于以下各项的一部分或全部:CH2域、CH3域、CH4域或其任何组合。举例来说,免疫球蛋白恒定亚区可以包含CH2域、CH3域、CH2域和CH3域两者、CH3域和CH4域两者、两个CH3域、CH4域、两个CH4域和CH2域及CH3域的一部分。在一些实施方案中,恒定区包含IgG1、IgG2、IgG3、IgG4、IgA1、IgA2、IgD或其任何组合的CH2和CH3域;IgG1、IgG2、IgG3、IgG4、IgA1、IgA2、IgD、IgE、IgM或其任何组合的免疫球蛋白CH3域;或IgE、IgM或其组合的免疫球蛋白CH3和CH4域。在一些实施方案中,恒定区实质上由CH2域和CH3域组成。
可以形成本公开的CD3结合多肽的免疫球蛋白恒定区的CH2域可以是来自于某些免疫球蛋白类别或子类(例如IgG1、IgG2、IgG3、IgG4、IgA1、IgA2或IgD)和来自于各种的物种(包括人、小鼠、大鼠和其它哺乳动物)的野生型免疫球蛋白CH2域或其改变的免疫球蛋白CH2域。在一些实施方案中,恒定区经修饰以降低或消除效应功能、减少或不固定补体和/或减少结合或不结合Fcγ受体。在一些实施方案中,Fcγ受体选自CD16、CD32和CD64。
在某些实施方案中,CH2域是野生型人免疫球蛋白CH2域,诸如人IgG1、IgG2、IgG3、IgG4、IgA1、IgA2或IgD的野生型CH2域,分别如PCT公布WO2011/090762的SEQ ID NO:115、199-201和195-197(所述序列以引用的方式并入本文中)中所述。在某些实施方案中,CH2域是如WO2011/090762的SEQ ID NO:115中所述的野生型人IgG1CH2域(所述序列以引用的方式并入本文中,它是本申请的SEQ ID NO:85)。在一些实施方案中,恒定区包含SEQ ID NO:55的氨基酸序列或由其组成。
在某些实施方案中,CH2域是在位置297的天冬酰胺上包含氨基酸取代(例如,天冬酰胺变成丙氨酸)的改变的免疫球蛋白CH2区(例如,改变的人IgG1CH2域)。这样的氨基酸取代减少或消除这个位点上的糖基化且取消FcγR与C1q的有效Fc结合。在位置297上具有Asn变成Ala取代的改变的人IgG1CH2域的序列阐述于WO2011/090762的SEQ ID NO:324中(所述序列以引用的方式并入本文中,它是本申请的SEQ ID NO:86)。
在某些实施方案中,CH2域是在位置234到238上包含至少一个取代或缺失的改变的免疫球蛋白CH2区(例如,改变的人IgG1CH2域)。举例来说,免疫球蛋白CH2区可以在位置234、235、236、237或238、位置234和235、位置234和236、位置234和237、位置234和238、位置234-236、位置234、235和237、位置234、236和238、位置234、235、237和238、位置236-238上或位置234-238上的两个、三个、四个或五个氨基酸的任何其它组合包含取代。另外或作为代替方案,改变的CH2区可以在位置234-238上,例如在位置236或位置237之一上包含一个或多个(例如两个、三个、四个或五个)氨基酸缺失,而在另一个位置上经取代。上述突变能降低或消除包含改变的CH2域的多肽异源二聚体的抗体依赖性细胞介导的细胞毒性(ADCC)活性或Fc受体结合能力。在某些实施方案中,已经用一个或多个丙氨酸残基置换位置234-238中的一个或多个上的氨基酸残基。在其它实施方案中,位置234-238上的氨基酸残基中仅一个缺失,而位置234-238上的其余氨基酸中的一个或多个可以经另一个氨基酸(例如丙氨酸或丝氨酸)取代。
在某些其它实施方案中,CH2域是在位置253、310、318、320、322和331上包含一个或多个氨基酸取代的改变的免疫球蛋白CH2区(例如,改变的人IgG1CH2域)。举例来说,免疫球蛋白CH2区可以在位置253、310、318、320、322或331、位置318和320、位置318和322、位置318、320和322上或位置253、310、318、320、322和331上的两个、三个、四个、五个或六个氨基酸的任何其它组合包含取代。上述突变能降低或消除包含改变的CH2域的多肽异源二聚体的补体依赖性细胞毒性(CDC)。
在某些其它实施方案中,除位置297上的氨基酸取代以外,改变的CH2区(例如,改变的人IgG1CH2域)还可以在位置234-238上包含一个或多个(例如,两个、三个、四个或五个)其它取代。举例来说,免疫球蛋白CH2区可以在位置234和297、位置234、235和297、位置234、236和297、位置234-236和297、位置234、235、237和297、位置234、236、238和297、位置234、235、237、238和297、位置236-238和297或除位置297以外的位置234-238上的两个、三个、四个或五个氨基酸的任何组合包含取代。另外或作为代替方案,改变的CH2区可以在位置234-238上,诸如在位置236或位置237上包含一个或多个(例如两个、三个、四个或五个)氨基酸缺失。其它突变能降低或消除包含改变的CH2域的多肽异源二聚体的抗体依赖性细胞介导的细胞毒性(ADCC)活性或Fc受体结合能力。在某些实施方案中,已经用一个或多个丙氨酸残基置换位置234-238中的一个或多个上的氨基酸残基。在其它实施方案中,位置234-238上的氨基酸残基中仅一个缺失,而位置234-238上的其余氨基酸中的一个或多个可以经另一个氨基酸(例如丙氨酸或丝氨酸)取代。
在某些实施方案中,除位置234-238上的一个或多个(例如,2、3、4或5个)氨基酸取代以外,本公开的融合蛋白中的突变的CH2区(例如,改变的人IgG1CH2域)可以在一个或多个参与补体固定的位置上(例如,在位置I253、H310、E318、K320、K322或P331上)含有一个或多个(例如,2、3、4、5或6个)其它氨基酸取代(例如经丙氨酸取代)。突变的免疫球蛋白CH2区的例子包括在位置234、235、237(如果存在)、318、320和322上具有丙氨酸取代的人IgG1、IgG2、IgG4和小鼠IgG2a CH2区。示例性突变的免疫球蛋白CH2区是在L234、L235、G237、E318、K320和K322上具有丙氨酸取代的小鼠IGHG2c CH2区。
在其它实施方案中,除位置297上的氨基酸取代和位置234-238上的其它缺失或取代以外,改变的CH2区(例如,改变的人IgG1CH2域)还可以在位置253、310、318、320、322和331上包含一个或多个(例如,两个、三个、四个、五个或六个)其它取代。举例来说,免疫球蛋白CH2区可以包含(1)位置297上的取代,(2)位置234-238上的一个或多个取代或缺失或其组合,和位置I253、H310、E318、K320、K322和P331上的一个或多个(例如,2、3、4、5或6个)氨基酸取代,诸如位置E318、K320和K322上的一个、两个、三个取代。上述位置上的氨基酸可以被丙氨酸或丝氨酸取代。
在某些实施方案中,免疫球蛋白CH2区多肽包含:(i)位置297的天冬酰胺上的氨基酸取代和位置234、235、236或237上的一个氨基酸取代;(ii)位置297的天冬酰胺上的氨基酸取代和位置234-237中的两个上的氨基酸取代;(iii)位置297的天冬酰胺上的氨基酸取代和位置234-237中的三个上的氨基酸取代;(iv)位置297的天冬酰胺上的氨基酸取代、位置234、235和237上的氨基酸取代和位置236上的氨基酸缺失;(v)位置234-237中的三个上的氨基酸取代和位置318、320和322上的氨基酸取代;或(vi)位置234-237中的三个上的氨基酸取代、位置236上的氨基酸缺失和位置318、320和322上的氨基酸取代。
在位置297的天冬酰胺上具有氨基酸取代的示例性改变的免疫球蛋白CH2区包括:在L234、L235、G237和N297上具有丙氨酸取代和在G236上具有缺失的人IgG1CH2区(WO2011/090762的SEQ IDNO:325,所述序列以引用的方式并入本文中)、在V234、G236和N297上具有丙氨酸取代的人IgG2CH2区(WO2011/090762的SEQ IDNO:326,所述序列以引用的方式并入本文中)、在F234、L235、G237和N297上具有丙氨酸取代和在G236上具有缺失的人IgG4CH2区(WO2011/090762的SEQ ID NO:322,所述序列以引用的方式并入本文中)、在F234和N297上具有丙氨酸取代的人IgG4CH2区(WO2011/090762的SEQ ID NO:343,所述序列以引用的方式并入本文中)、在L235和N297上具有丙氨酸取代的人IgG4CH2区(WO2011/090762的SEQ ID NO:344,所述序列以引用的方式并入本文中)、在G236和N297上具有丙氨酸取代的人IgG4CH2区(WO2011/090762的SEQ ID NO:345,所述序列以引用的方式并入本文中)、和在G237和N297上具有丙氨酸取代的人IgG4CH2区(WO2011/090762的SEQ ID NO:346,所述序列以引用的方式并入本文中)。
在某些实施方案中,除上述氨基酸取代以外,改变的CH2区(例如,改变的人IgG1CH2域)可能在除上述位置以外的一个或多个位置上含有一个或多个其它氨基酸取代。所述氨基酸取代可以是保守或非保守氨基酸取代。举例来说,在某些实施方案中,在改变的IgG2CH2区中,P233可以变成E233(参见例如WO2011/090762的SEQ IDNO:326,所述序列以引用的方式并入本文中)。另外或作为代替方案,在某些实施方案中,改变的CH2区可以含有一个或多个氨基酸插入、缺失或两者。插入、缺失或取代可以位于免疫球蛋白CH2区中的任何地方,诸如在野生型免疫球蛋白CH2区的N或C末端,从而经由铰链连接CH2区与另一个区(例如,结合域或免疫球蛋白异源二聚域)。
在某些实施方案中,本公开的多肽中的改变的CH2区包含或者是与野生型免疫球蛋白CH2区,诸如野生型人IgG1、IgG2或IgG4或小鼠IgG2a(例如,IGHG2c)的CH2区具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%同一性的序列。
本公开的CD3结合多肽中的改变的免疫球蛋白CH2区可以源自于各种物种(包括人、小鼠、大鼠和其它哺乳动物)的各种免疫球蛋白同种型,诸如IgG1、IgG2、IgG3、IgG4、IgA1、IgA2和IgD的CH2区。在某些实施方案中,本公开的融合蛋白中的改变的免疫球蛋白CH2区可以源自于人IgG1、IgG2或IgG4或小鼠IgG2a(例如IGHG2c)的CH2区,它们的序列阐述于WO2011/090762的SEQ ID NO:115、199、201和320中(所述序列以引用的方式并入本文中)。
在某些实施方案中,改变的CH2域是在位置235、318、320和322上具有丙氨酸取代(即,具有L235A、E318A、K320A和K322A取代的人IgG1CH2域)(WO2011/090762的SEQ ID NO:595,所述序列以引用的方式并入本文中)和任选地存在的N297突变(例如突变成丙氨酸)的人IgG1CH2域。在某些其它实施方案中,改变的CH2域是在位置234、235、237、318、320和322上具有丙氨酸取代(即,具有L234A、L235A、G237A、E318A、K320A和K322A取代的人IgG1CH2域)(WO2011/090762的SEQ ID NO:596,所述序列以引用的方式并入本文中)和任选地存在的N297突变(例如突变成丙氨酸)的人IgG1CH2域。
在某些实施方案中,改变的CH2域是具有本领域中已知的能增强诸如ADCC、ADCP、CDC、补体固定、Fc受体结合或其任何组合等免疫学活性的突变的改变的人IgG1CH2域。
可以形成本公开的CD3结合多肽的免疫球蛋白恒定区的CH3域可以是来自于各种物种(包括人、小鼠、大鼠和其它哺乳动物)的某些免疫球蛋白类别或子类(例如IgG1、IgG2、IgG3、IgG4、IgA1、IgA2、IgD、IgE、IgM)的野生型免疫球蛋白CH3域或其改变的免疫球蛋白CH3域。在某些实施方案中,CH3域是野生型人免疫球蛋白CH3域,诸如人IgG1、IgG2、IgG3、IgG4、IgA1、IgA2、IgD、IgE或IgM的野生型CH3域,分别如WO2011/090762的SEQ ID NO:116、208-210、204-207和212中所述(所述序列以引用的方式并入本文中)。在某些实施方案中,CH3域是如WO2011/090762的SEQ ID NO:116(所述序列以引用的方式并入本文中)中所述的野生型人IgG1CH3域。在某些实施方案中,CH3域是改变的人免疫球蛋白CH3域,诸如基于或源自于人IgG1、IgG2、IgG3、IgG4、IgA1、IgA2、IgD、IgE或IgM抗体的野生型CH3域的改变的CH3域。举例来说,改变的CH3域可以是在位置H433和N434上具有一个或两个突变的人IgG1CH3域(位置是根据EU编号法进行编号)。所述位置上的突变可能参与补体固定。在某些其它实施方案中,改变的CH3域可以是人IgG1CH3域,但在位置F405或Y407上具有一个或两个氨基酸取代。所述位置上的氨基酸参与了与另一个CH3域的相互作用。在某些实施方案中,改变的CH3域可以是最后一个赖氨酸缺失的改变的人IgG1CH3域。这种改变的CH3域的序列阐述于WO2011/090762的SEQ IDNO:761中(所述序列以引用的方式并入本文中)。
在某些实施方案中,形成多肽异源二聚体的CD3结合多肽包含一个CH3对,其包含所谓的“钮入孔”突变(参见Marvin和Zhu,ActaPharmacologica Sinica 26:649-58,2005;Ridgway等,Protein Engineering 9:617-21,1966)。更具体地说,突变可以引入到各多肽链的两个CH3域的每一个中,使得CH3/CH3缔合所需的空间互补性强制这两个CH3域与彼此配对。举例来说,多肽异源二聚体的一个单链多肽中的CH3域可以含有T366W突变(“钮”突变,其用较大的氨基酸取代小氨基酸),且多肽异源二聚体的另一个单链多肽中的CH3域可以含有Y407A突变(“孔”突变,其用较小的氨基酸取代大氨基酸)。其它示例性钮入孔突变包括(1)一个CH3域中的T366Y突变和另一个CH3域中的Y407T,和(2)一个CH3域中的T366W突变和另一个CH3域中的T366S、L368A和Y407V突变。
可以形成本公开的CD3结合多肽的免疫球蛋白恒定区的CH4域可以是来自于IgE或IgM分子的野生型免疫球蛋白CH4域或其改变的免疫球蛋白CH4域。在某些实施方案中,CH4域是野生型人免疫球蛋白CH4域,诸如分别如WO2011/090762的SEQ ID NO:213和214(所述序列以引用的方式并入本文中)中所述的人IgE和IgM分子的野生型CH4域。在某些实施方案中,CH4域是改变的人免疫球蛋白CH4域,诸如基于或源自于人IgE或IgM分子的CH4域的改变的CH4域,所述分子具有能增加或降低已知与IgE或IgM Fc区相关的免疫活性的突变。
在某些实施方案中,本公开的CD3结合多肽的免疫球蛋白恒定区包含CH2、CH3或CH4域的组合(即,一个以上选自CH2、CH3和CH4的恒定区域)。举例来说,免疫球蛋白恒定亚区可以包含CH2和CH3域或CH3和CH4域。在某些其它实施方案中,免疫球蛋白恒定区可以包含两个CH3域且不包含CH2或CH4域(即,仅两个或更多个CH3)。形成免疫球蛋白恒定亚区的多个恒定区结构域可以基于或源自于相同的免疫球蛋白分子,或者相同类别或子类的免疫球蛋白分子。在某些实施方案中,免疫球蛋白恒定亚区是IgG CH2CH3(例如IgG1CH2CH3、IgG2CH2CH3和IgG4CH2CH3),且可以是人(例如,人IgG1、IgG2和IgG4)CH2CH3。举例来说,在某些实施方案中,免疫球蛋白恒定亚区包含(1)野生型人IgG1CH2和CH3域、(2)具有N297A取代的人IgG1CH2(即,CH2(N297A))和野生型人IgG1CH3,或(3)人IgG1CH2(N297A)和最后一个赖氨酸缺失的改变的人IgG1CH3。
或者,多个恒定区结构域可以基于或源自于不同的免疫球蛋白分子或者不同类别或子类的免疫球蛋白分子。举例来说,在某些实施方案中,免疫球蛋白恒定亚区包含人IgM CH3域和人IgG1CH3域。形成免疫球蛋白恒定亚区的多个恒定区结构域可以直接连接在一起,或可以经由一个或多个(例如约2-10个)氨基酸彼此连接。
示例性免疫球蛋白恒定亚区阐述于WO2011/090762的SEQ IDNO:305-309、321、323、341、342和762中(所述序列以引用的方式并入本文中)。
在某些实施方案中,同源二聚体或异源二聚体的两个CD3结合多肽链的免疫球蛋白恒定区彼此同一。在某些其它实施方案中,异源二聚蛋白的一个多肽链的免疫球蛋白恒定亚区与所述异源二聚体的另一个多肽链的免疫球蛋白恒定亚区不同。举例来说,异源二聚蛋白的一个免疫球蛋白恒定亚区可以含有具有“钮”突变的CH3域,而所述异源二聚蛋白的另一个免疫球蛋白恒定亚区可以含有具有“孔”突变的CH3域。
本发明的一些实施方案涉及使用如下的双特异性或多特异性结合分子:(i)靶向人T细胞上的TCR复合物(例如CD3)和(ii)细胞表面蛋白,例如以重定向T细胞细胞毒性针对具有所述细胞表面蛋白的细胞,例如针对表达肿瘤抗原的肿瘤细胞以便治疗癌症。
在某些实施方案中,CD3结合蛋白可以包含一个或多个结合除CD3以外的靶标的其它结合域(例如第二结合域)。这些其它靶分子可以包含例如肿瘤相关抗原。在本发明的一个实施方案中,一个或多个其它结合域结合一个或多个以下肿瘤抗原或与其相互作用:RON、c-Met、CEACAM-6、PSMA、EpCAM、CEA、PCTA-1、STEAP-1、STEAP-2、PSCA、PSA、PAP、ALCAM(CD166)、PECAM-1、EphA2、CD151、CA-125/MUC16、MUC-1、MAGE-1、TROP2、IGF1R、TGFBR2、GHRHR、GHR、IL-6R、gp130、TNFR2、OSMRβ、Patched-1、Frizzled、Robo1、LTβR、CD19、CD25、CD26、CD27、CD30、CD33、CD44、CD44v6、CD63、CD80、CD81、CD86、CD100、CD151、CXCR4、CCR5、HER-2/ErbB1、HER-3/ErbB3、HER-4/ErbB4、EGFR/ErbB1、EGFRvIII同种型、MUC2、MUC3、MUC4、MUC5AC、MUC5b、MUC7、βhCG、Lewis-Y、神经节苷脂GD3、9-O-乙酰基-GD3、GM2、GloboH、岩藻糖酰GM1、Poly SA、GD2、碳酸酐酶IX(MN/CA IX)、音猬因子(Sonic Hedgehog)(Shh)、Wue-1、浆细胞抗原、(膜结合)IgE、黑色素瘤硫酸软骨素蛋白多糖(MCSP)、CCR8、TNF-α前体、间皮素、A33抗原、Ly-6;桥粒核心糖蛋白4、E-钙粘附蛋白新表位、胎儿乙酰胆碱受体、CA19-9标记物、苗勒氏抑制物质(MIS)受体II型、sTn(唾液酸化Tn抗原;TAG-72)、FAP(成纤维细胞活化抗原)、内皮唾液酸蛋白、LG、SAS、BCMA、TWEAKR/Fn14、FGFR4、VEGFR1、VEGFR2、SSX1和SSX2。
在某些实施方案中,CD3结合域结合TCR结合域以便将T细胞募集到表达肿瘤抗原的靶细胞。在某些实施方案中,CD3结合多肽可以包含特异性结合TCR复合物或其组分(例如TCRα、TCRβ、CD3γ、CD3δ和CD3ε)的CD3结合域和特异性结合肿瘤相关抗原的另一个结合域。
PSMA是一种高度受限的前列腺癌相关细胞膜抗原。在前列腺癌细胞中,PSMA的表达是正常前列腺上皮细胞上的1000倍(Su等,Cancer Res.199544:1441-1443)。PSMA的表达随着前列腺癌进展而增加,并且典型地在转移性疾病、激素难治性病例和较高等级病变中最高(Israeli等,Cancer Res.1994,54:1807-1811;Wright等,UrologicOncology:Seminars and Original Investigations 19951:18-28;Wright等,Urology 199648:326-332;Sweat等,Urology 199852:637-640)。另外,PSMA丰富地表达于多种其它实性肿瘤(包括膀胱癌、胰腺癌、黑素瘤、肺癌和肾癌)的新生血管上而不是正常的新生血管上(Chang等,Urology 200157:801-805;Divgi等,Clin.Cancer Res.19984:2729-3279)。靶向PSMA的结合域包括但不限于PCT公布号WO2012/145714中所描述的那些,该文献以全文引用的方式并入本文中。
在一些实施方案中,PSMA结合域包含与选自以下的氨基酸序列具有至少90%、至少95%或100%同一性的氨基酸序列:(i)SEQ IDNO:212的氨基酸1-107和124-243;(ii)SEQ ID NO:226的氨基酸1-107和124-243;或(iii)SEQ ID NO:216的氨基酸1-107和124-243。在一些实施方案中,本发明的蛋白质或分子包含选自SEQ ID NO:212、214、216和226的氨基酸序列。可根据本发明使用的PSMA结合域还描述于PCT公布号WO2012/145714中,包括了包含WO2012/145714的氨基酸序列SEQ ID NO:19、21、30、31、34或35的PSMA结合域,或包含有包含选自WO2012/145714的SEQ ID NO:5和23的氨基酸序列的VL链和包含选自WO2012/145714的SEQ IDNO:2、25和27的氨基酸序列的VH链。
RON(受体酪氨酸激酶,也称为MST1R)是胚胎发育所必需的受体型蛋白酪氨酸激酶且在发炎反应中也起着重要作用(Camp等,Ann.Surg.Oncol.12:273-281(2005))。RON主要表达于上皮衍生的细胞类型中,并且已经提出,RON如同许多其它受体型酪氨酸激酶一样可能在恶性上皮癌进展中起作用(Wang等,Carcinogenesis 23:1291-1297(2003))。RON的活化引发牵涉到诸如细胞增殖、细胞凋亡抑制和细胞运动性等肿瘤发生活性的下游信号传导路径。尤其是,RON由于其信号传导性质和/或RON在结肠直肠癌、乳腺癌、卵巢癌和胰腺癌中的过表达而代表了上皮癌的治疗靶标。
用于靶向RON的结合域包括但不限于实施例部分中所描述的那些和PCT公布WO2011/090761中所描述的那些,该文献以全文引用的方式并入本文中。在一些实施方案中,抗RON结合域包含(a)VL域,其包含i.CDR1氨基酸序列SEQ ID NO:87、CDR2氨基酸序列SEQ ID NO:88和CDR3氨基酸序列SEQ ID NO:89;或ii.CDR1氨基酸序列SEQ ID NO:90、CDR2氨基酸序列SEQ ID NO:91和CDR3氨基酸序列SEQ ID NO:92;或(b)VH域,其包含i.CDR1氨基酸序列SEQ ID NO:93、CDR2氨基酸序列SEQ ID NO:94和CDR3氨基酸序列SEQ ID NO:95;或ii.CDR1氨基酸序列SEQ ID NO:96、CDR2氨基酸序列SEQ ID NO:97和CDR3氨基酸序列SEQ ID NO:98;或(c)(a)的VL和(b)的VH。在一个实施方案中,VL域包含SEQ ID NO:99或100中任一者的氨基酸序列,且VH域包含SEQ ID NO:101、102和103中任一者的氨基酸序列。在另一个实施方案中,VL和VH域被人源化。在某些实施方案中,人源化VL包含SEQ ID NO:104、105和106中任一者的氨基酸序列,且人源化VH域包含SEQ IDNO:107-111中任一者的氨基酸序列。在一些实施方案中,抗RON结合域包含有包含SEQ ID NO:99和100中任一者的氨基酸序列的VL域,和包含SEQ ID NO:101、102和103中任一者的氨基酸序列的VH域。在一些实施方案中,抗RON结合域包含有包含SEQ ID NO:104、105和106中任一者的氨基酸序列的VL域,和包含SEQ IDNO:107-111中任一者的氨基酸序列的VH域。
在一些实施方案中,RON结合域包含与SEQ ID NO:187具有至少90%、92%、94%、96%、97%、98%、99%或100%同一性的氨基酸序列和/或包含与SEQ ID NO:188具有至少90%、92%、94%、96%、97%、98%、99%或100%同一性的氨基酸序列。在一些实施方案中,RON结合域包含(i)SEQ ID NO:187,其中氨基酸43(丙氨酸)经另一个氨基酸取代,例如经赖氨酸(A43K)或苏氨酸(A43T)取代;(ii)SEQID NO:188,其中氨基酸38(谷氨酰胺)和/或113(谷氨酰胺)经另一个氨基酸取代,例如经谷氨酸和/或精氨酸取代,诸如Q38R和/或Q113E;或(iii)其任何组合。在一些实施方案中,抗RON/抗CD3双特异性分子包含与SEQ ID NO:186、190、192或194中的任一者具有至少90%、92%、94%、96%、97%、98%、99%或100%同一性的氨基酸序列或由其组成。在一些实施方案中,本发明提供了一种编码抗RON/抗CD3双特异性分子的核酸,其中所述核酸包含与SEQ ID NO:185、189、191或193中的任一者具有至少90%、92%、94%、96%、97%、98%、99%或100%同一性的核苷酸序列。
CD19是在B细胞,包括大部分恶性B细胞的表面上发现的。靶向CD19可用于抑制和治疗B细胞相关疾病、白血病和淋巴瘤。
在一些实施方案中,CD19结合域包含与SEQ ID NO:196的氨基酸1-111具有至少90%、92%、94%、96%、97%、98%、99%或100%同一性的氨基酸序列和/或包含与SEQ ID NO:196的氨基酸128-251具有至少90%、92%、94%、96%、97%、98%、99%或100%同一性的氨基酸序列。在一些实施方案中,抗CD19/抗CD3双特异性分子包含与SEQ ID NO:196、198、200、202、204或206中任一者具有至少90%、92%、94%、96%、97%、98%、99%或100%同一性的氨基酸序列或由其组成。在一些实施方案中,本发明提供了一种编码抗CD19/抗CD3双特异性分子的核酸,其中所述核酸包含与SEQ IDNO:195、197、199、201、203或206中的任一者具有至少90%、92%、94%、96%、97%、98%、99%或100%同一性的核苷酸序列。
HER2也称为人ErbB2。在乳腺癌、卵巢癌和其它癌瘤(包括胃癌、子宫内膜癌、唾液腺癌、肺癌、肾癌、结肠癌、甲状腺癌、胰腺癌和膀胱癌)中也观察到了HER2的过表达(往往但不总是由于基因扩增)。靶向HER2的结合域包括但不限于PCT公布WO2009/055074中所描述的那些,该文献以全文引用的方式并入本文中。
在一些实施方案中,CD3结合多肽包含与SEQ ID NO:57、59、61、63、65、67、69、71、186、190、192、194、196、198、200、202、204或206具有至少90%、至少95%或100%同一性的氨基酸序列。
在一些实施方案中,CD3结合多肽是异源二聚体的一部分。在一些实施方案中,异源二聚体包含一对单链多肽,其中所述单链对包含与选自以下的配对具有至少90%、至少95%或100%同一性的氨基酸序列:SEQ ID NO:210和247、SEQ ID NO:210和218、SEQ ID NO:210和220、SEQ ID NO:208和249、SEQ ID NO:208和222或SEQ IDNO:208和224、SEQ ID NO:212和218、SEQ ID NO:216和222、SEQID NO:228和226或SEQ ID NO:214和218。
本发明还包括编码如本文中所描述的CD3结合多肽,或如本文中所描述的二聚或异源二聚CD3结合蛋白的一个或多个多肽链的核酸(例如DNA或RNA)。本发明的核酸包括具有与如SEQ ID NO:5、7、9、11、13、15、17、19、27、29、31、37和39中所提供的聚核苷酸基本上同一的区域的核酸或包含编码相同或相似多肽的编码区的核酸。在某些实施方案中,根据本发明的核酸与如SEQ ID NO:5、7、9、11、13、15、17、19、27、29、31、37和39中所提供的多肽编码聚核苷酸具有至少80%、典型地至少约90%且更典型地至少约95%或至少约98%同一性。本发明的核酸还包括互补核酸。在一些情况下,序列在比对时将完全互补(无错配)。在其它情形下,序列中可能存在最多约20%错配。在本发明的一些实施方案中提供了编码本发明的异源二聚CD3结合蛋白的第一和第二多肽链两者的核酸。本文中所提供的核酸序列可以使用密码子优化、简并序列、沉默突变和其它DNA技术加以利用以优化在特定宿主中的表达,且本发明涵盖所述序列修饰。
通过将所述分子放在载体中对包含所要聚核苷酸序列的聚核苷酸分子进行增殖。本发明还包括含有本发明核酸和/或表达本发明多肽的表达载体。使用病毒和非病毒载体,包括质粒。质粒的选择将取决于需要增殖的细胞类型和增殖目的。某些载体适用于扩增和制造大量的所需DNA序列。其它载体适合于在培养中的细胞中进行表达。其它载体适合于在整个动物或人的细胞中进行转移和表达。适当载体的选择完全在本领域技术人员的掌控之内。许多这样的载体可以得自市面。典型地借助于DNA连接酶连接到载体中裂解的限制酶位点来将部分或全长聚核苷酸插入载体中。或者,可以通过体内同源重组来插入所要的核苷酸序列。典型地,这伴随有将同源性区域连接到载体中所要核苷酸序列的两侧上。举例来说,通过寡核苷酸连接或通过聚合酶链反应,使用包含同源性区域和所要核苷酸序列的一部分的引物加入同源性区域。
对于表达来说,可以采用表达盒或系统。为了表达编码本文中所公开的多肽的核酸,将编码所述多肽的核酸分子引入到宿主细胞中,所述核酸分子可操作地连接到能控制在表达载体中的转录表达的调节序列。本发明包括了包含本发明的核酸和/或表达载体,例如编码本发明多肽的核酸的宿主细胞。除诸如启动子和增强子等转录调节序列以外,表达载体可以包括翻译调节序列和适合于选择携带表达载体的细胞的标记基因。本发明聚核苷酸所编码的基因产物表达于任何适宜的表达系统中,包括例如细菌、酵母、昆虫、两栖动物和哺乳动物系统。在表达载体中,在适当时将多肽编码聚核苷酸连接到调节序列以获得所要的表达性质。这些可以包括启动子、增强子、终止子、操纵子、抑制子和诱导物。启动子可以是调节性的(例如来自于类固醇诱导性pIND载体(Invitrogen)的启动子)或组成性的(例如来自于CMV、SV40、延伸因子或LTR序列的启动子)。使用如上文关于连接到载体所述的技术将这些连接到所要的核苷酸序列。可以使用本领域中已知的任何技术。因此,表达载体一般将提供转录和翻译起始区,它可以是诱导性的或组成性的,其中在转录起始区及转录和翻译结束区的转录控制下可操作地连接编码区。
可以将表达盒(“表达单元”)引入到多种载体中,例如质粒、BAC、YAC、噬菌体(诸如λ、P1、M13等)、植物或动物病毒载体(例如,基于逆转录病毒的载体、腺病毒载体)等等,其中载体正常以选择包含表达载体的细胞的能力为特征。载体可以提供染色体外维持,特别是作为质粒或病毒,或用于整合到宿主染色体中。在需要染色体外维持的情况下,提供起点序列以便复制质粒,它可以是低或高拷贝数。多种标记物可用于选择,确切地说防止毒素,更确切的说是防止抗生素的那些标记物。根据宿主的性质来选择所选的特定标记物,其中在一些情况下,可以用营养缺陷型宿主进行补充。DNA构建体的引入可以使用任何适宜的方法,包括例如结合、细菌转化、钙沉淀的DNA、电穿孔、融合、转染、用病毒载体感染、生物弹法等等。
因此,本发明内使用的蛋白质可以根据常规技术在经基因工程改造的宿主细胞中产生。合适的宿主细胞为可以用外源性DNA转化或转染且在培养基中生长的细胞类型,并且包括细菌、真菌细胞和培养的高级真核细胞(包括多细胞生物体的培养细胞),特别是培养的哺乳动物细胞。以下文献公开了用于操控克隆的DNA分子和将外源性DNA引入到多种宿主细胞中的技术:Sambrook和Russell,MolecularCloning:A Laboratory Manual(第3版,Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,NY,2001);和Ausubel等,Short Protocols inMolecular Biology(第4版,John Wiley&Sons,1999)。
举例来说,为了重组表达包含两个同一的如本文中所描述的CD3结合多肽链的同源二聚CD3结合蛋白,表达载体一般将包括可操作地连接到启动子的编码CD3结合多肽的核酸区段。为了重组表达包含不同的第一和第二多肽链的异源二聚CD3结合蛋白,第一和第二多肽链可以由宿主细胞中单独的载体共表达以便表达整个异源二聚蛋白。或者,为了表达异源二聚CD3结合蛋白,第一和第二多肽链可以由宿主细胞中的同一载体中单独的表达单元共表达以便表达整个异源二聚蛋白。通过常规技术将表达载体转移到宿主细胞,然后通过常规技术培养经过转染的细胞以产生编码多肽,从而产生对应的CD3结合蛋白。
为了将重组蛋白引导到宿主细胞的分泌路径中,在表达载体中提供分泌信号序列(也称为前导序列)。分泌信号序列可以是重组蛋白的天然形式的分泌信号序列,或可以源自于另一个分泌蛋白或重新合成。将分泌信号序列可操作地连接到编码多肽的DNA序列,即,将两个序列在正确的阅读框中接合且进行定位以便将新合成的多肽引导到宿主细胞的分泌路径中。分泌信号序列通常相对于编码相关多肽的DNA序列位于5',但某些信号序列可以位于相关DNA序列中的其它地方(参见例如Welch等,美国专利号5,037,743;Holland等,美国专利号5,143,830)。在特定变化方案中,根据本发明使用的分泌信号序列具有氨基酸序列MEAPAQLLFLLLLWLPDTTG(SEQ IDNO:79)。
培养的哺乳动物细胞是适合于产生在本发明内使用的重组蛋白的宿主。用于将外源性DNA引入到哺乳动物宿主细胞中的方法包括磷酸钙介导的转染(Wigler等,Cell 14:725,1978;Corsaro和Pearson,Somatic Cell Genetics 7:603,1981;Graham和Van der Eb,Virology52:456,1973)、电穿孔(Neumann等,EMBO J.1:841-845,1982)、DEAE右旋糖酐介导的转染(Ausubel等,同上)和脂质体介导的转染(Hawley-Nelson等,Focus 15:73,1993;Ciccarone等,Focus 15:80,1993)。举例来说,以下文献中公开了在培养的哺乳动物细胞中产生重组多肽:Levinson等,美国专利号4,713,339;Hagen等,美国专利号4,784,950;Palmiter等,美国专利号4,579,821;和Ringold,美国专利号4,656,134。合适的哺乳动物宿主细胞的例子包括非洲绿猴肾细胞(Vero;ATCC CRL 1587)、人胚肾细胞(293-HEK;ATCC CRL 1573)、幼仓鼠肾细胞(BHK-21、BHK-570;ATCC CRL 8544、ATCC CRL10314)、犬肾细胞(MDCK;ATCC CCL 34)、中国仓鼠卵巢细胞(CHO-K1;ATCC CCL61;CHO DG44;CHO DXB11(Hyclone,Logan,UT);也参见例如Chasin等,Som.Cell.Molec.Genet.12:555,1986))、大鼠垂体细胞(GH1;ATCC CCL82)、HeLa S3细胞(ATCC CCL2.2)、大鼠肝细胞癌细胞(H-4-II-E;ATCC CRL 1548)、经SV40转化的猴肾细胞(COS-1;ATCC CRL 1650)和鼠胚细胞(NIH-3T3;ATCC CRL1658)。其它合适的细胞系在本领域中是已知的,并且可得自诸如弗吉尼亚州马纳萨斯的美国典型培养物保藏中心等公共保藏中心。可以使用强转录启动子,诸如得自于SV-40或巨细胞病毒的启动子。参见例如美国专利号4,956,288。其它合适的启动子包括来自于金属硫蛋白基因的启动子(美国专利号4,579,821和4,601,978)和腺病毒主要晚期启动子。
药物选择一般用于选择出其中已插入外来DNA的培养的哺乳动物细胞。所述细胞通常称为“转基因细胞”。在选择剂存在下培养且能够将相关基因传递给其后代的细胞称为“稳定转基因细胞”。示例性选择标记物包括对抗生素新霉素具有抗性的编码基因,它允许在诸如G-418等新霉素类型药物存在下进行选择;针对黄嘌呤-鸟嘌呤磷酸核糖基转移酶的gpt基因,它允许宿主细胞在霉酚酸/黄嘌呤存在下生长;和提供针对博来霉素、争光霉素、灭瘟素和潮霉素的抗性的标记物(参见例如Gatignol等,Mol.Gen.Genet.207:342,1987;Drocourt等,Nucl.Acids Res.18:4009,1990)。选择系统还可以用于增加相关基因的表达水平,这一过程称为“扩增”。通过在低水平选择剂存在下培养转基因细胞,然后增加选择剂的量直到选择出能产生所引入基因的高水平产物的细胞来进行扩增。示例性可扩增选择标记物是二氢叶酸还原酶,它能赋予针对氨甲蝶呤的抗性。还可以使用其它抗药性基因(例如潮霉素抗性、多药物抗性、嘌呤霉素乙酰转移酶)。
还可以使用其它高级真核细胞作为宿主,包括昆虫细胞、植物细胞和禽类细胞。Sinkar等,J.Biosci.(Bangalore)11:47-58,1987已经回顾了使用发根农杆菌作为在植物细胞中表达基因的载体。以下文献中公开了转化昆虫细胞和在其中产生外来多肽:Guarino等,美国专利号5,162,222;和WIPO公布WO 94/06463。
可以用通常源自于苜蓿银纹夜蛾核多角体病毒(AcNPV)的重组杆状病毒感染昆虫细胞。参见King和Possee,The BaculovirusExpression System:A Laboratory Guide(Chapman&Hall,London);O'Reilly等,Baculovirus Expression Vectors:A Laboratory Manual(Oxford University Press.,New York 1994);和Baculovirus ExpressionProtocols.Methods in Molecular Biology(Richardson编,Humana Press,Totowa,NJ,1995)。还可以通过使用Luckow等(J.Virol.67:4566-4579,1993)描述的基于转座子的系统来产生重组杆状病毒。这个系统利用转移载体,可以呈试剂盒形式得自市面(BAC-TO-BAC试剂盒;LifeTechnologies,Gaithersburg,MD)。转移载体(例如PFASTBAC1;LifeTechnologies)含有用于将编码相关蛋白质的DNA移动到呈大质粒(称为“杆粒”)形式维持于大肠杆菌中的杆状病毒基因组中的Tn7转座子。参见Hill-Perkins和Possee,J.Gen.Virol.71:971-976,1990;Bonning等,J.Gen.Virol.75:1551-1556,1994;和Chazenbalk和Rapoport,J.Biol.Chem.270:1543-1549,1995。另外,转移载体可以包括如上文所公开与编码多肽延伸或亲和力标签的DNA进行框内融合。使用本领域中已知的技术,将含有蛋白质编码DNA序列的转移载体转化到大肠杆菌宿主细胞中,且针对含有指示重组杆状病毒的中断lacZ基因的杆粒筛选所述细胞。使用常用技术分离含有重组杆状病毒基因组的杆粒DNA,且用于转染草地贪夜蛾细胞,诸如Sf9细胞。随后产生表达相关蛋白质的重组病毒。通过本领域中通常使用的方法制造重组病毒储备液。
对于蛋白质产生来说,使用重组病毒感染宿主细胞,典型地为源自于草地粘虫、草地贪夜蛾(例如Sf9或Sf21细胞)或粉纹夜蛾(例如HIGH FIVE细胞;Invitrogen,Carlsbad,CA)的细胞系。一般参见Glick和Pasternak,Molecular Biotechnology,Principles&Applications ofRecombinant DNA(ASM Press,Washington,D.C.,1994)。还参见美国专利号5,300,435。使用无血清培养基来生长和维持所述细胞。合适的培养基制剂在本领域中是已知的且可以获自市面上的供应商。使所述细胞从大约2-5×105个细胞的接种密度生长到1-2×106个细胞的密度,此时加入感染复数(MOI)为0.1到10,更典型地为接近3的重组病毒储备液。所使用的程序一般描述于可用的实验室手册中(参见例如King和Possee,同上;O'Reilly等,同上;Richardson,同上)。
本发明内也可以使用真菌细胞,包括酵母细胞。在这方面特别相关的酵母种类包括酿酒酵母、巴斯德毕赤氏酵母和甲醇毕赤酵母。举例来说,以下文献公开了用外源性DNA转化酿酒酵母细胞和由其产生重组多肽的方法:Kawasaki,美国专利号4,599,311;Kawasaki等,美国专利号4,931,373;Brake,美国专利号4,870,008;Welch等,美国专利号5,037,743;和Murray等,美国专利号4,845,075。通过由通常具有抗药性或能够在不存在特定营养(例如亮氨酸)的情况下生长的选择标记物确定的表型来选择经过转化的细胞。用于酿酒酵母的示例性载体系统是Kawasaki等(美国专利号4,931,373)所公开的POT1载体系统,它允许通过在含葡萄糖的培养基中生长来选择经转化的细胞。用于酵母的合适的启动子和终止子包括来自于糖解酶基因(参见例如Kawasaki,美国专利号4,599,311;Kingsman等,美国专利号4,615,974;和Bitter,美国专利号4,977,092)和醇脱氢酶基因的那些。还参见美国专利号4,990,446、5,063,154、5,139,936和4,661,454。用于其它酵母,包括多形汉逊酵母、粟酒裂殖酵母、乳酸克鲁维酵母、脆壁克鲁维酵母、玉米黑粉菌、巴斯德毕赤氏酵母、甲醇毕赤酵母、季也蒙毕赤酵母和麦芽糖假丝酵母的转化系统在本领域中是已知的。参见例如Gleeson等,J.Gen.Microbiol.132:3459-3465,1986;Cregg,美国专利号4,882,279;和Raymond等,Yeast 14:11-23,1998。可以根据McKnight等,美国专利号4,935,349的方法利用曲霉细胞。Sumino等,美国专利号5,162,228公开了用于转化产黄头孢的方法。Lambowitz,美国专利号4,486,533公开了用于转化脉孢菌的方法。美国专利号5,716,808、5,736,383、5,854,039和5,888,768中公开了在甲醇毕赤酵母中产生重组蛋白。
原核宿主细胞,包括细菌大肠杆菌、牙胞杆菌属和其它菌属的菌株,也是本发明内可用的宿主细胞。用于转化这些宿主和表达克隆于其中的外来DNA序列的技术在本领域中是众所周知的(参见例如Sambrook和Russell,同上)。当在诸如大肠杆菌等细菌中表达重组蛋白时,蛋白可以保留在细胞质中,典型地呈不溶性颗粒形式,或可以被细菌分泌序列引导到壁膜间隙。在前一种情况下,细胞被溶解,且颗粒被回收并且使用例如异硫氰酸胍或尿素使其变性。然后,变性蛋白可以再折叠且通过稀释变性剂来进行二聚,诸如通过针对尿素溶液及还原型和氧化型谷胱甘肽的组合进行透析,随后针对缓冲生理盐水溶液进行透析。在替代方案中,蛋白质可以呈溶解形式从细胞质中回收且在不使用变性剂的情况下分离。蛋白质是在例如磷酸盐缓冲生理盐水中呈水性提取物形式从细胞中回收。为了俘获相关蛋白质,将提取物直接应用于色谱介质,诸如固定的抗体或肝素-琼脂糖凝胶柱。可以通过破坏细胞(例如,通过超声处理或渗透性冲击)以释放壁膜间隙的内含物且回收蛋白质,从而避免对变性和再折叠的需要而从壁膜间隙回收呈可溶解和功能形式的分泌蛋白。可以根据已知的方法在细菌宿主细胞中产生抗体,包括单链抗体。参见例如Bird等,Science242:423-428,1988;Huston等,Proc.Natl.Acad.Sci.USA 85:5879-5883,1988;和Pantoliano等,Biochem.30:10117-10125,1991。
根据常规程序在含有营养和所选宿主细胞生长所需的其它组分的培养基中培养经过转化或转染的宿主细胞。多种合适的培养基,包括确定成分培养基和复合型培养基,是本领域中已知的,且一般包括碳源、氮源、必需氨基酸、维生素和矿物质。培养基还可以视需要含有诸如生长因子或血清等组分。一般将通过例如药物选择或必需营养素缺乏来选择用于含有外源添加DNA的细胞的生长培养基,所述必需营养素是通过表达载体上携带的或共同转染到宿主细胞中的选择标记物来补充。
可以利用常规蛋白质纯化方法,典型地通过色谱技术的组合来纯化CD3结合蛋白。一般参见Affinity Chromatography:Principles&Methods(Pharmacia LKB Biotechnology,Uppsala,Sweden,1988);Scopes,Protein Purification:Principles and Practice(Springer-Verlag,New York 1994)。可以通过在固定的蛋白A或蛋白G上进行亲和色谱法来纯化包含免疫球蛋白Fc区的蛋白质。可以使用诸如凝胶过滤等其它纯化步骤来获得所要的纯度水平或进行脱盐、缓冲液交换等等。
本发明还包括了包含本发明的CD3结合多肽和药学上可接受的载剂、稀释剂和/或赋形剂的组合物。
在本发明的一个实施方案中,将单特异性CD3结合多肽施用到罹患诸如变形性关节炎等自体免疫疾病的患者。在本发明的另一个实施方案中,将本发明的单特异性CD3结合多肽施用到将要进行器官移植的受试者。
在另一个方面,本发明提供了一种用于治疗诸如癌症等以肿瘤抗原过表达为特征的病症的方法。一般来说,所述方法包括向需要所述治疗的受试者施用治疗有效量的如本文中所描述的包含能结合肿瘤抗原的第二结合域的CD3结合蛋白。在一些实施方案中,CD3结合蛋白诱导重定向T细胞细胞毒性(RTCC)针对受试者中表达肿瘤抗原的细胞。
在所述方法的某些变化方案中,所述病症是癌症。在其它变化方案中,所述病症是自体免疫疾病。本发明还提供了用于治疗癌症或自体免疫病症的方法,包括向有需要的患者施用治疗有效量的本文中所描述的组合物或CD3结合多肽。
在本文中所描述的治疗方法的各实施方案中,以符合与寻求治疗的疾病或病症的处置相关的常规方法的方式递送CD3结合蛋白。根据本文中的公开内容,将有效量的CD3结合蛋白施用给需要该治疗的受试者持续足以预防或治疗所述疾病或病症的时间或在足以预防或治疗所述疾病或病症的条件下施用。
为了施用,将CD3结合蛋白配制为药物组合物。包含CD3结合蛋白的药物组合物可以根据已知的方法来配制以制备药学上有用的组合物,其中组合治疗分子,呈与药学上可接受的载剂的混合物的形式。如果组合物的施用能被受体患者耐受,则将其称为“药学上可接受的载剂”。无菌磷酸盐缓冲生理盐水是药学上可接受的载剂的一个例子。其它合适的载剂对于本领域技术人员是众所周知的。(参见例如Gennaro(编),Remington's Pharmaceutical Sciences(Mack PublishingCompany,第19版,1995)。)制剂还可以包括一种或多种赋形剂、防腐剂、增溶剂、缓冲剂、白蛋白,以防止小瓶表面上的蛋白质损失等。
将包含CD3结合蛋白的药物组合物以治疗有效量施用给受试者。根据本发明的方法,CD3结合蛋白可以通过多种施用模式施用给受试者,包括例如通过肌肉内、皮下、静脉内、心房内、关节内、肠胃外、鼻内、肺内、经皮、胸膜内、鞘内和口服施用途径。出于预防和治疗目的,施用给受试者可以例如以单次快速推注递送方式、经由延长时间段内的连续递送(例如连续经皮递送)或以重复施用方案(例如,以每小时、每日或每周计)。
分子或组合物的“治疗有效量(或剂量)”或“有效量(或剂量)”是能在缓解病症的一种或多种症状方面产生统计上显著的效果(诸如统计上显著地减缓疾病进展或统计上显著地改良器官功能)的量。确切剂量将由临床医师根据公认标准,考虑欲治疗的病状的性质和严重程度、患者特性等来确定。剂量的确定在本领域技术人员的水平内。当提到组合时,治疗有效剂量是指产生治疗效果的活性成分的组合量,无论是依次施用还是同时施用(例如,在同一制剂中或在单独的制剂中同时施用)。
有效剂量的决定在本文中典型地是基于动物模型研究和随后的人临床试验,且通过确定能在模型受试者中显著减少受试者病症的发生或严重程度的有效剂量和施用方案加以指导。本发明组合物的有效剂量取决于许多不同的因素而变化,包括施用手段、目标部位、患者生理状态、患者是人还是动物、施用的其它药物处理、治疗是预防性的还是治疗性的,以及组合物本身的特定活性和其在个体中引出所要反应的能力。通常,患者是人,但在一些疾病中,患者可以是非人哺乳动物。典型地,调节给药方案以提供最佳治疗反应,例如,以优化安全性和功效。