CN104487979A - 用于预测肽的免疫原性的系统和方法 - Google Patents

用于预测肽的免疫原性的系统和方法 Download PDF

Info

Publication number
CN104487979A
CN104487979A CN201380039722.1A CN201380039722A CN104487979A CN 104487979 A CN104487979 A CN 104487979A CN 201380039722 A CN201380039722 A CN 201380039722A CN 104487979 A CN104487979 A CN 104487979A
Authority
CN
China
Prior art keywords
peptide
albumen
score
mhcii
compound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201380039722.1A
Other languages
English (en)
Inventor
P·帕斯
F·J·阿斯瓦德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bayer Healthcare LLC
Bayer Corp
Original Assignee
Bayer Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bayer Corp filed Critical Bayer Corp
Publication of CN104487979A publication Critical patent/CN104487979A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/30Immunoglobulins specific features characterized by aspects of specificity or valency
    • C07K2317/34Identification of a linear epitope shorter than 20 amino acid residues or of a conformational epitope defined by amino acid residues

Landscapes

  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Physiology (AREA)
  • Chemical & Material Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Peptides Or Proteins (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了预测肽的免疫原性的系统、计算机可读存储介质和方法。在某些情况下,所述系统包含:a)肽的模型、MHCII蛋白的模型和T细胞受体的模型;和b)用于以下的可执行程序:(i)评估包含所述肽、所述MHCII蛋白和所述T细胞受体的复合物的分子间相互作用的强度以提供预测所述肽的免疫原性的得分;和(ii)输出所述得分。

Description

用于预测肽的免疫原性的系统和方法
相关申请的交叉引用
本申请要求于2012年5月25日提交的美国临时申请61/652,076的优先权,所述临时申请以引用的方式全文纳入本文。
背景技术
从天然来源分离的或通过重组方法合成的人治疗性蛋白质(生物制剂)在被给予人类患者时能诱导免疫应答。这些免疫应答可导致的作用范围为从轻微的皮肤刺激到治疗药物的效力下降,并且在一些情况下可造成器官衰竭或死亡。减轻潜在的免疫原性是蛋白质工程的主要挑战之一。因此,使得能够对蛋白质的免疫原性进行临床前评估的工具和测定法可能是重要的。
附图说明
技术人员会理解下面描述的附图仅是为了说明的目的。所述附图并不意欲以任何方式限制本教导的范围。
图1示出了可用于实施图2所示的方法的计算机系统的一个示例性的实施方案。
图2示出了用于预测肽的免疫原性的方法的一个示例性的实施方案的一些特征。
图3示出了可以用来实施图2中所示的方法的方式。
发明内容
提供了一种计算机系统。在某些实施方案中,所述计算机系统包含存储器,所述存储器包含:a)肽的模型、MHCII的模型和T细胞受体的模型;和b)用于以下的可执行程序:(i)评估包含所述肽、所述MHCII蛋白和所述T细胞受体的复合物的分子间相互作用的强度以提供预测所述肽的免疫原性的得分;和(ii)输出所述得分。所述存储器还可包含用于在所述计算机系统的显示器上显示所述复合物的图像的指令。
还提供了包含免疫原性预测程序的计算机可读存储介质。在这些实施方案中,如上所述,所述介质可包含用于以下的指令:a)评估包含肽、MHCII蛋白和T细胞受体的复合物的分子间相互作用的强度以提供预测所述肽的免疫原性的得分;和b)输出所述得分。在某些实施方案中,所述免疫原性预测程序包含用于以下的指令:a)评估每一种均包含肽、MHCII蛋白和T细胞受体的多种复合物的分子间相互作用的强度,其中所述复合物包含不同的肽并且所述指令产生每一种复合物的得分;b)通过所述不同的肽的得分将它们排序(rank);和c)输出根据它们的得分排序的所述不同的肽的列表,从而提供了所述肽的免疫学特征(immunological profile)。
还提供了预测肽的免疫原性的方法。在某些实施方案中,所述方法包含:a)将所述肽的序列信息输入到包含免疫原性预测程序的系统中,所述免疫原性预测程序包含用于以下的指令:(i)评估包含所述肽、MHCII蛋白和T细胞受体的复合物的分子间相互作用的强度,以提供预测所述肽的免疫原性的得分;和(ii)输出所述得分;b)执行所述免疫原性预测程序;和c)从所述系统接收所述得分。在某些实施方案中,所述方法还包括:d)将所述得分排序。
本文列出了本教导的这些和其他特征。
定义
在更详细地描述示例性的实施方案之前,列出下面的定义以阐明和定义在本说明书中使用的术语的含义和范围。
本文中的“免疫原性”和语法上的同义词意指免疫应答的程度,所述免疫应答,包括但不限于,中和抗体和非中和抗体的产生、免疫复合物的形成、补体激活、肥大细胞激活、炎症和过敏反应。免疫原性具有物种特异性。在一些实施方案中,免疫原性是指在人类中的免疫原性。在一些实施方案中,免疫原性是指在啮齿动物(包括但不限于,大鼠、小鼠、仓鼠、豚鼠等)、灵长类动物、农场动物(包括但不限于,绵羊、山羊、猪、牛、马等)和家畜(包括但不限于,猫、狗、兔等)中的免疫原性。
本文中的“免疫应答”和“免疫学应答”以及语法上的同义词意指
免疫系统对分子的应答,包括体液免疫应答或细胞免疫应答。非限制性的免疫应答包括中和抗体和非中和抗体的产生、免疫复合物的形成、补体激活、肥大细胞激活、炎症和过敏反应。
本文中的“预测”意指在没有真正给药的情况下,系统或测定法在脊椎动物中充当体内免疫原性的替代物并概括或模拟治疗性给药的免疫原性结果或应答的能力。即,如果系统能够合理精确地证明——如果蛋白质抗原已被给药,其会引起或不会引起免疫原性应答,则该系统或测定法可预测脊椎动物免疫原性。
本文中的“增强的免疫原性”和语法上的同义词意指与对照(例如,未修饰的蛋白质)相比时的增强的激活免疫系统的能力。例如,如果经修饰的蛋白质与未经修饰的蛋白质相比以更高的效价或在更多的受试者中引起中和抗体或非中和抗体,则该经修饰的蛋白质可被称为具有“增强的免疫原性”。在具体的实施方案中,产生中和抗体的可能性提高了至少5%,例如至少2倍或至少5倍。例如,如果未经修饰的蛋白质在10%的受试者中产生免疫应答,则具有增强的免疫原性的变体会在10%以上的受试者(例如,20%以上或50%以上的受试者)中产生免疫应答。如果经修饰的蛋白质与亲本蛋白质相比显示出对一种或多种MHCI或MHCII等位基因的增强的结合或者如果其在更多的受试者中诱导T细胞激活,则该经修饰的蛋白质可被称为具有“增强的免疫原性”。在一些实施方案中,T细胞激活的可能性增加了至少5%,例如至少2倍或至少5倍。
本文中的“降低的免疫原性”和语法上的同义词意指与对照(例如,未修饰的蛋白质)相比时降低的激活免疫系统的能力。例如,如果治疗剂是蛋白质,如果经修饰的蛋白质与未经修饰的蛋白质相比以更低的效价或在更少的受试者中引起中和抗体或非中和抗体,则该经修饰的蛋白质可被称为具有“降低的免疫原性”。在一些实施方案中,产生中和抗体的可能性降低了,例如至少5%、至少50%或至少90%。例如,如果亲本蛋白质在10%的受试者中产生免疫应答,则具有降低的免疫原性的经修饰的蛋白质会在低于10%的受试者(例如,低于5%或低于1%的受试者)中产生免疫应答。如果经修饰的蛋白质与亲本蛋白质相比显示出对一种或多种MHCI或MHCII等位基因的降低的结合或者如果其在更少的受试者中诱导T细胞激活,则该经修饰的蛋白质也可被称为具有“降低的免疫原性”。在一些实施方案中,T细胞激活的可能性降低了至少5%,例如至少50%或至少90%。
本文中的“免疫刺激”和语法上的同义词意指刺激与在其他部分(例如蛋白质的免疫惰性部分)中产生的免疫应答相比更强的免疫应答的蛋白质的一部分。
本文中的“免疫惰性”和语法上的同义词意指不刺激免疫应答的蛋白质的一部分。
术语“MHCI”和“I类MHC”包括任何人I类MHC分子,其包括HLA-A、HLA-B和HLA-C的所有天然存在的序列变体,以及来自其他物种的等同分子。
术语“MHCII”和“II类MHC”包括任何人II类MHC分子,其包括DRA、DRB1、DRB3/4/5、DQA1、DQB1和DPB1分子的所有天然存在的序列变体,以及来自其他物种的等同分子。
本文使用的术语“TCR”和“T细胞受体”用于指任何人T细胞受体、和来自其他物种的那些。
本文中使用的术语“输入”用于指将信息输入计算机的任何方式。例如,在某些情况下,输入可包括选择已存在于计算机系统上的序列或模型。在其他情况下,输入可包括将序列或模型添加到计算机系统中。可使用用户界面进行输入。
本文中使用的术语“执行”用于指用户所采取的启动程序的动作。
本文中使用的术语“对接”是指将两个或多个单独的蛋白质组装成复合物的计算过程。
本文中使用的术语“评估分子间相互作用的强度”是指任何用于测量两个或多个蛋白如何很好地与彼此结合的方法,包括测量亲和力、互补性、能量支持(energetic favorability)(其可被测量为自由能的差异)等的方法。
在输入序列信息的上下文下,本文中使用的术语“序列信息”旨在包括输入序列的标识符(identifier)、输入序列和输入序列的结构信息(例如,序列的原子坐标)。
本文中使用的术语“接收”用于指通常以人类可读的形式(例如,以图形或文本文件的形式)将信息从计算机系统的存储器传送到用户。该术语旨在包括将图像传送到计算机监视器的屏幕、以及通过电子手段(例如,通过电子邮件等)将文件传送给用户。
在任何实施方案中,可将数据转发到“远程位置”,其中“远程位置”意指除了所述程序在其中执行的位置以外的位置。例如,远程位置可以是在同一城市的另一位置(例如,办公室、实验室等)、在不同城市的另一位置、在不同州的另一位置、在不同国家的另一位置等。因此,当一个项目被指示为另一个的“远离的”时,则意味着这两个项目可以在同一房间中,但是是分开的,或者至少在不同的房间中或不同的建筑物中,并且可以相距至少一英里、十英里或至少一百英里。“传送”信息是指将代表该信息的数据作为电信号通过适合的通信渠道(例如,私人或公共网络)传输。“转发”项目是指使该项目从一个位置到下一个位置的任何方式,无论是通过物理运输(physically transport)该项目还是通过别的方式(在可能时),并且包括(至少在数据的情况下),物理运输携带数据的介质或传送数据。通信介质的实例包括无线电或红外传输通道以及与另一计算机的网络连接或联网设备,以及互联网或者包括电子邮件传输和在网站之上记录的信息等等。
本文使用的术语“模型”是指任何方式的蛋白质三维结构的代表性数据。在一些情况下,模型可表示为例如一组原子坐标或电子密度图。可以理解的是,当在下面的说明书中提到蛋白质的结构时,其是被提及的蛋白质的代表(即,所述蛋白质的模型而不是蛋白质分子本身)。同样地,当提到复合物的相互作用时,其是指被预测在所提及的复合物模型中发生的相互作用。蛋白质的模型可包括翻译后修饰(例如,磷酸化或糖基化等)的结构信息(例如,原子坐标)。在一些实施方案中,可通过对蛋白质进行X射线晶体学分析产生“模型”。在其他实施方案中,可通过同源建模——即,使用高度相关的蛋白质的模型模拟蛋白质的氨基酸序列——产生模型。
本文使用的术语“MHCII蛋白”和“T细胞受体”是指结合到肽上的那些蛋白质的至少一部分。因此,在某些实施方案中,可使用MHCII蛋白的肽结合槽的模型、T细胞受体蛋白的CDR3区域的模型以及所述肽的模型进行下述方法。在某些情况下,可使用这些蛋白质的其他部分的模型(例如,所述T细胞受体的CDR1区域和CDR2区域、或所述MHCII蛋白的T细胞结合表面)。
具体实施方式
本公开内容提供了用于预测肽的免疫原性的系统、计算机可读存储介质以及方法。使用该系统、计算机可读存储介质或方法,可在研究和开发过程的早期评估肽的免疫原性,其中可获得大量候选物用于筛选。在某些情况下,在药物开发过程中,使用本发明的方法可降低或消除通过实验方法(例如,使用体外或体内测定法)测量候选生物活性蛋白质的免疫原性的需要。这种实验方法可能是资源密集型的且是相对缓慢的。
在描述各个实施方案之前,应理解,本公开内容的教导不限于所描述的具体实施例,并因此,当然是可以变化的。还应理解,本文使用的术语仅仅是为了描述具体实施方案的目的,但不意欲进行限定,因为本教导的范围将仅由所附的权利要求书来限定。
本文使用的部分标题仅仅是为了组织目的,不应被解释为以任何方式限制本发明的主题。尽管结合多个实施方案对本教导进行了描述,但是并不意味本教导将受限于这些实施方案。相反,正如本领域技术人员将会理解的,本教导包括各种替代、修改和等价物。
除非上下文另有明确说明,当提供值的范围时,应理解,在该范围的上限和下限之间的每一个中间值至下限单位的十分之一、以及在该规定范围中的任何其他规定值或中间值都包括在本公开内容内。
除非另有说明,本文使用的所有技术术语和科学术语具有与本公开内容所属领域的普通技术人员通常理解的的含义相同的含义。尽管在本教导的实施或测试中还可使用和本文所述的那些相似或等同的任意方法和材料,现在对一些示例性的方法和材料进行描述。
对任何出版物的引用是因为其公开先于本申请日,而不应被解释为承认本申请权利要求由于在先发明而没有资格早于这些公开物。另外,所提供的出版日期可不同于可能需要单独确认的实际出版日期。
除非上下文中另有明确说明,单数形式“一”、“一个”和“所述”包括复数指代对象。还要注意,可草拟权利要求以排除任何任选要素。因此,本声明旨在作为将排他性术语(如“单独地”、“仅”等等)用于权利要求要素的记载或使用“否定性”限定的先行基础。
如本领域普通技术人员在阅读本公开内容时会了解的,本文所描述的和所阐明的每一个单独的实施方案都具有离散的部件和特征,其可容易地与任何其他一些实施方案的特征分离或结合,而不偏离本教导的范围或精神。可按照所列举事件的顺序或者逻辑上可能的任何其它顺序实施任何所记载的方法。
计算机系统
图1示出了可被用于依据下述方法预测肽的免疫原性的系统100的一个实施方案。如本领域技术人员会理解的,很多不同的硬件选项和数据结构可用于实施下述方法。因此,图1所示的系统是示例性的并是非限制性的。
基本上,可将任何通用的计算机配置成用于本文所公开的方法和程序的功能性排列(functional arrangement)。这类计算机的硬件结构是本领域技术人员已知的,并且可包含硬件部件,所述硬件部件包括一个或多个处理器(CPU)、随机存取存储器(RAM)、只读存储器(ROM)、内部或外部数据存储介质(如硬盘驱动器)。计算机系统还可包括一个或多个用于处理并将图形信息输出到显示装置的图形板块。可将上述部件适当地通过计算机内部的总线互连。所述计算机还可包括用于与通用外部部件(例如监视器、键盘、鼠标、网络等)通讯的合适的接口。在一些实施方案中,所述计算机可以能够进行平行处理或可以是所配置的用于平行或分布式计算的网络的一部分,以增强本发明方法和程序的处理能力。在一些实施方案中,可将从所述存储介质读出的程序代码写入由插入于所述计算机中的扩展板提供的或由所述计算机连接的扩展单元所提供的存储器,并且由所述扩展板或扩展单元所提供的CPU等实际上可根据程序代码的指令执行部分或全部操作,以便完成下述功能。在其他实施方案中,可使用云计算系统执行所述方法。在这些实施方案中,可将数据文件和编程导出到云计算机,所述云计算机运行该程序,并将输出返回给用户。
在某些实施方案中,系统100可包括计算机102,其包括:a)中央处理单元104;b)非易失性主存储驱动器106,其可包括一个或多个用于存储软件和数据的硬盘驱动器,其中所述存储驱动器106由磁盘控制器108控制;c)系统存储器110,例如高速随机存取存储器(RAM),用于存储系统控制程序、数据和应用程序(包括从非易失性存储驱动器106加载的程序和数据);d)系统存储器110还可包括只读存储器(ROM);用户界面112,其包括一个或多个输入或输出设备,如鼠标114、键盘116和显示器118;e)任选的网络接口卡120,用于连接到任何有线或无线通信网络(例如,打印机);以及f)用于将所述系统的上述元件互连的内部总线122。
所述计算机系统的存储器可以是可通过处理器存储检索信息的任何设备,并且可包括磁性或光学设备、或固态存储器设备(如易失性或非易失性RAM)。存储器或存储器单元可具有一个以上相同或不同类型的物理存储器装置(例如,存储器可具有多种存储器装置,如多个驱动器、卡(card)或多个固态存储器装置,或它们的一些组合)。关于计算机可读介质,“永久性存储器”是指永久性的存储器。永久性存储器不会因对计算机或处理器的电力供应的终止而被擦除。计算机硬盘驱动器ROM(即未用作虚拟存储器的ROM)、CD-ROM、软盘和DVD都是永久性存储器的实例。随机存取存储器(RAM)是非永久性(即易失性)存储器的实例。永久性存储器的文件可以是可编辑的和可重写的。
计算机102的操作主要由操作系统124控制,其通过中央处理单元104执行。操作系统124可存储在系统存储器110中。在一些实施方案中,操作系统124包括文件系统126。除了操作系统124之外,系统存储器110的一种可能的实施方式还包括用于实施下述免疫原性预测方法的多种编程文件128和数据文件130。在某些情况下,所述编程128可包含免疫原性预测程序132,其中所述免疫原性预测程序132可包括多个模块,例如,对接模块138、评分模块140和用户界面模块134(其允许用户在用户界面112手动选择或改变到编程128的输入或由编程128所使用的参数。所述存储器可任选地包含用于模拟肽、MHC II蛋白和/或TCR蛋白的建模模块136,和/或排序模块142。数据文件130可包括所述编程的各种输入,包括肽模型144、MHC II模型146和TCR模型148数据文件。编程128还可包括图1中未示出的其他程序。例如,编程128还可包括结构预测模块,例如,从头建模程序或最佳拟合建模程序,即,基于已知结构(由例如晶体学研究所获得的)预测TCR和/或MHCII氨基酸序列的结构以提供新的数据文件130(例如,新的肽结构、新的MHCII结构和/或新的TCR结构)的程序。在一些实施方案中,可将所述MODELER程序(Discovery Studio,Accelrys,San Diego,CA)用作所述编程128。编程128还可包含移动窗口模块,所述移动窗口模块沿着长的蛋白质的氨基酸序列移动确定尺寸的滑动窗口以提供不同的肽序列,如果无法获得这类肽的结构,则所述不同的肽序列可被模拟并输入到免疫原性预测程序132。
数据文件144、146和148中的每一个的数目可发生很大变化。在具体的情况下,可存在每个文件各一个。但是,在一些情况下,可能有,例如,5至100个MHCII蛋白和/或TCR蛋白模型文件,但是更大数目的文件(例如,最高达1,000个或更多)可存在于多种情况中。在某些情况下,可能有1至100个或更多个肽模型文件144。在某些情况下,所述肽模型文件144可包含通过以下方式产生的肽序列的结构:如本文所述的,使用移动窗口模块处理候选生物活性蛋白质的氨基酸序列,然后使用结构预测模块处理所得的氨基酸序列。还可包括包含所述肽、MHCII蛋白和/或TCR蛋白的氨基酸序列的序列文件150。
模型文件144、146和148可以是适合显示蛋白质的三维结构的任意类型。在某些实施方案中,这些文件可以是包含多种蛋白的原子坐标的文本文件,但是可使用任意方式显示蛋白质的三维结构。在某些实施方案中,所述结构数据文件可含有最少量的实施本方法的信息。例如,TCR结构数据文件可包含只有TCR蛋白的CDR3的结构信息,因为该区域主要负责抗原结合。同样地,MHCII结构数据文件可包含只有MHCII蛋白的结合槽的结构信息。
在使用时,用户可将肽的序列信息输入到所述系统,并且从所述系统中接收复合物的排序列表。在该方法中,所述输入可包含选择或键入使得计算机能够鉴定输入的肽结构的标识符。在某些情况下,所述用户可输入肽的序列信息,并且所述计算机在启动该方法之前可模拟所述肽。在具体的情况下,除了关于肽的序列信息之外,所述用户还可输入所述MHCII蛋白和/或TCR蛋白的序列信息或模型。
计算机可读介质
在某些实施方案中,可以“编程”的形式将依据本文所述的方法的指令编码到计算机可读介质中,其中本文使用的术语“计算机可读介质”是指参与向计算机提供指令和/或数据用于执行和/或处理的任何存储或传输介质。存储介质的实例包括软盘、硬盘、光盘、磁-光盘、CD-ROM、CD-R、磁带、非易失性存储卡、ROM、DVD-ROM、蓝光盘、固态硬盘和网络连接存储(NAS),不管这些设备是否是内置于或外置于计算机。可将含信息的文件“存储”在计算机可读介质上,其中“存储”意指这样记录信息以使得计算机可在以后的日期对其访问和检索。
可使用可以一个或多种任意数量的计算机编程语言写入的编程执行本文所述的计算机-执行的方法。这些语言包括,例如,Java(SunMicrosystems,Inc.,SantaClara,CA)、VisualBasic(MicrosoftCorp.,Redmond,WA)和C++(AT&T Corp.,Bedminster,NJ)、以及任何很多其他语言。
方法
图2示出了用于预测肽的免疫原性的计算机-执行的方法200的一个示例性实施方案。一般而言,由用户通过将一种或多种肽的序列信息输入到计算机系统中,并执行预测所述肽的免疫原性的程序来启动计算机执行方法200。然后,所述用户从所述系统中接收预测所述肽的免疫原性的得分。在图2所示的实施方式中,方法200的计算机执行的部分包含评分子程序202,其用于计算包含肽、MHCII蛋白和T细胞受体的复合物的分子间相互作用的强度以提供并输出预测所述肽的免疫原性的得分。在某些情况下,评分子程序202可结合排序子程序204执行,当已经在可被排序的几个不同复合物上执行评分子程序202(由此产生几个得分)时,所述排序子程序204对由所述评分子程序202输出的得分进行排序。
可使用多个编程模块(例如,对接模块、评分模块和任选的建模模块)执行评分子程序202。在一些实施方案中,由用户执行所述程序使得计算机能够鉴定包含所选择的肽的模型、所选择的MHCII蛋白的模型和所选择的TCR蛋白模型的数据文件206。然后,将所选择的模型对接(使用,例如,对接模块)以提供肽-MHCII(pMHCII)模型208。在一些实施方案中,ZDOCK和RDOCK程序(Discovery Studio,Accelrys,SanDiego,CA)是可被用来提供所述模型的程序的实例。在某些情况下,可将所述肽的模型在MHCII蛋白的结合槽中围绕着其纵轴旋转以鉴定在所述肽和所述MHCII蛋白之间具有最大的互补性的复合物,用于此的方法是已知的。一旦鉴定出具有最佳互补性的复合物,可计算在所述pMHCII的模型中所述肽和所述结合槽之间互补性的程度以量化所述MHCII蛋白和所述肽的能量上最有利排列。可通过计算所述复合物的ΔG——即两种状态之间的自由能差异——来指示所述互补性的程度。在某些实施方案中,使用多种考虑到空间相互作用、疏水相互作用、范德华力等的方法计算蛋白质或肽的自由能(G)。由于修改了那些参数,所述蛋白质的自由能发生变化。与变性蛋白质模型相比的蛋白质模型的自由能差异定义了ΔG。换句话说,G(折叠蛋白)-G(变性蛋白质)=ΔG。
该数字(一旦获得)可被用于从所述方法的后面步骤中消除pMHCII的模型。例如,如果所述肽没有以大于预定阈值的亲和力与MHCII蛋白对接,则认为其是无免疫原性的并且可在所述方法的后面步骤中将其消除。在某些情况下,可计算指示所述肽和所述MHCII蛋白之间的互补性程度的得分,并且可结合其他测量值使用该数字来计算下述的免疫原性得分。
在图2所示的实施方案中,在所述pMHCII复合物模型已在步骤208中产生之后,可将所述pMHCII复合物与TCR蛋白质对接以产生pMHCII-TCR模型210。在产生所述pMHCII-TCR复合物模型之后,计算指示所述pMHCII-TCR模型是如何在能量上有利的得分214。这可被表示为自由能的差异。所述得分可指示所述TCR蛋白(特别是TCR蛋白的CDR3区域)与所述pMHCII复合物中所述肽之间的结合强度。在某些情况下,此计算也可考虑到所述肽和所述MHCII蛋白之间的结合强度。然后将该得分输出216。所述输出可以是任何类型的数值评估,例如,在1至100或1至1000或更大的范围内的数字,但是在某些情况下可使用其他类型的得分,例如,字母得分。
在某些实施方案中,可在几个不同的模型上重复所述方法,所述不同的模型在例如所述肽的氨基酸序列、所述MHCII蛋白的氨基酸序列和/或TCR的氨基酸序列上不同的。因此,在某些实施方案中,所述编程可确定是否所有所选择的序列都已经被分析218。如果并非所有模型均已被分析,则用新的输入运行所述程序。如果所有模型均已被分析,则所述程序可基于复合物的得分对它们进行排序220,并输出所述复合物的排序列表222。可通过排序子程序204进行所述排序。
一旦输出,可将得分的排序列表可检索地记录在计算机可读介质上。可使用多种数据文件类型和格式进行存储。在一些实施方案中,可记录包含每一种复合物的序列名称、以及通过它们的免疫原性得分排序的所述复合物各自的免疫原性的文本文件。
所述程序的对接模块可使用任何合适的方法将蛋白结构契合(fit)在一起。在一个实施方案中,所述对接步骤可基于两种蛋白质表面间的互补性将所述蛋白质契合在一起(参见,例如,Goldman et al,Proteins200038:79-94;Meng et al,Journal of Computational Chemistry 200413:505–524和Morris et al,Journal of Computational Chemistry 199819(14):1639–1662;全部以引用的方式纳入)。但是,在一些实施方案中,可通过计算在构象空间中的蛋白质-蛋白质对的相互作用能量将所述蛋白质契合在一起(参见,例如,Feig et al,Journal of ComputationalChemistry 200425:265–84;以引用的方式纳入)。所述方法的第二类可纳入刚体变换(例如平移和旋转),以及内部变化(例如扭转角度旋转)。用于对接的其他方法是已知的。
可使用任何合适的方法计算出估算pMHCII-TCR复合物中的结合相互作用的强度(特别是所述复合物中的肽与TCR蛋白的结合强度)的得分。在某些情况下,可使用基于力场、经验或知识的方法的任意组合计算所述得分。所述力场方法是这样的方法,在其中通过将所述复合物中两个蛋白质的分子间范德华力和原子间静电相互作用的强度进行加和来估计亲和力。在某些情况下,可以考虑两个结合配偶体的分子内能量(其在某些出版物中可被成为“应变能”)。最后,由于所述结合可在水性环境中发生,有时可使用隐式溶剂化方法(如Generalized Born模型(其可被用于计算疏水溶剂可及的表面积)和/或Poisson-Boltzmann方程(其描述了在含离子的溶剂中溶质的静电环境))将所述肽和蛋白质的去溶剂化能量考虑进去。在一些实施方案中,可通过经验方法——其基于计算所述两个结合配偶体之间的各种类型相互作用的数目——进行评分(参见,J.Comput.Aided Mol.Des.199812:309–23;以引用的方式纳入)。这种评分方法是基于彼此接触的原子的数目或是通过计算在所述复合物中与非复合蛋白质相比的溶剂可及表面积的变化(ΔSASA)。可使用多元线性回归方法拟合所述评分函数的系数。所述评分可基于以及进行:例如,疏水-疏水相互作用(有利的),疏水-亲水相互作用(不利的)、氢键(有利的,特别是如果被与溶剂屏蔽(ifshielded from solvent),如果溶剂暴露没有贡献(if solvent exposed nocontribution))以及在复合物形成中所固定的可旋转键(不利的)的数目和强度。基于知识的方法(也称为统计潜力)是基于被用于获得平均力势的大3D数据库(例如剑桥结构数据库或蛋白质数据库)中的分子间紧密接触的统计学观察结果。基于知识的方法都建立在这样的假设上,即,与通过随机分布所预期的相比发生得更为频繁的特定类型的原子或官能团之间的紧密分子间相互作用可能是能量上有利的,并因此有利地增加了结合亲和力(Muegge et al,J.Med.Chem.200649:5895–902;以引用的方式纳入)。
图3中示出了上述方法的一个实施方案。在该实施方式中,所述方法使用多个MHCII模型和多个肽模型作为输入,其中所述肽模型代表来自给定蛋白质的每一个15聚体肽。在一些实施方案中,可通过沿着所述蛋白质的氨基酸序列移动具有确定尺寸的滑动窗口以提供不同的肽来产生所述肽的模型。在这种情况下,所使用的窗口长度为15个氨基酸(因为这类似于适合契合进(fit into)所述MHCII结合裂缝的典型肽的大小)。但是,实际上,可使用范围为9到30个氨基酸的确定尺寸的窗口。使用单个TCR进行图3中所示的实施方案。实际上,可使用很多不同TCR(例如,2-1,000个TCR)的模型进行所述方法。在具体的实施方案中,可使用一个或多个可从T细胞库(可在体外或在体内制备)的序列中鉴定出的免疫显性TCR进行所述方法。在一些实施方案中,可通过离体刺激T细胞增殖,并对编码所得T细胞受体库的多核苷酸进行测序来获得所述TCR序列。
在该方法中,以成对的方式将n个MHCII模型与i个肽结构(其中,i是来自给定蛋白质的15聚体的数目)对接以产生多个肽-MHCII组合(pMHCIIa…n(1…i))。如上所述,在此阶段,如果所述肽不能很好地契合到MHCII蛋白的结合槽中,则可将pMHCII复合物消除。可使用计算机方法或者使用例如体外方法消除pMHCII。进而以成对的方式将这些复合物与TCR蛋白对接,并根据结合相互作用的强度进行评分,特别是计算了所述MHCII复合物中的肽与TCR蛋白的结合强度。将所述复合物排序(例如,基于亲和力、平均力场能量或任何其他合适的方式,从最弱到最强,反之亦然)并输出TCR-pMHCII复合物的排序列表。
本方法中使用的模型可从多种不同的来源获得。在一些情况下,可在那些分子的已知晶体结构(其若干实例是已知的)上模拟所述TCR蛋白和/或MHCII蛋白。用于模拟MHCII蛋白的结合槽的方法的实例是已知的,例如,De Rosa et al(PLoS One.20105:e11550);Cárdenas etal(J.Comput.Aided Mol.Des.201024:1035-51)和Menconi(Proc.Natl.Acad.Sci.2008105:14034-9),用于模拟TCR蛋白的CDR3的方法也是一样(参见,例如,Leimgruber et al(PLoS One.20116:e26301);Michielin et al(J.Mol.Bio.2000300:1205-35);Borg et al(NatureImmunology 20056:171-80);以引用的方式纳入)。可基于可利用的原子坐标对肽进行建模,或可通过本领域已知的多种结构预测程序中的任一种预测其线性结构。
用于将肽对接到MHCII蛋白以产生pMHCII复合物的方法是已知的(例如,Tong et al,Protein Sci.200413:2523–2532;Almagro et al,Protein Sci.19954:1708–1717;以引用的方式纳入)。在一些实施方案中,通过如下步骤对结合槽末端附近的肽残基进行对接:使用有效的伪-布朗刚体对接过程,然后是通过空间约束的满意度进行的中间骨架结构的环闭合,以及随后,对在MHC受体-肽界面处具有较差契合的整个骨架和配体相互作用侧链以及受体侧链进行精修。
用途
上述方法具有很多应用。在一个具体的实施方案中,所述方法可用于鉴定靶蛋白(例如,治疗性蛋白质)的免疫刺激片段。在这些实施方案中,所述方法可包含鉴定蛋白质的免疫刺激片段并改变该片段(例如通过改变所述片段的氨基酸序列、或通过将翻译后修饰添加该片段中到或从该片段中去除),以降低所述蛋白质的免疫原性。该方法可运用于任何治疗性蛋白,包括但不限于工业、药物和农业蛋白,包括可被给药以用于治疗如下的血液疾病或障碍的蛋白质:例如贫血(例如,再生障碍性贫血、范可尼(fanconi)贫血、溶血性贫血、镰状细胞性贫血、遗传性球形红细胞增多症和地中海贫血)、血红蛋白尿、血液凝固障碍(包括无纤维蛋白原血症、因子V缺乏、因子VII缺乏、因子X缺乏、因子XI缺乏、因子XII缺乏、血友病A、血友病B、冯〃维勒布兰德氏病、播散性血管内凝血、抗凝血酶III缺乏、伯纳德-苏里尔(Bernard-Soulier)综合症、蛋白C缺乏、血小板功能不全、血小板贮存池缺乏,蛋白质s缺乏)、紫癜(包括伊文氏(evans)综合症和血栓性血小板减少性紫癜)、血型不合、血液血小板疾病(如血小板减少症),血液蛋白质疾病(例如冷球蛋白血症和华氏(waldenstrom)巨球蛋白血症)、骨髓增生异常综合症、骨髓增生性疾病、血红蛋白病或白细胞异常(例如,嗜酸粒细胞增多、木村疾病,白细胞减少症和嗜中性白细胞减少症)等。
所述方法可运用于作为治疗癌症和其他疾病等的靶标的蛋白质。这类靶蛋白质的实例包括但不限于,配体、细胞表面受体、抗原、抗体、细胞因子、激素、转录因子、信号转导模块、细胞骨架蛋白、毒素和酶。治疗性蛋白的非限制性实例包括,腺苷脱酰胺酶、精氨酸酶、天冬酰胺酶、骨形态发生蛋白-7、睫状神经营养因子、DNA酶、促红细胞生成素、因子IX、因子VIII、促卵泡激素、葡糖脑苷脂酶(glucocerebrocidase)、促性腺激素释放激素、粒细胞集落刺激因子、粒细胞-巨噬细胞-集落刺激因子、生长激素、生长激素释放激素、人绒毛膜促性腺激素、胰岛素、干扰素α、干扰素β、干扰素γ、白细胞介素-2、白细胞介素-3、白细胞介素-1、鲑鱼降钙素、葡激酶、链激酶、组织纤溶酶原激活剂和血小板生成素。所述亲本蛋白质还可包括受体的胞外结构域,包括但不限于CD4、白细胞介素-1受体、肿瘤坏死因子受体和抗体(包括鼠类的、嵌合的、人源化的、骆驼源的(camelized)、llamalized、单链的或完整人类抗体)。蛋白质治疗剂可以是天然存在的或合成的。
在另一个实施方案中,所述方法可用于鉴定靶蛋白的免疫惰性片段。在这些实施方案中,所述方法可包含:鉴定靶蛋白的免疫惰性片段并改变该片段(例如,通过改变所述片段的氨基酸序列或者通过将翻译后修饰添加到所述片段中或从所述片段中去除)以提高所述蛋白的免疫原性。所述蛋白可来自任何传染性疾病,例如炭疽,水痘,白喉,甲型、乙型或丙型肝炎,HIB,HPV,季节性流感,脑炎,疟疾,麻疹,脑膜炎,腮腺炎,百日咳,脊髓灰质炎,狂犬病,风疹,带状疱疹,天花,破伤风,TB或黄热病(yeller fever)等。可使用这种方法,例如通过鉴定与癌症相关的免疫原性表位来鉴定癌症治疗的新靶标。然后可将这些表位用于设计疫苗或提高预先存在的针对特定表位的免疫应答。
在一些实施方案中,所述方法还可用于在具有自身免疫疾病的受试者中鉴定自身抗原。在该实施方案中,可对所述个体的T细胞库进行测序,并且可使用上述方法测试来自所述个体的蛋白质序列以鉴定免疫显性的自身肽——其序列应使得能够在所述个体中鉴定引起自身免疫性疾病的自身抗原。在类似的实施方案中,所述方法可用于预测与癌症相关的蛋白质的多个片段的免疫原性,并用于鉴定被预测为免疫刺激性的蛋白质的片段。可将所述免疫刺激片段用作或开发为,例如,癌症疫苗。
在上述实施方案的一些中,使用在被疫苗或治疗性蛋白所靶向的人群(例如北美、亚洲、南美、北非等)中普遍存在的MHCII蛋白质的结构进行建模可以是有利的。在某些情况下,所述输入MHCII蛋白可对应于个体的MHCII单倍型。
在任意一个上述实施方案中,可使用多种不同的测定法(如结合测定法或T细胞增殖测定法)测试对蛋白质的氨基酸序列的任何改变。在一些实施方案中,将离体T细胞活化测定法用于在实验上定量免疫原性(参见,例如Fleckenstein supra,Schmittel et.al.,J.Immunol.Meth.,24:17-24(2000),Anthony and Lehmann,Methods 29:260-269(2003),Stickler et al.,J.Immunother.23:654-660(2000),Hoffmeister et al.,Methods 29:270-281(2003);和Schultes and Whiteside,J.Immunol.Meth.279:1-15(2003),全部以引用的方式全文纳入)。可使用多个测定方案中的任意一种;这些方案在抗原呈递模式(MHC四聚体,完整的APC)、所述抗原(肽片段或完整蛋白)的形式、刺激的轮数以及检测方法(细胞因子产生的Elispot检测、流式细胞术、氚化胸苷掺入)上是不同的。
在一些实施方案中,所述方法可用于鉴定炎症的新靶标。在一些实施方案中,可对患有炎性疾病的受试者的T细胞受体库进行测序,并鉴定出免疫显性的T细胞受体。可将与来自受试者的MHCII蛋白形成复合物的该受体用于筛选大量的肽序列(例如,代表受试者的完整蛋白质组的肽)以鉴定最佳契合所述受体的肽,从而鉴定了免疫显性表位。一旦知道了所述免疫显性表位,则可对其进行靶向用于治疗。
尽管已经为了清楚理解的目的,以说明和实例的方式对上述实施方案进行了相当详细地描述,但是鉴于以上教导,对于本领域的普通技术人员来说是很明显的是,可对其进行某些改变和修改而不脱离所附权利要求的精神或范围。
实施例
可根据以下实施例进一步理解本教导的各方面,其不应被解释为以任何方式限制本教导的范围。
实施例1
步骤1:使用Perl脚本(AA_process.pl)可将所研究的蛋白质的氨基酸序列用于产生一系列重叠的15个氨基酸的肽。通过沿着所研究的蛋白质的氨基酸序列移动窗口以提供一系列彼此重叠14个氨基酸残基的肽来完成所述方法。所得的输出将是带有包含所研究的蛋白质的整个长度的重叠15聚体肽的列表的文本文件。
步骤2:使用MODELER(Discovery Studio,Accelrys)或等同的蛋白质建模软件对缺少x-射线晶体学结构的II类主要组织相容性复合物(MHCII)蛋白质进行建模。这可通过使用所解析的MHCII蛋白质的结构对未知结构进行同源建模来完成。可用于同源建模的结构可见于蛋白质数据库(PDB)网站。这类结构的一些实例是:3QXA、3L6F和3PGD。
步骤3:也使用MODELER或等同软件将在步骤1中产生的每一种肽进行建模。
步骤4:然后使用蛋白质对接算法(如ZDOCK或RDOCK(Discovery Studio,Accelrys))将步骤3中所建模的肽与步骤2中所建模的MHCII结构或者与来自PDB的已知MHCII结构对接,以确定最稳定的肽-MHCII(pMHCII)组合和构象(confirmation)。使用多参数评分函数基于每一个MHCII的亲和力、构象(confirmation)和普遍性对顶部的pMHCII复合物进行排序。基于各个项目确定截止值。
步骤5:通过标准测序技术或下一代测序技术(例如,适应性TCR)确定响应于所研究的蛋白质的T-细胞的序列。
步骤6:使用来自PDB的已知的TCR(例如,1TCR)的序列,使用同源建模基于步骤5中所获得的序列预测每一个TCR结构。可使用算法(如MODELER)进行同源建模。
步骤7:将步骤4中所预测的顶部pMHCII结构与步骤6中所预测的TCR结构对接以确定构象上最稳定的pMHCII-TCR结构。ZDOCK、RDOCK或类似的蛋白质-蛋白质对接算法将被用于此步骤。排序最高的结构将基于亲和力、构象(confirmation)和普遍性。
步骤8:最终的输出将会是pMHCII-TCR模型的排序列表。
实施例2
考虑到MHCII序列、T细胞受体(TCR)序列和目的蛋白质的序列,根据衍生自目的蛋白的肽形成稳定MHCII-肽-TCR复合物的预期能力如下对它们进行了排序。
开发了以下两步评分方案来模拟TCR-pMHC复合物形成的过程。首先,将所述肽序列建模到MHC腔,并对所述肽-MHC相互作用进行精修和评分。对所述肽和所述MHC的侧链位置进行精修。这得到了pMHC_得分。其次,将TCR添加到来自上一步的所述肽-MHC复合物。对TCR和pMHC的界面侧链、以及TCR相对于pMHC的取向进行了精修。计算了TCR和pMHC之间的相互作用的得分——TCR_pMHC_得分。最后将最终的得分计算为所述两个得分之和:
得分=pMHC_得分+TCR_pMHC_得分
在当前的实施方式中,使用了FireDock评分函数(参见Andrusieret al FireDock:fast interaction refinement in molecular docking.Proteins.200769:139-59和Mashiach et al FireDock:a web server forfast interaction refinement in molecular docking.Nucleic Acids Res.200836:W229-32)。所述FireDock函数包括减弱(softened)的范德华力、去溶剂化、静电、氢键键合、二硫键键合、π-堆积、脂肪族相互作用以及旋转异构体的偏好的加权组合。该函数可被替换为具有对蛋白质-蛋白质对接和环建模显示更好的性能的统计学潜力(statisticalpotential)的函数。可获得特异性针对肽-MHC-TCR相互作用的统计学潜力。可将I类MHC复合物用于培训所述潜力。
所述FireDock方法包括三个主要步骤:
1.侧链优化:通过旋转异构体文库对受体和配体的侧链柔性进行建模。通过解决整数LP问题找到针对所述界面残基的旋转异构体的最佳组合。该LP最小化了由排斥范德华和旋转异构体概率项(term)组成的部分能量函数。
2.刚体最小化:通过MC技术进行该最小化阶段,所述MC技术试图通过精修配体结构的取向来优化近似的结合能。该结合能由减弱的排斥和吸引的范德华项组成。在所述MC方法的每一个循环中,通过quasi-Newton算法进行局部最小化。默认地,进行50个MC循环。
3.评分和排序:这个最终的排序阶段试图鉴定出接近-天然的精修的解析度(solution)。根据结合能函数进行所述排序,所述结合能函数包括多种能量项:去溶剂化能量(原子接触能量,ACE)、范德华相互作用、部分静电、氢键和二硫键、π-堆积和脂肪族相互作用、旋转异构体的概率以及更多。
实施例3
可使用可得到的晶体结构作为新复合物的模板对所述三元MHCII-肽-TCR复合物进行建模。目前,PDB包含九个可作为模板的人MHCII-肽-TCR复合物(NCBI结构登录号1j8h、1fyt、4e41、2iam,2ian,1ymm、3pl6、3o6f和1zgl)。另外,还有类似数量的可作为模板的人MHCII-肽-TCR复合物的结构。
本研究的第二部分将所述三组分的复合物建模与所述评分函数结合,然后进行算法精修。使用可获得的复合物结构将所述评分方案和所述建模方案结合并进行了测试。已经鉴定出复合物中每一种肽的全长序列,并使用上述的建模算法对所有的那些全长序列的肽进行了建模。使用上述方法计算出得分。确定了正确的肽的排序,并与从NetMHCII预测器获得的结果比较(Nielsen et al BMC Bioinformatics.20078:238)。下表1示出了这些结果。
如下表所示,所述基于结构的方法排序出很多高于NetMHCII方法的测试肽。因此,基于下表1所示的结果,与基于传统上所使用的序列的预测方法(NetMHCII)相比,上述基于结构的方法能更好地预测实际结果。
表1:使用晶体结构的肽特异性的基准。

Claims (25)

1.一种包含存储器的计算机系统,所述存储器包含:
a)肽的模型、MHCII蛋白的模型和T细胞受体的模型;和
b)用于以下的可执行程序:
(i)评估包含所述肽、所述MHCII蛋白和所述T细胞受体的复合物的分子间相互作用的强度以提供预测所述肽的免疫原性的得分;和
(ii)输出所述得分。
2.权利要求1的系统,其还包含用于显示所述复合物图像的指令。
3.权利要求1或2的计算机系统,其中所述存储器包含多种不同的肽的模型、所述MHCII蛋白的模型和所述T细胞受体的模型;并且所述存储器包含用于以下的可执行程序:
评估包含所述不同的肽的复合物的分子间相互作用的强度以提供预测所述肽的免疫原性的得分;
通过所述不同的肽的得分将它们排序;和
输出根据它们的得分排序的所述不同肽的列表,其中所述输出提供了所述肽的经排序的免疫学特征。
4.一种包含免疫原性预测程序的计算机可读存储介质,所述免疫原性预测程序包含:
a)评估包含肽、MHCII蛋白和T细胞受体的复合物的分子间相互作用的强度以提供预测所述肽的免疫原性的得分;和
b)输出所述得分。
5.权利要求4的计算机可读存储介质,其中所述评估是通过对所述复合物进行三维建模而完成。
6.权利要求4或5的计算机可读存储介质,其中所述免疫原性预测程序包含用于以下的指令:
a)评估每种均包含肽、MHCII蛋白和T细胞受体的多种复合物的分子间相互作用的强度,其中所述复合物包含不同的肽并且所述评估产生每一种复合物的得分;
b)通过所述不同的肽的得分将它们排序;和
c)输出根据它们的得分排序的所述不同肽的列表,从而提供了所述肽的免疫学特征。
7.权利要求6的计算机可读存储介质,其中所述程序还包含用于输入蛋白质序列的指令和用于沿着蛋白质的氨基酸序列移动具有确定尺寸的滑动窗口以提供所述不同的肽的指令。
8.权利要求7的计算机可读存储介质,其中所述确定尺寸的范围为9到30个氨基酸。
9.权利要求6到8的任一项的计算机可读存储介质,其中所述程序还包含鉴定具有免疫刺激性的肽的指令。
10.权利要求6到9的任一项的计算机可读存储介质,其中所述复合物不同于彼此之处还在于所述MHCII蛋白的一种或多种氨基酸序列以及所述T细胞受体的氨基酸序列。
11.权利要求6到9的任一项的计算机可读存储介质,其中所述复合物包含不同的T细胞受体,其中所述不同的T细胞受体代表个体的T细胞受体库中的至少一部分。
12.一种预测肽的免疫原性的方法,所述方法包含:
a)将所述肽的序列信息输入到包含免疫原性预测程序的系统中,所述免疫原性预测程序包含用于以下的指令:
(i)评估包含所述肽、MHCII蛋白和T细胞受体的复合物的分子间相互作用的强度,以提供预测所述肽的免疫原性的得分;和
(ii)输出所述得分;
b)执行所述免疫原性预测程序;和
c)从所述计算机系统接收得分。
13.权利要求12的方法,其中所述方法包含将两个或多个不同的肽的序列信息输入到所述计算机系统中;并接收通过它们的得分所排序的不同的肽的列表。
14.权利要求13的方法,其中所述两种或多种不同的肽代表同一蛋白的不同的片段。
15.权利要求14的方法,还包含检查所述不同的肽的列表以鉴定所述蛋白的免疫刺激片段。
16.权利要求15的方法,还包含改变所述免疫刺激片段的氨基酸序列以在将所述蛋白给予哺乳动物时降低其免疫原性。
17.权利要求15的方法,还包含改变所述免疫刺激片段的翻译后修饰以在将所述蛋白给予哺乳动物时降低其免疫原性。
18.权利要求14的方法,,还包含检查所述不同的肽的列表以鉴定所述蛋白的免疫惰性片段。
19.权利要求18的方法,还包含改变所述免疫惰性片段以在将所述蛋白给予哺乳动物时增强其免疫原性。
20.权利要求12-19的任一项的方法,其中所述评估包含评估a)所述T细胞受体和b)包含所述肽和所述MHCII蛋白的复合物中的所述肽之间的相互作用的强度。
21.权利要求12-19的任一项的方法,其中所述评估还包含评估a)所述肽和b)所述MHCII蛋白之间的相互作用的强度。
22.权利要求12-19的任一项的方法,其中所述评估还包含评估a)肽和b)包含MHCII蛋白和T细胞受体的复合物的所述肽结合腔之间的相互作用的强度。
23.权利要求12-19的任一项的方法,其中所述方法还包含将所述MHCII蛋白和/或所述T细胞受体的序列信息输入到所述系统中。
24.权利要求12-19的任一项的方法,其中所述方法是来自疫苗的肽,并且所述方法还包含改变所述肽以增强所述疫苗的免疫原性。
25.权利要求12-19的任一项的方法,其中所述方法被用于预测与癌症相关的蛋白质的多个片段的免疫原性,并且鉴定出被预测为免疫刺激性的所述蛋白质的片段。
CN201380039722.1A 2012-05-25 2013-03-14 用于预测肽的免疫原性的系统和方法 Pending CN104487979A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261652076P 2012-05-25 2012-05-25
US61/652,076 2012-05-25
PCT/US2013/031661 WO2013176756A1 (en) 2012-05-25 2013-03-14 System and method for predicting the immunogenicity of a peptide

Publications (1)

Publication Number Publication Date
CN104487979A true CN104487979A (zh) 2015-04-01

Family

ID=49624222

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380039722.1A Pending CN104487979A (zh) 2012-05-25 2013-03-14 用于预测肽的免疫原性的系统和方法

Country Status (14)

Country Link
US (1) US20150205911A1 (zh)
EP (1) EP2856374A4 (zh)
JP (1) JP2015526775A (zh)
KR (1) KR20150021528A (zh)
CN (1) CN104487979A (zh)
AU (1) AU2013266850A1 (zh)
BR (1) BR112014029235A2 (zh)
CA (1) CA2874542A1 (zh)
IL (1) IL235815A0 (zh)
MX (1) MX2014014199A (zh)
NZ (1) NZ702084A (zh)
RU (1) RU2014152463A (zh)
SG (1) SG11201407459QA (zh)
WO (1) WO2013176756A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109002689A (zh) * 2018-07-23 2018-12-14 西安交通大学医学院第附属医院 T细胞数据处理方法及装置
CN110007067A (zh) * 2019-03-11 2019-07-12 江苏理工学院 一种蛋白质分子对接检测装置

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180006945A (ko) 2015-05-13 2018-01-19 아게누스 인코포레이티드 암 치료 및 예방용 백신
GB201607521D0 (en) * 2016-04-29 2016-06-15 Oncolmmunity As Method
EP3776557A4 (en) * 2018-04-13 2021-12-15 The Hong Kong Polytechnic University DATA STORAGE USING PEPTIDES
TW202012430A (zh) 2018-04-26 2020-04-01 美商艾吉納斯公司 熱休克蛋白質-結合之胜肽組成物及其使用方法
KR102425492B1 (ko) * 2020-04-27 2022-07-26 한림대학교 산학협력단 Sars-cov-2 바이러스에 대한 에피토프 기반 펩타이드 백신의 개발 방법
US20220130490A1 (en) * 2020-10-27 2022-04-28 Nec Laboratories America, Inc. Peptide-based vaccine generation
WO2023249440A1 (ko) * 2022-06-24 2023-12-28 지니너스 주식회사 펩타이드와 t 세포 수용체간의 결합을 추정하는 방법 및 장치
KR102611717B1 (ko) * 2022-11-08 2023-12-08 주식회사 제로믹스 면역원성 에피토프를 예측하는 방법 및 이를 이용한 장치

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040230380A1 (en) * 2002-01-04 2004-11-18 Xencor Novel proteins with altered immunogenicity
CN101289496A (zh) * 2008-05-30 2008-10-22 中国医学科学院医学生物学研究所 能激发机体抗结核杆菌的保护性免疫反应的抗原表位筛选方法及用途
CN101548034A (zh) * 2006-10-02 2009-09-30 航道生物技术有限责任公司 多样性合成肽和多肽文库的设计和构建

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69833755T2 (de) * 1997-05-21 2006-12-28 Biovation Ltd. Verfahren zur herstellung von nicht-immunogenen proteinen
EP1330766A2 (en) * 2000-07-10 2003-07-30 Xencor Method for designing protein libraries with altered immunogenicity
CA2452824A1 (en) * 2001-07-10 2003-01-23 Xencor Protein design automation for designing protein libraries with altered immunogenicity
JP2008545180A (ja) * 2005-05-12 2008-12-11 メルク エンド カムパニー インコーポレーテッド T細胞エピトープの全自動選択システムおよび方法
EP2205256A4 (en) * 2007-09-26 2012-10-24 Dana Farber Cancer Inst Inc REAGENTS TO TRIGGER IMMUNE REACTION

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040230380A1 (en) * 2002-01-04 2004-11-18 Xencor Novel proteins with altered immunogenicity
CN101548034A (zh) * 2006-10-02 2009-09-30 航道生物技术有限责任公司 多样性合成肽和多肽文库的设计和构建
CN101289496A (zh) * 2008-05-30 2008-10-22 中国医学科学院医学生物学研究所 能激发机体抗结核杆菌的保护性免疫反应的抗原表位筛选方法及用途

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
HAO ZHANG ET AL.: "Limitations of Ab Initio Predictions of Peptide Binding to MHC Class II Molecules", 《PLOS ONE》 *
JUAN C. ALMAGRO ET AL.: "Molecular modeling of a T-cell receptor bound to a major histocompatibility complex molecule: Implications for T-cell recognition", 《PROTEIN SCIENCE》 *
MORTEN NIELSEN ET AL.: "MHC Class II epitope predictive algorithms", 《IMMUNOLOGY》 *
NATALIE A. BOWERMAN ET AL.: "Engineering the Binding Properties of the T Cell Receptor: Peptide:MHC Ternary Complex that Governs T Cell Activity", 《MOL IMMUNOL》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109002689A (zh) * 2018-07-23 2018-12-14 西安交通大学医学院第附属医院 T细胞数据处理方法及装置
CN109002689B (zh) * 2018-07-23 2020-10-09 西安交通大学医学院第一附属医院 T细胞数据处理方法及装置
CN110007067A (zh) * 2019-03-11 2019-07-12 江苏理工学院 一种蛋白质分子对接检测装置

Also Published As

Publication number Publication date
BR112014029235A2 (pt) 2019-01-29
EP2856374A4 (en) 2016-04-20
WO2013176756A1 (en) 2013-11-28
IL235815A0 (en) 2015-01-29
MX2014014199A (es) 2015-02-12
NZ702084A (en) 2016-09-30
JP2015526775A (ja) 2015-09-10
KR20150021528A (ko) 2015-03-02
SG11201407459QA (en) 2014-12-30
EP2856374A1 (en) 2015-04-08
RU2014152463A (ru) 2016-07-20
AU2013266850A1 (en) 2014-12-04
US20150205911A1 (en) 2015-07-23
CA2874542A1 (en) 2013-11-28

Similar Documents

Publication Publication Date Title
CN104487979A (zh) 用于预测肽的免疫原性的系统和方法
JP7459159B2 (ja) Mhcペプチド結合予測のためのgan-cnn
Bahrami et al. Immunoinformatics: in silico approaches and computational design of a multi-epitope, immunogenic protein
Wang et al. Peptide binding predictions for HLA DR, DP and DQ molecules
Lauck et al. RosettaBackrub—a web server for flexible backbone protein structure modeling and design
Kolder et al. A full-body transcriptome and proteome resource for the European common carp
KR20200050992A (ko) 인간 집단의 관련성을 예측하기 위한 시스템 및 방법
Donovan et al. Unbiased rare event sampling in spatial stochastic systems biology models using a weighted ensemble of trajectories
US7856321B2 (en) Modeling biological effects of molecules using molecular property models
Doneva et al. Predicting immunogenicity risk in biopharmaceuticals
Zhao et al. Peptide-major histocompatibility complex class I binding prediction based on deep learning with novel feature
Guo et al. Machine learning methods for protein-protein binding affinity prediction in protein design
Koparde et al. Dynamical system modeling to simulate donor T cell response to whole exome sequencing-derived recipient peptides: understanding randomness in alloreactivity incidence following stem cell transplantation
Woelke et al. Development of immune-specific interaction potentials and their application in the multi-agent-system VaccImm
Thrift et al. Graph-pMHC: graph neural network approach to MHC class II peptide presentation and antibody immunogenicity
Pappalardo et al. Computational simulations of the immune system for personalized medicine: state of the art and challenges
Toussaint et al. Towards in silico design of epitope-based vaccines
Petrovsky et al. Bioinformatics for study of autoimmunity
Petrovsky et al. The future for computational modelling and prediction systems in clinical immunology
Gutiérrez-González et al. Human antibody immune responses are personalized by selective removal of MHC-II peptide epitopes
Castiglione et al. CTLs' repertoire shaping in the thymus: a Monte Carlo simulation
Doneva et al. Predicting Immunogenicity Risk in Biopharmaceuticals. Symmetry 2021, 13, 388
Trevizani et al. Deepitope: prediction of HLA-independent T-cell epitopes mediated by MHC class II using a convolutional neural network
Wei In Silico Tools in PROTACs design
Gupta et al. Open Tools of Drug Designing for Open Research.

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150401

WD01 Invention patent application deemed withdrawn after publication