CN109072227A

CN109072227A - 用于免疫治疗的监测和诊断及治疗剂的设计

Info

Publication number: CN109072227A
Application number: CN201780024830.XA
Authority: CN
Inventors: 新井理; 铃木隆二
Original assignee: Group Ku Chuang Century Corp
Current assignee: Group Ku Chuang Century Corp; Repertoire Genesis Inc
Priority date: 2016-03-15
Filing date: 2017-03-14
Publication date: 2018-12-21
Also published as: US12065699B2; JPWO2017159686A1; EP3431595A4; EP3431595A1; WO2017159686A1; JP6710004B2; US20190080044A1

Abstract

本发明提供了一种产生用于处置(特别是免疫治疗)、监测或诊断受试者疾病的肽的方法。该方法通过如下所述来实现：获取与受试者的基因组读段(例如，外显子组读段)及其突变相关的信息，以及任选地获取关于受试者的RNA序列的信息和关于受试者的MHC类型的信息，基于与基因组读段(例如，外显子组读段)及突变相关的信息、来自RNA序列的任意信息、MHC类型信息和关于疾病的信息分析与突变相关的表位，以及任选地基于关于表位的信息产生肽。

Description

用于免疫治疗的监测和诊断及治疗剂的设计

技术领域

本发明涉及用于免疫治疗的诊断、监测以及治疗剂的设计。更具体地，本发明涉及基于关于基因组(例如，外显子组)和mRNA的信息、基于MHC的信息以及其他生物信息来分析表位，以基于其结果设计对免疫治疗有用的肽。

背景技术

近来医学和生物学的发展，尤其是下一代测序仪(NGS)的快速发展，使得癌细胞的全基因组分析相对容易，并且使得能够在个体水平上分析细胞致癌转换相关的基因变化。通过这样的发展，使用分子靶向治疗药来调节突变基因功能的个体化治疗在临床医学领域中已经变得普遍。同时，尚未充分地研究靶向突变基因产物(新抗原)的特异性癌症免疫治疗(非专利文献1)。

已经对突变基因进行了基于突变体的综合数据库的分析，也称为突变体组(mutanome)分析。突变体组分析的目的是开发一种通过将各种氨基酸替换突变全面地引入蛋白质并测量每个突变体的结构和功能来构建序列/结构/功能数据库并分析该数据库以仅从序列信息预测蛋白质的结构/功能的方法(非专利文献2)。

[引用列表]

[非专利文献]

[非专利文献1]Schumacher TN等，(2015)Science，348(6230)，69-74，doi：10.1126/science.aaa4971，PMID：25838375

[非专利文献2]Castle JC等，(2012)Cancer Res.，72(5)，1081-1089，doi：10.1158/0008-5472.CAN-11-3722.Epub 2012年1月11日，PMID：22237626

发明内容

[问题的解决方案]

本发明人通过辛勤的研究开发出一种用于产生用于处置、监测或诊断受试者疾病的肽的方法。这通过如下所述来实现：获得与受试者的基因组读段(例如，外显子组读段)及其突变相关的信息和视需要关于受试者的RNA序列的信息以及关于受试者的MHC类型的信息，基于与基因组读段(例如，外显子组读段)及其突变相关的信息、任意的RNA序列信息、关于该MHC类型的信息和关于该疾病的信息来分析与该突变相关的表位，任选地基于表位信息产生肽。

因此，本发明提供了例如以下条目。

(1)一种产生用于处置、监测或诊断受试者疾病的肽的方法，所述方法包括以下步骤：

A)向分析仪中输入与所述受试者的病变组织特异性突变相关的信息和关于所述受试者的MHC类型的信息；

B)使该分析仪基于与该病变组织特异性突变相关的信息、关于该MHC类型的信息和关于该疾病的信息来分析与该突变相关的表位；和

C)基于关于所述表位的信息产生肽。

(2)根据前一条目所述的方法，其中，步骤B)包括以下步骤：使所述分析仪基于参考信息数据库添加对所述疾病组织特异性突变的注释以鉴定候选突变，该候选突变的核酸信息随后被转换为氨基酸信息以产生野生型(WT)肽和突变体(MT)肽，然后使该分析仪利用所述MHC类型、该WT肽和该MT肽搜索表位，随后将表位排序，并使该分析仪输出表位列表。

(3)根据前述条目中的任一条目所述的方法，包括基于与所述受试者的基因组读段及其突变相关的信息得出所述病变组织特异性突变。

(4)根据前述条目中的任一条目所述的方法，其中，所述基因组读段包括外显子组读段。

(5)根据前述条目中的任一条目所述的方法，其中，与所述基因组读段及其突变相关的信息分别获自所述受试者的正常样品和所述受试者的患所述病变样品，并且在定位与该基因组读段及其突变相关的信息之后，搜索所述病变组织特异性突变，以鉴定所述病变组织特异性突变。

(6)根据前述条目中的任一条目所述的方法，其中，步骤A)进一步包括将关于所述受试者的RNA读段的信息输入所述分析仪中，并且步骤B)包括使该分析仪基于关于该RNA读段的信息分析与所述突变相关的表位。

(7)根据前述条目中的任一条目所述的方法，其中，所述RNA读段包括病变组织的RNA读段，并且所述方法进一步包括定位该病变组织的RNA读段以搜索突变和/或得出表达量的步骤。

(8)根据前述条目中的任一条目所述的方法，其中，关于所述RNA读段的信息包括正常组织的RNA读段，并且所述方法进一步包括如下步骤：定位该正常组织的RNA读段以搜索体细胞突变和/或得出表达量，并将所述量与基于所述病变组织的RNA读段得出的表达量进行比较。

(9)根据前述条目中的任一条目所述的方法，其中，所述MHC类型得出自所述受试者的基因组读段。

(10)根据前述条目中的任一条目所述的方法，其中，步骤B)包括选自以下步骤的至少一个步骤：

B-1)使所述分析仪对所述病变组织特异性突变基于现有数据库添加注释并进行核酸-氨基酸转换，以得出关于野生型肽和疾病特异性突变体肽的信息；

B-2)使用已知的数据库，使该分析仪利用所述MHC类型、该野生型肽和该疾病特异性突变体肽搜索该疾病特异性表位；和

B-3)使该分析仪由所获得的表位的肽序列、MHC信息(基因型和亲和力)和突变信息(染色体、位置、突变模式(野生型/突变体)、可靠性、优先级及相应基因(基因名称、表达量))计算评分并按照优先次序对表位进行排序，并且

步骤C)包括以下步骤：

C-1)基于该排序产生肽。

(11)根据前述条目中的任一条目所述的方法，其中，与所述基因组读段及其突变相关的信息获自同一受试者。

(12)根据前述条目中的任一条目所述的方法，其中，与所述基因组读段及其突变相关的信息获自不同受试者。

(13)根据前述条目中的任一条目所述的方法，其中，与所述基因组读段及其突变相关的信息获自正常组织和该病变组织。

(14)根据前述条目中的任一条目所述的方法，其中，使用bwa、bowtie、novoalign或其组合来定位所述基因组读段。

(15)根据前述条目中的任一条目所述的方法，其中，使用包括MuTect、VarScan、lofreq或其组合的突变搜索程序来搜索所述基因组读段的突变。

(16)根据前述条目中的任一条目所述的方法，其中，使用选自ANNOVAR和snpEff的程序并利用选自refGene和ensEmbl的基因结构数据库和/或选自dbSNP、cosmic、1000genomes和whole exome features的已知突变信息的数据库添加所述注释。

(17)根据前述条目中的任一条目所述的方法，其中，使用选自TopHat和STAR的程序定位所述RNA读段。

(18)根据前述条目中的任一条目所述的方法，其中，使用选自MuTect、VarScan、GATK和samtools的突变搜索程序进行对所述RNA突变的搜索。

(19)根据前述条目中的任一条目所述的方法，其中，使用选自CuffLinks和Erange的突变搜索程序进行所述RNA表达量的得出。

(20)根据前述条目中的任一条目所述的方法，其中，使用选自HLAminer、Athlates、Sting HLA、HLA caller、OptiType和omixon的软件进行所述MHC分型。

(21)根据前述条目中的任一条目所述的方法，其中，所述受试者是人，并且所述MHC是HLA。

(22)根据前述条目中的任一条目所述的方法，其中，使用选自NetMHCpan、NetHMC、NetMHCcons和PickPocket的表位搜索程序进行所述表位搜索。

(23)根据前述条目中的任一条目所述的方法，其中，通过考虑选自所述突变的优先次序、存在/不存在基因表达和肽的优先次序中的至少一个要素来进行所述排序。

(24)根据前述条目中的任一条目所述的方法，其中，所述突变的优先次序考虑选自以下项的至少一个要素：已发现命中的突变搜索程序的数量的多少以及存在/不存在RNA水平突变的证据。

(25)根据前述条目中的任一条目所述的方法，其中，通过定位所述RNA读段并计算得出的fpkm或rpkm的值是否为正来确定存在/不存在所述基因表达。

(26)根据前述条目中的任一条目所述的方法，其中，所述肽的优先次序考虑选自以下项的至少一个要素：已发现命中的表位搜索程序的数量的多少、已发现命中的突变搜索软件的数量的多少、以及HLA-肽之间的IC50值<500nM。

(27)根据前述条目中的任一条目所述的方法，其中，通过按顺序应用HLA-肽之间的IC50值、已发现命中的表位搜索程序的数量，以及已发现命中的突变搜索软件的数量来对所述排序进行分类。

(28)根据前述条目中的任一条目所述的方法，其中，所述疾病是肿瘤或自身免疫疾病。

(29)根据前述条目中的任一条目所述的方法，其中，步骤A)包括选自以下步骤中的至少一个步骤：

A-1)使所述分析仪对所述受试者的基因组进行测序，以获得与该受试者的基因组读段及其突变相关的信息，并在定位与该受试者的基因组读段及其突变相关的信息之后搜索所述病变组织特异性突变以获得所述病变组织特异性突变；

A-2)使该分析仪对该受试者的RNA进行测序以获得关于受试者的RNA读段的信息，定位该病变组织的RNA读段，并搜索突变，和/或得出表达量，并且任选地定位正常组织的RNA读段以搜索体细胞突变和/或得出表达量以将所述量与基于该病变组织的RNA读段得出的表达量进行比较；和

A-3)任选地使该分析仪使用该受试者的基因组读段对该受试者进行MHC分型，以获得关于该受试者的MHC类型的信息。

(30)一种鉴定用于处置、监测或诊断受试者疾病的肽的方法，包括以下步骤：

A)向分析仪中输入与该受试者的病变组织特异性突变相关的信息和关于该受试者的MHC类型的信息；和

B)使该分析仪基于与该病变组织特异性突变相关的信息、关于该MHC类型的信息和关于该疾病的信息来分析与该突变相关的表位。

(31)根据前述条目中的任一条目所述的方法，进一步具有前述条目中的任意一个或更多个条目中的特征。

(32)一种产生用于处置、监测或诊断受试者的疾病的肽的设备，该设备包括：

A)信息输入单元，用于输入与该受试者的病变组织特异性突变相关的信息，和任选地关于该受试者的RNA读段的信息和关于该受试者的MHC类型的信息；

B)表位分析单元，用于基于与该受试者的病变组织特异性突变相关的信息和任选地该mRNA序列信息、关于该MHC类型的信息和基于该疾病的信息来分析与该突变相关的表位；和

C)肽产生单元，用于基于该表位的信息产生肽。

(33)根据前一条目所述的设备，其中，在单元B中执行在前述条目中的任意一个或更多个条目中定义的过程。

(34)根据前述条目中的任一条目所述的设备，其中，所述单元A包括用于对所述受试者的基因组进行测序的装置、用于确定所述受试者的病变组织特异性突变的装置、用于对所述受试者的RNA进行测序的装置和用于对所述受试者进行MHC分型的装置中的至少一种。

(35)一种鉴定用于处置、监测或诊断受试者疾病的肽的设备，包括：

A)信息输入单元，用于输入与该受试者的病变组织特异性突变相关的信息和任选地关于该受试者的RNA读段的信息以及关于该受试者的MHC类型的信息；和

B)表位分析单元，用于基于与该受试者的病变组织特异性突变相关的信息和任选地该mRNA序列信息、关于该MHC类型的信息和关于该疾病的信息来分析与该突变相关的表位，并输出其结果作为用于处置、监测或诊断该疾病的肽。

(36)根据前一条目所述的设备，其中，在所述单元B中执行在前述条目中的任意一个或更多个条目中定义的过程。

(37)根据前述条目中的任一条目所述的设备，其中，所述单元A包括用于对所述受试者的基因组进行测序的装置、用于确定所述受试者的病变组织特异性突变的装置、用于对所述受试者的RNA进行测序的装置和用于对所述受试者进行MHC分型的装置中的至少一种。

(38)一种用于使计算机执行鉴定用于处置、监测或诊断受试者的疾病的肽的方法的程序，所述方法包括以下步骤：

A)输入与该受试者的病变组织特异性突变相关的信息和任选地关于该受试者的RNA读段的信息和关于该受试者的MHC类型的信息；和

B)基于与该受试者的病变组织特异性突变相关的信息和任选地该mRNA序列信息、关于该MHC类型的信息和关于该疾病的信息来分析与该突变相关的表位，并输出其结果作为用于处置、监测或诊断该疾病的肽。

(39)根据前一条目所述的程序，进一步具有前述条目中的任意一个或更多个条目中的特征。

(40)一种计算机可读记录介质，其存储用于使计算机执行鉴定用于处置、监测或诊断受试者的疾病的肽的方法的程序，所述方法包括以下步骤：

A)输入与该受试者的病变组织特异性突变相关的信息和任选地关于该受试者的RNA读段的信息以及关于该受试者的MHC类型的信息；和

B)基于与该受试者的病变组织特异性突变相关的信息和任选地该mRNA序列信息、关于该MHC类型的信息以及关于该疾病的信息来分析与该突变相关的表位，并输出其结果作为用于处置、监测或诊断该疾病的肽。

(41)根据前一条目所述的记录介质，进一步具有前述条目中的任意一个或更多个条目中的特征。

本发明的目的在于可以提供上述特征中的一个或更多个，这些特征不仅以明确公开的组合还以其它方式组合提供。通过在需要时阅读和理解下文中的详细说明，本领域技术人员能够认识到本发明的其它实施方案和优点。

[发明的有益效果]

利用本发明可以获得对癌症等各种疾病的更有效的免疫治疗或免疫学监测。

附图说明

图1描绘了本发明的构思。

图2描绘了分析流程的示意图。中央的虚线表示本发明的核心流程。虚线外的区域表示可选的附加分析步骤。

图3示出分析流程中的起始界面，其中可以选择来自肿瘤的外显子组、来自正常组织的外显子组、来自肿瘤的RNA序列和来自正常组织的RNA序列、选择线程数、选择读段修剪条件、低质量(LQ)区的修剪、分析条件等。例如，可以为分析条件选择和设置诸如定位算法及其条件的算法类型。

图4示出分析条件设置界面。可以选择和设置外显子组定位和突变搜索、RNA定位及其表达分析、突变检测、突变注释、HLA分型的条件，以及用于表位预测(确定)的软件和条件。

图5是输出结果的示例。

图6示出实施例1中的实验结果。该图从左侧示出了对干扰素γ(样品编号14、33、41)的ELISPOT测定的结果以及按该顺序的细胞内部干扰素γ染色。

图7描绘了本发明的系统的框图。

具体实施方式

在下文中对本发明进行解释说明。在说明书通篇中，除非另外特别说明，否则单数表达应理解为涵盖其复数形式的概念。因此，除非另外特别说明，否则单数冠词(例如，在英语的情况下为“a”，“an”、“the”等)也应当被理解为涵盖其复数形式的概念。此外，除非另外特别说明，否则本文使用的术语应理解为以本领域常用的含义使用。因此，除非另外定义，否则本文使用的所有术语和科技术语具有与本发明所属领域的技术人员的一般理解相同的含义。在存在矛盾的情况下，以本说明书(包括定义)优先。

如本文所用，“基因组”以本领域常用的含义使用，指生物体的所有染色体的集合。

如本文所用，“外显子组”(exome)以本领域常用的含义使用，表示对基因组的外显子的全面分析和经全面分析的基因组外显子。因此，外显子组与归为基因组一部分的任何事物的全面分析有关。

如本文所用，“基因组读段”和“外显子组读段”分别指从基因组和外显子组的核酸序列读出的内容(read)。读段通常由基于碱基序列(腺嘌呤、胞嘧啶、鸟嘌呤和胸腺嘧啶(对于DNA)和尿嘧啶(对于RNA))的残基的序列信息说明。

如本文所用，“mRNA”是messager RNA的缩写。mRNA以本领域常用的含义使用，指具有可翻译成蛋白质的结构和碱基序列信息的RNA。

如本文所用，“RNA读段”是指从mRNA的核酸序列读出的内容(read)。RNA读段通常由序列信息说明。

如本文所用，“定位”是指根据规则将一个群体的各个组分机械地匹配或分配给另一群体的组分。如本文所用，“基因组定位”是指鉴定核酸序列或基因在基因组或染色体上的位置。此外，“mRNA定位”是指将mRNA读段定位到基因组上。定位出大量读段的位置和未定位的位置交替地重复，这可以分析为分别归为外显子和内含子。mRNA定位不仅可以搜索突变，还可以通过计算频率来得出表达量。

如本文所用，“MHC分型”或“HLA分型”是指鉴定人白细胞抗原的类型。“MHC”是一种主要的组织相容性复合物major histocompatibility complex，也称为主要组织相容抗原复合物，它是人类的人白细胞抗原(Human Leukocyte Antigen；HLA)。MHC类型或HLA类型可以从现有数据库或现有个人信息获得，或者可以通过各种方法来分型。这种方法的实例包括血清学测试、序列特异性寡核苷酸[SSO]、序列特异性引物[SSP]、基于CE序列的分型[SBT]等。或者，当使用下一代测序方法，例如使用Illumina的下一代测序仪的方法时，可以使用其中提供的分型方法进行分析。

如本文所用，“数据库”是指与基因相关的任何数据库。尤其是在本发明中，可以使用包含与疾病突变相关的信息的数据库。这样的数据库的实例包括但不限于日本DNA数据库(DDBJ，DNA Data Bank of Japan，www.ddbj.nig.ac.jp)数据库、GenBank(美国国家生物信息中心，www.ncbi.nlm.nih.gov/genbank/)数据库、ENA(EMBL(欧洲分子生物学实验室)，www.ebi.ac.uk/ena)数据库、IMGT(the international ImMunoGeneTics informationsystem，www.imgt.org)数据库等。

如本文所用，“注释”是指提供与某些数据相关联的信息(元数据)作为注解。在生物信息学领域，这指的是提供与某些生物体相关的基因相关信息等(例如，序列信息)与作为相关注解的与生物体相关的其他信息(基因功能等)。在本发明的方法中，可以使用参考信息数据库(DB)为搜索的突变添加信息。可以添加的信息的实例包括但不限于位置(外显子、内含子、调节区、基因间区等)、是否存在氨基酸突变、与突变相关的已知信息(与疾病、种族频率等相关)等。可以使用的数据库的实例包括基因结构的数据库(refGene、ensEmbl等)、关于突变的已知信息的数据库(dbSNP、cosmic、1000genomes、whole exome features等)等。可以使用注释软件，例如ANNOVAR或snpEff。通常使用ANNOVAR，但软件不限于此。

如本文所用，“分配”是指将诸如特定基因名称、功能或特征区(例如，结构域、结合区等)的信息分配给序列(例如，核酸序列、蛋白质序列等)。具体地，可以通过输入或链接序列等的特定信息来完成分配。

如本文所用，“核酸-氨基酸转换”(也缩写为NN-AA转换)是指基于密码子转换将核酸序列的信息转换为氨基酸序列。对于涉及氨基酸变化的突变，在本发明中可以得出变化前的肽(WT)和变化后的肽(MT)。这是一个简单的字符串转换，可以通过通用编程实现，或者通常是作为标准软件的一部分的函数。

如本文所用，“疾病特异性肽”是指相对于正常受试者，当受试者患有疾病时其频率增加(优选地特异性表达)的肽。当疾病是例如癌症时，疾病特异性肽被称为癌症特异性肽并且可以用作抗癌剂。

针对来自基因突变的抗原(新抗原)的个体化免疫治疗已引起本领域的关注。尤其是在癌症领域，常规使用的癌抗原具有低免疫原性，因此特定癌症免疫治疗的临床效果不一定是好的。在这方面，应当理解，若使用新抗原靶向参与癌症恶性转换的突变基因(Driver mutation)，则不容易发生因癌细胞中的抗原丢失而造成的逃避免疫监视机构，其中所述新抗原是为了被免疫系统识别为“非自体物”而有效地诱导具有高亲和力(highavidity)的抗原特异性T细胞。在这方面有提出，通过鉴定从驱动突变(Driver mutation)衍生的T细胞抗原表位等可以是一种有效的治疗方法(Yamada T，Azuma K，Muta E，Kim J，Sugawara S，Zhang GL等(2013)，PLoS ONE 8(11)：e78389.doi：10.1371/journal.pone.0078389)，并且已进行了一些临床试验。然而，以前是通过单独鉴定肽序列等来解决，因此尚未进行充分的分析。

如本文所用，“受试者”是指经受本发明的诊断或检查、治疗等的对象。

如本文所用，“测试样品”或简称“样品”仅需要是以受试者(生物体)、细胞或由其衍生的物质为目标的、认为其包含能够进行基因表达的样品即可。

如本文所用，“抗原”(antigen)是指可以被抗体分子特异性结合的任何底物。如本文所用，“免疫原”(immunogen)是指可以引发淋巴细胞活化的抗原，淋巴细胞的活化引起抗原特异性免疫应答。如本文所用，“表位”或“抗原决定簇”是指抗原分子中的与抗体或淋巴细胞受体结合的部位。可以使用关于表位的信息产生肽(例如，通过化学合成或微生物产生)以用于免疫治疗，例如癌症免疫治疗或癌症免疫学监测。例如，通过使用肽作为新抗原，这种肽可以用作发挥抗肿瘤作用的抗癌剂。

如本文所用，“诊断”是指鉴定与受试者的疾病、障碍、病症等相关的各种参数，以确定这样的疾病、障碍或病症的当前或未来状态。可以通过使用本发明的方法、设备或系统来检查身体状况。这样的信息可用于选择和确定受试者的疾病、障碍、病症、用于待施用的治疗或预防的处方制剂、方法等的各种参数。如本文所用，狭义地定义的“诊断”是指对当前状态的诊断，但是当广泛定义时，包括“早期诊断”、“预测性诊断”、“预先诊断”等。由于本发明的诊断方法原则上可以利用获自身体的样品并且可以远离诸如医生等的医疗实施者进行，因此本发明在工业上是有用的。为了阐明该方法可以远离诸如医生等的医疗实施者进行，有时会特意将“预测性诊断、预先诊断或诊断”称为“辅助”。如本文所用，“监测”是指当用于诸如癌症免疫等的针对疾病的免疫治疗时，对受试者对于该免疫治疗等的医药等的反应进行评价。任何方法都可用于监测。其一个代表性实例使用酶联免疫斑点测定(ELISPOT)。ELISPOT测定可用于评价受试者对于疫苗、药物或生物制剂的反应或用于评价疫苗、医药品或生物制剂的功效。ELISPOT测定是一种细胞测定，在检测/列出体外(invitro)分泌特定蛋白质的单个细胞中具有最高精度之一。其基于酶联免疫吸附测定(ELISA)，首先被开发用于分析特异性抗体分泌细胞，但也用于测量产生/分泌其他效应分子例如细胞因子等的细胞的频率。ELISPOT测定可以以高至数十万分之一的低频率检测细胞因子分泌细胞，相对于常规的ELISA测定，精确度高出200至400倍，具体取决于所分析的细胞因子/因子。由于响应于抗原释放的细胞因子可以被定位到单个细胞，因此可以计算T细胞应答者频率。ELISPOT还可以指示细胞因子应答的类型，其被认为是诱导的免疫应答的类型。

ELISPOT测定在靶向细胞而非测量溶液方面不同于ELISA，但它们在其他方面具有许多相似性。

在下文中将对该过程进行简要说明。在包被有特异性捕获抗体的孔表面上培养受试细胞。除去细胞后，以与ELISA相同的方式检测分泌的分子。通过使用沉淀基质在分泌细胞所在的位置形成斑点。因此，ELISPOT测定中测量的是分泌细胞的频率而不是溶液中物质的浓度。此外，每个斑点的大小和颜色强度代表从该位置的细胞分泌的细胞因子的量。当使用ELISPOT技术来分析特异性免疫应答时，利用了一种现象，其中T细胞在攻击抗原后开始产生细胞因子作为激活过程的一部分。由于具有对某种抗原有应答能力的每个细胞分泌相应的细胞因子，因此可以通过这种方法来对每个细胞进行鉴定。因此，该技术可用于任何细胞，但作为主要应用领域经常在检测CD8+T细胞中产生的IFN-γ的方法中使用，CD8+T细胞在感染、癌症和疫苗开发的研究中与细胞毒性T细胞(CTL)免疫相关。

如本文所用，“治疗”(therapy)是指关于某种疾病或病症(例如，癌症)，在成为这种情况下预防这种疾病或病症的恶化、优选地维持当前病症、更优选地缓解、并且还更优选地消除这种疾病或病症，包括能够发挥预防作用或改善患者疾病或伴随疾病的一种或更多种症状的作用。事先进行诊断并采用合适的治疗可以称为“伴随治疗”，并将其诊断药称为“伴随诊断药”。如本文所用，“处置”是指对患有某种疾病、障碍或其风险的受试者应用某种类型的处理或者补救。当广泛定义时，处置包括“治疗”和“预防”。

如本文所用，“治疗药(剂)”，当广泛定义时，是指能够医治目标病症(例如，诸如癌症等疾病)的所有药剂，并且是指抑制剂(例如抗体)，例如本发明提供的那些。在本发明的一个实施方案中，“治疗药”可以是包含活性成分和一种或更多种药理学上可接受的载体的医药组合物。例如，可以利用药物技术领域中已知的任何方法通过混合活性成分和上述载体来制备医药组合物。此外，治疗药的使用形式不受限制，只要其是用于治疗的物质即可。治疗药可以是单独的活性成分或者活性成分和任何成分的混合物。载体的形状也没有特别限制。例如，载体可以是固体或液体(例如，缓冲液)。

如本文所用，“预防”是指在处于这样的病症之前针对疾病或障碍(例如癌症)采取措施使得免于处于这样的病症的行为。例如，可以使用本发明的药剂进行诊断，并任选地使用本发明的药剂来预防或采取措施预防癌症等。

如本文所用，“预防药(剂)”，当广泛地定义时，是指能够预防目标病症(例如，诸如癌症等疾病)的所有药剂。

如本文所用，“药剂”、“剂”或者“因子”(每一个都相当于英语的agent)，当广泛地定义时，能够交换使用，可以是任何物质或其他元素(例如，光、辐射、热、电和其他形式的能量)，只要可以实现预期目标即可。这样的物质的实例包括但不限于蛋白质、多肽、寡肽、肽、多核苷酸、寡核苷酸、核苷酸、核酸(包括例如DNA和RNA，所述DNA例如cDNA和基因组DNA，所述RNA例如mRNA)、多糖、寡糖、脂质、有机小分子(例如，激素、配体、信息传递物质、有机小分子、通过组合化学合成的分子、可用作医药品的小分子(例如，小分子配体等)及其复合分子。对多核苷酸具有特异性的因子的典型实例包括但不限于与多核苷酸序列以某一序列同源性(例如，70％或更高的序列同一性)互补的多核苷酸、诸如与启动子区等结合的转录因子的多肽。对多肽具有特异性的因子的典型实例包括但不限于与多肽或其衍生物或类似物直接特异性结合的抗体(例如，单链抗体)、当多肽是受体或配体时的特异性配体或受体、当多肽是酶等时的底物。

可以在本发明中用作药物等的诊断药、治疗药、预防药等的配制方法在本领域中是已知的。该方法描述于例如日本药典、美国药典、其他国家的药典等中。因此，本领域技术人员可以根据本文的描述确定要使用的量而无需过多的实验。

(优选实施方案的说明)

在下文中对本发明的优选实施方案进行说明。应当理解，提供下文中所提供的实施例是为了更好地帮助理解本发明，因此本发明的范围不应当受到以下描述限制。因此，显而易见的是，本领域技术人员可以参考本文的描述以在本发明的范围内进行适当的修改。这些实施方案可以适当地与任何实施方案组合。

(鉴定和产生免疫治疗肽的方法)

在一个方面，本发明提供鉴定用于处置(包括治疗和预防)、监测或诊断受试者疾病的肽的方法。该方法包括以下步骤：A)向分析仪中输入与该受试者的病变组织特异性突变相关的信息和关于该受试者的MHC类型的信息；B)使该分析仪基于与病变组织特异性突变相关的信息、关于该MHC类型的信息和关于该疾病的信息来分析与该突变相关的表位；C)根据该表位的信息产生肽。本发明中使用的“分析仪”可以具有接收和分析待分析的输入信息、通过通信与其他单元接触、输出结果等的功能。在(免疫治疗分析仪/系统和分析软件)中对分析仪进行了详细的描述。可以使用其中的任何实施方案，并且各种单元可以构成分析仪。图7描绘了分析仪的示意图，其在(系统配置)中详细描述。

在一个实施方案中，本发明的方法可以包括以下步骤：A)向该分析仪中输入与该受试者的基因组读段(例如，外显子组读段)及其突变相关的信息，以及任选地关于该受试者的RNA序列的信息和关于该受试者的MHC类型的信息；B)使该分析仪基于与该基因组读段及其突变相关的信息和任选地关于该RNA序列的信息、关于该MHC类型的信息以及关于该疾病的信息来分析与该突变相关的表位，并输出其结果作为用于处置、监测或诊断该疾病的肽。

另一方面，本发明提供了产生用于处置、监测或诊断受试者疾病的肽的方法。该方法包括以下步骤：A)向分析仪中输入与该受试者的病变组织特异性突变相关的信息和关于该受试者的MHC类型的信息；和B)使分析仪基于与该病变组织特异性突变相关的信息、关于该MHC类型的信息和关于该疾病的信息来分析与该突变相关的表位。

在一个实施方案中，本发明的方法可以包括以下步骤：A)向分析仪中输入与该受试者的基因组读段(例如，外显子组读段)及其突变相关的信息和任选地关于该受试者的RNA序列的信息以及关于该受试者的MHC类型的信息；B)使分析仪基于与基因组读段及该突变相关的信息和任选地关于该RNA序列的信息、关于该MHC类型的信息和关于该疾病的信息来分析与该突变相关的表位；C)根据该表位的信息产生肽。

在本发明的方法中，通过分析可以获得与由于体细胞突变(somatic mutation)引起的疾病(例如，癌症)的特异性表位相关的信息，使得能够进行治疗或诊断，例如免疫治疗或免疫学监测。其实例包括使用新抗原(Neoantigen)的方法，基于靶向单个基因突变(独特抗原)的免疫应答的存在以获得抗肿瘤效果，以及其应用和应用于突变体组以用于综合分析。本发明可针对的其他疾病的实例包括由自身反应性T细胞诱导的自身免疫疾病。由于在许多自身免疫疾病中已证明T细胞异常与疾病成因有关，因此可以利用这样的信息。可以应用本发明，因为本发明可以鉴定和分离引起特定疾病的特异性T细胞并容易地确定其识别分子(致病抗原)。至于自身反应性T细胞，类风湿性关节炎/1型糖尿病/多发性硬化症是由关节中的未知抗原的特异性T细胞引起的疾病，因此它们是目标疾病的实例。通过鉴定在自身免疫中由T细胞识别的自身抗原并抑制自身反应性T细胞的活化或抑制活化本身来抑制自身免疫疾病的发作。从根本上理解，针对其自身建立的免疫耐受性的破坏与自身免疫的诱导相关。同时，本发明不仅可以鉴定已知致病抗原(表位)而且还可以鉴定未知致病抗原以通过全面浏览和检索存在/不存在诱导自身免疫的抗原侧体细胞突变来处置或预防疾病。本发明还可以应用于诊断/预防存在/不存在自身免疫疾病的致病抗原以及开发靶向致病抗原的治疗药。

在一个实施方案中，本发明进行的步骤B)包括使分析仪基于参考信息数据库添加对所述疾病组织特异性突变的注释以鉴定候选突变的步骤，其中候选突变的核酸信息然后被转换为氨基酸信息以产生野生型(WT)肽和突变体(MT)肽，然后使该分析仪使用MHC类型(人类的HLA类型)、WT肽和MT肽搜索表位，随后对表位进行排序，并输出表位列表。

在一个特定实施方案中，基于与所述受试者的基因组读段及其突变相关的信息得出病变组织特异性突变。

在一个实施方案中，所述基因组读段可包括来自正常组织的基因组读段和来自病变组织(例如，肿瘤等)的基因组读段。因此，可用于本发明的基因组读段的实例包括从病变组织(例如，肿瘤)或正常组织的基因组DNA序列读出的读段。获得基因组读段的方法的实例包括但不限于全基因组测序方法和外显子组测序方法。因此，与基因组读段及其突变相关的信息分别获自所述受试者的正常样品和所述受试者的病变样品，并且在定位与基因组读段及其突变相关的信息之后，搜索所述病变组织特异性突变以鉴定所述病变组织特异性突变。可以使用的设备的实例包括但不限于任何下一代测序仪(例如，Illumina、Roche 454等)、毛细管测序仪等。应当理解，可以使用任何方法，只要可以对核酸序列(基因序列)进行读段即可。特别地，通常使用外显子组序列。

在一个实施方案中，本发明使用的基因组读段包括外显子组读段。外显子组涉及构成基因组的主要部分的外显子的综合分析及其分析结果。尽管不希望受任何理论的约束，但是应当理解，用于研究的靶向外显子组读段可以靶向与用于研究的实际功能蛋白质更紧密地关联的信息，从而可以提高分析的精确度。

在一个实施方案中，本发明的方法利用关于受试者的RNA读段的信息。因此，在特定的实施方案中，所述步骤A)进一步包括将关于该受试者的RNA读段的信息输入到分析仪中，并且所述步骤B)包括使得分析仪基于关于该RNA读段的信息分析与突变相关的表位。在具体实施方案中，RNA读段包括病变组织的RNA读段，并且该方法还包括定位该病变组织的RNA读段以搜索突变和/或得出表达量的步骤。在一个优选的实施方案中，本发明中使用的RNA读段信息包括正常组织的RNA读段，并且该方法还包括以下步骤：定位该正常组织的RNA读段以搜索体细胞突变和/或得出表达量，并将所述量与基于该病变组织的RNA读段得出的表达量进行比较。尽管不希望受任何理论的约束，但是通过包括和使用从受试者的RNA读段的核酸序列(即，mRNA)读出的信息(read)，所得到的表位命中的精确度显著增加，因而如实施例中所证明的，获得约30％的命中率(通过干扰素γ分泌测定作为示例性实例)。因此，已经发现，可以实现过去不可能的显著水平的命中率。可用于本发明的RNA读段的实例包括从病变组织(例如，肿瘤)和/或正常组织的RNA序列读出的读段。应当理解，可以通过但不限于利用下一代测序仪使用RNA-Seq的方法、利用毛细管测序仪的EST分析或任何方法(只要可以对RNA序列进行读段即可)对这样的RNA序列进行测序。利用下一代测序仪的RNA-Seq最具代表性。

任何分型方法都可以用作可以在本发明中实施的MHC(HLA)分型。例如，可以使用来自基因组读段的软件进行分型。还可以使用用于从样本直接分型的测定系统，例如Luminex测定。

在另一个特定实施方案中，作为分析步骤的步骤B)包括选自以下步骤的至少一个步骤：使分析仪得出关于野生型肽和疾病特异性突变体肽的信息；使分析仪搜索该疾病特异性表位；并且使分析仪从获得的表位计算得分以对待区分优先次序的表位进行排序。在优选的实施方案中，该方法包括以下步骤：使分析仪鉴定疾病特异性突变，并使分析仪基于参考信息数据库添加对疾病组织特异性突变的注释，以鉴定候选突变，然后将候选突变的核酸信息转换为氨基酸信息以产生野生型(WT)肽和突变体(MT)肽的数据，然后使用MHC类型(人类的HLA类型)和WT肽和MT肽的数据搜索表位，随后对表位进行排序，并输出表位列表。

在优选的实施方案中，本发明的方法具有选自以下步骤中的至少一个步骤的一个或更多个特征：B-1)使分析仪基于现有数据库添加注释，并对该病变组织特异性特变进行核酸-氨基酸转换，以得出关于野生型肽和疾病特异性突变体肽的信息；B-2)使分析仪使用已知的数据库通过使用所述MHC类型、该野生型肽和该疾病特异性突变体肽搜索疾病特异性表位；和B-3)使分析仪从获得的表位的肽序列、MHC信息(基因型和亲和力)和突变信息(染色体、位置、突变模式(野生型/突变体)、可靠性、优先级和相应的基因(基因名称、表达量))计算评分用于对待区分优先次序的表位进行排序。

在优选的实施方案中，本发明的方法任选地包括使分析仪执行除B-1)至B-3)之外的以下步骤中的至少一个：分别从所述受试者的正常样品和所述受试者的病变样品获得与所述基因组读段及其突变相关的信息，并且在定位与该基因组读段及其突变相关的信息之后，搜索所述突变以鉴定该病变组织特异性突变；任选地由关于所述RNA读段的信息鉴定并定位疾病特异性序列以搜索突变和/或得出表达量，以及任选地由与该正常组织和该病变组织特异性异常相关的信息进行MHC分型以鉴定MHC类型。

更具体地，步骤B)包括以下步骤作为B-1)：首先使分析仪基于现有数据库添加注释并对所述病变组织特异性突变进行核酸-氨基酸转换以得出关于野生型肽和疾病特异性突变体肽的信息。对于在这方面使用的疾病特异性突变，可以利用已经存在的数据，并且可以执行以下的得出步骤。在得出步骤中，分别从所述受试者的正常样品和所述受试者的所述病变样品获得与该基因组读段及其突变相关的信息，并且在定位该基因组读段及其突变相关的信息(比对)之后，搜索所述病变组织特异性突变以鉴定病变组织特异性突变，添加注释并对病变组织特异性突变进行核酸-氨基酸转换以得出关于野生型肽和疾病特异性突变体肽的信息。可以通过分析关于这些野生型肽和疾病特异性突变体肽的信息来搜索体细胞突变。在输入基因组读段或外显子组读段时，可以为得出步骤考虑附加的流程。

在这方面，可以在本发明中进行的基因组定位是指将基因组读段比对到基因组序列。优选地，预先过滤读段可能是有利的。

用于过滤可以在本发明中使用的读段的方法可以采用任何方法。其代表性实例包括从基因组读段(例如，外显子组读段)和/或RNA读段中删除不适用于分析的区域，例如去除测序接头序列、去除低质量区、去除污染序列等。通过不修剪读段的一部分，而通过从读段集中去除不合适的读段来实现污染序列的去除。例如，可以在进行人类基因组分析之前去除来自细菌或病毒的序列。

可以使用在本领域中已知的任何方法作为去除测序接头序列的方法。其代表性实例包括在适当长度(例如12bp或更高(或10bp或更高、11bp或更高、13bp或更高、14bp或更高等)去除发现与衔接子序列的匹配具有10％或更低的错配率的区域。可以适当地改变错配率。例如，错配率可以是1％或更低、2％或更低、3％或更低、4％或更低、5％或更低、10％或更低、15％或更低、20％或更低等。

可以使用在本领域中已知的任何方法来去除低质量区。代表性的实例包括去除从读段的两端找时在合适的长度(例如10bp)具有预定值(例如12或更小)的平均质量值的区域。

如本文所用，“平均质量值”是指指示基因分析软件中的分析质量的值。该值在要使用的软件(例如，测序软件等)中适当地设置。本文使用的“质量值”是量化从各种测序仪输出的读段上的每个碱基的可靠性的值(定义为-log10(X)×10，其中碱基的错误率是X)。针对每个测序仪，每个碱基的错误率不同。每个测序仪模型通过其自身的逻辑将错误率评估为质量值。由于控制测序仪的前端计算机和在该计算机上运行的软件进行该评估，因此在常用软件(例如，测序软件)中适当地设置错误率。对此，“平均质量值”是在具有确定长度的区域中的质量值的算术平均值。

用于求出平均质量值的平均长度可以是除了上文讨论的值之外的值。其实例包括5bp、6bp、7bp、8bp、9bp、10bp、11bp、12bp、13bp、14bp、15bp和更长的长度。平均质量值的实例包括10或更小、11或更小、12或更小、13或更小、14或更小、15或更小等。

可用于基因组定位的软件的实例包括bwa、bowtie、novoalign等。通常，可以使用bwa。bwa和bowtie是公开的、可以免费下载的软件。Novoalign是本领域技术人员可获得的商业上可获得的软件。

本发明中的体细胞突变搜索是指通过比较病变组织与正常组织来搜索仅在病变组织(例如，肿瘤组织)中发现的突变。这种搜索也可以通过软件实现。可以使用的软件的实例包括突变搜索程序，例如muTect、VarScan和lofreq。通常，可以使用muTect。这样的软件可以同时使用。通过同时使用两种或更多种类型(2种类型、3种类型等)的软件可以提高可靠性。

在B-1)中执行的注释中，可以使用参考信息数据库为搜索到的突变添加信息。对此，可以添加诸如位置(外显子、内含子、调节区、基因间区等)的信息、是否存在氨基酸突变、或与突变相关的已知信息(与疾病相关、种族频率等)。可以使用的数据库的实例包括但不限于refGene、ensEmbl等作为基因结构的数据库。关于突变的已知信息的实例包括但不限于dbSNP、cosmic、1000基因组、全外显子组特征等。可以使用的软件的实例包括但不限于ANNOVAR、snpEff等。优选地使用ANNOVAR。可以进一步使用的数据库包括hg19。hg19是人类基因组序列数据库，其通常可用作背景作为定位的参考序列。

步骤B)还可以任选地包括由关于所述RNA读段信息鉴定并定位该疾病特异性序列以搜索突变和/或得出表达量的步骤。通过包括关于RNA读段的信息可以提高准确性。

通过将定位RNA读段到基因组序列上同时考虑外显子-内含子结构，可以实现mRNA的定位。与基因组读段的情况一样，在某些情况下会提前过滤读段。对于这种过滤技术，可以使用与针对基因组读段相同的技术。mRNA定位可以通过软件实现。可以使用的软件的实例包括TopHat、STAR等。通常，使用TopHat。

与基因组读段的情况一样，可以分析正常组织和病变组织(肿瘤等)的RNA读段。可以为此进行mRNA定位以搜索突变。对于突变搜索，可以搜索体细胞突变，就像基因组读段的情况那样。另外，可以搜索病变组织(例如，肿瘤)中的突变。在病变组织中的这样的突变搜索对在单个样本中发现的突变进行搜索。可以使用的软件的代表性实例包括muTect、VarScan、GATK、samtools等。通常，可以使用GATK。

对于RNA读段而言更具特征性的是，可以得出表达量并将其反映在分析中。通过将mRNA定位结果转换成每个基因的表达量，可以实现表达量的得出和比较。对此，可以通过将定位到每个基因座的读段的量视为表达量来进行分析。该单元通常为但不限于FPKM或RPKM(Fragments/Reads Per Kilobase of exon per Million mapped reads片段/读段/千碱基外显子/百万经定位的读段)。可以比较样本等之间的表达量。可以使用的软件的代表性实例包括CuffLinks、Erange和其他突变搜索程序。通常，使用CuffLink，但软件不限于此。

当同时使用病变组织的RNA读段时，可以进行病变组织(例如，肿瘤组织)的RNA读段的mRNA定位、突变搜索和表达量得出，并且关于这样的突变和表达量的信息可以用于将表位列表按优先次序排列。

当同时使用正常组织的RNA读段时，可以进行正常组织的RNA读段的mRNA定位、体细胞突变搜索和表达量得出，并且这样的信息可以用于将表位列表按优先次序排列。当同时进一步使用病变组织的RNA读段时，通过比较从病变组织的RNA读段得出的表达量和从正常组织的RNA读段得出的表达量得到的关于病变组织和正常组织之间的表达量差异的信息及关于体细胞突变的信息可用于将表位列表按优先次序排列。

步骤B)还可任选地包括使分析仪由与该正常组织和该病变组织特异性异常相关的信息进行MHC分型以鉴定MHC类型的步骤。对此，MHC分型(人类的HLA分型)可以由基因组读段确定HLA类型，但也可以使用在另一种测定系统中进行分型的结果。当使用软件时，可以使用诸如HLAminer、Athlates、Sting HLA、HLA caller、OptiType、omixon等软件。通常，使用omixon(人)或HLA caller(小鼠)。

步骤B)还可以包括步骤B-2)，使分析仪利用已知数据库使用该MHC类型、该野生型肽和该疾病特异性突变体肽来搜索该疾病特异性表位。对此，特异性表位搜索可以从指定的肽中搜索对指定的HLA类型具有亲和力的部分肽。可以使用的软件的实例包括但不限于NetMHCpan、NetHMC、NetMHCcons、PickPocket等。优选地，使用NetMHCpan。同时使用可以提高可靠性。除了人类之外，这也可以通过切换参考数据库在小鼠、大鼠、恒河猴、黑猩猩等中进行。

步骤B)还可以包括步骤B-3)，使分析仪从获得的表位的肽序列、MHC信息(基因型和亲和力)和突变信息(染色体、位置、突变模式(野生型/突变体)、可靠性、优先级和相应的基因(基因名称、表达量))计算评分以对待区分优先次序的表位进行排序。

优选实施方案的另一个特征包括在MHC信息(HLA信息)中搜索具有亲和力的部分肽，然后检查它们是否包含氨基酸突变位置并仅保存前者从而消除无用结果以提高步骤B-3)中分析仪的效率。由此实现分析结果的提高的效率和/或改进的精度。

用于选择表位的基准的实例包括突变的优先次序、存在/不存在基因表达、按优先次序排序的肽等。

在优选的实施方案中，表位选择的基准包括突变的优先次序。突变的优先次序的实例包括但不限于，当在多种类型的突变搜索软件中发现时提高优先级和/或存在来自RNA读段的证据等。或者，当存在基因表达时，也可以考虑提高优先级。存在/不存在基因表达可以通过fpkm或rpkm的值是否为正来确定，fpkm或rpkm的值通过由RNA读段的结果定位RNA读段计算得到。已经发现，如实施例中所示，利用RNA读段的结果有助于提高准确度。或者，可以对肽按优先次序排序。对此，多种类型的表位搜索软件是否发现肽可用于对肽按优先次序排序。肽的优先次序也可以通过参考HLA-肽等之间的IC 50水平来确定。其实例包括但不限于IC50<500nM、优选地IC50<400nM、IC50<300nM、IC50<200nM、IC50<100nM、IC50<90nM、IC50<80nM、IC50<70nM、IC50<60nM、IC50<50nM等。考虑到搜索结果，也可以适当地改变其中间值(例如，在实施例中使用的IC 50<54nM等)并将其用作阈值。

在优选的实施方案中，肽的优先次序考虑选自以下项的至少一种要素：发现命中的表位搜索程序的数量的多少、发现命中的突变搜索软件的数量的多少、HLA-肽之间的IC50值<500nM。更优选地，通过依次应用HLA-肽之间的IC50值、已发现命中的表位搜索程序的数量、以及已发现命中的突变搜索软件的数量来对排序进行分类。尽管不希望受任何理论的约束，但通过这种分选方法可以以出人意料的高精度鉴定抗原肽。

在另一个实施方案中，与所述基因组读段及其突变相关的信息获自本发明中的同一受试者。可以通过获得来自同一受试者的信息考虑同一人中的变化，同时进行分析。对此，与基因组读段及其突变有关的信息优选地从正常组织和所述病变组织获得。

在本发明的另一个实施方案中，与所述基因组读段及其突变有关的信息获自不同的受试者。优选地，正常受试者包括在不同受试者中，以便可以清楚地与怀疑患有疾病的受试者进行比较。可以通过基因组定位将这些差异鉴定为疾病特异性突变(例如，癌症的肿瘤特异性突变)，然后搜索体细胞突变。

一旦以这种方式获得疾病特异性突变，可以使分析仪使用适当的参考信息数据库(DB)添加注释，鉴定候选突变，并将其信息转换成氨基酸信息。可以基于以这种方式转换的候选氨基酸序列生成野生型肽和突变体肽。

在此使用的注释是指使用参考信息DB为搜索到的突变添加的信息。可以添加的信息的实例包括但不限于位置(外显子、内含子、调节区、基因间区等)、是否存在氨基酸突变、与突变相关的已知信息(与疾病的关联、种族频率等)等。可以在注释中使用的数据库的实例包括用于研究基因结构的refGene、ensEmbl等。对于关于突变的已知信息，可以使用dbSNP、cosmic、1000基因组、全外显子组特征等。ANNOVAR、snpEff等可以作为整体使用，而通常使用ANNOVAR，但数据库不限于此。

在本发明的方法中，进行核酸-氨基酸转换(NA-AA转换)，其通过转换常用的密码子代码来实现。不需要使用特别的软件，因为这是通过简单的字符串转换实现的。对于涉及氨基酸变化的突变，在转换为氨基酸后，在本发明中可以得到变化前(WT)和变化后(MT)的肽。由此可以去除在氨基酸水平上未发生变化的突变。

接下来，可以通过比较基于野生型与突变型肽的HLA类型的信息来搜索表位。表位搜索可以从指定的肽中搜索对指定的HLA类型具有亲和力的部分肽。可以使用的软件的实例包括但不限于NetMHCpan、NetHMC、NetMHCcons、PickPocket等。通常，使用NetMHCpan。同时使用两种或更多种类型的软件可以提高可靠性。此外，这通常可以使用例如人类、灵长类动物或啮齿动物等的哺乳动物的数据库来实现，但是这可以通过切换参考数据库代替已经运行的示例性人类实例来针对小鼠、大鼠、恒河猴、黑猩猩等实现。

当在本发明的方法中产生肽时，提供肽序列信息，从而可以通过可以基于序列信息实施的任何产生方法来产生肽，例如化学合成、微生物的产物或切割较大的肽(例如，酶促切割)。优选肽合成(化学合成)。这些是对于大规模生产和/或精确度而言优选的合成方法。

本发明也可以通过与针对人类所述相同的方法在动物中实施。其实例描述如下。

1.可以以所有品系(syngenic)的小鼠中为对象，针对自发地、化学地和辐射诱导的肿瘤(癌症、肉瘤或白血病)搜索新抗原。

2.从患癌小鼠的癌部位收集组织，并在正常小鼠中收集与肿瘤部位相同的器官/组织，其中在患癌小鼠中收集肿瘤部位和非肿瘤部位(例如，结肠癌的肿瘤部位和非肿瘤部位)。当小鼠来自相同的品系时，可以从正常小鼠收集正常组织。

3.从收集的组织/器官中提取DNA和RNA以进行外显子组seq和RNA seq分析。

4.由于每个品系已知MHC(major histocompatibility complex；主要组织相容性复合物)，因此搜索可用于本发明的突变体组mutanome，然后鉴定MHC(小鼠中的H-2)上呈递的新抗原。

5.为了选择新抗原，可以使用与实施例中举例说明的与针对人肿瘤所述相同的方法。

6.对于鉴定的新抗原，可以人工地合成肽，并在同系小鼠的脾细胞中加入并培养，以使用在培养后诱导IFNγ产生作为活化指标。

7.用新抗原刺激并培养的脾细胞来测量对肿瘤的细胞毒性。

8.如果明确通过研究试管的内容物搜索的新抗原功能性地诱导针对肿瘤的T细胞，则进行以下操作。

9.换句话说，检查了使用候选新抗原的体内(in vivo)效应。

10.作为体内效应，将新抗原直接施用于患癌小鼠(移植了新抗原搜索中所使用的肿瘤的小鼠)。此外，树突细胞治疗(来自同系小鼠的树突细胞在体外被刺激和培养并施用于患癌小鼠)可用于治疗。

(免疫治疗分析仪/系统和分析程序)

另一方面，本发明提供了产生用于处置、监测或诊断受试者疾病的肽的设备或系统。该设备或系统包括：A)信息输入单元，用于输入与该受试者的病变组织特异性突变有关的信息以及任选地关于该受试者的RNA读段的信息和关于该受试者的MHC类型的信息；B)表位分析单元，用于基于与该受试者的病变组织特异性突变相关的信息和任选地mRNA序列信息、关于该MHC类型的信息和关于该疾病的信息来分析与该突变相关的表位；C)肽产生单元，用于基于该表位的信息产生肽。在这方面使用的信息输入单元、分析单元和合成单元可包括在(鉴定和产生免疫治疗肽的方法)中解释的任何特征。用于本发明的“分析仪”可包括信息输入单元和表位分析单元。本发明的分析仪还可包括至少一个具有另一功能的附加单元。在下文中对这些单元进行说明书。

另一方面，一种鉴定用于处置、监测或诊断受试者疾病的肽的设备或系统。该设备或系统包括：A)信息输入单元，用于输入与该受试者的病变组织特异性突变相关的信息以及任选地关于该受试者的RNA读段的信息和关于该受试者的MHC类型的信息；B)表位分析单元，用于基于与该受试者的病变组织特异性突变相关的信息和任选地mRNA序列信息、该MHC类型的信息和关于该疾病的信息来分析与突变相关的表位，并输出其结果作为用于处置、监测或诊断该疾病的肽。本文使用的信息输入单元和分析单元可包括(鉴定和产生免疫治疗肽的方法)中解释的任何特征。

在另一方面，本发明提供了一种程序，用于使计算机执行鉴定用于处置、监测或诊断受试者疾病的肽的方法。该程序执行的方法包括以下步骤：A)输入与该受试者的病变组织特异性突变有关的信息以及任选地关于该受试者的RNA读段的信息和关于该受试者的MHC类型的信息；B)基于与该受试者的病变组织特异性突变相关的信息和任选地该mRNA序列信息、关于该MHC类型的信息和关于该疾病的信息分析与该突变相关的表位，并输出结果其作为用于治疗、监测或诊断疾病的肽。该程序可以存储在记录介质中并由传输介质传输。在此执行的方法可以包括在(鉴定和产生免疫治疗肽的方法)中解释的任何特征。

因此，本发明提供了一种记录介质，其存储用于使计算机执行鉴定用于处置、监测或诊断受试者的疾病的肽的方法的程序。由存储在其中的程序执行的方法包括以下步骤：A)输入与该受试者的病变组织特异性突变相关的信息，以及任选地关于该受试者的RNA读段的信息和关于该受试者的MHC类型的信息；B)基于与该受试者的病变组织特异性突变相关的信息和任选地该mRNA序列信息、关于该MHC类型的信息和关于该疾病的信息来分析与该突变相关的表位，并输出其结果作为用于处置、监测或诊断疾病的肽。记录介质可以是RAM、ROM或诸如硬盘(HDD)、磁盘(DVD等)或诸如USB存储器的闪存的外部存储设备。在此执行的方法可以包括在(鉴定和产生免疫治疗肽的方法)中解释的任何特征。

例如，在一个实施方案中，单元A(信息输入单元)可以包括用于对受试者的基因组进行测序的装置、用于对该受试者的RNA进行测序的装置、以及用于对所述受试者的MHC进行分型的装置中的至少一个。此外，由程序执行的步骤A)包括选自以下步骤中的至少一个步骤：A-1)对该受试者的基因组进行测序以获得并定位与该受试者的基因组读段相关的信息及其突变，然后搜索病变组织特异性突变，以获得所述病变组织特异性突变；A-2)对该受试者的RNA进行测序以获得关于该受试者的RNA的信息，定位该病变组织的RNA读段，搜索突变，和/或得出表达量，并任选地定位正常组织的RNA读段以搜索体细胞突变和/或得出表达量以将所述量与基于该疾病组织的RNA读段得出的表达量进行比较；和A-3)任选地使用该受试者的基因组读段对该受试者进行MHC分型，以获得关于该受试者的MHC类型的信息。

单元B(分析单元)可以具有各种功能。此外，由程序执行的步骤B)执行各种功能。由分析单元或分析步骤执行的步骤可以包括用于在计算机上实现用于实施图1中描绘的构思的动作的任何步骤，以及用于在计算机上实现用于实施图2中描绘的分析流程的任何步骤的动作的任何附加步骤。

特别地，单元B或由程序执行的步骤B)优选地实施输入或鉴定病变组织特异性突变的步骤和基于参考信息数据库为疾病特异性突变添加注释以鉴定候选突变的步骤，其中候选突变的核酸信息然后被转换为氨基酸信息以产生野生型(WT)肽和突变体(MT)肽，然后使用MHC类型(人类的HLA类型)、WT肽和MT肽搜索表位。在其之后对表位进行排序，并输出表位列表。

对于疾病特异性突变，可以使用已有的数据或者可以针对系统对B-1)来执行如下步骤：基于现有数据库添加注释，并对疾病组织特异性突变进行核酸-氨基酸转换，以得出关于野生型肽和疾病特异性突变体肽的信息。本发明的程序执行这样的步骤。步骤B-1)的细节在(鉴定和产生免疫治疗肽的方法)中进行了解释。

优选地，基于与受试者的基因组读段及其突变相关的信息得出病变组织特异性突变。对此，分别从所述受试者的正常样品和所述受试者的病变样品获得与基因组读段及其突变相关的信息，并且在定位与该基因组读段及其突变相关的信息之后，对所述病变组织特异性突变进行搜索以鉴定所述病变组织特异性突变。

优选地，可以通过本发明的设备或系统实施关于RNA读段的信息的分析。在这种情况下，可以通过本发明的设备或系统任选地实施由关于所述RNA读段的信息鉴定并定位该疾病特异性序列以搜索突变和/或得出表达量的步骤。这样的步骤可以在本发明的程序中执行。通过包括关于RNA读段的信息可以提高准确度。获得关于RNA读段的信息的步骤的细节在(鉴定和产生免疫治疗肽的方法)中进行了解释。

在本发明的设备或系统中，已知信息可以用作MHC类型(或HLA类型)，或者可以实施鉴定MHC类型的步骤。因此，本发明的设备或系统可以任选地实施由与正常组织和病变组织特异性异常相关的信息执行MHC分型以鉴定MHC分型的步骤。这样的步骤可以通过本发明的程序实现。MHC类型鉴定步骤的细节在(鉴定和产生免疫治疗肽的方法)中进行了解释。

在本发明的设备或系统中，可以实施B-2)利用已知数据库通过使用该MHC类型、该野生型肽和该疾病特异性突变体肽来搜索该疾病特异性表位的步骤。这样的步骤可以通过本发明的程序实施。由此搜索表位。步骤B-2)的细节在(鉴定和产生免疫治疗肽的方法)中进行了解释。

在本发明的设备或系统中，可以实施对表位进行排序的步骤。这样的步骤由本发明的程序执行。因此，步骤B-3)由获得的表位的肽序列、MHC信息(基因型和亲和力)和突变信息(染色体、位置、突变模式(野生型/突变体)、可靠性、优先级以及相应的基因(基因名称、表达量))计算得分以对待区分优先次序的表位进行排序，可以通过本发明的设备或系统实施。这样的步骤可以由本发明的程序执行。步骤B-3)的细节在(鉴定和产生免疫治疗肽的方法)中进行了解释。

当本发明的设备或系统产生肽时，该设备或系统可包括肽产生单元，其用于基于表位的信息产生肽。由于这种肽产生单元提供有肽序列信息，因此该设备或系统可包括通过任何可基于序列信息实施的产生方法实现产物的任何单元，所述产生方法例如化学合成、用微生物产生或裂解更大的肽(例如，酶促切割)。

本发明的程序可以与进行肽的产生的程序组合。或者，实现执行肽产生的步骤的程序可以作为本发明程序的一部分并入。

(系统配置)

接下来，参考图7中的框图说明本发明的系统或设备的配置。该图描绘了用单个系统实现的情况，但是该系统或设备可以由多个单元或组件构成。

本发明的系统包括RAM 03、ROM和诸如HDD、磁盘或闪存(诸如USB存储器)之类的外部存储设备05、以及连接到CPU01的输入/输出接口(I/F)25，CPU01通过系统总线20构建到计算机系统中。输入/输出I/F25连接至以下项的每一个：输入设备09(例如键盘或鼠标)、输出设备07(例如显示器)和通信设备11(例如调制解调器)。外部存储设备05包括信息数据库存储区30和程序存储区40。它们都是在外部存储设备05内部保留的常量存储区。

在这样的硬件配置中，安装在存储设备05中的软件程序由CPU 01调用到RAM 03上，通过输入装置09的各种指令(命令)的输入进行部署和执行，或者通过经由通信I/F、通信装置11等接收命令以与OS(操作系统)协作实现本发明的功能。

数据库存储区30被确认具有参考数据库、输入序列集、生成的基因组读段数据、RNA读段数据、MHC(HLA)类型数据、诸如特定突变数据的数据、执行各种步骤的软件以及在一些情况下的数据库。或者，通过通信装置11等获得的信息被连续写入和更新。任选地，通过管理每个输入序列集、参考数据库的每个基因信息ID及每个主表中的其它信息，可以用每个主表中定义的ID管理积累的样品信息。

与受试者的正常组织或病变组织(例如，癌组织)相关的信息(包括ID等)、样品的信息、序列分析的信息(读段)、与各种突变相关的信息、关于定位的信息、关于注释的信息、关于核酸-氨基酸转换的信息、关于表达量的信息、关于其比较的信息、关于野生型、突变型和MHC(HLA)类型的信息等在与样品ID相关联的同时作为输入条目信息存储在数据库存储区30中。在这方面，分析结果是通过本发明的处理获得的信息。

存储在程序存储区40中的计算机程序将计算机配置为本发明的程序或本发明的设备或系统，包括诸如表位搜索或表位按优先次序排序的处理。这些功能分别独立地是计算机程序或其模块或例行程序，其通过由CPU 01执行来将计算机配置为每个系统或设备。

(一般技术)

本文使用的分子生物学方法、生物化学方法和微生物学方法在本领域中是公知的和常规使用的，其描述于例如：Sambrook J.等(1989).Molecular Cloning:A LaboratoryManual,Cold Spring Harbor，其第三版(2001)；Ausubel,F.M.(1987).Current Protocolsin Molecular Biology,Greene Pub.Associates and Wiley-Interscience；Ausubel,F.M.(1989).Short Protocols in Molecular Biology:A Compendium of Methods fromCurrent Protocols in Molecular Biology,Greene Pub.Associates and Wiley-Interscience；Innis,M.A.(1990).PCR Protocols:A Guide to Methods andApplications,Academic Press；Ausubel,F.M.(1992).Short Protocols in MolecularBiology:A Compendium of Methods from Current Protocols in Molecular Biology,Greene Pub.Associates；Ausubel,F.M.(1995).Short Protocols in MolecularBiology:A Compendium of Methods from Current Protocols in Molecular Biology,Greene Pub.Associates；Innis,M.A.等(1995).PCR Strategies,Academic Press；Ausubel,F.M.(1999).Short Protocols in Molecular Biology:A Compendium ofMethods from Current Protocols in Molecular Biology,Wiley,and annual updates；Sninsky,J.J.等(1999).PCR Applications:Protocols for Functional Genomics,Academic Press,Gait,M.J.(1985).Oligonucleotide Synthesis:A PracticalApproach,IRL Press；Gait,M.J.(1990).Oligonucleotide Synthesis:A PracticalApproach,IRL Press；Eckstein,F.(1991).Oligonucleotides and Analogues:APractical Approach,IRL Press；Adams,R.L.等(1992).The Biochemistry of theNucleic Acids,Chapman&Hall；Shabarova,Z.等(1994).Advanced Organic Chemistry ofNucleic Acids,Weinheim；Blackburn,G.M.等(1996).Nucleic Acids in Chemistry andBiology,Oxford University Press；Hermanson,G.T.(1996).Bioconjugate Techniques,Academic Press,Bessatsu Jikken Igaku[Experimental Medicine,SupplementalVolume],Idenshi Donyu Oyobi Hatsugen Kaiseki Jikken Ho [Experimental Methodsfor Transgenesis&Expression Analysis],Yodosha,1997等。这些文献的相关部分(可以是全部)通过引用并入本文。

示出生物信息学中的公知常识的文献的实例包括：Gibas C.等(2001).Developing Bioinformatics Computer Skills,O’Reilly；Mount D.W.,(2004).Bioinformatics:Sequence and Genome Analysis,CSHL Press；Pevzner P.等(2011).Bioinformatics for Biologist,Cambridge University Press；SUGENO,Sumio等(2012)Saibokogaku Bessatsu[Cell Engineering,Supplemental Volume]"Jisedai ShikuensaMokutekibetsu Adobansuto Mesoddo"[Next Generation Sequencer,Advanced Methodby Objective],Shujunsha。这些文献的相关部分(可以是全部)通过引用并入本文。

本文引用的参考文献例如科学文献、专利和专利申请通过引用并入本文，其程度与具体地描述每个文献的全部内容相同。

在下文中对本发明进行了描述，同时示出了便于理解的优选实施方案。尽管在下文中基于实施例对本发明进行了解释说明，但提供上述说明和以下实施例仅用于示例的目的，而不是限制本发明。因此，本发明的范围不限于本文具体描述的实施方案和实施例，并且仅受权利要求的范围限制。

[实施例]

(实施例1：分选突变体肽和检测免疫原性-针对人受试者中的肿瘤)

(分析)

基于图2中例示的流程对突变体肽进行分选。

具体而言，进行以下操作。

(1)使用以下组的受试者。

目标患者：65岁的日本男性肺癌患者

在进行实施例之前，通过使用Luminex测定进行分型来鉴定以下HLA类型。

HLA类型：HLA-A*02:01,24:02

(2)从正常组织和肿瘤组织中提取DNA。使用TruSeq PE试剂盒，用Illumina公司的测序仪HiSeq 2000进行外显子组测序。使用的设备是Illumina公司的测序仪HiSeq 2000，使用的软件是同一测序仪的控制软件。

(外显子组读段定位)

接下来，使用bwa，并采用以下参数分别对来自正常组织和肿瘤组织的外显子组读段定位。

算法：mem

读段模式：配对结束

最小种子长度：19

带宽：100

对角线下降(off diagonal dropoff)：100

匹配得分：1

错配罚分：4

缺口开放罚分：6

缺口延伸罚分：1

剪切罚分：5

未配对读段罚分：9

(体细胞突变检索)

接下来，基于对来自正常组织和肿瘤组织的外显子组读段定位的结果，使用muTect、VarScan和lofreq搜索肿瘤组织特异性体细胞突变。

上述分析实现流程如图3至5所示。图3示出分析流程的起始界面，其中可以选择来自肿瘤的外显子组、来自正常组织的外显子组、来自肿瘤的RNA序列、来自正常组织的RNA序列、线程数、读段修剪条件、低质量(LQ)区的修剪、分析条件等。例如，可以为分析条件选择和设置算法类型，例如定位算法及其条件。图4示出分析条件设置界面。可以选择和设置外显子组作图和突变搜索、RNA定位及其表达分析的条件、突变检测、突变注释、HLA分型、以及用于表位预测(确定)的软件和条件。图5是输出结果的示例。结果，对肿瘤特异性突变计数并发现1673个突变。

(3)接下来，获得RNA读段(正常组织)和RNA读段(肿瘤组织)。从肿瘤组织中提取RNA，并使用TruSeq RNA文库试剂盒和TruSeq PE试剂盒用Illumina的测序仪HiSeq 2000测序。使用TopHat以如下参数定位所得RNA读段。

片段长度：16

最大不匹配：2

预期配对内距离：50

配对内距离的标准偏差：20

(4)接下来，使用作为mRNA定位的结果获得的数据来搜索突变(或搜索体细胞突变)并得出表达量。基于对来自肿瘤组织的RNA读段定位的结果，使用muTect和VarScan搜索突变。还使用Cufflinks计算基因表达量。

(5)一起分析在(4)中获得基于RNA读段的结果和突变。

(6)使用refGene和ensEmbl作为基因结构信息的数据库为在(2)中获得的肿瘤特异性突变添加注释，以鉴定候选突变。对所鉴定的候选突变进行核酸-氨基酸转换以定义野生型(WT)肽和突变体(MT)肽。

(7)接下来，使用omixon由外显子组读段进行HLA分型。

(8)用关于HLA类型的信息以及在(6)中获得的WT肽和MT肽分析表位。其结果如下表所示。表中MT序列中的连字符表示与正常氨基酸相比，其末端或其间的氨基酸发生突变。

表中的部分表示以下内容。

HLA等位基因：HLA等位基因

WT肽序列：野生型肽序列

MT肽序列：突变体肽序列

一致性百分比排序：一致性百分比排序

ANN IC50：使用人工神经网络方法计算的IC50(NetMHCpan中的最佳值)

ANN等级：其值转换为等级值

SMM IC50：使用稳定矩阵法计算的IC50(无法计算值时na)

SMM等级：其值转换为等级值

comblib sydney2008得分：使用sydney2008方法计算的IC50(无法计算值时na)

comblib sydney2008等级：将其值转换为等级值

突变信息：突变信息

染色体：染色体

开始位置：开始位置

结束位置：结束位置

基因名称：基因名称

登记：登记号

Exon ID：外显子号

在转录物上的位置：在转录物上的位置

WT NA：野生型中的核酸

MT NA：突变体中的核酸

在肽上的起始位置：在肽上的起始位置

在肽上的突变位置：在肽上的突变位置

在肽上的结束位置：在肽上的结束位置

WT AA：野生型氨基酸

MT AA：突变体氨基酸

上游AA：上游氨基酸

下游AA：下游氨基酸

对数似然值：对数似然值

读段深度：读段深度

肿瘤上的WT数：在肿瘤组织中位置上WT(无突变)读段的数量

肿瘤上的MT数：在肿瘤组织中的位置上MT(突变)读段的数量

肿瘤上WT的QV总和：在肿瘤组织中的位置上WT读段的质量值(QV)之和

肿瘤上MT的QV总和：在肿瘤组织中的位置上的MT读段的质量值(QV)之和

在正常组织上的WT数：在正常组织中的位置上WT读段的数量

在正常组织上的MT数：在正常组织中的位置上MT读段的数量

在正常组织上的WT的QV总和：在正常组织中的位置上WT读段的QV之和

在正常组织上的MT的QV总和：在正常组织中的位置上WT读段的QV之和

在RNA中发现：在RNA中是否也发现了突变的标志

通过以下发现：找到突变的软件的列表

所有AA变化：氨基酸替换模式的描述，包括基因名称、基因座的登记、核酸突变模式或氨基酸突变模式

cytoband：以cytoband文件格式中示出的位置

dbSNP 138：在dbSNP release.138中注册时的突变ID

cosmic 70：在cosmid release.70中注册时的突变ID

TSS：突变所在基因的TSS(转录起始位点)的ID

基因在基因组上的位置：简单地连接突变、染色体、起始位置和结束位置的位置

基因表达(FPKM)：基因表达量(片段/千碱基外显子/百万经定位读段)

95％conf低：FPKM的置信区间下限为95％

95％conf高：FPKM的置信区间上限为95％

状态：计算表达量的结果是有效(OK)还是低准确度(LOWQUAL)

[表1-1]

[表1-2]

[表1-3]

[表1-4]

[表1-5]

(分析结果)

分析结果如下所示。

使用HLA-A*02:01、24:02的个体从分析中发现了1673个肿瘤特异性突变。通过鉴定同样在RNA读段上具有突变的病例，将突变缩小至41。当缩小到进一步具有氨基酸变化的突变时，这些突变缩小至25。当通过肽的数量计数时，鉴定出44种肽(HLA-A*02:01)。换句话说，发现了44种对HLA-A*02:01具有IC50≤54nM亲和力的肽。在下一步中，使用具有HLA-A*02:01的健康个体的外周血，从而仅选择对HLA-A*02:01(而不是HLA-A*24:02)具有亲和力的肽。

(肽合成)

用肽合成仪合成这44种肽。在该实施例中，其过程如下所示。使用获自GenScript(日本东京)的肽。

(HLA-A*02:01样品)

使用具有与受试者样品(肿瘤患者)相同的HLA-A*02:01的健康个体的外周血。使用为此制备的肽进行反应性实验。

可以使用具有相同HLA类型的健康个体(例如，HLA-A*02:01)的血液(外周血)或癌症患者自身的血液作为样品。根据目的，也可以使用具有相同HLA-A*02:01的血液。

(ELISPOT测定)

进行的测定进行了干扰素γELISPOT和细胞内部干扰素γ染色。对于干扰素γELISPOT，使用经纯化的MABTECH抗人IFN-γmAb1-D1K(3420-3-250)作为捕获抗体。另外，使用MILLIPORE MultiScreen HTS 96孔过滤板。

简而言之，进行了以下操作。

(1)将细胞因子(本实施例中的干扰素-γ)特异性单克隆抗体(经纯化的MABTECH抗人IFN-γmAb1-D1K(3420-3-250))固定在固体层表面上。在该实施例中使用MILLIPOREMultiScreen HTS 96孔过滤板。

(2)刺激1×10⁵个细胞并在洗涤后培养16小时。分泌的细胞因子，即干扰素-γ，与生成细胞周围的捕获抗体(检测抗体；生物素化的MABTECH抗人IFN-γmAb7-B6-1(3420-6-250))结合。通过洗涤除去细胞后，加入抗干扰素γ抗体用于检测。

对于生物素标记的检测抗体，加入酶标记的链霉抗生物素蛋白(MABTECH链霉抗生物素蛋白-HRP(3310-9))。

(3)接着，使用BD ELISPOT AEC底物组(551951)进行着色。该方法使得能够看到对应于干扰素γ(细胞因子)产生细胞所在位置的斑点。用Carl Zeiss KS ELISPOT(MinervaTech)对获得的斑点计数。记录阳性细胞的频率。

(细胞内部干扰素γ染色)

对获得的样品进行细胞内部干扰素γ染色。刺激5×10⁵个淋巴细胞并在200μl培养基中培养4小时。加入新抗原肽和对照肽，使得最终浓度为1μg/ml用于刺激。还制备了未受刺激的对照。添加BioLegend Brefeldin A溶液(1,000X)，使得在刺激期间最终浓度为5.0μg/ml。培养完成后，收集细胞并在4℃下用Fixable Viability Dye eFluor780(eBioscience 65-0865-18)、FITC标记的抗CD4抗体(BD PharmingenTM557307)、ECD标记的抗CD8抗体(BECKMAN COULTER 41116015)和PerCP·CY5.5标记的抗CD3抗体(Biolegend300430)染色30分钟。

用Intraprep透化试剂(Immunotech，Marseille，France)处理细胞15分钟。用PE标记的抗-IL-2抗体(BD Pharmingen^TM559334)、用Alexa700标记的抗-TNFα抗体(BDPharmingen^TM557996)和用Pacific Blue标记的抗-IFN-γ抗体(Biolegend 502522)将细胞染色15分钟。

在悬于含有0.5％PFA的PBS中后，用Gallios流式细胞仪(BECKMAN COULTER)进行测量。对于细胞内部流式细胞术分选，使用CD8阳性细胞分析干扰素γ的产生。

(干扰素γ产生的结果)

图6示出分析干扰素γ产生的结果。各种肽的发现产生干扰素γ的突变体肽总结如下。在表中，带有变化的氨基酸标有下划线。

[表2]

在该表中，MT表示突变体，WT表示野生型。pepID是实施例中的示例编号。IC50表示抑制HLA-肽结合的浓度。在该表中，++表示发现在3/3中产生干扰素γ的样品，+表示发现在1/3至2/3中产生干扰素γ的样品。

从以上可以看出，在12例中观察到ELISPOT或细胞内部干扰素产生的阳性反应，这是实施例中找到的44例的近30％。

在常规技术的近30％的病例中从未发现可有用的候选癌症免疫肽。因此，认为这是显著的效果。

(实施例2：分选突变体肽和检测免疫原性–针对小鼠)

在该实施例中，当使用小鼠时可以进行相同的实验。

其程序如下所示。

1.可以以在所有品系(syngenic)的小鼠为对象，针对自发地、化学地和辐射诱导的肿瘤(癌症、肉瘤或白血病)搜索新抗原。在该实施例中，使用小鼠品系：C57BL/6(MHC单倍型H2^b)。肿瘤：B16黑色素瘤细胞用作肿瘤。

2.从患癌小鼠的癌症部位收集组织，并且在正常小鼠中收集与肿瘤部位相同的器官/组织，其中在患癌小鼠中收集肿瘤部位和非肿瘤部位(例如，结肠癌的肿瘤部位和非肿瘤部位)。当小鼠来自相同的品系时，从正常小鼠收集正常组织。

4.由于已知每种品系的MHC(主要组织相容性复合物)，因此搜索突变体组，然后鉴定MHC上呈递的新抗原(小鼠中的H-2)。

5.为了选择新抗原，使用与实施例1中针对人肿瘤所述相同的方法。具体地，从与B16黑素瘤细胞同系的C57BL/6小鼠收集正常皮肤，从中提取DNA和RNA，进行外显子seq/RNAseq，并用实施例1中的新抗原搜索软件鉴定候选肽。

6.对于鉴定的新抗原，人工合成肽，并在同系小鼠的脾细胞中添加并培养，以在培养后诱导IFNγ产生作为活性指标。

7.使用用新抗原刺激并培养的脾细胞测量对肿瘤的细胞毒性。

8.通过研究试管的内容物，清楚了所搜索的新抗原在功能上诱导针对肿瘤的T细胞。

9.检查使用候选新抗原的体内in vivo效应。

10.作为体内in vivo作用，将新抗原直接施用于患癌小鼠(在新抗原搜索中使用的移植了肿瘤的小鼠)。此外，树突细胞治疗(来自同系小鼠的树突细胞在体外in vitro被刺激和培养并施用于患癌小鼠)可用于治疗。

按照如下所述确定效果。

1.使用C57Bl/6小鼠来源的脾细胞进行Elispot测定后在体内测定效果并验证细胞毒性。

2.将B16黑素瘤细胞皮下移植到C57BL/6小鼠(1×10⁶)中。静脉内注射相同数量的B16黑素瘤细胞。

3.使用在B16皮下给药后的肿瘤大小和存活率作为新抗原治疗效果的指标。

以这种方式，还可以鉴定抗原肽用于对小鼠的治疗。

如上所述，本发明通过使用其优选实施方案来举例说明。但是，应当理解，本发明的范围应当仅基于权利要求来解释。还应理解，本文引用的任何专利、任何专利申请及任何参考文献都应以与在本文中具体描述的内容相同的方式通过引用并入本文。本申请要求日本专利申请No.2016-50861(2016年3月15日提交)的优先权。该日本专利申请的全部内容通过引用并入本文。

[工业实用性]

提供了一种用于以高准确度鉴定免疫治疗肽的技术，使得能够以更高的精确度进行治疗、监测和预防。该技术在制药行业和临床环境中特别有用。

[序列表自由文本]

SEQ ID NO：1至12是在实施例1中利用关于HLA类型以及WT肽和MT肽的信息进行的表位分析的结果中公开的氨基酸序列。SEQ ID NO：1、4、7和10是第一样品(HLA-C*03:03)中示出的序列。SEQ ID NO：2、5、8和11是第二样品(HLA-C*03:03)中示出的序列。SEQ ID NO：3、6、9和12是第三样品(HLA-C*14:02)中示出的序列。SEQ ID NO：1至3表示野生型氨基酸序列、SEQ ID NO：4至6表示突变的氨基酸序列、SEQ ID NO：7至9表示上游氨基酸序列、SEQ IDNO：10至12表示下游氨基酸序列。SEQ ID NO：13至36表示实际具有表2中所示命中的肽的氨基酸序列。SEQ ID NO：13至24是突变的氨基酸序列，其依次表示PepID 14、21、41、36、7、43、30、33、42、27、12和18。SEQ ID NO：25至36是野生型氨基酸序列，依次表示PepID 14、21、41、36、7、43、30、33、42、27、12和18。

序列表

<110> 组库创世纪株式会社

<120> 用于免疫治疗的监测和诊断及治疗剂的设计

<130> EC002PCT

<150> JP 2016-050861

<151> 2016-03-15

<160> 36

<170> PatentIn version 3.5

<210> 1

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> 第一样品WT肽

<400> 1

Leu Ala Asn Phe Val Leu Gln Asp Gln Leu Ala Leu

1 5 10

<210> 2

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 第二样品WT肽

<400> 2

Ile Ala Gln Arg Ser Val Thr Leu

1 5

<210> 3

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> 第三样品WT肽

<400> 3

Thr Tyr Pro Ala Ala His His Phe Arg Ile Gly Ile

1 5 10

<210> 4

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> 第一样品MT肽

<400> 4

Phe Ala Asn Phe Val Leu Gln Asp Gln Leu Ala Leu

1 5 10

<210> 5

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> 第二样品MT肽

<400> 5

Ile Ala Leu Arg Ser Val Thr Leu

1 5

<210> 6

<211> 12

<212> PRT

<213> 人工序列

<220>

<223> 第三样品MT肽

<400> 6

Thr Tyr Pro Ala Ala His His Phe Arg Ser Gly Ile

1 5 10

<210> 7

<211> 13

<212> PRT

<213> 人工序列

<220>

<223> 第一样品上游AA

<400> 7

Ile Tyr Phe Gly Thr Ala Tyr Val Ala Leu Thr Arg Asp

1 5 10

<210> 8

<211> 13

<212> PRT

<213> 人工序列

<220>

<223> 第二样品上游AA

<400> 8

Arg Lys Pro Cys Asp Asn Gly Asp Pro Tyr Val Ile Ala

1 5 10

<210> 9

<211> 13

<212> PRT

<213> 人工序列

<220>

<223> 第三样品上游AA

<400> 9

Lys Leu Ser Pro Thr Tyr Pro Ala Ala His His Phe Arg

1 5 10

<210> 10

<211> 13

<212> PRT

<213> 人工序列

<220>

<223> 第一样品下游AA

<400> 10

Ala Asn Phe Val Leu Gln Asp Gln Leu Ala Leu Asp Leu

1 5 10

<210> 11

<211> 13

<212> PRT

<213> 人工序列

<220>

<223> 第二样品下游AA

<400> 11

Arg Ser Val Thr Leu Pro Thr His Arg Glu Thr Pro Glu

1 5 10

<210> 12

<211> 13

<212> PRT

<213> 人工序列

<220>

<223> 第三样品下游AA

<400> 12

Gly Ile Ile Gly Ser Gly Leu Cys Val Phe Ser Lys His

1 5 10

<210> 13

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> pepID 14 MT

<400> 13

Phe Leu Ala Leu Glu Cys Leu Ala His Leu

1 5 10

<210> 14

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> pepID 21 MT

<400> 14

Gln Leu Leu Glu Pro Glu Ile Ser Phe Leu

1 5 10

<210> 15

<211> 9

<212> PRT

<213> 人工序列

<220>

<223> pepID 41 MT

<400> 15

Phe Thr Tyr Ser Ser Ala Leu Lys Val

1 5

<210> 16

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> pepID 36 MT

<400> 16

Ile Leu Gln Glu Tyr Arg Glu Asp Phe Val

1 5 10

<210> 17

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> pepID 7 MT

<400> 17

Val Leu Asn Ile Asn Asp Asn Glu Pro Val

1 5 10

<210> 18

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> pepID 43 MT

<400> 18

Phe Gln Tyr Ser Ser Pro Ala Leu Pro Thr

1 5 10

<210> 19

<211> 9

<212> PRT

<213> 人工序列

<220>

<223> pepID 30 MT

<400> 19

Ala Leu Tyr Pro Phe Glu Phe Arg Ser

1 5

<210> 20

<211> 9

<212> PRT

<213> 人工序列

<220>

<223> pepID 33 MT

<400> 20

Asn Ile Ser Ser Arg Ile His Thr Val

1 5

<210> 21

<211> 9

<212> PRT

<213> 人工序列

<220>

<223> pepID 42 MT

<400> 21

Lys Thr Phe Thr Tyr Ser Ser Ala Leu

1 5

<210> 22

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> pepID 27 MT

<400> 22

Lys Val Leu Gln Leu Leu Glu Pro Glu Ile

1 5 10

<210> 23

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> pepID 12 MT

<400> 23

Asn Leu Lys Lys Leu Leu Val Phe

1 5

<210> 24

<211> 11

<212> PRT

<213> 人工序列

<220>

<223> pepID 18 MT

<400> 24

Ile Cys Phe Leu Ala Leu Glu Cys Leu Ala His

1 5 10

<210> 25

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> pepID 14 WT

<400> 25

Ser Leu Ala Leu Glu Cys Leu Ala His Leu

1 5 10

<210> 26

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> pepID 21 WT

<400> 26

Gln Leu Leu Glu Pro Gln Ile Ser Phe Leu

1 5 10

<210> 27

<211> 9

<212> PRT

<213> 人工序列

<220>

<223> pepID 41 WT

<400> 27

Phe Arg Tyr Ser Ser Ala Leu Lys Val

1 5

<210> 28

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> pepID 36 WT

<400> 28

Ile Arg Gln Glu Tyr Arg Glu Asp Phe Val

1 5 10

<210> 29

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> pepID 7 WT

<400> 29

Val Leu Asp Ile Asn Asp Asn Glu Pro Val

1 5 10

<210> 30

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> pepID 43 WT

<400> 30

Tyr Gln Tyr Ser Ser Pro Ala Leu Pro Thr

1 5 10

<210> 31

<211> 9

<212> PRT

<213> 人工序列

<220>

<223> pepID 30 WT

<400> 31

Ala Leu Tyr Pro Phe Glu Ser Arg Ser

1 5

<210> 32

<211> 9

<212> PRT

<213> 人工序列

<220>

<223> pepID 33 WT

<400> 32

Asn Ile Ser Ser His Ile His Thr Val

1 5

<210> 33

<211> 9

<212> PRT

<213> 人工序列

<220>

<223> pepID 42 WT

<400> 33

Lys Thr Phe Arg Tyr Ser Ser Ala Leu

1 5

<210> 34

<211> 10

<212> PRT

<213> 人工序列

<220>

<223> pepID 27 WT

<400> 34

Lys Val Leu Gln Leu Leu Glu Pro Gln Ile

1 5 10

<210> 35

<211> 8

<212> PRT

<213> 人工序列

<220>

<223> pepID 12 WT

<400> 35

Asn Leu Glu Lys Leu Leu Val Phe

1 5

<210> 36

<211> 11

<212> PRT

<213> 人工序列

<220>

<223> pepID 18 WT

<400> 36

Ile Cys Ser Leu Ala Leu Glu Cys Leu Ala His

1 5 10

Claims

1.一种产生用于处置、监测或诊断受试者疾病的肽的方法，所述方法包括以下步骤：

B)使所述分析仪基于与所述病变组织特异性突变相关的信息、关于所述MHC类型的信息和关于所述疾病的信息来分析与所述突变相关的表位；和

C)基于关于所述表位的信息产生肽。

2.根据权利要求1所述的方法，其中，步骤B)包括以下步骤：使所述分析仪基于参考信息数据库添加对所述疾病组织特异性突变的注释以鉴定候选突变，所述候选突变的核酸信息随后被转换为氨基酸信息以产生野生型(WT)肽和突变体(MT)肽，然后使所述分析仪利用所述MHC类型、所述WT肽和所述MT肽搜索表位，随后将表位排序，并使所述分析仪输出表位列表。

3.根据权利要求1所述的方法，包括基于与所述受试者的基因组读段及其突变相关的信息得出所述病变组织特异性突变。

4.根据权利要求3所述的方法，其中，所述基因组读段包括外显子组读段。

5.根据权利要求3所述的方法，其中，与所述基因组读段及其突变相关的信息分别获自所述受试者的正常样品和所述受试者的患所述病变样品，并且在定位与所述基因组读段及其突变相关的信息之后，搜索所述病变组织特异性突变，以鉴定所述病变组织特异性突变。

6.根据权利要求1所述的方法，其中，步骤A)进一步包括将关于所述受试者的RNA读段的信息输入所述分析仪中，并且步骤B)包括使所述分析仪基于关于所述RNA读段的信息分析与所述突变相关的表位。

7.根据权利要求6所述的方法，其中，所述RNA读段包括病变组织的RNA读段，并且所述方法进一步包括定位所述病变组织的RNA读段以搜索突变和/或得出表达量的步骤。

8.根据权利要求7所述的方法，其中，关于所述RNA读段的信息包括正常组织的RNA读段，并且所述方法进一步包括如下步骤：定位所述正常组织的RNA读段以搜索体细胞突变和/或得出表达量，并将所述量与基于所述病变组织的RNA读段得出的表达量进行比较。

9.根据权利要求1所述的方法，其中，所述MHC类型得出自所述受试者的基因组读段。

10.根据权利要求2所述的方法，其中，步骤B)包括选自以下步骤的至少一个步骤：

B-2)使所述分析仪使用已知的数据库利用所述MHC类型、所述野生型肽和所述疾病特异性突变体肽搜索所述疾病特异性表位；和

B-3)使所述分析仪由所获得的表位的肽序列、MHC信息(基因型和亲和力)和突变信息(染色体、位置、突变模式(野生型/突变体)、可靠性、优先级及相应基因(基因名称、表达量))计算评分并按照优先次序对表位进行排序，并且

步骤C)包括以下步骤：

C-1)基于所述排序产生肽。

11.根据权利要求3所述的方法，其中，与所述基因组读段及其突变相关的信息获自同一受试者。

12.根据权利要求3所述的方法，其中，与所述基因组读段及其突变相关的信息获自不同受试者。

13.根据权利要求11或12所述的方法，其中，与所述基因组读段及其突变相关的信息获自正常组织和病变组织。

14.根据权利要求5所述的方法，其中，使用bwa、bowtie、novoalign或其组合来定位所述基因组读段。

15.根据权利要求5所述的方法，其中，使用包括MuTect、VarScan、lofreq或其组合的突变搜索程序来搜索所述基因组读段的突变。

16.根据权利要求2所述的方法，其中，使用选自ANNOVAR和snpEff的程序并利用选自refGene和ensEmbl的基因结构数据库和/或选自dbSNP、cosmic、1000基因组和全外显子组特征的已知突变信息的数据库添加所述注释。

17.根据权利要求7或8所述的方法，其中，使用选自TopHat和STAR的程序定位所述RNA读段。

18.根据权利要求7或8所述的方法，其中，使用选自MuTect、VarScan、GATK和samtools的突变搜索程序进行对所述RNA突变的搜索。

19.根据权利要求7或8所述的方法，其中，使用选自CuffLinks和Erange的突变搜索程序进行所述RNA表达量的得出。

20.根据权利要求9所述的方法，其中，使用选自HLAminer、Athlates、Sting HLA、HLAcaller、OptiType和omixon的软件进行所述MHC分型。

21.根据权利要求1至10中任一项所述的方法，其中，所述受试者是人，并且所述MHC是HLA。

22.根据权利要求2所述的方法，其中，使用选自NetMHCpan、NetHMC、NetMHCcons和PickPocket的表位搜索程序进行所述表位搜索。

23.根据权利要求2所述的方法，其中，通过考虑选自所述突变的优先次序、存在/不存在基因表达和肽的优先次序中的至少一个要素来进行所述排序。

24.根据权利要求23所述的方法，其中，所述突变的优先次序考虑选自以下项的至少一个要素：已发现命中的突变搜索程序的数量的多少以及存在/不存在RNA水平突变的证据。

25.根据权利要求23所述的方法，其中，通过定位所述RNA读段计算得出的fpkm或rpkm的值是否为正来确定存在/不存在所述基因表达。

26.根据权利要求23所述的方法，其中，所述肽的优先次序考虑选自以下项的至少一个要素：已发现命中的表位搜索程序的数量的多少、已发现命中的突变搜索软件的数量的多少、以及HLA-肽之间的IC50值<500nM。

27.根据权利要求23所述的方法，其中，通过按顺序应用HLA-肽之间的IC50值、已发现命中的表位搜索程序的数量，以及已发现命中的突变搜索软件的数量来对所述排序进行分类。

28.根据权利要求1至27中任一项所述的方法，其中，所述疾病是肿瘤或自身免疫疾病。

29.根据权利要求1所述的方法，其中，步骤A)包括选自以下步骤中的至少一个步骤：

A-1)使所述分析仪对所述受试者的基因组进行测序，以获得与所述受试者的基因组读段及其突变相关的信息，并定位与所述受试者的基因组读段及其突变相关的信息，然后搜索所述病变组织特异性突变以获得所述病变组织特异性突变；

A-2)使所述分析仪对所述受试者的RNA进行测序以获得关于受试者的RNA读段的信息，定位病变组织的RNA读段，并搜索突变，和/或得出表达量，并且任选地定位正常组织的RNA读段以搜索体细胞突变和/或得出表达量以将所述量与基于所述病变组织的RNA读段得出的表达量进行比较；和

A-3)任选地使所述分析仪使用所述受试者的基因组读段对所述受试者进行MHC分型，以获得关于所述受试者的MHC类型的信息。

30.一种鉴定用于处置、监测或诊断受试者疾病的肽的方法，包括以下步骤：

A)向分析仪中输入与所述受试者的病变组织特异性突变相关的信息和关于所述受试者的MHC类型的信息；和

B)使所述分析仪基于与所述病变组织特异性突变相关的信息、关于所述MHC类型的信息和关于所述疾病的信息来分析与所述突变相关的表位。

31.根据权利要求30所述的方法，进一步具有权利要求2至29中的任意一项或更多项中的特征。

32.一种产生用于处置、监测或诊断受试者的疾病的肽的设备，所述设备包括：

A)信息输入单元，用于输入与所述受试者的病变组织特异性突变相关的信息，和任选地关于所述受试者的RNA读段的信息和关于所述受试者的MHC类型的信息；

B)表位分析单元，用于基于与所述受试者的病变组织特异性突变相关的信息和任选地所述mRNA序列信息、关于所述MHC类型的信息和基于所述疾病的信息来分析与所述突变相关的表位；和

C)肽产生单元，用于基于所述表位的信息产生肽。

33.根据权利要求32所述的设备，其中，在单元B中执行在权利要求2到29中的任意一项或更多项中定义的过程。

34.根据权利要求32所述的设备，其中，所述单元A包括用于对所述受试者的基因组进行测序的装置、用于确定所述受试者的病变组织特异性突变的装置、用于对所述受试者的RNA进行测序的装置和用于对所述受试者进行MHC分型的装置中的至少一种。

35.一种鉴定用于处置、监测或诊断受试者疾病的肽的设备，包括：

A)信息输入单元，用于输入与所述受试者的病变组织特异性突变相关的信息和任选地关于所述受试者的RNA读段的信息以及关于所述受试者的MHC类型的信息；和

B)表位分析单元，用于基于与所述受试者的病变组织特异性突变相关的信息和任选地所述mRNA序列信息、关于所述MHC类型的信息和关于所述疾病的信息来分析与所述突变相关的表位，并输出其结果作为用于处置、监测或诊断所述疾病的肽。

36.根据权利要求35所述的设备，其中，在所述单元B中执行在权利要求2到29中的任意一项或更多项中定义的过程。

37.根据权利要求35所述的设备，其中，单元A包括用于对所述受试者的基因组进行测序的装置、用于确定所述受试者的病变组织特异性突变的装置、用于对所述受试者的RNA进行测序的装置和用于对所述受试者进行MHC分型的装置中的至少一种。

38.一种用于使计算机执行鉴定用于处置、监测或诊断受试者的疾病的肽的方法的程序，所述方法包括以下步骤：

A)输入与所述受试者的病变组织特异性突变相关的信息和任选地关于所述受试者的RNA读段的信息和关于所述受试者的MHC类型的信息；和

B)基于与所述受试者的病变组织特异性突变相关的信息和任选地所述mRNA序列信息、关于所述MHC类型的信息和关于所述疾病的信息来分析与所述突变相关的表位，并输出其结果作为用于处置、监测或诊断疾病的肽。

39.根据权利要求38所述的程序，进一步具有权利要求2至29中的任意一项或更多项中的特征。

40.一种计算机可读记录介质，其存储用于使计算机执行鉴定用于处置、监测或诊断受试者的疾病的肽的方法的程序，所述方法包括以下步骤：

A)输入与所述受试者的病变组织特异性突变相关的信息和任选地关于所述受试者的RNA读段的信息以及关于所述受试者的MHC类型的信息；和

B)基于与所述受试者的病变组织特异性突变相关的信息和任选地所述mRNA序列信息、关于所述MHC类型的信息以及关于所述疾病的信息来分析与所述突变相关的表位，并输出其结果作为用于处置、监测或诊断疾病的肽。

41.根据权利要求40所述的记录介质，进一步具有权利要求2至29中的任意一项或更多项中的特征。