JPWO2019168984A5

JPWO2019168984A5 -

Info

Publication number: JPWO2019168984A5
Application number: JP2020567466A
Authority: JP
Publication date: 2022-03-04
Anticipated expiration: 2039-02-27

Description

ＴＩＬ新生エピトープデータセット及び予想される新生抗原反応性Ｔ細胞の特定タスクにおける本明細書に開示されるモデルの予測性能は、ＨＬＡのプロセシング及び提示をモデル化することによって、治療に有用な新生エピトープの予測を得ることが今や可能であることを示す。要約すると、この研究は、抗原標的化免疫療法のための実用的なインシリコの抗原特定を可能とすることにより、患者の治癒へ向けた進展を加速するものである。
[本発明1001]
1つ以上のＭＨＣアレルによって腫瘍細胞の表面上に提示される可能性の高い、対象の1つ以上の腫瘍細胞に由来する少なくとも1つの新生抗原を特定するための方法であって、以下の工程：
前記対象の前記腫瘍細胞及び正常細胞からエクソーム、トランスクリプトーム、または全ゲノムのヌクレオチドシークエンシングデータのうちの少なくとも1つを取得する工程であって、前記ヌクレオチドシークエンシングデータは、前記腫瘍細胞からのヌクレオチドシークエンシングデータと前記正常細胞からのヌクレオチドシークエンシングデータとを比較することにより特定された新生抗原のセットのそれぞれのペプチド配列を表すデータを取得するために用いられ、各新生抗原のペプチド配列が、前記ペプチド配列を前記対象の前記正常細胞から特定される対応する野生型のペプチド配列とは異なるものとする少なくとも1つの変化を有する、前記取得する工程と、
前記新生抗原のそれぞれの前記ペプチド配列を、対応する数値ベクトルにコード化する工程であって、各数値ベクトルが、前記ペプチド配列を構成する複数のアミノ酸及び前記ペプチド配列内における前記アミノ酸の位置のセットに関する情報を含む、前記コード化する工程と、
前記対象の前記腫瘍細胞からエクソーム、トランスクリプトーム、または全ゲノムヌクレオチドシークエンシングデータのうちの少なくとも1つを取得する工程であって、前記ヌクレオチドシークエンシングデータが、前記対象の前記1つ以上のＭＨＣアレルのそれぞれのペプチド配列を表すデータを取得するために用いられる、前記取得する工程と、
前記対象の前記1つ以上のＭＨＣアレルのそれぞれの前記ペプチド配列を、対応する数値ベクトルにコード化する工程であって、各数値ベクトルが、前記ペプチド配列を構成する複数のアミノ酸及び前記ペプチド配列内における前記アミノ酸の位置のセットに関する情報を含む、前記コード化する工程と、
前記新生抗原のセットについて提示尤度のセットを生成するために、コンピュータプロセッサを使用して、前記新生抗原のそれぞれのペプチド配列をコード化した前記数値ベクトル及び前記1つ以上のＭＨＣアレルのそれぞれのペプチド配列をコード化した前記数値ベクトルを、機械学習させた提示モデルに入力する工程であって、前記セットの中の各提示尤度が、対応する新生抗原が前記1つ以上のＭＨＣアレルによって前記対象の前記腫瘍細胞の表面上に提示される尤度を表し、前記機械学習させた提示モデルが、
複数の試料の各試料について、前記試料中に存在するものとして特定されたＭＨＣアレルのセットの中の少なくとも1つのＭＨＣアレルに結合したペプチドの存在を測定する質量分析によって得られた標識、
前記試料のそれぞれについて、前記ペプチドを構成する複数のアミノ酸及び前記ペプチド内の前記アミノ酸の位置のセットに関する情報を含む数値ベクトルとしてコード化された訓練ペプチド配列、
前記試料のそれぞれについて、前記試料の前記ペプチドに結合した前記少なくとも1つのＭＨＣアレルを構成する複数のアミノ酸及び前記少なくとも1つのＭＨＣアレル内の前記アミノ酸の位置のセットに関する情報を含む数値ベクトルとしてコード化された訓練ペプチド配列
を含む訓練データセットに少なくとも基づいて特定される、複数のパラメータと、
入力として受信される、前記新生抗原のそれぞれの前記ペプチド配列をコード化した前記数値ベクトルと前記1つ以上のＭＨＣアレルのそれぞれの前記ペプチド配列をコード化した前記数値ベクトルとの間の関係、ならびに前記数値ベクトル及び前記パラメータに基づいた出力として生成された提示尤度を表す、関数と
を含む、前記入力する工程と、
選択された新生抗原のセットを生成するために、前記新生抗原のセットのサブセットを、前記提示尤度のセットに基づいて選択する工程と、
前記選択された新生抗原のセットを返す工程と
を含む、前記方法。
[本発明1002]
前記新生抗原のそれぞれのペプチド配列をコード化した前記数値ベクトル及び前記1つ以上のＭＨＣアレルのそれぞれのペプチド配列をコード化した前記数値ベクトルを、前記機械学習させた提示モデルに入力する前記工程が、
前記1つ以上のＭＨＣアレルのそれぞれについて、前記ペプチド配列の前記特定の位置の前記特定のアミノ酸に基づいて前記ＭＨＣアレルが前記新生抗原を提示するかどうかを示す依存性スコアを生成するために、前記機械学習させた提示モデルを前記新生抗原の前記ペプチド配列及び前記1つ以上のＭＨＣアレルの前記ペプチド配列に適用することを含む、本発明1001の方法。
[本発明1003]
前記新生抗原のそれぞれのペプチド配列をコード化した前記数値ベクトル及び前記1つ以上のＭＨＣアレルのそれぞれのペプチド配列をコード化した前記数値ベクトルを、前記機械学習させた提示モデルに入力する前記工程が、
各ＭＨＣアレルについて、前記対応するＭＨＣアレルが前記対応する新生抗原を提示する尤度を示す対応するアレルごと尤度を生成するために、前記依存性スコアを変換することと、
前記アレルごと尤度を組み合わせて前記新生抗原の前記提示尤度を生成することと
をさらに含む、本発明1002の方法。
[本発明1004]
前記依存性スコアを変換することが、前記新生抗原の提示を前記1つ以上のＭＨＣアレルにわたって相互排他的なものとしてモデル化する、本発明1003の方法。
[本発明1005]
前記新生抗原のそれぞれのペプチド配列をコード化した前記数値ベクトル及び前記1つ以上のＭＨＣアレルのそれぞれのペプチド配列をコード化した前記数値ベクトルを、前記機械学習させた提示モデルに入力する前記工程が、
前記提示尤度を生成するために、前記依存性スコアの組み合わせを変換することであって、前記依存性スコアの前記組み合わせを変換することが、前記新生抗原の提示を前記1つ以上のＭＨＣアレル間で干渉するものとしてモデル化する、前記変換すること
をさらに含む、本発明1002の方法。
[本発明1006]
前記提示尤度のセットが、少なくとも1つ以上のアレル非相互作用特性によってさらに特定され、
前記アレル非相互作用特性についての依存性スコアを生成するために、前記機械学習させた提示モデルを前記アレル非相互作用特性に適用することにより、前記アレル非相互作用特性に基づいて、前記対応する新生抗原のペプチド配列が提示されるかどうかを示すことをさらに含む、本発明1002～1005のいずれかの方法。
[本発明1007]
前記1つ以上のＭＨＣアレルの各ＭＨＣアレルについての前記依存性スコアを、前記アレル非相互作用特性についての前記依存性スコアと組み合わせることと、
各ＭＨＣアレルについてのアレルごと尤度を生成するために、各ＭＨＣアレルについての前記組み合わされた依存性スコアを変換することにより、前記対応するＭＨＣアレルが前記対応する新生抗原を提示する尤度を示すことと、
前記提示尤度を生成するために、前記アレルごと尤度を組み合わせることと
をさらに含む、本発明1006の方法。
[本発明1008]
前記ＭＨＣアレルのそれぞれについての前記依存性スコアと、前記アレル非相互作用特性についての前記依存性スコアとを組み合わせることと、
前記提示尤度を生成するために、前記組み合わされた依存性スコアを変換することと
をさらに含む、本発明1006の方法。
[本発明1009]
前記1つ以上のＭＨＣアレルが、2つ以上の異なるＭＨＣアレルを含む、本発明1001～1008のいずれかの方法。
[本発明1010]
前記ペプチド配列が、アミノ酸9個の長さ以外の長さを有するペプチド配列を含む、本発明1001～1009のいずれかの方法。
[本発明1011]
前記ペプチド配列をコード化する工程が、ワン・ホットコード化スキームを用いて前記ペプチド配列をコード化することを含む、本発明1001～1010のいずれかの方法。
[本発明1012]
前記複数の試料が、
（ａ）単一のＭＨＣアレルを発現するように操作された1つ以上の細胞株、
（ｂ）複数のＭＨＣアレルを発現するように操作された1つ以上の細胞株、
（ｃ）複数の患者から得られた、または複数の患者に由来する1つ以上のヒト細胞株、
（ｄ）複数の患者から得られた新鮮なまたは凍結された腫瘍試料、及び
（ｅ）複数の患者から得られた新鮮なまたは凍結された組織試料
のうちの少なくとも1つを含む、本発明1001～1011のいずれかの方法。
[本発明1013]
前記訓練データセットが、
（ａ）前記ペプチドの少なくとも1つについてのペプチド－ＭＨＣ結合親和性の測定値に関連するデータ、及び
（ｂ）前記ペプチドの少なくとも1つについてのペプチド－ＭＨＣ結合安定性の測定値に関連するデータ
のうちの少なくとも1つをさらに含む、本発明1001～1012のいずれかの方法。
[本発明1014]
前記提示尤度のセットが、
ＲＮＡ－ｓｅｑまたは質量分析により測定される、前記対象における前記1つ以上のＭＨＣアレルの少なくとも発現レベル
によってさらに特定される、本発明1001～1013のいずれかの方法。
[本発明1015]
前記提示尤度のセットが、
（ａ）前記新生抗原のセット内の新生抗原と前記1つ以上のＭＨＣアレルとの間の予測される親和性、及び
（ｂ）前記新生抗原コード化ペプチド－ＭＨＣ複合体の予測される安定性
のうちの少なくとも1つを含む特性によってさらに特定される、本発明1001～1014のいずれかの方法。
[本発明1016]
数値的尤度の前記セットが、
（ａ）そのソースタンパク質配列内の、前記新生抗原コード化ペプチド配列に隣接するＣ末端配列、及び
（ｂ）そのソースタンパク質配列内の、前記新生抗原コード化ペプチド配列に隣接するＮ末端配列
のうちの少なくとも1つを含む特性によってさらに特定される、本発明1001～1015のいずれかの方法。
[本発明1017]
前記選択された新生抗原のセットを選択する工程が、前記機械学習させた提示モデルに基づいて、選択されない新生抗原と比べて前記腫瘍細胞表面上に提示される尤度が増大している新生抗原を選択することを含む、本発明1001～1016のいずれかの方法。
[本発明1018]
前記選択された新生抗原のセットを選択する工程が、前記機械学習させた提示モデルに基づいて、選択されない新生抗原と比べて前記対象において腫瘍特異的な免疫応答を誘導することができる尤度が増大している新生抗原を選択することを含む、本発明1001～1017のいずれかの方法。
[本発明1019]
前記選択された新生抗原のセットを選択する工程が、前記提示モデルに基づいて、選択されない新生抗原と比べて、プロフェッショナル抗原提示細胞（ＡＰＣ）によってナイーブＴ細胞に対して提示されることができる尤度が増大している新生抗原を選択することを含み、任意で、前記ＡＰＣが樹状細胞（ＤＣ）である、本発明1001～1018のいずれかの方法。
[本発明1020]
前記選択された新生抗原のセットを選択する工程が、前記機械学習させた提示モデルに基づいて、選択されない新生抗原と比べて中枢性寛容または末梢性寛容によって阻害される尤度が減少している新生抗原を選択することを含む、本発明1001～1019のいずれかの方法。
[本発明1021]
前記選択された新生抗原のセットを選択する工程が、前記機械学習させた提示モデルに基づいて、選択されない新生抗原と比べて前記対象において正常組織に対する自己免疫応答を誘導することができる尤度が減少している新生抗原を選択することを含む、本発明1001～1020のいずれかの方法。
[本発明1022]
前記1つ以上の腫瘍細胞が、肺がん、メラノーマ、乳がん、卵巣がん、前立腺がん、腎臓がん、胃がん、結腸がん、精巣がん、頭頸部がん、膵臓がん、脳がん、Ｂ細胞リンパ腫、急性骨髄性白血病、慢性骨髄性白血病、慢性リンパ球性白血病、Ｔ細胞リンパ球性白血病、非小細胞肺がん、及び小細胞肺がんからなる群から選択される、本発明1001～1021のいずれかの方法。
[本発明1023]
前記選択された新生抗原のセットから個別化がんワクチンを構築するための出力を生成する工程をさらに含む、本発明1001～1022のいずれかの方法。
[本発明1024]
前記個別化がんワクチン用の出力が、前記選択された新生抗原のセットをコードした少なくとも1つのペプチド配列または少なくとも1つのヌクレオチド配列を含む、本発明1023の方法。
[本発明1025]
前記機械学習させた提示モデルが、ニューラルネットワークモデルである、本発明1001～1024のいずれかの方法。
[本発明1026]
前記ニューラルネットワークモデルが、1つ以上の層に配置された一連のノードを含む単一のニューラルネットワークモデルを含み、前記単一のニューラルネットワークモデルが、複数の異なるＭＨＣアレルのペプチド配列をコード化した数値ベクトルを受信するように構成されている、本発明1025の方法。
[本発明1027]
前記ニューラルネットワークモデルが、前記ニューラルネットワークモデルのパラメータを更新することによって訓練される、本発明1026の方法。
[本発明1028]
前記機械学習させた提示モデルが、1つ以上のノードの層を含むディープラーニングモデルである、本発明1025～1027のいずれかの方法。
[本発明1029]
前記試料の前記ペプチドに結合した前記少なくとも1つのＭＨＣアレルを構成する複数のアミノ酸及び前記少なくとも1つのＭＨＣアレル内の前記アミノ酸の位置のセットに関する情報を含む数値ベクトルとしてコード化された前記訓練ペプチド配列が、前記新生抗原のセットの提示尤度のセットを生成するために、前記機械学習させた提示モデルに入力される、前記対象のＭＨＣアレルのペプチド配列を含まない、本発明1001～1028のいずれかの方法。
[本発明1030]
前記訓練データセットの前記複数の試料の各試料の前記ペプチドに結合した前記少なくとも1つのＭＨＣアレルが、前記対象の前記1つ以上のＭＨＣアレルが属する遺伝子ファミリーに属する、本発明1001～1029のいずれかの方法。
[本発明1031]
前記訓練データセットの前記複数の試料の各試料の前記ペプチドに結合した前記少なくとも1つのＭＨＣアレルが、1個のＭＨＣアレルを含む、本発明1001～1030のいずれかの方法。
[本発明1032]
前記訓練データセットの前記複数の試料の各試料の前記ペプチドに結合した前記少なくとも1つのＭＨＣアレルが、複数のＭＨＣアレルを含む、本発明1001～1030のいずれかの方法。
[本発明1033]
前記1つ以上のＭＨＣアレルが、クラスＩＭＨＣアレルである、本発明1001～1032のいずれかの方法。
[本発明1034]
コンピュータシステムであって、
コンピュータプロセッサと、
前記コンピュータプロセッサにより実行されると前記コンピュータプロセッサに、
前記対象の前記腫瘍細胞及び正常細胞からエクソーム、トランスクリプトーム、または全ゲノムのヌクレオチドシークエンシングデータのうちの少なくとも1つを取得させることであって、前記ヌクレオチドシークエンシングデータが、前記腫瘍細胞からのヌクレオチドシークエンシングデータと前記正常細胞からのヌクレオチドシークエンシングデータとを比較することにより特定された新生抗原のセットのそれぞれのペプチド配列を表すデータを取得するために用いられ、各新生抗原のペプチド配列が、前記ペプチド配列を前記対象の前記正常細胞から特定される対応する野生型のペプチド配列とは異なるものとする少なくとも1つの変化を含む、前記取得させることと、
前記新生抗原のそれぞれの前記ペプチド配列を、対応する数値ベクトルにコード化させることであって、各数値ベクトルが、前記ペプチド配列を構成する複数のアミノ酸及び前記ペプチド配列内における前記アミノ酸の位置のセットに関する情報を含む、前記コード化させることと、
前記対象の前記1つ以上のＭＨＣアレルのそれぞれからエクソーム、トランスクリプトーム、または全ゲノムヌクレオチドシークエンシングデータのうちの少なくとも1つを取得させることであって、前記ヌクレオチドシークエンシングデータが、前記対象の前記1つ以上のＭＨＣアレルのそれぞれのペプチド配列を表すデータを取得するために用いられる、前記取得させることと、
前記対象の前記1つ以上のＭＨＣアレルのそれぞれの前記ペプチド配列を、対応する数値ベクトルにコード化させることであって、各数値ベクトルが、前記ペプチド配列を構成する複数のアミノ酸及び前記ペプチド配列内における前記アミノ酸の位置のセットに関する情報を含む、前記コード化させることと、
前記新生抗原のセットについて提示尤度のセットを生成するために、コンピュータプロセッサを使用して、前記新生抗原のそれぞれのペプチド配列をコード化した前記数値ベクトル及び前記1つ以上のＭＨＣアレルのそれぞれのペプチド配列をコード化した前記数値ベクトルを、機械学習させた提示モデルに入力させることであって、前記セットの中の各提示尤度が、対応する新生抗原が前記1つ以上のＭＨＣアレルによって前記対象の前記腫瘍細胞の表面上に提示される尤度を表し、前記機械学習させた提示モデルが、
複数の試料の各試料について、前記試料中に存在するものとして特定されたＭＨＣアレルのセットの中の少なくとも1つのＭＨＣアレルに結合したペプチドの存在を測定する質量分析によって得られた標識と、
前記試料のそれぞれについて、前記ペプチドを構成する複数のアミノ酸及び前記ペプチド内の前記アミノ酸の位置のセットに関する情報を含む数値ベクトルとしてコード化された訓練ペプチド配列と、
前記試料のそれぞれについて、前記試料の前記ペプチドに結合した前記少なくとも1つのＭＨＣアレルを構成する複数のアミノ酸及び前記少なくとも1つのＭＨＣアレル内の前記アミノ酸の位置のセットに関する情報を含む数値ベクトルとしてコード化された訓練ペプチド配列と、
を含む訓練データセットに少なくとも基づいて特定される、複数のパラメータと、
入力として受信される前記新生抗原のそれぞれの前記ペプチド配列をコード化した前記数値ベクトルと前記1つ以上のＭＨＣアレルのそれぞれの前記ペプチド配列をコード化した前記数値ベクトルとの間の関係、ならびに前記数値ベクトル及び前記パラメータに基づいた出力として生成された提示尤度を表す、関数と
を含む、前記入力させることと、
選択された新生抗原のセットを生成するために、前記新生抗原のセットのサブセットを、前記提示尤度のセットに基づいて選択させることと、
前記選択された新生抗原のセットを返させることと
を行わせるコンピュータプログラム命令を格納したメモリと
を含む、前記コンピュータシステム。

Claims

１つ以上のＭＨＣアレルによって腫瘍細胞の表面上に提示される可能性の高い、対象の１つ以上の腫瘍細胞に由来する少なくとも１つの新生抗原を特定するための方法であって、以下の工程：
新生抗原のセットのそれぞれのペプチド配列を表すデータを取得する工程と、
前記対象の前記１つ以上のＭＨＣアレルのそれぞれのペプチド配列を表すデータを取得する工程と、
前記新生抗原のセットについて提示尤度のセットを、機械学習させた提示モデルを使用して決定する工程であって、前記セットの中の各提示尤度が、対応する新生抗原が前記１つ以上のＭＨＣアレルによって前記対象の前記腫瘍細胞の表面上に提示される尤度を表し、前記機械学習させた提示モデルが、
複数の試料の各試料について、前記試料中に存在するものとして特定されたＭＨＣアレルのセットの中の少なくとも１つのＭＨＣアレルに結合したペプチドの存在を測定する質量分析によって得られた標識、
前記試料のそれぞれについて、ペプチドの訓練ペプチド配列または前記訓練ペプチド配列に由来するデータ、及び
前記試料のそれぞれについて、少なくとも１つのＭＨＣアレルの訓練ペプチド配列または前記訓練ペプチド配列に由来するデータ
を含む訓練データセットに少なくとも基づいて特定される、複数のパラメータ
を含む、前記決定する工程と、
選択された新生抗原のセットを生成するために、前記新生抗原のセットのサブセットを、前記提示尤度のセットに基づいて選択する工程と、
前記選択された新生抗原のセットを返す工程と
を含む、前記方法。
前記機械学習させた提示モデルを使用して決定する前記工程が、
前記１つ以上のＭＨＣアレルのそれぞれについて、前記ペプチド配列の前記特定の位置の前記特定のアミノ酸に基づいて前記ＭＨＣアレルが前記新生抗原を提示するかどうかを示す依存性スコアを生成するために、前記機械学習させた提示モデルを前記新生抗原の前記ペプチド配列及び前記１つ以上のＭＨＣアレルの前記ペプチド配列に適用することを含む、請求項１に記載の方法。
前記機械学習させた提示モデルを使用して決定する前記工程が、
（ａ）各ＭＨＣアレルについて、前記対応するＭＨＣアレルが前記対応する新生抗原を提示する尤度を示す対応するアレルごと尤度を生成するために、前記依存性スコアを変換することと、
前記アレルごと尤度を組み合わせて前記新生抗原の前記提示尤度を生成することと
をさらに含み、任意で、前記依存性スコアを変換することが、前記新生抗原の提示を前記１つ以上のＭＨＣアレルにわたって相互排他的なものとしてモデル化する、または
（ｂ）前記提示尤度を生成するために、前記依存性スコアの組み合わせを変換することであって、前記依存性スコアの前記組み合わせを変換することが、前記新生抗原の提示を前記１つ以上のＭＨＣアレル間で干渉するものとしてモデル化する、前記変換すること
をさらに含む、
請求項２に記載の方法。
前記提示尤度のセットが、少なくとも１つ以上のアレル非相互作用特性によってさらに特定され、
前記アレル非相互作用特性についての依存性スコアを生成するために、前記機械学習させた提示モデルを前記アレル非相互作用特性に適用することにより、前記アレル非相互作用特性に基づいて、前記対応する新生抗原のペプチド配列が提示されるかどうかを示すことをさらに含む、請求項２または３に記載の方法。
（ａ）
前記１つ以上のＭＨＣアレルの各ＭＨＣアレルについての前記依存性スコアを、前記アレル非相互作用特性についての前記依存性スコアと組み合わせることと、
各ＭＨＣアレルについて、前記対応するＭＨＣアレルが前記対応する新生抗原を提示する尤度を示すアレルごと尤度を生成するために、各ＭＨＣアレルについての前記組み合わされた依存性スコアを変換することと、
前記提示尤度を生成するために、前記アレルごと尤度を組み合わせることと
をさらに含む、または
（ｂ）
前記ＭＨＣアレルのそれぞれについての前記依存性スコアと、前記アレル非相互作用特性についての前記依存性スコアとを組み合わせることと、
前記提示尤度を生成するために、前記組み合わされた依存性スコアを変換することと
をさらに含む、
請求項４に記載の方法。
（ａ）前記１つ以上のＭＨＣアレルが、２つ以上の異なるＭＨＣアレルを含む；
（ｂ）前記ペプチド配列が、アミノ酸９個の長さ以外の長さを有するペプチド配列を含む；
（ｃ）前記ペプチド配列をコード化する工程が、ワン・ホットコード化スキームを用いて前記ペプチド配列をコード化することを含む；
（ｄ）前記複数の試料が、
（ｉ）単一のＭＨＣアレルを発現するように操作された１つ以上の細胞株、
（ｉｉ）複数のＭＨＣアレルを発現するように操作された１つ以上の細胞株、
（ｉｉｉ）複数の患者から得られた、または複数の患者に由来する１つ以上のヒト細胞株、
（ｉｖ）複数の患者から得られた新鮮なまたは凍結された腫瘍試料、及び
（ｖ）複数の患者から得られた新鮮なまたは凍結された組織試料
のうちの少なくとも１つを含む；
（ｅ）前記訓練データセットが、
（ｉ）前記ペプチドの少なくとも１つについてのペプチド－ＭＨＣ結合親和性の測定値に関連するデータ、及び
（ｉｉ）前記ペプチドの少なくとも１つについてのペプチド－ＭＨＣ結合安定性の測定値に関連するデータ
のうちの少なくとも１つをさらに含む；並びに／あるいは
（ｆ）前記提示尤度のセットが、
ＲＮＡ－ｓｅｑまたは質量分析により測定される、前記対象における前記１つ以上のＭＨＣアレルの少なくとも発現レベル
によってさらに特定される、
請求項１～５のいずれか１項に記載の方法。
（ａ）前記提示尤度のセットが、
（ｉ）前記新生抗原のセット内の新生抗原と前記１つ以上のＭＨＣアレルとの間の予測される親和性、及び
（ｉｉ）前記新生抗原コード化ペプチド－ＭＨＣ複合体の予測される安定性
のうちの少なくとも１つを含む特性によってさらに特定される；並びに／または
（ｂ）数値的尤度の前記セットが、
（ｉ）そのソースタンパク質配列内の、前記新生抗原コード化ペプチド配列に隣接するＣ末端配列、及び
（ｉｉ）そのソースタンパク質配列内の、前記新生抗原コード化ペプチド配列に隣接するＮ末端配列
のうちの少なくとも１つを含む特性によってさらに特定される、
請求項１～６のいずれか１項に記載の方法。
（ａ）前記選択された新生抗原のセットを選択する工程が、前記機械学習させた提示モデルに基づいて、選択されない新生抗原と比べて前記腫瘍細胞表面上に提示される尤度が増大している新生抗原を選択することを含む；
（ｂ）前記選択された新生抗原のセットを選択する工程が、前記機械学習させた提示モデルに基づいて、選択されない新生抗原と比べて前記対象において腫瘍特異的な免疫応答を誘導することができる尤度が増大している新生抗原を選択することを含む；
（ｃ）前記選択された新生抗原のセットを選択する工程が、前記提示モデルに基づいて、選択されない新生抗原と比べて、プロフェッショナル抗原提示細胞（ＡＰＣ）によってナイーブＴ細胞に対して提示されることができる尤度が増大している新生抗原を選択することを含み、任意で、前記ＡＰＣが樹状細胞（ＤＣ）である；
（ｄ）前記選択された新生抗原のセットを選択する工程が、前記機械学習させた提示モデルに基づいて、選択されない新生抗原と比べて中枢性寛容もしくは末梢性寛容によって阻害される尤度が減少している新生抗原を選択することを含む；及び／または
（ｅ）前記選択された新生抗原のセットを選択する工程が、前記機械学習させた提示モデルに基づいて、選択されない新生抗原と比べて前記対象において正常組織に対する自己免疫応答を誘導することができる尤度が減少している新生抗原を選択することを含む、
請求項１～７のいずれか１項に記載の方法。
前記１つ以上の腫瘍細胞が、肺がん、メラノーマ、乳がん、卵巣がん、前立腺がん、腎臓がん、胃がん、結腸がん、精巣がん、頭頸部がん、膵臓がん、脳がん、Ｂ細胞リンパ腫、急性骨髄性白血病、慢性骨髄性白血病、慢性リンパ球性白血病、Ｔ細胞リンパ球性白血病、非小細胞肺がん、及び小細胞肺がんからなる群から選択される、請求項１～８のいずれか１項に記載の方法。
前記選択された新生抗原のセットから個別化がんワクチンを構築するための出力を生成する工程をさらに含み、任意で、前記個別化がんワクチン用の出力が、前記選択された新生抗原のセットをコードした少なくとも１つのペプチド配列または少なくとも１つのヌクレオチド配列を含む、請求項１～９のいずれか１項に記載の方法。
前記機械学習させた提示モデルが、ニューラルネットワークモデルである、請求項１～１０のいずれか１項に記載の方法。
前記ニューラルネットワークモデルが、１つ以上の層に配置された一連のノードを含む単一のニューラルネットワークモデルを含み、前記単一のニューラルネットワークモデルが、複数の異なるＭＨＣアレルのペプチド配列をコード化した数値ベクトルを受信するように構成されており、任意で、前記ニューラルネットワークモデルが、前記ニューラルネットワークモデルのパラメータを更新することによって訓練される、請求項１１に記載の方法。
前記機械学習させた提示モデルが、１つ以上のノードの層を含むディープラーニングモデルである、請求項１１または１２に記載の方法。
（ａ）少なくとも１つのＭＨＣアレルの前記訓練ペプチド配列または前記訓練ペプチド配列に由来するデータが、前記新生抗原のセットの提示尤度のセットを生成するために、前記機械学習させた提示モデルに入力される、前記対象のＭＨＣアレルのペプチド配列を含まない；
（ｂ）前記訓練データセットの前記複数の試料の各試料の前記ペプチドに結合した前記少なくとも１つのＭＨＣアレルが、前記対象の前記１つ以上のＭＨＣアレルが属する遺伝子ファミリーに属する；
（ｃ）前記訓練データセットの前記複数の試料の各試料の前記ペプチドに結合した前記少なくとも１つのＭＨＣアレルが、１個または複数のＭＨＣアレルを含む；及び／または
（ｄ）前記１つ以上のＭＨＣアレルが、クラスＩＭＨＣアレルである、
請求項１～１３のいずれか１項に記載の方法。
コンピュータシステムであって、
コンピュータプロセッサと、
前記コンピュータプロセッサにより実行されると前記コンピュータプロセッサに、
新生抗原のセットのそれぞれのペプチド配列を表すデータを取得させることと、
前記対象の前記１つ以上のＭＨＣアレルのそれぞれのペプチド配列を表すデータを取得させることと、
前記新生抗原のセットについて提示尤度のセットを、機械学習させた提示モデルを使用して決定させることであって、前記セットの中の各提示尤度が、対応する新生抗原が前記１つ以上のＭＨＣアレルによって前記対象の前記腫瘍細胞の表面上に提示される尤度を表し、前記機械学習させた提示モデルが、
複数の試料の各試料について、前記試料中に存在するものとして特定されたＭＨＣアレルのセットの中の少なくとも１つのＭＨＣアレルに結合したペプチドの存在を測定する質量分析によって得られた標識と、
前記試料のそれぞれについて、ペプチドの訓練ペプチド配列または前記訓練ペプチド配列に由来するデータと、
前記試料のそれぞれについて、少なくとも１つのＭＨＣアレルの訓練ペプチド配列または前記訓練ペプチド配列に由来するデータと、
を含む訓練データセットに少なくとも基づいて特定される、複数のパラメータ
を含む、前記決定させることと、
選択された新生抗原のセットを生成するために、前記新生抗原のセットのサブセットを、前記提示尤度のセットに基づいて選択させることと、
前記選択された新生抗原のセットを返させることと
を行わせるコンピュータプログラム命令を格納したメモリと
を含む、前記コンピュータシステム。