JPWO2019168984A5 - - Google Patents

Download PDF

Info

Publication number
JPWO2019168984A5
JPWO2019168984A5 JP2020567466A JP2020567466A JPWO2019168984A5 JP WO2019168984 A5 JPWO2019168984 A5 JP WO2019168984A5 JP 2020567466 A JP2020567466 A JP 2020567466A JP 2020567466 A JP2020567466 A JP 2020567466A JP WO2019168984 A5 JPWO2019168984 A5 JP WO2019168984A5
Authority
JP
Japan
Prior art keywords
nascent
mhc
peptide sequence
antigens
allele
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020567466A
Other languages
English (en)
Other versions
JP7480064B2 (ja
JP2021514671A (ja
Publication date
Application filed filed Critical
Priority claimed from PCT/US2019/019836 external-priority patent/WO2019168984A1/en
Publication of JP2021514671A publication Critical patent/JP2021514671A/ja
Publication of JPWO2019168984A5 publication Critical patent/JPWO2019168984A5/ja
Application granted granted Critical
Publication of JP7480064B2 publication Critical patent/JP7480064B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

TIL新生エピトープデータセット及び予想される新生抗原反応性T細胞の特定タスクにおける本明細書に開示されるモデルの予測性能は、HLAのプロセシング及び提示をモデル化することによって、治療に有用な新生エピトープの予測を得ることが今や可能であることを示す。要約すると、この研究は、抗原標的化免疫療法のための実用的なインシリコの抗原特定を可能とすることにより、患者の治癒へ向けた進展を加速するものである。
[本発明1001]
1つ以上のMHCアレルによって腫瘍細胞の表面上に提示される可能性の高い、対象の1つ以上の腫瘍細胞に由来する少なくとも1つの新生抗原を特定するための方法であって、以下の工程:
前記対象の前記腫瘍細胞及び正常細胞からエクソーム、トランスクリプトーム、または全ゲノムのヌクレオチドシークエンシングデータのうちの少なくとも1つを取得する工程であって、前記ヌクレオチドシークエンシングデータは、前記腫瘍細胞からのヌクレオチドシークエンシングデータと前記正常細胞からのヌクレオチドシークエンシングデータとを比較することにより特定された新生抗原のセットのそれぞれのペプチド配列を表すデータを取得するために用いられ、各新生抗原のペプチド配列が、前記ペプチド配列を前記対象の前記正常細胞から特定される対応する野生型のペプチド配列とは異なるものとする少なくとも1つの変化を有する、前記取得する工程と、
前記新生抗原のそれぞれの前記ペプチド配列を、対応する数値ベクトルにコード化する工程であって、各数値ベクトルが、前記ペプチド配列を構成する複数のアミノ酸及び前記ペプチド配列内における前記アミノ酸の位置のセットに関する情報を含む、前記コード化する工程と、
前記対象の前記腫瘍細胞からエクソーム、トランスクリプトーム、または全ゲノムヌクレオチドシークエンシングデータのうちの少なくとも1つを取得する工程であって、前記ヌクレオチドシークエンシングデータが、前記対象の前記1つ以上のMHCアレルのそれぞれのペプチド配列を表すデータを取得するために用いられる、前記取得する工程と、
前記対象の前記1つ以上のMHCアレルのそれぞれの前記ペプチド配列を、対応する数値ベクトルにコード化する工程であって、各数値ベクトルが、前記ペプチド配列を構成する複数のアミノ酸及び前記ペプチド配列内における前記アミノ酸の位置のセットに関する情報を含む、前記コード化する工程と、
前記新生抗原のセットについて提示尤度のセットを生成するために、コンピュータプロセッサを使用して、前記新生抗原のそれぞれのペプチド配列をコード化した前記数値ベクトル及び前記1つ以上のMHCアレルのそれぞれのペプチド配列をコード化した前記数値ベクトルを、機械学習させた提示モデルに入力する工程であって、前記セットの中の各提示尤度が、対応する新生抗原が前記1つ以上のMHCアレルによって前記対象の前記腫瘍細胞の表面上に提示される尤度を表し、前記機械学習させた提示モデルが、
複数の試料の各試料について、前記試料中に存在するものとして特定されたMHCアレルのセットの中の少なくとも1つのMHCアレルに結合したペプチドの存在を測定する質量分析によって得られた標識、
前記試料のそれぞれについて、前記ペプチドを構成する複数のアミノ酸及び前記ペプチド内の前記アミノ酸の位置のセットに関する情報を含む数値ベクトルとしてコード化された訓練ペプチド配列、
前記試料のそれぞれについて、前記試料の前記ペプチドに結合した前記少なくとも1つのMHCアレルを構成する複数のアミノ酸及び前記少なくとも1つのMHCアレル内の前記アミノ酸の位置のセットに関する情報を含む数値ベクトルとしてコード化された訓練ペプチド配列
を含む訓練データセットに少なくとも基づいて特定される、複数のパラメータと、
入力として受信される、前記新生抗原のそれぞれの前記ペプチド配列をコード化した前記数値ベクトルと前記1つ以上のMHCアレルのそれぞれの前記ペプチド配列をコード化した前記数値ベクトルとの間の関係、ならびに前記数値ベクトル及び前記パラメータに基づいた出力として生成された提示尤度を表す、関数と
を含む、前記入力する工程と、
選択された新生抗原のセットを生成するために、前記新生抗原のセットのサブセットを、前記提示尤度のセットに基づいて選択する工程と、
前記選択された新生抗原のセットを返す工程と
を含む、前記方法。
[本発明1002]
前記新生抗原のそれぞれのペプチド配列をコード化した前記数値ベクトル及び前記1つ以上のMHCアレルのそれぞれのペプチド配列をコード化した前記数値ベクトルを、前記機械学習させた提示モデルに入力する前記工程が、
前記1つ以上のMHCアレルのそれぞれについて、前記ペプチド配列の前記特定の位置の前記特定のアミノ酸に基づいて前記MHCアレルが前記新生抗原を提示するかどうかを示す依存性スコアを生成するために、前記機械学習させた提示モデルを前記新生抗原の前記ペプチド配列及び前記1つ以上のMHCアレルの前記ペプチド配列に適用することを含む、本発明1001の方法。
[本発明1003]
前記新生抗原のそれぞれのペプチド配列をコード化した前記数値ベクトル及び前記1つ以上のMHCアレルのそれぞれのペプチド配列をコード化した前記数値ベクトルを、前記機械学習させた提示モデルに入力する前記工程が、
各MHCアレルについて、前記対応するMHCアレルが前記対応する新生抗原を提示する尤度を示す対応するアレルごと尤度を生成するために、前記依存性スコアを変換することと、
前記アレルごと尤度を組み合わせて前記新生抗原の前記提示尤度を生成することと
をさらに含む、本発明1002の方法。
[本発明1004]
前記依存性スコアを変換することが、前記新生抗原の提示を前記1つ以上のMHCアレルにわたって相互排他的なものとしてモデル化する、本発明1003の方法。
[本発明1005]
前記新生抗原のそれぞれのペプチド配列をコード化した前記数値ベクトル及び前記1つ以上のMHCアレルのそれぞれのペプチド配列をコード化した前記数値ベクトルを、前記機械学習させた提示モデルに入力する前記工程が、
前記提示尤度を生成するために、前記依存性スコアの組み合わせを変換することであって、前記依存性スコアの前記組み合わせを変換することが、前記新生抗原の提示を前記1つ以上のMHCアレル間で干渉するものとしてモデル化する、前記変換すること
をさらに含む、本発明1002の方法。
[本発明1006]
前記提示尤度のセットが、少なくとも1つ以上のアレル非相互作用特性によってさらに特定され、
前記アレル非相互作用特性についての依存性スコアを生成するために、前記機械学習させた提示モデルを前記アレル非相互作用特性に適用することにより、前記アレル非相互作用特性に基づいて、前記対応する新生抗原のペプチド配列が提示されるかどうかを示すことをさらに含む、本発明1002~1005のいずれかの方法。
[本発明1007]
前記1つ以上のMHCアレルの各MHCアレルについての前記依存性スコアを、前記アレル非相互作用特性についての前記依存性スコアと組み合わせることと、
各MHCアレルについてのアレルごと尤度を生成するために、各MHCアレルについての前記組み合わされた依存性スコアを変換することにより、前記対応するMHCアレルが前記対応する新生抗原を提示する尤度を示すことと、
前記提示尤度を生成するために、前記アレルごと尤度を組み合わせることと
をさらに含む、本発明1006の方法。
[本発明1008]
前記MHCアレルのそれぞれについての前記依存性スコアと、前記アレル非相互作用特性についての前記依存性スコアとを組み合わせることと、
前記提示尤度を生成するために、前記組み合わされた依存性スコアを変換することと
をさらに含む、本発明1006の方法。
[本発明1009]
前記1つ以上のMHCアレルが、2つ以上の異なるMHCアレルを含む、本発明1001~1008のいずれかの方法。
[本発明1010]
前記ペプチド配列が、アミノ酸9個の長さ以外の長さを有するペプチド配列を含む、本発明1001~1009のいずれかの方法。
[本発明1011]
前記ペプチド配列をコード化する工程が、ワン・ホットコード化スキームを用いて前記ペプチド配列をコード化することを含む、本発明1001~1010のいずれかの方法。
[本発明1012]
前記複数の試料が、
(a)単一のMHCアレルを発現するように操作された1つ以上の細胞株、
(b)複数のMHCアレルを発現するように操作された1つ以上の細胞株、
(c)複数の患者から得られた、または複数の患者に由来する1つ以上のヒト細胞株、
(d)複数の患者から得られた新鮮なまたは凍結された腫瘍試料、及び
(e)複数の患者から得られた新鮮なまたは凍結された組織試料
のうちの少なくとも1つを含む、本発明1001~1011のいずれかの方法。
[本発明1013]
前記訓練データセットが、
(a)前記ペプチドの少なくとも1つについてのペプチド-MHC結合親和性の測定値に関連するデータ、及び
(b)前記ペプチドの少なくとも1つについてのペプチド-MHC結合安定性の測定値に関連するデータ
のうちの少なくとも1つをさらに含む、本発明1001~1012のいずれかの方法。
[本発明1014]
前記提示尤度のセットが、
RNA-seqまたは質量分析により測定される、前記対象における前記1つ以上のMHCアレルの少なくとも発現レベル
によってさらに特定される、本発明1001~1013のいずれかの方法。
[本発明1015]
前記提示尤度のセットが、
(a)前記新生抗原のセット内の新生抗原と前記1つ以上のMHCアレルとの間の予測される親和性、及び
(b)前記新生抗原コード化ペプチド-MHC複合体の予測される安定性
のうちの少なくとも1つを含む特性によってさらに特定される、本発明1001~1014のいずれかの方法。
[本発明1016]
数値的尤度の前記セットが、
(a)そのソースタンパク質配列内の、前記新生抗原コード化ペプチド配列に隣接するC末端配列、及び
(b)そのソースタンパク質配列内の、前記新生抗原コード化ペプチド配列に隣接するN末端配列
のうちの少なくとも1つを含む特性によってさらに特定される、本発明1001~1015のいずれかの方法。
[本発明1017]
前記選択された新生抗原のセットを選択する工程が、前記機械学習させた提示モデルに基づいて、選択されない新生抗原と比べて前記腫瘍細胞表面上に提示される尤度が増大している新生抗原を選択することを含む、本発明1001~1016のいずれかの方法。
[本発明1018]
前記選択された新生抗原のセットを選択する工程が、前記機械学習させた提示モデルに基づいて、選択されない新生抗原と比べて前記対象において腫瘍特異的な免疫応答を誘導することができる尤度が増大している新生抗原を選択することを含む、本発明1001~1017のいずれかの方法。
[本発明1019]
前記選択された新生抗原のセットを選択する工程が、前記提示モデルに基づいて、選択されない新生抗原と比べて、プロフェッショナル抗原提示細胞(APC)によってナイーブT細胞に対して提示されることができる尤度が増大している新生抗原を選択することを含み、任意で、前記APCが樹状細胞(DC)である、本発明1001~1018のいずれかの方法。
[本発明1020]
前記選択された新生抗原のセットを選択する工程が、前記機械学習させた提示モデルに基づいて、選択されない新生抗原と比べて中枢性寛容または末梢性寛容によって阻害される尤度が減少している新生抗原を選択することを含む、本発明1001~1019のいずれかの方法。
[本発明1021]
前記選択された新生抗原のセットを選択する工程が、前記機械学習させた提示モデルに基づいて、選択されない新生抗原と比べて前記対象において正常組織に対する自己免疫応答を誘導することができる尤度が減少している新生抗原を選択することを含む、本発明1001~1020のいずれかの方法。
[本発明1022]
前記1つ以上の腫瘍細胞が、肺がん、メラノーマ、乳がん、卵巣がん、前立腺がん、腎臓がん、胃がん、結腸がん、精巣がん、頭頸部がん、膵臓がん、脳がん、B細胞リンパ腫、急性骨髄性白血病、慢性骨髄性白血病、慢性リンパ球性白血病、T細胞リンパ球性白血病、非小細胞肺がん、及び小細胞肺がんからなる群から選択される、本発明1001~1021のいずれかの方法。
[本発明1023]
前記選択された新生抗原のセットから個別化がんワクチンを構築するための出力を生成する工程をさらに含む、本発明1001~1022のいずれかの方法。
[本発明1024]
前記個別化がんワクチン用の出力が、前記選択された新生抗原のセットをコードした少なくとも1つのペプチド配列または少なくとも1つのヌクレオチド配列を含む、本発明1023の方法。
[本発明1025]
前記機械学習させた提示モデルが、ニューラルネットワークモデルである、本発明1001~1024のいずれかの方法。
[本発明1026]
前記ニューラルネットワークモデルが、1つ以上の層に配置された一連のノードを含む単一のニューラルネットワークモデルを含み、前記単一のニューラルネットワークモデルが、複数の異なるMHCアレルのペプチド配列をコード化した数値ベクトルを受信するように構成されている、本発明1025の方法。
[本発明1027]
前記ニューラルネットワークモデルが、前記ニューラルネットワークモデルのパラメータを更新することによって訓練される、本発明1026の方法。
[本発明1028]
前記機械学習させた提示モデルが、1つ以上のノードの層を含むディープラーニングモデルである、本発明1025~1027のいずれかの方法。
[本発明1029]
前記試料の前記ペプチドに結合した前記少なくとも1つのMHCアレルを構成する複数のアミノ酸及び前記少なくとも1つのMHCアレル内の前記アミノ酸の位置のセットに関する情報を含む数値ベクトルとしてコード化された前記訓練ペプチド配列が、前記新生抗原のセットの提示尤度のセットを生成するために、前記機械学習させた提示モデルに入力される、前記対象のMHCアレルのペプチド配列を含まない、本発明1001~1028のいずれかの方法。
[本発明1030]
前記訓練データセットの前記複数の試料の各試料の前記ペプチドに結合した前記少なくとも1つのMHCアレルが、前記対象の前記1つ以上のMHCアレルが属する遺伝子ファミリーに属する、本発明1001~1029のいずれかの方法。
[本発明1031]
前記訓練データセットの前記複数の試料の各試料の前記ペプチドに結合した前記少なくとも1つのMHCアレルが、1個のMHCアレルを含む、本発明1001~1030のいずれかの方法。
[本発明1032]
前記訓練データセットの前記複数の試料の各試料の前記ペプチドに結合した前記少なくとも1つのMHCアレルが、複数のMHCアレルを含む、本発明1001~1030のいずれかの方法。
[本発明1033]
前記1つ以上のMHCアレルが、クラスI MHCアレルである、本発明1001~1032のいずれかの方法。
[本発明1034]
コンピュータシステムであって、
コンピュータプロセッサと、
前記コンピュータプロセッサにより実行されると前記コンピュータプロセッサに、
前記対象の前記腫瘍細胞及び正常細胞からエクソーム、トランスクリプトーム、または全ゲノムのヌクレオチドシークエンシングデータのうちの少なくとも1つを取得させることであって、前記ヌクレオチドシークエンシングデータが、前記腫瘍細胞からのヌクレオチドシークエンシングデータと前記正常細胞からのヌクレオチドシークエンシングデータとを比較することにより特定された新生抗原のセットのそれぞれのペプチド配列を表すデータを取得するために用いられ、各新生抗原のペプチド配列が、前記ペプチド配列を前記対象の前記正常細胞から特定される対応する野生型のペプチド配列とは異なるものとする少なくとも1つの変化を含む、前記取得させることと、
前記新生抗原のそれぞれの前記ペプチド配列を、対応する数値ベクトルにコード化させることであって、各数値ベクトルが、前記ペプチド配列を構成する複数のアミノ酸及び前記ペプチド配列内における前記アミノ酸の位置のセットに関する情報を含む、前記コード化させることと、
前記対象の前記1つ以上のMHCアレルのそれぞれからエクソーム、トランスクリプトーム、または全ゲノムヌクレオチドシークエンシングデータのうちの少なくとも1つを取得させることであって、前記ヌクレオチドシークエンシングデータが、前記対象の前記1つ以上のMHCアレルのそれぞれのペプチド配列を表すデータを取得するために用いられる、前記取得させることと、
前記対象の前記1つ以上のMHCアレルのそれぞれの前記ペプチド配列を、対応する数値ベクトルにコード化させることであって、各数値ベクトルが、前記ペプチド配列を構成する複数のアミノ酸及び前記ペプチド配列内における前記アミノ酸の位置のセットに関する情報を含む、前記コード化させることと、
前記新生抗原のセットについて提示尤度のセットを生成するために、コンピュータプロセッサを使用して、前記新生抗原のそれぞれのペプチド配列をコード化した前記数値ベクトル及び前記1つ以上のMHCアレルのそれぞれのペプチド配列をコード化した前記数値ベクトルを、機械学習させた提示モデルに入力させることであって、前記セットの中の各提示尤度が、対応する新生抗原が前記1つ以上のMHCアレルによって前記対象の前記腫瘍細胞の表面上に提示される尤度を表し、前記機械学習させた提示モデルが、
複数の試料の各試料について、前記試料中に存在するものとして特定されたMHCアレルのセットの中の少なくとも1つのMHCアレルに結合したペプチドの存在を測定する質量分析によって得られた標識と、
前記試料のそれぞれについて、前記ペプチドを構成する複数のアミノ酸及び前記ペプチド内の前記アミノ酸の位置のセットに関する情報を含む数値ベクトルとしてコード化された訓練ペプチド配列と、
前記試料のそれぞれについて、前記試料の前記ペプチドに結合した前記少なくとも1つのMHCアレルを構成する複数のアミノ酸及び前記少なくとも1つのMHCアレル内の前記アミノ酸の位置のセットに関する情報を含む数値ベクトルとしてコード化された訓練ペプチド配列と、
を含む訓練データセットに少なくとも基づいて特定される、複数のパラメータと、
入力として受信される前記新生抗原のそれぞれの前記ペプチド配列をコード化した前記数値ベクトルと前記1つ以上のMHCアレルのそれぞれの前記ペプチド配列をコード化した前記数値ベクトルとの間の関係、ならびに前記数値ベクトル及び前記パラメータに基づいた出力として生成された提示尤度を表す、関数と
を含む、前記入力させることと、
選択された新生抗原のセットを生成するために、前記新生抗原のセットのサブセットを、前記提示尤度のセットに基づいて選択させることと、
前記選択された新生抗原のセットを返させることと
を行わせるコンピュータプログラム命令を格納したメモリと
を含む、前記コンピュータシステム。

Claims (15)

  1. 1つ以上のMHCアレルによって腫瘍細胞の表面上に提示される可能性の高い、対象の1つ以上の腫瘍細胞に由来する少なくとも1つの新生抗原を特定するための方法であって、以下の工程:
    新生抗原のセットのそれぞれのペプチド配列を表すデータ取得する工程と、
    記対象の前記1つ以上のMHCアレルのそれぞれのペプチド配列を表すデータ取得する工程
    前記新生抗原のセットについて提示尤度のセットを機械学習させた提示モデルを使用して決定する工程であって、前記セットの中の各提示尤度が、対応する新生抗原が前記1つ以上のMHCアレルによって前記対象の前記腫瘍細胞の表面上に提示される尤度を表し、前記機械学習させた提示モデルが、
    複数の試料の各試料について、前記試料中に存在するものとして特定されたMHCアレルのセットの中の少なくとも1つのMHCアレルに結合したペプチドの存在を測定する質量分析によって得られた標識、
    前記試料のそれぞれについて、ペプチドの訓練ペプチド配列または前記訓練ペプチド配列に由来するデータ及び
    前記試料のそれぞれについて、なくとも1つのMHCアレル訓練ペプチド配列または前記訓練ペプチド配列に由来するデータ
    を含む訓練データセットに少なくとも基づいて特定される、複数のパラメータ
    を含む、前記決定する工程と、
    選択された新生抗原のセットを生成するために、前記新生抗原のセットのサブセットを、前記提示尤度のセットに基づいて選択する工程と、
    前記選択された新生抗原のセットを返す工程と
    を含む、前記方法。
  2. 記機械学習させた提示モデルを使用して決定する前記工程が、
    前記1つ以上のMHCアレルのそれぞれについて、前記ペプチド配列の前記特定の位置の前記特定のアミノ酸に基づいて前記MHCアレルが前記新生抗原を提示するかどうかを示す依存性スコアを生成するために、前記機械学習させた提示モデルを前記新生抗原の前記ペプチド配列及び前記1つ以上のMHCアレルの前記ペプチド配列に適用することを含む、請求項1に記載の方法。
  3. 記機械学習させた提示モデルを使用して決定する前記工程が、
    (a)各MHCアレルについて、前記対応するMHCアレルが前記対応する新生抗原を提示する尤度を示す対応するアレルごと尤度を生成するために、前記依存性スコアを変換することと、
    前記アレルごと尤度を組み合わせて前記新生抗原の前記提示尤度を生成することと
    をさらに含任意で、前記依存性スコアを変換することが、前記新生抗原の提示を前記1つ以上のMHCアレルにわたって相互排他的なものとしてモデル化する、または
    (b)前記提示尤度を生成するために、前記依存性スコアの組み合わせを変換することであって、前記依存性スコアの前記組み合わせを変換することが、前記新生抗原の提示を前記1つ以上のMHCアレル間で干渉するものとしてモデル化する、前記変換すること
    をさらに含む
    請求項2に記載の方法。
  4. 前記提示尤度のセットが、少なくとも1つ以上のアレル非相互作用特性によってさらに特定され、
    前記アレル非相互作用特性についての依存性スコアを生成するために、前記機械学習させた提示モデルを前記アレル非相互作用特性に適用することにより、前記アレル非相互作用特性に基づいて、前記対応する新生抗原のペプチド配列が提示されるかどうかを示すことをさらに含む、請求項2または3に記載の方法。
  5. (a)
    前記1つ以上のMHCアレルの各MHCアレルについての前記依存性スコアを、前記アレル非相互作用特性についての前記依存性スコアと組み合わせることと、
    各MHCアレルについて、前記対応するMHCアレルが前記対応する新生抗原を提示する尤度を示すアレルごと尤度を生成するために、各MHCアレルについての前記組み合わされた依存性スコアを変換すること
    前記提示尤度を生成するために、前記アレルごと尤度を組み合わせることと
    をさらに含む、または
    (b)
    前記MHCアレルのそれぞれについての前記依存性スコアと、前記アレル非相互作用特性についての前記依存性スコアとを組み合わせることと、
    前記提示尤度を生成するために、前記組み合わされた依存性スコアを変換することと
    をさらに含む、
    請求項に記載の方法。
  6. (a)前記1つ以上のMHCアレルが、2つ以上の異なるMHCアレルを含む
    (b)前記ペプチド配列が、アミノ酸9個の長さ以外の長さを有するペプチド配列を含む;
    (c)前記ペプチド配列をコード化する工程が、ワン・ホットコード化スキームを用いて前記ペプチド配列をコード化することを含む;
    (d)前記複数の試料が、
    (i)単一のMHCアレルを発現するように操作された1つ以上の細胞株、
    (ii)複数のMHCアレルを発現するように操作された1つ以上の細胞株、
    (iii)複数の患者から得られた、または複数の患者に由来する1つ以上のヒト細胞株、
    (iv)複数の患者から得られた新鮮なまたは凍結された腫瘍試料、及び
    (v)複数の患者から得られた新鮮なまたは凍結された組織試料
    のうちの少なくとも1つを含む;
    (e)前記訓練データセットが、
    (i)前記ペプチドの少なくとも1つについてのペプチド-MHC結合親和性の測定値に関連するデータ、及び
    (ii)前記ペプチドの少なくとも1つについてのペプチド-MHC結合安定性の測定値に関連するデータ
    のうちの少なくとも1つをさらに含む;並びに/あるいは
    (f)前記提示尤度のセットが、
    RNA-seqまたは質量分析により測定される、前記対象における前記1つ以上のMHCアレルの少なくとも発現レベル
    によってさらに特定される
    請求項1~のいずれか1項に記載の方法。
  7. (a)前記提示尤度のセットが、
    )前記新生抗原のセット内の新生抗原と前記1つ以上のMHCアレルとの間の予測される親和性、及び
    ii)前記新生抗原コード化ペプチド-MHC複合体の予測される安定性
    のうちの少なくとも1つを含む特性によってさらに特定される;並びに/または
    (b)数値的尤度の前記セットが、
    (i)そのソースタンパク質配列内の、前記新生抗原コード化ペプチド配列に隣接するC末端配列、及び
    (ii)そのソースタンパク質配列内の、前記新生抗原コード化ペプチド配列に隣接するN末端配列
    のうちの少なくとも1つを含む特性によってさらに特定される、
    請求項1~のいずれか1項に記載の方法。
  8. (a)前記選択された新生抗原のセットを選択する工程が、前記機械学習させた提示モデルに基づいて、選択されない新生抗原と比べて前記腫瘍細胞表面上に提示される尤度が増大している新生抗原を選択することを含む
    (b)前記選択された新生抗原のセットを選択する工程が、前記機械学習させた提示モデルに基づいて、選択されない新生抗原と比べて前記対象において腫瘍特異的な免疫応答を誘導することができる尤度が増大している新生抗原を選択することを含む;
    (c)前記選択された新生抗原のセットを選択する工程が、前記提示モデルに基づいて、選択されない新生抗原と比べて、プロフェッショナル抗原提示細胞(APC)によってナイーブT細胞に対して提示されることができる尤度が増大している新生抗原を選択することを含み、任意で、前記APCが樹状細胞(DC)である;
    (d)前記選択された新生抗原のセットを選択する工程が、前記機械学習させた提示モデルに基づいて、選択されない新生抗原と比べて中枢性寛容もしくは末梢性寛容によって阻害される尤度が減少している新生抗原を選択することを含む;及び/または
    (e)前記選択された新生抗原のセットを選択する工程が、前記機械学習させた提示モデルに基づいて、選択されない新生抗原と比べて前記対象において正常組織に対する自己免疫応答を誘導することができる尤度が減少している新生抗原を選択することを含む、
    請求項1~のいずれか1項に記載の方法。
  9. 前記1つ以上の腫瘍細胞が、肺がん、メラノーマ、乳がん、卵巣がん、前立腺がん、腎臓がん、胃がん、結腸がん、精巣がん、頭頸部がん、膵臓がん、脳がん、B細胞リンパ腫、急性骨髄性白血病、慢性骨髄性白血病、慢性リンパ球性白血病、T細胞リンパ球性白血病、非小細胞肺がん、及び小細胞肺がんからなる群から選択される、請求項1~のいずれか1項に記載の方法。
  10. 前記選択された新生抗原のセットから個別化がんワクチンを構築するための出力を生成する工程をさらに含任意で、前記個別化がんワクチン用の出力が、前記選択された新生抗原のセットをコードした少なくとも1つのペプチド配列または少なくとも1つのヌクレオチド配列を含む、請求項1~9のいずれか1項に記載の方法。
  11. 前記機械学習させた提示モデルが、ニューラルネットワークモデルである、請求項1~10のいずれか1項に記載の方法。
  12. 前記ニューラルネットワークモデルが、1つ以上の層に配置された一連のノードを含む単一のニューラルネットワークモデルを含み、前記単一のニューラルネットワークモデルが、複数の異なるMHCアレルのペプチド配列をコード化した数値ベクトルを受信するように構成されており任意で、前記ニューラルネットワークモデルが、前記ニューラルネットワークモデルのパラメータを更新することによって訓練される、請求項11に記載の方法。
  13. 前記機械学習させた提示モデルが、1つ以上のノードの層を含むディープラーニングモデルである、請求項11または12に記載の方法。
  14. (a)少なくとも1つのMHCアレルの前記訓練ペプチド配列または前記訓練ペプチド配列に由来するデータが、前記新生抗原のセットの提示尤度のセットを生成するために、前記機械学習させた提示モデルに入力される、前記対象のMHCアレルのペプチド配列を含まない
    (b)前記訓練データセットの前記複数の試料の各試料の前記ペプチドに結合した前記少なくとも1つのMHCアレルが、前記対象の前記1つ以上のMHCアレルが属する遺伝子ファミリーに属する;
    (c)前記訓練データセットの前記複数の試料の各試料の前記ペプチドに結合した前記少なくとも1つのMHCアレルが、1個または複数のMHCアレルを含む;及び/または
    (d)前記1つ以上のMHCアレルが、クラスI MHCアレルである、
    請求項1~13のいずれか1項に記載の方法。
  15. コンピュータシステムであって、
    コンピュータプロセッサと、
    前記コンピュータプロセッサにより実行されると前記コンピュータプロセッサに、
    生抗原のセットのそれぞれのペプチド配列を表すデータを取させることと、
    記対象の前記1つ以上のMHCアレルのそれぞれのペプチド配列を表すデータを取得させることと、
    前記新生抗原のセットについて提示尤度のセットを機械学習させた提示モデルを使用して決定させることであって、前記セットの中の各提示尤度が、対応する新生抗原が前記1つ以上のMHCアレルによって前記対象の前記腫瘍細胞の表面上に提示される尤度を表し、前記機械学習させた提示モデルが、
    複数の試料の各試料について、前記試料中に存在するものとして特定されたMHCアレルのセットの中の少なくとも1つのMHCアレルに結合したペプチドの存在を測定する質量分析によって得られた標識と、
    前記試料のそれぞれについて、ペプチドの訓練ペプチド配列または前記訓練ペプチド配列に由来するデータと、
    前記試料のそれぞれについて、少なくとも1つのMHCアレル訓練ペプチド配列または前記訓練ペプチド配列に由来するデータと、
    を含む訓練データセットに少なくとも基づいて特定される、複数のパラメー
    を含む、前記決定させることと、
    選択された新生抗原のセットを生成するために、前記新生抗原のセットのサブセットを、前記提示尤度のセットに基づいて選択させることと、
    前記選択された新生抗原のセットを返させることと
    を行わせるコンピュータプログラム命令を格納したメモリと
    を含む、前記コンピュータシステム。
JP2020567466A 2018-02-27 2019-02-27 パンアレルモデルによる新生抗原の特定方法 Active JP7480064B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862636061P 2018-02-27 2018-02-27
US62/636,061 2018-02-27
PCT/US2019/019836 WO2019168984A1 (en) 2018-02-27 2019-02-27 Neoantigen identification with pan-allele models

Publications (3)

Publication Number Publication Date
JP2021514671A JP2021514671A (ja) 2021-06-17
JPWO2019168984A5 true JPWO2019168984A5 (ja) 2022-03-04
JP7480064B2 JP7480064B2 (ja) 2024-05-09

Family

ID=67806416

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020567466A Active JP7480064B2 (ja) 2018-02-27 2019-02-27 パンアレルモデルによる新生抗原の特定方法

Country Status (10)

Country Link
US (1) US20200411135A1 (ja)
EP (1) EP3759131A4 (ja)
JP (1) JP7480064B2 (ja)
KR (1) KR20200127001A (ja)
CN (1) CN111868080A (ja)
AU (1) AU2019227813B2 (ja)
CA (1) CA3091917A1 (ja)
IL (1) IL276839A (ja)
TW (1) TW202000693A (ja)
WO (1) WO2019168984A1 (ja)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014180490A1 (en) 2013-05-10 2014-11-13 Biontech Ag Predicting immunogenicity of t cell epitopes
WO2016128060A1 (en) 2015-02-12 2016-08-18 Biontech Ag Predicting t cell epitopes useful for vaccination
IL305238A (en) 2015-12-16 2023-10-01 Gritstone Bio Inc Identification of neoantigens, preparation, and use
WO2019075112A1 (en) 2017-10-10 2019-04-18 Gritstone Oncology, Inc. IDENTIFICATION OF NEO-ANTIGENS USING HOT POINTS
US11885815B2 (en) 2017-11-22 2024-01-30 Gritstone Bio, Inc. Reducing junction epitope presentation for neoantigens
US20220334129A1 (en) * 2019-09-13 2022-10-20 Evaxion Biotech A/S Method for identifying T-cell epitopes
WO2021091541A1 (en) * 2019-11-05 2021-05-14 Kri Technologies Incorporated Identifying cancer neoantigens for personalized cancer immunotherapy
CN114929899A (zh) * 2020-01-07 2022-08-19 韩国科学技术院 一种新抗原的筛选方法、系统及其用途
WO2021257879A1 (en) * 2020-06-18 2021-12-23 Personalis Inc. Machine-learning techniques for predicting surface-presenting peptides
CN111798919B (zh) * 2020-06-24 2022-11-25 上海交通大学 一种肿瘤新抗原预测方法、预测装置及存储介质
BR112023002724A2 (pt) * 2020-08-13 2023-05-02 Biontech Us Inc Neoantígenos ras e seus usos
CN112509641B (zh) * 2020-12-04 2022-04-08 河北环境工程学院 一种基于深度学习监测抗生素与金属联合产物的智能方法
CN113255690B (zh) * 2021-04-15 2022-04-12 南昌大学 一种基于轻量级卷积神经网络的复合绝缘子憎水性检测方法
EP4329780A1 (en) 2021-04-29 2024-03-06 Yeda Research and Development Co. Ltd T cell receptors directed against ras-derived recurrent neoantigens and methods of identifying same
CN113409888A (zh) * 2021-06-21 2021-09-17 中国科学院自动化研究所 一种肿瘤微环境及肿瘤基因突变检测系统、方法及设备
WO2023017768A1 (ja) * 2021-08-10 2023-02-16 日本電気株式会社 情報処理システム及び情報処理方法
CA3230568A1 (en) 2021-09-13 2023-03-16 Jean-Pol DETIFFE Method to generate a double-stranded dna pool encoding neoantigens of a tumor of a patient
EP4148146A1 (en) 2021-09-13 2023-03-15 OncoDNA Method to generate personalized neoantigens of a tumor of a patient
WO2023196966A1 (en) * 2022-04-08 2023-10-12 Gritstone Bio, Inc. Antigen predictions for infectious disease-derived epitopes
CN114821176B (zh) * 2022-04-28 2022-11-01 浙江大学 一种儿童脑部mr图像病毒性脑炎分类系统
WO2024015892A1 (en) * 2022-07-13 2024-01-18 The Broad Institute, Inc. Hla-ii immunopeptidome methods and systems for antigen discovery
WO2024036308A1 (en) * 2022-08-12 2024-02-15 Biontech Us Inc. Methods and systems for prediction of hla epitopes
CN116469457B (zh) * 2023-06-14 2023-10-13 普瑞基准科技(北京)有限公司 Mhc与抗原多肽结合、呈递及免疫原性的预测模型训练方法和装置
CN116453599B (zh) * 2023-06-19 2024-03-19 深圳大学 开放阅读框预测方法、设备及存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6931351B2 (en) * 2001-04-20 2005-08-16 International Business Machines Corporation Decision making in classification problems
ES2341802T3 (es) * 2005-09-05 2010-06-28 Immatics Biotechnologies Gmbh Peptidos asociados a tumores unidos promiscuamente a moleculas del antigeno de leucocito humano (hla) de clase ii.
HUE049886T2 (hu) * 2010-05-14 2020-10-28 Massachusetts Gen Hospital Tumorspecifikus neoantigéneket tartalmazó készítmények, tumorok kezelésében történõ alkalmazásra
WO2014180490A1 (en) * 2013-05-10 2014-11-13 Biontech Ag Predicting immunogenicity of t cell epitopes
CA2960834A1 (en) * 2014-09-10 2016-03-17 Genentech, Inc. Immunogenic mutant peptide screening platform
IL305238A (en) * 2015-12-16 2023-10-01 Gritstone Bio Inc Identification of neoantigens, preparation, and use

Similar Documents

Publication Publication Date Title
JP2020536553A5 (ja)
JP2020532323A5 (ja)
JPWO2019168984A5 (ja)
Zhao et al. Systematically benchmarking peptide-MHC binding predictors: From synthetic to naturally processed epitopes
JP2023134542A5 (ja)
Mei et al. A comprehensive review and performance evaluation of bioinformatics tools for HLA class I peptide-binding prediction
RU2019136762A (ru) Идентификация, производство и применение неоантигенов
JP7047115B2 (ja) Mhcペプチド結合予測のためのgan-cnn
US20220122690A1 (en) Attention-based neural network to predict peptide binding, presentation, and immunogenicity
JP2021503897A5 (ja)
Bravi et al. RBM-MHC: a semi-supervised machine-learning method for sample-specific prediction of antigen presentation by HLA-I alleles
JP2020518083A (ja) 免疫原性がん特異的エピトープのためのランク付けシステム
CN113424264A (zh) 用于生成个性化癌症疫苗的癌症突变选择
JPWO2020181240A5 (ja)
JP2023518725A (ja) ペプチド及びhla対立遺伝子配列を用いて新生抗原を予測する方法及びコンピュータプログラム
CN114929899A (zh) 一种新抗原的筛选方法、系统及其用途
Konstantinou T-cell epitope prediction
CN115747327A (zh) 涉及移码突变的新抗原预测方法
Albert et al. Deep neural networks predict class I major histocompatibility complex epitope presentation and transfer learn neoepitope immunogenicity
Dai et al. Machine learning optimization of peptides for presentation by class II MHCs
CN114882951A (zh) 基于二代测序数据检测mhc ii型肿瘤新生抗原的方法和装置
AU2019382854B2 (en) Method and system of targeting epitopes for neoantigen-based immunotherapy
Thrift et al. HLApollo: A superior transformer model for pan-allelic peptide-MHC-I presentation prediction, with diverse negative coverage, deconvolution and protein language features
US20240021274A1 (en) Using neural networks to predict peptide immunogenicity
Liu et al. A Deep Learning Approach for NeoAG-Specific Prediction Considering Both HLA-Peptide Binding and Immunogenicity: Finding Neoantigens to Making T-Cell Products More Personal