JPWO2019168984A5 - - Google Patents
Download PDFInfo
- Publication number
- JPWO2019168984A5 JPWO2019168984A5 JP2020567466A JP2020567466A JPWO2019168984A5 JP WO2019168984 A5 JPWO2019168984 A5 JP WO2019168984A5 JP 2020567466 A JP2020567466 A JP 2020567466A JP 2020567466 A JP2020567466 A JP 2020567466A JP WO2019168984 A5 JPWO2019168984 A5 JP WO2019168984A5
- Authority
- JP
- Japan
- Prior art keywords
- nascent
- mhc
- peptide sequence
- antigens
- allele
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 108700028369 Alleles Proteins 0.000 claims description 105
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 104
- 239000000427 antigen Substances 0.000 claims description 92
- 108091007433 antigens Proteins 0.000 claims description 92
- 102000036639 antigens Human genes 0.000 claims description 92
- 238000000034 method Methods 0.000 claims description 53
- 150000001413 amino acids Chemical class 0.000 claims description 22
- 210000004881 tumor cell Anatomy 0.000 claims description 17
- 239000002773 nucleotide Substances 0.000 claims description 14
- 125000003729 nucleotide group Chemical group 0.000 claims description 14
- 230000003993 interaction Effects 0.000 claims description 12
- 238000003062 neural network model Methods 0.000 claims description 12
- 210000004027 cell Anatomy 0.000 claims description 10
- 230000001613 neoplastic effect Effects 0.000 claims description 10
- 238000004949 mass spectrometry Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 6
- 108090000623 proteins and genes Proteins 0.000 claims description 6
- 210000000612 antigen-presenting cell Anatomy 0.000 claims description 4
- 229940022399 cancer vaccine Drugs 0.000 claims description 4
- 238000009566 cancer vaccine Methods 0.000 claims description 4
- 210000004443 dendritic cell Anatomy 0.000 claims description 4
- 238000005259 measurement Methods 0.000 claims description 4
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 4
- 102000004169 proteins and genes Human genes 0.000 claims description 4
- 210000001519 tissue Anatomy 0.000 claims description 4
- 210000001744 T-lymphocyte Anatomy 0.000 claims description 3
- 208000031261 Acute myeloid leukaemia Diseases 0.000 claims description 2
- 208000010839 B-cell chronic lymphocytic leukemia Diseases 0.000 claims description 2
- 208000003950 B-cell lymphoma Diseases 0.000 claims description 2
- 208000032791 BCR-ABL1 positive chronic myelogenous leukemia Diseases 0.000 claims description 2
- 208000003174 Brain Neoplasms Diseases 0.000 claims description 2
- 206010006187 Breast cancer Diseases 0.000 claims description 2
- 208000026310 Breast neoplasm Diseases 0.000 claims description 2
- 208000010833 Chronic myeloid leukaemia Diseases 0.000 claims description 2
- 206010009944 Colon cancer Diseases 0.000 claims description 2
- 102000008949 Histocompatibility Antigens Class I Human genes 0.000 claims description 2
- 108010088652 Histocompatibility Antigens Class I Proteins 0.000 claims description 2
- 208000008839 Kidney Neoplasms Diseases 0.000 claims description 2
- 206010058467 Lung neoplasm malignant Diseases 0.000 claims description 2
- 208000031422 Lymphocytic Chronic B-Cell Leukemia Diseases 0.000 claims description 2
- 208000033761 Myelogenous Chronic BCR-ABL Positive Leukemia Diseases 0.000 claims description 2
- 208000033776 Myeloid Acute Leukemia Diseases 0.000 claims description 2
- 206010028980 Neoplasm Diseases 0.000 claims description 2
- 206010033128 Ovarian cancer Diseases 0.000 claims description 2
- 206010061535 Ovarian neoplasm Diseases 0.000 claims description 2
- 206010061902 Pancreatic neoplasm Diseases 0.000 claims description 2
- 206010060862 Prostate cancer Diseases 0.000 claims description 2
- 208000000236 Prostatic Neoplasms Diseases 0.000 claims description 2
- 238000003559 RNA-seq method Methods 0.000 claims description 2
- 206010038389 Renal cancer Diseases 0.000 claims description 2
- 206010041067 Small cell lung cancer Diseases 0.000 claims description 2
- 208000005718 Stomach Neoplasms Diseases 0.000 claims description 2
- 208000000389 T-cell leukemia Diseases 0.000 claims description 2
- 208000024313 Testicular Neoplasms Diseases 0.000 claims description 2
- 206010057644 Testis cancer Diseases 0.000 claims description 2
- 230000000172 allergic effect Effects 0.000 claims description 2
- 208000010668 atopic eczema Diseases 0.000 claims description 2
- 230000006472 autoimmune response Effects 0.000 claims description 2
- 210000004899 c-terminal region Anatomy 0.000 claims description 2
- 208000032852 chronic lymphocytic leukemia Diseases 0.000 claims description 2
- 208000029742 colonic neoplasm Diseases 0.000 claims description 2
- 238000004590 computer program Methods 0.000 claims description 2
- 238000013136 deep learning model Methods 0.000 claims description 2
- 206010017758 gastric cancer Diseases 0.000 claims description 2
- 201000010536 head and neck cancer Diseases 0.000 claims description 2
- 208000014829 head and neck neoplasm Diseases 0.000 claims description 2
- 210000005260 human cell Anatomy 0.000 claims description 2
- 230000002452 interceptive effect Effects 0.000 claims description 2
- 201000010982 kidney cancer Diseases 0.000 claims description 2
- 201000005202 lung cancer Diseases 0.000 claims description 2
- 208000020816 lung neoplasm Diseases 0.000 claims description 2
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 claims description 2
- 201000001441 melanoma Diseases 0.000 claims description 2
- 208000002154 non-small cell lung carcinoma Diseases 0.000 claims description 2
- 201000002528 pancreatic cancer Diseases 0.000 claims description 2
- 208000008443 pancreatic carcinoma Diseases 0.000 claims description 2
- 230000002093 peripheral effect Effects 0.000 claims description 2
- 208000000587 small cell lung carcinoma Diseases 0.000 claims description 2
- 201000011549 stomach cancer Diseases 0.000 claims description 2
- 201000003120 testicular cancer Diseases 0.000 claims description 2
- 230000009466 transformation Effects 0.000 claims description 2
- 230000037455 tumor specific immune response Effects 0.000 claims description 2
- 208000029729 tumor suppressor gene on chromosome 11 Diseases 0.000 claims description 2
- 238000012163 sequencing technique Methods 0.000 description 12
- 230000008859 change Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 230000035876 healing Effects 0.000 description 1
- 238000009169 immunotherapy Methods 0.000 description 1
- 238000000126 in silico method Methods 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
Description
TIL新生エピトープデータセット及び予想される新生抗原反応性T細胞の特定タスクにおける本明細書に開示されるモデルの予測性能は、HLAのプロセシング及び提示をモデル化することによって、治療に有用な新生エピトープの予測を得ることが今や可能であることを示す。要約すると、この研究は、抗原標的化免疫療法のための実用的なインシリコの抗原特定を可能とすることにより、患者の治癒へ向けた進展を加速するものである。
[本発明1001]
1つ以上のMHCアレルによって腫瘍細胞の表面上に提示される可能性の高い、対象の1つ以上の腫瘍細胞に由来する少なくとも1つの新生抗原を特定するための方法であって、以下の工程:
前記対象の前記腫瘍細胞及び正常細胞からエクソーム、トランスクリプトーム、または全ゲノムのヌクレオチドシークエンシングデータのうちの少なくとも1つを取得する工程であって、前記ヌクレオチドシークエンシングデータは、前記腫瘍細胞からのヌクレオチドシークエンシングデータと前記正常細胞からのヌクレオチドシークエンシングデータとを比較することにより特定された新生抗原のセットのそれぞれのペプチド配列を表すデータを取得するために用いられ、各新生抗原のペプチド配列が、前記ペプチド配列を前記対象の前記正常細胞から特定される対応する野生型のペプチド配列とは異なるものとする少なくとも1つの変化を有する、前記取得する工程と、
前記新生抗原のそれぞれの前記ペプチド配列を、対応する数値ベクトルにコード化する工程であって、各数値ベクトルが、前記ペプチド配列を構成する複数のアミノ酸及び前記ペプチド配列内における前記アミノ酸の位置のセットに関する情報を含む、前記コード化する工程と、
前記対象の前記腫瘍細胞からエクソーム、トランスクリプトーム、または全ゲノムヌクレオチドシークエンシングデータのうちの少なくとも1つを取得する工程であって、前記ヌクレオチドシークエンシングデータが、前記対象の前記1つ以上のMHCアレルのそれぞれのペプチド配列を表すデータを取得するために用いられる、前記取得する工程と、
前記対象の前記1つ以上のMHCアレルのそれぞれの前記ペプチド配列を、対応する数値ベクトルにコード化する工程であって、各数値ベクトルが、前記ペプチド配列を構成する複数のアミノ酸及び前記ペプチド配列内における前記アミノ酸の位置のセットに関する情報を含む、前記コード化する工程と、
前記新生抗原のセットについて提示尤度のセットを生成するために、コンピュータプロセッサを使用して、前記新生抗原のそれぞれのペプチド配列をコード化した前記数値ベクトル及び前記1つ以上のMHCアレルのそれぞれのペプチド配列をコード化した前記数値ベクトルを、機械学習させた提示モデルに入力する工程であって、前記セットの中の各提示尤度が、対応する新生抗原が前記1つ以上のMHCアレルによって前記対象の前記腫瘍細胞の表面上に提示される尤度を表し、前記機械学習させた提示モデルが、
複数の試料の各試料について、前記試料中に存在するものとして特定されたMHCアレルのセットの中の少なくとも1つのMHCアレルに結合したペプチドの存在を測定する質量分析によって得られた標識、
前記試料のそれぞれについて、前記ペプチドを構成する複数のアミノ酸及び前記ペプチド内の前記アミノ酸の位置のセットに関する情報を含む数値ベクトルとしてコード化された訓練ペプチド配列、
前記試料のそれぞれについて、前記試料の前記ペプチドに結合した前記少なくとも1つのMHCアレルを構成する複数のアミノ酸及び前記少なくとも1つのMHCアレル内の前記アミノ酸の位置のセットに関する情報を含む数値ベクトルとしてコード化された訓練ペプチド配列
を含む訓練データセットに少なくとも基づいて特定される、複数のパラメータと、
入力として受信される、前記新生抗原のそれぞれの前記ペプチド配列をコード化した前記数値ベクトルと前記1つ以上のMHCアレルのそれぞれの前記ペプチド配列をコード化した前記数値ベクトルとの間の関係、ならびに前記数値ベクトル及び前記パラメータに基づいた出力として生成された提示尤度を表す、関数と
を含む、前記入力する工程と、
選択された新生抗原のセットを生成するために、前記新生抗原のセットのサブセットを、前記提示尤度のセットに基づいて選択する工程と、
前記選択された新生抗原のセットを返す工程と
を含む、前記方法。
[本発明1002]
前記新生抗原のそれぞれのペプチド配列をコード化した前記数値ベクトル及び前記1つ以上のMHCアレルのそれぞれのペプチド配列をコード化した前記数値ベクトルを、前記機械学習させた提示モデルに入力する前記工程が、
前記1つ以上のMHCアレルのそれぞれについて、前記ペプチド配列の前記特定の位置の前記特定のアミノ酸に基づいて前記MHCアレルが前記新生抗原を提示するかどうかを示す依存性スコアを生成するために、前記機械学習させた提示モデルを前記新生抗原の前記ペプチド配列及び前記1つ以上のMHCアレルの前記ペプチド配列に適用することを含む、本発明1001の方法。
[本発明1003]
前記新生抗原のそれぞれのペプチド配列をコード化した前記数値ベクトル及び前記1つ以上のMHCアレルのそれぞれのペプチド配列をコード化した前記数値ベクトルを、前記機械学習させた提示モデルに入力する前記工程が、
各MHCアレルについて、前記対応するMHCアレルが前記対応する新生抗原を提示する尤度を示す対応するアレルごと尤度を生成するために、前記依存性スコアを変換することと、
前記アレルごと尤度を組み合わせて前記新生抗原の前記提示尤度を生成することと
をさらに含む、本発明1002の方法。
[本発明1004]
前記依存性スコアを変換することが、前記新生抗原の提示を前記1つ以上のMHCアレルにわたって相互排他的なものとしてモデル化する、本発明1003の方法。
[本発明1005]
前記新生抗原のそれぞれのペプチド配列をコード化した前記数値ベクトル及び前記1つ以上のMHCアレルのそれぞれのペプチド配列をコード化した前記数値ベクトルを、前記機械学習させた提示モデルに入力する前記工程が、
前記提示尤度を生成するために、前記依存性スコアの組み合わせを変換することであって、前記依存性スコアの前記組み合わせを変換することが、前記新生抗原の提示を前記1つ以上のMHCアレル間で干渉するものとしてモデル化する、前記変換すること
をさらに含む、本発明1002の方法。
[本発明1006]
前記提示尤度のセットが、少なくとも1つ以上のアレル非相互作用特性によってさらに特定され、
前記アレル非相互作用特性についての依存性スコアを生成するために、前記機械学習させた提示モデルを前記アレル非相互作用特性に適用することにより、前記アレル非相互作用特性に基づいて、前記対応する新生抗原のペプチド配列が提示されるかどうかを示すことをさらに含む、本発明1002~1005のいずれかの方法。
[本発明1007]
前記1つ以上のMHCアレルの各MHCアレルについての前記依存性スコアを、前記アレル非相互作用特性についての前記依存性スコアと組み合わせることと、
各MHCアレルについてのアレルごと尤度を生成するために、各MHCアレルについての前記組み合わされた依存性スコアを変換することにより、前記対応するMHCアレルが前記対応する新生抗原を提示する尤度を示すことと、
前記提示尤度を生成するために、前記アレルごと尤度を組み合わせることと
をさらに含む、本発明1006の方法。
[本発明1008]
前記MHCアレルのそれぞれについての前記依存性スコアと、前記アレル非相互作用特性についての前記依存性スコアとを組み合わせることと、
前記提示尤度を生成するために、前記組み合わされた依存性スコアを変換することと
をさらに含む、本発明1006の方法。
[本発明1009]
前記1つ以上のMHCアレルが、2つ以上の異なるMHCアレルを含む、本発明1001~1008のいずれかの方法。
[本発明1010]
前記ペプチド配列が、アミノ酸9個の長さ以外の長さを有するペプチド配列を含む、本発明1001~1009のいずれかの方法。
[本発明1011]
前記ペプチド配列をコード化する工程が、ワン・ホットコード化スキームを用いて前記ペプチド配列をコード化することを含む、本発明1001~1010のいずれかの方法。
[本発明1012]
前記複数の試料が、
(a)単一のMHCアレルを発現するように操作された1つ以上の細胞株、
(b)複数のMHCアレルを発現するように操作された1つ以上の細胞株、
(c)複数の患者から得られた、または複数の患者に由来する1つ以上のヒト細胞株、
(d)複数の患者から得られた新鮮なまたは凍結された腫瘍試料、及び
(e)複数の患者から得られた新鮮なまたは凍結された組織試料
のうちの少なくとも1つを含む、本発明1001~1011のいずれかの方法。
[本発明1013]
前記訓練データセットが、
(a)前記ペプチドの少なくとも1つについてのペプチド-MHC結合親和性の測定値に関連するデータ、及び
(b)前記ペプチドの少なくとも1つについてのペプチド-MHC結合安定性の測定値に関連するデータ
のうちの少なくとも1つをさらに含む、本発明1001~1012のいずれかの方法。
[本発明1014]
前記提示尤度のセットが、
RNA-seqまたは質量分析により測定される、前記対象における前記1つ以上のMHCアレルの少なくとも発現レベル
によってさらに特定される、本発明1001~1013のいずれかの方法。
[本発明1015]
前記提示尤度のセットが、
(a)前記新生抗原のセット内の新生抗原と前記1つ以上のMHCアレルとの間の予測される親和性、及び
(b)前記新生抗原コード化ペプチド-MHC複合体の予測される安定性
のうちの少なくとも1つを含む特性によってさらに特定される、本発明1001~1014のいずれかの方法。
[本発明1016]
数値的尤度の前記セットが、
(a)そのソースタンパク質配列内の、前記新生抗原コード化ペプチド配列に隣接するC末端配列、及び
(b)そのソースタンパク質配列内の、前記新生抗原コード化ペプチド配列に隣接するN末端配列
のうちの少なくとも1つを含む特性によってさらに特定される、本発明1001~1015のいずれかの方法。
[本発明1017]
前記選択された新生抗原のセットを選択する工程が、前記機械学習させた提示モデルに基づいて、選択されない新生抗原と比べて前記腫瘍細胞表面上に提示される尤度が増大している新生抗原を選択することを含む、本発明1001~1016のいずれかの方法。
[本発明1018]
前記選択された新生抗原のセットを選択する工程が、前記機械学習させた提示モデルに基づいて、選択されない新生抗原と比べて前記対象において腫瘍特異的な免疫応答を誘導することができる尤度が増大している新生抗原を選択することを含む、本発明1001~1017のいずれかの方法。
[本発明1019]
前記選択された新生抗原のセットを選択する工程が、前記提示モデルに基づいて、選択されない新生抗原と比べて、プロフェッショナル抗原提示細胞(APC)によってナイーブT細胞に対して提示されることができる尤度が増大している新生抗原を選択することを含み、任意で、前記APCが樹状細胞(DC)である、本発明1001~1018のいずれかの方法。
[本発明1020]
前記選択された新生抗原のセットを選択する工程が、前記機械学習させた提示モデルに基づいて、選択されない新生抗原と比べて中枢性寛容または末梢性寛容によって阻害される尤度が減少している新生抗原を選択することを含む、本発明1001~1019のいずれかの方法。
[本発明1021]
前記選択された新生抗原のセットを選択する工程が、前記機械学習させた提示モデルに基づいて、選択されない新生抗原と比べて前記対象において正常組織に対する自己免疫応答を誘導することができる尤度が減少している新生抗原を選択することを含む、本発明1001~1020のいずれかの方法。
[本発明1022]
前記1つ以上の腫瘍細胞が、肺がん、メラノーマ、乳がん、卵巣がん、前立腺がん、腎臓がん、胃がん、結腸がん、精巣がん、頭頸部がん、膵臓がん、脳がん、B細胞リンパ腫、急性骨髄性白血病、慢性骨髄性白血病、慢性リンパ球性白血病、T細胞リンパ球性白血病、非小細胞肺がん、及び小細胞肺がんからなる群から選択される、本発明1001~1021のいずれかの方法。
[本発明1023]
前記選択された新生抗原のセットから個別化がんワクチンを構築するための出力を生成する工程をさらに含む、本発明1001~1022のいずれかの方法。
[本発明1024]
前記個別化がんワクチン用の出力が、前記選択された新生抗原のセットをコードした少なくとも1つのペプチド配列または少なくとも1つのヌクレオチド配列を含む、本発明1023の方法。
[本発明1025]
前記機械学習させた提示モデルが、ニューラルネットワークモデルである、本発明1001~1024のいずれかの方法。
[本発明1026]
前記ニューラルネットワークモデルが、1つ以上の層に配置された一連のノードを含む単一のニューラルネットワークモデルを含み、前記単一のニューラルネットワークモデルが、複数の異なるMHCアレルのペプチド配列をコード化した数値ベクトルを受信するように構成されている、本発明1025の方法。
[本発明1027]
前記ニューラルネットワークモデルが、前記ニューラルネットワークモデルのパラメータを更新することによって訓練される、本発明1026の方法。
[本発明1028]
前記機械学習させた提示モデルが、1つ以上のノードの層を含むディープラーニングモデルである、本発明1025~1027のいずれかの方法。
[本発明1029]
前記試料の前記ペプチドに結合した前記少なくとも1つのMHCアレルを構成する複数のアミノ酸及び前記少なくとも1つのMHCアレル内の前記アミノ酸の位置のセットに関する情報を含む数値ベクトルとしてコード化された前記訓練ペプチド配列が、前記新生抗原のセットの提示尤度のセットを生成するために、前記機械学習させた提示モデルに入力される、前記対象のMHCアレルのペプチド配列を含まない、本発明1001~1028のいずれかの方法。
[本発明1030]
前記訓練データセットの前記複数の試料の各試料の前記ペプチドに結合した前記少なくとも1つのMHCアレルが、前記対象の前記1つ以上のMHCアレルが属する遺伝子ファミリーに属する、本発明1001~1029のいずれかの方法。
[本発明1031]
前記訓練データセットの前記複数の試料の各試料の前記ペプチドに結合した前記少なくとも1つのMHCアレルが、1個のMHCアレルを含む、本発明1001~1030のいずれかの方法。
[本発明1032]
前記訓練データセットの前記複数の試料の各試料の前記ペプチドに結合した前記少なくとも1つのMHCアレルが、複数のMHCアレルを含む、本発明1001~1030のいずれかの方法。
[本発明1033]
前記1つ以上のMHCアレルが、クラスI MHCアレルである、本発明1001~1032のいずれかの方法。
[本発明1034]
コンピュータシステムであって、
コンピュータプロセッサと、
前記コンピュータプロセッサにより実行されると前記コンピュータプロセッサに、
前記対象の前記腫瘍細胞及び正常細胞からエクソーム、トランスクリプトーム、または全ゲノムのヌクレオチドシークエンシングデータのうちの少なくとも1つを取得させることであって、前記ヌクレオチドシークエンシングデータが、前記腫瘍細胞からのヌクレオチドシークエンシングデータと前記正常細胞からのヌクレオチドシークエンシングデータとを比較することにより特定された新生抗原のセットのそれぞれのペプチド配列を表すデータを取得するために用いられ、各新生抗原のペプチド配列が、前記ペプチド配列を前記対象の前記正常細胞から特定される対応する野生型のペプチド配列とは異なるものとする少なくとも1つの変化を含む、前記取得させることと、
前記新生抗原のそれぞれの前記ペプチド配列を、対応する数値ベクトルにコード化させることであって、各数値ベクトルが、前記ペプチド配列を構成する複数のアミノ酸及び前記ペプチド配列内における前記アミノ酸の位置のセットに関する情報を含む、前記コード化させることと、
前記対象の前記1つ以上のMHCアレルのそれぞれからエクソーム、トランスクリプトーム、または全ゲノムヌクレオチドシークエンシングデータのうちの少なくとも1つを取得させることであって、前記ヌクレオチドシークエンシングデータが、前記対象の前記1つ以上のMHCアレルのそれぞれのペプチド配列を表すデータを取得するために用いられる、前記取得させることと、
前記対象の前記1つ以上のMHCアレルのそれぞれの前記ペプチド配列を、対応する数値ベクトルにコード化させることであって、各数値ベクトルが、前記ペプチド配列を構成する複数のアミノ酸及び前記ペプチド配列内における前記アミノ酸の位置のセットに関する情報を含む、前記コード化させることと、
前記新生抗原のセットについて提示尤度のセットを生成するために、コンピュータプロセッサを使用して、前記新生抗原のそれぞれのペプチド配列をコード化した前記数値ベクトル及び前記1つ以上のMHCアレルのそれぞれのペプチド配列をコード化した前記数値ベクトルを、機械学習させた提示モデルに入力させることであって、前記セットの中の各提示尤度が、対応する新生抗原が前記1つ以上のMHCアレルによって前記対象の前記腫瘍細胞の表面上に提示される尤度を表し、前記機械学習させた提示モデルが、
複数の試料の各試料について、前記試料中に存在するものとして特定されたMHCアレルのセットの中の少なくとも1つのMHCアレルに結合したペプチドの存在を測定する質量分析によって得られた標識と、
前記試料のそれぞれについて、前記ペプチドを構成する複数のアミノ酸及び前記ペプチド内の前記アミノ酸の位置のセットに関する情報を含む数値ベクトルとしてコード化された訓練ペプチド配列と、
前記試料のそれぞれについて、前記試料の前記ペプチドに結合した前記少なくとも1つのMHCアレルを構成する複数のアミノ酸及び前記少なくとも1つのMHCアレル内の前記アミノ酸の位置のセットに関する情報を含む数値ベクトルとしてコード化された訓練ペプチド配列と、
を含む訓練データセットに少なくとも基づいて特定される、複数のパラメータと、
入力として受信される前記新生抗原のそれぞれの前記ペプチド配列をコード化した前記数値ベクトルと前記1つ以上のMHCアレルのそれぞれの前記ペプチド配列をコード化した前記数値ベクトルとの間の関係、ならびに前記数値ベクトル及び前記パラメータに基づいた出力として生成された提示尤度を表す、関数と
を含む、前記入力させることと、
選択された新生抗原のセットを生成するために、前記新生抗原のセットのサブセットを、前記提示尤度のセットに基づいて選択させることと、
前記選択された新生抗原のセットを返させることと
を行わせるコンピュータプログラム命令を格納したメモリと
を含む、前記コンピュータシステム。
[本発明1001]
1つ以上のMHCアレルによって腫瘍細胞の表面上に提示される可能性の高い、対象の1つ以上の腫瘍細胞に由来する少なくとも1つの新生抗原を特定するための方法であって、以下の工程:
前記対象の前記腫瘍細胞及び正常細胞からエクソーム、トランスクリプトーム、または全ゲノムのヌクレオチドシークエンシングデータのうちの少なくとも1つを取得する工程であって、前記ヌクレオチドシークエンシングデータは、前記腫瘍細胞からのヌクレオチドシークエンシングデータと前記正常細胞からのヌクレオチドシークエンシングデータとを比較することにより特定された新生抗原のセットのそれぞれのペプチド配列を表すデータを取得するために用いられ、各新生抗原のペプチド配列が、前記ペプチド配列を前記対象の前記正常細胞から特定される対応する野生型のペプチド配列とは異なるものとする少なくとも1つの変化を有する、前記取得する工程と、
前記新生抗原のそれぞれの前記ペプチド配列を、対応する数値ベクトルにコード化する工程であって、各数値ベクトルが、前記ペプチド配列を構成する複数のアミノ酸及び前記ペプチド配列内における前記アミノ酸の位置のセットに関する情報を含む、前記コード化する工程と、
前記対象の前記腫瘍細胞からエクソーム、トランスクリプトーム、または全ゲノムヌクレオチドシークエンシングデータのうちの少なくとも1つを取得する工程であって、前記ヌクレオチドシークエンシングデータが、前記対象の前記1つ以上のMHCアレルのそれぞれのペプチド配列を表すデータを取得するために用いられる、前記取得する工程と、
前記対象の前記1つ以上のMHCアレルのそれぞれの前記ペプチド配列を、対応する数値ベクトルにコード化する工程であって、各数値ベクトルが、前記ペプチド配列を構成する複数のアミノ酸及び前記ペプチド配列内における前記アミノ酸の位置のセットに関する情報を含む、前記コード化する工程と、
前記新生抗原のセットについて提示尤度のセットを生成するために、コンピュータプロセッサを使用して、前記新生抗原のそれぞれのペプチド配列をコード化した前記数値ベクトル及び前記1つ以上のMHCアレルのそれぞれのペプチド配列をコード化した前記数値ベクトルを、機械学習させた提示モデルに入力する工程であって、前記セットの中の各提示尤度が、対応する新生抗原が前記1つ以上のMHCアレルによって前記対象の前記腫瘍細胞の表面上に提示される尤度を表し、前記機械学習させた提示モデルが、
複数の試料の各試料について、前記試料中に存在するものとして特定されたMHCアレルのセットの中の少なくとも1つのMHCアレルに結合したペプチドの存在を測定する質量分析によって得られた標識、
前記試料のそれぞれについて、前記ペプチドを構成する複数のアミノ酸及び前記ペプチド内の前記アミノ酸の位置のセットに関する情報を含む数値ベクトルとしてコード化された訓練ペプチド配列、
前記試料のそれぞれについて、前記試料の前記ペプチドに結合した前記少なくとも1つのMHCアレルを構成する複数のアミノ酸及び前記少なくとも1つのMHCアレル内の前記アミノ酸の位置のセットに関する情報を含む数値ベクトルとしてコード化された訓練ペプチド配列
を含む訓練データセットに少なくとも基づいて特定される、複数のパラメータと、
入力として受信される、前記新生抗原のそれぞれの前記ペプチド配列をコード化した前記数値ベクトルと前記1つ以上のMHCアレルのそれぞれの前記ペプチド配列をコード化した前記数値ベクトルとの間の関係、ならびに前記数値ベクトル及び前記パラメータに基づいた出力として生成された提示尤度を表す、関数と
を含む、前記入力する工程と、
選択された新生抗原のセットを生成するために、前記新生抗原のセットのサブセットを、前記提示尤度のセットに基づいて選択する工程と、
前記選択された新生抗原のセットを返す工程と
を含む、前記方法。
[本発明1002]
前記新生抗原のそれぞれのペプチド配列をコード化した前記数値ベクトル及び前記1つ以上のMHCアレルのそれぞれのペプチド配列をコード化した前記数値ベクトルを、前記機械学習させた提示モデルに入力する前記工程が、
前記1つ以上のMHCアレルのそれぞれについて、前記ペプチド配列の前記特定の位置の前記特定のアミノ酸に基づいて前記MHCアレルが前記新生抗原を提示するかどうかを示す依存性スコアを生成するために、前記機械学習させた提示モデルを前記新生抗原の前記ペプチド配列及び前記1つ以上のMHCアレルの前記ペプチド配列に適用することを含む、本発明1001の方法。
[本発明1003]
前記新生抗原のそれぞれのペプチド配列をコード化した前記数値ベクトル及び前記1つ以上のMHCアレルのそれぞれのペプチド配列をコード化した前記数値ベクトルを、前記機械学習させた提示モデルに入力する前記工程が、
各MHCアレルについて、前記対応するMHCアレルが前記対応する新生抗原を提示する尤度を示す対応するアレルごと尤度を生成するために、前記依存性スコアを変換することと、
前記アレルごと尤度を組み合わせて前記新生抗原の前記提示尤度を生成することと
をさらに含む、本発明1002の方法。
[本発明1004]
前記依存性スコアを変換することが、前記新生抗原の提示を前記1つ以上のMHCアレルにわたって相互排他的なものとしてモデル化する、本発明1003の方法。
[本発明1005]
前記新生抗原のそれぞれのペプチド配列をコード化した前記数値ベクトル及び前記1つ以上のMHCアレルのそれぞれのペプチド配列をコード化した前記数値ベクトルを、前記機械学習させた提示モデルに入力する前記工程が、
前記提示尤度を生成するために、前記依存性スコアの組み合わせを変換することであって、前記依存性スコアの前記組み合わせを変換することが、前記新生抗原の提示を前記1つ以上のMHCアレル間で干渉するものとしてモデル化する、前記変換すること
をさらに含む、本発明1002の方法。
[本発明1006]
前記提示尤度のセットが、少なくとも1つ以上のアレル非相互作用特性によってさらに特定され、
前記アレル非相互作用特性についての依存性スコアを生成するために、前記機械学習させた提示モデルを前記アレル非相互作用特性に適用することにより、前記アレル非相互作用特性に基づいて、前記対応する新生抗原のペプチド配列が提示されるかどうかを示すことをさらに含む、本発明1002~1005のいずれかの方法。
[本発明1007]
前記1つ以上のMHCアレルの各MHCアレルについての前記依存性スコアを、前記アレル非相互作用特性についての前記依存性スコアと組み合わせることと、
各MHCアレルについてのアレルごと尤度を生成するために、各MHCアレルについての前記組み合わされた依存性スコアを変換することにより、前記対応するMHCアレルが前記対応する新生抗原を提示する尤度を示すことと、
前記提示尤度を生成するために、前記アレルごと尤度を組み合わせることと
をさらに含む、本発明1006の方法。
[本発明1008]
前記MHCアレルのそれぞれについての前記依存性スコアと、前記アレル非相互作用特性についての前記依存性スコアとを組み合わせることと、
前記提示尤度を生成するために、前記組み合わされた依存性スコアを変換することと
をさらに含む、本発明1006の方法。
[本発明1009]
前記1つ以上のMHCアレルが、2つ以上の異なるMHCアレルを含む、本発明1001~1008のいずれかの方法。
[本発明1010]
前記ペプチド配列が、アミノ酸9個の長さ以外の長さを有するペプチド配列を含む、本発明1001~1009のいずれかの方法。
[本発明1011]
前記ペプチド配列をコード化する工程が、ワン・ホットコード化スキームを用いて前記ペプチド配列をコード化することを含む、本発明1001~1010のいずれかの方法。
[本発明1012]
前記複数の試料が、
(a)単一のMHCアレルを発現するように操作された1つ以上の細胞株、
(b)複数のMHCアレルを発現するように操作された1つ以上の細胞株、
(c)複数の患者から得られた、または複数の患者に由来する1つ以上のヒト細胞株、
(d)複数の患者から得られた新鮮なまたは凍結された腫瘍試料、及び
(e)複数の患者から得られた新鮮なまたは凍結された組織試料
のうちの少なくとも1つを含む、本発明1001~1011のいずれかの方法。
[本発明1013]
前記訓練データセットが、
(a)前記ペプチドの少なくとも1つについてのペプチド-MHC結合親和性の測定値に関連するデータ、及び
(b)前記ペプチドの少なくとも1つについてのペプチド-MHC結合安定性の測定値に関連するデータ
のうちの少なくとも1つをさらに含む、本発明1001~1012のいずれかの方法。
[本発明1014]
前記提示尤度のセットが、
RNA-seqまたは質量分析により測定される、前記対象における前記1つ以上のMHCアレルの少なくとも発現レベル
によってさらに特定される、本発明1001~1013のいずれかの方法。
[本発明1015]
前記提示尤度のセットが、
(a)前記新生抗原のセット内の新生抗原と前記1つ以上のMHCアレルとの間の予測される親和性、及び
(b)前記新生抗原コード化ペプチド-MHC複合体の予測される安定性
のうちの少なくとも1つを含む特性によってさらに特定される、本発明1001~1014のいずれかの方法。
[本発明1016]
数値的尤度の前記セットが、
(a)そのソースタンパク質配列内の、前記新生抗原コード化ペプチド配列に隣接するC末端配列、及び
(b)そのソースタンパク質配列内の、前記新生抗原コード化ペプチド配列に隣接するN末端配列
のうちの少なくとも1つを含む特性によってさらに特定される、本発明1001~1015のいずれかの方法。
[本発明1017]
前記選択された新生抗原のセットを選択する工程が、前記機械学習させた提示モデルに基づいて、選択されない新生抗原と比べて前記腫瘍細胞表面上に提示される尤度が増大している新生抗原を選択することを含む、本発明1001~1016のいずれかの方法。
[本発明1018]
前記選択された新生抗原のセットを選択する工程が、前記機械学習させた提示モデルに基づいて、選択されない新生抗原と比べて前記対象において腫瘍特異的な免疫応答を誘導することができる尤度が増大している新生抗原を選択することを含む、本発明1001~1017のいずれかの方法。
[本発明1019]
前記選択された新生抗原のセットを選択する工程が、前記提示モデルに基づいて、選択されない新生抗原と比べて、プロフェッショナル抗原提示細胞(APC)によってナイーブT細胞に対して提示されることができる尤度が増大している新生抗原を選択することを含み、任意で、前記APCが樹状細胞(DC)である、本発明1001~1018のいずれかの方法。
[本発明1020]
前記選択された新生抗原のセットを選択する工程が、前記機械学習させた提示モデルに基づいて、選択されない新生抗原と比べて中枢性寛容または末梢性寛容によって阻害される尤度が減少している新生抗原を選択することを含む、本発明1001~1019のいずれかの方法。
[本発明1021]
前記選択された新生抗原のセットを選択する工程が、前記機械学習させた提示モデルに基づいて、選択されない新生抗原と比べて前記対象において正常組織に対する自己免疫応答を誘導することができる尤度が減少している新生抗原を選択することを含む、本発明1001~1020のいずれかの方法。
[本発明1022]
前記1つ以上の腫瘍細胞が、肺がん、メラノーマ、乳がん、卵巣がん、前立腺がん、腎臓がん、胃がん、結腸がん、精巣がん、頭頸部がん、膵臓がん、脳がん、B細胞リンパ腫、急性骨髄性白血病、慢性骨髄性白血病、慢性リンパ球性白血病、T細胞リンパ球性白血病、非小細胞肺がん、及び小細胞肺がんからなる群から選択される、本発明1001~1021のいずれかの方法。
[本発明1023]
前記選択された新生抗原のセットから個別化がんワクチンを構築するための出力を生成する工程をさらに含む、本発明1001~1022のいずれかの方法。
[本発明1024]
前記個別化がんワクチン用の出力が、前記選択された新生抗原のセットをコードした少なくとも1つのペプチド配列または少なくとも1つのヌクレオチド配列を含む、本発明1023の方法。
[本発明1025]
前記機械学習させた提示モデルが、ニューラルネットワークモデルである、本発明1001~1024のいずれかの方法。
[本発明1026]
前記ニューラルネットワークモデルが、1つ以上の層に配置された一連のノードを含む単一のニューラルネットワークモデルを含み、前記単一のニューラルネットワークモデルが、複数の異なるMHCアレルのペプチド配列をコード化した数値ベクトルを受信するように構成されている、本発明1025の方法。
[本発明1027]
前記ニューラルネットワークモデルが、前記ニューラルネットワークモデルのパラメータを更新することによって訓練される、本発明1026の方法。
[本発明1028]
前記機械学習させた提示モデルが、1つ以上のノードの層を含むディープラーニングモデルである、本発明1025~1027のいずれかの方法。
[本発明1029]
前記試料の前記ペプチドに結合した前記少なくとも1つのMHCアレルを構成する複数のアミノ酸及び前記少なくとも1つのMHCアレル内の前記アミノ酸の位置のセットに関する情報を含む数値ベクトルとしてコード化された前記訓練ペプチド配列が、前記新生抗原のセットの提示尤度のセットを生成するために、前記機械学習させた提示モデルに入力される、前記対象のMHCアレルのペプチド配列を含まない、本発明1001~1028のいずれかの方法。
[本発明1030]
前記訓練データセットの前記複数の試料の各試料の前記ペプチドに結合した前記少なくとも1つのMHCアレルが、前記対象の前記1つ以上のMHCアレルが属する遺伝子ファミリーに属する、本発明1001~1029のいずれかの方法。
[本発明1031]
前記訓練データセットの前記複数の試料の各試料の前記ペプチドに結合した前記少なくとも1つのMHCアレルが、1個のMHCアレルを含む、本発明1001~1030のいずれかの方法。
[本発明1032]
前記訓練データセットの前記複数の試料の各試料の前記ペプチドに結合した前記少なくとも1つのMHCアレルが、複数のMHCアレルを含む、本発明1001~1030のいずれかの方法。
[本発明1033]
前記1つ以上のMHCアレルが、クラスI MHCアレルである、本発明1001~1032のいずれかの方法。
[本発明1034]
コンピュータシステムであって、
コンピュータプロセッサと、
前記コンピュータプロセッサにより実行されると前記コンピュータプロセッサに、
前記対象の前記腫瘍細胞及び正常細胞からエクソーム、トランスクリプトーム、または全ゲノムのヌクレオチドシークエンシングデータのうちの少なくとも1つを取得させることであって、前記ヌクレオチドシークエンシングデータが、前記腫瘍細胞からのヌクレオチドシークエンシングデータと前記正常細胞からのヌクレオチドシークエンシングデータとを比較することにより特定された新生抗原のセットのそれぞれのペプチド配列を表すデータを取得するために用いられ、各新生抗原のペプチド配列が、前記ペプチド配列を前記対象の前記正常細胞から特定される対応する野生型のペプチド配列とは異なるものとする少なくとも1つの変化を含む、前記取得させることと、
前記新生抗原のそれぞれの前記ペプチド配列を、対応する数値ベクトルにコード化させることであって、各数値ベクトルが、前記ペプチド配列を構成する複数のアミノ酸及び前記ペプチド配列内における前記アミノ酸の位置のセットに関する情報を含む、前記コード化させることと、
前記対象の前記1つ以上のMHCアレルのそれぞれからエクソーム、トランスクリプトーム、または全ゲノムヌクレオチドシークエンシングデータのうちの少なくとも1つを取得させることであって、前記ヌクレオチドシークエンシングデータが、前記対象の前記1つ以上のMHCアレルのそれぞれのペプチド配列を表すデータを取得するために用いられる、前記取得させることと、
前記対象の前記1つ以上のMHCアレルのそれぞれの前記ペプチド配列を、対応する数値ベクトルにコード化させることであって、各数値ベクトルが、前記ペプチド配列を構成する複数のアミノ酸及び前記ペプチド配列内における前記アミノ酸の位置のセットに関する情報を含む、前記コード化させることと、
前記新生抗原のセットについて提示尤度のセットを生成するために、コンピュータプロセッサを使用して、前記新生抗原のそれぞれのペプチド配列をコード化した前記数値ベクトル及び前記1つ以上のMHCアレルのそれぞれのペプチド配列をコード化した前記数値ベクトルを、機械学習させた提示モデルに入力させることであって、前記セットの中の各提示尤度が、対応する新生抗原が前記1つ以上のMHCアレルによって前記対象の前記腫瘍細胞の表面上に提示される尤度を表し、前記機械学習させた提示モデルが、
複数の試料の各試料について、前記試料中に存在するものとして特定されたMHCアレルのセットの中の少なくとも1つのMHCアレルに結合したペプチドの存在を測定する質量分析によって得られた標識と、
前記試料のそれぞれについて、前記ペプチドを構成する複数のアミノ酸及び前記ペプチド内の前記アミノ酸の位置のセットに関する情報を含む数値ベクトルとしてコード化された訓練ペプチド配列と、
前記試料のそれぞれについて、前記試料の前記ペプチドに結合した前記少なくとも1つのMHCアレルを構成する複数のアミノ酸及び前記少なくとも1つのMHCアレル内の前記アミノ酸の位置のセットに関する情報を含む数値ベクトルとしてコード化された訓練ペプチド配列と、
を含む訓練データセットに少なくとも基づいて特定される、複数のパラメータと、
入力として受信される前記新生抗原のそれぞれの前記ペプチド配列をコード化した前記数値ベクトルと前記1つ以上のMHCアレルのそれぞれの前記ペプチド配列をコード化した前記数値ベクトルとの間の関係、ならびに前記数値ベクトル及び前記パラメータに基づいた出力として生成された提示尤度を表す、関数と
を含む、前記入力させることと、
選択された新生抗原のセットを生成するために、前記新生抗原のセットのサブセットを、前記提示尤度のセットに基づいて選択させることと、
前記選択された新生抗原のセットを返させることと
を行わせるコンピュータプログラム命令を格納したメモリと
を含む、前記コンピュータシステム。
Claims (15)
- 1つ以上のMHCアレルによって腫瘍細胞の表面上に提示される可能性の高い、対象の1つ以上の腫瘍細胞に由来する少なくとも1つの新生抗原を特定するための方法であって、以下の工程:
新生抗原のセットのそれぞれのペプチド配列を表すデータを取得する工程と、
前記対象の前記1つ以上のMHCアレルのそれぞれのペプチド配列を表すデータを取得する工程と、
前記新生抗原のセットについて提示尤度のセットを、機械学習させた提示モデルを使用して決定する工程であって、前記セットの中の各提示尤度が、対応する新生抗原が前記1つ以上のMHCアレルによって前記対象の前記腫瘍細胞の表面上に提示される尤度を表し、前記機械学習させた提示モデルが、
複数の試料の各試料について、前記試料中に存在するものとして特定されたMHCアレルのセットの中の少なくとも1つのMHCアレルに結合したペプチドの存在を測定する質量分析によって得られた標識、
前記試料のそれぞれについて、ペプチドの訓練ペプチド配列または前記訓練ペプチド配列に由来するデータ、及び
前記試料のそれぞれについて、少なくとも1つのMHCアレルの訓練ペプチド配列または前記訓練ペプチド配列に由来するデータ
を含む訓練データセットに少なくとも基づいて特定される、複数のパラメータ
を含む、前記決定する工程と、
選択された新生抗原のセットを生成するために、前記新生抗原のセットのサブセットを、前記提示尤度のセットに基づいて選択する工程と、
前記選択された新生抗原のセットを返す工程と
を含む、前記方法。 - 前記機械学習させた提示モデルを使用して決定する前記工程が、
前記1つ以上のMHCアレルのそれぞれについて、前記ペプチド配列の前記特定の位置の前記特定のアミノ酸に基づいて前記MHCアレルが前記新生抗原を提示するかどうかを示す依存性スコアを生成するために、前記機械学習させた提示モデルを前記新生抗原の前記ペプチド配列及び前記1つ以上のMHCアレルの前記ペプチド配列に適用することを含む、請求項1に記載の方法。 - 前記機械学習させた提示モデルを使用して決定する前記工程が、
(a)各MHCアレルについて、前記対応するMHCアレルが前記対応する新生抗原を提示する尤度を示す対応するアレルごと尤度を生成するために、前記依存性スコアを変換することと、
前記アレルごと尤度を組み合わせて前記新生抗原の前記提示尤度を生成することと
をさらに含み、任意で、前記依存性スコアを変換することが、前記新生抗原の提示を前記1つ以上のMHCアレルにわたって相互排他的なものとしてモデル化する、または
(b)前記提示尤度を生成するために、前記依存性スコアの組み合わせを変換することであって、前記依存性スコアの前記組み合わせを変換することが、前記新生抗原の提示を前記1つ以上のMHCアレル間で干渉するものとしてモデル化する、前記変換すること
をさらに含む、
請求項2に記載の方法。 - 前記提示尤度のセットが、少なくとも1つ以上のアレル非相互作用特性によってさらに特定され、
前記アレル非相互作用特性についての依存性スコアを生成するために、前記機械学習させた提示モデルを前記アレル非相互作用特性に適用することにより、前記アレル非相互作用特性に基づいて、前記対応する新生抗原のペプチド配列が提示されるかどうかを示すことをさらに含む、請求項2または3に記載の方法。 - (a)
前記1つ以上のMHCアレルの各MHCアレルについての前記依存性スコアを、前記アレル非相互作用特性についての前記依存性スコアと組み合わせることと、
各MHCアレルについて、前記対応するMHCアレルが前記対応する新生抗原を提示する尤度を示すアレルごと尤度を生成するために、各MHCアレルについての前記組み合わされた依存性スコアを変換することと、
前記提示尤度を生成するために、前記アレルごと尤度を組み合わせることと
をさらに含む、または
(b)
前記MHCアレルのそれぞれについての前記依存性スコアと、前記アレル非相互作用特性についての前記依存性スコアとを組み合わせることと、
前記提示尤度を生成するために、前記組み合わされた依存性スコアを変換することと
をさらに含む、
請求項4に記載の方法。 - (a)前記1つ以上のMHCアレルが、2つ以上の異なるMHCアレルを含む;
(b)前記ペプチド配列が、アミノ酸9個の長さ以外の長さを有するペプチド配列を含む;
(c)前記ペプチド配列をコード化する工程が、ワン・ホットコード化スキームを用いて前記ペプチド配列をコード化することを含む;
(d)前記複数の試料が、
(i)単一のMHCアレルを発現するように操作された1つ以上の細胞株、
(ii)複数のMHCアレルを発現するように操作された1つ以上の細胞株、
(iii)複数の患者から得られた、または複数の患者に由来する1つ以上のヒト細胞株、
(iv)複数の患者から得られた新鮮なまたは凍結された腫瘍試料、及び
(v)複数の患者から得られた新鮮なまたは凍結された組織試料
のうちの少なくとも1つを含む;
(e)前記訓練データセットが、
(i)前記ペプチドの少なくとも1つについてのペプチド-MHC結合親和性の測定値に関連するデータ、及び
(ii)前記ペプチドの少なくとも1つについてのペプチド-MHC結合安定性の測定値に関連するデータ
のうちの少なくとも1つをさらに含む;並びに/あるいは
(f)前記提示尤度のセットが、
RNA-seqまたは質量分析により測定される、前記対象における前記1つ以上のMHCアレルの少なくとも発現レベル
によってさらに特定される、
請求項1~5のいずれか1項に記載の方法。 - (a)前記提示尤度のセットが、
(i)前記新生抗原のセット内の新生抗原と前記1つ以上のMHCアレルとの間の予測される親和性、及び
(ii)前記新生抗原コード化ペプチド-MHC複合体の予測される安定性
のうちの少なくとも1つを含む特性によってさらに特定される;並びに/または
(b)数値的尤度の前記セットが、
(i)そのソースタンパク質配列内の、前記新生抗原コード化ペプチド配列に隣接するC末端配列、及び
(ii)そのソースタンパク質配列内の、前記新生抗原コード化ペプチド配列に隣接するN末端配列
のうちの少なくとも1つを含む特性によってさらに特定される、
請求項1~6のいずれか1項に記載の方法。 - (a)前記選択された新生抗原のセットを選択する工程が、前記機械学習させた提示モデルに基づいて、選択されない新生抗原と比べて前記腫瘍細胞表面上に提示される尤度が増大している新生抗原を選択することを含む;
(b)前記選択された新生抗原のセットを選択する工程が、前記機械学習させた提示モデルに基づいて、選択されない新生抗原と比べて前記対象において腫瘍特異的な免疫応答を誘導することができる尤度が増大している新生抗原を選択することを含む;
(c)前記選択された新生抗原のセットを選択する工程が、前記提示モデルに基づいて、選択されない新生抗原と比べて、プロフェッショナル抗原提示細胞(APC)によってナイーブT細胞に対して提示されることができる尤度が増大している新生抗原を選択することを含み、任意で、前記APCが樹状細胞(DC)である;
(d)前記選択された新生抗原のセットを選択する工程が、前記機械学習させた提示モデルに基づいて、選択されない新生抗原と比べて中枢性寛容もしくは末梢性寛容によって阻害される尤度が減少している新生抗原を選択することを含む;及び/または
(e)前記選択された新生抗原のセットを選択する工程が、前記機械学習させた提示モデルに基づいて、選択されない新生抗原と比べて前記対象において正常組織に対する自己免疫応答を誘導することができる尤度が減少している新生抗原を選択することを含む、
請求項1~7のいずれか1項に記載の方法。 - 前記1つ以上の腫瘍細胞が、肺がん、メラノーマ、乳がん、卵巣がん、前立腺がん、腎臓がん、胃がん、結腸がん、精巣がん、頭頸部がん、膵臓がん、脳がん、B細胞リンパ腫、急性骨髄性白血病、慢性骨髄性白血病、慢性リンパ球性白血病、T細胞リンパ球性白血病、非小細胞肺がん、及び小細胞肺がんからなる群から選択される、請求項1~8のいずれか1項に記載の方法。
- 前記選択された新生抗原のセットから個別化がんワクチンを構築するための出力を生成する工程をさらに含み、任意で、前記個別化がんワクチン用の出力が、前記選択された新生抗原のセットをコードした少なくとも1つのペプチド配列または少なくとも1つのヌクレオチド配列を含む、請求項1~9のいずれか1項に記載の方法。
- 前記機械学習させた提示モデルが、ニューラルネットワークモデルである、請求項1~10のいずれか1項に記載の方法。
- 前記ニューラルネットワークモデルが、1つ以上の層に配置された一連のノードを含む単一のニューラルネットワークモデルを含み、前記単一のニューラルネットワークモデルが、複数の異なるMHCアレルのペプチド配列をコード化した数値ベクトルを受信するように構成されており、任意で、前記ニューラルネットワークモデルが、前記ニューラルネットワークモデルのパラメータを更新することによって訓練される、請求項11に記載の方法。
- 前記機械学習させた提示モデルが、1つ以上のノードの層を含むディープラーニングモデルである、請求項11または12に記載の方法。
- (a)少なくとも1つのMHCアレルの前記訓練ペプチド配列または前記訓練ペプチド配列に由来するデータが、前記新生抗原のセットの提示尤度のセットを生成するために、前記機械学習させた提示モデルに入力される、前記対象のMHCアレルのペプチド配列を含まない;
(b)前記訓練データセットの前記複数の試料の各試料の前記ペプチドに結合した前記少なくとも1つのMHCアレルが、前記対象の前記1つ以上のMHCアレルが属する遺伝子ファミリーに属する;
(c)前記訓練データセットの前記複数の試料の各試料の前記ペプチドに結合した前記少なくとも1つのMHCアレルが、1個または複数のMHCアレルを含む;及び/または
(d)前記1つ以上のMHCアレルが、クラスI MHCアレルである、
請求項1~13のいずれか1項に記載の方法。 - コンピュータシステムであって、
コンピュータプロセッサと、
前記コンピュータプロセッサにより実行されると前記コンピュータプロセッサに、
新生抗原のセットのそれぞれのペプチド配列を表すデータを取得させることと、
前記対象の前記1つ以上のMHCアレルのそれぞれのペプチド配列を表すデータを取得させることと、
前記新生抗原のセットについて提示尤度のセットを、機械学習させた提示モデルを使用して決定させることであって、前記セットの中の各提示尤度が、対応する新生抗原が前記1つ以上のMHCアレルによって前記対象の前記腫瘍細胞の表面上に提示される尤度を表し、前記機械学習させた提示モデルが、
複数の試料の各試料について、前記試料中に存在するものとして特定されたMHCアレルのセットの中の少なくとも1つのMHCアレルに結合したペプチドの存在を測定する質量分析によって得られた標識と、
前記試料のそれぞれについて、ペプチドの訓練ペプチド配列または前記訓練ペプチド配列に由来するデータと、
前記試料のそれぞれについて、少なくとも1つのMHCアレルの訓練ペプチド配列または前記訓練ペプチド配列に由来するデータと、
を含む訓練データセットに少なくとも基づいて特定される、複数のパラメータ
を含む、前記決定させることと、
選択された新生抗原のセットを生成するために、前記新生抗原のセットのサブセットを、前記提示尤度のセットに基づいて選択させることと、
前記選択された新生抗原のセットを返させることと
を行わせるコンピュータプログラム命令を格納したメモリと
を含む、前記コンピュータシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862636061P | 2018-02-27 | 2018-02-27 | |
US62/636,061 | 2018-02-27 | ||
PCT/US2019/019836 WO2019168984A1 (en) | 2018-02-27 | 2019-02-27 | Neoantigen identification with pan-allele models |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2021514671A JP2021514671A (ja) | 2021-06-17 |
JPWO2019168984A5 true JPWO2019168984A5 (ja) | 2022-03-04 |
JP7480064B2 JP7480064B2 (ja) | 2024-05-09 |
Family
ID=67806416
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020567466A Active JP7480064B2 (ja) | 2018-02-27 | 2019-02-27 | パンアレルモデルによる新生抗原の特定方法 |
Country Status (10)
Country | Link |
---|---|
US (1) | US20200411135A1 (ja) |
EP (1) | EP3759131A4 (ja) |
JP (1) | JP7480064B2 (ja) |
KR (1) | KR20200127001A (ja) |
CN (1) | CN111868080A (ja) |
AU (1) | AU2019227813B2 (ja) |
CA (1) | CA3091917A1 (ja) |
IL (1) | IL276839A (ja) |
TW (1) | TW202000693A (ja) |
WO (1) | WO2019168984A1 (ja) |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014180490A1 (en) | 2013-05-10 | 2014-11-13 | Biontech Ag | Predicting immunogenicity of t cell epitopes |
WO2016128060A1 (en) | 2015-02-12 | 2016-08-18 | Biontech Ag | Predicting t cell epitopes useful for vaccination |
IL305238A (en) | 2015-12-16 | 2023-10-01 | Gritstone Bio Inc | Identification of neoantigens, preparation, and use |
WO2019075112A1 (en) | 2017-10-10 | 2019-04-18 | Gritstone Oncology, Inc. | IDENTIFICATION OF NEO-ANTIGENS USING HOT POINTS |
US11885815B2 (en) | 2017-11-22 | 2024-01-30 | Gritstone Bio, Inc. | Reducing junction epitope presentation for neoantigens |
US20220334129A1 (en) * | 2019-09-13 | 2022-10-20 | Evaxion Biotech A/S | Method for identifying T-cell epitopes |
WO2021091541A1 (en) * | 2019-11-05 | 2021-05-14 | Kri Technologies Incorporated | Identifying cancer neoantigens for personalized cancer immunotherapy |
CN114929899A (zh) * | 2020-01-07 | 2022-08-19 | 韩国科学技术院 | 一种新抗原的筛选方法、系统及其用途 |
WO2021257879A1 (en) * | 2020-06-18 | 2021-12-23 | Personalis Inc. | Machine-learning techniques for predicting surface-presenting peptides |
CN111798919B (zh) * | 2020-06-24 | 2022-11-25 | 上海交通大学 | 一种肿瘤新抗原预测方法、预测装置及存储介质 |
BR112023002724A2 (pt) * | 2020-08-13 | 2023-05-02 | Biontech Us Inc | Neoantígenos ras e seus usos |
CN112509641B (zh) * | 2020-12-04 | 2022-04-08 | 河北环境工程学院 | 一种基于深度学习监测抗生素与金属联合产物的智能方法 |
CN113255690B (zh) * | 2021-04-15 | 2022-04-12 | 南昌大学 | 一种基于轻量级卷积神经网络的复合绝缘子憎水性检测方法 |
EP4329780A1 (en) | 2021-04-29 | 2024-03-06 | Yeda Research and Development Co. Ltd | T cell receptors directed against ras-derived recurrent neoantigens and methods of identifying same |
CN113409888A (zh) * | 2021-06-21 | 2021-09-17 | 中国科学院自动化研究所 | 一种肿瘤微环境及肿瘤基因突变检测系统、方法及设备 |
WO2023017768A1 (ja) * | 2021-08-10 | 2023-02-16 | 日本電気株式会社 | 情報処理システム及び情報処理方法 |
CA3230568A1 (en) | 2021-09-13 | 2023-03-16 | Jean-Pol DETIFFE | Method to generate a double-stranded dna pool encoding neoantigens of a tumor of a patient |
EP4148146A1 (en) | 2021-09-13 | 2023-03-15 | OncoDNA | Method to generate personalized neoantigens of a tumor of a patient |
WO2023196966A1 (en) * | 2022-04-08 | 2023-10-12 | Gritstone Bio, Inc. | Antigen predictions for infectious disease-derived epitopes |
CN114821176B (zh) * | 2022-04-28 | 2022-11-01 | 浙江大学 | 一种儿童脑部mr图像病毒性脑炎分类系统 |
WO2024015892A1 (en) * | 2022-07-13 | 2024-01-18 | The Broad Institute, Inc. | Hla-ii immunopeptidome methods and systems for antigen discovery |
WO2024036308A1 (en) * | 2022-08-12 | 2024-02-15 | Biontech Us Inc. | Methods and systems for prediction of hla epitopes |
CN116469457B (zh) * | 2023-06-14 | 2023-10-13 | 普瑞基准科技(北京)有限公司 | Mhc与抗原多肽结合、呈递及免疫原性的预测模型训练方法和装置 |
CN116453599B (zh) * | 2023-06-19 | 2024-03-19 | 深圳大学 | 开放阅读框预测方法、设备及存储介质 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6931351B2 (en) * | 2001-04-20 | 2005-08-16 | International Business Machines Corporation | Decision making in classification problems |
ES2341802T3 (es) * | 2005-09-05 | 2010-06-28 | Immatics Biotechnologies Gmbh | Peptidos asociados a tumores unidos promiscuamente a moleculas del antigeno de leucocito humano (hla) de clase ii. |
HUE049886T2 (hu) * | 2010-05-14 | 2020-10-28 | Massachusetts Gen Hospital | Tumorspecifikus neoantigéneket tartalmazó készítmények, tumorok kezelésében történõ alkalmazásra |
WO2014180490A1 (en) * | 2013-05-10 | 2014-11-13 | Biontech Ag | Predicting immunogenicity of t cell epitopes |
CA2960834A1 (en) * | 2014-09-10 | 2016-03-17 | Genentech, Inc. | Immunogenic mutant peptide screening platform |
IL305238A (en) * | 2015-12-16 | 2023-10-01 | Gritstone Bio Inc | Identification of neoantigens, preparation, and use |
-
2019
- 2019-02-27 JP JP2020567466A patent/JP7480064B2/ja active Active
- 2019-02-27 CN CN201980019430.9A patent/CN111868080A/zh active Pending
- 2019-02-27 AU AU2019227813A patent/AU2019227813B2/en active Active
- 2019-02-27 KR KR1020207027458A patent/KR20200127001A/ko unknown
- 2019-02-27 TW TW108106921A patent/TW202000693A/zh unknown
- 2019-02-27 EP EP19760756.7A patent/EP3759131A4/en active Pending
- 2019-02-27 WO PCT/US2019/019836 patent/WO2019168984A1/en unknown
- 2019-02-27 CA CA3091917A patent/CA3091917A1/en active Pending
- 2019-02-27 US US16/975,823 patent/US20200411135A1/en active Pending
-
2020
- 2020-08-20 IL IL276839A patent/IL276839A/en unknown
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2020536553A5 (ja) | ||
JP2020532323A5 (ja) | ||
JPWO2019168984A5 (ja) | ||
Zhao et al. | Systematically benchmarking peptide-MHC binding predictors: From synthetic to naturally processed epitopes | |
JP2023134542A5 (ja) | ||
Mei et al. | A comprehensive review and performance evaluation of bioinformatics tools for HLA class I peptide-binding prediction | |
RU2019136762A (ru) | Идентификация, производство и применение неоантигенов | |
JP7047115B2 (ja) | Mhcペプチド結合予測のためのgan-cnn | |
US20220122690A1 (en) | Attention-based neural network to predict peptide binding, presentation, and immunogenicity | |
JP2021503897A5 (ja) | ||
Bravi et al. | RBM-MHC: a semi-supervised machine-learning method for sample-specific prediction of antigen presentation by HLA-I alleles | |
JP2020518083A (ja) | 免疫原性がん特異的エピトープのためのランク付けシステム | |
CN113424264A (zh) | 用于生成个性化癌症疫苗的癌症突变选择 | |
JPWO2020181240A5 (ja) | ||
JP2023518725A (ja) | ペプチド及びhla対立遺伝子配列を用いて新生抗原を予測する方法及びコンピュータプログラム | |
CN114929899A (zh) | 一种新抗原的筛选方法、系统及其用途 | |
Konstantinou | T-cell epitope prediction | |
CN115747327A (zh) | 涉及移码突变的新抗原预测方法 | |
Albert et al. | Deep neural networks predict class I major histocompatibility complex epitope presentation and transfer learn neoepitope immunogenicity | |
Dai et al. | Machine learning optimization of peptides for presentation by class II MHCs | |
CN114882951A (zh) | 基于二代测序数据检测mhc ii型肿瘤新生抗原的方法和装置 | |
AU2019382854B2 (en) | Method and system of targeting epitopes for neoantigen-based immunotherapy | |
Thrift et al. | HLApollo: A superior transformer model for pan-allelic peptide-MHC-I presentation prediction, with diverse negative coverage, deconvolution and protein language features | |
US20240021274A1 (en) | Using neural networks to predict peptide immunogenicity | |
Liu et al. | A Deep Learning Approach for NeoAG-Specific Prediction Considering Both HLA-Peptide Binding and Immunogenicity: Finding Neoantigens to Making T-Cell Products More Personal |