JP7140280B2 - ネオ抗原ベースの免疫療法のためのエピトープを標的化する方法およびシステム - Google Patents

ネオ抗原ベースの免疫療法のためのエピトープを標的化する方法およびシステム Download PDF

Info

Publication number
JP7140280B2
JP7140280B2 JP2021519744A JP2021519744A JP7140280B2 JP 7140280 B2 JP7140280 B2 JP 7140280B2 JP 2021519744 A JP2021519744 A JP 2021519744A JP 2021519744 A JP2021519744 A JP 2021519744A JP 7140280 B2 JP7140280 B2 JP 7140280B2
Authority
JP
Japan
Prior art keywords
epitopes
epitope
embedding
candidate
scores
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021519744A
Other languages
English (en)
Other versions
JP2022504635A (ja
Inventor
ブランドン マローン
広祐 尾上
慶子 吉原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JP2022504635A publication Critical patent/JP2022504635A/ja
Application granted granted Critical
Publication of JP7140280B2 publication Critical patent/JP7140280B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/30Detection of binding sites or motifs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioethics (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Description

先行出願の相互参照
2018年11月21日に出願された米国仮特許出願第62/770,220号に対する優先権が主張され、その開示の全体は参照により本明細書に組み込まれる。
本発明は、特にネオ抗原ベースの免疫療法のための、異なるネオ抗原が特定の患者において免疫応答を誘発する可能性を決定するためのコンピューターによる計算方法およびシステムに関する。
がん細胞は、正常な健常細胞中に存在しない、ネオ抗原と称される、デオキシリボ核酸(DNA)中の変化を多くの場合に含む。ネオ抗原は健常細胞中に存在しないので、それらはがん療法のための魅力的な標的である。免疫療法において、目標は、がん細胞を攻撃および殺傷するように患者の免疫系を刺激することである。ネオ抗原ベースの免疫療法において、目標は、ネオ抗原を特異的に標的化するように免疫系に教示することである。健常細胞はネオ抗原を含まないので、そのような療法は、オフターゲットまたは自己免疫応答を回避すると考えられる。
本発明の実施形態は、ネオ抗原を、分子生物学の原理にしたがってメッセンジャーリボ核酸(mRNA)に転写され、不正確な情報を伝えるDNA中の変化と考える。これらのmRNAは次に、形成異常のタンパク質に翻訳される。換言すれば、ネオ抗原は、不正確なアミノ酸を有するペプチド配列(タンパク質)を結果としてもたらす。これらのタンパク質は次に、2つの抗原プロセシング経路:内因性プロセシング経路または外因性プロセシング経路のうちの1つにより処理される。これらの経路は、Alberts, B.ら、「Molecular Biology of the Cell」、Garland Science(2002)(参照により全体が本明細書に組み込まれる)により論じられている。
内因性プロセシング経路において、タンパク質は、それが合成された細胞内に留まる。タンパク質は、プロテアソームにより約9アミノ酸の、エピトープとも称される小さいペプチド配列に切り刻まれる。エピトープの一部は次に、プロセシングのために小胞体(ER)に輸送される。ERにおいて、エピトープの一部は主要組織適合複合体Iタンパク質(MHC-I)に結合する。このエピトープ-MHC-I複合体は細胞表面上に提示される。そのため、細胞は抗原提示細胞(APC)と称される。最後に、CD8受容体タンパク質を有する(CD8+)T細胞はエピトープ-MHC-I複合体に結合する。これらのCD8+ T細胞(細胞傷害性T細胞、またはCTCとも呼ばれる)は次に、アポトーシスを開始するようにAPCを誘導し、アポトーシスは、一般用語では、CTCがAPCに自身を殺傷するように指図することを意味する。
外因性プロセシング経路において、形成異常のタンパク質は最初に、細胞外環境から、APCになるもののエンドソームへとエンドサイトーシスされる。換言すれば、形成異常のタンパク質は細胞に「吸収」される。タンパク質は次に、内因性プロセシング経路に類似した方式でプロテアーゼによりエピトープに分解される。エピトープは次に主要組織適合複合体IIタンパク質(MHC-II)に結合し、エピトープ-MHC-II複合体は細胞表面上に提示される。MHC-II複合体に結合するエピトープは、約15アミノ酸の長さである傾向があり、したがって、MHC-Iに結合するものよりも幾分長い。そのため、外因性プロセシング経路もまたAPCを作出する。CD4受容体タンパク質を有する(CD4+)T細胞はエピトープ-MHC-II複合体に結合する。CTCとは異なり、CD4+ T細胞は、サイトカイン、またはB細胞もしくはCTCを活性化させるシグナル伝達物質を放出する。CD4+ T細胞は直接的に作用するよりもむしろ他の細胞を活性化させるので、それらは多くの場合にヘルパーT細胞と呼ばれる。
ヒトにおけるMHCシステムはヒト白血球抗原(HLA)システムとも称される。各人は、HLA-A、HLA-BおよびHLA-Cと称される3種類のHLA-I遺伝子を有する。追加的に、各人は、2つのバージョンのそれらの各遺伝子(1つは母親から、1つは父親から遺伝したもの)を有する。それらの遺伝子の特有のバージョンはアレルと称される。そのため、各人は、6つまでの異なるHLA-I遺伝子を有する。これらの遺伝子は構造的に類似しているが、エピトープに結合する強さにおいて異なる。さらに、これらの遺伝子は高度に多型であり、すなわち、異なる人は異なるアレルを有する。
状況はHLA-IIシステムについてよりいっそう複雑である。HLA-DR、HLA-DPおよびHLA-DQと称される同様に3種類のHLA-II遺伝子があるが、それらはそれぞれ、2つの多型遺伝子(各々のアルファ鎖およびベータ鎖と称される)により形成されるヘテロ二量体複合体である。再び、各人は、2アレル(1つは母親から、1つは父親から)の各遺伝子を遺伝性に受け継ぐ。そのため、合計で、各人は12(まで)の異なるHLA-II複合体を有する。HLA-Iと同様に、異なる人は異なるアレルを有し、数千の異なる組合せが観察されている。
一実施形態では、本発明は、個別化された免疫療法のための標的としてネオ抗原に由来するエピトープを順位付けする方法を提供する。候補エピトープががん患者の患者データに基づいて収集される。スコアのセットが候補エピトープのそれぞれについて算出され、候補エピトープのうちの各々の1つについてのセットのうちの各々の1つにおけるスコアのそれぞれが、がん患者において免疫応答を誘発する、候補エピトープのうちの各々の1つの可能性の独立した度合を表す。スコアのセットのそれぞれにおけるスコアを、候補エピトープのそれぞれについての単一のスコアに組み合わせる。各場合における候補エピトープについての単一のスコアが、患者において免疫応答を誘発する全体的な可能性を反映する。候補エピトープが、免疫療法のために単一のスコアを使用して順位付けされる。
本発明は、例示的な図に基づいて以下においてよりいっそう詳細に記載される。本発明は例示的な実施形態に限定されない。本明細書に記載および/または図示される全ての特徴は、本発明の実施形態において単独でまたは異なる組合せで組み合わせて使用され得る。本発明の様々な実施形態の特徴および利点は、以下を図示する添付の図面を参照して以下の詳細な説明を読むことにより明らかとなる。
免疫療法のために標的エピトープを順位付けおよび選択するためのコンピューターシステムおよび方法の図式的な概要である。 患者特異的ネオペプチドをコードする配列を有するプラスミドの調製方法のフローチャートである。 本発明の一実施形態による体細胞突然変異の種類に依存したネオエピトープの設計の図式的な概要である。
本発明の実施形態は、免疫療法のための標的として特定の患者において免疫応答を誘発する可能性にしたがってネオ抗原、またはネオエピトープとも称されるネオ抗原に由来するエピトープを順位付けまたは優先順位付けするための方法およびシステムを提供する。方法およびシステムは、個人的データに基づいて様々な指標から各エピトープについての単一の個別化スコアを推定する。このスコアを次に、ネオ抗原の優先順位を作出するためにドメインナレッジと組み合わせる。いずれのエピトープが特定の患者について最良の標的を与えるのかをより良好な正確性で推定できることに加えて、本発明の実施形態は、有利なことに、最も有望な標的をより良好に同定するためにネオ抗原の多様性を考慮する。
全てのネオエピトープが療法のために等しく有望な標的というわけではない。上記のように、ネオ抗原が免疫応答を最終的に誘発する経路は非常に複雑であり、任意のステップにおいて失敗し得る。例えば、一部のネオ抗原は、特定の人において存在する適切なHLA複合体に結合できないエピトープを結果としてもたらす一方、他のものは、決してタンパク質に翻訳すらされないDNAを結果としてもたらすことがあるため、経路がそもそも活性ではない。そのため、免疫応答を誘発する可能性に基づいてネオエピトープを順位付けまたは優先順位付けできることは、ネオ抗原ベースの免疫療法が特定の患者に有効である可能性を著しく増加させることができる。公知のアプローチとは対照的に、本発明の実施形態は、類似したエピトープからの既知の実験結果を明示的に組み込んで順位付けを決定することによってより正確な予測を生じさせることができる。
一実施形態では、本発明は、個別化された免疫療法のための標的としてネオ抗原に由来するエピトープを順位付けする方法を提供する。候補エピトープががん患者の患者データに基づいて収集される。スコアのセットが候補エピトープのそれぞれについて算出され、候補エピトープのうちの各々の1つについてのセットのうちの各々の1つにおけるスコアのそれぞれが、がん患者において免疫応答を誘発する、候補エピトープのうちの各々の1つの可能性の独立した度合を表す。スコアのセットのそれぞれにおけるスコアを、候補エピトープのそれぞれについての単一のスコアに組み合わせる。各場合における候補エピトープについての単一のスコアが、患者において免疫応答を誘発する全体的な可能性を反映する。候補エピトープが、免疫療法のために単一のスコアを使用して順位付けされる。
同じまたは他の実施形態では、スコアのセットのそれぞれは少なくとも、がん患者に特異的なHLAアレルを使用して決定されるヒト白血球抗原(HLA)結合の可能性を指し示す第1のスコア、およびがん患者に特異的な健常リボ核酸(RNA)配列データを使用して同定されるT細胞受容体(TCR)レパートリーを使用して予測されるT細胞応答を指し示す第2のスコアを含む。
同じまたは他の実施形態では、スコアのセットのそれぞれは、がん患者に特異的な腫瘍RNA配列データに基づく第3のスコアをさらに含む。
同じまたは他の実施形態では、方法は、エピトープの実験的に検証された特性およびエピトープについてのドメインナレッジを抽出すること、ならびに実験的に検証された特性およびドメインナレッジに基づいてエピトープのそれぞれをベクトル空間に埋め込むことをさらに含む。
同じまたは他の実施形態では、候補エピトープは、単一のスコアおよび埋め込みに基づいて順位付けされる。
同じまたは他の実施形態では、順位付けは、ベクトル空間中の最大加重距離の順序で行われ、各場合における加重距離は、候補エピトープのうちの各々の1つについての単一のスコアを掛けたベクトル空間中のユークリッド距離に基づいて決定され、その結果、ベクトル空間の原点からの最大加重距離を有する候補エピトープのうちの1つが第1に順位付けされ、続いて最上位のエピトープからの最大加重差異を有する候補エピトープのうちの1つが順位付けされる。
同じまたは他の実施形態では、埋め込みは、表現学習埋め込みフレームワークを使用して行われ、表現学習埋め込みフレームワークは、ノードがエピトープを表し、エッジが、予め定義された閾値より高い類似度を有するエピトープを接続する、親和性グラフを使用し、ノードの属性は少なくとも、実験由来の特性およびドメインナレッジを含み、埋め込み関数は、属性を数ベクトルにマッピングするために属性のそれぞれについて学習される。代替的に、埋め込みは、直接埋め込みにより行われ、直接埋め込みにおいて、少なくとも、実験由来の特性およびドメインナレッジは、結合されて一緒になった数ベクトルを使用してそれぞれ埋め込まれる。
同じまたは他の実施形態では、埋め込みは、エピトープの生化学的特性のベクトル表現を含む。
同じまたは他の実施形態では、埋め込みは、エピトープのアミノ酸配列のベクトル表現を含む。
別の実施形態では、本発明は、個別化された免疫療法のための標的としてネオ抗原に由来するエピトープを順位付けするためのコンピューターシステムであって、コンピューターシステムがメモリーおよび1つまたは複数のプロセッサーを含み、1つまたは複数のプロセッサーが、単独または組合せで、上記の実施形態のいずれかによる方法の実行を提供するように構成されている、コンピューターシステムを提供する。
同じまたは他の実施形態では、スコアのセットのそれぞれは少なくとも、がん患者に特異的なHLAアレルを使用して決定されるヒト白血球抗原(HLA)結合の可能性を指し示す第1のスコア、およびがん患者に特異的な健常リボ核酸(RNA)配列データを使用して同定されるT細胞受容体(TCR)レパートリーを使用して予測されるT細胞応答を指し示す第2のスコアを含む。
同じまたは他の実施形態では、請求項11に記載のコンピューターシステムは、以下のステップの実行を提供するようにさらに構成される。:エピトープの実験的に検証された特性およびエピトープについてのドメインナレッジを抽出すること、ならびに実験的に検証された特性およびドメインナレッジに基づいてエピトープのそれぞれをベクトル空間に埋め込む。候補エピトープは、単一のスコアおよび埋め込みに基づいて順位付けされる。
同じまたは他の実施形態では、順位付けは、ベクトル空間中の最大加重距離の順序で行われ、各場合における加重距離は、候補エピトープのうちの各々の1つについての単一のスコアを掛けたベクトル空間中のユークリッド距離に基づいて決定され、その結果、ベクトル空間の原点からの最大加重距離を有する候補エピトープのうちの1つが第1に順位付けされ、続いて最上位のエピトープからの最大加重差異を有する候補エピトープのうちの1つが順位付けされる。
さらなる実施形態では、本発明は、メモリーを使用して、単独または組合せで、1つまたは複数のプロセッサーにより実行されると、上記の実施形態のいずれかによる方法の実行を提供する命令を有する非一時的なコンピューター読取り可能な媒体を提供する。
さらなる実施形態では、本発明は、(a)本明細書に記載の実施形態のいずれかによるエピトープを順位付けする方法の実行のプロセスおよび(b)エピトープを順位付けする方法の実行により同定されたネオペプチドを合成するプロセスを含む、ネオペプチドの製造方法を提供する。
さらなる実施形態では、本発明は、本明細書に記載の実施形態のいずれかによるエピトープを順位付けする方法の実行のプロセスおよびエピトープを順位付けする方法の実行により同定されたネオペプチドを合成するプロセスにより得られたネオペプチドを提供する。
さらなる実施形態では、本発明は、本明細書に記載の実施形態のいずれかによるエピトープを順位付けする方法の実行により同定されたネオペプチドを含む、医薬組成物を提供する。
さらなる実施形態では、本発明は、本明細書に記載の実施形態のいずれかによるエピトープを順位付けする方法の実行により同定されたネオペプチドを含む、がんの治療において使用するための医薬組成物を提供する。
さらなる実施形態では、本発明は、対象に本明細書に記載の実施形態のいずれかによるエピトープを順位付けする方法の実行により同定されたネオペプチドを投与するステップを含む、対象においてがんを治療する方法を提供する。
さらなる実施形態では、本発明は、がんの治療用の医薬の調製のための、本明細書に記載の実施形態のいずれかによるエピトープを順位付けする方法の実行により同定されたネオペプチドの使用を提供する。
図1は、例示的な実施形態にしたがってエピトープまたはネオエピトープを決定および優先順位付けするための方法およびシステム10の他に、本発明の実施形態が使用可能な状況を実証するためのいくつかの公的に利用可能な構成要素の図式的な概要である。システム10は、3つの主な相を含む方法を実装する:
1.候補エピトープ26を生成する相であって、候補エピトープ26が、単一の患者の全エクソームシークエンシング(WXS)データ12に基づいて同定される;
2.候補エピトープ26をスコア付けする相であって、エビデンス構成要素が独立して各候補エピトープ26にスコアを割り当てる。本発明の特に有利な実施形態では、これらのスコアの全てまたは少なくとも部分が個別化データに基づくことが重要である。
3.候補エピトープ26を順位付けする相であって、個別化スコアを、埋め込み中にコードされた履歴データおよびドメインナレッジと組み合わせ、エピトープの最終順位50を構築する。
相1~3を実行するための図1に示される様々なシステム構成要素の他に、エピトープの埋め込みおよびHLA型判定のための構成要素は、単一のサーバー、またはメモリーへのアクセスを有するコンピュータープロセッサー、またはそれぞれが相1~3の部分、埋め込みおよび/もしくはHLA型判定を行う、複数の異なるサーバーおよび/もしくはメモリーへのアクセスを有するプロセッサーであり得る。
相1は、候補エピトープ26を生成するための候補エピトープ生成装置構成要素20により実行され、体細胞バリアントをコールするようにプログラムされている体細胞バリアント同定装置構成要素22を含む。この体細胞バリアント同定装置構成要素22は、WXSデータ12からネオ抗原として体細胞バリアントを同定する。体細胞バリアント同定装置22は、患者の腫瘍および健常WXSデータ12を比較して、腫瘍試料中に現れるが健常試料中には現れないバリアントを決定し、これらのバリアントを体細胞バリアント、またはネオ抗原として同定する。1つの特定の例として、Broad Instituteにより開発されたgenome analysis toolkit(GATK)は、このステップを実行するために使用され得る、商業的にオンラインで利用可能かつ参照により全体が本明細書に組み込まれる、体細胞の短いバリアントの発見(SNV+インデル)のための最良の実施ワークフローを与える。
次に、候補エピトープ26が候補抽出構成要素24により2ステップで抽出される。第1に、各同定された体細胞バリアントの種類が、タンパク質コーディング領域のアミノ酸配列の変化に基づいてアノテーションされる。例えば、体細胞バリアントは、健常試料と比較して腫瘍配列データにおいて特定の位置における異なるアミノ酸(ミスセンス突然変異)またはアミノ酸の短い挿入もしくは欠失を結果としてもたらし得る。第2に、同定された体細胞バリアントを含む全ての可能な9-mer(「クラスIエピトープ」)および15-mer(「クラスIIエピトープ」)が候補エピトープ26のセットとして生成される。例として、アノテーションは、McLaren, W.ら、「The Ensembl Variant Effect Predictor」、Genome Biology、Jun 6;17(1):122(2016)と共に、オンラインで利用可能であり、参照により本明細書に組み込まれる、グループEnsemblからのValiant Effect Predictor(VEP)ツールを使用して行われ得る。9-merおよび15-merは、スライディングウィンドウアプローチにより生成される。例えば、位置10におけるミスセンス突然変異の場合、位置10~18に基づく9-merまで、位置2~10に基づく9-merが生成され、次に、位置3~11に基づく別の9-merが生成される、などである。すなわち、候補エピトープを生成するために、突然変異を含むサイズ9(および15)の全ての可能なウィンドウが使用される。欠失および短い挿入から候補エピトープを作出するために類似したアプローチが使用される。長い挿入(9個より多いアミノ酸)の場合、スライディングウィンドウアプローチもまた応用されるが、それは体細胞バリアントのみからのアミノ酸を含んでもよい。
HLA型判定構成要素28において、患者のHLA-IアレルがWXSデータ12を使用して決定されると共に、患者のHLA-IIアレルが腫瘍RNAシークエンシング(RNA-seq)データ16を使用して決定される。これらの決定の両方は、標準的な実施にしたがって行うことができる。例えば、HLA-Iアレルは、Szolek, A.ら、「OptiType: precision HLA typing from next-generation sequencing data. Bioinformatics」、30、3310~3316頁(2014)により論じられているツールOptiTypeを使用して決定することができ、HLA-IIアレルは、Boegel, S.ら、「HLA typing from RNA-Seq sequence reads」、Genome Medicine、4(2012)(これらのそれぞれは参照により本明細書に組み込まれる)により論じられているツールseq2HLAを使用して同定することができる。
相2は、相1からの同定された候補エピトープをスコア付けするための候補エピトープスコア付け構成要素30により実行され、順位付けのための個々のスコアがエビデンス構成要素から算出される。例示的な実施形態によれば、3つのエビデンス構成要素が特に使用され、これらは特に、HLA結合構成要素32、T細胞応答構成要素34およびRNA-seq発現構成要素36であるが、他のものが他の実施形態において使用され得る。3つの構成要素は、一般に、クラスIおよびクラスIIの両方のエピトープについて同じであるが、特有の差異は以下において関連する場合に論じられる。予測的T細胞応答構成要素34は、本発明の実施形態に導入される新たな構成要素であり、本明細書において論じられる利点を提供する。HLA結合構成要素32は、患者において同定された各HLAアレルに対して候補エピトープのそれぞれの結合スコアを算出する。HLA結合構成要素32は、クラスIエピトープ(9-mer)の結合スコアを予測する場合にHLA-Iアレルのみを考慮し、同様にクラスIIエピトープ(15-mer)の結合スコアを予測する場合にHLA-IIアレルのみを考慮する。
既存の刊行されたおよび公的に利用可能なネオ抗原検出および順位付けパイプラインは、HLA結合の予測を含む。そのため、HLA結合構成要素32は単純に、入力としてエピトープ配列およびアレルを取り、予測された結合スコアを出力する機能(例えば、機械学習モデル)として挙動する。スコアは、エピトープおよびアレルの間の結合の確率または生化学的結合親和性に比例した数のいずれかであり得る。Kuksa, P.ら、「High-order neural networks and kernel methods for peptide-MHC binding prediction」、Bioinformatics、31、3600~3607頁(2015)(全体が本明細書に組み込まれる)などの、HLA結合のための刊行されたモデルをこの構成要素のために使用することができる。この構成要素は患者特異的HLAアレルを考慮に入れるので、出力を個別化スコアと考えることができる。
T細胞応答構成要素34は、候補エピトープ26についての患者における免疫応答の強さまたは可能性を表すスコアを算出する。特に、第1のステップにおいて、患者特異的T細胞受容体(TCR)レパートリーは、以下において言及される参考文献において論じられているように、T細胞が特異的にエンリッチされたものであってもよい、健常RNA-seqデータ14を使用して同定される。次に、この患者特異的情報は、各候補エピトープ26についてT細胞応答を予測するために使用される。特に、T細胞応答は、2つの独立したスコアとして算出される。第1のスコアは、例えば以下の擬似コードにしたがって、TCRおよびエピトープ-HLA結合の可能性を算出する。第2のスコアは、エピトープが結合とは独立してT細胞応答を誘発する可能性を算出する(擬似コードにおいて以下に記載される)。
T細胞受容体、エピトープ-HLA結合親和性の算出
・患者のHLAアレルのセット中の各アレルについて
・各候補エピトープ、eについて
・患者のTCRレパートリー中の各T細胞受容体(TCR)について
・例えばPierce, B. G.ら、「A flexible docking approach for prediction of T cell receptor-peptide-MHC complexes」、Protein Science、22、35~46頁(2013)(以下の参照により組み込まれる)に記載されるように、TCR、エピトープ、アレル結合親和性を算出する
・eについて最大結合親和性を選択する
・[0,1]の範囲内になるように患者についての全ての候補エピトープについての最大結合親和性を線形スケーリングする
エピトープが(結合とは独立して)T細胞応答を誘発する可能性を算出するために、ネオ抗原ではないソース(例えば、ウイルス、Dhanda, S.K.ら、「Predicting HLA CD4 Immunogenicity in Human Populations」、Frontiers in Immunology、9、1369(2018)を参照)を有するエピトープについてのヒトにおけるin vivo実験、またはマウスにおいて通常見出されるものよりもむしろヒトMHC遺伝子を有するように遺伝子改変されたマウスであるトランスジェニックマウスにおいて使用されたエピトープに基づくin vivo実験(例えば、Calis, J.J.ら、「Properties of MHC Class I Presented Peptides that Enhance Immunogenicity」、PLOS Computational Biology、9(2013)を参照)などの、免疫応答実験からの履歴データを使用して教師あり機械学習モデルが訓練される。第1のモデルは、CD8+ T細胞におけるMHC-I応答を予測するために訓練され、第2のモデルは、CD4+ T細胞におけるMHC-II応答を予測するために使用される。訓練されたら、これらのモデルは、各候補エピトープが各々の種類のT細胞からの応答を誘発する可能性を予測するために使用される。
Gong, Q.ら、「Assessment of T-cell receptor repertoire and clonal expansion in peripheral T-cell lymphoma using RNA-seq data」、Scientific Reports、7(2017)(参照により全体が本明細書に組み込まれる)は、RNA-seqはTCRレパートリーを評価するための有効なツールであることを示す。Kato, T.ら、「Effective screening of T cells recognizing neoantigens and construction of T-cell receptor-engineered T cells」、Oncotarget、9、11009~11019頁(2018)(参照により全体が本明細書に組み込まれる)は、TCRレパートリーは、細胞療法のために特有のネオ抗原を標的化するようにT細胞を操作する場合の重要な考慮であることを示す。さらに、Pierce, B. G., et al., “A flexible docking approach for prediction of T cell receptor-peptide-MHC complexes,” Protein Science, 22, 35-46 (2013)(参照により全体が本明細書に組み込まれる)において論じられている伝統的なアプローチは、T細胞受容体およびエピトープ-HLA複合体の結合を予測できることを示している。しかしながら、患者特異的TCRレパートリーおよび患者特異的HLAアレルは、免疫応答を惹起する可能性にしたがってネオ抗原を優先順位付けする目的のために共同的に考慮されてはいない。T細胞応答構成要素は患者特異的TCRレパートリーを考慮に入れるので、それは個別化されている。
RNA-seq発現構成要素36は、腫瘍試料中のネオ抗原を含有する転写物(すなわち、RNAになる遺伝子のバージョン;上記の参照により組み込まれるAlberts B.らを参照)のRNA-seq発現に基づいてスコアを算出する。これは、標準的な解析パイプラインを使用して行うことができる。それは、患者のRNAに直接的に由来するため、明確に個別化されている。例えば、Conesa, Anaら、「A survey of best practices for RNA-seq data analysis」、Genome Biology、vol. 17、13.26、doi:10.1186/s13059-016-0881(Jan. 2016)は、各転写物の発現を推定するためのいくつかのマルチステップパイプラインを記載するRNA-seqデータ解析用の最良の実施の調査を提供した。発現は、0の最小値および100万の理論的な最大値を有する、「転写物/100万」、またはTPMという単一の数として与えられる。実際には、100のような値は、典型的には、「高い」と考えられる。本発明の一実施形態によれば、RNA-seq発現スコアは、全ての転写物についてTPMに100までの上限を設け、次に100で割ることにより算出される。そのため、全ての転写物は、この実施形態では、0~1のRNA-seq発現スコアを有する。ソース転写物のスコアが各候補エピトープに割り当てられる。候補エピトープが、複数のオーバーラップする転写物を起源としている可能性がある場合、好ましくは、各可能なソース転写物について1コピーのエピトープが作出される。
3つの可能なスコア付け装置のみが例示的な実施形態のために本明細書に記載されている。しかしながら、多様な他のエピトープスコア付け装置が学術文献において提案されている。例えば、腫瘍RNA-seqデータ16内のネオ抗原のリード深さおよびアレル頻度は、候補エピトープを順位付けするための別の一般的に使用されるアプローチである。リード深さの場合、候補エピトープについてのスコアは、候補エピトープの作出に繋がる体細胞バリアントを含有するRNA-seqリードの数として与えられる。この数は、RNA-seq発現とまさに同様に100までの上限を設けられ、0~1にスケーリングされる。アレル頻度について、2つのスコアが腫瘍試料の全エクソームシークエンシングまたはRNA-seqにおける(正常な参照配列と比較した)体細胞バリアントの頻度として算出される。本発明の他の実施形態によれば、3つの例示的なエピトープスコア付け装置の代替または追加として、異なるスコア付け装置を実装することができる。
候補エピトープ26を順位付けする相3において、候補エピトープ順位付け装置構成要素40により、候補エピトープ26のそれぞれについて、エビデンス構成要素により算出されたスコアを組み合わせることにより免疫応答を誘発する各々の候補エピトープ26の可能性について、個別化スコア算出装置構成要素42を使用して、単一の個別化スコアが算出される。スコアを組み合わせる方法を学習するために、好ましくはオフラインで、教師あり機械学習アプローチが使用される。
卵巣がんについての血液中のがん抗原(CA)125レベルまたは無増悪生存の期間などの、エピトープ特異的な臨床またはサロゲートエンドポイントが利用可能な場合、これらは最初に、エピトープが免疫応答を誘発したのかどうかを表現するための適切な表現に変換される。例えば、患者における低減したCA125レベルと関連付けられるエピトープは、陽性の免疫応答を誘発しており、したがって、免疫応答は二元変数と考えられると決定され得る。代替的に、CA125の低減の量を各エピトープと関連付けることができ、したがってこの場合、免疫応答は連続変数である。そのようなエピトープ特異的な臨床またはサロゲートエンドポイントは、臨床およびサロゲートエンドポイントデータベース47に保存し、そこから取得することができる。
エンドポイントが利用可能でない場合、プロキシエンドポイントが設計される。これらのエンドポイントは、臨床エンドポイントでもサロゲートエンドポイントでもない他の実験データに基づいてもよい。代替的に、それらは、コンピューターシミュレーションにより決定されるか、または手動で選択されてもよい。
いずれの場合も、エビデンス構成要素からのスコアに基づいて選択されたエンドポイント(すなわち、免疫応答)を予測するために、任意の適切な最先端の教師あり機械学習モデルを訓練することができる。特に、スコアは、臨床およびサロゲート(またはプロキシ)エンドポイントデータベース47を用いて全てのエピトープについて算出される。次に、データベース中の既知のエンドポイントを予測するために教師あり機械学習モデルが訓練される。線形モデルが選択される場合、エンドポイントを最良に予測するために学習の結果は各スコアについて適切な重みである。ランダムフォレストまたはニューラルネットワークなどの他のモデルクラスが選択される場合、学習されたモデルの正確な解釈は、より明確でないことがある。それにもかかわらず、いずれの場合における結果も、入力としてエピトープについてのスコアを取り、選択されたエンドポイント(すなわち、免疫応答)を予測する機械学習モデルである。エンドポイントが未知であるエピトープの免疫応答を予測するために同じモデルが次に使用される。
全エピトープ埋め込み構成要素46において、「位置」、または埋め込みは、ベクトル空間内の候補エピトープ26のそれぞれについて算出される。この埋め込みは、各エピトープ26の配列類似性、生化学的特性、既知の実験結果、ドメインナレッジ、および他の特性を組み込んでもよい。全エピトープ埋め込み構成要素46は、歴史的エピトープ実験結果データベース48およびドメインナレッジデータベース49などの、そのような情報を含む物理メモリーデータベースへのアクセスを有する。本明細書において「直接埋め込み」および「表現学習埋め込み」と称される2つの例は、どのようにこれらの特性が埋め込みに組み込まれ得るのかのために与えられる。これらは実例に過ぎない。
直接埋め込みにおける配列類似性のために、各エピトープは、その配列に基づいてワンホットでコードされたベクトルとして表現される。例えば、アミノ酸の小さいサブセット:R、K、D、Eのみを考慮して、ワンホットコーディングは、Rについて(1,0,0,0)、Kについて(0,1,0,0)などを使用する。エピトープは次に、この例:
REDD:R(1,0,0,0);E(0,0,0,1);D(0,0,1,0);D(0,0,1,0):(1,0,0,0, 0,0,0,1, 0,0,1,0, 0,0,1,0)
に示されるように、その各アミノ酸の結合として表現される。
直接埋め込みにおける生化学的特性のために、エピトープ中の各アミノ酸の電荷、極性、および疎水性に基づいて12次元空間への4-merの埋め込みを利用することができる。この例では、アミノ酸は、これもまたオンラインで利用可能な以下の特性:
荷電性:R、K、D、E
極性:Q、N、H、S、T、Y、C、W
疎水性:A、I、L、M、F、V、P、G
を有することが想定される。
そのため、各荷電性アミノ酸を(1,0,0)として、各極性アミノ酸を(0,1,0)として、および各疎水性アミノ酸を(0,0,1)として埋め込む選択が可能である。これらの埋め込みは唯一のものではなく、荷電性に1、極性に2、および疎水性に3などの他の埋め込みスキームを使用することができる。
選択された埋め込みスキームを用いて、以下の例が提供される:
MSDE:M(0,0,1);S(0,1,0);D(1,0,0);E(1,0,0):(0,0,1,0,1,0,1,0,0,1,0,0)
RKAD:R(1,0,0);K(1,0,0);A(0,0,1);D(1,0,0):(1,0,0,1,0,0,0,0,1,1,0,0)
WILD:(0,1,0,0,0,1,0,0,1,1,0,0)
これらの埋め込みは特定の患者とは独立しており、エピトープについての「バックグラウンドナレッジ」を表現するものとして考えることができる。
一部の場合には、既知の実験結果が特定のエピトープについて利用可能であり、それらを直接埋め込みにおいて使用することができる。例えば、特有のHLA-IまたはHLA-IIアレルについての特定のエピトープの結合親和性が既知であり得る。この情報は、適切な値を含有する数ベクトルを使用して直接的に埋め込まれる。各々の実験結果が特定のエピトープについて既知でない場合、値は「欠測」(missing)と考えられる。後に、これらの欠測値を与えるために、欠測値を処理するための標準的な機械学習技術が使用されてもよい。
直接埋め込みにおけるドメインナレッジのために、多くの場合、追加の情報が特定のエピトープについて既知であり得る。例えば、それは、多くの疾患に対する突然変異(「RCV000302825.1」などの識別記号を有する)の臨床的意義(「良性」または「病原性の可能性がある」など)を含む、単一ヌクレオチド多型データベース(dbSNP、オンラインで利用可能)中に記録された突然変異の結果として生成されてもよく、またはエピトープは、既知の腫瘍関連遺伝子における変化に起因した結果であってもよい。テキストデータのバッグオブワードまたはバイナリデータのインジケータ(例えば、エピトープが既知の腫瘍関連遺伝子における変化に起因するのかどうか)などの好適なデータ表現、および前処理を使用してこの情報が捕捉される。
最終の直接埋め込みは、上記のベクトルを単一のベクトルに組み合わせることにより各エピトープについて見出される。例えば、例えば以下において論じられるように、個々のベクトルのそれぞれが結合されて、1つの大きいベクトルが形成される。それを行う際に、一実施形態によれば、0または1である正常数値としてバイナリ/カテゴリカル値を処理することができる。以下にさらに論じられる別の実施形態によれば、より洗練されたアプローチを使用することができる。
既知のエピトープのドメインナレッジ、およびドメインナレッジ値から異なる場合の結果としてもたらされる直接埋め込みの単純化された例は以下の通りである。直接埋め込みを作出するために使用される標準的な機械学習アプローチ、または「変化無し」は括弧内に与えられる。
エピトープ1
- エピトープ_配列(埋め込みのために使用されない):AGTW
- 配列_生化学的特性(変化無し):[0,0,1,0,0,1,0,1,0,0,1,0]
- HLA_A*0201_結合(変化無し):5.3
- HLA_B*2705_結合(変化無し):?
- HLA_DRB1*1201_結合(変化無し):3.2
- dbSNP_RCV000302825.1_臨床的意義(ワンホットコーディング):?([0,0,0,0])
- dbSNP_RCV000587704.1_臨床的意義(ワンホットコーディング):良性([1,0,0,0])
- がん遺伝子(ワンホットコーディング):該当せず([1,0])
- 遺伝子_説明(標準的な自然言語前処理、続いてterm frequency-inverse document frequency(TF-IDF)):リボソームの構成要素、細胞中でのタンパク質の合成の原因となる大きいリボ核タンパク質複合体。([0.2,0,0,0.1,0.1,0.5,0.3,0.6])
- 直接埋め込み:結合([0,0,1,0,0,1,0,1,0,0,1,0]、[5.3,?,3.2]、[0,0,0,0]、[1,0,0,0]、[1,0]、[0.2,0,0,0.1,0.1,0.5,0.3,0.6])
エピトープ2
- エピトープ_配列(埋め込みのために使用されない):PLKK
- 配列_生化学的特性(変化無し):[0,0,1,0,0,1,1,0,0,1,0,0]
- HLA_A*0201_結合(変化無し):?
- HLA_B*2705_結合(変化無し):6.5
- HLA_DRB1*1201_結合(変化無し):?
- dbSNP_RCV000302825.1_臨床的意義(ワンホットコーディング):良性の可能性がある([0,1,0,0])
- dbSNP_RCV000587704.1_臨床的意義(ワンホットコーディング):良性([1,0,0,0])
- がん遺伝子(ワンホットコーディング):該当([0,1])
- 遺伝子_説明(標準的な自然言語前処理、続いてTF-IDF):プレmRNAの選択的スプライシングの調節を媒介する。プレmRNA中のスプライス部位に結合し、スプライス部位の選択を調節する。([0,0,0.3,0.8,0,0.1,0.2,0])
- 直接埋め込み:結合([0,0,1,0,0,1,1,0,0,1,0,0]、[?,6.5,?]、[0,1,0,0]、[1,0,0,0]、[0,1]、[0,0,0.3,0.8,0,0.1,0.2,0])
エピトープ3
- エピトープ_配列(埋め込みのために使用されない):RMI
- 配列_生化学的特性(変化無し):[1,0,0,0,0,1,0,0,1]
- HLA_A*0201_結合(変化無し):2.3
- HLA_B*2705_結合(変化無し):5.9
- HLA_DRB1*1201_結合(変化無し):6.1
- dbSNP_RCV000302825.1_臨床的意義(ワンホットコーディング):病原性の可能性がある([0,0,1,0])
- dbSNP_RCV000587704.1_臨床的意義(ワンホットコーディング):病原性([0,0,0,1])
- がん遺伝子(ワンホットコーディング):該当([0,1])
- 遺伝子_説明(標準的な自然言語前処理、続いてTF-IDF):制御性T細胞(Treg)の発生および阻害機能のために決定的な転写調節因子。Treg系列の全的な抑制機能および安定性の獲得を可能とすることにより免疫系のホメオスタシスの維持において必須の役割を果たす([0.9,0.7,0.8,0,0,0,0,0.9])
- 直接埋め込み:結合([1,0,0,0,0,1,0,0,1]、[2.3,5.9,6.1]、[0,0,1,0]、[0,0,0,1]、[0,1]、[0.9,0.7,0.8,0,0,0,0,0.9])
エピトープ4
- エピトープ_配列(埋め込みのために使用されない):TAG
- 配列_生化学的特性(変化無し):[0,1,0,0,0,1,0,0,1]
- HLA_A*0201_結合(変化無し):6.1
- HLA_B*2705_結合(変化無し):?
- HLA_DRB1*1201_結合(変化無し):2.1
- dbSNP_RCV000302825.1_臨床的意義(ワンホットコーディング):?([0,0,0,0])
- dbSNP_RCV000587704.1_臨床的意義(ワンホットコーディング):?([0,0,0,0])
- がん遺伝子(ワンホットコーディング):?([0,0])
- 遺伝子_説明(標準的な自然言語前処理、続いてTF-IDF):?([0,0,0,0,0,0,0,0])
- 直接埋め込み:結合([0,1,0,0,0,1,0,0,1]、[6.1,?,2.1]、[0,0,0,0]、[0,0,0,0]、[0,0,]、[0,0,0,0,0,0,0,0])
これらの例において、臨床的意義についてのワンホットエンコーディングにおけるインジケータの順序は、[良性,良性の可能性がある,病原性の可能性がある,病原性]である。バイナリ変数がん遺伝子(「この体細胞バリアントは既知のがん遺伝子に存在するか?」)について、インジケータの順序は、[該当せず,該当]である。遺伝子_説明について、8つの項が標準的な前処理の後に残るので、ベクトルは全て長さ8である。これらの変数について、欠測値を指し示すために全てゼロのベクトルが使用される。追加のインジケータフィールド(例えば、がん遺伝子について[該当せず,該当,欠測])などの他の戦略を使用することもできる。既知の結合親和性などの欠測数値は、「非数」(not a number)などの標準的な表現を使用して「欠測」のままとされる。
上記の直接埋め込みアプローチに対する代替として、より洗練された表現学習埋め込みアプローチを使用することができる。好ましい実施形態では、Garcia-Duran, A.ら、「Learning Graph Representations with Embedding Propagation」、Advances in Neural Information Processing Systems、30(2017)(参照により全体が本明細書に組み込まれる)において論じられている埋め込み伝播(embedding propagation;EP)フレームワークが使用される。EPは、ノードが実体を表し、エッジが類似した実体を接続する親和性グラフを入力として取る。属性のセットが各ノードについて提供される。一部の属性は、一部のノードについて欠測していてもよい。EPは、属性を数ベクトルにマッピングする埋め込み関数を学習する。異なる関数が各属性について学習され、異なる種類の関数が異なる属性種について学習され得る。関数のパラメーターは、グラフ中の隣接するノードの数ベクトルが類似しているように学習される。
この設定において、EP用のグラフ中の各ノードはエピトープに対応し、エッジは類似したエピトープを接続する。類似性の例として、特定の閾値より高い類似性を有する全てのエピトープを、レーベンシュタイン距離などの配列類似度にしたがって接続することができる。各ノード上の属性は、例えば、上記の生化学的特性、実験結果およびドメインナレッジであり得る。そのような表現学習アプローチは、この文脈において以前に使用されていない。
一実施形態によれば、埋め込みは距離を算出するためにのみ使用されるので、埋め込みではなくエピトープに対してカーネルを定義することもまた可能である。しかしながら、例えば、Niepert, M.ら、「Learning Convolutional Neural Networks for Graphs」、Proceedings of the 33rd International Conference on Machine Learning、(2016)(参照により全体が本明細書に組み込まれる)により、埋め込みベースのアプローチは多くの文脈においてカーネルベースのアプローチより優れることが示されているので、埋め込みベースのアプローチが好ましい。
エピトープ順位付け構成要素44において、候補エピトープ26は、それらの個別化スコアおよび埋め込みに基づいて順位付けされる。エピトープ順位付け構成要素44は、高順位のエピトープが、免疫応答を誘導する可能性があり、かつ埋め込み空間の多様な部分にあるように、候補エピトープ26を最終順位50に順序付ける。さらに、上位順位のエピトープの一部が技術的理由に起因して破棄されなければならない場合に、順位50は多様なままとなる。
一実施形態によれば、単一のエピトープおよび「それまで」に選択されたエピトープのセットの間の最大加重距離が使用される。これは、単一のエピトープおよび「それまで」のセット中の任意のエピトープの間の最大ユークリッド距離に単一のエピトープのスコアを掛けたものとして取られる。低いスコアを有するエピトープは、それらの埋め込み位置にかかわらず、低い「最大加重距離」を常に有することをこれは意味する。他方、高いスコアであるが類似した埋め込み位置を有するエピトープは、相対的に短い距離を有する。そのため、手順はまた、埋め込み空間中で互いに遠位にある大きいスコアを有するエピトープを選択することにより多様性を促す。
候補エピトープ26は、以下のアルゴリズムを使用して順位付けすることができる:
1.最上位のエピトープとして原点(0,0,...)の位置からの最大加重距離を有するエピトープを選択する。
2.第2位のエピトープとして最上位のエピトープからの最大加重距離を有するエピトープを選択する。
3.第3位のエピトープとして最上位および第2位の両方のエピトープからの最大加重距離を有するエピトープを選択する。
全てのエピトープが順位付けされるまでこの処理が続けられる。
本発明の実施形態は、以下の向上を提供する:
1)各エピトープについて免疫応答を誘発する可能性を反映する単一のスコアを算出する。単一のスコアは、患者特異的T細胞受容体レパートリーおよびHLAアレルを含む個別化データを反映する個々の独立したスコアのセットの組合せである。
2)それらの実験的に検証された特性およびドメインナレッジに基づく表現学習を使用してエピトープをベクトル空間に埋め込む。
3)スコア、埋め込み位置、および配列多様性を組み合わせることによりエピトープを順位付けする。特に、これは、エピトープのサブセットを選択することとは対照的に、順位が作出されることを意味する。さらに、順位は、免疫応答の可能性のみではなく、免疫応答の可能性および多様性の両方に基づく。
本発明の一実施形態によれば、免疫応答を誘発する可能性に基づいてネオ抗原に由来するエピトープを優先順位付けする方法は、
1)実験的に検証されたエピトープの特性を抽出するステップ、
2)エピトープについてのドメインナレッジを抽出するステップ、
3)実験的に検証された特性に基づいて全てのエピトープをベクトル空間に埋め込むステップ、
4)候補エピトープのセットを収集するステップ、
5)免疫応答を誘発するエピトープの可能性の独立した度合をそれぞれが与える、各エピトープについてのスコアのセットを算出するステップ、
6)各エピトープについてのスコアのセットを、エピトープが免疫応答を誘発する全体的な可能性を反映する単一のスコアに組み合わせるステップ、ならびに
7)それらの免疫応答可能性、埋め込み、および配列多様性の両方に基づいてエピトープを順位付けするステップ
を含む。
ステップ1)~3)はオフラインで行うことができ、ステップ4)~7)はオンラインで行うことができる。
本発明の実施形態によるモジュール式スコア付けアプローチは、有利なことに、エピトープの免疫原性を自然に組み込むことを可能とする。現在まで、全ての記載されたネオ抗原選択パイプラインは、ネオ抗原を選択するための「エンドポイント」としてHLA結合のみを考慮してきた。例えば、Bjerregaard, A.ら、「MuPeXI: prediction of neo-epitopes from tumor sequencing data」、Cancer Immunology、Immunotherapy、66、1123~1130頁(2017)は、T細胞応答についての用語を含まない。米国特許第10,055,540号は、方法はHLAアレル上の提示の可能性を予測することを明示的に記載している。Rubinsteyn, A.ら、「Vaxrank: Vaccine Peptide Selection」、J. Computational Pipeline for the PGV-001 Neoantigen Vaccine Trial、Frontiers in Immunology、8(2018)は、予測されたMHCの結合および発現にしたがって候補ワクチンペプチドの最終順位を作成することを記載している。Hundal, J.、「pVAC-Seq: A genome-guided in silico approach to identifying tumor neoantigens」、Genome Medicine、2016、8は、「HLAクラスI分子に結合する高親和性ペプチドを予測すること」を目的としている。しかしながら、彼らは、予測において免疫原性を含めていない。米国特許出願公開第2016/0069895号は、ペプチドスクリーニングプラットフォームを記載している。米国特許出願公開第2017/0224799号は、ペプチドの免疫原性を予測するためにMHCタンパク質結合溝におけるエピトープのコンホメーション安定性を使用する方法を記載している。そのため、彼らは、エピトープおよびMHC結合の安定性のみを考慮している。よって、彼らも同様に、予測において免疫原性を含めていない。以上の刊行物のそれぞれは、参照により全体が本明細書に組み込まれる。
さらに、本発明の実施形態によるシステムは、任意の機能的アノテーションを含めることを可能とする。例えば、がんと関連付けられることが既知である領域中のDNA変化に由来するネオ抗原を優先順位付けすることが可能である。それにより、システムは、「ドライバー突然変異」を自然に優先順位付けすることができる。再び、既存の刊行された方法は、この種類のドメインナレッジを組み込んでいない。
埋め込みモデルは、有利なことに、それが既知の場合に、エピトープについての実験的エビデンスを直接的に組み込むことを可能とする。対照的に、既存の方法は、訓練された機械学習モデルを介して間接的にそのようなエビデンスを含むに過ぎない(BjerregaardらおよびRubinsteynらのNetMHCPan;HundalらのNetMHC;ならびに米国特許第10,055,540号における特製のニューラルネットワークモデルを参照)。
また、本発明の実施形態による方法は、有利なことに、内因性および外因性経路に等しく応用可能である。先行するアプローチは、内因性経路にのみ焦点を当てている。米国特許第10,055,540号は、訓練セットにおいてHLA-II結合エピトープを使用することに言及しているが、予測はHLA-I結合(すなわち、内因性経路)についてのみである。
提案される優先順位付けスキームのために、候補エピトープのセットが利用可能であるべきである。Alexandrovら、「Signatures of mutational processes in human cancer」、Nature、2013、500、415~421頁(2013)は、毛様性星状細胞腫および急性リンパ芽球性白血病(acute lyphoblastic leukemia)などの一部の形態のがんは、非常に少数の突然変異と関連付けられることを記載しており、その場合、優先順位付けするための十分な候補エピトープが現在存在しない可能性がある。
組合せ中の個々のスコアの重みの決定は、選択されるアウトカムに依存し、臨床試験毎に異なるアウトカムが考慮されることが一般的である。例えば、血液中のCA125のレベルは、いくつかの種類のがん(特に卵巣がん)のための一般的な定量的エンドポイントである。他の試験では、無増悪生存期間または他のアウトカムが考慮され得る。これらは異なるスケールの異なる種類の数であるので、重み付けされる異なるスコアの重要性に影響し得る。
本発明の実施形態は、ワクチンベースの免疫療法において使用するためおよび/または「サービスとしてのネオ抗原検出」を提供するためのエピトープの選択のために使用することができる。
図2は、特定の患者100のためのトランスファー配列120に到達するために標的ネオエピトープを予測、順位付けおよび選択する方法を図示する。いくつかのステップS1~S5は、ステップS5にしたがって患者特異的ネオペプチドをコードする配列を有するプラスミド(または「患者特異的プラスミド」)を生成するために使用されるトランスファー配列120を設計するまで、ステップS1における患者試料(腫瘍および正常組織)の収集物から行われる。
ステップS1において、患者腫瘍試料が手術の直後に得られる。試料の部分がホルマリン固定およびパラフィン包埋(FFPE)のために除去され、組織の別の小片が直ちに凍結される。血液検体がPAXgeneチューブ中の全血としてまたはFicoll勾配分離末梢血単核細胞(PBMC)として収集される。試料は配列解析まで-80℃で(または窒素蒸気中で)貯蔵される。
ステップS2において、全エクソームシークエンシング(WES)が認可された実験室において行われることが好ましい。腫瘍および末梢試料からのゲノムDNAがせん断され、末端修復され、バーコード付加ILLUMINAシークエンシングアダプターをライゲートされ、増幅され、サイズ選択される。凍結腫瘍組織が好ましくは使用される。利用可能でない場合、FFPE腫瘍試料がWESのために使用される。この実施形態では、エクソームは、ILLUMINAからのNextera Rapid Capture Exome v1.2バイトセットまたは同等物を使用して標的化される。この捕捉方法は、NCBIのRefSeqGeneデータベースの全てのコーディング領域を含む約37.7Mbのエクソン領域をカバーする(O'Learyら、「Reference sequence (RefSeq) database at NCBI: current status, taxonomic expansion, and functional annotation」、Nucleic Acids Res、44:D733~45頁(2016)を参照)。結果としてもたらされたライブラリーが次にqPCR定量化され、プールされ、ILLUMINAシークエンサーを使用して少なくとも2×75bpのペアードエンドリードとしてシークエンシングされて、fastqファイルが得られる。
RNAシークエンシングライブラリーの構築のために、好ましくは凍結試料から、または凍結材料が利用可能でない場合にはFFPE試料から、RNAが抽出される。ILLUMINAからのTruSeq RNA Access Library Prep Kitまたは同等物を使用してRNA-Seqライブラリーが調製される。全RNA濃度が定量化され、ライブラリー調製の前に正規化される。TruSeq RNA Access Library Prep kitまたは同等物を使用して、ストランド化cDNAライブラリーが調製され、それが次にDNAオリゴヌクレオチドプローブのセットにハイブリダイズされて、mRNA転写物断片用のライブラリーがエンリッチされる。トランスクリプトーム捕捉は21,415遺伝子を標的化し、これはRefSeqエクソーム(Rapid Capture Exomeと同じバイトセット)の98.3%を表す。各シークエンシングランは、少なくとも2×50bpのペアードエンドのリード長さを用いて実行される。
ステップS3において、体細胞突然変異が同定される。患者毎に、腫瘍および正常全エクソームシークエンシングリードからのバリアントコーリングを介して候補エピトープが同定される。配列データ用の柔軟性リードトリミングツール、Trimmomaticを使用して、腫瘍および正常全エクソームシークエンシングリードがトリミングおよびフィルタリングされる。品質管理後に、それらは、BWA-MEMを使用してヒトGRCh38参照ゲノムに対してアライメントされる。アライメントファイルは、GATK Best Practicesにしたがって処理される。候補生成のために、突然変異したアミノ酸を含む全ての可能なペプチド配列が9-merまたは15-merウィンドウサイズに基づいて生成される。
患者のHLA遺伝子型を決定するために、全エクソームシークエンシングリードがRazerS3を使用してトリミングされ、IMGT/HLAデータベースに対してアライメントされる。HLAクラスIアレルがOptiTypeを使用して同定される。Flexbarを使用して低品質リードをフィルタリングした後に腫瘍RNA-seqリードがトリミングされ、リボソームRNAリードがbowtie2を使用してフィルタリング除去される。品質管理後に、それらはbowtieを使用してIMGT/HLAデータベースに対してアライメントされる。HLAクラスIIアレルがseq2HLAを使用して同定される。
ステップS3においてさらに、候補エピトープの免疫原性スコア付けおよび順位付けが行われる。ワクチンの設計用の候補エピトープの妥当性が、腫瘍特異的免疫標的としてのそれらの妥当性を推進する一連の生物学的および生化学的因子を使用してスコア付けおよび順位付けされる。これらの因子としては、患者HLAに対する結合親和性、免疫原性であることが既知のエピトープに対する類似性、転写レベルでの発現のレベル、突然変異の頻度、正常ヒト配列に対する相同性、ウイルスタンパク質に対する相同性、および所与の配列が提示のために細胞内機構によりプロセシングされる可能性が挙げられる。これらの因子は、これらの因子のそれぞれを反映する指数を定義する、上記の実施形態におけるような、いくつかのエビデンス構成要素の算出によるスコア付けにおいて考慮に入れられる。その例が以上および以下において記載されるエビデンス構成要素が、各候補エピトープについての全体的なスコアおよび順位を導出するために使用される。エビデンス構成要素は、クラスIおよびクラスIIの両方のエピトープについて一般に同じであり得るが、以下における関連する場合に特有の差異が指摘される。エビデンス構成要素は、好ましくはメモリーまたはデータベースから、各々の入力を受け取り、各々のスコアを出力するように特に構成されたコンピューター処理構成要素である。
HLA結合親和性のために、実験室in vitroアッセイを使用して測定された結合親和性の自社データベースを使用して高次カーネルサポートベクターマシンに基づく高性能機械学習アルゴリズムを訓練させた。簡潔に述べれば、TAP欠損腫瘍細胞系を使用する安定化アッセイによりHLAクラスI分子に対するペプチドの結合を測定する。それにより、結合親和性の正確な測定が可能となるため、より良好な予測が可能となる。この実施形態では、HLA-A*02:01結合ペプチドを分析する研究を行い、広く利用可能なT2細胞を使用し、他のHLAクラスIアレル分子の分析のために好適ないくつかの細胞系もまた生成した。HLA-A分子もHLA-B分子も発現しないC1R細胞(ATCC、Manassas、VA)に異なる目的のHLA-A遺伝子をトランスフェクトした。次に、細胞表面上に実質的な数の「エンプティHLA分子」の出現を生じさせるCrispr/Cas9システムを使用して抗原プロセシング関連トランスポーター(TAP)遺伝子を欠失させた。ペプチドローディングHLA-A分子を検出するために、ペプチド乱雑様式でHLA-Aアレル分子のほとんどを認識するモノクローナル抗体(mAb)を開発した。TAP欠損細胞系およびこのmAbを使用することにより、結合親和性の高度に正確な測定が可能である。HLAクラスII分子の分析のために、生抗原提示細胞(APC)の細胞表面上のHLAクラスII分子へのペプチドの結合を測定する方法を開発した。方法を最初に、細胞関連ペプチダーゼによる分解からペプチドを保護するためにNおよびC末端において2アミノ酸の伸長を有する11-merペプチドの結合を測定することにより特徴付けた。それにより、結合アッセイの間のペプチド濃度の正確性が確保される。公的データベースにおいて、ほとんどのHLAクラスII結合データはより長いペプチドを使用して得られており、それにより、HLAクラスII分子と直接的に接触するペプチドについての正確な配列情報が不明瞭になる。第2に、生細胞上のHLAクラスII分子へのペプチドの結合をpH6.0において、効率的なペプチドローディング、およびそのため結合親和性の正確な測定を可能にする水素結合交換体、p-クロロフェノールの添加により促した。この方法は抗原提示の天然の機構を利用し、アフィニティー精製されたHLAクラスIIを使用する他の方法とは異なり、ペプチドの結合に影響し得る洗浄剤を使用しない。モデルは、結合親和性に比例する値を予測し、スコアの範囲は変動するが、典型的な「強いバインダー」は範囲[5,7]内のスコアを有する。
既知の免疫原性のエピトープに対する類似性を決定するために、エビデンス構成要素は、in vitro免疫原性アッセイにおいてT細胞応答を誘発する候補エピトープの可能性をスコア付けするために深層畳み込みニューラルネットワーク(CNN)を使用する。各アミノ酸の任意の埋め込みを学習するのではなく、代わりに既知の生化学的特性(例えば、極性および疎水性)の他に、進化的特徴(BLOSUM62突然変異値)が使用される。これらのモデルは、免疫エピトープデータベース(IEDB)からの公的なCD4またはCD8免疫応答データを使用して訓練される。モデルは可能性を予測するので、このスコアは常に範囲[0,1]内である。
RNA発現について、FPKM(100万キロベース当たりの断片;Fragments Per Kilobase Million)値がRNA-seqリードファイルから抽出される。RNA-seq値は、最初に全てのFPKM値に100の上限を設ける(すなわち、100より高いFPKM値は100に設定される)ことにより範囲[0,1]に変換される。推定されたFPKMが1未満である転写物を起源とするエピトープはフィルタリング除去される。RNA発現スコアを生成するために、値は次に[0,1]から線形にスケーリングされる。
DNA、RNAアレル頻度について、エビデンス構成要素は、腫瘍試料のWESまたはRNAシークエンシングにおいてそれぞれ突然変異またはインデルの頻度を与える。そのため、それは常に範囲[0,1]内である。
RNAアレル深度について、エビデンス構成要素は、エピトープの原因となる突然変異またはインデルを含むRNAシークエンシングリードの数を与える。カウントは100にクリッピングされ、[0,1]から線形にスケーリングされる。いかなるRNAシークエンシングサポートも有しないエピトープはフィルタリングされる。
ヒト配列相同性のために、エビデンス構成要素は、エピトープ配列をヒトプロテオーム中のその最も近いホモログと比較する。特に、basic local alignment search tool(BLAST)データベースがヒトプロテオーム(Ensemble、GRCh38、バージョン90)を使用して構築される。BLAST検索が次に行われ、各ヒットについて、正規化されたblocks substitution matrix(BLOSUM)類似性が計算され、それは0(完全に異なる配列)~1(正確に同じ配列)の範囲に及ぶ。この構成要素からのスコアは(1-類似度)として取られる。例えば、エピトープがヒトプロテオーム中の他の場所に実際に存在する場合、このスコアは0である。
ウイルス配列に対する相同性のために、ウイルスタンパク質は免疫応答を誘発する可能性がより高いので、エビデンス構成要素は、エピトープ配列をウイルスプロテオーム中のその最も近いホモログと比較する。それはヒト相同性構成要素に類似している。BLASTデータベースがRefSeqバージョン91からの非重複ウイルスタンパク質配列を使用して構築される。検索は、ヒト相同性構成要素におけるものと同じパラメーターを使用して行われ、再び最も類似したマッチが見出されるが、この場合、類似性がスコアとして使用される。そのため、ウイルス配列に類似したエピトープはより高いスコアを有する。このスコアの範囲は[0,1]であり、1はウイルス配列における正確なマッチを指し示す。
細胞内プロセシングについて、エビデンス構成要素は、特定のエピトープが細胞内プロセシング(プロテアソーム切断、TAP結合および輸送)を受け、各々のHLA分子による提示のために利用可能である可能性(範囲[0,1]内のスコア)を予測する。これを予測するために勾配ブーストツリーが訓練され、それらは、T細胞応答を予測するためと同じ入力を各エピトープのために使用する他に、各々のHLA分子の擬似配列を使用する。モデルは、公的な質量分析データに基づく「正例」、および訓練用の「負例」を使用して訓練され、試験はまた、利用可能な公的なデータに基づく。
エビデンス構成要素は、好ましくは、重み付けされる。各構成要素のそれぞれについての重み、または各エビデンス構成要素の相対的な重要性は、公的なex vivoT細胞応答データを使用して決定される。特に、上記の値は、ex vivo実験において試験された各エピトープについて算出される。次に、観察されるT細胞応答を予測するために線形モデルが訓練される。線形モデルにおいて学習された係数は、各構成要素のための重みとして取られる。
最後にステップS3において、エピトープの最終順位は、3つの要素:スコア組合せ構成要素(上記のエビデンス構成要素の重み付けされた組合せである)、エピトープ埋め込み構成要素(多次元空間中の位置)ならびにスコアおよび位置を組み合わせるエピトープ順位付け構成要素に基づく。
各候補エピトープについての単一のスコアは、全てのエビデンス構成要素からのスコアを組み合わせることにより算出される。本発明の一実施形態によるシステムの1つの著しい利点は、HLA結合親和性データセットの使用に由来する。単一のスコアは、上記の全ての構成要素、または他の実施形態において使用されるエビデンス構成要素の異なる組合せの加重和として算出される。
この実施形態におけるエピトープ埋め込み構成要素は、上記の実施形態において論じられたエピトープ埋め込み構成要素に類似したものであり得る。「位置」は、埋め込み空間内の各エピトープについて計算される。単純な例として、エピトープ中の各アミノ酸の電荷、極性、および疎水性に基づいて9-merを27次元空間(9アミノ酸×3つの特性=27次元)に埋め込むことを考えることができる。これらの埋め込みは特定の患者とは独立しており、エピトープについての「バックグラウンドナレッジ」を表現するものとして考えることができる。例えば、埋め込み位置を学習するために上記のEPアルゴリズムを使用することができる。EPは2つの相:オフライン学習相(既知の実験結果を使用する)、およびオンライン埋め込み相(新たな候補エピトープの位置が決定される)からなる。学習相において、EPは、エピトープが、配列類似性の他に、それらのエピトープの全ての既知の特性(例えば、既知のHLA結合親和性データ、質量分析データにおける存在、そしてまた、エピトープの起源となる遺伝子の遺伝子オントロジータームなどの情報)に基づいて接続されるグラフを入力として取る。EPは次に、グラフ中で近傍にあり、かつ類似した特性を有するエピトープを埋め込み空間中の近くの位置にマッピングするようにニューラルネットワークを訓練する。再び、これはオフライン学習相において行われ、候補エピトープについての情報を使用しない。オンライン埋め込み相において、各候補エピトープの位置が決定される。最初に、各候補エピトープについて、訓練グラフ中のそのネイバー(neighbors)が配列類似性に基づいて決定される。次に、訓練されたニューラルネットワークを使用して、埋め込み空間中の候補エピトープの位置が決定される。
候補エピトープは、上記のそれらの患者特異的スコア(上記に論じられているように実装されたスコア組合せ構成要素から)および「多様性」に基づいて順位付けされる。目標は、高順位のエピトープが、免疫応答を誘導する可能性があり、かつ多様であるように、エピトープを順位付けすることである。さらに、順位付けは、上位順位のエピトープの一部が合成などの問題に起因して使用できない場合に多様なままであるように設計される。最初に、各候補エピトープのスコアにその位置を掛けることにより患者特異的位置が各候補エピトープについて決定される。そのため、例えば、0に近いスコアを有する全ての候補エピトープは一緒に近傍にある一方、大きいスコアを有する候補エピトープは遠位である。次に、エピトープを順位付けするために反復処理が使用される。最も高いスコアを有する候補エピトープが最上位のエピトープとして選択される。最上位のエピトープから最も遠い候補エピトープが次に同定され、第2位のエピトープとして取られる。第3位の候補エピトープは、最初の2つの両方から最も遠いものである。例えば、上位30の候補エピトープが順位付けされるまで、この処理が続けられる。
有利なことに、高いスコアであるが類似した位置を有する候補エピトープは相対的に短い距離を有し、そのため、手順は多様性も促す。換言すれば、方法は、埋め込み空間中で互いに遠位にある大きいスコアを有するエピトープを選択する。
広範な免疫応答への上記のように同定されたネオエピトープの提示を可能とするために、予測された9-merネオエピトープを突然変異部位から各方向に15-merウィンドウをカバーするように伸長させることによりネオペプチドをステップS4において設計した。結果としてもたらされるネオペプチドは、エピトープの生成に繋がる突然変異の種類に依存する。様々な場合のシナリオを図3に示す。ネオペプチドの設計のための全体的な規則が次に、予測されたネオエピトープの部分である最初および最後の突然変異位置のそれぞれ上流および下流の最大で14残基の伸長として定義される。
図3において、Mは突然変異を表し、M1はエピトープ中の最初の突然変異を表し、Mnはエピトープ中の最後の突然変異を表し(1<n≦9)、Δは欠失事象を表し、SIはインフレームの短い挿入を表し(1<m<9)、LIはインフレームの長い挿入を表し(>9)、FSはフレームシフトを表す。エピトープ推進性の検出される突然変異は、9(9-merエピトープ)を超えることができない。
ネオペプチド融合トランスファー配列の設計において、それらの融合物をコードする発現カセットの部分であるための順位付けされたネオペプチドの適格性は様々な基準に依存し、該基準としては、配列相同性、ならびに、疎水性、および膜貫通ドメインを形成する傾向のような疎水性に関連するタンパク質の特徴などの、組換えベクターの生成に影響する可能性がある生化学的特性が挙げられる。ステップS5において上記の特性に基づいて最適化された発現カセットを設計するために特製のツールが使用される。ツールは、不適切なタンパク質融合物に繋がる可能性があるネオペプチドの任意の組合せを検出し、それを破棄する。禁じられた特徴を既に有するか、または高度に疎水性の融合タンパク質を誘導する任意のネオペプチド候補は、自動的に不適格とされ、初期リスト中に次の候補があれば、それにより置き換えられる。結果としてもたらされた発現カセットは次に、プラスミド生成のために要求されるトランスファー配列に埋め込まれる。
本発明の各ネオペプチドは、当業者に公知の技術を使用して合成することができる。例えば、それは、Fmoc法もしくはtBoc法などの固相方法、または液相法により人工的に合成されてもよい。所望のペプチドはまた、本発明のネオペプチドをコードするポリヌクレオチドまたは該ポリヌクレオチドを含有する組換えベクターを発現させることにより製造されてもよい。そのように得られるネオペプチドはそれぞれ、当業者に公知の技術を使用して検証することができる。例えば、それは、エドマン分解方法または質量分析方法を使用して検証することができる。
簡潔に述べれば、固相合成方法を使用することによるペプチドの合成は、ペプチドの保護されたC末端アミノ酸を樹脂に最初に取り付けることを伴う。取付けの後に、樹脂は濾過され、洗浄され、C末端アミノ酸のアルファアミノ基上の保護基(例えば、t-ブチルオキシカルボニル)は除去される。この保護基の除去は、当然ながら、そのアミノ酸および樹脂の間の結合を壊すことなく起こらなければならない。結果としてもたらされた樹脂ペプチドに、最後から2番目のC末端の保護アミノ酸が次に連結される。この連結は、第2のアミノ酸の遊離カルボキシ基および樹脂に取り付けられた第1のアミノ酸のアミノ基の間のアミド結合の形成により起こる。ペプチドの全てのアミノ酸が樹脂に取り付けられるまで、この一連の事象が逐次的なアミノ酸を用いて繰り返される。最後に、保護されたペプチドが樹脂から切断され、保護基が除去されて、所望のペプチドが得られる。樹脂からペプチドを分離するためおよび保護基を除去するために使用される切断技術は樹脂および保護基の選択に依存し、ペプチド合成の技術に精通している者に公知である。
一実施形態によれば、ネオペプチドは、上記の実施形態のいずれかによる方法の実行のプロセスおよび方法の実行により同定されたネオペプチドを製造するプロセスにより得られる。
標的に対するエピトープを決定する他のやり方があるが、これらは全て重大な欠点を有し、上記に論じられている向上を提供しない。例えば、全ての可能なエピトープを実験的に検証して、順位付けの必要性を取り除くことができるかもしれない。しかしながら、これは時間およびコストの両方の観点で法外なものであり、したがって、実行可能な解決策ではない。別の例として、エピトープのセットをハードフィルターのセットに基づいてコンピューターで選択することができるかもしれない。しかしながら、フィルターは、人手により設計される必要があり、多くのエピトープが全てのフィルターを通過した場合、またはどれも通過しない場合にどのように処理するべきかは明確でない。さらなる例として、エピトープのセットを専門家の手により選択することができるかもしれない。しかしながら、HLA分子に結合する可能性があるエピトープを同定することは直截的なものではないこと、およびHLA分子に結合するだけではなく内因性または外因性プロセシング経路の全体を活性化させるエピトープを選択することはよりいっそう困難であることが文献、例えば、Jurtz, V.、「NetMHCpan-4.0: Improved Peptide-MHC Class I Interaction Predictions Integrating Eluted Ligand and Peptide Binding Affinity Data」、Journal of Immunology、199、3360~3368頁(2017)(参照により全体が本明細書に組み込まれる)において観察されている。そのため、そのようなアプローチは、多くの偽陽性を結果としてもたらす可能性がある。さらに、一部の腫瘍試料は数千のエピトープ候補を結果としてもたらすため、これらの場合における手動の順位付けまたは選択は実際的ではない。エピトープはまた、予測されたHLA結合親和性のみに基づいて順位付けすることができるかもしれない。しかしながら、高い予測されたHLA結合親和性を有する多くのエピトープは免疫応答を誘発しないことがGros, A.ら、「Prospective identification of neoantigen-specific lymphocytes in the peripheral blood of melanoma patients」、Nature Medicine、22、433~438頁(2016)により報告されている。そのため、そのようなアプローチは、多くの偽陽性を結果としてもたらす可能性がある。
本明細書に記載の任意の実施形態では、順位付けされた候補エピトープは、好ましくは、免疫療法においてそれらの順位にしたがってエピトープを標的化することにより特定の患者の治療において使用される。
そのため、さらなる実施形態では、本発明は、がんの治療用の医薬組成物の調製のための、本明細書に記載の実施形態のいずれかによるエピトープを順位付けする方法の実行により同定されたネオペプチドの使用、そしてまた、1つまたは複数の実施形態では、医薬組成物を提供する。
本発明の1つまたは複数の実施形態によるがんの治療または予防用の医薬組成物は、活性原料成分として少なくとも1つの本発明のネオペプチドを含有する。本発明のネオペプチドは、抗原提示細胞上に提示されることにより細胞傷害性Tリンパ球(CTL)を誘導し、誘導されたCTLはがん細胞を損傷する。そのため、本発明の医薬組成物の活性原料成分は本発明のネオペプチドに限定されず、CTLの直接的または間接的なネオペプチド特異的誘導が可能な成分であってもよく、例えば、活性原料成分はまた、ネオペプチドをコードするポリヌクレオチドもしくはそのようなポリヌクレオチドを含有するベクター、もしくはネオペプチドをコードするmRNAもしくは表面上にネオペプチドおよびHLA分子の複合体を提示する抗原提示細胞もしくは抗原提示細胞から分泌されるエキソソーム、またはこれらの組合せであってもよい。使用される抗原提示細胞の例としては、マクロファージおよび樹状細胞が挙げられるが、高いCTL誘導能力を有する樹状細胞を使用することが好ましい。ケモカイン、サイトカイン、腫瘍壊死因子、および化学療法剤などの、がん療法のために使用されることが公知の他の任意の原料成分を本発明の医薬組成物に含有させることができる。
本発明の医薬組成物は、限定は意図されないが例えば以下の作用機序により、がん細胞の殺傷のために有用であると考えられる。そのため、本明細書に記載の実施形態のいずれかによるエピトープを順位付けする方法の実行により同定されたネオペプチドを含む、がんの治療において使用するための医薬組成物が開示される。特定のがん患者への本発明の医薬組成物の投与は、医薬組成物中のネオペプチドが、それが抗原提示細胞表面上のHLA分子に結合した状態で提示されることを結果としてもたらす。そのような抗原提示細胞上のネオペプチドを認識すると、CTLは活性化され、増殖し、全身に循環する。ネオペプチド特異的CTLががん組織に入った場合、それは、がん細胞表面上に存在するHLA分子に天然に結合する、特有のがん抗原に由来する同じネオペプチドを認識してがん細胞を殺傷する。そのような作用はがん治療に寄与する。そのため、さらなる実施形態では、本発明は、それを必要とする対象においてがんを治療する方法に関する。
本発明の医薬組成物は、がんを治療するためだけではなく、がんを予防するためにも使用することができる。例えば、健常なヒト身体への本発明の医薬組成物の投与はCTLを誘導し、誘導された細胞傷害性T細胞は身体中に留まるため、特定のがん細胞が存在する場合にがん細胞を損傷することができる。同様に、組成物は、がんの再発を予防するためにがんの治療後にヒト身体に投与されてもよい。そのような事例の両方において、医薬組成物はワクチン組成物である。
本明細書において、「がん」という用語はその最も広い意味において使用される。がんの例としては、星状細胞腫、乏突起膠腫、髄膜腫、神経線維腫、膠芽腫、上衣腫、神経鞘腫、神経線維肉腫、神経芽腫、下垂体腫瘍(例えば、下垂体腺腫)、髄芽腫、黒色腫、脳腫瘍、前立腺がん、頭頸部がん、食道がん、腎臓がん、腎細胞がん、膵臓がん、乳がん、肺がん、結腸がん、結腸直腸がん、胃がん、皮膚がん、卵巣がん、膀胱がん、線維肉腫、扁平細胞がん、神経外胚葉性腫瘍、甲状腺腫瘍、リンパ腫、白血病、多発性骨髄腫、肝細胞がん、中皮腫および類表皮がんが挙げられるがそれに限定されない。
本発明の医薬組成物は、水性溶媒中に溶解し、薬学的に許容される塩の形態で製剤化し、患者に投与することができる。そのような薬学的に許容される塩の形態の例としては、生理学的に許容される水溶性塩、例えば、ナトリウム、カリウム、マグネシウム、またはカルシウムの塩の形態で生理的pHにおいて緩衝化された形態が挙げられる。水溶性溶媒に加えて、非水溶性溶媒もまた使用することができ、そのような非水溶性溶媒の例としては、エタノールおよびプロピレングリコールなどのアルコールが挙げられる。
本実施形態の医薬組成物を含有する製剤は、様々な目的のための剤を含有してもよく、そのような剤の例としては、防腐剤および緩衝剤が挙げられる。防腐剤の例としては、重亜硫酸ナトリウム、重硫酸ナトリウム、チオ硫酸ナトリウム、塩化ベンザルコニウム、クロロブタノール、チメロサール、酢酸フェニル水銀、硝酸フェニル水銀、メチルパラベン、ポリビニルアルコール、フェニルエチルアルコール、アンモニア、ジチオトレイトール、およびベータ-メルカプトエタノールが挙げられる。緩衝剤の例としては、炭酸ナトリウム、ホウ酸ナトリウム、リン酸ナトリウム、酢酸ナトリウム、および重炭酸ナトリウムが挙げられる。これらの剤は、系のpHを2~9、好ましくは4~8に維持することができる量で存在することができる。
本発明の医薬組成物の投薬形態は特に限定されないが、ワクチンの形態において使用される場合、その投薬形態の例としては、注射(筋肉内、皮下、および皮内)、経口製剤、ならびに点鼻製剤が挙げられる。本発明の医薬組成物がワクチンの形態である場合、それは、複数の活性原料成分を含有する混合カクテルワクチンであってもよい。例えば、そのようなワクチンは、本発明のネオペプチドのいずれか2つもしくはより多くを含有することができ、または他の活性原料成分との組合せにより複数の活性原料成分を含有することができる。
本発明のワクチンは、それ自体は活性を有さず、ワクチンとしての医薬組成物の効果をさらに増進する効果を有する、医薬組成物以外の原料成分である原料成分を含有する不活性原料成分含有ワクチンであってもよい。不活性原料成分の例としては、アジュバントおよびトキソイドが挙げられる。アジュバントの例としては、限定は意図されないが、沈殿種のもの、例えば、水酸化アルミニウム、リン酸アルミニウム、およびリン酸カルシウム、ならびに油性種のもの、例えば、フロイント完全アジュバントおよびフロイント不完全アジュバントが挙げられる。
ワクチンの形態で存在する場合、本発明の医薬組成物は、好ましくは、経口的に、または注射もしくは注入、例えば、皮内、皮下、もしくは筋肉内投与により、または鼻もしくは咽頭などの粘膜を通じた皮膚投与もしくは吸入により、身体中に投与される。その単回用量は、細胞傷害性T細胞を有意に誘導できる用量および有意な数の非がん細胞が傷害を経験する用量の間に設定することができる。
本発明の医薬組成物は、ヒト身体への投与のためだけではなく、体外使用のためにも想定される。より特には、本発明の医薬組成物は、in vitroまたはex vivoで抗原提示細胞を刺激してそのCTL誘導活性を増加させる目的のために使用されてもよい。例えば、本発明の医薬組成物ががんに対する樹状細胞療法のために使用される場合、組成物を、がんの治療または予防を必要とする患者に由来する樹状細胞などの抗原提示細胞と事前に接触させ、続いて抗原提示細胞を患者の身体に戻すことにより患者に投与することができる。医薬組成物中に含有されるペプチドは、例えば、リポフェクション法または注射法により、抗原提示細胞に導入することができる。本発明のペプチドをコードするポリヌクレオチドがそのような応用において使用される場合、ポリヌクレオチドは、当該技術分野において公知の技術により抗原提示細胞に導入することができる。例えば、患者に由来する抗原提示細胞は、目的のポリヌクレオチドまたは該ポリヌクレオチドをコードするベクターを使用してリポフェクション法、エレクトロポレーション法、微量注射法、細胞融合法、DEAEデキストラン法、またはリン酸カルシウム法などによりin vitroで形質転換されてもよい。
本発明は、治療有効用量で本発明による薬剤を投与することによりがんを治療する方法を含む。治療有効用量は、例えば、患者の症状、年齢、性別、体重および感受性の差異、調製物の投与方法、投与間隔および種類に依存して当業者により適切に決定され得る。
本発明のネオペプチドは、ヒト身体への投与のためだけではなく、体外使用のためにも想定される。より特には、本発明のネオペプチドは、in vitroまたはex vivoで抗原提示細胞を刺激してそのCTL誘導活性を増加させる目的のために使用されてもよい。例えば、本発明のネオペプチドが樹状細胞療法のために使用される場合、ネオペプチドを、免疫誘導を必要とする患者に由来する樹状細胞などの抗原提示細胞と事前に接触させ、続いて抗原提示細胞を患者の身体に戻すことにより患者に投与することができる。ネオペプチドは、例えば、リポソーム(リポフェクション法)または注射法を介するトランスフェクションにより、抗原提示細胞に導入することができる。本発明のネオペプチドをコードするポリヌクレオチドがそのような応用において使用される場合、ポリヌクレオチドは、当該技術分野において公知の技術により抗原提示細胞に導入することができる。例えば、患者に由来する抗原提示細胞は、目的のポリヌクレオチドまたは該ポリヌクレオチドを発現するベクターを使用してリポフェクション法、エレクトロポレーション法、微量注射法、細胞融合法、DEAEデキストラン法、またはリン酸カルシウム法などによりin vitroで形質転換されてもよい。
本明細書において使用される場合、「免疫誘導」は、免疫応答を誘導すること、例えば、抗原提示細胞のCTL誘導活性を増加させること、およびさらにがん細胞に対するCTLの細胞傷害活性を増加させることを意味する。本明細書において使用される場合、「CTL誘導」は、ある特定の抗原を特異的に認識するCTLを誘導しもしくは増殖させること、またはナイーブT細胞を、がん細胞などの標的細胞を殺傷する能力(細胞傷害活性)を有するエフェクター細胞に分化させること、および/またはin vitroもしくはin vivoでの抗原提示細胞表面上の本発明のペプチドの提示によりCTLの細胞傷害活性を増加させることを意味する。
本発明を図面および以上の記載において詳細に実例による説明および記載をしてきたが、そのような説明および記載は、実例的または例示的なものであり、限定的なものではないと考えられるべきである。以下の請求項の範囲内で変更および改変が当業者により為され得ることが理解される。特に、本発明は、以上および以下に記載の異なる実施形態からの特徴の任意の組合せを有するさらなる実施形態をカバーする。追加的に、本発明を特徴付ける本明細書において為された記載は、本発明の一実施形態を参照し、必ずしも全ての実施形態を参照するものではない。
請求項において使用される用語は、以上の記載と合致する最も広い合理的な解釈を有するものと解されるべきである。例えば、要素の導入における冠詞「a」または「the」の使用は、複数の要素の排除として解釈されるべきではない。同様に、「または」という記載は包含的であると解釈されるべきであり、「AまたはB」という記載は、AおよびBのうちの1つのみが意図されることが文脈または以上の記載から明確でなければ、「AおよびB」を排除するものではない。さらに、「A、BおよびCのうちの少なくとも1つ」という記載は、A、BおよびCからなる要素の群のうちの1つまたは複数として解釈されるべきであり、A、BおよびCがカテゴリーまたはその他として関連しているのかどうかにかかわらず、列記される要素A、BおよびCのそれぞれの少なくとも1つを要求するものと解釈されるべきではない。さらに、「A、Bおよび/またはC」または「A、BまたはCのうちの少なくとも1つ」という記載は、列記される要素からの任意の単数の実体、例えば、A、列記される要素からの任意のサブセット、例えば、AおよびB、または要素A、BおよびCのリスト全体を含むものと解釈されるべきである。

Claims (10)

  1. コンピューターにより実施される、個別化された免疫療法のための標的としてネオ抗原に由来するエピトープを順位付けする方法であって、
    がん患者の患者データに基づいて候補エピトープを収集するステップ、
    前記候補エピトープのそれぞれについてスコアのセットを算出するステップであって、前記候補エピトープのうちの各々の1つについての前記セットのうちの各々の1つにおける前記スコアのそれぞれが、前記がん患者において免疫応答を誘発する、候補エピトープのうちの前記各々の1つの可能性の独立した度合を表す、ステップ、
    スコアの前記セットのそれぞれにおける前記スコアを前記候補エピトープのそれぞれについての単一のスコアに組み合わせるステップであって、各場合における前記候補エピトープについての前記単一のスコアが、前記患者において前記免疫応答を誘発する全体的な可能性を反映する、ステップ、
    前記エピトープの実験的に検証された特性および前記エピトープについてのドメインナレッジを抽出するステップ、
    前記実験的に検証された特性および前記ドメインナレッジに基づいて前記エピトープのそれぞれをベクトル空間に埋め込むステップ、および、
    前記免疫療法のために前記単一のスコアを使用して前記候補エピトープを順位付けするステップ
    を含
    前記埋め込みは、表現学習埋め込みフレームワークを使用して行われ、前記表現学習埋め込みフレームワークが、ノードが前記エピトープを表し、エッジが、予め定義された閾値より高い類似度を有するエピトープを接続する、親和性グラフを使用し、前記ノードの属性が少なくとも、前記実験由来の特性および前記ドメインナレッジを含み、埋め込み関数が、前記属性を数ベクトルにマッピングするために前記属性のそれぞれについて学習される、
    方法。
  2. スコアの前記セットのそれぞれが少なくとも、前記がん患者に特異的なHLAアレルを使用して決定されるヒト白血球抗原(HLA)結合の可能性を指し示す第1のスコア、および前記がん患者に特異的な健常リボ核酸(RNA)配列データを使用して同定されるT細胞受容体(TCR)レパートリーを使用して予測されるT細胞応答を指し示す第2のスコアを含む、請求項1に記載の方法。
  3. スコアの前記セットのそれぞれが、前記がん患者に特異的な腫瘍RNA配列データに基づく第3のスコアをさらに含む、請求項2に記載の方法。
  4. 前記候補エピトープが、前記単一のスコアおよび前記埋め込みに基づいて順位付けされ
    前記順位付けが、前記ベクトル空間中の最大加重距離の順序で行われ、各場合における前記加重距離が、前記候補エピトープのうちの各々の1つについての前記単一のスコアを掛けた前記ベクトル空間中のユークリッド距離に基づいて決定され、その結果、前記ベクトル空間の原点からの最大加重距離を有する前記候補エピトープのうちの1つが第1に順位付けされ、続いて前記最上位のエピトープからの最大加重差異を有する前記候補エピトープのうちの1つが順位付けされる、請求項に記載の方法。
  5. 前記埋め込みが、前記エピトープの生化学的特性のベクトル表現を含む、請求項に記載の方法。
  6. 前記埋め込みが、前記エピトープのアミノ酸配列のベクトル表現を含む、請求項に記載の方法。
  7. 個別化された免疫療法のための標的としてネオ抗原に由来するエピトープを順位付けするためのコンピューターシステムであって、前記コンピューターシステムが、メモリーおよび1つまたは複数のプロセッサーを含み、前記1つまたは複数のプロセッサーが、単独または組合せで、
    がん患者の患者データに基づいて候補エピトープを収集するステップ、
    前記候補エピトープのそれぞれについてスコアのセットを算出するステップであって、前記候補エピトープのうちの各々の1つについての前記セットのうちの各々の1つにおける前記スコアのそれぞれが、前記がん患者において免疫応答を誘発する、候補エピトープのうちの前記各々の1つの可能性の独立した度合を表す、ステップ、
    スコアの前記セットのそれぞれにおける前記スコアを前記候補エピトープのそれぞれについての単一のスコアに組み合わせるステップであって、各場合における前記候補エピトープについての前記単一のスコアが、前記患者において前記免疫応答を誘発する全体的な可能性を反映する、ステップ、
    前記エピトープの実験的に検証された特性および前記エピトープについてのドメインナレッジを抽出するステップ、
    前記実験的に検証された特性および前記ドメインナレッジに基づいて前記エピトープのそれぞれをベクトル空間に埋め込むステップ、および、
    前記免疫療法のために前記単一のスコアを使用して前記候補エピトープを順位付けするステップ
    を含む方法の実行を提供するように構成されており
    前記埋め込みは、表現学習埋め込みフレームワークを使用して行われ、前記表現学習埋め込みフレームワークが、ノードが前記エピトープを表し、エッジが、予め定義された閾値より高い類似度を有するエピトープを接続する、親和性グラフを使用し、前記ノードの属性が少なくとも、前記実験由来の特性および前記ドメインナレッジを含み、埋め込み関数が、前記属性を数ベクトルにマッピングするために前記属性のそれぞれについて学習される、
    コンピューターシステム。
  8. スコアの前記セットのそれぞれが少なくとも、前記がん患者に特異的なHLAアレルを使用して決定されるヒト白血球抗原(HLA)結合の可能性を指し示す第1のスコア、および前記がん患者に特異的な健常リボ核酸(RNA)配列データを使用して同定されるT細胞受容体(TCR)レパートリーを使用して予測されるT細胞応答を指し示す第2のスコアを含む、請求項に記載のコンピューターシステム。
  9. 前記候補エピトープが、前記単一のスコアおよび前記埋め込みに基づいて順位付けされ
    前記順位付けが、前記ベクトル空間中の最大加重距離の順序で行われ、各場合における前記加重距離が、前記候補エピトープのうちの各々の1つについての前記単一のスコアを掛けた前記ベクトル空間中のユークリッド距離に基づいて決定され、その結果、前記ベクトル空間の原点からの最大加重距離を有する前記候補エピトープのうちの1つが第1に順位付けされ、続いて前記最上位のエピトープからの最大加重差異を有する前記候補エピトープのうちの1つが順位付けされる、請求項に記載のコンピューターシステム。
  10. メモリーを使用して、単独または組合せで、1つまたは複数のプロセッサーにより実行されると、
    がん患者の患者データに基づいて候補エピトープを収集するステップ、
    前記候補エピトープのそれぞれについてスコアのセットを算出するステップであって、前記候補エピトープのうちの各々の1つについての前記セットのうちの各々の1つにおける前記スコアのそれぞれが、前記がん患者において免疫応答を誘発する、候補エピトープのうちの前記各々の1つの可能性の独立した度合を表す、ステップ、
    スコアの前記セットのそれぞれにおける前記スコアを前記候補エピトープのそれぞれについての単一のスコアに組み合わせるステップであって、各場合における前記候補エピトープについての前記単一のスコアが、前記患者において前記免疫応答を誘発する全体的な可能性を反映する、ステップ、
    前記エピトープの実験的に検証された特性および前記エピトープについてのドメインナレッジを抽出するステップ、
    前記実験的に検証された特性および前記ドメインナレッジに基づいて前記エピトープのそれぞれをベクトル空間に埋め込むステップ、および、
    疫療法のために前記単一のスコアを使用して前記候補エピトープを順位付けするステップ、
    を含む方法の実行を提供する命令を有
    前記埋め込みは、表現学習埋め込みフレームワークを使用して行われ、前記表現学習埋め込みフレームワークが、ノードが前記エピトープを表し、エッジが、予め定義された閾値より高い類似度を有するエピトープを接続する、親和性グラフを使用し、前記ノードの属性が少なくとも、前記実験由来の特性および前記ドメインナレッジを含み、埋め込み関数が、前記属性を数ベクトルにマッピングするために前記属性のそれぞれについて学習される、
    非一時的なコンピューター読取り可能な媒体。
JP2021519744A 2018-11-21 2019-11-20 ネオ抗原ベースの免疫療法のためのエピトープを標的化する方法およびシステム Active JP7140280B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201862770220P 2018-11-21 2018-11-21
US62/770,220 2018-11-21
US201916392658A 2019-04-24 2019-04-24
US16/392,658 2019-04-24
PCT/EP2019/081960 WO2020104539A1 (en) 2018-11-21 2019-11-20 Method and system of targeting epitopes for neoantigen-based immunotherapy

Publications (2)

Publication Number Publication Date
JP2022504635A JP2022504635A (ja) 2022-01-13
JP7140280B2 true JP7140280B2 (ja) 2022-09-21

Family

ID=67658382

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021519744A Active JP7140280B2 (ja) 2018-11-21 2019-11-20 ネオ抗原ベースの免疫療法のためのエピトープを標的化する方法およびシステム

Country Status (10)

Country Link
US (1) US20210391031A1 (ja)
EP (1) EP3844756A1 (ja)
JP (1) JP7140280B2 (ja)
KR (1) KR20210064229A (ja)
CN (1) CN112805784A (ja)
AU (1) AU2019382854B2 (ja)
BR (1) BR112021005353A2 (ja)
CA (1) CA3115017C (ja)
SG (1) SG11202102582TA (ja)
WO (1) WO2020104539A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114846560A (zh) * 2019-10-21 2022-08-02 赛诺菲巴斯德股份有限公司 用于预测生物应答的系统和方法
WO2023147530A1 (en) * 2022-01-31 2023-08-03 The Board Of Regents Of The University Of Texas System Tcr-repertoire functional units

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016521128A (ja) 2013-05-10 2016-07-21 バイオエヌテック アーゲーBioNTech AG T細胞エピトープの免疫原性の予測
WO2018183980A2 (en) 2017-03-31 2018-10-04 Pei Jia Yang Ranking system for immunogenic cancer-specific epitopes

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3998481A1 (en) 2014-09-10 2022-05-18 F. Hoffmann-La Roche AG Immunogenic mutant peptide screening platform
WO2016040110A1 (en) 2014-09-10 2016-03-17 The University Of Connecticut Identification of immunologically protective neo-epitopes for the treatment of cancers
US10210246B2 (en) * 2014-09-26 2019-02-19 Oracle International Corporation Techniques for similarity analysis and data enrichment using knowledge sources
RU2729116C2 (ru) 2015-12-16 2020-08-04 Гритстоун Онколоджи, Инк. Идентификация, производство и применение неоантигенов

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016521128A (ja) 2013-05-10 2016-07-21 バイオエヌテック アーゲーBioNTech AG T細胞エピトープの免疫原性の予測
WO2018183980A2 (en) 2017-03-31 2018-10-04 Pei Jia Yang Ranking system for immunogenic cancer-specific epitopes

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Anne-Mette Bjerregaard, et al.,MuPeXI: prediction of neo-epitopes from tumor sequencing data,online,2017年04月20日,[検索日:2022年4月26日], <URL:htttps://pubmed.ncbi.nlm.nih.gov/28429069/>
Emmi Jokinen, et al.,Determining epitope specificity of T cell receptors with TCRGP,online,2019年08月21日,第1-17ページ,[検索日:2022年4月26日], <URL:htttps://www.biorxiv.org/content/10.1101/542332v2.full.pdf>
Liu X shirley, et al.,Applications of Immunogenomics to Cancer,online,2017年02月09日,Abstract,[検索日:2022年4月26日], <URL:https://pubmed.ncbi.nlm.nig.gov/28187283/>

Also Published As

Publication number Publication date
CA3115017A1 (en) 2020-05-28
CA3115017C (en) 2023-10-31
AU2019382854B2 (en) 2023-04-20
WO2020104539A1 (en) 2020-05-28
KR20210064229A (ko) 2021-06-02
AU2019382854A1 (en) 2021-04-29
EP3844756A1 (en) 2021-07-07
US20210391031A1 (en) 2021-12-16
SG11202102582TA (en) 2021-04-29
CN112805784A (zh) 2021-05-14
JP2022504635A (ja) 2022-01-13
BR112021005353A2 (pt) 2021-06-15

Similar Documents

Publication Publication Date Title
CN104662171B (zh) 个性化癌症疫苗和过继免疫细胞治疗
JP2020536553A5 (ja)
KR20190140935A (ko) 신생항원 동정, 제조, 및 용도
TWI672503B (zh) 致免疫性之癌症特異抗原決定位的排名系統
KR20230042048A (ko) 펩타이드 결합, 제시, 및 면역원성을 예측하기 위한 어텐션-기반 신경망
CN108601731A (zh) 新抗原的鉴别、制造及使用
Zahroh et al. Immunoinformatics approach in designing epitope-based vaccine against meningitis-inducing bacteria (Streptococcus pneumoniae, Neisseria meningitidis, and Haemophilus influenzae type b)
Logunova et al. MHC-II alleles shape the CDR3 repertoires of conventional and regulatory naïve CD4+ T cells
CN105451759A (zh) 预测t细胞表位的免疫原性
BR112021005702A2 (pt) método para selecionar neoepítopos
US20190080044A1 (en) Monitoring and diagnosis for immunotherapy, and design for therapeutic agent
JP7140280B2 (ja) ネオ抗原ベースの免疫療法のためのエピトープを標的化する方法およびシステム
CA3217623A1 (en) Compositions and method for optimized peptide vaccines using residue optimization
US20230047716A1 (en) Method and system for screening neoantigens, and uses thereof
Olsen et al. Bioinformatics for cancer immunotherapy target discovery
Qasim et al. Computer-aided genomic data analysis of drug-resistant Neisseria gonorrhoeae for the Identification of alternative therapeutic targets
WO2023089203A1 (en) Methods for predicting immunogenicity of mutations or neoantigenic peptides in tumors
WO2022204566A1 (en) Using neural networks to predict peptide immunogenicity
Ehrlich et al. Computational Methods for Predicting Key Interactions in T Cell–Mediated Adaptive Immunity
CN113316818A (zh) 新生抗原的鉴定方法
CN116710115A (zh) 用于优化的肽疫苗的组合物和方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210409

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220510

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220623

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220809

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220822

R151 Written notification of patent or utility model registration

Ref document number: 7140280

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151