JP2023524048A - 癌の免疫療法のための複合バイオマーカー - Google Patents

癌の免疫療法のための複合バイオマーカー Download PDF

Info

Publication number
JP2023524048A
JP2023524048A JP2022566109A JP2022566109A JP2023524048A JP 2023524048 A JP2023524048 A JP 2023524048A JP 2022566109 A JP2022566109 A JP 2022566109A JP 2022566109 A JP2022566109 A JP 2022566109A JP 2023524048 A JP2023524048 A JP 2023524048A
Authority
JP
Japan
Prior art keywords
data
genomic
transcriptome
indices
generating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022566109A
Other languages
English (en)
Inventor
ウィルバー アボット ザ サード チャールズ
マイケル ボイル ショーン
マーティ パイク レイチェル
レビー エリック
メラチェルーブ ダッタトレヤ
マクロリー リーナ
チェン リチャード
パワー ロバート
バーサ ガーボル
ハリス ジェイソン
ミラーニ パメラ
タンドン プラティーク
マクニット ポール
モラ マッシモ
デサイ セジャル
サルビダー ジュアン-セバスチャン
クラーク マイケル
ハウデンシルド クリスチャン
ウエスト ジョン
フィリップス ニック
ブイ.チャン シモ
Original Assignee
パーソナリス,インコーポレイティド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by パーソナリス,インコーポレイティド filed Critical パーソナリス,インコーポレイティド
Publication of JP2023524048A publication Critical patent/JP2023524048A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Data Mining & Analysis (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Pathology (AREA)
  • Immunology (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Physiology (AREA)
  • Software Systems (AREA)
  • Public Health (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Oncology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Hospice & Palliative Care (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

特定の型の免疫療法治療に対する対象の応答性の予測水準を特定する複合バイオマーカーを生成する方法が提供される。この方法は、1つ以上のDNA配列に対応する1つ以上の特性を表すゲノム指標を生成することを含むことができる。この方法はまた、1つ以上のRNA配列の対応するRNA配列から翻訳される一組のペプチドに対応する1つ以上の特性を表すトランスクリプトーム指標を生成することを含むことができる。この方法はまた、一組のゲノム指標および一組のトランスクリプトーム指標に由来する複合バイオマーカースコアを生成することを含むことができる。この方法はまた、複合バイオマーカースコアに基づいて、特定の型の免疫療法治療に対する対象の応答性の予測水準を決定することを含むことができる。【選択図】図1

Description

発明の分野
本開示は一般的に、生体試料に由来するゲノム指標およびトランスクリプトーム指標に基づいて複合バイオマーカーを決定するシステムおよび方法に関する。より詳しくは、限定はされないが、本開示は、ゲノム指標およびトランスクリプトーム指標に基づいて、特定の型の免疫療法治療に対する対象の応答性の予測水準を特定する複合バイオマーカースコアを決定することに関する。
関連特許の相互参照
本出願は、2020年4月29日付けの米国仮特許出願第63/017,542号および2020年6月18日付けの米国仮特許出願第63/040,943号に対する優先権を主張する。それぞれの出願は、全ての目的のためにその全体が参照により本明細書に組み込まれる。
免疫療法は、多くの癌および自己免疫疾患の治療に使用される。免疫チェックポイント遮断療法は、種々の悪性腫瘍に対する有効な形態の癌治療として知られているが、これらの療法に対する対象の応答性を一貫して予測する診断バイオマーカーは依然として見い出せていない。免疫療法に対する免疫系の耐性の極めて多様かつ複雑な性質ならびに治療に関連する潜在的な毒性を考慮すると、特定の免疫療法に対する治療応答性を正確に予測することは困難な可能性がある。
免疫ゲノミクスが、免疫療法の治療効力を判断できる技術として登場してきた。この技術により、癌の効果的な治療法の決定に繋がることができ、いくつかの新たな治療法、診断法、およびプロセスの発見に寄与できる可能性がある。例えば免疫ゲノミクスを用いて新生抗原を特定することが可能となり、この方法は、癌の正確な治療法および診断法の開発に貢献できる。さらにバリアントコールなどのゲノムデータは、複雑な免疫系応答および癌免疫療法に対する耐性に関する見識を提供できる。但し標的を絞った診断のための癌判定項目を用いる従来からの技術では、限られたデータ量しか提供されず、統合的な複合バイオマーカーの開発にとっては信頼性に乏しい可能性がある。
実施態様によっては、特定の型の免疫療法治療に対する対象の応答性の予測水準を特定する複合バイオマーカースコアを決定する方法およびシステムが提供される。免疫ゲノミクス解析システムは、対象の生体試料を処理して生成されたゲノムデータおよびトランスクリプトームデータを入手する。場合によっては、生体試料は1つ以上の癌細胞を含む。ゲノムデータは、生体試料中の1つ以上のDNA配列を特定でき、ここでは全エクソーム配列決定を実施して1つ以上のDNA配列を特定できる。トランスクリプトームデータは、生体試料中の1つ以上のRNA配列を特定でき、ここではトランスクリプトーム配列決定を用いて1つ以上のRNA配列を特定できる。さらにまたはあるいは、ゲノムデータおよびトランスクリプトームデータは、対象の生体試料および基準生体試料を含む試料対から生成でき、ここで基準生体試料は1つ以上の癌細胞を含まない。
免疫ゲノミクス解析システムでは、ゲノムデータを処理して一組のゲノム指標を生成する。ゲノム指標のそれぞれの組は、対応するDNA配列に対応する1つ以上の特性を1つ以上のDNA配列として表すことができる。場合によっては、一組のゲノム指標には、(i)1つ以上のDNA配列中の1つ以上の体細胞変異のそれぞれについて1つ以上の特性を表す定量指標または分類指標;(ii)ヘテロ接合性の喪失が生体試料の少なくとも1つのヒト白血球抗原(HLA)遺伝子内で発生したか否かを示す分類指標;および(iii)予測される腫瘍変異の負荷を表す定量指標または分類指標が含まれる。HLAのヘテロ接合性の喪失に関しては、対応する分類指標は、ゲノムデータをHLA欠失識別機械学習モデルに当てはめることで生成できる。
免疫ゲノミクス解析システムは、トランスクリプトームデータを処理して一組のトランスクリプトーム指標を生成する。一組のトランスクリプトーム指標のそれぞれは、1つ以上のRNA配列のうちの対応するRNA配列から翻訳される一組のペプチドに対応する1つ以上の特性を表すことができる。場合によっては、一組のトランスクリプトーム指標には、(i)生体試料の予測される新生抗原負荷を表す定量指標または分類指標;(ii)生体試料から検出された1つ以上の候補となる新生抗原のそれぞれの1つ以上の特性を表す定量指標または分類指標;(iii)細胞表面提示の喪失が検出される1つ以上のHLAタンパク質のそれぞれの1つ以上の特性を表す定量指標または分類指標;(iv)細胞表面提示の喪失が検出された1つ以上のHLAタンパク質をコードするHLA遺伝子に対応する1つ以上の特性を表す定量指標または分類指標;(v)免疫細胞に対応する配列の発現水準を表す定量指標または分類指標;および(vi)生体試料から検出された1つ以上のT細胞受容体の発現水準を表す定量指標または分類指標が含まれる。細胞表面提示の喪失が検出されるHLAタンパク質に関しては、対応する指標は、ゲノムデータおよびトランスクリプトームデータを新生抗原提示予測機械学習モデルに当てはめることで生成できる。
免疫ゲノミクス解析システムは、一組のゲノム指標および一組のトランスクリプトーム指標に由来する複合バイオマーカースコアを生成し、この複合バイオマーカースコアに基づいて、特定の型の免疫療法治療に対する対象の応答性の予測水準を決定する。場合によっては、免疫ゲノミクス解析システムでは、(i)一組のゲノム指標のうちのそれぞれのゲノム指標を、一組のトランスクリプトーム指標のうちの対応するトランスクリプトーム指標に基づいて決定された重み値で重み付けすること、および(ii)重み付けされたゲノム指標を用いて複合バイオマーカースコアを生成することによって、複合バイオマーカースコアを生成する。
免疫ゲノミクス解析システムは、対象の応答性の予測水準に対応する結果を出力する。この結果は、特定の治療に対する対象の応答性の予測水準に基づいて、(i)特定の治療の推奨;(ii)ヒト対象に対して特定の治療を施用する推奨;および/または(iii)ヒト対象に対して特定の治療を施用しない推奨を特定する報告であってもよい。実施態様によっては、推奨される治療をヒト対象に施用する。
実施態様によっては、非一時的な機械可読記憶媒体に確実に具現化され、かつ1つ以上のデータプロセッサに本明細書に開示の1つ以上の方法の一部または全部を実行させるように構成された命令を含むコンピュータプログラム製品が提供される。
本開示の実施態様によっては、1つ以上のデータプロセッサを含むシステムを含む。実施態様によっては、このシステムは、1つ以上のデータプロセッサで実行されると、1つ以上のデータプロセッサに本明細書に開示の1つ以上の方法の一部または全部および/または1つ以上のプロセスの一部または全部を実行させる命令を含む非一時的コンピュータ可読記憶媒体を含む。本開示の実施態様によっては、非一時的な機械可読記憶媒体に確実に具現化されたコンピュータプログラム製品を含み、これには、1つ以上のデータプロセッサに本明細書に開示の1つ以上の方法の一部または全部および/または1つ以上のプロセスの一部または全部を実行させるように構成された命令が含まれる。
使用されている用語および表現は、限定の目的ではなく説明の用語として用いられ、それらの用語および表現の使用では、表示かつ説明される特徴またはその一部の均等物を除外する意図はなく、様々な変更が本発明の特許請求の範囲内で可能であることは分かっている。従って当然のことであるが、特許請求される本発明は、実施態様および任意の特徴によって具体的に開示されているが、当業者なら本明細書に開示の趣旨の修正および変更を講じることができ、かつそのような修正および変更は、添付の特許請求の範囲によって定義される本発明の範囲内に含まれると考えられる。
本開示の特徴、実施態様、および利点は、以下の詳細な説明を以下の図面を参照して読み込むと、より明確に理解される。本特許または本出願ファイルには、少なくとも1色で作成された図面が含まれる。色刷り図面を含む本特許または本特許出願公開のコピーは、要求および必要な手数料の支払いに応じて特許庁から提供される。
図1は、いくつかの実施態様による、生体試料からゲノムデータおよびトランスクリプトームデータを生成するための概略図の一例を示す。 図2A~Bは、臨床集団の対象に対応するゲノムデータおよびトランスクリプトームデータ中の発癌性変化に対応する統計データを示す。 図2A~Bは、臨床集団の対象に対応するゲノムデータおよびトランスクリプトームデータ中の発癌性変化に対応する統計データを示す。 図3A~Cは、免疫系応答に関連する差分的に発現される遺伝子を特定するトランスクリプトーム指標に対応する統計データを示す。 図3A~Cは、免疫系応答に関連する差分的に発現される遺伝子を特定するトランスクリプトーム指標に対応する統計データを示す。 図3A~Cは、免疫系応答に関連する差分的に発現される遺伝子を特定するトランスクリプトーム指標に対応する統計データを示す。 図4は、差分的に調節された免疫経路ごとの正規化された富化スコアに対応する統計データを示す。 図5A~Cは、T細胞受容体の発現水準を特定するトランスクリプトーム指標に対応する統計データを示す。 図5A~Cは、T細胞受容体の発現水準を特定するトランスクリプトーム指標に対応する統計データを示す。 図5A~Cは、T細胞受容体の発現水準を特定するトランスクリプトーム指標に対応する統計データを示す。 図6は、第1群の応答対象と第2群の非応答対象との間の富化スコアの比較を特定する一組の箱ひげ図を示す。 図7A~Bは、種々の遺伝子および疾患部位に亘る新生抗原負荷を特定するトランスクリプトーム指標に対応する統計データを示す。 図7A~Bは、種々の遺伝子および疾患部位に亘る新生抗原負荷を特定するトランスクリプトーム指標に対応する統計データを示す。 図8A~Fは、種々の対象に亘る新生抗原負荷スコアを特定する統計データを示し、この新生抗原負荷スコアにより、免疫療法で治療された対象の応答性を予測できる。 図8A~Fは、種々の対象に亘る新生抗原負荷スコアを特定する統計データを示し、この新生抗原負荷スコアにより、免疫療法で治療された対象の応答性を予測できる。 図8A~Fは、種々の対象に亘る新生抗原負荷スコアを特定する統計データを示し、この新生抗原負荷スコアにより、免疫療法で治療された対象の応答性を予測できる。 図8A~Fは、種々の対象に亘る新生抗原負荷スコアを特定する統計データを示し、この新生抗原負荷スコアにより、免疫療法で治療された対象の応答性を予測できる。 図8A~Fは、種々の対象に亘る新生抗原負荷スコアを特定する統計データを示し、この新生抗原負荷スコアにより、免疫療法で治療された対象の応答性を予測できる。 図8A~Fは、種々の対象に亘る新生抗原負荷スコアを特定する統計データを示し、この新生抗原負荷スコアにより、免疫療法で治療された対象の応答性を予測できる。 図9A~Fは、発見コホートの各対象サンプルに存在する変異に関する1つ以上の特徴を特定する統計データを示す。 図9A~Fは、発見コホートの各対象サンプルに存在する変異に関する1つ以上の特徴を特定する統計データを示す。 図9A~Fは、発見コホートの各対象サンプルに存在する変異に関する1つ以上の特徴を特定する統計データを示す。 図9A~Fは、発見コホートの各対象サンプルに存在する変異に関する1つ以上の特徴を特定する統計データを示す。 図9A~Fは、発見コホートの各対象サンプルに存在する変異に関する1つ以上の特徴を特定する統計データを示す。 図9A~Fは、発見コホートの各対象サンプルに存在する変異に関する1つ以上の特徴を特定する統計データを示す。 図10は、種々のドライバー変異、疾患部位、および対象群に亘る腫瘍変異の負荷を特定する複数組の箱ひげ図を示す。 図11A~Dは、種々の対象に亘る複合バイオマーカースコアを特定する統計データを示し、この複合バイオマーカースコアは、免疫療法で治療された対象の応答性を予測する際の性能の改善を示している。 図11A~Dは、種々の対象に亘る複合バイオマーカースコアを特定する統計データを示し、この複合バイオマーカースコアは、免疫療法で治療された対象の応答性を予測する際の性能の改善を示している。 図11A~Dは、種々の対象に亘る複合バイオマーカースコアを特定する統計データを示し、この複合バイオマーカースコアは、免疫療法で治療された対象の応答性を予測する際の性能の改善を示している。 図11A~Dは、種々の対象に亘る複合バイオマーカースコアを特定する統計データを示し、この複合バイオマーカースコアは、免疫療法で治療された対象の応答性を予測する際の性能の改善を示している。 図12A~Bは、種々の対象に亘る複合バイオマーカースコアを特定する統計データを示し、この複合バイオマーカースコアは、集団中の対象の無増悪生存率および全生存率を予測する際の性能の改善を示している。 図12A~Bは、種々の対象に亘る複合バイオマーカースコアを特定する統計データを示し、この複合バイオマーカースコアは、集団中の対象の無増悪生存率および全生存率を予測する際の性能の改善を示している。 図13A~Bは、新生抗原提示の確率の低下に寄与する可能性があるHLA遺伝子に対する体細胞変異を特定する統計データを示す。 図13A~Bは、新生抗原提示の確率の低下に寄与する可能性があるHLA遺伝子に対する体細胞変異を特定する統計データを示す。 図14A~Bは、正常試料と特定の対象の対応する腫瘍試料との間のHLA配列の比較を特定する複数組の判定項目の例を示す。 図14A~Bは、正常試料と特定の対象の対応する腫瘍試料との間のHLA配列の比較を特定する複数組の判定項目の例を示す。 図15は、いくつかの実施態様による、複合バイオマーカースコアを生成する方法の一例を示す流れ図を含む。
I.概要
上述のように、チェックポイント阻害療法の効力は、腫瘍、対応する腫瘍微小環境、および対応する免疫系の間の複雑な相互作用を含む、種々の生体要因に依存する可能性がある。PD-L1発現、インターフェロン(IFN)-γに基づく符号、腫瘍変異の負荷、不一致の修復欠損、抗原提示機構内の変化を含む遺伝子変化、HLAのヘテロ接合性喪失、およびT細胞レパートリーの多様性を含む、免疫療法に対する免疫系の応答を特定するための多数のバイオマーカーが考察されている。
免疫チェックポイント遮断療法に対する免疫系応答に影響を及ぼすことができる多様な生体因子によって示されるように、様々な生体因子を組み込み、かつ免疫療法に対する免疫系応答を正確に予測できる統合的なバイオマーカーを指向する検討が拡大している。例えば従来からの技術では、試料の免疫原性および新生抗原クローン構造に対応する情報を組み合わせて、免疫チェックポイント遮断に対する免疫系応答を予測してきた。これらの従来からの技術によって生み出された結果により、黒色腫、肺がん、および腎臓がんを患う対象の予後を決定することを試みてきた。これらの従来からの技術は何らかの肯定的な結果をもたらしてきたが、従来からの技術では、免疫系の応答を一貫してかつ正確に予測できるデータの生成には依然不十分である。この課題は、腫瘍に対して免疫応答を促進する複雑なメカニズムに起因している可能性がある。さらにこれらの従来からの技術は、対象からの大量の試料を必要とし、これにより侵襲的なものとなり、いくつかの状況(例えば、対象が高齢や若齢または対象が妊娠中の状況)では入手が困難となる可能性がある。
従来からのシステムの少なくとも上記の欠点に対処するために、本発明の技術を用いて、特定の型の免疫療法治療に対する対象の応答性の予測水準を特定する複合バイオマーカースコアを決定できる。免疫ゲノミクス解析システムは、対象の生体試料を処理して生成されたゲノムデータおよびトランスクリプトームデータを入手する。場合によっては、生体試料は1つ以上の癌細胞を含む。このゲノムデータは、生体試料中の1つ以上のDNA配列を特定でき、ここでは全エクソーム配列決定を実行して1つ以上のDNA配列を特定できる。このトランスクリプトームデータは、生体試料中の1つ以上のRNA配列を特定でき、ここではトランスクリプトーム配列決定を用いて1つ以上のRNA配列を特定できる。さらにまたはあるいは、ゲノムデータおよびトランスクリプトームデータは、対象の生体試料および基準生体試料を含む試料対から生成でき、ここで基準生体試料は1つ以上の癌細胞を含まない。
免疫ゲノミクス解析システムは、ゲノムデータを処理して、一組のゲノム指標を生成する。一組のゲノム指標のそれぞれは、対応するDNA配列に対応する1つ以上の特性を1つ以上のDNA配列として表すことができる。場合によっては、一組のゲノム指標には、(i)1つ以上のDNA配列中の1つ以上の体細胞変異のそれぞれについて1つ以上の特性を表す定量指標または分類指標;(ii)ヘテロ接合性の喪失が生体試料の少なくとも1つのヒト白血球抗原(HLA)遺伝子内で発生したか否かを示す分類指標;および(iii)予測される腫瘍変異の負荷を表す定量指標または分類指標が含まれる。HLAのヘテロ接合性の喪失に関しては、対応する分類指標は、ゲノムデータをHLA欠失識別機械学習モデルに当てはめることで生成できる。
免疫ゲノミクス解析システムは、トランスクリプトームデータを処理して一組のトランスクリプトーム指標を生成する。トランスクリプトーム指標のそれぞれの組は、1つ以上のRNA配列のうちの対応するRNA配列から翻訳される一組のペプチドに対応する1つ以上の特性を表すことができる。場合によっては、一組のトランスクリプトーム指標には、(i)生体試料の予測される新生抗原負荷を表す定量指標または分類指標;(ii)生体試料から検出された1つ以上の候補となる新生抗原のそれぞれの1つ以上の特性を表す定量指標または分類指標;(iii)細胞表面提示の喪失が検出される1つ以上のHLAタンパク質のそれぞれの1つ以上の特性を表す定量指標または分類指標;(iv)細胞表面提示の喪失が検出された1つ以上のHLAタンパク質をコードするHLA遺伝子に対応する1つ以上の特性を表す定量指標または分類指標;(v)免疫細胞に対応する配列の発現水準を表す定量指標または分類指標;および(vi)生体試料から検出された1つ以上のT細胞受容体の発現水準を表す定量指標または分類指標が含まれる。細胞表面提示の喪失が検出されるHLAタンパク質に関しては、対応する指標は、ゲノムデータおよびトランスクリプトームデータを新生抗原提示予測機械学習モデルに当てはめることで生成できる。
免疫ゲノミクス解析システムは、一組のゲノム指標および一組のトランスクリプトーム指標に由来する複合バイオマーカースコアを生成し、この複合バイオマーカースコアに基づいて、特定の型の免疫療法治療に対する対象の応答性の予測水準を決定する。場合によっては、免疫ゲノミクス解析システムでは、(i)一組のゲノム指標のうちのそれぞれのゲノム指標を、一組のトランスクリプトーム指標のうちの対応するトランスクリプトーム指標に基づいて決定された重み値で重み付けすること、および(ii)重み付けされたゲノム指標を用いて複合バイオマーカースコアを生成することによって、複合バイオマーカースコアを生成する。
免疫ゲノミクス解析システムは、対象の応答性の予測水準に対応する結果を出力する。この結果は、特定の治療に対する対象の応答性の予測水準に基づいて、(i)特定の治療の推奨;(ii)ヒト対象に対して特定の治療を施用する推奨;および/または(iii)ヒト対象に対して特定の治療を施用しない推奨を特定する報告であってもよい。実施態様によっては、推奨される治療をヒト対象に施用する。
従って本開示の実施態様は、検証され強化されたエキソームおよびトランスクリプトームに基づく腫瘍鑑定プラットフォームに基づいて複合バイオマーカースコアを生成することによって、従来からの技術を超える技術的利点を提供する。特に複合バイオマーカースコアは、様々な腫瘍および免疫関連の分子メカニズムの特性を表す指標から決定でき、指標の生成に用いられる生体試料量を最小限にできる。このような技術は、大量の生体試料を取得する侵襲的な手順を必要とせずに、対応する対象の診断、予後判断、かつ/あるいは治療の推奨の精度を向上させる可能性がある。従って本開示の実施態様は、免疫療法に対する応答性および耐性を促進する生体メカニズムを特定することによって、その免疫療法治療に対する応答性を正確に予測するための複合免疫ゲノミクスフレームワークを提供する。
本開示の発明の種々の実施態様が本明細書に示されかつ説明されてきたが、それらの実施態様は単なる例として提供されていることは当業者には明白である。多くの変形、変更、および置換を、当業者なら本発明から逸脱することなく発案できる可能性がある。当然のことであるが、本明細書に記載の本発明の実施態様に対する種々の代替技術を、本明細書に説明される発明のいずれか1つを実施する際に使用してもよい。
II.定義
本発明の様々な実施態様が本明細書に示されかつ説明されてきたが、それらの実施態様は単なる例として提供されていることは当業者には明白である。多くの変形、変更、および置換を、当業者なら本発明から逸脱することなく発案できる可能性がある。当然のことであるが、本明細書に記載の本発明の実施態様に対する種々の代替技術を使用してもよい。
本明細書で使用される用語「癌」または「悪性腫瘍」は、一般的に、身体の細胞が停止することなく分裂して周囲の組織内に拡大する関連疾患の集合を指す。癌は身体のほぼどこからでも発生し、老化細胞、異常細胞、または損傷細胞を除去かつ置換する規則的プロセスが中断される場合に増殖し、これらの細胞は、それらが死滅すべき際に生き残り、あるいはそれらが不必要な際に新たな細胞が形成される。これらの細胞は停止することなく分裂し、それらの起点からの近傍の組織および遠方の組織の両方に拡大しかつ浸潤することができる。
本明細書で使用される用語「新生抗原」は、一般に免疫系によって過去に認識されたことのない新たに形成された抗原を指す。新生抗原は、腫瘍の変異の結果として形成される腫瘍タンパク質の変化から生じる可能性がある。新生抗原は、MHCクラスI分子およびクラスII分子表面に負荷されて、T細胞に提示され得る体細胞変異の部分集合を構成する可能性がある。これらの新生抗原は、免疫系によって内因性の腫瘍特異的(非自己性の)標的として認識されてもよい。
本明細書で使用される用語「腫瘍微小環境」は、周囲の血管、免疫細胞、線維芽細胞、シグナル伝達分子、および細胞外マトリックスを含む腫瘍周りの環境を指す。腫瘍およびその微小環境は密接に関連していて、動的な相互性とともに常に相互作用している。腫瘍の進行は、癌細胞とそれらの環境の相互作用によって影響を受け、治療応答および治療耐性を形成する。
本明細書で使用される用語「バイオマーカー」は、(例えば疾患を持つ)第1の表現型を有する対象または対象群からの生体試料中に、(例えば疾患を持たない)第2の表現型を有する対象または対象群からの生体試料に比較して差分として存在する(すなわち増加または低下した)代謝産物またはそれに由来する小分子を指す。バイオマーカーは、任意の水準で差分として存在してもよいが、一般に少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも100%、少なくとも110%、少なくとも120%、少なくとも130%、少なくとも140%、少なくとも150%、またはそれ以上増大する水準で存在し、あるいは一般に少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または100%(すなわち存在しない)低下する水準で存在する。バイオマーカーは、統計的に有意な水準で差分として存在することが好ましい。
本明細書で使用される用語「水準」は、1つ以上のバイオマーカーの水準を指し、かつ試料中のバイオマーカーの絶対的または相対的な量または濃度を意味する。
本明細書で使用される用語「基準特性」は、健康な対象、あるいは病状、疾患、または身体障害のうちの1つ以上を示す代謝特性を指す。基準特性内には、1つ以上のバイオマーカーの絶対的または相対的な量または濃度、1つ以上のバイオマーカーの有無、1つ以上のバイオマーカーの量または濃度の範囲、1つ以上のバイオマーカーの最小および/または最大の量または濃度、1つ以上のバイオマーカーの量または濃度の平均値、および/または1つ以上のバイオマーカーの量または濃度の中央値であってもよい、1つ以上のバイオマーカー(それに由来する代謝物またはそれに由来する小分子)の基準水準が存在する。
本明細書で使用される用語「統計的に有意な」は、限定はされないが、例えば分散分析(ANOVA)またはウイルコクソンの順位和検定などのパラ指標統計またはノンパラ指標統計を用いて決定された、少なくとも約95%の信頼水準、好ましくは少なくとも約97%の信頼水準、より好ましくは少なくとも約98%の信頼水準、最も好ましくは少なくとも約99%の信頼水準を意味し、ウイルコクソンの順位和検定では、少なくとも約95%の信頼水準についてはp<0.05として表される。本明細書で使用される用語「免疫チェックポイント遮断」は、一般に免疫抑制分子の阻害によって免疫応答の終結に焦点を当て、それによって免疫応答の終結を防止する療法、あるいは免疫応答中に枯渇するTリンパ球を作動させる療法を指す。
用語「少なくとも~(at least)」、「~より大きい(greater than)」、または「~以上(greater than or equal to)」が、一連の2つ以上の数値の最初の数値の前にあるときは常に、用語「少なくとも~(at least)」、「~より大きい(greater than)」、または「~以上(greater than or equal to)」は、その一連の数値のうちのそれぞれの数値にも当てはまる。例えば1、2、または3以上は、1以上、2以上、または3以上と同等である。
用語「~を超えない(no more than)」、「~より小さい(less than)」、または「~以下(less than or equal to)」が、一連の2つ以上の数値の最初の数値の前にあるときは常に、用語「~を超えない(no more than)」、「~より小さい(less than)」、または「~以下(less than or equal to)」は、その一連の数値のうちのそれぞれの数値に当てはまる。例えば、3、2、または1以下は、3以下、2以下、または1以下と同等である。
特許請求の範囲および/または明細書内の用語「含む(comprising)」とともに使用される場合の「a」または「an」という単語の使用は、「1つ(one)」を意味することもあるが、それは「1つ以上(one or more)」、「少なくとも1つ(at least one)」、および「1つまたは1つ以上(one or more than one)」の意味とも一致している。
特許請求の範囲内での用語「または(or)」は、代替物のみを指すように、あるいは代替物が互いに排他的であることを明示的に示される場合を除いては、「および/または(and/or)」を意味するように使用されるが、本開示では、代替物のみならびに「および/または(and/or)」を指す定義を裏付けている。本明細書で使用される「別の(another)」は、少なくとも第2またはそれ以上を意味する場合がある。
用語「含む(comprise)」、「有する(have)」、および「含む(include)」は、非制限の連結動詞である。「含む(comprises)」、「含むこと(comprising)」、「有する(has)」、「有すること(having)」、「含む(includes)」、「含むこと(including)」などの1つ以上のこれらの動詞の任意の形態または時制もまた非制限を意味する。例えば、1つ以上の工程を「含む(comprises)」、「有する(has)」、または「含む(includes)」任意の方法は、それらの1つ以上の工程のみを所有することに限定されず、他の列記されていない工程をまた包含する。
III.免疫療法治療および免疫系の応答メカニズム
A.腫瘍微小環境
免疫系は、ウイルス、寄生虫、アレルギー源、癌などの広範囲の種々の抗原を検出し、異常物質、異常細胞、および/または異常組織に対して身体内で応答を開始する。悪性腫瘍の増殖を含む癌の増殖はまた、対象の免疫細胞によって認識されて、免疫応答を誘発する可能性がある。免疫細胞の活性化は、適切な免疫応答を開始するために厳密な制御を必要とする多数の細胞内シグナル伝達経路を誘発できる。癌の増殖は、それらの微小環境と密接に相互作用する可能性がある。腫瘍は、癌細胞の不均一な集団だけでなく、様々な常在細胞および浸潤宿主細胞、分泌因子、および細胞外マトリックスタンパク質から構成されることもある。癌および腫瘍の進行は、癌細胞とこの腫瘍微小環境との相互作用によって顕著に影響を受ける可能性があり、これ相互作用は、最終的に腫瘍の根絶、転移、治療応答、または治療耐性を決定する可能性がある。癌の進行時の腫瘍微小環境のメカニズムは、免疫チェックポイント阻害療法などの腫瘍微小環境の成分を標的とする際の治療手段を提供できる。
特に固形腫瘍内の腫瘍微小環境は、エフェクターT細胞などの免疫細胞に対して敵対性がないままであってもよい。腫瘍微小環境内での免疫抑制シグナルの連続集中および必須栄養素の不足により、T細胞の枯渇がもたらされる可能性がある。腫瘍の微小環境を克服しかつ治療に対する早期予測応答を決定することは、腫瘍内の癌細胞を根絶する際の免疫療法の効率を向上する際に重要な要因となる可能性がある。癌細胞の急速な増殖に適応するための代謝の再プログラミングおよび適応性は、悪性癌での治療耐性の重要なメカニズムとなる可能性がある。限定はされないが、マクロファージ、B細胞、T細胞、好中球、および樹状細胞を含むいくつかの免疫細胞型は、腫瘍微小環境内に存在し、かつ癌の進行において活動的な役割を保持できる。
B.腫瘍逃避メカニズム
新生物の発生から悪性腫瘍への進行は、部分的には免疫の監視の不全により起こる可能性がある。癌細胞は、免疫による認識および排除から逃避し、免疫抑制の微小環境を形成する場合がある。癌細胞が消費する量は大きいので、この領域での天然の免疫細胞は栄養不足の環境に直面する可能性がある。乳酸塩や糖分解の最終生成物などの癌細胞代謝の複数の代謝副産物は、天然の免疫細胞に有害となり、それらの分化、活性化、健全性、抗腫瘍機能を損ない、かつそれらが癌細胞と広範囲に競合できなくなる可能性がある。
低酸素症などの腫瘍微小環境内での代謝の変化はまた、骨髄細胞の分化プログラムに影響を及ぼし、それらの抗原提示特性を変化させる可能性がある。低酸素を媒介とする発現は、T細胞の免疫抑制を促進する抑制性リガンドの発現を選択的に上方制御できる。腫瘍微小環境内での癌を媒介とする代謝の変化は、免疫微小環境の細胞組成および機能に影響を及ぼすので、癌細胞の代謝の変化を標的とすることにより、癌細胞の成長および進行に影響を及ぼし、ならびに免疫細胞の代謝プログラムおよびその抗腫瘍機能を変更することによって、抗腫瘍免疫を改善するための治療標的を提供できる。
C.免疫療法
代謝プロセスは、静止状態では、ならびに感染、炎症、癌、および自己免疫症などの病原性プロセス中には、免疫細胞応答を調節できる。これらの複雑な条件では、免疫療法は新たな治療手段を提供きる可能性がある。マクロファージならびに他の免疫細胞は、疾患の病理に依存して代謝の柔軟性を示す。腫瘍浸潤リンパ球は、腫瘍微小環境の注目部分であり、かつ予後および治療への応答の改善に関連する可能性がある(Cogdill, Andrews, and Wargo 2017 Tomioka et al. 2018)。
免疫療法により、対象の免疫系を活性化して癌と闘うことができる。免疫療法により癌細胞を効率的に根絶するために、T細胞または他の免疫細胞は、ヒト白血球抗原(HLA)によって提示される腫瘍ペプチドを認識できる。HLAまたは主要組織適合性複合体は、抗原提示に関与するタンパク質である可能性があり、HLA遺伝子によってコードできる。チェックポイント阻害療法は、腫瘍、腫瘍の微小環境、および免疫系の間の複雑な相互作用を含む、様々な生体要因によって影響を受ける対象の応答による有意義な抗腫瘍活性を実証している(Hodi et al. 2010;Larkin, Ho and Wolchok 2015 Hugo et al. 2016;Ribas et al. 2016;Wolchok et al. 2017)。
免疫チェックポイント遮断療法は、T細胞活性化を促進または阻害するために利用されてもよい。免疫応答は、開始段階、および免疫系が危険信号を認識して先天的な信号によって活性化されてその危険と闘う活性化段階を含んでもよい。この反応は、感染症や癌に抵抗する第1段階のうちの1つであってもよいが、この活性化の持続が組織の損傷を引き起こす可能性があるので、危険が制御されたなら直ぐに切断される必要がある。免疫系の活性化の後に終結段階が続き、この段階では、内因性免疫抑制分子が損傷を抑止するために免疫応答を停止させる。癌免疫療法では、治療手法が古典的な形態で免疫応答の開始および活性化を強化して、癌に対するTリンパ球の出現および効力を増大させた。免疫チェックポイント遮断療法は、免疫抑制分子を阻害することによって免疫応答の終結に焦点を当て、それによって免疫応答の終結を阻止し、または免疫応答中に消耗したTリンパ球を喚起させる可能性がある。負に調節する免疫チェックポイントを遮断することにより、消耗した免疫細胞が浸潤する癌を死滅させるそれらの能力を回復させ、かつ生き残った癌細胞を休眠状態に追いやることができる。
免疫チェックポイントは、免疫系に固有の共刺激要素および抑制要素であってもよい。免疫チェックポイントは、自己免疫寛容性を維持し、生理学的免疫応答の持続時間および許容度を調節して、免疫系が病原性感染に応答する際の組織への損傷を防止するのに役立つ可能性がある。免疫応答はまた、T細胞が腫瘍細胞に特徴的な抗原を認識する場合に開始できる。共刺激シグナルと抑制シグナルの間の平衡を用いて、免疫チェックポイントタンパク質によって調節され得る、T細胞からの免疫応答を制御してもよい。T細胞が成熟して胸腺内で活性化した後に、T細胞は炎症部位および損傷部位に移動して修復機能を実行できる。T細胞の機能は、直接的な作用によって、あるいは免疫系に関与するサイトカインおよび膜リガンドの動員を通してのいずれかによって発生できる。T細胞の成熟、活性化、増殖、および機能に関与する工程は、共刺激シグナルおよび抑制シグナル、すなわち免疫チェックポイントタンパク質を通して調節できる。腫瘍は、免疫耐性メカニズムとしてチェックポイントタンパク質の機能を調節不全にする可能性がある。従ってチェックポイントタンパク質の修飾薬の開発は、治療上の価値を持つ可能性がある。免疫チェックポイント分子の非限定的な例としては、CTLA4およびPD-1が含まれる。これらのチェックポイント分子は、経路内のIL-2の上流で機能できる。
IV.免疫療法に対する免疫系応答を予測するのに用いられるバイオマーカーの例
免疫学的チェックポイント分子は、免疫グロブリンスーパーファミリーのメンバーであってもよく、制御されていない免疫反応を抑止する抑制性受容体であってもよい。適応免疫応答は、自己寛容性を維持し、かつ免疫応答中に発生し得る付随的な組織損傷を最小限に抑えるために使用できる、そのようなチェックポイント分子によって制御される可能性がある。PD-L I発現、インターフェロン(IFN)γに基づく符号、腫瘍変異の負荷、マイクロサテライト不安定性(MSI)および不一致修復の欠損、抗原提示機構内の変異を含む遺伝子変異、HLAヘテロ接合性の喪失、およびT細胞レパートリーの多様性を含む、免疫チェックポイント遮断に対する多数の応答のバイオマーカーが提案されている(Herbst et al. 2014;Gao et al. 2016; Zaretsky et al. 2016;Roh et al. 2017 Sade-Feldman et al. 2017;Mariathasan et al. 2018;Chowell etal. 2019)
免疫チェックポイント遮断療法への応答に影響を及ぼし得る生体特性の多様性により、複数の生体特性を統合して免疫療法への応答をより適切に予測するバイオマーカーを特定するような取組みが拡大している(Charoentong et al. 2017)。そのような取組みの1つでは、純度補正された腫瘍変異の負荷を、受容体チロシンキナーゼ(RTK)変異、HLA変異、および喫煙符号とともに組み合わせた符号を用いて、非小細胞肺がん(NSCLC)での免疫チェックポイント遮断応答を予測し(Anagnostou et al. 2020)、黒色腫研究では、ゲノムデータ、トランスクリプトームデータ、および臨床データを組み合わせて、免疫チェックポイント遮断に対する応答が予測された(Liu et al. 2019)。
新生抗原は、MHCクラスIおよびクラスII分子表面に負荷され、かつT細胞に提示され得る体細胞変異の部分集合を構成できる。これらの新生抗原は、免疫系によって内因性の腫瘍特異的(非自己性の)標的として認識できる。免疫チェックポイント遮断は、細胞傷害性(CD8+)T細胞の能力を利用して、h-ICクラスI分子表面に新生抗原を表示する癌細胞を検出かつ破壊すると考えられている(Schumacher and Schreiber 2015)。免疫原性と新生抗原のクローン構造を統合した検討では、黒色腫、肺がん、および腎臓がんを患う対象での免疫チェックポイント遮断に対する応答および予後を予測し、バイオマーカーの幅広い適応性が示唆されていた(Lu et al. 2020)。
最近では、遺伝子発現解析、メタボロミクス、およびプロテオミクスの各手法を用いて、癌の診断および進行のための代理バイオマーカーを特定する取組みが増大している。遺伝子発現解析は、ヘテロ接合性の喪失、すなわち遺伝子全体および周囲の染色体領域の喪失をもたらす可能性のある交差染色体事象に関する見識を提供できる。ヘテロ接合性の喪失は、癌内の喪失領域に機能的な腫瘍抑制遺伝子が存在しないことを示す可能性がある。腫瘍抑制遺伝子は、この喪失によって、あるいは癌の増殖から身体を保護するために腫瘍抑制遺伝子を残さない点変異によって不活性化されてもよい。ヘテロ接合性の検出でのHLA喪失は、汎用性の癌バイオマーカーである可能性がある。
V.複合バイオマーカースコアを生成する技術
本明細書での説明のように、免疫ゲノミクス解析システムによって生成される複合バイオマーカースコアは、予測された新生抗原を有する抗原提示機構内での有害事象(例えばHLAヘテロ接合性の喪失)に関する情報を組み込んで、免疫療法に対する対象の応答を層別できる。複合バイオマーカースコアは、従来からの単一検体のバイオマーカーよりも優れていて、腫瘍回避の複数の側面を捉える複雑なモデルが、対象の応答のより堅牢な層別を提供できることを示唆している。さらにこのようなデータ集約型バイオマーカーは、限られた腫瘍組織を用いて達成される様々な臨床集団での包括的な腫瘍特性を備えていて、臨床的に実用性がある。これらの知見は、後期癌患者に応答の正確な複合バイオマーカーを提供するだけでなく、臨床環境での全エクソームデータおよびトランスクリプトームデータの使用を裏付ける証拠を提供する。
A.ゲノムデータおよびトランスクリプトームデータの生成
1.生体試料
図1は、いくつかの実施態様に従って、生体試料からゲノムデータおよびトランスクリプトームデータを生成するための概略図100の一例を示す。例えば概略図100は、癌細胞を含む生体試料を対象から選択することを含む。場合によっては、治療前の正常血液試料および腫瘍試料を対象から採取する。例えば、治療前の正常血液試料および腫瘍試料は、抗PD-1療法を受けた切除不能なステージIII/IVの黒色腫を患う対象から採取されてもよい。
生体試料を処理して、対象の免疫ゲノム解析の特性を生成でき、この特性には、包括的な腫瘍変異情報、遺伝子発現の定量、新生抗原の特性付け、HLA(分類、変異、およびヘテロ接合性の喪失)、T細胞受容体レパートリーの特性、マイクロサテライト不安定性検出、癌ウイルスの特定、および腫瘍微小環境特性を含んでもよい。次いで特性データを、臨床転帰および対象に対して演算された複合バイオマーカースコアとともに解析して、特定の免疫療法治療に対する応答性の予測水準を特定してもよい。
試料は対象から採取してもよい。試料は、血液(例えば全血)、血漿、血清、臍帯血、絨毛膜絨毛、羊水、(例えば、気管支肺胞、胃、腹膜、導管、耳、関節鏡からの)洗浄液、(例えば着床前の胚からの)生検試料、腹腔穿刺試料、胎児有核細胞または胎児細胞残滓、胆汁、母乳、尿、唾液、粘膜排泄物、痰、便、汗、膣分泌液、(精巣などの)体液水溜、膣洗浄液、胸水、腹水、脳脊髄液、気管支肺胞洗浄液、乳頭からの分泌液、体の種々の部分(甲状腺、乳房など)からの吸引液、涙液、胚細胞、または(胎盤細胞などの)胎児細胞から取得されてもよく、あるいは含んでもよい。実施態様によっては、血液試料は、踵または指の刺し傷によって、頭皮の静脈から、または耳たぶの穿刺によって取得される。生体試料は、体液試料または組織試料(例えば皮膚試料)であってもよい。生体試料は、生存しているまたは死滅した対象に由来する任意の組織または材料を含んでもよい。生体試料は無細胞試料であってもよい。生体試料は、タンパク質または核酸(例えば、DNAまたはRNAまたはその断片)を含んでもよい。試料は固定されていても固定されていなくてもよい。試料は埋め込まれていても遊離していてもよい。試料はホルマリン固定パラフィンによる埋め込み試料であってもよい。
生体試料は、1つ以上の核酸分子を含んでもよい。核酸分子は、DNA分子、RNA分子(例えば、mRNA、cRNA、またはmiRNA)、およびDNA/RNA混成分子であってもよい。DNA分子の例として、限定はされないが、二本鎖DNA、一本鎖DNA、一本鎖DNAヘアピン、cDNA、ゲノムDNAが挙げられる。核酸は、二本鎖RNA、一本鎖RNA、ncRNA、RNAヘアピン、およびmRNAなどのRNA分子であってもよい。ncRNAの例としては、限定はされないが、siRNA、miRNA、snoRNA、piRNA、tiRNA、PASR、TASR、aTASR、TSSa-RNA、snRNA、RE-RNA、uaRNA、x-ncRNA、hY RNA、usRNA、snaR、およびvtRNAが挙げられる。
2.配列決定
生体試料からのゲノムデータに対応するDNA配列を生成するために、全エクソームライブラリーの調製および配列決定を実施してもよい。DNAは生体試料から抽出され、処理され、全エクソーム配列決定に掛けられる。全エクソーム捕捉ライブラリーは、腫瘍試料および正常な血液試料からのDNAを用いて構築してもよい。場合によっては、標的プローブを用いて、生物医学的かつ臨床的に関連する遺伝子の包含率を高める。手順は、約250 bpの平均ライブラリー挿入長が得られるように変更されてもよい。配列決定の読取り値は、品質管理処理を受けて(例えばFastQCによって)FASTQファイルを提供する。FASTQファイルは、基準ゲノムに整列されてBAMファイルを生成する。
生体試料からトランスクリプトームデータに対応するRNA配列を生成するために、トランスクリプトーム配列決定を実施してもよい。場合によっては、トランスクリプトーム配列決定には、マイクロアレイおよびRNA-Seqが含まれる。マイクロアレイは、相補的なプローブ列へのハイブリダイズを通して、定義された一組の転写産物の存在量を測定するように構成できる。RNA-Seqとは、生体試料中の転写産物の相補的DNAの配列決定を指してもよく、ここで相補的DNAの存在量は、各転写産物の計数値から導き出される。
場合によっては、試料処理は、核酸試料処理およびその後の核酸試料配列決定を含む。核酸試料の一部または全部を配列決定して配列情報を提供することができ、この配列情報は、電子的、磁気的、または光学的な保存場所に保存または他の方法で維持してもよい。配列情報は、コンピュータプロセッサの助けを借りて解析でき、解析された配列情報は電子的な保存場所に保存してもよい。電子的な保存場所は、核酸試料から生成された配列情報の貯蔵物または収集物および解析された配列情報を含んでもよい。
実施態様によっては、全ゲノム配列決定を使用することを含んでもよい。場合によっては、全ゲノム配列決定を使用して、ヒトでの変異体を特定する。場合によっては、配列決定には、ゲノムの一部分に対するディープ配列決定が含まれてもよい。例えばゲノムの一部分は、少なくとも約50;75;100;125;150;175;200;225;250;275;300;350;400;450;500;550;600;650;700;750;800;850;900;950;1,000;1,100;1,200;1,300;1,400;1,500;1,600;1,700;1,800;1,900;2,000;3,000;4,000;5,000;6,000;7,000;8,000;9,000;10,000;15,000;20,000;30,000;40,000;50,000;60,000;70,000;80,000;90,000;100,000、またはそれ以上の塩基または塩基対であってもよい。場合によっては、ゲノムは、100万、200万、300万、400万、500万、600万、700万、800万、900万、1000万、または1000万を超える塩基または塩基対に亘って配列決定されてもよい。場合によっては、ゲノムはエクソーム全体に亘って配列決定されてもよい(例えば全エクソーム配列決定)。場合によっては、ディープ配列決定には、ゲノムの一部分に亘って複数の読取り値を取得することを含んでもよい。例えば、複数の読取り値の取得には、ゲノムの一部分に亘って少なくとも2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、10,000の読取り値、または10,000を超える読取り値を含んでもよい。
実施態様によっては、ディープ配列決定によって低対立遺伝子画分を検出することを含んでもよい。場合によっては、次世代配列決定によってディープ配列決定を実行する。場合によっては、エラーが発生し易い領域を回避することによってディープ配列決定を実行する。場合によっては、エラーが発生し易い領域には、配列重複に近い領域、異常に高いまたは低い%GCの領域、ホモポリマーに近い領域、ジヌクレオチドおよびトリヌクレオチド、および他の短い反復に近い領域が含まれる可能性がある。場合によっては、エラーが発生し易い領域には、DNA配列決定エラー(ホモポリマー配列でのポリメラーゼのずれなど)を引き起こす領域が含まれる場合がある。
実施態様によっては、試料中の1つ以上の核酸分子に対して1回以上の配列決定反応を実施することを含んでもよい。実施態様によっては、試料中の1つ以上の核酸分子に対して1回以上、2回以上、3回以上、4回以上、5回以上、6回以上、7回以上、8回以上、9回以上、10回以上、15回以上、20回以上、30回以上、40回以上、50回以上、60回以上、70回以上、80回以上、90回以上、100回以上、200回以上、300回以上、400回以上、500回以上、600回以上、700回以上、800回以上、900回以上、または1000回以上の配列決定反応を実施する。配列決定反応は、同時に、連続して、またはそれらの組合せで実行してもよい。配列決定反応は、全ゲノム配列決定またはエクソーム配列決定を含んでもよい。配列決定反応には、マクサム・ギルバートの連鎖停止システムまたは高スループットシステムが含まれてもよい。あるいはまたはさらに、配列決定反応には、HelioscopeTM単一分子配列決定、Nanopore DNA配列決定、Lynx Therapeuticsの大規模並列符号配列決定(MPSS)、454パイロ配列決定、単一分子リアルタイム(RNAP)配列決定、Illumina(Solexa)配列決定、SOLiD配列決定、Ion TorrentTM、イオン半導体配列決定、単一分子SMRT(TM)配列決定、ポロニー配列決定、DNAナノボール配列決定、VisiGen Biotechnologiesの手法、またはそれらの組合せを含んでもよい。あるいはまたはさらに、配列決定反応として、限定はされないが、Illuminaが提供するGenome Analyzer IIx、HiSeq、およびMiSeq、Pacific Biosciences(California)が提供するPacBio RSシステムなどのSingle Molecule Real Time(SMRTTM)技術、およびSolexa Sequencer、ならびにHelicos Inc.(Cambridge, MA)が提供するHeliScope TM SequencerなどのTrue Single Molecule Sequencing(tSMS TM)技術を含む1つ以上の配列決定プラットフォームを挙げてもよい。配列決定反応にはまた、電子顕微鏡または化学感応性電界効果トランジスタ(chemFET)アレイを含んでもよい。側面によっては、配列決定反応は、キャピラリー配列決定、次世代配列決定、サンガー配列決定、合成による配列決定、核酸連結による配列決定、ハイブリダイズによる配列決定、単一分子配列決定、またはそれらの組合せを含む。合成による配列決定には、可逆的転写終結配列決定、連続単分子配列決定、逐次フロー配列決定、またはそれらの組合せを含んでもよい。逐次フロー配列決定には、パイロ配列決定、pH媒介による配列決定、半導体配列決定、またはそれらの組合せが含まれてもよい。
実施態様によっては、少なくとも1つのロングリード配列決定反応および少なくとも1つのショートリード配列決定反応を実行することを含んでもよい。ロングリード配列決定反応および/またはショートリード配列決定反応は、核酸分子の部分集合の少なくとも一部分に対して実行してもよい。ロングリード配列決定反応および/またはショートリード配列決定反応は、核酸分子の2つ以上の部分集合のうちの少なくとも一部分に対して実行してもよい。ロングリード配列決定反応およびショートリード配列決定反応の両方を、核酸分子の1つ以上の部分集合の少なくとも一部分に対して実行してもよい。
1つ以上の核酸分子またはその部分集合の配列決定には、少なくとも約5;10;15;20;25;30;35;40;45;50;60;70;80;90;100;200;300;400;500;600;700;800;900;1,000;1,500;2,000;2,500;3,000;3,500;4,000;4,500;5,000;5,500;6,000;6,500;7,000;7500;8,000;8,500;9,000;10,000;25,000;50,000;75,000;100,000;250,000;500,000;750,000;10,000,000;25,000,000;50,000,000;100,000,000;250,000,000;500,000,000;750,000,000;1,000,000,000個、またはそれ以上の配列読取り値を含んでもよい。
配列決定反応は、1つ以上の核酸分子内の少なくとも約50;60;70;80;90;100;110;120;130;140;150;160;170;180;190;200;210;220;230;240;250;260;270;280;290;300; 325;350;375;400;425;450;475;500;600;700;800;900;1,000;1,500;2,000;2,500;3,000;3,500;4,000;4,500;5,000;5,500;6,000;6,500;7,000;7,500;8,000;8,500;9,000;10,000;20,000;30,000;40,000;50,000;60,000;70,000;80,000;90,000;100,000個、またはそれ以上の塩基または塩基対を配列決定することを含んでもよい。配列決定反応は、1つ以上の核酸分子内の少なくとも約50;60;70;80;90;100;110;120;130;140;150;160;170;180;190;200;210;220;230;240;250;260;270;280;290;300; 325;350;375;400;425;450;475;500;600;700;800;900;1,000;1,500;2,000;2,500;3,000;3,500;4,000;4,500;5,000;5,500;6,000;6,500;7,000;7,500;8,000;8,500;9,000;10,000;20,000;30,000;40,000;50,000;60,000;70,000;80,000;90,000;100,000個、またはそれ以上の連続する塩基または塩基対を配列決定することを含んでもよい。
好ましくは、本発明の方法で用いられる配列決定技術は、1回の操作当たり少なくとも100個の読取り値、1回の操作当たり少なくとも200個の読取り値、1回の操作当たり少なくとも300個の読取り値、1回の操作当たり少なくとも400個の読取り値、1回の操作当たり少なくとも500個の読取り値、1回の操作当たり少なくとも600個の読取り値、1回の操作当たり少なくとも700個の読取り値、1回の操作当たり少なくとも800個の読取り値、1回の操作当たり少なくとも900個の読取り値、1回の操作当たり少なくとも1,000個の読取り値、1回の操作当たり少なくとも5,000個の読取り値、1回の操作当たり少なくとも10,000個の読取り値、1回の操作当たり少なくとも50,000個の読取り値、1回の操作当たり少なくとも100,000個の読取り値、1回の操作当たり少なくとも500,00個の読取り値、または1回の操作当たり少なくとも1,000,000個の読取り値を生成する。あるいは、本発明の方法で用いられる配列決定技術は、1回の操作当たり少なくとも1,500,000個の読取り値、1回の操作当たり少なくとも2,000,000個の読取り値、1回の操作当たり少なくとも2,500,000個の読取り値、1回の操作当たり少なくとも3,000,000個の読取り値、1回の操作当たり少なくとも3,500,000個の読取り値、1回の操作当たり少なくとも4,000,000個の読取り値、1回の操作当たり少なくとも4,500,000個の読取り値、または1回の操作当たり少なくとも5,000,000個の読取り値を生成する。
好ましくは、本発明の方法で用いられる配列決定技術は、一読取り値当たり少なくとも約30塩基対、少なくとも約40塩基対、少なくとも約50塩基対、少なくとも約60塩基対、少なくとも約70塩基対、少なくとも約80塩基対、少なくとも約90塩基対、少なくとも約100塩基対、少なくとも約110塩基対、少なくとも約120塩基対、少なくとも約150塩基対、少なくとも約200塩基対、少なくとも約250塩基対、少なくとも約300塩基対、少なくとも約350塩基対、少なくとも約400塩基対、少なくとも約450塩基対、少なくとも約500塩基対、少なくとも約550塩基対、少なくとも600塩基対、少なくとも約700塩基対、少なくとも約800塩基対、少なくとも約900塩基対、または少なくとも約1,000塩基対を生成してもよい。あるいは本発明の方法で用いられる配列決定技術は、長い配列決定の読取り値を生成してもよい。場合によっては、本発明の方法で用いられる配列決定技術は、一読取り値当たり少なくとも約1,200塩基対、一読取り値当たり少なくとも約1,500塩基対、一読取り値当たり少なくとも約1,800塩基対、一読取り値当たり少なくとも約2,000塩基対、一読取り値当たり少なくとも約2,500塩基対、一読取り値当たり少なくとも約3,000塩基対、一読取り値当たり少なくとも約3,500塩基対、一読取り値当たり少なくとも約4,000塩基対、一読取り値当たり少なくとも約4,500塩基対、一読取り値当たり5,000塩基対、一読取り値当たり少なくとも約6,000塩基対、一読取り値当たり少なくとも約7,000塩基対、一読取り値当たり少なくとも約8,000塩基対、一読取り値当たり少なくとも約9,000塩基対、一読取り値当たり少なくとも約10,000塩基対、一読取り値当たり20,000塩基対、一読取り値当たり30,000塩基対、一読取り値当たり40,000塩基対、一読取り値当たり50,000塩基対、一読取り値当たり60,000塩基対、一読取り値当たり70,000塩基対、一読取り値当たり80,000塩基対、一読取り値当たり90,000塩基対、または一読取り値当たり100,000塩基対を生成してもよい。
高生産性の配列決定システムは、配列決定されたヌクレオチドの増殖中の鎖へのその取り込みの直後またはその時点での検出、すなわちリアルタイムまたは実質的にリアルタイムでの配列の検出を可能にする。場合によっては、高生産性の配列決定により、1時間当たり少なくとも1,000個、少なくとも5,000個、少なくとも10,000個、少なくとも20,000個、少なくとも30,000個、少なくとも40,000個、少なくとも50,000個、少なくとも100,000個、または少なくとも500,000個の配列読取り値が生成され、各読取り値は、一読取り値当たり少なくとも50塩基、少なくとも60塩基、少なくとも70塩基、少なくとも80塩基、少なくとも90塩基、少なくとも100塩基、少なくとも120塩基、少なくとも150塩基、少なくとも200塩基、少なくとも250塩基、少なくとも300塩基、少なくとも350塩基、少なくとも400塩基、少なくとも450塩基、または少なくとも500塩基である。配列決定は、ゲノムDNA、RNA転写物に由来するcDNA、または鋳型としてのRNAなどの本明細書に記載の核酸を用いて実行してもよい。
3.整列
上記の配列決定技術によって生成された配列読取り値(例えばDNA配列、RNA配列)を、対応する基準ゲノム(例えば、hs37d5基準ゲノム構築物)にマップ化できる。場合によっては、整列の経路により、整列、重複除去、および塩基品質スコアの再較正を実行して、ゲノムデータおよびトランスクリプトームデータを生成する。この経路は、重複除去にはPicardツールキット(RRID:SCR_006525)を用い、またゲノム解析ツールキット(GATK、RRID:SCR_001876)を用いて配列の整列を改善しかつ塩基品質スコア(BQSR)を補正する。次いで整列させた配列データを、SAM(RRID:SCR_01095)仕様に従ってBAM形式に戻す。場合によっては、体細胞変異体を、基準ゲノムに対する配列読取り値の整列に基づいて特定する。
場合によっては、全トランスクリプトームの配列決定は、STAR(RRID:SCR_015899)を用いて整列され、100万個当たりの転写産物(TPM)での正規化された発現値を計算する。RNA配列決定および整列の品質管理では、次の指標を特定してもよい:平均読取り長、一意的にマップ化された読取り値の百分率、マップ化された読取り値対の平均長さ、スプライス部位の数、塩基当たりの不一致率、塩基当たりの欠失/挿入率、欠失/挿入の平均長、ならびに染色体間および孤立した読取り値を含む異常な読取り値対の整列。
B.トランスクリプトームデータに由来するトランスクリプトーム指標
免疫ゲノミクス解析システムは、生体試料に対応するトランスクリプトームデータを処理して、一組のトランスクリプトーム指標を生成する。一組のトランスクリプトーム指標のそれぞれは、1つ以上のRNA配列のうちの対応するRNA配列から翻訳される一組のペプチドに対応する1つ以上の特性を表してもよい。場合によっては、一組のトランスクリプトーム指標には、(i)生体試料の予測される新生抗原負荷を表す定量指標または分類指標;(ii)生体試料から検出された1つ以上の候補となる新生抗原のそれぞれの1つ以上の特性を表す定量指標または分類指標;(iii)細胞表面提示の喪失が検出される1つ以上のHLAタンパク質のそれぞれの1つ以上の特性を表す定量指標または分類指標;(iv)細胞表面提示の喪失が検出された1つ以上のHLAタンパク質をコードするHLA遺伝子に対応する1つ以上の特性を表す定量指標または分類指標;および(v)生体試料から検出された1つ以上のT細胞受容体の発現水準を表す定量指標または分類指標が含まれる。細胞表面提示の喪失が検出されるHLAタンパク質に関しては、対応する指標は、ゲノムデータおよびトランスクリプトームデータを新生抗原提示予測機械学習モデルに当てはめることで生成できる。
1.免疫浸潤の符号
一組のトランスクリプトーム指標は、免疫細胞に対応する配列の発現水準を表す定量指標または分類指標を含んでもよい。場合によっては、定量指標または分類指標は免疫浸潤スコアであり、このスコアは種々の腫瘍浸潤免疫細胞型の量に基づいて導き出される。免疫浸潤スコアは、トランスクリプトームデータを用いて計算できる。例えば、遺伝子組の富化を表す半定量性スコアを、単一の試料中で計算してもよい。場合によっては、17個の細胞型を表す一組の基準遺伝子発現符号を用いて免疫浸潤スコアを生成し、これらの細胞型には、悪性細胞、CAF、内皮細胞、NK細胞、B細胞、マクロファージ、ならびにCD8+ T細胞およびCD4+ T細胞が含まれてもよい。
免疫浸潤スコアを生成するために、遺伝子組の富化分析を用いて、特定の細胞型に特異的な遺伝子が目的の試料中に最高程度に高く発現される場合には(すなわち細胞型が試料中に富化されている場合には)高い富化スコアを演算でき、それ以外の場合には低い富化スコアを演算できる。同一の細胞型(遺伝子組)に対する富化スコアを試料全体で比較して、対象の免疫浸潤を明確にできる。さらにまたはあるいは、免疫浸潤スコアを、目的の細胞型(例えば癌細胞)の相対分画を定量的に推定できる逆重畳技術を使用して生成する。逆重畳のアルゴリズムは、異種試料の遺伝子発現特性を異なる細胞の遺伝子発現水準の重畳と見做しかつ未知の細胞分画を推定して、細胞型に特異的な発現特性を記述する符号マトリックスに活用する。
2.T細胞受容体の発現水準
一組のトランスクリプトーム指標は、生体試料から検出された1つ以上のT細胞受容体の発現水準を表す定量指標または分類指標を含んでもよい。1つ以上のT細胞受容体の発現水準により、生体試料中に検出されるクローンリンパ球の水準および分布を特定できる。生体試料からのリンパ球の質および量を用いて、対象の健康および疾患に影響を及ぼす種々の要因を特定できる。1つ以上のT細胞受容体の発現水準は、正常な免疫多様性、増殖、または再構成を有すると解釈でき、あるいは別の場合には炎症、感染、ワクチン接種、自己免疫、または癌を有すると解釈できる。場合によっては、生体試料のリンパ球浸潤の質および量を評価するために使用されるいくらかの分析パラメータには、多様性、濃度、均一性、クローン性、およびエントロピーの各指標が含まれてもよい。
場合によっては、1つ以上のT細胞受容体の発現水準は、生体試料中に検出されるT細胞受容体β(TCR-β)配列のクローン性に対応する。免疫ゲノミクス解析システムは、トランスクリプトームデータを処理してTCR-βクローンの特性を明確にし、このクローンはTCR-βの増殖範囲(基準トランスクリプトームに亘って約100倍の増殖範囲)の拡大を提供する。CDR3配列中にフレームシフトまたは未成熟の終止コドンを持つ非生産的なクローンを除外でき、ならびにVまたはJのヒットの閾値を下回る整列スコアを有する信頼性の低いクローンも除外できる。次いでクローン性を、1-Pielouの均一性として計算してもよい。
3.差分的遺伝子発現
一組のトランスクリプトーム指標は、トランスクリプトームデータ中の特定された遺伝子当たりの読取り数を表す定量指標を含んでもよい。例えば、100万個の配列読取り値当たりの数を、生体試料内で特定された読取り値の総数によって一遺伝子当たりの読取り数を正規化して計算できる。場合によっては閾値は、特定の遺伝子が定量指標の一部分であるべきか否かに関して選択される。例えば、集団の試料の25%以上で100万当たりの読み取り数が0を超える遺伝子のみを分析に含めることができる。場合によっては、残りのデータをrlog変換を用いて処理し、差分的遺伝子発現を解析する。0.05未満の調整p値および-0.5未満または1超の最小log2倍率変化を有する遺伝子は、差分的に発現されたと見做された。差分的に発現する遺伝子の生体的な意義は、限定はされないが、MSigDB(Molecular Signatures Database、RRID:SCR_016863)認証遺伝子組およびKEGG(RRID:SCR_012773)遺伝子組を含む種々の遺伝子組を用いる経路水準で特定できる。
4.新生抗原提示の予測
一組のトランスクリプトーム指標は、細胞表面提示の喪失が検出される1つ以上のHLAタンパク質のそれぞれの1つ以上の特性を表す定量指標または分類指標を含んでもよい。特にトランスクリプトーム指標は、HLA変異、HLAヘテロ接合性の喪失、およびβ2-ミクログロブリン変異などの新生抗原の提示を妨げる可能性のある患者固有の腫瘍変化に対応させることができる。
新生抗原提示の予測指標は、トランスクリプトームデータを用いて検証された腫瘍特異性のゲノム事象(単一ヌクレオチド変異、挿入欠失、および融合)を用いて生成された候補となる新生抗原を特定することによって生成できる。全ての候補ペプチドは、MHCクラスI提示を予測するための新生抗原提示予測機械学習モデルを使用してスコアを付けることができ、このモデルは、大規模な免疫ペプチドデータ組を用いて学習される。学習された新生抗原提示予測機械学習モデルは、候補ペプチドのそれぞれに対応するデータを用いて、候補ペプチドが細胞表面に提示かつ発現されるか否かを予測する出力を生成できる。機械学習モデルの出力に基づいて、信頼性のある閾値を超える候補ペプチドの部分集合を用いて新生抗原負荷スコアを計算できる。複合バイオマーカースコアを計算するために、新生抗原負荷スコアを調整して、新生抗原提示を損なう可能性のある対象固有の腫瘍の変化、例えばMHC複合体および抗原提示機械への変化、ならびにHLAのヘテロ接合性の喪失を考慮してもよい。
C.ゲノムデータ由来のゲノム指標
免疫ゲノミクス解析システムは、ゲノムデータを処理して、一組のゲノム指標を生成できる。一組のゲノム指標のそれぞれは、対応するDNA配列に対応する1つ以上の特性を1つ以上のDNA配列として表すことができる。場合によっては、一組のゲノム指標には、(i)1つ以上のDNA配列中の1つ以上の体細胞変異のそれぞれについて1つ以上の特性を表す定量指標または分類指標;(ii)ヘテロ接合性の喪失が生体試料の少なくとも1つのヒト白血球抗原(HLA)遺伝子内で発生したか否かを示す分類指標;および(iii)予測される腫瘍変異の負荷を表す定量指標または分類指標が含まれる。HLAのヘテロ接合性の喪失に関しては、対応する分類指標は、ゲノムデータをHLA欠失識別機械学習モデルに当てはめることで生成できる。
1.単一塩基の変異および挿入欠失
一組のゲノム指標は、1つ以上のDNA配列内の1つ以上の体細胞変異のそれぞれについての1つ以上の特性を表す定量指標または分類指標を含むことができる。1つ以上の体細胞変異は、DNA配列の1つ以上の核酸分子中に単一ヌクレオチドの変異、挿入/欠失多型、コピー数変化、および融合を含んでもよい。場合によっては、DNA配列中で特定された変異ごとに、変異の数、塩基転換に対する転移の比率、変異水準の一致率などを含む品質指標を生成してもよい。例えばゲノムデータを、品質スコア再較正モジュールを用いて処理してもよく、このモジュールは、それらの偽陽性の呼出しを表す可能性によって単一ヌクレオチド変異を層別できる。場合によっては、誤呼び出しされた変異を補正できるように、ゲノムデータの配列の整列情報を処理できる。さらにまたはあるいは、体細胞の単一ヌクレオチド変異および挿入欠失コールを組み合わせて、1)配列包含率および読取り品質などの整列指標、2)ギャップ領域への近接などの位置的特性、および3)正常組織に存在する可能性に基づいて、一組の試験済みフィルターを通して分析できる。
2.対立遺伝子特異的HLAのヘテロ接合性の喪失
一組のゲノム指標はまた、生体試料の少なくとも1つのHLA遺伝子中にヘテロ接合性の喪失が生じたか否かを示す分類指標を含んでもよい。HLAのヘテロ接合性の喪失は新生抗原の提示に影響を及ぼす可能性があるので、HLA欠失識別機械学習モデルを使用してHLAのヘテロ接合性の喪失を検出できる。HLAのヘテロ接合性の喪失を、免疫系への腫瘍新生抗原の提示能力を低下させることによって免疫逃避を促進する後天的な耐性メカニズムであると見做してもよい。HLAの喪失のプロセスは、特に腫瘍進化の後期段階で腫瘍微小環境内の選択圧によって支配されるので、後期段階の黒色腫対象の集団内での対立遺伝子特異的HLAのヘテロ接合性の喪失が、明白な新生抗原負荷が上昇するにも拘わらず治療応答が低下することに寄与する可能性があることが仮定された。
上記のゲノム指標を生成するために、生体試料を次の手順を用いて処理してもよい:1)全ての腫瘍および正常読取り値を、対象の対立遺伝子特異的HLAにマップ化する;2)相同な対立遺伝子を整列させて、全ての患者に特異的な不一致部位を見出す;3)正規化されたb対立遺伝子頻度および対立遺伝子に特異的な包含率を、各不一致部位で計算する。各遺伝子について、対立遺伝子に特異的な特性をHLA欠失識別機械学習モデルに入力して、正規化されたb対立遺伝子頻度および対立遺伝子に特異的な不一致部位、腫瘍の純度、および腫瘍の倍数性を含むヘテロ接合性の喪失を予測した。
3.変異負荷
一組のゲノム指標は、予測された腫瘍変異負荷を表す定量指標または分類指標を含んでもよい。腫瘍の変異負荷は、癌細胞のDNAに見られる変異(変化)の総数を指すことになる。腫瘍の変異負荷を認識することにより、最善の治療計画を立てるのに役立つ可能性があり、腫瘍の変異負荷は、免疫チェックポイント遮断応答の潜在的なバイオマーカーとして特定されている。
D.複合バイオマーカースコアの生成
免疫ゲノミクス解析システムは、一組のゲノム指標および一組のトランスクリプトーム指標に由来する複合バイオマーカースコアを生成し、この複合バイオマーカースコアに基づいて、特定の型の免疫療法治療に対する対象の応答性の予測水準を決定する。例えば、複合バイオマーカースコアは、新生抗原負荷スコアに対応するトランスクリプトーム指標を用いて生成することができ、この複合バイオマーカースコアは、ゲノムデータから特定された予測された腫瘍変異負荷に基づいて調節できる。従って複合バイオマーカースコアは、新生抗原の提示および他の確立された耐性マーカーに対する障害を考慮できる。抗原提示を複合バイオマーカースコアに組み込むと、免疫チェックポイント遮断応答に関連する予測水準が強化される可能性がある。
新生抗原負荷の測定値の上昇により、いずれの対象が免疫療法から恩恵を受けるかを予測できるが、複合バイオマーカースコアは、生殖細胞水準ならびに体細胞水準の両方での抗原提示機構内の遺伝的変異から生じるさらなる耐性メカニズムに対応するゲノム指標およびトランスクリプトーム指標に基づいて導き出すことができる。これらのさらなる耐性メカニズムにより、新生抗原の提示能力を低減させて、免疫応答をさらに調整できる。従って複合バイオマーカーは、新生抗原負荷に対応する指標をバイオマーカーとして使用できるが、RNA発現水準だけでなく、後続の処理工程および縦断的処理に由来する追加データに対応するゲノム指標およびトランスクリプトーム指標をさらに含んでもよい。
場合によっては、複合バイオマーカースコアは、HLA変異、HLAのヘテロ接合性の喪失、およびβ2-ミクログロブリン変異を含む、新生抗原提示をさらに妨害する可能性がある対象に特異的な腫瘍変化を考慮するために調整される新生抗原負荷スコアに対応する。結果として、複合バイオマーカースコアを用いる対象の解析は、新生抗原および腫瘍の変異負荷と個別に比較した場合に、治療転帰の予測を向上させることができる。生体メカニズムおよび新生抗原提示の障害の両方をモデル化する複合バイオマーカー手法は、腫瘍免疫応答のより単純な生体モデルに基づいて構築された多くの現状のバイオマーカーよりも、免疫チェックポイント遮断療法でのより強力なバイオマーカーとして役立つ可能性がある。腫瘍変異負荷に基づく手法とは異なり、複合バイオマーカースコアは、新生抗原提示のより広範なメカニズムのモデル化によって生成できる。
さらにまたはあるいは、免疫療法に対する応答の低下に関連する体細胞変異の部分集合(例えば、HLAクラスIおよびB2M変異、HLAクラスI遺伝子のヘテロ接合性の喪失)を重み付けして、複合バイオマーカースコアを調整する。これらの回避メカニズムを考慮することにより、複合バイオマーカースコアは、免疫系への腫瘍抗原提示のより完全な表現を捉えて、このバイオマーカーの予測強度を高めることができる。上記の手法は、非小細胞肺がんおよび頭頸部の扁平上皮がんの対象集団などの1つ以上の特定型の癌に施用する場合に、HLAのヘテロ接合性の喪失はこれらの型の癌の進行に影響を及ぼす広範な回避メカニズムとして特定されるので、より正確な結果を得ることができる。例えば頭頸部がん、肺腺がん、膵臓がん、および前立腺がんの腫瘍データでは、45%を超える頻度で対立遺伝子に特異的な発現の喪失が明らかになった。クラスI HLA遺伝子の体細胞変異の出現と組み合わされたHLAのヘテロ接合性の喪失は、複合バイオマーカースコアによって捕捉されて、抗原提示機構への損傷事象を特定できる。
従って複合バイオマーカースコアは、複数の特質に対して、すなわちエキソームおよびトランスクリプトーム、腫瘍および免疫の応答ならびに耐性に対して、一組の広範な生体特性を統合できる。次いで複合バイオマーカースコアを用いて、免疫療法に対する応答および耐性を推進する生体メカニズムを反映する免疫チェックポイント遮断応答を予測できる。
E.治療の選択
複合バイオマーカースコアは、免疫チェックポイント遮断療法の応答に対する強力な予測因子として機能できる。図に示すように、複合バイオマーカースコアにより、腫瘍変異の負荷およびその他の単一の検体/遺伝子、ならびに検出集団で検定された発現符号に対比して、より顕著に免疫チェックポイント遮断療法に対する応答者および非応答者を分離できた。特定の免疫療法に対する応答性を予測するための複合バイオマーカースコアの価値を、大規模な独立検証集団内でこれらの知見を追認することでさらに実証した。
複合バイオマーカースコアは、新生抗原が免疫応答を誘導して、免疫療法に対する臨床応答の促進が可能であることをさらに実証できる。応答と腫瘍変異の負荷の間には僅かの弱い関連性しか観察されなかったが、新生抗原負荷と対象の応答の間にはより強い関連性が明らかになった。この知見は、様々な臨床研究での患者集団内の黒色腫の部分型の分布の交絡効果に原因があり、この効果は腫瘍変異の負荷の予測力に悪影響を及ぼす可能性があることが示唆されている。但しその集団が関与するこのような問題は、新生抗原負荷に影響を及ぼすようには見受けられなかった。バイオマーカーとしての新生抗原負荷の堅牢性の向上は、この測定がMHC結合ペプチドレパートリー中のタンパク質表現と相関することが分かっているので、その後の処理工程からの追加データならびにRNAの発現水準を含めることによって達成される可能性がある。
場合によっては、対象の応答に影響を及ぼす追加の要因が、新生抗原負荷以外に特定されている。説明の例として、検出集団内で観察された最高の複合バイオマーカースコアを有する非応答の異常値にはまた、影響の大きいナンセンスPD-1変異が含まれ、この変異は抗PD1療法への応答を妨げる可能性が高いと解釈できる。複合バイオマーカースコアが高い検証集団内の異常値である非応答の対象は、典型的な皮膚性黒色腫に比較して高水準の変異負荷ならびに明確な臨床病理特性および遺伝特性に関連する転移性線維形成性黒色腫を患う対象に対応する。従って複合バイオマーカースコアとともに臨床応答データを使用して、免疫療法に対する対象の応答の不均一性の水準を特定できる。さらに臨床応答データの複合バイオマーカースコアと組合せると、特定の治療法の組合せに対して脆弱な悪性腫瘍の部分集合を特定できる。最後に、臨床応答データの複合バイオマーカースコアと組合せると、新生抗原の提示を超えて拡張する治療耐性または応答の他のメカニズムを特定できる。
従って複合バイオマーカースコアを用いて、疾患を予防、停止、逆転、または改善するための治療法を決定できる。この疾患は癌である可能性がある。複合バイオマーカースコアは、対象の応答性の予測水準を示すことができる。従って複合バイオマーカースコアは、特定の治療に対する対象の応答性の予測水準に基づいて、(i)特定の治療の推奨;(ii)ヒト対象に特定の治療を施用する推奨;および/または(iii)ヒト対象に特定の治療を施用しない推奨を特定する報告として出力される。実施態様によっては、推奨の治療がヒト対象に施される。
癌の非限定的な例として、急性リンパ芽球性白血病、急性骨髄性白血病、副腎皮質がん、AIDS関連がん、AIDS関連リンパ腫、肛門がん、虫垂がん、トロサイトーマ、神経芽細胞腫、基底細胞がん、胆管がん、膀胱がん、骨がん、小脳星細胞腫、脳星細胞腫/悪性神経膠腫、上衣細胞腫、髄芽細胞腫、天幕上原始神経外胚葉性腫瘍、視覚経路神経膠腫、および視床下部神経膠腫などの脳腫瘍、乳がん、気管支腺腫、バーキットリンパ腫、原発不明のがん、中枢神経系リンパ腫、小脳星細胞腫、子宮頸がん、小児がん、慢性リンパ球性白血病、慢性骨髄性白血病、慢性骨髄増殖性疾患、結腸がん、皮膚T細胞性リンパ腫、線維形成性小円形細胞腫瘍、子宮内膜がん、上衣細胞腫、食道がん、ユーイング肉腫、胚細胞腫瘍、胆嚢がん、胃がん、胃腸カルチノイド腫瘍、消化管間質腫瘍、神経膠腫、有毛細胞白血病、頭頸部がん、心臓がん、肝細胞(肝臓)がん、ホジキンリンパ腫、下咽頭がん、眼内黒色腫、膵島細胞がん、カポジ肉腫、腎臓がん、喉頭がん、唇および口腔がん、脂肪肉腫、肝臓がん、非小細胞がんおよび小細胞肺がんなどの肺がん、リンパ腫、白血病、マクログロブリン悪性骨/骨肉腫の線維性組織球腫、髄芽細胞腫、黒色腫、中皮腫、潜在性口腔がんを含む転移性扁平上皮頸部がん、多発性内分泌腫瘍症候群、骨髄異形成症候群、骨髄性白血病、鼻腔および副鼻腔がん、上咽頭がん、神経芽細胞腫、非ホジキンリンパ腫、非小細胞肺がん、口腔がん、中咽頭がん、骨肉腫/悪性線維性骨組織球腫、卵巣がん、卵巣上皮がん、卵巣胚細胞腫瘍、膵臓がん、膵島細胞がん、副鼻腔および鼻腔がん、副甲状腺がん、陰茎がん、咽頭がん、褐色細胞腫、松果体星細胞腫、松果体胚細胞腫、下垂体腺腫、胸膜肺芽細胞腫、形質細胞腫瘍、中枢神経系原発リンパ腫、前立腺がん、直腸がん、腎細胞がん、腎盂および尿管移行性細胞がん、網膜芽細胞腫、横紋筋肉腫、唾液腺がん、肉腫、皮膚がん、メルケル細胞皮膚がん、小腸がん、軟部肉腫、扁平上皮細胞がん、胃がん、T細胞リンパ腫、咽頭がん、胸腺腫、胸腺がん、甲状腺がん、(妊娠性)絨毛腫瘍、原発部位不明のがん、尿道がん、子宮肉腫、膣がん、外陰部がん、ワルデンストレームマクログロブリン血症、およびウィルムス腫瘍が挙げられる。統合的な複合バイオマーカーを使用できる疾患または病状の例として、血液悪性腫瘍、固形悪性腫瘍、転移性がん、および良性腫瘍が含まれる。
癌を患う複数の対象は、統合的な複合バイオマーカーの使用から恩恵を得ることができる。対象は、ヒト、チンパンジーなどのヒト以外の霊長類、ならびにその他の類人猿およびサル類;ウシ、ウマ、ヒツジ、ヤギ、ブタなどの家畜;ウサギ、イヌ、ネコなどの飼育動物;ラット、マウス、モルモットなどのげっ歯類を含む実験動物などであってもよい。対象はいずれの年齢であってもよい。例えば対象は、高齢者、成人、青年、青年期前、子供、幼児、乳児であってもよい。
患者の健康または治療対象の選択肢は、対象からの体液または組織試料を提供すること;体液または組織試料からゲノム特性およびプロテオミクス特性を収集すること;およびゲノム特性およびプロテオミクス特性を少なくとも1つの基準特性と比較して対象の健康を評価することによって評価してもよい。基準特性は、1つ以上の疾患、損傷、または障害のうちの少なくとも1つの特性を明確にしてもよい。基準特性は、同じ疾患を有する対象から、健康な集団から、またはその両方から収集されたゲノム特性またはプロテオミクス特性から構築されてもよい。この方法は、経時的にゲノム特性またはプロテオミクス特性を基準特性と反復して比較して監視することを含んでもよい。本開示の側面は、腫瘍特性と基準特性の間の差を統計的に分析して少なくとも1つのバイオマーカーを特定することを含んでもよい。95%、97%、98%、または99%未満の有意水準を有するバイオマーカーまたはバイオマーカー群は、排除してもよい。
側面によっては、本開示は、対象での癌の治療のための適応免疫療法の方法を提供でき、この方法は、対象に第1過程の第1の免疫療法化合物を投与する工程;および新生抗原負荷、HLA遺伝子型の多様性、HLAのヘテロ接合性の喪失、免疫レパートリー特性、免疫細胞の逆重畳、癌ウイルスなどの追加の新規および治験中のバイオマーカーに関連する包括的な腫瘍および免疫関連分子情報を取得する工程を含み、第2過程の免疫療法には、腫瘍および免疫関連の分子特性が第1の免疫療法化合物に対する応答が不十分であると示される場合には、第2の免疫療法化合物を含み;あるいは、腫瘍および免疫関連の分子特性が第1の免疫療法化合物に対する応答が不十分であると示されない場合には、第2過程の第1の免疫療法化合物を含む。第1過程の第1の免疫療法化合物の第1の用量を投与した後に取得される1つ以上の生体試料は、第1過程の第1の免疫療法化合物が後続の用量で投与されるのと同一の日に取得されてもよい。
治療、検査、または分析は、疾患の臨床発症の前に対象に提供してもよい。治療、検査、または分析は、疾患の臨床発症の後に対象に提供してもよい。治療、検査、または分析は、疾患の臨床発症の1日後、1週間後、6ヶ月後、12ヶ月後、または2年後に対象に提供してもよい。治療、検査、または分析は、疾患の臨床発症後の1日以上、1週間以上、1ヶ月以上、6ヶ月以上、12ヶ月以上、2年以上に亘って対象に提供されてもよい。治療、検査、または分析は、疾患の臨床発症後の1日未満、1週間未満、1ヶ月未満、6ヶ月未満、12ヶ月未満、または2年未満に亘って対象に提供されてもよい。治療、検査、または分析はまた、臨床治験でヒトを治療、検査、または分析することを含んでもよい。
VI.複合バイオマーカースコアを生成するための実験結果
免疫療法に対する免疫系応答の予測での複合バイオマーカースコアの効力を実証するために、次の実験を実施した。治療前のホルマリン固定パラフィン包埋腫瘍および正常血液試料を、対として採取かつ特性解析して、包括的な腫瘍変異情報、遺伝子発現の定量、新生抗原の特徴付け、HLA(型解析、変異、およびヘテロ接合性の喪失)、TCRレパートリーの特性、および腫瘍微小環境の特性を生成した。次いでこれらのデータを臨床転帰とともに区分し、ここで複合新生抗原のスコアを、各対象について腫瘍変異負荷などの追加のバイオマーカーとともに演算した。
A.群集団
1.検出集団
研究集団に関しては、治療を受けた切除不能なステージIII/IVの黒色腫を患う51人の対象を、無作為または非盲検の形態で過去に遡って登録した。対象を、ニボルマブ(4週間毎に480 mgの静脈内注射(IV)または2週間毎に240 mgの静脈内注射)、ニボルマブとイピリムマブの併用(3週間毎にそれぞれ1 mg/kgの静脈内注射および3 mg/kgの静脈内注射)、あるいはペムブロリズマブ(3週間毎に200 mgの静脈内注射)のいずれかで治療した。固形腫瘍および血液試料を、治療開始前の3ヶ月以内に採取した。コンピューター断層撮影走査測定を、治療開始から10~12週間後に実施し、その後の追跡走査測定を3ヶ月毎に実施した。応答者を、完全応答(CR)または部分応答(PR)として定義した。非応答者を、安定型疾患(SD)または進行性疾患(PD)として定義した。
2.検証集団
予測結果の反復を、免疫チェックポイント遮断療法を受けた進行性黒色腫対象から採取された公的に入手可能なNGSデータを用いて実施した。この研究の全エクソームおよびRNA配列決定データを、dbGaP(遺伝子型および表現型のNCBIデータベース、RRID:SCR_002709)(研究受託番号:phs000452.v3.p1)から取得した。治療に対する応答が混乱した対象(2人)および低純度の腫瘍を患う対象(7人)を分析から除外し、検証のために評価可能な対象(110人)を残した。検証集団の臨床的特性は、元々の研究に提供されている。
3.臨床データの統計分析
臨床データの生成に関して、カプラン・マイヤー法を用いて無増悪生存期間(PFS)および全生存期間(OS)を推定した。客観的応答率を、クロッパー・ピアソンの正確なCIとともに比率として記録した。フィッシャーの正確確率検定およびカイ二乗検定を用いて、群間の関連性およびカテゴリ変数を検定した。3つ以上の群間の分散を考慮する場合には、クラスカル・ワリスH検定を用いた。ウィルコクソン・マン・ホイットニー順位和検定(MWW)を用いて、数値のペアワイズ比較を実施した。ベンジャミニ・ホッホベルグ補正を用いて、列記されたP値を調整した。コルモゴロフ・スミルノフ(KS)統計を用いて、RNA経路分析を実施した。連続変数間の相関関係を、ケンドールのタウ係数を用いて決定した。予測モデルをロジスティック回帰を用いて生成し、AUROCを用いて公開された方法に従って応答と非応答を区別する能力を決定した(28)。全ての検定を両側で実施し、経路解析での0.1未満のFDR値および他の全ての検定での0.05未満のP値は、統計的に有意であると見做された。次の表にその結果を示す。
B.集団の臨床データ
1.検出集団の試料に対応する臨床的特性
免疫チェックポイント遮断で治療された集団での51人の切除不能な黒色腫対象について、集団に対応する追跡期間の中央値は治療後24ヶ月であり、51人の対象のうち33人(50%、95%のクロッパー・ピアソン信頼度間隔:50~78%)が、固形腫瘍での応答評価基準(RECIST)1.1による最初の評価で客観的な応答を示していた。臨床集団内では、腫瘍は、頭頸領域部(31%)、胴体部(31%)、四肢部(25%)、末端領域部(6%)、粘膜部(4%)、および潜在領域部(2%)から発生した。これらのデータに加えて、性別、年齢、およびその他の対象固有の人的統計情報を表示する。次の表は、臨床集団の対象に関連する種々の特性の纏めを示す。
Figure 2023524048000002
表1に示すように、疾患起源の部位間で客観的応答率に統計的な有意差は無かった。さらに11人の対象(22%)ではチェックポイント阻害剤による先行治療の後に実施したが、40人(78%)では免疫チェックポイント遮断を受けなかった。対象に、ペムブロリズマブ(29人、57%)、ニボルマブ(15人、29%)、またはニボルマブとイピリムマブの併用(7人、14%)のいずれかを投与した。
2.検出集団の試料に対応するゲノムデータ
応答腫瘍および非応答腫瘍に関連する変異を調査して、多重仮説補正後の応答に有意な単一遺伝子予測因子が無いことが明らかになった(対象水準の変異データ)。以下の表は、臨床集団内で特定された各遺伝子の応答者と非応答者間の比較データを提供するlog2値およびp値を示す。
Figure 2023524048000003
Figure 2023524048000004
Figure 2023524048000005
Figure 2023524048000006
3.集団の対象に対応する免疫経路データ
次いで臨床データに対応する遺伝的に中断された経路を決定した。最も高頻度に中断された経路には、RTK-RAS経路およびWNT経路が含まれていた(それぞれ集団の73%および51%で中断されていた)。変異をRTK-RAS経路全体に亘って検出した。ROS1およびERBB4、ならびにNRAS、BRAF、MAPK1および2を含むRASファミリー遺伝子を含む多数のRTKが変異していた。
図2A~Bは、臨床集団の対象に対応するゲノムデータおよびトランスクリプトームデータ内の発癌性変化に対応する統計データを示す。図2Aは、後期の黒色腫対象中の既知の発癌経路での変異を示す。図2Aには、影響を受けた経路の比率を、経路内で変異した遺伝子の数で示す(この分析に含まれる51人の試料)。図2Bは、RTK-RAS経路内で発生する変異を視覚化したものを示す。癌抑制遺伝子を赤色で示し、癌遺伝子を青色で示す。ドットは、特定の遺伝子内に変異が無いことを表す。各列は腫瘍を表し、緑色のブロックは特定の遺伝子内の変異を表す。
C.トランスクリプトーム指標
1.差分的遺伝子発現
トランスクリプトームデータを、検出集団の各対象について生成した。トランスクリプトームデータから、種々のトランスクリプトーム指標を生成した。例えば121個の差分的に発現する遺伝子が、応答する対象内で特定された(48人の評価可能な対象;調整P値0.05以下、対数倍率変化2超または-0.5未満)。図3A~Cは、免疫系応答に関連する差分的に発現される遺伝子を特定するトランスクリプトーム指標に対応する統計データを示す。図3Aは、この集団での最高水準の差分的発現を有する50個の遺伝子を示し、ここでは倍数変化を提供して応答対象と非応答対象を比較している。図3Aはさらに、48個の遺伝子の対応する組の各遺伝子について0.05未満のベンジャミニ・ホッホベルグ補正したP値を示す。全てを図3Aには示していないが、これらの遺伝子のうちの29個で富化が観察され、92個の遺伝子で発現の低下が観察された。説明のために、図3Bは臨床集団の各対象について差分的に発現した遺伝子のヒートマップ(濃淡図)を示す。図3Bでは、各列は対象を表し各行は遺伝子を表す。
最も強く上方制御された遺伝子(log2倍率変化=3.28;FDR調整されたP値=0.0005)の中には、小細胞肺がん組織および他の腫瘍組織内で高い発現を示す阻害性Notchリガンドであるδ様リガンド3(DLL3)が含まれていた。腫瘍内での均一な細胞表面発現の上昇に比較して正常組織内での細胞質発現は低いので、δ様リガンド3遺伝子を治療標的とする可能性を現在検討中である。さらにケラチン(KRT)ファミリーの4つのメンバー(KRT72、73、81、86)は、癌の発症と広範な関係を有することが特定されている遺伝子群であるが、応答者と非応答者を比較した場合に発現水準に変化が見られた。DLL3およびKRTファミリー遺伝子に対する遺伝子発現解析結果の検証では、DLL3の有意性が確認されたが(MWW;P=0.02)、KRT72、73、81、86では有意性は確認されなかった(MWW;それぞれP=0.44、P=0.41、P=0.6、およびP=0.17)。検証結果でのこのような差は、個々の遺伝子の差分的な発現を決定する感度の低下が原因である可能性がある。
集団水準では有意な富化は無かったが、IDO1の発現が、3人の対象で非常に高い水準で検出された(IDO1のTPMの中央値=10.36;IDO1のTPMの異常値=1955、661、および451)。説明のための図3Cは、応答対象のIDO1遺伝子発現水準と非応答対象のIDO1遺伝子発現水準を比較する一組の箱ひげ図を示す。遺伝子発現値を、百万キロ塩基当たりの転写産物(TPM)の単位で示した。応答対象の群では、3人の対象で異常値が特定された。IDO1の発現値は免疫療法に対する応答に関係があるようには見受けられなかったが、発現水準が上昇したこれらの異常値は、対応する対象(48人)内では完全な応答を阻止する回避メカニズムを示す可能性がある。例えばIDO1を過剰発現している対象のうちの2人は、おそらくIDO1が駆動する免疫抑制環境のために、免疫療法に対する完全な応答を達成できなかった可能性がある。
2.遺伝子富化分析
次に遺伝子組の富化分析を実施して、臨床集団内で差分的に調節される経路を特定した。図4は、差分的に調節されるそれぞれの免疫経路での正規化された富化スコアに対応する統計データを示し、ここでは遺伝子組の富化分析に基づいて正規化された富化スコアを生成している。図4に示すように、免疫機能に関連する経路の顕著な富化が上方制御された遺伝子を有する応答対象中で特定された。0.05未満のベンジャミニ・ホッホベルグ補正のP値が示される。炎症性シグナル伝達カスケードが、確認されたものの中で最も高く富化された経路中に存在していた(有意性を0.1未満のFDRとして設定)。免疫経路の活性化は、その他の富化された経路に起因すると思われる。例えばTh17の細胞分化は、(i)Th17細胞中のRORγtを誘発するサイトカインTGF-β;および(ii)Th17系統を誘発するIL-6によって駆動されてもよい。観測されたTh17の富化は、観測されたSTAT3シグナル伝達の増加によって正方向に調節されてもよく、このシグナル伝達はTh17の分化を促進するのに役立つ。
3.T細胞受容体の発現水準
図5A~Cは、T細胞受容体の発現水準を特定するトランスクリプトーム指標に対応する統計データを示す。適応免疫系は、固有のT細胞受容体(TCR)のその広いレパートリーにより広範囲の抗原に応答できる。図5A、BおよびCの箱ひげ図は、その下限である百分位の25番目からその上限である百分位の75番目までの四分位範囲を包含し、中央値は水平線で示されている。上部のひげには、百分位の75番目より上位の1.5倍の四分位範囲内の最大値が含まれる。下部のひげには、百分位の25番目より下位の1.5倍の四分位範囲内の最小値が含まれる。治療前の腫瘍免疫状況を特徴付けるために、TCR-βレパートリーの多様性を集団内の一部の対象(28人の対象)で特定した。クローン性を、1-Pielouの均一性を用いて全ての増殖性のTCR-β配列のクローン存在量に対して決定した。腫瘍内の不均一性は免疫応答の決定因子であると考えられるので、腫瘍の不均一性の推定水準を示す変異対立遺伝子腫瘍不均一性(MATH)スコアを、特定されたTCR-βクローン性と比較した。図5Aは、低水準と高水準の変異対立遺伝子腫瘍不均一性の間のTCR-βクローン性の比較を特定する一組の箱ひげ図を示す。図5Aに示すように、高い腫瘍不均一性とTCR-βレパートリーのクローン多様性との間に有意な関連性(MWW;P=0.014)が特定された。
図5Bは、免疫療法に応答性であると特定された第1群の対象と、免疫療法に非応答性であると特定された第2群の対象との間のTCR-βクローン性の比較を特定する一組の箱ひげ図を示す。図5Bに示すように、TCR-βクローン性は、非応答対象に比較して、応答対象では上昇している(28人;MWW;P=0.047)。従ってTCR-βのクローン性は、治療転帰と有意に関連すると考えることができる。さらに図5Cは、高いTCR-βクローン性を有すると特定された第1群と低いTCR-βクローン性を有すると特定された第2群との間の無増悪生存確率の比較を特定する折れ線グラフを示す。図5Cでは、クローン性の低い対象と比較すると、クローン性の高い対象では有意に長い無増悪生存期間が観察されたことを示し(両側KMログランク検定、P=0.0043)、ここで高/低クローン性の層別は、(集団年齢の中央値を分割点として用いて)老/若集団について個別に計算した。
4.免疫浸潤符号
集団での腫瘍微小環境内での免疫細胞集団および間質細胞集団の特徴付けを実施した。得られたデータを用いて、半定量的な免疫浸潤スコアを生成した。図6は、第1群の応答対象と第2群の非応答対象との間の富化スコアの比較を特定する一組の箱ひげ図を示す。富化スコアの比較を、制御性T細胞(TREG)、ナチュラルキラー細胞(NK細胞)、および癌関連線維芽細胞(CAF)を含む、種々の形態の腫瘍浸潤リンパ球に対して特定した。図6に示すように、応答対象および非応答対象は、種々の形態に亘って免疫細胞発現が類似する分布を広範囲に共有していた。従って免疫細胞の遺伝子発現水準は、単独では免疫療法に対する応答性水準の強力な予測指標にはならないように思われる。但し本明細書での説明のように、これらの発現水準は、免疫療法に対する応答性を高精度に予測する複合バイオマーカースコアを生成する際の寄与因子とすることができる。
5.新生抗原負荷
新生抗原に基づくバイオマーカー手法により、免疫チェックポイント遮断に対する応答性との強い相関を達成できる。この特定の試験例に関して、それぞの性能水準を比較するように、2つの異なる新生抗原モデルを生成した。第1の新生抗原モデルは、新生抗原負荷のみに基づくスコアに対応させ、第2の新生抗原モデルは、新生抗原提示およびその他の確立された耐性マーカーに対する障害を考慮するように、拡張した第1のモデルに対応させた。従って第2の新生抗原モデルは、複合バイオマーカースコアを生成するためのモデルに対応している。
新生抗原負荷スコアを計算するために、エキソームデータおよびトランスクリプトームデータに由来する特性を用いた。推定の新生エピトープは、エクソーム配列決定およびトランスクリプトーム配列決定の両方から検出された単一ヌクレオチドの変異、挿入欠失、および融合から予測された。MHCクラスI新生抗原予測を改善するために、単一対立遺伝子HLA遺伝子導入細胞株からの質量分析に基づくペプチド結合データを生成した。このデータを用いて、HLA結合、プロテアソーム切断、および遺伝子発現情報を統合する機械学習アルゴリズムの改良を学習させて新生抗原予測を改善した。
図7A~Bは、種々の遺伝子および疾患部位に亘る新生抗原負荷を特定するトランスクリプトーム指標に対応する統計データを示す。図7Aは、BRAF、NRAS、NF1、およびWTの各遺伝子に対応するドライバー変異に対応する新生抗原負荷スコアを特定する一組の箱ひげ図を示す。図7Aは、新生抗原負荷が異なるドライバー変異を有する腫瘍間で顕著に変化し、部分型の間で有意な変動が現出することを示している(クラスカル・ワリス、P=1e-04)。
さらに図7Bは、末端、四肢、頭頚、粘膜、胴体、および不顕性の各領域を含む黒色腫の種々の疾患部位に対応する新生抗原負荷スコアを特定する一組の箱ひげ図を示す。図7Bでは、起源の疾患部位に亘る有意な関連性は検出されなかった(クラスカル・ワリス、P=0.08)。従って異なる起源の部位から生じる腫瘍を比較した場合に、新生抗原負荷に全体的な変動はなかったが、末端領域と胴体領域の黒色腫の間の事後比較では有意な変動が明確であることが観察できた(MWW;P=0.047)。
図8A~Fは、種々の対象に亘って新生抗原負荷スコアを特定する統計データを示し、ここでこの新生抗原負荷スコアにより免疫療法で治療された対象の応答性を予測できる。図8Aは、免疫療法に応答した第1群の対象と免疫療法に応答しなかった第2群の対象との間の新生抗原負荷スコアの比較に対応する一組の箱ひげ図を示す。図8Aでは、各箱ひげ図は、その下限である百分位の25番目からその上限である百分位の75番目までの四分位範囲を包含し、中央値は水平線によって示される。上部のひげには、百分位の75番目より上位の1.5倍の四分位範囲内の最大値が含まれる。下部のひげには、百分位の25番目より下位の1.5倍の四分位範囲内の最小値が含まれる。新生抗原負荷は、非応答対象と比較すると、応答対象で有意に高いことが分かった(51人;MWW;P=0.016)。図8Bは、検証集団内の対象群(例えば、応答対象、非応答対象)の新生抗原負荷スコアの比較に対応する一組の箱ひげ図を示す。図8Bでの検証集団からのデータは、治療に応答した対象が有意に高い新生抗原負荷を示したことを追認している(MWW;P=0.021)。
他の形態の実験データではまた、高い新生抗原負荷スコアが免疫療法に対する応答性とより強く関連することを示している。図8Cは、高い新生抗原負荷を有すると特定された第1群と低い新生抗原負荷を有すると特定された第2群との間の無増悪生存確率の比較を特定する折れ線図グラフを示す。図8Cに示すように、新生抗原負荷が低い対象と比較した場合に、新生抗原負荷が高い対象では有意に長い無増悪生存期間が観察された(両側KMログランク検定;P=0.002)。図8Dは検証集団内の対象群間の無増悪生存確率の比較を特定する折れ線グラフを示し、図8Eは検証集団内の対象群間の全生存率の比較を特定する折れ線グラフを示す。図8Dは検証集団内で新生抗原負荷の高い対象の無増悪生存期間が新生抗原負荷の低い対象より有意に長くはなかったことを示しているが(両側KMログランク検定、P=0.085)、図8Eは全生存率の顕著な改善が新生抗原負荷の高い対象で観察されたことを示している(両側KMログランク検定、P=0.005)。
図8Fは、新生抗原負荷スコアモデルの性能水準を特定する受信者動作特性曲線を示す。図8Fに示すように、新生抗原負荷スコアモデルでの曲線下面積値は0.71であり、交差検証曲線下面積値(平均値)は0.69であった(対数尤度比P=0.0329)。
D.ゲノム指標
1.変異特性
トランスクリプトームデータに加えて、ゲノムデータを検出集団内の各対象について生成した。ゲノムデータから、種々のゲノム指標を生成した。図9A~Fは、検出集団の各対象試料中に存在する変異に関連する1つ以上の特性を特定する統計データを示す。図9Aは、抗PD-1療法を受けている対象の種々の遺伝子内の変異の特定を示す。図9Aの頂部の箱ひげ図は変異負荷を表す。タイル図は、試料(列)ごとに変異した遺伝子(行)を示し、タイルの色は変異の種類を示している。右側の箱ひげ図は、特定の遺伝子に変異を有する対象の数を表し、変異の種類を示すように色付けされている。このタイル図では、1番目の行は治療応答を表していて、応答(部分応答または完全応答;濃い緑色;33人)または非応答(黒色;18人)のいずれかである。
図9Aでは、非同義ではあるが腫瘍変異負荷の中央値は、4.07変異/MB(四分位範囲、0.95~12.455)であった。このゲノム指標は、既知のデータ組で観察される値に一致するように見受けられる。例えば図9Bは、種々のデータ組に亘ってそれぞれの試料で特定された変異量を示す。検出集団での変異負荷の水準は、TCGA-SKCMのデータ集合(黒色腫)での水準に相当する。図9Bでは、各ドットは1つの試料を表し、赤色の水平線はそれぞれの癌種での変異の中央値である。(対数目盛の)縦軸は、試料当たりの変異数を示す。
図9Cは、検出集団内の各対象の単一ヌクレオチド変異体のそれぞれの型の変異量を特定する一組の箱ひげ図であり、かつ単一ヌクレオチド変異体型の分布を示す棒グラフである。図9Cでは、単一ヌクレオチド変異体を転移または転換のいずれかに分類した(n=49)。左側の箱ひげ図は6つの異なる置換型の全体的な分布を示し、右側の箱ひげ図は転移(Ti)および変換(Tv)の分布を示す。図9Cに示すように、C>T転移が、特定された単一ヌクレオチド変異体の大部分を形成するように見受けられる(76%)。
図9Dは、検出集団内の各対象についての3つの変異符号の分布を特定する棒グラフを示す。符号はヌクレオチド置換の基質を分解して抽出され、変異した塩基の直近を囲む塩基に基づいて96個の置換クラスに分類され、集団内を3つの主要な符号で分類した。図9Dによると、最も共通的に特定されたドライバー変異はBRAF内で対象の33%に発生し、続いて集団の20%がNRASかつ16%がNF1であった。図9Eは、3つの主要な符号の変異の分布を示す。抽出された符号を、過去に検証された符号と比較した。検出集団内の第1および2の符号はUV符号に最も類似しており、第3の符号は未知の病因の符号に最も密接に関連していた。図9Eに示すように、検出集団内に見られる変異符号は、UV誘発性のDNA損傷に最も強く関連している。
図9Fは、特定の腫瘍(例えばBRAF、NRAS)に関連する各ドライバー変異について、免疫療法に対する応答性の種々の水準に対応する対象の分布を特定する棒グラフを示す。例えば応答者は、完全応答(CR)または部分応答(PR)として定義した。非応答者は、安定型疾患(SD)または進行性疾患(PD)として定義した。ドライバー変異とは、癌細胞に腫瘍性形質転換のための基本的な増殖優位性を与える遺伝子変化を指すことができる。図9Fでは、BRAF変異腫瘍を有する対象は、治療に対しより積極的に応答する傾向があった(47人;正確な二項検定;P=0.0258)。種々のゲノム亜型に対する応答率は、予測される応答率からは顕著な変化はなかった。対象でのWT遺伝子での進行性疾患数の増加は、BRAFの頻度の低下に起因する可能性が高く、この低下は典型的にはより高い率で観察される。
2.腫瘍の変異負荷
図10は、種々のドライバー変異、疾患部位、および対象群に亘って腫瘍変異負荷を特定する複数組の箱ひげ図1000を示す。箱ひげ図1000は、箱ひげ図1002、1004、および1006を含む。箱ひげ図は、その下限である百分位の25番目からその上限である百分位の75番目までの四分位範囲を包含し、中央値は水平線によって示される。上部のひげには、百分位の75番目より上位の1.5倍の四分位範囲内の最大値が含まれる。下部のひげには、百分位の25番目より下位の1.5倍の四分位範囲内の最小値が含まれる。腫瘍の変異負荷に対応する値は、log10目盛りでプロットされた。
箱ひげ図1002は、各ドライバー変異の腫瘍変異負荷を特定する。腫瘍変異負荷は、種々のドライバー変異を有する腫瘍間で有意に変動していた(クラスカル・ワリス、P=0.00012)。箱ひげ図1004は、黒色腫の疾患起源のそれぞれの特定部位について腫瘍変異負荷を特定する。箱ひげ図1004は、種々の疾患起源の部位に亘る腫瘍変異負荷の有意な全体的な変動を示し、この有意な変動は、頭頸部を起点とする黒色腫に対比することで明確になる(クラスカル・ワリス、P=0.016)。
箱ひげ図1006は、免疫療法に応答した第1群の対象および免疫療法に応答しなかった第2群の対象の腫瘍変異負荷を特定する。応答対象と非応答対象での腫瘍変異負荷の比較では、有意な関連性が明らかになった(MMW;P=0.049)。但しこの集団での応答対象と非応答対象の腫瘍変異負荷の間の比較的小さな差異は、これらの測定値は予測バイオマーカーとしての腫瘍変異負荷の効果を制限することが最近提示されているので、黒色腫の亜型の交絡効果および腫瘍純度の変化に起因する可能性がある。従って腫瘍変異負荷の単独では、免疫療法に対する応答性を高精度に予測できない可能性がある。
E.複合バイオマーカースコア
本明細書での説明のように、本開示の実施態様では、抗原提示機構の変化が新生抗原提示を妨害する可能性があることが分かっている。これらの変化は免疫チェックポイント遮断に対する対象の応答性に影響を及ぼすことが個別に指摘されているので、このデータを考慮することにより、免疫療法に対する応答性を予測する性能を改善できる可能性がある。従って複合バイオマーカースコアは、新生抗原負荷スコアを調整して、HLA変異、HLAのヘテロ接合性の喪失、およびB2M変異を含む、新生抗原提示を妨げる可能性のある対象に固有の腫瘍変化を考慮する。
1.検出集団
図11A~Dは、種々の対象に亘って複合バイオマーカースコアを特定する統計データを示し、ここで複合バイオマーカースコアは、免疫療法で治療された対象の応答性を予測する際に改善された性能を示す。特に図11A~Dは、複合バイオマーカースコアが新生抗原負荷の単独よりも免疫療法に対する応答性により強く関連していることを示している。例えば図11Aは、免疫療法に応答した第1群の対象と免疫療法に応答しなかった第2群の対象の間の複合バイオマーカースコアの比較に対応する一組の箱ひげ図を示す。図11Aに示すように、複合バイオマーカースコアは、非応答対象に比較して応答対象では有意に高い(51人;MWW;P=0.002)。従って複合バイオマーカースコアにより、新生抗原負荷と比較した場合に、治療転帰の予測が改善された。図11Bは、検証集団内の対象群(例えば応答対象、非応答対象)の複合バイオマーカースコアの比較に対応する一組の箱ひげ図を示す。図11Bの検証集団からのデータでは、同様の結果が確認でき、応答群内の対象は、非応答対象よりも有意に高い複合バイオマーカースコアを示している(110人;MWW;P=0.010)。図11A~Bを参照すると、対応する箱ひげ図は、その下限である百分位の25番目からその上限である百分位の75番目までの四分位範囲を包含し、中央値は水平線によって示される。上部のひげには、百分位の75番目より上位の1.5倍の四分位範囲内の最大値が含まれる。下部のひげには、百分位の25番目より下位の1.5倍の四分位範囲内の最小値が含まれる。
図11Cは、高い複合バイオマーカースコアを有すると特定された第1群と低い複合バイオマーカースコアを有すると特定された第2群の間の無増悪生存確率の比較を特定する折れ線グラフを示す。図11Cに示すように、複合バイオマーカースコアが低い対象に比較して、複合バイオマーカースコアが高い対象では有意に長い無増悪生存期間が観察された(両側KMログランク検定;P=0.0016)。
図11Dは、複合バイオマーカースコアモデルの性能水準を特定する受信者動作特性曲線を示す。図11Dに示すように、複合バイオマーカーモデルは新生抗原負荷モデルよりも良好に機能し、複合バイオマーカースコアの曲線下面積値は0.71から0.76に増加し、交差検証曲線下面積値(平均値)は0.69から0.75に増加した(対数尤度比P=0.0057)。
2.検証集団
図12A~Bは、種々の対象に亘って複合バイオマーカースコアを特定する統計データを示し、ここで複合バイオマーカースコアは、集団内の対象の無増悪率および全生存率を予測する際に改善された性能を示す。特に複合バイオマーカースコアの性能水準の改善は、検証集団でより顕著であった。図12Aは、検証集団内の対象群間の無増悪生存確率の比較を特定する折れ線グラフを示し、図12Bは、検証集団内の対象群間の全生存率の比較を特定する折れ線グラフを示す。検証集団内で新生抗原負荷スコアについて見出された結果とは対照的に、図12Aは、高い複合バイオマーカースコアに関連する対象の無増悪生存期間が、低い複合バイオマーカースコアに関連する対象よりも有意に長かったことを示している(両側KMログランク検定、P=0.05)。さらに図12Bに示すように、全生存率を解析した場合にはまたより大きな有意性が達成され、全生存率は、高い複合バイオマーカースコアに関連する対象では有意に長くなった(両側KMログランク検定、P=0.002)。複合バイオマーカースコアによる向上は、検出集団内の23.5%の対象および検証集団内の17.27%の対象が抗原提示に潜在的に影響を及ぼす少なくとも1つのメカニズムを有するという知見によって生物学的に解釈でき、これらの特徴が高頻度で免疫療法に対する免疫システムの応答性に影響を及ぼす可能性があることを示唆している。
3.複合バイオマーカースコアに影響を及ぼすHLA遺伝子の変異
図13A~Bは、新生抗原提示の確率の低下に寄与し得るHLA遺伝子に対する体細胞変異を特定する統計データを示す。特に検出集団全体に損傷を与えるHLA変異の再調査によって、多くの対象での有害な変異が明らかになった。例えば、図13Aは、検出集団の試料内で特定された体細胞変異の例を示す。図13Aに示すように、HLA-A02:01内のストップゲイン変異およびHLA-B15:01内のスプライス領域変異を含む2つの個別の体細胞HLA変異が対象25に見出された(対立遺伝子分率は、それぞれ0.473および0.368)。これらの体細胞変異により、HLA-A02:01の表面発現が喪失し、かつHLAB15:01のミスフォールドが生じる可能性がある。有害なフレームシフト変異が、対象38でのβ2-ミクログロブリン(B2M)内で検出され、これによりその対象の全てのMHCクラスI提示が損なわれる可能性がある。
図13Bは、検出集団の対象25でのそれぞれのHLA遺伝子によって提示される新生抗原の相対頻度を特定する棒グラフを示す。図13Bでは、対象25での38.9%の新生抗原(A02:01では19.1%;B15:01では19.8%)が、損傷したHLA対立遺伝子に結合すると予測され、これにより新生抗原提示の潜在的に深刻な障害が示唆された。注目すべきことには、対象25は新生抗原負荷が非応答対象内の遥かに高い異常値であり、複合バイオマーカースコアで捉えられる以上の新生抗原提示の障害が、免疫チェックポイント遮断耐性に寄与する要因である可能性があることを示唆している。別の異常値である対象38(新生抗原負荷が高い非応答者)では、有害なフレームシフト変異がB2M内で高い対立遺伝子画分で検出され、これもまた抗原提示に影響を及ぼす可能性がある。
4.HLAのヘテロ接合性の喪失
HLAのヘテロ接合性の喪失をさらに、この喪失は新生抗原の提示に影響を及ぼす可能性があるので、この集団内で調べた。HLAのヘテロ接合性の喪失は、免疫系への腫瘍新生抗原の提示能力を低下させて免疫逃避を促進する後天的な耐性メカニズムを指す。HLAの喪失プロセスは、特に腫瘍進化の後期段階で腫瘍微小環境内の選択圧によって支配されるので、後期黒色腫対象の集団内では、対立遺伝子特異的HLAのヘテロ接合性の喪失が、明白な新生抗原負荷の上昇にも拘わらず治療応答の低下に寄与する可能性があることが想定された。
HLAのヘテロ接合性の喪失は、評価可能な対象の19.6%(10/51)で発生するHLA破壊の最も汎用的な形態であり、3つの個体が全ての非ホモ接合性HLAに亘ってヘテロ接合性の喪失を示していることを見出した。図14A~Bは、特定の対象の正常試料と対応する腫瘍試料との間のHLA配列の比較を特定する複数組の判定項目の例を示す。例えば図14Aは、対象の正常試料と腫瘍試料の間のHLA-A配列の比較を特定する一組の判定項目を示す。図14Bは、対象の正常試料と腫瘍試料の間のHLA-C配列の比較を特定する一組の判定項目を示す。
図14A~Bは、検出集団の対象54のHLA-AおよびHLA-CでのHLAのヘテロ接合性の喪失に関するNGS配列に基づく証拠を提供する。HLA-Bは示されてはいない。1番目の行は、正常試料での両方の相同対立遺伝子の生の読取り範囲を示す。2番目の行は、腫瘍試料での両方の相同対立遺伝子の生の読取り範囲を示す。両方のプロットには、2つの対立遺伝子間の差異の位置を表す灰色の垂直線を入れる。全ての読取り値を不一致が無いようにマップにする必要がある厳密なマップ化パラメータにより、灰色の線での範囲の差異は、対立遺伝子間の範囲の真の差異を表すことになる。3番目の判定項目は、正常試料(灰色)と腫瘍試料(黒色)からのb対立遺伝子頻度を示している。腫瘍試料中のb対立遺伝子頻度は、対立遺伝子間のプライマーのハイブリダイズに違いがあるために、正常試料中のb対立遺伝子頻度に照らして考慮する必要がある。4番目の判定項目は、各対立遺伝子の腫瘍試料と正常試料間の範囲での比率を示す。これらの数値は、エクソーム全体に亘って腫瘍試料と正常試料の読取り深度によって正規化されている。コピー数の変化のない期待値は1であり、灰色の破線で示される。3番目と4番目の判定項目は両方とも、2つの対立遺伝子間の不一致位置についてデータのみを示す。
図14A~Bに示すように、対象からの一致した正常組織は、一般的にHLA遺伝子AおよびCに亘って対立遺伝子に特異的な範囲を提示している。対照的にこの対象からの腫瘍組織は、各HLAの大部分に及ぶ対立遺伝子に特異的な範囲では広範な不均衡を示し、HLA-A01:01およびHLA-C07:01での包含率の水準は低い。B対立遺伝子頻度(b対立遺伝子頻度)は正常試料との絶対差を示す。失われた対立遺伝子(図14A~B中の4番目の行)では一貫して低い包含率が観察され、これはこの対象の新生抗原の約54%を提示すると予測され、免疫系への提示能力を低下させる可能性が高い。
VII.複合バイオマーカースコアを生成するプロセス
図15は、いくつかの実施態様に従って、複合バイオマーカースコアを生成する方法の一例を示す流れ図1500を含む。流れ図1500に記載の動作は、例えばトランスクリプトーム指標およびゲノム指標に基づいて複合バイオマーカースコアを生成するための1つ以上の動作を実行するコンピュータシステムによって実施されてもよい。流れ図1500は連続プロセスとして動作を説明しているが、実施態様によっては、動作の多くを並行してすなわち同時に実施してもよい。また動作の順番を入れ替えてもよい。動作には、図には示されない追加の工程が含まれてもよい。さらにこの方法の実施態様は、ハードウェア、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語、またはそれらの任意の組合せによって実行されてもよい。ソフトウェア、ファームウェア、ミドルウェア、またはマイクロコードで実行される場合には、関連のタスクを実行するためのプログラムコードまたはコードセグメントは、記憶媒体などのコンピュータ可読媒体内に格納していてもよい。
動作1510では、免疫ゲノミクス解析システムは、対象の生体試料を処理して生成されたゲノムデータおよびトランスクリプトームデータを入手する。場合によっては、生体試料は1つ以上の癌細胞を含む。ゲノムデータは、生体試料中の1つ以上のDNA配列を特定でき、ここでは全エクソーム配列決定を実施して1つ以上のDNA配列を特定できる。トランスクリプトームデータは、生体試料中の1つ以上のRNA配列を特定でき、ここではトランスクリプトーム配列決定を用いて1つ以上のRNA配列を特定できる。さらにまたはあるいは、ゲノムデータおよびトランスクリプトームデータは、対象の生体試料および基準生体試料を含む試料対から生成でき、ここで基準生体試料には1つ以上の癌細胞を含まない。
動作1520では、免疫ゲノミクス解析システムは、ゲノムデータを処理して一組のゲノム指標を生成する。一組のゲノム指標のそれぞれは、対応するDNA配列に対応する1つ以上の特性を1つ以上のDNA配列として表すことができる。場合によっては、一組のゲノム指標には、(i)1つ以上のDNA配列中の1つ以上の体細胞変異のそれぞれについて1つ以上の特性を表す定量指標または分類指標;(ii)ヘテロ接合性の喪失が生体試料の少なくとも1つのヒト白血球抗原(HLA)遺伝子内で発生したか否かを示す分類指標;および(iii)予測される腫瘍変異の負荷を表す定量指標または分類指標が含まれる。HLAのヘテロ接合性の喪失に関しては、対応する分類指標は、ゲノムデータをHLA欠失識別機械学習モデルに当てはめることで生成できる。
動作1530では、免疫ゲノミクス解析システムは、トランスクリプトームデータを処理して一組のトランスクリプトーム指標を生成する。一組のトランスクリプトーム指標のそれぞれは、1つ以上のRNA配列のうちの対応するRNA配列から翻訳される一組のペプチドに対応する1つ以上の特性を表すことができる。場合によっては、一組のトランスクリプトーム指標には、(i)生体試料の予測される新生抗原負荷を表す定量指標または分類指標;(ii)生体試料から検出された1つ以上の候補となる新生抗原のそれぞれの1つ以上の特性を表す定量指標または分類指標;(iii)細胞表面提示の喪失が検出される1つ以上のHLAタンパク質のそれぞれの1つ以上の特性を表す定量指標または分類指標;(iv)細胞表面提示の喪失が検出された1つ以上のHLAタンパク質をコードするHLA遺伝子に対応する1つ以上の特性を表す定量指標または分類指標;(v)免疫細胞に対応する配列の発現水準を表す定量指標または分類指標;および(vi)生体試料から検出された1つ以上のT細胞受容体の発現水準を表す定量指標または分類指標が含まれる。細胞表面提示の喪失が検出されるHLAタンパク質に関しては、対応する指標は、ゲノムデータおよびトランスクリプトームデータを新生抗原提示予測機械学習モデルに当てはめることで生成できる。
動作1540では、免疫ゲノミクス解析システムは、一組のゲノム指標および一組のトランスクリプトーム指標に由来する複合バイオマーカースコアを生成する。場合によっては、免疫ゲノミクス解析システムでは、(i)一組のゲノム指標のうちのそれぞれのゲノム指標を、一組のトランスクリプトーム指標のうちの対応するトランスクリプトーム指標に基づいて決定された重み値で重み付けすること、および(ii)重み付けされたゲノム指標を用いて複合バイオマーカースコアを生成することによって、複合バイオマーカースコアを生成する。
動作1550では、免疫ゲノミクス解析システムは、複合バイオマーカースコアに基づいて、特定の型の免疫療法治療に対する対象の応答性の予測水準を決定する。
動作1560では、免疫ゲノミクス解析システムは、対象の応答性の予測水準に対応する結果を出力する。この結果は、特定の治療に対する対象の応答性の予測水準に基づいて、(i)特定の治療の推奨;(ii)ヒト対象に対して特定の治療を施用する推奨;および/または(iii)ヒト対象に対して特定の治療を施用しない推奨を特定する報告であってもよい。実施態様によっては、推奨される治療をヒト対象に施用する。その後にプロセス1500は終了する。
VIII.その他の考慮事項
本主題はその特定の実施態様に関して詳細に説明されてきたが、当業者なら前述の内容を理解できるとその実施態様に対して変更、変形、および均等物を容易に生成できることが分かる。従って当然のことではあるが、本開示は、限定ではなく例として提示することを目的としており、当業者には容易に明らかである修正、変形、および/または追加を本主題に含むことを排除するものではない。実際のところ、本明細書に記載の方法およびシステムは、種々の他の形態で具現化することができ、さらに本開示の趣旨から逸脱することなく、本明細書に記載の方法およびシステムの形態における様々な省略、置換、および変更を実施することができる。添付の特許請求の範囲およびそれらの均等物は、本開示の範囲および趣旨内に含まれるそのような形態または修正を包含することを意図している。
他に特記の無い限り、本明細書の全体を通して「処理すること(processing)」、「演算すること(computing)」、「計算すること(calculating)」、「決定すること(determining)」、および「特定すること(identifying)」などの用語を活用する説明内容は、メモリ、レジスタ、またはその他の情報記憶装置、伝送装置、または計算プラットホームの表示装置内の物理的な電子量または磁気量として表されるデータを操作または変換する、1つ以上のコンピュータまたは類似の電子計算装置などの演算装置の動作またはプロセスを指すことが分かっている。
本明細書で説明する1つ以上のシステムは、特定のハードウェア構築物または構成物に限定はされない。演算装置は、1つ以上の入力に条件付けされた結果を提供する構成部品の任意の適切な配置を含んでもよい。適切な演算装置には、本主題の1つ以上の実施態様を実行する汎用演算装置から専用演算装置までの演算システムをプログラムするまたは構成する、格納されたソフトウェアを利用する多目的マイクロプロセッサに基づく演算システムが含まれる。任意の適切なプログラミング、スクリプト作成、または他の形態の言語または言語の組合せを用いて、演算装置のプログラミングまたは構成に使用できるソフトウェアで本明細書に含まれる教示を実行できる。
実施態様によっては、実施態様はそのような演算装置の動作によって実施されてもよい。上記の例に提示されるブロックの順序は変更してもよく、例えばブロックを並べ替えたり、組み合わせたり、および/または部分ブロックに分割してもよい。特定のブロックまたはプロセスを並行して実施してもよい。
本明細書で使用される条件付き語句、特に「あってもよい(can)」、「ありうる(could)」、「ありうる(might)」、「あってもよい(may)」、「例えば(e.g.)」などは、他に特記の無い限り、あるいは使用される文脈内で別の形で解釈されない限り、一般的には特定の例には特定の特性、要素、および/または工程を含み、その他の例にはそれらを含まないことを伝達することを意図している。従ってそのような条件付き語句は、一般的には、特性、要素、および/または工程が1つ以上の例にはいずれかの形で必要であること、あるいは1つ以上の例には、筆者の入力または記載の有無に拘わらず、これらの特性、要素、および/または工程が、任意の特定の例に含まれるかまたは実行されるか否かを決定する論理を必然的に含むことを暗示する意図はない。
「含むこと(including)」、「含むこと(including)」、「有すること(having)」などの用語は同義語であり、非制限の形態で包括的に使用され、追加の要素、特性、動作、操作などを排除しない。さらに用語「または(or)」は、例えば要素の一覧を接続するために用いられる場合に、用語「または(or)」は、一覧の中の要素のうちの1つ、いくつか、または全てを意味するように、包括的な意味で(排他的な意味ではなく)使用される。本明細書での「適合される(adapted to)」または「構成される(configured to)」の使用は、追加の作業または工程を実施するように適合または構成された装置を排除しない語句を意味する。さらに「に基づく(based on)」の使用は、1つ以上の記載された条件または数値「に基づく」プロセス、工程、計算、またはその他の動作が、実際には、記載される条件または数値を超える追加の条件または数値に基づく場合があるように非限定で包括的であることを意味している。同様に「に少なくとも部分的に基づく(based at least in part on)」の使用は、1つ以上の記載された条件または数値「に少なくとも部分的に基づく」プロセス、工程、計算、またはその他の動作が、実際には、記載される条件または数値を超える追加の条件または数値に基づく場合があるように非限定で包括的であることを意味している。本明細書に含まれる見出し、一覧、および番号付けは、説明を容易にすることのみを目的として、限定することを意味するものではない。
上記の様々な特徴およびプロセスは、互いに独立して用いてもよく、または様々な方法で組み合わせてもよい。全ての可能な組合せおよび部分的な組合せは、本開示の範囲内に含まれることが意図されている。さらに特定の方法またはプロセスのブロックは、いくつかの実行では省略されてもよい。本明細書で説明する方法およびプロセスはまた、任意の特定の順序に限定されず、それに関連するブロックまたは状態は、適切な他の順序で実行されてもよい。例えば、説明されたブロックまたは状態は、具体的に開示された以外の順序で実行されてもよく、あるいは複数のブロックまたは状態が単一のブロックまたは状態に結合されてもよい。例示的なブロックまたは状態は、連続的に、並列的に、または他の手法で実行されてもよい。ブロックまたは状態は、開示された例に追加してもよく、またはその例から削除してもよい。同様に本明細書に記載された例示的なシステムおよび構成要素は、記載されたものとは異なって構成されてもよい。例えば要素を、開示された例に追加、その例を削除、あるいはその例に対比して再構成してもよい。

Claims (17)

1つ以上の癌細胞を含む対象の生体試料を処理することによって生成された生体試料中の1つ以上のDNA配列を特定するゲノムデータおよび生体試料中の1つ以上のRNA配列を特定するトランスクリプトームデータを入手する工程;
前記ゲノムデータに基づいて、一組のゲノム指標のそれぞれが対応するDNA配列に対応する1つ以上の特性を1つ以上のDNA配列として表す、前記一組のゲノム指標を生成する工程;
前記トランスクリプトームデータに基づいて、一組のトランスクリプトーム指標のそれぞれが1つ以上のRNA配列の対応するRNA配列から翻訳された一組のペプチドに対応する1つ以上の特性を表す、前記一組のトランスクリプトーム指標を生成する工程;
前記一組のゲノム指標および前記一組のトランスクリプトーム指標に由来する複合バイオマーカースコアを特定する工程;
前記複合バイオマーカースコアに基づいて、特定の型の免疫療法治療に対する前記対象の応答性の予測水準を決定する工程;および
前記対象の前記応答性の予測水準に対応する結果を出力する工程、
を含む方法。
前記一組のゲノム指標を生成する工程は、1つ以上のDNA配列内の1つ以上の体細胞変異のそれぞれに対して1つ以上の特性を表す定量指標または分類指標を決定することを含む、請求項1に記載の方法。
前記一組のゲノム指標を生成する工程は、前記生体試料の少なくとも1つのヒト白血球抗原(HLA)遺伝子内でヘテロ接合性の喪失が発生したか否かを示す分類指標を決定することを含む、請求項1または2に記載の方法。
前記ヘテロ接合性の喪失が発生したか否かを示す指標を決定することは、前記ゲノムデータをHLA欠失識別機械学習モデルに当てはめて、ヘテロ接合性の喪失が発生したか否かを示す前記指標に対応する出力を生成することを含む、請求項3に記載の方法。
前記一組のトランスクリプトーム指標を生成する工程は、前記生体試料の予測された新生抗原負荷を表す定量指標または分類指標を決定することを含む、請求項1~4のいずれか一項に記載の方法。
前記一組のトランスクリプトーム指標を生成する工程は、前記ゲノムデータおよび前記トランスクリプトームデータに基づいて、前記生体試料から検出された1つ以上の候補となる新生抗原のそれぞれの1つ以上の特性を表す定量指標または分類指標を決定することを含む、請求項1~5のいずれか一項に記載の方法。
前記一組のトランスクリプトーム指標を生成する工程は、細胞表面提示の喪失が検出される1つ以上のHLAタンパク質のそれぞれの1つ以上の特性を表す定量指標または分類指標を生成することを含む、請求項1~6のいずれか一項に記載の方法。
前記一組のトランスクリプトーム指標を生成する工程は、トランスクリプトームデータに基づいて、細胞表面提示の喪失が検出される1つ以上のHLAタンパク質をコードするHLA遺伝子に対応する1つ以上の特性を表す定量指標または分類指標を生成することを含む、請求項7に記載の方法。
前記一組のトランスクリプトーム指標を生成する工程は、前記ゲノムデータおよび前記トランスクリプトームデータを新生抗原提示予測機械学習モデルに当てはめて、前記1つ以上のHLAタンパク質のそれぞれの1つ以上の特性を表す前記定量指標または分類指標を生成することを含む、請求項7に記載の方法。。
前記一組のトランスクリプトーム指標を生成する工程は、前記生体試料から検出された1つ以上のT細胞受容体の発現水準を表す定量指標または分類指標を決定することを含む、請求項1~9のいずれか一項に記載の方法。
前記生体試料は前記対象の腫瘍から採取され、前記一組のトランスクリプトーム指標を生成する工程は、免疫細胞に対応する配列の発現水準を表す定量指標または分類指標を決定することを含む、請求項1~10のいずれか一項に記載の方法。。
前記ゲノムデータおよび前記トランスクリプトームデータを入手する工程は、全エクソーム配列決定を用いて前記1つ以上のDNA配列を特定することを含む、請求項1~11のいずれか一項に記載の方法。
前記ゲノムデータおよび前記トランスクリプトームデータを入手する工程は、トランスクリプトーム配列決定を用いて前記1つ以上のRNA配列を特定することを含む、請求項1~12のいずれか一項に記載の方法。
前記ゲノムデータおよび前記トランスクリプトームデータを入手する工程は、前記対象の前記生体試料および基準生体試料から前記ゲノムデータおよび前記トランスクリプトームデータを生成することを含み、前記基準生体試料は1つ以上の癌細胞を含まない、請求項1~13のいずれか一項に記載の方法。
前記複合バイオマーカースコアを生成する工程は、
前記一組のゲノム指標のそれぞれのゲノム指標を、前記一組のトランスクリプトーム指標の対応するトランスクリプトーム指標に基づいて決定された重み値で重み付けすること;および
前記重み付けされたゲノム指標を用いて前記複合バイオマーカースコアを生成することを含む、請求項1~14のいずれか一項に記載の方法。。
1つ以上のデータプロセッサ;および
前記1つ以上のデータプロセッサで実行される場合に、前記1つ以上のデータプロセッサに本明細書に開示される1つ以上の方法の一部または全部を実行させる命令を含む非一時的なコンピュータ可読記憶媒体を含む、システム。
1つ以上のデータプロセッサに本明細書に開示される1つ以上の方法の一部または全部を実行させるように構成された命令を含む、非一時的な機械可読記憶媒体内に確実に具現化されたコンピュータプログラム製品。
JP2022566109A 2020-04-29 2021-04-28 癌の免疫療法のための複合バイオマーカー Pending JP2023524048A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US202063017542P 2020-04-29 2020-04-29
US63/017,542 2020-04-29
US202063040943P 2020-06-18 2020-06-18
US63/040,943 2020-06-18
PCT/US2021/029684 WO2021222434A1 (en) 2020-04-29 2021-04-28 Composite biomarkers for immunotherapy for cancer

Publications (1)

Publication Number Publication Date
JP2023524048A true JP2023524048A (ja) 2023-06-08

Family

ID=78373949

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022566109A Pending JP2023524048A (ja) 2020-04-29 2021-04-28 癌の免疫療法のための複合バイオマーカー

Country Status (5)

Country Link
US (1) US20230050395A1 (ja)
EP (1) EP4143310A1 (ja)
JP (1) JP2023524048A (ja)
CN (1) CN115715322A (ja)
WO (1) WO2021222434A1 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101781147B1 (ko) * 2008-12-22 2017-10-10 셀루라 인코포레이티드 대립유전자, 게놈 및 전사체 검출을 위한 방법 및 유전자형 분석 패널
SG173048A1 (en) * 2009-01-20 2011-08-29 Univ Leland Stanford Junior Single cell gene expression for diagnosis, prognosis and identification of drug targets
EP3965111A1 (en) * 2013-08-30 2022-03-09 Personalis, Inc. Methods and systems for genomic analysis
GB2568608B (en) * 2016-05-27 2022-10-12 Personalis Inc Personalized genetic testing

Also Published As

Publication number Publication date
CN115715322A (zh) 2023-02-24
US20230050395A1 (en) 2023-02-16
WO2021222434A1 (en) 2021-11-04
EP4143310A1 (en) 2023-03-08

Similar Documents

Publication Publication Date Title
Liu et al. Integrative molecular and clinical modeling of clinical outcomes to PD1 blockade in patients with metastatic melanoma
US20240141432A9 (en) Detection and treatment of disease exhibiting disease cell heterogeneity and systems and methods for communicating test results
CA2988674C (en) Detection of chromosome interactions
US20240079089A1 (en) Immunotherapy Markers And Uses Therefor
Ran et al. Genetics of psoriasis: a basis for precision medicine
US20080234138A1 (en) TP53 gene expression and uses thereof
Abbott et al. Prediction of immunotherapy response in melanoma through combined modeling of neoantigen burden and immune-related resistance mechanisms
US20200109455A1 (en) Systems and methods for predicting clinical responses to immunotherapies
JP2022513068A (ja) 免疫療法で治療されたがん患者の応答の予測を改善する方法
CN111254196B (zh) Inpp4b基因变异在预测非小细胞肺癌患者对免疫检查点抑制剂疗法敏感性中的应用
Pagadala et al. Germline modifiers of the tumor immune microenvironment implicate drivers of cancer risk and immunotherapy response
Li Yim et al. Novel insights into rheumatoid arthritis through characterization of concordant changes in DNA methylation and gene expression in synovial biopsies of patients with differing numbers of swollen joints
Zhang et al. Identification of the BTN3A3 gene as a molecule implicated in generalized pustular psoriasis in a Chinese population
CN110923329B (zh) Fgfr4点突变在预测非小细胞肺癌患者对免疫检查点抑制剂疗法敏感性中的应用
WO2023185985A1 (zh) 用于评估肿瘤ibc疗法的疗效的生物标志物、系统、方法及试剂盒
CN106119406B (zh) 多发性肉芽肿血管炎及微小动脉炎的基因分型诊断试剂盒及使用方法
JP2023524048A (ja) 癌の免疫療法のための複合バイオマーカー
WO2015039107A1 (en) Activities of multiple cancer-related pathways are associated with braf mutation and predict the resistance to braf/mek inhibitors in melanoma cells
CN112442528A (zh) Loxhd1基因突变体及其应用
WO2014190927A1 (zh) 胰腺神经内分泌肿瘤易感基因位点及检测方法和试剂盒
WO2023125787A1 (en) Biomarkers for colorectal cancer treatment
CN111919257B (zh) 降低测序数据中的噪声的方法和系统及其实施和应用
US20220344004A1 (en) Detecting the presence of a tumor based on off-target polynucleotide sequencing data
WO2023081117A1 (en) Immunotherapy targeting
Spassova Prognostic and predictive biomarkers in Merkel cell carcinoma

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221223

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20221223

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230927

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231205

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240301