JP2021505976A - Systems and methods for assessing drug efficacy - Google Patents

Systems and methods for assessing drug efficacy Download PDF

Info

Publication number
JP2021505976A
JP2021505976A JP2019566271A JP2019566271A JP2021505976A JP 2021505976 A JP2021505976 A JP 2021505976A JP 2019566271 A JP2019566271 A JP 2019566271A JP 2019566271 A JP2019566271 A JP 2019566271A JP 2021505976 A JP2021505976 A JP 2021505976A
Authority
JP
Japan
Prior art keywords
expression
feature
trained
machine learning
responsiveness
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019566271A
Other languages
Japanese (ja)
Other versions
JP7429539B2 (en
Inventor
シレ・ジャン
メンチ・ワン
アーロン・ワイズ
ハン・カン
ヴィトール・フェレイラ・オヌチッチ
クリスティーナ・クルグルヤク
Original Assignee
イルミナ インコーポレイテッド
イルミナ インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by イルミナ インコーポレイテッド, イルミナ インコーポレイテッド filed Critical イルミナ インコーポレイテッド
Publication of JP2021505976A publication Critical patent/JP2021505976A/en
Application granted granted Critical
Publication of JP7429539B2 publication Critical patent/JP7429539B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Bioethics (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Image Analysis (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Peptides Or Proteins (AREA)

Abstract

訓練した機械学習分類器に、腫瘍試料由来の特徴を含む、非非訓練対象のゲノム情報を入力する工程であって、訓練した機械学習分類器が、訓練対象から得られる腫瘍試料の特徴、及びチェックポイント阻害治療に対する、その応答性について訓練され、機械学習分類器が、治療に対する応答性を予測するように訓練される、工程と、訓練した機械学習分類器を用いて、対象がチェックポイント阻害に対して応答することを予測するチェックポイント阻害応答性分類を生成する工程と、チェックポイント阻害応答性分類を、グラフィカルユーザインターフェースを使用してレポートする工程とを含む、コンピュータ実行方法を提供する。また、この方法を実施するためのコンピュータシステム及びこの方法により訓練される機械学習分類器を提供する。In the step of inputting the genomic information of the non-trained object including the characteristics derived from the tumor sample into the trained machine learning classifier, the trained machine learning classifier is the process of inputting the characteristics of the tumor sample obtained from the trained object and the characteristics of the tumor sample. A subject is checkedpoint-inhibited using a process and a trained machine-learning classifier trained for its responsiveness to checkpoint inhibition treatment and a machine learning classifier trained to predict its responsiveness to treatment. Provided is a computer execution method including a step of generating a checkpoint inhibitory responsiveness classification that predicts a response to a response and a step of reporting the checkpoint inhibitory responsiveness classification using a graphical user interface. Also provided are a computer system for carrying out this method and a machine learning classifier trained by this method.

Description

関連出願の相互参照
本出願は、2017年12月1日出願の米国仮特許出願第62/593,802号の優先権を主張し、その全内容をこれにより本明細書に組み込む。
Cross-reference to related applications This application claims the priority of US Provisional Patent Application No. 62 / 593,802 filed December 1, 2017, the entire contents of which are incorporated herein by this.

体内の異常性又はがん性細胞を検出することは、免疫系における重要な課題である。関与する1つの機構は、免疫チェックポイントである。例えば、プログラム細胞死タンパク質1(PD-1)及び細胞傷害性Tリンパ球関連タンパク質4(CTLA-4)チェックポイントは、T細胞上で、免疫機能をネガティブに制御し、過剰反応を防ぐ(即ち、免疫系の自己認識を促進する)。しかし、この機構は、腫瘍細胞に利用されて、免疫攻撃を免れ得る。PD-1阻害(例えば、抗PD1抗体)及びCTLA-4(例えば、CTLA-4抗体)のような免疫療法は、チェックポイント活性を遮断し、これによりT細胞が疾患又は腫瘍細胞それ自体を同定することを容易とする。 Detecting abnormal or cancerous cells in the body is an important challenge in the immune system. One mechanism involved is the immune checkpoint. For example, programmed cell death protein 1 (PD-1) and cytotoxic T lymphocyte-related protein 4 (CTLA-4) checkpoints negatively regulate immune function and prevent overreaction on T cells (ie,). , Promotes self-recognition of the immune system). However, this mechanism can be utilized by tumor cells to escape immune attack. Immunotherapy such as PD-1 inhibition (eg, anti-PD1 antibody) and CTLA-4 (eg, CTLA-4 antibody) block checkpoint activity, which allows T cells to identify the disease or tumor cells themselves. Make it easy to do.

しかし、免疫チェックポイント療法は、有効であり得るが、すべてのがん患者における応答性は、保証されない。従来のがん治療と比較して、免疫チェックポイント療法は、種々のがんを有する患者の長期生存の向上を示した。しかし、がん患者の一部のみが、抗CTLA-4抗体(例えば、イピリムマブ)を含む現在承認されているチェックポイント阻害薬、及び抗PD-1抗体(例えば、ニボルマブ)又は抗プログラム死リガンド1(抗PD-L1)抗体(例えば、アテゾリズマブ)のようなPD-1チェックポイント経路を標的とする治療に応答する。従って、特定のチェックポイント療法に応答し得る患者を選択すること、及びいずれのチェックポイント標的が最良の結果を特定の患者にもたらし得るかを予測することが可能となることは、利点となり得る。 However, while immune checkpoint therapy may be effective, responsiveness in all cancer patients is not guaranteed. Compared to traditional cancer treatments, immune checkpoint therapy has shown improved long-term survival in patients with a variety of cancers. However, only some cancer patients have currently approved checkpoint inhibitors, including anti-CTLA-4 antibody (eg, ipilimumab), and anti-PD-1 antibody (eg, nivolumab) or anti-programmed death ligand 1 Respond to treatments that target the PD-1 checkpoint pathway, such as (anti-PD-L1) antibodies (eg, atezolizumab). Therefore, it may be advantageous to be able to select patients who can respond to a particular checkpoint therapy and to be able to predict which checkpoint target may give the best results to a particular patient.

多種多様なゲノム及び細胞の特徴は、特定の個人のための免疫療法の有効性に寄与し得る。例えば、腫瘍変異頻度(TMB、tumor mutation burden)が高くなると、腫瘍細胞上の抗原提示が増加することにより応答率がポジティブに影響され、PD-1が遮断される場合にT細胞による認識が増加することとなり得る。CD4/CD8/CD19を発現する白血球腫瘍浸潤は、このような細胞が腫瘍細胞の免疫的攻撃及び引き続く抗原放出を助けるため、より良い臨床結果と相関する。骨髄由来抑制細胞及び制御性T細胞(Treg)は、T細胞の有効性を抑制して、様々な患者における生存の悪化に相関する。これらが、相互に作用する次世代シーケンシング(NGS)データから検出可能かつ導出可能な特徴であるため、それらの免疫療法応答に対する関係を調べ、チェックポイント阻害のような療法又は他の癌治療に対する応答性の予測を立て、他の個人の応答性に基づき、個人の多因子性コンテキストを考慮しながら、特定の個人において協働する多くの特徴のコンテキストを組み込む、機械学習アプリケーションを構築することが重要である。 A wide variety of genomic and cellular features can contribute to the effectiveness of immunotherapy for a particular individual. For example, when the tumor mutation burden (TMB) increases, the response rate is positively affected by increased antigen presentation on tumor cells, and recognition by T cells increases when PD-1 is blocked. Can be. Leukocyte tumor infiltration expressing CD4 / CD8 / CD19 correlates with better clinical outcomes because such cells aid in the immune attack and subsequent antigen release of tumor cells. Bone marrow-derived inhibitory cells and regulatory T cells (Tregs) suppress T cell efficacy and correlate with poor survival in a variety of patients. Because these are detectable and derivable features from interacting next-generation sequencing (NGS) data, investigate their relationship to immunotherapeutic responses and for therapy such as checkpoint inhibition or other cancer treatments. Building machine learning applications that predict responsiveness and incorporate the context of many features that collaborate in a particular individual, taking into account the individual's multifactorial context, based on the responsiveness of other individuals. is important.

更に、特定の個人がチェックポイント阻害に対してポジティブに応答するかどうかを判定するために相互作用し得る、潜在的多数の相互作用するゲノム、細胞、及び他の特徴を考慮すると、応答性予測をレポートする方法の向上が必要とされる。例えば、多種多様な特徴が、応答性の予測において組み合わせ的に相互作用し得る。機械学習方法を適用して、患者が所与のチェックポイント阻害に高く応答し得るか又は低く応答し得るかを評価する場合、様々な個人において、一部の特徴が、他よりも高いか又は低い重要性を有すると判定され、種々の特徴が、それぞれが応答性に影響し得ることを示唆するレベルと種々の程度で異なり、種々の因子が、種々のチェックポイント阻害治療に対する患者の応答性が高いか又は低いかを示し得る。従って、応答性の予測において重要であり予測の有効性における方向性を示す特徴の識別を含む、特定の患者の応答性のコンテキストレポートが、必要とされている。しかし、予測レポートのこのようなすべての潜在的側面を提示するスペースが限られていることを考慮すると、現在のレポート方法は、不十分なものである。従って、関連する応答性予測の多数の要素をレポートするための新規の方法が、求められている。 In addition, responsiveness predictions given the potential number of interacting genomes, cells, and other features that may interact to determine whether a particular individual responds positively to checkpoint inhibition. Need to be improved in the way it reports. For example, a wide variety of features can interact in combination in predicting responsiveness. When applying machine learning methods to assess whether a patient can respond more or less to a given checkpoint inhibition, some features may be higher or lower than others in different individuals. Determined to be of low importance, different characteristics differ to varying degrees with levels suggesting that each may affect responsiveness, and different factors determine the patient's responsiveness to different checkpoint inhibition therapies. Can indicate whether is high or low. Therefore, there is a need for a contextual report of responsiveness in a particular patient, including identification of features that are important in predicting responsiveness and directional in the effectiveness of the prediction. However, given the limited space available to present all these potential aspects of forecast reporting, current reporting methods are inadequate. Therefore, there is a need for new methods for reporting multiple elements of relevant responsiveness predictions.

Gaujouxら(2013) CellMix: a comprehensive toolbox for gene expression deconvolution、Bioinformatics 29:2211〜2212頁Gaujoux et al. (2013) CellMix: a comprehensive toolbox for gene expression deconvolution, Bioinformatics 29:22 11-2212 F Finotelloら(2018)、Quantifying tumor-infiltrating immune cells from transcriptomics data、Cancer Immunology、Immunotherapy 67:1031〜1040頁F Finotello et al. (2018), Quantifying tumor-infiltrating immune cells from transcriptomics data, Cancer Immunology, Immunotherapy 67: 1031-1040 Barbieら(2009)、Systematic RNA interference reveals that oncogenic KRAS-driven cancers require TBK1、Nature 462:108〜112頁Barbie et al. (2009), Systematic RNA interference reveals that oncogenic KRAS-driven cancers require TBK1, Nature 462: 108-112 Hugoら(2016) Genomic and Transcriptomic Features of Response to Anti-PD-1 Therapy in Metastatic Melanoma. Cell. 2016;165(1):35〜44頁(doi:10.1016/j.cell.2016.02.065)Hugo et al. (2016) Genomic and Transcriptomic Features of Response to Anti-PD-1 Therapy in Metastatic Melanoma. Cell. 2016; 165 (1): 35-44 (doi: 10.1016 / j.cell.2016.02.065) Van Allenら(2015) Genomic correlates of response to CTLA-4 blockade in metastatic melanoma. Science 350:207〜211頁(doi: 10.1126/science.aad0095)Van Allen et al. (2015) Genomic correlates of response to CTLA-4 blockade in metastatic melanoma. Science 350: 207-211 (doi: 10.1126 / science.aad0095)

本開示は、上記及び他の不足点を当技術分野において克服することを対象とする。 The present disclosure is intended to overcome the above and other deficiencies in the art.

ある態様では、訓練した機械学習分類器に非訓練対象のゲノム情報を入力する工程であって、非訓練対象のゲノム情報が、非訓練対象から得られる腫瘍プロファイル由来の特徴を含み、訓練した機械学習分類器が、複数の訓練対象のゲノム情報、及びチェックポイント阻害を含む治療に対する複数の訓練対象のぞれぞれの応答性について訓練され、複数の訓練対象のゲノム情報が、複数の訓練対象のそれぞれから得られる腫瘍試料の特徴を含み、機械学習分類器が、治療に対する応答性を予想するように訓練される、工程と、訓練した機械学習分類器を使用して、非訓練対象についてチェックポイント阻害応答性分類を生成する工程であって、チェックポイント阻害応答性分類が、非訓練対象がチェックポイント阻害に対して応答することを予測する、工程と、非訓練対象のチェックポイント阻害応答性分類を、グラフィカルユーザインターフェースを使用してレポートする工程とを含む、コンピュータ実行方法を開示する。ある例では、非訓練対象から得られる腫瘍プロファイル由来の特徴の少なくとも一部、又は訓練対象の1人又は複数から得られる腫瘍プロファイル由来の特徴の少なくとも一部は、次の特徴の群から選択される:すべての変異からなる総変異頻度、非同義変異からなる総変異頻度、ベータ2ミクログロブリン(B2M)発現、プロテアソームサブユニットベータ10(PSMB10)発現、抗原ペプチドトランスミッター1(TAP1)発現、抗原ペプチド輸送体2(TAP2)発現、ヒト白血球抗原A(HLA-A)発現、主要組織適合複合体クラスI B(HLA-B)発現、主要組織適合複合体クラスI C(HLA-C)発現、主要組織適合複合体クラスII DQアルファ1(HLA-DQA1)発現、HLAクラスII組織適合抗原DRB1ベータ鎖(HLA-DRB1)発現、HLAクラスI組織適合抗原アルファ鎖E(HLA-E)発現、ナチュラルキラー細胞顆粒タンパク質7(NKG7)発現、ケモカイン様受容体(CMKLR1)発現、表面抗原分類8(CD8)を発現する細胞による腫瘍浸潤、表面抗原分類4(CD4)を発現する細胞による腫瘍浸潤、表面抗原分類19(CD19)を発現する細胞による腫瘍浸潤、グランザイムA(GZMA)発現、パーフォリン1(PRF1)発現、細胞傷害性Tリンパ球関連タンパク質4(CTLA4)発現、プログラム細胞死タンパク質1(PD1)発現、プログラム死リガンド1(PDL1)発現、プログラム細胞死1リガンド2(PDL2)発現、リンパ球活性化遺伝子3(LAG3)発現、Ig及びITIMドメインを有するT細胞免疫受容体(TIGIT)発現、表面抗原分類276(CD276)発現、ケモカイン(C-Cモチーフ)リガンド5(CCL5)、CD27発現、ケモカイン(C-X-Cモチーフ)リガンド9(CXCL9)発現、C-X-Cモチーフケモカイン受容体6(CXCR6)、インドールアミン2,3-ジオキシゲナーゼ(IDO)発現、シグナル伝達兼転写活性化因子1(STAT1)発現、3-フコシル-N-アセチル-ラクトサミン(CD15)発現、インターロイキン2受容体アルファ鎖(CD25)発現、siglec-3(CD33)、表面抗原分類39(CD39)発現、表面抗原分類118(CD118)発現、フォークヘッドボックスP3(FOXP3)発現、及び前述の2つ以上の任意の組合せ。 In some embodiments, the process of inputting untrained genomic information into a trained machine learning classifier, wherein the untrained genomic information includes features derived from the tumor profile obtained from the untrained subject and is a trained machine. A learning classifier is trained on the genomic information of multiple training subjects and the responsiveness of each of the multiple training subjects to treatments including checkpoint inhibition, and the genomic information of multiple training subjects is combined with multiple training subjects. Machine learning classifiers are trained to anticipate treatment responsiveness, including features of tumor samples obtained from each of the processes and checked for non-trained subjects using trained machine learning classifiers. A step of generating a point inhibition responsiveness classification, in which the checkpoint inhibition responsiveness classification predicts that the untrained subject will respond to checkpoint inhibition, and the checkpoint inhibition responsiveness of the untrained subject. Disclosure of computer execution methods, including the process of reporting classifications using a graphical user interface. In one example, at least some of the features derived from the tumor profile obtained from the untrained subject, or at least some of the features derived from the tumor profile obtained from one or more of the trained subjects, are selected from the group of features: : Total mutation frequency consisting of all mutations, total mutation frequency consisting of non-synonymous mutations, beta2 microglobulin (B2M) expression, proteasome subunit beta10 (PSMB10) expression, antigen peptide transmitter 1 (TAP1) expression, antigen peptide Transporter 2 (TAP2) expression, human leukocyte antigen A (HLA-A) expression, major tissue compatible complex class IB (HLA-B) expression, major tissue compatible complex class IC (HLA-C) expression, major tissue compatible Complex class II DQ alpha 1 (HLA-DQA1) expression, HLA class II tissue-compatible antigen DRB1 beta chain (HLA-DRB1) expression, HLA class I tissue-compatible antigen alpha chain E (HLA-E) expression, natural killer cell granules Protein 7 (NKG7) expression, chemokine-like receptor (CMKLR1) expression, tumor invasion by cells expressing surface antigen classification 8 (CD8), tumor invasion by cells expressing surface antigen classification 4 (CD4), surface antigen classification 19 Tumor invasion by cells expressing (CD19), granzyme A (GZMA) expression, perforin 1 (PRF1) expression, cytotoxic T lymphocyte-related protein 4 (CTLA4) expression, programmed cell death protein 1 (PD1) expression, program Death ligand 1 (PDL1) expression, programmed cell death 1 ligand 2 (PDL2) expression, lymphocyte activation gene 3 (LAG3) expression, T cell immunoreceptor (TIGIT) expression with Ig and ITIM domains, surface antigen classification 276 (CD276) expression, chemokine (CC motif) ligand 5 (CCL5), CD27 expression, chemokine (CXC motif) ligand 9 (CXCL9) expression, CXC motif chemokine receptor 6 (CXCR6), indolamine 2,3-dioxygenase ( IDO) expression, signaling and transcriptional activator 1 (STAT1) expression, 3-fucosyl-N-acetyl-lactosamine (CD15) expression, interleukocyte 2 receptor alpha chain (CD25) expression, siglec-3 (CD33), Surface antigen classification 39 (CD39) expression, surface antigen classification 118 (CD118) expression, forkhead box P3 (FOXP3) expression, and any of the two or more aforementioned combinations mentioned above. Se.

別の例では、訓練特徴の少なくとも一部、又は非訓練特徴の少なくとも一部は、遺伝子セットを含む。更なる例では、遺伝子セットは、単一サンプル遺伝子セットの濃縮解析を使用して選択された。また別の例では、機械学習分類器は、ランダムフォレストである。また更なる例では、少なくとも50,000の木が、機械学習分類器の訓練において使用される。尚更なる例では、チェックポイント阻害応答性分類は、予測スコア及び1つ又は複数の特徴識別子を含み、1つ又は複数の特徴識別子は、特徴価、特徴重要度、及び特徴重みからなる群から選択される。 In another example, at least some of the trained features, or at least some of the untrained features, include a gene set. In a further example, the gene set was selected using a single sample gene set enrichment analysis. In yet another example, the machine learning classifier is a random forest. In a further example, at least 50,000 trees are used in training machine learning classifiers. In a further example, the checkpoint inhibition responsiveness classification comprises a predicted score and one or more feature identifiers, the one or more feature identifiers being selected from the group consisting of feature value, feature importance, and feature weight. Will be done.

別の例では、グラフィカルユーザインターフェースは、特徴識別子を環状扇形の各側面としてレポートし、環状扇形の角度が特徴重要度をレポートし、環状扇形の外半径が特徴重みをレポートし、環状扇形の色が特徴価をレポートする。更なる例では、ある特徴の特徴重要度は、特徴のジニ指数の減少を含む。更に別の例では、グラフィカルユーザインターフェースは、特徴の特徴重要度が閾値を超える場合かつその場合に限り、特徴の識別子をレポートする。また別の例では、特徴の特徴重要度は、特徴の特徴重要度の2乗が0.1を超えない場合、閾値を超えない。また更なる例では、各環状扇形は内弧を含み、環状扇形の内弧は円を形成するように配置される。 In another example, the graphical user interface reports the feature identifier as each side of the circular sector, the angle of the circular sector reports the feature importance, the outer radius of the circular sector reports the feature weight, and the color of the circular sector. Reports feature values. In a further example, the feature importance of a feature includes a decrease in the Gini index of the feature. In yet another example, the graphical user interface reports feature identifiers only if and only if the feature importance of the feature exceeds a threshold. In yet another example, the feature importance of a feature does not exceed a threshold if the square of the feature importance of the feature does not exceed 0.1. In a further example, each circular sector includes an inner arc, and the inner arcs of the circular sector are arranged to form a circle.

別の例は、治療に対する非訓練対象の応答性を訓練した機械学習分類器に入力する工程と、機械学習分類器を更に訓練する工程とを更に含み、更に訓練する工程は、訓練した機械学習分類器を、非訓練対象から得られる腫瘍試料の特徴、及び治療に対する非訓練対象の応答性について訓練することを含む。また別の例は、生成されたチェックポイント阻害応答性分類に基づいて治療を選択する工程を更に含む。 Another example further includes the step of inputting the responsiveness of the non-trained object to the treatment into the trained machine learning classifier and the step of further training the machine learning classifier, and the further training step is the trained machine learning. The classifier involves training the characteristics of the tumor sample obtained from the untrained subject and the responsiveness of the untrained subject to treatment. Yet another example further comprises selecting a treatment based on the checkpoint inhibition responsiveness classification generated.

別の態様では、1つ又は複数のマイクロプロセッサと、訓練した機械学習分類器、及び非訓練対象のゲノム情報を記憶するための1つ又は複数のメモリであって、訓練した機械学習分類器が、複数の訓練対象のゲノム情報、及びチェックポイント阻害を含む治療に対する複数の訓練対象のそれぞれの応答性について訓練され、複数の訓練対象のゲノム情報が、複数の訓練対象のそれぞれから得られる腫瘍プロファイルの特徴を含み、機械学習分類器が、治療に対する応答性を予測するように訓練され、非訓練対象のゲノム情報が、非訓練対象から得られる腫瘍プロファイル由来の特徴を含む、メモリとを含むコンピュータシステムであって、1つ又は複数のメモリが、1つ又は複数のマイクロプロセッサにより実行される場合、コンピュータシステムに、訓練した機械学習分類器を使用してチェックポイント阻害応答性分類を非訓練対象について生成させ、非訓練対象のチェックポイント阻害応答性分類を、グラフィカルユーザインターフェースを使用してレポートさせる、命令を記憶し、チェックポイント阻害応答性分類が、非訓練対象がチェックポイント阻害に対して応答することを予測する、コンピュータシステムを開示する。 In another aspect, the trained machine learning classifier is one or more microprocessors and a trained machine learning classifier, and one or more memories for storing untrained genomic information. , Genome information of multiple training subjects, and tumor profiles obtained from each of the multiple training subjects by being trained for the responsiveness of each of the multiple training subjects to treatments including checkpoint inhibition. A computer that includes features, a machine learning classifier is trained to predict responsiveness to treatment, and untrained genomic information contains memory and features derived from tumor profiles obtained from the untrained subject. In a system where one or more memories are run by one or more microprocessors, the computer system is untrained for checkpoint inhibition responsiveness classification using a trained machine learning classifier. To generate and report the checkpoint inhibition responsiveness classification of the untrained subject using the graphical user interface, memorize the instructions, and the checkpoint inhibition responsiveness classification of the untrained subject responds to the checkpoint inhibition. Disclose a computer system that predicts what to do.

ある例では、非訓練対象から得られる腫瘍プロファイル由来の少なくとも一部の特徴、又は1つ又は複数の訓練対象から得られる腫瘍プロファイル由来の少なくとも一部の特徴は、次の群から選択される:すべての変異からなる総変異頻度、非同義変異からなる総変異頻度、ベータ2ミクログロブリン(B2M)発現、プロテアソームサブユニットベータ10(PSMB10)発現、抗原ペプチドトランスミッター1(TAP1)発現、抗原ペプチド輸送体2(TAP2)発現、ヒト白血球抗原A(HLA-A)発現、主要組織適合複合体クラスI B(HLA-B)発現、主要組織適合複合体クラスI C(HLA-C)発現、主要組織適合複合体クラスII DQアルファ1(HLA-DQA1)発現、HLAクラスII組織適合抗原DRB1ベータ鎖(HLA-DRB1)発現、HLAクラスI組織適合抗原アルファ鎖E(HLA-E)発現、ナチュラルキラー細胞顆粒タンパク質7(NKG7)発現、ケモカイン様受容体(CMKLR1)発現、表面抗原分類8(CD8)を発現する細胞による腫瘍浸潤、表面抗原分類4(CD4)を発現する細胞による腫瘍浸潤、表面抗原分類19(CD19)を発現する細胞による腫瘍浸潤、グランザイムA(GZMA)発現、パーフォリン1(PRF1)発現、細胞傷害性Tリンパ球関連タンパク質4(CTLA4)発現、プログラム細胞死タンパク質1(PD1)発現、プログラム死リガンド1(PDL1)発現、プログラム細胞死1リガンド2(PDL2)発現、リンパ球活性化遺伝子3(LAG3)発現、Ig及びITIMドメインを有するT細胞免疫受容体(TIGIT)発現、表面抗原分類276(CD276)発現、ケモカイン(C-Cモチーフ)リガンド5(CCL5)、CD27発現、ケモカイン(C-X-Cモチーフ)リガンド9(CXCL9)発現、C-X-Cモチーフケモカイン受容体6(CXCR6)、インドールアミン2,3-ジオキシゲナーゼ(IDO)発現、シグナル伝達兼転写活性化因子1(STAT1)発現、3-フコシル-N-アセチル-ラクトサミン(CD15)発現、インターロイキン2受容体アルファ鎖(CD25)発現、siglec-3(CD33)、表面抗原分類39(CD39)発現、表面抗原分類118(CD118)発現、フォークヘッドボックスP3(FOXP3)発現、及び前述の2つ以上の任意の組合せ。 In one example, at least some features from a tumor profile obtained from an untrained subject, or at least some features from a tumor profile obtained from one or more trained subjects, are selected from the following group: Total mutation frequency consisting of all mutations, total mutation frequency consisting of non-synonymous mutations, beta2 microglobulin (B2M) expression, proteasome subunit beta10 (PSMB10) expression, antigen peptide transmitter 1 (TAP1) expression, antigen peptide transporter 2 (TAP2) expression, human leukocyte antigen A (HLA-A) expression, major tissue compatible complex class IB (HLA-B) expression, major tissue compatible complex class IC (HLA-C) expression, major tissue compatible complex Class II DQ alpha 1 (HLA-DQA1) expression, HLA class II tissue compatible antigen DRB1 beta chain (HLA-DRB1) expression, HLA class I tissue compatible antigen alpha chain E (HLA-E) expression, natural killer cell granule protein 7 (NKG7) expression, chemokine-like receptor (CMKLR1) expression, tumor invasion by cells expressing surface antigen classification 8 (CD8), tumor invasion by cells expressing surface antigen classification 4 (CD4), surface antigen classification 19 (CD19) ), Tumor invasion by cells expressing), Granzyme A (GZMA) expression, Perforin 1 (PRF1) expression, Cytotoxic T lymphocyte-related protein 4 (CTLA4) expression, Programmed cell death protein 1 (PD1) expression, Programmed death ligand 1 (PDL1) expression, programmed cell death 1 ligand 2 (PDL2) expression, lymphocyte activation gene 3 (LAG3) expression, T cell immunoreceptor (TIGIT) expression with Ig and ITIM domains, surface antigen classification 276 (CD276) ) Expression, chemokine (CC motif) ligand 5 (CCL5), CD27 expression, chemokine (CXC motif) ligand 9 (CXCL9) expression, CXC motif chemokine receptor 6 (CXCR6), indolamine 2,3-dioxygenase (IDO) Expression, signal transduction and transcriptional activator 1 (STAT1) expression, 3-fucosyl-N-acetyl-lactosamine (CD15) expression, interleukocyte 2 receptor alpha chain (CD25) expression, siglec-3 (CD33), surface antigen Classification 39 (CD39) expression, surface antigen classification 118 (CD118) expression, forkhead box P3 (FOXP3) expression, and any combination of two or more of the aforementioned.

別の例では、訓練特徴の少なくとも一部、又は非訓練特徴の少なくとも一部は、遺伝子セットを含む。また別の例では、遺伝子セットは、単一サンプル遺伝子セットの濃縮解析を使用して選択された。更に別の例では、機械学習分類器は、ランダムフォレストである。更なる例では、少なくとも50,000の木が、機械学習分類器の訓練において使用される。また更なる例では、チェックポイント阻害応答性分類は、予測スコア及び1つ又は複数の特徴識別子を含み、1つ又は複数の特徴識別子は、特徴価、特徴重要度、及び特徴重みからなる群から選択される。命令は、1つ又は複数のマイクロプロセッサにより実行される場合、グラフィカルユーザインターフェースに環状扇形の各側面として特徴識別子をレポートさせ、環状扇形の角度が特徴重要度をレポートし、環状扇形の外半径が特徴重みをレポートし、環状扇形の色が特徴価をレポートする。 In another example, at least some of the trained features, or at least some of the untrained features, include a gene set. In yet another example, the gene set was selected using a single sample gene set enrichment analysis. In yet another example, the machine learning classifier is a random forest. In a further example, at least 50,000 trees are used in training machine learning classifiers. In a further example, the checkpoint inhibition responsiveness classification comprises a predicted score and one or more feature identifiers, the one or more feature identifiers consisting of a group consisting of feature value, feature importance, and feature weight. Be selected. When the instruction is executed by one or more microprocessors, it causes the graphical user interface to report the feature identifier as each side of the circular sector, the angle of the circular sector reports the feature importance, and the outer radius of the circular sector. The feature weight is reported, and the circular sector color reports the feature value.

別の例では、特徴の特徴重要度は、特徴のジニ指数の減少を含む。また別の例では、命令は、1つ又は複数のマイクロプロセッサにより実行される場合、グラフィカルユーザインターフェースに、特徴の特徴重要度が閾値を超える場合かつその場合に限り、特徴の識別子をレポートさせる。また更なる例では、特徴の特徴重要度は、特徴の特徴重要度の2乗が0.1を超えない場合、閾値を超えない。更に別の例では、命令は、1つ又は複数のマイクロプロセッサにより実行される場合、グラフィカルユーザインターフェースに、各環状扇形の内弧、及び環状扇形の内弧を含む円をレポートさせる。尚更なる例では、命令は、1つ又は複数のマイクロプロセッサにより実行される場合、コンピュータシステムに機械学習分類器を更に訓練させ、更に訓練させることは、訓練した機械学習分類器を非訓練対象から得られる腫瘍試料の特徴、及び治療に対する非訓練対象の応答性について訓練することを含む。 In another example, the feature importance of a feature involves a decrease in the Gini index of the feature. In yet another example, the instruction, when executed by one or more microprocessors, causes the graphical user interface to report the feature identifier only if the feature importance of the feature exceeds a threshold. In a further example, the feature importance of the feature does not exceed the threshold if the square of the feature importance of the feature does not exceed 0.1. In yet another example, the instruction, when executed by one or more microprocessors, causes the graphical user interface to report an inner arc of each circular sector and a circle containing the inner arc of the circular sector. In a further example, when the instruction is executed by one or more microprocessors, training the computer system further to train the machine learning classifier and further training the trained machine learning classifier from the untrained subject. It involves training the characteristics of the resulting tumor sample and the responsiveness of the untrained subject to treatment.

また別の態様では、免疫チェックポイント応答性の分類のための機械学習に基づく分類器であって、多数のプロセッサ上で実行し、免疫チェックポイント阻害治療に対する非訓練対象の応答性を予測するように訓練される、機械学習に基づく分類器であって、機械学習に基づく分類器が、機械学習に基づく分類器に、複数の訓練対象のゲノム情報、及び治療に対する複数の訓練対象のそれぞれの応答性を入力することにより訓練され、複数の訓練対象のゲノム情報が、複数の訓練対象のそれぞれから得られる腫瘍プロファイルの特徴を含む、機械学習に基づく分類器と、機械学習に基づく分類器に、非訓練対象から得られる腫瘍試料の特徴を入力する入力プロセッサであって、機械学習に基づく分類器が、非訓練対象についてチェックポイント阻害応答性分類を生成するように構成されており、チェックポイント阻害応答性分類が、対象がチェックポイント阻害治療に対して応答することを予測する、入力プロセッサと、チェックポイント阻害応答性分類をレポートする出力プロセッサとを含む、機械学習に基づく分類器を開示する。ある例では、チェックポイント阻害応答性分類は、予測スコア及び複数の識別子を含む。 In yet another embodiment, a machine learning-based classifier for classifying immune checkpoint responsiveness that runs on a number of processors to predict the responsiveness of untrained subjects to immune checkpoint inhibition therapy. A machine learning-based classifier that is trained in a machine learning-based classifier that provides machine learning-based classifiers with genomic information for multiple training subjects and their respective responses to treatment. Trained by entering gender, machine learning-based classifiers and machine-learning-based classifiers that contain the genomic information of multiple training subjects, including tumor profile features obtained from each of the multiple training subjects, An input processor that inputs the characteristics of tumor samples obtained from untrained subjects, a machine learning-based classifier configured to generate checkpoint inhibition responsive classifications for untrained subjects. Discloses a machine learning-based classifier that includes an input processor that predicts that a subject will respond to a checkpoint inhibition treatment and an output processor that reports a checkpoint inhibition response classification. In one example, the checkpoint inhibition responsiveness classification includes a predicted score and multiple identifiers.

上記及び他の本開示の特徴、態様、及び利点は、次の詳細な説明を読解し、ここに添付の図面を参照すれば、より良く理解されるようになるであろう。 The above and other features, aspects, and advantages of the present disclosure will be better understood by reading the following detailed description and referring to the accompanying drawings herein.

本開示の態様による方法を実施するためのオプションを示すウェブダイアグラムである。FIG. 6 is a web diagram showing options for implementing the method according to aspects of the present disclosure. 分類器の訓練及び治療に対する患者の応答性の予測に本開示の態様に従って関連し得る特徴の非限定的な例の一部である。It is part of a non-limiting example of features that may be associated with predicting patient responsiveness to classifier training and treatment according to aspects of the present disclosure. 分類器を訓練する方法を本開示の態様に従って、どのように実施し得るかの例を示すウェブダイアグラムである。It is a web diagram which shows an example of how the method of training a classifier can be carried out according to the aspect of this disclosure. 訓練した分類器を使用して治療に対する対象の応答性を予測する方法を本開示の態様に従って、どのように実施し得るかの例を示すウェブダイアグラムである。It is a web diagram showing an example of how a method of predicting a subject's responsiveness to treatment using a trained classifier can be performed according to aspects of the present disclosure. 訓練した機械学習に基づく分類器により、本開示の態様に従って予測する場合の治療に対する対象の応答性をレポートする方法の例である。It is an example of a method of reporting a subject's responsiveness to treatment when predicted according to aspects of the present disclosure by a trained machine learning based classifier. 訓練した機械学習に基づく分類器により、本開示の態様に従って予測する場合の治療に対する対象の応答性をレポートする方法の例である。It is an example of a method of reporting a subject's responsiveness to treatment when predicted according to aspects of the present disclosure by a trained machine learning based classifier. 訓練した機械学習に基づく分類器により、本開示の態様に従って予測する場合の種々の治療に対する対象の応答性をレポート及び比較する方法の例である。It is an example of a method of reporting and comparing the responsiveness of a subject to various treatments when predicting according to aspects of the present disclosure by a trained machine learning based classifier. 訓練した機械学習に基づく分類器により、本開示の態様に従って予測する場合の種々の治療に対する対象の応答性をレポート及び比較する方法の例である。It is an example of a method of reporting and comparing the responsiveness of a subject to various treatments when predicting according to aspects of the present disclosure by a trained machine learning based classifier. 遺伝子セットを特徴として含まないか又は含む、訓練した機械学習に基づいた分類器により、本開示の態様に従って予測する場合の種々の治療に対する対象の応答性をレポート及び比較する方法の例である。It is an example of a method of reporting and comparing the responsiveness of a subject to various treatments when predicted according to aspects of the present disclosure by a trained machine learning based classifier that does or does not include a gene set as a feature. 訓練した機械学習に基づく分類器により、本開示の態様に従って予想する場合の治療に対する対象の応答性をレポートする方法の例である。It is an example of a method of reporting a subject's responsiveness to treatment as expected according to aspects of the present disclosure by a trained machine learning based classifier. 38の特徴を使用すると、単一因子を使用した場合と比較して優れた分類器性能が生まれることを実証する、比較したグラフ及び図である。These are comparative graphs and figures demonstrating that the use of 38 features results in better classifier performance compared to the use of a single factor. 38の特徴を使用すると、単一因子を使用した場合と比較して優れた分類器性能が生まれることを実証する、比較したグラフ及び図である。These are comparative graphs and figures demonstrating that the use of 38 features results in better classifier performance compared to the use of a single factor. 遺伝子セットを用いない38の特徴を使用するか、又は遺伝子セットを用いた44の特徴を使用して、機械学習分類器の性能を比較するグラフ及び図である。It is a graph and figure which compares the performance of a machine learning classifier using 38 features without a gene set or 44 features with a gene set. 遺伝子セットを用いない38の特徴を使用するか、又は遺伝子セットを用いた44の特徴を使用して、機械学習分類器の性能を比較するグラフ及び図である。It is a graph and figure which compares the performance of a machine learning classifier using 38 features without a gene set or 44 features with a gene set. 遺伝子セットを用いない38の特徴を使用するか、又は遺伝子セットを用いた44の特徴を使用して、機械学習分類器の性能を比較するグラフ及び図である。It is a graph and figure which compares the performance of a machine learning classifier using 38 features without a gene set or 44 features with a gene set. 遺伝子セットを用いない38の特徴を使用するか、又は遺伝子セットを用いた44の特徴を使用して、機械学習分類器の性能を比較するグラフ及び図である。It is a graph and figure which compares the performance of a machine learning classifier using 38 features without a gene set or 44 features with a gene set.

本開示は、チェックポイント阻害物質による治療又は他のがん治療に対して個人が応答し得るかどうかの予測を得るための機械学習方法に関する。様々な個人が、所与の治療に対して応答するか否かはわからない。治療に対する応答性は、所与の特徴又は定量的量の所与の特徴の存在だけでなく非存在にもそれぞれ依存し得る。むしろ、多数の特徴が、個人の間で差次的に複合して、所与の治療に応答する可能性が高められる個人もあれば、低められる個人もあり得る。単一の特徴、又はほんの一部の特徴に基づいて患者の応答性を予想する標準的方法では、互いに独立して変化し得る多数の因子がこのように協働する状況下で応答性を正確には予測しない。 The present disclosure relates to machine learning methods for obtaining predictions of an individual's ability to respond to treatment with checkpoint inhibitors or other cancer treatments. It is not known whether different individuals will respond to a given treatment. Responsiveness to treatment can depend on the presence or absence of a given feature or a quantitative amount of a given feature, respectively. Rather, a number of features may be differentially compounded among individuals to increase the likelihood of responding to a given treatment, while others may reduce it. The standard method of predicting patient responsiveness based on a single feature, or just a few features, is accurate in responsiveness in situations where multiple factors that can vary independently of each other work together in this way. Do not predict.

機械学習方法は、一般的診断予測方法のこの欠点に対する新規の解決法を提示する。教師あり機械学習では、例えば、多くの個人の多数の特徴を表し、所与の治療に対する各個人の既知の応答性と組み合わせる大量のデータセットは、コンピュータメモリ記憶装置上にロードすることができる。コンピュータの記憶媒体は、コンピュータプロセッサに個人の特徴情報及び応答性を処理するよう指示して、個人が所与の治療に応答性である尤度の高低を示す特徴情報のパターンを識別する命令を含む。このような解析のために機械学習方法を使用する利点は、特徴のパターンの識別と、コンピュータシステムのデータ記憶及び検索の高い能力なしでは不可能な、治療に対する応答性の予測に対するその適合と、大量の情報を処理するその能力とを可能とすることである。コンピュータ実行機械学習システムは、数十若しくは数百以上の特徴、又は数十若しくは数百以上の対象を処理して、特徴のパターン、及び個人の応答性との集約したその相関性を識別することができる。このように識別したパターンは、さもなければ検出不可能であり、コンピュータシステムが、一連の複合的情報の大量のデータ処理を実行することが必要とされ得る。 Machine learning methods offer new solutions to this shortcoming of common diagnostic prediction methods. In supervised machine learning, for example, a large data set that represents a large number of characteristics of many individuals and is combined with each individual's known responsiveness to a given treatment can be loaded onto computer memory storage. The storage medium of the computer instructs the computer processor to process the personal trait information and responsiveness, and issues an instruction to identify a pattern of trait information indicating the high or low likelihood that the individual is responsive to a given treatment. Including. The advantages of using machine learning methods for such analyzes are the identification of patterns of features and their adaptation to the prediction of responsiveness to treatment, which would not be possible without the high ability of computer systems to store and retrieve data. It is to enable its ability to process large amounts of information. Computer-executed machine learning systems process dozens or hundreds of features, or dozens or hundreds of objects, to identify patterns of features and their aggregated correlation with individual responsiveness. Can be done. The patterns identified in this way are otherwise undetectable and may require a computer system to perform a large amount of data processing on a set of complex information.

個人の特徴を決定するために、個人、例えば、がんを有する個人の組織試料を入手し、このような組織の特性を決定し得る。一部の例では、入手する組織は、腫瘍から採取される細胞の試料であり得る。他の例では、入手する組織は、個人から得られる非腫瘍組織であり得る。 To determine the characteristics of an individual, tissue samples of the individual, eg, an individual with cancer, can be obtained and the characteristics of such tissue can be determined. In some examples, the tissue obtained may be a sample of cells taken from the tumor. In another example, the tissue obtained may be non-tumor tissue obtained from an individual.

本明細書では、チェックポイント阻害は、腫瘍細胞が、免疫系における自己認識経路を活性化し、これにより免疫細胞攻撃及び腫瘍細胞の細胞溶解を妨げるプロセスを遮断する治療を指す。このような経路の腫瘍細胞による活性化は、例えば、腫瘍細胞を認識及び標的化するように免疫細胞を改変する場合、がん免疫治療に対する一部の患者の不応性に寄与すると考えられる。チェックポイント阻害の例としては、CTLA4経路が挙げられる。CTLA4は、制御性T細胞上に発現するタンパク質受容体である。これはまた、がんにおいてよく見られるように、活性化された後、通常のT細胞上に発現し得る。CTLA4がCD80又はCD87を結合すると、タンパク質は、抗原提示細胞の表面上に発現し、免疫抑制が生じる。健常細胞では、この機構により自己認識が促進され、自己細胞の免疫的攻撃を防ぐ。しかし、がんでは、この経路の上方制御により、腫瘍細胞が免疫系による検出及び攻撃を逃れることが助長される。この経路を阻害するチェックポイント阻害治療の例(例えば、抗CTLA4抗体であるイピリムマブ)は、例えば、抗腫瘍免疫応答性を刺激する他のがん免疫治療と組み合わせる場合、腫瘍細胞を標的化及び破壊する免疫系の能力を促進し得る。 As used herein, checkpoint inhibition refers to a treatment in which tumor cells activate self-recognition pathways in the immune system, thereby blocking processes that prevent immune cell attack and tumor cell lysis. Activation of such pathways by tumor cells is thought to contribute to the refractory of some patients to cancer immunotherapy, for example, when modifying immune cells to recognize and target tumor cells. An example of checkpoint inhibition is the CTLA4 pathway. CTLA4 is a protein receptor expressed on regulatory T cells. It can also be expressed on normal T cells after activation, as is often the case in cancer. When CTLA4 binds to CD80 or CD87, the protein is expressed on the surface of antigen-presenting cells, resulting in immunosuppression. In healthy cells, this mechanism promotes self-awareness and prevents the immune attack of autologous cells. However, in cancer, upregulation of this pathway helps tumor cells escape detection and attack by the immune system. Examples of checkpoint inhibitory therapies that block this pathway (eg, the anti-CTLA4 antibody ipilimumab) target and destroy tumor cells, for example, when combined with other cancer immunotherapies that stimulate anti-tumor immune responsiveness. Can promote the ability of the immune system to do so.

同様に、チェックポイント阻害の別の例は、PD-1経路である。自己細胞上に発現するPD1-L1受容体にT細胞上のPD-1が結合すると、免疫抑制応答が生じる。CTLA4経路と同様に、この経路はまた、腫瘍細胞が免疫系による検出及び攻撃を逃れるのに利用される。この経路を阻害するチェックポイント阻害治療の例(例えば、抗PD-1抗体であるペムブロリズマブ、ニボルマブ、及びセミプリマブ(cemiplimab)並びに抗PD-L1抗体であるアテゾリズマブ、アベルマブ、及びデュルバルマブ)は、例えば、抗腫瘍免疫応答性を刺激する他のがん免疫治療と組み合わせる場合、免疫系が腫瘍細胞を標的化及び破壊する能力を促進し得る。 Similarly, another example of checkpoint inhibition is the PD-1 pathway. When PD-1 on T cells binds to the PD1-L1 receptor expressed on autologous cells, an immunosuppressive response occurs. Like the CTLA4 pathway, this pathway is also utilized by tumor cells to escape detection and attack by the immune system. Examples of checkpoint inhibition therapies that block this pathway (eg, the anti-PD-1 antibodies pembrolizumab, nivolumab, and semiprimab and the anti-PD-L1 antibodies atezolizumab, avelumab, and durvalumab) are, for example, anti-PD-1 antibodies. When combined with other cancer immunotherapies that stimulate tumor immune responsiveness, it can enhance the ability of the immune system to target and destroy tumor cells.

本明細書において使用する場合、チェックポイント阻害物質又はチェックポイント阻害治療等の用語は、このような治療、並びにCTLA4若しくはPD-1の、これらの同族リガンド若しくは受容体との相互作用、又はこれらの下流シグナル伝達続発症若しくは細胞機能の活性化を防ぐことにより機能する、他の抗体又は医薬組成物による治療を含む、チェックポイント阻害経路を阻害する他の治療を含む。 As used herein, terms such as checkpoint inhibitor or checkpoint inhibitory therapy refer to such therapies, as well as the interaction of CTLA4 or PD-1 with their cognate ligands or receptors, or theirs. Includes other therapies that inhibit checkpoint inhibition pathways, including treatment with other antibodies or pharmaceutical compositions that function by preventing downstream signaling sequelae or activation of cell function.

多くの特徴は、所与の治療に対して個人が応答性であるかどうかの予測の生成において関連し得る。例としては、個人から得られる細胞のゲノムに含まれる遺伝子配列情報、個人の細胞のゲノムから転写されるRNAに発現する遺伝子配列情報、試料中の対応するRNA転写若しくはそのタンパク質産物の量に反映され得るゲノム配列の転写物の発現量、又は試料中に存在する種々の細胞が挙げられる。試料が個人由来の腫瘍組織又は細胞を含む例では、このような情報は、母集団若しくは個人の非腫瘍細胞又は遺伝子配列決定パラダイムにおいて言及される対照ゲノムと比較した、腫瘍細胞、即ち、1つ又は複数の修飾ゲノム配列を有する細胞の特性を示し得る。腫瘍形成は、ヌクレオチド配列における1つの変異若しくは2つ以上の変異、及び/又はゲノムDNAにおける2つ以上の配列の変異から生じ得る。一部の場合では、例えば、複数のこのような配列修飾の蓄積は、細胞を非疾患細胞から腫瘍細胞へ変換するように相互に機能し得る。他の場合では、1つ又は一部のこのような修飾の細胞における初期の蓄積は、このような修飾を細胞に更に蓄積させ得る。更に他の場合では、このような修飾の細胞における増殖は、特定の任意の修飾が、腫瘍の増殖に直接関与するか、又はその原因となるとは限らないことを示し得る。むしろ、腫瘍形成プロセスにより、細胞の腫瘍細胞への形質転換を直接誘導する、一部の修飾を生じ得るが、細胞の腫瘍細胞への形質転換を直接誘導しない他の修飾をも生じ得る。 Many features may be relevant in the generation of predictions of whether an individual is responsive to a given treatment. For example, it is reflected in the gene sequence information contained in the genome of a cell obtained from an individual, the gene sequence information expressed in RNA transcribed from the genome of an individual cell, the corresponding RNA transcription in a sample, or the amount of its protein product. Expression levels of transcripts of possible genomic sequences, or various cells present in the sample. In examples where the sample contains tumor tissue or cells of individual origin, such information is the tumor cells, i.e., one compared to the non-tumor cells of the population or individual or the control genome referred to in the gene sequencing paradigm. Alternatively, it can exhibit the characteristics of cells having multiple modified genomic sequences. Tumor formation can result from one or more mutations in a nucleotide sequence and / or mutations in two or more sequences in genomic DNA. In some cases, for example, the accumulation of multiple such sequence modifications can function with each other to transform cells from non-disease cells to tumor cells. In other cases, early accumulation in one or some of the cells with such modifications may cause further accumulation of such modifications in the cells. In yet other cases, proliferation in cells with such modifications may indicate that any particular modification is not always directly involved in or responsible for the growth of the tumor. Rather, the tumorigenesis process can result in some modifications that directly induce the transformation of cells into tumor cells, but can also result in other modifications that do not directly induce the transformation of cells into tumor cells.

従って、このような修飾をゲノムDNA配列に多数有し得る個人の腫瘍細胞も存在すれば、このような修飾がわずかであり得る個人の腫瘍細胞も存在する。その中でも、一部の腫瘍細胞は、ゲノム修飾の結果として改変されたアミノ酸配列を有する転写物又はタンパク質産物を生じる可能性があり、例えば、ゲノムDNAにおいてDNA配列を修飾すると、修飾が起こらなければ産生されたはずのものと異なる配列を有する、タンパク質又はRNA分子が産生される場合がある。このような修飾は、非同義変異と呼ばれる。他の修飾は、非コードDNAの修飾であり得るか、又はタンパク質アミノ酸配列を変異させないコードDNAの修飾であり得る。例えば、イントロン配列又は非転写DNAへの修飾が、同一の修飾を保持しないゲノムから産生されるタンパク質のアミノ酸配列とアミノ酸配列が異なるタンパク質産物を生じない可能性がある。このような修飾は、同義変異と呼ばれる。従って、種々の腫瘍は、種々の総数の非同義変異、種々の数の同義変異、又は種々の数の両方の変異を含む(又は同一の総数のゲノム変異を含むが、種々の数の同義変異及び種々の数の非同義変異を含まない)、種々の総数の修飾をゲノムDNAに含み得る。細胞が保持する変異の数は、その変異頻度又は総変異頻度と呼ばれ、一方、その細胞が保持する非同義変異の総数は、その非同義変異頻度と呼ばれ、その細胞が保持する同義変異の数は、その同義変異頻度と呼ばれる。 Thus, there are individual tumor cells that may have many such modifications in the genomic DNA sequence, and there are individual tumor cells that may have only minor such modifications. Among them, some tumor cells may produce transcripts or protein products with modified amino acid sequences as a result of genomic modification, for example, modification of the DNA sequence in genomic DNA does not result in modification. A protein or RNA molecule with a different sequence than it should have been produced may be produced. Such modifications are called non-synonymous mutations. Other modifications can be modifications of non-coding DNA or modifications of coding DNA that do not mutate the protein amino acid sequence. For example, modifications to intron sequences or non-transcribed DNA may not result in protein products that differ in amino acid sequence from amino acid sequences of proteins produced from genomes that do not retain the same modification. Such modifications are called synonymous mutations. Thus, different tumors contain different numbers of non-synonymous mutations, different numbers of synonymous mutations, or both different numbers of mutations (or contain the same total number of genomic mutations, but different numbers of synonymous mutations. And various numbers of non-synonymous mutations are not included), and various numbers of modifications can be included in genomic DNA. The number of mutations carried by a cell is called its mutation frequency or total mutation frequency, while the total number of non-synonymous mutations held by a cell is called its non-synonymous mutation frequency and is called the synonymous mutation held by that cell. The number of is called its synonymous mutation frequency.

非腫瘍細胞から腫瘍細胞への細胞の変換は、このような修飾のゲノムDNAへの蓄積に対応し得る。このような蓄積は、同義変異の蓄積、非同義変異の蓄積、又は両方のタイプの蓄積であり得る。いずれにせよ、総変異頻度は、非腫瘍細胞から腫瘍細胞へ変換するまで、非腫瘍細胞から腫瘍細胞へ変換する際、及び非腫瘍細胞から腫瘍細胞へ変換した後に増加し得る。更に、腫瘍細胞の変異頻度は、チェックポイント阻害が、免疫系による抗腫瘍応答の刺激に有効である可能性があるかどうかに影響し得る。腫瘍細胞が多くの変異を保持するほど、チェックポイント阻害を抑制すると、腫瘍細胞を疾患細胞として認識して攻撃することから免疫系を脱抑制し得る確率が増大する。特に、非同義腫瘍変異頻度は、抗腫瘍免疫応答を脱抑制するチェックポイント阻害の能力とポジティブに相関し得る。非同義変異の結果として産生される、変異アミノ酸配列を有するタンパク質は、細胞において異常として同定され、細胞内で発生する病態の兆候として細胞膜上に存在し得る。例えば、腫瘍は、新生抗原と呼ばれる、変異アミノ酸配列を有するタンパク質を発現し得る。このような新生抗原を発現する腫瘍細胞は、このような新生抗原の変異断片をその細胞膜上に発現し得る。 Cell conversion from non-tumor cells to tumor cells can correspond to the accumulation of such modifications in genomic DNA. Such accumulation can be the accumulation of synonymous mutations, the accumulation of non-synonymous mutations, or both types of accumulation. In any case, the total mutation frequency can increase during non-tumor cell to tumor cell conversion, during non-tumor cell to tumor cell conversion, and after non-tumor cell to tumor cell conversion. In addition, the frequency of tumor cell mutations can affect whether checkpoint inhibition may be effective in stimulating an antitumor response by the immune system. The more mutations a tumor cell retains, the greater the chance that suppressing checkpoint inhibition will allow it to desuppress the immune system by recognizing and attacking the tumor cell as a diseased cell. In particular, the frequency of non-synonymous tumor mutations can positively correlate with the ability of checkpoint inhibition to desuppress the antitumor immune response. Proteins with mutated amino acid sequences produced as a result of non-synonymous mutations can be identified as abnormal in cells and present on the cell membrane as a sign of intracellular pathology. For example, a tumor can express a protein with a mutated amino acid sequence called a nascent antigen. Tumor cells expressing such nascent antigens can express mutant fragments of such nascent antigens on their cell membranes.

このような新生抗原が提示されると、細胞が病変している(例えば、腫瘍細胞)との免疫系による認識が刺激され、免疫系がこのような細胞を標的化して破壊することが促進され得る。しかし、腫瘍の相殺プロセスは、チェックポイント経路を利用して免疫検出を逃れ得る。従って、チェックポイント経路阻害物質が、がん免疫治療の強化を補助し得るかどうかは、腫瘍の変異頻度に依存し得る。頻度が高いことは、新生抗原提示のレベルが高いことに対応する可能性があり、チェックポイント阻害治療が行われる場合に抗腫瘍免疫原性を刺激する確率を増加させる。概して、総変異頻度が高いことは、非同義変異頻度が高いことを示し得るため、総変異頻度が高いことは、新生抗原の発現が増大することを示し得る。更に、非同義腫瘍変異頻度が高いこともまた、新生抗原の発現が増大することを示し得るため、チェックポイント阻害が有効であり得る尤度が高いことを示し得る。同義腫瘍変異頻度が、チェックポイント阻害に対する応答性と相関し得ること、並びに/又は同義及び非同義腫瘍変異頻度の一部の組合せが、総変異頻度に反映され得るように、チェックポイント阻害に対する応答性と相関し得ることもまた、あり得る。従って、総変異頻度、非同義腫瘍変異頻度、同義腫瘍変異頻度、又はこれらの2つ以上の任意の組合せは、チェックポイント応答性を予測することができ、本明細書に開示の機械学習方法に含まれる1つ又は複数の特徴であり得る。 Presenting such a neogenic antigen stimulates the immune system's perception that the cell is lesioned (eg, a tumor cell) and promotes the immune system to target and destroy such cells. obtain. However, the tumor offsetting process can utilize the checkpoint pathway to escape immunodetection. Therefore, whether checkpoint pathway inhibitors can assist in enhancing cancer immunotherapy may depend on the frequency of tumor mutations. Higher frequency may correspond to higher levels of neonatal antigen presentation and increase the probability of stimulating antitumor immunogenicity when checkpoint inhibitory therapy is given. In general, a high total mutation frequency may indicate a high non-synonymous mutation frequency, and a high total mutation frequency may indicate increased expression of the nascent antigen. Furthermore, a high frequency of non-synonymous tumor mutations can also indicate increased expression of the nascent antigen, thus indicating a high likelihood that checkpoint inhibition may be effective. Response to checkpoint inhibition so that synonymous tumor mutation frequency can correlate with responsiveness to checkpoint inhibition and / or some combinations of synonymous and non-synonymous tumor mutation frequencies can be reflected in total mutation frequency. It is also possible that it can correlate with sex. Thus, total mutation frequency, non-synonymous tumor mutation frequency, synonymous tumor mutation frequency, or any combination of two or more of these can predict checkpoint responsiveness, according to the machine learning methods disclosed herein. It can be one or more features included.

変異が同義であるか又は非同義であるかの他に、又はそれに加えて、他の又は追加の変異特性も存在する可能性があり、その数又はタイプは、1つ又は複数の変異が同義であるか又は非同義であるかと同様に、治療に対する応答性の予測において関連し得る。例えば、ノンストップ変異と呼ばれる、一部の変異は、終止コドンにおける変異であり、RNA転写物の変異部分により、さもなければ終止するところを超えて継続するRNA産物の翻訳を生じる。変異の別の形態は、フレームシフト変異であり、3つ組で分割不可能な多数の近接するヌクレオチドの挿入(フレームシフト挿入)又は欠失(フレームシフト欠失)(例えば、単一のヌクレオチドの挿入又は欠失)を含む。これはコドンの読み配列のずれを生じ、従って産生されたRNA転写物の翻訳において種々のtRNA分子の動員が生じ、従って翻訳タンパク質のアミノ酸配列が変異する。他の変異は、スプライス部位変異であり、これは、スプライス部位で、又はその近傍で発生し、従って正常なmRNAのスプライシングを修飾し、修飾RNA転写物が生じ得る。又は、変異は、ミスセンス変異であり、この場合、単一ヌクレオチドが変異し、これによりその単一ヌクレオチドを含むコドンが変異して、翻訳において様々な種類のtRNAを動員し、従って異なるアミノ酸配列を有するタンパク質を産生し得る。 In addition to whether the mutations are synonymous or non-synonymous, or in addition, there may be other or additional mutational properties, the number or type of which is synonymous with one or more mutations. As well as being or non-synonymous, it may be relevant in predicting responsiveness to treatment. For example, some mutations, called non-stop mutations, are mutations at the stop codon, where the mutant portion of the RNA transcript results in translation of the RNA product that would otherwise continue beyond termination. Another form of mutation is a frameshift mutation, which is the insertion or deletion (frameshift deletion) of a large number of adjacent nucleotides that are indivisible in triplets (eg, a single nucleotide). Insertion or deletion). This results in a shift in the codon reading sequence, thus resulting in the recruitment of various tRNA molecules in the translation of the produced RNA transcript, thus altering the amino acid sequence of the translated protein. Another mutation is a splice site mutation, which occurs at or near the splice site and thus modifies normal mRNA splicing, resulting in modified RNA transcripts. Alternatively, the mutation is a missense mutation, in which a single nucleotide is mutated, which mutates the codon containing that single nucleotide, recruiting different types of tRNAs in translation and thus different amino acid sequences. Can produce the proteins it has.

別の起こり得る変異は、スタート変異であり、転写開始部位へ又は開始コドンへの変異であり、転写又は翻訳を開始する部位における変異をそれぞれ生じ得る。例えば、開始部位の変異は、その開始部位からの転写の開始を妨げ得る。又は、変異は、それまでに存在しなかった転写開始部位を生成し得る。転写開始部位の変異は、さもなければ産生されたはずのRNA転写物と異なる長さであるが、転写が変異の非存在下で生じるためにインフレームであるか、又はそのためにフレーム外であり得る、RNA転写物の転写を生じ得る。開始コドンへの類似の変異もまた発生し、翻訳の開始が発生しないか、又はそれまでに開始しなかった部位から翻訳の開始が発生する、RNA産物の転写を生じ得る。このような終止コドン変異は、インフレームであるか、又はフレーム外でもあり得る。又は、変異は、ナンセンス変異、即ち、未成熟終止コドンを有するRNA転写物を生じる変異であり得る。前述の変異のいずれかは、一塩基多型(SNP)であり得る。前述の種々の変異のいずれか1つ又は複数は、所与の治療、例えば、所与のチェックポイント阻害物質に対する個人の応答性の予測に関連する特徴であり得る。 Another possible mutation is a start mutation, a mutation to the transcription start site or to the start codon, which can result in a mutation at the site that initiates transcription or translation, respectively. For example, mutations in the initiation site can prevent the initiation of transcription from that initiation site. Alternatively, the mutation may generate a transcription initiation site that did not previously exist. The mutation at the transcription initiation site is of a different length than the RNA transcript that would otherwise have been produced, but is either in-frame or out-of-frame because transcription occurs in the absence of the mutation. Obtain, transcription of RNA transcripts can occur. Similar mutations to the start codon can also occur, resulting in transcription of the RNA product, where translation initiation does not occur or translation initiation occurs from sites that have not previously initiated. Such stop codon mutations can be in-frame or out-of-frame. Alternatively, the mutation can be a nonsense mutation, i.e., a mutation that results in an RNA transcript with an immature stop codon. Any of the aforementioned mutations can be single nucleotide polymorphisms (SNPs). One or more of the various mutations described above can be features associated with a given treatment, eg, prediction of an individual's responsiveness to a given checkpoint inhibitor.

別の例では、リンパ球による腫瘍の浸潤の量により、チェックポイント阻害物質に対する応答性を予測することができる。腫瘍は、非腫瘍細胞から腫瘍細胞へ形質転換した細胞だけでなく、他の非形質転換細胞をも含む。例としては、腫瘍内の形質転換細胞に対する免疫応答を刺激する役割を果たしている、又は果たし得る免疫系の細胞が挙げられる。腫瘍内で形質転換細胞と混合する免疫細胞、特に、リンパ球は、腫瘍浸潤リンパ球を指す。腫瘍浸潤リンパ球、及びリンパ球表現型の識別子として作用する種々のマーカーを発現する腫瘍浸潤リンパ球のレベルにより、腫瘍試料を採取した対象が、チェックポイント阻害に対して応答性であり得るかどうかを予測することができる。腫瘍が、例えば、腫瘍細胞と腫瘍浸潤リンパ球の異種混合物であるため、これは、試料中に存在する腫瘍浸潤リンパ球上で発現するリンパ球マーカー、及び形質転換腫瘍細胞のような腫瘍試料中の他の細胞上で潜在的に発現するリンパ球マーカーを識別するための利点となり得る。 In another example, the amount of tumor infiltration by lymphocytes can predict responsiveness to checkpoint inhibitors. Tumors include not only cells transformed from non-tumor cells to tumor cells, but also other non-transformed cells. Examples include cells of the immune system that play or may play a role in stimulating an immune response against transformed cells in a tumor. Immune cells that mix with transformed cells in the tumor, especially lymphocytes, refer to tumor-infiltrating lymphocytes. Whether the subject from whom the tumor sample was taken could be responsive to checkpoint inhibition, depending on the level of tumor-infiltrating lymphocytes and tumor-infiltrating lymphocytes expressing various markers that act as identifiers for the lymphocyte phenotype. Can be predicted. Since the tumor is, for example, a heterologous mixture of tumor cells and tumor-infiltrating lymphocytes, this is a lymphocyte marker expressed on the tumor-infiltrating lymphocytes present in the sample, and in tumor samples such as transformed tumor cells. It can be an advantage for identifying lymphocyte markers that are potentially expressed on other cells.

例えば、腫瘍浸潤リンパ球は、表面抗原分類8(CD8)、表面抗原分類4(CD4)又は表面抗原分類19(CD19)をコードする遺伝子の転写物(例えば、RNA)を発現する可能性があり、このそれぞれは、細胞において発現する場合、リンパ球表現型のマーカーとして作用し得る。従って、CD8、CD4、CD19、又は前述のいずれか2つ以上の任意の組合せの発現レベルは、腫瘍試料から判定することができる。従って、例えば、RNAの量は、試料から判定することができる。このような判定が、腫瘍浸潤リンパ球によるその発現だけでなく、形質転換腫瘍細胞のような腫瘍試料中の他の細胞をも反映し得るため、これは、その発現の検出量が、腫瘍浸潤リンパ球による発現にどの程度起因し得るか、及びどの程度起因し得ないかを判定するための利点となり得る。そのように判定するために、デンコンボリューションプロセスを適用することができ、これにより、腫瘍浸潤リンパ球による発現レベルを他の細胞による発現に対して判定することができる。腫瘍浸潤リンパ球のデコンボリューションを実施するための種々のオプションが利用可能であり、例えば、Gaujouxら(2013) CellMix: a comprehensive toolbox for gene expression deconvolution、Bioinformatics 29:2211〜2212頁、及びF Finotelloら(2018)、Quantifying tumor-infiltrating immune cells from transcriptomics data、Cancer Immunology、Immunotherapy 67:1031〜1040頁に記載のものを含む。デコンボリューション解析は、非限定的な例として、Rプログラミング言語で実施することができる。 For example, tumor-infiltrating lymphocytes may express transcripts (eg, RNA) of genes encoding surface antigen classification 8 (CD8), surface antigen classification 4 (CD4) or surface antigen classification 19 (CD19). Each of these can act as a marker of lymphocyte phenotype when expressed in cells. Thus, the expression level of CD8, CD4, CD19, or any combination of any two or more of the above can be determined from the tumor sample. Thus, for example, the amount of RNA can be determined from the sample. This is because the amount of detection of its expression is tumor invasion, as such a determination can reflect not only its expression by tumor infiltrating lymphocytes, but also other cells in the tumor sample, such as transformed tumor cells. It can be an advantage in determining to what extent it can and cannot be attributed to lymphocyte expression. To do so, a denconvolution process can be applied, which allows the level of expression by tumor-infiltrating lymphocytes to be determined relative to expression by other cells. Various options are available for performing tumor-infiltrating lymphocyte deconvolution, such as Gaujoux et al. (2013) CellMix: a comprehensive toolbox for gene expression deconvolution, Bioinformatics 29: 2211-2212, and F Finotello et al. (2018), Quantifying tumor-infiltrating immune cells from transcriptomics data, Cancer Immunology, Immunotherapy 67: 1031-1040. Deconvolution analysis can be performed in the R programming language, as a non-limiting example.

特に、腫瘍浸潤リンパ球デコンボリューションと呼ばれるプロセスにより、所与のリンパ球転写物(例えば、CD8、CD4又はCD19)の発現レベルを使用して、腫瘍試料においてリンパ球細胞のCD4又はCD8又はCD19を発現している割合を判定することができる。即ち、腫瘍において同定され得る所与のリンパ球転写物の量により表される、腫瘍のリンパ球浸潤の量を単に示すにとどまらず、腫瘍浸潤リンパ球デコンボリューションは、発現する転写物の種類により識別されるリンパ球のタイプを示すこと、腫瘍浸潤全体に占める割合を更に提供することができる。腫瘍のリンパ球浸潤の総量は、チェックポイント阻害物質のような所与の治療に対して個人が応答性であり得るかどうかの予測において関連する可能性があり、所与の転写物(例えば、これらに限定されないが、CD4又はCD8又はCD19)を発現するリンパ球により生じる腫瘍のリンパ球浸潤の具体的寄与もまた、このような予測を立てる上で関連する可能性がある。 In particular, by a process called tumor infiltrating lymphocyte deconvolution, the expression levels of a given lymphocyte transcript (eg, CD8, CD4 or CD19) are used to generate CD4 or CD8 or CD19 of lymphocyte cells in a tumor sample. The rate of expression can be determined. That is, it does not merely indicate the amount of lymphocyte infiltration of the tumor, which is represented by the amount of given lymphocyte transcript that can be identified in the tumor, and the tumor infiltrating lymphocyte deconvolution depends on the type of transcript expressed. It is possible to indicate the type of lymphocyte to be identified and further provide a percentage of the total tumor infiltration. The total amount of lymphocyte infiltration in a tumor may be relevant in predicting whether an individual may be responsive to a given treatment, such as a checkpoint inhibitor, and given transcripts (eg, eg). Specific contributions of tumor lymphocyte infiltration caused by lymphocytes expressing CD4 or CD8 or CD19), but not limited to these, may also be relevant in making such predictions.

他の種々の特徴は、チェックポイント阻害に対して個人が応答性であり得るかどうかの予測において関連し得る。このような特徴は、一般に、チェックポイント阻害物質が、がん免疫応答の促進又は強化において有効であり得るか否かに理論的に関するプロセスに従って分類することができる。例えば、一部の特徴は、腫瘍細胞が変異タンパク質の抗原をその細胞表面上に発現し、これにより抗腫瘍免疫応答の確率を増加させる可能性が高くなり得るか又は低くなり得るか、及びどの程度まで高くなり得るか又は低くなり得るかに関し得る。既に考察されているこのような特徴の例としては、種々の腫瘍変異頻度、例えば、総腫瘍変異頻度又は非同義腫瘍変異頻度が挙げられる。他の例としては、種々のタンパク質、又は抗原提示に関与して免疫応答を刺激することで知られるタンパク質をコードする、遺伝子の転写物の発現レベルが挙げられる。一部の非限定的な例としては、ベータ2ミクログロブリン(B2M)、プロテアソームサブユニットベータ10(PSMB10)、抗原ペプチドトランスミッター1(TAP1)、抗原ペプチド輸送体2(TAP2)、ヒト白血球抗原A(HLA-A)、主要組織適合複合体クラスI B(HLA-B)発現、主要組織適合複合体クラスI C(HLA-C)、主要組織適合複合体クラスII DQアルファ1(HLA-DQA1)、及びHLAクラスII組織適合抗原DRB1ベータ鎖(HLA-DRB1)が挙げられる。このような遺伝子産物は、タンパク質断片、又は抗原、又は細胞表面の提示及び免疫T細胞による認識において種々の工程を踏むことで知られている。 Various other features may be relevant in predicting whether an individual may be responsive to checkpoint inhibition. Such features can generally be categorized according to theoretical processes as to whether checkpoint inhibitors may be effective in promoting or enhancing the cancer immune response. For example, some features are whether tumor cells can increase or decrease the probability of an anti-tumor immune response by expressing antigens of mutant proteins on their cell surface, and which It can be about whether it can be as high or low as possible. Examples of such features already discussed include various tumor mutation frequencies, such as total tumor mutation frequency or non-synonymous tumor mutation frequency. Other examples include expression levels of transcripts of genes encoding various proteins, or proteins known to be involved in antigen presentation and stimulate an immune response. Some non-limiting examples are beta 2 microglobulin (B2M), proteasome subunit beta 10 (PSMB10), antigen peptide transmitter 1 (TAP1), antigen peptide transporter 2 (TAP2), human leukocyte antigen A ( HLA-A), major histocompatibility complex class IB (HLA-B) expression, major histocompatibility complex class IC (HLA-C), major histocompatibility complex class II DQ alpha 1 (HLA-DQA1), and HLA Class II histocompatibility complex DRB1 beta chain (HLA-DRB1) is mentioned. Such gene products are known to undergo various steps in the presentation of protein fragments, antigens, or cell surfaces and recognition by immune T cells.

このような遺伝子産物のいずれか1つ、又はその2つ以上の任意の組合せ、又はそのいずれかの腫瘍における発現レベルは、腫瘍細胞の表面上の抗原の発現レベルを示し得る。例えば、このような産物の発現は、非同義変異を有するゲノムDNAのタンパク質産物の細胞表面上での提示の程度に影響し得る。発現が抗原提示を増加させる場合、T細胞が疾患細胞を示すものとして認識し、抗腫瘍免疫応答を結果的に引き起こす可能性がある、変異抗原を提示する尤度は、所与のチェックポイント阻害物質が、対象において応答を生じるのに有効であり得る確率を増加させ得る。従って、前述のいずれか又はその2つ以上の組合せの発現レベルが、腫瘍試料における細胞上の抗原提示の程度とポジティブ又はネガティブに相関する場合、このような発現レベルは、その腫瘍を採取した対象が、所与のチェックポイント阻害物質に対して応答し得る尤度と、ポジティブ又はネガティブにそれぞれ相関し得る。 The expression level of any one of such gene products, or any combination of two or more thereof, or any combination thereof in a tumor can indicate the expression level of the antigen on the surface of the tumor cell. For example, expression of such products can affect the degree of presentation of genomic DNA protein products with non-synonymous mutations on the cell surface. If expression increases antigen presentation, the likelihood of presenting a mutant antigen, which T cells recognize as indicating diseased cells and can result in an antitumor immune response, is a given checkpoint inhibition. It can increase the probability that a substance can be effective in producing a response in a subject. Therefore, if the expression level of any or a combination of two or more of the above correlates positively or negatively with the degree of antigen presentation on the cell in the tumor sample, such expression level is the subject from which the tumor was collected. Can correlate positively or negatively with the likelihood of responding to a given checkpoint inhibitor, respectively.

別のタイプの特徴は、対象から採取される腫瘍試料中に存在するT細胞又はNK細胞の発現レベルを含むことができ、これはまた、チェックポイント阻害のような治療に対する応答性の予測に関連し得る。例えば、HLAクラスI組織適合抗原アルファ鎖E(HLA-E)、ナチュラルキラー細胞顆粒タンパク質7(NKG7)、ケモカイン様受容体1(CMKLR1)、又はこれらの2つ以上の任意の組合せの発現のレベルはまた、チェックポイント阻害物質に対する応答を予測し得る。従って、特徴は、このような産物又はそのRNA転写物の1つ又は複数の発現の尺度を含み得る。 Another type of feature can include the expression level of T or NK cells present in the tumor sample taken from the subject, which is also associated with predicting responsiveness to treatments such as checkpoint inhibition. Can be done. For example, the level of expression of HLA Class I tissue-compatible antigen alpha chain E (HLA-E), natural killer cell granule protein 7 (NKG7), chemokine-like receptor 1 (CMKLR1), or any combination of two or more of these. Can also predict the response to checkpoint inhibitors. Thus, features may include measures of expression of one or more of such products or RNA transcripts thereof.

別のタイプの特徴は、抗腫瘍免疫応答により促進され得るか又はこのような活性を阻害し得るような細胞溶解活性の強化に関するか又はこれを意味する、タンパク質又はそれによる転写物の発現の存在又はレベルに関し得る。上記に考察する腫瘍浸潤リンパ球デコンボリューションの尺度は、このような特徴の例であり得る(例えば、表面抗原分類8(CD8)、表面抗原分類4(CD4)、又は表面抗原分類19(CD19)を発現する細胞による腫瘍浸潤のデコンボリューション)。このカテゴリーの特徴の他の非限定的例としては、グランザイムA(GZMA)若しくはパーフォリン1(PRF1)若しくは前述の2つ以上の任意の組合せ、又はそれらによるRNA転写物の発現のレベルが挙げられ得る。 Another type of feature is the presence of expression of a protein or transcript by it relating to or implying an enhancement of cytolytic activity that can be promoted by an anti-tumor immune response or inhibit such activity. Or it can be about the level. The scale of tumor infiltrating lymphocyte deconvolution discussed above can be an example of such a feature (eg, surface antigen classification 8 (CD8), surface antigen classification 4 (CD4), or surface antigen classification 19 (CD19)). Deconvolution of tumor infiltration by cells expressing). Other non-limiting examples of features in this category may include Granzyme A (GZMA) or perforin 1 (PRF1) or any combination of two or more of the aforementioned, or the level of expression of RNA transcripts by them. ..

更に他の特徴は、抗腫瘍免疫応答性のチェックポイント阻害のプロセス又は機能に関し得る。対象由来の腫瘍試料におけるチェックポイント阻害に寄与する種々のタンパク質産物又はそれによる転写物の発現のレベルは、対象が、チェックポイント阻害治療のようながん治療による治療に対して応答し得るかどうかの予測において関連し得る。このような特徴の例としては、細胞傷害性Tリンパ球関連タンパク質4(CTLA-4)、プログラム細胞死タンパク質1(PD1)、プログラム死リガンド1(PDL1)、プログラム細胞死1リガンド2(PDL2)、リンパ球活性化遺伝子3(LAG3)、Ig及びITIMドメインを有するT細胞免疫受容体(TIGIT)、表面抗原分類276(CD276)、又は前述のいずれか2つ以上の発現、又はそれらのRNA転写物の発現が挙げられ得る。 Yet other features may relate to the process or function of antitumor immune responsiveness checkpoint inhibition. Whether the level of expression of various protein products or transcripts thereof that contribute to checkpoint inhibition in a subject-derived tumor sample allows the subject to respond to treatment with cancer treatments such as checkpoint inhibition therapy. Can be relevant in the prediction of. Examples of such features are cytotoxic T lymphocyte-related protein 4 (CTLA-4), programmed cell death protein 1 (PD1), programmed death ligand 1 (PDL1), programmed cell death 1 ligand 2 (PDL2). , Lymphocyte activation gene 3 (LAG3), T cell immunoreceptor with Ig and ITIM domains (TIGIT), Surface antigen classification 276 (CD276), or expression of any two or more of the above, or RNA transcription thereof. The expression of a substance can be mentioned.

個人が治療に対して応答し得るかどうかの予測において関連し得る他の特徴は、その発現がインターフェロンγの放出及びそれによる受容体での活性の下流にある産物のような、インターフェロンγ活性に関するタンパク質又はそれによるRNA転写物の発現を含む。このタイプの特徴の例としては、ケモカイン(C-Cモチーフ)リガンド5(CCL5)、CD27、ケモカイン(C-X-Cモチーフ)リガンド9(CXCL9)、C-X-Cモチーフケモカイン受容体6(CXCR6)、インドールアミン2,3-ジオキシゲナーゼ(IDO)、シグナル伝達兼転写活性化因子1(STAT1)、又は前述の2つ以上の任意の組合せの発現、又はそれらによるRNA転写物の発現が挙げられ得る。インターフェロンγ活性の他の指標はまた、チェックポイント阻害のような治療に対する応答性を予測することができる。 Other features that may be relevant in predicting whether an individual may respond to treatment are related to interferon gamma activity, such as products whose expression is downstream of the release of interferon gamma and its activity at the receptor. Includes expression of a protein or RNA transcript thereby. Examples of this type of feature are chemokine (CC motif) ligand 5 (CCL5), CD27, chemokine (CXC motif) ligand 9 (CXCL9), CXC motif chemokine receptor 6 (CXCR6), indolamine 2,3-di Expression of oxygenases (IDOs), signaling and transcriptional activators 1 (STAT1), or any combination of two or more of the aforementioned, or RNA transcripts by them can be mentioned. Other indicators of interferon gamma activity can also predict responsiveness to treatments such as checkpoint inhibition.

個人が治療に対して応答し得るかどうかの予測において関連し得る他の特徴は、骨髄由来抑制細胞(MDSC)又は制御性T細胞(Treg)に関するタンパク質又はそれによるRNA転写物の発現を含み、これは、抗腫瘍免疫応答性に免疫抑制作用を付与する可能性があり、がん免疫治療の有効性を鈍らせるか又は妨げる可能性がある。このような特徴の例としては、対象の腫瘍由来の腫瘍試料における、3-フコシル-N-アセチル-ラクトサミン(CD15)、インターロイキン2受容体アルファ鎖(CD25)、siglec-3(CD33)、表面抗原分類39(CD39)、表面抗原分類118(CD118)、フォークヘッドボックスP3(FOXP3)、又は前述の2つ以上の任意の組合せの発現が挙げられ得る。このような細胞の存在又はそれらの活性を意味する、他の種類のタンパク質又は対応するRNA転写物の腫瘍発現レベルはまた、チェックポイント阻害治療又はがんのための他の療法に対して個人が応答し得るかどうかに関連し得る。 Other features that may be relevant in predicting whether an individual may respond to treatment include expression of proteins or RNA transcripts by them for bone marrow-derived immunosuppressive cells (MDSCs) or regulatory T cells (Tregs). This may confer immunosuppressive effects on antitumor immune responsiveness and may blunt or hinder the effectiveness of cancer immunotherapy. Examples of such characteristics include 3-fucosyl-N-acetyl-lactosamine (CD15), interleukin-2 receptor alpha chain (CD25), siglec-3 (CD33), and surface in tumor samples derived from the target tumor. Expression of antigen classification 39 (CD39), surface antigen classification 118 (CD118), forkhead box P3 (FOXP3), or any combination of two or more of the aforementioned may be mentioned. Tumor expression levels of other types of proteins or corresponding RNA transcripts, which imply the presence or activity of such cells, are also indicated by individuals for checkpoint inhibition therapy or other therapies for cancer. It can be related to whether or not it can respond.

任意の前述の特徴のいずれか1つ又は複数は、チェックポイント阻害物質による治療を含む、所与のがん治療による治療に対して個人が応答し得るかどうかについて予測を立てるのに種々の程度で関連し得る。特徴のいずれかは、採取して、特徴の判定についてテストした対象の腫瘍に関するゲノム情報に関連するか又はそれを具体化し得る。この場合、ゲノムの用語は、ゲノムDNAにおけるヌクレオチドの配列に関する情報だけでない特徴(例えば、変異頻度に関する特徴等)を含むために使用する。本明細書では、特徴の尺度により表されるゲノム情報はまた、ゲノム転写物、又はこのような転写物から産生されるタンパク質産物の種々の産物の発現レベルの尺度を含む。従って、上記の種々のタンパク質産物、若しくは詳細に同定されたもののような同様の経路に関与する他のタンパク質産物のいずれかの発現レベル、又はそれらによるRNA転写物の発現レベルは、本明細書に開示の予想的特徴に関するため、ゲノム情報に含むことができる。また、特徴に関するゲノム情報に含まれるものは、腫瘍浸潤リンパ球デコンボリューションの特徴の尺度であり得る。 Any one or more of the aforementioned features will vary in degree in predicting whether an individual will be responsive to treatment with a given cancer treatment, including treatment with checkpoint inhibitors. Can be related at. Any of the features may relate to or embody genomic information about the tumor of interest that was taken and tested for trait determination. In this case, genomic terminology is used to include features that are not just information about nucleotide sequences in genomic DNA (eg, features related to mutation frequency, etc.). As used herein, genomic information represented by a measure of characteristics also includes a measure of the expression level of genomic transcripts, or various products of protein products produced from such transcripts. Thus, the expression levels of any of the various protein products described above, or other protein products involved in similar pathways, such as those identified in detail, or the expression levels of RNA transcripts by them, are described herein. It can be included in genomic information because it relates to the predictive features of the disclosure. Also, what is included in the genomic information about the features can be a measure of the features of tumor-infiltrating lymphocyte deconvolution.

個人の特徴の尺度に加えて、所与の経路若しくは機能若しくは細胞型に関することで知られるか、又はそのように考えられている特徴の相関する発現レベルのパターンはまた、チェックポイント阻害又は他のがん治療に対する応答性に関連する特徴であり得る。例えば、前述の特徴の中でも、経路の共有する一部の共通性、又は細胞の若しくは生理的応答性、又は細胞表現型を示す群は、識別することができ、それらが群として、協調的に上方制御若しくは下方制御されるか、又はより一般的に発現するか、又はさもなければ特定の対象の腫瘍由来の試料中に高若しくは低レベルで相関して群として存在するかの個人の特徴の測定に基づいて、判定がなされ得る。一部の例では、群化された特徴のこのような一般化された測定の尺度は、個人の特徴に加えて、それ自体を特徴として入力して、機械学習分類器を訓練し、チェックポイント阻害若しくは他の治療、又は両方に対する対象の応答性を予測することができる。本明細書では、群全体の発現レベル等を表す追加の特徴を得るための、このような特徴群は、遺伝子セットと呼ばれる。従って、遺伝子セットは、ゲノム変異の存在、特定のRNA転写物の発現レベル、同定された細胞型の存在等の相関性を示すものを表す尺度の組合せを含み得る。 In addition to measures of individual traits, patterns of correlated expression levels of traits known or thought to be related to a given pathway or function or cell type are also checkpoint inhibition or other. It can be a feature related to responsiveness to cancer treatment. For example, among the above-mentioned characteristics, groups showing some commonality of pathways, or cell or physiological responsiveness, or cell phenotype can be identified, and they can be distinguished as a group in a coordinated manner. Individual characteristics of upregulation or downregulation, or more commonly expressed, or otherwise present as a group with high or low levels of correlation in a sample from a particular subject tumor. Judgments can be made based on the measurements. In some examples, such a generalized measure of grouped features, in addition to individual features, inputs itself as a feature to train a machine learning classifier and checkpoint. The responsiveness of the subject to inhibition and / or other treatments can be predicted. In the present specification, such a feature group for obtaining additional features representing the expression level of the whole group and the like is referred to as a gene set. Thus, a gene set can include a combination of scales that represent a correlation such as the presence of genomic mutations, the expression level of a particular RNA transcript, the presence of an identified cell type, and the like.

非限定的な例では、前述の特徴の中でも、一部は、抗原提示に関し、これにより腫瘍のような細胞は、タンパク質断片をそれらの細胞膜上に発現させて、免疫系によりモニタリングされる。上記のように、抗原提示は、例えば、チェックポイント阻害物質により抗腫瘍免疫応答を刺激する尤度を増加させ得る。このような特徴の一部の例としては、総変異頻度、非同義変異頻度、若しくは他の変異頻度(ノンストップ変異頻度、フレームシフト変異頻度(挿入性、欠失性、又はいずれか)、スプライス部位変異頻度、ミスセンス変異頻度、スタート変異頻度(インフレーム、フレーム外、又はいずれか)、ナンセンス変異頻度、開始コドン変異頻度(開始コドンSNP又はその他を含む)、インフレーム挿入変異頻度、インフレーム欠失性変異頻度、又は他のSNP変異頻度)、又は前述の2つ以上の任意の組合せが挙げられ得る。抗原提示に関係する特徴の他の非限定的な例としては、ベータ2ミクログロブリン(B2M)、プロテアソームサブユニットベータ10(PSMB10)、抗原ペプチドトランスミッター1(TAP1)、抗原ペプチド輸送体2(TAP2)、ヒト白血球抗原A(HLA-A)、主要組織適合複合体クラスI B(HLA-B)発現、主要組織適合複合体クラスI C(HLA-C)、主要組織適合複合体クラスII DQアルファ1(HLA-DQA1)、及びHLAクラスII組織適合抗原DRB1ベータ鎖(HLA-DRB1)が挙げられ得る。前述の特徴の中からの個々の例に関する存在又は発現レベル等に関する特徴に加えて、追加の特徴は、前述の一部若しくはすべてが協調的に上方若しくは下方制御されるか、又はさもなければ対象の腫瘍内に高若しくは低レベルで存在する、程度を表し得る(機械学習分類器の訓練のためであろうと予測のためであろうと)。 In a non-limiting example, some of the aforementioned features relate to antigen presentation, which causes tumor-like cells to express protein fragments on their cell membranes and are monitored by the immune system. As mentioned above, antigen presentation can increase the likelihood of stimulating an antitumor immune response, for example, with checkpoint inhibitors. Some examples of such features are total mutation frequency, non-synonymous mutation frequency, or other mutation frequency (nonstop mutation frequency, frameshift mutation frequency (insertion, deletion, or either), splice. Site mutation frequency, missense mutation frequency, start mutation frequency (in-frame, out-of-frame, or either), nonsense mutation frequency, start codon mutation frequency (including start codon SNP or others), in-frame insertion mutation frequency, in-frame lack Missense mutation frequency, or other SNP mutation frequency), or any combination of the two or more mentioned above can be mentioned. Other non-limiting examples of features related to antigen presentation are beta 2 microglobulin (B2M), proteasome subunit beta 10 (PSMB10), antigen peptide transmitter 1 (TAP1), antigen peptide transporter 2 (TAP2). , Human leukocyte antigen A (HLA-A), Major histocompatibility complex class IB (HLA-B) expression, Major histocompatibility complex class IC (HLA-C), Major histocompatibility complex class II DQ alpha 1 (HLA) -DQA1) and HLA class II histocompatibility complex DRB1 beta chain (HLA-DRB1) can be mentioned. In addition to features relating to the presence or expression level of individual examples from the aforementioned features, additional features may or may not be coordinately upward or downward controlled in part or all of the aforementioned features, or otherwise subject. It may represent a high or low level of presence in the tumor (whether for training of machine learning classifiers or for prediction).

別の非限定的な例として、一部の特徴は、対象から採取される腫瘍試料中に存在するT細胞又はNK細胞の発現レベルに関し、これはまた、チェックポイント阻害のような治療に対する応答性の予測に関連し得る。例えば、HLAクラスI組織適合抗原アルファ鎖E(HLA-E)、ナチュラルキラー細胞顆粒タンパク質7(NKG7)、ケモカイン様受容体1(CMKLR1)、又はこれらの2つ以上の任意の組合せの発現レベルはまた、チェックポイント阻害物質に対する応答を予測し得る。前述の特徴の中からの個々の例に関する存在又は発現レベル等に関する特徴に加えて、追加の特徴は、前述の一部若しくはすべてが協調的に上方若しくは下方制御されるか、又はさもなければ対象の腫瘍内に高若しくは低レベルで存在する、程度を表し得る(機械学習分類器の訓練のためであろうと予測のためであろうと)。 As another non-limiting example, some features relate to the expression levels of T or NK cells present in tumor samples taken from a subject, which is also responsive to treatments such as checkpoint inhibition. Can be related to the prediction of. For example, the expression level of HLA class I tissue-compatible antigen alpha chain E (HLA-E), natural killer cell granule protein 7 (NKG7), chemokine-like receptor 1 (CMKLR1), or any combination of two or more of these It can also predict the response to checkpoint inhibitors. In addition to features relating to the presence or expression level of individual examples from the aforementioned features, additional features may or may not be coordinately upward or downward controlled in part or all of the aforementioned features, or otherwise subject. It may represent a high or low level of presence in the tumor (whether for training of machine learning classifiers or for prediction).

別の非限定的な例として、免疫応答により、対象から採取される腫瘍試料中に存在する、腫瘍細胞のような細胞の細胞死及び細胞溶解が促進される場合のように、一部の特徴は、免疫的刺激による細胞溶解の指標に関し、これはまた、チェックポイント阻害のような治療に対する応答性の予測に関連し得る。例えば、デコンボリューションされたCD8発現、デコンボリューションされたCD4発現、デコンボリューションされたCD19発現(比例的に寄与するCD8、CD4、又はCD19発現細胞を表すデコンボリューションは、腫瘍試料中に存在する腫瘍浸潤リンパ球の数に対してそれぞれ表す)、グランザイムA(GZMA)若しくはパーフォリン1(PRF1)、又は前述の2つ以上の任意の組合せ、或いはそれらによるRNA転写物の発現レベルはまた、チェックポイント阻害物質に対する応答を予測し得る。前述の特徴の中からの個々の例に関する存在又は発現レベル等に関する特徴に加えて、追加の特徴は、前述の一部若しくはすべてが協調的に上方若しくは下方制御されるか、又はさもなければ対象の腫瘍内に高若しくは低レベルで存在する、程度を表し得る(機械学習分類器の訓練のためであろうと予測のためであろうと)。 As another non-limiting example, some features, such as when an immune response promotes cell death and lysis of cells such as tumor cells present in a tumor sample taken from a subject. With respect to indicators of cell lysis by immune stimulation, which may also be associated with predicting responsiveness to treatments such as checkpoint inhibition. For example, decombined CD8 expression, deconvoluted CD4 expression, deconvoluted CD19 expression (deconvolution representing proportionally contributing CD8, CD4, or CD19 expressing cells is tumor invasion present in the tumor sample. The expression level of RNA transcripts by (represented by the number of lymphocytes), Granzyme A (GZMA) or perforin 1 (PRF1), or any combination of two or more of the aforementioned, or by them, is also a checkpoint inhibitor. Can predict the response to. In addition to features relating to the presence or expression level of individual examples from the aforementioned features, additional features may or may not be coordinately upward or downward controlled in part or all of the aforementioned features, or otherwise subject. It may represent a high or low level of presence in the tumor (whether for training of machine learning classifiers or for prediction).

別の非限定的な例として、一部の特徴は、対象から採取される腫瘍試料中に存在するチェックポイント阻害機能に関与する細胞及び分子プロセスに関し、これはまた、チェックポイント阻害のような治療に対する応答性の予測に関連し得る。このような特徴の非限定的な例として、細胞傷害性Tリンパ球関連タンパク質4(CTLA4)、プログラム細胞死タンパク質1(PD1)、プログラム死リガンド1(PDL1)、プログラム細胞死1リガンド2(PDL2)、リンパ球活性化遺伝子3(LAG3)、Ig及びITIMドメインを有するT細胞免疫受容体(TIGIT)、表面抗原分類276(CD276)、若しくは前述のいずれか2つ以上の発現、又はそれらによるRNA転写物の発現が挙げられ得る。前述の特徴の中からの個々の例に関する存在又は発現レベル等に関する特徴に加えて、追加の特徴は、前述の一部若しくはすべてが協調的に上方若しくは下方制御されるか、又はさもなければ対象の腫瘍内に高若しくは低レベルで存在する、程度を表し得る(機械学習分類器の訓練のためであろうと予測のためであろうと)。 As another non-limiting example, some features relate to cellular and molecular processes involved in checkpoint inhibitory function present in tumor samples taken from a subject, which also treats such as checkpoint inhibition. May be related to predicting responsiveness to. Non-limiting examples of these characteristics include cytotoxic T lymphocyte-related protein 4 (CTLA4), programmed cell death protein 1 (PD1), programmed death ligand 1 (PDL1), programmed cell death 1 ligand 2 (PDL2). ), Lymphocyte activation gene 3 (LAG3), T cell immunoreceptor (TIGIT) having Ig and ITIM domains, Surface antigen classification 276 (CD276), or expression of any two or more of the above, or RNA by them. Expression of transcripts can be mentioned. In addition to features relating to the presence or expression level of individual examples from the aforementioned features, additional features may or may not be coordinately upward or downward controlled in part or all of the aforementioned features, or otherwise subject. It may represent a high or low level of presence in the tumor (whether for training of machine learning classifiers or for prediction).

別の非限定的な例として、一部の特徴は、対象から採取される腫瘍試料中に存在するインターフェロンγ活性に関与する、指標又は細胞及び分子経路に関し、これらはまた、チェックポイント阻害のような治療に対する応答性の予測に関連し得る。このような特徴の非限定的な例としては、ケモカイン(C-Cモチーフ)リガンド5(CCL5)、CD27、ケモカイン(C-X-Cモチーフ)リガンド9(CXCL9)、C-X-Cモチーフケモカイン受容体6(CXCR6)、インドールアミン2,3-ジオキシゲナーゼ(IDO)、シグナル伝達兼転写活性化因子1(STAT1)、又は前述の2つ以上の任意の組合せの発現、又はそれらによるRNA転写物の発現が挙げられ得る。前述の特徴の中からの個々の例に関する存在又は発現レベル等に関する特徴に加えて、追加の特徴は、前述の一部若しくはすべてが協調的に上方若しくは下方制御されるか、又はさもなければ対象の腫瘍内に高若しくは低レベルで存在する、程度を表し得る(機械学習分類器の訓練のためであろうと予測のためであろうと)。 As another non-limiting example, some features relate to indicators or cellular and molecular pathways involved in interferon gamma activity present in tumor samples taken from a subject, which are also like checkpoint inhibition. It may be related to the prediction of responsiveness to various treatments. Non-limiting examples of such features include chemokine (CC motif) ligand 5 (CCL5), CD27, chemokine (CXC motif) ligand 9 (CXCL9), CXC motif chemokine receptor 6 (CXCR6), indolamine 2 , 3-Dioxygenase (IDO), signal transduction and transcriptional activator 1 (STAT1), or the expression of any combination of two or more of the aforementioned, or the expression of RNA transcripts by them. In addition to features relating to the presence or expression level of individual examples from the aforementioned features, additional features may or may not be coordinately upward or downward controlled in part or all of the aforementioned features, or otherwise subject. It may represent a high or low level of presence in the tumor (whether for training of machine learning classifiers or for prediction).

別の非限定的な例として、一部の特徴は、対象から採取される腫瘍試料中に存在する、MDSC又はTregの存在又は活性に関し、これはまた、チェックポイント阻害のような治療に対する応答性の予測に関連し得る。このような特徴の非限定的な例としては、対象の腫瘍由来の腫瘍試料における、3-フコシル-N-アセチル-ラクトサミン(CD15)、インターロイキン2受容体アルファ鎖(CD25)、siglec-3(CD33)、表面抗原分類39(CD39)、表面抗原分類118(CD118)、フォークヘッドボックスP3(FOXP3)、又は前述の2つ以上の任意の組合せの発現が挙げられ得る。前述の特徴の中からの個々の例に関する存在又は発現レベル等に関する特徴に加えて、追加の特徴は、前述の一部若しくはすべてが協調的に上方若しくは下方制御されるか、又はさもなければ対象の腫瘍内に高若しくは低レベルで存在する、程度を表し得る(機械学習分類器の訓練のためであろうと予測のためであろうと)。 As another non-limiting example, some features relate to the presence or activity of MDSCs or Tregs present in tumor samples taken from a subject, which is also responsive to treatments such as checkpoint inhibition. Can be related to the prediction of. Non-limiting examples of such characteristics include 3-fucosyl-N-acetyl-lactosamine (CD15), interleukin-2 receptor alpha chain (CD25), siglec-3 (siglec-3) in tumor samples derived from the tumor of interest. Expression of CD33), surface antigen classification 39 (CD39), surface antigen classification 118 (CD118), forkhead box P3 (FOXP3), or any combination of two or more of the aforementioned may be mentioned. In addition to features relating to the presence or expression level of individual examples from the aforementioned features, additional features may or may not be coordinately upward or downward controlled in part or all of the aforementioned features, or otherwise subject. It may represent a high or low level of presence in the tumor (whether for training of machine learning classifiers or for prediction).

従って、一部の例では、1つ又は複数の遺伝子セットを同定することができ、このような遺伝子セットに関する特徴の、対象の腫瘍における上方又は下方制御が協調又は相関する程度の尺度は、機械学習分類器を訓練するか、或いはチェックポイント阻害若しくは他の治療又は両方に対する対象の応答性を予測するための追加の特徴として提供され得る。遺伝子セットの例としては、抗原提示、T細胞及びNK細胞の特性、細胞溶解の指標、チェックポイント阻害、インターフェロンγ、及びMSDC/Tregの存在又は活性に関する遺伝子セットが挙げられる。一部の場合では、1つ又は複数のこのような遺伝子セットは、上記に考察する他の個人の特徴のいずれかの1つ又は複数と共に、チェックポイント阻害若しくは他の治療に対する患者の応答性の予測に使用される、訓練又は機械学習分類器に含むことができる。遺伝子セットの特徴における特徴がどのように協調的に上方若しくは下方制御されるか、又はさもなければ高若しくは低レベルで協調的に若しくは相関して発現若しくは存在するか、の一般化された尺度の確認において種々の方法を利用することができる。一例としては、単一試料遺伝子セット濃縮解析(ssGSEA、single sample gene set enrichment analysis)と呼ばれる解析が挙げられ得る。ssGSEAでは、例えば、Barbieら(2009)、Systematic RNA interference reveals that oncogenic KRAS-driven cancers require TBK1、Nature 462:108〜112頁に記載のように、経験的累積分布関数を使用して、このような群化した遺伝子セットの濃縮を確認する。ssGSEAは、非限定的な例として、Rプログラミング言語で実施することができる。 Thus, in some examples, one or more gene sets can be identified, and a measure of the extent to which the up or down regulation of features of such gene sets coordinate or correlate in a tumor of interest is mechanical It may be provided as an additional feature for training a learning classifier or predicting a subject's responsiveness to checkpoint inhibition or other treatments or both. Examples of gene sets include antigen presentation, T and NK cell properties, cell lysis indicators, checkpoint inhibition, interferon gamma, and gene sets for the presence or activity of MSDC / Treg. In some cases, one or more such gene sets, along with one or more of the other individual characteristics discussed above, may be the patient's responsiveness to checkpoint inhibition or other treatments. It can be included in training or machine learning classifiers used for prediction. A generalized measure of how features in a gene set feature are coordinately up or down regulated, or otherwise coordinated or correlated at high or low levels. Various methods can be used for confirmation. One example may be an analysis called single sample gene set enrichment analysis (ssGSEA). In ssGSEA, for example, as described in Barbie et al. (2009), Systematic RNA interference reveals that oncogenic KRAS-driven cancers require TBK1, Nature 462: 108-112, using an empirical cumulative distribution function, such Confirm enrichment of the grouped gene set. ssGSEA can be implemented in the R programming language as a non-limiting example.

前述の特徴では、一部、又はいずれか2つ以上の任意の組合せは、機械学習分類器を訓練するため、並びに訓練した機械学習分類器を使用して、例えば、チェックポイント阻害物質による治療に対して対象が応答し得るかどうか、又はその可能性がどの程度かを予測するための両方に使用することができる。しかし、前述の特徴のすべてを使用して機械学習分類器を訓練する必要はない。機械学習分類器は、前述のすべてを含むか、又は前述のいずれか1つ又は複数を除外する、一連の特徴により訓練することができる。この任意選択の包含及び除外により示唆されるすべての組合せ及び順列は、必ずしも明示的かつ逐語的に列挙しないが、その全体をこれにより組み込む。当業者は、前述の特徴により起こり得る、部分集合、組合せ、部分的組合せ、及び順列を概念化することが可能であろう。同様に、追加の特徴はまた、前述のすべて若しくは単なる組合せ、部分的組合せ、順列、又は前述の特徴のすべてより少数の他の混合に加えてのいずれかにより含むことができる。このようなすべての種々の例は、本開示に明確に含まれる。 In the features described above, some, or any combination of any two or more, is used to train machine learning classifiers, and using trained machine learning classifiers, eg, for treatment with checkpoint inhibitors. It can be used both to predict whether the subject is responsive to it and to what extent it is likely. However, it is not necessary to train a machine learning classifier with all of the above features. Machine learning classifiers can be trained with a set of features that include all of the above, or exclude one or more of the above. All combinations and permutations suggested by this optional inclusion and exclusion are not necessarily listed explicitly and verbatim, but are incorporated by this in their entirety. One of ordinary skill in the art will be able to conceptualize subsets, combinations, partial combinations, and permutations that can occur due to the features described above. Similarly, additional features can also be included by any of all or just combinations, partial combinations, permutations, or in addition to a smaller number of other mixtures than all of the above features. All such various examples are expressly included in this disclosure.

一部の例では、機械学習分類器の訓練に使用する任意の対象の特徴は、他のあらゆる対象について、機械学習分類器の訓練において使用する特徴と同一である。しかし、他の例では、種々の特徴は、機械学習分類器を訓練するのに用いられる異なる対象について提供することができる。言い換えれば、一部の対象は、他の対象の訓練セット由来の特徴に含まれない、その対象の一連の訓練に含まれる特徴を有し得る。同様に、一部の例では、治療に対する対象の応答性に関する予測を機械学習分類器から得るために、対象由来の腫瘍試料から予測を得るために得られる特徴は、分類器の訓練に使用する特徴と同一であり得る。即ち、機械学習分類器の訓練に使用する、すべての対象由来の特徴は、すべて相互に同一であり、また、機械学習分類器からの予測が求められる対象の特徴と同一であり得る。他の例では、機械学習分類器の訓練に使用する訓練した対象の特徴と、機械学習分類器からの予測が求められる対象の特徴との間で不適合が存在し得る。機械学習分類器の訓練に使用する、一部又はすべての対象由来の特徴は、機械学習分類器からの予測が求められる対象由来の対応する特徴が存在しない特徴を含み得る。 In some examples, the characteristics of any object used in training a machine learning classifier are the same as those used in training a machine learning classifier for all other objects. However, in other examples, various features can be provided for different objects used to train machine learning classifiers. In other words, some subjects may have features included in a series of trainings for that subject that are not included in the features derived from the training set of the other subject. Similarly, in some examples, to obtain predictions about a subject's responsiveness to treatment from a machine learning classifier, the features obtained to obtain predictions from a subject-derived tumor sample are used for classifier training. Can be identical to features. That is, all the object-derived features used in the training of the machine learning classifier are the same as each other, and can be the same as the features of the object for which prediction from the machine learning classifier is required. In another example, there may be inconsistencies between the characteristics of the trained subject used to train the machine learning classifier and the characteristics of the subject for which predictions from the machine learning classifier are required. Some or all object-derived features used in training the machine learning classifier may include features for which there is no corresponding object-derived feature that is required to be predicted from the machine learning classifier.

一部の例では、機械学習分類器からの予測が求められる対象は、機械学習分類器の訓練に用いられる1人又は一部又はすべての対象由来の特徴に対応する特徴が不足し得る。他の例では、対象は、類似の特徴を有し得るが、同一の特徴は有さず、類似の特徴は、対象の存在しない同一の特徴の代わりに使用することができる。例えば、機械学習分類器は、少なくとも一部の訓練対象について、1つ又は複数の遺伝子セットの特徴、例えば、上記のssGSEAを使用して得ることができる遺伝子セットの特徴を含む、特徴について訓練されていてもよい。機械学習分類器の訓練に遺伝子セットを使用した訓練対象の一部では、このようなセットの一部は、同一の基礎をなす個人の特徴から得ていてもよい。例えば、抗原提示関連遺伝子セットの特徴の遺伝子セットは、機械学習分類器の訓練に用いられるすべての対象について、同一の基礎をなす特徴から得ていてもよい。他の例では、ある訓練対象のための一部の抗原提示関連遺伝子セットは、別の訓練対象由来の抗原提示関連遺伝子セットの確認に含まれなかったこのような特徴の一部を含む、基礎をなす特徴に基づき得る。これは、他の遺伝子セットにも当てはまる。更に、訓練した機械学習分類器からの予測が求められる、遺伝子セットの特徴の対象は、予測の取得に用いることができ、遺伝子セットの特徴の値は、訓練対象の1人又は複数についての対応する遺伝子セットの特徴の値の取得に使用しており、機械学習分類器の訓練に使用している、少なくとも1つ又は複数の基礎をなす特徴を含まない、対象由来の個人の特徴の基礎をなすセットから得ていてもよい。 In some examples, the subject for which prediction from the machine learning classifier is required may lack features corresponding to features from one or some or all of the objects used in training the machine learning classifier. In another example, the subject may have similar features, but not the same features, and similar features can be used in place of the same features in which the subject does not exist. For example, a machine learning classifier is trained for at least some of the training subjects for features that include one or more gene set features, eg, gene set features that can be obtained using the ssGSEA described above. You may be. For some of the training subjects that used gene sets to train machine learning classifiers, some of such sets may be derived from the same underlying personal characteristics. For example, a gene set of features of an antigen-presenting-related gene set may be derived from the same underlying features for all subjects used to train machine learning classifiers. In another example, some antigen-presenting-related gene sets for one training subject include some of these features that were not included in the identification of antigen-presenting-related gene sets from another training subject. Obtained based on the characteristics that make up. This also applies to other gene sets. In addition, gene set feature targets that require predictions from trained machine learning classifiers can be used to obtain predictions, and gene set feature values correspond to one or more trained subjects. The basis of the individual features of the subject origin, which is used to obtain the value of the features of the gene set to be used and does not contain at least one or more underlying features used for training the machine learning classifier. It may be obtained from the training set.

特徴は、生体試料における、遺伝子シーケンシングデータ又はタンパク質若しくはRNA転写物の発現レベルを定量する公知の方法により確認することができる。例えば、次世代シーケンシング技術を使用して得られ得る相当量のヌクレオチド配列情報は、所与の特徴を得るために使用する次世代シーケンシングのタイプに応じて、ゲノム関連の特徴(例えば、総変異頻度等)と、例えば、RNA転写物の発現レベルの両方をもたらし得る。適切な方法の例としては、全ゲノムシーケンシング、全エクソームシーケンシング、全トランスクリプトームシーケンシング、mRNAシーケンシング、遺伝子アレイ解析、RNAアレイ解析、タンパク質アレイのようなタンパク質解析、又は本開示の態様による機械学習分類器からの予測の訓練及び/若しくは取得に使用される特徴の存在若しくはレベル若しくは量を確認するための他の関連する方法が挙げられる。一部の例では、一連の同一の技術を使用して、機械学習分類器を訓練するためのすべての訓練対象から、及び予測が求められる対象から特徴を得ることができる。他の例では、特徴若しくは一部の特徴を種々の訓練対象について決定した方法、及び/又は予測を得るために使用する特徴を予測が求められる対象について得た方法との間で方法論的な差が存在し得る。 The characteristics can be confirmed by gene sequencing data or a known method for quantifying the expression level of a protein or RNA transcript in a biological sample. For example, the significant amount of nucleotide sequence information that can be obtained using next-generation sequencing techniques depends on the type of next-generation sequencing used to obtain a given feature, and genome-related features (eg, total). It can result in both mutation frequency) and, for example, expression levels of RNA transcripts. Examples of suitable methods include whole genome sequencing, whole exome sequencing, whole transcriptome sequencing, mRNA sequencing, gene array analysis, RNA array analysis, protein analysis such as protein array, or the disclosure of the present disclosure. Other relevant methods for ascertaining the presence or level or quantity of features used to train and / or acquire predictions from machine learning classifiers by aspect can be mentioned. In some examples, a series of identical techniques can be used to obtain features from all trained objects for training machine learning classifiers and from objects for which prediction is required. In other examples, methodological differences between the method of determining features or some features for various training subjects and / or the method of obtaining the features used to obtain predictions for subjects requiring prediction. Can exist.

訓練対象由来の特徴を用いた機械学習分類器の訓練に加えて、治療に対する訓練対象の応答性もまた、機械学習分類器にロードされる。従って、訓練対象は、機械学習分類器を訓練するために特徴及び応答性を提供する対象である。応答性は、例えば、訓練対象が、治療に対して応答したものとして分類される場合、対象が、寿命の延長、腫瘍の収縮、部分的又は完全な寛解等を含む、所定の応答を示したかどうかのような、2項分類であり得る。他の例では、応答性は、応答性が得られたか否かの2項評価ではなく、得られる応答性の程度に基づくスコア又は値であり得る。例えば、本開示による機械学習分類器は、求められる予測のタイプに応じて、非限定的な例として、分類木及び回帰木を含むことができる。 In addition to training the machine learning classifier with features derived from the trained subject, the responsiveness of the trained subject to treatment is also loaded into the machine learning classifier. Therefore, the training object is an object that provides features and responsiveness for training a machine learning classifier. Responsiveness, for example, when the trained subject is classified as responding to treatment, did the subject exhibit a given response, including extended lifespan, tumor contraction, partial or complete remission, etc. It can be a binary classification, such as. In another example, responsiveness can be a score or value based on the degree of responsiveness obtained, rather than a binomial assessment of whether responsiveness was obtained. For example, the machine learning classifier according to the present disclosure may include classification trees and regression trees as non-limiting examples, depending on the type of prediction required.

機械学習分類器は、コンピュータに基づく機械学習に適する任意の分類器であり得る。非限定的な例としては、ランダムフォレスト機械学習分類器が挙げられる。ランダムフォレスト機械学習分類器では、訓練対象の特徴及び治療の値に対する応答性に基づく決定木は、分類決定点を表すノード、及び訓練された入力に基づく結果を表す葉と共に作成する。ランダムフォレスト分類器は、特徴のサブセット及び訓練対象のサブセットを使用して複数の木を生成して、多数の木を作成し、次いで集約することができる。入力のサブセットを含む、このような複数の決定木は、過訓練を防ぎ、予測におけるエラー及びバイアスを減少させる。一部の例では、より正確な機械学習分類器の訓練において、より多くの決定木を作成することができる。一部の例では、5,000〜500,000のいずれかの決定木を訓練において作成することができる。例えば、5,000、10,000、15,000、20,000、25,000、30,000、50,000、75,000、90,000、100,000、125,000、150,000、175,000、200,000、225,000、250,000、275,000、300,000、325,000、350,000、375,000、400,000、425,000、450,000、475,000又は500,000の決定木を実行し、ランダムフォレスト機械学習分類器に集約することができる。このような例示的な可能性のある範囲で数えられ得る数よりも、多い又は少ない木を実行することができる。 The machine learning classifier can be any classifier suitable for computer-based machine learning. A non-limiting example is the Random Forest Machine Learning Classifier. In a random forest machine learning classifier, a decision tree based on the characteristics of the trained object and its responsiveness to treatment values is created with nodes representing classification decision points and leaves representing results based on trained inputs. Random forest classifiers can generate multiple trees using a subset of features and a subset to be trained to create a large number of trees and then aggregate them. Such multiple decision trees, including a subset of inputs, prevent overtraining and reduce errors and biases in prediction. In some examples, more decision trees can be created in the training of more accurate machine learning classifiers. In some examples, any decision tree from 5,000 to 500,000 can be created in the training. For example, 5,000, 10,000, 15,000, 20,000, 25,000, 30,000, 50,000, 75,000, 90,000, 100,000, 125,000, 150,000, 175,000, 200,000, 225,000, 250,000, 275,000, 300,000, 325,000, 350,000, 375,000, 400,000, 425,000, 450,000, 475,000 or 500,000 decision trees can be run and aggregated into a random forest machine learning classifier. It is possible to run more or fewer trees than can be counted in such an exemplary possible range.

多数のオプションが、ランダムフォレスト訓練の実施、及びランダムフォレスト分類器からの予測の生成に利用可能である。非限定的な例として、Rプログラミング言語を使用することができる。他の分類器はまた、本開示の態様に従って使用することもでき、ニューラルネットワーク分類器、サポートベクターマシン、最大エントロピー分類器、超勾配ブースティング分類器、及びランダムファーン(random fern)分類器を含むが、これらに限定されない。 Numerous options are available for conducting random forest training and generating predictions from random forest classifiers. As a non-limiting example, the R programming language can be used. Other classifiers can also be used in accordance with aspects of the present disclosure, including neural network classifiers, support vector machines, maximum entropy classifiers, super-gradient boosting classifiers, and random fern classifiers. However, it is not limited to these.

本明細書に開示の方法によれば、特徴は、何人もの訓練対象のそれぞれから、このような各対象の応答性として得られる。このような特徴及び応答性、又は入力は、コンピュータメモリ記憶装置、例えば、ハードドライブ、サーバ、又は他のメモリ構成要素に入力する。また、このようなコンピュータのメモリ記憶装置機能上に記憶されたものは、ソフトウェアに含まれる命令であり、これは1つ又は複数のマイクロプロセッサに指示する。命令は、訓練対象由来の入力を使用して機械学習分類器を作成するための命令を含む。次いで、訓練した機械学習分類器は、1つ又は複数のコンピュータメモリに記憶され、続いて、応答性についての予測が求められる対象由来の特徴について実行され得る。 According to the methods disclosed herein, a feature is obtained from each of a number of trained subjects as the responsiveness of each such subject. Such features and responsiveness, or inputs, enter into a computer memory storage device, such as a hard drive, server, or other memory component. Also, what is stored on the memory storage function of such a computer is an instruction included in the software, which directs one or more microprocessors. The instructions include instructions for creating a machine learning classifier using inputs from the trained subject. The trained machine learning classifier can then be stored in one or more computer memories and subsequently performed for subject-derived features for which predictions about responsiveness are required.

非限定的な例として、命令は、1つ又は複数のマイクロプロセッサを指示して、ランダムフォレスト訓練を実施し、訓練対象の入力から決定木を作成して、種々の特徴の存在、非存在、レベル等が、治療に対する応答性を示し、多数の決定木を訓練したランダムフォレスト機械学習分類器に集約する可能性が高いか又は低いかを確認し得る。次いで、特徴及び応答性を命令に従って処理する場合に1つ又は複数のマイクロプロセッサにより生成される決定木の集約に基づく、本例による訓練した機械学習分類器は、1つ又は複数のメモリに記憶することができる。続いて、非訓練対象(即ち、訓練した機械学習分類器の訓練に特徴の値を使用しなかった対象)が、特定のチェックポイント阻害物質のような治療に対して応答性であり得るかどうかについて予測する場合、この非訓練対象の腫瘍試料から得られる特徴は、1つ又は複数のメモリ内にロードすることができる。1つ又は複数のマイクロプロセッサは、命令を処理して、1つ又は複数のマイクロプロセッサにより1つ又は複数のメモリからアクセスされる、訓練した機械学習分類器により非訓練対象の特徴を解析し、対象の応答性についての予測をレポートすることができる。 As a non-limiting example, an instruction directs one or more microprocessors to perform random forest training and create a decision tree from the input to be trained, with or without the presence or absence of various features. It can be confirmed whether the level etc. is responsive to treatment and is likely or low to aggregate a large number of decision trees into a trained random forest machine learning classifier. The machine learning classifier trained by this example, based on the aggregation of decision trees generated by one or more microprocessors when processing features and responsiveness according to instructions, is then stored in one or more memories. can do. Then, whether the untrained subject (ie, the subject who did not use the feature values to train the trained machine learning classifier) can be responsive to treatments such as certain checkpoint inhibitors. The features obtained from this untrained tumor sample can be loaded into one or more memories when predicting. One or more microprocessors process instructions and analyze untrained features with a trained machine learning classifier, accessed from one or more memories by one or more microprocessors. You can report predictions about the responsiveness of the subject.

このような例では、機械学習分類器は、複数の訓練対象のそれぞれから得られる腫瘍試料の特徴、及びチェックポイント阻害を含む治療に対する複数の訓練対象のそれぞれの応答性について訓練された、訓練した機械学習分類器であり、機械学習分類器は、治療に対する応答性を予測するように訓練された。更に、対象腫瘍プロファイル由来の非訓練の特徴を含む非訓練対象のゲノム情報、又は特徴の値のセットは、訓練した機械学習分類器に入力して、非訓練対象についての治療応答性分類、例えば、非訓練対象が治療に対してどのように応答し得るかの予測を示す分類又はスコアを生成した。治療は、チェックポイント阻害であり得る。 In such an example, a machine learning classifier was trained and trained on the characteristics of tumor samples obtained from each of the multiple training subjects, and the responsiveness of each of the multiple training subjects to treatment, including checkpoint inhibition. A machine learning classifier, which was trained to predict responsiveness to treatment. In addition, a set of untrained subject genomic information, or feature values, including untrained features derived from the subject tumor profile can be entered into a trained machine learning classifier for treatment responsiveness classification for the untrained subject, eg. , Generated classifications or scores that predict how untrained subjects may respond to treatment. Treatment can be checkpoint inhibition.

訓練した機械学習分類器により生成される、非訓練対象についてのチェックポイント阻害応答性は、ユーザにレポートすることができる。レポートは、非訓練対象が治療に対して応答すると予測されるか否かを2項評価で示す、対象の分類を含むことができる。他の例では、段階評価による数値スコアは、非訓練対象が応答すると予測されるか否かの2項分類に加えて、又はその2項分類ではなく、応答性の確率を示し得る。他の例では、応答性の特定の程度をレポートすることができる。例えば、レポートは、高い尤度の応答性を示すことができるが、応答性は、持続時間又は程度について限定され得る。他の例では、レポートは、比較的低い尤度の応答性の予測を示すことができるが、このような非訓練対象が応答すると予測される場合、より長大な持続時間又は程度の応答性の予測を示し得る。 The checkpoint inhibition responsiveness for untrained subjects generated by the trained machine learning classifier can be reported to the user. The report can include a classification of subjects that indicates in a binomial assessment whether untrained subjects are expected to respond to treatment. In another example, the numerical score by grade may indicate the probability of responsiveness in addition to, or not to, the binary classification of whether the untrained subject is expected to respond. In another example, a particular degree of responsiveness can be reported. For example, reports can show high likelihood responsiveness, but responsiveness can be limited in terms of duration or degree. In another example, the report can show a relatively low likelihood prediction of responsiveness, but if such an untrained subject is expected to respond, it will have a longer duration or degree of responsiveness. Can show predictions.

予測のレポートは、応答する可能性がないものとは対照的に、応答する可能性があるスコア又は2項予測として、グラフィカルユーザインターフェース(GUI)によりレポートすることができる。例えば、1つ又は複数のメモリ及び1つ又は複数のマイクロプロセッサに接続されており、特徴の値の非訓練対象のプロファイルを入力し、訓練した機械学習分類器により解析した、コンピュータ又はコンピュータシステムは、予測が視覚的にレポートされるディスプレイ装置に更に接続することができる。GUIは、多くの形態のいずれかをとることができる。例えば、GUIは、予測の生成において高度の重要度又は重みを有する、特徴又は特徴のサブセット、並びにこのような各因子が、非訓練対象が治療に対して応答する尤度を高く示したか又は低く示したか(即ち、特徴の価)の種々の側面を、以下に更に説明するように非訓練対象についての特徴の値を考慮して、表形式化することであり得る。又は、レポートは、このような情報をレポートするために、種々の形状、影、又は色彩設計を含み得る。 Prediction reports can be reported via a graphical user interface (GUI) as responsive scores or binary predictions, as opposed to those that are unlikely to respond. For example, a computer or computer system that is connected to one or more memories and one or more microprocessors, inputs an untrained profile of feature values, and analyzes it with a trained machine learning classifier. It can be further connected to a display device where predictions are visually reported. The GUI can take any of many forms. For example, the GUI has a high degree of importance or weight in the generation of predictions, a subset of features or features, and each such factor has a high or low likelihood of the untrained subject responding to treatment. The various aspects of what has been shown (ie, the value of the feature) can be tabulated, taking into account the value of the feature for the untrained subject, as further described below. Alternatively, the report may include various shape, shadow, or color designs to report such information.

本明細書に開示の一連の特徴を使用する予測分類のレポートは、治療に対する応答性を予測するための従来の方法から本明細書に開示の主題を区別するものである。従来の治療予測方法とは異なって、組み合わせた方法を利用する方法を本明細書において開示し、この場合、一部の例では、予測の生成において1つ又はほんの少数が分離しているのではなく相互に関連して、多数の特徴を検索することができる。従来の方法を超える、本明細書に開示のこのような特質は、これまで正確性及び一般化可能性が非常に制限され、限られた数の特徴に基づいていた、チェックポイント阻害物質のような所与の治療に対して個人が応答し得るかどうかを予測する、これまでの試みにおいて利点を有する。本明細書において開示するように、多数の因子の寄与、並びにそれぞれが独立して及び他と協調して予測にどのように影響するかを評価するための新規の機械学習プロセスは、予測における従来の試みのこのような制限を克服する。 Predictive classification reports that use the set of features disclosed herein distinguish the subject matter disclosed herein from conventional methods for predicting responsiveness to treatment. Unlike conventional treatment prediction methods, methods that utilize combined methods are disclosed herein, in which case, in some cases, one or only a few may be separated in the generation of predictions. It is possible to search for a large number of features that are not interrelated. Beyond conventional methods, such properties disclosed herein are like checkpoint inhibitors, which were previously highly limited in accuracy and generalizability and were based on a limited number of features. It has advantages in previous attempts to predict whether an individual can respond to a given treatment. As disclosed herein, new machine learning processes for assessing the contributions of multiple factors, and how each influences prediction independently and in collaboration with others, are conventional in prediction. Overcome such limitations of the attempt.

応答性予測を確認するための従来の方法は、治療に対する応答性の尤度が高いか又は低いかを示し得る、特徴又は限られた数の特徴の識別に関していた。対照的に、本明細書では、機械学習分類器を使用して潜在的多数の特徴の相対的寄与を評価するか、又は相互により同時に関連して予測を立てる、新規の方法を開示する。機械学習分類器の新規適用による、このような多因子性の方法は、現在利用可能な方法を超える大きな利点を提供する。 Conventional methods for confirming responsiveness predictions have involved the identification of features or a limited number of features that can indicate whether the likelihood of responsiveness to treatment is high or low. In contrast, this specification discloses a novel method in which machine learning classifiers are used to assess the relative contributions of a large number of potential features, or to make more co-related predictions with each other. With the new application of machine learning classifiers, such multifactorial methods offer significant advantages over currently available methods.

応答性予測をレポートするための一部のGUIの例の有益な特徴は、レポートされる予測に関連する特徴に関する多面的な情報を比較的狭小なスペースに表示して、ユーザが有用な情報をコンパクトに確認できることにあり得る。特に、本開示に従って使用するGUIの特定の例の利点は、限られた若しくは小型化したサイズのディスプレイのため、又は相当量の他の情報をまた表示するのに必要とするか、若しくは望ましいディスプレイのための、そのサイズ設定及び配置であり得る。本開示による予測分類をレポートするためのGUIは、予測分類を容易に認識及び把握できる大量のファセット、及び/又はその生成に関連する特徴を、限られた表示サイズ又は限られた比率のディスプレイ内に収めるように機能し得る。このようなコンパクトなレポート機能は、ディスプレイが、電話又は他の無線通信機器のような携帯型電子機器(例えば、タブレット型コンピュータ又は電話又は他の携帯型の有線若しくは無線機器)のスクリーンである場合のように、これがレポートの受信及び解釈を促進し、他の目的又はその限られた能力のために必要とされ得る表示スペースを確保するという点において、ユーザの、レポートを提供するコンピュータシステムとの接続を向上させる。特徴の大量の特性及び側面を制約されたスペース内に凝縮し、更に、迅速かつ容易に確認可能のままである大量の情報を迅速に伝える能力を保持する、GUIによりレポートを示す例では、より多くの表示スペースが追加の目的のために引き続き同時に利用可能であるか、又はより小型のディスプレイ上での使用が引き続き可能である点において、コンピュータシステムの有用性は向上する。 A useful feature of some GUI examples for reporting responsive predictions is that they display multifaceted information about the features related to the reported predictions in a relatively small space to provide useful information to the user. It is possible that it can be confirmed compactly. In particular, the advantages of certain examples of GUIs used in accordance with this disclosure are for displays of limited or miniaturized size, or for displays that are required or desirable to display a significant amount of other information as well. It can be its sizing and placement for. The GUI for reporting predictive classifications according to the present disclosure provides a large number of facets, and / or features related to their generation, in a display of limited display size or proportion, which makes it easy to recognize and understand predictive classifications. Can function to fit in. Such a compact reporting feature is when the display is the screen of a portable electronic device such as a telephone or other wireless communication device (eg, a tablet computer or telephone or other portable wired or wireless device). With the computer system that provides the report, such as, in that this facilitates the reception and interpretation of the report and secures the display space that may be needed for other purposes or its limited capabilities. Improve connectivity. In the example showing a report by GUI, which condenses a large amount of characteristics and aspects of a feature into a confined space, and retains the ability to quickly convey a large amount of information that remains quickly and easily identifiable, more The usefulness of computer systems is enhanced in that more display space is still available at the same time for additional purposes, or is still available for use on smaller displays.

レポートは、特徴識別子、又は応答性分類の生成において使用する一部若しくはすべての特徴の側面若しくは特性を含むことができる。例えば、レポートは、特徴の価の指示、即ち、ユーザのプロファイルにおけるその値が、対象が治療に対して応答し得る尤度の増加又は減少を示したかどうかを含むことができる。即ち、非訓練対象のプロファイルでは、特徴は、ポジティブな価又はネガティブな価を有し得る。ポジティブ価は、訓練対象における特徴の値が治療に対する応答性とポジティブに相関する傾向にあり、その特徴についての非訓練対象の値が高かったか、又は訓練対象における特徴の値が治療に対する応答性とネガティブに相関する傾向にあり、その特徴についての非訓練対象の値が低かったことを意味し得る。 The report can include feature identifiers, or aspects or properties of some or all features used in the generation of responsiveness classifications. For example, the report can include an indication of the value of the feature, i.e., whether that value in the user's profile indicates an increase or decrease in the likelihood that the subject can respond to treatment. That is, in a non-trained profile, the feature can have a positive or negative value. The positive value tends to positively correlate the value of the feature in the trained subject with the responsiveness to treatment, and the value of the non-trained subject for the feature was high, or the value of the feature in the trained subject was the responsiveness to treatment It tends to correlate negatively, which may mean that the untrained value for that feature was low.

別の識別子は、所与の機械学習分類器についての予測の生成における特徴の重要度の指示であり得る。重要度又は特徴は、訓練に使用する他の特徴に対して、いずれかの方向に予測を推進する可能性が高いことを示し得る。例えば、一部の例では、ジニ減少指数は、訓練中に1つ又は複数の特徴について確認することができる。ジニ減少指数は、予測の生成の推進において他の特徴が有する影響の程度に対して、それが分類器の機能性に対する特徴の有効性が占める割合を示すという点において、特徴の重要度を示す。ジニ減少指数は、種々のソフトウェアパッケージを使用して、例えば、Rプログラミング言語を使用することにより決定することができる。一部の例では、特徴の重要度のジニ減少指数を使用して、予測スコアとは別に、又はそれに加えて、どの特徴の識別子をレポートに含むかを決定することができる。例えば、GUIの形態の所与のレポートでは、GUIは、特徴の重要度が、所定の最小重要度閾に見合うか又は超えるような特徴のみを表示することができる。例えば、レポートは、特徴の重要度が、ジニ減少指数として数値的に表され、2乗して0.1を超えるような特徴のみの識別子を含み得る。ストリンジェントな最小重要度閾は、予測スコアと共に含まれることが望ましい情報の程度に応じて、所与のレポートの代わりに、又はそれに変更して、高く又は低く設定することができる。最小重要度閾が高くなるほど、レポートに含まれ得る特徴の識別子は少なくなり、逆の場合も同様である。例えば、最小重要度閾は、数値的重要度(例えば、ジニ減少指数)の2乗が、0.01〜0.5のいずれかを超える閾値であり得る。他の最小重要度閾は、この範囲の間又はこの範囲外のいずれかから選択され得る。 Another identifier can be an indication of the importance of the feature in generating predictions for a given machine learning classifier. The importance or feature can indicate that it is likely to drive the prediction in either direction relative to the other features used for training. For example, in some cases, the gini reduction index can be identified for one or more features during training. The Gini Decrease Index indicates the importance of a feature in that it represents the proportion of the effectiveness of the feature to the functionality of the classifier to the degree of influence that the other feature has on driving the generation of forecasts. .. The Gini Decrease Index can be determined using various software packages, for example by using the R programming language. In some examples, the gini reduction index of feature importance can be used to determine which feature identifiers are included in the report, either separately from or in addition to the predicted score. For example, in a given report in the form of a GUI, the GUI may only display features whose importance meets or exceeds a given minimum importance threshold. For example, a report may include only feature identifiers where the importance of a feature is expressed numerically as a gini reduction index and squared to greater than 0.1. The stringent minimum importance threshold can be set high or low in place of or in place of a given report, depending on the degree of information that should be included with the predicted score. The higher the minimum importance threshold, the fewer identifiers of features that can be included in the report, and vice versa. For example, the minimum importance threshold can be a threshold at which the square of the numerical importance (eg, the Gini reduction index) exceeds any of 0.01 to 0.5. Other minimum importance thresholds can be selected either during or outside this range.

レポートに含まれ得る特徴識別子の別の例は、特徴の重みである。特徴の重みは、対象のその特徴の値が、対象が治療に対して応答し得るか否かをそのまま示唆し得る程度の尺度である。例えば、各特徴について、単一因子の決定境界を決定することができる。単一因子決定境界は、訓練対象が治療に応答するか否かを最も良好に区別する、その特徴についての値である。例えば、治療に応答する訓練対象のすべてが所与の量を超える特徴についての値を有したが、応答しない治療対象のすべてがその量未満の値を有した場合、その量は、単一因子決定境界であり得る。一部の他の例では、一部の応答する訓練対象が、一部の応答しない訓練対象を超える特徴の値を有する可能性もあれば、他の応答する訓練対象が、その訓練対象未満の特徴の値を有する可能性もある。従って、一部の例では、応答者と非応答者との間で明解に区別される特徴の値についての輝線が存在する可能性もあれば、一方、他の例では、応答者と非応答者との間の特徴の値の境界において、より多くの重複が存在する可能性もある。後者の例では、単一因子決定境界は、訓練対象のセットにおいて、応答者と非応答者との間で起こり得る最大の差をもたらす値として選択され得る。 Another example of a feature identifier that can be included in a report is a feature weight. The weight of a feature is a measure that the value of that feature of the subject can directly suggest whether the subject can respond to treatment. For example, for each feature, a single factor decision boundary can be determined. The single factor determination boundary is a value for that characteristic that best distinguishes whether a trained subject responds to treatment. For example, if all trained subjects responding to treatment had values for features above a given amount, but all non-responding treatment subjects had values less than that amount, the amount was a single factor. It can be a decision boundary. In some other examples, some responsive training subjects may have values of features that exceed some non-responsive training subjects, while other responsive training subjects may be less than that training subject. It may also have feature values. Thus, in some examples, there may be a bright line for the value of a feature that is clearly distinguished between the respondent and the non-responder, while in others, the responder and the non-responder. There may be more duplication at the boundary of feature values with a person. In the latter example, the single factor determination boundary can be selected as the value that results in the largest possible difference between responders and non-responders in the set of training subjects.

特徴の重みは、非訓練対象についての特徴の値が、その特徴についての単一特徴の決定境界とどの程度まで異なるかの、尺度又は指示である。非訓練対象についての特徴の値が、訓練対象に基づく特徴についての単一因子決定境界と異なるほど、応答性分類予測の判定において特徴が有し得る重みは大きくなる。例えば、特徴は、ネガティブ価を有する可能性があり、これは、非訓練対象が、訓練対象における応答性とポジティブに相関する特徴について低い値、又は訓練対象における応答性とネガティブに相関する特徴について高い値を有することを意味する。その特徴についての非訓練対象の値が、その特徴についての単一因子決定境界と実質的に異なる場合、その特徴の重みは、大きくなり得る。しかし、別の特徴が、高い重要性、及びポジティブ価(即ち、非訓練対象について高い値及び訓練対象における応答性とのポジティブな相関性、又は非訓練対象において低い値及び訓練対象における応答性とのネガティブな相関性)を有する場合、たとえその値が、単一因子決定境界とあまり異ならない(即ち、重みが小さい)としても、応答性予測分類に対するこの影響は、比例的に強力となり得る。 A feature weight is a measure or indication of how different a feature's value for an untrained subject is from the single feature determination boundary for that feature. The more the value of the feature for the untrained subject differs from the single-factor determination boundary for the feature based on the trained subject, the greater the weight that the feature can have in determining the responsive classification prediction. For example, a feature may have a negative value, which is a low value for a feature in which the untrained subject positively correlates with responsiveness in the trained subject, or a feature that negatively correlates with responsiveness in the trained subject. It means having a high value. If the untrained value for the feature is substantially different from the single-factor determination boundary for the feature, the weight of the feature can be high. However, another feature is high importance and positive value (ie, high value for non-trained subjects and positive correlation with responsiveness in the trained subject, or low value in the non-trained subject and responsiveness in the trained subject. This effect on the responsive predictive classification can be proportionally stronger if it has a negative correlation of), even if its value is not very different (ie, less weighted) from the single factor determination boundary.

応答性予測レポート及びGUIの構成要素として特徴識別子を示すために、多数の可能な方法が存在し得る。いくつかの特定の例を本明細書において少し詳しく示す。ただし、当業者は、特徴の価、重み、及び重要性をGUIレポートにおいてレポートするために、他の多くの可能な方法が存在し得ること、並びに本明細書において提供する例は、制限しないものであり、又はそれぞれがそのままで、いかなる方法であれ明確に必須であることを理解するであろう。 There can be many possible ways to indicate feature identifiers as components of responsiveness prediction reports and GUIs. Some specific examples are given in a little more detail herein. However, one of ordinary skill in the art is not limited to the fact that there may be many other possible ways for reporting the value, weight, and importance of a feature in a GUI report, and the examples provided herein. You will understand that, or as they are, they are clearly essential in any way.

GUIは、行及び列により表形式化した特徴を示すことができる。特徴は、例えば、行により示すことができ、所与の特徴の種々の特性は、複数の列により示すことができる。例えば、種々の列は、特徴の重要度、その価、その特徴の単一因子決定境界、非訓練対象のその特徴の値を示すことができ、任意選択で、非訓練対象のその特徴の値が、その特徴の単一因子決定境界とどの程度異なるか、及び予測がその特徴のみに基づいていた場合、非訓練対象が応答すると予測され得るかどうかを可視的に指示する。表形式のGUIは、前述の2つ以上の任意の組合せを含むことができる。表形式のGUIレポートはまた、総体的予測スコアを含むことができる。 The GUI can show tabular features with rows and columns. Features can be represented, for example, by rows, and various properties of a given feature can be represented by multiple columns. For example, the various columns can indicate the importance of the feature, its value, the single-factor determination boundary of the feature, the value of the feature of the untrained subject, and optionally the value of the feature of the untrained subject. Visually indicates how different from the single-factor determination boundary of the feature and whether the untrained subject could be predicted to respond if the prediction was based solely on the feature. The tabular GUI can contain any combination of the two or more mentioned above. A tabular GUI report can also include an overall predicted score.

GUIはまた、ヒストグラムであり得る。例えば、柱は、非訓練対象についての所与の特徴の値を示し、線はまた、その特徴の単一因子決定境界を示し得る。非訓練対象についての特徴の値と単一因子決定境界を示す線との間の差は、その特徴の重みの識別子である。線はまた、柱の高さと単一因子決定境界を示す線との間に描かれ得る。2つの間の線の長さはまた、重みの識別子である。価は、柱の下に記号で示し得る。例えば、正又は負の記号は、ポジティブ又はネガティブ価をそれぞれ示し得る。他の対は、上方及び下方を指す矢印、上方向及び下方向を指す三角形等を含むことができ、この場合、一方向は、その特徴のポジティブ価を示し、他方向は、ネガティブ価を示す。価はまた、柱の色又は影により示し、ある色又は影のパターンの柱は、ある価(ポジティブ又はネガティブ)を示し、異なる色又は影のパターンの柱は、反対の価を示し得る。ヒストグラムにおける非訓練対象の特徴の値とその特徴の単一因子決定境界との間の線の色又は影はまた、価を示し得る。例えば、特徴の値が、訓練対象の応答性とネガティブに相関し、非訓練対象の特徴の値が、単一因子決定境界よりも少ない場合、その特徴のヒストグラムレポートのバーにおける非訓練対象の値と単一因子決定境界とを結ぶ線は、ポジティブ価を示す、色又は影であり得る。一方、特徴の値が、訓練対象の応答性とポジティブに相関し、非訓練対象のその特徴の値が、単一因子決定境界よりも少ない場合、その特徴のヒストグラムレポートのバーにおける非訓練対象の値と単一因子決定境界とを結ぶ線は、ネガティブ価を示す、色又は影であり得る。両方の場合において、非訓練対象のその特徴の値は、その特徴の単一因子決定境界よりも少ないが、特徴が、訓練対象の応答性とネガティブ(ポジティブ価)又はポジティブ(ネガティブ価)に相関したかどうかに応じて、その価は、異なることに留意されたい。逆もまた当てはまり得る(即ち、特徴の単一因子決定境界が、非訓練対象のその特徴の値よりも少ないかどうかにかかわらず、特徴が、訓練対象の応答性とポジティブ又はネガティブにそれぞれ相関する傾向にあるかどうかに応じて、ポジティブ又はネガティブ価を有し得る)。 The GUI can also be a histogram. For example, a column may indicate the value of a given feature for an untrained subject, and a line may also indicate a single factor determination boundary for that feature. The difference between the value of a feature for an untrained subject and the line indicating the single-factor determination boundary is an identifier for the weight of that feature. The line can also be drawn between the height of the column and the line indicating the single factor determination boundary. The length of the line between the two is also a weight identifier. The value may be symbolized below the pillar. For example, positive or negative symbols can indicate positive or negative values, respectively. The other pair can include arrows pointing up and down, triangles pointing up and down, etc., where one direction shows the positive value of the feature and the other direction shows the negative value. .. The valence is also indicated by the color or shadow of the pillar, a pillar with a certain color or shadow pattern may show a certain valence (positive or negative), and a pillar with a different color or shadow pattern may show the opposite valence. The color or shadow of the line between the value of the untrained feature in the histogram and the single factor determination boundary of that feature can also indicate valence. For example, if the value of a feature negatively correlates with the responsiveness of the trained subject and the value of the untrained feature is less than the single-factor determination boundary, then the value of the untrained target in the bar of the histogram report for that feature. The line connecting and the single factor determination boundary can be a color or shadow showing a positive value. On the other hand, if the value of the feature positively correlates with the responsiveness of the trained subject and the value of the feature of the untrained subject is less than the single-factor determination boundary, then the value of the untrained subject in the histogram report bar of the feature The line connecting the value and the single factor determination boundary can be a color or shadow showing a negative value. In both cases, the value of the feature of the untrained subject is less than the single-factor determination boundary of the feature, but the feature correlates with the responsiveness of the trained subject as negative (positive value) or positive (negative value). Note that the value will vary depending on whether or not it has been done. The reverse is also true (ie, whether the single-factor determination boundary of a feature is less than the value of that feature in the untrained subject, the feature correlates positively or negatively with the responsiveness of the trained subject, respectively. Can have a positive or negative value, depending on whether it is prone).

特徴の重要度は、ヒストグラムにおけるその特徴について柱の近傍、内、又は下に記号又は他の指標により示すことができる。例えば、特徴についてのバーの下の記号のサイズは、その重要度を示すことができる。又は、重要度は、このように色又は影を付けて重要度の程度を示す、バー又は付随する記号により、色分けすることができる。入力すると、色又は影を付けたスペクトルを示すヒストグラムと関連することができ、重要度の高さは、一方の端のスペクトルにより類似する色又は影によって示し、重要度の低さは、他方の端のスペクトルにより類似する色又は影のパターンによって示す。一部の例では、例えば、非訓練対象の特徴についてのヒストグラムGUIレポートにおいてバーの下に配置された記号は、特徴の値が、訓練対象における応答性とネガティブ又はポジティブに相関したかどうかを示し得る。例えば、正符号及び負符号、上方矢印及び下方矢印、上方向を指す三角形及び下方向を指す三角形、又は他の対は、ポジティブ及びネガティブに相関する特徴を示す。このような場合では、このような記号の相対的サイズは、その相対的重要度を示し得る。 The importance of a feature can be indicated by a symbol or other indicator near, within, or below the column for that feature in the histogram. For example, the size of the symbol below the bar for a feature can indicate its importance. Alternatively, the importance can be color coded by a bar or an accompanying symbol thus colored or shaded to indicate the degree of importance. When entered, it can be associated with a histogram showing a spectrum with colors or shadows, with high importance being indicated by colors or shadows that are more similar to the spectrum at one end, and less important being the other. It is indicated by a color or shadow pattern that is more similar to the edge spectrum. In some examples, for example, the symbol placed below the bar in a histogram GUI report on untrained features indicates whether the feature values were negatively or positively correlated with responsiveness in the trained subject. obtain. For example, positive and negative signs, up and down arrows, triangles pointing up and triangles pointing down, or other pairs show features that correlate positively and negatively. In such cases, the relative size of such symbols may indicate their relative importance.

別の例では、GUIレポートは、特徴の識別子を伝える形状を含む。例えば、識別子をGUIレポートに含む各特徴は、寸法、色、影、又は他の側面が種々の識別子を示し得る形状により表すことができる。例えば、特徴はそれぞれ、四角形により表し、幅は重要度を、高さは重みを表す。四角形の色、影又は輪郭のパターンは、価を示すことができる。又は、特徴は、三角形により表すことができ、底辺は重要度を、高さは重みを、又はその逆を表す。三角形は、ポジティブ価を有する特徴を際立たせることができ、その逆も可能である。又は、三角形の色、又は影のパターン、又はその輪郭を描く線のパターンは、価を示すことができる。 In another example, the GUI report contains a shape that conveys a feature identifier. For example, each feature that includes an identifier in a GUI report can be represented by a shape in which dimensions, colors, shadows, or other aspects can represent different identifiers. For example, each feature is represented by a quadrangle, where width represents importance and height represents weight. The color of the rectangle, the pattern of shadows or contours can indicate the value. Alternatively, the feature can be represented by a triangle, where the base represents importance, the height represents weight, and vice versa. Triangles can highlight features with a positive value and vice versa. Alternatively, the color of the triangle, or the pattern of shadows, or the pattern of lines that outline them, can indicate a value.

別の例では、特徴の識別子は、環状の扇形、又は環状扇形の形状で示すことができる。環状扇形の角度は重要度を、その外半径はその重みを、又はその逆を示し得る。価は、環状扇形の色、若しくは影を付けるパターン、又はその輪郭を描く線にパターンを付けることにより示すことができる。他の例では、扇の形、又は扇形は、特徴の識別子を表すことができ、角度及び半径は、重要度及び重み、又はその逆を表し、色又は影等は、例えば、上記の環状扇形の価を表す。特徴識別子を環状扇形により表す場合、一部の例では、このようなすべての環状扇形は、同一の内半径を有するように描くことができ、環状扇形は、その内弧が共に内円を形成するように配置することができる。内円それ自体において、予測スコア、他の総体的概要、又は応答性予測若しくは分類の指示を示すことができる。この内円の色又は影は、応答性分類予測が、非訓練対象が応答する可能性があるか否かを予測するかどうかを示すことができる。例えば、予測が、非訓練対象が応答する可能性があるという場合、内円は、ある色若しくは影のパターンを有するか、又はあるパターンの線で描くことができ、一方、予測が、非訓練対象が応答しない可能性があるという場合、内円は、異なる色又は影のパターンを有することができる。他の例では、内円ではなく、別の形状、例えば、正方形、星、三角形、五角形又は他の形状が内側に存在し得る。内側の形状のサイズは、予測の強度を示し、内側の形状が大きければ、予測の信頼が高いことを示し、その逆も示し得る。 In another example, the feature identifier can be indicated in the form of an annular sector or an annular sector. The angle of the circular sector can indicate importance, its outer radius can indicate its weight, or vice versa. The value can be indicated by the color of the circular sector, the pattern that casts a shadow, or the pattern that outlines the pattern. In other examples, the sector, or sector, can represent an identifier of the feature, the angle and radius represent importance and weight, or vice versa, and the color, shadow, etc., for example, the circular fan, described above. Represents the value of. When the feature identifier is represented by a circular sector, in some examples all such circular sectors can be drawn to have the same inner radius, which together form an inner circle with their inner arcs. Can be arranged to do so. In the inscribed circle itself, a prediction score, other overall overview, or responsiveness prediction or classification instructions can be provided. The color or shadow of this inner circle can indicate whether the responsive classification prediction predicts whether the untrained subject is likely to respond. For example, if the prediction says that the untrained subject may respond, the inner circle may have a pattern of color or shadow, or be drawn with a line of a pattern, while the prediction is untrained. The inner circle can have a different color or shadow pattern if the subject may not respond. In other examples, instead of the inner circle, another shape, such as a square, star, triangle, pentagon or other shape, may be present inside. The size of the inner shape indicates the strength of the prediction, and the larger the inner shape, the more reliable the prediction, and vice versa.

GUIレポートはまた、より多くの情報を求めるか、又はGUIでレポートされる特定の特徴の関心に応じて追加のソフトウェアアプリケーションを起動する機会をユーザに提供することができる。例えば、GUIは、ユーザが、特徴の識別子上にマウスを移動させる等で装置に入力することにより、又はタッチスクリーンに触れることにより制御可能な、ポインタ又は他の要素をホバリングすることができるように構成され得る。要素を方向づけるか、又はディスプレイの特徴に触れると、更に選択可能なオプションを有するドロップダウンメニューを開くことができる。例えば、ドロップダウンメニューは、特徴の値のような、非訓練対象に特異的な特徴の側面、或いは特徴のコホート範囲、訓練データに存在する値の範囲に対して、又は非訓練対象が応答すると予測されたような方法で応答した訓練対象について、若しくは他の訓練対象についての訓練データのみと比較して、表した非訓練対象の特徴の値の割合、或いは特徴の単一因子決定境界、或いは特徴の重要度又は他の治療に対する応答性との相関性、或いは前述の2つ以上の任意の組合せを表示することができる。ドロップダウンメニューはまた、1つ又は複数のマイクロプロセッサによりアクセス可能な他のプログラムへのリンクを示して、特徴又は非訓練対象の予測スコアを更に評価することができ、例えば、異なる機械学習分類器を実行することができる。このような双方向性をGUIレポートに圧縮することにより、相当なスペース及び計算的リソースを確保することができ、ユーザのコンピュータシステムとの双方向性を大幅に強化する。例えば、ドロップダウンメニューオプションにアクセスする間のGUIレポートの同時連続的表示のために必要とされる表示スペースは、減少する。更に、時間及び計算リソースを確保することができ、例えば、双方向性により、表示スクリーン間又はアプリケーション間で切り換えることなく、複数のコンピュータ機能にアクセスすることが可能となり得る。 GUI reports can also provide users with the opportunity to request more information or launch additional software applications depending on the interests of the particular features reported in the GUI. For example, the GUI allows the user to hover over pointers or other elements that can be controlled by typing into the device, such as by moving the mouse over the feature identifier, or by touching the touch screen. Can be configured. Orienting the element or touching the features of the display will open a drop-down menu with more selectable options. For example, a drop-down menu may respond to an aspect of a feature that is specific to an untrained subject, such as a feature value, or a cohort range of features, a range of values that exist in the training data, or if the untrained subject responds. Percentages of untrained feature values represented, or single-factor determination boundaries of features, or single-factor determination boundaries of features, compared only to training data for trained subjects that responded in a predicted manner, or for other trained subjects. The importance of the features or their correlation with their responsiveness to other treatments, or any combination of the two or more mentioned above can be displayed. Drop-down menus can also show links to other programs accessible by one or more microprocessors to further evaluate predictive scores for features or untrained subjects, eg, different machine learning classifiers. Can be executed. By compressing such interactivity into a GUI report, a considerable amount of space and computational resources can be secured, and the interactivity with the user's computer system is greatly enhanced. For example, the display space required for simultaneous continuous display of GUI reports while accessing the drop-down menu option is reduced. In addition, time and computational resources can be reserved and, for example, interactivity can allow access to multiple computer functions without switching between display screens or between applications.

一部の例では、訓練した機械学習分類器は、更に訓練することができる。例えば、治療に対する非訓練対象の応答性が確認されると、機械学習分類器は、訓練対象の特徴の値、特徴の値に加えて最初に訓練した応答性、予測を提供した非訓練対象についての応答性、及び得られた応答性を含む特徴について再訓練することができる。他の例では、訓練した機械学習分類器は、訓練した機械学習分類器から予測を得られなかった非訓練対象の、追加の特徴の値及び応答性により再訓練することができる。 In some examples, the trained machine learning classifier can be further trained. For example, when the responsiveness of an untrained subject to treatment is confirmed, the machine learning classifier will use the feature values of the trained subject, the responsiveness of the first training in addition to the feature values, and the untrained subject that provided the prediction. Can be retrained for features including responsiveness and responsiveness obtained. In another example, the trained machine learning classifier can be retrained by the value and responsiveness of additional features of the untrained subject that could not be predicted from the trained machine learning classifier.

一部の例では、対象についての応答予測分類を得る際、所与のチェックポイント阻害治療を適用するか否かの判定がなされ得る。本明細書に開示のように訓練した機械学習分類器から得られる特定のチェックポイント治療についての予測スコアが高い場合は、機械学習分類器を訓練して応答性を予測した治療により対象を治療する判定となり得る。又は、スコアが低い場合は、このような治療を適用しない判定となり得る。本明細書に開示の方法、システム、又は機械学習分類器に従って得られた、応答性の尤度が好適に高い応答予測分類又はスコア、このような応答予測分類又はスコアの結果として対象を治療する指示を得る者は、その治療により対象を治療することができる。このような治療に対して対象が応答し得ることを示す、本開示に従って生成される、応答予測分類又は予測スコアを得ることに応じてチェックポイント阻害治療を施すことにより、対象においてがんを治療すること、又はこのような応答予測分類若しくは予測スコアを得た者への指示に基づいてこのような治療を施すことを本開示に含む。 In some examples, when obtaining a response prediction classification for a subject, a decision may be made as to whether or not to apply a given checkpoint inhibition therapy. If the predicted score for a particular checkpoint treatment obtained from a trained machine learning classifier as disclosed herein is high, the machine learning classifier is trained to treat the subject with a treatment that predicts responsiveness. It can be a judgment. Alternatively, if the score is low, it may be determined that such treatment is not applied. Responsively likely response predictive classifications or scores obtained according to the methods, systems, or machine learning classifiers disclosed herein, treating subjects as a result of such response predictive classifications or scores. The person who receives the instruction can treat the subject by the treatment. Treat cancer in a subject by performing checkpoint inhibitory therapy in response to obtaining a response predictive classification or predictive score generated in accordance with the present disclosure, indicating that the subject can respond to such treatment. This disclosure includes doing so, or giving such treatment based on instructions to those who have obtained such response prediction classifications or prediction scores.

次の実施例は、本開示の特定の実施形態を説明することを意図するが、その範囲を制限することは決して意図しない。 The following examples are intended to illustrate certain embodiments of the present disclosure, but are by no means intended to limit their scope.

図1は、本開示の態様による方法を実施するためのオプションを示すウェブダイアグラムである。特徴の値のソース、例えば、がんゲノムアトラス(TCGA、the cancer genome atlas)、又は臨床試験(例えば、抗PD1治療による治療、抗CTLA4治療若しくは他のチェックポイント阻害治療又は他の癌治療の試験)由来のデータの潜在的な非限定的例を示す。特徴の値の決定に使用する特徴情報を得るために使用し得る、アッセイの一部の非限定的な例をまた示し、例えば、2つの非限定的例のような、RNAseq及び全エクソームシーケンシング(WES)がある。種々の特徴の種々の非限定的な例をまた示し、例えば、試験する例のもの、又はこのような特徴の値の確認に適切な尺度がアッセイにより提供され得るものである。例としては、HLA、遺伝子発現、ssGSEA、腫瘍変異頻度、腫瘍浸潤リンパ球(デコンボリューション後)によるもののような細胞溶解性浸潤、CGA、新生抗原、クローン及び/又はサブクローン変異(即ち、所与の変異を最初に示す細胞の子孫に存在する変異、及び後に別の変異を得た、最初に変異した細胞由来の細胞の子孫の他の変異)の存在等が挙げられる。特徴は、機械学習(ML)モデルにより処理し、これにより機械学習分類器を訓練し、非訓練対象の特徴の値を訓練した機械学習分類器に入力し、その上で患者応答を得て、治療に対して応答する可能性があるものか否かとして非訓練患者を標識する。 FIG. 1 is a web diagram showing options for implementing the method according to aspects of the present disclosure. Sources of feature values, such as the cancer genome atlas (TCGA), or clinical trials (eg, treatment with anti-PD1 treatment, anti-CTLA4 treatment or other checkpoint inhibition treatment, or trials of other cancer treatments. ) Shows potential non-limiting examples of derived data. Some non-limiting examples of assays that can be used to obtain feature information to be used to determine feature values are also shown, for example RNAseq and whole exome sequences, such as two non-limiting examples. There is a sing (WES). Various non-limiting examples of various features are also shown, eg, those of the example to be tested, or those in which the assay can provide a suitable scale for confirming the value of such features. Examples include HLA, gene expression, ssGSEA, tumor mutation frequency, cytolytic invasion such as by tumor infiltrating lymphocytes (after deconvolution), CGA, nascent antigens, clones and / or subclonal mutations (ie, given). Examples include the presence of a mutation present in the progeny of the cell that first exhibits the mutation, and other mutations of the progeny of the cell derived from the first mutated cell that later obtained another mutation. Features are processed by a machine learning (ML) model, which trains the machine learning classifier, inputs the values of the untrained feature into the trained machine learning classifier, and then obtains the patient response. Mark untrained patients as having the potential to respond to treatment.

図2は、本開示の態様による、分類器の訓練及び治療に対する患者の応答性の予測に関連し得る特徴の非限定的な例の一部を示す。当業者に理解され得るように、図2に定める特徴は、非限定的な例である。これらはまた、すべてが必要であるとは限らない。図2に示すもの以外の他の特徴を利用することができるが、示す一部は、本開示の態様による方法の実施において省略し得る。本明細書における特徴は、機能、細胞若しくは分子経路又は応答等に応じて群化したものとして示す。このような群の例としては、抗原提示、T細胞又はNK細胞の特性、免疫媒介性細胞溶解の特性、チェックポイント経路関連物質、インターフェロンγ経路関連物質、及びMDSC/Treg特性が挙げられる。他の機能又は細胞若しくは分子プロセス等を表す他の群は、本明細書に示すもののうちのいずれかに加えて、又はその代わりに非限定的な例として含むことができる。 FIG. 2 shows some non-limiting examples of features that may be associated with predicting patient responsiveness to classifier training and treatment according to aspects of the present disclosure. As can be understood by those skilled in the art, the features set forth in FIG. 2 are non-limiting examples. These are also not all needed. Other features than those shown in FIG. 2 may be utilized, but some of which may be omitted in the practice of the method according to aspects of the present disclosure. The features in the present specification are shown as grouped according to function, cell or molecular pathway, response, and the like. Examples of such groups include antigen presentation, T or NK cell properties, immune-mediated cell lysis properties, checkpoint pathway-related substances, interferon gamma pathway-related substances, and MDSC / Treg properties. Other groups representing other functions or cell or molecular processes, etc. may be included in addition to, or instead of, as non-limiting examples of any of those presented herein.

図3は、分類器を訓練する方法を本開示の態様に従って、どのように実施し得るかの例を示すウェブダイアグラムである。当業者に理解され得るように、図3に定める特徴は、非限定的な例である。これらはまた、すべてが必要であるとは限らない。図3に示すもの以外の他の特徴を利用することができるが、示す一部は、本開示の態様による方法の実施において省略し得る。本明細書における特徴は、機能、細胞若しくは分子経路又は応答等に応じて群化したものとして示す。このような群の例としては、抗原提示、T細胞又はNK細胞の特性、免疫媒介性細胞溶解の特性、チェックポイント経路関連物質、インターフェロンγ経路関連物質、及びMDSC/Treg特性が挙げられる。訓練では、図3に示すように、訓練対象由来の特徴、例えば、ここに示すものは、ランダムフォレスト分類器のような機械学習分類器に、訓練した対象が、チェックポイント阻害治療のような所与の治療にどのように応答したかに対応する標識として入力する。このような方法で、分類器を訓練する。開示するように、他の機械学習分類器をも使用することができる。 FIG. 3 is a web diagram showing an example of how a method of training a classifier can be performed in accordance with aspects of the present disclosure. As will be appreciated by those skilled in the art, the features set forth in FIG. 3 are non-limiting examples. These are also not all needed. Other features than those shown in FIG. 3 can be utilized, but some of which may be omitted in the practice of the method according to aspects of the present disclosure. The features in the present specification are shown as grouped according to function, cell or molecular pathway, response, and the like. Examples of such groups include antigen presentation, T or NK cell properties, immune-mediated cell lysis properties, checkpoint pathway-related substances, interferon gamma pathway-related substances, and MDSC / Treg properties. In the training, as shown in FIG. 3, the characteristics derived from the training target, for example, those shown here are in a machine learning classifier such as a random forest classifier, and the trained subject is a place such as checkpoint inhibition treatment. Enter as a marker corresponding to how you responded to your treatment. Train the classifier in this way. Other machine learning classifiers can also be used as disclosed.

図4は、訓練した分類器を使用して治療に対する対象の応答性を予測する方法を本開示の態様に従って、どのように実施し得るかの例を示すウェブダイアグラムを示す、図3の拡張である。特徴(その非限定的な例を本明細書において例として示す)について訓練した機械学習分類器(この非限定的な例では、ランダムフォレスト分類器)は、非訓練対象から得られる更なる入力を受信する。特に、非訓練対象由来の特徴の値を機械学習分類器に入力する。次いで、訓練した機械学習分類器は、応答性の尤度を示すスコア(本明細書において免疫スコアとして示す)を含み得る応答予測分類及び/又は特徴の識別子を予測のレポートにおいて生成する。 FIG. 4 is an extension of FIG. 3 showing an example of how a trained classifier can be used to predict a subject's responsiveness to treatment in accordance with aspects of the present disclosure. is there. A machine learning classifier (in this non-limiting example, a random forest classifier) trained on a feature (an example of which is shown herein as an example) receives additional input from an untrained subject. Receive. In particular, input the value of the feature derived from the non-trained object into the machine learning classifier. The trained machine learning classifier then generates a response predictive classification and / or feature identifier in the prediction report that may include a score indicating the likelihood of responsiveness (indicated herein as an immune score).

特徴及びPD-1阻害に対する応答性は、Hugoら(2016) Genomic and Transcriptomic Features of Response to Anti-PD-1 Therapy in Metastatic Melanoma. Cell. 2016;165(1):35〜44頁(doi:10.1016/j.cell.2016.02.065)から取得した。この試験では、メラノーマを有する26人の患者由来の腫瘍試料から得られる、全エクソームシーケンシングデータ及びRNAseqデータを、PD-1チェックポイント経路の阻害物質による治療(抗PD-1抗体治療(ニボルマブ)又は抗PD-L1抗体治療(ペムブロリズマブ))の前後に得た。生データは、公的に入手可能であり、本明細書の例のためにアクセスした。RNAsepにより得たトランスクリプトームのデータ(試料中の転写物の発現レベルを含む)は、米国立バイオテクノロジー情報センター(NCBI、National Center for Biotechnology Information)の遺伝子発現オムニバス(Gene Expression Omnibus)から受託番号GSE78220でオンラインにより入手可能であった(https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE78220)。NGS法により得た全エクソームシーケンシングデータは、NCBI配列解読アーカイブ(NCBI Sequence Read Archive)(https://www.ncbi.nlm.nih.gov/sra)から受託番号SRA:SRP067938及びSRA:SRP090294によりオンラインで入手可能であった。このようなデータが入手可能であった患者の応答性はまた、公表された試験の結果から得た。このようなソースからデータを選択して、機械学習分類器を訓練して抗PD1チェックポイント経路阻害物質に対する応答性を予測するための、訓練対象についての特徴及び訓練対象についての応答性を作成した。訓練した機械学習分類器から予測を得るための特徴のデータをまた、このようなソースから得た。 Hugo et al. (2016) Genomic and Transcriptomic Features of Response to Anti-PD-1 Therapy in Metastatic Melanoma. Cell. 2016; 165 (1): 35-44 (doi: 10.1016) Obtained from /j.cell.2016.02.065). In this study, total exome sequencing and RNAseq data from tumor samples from 26 patients with melanoma were treated with inhibitors of the PD-1 checkpoint pathway (anti-PD-1 antibody therapy (nivolumab)). ) Or anti-PD-L1 antibody treatment (pembrolizumab)). Raw data is publicly available and has been accessed for the examples herein. Transcriptome data obtained by RNAsep (including expression levels of transcripts in samples) is available from the National Center for Biotechnology Information (NCBI) Gene Expression Omnibus. It was available online at GSE78220 (https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE78220). All exome sequencing data obtained by the NGS method is available from the NCBI Sequence Read Archive (https://www.ncbi.nlm.nih.gov/sra) with accession numbers SRA: SRP067938 and SRA: SRP090294. Was available online by. The responsiveness of patients for whom such data were available was also obtained from the results of published trials. Data were selected from such sources to train machine learning classifiers to create features for training subjects and responsiveness for training subjects to predict responsiveness to anti-PD1 checkpoint pathway inhibitors. .. Feature data for obtaining predictions from trained machine learning classifiers were also obtained from such sources.

特徴及びCTLA-4阻害に対する応答性は、Van Allenら(2015) Genomic correlates of response to CTLA-4 blockade in metastatic melanoma. Science 350:207〜211頁(doi: 10.1126/science.aad0095)から取得した。この試験では、メラノーマを有する30人の患者由来の腫瘍試料から得られる、全エクソームシーケンシングデータ及びRNAseqデータを、CTLA-4の阻害物質(イピリムマブ)による治療の前後に得た。生データは、公的に入手可能であり、本明細書の例のためにアクセスした。NGS法により得た、全エクソームシーケンシングデータ及びトランスクリプトームデータは、遺伝子型及び表現型のNCBIデータベース(dbGaP、NCBI database of Genotypes and Phenotypes)から受託番号phs000452.v2.plでオンラインにより入手可能であった(https://www.ncbi.nlm.nih.gov/gap/?term=phs000452.v2.p1)。このようなデータが入手可能であった患者の応答性はまた、公表された試験の結果からから得た。このようなソースからデータを選択して、機械学習分類器を訓練して抗CTLA4チェックポイント経路阻害物質に対する応答性を予測するための、訓練対象についての特徴及び訓練対象についての応答性を作成した。訓練した機械学習分類器から予測を得るための特徴のデータをまた、このようなソースから得た。 Characteristics and responsiveness to CTLA-4 inhibition were obtained from Van Allen et al. (2015) Genomic correlates of response to CTLA-4 blockade in metastatic melanoma. Science 350: 207-211 (doi: 10.1126 / science.aad0095). In this study, total exome sequencing and RNAseq data from tumor samples from 30 patients with melanoma were obtained before and after treatment with a CTLA-4 inhibitor (ipilimumab). Raw data is publicly available and has been accessed for the examples herein. All exome sequencing and transcriptome data obtained by the NGS method are available online at accession number phs000452.v2.pl from the NCBI database of Genotypes and Phenotypes (dbGaP) for genotypes and phenotypes. It was (https://www.ncbi.nlm.nih.gov/gap/?term=phs000452.v2.p1). The responsiveness of patients for whom such data were available was also derived from the results of published trials. Data were selected from such sources to train machine learning classifiers to create features for training subjects and responsiveness for training subjects to predict responsiveness to anti-CTLA4 checkpoint pathway inhibitors. .. Feature data for obtaining predictions from trained machine learning classifiers were also obtained from such sources.

両方の試験から得られるデータから、データを前処理して、訓練のために機械学習分類器への特徴の入力を作成した。次いで、このような入力を受信したランダムフォレスト機械学習分類器を、訓練データについて訓練した。次いで、一部の対象由来の特徴を使用して一方又は両方の訓練した分類器から予測を生成し、予測スコア及び特徴の識別子を含む、応答性予測分類をGUIによりレポートした。図1は、上記のように、このような例において使用する一部の方法の例の概要を示す。図2は、機械学習分類器に入力するために選択された38の特徴を示す。特徴は、このような特徴の役割についての現在の理解に基づいて、対象がチェックポイント阻害に対して応答するか否かの予測に、これらが関し得るという予想に基づいて選択された。allMutは、すべてが変異する腫瘍変異頻度を指し、nonSynMutは、非同義変異に起因し得る腫瘍変異頻度を指す。cd8_dec、cd4_dec及びcd19_decは、それぞれCD8、CD4及びCD19についての腫瘍浸潤リンパ球デコンボリューション尺度を指す。図2に定める残りの特徴は、RNAseqデータから取得し、相対発現レベルの尺度を含んだ。一部の例では、ssGSEAはまた、一連の特徴(抗原提示、T細胞/NK細胞特性、免疫細胞溶解特性、チェックポイント経路、インターフェロンγ及びMDSC/Treg特性)のために得た。このような例では、一部の機械学習分類器は、オリジナルの38の特徴のみについて訓練し、他の機械学習分類器は、オリジナルの38の特徴にssGSEA解析により得た遺伝子セットを加えて、結果として総計44の特徴について訓練した。 From the data obtained from both tests, the data was preprocessed to create feature inputs to the machine learning classifier for training. Random forest machine learning classifiers that received such inputs were then trained on the training data. Predictions were then generated from one or both trained classifiers using features from some subjects, and responsive predictive classifications, including predictive scores and feature identifiers, were reported via GUI. FIG. 1 outlines an example of some of the methods used in such an example, as described above. Figure 2 shows the 38 features selected for input to the machine learning classifier. The features were selected based on the current understanding of the role of such features and the expectation that they could be involved in predicting whether the subject would respond to checkpoint inhibition. allMut refers to the frequency of tumor mutations that all mutate, and nonSynMut refers to the frequency of tumor mutations that can result from non-synonymous mutations. cd8_dec, cd4_dec and cd19_dec refer to the tumor infiltrating lymphocyte deconvolution scale for CD8, CD4 and CD19, respectively. The remaining features defined in Figure 2 were taken from RNAseq data and included a measure of relative expression levels. In some examples, ssGSEA was also obtained for a range of features (antigen presentation, T cell / NK cell properties, immune cell lysis properties, checkpoint pathway, interferon gamma and MDSC / Treg properties). In such an example, some machine learning classifiers trained only on the original 38 features, while other machine learning classifiers added the gene set obtained by ssGSEA analysis to the original 38 features. As a result, a total of 44 features were trained.

特徴の1つの値あたりの対象のデータは、それらの値を要求する順位により、セットのうちのその特徴について、すべての対象の値の、値の範囲に対する1特徴あたりの各値の割合として正規化した。このような例における訓練のための応答性は、2項評価であり、対象は、応答性(部分的応答性と完全応答性の両方、又は各基礎的試験においてレポートされる、治療による長期的有効性を含む)又は非応答性であるもの(治療に応答する疾患進行を有し、基礎的試験においてレポートされる、治療の有効性を有しないとしてレポートされる対象を含む)として標識した。 The target data per value of a feature is normal as the ratio of each value per feature to the range of values for that feature in the set, depending on the order in which those values are requested. It became. The responsiveness for training in such cases is a binomial assessment and the subject is responsive (both partial and full responsive, or long-term treatment as reported in each basic study. Labeled as either effective (including efficacy) or non-responsive (including subjects with treatment-responsive disease progression, reported in basic trials, and reported as ineffective treatment).

1つ又は複数のメモリ記憶装置及び1つ又は複数のマイクロプロセッサを含むコンピュータシステムに特徴を入力した。1つ又は複数のメモリ記憶装置は、1つ又は複数のマイクロプロセッサにより実行する場合、Rプログラミング言語を使用してランダムフォレスト機械学習分類器を訓練する命令を含んだ。対象の特徴は、1つ又は複数のメモリ記憶装置上に記憶し、1つ又は複数のマイクロプロセッサにより命令に従って解析した。このような例では、50,000の木を使用した。訓練後、コンピュータシステムの1つ又は複数のメモリ記憶装置上に記憶されるように、訓練した機械学習分類器に対象の特徴を入力して、応答予測分類スコアを生成し、コンピュータディスプレイ上のGUIによりレポートした。訓練の例を図3に示し、予測生成の例を図4に示す。 Features have been entered into a computer system that includes one or more memory storage devices and one or more microprocessors. One or more memory storage devices included instructions to train a random forest machine learning classifier using the R programming language when executed by one or more microprocessors. The features of the subject were stored on one or more memory storage devices and analyzed according to instructions by one or more microprocessors. In such an example, we used 50,000 trees. After training, enter the features of interest into the trained machine learning classifier so that they are stored on one or more memory storage devices in the computer system to generate a response prediction classification score and a GUI on the computer display. Reported by. An example of training is shown in Fig. 3, and an example of predictive generation is shown in Fig. 4.

最終的な予想スコアは、分類の確率により生成し、0〜10のスコアに調整した。例として、説明のために、所与の免疫療法に対して「応答する」確率0.75の分類は、7.5の応答性予測スコアに置き換えた。更に、各特徴では、単一因子決定境界は、分類精度を最大化する値で決定した。特徴が、応答性である場合の分類とポジティブ又はネガティブに相関したかどうかの相関の方向性は、特徴と応答との間のスピアマンの相関により決定した。全試料を使用して、訓練及び非訓練対象を分離せずに、前述の解析を行った。性能解析を別々に行った。3分割交差検証並びに曲線下面積(AUC)プロット、Rプログラミング言語パッケージ「caret」及び「cvAUC」をデフォルト機能及びパラメータで使用した。 The final expected score was generated by the probability of classification and adjusted to a score of 0 to 10. As an example, for illustration purposes, the 0.75 probability of "responding" to a given immunotherapy was replaced with a predictive responsiveness score of 7.5. In addition, for each feature, the single factor determination boundary was determined by a value that maximized classification accuracy. The direction of the correlation between the classification when the feature was responsive and whether it was positively or negatively correlated was determined by Spearman's correlation between the feature and the response. The above analysis was performed using all samples without separating the trained and untrained subjects. Performance analysis was performed separately. Area under the curve (AUC) plot, R programming language packages "caret" and "cvAUC" were used with default features and parameters.

図5は、応答分類予測スコア及び特徴識別子をレポートするGUI500のレポートの例を示す。このような例では、特徴の識別子は、特徴の重要度(特徴のジニ指数の減少により決定される重要度)の2乗が0.1よりも大きい場合にのみ示された。図5は、抗PD1治療(例えば、抗PD1又はPD1-L1抗体)に対する応答性を予測するように訓練した機械学習分類器上で実行した抗PD1試験について、データが得られた対象についてのGUIレポートを示す。最小重要度閾を超える重要度を有する15の特徴は、FEATURES列510に示す。特徴の重要度は、IMP.列520に示す。特徴が図2のものと関連する群は、GROUP列530に示す。特徴の応答性とのポジティブ又はネガティブな相関性は、CORR列540に示す。この例では、三角形を使用して相関性の方向を示しており、上方を指す三角形は、特徴の値と応答性との間のポジティブな相関性を示し、下方を指す三角形は、特徴の値と応答性との間のネガティブな相関性を示す。特徴の単一因子決定境界は、1FDB列550に示す。この例では、単一因子決定境界は、応答者と非応答者との間で得られる最も高い差を提供した、その試料についての対象の上及び下の値(即ち、応答性及び非応答性対象の間の区別において割合の精度が総体的に低い、上又は下の値)の範囲における割合として数値的に定める。単一因子決定境界はまた、1FDB列の各特徴のセル内に左から右へ影を付けることにより示し、単一因子決定境界により示す割合を表す(即ち、境界の値に比例して、割合が低いと影が薄く、割合が高いと影が濃い)。各特徴についての対象の値は、INPUT列560に示す(このPT5 INPUTの場合、ここで予測をレポートする患者を、患者番号5又はPT5として識別している)。PT5 INPUT列560の数は、所与の特徴についての対象の値を示し、並びに影は、訓練対象についての値の範囲に対する、その対象の特徴の値の割合の順位を示す。 Figure 5 shows an example of a GUI500 report reporting response classification prediction scores and feature identifiers. In such an example, the feature identifier was shown only if the square of the feature's importance (the importance determined by the decrease in the feature's Gini index) was greater than 0.1. Figure 5 shows a GUI for subjects for which data were obtained for anti-PD1 trials performed on machine learning classifiers trained to predict responsiveness to anti-PD1 treatment (eg, anti-PD1 or PD1-L1 antibodies). Show the report. Fifteen features with importance above the minimum importance threshold are shown in FEATURES column 510. The importance of the features is shown in IMP. Column 520. The groups whose features are related to those in Figure 2 are shown in GROUP column 530. Positive or negative correlation with feature responsiveness is shown in CORR column 540. In this example, triangles are used to indicate the direction of correlation, upward-pointing triangles show a positive correlation between feature values and responsiveness, and downward-pointing triangles show feature values. Shows a negative correlation between and responsiveness. The single-factor determination boundaries of the features are shown in column 1FDB column 550. In this example, the single factor determination boundary provided the highest difference obtained between responders and non-responders, above and below the subject for that sample (ie, responsive and non-responsive). In the distinction between objects, the accuracy of the ratio is generally low, and it is numerically determined as the ratio in the range of upper or lower values). Single-factor determination boundaries are also indicated by shadowing from left to right within the cells of each feature in the 1FDB column, representing the proportions indicated by the single-factor determination boundaries (ie, proportions in proportion to the value of the boundary). If is low, the shadow is light, and if the ratio is high, the shadow is dark). The values of interest for each feature are shown in INPUT column 560 (for this PT5 INPUT, the patient reporting the prediction here is identified as patient number 5 or PT5). The number in column 560 of PT5 INPUT indicates the value of the object for a given feature, and the shadow indicates the order of the ratio of the value of the feature of that object to the range of values for the training object.

所与の特徴の値のみに基づいて対象が治療に対して応答すると予測され得たかどうかを1F.PRED列570にレポートする。従って、ポジティブに相関する特徴では、PT5 Input560の値が1FDB550の値を超える場合、1F.PRED570は、YESを示す(特徴が、対象が治療に対して応答する可能性があると予測し得ることを意味する)。ポジティブに相関する特徴では、PT5 Input560の値が1FDB550の値未満である場合、1F.PRED570は、NOを示す(特徴が、対象が治療に対して応答しない可能性があると予測し得ることを意味する)。ネガティブに相関する特徴では、PT5 Input560の値が1FDB550の値を超える場合、1F.PRED570は、NOを示す(特徴が、対象が治療に対して応答しない可能性があると予測し得ることを意味する)。また、ネガティブに相関する特徴では、PT5 Input560の値が1FDB550の値未満である場合、1F.PRED570は、YESを示す(特徴が、対象が治療に対して応答する可能性があると予測し得ることを意味する)。この例では、1F.PRED570のセルはまた、特徴のみが応答性を予測し得るかどうかに応じて色分けすることができる。YESのセルは、緑に着色し得るが、例えば(R)のように、NOのセルは、赤(R)に着色し得る。最終行のFULL MODEL(全モデル)580は、この場合は5.5の応答分類スコアをレポートする。カットオフは、上又は下の値で決定することができ、治療が有効であるか否かを予測し得る。例えば、5.0未満のスコアは、治療がこの患者に作用しない可能性があると予測すると考えることができ、5.0を超えるスコアは、治療がこの患者に作用する可能性があると示すと考えることができる。このように、5を超えるスコアによって治療がこの患者に作用する可能性があると示すと考えられる場合、本明細書に開示の機械学習分類器を訓練及び使用する有用性により、GUIレポートに指標が示される1つの特徴のみに基づいて基礎的に予測し得るものよりも大幅に向上した、予測のための基礎が、一部の特徴(重要度が最も高い特徴を含む)のみでは非応答性であると予測したが、機械学習分類器では、患者が応答し得ると総体的に予測するという点において、もたらされることを理解することができる。 Report in column 1F.PRED column 570 whether a subject could be predicted to respond to treatment based solely on the value of a given feature. Thus, for positively correlated features, 1F.PRED570 indicates YES if the value of PT5 Input560 exceeds the value of 1FDB550 (the feature can be predicted that the subject may respond to treatment). Means). For positively correlated features, 1F.PRED570 indicates NO if the value of PT5 Input560 is less than the value of 1FDB550 (the feature can be predicted that the subject may not respond to treatment). means). For negatively correlated features, 1F.PRED570 indicates NO if the value of PT5 Input560 exceeds the value of 1FDB550 (meaning that the feature can predict that the subject may not respond to treatment). To do). Also, for negatively correlated features, 1F.PRED570 indicates YES if the value of PT5 Input560 is less than the value of 1FDB550 (features can be predicted that the subject may respond to treatment). Means that). In this example, the cells of 1F.PRED570 can also be color coded depending on whether only the features can predict responsiveness. The YES cell can be colored green, but the NO cell can be colored red (R), for example (R). The last line, FULL MODEL 580, reports a response classification score of 5.5 in this case. The cutoff can be determined by a value above or below and can predict whether the treatment is effective or not. For example, a score below 5.0 can be considered to predict that treatment may not affect this patient, and a score above 5.0 may be considered to indicate that treatment may affect this patient. it can. Thus, if a score greater than 5 is considered to indicate that treatment may affect this patient, the usefulness of training and using the machine learning classifiers disclosed herein is an indicator in the GUI report. The basis for prediction is significantly improved over what can be basically predicted based on only one feature shown, but is non-responsive with only some features (including the most important features). However, it can be understood that the machine learning classifier brings about it in terms of overall predicting that the patient can respond.

この例では、応答予測スコアは、GUIレポートに含まれる各特徴の指標として、GUIによりレポートし、重み(PT5 INPUT560と1FDB550との間の比較を提示することにより)、重要度520、及び1F.PREDの価を含む。一部の例では、ユーザは、例えば、GUIレポートの一部に対応するタッチスクリーンディスプレイの一部に触れるか、或いはカーソルのようなグラフィック要素を、マウスのような装置で特徴又は関連する指標又はそのスコア上を移動させて、追加情報にアクセスするか、又は1つ若しくは複数のマイクロプロセッサに対する、1つ若しくは複数のメモリ記憶装置上に記憶される種々のプログラミング命令により実行することができる、追加の解析から選択することによって、GUIの種々の側面からドロップダウンメニューにアクセスするオプションを有し得る。 In this example, the response prediction score is reported by the GUI as an indicator of each feature contained in the GUI report, weight (by presenting a comparison between PT5 INPUT560 and 1FDB550), importance 520, and 1F. Includes PRED value. In some examples, the user touches, for example, a part of a touch screen display that corresponds to a part of a GUI report, or a graphic element such as a cursor is featured or associated with a device such as a mouse. Additional information that can be moved over the score to access additional information or to be executed by various programming instructions stored on one or more memory storage devices for one or more microprocessors. You may have the option to access the drop-down menu from various aspects of the GUI by choosing from the analysis of.

この対象についての別のGUIレポート610を図6に示す。複数のGUIレポートを、図6に示す例において単一のレポートにまとめる。図6の上部は、環状扇形610の輪を示し、図5で説明するように、重要度が最小重要度閾を超える特徴にそれぞれ対応する。環状扇形がそれぞれ対応する特徴はまた、記述により示す。例えば、特徴HLA.Bに対応する環状扇形は、630により示す。環状扇形はそれぞれ角度、外半径、及び内半径、並びに内弧を有する。この例では、角度は、特徴の重要度に対応する。この例では、特徴の角度は、相互に比例しており、目視比較が直接可能となる。また、この例では、外半径と内半径との間の差は、その重み(即ち、対象の特徴の値と単一因子決定境界との差)に対応する。この例における特徴の価はまた、特徴の環状扇形の輪郭を描く線の種類によりレポートする。環状扇形が対象についてポジティブ価を有する特徴(例えば、総腫瘍変異頻度640について)は、実線で輪郭を描くが、環状扇形が対象についてネガティブ価を有する特徴(例えば、HLA.B630について)は、点線で輪郭を描く。 Another GUI report 610 for this subject is shown in Figure 6. Combine multiple GUI reports into a single report in the example shown in Figure 6. The upper part of FIG. 6 shows the annular fan-shaped 610 ring, which corresponds to each feature whose importance exceeds the minimum importance threshold, as described in FIG. The corresponding features of each annular sector are also indicated by description. For example, the annular fan shape corresponding to feature HLA.B is indicated by 630. The annular sector has an angle, an outer radius, an inner radius, and an inner arc, respectively. In this example, the angle corresponds to the importance of the feature. In this example, the angles of the features are proportional to each other, allowing direct visual comparison. Also, in this example, the difference between the outer and inner radii corresponds to its weight (ie, the difference between the value of the feature of interest and the single factor determination boundary). The feature valence in this example is also reported by the type of line that outlines the feature circular sector. Features in which the circular sector has a positive valence for the subject (eg, for total tumor mutation frequency 640) are outlined with a solid line, while features in which the circular sector has a negative valence for the subject (eg, for HLA.B630) are dotted. Draw a contour with.

この例では、内弧は、内円を形成するように配置する。また、この例では、内円において、この患者についての応答性予測分類スコアは、この場合5.5とレポートされる。また、この例では、総体的予測は、内円を形成する実線により示し、対象の応答予測分類スコアが、応答性と非応答性との予測を区別する、所定のレベルを超えることを意味する。他の例では、点線は、応答予測分類スコアが、このような所定のスコア閾値未満であった場合、内円を形成し得る。他の例では、環状扇形及び/若しくは内円における色若しくは影のパターンの差、並びに/又は環状扇形若しくは内円の輪郭の着色の差は、価を示し得る。 In this example, the inner arcs are arranged to form an inner circle. Also, in this example, in the inner circle, the responsive predictive classification score for this patient is reported to be 5.5 in this case. Also, in this example, the overall prediction is indicated by a solid line forming an inner circle, meaning that the response prediction classification score of the subject exceeds a predetermined level that distinguishes between responsive and non-responsive predictions. .. In another example, the dotted line may form an inscribed circle if the response prediction classification score is below such a predetermined score threshold. In another example, the difference in color or shadow pattern in the circular sector and / or the inner circle, and / or the difference in the coloring of the contour of the circular sector or the inner circle may indicate a value.

この例では、600の図6に示すGUIレポートの上部610は、応答予測分類スコアのレポートを含み、特徴の重要度、価、及び重みを示す。このようなGUIレポート1010の別の例は、図10に示す。特徴についての環状扇形は、円を形成するその内弧と共にではなく個別に示す。外弧1002、内弧1001、及び外半径と内半径との差1003の例は、CD15の環状扇形について示し、環状扇形1004の角度は、例示のためにHLA.B 1030の環状扇形の下に示す。特徴の外半径(又は内半径と外半径との差)は、重みをレポートし、角度は、重要度をレポートし、環状扇形の輪郭を描く線のパターンは、特徴が、ポジティブ(実線、例えば、総腫瘍変異頻度all_tmb 1040についての環状扇形)又はネガティブ(点線、例えば、CD15についての環状扇形)な価を有するかについてレポートする。応答予測分類スコアは、ここに示さないが、このようなGUIレポート1010にまた任意選択で含む。種々のパターンの輪郭ではなく、種々の色又は影のパターンを使用して、特徴の価を示すことができる。環状扇形以外の形状をまた使用することができる。例えば、特徴は、四角形としてレポートして、重要度及び重みは、幅及び高さにより表すか、又は、例えば、三角形としてレポートして、底辺の幅は、重要度を反映し、高さは、重みを表し、方向性は、価を表すことができる。当業者は、本開示の態様によるレポートGUIの複数の特徴の複数の指標をレポートするために、多数の可能な方法が適応可能であることを理解するであろう。 In this example, the top 610 of the GUI report shown in FIG. 6 of 600 includes a report of response prediction classification scores, showing the importance, value, and weight of features. Another example of such a GUI report 1010 is shown in Figure 10. The annular fan shape for features is shown individually, not with its inner arc forming a circle. Examples of outer arc 1002, inner arc 1001, and difference 1003 between outer and inner radii are shown for the annular sector of CD15, and the angle of the annular sector 1004 is below the annular sector of HLA.B 1030 for illustration. Shown. The outer radius of the feature (or the difference between the inner radius and the outer radius) reports the weight, the angle reports the importance, and the pattern of lines that outline the circular sector is positive (solid line, eg, solid line). , Total tumor mutation frequency all_tmb 1040 circular sector) or negative (dotted line, eg circular sector for CD15) valence. Response prediction classification scores are not shown here, but are also optionally included in such GUI report 1010. Patterns of different colors or shadows, rather than contours of different patterns, can be used to indicate the value of the feature. Shapes other than the annular fan shape can also be used. For example, features are reported as rectangles and importance and weight are represented by width and height, or, for example, as triangles, the base width reflects importance and height is. It represents a weight, and the directionality can represent a value. One of ordinary skill in the art will appreciate that a number of possible methods are applicable for reporting multiple indicators of multiple features of the reporting GUI according to aspects of the present disclosure.

図6に示すGUIレポート600に戻って、環状扇形610を含むレポートの上部の下は、GUIレポート620のヒストグラム部分である。GUIレポートは、このような部分の両方若しくは片方のみを有し得るか、又はいずれも有しない。ヒストグラム620は、対象についてレポートされる値が、その特徴について設定した最小重要度閾を超える各特徴の柱を示す。左側の目盛650は、各特徴についての対象の値の割合の順位を示す。各特徴の柱は、訓練対象の値についての値の範囲の割合として、その特徴についての対象の特徴の値を表す。対象の値の例として、特徴CD15 660を示す。また、各柱について、その特徴についての単一特徴の決定境界として、この場合は水平線を示す。単一特徴決定境界の例として、特徴CD15 670を示す。各柱の下の三角形は、特徴が、応答性とポジティブ(上方を指す三角形)に又はネガティブ(下方を指す三角形)に相関するかどうかを示す。例として、CD15の680を指す。三角形はまた、高い重要度を表す大きな三角形、及び低い重要度を表す小さな三角形を割り当てて、各特徴の相対的重要度を反映する。対象の特徴の値とその特徴についての単一因子決定境界との間の線は、その特徴の重みを示す。特徴についての重みのレポートの例として、特徴CD15 690を示す。特徴についての価は、重みの線が実線(ポジティブ価)であるか又は点線(ネガティブ価)であるかにより示す。当業者に理解され得るように、種々の特徴の種々の指示をレポートするための、このような特定の各例は、省略するか、又は種々のグラフィック表示で置き換えることができる。色及び影は、特徴についての価及び/又は相関性を表し、矢印又は他の方向指示形状は、価又は相関性を表し、重要度は、目盛を付けた色分け設計等により表し得る。 Returning to the GUI report 600 shown in FIG. 6, below the top of the report containing the circular sector 610 is the histogram portion of the GUI report 620. GUI reports may or may not have both or one of these parts. Histogram 620 shows the pillars of each feature whose values reported for the subject exceed the minimum importance threshold set for that feature. The scale 650 on the left shows the order of the percentage of the value of interest for each feature. The pillar of each feature represents the value of the target feature for that feature as a percentage of the range of values for the value of the training target. As an example of the target value, feature CD15 660 is shown. Also, for each column, a horizontal line is shown in this case as a single feature determination boundary for that feature. As an example of a single feature determination boundary, feature CD15 670 is shown. The triangle below each pillar indicates whether the feature correlates with responsiveness positively (upward pointing triangle) or negative (downward pointing triangle). As an example, it refers to 680 of CD15. The triangles are also assigned a large triangle representing high importance and a small triangle representing low importance to reflect the relative importance of each feature. The line between the value of the feature of interest and the single-factor determination boundary for that feature indicates the weight of that feature. As an example of a weight report for a feature, feature CD15 690 is shown. The value for the feature is indicated by whether the weight line is a solid line (positive value) or a dotted line (negative value). As will be appreciated by those skilled in the art, each such specific example for reporting different instructions for different features may be omitted or replaced with different graphic representations. Colors and shadows represent valences and / or correlations for features, arrows or other directional shapes represent valences or correlations, and importance can be represented by a graduated color-coded design or the like.

一部の例では、遺伝子セットを使用して、機械学習分類器を訓練し、訓練した機械学習分類器から予測を生成した。ssGSEAにより生成する遺伝子セットの例を図7に示す。遺伝子セットを決定するために使用する個人の特徴により群化した6セットを示す。例としては、抗原プロセシング経路、即ち、抗原提示(710)に関するもの、T細胞及びNK細胞特性720、細胞溶解特性730、チェックポイント経路740、インターフェロンガンマ750、及びMSDC/Treg特性760が挙げられる。細胞セットを含む、各特徴についての相関性及び重要度は、PD1及びCTLA4機械学習分類器を訓練するために使用する場合、770及び780にそれぞれ示す。一部の例では、遺伝子セットの値がssGSEAを使用して決定された場合の個人の任意の特徴よりも高い相関性又は高い重要度のいずれかを生じた遺伝子セットを、破線の囲みで輪郭を描いたセルにおいて強調し、特徴として遺伝子セットを含む値を示す。ssGSEAを含む場合の有用性をまた図9に示す。図9は、2つの異なる訓練した機械学習分類器を使用した、同一の対象についての応答性予測に関する2つのGUIレポートを示す。左側の予測910は、訓練又は予測においてssGSEA遺伝子セットを特徴として使用せずに、予測を生成することにより得た。右側の予測920は、訓練又は予測においてssGSEA遺伝子セットを特徴として使用して、予測を生成することにより得た。ssGSEAによる遺伝子セットを含む場合、一部の遺伝子セット(定義により、遺伝子セットを用いずに得た予測910に含まれなかったもの)を含み、総体的予測を断念することなく、最小閾値境界を超えた特徴は少なかった(11対15)(例えば、対象の応答者としての分類を開始させる、最小応答予測分類スコアとして設定したスコア5.0を予測が超えた両方の場合において)。 In some examples, gene sets were used to train machine learning classifiers and generate predictions from the trained machine learning classifiers. Figure 7 shows an example of the gene set produced by ssGSEA. Six sets are shown grouped according to the characteristics of the individual used to determine the gene set. Examples include those relating to antigen processing pathways, namely antigen presentation (710), T cell and NK cell properties 720, cell lysis properties 730, checkpoint pathway 740, interferon gamma 750, and MSDC / Treg properties 760. Correlation and importance for each feature, including cell set, is shown in 770 and 780 when used to train PD1 and CTLA4 machine learning classifiers, respectively. In some examples, a dashed box outlines a gene set that has either been highly correlated or of greater importance than any individual feature when the gene set value was determined using ssGSEA. Is emphasized in the cell in which is drawn, and the value including the gene set is shown as a feature. The usefulness when ssGSEA is included is also shown in FIG. Figure 9 shows two GUI reports on responsiveness prediction for the same subject using two different trained machine learning classifiers. The prediction 910 on the left was obtained by generating a prediction without using the ssGSEA gene set as a feature in training or prediction. Prediction 920 on the right was obtained by generating a prediction using the ssGSEA gene set as a feature in training or prediction. When including the gene set by ssGSEA, it includes some gene sets (by definition, those not included in the prediction 910 obtained without the gene set), and the minimum threshold boundary is set without giving up the overall prediction. Fewer features were exceeded (11:15) (eg, in both cases where the prediction exceeded the score 5.0 set as the minimum response prediction classification score, which initiates the classification as the respondent of the subject).

図8は、2つの異なる機械学習分類器を使用して予測を生成した同一の患者から得られる2つのGUIレポートを示し、一方の810は、抗CTLA4治療に対する応答性を予測するように訓練し、他方の820は、抗PD1に対する応答性を予測するように訓練し、共に図2に示す特徴を使用した。抗CTLA4機械学習分類器810は、3.8の応答予測分類スコアを生成し、対象が抗CTLA4治療に対して応答しない可能性があることを予測した(5.0の応答予測分類スコア閾値を使用して)。この810の場合、応答性予測分類スコアの価(非応答性)は、応答予測分類スコアを示す内円815の周囲に点線で示す。このような予測の精度は、臨床試験ソース(Van Allenら)からこの患者が、「疾患進行」として応答分類され、対象が抗CTLA4治療に対して非応答性であったことが示されることにより実証される。しかし、抗PD1機械学習分類器820は、6.7の応答予測分類スコアを生成し、対象が抗PD1(例えば、抗PD1又は抗PD-L1抗体)治療に対して応答する可能性があることを予測した(再び5.0の応答予測分類スコア閾値を使用して)。この820の場合、応答予測分類スコア(応答性)は、応答予測分類スコアを示す内円817の周囲に実線で示す。 Figure 8 shows two GUI reports obtained from the same patient who generated predictions using two different machine learning classifiers, one 810 trained to predict responsiveness to anti-CTLA4 treatment. The other 820 was trained to predict responsiveness to anti-PD1 and both used the features shown in Figure 2. The anti-CTLA4 machine learning classifier 810 generated a response predictive classification score of 3.8 and predicted that the subject might not respond to anti-CTLA4 treatment (using the response predictive classification score threshold of 5.0). .. In the case of this 810, the value (non-responsiveness) of the response prediction classification score is indicated by a dotted line around the inner circle 815 indicating the response prediction classification score. The accuracy of such predictions is due to clinical trial sources (Van Allen et al.) Showing that the patient was categorized as "disease progression" and that the subject was non-responsive to anti-CTLA4 treatment. Demonstrated. However, the anti-PD1 machine learning classifier 820 produces a response-predictive classification score of 6.7, predicting that a subject may respond to anti-PD1 (eg, anti-PD1 or anti-PD-L1 antibody) treatment. (Again using the response prediction classification score threshold of 5.0). In the case of this 820, the response prediction classification score (responsiveness) is indicated by a solid line around the inner circle 817 indicating the response prediction classification score.

使用する機械学習分類器に応じた種々の応答予測分類スコア(並びに対応する、種々の特徴の価、重み、及び重要度の差)は、本明細書に開示の方法の能力を反映する。例えば、HLA.Aをレポートする指標830は、抗CTLA4治療に対するこの患者の応答性の予測についてネガティブ価を有するが、抗PD1治療に対するこの対象の応答性の予測についてポジティブ価を有することを示す。更に、非同義腫瘍変異頻度及び総腫瘍変異頻度についての特徴の値は、抗CTLA4機械学習分類器では、最小重要度閾を超えなかったが、抗PD1機械学習分類器840では、最小重要度閾を超えた。 The various response prediction classification scores (and the corresponding differences in valence, weight, and importance of various features) depending on the machine learning classifier used reflect the capabilities of the methods disclosed herein. For example, index 830, which reports HLA.A, indicates that it has a negative value for predicting the patient's responsiveness to anti-CTLA4 treatment, but has a positive value for predicting the subject's responsiveness to anti-PD1 treatment. Furthermore, the feature values for non-synonymous tumor mutation frequency and total tumor mutation frequency did not exceed the minimum importance threshold in the anti-CTLA4 machine learning classifier, whereas in the anti-PD1 machine learning classifier 840, the minimum importance threshold. Beyond.

図5に示す例と同様に、図6、図8、図9及び図10に示す例示的GUIレポートは、ユーザ双方向性を含み得る。従って、一部の例では、ユーザは、例えば、GUIレポートの一部に対応するタッチスクリーンディスプレイの一部に触れるか、又はカーソルのようなグラフィック要素を、マウスのような装置で特徴(例えば、ヒストグラムの環状扇形若しくは柱又は他の指標)上を移動させて、追加情報にアクセスするか、又は1つ又は複数のマイクロプロセッサに対する、1つ又は複数のメモリ記憶装置上に記憶される種々のプログラミング命令により実行することができる、追加の解析から選択することによって、GUIの種々の側面からドロップダウンメニューにアクセスするオプションを有し得る。 Similar to the example shown in FIG. 5, the exemplary GUI reports shown in FIGS. 6, 8, 9 and 10 may include user interactivity. Thus, in some examples, the user touches, for example, a part of the touch screen display that corresponds to a part of the GUI report, or features a graphic element such as a cursor in a device such as a mouse (eg, for example). Various programming stored on one or more memory storage devices for access to additional information or for one or more microprocessors by moving over a circular fan or column or other indicator of the histogram. You may have the option to access the drop-down menu from various aspects of the GUI by choosing from additional parsings that can be performed by instructions.

図11A〜図11Dは、図2に示す38の特徴のすべてを使用すると、単一因子を使用する場合よりも分類器の性能が生まれることを実証する。これは、抗PD1又は抗CTLA4治療のいずれに対する応答性を予測するように訓練したかにかかわらず、機械学習分類器に当てはまった。図11Aは、機械学習分類器を訓練及びテストして、例えば、抗PD1治療に対する応答性を予測するように38の特徴すべてを使用すると、交差検証(CV)なしで機械学習分類器を過訓練させる場合、1.00の偽陽性対真陽性の受信者操作特性(auROC、Receiver Operator Characteristic)のAUCが得られ、図11Bに示すように、単一因子の平均について1.00auROC対0.64auROCに達したことを示す。図11C及び図11Dは、図2に示す38の特徴を使用すると、単一因子の特徴の上位の3つすべてである、HLA-B、nonSyn_tmb及びall_tmbよりも正確であることを更に示す。 Figures 11A to 11D demonstrate that the use of all 38 features shown in Figure 2 results in classifier performance over that of using a single factor. This was true for machine learning classifiers, regardless of whether they were trained to predict responsiveness to anti-PD1 or anti-CTLA4 treatment. Figure 11A trains and tests machine learning classifiers and overtrains machine learning classifiers without cross-validation (CV), for example, using all 38 features to predict responsiveness to anti-PD1 treatment. In this case, an AUC of 1.00 false positive vs. true positive receiver operating characteristic (auROC, Receiver Operator Characteristic) was obtained, reaching 1.00 auROC vs. 0.64 auROC for a single factor mean, as shown in Figure 11B. Is shown. Figures 11C and 11D further show that using the 38 features shown in Figure 2, they are more accurate than all three of the top three single-factor features, HLA-B, nonSyn_tmb and all_tmb.

図12A〜図12Dは、分類器性能を有したssGSEAにより取得する、遺伝子セットを使用する場合の有効性を示すグラフである。ssGSEAの性能は、図2に示す38の特徴を使用した場合に匹敵する。図12A、図12B及び図12Cは、図2に示す38の特徴を使用して抗PD1(図12A)若しくは抗CTLA4(図12B)治療に対する応答性を予測する場合、又は38の特徴に加えて図7に示す6つの遺伝子セットを使用して抗PD1治療(図12C)に対する応答性を予測する場合についての3分割交差検証auROCをレポートする。ssGSEAにより得た6つの遺伝子セットを含む場合、性能は、抗PD1治療予測について0.69〜0.64に低下したが(図12A〜図12Cを比較して)、最小重要度閾を超えた重要度を有する特徴の数は、15〜11に減少した(上記に考察するように、例えば、図8を参照)。図12Dは、機械学習分類器の応答予測分類スコアによる偽陽性及び真陽性結果についての比較可能なt検定の結果を示す(交差検証なし)。従って、一部の例では、特徴として含む遺伝子セットは、分類器の総体的な安定性を向上させ、過訓練の回避を助け、これによる重要な特徴及び指標のより明快な解釈を可能とし得る。 12A-12D are graphs showing the effectiveness of using the gene set obtained by ssGSEA with classifier performance. The performance of ssGSEA is comparable when using the 38 features shown in Figure 2. 12A, 12B and 12C use the 38 features shown in Figure 2 to predict responsiveness to anti-PD1 (Figure 12A) or anti-CTLA4 (Figure 12B) treatment, or in addition to the 38 features. We report a 3-fold cross-validation au ROC for predicting responsiveness to anti-PD1 therapy (Figure 12C) using the six gene sets shown in Figure 7. When including the 6 gene sets obtained by ssGSEA, performance was reduced to 0.69 to 0.64 for anti-PD1 treatment prediction (comparing Figures 12A to 12C), but with importance above the minimum importance threshold. The number of features decreased from 15 to 11 (see, for example, Figure 8 as discussed above). Figure 12D shows the results of comparable t-tests for false-positive and true-positive results from the machine learning classifier's response prediction classification score (without cross-validation). Thus, in some cases, the gene set included as a feature may improve the overall stability of the classifier, help avoid overtraining, and thereby allow a clearer interpretation of key features and indicators. ..

このような例において使用するデータは、チェックポイント阻害物質である、抗CTLA4抗体、抗PD1抗体、及び抗PD1-L1抗体の有効性を、メラノーマを有する患者においてテストする試験に登録した対象由来であった。しかし、当業者に理解され得るように、チェックポイント阻害に基づく役割は、他のがんのがん免疫治療の有効性の鈍化において作用することで知られており、チェックポイント経路機能、本明細書に開示の方法、システム、及び分類器における、本明細書に含むもののような特徴の役割は、このようなチェックポイント阻害物質に対する対象の応答性の予測を生成するのに、乳がん、消化器系のがん、肝がん、膀胱がん、リンパ腫、白血病、骨組織のがん、神経系のがん、肺がん、膵がん、又はその他を含む、他のがんにおいても等しく有用及び有効であり得る。更に、当業者にまた理解され得るように、チェックポイント阻害物質に対する応答性もまた、本明細書に開示する前述の例において特異的に使用するものに加えて、本明細書に開示の方法、システム、及び分類器を使用して予測することができ、これらは単にその適応性の非限定的な例として扱う。 The data used in such examples are from subjects enrolled in a study that tests the efficacy of the checkpoint inhibitors anti-CTLA4 antibody, anti-PD1 antibody, and anti-PD1-L1 antibody in patients with melanoma. there were. However, as will be appreciated by those skilled in the art, a role based on checkpoint inhibition is known to act in slowing the efficacy of cancer immunotherapy for other cancers, checkpoint pathway function, herein. The role of features in the methods, systems, and classifiers disclosed herein, such as those included herein, is to generate predictions of a subject's responsiveness to such checkpoint inhibitors in breast cancer, gastrointestinal tract. Equally useful and effective in other cancers, including systemic cancer, liver cancer, bladder cancer, lymphoma, leukemia, bone tissue cancer, nervous system cancer, lung cancer, pancreatic cancer, or others Can be. Moreover, as will also be appreciated by those skilled in the art, responsiveness to checkpoint inhibitors is also a method disclosed herein, in addition to those specifically used in the aforementioned examples disclosed herein. It can be predicted using systems and classifiers, and these are treated merely as non-limiting examples of their adaptability.

この性能解析の落とし穴は、試料サイズが小さいことである。多数の特徴を用いたとしても、過訓練は避けられない。一方、分割交差検証の結果は、非常に不安定であり、連続曲線ではなくauROC点の離散化を示す。しかし、本発明者らが有する制限において、全モデルによる解析は、単一因子による解析よりも明白に性能が優れている。 The pitfall of this performance analysis is the small sample size. Overtraining is inevitable, even with many features. On the other hand, the results of cross-validation are very unstable and show the discretization of auROC points rather than a continuous curve. However, in the limitations of the present inventors, the analysis by all models clearly outperforms the analysis by a single factor.

好ましい実施形態を本明細書において詳細に表示及び記載したが、本開示の趣旨に逸脱することなく、種々の修飾、追加、置換等をなすことが可能であり、従って、以下の特許請求の範囲に定義するように、これらが本開示の範囲内にあるとみなされることが、関連分野の当業者に明らかとなるであろう。 Although preferred embodiments are presented and described in detail herein, various modifications, additions, substitutions, etc. can be made without departing from the spirit of the present disclosure, and thus the following claims. As defined in, it will be apparent to those skilled in the art concerned that these are considered to be within the scope of the present disclosure.

本明細書においてより詳細に検討する前述の概念及び追加の概念のすべての組合せが(このような概念が相互に矛盾しなければ)、本明細書に開示の、本発明の主題の一部であると考えられることが理解されるべきである。特に、本開示の最後に現れる、主張する主題のすべての組合せは、本明細書に開示の、本発明の主題の一部であると考えられる。 All combinations of the aforementioned and additional concepts discussed in more detail herein (unless such concepts contradict each other) are part of the subject matter of the invention disclosed herein. It should be understood that there is. In particular, all combinations of claimed subject matter appearing at the end of this disclosure are considered to be part of the subject matter of the present invention disclosed herein.

GSE 78220
SRA SRP067938
SRA SRP090294
dbGaP phs000452.v2.pl
GSE 78220
SRA SRP067938
SRA SRP090294
dbGaP phs000452.v2.pl

Claims (29)

訓練した機械学習分類器に非訓練対象のゲノム情報を入力する工程であって、非訓練対象のゲノム情報が、非訓練対象から得られる腫瘍プロファイル由来の特徴を含み、
訓練した機械学習分類器が、複数の訓練対象のゲノム情報、及びチェックポイント阻害を含む治療に対する複数の訓練対象のそれぞれの応答性について訓練され、複数の訓練対象のゲノム情報が、複数の訓練対象のそれぞれから得られる腫瘍プロファイルの特徴を含み、機械学習分類器が、治療に対する応答性を予測するように訓練される、工程と、
訓練した機械学習分類器を使用して、非訓練対象についてチェックポイント阻害応答性分類を生成する工程であって、チェックポイント阻害応答性分類が、非訓練対象がチェックポイント阻害に対して応答することを予測する、工程と、
非訓練対象のチェックポイント阻害応答性分類を、グラフィカルユーザインターフェースを使用してレポートする工程と
を含む、コンピュータ実行方法。
In the process of inputting genomic information of a non-trained subject into a trained machine learning classifier, the genomic information of the non-trained subject contains features derived from a tumor profile obtained from the non-trained subject.
A trained machine learning classifier is trained on the genomic information of multiple training subjects and the responsiveness of each of the training subjects to treatments including checkpoint inhibition, and the genomic information of the multiple training subjects is the multiple training subjects. Machine learning classifiers are trained to predict responsiveness to treatment, including features of the tumor profile obtained from each of the processes and
In the process of generating a checkpoint inhibition responsiveness classification for a non-trained subject using a trained machine learning classifier, the checkpoint inhibition responsiveness classification is that the untrained subject responds to checkpoint inhibition. Predict the process and
A computer execution method that includes the process of reporting an untrained checkpoint inhibition responsiveness classification using a graphical user interface.
非訓練対象から得られる腫瘍プロファイル由来の特徴の少なくとも一部、又は訓練対象の1人又は複数から得られる腫瘍プロファイル由来の特徴の少なくとも一部が、すべての変異からなる総変異頻度、非同義変異からなる総変異頻度、ベータ2ミクログロブリン(B2M)発現、プロテアソームサブユニットベータ10(PSMB10)発現、抗原ペプチドトランスミッター1(TAP1)発現、抗原ペプチド輸送体2(TAP2)発現、ヒト白血球抗原A(HLA-A)発現、主要組織適合複合体クラスI B(HLA-B)発現、主要組織適合複合体クラスI C(HLA-C)発現、主要組織適合複合体クラスII DQアルファ1(HLA-DQA1)発現、HLAクラスII組織適合抗原DRB1ベータ鎖(HLA-DRB1)発現、HLAクラスI組織適合抗原アルファ鎖E(HLA-E)発現、ナチュラルキラー細胞顆粒タンパク質7(NKG7)発現、ケモカイン様受容体(CMKLR1)発現、表面抗原分類8(CD8)を発現する細胞による腫瘍浸潤、表面抗原分類4(CD4)を発現する細胞による腫瘍浸潤、表面抗原分類19(CD19)を発現する細胞による腫瘍浸潤、グランザイムA(GZMA)発現、パーフォリン1(PRF1)発現、細胞傷害性Tリンパ球関連タンパク質4(CTLA4)発現、プログラム細胞死タンパク質1(PD1)発現、プログラム死リガンド1(PDL1)発現、プログラム細胞死1リガンド2(PDL2)発現、リンパ球活性化遺伝子3(LAG3)発現、Ig及びITIMドメインを有するT細胞免疫受容体(TIGIT)発現、表面抗原分類276(CD276)発現、ケモカイン(C-Cモチーフ)リガンド5(CCL5)、CD27発現、ケモカイン(C-X-Cモチーフ)リガンド9(CXCL9)発現、C-X-Cモチーフケモカイン受容体6(CXCR6)、インドールアミン2,3-ジオキシゲナーゼ(IDO)発現、シグナル伝達兼転写活性化因子1(STAT1)発現、3-フコシル-N-アセチル-ラクトサミン(CD15)発現、インターロイキン2受容体アルファ鎖(CD25)発現、siglec-3(CD33)、表面抗原分類39(CD39)発現、表面抗原分類118(CD118)発現、フォークヘッドボックスP3(FOXP3)発現、及び前述の2つ以上の任意の組合せからなる群から選択される、請求項1に記載の方法。 At least some of the features derived from the tumor profile obtained from the untrained subject, or at least some of the features derived from the tumor profile obtained from one or more of the trained subjects, consist of all mutations. Total mutation frequency consisting of, beta 2 microglobulin (B2M) expression, proteasome subunit beta 10 (PSMB10) expression, antigen peptide transmitter 1 (TAP1) expression, antigen peptide transporter 2 (TAP2) expression, human leukocyte antigen A (HLA) -A) expression, major histocompatibility complex class IB (HLA-B) expression, major histocompatibility complex class IC (HLA-C) expression, major histocompatibility complex class II DQ alpha 1 (HLA-DQA1) expression, HLA class II histocompatibility antigen DRB1 beta chain (HLA-DRB1) expression, HLA class I histocompatibility antigen alpha chain E (HLA-E) expression, natural killer cell granule protein 7 (NKG7) expression, chemokine-like receptor (CMKLR1) Expression, tumor invasion by cells expressing surface antigen classification 8 (CD8), tumor invasion by cells expressing surface antigen classification 4 (CD4), tumor invasion by cells expressing surface antigen classification 19 (CD19), granzyme A ( GZMA) expression, perforin 1 (PRF1) expression, cytotoxic T lymphocyte-related protein 4 (CTLA4) expression, programmed cell death protein 1 (PD1) expression, programmed death ligand 1 (PDL1) expression, programmed cell death 1 ligand 2 (PDL2) expression, lymphocyte activation gene 3 (LAG3) expression, T cell immunoreceptor (TIGIT) expression with Ig and ITIM domains, surface antigen classification 276 (CD276) expression, chemokine (CC motif) ligand 5 (CCL5) ), CD27 expression, chemokine (CXC motif) ligand 9 (CXCL9) expression, CXC motif chemokine receptor 6 (CXCR6), indolamine 2,3-dioxygenase (IDO) expression, signaling and transcriptional activator 1 (STAT1) ) Expression, 3-fucosyl-N-acetyl-lactosamine (CD15) expression, interleukocyte 2 receptor alpha chain (CD25) expression, siglec-3 (CD33), surface antigen classification 39 (CD39) expression, surface antigen classification 118 ( The first aspect of the present invention, which is selected from the group consisting of CD118) expression, forkhead box P3 (FOXP3) expression, and any combination of two or more described above. How to put. 訓練特徴の少なくとも一部、又は非訓練特徴の少なくとも一部が、遺伝子セットを含む、請求項1に記載の方法。 The method of claim 1, wherein at least a portion of the trained features, or at least a portion of the non-trained features, comprises a gene set. 遺伝子セットが、単一サンプル遺伝子セットの濃縮解析を使用して選択された、請求項3に記載の方法。 The method of claim 3, wherein the gene set was selected using enrichment analysis of a single sample gene set. 機械学習分類器が、ランダムフォレストである、請求項1に記載の方法。 The method of claim 1, wherein the machine learning classifier is a random forest. 少なくとも50,000の木が、機械学習分類器の訓練において使用される、請求項5に記載の方法。 The method of claim 5, wherein at least 50,000 trees are used in the training of machine learning classifiers. チェックポイント阻害応答性分類が、予測スコア及び1つ又は複数の特徴識別子を含み、1つ又は複数の特徴識別子が、特徴価、特徴重要度、及び特徴重みからなる群から選択される、請求項1に記載の方法。 Claim that the checkpoint inhibition responsiveness classification comprises a predicted score and one or more feature identifiers, the one or more feature identifiers being selected from the group consisting of feature value, feature importance, and feature weight. The method described in 1. グラフィカルユーザインターフェースが、特徴識別子を環状扇形の各側面としてレポートし、環状扇形の角度が特徴重要度をレポートし、環状扇形の外半径が特徴重みをレポートし、環状扇形の色が特徴価をレポートする、請求項7に記載の方法。 The graphical user interface reports the feature identifier as each side of the circular sector, the angle of the circular sector reports the importance of the feature, the outer radius of the circular sector reports the feature weight, and the color of the circular sector reports the feature value. The method according to claim 7. 特徴の特徴重要度が、特徴のジニ指数の減少を含む、請求項8に記載の方法。 The method of claim 8, wherein the feature importance of the feature comprises a decrease in the Gini index of the feature. グラフィカルユーザインターフェースが、特徴の特徴重要度が閾値を超える場合かつその場合に限り、特徴の識別子をレポートする、請求項9に記載の方法。 The method of claim 9, wherein the graphical user interface reports the feature identifier only if the feature importance of the feature exceeds a threshold. 特徴の特徴重要度が、特徴の特徴重要度の2乗が0.1を超えない場合、閾値を超えない、請求項10に記載の方法。 The method according to claim 10, wherein the feature importance of the feature does not exceed the threshold value when the square of the feature importance of the feature does not exceed 0.1. 各環状扇形が内弧を含み、環状扇形の内弧が円を形成するように配置される、請求項10に記載の方法。 The method of claim 10, wherein each circular sector includes an inner arc and the inner arcs of the circular fan are arranged to form a circle. 治療に対する非訓練対象の応答性を、訓練した機械学習分類器に入力する工程と、機械学習分類器を更に訓練する工程とを更に含み、更に訓練する工程が、訓練した機械学習分類器を、非訓練対象から得られる腫瘍試料の特徴、及び治療に対する非訓練対象の応答性について訓練することを含む、請求項1に記載の方法。 The step of inputting the responsiveness of the non-trained object to the treatment into the trained machine learning classifier and the step of further training the machine learning classifier are further included, and the step of further training is the trained machine learning classifier. The method of claim 1, comprising training the characteristics of the tumor sample obtained from the non-trained subject and the responsiveness of the non-trained subject to treatment. 生成されたチェックポイント阻害応答性分類に基づいて治療を選択する工程を更に含む、請求項1に記載の方法。 The method of claim 1, further comprising selecting a treatment based on the generated checkpoint inhibitory responsiveness classification. 1つ又は複数のマイクロプロセッサと、
訓練した機械学習分類器、及び非訓練対象のゲノム情報を記憶するための1つ又は複数のメモリであって、訓練した機械学習分類器が、複数の訓練対象のゲノム情報、及びチェックポイント阻害を含む治療に対する複数の訓練対象のそれぞれの応答性について訓練され、複数の訓練対象のゲノム情報が、複数の訓練対象のそれぞれから得られる腫瘍プロファイルの特徴を含み、機械学習分類器が、治療に対する応答性を予測するように訓練され、非訓練対象のゲノム情報が、非訓練対象から得られる腫瘍プロファイル由来の特徴を含む、メモリと
を含むコンピュータシステムであって、
1つ又は複数のメモリが、1つ又は複数のマイクロプロセッサにより実行される場合、コンピュータシステムに、訓練した機械学習分類器を使用してチェックポイント阻害応答性分類を非訓練対象について生成させ、非訓練対象のチェックポイント阻害応答性分類を、グラフィカルユーザインターフェースを使用してレポートさせる、命令を記憶し、前記チェックポイント阻害応答性分類が、非訓練対象がチェックポイント阻害に対して応答することを予測する、コンピュータシステム。
With one or more microprocessors,
A trained machine learning classifier and one or more memories for storing non-trained genomic information, and the trained machine learning classifier can perform multiple trained genomic information and checkpoint inhibition. Trained for the responsiveness of each of the multiple training subjects to the including treatment, the genomic information of the multiple training subjects contains the features of the tumor profile obtained from each of the multiple training subjects, and the machine learning classifier responds to the treatment. A computer system in which the genomic information of a non-trained subject trained to predict sex contains memory and features derived from a tumor profile obtained from the non-trained subject.
When one or more memories are run by one or more microprocessors, the computer system is forced to generate a checkpoint inhibition responsive classification for the untrained subject using a trained machine learning classifier, and is non-trained. The checkpoint inhibition responsiveness classification of the trained subject is reported using a graphical user interface, the instruction is memorized, and the checkpoint inhibition responsiveness classification predicts that the non-trained subject responds to the checkpoint inhibition. Computer system.
非訓練対象から得られる腫瘍プロファイル由来の特徴の少なくとも一部、又は訓練対象の1人若しくは複数から得られる腫瘍プロファイル由来の特徴の少なくとも一部が、すべての変異からなる総変異頻度、非同義変異からなる総変異頻度、ベータ2ミクログロブリン(B2M)発現、プロテアソームサブユニットベータ10(PSMB10)発現、抗原ペプチドトランスミッター1(TAP1)発現、抗原ペプチド輸送体2(TAP2)発現、ヒト白血球抗原A(HLA-A)発現、主要組織適合複合体クラスI B(HLA-B)発現、主要組織適合複合体クラスI C(HLA-C)発現、主要組織適合複合体クラスII DQアルファ1(HLA-DQA1)発現、HLAクラスII組織適合抗原DRB1ベータ鎖(HLA-DRB1)発現、HLAクラスI組織適合抗原アルファ鎖E(HLA-E)発現、ナチュラルキラー細胞顆粒タンパク質7(NKG7)発現、ケモカイン様受容体(CMKLR1)発現、表面抗原分類8(CD8)を発現する細胞による腫瘍浸潤、表面抗原分類4(CD4)を発現する細胞による腫瘍浸潤、表面抗原分類19(CD19)を発現する細胞による腫瘍浸潤、グランザイムA(GZMA)発現、パーフォリン1(PRF1)発現、細胞傷害性Tリンパ球関連タンパク質4(CTLA4)発現、プログラム細胞死タンパク質1(PD1)発現、プログラム死リガンド1(PDL1)発現、プログラム細胞死1リガンド2(PDL2)発現、リンパ球活性化遺伝子3(LAG3)発現、Ig及びITIMドメインを有するT細胞免疫受容体(TIGIT)発現、表面抗原分類276(CD276)発現、ケモカイン(C-Cモチーフ)リガンド5(CCL5)、CD27発現、ケモカイン(C-X-Cモチーフ)リガンド9(CXCL9)発現、C-X-Cモチーフケモカイン受容体6(CXCR6)、インドールアミン2,3-ジオキシゲナーゼ(IDO)発現、シグナル伝達兼転写活性化因子1(STAT1)発現、3-フコシル-N-アセチル-ラクトサミン(CD15)発現、インターロイキン2受容体アルファ鎖(CD25)発現、siglec-3(CD33)、表面抗原分類39(CD39)発現、表面抗原分類118(CD118)発現、フォークヘッドボックスP3(FOXP3)発現、及び前述の2つ以上の任意の組合せからなる群から選択される、請求項15に記載のシステム。 At least some of the features derived from the tumor profile obtained from the untrained subject, or at least some of the features derived from the tumor profile obtained from one or more of the trained subjects, consist of all mutations. Total mutation frequency consisting of, beta 2 microglobulin (B2M) expression, proteasome subunit beta 10 (PSMB10) expression, antigen peptide transmitter 1 (TAP1) expression, antigen peptide transporter 2 (TAP2) expression, human leukocyte antigen A (HLA) -A) expression, major histocompatibility complex class IB (HLA-B) expression, major histocompatibility complex class IC (HLA-C) expression, major histocompatibility complex class II DQ alpha 1 (HLA-DQA1) expression, HLA class II histocompatibility antigen DRB1 beta chain (HLA-DRB1) expression, HLA class I histocompatibility antigen alpha chain E (HLA-E) expression, natural killer cell granule protein 7 (NKG7) expression, chemokine-like receptor (CMKLR1) Expression, tumor invasion by cells expressing surface antigen classification 8 (CD8), tumor invasion by cells expressing surface antigen classification 4 (CD4), tumor invasion by cells expressing surface antigen classification 19 (CD19), granzyme A ( GZMA) expression, perforin 1 (PRF1) expression, cytotoxic T lymphocyte-related protein 4 (CTLA4) expression, programmed cell death protein 1 (PD1) expression, programmed death ligand 1 (PDL1) expression, programmed cell death 1 ligand 2 (PDL2) expression, lymphocyte activation gene 3 (LAG3) expression, T cell immunoreceptor (TIGIT) expression with Ig and ITIM domains, surface antigen classification 276 (CD276) expression, chemokine (CC motif) ligand 5 (CCL5) ), CD27 expression, chemokine (CXC motif) ligand 9 (CXCL9) expression, CXC motif chemokine receptor 6 (CXCR6), indolamine 2,3-dioxygenase (IDO) expression, signaling and transcriptional activator 1 (STAT1) ) Expression, 3-fucosyl-N-acetyl-lactosamine (CD15) expression, interleukocyte 2 receptor alpha chain (CD25) expression, siglec-3 (CD33), surface antigen classification 39 (CD39) expression, surface antigen classification 118 ( Claim 1 selected from the group consisting of CD118) expression, forkhead box P3 (FOXP3) expression, and any combination of two or more described above. The system described in 5. 訓練特徴の少なくとも一部、又は非訓練特徴の少なくとも一部が、遺伝子セットを含む、請求項15に記載のシステム。 The system of claim 15, wherein at least some of the trained features, or at least some of the non-trained features, contain a gene set. 遺伝子セットが、単一サンプル遺伝子セットの濃縮解析を使用して選択された、請求項17に記載のシステム。 17. The system of claim 17, wherein the gene set was selected using a single sample gene set enrichment analysis. 機械学習分類器が、ランダムフォレストである、請求項15に記載のシステム。 The system of claim 15, wherein the machine learning classifier is a random forest. 少なくとも50,000の木が、機械学習分類器の訓練において使用される、請求項19に記載のシステム。 The system of claim 19, wherein at least 50,000 trees are used in the training of machine learning classifiers. チェックポイント阻害応答性分類が、予測スコア及び1つ又は複数の特徴識別子を含み、1つ又は複数の特徴識別子が、特徴価、特徴重要度、及び特徴重みからなる群から選択される、請求項15に記載のシステム。 Claim that the checkpoint inhibition responsiveness classification comprises a predicted score and one or more feature identifiers, the one or more feature identifiers being selected from the group consisting of feature value, feature importance, and feature weight. The system described in 15. 命令が、1つ又は複数のマイクロプロセッサにより実行される場合、グラフィカルユーザインターフェースに特徴識別子を環状扇形の各側面としてレポートさせ、環状扇形の角度が特徴重要度をレポートし、環状扇形の外半径が特徴重みをレポートし、環状扇形の色が特徴価をレポートする、請求項21に記載の方法。 When the instruction is executed by one or more microprocessors, have the graphical user interface report the feature identifier as each side of the circular sector, the angle of the circular sector reports the feature importance, and the outer radius of the circular sector. 21. The method of claim 21, wherein the feature weights are reported and the circular sector color reports the feature values. 特徴の特徴重要度が、特徴のジニ指数の減少を含む、請求項22に記載のシステム。 22. The system of claim 22, wherein the feature importance of the feature comprises a decrease in the Gini index of the feature. 命令が、1つ又は複数のマイクロプロセッサにより実行される場合、グラフィカルユーザインターフェースに、特徴の特徴重要度が閾値を超える場合かつその場合に限り、特徴の識別子をレポートさせる、請求項23に記載のシステム。 23. Claim 23, wherein the instruction is executed by one or more microprocessors and causes the graphical user interface to report the feature identifier if and only if the feature feature importance exceeds the threshold. system. 特徴の特徴重要度が、特徴の特徴重要度の2乗が0.1を超えない場合、閾値を超えない、請求項24に記載のシステム。 24. The system of claim 24, wherein the feature importance of the feature does not exceed a threshold if the square of the feature importance of the feature does not exceed 0.1. 命令が、1つ又は複数のマイクロプロセッサにより実行される場合、グラフィカルユーザインターフェースに、各環状扇形の内弧、及び環状扇形の内弧を含む円をレポートさせる、請求項24に記載のシステム。 24. The system of claim 24, wherein when the instruction is executed by one or more microprocessors, the graphical user interface is made to report an inner arc of each circular sector and a circle containing the inner arc of the circular sector. 命令が、1つ又は複数のマイクロプロセッサにより実行される場合、コンピュータシステムに機械学習分類器を更に訓練させ、更に訓練させることが、訓練した機械学習分類器を、非訓練対象から得られる腫瘍試料の特徴、及び治療に対する非訓練対象の応答性について訓練することを含む、請求項15に記載のシステム。 When the instruction is executed by one or more microprocessors, the computer system may be further trained and further trained to train the machine learning classifier, a tumor sample obtained from an untrained subject. 15. The system of claim 15, comprising training the characteristics of the non-trained subject to treatment and responsiveness to the treatment. 免疫チェックポイント応答性の分類のための機械学習に基づく分類器であって、
多数のプロセッサ上で実行し、免疫チェックポイント阻害治療に対する非訓練対象の応答性を予測するように訓練される、機械学習に基づく分類器であって、
機械学習に基づく分類器が、機械学習に基づく分類器に、複数の訓練対象のゲノム情報、及び治療に対する複数の訓練対象のそれぞれの応答性を入力することにより訓練され、複数の訓練対象のゲノム情報が、複数の各訓練対象から得られる腫瘍プロファイルの特徴を含む、機械学習に基づく分類器と、
機械学習に基づく分類器に非訓練対象のゲノム情報を入力する入力プロセッサであって、非訓練対象のゲノム情報が、非訓練対象から得られる腫瘍プロファイル由来の特徴を含み、機械学習に基づく分類器が、
非訓練対象についてチェックポイント阻害応答性分類を生成するように構成されており、チェックポイント阻害応答性分類が、対象がチェックポイント阻害治療に対して応答することを予測する、入力プロセッサと、
チェックポイント阻害応答性分類をレポートする出力プロセッサと
を含む、機械学習に基づく分類器。
A machine learning-based classifier for the classification of immune checkpoint responsiveness
A machine learning-based classifier that runs on a number of processors and is trained to predict the responsiveness of untrained subjects to immune checkpoint inhibition therapy.
A machine learning-based classifier is trained by inputting the genomic information of multiple training targets and the responsiveness of each of the multiple training targets to treatment into the machine learning-based classifier, and the genomes of multiple training targets. With a machine learning-based classifier, the information contains features of the tumor profile obtained from each of the multiple training subjects.
A machine learning-based classifier that is an input processor that inputs untrained genomic information into a machine-learning-based classifier, in which the non-trained genomic information contains features derived from tumor profiles obtained from the non-trained subject. But,
With an input processor, which is configured to generate a checkpoint inhibitory responsiveness classification for untrained subjects, the checkpoint inhibitory responsiveness classification predicts that the subject will respond to checkpoint inhibitory therapy.
A machine learning-based classifier that includes an output processor that reports checkpoint inhibition responsiveness classification.
チェックポイント阻害応答性分類が、予測スコア及び複数の識別子を含む、請求項28に記載の機械学習に基づく分類器。 The machine learning based classifier according to claim 28, wherein the checkpoint inhibition responsiveness classification comprises a predicted score and a plurality of identifiers.
JP2019566271A 2017-12-01 2018-12-03 Systems and methods for evaluating drug efficacy Active JP7429539B2 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762593802P 2017-12-01 2017-12-01
US62/593,802 2017-12-01
PCT/US2018/063658 WO2019109089A1 (en) 2017-12-01 2018-12-03 Systems and methods for assessing drug efficacy

Publications (2)

Publication Number Publication Date
JP2021505976A true JP2021505976A (en) 2021-02-18
JP7429539B2 JP7429539B2 (en) 2024-02-08

Family

ID=64734247

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019566271A Active JP7429539B2 (en) 2017-12-01 2018-12-03 Systems and methods for evaluating drug efficacy

Country Status (11)

Country Link
EP (1) EP3616205A1 (en)
JP (1) JP7429539B2 (en)
KR (1) KR20200093437A (en)
CN (1) CN110678930B (en)
AU (1) AU2018375214A1 (en)
BR (1) BR112019024537A2 (en)
CA (1) CA3061736A1 (en)
MX (1) MX2019014285A (en)
SG (1) SG11201910041WA (en)
WO (1) WO2019109089A1 (en)
ZA (1) ZA201907298B (en)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111640508B (en) * 2020-05-28 2023-08-01 上海市生物医药技术研究院 Method and application of pan-tumor targeted drug sensitivity state assessment model constructed based on high-throughput sequencing data and clinical phenotypes
CN111863126B (en) * 2020-05-28 2024-03-26 上海市生物医药技术研究院 Method for constructing colorectal tumor state evaluation model and application
CN111755073B (en) * 2020-05-31 2022-11-15 复旦大学 Transcriptome-based PD-1 therapy treatment effect prediction system
CN113095440B (en) * 2020-09-01 2022-05-17 电子科技大学 Training data generation method based on metalearner and causal effect heterogeneous reaction difference estimation method
EP4385024A1 (en) * 2021-08-11 2024-06-19 Oncohost Ltd Predicting patient response
CN114694745A (en) * 2022-03-24 2022-07-01 至本医疗科技(上海)有限公司 Method, apparatus, computer device and storage medium for predicting an immune efficacy
WO2023230321A1 (en) * 2022-05-27 2023-11-30 Cofactor Genomics, Inc. Machine learning systems and methods for gene set enrichment analysis and scoring

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015184061A2 (en) * 2014-05-28 2015-12-03 Dana-Farber Cancer Institute, Inc. Activating jak kinase biomarkers predictive of anti-immune checkpoint inhibitor response
WO2017167942A1 (en) * 2016-03-31 2017-10-05 Pamgene Bv Method for predicting the response of melanoma patients to a medicament
WO2017201165A1 (en) * 2016-05-17 2017-11-23 Genecentric Diagnostics, Inc. Methods for subtyping of lung adenocarcinoma

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110106740A1 (en) * 2002-05-24 2011-05-05 University Of South Florida Tissue classification method for diagnosis and treatment of tumors
CN104573410A (en) * 2015-01-20 2015-04-29 合肥工业大学 Cancer chemosensitivity prediction technique based on molecular subnet and random forest classifier

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015184061A2 (en) * 2014-05-28 2015-12-03 Dana-Farber Cancer Institute, Inc. Activating jak kinase biomarkers predictive of anti-immune checkpoint inhibitor response
WO2017167942A1 (en) * 2016-03-31 2017-10-05 Pamgene Bv Method for predicting the response of melanoma patients to a medicament
WO2017201165A1 (en) * 2016-05-17 2017-11-23 Genecentric Diagnostics, Inc. Methods for subtyping of lung adenocarcinoma
JP2019516407A (en) * 2016-05-17 2019-06-20 ジーンセントリック セラピューティクス, インコーポレイテッド Methods for subtyping lung adenocarcinoma

Also Published As

Publication number Publication date
CN110678930B (en) 2023-06-20
SG11201910041WA (en) 2019-11-28
JP7429539B2 (en) 2024-02-08
CN110678930A (en) 2020-01-10
MX2019014285A (en) 2020-01-27
WO2019109089A1 (en) 2019-06-06
EP3616205A1 (en) 2020-03-04
ZA201907298B (en) 2023-06-28
KR20200093437A (en) 2020-08-05
BR112019024537A2 (en) 2020-06-09
RU2019135697A (en) 2022-01-04
CA3061736A1 (en) 2019-06-06
AU2018375214A1 (en) 2019-12-12
NZ759413A (en) 2022-03-25

Similar Documents

Publication Publication Date Title
JP7429539B2 (en) Systems and methods for evaluating drug efficacy
JP7408534B2 (en) Systems and methods for generating, visualizing, and classifying molecular functional profiles
Smith et al. Endogenous retroviral signatures predict immunotherapy response in clear cell renal cell carcinoma
Karasaki et al. An immunogram for the cancer-immunity cycle: towards personalized immunotherapy of lung cancer
Saini et al. Human endogenous retroviruses form a reservoir of T cell targets in hematological cancers
Eckstein et al. Cytotoxic T-cell-related gene expression signature predicts improved survival in muscle-invasive urothelial bladder cancer patients after radical cystectomy and adjuvant chemotherapy
Dumeaux et al. Peripheral blood cells inform on the presence of breast cancer: A population‐based case–control study
Stein et al. The varied distribution and impact of RAS codon and other key DNA alterations across the translocation cyclin D subgroups in multiple myeloma
Yi et al. MHC-II signature correlates with anti-tumor immunity and predicts anti-PD-L1 response of bladder cancer
CA3227993A1 (en) Predicting patient response
Zhao et al. Identification of immune cell infiltration landscape and their prognostic significance in uveal melanoma
Kim et al. MHC II immunogenicity shapes the neoepitope landscape in human tumors
US20230245724A9 (en) Systems and methods for assessing drug efficacy
Bendall et al. Specific human endogenous retroviruses predict metastatic potential in uveal melanoma
US20230160009A1 (en) Predictive response biomarker discovery process
Xu et al. Ferroptosis-related lncRNA signature predicts prognosis and immunotherapy efficacy in cutaneous melanoma
Liu et al. Landscape of immune microenvironment in epithelial ovarian cancer and establishing risk model by machine learning
Naulaerts et al. Immunogenomic, single-cell and spatial dissection of CD8+ T cell exhaustion reveals critical determinants of cancer immunotherapy
Zhang et al. Pan-cancer evaluation of regulated cell death to predict overall survival and immune checkpoint inhibitor response
Yang et al. Knockout of immunotherapy prognostic marker genes eliminates the effect of the anti-PD-1 treatment
RU2797170C9 (en) Systems and methods for assessing the efficiency of a medicinal product
RU2797170C2 (en) Systems and methods for assessing the efficiency of a medicinal product
NZ759413B2 (en) Systems and methods for assessing drug efficacy
Rendeiro et al. Chromatin mapping and single-cell immune profiling define the temporal dynamics of ibrutinib drug response in chronic lymphocytic leukemia
Xiong et al. Prognostic Value of N6-Methyladenosine-Related lncRNAs in Early-Stage Colorectal Cancer: Association With Immune Cell Infiltration and Chemotherapeutic Drug Sensitivity

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221128

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230424

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230719

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20230925

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231110

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20231120

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240122

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240129

R150 Certificate of patent or registration of utility model

Ref document number: 7429539

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150