JP2021501422A - Temozolomide reaction predictors and methods - Google Patents

Temozolomide reaction predictors and methods Download PDF

Info

Publication number
JP2021501422A
JP2021501422A JP2020524174A JP2020524174A JP2021501422A JP 2021501422 A JP2021501422 A JP 2021501422A JP 2020524174 A JP2020524174 A JP 2020524174A JP 2020524174 A JP2020524174 A JP 2020524174A JP 2021501422 A JP2021501422 A JP 2021501422A
Authority
JP
Japan
Prior art keywords
information
mgmt
methylation
rnaseq
tumor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020524174A
Other languages
Japanese (ja)
Inventor
ダブリュー. セットー,クリストファー
ダブリュー. セットー,クリストファー
ヴィーラパネニ,サイヒサ
ベンツ,スティーブン
Original Assignee
ナントミクス,エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ナントミクス,エルエルシー filed Critical ナントミクス,エルエルシー
Publication of JP2021501422A publication Critical patent/JP2021501422A/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Genetics & Genomics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical & Material Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Analytical Chemistry (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Physiology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

企図されるシステム及び方法は、テモゾロミドに対する反応予測モデルを使用し、このモデルは、RNAseq情報、タンパク質定量情報、及びメチル化情報に基づき、且つ少なくとも85%の予測確度を有する。The system and method intended uses a reaction prediction model for temozolomide, which is based on RNAseq information, protein quantification information, and methylation information and has at least 85% predictive accuracy.

Description

本願は、2017年10月30日出願の出願番号62/579,127、2018年9月5日出願の出願番号62/727,245の同時係属米国仮出願(両方ともその全体が本明細書に組み込まれる)に基づく優先権を主張する。 This application is a co-pending US provisional application with application numbers 62 / 579,127 filed on October 30, 2017 and application numbers 62/727,245 filed on September 5, 2018, both of which are herein in their entirety. Claim priority based on (incorporated).

本発明の分野は、テモゾロミドに対する患者の薬剤反応を予測するシステム及び方法、とりわけ、患者が癌と診断される場合である。 The field of the present invention is a system and method for predicting a patient's drug response to temozolomide, especially when the patient is diagnosed with cancer.

背景の説明は、本発明の理解に役立ちうる情報を含む。本明細書に提供されるいずれの情報も、本特許請求の発明の先行技術又は関連技術であると認められたわけではなく、具体的又は黙示的に参照されたいずれの刊行物も、先行技術であると認められたわけではない。 The background description includes information that may be helpful in understanding the present invention. None of the information provided herein has been found to be prior art or related art of the claimed invention, and any specific or implied reference publication is in prior art. It was not recognized as being.

本明細書に記載の刊行物及び特許出願はすべて、各個別の刊行物又は特許出願があたかも参照により具体的且つ個別的に示されて組み込まれたのと同程度に参照により組み込まれる。組み込まれた参照文献中の用語の定義又は使用が本明細書に提供されたその用語の定義と矛盾又は対立する場合、本明細書に提供されたその用語の定義が適用され、参照文献中のその用語の定義は適用されない。 All publications and patent applications described herein are incorporated by reference to the same extent that each individual publication or patent application is specifically and individually indicated and incorporated by reference. If the definition or use of a term in an incorporated reference conflicts with or conflicts with the definition of that term provided herein, the definition of that term provided herein applies and is incorporated into the reference. The definition of the term does not apply.

テモゾロミド(TMZ)は、膠芽細胞腫及び黒色腫の標準的治療として使用される化学療法剤であり、最近、転移結腸直腸癌(mCRC)の患者で限られてはいるが有望な活性が示された。TMZは、DNAのグアニン残基のN−7位又はO−6位に対してアルキル化/メチル化活性を有する作用剤であり、多くの場合、感受性細胞の細胞死をトリガーする。しかしながら、各種DNA損傷修復酵素とりわけO−6−メチルグアニン−DNAメチルトランスフェラーゼ(MGMT)は、腫瘍細胞の少なくともいくつかでテモゾロミドの効果を打ち消すおそれがある。より最近では、MGMT遺伝子のエピジェネティックサイレンシングが報告され、MGMT遺伝子のエピジェネティックサイレンシングを有する腫瘍細胞は、TMZによる死滅に対してより感受性のあることが見いだされた。 Temozolomide (TMZ) is a chemotherapeutic agent used as the standard treatment for glioblastoma and melanoma, and has recently shown limited but promising activity in patients with metastatic colorectal cancer (mCRC). Was done. TMZ is an agent having an alkylating / methylating activity on the N-7 or O-6 position of a guanine residue in DNA, and often triggers cell death of susceptible cells. However, various DNA damage repair enzymes, especially O-6-methylguanine-DNA methyltransferase (MGMT), can counteract the effects of temozolomide in at least some of the tumor cells. More recently, epigenetic silencing of the MGMT gene has been reported, and tumor cells with epigenetic silencing of the MGMT gene have been found to be more susceptible to TMZ killing.

したがって、MGMTはTMZの耐性マーカーとみなされる。通常、腫瘍のMGMT発現ステータスは、メチル−BEAMing(MB)として知られるディジタルポリメラーゼ連鎖反応(PCR)法により評価可能であり、>60%MGMTメチル化のカットオフはTMZの奏効を予測する。他の一アプローチでは、質量分析(MS)プロテオミック解析は、ホルマリン固定パラフィン包埋(FFPE)組織切片においてMGMTタンパク質及び他の利用可能なタンパク質バイオマーカーを客観的に定量可能である。この場合、200amol/μg(アッセイの検出限界に基づいてあらかじめ規定される)のMGMTタンパク質カットオフは、TMZで治療されるmCRC患者において奏効の予測因子となる。MGMTタンパク質の量は、MGMTメチル化ステータスにも相関しうる。 Therefore, MGMT is considered a TMZ resistance marker. Usually, the MGMT expression status of tumors can be evaluated by the digital polymerase chain reaction (PCR) method known as methyl-BEAMing (MB), and a cutoff of> 60% MGMT methylation predicts TMZ response. In another approach, mass spectrometry (MS) proteomic analysis can objectively quantify MGMT proteins and other available protein biomarkers in formalin-fixed paraffin-embedded (FFPE) tissue sections. In this case, a 200 amol / μg MGMT protein cutoff (predetermined based on the detection limit of the assay) is a predictor of response in TMZ-treated mCRC patients. The amount of MGMT protein can also correlate with MGMT methylation status.

TMZ治療を受けたmCRC患者のうち、腫瘍が低レベル又は検出不能レベルのMGMTタンパク質を発現したものは、より高いMGMTタンパク質レベルを有するそのカウンターパートよりも長いmPFSを有していた。ASCO Annual Meeting,Chicago,Illinois(2017年6月2〜6日)のアブストラクト#11601に提示されたように、質量分析により定量されるMGMTタンパク質発現とMBによるMGMTメチル化ステータスとの間に80%の相関が観測された。定量プロテオミクスは、FFPE腫瘍サンプルにおいてMGMTタンパク質を客観的に測定し、TMZに対するレスポンダー9名中9名をレトロスペクティブに同定した。ディジタルPCRメチル化アッセイ(メチル−BEAMing)は、TMZに対するレスポンダー8名中7名をレトロスペクティブに同定した。したがって、研究者らは、MGMTの定量プロテオミック解析がTMZ療法のmCRC患者の選択に潜在的に使用可能であると結論付けた。 Among mCRC patients treated with TMZ, those whose tumors expressed low or undetectable levels of MGMT protein had longer mPFS than their counterparts with higher MGMT protein levels. 80% between MGMT protein expression quantified by mass spectrometry and MGMT methylation status by MB, as presented in Abstract # 11601 of ASCO Annual Meeting, Chicago, Illinois (June 2-6, 2017). Correlation was observed. Quantitative proteomics objectively measured MGMT protein in FFPE tumor samples and retrospectively identified 9 of 9 responders to TMZ. The digital PCR methylation assay (methyl-BEAMing) retrospectively identified 7 of 8 responders to TMZ. Therefore, the researchers concluded that quantitative proteomic analysis of MGMT could potentially be used to select patients with TMZ therapy mCRC.

しかしながら、かかるアプローチは、レトロスペクティブ方式でのみプロテオミック解析及びメチル化解析とみなされた。さらに、質量分析の検出限界及びメチル化検出の欠損可能性は、潜在的にレスポンダー解析の確度をさらに低減する。実際に、質量分析とメチル化解析との間でMGMTとの反応関連性の一致は約80%にすぎないことが観測された。さらに、著者らは、臨床上有用な予測確度で反応予測を支援又は示唆する可能性のあるいずれの解析選択肢も提示しなかった。 However, such an approach was considered proteomic and methylation analysis only in the retrospective manner. In addition, the detection limits of mass spectrometry and the potential for deficiencies in methylation detection potentially further reduce the accuracy of responder analysis. In fact, it was observed that there was only about 80% agreement on the reaction association with MGMT between mass spectrometry and methylation analysis. In addition, the authors did not present any analytical options that could support or suggest response prediction with clinically useful predictive accuracy.

したがって、特定の薬剤反応を予測する各種システム及び方法が当技術分野で公知であるとしても、高信頼度で薬剤の単純且つロバストな治療予測を可能にするとともに患者特異的に治療反応の予測を可能にするシステム及び方法の必要性が残っている。 Therefore, even if various systems and methods for predicting a specific drug response are known in the art, it enables highly reliable, simple and robust treatment prediction of the drug, and predicts the treatment response in a patient-specific manner. There remains a need for systems and methods that enable it.

本発明の主題は、患者の固形腫瘍の治療においてテモゾロミドに対する治療反応を予測する各種デバイス、システム、及び方法に関する。本発明の主題の一態様では、本発明者らは、患者においてテモゾロミドに対する治療反応を予測する方法を企図する。本方法は、患者の腫瘍からRNAseq情報、タンパク質定量情報、及びメチル化情報を提供する工程と、反応予測モデルによりテモゾロミドに対する反応予測を計算する他の一工程と、を含み、反応予測モデルは、RNAseq情報、タンパク質定量情報、及びメチル化情報を使用する。 The subject of the present invention relates to various devices, systems, and methods for predicting a therapeutic response to temozolomide in the treatment of solid tumors in patients. In one aspect of the subject matter of the present invention, the inventors contemplate a method of predicting a therapeutic response to temozolomide in a patient. The method includes a step of providing RNAseq information, protein quantification information, and methylation information from a patient's tumor and another step of calculating a reaction prediction for temozolomide by a reaction prediction model. RNAseq information, protein quantification information, and methylation information are used.

最も好ましくは、反応予測モデルはK最近傍アプローチを使用し、且つRNAseq情報、タンパク質定量情報、及びメチル化情報はサブグループ化される。たとえば、RNAseq情報は3.5のlog2(TPM+1)カットオフ値を用いてサブグループ化しうるし、タンパク質定量情報は200amol/mLのカットオフ値を用いてサブグループ化しうるし、且つ/又はメチル化情報は60%プロモーターCpGメチル化のカットオフ値を用いてサブグループ化される。最も典型的には、反応予測モデルは少なくとも80%又は少なくとも85%の予測確度を有する。 Most preferably, the reaction prediction model uses the K-nearest neighbor approach, and RNAseq information, protein quantification information, and methylation information are subgrouped. For example, RNAseq information can be subgrouped using a log2 (TPM + 1) cutoff value of 3.5, protein quantification information can be subgrouped using a cutoff value of 200 amol / mL, and / or methylation information can be subgrouped. It is subgrouped using the cutoff value of 60% promoter CpG methylation. Most typically, the reaction prediction model has a prediction accuracy of at least 80% or at least 85%.

RNAseq情報、タンパク質定量情報、及びメチル化情報は、FFPEサンプル又はフレッシュ腫瘍サンプルから提供され、且つ腫瘍は固形腫瘍(たとえば、転移結腸癌、膠芽細胞腫、又は黒色腫)であることが、さらに企図される。 RNAseq information, protein quantification information, and methylation information are provided from FFPE or fresh tumor samples, and the tumor may be a solid tumor (eg, metastatic colon cancer, glioblastoma, or melanoma). It is planned.

本発明の主題の他の一態様は、腫瘍を有する患者の治療方法を含む。本方法は、患者の腫瘍(たとえば固形腫瘍)からRNAseq情報、タンパク質定量情報、及びメチル化情報を提供する工程と、反応予測モデルによりテモゾロミドに対する反応確率を計算する工程と、を含み、反応予測モデルは、RNAseq情報、タンパク質定量情報、及びメチル化情報を使用する。次いで、本方法は、>0.5のテモゾロミド反応確率を有する患者にテモゾロミドを投与する工程を続いて行う。好ましくは、反応予測モデルはK最近傍アプローチを使用し、且つ/又は反応予測モデルは少なくとも85%の予測確度を有する。 Another aspect of the subject matter of the present invention includes a method of treating a patient having a tumor. The method includes a step of providing RNAseq information, protein quantification information, and methylation information from a patient's tumor (for example, a solid tumor) and a step of calculating the reaction probability to temozolomide by a reaction prediction model, and includes a reaction prediction model. Uses RNAseq information, protein quantification information, and methylation information. The method is then followed by the step of administering temozolomide to a patient with a temozolomide reaction probability of> 0.5. Preferably, the reaction prediction model uses the K-nearest neighbor approach and / or the reaction prediction model has a prediction accuracy of at least 85%.

いくつかの実施形態では、RNAseq情報、タンパク質定量情報、及びメチル化情報はサブグループ化される。好ましくは、RNAseq情報は3.5のlog2(TPM+1)カットオフ値を用いてサブグループ化され、且つ/又はタンパク質定量情報は200amol/mLのカットオフ値を用いてサブグループ化され、且つ/又はメチル化情報は60%プロモーターCpGメチル化のカットオフ値を用いてサブグループ化される。 In some embodiments, RNAseq information, protein quantification information, and methylation information are subgrouped. Preferably, RNAseq information is subgrouped with a log2 (TPM + 1) cutoff value of 3.5 and / or protein quantification information is subgrouped with a cutoff value of 200 amol / mL and / or. Methylation information is subgrouped using the 60% promoter CpG methylation cutoff value.

いくつかの実施形態では、RNAseq情報、タンパク質定量情報、及びメチル化情報は、FFPEサンプル又はフレッシュ腫瘍サンプルから提供される。いくつかの実施形態では、腫瘍は、転移結腸癌、膠芽細胞腫、又は黒色腫である。 In some embodiments, RNAseq information, protein quantification information, and methylation information are provided from FFPE samples or fresh tumor samples. In some embodiments, the tumor is metastatic colon cancer, glioblastoma, or melanoma.

本発明の主題の各種目的、特徴、態様、及び利点は、添付の図面と併せて好ましい実施形態の以下の詳細な説明から明らかになるであろう。 The various objectives, features, aspects, and advantages of the subject matter of the present invention will become apparent from the following detailed description of preferred embodiments in conjunction with the accompanying drawings.

実験研究に使用したサンプル及びアッセイを示す。The samples and assays used in the experimental studies are shown. (図2A)MGMTタンパク質ステータス別の及び(図2B)MGMTプロモーター高メチル化ステータス別のTMZ治療患者(n=41)間における腫瘍体積の(ベースラインからの)パーセント変化のグラフを示す。FIG. 2A shows a graph of the percentage change (from baseline) in tumor volume between TMZ-treated patients (n = 41) by MGMT protein status and (FIG. 2B) MGMT promoter hypermethylation status. TMZ治療患者間における腫瘍体積の(ベースラインからの)パーセント変化のグラフを示す。FIG. 3 shows a graph of percentage changes (from baseline) in tumor volume between TMZ treated patients. MGMTタンパク質発現レベル別のTMZ治療を受けた転移結腸直腸癌患者の無進行生存(PFS、図4A)及び全生存(OS、図4B)のグラフを示す。FIG. 3 shows graphs of progressionless survival (PFS, FIG. 4A) and overall survival (OS, FIG. 4B) of patients with metastatic colorectal cancer who received TMZ treatment by MGMT protein expression level. MGMTメチル化ステータスにより層別化されたTMZ治療を受けた転移結腸直腸癌患者のPFS(図5A)及びOS(図5B)のグラフを示す。FIG. 5 shows a graph of PFS (FIG. 5A) and OS (FIG. 5B) of patients with metastatic colorectal cancer who received TMZ treatment stratified by MGMT methylation status. RNA−seq解析によるTMZ治療を受けた転移結腸直腸癌患者のPFS(図6A)及びOS(図6B)のグラフを示す。The graph of PFS (FIG. 6A) and OS (FIG. 6B) of the metastatic colorectal cancer patient who received TMZ treatment by RNA-seq analysis is shown. MGMTタンパク質発現レベル別のTMZ治療を受けた転移結腸直腸癌患者のグラフを示す。The graph of the metastatic colorectal cancer patient who received TMZ treatment by the MGMT protein expression level is shown. RNAseqデータのカットオフ値を模式的に例示するグラフである。It is a graph which schematically exemplifies the cutoff value of RNAseq data. RNAseq値とプロテオミック値との間の一致を模式的に例示するグラフである。It is a graph which schematically exemplifies the agreement between the RNAseq value and the proteomic value. RNAseq値とプロテオミック値との間の一致を模式的に例示するグラフである。It is a graph which schematically exemplifies the agreement between the RNAseq value and the proteomic value. MGMTタンパク質の量とMGMTメチル化との間の一致の棒グラフを示す。A bar graph of the match between the amount of MGMT protein and MGMT methylation is shown. MGMTタンパク質レベルサブグループに対してPFS(無進行生存)及びOS(全生存)を描いたグラフである。FIG. 5 is a graph depicting PFS (progressive survival) and OS (survival) for the MGMT protein level subgroup. MGMT RNAseqレベルサブグループに対してPFS(無進行生存)を描いたグラフである。FIG. 5 is a graph depicting PFS (progressive survival) for the MGMT RNAseq level subgroup. MGMTサブグループの一組合せに対してPFS(無進行生存)を描いたグラフである。It is a graph which drew PFS (progressive survival) for one combination of MGMT subgroups. MGMTサブグループの他の一組合せに対してPFS(無進行生存)及びOS(全生存)を描いたグラフである。FIG. 5 is a graph depicting PFS (progressive survival) and OS (survival) for the other combination of MGMT subgroups. 各種分類器に対する各種入力変数に基づいてテモゾロミド反応予測確度を描いたグラフである。It is a graph which drew the temozolomide reaction prediction accuracy based on various input variables for various classifiers. 実施例2のリーブペアアウト交差検証による予測モデルの平均確度のグラフを示す。The graph of the average accuracy of the prediction model by the leave pair-out cross-validation of Example 2 is shown. MGMTアセスメント法グループ別の58予測モデリングストラテジーに対する未知サンプルの平均予測確度のグラフを示す。グループは、実施例2の平均確度により左から右に順序付けられる。A graph of the mean predictive accuracy of unknown samples for 58 predictive modeling strategies by MGMT assessment method group is shown. The groups are ordered from left to right by the average accuracy of Example 2. 各種タイプのデータから薬剤反応を予測するマシンラーニングの模式図を示す。A schematic diagram of machine learning for predicting drug reaction from various types of data is shown. 予測モデルの回帰及び分類のパイプラインのフローチャートを示す。The flow chart of the regression and classification pipeline of the prediction model is shown. 各種回帰モデルにより決定された全発現とMGMTタンパク質との関係のグラフを示す。The graph of the relationship between the total expression and the MGMT protein determined by various regression models is shown. 各種回帰モデルにより決定されたMGMTタンパク質とMGMT遺伝子との関係のグラフを示す。The graph of the relationship between MGMT protein and MGMT gene determined by various regression models is shown. メチル化値を用いた確度値のグラフを示す。The graph of the accuracy value using the methylation value is shown. メチル化値を用いた確度値の他の一グラフを示す。Another graph of the accuracy value using the methylation value is shown. 予測モデルのトレーニングデータセット及び試験データセットのヒートマップを示す。The heat map of the training data set and the test data set of the prediction model is shown.

本発明者は、このたび、腫瘍の(好ましくはサブグループ化された)RNAseq情報とタンパク質定量情報とプロモーターメチル化情報との組合せに基づくモデルを用いて予想外に高い確度で臨床上有用なテモゾロミド予測モデルを確立可能であることを発見した。とくに好ましい態様では、モデルはK最近傍アプローチに基づく。 The inventor has now used a model based on a combination of tumor (preferably subgrouped) RNAseq information, protein quantification information and promoter methylation information to provide unexpectedly high accuracy and clinically useful temozolomide. We found that a predictive model could be established. In a particularly preferred embodiment, the model is based on the K-nearest neighbor approach.

MGMTタンパク質レベル又はプロモーターメチル化とテモゾロミド反応との間の事後関連性は一般に知られているが、かかる関連性は必ずしも予測されるとは限らず、もちろん高い確度で予測されることはないことを認識すべきである。本発明者は、このたび、患者の腫瘍から定量された且つ好ましくはサブグループ化されたパラメーター:(1)RNAseq情報とくにTPM単位で測定されるものと(2)タンパク質定量情報とくに質量分析により測定されるものと(3)メチル化情報とくにMGMTプロモーター領域で測定されるものとの組合せにより患者治療反応を予測するきわめて正確な予測モデルを確立可能であることを観測した。 Although posterior associations between MGMT protein levels or promoter methylation and temozolomide reactions are generally known, such associations are not always predicted and, of course, not with high accuracy. You should be aware. The present inventor has now quantified and preferably subgrouped parameters from a patient's tumor: (1) RNAseq information, especially those measured in TPM units and (2) protein quantification information, especially measured by mass analysis. It was observed that it is possible to establish an extremely accurate prediction model for predicting the patient's therapeutic response by combining (3) methylation information, especially that measured in the MGMT promoter region.

したがって、本発明者は、腫瘍を有する患者においてテモゾロミドに対する治療反応を予測する方法を企図する。本方法は、患者の腫瘍からRNAseq情報とタンパク質定量情報とメチル化情報とを提供する工程を含む。次いで、RNAseq情報とタンパク質定量情報とメチル化情報とを考慮に入れた反応予測モデルを用いて、テモゾロミドに対する反応予測を確立する。容易に分かるであろうが、情報のタイプは、サンプルの性質を少なくともある程度決定するであろう。 Therefore, the present inventor contemplates a method of predicting a therapeutic response to temozolomide in patients with tumors. The method comprises providing RNAseq information, protein quantification information and methylation information from a patient's tumor. Next, a reaction prediction model that takes into account RNAseq information, protein quantification information, and methylation information is used to establish a reaction prediction for temozolomide. As will be readily apparent, the type of information will determine the nature of the sample, at least to some extent.

本明細書で用いられる場合、「腫瘍」という用語は、人体の1つ以上の解剖学的位置に配置されうる又は見いだされうる1つ以上の癌細胞、癌組織、悪性腫瘍細胞、又は悪性腫瘍組織を意味し、それらと同義的に用いられる。本明細書で用いられる「患者」という用語は、病態(たとえば癌)を有すると診断された者さらには病態の検出又は同定を目的として検査及び/又は試験を受けている者の両方を含むことに留意すべきである。そのため、腫瘍を有する患者とは、癌を有すると診断された者さらには癌を有することが疑われる者の両方を意味する。本明細書で用いられる場合、「provide(提供する)」又は「providing(提供する)」という用語は、製造する、生成する、配置する、使用可能にする、移動する、又は即使用可能にするいずれかの行為を意味及び包含する。 As used herein, the term "tumor" refers to one or more cancer cells, cancer tissues, malignant tumor cells, or malignant tumors that can be located or found in one or more anatomical locations in the human body. Means tissues and is used synonymously with them. As used herein, the term "patient" includes both those who have been diagnosed with a condition (eg, cancer) and who are being tested and / or tested for the purpose of detecting or identifying the condition. Should be noted. Therefore, a patient with a tumor means both those who have been diagnosed with cancer and those who are suspected of having cancer. As used herein, the terms "provide" or "providing" make, produce, place, make available, move, or make ready to use. Meaning and including any act.

したがって、本発明の主題のほとんどの態様では、すべての関連情報を得るために腫瘍サンプルが使用されるであろう。患者の腫瘍サンプル(腫瘍細胞若しくは腫瘍組織)(又は比較として患者若しくは健常者の健常組織)を得るいずれかの好適な方法が企図される。最も典型的には、腫瘍サンプルは、生検を介して患者から得ることが可能であり(液体生検を含めて、又は手術や独立生検手順などの際に組織切除を介して得られる)、フレッシュな状態でありうるか又は組織のオミクスデータを得るためのさらなるプロセスまで処理した状態(たとえば凍結したホルマリン固定パラフィン包埋(FFPE)サンプルなど)でありうる。たとえば、腫瘍細胞又は腫瘍組織は、新鮮な状態又は凍結した状態でありうる。他の例では、腫瘍細胞又は腫瘍組織は、細胞/組織の抽出物の形態でありうる。いくつかの実施形態では、腫瘍サンプルは、単一の組織若しくは解剖学的領域又は複数の異なる組織若しくは解剖学的領域から得られうる。たとえば、転移乳癌組織は、患者の乳房から、さらには転移した乳癌組織に対しては他の器官(たとえば、肝臓、脳、リンパ節、血液、肺など)から得ることが可能である。好ましくは、患者の健常組織若しくは対応正常部組織(たとえば患者の非癌性乳房組織)を得ることが可能であるか、又は比較として類似の方法を介して健常者(患者以外)の健常組織を得ることも可能である。 Therefore, in most aspects of the subject matter of the invention, tumor samples will be used to obtain all relevant information. Any suitable method of obtaining a patient's tumor sample (tumor cells or tumor tissue) (or, by comparison, healthy tissue of the patient or healthy person) is contemplated. Most typically, tumor samples can be obtained from the patient via biopsy (including liquid biopsy or via tissue resection during surgery, independent biopsy procedures, etc.). It can be in a fresh state or in a state that has been processed to further processes to obtain tissue omics data (eg, frozen formalin-fixed paraffin-embedded (FFPE) samples, etc.). For example, tumor cells or tissue can be fresh or frozen. In another example, the tumor cell or tissue can be in the form of a cell / tissue extract. In some embodiments, the tumor sample can be obtained from a single tissue or anatomical region or from multiple different tissues or anatomical regions. For example, metastatic breast cancer tissue can be obtained from the patient's breast and, for metastatic breast cancer tissue, from other organs (eg, liver, brain, lymph nodes, blood, lungs, etc.). Preferably, it is possible to obtain a healthy or corresponding normal tissue of the patient (eg, the non-cancerous breast tissue of the patient), or a healthy tissue of a healthy person (other than the patient) through a similar method for comparison. It is also possible to obtain.

いくつかの実施形態では、腫瘍サンプルは、関連期間にわたり腫瘍サンプルのいずれかの変化を決定するために複数の時点で患者から取得可能である。たとえば、腫瘍サンプル(又は腫瘍が疑われるサンプル)は、サンプルが癌性として決定又は診断される前及びその後に得られうる。他の一例では、腫瘍サンプル(又は腫瘍が疑われるサンプル)は、1回又は一連の抗腫瘍治療(たとえば、放射線療法、化学療法、免疫療法など)の前、その時、及び/又はその後(たとえば終了時など)に得られうる。さらに他の一例では、腫瘍サンプル(又は腫瘍が疑われるサンプル)は、新たな転移した組織又は細胞を同定する際に腫瘍の進行中に得られうる。 In some embodiments, the tumor sample is available from the patient at multiple time points to determine any changes in the tumor sample over the relevant period. For example, a tumor sample (or a sample suspected of having a tumor) can be obtained before and after the sample is determined or diagnosed as cancerous. In another example, a tumor sample (or a sample suspected of having a tumor) is before, then, and / or after (eg, termination, eg, radiation therapy, chemotherapy, immunotherapy, etc.) a single or series of antitumor treatments. Can be obtained at times). In yet another example, a tumor sample (or a sample suspected to be a tumor) may be obtained during tumor progression in identifying new metastatic tissue or cells.

得られた腫瘍細胞又は腫瘍組織から、DNA(たとえば、ゲノミックDNA、染色体外DNAなど)、RNA(たとえば、mRNA、miRNA、siRNA、shRNAなど)、及び/又はタンパク質(たとえば、膜タンパク質、細胞質タンパク質、核タンパク質など)を単離し、そしてさらに解析することによりオミクスデータを得ることが可能である。代替的及び/又は追加的に、オミクスデータを得る工程は、1名以上の患者及び/又は健常者のオミクス情報を記憶するデータベースからオミクスデータを受け取ることを含みうる。たとえば、患者の腫瘍のオミクスデータは、患者の腫瘍組織から単離されたDNA、RNA、及び/又はタンパク質から得られうるとともに、得られたオミクスデータは、同一型の腫瘍又は異なる型の腫瘍を有する他の患者の他のオミクスデータセットと共にデータベース(たとえば、クラウドデータベース、サーバーなど)に記憶しうる。健常者又は患者の対応正常部組織(又は健常組織)から得られたオミクスデータはまた、解析時に関連データセットをデータベースから検索できるようにデータベースに記憶可能である。同様に、タンパク質データを得る場合、これらのデータはまた、とりわけタンパク質が酵素活性を有する場合(たとえば、ポリメラーゼ、キナーゼ、ヒドロラーゼ、リアーゼ、リガーゼ、オキシドレダクターゼなど)、タンパク質活性を含みうる。 From the resulting tumor cells or tissues, DNA (eg, genomic DNA, extrachromosomal DNA, etc.), RNA (eg, mRNA, miRNA, siRNA, shRNA, etc.), and / or proteins (eg, membrane proteins, cytoplasmic proteins, etc.) Omics data can be obtained by isolating (such as nuclear proteins) and further analyzing. Alternatively and / or additionally, the step of obtaining omics data may include receiving omics data from a database that stores omics information of one or more patients and / or healthy individuals. For example, omics data for a patient's tumor can be obtained from DNA, RNA, and / or proteins isolated from the patient's tumor tissue, and the omics data obtained can be for tumors of the same type or different types. It can be stored in a database (eg, cloud database, server, etc.) along with other omics datasets of other patients who have it. Correspondence of a healthy person or patient Omics data obtained from a normal tissue (or healthy tissue) can also be stored in a database so that relevant datasets can be retrieved from the database during analysis. Similarly, when obtaining protein data, these data may also include protein activity, especially if the protein has enzymatic activity (eg, polymerase, kinase, hydrolase, lyase, ligase, oxidoreductase, etc.).

本明細書で用いられる場合、オミクスデータは、限定されるものではないが、ゲノミクス、プロテオミクス、及びトランスクリプトミクスに関連する情報、さらには特異的な遺伝子発現又は転写物の解析、並びに細胞の他の特性及び生物学的機能を含む。ゲノミクスデータに関して、好適なゲノミクスデータは、腫瘍サンプル及び対応正常部サンプルの両方の全ゲノムシーケンシング及び/又はエキソームシーケンシング(典型的には少なくとも10×、より典型的には少なくとも20×のカバレッジデプス)により取得可能なDNA配列解析情報を含む。代替的に、DNAデータは、先行する配列決定からすでに確立された配列レコード(たとえば、SAM、BAM、FASTA、FASTQ、又はVCFファイル)からも提供しうる。したがって、データセットは、未処理又は処理済みのデータセットを含みうるとともに、模範的データセットは、BAMフォーマット、SAMフォーマット、FASTQフォーマット、又はFASTAフォーマットを有するものを含む。しかしながら、データセットは、BAMフォーマットで又はBAMBAM差分オブジェクトとして提供されることがとりわけ好ましい(たとえば、米国特許出願公開第2012/0059670A1号明細書及び米国特許出願公開第2012/0066001A1号明細書)。オミクスデータは、全ゲノムシーケンシング、エキソームシーケンシング、トランスクリプトームシーケンシング(たとえばRNA−seq)、又は遺伝子特異的解析(たとえば、PCR、qPCR、ハイブリダイゼーション、LCRなど)に由来しうる。同様に、配列データのコンピューター解析は、多くの方式で実施しうる。しかしながら、最も好ましい方法では、解析は、たとえば、米国特許出願公開第2012/0059670A1号明細書及び米国特許出願公開第2012/0066001A1号明細書に開示されるように、BAMファイル及びBAMサーバーを用いて腫瘍サンプル及び正常サンプルの位置ガイド同期アライメントによりin silicoで実施される。かかる解析は、偽陽性ネオエピトープを有利に低減し、且つメモリー及びコンピューター資源に対する要件を有意に低減する。 As used herein, omics data is, but is not limited to, information related to genomics, proteomics, and transcriptomics, as well as specific gene expression or transcript analysis, as well as other cells. Includes properties and biological functions of. With respect to genomics data, suitable genomics data include whole-genome sequencing and / or exome sequencing (typically at least 10x, more typically at least 20x) coverage of both tumor and corresponding normal samples. Depth) includes DNA sequence analysis information that can be obtained. Alternatively, DNA data can also be provided from sequence records already established from the preceding sequencing (eg, SAM, BAM, FASTA, FASTQ, or VCF files). Thus, datasets may include unprocessed or processed datasets, and exemplary datasets include those having BAM format, SAM format, FASTQ format, or FASTA format. However, it is particularly preferred that the dataset be provided in BAM format or as a BAMBAM difference object (eg, US Patent Application Publication No. 2012/0059670A1 and US Patent Application Publication No. 2012/0066001A1). Omics data can be derived from whole-genome sequencing, exome sequencing, transcriptome sequencing (eg RNA-seq), or gene-specific analysis (eg PCR, qPCR, hybridization, LCR, etc.). Similarly, computer analysis of sequence data can be performed in many ways. However, in the most preferred method, the analysis uses a BAM file and a BAM server, as disclosed, for example, in US Patent Application Publication No. 2012/0059670A1 and US Patent Application Publication No. 2012/0066001A1. Performed in silico by position-guided synchronous alignment of tumor and normal samples. Such an analysis favorably reduces false-positive neoepitope and significantly reduces memory and computer resource requirements.

代替的又は追加的に、関連情報は腫瘍から直接得ることが好ましいが、データの1つ以上はデータベースからも得られうる。たとえば、全ゲノムシーケンシング及びRNA解析の達成にフレッシュ腫瘍サンプルを使用する場合、関連情報は、データベース又は最適にはシーケンシングセンターから提供されうる。プロテオミクス解析は、レーザーマイクロダイセクションを用いてFFPEサンプルから実施しうるとともに、質量分析は、かかるサンプルを用いて実施可能である。したがって、情報源は、必ずしも単一源に由来する必要があるとは限らず、各種源からアセンブルしうる。同様に、企図される解析は、異なる時点、たとえば、手術前及びテモゾロミドの投与前、又は手術後及びテモゾロミドの投与前などのデータを利用しうる。 Alternatively or additionally, the relevant information is preferably obtained directly from the tumor, but one or more of the data can also be obtained from the database. For example, when using fresh tumor samples to achieve whole-genome sequencing and RNA analysis, relevant information may be provided from the database or optimally from the sequencing center. Proteomics analysis can be performed from FFPE samples using a laser microdissection, and mass spectrometry can be performed using such samples. Therefore, sources do not necessarily have to come from a single source and can be assembled from a variety of sources. Similarly, the intended analysis may utilize data at different time points, such as before surgery and before administration of temozolomide, or after surgery and before administration of temozolomide.

したがって、好ましくは、好適なゲノム情報は、たとえば、MGMT遺伝子の突然変異、重複、又は欠失、並びに転写(及びスプライス変異又は存在する場合は他の突然変異)の定量情報を提供するMGMTのRNA配列情報とくにRNAseq情報を同定しうる全ゲノムシーケンシング又はエキソームシーケンシングを含む。代替的に、定量情報は、ハイブリダイゼーション法及び/又は他のPCRベース法によっても得られうる。同様に、タンパク質情報は、選択された反応モニタリング法、抗体ベース情報、及び/又は染色法を含めて、好ましくは質量分析法を用いて得られる。 Thus, preferably, suitable genomic information is RNA of MGMT that provides, for example, mutations, duplications, or deletions of the MGMT gene, as well as quantitative information on transcription (and splice mutations or other mutations, if any). Includes whole-genome sequencing or exome sequencing that can identify sequence information, especially RNAseq information. Alternatively, quantitative information can also be obtained by hybridization and / or other PCR-based methods. Similarly, protein information is obtained, preferably using mass spectrometry, including selected reaction monitoring methods, antibody-based information, and / or staining methods.

DNA損傷アルキル化剤テモゾロミド(TMZ)は、膠芽細胞腫、黒色腫、及びリンパ腫の治療が承認されている。MGMT酵素は、アルキル化剤由来の損傷の修復に関与する。MGMTエピジェネティックサイレンシングは、黒色腫研究でTMZ耐性に関連し、結腸直腸癌(CRC)の約1/3で起こる。しかしながら、困ったことに、低いMGMTタンパク質発現は、TMZ反応の予測を増加させうるとともに、mCRC患者においてMGMTメチル化よりもさらに増加させうることが、従来の研究により実証された。各種MGMTアッセイとアウトカムとの関係は依然として不明である。 The DNA damage alkylating agent temozolomide (TMZ) is approved for the treatment of glioblastoma, melanoma, and lymphoma. The MGMT enzyme is involved in repairing damage from alkylating agents. MGMT epigenetic silencing is associated with TMZ resistance in melanoma studies and occurs in about one-third of colorectal cancer (CRC). Unfortunately, however, previous studies have demonstrated that low MGMT protein expression can increase the prediction of TMZ response and even more than MGMT methylation in mCRC patients. The relationship between various MGMT assays and outcomes remains unclear.

したがって、本発明者らは、予測モデルの構築では単一分子エンティティーに対して2タイプ以上のデータセットの使用を企図する。有利には、好適なタイプのデータセットは、DNAコピー数データ、DNA突然変異データ、RNAスパイス変異体データ、RNA発現レベルデータ、プロモーターメチル化データ、エピジェネティック修飾データ、タンパク質データ、及びタンパク質活性データを含む。最も典型的には、かかるデータは、容易に入手可能であり、且つ/又は各種経路モデル(たとえばPARADIGM)から推測可能である。2タイプ以上のデータセットが使用される場合、少なくとも3つの異なるタイプのデータセットが利用されるであろうことも企図される。容易に分かるであろうが、分類アルゴリズムの選択は、少なくともある程度、データセットのタイプの関数であろうし、当業者であれば、所与のデータセットに対して適切な分類アルゴリズムを決定可能であろう。さらに、以下にも模範的に記されるように、カットオフ値はあらかじめ決めうるか、又は独立してさらなるマシンラーニングを用いて学習しうる。 Therefore, we intend to use two or more types of datasets for a single molecule entity in the construction of predictive models. Advantageously, suitable types of data sets include DNA copy count data, DNA mutation data, RNA spice variant data, RNA expression level data, promoter methylation data, epigenetic modification data, protein data, and protein activity data. including. Most typically, such data are readily available and / or inferrable from various pathway models (eg, PARADIGM). It is also contemplated that if more than one type of dataset is used, then at least three different types of datasets will be used. As will be readily apparent, the choice of classification algorithm will be, at least to some extent, a function of the type of dataset, and one of ordinary skill in the art will be able to determine the appropriate classification algorithm for a given dataset. Let's do it. In addition, the cutoff value can be predetermined or independently learned using additional machine learning, as illustrated below.

定量メトリックを得るために使用される特定の方法にかかわらず、RNAseq情報、タンパク質定量情報、及びメチル化情報の1つ以上は、1つ以上の閾値を用いてサブグループ化することが一般に好ましいことが企図される。たとえば、以下でより詳細に説明されるように、RNAseq情報はTPM(転写物百万分率)閾値によりサブグループ化しうるし、タンパク質定量情報は検出閾値又は200amolなどの特定の値によりサブグループ化しうるし、且つメチル化情報は、メチル−BEAMingにより決定される閾値(たとえば、60%メチル化MGMTプロモーター配列)によりサブグループ化しうる。 Regardless of the particular method used to obtain the quantitative metric, it is generally preferred that one or more of the RNAseq information, protein quantitative information, and methylation information be subgrouped using one or more thresholds. Is intended. For example, RNAseq information can be subgrouped by TPM (transcription parts per million) threshold, and protein quantification information can be subgrouped by specific values such as detection threshold or 200amol, as described in more detail below. And the methylation information can be subgrouped by a threshold determined by methyl-BEAMing (eg, 60% methylated MGMT promoter sequence).

本発明者らはさらに、かかるRNAseq情報、タンパク質定量情報、及びメチル化情報の1つ以上、及び/又はサブグループ化された情報の1つ以上の閾値を用いることにより、予測モデルをトレーニングして予測モデルの確度を検証することが可能であることを企図する。反応予測モデルに関して、当技術分野で公知のモデル構築方法が多数存在すること、且つ企図されるモデルは、RNAseq情報、タンパク質定量情報、及びメチル化情報の1つ以上をグループ化して又はグループ化せずに及びそれらのいずれかを組み合わせて使用しうることに留意すべきである。しかしながら、以下でより詳細にさらに記載されるように、モデルは、RNAseq情報、タンパク質定量情報、及びメチル化情報をサブグループ化して使用することが好ましい。 We further train predictive models by using one or more of such RNAseq information, protein quantification information, and methylation information, and / or one or more thresholds of subgrouped information. It is intended that it is possible to verify the accuracy of the prediction model. There are many model-building methods known in the art for reaction prediction models, and the model intended is to group or group one or more of RNAseq information, protein quantification information, and methylation information. It should be noted that it can be used without or in combination with any of them. However, as described in more detail below, the model preferably uses RNAseq information, protein quantification information, and methylation information subgrouped.

同様に、当技術分野で公知の予測タスク用の各種多変量分類アルゴリズムが存在し、模範的分類器としては、エクストラツリー分類器、KNN分類器、RBF又は線形サポートベクトル分類器、ディシジョンツリー分類器、ナイーブベイズ分類器、クアッドディスクリミナント分類器、リッジ分類器、ガウスプロセス分類器、ランダムフォレスト分類器、ランダムフォレストベース又はデシジョンツリーベースの推定量のいずれかを用いたアダブースト分類器が挙げられる。当技術分野で公知の予測タスク用の各種単変量分類アルゴリズムが存在し、例としてユーデン解析を用いて最適分類閾値が見いだされている。以下に示されるように、かかるアルゴリズムはさまざまな確度メトリックを提供するであろう。また、反応予測モデルの作成には最高確度(又は確度ゲイン)を有する分類器を使用することが一般に好ましい。とくに相対的に高い確度のものでは、企図される方法は、未知癌患者(たとえばmCRC患者など)で検証したとき、使用した分類器のタイプに依存して、少なくとも70%、少なくとも80%、少なくとも85%の予測確度を可能にした。最も好ましくは、K最近傍分類器を使用した場合、約86%の確度が達成された。 Similarly, there are various multivariate classification algorithms known in the art for predictive tasks, and exemplary classifiers include extra tree classifiers, KNN classifiers, RBF or linear support vector classifiers, and decision tree classifiers. , Naive Bayes Classifier, Quad Discretionary Classifier, Ridge Classifier, Gaussian Process Classifier, Random Forest Classifier, Random Forest Classifier or Decision Tree Based Estimate. There are various univariate classification algorithms for predictive tasks known in the art, and the optimal classification threshold has been found using Uden analysis as an example. Such an algorithm will provide various accuracy metrics, as shown below. In addition, it is generally preferable to use a classifier having the highest accuracy (or accuracy gain) for creating a reaction prediction model. Especially with relatively high accuracy, the intended method, when tested in patients with unknown cancer (eg, mCRC patients), depends on the type of classifier used, at least 70%, at least 80%, at least. It enabled a prediction accuracy of 85%. Most preferably, about 86% accuracy was achieved when using the K-nearest neighbor classifier.

FELDSPARコホートの3つの第II相臨床試験の1つでTMZを摂取した41名の転移結腸直腸癌患者からアーカイブFFPE組織切片を得た。表1に示されるように、解析のために41名のTMZ治療患者から腫瘍サンプルを入手可能であった。これらの患者は69歳のメジアン年齢を有し、TMZ前にメジアンで3回の化学療法レジメンを受けていた。患者の大多数は、0又は1のECOGステータス(85%)及び少なくとも2つの転移部位(56%)を有し、最頻発部位は肝臓であった。mCRCで予想されるように、患者はすべて、TMZで最終的に進行した。ORRは次の通りであった。すなわち、26名の患者(63%)は進行性疾患を有し、9名(22%)は部分反応を有し、6名(15%)は安定性疾患を有していた。図1に示されるように、これらの41サンプルのうち、39はRNAseqシーケンシングの品質管理標準に首尾よく合格し、且つ35はメチルBEAMing(ディジタルMB)の品質管理標準に首尾よく合格した。以下はこの選択されたサンプルの簡単な解析である。 Archived FFPE tissue sections were obtained from 41 patients with metastatic colorectal cancer who received TMZ in one of the three Phase II clinical trials of the FELDPAR cohort. Tumor samples were available from 41 TMZ treated patients for analysis, as shown in Table 1. These patients had a median age of 69 years and had received three chemotherapy regimens with the median prior to TMZ. The majority of patients had 0 or 1 ECOG status (85%) and at least 2 metastatic sites (56%), with the most frequent site being the liver. All patients eventually progressed to TMZ, as expected by mCRC. The ORR was as follows. That is, 26 patients (63%) had progressive disease, 9 (22%) had partial reaction, and 6 (15%) had stable disease. Of these 41 samples, 39 successfully passed the quality control standard for RNAseq sequencing, and 35 successfully passed the quality control standard for methyl BEAMing (digital MB), as shown in FIG. The following is a brief analysis of this selected sample.

Figure 2021501422
Figure 2021501422

41アーカイブサンプルはすべてLC−MSにより評価可能であり、35はディジタルMBにより解析され、且つ39はRNA−seqによるMGMTアセスメントに十分な品質であった(図1、表1)。LC−MSベースプロテオミクスにより評価された患者のうち、18名(44%)はMGMTタンパク質試験で陰性であったので(<200amol/μgの腫瘍タンパク質)、TMZに反応する可能性が高いとみなされた。残り(n=23)はMGMTタンパク質陽性であり、TMZ療法に反応する可能性が低いとみなされた。臨床試験参加者のこの分子富化集団では、MGMTレートは高く44%であった。比較すると、1年間にわたるプロテオミック試験のために我々の実験室に渡された全CRC患者サンプル(n=114)では、MGMT陰性の出現率16%が見いだされた。MBにより、63%カットオフを超えるMGMTプロモーターメチル化は、12名(34%)の患者で観測され、残りは非メチル化MGMTステータスを有していた(表2)。MB及びLC−MSの両方により解析された35腫瘍では、方法間の一致レートは77%、p=0.004であった。 All 41 archive samples were evaluable by LC-MS, 35 were analyzed by digital MB, and 39 were of sufficient quality for MGMT assessment by RNA-seq (FIGS. 1, Table 1). Of the patients evaluated by LC-MS-based proteomics, 18 (44%) were negative in the MGMT protein test (<200 amol / μg of tumor protein) and were therefore considered likely to respond to TMZ. It was. The rest (n = 23) were MGMT protein positive and were considered unlikely to respond to TMZ therapy. In this molecularly enriched population of clinical trial participants, the MGMT rate was high at 44%. By comparison, an MGMT-negative incidence of 16% was found in all CRC patient samples (n = 114) delivered to our laboratory for a one-year proteomic study. MGMT promoter methylation above the 63% cutoff by MB was observed in 12 (34%) patients, the rest having unmethylated MGMT status (Table 2). For 35 tumors analyzed by both MB and LC-MS, the concordance rate between methods was 77%, p = 0.004.

Figure 2021501422
Figure 2021501422

反応及び生存を予測するMGMTアッセイの能力: 定量プロテオミクスは、TMZに対するRECIST規定レスポンダー9名中9名をレトロスペクティブに同定し、9名のレスポンダーはすべて、LC−MSにより陰性MGMTタンパク質発現を有していた。MGMT陰性タンパク質を有する追加の9名の患者は、TMZに対するRECIST規定反応を有していなかった(ORR、MGMT陰性患者:50%)。陽性MGMTタンパク質発現を有する患者は誰も、TMZに反応しなかった(ORR、MGMT陽性患者:0%、p=0.0001、表2、図2A)。 Ability of MGMT assay to predict response and survival: Quantitative proteomics retrospectively identified 9 of 9 RECIST-regulated responders to TMZ, all 9 responders having negative MGMT protein expression by LC-MS. It was. Nine additional patients with MGMT-negative proteins did not have a RECIST-defined response to TMZ (ORR, MGMT-negative patients: 50%). None of the patients with positive MGMT protein expression responded to TMZ (ORR, MGMT positive patients: 0%, p = 0.0001, Table 2, FIG. 2A).

MB(n=35)により解析された患者のうち、MGMT高メチル化ステータスは、TMZに対するレスポンダー8名中6名をレトロスペクティブに同定し、MBによりMGMT高メチル化を有する追加の6名の患者は、ノンレスポンダーであった(ORR、MGMT高メチル化患者:50%)。陰性メチル化ステータスを有する2名の患者は、TMZに反応した(ORR:9%、p=0.011、表2、図2B)。図3は、メチル化ステータス及びMGMTタンパク質発現レベルのデータを組み合わせたグラフを示す(MGMTタンパク質<200amol/μg(n=18、暗青色)及びMGMT≧200amol/μg(n=23、薄青色)を有する患者ごとの腫瘍体積の(ベースラインからの)パーセント変化)。陽性ステータスが>60%(赤線)として規定されるMBによるMGMTメチル化ステータス(赤色バー、n=35)。 Of the patients analyzed by MB (n = 35), MGMT hypermethylation status retrospectively identified 6 of 8 responders to TMZ, and an additional 6 patients with MGMT hypermethylation by MB. , Non-responder (ORR, MGMT hypermethylated patients: 50%). Two patients with negative methylation status responded to TMZ (ORR: 9%, p = 0.011, Table 2, FIG. 2B). FIG. 3 shows a graph combining data on methylation status and MGMT protein expression levels (MGMT protein <200 amol / μg (n = 18, dark blue) and MGMT ≧ 200 amol / μg (n = 23, light blue). Percentage change (from baseline) of tumor volume per patient with. MGMT methylation status by MB (red bar, n = 35) with positive status defined as> 60% (red line).

生存分析では、LC−MSにより陰性MGMTタンパク質発現を有する患者は、プロテオミック陽性患者よりも長いメジアンPFS(mPFS)を有していた(3.7ヶ月間対1.8ヶ月間、HR:0.504[95%CI 0.27〜0.94]、p=0.014)(図4A)。MGMTレベルは、二変量コックス比例ハザードモデルで12潜在交絡因子(BRAF及びKRAS突然変異ステータス、性別、ECOG、前治療回数、LDHベースラインレベル、転移部位数、好中球対リンパ球比、腹膜疾患、原発腫瘍位置、アーカイブ組織部位、並びに年齢)とペアにしたとき、PFSの統計学的に有意な予測因子を維持した。 In survival analysis, patients with negative MGMT protein expression by LC-MS had longer median PFS (mPFS) than proteomic-positive patients (3.7 months vs. 1.8 months, HR: 0). .504 [95% CI 0.27 to 0.94], p = 0.014) (Fig. 4A). MGMT levels were 12 latent confounders (BRAF and KRAS mutation status, gender, ECOG, number of pretreatments, LDH baseline level, number of metastatic sites, neutrophil to lymphocyte ratio, peritoneal disease in a bivariate Cox proportional hazards model. , Primary tumor location, archived tissue site, and age) maintained a statistically significant predictor of PFS.

これらの臨床変量のいくつかはアウトカムに関連したが(たとえばLDH)、MGMTタンパク質発現は、PFSの最も統計学的に有意な予測因子であった(表3)。MGMTタンパク質発現によるOSの差はPFS差に類似していたが、統計的有意性に達しなかった(8.7対7.4ヶ月間、HR:0.593[95%CI:0.32〜1.12]、p=0.078)(図4B)。MGMT MBにより層別化された患者間ではPFS又はOSの統計学的有意差は存在しなかった(図5A及び5B)。 Although some of these clinical variables were outcome-related (eg LDH), MGMT protein expression was the most statistically significant predictor of PFS (Table 3). The difference in OS due to MGMT protein expression was similar to the difference in PFS, but did not reach statistical significance (8.7 vs. 7.4 months, HR: 0.593 [95% CI: 0.32-]. 1.12], p = 0.078) (Fig. 4B). There were no statistically significant differences in PFS or OS between patients stratified by MGMT MB (FIGS. 5A and 5B).

Figure 2021501422
Figure 2021501422

RNAシーケンシングによるMGMT: データに当てはめたmRNA発現に対して実験的カットポイントを用いて(≦3.5log2[TPM+1])、サンプルの大多数で低MGMTmRNA発現が観測された(n=23、59%)(表2)。RNA−seqにより低MGMT RNA発現を有する患者の腫瘍は、より高いmRNAエクスプレッサーよりも非有意に高いORRを有していた(35%対6%、p=0.115、表2)。MGMTmRNA発現により層別化された患者間に統計的に有意な生存差は存在しない(図6A及び図6B)。図7A及び図7Bは、TMZ治療患者(n=41)間で、MGMTタンパク質レベル<200amol/μg(n=18)を有するものは、より高いMGMTタンパク質レベルを有する患者よりも長いメジアンPFS(mPFS)を有していたことを示す他のグラフを示す。患者はすべて、TMZで最終的に進行する。(図7A)臨床反応を反映するRECIST基準により進行を再定義し、≧6ヶ月間にわたり部分反応又は安定性疾患を有する患者をレスポンダー(n=18)又はノンレスポンダー(n=23)として規定した。全生存の結果は一貫性があり、ほぼ統計的に有意であった(8.7対7.4ヶ月間、HR=0.6、p=0.077)(図7B)。 MGMT by RNA-Seqing: Low MGMT mRNA expression was observed in the majority of samples using experimental cutpoints for data-fitted mRNA expression (≤3.5log2 [TPM + 1]). %) (Table 2). Tumors of patients with low MGMT RNA expression due to RNA-seq had a non-significantly higher ORR than higher mRNA expressors (35% vs. 6%, p = 0.115, Table 2). There is no statistically significant survival difference between patients stratified by MGMT mRNA expression (FIGS. 6A and 6B). 7A and 7B show that among TMZ treated patients (n = 41), those with MGMT protein level <200 amol / μg (n = 18) are longer median PFS (mPFS) than patients with higher MGMT protein levels. ) Is shown in another graph showing that it had. All patients eventually progress with TMZ. (Fig. 7A) Progression is redefined by RECIST criteria that reflect clinical response, and patients with partial response or stable disease for ≧ 6 months are defined as responders (n = 18) or non-responders (n = 23). did. Overall survival results were consistent and nearly statistically significant (8.7 vs. 7.4 months, HR = 0.6, p = 0.077) (Fig. 7B).

RNAseqのカットオフとMS−プロテオミックカットオフとの間の相関: 観測/実用MS−プロテオミクスカットオフ値に対するRNAseqの対応するカットオフ値を同定する試みで、本発明者は、すべてのCOAD及びREAD TCGAサンプルでMGMT発現レベルを得て、先行プロテオミック解析により提案された200amolカットオフとマッチしうるナチュラルブレイクを発現パターンで探索した。図8A及び8Bから分かるように、MGMT TPMの分布は、3.5log2(TPM+1)(垂直線で示される)の近傍にナチュラルブレイクを有する2モードで現れる。3.5log2(TPM+1)のカットオフでは、以下の表4からも明らかなように、200amol/mL MSプロテオミクスカットオフとRNAseqクラスとの間で良好な一致が観測される。タンパク質閾値とRNA閾値との間のこの関連レベルに対するフィッシャー正確p値は、p<0.00082である。 Correlation between RNAseq cutoffs and MS-proteomic cutoffs: In an attempt to identify the corresponding cutoff values for RNAseq relative to observed / practical MS-proteomics cutoff values, we have identified all COADs and READs. MGMT expression levels were obtained from TCGA samples and natural breaks that could match the 200 amol cutoff proposed by prior proteomics were searched for in expression patterns. As can be seen from FIGS. 8A and 8B, the distribution of MGMT TPM appears in two modes with a natural break near 3.5log2 (TPM + 1) (indicated by the vertical line). At the 3.5 log2 (TPM + 1) cutoff, good agreement is observed between the 200 amol / mL MS proteomics cutoff and the RNAseq class, as is also apparent from Table 4 below. Fisher's exact p-value for this association level between the protein threshold and the RNA threshold is p <0.00082.

Figure 2021501422
Figure 2021501422

フォローアップ解析では、本発明者は、選択されたカットオフ(3.5log2[TPM+1])が、図9A及び9Bから得られるユーデン解析によりこのコホートにおいてRNAseqとプロテオミック値との間の一致に関して最適であることを見いだした。この3.5のカットポイントでは、プロテオミックMGMTクラスと比較したとき、このコホートで0.71のTPR及び0.11のFPRが得られる。図9Cは、TMZに対するノンレスポンデント及びレスポンデントのRNAseq値を示す棒グラフを示す(統計量=−1.04、p値=0.305)。図9Dは、MGMTプロテオミックアッセイとMBとの間の一致レートが80%、p=0.0011フィッシャー検定であったことを示唆する棒グラフを示す(MBにより解析された35腫瘍)。 In follow-up analysis, we found that the selected cutoff (3.5log2 [TPM + 1]) was optimal for matching between RNAseq and proteomic values in this cohort by the Uden analysis obtained from FIGS. 9A and 9B. I found that. At this 3.5 cut point, a TPR of 0.71 and an FPR of 0.11 are obtained in this cohort when compared to the proteomic MGMT class. FIG. 9C shows a bar graph showing non-respondent and respondent RNAseq values for TMZ (statistic = −1.04, p-value = 0.305). FIG. 9D shows a bar graph suggesting that the concordance rate between the MGMT proteomic assay and MB was 80%, p = 0.0011 Fisher's exact test (35 tumors analyzed by MB).

アウトカムに関連するMGMTサブグループの規定: 第1の解析では、本発明者は、前の研究を再現して<200amol/mL MGMTタンパク質を有する患者のPFS奏効を実証した。典型的な結果は図10Aに示される。プロテオミッククラス間のログランク検定はp≦0.0186を有し、コックス比例ハザード結果は表5に示される。 Definition of MGMT subgroups related to outcomes: In the first analysis, we reproduced the previous study to demonstrate PFS response in patients with <200 amol / mL MGMT protein. Typical results are shown in FIG. 10A. The log rank test between proteomic classes has p ≦ 0.0186, and the Cox proportional hazard results are shown in Table 5.

Figure 2021501422
Figure 2021501422

ログランク検定はこれらの2つのサブグループでp<0.0186を与えるが(前の研究に示される)、コックス比例ハザード比はp<0.021を与えることに留意すべきである。コックスモデルはわずかに保存的であり、アーム内のアンバランスを考慮に入れる。両方の統計について以下の結果で考察する。このスプリットは、図10Bから分かるように、生存メトリックとしてOS及びエンドポイントとして死を用いたとき、p<0.05の有意性を失うことにも、留意すべきである。この場合、プロテオミッククラス間のログランク検定はp≦0.0879であり、コックス比例ハザードは表6に示される通りであった。 It should be noted that the log-rank test gives p <0.0186 in these two subgroups (shown in the previous study), but the Cox proportional hazard ratio gives p <0.021. The Cox model is slightly conservative and takes into account imbalances in the arm. Both statistics are considered in the results below. It should also be noted that this split loses the significance of p <0.05 when using OS as the survival metric and death as the endpoint, as can be seen in FIG. 10B. In this case, the log rank test between proteomic classes was p ≦ 0.0879, and the Cox proportional hazards were as shown in Table 6.

Figure 2021501422
Figure 2021501422

次いで、本発明者は、RNAseqサブグループを用いて観測される関連を調べた。この場合、TGCA COAD/READデータで確立された3.5log2(TPM+1)のRNAseqカットオフを用いて、図11に示されるようにサブグループを規定した。これはp≦0.1731のRNAseqクラス間のログランク検定を提供し、コックス比例ハザードは表7に示される。容易に分かるように、RNAseqクラスはプロテオミックサブグループほど予測的ではなく、このコホートサイズでは有意性を達成しなかった。同様に、生存メトリックとしてOSを用いても有意性を達成しなかった。 The inventor then investigated the associations observed using the RNAseq subgroup. In this case, the 3.5 log2 (TPM + 1) RNAseq cutoffs established in the TGCA COAD / READ data were used to define subgroups as shown in FIG. This provides a log-rank test between RNAseq classes with p ≦ 0.1731, and the Cox proportional hazards are shown in Table 7. As can be easily seen, the RNAseq class was less predictive than the proteomic subgroup and did not achieve significance in this cohort size. Similarly, using OS as a survival metric did not achieve significance.

Figure 2021501422
Figure 2021501422

次いで、本発明者は、RNAseqサブグループとプロテオミッククラスとの組合せを用いて観測される関連を調べた。サンプルがRNAseq又はタンパク質のどちらかで高いMGMTを有していた場合、それはMGMTが高いとみなされた。かかる解析の典型的な結果は図12に示される。この場合、組合せRNA+タンパク質クラス間のログランク検定はp≦0.0350であり、コックス比例ハザード結果は表6に示される。この場合、示差的生存性は有意であり且つRNAseq単独を改善したが、プロテオミック200amolスプリット単独ほど有意ではなかったことに留意すべきである。 The inventor then investigated the observed associations using combinations of RNAseq subgroups and proteomic classes. If the sample had a high MGMT in either RNAseq or protein, it was considered high in MGMT. Typical results of such an analysis are shown in FIG. In this case, the log rank test between the combination RNA + protein classes is p ≦ 0.0350, and the Cox proportional hazard results are shown in Table 6. It should be noted that in this case, differential viability was significant and improved RNAseq alone, but not as significantly as proteomic 200amol split alone.

Figure 2021501422
Figure 2021501422

さらなる解析では、本発明者は、以上の組合せ+MGMTプロモーターCpGメチル化サブグループを用いて観測される関連を調べた。より具体的には、>60%メチル化を有するサンプルはMGMT発現阻害を有すると予想され、最適組合せは次の通りであった。すなわち、高MGMT:低メチル化且つ高RNA又は高タンパク質のどちらか、及び低MGMT:高メチル化又は低RNA若しくは低タンパク質のどちらか。 In further analysis, we investigated the associations observed using the above combination + MGMT promoter CpG methylation subgroup. More specifically, samples with> 60% methylation were expected to have inhibition of MGMT expression, and the optimal combinations were: That is, high MGMT: either low methylation and high RNA or high protein, and low MGMT: high methylation or low RNA or low protein.

図13Aは、かかる解析の模範的結果を示す。この場合、3元組合せクラス間のログランク検定はp≦0.0378であり、コックス比例ハザードは表9に示される。 FIG. 13A shows exemplary results of such an analysis. In this case, the log rank test between the ternary combination classes is p ≦ 0.0378, and the Cox proportional hazards are shown in Table 9.

Figure 2021501422
Figure 2021501422

この分離は、RNA+タンパク質又はタンパク質単独ほど識別可能ではなかったが、図13Bに示されるように、OSが生存メトリックであるとき、ログランク検定及びコックスPH検定の両方で有意性を維持した。その場合、3元組合せクラス間のログランク検定はp≦0.0419であり、コックス比例ハザードは表10に示される。 This separation was not as distinguishable as RNA + protein or protein alone, but remained significant in both the Logrank test and the Cox PH test when OS was a survival metric, as shown in FIG. 13B. In that case, the log rank test between the ternary combination classes is p ≦ 0.0419, and the Cox proportional hazards are shown in Table 10.

Figure 2021501422
Figure 2021501422

テモゾロミド反応予測例I: 本発明者は、MGMT−オミクス値に基づいてテモゾロミド反応の予測モデルを構築する複数の方法を評価した。より具体的には、本発明者は、MGMTアッセイの各々、すなわち、RNAseq発現TPM、タンパク質amol/mL、及びメチル化パーセント、並びにそれらの組合せ及び部分的組合せを用いて、テモゾロミド反応の予測モデルを構築した。これらの特徴の各々の生の連続値さらにはそれらのサブグループ化値(それぞれ、3.5log2(TPM+1)、200amol/mL、及び60%CpGメチル化)のいずれも用いて、さらなるモデルを構築した。組み合わせて、これは10の異なる「データセット」をもたらした:
1.発現単独
2.タンパク質単独
3.メチル化単独
4.発現+タンパク質
5.発現+タンパク質+メチル化
6.発現(サブグループ化)+タンパク質
7.発現(サブグループ化)+タンパク質(サブグループ化)
8.発現(サブグループ化)+タンパク質(サブグループ化)+メチル化(サブグループ化)
9.発現+タンパク質+メチル化(サブグループ化)
10.発現+タンパク質(サブグループ化)+メチル化(サブグループ化)
Temozolomide Reaction Prediction Example I: The present inventor evaluated a plurality of methods for constructing a prediction model of temozolomide reaction based on MGMT-omics values. More specifically, the inventor used each of the MGMT assays, ie RNAseq-expressing TPM, protein amol / mL, and percent methylation, and combinations and partial combinations thereof to predict a model of temozolomide reaction. It was constructed. Further models were constructed using the raw continuous values of each of these features as well as their subgrouping values (3.5log2 (TPM + 1), 200amol / mL, and 60% CpG methylation, respectively). .. In combination, this resulted in 10 different "datasets":
1. 1. Expression alone 2. Protein alone 3. Methylation alone 4. Expression + protein 5. Expression + protein + methylation 6. Expression (subgrouping) + protein 7. Expression (subgrouping) + protein (subgrouping)
8. Expression (subgrouping) + protein (subgrouping) + methylation (subgrouping)
9. Expression + protein + methylation (subgrouping)
10. Expression + protein (subgrouping) + methylation (subgrouping)

予測性能を評価するために、本発明者はリーブペアアウト交差検証(LPOCV)を使用した。この検証方法は、37/39サンプルで予測モデルを構築してから1つの未知陽性サンプル及び1つの未知陰性サンプルで予測性能を試験するのに必要である。これは、陽性サンプルと陰性サンプルとのすべての可能な組合せで繰り返され、このコホートで308性能評価をもたらす。これらの308未知試験セット全体にわたる平均性能は、所与の予測アルゴリズムに対して報告された確度である。 To evaluate predictive performance, we used leave pair-out cross-validation (LPOCV). This verification method is necessary to build a prediction model with 37/39 samples and then test the prediction performance with one unknown positive sample and one unknown negative sample. This is repeated with all possible combinations of positive and negative samples, resulting in a 308 performance rating in this cohort. The average performance across these 308 unknown test sets is the accuracy reported for a given prediction algorithm.

すべてのマルチ特徴データセット(以上の4〜10)で、本発明者は、この予測タスクに対して13の異なる分類アルゴリズムを評価した。シングル特徴データセット(以上の1、2、及び3)で、ユーデンJ統計量を用いてトレーニングサンプルにより新しい最適カットオフを確立し、新しいカットオフの性能を未知サンプルペアで試験した。 For all multi-feature datasets (4-10 above), the inventor evaluated 13 different classification algorithms for this prediction task. With single feature datasets (1, 2, and 3 above), the Uden J statistic was used to establish new optimal cutoffs with training samples and the performance of the new cutoffs was tested with unknown sample pairs.

これらの10データセット及び14分類アルゴリズムを組み合わせて、140の異なるモデリングストラテジーとした。LPOCVを用いてこれらの140ストラテジーの予測性能を未知サンプルで評価するために、追加の2772ユニーク予測サブモデルを構築する必要があった。図14は、これらのモデリングストラテジーの各々で未知サンプルの平均確度を示す。 These 10 datasets and 14 classification algorithms were combined into 140 different modeling strategies. In order to evaluate the prediction performance of these 140 strategies with unknown samples using LPOCV, it was necessary to build an additional 2772 unique prediction submodel. FIG. 14 shows the average accuracy of unknown samples for each of these modeling strategies.

計算及び図14から分かるように、全体で最良のモデリングストラテジーは、未知サンプルでテモゾロミド反応の予測確度が87%であった。この性能(確度87%)は、マジョリティー分類ストラテジー(すなわち、すべてのサンプルが耐性であると推定する:71%)よりもかなり良好であり、タンパク質値単独使用(80%)よりも向上することを認識すべきである。このモデリングストラテジーを選択して最終予測モデルを提案した。 As can be seen from the calculations and FIG. 14, the best overall modeling strategy was 87% predictive accuracy of the temozolomide reaction in the unknown sample. This performance (87% accuracy) is significantly better than the majority classification strategy (ie, all samples are estimated to be resistant: 71%) and is improved over protein value alone (80%). You should be aware. We selected this modeling strategy and proposed a final prediction model.

最高性能モデリングストラテジーは、3つすべての特徴(RNA、タンパク質、及びメチル化)をそれらのサブグループ化変換に利用してK最近傍アプローチを使用する。このアプローチは、以下のように新規なサンプルに対してテモゾロミド反応予測を行う。1.以上に記載のあらかじめ規定されたカットオフを用いて、MGMTmRNA発現ステータス、タンパク質レベル、及びプロモーターメチル化ステータスを規定し、2.3つすべてのMGMT関連特徴を用いて予測されるトレーニングインスタンス及び新規なサンプルの各々の間でペアワイズミンコフスキー距離を計算し(すなわちブルートツリー)、3.各新規サンプルで5つの最近接マッチングを同定し、4.新規なサンプルを最近接トレーニングサンプルのマジョリティーの反応クラスに帰属する。 The best-performing modeling strategy uses the K-nearest neighbor approach, utilizing all three features (RNA, protein, and methylation) for their subgrouping transformations. This approach predicts the temozolomide reaction for new samples as follows. 1. 1. The pre-defined cutoffs described above are used to define MGMT mRNA expression status, protein levels, and promoter methylation status, and predicted training instances and novels using all 2.3 MGMT-related features. 2. Calculate the pairwise Minkowski distance between each of the samples (ie the brute tree). 4. Identify 5 closest matches in each new sample. The new sample is attributed to the majority response class of the closest training sample.

新規サンプルにおける予測性能が交差検証設定条件のものに類似するという強い確信をもって、すべての利用可能なサンプルをトレーニングに使用する最終モデルを本願で提案する。3つのバイナリー特徴でトレーニングされるので、最終モデルは、8つの識別可能な状態でテモゾロミド感受性の確率を記述する(表11)。新規なサンプルは、以上に記載のものと同一のカットオフを用いてサブグループ化しうるとともに、これらの8状態の1つに割り当てうる。>0.5の感受性予測確率は、状態が約87%の確度でテモゾロミドに対して感受性であることを示唆する。逆に言えば、<0.5のテモゾロミド反応確率はテモゾロミドに対する耐性に関連付けられる。 With a strong belief that the predictive performance of the new sample is similar to that of the cross-validation configuration, we propose a final model in which all available samples are used for training. Since trained with three binary features, the final model describes the probabilities of temozolomide susceptibility in eight distinguishable states (Table 11). New samples can be subgrouped using the same cutoffs as described above and assigned to one of these eight states. A susceptibility prediction probability of> 0.5 suggests that the condition is sensitive to temozolomide with a certainty of about 87%. Conversely, a temozolomide reaction probability of <0.5 is associated with resistance to temozolomide.

Figure 2021501422
Figure 2021501422

テモゾロミド反応予測例II: 本発明者らは、3つの個別の定量MGMTアッセイ(プロモーター定量メチル化、RNA発現、及びタンパク質存在量)に基づいてTMZ反応のロバスト予測モデルをトレーニングして、未知mCRC患者においてその確度を検証するように努めた。単一タイプの予測因子を同定するのではなく、さまざまな観点から見て、本発明者らは、各種変数を組み込んで高い感度及び確度で予測モデルを導くように、マシンラーニング設定条件で複数の予測因子を同定するように企てた。 Temozolomide Reaction Prediction Example II: We trained a robust prediction model of TMZ reaction based on three individual quantitative MGMT assays (promoter quantitative methylation, RNA expression, and protein abundance) to patients with unknown mCRC. I tried to verify its accuracy. Rather than identifying a single type of predictor, from a variety of perspectives, we have incorporated multiple variables to derive a predictive model with high sensitivity and accuracy in multiple machine learning settings. Attempts were made to identify predictors.

一例では、3つのTMZ安全性試験(INT試験n.20/13、INT試験20/13、及びEudraCT2012−002766−13)に由来する41アーカイブ腫瘍サンプルを用いてモデルをトレーニングした。TMZに対する反応は、RECIST v.1.1基準により規定した。MGMTステータスは、3つの方法、すなわち、ディジタルPCR/メチル−BEAMing(MB)、RNAseq、及び液体クロマトグラフィー質量スペクトルにより評価した。トレーニングセット内で交差検証(CV)を用いて、いくつかの多変量モデリングストラテジー(kNN、SVM、ディシジョンツリーなど)を評価した。臨床グレードメチル化試験の欠如が理由で、最初にMGMTメチル化(全RNAseqに基づいて)を予測し、次いで、予測されたメチル化を用いてTMZ反応を分類するモデルも探究した。同様にアッセイされたフォローアップ研究に由来する14未知腫瘍サンプルで、CVで最も正確なモデルを検証した。各MGMTアッセイにおけるあらかじめ規定された閾値を比較の基準として使用した。 In one example, the model was trained with 41 archive tumor samples from three TMZ safety studies (INT study n.20 / 13, INT study 20/13, and EudraCT2012-002766-13). Responses to TMZ are described in RECIST v. Specified by 1.1 standards. MGMT status was evaluated by three methods: digital PCR / methyl-BEAMing (MB), RNAseq, and liquid chromatography mass spectra. Several multivariate modeling strategies (kNN, SVM, decision tree, etc.) were evaluated using cross-validation (CV) within the training set. Due to the lack of clinical grade methylation trials, we also explored a model that first predicted MGMT methylation (based on total RNAseq) and then used the predicted methylation to classify TMZ reactions. The most accurate model of CV was validated with 14 unknown tumor samples from a similarly assayed follow-up study. Predefined thresholds for each MGMT assay were used as criteria for comparison.

以下の表1の模範的結果から分かるように、複数の変数をトレーニング及び検証に使用したとき、単一変数(すなわち、個別に使用されるメチル化又はタンパク質又は発現)と比較して、テモゾロミドに対する反応予測が有意に改善された。実際に、複数の変数の組込みに基づいて、難治性mCRCにおけるTMZ反応はほぼ予測可能である。予測されたメチル化、転写レベル、及びタンパク質存在量を組み合わせると、最も正確且つロバストな反応予測方法が得られる(82%〜87%の確度)。 As can be seen from the exemplary results in Table 1 below, when multiple variables were used for training and validation, they were compared to a single variable (ie, individually used methylation or protein or expression) for temozolomide. Response prediction was significantly improved. In fact, the TMZ response in refractory mCRC is nearly predictable, based on the incorporation of multiple variables. The combination of predicted methylation, transcriptional levels, and protein abundance gives the most accurate and robust method of predicting response (82% -87% certainty).

Figure 2021501422
Figure 2021501422

1セットの実験では、本発明者らは、MGMTタンパク質(LC−MSにより測定される)、MGMT発現(TPMにより測定される)、及びMGMTプロモーターメチル化(ディジタルPCR/メチル−BEAMing(MB)により測定される)に関してトレーニングコホート予測性能を調べた。より具体的には、TMZに対する反応を予測するあらかじめ規定されたカットオフの能力を評価するために、我々は、リーブペアアウト交差検証ストラテジーを使用した。あらかじめ規定された探索カットオフは、未知サンプルで、LC−MS、RNAseq、及びMBデータにより、それぞれ、330、308、及び250回評価した。LC−MS及びRNA−seqにおけるあらかじめ規定されたカットオフは、MBモデル(68.0%)よりも良好な平均予測性能(それぞれ、82.1%及び72.2%)を示し、典型的な結果は図15に示される。 In one set of experiments, we determined by MGMT protein (measured by LC-MS), MGMT expression (measured by TPM), and MGMT promoter methylation (digital PCR / methyl-BEAMing (MB)). The training cohort prediction performance was investigated for (measured). More specifically, to assess the ability of pre-defined cutoffs to predict response to TMZ, we used a leave pair-out cross-validation strategy. Predefined search cutoffs were evaluated on unknown samples 330, 308, and 250 times with LC-MS, RNAseq, and MB data, respectively. Predefined cutoffs in LC-MS and RNA-seq show better mean predictive performance (82.1% and 72.2%, respectively) than the MB model (68.0%), which is typical. The results are shown in FIG.

各種分類アルゴリズム及びトレーニングデータ(すなわち、シングル変数対マルチ変数)の影響をさらに調べるために、本発明者らは、タンパク質、RNA、及びメチル化のデータを単独又は組合せで及びあらかじめ規定された閾値を用いて又は用いずに、いくつかのラーニングアプローチを実施した。図16から分かるように、タンパク質ベースモデルは、相対的に高い予測確度を有しており、3つすべての変数を用いたモデルは、それよりもさらに優れていた。確度を向上させるとともに臨床要件又はサンプル要件を単純化するさらなる試みで、本発明者らは、トレーニングデータとして前のTMZ試験を用いて10候補モデル(+3つのあらかじめ規定されたカットオフ)を構築し、測定されたメチル化を全RNAseqに基づいて回帰モデルを用いて「予測されたメチル化」で置き換えた。次いで、図17に模範的に示されるように、未知試験コホート(TEMIRI)で性能を試験した。この場合、トレーニングデータセットはTMZコホートであり、3つの第II相試験に由来するTMZの治療を受けた41名のmCRC患者を含んでいた。質量スペクトルによる連続MGMTタンパク質レベルさらにはRNAseqによるRNA発現データ及び連続MGMTメチル化パーセントデータは、すべての患者で入手可能であった。薬剤反応は2元薬剤反応データとして記した。試験データセットは、TMZ+イリノテカンの治療を受けた32名のmCRC患者を含んでいた。2元薬剤反応データは3名の患者で欠落しており。遺伝子発現値は14名の患者で利用可能であり、MGMTタンパク質発現データは21名の患者で利用可能であった。表13を参照されたい。 To further investigate the effects of various classification algorithms and training data (ie, single-variable vs. multi-variable), we set protein, RNA, and methylation data alone or in combination and with predetermined thresholds. Several learning approaches were performed with or without use. As can be seen from FIG. 16, the protein-based model had a relatively high predictive accuracy, and the model using all three variables was even better. In a further attempt to improve accuracy and simplify clinical or sample requirements, we constructed 10 candidate models (+3 pre-defined cutoffs) using previous TMZ trials as training data. , The measured methylation was replaced with "predicted methylation" using a regression model based on total RNAseq. Performance was then tested in an unknown test cohort (TEMIRI), as shown exemplary in FIG. In this case, the training dataset was a TMZ cohort and included 41 mCRC patients treated with TMZ from three Phase II trials. Continuous MGMT protein levels by mass spectrum as well as RNA expression data and continuous MGMT methylation percent data by RNAseq were available in all patients. The drug reaction is described as binary drug reaction data. The study dataset included 32 mCRC patients treated with TMZ + irinotecan. Dual drug response data are missing in 3 patients. Gene expression values were available in 14 patients and MGMT protein expression data were available in 21 patients. See Table 13.

Figure 2021501422
Figure 2021501422

本発明者らはさらに、メチル化を説明する及び/又は断定されたメチル化値を使用するより高い確度のマシンラーニング用回帰モデルを構築可能であることを企図する。図18は、回帰モデルを構築するための回帰及び分類のパイプラインを示す。表14に示されるように、MGMTタンパク質発現レベル及びMGMT RNAseqの両方をデータセットとして使用したとき、リグレッサーモデルのRMSE(残差の分散の平方根であり、データへのモデルの絶対的当てはまり、すなわち、観測データ点がモデルの予測値にどの程度近いかを表す)はより小さい(より良好に当てはまる)。 We further contemplate that it is possible to construct a regression model for machine learning with higher accuracy that describes methylation and / or uses asserted methylation values. FIG. 18 shows a regression and classification pipeline for building a regression model. As shown in Table 14, when both MGMT protein expression levels and MGMT RNAseq were used as datasets, the regressor model's RMSE (the square root of the variance of the residuals, which is the absolute fit of the model to the data, ie. , Represents how close the observed data points are to the predicted values of the model) is smaller (better fit).

Figure 2021501422
Figure 2021501422

図19は、全発現(すべてのRNAの発現レベル)及びMGMTタンパク質発現レベルをデータセットとしたときの各種リグレッサーモデルの平均確度値を示しており、これは表15にもまとめられる。 FIG. 19 shows the average accuracy values of various regressor models when the total expression (expression level of all RNA) and the MGMT protein expression level are used as a data set, which are also summarized in Table 15.

Figure 2021501422
Figure 2021501422

図20は、MGMT遺伝子発現及びMGMTタンパク質発現のレベルをデータセットとしたときの各種リグレッサーモデルの平均RMSE値を示しており、これは表16にもまとめられる。 FIG. 20 shows the mean squared RMSE values of various regressor models when the levels of MGMT gene expression and MGMT protein expression are used as a data set, which are also summarized in Table 16.

Figure 2021501422
Figure 2021501422

次いで、本発明者らは、断定されたメチル化値を用いてリグレッサーモデルを構築した。図21及び22は、断定されたメチル化値をデータセットとして使用したときの各種リグレッサーモデルの平均確度値を示しており、それぞれ、これは表17及び表18にもまとめられる。 We then constructed a regressor model using the asserted methylation values. 21 and 22 show the average accuracy values of the various regressor models when the asserted methylation values were used as the dataset, which are also summarized in Tables 17 and 18, respectively.

Figure 2021501422
Figure 2021501422

Figure 2021501422
Figure 2021501422

図23は、記載のごとくあらかじめ設定された閾値を用いて44サンプルにわたり1,000のほとんどの可変遺伝子について反応予測の模範的結果を有するヒートマップを示し、表14は、選択されたデータセット及びデータセットの組合せで使用した模範的分類アルゴリズムのリストである。再度分かるであろうが、MGMT RNAseq、MGMTタンパク質、及びMGMTプロモーターメチル化の使用は、テモゾロミドに対する反応予測の優れたトレーニング及び試験の確度を提供した。同様に、感度、特異度、及びF1スコアはすべて、他の分類器及び個別データセットよりも実質的に増加した。表19の最良モデルのサンプルレベル予測は表20に列挙されており、これから、他のモデルと比較したとき、タンパク質、MGMTメチル化、及びmRNAを同時に考慮したモデルはより良好に機能することが示唆される。 FIG. 23 shows a heatmap with exemplary results of response prediction for most of 1,000 variable genes over 44 samples using preset thresholds as described, and Table 14 shows the selected dataset and A list of exemplary classification algorithms used in the dataset combination. As you will see again, the use of MGMT RNAseq, MGMT protein, and MGMT promoter methylation provided excellent training and test accuracy for predicting response to temozolomide. Similarly, sensitivity, specificity, and F1 scores were all substantially increased over other classifiers and individual datasets. The sample level predictions for the best models in Table 19 are listed in Table 20, suggesting that models that simultaneously consider protein, MGMT methylation, and mRNA work better when compared to other models. Will be done.

Figure 2021501422
Figure 2021501422

Figure 2021501422
Figure 2021501422

TMZの治療を受けた難治性mCRC患者のこのレトロスペクティブ解析では、MGMTタンパク質に対するMSベース試験は、50%の感度及び100%の特異度を有していた。この小さな患者コホートでは、プロテオミック試験は、TMZに対する反応を予測するうえでディジタルMB及びRNA−seqのいずれよりも優れていた。さらに、あらかじめ規定された閾値(200amol/μg)未満のMGMTタンパク質発現は、mPFSの2倍増加に関連し、この関連は12の予測変数に依存しなかった。興味深いことに、LC−MSにより陽性MGMTタンパク質発現を有する患者は、TMZの臨床試験に参加したmCRC患者で報告されたものに類似したPFSを有していた。かかる試験の期待外れの結果は、TMZに対する最適候補者を選択するMSPなどの標準的MGMTアセスメント法の能力の限定を反映している可能性がある。本研究は、プロスペクティブ試験でLC−MSなどの代替MGMTプラットフォームのアセスメントを支援する。 In this retrospective analysis of patients with refractory mCRC treated with TMZ, MS-based trials for MGMT protein had 50% sensitivity and 100% specificity. In this small patient cohort, proteomic trials were superior to both digital MB and RNA-seq in predicting response to TMZ. In addition, MGMT protein expression below a predetermined threshold (200 amol / μg) was associated with a 2-fold increase in mPFS, which association was independent of the 12 predictors. Interestingly, patients with positive MGMT protein expression by LC-MS had a PFS similar to that reported in patients with mCRC who participated in TMZ clinical trials. The disappointing results of such tests may reflect the limited capabilities of standard MGMT assessment methods such as MSP to select the best candidate for TMZ. This study supports the assessment of alternative MGMT platforms such as LC-MS in prospective trials.

TMZ反応の予測因子としてのMGMTアッセイの確度及びロバスト性を交差検証設定条件で厳しく試験した。この実行時、プロテオミックMGMT試験は、82.1%の平均確度を有して他方の試験プラットフォームよりも優れていた。 The accuracy and robustness of the MGMT assay as a predictor of TMZ reaction was rigorously tested under cross-validation settings. At the time of this run, the proteomic MGMT test was superior to the other test platform with an average accuracy of 82.1%.

TMZに対する潜在的レスポンダーを同定する重要性は、TMZ治療mCRCのDNAミスマッチ修復が損なわれるときに認識されることに留意されたい。この場合、TMZレスポンダーは、安定マイクロサテライトから不安定マイクロサテライト(MSI)に切り替わることにより、免疫チェックポイント阻害剤による療法に適格となる。言い換えると、TMZで再発する患者は免疫療法を開始しうる。 It should be noted that the importance of identifying potential responders to TMZ is recognized when the DNA mismatch repair of TMZ-treated mCRC is impaired. In this case, the TMZ responder is eligible for immune checkpoint inhibitor therapy by switching from stable microsatellite to unstable microsatellite (MSI). In other words, patients who relapse with TMZ may initiate immunotherapy.

TMZに対する潜在的レスポンダーを同定する重要性は、TMZ治療mCRCのDNAミスマッチ修復の障害に関する最近発表された知見により強調され、この場合、TMZレスポンダーは、安定マイクロサテライトから不安定マイクロサテライト(MSI)に切り替わることにより、免疫チェックポイント阻害剤による療法に適格となる。このことから、TMZで再発する患者は免疫療法を開始しうることが示唆される。したがって、本発明者らはさらに、予測結果に基づいて患者に対する癌治療を推奨したり又は更新したりすることが可能であることを企図する。たとえば、患者がTMZに反応すると反応予測モデルにより予測される場合、腫瘍の治療に有効な用量及びスケジュールで患者にTMZを投与可能である。他の一例では、患者がもはやTMZに反応しないか又はTMZに対する反応性を実質的に低減している(たとえば、TMZの治療前と比較して又は癌の類似の予後を有する他の個体などと比較して少なくとも30%、少なくとも50%、少なくとも70%低減している)と反応予測モデルにより予測される場合、患者に免疫療法剤(たとえば、チェックポイント阻害剤、癌ワクチンなど)を投与可能である。 The importance of identifying potential responders to TMZ is highlighted by recently published findings regarding impaired DNA mismatch repair in TMZ-treated mCRCs, in which case TMZ responders change from stable microsatellite to unstable microsatellite (MSI). The switch qualifies for therapy with immune checkpoint inhibitors. This suggests that patients who relapse with TMZ may start immunotherapy. Therefore, we further contemplate that it is possible to recommend or update cancer treatments for patients based on the predicted results. For example, if a response prediction model predicts that a patient will respond to TMZ, TMZ can be administered to the patient at a dose and schedule that is effective in treating the tumor. In another example, the patient no longer responds to TMZ or has substantially reduced responsiveness to TMZ (eg, with other individuals having a similar prognosis for cancer compared to before TMZ treatment). Patients can be administered immunotherapeutic agents (eg, checkpoint inhibitors, cancer vaccines, etc.) if predicted by response prediction models to be at least 30%, at least 50%, and at least 70% reduced in comparison. is there.

本明細書で用いられる場合、薬剤又は癌治療剤を「投与する」という用語は、薬剤又は癌治療剤の直接投与及び間接投与の両方を意味する。薬剤又は癌治療剤の直接投与は、典型的には、ヘルスケア専門家(たとえば、医師、看護師など)により実施され、且つ間接投与は、直接投与(たとえば、注射、経口摂取、局所適用などを介して)のために薬剤又は癌治療剤をヘルスケア専門家に提供する工程又はヘルスケア専門家が利用できるようにする工程を含む。 As used herein, the term "administering" a drug or cancer therapeutic agent means both direct and indirect administration of the drug or cancer therapeutic agent. Direct administration of the drug or cancer therapeutic agent is typically performed by a healthcare professional (eg, doctor, nurse, etc.), and indirect administration is direct administration (eg, injection, oral ingestion, topical application, etc.). Includes the step of providing a drug or cancer therapeutic agent to a healthcare professional or making it available to a healthcare professional for (via).

本明細書及び以下の特許請求の範囲全体で用いられる場合、「a」、「an」、及び「the」の意味は、とくに文脈上明確に規定されない限り、複数形の参照語を含む。また、本明細書で用いられる場合、文脈上明確に規定されない限り、「in」の意味は「in」及び「on」を含む。また、本明細書で用いられる場合、文脈上とくに規定されない限り、「〜に結合される」という用語は、直接結合(互いに結合された2つの要素が互いに接触する)及び間接結合(少なくとも1つの追加の要素が2つの要素間に位置する)の両方を含むことが意図される。したがって、「〜に結合される」及び「〜と結合される」という用語は同義的に用いられる。最後に、文脈上逆の規定がない限り、本明細書に示される範囲はすべて、その端点を含むと解釈すべきであり、且つオープンエンドの範囲は、商業的に実用的な値を含むと解釈すべきである。同様に、値のリストはすべて、文脈上逆のことが示唆されない限り、中間値を含むとみなすべきである。 As used herein and throughout the claims below, the meanings of "a", "an", and "the" include plural references unless expressly specified in the context. Also, as used herein, the meaning of "in" includes "in" and "on" unless explicitly defined in the context. Also, as used herein, unless otherwise specified in the context, the term "bonded to" refers to direct binding (two elements coupled to each other contacting each other) and indirect coupling (at least one). It is intended to include both (an additional element is located between the two elements). Therefore, the terms "combined with" and "combined with" are used synonymously. Finally, unless contextually reversed, all ranges set forth herein should be construed to include their endpoints, and open-ended ranges include commercially practical values. Should be interpreted. Similarly, all lists of values should be considered to contain intermediate values unless the context suggests the opposite.

本明細書に記載の本発明の概念から逸脱することなく、すでに説明したもの以外のより多くの変更が可能であることは、当業者には明らかなはずである。したがって、本発明の主題は、添付の特許請求の範囲内でない限り制限すべきではない。さらに、本明細書及び特許請求の範囲の両方を解釈する際、用語はすべて、文脈に矛盾しない可能な限り最広義に解釈すべきである。特定的には、「comprises(〜を含む)」及び「comprising(〜を含む)」という用語は、要素、成分、又は工程を非排他的に参照するものとして解釈すべきであり、参照された要素、成分、又は工程が存在しうるか、又はそれらを利用しうるか、又は明示的に参照されない他の要素、成分、又は工程と組み合わせうることを示唆する。本明細書の特許請求の範囲がA、B、C....及びNからなる群から選択される何かの少なくとも1つのものを参照する場合、その文言は、A+N、B+Nなどではなくその群の1つの要素のみを必要とすると解釈すべきである。 It should be apparent to those skilled in the art that more modifications than those already described can be made without departing from the concepts of the invention described herein. Therefore, the subject matter of the present invention should not be limited unless it is within the scope of the appended claims. Moreover, in interpreting both the present specification and the claims, all terms should be interpreted in the broadest possible sense consistent with the context. Specifically, the terms "comprises" and "comprising" should be construed and referenced as non-exclusive references to elements, components, or processes. It suggests that elements, components, or processes may exist, or that they may be utilized, or that they may be combined with other elements, components, or processes that are not explicitly referenced. The claims of the present specification are A, B, C.I. .. .. .. When referring to at least one of something selected from the group consisting of and N, the wording should be interpreted as requiring only one element of the group, not A + N, B + N, etc.

Claims (18)

患者においてテモゾロミドに対する治療反応を予測する方法であって、
前記患者の腫瘍からRNAseq情報、タンパク質定量情報、及びメチル化情報を提供することと、
反応予測モデルによりテモゾロミドに対する反応予測を計算することであって、前記反応予測モデルが、前記RNAseq情報、タンパク質定量情報、及びメチル化情報を使用する、計算することと、
を含む方法。
A method of predicting therapeutic response to temozolomide in patients.
To provide RNAseq information, protein quantification information, and methylation information from the patient's tumor.
To calculate the reaction prediction for temozolomide by the reaction prediction model, that the reaction prediction model uses the RNAseq information, the protein quantification information, and the methylation information.
How to include.
前記反応予測モデルがK最近傍アプローチを使用する、請求項1に記載の方法。 The method of claim 1, wherein the reaction prediction model uses a K-nearest neighbor approach. 前記RNAseq情報、タンパク質定量情報、及びメチル化情報がサブグループ化される、請求項1又は2に記載の方法。 The method according to claim 1 or 2, wherein the RNAseq information, protein quantification information, and methylation information are subgrouped. 前記RNAseq情報が、3.5のlog2(TPM+1)カットオフ値を用いてサブグループ化される、請求項3に記載の方法。 The method of claim 3, wherein the RNAseq information is subgrouped using a log2 (TPM + 1) cutoff value of 3.5. 前記タンパク質定量情報が、200amol/mLのカットオフ値を用いてサブグループ化される、請求項3に記載の方法。 The method of claim 3, wherein the protein quantification information is subgrouped using a cutoff value of 200 amol / mL. 前記メチル化情報が、60%プロモーターCpGメチル化のカットオフ値を用いてサブグループ化される、請求項3に記載の方法。 The method of claim 3, wherein the methylation information is subgrouped using the cutoff value of 60% promoter CpG methylation. 前記RNAseq情報、タンパク質定量情報、及びメチル化情報が、FFPEサンプル又はフレッシュ腫瘍サンプルから提供される、請求項1〜6のいずれか一項に記載の方法。 The method according to any one of claims 1 to 6, wherein the RNAseq information, protein quantification information, and methylation information are provided from an FFPE sample or a fresh tumor sample. 前記腫瘍が固形腫瘍である、請求項1〜7のいずれか一項に記載の方法。 The method according to any one of claims 1 to 7, wherein the tumor is a solid tumor. 前記腫瘍が転移結腸癌、膠芽細胞腫、又は黒色腫である、請求項1〜8のいずれか一項に記載の方法。 The method according to any one of claims 1 to 8, wherein the tumor is metastatic colon cancer, glioblastoma, or melanoma. 前記反応予測モデルが少なくとも85%の予測確度を有する、請求項1〜9のいずれか一項に記載の方法。 The method according to any one of claims 1 to 9, wherein the reaction prediction model has a prediction accuracy of at least 85%. 前記RNAseq情報、タンパク質定量情報、及びメチル化情報がサブグループ化される、請求項1に記載の方法。 The method of claim 1, wherein the RNAseq information, protein quantification information, and methylation information are subgrouped. 前記RNAseq情報が、3.5のlog2(TPM+1)カットオフ値を用いてサブグループ化される、請求項11に記載の方法。 The method of claim 11, wherein the RNAseq information is subgrouped using a log2 (TPM + 1) cutoff value of 3.5. 前記タンパク質定量情報が、200amol/mLのカットオフ値を用いてサブグループ化される、請求項11に記載の方法。 The method of claim 11, wherein the protein quantification information is subgrouped using a cutoff value of 200 amol / mL. 前記メチル化情報が、60%プロモーターCpGメチル化のカットオフ値を用いてサブグループ化される、請求項11に記載の方法。 The method of claim 11, wherein the methylation information is subgrouped using the cutoff value of 60% promoter CpG methylation. 前記RNAseq情報、タンパク質定量情報、及びメチル化情報が、FFPEサンプル又はフレッシュ腫瘍サンプルから提供される、請求項1に記載の方法。 The method of claim 1, wherein the RNAseq information, protein quantification information, and methylation information are provided from an FFPE sample or a fresh tumor sample. 前記腫瘍が固形腫瘍である、請求項1に記載の方法。 The method of claim 1, wherein the tumor is a solid tumor. 前記腫瘍が転移結腸癌、膠芽細胞腫、又は黒色腫である、請求項1に記載の方法。 The method of claim 1, wherein the tumor is metastatic colon cancer, glioblastoma, or melanoma. 前記反応予測モデルが少なくとも85%の予測確度を有する、請求項1に記載の方法。 The method of claim 1, wherein the reaction prediction model has a prediction accuracy of at least 85%.
JP2020524174A 2017-10-30 2018-10-26 Temozolomide reaction predictors and methods Pending JP2021501422A (en)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201762579127P 2017-10-30 2017-10-30
US62/579,127 2017-10-30
US201862727245P 2018-09-05 2018-09-05
US62/727,245 2018-09-05
PCT/US2018/057843 WO2019089393A1 (en) 2017-10-30 2018-10-26 Temozolomide response predictor and methods

Publications (1)

Publication Number Publication Date
JP2021501422A true JP2021501422A (en) 2021-01-14

Family

ID=66333325

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020524174A Pending JP2021501422A (en) 2017-10-30 2018-10-26 Temozolomide reaction predictors and methods

Country Status (7)

Country Link
JP (1) JP2021501422A (en)
KR (1) KR20200079524A (en)
CN (1) CN111492435A (en)
AU (1) AU2018362347A1 (en)
CA (1) CA3080342A1 (en)
TW (1) TW201923635A (en)
WO (1) WO2019089393A1 (en)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5731304A (en) * 1982-08-23 1998-03-24 Cancer Research Campaign Technology Potentiation of temozolomide in human tumour cells
WO2012009382A2 (en) * 2010-07-12 2012-01-19 The Regents Of The University Of Colorado Molecular indicators of bladder cancer prognosis and prediction of treatment response
KR20130138779A (en) * 2010-09-23 2013-12-19 카운슬 오브 사이언티픽 앤드 인더스트리얼 리서치 Top2a inhibition by temozolomide useful for predicting gbm patient's survival
WO2016118527A1 (en) * 2015-01-20 2016-07-28 Nantomics, Llc Systems and methods for response prediction to chemotherapy in high grade bladder cancer

Also Published As

Publication number Publication date
TW201923635A (en) 2019-06-16
KR20200079524A (en) 2020-07-03
CN111492435A (en) 2020-08-04
WO2019089393A1 (en) 2019-05-09
AU2018362347A1 (en) 2020-05-14
CA3080342A1 (en) 2019-05-09

Similar Documents

Publication Publication Date Title
Robertson et al. Comprehensive molecular characterization of muscle-invasive bladder cancer
JP7455757B2 (en) Machine learning implementation for multianalyte assay of biological samples
Ross et al. Tissue-based genomics augments post-prostatectomy risk stratification in a natural history cohort of intermediate-and high-risk men
US20190292600A1 (en) Nasal epithelium gene expression signature and classifier for the prediction of lung cancer
Tembe et al. MicroRNA and mRNA expression profiling in metastatic melanoma reveal associations with BRAF mutation and patient prognosis
JP7340021B2 (en) Tumor classification based on predicted tumor mutational burden
EP3494235A1 (en) Swarm intelligence-enhanced diagnosis and therapy selection for cancer using tumor- educated platelets
US11814687B2 (en) Methods for characterizing bladder cancer
JP2021502074A (en) Normalization of tumor gene mutation amount
Reinert et al. Circulating tumor DNA for prognosis assessment and postoperative management after curative‐intent resection of colorectal liver metastases
EP3964589A1 (en) Assessing colorectal cancer molecular subtype and uses thereof
Sun et al. Genomic instability-associated lncRNA signature predicts prognosis and distinct immune landscape in gastric cancer
Widman et al. Machine learning guided signal enrichment for ultrasensitive plasma tumor burden monitoring
Lau et al. Single-molecule methylation profiles of cell-free DNA in cancer with nanopore sequencing
WO2022212590A1 (en) Systems and methods for multi-analyte detection of cancer
WO2020092101A1 (en) Consensus molecular subtypes sidedness classification
Parasramka et al. Validation of gene expression signatures to identify low-risk clear-cell renal cell carcinoma patients at higher risk for disease-related death
US20220301654A1 (en) Systems and methods for predicting and monitoring treatment response from cell-free nucleic acids
JP2021501422A (en) Temozolomide reaction predictors and methods
Ragulan et al. A low-cost multiplex biomarker assay stratifies colorectal cancer patient samples into clinically-relevant subtypes
Deng et al. Multi‐omics integration reveals a core network involved in host defence and hyperkeratinization in psoriasis
CN111670255A (en) BAM characteristics from liquid and solid tumors and uses thereof
TW201926094A (en) Subtyping of TNBC and methods
US20230416841A1 (en) Inferring transcription factor activity from dna methylation and its application as a biomarker
US20230326554A1 (en) Identifying treatment response signatures

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200707