JP2020523991A

JP2020523991A - Ｐｒａｅｇｎａｎｔ転移性乳癌コホートにおける不良アウトカムの予後指標因子

Info

Publication number: JP2020523991A
Application number: JP2019569362A
Authority: JP
Inventors: ゼトー，クリストファー; チャールズベンツ，スティーブン; グエン，アンドリュー
Original assignee: ナントミクス，エルエルシー
Priority date: 2017-06-16
Filing date: 2018-06-15
Publication date: 2020-08-13
Also published as: KR20200010576A; IL271479A; WO2018232320A3; AU2018283369A1; EP3639277A2; CN110770849A; WO2018232320A2; CA3066930A1; US20210142864A1; SG11201911820RA

Abstract

転移性乳癌と診断された患者の腫瘍組織からのトランスクリプトミクスデータがクラスタリングされ、且つ患者の全生存と関連付けられる。不良アウトカムと関連するクラスタの１つからの遺伝子のサブセットは、複数の遺伝子の発現レベルに基づいて生存期間を予測する生存予測モデルを作成するために使用される。このように作成された生存予測モデルを使用して、転移性乳癌と診断された患者の生存期間が予測され得、及びその生存期間に基づいて治療レジメンが更新又は作成され得る。

Description

本出願は、２０１７年６月１６日に出願された本出願人らの同時係属米国仮特許出願第６２／５２１，２６７号明細書及び２０１７年１２月４日に出願された同第６２／５９４，３４５号明細書に対する優先権を主張する。

本発明の分野は、転移性乳癌患者の予後及び／又は生存を予測するために使用され得る転移性乳癌の分子プロファイルを同定するシステム及び方法である。

本明細書における全ての刊行物及び特許出願は、それぞれの個々の刊行物又は特許出願が参照により組み込まれることが具体的及び個別的に示されるのと同程度に参照により組み込まれる。組み込まれる参照文献における用語の定義又は使用が、本明細書に提供されるその用語の定義と不一致であるか又は逆である場合、本明細書に提供されるその用語の定義が適用され、参照文献におけるその用語の定義は適用されない。

初回診断時、乳癌は、典型的には、種々の基準、例としてグレード、病期及び組織病理を使用して分類される。ここ１０年にわたり、分子的特徴付けも考慮されるようになっており、それとしては、典型的には、受容体状態、特にエストロゲン受容体（ＥＲ）、プロゲステロン受容体（ＰＲ）及びヒト上皮成長因子受容体２（ＨＥＲ２）が挙げられる。さらに、多数の遺伝子ベーステストが癌のさらなるサブタイピングにおいて一般的になっている。

例えば、トリプルネガティブ乳癌（ＴＮＢＣ）を、化学療法に対して観察される治療応答のレトロスペクティブ分析に基づき、いくつかの分子的に区別されるサブグループの分子サブタイプにリファインする労力が払われている（例えば、ＰＬＯＳＯＮＥ｜ＤＯＩ：１０．１３７１／ｊｏｕｒｎａｌ．ｐｏｎｅ．０１５７３６８Ｊｕｎｅ１６、２０１６を参照されたい）。同様に、ＴＮＢＣについてのサブタイプは、ＴＮＢＣの５つの潜在的な臨床的に実用可能なグルーピングに基づいて定義された：１）ＤＮＡ修復欠損又は成長因子経路を有するベーサルライクＴＮＢＣ；２）上皮間葉移行及び癌幹細胞特徴を有する間葉様ＴＮＢＣ；３）免疫関連ＴＮＢＣ；４）アンドロゲン受容体過剰発現を有するルミナール／アポクリンＴＮＢＣ；並びに５）ＨＥＲ２エンリッチドＴＮＢＣ（例えば、Ｏｎｃｏｔａｒｇｅｔ，Ｖｏｌ．６、Ｎｏ．１５；ｐｐ１２８９０−１２９０８を参照されたい）。さらに別の研究（例えば、ＪＢｒｅａｓｔＣａｎｃｅｒ２０１６Ｓｅｐｔｅｍｂｅｒ；１９（３）：２２３−２３０を参照されたい）において、ＴＮＢＣのサブタイプは、ベーサルライク、間葉、ルミナールアンドロゲン受容体及び免疫エンリッチド（ｉｍｍｕｎｅｅｎｒｉｃｈｅｄ）と同定された。一層さらなる公知の研究において、発現サブタイピングが実施され、テストされた患者サンプルのうちの３つのサブクラスタが同定された（例えば、ＢｒｅａｓｔＣａｎｃｅｒＲｅｓｅａｒｃｈ（２０１５）１７：４３を参照されたい）。同様に、ＴＮＢＣを遺伝子発現により分類するためのオンライン分類ツール（ＵＲＬ：ｃｂｃ．ｍｃ．ｖａｎｄｅｒｂｉｌｔ．ｅｄｕ／ｔｎｂｃ；ＣａｎｃｅｒＩｎｆｏｒｍａｔｉｃｓ２０１２：１１１４７−１５６）が公開され、それは、ＴＮＢＣデータを６つの区別されるサブタイプに分類する。

しかしながら、乳癌が転移性乳癌である場合、患者は、新規標的療法にかかわらず、極めて不所望な予後を有することが多い。さらに、進行性／転移性乳癌を有する患者についての予後及び予測因子は、十分に理解されていない。実際、転移性状況における患者及び腫瘍の分子的評価は、この患者群への多大な利益を示す分子プレシジョンメディシンの進歩に関わらず、定型的に実施されていない。

したがって、乳癌を分類する種々のシステム及び方法は、当技術分野において公知であるが、転移性乳癌の分子的特徴付けは、十分に理解されていない。したがって、転移性乳癌の分子的特徴付けを可能とするシステム及び方法が必要とされ続けている。

本発明の主題は、転移性乳癌組織の遺伝子発現プロファイルを使用して患者の全生存期間と有意に関連する遺伝子のクラスタを同定する種々のシステム及び方法を対象とする。次いで、このように同定されたクラスタを使用して、複数の患者の少なくとも一部の不良生存と関連する少なくとも１つのクラスタ中の複数の遺伝子の発現レベルに基づき、生存期間を予測する生存予測モデルを作成することができる。

したがって、本発明の主題の一態様としては、転移性乳癌についての生存予測モデルを作成する方法が挙げられる。この方法は、転移性乳癌と診断された複数の患者のトランスクリプトミクスデータを得るステップを含む。次いで、完全ピアソン相関を使用して、複数のクラスタへのトランスクリプトミクスデータを複数のクラスタにクラスタリングする。典型的には、トランスクリプトミクスデータは、少なくとも１，０００個の遺伝子のＲＮＡ−ｓｅｑデータ及び／又はＲＮＡ発現レベルを含み、クラスタの数は、エルボー法を使用して決定される。複数のクラスタのうち、複数のクラスタを複数の患者の全生存と相関させることにより、複数の患者の少なくとも一部の不良生存と関連するものとして少なくとも１つのクラスタを同定する。好ましくは、複数のクラスタは、複数の患者の全生存と示差的に相関される。次いで、複数の遺伝子の発現レベルに基づき、生存期間を予測する生存予測モデルを作成する。好ましくは、複数の遺伝子は、複数の患者の少なくとも一部の不良生存と関連する少なくとも１つのクラスタ中に存在し、ＷＮＴシグナリング経路又は多能性経路と関連する少なくとも１つの遺伝子を含む。さらに、少なくとも１つのクラスタは、１．３超のハザード比を有することが好ましい。

好ましくは、複数の遺伝子は、複数の遺伝子の発現レベルの関数における複数の患者のうちの短期生存者（ｌｏｗｓｕｒｖｉｖｏｒ）からの長期生存者（ｈｉｇｈｓｕｒｖｉｖｏｒ）の分離の質に基づき、少なくとも１つのクラスタのトランスクリプトミクスデータのうちから選択される。一部の実施形態において、複数の遺伝子は、５０個未満である。他の実施形態において、複数の遺伝子は、ＴＭＥＭ２５７、ＦＡＭ１８０Ｂ、ＷＮＴ１１、ＣＴＤＳＰＬ、ＰＲＯＫ１、ＧＡＤ２、ＧＲＫ７、ＦＺＤ６、ＫＲＴＡＰ５０５、ＫＲＴ３１、ＰＲＡＭＥＦ１２、ＳＹＮＧＲ４、ＳＯＸ２、ＢＨＬＨＡ９、ＰＯＵ１Ｆ１、ＫＨＮＹＮ、ＣＡＣＮＡ２Ｄ４、Ｃ３ｏｒｆ３６、ＲＨＯＸＦ２、ＰＡＢＰＮ１Ｌ、ＥＩＤ２Ｂ、ＢＢＳ４、ＡＧＰＳ、ＥＦＣＣ１、ＲＯＢＯ２、ＣＭＴＭ４、ＴＨＴＰＡ、ＺＰ４、ＨＩＳＴ１Ｈ２ＢＥ、ＬＯＣ２８６２３８、ＩＦＮＬ２、ＤＧＫＫ、ＧＮＧＴ１、ＵＳＰ１７Ｌ３０及びＥＲＮ１からなる群から選択される。

さらに、方法は、予測生存期間を患者の実際の生存期間と比較することにより、生存予測モデルのｃ統計量を計算することをさらに含み得る。好ましくは、生存予測モデルのｃ統計量は、０．７超である。

本発明の主題の別の態様において、本発明者らは、転移性乳癌と診断された患者の生存期間を予測する方法を企図する。この方法において、患者の腫瘍組織のトランスクリプトミクスデータを得、トランスクリプトミクスデータからの複数の遺伝子のＲＮＡ発現レベルを決定する。典型的には、トランスクリプトミクスデータは、ＲＮＡ−ｓｅｑデータを含む。生存予測モデルを使用して、ＲＮＡ発現レベルに基づいて患者の生存期間を予測することができる。最も好ましくは、複数の遺伝子のうちの少なくとも２つの遺伝子は、Ｗｎｔシグナリング経路又は多能性経路と関連する。

最も典型的には、複数の遺伝子の数は、５０個未満である。好ましくは、複数の遺伝子は、ＴＭＥＭ２５７、ＦＡＭ１８０Ｂ、ＷＮＴ１１、ＣＴＤＳＰＬ、ＰＲＯＫ１、ＧＡＤ２、ＧＲＫ７、ＦＺＤ６、ＫＲＴＡＰ５０５、ＫＲＴ３１、ＰＲＡＭＥＦ１２、ＳＹＮＧＲ４、ＳＯＸ２、ＢＨＬＨＡ９、ＰＯＵ１Ｆ１、ＫＨＮＹＮ、ＣＡＣＮＡ２Ｄ４、Ｃ３ｏｒｆ３６、ＲＨＯＸＦ２、ＰＡＢＰＮ１Ｌ、ＥＩＤ２Ｂ、ＢＢＳ４、ＡＧＰＳ、ＥＦＣＣ１、ＲＯＢＯ２、ＣＭＴＭ４、ＴＨＴＰＡ、ＺＰ４、ＨＩＳＴ１Ｈ２ＢＥ、ＬＯＣ２８６２３８、ＩＦＮＬ２、ＤＧＫＫ、ＧＮＧＴ１、ＵＳＰ１７Ｌ３０及びＥＲＮ１からなる群から選択される。

好ましくは、生存予測モデルは、転移性乳癌と診断された複数の患者のトランスクリプトミクスデータを得ることによって作成される。次いで、完全ピアソン相関を使用して、複数のクラスタへのトランスクリプトミクスデータを複数のクラスタにクラスタリングする。典型的には、トランスクリプトミクスデータは、少なくとも１，０００個の遺伝子のＲＮＡ−ｓｅｑデータ及び／又はＲＮＡ発現レベルを含み、クラスタの数は、エルボー法を使用して決定される。複数のクラスタのうち、複数のクラスタを複数の患者の全生存と相関させることにより、複数の患者の少なくとも一部の不良生存と関連するものとして少なくとも１つのクラスタを同定する。好ましくは、複数のクラスタは、複数の患者の全生存と示差的に相関される。この方法において生存期間を予測するために使用される複数の遺伝子は、複数の遺伝子の発現レベルの関数における複数の患者のうちの短期生存者からの長期生存者の分離の質に基づき、少なくとも１つのクラスタから選択され得る。さらに、少なくとも１つのクラスタは、１．３超のハザード比を有することが好ましい。

さらに、生存予測モデルのｃ統計量は、予測生存期間を患者の実際の生存期間と比較することによって計算され得る。好ましくは、生存予測モデルのｃ統計量は、０．７超である。

さらに、方法は、予測生存期間に基づき、患者記録を更新若しくは作成するステップ及び／又は予測生存期間に基づき、患者のための治療レジメンを修正するステップを含み得る。

本発明の主題のさらに別の態様において、本発明者らは、転移性乳癌と診断された患者のための治療レジメンを作成又は更新する方法を企図する。この方法において、患者の腫瘍組織のトランスクリプトミクスデータを得、トランスクリプトミクスデータからの複数の遺伝子のＲＮＡ発現レベルを決定する。典型的には、トランスクリプトミクスデータは、ＲＮＡ−ｓｅｑデータを含む。次いで、生存予測モデルを使用して、ＲＮＡ発現レベルに基づいて患者の生存期間を予測することができる。方法は、Ｗｎｔシグナリング経路又は多能性経路の経路要素を標的化する少なくとも１つの薬剤を含むように治療レジメンを作成又は更新するステップで続く。

最も典型的には、複数の遺伝子の数は、５０個未満である。好ましくは、複数の遺伝子は、ＴＭＥＭ２５７、ＦＡＭ１８０Ｂ、ＷＮＴ１１、ＣＴＤＳＰＬ、ＰＲＯＫ１、ＧＡＤ２、ＧＲＫ７、ＦＺＤ６、ＫＲＴＡＰ５０５、ＫＲＴ３１、ＰＲＡＭＥＦ１２、ＳＹＮＧＲ４、ＳＯＸ２、ＢＨＬＨＡ９、ＰＯＵ１Ｆ１、ＫＨＮＹＮ、ＣＡＣＮＡ２Ｄ４、Ｃ３ｏｒｆ３６、ＲＨＯＸＦ２、ＰＡＢＰＮ１Ｌ、ＥＩＤ２Ｂ、ＢＢＳ４、ＡＧＰＳ、ＥＦＣＣ１、ＲＯＢＯ２、ＣＭＴＭ４、ＴＨＴＰＡ、ＺＰ４、ＨＩＳＴ１Ｈ２ＢＥ、ＬＯＣ２８６２３８、ＩＦＮＬ２、ＤＧＫＫ、ＧＮＧＴ１、ＵＳＰ１７Ｌ３０及びＥＲＮ１からなる群から選択される。代わりに、複数の遺伝子は、ＷＮＴ１１、ＳＯＸ２及びＦＺＤ６を含む。

さらに、生存予測モデルのｃ統計量は、予測生存期間を患者の実際の生存期間と比較することによって計算され得る。好ましくは、生存予測モデルのｃ統計量は、０．７超である。さらに、方法は、予測生存期間に基づき、患者記録を更新又は作成するステップを含み得る。

本発明の主題の種々の目的、特徴部、態様及び利点は、添付の図面に加えて好ましい実施形態の以下の詳細な説明からより明らかになる。

ＰＲＡＥＧＮＡＮＴ試験プログラムの概略的説明である。免疫組織化学（ＩＨＣ）グルーピングにより階層化されたＰＲＡＥＧＮＡＮＴ試験プログラムにおける全生存（ＯＳ）を示すグラフである。ＰＡＭ５０サブタイプグルーピングにより階層化されたＰＲＡＥＧＮＡＮＴ試験プログラムにおける全生存（ＯＳ）を示すグラフである。１，０００個の最も変動して発現される遺伝子及び完全ピアソン相関を使用した５つのクラスタへのクラスタリングについての例示的なヒートマップである。図４において決定された遺伝子の５つのクラスタの遺伝子発現レベルにより階層化されたＰＲＡＥＧＮＡＮＴ試験プログラムにおける全生存（ＯＳ）を示すグラフである。それぞれクラスタ５及び２における最不良生存グルーピング（６Ａ）及び最良好生存グルーピング（６Ｂ）についての例示的なベン図グラフを示す。訓練データセット及び評価データセットを用いた例示的な死亡までの時間の予測グラフを示す。生存予測モデルにおいて使用された３５個の遺伝子のヒートマップを示す。

ここで、本発明者らは、転移性乳癌と診断された患者の腫瘍組織から決定された遺伝子の発現プロファイリングを使用して、転移性乳癌患者の異なるレベルの全生存と関連する遺伝子発現パターンのクラスタを作成できることを発見した。本発明者らは、このように作成されたクラスタ、より具体的には転移性乳癌患者の不良予後又は不良生存と関連する高リスククラスタが、不良予後を有する患者の生存期間又は死亡までの時間を予測するための他のマーカー又はサブタイピング法よりも良好な指標因子であり得ることをさらに発見した。高リスククラスタ中の遺伝子のうち、本発明者らは、高精度の予測モデルを作成するために使用することができる、生存期間と最も実質的に関連する遺伝子の小さいサブセットを同定することができた。

異なる観点から考慮すると、患者の生存期間又は死亡までの時間は、トランスクリプトミクスを、患者の異なる生存期間又は死亡までの時間に関連する複数のクラスタにクラスタリングすることにより同定された遺伝子のグループの発現プロファイリングを決定することにより、より高信頼度で予測できることを本発明者らは発見した。遺伝子のグループの遺伝子の数は、機械学習を使用して低減させることができる一方、予測の信頼性及び精度を維持又はさらに増加させ、そうして患者の生存期間の正確な予測を提供するために処理されるデータの量を低減させ得ることを本発明者らはさらに見出した。結果的に、本発明の主題の１つの特に好ましい態様において、本発明者らは、転移性乳癌と診断された複数の患者のトランスクリプトミクスデータを使用し、トランスクリプトミクスデータを、少なくとも１つが患者の不良生存と関連する複数のクラスタにクラスタリングして、転移性乳癌についての生存予測モデルを作成する方法を企図する。このようにクラスタリングされたトランスクリプトミクスデータからの遺伝子のサブセット及び／又はその発現パターンを同定し、全生存と関連付け、そうして高信頼性の生存予測モデルを作成し得る。

本明細書において使用される用語「腫瘍」は、ヒト体内の１つ以上の解剖学的部位に位置するか又は見出され得る１つ以上の癌細胞、癌組織、悪性腫瘍細胞又は悪性腫瘍組織を指し、それらと互換的に使用される。本明細書において使用される用語「患者」には、病態（例えば、癌）と診断された個体並びに病態を検出又は同定する目的で検査及び／又はテストを受ける個体の両方が含まれることに留意すべきである。したがって、腫瘍を有する患者は、癌と診断された個体及び癌を有する疑いがある個体の両方を指す。本明細書において使用される用語「提供する」又は「提供すること」は、製造し、作成し、配置し、使用可能とし、移し、又は使用準備する任意の動作を指し、その用語にはそれらが含まれる。

トランスクリプトミクスデータの取得
オミクスデータ、特にトランスクリプトミクスデータを得る任意の好適な方法及び／又は手順が企図される。例えば、トランスクリプトミクスデータは、個体から組織を得、その組織を処理してその組織からＲＮＡを得、関連情報をさらに分析することにより得ることができる。別の例において、トランスクリプトミクスデータは、個体のトランスクリプトミクス情報を保存するデータベースから直接得ることができる。

個体の組織からオミクスデータを得る場合、患者から腫瘍サンプル（腫瘍細胞若しくは腫瘍組織）又は健常組織を得る任意の好適な方法が企図される。最も典型的には、腫瘍サンプル又は健常組織サンプルは、生検（例として、液体生検又は外科手術中若しくは独立した生検手順の組織切除を介して得られるものなど）を介して患者から得ることができ、それは、組織からオミクスデータを得るさらなるプロセスまで新鮮物又は処理物（例えば、冷凍物など）であり得る。例えば、組織又は細胞は、新鮮物又は冷凍物であり得る。他の例において、組織又は細胞は、細胞／組織抽出物の形態であり得る。一部の実施形態において、組織又は細胞は、単一又は複数の異なる組織又は解剖学的領域から得ることができる。例えば、転移性乳癌組織は、患者の乳房及び転移乳癌組織についての他の器官（例えば、肝臓、脳、リンパ節、血液、肺など）から得ることができる。別の例において、患者の健常組織又は対応する正常組織（例えば、患者の非癌性乳房組織）は、身体又は器官の任意の部分、好ましくは肝臓、血液又は腫瘍付近（解剖学的距離が近いなど）の任意の他の組織から得ることができる。

一部の実施形態において、腫瘍サンプルを複数の時点で患者から得て、関連期間にわたる腫瘍サンプルの任意の変化を決定することができる。例えば、腫瘍サンプル（又は疑いがある腫瘍サンプル）は、サンプルが癌性と決定又は診断される前及びその後に得ることができる。別の例において、腫瘍サンプル（又は疑いがある腫瘍サンプル）は、１回又は一連の抗腫瘍治療（例えば、放射線療法、化学療法、免疫療法など）前、その間及び／又はその後（例えば、完了時など）に得ることができる。さらに別の例において、腫瘍サンプル（又は疑いがある腫瘍サンプル）は、新たな転移組織又は細胞の同定時に腫瘍の進行の間に得ることができる。

得られた腫瘍サンプル（細胞若しくは組織）又は健常サンプル（サンプル若しくは組織）からＲＮＡ（例えば、ｍＲＮＡ、ｍｉＲＮＡ、ｓｉＲＮＡ、ｓｈＲＮＡなど）を単離し、さらに分析してトランスクリプトミクスデータを得ることができる。代わりに及び／又は加えて、トランスクリプトミクスデータを得るステップは、１人以上の患者及び／又は健常個体のトランスクリプトミクス情報を保存するデータベースからトランスクリプトミクスデータを受容することを含み得る。例えば、患者の腫瘍のトランスクリプトミクスデータは、患者の腫瘍組織からの単離ＲＮＡから得ることができ、得られたオミクスデータは、同一タイプの腫瘍又は異なるタイプの腫瘍を有する他の患者の他のトランスクリプトミクスデータセットとデータベース（例えば、クラウドデータベース、サーバなど）に保存することができる。患者の健常個体又は対応する正常組織（若しくは健常組織）から得られたトランスクリプトミクスデータも、分析時にデータベースから関連データセットを検索することができるようにデータベースに保存することができる。

癌及び／又は正常細胞のトランスクリプトミクスデータは、患者から、患者又は健常個体の癌組織（罹患組織）及び／又は対応する健常組織から得られたＲＮＡ（好ましくは、細胞ｍＲＮＡ）の配列情報及び／又は発現レベル（例として、発現プロファイリング、コピー数又はスプライスバリアント分析）を含む。当技術分野において公知のトランスクリプトミック分析の多数の方法が存在し、公知の方法の全てが本明細書における使用に好適であると考えられる（例えば、ＲＮＡｓｅｑ、ＲＮＡハイブリダイゼーションアレイ、ｑＰＣＲなど）。結果的に、好ましい材料としては、ｍＲＮＡ及び一次転写産物（ｈｎＲＮＡ）が挙げられ、ＲＮＡ配列情報は、同一患者の腫瘍サンプル及び対応する正常（健常）サンプルから順次得られた逆転写ポリＡ^＋−ＲＮＡから得ることができる。同様に、ポリＡ^＋−ＲＮＡは、典型的にはトランスクリプトームの代表物として好ましい一方、ＲＮＡの他の形態（ｈｎ−ＲＮＡ、非ポリアデニル化ＲＮＡ、ｓｉＲＮＡ、ｍｉＲＮＡなど）も本明細書における使用に好適であると考えられることに留意すべきである。好ましい方法としては、定量的ＲＮＡ（ｈｎＲＮＡ又はｍＲＮＡ）分析、特に例としてＲＮＡｓｅｑ、ｑＰＣＲ及び／又はｒｔＰＣＲベースの方法が挙げられるが、種々の代替法（例えば、固相ハイブリダイゼーションベースの方法）も好適であると考えられる。

特定の疾患（例えば、癌など）、病期又は分析のタイプのために１つ以上の所望の核酸又は遺伝子を選択できることを認識すべきである。好ましくは、トランスクリプトミクスデータは、変動発現遺伝子のＲＮＡ発現レベルを含む。本明細書において使用される変動発現遺伝子は、発現レベルがサンプル間で少なくとも１０％、好ましくは少なくとも２０％、より好ましくは少なくとも３０％、最も好ましくは少なくとも５０％変動する任意の遺伝子を指す。したがって、トランスクリプトミクスデータに含まれる遺伝子の数は、特定の疾患（例えば、癌など）、病期又は分析のタイプに応じて変動し得る。最も典型的には、転移性乳癌組織のトランスクリプトミクスデータにおいて、トランスクリプトミクスデータに含めるべき変動発現遺伝子の数は、少なくとも３００個の遺伝子、好ましくは少なくとも５，００個の遺伝子、より好ましくは少なくとも１，０００個の遺伝子、最も好ましくは少なくとも１，５００個の遺伝子である。

患者からトランスクリプトミクスデータを得る１つの例示的なプロトコル及び／又はデータベースとしては、企図されるトランスクリプトミックプロファイリングを含み、腫瘍／患者分子的特徴のリアルタイム包括的分析のためのインフラストラクチャを提供するように設計されるプロスペクティブ分子乳癌レジストリ（ＰＲＡＥＧＮＡＮＴ；試験プロトコル（ＮＣＴ０２３３８７６７））を挙げることができる。図１に示されるとおり、ＰＲＡＥＧＮＡＮＴ試験プログラムは、転移又は手術不可能な局所領域疾患のいずれかを有する患者にフォーカスする。組み入れは、規定の治療ラインを受容する患者に限定されない。疾患進行は、客観的に評価可能でなければならない。腫瘍再評価は、２〜３ヵ月ごとに行い、疾患が治療の変更後ごとに進行し続ける場合に追加の評価を実施する。有害事象及び重度の有害事象は、試験全体を通して生活の質として継続的に報告し、患者が任意の有害事象と一緒にその生活の質をそれら自身で記録することを可能とするプログラム（ＰＲＯ；患者報告アウトカム）を使用する。

トランスクリプトミクス分析及びクラスタリング
本発明者らは、好ましくは、類似の疾患の状態において同一の疾患と診断された複数の患者のトランスクリプトミクスデータを遺伝子の発現レベルの相関及び／又はパターンに基づいて複数のグループにクラスタリングできることを企図する。トランスクリプトミクスデータをクラスタリングする任意の好適な方法が企図される。例えば、腫瘍組織中の変動発現遺伝子は、線形回帰法を使用して、好ましくは完全ピアソン相関を使用してクラスタリングすることができる。このような例において、遺伝子の１つのグループ又はクラスタにおける相関係数の絶対値は、少なくとも０．４超、好ましくは０．５超、より好ましくは０．６超、最も好ましくは０．７超であることが好ましい。したがって、一部の状況において、１つのクラスタ又は１つのグループ中の遺伝子は、互いに負又は正に相関する２つ以上のサブグループに分けることができる。

さらに、クラスタ又はグループのメンバー（量）（例えば、ｋ平均アルゴリズムにおけるｋ）は、任意の好適な手段又はアルゴリズムにより決定することができる。１つの例示的な好ましい方法は、エルボー法である。また、他の方法としては、ｘ平均クラスタリング、情報量規準アプローチ（例えば、赤池情報量規準（ＡＩＣ）、ベイズ情報量規準（ＢＩＣ）又は逸脱度情報量規準（ＤＩＣ）など）、情報理論的アプローチ（例えば、ジャンプ法（ｊｕｍｐｍｅｔｈｏｄ）など）、シルエット法及び／又はクロスバリデーション法が挙げられる。エルボー法を使用してクラスタの数を決定する場合、決定された数値及び次の値について説明される分散の割合の増分（Ｆ検定値）は、１０％未満又は好ましくは５％未満であることが好ましい。例えば、図４に示されるとおり、ヒートマップにおいて、完全ピアソン相関を使用して遺伝子発現パターンに基づいて１，０００個超の変動発現遺伝子を５つのクラスタにクラスタリングする。３〜１０個のクラスタの最適数は、エルボー法を使用して同定し（データを示さず）、ｋ平均を使用してそれぞれの患者のそれぞれの腫瘍サンプル（合計１４２個のサンプル）のトランスクリプトミクスデータ（遺伝子発現レベル）を５つのクラスタの１つと関連付けた。

トランスクリプトミクスデータのそれぞれのクラスタを患者の示差的な全生存と関連付けることができ、不良生存と関連する少なくとも１つのクラスタを同定できることが企図される。本明細書において使用される全生存は、疾患と診断された患者が依然として生存している診断日からの日数により計測する。例えば、図５に示されるとおり、それぞれのクラスタ（クラスタ１〜５）に対応する患者のサブセットの全生存は、カプランマイヤー曲線上で可視化されるとおり、５つのクラスタ間で示差的な全生存を示す。コックス比例ハザードモデルをそれらの５つのクラスタにフィットさせ、関連係数からそれぞれのクラスタのハザード比を計算する。一般に、ハザード比は、変動発現遺伝子の数（共変量の数）及び変動発現遺伝子の影響に基づいて計算することができる。本発明者らは、５つのクラスタのうち、クラスタ５（合計１３個のサンプルのトランスクリプトミクスデータに対応する）が最大のハザード比（１．４５１、ｐ＝０．００２１）を有することを見出し、それは、クラスタ５が転移性乳癌予後の不良アウトカムと最も有意に関連することを示した。

本発明者らは、患者の全生存、特に患者の不良アウトカムが、転移性乳癌と関連することが公知の他の個々の臨床的特徴又はマーカーと比較して、クラスタリングされた遺伝子及びそれらの発現パターンと有意に関連することを見出した。例えば、複数の転移性乳癌患者から、図１に示される実験スキームに従って腫瘍組織を得た。利用可能な初期結果に基づき、２５個の臨床的特徴を、表１に例示的に示されるとおりコックス比例ハザードモデルにおいて生存との有意な関連について独立してテストした。特徴としては、とりわけ、診断情報（グレード、ホルモン受容体状態など）、健常関連要因（ＢＭＩ、体重など）、以前の乳癌診断の本人及び家族の病歴が挙げられる。このような特徴のうち、本発明者らは、示差的な生存と有意に関連する（ｐ＜０．０５）５つの特徴（エストロゲン受容体（ＥＲ）又はプロゲステロン受容体（ＰＲ）陽性、トリプルネガティブ状態、６１歳未満診断及びトリプルネガティブ状態、ＰＲ陽性状態及びボディマスインデックス（ＢＭＩ））並びにサブタイプを規定するために使用される３つの追加の特徴（ＥＲ状態、ＨＥＲ２状態及び診断時グレード）を同定した。最も強力なアウトカムの指標因子は、分子的特徴：ＥＲ又はＰＲ陽性状態及びトリプルネガティブ状態（ＥＲ−ＰＲ−ＨＥＲ２−）であった。

したがって、次に、本発明者らは、転移性乳癌についての３つの免疫組織化学（ＩＨＣ）マーカー：エストロゲン受容体（ＥＲ）、プロゲステロン受容体（ＰＲ）及び上皮成長因子（ＨＥＲ２）を、臨床サブタイプを規定するための診断時グレード（Ｇ１）とともに使用して、分子マーカー及び転移性乳癌の臨床サブタイプと全生存率との間の相関を評価した。患者の生検組織を得、マーカータンパク質の発現及び／又は強度を決定して患者のサンプルを４つのグループ又はクラスタにグルーピングした：３つ全ての受容体についてＩＨＣ陰性をＴＮＢＣとしてグルーピングし；ＨＥＲ２＋サンプルをＨＥＲ２としてグルーピングし；ＥＲ／ＰＲ＋及び３未満のＧ１をルミナールＡとしてグルーピングし；ＥＲ／ＰＲ＋及び２超のＧ１をルミナールＢとしてグルーピングした。全生存（ＯＳ）を、図２に示されるとおり標準ＩＨＣ分類（ルミナールＡ、ルミナールＢ、ＴＮＢＣ及びＨＥＲ２）に対してプロットした。コックス比例ハザードモデルをそれらの４つのグループにフィットさせ、関連係数からハザード比を計算した。予期される傾向が明らかである一方（例えば、ＴＮＢＣは不良予後を有する）、本発明者らは、臨床及び分子サブタイプ（タンパク質発現レベル）に基づく分類がコホートサイズにおいて統計的に有意なレベルで患者の全生存と関連し得ないことを見出すことができた。

本発明者らは、臨床及び分子サブタイプと患者の全生存との間の相関が、臨床及び分子サブタイプをそれらのトランスクリプトミクスデータにより分析する場合により実質的であるか否かをさらに決定した。したがって、ＯＳについての公知の臨床関連要因（例えば、ホルモン受容体状態、診断時年齢及びＢＭＩ）をコックス比例ハザード比により分析し、アウトカムのトランスクリプトミックマーカーと比較した。全ての患者腫瘍をＩｌｌｕｍｉｎａシーケンシングプラットフォーム上でシーケンシングし、ＲＮＡｓｅｑ発現データをＲＳＥＭにより分析してそれぞれの遺伝子アイソフォームについての転写産物百万分率（ＴＰＭ）値を推定した。ＴＰＭ対数値を推定ＰＡＭ５０内因性乳癌クラスタ遺伝子セットにおいて使用してＰＲＥＡＧＮＡＮＴコホートにおけるサブグループを同定した。図３に示されるとおり、全生存（ＯＳ）を標準ＰＡＭ５０内因性サブタイプ：ルミナールＡ、ルミナールＢ、ベーサル及びＨＥＲ２に対してプロットした。コックス比例ハザードモデルをそれらの４つのサブグループにフィットさせ、関連係数からハザード比を計算した。本発明者らは、ＨＥＲ２グループが十分な分析表現を有さない一方、ベーサル及びルミナールＡサブタイプがそれぞれ不良及び最良好の生存と有意に相関することを見出した。試験プロトコルからの利用可能なオミクスデータに基づき、本発明者らは、ホルモン受容体陽性（ＨＲ＝０．７、ｐ＜０．００６）及びＴＮＢＣ状態（ＨＲ＝１．４、ｐ＜０．０１）がアウトカムと有意に関連することを見出した。さらに、ＰＡＭ５０サブタイプも強力なアウトカムの指標因子であった（例えば、他のサブタイプと比較したベーサル疾患は、ＨＲ＝１．３４を有する、ｐ＜０．０４）。特に、発現ベースＰＡＭ５０サブタイプは、同等のＩＨＣベースサブタイプよりも有意な示差的な生存を示した。

また、一部のＰＡＭ５０サブタイプは、患者の全生存と相対的に強力に関連し得たが、本発明者らは、このコホートにおけるＲＮＡ発現ベース高リスククラスタが、他のクラスタと比較して臨床バリアント、ＩＨＣマーカー又は確立されたサブタイプよりも不良予後をＨＲ＝１．４５（ｐ＜０．００３）で示すことを見出した。表２は、ＩＨＣ／臨床情報、確立された発現サブタイプ及び患者間の複数の遺伝子のＲＮＡ発現レベルを使用するクラスタリングを使用する最良好及び最不良の全生存を有する患者サブグループを列記する。このコホートにおける内因性サブタイプ（複数の遺伝子のＲＮＡ発現レベルを使用するクラスタリング）は、ＩＨＣ／臨床サブタイプ又はＰＡＭ５０内因性サブタイプと比較して示差的な生存と最も強力に相関する（ｐ＜０．０２）。

さらに、本発明者らは、ＩＨＣ／臨床情報、確立された発現サブタイプ（ＰＡＭ５０）及び患者間の複数の遺伝子のＲＮＡ発現レベルを使用するクラスタリングにより分類される患者グループが実質的に重複しないことも見出した。例えば、図６Ａは、主に転移性乳癌の不良アウトカムと関連する３つの患者グループ（ＩＨＣ／臨床サブグルーピングからのＴＮＢＣグループ、ＰＡＭ５０サブグルーピングからのベーサルグループ、ＲＮＡ発現レベルを使用するクラスタリングからのクラスタ５）のベン図を示す。最不良の全生存の３つの群間で一部の重複する患者集団が存在する一方、２つのグループの組合せは、それぞれのグループの患者の５０％超を共有しない。同様に、図６Ｂは、主に転移性乳癌の最良好アウトカムと関連する３つの患者グループ（ＩＨＣ／臨床及びＰＡＭ５０についてのルミナールＡグループ並びにＲＮＡ発現レベルを使用するクラスタリングからのクラスタ２）のベン図を示す。最不良の全生存の３つの群間で一部の重複する患者集団が存在する一方、２つのグループの組合せは、それぞれのグループの患者の５０％超を共有しない。さらに、ＩＨＣ／臨床サブグルーピングにおいてルミナールＡグループと分類された患者のグループ及びＰＡＭ５０サブグルーピングにおいてルミナールＡグループと分類された患者のグループも実質的に重複しておらず、ＩＨＣ／臨床サブグルーピング及びＰＡＭ５０サブグルーピングにおいて同一の分子マーカー（タンパク質又はＲＮＡのいずれかの異なる形態）を使用するサブグルーピングがマーカーと全生存との異なる相関を与え、したがって、そのようなグルーピングからの相関を使用すると信頼性の低い生存期間の予測が得られ得ることを示す。

このような結果は、発現レベルが相関する遺伝子をクラスタリングすることによる分子プロファイリングを使用して、患者の全生存又は予期予後の、特に転移性乳癌と診断された患者の不良アウトカムのより高精度の予測モデルを作成できることを示唆する。したがって、本発明者らは、遺伝子のＲＮＡ発現レベルの相関から作成された少なくとも１つのクラスタが、選択されたクラスタ中の複数の遺伝子の患者のＲＮＡ発現レベルの関数における生存期間（又は死亡までの時間）を予測する機械学習を使用して生存予測モデルを作成するように選択できることをさらに企図する。好ましい実施形態において、生存予測モデルを作成するために使用される遺伝子クラスタは、患者の不良アウトカムと最も実質的に関連するものである。別の好ましい実施形態において、生存予測モデルを作成するために使用される遺伝子クラスタは、０．８超、好ましくは１．０超、より好ましくは１．２超、最も好ましくは１．３超のハザード比を有する。例えば、転移性乳癌の遺伝子の好ましいクラスタとしては、図４及び５に示されるクラスタ５を挙げることができる。なぜなら、そのクラスタは、転移性乳癌患者の全生存と最も実質的に反相関するためである。

一部の実施形態において、選択されたクラスタ中の全部の又は実質的に全ての遺伝子を使用して生存予測モデルを作成することができる。このような実施形態において、選択されたクラスタ中の遺伝子の数は、データを効率的に処理するため及びさらに低信頼性変動発現データを低減させるために２００個未満、好ましくは１００個未満、より好ましくは５０個未満の遺伝子であることが好ましい。他の実施形態において、クラスタ中の全ての遺伝子のうちの遺伝子のサブセットは、生存予測モデルを作成するように選択することができる。このような実施形態において、遺伝子のサブセットは、複数の遺伝子の発現レベルの関数における複数の患者のうちの短期生存者からの長期生存者の分離の質に基づいて選択することが好ましい。換言すると、例えば、遺伝子のサブセットは、全体的に又は個別的に長期間生存した（全生存に対して上位１０％、上位２０％、上位３０％）転移性乳癌患者が複数の遺伝子の少なくとも１０％、少なくとも２０％、少なくとも３０％高い又は低い平均発現レベルを有する場合に選択する。

代わりに及び／又は加えて、遺伝子のサブセットは、遺伝子の数を低減させて生存予測モデルの予測可能性及び効率を最大化する機械学習アルゴリズムにより選択することができる。一般に、選択又は低減処理は、それぞれの変数（例えば、それぞれの遺伝子発現レベルなど）の重要度のレベルの決定を可能とし、他の変数の効果の評価もそのようなものが統計的に排除される場合に可能とする。任意の好適な機械学習アルゴリズムが企図され、例示的な機械学習アルゴリズムとしては、限定されるものではないが、線形カーネルサポートベクターマシン（ＳＶＭ）（参照により全体として本明細書に組み込まれるＢｅｎ−Ｈｕｒらによる「ＡＵｓｅｒ’ｓＧｕｉｄｅｔｏＳｕｐｐｏｒｔＶｅｃｔｏｒＭａｃｈｉｎｅｓ」という名称の刊行物に記載のＳＶＭ）、一次多項式カーネルＳＶＭ、二次多項式カーネルＳＶＭ、リッジ回帰、ラッソ、エラスティックネット、逐次最小問題最適化法、ランダムフォレスト、Ｊ４８ツリー、単純ベイズ、ＪＲｉｐルール、ＨｙｐｅｒＰｉｐｅｓ及びＮＭＦ予測因子が挙げられる。このような例において、予測モデルは、患者のトランスクリプトミクスデータの少なくとも４０％、少なくとも５０％、少なくとも６０％、少なくとも７０％及び訓練データセットとしての生存データを用いて作成し、訓練できることが企図される。訓練データセットを分析するために使用され、予測モデルの構築のために選択される遺伝子の数は、選択処理（例えば、分散閾値選択、Ｌ１選択など）を使用して低減させることができる。次いで、予測モデルを患者のトランスクリプトミクスデータのサブセット及び評価データセットとしての生存データを用いてテストすることができる。

一部の実施形態において、予測モデルの妥当性は、予測モデルのｃ統計量を計算することにより決定することができる。一般に、ｃ統計量又は一致頻度は、予測生存期間及び実際の生存期間が一致する患者の数が増加する場合に増加する。好ましくは、選択された遺伝子のサブセット及びそれらの発現レベルを使用する生存期間予測モデルは、０．５超、好ましくは０．６超、より好ましくは０．７超、最も好ましくは０．７５超のｃ統計量を有する。

図７は、予測モデルにより作成された訓練セットの予測全生存データ（四角として示される）及び予測モデルにより作成された評価データセットの予測全生存データ（丸）及び実際の生存データをプロットする１つの例示的なグラフを示す。死亡がアノテートされた４３人の患者についての全ＲＮＡｓｅｑ発現及び生存データを使用して死亡までの時間の予測モデルを構築し、テストした。これらの患者の８０パーセントを訓練セットとして無作為に選択した。得られたモデルを、提出された２０％のテストサンプルにおけるＯＳの予測に適用した。このモデルは、０．７８のｃ統計量を達成し、真のＯＳ標識である。

図７のグラフとして示される予測モデルにおいて、本発明者らは、予測モデルを作成するための遺伝子の数を５０個未満に低減させ得ることを見出した。より具体的には、ラッソ回帰モデルを訓練データにフィットさせ、それは、Ｌ１選択処理を使用して最終予測モデルにおいて利用される遺伝子特徴の数を最小化し、それは、＞１９０００個の特徴から減少した３５個の特徴（遺伝子、遺伝子発現レベルなど）のみを使用するモデルをもたらす。図８は、この生存予測モデルにおいて使用された３５個の遺伝子のヒートマップを示す。行は、階層クラスタリングによりソートし、列は、ＯＳ増加の順で左から右にソートする。短期及び長期生存者間の示差的発現の明確なパターンが存在し、例としてＴＭＥＭ２５７、ＦＡＭ１８０Ｂ、ＷＮＴ１１、ＣＴＤＳＰＬ、ＰＲＯＫ１、ＧＡＤ２、ＧＲＫ７、ＦＺＤ６、ＫＲＴＡＰ５０５、ＫＲＴ３１、ＰＲＡＭＥＦ１２、ＳＹＮＧＲ４、ＳＯＸ２、ＢＨＬＨＡ９、ＰＯＵ１Ｆ１、ＫＨＮＹＮ、ＣＡＣＮＡ２Ｄ４、Ｃ３ｏｒｆ３６、ＲＨＯＸＦ２、ＰＡＢＰＮ１Ｌ、ＥＩＤ２Ｂ、ＢＢＳ４、ＡＧＰＳ、ＥＦＣＣ１、ＲＯＢＯ２、ＣＭＴＭ４、ＴＨＴＰＡ、ＺＰ４、ＨＩＳＴ１Ｈ２ＢＥ、ＬＯＣ２８６２３８、ＩＦＮＬ２、ＤＧＫＫ、ＧＮＧＴ１、ＵＳＰ１７Ｌ３０及びＥＲＮ１の遺伝子発現レベルが挙げられる。

本発明者らは、生存予測モデルにおいて使用された３５個の選択遺伝子の一部の遺伝子が１つ以上の腫瘍関連経路と関連することをさらに見出した。３５個の選択遺伝子は、遺伝子セット濃縮分析（ＧＳＥＡ）を使用して分析する。表３は、これらの３５個の予測遺伝子についての例示的なＧＳＥＡについての結果を示す。５つのデータベースを、キュレートされたそれらの予測遺伝子についての濃縮遺伝子セットに対してクエリした（Ｗｉｋｉｐａｔｈｗａｙｓ、ＧＯ、ＫＥＧＧなど）。この表は、有意に関連するものを示す（調整ｐ＜０．０５）。３５個の遺伝子の３つをＷＮＴシグナリング及び多能性と関連すると一貫して同定し、それは、この予後モデルについての機能的アノテーションを示唆する。

予後シグネチャを開発するための分子プロファイリングの使用は、総コホートの小さいサブセット中でも転移性状況において不良アウトカムの標準的な臨床関連要因よりも優れていることを認識すべきである。さらに、単一又は少数の公知の臨床マーカーに代えてマーカーのグループとしてこのようにクラスタリングされた遺伝子発現を使用して作成された予測モデルは、より高信頼性の高精度の予測又は推定生存期間を転移性乳癌と診断された患者に提供し得た。したがって、このアプローチは、単一又は少数の公知の臨床マーカー又は表現型を使用する従来の技術を使用して予後を高信頼性で予測することができなかった転移性乳癌についての診断及び／又は予後ツールを進歩させ、改善する。さらに、遺伝子のサブセットのうちのいくつかの腫瘍経路関連遺伝子を同定することにより、このアプローチは、不良アウトカムを有する転移性乳癌患者を治療するための潜在的な標的も提供する。

したがって、本発明の主題の別の態様において、本発明者らは、転移性乳癌と診断された患者の生存期間を予測する方法を企図する。この方法において、単一の解剖学的部位又は複数の解剖学的部位のいずれかからの腫瘍組織のトランスクリプトミクスデータを得る。トランスクリプトミクスデータのうち、患者の生存期間の予測に関連するトランスクリプトミクスデータのサブセットをさらに得ることができる。好ましくは、トランスクリプトミクスデータのサブセットは、ＴＭＥＭ２５７、ＦＡＭ１８０Ｂ、ＷＮＴ１１、ＣＴＤＳＰＬ、ＰＲＯＫ１、ＧＡＤ２、ＧＲＫ７、ＦＺＤ６、ＫＲＴＡＰ５０５、ＫＲＴ３１、ＰＲＡＭＥＦ１２、ＳＹＮＧＲ４、ＳＯＸ２、ＢＨＬＨＡ９、ＰＯＵ１Ｆ１、ＫＨＮＹＮ、ＣＡＣＮＡ２Ｄ４、Ｃ３ｏｒｆ３６、ＲＨＯＸＦ２、ＰＡＢＰＮ１Ｌ、ＥＩＤ２Ｂ、ＢＢＳ４、ＡＧＰＳ、ＥＦＣＣ１、ＲＯＢＯ２、ＣＭＴＭ４、ＴＨＴＰＡ、ＺＰ４、ＨＩＳＴ１Ｈ２ＢＥ、ＬＯＣ２８６２３８、ＩＦＮＬ２、ＤＧＫＫ、ＧＮＧＴ１、ＵＳＰ１７Ｌ３０及びＥＲＮ１から選択される複数の遺伝子のＲＮＡ発現レベルを含む。より好ましくは、トランスクリプトミクスデータのサブセットは、Ｗｎｔシグナリング経路又は多能性経路と関連する少なくとも２つの遺伝子のＲＮＡ発現レベルを含み、それは、ＳＯＸ２、ＷＮＴ１１及びＦＺＤ６を含み得る。このように得られたトランスクリプトミクスデータのサブセットは、上記の生存予測モデルを使用してさらに分析して、患者の生存期間を予測することができる。

本発明者らは、予測生存期間並びに／又は選択された遺伝子のサブセット、例えば特にＳＯＸ２、ＷＮＴ１１及びＦＺＤ６の遺伝子発現データに基づき、患者記録を作成又は更新することができ、新たな治療計画を推奨することができるか、又は事前に使用された治療計画を更新できることをさらに企図する。例えば、患者の予後が不良（予測生存期間が短い）と予測され、ＳＯＸ２の発現レベルが実質的に減少し、Ｗｎｔシグナリング経路の脱阻害及び癌細胞の転移能を示す場合、患者記録自体を更新することができ、Ｗｎｔシグナリング経路を阻害するか、又はＳＯＸ２発現若しくは既存のＳＯＸ２活性を増加させるための治療剤を含めるように患者に対する治療レジメンを作成し、更新することができる。さらに、更新又は作成される治療レジメンは、予測生存期間を反映する治療タイムラインを含み得る（例えば、予期生存期間よりも長期間を要し得る治療計画の一部の選択を排除し、予期生存期間の５０％以内で終了させることができる治療によりレジメンを修正するなど）。このような実施形態において、更新された治療レジメン（例えば、治療の少なくとも５日後、治療の少なくとも１０日後など）を適用した後に患者のトランスクリプトミクスデータを得て、治療後の生存期間をさらに予測できることも企図される。

本明細書の詳細な説明及び以下の特許請求の範囲全体にわたり使用される「１つの（ａ）」、「１つの（ａｎ）」及び「その」の意味には、文脈が特に明示しない限り、複数の言及対象が含まれる。さらに、本明細書の詳細な説明において使用される「中」の意味には、文脈が特に明示しない限り、「中」及び「上」が含まれる。最後に、文脈が相反を示さない限り、本明細書に記載の全ての範囲は、それらの終点を包括するものと解釈すべきであり、オープンエンドの範囲は、商用的な値を含めるように解釈すべきである。同様に、値の全ての列記は、文脈が相反を示さない限り、中間値を包括するものとみなすべきである。

本明細書に記載の全ての方法は、特に本明細書に示されない限り又は特に文脈により明らかに矛盾しない限り、任意の好適な順序で実施することができる。本明細書のある実施形態に関して提供されるいずれか及び全ての例の使用又は例示的な言語（例えば、「など」）は、本発明の主題をより良好に説明するものにすぎず、他で特許請求されない限り本発明の主題の範囲を限定するものではない。本明細書中の言語は、任意の特許請求されていない要素が本発明の主題の実施に不可欠であることを示すと解釈すべきでない。

既に記載のものに加え、本明細書の本発明の概念を逸脱せずにより多くの改変形態が考えられることは、当業者に明らかなはずである。したがって、本発明の主題は、添付の特許請求の範囲の範囲以外で限定されるべきではない。さらに、本明細書及び特許請求の範囲の両方の解釈において、全ての用語は、文脈と一致する最も広い可能な様式で解釈すべきである。特に、用語「含む（ｃｏｍｐｒｉｓｅｓ）」及び「含む（ｃｏｍｐｒｉｓｉｎｇ）」は、非排他的様式で要素、構成成分又はステップを指すものと解釈すべきであり、言及される要素、構成成分又はステップが、明示的に言及されない他の要素、構成成分若しくはステップと存在するか、又は利用されるか、又は組み合わされ得ることを示す。本明細書の特許請求の範囲が、Ａ、Ｂ、Ｃ．．．．及びＮからなる群から選択されるものの少なくとも１つを指す場合、本文は、その群からの１つの要素のみを要求し、Ａ及びＮでもＢ及びＮでもないなどと解釈すべきである。

Claims

転移性乳癌についての生存予測モデルを作成する方法であって、
転移性乳癌と診断された複数の患者のトランスクリプトミクスデータを得ること；
完全ピアソン相関を使用して前記トランスクリプトミクスデータを複数のクラスタにクラスタリングすること；
前記複数のクラスタを前記複数の患者の全生存と相関させることにより、前記複数の患者の少なくとも一部の不良生存と関連する少なくとも１つのクラスタを同定すること；
前記複数の患者の少なくとも一部の不良生存と関連する前記少なくとも１つのクラスタ中の複数の遺伝子の発現レベルに基づき、生存期間を予測する前記生存予測モデルを作成すること
を含み、前記複数の遺伝子は、ＷＮＴシグナリング経路又は多能性経路と関連する少なくとも１つの遺伝子を含む、方法。
前記トランスクリプトミクスデータは、少なくとも１，０００個の遺伝子のＲＮＡ発現レベルを含む、請求項１に記載の方法。
前記複数のクラスタの数は、エルボー法を使用して決定される、請求項１又は２に記載の方法。
前記複数のクラスタは、前記複数の患者の前記全生存と示差的に相関される、請求項１〜３のいずれか一項に記載の方法。
前記少なくとも１つのクラスタは、１．３超のハザード比を有する、請求項１〜４のいずれか一項に記載の方法。
前記複数の遺伝子は、前記複数の遺伝子の前記発現レベルの関数における前記複数の患者のうちの短期生存者からの長期生存者の分離の質に基づき、前記少なくとも１つのクラスタのトランスクリプトミクスデータのうちから選択される、請求項１〜５のいずれか一項に記載の方法。
前記複数の遺伝子の数は、５０個未満である、請求項１〜６のいずれか一項に記載の方法。
前記複数の遺伝子は、ＴＭＥＭ２５７、ＦＡＭ１８０Ｂ、ＷＮＴ１１、ＣＴＤＳＰＬ、ＰＲＯＫ１、ＧＡＤ２、ＧＲＫ７、ＦＺＤ６、ＫＲＴＡＰ５０５、ＫＲＴ３１、ＰＲＡＭＥＦ１２、ＳＹＮＧＲ４、ＳＯＸ２、ＢＨＬＨＡ９、ＰＯＵ１Ｆ１、ＫＨＮＹＮ、ＣＡＣＮＡ２Ｄ４、Ｃ３ｏｒｆ３６、ＲＨＯＸＦ２、ＰＡＢＰＮ１Ｌ、ＥＩＤ２Ｂ、ＢＢＳ４、ＡＧＰＳ、ＥＦＣＣ１、ＲＯＢＯ２、ＣＭＴＭ４、ＴＨＴＰＡ、ＺＰ４、ＨＩＳＴ１Ｈ２ＢＥ、ＬＯＣ２８６２３８、ＩＦＮＬ２、ＤＧＫＫ、ＧＮＧＴ１、ＵＳＰ１７Ｌ３０及びＥＲＮ１からなる群から選択される、請求項１〜７のいずれか一項に記載の方法。
前記トランスクリプトミクスデータは、ＲＮＡ−ｓｅｑデータを含む、請求項１〜８のいずれか一項に記載の方法。
前記予測生存期間を前記患者の実際の生存期間と比較することにより、前記生存予測モデルのｃ統計量を計算することをさらに含む、請求項１〜９のいずれか一項に記載の方法。
前記ｃ統計量は、０．７超である、請求項１０に記載の方法。
前記複数のクラスタの数は、エルボー法を使用して決定される、請求項１に記載の方法。
前記複数のクラスタは、前記複数の患者の前記全生存と示差的に相関される、請求項１に記載の方法。
前記少なくとも１つのクラスタは、１．３超のハザード比を有する、請求項１に記載の方法。
前記複数の遺伝子は、前記複数の遺伝子の前記発現レベルの関数における前記複数の患者のうちの短期生存者からの長期生存者の分離の質に基づき、前記少なくとも１つのクラスタのトランスクリプトミクスデータのうちから選択される、請求項１に記載の方法。
前記複数の遺伝子の数は、５０個未満である、請求項１に記載の方法。
前記複数の遺伝子は、ＴＭＥＭ２５７、ＦＡＭ１８０Ｂ、ＷＮＴ１１、ＣＴＤＳＰＬ、ＰＲＯＫ１、ＧＡＤ２、ＧＲＫ７、ＦＺＤ６、ＫＲＴＡＰ５０５、ＫＲＴ３１、ＰＲＡＭＥＦ１２、ＳＹＮＧＲ４、ＳＯＸ２、ＢＨＬＨＡ９、ＰＯＵ１Ｆ１、ＫＨＮＹＮ、ＣＡＣＮＡ２Ｄ４、Ｃ３ｏｒｆ３６、ＲＨＯＸＦ２、ＰＡＢＰＮ１Ｌ、ＥＩＤ２Ｂ、ＢＢＳ４、ＡＧＰＳ、ＥＦＣＣ１、ＲＯＢＯ２、ＣＭＴＭ４、ＴＨＴＰＡ、ＺＰ４、ＨＩＳＴ１Ｈ２ＢＥ、ＬＯＣ２８６２３８、ＩＦＮＬ２、ＤＧＫＫ、ＧＮＧＴ１、ＵＳＰ１７Ｌ３０及びＥＲＮ１からなる群から選択される、請求項１に記載の方法。
前記トランスクリプトミクスデータは、ＲＮＡ−ｓｅｑデータを含む、請求項１に記載の方法。
前記予測生存期間を前記患者の実際の生存期間と比較することにより、前記生存予測モデルのｃ統計量を計算することをさらに含む、請求項１に記載の方法。
前記ｃ統計量は、０．７超である、請求項１８に記載の方法。
転移性乳癌と診断された患者の生存期間を予測する方法であって、
前記患者の腫瘍組織のトランスクリプトミクスデータを得ること；
前記トランスクリプトミクスデータからの複数の遺伝子のＲＮＡ発現レベルを決定すること；
生存予測モデルを使用して、前記ＲＮＡ発現レベルに基づいて前記患者の前記生存期間を予測すること
を含み、前記複数の遺伝子のうちの少なくとも２つの遺伝子は、Ｗｎｔシグナリング経路又は多能性経路と関連する、方法。
トランスクリプトミクスデータは、ＲＮＡ−ｓｅｑデータを含む、請求項２０に記載の方法。
前記複数の遺伝子の数は、５０個未満である、請求項２０又は２１に記載の方法。
前記複数の遺伝子は、ＴＭＥＭ２５７、ＦＡＭ１８０Ｂ、ＷＮＴ１１、ＣＴＤＳＰＬ、ＰＲＯＫ１、ＧＡＤ２、ＧＲＫ７、ＦＺＤ６、ＫＲＴＡＰ５０５、ＫＲＴ３１、ＰＲＡＭＥＦ１２、ＳＹＮＧＲ４、ＳＯＸ２、ＢＨＬＨＡ９、ＰＯＵ１Ｆ１、ＫＨＮＹＮ、ＣＡＣＮＡ２Ｄ４、Ｃ３ｏｒｆ３６、ＲＨＯＸＦ２、ＰＡＢＰＮ１Ｌ、ＥＩＤ２Ｂ、ＢＢＳ４、ＡＧＰＳ、ＥＦＣＣ１、ＲＯＢＯ２、ＣＭＴＭ４、ＴＨＴＰＡ、ＺＰ４、ＨＩＳＴ１Ｈ２ＢＥ、ＬＯＣ２８６２３８、ＩＦＮＬ２、ＤＧＫＫ、ＧＮＧＴ１、ＵＳＰ１７Ｌ３０及びＥＲＮ１からなる群から選択される、請求項２０〜２２のいずれか一項に記載の方法。
前記生存予測モデルは、
転移性乳癌と診断された複数の患者のトランスクリプトミクスデータを得るステップ；
完全ピアソン相関を使用して前記トランスクリプトミクスデータを複数のクラスタにクラスタリングするステップ；
前記複数のクラスタを前記複数の患者の全生存と相関させることにより、前記複数の患者の少なくとも一部の不良生存と関連する少なくとも１つのクラスタを同定するステップ；及び
前記複数の遺伝子の前記発現レベルの関数における前記複数の患者のうちの短期生存者からの長期生存者の分離の質に基づき、前記少なくとも１つのクラスタから前記複数の遺伝子を選択するステップ
を使用して作成される、請求項２０〜２３のいずれか一項に記載の方法。
前記複数の患者の前記トランスクリプトミクスデータは、少なくとも１，０００個の遺伝子のＲＮＡ発現レベルを含む、請求項２４に記載の方法。
前記複数のクラスタの数は、エルボー法を使用して決定される、請求項２４又は２５に記載の方法。
前記複数のクラスタは、前記複数の患者の前記全生存と示差的に相関される、請求項２４〜２６のいずれか一項に記載の方法。
前記少なくとも１つのクラスタは、１．３超のハザード比を有する、請求項２４〜２７のいずれか一項に記載の方法。
前記予測生存期間を前記患者の実際の生存期間と比較することにより、前記生存予測モデルのｃ統計量を計算することをさらに含む、請求項２４〜２８のいずれか一項に記載の方法。
前記生存予測モデルの前記ｃ統計量は、０．７超である、請求項２９に記載の方法。
前記予測生存期間に基づき、患者記録を更新又は作成することをさらに含む、請求項２０〜３０のいずれか一項に記載の方法。
前記予測生存期間に基づき、前記患者のための治療レジメンを修正することをさらに含む、請求項２０〜３１のいずれか一項に記載の方法。
前記複数の遺伝子の数は、５０個未満である、請求項２０に記載の方法。
前記複数の遺伝子は、ＴＭＥＭ２５７、ＦＡＭ１８０Ｂ、ＷＮＴ１１、ＣＴＤＳＰＬ、ＰＲＯＫ１、ＧＡＤ２、ＧＲＫ７、ＦＺＤ６、ＫＲＴＡＰ５０５、ＫＲＴ３１、ＰＲＡＭＥＦ１２、ＳＹＮＧＲ４、ＳＯＸ２、ＢＨＬＨＡ９、ＰＯＵ１Ｆ１、ＫＨＮＹＮ、ＣＡＣＮＡ２Ｄ４、Ｃ３ｏｒｆ３６、ＲＨＯＸＦ２、ＰＡＢＰＮ１Ｌ、ＥＩＤ２Ｂ、ＢＢＳ４、ＡＧＰＳ、ＥＦＣＣ１、ＲＯＢＯ２、ＣＭＴＭ４、ＴＨＴＰＡ、ＺＰ４、ＨＩＳＴ１Ｈ２ＢＥ、ＬＯＣ２８６２３８、ＩＦＮＬ２、ＤＧＫＫ、ＧＮＧＴ１、ＵＳＰ１７Ｌ３０及びＥＲＮ１からなる群から選択される、請求項２０に記載の方法。
前記生存予測モデルは、
転移性乳癌と診断された複数の患者のトランスクリプトミクスデータを得るステップ；
完全ピアソン相関を使用して前記トランスクリプトミクスデータを複数のクラスタにクラスタリングするステップ；
前記複数のクラスタを前記複数の患者の全生存と相関させることにより、前記複数の患者の少なくとも一部の不良生存と関連する少なくとも１つのクラスタを同定するステップ；及び
前記複数の遺伝子の前記発現レベルの関数における前記複数の患者のうちの短期生存者からの長期生存者の分離の質に基づき、前記少なくとも１つのクラスタから前記複数の遺伝子を選択するステップ
を使用して作成される、請求項２０に記載の方法。
前記複数の患者の前記トランスクリプトミクスデータは、少なくとも１，０００個の遺伝子のＲＮＡ発現レベルを含む、請求項３５に記載の方法。
前記複数のクラスタの数は、エルボー法を使用して決定される、請求項３５に記載の方法。
前記複数のクラスタは、前記複数の患者の前記全生存と示差的に相関される、請求項３５に記載の方法。
前記少なくとも１つのクラスタは、１．３超のハザード比を有する、請求項３５に記載の方法。
前記予測生存期間を前記患者の実際の生存期間と比較することにより、前記生存予測モデルのｃ統計量を計算することをさらに含む、請求項３５に記載の方法。
前記生存予測モデルの前記ｃ統計量は、０．７超である、請求項４０に記載の方法。
前記予測生存期間に基づき、患者記録を更新又は作成することをさらに含む、請求項２０に記載の方法。
前記予測生存期間に基づき、前記患者のための治療レジメンを修正することをさらに含む、請求項２０に記載の方法。
転移性乳癌と診断された患者のための治療レジメンを作成又は更新する方法であって、
前記患者の腫瘍組織のトランスクリプトミクスデータを得ること；
前記トランスクリプトミクスデータからの複数の遺伝子のＲＮＡ発現レベルを決定すること；
生存予測モデルを使用して、前記ＲＮＡ発現モデルに基づいて前記患者の生存期間を予測すること；及び
Ｗｎｔシグナリング経路又は多能性経路の経路要素を標的化する少なくとも１つの薬剤を含むように前記治療レジメンを作成又は更新すること
を含む方法。
トランスクリプトミクスデータは、ＲＮＡ−ｓｅｑデータを含む、請求項４４に記載の方法。
前記複数の遺伝子の数は、５０個未満である、請求項４４又は４５に記載の方法。
前記複数の遺伝子は、ＴＭＥＭ２５７、ＦＡＭ１８０Ｂ、ＷＮＴ１１、ＣＴＤＳＰＬ、ＰＲＯＫ１、ＧＡＤ２、ＧＲＫ７、ＦＺＤ６、ＫＲＴＡＰ５０５、ＫＲＴ３１、ＰＲＡＭＥＦ１２、ＳＹＮＧＲ４、ＳＯＸ２、ＢＨＬＨＡ９、ＰＯＵ１Ｆ１、ＫＨＮＹＮ、ＣＡＣＮＡ２Ｄ４、Ｃ３ｏｒｆ３６、ＲＨＯＸＦ２、ＰＡＢＰＮ１Ｌ、ＥＩＤ２Ｂ、ＢＢＳ４、ＡＧＰＳ、ＥＦＣＣ１、ＲＯＢＯ２、ＣＭＴＭ４、ＴＨＴＰＡ、ＺＰ４、ＨＩＳＴ１Ｈ２ＢＥ、ＬＯＣ２８６２３８、ＩＦＮＬ２、ＤＧＫＫ、ＧＮＧＴ１、ＵＳＰ１７Ｌ３０及びＥＲＮ１からなる群から選択される、請求項４４〜４６のいずれか一項に記載の方法。
前記複数の遺伝子は、ＷＮＴ１１、ＳＯＸ２及びＦＺＤ６を含む、請求項４４〜４７のいずれか一項に記載の方法。
前記生存予測モデルは、
転移性乳癌と診断された複数の患者のトランスクリプトミクスデータを得るステップ；
完全ピアソン相関を使用して前記トランスクリプトミクスデータを複数のクラスタにクラスタリングするステップ；
前記複数のクラスタを前記複数の患者の全生存と相関させることにより、前記複数の患者の少なくとも一部の不良生存と関連する少なくとも１つのクラスタを同定するステップ；及び
前記複数の遺伝子の前記発現レベルの関数における前記複数の患者のうちの短期生存者からの長期生存者の分離の質に基づき、前記少なくとも１つのクラスタから前記複数の遺伝子を選択するステップ
を使用して作成される、請求項４４〜４８のいずれか一項に記載の方法。
前記複数の患者の前記トランスクリプトミクスデータは、少なくとも１，０００個の遺伝子のＲＮＡ発現レベルを含む、請求項４９に記載の方法。
前記複数のクラスタの数は、エルボー法を使用して決定される、請求項４９又は５０に記載の方法。
前記複数のクラスタは、前記複数の患者の前記全生存と示差的に相関される、請求項４９〜５１のいずれか一項に記載の方法。
前記少なくとも１つのクラスタは、１．３超のハザード比を有する、請求項４９〜５２のいずれか一項に記載の方法。
前記予測生存期間を前記患者の実際の生存期間と比較することにより、前記生存予測モデルのｃ統計量を計算することをさらに含む、請求項４９〜５３のいずれか一項に記載の方法。
前記生存予測モデルの前記ｃ統計量は、０．７超である、請求項５４に記載の方法。
前記予測生存期間に基づき、患者記録を更新又は作成することをさらに含む、請求項４４〜５５のいずれか一項に記載の方法。
前記複数の遺伝子の数は、５０個未満である、請求項４４に記載の方法。
前記複数の遺伝子は、ＴＭＥＭ２５７、ＦＡＭ１８０Ｂ、ＷＮＴ１１、ＣＴＤＳＰＬ、ＰＲＯＫ１、ＧＡＤ２、ＧＲＫ７、ＦＺＤ６、ＫＲＴＡＰ５０５、ＫＲＴ３１、ＰＲＡＭＥＦ１２、ＳＹＮＧＲ４、ＳＯＸ２、ＢＨＬＨＡ９、ＰＯＵ１Ｆ１、ＫＨＮＹＮ、ＣＡＣＮＡ２Ｄ４、Ｃ３ｏｒｆ３６、ＲＨＯＸＦ２、ＰＡＢＰＮ１Ｌ、ＥＩＤ２Ｂ、ＢＢＳ４、ＡＧＰＳ、ＥＦＣＣ１、ＲＯＢＯ２、ＣＭＴＭ４、ＴＨＴＰＡ、ＺＰ４、ＨＩＳＴ１Ｈ２ＢＥ、ＬＯＣ２８６２３８、ＩＦＮＬ２、ＤＧＫＫ、ＧＮＧＴ１、ＵＳＰ１７Ｌ３０及びＥＲＮ１からなる群から選択される、請求項４４に記載の方法。
前記複数の遺伝子は、ＷＮＴ１１、ＳＯＸ２及びＦＺＤ６を含む、請求項４４に記載の方法。
前記生存予測モデルは、
転移性乳癌と診断された複数の患者のトランスクリプトミクスデータを得るステップ；
完全ピアソン相関を使用して前記トランスクリプトミクスデータを複数のクラスタにクラスタリングするステップ；
前記複数のクラスタを前記複数の患者の全生存と相関させることにより、前記複数の患者の少なくとも一部の不良生存と関連する少なくとも１つのクラスタを同定するステップ；及び
前記複数の遺伝子の前記発現レベルの関数における前記複数の患者のうちの短期生存者からの長期生存者の分離の質に基づき、前記少なくとも１つのクラスタから前記複数の遺伝子を選択するステップ
を使用して作成される、請求項４４に記載の方法。
前記複数の患者の前記トランスクリプトミクスデータは、少なくとも１，０００個の遺伝子のＲＮＡ発現レベルを含む、請求項６０に記載の方法。
前記複数のクラスタの数は、エルボー法を使用して決定される、請求項６０に記載の方法。
前記複数のクラスタは、前記複数の患者の前記全生存と示差的に相関される、請求項６０に記載の方法。
前記少なくとも１つのクラスタは、１．３超のハザード比を有する、請求項６０に記載の方法。
前記予測生存期間を前記患者の実際の生存期間と比較することにより、前記生存予測モデルのｃ統計量を計算することをさらに含む、請求項６０に記載の方法。
前記生存予測モデルの前記ｃ統計量は、０．７超である、請求項６５に記載の方法。
前記予測生存期間に基づき、患者記録を更新又は作成することをさらに含む、請求項４４に記載の方法。