JP7365899B2 - 癌の分類および予後 - Google Patents

癌の分類および予後 Download PDF

Info

Publication number
JP7365899B2
JP7365899B2 JP2019518269A JP2019518269A JP7365899B2 JP 7365899 B2 JP7365899 B2 JP 7365899B2 JP 2019518269 A JP2019518269 A JP 2019518269A JP 2019518269 A JP2019518269 A JP 2019518269A JP 7365899 B2 JP7365899 B2 JP 7365899B2
Authority
JP
Japan
Prior art keywords
cancer
expression
genes
desnt
patient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019518269A
Other languages
English (en)
Other versions
JP2019537108A5 (ja
JP2019537108A (ja
Inventor
ボグダン-アレキサンドル ルカ
ビンセント モールション
ダニエル サイモン ブルーワー
コリン ステェファン クーパー
Original Assignee
ユーイーエー エンタープライジズ リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ユーイーエー エンタープライジズ リミテッド filed Critical ユーイーエー エンタープライジズ リミテッド
Publication of JP2019537108A publication Critical patent/JP2019537108A/ja
Publication of JP2019537108A5 publication Critical patent/JP2019537108A5/ja
Priority to JP2022147254A priority Critical patent/JP7539443B2/ja
Application granted granted Critical
Publication of JP7365899B2 publication Critical patent/JP7365899B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Immunology (AREA)
  • Wood Science & Technology (AREA)
  • Pathology (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Polysaccharides And Polysaccharide Derivatives (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Description

本発明は患者からのサンプルを使用する癌、特には前立腺癌の分類に関する。特に、本発明は潜在的に侵襲性の前立腺癌を同定する方法を提供し、どの癌が侵襲性であるか、または侵襲性になるか(従って治療が必要である)、またどれがインドレント(indolent)のままであるか(従って治療が必要ではない)を決定する。したがって、本発明は患者を予後不良であるかを同定するのに有用である。本発明によって同定された癌の特定の群はここにDESNT癌と呼ばれる。
前立腺癌の診断のための一般的な方法は血液中の前立腺特異性抗原(PSA)の測定である。しかしながら、PSAに検知される前立腺癌の50-80%は生物学上無関係である。すなわち、治療なしでも、それらは症状を引き起さないだろう。初期の前立腺癌の根治療法は、手術または放射線療法で、顕著な癌の人が理想的にターゲットとされるべきである。その結果、残りの生物学上「無関係の」疾病を有する者は、治療の副作用を免れる。診断時の個々の前立腺癌の振る舞いの正確な予測は、現在可能ではない。また、ほとんどの場合の即時の根治療法は共通のアプローチだった。彼らを悩ませていない「疾病」のための治療の結果、多くの人にインポテンスまたは失禁が起こる。多くの予後のバイオマーカーが前立腺癌のために提案された。重要な質問は、生物学上無関係の疾病を持った者から臨床的に顕著な場合を区別するために、PSAに検知された初期の前立腺癌にこれらのバイオマーカーを適用することができるかどうかである。侵襲性の癌を初期に検知するための有効な方法は、初期の前立腺癌の管理でのパラダイム・シフトに結びつくことがある。
前立腺癌の臨床の管理での重大問題は、それが高度に多様性(heterogeneous)であるということである。したがって、個々の癌の振る舞いの正確な予測は、診断の時に達成可能ではなく、本質的な過剰治療に結びつく。他の多くの癌タイプとは対照的に、グローバルな表現パターンの管理されていない分析に基づいた前立腺癌の層化が可能だったかどうかは謎のままである:乳癌(例えばERBB2 過剰発現(overexpressing))については、基底・管腔のサブグループは同定することができる。
侵襲性の癌(それは治療を要求することがある)および非侵襲性の癌(それは恐らく治療しないでおくことができ、不必要な介在からの患者への副作用も与えないでおくことができる)を同定する際に、前立腺癌のための、よりよいアシストへのもっと信頼できる診断テストの必要がある。本発明は、患者がDESNTと呼ばれる人間の前立腺癌の予後不良カテゴリーのメンバーであるか否かを予測するための、アルゴリズムに基づいた分子診断アッセイを提供する。ある実施態様では、ある遺伝子(たとえば表2あるいは表3にリストされたもの)の発現レベルが、癌がDESNT癌であるか否かを予測するために単独であるいは組み合わせて使用されることができる。本発明の方法の実施によって提供される、アルゴリズムに基づいた分析および関連する情報は、前立腺癌の最適な治療の意思決定を促進する。例えば、そのような医療ツールは、侵襲性疾患を有する高い危険を有する人、したがって根本的および/または積極的治療を必要とする患者を医師が同定することを可能にするだろう。
本発明の発明者は、ラテントプロセスデコンポジション(Latent Process Decomposition)と呼ばれるベイズのクラスタリング手続き(LPD, Simon Rogers, Mark Girolami, Colin Campbell, Rainer Breitling, "The Latent Process Decomposition of cDNA Microarray Data Sets", IEEE/ACM Transactions on Computational Biology and Bioinformatics, vol.2, no. 2, pp. 143-156, April-June 2005) doi:10.1109/TCBB.2005.29)を適用し、4つの独立した前立腺癌トランスクリプトーム・データセット中で、一般的なプロセスを同定してDESNTを指定した。DESNT癌は、遺伝子のコアセットのダウンレギュレーション(down-regulation of a core set of genes)、細胞骨格マシーナリー(cytoskeleton machinery)に含まれる多くのコード化蛋白、イオン輸送および細胞接着により特徴づけられる。PSA再発データ(PSA failure data)とリンクした3つのデータセットと引き続くDESNTを持った前立腺摘除患者について、癌は、非DESNT患者と比較して非常に貧弱な結果(p=2.65x10-5、p=7.74x10-9およびp=4.28x10-5)を示した。それらが患者について非常に貧弱な結果を結果的にもたらすので、DESNT癌は侵襲性の前立腺癌と考えられる。結果は、人間の前立腺癌の新しい予後不良カテゴリーの存在を実証し、および療法のターゲッティングでのアシスト、インドレントな疾病を持った人の治療に関連する罹患率を回避するのを支援する。Rogersらと異なり、発明者は、生存したグループの相関を決定するために分析を行い、各プロセスのための特徴遺伝子(signature genes)の定義を提供した。発明者は、さらに癌のはるかに大きなセットおよび多数のデータセットの分析を行い、初めて異なるデータセットにわたって共通のプロセスを同定するだけでなく、さらにこの特定のグループと癌の予後不良と不変的に関連させた。発明者は、さらに任意に腫物病期、グリーソンスコア(Gleason score)およびPSAのような前立腺癌のための他のマーカーと組み合わせて、癌の予後を任意に決定するために使用することができる発現プロフィールを与えるためのこのプロセスの寄与を発見した。顕著には、本発明の方法は単純な階層的クラスター形成方法ではなく、従来技術と比較して患者サンプルのはるかに詳細で正確な分析を許可する。初めて、発明者は、癌進行の信頼できる予測を許容する方法を提供した。従来技術ではそのような相関を作ることができなかったので、癌進行を検知するために先行技術の方法は使用することができなかった。
発明者は、さらにLPDと異なり、コンピューター処理集約的でなく、広範囲のデータセットおよび個々の癌に適用することができるクラシファイヤーの開発を望んだ。したがって、本発明は、さらにDESNT癌を同定するためにランダムフォレスト分類(random forest classification)で使用することができる遺伝子特徴(gene signature)を同定する方法を提供する。
発明者は、追加の数学的方法を使用し、予後と診断のさらなる方法を提供し、かつさらに患者を予後不良と同定するのに役立つバイオマーカーおよびバイオマーカー・パネルを提供する。
ここに使用されるように、「DESNT」癌は予後不良の前立腺癌、および治療を要求する癌を指す。「DESNTステータス」は、癌が進行(あるいは、経時データとして進行していた)すると予測されるか否かをいい、DESNTステータスを決定するステップは、癌が進行し、従って、治療を要求するか否かを予測することをいう。進行は高いPSA、転移および/または患者の死亡を指すことがある。本発明は、患者を潜在的に予後不良と同定し、それらに治療を推薦するのに役立つ。
発明の最初の態様では、患者の癌(たとえば前立腺癌)を分類する方法であって、例えば侵襲性の癌(たとえば侵襲性の前立腺癌)の診断、または患者を癌の予後不良(つまりDESNT癌の患者)と同定する、以下を含む方法が提供される:
a) 患者から得られたサンプル中の複数の遺伝子の発現レベルを決定し、患者の発現プロフィールを提供すること;
b) 統計のベイズのクラスタリング分析あるいは他のクラスタリング分析を、患者の発現プロフィールおよび異なる患者からの同じ複数の遺伝子についての参照データセットについて行うこと;
c) 任意に複数回分析ステップb)を繰り返すこと;および
d) 癌を分類し、患者が癌にかかっているかどうか決定する、あるいは患者が予後不良(つまり、患者はDESNT癌にかかっている)かどうか決定すること。
この方法およびその変法は今後方法1と呼ばれる。
発明の第二の態様では、前立腺癌を分類する方法が提供され、例えば患者の侵襲性の前立腺癌の分析方法、または患者を前立腺癌予後不良と同定する方法、つまりDESNT前立腺癌の患者と同定する方法であって、以下を含む方法が提供される:
a) データセット中の個々の患者のサンプルのDESNTステータスが知られている参照データセット(例えばLPD分析によって決定される)を提供すること;
b) このデータセットから複数の遺伝子を選択すること、ここで複数の遺伝子が、表2にリストされたグループから選ばれた少なくとも5、少なくとも10、少なくとも20、少なくとも30、少なくとも40、あるいは少なくとも45の遺伝子を含むか、または表3にリストされたグループから選ばれた少なくとも5、少なくとも10、少なくとも15あるいは少なくとも20遺伝子を含む;
c) 任意に:
(i) コントロールとして患者のサンプル中の少なくとも1つの異なる遺伝子の発現ステータスをさらに決定すること、ここでコントロール遺伝子は表2あるいは表3にリストされた遺伝子ではない;
(ii) 複数の遺伝子およびコントロール遺伝子の発現の相対的なレベルを決定すること;および
d) これらの選択された遺伝子の発現ステータスを使用し、参照データセットにスーパーバイズされた機械学習アルゴリズム(supervised machine learning algorithm)(例えばランダムフォレスト分析(random forest analysis))を適用し、DESNT癌のための予測を得ること;
e) 患者から得られたサンプル中の同じ複数の遺伝子の発現ステータスを決定し、患者の発現プロフィールを提供すること;
f) 任意に、参照データセットに対して患者の発現プロフィールを正規化すること;および
g) 患者の発現プロフィールへ予測を適用し、癌を分類し、侵襲性の癌の存在を決定するか、あるいは患者は予後不良かどうか(つまり、患者の癌がDESNTあるいは非DESNTか)を決定すること。
この方法およびその変法は今後方法2と呼ばれる。
発明の第3の態様では、癌、たとえば前立腺癌を分類する方法が提供され、例えば患者の侵襲性の癌、たとえば前立腺癌の分析方法、または患者の癌を予後不良と同定する方法、つまりDESNT癌の患者と同定する方法であって、以下を含む方法が提供される:
a) データセット中の個々の患者のDESNTステータスが知られている参照データセット(例えばLPD分析によって決定される)を提供すること;
b) このデータセットから複数の遺伝子を選択すること;
c) これらの選択された遺伝子の発現ステータスを使用し、データセットにスーパーバイズされた機械学習アルゴリズム(例えばランダムフォレスト分析)を適用し、DESNT癌のための予測を得ること;
d) 患者から得られたサンプル中の同じ複数の遺伝子の発現ステータスを決定し、患者の発現プロフィールを提供すること;
e) 任意に参照データセットへ患者の発現プロフィールを正規化すること;および
f) 患者の発現プロフィールへ予測を適用し、癌を分類し、侵襲性の癌の存在を決定するか、あるいは患者は予後不良かどうか(つまり、患者の癌がDESNTあるいは非DESNTか)を決定すること。
この方法およびその変法は今後方法3と呼ばれる。
発明の第4の態様では、前立腺癌を分類する方法が提供され、例えば患者の侵襲性の癌(たとえば侵襲性の前立腺癌)の診断方法、または患者を癌予後不良と同定する方法、つまりDESNT癌の患者と同定することであって、以下を含む方法が提供される:
a) データセット中の個々の患者のサンプルのDESNTステータスが知られている参照データセット(例えばLPD分析によって決定されされる)を提供すること;
b) このデータセットから、その発現ステータスがDESNTおよび非DESNT癌の間で相違することが知られている複数の遺伝子を選択すること、たとえば表4にリストされた複数の遺伝子、たとえば少なくとも100、少なくとも200、少なくとも300、少なくとも400、少なくとも500あるいは少なくとも1000の遺伝子を選択すること;
c) 選択された遺伝子にLASSOロジスティク回帰モデル分析を適用し、DESNT癌と同定する選択された遺伝子の部分集合を同定すること;
d) 選択された遺伝子のこの部分集合の発現ステータスを使用し、スーパーバイズされた機械学習アルゴリズム(例えばランダムフォレスト分析)をデータセットに適用し、DESNT癌についての予測を得ること;
e) 患者から得られたサンプル中の選択された遺伝子の部分集合の発現ステータスを決定し、患者の発現プロフィールを提供すること;
f) 任意に参照データセットへ患者の発現プロフィールを正規化すること;および
g) 患者の発現プロフィールへ予測を適用し、癌を分類し、侵襲性の癌の存在を決定するか、あるいは患者は予後不良かどうか決定すること(つまり、患者の癌がDESNTかあるいは非DESNTかを決定すること)。
この方法およびその変法は今後方法4と呼ばれる。
発明の第5の態様では、癌の進行の予測、あるいは癌の分類指標として表2にリストされた遺伝子を含むバイオマーカー・パネルが提供される。特に、表2にリストされた遺伝子は癌(たとえば前立腺癌)の進行を予測するために使用することができる。これらの遺伝子のダウンレギュレーションは癌進行の予測である。一般に、発明の実施態様では、表2からの遺伝子の、少なくとも5、少なくとも10、少なくとも20、少なくとも30あるいは少なくとも40が使用される。ある実施態様では、表2からの45の遺伝子のすべてが使用されるだろう。したがって、同じバイオマーカー・パネルを使用して、他の癌タイプの進行を予測することができるが、このパネルは患者の中の侵襲性の癌の診断、特には侵襲性の前立腺癌の診断に役立つ。
発明の第6の態様では、癌の進行の予測、あるいは癌の分類指標として表3にリストされた遺伝子を含むバイオマーカー・パネルが提供される。特に、表3にリストされた遺伝子は癌の進行を予測するために使用することができる。一般に、発明の実施態様では、表3からの遺伝子の、少なくとも5つ、少なくとも10、あるいは少なくとも15が使用される。ある実施態様では、表3からの20の遺伝子はすべて使用されるだろう。このパネルは特に前立腺癌に関連し、したがって、患者の中の前立腺癌進行を予測するのに役立つ。
発明の第7の態様では、癌の進行の予測、あるいは癌の分類指標として表1にリストされた遺伝子を含むバイオマーカー・パネルが提供される。特に、表1にリストされた遺伝子は癌の進行を予測するために使用することができる。一般に、発明の実施態様の中で、表1からの遺伝子の少なくとも5、少なくとも10、あるいは少なくとも15、少なくとも20、少なくとも50、少なくとも100、少なくとも200、少なくとも300あるいは少なくとも400が使用されるだろう。ある実施態様では、表1からの500の遺伝子はすべて使用されるだろう。このパネルは前立腺癌へ特に関連し、したがって、患者の中の前立腺癌進行を予測するのに役立つ。表1から使用される遺伝子の選択はここに記述されるような方法を使用して決定されることができる。発明のある実施態様では、バイオマーカー・パネルは、癌のための予測の決定に関する本発明の方法によって生成される。そのような分析は、遺伝子の任意のセットで行うことができる。好ましくは、バイオマーカー・パネルが選ばれる遺伝子のセットは、少なくとも1000のランダムに選択された遺伝子を含む。ある実施態様では、遺伝子は、ハウスキーピング遺伝子(housekeeping genes)ではない(例えば表6にリストされた遺伝子ではない)。
上に定義されたパネルは総体として本明細書で「バイオマーカー・パネル」と呼ばれることがある。
発明の一層の態様では、癌(たとえば前立腺癌)について診断するか、スクリーンするか、検査する方法が提供され、特には侵襲性かDESNT癌か(たとえば侵襲性かまたはDESNT前立腺癌か)について提供され、バイオマーカー・パネルからの遺伝子のすべてまたは選択された遺伝子のサンプル内の発現のレベルを検査することを含む。ある実施態様では、生体試料は、前立腺組織生検(たとえば疑わしい腫物サンプル)、唾液、血液サンプルあるいは尿サンプルである。好ましくは、サンプルは、前立腺生検、前立腺摘除標本(取り出された前立腺)あるいはTURP(前立腺切除術)標本からの組織試料である。
癌(たとえば前立腺癌)、特には侵襲性の癌(たとえば侵襲性の前立腺癌)の診断で使用されるためのバイオマーカー・パネル中の1つ以上の遺伝子がさらに提供される。そのような癌を検知するか診断する方法におけるバイオマーカー・パネルの中の1つ以上の遺伝子の使用、およびバイオマーカー・パネルの中の1つ以上の遺伝子を使用してそのような癌を検知するか診断する方法を提供する。
癌(たとえば前立腺癌)、特には侵襲性の癌(たとえば侵襲性の前立腺癌)の進行の予測での使用のための、バイオマーカー・パネル中の1つ以上の遺伝子がさらに提供される。癌の進行を予測する方法でのバイオマーカー・パネルの中の1つ以上の遺伝子の使用、およびバイオマーカー・パネルの中の1つ以上の遺伝子を使用して、癌の進行を予測する方法がさらに提供される。
癌(たとえば前立腺癌)の分類で使用するためのバイオマーカー・パネルの中の1つ以上の遺伝子がさらに提供される。癌を分類する方法におけるバイオマーカー・パネルの中の1つ以上の遺伝子の使用、およびバイオマーカー・パネル中の1つ以上の遺伝子の使用する癌の分類方法がさらに提供される。
生体試料中のバイオマーカー・パネルの1つ以上の遺伝子の発現のレベルを検知するための手段を含む、前立腺癌を検査するためのキットの一部がさらに提供される。さらにバイオマーカー・パネルの中にない1つ以上のコントロール遺伝子の発現のレベルを検知するための手段を含むことができる。
生体試料中のバイオマーカー・パネルの1つ以上の遺伝子の発現のレベルを検知することを含む、侵襲性および非侵襲性の前立腺癌を同定する方法がさらに提供される。任意に、測定された遺伝子の各々の発現レベルは、参照と比較される。参照はコントロールまたはハウスキーピング遺伝子であることができる。ある実施態様では、コントロール遺伝子は表6あるいは表7にリストされた遺伝子から選ばれる。表7のコントロール遺伝子は前立腺癌へ特に関連する。表6のコントロール遺伝子はより広く有用である。
さらに、侵襲性の癌の診断方法、癌の分類方法、癌の予後予測方法、癌進行の予測方法であって、生体試料中のバイオマーカー・パネル中の1つ以上の遺伝子の発現のレベルを検知を含む方法が提供される。任意に、方法は定量化された遺伝子の各々の発現レベルを参照と比較することをさらに含む。
発明の一層の態様では、患者の前立腺癌を治療する方法であって、侵襲性の前立腺癌あるいは予後不良の癌が診断されるか疑われる場合に、前立腺癌の治療を行う方法が提供される。発明では、発明の方法のうちの1つを使用して、患者は侵襲性の前立腺癌を持っているか、予後不良であると診断される。ある実施態様では、患者の癌(たとえば前立腺癌)を診断するか、分類するか、予後不良か、癌の進行を予測する方法、あるいは患者を前立腺癌の予後不良と患者と同定(つまり、患者をDESNT前立腺癌と同定)する方法により、治療方法が進められる。
ラテントプロセスデコンポジション(Latent Process Decomposition:LPD)、遺伝子相関および臨床の結果。 DESNT予後不良前立腺癌(DESNT poor prognosis prostate cancer)で共通してダウンレギュレートされた遺伝子 癌ゲノムアトラスデータセット(The Cancer Genome Atlas dataset)中のRF-DESNTおよび非-RF-DESNT癌の比較。 コンピュータ機器の例 ログ尤度プロット(Log-likelihood plots) トランスクリプトーム・データセットのラテントプロセスデコンポジション(LPD)分析。 LPDによって同定されたDESNT癌についての結果の分析。 LPD分類によって同定されたDESNT癌の遺伝子発現の相関。 20の遺伝子シグネチャー(gene signature)を使用するRF分類によるDESNT癌の検知。 RF分類によって同定されたDESNT癌のための結果の分析。 RF分類によって同定されたDESNT癌の遺伝子発現の相関。 LPD結果の分布 MSKCCデータセットのLPD。 DESNT癌存在のパーセンテージに基づいた前立腺癌の層化(stratification)。 LPDについて1、3、5および7年でのPSAのない生存を予測するために開発されたノモグラムモデル LPDのためのコックス・モデル。
表1: 前立腺癌の大部分にわたり変わる500の遺伝子プローブ。(隅付きかっこ、表2-1から表2-4に示される。)
表2: CancerMap、Stephenson、MSKCCおよびKleinデータセットからの80/100の45の共通してダウンレギュレートされた遺伝子。(隅付きかっこ、表3に示される。)
表3: 20のランダムフォレスト遺伝子。(隅付きかっこ、表4に示される。)
表4: DESNTおよび非DESNT癌の間で変化する1669の遺伝子。(隅付きかっこ、表5-1から表5-6に示される。)
表5: CamCap、Stephenson、MSCKSSおよびKleinデータセットからの67/100の35の共通してダウンレギュレートされた遺伝子。(隅付きかっこ、表6に示される。)
表6: 一般コントロール/ハウスキーピング遺伝子。(隅付きかっこ、表7に示される。)
表7: 前立腺癌のためのコントロール/ハウスキーピング遺伝子。(隅付きかっこ、表8に示される。)
詳細な発明の説明
本発明は癌進行予測に役立つ方法、バイオマーカー・パネルおよびキットを提供する。発明の1つの実施態様では、癌を分類する方法、侵襲性の癌を診断する方法、予後不良の癌(つまりDESNT癌の患者)を同定する方法であって以下を含む方法が提供される:
a) 患者から得られたサンプル中の複数の遺伝子の発現レベルを決定し、患者の発現プロフィールを提供すること;
b) 統計的ベイジアンクラスタリング分析あるいは異なるクラスタリング分析を、患者の発現プロフィールと異なる患者からの同じ複数の遺伝子についての参照データセットについて行うこと;
c) 任意に、複数回分析ステップb)を繰り返すこと;および
d) 癌を分類し、患者が侵襲性の癌にかかっているかどうか決定するか、あるいは患者が予後不良(つまり、患者はDESNT癌にかかっている)かどうか決定すること。
この方法は前立腺癌へ特に関連するが、他の癌にも適用することができる。
方法1の分析ステップb)が繰り返される実施態様では、分析が実行されるごとに、異なる最初のランダムシードが使用されることができる。
複数の遺伝子の発現のレベルを決定する方法1のステップa)は、その発現レベルが癌により変わることが知られている遺伝子に対して実行されることができる。例えば、発現のレベルは、少なくとも50、少なくとも100、少なくとも200、あるいは最も好ましくは少なくとも500の癌により変わることが知られている遺伝子について決定されることがある。当業者は、たとえば癌患者について以前に公表されたデータセットを使用し、その発現レベルが異なる癌サンプルで変わる一群の遺伝子を選んで、どの遺伝子を測定しなければならないかを決めることができる。特に、遺伝子の選択は、それらの発現レベルが癌の種類により変わることが知られている量に基づいて決定される。
癌による変異は、同じ組織起源(例えば前立腺、胸、肺など)を有する癌について見られる発現における変異を指す。例えば、発現における変異は、同じ組織起源の癌にかかっている異なる患者から採取されたサンプル間で測定することができる発現の差である。遺伝子の選択を見る時、いくらかまたはすべてのサンプルにわたって同じか同様の発現を持つだろう。これらはほとんど変異がないか、あるいは少ない変異を持つと言われている。他のものはハイ・レベルの変異(いくつかのサンプルでは高い発現があり、他のものにおいては低い)を有する。
発現レベルが前立腺癌間でどれくらい変わるかの測定は、特には統計分析で、当業者に知られている多くの方法で決定することができる。例えば、当業者は、各々の複数の癌サンプル中の複数の遺伝子を考慮し、複数のサンプルにわたる発現レベルの標準偏差または相互四分位の範囲が、前もって定義した閾値を越える遺伝子を選択することができる。遺伝子はサンプルまたは患者にわたるそれらの変化によってオーダーすることができる。また、変わる遺伝子の選択を行うことができる。例えば、変化が最大の遺伝子を使用することができ、たとえば500の遺伝子が最大の変化を示す。もちろん、最大に変化する遺伝子が必ずしも使用されることが重大だとは限らない。例えば、トップの500から1000の遺伝子を使用することができることがある。一般に、変化によるものである場合、選ばれた遺伝子はすべて、遺伝子のトップ50%であるだろう。重要なことは、発現レベルが参照データセットにわたり変わるということである。遺伝子の選択は臨床の攻撃性(clinical aggression)に関係なく行われる。これはスーパーバイズされていない分析として知られている。当業者は、この目的のための遺伝子の選び方に気づいている。
ステップb)は、1つ以上の参照データセットの使用を要求する。参照データセットが当業者に利用可能であるので、参照データセットの調製は一般に方法の一部ではない。方法1の以前に得られた参照データセット(あるいはステップbの中で新たに得られた参照データセットでさえ)を使用する場合、参照データセットへの患者のサンプル中の複数の遺伝子についての発現のレベルの正規化は、患者のサンプルについて得られた情報が参照データセットと比較可能だったことを保証するために要求されることがある。正規化技術は当業者に知られており、例えば完全なマイクロアレイ・データセットが利用可能な場合に、Robust Multi-Array Average、Froze Robust Multi-Array Average または Probe Logarithmic Intensity Errorが知られている。Quantile正規化も使用することができる。最初の発現プロフィールが参照データセットと組み合わされた後に正規化を行い、正規化された組み合わされたデータセットを提供することができる。
正規化の方法は、たとえば分析されたRNAの量の差および、使用されるRNAの品質の変異等を説明するために、測定されたレベルの補正を含み、すべての分析された遺伝子を比較可能なスケールにする。コントロール遺伝子(ハウスキーピング遺伝子とも呼ばれる)は、適切な条件(例えばDESNT癌)下で発現ステータスにおいて異ならないと知られているので有用である。ハウスキーピング遺伝子の例は当業者に知られており、それらはRPLP2、GAPDH、PGK1 Alas1、TBP1、HPRT、K-Alpha1およびCLTCを含んでいる。ある実施態様では、ハウスキーピング遺伝子は表6あるいは表7にリストされたものである。表7は前立腺癌へ特に関連する。発明の好ましい実施態様は、少なくとも2つのハウスキーピング遺伝子を正規化に使用する。
方法1のステップa)は、一人の患者からの単一の発現プロフィールを含むことができる。あるいは、診断を行う異なる患者からの2つ以上の発現プロフィールを使用することができる。多くの患者を同時に診断する場合、そのようなアプローチは有用である。方法は、それらの発現プロフィールが分析ステップでより容易に同定されることを可能にするために、患者の発現プロフィールの各々のユニークなラベルを付するステップを含むことがある。
ある実施態様では、特には前立腺癌に関係するものでは、発現のレベルは表1のリストから選ばれた複数の遺伝子のために決定される。
ある実施態様では、方法1のステップa)は表1の中のリストから選ばれた少なくとも20、少なくとも50、少なくとも100、少なくとも200あるいは少なくとも500の遺伝子の発現レベルを決定することを含んでいる。遺伝子の数が増加するにつれて、テストの正確さはさらに増加する。好ましい実施態様では、500の遺伝子は少なくともすべて表1の中のリストから選ばれる。しかしながら、表1の遺伝子に制限する必要はない。
ある場合には、さらに多くの遺伝子の発現のレベルについての情報が、方法1のステップa)の中で得られることがある。たとえば非常に多くの遺伝子の発現のレベルを決定するマイクロアレイの使用によって得られる。全体のトランスクリプトームを得ることは可能である。しかしながら、その発現レベルが前立腺癌にわたって変わることが知られている遺伝子の部分集合に、引き続く分析ステップを行なうことのみが必要である。好ましくは、もし遺伝子の部分集合が癌(たとえば前立腺癌)により異なる発現レベルを伴っていれば、これは厳密に必要ではないが、使用される遺伝子は、前立腺癌によりその発現レベルが大きく変わる(つまり、発現は癌攻撃性によって変わる)るものになるだろう。
分析が行なわれる実際の遺伝子は、利用可能な発現レベル情報に依存するだろう。また、それはデータセットごとに変わることがある。この方法のステップは、遺伝子の特定のリストに制限される必要はない。しかしながら、表1にリストされた遺伝子は使用することができる。
したがって、方法1のステップa)は、方法の残りに必要とされる遺伝子の非常に多数の決定を含んでいることがある。したがって、方法は、患者のサンプルについて、発現プロフィールから、発現レベルが前立腺癌により変わることが知られている遺伝子の部分集合を選択するステップをさらに含むことがある。部分集合は表1から選ばれた少なくとも20、少なくとも50、少なくとも100、少なくとも200、あるいは少なくとも500の遺伝子であることがある。
好ましい実施態様では、ベイズのクラスタリング分析はラテントプロセスデコンポジション(LPD)分析である。そのような数理モデルは当業者に知られており、例えばSimon Rogers, Mark Girolami, Colin Campbell, Rainer Breitling, "The Latent Process Decomposition of cDNA Microarray Data Sets", IEEE/ACM Transactions on Computational Biology and Bioinformatics, vol.2, no. 2, pp. 143-156, April-June 2005』, doi:10.1109/TCBB.2005.29、に述べられている。使用することができる代替のベイズのクラスターアルゴリズムは次のものを含んでいる:デリクレットのプロセス混合モデル(Dirichlet Process Mixture Models)、ベイズの階層的クラスタリング(Bayesian Hierarchical Clustering)、ベイズの超パラメーター再評価による多重トピック・マイクロアレイ分析(Bayesian Multi-topic Microarray Analysis with Hyperparameter Reestimation)、ベイズの混合モデル(Bayesian Mixture Models)、LPDへのマルコフ連鎖モンテカルロアプローチ(a Markov Chain Monte Carlo approach to LPD)、マージナライズドベイズのアプローチ(a marginalized variational Bayesian approach)。
LPD分析が参照データセット(それは複数の患者についての、その発現レベルが前立腺癌により著しく変わる多くの遺伝子の発現レベルについての情報を含んでいる)上で行なわれる場合、DESNT(侵襲性か予後不良)癌をすべて示す患者の個体群を同定することは可能である。LPD分析は「プロセス」へ患者をグループ化する。本発明の発明者は、その発現レベルが前立腺癌により変わると知られている遺伝子を使用してLPD分析が行なわれる場合、患者について否定的な結果(つまりDESNT/侵襲性の癌)を常に本質的に伴う、1つの特別の患者集団(あるいはプロセス)が同定されることを驚くべきことに発見した。さらにより驚いたことに、このプロセスは多数の異なるデータセットでも存在する。
本発明では、発明者は、log尤度プロット(log-likelihood plots)(図1b、5)から示されるように、全体の発現プロフィールに寄与する、3から8の根本的なプロセス間に使用して、LDP分析を行なった。各データセットのデコンポジションに続いて、それらの最も高いpi値に基づいて個々のプロセスに割り当てられた癌は、図1aおよび図6の中で示される結果を与えた。piは、個々の癌の発現プロフィールへの各プロセスiの貢献値である:すべてのプロセスでのpiの合計=1である。しかしながら、必ずしも最も高いpi値を使用する必要があるとは限らず、piは違う様に定義することができる。また、当業者は可能な変化を理解できるだろう。例えば、piは、少なくとも0.1、少なくとも0.2、少なくとも0.3、少なくとも0.4あるいは好ましくは少なくとも0.5であることができる。
確かに、実施例2に実証されるように、piは連続変数で、与えられたサンプルの発現プロフィールへの与えられたプロセスの貢献の指標である。DESNTプロセスの貢献が高いほど(与えられたサンプルについて発現プロフィールへのDESNTプロセスに関するpi値が高いほど)、癌が不良な結果を持つという可能性は大きい。実施例2に実証され示されるように、与えられたサンプルについては、多くの異なるプロセスが発現プロフィールに寄与することができる。
DESNTプロセスが予測される不良な結果について最も優性な(つまり発現プロフィールに寄与するすべてのプロセスの中で最も高いpi値を有すること)ものであることは必ずしも必要としない。しかしながら、pi値がより高いと、患者の結果はより悪くなり;PSAへの参照だけではなく、さらに転移と死亡はより起こりそうである。ある実施態様では与えられた癌についての全体的な発現プロフィールへのDESNTプロセスの貢献は、DESNTである癌の可能性を評価する場合に、決定されることができる。ある実施態様では、癌進行の予測は、腫瘍のステージ、グリーソンスコア(Gleason score)および/またはPSAスコアの1つ以上との組み合わせで行われることがある。したがって、ある実施態様では、癌予後を決定するステップは、発現プロフィールへのDESNTプロセスについてのpi値を決定するステップを含むことができ、任意に、さらに、患者の腫瘍のステージ、患者のグリーソンスコア、または患者のPSAスコアの決定を含むことがある。
ある実施態様では、個々の患者の発現プロフィールをグループ化するステップは、各発現プロフィールについてLDP分析を使用して、個々の患者の発現プロフィールについて全体的な発現プロフィールへの各グループの貢献(pi)を決定することを含む(そこでは与えられた発現プロフィールに対するすべてのpi値の合計は1である)。患者の発現プロフィールは、全体的な発現プロフィールに最大に寄付するグループによって個々のグループに割り当てられることができる(言いかえれば、患者の発現プロフィールは最も高いpi値を備えたグループに割り当てられる)。ある実施態様では、グループはそれぞれDESNTあるいは非DESNTステータスのいずれかに割り当てられる。患者の癌進行は、全体的な発現プロフィールへのDESNTプロセスの貢献(pi値)によって予測することができる。ある実施態様では、患者の癌サンプルのDESNTプロセスに対するpi値が、少なくとも0.1、少なくとも0.2、少なくとも0.3、少なくとも0.4、あるいは少なくとも0.5である場合、DESNT癌が予測される。
図1aでは、「pi」値は縦軸に示される。カラムはそれぞれ単一の患者を示す。各データセットのLPDに続いて、癌は、この図の中で示される結果を与えるそれらの最も高いpi値に基づいて個々のプロセスに割り当てられた。piは、個々の癌の発現プロフィールへの各プロセスiの寄与である:すべてのプロセスのパイ値の合計=1である。
参照データセットは先に得られることができる。一般に、これらのデータセットを得ることは要求される本発明の方法の一部ではない。しかしながら、ある実施態様では、方法はLPD分析へ包含される追加のデータセットを得ることをさらに含むことがある。参照データセットは、患者のサンプルの中で測定された同じ遺伝子を含む、複数の発現プロフィールの形である。
ここに記述された方法のすべてにおいては、DESNT癌あるいはDESNT癌グループを同定することが可能な、4つの主な方法がある:
(i) 別の1または複数のデータセットのDESNT癌グループとの遺伝子発現レベルの相関;
(ii) コアダウンレギュレート遺伝子セット(core down-regulated gene set)とDESNTおよび非DESNT癌の間の差別的に発現した遺伝子とのオーバーラップのデモンストレーション;
(iii) より不良な臨床の結果;および
(iv) 一緒にされた参照のLPD、および患者のデータセットが既知のDESNTグループでクラスターにされる場合に割り当てられたDESNTステータスの未知の患者のデータセットにLPDを行うこと。
最初の(i)の方法では、LPD分析が行なわれた後、患者のサンプルは異なるプロセスで一緒にグループ化される。各プロセスでの患者について、各遺伝子の発現のレベルは平均される。その後、DESNT癌の存在が知られている他のデータセットからのデータと、平均された発現レベルを関連づける。従って、新しいデータセット中のプロセスが、DESNT癌に関連しているかを決定することができる。その後、新しいデータセットは、本発明の方法の中で使用することができる。新しいデータセットが1つ以上の未知の患者サンプルを含んでいる場合、未知の患者のサンプル・グループがDESNTプロセスを備えているか否かの決定をなすことができる(つまり、DESNTプロセス/グループと同じプロセス/グループに割り当てられる)からである。あるいは、DESNTグループ中の平均遺伝子発現レベルとサンプル中の遺伝子の発現を関連付けすることは可能である。このように、単一の未知の標本の相関付けを実行することが可能である。
第2の(ii)の方法では、DESNT癌で異なる発現をすることが知られている(例えば、ダウンレギュレートされる)、遺伝子の参照セットを持っていることが必要である。これは、複数のデータセットについてのLPD分析を行い、各データセット中のプロセスを決定することにより、先に得られることができる。その方法では、共通のプロセスは上に記述された方法を使用して、遺伝子相関に基づいて同定することができる。各データセットの非DESNTプロセスと、DESNTプロセスの各発現プロフィールと比較して、一貫してダウンレギュレートされる遺伝子の部分集合が同定される。本発明の発明者によって行なわれた分析では、分析された4つのデータセットについてのLPD分析の100回の検定で、少なくとも80回で45の遺伝子が最も共通してダウンレギュレートされると分かった(表2)。しかしながら、異なるデータセットが使用される場合、異なる遺伝子が同定されることがある。異なるデータセットが使用される時、同定された遺伝子間に相当なオーバーラップがあるだろう。例えば、データセットの異なるコンビネーションを使用して、研究者によって行なわれた第2の分析では、35遺伝子が、各データセットのLPD分析の100回の内の少なくとも67回でダウンレギュレートしたと分かった(表5)。最初の分析で同定された、45の共通してダウンレギュレートされた遺伝子と、27の遺伝子にオーバーラップがあった。
一旦コアダウンレギュレートされた遺伝子セットが得られれば、方法(ii)は実行することができる。特に、DESNT癌は、テスト・データセットからの1つのグループにおける差別的に発現した遺伝子と、コアダウンレギュレートした遺伝子のセットの間でのオーバーラップを示すことにより同定することができる。「オーバーラップ」は、50%、60%、70%、80%、90%あるいは100%のオーバーラップであることができる。好ましくは、オーバーラップは少なくとも67%である。コアダウンレギュレートされた遺伝子セットは、少なくとも5、少なくとも10、少なくとも20、少なくとも30、あるいは少なくとも40の遺伝子を含むことができる。例えば、コアダウンレギュレートされた遺伝子セットは、表1の45の遺伝子を含むことができる。
発明の1つの実施態様では、したがって、癌を分類する方法であって、表2からの少なくとも5、少なくとも10、少なくとも20、少なくとも30、少なくとも40、あるいはすべての45の遺伝子の患者サンプルの発現のレベルと、健康な者または侵襲性もしくはDESNT癌にかかっていない者の同じ遺伝子の発現とレベルを比較することを含む方法が提供される。あるいは、方法は表5からの少なくとも5、少なくとも10、少なくとも20、少なくとも30、あるいは35の遺伝子すべての患者サンプルの発現のレベルを比較することを含むことがある。患者のサンプル中の遺伝子の少なくとも50%、60%、70%あるいは80%の発現のレベルがコントロールまたは参照の遺伝子よりも低い場合、DESNT癌は存在し、癌進行が予測される。
新しい(テスト)データセットが1以上の未知の患者サンプルを含んでいる場合、未知の患者のサンプル・グループがDESNTプロセスを備えているか否かの決定をなすことができる。
第3(iii)の方法では、LPDによって同定されたDESNT癌プロセスはより不良な臨床結果、たとえば、非DESNT癌と比較された時、患者の死亡あるいは癌再発に関係する。再び、新しい(テスト)データセットが1以上の未知の患者サンプルを含んでいる場合、第3(iii)の方法を使用して未知の患者のサンプル・グループがDESNTプロセスを備えているか否かの決定をなすことができる。
第4の(iv)の方法では、単一の患者サンプルからの複数の遺伝子についての単一の発現プロフィールへLPD分析を実行し、その個々の患者がDESNT癌にかかっているかどうか決定することは可能ではない。発明の1つの方法では、患者のサンプルからの発現プロフィールがより大きなデータセットの分析に含められることが必要である。したがって、例えば、方法1のステップb)(LPD分析ステップ)は、患者の発現プロフィールおよび参照データセットに同時に行うことができる。言いかえれば、患者の発現プロフィールはLPD分析に先立って、参照データセットと結合することができる。追加の患者のサンプルがDESNT癌プロセスにグループ化される場合、患者はDESNT癌にかかっている。
したがって、本発明の1つの実施態様では、方法は、
a) 患者から得られたサンプル中の複数の遺伝子の発現のレベルを決定し、最初の発現プロフィールを提供すること、
b) 参照データセットと最初の発現プロフィールを組み合わせて結合データセットを得ること、ここで該参照データセットは異なる患者から得た同じ複数の遺伝子のための発現プロフィールを含み、任意に参照データセット中の患者の臨床の結果は知られている;
c) 該結合データセットについてのLPD分析を行なうこと;
d) DESNT癌に関係しているLPD分析からプロセス(患者群)を同定すること;および
e) 患者のサンプルがDESNT癌を伴うプロセス(患者群)中かどうか決定することにより、癌を分類するか、患者の中のDESNT癌の存在又は非存在を決定することを含む。
既に記載されたように、本発明の方法のうちのいくつかは、多数の患者サンプルに対して同時に実行することができる。例えば、サンプル中の複数の遺伝子の発現のレベルは、少なくとも2人の異なる患者から得られた少なくとも2つのサンプルの中で決定され、各患者についての発現プロフィールを提供する。
本発明の方法はさらに、1つ以上の患者の発現プロフィールにユニークなラベルを割り当てることを含み、分析ステップの間により容易にそれらを同定することができるようにされる。
本発明の方法で、DESNT癌に関係するプロセス/患者群の同定を、上記の最初の3つの方法のうちの1つの使用により行うことができる。具体的には、(i) 別のデータセットのDESNT癌グループと遺伝子発現レベルの相関;(ii) コアダウンレギュレート遺伝子セットを有するDESNTおよび非DESNT癌の間の差別的に発現した遺伝子のオーバーラップのデモンストレーション;
(iii) より不良な臨床の結果;
DESNTとしての個々の癌の割付は、方法(iv)の患者のデータセットが既知のDESNTグループか否かを決定するために、結合した参照データセットと患者のデータセットにLPDを実行することにより達成される。方法(iii)は、既知とされる参照データセット中の患者に臨床結果を要求する。
「臨床結果」は、参照データセット中の各患者について、癌が進行したか否かを意味する。例えば、初期評価の一部として、患者は前立腺特異性抗原(PSA)レベルをモニターされることがある。それが特定のレベルを上回る場合、これは再発、そしてその結果として疾患の進行を示す。病理組織学的診断も使用されることができる。リンパ節への広がり、転移にも使用される。さらに癌による患者の死亡(あるいは単に一般に患者の死亡)は臨床の終了である。グリーソン・スコアリング(Gleason scoring)、癌進度、および多数の生検(サンプルを得るために中空針を含むコアリング法(coring method)を使用して得られたもののような)が使用されることができる。臨床結果は前立腺癌の治療の後に評価されることがある。これは長期での患者の身に起こることである。通常、患者は、有効に前立腺を切除するか殺すために根本的に(前立腺摘除、放射線療法)治療されるだろう。再発あるいは引き続くPSAレベルの上昇(PSA再発として知られている)の存在は、進行した癌を示す。本発明の方法を使用して同定されたDESNT癌群は、より速く進行する癌の部分母集団を含む。そのような方法(i)、(ii)、(iii)および(iv)の組み合わせが使用されることができる。また、当業者は、参照データセット中の患者についての患者の結果を決定する方法に精通している。
従って、発明の方法のすべては、DESNT癌が疑われる患者の中で実行されることができる。重要なことには、癌の治療が提供される前に、本発明は、癌進行を予測することを許容する。癌が治療なしでも進行しない時にも、多くの患者が前立腺癌の不必要な治療を受けるので、これは前立腺癌にとって特に重要である。
さらに、同じデータが分析されている場合さえ、分析が実行されるごとに、LPDの結果がわずかに異なることがあるので、診断の正確さは分析の繰り返しにより増加される場合がある。多くの場合、その変異は、LPDプロセスの各実行の中で使用されている乱数発生機(シード値として使用される)の異なる出発点による。また、したがって、同じデータセット上の繰り返された実行についてさえ、多数の異なる結果が発生する場合がある。したがって、分析を複数の回行ない、モード値(最頻値)、または平均値を参照することが有益である。ある実施態様では、LPD分析は少なくとも2、3、5あるいは少なくとも20回行なわれる。ある実施態様では、分析は少なくとも50回行なわれる。好ましい実施態様では、分析は少なくとも100回(つまり、少なくとも99回繰り返される)行なわれる。
分析ステップが繰り返される実施態様では、癌がDESNTかどうか決定するステップは、癌がDESNTとして示される数と、癌が非DESNT(つまりインドレントか、非侵襲性の前立腺癌)として示される数の比較を要求することがある。例えば、患者が侵襲性の癌にかかっているという決定は、試みられた分析ステップの少なくとも50%で癌がDESNTであることを要求することがある。好ましい実施態様では、癌は少なくとも60%、あるいはもっと好ましい実施態様では少なくとも70%でDESNTでなければならない。最も好ましい実施態様では、癌は分析の少なくとも67%でDESNTである。
LPD分析が試みられる場合、それは多くのプロセス(グループ)へ分析されるデータセット中の患者を分割する。発明のある実施態様では、特定の患者(その臨床の結果は知られていない)がDESNT癌にかかっているかどうか決定するステップは、プロセス(例えば侵襲性の癌に関連した患者群)が知られていることを要求する。その後、参照データセットに加えられた患者のサンプルは、侵襲性の癌(DESNT)グループに存在するか、あるいは存在しないことができ、患者が侵襲性の癌にかかっているかどうか決定される。
しかしながら、上に記載されたように、参照データセット中の患者の臨床の結果を前もって知ることは必ずしも必要とは限らない。DESNT癌の存在を決定するこれらの2つの方法のどちらかあるいは両方を使用することができる:
(i) 他のデータセット中のDESNT癌グループと遺伝子発現レベルとの相関;または
(ii) コアをダウンレギュレートされた遺伝子セットのDESNTおよび非DESNT癌の間の差別的に発現した遺伝子のオーバーラップのデモンストレーション。
DESNTとしての個々の癌の割付は、結合した参照データセットと 患者のデータセットにLPDを実行し、患者のデータセットクラスターが既知のDESNTグループのクラスターに分けられるかどうか決定することにより達成することができる。
理想的には、参照データセット中のDESNT癌の存在または不存在は、これらの方法の3つまでを使用して決定される:
i. 別の1または複数のデータセット中のDESNT癌グループの遺伝子発現レベルの相関、
ii. コアダウンレギュレートされた遺伝子セットのDESNT癌および非DESNT癌の間の差別的に発現した遺伝子のオーバーラップのデモンストレーション、および
iii. 臨床の結果との相関。
患者のサンプル中の複数の遺伝子の発現のレベルを決定するステップは、ここに議論されたもののような当業者に公知の方法、たとえばProkopec SD, Watson JD, Waggott DM, Smith AB, Wu AH, Okey AB et al. Systematic evaluation of medium-throughput mRNA abundance platforms. RNA 2013; 19: 51-62; Chatterjee A, Leichter AL, Fan V, Tsai P, Purcell RV, Sullivan MJ et al.A cross comparison of technologies for the detection of microRNAs in clinical FFPE samples of hepatoblastoma patients. Sci Rep 2015; 5: 10438; Pollock JD. Gene expression profiling: methodological challenges, results, and prospects for addiction research. Chem Phys Lipids 2002; 121: 241-256; Mantione KJ, Kream RM, Kuzelova H, Ptacek R, Raboch J, Samuel JM et al. Comparing bioinformatic gene expression profiling methods: microarray and RNA-Seq. Med Sci Monit Basic Res 2014; 20: 138-142; Casassola A, Brammer SP, Chaves MS, Ant J. Gene expression: A review on methods for the study of defense-related gene differential expression in plants. American Journal of Plant Research 2013; 4, 64-73; Ozsolak F, Milos PM. RNA sequencing: advances, challenges and opportunities. Nat Rev Genet 2011; 12: 87-98.A cross comparison of technologies for the detection of microRNAs in clinical FFPE samples of hepatoblastoma patients. Sci Rep 2015; 5: 10438; Pollock JD. Gene expression profiling: methodological challenges, results, and prospects for addiction research. Chem Phys Lipids 2002; 121: 241-256; Mantione KJ, Kream RM, Kuzelova H, Ptacek R, Raboch J, Samuel JM et al. Comparing bioinformatic gene expression profiling methods: microarray and RNA-Seq. Med Sci Monit Basic Res 2014; 20: 138-142; Casassola A, Brammer SP, Chaves MS, Ant J. Gene expression: A review on methods for the study of defense-related gene differential expression in plants. American Journal of Plant Research 2013; 4, 64-73; Ozsolak F, Milos PM. RNA sequencing: advances, challenges and opportunities. Nat Rev Genet 2011; 12: 87-98、によることができる。
発明の実施態様では、すべての方法の分析ステップはコンピューターで実行できる。発明は、さらに本発明の方法の任意の方法を実行するようにプログラムされたコンピューター読取り可能なメディアを提供する。
発明の一層の実施態様では、前立腺癌を分類する方法、例えば患者の中の侵襲性の前立腺癌を診断するか、または患者の前立腺癌について予後不良(つまりDESNT前立腺癌の患者)と同定する方法であって、以下を含む方法が提供される。
a) データセット中の個々の患者のサンプルのDESNTステータスが知られている(例えばLPD分析によって決定される)参照データセットを提供すること;
b) このデータセットから複数の遺伝子を選択すること、ここで該複数の遺伝子は、表2にリストされたグループから選ばれた少なくとも5、少なくとも10、少なくとも20、少なくとも30、少なくとも40、あるいは少なくとも45の遺伝子、あるいは表3にリストされたグループから選ばれた少なくとも5、少なくとも10、少なくとも15、あるいは少なくとも20の遺伝子を含む;
c) 任意に:
(i) コントロールとして、少なくとも1つの患者のサンプル中の遺伝子の発現ステータスをさらに決定すること、ここで該コントロール遺伝子は表2あるいは表3にリストされた遺伝子でない;
(ii) 複数の遺伝子およびコントロール遺伝子の発現の相対的なレベルを決定すること;および
d) 選択された遺伝子の発現ステータスを使用して、データセットにスーパーバイズされた機械学習アルゴリズム(例えばランダムフォレスト分析)を適用し、DESNT癌についての予測を得ること;
e) 患者から得られたサンプル中の同じ複数の遺伝子の発現ステータスを決定し、患者の発現プロフィールを提供すること;
f) 任意に、参照データセットへ患者の発現プロフィールを正規化すること;および
g) 患者の発現プロフィールへ予測を適用して癌を分類し、侵襲性の癌の存在を決定するか、あるいは患者は予後不良かどうか決定すること(つまり、患者の癌がDESNTあるいは非DESNTかどうか決定すること)。
この方法およびその変種は今後方法2と呼ばれる。表2の遺伝子は、多数のデータセットについてLPD分析を行ないDESNTグループの中で共通してダウンレギュレートされる遺伝子を決定することにより、発明者によって同定された。表3の遺伝子は、方法4に述べられているようなLASSO分析を行なうことにより発明者によって同定された。
好ましい実施態様では、ステップ(i)の中で使用されるコントロール遺伝子は、表6あるいは表7にリストされたハウスキーピング遺伝子から選ばれる。
表7は、前立腺癌に特に関連する。発明のある実施態様では、少なくとも1、少なくとも2、少なくとも5あるいは少なくとも10のハウスキーピング遺伝子を使用する。好ましい実施態様では少なくとも2つのハウスキーピング遺伝子を使用する。上記のステップ(ii)はテスト遺伝子とハウスキーピング遺伝子の間の比率を決定することを含むことがある。
発明の一層の方法では、患者の中の侵襲性の癌(たとえば侵襲性の前立腺癌)を診断するか、または患者を予後不良の癌(つまりDESNT癌の患者)と同定する、以下を含む方法が提供される:
a) データセット中の個々の患者のサンプルのDESNTステータスが知られている(例えばLPD分析によって決定される)参照データセットを提供すること;
b) このデータセットから複数の遺伝子を選ぶこと;
c) これらの選択された遺伝子の発現ステータスを使用して、データセットに、スーパーバイズされた機械学習アルゴリズム(例えばランダムフォレスト分析)を適用し、DESNT癌のための予測を得ること;
d) 患者から得られたサンプル中の同じ複数の遺伝子の発現ステータスを決定し、患者の発現プロフィールを提供すること;
e) 任意に、参照データセットへ患者の発現プロフィールを正規化すること;および
f) 患者の発現プロフィールに予測を適用し、患者の癌がDESNTあるいは非DESNTかどうか決定すること。
この方法およびその変種は今後方法3と呼ばれる。発明のさらなる方法では、、患者の中の侵襲性の癌(たとえば侵襲性の前立腺癌)を診断するか、または患者を予後不良の癌(つまりDESNT癌の患者)と同定する、以下を含む方法が提供される:
a) データセット中の個々の患者のサンプルのDESNTステータスが知られている(例えばLPD分析によって決定される)1又は複数の参照データセットを提供すること;
b) このデータセットから、その発現ステータスがDESNTおよび非DESNT癌の間で変化することが知られている複数の遺伝子を選ぶこと(例えば表4表にリストされた複数の遺伝子、たとえば表4にリストされた少なくとも100、少なくとも200、少なくとも300、少なくとも400、少なくとも500、あるいは少なくとも1000の遺伝子);
c) 選択された遺伝子にLASSOロジスティク回帰モデル分析を適用し、DESNT癌を[最良に]同定する選択された遺伝子の部分集合を特定する;
d) 選択された遺伝子の部分集合の発現ステータスを使用し、データセットにスーパーバイズされた機械学習アルゴリズム(例えばランダムフォレスト分析)を適用し、DESNT癌のための予測を得ること;
e) 患者から得られたサンプル中の選択された遺伝子の部分集合の発現ステータスを決定し、患者の発現プロフィールを提供すること;
f) 参照データセットへ患者の発現プロフィールを正規化すること;および
g) 患者の発現プロフィールに最適な予測を適用し、患者の癌がDESNTあるいは非DESNTかどうか決定すること。
この方法およびその変種は今後方法4と呼ばれる。
ランダムフォレスト分析を含む方法を利用して同定されたDESNT患者集団は、「RF-DESNT」と呼ばれる。LPD分析を含む方法を利用して同定されたDESNT患者集団は、「LPD-DESNT」と呼ばれる。
本発明の発明者は、LPDと異なり、コンピューター処理集約的でなく、広範囲のデータセットに適用可能なクラシファイヤーを開発することを望んでいる。
方法2から4はそのような解決策を提供し、癌進行を予測するために使用することができる。したがって、本発明は、RF-DESNT癌を同定し、かつ癌進行を予測するためにランダムフォレスト分類の中で使用することができる遺伝子シグネチャーを同定する方法を提供する。
スーパーバイズされた機械学習アルゴリズムあるいは一般的な線形モデルが、DESNTステータスの予測を生成するために使用される。好ましいアプローチはランダムフォレスト分析であるが、支援ベクター機械(support vector machines)、ニューラル・ネットワーク(neural networks)、ネイティブベイズクラシファイヤー(naive Bayes classifier)あるいはニアレストネイバーアルゴリズム(nearest neighbour algorithms)のような選択肢を使用することができる。そのような方法は当業者によって知られており理解されている。
ランダムフォレスト分析は癌がDESNTか否かを予測するために使用することができる。上記の方法2から4は、方法1より相当に少ない計算能力を要求し、従ってより容易に実行することができる。
ランダムフォレスト分析は分類、回帰および他のタスクのための全体学習法であり、トレーニング中にディシジョンツリーの強度を構成することにより作動し、クラスのモードであるクラスを出力し(分類)、個々のディシジョンツリーの平均の予測(回帰)を出力する。従って、ランダムフォレストはデータの過剰適合を修正し、任意の1つのディシジョンツリーにする。
ディシジョンツリーは、木のようなグラフか決定のモデルを含み、チャンスイベント結果(chance event outcomes)を含むそれらの可能な結論を含む。ディシジョンツリーのそれぞれの中間ノードは、典型的には1または複数の属性のテスト(たとえば、癌サンプル中の遺伝子の発現レベルが前もって定義した閾値より上にあるか否か)を表し、ディシジョンツリーのそれぞれの枝は、典型的にはテストの結果を表わす。また、ディシジョンツリーのそれぞれのリーフノードはそれぞれ典型的にはクラス(分類)ラベルを表わす。
ランダムフォレスト分析では、全体クラシファイヤーは、典型的にはトレーニング・データセット(参照データセットとも呼ばれる)でトレーニングされ、ここで、たとえばLPDによって決定されるように、DESNTグループか否かが知られている。トレーニングは、DESNTあるいは非DESNTのメンバーシップについての予測であるモデルを生成する。RFによって同定されたグループはRF-DESNTおよびRF-非-DESNTと呼ぶことができる。一旦トレーニングされたら、ランダムフォレストクラシファイヤーは、未知のサンプルからのデータセットに適用することができる。このステップは決定論的である、つまり、クラシファイヤーが同じデータセットに続いて繰り返し適用されれば、それは一貫して毎回同じクラスの中へ新しいデータセットの各癌をソートするだろう。
全体クラシファイヤーは、RF-DESNT癌あるいはRF-非-DESNT癌のいずれかとして新しいデータセット中の各癌サンプルを分類するように作用する。従って、ランダムフォレスト分析が試みられる場合、全体クラシファイヤーは多くのクラスへ分析されているデータセット中の癌を分割する。クラスの数は、2であることができる。つまり、全体の分類は、DESNT癌を有するDESNTクラスまたはDESNTグループ、および他の癌を有する非DESNTクラスまたは非DESNTグループに、データセット中の患者を分類することができる。
ランダムフォレストのディシジョンツリーはそれぞれ、与えられた癌サンプルについて、それが認識するように訓練されたクラスのうちの1つ、つまりDESNT/非DESNTにそれを帰する独立予測因子である。各ディシジョンツリーのノードはそれぞれ、患者から得られた癌サンプル中の同じ複数遺伝子の1つ以上の遺伝子に関するテストを含む。いくつかの遺伝子はノードでテストされることができる。例えば、テストは、複数の遺伝子の1つ以上の遺伝子の発現レベルが前もって定義した閾値より上にあるかどうか尋ねることがある。
ディシジョンツリー間の変異は、異なる方法でクラスにサンプルを分けるように各ディシジョンツリーに導くだろう。全体の分類は、すべての独立したディシジョンツリーによって生成された分類を行い、最多のディシジョンツリーが導くクラスにサンプルを分ける。
方法2、3あるいは4(ランダムフォレスト分析の決定に基づく)のステップb)の中で発現のレベルが決定される複数の遺伝子は、任意の適切な方法を使用して選ぶことができる。可能な1つの方法は、トレーニング・データセットにLPD分析あるいは他のベイズの統計分析を適用し、DESNTグループ/プロセスに割り当てられる癌を決定することである。その後、非DESNT癌に比較して、DESNT癌で一貫してダウンレギュレートされる遺伝子を選択する。このダウンレギュレーションは、LPD分析が行なわれたいくつかの異なるデータセットにわたり一貫していることがある。ある実施態様では、方法2、3および4のステップb)の中で使用される複数の遺伝子は、少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも30、少なくとも40あるいは少なくとも45の遺伝子を含む。特に、方法2および方法3のステップb)の中で使用される複数の遺伝子は、表2にリストされた遺伝子の少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも30、少なくとも40あるいは45の遺伝子すべてを含む。
別の可能な方法(方法4のような)では、ア リースト アブソリュート シュリンケージ アンド セレクション オペレーター(a least absolute shrinkage and selection operator;LASSO)分析を行ない、かつ最も良くDESNTメンバーシップを特徴づける遺伝子を選択する。モデル係数の絶対値の合計がある閾値未満であるように、ロジスティク回帰モデルは係数の制約を受けて実行される。これは、DESNTメンバーシップを予測する能力を持っていないか、既にモデル内で遺伝子の発現と関連づけられている遺伝子を除去する効果がある。LASSOは、トレーニングまたは参照データセット中のDESNTと非DESNTサンプルを同定する可能性が最もありそうな遺伝子を見つける数学的な方法である。遺伝子の部分集合は方法4のステップe)であり、少なくとも5、少なくとも10、少なくとも15、あるいは少なくとも20の遺伝子を含むことがある。特別の実施態様では、方法4のステップa)およびb)は必要ではない。また、代わりに、方法は、表3に示された遺伝子の部分集合の、少なくとも5、少なくとも10、少なくとも15あるいは少なくとも20を使用して、方法4のステップc)から始めることができる。
方法4を実施する時、発明者は次のステップを行う。出発点として、発明者によって分析された5つ(合計の遺伝子)のデータセットの少なくとも2つにおいて一般に存在したDESNT癌の中の、(非DESNT癌と比較して)著しく変化する発現を示す遺伝子はすべて同定された。LASSOを実行するための代表的なDESNT LPD分類は、分析されたMSKCCデータセットから選ばれた。実際には、使用されるDESNT分類は、たとえばいくつかの統計的検定の平均のp値、あるいはいくつかの記述のすべての合計から選択される代表的な方法を使用することができ、たとえば、サンプルの少なくとも50%がDESNTステータスに該当する場合、DESNTとして分類される。
LASSOロジスティク回帰モデルは、MSKCCデータセットの内のDESNTメンバーシップを予測し、DESNTメンバーシップを特徴づける20のセットの遺伝子の選択に結びつけるために使用された。これらの遺伝子は表3にリストされる。1669の遺伝子からのこれらの20の遺伝子の除去およびこの手続きの反復は、DESNTメンバーシップを特徴づけることができる遺伝子のさらなるセットを同定した。出発点としてLPDによって分析された他のデータセットを使用して、同じ分析を行なうことにより、遺伝子の追加のセットを得ることができる。
本発明は、DESNT癌または癌進行と関連するか、それを予測する遺伝子の一層のリストを提供する。例えば、1つの実施態様では、LASSO分析がDESNT癌、特にはDESNT前立腺癌を示すかまたは予測する発現シグネチャーを提供するために使用することができる。発現シグネチャーもバイオマーカー・パネルと考えられることができ、表3にリストされた遺伝子から成るグループから選ばれる少なくとも5、少なくとも10、少なくとも12、少なくとも15あるいはすべての20の遺伝子を含む。
発明の任意の方法では、統計分析を分析される遺伝子の発現のレベルについて行なうことができるか、または統計分析を、遺伝子発現および任意のコントロール遺伝子の発現の相対的なレベルにしたがって計算された比率に行なうことができることに留意すべきである。
例えば、方法1に関して、方法は、次のステップを含むことができる:
a) 患者から得られたサンプル中の複数の遺伝子の発現のレベルを決定し、患者の発現プロフィールを提供すること;
b) コントロールとして患者のサンプル中の、少なくとも1つの異なる遺伝子の発現ステータスをさらに決定すること、ここでコントロール遺伝子は発現のレベルがステップa)で決定された遺伝子ではない;
c) 複数の遺伝子および1または複数のコントロール遺伝子の発現の相対的なレベルを決定すること;
d) 異なる患者からの発現プロフィールを含む参照データセットを提供し、ステップa)で使用されたものと同じ複数の遺伝子、およびステップb)で使用したものと同じ1または複数のコントロール遺伝子の発現の相対的なレベルを決定すること;
e) 統計的ベイズクラスタリング分析あるいは他のクラスタリング分析を、ステップc)およびd)で得られた相対的な発現レベルについて行うこと;
f) 任意に、複数回分析ステップe)を繰り返すこと;および
g) 癌を分類し、患者が癌にかかっているかどうか、あるいは患者が予後不良(つまり、患者はDESNT癌にかかっている)かを決定すること。
方法2に関して、方法は、以下のステップを含むことができる:
a) データセット中の個々の患者のサンプルのDESNTステータスが知られている(例えばLPD分析によって決定されたように)、参照データセットを提供すること;
b) このデータセットから複数の遺伝子を選択すること、ここで複数の遺伝子が、表2にリストされたグループから選ばれた少なくとも5、少なくとも10、少なくとも20、少なくとも30、少なくとも40あるいは少なくとも45の遺伝子を含むか、あるいは表3にリストされたグループから選ばれた少なくとも5、少なくとも10、少なくとも15あるいは少なくとも20の遺伝子を含む;
c) コントロールとして少なくとも1つのさらに異なる患者のサンプル中の遺伝子の発現ステータスを決定すること;
d) 複数の遺伝子および1または複数のコントロール遺伝子の発現の相対的なレベルを決定すること;
e) 発現の相対的なレベルを使用し、スーパーバイズされた機械学習アルゴリズム(例えばランダムフォレスト分析)を参照データセット適用し、DESNT癌についての予測を得ること;
f) 患者から得られたサンプル中の同じ複数の遺伝子およびコントロール遺伝子の発現の相対的なレベルを決定し、患者の発現プロフィールを提供すること;
g) 任意に参照データセットへ患者の発現プロフィールを正規化すること;および
h) 患者の発現プロフィールへ予測を適用し、癌を分類し、侵襲性の癌の存在、または患者が予後不良(つまり、患者の癌がDESNTあるいは非DESNTかどうか決定する)かどうかを決定すること。
方法3に関して、方法は、以下のステップを含むことができる:
a)データセット中の個々の患者のサンプルのDESNTステータス(つまり癌分類)が知られている(例えばLPD分析によって決定されている)参照データセットを提供すること;
b) 複数の遺伝子をこのデータセットから選択すること;
c) コントロールとして少なくとも1つさらに異なる患者のサンプル中の遺伝子の発現ステータスを決定すること;
d) 複数の遺伝子および1または複数のコントロール遺伝子の発現の相対的なレベルを決定すること;
e) これらの選択された遺伝子の発現の相対的なレベルを使用し、スーパーバイズされた機械学習アルゴリズム(例えばランダムフォレスト分析)をデータセットに適用し、DESNT癌についての予測を得ること;
f) 患者から得られたサンプル中の発現の相対的なレベルを含む患者の発現プロフィールを提供すること、ここで発現の相対的なレベルはステップb)で選択されたものと同じ複数の遺伝子、およびステップd)で使用されたものと同じコントロール遺伝子を使用して得られる;
g) 任意に参照データセットへ患者の発現プロフィールを正規化すること;および
h) 患者の発現プロフィールへ予測を適用し、癌を分類し、侵襲性の癌の存在、または患者が予後不良(つまり、患者の癌がDESNTあるいは非DESNTかどうか決定する)かどうかを決定すること。
方法4に関して、方法は、以下のステップを含むことができる:
a) データセット中の個々の患者のサンプルのDESNTステータス(つまり癌分類)が知られている(例えばLPD分析によって決定されている)1以上の参照データセットを提供すること;
b) このデータセットから、その発現ステータスがDESNTおよび非DESNT癌の間で変わることが知られている複数の遺伝子を選ぶこと(例えば表4にリストされた複数の遺伝子、例えば表4にリストされた遺伝子の少なくとも100、少なくとも200、少なくとも300、少なくとも400、少なくとも500あるいは少なくとも1000の遺伝子);
c) 選択された遺伝子上にLASSOロジスティク回帰モデル分析を適用し、DESNT癌を同定する選択された遺伝子の部分集合を同定すること;
d) コントロールとして少なくとも1つさらに異なる患者のサンプル中の遺伝子の発現ステータスを決定すること;
e) 遺伝子、および1または複数のコントロール遺伝子の部分集合の発現の相対的なレベルを決定すること;
f) 相対的な発現レベルを使用し、スーパーバイズされた機械学習アルゴリズム(例えばランダムフォレスト分析)をデータセットに適用し、DESNT癌についての予測を得ること;
g) 患者から得られたサンプル中の発現の相対的なレベルを含む患者の発現プロフィールを提供すること、ここで発現の相対的なレベルはステップc)で選択されたものと遺伝子の同じ部分集合、およびステップe)で使用されたものと同じコントロール遺伝子を使用して得られる;
h) 任意に参照データセットへ患者の発現プロフィールを正規化すること;および
i) 患者の発現プロフィールへ予測を適用し癌を分類し、侵襲性の癌の存在を決定するか、あるいは患者は予後不良を決定すること、(つまり、患者の癌がDESNTあるいは非DESNTかどうか決定する)。
上記の方法のうちのどれでも、1または複数のコントロール遺伝は表6あるいは表7にリストされた遺伝子から選ばれることができる。
データセット
本発明者は分析において、MSKCC、CancerMap、Stephenson、CamCapおよびTCGAデータセットを使用した。しかしながら、他の適切なデータセットも利用可能である。一般に、データセットは、患者または腫瘍のサンプルからの複数の発現プロフィールを含む。データセットのサイズは変わることができる。例えば、データセットは、患者または腫瘍サンプルからの少なくとも20、任意に少なくとも50、少なくとも100、少なくとも200、少なくとも300、少なくとも400あるいは少なくとも500の発現プロフィールを含むことがある。好ましくは、データセットは、少なくとも500の患者あるいは腫瘍からの発現プロフィールを含む。
ある実施態様では、発明の方法は、複数のデータセットからの発現プロフィールを使用する。例えば、ある実施態様では、方法は、少なくとも2つのデータセットからの発現プロフィールを使用し、それぞれのデータセットは、少なくとも250の患者あるいは腫瘍からの発現プロフィールを含む。
患者または腫瘍からの発現プロフィールは、遺伝子の部分集合の発現のレベルについての情報を含み、たとえば少なくとも10、少なくとも40、少なくとも100、少なくとも500、少なくとも1000、少なくとも1500、少なくとも2000、少なくとも5000あるいは少なくとも10000遺伝子についての情報を含む。好ましくは、患者の発現プロフィールは、少なくとも500の遺伝子の発現データを含む。発明の様々な方法の分析ステップで、遺伝子の部分集合のどんな選択もデータセットの中にある遺伝子から得られるだろう。
癌の分類
ここに示された方法とバイオマーカーは、進行の可能性によって癌を分類するのに役立つ(従って癌の予後に役立つ)。本発明は、特に前立腺癌に焦点が当てられるが、方法は他の癌にも使用することができる。特に、表2の中の遺伝子のリストは、例えば、前立腺癌を含む一連の癌の進行を示すことが分かった。進行しそうかまたは進行する癌は発明者によってDESNT癌と呼ばれる。DESNT癌は、進行が予測される癌を指す。DESNTステータスは、癌が進行するかどうかの指標を指す。侵襲性の癌は進行する癌である。
本発明の方法により分類することができる癌のタイプとしては以下を包含する;急性リンパ芽球性白血病、急性または慢性のリンパ球あるいは顆粒白血球の腫瘍、急性骨髄性白血病、急性前骨髄球性白血病、腺癌、腺腫、副腎癌、基底細胞癌、骨癌、脳腫瘍、乳癌、気管支癌、子宮頚部形成異常、慢性骨髄性白血病、結腸癌、類表皮癌、ユーイング肉腫、胆嚢癌、胆石腫物、巨細胞腫、膠芽腫多重形、毛様細胞腫瘍、頭部癌、過形成、過形成の角膜神経腫瘍、イン・シトゥー癌腫、腸の神経節腫、島細胞腫、カポジ肉腫、腎臓癌、喉頭癌、平滑筋腫瘍、肝臓癌、肺癌、リンパ腫、悪性カルチノイド、悪性高カルシウム血症、悪性黒色腫、マルファン症候群様の体質腫瘍、髄様癌、転移性の皮膚癌、粘膜神経腫、菌状息肉腫、骨髄異形成症候群、骨髄腫、頚部癌、神経の組織癌、神経芽腫、骨原性肉腫、骨肉腫、卵巣腫瘍、膵癌、副甲状腺癌、クロム親和細胞腫、真性赤血球増加症、原発性の脳腫瘍、前立腺癌、直腸癌、腎の細胞腫瘍、網芽細胞腫、横紋筋肉腫、セミノーマ、皮膚癌、小細胞肺腫瘍、軟部組織肉腫、扁平上皮癌、胃癌、甲状腺癌、局所的の皮膚病変、細網細胞肉腫(veticulum cell sarcoma)、あるいはウィルムス腫瘍(Wilm's tumor)。
本発明が特に関連するものには、前立腺癌、結腸直腸癌および乳癌がある。
「侵襲性の癌」は、「侵襲性の前立腺癌」を含む。侵襲性の前立腺癌は、疾患進行および潜在的なさらなる合併症(たとえば転移あるいは転移性の進行)を防ぐか、停止させるか、低減するために治療を要求する癌として定義することができる。侵襲性の前立腺癌は、治療していないでおかれたならば、前立腺の外部に広がり、患者を殺すことがある前立腺癌である。本発明は、侵襲性の前立腺癌を含むいくつかの侵襲性の癌を検知するのに役立つ。
前立腺癌は、アメリカン ジョイント コミッティー オン キャンサー(American Joint Committee on Cancer:AJCC)の腫瘍ノード転移(tumour-nodes-metastasis:TNM)進度システムにしたがって分類することができる。Tスコアは、主要な(原発性)腫瘍のサイズ、および前立腺の外部で成長しているか、および近くの器官内に存在しているかについて記述する。Nスコアは近くの(局所的な)リンパ節に広がっているか記述する。Mスコアは、癌が身体の他の器官に転移(拡散)したかどうかを示す:
T1腫瘍は小さすぎるので、スキャン上で見ることができず、前立腺の診察時には自覚症状はない。高いPSAレベルを検出した後、それらは針生検によって発見されることがある。
T2腫瘍は完全に前立腺の内部にあり、3つのより小さなグループに分割される:
T2a - 腫瘍は、前立腺の葉のうちの1つの半分だけにある;
T2b - 腫瘍は葉のうちの1つの半分以上にある;
T2c - 腫瘍は両方の葉にあるが、前立腺の内部にまだある。
T3腫瘍は前立腺のカプセル(カバリング)を通り抜けている - それらは2つのより小さなグループに分類される:
T3a - 腫瘍は前立腺のカプセル(カバリング)を通り抜けている;
T3b - 腫瘍は精嚢へ広がっている。
T4腫瘍は、たとえば直腸、膀胱、筋肉あるいは骨盤腔の側のような他の近くの体器官へ広がっている。病期T3およびT4腫瘍は局所的に進行した前立腺癌と呼ばれる。
リンパ節はそれらが癌細胞を含んでいる場合、「陽性」と評される。リンパ節の内部の癌細胞がある場合、それは通常より大きい。より多くの癌細胞を含むほど、リンパ節は大きくなるだろう:
NX - リンパ節はチェックすることができない;
N0 - 前立腺に近いリンパ節に癌細胞はない;
N1 - リンパ節の中に癌細胞がある。
M進度は転移(癌拡散)を指す:
M0 - 癌は骨盤の外部に広がっていない;
M1 - 癌は骨盤の外部に広がっている;
M1a - 骨盤の外側のリンパ節に癌細胞がある;
M1b - 硬骨に癌細胞がある;
M1c - 他の場所に癌細胞がある。
前立腺癌もグリーソン分類(Gleason grading system)を使用して、スコア付けされることができる。それは、疾病の悪化を類別するために組織学的分析を使用する。1から5のグレードが診察される細胞に割り当てられる。また、2つの最も一般的な等級が全体的なグリーソンスコアを提供するために加えられる。グレード1は、緊密にパックされた形の良い腺を含み健康な組織に非常によく似ている。グレード5は認識しうる腺がないか、あるいは非常に少ない。6未満のスコアでは予後良好である。しかし、6以上のスコアではより侵襲性のものとして分類される。グリーソンスコアは泌尿器病理学の国際学会によって2005年に修正された。このスコアリングの基準は以下に記述される(Epstein JI, Allsbrook WC Jr, Amin MB, Egevad LL; ISUP Grading Committee. The 2005 International Society of Urological Pathology (ISUP) Consensus Conference on Gleason grading of prostatic carcinoma. Am J Surg Pathol 2005;29(9):1228-42)。
グリーソンスコアは生検で検知される、つまり、サンプリングされた腫瘍の部分で検知される。グリーソン6の前立腺は、生検によってサンプリングされない侵襲性の腫瘍の小さな巣(foci)を持っていることがある。したがって、グリーソンはガイドである。より低いグリーソンスコアでは、より小さな割合の患者が侵襲性の癌を持つだろう。前立腺癌の患者の中のグリーソンスコアは2から10までに達することができる。グリーソンの小部分は侵襲性の癌があるので、平均生存率は高い。また、グリーソン増加するとともに平均生存率は減少する。侵襲性の癌を有する患者によって低下される(つまり、各グリーソンスコアでの生存率の混合がある)からである。
前立腺癌もそれらがどれくらい進んだかによってステージを分けることができる。これは、たとえばグリーソンスコアおよび/またはPSA検査のような他の要因と同様にTMNスコアリングに基づく。進度は以下のように定義することができる:
第1期:
T1、N0、M0、グリーソンスコア6以下、10未満のPSA;または
T2a、N0、M0、グリーソンスコア6以下、10未満のPSA。
病期IIA:
T1、N0、M0、7のグリーソンスコア、20未満のPSA;または
T1、N0、M0、6以下のグリーソンスコア、少なくとも10だが20未満のPSA:または、
T2aあるいはT2b、N0、M0、7以下のグリーソンスコア、20未満のPSA。
病期IIB:
T2c、N0、M0、任意のグリーソンスコア、任意のPSA;または
T1またはT2、N0、M0、任意のグリーソンスコア、20以上のPSA:または
T1あるいはT2、N0、M0、8以上のグリーソンスコア、任意のPSA。
第3期:
T3、N0、M0、任意のグリーソンスコア、任意のPSA。
第4期:
T4、N0、M0、任意のグリーソンスコア、任意のPSA;または
任意のT、N1、M0、任意のグリーソンスコア、任意のPSA:または
任意のT、任意のN、M1、任意のグリーソンスコア、任意のPSA。
本発明では、侵襲性の癌は機能的にあるいは臨床的に定義される:すなわち進行することができる癌をいう。これはPSA再発によって測定することができる。患者が手術または放射線療法を受ける場合、前立腺細胞は殺されるか除去される。PSAが前立腺細胞によってのみ作られるので、患者の血液中のPSAレベルは非常に低いか検出できない量になる。癌が再発し始める場合、PSAレベルは増加し、再び検知できるようになる。これは「PSA再発(PSA failure)」と呼ばれる。代替的測定は転移あるいはエンドポイントとしての死亡の存在である。
グリーソンおよび上に定義されるような病期の増加も進行と見なすことができる。しかしながら、DESNT特性記述はグリーソン、病期およびPSAに依存しない。それは、グリーソン、病期およびPSAに加えて、侵襲性の癌の進行に関する追加情報を提供する。したがって、それは結果の有用な独立した予測因子である。しかしながら、DESNTステータスは、グリーソン、腫瘍病期および/またはPSAと組み合わせることができる。
したがって、発明の方法は癌を分類する方法を提供する。いくつかの方法は、バイオマーカー・パネルの1または複数のメンバーの発現レベルまたは発現ステータスを決定することを含む。遺伝子のパネルは本発明の方法を使用して決定されることができる。ある実施態様では、遺伝子のパネルは表3にリストされた遺伝子の少なくとも5、少なくとも10、少なくとも15あるいは20すべての遺伝子を含むことができる。遺伝子のパネルは表2にリストされた遺伝子の少なくとも5、少なくとも10、少なくとも20、少なくとも30、少なくとも40あるいはすべての45の遺伝子を含むことができる。本発明の他のバイオマーカー・パネル、あるいは本発明の方法を使用して生成されたパネルも使用されることができる。
それらの遺伝子の1つ以上のステータス(例えば遺伝子の少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、少なくとも95%あるいは100%)が、異常なステータスを持つと考えられる場合、侵襲性であると癌が記述される。異常なステータスは、健康または非侵襲性の癌状態と異なる発現ステータス(例えばDNAメチル化あるいは他の後成の要因による、発現のレベルによって決定される)として定義することができる。これは、分析される同じ遺伝子の以前に決定された参照発現ステータスによって決定されることができるし、あるいは1つ以上のコントロールあるいはハウスキーピング遺伝子のステータスの決定により達成されることができる。ハウスキーピング遺伝子は、進行した患者と進行していない患者で同じレベルで発現されると一般に考えられている。したがって、コントロール遺伝子に対するテスト遺伝子の比率を決定することは可能である。比率は正常な細胞と進行した組織において異なるだろう。上に記載されたように、表6あるいは表7のハウスキーピング遺伝子を使用することができる。
例えば、1つの実施態様では、表3の遺伝子の少なくとも15遺伝子の、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%が異常な発現ステータスを有する場合(たとえば表3の15遺伝子の少なくとも80%)、癌は侵襲性であるか、または潜在的に侵襲性であるとされる。別の実施態様では、表2の遺伝子の少なくとも40遺伝子の、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%が異常な発現ステータスを有する場合(たとえば表2の40遺伝子の少なくとも80%)、癌は侵襲性であるか、または潜在的に侵襲性であるとされる。
遺伝子の発現ステータスの決定は遺伝子の発現のレベルを決定することを含むことがある。ここに使用されるような発現ステータスおよび発現のレベルは、当業者に公知の方法で決定することができる。例えば、当業者に公知の方法によって決定されるように、これは特定の遺伝子(1または複数)のアップまたはダウンレギュレーションを指すことがある。後成の修飾(epigenetic modifications)は、発現の指標、例えばDNAメチル化ステータスの決定、または他の後成の変化、たとえばヒストーンマーキング(histone marking)、RNA変化あるいはコンフォメーション変化の指標として使用されることができる。後成の修飾は、DNAの中の遺伝子の発現を規制し、患者の間の療法の効能に影響を及ぼすことができる。異常の後成の変化は、例えば癌のような多くの疾病に関係している。動物中のDNAメチル化は投与量補正、インプリンティング、およびゲノム安定および発現に影響を及ぼす。DNAメチル化を同定する方法は、当業者に公知であり、例えばメチル化特異性PCR、マトリックス支援レーザー脱離/イオン化飛行時間型質量分析法、マイクロアレイの使用、リデュースト リプレゼンテーション ビスルフェイト シーケンシング(reduced representation bisulfate sequencing:RRBS)あるいはホール ゲノム ショットガン ビスルフェイト シーケンシング(whole genome shotgun bisulfate sequencing:WGBS)が使用される。さらに、後成の変化は、クロマチンのコンフォメーションの変化を含んでいることがある。
遺伝子の発現ステータスも後成の特徴を検討して判断されることがある。
たとえばメチル化によるDNA中のシトシンの修飾は、遺伝子発現の変更に関係するかもしれない。評価する後成の変化の他の方法は、ヒストン修飾(マーキング)および関連する遺伝子の検討、非コードRNAの検討およびクロマチンコンフォメーション分析を含む。後成のステータスを検査するために使用することができる技術の例は次の出版物に提供される:
1.Zhang, G. & Pradhan, S. Mammalian epigenetic mechanisms. IUBMB life (2014).
2.Gronbak, K. et al. A critical appraisal of tools available for monitoring epigenetic changes in clinical samples from patients with myeloid malignancies. Haematologica 97, 1380-1388 (2012).
3.Ulahannan, N. & Greally, J. M. Genome-wide assays that identify and quantify modified cytosines in human disease studies. Epigenetics Chromatin 8, 5 (2015).
4.Crutchley, J. L., Wang, X., Ferraiuolo, M. A. & Dostie, J. Chromatin conformation signatures: ideal human disease biomarkers? Biomarkers (2010).
5.Esteller, M. Cancer epigenomics: DNA methylomes and histone-modification maps. Nat. Rev. Genet. 8, 286-298 (2007).
発現ステータスが異常であると見いだされた場合、特定のサンプルのバイオマーカーのステータスと、平均サンプル(つまり健康なサンプルあるいはDESNT癌にかかっていない患者から得られたサンプル)に一般に見いだされるステータスとが異なる状況を指す。本発明では、異常な発現ステータスの存在はDESNT癌を示すことができる。例えば、異常なステータスは、後成の要因を使用し、または遺伝子発現のレベル(例えばRNAレベル)の決定により決定されることがある。表2にリストされた遺伝子に関して、遺伝子発現の減少あるいはその遺伝子の発現の減少に帰着する発現ステータスの変化は、DESNT癌を示す。したがって、表2にリストされた遺伝子の少なくとも5、少なくとも10、少なくとも20、少なくとも30、少なくとも40あるいは45のすべての遺伝子の異常な発現ステータスの存在は、DESNT癌を示す。あるいは、表2にリストされ遺伝子の、少なくとも5、少なくとも10、少なくとも20、少なくとも30、少なくとも40あるいは45のすべての遺伝子の発現ステータスを表示する手段である閾値は当業者によって決定されることできる。与えられた患者のサンプルについては、平均発現ステータスが前述の閾値未満(1つ以上の遺伝子、あるいは好ましくは分析されている遺伝子の過半での発現の減少)である場合、これはDESNT癌を示す。
ある実施態様では、表2にリストされた遺伝子の少なくとも5、少なくとも10、少なくとも20、少なくとも30、少なくとも40あるいは45の遺伝子すべての発現ステータスあるいは発現レベルの減少は、DESNT癌を示す。ある場合には、新しいバイオマーカー・パネルが、癌の分類に使用された本発明の方法を使用して、生成されることができる。例えば、35遺伝子データセットの異なる組み合わせを使用して行なわれた第2の分析では、遺伝子は、各データセットのLPD分析の100回の少なくとも67回でダウンレギュレートされたことが見いだされた(表5)。最初の分析で、45の共通してダウンレギュレートした遺伝子と27の遺伝子がオーバーラップしていた。したがって、バイオマーカー・パネルは表5にリストされた遺伝子の少なくとも5、少なくとも10、少なくとも20、少なくとも30あるいは35の遺伝子すべてを含むことができる。
通常、発現ステータスが異常かどうか決定するために、患者のサンプルの少なくとも1つのコントロール遺伝子の発現ステータスの決定を含むことが必要である。少なくとも1つのコントロール遺伝子の発現ステータスに基づいて、予後の遺伝子のための指標値を決定することができる。指標値が予後の遺伝子の発現の減少のために、ある閾値未満である場合、これは癌進行を示すか、あるいは癌進行を予測する(つまりDESNT癌)。1つ以上のコントロール遺伝子を使用し、予後の遺伝子の発現レベルを正規化し、予後の遺伝子の少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%あるいは少なくとも95%が減少した発現レベルを持っているかどうか決定することにより、閾値が決定される。ある実施態様では、減少した発現レベルを有する予後の遺伝子の100%は、癌進行を示すかあるいは予測的である(つまりDESNT癌)。
発明の1つの実施態様では、方法は次のものを含む:
a) 対象の分析物(例えばRNA、DNAあるいは蛋白質)の生体試料を富化すること;および
b) 富化したサンプル内の対象分析物の後成のステータスを決定すること。
蛋白質は発現レベルを決定するためにも使用され、適切な方法は、当業者に知られている。これもさらに以下に議論される。
装置とメディア
本発明は、さらに発明の任意の方法を行なうように構成された装置を提供する。図4は本明細書に示された方法の実行のための装置または計算装置100を示す。当業者によって理解されるように、図3に示されるアーキテクチャーと異なるアーキテクチャーが使用されることができる。
図を参照する。メーター100は、ビジュアルディスプレイ110およびバーチャルまたは専用のユーザ入力デバイス112を含む多くのユーザー・インタフェースを含んでいる。メーター100はさらにプロセッサー114、メモリ116および電力システム118を含んでいる。メーター100は、プロセッサー114とリモートシステムの間でコミュニケーションを送受信するためにさらにコミュニケーション・モジュール120を含む。メーター100は、さらに受け取り(例えば、操作された時、プロセッサー114にここに記述されるような方法を行なわせる指示を伴うメモリディスクまたは非一時的なコンピューター読取り可能なメディア)のためのレシービングデバイスまたはポート122を含む。
プロセッサー114はデータを受け取り、メモリ116にアクセスし、前記メモリ116、コミュニケーション・モジュール120あるいはユーザ入力デバイス112から指示を受け取った際に実行するように構成される。プロセッサーはディスプレイ110をコントロールし、コミュニケーション・モジュール120を介してリモート機器にデータを伝えることができる。
メモリ116は、プロセッサーによって読まれた時、プロセッサーに本明細書に記述される方法を行なわせるように構成される、コンピューター読取り可能な指示を含むことができる。
本発明は、指示を格納した機械読取り可能な媒体(これは一時的または非一時的であることができる)を提供する。指示は、機械によって読まれた時、指示が実行され本明細書に示される方法を引き起こすように形成される。
他の方法および発明の用途
さらに診断または癌の進度の決定を支援するために、発明の方法は、さらなるテスト(例えばPSA検査、グリーソンスコア分析)と組み合わせることができる。PSA方法では、血液サンプル中の前立腺特異抗原の量が定量化される。
前立腺特異抗原は前立腺の細胞によって生産された蛋白質である。レベルが血液の中で上がった場合、これは前立腺癌を示す。「上がった」量は、患者の詳細(例えば年齢)に依存するだろうが、一般にレベルが高いほど、前立腺癌が存在するということである。期間(例えば一週、一か月、6か月あるいは一年)にわたるPSAレベルの連続的上昇も、さらに前立腺癌の表れである。たとえば4ナノグラム/mlあるいは10ナノグラム/ml以上のPSAレベルは前立腺癌を示すが、前立腺癌は4以下のPSAレベルの患者でも見つかる。
発明のある実施態様では、方法は、非侵襲性の癌から侵襲性の癌(たとえば侵襲性の前立腺癌)を差別的に診断することができる。これは癌のDESNTステータスの決定により達成することができる。別法としてあるいはさらに、定量されている遺伝子のそれぞれについての試験サンプル内の発現レベルと、適切な参照(例えば健康な患者、または非侵襲性の癌に苦しむ患者からのサンプル)の患者、またはコントロールまたはハウスキーピング遺伝子を使用した発現レベルとの比較により達成されることができる。このように、不必要な治療は回避することができる。また、適切な治療が代わりに適用される(例えばフルオキセチン(fluoxetine)、ガバペンチン(gabapentin)あるいはアミトリプチリン(amitriptyline)のような前立腺炎の抗生物質治療あるいはフィナステリド(Finasteride)のようなアルファ・リダクターゼ阻害剤での治療)。
発明の1つの実施態様では、方法は、以下のステップを含む:
1) 患者から得られた生体試料のRNAを検知すること;および
2) RNA分子の各々の発現レベルを定量すること。
検知されたRNA転写物は、定量されるバイオマーカーに相当する(従ってその発現レベルが測定されている遺伝子)。ある実施態様では、検知されているRNA(例えばmRNA、IncRNAあるいはスモールRNA)は、表2にリストされた少なくとも40の遺伝子(任意に表2にリストされた遺伝子の少なくともすべて)に対応し、または表3にリストされた少なくとも15の遺伝子(任意に表3にリストされた遺伝子のすべて)に対応する。そのような方法は、先に患者から得られたサンプル上で試みられることができる。任意に患者はDREを行い、前立腺をマッサージし、得られるサンプル中のRNAの量を増加させることができる。あるいは、方法はそれ自身、患者から生体試料を得る1ステップを含むことができる。
1つの実施態様では、検知されたRNA転写物は、表1にリストされた遺伝子の選択またはすべてに相当する。その後、遺伝子の部分集合は、たとえばLDP分析のようなさらなる分析のために選ぶことができる。
発明のある実施態様では、生体試料は検知と定量に先立ってRNA(あるいは蛋白質のような他の分析物)を富化することができる。しかしながら、富化のステップは任意である。また、代わりに、RNAは、全尿のような生の加工されていない生体試料から得ることができる。富化のステップは、サンプル中のRNA(あるいは他の分析物)の濃度を増加させる任意の適切な前処理方法ステップであることができる。例えば、富化のステップは、サンプルから細胞を除去するための遠心分離と濾過を含むことができる。
発明の1つの実施態様では、方法は以下を含む:
a) 増幅、濾過あるいは遠心分離によってRNAについて生体試料を富化すること、任意に生体試料はDREを経験した患者から得られた;
b) 富化したサンプルのRNA転写物を検知すること;および
c) 検知されたRNA分子の各々の発現レベルを定量すること。
検知のステップは、ハイブリダイゼーション、増幅、シーケンシング、または分子量および/または電荷の検知、または細胞の表現型の変化、あるいは特定の分子の結合の検知、あるいはそれらの組み合わせに基づく検知方法を含むことができる。
ハイブリダイゼーションに基づいた方法はノーザンブロット、マイクロアレイ、ナノストリング(NanoString)、RNA-FISH、分岐鎖ハイブリダイゼーション分析、および関連方法を含んでいる。増幅に基づいた方法は、定量逆転写ポリメラーゼ連鎖反応(quantitative reverse transcription polymerase chain reaction:qRT-PCT)、トランスクリプション メディエイティッド 増幅(transcription mediated amplification)、および関連方法を含んでいる。シーケンシングに基づいた方法は、サンガー・シーケンシング(Sanger sequencing)、次世代シーケンシング(合成による高スループットシーケンシング)、およびターゲッティッドRNAseq(targeted RNAseq)、ナノポアメディエイティッドシーケンシング(nanopore mediated sequencing:MinION)、質量分析検知および関連方法を含んでいる。分子量および/または電荷の検知に基づいた方法は、質量分析を含むが、これに制限されない。表現型の変化に基づいた方法は、miRNAsをスクリーニングする方法(例えば、Cullen & Arndt, Immunol. Cell Biol., 2005, 83:217-23を参照)により、テスト・セル、あるいは動物の細胞内の変化を検知することができる。特定の分子の結合に基づいた方法は、例えば抗体あるいはRNAまたはDNA結合性蛋白質のような他の結合分子との結合の検知を含んでいる。
ある実施態様では、方法は、RNA転写物をcDNA転写物に変換する1ステップを含むことがある。そのような方法ステップは、方法の任意の時に行うことができ、たとえば富化の前(このステップが行われる場合、富化ステップはcDNA富化ステップである)、検知の前(その場合には検知ステップはcDNA検知のステップである)、あるいは定量の前(その場合には検知された各cDNAシーケンスの転写物の数を数えることによる検知されたRNA分子の各々の発現レベルである)に行うことができる。
発明の方法は、検知され定量されるRNAあるいはcDNAの量を増加させる増幅ステップ含んでいることがある。増幅の方法はPCR増幅を含んでいる。
発明のいくつかの方法では、cDNA-結合分子複合体の検知および定量化は遺伝子発現を決定するために使用されることができる。例えば、サンプル中のRNA転写物は、逆転写によってcDNAに変換されることができ、その後にサンプルは定量されている遺伝子に特異的な結合分子と接触され、DNA特異的結合分子複合体の存在を検知し、対応する遺伝子の発現を定量する。
したがって、バイオマーカー・パネルの中で同定された1以上の遺伝子に対応するcDNA転写物の、検知方法での使用、前立腺癌の予後の診断または決定での使用を提供する。
一旦発現レベルが定量されれば、癌(特には侵襲性の前立腺癌)の診断を決定することができる。発明の方法は患者の予後を決定するため、治療への患者の反応を決定するため、患者の癌の治療適応性を決定するために使用することができる。方法は癌進行を予測するために使用することができるからである。
方法はさらに、定量化された発現レベルを参照と比較し、次いで癌、特には侵襲性の前立腺癌の存在または不存在を決定するステップをさらに含むことができる。
分析物富化は任意の適切な方法によって達成されることができるが、遠心分離および/または濾過によりサンプルからセルデブリスを取り除くことが好ましい。富化したサンプルからRNAを得るステップは、富化したサンプルの中にあるマイクロベシクル(microvesicles)からRNAを収穫することを含んでいることがある。
RNAシーケンシングステップは任意の適切な方法によって達成されることができるが、直接RNAシーケンシング、RT-PCRあるいは、シーケンシング-バイ-シンセシス(sequencing-by-synthesis)(次世代、あるいはNGS、高スループットシーケンシングが好ましい。定量化は任意の適切な方法によって達成されることができるが、たとえば、特定のシーケンスで特定された転写物の数を数えるにとによって達成することができる。1つの実施態様では、シーケンス(通常75-100の塩基対)はすべてヒトの参照とアラインされる。適切なデータベース(例えばEnsemblデータベース)に定義された各遺伝子について、シーケンスの数、あるいはその遺伝子とオーバーラップする(そしてどんな他のものともオーバーラップしない)読みを、数える。サンプル間の遺伝子を比較するために、各サンプルを正規化することが通常必要であり、量はシークエンスされたデータと等価な合計となるようにされる。正規化の方法は当業者に明白である。
当業者に明白なように、使用されている試験サンプルのタイプを考慮するため、および/または分析に先立って生じた試験サンプルを処理するため、分析物濃度のどんな測定値も正規化されることが必要である。
遺伝子の発現レベルはコントロールと比較され、発現のレベルが分析されているサンプルでのものより高いか低いかを決定することができる。分析されたサンプルの発現のレベルが、分析されたサンプルと比較されるサンプル中の発現のレベルより高い場合、遺伝子はアップレギュレートされたと言える。分析されたサンプルの発現のレベルが、分析されたサンプルと比較されるサンプル中の発現のレベルより低い場合、遺伝子はダウンレギュレートされたと言える。
発明の実施態様では、遺伝子の発現のレベルは予兆であることがある。そのため、本発明は、介在を要求する前立腺癌(侵襲性の前立腺癌)、および介在を要求しない癌(インドレントまたは非侵襲性の前立腺癌)を区別するのに有用であり、不必要な治療およびそれらに関連する副作用を回避するのに特に役立つ。本発明の最も有望な使用は、追加の患者のサンプルがLPD分析によりDESNTかどうか決定するための500の遺伝子パネルの使用、患者のサンプル中の遺伝子のダウンレギュレーションを測定することによりDESNTかどうか決定するための45の遺伝子パネルの使用、およびRF分析による20の遺伝子パネルの使用だろう。
発明のある実施態様では、バイオマーカー・パネルは、PSA検査、PCA3テスト、プーロラリス(Prolaris)あるいはオンコタイプ(Oncotype) DXテストのような別のテストと組み合わせることができる。他のテストは、グリーソンスコアを決定する組織学的検査、あるいは癌の進行の病期の事前評価であることがある。
発明の一層の実施態様では、前立腺癌の治療のための患者の適応性を決定する方法であって、本発明の方法によって癌を分類すること、癌進行が診断されるか疑われる場合に、特に侵襲性の前立腺癌が診断されるか疑われる場合に、前立腺癌の治療を続けるかどうか決定することを含む方法が提供される。
患者の療法に対する反応をモニターする方法であって、本発明の方法によって、先に前立腺癌の治療(例えば化学療法および/または放射線療法)を受けた患者から得られた生体試料を使用して、癌を分類することを含む方法がさらに提供される。ある実施態様では、方法は治療を受ける前後の患者の中で繰り返される。その後、発現のレベルの比較に基づいて、治療を継続するべきか、代替療法を試みるべきであるかどうかの決定をなすことができる。例えば、治療を受けた後にDESNT癌が検知されるか疑われる場合、代替治療療法が使用されることができる。方法は治療がDESNTから非DESNTに患者の癌をダウングレードすることに成功するかどうか確かめるために繰り返すことができる。
1つの実施態様では、以下を含む方法が提供される:
a) 患者から得られたサンプルに本発明の診断法を行い、DESNT癌(たとえばDESNT前立腺癌)の存在または非存在を決定すること;
b) DESNT癌が見つかるか疑われる癌について治療を提供すること;
c) 患者から得られたさらなるサンプルに本発明の診断法を続いて行い、DESNT癌の存在または非存在を決定すること;および
d) 癌のための療法を維持するか、変更するか、終了すること。
発明のある実施態様では、たとえば治療に引き続く尿中のバイオマーカー発現を測定することにより、容易に異なる治療の影響をモニターすることができるので、本発明の方法とバイオマーカーのパネルは患者の治療を個別的に取り扱うのに有用である。発明の方法およびバイオマーカーは、たとえばホルモン除去療法に対する反応のような治療の有効性を予測するために使用することができる。
発明の別の実施態様では、患者の癌(たとえば侵襲性の前立腺癌)を治療するか防ぐ方法であって、患者から得られたサンプルに本発明の診断法を適用し、DESNT癌の存在または非存在を決定し、DESNT癌が検知されるか疑われれば癌治療を施す方法が提供される。前立腺癌を治療する方法は腫瘍を切除しおよび/または患者へ化学療法および/または放射線療法を施すことを含むことがある。
本発明の癌を治療する方法は、侵襲性の前立腺癌の治療に特に役立つ。ある実施態様では、治療法は、DESNT癌を持っていると同定された患者に行なわれる。
可能であれば、前立腺癌の治療は腫瘍の切除あるいは他の外科技術を含んでいる。例えば、治療は根本的または部分的な前立腺摘除、経尿道的切除(trans-urethral resection)、精巣摘除あるいは両側の精巣摘除を含むことがある。治療は、別法としてあるいはさらに化学療法および/または放射線療法による治療を含むことがある。化学療法の治療はドセタセル(docetaxel)、アビラテロン(abiraterone)あるいはエンザルタミド(enzalutamide)を含んでいる。放射線治療(Radiotherapeutic treatment)は体外照射療法(external beam radiotherapy)、骨盤の放射線療法、手術後の放射線療法、近距離照射療法あるいは場合に応じて予防的な放射線療法を含んでいる。他の治療は、補助ホルモン療法(たとえばアンドロゲン抑制療法、寒冷療法、高密度焦点式超音波療法、免疫療法、近距離照射療法および/またはビスホスホネートおよび/またはステロイド投与)を含んでいる。
発明の別の実施態様では、次のものを含む癌の治療に役立つ薬を同定する方法が提供される:
a) 患者から得られたサンプルに発明の診断法を行い、DESNT癌の存在か非存在を決定すること;
b) 患者への候補薬を投与すること;
c) 患者から得られたさらなるサンプルに発明の診断法を続いて行い、DESNT癌の存在か非存在を決定すること;および
d) ステップc)で発見された知見とステップ(a)で発見された知見を比較すること、ここでDESNT癌の可能性の低減は薬候補を癌の可能な治療薬であると同定する。
生体試料
発明の方法は、生体試料に行なわれるステップを含むことがある。分析される生体試料は、尿サンプル、精液サンプル、前立腺の滲出液サンプル、あるいは前立腺に由来する高分子または細胞を含んでいる任意のサンプル、全血サンプル、漿液サンプル、唾液、あるいは生検試料(たとえば前立腺組織試料あるいは腫瘍サンプル)であることができる。前立腺癌についての最も一般的な生体試料は、前立腺生検、前立腺摘除あるいはTURPからのものである。方法は、生体試料を得るか提供するステップを含んでいることがある。あるいは、サンプルはたとえば生体外の方法で患者から得られたものであることができる。サンプルは、潜在的に癌である前立腺組織、または前立腺内の他の細胞、あるいは前立腺、血液、あるいは免疫系内の細胞によって生産された微小小胞体に関連する遺伝子の発現のレベルを表すと考えられる。従って、本発明の方法は、癌に反応する前立腺、および/または血液システムおよび/または骨髄内の細胞によって生産されたRNAの定量データを使用して前立腺癌の存在か非存在を決定する。
発明の方法は患者からの1つの試験サンプルに対して実行されることができる。あるいは、複数の試験サンプル(例えば少なくとも2、3、4あるいは5サンプル)が、患者から受け取られることがある。サンプルはそれぞれ発明の方法を使用して個別の分析に供されることができるし、あるいは診断を行う一人の患者からの多数のサンプルに方法が適用されることができる。
発明の中で使用されるさらなる分析法
発明のバイオマーカー・パネルからの遺伝子または蛋白質の発現のレベルは、多くの方法で決定することができる。バイオマーカーがサンプル内のタンパク質として発現される場合、発現のレベルは、たとえばサンプル中の蛋白質の濃度を決定することによりバイオマーカーを定量することにより決定することができる。あるいは、サンプル(たとえば組織試料)中のRNAあるいは蛋白質の量が決定されることができる。一旦発現のレベルが決定されたならば、レベルは、任意にコントロールと比較することができる。これは先に測定された発現レベル(同じ被験者から異なる時期に得られたサンプル中で、あるいは異なる被験者(例えば健康な被験者、非侵襲性の癌(つまりコントロールまたは参考)の被験者)から得たサンプル中で)、異なる蛋白質またはペプチド、あるいは他のマーカー、または、同じサンプル内において、分析されているサンプル内で発現またはタンパク濃度のレベルがより高いかより低いかどうか決定するアセスメント手段であることができる。ハウスキーピング遺伝子もコントロールとして使用することができる。理想的には、コントロールはサンプル間で一般に著しく変わらない蛋白質かDNAマーカーである。
遺伝子発現を定量する他の方法は、RNAシーケンシングを含んでいる。その1つの態様は全体トランスクリプトームショットガンシーケンシング(whole transcriptome shotgun sequencing:WTSS)として知られている。RNAシーケンシングの使用は、サンプルの中にあるRNAシーケンスの特性(nature)を決定することができ、そして各RNA分子(例えばmRNAあるいはmicroRNAトランスクリプト)の存在量の測定により、更に遺伝子発現を定量する。方法は、サンプルの分析はシーケンシング-バイ-シンセシス(sequencing-by-synthesis)のアプローチを使用する。
使用することができるいくつかのタイプのRNAシーケンシングがあり、たとえばRNA PolyAテイルシーケンシング(RNA PolyA tail sequencing)(RNAシーケンスのpolyAテイルがpolyTオリゴヌクレオチドを使用してターゲットとされている)、ランダム-プリムドシーケンシング(random-primed sequencing)(ランダムなオリゴヌクレオチド・プライマーを使用して)、ターゲッティドシーケンス(targeted sequence)(特定遺伝子トランスクリプトに補足的な特異性オリゴヌクレオチド・、プライマーを使用して)、小分子RNA/非コードRNAシーケンシング(それはサイズ分離を使用して、microRNAsのような小さな非コードのRNAを分離することを含むことができる)、ダイレクトRNAシーケンシングおよびリアルタイムPCRを含む。ある実施態様では、RNAシーケンス読み取りは、参照ゲノムにアラインされ、遺伝子発現を決定するために各シーケンスの読み取りの数を定量する。発明のある実施態様では、方法は転写アセンプリ(デノボ(de-novo)あるいはゲノム・ガイドされた)を含む。
RNA、DNAおよび蛋白質配列(マイクロアレイ)はある実施態様の中で使用されることができる。RNAとDNAのマイクロアレイは、DNAまたはRNAのオリゴヌクレオチドの一連の微視的なスポット(microscopic spots)を含み、各々は補足的な核酸分子に結合することができるヌクレオチドのユニーク配列を含む。このように、オリゴヌクレオチドは、高い厳格な条件の下で正確な標的配列がハイブリダイズするプローブとして使用される。本発明では、標的配列は、その発現が検知されている遺伝子に対応する、転写されたRNA配列またはそれらのユニークな部分であることができる。蛋白質マイクロアレイも直接蛋白質発現を検知するために使用することができる。これらは固体の表面に固定された捕獲分子(capture molecules)を含む、DNAおよびRNAマイクロアレイに似ている。
捕獲分子は抗体、蛋白質、アプタマー、核酸、レセプタおよび酵素を含んでいる。商用抗体が検知される分析物に利用可能でない場合、それは望ましいことがある。アレイに使用するための捕獲分子は、外部的に合成し、精製し、アレイに付着させることができる。あるいは、それらはその場で合成し、配列に直接付着させることができる。捕獲分子は生合成、無細胞のDNA発現あるいは化学合成によって合成することができる。その場合成は後の2つで可能である。
一旦マイクロアレイ上で捕らえられたならば、検査法は公知技術の任意のもののいずれかでありえる。例えば、螢光検知を使用することができる。それは敏感で、安全で、高解像度でありえる。他の検査法としては、他の光学的手法(例えば比色分析、化学発光、ラベルフリー表面プラスモン共鳴分析(label free Surface Plasmon Resonance analysis)、顕微鏡検査法、反射率など)、質量分析、電気化学的方法(例えばボルタメトリー(voltametry)および電流測定)および無線周波数方法(例えば多極共鳴分光法(multipolar resonance spectroscopy))を含んでいる。
RNAまたはcDNAの検知のための方法は、ハイブリダイゼーション(例えばノーザンブロット、マイクロアレイ、ナノストリング(NanoString)、RNA-FISH、枝分れ鎖ハイブリダイゼーション分析、TaqManまたはSYBR green生成物検出のような定量的逆転写ポリメラーゼ連鎖反応(qRT-PCR)のための増幅検査法に基づくことができる。次のもののようなプライマー伸張検知方法:単一のヌクレオチド伸張、サンガー・シーケンシング。あるいは、RNAは、サンガー・シーケンシング、次世代(高生産性)シーケンシング、特にはシーケンシング-バイ-シンセシス、プリサイスターゲッティドRNAseq分析(recise targeted RNAseq assays)のようなターゲッティドRNAseq分析、あるいはオックスフォード・ナノポアMinION装置のような分子検出装置によりシーケンスされる。上記の技術の組み合わせは、磁気ビーズを介した分子捕獲、転写増幅およびたとえば化学発光による検知のための第2のプローブとのハイブリダイゼーションを使用するGen-Probe PCA3分析において使用される、Transcription Mediated Amplification (TMA)において使用される。
RNAは検知に先立ってcDNAに変換されることができる。RNAまたはcDNAは、検知の前にあるいは検知の一部として増幅されることができる。テストは、テスト・セル内の表現型の1または複数の変化によってRNA、蛋白質あるいは他の高分子の存在を検知することができる機能テストを構成することがある。表現型の変化は、運動性または侵襲の変化を含む。
一般に、電気泳動に供された蛋白質も質量分析によりさらにキャラクタライズされる。
そのような質量分析方法はマトリックス-アシスティドレーザ脱離/イオン化飛行時間(matrix-assisted laser desorption/ionisation time-of-flight:MALDI-TOF)を含むことができる。
MALDI-TOFは、生体分子(たとえば蛋白質、ペプチドおよび糖)の分析を可能とするイオン化技術である。それは、従来のイオン化方法によってイオン化された時に脆弱でフラグメントになる傾向がある。イオン化はレーザー・ビーム(例えば窒素レーザー)が引き金となって起きる。また、マトリックスが、直接のレーザー・ビームへの暴露によって破壊されることから生体分子を防御し、かつ気化とイオン化を促進するために使用される。サンプルは溶液でマトリックス分子と混合される。また、少量の混合物が表面に残され、乾燥される。溶剤が蒸発するとともに、サンプルとマトリックスは共結晶する。
タンパク濃度を決定するさらなる方法は、質量分析および/またはたとえばLC-MS、UPLC、タンデムUPLC-MS/MSシステムおよび ELISA法のような液体クロマトグラフィーを含んでいる。発明の中で使用されることができる他の方法は、Agilentバイトキャプチャー(Agilent bait capture)およびPCRに基づいた方法(例えば、PCR増幅は分析物の量を増加させるために使用されることができる)を含んでいる。
発明の方法は、分析物(定量されるRNA分子または蛋白質)に特異的な結合分子あるいは試薬を使用して実行することができる。結合分子と試薬は、検知されるRNA分子または蛋白質への親和性がある分子であり、それらが公知の方法を使用して検知することができる結合分子/試薬-分析物複合体を形成することができるようにされる。発明の結合分子はオリゴヌクレオチド、またはオリゴリボヌクレオチド、ロックド核酸(locked nucleic acid)あるいは他の同様の分子、抗体、抗体フラグメント、蛋白質、アプタマーあるいは分子でインプリントされた重合体構造、あるいはDNAまたはRNAと結合することができる他の分子であることができる。発明の方法は適切な1または複数の結合分子と生体試料と接触することを含むことができる。結合分子が発明のキットの一部を形成することがある。特にはそれらは本発明のバイオセンサーの一部を形成することがある。
アプタマーは特定の標的分子に結合するオリゴヌクレオチドあるいはペプチド分子である。オリゴヌクレオチド・アプタマーはDNAアプタマーおよびRNAアプタマーを含んでいる。アプタマーはランダム・シーケンス・オリゴヌクレオチドあるいはペプチドのプールから生体外の選別過程によって作成することができる。アプタマーはリボザイムと結合することができ、それらの標的分子が存在する状態で自己開裂する。他のオリゴヌクレオチドは、定量されているRNA分子と相補的なRNA分子を含んでいることがある。例えば、polyT oligosはRNA分子のpolyAテイルをターゲットとするために使用することができる。
アプタマーは公知の任意のプロセスによって作ることができる。例えば、アプタマーが同定されることができるプロセスは、systematic evolution of ligands by exponential enrichment(SELEX)である。これは標的分子への選択的な結合に基づいて分割することにより、分子のライブラリーの複雑さを反復して低減すること、およびその後の再増幅を含む。潜在的なアプタマーのライブラリーは目標蛋白質でインキュベートされ、結合していない要素が結合した要素から分離される。結合された要素は回収され増幅され(例えばポリメラーゼ連鎖反応によって)、低減された複雑さ(たとえば富化されたプール)のライブラリーを生産する。富化したプールはSELEXの第2のサイクルを始めるために使用される。
目標蛋白質への引き続く富化されたプールの結合はサイクルごとにモニターされる。一旦、結合分子の割合が適切なレベルに上昇したと判断されれば、富化したプールのクローンが作られる。その後、結合分子は個々に分析される。SELEXはFitzwater & Polisky (1996) Methods Enzymol, 267:275-301でレビューされる。
抗体はモノクローナルとポリクローナル抗体の両方を含むことができ、公知の任意の手段によって生産することができる。特別の蛋白質に結合するモノクローナルおよびポリクローナル抗体を生産するための技術は、当該技術分野でよく開発されている。それらは、標準的な免疫学教科書、例えば、Roitt et al., Immunology, second edition (1989), Churchill Livingstone, Londonで議論される。抗体は人間からのもの、ヒト化されたもの、あるいは、他の種からのものであることがある。本発明は、抗原に結合することができる抗体誘導体を含んでいる。したがって、本発明は抗体フラグメントおよび合成構成物を含んでいる。抗体フラグメントおよび合成構成物の例は、Dougall et al. (1994) Trends Biotechnol, 12:372-379中で与えられる。たとえばFab,F(ab’)またはFvのような、抗体フラグメントあるいは誘導体は使用されることができる。Hustonet al.(993) Int Rev Immunol, 10:195-217に記述されたような単一鎖抗体(scAb)も使用することができる。ドメイン抗体(dAbs)、例えば単一ドメイン抗体、あるいは抗体様の単一ドメイン抗原結合性レセプターも使用することができる。さらに、抗体フラグメントおよび免疫グロブリン様分子、ペプチドミメティクス(peptidomimetics)あるいは非ペプチド・ミメティクスは、抗体の結合活性を模倣する様にデザインすることができる。Fvフラグメントは単一鎖Fv(scFv)分子として知られている合成構成物を生産するために変成することができる。これは、分子の安定性に寄与するVHおよびVL領域に共有結合で連結するペプチド・リンカーを含んでいる。
他の合成構成物はCDRペプチドを含んでいる。これらは抗原結合決定基(antigen binding determinant)を含む合成ペプチドである。これらの分子は、CDRループの構造を模倣し、抗原相互作用性の側鎖を含んでいるコンフォメーションが制限された有機的な環である。合成構成物はさらにキメラ分子を含んでいる。合成構成物は、さらに抗原結合に加えて分子にある望ましい性質を提供する、共有結合でリンクした部位を含む分子を含んでいる。例えば、部位は、ラベル(例えば蛍光性か放射性のラベルのような検知できるラベル)、ヌクレオチドあるいは薬学的に活性な作用薬であることができる。
結合分子が抗体か抗体フラグメントである発明のそれらの実施態様では、発明の方法は公知の任意の免疫手法を使用して行なうことができる。例えば、ELISA、ラジオイムノアッセイあるいは同様の技術が利用できる。一般に、適切な自己抗体は固体の表面上で不動化される。また、テストされるサンプルは自己抗体と接触させられる。自己抗体によって認識された癌マーカー蛋白質がサンプルの中にある場合、抗体マーカー複合体が形成される。その後、複合体は、例えば、マーカー蛋白質のエピトープを特異的に認識するラベルが付けられた第2の抗体を使用して、定量的に測定することができる。ラベルは、例えばワサビダイコンのペルオキシダーゼ(HRP)あるいはアルカリフォスファターゼ(AP)のような生化学的標識で第2の抗体に付けられることがある。また、複合体の検知は、比色定量、化学発光、または蛍光性の生成物を生成する酵素用の基質の追加によって達成することができる。あるいは、複合体の存在は、検知できるラベル(例えば適切な酵素)でラベルが付けられたマーカー蛋白質の追加によって決定されることができる。この場合、酵素活性の測定量は、形成された複合体の量に反比例する。また、負のコントロールが、サンプル中の抗原の存在の決定するために参照として必要である。複合体を検知する別の方法は、放射性同位元素でラベルが付けられた抗体あるいは抗原を利用し、放射能の測定を行うものである。抗原のための放射性のラベルの例はH、14Cおよび125Iを含んでいる。
発明の方法は定性的フォーマット(それはサンプル中の癌マーカー分析物の存在か非存在を決定する)、あるいは定量的フォーマット(それはさらに、サンプルの中にある癌マーカー分析物の量の測定を提供する)で行なうことができる。一般に、発明の方法は定量的である。サンプルの中にあるバイオマーカーの量は上記の任意の技術を使用して計算されることができる。この場合、分析を行なう前に、既知量の癌マーカー分析物を含んでいるか既知の濃度の癌マーカー分析物の一連の標準試料からの分析に使用するために同じ検知反応を使用して得られた信号の測定により、標準曲線を描くことが必要なことがある。スクリーンされるサンプルの中に存在する癌マーカーの量は、その後標準曲線から推定された。
したがって、本発明の中で使用されるような遺伝子発現を決定する方法は、ポリヌクレオチドのハイブリダイゼーション分析に基づいた方法、ポリヌクレオチドのシーケンシングに基づいた方法、プロテオミクス・ベースの方法、逆転写PCR、マイクロアレイ・ベースの方法および免疫組織化学ベースの方法を含んでいる。計量遺伝子発現に関係のある参照も上に提供される。
キットの部分とバイオセンサー
発明の一層の実施態様では、発明のバイオマーカーの発現または濃度を定量するための手段、あるいは発明のバイオマーカーの発現ステータスを決定する手段を含む、癌進行予測(DESNT癌の検知)のための部分のキットが提供される。手段は任意の適切な検出手段であることがある。例えば、ここに議論されるように、手段はバイオセンサーであることがある。キットは、さらに1または複数のサンプルの包装容器および/または生体試料からバイオマーカーを抽出するための溶剤を含むことができる。キットは、さらに使用のための指示を含むことがある。
発明のある実施態様では、発明のバイオマーカーの発現ステータス(例えば発現のレベル)を検知するための手段を含む、癌の分類(例えば、癌進行の可能性を決定する)のための、部分のキットが提供される。バイオマーカーを検知するための手段は、定量されるバイオマーカーに特異的に結合するか、反応する試薬であることがある。したがって、発明の1つの実施態様では、定量されるバイオマーカー分析物に特異的に結合する試薬または分子と、患者からの生体試料とを接触させること、分析物-試薬あるいは分析物-結合分子の複合体の量を測定すること、生体試料中の関連する蛋白質あるいは遺伝子の発現のレベルと、分析物-試薬あるいは分析物-結合分子の複合体の量を相関させることを含む前立腺癌を診断する方法を提供する。
例えば、発明の1つの実施態様では、方法は、以下のステップを含む:
a) 発明のバイオマーカーの1つ以上に特異性の試薬または結合分子と生体試料を接触させること;
b) バイオマーカーについて分析物-試薬あるいは分析物-結合分子複合体の量を定量すること;および
c) 分析物-試薬あるいは分析物-結合分子複合体の量を生体試料中のバイオマーカーの発現レベルと関連させること。
方法は、ステップc)中のバイオマーカーの発現レベルを参照と比較し癌のステータスを分類すること、特には癌進行の可能性、そしてその結果治療の必要性(侵襲性の前立腺癌)を決定するステップd)をさらに含むことができる。もちろん、ある実施態様では、方法は本発明に述べられていたような統計分析を行なうことをさらに含むことができる。その後、患者は治療されることができる。適切な試薬あるいは結合分子としては、抗体か抗体フラグメント、オリゴヌクレオチド、アプタマー、酵素、核酸、細胞小器官、細胞、生物学的組織、インプリントされた分子あるいは小分子を含む。そのような方法は発明のキットを使用して実行されることができる。
部分のキットは、メモリとプロセッサーを有する器具または装置を含むことがある。メモリは格納された指示含むことができ、プロセッサーによって読まれた時、プロセッサーに上に記述された方法の1つ以上を行なわせる。メモリは、さらにランダムフォレスト分析で使用される複数のディシジョンツリーを含むことができる。
発明の部分のキットはバイオセンサーであることができる。バイオセンサーは生物学的感知要素を組込み、生体試料についての情報(例えば分析物の存在(あるいは非存在)または濃度)を提供する。具体的には、それらは生理化学的な検出器とバイオ認識コンポーネント(バイオレセプタ)を組み合わせ、分析物(たとえばRNAまたは蛋白質)の検知および/または定量を行う。例えば、バイオレセプタは対象の分析物と特異的に相互作用するかまたは結合し、たとえば抗体か抗体フラグメント、酵素、核酸(たとえばアプタマー)、細胞小器官、細胞、生物学的組織、インプリントされた分子あるいは小分子であることができる。
バイオレセプタは、支持体(例えば金属、ガラス、高分子支持材、ヒドロゲル支持体のような3-次元の格子支持体)上に不動化されることができる。
バイオセンサーは、存在するバイオ変換器(biotransducer)のタイプによってしばしば分類される。例えば、バイオセンサーは、電気化学(たとえば電位差計)、電子、圧電気、重量分析、ピロ電気のバイオセンサーあるいはイオンチャネル・スイッチ・バイオセンサーであることができる。分析物の存在量を正確に決定することができるように、変換器は、対象の分析物とバイオレセプタの間の相互作用を定量的な信号に翻訳する。光学的バイオセンサーは、バイオレセプタと対象の分析物の間の相互作用に起因する表面プラズモン共鳴に依存することがある。SPRは試験サンプル中の分析物の量を定量化するために使用することができる。他のタイプのバイオセンサーは、エバネセント波バイオセンサー(evanescent wave biosensor)、ナノバイオセンサーおよび生物学的バイオセンサー(例えば酵素、核酸(たとえばRNAまたはアプタマー)、抗体、エピジェネティック(epigenetic)、細胞小器官、細胞、組織あるいは微生物バイオセンサー)を含んでいる。
本発明は、定量されるバイオマーカーの各々に特異性の捕獲分子(たとえばRNAまたはDNAオリゴヌクレオチド)を含むマイクロアレイ(RNA、DNAあるいは蛋白質)を提供する。そこでは捕獲分子は固体担体上に不動化される。マイクロアレイは発明の方法に有用である。
発明の1つの実施態様では、発明のバイオマーカーの1つ以上の発現レベルを決定することを含む前立腺癌を分類する方法が提供され、方法は決定された値を参照と比較することを任意に含む。
分析されるバイオマーカーは、発明の方法によって決定することができる。あるいは、ここに提供されるバイオマーカー・パネルを使用することができる。表3にリストされた遺伝子の少なくとも15(好ましくは20すべて)は、前立腺癌を分類するのに役立つ。
表2にリストされた遺伝子の少なくとも40(好ましくは45すべて)は、いくつかの異なるタイプの癌を分類し、前立腺癌の分類を含む癌の進行の可能性を決定するのに役立つ。第2および引き続く発明の態様の特徴は、発明の最初の態様の特徴に準ずる。
本発明は、以下の例を参照してさらに記述される。それは例示のためにのみ存在し、本発明を制限するものではない。
実施例では、以下の多くの図が言及される:
図1:ラテントプロセスデコンポジション(Latent Process Decomposition:LPD)、遺伝子相関および臨床結果
a. MSKCCデータセットからのアフィメトリックス発現データ(Affymetrix expression data)のLPD分析は、サンプルを8つのプロセス(各々棒グラフによって表わされた)に分割した。サンプルは8つのプロセスすべてで表わされる。また、各棒の高さは、各LPDプロセスに割り当てることができるシグネチャーの割合(pi)に相当する。サンプルは、それらがpiの最高値を示すLPDグループに割り当てられる。LPDは、500の遺伝子プローブを使用して、MSKCCデータセットの中でサンプル間の発現における最も大きな変異について行なわれた。DESNT癌を含むプロセスが示される。
b. LPD分析において使用されたデータセットのリスト。LPDの中で使用される原発性癌および正常な標本のユニークな数が示される。FF:新鮮な凍結された標本;FFPE、ホルマリン-固定化パラフィン埋め込み標本。CancerMapとCamCapは独立しておらず、40の癌を共通して有していた。CancerMapデータセットのための臨床および分子の詳細は、補助情報表2および補足的データ1に与えられる。
c. DESNTとして指定された癌の間の遺伝子発現の平均値の相関。MSKCC、CancerMap、StephensonおよびKleinデータセットのための6つの比較がすべて示される。各遺伝子の発現レベルはすべてのサンプルにわたり平均0および標準偏差1で正規化した。
d. MSKCC、CancerMapおよびStephensonデータセットのためのKaplan-Meier PSA再発プロット。各グループ中の癌の数は各Kaplan-Meierプロットの右下隅に示される。PSA再発の患者の数は括弧の中で示される。
図2:DESNT予後不良前立腺癌内で共通してダウンレギュレートした遺伝子
a. 非DESNT癌と比較してDESNT癌中で著しく変化した発現を示した遺伝子の数(P<0.01、再発発見比率(False Discovery Rate)について補正後)。100の独立したLPDの実験で少なくとも80でダウンレギュレートしたとの厳格な要求に基づいて、4つの発現マイクロアレイ・データセットすべてにおいて45の遺伝子がDESNT癌中でより低い発現をした。
b. 生物学的グループによる45の遺伝子のリスト。コード化された蛋白質の機能は、補助情報表3に示される。45の遺伝子のうちのいくつかは間質組織で優先的に発現されるが、我々は、細胞の組成物のデータが利用可能であるCancerMapおよびCamCapの患者のシリーズの両方において間質組織の含有量と臨床の結果の間には相関が無いことを見いだした。患者が2つのグループ(中央の間質含有量の上および下)へ階層化された時、Kaplan-Meierプロットは、CancerMap(ログ-ランク検定、p=0.159)およびCamCap(p=0.261)の患者のシリーズの両方の結果の差を示さなかった。
c. circosプロットとして表わされる、前立腺癌のための公表された予後不良シグネチャーでの遺伝子と、人間の前立腺癌のためのDESNT分類の関係。45の共通してダウンレギュレートされる遺伝子へのリンクは茶色で示される。
図3:The Cancer Genome Atlasデータセット中のRF-DESNTおよび非-RF-DESNT癌の比較
20の遺伝子のランダムフォレスト(RF)クラシファイヤーはDESNT癌(RF-DESNT癌と同定される)を同定するために使用された。遺伝子変化のタイプは各遺伝子(突然変異、融合、欠失および過剰発現)について示される。生化学的再発(BCR)を含む臨床のパラメーターは、iCluster、メチル化、ソマティックコピー数変化(somatic copy number alteration:SVNA)およびmRNA7,20のグループと一緒に底部に表わされる。各遺伝子の突然変異およびホモ接合体欠失は、BRCA2(P=0.021、χテスト)およびTP53(P=0.0038)の中の遺伝子変化の過剰を含むRF-DESNT癌と組み合わせられた時、複数の試験について修正した後に、これらの相違は有意でなかった(P>0.05)。
図5:ログ尤度プロット(Log-likelihood plots)
各データセットについてのログ尤度(縦軸)対プロセスの数(横軸)。MAP解決策(上のカーブ)および最大尤度解決策(下のカーブ)を使用した。最大尤度モデルについては、ログ尤度のピークは、使用するプロセスの数を示す。MAPモデルについては、ベイズ事前確率(Bayesian prior)が、過剰に複雑なモデルの罰則を構築するために使用される。ログ尤度は後にプラトーへ上昇し、その後それ以上のゲインはえられず、使用されるべきプロセスの最大数を示す。
図6:トランスクリプトーム・データセットのラテントプロセスデコンポジション(LPD)分析
MSKCC、Stephenson、CancerMap、CamCapおよびKleinデータセットは各々、それらのログ尤度プロット(図5)から示されたプロセスの最適な数へデコンポジションされた。単一のサンプルはすべてのプロセスにわたり表わされる。また、各棒の高さは、各LPDプロセスに帰することができるシグネチャーの割合(pi)に相当する。サンプルは、それらがpiの最高値を示すLPDグループに割り当てられる。MSKCC、CancerMapおよびCamCapデータセットについて、赤、青、緑は、方法の中で定義されるような臨床のパラメーターに基づいた進行の異なる危険を有する癌を表示する。Stephensonデータセットについては、3つの危険グループへの指示に必要なパラメーターのうちのいくつかが見当たらないので、病理学的病期だけが示される。Kleinデータセットからの臨床データは公的に利用可能ではない。各データセットについては、DESNT癌を含むプロセスが示される。ログ尤度プロットとLPDは、その発現がMSKCCデータセットの中で最大に変化する500の遺伝子座を使用して行なわれた。
図7:LPDによって同定されたDESNT癌についての結果の分析
(a-d) MSKCC(a)、CancerMap(b)、Stephenson(c)およびCamCap(d)データセットについてのKaplan-Meier PSA再発プロット。各データセットについては、LPDによってDESNTプロセスに割り当てられた癌は、残りの癌と比較される。各グループ中の癌の数は各プロットの右下隅に示される。PSA再発の癌の数は括弧の中に示される。示されたKaplan-Meierプロットは、無作為に選ばれたシードパラメーターを使用して、各々行なわれた、100のLPD実験からの最も頻繁な値(モード)p値を表わす(図12)。
(e-i) MSKCC(e)、CancerMap(f)およびStephenson(g)データセットのための方法に述べられているように、多変量分析が行なわれた。(h)については、多変量分析が、結合したMSKCC、CancerMapおよびStephensonデータセットについて行なわれた。
(i) 多変量分析をCamCapデータセット上で行なった。CamCapは、CancerMapデータセットの40の癌がオーバーラップしたために、別途分析された。方法に述べられているように、MSKCCとStephensonのデータセット用の病理学的病期共変量はコックス・モデルのその比例ハザード仮定を満足せず、時間従属変数としてモデル化された。
図8:LPD分類によって同定されたDESNT癌の遺伝子発現の相関
癌の間の遺伝子発現の平均値の相関(corr.)を、MSKCC、CancerMap、Stephenson、KleinおよびCamCapデータセットの各々からのLPDを使用して、DESNTプロセスとの間で示した。その発現レベルがMSKCCデータセットの中で最大に変化し、LPDのために使用された、500の遺伝座からのデータが示される。平均0および標準偏差1で、各遺伝子の発現レベルがすべてのサンプルにわたり正規化された。10の可能な比較がすべて示される。
図9:20の遺伝子シグネチャーを使用するRF分類によるDESNT癌の検知
ランダムフォレスト分類が、1669の遺伝子のlasso回帰分析(lasso regression analysis)の中の5つのデータセット;MSKCC、CancerMap、Stephenson、KleinおよびCamCapの少なくとも2つでDESNT癌の有意な変化された発現と同定された20の遺伝子のシグネチャーを使用して行なわれた。各データセットについて使用された参照は、図12に示されるモードp値に対応するDESNTグループの癌であった。図は各予測についてのAUC、正確さ、感度および特異性を示す。偽陽性(右上)・偽陰性(左下)割付の数を示すグリッドが、各データセットのために示される。
図10:RF分類によって同定されたDESNT癌についての結果の分析
(a-e) MSKCC(a)、CancerMap(b)、Stephenson(c)、CamCap(d)およびTCGA(e)データセットのためのKaplan-Meier PSA再発プロット。各データセットについては、20の遺伝子RF分類を使用してDESNTに割り当てられた癌は、残りの癌と比較された。各グループ中の癌の数は各プロットの右下隅に示される。PSA再発癌の数は括弧の中に示される。MSKCC(f)、CancerMap(g)、Stephenson(h)、CamCap(i)およびTCGA(j)データセットのための方法に述べられているように、多変量分析が行なわれた。方法に述べられているように、MSKCCとStephensonのデータセットについての病理学的病期共変量はコックス・モデルの比例ハザード性(proportional hazards assumption)を満足せず、時間従属変数としてモデル化された。
図11:RF分類によって同定されたDESNT癌の遺伝子発現の相関
癌の間の遺伝子発現の平均値の相関は、MSKCC、CancerMap、Stephenson、Klein、CamCapおよびTCGAデータセットの各々からのRF分類を使用して、DESNTプロセスに割り当てた。その発現レベルがMSKCCデータセットの中で最大に変化し、LPDのために使用された500の座からのデータが示される。平均0および標準偏差1として、各遺伝子の発現レベルはすべてのサンプルにわたり正規化された。15の可能な比較がすべて示される。各データセットについては、LPDとRFによって同定されたDESNTプロセスの間に同様の相関が観察された(データは示されない)。
図12:LPD検定の分布
100のLPDのPSA再発ログ・ランクp値の分布を、データセット(a)MSKCC、(b)CancerMap、(c)CamCapおよび(d)Stephensonについてランダムシードで再開した。モードログ-ランクp値に対応するKaplan-Meierプロットの例は、図1dおよび図7a-dに示される。
図13:MSKCCデータセットのLPDデコンポジション。
(a) サンプルは8つのプロセスすべてで表わされる。また、各棒の高さは、各LPDプロセスに割り当てることができるシグネチャーの割合(ガンマ、垂直軸)に相当する。
7番目の列は、各サンプルの中で同定されたDESNT発現シグネチャーのパーセンテージを示す。
(b) 各サンプルの中にあるDESNT癌の割合を示す棒グラフ。
(c,d) 個々の癌の組成を示す円グラフ。DESNTは赤である。他のLPDグループはキーの中で示されるような異なる色によって表わされる。円グラフの隣の数は、それが上記の棒グラフからどの癌を表わすか示す。DESNTシグネチャーが最も豊富なものだった時、個々の癌は「DESNT癌」として割り当てられた;例は左の箱(DESNT)の中で示される。他の多くの癌は少ない割合のDESNT癌(d)を含んでおり、さらに不良な結果を持つと予測される:例はより大きなボックス(c、いくつかのDESNT)中に示される。
図14:存在するDESNT癌のパーセンテージに基づいた前立腺癌の層化
これらの分析については、MSKCC、CancerMap、CamCapおよびStephensonデータセットからのデータは組み合わせられた(n=517)。
(a) プロットは各癌へのDESNT癌の寄与を示し、4つのグループへ分けられた。
グループ1のサンプルは0.1%未満のDESNT癌がある。
(b) LPDによって決定されるDESNT癌存在の割合に基づいて、Kaplan-Meierプロットは生化学的再発(BCR)の無い生存を示す。各グループ中の癌の数は右下に示される。各グループ中のPCR再発の数は括弧内に示される。グループ1-4の定義は図2aの中に示される。DESNT30%まで(グループ2)のガンマ値の癌は、DESNTを欠く癌(<0.1%)と比較して、より不良な臨床の結果(X2テスト、p=0.015)を示した。中間物(0.3から0.6)および高い(>0.6)ガンマ値を有する癌は、さらにDESNTを欠く癌と比較して有意により悪い結果(それぞれ、P=2.69×10-6およびP=2.22×10-14)を示した。結合したログ-ランクp値=1.28x10-14
図15:LPDについて、ノモグラムモデルは1、3、5および7年でPSAの無い生存を予測するために開発された。
一人の患者のそれぞれの臨床の変数の評価は、対応するポイントスコア(トップスケール)を有する。各変数のポイント・スコアは加えられ、各患者について合計のポイント・スコアを生成する。1、3、5および7年でのPSAの無い生存の予測された可能性は、トップのポイント・スコアから確率目盛に鉛直線を下に引き下げることにより決定することができる。
図16:LPDのためのコックス・モデル
(a) 各共変量のHRのグラフ表示およびHRの95%の信頼区間。
(b) HR、95%のCIおよびコックス・モデルのワルド検定統計量。
(c) 1000のブートストラップリサンプルを使用するモノグラムの内部バリデーション(internal validation)のためのキャリブレーション・プロット。
黒実線は、モノグラムの明白なパフォーマンスを表わす、青色線は、バイアス補正されたパフォーマンスを表わす、点線は、理想的なパフォーマンスを表わす。
(d) CamCapデータセットを使用するモノグラムの外部バリデーション(external validation)のためのキャリブレーション・プロット。実線は観測されたパフォーマンスに相当し、点線は、理想的なパフォーマンスを表わす。
実施例
実施例1
前立腺癌の臨床の管理での重大問題は、それが高度に異質であるということである1、2。したがって、個々の癌行動の正確な予測は診断の時に達成可能ではなく、本質的な過剰治療に結びつく3、4。それが乳癌5とは対照的に、グローバルな発現プロフィールのスーパーバイズしていない分析は、別個の臨床結果のロバストカテゴリー(robust categories)の前立腺癌を定義していないことは謎のままである6,7。現在の研究では、ラテントプロセスデコンポジション(Latent Process Decomposition (LPD)) とも呼ばれるスーパーバイズしていないベイズ手順の適用が、4つの独立した前立腺癌トランスクリプトーム・データセット中の共通のプロセスを同定する。このプロセスに割り当てられた癌(DESNT癌と同定)は、サイトスケルトンマシーナリー(cytoskeleton machinery)、イオン輸送および細胞接着に含まれる多くのコード化蛋白質の45遺伝子のコアセットの低い発現により特徴づけられる。前立腺摘除に続くリンクしたPSA再発データを備えた3つのデータセットについては、DESNT癌の患者は、他の患者に比較して非常に不良な結果を示した(P=2.65x10-5、P=4.28x10-5およびP=2.98x10-8)。ランダムフォレスト分類を使用したThe Cancer Genome Atlas内で注釈された前立腺癌の分析は、DESNT癌と、ETS遺伝子ステータスを含む任意の特別のクラスの遺伝子突然変異の存在の間のリンクを明らかにできなかった。我々の結果は、人間の前立腺癌の予後不良カテゴリーの存在を実証し、療法のターゲッティングを助け、インドレント疾病を持った人の治療に関連する罹患を回避するのを支援するだろう。
前立腺癌のためのほとんどの発現に基づいた予後のシグネチャーは、侵襲性および非侵襲性の疾病の比較9、10、または特定の生物学的機能を表わす遺伝子11-14の選択を含む、スーパーバイズされたステップを使用して導かれたものを共通に持っている。あるいは、発現バイオマーカーは体細胞のコピー数多型(somatic copy number variations:SCNV)の存在にリンクされることがある。latent Dirchelet allocation method15に基づいたLPDは、臨床結果か生物学的役割8についての知識がない状態でデータセットの構造を検討する。標準のスーパーバイズされていないクラスターリングモデル(例えばk-手段および階層的クラスタリング)とは対照的に、個々の癌は単一のクラスタに割り当てられない:代わりに、各癌の中の遺伝子発現レベルはラテントプロセスの組み合わせによってモデル化される。個々の癌の組成が非常に異種混合の場合16,17、および単一の標本が1を超える寄与系統(contributing lineage)18-20を含んでいる場合、この種の分析は前立腺癌に特に適している。LPDは、乳癌データセットにベイサル(basal)とERBB2の過剰発現サブグループの存在を確認し、かつ重度の前立腺癌の患者が2つの臨床的に別個のカテゴリーへ階層化することができること21を示すために以前から使用されていた。
前立腺摘除標本から得られた4つの独立したトランスクリプトーム・データセット(MSKCC、CancerMap、Klein22およびStephenson23、図1b)が分析された。LPDは、ログ尤度プロット(図1b、図5)から示されるように、全体的な発現プロフィールに寄与する、3から8の間の根本的なプロセスを使用して行なわれた。各データセットのデコンポジションに続いて、癌は、図1aおよび図6の中で示される結果を生成するそれらの最も高いpi値に基づいて個々の潜在プロセスに割り当てられた。piは、個々の癌の発現プロフィールへの各プロセスiの寄与である:すべてのプロセスでのpiの合計は1である。デコンポジション間での関係を求めて、遺伝子発現レベルの相関に基づき、4つのデータセットすべてにわたり共通するように見える1つのプロセスが同定された(図1c)。さらに各データセットについて、この集合体を調査するために、我々は、プロセスに割り当てられた癌と同じデータセットからの他のすべての癌と比較して、著しくより低くまたは高く発現した遺伝子を同定した(False Discovery Rateについて補正の後、p<0.01)。これは、より低い発現の45の遺伝子すべてで共有されるセットを明らかにした(図2a、拡張データ表1)。これらの45のコア遺伝子によってコード化された蛋白質の多くは細胞骨格のコンポーネントであるかまたはその力学を規制する。その一方で他のものは細胞接着およびイオン輸送に関係している(図2b)。45の遺伝子のうちの11は、前立腺癌について公表された予後のシグネチャーの要素だった(図2cおよび補足データ1)。例えば、MYLK、ACTG2およびCNN1は癌転移24のためのシグネチャーでダウンレギュレートされる。一方、TMP2のより低い発現がOncotype DXシグネチャーの一部としてより不良な結果に関係している25。この一般的なプロセスに割り当てられた癌は、「DESNT」(ラテン語でDEScenduNT、下がる)と呼ばれる。
MSKCC発現データセットに利用可能にリンクされた臨床データを使用して、発明者は、他のプロセスに割り当てられた患者と比較された時、DESNT癌の患者が非常に不良な結果を示すことを見いだした(P=2.65x10-5、ログランク検定、図1d)。前立腺摘除に続くPSA再発データが利用可能であることがさらなる2つのデータセットで確認された(図1d):DESNT癌を有するStephensonおよびCancerMapデータセット患者の両方について、非常に不良な結果が示された(それぞれ、P=4.28x10-5およびP=2.98x10-8)。Gleason sumを含む多変量解析において、DESNT癌とされたStageおよびPSAはStephensonおよびCancerMap データセットにおける不良な結果の独立予測因子だった(P=1.83x10-4 およびP=3.66x10-3,Cox regression model)が、MSKCCデータセットではそうではなかった(P=0.327)(表8、図7)。3つのデータセットが組み合わされた時、DESNTメンバーシップの独立した予測値は、P=1.61x10-7(図7)であり、Gleason SumではP=1.00x10-5だった。予後不良DESNTプロセスは、CamCap dataset(表8、図7および8)の中で同定された。それは独立していなかったので、上記の分析から除外された:CancerMapに含まれた癌との本質的なオーバーラップがあった(図1b)。
発明者は、LPDと異なり、コンピューター処理集約的でなく、データセットのより広い範囲および個々の癌の両方に適用することができたクラシファイヤーの開発を望んでいた。少なくとも2つのデータセット中でDESNTおよび非DESNT癌の間で著しく変化した発現を有する1669の遺伝子が、分析に選ばれた。LASSOロジスティク回帰モデル(LASSO logistic regression model)は20遺伝子のセットの選択に導くMSKCCデータセット内のDESNTメンバーシップの最良の予測である遺伝子を同定するために使用された(拡張データテーブル2)。それはDESNT癌の中で有意により低い発現を備えた45の遺伝子に対して1つの遺伝子オーバーラップ(ACTG2)を持っていた。ランダムフォレスト(RF)分類を使用して、これらの20の遺伝子が、個々の癌がDESNTであるとの予測について高い特異性および感度を、MSKCCトレーニング・データセット、および3つの確認データセット中で有するとされた(図9)。PSA再発データにリンクされた2つの確認データセット(StephensonとCancerMap)については、予測された癌サブグループは、一変量および多変量分析の両方でより不良な臨床の結果を示し、これはLPDを使用して観察された結果と合致した(表8、図10)。RF分類がThe Cancer Genome Atlas (TCGA)20によって注釈された(annotated)333の前立腺癌からのRNAseqデータに適用された時、以下のものに基づいてDESNTとして確認された患者のサブグループが同定された:
(i) 他のデータセット中のDESNT癌グループとの遺伝子発現レベルの相関(図11);
(ii) コアダウンレギュレートした遺伝子セット(45/45の遺伝子)でのDESNTおよび非DESNT癌の間での差別的に発現した遺伝子のオーバーラップのデモンストレーション;および
(iii) 非DESNT患者と比較してより不良な臨床の結果(P=5.4x10-4)(表8、図10e)。
TCGAデータセットについての、我々は任意の特定の遺伝子変化の存在と、DESNT癌としての割付との間の相関を見つけられなかった(False Discovery Rate、χテストについての補正後P>0.05、図3)。特別の留意点として、ETS遺伝子ステータスに相関はなかった(P=0.136、χテスト、図3)。蛍光インシティハイブリダイゼーション ブレーク-アパート分析(the fluorescence in situ hybridization break-apart assay)26を使用して決定されたDESNT癌とERG遺伝子転位の間の相関の欠如は、CancerMapサンプル(LPD-DESNT、P=0.549;RF-DESNT、P=0.2623、χ2テスト:それぞれLPD-DESNTおよびRF-DESNTと呼ばれる、LPDおよびRFアプローチによって同定されたDESNT癌)を使用して確認された。これらの観察は、ERGステータスと臨床結果の間の相関の不足と一致している27。前立腺癌のほぼ半分で見つかったETS遺伝子変化20、26は、前立腺癌の進行の初期のステップであると考えられる17,28ので、DESNT癌の生成に関係する変化は、ETS陽性と、ETS陰性癌に共通する後の出来事を表わす。
TGCAシリーズ中のRF-DESNT癌については、45のコア遺伝子のうちのいくつかは、制御遺伝子発現における可能な役割を示唆する、非-RF-DESNT癌(補助情報表1)と比較して、CpG遺伝子メチル化の変更されたレベルを示した。このアイデアを支援するものとして、45のコア遺伝子のうちの16については、ヒト癌中の後成のダウンレギュレーションは、前立腺癌中の6つの遺伝子を含めて、以前に報告されている(CLU、DPYSL3、GSTP1、KCNMA1、SNAI2およびSVIL)(図2b、拡張データ表1)。5つの遺伝子(FBLN1、GPX3、GSTP1、KCNMA1、TIMP3)のCpGメチル化は、以前に癌攻撃性にリンクされた。細胞骨格構造(cytoskeleton structure)を決定し、DESNT癌の中の細胞接着に含まれる遺伝子のダウンレギュレーションは、癌攻撃性を決定する際にアメーバ状のタイプの移動および間充織の移動の寄与に反対するだろうが、集合的な移動または膨張性増殖型(expansive growth phenotypes)を反映することができるだろう29。
前立腺癌についてのThe European Randomized研究からの証拠は、PSAスクリーニングが前立腺癌からの死亡率を21%引き下げることができることを実証する30。しかしながら、PSAスクリーニングについての重大問題は、それが臨床的に無関係である癌の50%以内の検知に結びつくということである3,4:それは人のスクリーニングがない状態での一生の症状を引き起こさなかったであろう癌である。前立腺癌トランスクリプトーム・データセットへのLPDの適用に関する我々の研究は、すべての試験された前立腺摘除シリーズにわたる共通の新しい予後不良カテゴリーの前立腺癌の存在を明らかにした。いくつかの異なるプラットフォーム(Illumina HT12 v4 BeadChip array、RNAseq、Affymetrix array)によって生成されたデータを使用して、冷凍された組織とホルマリン固定された組織の両方から、DESNT癌カテゴリーを検知した。DESNTとしての癌の分類は、その癌が進行する患者を同定する能力を著しく増強するだろう。ついで、これはより攻撃的な疾患を有する人への放射線療法、手術および化学療法のターゲッティングを可能とし、無関係の癌の人の中で、インポテンスを含む治療の副作用を回避するのを支援するだろう。
方法
CancerMapデータセット
新鮮な前立腺癌標本は、Royal Marsden NHS Foundation Trust and Addenbrooke's Hospital, Cambridgeで前立腺摘除を経験した系統的な一連の患者から得られた。適切な地方の研究倫理委員会(Research Ethics Committee)の許諾が、この研究について得られた。冷凍された前立腺スライスを集め31、RNAが以前に記述されるように調製された7,32
発現プロフィールは、メーカーの指示によって1.0 Human Exon ST (Affymetrix, Santa Clara, CA, USA)を使用して、以前に記述された32ように決定された。Affymetrix GeneChip(登録商標)のWhole Transcript Sense Target Labelling Assay が使用され、バイアスなしで発現されたゲノム全体(RNAの合計の1.5μg)から増幅されビオチン化されたセンス-ストランドDNA目標(biotinylated sense-strand DNA targets)を生成した。メーカーの指示に、ハイブリダイゼーション、洗浄および走査のステップについて従った。アレイは、16時間、45℃でAffymetrix Gene Chipハイブリダイゼーション・オーブンの中で60rpmでそれらを回転させることによりハイブリダイズされた。ハイブリダイゼーションの後、アレイはAffymetrix GeneChip Fluidics station FS 450の中で洗われた。アレイはAffymetrix Gene Chip scanner 3000 7Gシステムを使用して走査された。データはGene Expression Omnibus GSE(出版でリリースされるデータ)から利用可能である。
進行カテゴリーのリスク
進行カテゴリーの前立腺摘除リスクが、前立腺癌(Chris Foster、パーソナルコミュニケーション)についての英国の国際的な癌ゲノム・コンソーシアム層化(the UK International Cancer Genome Consortium stratification)に基づいて定義された。
Figure 0007365899000001
追加トランスクリプトーム・データセット
MSKCC、CancerMap、CamCap、StephensonおよびKleinと呼ばれる5つの前立腺癌マイクロアレイ・データセットが分析された。分析されたすべてのデータは根治的前立腺摘除標本からだった。MSKCCデータセットは370のAffymetrix Human Exon 1.0 ST Array 実験 (GEO: GSE21034)を含む。50のマイクロアレイは細胞系統、異種移植片および転移性の組織に対応して除去された。残りの320のマイクロアレイは、原発性の腫瘍および正常組織サンプルからの160の複製を表わす:各サンプルからの1つのデータセットだけがLPD分析で使用された。Stephensonデータセットは、Affymetrix U133A ヒトの遺伝子アレイ23を使用して得られた78の癌および11の正常な前立腺サンプルからのデータを含んでいる。Kleinは、Affymetrix Human Exon 1.0 ST Arrays (GEO: GSE62667)22で分析された、182のホルマリン固定され、パラフィン埋込(FFPE)された原発性の腫瘍サンプルから成る。我々の研究で使用されるCamCapデータセットは、2つの前立腺摘除シリーズ(CambridgeとStockholm)から得られたIllumina HumanHT-12 V4.0発現ビーズチップ(ビーズ・マイクロアレイ)データセット(GEO:GSE70768とGSE70769)を組み合わせて生成され、147の癌および73の正常なサンプルから成った。CamCapとCancerMapのデータセットは40人の患者に共通し、したがって独立していない。The Cancer Genome Atlasからの333の前立腺癌から成る1つのRNAseqデータセットが分析され、TCGA20と呼ばれた。TCGAによって供給された遺伝子あたりのカウントが使用された。
データ処理
遺伝子レベルおよびエキソン・レベル(exon-level)発現信号評価は、Affymetrix発現コンソール・ソフトウェア・パッケージ(Affymetrix Expression Console software package)の中でインプリメントされたロバスト多重配列分析アルゴリズム( robust multiarray analysis algorithm)33を使用して、Affymetrix GeneChip Exon 1.0 STアレイから生成されたCELファイルから導かれた。ビーズマイクロアレイデータセットについては、あらかじめ正規化されたデータが使用されて、illuminaHumanv4.db Rアノテーションパッケージを使用して、UCSC hg19に注釈された(annotated)。不良な品質プローブ(「悪い」および「マッチなし」プローブ)が除去された。あらかじめ正規化されたStephensonデータセットはhgu133a.db Rパッケージを使用して注釈された。必要な時、データセット/コアバッチ効果は、sva Rパッケージ中でインプリメントされたComBat アルゴリズム34の使用のために調節された。
Latent Process Decomposition
Latent Process Decomposition(LPD)8、35、スーパーバイズされていないベイズアプローチが、サンプルをプロセスと呼ばれるサブグループに分類するために使用された。Rogersら35の中でのように、LPDでの使用のためにMSKCCデータセットにわたる最も大きな変異を備えた500 プローブセットが選ばれた。これらのプローブセットは492の遺伝子をマップする。各データセットのために、これらの遺伝子をマップするすべてのプローブがLPD分析(CancerMap:507、CamCap:483、Stephenson:609)の中で使用された。
LPDは客観的にプロセスの中で最も有望な数を評価することができる。発明者は、プロセスの様々な数で見積もられたデータのホールドアウトバリデーションログ尤度(hold-out validation log-likelihood)を評価し、またプロセスの数を選ぶために均一(最大尤度アプローチと等価)および不均一(MAPアプローチ)の組み合わせを使用した。MAPアプローチのために、モデルの平均パラメーターが先に観察されたように0.1にセットされた。この使用された値は結果にほとんど影響を与えず、最大のログ尤度に相当する先の値に変化パラメータがセットされた、つまりMSKCCには-0.5、CancerMapには-0.5、CamCapには-0.05、Stephensonには-0.75、Kleinには-0.3。強健さ(robustness)のために、発明者は、各データセットのために、異なるシードでLPDを100回行った。100回の実施から、発明者は、後の分析に使用される代表的な検定を選択した。代表的な検定は、モードに近い生存ログ-ランクp値での検定だった。Kleinデータセットについては、利用可能な臨床データを持っていなかったので、LPDからのホールドアウトログ尤度が代わりに使用された。
統計的検定
統計的検定はすべてRバージョン3.2.2(https://www.r-project.org/)により行なわれた。特定の遺伝子セットとサンプル・サブグループの2つのデータセット間の発現プロフィール間の相関は、以下のように計算された:
1. 各遺伝子については、1つのプローブセットは任意に選択されている;
2. 各プローブセットについては、その分布は標準正規分布にすべてのサンプルにわたり変形される;
3. サブグループ中のサンプルにわたる各プローブセットの平均の発現が決定され、サブグループについての発現プロフィールを得た;および
4.2つのデータセット中のサブグループの発現プロフィール間のピアソンの相関が決定される。
差別的に発現されたプローブセットは、limma R パッケージ36に実装された(implemented )緩和されたt検定(moderated t-test)を使用して同定された。遺伝子は、調整されたp値が0.01未満(フォルスディスカバリーレート(False Discovery Rate)を使用して調整されたp値)だった場合、著しく差別的に発現すると考えられる。
生存率分析は前立腺摘除の後の生化学的再発をエンドポイントとして、コックス比例ハザード・モデル(Cox proportional hazards models)およびKaplan-Meier評価(Kaplan-Meier estimator)を使用して行なわれた。1人の患者当たりいくつかのサンプルが利用可能だった時、腫瘍組織の最も高い割合を備えたサンプルだけが使用された。正常組織からの発現プロフィールは含まれなかった。多変数の生存率分析は、臨床の共変量グリーソン・グレード(≦7および>7)、病理学的病期(T1/T2およびT3/T4)およびPSAレベル(≦10および>10)で行なわれた。発明者は、ヘヴィサイド関数(heavyside function)での変数の生成物として、比例ハザード仮定(MSKCCの中のT-病期)を満たさなかった変数をモデル化した:
Figure 0007365899000002
ここでt0は時間閾値である。ヘヴィサイド関数での予測の増加は、予測を時間区間に分割し、拡張コックス・モデルがそれについて異なる危険比率を計算した。
DESNTメンバーシップの最適な予測の算出
DESNTメンバーシップの最適な予測を引き出すために、それらが比較可能なように、データセットが調製された:関連する遺伝子がすべてのマイクロアレイ・プラットフォームで見つけられた場合のみプローブは保持された。1つの無作為に選ばれたプローブだけが、1つの遺伝子当たり保持された。また、バッチ効果はComBat アルゴリズム34を使用して調節した。MSKCCデータセットは、トレーニング・セットとして使用され、他のデータセットはテスト・セットとして使用された。遺伝子選択は、glmnet R パッケージ37の中で実装された、正則化された一般的な線形モデル・アプローチ(LASSO)を使用して、5つのマイクロアレイ・データセット(1669の遺伝子)の合計の少なくとも2つのDESNTの中で、著しくアップまたはダウンレギュレートされたすべての遺伝子から始めて行なわれた。LASSOは、100回実行された。また、実行の少なくとも25%で選択された遺伝子だけが保持された。その後、最適な予測は、ランダムフォレスト R パッケージ39の中で実装されたランダムフォレストモデル38を使用して導き出された。デフォルトパラメーターが使用され、ツリーの数は10001にセットされた。クラスサイズの不均衡は、大多数のクラスのサンプリングを少数のクラスの度数に減らすことにより調節された。
実施例2
DESNTシグネチャーの存在は不良な臨床結果を予測する。従来の研究では、発現マイクロアレイ・データセットの最適なデコンポジションは3から8の基本的なプロセスを使用して行なわれた。8つのプロセスへのMSKCCデータセットのデコンポジションの例は、図13aに示され、プロセスがそれぞれ棒グラフによって表わされる。サンプルは8つのプロセスすべてで表わされる。また、各棒の高さは、各LPDプロセスに割り当てることができるシグネチャーの割合(γまたはpi)に相当する。LPDプロセス7は、各サンプルの中で同定されたDESNT発現シグネチャーのパーセンテージを示し、図13bおよび13dの中で示されるように、DESNTシグネチャーが最も豊富だった時、個々の癌が「DESNT癌」として割り当てられる。PSA再発について、DESNT癌の患者は、同じデータセット中の他の癌に比べて、常により不良な結果を示した。含意は、それが不良な結果を与えるDESNTシグネチャーを含んでいる癌の部位の存在であるということである。このモデルは、MSKCCデータセットのために図13Cで示されるもののような、DESNTシグネチャーのより小さな寄与を含んでいる癌がさらにより不良な結果を示すに違いないと予測する。
この予測をテストする力を高めるため、MSKCC、CancerMap、StephensonおよびCamCapからの癌からのこのデータが組み合わされた(n=515)。連続変数としてDESNTプロセスに割り当てられた発現の割合(γ)を処理し、発明者は、それがPSA再発(P=2.66x10-15、HR=1.5、95% CI=[1.35,1.66]、コックス比例ハザード回帰モデル)と重要な関連を持つことを見いだした。γが増加するとともに、結果はより悪くなった。これは、癌を存在するDESNTプロセスの割合に基づいた4つのグループに分割することにより説明され(図14a)、PSA再発のない生存は、以下のとおり(図14b)である;
(i) DESNT癌無し、70か月で74.4%。
(ii) 0.3未満のγ、70か月で63.1%;
(iii) 0.3から0.6のγ、70か月で45.5%、および(iv)>0.60のγ、70か月で20.4%(図14b)。
全体的に癌の47%は少なくとも幾分のDESNT癌を含んでいた(図14a)。
PSA再発を予測するDESNTノモグラム
DESNT癌の割合は、Cox比例ハザードモデルで他の臨床の変数(グリーソン・グレード、PSAレベル、病理学的病期および外科的マージンステータス)と組み合わされ、330の癌のコンバイン・データセットとフィッティングされた。DESNTγは、グリーソン・グレード=4+3(P=1.8x10-3、HR=3.26、95% CI=[1.55,6.86])、およびグリーソン・グレード>7(P<1x10-4、HR=5.41、95% CI=[2.46,11.92]、病理学的病期(P=2.45x10-2、HR=1.62、95% CI=[1.06,2.48])、陽性の外科的マージン(P=1.74x10-2、HR=1.69、95% CI=[1.10,2.60]))と共に、より悪い臨床の結果(P=3x10-4、HR=1.30、95% CI=[1.13,1.50]、図16a、b)の独立予測因子だった。予測としてのPSAレベルは、統計的有意差(P=0.1145、HR=1.13、95% CI=[0.97,1.32])の我々の閾値未満だった。この生存モデルを使用して、他の変数とともにDESNT癌への使用のための、前立腺摘除後の、1、3、5および7年での生化学的再発のリスクを予測するノモグラムが考案された(図15、図16)。内的妥当性(internal validation)では、ノモグラムはブートストラップ-補正された0.761のC指標、外的妥当性(external validation)ではCamCapデータセットで、0.799のC指標を得た。
Figure 0007365899000003



Figure 0007365899000004



Figure 0007365899000005


Figure 0007365899000006


Figure 0007365899000007
Figure 0007365899000008
Figure 0007365899000009
Figure 0007365899000010
Figure 0007365899000011

Figure 0007365899000012

Figure 0007365899000013

Figure 0007365899000014

Figure 0007365899000015
Figure 0007365899000016
Figure 0007365899000017
表8:
DESNT癌の患者の不良な臨床結果
各データセットについて、DESNTおよび非DESNT癌について報告されたPSA再発間で比較された。LPD、ラテントプロセスデコンポジション;RF-ランダムフォレスト。LPDについては、ログランク p値は、方法に述べられているように100の独立したLPD検定から選ばれたモーダルLPD検定を表す。多変量分析については、グリーソンおよび臨床病期データだけが利用可能なTCGAデータセットを例外として、診断時のグリーソン、PSAおよび病理学的病期がすべてがデータセットに含まれている。完全な分析は図7に示される。
Figure 0007365899000018
拡張データテーブル
拡張データテーブル1:
DESNT癌グループ中の変更された発現を示す遺伝子。
各データセットについては、非DESNTグループと比較されたDESNT癌グループ中の著しく変化した発現(p<0.05)を示す遺伝子が計算された:p値は複数の試験のために補正された。LPDは、異なる無作為に選択されたシード値を使用して、各データセットのために再度100回実行された。4つのデータセットすべてについて、少なくとも80/100実施での発現が変化した45の遺伝子について結果がリストされる。遺伝子がそれぞれ著しく発現が変化した実施の正確な数が示される。DESNT癌グループの中のすべての遺伝子はダウンレギュレートされた。強調は、その生成物が以下のコンポーネントであるかリンクされた遺伝子を表わす:細胞骨格(太字);付着、インテグリンおよび細胞間マトリックス(下線)、転写因子および翻訳レギュレーター(二重下線)、およびイオンチャネル(点線の下線)。シンボル:* 癌の中のCpGメチル化によるダウンレギュレーション;**前立腺癌中のCpGメチル化によるダウンレギュレーション;†不良な結果に関係するCpGメチル化;‡の前立腺癌の機能的な接続性ハブ;|| 前立腺癌にフォーカスされた遺伝子遺伝子相互作用。
Figure 0007365899000019
拡張データテーブル2:
20の遺伝子ランダムフォレストクラシファイヤー。5つのデータセット(MSKCC、CancerMap、Stephenson、KleinおよびCamCap)の内少なくとも2つのデータセットでDESNT癌中で著しく変化した発現を示す1669の遺伝子のリストが、出発点として使用された。lassoロジスティク回帰モデルを適用し、MSKCCデータセット内のDESNTメンバーシップを予測し、この表に示される20の遺伝子のセットを選択した。各遺伝子については、ランダムフォレスト分類を行なう場合の変数としての重要性も記録される。
Figure 0007365899000020
補助情報表
補助情報表1:
差別的メチル化
TCGAデータセットの中で同定されたDENSTおよび非DESNT癌の間の差別的メチル化が示される。DESNT癌は、ランダムフォレスト分類を使用して、拡張データ表2に示される20の遺伝子シグネチャーを使用して同定された。その後、我々は、Rパッケージに実装された「methyAnalysis」(http://www.bioconductor.org/packages/release/bioc/html/methyAnalysis.html)で、差別的にメチル化された部位(DMR)を検知する方法を適用した。有意な結果がリストされる。
Figure 0007365899000021
Figure 0007365899000022
補助情報表2:
CancerMapデータセットの臨床的特徴
Figure 0007365899000023

補助情報表3:差別的に発現した遺伝子の機能
45の遺伝子のリストは、MSKCC、Stephenson、CancerMapおよびKleinデータセットの中で同定されたDESNT癌で共通してダウンレギュレートした。
Figure 0007365899000024
Figure 0007365899000025
Figure 0007365899000026
補足データ
補足データ:
CancerMapデータセット中のサンプルの臨床および分子の特性。この出願で提供される情報を使用することを可能にするために、この表が分割されたことに注意。それぞれのカラムは、列、サンプルID、ドナーID、バッチ、試料タイプ、抽出方法、センター、ERG FISHステータス、腫瘍パーセンテージ、人種・民族、診断時の年齢、病理学病期、病理学的サブステージ、PSAプレ-前立腺摘除、グリーソンスコア、マージン、嚢外伸展(Extra Capsular Extension)、BCR フリータイム月(BCR FreeTime months)、BCRイベントおよびICGCカテゴリーを含む。
Figure 0007365899000027
Figure 0007365899000028
Figure 0007365899000029
Figure 0007365899000030
Figure 0007365899000031
Figure 0007365899000032
Figure 0007365899000033
Figure 0007365899000034
Figure 0007365899000035
Figure 0007365899000036
上記の表中、マージンの欄における「Normal」、「Tumour」、「Low Tumour」、「Stroma」は、それぞれ「正常」、「腫瘍有」、「少量の腫瘍」、「間質」であり、センターの欄における「Cambridge」は、「ケンブリッジ」であり、抽出方法の欄における「Trizol」は「トリゾール」であり、ERG FISHステータスの欄における「MixedEdel」、「MixedEsplit」、「MixedPloidy」、「MixedRearrangement」は、それぞれ「混合Edel」、「混合Esplit」、「混合Ploidy」、「混合リアレンジメント」であり、人種・民族の欄の「White - British」、「Turkish」、「Black or Black British - Caribbean」、「White - Other」、「Black or Black British - African」、「White - Irish」はそれぞれ、「白人-英国人」、「トルコ人」、「黒人または黒人英国人-カリブ人」、「白人-その他」、「黒人または黒人英国人-アフリカ人」、「白人-アイルランド人」である。
Figure 0007365899000037
Figure 0007365899000038
Figure 0007365899000039
Figure 0007365899000040
Figure 0007365899000041
Figure 0007365899000042
Figure 0007365899000043
Figure 0007365899000044
Figure 0007365899000045
Figure 0007365899000046
上記の表中、マージンの欄における、「negative margins」、「Positive circumferential」、「Negative」、「Positive base」、「positive Apex margin」、「positive apex & circumferential margin」、「positive circumferential margin」、「positive apex」、「positive base margin」、「Positive base & circumferential」、「Positive complex」は、それぞれ「ネガティブマージン」、「ポジィティブサーカムフェレンシャル」、「ネガティブ」、「ポジィティブベース」、「ポジィティブアペックスマージン」、「ポジィティブアペックスアンドサーカムフェレンシャルマージン」、「ポジィティブサーカムフェレンシャルマージン」、「ポジィティブアペック」、「ポジィティブベースマージン」、「ポジィティブベースアンドサーカムフェレンシャル」、「ポジィティブコンプレックス」であり、嚢外伸展の欄の「Unknown」は、「未知」であり、BCRイベントの欄の「FALSE」、「TRUE」、はそれぞれ「偽」、「真」であり、ICGCカテゴリーの欄の、「normal」、「unknown」はそれぞれ、「正常」、「未知」である。
本発明は以下の実施態様を含む。
実施態様第1項:以下を含む、癌を分類する方法、または癌の進行を予測する方法:
a) 患者から得られたサンプル中の複数の遺伝子の発現ステータスを決定し、患者の発現プロフィールを提供すること;
b) 統計のベイズのクラスタリング分析あるいは他のクラスタリング分析を、患者の発現プロフィールおよび異なる患者からの同じ複数の遺伝子についての参照データセットについて行うこと;
c) 任意に複数回、分析ステップb)を繰り返すこと;および
d) 癌を分類すること、または癌の進行を予測すること。
実施態様第2項:前記ステップb)が少なくとも2回、少なくとも3回、少なくとも5回、少なくとも20回、少なくとも50回、あるいは少なくとも100回繰り返される、実施態様第1項記載の方法。
実施態様第3項:異なるランダムなシードが各クラスタリング分析に使用される、実施態様第2項記載の方法。
実施態様第4項:前記の複数の遺伝子の発現ステータスを決定することが、複数の遺伝子の発現レベルを決定することを含む、実施態様第1から3のいずれか1項記載の方法。
実施態様第5項:少なくとも50、少なくとも100、少なくとも200あるいは最も好ましくは少なくとも500の遺伝子について発現ステータスが決定される、実施態様第1から4のいずれか1項記載の方法。
実施態様第6項:統計分析を行なう前に、参照データセットに対して患者の発現プロフィールを正規化することをさらに含む、実施態様第1から5のいずれか1項記載の方法。
実施態様第7項:ステップa)の遺伝子が表1にリストされた遺伝子から選ばれる、実施態様第1から6のいずれか1項記載の方法。
実施態様第8項:前記ステップa)は、少なくとも20、少なくとも50、少なくとも100、少なくとも200、少なくとも500または少なくとも1000の遺伝子の発現ステータスを決定することを含む、実施態様第1から7のいずれか1項記載の方法。
実施態様第9項:前記ステップa)は、表1にリストされた遺伝子から選ばれる少なくとも100の遺伝子の発現ステータスを決定することを含む、実施態様第1から8のいずれか1項記載の方法。
実施態様第10項:前記ステップa)は、表1にリストされたすべての500の遺伝子の発現ステータスを決定することを含む、実施態様第1から9のいずれか1項記載の方法。
実施態様第11項:その発現ステータスが統計分析のために決定されている遺伝子の部分集合を選択するステップをさらに含む、実施態様第1から10のいずれか1項記載の方法。
実施態様第12項:遺伝子の部分集合内のそれぞれの遺伝子の発現ステータスが、癌患者のサンプルにより変化することが知られている、実施態様第11項記載の方法。
実施態様第13項:統計分析の前に、患者の発現プロフィールにユニークなラベルを付することをさらに含む、実施態様第1から12のいずれか1項記載の方法。
実施態様第14項:前記ステップd)が、患者の癌サンプルのDESNTステータスを決定することを含む、実施態様第1から13のいずれか1項記載の方法。
実施態様第15項:前記ステップd)が、患者の癌サンプルのDESNTステータスを決定することを含む、実施態様第1から14のいずれか1項記載の方法。
実施態様第16項:該参照データセット内のそれぞれの発現プロフィールのDESNTステータスが知られている、実施態様第1から15のいずれか1項記載の方法。
実施態様第17項:該患者の発現プロフィールが、統計分析の前に少なくとも2つの参照データセットと組み合わされる、実施態様第1から16のいずれか1項記載の方法。
実施態様第18項:統計分析がLPD分析である、実施態様第1から17のいずれか1項記載の方法。
実施態様第19項:LPD分析が個々の患者の発現プロフィールをグループに分ける、実施態様第18項記載の方法。
実施態様第20項:個々の患者の発現プロフィールをグループに分けることが、それぞれの発現プロフィールについて、LDP分析を使用して、個々の患者の発現プロフィールについて全体の発現プロフィールへの各グループの貢献(pi)を決定することを含む、実施態様第19項記載の方法。
実施態様第21項:該患者の発現プロフィールが、全体の発現プロフィールに最も貢献するグループへ、個々のグループが分けられる、実施態様第20項記載の方法。
実施態様第22項:患者の癌進行が、全体の発現プロフィールへのDESNTプロセスへの貢献(pi値)により予測される、実施態様第20または21項記載の方法。
実施態様第23項:全体の発現プロフィールへのDESNTプロセスへの貢献が、全体の発現プロフィールへの他のプロセスの貢献よりも大きい場合に、DESNT癌が予測される、実施態様第22項記載の方法。
実施態様第24項:全体の発現プロフィールへのDESNTプロセスへの貢献、患者の腫瘍のステージ、患者のグリーソンスコアおよび/または患者のPSAスコアにより、DESNT癌が予測される、実施態様第22項記載の方法。
実施態様第25項:患者の癌サンプルのDESNTプロセスに対するpi値が、少なくとも0.1、少なくとも0.2、少なくとも0.3、少なくとも0.4あるいは少なくとも0.5である場合、DESNT癌が予測される、実施態様第22項記載の方法。
実施態様第26項:グループがDESNTまたは非DESNTステータスに分けられる、実施態様第19項記載の方法。
実施態様第27項:1グループのみがDESNTステータスに分けられる、実施態様第26項記載の方法。
実施態様第28項:1または複数の参照データセットから、患者のサンプルグループがDESNT癌を有するとき、患者の癌が侵襲性と分類されるか、癌進行が予測される、実施態様第27項記載の方法。
実施態様第29項:統計分析が複数回行なわれ、統計分析の少なくとも60%の検定で、1または複数の参照データセットから患者のサンプルグループがDESNT癌を有するとき、患者の癌が侵襲性として分類され、癌進行が予測される、実施態様第27項記載の方法。
実施態様第30項:癌は前立腺癌である、実施態様第1から29のいずれか1項記載の方法。
実施態様第31項:以下を含む、癌を分類する方法、または癌の進行を予測する方法:
a) データセット中の個々の患者のサンプルの癌進行ステータスが知られている参照データセットを提供すること;
b) このデータセットから複数の遺伝子を選択すること、ここで複数の遺伝子が、表2にリストされたグループから選ばれた少なくとも5、少なくとも10、少なくとも20、少なくとも30、少なくとも40、あるいは少なくとも45の遺伝子を含むか、または表3にリストされたグループから選ばれた少なくとも5、少なくとも10、少なくとも15あるいは少なくとも20の遺伝子を含む;
c) 任意に:
(i) コントロールとして患者のサンプル中の少なくとも1つの異なる遺伝子の発現ステータスをさらに決定すること、ここでコントロール遺伝子は表2あるいは表3にリストされた遺伝子ではない;
(ii) 複数の遺伝子およびコントロール遺伝子の発現の相対的なレベルを決定すること;および
d) これらの選択された遺伝子の発現ステータスを使用し、データセットにスーパーバイズされた機械学習アルゴリズムを適用し、癌の進行の予測を得ること;
e) 患者から得られたサンプル中の同じ複数の遺伝子の発現ステータスを決定し、患者の発現プロフィールを提供すること;
f) 任意に、参照データセットに対して患者の発現プロフィールを正規化すること;および
g) 患者の発現プロフィールへ予測を適用し、癌を分類するか、または癌の進行を予測すること。
実施態様第32項:該複数の遺伝子が、表2にリストされたグループから選ばれた少なくとも5、少なくとも10、少なくとも20、少なくとも30、少なくとも40、あるいは少なくとも45の遺伝子を含む、実施態様第31項記載の方法。
実施態様第33項:該複数の遺伝子が、表3にリストされたグループから選ばれた少なくとも5、少なくとも10、少なくとも15あるいは少なくとも20の遺伝子を含む、実施態様第31項記載の方法。
実施態様第34項:前記の発現の相対的なレベルを決定することが、患者のデータセットと参照データセットのそれぞれの遺伝子対の発現の比率を決定することを含む、実施態様第31から33のいずれか1項記載の方法。
実施態様第35項:該機械学習アルゴリズムがランダムフォレスト分析である、実施態様第31から34のいずれか1項記載の方法。
実施態様第36項:データセット中の個々の患者のサンプルの癌進行ステータスは、癌のDESNTステータスによって知られる、実施態様第31から35のいずれか1項記載の方法。
実施態様第37項:癌のDESNTステータスはLPDを含む分析を使用して、あらかじめ決定されている、実施態様第31から36のいずれか1項記載の方法。
実施態様第38項:癌のDESNTステータスは、実施態様第1から23のいずれか1項記載の方法を使用してあらかじめ決定されている、実施態様第37項記載の方法。
実施態様第39項:癌の分類または癌進行の予測は、癌のDESNTステータスを決定することを含む、実施態様第31から36のいずれか1項記載の方法。
実施態様第40項:少なくとも1つのコントロール遺伝子は表6あるいは表7にリストされた遺伝子である、実施態様第31から39のいずれか1項記載の方法。
実施態様第41項:少なくとも2つのコントロール遺伝子の発現ステータスが決定される、実施態様第31から40のいずれか1項記載の方法。
実施態様第42項:以下を含む、癌を分類する方法、または癌の進行を予測する方法:
a) データセット中の個々の患者の癌進行ステータスが知られている参照データセット(例えばLPD分析によって決定される)を提供すること;
b) このデータセットから複数の遺伝子を選択すること;
c) これらの選択された遺伝子の発現ステータスを使用し、データセットにスーパーバイズされた機械学習アルゴリズムを適用し、癌の進行の予測を得ること;
d) 患者から得られたサンプル中の同じ複数の遺伝子の発現ステータスを決定し、患者の発現プロフィールを提供すること;
e) 任意に参照データセットへ患者の発現プロフィールを正規化すること;および
f) 患者の発現プロフィールへ予測を適用し、癌を分類するか、または癌の進行を予測すること。
実施態様第43項:データセット中の個々の患者のサンプルの癌進行ステータスが、癌のDESNTステータスによって知られている、実施態様第42項記載の方法。
実施態様第44項:癌のDESNTステータスはLPDを含む分析を使用してあらかじめ決定されている、実施態様第42または43項記載の方法。
実施態様第45項:癌のDESNTステータスは、実施態様第1から23のいずれか1項記載の方法を使用してあらかじめ決定されている、実施態様第44項記載の方法。
実施態様第46項:該スーパーバイズされた機械学習アルゴリズムがランダムフォレスト分析である、実施態様第42から45のいずれか1項記載の方法。
実施態様第47項:癌の分類または癌進行の予測は、癌のDESNTステータスを決定することを含む、実施態様第42から46のいずれか1項記載の方法。
実施態様第48項:少なくとも10、少なくとも20、少なくとも30、少なくとも40あるいは少なくとも50の遺伝子が、ステップb)で選択される、実施態様第42から47のいずれか1項記載の方法。
実施態様第49項:ステップb)で選択された遺伝子が、進行しているかまたは進行するだろう癌内でダウンレギュレートされる、実施態様第42から48のいずれか1項記載の方法。
実施態様第50項:ステップb)で選択された遺伝子が、表2にリストされたグループから選ばれた少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも30、少なくとも40、あるいは45のすべての遺伝子を含む、実施態様第42から49のいずれか1項記載の方法。
実施態様第51項:以下を含む、癌を分類する方法、または癌の進行を予測する方法:
a) データセット中の個々の患者のサンプルのDESNTステータスが知られている1以上の参照データセット(例えばLPD分析によって決定される)を提供すること;
b) このデータセットから、発現ステータスが癌が進行しているかまたは進行するだろう癌と、癌が進行していないかまたは進行しないだろう癌との間で発現ステータスが変化することが知られている複数の遺伝子を選択すること、;
c) 選択された遺伝子にLASSOロジスティク回帰モデル分析を適用し、癌進行が予測された選択された遺伝子の部分集合を同定すること;
d) 選択された遺伝子のこの部分集合の発現ステータスを使用し、スーパーバイズされた機械学習アルゴリズムをデータセットに適用し、DESNT癌についての予測を得ること;
e) 患者から得られたサンプル中の選択された遺伝子の部分集合の発現ステータスを決定し、患者の発現プロフィールを提供すること;
f) 任意に1または複数の参照データセットへ患者の発現プロフィールを正規化すること;および
g) 患者の発現プロフィールへ予測を適用し、癌を分類するか、または癌の進行を予測すること。
実施態様第52項:データセット中の個々の患者のサンプルの癌進行ステータスが、癌のDESNTステータスによって知られている、実施態様第51項記載の方法。
実施態様第53項:癌のDESNTステータスはLPDを含む分析を使用してあらかじめ決定されている、実施態様第51または52項記載の方法。
実施態様第54項:癌のDESNTステータスは、実施態様第1から23のいずれか1項記載の方法を使用してあらかじめ決定されている、実施態様第53項記載の方法。
実施態様第55項:複数の遺伝子が表4にリストされた少なくとも100、少なくとも200、少なくとも300、少なくとも400、少なくとも500あるいは少なくとも1000の遺伝子である、実施態様第51から54のいずれか1項記載の方法。
実施態様第56項:癌のDESNTステータスによって、遺伝子が癌進行を予測する、実施態様第51から55のいずれか1項記載の方法。
実施態様第57項:該スーパーバイズされた機械学習アルゴリズムがランダムフォレスト分析である、実施態様第51から56のいずれか1項記載の方法。
実施態様第58項:癌の分類または癌進行の予測は、癌のDESNTステータスを決定することを含む、実施態様第51から57のいずれか1項記載の方法。
実施態様第59項:癌は前立腺癌である、実施態様第1から58のいずれか1項記載の方法。
実施態様第60項:サンプルは、尿サンプル、精液サンプル、前立腺の滲出液サンプル、あるいは前立腺に由来する高分子または細胞を含んでいる任意のサンプル、全血サンプル、漿液サンプル、唾液、あるいは生検試料である、実施態様第1から59のいずれか1項記載の方法。
実施態様第61項:サンプルは前立腺生検、前立腺摘除あるいはTURPサンプルである、実施態様第60項記載の方法。
実施態様第62項:患者からサンプルを得ることをさらに含む、実施態様第1から61のいずれか1項記載の方法。
実施態様第63項:少なくとも2、少なくとも3、または少なくとも5のサンプルに対して方法が実行される、実施態様第1から62のいずれか1項記載の方法。
実施態様第64項:方法は多数の患者サンプルに対して同時に行われる、実施態様第63項記載の方法。
実施態様第65項:方法は多数の患者サンプルに対して同時に行われる、実施態様第63項記載の方法。
実施態様第66項:1または複数のデータセットが複数の腫瘍、あるいは患者の発現プロフィールを含む、実施態様第1から65のいずれか1項記載の方法。
実施態様第67項:データセットは各々少なくとも20、少なくとも50、少なくとも100、少なくとも200、少なくとも300、少なくとも400あるいは少なくとも500の患者もしくは腫瘍発現プロフィールを含む、実施態様第66項記載の方法。
実施態様第68項:患者または腫瘍の発現プロフィールは、少なくとも10、少なくとも40、少なくとも100、少なくとも500、少なくとも1000、少なくとも1500、少なくとも2000、少なくとも5000あるいは少なくとも10000の遺伝子の発現ステータスについての情報を含む、実施態様第66または67項記載の方法。
実施態様第69項:患者または腫瘍の発現プロフィールは、少なくとも10、少なくとも40、少なくとも100、少なくとも500、少なくとも1000、少なくとも1500、少なくとも2000、少なくとも5000あるいは少なくとも10000の遺伝子の発現レベルについての情報を含む、実施態様第66または67項記載の方法。
実施態様第70項:実施態様第1から69のいずれか1項記載の方法によって診断がされた患者へ、治療薬を投与することを含む癌を治療する方法。
実施態様第71項:a. 患者のサンプルを提供すること;
b. 実施態様第1から69のいずれか1項で定義される方法による癌進行の予測をすること;および
c. ステップbの予測の結果により、癌進行が予測されるか、検知されるか、疑われる場合に、患者へ癌の治療薬を投与することを含む、実施態様第70項記載の方法。
実施態様第72項:実施態様第1から69のいずれか1項で定義される方法による癌進行の予測をすることを含む、癌の診断方法。
実施態様第73項:実施態様第1から72のいずれか1項記載の方法を実行するように構成されたコンピュータ装置。
実施態様第74項:実施態様第1から72のいずれか1項記載の方法を実行するようにプログラムされたコンピュータ読み取り可能なメディア。
実施態様第75項:表2にリストされた遺伝子を少なくとも5、少なくとも10、少なくとも20、少なくとも30、少なくとも40あるいは45のすべてを含むバイオマーカー・パネル。
実施態様第76項:表2にリストされた遺伝子を少なくとも40含む、実施態様第75項記載のバイオマーカー・パネル。
実施態様第77項:表2にリストされた45遺伝子のすべてを含む、実施態様第75項記載のバイオマーカー・パネル。
実施態様第78項:表3にリストされた遺伝子を少なくとも5、少なくとも10、少なくとも15、あるいは20のすべてを含むバイオマーカー・パネル。
実施態様第79項:表3にリストされた遺伝子を少なくとも15含む、実施態様第78項記載のバイオマーカー・パネル。
実施態様第80項:表3にリストされた20遺伝子のすべてを含む、実施態様第78項記載のバイオマーカー・パネル。
実施態様第81項:表1にリストされた遺伝子を 少なくとも10、少なくとも15、少なくとも20、少なくとも50、少なくとも100、少なくとも200、少なくとも300、少なくとも400あるいは500のすべてを含むバイオマーカー・パネル。
実施態様第82項:表1にリストされた遺伝子を 少なくとも400含む、実施態様第81項記載のバイオマーカー・パネル。
実施態様第83項:表1にリストされた500遺伝子のすべてを含む、実施態様第81項記載のバイオマーカー・パネル。
実施態様第84項:表5にリストされた遺伝子を少なくとも5,少なくとも10、少なくとも20、少なくとも30、あるいは35のすべてを含むバイオマーカー・パネル。
実施態様第85項:表5にリストされた遺伝子を少なくとも30含む、実施態様第84項記載のバイオマーカー・パネル。
実施態様第86項:表5にリストされた35遺伝子のすべてを含む、実施態様第84項記載のバイオマーカー・パネル。
実施態様第87項:実施態様第1から69のいずれか1項記載の方法によって調製されたバイオマーカー・パネル。
実施態様第88項:癌の診断での使用、あるいは癌進行の予測での使用のための、実施態様第75から87のいずれか1項記載のバイオマーカー・パネル。
実施態様第89項:癌の診断または予後を予測する方法、癌進行の予測方法、または癌の分類方法における、実施態様第75から87のいずれか1項記載のバイオマーカー・パネル。
実施態様第90項:実施態様第75から87のいずれか1項記載のバイオマーカー・パネルにおいて、遺伝子の発現レベルまたは発現ステータスを決定することを含む、癌の診断または予後を予測する方法、癌進行の予測方法、または癌の分類方法。
実施態様第91項:測定されたバイオマーカーの発現レベルまたは発現ステータスを1つ以上の参照遺伝子と比較することをさらに含む、実施態様第90項記載の方法。
実施態様第92項:1つ以上の参照遺伝子がハウスキーピング遺伝子である、実施態様第91項記載の方法。
実施態様第93項:ハウスキーピング遺伝子が表6あるいは表7の中の遺伝子から選ばれる、実施態様第92項記載の方法。
実施態様第94項:測定されたバイオマーカーの発現レベルまたは発現ステータスを比較することを含む、実施態様第93項記載の方法。
実施態様第95項:バイオマーカー・パネルは、表2にリストされた遺伝子の少なくとも5、少なくとも10、少なくとも20、少なくとも30、少なくとも40あるいは45のすべてを含むか、または表5にリストされた遺伝子の少なくとも5、少なくとも10、少なくとも20、少なくとも30あるいは35のすべてを含み、
参照との発現レベルまたは発現ステータスの比較は、健康な人または、進行しているかもしくは進行するだろう癌を持っていない患者からのサンプル内の1または複数の同じ遺伝子の発現レベルまたは発現ステータスを比較することを含む、実施態様第94項記載の方法。
実施態様第96項:遺伝子の発現レベルまたは発現ステータスの比較は、前記の患者からのものを使用する、実施態様第90から95のいずれか1項記載の方法。
実施態様第97項:実施態様第1から69のいずれか1項で定義された方法により統計分析を行う、実施態様第90項記載の方法。
実施態様第98項:実施態様第75から87のいずれか1項で定義されたバイオマーカー・パネルからの少なくとも5つの遺伝子の発現レベルまたは発現ステータスを検知するための手段を含むキット。
実施態様第99項:実施態様第75から87のいずれか1項で定義されたバイオマーカー・パネルのすべての遺伝子の発現レベルまたは発現ステータスを検知するための手段を含む、実施態様第98項記載のキット。
実施態様第100項:1以上のコントロールあるいは参照遺伝子の発現レベルまたは発現ステータスを検知するための手段をさらに含む、実施態様第98または99項記載のキット。
実施態様第101項:使用のための指示をさらに含む、実施態様第98から100のいずれか1項記載のキット。
実施態様第102項:実施態様第74で定義されたコンピュータ読み取り可能なメディアをさらに含む、実施態様第98から101のいずれか1項記載のキット。
実施態様第103項:実施態様第75から87のいずれか1項で定義されたバイオマーカー・パネルからの少なくとも5つの遺伝子の発現レベルまたは発現ステータスを検知するように構成されたバイオセンサー。
実施態様第104項:実施態様第75から87のいずれか1項で定義されたバイオマーカー・パネルのすべての遺伝子の発現レベルまたは発現ステータスを検知するように構成された、実施態様第103項記載のバイオセンサー。
実施態様第105項:1以上のコントロールあるいは参照遺伝子の発現レベルまたは発現ステータスを検知するように構成される、実施態様第103または104項記載のバイオセンサー。
実施態様第106項:バイオセンサーはマイクロアレイである、実施態様第103から105のいずれか1項記載のバイオセンサー。
実施態様第107項:実施態様第103から106のいずれか1項で定義されたバイオセンサーを含む、実施態様第98から102のいずれか1項記載のキット。

参考文献
1. D'Amico, A. V., Moul, J., Carroll, P. R. & Sun, L. Cancer-specific mortality after surgery or radiation for patients with clinically localized prostate cancer managed during the prostate-specific antigen era. J. Clin. Oncol. 21, 2163-2172 (2003).
2. Buyyounouski, M. K., Pickles, T. & Kestin, L. L. Validating the interval to biochemical failure for the identification of potentially lethal prostate cancer. J. Clin. Oncol. 30, 1857-1863 (2012).
3. Draisma, G. et al. Lead time and overdiagnosis in prostate-specific antigen screening: importance of methods and context. J. Natl. Cancer Inst. 101, 374-383 (2009).
4. Etzioni, R., Gulati, R., Mallinger, L. & Mandelblatt, J. Influence of study features and methods on overdiagnosis estimates in breast and prostate cancer screening. Ann. Intern. Med. 158, 831-838 (2013).
5. Sorlie, T. et al. Repeated observation of breast tumor subtypes in independent gene expression data sets. Proc. Natl. Acad. Sci. U.S.A. 100, 8418-8423 (2003).
6. Taylor, B. S. et al. Integrative genomic profiling of human prostate cancer. Cancer Cell 18, 11-22 (2010).
7. Ross-Adams, H. et al. Integration of copy number and transcriptomics provides risk stratification in prostate cancer: A discovery and validation cohort study. EBioMedicine 2, 1133-1144 (2015).
8. Carrivick, L. et al. Identification of prognostic signatures in breast cancer microarray data using Bayesian techniques. J R Soc Interface 3, 367-381 (2006).
9. Glinsky, G. V., Glinskii, A. B., Stephenson, A. J., Hoffman, R. M. & Gerald, W. L. Gene expression profiling predicts clinical outcome of prostate cancer. J. Clin. Invest. 113, 913-923 (2004).
10. Erho, N. et al. Discovery and validation of a prostate cancer genomic classifier that predicts early metastasis following radical prostatectomy. PLoS ONE 8, e66855 (2013).
11. Cuzick, J. et al. Prognostic value of an RNA expression signature derived from cell cycle proliferation genes in patients with prostate cancer: a retrospective study. Lancet Oncol. 12, 245-255 (2011).
12. Ramos-Montoya, A. et al. HES6 drives a critical AR transcriptional programme to induce castration-resistant prostate cancer through activation of an E2F1-mediated cell cycle network. EMBO Molecular Medicine n/a-n/a (2014). doi:10.1002/emmm.201303581
13. Tomlins, S. A. et al. Characterization of 1577 primary prostate cancers reveals novel biological and clinicopathologic insights into molecular subtypes. Eur. Urol. 68, 555-567 (2015).
14. You, S. et al. Integrated classification of prostate cancer reveals a novel luminal subtype with poor outcome. Cancer Res. (2016). doi:10.1158/0008-5472.CAN-16-0902
15. Blei, D. M., Ng, A. Y. & Jordan, M. I. Latent dirichlet allocation. the Journal of machine Learning research (2003).
16. Boutros, P. C. et al. Spatial genomic heterogeneity within localized, multifocal prostate cancer. Nat. Genet. (2015). doi:10.1038/ng.3315
17. Clark, J. et al. Complex patterns of ETS gene alteration arise during cancer development in the human prostate. Oncogene 27, 1993-2003 (2008).
18. Cooper, C. S. et al. Analysis of the genetic phylogeny of multifocal prostate cancer identifies multiple independent clonal expansions in neoplastic and morphologically normal prostate tissue. Nat. Genet. 47, 367-372 (2015).
19. Svensson, M. A. et al. Testing mutual exclusivity of ETS rearranged prostate cancer. Lab. Invest. 91, 404-412 (2011).
20. Cancer Genome Atlas Research Network. The Molecular Taxonomy of Primary Prostate Cancer. Cell 163, 1011-1025 (2015).
21. Olmos, D. et al. Prognostic value of blood mRNA expression signatures in castration-resistant prostate cancer: a prospective, two-stage study. Lancet Oncol. 13, 1114-1124 (2012).
22. Klein, E. A., Yousefi, K., Haddad, Z., Choeurng, V. & Buerki, C. A genomic classifier improves prediction of metastatic disease within 5 years after surgery in node-negative high-risk prostate cancer patients managed by …. Eur. Urol. (2015).
23. Stephenson, A. J. et al. Integration of gene expression profiling and clinical variables to predict prostate carcinoma recurrence after radical prostatectomy. Cancer 104, 290-298 (2005).
24. Ramaswamy, S., Ross, K. N., Lander, E. S. & Golub, T. R. A molecular signature of metastasis in primary solid tumors. Nat. Genet. 33, 49-54 (2003).
25. Klein, E. A. et al. A 17-gene assay to predict prostate cancer aggressiveness in the context of Gleason grade heterogeneity, tumor multifocality, and biopsy undersampling. Eur. Urol. 66, 550-560 (2014).
26. Tomlins, S. A. et al. Recurrent fusion of TMPRSS2 and ETS transcription factor genes in prostate cancer. Science 310, 644-648 (2005).
27. Weischenfeldt, J. et al. Integrative genomic analyses reveal an androgen-driven somatic alteration landscape in early-onset prostate cancer. Cancer Cell 23, 159-170 (2013).
28. Park, K. et al. TMPRSS2:ERG Gene Fusion Predicts Subsequent Detection of Prostate Cancer in Patients With High-Grade Prostatic Intraepithelial Neoplasia. J. Clin. Oncol. 32, 206-211 (2014).
29. Friedl, P., Locker, J., Sahai, E. & Segall, J. E. Classifying collective cancer cell invasion. Nat. Cell Biol. 14, 777-783 (2012).
30. Schroder, F. H. et al. Screening and prostate cancer mortality: results of the European Randomised Study of Screening for Prostate Cancer (ERSPC) at 13 years of follow-up. Lancet 384, 2027-2035 (2014).
31. Warren, A. Y. et al. Method for sampling tissue for research which preserves pathological data in radical prostatectomy. Prostate 73, 194-202 (2013).
32. Jhavar, S. et al. Detection of TMPRSS2-ERG translocations in human prostate cancer by expression profiling using GeneChip Human Exon 1.0 ST arrays. J Mol Diagn 10, 50-57 (2008).
33. Irizarry, R. A. et al. Exploration, normalization, and summaries of high density oligonucleotide array probe level data. Biostatistics 4, 249-264 (2003).
34. Johnson, W. E., Li, C. & Rabinovic, A. Adjusting batch effects in microarray expression data using empirical Bayes methods. Biostatistics (2007).
35. Rogers, S., Girolami, M., Campbell, C. & Breitling, R. The latent process decomposition of cDNA microarray data sets. IEEE/ACM Trans Comput Biol Bioinform 2, 143-156 (2005).
36. Ritchie, M. E. et al. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Res. 43, e47 (2015).
37. Friedman, J., Hastie, T. & Tibshirani, R. Regularization paths for generalized linear models via coordinate descent. Journal of statistical software (2010).
38. Breiman, L. Random forests. Machine learning (2001).
39. Liaw, A. & Wiener, M. Classification and regression by randomForest. R news (2002).

Claims (9)

  1. 以下を含む、前立腺癌の進行を予測するための方法:
    a) 患者から得られたサンプル中の表1から選択された少なくとも100の遺伝子の発現ステータスを決定し、患者の発現プロフィールを提供すること、ここで前記の少なくとも100の遺伝子は前立腺癌により発現レベルが変わることが知られている;
    b) ラテントプロセスデコンポジション(LPD)分析を、患者の発現プロフィールおよび異なる患者からの同じ少なくとも100の遺伝子についての参照データセットについて行うこと;
    c) 任意に複数回、分析ステップb)を繰り返すこと;および
    d) 前立腺癌の進行を予測すること、
    ここで、LPD分析が個々の患者の発現プロフィールをグループに分け、
    該グループは予後不良(DESNT)または予後不良ではない(非DESNT)ステータスに分けられ、
    それぞれの発現プロフィールについて、LPD分析が個々の患者の発現プロフィールについて、全体の発現プロフィールへの各グループの貢献(pi)を決定する、
    ここで、
    患者の前立腺癌進行が、全体の患者の発現プロフィールへの予後不良(DESNT)のグループの貢献(pi値)により予測され、全体の患者の発現プロフィールへの予後不良(DESNT)のグループの貢献(pi値)が高いほど悪い予測とされる;
    患者の癌サンプルの予後不良(DESNT)のグループに対するpi値が、少なくとも0.1である場合、前立腺癌の進行が予測される;または
    1または複数の参照データセットから、患者のサンプルが予後不良(DESNT)の癌とグループ化された時、癌進行が予測される。
  2. 前記ステップa)が、表1から選択された500の遺伝子の発現ステータスを決定することを含む、請求項1記載の方法。
  3. 以下のいずれかを含む、請求項1または2記載の方法:
    a. 該患者の発現プロフィールが、全体の発現プロフィールに最も貢献するグループにより個々のグループに分けられる;
    b. 全体の発現プロフィールへの予後不良(DESNT)のグループの貢献が、全体の発現プロフィールへの他のグループの単一での貢献よりも大きい場合に、前立腺癌の進行が予測される;
    c. 全体の発現プロフィールへの予後不良(DESNT)のグループの貢献、患者の腫瘍のステージ、患者のグリーソンスコアおよび/または患者のPSAスコアにより、前立腺癌の進行が予測される;
    d. 1グループのみが予後不良(DESNT)のステータスに分けられる;
    e. PLD分析が複数回行なわれ、PLD分析の少なくとも60%の検定で、1または複数の参照データセットから予後不良(DESNT)の癌とグループ化された時、癌進行が予測される;
    f. 前記請求項1のステップb)が少なくとも2回繰り返される
    g. 異なるランダムなシードが各クラスタリング分析に使用される;
    h. 複数の遺伝子の発現ステータスを決定することが、複数の遺伝子の発現レベルを決定することを含む;
    i. 統計分析を行なう前に、参照データセットに対して患者の発現プロフィールを正規化することをさらに含む;
    j. 統計分析のためにその発現ステータスが決定されている遺伝子の部分集合を選択するステップをさらに含み、任意に該遺伝子の部分集合内のそれぞれの遺伝子の発現ステータスが、癌患者のサンプルで変化することが知られている;
    k. 統計分析の前に、患者の発現プロフィールにユニークなラベルを付することをさらに含む;
    l. 該参照データセット内のそれぞれの発現プロフィールの前立腺癌の予後不良(DESNT)ステータスが知られている
    m. 該患者の発現プロフィールが、統計分析の前に少なくとも2つの参照データセットと組み合わされる。
  4. 以下のいずれかを含む、請求項1から3のいずれか1項記載の方法:
    a) サンプルは、尿サンプル、精液サンプル、前立腺の滲出液サンプル、あるいは前立腺に由来する高分子または細胞を含んでいる任意のサンプル、全血サンプル、漿液サンプル、唾液、あるいは生検試料であり、任意にサンプルは前立腺生検、前立腺摘除あるいはTURPサンプルである;
    b) 少なくとも2のサンプルに対して方法が実行され、任意に方法は複数の患者サンプルに対して同時に行われる
    c) 1または複数のデータセットが複数の腫瘍、あるいは患者の発現プロフィールを含み、任意データセットは各々少なくとも20の患者もしくは腫瘍発現プロフィールを含み、さらに任意に、i. 患者または腫瘍の発現プロフィールは、少なくとも10の遺伝子の発現ステータスについての情報を含むか、または
    ii. 患者または腫瘍の発現プロフィールは、少なくとも10の遺伝子の発現レベルについての情報を含む。
  5. 表1にリストされたすべての500の遺伝子の発現レベルまたは発現ステータスを検知するための手段を含む、前立腺癌の進行を予測するためのキット
    ここで、遺伝子の発現レベルまたは発現ステータスを検知するための手段がマイクロアレイであり、該マイクロアレイはRNA、DNAまたは蛋白質マイクロアレイであり、該マイクロアレイは発現が検知される遺伝子に特異的な結合分子を含む。
  6. さらに以下を含む、請求項5記載のキット:
    a. 1以上のコントロール遺伝子または参照遺伝子の発現レベルまたは発現ステータスを検知するための手段;および/または、
    b. キットを使用するための指示
  7. 表1にリストされたすべての500の遺伝子の発現レベルまたは発現ステータスを検知するように構成されたマイクロアレイ。
  8. 該マイクロアレイはRNA、DNAまたは蛋白質マイクロアレイであり、該マイクロアレイは発現が検知される遺伝子に特異的な結合分子を含む、請求項7記載のマイクロアレイ。
  9. マイクロアレイが、1以上のコントロール遺伝子または参照遺伝子の発現レベルまたは発現ステータスを検知するように構成される、請求項7または8記載のマイクロアレイ。
JP2019518269A 2016-10-05 2017-10-05 癌の分類および予後 Active JP7365899B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022147254A JP7539443B2 (ja) 2016-10-05 2022-09-15 癌の分類および予後

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB1616912.0 2016-10-05
GBGB1616912.0A GB201616912D0 (en) 2016-10-05 2016-10-05 Classification of cancer
PCT/EP2017/075368 WO2018065525A1 (en) 2016-10-05 2017-10-05 Classification and prognosis of cancer

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2022147254A Division JP7539443B2 (ja) 2016-10-05 2022-09-15 癌の分類および予後

Publications (3)

Publication Number Publication Date
JP2019537108A JP2019537108A (ja) 2019-12-19
JP2019537108A5 JP2019537108A5 (ja) 2020-11-19
JP7365899B2 true JP7365899B2 (ja) 2023-10-20

Family

ID=57571107

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2019518269A Active JP7365899B2 (ja) 2016-10-05 2017-10-05 癌の分類および予後
JP2022147254A Active JP7539443B2 (ja) 2016-10-05 2022-09-15 癌の分類および予後

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2022147254A Active JP7539443B2 (ja) 2016-10-05 2022-09-15 癌の分類および予後

Country Status (7)

Country Link
US (2) US11746380B2 (ja)
EP (1) EP3523443A1 (ja)
JP (2) JP7365899B2 (ja)
AU (2) AU2017341084B2 (ja)
CA (1) CA3038743A1 (ja)
GB (1) GB201616912D0 (ja)
WO (1) WO2018065525A1 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11913076B2 (en) * 2017-05-12 2024-02-27 The Henry M. Jackson Foundation For The Advancement Of Military Medicine, Inc. Prostate cancer gene profiles and methods of using the same
US11894139B1 (en) * 2018-12-03 2024-02-06 Patientslikeme Llc Disease spectrum classification
CN109637589B (zh) * 2018-12-13 2022-07-26 上海交通大学 基于频繁模式和机器学习双推荐制的核定位信号预测方法
CN111796095A (zh) * 2019-04-09 2020-10-20 苏州扇贝生物科技有限公司 一种蛋白质组质谱数据处理方法及装置
GB201915464D0 (en) * 2019-10-24 2019-12-11 Uea Enterprises Ltd Novel biomarkers and diagnostic profiles for prostate cancer
JPWO2022071242A1 (ja) * 2020-09-30 2022-04-07
CN112365948B (zh) * 2020-10-27 2023-07-18 沈阳东软智能医疗科技研究院有限公司 癌症分期预测系统
CN116324874A (zh) * 2020-11-06 2023-06-23 威里利生命科学有限责任公司 对前列腺癌预后的人工智能预测
CN114540492A (zh) * 2022-01-10 2022-05-27 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所) 检测SCN4A和SCN7A mRNA表达量的产品在制备肝癌预后预测产品中的应用
WO2023215513A1 (en) * 2022-05-04 2023-11-09 The Regents Of The University Of California Methods and systems for characterization, diagnosis, and treatment of cancer
CN115747329B (zh) * 2022-09-03 2023-10-17 昂凯生命科技(苏州)有限公司 用于预测肿瘤进展及预后的基因标志物组合、试剂盒及系统
WO2024081796A1 (en) * 2022-10-12 2024-04-18 Liquid Biopsy Research LLC Methods for prostate cancer detection in saliva
CN116298292B (zh) * 2023-03-20 2023-09-08 江西省肿瘤医院(江西省第二人民医院、江西省癌症中心) Gng2蛋白的检测试剂在制备诊断和预后结肠癌的产品中的用途

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016521966A (ja) 2013-03-15 2016-07-28 メタマーク ジェネティクス, インコーポレイテッド 癌の予後のための組成物および方法

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6351666B1 (en) 1998-02-27 2002-02-26 Biofield Corp. Method and apparatus for sensing and processing biopotentials
US7353215B2 (en) 2001-05-07 2008-04-01 Health Discovery Corporation Kernels and methods for selecting kernels for use in learning machines
WO2002072828A1 (fr) 2001-03-14 2002-09-19 Dna Chip Research Inc. Procede permettant de prevoir un cancer
WO2003041562A2 (en) 2001-11-14 2003-05-22 Whitehead Institute For Biomedical Research Molecular cancer diagnosis using tumor gene expression signature
EP1828917A4 (en) 2004-11-12 2012-04-25 Health Discovery Corp BIOMARKERS FOR DETECTING, PREDICTING AND MONITORING PROSTATE DISEASE
US7914988B1 (en) 2006-03-31 2011-03-29 Illumina, Inc. Gene expression profiles to predict relapse of prostate cancer
JP2010518868A (ja) 2007-02-23 2010-06-03 バイオセラノスティクス,インコーポレイティド 前立腺癌の生存及び再発
WO2009067655A2 (en) 2007-11-21 2009-05-28 University Of Florida Research Foundation, Inc. Methods of feature selection through local learning; breast and prostate cancer prognostic markers
NZ617003A (en) 2010-01-11 2015-04-24 Genomic Health Inc Method to use gene expression to determine likelihood of clinical outcome of renal cancer
US20120053253A1 (en) 2010-07-07 2012-03-01 Myriad Genetics, Incorporated Gene signatures for cancer prognosis
US20140045915A1 (en) 2010-08-31 2014-02-13 The General Hospital Corporation Cancer-related biological materials in microvesicles
CN104603292A (zh) 2012-07-20 2015-05-06 戴格努生命科学公司 用于提供前列腺癌的临床评估的方法、试剂盒和组合物
DK3435084T3 (da) 2012-08-16 2023-05-30 Mayo Found Medical Education & Res Prostatakræftprognose under anvendelse af biomarkører
WO2014057279A1 (en) 2012-10-10 2014-04-17 Institute Of Cancer Research: Royal Cancer Hospital Micro-rna biomarkers for prostate cancer
WO2014159443A1 (en) 2013-03-14 2014-10-02 Genomedx Biosciences, Inc. Cancer biomarkers and classifiers and uses thereof
GB201320061D0 (en) * 2013-11-13 2013-12-25 Electrophoretics Ltd Materials nad methods for diagnosis and prognosis of liver cancer
CA2996426A1 (en) 2015-10-05 2017-04-13 Cedars-Sinai Medical Center Method of classifying and diagnosing cancer

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016521966A (ja) 2013-03-15 2016-07-28 メタマーク ジェネティクス, インコーポレイテッド 癌の予後のための組成物および方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
David Olmos et al.,Prognostic value of blood mRNA expression signatures in castration-resistant prostate cancer: a prospective,two-stage study, online, PMC, 2016年5月24日, PMID:PMC4878433 DOI:10.1016/S1470-2045(12)70372-8,[2022年4月19日検索],インターネット,<URL:https://pubmed.ncbi.nlm.nih.gov/23059046/>

Also Published As

Publication number Publication date
EP3523443A1 (en) 2019-08-14
AU2024200150A1 (en) 2024-01-25
AU2017341084A1 (en) 2019-04-11
US20200263255A1 (en) 2020-08-20
US11746380B2 (en) 2023-09-05
WO2018065525A1 (en) 2018-04-12
JP2023003422A (ja) 2023-01-11
JP7539443B2 (ja) 2024-08-23
US20230349000A1 (en) 2023-11-02
JP2019537108A (ja) 2019-12-19
GB201616912D0 (en) 2016-11-16
AU2017341084B2 (en) 2023-11-02
CA3038743A1 (en) 2018-04-12

Similar Documents

Publication Publication Date Title
JP7539443B2 (ja) 癌の分類および予後
Lal et al. Molecular signatures in breast cancer
AU2021212151B2 (en) Compositions, methods and kits for diagnosis of a gastroenteropancreatic neuroendocrine neoplasm
Lin et al. Molecular classification and prediction in gastric cancer
EP3776558A2 (en) Improved classification and prognosis of prostate cancer
Luca et al. DESNT: a poor prognosis category of human prostate cancer
WO2015073949A1 (en) Method of subtyping high-grade bladder cancer and uses thereof
Pass et al. Biomarkers and molecular testing for early detection, diagnosis, and therapeutic prediction of lung cancer
Rathmell et al. Genomics of chromophobe renal cell carcinoma: implications from a rare tumor for pan-cancer studies
WO2012125411A1 (en) Methods of predicting prognosis in cancer
Saleh et al. Comparative analysis of triple-negative breast cancer transcriptomics of Kenyan, African American and Caucasian Women
JP2024515565A (ja) ヌクレオソーム保護およびクロマチンアクセシビリティを調査するためのセルフリーdna配列データ解析法
Jonker et al. Epigenetic dysregulation in adrenocortical carcinoma, a systematic review of the literature
Foong et al. Future Role of Molecular Profiling in Small Breast Samples and Personalised Medicine
Parker Clinical implementation of breast cancer genomics
BR112017005279B1 (pt) Métodos para detectar um neoplasma neuroendócrino gastroenteropancreático (gep-nen), para diferenciar gep-nen estável de um gep-nen progressivo e para determinar uma resposta a uma terapia com radionucleotídeo para receptor de peptídeo de um gep-nen
Brannon Molecular stratification and characterization of clear cell renal cell carcinoma

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190607

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20190523

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7426

Effective date: 20190522

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190910

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201003

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201003

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211011

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20211223

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20220307

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220406

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20220516

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220915

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20220915

C11 Written invitation by the commissioner to file amendments

Free format text: JAPANESE INTERMEDIATE CODE: C11

Effective date: 20221017

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221020

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20221021

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20221031

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20221111

C211 Notice of termination of reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C211

Effective date: 20221128

C22 Notice of designation (change) of administrative judge

Free format text: JAPANESE INTERMEDIATE CODE: C22

Effective date: 20230222

C13 Notice of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: C13

Effective date: 20230426

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20230630

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230808

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20231010

R150 Certificate of patent or registration of utility model

Ref document number: 7365899

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150