JP2007527247A - 臨床的基準および情報提供性遺伝子セットの組合せを使用する乳癌患者の分類 - Google Patents

臨床的基準および情報提供性遺伝子セットの組合せを使用する乳癌患者の分類 Download PDF

Info

Publication number
JP2007527247A
JP2007527247A JP2007502116A JP2007502116A JP2007527247A JP 2007527247 A JP2007527247 A JP 2007527247A JP 2007502116 A JP2007502116 A JP 2007502116A JP 2007502116 A JP2007502116 A JP 2007502116A JP 2007527247 A JP2007527247 A JP 2007527247A
Authority
JP
Japan
Prior art keywords
genes
individual
markers
age
expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007502116A
Other languages
English (en)
Inventor
ダイ,ホンユ
ヴィア,ローラ,ジェイ. ファント
ラム,ジョン
ストートン,ローランド
フレンド,スティーブン,エイチ.
ヘ,ユドン
Original Assignee
ロゼッタ インファーマティクス エルエルシー
ザ ネザーランズ キャンサー インスティチュート
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ロゼッタ インファーマティクス エルエルシー, ザ ネザーランズ キャンサー インスティチュート filed Critical ロゼッタ インファーマティクス エルエルシー
Publication of JP2007527247A publication Critical patent/JP2007527247A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57415Specifically defined cancers of breast
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10TTECHNICAL SUBJECTS COVERED BY FORMER US CLASSIFICATION
    • Y10T436/00Chemistry: analytical and immunological testing
    • Y10T436/14Heterocyclic carbon compound [i.e., O, S, N, Se, Te, as only ring hetero atom]
    • Y10T436/142222Hetero-O [e.g., ascorbic acid, etc.]
    • Y10T436/143333Saccharide [e.g., DNA, etc.]

Abstract

本発明は、癌、例えば乳癌などの状態の予後判定方法を提供し、その方法は、状態についての複数の表現型、遺伝子型または臨床上の特徴によって個体を複数の患者サブセットに分類するステップと、その個体由来の試料中でそのサブセットについて特定された予後情報提供性遺伝子の発現のパターンを分析するステップとを含む。本発明はまた、そのような患者サブセットを構築する方法、およびそのようなサブセットについて予後情報提供性のある遺伝子セットを特定する方法をも提供する。本発明はさらに、個体に治療法を割り当てる方法、予後判定を行うのに有用なマイクロアレイ、このマイクロアレイを含むキット、ならびに本発明の方法を実施するためのコンピュータシステムおよびプログラムを提供する。

Description

1.技術分野
本発明は、患者の別個のサブセットを特定し、次いでそれについて情報提供性遺伝子の特異的なセットを特定するための、疾患などの状態の表現型的側面と遺伝子型的側面の両方の使用に関する。本発明はまた、臨床的パラメーター、およびマーカーの(例えば遺伝子発現パターンの)状態に基づく、状態のサブセットへの乳癌患者などの個体の分類、ならびに状態のサブセット内での予後判定に情報提供性のあるマーカーに基づくその個体の予後判定にも関する。本発明はまた、乳癌などの状態を有する、または有することが疑われる個体に対する治療または療法の処方を決定する方法にも関する。本発明はさらに、特に5つの乳癌特異的患者サブセットおよびそのそれぞれについての予後情報提供性遺伝子を使用した、臨床試験を構築する方法、ならびに臨床試験のための、または他の状態に関連する(例えば乳癌に関連する)研究のための患者集団を特定する方法に関する。最後に、本発明は、上記の方法のコンピュータ実装形態に関する。
2.背景技術
米国で報告されている癌の症例数の増加、および実際上は世界中で起こっているその増加は、重大な問題である。現在のところ、特定の型の癌に使用可能な少数の治療しか存在せず、これらが成功する保証はない。最も有効にするためには、これらの治療は、悪性腫瘍の早期検出だけでなく、悪性腫瘍の重症度の信頼できる評価を必要とする。
女性の主要な死因である乳癌の発生率は、過去30年間にわたって米国で徐々に増加してきた。その累積的リスクは比較的高く、米国では85歳までに女性8名中1名が何らかの型の乳癌を発症することが予想される。実際、乳癌は、米国では女性では最も多い癌であり、癌による死亡の2番目に多い原因である。1997年に、181,000例の新たな症例が米国で報告され、44,000人が乳癌で死亡すると推定された(Parkerら, CA Cancer J. Clin. 47:5-27 (1997); Chuら, J. Nat. Cancer Inst. 88:1571-1579 (1996))。ほとんどの乳癌に関する腫瘍発生の機構は主として不明であるが、一部の女性にとって乳癌を発症する素因となる可能性がある遺伝的因子が存在する(Mikiら, Science, 266:66-71(1994))。
散発性腫瘍は、現在のところ既知の生殖細胞系列突然変異との関係は認められていないが、乳癌の大部分を構成する。また他の非遺伝的因子がその疾患の原因に著しい影響を及ぼす可能性も高い。癌の発生原因にかかわらず、乳癌の罹患率および死亡率は、その進行の早期に検出されない場合に著しく増大する。したがって、乳房組織における細胞の形質転換および腫瘍形成の早期検出に労力がかなり大きく集中してきた。
腫瘍を特定および特徴付けするためのマーカーに基づく手法から、診断および予後判定の信頼性の向上が展望される。通常、乳癌の診断は、腫瘍の存在についての組織病理学的証拠を必要とする。また診断に加えて、組織病理検査により、予後判定についての情報が得られ、治療法が選択される。腫瘍サイズ、腫瘍の段階、患者の年齢やリンパ節転移などの臨床的パラメーターに基づいて予後判定を確立することもできる。
診断および/または予後判定は、乳房の外部の直接検査により、あるいは乳房X線撮影(mammography)または他のX線画像化方法により、様々な程度の有効性で判定することができる(Jatoi, Am. J. Surg. 177:518-524 (1999))。しかし、後者の手法は、かなり大きなコストがかからないわけではない。乳房X線写真を撮るたびに、患者は、試験中使用される放射線の電離特性により誘発される乳房腫瘍を有する小さなリスクを被る。さらに、そのプロセスは高価であり、専門技術者の主観的な解釈が不正確さにつながる可能性がある。例えば、放射線科医の調査対象集団によって個々に解釈された一連の乳房X線写真の約3分の1について大きな臨床的相違が認められることが一研究で示された。さらに、乳房X線写真撮影が苦痛な経験であることが多数の女性に知られている。したがって、米国国立癌研究所(National Cancer Institute)は、50歳未満の女性に対しては、この集団がそれより老齢の女性ほど乳癌を発症する可能性が高くないので、乳房X線写真を推奨していない。しかし、50歳未満の女性で発生する乳癌はわずか約22%であるが、閉経期前の女性の乳癌がより侵襲性であることがデータから示唆されることは留意せざるを得ない。
治療の選択肢、予後判定、および治療応答の可能性がすべて診断に応じて幅広く変化するので、臨床的診療では、乳癌の種々のサブタイプの正確な診断が重要である。正確な予後判定、または遠隔転移のない生存の判定により、癌専門医は、最も侵襲性の高い治療を受けた予後不良の女性に補助化学療法を適用することが可能となる。さらに、予後不良の正確な予測は、次いで潜在的な被験患者を予後判定に従って層別することができるので、新たな乳癌の療法の臨床試験に大きな影響を及ぼす。次いで、試験は、予後不良の患者に限定することができ、それによって実験的療法が有効であるかどうか識別することが容易になる。
今日まで、臨床情報のみに基づいた予後についての満足のいく予測因子のセットは特定されていない。乳房腫瘍遺伝子発現プロファイル作成においてERの状態が有力な特徴となることが多数の研究者によって観察されている。Westら, Proc. Natl. Acad. Sci. U.S.A. 98:11462 (2001); van 't Veerら, Nature 415:530 (2002); Sorlieら, Proc. Natl. Acad. Sci. U.S.A. 100:8418 (2003); Perouら, Nature 406:747 (2000); Gruvbergerら, Cancer Res. 61:5979 (2001); Sotiriouら, Proc. Natl. Acad. Sci. U.S.A. 100:10393 (2003)を参照されたい。患者の生存とERの状態に何らかの関係があることが一般に受け入れられている。van de Vijverら, N. Engl. J. Med. 347:1999 (2002); Surowiakら, Folia Histochem. Cytobiol. 39:143 (2001); Pichonら, Br. J. Cancer 73:1545 (1996); Collettら, J. Clin. Pathol. 49:920 (1996)を参照されたい。BRCA1の突然変異は、家族性癌感受性と関係がある。Bieseckerら, JAMA 269:1970 (1993); Eastonら, Cancer Surv. 18:95 (1993)を参照されたい。若齢の癌患者が不良な腫瘍を有する傾向があるので、年齢も予後判定因子と考えられる。Maggardら, J. Surg. Res. 113:109 (2003)を参照されたい。リンパ節の状態は、治療の決定因子である。Eifelら, J Natl. Cancer Inst. 93:979 (2001)を参照されたい。
最近、BRCA1およびBRCA2の発見および特徴付けにより、家族性乳癌の一因となり得る遺伝的因子について知識が広がった。この2つの遺伝子座内での生殖細胞系列突然変異は、乳癌および/または卵巣癌の50〜85%の寿命リスクと関係する(Casey, Curr. Opin. Oncol. 9:88-93 (1997); Marcusら, Cancer 77:697-709 (1996))。しかし、約5%〜10%の乳癌しか、乳癌感受性遺伝子であるBRCA1およびBRCA2を伴わない。突然変異BRCA1を保有する女性についての乳癌の累積寿命リスクは約92%であると予測され、その一方で、非保有者である大部分の女性についての累積寿命リスクは約10%であると推定される。BRCA1は、ゲノム安定性の維持にとってどちらも重要なDNA修復と細胞周期制御に関与する腫瘍抑制遺伝子である。今まで報告されているすべての突然変異のうち90%を超えるものが、そのタンパク質産物の未熟な段階での切断を生じさせ、その機能が異常となり、または消失する。BRCA1突然変異保有者の乳癌の組織像は散発例のものと異なるが、突然変異分析が保有者を発見するただ1つの方法である。BRCA1と同様に、BRCA2は乳癌の発症に関与し、BRCA1のようにDNA修復の際にある役割を果たす。しかし、BRCA1と異なり、これは卵巣癌に関与しない。
他の遺伝子、例えばc−erb−2(HER2)およびp53が乳癌と関連付けられてきた(Beenkenら, Ann. Surg. 233(5):630-638 (2001))。c−erb−2(HER2)およびp53の過剰発現は予後不良と相関し(Rudolphら, Hum. Pathol. 32(3):311-319 (2001))、mdm2(Lukasら, Cancer Res. 61(7):3212-3219 (2001))、ならびにサイクリン1およびp27(Porter & Roberts、1998年8月6日に公開された国際公開WO98/33450)の異常発現産物も同様に相関する。
BRCA1またはBRCA2の突然変異の検出は、これらの腫瘍の出現をよりよく制御し予防する療法の設計に向けてのステップとなる。最近、多数の研究で遺伝子発現プロファイル作成を使用して種々の癌が分析されており、それらの研究から分子レベルで新たな診断および予後判定の情報がもたらされている。Zajchowskiら, "Identification of Gene Expression Profiled that Predict the Aggressive Behavior of Breast Cancer Cells," Cancer Res. 61:5168 (2001); Westら, "Predicting the Clinical Status of Human Breast Cancer by Using Gene Expression Profiles," Proc. Natl. Acad. Sci. U.S.A. 98:11462 (2001); van't Veerら, "Gene Expression Profiling Predicts the Outcome of Breast Cancer, " Nature 415:530 (2002); Robertsら, "Diagnosis and Prognosis of Breast Cancer Patients, " WO02/103320; Sorlieら, Proc. Natl. Acad. Sci. U.S.A. 100:8418 (2003); Perouら, Nature 406:747 (2000); Khanら, Cancer Res 58, 5009 (1998); Golubら, Science 286, 531 (1999); DeRisiら, Nat. Genet. 14:457 (1996); Alizadehら, Nature 403, 503 (2000)を参照されたい。種々の癌について情報提供性のある遺伝子セットを特定する方法も記載されている。Robertsら, "Diagnosis and Prognosis of Breast Cancer Patients"、WO02/103320; Golubら, 米国特許出願公開第6,647,341号を参照されたい。
エストロゲン受容体(ER)の状態、またはBRCA1突然変異と散発性(すなわちBRCA1型以外の)突然変異との状態に基づいて、乳癌を有する、または有することが疑われる個体を区別するのに情報提供性のある遺伝子セットが特定されている。Robertsら, WO02/103320; van't Veerら, Nature 415:530 (2001)を参照されたい。散発性腫瘍型の個体を、最初の診断から5年以内に転移しない可能性が高い個体(すなわち、予後が良好な個体)、または最初の診断から5年以内に転移する可能性が高い個体(すなわち、予後が不良な個体)に分類することができる遺伝子セットも特定されている。Roberts, (上掲); van't Veer, (上掲)を参照されたい。
Robertsら、WO02/103320では、乳癌の予後判定に有用な70遺伝子のセットについて記載されており、それは、予後判定の臨床的な尺度より優れ、転帰が良好な患者を選択しそれによって過剰な治療を回避する際に良好な潜在性を示した。van de Vijverら, N. Engl. J. Med. 347:1999 (2002)を参照されたい。しかし、最も予測性の高い値を有する遺伝子の発現は、不良な患者の間で不均一であり、そのことから改善の必要があることが示唆される。
Robertsらに記載の遺伝子発現のパターンは、エストロゲン受容体およびBRCA1の状態など既存の臨床的指標と相関していたが、臨床的な尺度は組み込まれていなかった。さらに、転帰不良の群が特に発現パターンの不均一性を示していたが、この研究の間に見つかった最も良好な分類決定の規則は、転帰が良好な訓練群の平均プロファイルとの患者プロファイルの類似性に基づくかなり単純なものであった。
国際公開第WO98/33450号 国際公開第WO02/103320号 米国特許出願公開第6,647,341号 Parkerら, CA Cancer J. Clin. 47:5-27 (1997) Chuら, J. Nat. Cancer Inst. 88:1571-1579 (1996) Mikiら, Science, 266:66-71(1994) Jatoi, Am. J. Surg. 177:518-524 (1999) Westら, Proc. Natl. Acad. Sci. U.S.A. 98:11462 (2001) van 't Veerら, Nature 415:530 (2002) Sorlieら, Proc. Natl. Acad. Sci. U.S.A. 100:8418 (2003) Perouら, Nature 406:747 (2000) Gruvbergerら, Cancer Res. 61:5979 (2001) Sotiriouら, Proc. Natl. Acad. Sci. U.S.A. 100:10393 (2003) van de Vijverら, N. Engl. J. Med. 347:1999 (2002) Surowiakら, Folia Histochem. Cytobiol. 39:143 (2001) Pichonら, Br. J. Cancer 73:1545 (1996) Collettら, J. Clin. Pathol. 49:920 (1996) Bieseckerら, JAMA 269:1970 (1993) Eastonら, Cancer Surv. 18:95 (1993) Maggardら, J. Surg. Res. 113:109 (2003) Eifelら, J Natl. Cancer Inst. 93:979 (2001) Casey, Curr. Opin. Oncol. 9:88-93 (1997) Marcusら, Cancer 77:697-709 (1996) Beenkenら, Ann. Surg. 233(5):630-638 (2001) Rudolphら, Hum. Pathol. 32(3):311-319 (2001) Lukasら, Cancer Res. 61(7):3212-3219 (2001) Zajchowskiら, Cancer Res. 61:5168 (2001) Sorlieら, Proc. Natl. Acad. Sci. U.S.A. 100:8418 (2003) Khanら, Cancer Res 58, 5009 (1998) Golubら, Science 286, 531 (1999) DeRisiら, Nat. Genet. 14:457 (1996) Alizadehら, Nature 403, 503 (2000)
乳癌が、複数の型の分子的事象の結果生じることは明らかである。同様に、他の癌;糖尿病、自己免疫障害または神経変性障害、肥満などの癌でない疾患;などの様々な他の状態も、複数の分子的事象の結果生じる。さらに、特定の環境条件への曝露、例えば、毒素、汚染物質、薬物、食品添加物などの天然または人工の作用物質への曝露に対する個体の応答は、おそらく複数の分子的事象の結果生じる。したがって、予防および/または療法の適当な処方を提供することができるように予後判定の方法を改善する必要性が存在する。最初に疾患または状態に関連する遺伝子型または表現型の特徴に基づいて個体の別個のサブセットを特定し、次いでその患者サブセット内で予後判定について情報提供性のある遺伝子セットを特定することによって、予後判定力の高い遺伝子セットを特定することができる。次いで、乳癌などの状態を有する個体、またはその状態を有することが疑われる個体に、その状態の根底にある分子機構に適した療法が提供される。本発明は、乳癌、および他の癌、疾患または状態についてそのような方法を提供する。
3.発明の概要
本発明は、状態の関連サブセットを特定する方法を提供し、例えばそれらのサブセットの1つに分類可能な個体の予後判定用の、それらのサブセットに関連するマーカーの特定をもたらす。本発明はさらに、乳癌を有する個体の予後判定に有用なマーカーのセットを提供し、その患者は乳癌の1つまたは複数の特徴に従って分類される。
したがって、本発明は、複数の表現型または遺伝子型の特徴を含む状態について情報提供性のある遺伝子またはマーカーのセットを特定する方法を提供し、その方法は、(a)前記状態についての1つもしくは複数の表現型または遺伝子型の特徴に基づいて、複数の第1クラスに複数の試料または個体をそれぞれ分類するステップと、(b)前記各第1クラス内で、前記状態について情報提供性のある遺伝子またはマーカーの第1セットを特定するステップとを含み、前記各第1クラス内での前記の遺伝子またはマーカーの第1セットは、他の第1クラスと比べて前記クラスにユニークなものである。具体的な実施形態では、この方法はさらに、前記分類ステップ(a)で使用したものと異なる表現型または遺伝子型の特徴に基づいて、前記第1クラスの少なくとも1つの中の前記試料または個体を複数の第2クラスにさらに分類するステップと、前記第2クラスの少なくとも1つの中で、情報提供性のある遺伝子またはマーカーの第2セットを特定するステップとを含み、前記各第2クラス内での前記の情報提供性のある遺伝子またはマーカーの第2セットは、他の第1および第2クラスと比べて前記第2クラスにユニークなものである。
本発明はさらに、複数の表現型または遺伝子型の特徴を含む状態について情報提供性のある遺伝子またはマーカーのセットを特定する方法を提供し、その方法は、(a)1つもしくは複数の表現型または遺伝子型の特徴に基づいて、複数の第1クラスに複数の試料または個体をそれぞれ分類するステップと、(b)前記分類ステップ(a)で使用したものと異なる表現型または遺伝子型の特徴に基づいて、前記第1クラスの少なくとも1つを複数の第2クラスに分類するステップと、(c)前記第1クラスまたは前記第2クラスの少なくとも1つの中で前記状態について情報提供性のある遺伝子またはマーカーのセットを特定するステップとを含み、前記の遺伝子またはマーカーの第2セットは、他の第1および第2クラスと比べて前記クラスにユニークなものである。
本発明はさらに、複数の表現型または遺伝子型の特徴を含む状態について情報提供性のある遺伝子またはマーカーのセットを特定する方法を提供し、その方法は、(a)前記複数の表現型または遺伝子型の特徴から第1の特徴を選択するステップと、(b)前記第1の特徴により区別可能な第1の状態クラスの少なくとも2つを特定するステップと、(c)前記第1の状態クラスの少なくとも1つに分類可能な複数の個体を選択するステップと、(d)前記複数の個体のそれぞれに由来する試料中で、前記第1の状態クラスの前記少なくとも1つの中で前記状態について情報提供性のある遺伝子またはマーカーのセットを特定するステップとを含む。
本発明はさらに、ある状態を有する個体を予後良好または予後不良に分類する方法を提供し、その方法は、(a)前記状態についての1つまたは複数の表現型、遺伝子型または臨床上の特徴により区別される複数の患者クラスの1つに前記個体を分類するステップと、(b)個体から得られた細胞試料中で、前記個体が分類される患者クラスの予後判定について情報提供性のある遺伝子またはそのコードタンパク質を含む複数の遺伝子またはそのコードタンパク質の発現レベルを、対照と比較して決定するステップと、(c)前記発現レベルに基づいて、前記個体を予後良好または予後不良に分類するステップとを含む。具体的な実施形態では、前記状態は癌であり、前記の予後良好は、最初の診断から5年以内に転移が起こらないことであり、前記の予後不良は、最初の診断から5年以内に転移が起こることである。より具体的な実施形態では、前記癌は乳癌である。他の具体的な実施形態では、前記対照は、予後不良であると認められた個体に由来する複数の試料にわたる前記複数の遺伝子またはそのコードタンパク質それぞれの発現の平均レベルである。より具体的な実施形態では、前記分類ステップ(c)は、前記複数の遺伝子またはそのコードタンパク質それぞれの発現レベルを、前記対照中の対応する遺伝子またはそのコードタンパク質それぞれの発現の前記平均レベルと比較するステップと、前記発現レベルが、前記対照中の前記遺伝子またはそのコードタンパク質それぞれの発現の前記平均レベルと、偶然に予想されるよりも強く相関する場合に前記個体を予後不良に分類するステップとを含む方法によって実施される。他の具体的な実施形態では、前記対照は、予後良好であると認められた個体に由来する複数の試料にわたる前記複数の遺伝子またはそのコードタンパク質それぞれの発現の平均レベルである。より具体的な実施形態では、前記のステップ(c)での分類は、前記複数の遺伝子またはそのコードタンパク質それぞれの発現レベルを、前記対照中の対応する遺伝子またはそのコードタンパク質それぞれの発現の前記平均レベルと比較するステップと、前記発現レベルが、前記対照中の前記遺伝子またはそのコードタンパク質それぞれの発現の前記平均レベルと、偶然に予想されるよりも強く相関する場合に前記個体を予後良好に分類するステップとを含む方法によって実施される。他の具体的な実施形態では、前記複数の患者クラスは、ER、BRCA1の個体;ER、散発性の個体;ER+、ER/年齢 高値の個体;ER+、ER/年齢 低値、LN+の個体;およびER+、ER/年齢 低値、LNの個体を含む。
本発明はさらに、乳癌患者を予後良好または予後不良に分類する方法を提供し、その方法は、(a)前記乳癌患者をER、BRCA1;ER、散発性;ER+、ER/年齢 高値;ER+、ER/年齢 低値、LN+;またはER+、ER/年齢 低値、LNに分類するステップと、(b)前記乳癌患者から得られた細胞試料中で、前記乳癌患者がER、BRCA1に分類される場合には表1中のマーカーに、前記乳癌患者がER、散発性に分類される場合には表2中のマーカーに、前記乳癌患者がER+、ER/年齢 高値に分類される場合には表3中のマーカーに、前記乳癌患者がER+、ER/年齢 低値、LN+に分類される場合には表4中のマーカーに、または前記乳癌患者がER+、ER/年齢 低値、LNに分類される場合には表5中のマーカーに対応する遺伝子を2つ含む第1の複数の遺伝子の発現レベルを、対照と比較して決定するステップと、(c)前記第1の複数の遺伝子の発現レベルに基づいて前記乳癌患者を予後良好または予後不良に分類するステップとを含み、前記乳癌患者は、ER遺伝子発現のlog10(比)の年齢に対する比が所定の値を超える場合には「ER/年齢 高値」であり、ER遺伝子発現のlog10(比)の年齢に対する比が前記の所定の値を超えない場合には「ER/年齢 低値」である。具体的な実施形態では、前記対照は、前記乳癌患者がER、BRCA1である場合にはER、BRCA1の個体に由来する複数の試料中における前記複数の遺伝子それぞれの発現の平均レベル;前記乳癌患者がER、散発性である場合にはER、散発性の個体に由来する複数の試料中における前記複数の遺伝子それぞれの発現の平均レベル;前記乳癌患者がER+、ER/年齢 高値である場合にはER+、ER/年齢 高値の個体に由来する複数の試料中における前記複数の遺伝子それぞれの発現の平均レベル;前記乳癌患者がER+、ER/年齢 低値、LN+である場合にはER+、ER/年齢 低値、LN+の個体に由来する複数の試料中における前記複数の遺伝子それぞれの発現の平均レベル;または前記乳癌患者がER+、ER/年齢 低値、LNである場合にはER+、ER/年齢 低値、LNの個体に由来する複数の試料中における前記複数の遺伝子それぞれの発現の平均レベルである。より具体的な実施形態では、前記個体はそれぞれ予後不良である。他のより具体的な実施形態では、前記個体はそれぞれ予後良好である。さらにより具体的な実施形態では、前記分類ステップ(c)は、前記乳癌患者由来の試料中における前記複数の遺伝子またはそのコードタンパク質それぞれの発現レベルを前記対照と比較するステップと、前記発現レベルが、前記対照中の対応する遺伝子またはそのコードタンパク質の発現の前記平均レベルと、偶然に予想されるよりも強く相関する場合に前記乳癌患者を予後不良に分類するステップとを含む方法によって実施される。他の具体的な実施形態では、前記のERの所定の値は、ER=0.1(年齢−42.5)と算出され、式中、年齢は前記個体の年齢である。他の具体的な実施形態では、前記個体はER、BRCA1であり、前記複数の遺伝子はそれに対するマーカーが表1中に列挙されている遺伝子を2つ含む。他の具体的な実施形態では、前記個体はER、BRCA1であり、前記複数の遺伝子はそれに対するマーカーが表1中に列挙されている遺伝子をすべて含む。他の具体的な実施形態では、前記個体はER、散発性であり、前記複数の遺伝子はそれに対するマーカーが表2中に列挙されている遺伝子を2つ含む。他の具体的な実施形態では、前記個体はER、散発性であり、前記複数の遺伝子はそれに対するマーカーが表2中に列挙されている遺伝子をすべて含む。他の具体的な実施形態では、前記個体はER+、ER/年齢 高値であり、前記複数の遺伝子はそれに対するマーカーが表3中に列挙されている遺伝子を2つ含む。前記個体はER+、ER/年齢 高値であり、前記複数の遺伝子はそれに対するマーカーが表3中に列挙されている遺伝子をすべて含む。他の具体的な実施形態では、前記個体はER+、ER/年齢 低値、LN+であり、前記複数の遺伝子はそれに対するマーカーが表4中に列挙されている遺伝子を2つ含む。他の具体的な実施形態では、前記個体はER+、ER/年齢 低値、LN+であり、前記複数の遺伝子はそれに対するマーカーが表4中に列挙されている遺伝子をすべて含む。他の具体的な実施形態では、前記個体はER+、ER/年齢 低値、LNであり、前記複数の遺伝子はそれに対するマーカーが表5中に列挙されている遺伝子を2つ含む。他の具体的な実施形態では、前記個体はER+、ER/年齢 低値、LNであり、前記複数の遺伝子はそれに対するマーカーが表5中に列挙されている遺伝子をすべて含む。他の具体的な実施形態では、その方法は、前記細胞試料中で、それに対するマーカーが表1〜5中に見られず予後判定について情報提供性のある第2の複数の遺伝子の発現レベルを、対照と比較して決定するステップをさらに含む。
他の実施形態では、本発明は、臨床試験における複数のカテゴリーの1つに個体を割り当てる方法を提供し、その方法は、(a)前記個体をER、BRCA1;ER、散発性;ER+、ER/年齢 高値;ER+、ER/年齢 低値、LN+;またはER+、ER/年齢 低値、LNに分類するステップと、(b)前記個体について、前記個体がER、BRCA1に分類される場合には表1中に、前記個体がER、散発性に分類される場合には表2中に、前記個体がER+、ER/年齢 高値に分類される場合には表3中に、前記個体がER+、ER/年齢 低値、LN+に分類される場合には表4中に、または前記個体がER+、ER/年齢 低値、LNに分類される場合には表5中にそれに対するマーカーが列挙されている少なくとも2つの遺伝子の発現レベルを決定するステップと、(c)前記個体が予後良好または予後不良と相関する前記の少なくとも2つの遺伝子の発現パターンを有するかどうか判定するステップと、(d)前記個体が予後良好である場合に臨床試験における1つのカテゴリーに前記個体を割り当て、前記個体が予後不良である場合に前記臨床試験における第2のカテゴリーに前記個体を割り当てるステップとを含む。具体的な実施形態では、ステップ(a)で決定した前記個体の分類に基づいて、前記個体を前記臨床試験における1つのカテゴリーにさらに割り当てる。他の具体的な実施形態では、乳癌の任意の他の臨床上、表現型または遺伝子型の特徴に基づいて、前記個体を前記臨床試験におけるカテゴリーにさらに割り当てる。他の具体的な実施形態では、前記方法は、前記細胞試料中で、それに対するマーカーが表1〜5中に見られず乳癌の予後判定について情報提供性のある第2の複数の遺伝子の発現レベルを、対照と比較して決定するステップと、前記第1の複数の遺伝子に加えて、前記第2の複数の遺伝子の発現から、前記個体が予後良好であるか予後不良であるかを判定するステップとをさらに含む。
本発明はさらに、それに対するマーカーが表1〜5のいずれかに列挙されている複数の遺伝子に対して相補的かつハイブリダイズ可能なプローブを含むマイクロアレイを提供する。本発明はさらに、それに対するマーカーが表1中に列挙されている複数の遺伝子、それに対するマーカーが表1中に列挙されている各遺伝子、それに対するマーカーが表2中に列挙されている複数の遺伝子、それに対するマーカーが表2中に列挙されている各遺伝子、それに対するマーカーが表3中に列挙されている複数の遺伝子、それに対するマーカーが表3中に列挙されている各遺伝子、それに対するマーカーが表4中に列挙されている複数の遺伝子、それに対するマーカーが表4中に列挙されている各遺伝子、それに対するマーカーが表5中に列挙されている複数の遺伝子、またはそれに対するマーカーが表5中に列挙されている各遺伝子に対して相補的かつハイブリダイズ可能なプローブを含むマイクロアレイを提供する。本発明はさらに、上記マイクロアレイのいずれかを提供し、前記プローブは、前記マイクロアレイ上のプローブの少なくとも50%である。本発明はさらに、上記マイクロアレイのいずれかを提供し、前記プローブは、前記マイクロアレイ上のプローブの少なくとも90%である。本発明はさらに、それに対するマーカーが表1〜5のいずれかに列挙されている複数の遺伝子に対して相補的かつハイブリダイズ可能なプローブを含むマイクロアレイを提供し、前記プローブはそれに対するマーカーが表1中に列挙されている遺伝子の少なくとも75%に対して相補的かつハイブリダイズ可能であり、それに対するマーカーが表2中に列挙されている遺伝子の少なくとも75%に対して相補的かつハイブリダイズ可能であり、それに対するマーカーが表3中に列挙されている遺伝子の少なくとも75%に対して相補的かつハイブリダイズ可能であり、それに対するマーカーが表4中に列挙されている遺伝子の少なくとも75%に対して相補的かつハイブリダイズ可能であり、それに対するマーカーが表5中に列挙されている遺伝子の少なくとも75%に対して相補的かつハイブリダイズ可能であり、前記プローブは、合計で、前記マイクロアレイ上のプローブのうち少なくとも50%である。
本発明はさらに、密封容器中に上記マイクロアレイのいずれかを含むキットを含む。
本発明はさらに、ある状態について情報提供性のある遺伝子のセットを特定する方法を提供し、前記状態は複数の表現型または遺伝子型の特徴を有し、その結果前記の表現型または遺伝子型の特徴の少なくとも1つによって、特徴クラスの少なくとも1つに試料を分類することができ、前記方法は、(a)前記状態を有する個体由来の複数の試料を選択するステップと、(b)前記複数の試料を使用して前記特徴クラスについて情報提供性のある遺伝子の第1セットを特定するステップと、(c)前記複数の試料それぞれの特徴クラスを予測するステップと、(d)前記特徴クラスが誤って予測された試料を廃棄するステップと、(e)ステップ(c)および(d)を少なくとも1回反復するステップと、(f)ステップ(e)後に残存している前記複数の試料中の試料を使用して前記特徴クラスについて情報提供性のある遺伝子の第2セットを特定するステップとを含む。
本発明はさらに、臨床試験における複数のカテゴリーの1つに個体を割り当てる方法を提供し、その方法は、(a)ある状態の遺伝子型または表現型の特徴の少なくとも1つによって区別される複数の状態カテゴリーの1つに個体を分類するステップと、(b)前記個体に由来する試料中で、前記状態カテゴリーについて情報提供性のある複数の遺伝子の発現レベルを決定するステップと、(c)前記複数の遺伝子の前記発現レベルから、個体が予後良好であるか、または予後不良であることが示唆されるかどうか判定するステップと、(d)予後判定に基づいて臨床試験における1つのカテゴリーに個体を割り当てるステップとを含む。
本発明はまた、生物中において、ある状態について情報提供性のある遺伝子またはマーカーの1つ以上のセットを特定する方法をも提供し、その方法は、(a)生物の1つまたは複数の臨床上、表現型または遺伝子型の特徴に基づいて、前記状態にある生物の複数の個体またはそれに由来する試料を複数のクラスに細分し、その各クラスは、それぞれがそのクラスに特異的な1つまたは複数の臨床上、表現型または遺伝子型の特徴を有する生物の複数の個体またはそれに由来する試料からなるステップと、(b)前記複数のクラスの1つまたは複数それぞれに関して、前記クラス中の個体において前記状態について情報提供性のある遺伝子またはマーカーのセットを特定することを試みるステップとを含み、前記クラス中の個体において前記状態について情報提供性のある遺伝子またはマーカーのセットが前記複数のクラスの前記1つまたは複数のいずれかに関して得られる場合、前記の遺伝子またはマーカーのセットは、前記生物中において、前記状態について情報提供性のある遺伝子またはマーカーのセットとみなされる。
一実施形態では、その方法はさらに、前記クラス中の個体において当該状態について情報提供性のある遺伝子またはマーカーのセットを得ることができない前記クラスの1つまたは複数それぞれに関して、前記クラス中の前記複数の個体またはそれに由来する試料に対して前記ステップ(a)および(b)を反復するステップをさらに含み、その結果、前記クラス中の前記複数の個体またはそれに由来する試料が、前記クラスを定義するのに使用したものと異なる、前記生物の1つまたは複数の臨床上、表現型または遺伝子型の特徴に基づいて複数のさらなるクラスに細分され、前記複数のさらなるクラスそれぞれに関して、前記クラス中の個体において前記状態について情報提供性のある遺伝子またはマーカーのセットが得られる場合、前記の遺伝子またはマーカーのセットは、前記生物中において、前記状態について情報提供性のある遺伝子またはマーカーのセットとみなされる。
本発明はまた、生物中において、ある状態について情報提供性のある遺伝子またはマーカーの1つまたは複数のセットを特定する方法をも提供し、その方法は、(a)前記生物の1つまたは複数の臨床上、表現型または遺伝子型の特徴に基づいて、前記状態にある前記生物の複数の個体またはそれに由来する試料を複数のクラスに細分し、各前記クラスは、それぞれが前記クラスに特異的な前記1つまたは複数の臨床上、表現型または遺伝子型の特徴を有する前記生物の複数の個体またはそれに由来する試料からなるステップと、(b)前記複数のクラスの1つまたは複数それぞれに関して、前記クラス中の個体において前記状態について情報提供性のある遺伝子またはマーカーのセットを特定することを試み、前記クラス中の個体において前記状態について情報提供性のある遺伝子またはマーカーのセットが前記クラスの前記1つまたは複数のいずれかに関して特定される場合、前記の遺伝子またはマーカーのセットは、前記生物中において、状態について情報提供性のある遺伝子またはマーカーのセットとみなされるステップと、(c)前記クラス中の個体において前記状態について情報提供性のある遺伝子またはマーカーのセットを得ることができない前記クラスの1つまたは複数それぞれに関して、前記クラス中の前記複数の個体またはそれに由来する試料に対して前記ステップ(a)および(b)を反復するステップとを含み、その結果、前記クラス中の前記複数の試料または個体が、前記クラスを定義するのに使用したものと異なる、前記生物の1つまたは複数の臨床上、表現型または遺伝子型の特徴に基づいて複数のさらなるクラスに細分され、前記複数のさらなるクラスの1つまたは複数それぞれに関して、前記クラス中の個体において前記状態について情報提供性のある遺伝子またはマーカーのセットが得られる場合、前記の遺伝子またはマーカーのセットは、前記生物中において、状態について情報提供性のある遺伝子またはマーカーのセットとみなされる。
本発明の方法では、その状態はある種の癌でもよい。そのような実施形態では、前記の遺伝子またはマーカーの各セットは、対応するクラス中における個体の予後についての情報提供性を有する可能性がある。一実施形態では、その状態は乳癌であり、1つまたは複数の臨床上、表現型または遺伝子型の特徴は、年齢、ERレベル、ER/年齢、BRAC1状態、およびリンパ節の状態を含む。
一実施形態では、本発明の方法は、選択された予後レベルを有する複数の患者における遺伝子またはマーカーのレベルを表す、前記クラスについて情報提供性のある遺伝子またはマーカーのセットの遺伝子またはマーカーのレベルの測定値を含むテンプレートプロファイルを作成するステップをさらに含む。
本発明はまた、乳癌患者を予後良好または予後不良と予測する方法を提供し、その方法は、(a)以下のクラス:(a1)ER、BRCA1;(a2)ER、散発性;(a3)ER+、ER/年齢 高値;(a4)ER+、ER/年齢 低値、LN+;または(a5)ER+、ER/年齢 低値、LNの1つに前記乳癌患者を分類するステップと、(b)前記乳癌患者から得られた細胞試料中における、(b1)前記乳癌患者がER、BRCA1に分類される場合には表1中のマーカーに、(b2)前記乳癌患者がER、散発性に分類される場合には表2中のマーカーに、(b3)前記乳癌患者がER+、ER/年齢 高値に分類される場合には表3中のマーカーに、(b4)前記乳癌患者がER+、ER/年齢 低値、LN+に分類される場合には表4中のマーカーに、または(b5)前記乳癌患者がER+、ER/年齢 低値、LNに分類される場合には表5中のマーカーに対応する遺伝子またはマーカーを少なくとも2つ含む複数の遺伝子またはマーカーの測定値を含むプロファイルを決定するステップと、(c)前記複数の遺伝子またはマーカーの前記プロファイルに基づいて前記乳癌患者を予後良好または予後不良に分類するステップとを含み、ERは高いERレベルを示し、ERは低いERレベルを示し、前記ER/年齢は、前記患者の年齢に対する前記ERレベルの計量値であり、LNは、前記患者中でリンパ節状態が0より大きいことを示し、LNは、前記患者中でリンパ節状態が0であることを示す。
一実施形態では、ステップ(c)は、前記プロファイルを予後良好なテンプレートおよび/または予後不良なテンプレートと比較するステップを含む方法によって実施され、前記患者は、前記プロファイルが予後良好なテンプレートと類似性が高く、または予後不良なテンプレートと類似性が低い場合には予後良好に、あるいは前記プロファイルが予後良好なテンプレートと類似性が低く、または予後不良なテンプレートと類似性が高い場合には予後不良に分類される。予後良好なテンプレートは、転帰が良好な複数の患者における前記遺伝子またはマーカーのレベルを表す前記複数の遺伝子またはマーカーの測定値を含むが、予後不良なテンプレートは、転帰が不良な複数の患者における前記遺伝子またはマーカーのレベルを表す前記複数の遺伝子またはマーカーの測定値を含む。本明細書では、転帰が良好な患者とは、最初の診断後第1の期間内に転移の再発がない乳癌患者であるが、転帰が不良な患者とは、最初の診断後第2の期間内に転移の再発がある乳癌患者である。
他の実施形態では、乳癌患者の予後を予測する方法は、前記プロファイル、前記ERレベル、前記LN状態、および/または前記ER/年齢を決定するステップをさらに含む。一実施形態では、前記プロファイルは、前記患者に由来する試料中における複数の転写産物の測定値を含む発現プロファイルであり、前記の予後良好なテンプレートは、前記の転帰が良好な複数の患者における前記転写産物の発現レベルを表す前記複数の転写産物の測定値を含み、前記の予後不良なテンプレートは、前記の転帰が不良な複数の患者における前記転写産物の発現レベルを表す前記複数の転写産物の測定値を含む。
一実施形態では、前記発現プロファイルは、対照試料中における前記複数の転写産物の測定値に対する、前記患者に由来する前記試料中における前記複数の転写産物の差次的な測定値を含む差次的発現プロファイルである。
一実施形態では、前記の予後良好なテンプレート中における前記各転写産物の測定値は、前記の転帰が良好な複数の患者中における前記転写産物の発現レベルの平均である。
一実施形態では、前記の予後良好なまたは予後不良なテンプレートとの前記発現プロファイルの類似性は、前記発現プロファイルと、前記の予後良好なまたは予後不良なテンプレートそれぞれとの相関係数によって表され、相関係数が相関の閾値より、例えば0.5より大きいと、類似性が高いことが示唆され、前記相関係数が前記相関閾値以下であると、類似性が低いことが示唆される。
他の実施形態では、前記の予後良好なまたは予後不良なテンプレートとの前記発現プロファイルの類似性は、細胞成分プロファイルと、前記の予後良好なまたは予後不良なテンプレートそれぞれとの隔たりによって表され、隔たりが所与の値未満であると、類似性が高いことが示唆され、隔たりが前記の所与の値以上であると、類似性が低いことが示唆される。
他の実施形態では、前記プロファイルは、前記患者に由来する試料中における複数のタンパク質種の測定値を含み、前記の予後良好なテンプレートは、前記の転帰が良好な複数の患者における前記タンパク質種のレベルを表す前記複数のタンパク質種の測定値を含み、前記の予後不良なテンプレートは、前記の転帰が不良な複数の患者における前記タンパク質種のレベルを表す前記複数のタンパク質種の測定値を含む。
一実施形態では、前記ERレベルは、前記対照試料中における前記エストロゲン受容体をコードする遺伝子、例えば、エストロゲン受容体α遺伝子の発現レベルと比較しての、前記患者中における前記遺伝子の発現レベルを測定することによって決定され、前記ERレベルは、前記発現レベルのlog10(比)が−0.65より大きい場合にはERに分類され、前記ERレベルは、前記発現レベルのlog10(比)が−0.65以下である場合にはERに分類される。
一実施形態では、前記ER/年齢は、前記ERレベルがc(年齢−d)より高い場合には高値に分類され、前記ER/年齢は、前記ERレベルがc(年齢−d)以下である場合には低値に分類され、式中cは係数であり、年齢は前記患者の年齢であり、dは年齢の閾値である。
具体的な実施形態では、前記エストロゲン受容体レベルは、登録番号NM_000125の遺伝子に対応する転写産物を検出するポリヌクレオチドプローブによって測定され、前記対照試料は、様々な患者の乳癌細胞のプールであり、c=0.1であり、d=42.5である。
一実施形態では、前記対照試料は、複数の乳癌患者に由来する前記複数の転写産物のcDNAを一緒にプールすることによって作製される。他の実施形態では、前記対照試料は、前記遺伝子の前記複数の転写産物および前記エストロゲン受容体をコードする前記転写産物の合成cDNAを一緒にプールすることによって作製される。
一実施形態では、前記個体はER、BRCA1であり、前記複数の遺伝子はそれに対するマーカーが表1中に列挙されている遺伝子を少なくとも2つ含む。一実施形態では、前記個体はER、BRCA1であり、前記複数の遺伝子はそれに対するマーカーが表1中に列挙されている遺伝子をすべて含む。
他の実施形態では、前記個体はER、散発性であり、前記複数の遺伝子はそれに対するマーカーが表2中に列挙されている遺伝子を少なくとも2つ含む。一実施形態では、前記個体はER、散発性であり、前記複数の遺伝子はそれに対するマーカーが表2中に列挙されている遺伝子をすべて含む。
さらに他の実施形態では、前記個体はER+、ER/年齢 高値であり、前記複数の遺伝子はそれに対するマーカーが表3中に列挙されている遺伝子を少なくとも2つ含む。一実施形態では、前記個体はER+、ER/年齢 高値であり、前記複数の遺伝子はそれに対するマーカーが表3中に列挙されている遺伝子をすべて含む。
さらに他の実施形態では、前記個体はER+、ER/年齢 低値、LN+であり、前記複数の遺伝子はそれに対するマーカーが表4中に列挙されている遺伝子を少なくとも2つ含む。一実施形態では、前記個体はER+、ER/年齢 低値、LN+であり、前記複数の遺伝子はそれに対するマーカーが表4中に列挙されている遺伝子をすべて含む。
さらに他の実施形態では、前記個体はER+、ER/年齢 低値、LNであり、前記複数の遺伝子はそれに対するマーカーが表5中に列挙されている遺伝子を少なくとも2つ含む。一実施形態では、前記個体はER+、ER/年齢 低値、LNであり、前記複数の遺伝子はそれに対するマーカーが表5中に列挙されている遺伝子をすべて含む。
一実施形態では、前記プロファイルは、それに対するマーカーが表1〜5中に見られず予後判定について情報提供性のある1つまたは複数の遺伝子をさらに含む。
本発明はまた、臨床試験における複数のカテゴリーの1つに個体を割り当てる方法を提供し、その方法は、上記に記載の方法のいずれかによって決定されるときに前記個体が予後良好である場合、臨床試験における1つのカテゴリーに前記個体を割り当て、上記に記載の方法のいずれかによって決定されるときに前記個体が予後不良である場合、前記臨床試験における第2のカテゴリーに前記個体を割り当てるステップを含む。
一実施形態では、前記プロファイル、前記ERレベル、前記LN状態、および/または前記ER/年齢を基礎とする前記個体の分類に基づいて、前記臨床試験における1つのカテゴリーに前記個体をさらに割り当てる。
一実施形態では、乳癌の1つまたは複数の他の臨床上、表現型または遺伝子型の特徴に基づいて、前記臨床試験における1つのカテゴリーに前記個体をさらに割り当てる。
一実施形態では、その方法は、前記細胞試料中で、それに対するマーカーが表1〜5中に見られない前記1つまたは複数の遺伝子の発現レベルを決定するステップと、前記1つまたは複数の遺伝子の前記発現レベルから、前記個体が予後良好であるか予後不良であるかを判定するステップとをさらに含む。
4.図面の簡単な説明
図1は、情報提供性のある予後関連遺伝子の特定に使用した、5つの患者サブセットが生じた決定樹を描いた図である。
図2:ERレベルと年齢との関係を示す図である。(A)ER+患者の年齢に対するERの散布図である。黒色点は転移のない試料を示し、灰色点は転移のある試料を示す。ER+群の患者は、「ER+、ER/年齢 高値」の群(黒色線の上にある)および「ER+、ER/年齢 低値」の群(黒色線の下にある)に細分することができることが明らかである。黒色線は、ER=0.1(年齢−42.5)で近似され、点線は、ER=0.1(年齢−50)で近似される。各集団内で、ERレベルも年齢とともに増大する。(B)ER+試料におけるすべての患者の年齢分布を示す図である。二峰性分布が観察される。(C)ER+試料におけるすべての患者の、調整した年齢(年齢−10)に対するERの分布を示す図である。二峰性分布が観察される。(D)転移のある試料の年齢分布を示す図である。(E)転移のある試料の、調整した年齢に対するERの分布を示す図である。この分布中で現れる3つのピークは多型性を示唆する。
図3:「ER/散発性」の群についての分類指標の性能を示す図である。(A)疾患の転帰の予測についての1点除外相互検証(LOOCV)から得られた、分類指標中で使用されるレポーター遺伝子の数の関数としてのエラー率を示す図である。(B)良好な群に対する相関(X軸)と、不良な群に対する相関(Y軸)の間の散布図である。丸印は転移のない試料を示し、四角印は転移のある試料を示す。点線:不良と良好を分離するための閾値。(C)転帰が良好な群に関して算出されたエラー率(良好の合計数で割った、不良と誤って分類された良好な転帰)、もしくは転帰が不良な群に関して算出されたエラー率(不良の合計数で割った、良好と誤って分類された不良な転帰)、または2つの率の平均を示す図である。
図4:「ER+、ER/年齢 高値」の群についての分類指標の性能を示す図である。(A)疾患の転帰の予測についての1点除外相互検証(LOOCV)から得られた、分類指標中で使用されるレポーター遺伝子の数の関数としてのエラー率を示す図である。(B)良好な群に対する相関(X軸)と、不良な群に対する相関(Y軸)の間の散布図である。丸印は転移のない試料を示し、四角印は転移のある試料を示す。点線:不良と良好を分離するための閾値。(C)転帰が良好な群に関して算出されたエラー率(良好の合計数で割った、不良と誤って分類された良好な転帰)、もしくは転帰が不良な群に関して算出されたエラー率(不良の合計数で割った、良好と誤って分類された不良な転帰)、または2つの率の平均を示す図である。
図5:「ER+、ER/年齢 低値/LN」の群についての分類指標の性能を示す図である。(A)疾患の転帰の予測についての1点除外相互検証(LOOCV)から得られた、分類指標中で使用されるレポーター遺伝子の数の関数としてのエラー率を示す図である。(B)良好な群に対する相関(X軸)と、不良な群に対する相関(Y軸)の間の散布図である。丸印は転移のない試料を示し、四角印は転移のある試料を示す。点線は、不良と良好を分離するための閾値を示す。(C)転帰が良好な群に関して算出されたエラー率(良好の合計数で割った、不良と誤って分類された良好な転帰)、もしくは転帰が不良な群に関して算出されたエラー率(不良の合計数で割った、良好と誤って分類された不良な転帰)、または2つの率の平均を示す図である。
図6:「ER+、ER/年齢 低値/LN+」の群についての分類指標の性能を示す図である。(A)疾患の転帰の予測についての1点除外相互検証(LOOCV)から得られた、分類指標中で使用されるレポーター遺伝子の数の関数としてのエラー率を示す図である。(B)良好な群に対する相関(X軸)と、不良な群に対する相関(Y軸)の間の散布図である。丸印は転移のない試料を示し、四角印は転移のある試料を示す。点線:不良と良好を分離するための閾値。(C)転帰が良好な群に関して算出されたエラー率(良好の合計数で割った、不良と誤って分類された良好な転帰)、もしくは転帰が不良な群に関して算出されたエラー率(不良の合計数で割った、良好と誤って分類された不良な転帰)、または2つの率の平均を示す図である。
図7:「ER、BRCA1」の群についての分類指標の性能を示す図である。(A)疾患の転帰の予測についての1点除外相互検証(LOOCV)から得られた、分類指標中で使用されるレポーター遺伝子の数の関数としてのエラー率を示す図である。(B)良好な群に対する相関(X軸)と、不良な群に対する相関(Y軸)の間の散布図である。丸印は転移のない試料を示し、四角印は転移のある試料を示す。点線:不良と良好を分離するための閾値。(C)転帰が良好な群に関して算出されたエラー率(良好の合計数で割った、不良と誤って分類された良好な転帰)、もしくは転帰が不良な群に関して算出されたエラー率(不良の合計数で割った、良好と誤って分類された不良な転帰)、または2つの率の平均を示す図である。
図8:患者の部分集団中で重要な生物学的機能を表す遺伝子のヒートマップである。A:細胞周期遺伝子は、ER/年齢 高値の患者における転帰の予測性がある。B:細胞周期遺伝子は、「ER−および散発性」の患者における転帰の予測性がない。C:解糖遺伝子は、ER/年齢 低値およびLN−である患者における転帰の予測性がある。D:解糖遺伝子は、「ER−およびBRCA1」の患者における転帰の予測性がない。
5.発明の詳細な説明
5.1 序論
本発明は、疾患などの状態を有する個体を1つまたは複数の個体のサブセットに分類する方法を提供し、各サブセット中の個体は、その状態の1つまたは複数の表現型または遺伝子型の特徴によって特徴付けられる。個体は、真核生物または原核生物でもよく、ヒト、霊長類、げっ歯類、ネコ、イヌなどを含むがそれだけに限らない哺乳動物、鳥類、爬虫類、魚類などの動物でもよい。本明細書において「個体」はまた、細菌や酵母などの単細胞生物、またはそのコロニーをも包含する。状態は、癌などの疾患でもよく、乳癌などの特定の癌でもよい。状態はまた、毒素、汚染物質、薬物への曝露や、都市地域または工業地域の近傍などの環境状態でもよい。
本発明は、状態の臨床的、生物学的または生化学的パラメーターと、遺伝子発現パターンのデータの組合せを使用することにより、癌、例えば乳癌などの状態を有する、またはその状態を有することが疑われる個体の予後を判定する方法を提供する。予後判定では、選択されるパラメーターは、好ましくは、その状態の進行および/または転帰に関し、またはそれに影響を及ぼす。特定の状態を有する個体のサブセット内での遺伝子発現のパターンにより、そのサブセットについて、例えばそのサブセット内での予後判定について情報提供性のある、サブセット内での遺伝子のセットが特定される。一般に、特定のサブセット内で予後判定について情報提供性のある遺伝子のセットの特定が成功すると、状態サブセットへの個体の分類の基礎となる、状態の複数の臨床的、生物学的または生化学的パラメーターの選択が正当化される。
乳癌の例では、患者群は、年齢、リンパ節(LN)の状態、エストロゲン受容体(ER)レベル、およびBRCA1突然変異の状態の少なくとも1つに従って、別個の患者サブセットに最初に分類される。これらの臨床的なファクターは、腫瘍の病因、ならびに疾患の転帰における違いに関係している。これらの特徴は、限定的なものではない;個体を分類するために、乳癌の他の遺伝子型または表現型の特徴、例えば、腫瘍の段階、腫瘍のサイズ、腫瘍細胞型などを、単独でまたは本明細書に列挙したものと組み合わせて使用することもできる。これらのパラメーターに関連する、遺伝子発現または腫瘍の運命の違いは、腫瘍の起源および腫瘍の発生の違いをおそらく表すものであり、したがって腫瘍の層別化にふさわしい候補である。次いで、各サブセット内で予後判定に情報提供性のある遺伝子セットを特定する。次いで、同じ基準を使用して新たな乳癌患者を分類し、その患者が属する患者サブセットに特異的な遺伝子セットに基づいて予後判定を行う。予後分類指標を構築する過程では、腫瘍の転帰に関連する均一なパターンに特に注意する。そのような均一な予後のパターンの出現から、サブセット内で最も一般的な機構が示唆される可能性がある。同時に、そのようなパターンの特定が成功すると、腫瘍の層別化に使用されるパラメーターも正当化される。mRNA単独の手法とこの手法とを区別するために、臨床データを遺伝子発現データと統合する現在の手法を、本明細書において「包括的予後判定」と称する。
5.2 定義
本明細書において、「BRCA1腫瘍」または「BRCA1型」とは、BRCA1遺伝子座の突然変異を含む細胞を有する腫瘍を意味する。
相関の「絶対振幅」とは、相関の絶対値を意味する;例えば、−0.35と0.35の両方の相関係数は、絶対振幅が0.35である。
「マーカー」とは、細胞成分、または細胞成分の修飾物(例えば、遺伝子全体、その遺伝子に由来するEST、その遺伝子によってコードされるタンパク質、そのタンパク質の翻訳後修飾物など)を意味し、その発現またはレベルは、特定の状態の間で変化する。その成分の特徴の変化が特定の状態と相関する場合、その成分は、その状態のマーカーである。
「マーカー由来のポリヌクレオチド」とは、マーカー遺伝子から転写されるRNA、それから産生される任意のcDNAまたはcRNA、およびマーカー遺伝子に対応する遺伝子に由来する配列を有する合成核酸などそれに由来する任意の核酸を意味する。
「類似値」とは、比較する2つの物の間にある類似性の程度を表す数である。例えば、類似値は、特定の表現型に関連するマーカーについての、患者の発現プロファイルと、その表現型に特異的なテンプレートとの間の全体的な類似性(例えば、その表現型が予後良好である場合、「予後良好な」テンプレートとの類似性)を示す数でもよい。類似値は、相関係数などの類似性の計量値として表してもよく、あるいは、患者試料とテンプレートの間にある発現レベルの差、または発現レベルの差の総計として単純に表してもよい。
「患者サブセット」とは、個体の群であり、そのすべてが特定の状態を有し、または特定の状態にあり、その状態の、またはその状態に対する反応の1つまたは複数の表現型、遺伝子型または臨床上の特徴によりその状態を有する他の個体と区別される。例えば、その状態が乳癌である場合、個体は、「ER」または「ER」の患者サブセットに属する可能性もあり、あるいは特定の年齢群の患者サブセットに属する可能性もある。
遺伝子および/またはマーカーは、その遺伝子および/またはマーカーの発現が、状態、表現型、遺伝子型または臨床上の特徴と、偶然に予想されるよりも大きく相関または反相関する場合に、その状態、表現型、遺伝子型または臨床上の特徴について「情報提供性がある」。
個体のERレベルが所与の年齢についての閾値より高い場合に、所与の年齢の個体を「ER/年齢 高値」に分類することができる。閾値は年齢依存的である、すなわち異なる各年齢について閾値が異なる可能性がある。一実施形態では、年齢依存的な閾値は、c(年齢−d)として算出され、式中cは係数であり、年齢は患者の年齢であり、dは年齢の閾値である。パラメーターcおよびdは、用いたERレベルおよび年齢に依存する。それらは、患者のERレベル・年齢の分布を、ERレベル・年齢の依存関係がそれぞれ異なる2つの部分集団の二峰性分布に適合させることによって決定することができる。具体的な実施形態では、ER発現レベルのlog(比)で表されるERレベルについてc=0.1およびd=42.5を使用する。したがって、例えば、この実施形態において45歳の個体についての閾値は0.1(45−42.5)、すなわち0.25であり、その個体のER発現レベルのlog(比)が0.25以上である場合には、その個体は「ER/年齢 高値」に分類され、その他の場合には、その個体は「ER/年齢 低値」に分類される。
5.3 診断および予後判定用マーカーセットの特定
5.3.1 状態サブセットの特定
本発明は、乳癌の診断および予後判定に有用な遺伝子および/またはマーカーのセットを特定する方法を提供する。より一般には、本発明はまた、他の癌の診断または予後判定に有用な遺伝子および/またはマーカーのセットを特定する方法をも、さらに一般には、疾患や特定の環境状態への曝露など、特定の状態を有する個体の部分集団間の鑑別に有用な遺伝子および/またはマーカーのセットを特定する方法をも提供する。
その方法は、それについて複数の表現型または遺伝子型のサブセットを特定することができるいずれの状態にも適用することができる。その状態は、疾患でもよく、例えば、その状態は、癌、自己免疫疾患、炎症性疾患、感染症、神経疾患、変性疾患などでもよい。その状態は、環境的なものでもよく、例えば、その状態は、特定の食事、地理的位置などでもよく、その状態は、例えば、薬物、毒素、発癌物質、食品、毒物、吸入化合物、摂取化合物などをはじめとする化合物への曝露でもよく、その状態は、医学的状態に対する特定の遺伝的背景または素因などでもよい。
状態が癌である場合、その状態は、いずれの癌でもよく、例えば、それだけに限らないが、急性白血病、急性リンパ性白血病、急性骨髄性白血病、骨髄芽球性白血病、前骨髄球性白血病、骨髄単球性白血病、単球性白血病、および赤白血病をはじめとする白血病;慢性骨髄性(顆粒球性)白血病や慢性リンパ性白血病などの慢性白血病;真性赤血球増加症;ホジキン病や非ホジキン病などのリンパ腫;多発性骨髄腫;ワルデンストレームマクログロブリン血症;H鎖病;肉腫および癌腫、線維肉腫、粘液肉腫、脂肪肉腫、軟骨肉腫、骨原性肉腫、脊索腫、血管肉腫、内皮肉腫、リンパ管肉腫、リンパ管内皮肉腫、滑膜腫、中皮腫、ユーイング腫瘍、平滑筋肉腫、横紋筋肉腫、結腸癌、膵癌、乳癌、卵巣癌、前立腺癌、扁平上皮癌、基底細胞癌、腺癌、汗腺癌、脂腺癌、乳頭癌、乳頭腺癌、嚢胞腺癌、髄様癌、気管支癌、腎細胞癌、肝癌、胆管癌、絨毛癌、精上皮腫、胎児性癌、ウィルムス腫瘍、子宮頚癌、精巣腫瘍、肺癌、小細胞肺癌、膀胱癌、上皮癌、神経膠腫、星状細胞腫、髄芽腫、頭蓋咽頭腫、上衣腫、松果体腫、血管芽細胞腫、聴神経腫、乏突起神経膠腫、髄膜腫、黒色腫、神経芽細胞腫や網膜芽細胞腫などの固形癌でよい。
最初の段階で遺伝子発現パターンにより患者などの個体または患者に由来する腫瘍試料を層別するのではなく、ある状態について情報提供性のある遺伝子のセットを特定する方法は、その状態を有する、またはその状態によって影響を受けている個体のより大きなクラスの中で、個体の表現型、遺伝子型または臨床上のサブセットを特定することから開始する。
一実施形態では、その状態は癌であり、サブセットは、癌の表現型、遺伝子型および/または臨床上の特徴によって区別される。この実施形態では、個体の群は、癌に関連する1つまたは複数の表現型、遺伝子型または臨床上の特徴に従って、患者サブセットに分類される。患者集団を患者サブセットに細分するプロセスにおける任意のステップで、特定の患者サブセットについて予後情報提供性のある遺伝子セットを特定することができるかどうかを確認するために、1つまたは複数の遺伝子の発現レベルを決定することができる。情報提供性遺伝子セットが特定されたが、望ましいほど情報提供性がなかった場合、患者サブセットをさらに分け、新たな遺伝子セットを特定することができる。これらのサブセットをさらに細分することができる。例えば、表現型、遺伝子型または臨床上の特徴Aに基づいて、特定の癌に罹患している個体の群を最初にサブセットS1およびS2に分類することができる。次いで、これらのサブセット内で予後判定について情報提供性のある遺伝子のセットを特定するために、サブセットS1またはS2に属する個体から得られた腫瘍試料中で複数の遺伝子の発現レベルを決定する。次いで、他の表現型、遺伝子型または臨床上の特徴に基づいて、サブセットS1およびS2を2つ以上のサブセットにそれぞれ細分する。もし行うならば、細分の基準は、S1とS2で同じである必要はない。例えば、様々な実施形態では、S1は細分されないが、S2は特徴Bに基づいて細分される;またはS1は特徴Bに基づいて細分されるが、S2は細分されない;またはS1とS2は特徴Bに基づいてどちらも細分される;またはS1は特徴Bに基づいて細分されるが、S2は特徴Cに基づいて細分される;などとなる。複数の患者サブセットを誘導する特定の決定基盤(decision matrix)では、好ましい結果は、各患者サブセットについて予後情報提供性のある遺伝子セットである。異なる決定基盤により、異なる患者サブセットを誘導することができ、そのサブセットによって、予後情報提供性のある遺伝子の異なるセットを得ることができる。
乳癌の具体例では、複数の表現型、遺伝子型または臨床上の指標を使用して、患者を複数の患者サブセットのうちの1つの構成要素に分類し、その指標は、医学的、生化学的または遺伝的に乳癌と関連する。例えば、それだけに限らないが、エストロゲン受容体(ER)状態、腫瘍の型(すなわち、BRCA1型または散発性)、リンパ節の状態、癌の段階、腫瘍の浸潤性、または年齢を含めた基準に基づいて、患者の群を患者サブセットに分類することができる。「BRCA1型」は、BRCA1の突然変異が存在することを示す。各分類ステップでは、サブセットの決定に使用する特徴に応じて、2つのクラスだけ、例えばER+またはER、あるいは3つ以上のサブセット(例えば、腫瘍の段階による)に癌患者の群を分類することができる。本明細書において、「ER+」は、エストロゲン受容体がいくらか高いレベルで発現することを示す;例えば、それはエストロゲン受容体が検出可能な程度に発現し、または10%を超える細胞でその受容体が組織染色されることなどを示す。反対に、「ER−」は、エストロゲン受容体が低いレベルで発現するか、またはまったく発現しないことを示す;例えば、それはその受容体の発現が検出可能でなく、または10%以下の細胞でしかその受容体が組織染色されないことなどを示す。各表現型クラスについて最適化されたマーカー遺伝子セットは、サブセットが確立した後で決定することが好ましい。対象とする状態の特定の特徴により他のサブセットと区別される特定の患者サブセットについて情報提供性のあるマーカーを決定することができない場合、複数の第2の患者サブセットを作成するために、状態の他の特徴によってそのサブセットをさらに分けることができ、その後この第2の患者サブセットについて情報提供性のある遺伝子を特定することができる。
図1は、実施例で説明する、予後判定について情報提供性のある遺伝子を特定する準備において、乳癌に関連する表現型および遺伝子型の特徴に従って乳癌患者の集合を細分するプロセスを示す。乳癌の腫瘍試料の集合は、エストロゲン受容体の状態によって最初に細分した。エストロゲン受容体の存在の有無が他の遺伝子の発現に大いに影響を及ぼすので、ER状態を選択した。ER+の患者サブセットでは、患者が年齢に対するERレベルで二峰性に分布しているように見えた、すなわち、年齢に対するERレベルの依存性が、図2A中の実線によって分離される2つのクラスに入る傾向があったことに注目した。この二峰性を使用して、ER+の個体を、「ER+、ER/年齢 高値」の個体および「ER+、ER/年齢 低値」の個体にさらに細分した。ER+、ER/年齢 高値の患者サブセットについて情報提供性遺伝子のセットを特定した。しかし、ER+、ER/年齢 低値のサブセットについて情報提供性セットが特定されなかったので、患者のサブセットをLN+およびLN−の個体にさらに分けた。したがって、一実施形態では、本発明は、複数の表現型もしくは遺伝子型の特徴を含む状態について情報提供性のある遺伝子またはマーカーのセットを特定する方法を提供し、その方法は、(a)1つの表現型もしくは遺伝子型の特徴に基づいて、複数の第1クラスに複数の試料または個体をそれぞれ分類するステップと、(b)前記各第1クラス内で、情報提供性のある遺伝子またはマーカーのセットを特定するステップとを含み、前記各第1クラス内での前記の情報提供性のある遺伝子またはマーカーのセットは、前記クラスにユニークなものである。
5.3.2 患者サブセットについて情報提供性のあるマーカーセットの特定
患者サブセットを特定した後、予後などの特定の結果について情報提供性のあるマーカー(遺伝子など)を特定することができる。一実施形態では、マーカーセットを特定する方法は下記の通りである。この例は、マーカーとしての遺伝子および遺伝子由来の核酸の使用について説明するものであるが、タンパク質または他の細胞成分を状態のマーカーとして使用することができる。
標的ポリヌクレオチドを抽出し標識した後、試料X中における複数のマーカー(遺伝子など)の発現を、標準または対照中における複数のマーカーの発現と比較する。一実施形態では、標準または対照は、複数の正常な個体、または特定の状態に曝露されて複数の個体の1つまたは複数の試料に由来する標的マーカー(ポリヌクレオチド分子など)を含む。例えば、対照の、または正常な個体は、対象とする特定の疾患または状態を有しない者(例えば、乳癌が対象の疾患である場合、乳癌で苦しんでいない個体)でもよく、あるいは、特定の環境状態に曝露されていない個体でもよい。標準または対照はまた、試料Xを得た個体と異なる形態または段階の同じ疾患を有する個体、異なる疾患または異なる状態を有する個体、あるいは異なる状態に曝露されたかまたはその状態にある個体に由来する1つまたは複数の試料に由来する標的ポリヌクレオチド分子をも含む。対照は、例えば、状態の進行、または治療の経過に対する応答を評価するために、早い時期に個体から得られた試料、または試料のセットでもよい。
好ましい実施形態では、標準または対照は、標的ポリヌクレオチド分子のプールである。しかし、タンパク質レベル、または他のいずれかの対応する生体分子のレベルを比較する場合には、そのプールは、タンパク質または対応する生体分子のプールでもよい。乳癌との関連で好ましい実施形態では、そのプールは、散発型腫瘍を有する多数の個体から得られた試料を含む。
他の好ましい実施形態では、そのプールは、腫瘍試料に由来するマーカー由来核酸のプール中で認められる各マーカーに由来する核酸のレベルを概算するのに設計された、人工的に作製された核酸の集団を含む。他の実施形態では、「数学的試料プール」とも呼ばれるそのプールは、物理的なポリヌクレオチドのセットではなく発現値のセットによって表される;疾患などの状態を有する個体由来の試料中における関連マーカーの発現レベルを、数学的試料プール中での同じマーカーの発現の対照レベルを表す値と比較する。そのような対照は、コンピュータに記憶されている値のセットでもよい。そのような人工的または数学的な対照は、対象とするどんな状態についても構築することができる。
乳癌に特異的な他の実施形態では、そのプールは、正常なまたは乳癌の細胞株または細胞株の試料に由来する。好ましい実施形態では、そのプールは、特定の患者サブセット内の個体、例えば「ER+、ER/年齢 高値」の個体から得られた試料を含み、前記各個体は予後良好であるか、または前記各個体は予後不良である。もちろん、例えば発現タンパク質をマーカーとして使用する場合、そのタンパク質は個体の試料から得られ、標準または対照は、多数の正常な個体に由来するタンパク質のプール、または乳癌の特定の予後である個体に由来する試料のプールなどある状態の特定の状態を有する多数の個体に由来するものでもよい。
当該技術分野で公知の任意の手段によってその比較を行うことができる。例えば、アガロースまたはポリアクリルアミドゲル中でマーカーに由来する標的ポリヌクレオチド分子(例えば、RNAまたはcDNA)を分離し、その後、マーカー特異的なオリゴヌクレオチドプローブでハイブリダイゼーションを行うことによって、様々なマーカーの発現レベルを評価することができる。あるいは、その比較は、標的ポリヌクレオチド分子を標識し、その後配列決定用ゲル上で分離することによって行うこともできる。患者および対照または標準のポリヌクレオチドが隣接したレーンに入るようにポリヌクレオチド試料をゲル上に置く。視覚的に、またはデンシトメーターによって発現レベルの比較を行う。好ましい実施形態では、マイクロアレイへのハイブリダイゼーションによってすべてのマーカーの発現を同時に評価する。各手法において、特定の基準を満たしたマーカーを、乳癌の予後判定について情報提供性のあるものと認める。
標準または対照の状態と比較した、疾患などの状態における発現の有意差に基づいてマーカー遺伝子を選択する。例えば、対象とする試料のセット内でマーカー遺伝子が有意な変化を示すかどうかを判定することによって、マーカー遺伝子をスクリーニングすることができる。試料のセット内で有意な変化量を示さない遺伝子は、その疾患または状態について情報提供性がないと推定され、その疾患または状態のマーカーとして選択されない。試料セット内で有意な変化を示す遺伝子は、その疾患または状態についての候補情報提供性遺伝子である。変化の程度は、試料のセット内での試料と対照との間の遺伝子発現の差、または発現の比を算出することによって推定することができる。その発現、または発現の比は、任意の手段、例えば線形または対数変換によって変換することができる。患者試料中でのマーカーの有意なアップレギュレーションまたはダウンレギュレーションに基づいて、選択を行うことができる。マーカーの発現と疾患および状態との間にある相関の統計的な有意性(すなわち、p値)を算出することによって選択を行うこともできる。好ましくは、どちらの選択基準も使用する。したがって、本発明の一実施形態では、マーカーが、標準と比較して発現において2倍を超える変化(増大または低下)と、乳癌の存在とマーカー発現の変化との間の相関について0.01以下の(すなわち、統計学的に有意な)p値の両方を示す場合に、患者サブセット内で乳癌の予後に関連するマーカーを選択する。
本発明との関連で、「予後良好」は、特定の状態、特に特定の疾患についての望ましい結果を示し、「予後不良」は、その状態の望ましくない結果を示す。例えば、その状態が癌である場合、「予後良好」とは、部分寛解または完全寛解を意味することがあり、「予後不良」とは治療後の癌の再発を意味することがある。「予後良好」および「予後不良」を構成するものは、対象とする状態に特異的であり、例えば個体が罹患した特定の癌に特異的である。例えば、膵癌について「予後良好」とは、最初の診断後1年間または2年間生存することであり得るが、ホジキン病について「予後良好」とは、5年間以上生存することであり得る。乳癌の具体例では、「予後良好」とは、最初の診断後1、2、3、4、または5年以上の期間内に転移の再発がない可能性を意味し、「予後不良」とは、その期間内に転移の再発がある可能性を意味する。より具体的な例では、「予後良好」とは、最初の診断後5年以内に転移の再発がない可能性を意味し、「予後不良」とは、その期間内に転移の再発がある可能性を意味する。
癌、例えば乳癌についてより具体的な実施形態では、多数の乳癌の腫瘍試料を使用して、臨床的なカテゴリーまたは臨床的なパラメーター
Figure 2007527247
と、個々の各遺伝子についての、すべての試料にわたる発現比の線形変換、対数変換または任意の変換
Figure 2007527247
の間の相関係数ρを算出することによってマーカーを特定する。具体的には、相関係数は下記のように算出することができる:
Figure 2007527247
相関係数がカットオフ値を超えるマーカーを、所与の患者サブセット内で、特定の臨床的な型(例えば予後良好)に特異的な予後情報提供性マーカーと認める。そのようなカットオフ値または閾値は、モンテカルロシミュレーションにより得られた区別用遺伝子のある種の有意性と対応することがある。閾値は、使用する試料の数に依存する;閾値は、
Figure 2007527247
として算出することができ、式中
Figure 2007527247
は分布の幅であり、n=試料の数である。具体的な実施形態では、相関係数が約0.3より大きいか、または約−0.3未満である場合にマーカーを選択する。
次に、その相関の有意性を算出する。そのような有意性を算出するいずれの統計的手段によってこの有意性を算出してもよい。具体的な例では、特定のマーカーの発現差と臨床的なカテゴリーの間の関係をランダム化するために、モンテカルロ技術を用いて相関データのセットを作成する。モンテカルロ法の実行において基準を満たすマーカーの頻度分布を使用して、臨床データとの相関によって選択されたマーカーの数が有意であるかどうか判定する。
マーカーセットを特定した後、マーカーを区別の有意性の順に順位付けることができる。順位付けの1つの手段は、マーカーの遺伝子発現の変化と、区別される特定の状態の間での相関の振幅によるものである。他の好ましい手段は、統計的な計量値を使用するものである。具体的な実施形態では、その計量値は、t検定に類似する統計量である:
Figure 2007527247
この方程式中で、<x>は、第1臨床群(例えば、予後良好)内での転写産物発現測定値の対数比の誤差加重平均であり、<x>は、第2の関連する臨床群(例えば、予後不良)内での対数比の誤差加重平均であり、σは第1臨床群(例えば、予後良好)内での対数比の分散であり、nは、対数比の妥当な測定値が利用可能な試料の数であり、σは第2臨床群(例えば、予後不良)内での対数比の分散であり、nは、対数比の妥当な測定値が利用可能な試料の数である。t値は、2つの平均間の、分散で補正した差を表す。
順位付けしたマーカーセットを使用して、区別に使用するセット中のマーカーの数を最適化することができる。これは、一般に下記の「1点除外(leave one out)」法で行われる。第1の実行では、サブセット、例えば、順位表の最上位から5個のマーカーを用いてテンプレートを作成し、試料X個からX−1個を用いてテンプレートを作成し、残りの試料の状態を予測する。このプロセスを、試料X個のいずれにも1回予測が行われるまで、いずれの試料についても反復する。第2の実行では、さらなるマーカー、例えば5つのさらなるマーカーを加え、その結果、ここでは10個のマーカーからテンプレートを作成し、残りの試料の結果を予測する。このプロセスを、マーカーのセット全体を用いてテンプレートを作成するまで反復する。各実行では、1型エラー(偽陰性)および2型エラー(偽陽性)をカウントする;マーカーの最適な数は、1型エラー率、2型エラー率、または好ましくは1型および2型のエラー率の合計が最低である場合の数である。
予後判定マーカーでは、さらなる統計量である生存モデルによりマーカーセットの検証を行うことができる。この統計量によって、腫瘍の遠隔転移の確率が最初の診断からの時間の関数として得られる。ワイブル、正規、対数正規、対数ロジスティック、対数指数、または対数レイリー(log-Rayleigh)を含めたいくつかのモデルを使用することができる(Chapter 12 "Life Testing", S-PLUS 2000 GUIDE TO STATISTICS, Vol. 2, p. 368 (2000))。「正規」モデルでは、時間tでの遠隔転移の確率Pは下記のように算出される。
P=α×exp(−t/τ) 方程式(3)
式中αは固定され1に等しく、τはフィッティングされるパラメーターであり、「予測寿命」を見積もるものである。
マーカーの選択または順位付けから(すなわち、相関の算出から)1つまたは複数の試料を除外することにより、上記のマーカー特定プロセスを1回または複数回反復することが好ましい。除外された試料は、先の反復から正しく予測することができないものである。好ましくは、この反復プロセスにおいてマーカー選択から除外された試料は、性能の誇張を回避するために、分類指標の性能の評価中に含まれる。
上記の方法、特に上記の統計的方法は、特定の患者サブセット内での乳癌の予後に関連するマーカーの特定に限られるものではなく、それを使用して、任意の表現型または状態に、あるいは表現型または状態の1つもしくは複数の特徴によって定義される表現型または状態の任意のサブセットに関連するマーカー遺伝子のセットを特定することができることが当業者には明らかであろう。その表現型または状態は、癌などの疾患の存在の有無でもよく、あるいは、その癌に関連する任意の特定用の臨床的な状態の存在の有無でもよい。疾患との関連では、表現型は、生存時間などの予後、疾患状態の遠隔転移の確率、あるいは治療法または予防法に対する特定の応答の可能性でもよい。表現型は、癌、または疾患である必要はない;表現型は、健常な個体に関連する重要でない特徴でもよい。
したがって、本発明は、複数の表現型または遺伝子型の特徴を含む状態について情報提供性のある遺伝子またはマーカーのセットを特定する方法を提供し、その方法は、(a)前記状態についての1つもしくは複数の表現型または遺伝子型の特徴に基づいて、複数の第1クラスに複数の試料または個体をそれぞれ分類するステップと、(b)前記各第1クラス内で、前記状態について情報提供性のある遺伝子またはマーカーの第1セットを特定するステップとを含み、前記各第1クラス内での前記の遺伝子またはマーカーの第1セットは、他のクラスと比べて前記クラスにユニークなものである。具体的な実施形態では、前記第1クラスの区別に使用したものと異なる表現型または遺伝子型の特徴に基づいて、前記第1クラスの少なくとも1つの中の試料または個体を複数の第2クラスにさらに分類し、前記第2クラスの少なくとも1つの中で、情報提供性のある遺伝子またはマーカーの第2セットを特定し、前記各第2クラス内での前記の情報提供性のある遺伝子またはマーカーの第2セットは、他のクラスと比べて前記第2クラスにユニークなものである。他の実施形態では、本発明は、複数の表現型または遺伝子型の特徴を含む状態について情報提供性のある遺伝子またはマーカーのセットを特定する方法を提供し、その方法は、(a)1つまたは複数の表現型または遺伝子型の特徴に基づいて、複数の第1クラスに複数の試料または個体をそれぞれ分類するステップと、(b)前記複数の第1クラスの区別に使用したものと異なる表現型または遺伝子型の特徴に基づいて、前記第1クラスの少なくとも1つを複数の第2クラスに分類するステップと、(c)前記第1クラスまたは前記第2クラスの少なくとも1つの中で前記状態について情報提供性のある遺伝子またはマーカーのセットを特定するステップとを含み、前記の遺伝子またはマーカーのセットは、他のクラスと比べて前記クラスにユニークなものである。本発明はさらに、複数の表現型または遺伝子型の特徴を含む状態について情報提供性のある遺伝子またはマーカーのセットを特定する方法を提供し、その方法は、(a)前記複数の表現型または遺伝子型の特徴から第1の特徴を選択するステップと、(b)前記第1の特徴により区別可能な第1の状態クラスの少なくとも2つを特定するステップと、(c)前記第1の状態クラスの少なくとも1つに分類可能な複数の個体を選択するステップと、(d)前記複数の個体のそれぞれに由来する試料中で、前記第1の状態クラスの前記少なくとも1つの中で前記状態について情報提供性のある遺伝子またはマーカーのセットを特定するステップとを含む。
5.3.3 5つの患者サブセットについての分類遺伝子セット
本発明は、乳癌の予後判定に有用なマーカーのセットを提供する。乳癌を有する個体の特定のサブセット中で、上記の方法に従ってマーカーを特定した。一般に、エストロゲン受容体(ER)の状態、リンパ節の状態、突然変異の型(すなわち、BRCA1型または散発性)、および診断時の年齢を含めた乳癌の予後に関連する基準に基づいて5つの表現型のカテゴリーに最初に層別された乳癌患者の集団内で、マーカーセットを特定した。より具体的には、試料を得た患者および腫瘍を、ER、散発性(すなわち、エストロゲン受容体陰性であり、かつ非BRCA1型腫瘍を有する);ER、BRCA1(すなわち、エストロゲン受容体陰性であり、かつBRCA1型腫瘍を有する);ER+、ER/年齢 高値(すなわち、エストロゲン受容体陽性であり、エストロゲン受容体遺伝子発現のlog(比)の年齢に対する比が高い);ER+、ER/年齢 低値、LN+(すなわち、エストロゲン受容体陽性であり、エストロゲン受容体遺伝子発現のlog(比)の年齢に対する比が低く、リンパ節陽性である);およびER、ER/年齢 低値、LN(すなわち、エストロゲン受容体陽性であり、エストロゲン受容体遺伝子発現のlog(比)の年齢に対する比が低く、リンパ節陰性である)に分類した。元の患者をこの5つのサブセットに細分する原理は、実施例(第6節)中で詳述する。上記の各サブセットに有用なマーカーセットを表1〜5にそれぞれ示す。
Figure 2007527247
Figure 2007527247
Figure 2007527247
Figure 2007527247
Figure 2007527247
Figure 2007527247
Figure 2007527247
Figure 2007527247
Figure 2007527247
Figure 2007527247
Figure 2007527247
Figure 2007527247
5.4 診断および予後判定の方法
5.4.1 試料収集
本発明では、標的ポリヌクレオチド分子やタンパク質などのマーカーを、乳癌などの状態で苦しんでいる個体から得られた試料から抽出する。試料は、臨床上許容されるどんな方法で収集してもよいが、(遺伝子発現を測定する場合には)マーカー由来のポリヌクレオチド(すなわち、RNA)が保存され、または(コードタンパク質を測定する場合には)タンパク質が保存されるように収集しなければならない。例えば、mRNAまたはそれに由来する核酸(すなわちcDNAまたは増幅DNA)は、好ましくは標準または対照のポリヌクレオチド分子と区別できるように標識し、同時にまたはそれぞれ独立して、その両方を、上記のマーカーまたはマーカーセットもしくはサブセットの一部または全部を含むマイクロアレイとハイブリダイズさせる。あるいは、mRNAまたはそれに由来する核酸は、標準または対照のポリヌクレオチド分子と同じ標識で標識することもでき、その場合、特定のプローブでのそれぞれのハイブリダイゼーション強度を比較する。試料は、臨床的に適切ないずれかの組織試料、例えば腫瘍生検もしくは穿刺吸引、または血液、血漿、血清、リンパ液、腹水、嚢胞液、尿や乳頭滲出液などの体液試料を含むことがある。試料は、ヒトから、あるいは、獣医学との関係で、反芻動物、ウマ、ブタやヒツジなどの非ヒト動物から、またはネコやイヌなどの家庭内ペット動物から得ることができる。
総RNAおよびポリ(A)+RNAを調製する方法は周知であり、一般にSambrookら, MOLECULAR CLONING - A LABORATORY MANUAL (第2版), Vols. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York (1989))およびAusubelら, CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, vol. 2, Current Protocols Publishing, New York (1994))中に記載されている。
RNAは、細胞を溶解し、その中に含まれるタンパク質を変性させる手順によって真核細胞から単離することができる。対象とする細胞には、野生型細胞(すなわち非癌性)、薬物に曝露した野生型細胞、腫瘍細胞または腫瘍由来細胞、改変細胞、正常なまたは腫瘍の細胞株細胞、および薬物に曝露した改変細胞がある。好ましくは、細胞は乳癌の腫瘍細胞である。
DNAを除去するさらなるステップを使用することができる。非イオン性界面活性剤で細胞溶解を行い、その後微小遠心分離で核を、したがって大部分の細胞DNAを除去することができる。一実施形態では、RNAは、対象とする様々な型の細胞から、グアニジンチオシアネート溶解、その後DNAからRNAを分離するCsCl遠心分離を使用して抽出する(Chirgwinら, Biochemistry 18:5294-5299 (1979))。ポリ(A)+RNAは、オリゴdTセルロースを用いた選択により選択される(Sambrookら, MOLECULAR CLONING - A LABORATORY MANUAL (第2版), Vols. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York (1989)を参照)。あるいは、例えば熱したフェノールまたはフェノール/クロロホルム/イソアミルアルコールを用いた有機抽出により、DNAからのRNAの分離を行うこともできる。
必要なら、RNアーゼ阻害剤を溶解緩衝液に添加することもできる。同様に、特定の細胞型では、プロトコールにタンパク質変性/消化ステップを加えることが好ましい場合がある。
多くの適用例では、転移RNA(tRNA)やリボソームRNA(rRNA)など他の細胞RNAに対して、mRNAを選択的に富化することが望ましい。ほとんどのmRNAは、その3’末端にポリ(A)尾部を含む。これによって、例えば、セルロースやセファデックス(Sephadex)(商標)などの固体支持体と結合したオリゴ(dT)またはポリ(U)を使用したアフィニティークロマトグラフィーでそれを富化することが可能となる(Ausubelら, CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, vol. 2, Current Protocols Publishing, New York (1994)を参照)。結合させた後、アフィニティーカラムから2mM EDTA/0.1%SDSを使用してポリ(A)+mRNAを溶出する。
RNAの試料は、複数の異なるmRNA分子を含む可能性があり、異なるmRNA分子はそれぞれ異なるヌクレオチド配列を有する。具体的な実施形態では、RNA試料中のmRNA分子は、少なくとも5、10、15、20、25、30、40または50個の異なるヌクレオチド配列を含む。より好ましくは、RNA試料中のmRNA分子は、マーカー遺伝子それぞれに対応するmRNA分子を含む。他の具体的な実施形態では、RNA試料は哺乳動物RNA試料である。
具体的な実施形態では、細胞由来の総RNAまたはmRNAを本発明の方法で使用する。RNAの供給源は、植物または動物、ヒト、哺乳動物、霊長類、非ヒト動物、イヌ、ネコ、マウス、ラット、トリ、酵母、真核生物、原核生物などの細胞である可能性がある。具体的な実施形態では、1×10個以下の細胞由来の総mRNAまたは総RNAを含む試料で本発明の方法を使用する。他の実施形態では、当該技術分野で公知の方法によって、上記の供給源から、タンパク質レベルでの発現分析に使用するタンパク質を単離することができる。
本明細書で開示されているマーカー配列の相同体に対するプローブを、好ましくは非ヒト核酸についてアッセイするときに使用することができる。
本発明の方法では、マーカーとして適切ないずれの分子でも使用することができる。例えば、疾患をはじめとする特定の状態について情報提供性のあるタンパク質のセットを決定することができる。遺伝子に基づくマーカーに関するのと同様に、その状態の表現型または遺伝子型のサブセットについて、試料中の種々のタンパク質の変化レベルを決定することができ、1つまたは複数のこれらのサブセットについて情報提供性のあるタンパク質のセットを作成するために、レベル(存在量)または活性、あるいはその両方において有意な変化を示すタンパク質を特定することができる。例えば、一次元ポリアクリルアミドゲル電気泳動、二次元ポリアクリルアミドゲル電気泳動、非変性ポリアクリルアミドゲル電気泳動、等電点分離ゲルなどのゲル電気泳動の使用、抗体アレイの使用などによって、そのようなタンパク質を特定することができる。もちろん、個体の分類に使用する特定のテンプレートは、マーカーとして使用する細胞成分の型に依存する。例えば、核酸(例えば、発現遺伝子に由来する遺伝子または核酸)をマーカーとして使用する場合、テンプレートは、核酸(あるいはその発現または存在量のレベル)を含み、タンパク質をマーカーとして使用する場合、テンプレートは、タンパク質、例えば、個体のセット中におけるそのタンパク質のレベルまたは存在量などを含む。
5.4.2 乳癌の予後判定用遺伝子セットの使用
本発明によれば、ある状態の複数のサブセットについて情報提供性のある遺伝子セットを特定した後、個体をこれらのサブセットの1つに分類し、個体から得られた乳癌の腫瘍試料におけるそのサブセットについての遺伝子セット中の遺伝子、またはそのコードタンパク質の発現に基づいて予後判定を行う。
例えば、ある特定の仮想の状態は、3つの対応する表現型の特徴A、BおよびCを有する。この例では、これらの特徴に基づいて、4つの患者サブセットA;A;A;およびAの予後判定について情報提供性のある遺伝子セットを、上記の方法によって特定する。したがって、その状態を有する個体は、表現型A〜Cに従って4つの患者サブセットの1つに分類される。したがって、一実施形態では、本発明によって、ある状態を有する個体が、そのサブセットの予後判定について情報提供性のある遺伝子のセットが特定されている複数の患者サブセットの1つに分類される。次いで、個体から試料を取得し、試料中の、予後判定について情報提供性のある遺伝子の発現を分析し、対照と比較する。様々な実施形態では、対照は、その患者サブセットに分類可能である予後良好な個体から得られた試料のプール中における情報提供性遺伝子の平均的発現;その患者サブセットに分類可能である予後不良な個体から得られた試料のプール中における情報提供性遺伝子の平均的発現;その患者サブセットに分類可能である予後良好な個体の遺伝子発現レベルを表す数学的な値のセットなどである。
他の実施形態では、個体から試料を取得し、試料中の、予後判定について情報提供性のある遺伝子の発現レベルを分析する。一実施形態では、各遺伝子の発現レベルを、基準試料の対照中の対応する遺伝子の発現レベルと比較して、差次的な発現レベルを決定することができる。次いで、複数の遺伝子の発現レベルまたは差次的発現レベルを含む発現プロファイルを、テンプレートプロファイルと比較する。様々な実施形態では、テンプレートプロファイルは、その患者サブセットに分類可能である予後良好な個体から得られた試料中における情報提供性遺伝子の平均的発現を含む予後良好なテンプレート;またはその患者サブセットに分類可能である予後不良な個体から得られた試料中における情報提供性遺伝子の平均的発現を含む予後不良なテンプレート;またはその患者サブセットに分類可能である予後良好な個体の遺伝子発現レベルを表す数学的な値のセットを含む予後良好なプロファイルなどである。
具体的な実施形態では、その状態は乳癌であり、表現型、遺伝子型および/または臨床上のクラスは、ER、BRCA1の個体;ER、散発性の個体;ER+、ER/年齢 高値の個体;ER+、ER/年齢 低値、LN+の個体;およびER+、ER/年齢 低値、LNの個体である。この実施形態では、個体をER+またはERに分類することができる。個体がERである場合、個体は、BRCA1型または散発性の腫瘍を有するものにさらに分類される。したがって、ERの個体は、ER、BRCA1またはER、散発性に分類される。あるいは、個体がER+に分類される場合、個体は、エストロゲン受容体をコードする遺伝子の発現レベルのlog(比)の、個体の年齢に対する比が高いまたは低いものにさらに分類される。比が低い個体は、LN+またはLN−にさらに分類される。したがって、ER+の個体は、ER+、ER/年齢 高値;ER+、ER/年齢 低値、LN+;またはER+、ER/年齢 低値、LNに分類される。もちろん、個体のER状態、腫瘍の型、年齢およびLN状態は、その個体がこの5つのサブセットの1つに分類される限り、任意の順で特定することができる。
したがって、一実施形態では、本発明は、ある状態を有する個体を予後良好または予後不良に分類する方法を提供し、その方法は、(a)前記状態についての1つまたは複数の表現型、遺伝子型または臨床上の特徴により区別される複数の患者クラスの1つに前記個体を分類するステップと、(b)個体から得られた細胞試料中で、前記個体が分類される患者クラスの予後判定について情報提供性のある遺伝子またはそのコードタンパク質を含む、複数の遺伝子またはそのコードタンパク質の発現レベルを、対照と比較して決定するステップと、(c)前記発現レベルに基づいて、前記個体を予後良好または予後不良に分類するステップとを含む。具体的な実施形態では、前記状態は乳癌であり、予後良好とは、最初の診断から5年以内に転移が起こらないことであり、予後不良とは、最初の診断から5年以内に転移が起こることである。より具体的な実施形態では、ある状態を有する前記個体を予後良好または予後不良に分類する前記のステップは、前記複数の遺伝子またはそのコードタンパク質それぞれの発現レベルを、前記対照中の対応する遺伝子またはそのコードタンパク質それぞれの発現の前記平均レベルと比較し、前記発現レベルが、それぞれ予後良好の対照または予後不良の対照中の前記遺伝子またはそのコードタンパク質それぞれの発現の前記平均レベルと、偶然に予想されるよりも強く相関する場合に前記個体を予後良好または予後不良に分類することによって実施される。その方法のより具体的な実施形態では、前記複数の患者サブセットは、ER、BRCA1の個体;ER、散発性の個体;ER+、ER/年齢 高値の個体;ER+、ER/年齢 低値、LN+の個体;およびER+、ER/年齢 低値、LNの個体を含む。他の実施形態では、前記対照は、前記サブセットに分類された、予後が良好または転帰が良好であり、あるいは予後が不良または転帰が不良である個体由来の腫瘍試料のプール中における、予後判定について情報提供性のある前記複数の遺伝子それぞれについての発現の平均レベルである。他の具体的な実施形態では、前記対照は、前記サブセットに分類可能な、予後良好であるか、または予後不良である個体の腫瘍試料中における予後判定について情報提供性のある遺伝子の発現の平均レベルを表す数学的な値のセットである。
本明細書に記載の様々な患者サブセットが、腫瘍形成および転移の開始の様々な分子機構を反映することは明らかである。したがって、表1〜5に列挙されている遺伝子セットはまた、個体に特定の型の乳癌を有すると最初に診断するのにも有用である。したがって、本発明はまた、個体を特定のサブタイプの乳癌を有すると診断する方法をも提供し、その方法は、前記個体由来の試料中で、それに対するマーカーが表1〜5中に列挙されている複数の遺伝子の発現レベルを決定するステップと、前記サブタイプの癌の乳癌試料中における前記複数の遺伝子の発現を表す対照と前記発現とを比較するステップと、前記比較に基づいて、個体を前記サブタイプの乳癌を有すると診断するステップとを含む。具体的な実施形態では、前記サブタイプの癌は、ER、BRCA1型;ER、散発性型;ER+、ER/年齢 高値型;ER+、ER/年齢 低値、LN+型;およびER/年齢 低値、LN型からなる群から選択される。他の具体的な実施形態では、前記対照は、それに対するマーカーが表1、表2、表3、表4または表5中に列挙されている複数の遺伝子の発現の平均レベルである。他の具体例では、前記比較ステップは、前記個体から得られた前記試料中における、それに対するマーカーが表1〜5のそれぞれに列挙されている遺伝子の発現の、表1〜5のそれぞれについて同じ遺伝子の発現の対照レベルに対する類似性を決定するステップと、前記試料中における前記遺伝子の発現レベルが、それに対するマーカーが表1、表2、表3、表4または表5のいずれの中に列挙されている前記の遺伝子の対照発現と最も類似しているかを判定するステップとを含む。
他の実施形態では、本発明は、個体を予後良好または予後不良に分類する方法を提供し、その方法は、(a)前記個体をER、BRCA1;ER、散発性;ER+、ER/年齢 高値;ER+、ER/年齢 低値、LN+;またはER+、ER/年齢 低値、LNに分類するステップと、(b)個体から得られた細胞試料中で、前記個体がER、BRCA1に分類される場合には表1のマーカーに、前記個体がER、散発性に分類される場合には表2のマーカーに、前記個体がER+、ER/年齢 高値に分類される場合には表3のマーカーに、前記個体がER+、ER/年齢 低値、LN+に分類される場合には表4のマーカーに、または前記個体がER+、ER/年齢 低値、LNに分類される場合には表5のマーカーに対応する遺伝子を2つ含む第1の複数の遺伝子の発現レベルを、対照と比較して決定するステップとを含み、前記個体は、年齢に対するER発現の比が所定の値を超える場合には「ER/年齢 高値」であり、年齢に対するER発現の比が前記の所定の値を超えない場合には「ER/年齢 低値」である。この方法の具体的な実施形態では、前記のERの所定の値は、ER=0.1(年齢−42.5)と算出され、式中、年齢は前記個体の年齢である。他の具体的な実施形態では、前記個体はER、BRCA1であり、前記複数の遺伝子はそれに対するマーカーが表1中に列挙されている遺伝子のうち1、2、3、4、5、10個またはすべてを含む(すなわち少なくとも包含する)。他の具体的な実施形態では、前記個体はER、散発性であり、前記複数の遺伝子はそれに対するマーカーが表2中に列挙されている遺伝子のうち1、2、3、4、5、10個またはすべてを含む(すなわち少なくとも包含する)。他の具体的な実施形態では、前記個体はER+、ER/年齢 高値であり、前記複数の遺伝子はそれに対するマーカーが表3中に列挙されている遺伝子のうち1、2、3、4、5、10個またはすべてを含む(すなわち少なくとも包含する)。他の具体的な実施形態では、前記個体はER+、ER/年齢 低値、LN+であり、前記複数の遺伝子はそれに対するマーカーが表4中に列挙されている遺伝子のうち1、2、3、4、5、10個またはすべてを含む(すなわち少なくとも包含する)。他の具体的な実施形態では、前記個体はER+、ER/年齢 低値、LNであり、前記複数の遺伝子はそれに対するマーカーが表5中に列挙されている遺伝子のうち1、2、3、4、5、10個またはすべてを含む(すなわち少なくとも包含する)。他の具体的な実施形態では、その方法は、前記細胞試料中で、それに対するマーカーが表1〜5中に見られず予後判定について情報提供性のある第2の複数の遺伝子の発現レベルを、対照と比較して決定するステップをさらに含む。
一実施形態では、本発明は、ある状態を有する個体を予後良好または予後不良に分類する方法を提供し、その方法は、(a)前記状態についての1つまたは複数の表現型、遺伝子型または臨床上の特徴により区別される複数の患者クラスの1つに前記個体を分類するステップと、(b)個体から得られた細胞試料中で前記個体が分類される患者クラスの予後判定について情報提供性のある遺伝子またはそのコードタンパク質を含む複数の遺伝子またはそのコードタンパク質の発現レベルを、場合によっては対照と比較して決定するステップと、(c)前記発現レベルに基づいて、前記個体を予後良好または予後不良に分類するステップとを含む。具体的な実施形態では、前記状態は乳癌であり、予後良好とは、最初の診断から5年以内に転移が起こらないことであり、予後不良とは、最初の診断から5年以内に転移が起こることである。より具体的な実施形態では、ある状態を有する前記の個体を予後良好または予後不良に分類する前記のステップは、患者の前記複数の遺伝子またはそのコードタンパク質の発現プロファイルを、前記複数の遺伝子またはそのコードタンパク質の発現レベルの予後良好および/または予後不良のテンプレートプロファイルと比較し、前記患者の発現プロファイルが、予後良好なテンプレートまたは予後不良なテンプレートと類似性が高い場合に前記個体をそれぞれ予後良好または予後不良に分類することによって実施される。その方法のより具体的な実施形態では、前記複数の患者サブセットとは、ER、BRCA1の個体;ER、散発性の個体;ER+、ER/年齢 高値の個体;ER+、ER/年齢 低値、LN+の個体;およびER+、ER/年齢 低値、LNの個体を含む。他の実施形態では、前記の予後良好なテンプレートは、前記サブセットに分類された、予後が良好または転帰が良好である個体由来の腫瘍試料中における、予後判定について情報提供性のある前記複数の遺伝子それぞれの発現の平均レベルであるが、前記の予後不良なテンプレートは、前記サブセットに分類された、予後が不良または転帰が不良である個体由来の腫瘍試料中における、予後判定について情報提供性のある前記複数の遺伝子それぞれの発現の平均レベルである。他の具体的な実施形態では、前記の予後良好または予後不良なテンプレートは、前記サブセットに分類可能な、それぞれ予後良好であるか、または予後不良である個体の腫瘍試料中における予後判定について情報提供性のある遺伝子の発現の平均レベルを表す数学的な値のセットである。
本明細書に記載の様々な患者サブセットが、腫瘍形成および転移の開始の様々な分子機構を反映することは明らかである。したがって、表1〜5に列挙されている遺伝子セットはまた、個体に特定の型の乳癌を有すると最初に診断するのにも有用である。したがって、本発明はまた、個体を特定のサブタイプの乳癌を有すると診断する方法をも提供し、その方法は、前記個体由来の試料中で、それに対するマーカーが表1〜5中に列挙されている複数の遺伝子の発現プロファイルを決定するステップと、前記サブタイプの癌の乳癌試料中において前記複数の遺伝子の発現を表すテンプレートのプロファイルと前記発現プロファイルを比較するステップと、前記比較に基づいて、個体を前記サブタイプの乳癌を有すると診断するステップとを含む。具体的な実施形態では、前記サブタイプの癌は、ER、BRCA1型;ER、散発性型;ER+、ER/年齢 高値型;ER+、ER/年齢 低値、LN+型;およびER/年齢 低値、LN型からなる群から選択される。他の具体的な実施形態では、前記テンプレートは、それに対するマーカーが表1、表2、表3、表4または表5中に列挙されている複数の遺伝子の発現の平均レベルを含む。他の具体的な例では、前記比較ステップは、前記個体から得られた前記試料中における、それに対するマーカーが表1〜5のそれぞれに列挙されている遺伝子の発現プロファイルの、表1〜5のそれぞれについて同じ遺伝子の発現レベルを含むテンプレートプロファイルに対する類似性を決定するステップと、前記試料中における前記遺伝子の発現パターンが、それに対するマーカーが表1、表2、表3、表4または表5のいずれの中に列挙されている遺伝子の発現パターンと最も類似しているかを判定するステップとを含む。
他の実施形態では、本発明は、個体を予後良好または予後不良に分類する方法を提供し、その方法は、(a)前記個体をER、BRCA1;ER、散発性;ER+、ER/年齢 高値;ER+、ER/年齢 低値、LN+;またはER+、ER/年齢 低値、LNに分類するステップと、(b)個体から得られた細胞試料中で、前記個体がER、BRCA1に分類される場合には表1のマーカーに、前記個体がER、散発性に分類される場合には表2のマーカーに、前記個体がER+、ER/年齢 高値に分類される場合には表3のマーカーに、前記個体がER+、ER/年齢 低値、LN+に分類される場合には表4のマーカーに、または前記個体がER+、ER/年齢 低値、LNに分類される場合には表5のマーカーに対応する遺伝子を少なくとも2つ含む第1の複数の遺伝子の発現プロファイルを、対照と比較して決定するステップとを含み、前記個体は、個体のERレベルが所定の値を超える場合には「ER/年齢 高値」であり、個体のERレベルが前記の所定の値を超えない場合には「ER/年齢 低値」である。この方法の具体的な実施形態では、前記のERの所定の値は、ER=0.1(年齢−42.5)と算出され、式中、年齢は前記個体の年齢である。他の具体的な実施形態では、前記個体はER、BRCA1であり、前記複数の遺伝子はそれに対するマーカーが表1中に列挙されている遺伝子を少なくとも1、2、3、4、5、10個またはすべて含む。他の具体的な実施形態では、前記個体はER、散発性であり、前記複数の遺伝子はそれに対するマーカーが表2中に列挙されている遺伝子を少なくとも1、2、3、4、5、10個またはすべて含む。他の具体的な実施形態では、前記個体はER+、ER/年齢 高値であり、前記複数の遺伝子はそれに対するマーカーが表3中に列挙されている遺伝子を少なくとも1、2、3、4、5、10個またはすべて含む。他の具体的な実施形態では、前記個体はER+、ER/年齢 低値、LN+であり、前記複数の遺伝子はそれに対するマーカーが表4中に列挙されている遺伝子を少なくとも1、2、3、4、5、10個またはすべて含む。他の具体的な実施形態では、前記個体はER+、ER/年齢 低値、LNであり、前記複数の遺伝子はそれに対するマーカーが表5中に列挙されている遺伝子を少なくとも1、2、3、4、5、10個またはすべて含む。他の具体的な実施形態では、その方法は、前記細胞試料中で、それに対するマーカーが表1〜5中に見られず予後判定について情報提供性のある第2の複数の遺伝子の発現レベルを、対照と比較して決定するステップをさらに含む。
乳癌患者のLN状態に関して情報が入手可能である場合、患者を「非常に予後良好」、「予後中程度」または予後不良と認めることができ、それによって治療の改善が可能となる。一実施形態では、本発明は、乳癌患者に治療法を割り当てる方法を提供し、その方法は、(a)それに対するマーカーが表1、表2、表3、表4または表5中に列挙されている少なくとも5個の遺伝子の発現レベルに基づいて、前記患者を「予後不良」、「予後中程度」または「非常に予後良好」に分類するステップと、(b)(i)患者がリンパ節陰性であり予後良好または予後中程度に分類される場合には補助化学療法を含まない治療法、あるいは(ii)前記患者がリンパ節の状態と発現プロファイルとの他のいずれかの組合せを有する場合には化学療法を含む治療法を前記患者に割り当てるステップとを含む。
他の実施形態では、(a)乳癌患者の年齢、ER状態、LN状態および腫瘍の型を決定するステップと、(b)前記患者をER、散発性;ER、BRCA1;ER+、ER/年齢 高値;ER+、ER/年齢 低値、LN+;またはER+、ER/年齢 低値、LNに分類するステップと、(c)前記乳癌患者から得られた細胞試料中で、それに対するマーカーが、前記患者がER、散発性に分類される場合には表1に、前記患者がER、BRCA1に分類される場合には表2に、前記患者がER+、ER/年齢 高値に分類される場合には表3に、前記患者がER+、ER/年齢 低値、LN+に分類される場合には表4に、または前記患者がER+、ER/年齢 低値、LNに分類される場合には表5に列挙されている少なくとも5個の遺伝子を含む発現プロファイルを決定するステップと、(d)前記少なくとも5個の遺伝子の発現プロファイルの、前記少なくとも5個の遺伝子の発現レベルを含むテンプレートプロファイルに対する類似性を決定して患者の類似値を得るステップと、(e)前記の患者の類似値を、選択された第1および第2の類似値の閾値とそれぞれ比較し、前記第2の類似値の閾値は、前記第1の類似値の閾値より前記テンプレート発現プロファイルに対する類似性が高いことを示すステップと、(f)前記の患者の類似値が前記第2の類似値の閾値を超える場合には第1の予後に、前記の患者の類似値が前記第1の類似値の閾値を超えるが、前記第2の類似値の閾値を超えない場合には第2の予後に、前記の患者の類似値が前記第1の類似値の閾値を超えない場合には第3の予後に前記乳癌患者を分類するステップとを含む方法によって乳癌患者に予後を割り当てる。その方法の具体的な実施形態では、前記第1の予後とは、「非常に予後良好」であり、前記第2の予後とは、「予後中程度」であり、前記第3の予後とは、「予後不良」であり、前記乳癌患者に、患者がリンパ節陰性であり予後良好または予後中程度に分類される場合には補助化学療法を含まない治療法を、あるいは前記患者がリンパ節の状態と発現プロファイルとの他の任意の組合せを有する場合には化学療法を含む治療法を割り当てる。
本発明はまた、乳癌患者に治療法を割り当てる方法を提供し、その方法は、(a)前記患者についてリンパ節の状態を判定するステップと、(b)前記患者由来の細胞試料中で、それに対するマーカーが表5中に列挙されている少なくとも5個の遺伝子の発現を決定し、それによって発現プロファイルを作成するステップと、(c)前記発現プロファイルに基づいて「予後不良」、「予後中程度」、または「非常に予後良好」に前記患者を分類するステップと、(d)患者がリンパ節陰性であり予後良好または予後中程度に分類される場合には補助化学療法を含まない治療法を、あるいは前記患者がリンパ節の状態と分類との他のいずれかの組合せを有する場合には化学療法を含む治療法を前記患者に割り当てるステップとを含む。この方法の具体的な実施形態では、「予後中程度」に分類されたリンパ節陰性の患者に割り当てる前記治療法は、さらに補助ホルモン療法を含む。この方法の他の具体的な実施形態では、前記分類ステップ(c)は、(a)乳癌腫瘍試料のプールを構成する複数の乳癌腫瘍試料を、前記各腫瘍試料中における前記少なくとも5個の遺伝子の発現プロファイルと、前記プールを構成する残りの腫瘍試料すべてにわたる前記少なくとも5個の遺伝子の発現プロファイルと間の、類似値として表される類似性の程度によって大きい順に順位付けるステップと、(b)前記分類ステップにおける偽陰性についての許容される数を決定し、偽陰性とは、前記細胞試料中における前記少なくとも5個の遺伝子の発現レベルからその乳癌患者に最初の診断から最初の5年以内に遠隔転移がないことが予測されるが最初の診断から最初の5年以内に遠隔転移が起こった乳癌患者であるステップと、(c)前記順位付けたリスト中において偽陰性が前記の腫瘍試料の許容される数以下である類似値を決定するステップと、(d)ステップ(c)で決定した前記類似値を第1の類似値の閾値として選択するステップと、(e)前記第1の類似値より大きい第2の類似値を、第2の類似値の閾値として選択するステップと、(f)乳癌患者由来の乳癌腫瘍試料中における前記少なくとも5個の遺伝子の発現プロファイルと、前記プール中における前記少なくとも5個それぞれの遺伝子の発現プロファイルとの間の類似性を決定して、患者の類似値を得るステップとを含み、前記患者の類似値が前記第2の類似値の閾値と同じであるかまたはそれを超える場合には、前記患者が「非常に予後良好」に分類され、前記患者の類似値が前記第1の類似値の閾値と同じであるかまたはそれを超えるが、前記第2の類似値の閾値より小さい場合には、前記患者が「予後中程度」に分類され、前記患者の類似値が前記第1の類似値の閾値より小さい場合には、前記患者が「予後不良」に分類される方法によって実施される。この方法の他の具体的な実施形態は、前記患者のエストロゲン受容体(ER)の状態を判定するステップを含み、前記患者がER陽性かつリンパ節陰性である場合、前記患者に割り当てる前記治療法は、さらに補助ホルモン療法を含む。
いずれかの患者サブセットまたは臨床クラス、例えば上記のクラスのいずれかの中の患者を、臨床クラス中の患者の予後レベルに適したテンプレートプロファイルに対する患者の細胞成分プロファイルの類似性に基づいて、特定の予後レベル、例えば予後良好または予後不良に分類することができる。一実施形態では、特定の予後レベルに対応する細胞成分プロファイル、例えば、その予後レベルを有する複数の患者において細胞成分のレベルを表す複数の細胞成分の測定値を含むプロファイルを予後レベルのテンプレートとして使用する。例えば、転帰が良好な複数の患者における細胞成分のレベルを表す複数の細胞成分の測定値を含む予後良好なテンプレートプロファイル、または転帰が不良な複数の患者における細胞成分のレベルを表す複数の細胞成分の測定値を含む予後不良なテンプレートプロファイルを、患者が予後良好であるかまたは予後不良であるかの決定に使用することができる。本明細書において、転帰が良好な患者とは、最初の診断から一定期間内、例えば、1、2、3、4、5または10年の期間内に転移の再発がない患者である。その一方で、転帰が不良な患者とは、最初の診断から一定期間内、例えば、1、2、3、4、5または10年の期間内に転移の再発がある患者である。好ましい実施形態では、どちらの期間も10年である。表1〜5は、それぞれの患者クラスについての例示的なテンプレートプロファイルを示す。例えば、ER+、ER/年齢 低値、LN+の組合せを有する患者の発現プロファイルを、表4の予後良好なテンプレートと比較して、患者が予後良好であるかまたは予後不良であるかを判定することができる。
特定の予後のテンプレートに対する患者の細胞成分プロファイルの類似性の程度を使用して、患者が特定の予後を有するかどうかを示唆することができる。例えば、高い類似性の程度からは患者が特定の予後を有することが示唆されるが、低い類似性の程度からは患者が特定の予後を有さないことが示唆される。好ましい実施形態では、患者の細胞成分プロファイルが予後良好なテンプレートと類似性が高く、かつ/または予後不良なテンプレートと類似性が低い場合、予後良好なプロファイルを有するものに患者を分類する。他の実施形態では、患者の細胞成分プロファイルが予後良好なテンプレートと類似性が低く、かつ/または予後不良なテンプレートと類似性が高い場合、予後不良なプロファイルを有するものに患者を分類する。55歳未満の乳癌患者の応答性を予測する実施形態では、テンプレートの作成に使用する、転帰が良好な患者および不良な患者の集団中の患者も、乳癌の診断の時点で55歳未満であることが好ましい。
患者の細胞成分プロファイルとテンプレートプロファイルとの類似性の程度は、当該技術分野で公知のいずれの方法を使用して決定してもよい。一実施形態では、類似性は、患者プロファイルとテンプレートとの相関係数によって表される。一実施形態では、相関の閾値より高い相関係数から類似性が高いことが示唆されるが、閾値より低い相関係数から類似性が低いことが示唆される。好ましい実施形態では、相関の閾値は、0.3、0.4、0.5または0.6として設定される。他の実施形態では、患者プロファイルとテンプレートとの類似性は、患者プロファイルとテンプレートとの隔たりによって表される。一実施形態では、隔たりが所与の値より低いと、類似性が高いことが示唆され、隔たりが所与の値以上であると、類似性が低いことが示唆される。
例として、一実施形態では、予後良好のテンプレートを
Figure 2007527247
(例えば、表1〜5のうちの1つの予後良好の欄中に列挙されているxdevのものからなるプロファイル)と定義し、かつ/または予後不良のテンプレートを、
Figure 2007527247
(例えば、表1〜5のうちの1つの予後不良の欄中に列挙されているxdevのものからなるプロファイル)と定義する。次いで、2つの分類パラメーター(PおよびP)の一方または両方を使用して、患者プロファイルとそれぞれのテンプレートとの類似性の程度を測定することができる:Pは、患者プロファイル
Figure 2007527247
と予後良好なテンプレート
Figure 2007527247
との類似性を測定するものであり、Pは、
Figure 2007527247
と予後不良なテンプレート
Figure 2007527247
との類似性を測定するものである。相関係数を使用する実施形態では、相関係数Pは、
Figure 2007527247
として算出することができ、式中、i=1および2である。
したがって、一実施形態では、Pが選択された相関の閾値より高いか、またはPが選択された相関の閾値以下である場合、
Figure 2007527247
は、予後良好なプロファイルに分類される。他の実施形態では、Pが選択された相関の閾値より低いか、またはPが選択された相関の閾値より高い場合、
Figure 2007527247
は、予後不良なプロファイルに分類される。さらに他の実施形態では、Pが第1の選択された相関の閾値より高い場合、
Figure 2007527247
は、予後良好なプロファイルに分類され、Pが第2の選択された相関の閾値より高い場合、
Figure 2007527247
は、予後不良なプロファイルに分類される。
好ましい実施形態では、細胞成分プロファイルは、患者に由来する試料中における複数の転写産物(例えば、mRNAまたはcDNAとして測定されるもの)、例えば、表1〜5の1つの全部または一部の中のマーカーに対応する複数の転写産物の測定値を含む発現プロファイルである。この実施形態では、予後良好なテンプレートは、複数の予後良好な患者における転写産物の発現レベルを表す複数の転写産物の測定値を含む予後良好な発現のテンプレートとすることができ、予後不良なテンプレートは、複数の予後不良な患者における転写産物の発現レベルを表す複数の転写産物の測定値を含む予後不良な発現のテンプレートとすることができる。好ましい実施形態では、予後良好なまたは予後不良な発現テンプレート中の各転写産物の測定値は、それぞれ予後良好なまたは予後不良な複数の患者中における転写産物の発現レベルの平均である。
他の実施形態では、発現プロファイルは、対照試料中における複数の転写産物の測定値に対する、患者に由来する試料中における複数の転写産物の差次的な測定値を含む差次的発現プロファイルである。差次的な測定値は、xdev、log(比)、誤差加重log(比)、または平均減算log(強度)でもよい(例えば、Stoughtonら、PCT公開WO00/39339(2000年7月6日公開);Maoら、代理人整理番号9301−188−999の米国特許出願第10/848,755号(2004年5月18日出願)を参照、これらはそれぞれ、その全体が参照により本明細書に組み入れられる)。
5.4.3 発現レベルの差に対する感度の向上
本明細書で開示されているマーカーを使用し、実際に、例えば、プロファイルを比較するか、または1つの表現型を有する個体を第2の表現型を有する他の個体と区別するためにマーカーのいずれかのセットを使用する際に、試料中におけるマーカーの絶対的な発現レベルを含むプロファイルをテンプレートと比較することができ、例えば、テンプレートは複数の個体におけるマーカーの発現の平均レベルを含む。しかし、その比較の感度を高めるために、発現レベルの値をいくつかの形に変換することが好ましい。また、マーカーのいずれかのセットを使用して1つの表現型を有する個体を第2の表現型を有する他の個体と区別するために、試料中における各マーカーの絶対的な発現を対照と比較することができ、例えば、対照は、個体のプール中における各マーカーそれぞれの発現の平均レベルとすることができる。
例えば、各マーカーの発現レベルは、その発現レベルが決定されているマーカーすべての平均発現レベルによって、または対照遺伝子のセットの平均発現レベルによって標準化することができる。したがって、一実施形態では、マーカーは、マイクロアレイ上のプローブによって表され、各マーカーの発現レベルは、マーカーでない任意の遺伝子をはじめとする、マイクロアレイ上で表される遺伝子すべてにわたる平均または中央値発現レベルによって標準化する。具体的な実施形態では、標準化は、マイクロアレイ上の遺伝子すべての発現の中央値または平均レベルを除算することによって実施する。他の実施形態では、マーカーの発現レベルは、対照マーカーのセットの平均または中央値発現レベルによって標準化する。具体的な実施形態では、対照マーカーは、ハウスキーピング遺伝子のセットを含む。他の具体的な実施形態では、標準化は、対照遺伝子の中央値または平均発現レベルで除算することによって行う。
個々のマーカーの発現レベルを、試料のプール中における同じマーカーの発現と比較した場合、マーカーに基づくアッセイの感度も高まる。好ましくは、その比較は、試料のプール中における各マーカー遺伝子の平均または中央値発現レベルに対するものである。そのような比較は、例えば、各マーカーについてプールの平均または中央値発現レベルで試料中の各マーカーの発現レベルを除算することによって行うことができる。これは、試料中のマーカーと全体としてのプールのマーカーとの発現における相対的な差を強調する効果を有し、それによって比較の感度が高くなり、絶対的な発現レベルを単独で使用するより意味のある結果が得られる可能性が高くなる。発現レベルのデータは、任意の好都合な形に変換することができる;好ましくは、すべての発現レベルのデータを対数変換した後に平均値または中央値を得る。
プールとの比較を行う際に、2つの手法を使用することができる。第1に、試料中におけるマーカーの発現レベルを、プール中におけるそれらのマーカーの発現レベルと比較することができ、試料に由来する核酸とプールに由来する核酸を、単一実験の過程の間にハイブリダイズする。そのような手法は、各比較または限定された数の比較について新たなプール核酸を生成することを必要とし、したがって、利用可能な核酸の量によって限定される。あるいは、かつ好ましくは、標準化および/または変換されていてもいなくても、プール中の発現レベルを、コンピュータ、またはコンピュータで読み取り可能な媒体に記憶させて、試料に由来する個々の発現レベルのデータ(すなわち、単一チャネルデータ)との比較に使用する。
本発明はまた、第1の細胞または生物を、少なくとも2つの異なる表現型のうち1つを有するものに分類する下記の方法を提供し、その異なる表現型は、第1の表現型および第2の表現型を含む。第1の細胞または生物由来の第1の試料中における複数の各マーカーの発現レベルを、前記少なくとも2つの異なる表現型をそれぞれ示す異なる細胞または生物を含む複数の細胞または生物由来のプール試料中における前記各マーカーそれぞれの発現レベルと比較して、第1の比較値を得る。次いで、第1の比較値を第2の比較値と比較し、前記第2の比較値は、前記第1の表現型を有すると特徴付けられた細胞または生物由来の試料中における前記各マーカーの発現レベルを、プール試料中における前記各マーカーそれぞれの発現レベルと比較するステップを含む方法の結果物である。次いで、第1の比較値を第3の比較値と比較し、前記第3の比較値は、第2の表現型を有すると特徴付けられた細胞または生物由来の試料中における各マーカーの発現レベルを、プール試料中における各マーカーそれぞれの発現レベルと比較するステップを含む方法の結果物である。具体的な実施形態では、マーカーは、遺伝子、その遺伝子によってコードされるタンパク質などでもよい。場合によっては、第1の比較値は、さらなる比較値とそれぞれ比較することができ、さらなる各比較値は、前記第1および第2の表現型と異なるが、その少なくとも2つの異なる表現型の中に含まれる表現型を有すると特徴付けられた細胞または生物由来の試料中における前記各マーカーの発現レベルを、前記プール試料中における前記各遺伝子それぞれの発現レベルと比較するステップを含む方法の結果物である。最後に、前記第2、第3の、また存在する場合は1つまたは複数のさらなる比較値のどれと前記第1の比較値が最も類似するかに関して決定がなされ、第1の細胞または生物が、前記第1の比較値と最も類似する前記比較値を得るのに使用した細胞または生物の表現型を有することが決定される。
個々のマーカーの発現レベルを、対照試料中、例えば試料のプールを含む試料中における同じマーカーの発現と比較して差次的発現プロファイルを作成する場合、マーカーに基づくアッセイの感度も高まる。そのような比較は、例えば、試料中における各マーカーの発現レベルと、対照試料中における対応するマーカーの発現レベルとの比を決定することによって行うことができる。これは、試料中のマーカーと対照全体のマーカーとの間の発現における相対的な差を強調する効果を有し、それによってその後のテンプレートとの比較の感度が高くなり、絶対的な発現レベルを単独で使用するより意味のある結果が得られる可能性が高くなる。比較は、いずれかの好都合な形で、例えば差、比、またはlog(比)を得ることによって行うことができる。
対照試料との比較を行う際に、2つの手法を使用することができる。第1に、試料中におけるマーカーの発現レベルを、対照試料中におけるそれらのマーカーの発現レベルと比較することができ、試料に由来する核酸と、対照に由来する核酸は、単一実験の過程の間にハイブリダイズする。そのような手法は、各比較または限定された数の比較について核酸の新たな対照試料を生成することを必要とし、したがって、利用可能な核酸の量によって限定される。あるいは、標準化および/または変換されていてもいなくても、対照試料中の発現レベルを、コンピュータ、またはコンピュータで読み取り可能な媒体に記憶させて、試料に由来する個々の発現レベルのデータ(すなわち、単一チャネルデータ)との比較に使用する。
本発明の方法は、好ましくは対照または基準試料を使用し、その試料は、細胞成分中でのそれに対する変化を決定することができるいずれの適切な試料でもよい。一実施形態では、対照または基準試料は、複数の乳癌患者に由来する複数の細胞成分、例えば複数の転写産物またはcDNA、あるいは複数のタンパク質種を一緒にプールすることによって作製する。あるいは、対照または基準試料は、精製または合成された細胞成分、例えば精製または合成された複数の転写産物またはcDNA、精製または合成された複数のタンパク質種を一緒にプールすることによって作製することもできる。一実施形態では、各転写産物またはcDNAについての合成RNAをプールして対照または基準試料とする。好ましくは、合成RNAの存在量はおよそ、現実の腫瘍プール中において対応する転写産物の存在量である。個々の各患者試料についてのマーカー遺伝子の差次的発現は、この対照試料に対して測定する。一実施形態では、診断用/予後判定用の転写産物の発現レベルについてアッセイを行うのに使用するマイクロアレイ上のプローブ配列に対応する60merのオリゴヌクレオチドを合成し、pBluescriptSK−ベクター(Stratagene、La Jolla、カリフォルニア州)中のT7プロモーター配列の近傍にクローン化する。個々のクローンを単離し、DNA配列決定によってそのインサートの配列を確認する。合成RNAを生成するために、クローンをEcoRIで直鎖化し、T7 in vitro転写(IVT)反応をMegaScriptキット(Ambion、Austin、テキサス州)によって行い、その後産物のDNアーゼ処理を行う。合成RNAをRNeasyカラム(Qiagen、Valencia、カリフォルニア州)で精製する。これらの合成RNAを転写し、増幅し、標識し、一緒に混合して、基準プールを作製する。これらの合成RNAの存在量は、現実の腫瘍プール中における対応するマーカー遺伝子の転写産物の存在量に近づくように選択する。
本発明は、第1の細胞または生物を、少なくとも2つの異なる表現型の1つを有するものに分類する下記の方法を提供し、その異なる表現型は、第1の表現型および第2の表現型を含む。第1の細胞または生物由来の第1の試料中における複数の各マーカーの発現レベルを、前記少なくとも2つの異なる表現型をそれぞれ示す異なる細胞または生物を含む複数の細胞または生物由来のプール試料中における前記各マーカーそれぞれの発現レベルと比較して、第1の比較値を得、その結果、前記複数のマーカーについて複数の第1の比較値を含む第1の差次的プロファイルが作成される。次いで、第1の差次的プロファイルを、複数の第2の比較値を含む第2の差次的プロファイルと比較し、それぞれの前記第2の比較値は、前記第1の表現型を有すると特徴付けられた細胞または生物由来の試料中における前記各マーカーの発現レベルを、プール試料中における前記各マーカーそれぞれの発現レベルと比較するステップを含む方法の結果物である。次いで、第1の差次的プロファイルを、複数の第3の比較値を含む第3の差次的プロファイルと比較し、それぞれの前記第3の比較値は、第2の表現型を有すると特徴付けられた細胞または生物由来の試料中における各マーカーの発現レベルを、プール試料中における各マーカーそれぞれの発現レベルと比較するステップを含む方法の結果物である。具体的な実施形態では、各マーカーは、遺伝子、その遺伝子によってコードされるタンパク質などでもよい。場合によっては、第1の差次的プロファイルは、それぞれがさらなる比較値を含むさらなる発現プロファイルとそれぞれ比較することができ、さらなる各比較値は、前記第1および第2の表現型と異なるが、その少なくとも2つの異なる表現型の中に含まれる表現型を有すると特徴付けられた細胞または生物由来の試料中における前記各マーカーの発現レベルを、前記プール試料中における前記各遺伝子それぞれの発現レベルと比較するステップを含む方法の結果物である。最後に、前記第2、第3の、また存在する場合は1つまたは複数のさらなる差次的プロファイルのどれと前記第1の差次的プロファイルが最も類似するかに関して決定がなされ、第1の細胞または生物が、前記第1の差次的プロファイルと最も類似する前記差次的プロファイルを得るのに使用した細胞または生物の表現型を有することが決定される。
この方法の具体的な実施形態では、比較値は、前記各遺伝子の発現レベルのそれぞれの比である。他の具体的な実施形態では、任意の比較ステップの前に、プール試料中における各遺伝子の各発現レベルを標準化する。より具体的な実施形態では、発現レベルの標準化は、前記細胞または生物由来のプール試料中における各遺伝子の発現の中央値または平均レベルで除算することによって、あるいは1つまたは複数のハウスキーピング遺伝子の発現の中央値または平均レベルで除算することによって実施する。他の具体的な実施形態では、標準化された発現レベルを対数変換に供し、比較ステップは、試料中における各遺伝子の発現レベルの対数からその対数変換を減算することを含む。他の具体的な実施形態では、2種以上の異なる表現型は、疾患または異常の異なる段階である。さらに他の具体的な実施形態では、2種以上の異なる表現型は、疾患または異常の異なる予後である。さらに他の具体的な実施形態では、プール試料中における各遺伝子それぞれの発現レベル、あるいは第1の表現型、第2の表現型、または前記第1および第2の表現型と異なる前記表現型をそれぞれ有すると特徴付けられた細胞または生物由来の試料中における前記各遺伝子の前記発現レベルを、コンピュータ、またはコンピュータで読み取り可能な媒体に記憶させる。
他の具体的な実施形態では、2つの表現型は、予後良好および予後不良である。より具体的な実施形態では、2つの表現型は、ER、BRCA1の状態、ER、散発性の状態、ER+、ER/年齢 高値の状態、ER+、ER/年齢 低値、LN+の状態、またはER+、ER/年齢 低値、LN+の状態であると認められる個体についての予後良好および予後不良である。
他の具体的な実施形態では、試料中における遺伝子の発現プロファイルと、2種以上の表現型の1つしか示さないプール中における同じ遺伝子の発現プロファイルとの間で比較を行う。予後相関遺伝子との関連で、例えば、試料中における予後関連遺伝子の発現レベルを、(予後不良な患者および予後良好な患者由来の試料を含む複数の試料と対照的に)複数の「予後良好な」試料中における同じ遺伝子の発現の平均レベルと比較することができる。したがって、この方法では、予後相関遺伝子の発現プロファイルが、「予後良好な」平均発現プロファイル(例えば、「予後良好な」複数の患者由来の試料中における予後相関遺伝子の発現の平均レベルを含むプロファイル)に対する選択された相関係数を超える場合に試料を予後良好に分類する。その発現プロファイルと「予後良好な」発現プロファイルの相関が不十分である(例えば、その相関係数が選択された係数を超えない)患者を予後不良に分類する。
表現型、遺伝子型、または臨床上の特徴に基づいて個体を患者サブセットに分類する場合、試料のプールは、各患者サブセットを代表する試料を含む表現型についての試料のプールでもよい。あるいは、試料のプールは、特定の患者サブセットしか代表しない表現型についての試料のプールでもよい。例えば、個体がER+、散発性に分類される場合、個体の試料を比較する試料のプールは、ER+、散発性の予後良好な個体のみに由来する試料のプールでもよく、あるいは、ER状態または突然変異の型と無関係に、予後良好な個体の試料のプールでもよい。
その方法を複数の患者サブセットに適用することができる。例えば、具体的な実施形態では、表現型は予後良好であり、個体を以下の患者サブセット:ER、BRCA1の状態、ER、散発性の状態、ER+、ER/年齢 高値の状態、ER+、ER/年齢 低値、LN+の状態、またはER+、ER/年齢 低値、LN+の状態の1つに分類する。次いで、個体が分類されている患者サブセットの予後判定について情報提供性のあるマーカーのセットを使用して、個体について予想される予後を判定する。個体が分類されている特定のサブセットの予後相関遺伝子の発現プロファイルが、「予後良好な」平均発現プロファイル(例えば、「予後良好な」サブクラス内の患者に由来する複数の試料中における予後相関遺伝子の発現レベル)に対する選択された相関係数を超える場合に、試料を予後良好な個体に由来するものに分類する。その発現レベルと「予後良好な」発現プロファイルの相関が不十分である(例えば、その相関係数が選択された係数を超えない)患者を予後不良に分類する。
もちろん、数学的試料プールと具体的に比較せずに単一チャネルデータを使用することもできる。例えば、(a)試料に由来する核酸を蛍光団で標識して蛍光団標識核酸のプールを取得し、(b)ハイブリダイゼーションが起こり得る条件下で前記の蛍光団標識核酸をマイクロアレイと接触させ、マイクロアレイ上の複数の別個の各位置で、前記条件下で前記マイクロアレイと結合した前記蛍光団標識核酸からの蛍光発光シグナルを検出し、(c)第1および第2のテンプレートに対する個々の試料中でのマーカー遺伝子発現の類似性を決定することによって、それぞれが同じマーカーの発現レベルを含む第1の表現型のテンプレートおよび第2の表現型のテンプレートに対する、試料中での、第1または第2の表現型と相関する少なくとも5個のマーカーの発現プロファイル間の類似性を算出することにより、試料を第1または第2の表現型を有するものに分類することができ、その第1および第2の表現型は関連し、前記発現が第1のテンプレートに類似する場合、試料を第1の表現型を有するものに分類し、前記発現が第2のテンプレートに類似する場合、試料を第2の表現型を有するものに分類する。
上記の方法の具体的な実施形態では、第1の表現型は、乳癌の予後良好であり、試料は、患者サブセットに分類されている個体由来の試料であり、第1および第2のテンプレートは、特定の患者サブセットの表現型についてのテンプレートである。より具体的な実施形態では、例えば、第1の表現型は予後良好であり、第2の表現型は予後不良であり、患者は、ER、散発性の患者サブセット、ER、BRCA1のサブセット、ER+、ER/年齢 高値のサブセット、ER+、ER/年齢 低値、LN+のサブセット、またはER+、ER/年齢 低値、LN+のサブセットに分類され、前記第1および第2のテンプレートは、それぞれ予後良好な個体および予後不良な個体中におけるマーカー遺伝子の発現に由来するテンプレートであり、前記個体は、前記患者が分類される患者サブセットのすべてである。
5.5 マーカー遺伝子発現レベルの決定
5.5.1 方法
試料中でのマーカー遺伝子の発現レベルは、当該技術分野で公知のいずれかの手段によって決定することができる。発現レベルは、各マーカー遺伝子から転写された核酸を単離しそのレベル(すなわち、量)を決定することによって決定することができる。あるいは、またはさらには、マーカー遺伝子によってコードされる特定のタンパク質のレベルを決定することもできる。
試料中に存在するmRNA、またはそれに由来するポリヌクレオチドの量を決定することによって、特定のマーカー遺伝子の発現レベルを実現することができる。RNAレベルを決定するどんな方法も使用することができる。例えば、試料からRNAを単離し、それをアガロースゲル上で分離する。次いで、分離したRNAを、フィルターなどの固体支持体にトランスファーする。次いで、1つまたは複数のマーカーを表す核酸プローブを、ノーザンハイブリダイゼーションによりフィルターにハイブリダイズさせ、マーカー由来のRNAの量を決定する。そのような決定は、視覚によるものでもよく、あるいは機械に支援される、例えば、デンシトメーターの使用によるものでもよい。RNAレベルを決定する他の方法は、ドットブロットまたはスロットブロットの使用によるものである。この方法では、試料由来のRNA、またはそれに由来する核酸を標識する。次いで、RNAまたはそれに由来する核酸を、1つまたは複数のマーカー遺伝子に由来し、フィルター上の容易に特定可能な別個の位置に配置されたオリゴヌクレオチドを含むフィルターとハイブリダイズさせる。フィルター結合オリゴヌクレオチドと標識RNAのハイブリダイゼーションまたはその欠如を、視覚的にまたはデンシトメーターにより決定する。放射標識または蛍光(すなわち可視的)標識を用いてポリヌクレオチドを標識することができる。
これらの例は、限定的でないものと意図される;RNAの存在量を決定する他の方法が当該技術分野で公知である。
特定のマーカー遺伝子の発現レベルは、マーカー遺伝子から発現された特定のタンパク質のレベルを決定することによって評価することもできる。例えば、試料由来のタンパク質をポリアクリルアミドゲル上で分離し、その後ウェスタンブロット中で抗体を使用して特定のマーカー由来タンパク質を特定することにより、これを実現することができる。あるいは、二次元ゲル電気泳動の系によってタンパク質を分離することもできる。二次元ゲル電気泳動は当該技術分野で周知であり、通常、1次元目の方向に等電点電気泳動を行い、その後、2次元目の方向にSDS−PAGE電気泳動を行う。例えば、Hamesら, 1990, GEL ELECTROPHORESIS OF PROTEINS: A PRACTICAL APPROACH, IRL Press, New York; Shevchenkoら, Proc. Nat'l Acad. Sci. USA 93:1440-1445 (1996); Saglioccoら, Yeast 12:1519-1533 (1996); Lander, Science 274:536-539 (1996)を参照されたい。質量分析技術、ウェスタンブロット法、ならびにポリクローナル抗体およびモノクローナル抗体を使用するイムノブロット分析をはじめとする多数の技術によって、得られた電気泳動像を分析することができる。
あるいは、マーカー由来タンパク質レベルは、結合部位が、細胞ゲノムによってコードされる複数のタンパク質種に特異的な、固定化された、好ましくはモノクローナルの抗体を含む抗体マイクロアレイを構築することによって決定することもできる。好ましくは、対象とするマーカー由来タンパク質のかなりの割合に対する抗体が存在する。モノクローナル抗体を作製する方法は周知である(例えば、Harlow and Lane, 1988, ANTIBODIES: A LABORATORY MANUAL, Cold Spring Harbor, New Yorkを参照、これはすべての目的でその全体が組み入れられる)。一実施形態では、細胞のゲノム配列に基づいて設計された合成ペプチド断片に対してモノクローナル抗体を産生させる。そのような抗体アレイを用いて、細胞由来のタンパク質をアレイと接触させ、当該技術分野で公知のアッセイでその結合についてアッセイを行う。一般に、組織のスライスまたは切片の免疫組織化学染色により、診断または予後判断の対象となるタンパク質の発現、および発現レベルを検出することができる。
最後に、多数の組織標本中でのマーカー遺伝子の発現について、「組織アレイ」を用いて特徴付けることができる(Kononenら, Nat. Med 4(7):844-7 (1998))。組織アレイでは、複数の組織試料を、同じマイクロアレイ上で評価する。そのアレイは、RNAおよびタンパク質レベルのin situ検出を可能にする;連続切片は、複数のサンプルの同時分析を可能にする。
5.5.2 マイクロアレイ
好ましい実施形態では、ポリヌクレオチドマイクロアレイを使用して発現を測定し、その結果、上記の各マーカーの発現状態が同時に評価される。一般に、本発明に従ったマイクロアレイは、特定の疾患または状態に対して、具体的には、その疾患もしくは状態の遺伝子型または表現型の特徴の特定の組合せを有する個体に対して、予後判定または転帰判定について情報提供性のある(すなわち、特定の患者サブセットについて予後情報提供性のある)複数のマーカーを含む。
本発明のマイクロアレイは、好ましくは、患者サブセット内で予後情報提供性があると認められた、少なくとも2、3、4、5、7、10、15、20、25、30、35、40、45、50、75、100、150、もしくは200種以上のマーカー、またはすべてのマーカー、あるいはマーカーの任意の組合せを含む。マイクロアレイが含む情報提供性マーカーの現実の数は、対象とする特定の状態、認められたマーカーの数、場合によっては、予後の判定でI型エラー、II型エラー、またはI型およびII型のエラーが最少となると判明した情報提供性マーカーの数に応じて決まる。本明細書において、「I型エラー」とは偽陽性を意味し、「II型エラー」とは偽陰性を意味する;乳癌の予後の例では、I型エラーとは、予後良好な個体を予後不良とした特徴付けの誤りであり、II型エラーとは、予後不良な個体を予後良好とした特徴付けの誤りである。
具体的な実施形態では、本発明はポリヌクレオチドアレイを提供し、ここで特定の患者サブセットについて認められた予後判定マーカーが、前記アレイ上のプローブの少なくとも50%、60%、70%、80%、85%、90%、95%または98%を占める。他の具体的な実施形態では、マイクロアレイは複数のプローブを含み、前記複数のプローブは、特定の患者サブセットについて認められた予後情報提供性マーカーのうち少なくとも75%と相補的かつハイブリダイズ可能なプローブを含む。本発明のマイクロアレイは、もちろん、特定の状態について認められた複数の患者サブセットまたは各患者サブセットについて予後情報提供性のあるマーカーと相補的かつハイブリダイズ可能なプローブを含んでよい。したがって、他の実施形態では、本発明のマイクロアレイは、対象とする状態について認められた各患者サブセットについて特定された予後情報提供性マーカーのうち少なくとも75%と相補的かつハイブリダイズ可能な複数のプローブを含み、前記プローブは、合計で、前記マイクロアレイ上のプローブの少なくとも50%である。
さらに他の具体的な実施形態では、本明細書で開示されている方法で使用するマイクロアレイは、場合によっては、本明細書の他の箇所で開示されている方法によって特定された少なくとも一部のマーカーに対して追加のマーカーを含む。例えば、具体的な実施形態では、マイクロアレイは、Altschulerら、国際公開WO02/18646(2002年3月7日公開)、およびSchererら、国際公開WO02/16650(2002年2月28日公開)に記載されているスクリーニング用またはスキャン用アレイである。スキャンおよびスクリーニング用アレイは、発現しているものと発現していないものの両方のゲノム核酸配列に由来する、規則正しく配置され、位置アドレス指定可能なプローブを含む。そのようなアレイは、対象とする状態の患者サブセットについて特定されたマーカーのサブセット、または全部に対応するプローブを含んでもよく、そのアレイを使用して、その他の形で特定された予後情報提供性マーカーしか含まないマイクロアレイと同様にしてマーカー発現をモニターすることができる。
さらに他の具体的な実施形態では、マイクロアレイは、本明細書に記載の方法によって特定されたマーカーを少なくとも5個含む市販されているcDNAマイクロアレイである。好ましくは、市販されているcDNAマイクロアレイは、特定の状態の患者サブセットについて情報提供性があるものとして本明細書に記載の方法によって特定されたマーカーをすべて含む。しかし、そのようなマイクロアレイは、そのようなマーカーを少なくとも5、10、15、または25個、特定されたマーカーの最大数まで含んでもよい。
乳癌に特異的な実施形態では、本発明は、上記の各マーカーセット(すなわち、表1〜5に示す、ER、散発性の個体について情報提供性のあるマーカー、ER、BRCA1の個体について情報提供性のあるマーカー、ER+、ER/年齢 高値の個体について情報提供性のあるマーカー、ER+、ER/年齢 低値、LN+の個体について情報提供性のあるマーカー、およびER+、ER/年齢 低値、LNの個体について情報提供性のあるマーカー)と対応する遺伝子とハイブリダイズ可能なプローブを含むオリゴヌクレオチドまたはcDNAアレイを提供する。本明細書に記載のマイクロアレイはいずれも、キット中の密封容器に入れて提供することができる。
本発明は、任意の乳癌患者の予後判断に、または複数の患者サブセットの1つに分類された乳癌患者に有用なプローブを備えたマイクロアレイを提供する。特に、本発明は、表1〜5のいずれかの中の、予後良好な患者と予後不良な患者を区別する少なくとも5、10、15、20または25個以上の遺伝子マーカーからなる1つまたは複数のサブセット、あるいは最大でマーカーの完全なセットに対するプローブを含むポリヌクレオチドアレイを提供する。したがって、特定の実施形態では、本発明は、それに対するマーカーが表1、2、3、4または5に列挙されている複数の遺伝子に対するプローブを含むマイクロアレイを提供する。具体的な実施形態では、本発明のマイクロアレイは、表1中のマーカーを1、2、3、4、5または10個、表2中のマーカーを少なくとも5個;表3中のマーカーを1、2、3、4、5または10個;表4中のマーカーを1、2、3、4、5または10個;あるいは表5中のマーカーを1、2、3、4、5または10個含む。他の実施形態では、マイクロアレイは、表1〜5のいずれか2つ、3つまたは4つ、あるいは表1〜5のすべての中で示されるマーカーの1、2、3、4、5または10個に対するプローブを含む。他の実施形態では、本発明のマイクロアレイは、表1、表2、表3、表4または表5中の各マーカーを含む。他の実施形態では、マイクロアレイは、表1〜5中で示されるマーカーをすべて含む。具体的な実施形態では、アレイは、表1、表2、表3、表4または表5中に列挙されているマーカーのみに由来するプローブ、あるいは表1〜5のいずれか2つ、表1〜5のいずれか3つ、表1〜5のいずれか4つ、または表1〜5のすべてに由来するプローブを含む。
他の実施形態では、アレイは、乳がんの予後判断について情報提供性があると認められている、表1〜5のいずれにも列挙されていないマーカーに由来する複数の他のプローブと組み合わせて、表1〜5のいずれかに列挙されているマーカーに由来する複数のプローブを含む。
具体的な実施形態では、本発明はポリヌクレオチドアレイを提供し、ここで、本明細書において表1、2、3、4および/または5の中に記載の乳癌予後判定マーカーが、前記アレイ上のプローブの少なくとも50%、60%、70%、80%、85%、90%、95%または98%を占める。他の具体的な実施形態では、マイクロアレイは複数のプローブを含み、前記複数のプローブは、それに対するマーカーが表1中に列挙されている遺伝子のうち少なくとも75%と相補的かつハイブリダイズ可能なプローブ;それに対するマーカーが表2中に列挙されている遺伝子のうち少なくとも75%と相補的かつハイブリダイズ可能なプローブ;それに対するマーカーが表3中に列挙されている遺伝子のうち少なくとも75%と相補的かつハイブリダイズ可能なプローブ;それに対するマーカーが表4中に列挙されている遺伝子のうち少なくとも75%と相補的かつハイブリダイズ可能なプローブ;それに対するマーカーが表5中に列挙されている遺伝子のうち少なくとも75%と相補的かつハイブリダイズ可能なプローブを含み、前記プローブは、合計で、前記マイクロアレイ上のプローブの少なくとも50%である。
さらに他の具体的な実施形態では、本明細書で開示されている方法で使用するマイクロアレイは、場合によっては、表1〜5中に列挙されている少なくとも一部のマーカーに対して追加のマーカーを含む。例えば、具体的な実施形態では、マイクロアレイは、Altschulerら、国際公開WO02/18646(2002年3月7日公開)、およびSchererら、国際公開WO02/16650(2002年2月28日公開)に記載されているスクリーニング用またはスキャン用アレイである。スキャンおよびスクリーニング用アレイは、発現しているものと発現していないものの両方のゲノム核酸配列に由来する、規則正しく配置され、位置指定可能なプローブを含む。そのようなアレイは、表1〜5中に列挙されているマーカーのサブセット、または全部、あるいは上記のそのサブセットに対応するプローブを含んでもよく、そのアレイを使用して、表1〜5中に列挙されているマーカーしか含まないマイクロアレイと同様にしてマーカー発現をモニターすることができる。
さらに他の具体的な実施形態では、マイクロアレイは、表1〜5中に列挙されているマーカーを少なくとも5個含む市販されているcDNAマイクロアレイである。好ましくは、市販されているcDNAマイクロアレイは、表1〜5中に列挙されているマーカーをすべて含む。しかし、そのようなマイクロアレイは、表1〜5のいずれかの中のマーカーを少なくとも5、10、15、または25個、表中のマーカーの最大数まで含んでもよく、表1〜5のいずれか1つの中のマーカーのすべておよび表1〜5の他のもののサブセット、または上記に記載のそれぞれのサブセットを含んでもよい。本明細書で開示されている方法で使用するマイクロアレイの具体的な実施形態では、表1〜5の全部または一部であるマーカーは、マイクロアレイ上のプローブの少なくとも50%、60%、70%、80%、90%、95%または98%を占める。
上記のマーカーセットおよび/またはサブセットを含むマイクロアレイの構築に関係する一般的な方法を、以下の節で説明する。
5.5.2.1 マイクロアレイの構築
ポリヌクレオチド配列を含むプローブを選択し、次いでそのようなプローブを固体支持体または表面に固定化することによってマイクロアレイを作製する。例えば、プローブは、DNA配列、RNA配列、またはDNAおよびRNAのコポリマー配列を含んでもよい。プローブのポリヌクレオチド配列はまた、DNAおよび/またはRNAアナログ、またはその組合せを含んでもよい。例えば、プローブのポリヌクレオチド配列は、ゲノムDNAの完全な断片でもよく、あるいは部分的な断片でもよい。プローブのポリヌクレオチド配列はまた、合成オリゴヌクレオチド配列などの合成ヌクレオチド配列でもよい。in vivoで酵素的に、in vitroで酵素的に(例えば、PCRにより)、またはin vitroで非酵素的にプローブの配列を合成することができる。
本発明の方法で使用する1つまたは複数のプローブは、好ましくは、固体支持体に固定化され、その支持体は多孔性でもよく、あるいは非多孔性でもよい。例えば、本発明のプローブは、ポリヌクレオチドの3’または5’末端でニトロセルロースまたはナイロンの膜またはフィルターと共有結合したポリヌクレオチド配列でもよい。そのようなハイブリダイゼーションプローブは、当該技術分野で周知である(例えば、Sambrookら, MOLECULAR CLONING - A LABORATORY MANUAL (第2版), Vols. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York (1989)を参照)。あるいは、固体支持体もしくは表面は、ガラスまたはプラスチックの表面でもよい。特に好ましい実施形態では、その表面上で、DNAまたはDNA模倣物の集団や、あるいは、RNAまたはRNA模倣物の集団などのポリヌクレオチドの集団が固定化されている固相からなるプローブのマイクロアレイに対して、ハイブリダイゼーションのレベルを測定する。固相は、非多孔性でもよく、あるいは、場合によっては、ゲルなどの多孔性物質でもよい。
好ましい実施形態では、マイクロアレイは、それぞれが本明細書に記載のマーカーの1つを表す結合(例えば、ハイブリダイゼーション)部位または「プローブ」が規則正しく配置された支持体または表面を含む。好ましくは、マイクロアレイは、アドレス指定可能なアレイであり、より好ましくは位置アドレス指定可能なアレイである。より具体的には、アレイの各プローブは、好ましくは、固体支持体上で既知かつ所定の位置にあり、その結果、アレイ中の(すなわち、支持体または表面上の)その位置から各プローブの素性(すなわち、その配列)を決定することができる。好ましい実施形態では、各プローブは、単一の部位で固体支持体と共有結合している。
マイクロアレイは、多くの方法で作製することができ、そのいくつかを以下で説明する。どのように作製されても、マイクロアレイは特定の特徴を共有する。アレイは複製可能であり、それによって所与のアレイの複数複製物を作製することが可能であり、それらを互いに比較することが容易となる。好ましくは、マイクロアレイは、結合(例えば、核酸のハイブリダイゼーション)条件下で安定な物質から作製される。マイクロアレイは、好ましくは小さく、例えば、1cm〜25cm、12cm〜13cm、または3cmである。しかし、より大きなアレイも意図され、例えば、スクリーニングアレイでの使用に好ましいことがある。好ましくは、マイクロアレイ中での所与の結合部位または結合部位のユニークなセットは、細胞中の単一の遺伝子の産物と(例えば、特異的なmRNA、またはそれに由来する特異的なcDNAと)特異的に結合する(例えば、ハイブリダイズする)。しかし、一般には、他の関連または類似配列が所与の結合部位と交差ハイブリダイズする。
本発明のマイクロアレイは1つまたは複数の試験プローブを含み、そのプローブはそれぞれ、検出対象のRNAまたはDNAの部分配列と相補的なポリヌクレオチド配列を有する。好ましくは、固体表面上の各プローブの位置は既知である。実際、マイクロアレイは、好ましくは位置アドレス指定可能なアレイである。具体的には、アレイの各プローブは、好ましくは、固体支持体上で既知かつ所定の位置にあり、その結果、アレイ上の(すなわち、支持体または表面上の)その位置から各プローブの素性(すなわち、その配列)を決定することができる。
本発明によれば、マイクロアレイとは、その中の各位置が本明細書に記載のマーカーの1つを表すアレイ(すなわち行列)である。例えば、各位置は、その遺伝子マーカーから転写された特定のRNAまたはcDNAが特異的にハイブリダイズすることができるゲノムDNAに基づくDNAまたはDNAアナログを含むことができる。DNAまたはDNAアナログは、例えば、合成オリゴマーまたは遺伝子断片でもよい。一実施形態では、各マーカーを表すプローブがアレイ上に存在する。好ましい実施形態では、アレイは、表1〜5中に列挙されている各マーカーに対するプローブを含む。
5.5.2.2 マイクロアレイ用プローブの調製
上記で述べたように、本発明に従って特定のポリヌクレオチド分子が特異的にハイブリダイズする「プローブ」は、相補的なゲノムポリヌクレオチド配列を含む。マイクロアレイのプローブは、好ましくは、1,000ヌクレオチド以下のヌクレオチド配列からなる。いくつかの実施形態では、アレイのプローブは、10〜1,000ヌクレオチドのヌクレオチド配列からなる。好ましい実施形態では、プローブのヌクレオチド配列は、長さが10〜200ヌクレオチドであり、生物種のゲノム配列であり、その結果、かかる生物種のゲノムに相補的であるためにハイブリダイズが可能な配列を有し、そのようなゲノムの全部または一部にわたって順番に並んでいる複数の異なるプローブが存在する。他の具体的な実施形態では、プローブは、長さが10〜30ヌクレオチドであり、長さが10〜40ヌクレオチドであり、長さが20〜50ヌクレオチドであり、長さが40〜80ヌクレオチドであり、長さが50〜150ヌクレオチドであり、長さが80〜120ヌクレオチドであり、最も好ましくは長さが60ヌクレオチドである。
プローブは、生物のゲノムの一部分に対応するDNAまたはDNA「模倣物」(mimics)(例えば、誘導体およびアナログ)を含んでもよい。他の実施形態では、マイクロアレイのプローブは相補的なRNAまたはRNA模倣物である。DNA模倣物とは、DNAとの特異的なワトソン・クリック様のハイブリダイゼーション、またはRNAとの特異的なハイブリダイゼーションが可能であるサブユニットからなるポリマーである。核酸は、塩基部分で、糖部分で、またはリン酸骨格で修飾することができる。例示的なDNA模倣物には、例えば、ホスホロチオエートがある。
DNAは、例えば、ゲノムDNAまたはクローン化配列のポリメラーゼ連鎖反応(PCR)増幅によって得ることができる。PCRプライマーは、好ましくは、ゲノムの既知の配列に基づいて選択され、ゲノムDNAの特定の断片を増幅する。Oligo第5.0版(National Biosciences)などの当該技術分野で周知のコンピュータプログラムは、必要な特異性および最適な増幅特性を有するプライマーの設計に有用である。典型的には、マイクロアレイ上の各プローブは、長さが10塩基〜50,000塩基であり、通常は300塩基〜1,000塩基である。PCRの方法は、当該技術分野で周知であり、例えば、Innisら(編), PCR PROTOCOLS: A GUIDE TO METHODS AND APPLICATIONS, Academic Press Inc., San Diego, CA (1990)に記載されている。制御ロボット利用システムが核酸の単離および増幅に有用であることは当業者に明らかであろう。
マイクロアレイのポリヌクレオチドプローブを作製する代替の好ましい手段は、例えばN−ホスホネートまたはホスホルアミダイト化学反応を用いた合成ポリヌクレオチドまたはオリゴヌクレオチドの合成によるものである(Froehlerら, Nucleic Acid Res. 14:5399-5407 (1986); McBrideら, Tetrahedron Lett. 24:246-248 (1983))。合成配列は、典型的には長さが約10〜約500塩基であり、より典型的には約20〜約100塩基であり、最も好ましくは長さが約40〜約70塩基である。いくつかの実施形態では、合成核酸は、決してそれだけに限らないが、イノシンなどの非天然塩基を含む。上記で述べたように、核酸アナログは、ハイブリダイゼーションの結合部位として使用することができる。適切な核酸アナログの例は、ペプチド核酸である(例えば、Egholmら, Nature 363:566-568 (1993);米国特許出願公開第5,539,083号を参照)。
プローブは、好ましくは、結合エネルギー、塩基の組成、配列の複雑性、交差ハイブリダイゼーション結合エネルギー、および二次構造を考慮したアルゴリズムを使用して選択する。Friendら、国際特許公開WO01/05935(2001年1月25日公開);Hughesら, Nat. Biotech. 19:342-7 (2001)を参照されたい。
当業者ならば、陽性対照プローブ、例えば、標的ポリヌクレオチド分子中の配列と相補的かつハイブリダイズ可能であることが知られているプローブ、および陰性対照プローブ、例えば、標的ポリヌクレオチド分子中の配列と相補的でなくかつハイブリダイズ可能でないことが知られているプローブがアレイ上に含まれるべきであることも理解するであろう。一実施形態では、陽性対照は、アレイの周囲に沿って合成される。他の実施形態では、陽性対照は、アレイを横切る対角線中に合成される。さらに他の実施形態では、各プローブに対する逆方向の相補体を、陰性対照として働くプローブの位置の隣に合成する。さらに他の実施形態では、他の生物種由来の配列を、陰性対照として、または「スパイクイン(spike-in)」対照として使用する。
5.5.2.3 固体表面とのプローブの結合
例えばガラス、プラスチック(例えばポリプロピレン、ナイロン)、ポリアクリルアミド、ニトロセルロース、ゲル、あるいは他の多孔性または非多孔性物質から作製することができる固体支持体または表面とプローブを結合させる。表面と核酸を結合させる好ましい方法は、ガラスプレート上でのプリントによるものであり、Schenaら, Science 270:467-470 (1995)に概要が記載されている。この方法は、cDNAのマイクロアレイの作製に特に有用である(DeRisiら, Nature Genetics 14:457-460 (1996); Shalonら, Genome Res. 6: 639-645 (1996);およびSchenaら, Proc. Natl. Acad. Sci. U.S.A. 93:10539-11286 (1995)も参照)。
マイクロアレイを作製する第2の好ましい方法は、高密度オリゴヌクレオチドアレイを作製することによるものである。in situ合成用のフォトリソグラフィー技術(Fodorら, 1991, Science 251:767-773;Peaseら, 1994, Proc. Natl. Acad. Sci. U.S.A. 91:5022-5026;Lockhartら, 1996, Nature Biotechnology 14:1675;米国特許出願公開第5,578,832号;同第5,556,752号;および同第5,510,270号を参照)、または所定のオリゴヌクレオチドを迅速に合成し沈着させる他の方法(Blanchardら, Biosensors & Bioelectronics 11:687-690)を使用して、表面上の所定の位置に所定の配列と相補的な数千種類のオリゴヌクレオチドを含むアレイを作製する技術が知られている。これらの方法を使用するとき、既知の配列のオリゴヌクレオチド(例えば60mer)を、誘導体化スライドガラスなどの表面上に直接合成する。通常、作製されたアレイには重複があり、RNA1種当たりにいくつかのオリゴヌクレオチド分子が存在する。
例えば、マスキング(Maskos and Southern, 1992, Nuc. Acids. Res. 20:1679-1684)による、マイクロアレイを作製する他の方法を使用することもできる。原理上、上記で述べたように、任意の型のアレイ、例えば、ナイロンハイブリダイゼーション膜上のドットブロット(Sambrookら, MOLECULAR CLONING - A LABORATORY MANUAL (第2版), Vols. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York (1989)を参照)を使用することができる。しかし、当業者には理解されるであろうが、ハイブリダイゼーション体積が小さいために、非常に小さなアレイが好ましいことが多い。
一実施形態では、本発明のアレイは、支持体上でポリヌクレオチドプローブを合成することによって作製する。そのような実施形態では、ポリヌクレオチドプローブは、ポリヌクレオチドの3’または5’末端で支持体と共有結合する。
特に好ましい実施形態では、本発明のマイクロアレイは、オリゴヌクレオチド合成用のインクジェットプリント装置により、例えば、Blanchardの米国特許出願公開第6,028,189号; Blanchardら, 1996, Biosensors and Bioelectronics 11:687-690; Blanchard, 1998, Synthetic DNA Arrays in Genetic Engineering, Vol. 20, J.K. Setlow(編), Plenum Press, New York, pages 111-123に記載の方法およびシステムを使用して製造する。具体的には、そのようなマイクロアレイ中のオリゴヌクレオチドプローブは、好ましくは、アレイ中で、例えばスライドガラス上で、炭酸プロピレンなどの高表面張力溶媒の「微小液滴」中の個々のヌクレオチド塩基を連続して沈着させることによって合成する。微小液滴は体積が小さく(例えば、100pL以下、より好ましくは50pL以下)、(例えば疎水性領域により)マイクロアレイ上で互いに分離して、アレイのエレメント(すなわち、異なるプローブ)の位置を規定する、表面張力による円形のウェルを形成する。このインクジェット法によって製造されたマイクロアレイは通常高密度であり、好ましくは1cm当たり異なるプローブが少なくとも約2500種類の密度である。ポリヌクレオチドプローブは、ポリヌクレオチドの3’または5’末端で支持体と共有結合する。
5.5.2.4 標的ポリヌクレオチド分子
本発明によって分析することができるポリヌクレオチド分子(「標的ポリヌクレオチド分子」)は、臨床的に適切ないずれの供給源に由来するものでもよいが、天然に存在する核酸分子、ならびに合成核酸分子をはじめとする、発現されたRNAまたはそれに由来する核酸(例えば、cDNA、またはRNAポリメラーゼプロモーターを組み込んでいるcDNAに由来する増幅RNA)である。一実施形態では、標的ポリヌクレオチド分子は、決してそれだけに限らないが、細胞の総RNA、ポリ(A)メッセンジャーRNA(mRNA)またはその一部分、細胞質mRNA、またはcDNAから転写されたRNA(すなわち、cRNA;例えば、Linsley & Schelter、米国特許出願第09/411,074号(1999年10月4日出願)、あるいは米国特許出願公開第5,545,522号、同第5,891,636号、または同第5,716,785号を参照)をはじめとするRNAを含む。総RNAおよびポリ(A)RNAを調製する方法は当該技術分野で周知であり、一般には、例えばSambrookら, MOLECULAR CLONING - A LABORATORY MANUAL (第2版), Vols. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York (1989)に記載されている。一実施形態では、本発明で対象とする様々な型の細胞から、グアニジンチオシアネート溶解、その後にCsCl遠心分離を用いてRNAを抽出する(Chirgwinら, 1979, Biochemistry 18:5294-5299)。他の実施形態では、シリカゲルベースのカラムを用いて総RNAを抽出するが、そのカラムの市販されている例としては、RNeasy(Qiagen、Valencia、カリフォルニア州)およびStrataPrep(Stratagene、La Jolla、カリフォルニア州)が挙げられる。出芽酵母で好ましい代替の実施形態では、Ausubelら(編), 1989, CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, Vol. III, Green Publishing Associates, Inc., John Wiley & Sons, Inc., New York, pp. 13.12.1-13.12.5に記載のように、フェノールおよびクロロホルムを用いて細胞からRNAを抽出する。ポリ(A)RNAは、例えば、オリゴdTセルロースでの選択によって、あるいは、細胞の総RNAのオリゴdTプライム逆転写によって選択することができる。一実施形態では、当該技術分野で公知の方法によって、例えば、ZnClとともにインキュベートすることによってRNAを断片化して、RNAの断片を作製することができる。他の実施形態では、本発明によって分析されるポリヌクレオチド分子は、cDNA、あるいは増幅RNAまたはcDNAのPCR産物を含む。
一実施形態では、総RNA、mRNA、またはそれに由来する核酸は、乳癌で苦しんでいる者から得られた試料から単離する。特定の細胞中で発現が不十分な標的ポリヌクレオチド分子は、標準化技術を用いて富化することができる(Bonaldoら, 1996, Genome Res. 6:791-806)。
上記のように、標的ポリヌクレオチドは、検出可能となるように1つまたは複数のヌクレオチドに標識する。当該技術分野で公知のいずれかの方法を使用して、検出可能となるように標的ポリヌクレオチドを標識することができる。好ましくは、この標識では、RNAの長さに沿って均一に標識を組み込み、より好ましくは、高度に効率よく標識を実施する。この標識の一実施形態では、オリゴdTプライム逆転写を使用して標識を組み込むが、この方法の従来法は、3’末端断片の生成に偏っている。したがって、好ましい実施形態では、ランダムプライマー(例えば、9mer)を逆転写で使用して、標的ポリヌクレオチドの完全長にわたって標識ヌクレオチドを均一に組み込む。あるいは、標的ポリヌクレオチドを増幅するために、PCR法、またはT7プロモーターを基礎とするin vitro転写法と組み合わせて、ランダムプライマーを使用することもできる。
好ましい実施形態では、検出可能な標識は、発光標識である。例えば、蛍光標識、生物発光標識、化学発光標識、および比色標識を本発明で使用することができる。非常に好ましい実施形態では、標識は、フルオレセイン、リン光体、ローダミンや、ポリメチン色素誘導体などの蛍光標識である。市販されている蛍光標識の例としては、例えば、FluorePrime(Amersham Pharmacia、Piscataway、ニュージャージー州)、Fluoredite(Millipore、Bedford、マサチューセッツ州)、FAM(ABI、Foster City、カリフォルニア州)や、Cy3またはCy5(Amersham Pharmacia、Piscataway、ニュージャージー州)などの蛍光ホスホルアミダイトがある。他の実施形態では、検出可能な標識は、放射標識ヌクレオチドである。
さらに好ましい実施形態では、患者試料由来の標的ポリヌクレオチド分子は、標準の標的ポリヌクレオチド分子とは異なる様式で標識する。標準は、正常個体(すなわち、乳癌で苦しんでいないもの)由来の標的ポリヌクレオチド分子を含み得る。非常に好ましい実施形態では、標準は、正常個体由来の試料、または散発型乳房腫瘍を有する個体由来の腫瘍試料からプールした標的ポリヌクレオチド分子を含む。他の実施形態では、標的ポリヌクレオチド分子は、同じ個体に由来するが、異なる時点で得られたものであり、したがって、治療(すなわち、化学療法、放射線療法または凍結療法)の経過の間、およびその後におけるマーカー発現の変化またはその欠如によって治療の有効性が示唆され、予後不良のパターンから予後良好のパターンへのマーカー発現の変化から、その治療が有効であることが示唆される。この実施形態では、異なる時点では異なる様式で標識する。
5.5.2.5 マイクロアレイとのハイブリダイゼーション
標的ポリヌクレオチド分子が、アレイの相補的なポリヌクレオチド配列と、好ましくはその相補的DNAが位置する特定のアレイ部位と特異的に結合または特異的にハイブリダイズするように、核酸のハイブリダイゼーションおよび洗浄の条件を選択する。
その上に位置する二本鎖プローブDNAを含むアレイは、好ましくは変性条件にさらして、標的ポリヌクレオチド分子と接触させる前にDNAを一本鎖にする。一本鎖プローブDNA(例えば、合成オリゴデオキシリボ核酸)を含むアレイは、例えば、自己の相補的配列に起因して形成されるヘアピンまたはダイマー構造を除去するために、標的ポリヌクレオチド分子と接触させる前に変性させることが必要である場合がある。
最適なハイブリダイゼーションの条件は、プローブおよび標的の核酸の長さ(例えば、オリゴマーに対して200塩基より大きいポリヌクレオチド)および型(例えば、RNA、またはDNA)に依存する。当業者ならば、オリゴヌクレオチドが短くなるにつれて、満足なハイブリダイゼーションの結果のため、比較的均一な融解温度にするのにその長さの調節が必要となる可能性があることを理解するであろう。核酸の特異的な(すなわちストリンジェントな)ハイブリダイゼーション条件のための一般的なパラメーターは、Sambrookら, MOLECULAR CLONING - A LABORATORY MANUAL (第2版), Vols. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York (1989)、およびAusubelら, CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, vol. 2, Current Protocols Publishing, New York (1994)中に記載されている。SchenaらのcDNAマイクロアレイの典型的なハイブリダイゼーション条件では、5×SSC+0.2%SDS中で65℃にて4時間ハイブリダイゼーションを行い、その後低ストリンジェンシー洗浄バッファー(1×SSC+0.2%SDS)中で25℃にて洗浄し、その後、高ストリンジェンシー洗浄バッファー(0.1×SSC+0.2%SDS)中で25℃にて10分間処理する(Schenaら, Proc. Natl. Acad. Sci. U.S.A. 93:10614 (1993))。有用なハイブリダイゼーション条件は、例えば、Tijessen, 1993, HYBRIDIZATION WITH NUCLEIC ACID PROBES, Elsevier Science Publishers B .V.;およびKricka, 1992, NONISOTOPIC DNA PROBE TECHNIQUES, Academic Press, San Diego, CAからも得られる。
特に好ましいハイブリダイゼーション条件としては、1M NaCl、50mM MESバッファー(pH6.5)、0.5%サルコシンナトリウムおよび30%ホルムアミド中で、プローブの平均融解温度またはその近傍の温度(例えば、51℃以内、より好ましくは21℃以内)でのハイブリダイゼーションが挙げられる。
5.5.2.6 シグナル検出およびデータ分析
蛍光標識プローブを使用する場合、好ましくは、走査型共焦点レーザー顕微鏡法によりマイクロアレイの各位置での蛍光の発光を検出することができる。一実施形態では、適当な励起用ラインを用いて、使用する2種類の蛍光団それぞれについて別々のスキャンを実施する。あるいは、2種類の蛍光団に特異的な波長で同時に標本を照明することを可能にするレーザーを使用して、2種類の蛍光団からの発光を同時に分析することができる(Shalonら, 1996, "A DNA microarray system for analyzing complex DNA samples using two-color fluorescent probe hybridization," Genome Research 6:639-645を参照、これはすべての目的でその全体が組み入れられる)。好ましい実施形態では、コンピュータ制御X−Yステージおよび顕微鏡用対物レンズを備えたレーザー蛍光スキャナーでアレイをスキャンする。2種類の蛍光団の連続励起を多重ライン、混合ガスレーザーで行い、発した光を波長で分離し、2つの光電子増倍管で検出する。蛍光レーザースキャン装置は、Schenaら, Genome Res. 6:639-645 (1996)、および本明細書で引用した他の参照文献中に記載されている。あるいは、Fergusonら, Nature Biotech. 14:1681-1684 (1996)に記載の光ファイバーバンドルを使用して、mRNA量のレベルを多数の部位で同時にモニターすることもできる。
シグナルを記録し、好ましい実施形態では、コンピュータによって、例えば、12または16ビットのアナログデジタル交換器を使用してそれを分析する。一実施形態では、画像用プログラム(例えば、Hijaak Graphics Suite)を使用してスキャン画像をスペックル除去し、次いで各部位の各波長で平均ハイブリダイゼーションのスプレッドシートを作成する画像格子化プログラムを使用してその画像を分析する。必要ならば、2種類の蛍光団のチャネル間にある「クロストーク」(または重複)について実験的に決定される補正を行うこともできる。転写産物アレイ上の特定のどんなハイブリダイゼーション部位でも、2種類の蛍光団の発光の比率を算出することができる。その比率は、同族遺伝子の絶対的な発現レベルと無関係であるが、異なる乳癌関連状態と関係してその発現が著しく調節される遺伝子に有用である。
5.6 患者サブセットに特異的な治療法
共通する状態を有する個体のサブセットを特定し、その後個体の特定のサブセットについて情報提供性のある遺伝子のセットを特定する利点は、そのような細分および特定によって、その状態の特定の形態に役割を果たすか、または最も密接に関係する遺伝子のサブセットがより正確に特定されるようになることである。例えば、乳癌は、いくつかの異なる分子機構によってもたらされる複雑な状態である。ER+の個体、特にER+、ER/年齢 高値の個体は、細胞周期制御遺伝子の高レベルの発現を示し、これらの遺伝子の発現は、この患者サブセットの予後判定に非常に情報提供性がある(実施例を参照)。しかし、ERの個体では、これらの遺伝子の発現は、予後判定について情報提供性がない。
したがって、情報提供性マーカーのセットを使用して、個体が分類されている状態サブセットに応じて、個体に(例えば乳癌を有する個体に)特定の処方の療法を割り当てることができる。したがって、一実施形態では、本発明は、状態を有する個体に療法の処方を割り当てる方法を提供し、前記方法は、複数の情報提供性遺伝子がその少なくとも1つについて特定されている複数の状態サブセットの1つに個体を分類するステップと、その遺伝子と関係する状態のサブセットの治療に有効であることが知られているか、または有効であると思われる療法の処方を割り当てるステップとを含む。具体的な実施形態では、前記状態は乳癌であり、前記患者サブセットは、ER+、ER/年齢 高値の状態であり、前記の療法の処方は、細胞周期の停止に有効であることが知られている、または有効であると思われる1つまたは複数の化合物の投与を含む。より具体的な実施形態では、前記の1つまたは複数の化合物は、タキソールまたはビンカアルカロイドを含む。
もちろん、上記の表現型および遺伝子発現に基づいて選択されたかまたは割り当てられたいずれの療法の処方も、状態の治療と関連するか、あるいはそれに有効であることが知られているか、または有効であると思われる他の治療、または療法の処方で補うことができる。例えば、乳癌の治療は、遺伝子発現分析によって示唆される以外の外科手術、組織保存治療または根治治療、放射線治療、化学療法、あるいは有効であることが知られているか、または有効であると思われる他のいずれかの療法または治療をさらに含んでもよい。
5.7 臨床試験および疫学的研究
本発明の方法を使用して、臨床試験、疫学的研究などの中でのカテゴリーに個体を割り当てることもできる。例えば、特定のタンパク質(例えば、エストロゲン受容体)や組織構造(例えば、リンパ節)の存在の有無などの状態の特徴に従って、また予後および予後と相関する試験の結果を用いて個体を区別することができる。具体的な例では、その状態は乳癌であり、その特徴はエストロゲン受容体の存在であり、その結果は予後であり、それは最初の診断後所与の期間内で、例えば5年以内で予想される転移の再発の有無である。他の具体的な例では、その状態は肥満であり、その特徴は、24時間のエネルギー消費であり、その予後は、予想される心疾患または糖尿病の発生である。他の具体的な例では、その状態は神経変性疾患であり、その特徴は、特定範囲の濃度の環境毒素への曝露であり、その予後は、予想される運動機能障害の発生または程度である。それぞれの場合で、その特徴および予想される結果を使用して、臨床試験または疫学的研究の中で1つのカテゴリーに個体を割り当てる。
したがって、本発明は、臨床試験における複数のカテゴリーの1つに個体を割り当てる方法を提供し、その方法は、その状態についての少なくとも1つの遺伝子型または表現型の特徴によって区別される複数の状態カテゴリーの1つに個体を分類するステップと、前記個体に由来する試料中で、前記状態カテゴリーについて情報提供性のある複数の遺伝子の発現レベルを決定するステップと、前記複数の遺伝子の前記発現レベルから、個体が予後良好または予後不良であることが示唆されるかどうか判定するステップと、予後判断に基づいて臨床試験における1つのカテゴリーに個体を割り当てるステップとを含む。
具体的な実施形態では、本発明は、乳癌の臨床試験における1つのカテゴリーに個体を割り当てる方法を提供し、前記方法は、(a)前記個体をER、BRCA1;ER、散発性;ER+、ER/年齢 高値;ER+、ER/年齢 低値、LN+;またはER+、ER/年齢 低値、LNに分類するステップと、(b)前記個体について、前記個体がER、BRCA1に分類される場合には表1中に、前記個体がER、散発性に分類される場合には表2中に、前記個体がER+、ER/年齢 高値に分類される場合には表3中に、前記個体がER+、ER/年齢 低値、LN+に分類される場合には表4中に、または前記個体がER+、ER/年齢 低値、LNに分類される場合には表5中にそれに対するマーカーが列挙されている少なくとも2つの遺伝子の発現レベルを決定するステップと、(c)前記個体が予後良好または予後不良と相関する前記の少なくとも2つの遺伝子の発現パターンを有するかどうか判定するステップと、(d)前記個体が予後良好である場合に臨床試験における少なくとも1つのカテゴリーに前記個体を割り当て、前記個体が予後不良である場合に前記臨床試験における第2のカテゴリーに前記個体を割り当てるステップとを含む。より具体的な実施形態では、ステップ(a)で決定した前記個体の分類に基づいて、前記個体を前記臨床試験における1つのカテゴリーにさらに割り当てる。他のより具体的な実施形態では、乳癌の任意の他の臨床上、表現型または遺伝子型の特徴に基づいて、前記個体を前記臨床試験における1つのカテゴリーにさらに割り当てる。他のより具体的な実施形態では、その方法は、前記細胞試料中で、それに対するマーカーが表1〜5中に見られず乳癌の予後判定について情報提供性のある第2の複数の遺伝子の発現レベルを、対照と比較して決定するステップと、前記第1の複数の遺伝子に加えて、前記第2の複数の遺伝子の発現から、前記個体が予後良好であるか予後不良であるかを判定するステップとをさらに含む。
5.8 キット
本発明はさらに、上記のマーカーセットを含むキットを提供する。本発明のキットの構成成分は、好ましくは密封容器中に入っている。好ましい実施形態では、キットは、標的ポリヌクレオチド分子とのハイブリダイゼーション用に準備されているマイクロアレイを含む。具体的な実施形態では、キットは、第5.5.2節で詳細に説明したマイクロアレイのいずれかを含んでもよい。タンパク質が標的分子である場合、キットは、好ましくは、特定の状態に関係するタンパク質との結合用の複数の抗体、およびそのような結合を特定する手段(例えば、サンドイッチアッセイ、ELISA、RIAなどを行う手段)を含む。そのような抗体は、例えば、それぞれ独立に、または抗体アレイの一部として提供することができる。キットはさらに、第5.9節で詳細に説明する、上記のデータ分析用のソフトウェアを含んでもよい。キットは、好ましくは、1つまたは複数の対照試料を含む。そのような対照試料は、マイクロアレイとのハイブリダイゼーションに適したマーカー関連またはマーカー由来ポリヌクレオチドの人工的な集団でよく、そのマーカーは、対象とする状態(例えば、乳癌)に関係または関連する。あるいは、対照は、コンピュータディスクまたは他の記憶媒体に記憶されている発現値のセットでもよい。
本発明のキットは、本来、主として診断用であり得る;すなわちそれは、対象とする状態の特徴(例えば、予後)、治療法に対して予想される応答、毒素曝露など環境状態への曝露の予想される結果などを判定する際に医師または研究者を援助することができる。本発明のキットを用いて個体を分類して、例えば、臨床試験において異なる群に個体を分けることができる。各キットの使用は、含まれるマーカー、マイクロアレイ、対照などによって決まる。
5.9 コンピュータ支援分析
前節で記載した分析法は、下記のコンピュータシステムの使用により、下記のプログラムおよび方法に従って実行することができる。コンピュータシステムは、外部構成部品と連結した内部構成部品を含む。典型的なコンピュータシステムの内部構成部品には、メインメモリと相互接続したプロセッサエレメントがある。例えば、コンピュータシステムは、好ましくは32MB以上のメインメモリを有するIntel8086−、80386−、80486−、Pentium(商標)またはPentium(商標)ベースのプロセッサを基礎とすることができる。コンピュータシステムは、MacintoshまたはMacintoshベースのシステムでもよいが、ミニコンピュータまたはメインフレームでもよい。
外部構成部品は、好ましくは大容量記憶装置を含む。この大容量記憶装置は、1つまたは複数のハードディスク(それらは通常プロセッサおよび記憶装置と同梱されている)でもよい。そのようなハードディスクは、好ましくは1GB以上の記憶容量がある。他の外部構成部品としては、ユーザインターフェース装置が挙げられ、その装置はモニターでもよく、入力装置を有し、その入力装置は「マウス」、もしくは他の図形入力装置、および/またはキーボードでもよい。印刷装置をコンピュータに連結することもできる。
通常、コンピュータシステムは、ネットワークリンクとも連結し、そのリンクは、他のローカルコンピュータシステム、遠隔コンピュータシステム、またはインターネットなどの広域通信ネットワークとのイーサネットリンクの一部でもよい。このネットワークリンクによって、コンピュータシステムが他のコンピュータシステムとデータを共有し、それとともにタスクを処理することが可能となる。
このシステムの作動中に、いくつかのソフトウェア構成部品をメモリにロードするが、そのソフトウェアは、当該技術分野で標準的なものもあり、本発明に特別なものもある。これらのソフトウェア構成部品が全体で、コンピュータシステムが本発明に従って機能するようにする。これらのソフトウェア構成部品は通常、大容量記憶装置に記憶されている。ソフトウェア構成部品はオペレーティングシステムを含み、そのシステムはコンピュータシステムおよびそのネットワークの相互接続を管理する役割を果たす。このオペレーティングシステムは、例えば、Windows3.1、Windows95、Windows98、Windows2000やWindowsNTなどのMicrosoft Windows(登録商標)系のものでもよく、あるいは、MacintoshOS系のものでもよく、あるいはUNIX、LINUXなどのUNIXの派生物、またはミニコンピュータもしくはメインフレームに特異的なオペレーティングシステムでもよい。ソフトウェア構成部品は共通言語を表し、好都合なことにこのシステム上に存在して本発明に特異的な方法を実施するプログラムを支援する機能を果たす。多数の高レベルまたは低レベルのコンピュータ言語を使用して、本発明の分析法のプログラムを作成することができる。実行時間の間またはコンパイルする間に命令を解釈することができる。好ましい言語には、C/C++、FORTRANおよびJAVAがある。最も好ましくは、式の記号入力および高レベルな処理(使用するアルゴリズムの一部または全部を含む)の明確化を可能にし、それによって使用者が個々の式またはアルゴリズムをプログラム作成する必要が手順上なくなる数学ソフトウェアパッケージ中で本発明の方法のプログラムを作成する。そのようなパッケージには、Mathworks(Natick、マサチューセッツ州)のMathlab、Wolfram Research(Champaign、イリノイ州)のMathematica(登録商標)、またはMath Soft(Cambridge、マサチューセッツ州)のS−Plus(登録商標)がある。具体的には、ソフトウェア構成部品は、手順言語、または記号を用いたパッケージ中でプログラム作成された本発明の分析法を含む。
キットに含まれるソフトウェアは、本明細書で開示されている本発明の方法のデータ分析法を含む。具体的には、ソフトウェアは、臨床的なカテゴリー(例えば、予後)とマーカー発現との類似値の算出をはじめとする、マーカー発見用の数学的ルーチンを含んでよい。ソフトウェアはまた、アレイで得られた蛍光データを使用して試料のマーカー発現と対照のマーカー発現との類似性を算出して、試料の臨床的な分類を決定する数学的ルーチンを含んでもよい。
さらに、ソフトウェアはまた、対象とする状態を有する個体について、予後の結果および推奨される治療法を決定する数学的ルーチンを含んでもよい。乳癌の具体例では、数学的ルーチンにより、乳癌を有する個体について予後の結果および推奨される治療法が決定される。そのような乳癌特異的なソフトウェアは、コンピュータシステムのプロセッサにデータ構造を受け取らせる命令を含み、該データ構造としては、乳癌患者から得られた乳癌腫瘍試料中での、表1〜5のいずれかに列挙されている5個以上のマーカー遺伝子の発現レベル;対照またはテンプレート中での同じ遺伝子の発現の平均レベル;ならびに年齢、リンパ節の状態およびER状態をはじめとする、乳癌患者の臨床情報が挙げられる。ソフトウェアはさらに、ハイブリダイゼーションデータを変換する数学的ルーチン、および患者の乳癌腫瘍試料と対照またはテンプレート中でのマーカー遺伝子の発現レベル間の類似性を算出する数学的ルーチンを含んでもよい。具体的な実施形態では、ソフトウェアは、患者の乳癌腫瘍試料と対照またはテンプレート中でのマーカー遺伝子の発現レベル間の類似性を表す、相関係数などの類似性の計量値を算出し、その類似性の計量値として類似性を表現する数学的ルーチンを含む。
ソフトウェアは、好ましくは、患者の臨床データおよびマーカー遺伝子発現データを統合し、ある療法の処方を推奨する決定ルーチンを含む。一実施形態では、例えば、ソフトウェアにより、プロセッサユニットは患者の腫瘍試料中の予後関連遺伝子の発現データを受け取り、テンプレートまたは対照中での同じ遺伝子の値に対するこれらの発現値の類似性の計量値を算出し、この類似性の計量値を、予後の群を区別する予め選択された類似性の計量値の1つまたは複数の閾値と比較し、患者を予後の群に割り当て、予後の群に基づいて、推奨する治療法を割り当てる。具体的な例では、ソフトウェアによって、さらにプロセッサユニットは乳癌患者についての臨床情報を含むデータ構造を受け取る。より具体的な例では、そのような臨床情報は、患者の年齢、エストロゲン受容体の状態、およびリンパ節の状態を含む。
好ましくは、ソフトウェアにより、プロセッサユニットは、対象とする特定の状態および/もしくはその状態を有する個体の相当な表現型および/または遺伝子型の特徴を含むデータ構造を受け取り、その特徴に従って個体を状態サブセットに分類する。次いで、ソフトウェアにより、プロセッサはサブセット特異的マーカーの値を受け取り、個体由来のそのマーカーに関連する値(例えば、レベル、存在量、活性など)の類似性の計量値を対照との比較で算出し、この類似性の計量値を、予後の群を区別する予め選択された類似性の計量値の1つまたは複数の閾値と比較し、患者を予後の群に割り当て、予後の群に基づいて、推奨する治療法を割り当てる。乳癌および乳癌患者の具体例では、一実施形態において、ソフトウェアにより、プロセッサユニットは、患者の年齢、エストロゲン受容体の状態、およびリンパ節の状態をはじめとするデータ構造を受け取り、このデータに基づいて、下記の患者サブセットの1つに患者を分類する:ER、散発性;ER、BRCA1;ER+、ER/年齢 高値;ER+、ER/年齢 低値、LN+;またはER+、ER/年齢 低値、LN。次いで、ソフトウェアにより、プロセッサは患者の腫瘍試料中でのサブセット特異的予後情報提供性遺伝子発現の発現値を受け取り、患者サブセット特異的なテンプレートまたは対照中での同じ遺伝子の値に対するこれらの発現値の類似性の計量値を算出し、この類似性の計量値を、予後の群を区別する予め選択された類似性の計量値の1つまたは複数の閾値と比較し、患者を予後の群に割り当て、予後の群に基づいて、推奨する治療法を割り当てる。
対照が、患者、例えば乳癌患者の群内でのマーカー遺伝子の発現値を含む発現のテンプレートである場合、対照は、患者の個々のハイブリダイゼーションデータと同時に(すなわち同じハイブリダイゼーション実験中で)得られたハイブリダイゼーションデータを含んでもよく、あるいはコンピュータまたはコンピュータで読み取り可能な媒体に記憶させたハイブリダイゼーションまたはマーカー発現値のセットでもよい。後者を使用する場合、初回のまたは経過観察の腫瘍試料、あるいは腫瘍と疑われる試料から得られた、選択されたマーカー遺伝子についての新たな患者ハイブリダイゼーションデータを、さらなる対照ハイブリダイゼーションを必要とせずに、同じ遺伝子についての記憶されている値と比較することができる。しかし、ソフトウェアはさらに、対照データセットを更新して、例えばさらなる乳癌患者からの情報を加え、または対照データセットの既存の構成要素を除去し、その結果、テンプレートを含む平均発現レベルの値を再計算するルーチンを含んでもよい。他の具体的な実施形態では、前記対照は、コンピュータで読み取り可能な媒体に記憶させた、前記の少なくとも5個の前記遺伝子それぞれに関する単一チャネル平均ハイブリダイゼーション強度の値のセットを含む。
乳癌患者、または他の型の状態を有する患者に関係し、本発明のコンピュータプログラム製品により使用される臨床データは、臨床データのデータベース中に包含されていてもよく、そのデータベース中では各患者の情報が別々の記録中に維持され、その記録は、最初の診断の一部として得られた、または治療中の状態(例えば乳癌)の進行を追跡するための発現プロファイルデータをはじめとする、患者、患者の病歴、治療、予後あるいは臨床試験または研究への参加に関連するいかなる情報を含んでいてもよい。
したがって、本発明の一実施形態は、予後に従って乳癌患者を分類するコンピュータプログラム製品を提供し、そのコンピュータプログラム製品は、メモリおよびプロセッサを有するコンピュータとともに使用し、コンピュータプログラム機構が符号化されている、コンピュータで読み取り可能な記憶媒体を含み、前記コンピュータプログラム製品をコンピュータの1つまたは複数のメモリユニットにロードすることができ、前記コンピュータプログラム生成物により、コンピュータの1つまたは複数のプロセッサユニットが、以下のステップを実行する:(a)前記乳癌患者の年齢、ER状態、LN状態および腫瘍の型を含む第1のデータ構造を受け取るステップ、(b)前記患者をER、散発性;ER、BRCA1;ER+、ER/年齢 高値;ER+、ER/年齢 低値、LN+;またはER+、ER/年齢 低値、LNに分類するステップ、(c)前記乳癌患者から得られた細胞試料中で、それに対するマーカーが、前記患者がER、散発性に分類される場合には表1に、前記患者がER、散発性に分類される場合には表2に、前記患者がER+、ER/年齢 高値に分類される場合には表3に、前記患者がER+、ER/年齢 低値、LN+に分類される場合には表4に、または前記患者がER+、ER/年齢 高値、LNに分類される場合には表5に列挙されている少なくとも2つの遺伝子の発現レベルを含む第1のデータ構造を受け取るステップ、(d)前記少なくとも2つの遺伝子の発現レベルの、前記少なくとも2つの遺伝子の対照発現レベルに対する類似性を決定して患者の類似値を得るステップ、(e)前記の患者の類似値を、前記遺伝子の前記発現レベルの、前記対照発現レベルに対する類似値についての選択された第1および第2の閾値とそれぞれ比較して第1および第2の類似性の閾値を得るが、前記第2の類似値の閾値が、前記第1の類似値の閾値より前記対照発現レベルに対しての方が類似性が高いことを示すステップ、ならびに(f)前記の患者の類似値が前記第1および前記第2の類似値の閾値を超える場合には第1の予後に、前記の患者の類似値が前記第1の類似値の閾値を超えるが、前記第2の類似値の閾値を超えない場合には第2の予後に、前記の患者の類似値が前記第1の類似値の閾値または前記第2の類似値の閾値を超えない場合には第3の予後に前記乳癌患者を分類するステップ。前記コンピュータプログラム製品の具体的な実施形態では、前記第1の類似値の閾値および前記第2の類似値の閾値は、前記コンピュータに記憶されている値である。他のより具体的な実施形態では、前記第1の予後とは、「非常に予後良好」であり、前記第2の予後とは、「予後中程度」であり、前記第3の予後とは、「予後不良」であり、前記コンピュータプログラム機構をメモリにロードすることができ、さらに、前記コンピュータプログラム機構により、前記コンピュータの前記1つまたは複数のプロセッサユニットが、患者がリンパ節陰性であり予後良好または予後中程度に分類される場合には補助化学療法を含まない治療法を、あるいは前記患者がリンパ節の状態と発現プロファイルの他のいずれかの組合せを有する場合には化学療法を含む治療法を前記乳癌患者に割り当てるステップを実行する。他の具体的な実施形態では、前記コンピュータプログラム機構をメモリにロードすることができ、さらに、前記コンピュータプログラム機構により、前記のコンピュータの1つまたは複数のプロセッサユニットが、前記乳癌患者に特異的な臨床データを含むデータ構造を受け取るステップを実行する。より具体的な実施形態では、前記単一チャネルハイブリダイゼーション強度の値を対数変換する。しかし、その方法のコンピュータ実装形態は、いかなる望ましい変換方法を使用してもよい。他の具体的な実施形態では、コンピュータプログラム製品により、前記処理ユニットが、前記乳癌患者から得られた前記細胞試料中での前記各遺伝子の発現レベルと前記対照中での同じ遺伝子の発現レベルとの差を算出することによって前記比較ステップ(e)を行う。他の具体的な実施形態では、コンピュータプログラム製品により、前記処理ユニットが、前記対照中での前記各遺伝子の発現の平均対数レベルを算出して各遺伝子の対照平均対数発現レベルを得て、前記乳癌患者由来の乳癌試料中での前記各遺伝子の対数発現レベルを算出して患者対数発現レベルを得て、そして前記各遺伝子の患者対数発現レベルと対照平均対数発現との差を算出することによって前記比較ステップ(e)を行う。他の具体的な実施形態では、コンピュータプログラム製品により、前記処理ユニットが、前記乳癌患者から得られた前記細胞試料中での前記各遺伝子の発現レベルと、前記対照中での同じ各遺伝子の発現レベルとの類似性を算出することによって前記比較ステップ(e)を行い、ここで前記類似性は類似値として表す。より具体的な実施形態では、前記類似値は相関係数である。しかし、類似値は、当該技術分野で公知のいずれかの類似性の計量値で表現されていてもよい。
もちろん、乳癌に特異的な上記の例は限定的なものではない;対象とするいかなる状態についても、類似のコンピュータシステム、ソフトウェア、およびデータ分析法を利用することができる。例えば、類似のソフトウェアを使用して、他の型の任意の癌、あるいは他の癌でないいずれかの疾患または状態の予後を、その癌、癌でない疾患または状態に特異的なマーカー、発現レベルデータ、および対照を用いて判定することができる。
本発明の方法を実施する例示的な実装形態では、最初に使用者は実験データをコンピュータシステム中に入れる。これらのデータは、使用者によってモニター、キーボードから直接、またはネットワーク接続によって連結した他のコンピュータシステムから、またはCD−ROM、フロッピーディスク(図示せず)、テープドライブ(図示せず)、ZIP(登録商標)ドライブ(図示せず)などの取り外し可能な記憶媒体上で、またはネットワークを介して入力することができる。次に、使用者は、本発明の方法を行う発現プロファイル分析ソフトウェアを実行させる。
他の例示的な実装形態では、最初に使用者は実験データおよび/またはデータベースをコンピュータシステム中に入れる。記憶媒体からまたは遠隔コンピュータから、好ましくは動的な遺伝子セットデータベースシステムからネットワークを介して、このデータをメモリに入れる。次に、使用者は、本発明のステップを行うソフトウェアを実行させる。
さらに、本発明のソフトウェアおよびコンピュータシステム製品中で得られ、かつ分析されたデータが極秘のものである可能性があるので、ソフトウェアおよび/またはコンピュータシステムは、パスワード保護や、好ましくは、特にコンピュータ間で、例えばインターネットで情報を伝達する場合、適切な暗号化アルゴリズム(例えば、PGP)によるデータの暗号化などのアクセス制御またはアクセス制御ルーチンを含むことが好ましい。
本発明の分析法を実施するための代替のコンピュータシステムおよびソフトウェアは、当業者には明らかであり、添付した特許請求の範囲内に含まれるものとする。特に、添付した特許請求の範囲は、当業者に容易に明らかとなる本発明の方法を実施するための代替のプログラム構造を含むものとする。
6.実施例
表現型サブセットおよびそれぞれについて情報提供性のある遺伝子セットの特定
材料および方法
腫瘍試料
コホート試料311個を乳癌患者から収集した。散発性の患者(すなわち、BRCA1型の腫瘍を有していると認められなかったもの;n=291)の選択基準は以下のものとした:原発浸潤性乳癌が5cm未満(T1またはT2);腋窩転移なし(N0);診断時の年齢が55歳未満;診断の暦年が1983〜1996年;悪性腫瘍の前歴なし。患者はすべて、改変型根治的乳房切除術または乳房保存的治療によって治療された。van’t Veerら, Nature 415:530 (2002)を参照されたい。遺伝性(すなわちBRCA1型;n=20)腫瘍の選択基準は以下のものとした:BRCA1またはBRCA2の生殖細胞系列突然変異の保因者、および原発浸潤性乳癌。van’t Veer、上掲を参照されたい。さらに、BRCA1群の分類指標の開発では、予め確認されていたBRCA1試料14個(van’t Veer、上掲を参照)をBRCA1型試料20個に加えて試料サイズを拡大した。その試料14個は、ER陰性であり、年齢が55歳未満であるという条件も満たしている。
データ分析
試料の部分集団化:図1中に示すように、ERが優勢な遺伝子発現パターンであるため、腫瘍試料を最初にER+とERの分岐集団に分割した。ERの分岐集団では、BRCA1状態の判定に最適であると以前に認められた発現のテンプレートおよび遺伝子100個を用いて、試料を「BRCA1突然変異様」および「散発性様」のカテゴリーにさらに分割した。van’t Veerら, Nature 415:530 (2002)を参照されたい。ER+カテゴリーでは、年齢に対するERの分布(下記を参照)によって2つの集団「ER/年齢 低値」および「ER/年齢 高値」に試料を分割した。「ER/年齢 低値」群内で、リンパ節の状態に従って試料を2つの部分集団:リンパ節陰性(リンパ節が0;LN−)および陽性(リンパ節が>0;LN+)の群にさらに分割した。
これらの分割の結果、5つの異なる部分集団:「ER、散発性」(n=52)、「ER、BRCA1」(n=34)、「ER+、ER/年齢 高値」(n=83)、「ER+、ER/年齢 低値、LN」(n=81)、および「ER+、ER/年齢 低値、LN+」(n=75)となった。さらに「ER+、ER/年齢 低値、LN+」群の中で年齢に対するERの特定の分布を有する少数の試料を除外して分類指標を開発したが、詳細については下記を参照されたい。
エストロゲン受容体レベル:マイクロアレイ上の60merオリゴヌクレオチドによってエストロゲン受容体遺伝子発現レベルを測定した。個々のあらゆる試料をすべての試料のプールと比較してから、プールに対する比を使用して、相対レベルを測定した。log10(比)で−0.65の閾値を使用して、ER+の群とERの群を分離した。van’t Veerら, Nature 415:530 (2002)を参照されたい。
年齢に対するERの分布による分類:試料は、ER+試料の間で、ERvs年齢の空間において均一に分布していなかった(図2)。まず、ER発現レベルが高い若年個体由来の試料がほとんどなかったので、ERレベルは年齢とともに増大することが明らかであった。例えば、年齢が35〜40歳の群では、ERのlog(比)>0.2の試料は、年齢が40〜45歳の群と比べて比較的少ない。使用した試料のセットでは、40<年齢45の群は、log(比)ER値が−0.2〜0.2である試料を30個、値が0.2を超える試料を28個含み、その一方で、35<年齢40の群は、値が−0.2〜0.2である試料を24個含むが、値が0.2を超える試料を6個しか含まない(フィッシャーの正確確率検定のP値:1%)。年齢とともにERレベルが増大することは、単にエストロゲンレベルが年齢とともに低下し、代償的にエストロゲン受容体レベルが上昇することに起因する可能性がある。
少なくとも2群の患者が存在することも明らかであり、これは図2Aで2群に分ける実線によって示されている。実線によって示される分離の二峰性の検定から、P値<10−4が得られた。この2群はそれぞれ、ERレベルと年齢との間にその固有の傾向を有する。実線は、ER=0.1(年齢−42.5)に近似することができる。実線より大きい値を有する患者を、「ER/年齢 高値」の群と呼び、実線より小さい患者を「ER/年齢 低値」の群と呼ぶ。
各群での予後判定
特徴選択および性能評価:各群での予後判定では、各群の患者で情報提供性のない遺伝子にフィルターをかけてそれを取り除いた。具体的には、3回を超える実験において、
Figure 2007527247
であり、かつ
Figure 2007527247
である遺伝子だけを残した。このステップで、すべての試料にわたって有意な変化がまったくなかったすべての遺伝子を除去した。第2のステップでは、1点除外相互検証(Leave-out-one cross validation)(LOOCV)の手順を使用して、分類指標におけるレポーター遺伝子(特徴)の数を最適化し、各群での分類指標の性能を評価した。特徴選択は、各LOOCVプロセスのループの内部に包含される。各群について分類指標が1つ必要であったので、「訓練用試料」をすべて使用して、「再置換」の結果、最終的な「最適の」レポーター遺伝子を選択した。
訓練用試料の選択:最初の診断から5年以内に転移が起こった患者(「ER、散発性」の試料では3年以内;すなわち「転帰が不良な」群)、または5年の経過観察の期間を超えて転移が起こらなかった患者(すなわち、「転帰が良好な」群)由来の試料だけを訓練用セットとして使用した。転移がなかった患者、または早期に転移が起こった患者間での情報提供性遺伝子の平均発現レベルを予測用の発現のテンプレートとして使用したので、ER+試料の訓練用試料は、初回のLOOCVプロセスによっても正確に分類することができる試料にさらに限定した。「ER、散発性」の試料では、改善が認められなかったので、そのような反復は行わなかった。「ER、BRCA1」の試料では、反復を行ったが、2回目の反復での訓練用試料は、初回のLOOCVから正しく予測された転帰が良好な試料、および5年未満で転移が起こった転帰が不良なすべての試料に限定した。不良な試料が少数であり、そのような限定により改善が認められなかったので、転帰が不良な試料のさらなる限定は行わなかった。初回のLOOCVでは、「ER、散発性」の群を除いて、特徴の数は遺伝子50個に定めた。その個体由来の試料中でのレポーター遺伝子の発現が「平均不良プロファイル」より「平均良好プロファイル」に類似していた場合、患者は転帰が良好である、すなわち最初の診断から5年以内に転移が起こらないと予測し、その試料中でのレポーター遺伝子の発現が「平均良好プロファイル」より「平均不良プロファイル」に類似していた場合、患者は転帰が不良である、すなわち5年以内に転移が起こると患者を予測した。
そのような反復作業を正当とする理由は3つある。第1に、生物学的には、転移がないままである、または転移を起こす特別な理由(大多数とは異なる)を有する少数の個体が常に存在する。第2に、統計的には、ほとんどの患者群は、大部分の試料の分布に従わない外れ値を含む。第3に、方法論的には、その反復作業では、「ブースティング(boosting)」の考え方と非常に類似しているが、誤って予測される試料の重みを増す代わりに、特徴の選択および分類指標の訓練ではうまく挙動する試料に重きを置く。このプロセスを使用して「訓練用試料」を選択し、訓練用試料を定めた後にLOOCV(特徴の選択を含む)を使用して性能を評価したので、本発明者らの手順に関与する過剰適合(over-fitting)の問題はない。したがって、この反復方法は、各群内で転移の優勢な形態を明らかにする可能性が高い。
エラー率およびオッズ比、最終LOOCVでの閾値:特に明記しない限り、エラー率は、2つの集団に由来する平均したエラー率とした:(1)転帰が不良な試料の合計数で割った、転帰が良好な試料と誤って分類された転帰が不良な試料の数;および(2)良好な試料の合計数で割った、転帰が不良な試料と誤って分類された転帰が良好な試料の合計数。所与の閾値について2つのオッズ比を報告した:(1)全体オッズ比および(2)5年オッズ比。5年オッズ比は、5年を超えて転移がなかった個体、および5年以内に転移を経験した個体から算出した。cor1−cor2プロットに閾値を適用し、ここで「cor1」とは、訓練用セットにおける「平均良好プロファイル」との相関を表し、「cor2」とは、訓練用セットにおける「平均不良プロファイル」との相関を表す。
最終回のLOOCVでの閾値は、下記のステップを用いて定義した:(1)訓練用にiを除外したN個の試料それぞれについて、訓練用セットに基づいた特徴を選択した、(2)特徴のセットを与えて、N−1個の試料で不完全なLOOCVを行った(除外した試料が訓練用セットに入っているか否かに応じて「平均不良プロファイル」および「平均良好プロファイル」が変化するのみである)、(3)N−1個の試料の最小エラー率に基づいた閾値を決定し、ステップ(1)での試料iにその閾値を割り当てた、(4)N個すべての試料の中央閾値を得て、それを最終閾値とした。図3〜7では、5群:「ER、散発性」、「ER、BRCA1」、「ER+、ER/年齢 高値」、「ER+、ER/年齢 低値、LN」、「ER+、ER/年齢 低値、LN+」の分類指標についての詳細な情報を示す。表1〜5(第5.3節を参照)では、5つの患者サブセットそれぞれに関する5つの分類指標それぞれについての最終的な最適のレポーター遺伝子を列挙している。下記の表6は、各分類指標で使用した閾値とともに、5つの分類指標それぞれの性能の概要を示すものである。
Figure 2007527247
分類方法:本明細書に記載のすべての分類指標、特徴の選択および最適化は、LOOCVループの内部に包含させた。分類指標の性能は、LOOCVの結果に基づくものとした。各患者から選択された特徴に基づくプロファイルを「平均良好プロファイル」および「平均不良プロファイル」と(相関により)比較して、その予想される転帰を判定した。
相関の算出:ピアソンの相関係数を使用して、各遺伝子の発現のlog(比)と終点データ(最終の転帰)との相関を算出した。各患者のプロファイルと「平均良好プロファイル」および「平均不良プロファイル」との相関は、余弦積とした(平均減算せず)。
結果
55歳より前に診断され、そのすべてが、70遺伝子の予後プロファイルを確立し検証した以前の研究の対象全部である患者311名のマイクロアレイ発現プロファイルに包括的予後判定の戦略を使用した。van 't Veerら, Nature 415:530 (2002); van de Vijverら, N. Engl. J. Med. 347:1999 (2002)を参照されたい。さらに、Natureの研究から既知のBRCA1試料14個を、BRCA1の群の予後分類指標を定義する際に含めた。層別化の全体像を図1に示す。各患者サブセットにおいて、予後分類指標を開発し、1点除外相互検証によりその性能を評価した。各分類指標の生物学的性質も調べた。
特定の臨床パラメーターを次の層別化に使用すべきかどうかを決定する過程の間で、本発明者らの目的は2つあった:(1)均一な予後パターンの特定;および/または(2)サブセット中での予後判定の向上。小さな群であるほどその群内で一様なパターンが誘導される可能性が高いが、予測能力がますます制限されるので、この2つの目的の間には微妙なバランスがある。BRCA1サブセットを除いて、本発明者らの層別化では各群が50個以上の試料を含めた。
層別化の第1の層は、エストロゲン受容体レベルに基づくものとした。階層的クラスター分析で認められるように、エストロゲン受容体発現が、乳癌における全体的な遺伝子発現に対して優勢な影響を有することが以前観察された。van 't Veerら, Nature 415:530 (2002); Perouら, Nature 406:747 (2000); Gruvbergerら, Cancer Res. 61:5979 (2001)を参照されたい。以前の分析では、最大2500個の遺伝子が、腫瘍においてER発現レベルと有意に相関した。van 't Veerら, Nature 415:530 (2002)を参照されたい。以前に定義された閾値によれば(van de Vijverら, N. Engl. J. Med. 347:1999 (2002))、アレイ上のオリゴプローブによって測定されるエストロゲン受容体レベルに従って(登録番号:NM_000125)、試料を最初に2群に分割した;log(比)>−0.65の試料はER+の群に属し、残りはERの群に属する。この結果、239個の試料がER+の群に入り、72個の試料がERの群に入った。
ER+分岐集団では、ER発現レベルを年齢の関数として示すとき、少なくとも2つの部分集団が存在することが明らかであることが観察された(一般に、臨床データではどんな二峰性も有用である)。この二峰性に従って腫瘍を層別した(図2を参照)。ER/年齢比が高いER+患者の群を「ER/年齢 高値」群(試料83個)と称し、残った患者の群を「ER/年齢 低値」群(試料156個)と称した。
「ER/年齢 高値」群内で、その転帰と高度に相関する予後判定レポーター遺伝子の群を特定する(表3を参照)。さらに、これらの遺伝子間で発現の類似性が高いことによって示唆されるように、それらの遺伝子の発現が非常に均一であることが明らかであった。図2Aを参照されたい。レポーター選択を含む1点除外相互検証から、14.6のオッズ比(95%CI:4.7〜45.4)および24.0の5年オッズ比(95%CI:6.0〜95.5)が得られた。このレポーター遺伝子を調べると、その大部分は、転帰が不良な腫瘍で高度に発現する細胞周期遺伝子であることが分かる。この群がLN+およびLN−の個体を含み、様々に治療されていても、遠隔転移の発生は、生物学的に一様な遺伝子セットによって予測され、このことからおそらく、増殖が疾患進行の主な駆動力であると示唆されることは注目すべきである。また、腫瘍の他の部分集団でこれらの遺伝子の変動が観察されても、その設定では、これは一般に転帰と相関しない(下記を参照)。
「ER/年齢 低値」群では、その群全体で予測性のあるパターンは認められなかった;したがって、試料をさらにLN−(試料81個、「ER/年齢 低値、LN」と称する)およびLN+(試料75個、「ER/年齢 高値、LN+」と称する)に層別した。
「ER/年齢 低値、LN」群内で、一様に同時制御され、その転帰と相関する遺伝子の群を特定した。1点除外相互検証(特徴選択を含む)から、21.4のオッズ比(95%CI:6.0〜76.5)および29.2の5年オッズ比(95%CI:6.7〜126.3)が得られた。この群の遺伝子も、個々の生物学的機能について富化される(下記を参照)。
「ER/年齢 低値、LN+」サブセットでは、ERレベルが低い老齢の個体由来の試料をいくつか除外した後で、情報提供性のある遺伝子セット(表4を参照)を得た。図2A中で、点線(ER<0.1(年齢−50)と近似される)の下にあるものとしてこれらの試料を示す。除外後、試料56個が残った。この試料セットによって、予後判定に有用な、非常に均一なパターンを有する遺伝子の群を特定した(全体オッズ比:11.4(2.5〜50.9)、5年オッズ比:15.0(2.6〜87.6))。このことから、ERと年齢が乳癌患者の層別に重要な組合せであることが再度示唆される。この分類指標に含まれるレポーター遺伝子も、リンパ球浸潤の程度の臨床的な尺度と相関した(データは示さず)。この群での予測は他の陽性の群ほど強力ではなく、このことは、原発腫瘍がこの群の患者の転移についてはより弱い情報を有し、転移が、リンパ節中にすでにある腫瘍から出発するかまたはそれに影響を受ける可能性があることを示唆し得る。
ER分岐集団では、試料の一部が「BRCA1様」であるので、試料を「BRCA1様」および「散発性様」に分割することは当然である。分類を行うために、Robertsら, "Diagnosis and Prognosis of Breast Cancer Patients"、国際公開WO02/103320(参照によりその全体が本明細書に組み入れられる)に記載のBRCA1/散発性腫瘍型の分類指標を使用して、ERコホート試料を区別した。ER試料72個のうち52個が「散発性様」であることが分かり、20個が「BRCA1様」であることが分かった。興味深いことに、「散発性様」の群は、erbb2突然変異について富化した(データは示さず)。
「ER、散発性」の群内では、均一な予後パターンは認められなかった;しかし、腫瘍の転帰について高度に予測性である遺伝子20個が特定された(表2を参照)。特徴選択を含む1点除外相互検証から、7.4のオッズ比(95%CI2.2〜25.0)および9.6の5年オッズ比(2.5〜37.6)が得られた。この結果は、ER患者サブセットについては群内での予後判定力がない、以前に特定された70遺伝子の予後分類指標(Robertsら、国際公開WO02/103320; van 't Veerら, Nature 415:530 (2002)を参照)と比較して予後判断が著しく向上したことを表すものである。20個の遺伝子から転帰が予測され、この群中で均一な(かつ明らかな生物学的)パターンが認められないことから、おそらく、この群中では転移の複数の機構があることが示唆される。遺伝子の注釈付けから、含まれる遺伝子が浸潤、エネルギー代謝および他の機能に関与する可能性があることが示唆される。
「ER、BRCA1様」の群では、以前の研究からBRCA1突然変異保因者試料14個を加えて、試料の数を増やした。この追加試料14個は、ER陰性および年齢55歳未満という選択基準も満たしていた。1点除外相互検証プロセスで、最終的な転帰について予測性を有する遺伝子10個が特定された。全体オッズ比は14.7(95%CI:2.3〜92.1)であり、5年オッズ比は24.0(95%CI:2.0〜282.7)である。
均一な遺伝子発現パターンがER分岐集団で認められなかったので、これらの遺伝子の予測能力をさらに検証した。さらなる検証の手段の1つは、様々な分類遺伝子セットを生物学的解釈について再検討し、各分類指標内で腫瘍の起源に関して示唆を与える遺伝子を特定することとした。
「ER+、ER/年齢 高値」群から、G1/S期およびG2/M期の両者を表す細胞周期遺伝子について高度に富化された分類指標が得られた。この群では、既知の細胞周期遺伝子すべてを含めた遺伝子50個のうち46個の過剰発現が疾患の進行と関連していた。このことは、転移潜在性の決定因子である急速な増殖と矛盾しない。この分類指標中の遺伝子4個が、転帰および細胞周期と反相関した。これらの遺伝子の1つはフォリスタチンをコードし、これはアクチビンおよびTGFβファミリーの他のメンバーと結合してそれを阻害するが(Linら, Reproduction 126:133 (2003))、そのファミリーのメンバーは、増殖刺激をはじめとする多数の機能を有する。腫瘍の段階からも、この群での転移潜在性が正確に予測され(全体オッズ比:5.9、95%CI:2.0〜18.0、5年オッズ比:12.5、95%CI:2.6〜59.3)、それはこれらの遺伝子の発現レベルとも相関し、これは増殖速度が疾患の進行の主要な決定因子であることと矛盾しない。この遺伝子セットは、協調的かつ同様に変動する発現が認められるにもかかわらず、他の患者サブセットでの転帰との相関が有意に低かった。例えば、「ER、散発性」群での多数の腫瘍では、細胞周期遺伝子発現が高くFST遺伝子発現が低いが、これらの群でのこれらの遺伝子発現と転帰との相関は最低限であり、このことから、増殖がこの場合の転帰の主要な決定因子でなかったことが示唆される(図8Aおよび8Bを参照)。
ER+、ER/年齢 低値、LNの群から、解糖酵素の遺伝子(56個のうち12個)ならびに低酸素状態および/または血管新生によって誘導される遺伝子(56個のうち14個)の両方を多く含み、5個の遺伝子がどちらの分類にも入っている分類指標が得られた。これらの遺伝子は、転帰の不良と正に相関し、このことから、エネルギー代謝(解糖)、血管新生および低酸素状態への適応が腫瘍のこの部分集団中で極めて重要な経路であることが示唆された。協調的かつ同様に変動する発現が認められるにもかかわらず、これらの遺伝子はいずれも他の患者サブセットの分類指標中には現れず、他の腫瘍中でこれらの遺伝子の予測性の値が非常に低かった(図8Cおよび8Dを参照)。
上記の分析から、特定の周知の機能(増殖、血管新生、エネルギー代謝)が、特定の腫瘍型では重要であり他の型ではそうではないことが示唆され、したがって、これらの機能を標的とする療法が、一部の腫瘍の部分集団では同様に有効であり、他の部分集団ではそうでない可能性が高い。例えば、タキソールやビンカアルカロイドなどの細胞周期進行を標的とする療法は、細胞周期遺伝子の過剰発現がその分類指標中で優勢である場合、ER+、ER/年齢 高値の群で最適に有効である可能性がある。その一方で、細胞周期遺伝子発現の変動が転帰と相関しない腫瘍の部分集団は、タキソールまたはビンカアルカロイドに感受性でない可能性がある。
「包括的予後判定」の手法により、70遺伝子の分類指標と比較した場合の予測エラー率が著しく改善された(表7)。比較を公平にするために、70遺伝子の分類指標から得られた結果の2セットを列挙した。第1のセットは、患者サブセットすべてに同じ閾値(以前に偽陰性率について最適化された閾値)を適用した結果得られ、第2のセットは、各患者サブセットについて最適化された(平均エラー率について最適化された)閾値を使用した結果得られる。包括的な手法により、エラー率が少なくとも6%低くなった。
Figure 2007527247
7.引用した参照文献
本明細書で引用した参照文献はすべて、個々の刊行物または特許もしくは特許出願それぞれがすべての目的でその全体が参照により組み入れられることが具体的にかつそれぞれ独立に示された場合と同程度にすべての目的で(その全体が参照により)本明細書に組み入れられる。
当業者には明らかであるように、その精神および範囲を逸脱せずに、本発明に多数の改変および変更を加えることができる。本明細書に記載した具体的な実施形態は、一例として提供されるものに過ぎず、本発明は、かかる特許請求の範囲に権利が与えられる均等の全範囲に沿って、添付した特許請求の範囲の文言によってのみ限定されるべきである。
情報提供性のある予後関連遺伝子の特定に使用した、5つの患者サブセットが生じた決定樹を描いた図である。 ERレベルと年齢との関係を示す図である。(A)ER+患者の年齢に対するERの散布図である。黒色点は転移のない試料を示し、 ERレベルと年齢との関係を示す図である。(B)ER+試料におけるすべての患者の年齢分布を示す図である。(C)ER+試料におけるすべての患者の、調整した年齢(年齢−10)に対するERの分布を示す図である。(D)転移のある試料の年齢分布を示す図である。(E)転移のある試料の、調整した年齢に対するERの分布を示す図である。 「ER/散発性」の群についての分類指標の性能を示す図である。 「ER+、ER/年齢 高値」の群についての分類指標の性能を示す図である。 「ER+、ER/年齢 低値/LN」の群についての分類指標の性能を示す図である。 「ER+、ER/年齢 低値/LN+」の群についての分類指標の性能を示す図である。 「ER、BRCA1」の群についての分類指標の性能を示す図である。(A)疾患の転帰の予測についての1点除外相互検証(LOOCV)から得られた、分類指標中で使用されるレポーター遺伝子の数の関数としてのエラー率を示す図である。(B)良好な群に対する相関(X軸)と、不良な群に対する相関(Y軸)の間の散布図である。(C)転帰が良好な群に関して算出されたエラー率(良好の合計数で割った、不良と誤って分類された良好な転帰)、もしくは転帰が不良な群に関して算出されたエラー率(不良の合計数で割った、良好と誤って分類された不良な転帰)、または2つの率の平均を示す図である。 患者の部分集団中で重要な生物学的機能を表す遺伝子のヒートマップである。A:細胞周期遺伝子は、ER/年齢 高値の患者における転帰の予測性がある。B:細胞周期遺伝子は、「ER−および散発性」の患者における転帰の予測性がない。 患者の部分集団中で重要な生物学的機能を表す遺伝子のヒートマップである。C:解糖遺伝子は、ER/年齢 低値およびLN−である患者における転帰の予測性がある。D:解糖遺伝子は、「ER−およびBRCA1」の患者における転帰の予測性がない。

Claims (87)

  1. 複数の表現型または遺伝子型の特徴を含む状態について情報提供性のある遺伝子またはマーカーのセットを特定する方法であって、
    (a)前記状態についての1つもしくは複数の表現型または遺伝子型の特徴に基づいて、複数の第1クラスに複数の試料または個体をそれぞれ分類するステップと、
    (b)前記各第1クラス内で、前記状態について情報提供性のある遺伝子またはマーカーの第1セットを特定するステップと
    を含み、前記各第1クラス内での前記の遺伝子またはマーカーの第1セットは、他の第1クラスと比べて前記クラスにユニークなものである、上記方法。
  2. 前記分類ステップ(a)で使用したものと異なる表現型または遺伝子型の特徴に基づいて、前記第1クラスの少なくとも1つの中の前記試料または個体を複数の第2クラスにさらに分類するステップと、前記第2クラスの少なくとも1つの中で、情報提供性のある遺伝子またはマーカーの第2セットを特定するステップとをさらに含み、前記各第2クラス内での前記の情報提供性のある遺伝子またはマーカーの第2セットが、他の第1および第2クラスと比べて前記第2クラスにユニークなものである、請求項1に記載の方法。
  3. 複数の表現型または遺伝子型の特徴を含む状態について情報提供性のある遺伝子またはマーカーのセットを特定する方法であって、
    (a)1つもしくは複数の表現型または遺伝子型の特徴に基づいて、複数の第1クラスに複数の試料または個体をそれぞれ分類するステップと、
    (b)前記分類ステップ(a)で使用したものと異なる表現型または遺伝子型の特徴に基づいて、前記第1クラスの少なくとも1つを複数の第2クラスに分類するステップと、
    (c)前記第1クラスまたは前記第2クラスの少なくとも1つの中で前記状態について情報提供性のある遺伝子またはマーカーのセットを特定するステップと
    を含み、前記の遺伝子またはマーカーの第2セットは、他の第1および第2クラスと比べて前記クラスにユニークなものである、上記方法。
  4. 複数の表現型または遺伝子型の特徴を含む状態について情報提供性のある遺伝子またはマーカーのセットを特定する方法であって、
    (a)前記複数の表現型または遺伝子型の特徴から第1の特徴を選択するステップと、
    (b)前記第1の特徴により区別可能な第1の状態クラスの少なくとも2つを特定するステップと、
    (c)前記第1の状態クラスの少なくとも1つに分類可能な複数の個体を選択するステップと、
    (d)前記複数の個体のそれぞれに由来する試料中で、前記第1の状態クラスの少なくとも1つに入る状態について情報提供性のある遺伝子またはマーカーのセットを特定するステップと
    を含む、上記方法。
  5. ある状態を有する個体を予後良好または予後不良に分類する方法であって、
    (a)前記状態についての1つもしくは複数の表現型、遺伝子型または臨床上の特徴により区別される複数の患者クラスの1つに前記個体を分類するステップと、
    (b)個体から得られた細胞試料中で前記個体が分類される患者クラスの予後判定について情報提供性のある遺伝子またはそのコードタンパク質を含む複数の遺伝子またはそのコードタンパク質の発現レベルを対照と比較して決定するステップと、
    (c)前記発現レベルに基づいて、前記個体を予後良好または予後不良に分類するステップと
    を含む、上記方法。
  6. 前記状態が癌であり、前記の予後良好が、最初の診断から5年以内に転移が起こらないことであり、前記の予後不良が、最初の診断から5年以内に転移が起こることである、請求項5に記載の方法。
  7. 前記対照が、予後不良であると認められた個体に由来する複数の試料にわたる前記複数の遺伝子またはそのコードタンパク質それぞれの発現の平均レベルである、請求項5に記載の方法。
  8. 前記分類ステップ(c)が、前記複数の遺伝子またはそのコードタンパク質それぞれの発現レベルを、前記対照中の対応する遺伝子またはそのコードタンパク質それぞれの発現の前記平均レベルと比較するステップと、前記発現レベルが、前記対照中の前記遺伝子またはそのコードタンパク質それぞれの発現の前記平均レベルと、偶然に予想されるよりも強く相関する場合に前記個体を予後不良に分類するステップとを含む方法によって実施される、請求項7に記載の方法。
  9. 前記対照が、予後良好であると認められた個体に由来する複数の試料にわたる前記複数の遺伝子またはそのコードタンパク質それぞれの発現の平均レベルである、請求項5に記載の方法。
  10. 前記のステップ(c)での分類が、前記複数の遺伝子またはそのコードタンパク質それぞれの発現レベルを、前記対照中の対応する遺伝子またはそのコードタンパク質それぞれの発現の前記平均レベルと比較するステップと、前記発現レベルが、前記対照中の前記遺伝子またはそのコードタンパク質それぞれの発現の前記平均レベルと、偶然に予想されるよりも強く相関する場合に前記個体を予後良好に分類するステップとを含む方法によって実施される、請求項9に記載の方法。
  11. 前記複数の患者クラスが、ER、BRCA1の個体;ER、散発性の個体;ER+、ER/年齢 高値の個体;ER+、ER/年齢 低値、LN+の個体;およびER+、ER/年齢 低値、LNの個体を含む、請求項5に記載の方法。
  12. 乳癌患者を予後良好または予後不良に分類する方法であって、
    (a)前記乳癌患者をER、BRCA1;ER、散発性;ER+、ER/年齢 高値;ER+、ER/年齢 低値、LN+;またはER+、ER/年齢 低値、LNに分類するステップと、
    (b)前記乳癌患者から得られた細胞試料中で、前記乳癌患者がER、BRCA1に分類される場合には表1中のマーカーに、前記乳癌患者がER、散発性に分類される場合には表2中のマーカーに、前記乳癌患者がER+、ER/年齢 高値に分類される場合には表3中のマーカーに、前記乳癌患者がER+、ER/年齢 低値、LN+に分類される場合には表4中のマーカーに、または前記乳癌患者がER+、ER/年齢 低値、LNに分類される場合には表5中のマーカーに対応する遺伝子のうち2つを含む第1の複数の遺伝子の発現レベルを、対照と比較して決定するステップと、
    (c)前記第1の複数の遺伝子の発現レベルに基づいて前記乳癌患者を予後良好または予後不良に分類するステップと
    を含み、前記乳癌患者が、ER遺伝子発現のlog10(比)の年齢に対する比が所定の値を超える場合には「ER/年齢 高値」であり、ER遺伝子発現のlog10(比)の年齢に対する比が前記の所定の値を超えない場合には「ER/年齢 低値」である、上記方法。
  13. 前記対照が、前記乳癌患者がER、BRCA1である場合にはER、BRCA1の個体に由来する複数の試料中における前記複数の遺伝子それぞれの発現の平均レベルであり;前記乳癌患者がER、散発性である場合にはER、散発性の個体に由来する複数の試料中における前記複数の遺伝子それぞれの発現の平均レベルであり;前記乳癌患者がER+、ER/年齢 高値である場合にはER+、ER/年齢 高値の個体に由来する複数の試料中における前記複数の遺伝子それぞれの発現の平均レベルであり;前記乳癌患者がER+、ER/年齢 低値、LN+である場合にはER+、ER/年齢 低値、LN+の個体に由来する複数の試料中における前記複数の遺伝子それぞれの発現の平均レベルであり;または前記乳癌患者がER+、ER/年齢 低値、LNである場合にはER+、ER/年齢 低値、LNの個体に由来する複数の試料中における前記複数の遺伝子それぞれの発現の平均レベルである、請求項12に記載の方法。
  14. 前記個体がそれぞれ予後不良である、請求項13に記載の方法。
  15. 前記個体がそれぞれ予後良好である、請求項13に記載の方法。
  16. 前記分類ステップ(c)が、前記乳癌患者由来の試料中における前記複数の遺伝子またはそのコードタンパク質それぞれの発現レベルを前記対照と比較するステップと、前記発現レベルが、前記対照中の対応する遺伝子またはそのコードタンパク質の発現の前記平均レベルと、偶然に予想されるよりも強く相関する場合に前記乳癌患者を予後不良に分類するステップとを含む方法によって実施される、請求項14に記載の方法。
  17. 前記のERの所定の値が、ER=0.1(年齢−42.5)と算出され、年齢が前記個体の年齢である、請求項12に記載の方法。
  18. 前記個体がER、BRCA1であり、前記複数の遺伝子が、それに対するマーカーが表1中に列挙されている遺伝子を2つ含む、請求項12に記載の方法。
  19. 前記個体がER、BRCA1であり、前記複数の遺伝子が、それに対するマーカーが表1中に列挙されている遺伝子をすべて含む、請求項12に記載の方法。
  20. 前記個体がER、散発性であり、前記複数の遺伝子が、それに対するマーカーが表2中に列挙されている遺伝子を2つ含む、請求項12に記載の方法。
  21. 前記個体がER、散発性であり、前記複数の遺伝子が、それに対するマーカーが表2中に列挙されている遺伝子をすべて含む、請求項12に記載の方法。
  22. 前記個体がER+、ER/年齢 高値であり、前記複数の遺伝子が、それに対するマーカーが表3中に列挙されている遺伝子を2つ含む、請求項12に記載の方法。
  23. 前記個体がER+、ER/年齢 高値であり、前記複数の遺伝子が、それに対するマーカーが表3中に列挙されている遺伝子をすべて含む、請求項12に記載の方法。
  24. 前記個体がER+、ER/年齢 低値、LN+であり、前記複数の遺伝子が、それに対するマーカーが表4中に列挙されている遺伝子を2つ含む、請求項12に記載の方法。
  25. 前記個体がER+、ER/年齢 低値、LN+であり、前記複数の遺伝子が、それに対するマーカーが表4中に列挙されている遺伝子をすべて含む、請求項12に記載の方法。
  26. 前記個体がER+、ER/年齢 低値、LNであり、前記複数の遺伝子が、それに対するマーカーが表4中に列挙されている遺伝子を2つ含む、請求項12に記載の方法。
  27. 前記個体がER+、ER/年齢 低値、LNであり、前記複数の遺伝子が、それに対するマーカーが表4中に列挙されている遺伝子をすべて含む、請求項12に記載の方法。
  28. 前記細胞試料中で、それに対するマーカーが表1〜5中に見られず予後判定について情報提供性のある第2の複数の遺伝子の発現レベルを、対照と比較して決定するステップをさらに含む、請求項12に記載の方法。
  29. 臨床試験における複数のカテゴリーの1つに個体を割り当てる方法であって、
    (a)前記個体をER、BRCA1;ER、散発性;ER+、ER/年齢 高値;ER+、ER/年齢 低値、LN+;またはER+、ER/年齢 低値、LNに分類するステップと、
    (b)前記個体について、前記個体がER、BRCA1に分類される場合には表1中に、前記個体がER、散発性に分類される場合には表2中に、前記個体がER+、ER/年齢 高値に分類される場合には表3中に、前記個体がER+、ER/年齢 低値、LN+に分類される場合には表4中に、または前記個体がER+、ER/年齢 低値、LNに分類される場合には表5中にそれに対するマーカーが列挙されている少なくとも2つの遺伝子の発現レベルを決定するステップと、
    (c)前記個体が前記の少なくとも2つの遺伝子について予後良好または予後不良と相関する発現パターンを有するかどうか判定するステップと、
    (d)前記個体が予後良好である場合に臨床試験における1つのカテゴリーに前記個体を割り当て、前記個体が予後不良である場合に前記臨床試験における第2のカテゴリーに前記個体を割り当てるステップと
    を含む、上記方法。
  30. ステップ(a)で決定した前記個体の分類に基づいて、前記個体を前記臨床試験におけるカテゴリーにさらに割り当てる、請求項29に記載の方法。
  31. 乳癌についての任意の他の臨床上、表現型または遺伝子型の特徴に基づいて、前記個体を前記臨床試験におけるカテゴリーにさらに割り当てる、請求項29に記載の方法。
  32. 前記細胞試料中で、それに対するマーカーが表1〜5中に見られず乳癌の予後判定について情報提供性のある第2の複数の遺伝子の発現レベルを、対照と比較して決定するステップと、前記第1の複数の遺伝子に加えて、前記第2の複数の遺伝子の発現から、前記個体が予後良好であるか予後不良であるかを判定するステップとをさらに含む、請求項29に記載の方法。
  33. ある状態について情報提供性のある遺伝子のセットを特定する方法であって、前記状態が複数の表現型または遺伝子型の特徴を有し、その結果前記の表現型または遺伝子型の特徴の少なくとも1つによって、特徴クラスの少なくとも1つに試料を分類することができ、
    (a)前記状態を有する個体由来の複数の試料を選択するステップと、
    (b)前記複数の試料を使用して前記特徴クラスについて情報提供性のある遺伝子の第1セットを特定するステップと、
    (c)前記複数の試料それぞれの特徴クラスを予測するステップと、
    (d)前記特徴クラスが誤って予測された試料を廃棄するステップと、
    (e)ステップ(c)および(d)を少なくとも1回反復するステップと、
    (f)ステップ(e)後に残存している前記複数の試料中の試料を使用して前記特徴クラスについて情報提供性のある遺伝子の第2セットを特定するステップと
    を含む、上記方法。
  34. 前記癌が乳癌である、請求項6に記載の方法。
  35. 臨床試験における複数のカテゴリーの1つに個体を割り当てる方法であって、
    (a)状態の遺伝子型または表現型の特徴の少なくとも1つによって区別される複数の状態カテゴリーの1つに個体を分類するステップと、
    (b)前記個体に由来する試料中で、前記状態カテゴリーについて情報提供性のある複数の遺伝子の発現レベルを決定するステップと、
    (c)前記複数の遺伝子の前記発現レベルから、個体が予後良好であるか、または予後不良であることが示唆されるかどうか判定するステップと、
    (d)予後判定に基づいて臨床試験における1つのカテゴリーに個体を割り当てるステップと
    を含む、上記方法。
  36. 生物中において、ある状態について情報提供性のある遺伝子またはマーカーの1つまたは複数のセットを特定する方法であって、
    (a)前記生物の1つもしくは複数の臨床上、表現型または遺伝子型の特徴に基づいて、前記状態にある前記生物の複数の個体またはそれに由来する試料を複数のクラスに細分し、その各クラスが、それぞれが前記クラスに特異的な1つもしくは複数の臨床上、表現型または遺伝子型の特徴を有する前記生物の複数の個体またはそれに由来する試料からなるステップと、
    (b)前記複数のクラスの1つまたは複数それぞれに関して、前記クラス中の個体において前記状態について情報提供性のある遺伝子またはマーカーのセットを特定することを試みるステップと
    を含み、前記クラス中の個体において前記状態について情報提供性のある遺伝子またはマーカーのセットが前記複数のクラスの前記1つまたは複数のいずれかに関して得られる場合、前記の遺伝子またはマーカーのセットを、前記生物中において、前記状態について情報提供性のある遺伝子またはマーカーのセットとみなす、上記方法。
  37. 前記クラス中の個体において前記状態について情報提供性のある遺伝子またはマーカーのセットを得ることができない前記クラスの1つまたは複数それぞれに関して、前記クラス中の前記複数の個体またはそれに由来する試料に対して前記ステップ(a)および(b)を反復するステップをさらに含み、その結果、前記クラス中の前記複数の個体またはそれに由来する試料を、前記クラスを定義するのに使用したものと異なる、前記生物の1つもしくは複数の臨床上、表現型または遺伝子型の特徴に基づいて複数のさらなるクラスに細分し、前記複数のさらなるクラスそれぞれに関して、前記クラス中の個体において前記状態について情報提供性のある遺伝子またはマーカーのセットが得られる場合、前記の遺伝子またはマーカーのセットを、前記生物中において、前記状態について情報提供性のある遺伝子またはマーカーのセットとみなす、請求項36に記載の方法。
  38. 生物中において、ある状態について情報提供性のある遺伝子またはマーカーの1つまたは複数のセットを特定する方法であって、
    (a)前記生物の1つもしくは複数の臨床上、表現型または遺伝子型の特徴に基づいて、前記状態にある前記生物の複数の個体またはそれに由来する試料を複数のクラスに細分し、各前記クラスが、それぞれが前記クラスに特異的な前記1つもしくは複数の臨床上、表現型または遺伝子型の特徴を有する前記生物の複数の個体またはそれに由来する試料からなるステップと、
    (b)前記複数のクラスの1つまたは複数それぞれに関して、前記クラス中の個体において前記状態について情報提供性のある遺伝子またはマーカーのセットを特定することを試み、前記クラス中の個体において前記状態について情報提供性のある遺伝子またはマーカーのセットが前記クラスの前記1つまたは複数のいずれかに関して特定される場合、前記の遺伝子またはマーカーのセットを、前記生物中において、ある状態について情報提供性のある遺伝子またはマーカーのセットとみなすステップと、
    (c)前記クラス中の個体において前記状態について情報提供性のある遺伝子またはマーカーのセットを得ることができない前記クラスの1つまたは複数それぞれに関して、前記クラス中の前記複数の個体またはそれに由来する試料に対して前記ステップ(a)および(b)を反復し、その結果、前記クラス中の前記複数の試料または個体を、前記クラスを定義するのに使用したものと異なる、前記生物の1つもしくは複数の臨床上、表現型または遺伝子型の特徴に基づいて複数のさらなるクラスに細分するステップとを含み、前記複数のさらなるクラスの1つまたは複数それぞれに関して、前記クラス中の個体において前記状態について情報提供性のある遺伝子またはマーカーのセットが得られる場合、前記の遺伝子またはマーカーのセットを、前記生物中において、ある状態について情報提供性のある遺伝子またはマーカーのセットとみなす、上記方法。
  39. 前記状態が癌の1つの型であり、前記の遺伝子またはマーカーの各セットが、対応するクラス中における個体の予後の情報提供性を有する、請求項38に記載の方法。
  40. 前記状態が乳癌であり、前記の1つもしくは複数の臨床上、表現型または遺伝子型の特徴が、年齢、ERレベル、ER/年齢、BRAC1状態、およびリンパ節の状態を含む、請求項39に記載の方法。
  41. 選択された予後レベルを有する複数の患者において遺伝子またはマーカーのレベルを表す、前記クラスについての前記セットの遺伝子またはマーカーのレベルの測定値を含むテンプレートプロファイルを作成するステップをさらに含む、請求項39に記載の方法。
  42. 乳癌患者を予後良好または予後不良と予測する方法であって、
    (a)以下のクラス:(a1)ER、BRCA1;(a2)ER、散発性;(a3)ER+、ER/年齢 高値;(a4)ER+、ER/年齢 低値、LN+;または(a5)ER+、ER/年齢 低値、LNの1つに前記乳癌患者を分類するステップと、
    (b)前記乳癌患者から得られた細胞試料中における、(b1)前記乳癌患者がER、BRCA1に分類される場合には表1中のマーカーに、(b2)前記乳癌患者がER、散発性に分類される場合には表2中のマーカーに、(b3)前記乳癌患者がER+、ER/年齢 高値に分類される場合には表3中のマーカーに、(b4)前記乳癌患者がER+、ER/年齢 低値、LN+に分類される場合には表4中のマーカーに、または(b5)前記乳癌患者がER+、ER/年齢 低値、LNに分類される場合には表5中のマーカーに対応する遺伝子またはマーカーを少なくとも2つ含む前記複数の遺伝子またはマーカーの測定値を含むプロファイルを決定するステップと、
    (c)前記複数の遺伝子またはマーカーの前記プロファイルに基づいて前記乳癌患者を予後良好または予後不良に分類するステップと
    を含み、ERは高いERレベルを示し、ERは低いERレベルを示し、前記ER/年齢は、前記患者の年齢に対する前記ERレベルの計量値であり、LNは、前記患者中でリンパ節状態が0より大きいことを示し、LNは、前記患者中でリンパ節状態が0であることを示す、上記方法。
  43. ステップ(c)を、前記プロファイルを予後良好なテンプレートおよび/または予後不良なテンプレートと比較するステップを含む方法によって実施し、前記患者を、そのプロファイルが予後良好なテンプレートと類似性が高いか、または予後不良なテンプレートと類似性が低い場合には予後良好に分類し、あるいはそのプロファイルが予後良好なテンプレートと類似性が低いか、または予後不良なテンプレートと類似性が高い場合には予後不良に分類し、前記の予後良好なテンプレートが、転帰が良好な複数の患者における前記遺伝子またはマーカーのレベルを表す前記複数の遺伝子またはマーカーの測定値を含み、前記の予後不良なテンプレートが、転帰が不良な複数の患者における前記遺伝子またはマーカーのレベルを表す前記複数の遺伝子またはマーカーの測定値を含み、転帰が良好な患者とは、最初の診断後第1の期間内に転移の再発がない乳癌患者であり、転帰が不良な患者とは、最初の診断後第2の期間内に転移の再発がある患者である、請求項42に記載の方法。
  44. 前記プロファイル、前記ERレベル、前記LN状態、および/または前記ER/年齢を決定するステップをさらに含む、請求項43に記載の方法。
  45. 前記プロファイルが、前記患者に由来する試料中における複数の転写産物の測定値を含む発現プロファイルであり、前記の予後良好なテンプレートが、前記の転帰が良好な複数の患者における前記転写産物の発現レベルを表す前記複数の転写産物の測定値を含み、前記の予後不良なテンプレートが、前記の転帰が不良な複数の患者における前記転写産物の発現レベルを表す前記複数の転写産物の測定値を含む、請求項44に記載の方法。
  46. 前記発現プロファイルが、対照試料中における前記複数の転写産物の測定値に対する、前記患者に由来する前記試料中における前記複数の転写産物の差次的な測定値を含む差次的発現プロファイルである、請求項45に記載の方法。
  47. 前記プロファイルが、前記患者に由来する試料中における複数のタンパク質種の測定値を含み、前記の予後良好なテンプレートが、前記の転帰が良好な複数の患者における前記タンパク質種のレベルを表す前記複数のタンパク質種の測定値を含み、前記の予後不良なテンプレートが、前記の転帰が不良な複数の患者における前記タンパク質種のレベルを表す前記複数のタンパク質種の測定値を含む、請求項43に記載の方法。
  48. 前記の予後良好なテンプレート中における前記各転写産物の測定値が、前記の転帰が良好な複数の患者中における前記転写産物の発現レベルの平均である、請求項46に記載の方法。
  49. 前記の予後良好なテンプレートとの前記発現プロファイルの類似性が、前記発現プロファイルと前記の予後良好なテンプレートとの相関係数によって表され、前記相関係数が相関の閾値より大きいと、類似性が高いことが示唆され、前記相関係数が前記相関閾値以下であると、類似性が低いことが示唆される、請求項48に記載の方法。
  50. 前記の予後良好なテンプレートとの前記発現プロファイルの類似性が、細胞成分プロファイルと前記の予後良好なテンプレートとの隔たりによって表され、前記の隔たりが所与の値未満であると、類似性が高いことが示唆され、前記の隔たりが前記の所与の値以上であると、類似性が低いことが示唆される、請求項48に記載の方法。
  51. 前記相関閾値が0.5である、請求項49に記載の方法。
  52. 前記患者中におけるエストロゲン受容体をコードする遺伝子の発現レベルを、前記対照試料中における該遺伝子の発現レベルと比較して測定することによって、前記ERレベルを決定し、前記発現レベルのlog10(比)が−0.65より大きい場合には、前記ERレベルをERに分類し、前記発現レベルのlog10(比)が−0.65以下である場合には、前記ERレベルをERに分類する、請求項51に記載の方法。
  53. 前記エストロゲン受容体をコードする遺伝子が、エストロゲン受容体α遺伝子である、請求項52に記載の方法。
  54. ERレベルがc(年齢−d)より高い場合には前記ER/年齢を高値に分類し、ERレベルがc(年齢−d)以下である場合には前記ER/年齢を低値に分類し、cが係数であり、年齢が前記患者の年齢であり、dが年齢の閾値である、請求項53に記載の方法。
  55. 前記エストロゲン受容体レベルを、登録番号NM_000125の遺伝子に対応する転写産物を検出するポリヌクレオチドプローブによって測定し、前記対照試料が、様々な患者の乳癌細胞のプールであり、c=0.1であり、d=42.5である、請求項54に記載の方法。
  56. 前記対照試料を、複数の乳癌患者に由来する前記複数の転写産物のcDNAを一緒にプールすることによって作製する、請求項55に記載の方法。
  57. 前記対照試料を、前記複数の転写産物および前記エストロゲン受容体をコードする遺伝子の転写産物の合成cDNAを一緒にプールすることによって作製する、請求項55に記載の方法。
  58. 前記個体がER、BRCA1であり、前記複数の遺伝子が、それに対するマーカーが表1中に列挙されている遺伝子を少なくとも2つ含む、請求項42に記載の方法。
  59. 前記個体がER、BRCA1であり、前記複数の遺伝子が、それに対するマーカーが表1中に列挙されている遺伝子をすべて含む、請求項42に記載の方法。
  60. 前記個体がER、散発性であり、前記複数の遺伝子が、それに対するマーカーが表2中に列挙されている遺伝子を少なくとも2つ含む、請求項42に記載の方法。
  61. 前記個体がER、散発性であり、前記複数の遺伝子が、それに対するマーカーが表2中に列挙されている遺伝子をすべて含む、請求項42に記載の方法。
  62. 前記個体がER+、ER/年齢 高値であり、前記複数の遺伝子が、それに対するマーカーが表3中に列挙されている遺伝子を少なくとも2つ含む、請求項42に記載の方法。
  63. 前記個体がER+、ER/年齢 高値であり、前記複数の遺伝子が、それに対するマーカーが表3中に列挙されている遺伝子をすべて含む、請求項42に記載の方法。
  64. 前記個体がER+、ER/年齢 低値、LN+であり、前記複数の遺伝子が、それに対するマーカーが表4中に列挙されている遺伝子を少なくとも2つ含む、請求項42に記載の方法。
  65. 前記個体がER+、ER/年齢 低値、LN+であり、前記複数の遺伝子が、それに対するマーカーが表4中に列挙されている遺伝子をすべて含む、請求項42に記載の方法。
  66. 前記個体がER+、ER/年齢 低値、LNであり、前記複数の遺伝子が、それに対するマーカーが表4中に列挙されている遺伝子を少なくとも2つ含む、請求項42に記載の方法。
  67. 前記個体がER+、ER/年齢 低値、LNであり、前記複数の遺伝子が、それに対するマーカーが表4中に列挙されている遺伝子をすべて含む、請求項42に記載の方法。
  68. 前記プロファイルが、それに対するマーカーが表1〜5中に見られず予後判定について情報提供性のある1つまたは複数の遺伝子をさらに含む、請求項42に記載の方法。
  69. 臨床試験における複数のカテゴリーの1つに個体を割り当てる方法であって、請求項7〜33のいずれか1項に記載の方法によって決定したときに前記個体が予後良好である場合、臨床試験における1つのカテゴリーに前記個体を割り当て、請求項7〜33のいずれか1項に記載の方法によって決定したときに前記個体が予後不良である場合、前記臨床試験における第2のカテゴリーに前記個体を割り当てるステップを含む、上記方法。
  70. ステップ(a)で決定される前記個体の分類に基づいて、前記臨床試験における1つのカテゴリーに前記個体をさらに割り当てる、請求項69に記載の方法。
  71. 乳癌についての1つもしくは複数の他の臨床上、表現型または遺伝子型の特徴に基づいて、前記臨床試験における1つのカテゴリーに前記個体をさらに割り当てる、請求項69に記載の方法。
  72. 前記細胞試料中で、それに対するマーカーが表1〜5中に見られない前記1つまたは複数の遺伝子の発現レベルを決定するステップと、前記1つまたは複数の遺伝子の前記発現レベルから、前記個体が予後良好であるか予後不良であるかを判定するステップとをさらに含む、請求項69に記載の方法。
  73. 表1〜5のいずれか1つに列挙されている異なる遺伝子中の配列に対してそれぞれが相補的かつハイブリダイズ可能な複数のポリヌクレオチドプローブを含むマイクロアレイ。
  74. 表1中に列挙されている異なる遺伝子中の配列に対してそれぞれが相補的かつハイブリダイズ可能な複数のポリヌクレオチドプローブを含むマイクロアレイ。
  75. 前記複数のポリヌクレオチドプローブが、表1中に列挙されている各遺伝子に対して相補的かつハイブリダイズ可能なプローブを含む、請求項74に記載のマイクロアレイ。
  76. 表2中に列挙されている異なる遺伝子中の配列に対してそれぞれが相補的かつハイブリダイズ可能な複数のポリヌクレオチドプローブを含むマイクロアレイ。
  77. 前記複数のポリヌクレオチドプローブが、表2中に列挙されている各遺伝子中の配列に対して相補的かつハイブリダイズ可能なプローブを含む、請求項76に記載のマイクロアレイ。
  78. 表3中に列挙されている異なる遺伝子中の配列に対してそれぞれが相補的かつハイブリダイズ可能な複数のポリヌクレオチドプローブを含むマイクロアレイ。
  79. 前記複数のポリヌクレオチドプローブが、表3中に列挙されている各遺伝子中の配列に対して相補的かつハイブリダイズ可能なプローブを含む、請求項78に記載のマイクロアレイ。
  80. 表4中に列挙されている異なる遺伝子中の配列に対してそれぞれが相補的かつハイブリダイズ可能な複数のポリヌクレオチドプローブを含むマイクロアレイ。
  81. 前記複数のポリヌクレオチドプローブが、表4中に列挙されている各遺伝子中の配列に対して相補的かつハイブリダイズ可能なプローブを含む、請求項80に記載のマイクロアレイ。
  82. 表5中に列挙されている異なる遺伝子中の配列に対してそれぞれが相補的かつハイブリダイズ可能な複数のポリヌクレオチドプローブを含むマイクロアレイ。
  83. 前記複数のポリヌクレオチドプローブが、表5中に列挙されている各遺伝子中の配列に対して相補的かつハイブリダイズ可能なプローブを含む、請求項82に記載のマイクロアレイ。
  84. 前記複数のポリヌクレオチドプローブが、前記マイクロアレイ上のプローブの少なくとも50%を構成する、請求項73〜83のいずれか1項に記載のマイクロアレイ。
  85. 前記複数のポリヌクレオチドプローブが、前記マイクロアレイ上のプローブの少なくとも90%を構成する、請求項73〜83のいずれか1項に記載のマイクロアレイ。
  86. 前記複数のポリヌクレオチドプローブが、表1、表2、表3、表4、または表5中に列挙されている遺伝子の少なくとも75%に対して相補的かつハイブリダイズ可能なプローブを含み、前記複数のポリヌクレオチドプローブが、合計で、前記マイクロアレイ上のプローブの少なくとも50%を構成する、請求項73に記載のマイクロアレイ。
  87. 密封容器中に請求項73〜83のいずれか1項に記載のマイクロアレイを含むキット。
JP2007502116A 2004-03-05 2005-03-07 臨床的基準および情報提供性遺伝子セットの組合せを使用する乳癌患者の分類 Pending JP2007527247A (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US55081004P 2004-03-05 2004-03-05
US60407604P 2004-08-24 2004-08-24
US65040105P 2005-02-04 2005-02-04
PCT/US2005/007894 WO2005086891A2 (en) 2004-03-05 2005-03-07 Classification of breast cancer patients using a combination of clinical criteria and informative genesets

Publications (1)

Publication Number Publication Date
JP2007527247A true JP2007527247A (ja) 2007-09-27

Family

ID=34976216

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007502116A Pending JP2007527247A (ja) 2004-03-05 2005-03-07 臨床的基準および情報提供性遺伝子セットの組合せを使用する乳癌患者の分類

Country Status (5)

Country Link
US (1) US8019552B2 (ja)
EP (1) EP1730308A4 (ja)
JP (1) JP2007527247A (ja)
CA (1) CA2558808A1 (ja)
WO (1) WO2005086891A2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015047101A (ja) * 2013-08-30 2015-03-16 国立大学法人大阪大学 乳癌術前化学療法に対する感受性の診断補助方法および判定装置
JP2015520606A (ja) * 2012-04-09 2015-07-23 フンダシオ プリバーダ インスティトゥト デ レセルカ ビオメディカ がん転移の予後診断および処置のための方法
JP2016073287A (ja) * 2009-04-16 2016-05-12 ナショナル リサーチ カウンシル オブ カナダ 腫瘍特性及びマーカーセットの同定のための方法、腫瘍分類、並びに癌のマーカーセット
JP2016214245A (ja) * 2009-11-23 2016-12-22 ジェノミック ヘルス, インコーポレイテッド 癌の臨床転帰を予測する方法

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7171311B2 (en) 2001-06-18 2007-01-30 Rosetta Inpharmatics Llc Methods of assigning treatment to breast cancer patients
ATE503023T1 (de) 2001-06-18 2011-04-15 Rosetta Inpharmatics Llc Diagnose und prognose von brustkrebspatientinnen
WO2007030611A2 (en) * 2005-09-09 2007-03-15 The Board Of Regents Of The University Of Texas System A calculated index of genomic expression of estrogen receptor (er) and er related genes
FR2891278B1 (fr) * 2005-09-23 2008-07-04 Vigilent Technologies Sarl Procede pour determiner l'etat d'un ensemble de cellules et systeme pour la mise en oeuvre dudit procede
WO2007084992A2 (en) * 2006-01-19 2007-07-26 The University Of Chicago Prognosis and therapy predictive markers and methods of use
CA2677000A1 (en) * 2007-01-30 2008-08-07 Pharmacyclics, Inc. Methods for determining cancer resistance to histone deacetylase inhibitors
JP2010519529A (ja) * 2007-02-23 2010-06-03 プレディクティブ バイオサイエンシーズ コーポレイション 臨床的介入を指向する診断方法
US20080228700A1 (en) 2007-03-16 2008-09-18 Expanse Networks, Inc. Attribute Combination Discovery
WO2009032915A2 (en) * 2007-09-06 2009-03-12 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Arrays, kits and cancer characterization methods
WO2009089517A1 (en) 2008-01-10 2009-07-16 The Neuro-Signaling Foundation Method and system for processing cancer cell electrical signals for medical therapy
US8105777B1 (en) 2008-02-13 2012-01-31 Nederlands Kanker Instituut Methods for diagnosis and/or prognosis of colon cancer
AU2009257948A1 (en) * 2008-04-17 2009-12-17 Neuro-Code Technologies, Llc System and method to elicit apoptosis in malignant tumor cells for medical treatment
US10359425B2 (en) * 2008-09-09 2019-07-23 Somalogic, Inc. Lung cancer biomarkers and uses thereof
US7917438B2 (en) 2008-09-10 2011-03-29 Expanse Networks, Inc. System for secure mobile healthcare selection
US8200509B2 (en) 2008-09-10 2012-06-12 Expanse Networks, Inc. Masked data record access
US20100221752A2 (en) * 2008-10-06 2010-09-02 Somalogic, Inc. Ovarian Cancer Biomarkers and Uses Thereof
US8108406B2 (en) 2008-12-30 2012-01-31 Expanse Networks, Inc. Pangenetic web user behavior prediction system
EP3276526A1 (en) 2008-12-31 2018-01-31 23Andme, Inc. Finding relatives in a database
EP2425021A4 (en) * 2009-05-01 2013-03-06 Nuvera Biosciences Inc INDEX OF GENOMEXPRESSION OF ESTROGEN RECEPTOR (ER) AND ER-ASSOCIATED GENES
AU2010289383B2 (en) * 2009-09-03 2015-04-16 Medimmune, Llc Type 1 interferon diagnostic
US20130116150A1 (en) 2010-07-09 2013-05-09 Somalogic, Inc. Lung Cancer Biomarkers and Uses Thereof
CN106198980B (zh) 2010-08-13 2018-09-07 私募蛋白质体公司 胰腺癌生物标记及其用途
AU2011311452B2 (en) 2010-10-06 2016-09-01 Fundacio Institut De Recerca Biomedica (Irb Barcelona) Method for the diagnosis, prognosis and treatment of breast cancer metastasis
US20120252689A1 (en) 2011-04-01 2012-10-04 Zhong Wu Gene expression signature for wnt/b-catenin signaling pathway and use thereof
US9175351B2 (en) * 2011-07-13 2015-11-03 Agendia N.V. Means and methods for molecular classification of breast cancer
KR101892788B1 (ko) 2011-09-13 2018-08-28 파마싸이클릭스 엘엘씨 벤다무스틴과 조합된 히스톤 디아세틸라제 억제제의 제제 및 그의 용도
TR201819859T4 (tr) 2012-06-06 2019-01-21 Fundacio Inst De Recerca Biomedica Irb Barcelona Akciğer kanseri metastazının tanısı ve prognozu için yöntem.
US9758829B2 (en) 2012-06-22 2017-09-12 Htg Molecular Diagnostics, Inc. Molecular malignancy in melanocytic lesions
US9646135B2 (en) 2013-10-08 2017-05-09 COTA, Inc. Clinical outcome tracking and analysis
US9734291B2 (en) 2013-10-08 2017-08-15 COTA, Inc. CNA-guided care for improving clinical outcomes and decreasing total cost of care
WO2015054156A1 (en) 2013-10-08 2015-04-16 COTA, Inc. Clinical outcome tracking and analysis
US10459561B2 (en) * 2015-07-09 2019-10-29 Qualcomm Incorporated Using capacitance to detect touch pressure
US11154238B2 (en) 2015-08-07 2021-10-26 Electroceuticals, Llc Systems, methods and apparatuses for providing bioelectronic neurocode-based therapies to mammals
EP3901283A1 (en) 2016-05-25 2021-10-27 Inbiomotion S.L. Therapeutic treatment of breast cancer based on c-maf status
US20220044764A1 (en) * 2017-06-28 2022-02-10 Balaji Narayana Reddy Treatment of cancer by risk stratification of patients based on comordidities
AU2018372762A1 (en) 2017-11-22 2020-05-21 Inbiomotion S.L. Therapeutic treatment of breast cancer based on c-maf status
CN117616280A (zh) * 2021-06-23 2024-02-27 阿洛赛尔公司 预测癌症复发

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU724107B2 (en) 1997-01-31 2000-09-14 Fred Hutchinson Cancer Research Center Prognosis of cancer patients by determining expression of cell cycle regulators p27 and cyclin E
US6351712B1 (en) 1998-12-28 2002-02-26 Rosetta Inpharmatics, Inc. Statistical combining of cell expression profiles
US6647341B1 (en) 1999-04-09 2003-11-11 Whitehead Institute For Biomedical Research Methods for classifying samples and ascertaining previously unknown classes
WO2002008261A2 (en) 2000-07-26 2002-01-31 Stanford University Bstp-trans protein and related reagents and methods of use thereof
US6713257B2 (en) 2000-08-25 2004-03-30 Rosetta Inpharmatics Llc Gene discovery using microarrays
US7807447B1 (en) 2000-08-25 2010-10-05 Merck Sharp & Dohme Corp. Compositions and methods for exon profiling
US7171311B2 (en) * 2001-06-18 2007-01-30 Rosetta Inpharmatics Llc Methods of assigning treatment to breast cancer patients
ATE503023T1 (de) * 2001-06-18 2011-04-15 Rosetta Inpharmatics Llc Diagnose und prognose von brustkrebspatientinnen
US20050054826A1 (en) 2003-05-19 2005-03-10 Rosetta Inpharmatics Llc Human diaphanous-3 gene and methods of use therefor
EP1627921B1 (de) * 2004-08-18 2008-08-27 Roche Diagnostics GmbH Verfahren zur Messung einer Nukleinsäureamplifikation in Real Time beinhaltend die Positionierung eines Reaktionsgefässes relativ zu einer Detektionseinheit
JP2008536094A (ja) 2005-02-04 2008-09-04 ロゼッタ インファーマティクス エルエルシー 乳癌患者における化学療法反応性を予測する方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016073287A (ja) * 2009-04-16 2016-05-12 ナショナル リサーチ カウンシル オブ カナダ 腫瘍特性及びマーカーセットの同定のための方法、腫瘍分類、並びに癌のマーカーセット
JP2016214245A (ja) * 2009-11-23 2016-12-22 ジェノミック ヘルス, インコーポレイテッド 癌の臨床転帰を予測する方法
JP2015520606A (ja) * 2012-04-09 2015-07-23 フンダシオ プリバーダ インスティトゥト デ レセルカ ビオメディカ がん転移の予後診断および処置のための方法
JP2018102316A (ja) * 2012-04-09 2018-07-05 フンダシオ インスティトゥト デ レセルカ ビオメディカ(イエレベ バルセロナ) がん転移の予後診断および処置のための方法
JP2022125079A (ja) * 2012-04-09 2022-08-26 フンダシオ インスティトゥト デ レセルカ ビオメディカ(イエレベ バルセロナ) がん転移の予後診断および処置のための方法
JP2015047101A (ja) * 2013-08-30 2015-03-16 国立大学法人大阪大学 乳癌術前化学療法に対する感受性の診断補助方法および判定装置

Also Published As

Publication number Publication date
WO2005086891A3 (en) 2006-03-09
US20080187909A1 (en) 2008-08-07
US8019552B2 (en) 2011-09-13
EP1730308A2 (en) 2006-12-13
WO2005086891A2 (en) 2005-09-22
CA2558808A1 (en) 2005-09-22
EP1730308A4 (en) 2008-10-08
WO2005086891A9 (en) 2006-01-26

Similar Documents

Publication Publication Date Title
JP2007527247A (ja) 臨床的基準および情報提供性遺伝子セットの組合せを使用する乳癌患者の分類
JP7042717B2 (ja) 癌の臨床転帰を予測する方法
JP4619350B2 (ja) 乳癌患者の診断および予後
JP5237076B2 (ja) 乳癌患者の診断および予後
JP6351112B2 (ja) 前立腺癌の予後を定量化するための遺伝子発現プロフィールアルゴリズムおよび試験
EP1782315A2 (en) Prognosis of breast cancer patients
JP2008536094A (ja) 乳癌患者における化学療法反応性を予測する方法
WO2009009662A1 (en) Method of predicting non-response to first line chemotherapy