JP2006519591A - 乳癌患者の診断および予後 - Google Patents

乳癌患者の診断および予後 Download PDF

Info

Publication number
JP2006519591A
JP2006519591A JP2006500977A JP2006500977A JP2006519591A JP 2006519591 A JP2006519591 A JP 2006519591A JP 2006500977 A JP2006500977 A JP 2006500977A JP 2006500977 A JP2006500977 A JP 2006500977A JP 2006519591 A JP2006519591 A JP 2006519591A
Authority
JP
Japan
Prior art keywords
genes
similarity
patient
prognosis
breast cancer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006500977A
Other languages
English (en)
Other versions
JP4619350B2 (ja
Inventor
ヴィア,ローラ,ヨハンナ ファント
ヘ,ユドン
Original Assignee
ロゼッタ インファーマティクス エルエルシー
ザ ネザーランズ キャンサー インスティチュート
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ロゼッタ インファーマティクス エルエルシー, ザ ネザーランズ キャンサー インスティチュート filed Critical ロゼッタ インファーマティクス エルエルシー
Publication of JP2006519591A publication Critical patent/JP2006519591A/ja
Application granted granted Critical
Publication of JP4619350B2 publication Critical patent/JP4619350B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/136Screening for pharmacological compounds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Abstract

本発明は、その発現が乳癌と相関する遺伝子マーカーに関する。特に、本発明により、エストロゲン受容体ESR1およびBRCA1ならびに散発性腫瘍の存在または不在など、乳癌と関連する病態を識別し、初診から5年以内の腫瘍遠隔転移の尤度についての情報を提供するためにその発現パターンを使用できるマーカーセットが提供される。本発明は、これらのマーカーを使用してこうした病態を識別する方法に関する。本発明は予後に基づいて患者を分類し、治療する方法も提供する。また、本発明は、すぐに使用できる型のマイクロアレイを含むキット、および、本明細書に開示する診断、予後、および統計の方法を用いたデータ解析用のコンピュータソフトウェアに関する。

Description

本出願は、その全体で本明細書中に参照として組み込まれる2003年1月15日出願の米国出願第10/342,887号に対する優先権を主張する。
本出願はコンパクトディスクで提出した配列表を含み、これは、2004年1月14日作製、サイズ6,634,308バイトのファイル名9301188228.txtを含む、1枚の複製を含めた2枚のコンパクトディスクに記録されている。コンパクトディスク内の配列表は、その全体で本明細書中に参照として組み込まれる。
1.発明の分野
本発明は、乳癌の診断および予後に有用なマーカー遺伝子の同定に関する。より詳細には、本発明は、乳癌に関連する一セットのマーカー遺伝子、エストロゲン受容体(+)腫瘍対エストロゲン受容体(−)腫瘍中で示差的に発現される一セットのマーカー遺伝子、BRCA1対散発性腫瘍中で示差的に発現される一セットのマーカー遺伝子、および臨床的予後が良好な(すなわち診断から少なくとも5年間の経過観察の間、転移または疾患がない)患者対臨床的予後が不良な(すなわち診断から5年以内に転移または疾患が起こった)患者に由来する散発性腫瘍中で示差的に発現される一セットのマーカー遺伝子の同定に関する。上記マーカーのセットのそれぞれについて、本発明はさらに、乳癌に関連する状態を識別する方法に関する。本発明はさらに、乳癌を有する患者の治療過程を決定する方法を提供する。
2.発明の背景
米国および実際に世界中で報告されている癌の症例数の上昇は重大な懸案事項である。現在では特定の種類の癌に対して利用可能な一握りの治療方法しか存在せず、これらは成功する保証がない。最も有効であるためには、これらの治療には悪性腫瘍の早期検出が必要であるだけでなく、悪性腫瘍の重篤度の信頼性のある評価も必要である。
女性の主要な死亡原因である乳癌の発生率は、米国内において過去30年の間に徐々に上昇してきている。その累積リスクは比較的高く、米国内において8人中1人の女性が85歳までに何らかの種類の乳癌を発生すると予測されている。実際、乳癌は女性における最も一般的な癌であり、米国において2番目に一般的な癌による死亡の原因である。1997年には、米国において181,000件の新しい症例が報告され、44,000人が乳癌により死亡するであろうと推定された(Parker他、CA Cancer J.Clin.、47:5〜27(1997);Chu他、J.Nat.Cancer Inst.、88:1571〜1579(1996))。ほとんどの乳癌の腫瘍化の機構は大部分が不明であるが、一部の女性に乳癌を発生させる素因となる可能性のある遺伝的要因が存在する(Miki他、Science、266:66〜71(1994))。最近になって、BRCA1およびBRCA2の発見および特徴づけにより、家族性乳癌に寄与する可能性がある遺伝的要因に対する我々の知見が拡大した。これら2つの遺伝子座内での生殖系列の突然変異は、乳癌および/または卵巣癌の50〜85%の生涯リスクに関連している(Casey、Curr.Opin.Oncol.、9:88〜93(1997);Marcus他、Cancer、77:697〜709(1996))。乳癌の約5%〜10%のみが、乳癌感受性遺伝子であるBRCA1およびBRCA2に関連している。突然変異したBRCA1を保有する女性の乳癌の累積生涯リスクは約92%であると予測され、一方、大多数である保有しない女性の累積生涯リスクは約10%であると推定される。BRCA1は癌抑制遺伝子であり、ゲノムの安定性維持のために共に重要である、DNAの修復および細胞周期の制御に関与している。これまでに報告されているすべての突然変異の90%超が、異常なまたは消滅した機能を伴う、タンパク質産物の未熟な切断をもたらしている。BRCA1突然変異の保有者の乳癌の組織学は散発性腫瘍の症例の組織学とは異なるが、突然変異の解析が保有者を見つけ出す唯一の方法である。BRCA1と同様、BRCA2は乳癌の発生に関与しており、またBRCA1と同様にDNAの修復に役割を果たす。しかし、BRCA1とは異なり、これは卵巣癌には関与していない。
他の遺伝子、たとえばc−erb−2(HER2)およびp53が乳癌に関連づけられている(Beenken他、Ann.Surg.、233(5):630〜638(2001)。c-erb-2(HER2)およびp53の過剰発現は予後不良と相関関係にあり(Rudolph他、Hum.Pathol.、32(3):311〜319(2001)、mdm2(Lukas他、Cancer Res.、61(7):3212〜3219(2001)ならびにサイクリン1およびp27(1998年8月6日公開のPorter&Roberts、国際公開公報WO98/33450号)の異常な発現産物もそうである。しかし、一貫して乳癌と関連する臨床的に有用なマーカーは他に同定されていない。
既知の生殖系列突然変異に現在関連付けられていない散発性腫瘍が、乳癌の大多数を構成している。他の遺伝的でない要素もこの疾患の病因学に顕著な影響を与えている可能性がある。癌の起源にかかわらず、乳癌はその進行の早期に検出されなければ罹患率および死亡率が顕著に高まる。したがって、乳房組織における細胞形質転換および腫瘍形成の早期検出に相当な努力が集中している。
腫瘍の同定および特徴づけに対するマーカーに基づいた手法により、診断および予後の信頼性の改善が期待される。典型的には、乳癌の診断には腫瘍が存在することの組織病理学的な証拠が必要である。診断に加えて、組織病理学的検査では予後および治療法の選択に関する情報も提供される。予後は、また腫瘍の大きさ、腫瘍進行度、患者の年齢、およびリンパ節転移などの臨床的パラメータに基づいて確立させてもよい。
診断および/または予後は、乳房の外側の直接検査またはマンモグラフィーもしくは他のX線画像化方法によって、様々な程度の有効性で決定し得る(Jatoi、Am.J.Surg.、177:518〜524、(1999))。しかし、後者の手法には無視できない犠牲が伴う。マンモグラムを行う度に、患者は試験中に使用する放射線のイオン化特性によって誘発される乳房腫瘍を生じる危険性を少し被る。さらに、このプロセスは高価であり、技術者の主観的な解釈は不正確さをもたらす可能性がある。たとえば、ある研究では、調査した放射線科医のグループが個別に解釈した一組のマンモグラムの約3分の1で大きな臨床不一致が示された。さらに、多くの女性はマンモグラムを受けることが苦痛の体験であると考えている。したがって、国立癌研究所は50歳未満の女性にはマンモグラムを薦めておらず、これは、このグループはより年配の女性よりも乳癌を発生する可能性が低いからである。しかし、50歳未満の女性で発生する乳癌は約22%でしかないが、データから、乳癌は閉経前の女性でより攻撃的であることが示唆されていることに言及せざるを得ない。
治療の選択肢、予後、および治療応答の可能性はすべて診断次第で広範に変化するので、臨床行為において乳癌の様々な亜型を正確に診断することが重要である。正確な予後、または遠隔転移のない存命の判定により、腫瘍学者が補助化学療法剤の投与を必要通りに行うことが可能となり、予後がより不良である女性に最も積極的な治療が与えられる。さらに、予後不良が正確に予測できると潜在的な研究対象患者を予後に応じて層別化することができるので、新しい乳癌療法の臨床治験に大きな影響が与えられるであろう。これにより、治験を予後不良の患者に制限することができ、したがって実験的治療が有効であるかどうかを識別することがより容易になる。現在までに、臨床情報のみに基づいた予後の満足できる予測判断材料は同定されていない。BRCA1またはBRCA2突然変異の検出は、このような腫瘍の出現をよりよく制御かつ予防する治療の設計への一歩を表す。しかし、最も一般的な乳癌腫瘍の種類である散発性腫瘍を有する患者を診断する均等手段は存在せず、また、乳癌の亜型を区別する手段も存在しない。
アジュバント全身療法は、リンパ節陰性およびリンパ節陽性の乳癌を有する70歳までの閉経前および閉経後の女性のいずれにおいても、疾患のない全体的な生存率を実質的に向上させることが示されている。Early Breast Cancer Trialists’ Collaborative Group、Lancet、352(9132):930〜942(1998);Early Breast Cancer Trialists’ Collaborative Group、Lancet、351(9114):1451〜1467(1998)を参照されたい。アジュバント治療の絶対的な利点は予後特徴が不良である患者においてより大きく、したがって、これらのいわゆる「高リスク」の患者のみを選択して補助化学療法を行うという方針が生じている。Goldhirsch他、Meeting highlights:International Consensus Panel on the Treatment of Primary Breast Cancer、Seventh International Conference on Adjuvant Therapy of Primary Breast Cancer、J.Clin.Oncol.、19(18):3817〜3827(2001);Eifel他、National Institutes of Health Consensus Development Conference Statement:Adjuvant Therapy for Breast Cancer、2000年11月1〜3日、J.Natl.Cancer Inst.、93(13):979〜989(2001)。乳癌における認められた予後および予測要素には、年齢、腫瘍の大きさ、腋窩リンパ節状態、組織学的腫瘍型、病理学的進行度およびホルモン受容体の状態が含まれる。多数の他の要素が疾患の結果を予測するその潜在性について調査されているが、これらは一般に、限られた予測能力しかない。Isaacs他、Semin.Oncol.、28(1):53〜67(2001)。
cDNAマイクロアレイを用いた遺伝子発現プロファイリングを使用して、Perou他は、教師なし(unsupervised)クラスター分析に基づいて乳癌患者のいくつかのサブグループ、すなわち「基底型」の者および「管腔型」者が存在することを示した。Perou他、Nature、406(6797):747〜752(2000)。これらのサブグループは、局所的に進行した乳癌を有する患者における疾患の結果に関して異なる。Sorlie他、Proc.Natl.Acad.Sci.U.S.A.、98(19):10869〜10874(2001)。さらに、診断的分類、たとえば、BRCA1および2(Hedenfalk他、N.Engl.J.Med.、344(8):539〜548(2001);van’t Veer他、Nature、415(6871):530〜536(2002));エストロゲン受容体(Perou、上記;van’t Veer、上記;Gruvberger他、Cancer.Res.、61(16):5979〜5984(2001))ならびにリンパ節状態(West他、Proc.Natl.Acad.Sci.U.S.A.、98(20):11462〜11467(2001);Ahr他、Lancet、359(9301):131〜132(2002))を同定するためにマイクロアレイ分析が使用されている。
3.発明の概要
本発明は、乳癌の様々な種類および亜型を識別する遺伝子マーカーのセット、ならびにその使用方法を提供する。一実施形態では、本発明は、細胞サンプルをER(+)またはER(−)として分類する方法であって、対照と比較した第1の複数の遺伝子の発現の差を検出することを含み、前記第1の複数の遺伝子は表1に記載のマーカーに対応する遺伝子の少なくとも5個からなる方法を提供する。具体的な実施形態では、前記複数の遺伝子は、表1に記載の遺伝子マーカーの少なくとも50、100、200、500、1000、2,460個までからなる。別の具体的な実施形態では、前記複数の遺伝子は、表2に記載の2,460個のマーカーに対応するそれぞれの遺伝子からなる。別の具体的な実施形態では、前記複数の遺伝子は、表2に記載の550個のマーカーからなる。別の具体的な実施形態では、前記対照は、個々の散発性患者の腫瘍のプール由来の核酸を含む。別の具体的な実施形態では、前記検出は、(a)複数の散発性患者内の複数のER(+)患者由来の核酸を個々の散発性患者の腫瘍のプール由来の核酸に対してハイブリダイゼーションさせることによってER(+)テンプレートを作製するステップと;(b)前記複数の散発性患者内の複数のER(−)患者由来の核酸を前記複数の散発性患者内の個々の散発性患者の前記腫瘍のプール由来の核酸に対してハイブリダイゼーションさせることによってER(−)テンプレートを作製するステップと;(c)個々のサンプル由来の核酸を前記プールに対してハイブリダイゼーションさせるステップと;(d)個々のサンプル中のマーカー遺伝子の発現とER(+)テンプレートおよびER(−)テンプレートの発現との類似度を決定するステップであって、前記発現がER(+)テンプレートにより類似している場合はサンプルをER(+)と分類し、前記発現がER(−)テンプレートにより類似している場合はサンプルをER(−)と分類するステップとを含む。
本発明はさらに、BRCA1または散発性であるとするサンプルの分類、および予後良好または予後不良を有するとする患者の分類に適用する上記方法を提供する。BRCA1/散発性遺伝子マーカーについて、本発明は、前記複数の遺伝子が表3に記載のBRCA1/散発性マーカーの少なくとも5、20、50、100、200または300個である前記方法を使用し得ることを提供する。具体的な実施形態では、表4に記載の最適な100個のマーカーを使用する。予後用マーカーについて、本発明は、表5に記載の遺伝子マーカーの少なくとも5、20、50、100、または200個を使用し得ることを提供する。具体的な実施形態では、表6に記載の最適な70個のマーカーを使用する。
本発明はさらに、マーカーを組み合わせ得ることを提供する。したがって、一実施形態では、表1からの少なくとも5個のマーカーを表3からの少なくとも5個のマーカーと共に使用する。別の実施形態では、表5からの少なくとも5個のマーカーを表3からの少なくとも5個のマーカーと共に使用する。別の実施形態では、表1からの少なくとも5個のマーカーを表5からの少なくとも5個のマーカーと共に使用する。別の実施形態では、表1、3、および5のそれぞれから少なくとも5個ずつのマーカーを同時に使用する。
本発明はさらに、サンプル中の表1に記載のマーカーの少なくとも5個の発現と、ER(−)核酸プールおよびER(+)核酸プール中の同じマーカーの発現との類似度を計算することによってサンプルをER(+)またはER(−)として分類する方法であって、(a)サンプル由来の核酸を第1の蛍光体で標識して蛍光体標識した核酸の第1のプールを得るステップと;(b)2つ以上のER(+)サンプル由来の核酸の第1のプール、および2つ以上のER(−)サンプル由来の核酸の第2のプールを第2の蛍光体で標識するステップと;(c)ハイブリダイゼーションが起こり得るような条件下で前記第1の蛍光体標識した核酸および前記第2の蛍光体標識した核酸の第1のプールと前記第1のマイクロアレイとを接触させ、ハイブリダイゼーションが起こり得るような条件下で前記第1の蛍光体標識した核酸および前記第2の蛍光体標識した核酸の第2のプールと前記第2のマイクロアレイとを接触させ、第1のマイクロアレイ上の複数の別個の所在地のそれぞれにおいて、前記第1の蛍光体標識した核酸からの第1の蛍光発光シグナルおよび前記条件下で前記第1のマイクロアレイに結合している前記第2の蛍光体標識した遺伝物質の第1のプールからの第2の蛍光発光シグナルを検出し、前記第2のマイクロアレイ上のマーカーの所在地のそれぞれにおいて、前記第1の蛍光体標識した核酸からの前記第1の蛍光発光シグナルおよび前記第2の蛍光体標識した核酸の第2のプールからの第3の蛍光発光シグナルを検出するステップと;(d)前記第1の蛍光発光シグナルと前記第2の蛍光発光シグナル、および前記第1の発光シグナルと前記第3の蛍光発光シグナルとを比較することによって、ER(−)およびER(+)のプールに対するサンプルの類似度を決定するステップと;(e)第1の蛍光発光シグナルが前記第3の蛍光発光シグナルよりも前記第2の蛍光発光シグナルに類似している場合はサンプルをER(+)と分類し、第1の蛍光発光シグナルが前記第2の蛍光発光シグナルよりも前記第3の蛍光発光シグナルに類似している場合はサンプルをER(−)と分類するステップであって、前記類似度は統計的方法によって定義されることを含む方法を提供する。本発明はさらに、BRCA1を散発性腫瘍から識別するために、または予後不良の患者を予後良好の患者から識別するために、上記方法において他の開示したマーカーのセットを使用し得ることを提供する。
具体的な実施形態では、前記類似度は前記第1の蛍光体標識した核酸と前記第2の蛍光体標識した核酸の第1のプールとの、それぞれのマーカーの発現レベルの差の第1の和、および前記第1の蛍光体標識した核酸と前記第2の蛍光体標識した核酸の第2のプールとの、それぞれのマーカーの発現レベルの差の第2の和を決定することによって計算し、前記第1の和が前記第2の和より大きい場合はサンプルをER(−)と分類し、前記第2の和が前記第1の和より大きい場合はサンプルをER(+)と分類する。別の具体的な実施形態では、前記類似度は、ER(+)テンプレートと前記サンプル中の前記マーカーの発現との第1の分類パラメータP、およびER(−)テンプレートと前記サンプル中の前記マーカーの発現との第2の分類パラメータPを算出することによって計算し、前記PおよびPは以下の式に従って計算する:
Figure 2006519591
[式中、
Figure 2006519591
はそれぞれER(−)およびER(+)テンプレートであり、それぞれ、前記第2の蛍光体標識した核酸の第1のプール中の前記マーカーのそれぞれにおける前記第2の蛍光発光シグナルおよび前記第2の蛍光体標識した核酸の第2のプール中の前記マーカーのそれぞれにおける前記第3の蛍光発光シグナルの平均をとることによって計算し、
Figure 2006519591
は、ER(+)またはER(−)として分類するサンプル中の前記マーカーのそれぞれにおける前記第1の蛍光発光シグナルであり、サンプル中のマーカーの発現は、P<Pである場合はER(+)に類似しており、P>Pである場合はER(−)に類似している]。
本発明はさらに、その発現が特定の表現型に関連するマーカー遺伝子を同定する方法を提供する。一実施形態では、本発明は、その発現が特定の表現型に関連している一セットのマーカー遺伝子を決定する方法であって、(a)2つ以上の表現型の分類を有する表現型を選択するステップと;(b)前記遺伝子の発現が表現型の分類の1つと相関しているまたは逆相関している複数の遺伝子を同定し、それぞれの遺伝子の相関係数を以下の等式に従って計算する:
Figure 2006519591
[式中、
Figure 2006519591
は前記表現型の分類を表わす数であり、
Figure 2006519591
はそれぞれの個々の遺伝子におけるすべてのサンプルにわたる対数的発現率であり、相関係数が閾値以上の絶対値を有する場合は前記遺伝子の前記発現が前記表現型の分類に関連しており、前記複数の遺伝子は、その発現が特定の表現型に関連する一セットのマーカー遺伝子である]
ステップとを含む方法を提供する。閾値は使用するサンプルの数に依存し、閾値は、
Figure 2006519591
[式中、
Figure 2006519591
は分布幅であり、n=サンプル数である]
として計算することができる。n=98である具体的な実施形態では、前記閾値は0.3である。具体的な実施形態では、前記マーカー遺伝子のセットは、以下のように確証する:(a)統計的方法を使用して前記マーカー遺伝子と前記表現型の分類との関連性をランダム化することによって、それぞれのマーカー遺伝子について対照相関係数を作製すること;(b)ステップ(a)を100回以上繰り返してそれぞれのマーカー遺伝子についての前記対照相関係数の頻度分布を得ること;(c)閾値以上の対照相関係数を有するマーカー遺伝子の数を決定することによって、対照マーカー遺伝子のセットを作製すること;および(d)このようにして同定された対照マーカー遺伝子の数を前記マーカー遺伝子の数と比較し、前記マーカー遺伝子の数と対照遺伝子の数とのp値の差が0.01未満の場合は、前記マーカー遺伝子のセットは有効である。別の具体的な実施形態では、前記マーカー遺伝子のセットを、(a)相関の大きさまたは相関係数の有意性によって遺伝子を順位づけすること、および(b)順位リストの上位から任意数のマーカー遺伝子を選択することを含む方法によって最適化する。閾値は試験したサンプルの数に依存する。
本発明はさらに、臨床治験において人を複数の分類の1つに割り当てる方法であって、それぞれの人において表6に記載の予後マーカーの少なくとも5個の発現レベルを決定すること、そこから前記人が予後良好または予後不良と相関する発現パターンを有するかどうかを決定すること、および前記人が予後良好であると決定された場合は前記人を臨床治験において1つの分類に割り当て、その人が予後不良であると決定された場合は異なる分類に割り当てることを含む方法を提供する。本発明はさらに、臨床治験において人を、そのそれぞれが異なる表現型に関連している複数の分類の1つに割り当てる方法であって、それぞれの前記人において一セットのマーカーからの少なくとも5個のマーカーの発現レベルを決定すること(ただし、前記マーカーのセットが前記臨床的分類のそれぞれに関連するマーカーを含む)、そこから前記人が臨床的分類の1つと相関する発現パターンを有するかどうかを決定すること、および前記人が前記分類の1つに関連する表現型を有すると決定された場合は前記人をその分類に割り当てることを含む方法を提供する。
本発明はさらに、第1の細胞または生物を少なくとも2つの異なる表現型の1つを有するとして分類する方法であって、前記少なくとも2つの異なる表現型が第1の表現型および第2の表現型を含み、前記方法が(a)第1の細胞または生物由来の第1のサンプル中の複数の遺伝子のそれぞれの発現レベルと、それぞれ複数の細胞または生物由来のプールしたサンプル中の前記遺伝子のそれぞれの発現レベルとを比較し(前記複数の細胞または生物は前記少なくとも2つの異なる表現型を示す異なる細胞または生物をそれぞれ含む)、第1の比較値を生じること;(b)前記第1の比較値と第2の比較値とを比較することであり、前記第2の比較値は、前記第1の表現型を有すると特徴づけられた細胞または生物由来のサンプル中の前記遺伝子のそれぞれの発現レベルと、それぞれ前記プールしたサンプル中の各前記遺伝子の発現レベルとを比較することを含む方法の結果である;(c)前記第1の比較値と第3の比較値とを比較することであり、前記第3の比較値は、前記第2の表現型を有すると特徴づけられた細胞または生物由来のサンプル中の前記遺伝子のそれぞれの発現レベルと、それぞれ前記プールしたサンプル中の各前記遺伝子の発現レベルとを比較することを含む方法の結果である、(d)前記第1の比較値と1つまたは複数の追加の比較値とをそれぞれ比較するステップを任意選択で1回または複数回実施することであり、それぞれの追加の比較値は、前記第1および第2の表現型とは異なる表現型を有すると特徴づけられているが前記少なくとも2つの異なる表現型に含まれる細胞または生物由来のサンプル中の前記遺伝子のそれぞれの発現レベルと、それぞれ前記プールしたサンプル中の各前記遺伝子の発現レベルとを比較することを含む方法の結果である;ならびに(e)前記第1の比較値が前記第2、第3、および存在する場合は1つまたは複数の追加の比較値のいずれに最も類似するかを決定することであって、前記第1の細胞または生物が、前記第1の比較値に最も類似する前記比較値を生じるために使用した細胞または生物の表現型を有すると決定されること、を含む方法を提供する。
上記方法の具体的な実施形態では、前記比較値はそれぞれ、前記遺伝子のそれぞれの発現レベルの割合である。別の具体的な実施形態では、前記プールしたサンプル中の各前記遺伝子の前記発現レベルのそれぞれは、前記比較ステップのいずれよりも前に正規化する。別の具体的な実施形態では、前記発現レベルの正規化は、前記発現レベルのそれぞれを前記遺伝子のそれぞれの発現レベルの中央値または平均値で割り算するか、または前記プールしたサンプル中の1つまたは複数のハウスキーピング遺伝子の発現レベルの平均値または中央値で割ることによって行う。より具体的な実施形態では、前記正規化した発現レベルを対数変換し、前記比較ステップは、前記対数変換した数値を前記細胞または生物由来の前記サンプル中の各前記遺伝子の前記発現レベルの対数から引き算することを含む。別の具体的な実施形態では、前記少なくとも2つの異なる表現型は、1つの疾患または障害の異なる段階である。別の具体的な実施形態では、前記少なくとも2つの異なる表現型は、1つの疾患または障害の異なる予後を有する。さらに別の具体的な実施形態では、それぞれ前記プールしたサンプル中の各前記遺伝子の前記発現レベル、またはそれぞれ前記第1の表現型、前記第2の表現型、もしくは前記第1および第2の表現型とは異なる前記表現型を有すると特徴づけられた前記細胞もしくは生物由来のサンプル中の各前記遺伝子の前記発現レベルを、コンピュータに記憶させる。
本発明はさらに、開示したマーカーのセットを含むマイクロアレイを提供する。一実施形態では、本発明は、表1〜6のいずれか1つからの少なくとも5個のマーカーを含む、すなわちマイクロアレイ上のプローブの少なくとも50%が表1〜6のいずれか1つ中に存在するマイクロアレイを提供する。より具体的な実施形態では、前記マイクロアレイ上のプローブの少なくとも60%、70%、80%、90%、95%または98%が表1〜6のいずれか1つ中に存在する。
別の実施形態では、本発明は、ER(+)およびER(−)細胞サンプルを識別するためのマイクロアレイであって、支持体に結合したポリヌクレオチドプローブの位置がアドレス可能なアレイを含み、前記ポリヌクレオチドプローブが異なるヌクレオチド配列の複数のポリヌクレオチドプローブを含み、前記異なるヌクレオチド配列のそれぞれが複数の遺伝子に相補的かつハイブリダイゼーション可能な配列を含み、前記複数の遺伝子が表1または表2に記載のマーカーに対応する遺伝子の少なくとも5個からなり、マイクロアレイ上のプローブの少なくとも50%が表1または表2のいずれか1つ中に存在するマイクロアレイを提供する。さらに別の実施形態では、本発明は、BRCA1型および散発性腫瘍型の細胞サンプルを識別するためのマイクロアレイであって、支持体に結合したポリヌクレオチドプローブの位置がアドレス可能なアレイを含み、前記ポリヌクレオチドプローブが異なるヌクレオチド配列の複数のポリヌクレオチドプローブを含み、前記異なるヌクレオチド配列のそれぞれが複数の遺伝子に相補的かつハイブリダイゼーション可能な配列を含み、前記複数の遺伝子が表3または表4に記載のマーカーに対応する遺伝子の少なくとも5個からなり、マイクロアレイ上のプローブの少なくとも50%が表3または表4のいずれか1つ中に存在するマイクロアレイを提供する。さらに別の実施形態では、本発明は、予後良好の患者由来の細胞サンプルおよび予後不良の患者由来の細胞サンプルを識別するためのマイクロアレイであって、支持体に結合したポリヌクレオチドプローブの位置がアドレス可能なアレイを含み、前記ポリヌクレオチドプローブが異なるヌクレオチド配列の複数のポリヌクレオチドプローブを含み、前記異なるヌクレオチド配列のそれぞれが複数の遺伝子に相補的かつハイブリダイゼーション可能な配列を含み、前記複数の遺伝子が表5または表6に記載のマーカーに対応する遺伝子の少なくとも5個からなり、マイクロアレイ上のプローブの少なくとも50%が表5または表6のいずれか1つ中に存在するマイクロアレイを提供する。本発明はさらに、表1に記載のER状態マーカー遺伝子の少なくとも5、20、50、100、200、500、100、1,250、1,500、1,750、もしくは2,000個、表3に記載のBRCA1散発性マーカー遺伝子の少なくとも5、20、50、100、200、もしくは300個、または表5に記載の予後用マーカー遺伝子の少なくとも5、20、50、100もしくは200個を任意の組合せで含み、前記マイクロアレイ上のプローブの少なくとも50%、60%、70%、80%、90%、95%もしくは98%が表1、表3および/または表5中に存在するマイクロアレイを提供する。
本発明はさらに、サンプルのER状態を決定するためのキットであって、それぞれが表1に記載のマーカーを少なくとも5個含む少なくとも2つのマイクロアレイ、ならびにサンプル中の表1に記載のマーカー由来の核酸のレベルとER(−)プールおよびER(+)プール中の表1に記載のマーカー由来の核酸のレベルとの類似度を決定するためのコンピュータシステムを含み、前記コンピュータシステムは、プロセッサと、1つまたは複数のプログラムをコード化している、プロセッサに連結したメモリとを含み、前記1つまたは複数のプログラムは、プロセッサに、サンプルとER(−)プールとのそれぞれのマーカーの発現の差異総量、およびサンプルとER(+)プールとのそれぞれのマーカーの発現の差異総量を計算することを含む方法、またはサンプル中のマーカーの発現とER(−)およびER(+)のプール中の発現との相関を決定することを含む方法を行わせ、前記相関は等式(4)に従って計算することを含むキットを提供する。本発明は、適切なマーカー遺伝子のセットを含めることによってBRCA1と散発性腫瘍、ならびに予後良好の患者からのサンプルと予後不良の患者からのサンプルとを識別することができるキットを提供する。本発明はさらに、サンプルが予後良好の患者由来かまたは予後不良の患者由来であるかを決定するためのキットであって、表5に記載のマーカーに対応する遺伝子の少なくとも5個に対するプローブを含む少なくとも1つのマイクロアレイ、ならびにサンプル中の表5に記載のマーカー由来の核酸のレベルの、予後良好の個体由来のサンプルのプールおよび予後良好の個体のサンプルのプール中の、表5に記載のマーカー由来の核酸のレベルに対する類似度を決定するための1つまたは複数のプログラムが記録されたコンピュータで読取り可能な媒体を含み、1つまたは複数のプログラムは、サンプルと予後良好のプールとのそれぞれのマーカーの発現の差異総量、およびサンプルと予後不良のプールとのそれぞれのマーカーの発現の差異総量を計算することを含む方法、またはサンプル中のマーカーの発現と予後良好および予後不良のプール中の発現との相関を決定することを含む方法をコンピュータに行わせ、前記相関は等式(3)に従って計算することを含むキットを提供する。
本発明はさらに、予後に従って乳癌患者を分類するための方法であって、(a)前記乳癌患者から採取した細胞サンプル中のそのマーカーが表5に記載されている少なくとも5個の遺伝子のそれぞれの発現レベルと、前記少なくとも5個の遺伝子のそれぞれの対照発現レベルとを比較すること;および(b)前記細胞サンプル中の前記発現レベルと前記対照レベルとの類似度に基づいて、前記乳癌患者をその乳癌の予後に従って分類することを含む方法を提供する。本方法の具体的な実施形態では、ステップ(b)は、前記類似度が1つまたは複数の事前に決定した類似度の閾値を超えているかどうかを決定することを含む。本方法の別のより具体的な実施形態では、前記対照レベルとは、初診から5年以内に遠隔転移が起こらなかった複数の乳癌患者から得た腫瘍サンプルのプール中の、前記少なくとも5個の遺伝子のそれぞれの平均発現レベルである。本方法の別の具体的な実施形態では、前記対照レベルは、初診から5年以内に遠隔転移が起こらなかった乳癌患者中の前記遺伝子の発現レベルを含む。本方法の別の具体的な実施形態では、前記対照レベルは、前記少なくとも5個の遺伝子のそれぞれについて、コンピュータに記憶されている平均対数強度値を含む。本方法の別の具体的な実施形態では、前記対照レベルは、前記少なくとも5個の遺伝子のそれぞれについて、表7に記載の平均対数強度値を含む。本方法の別の具体的な実施形態では、前記比較ステップ(a)は、前記細胞サンプル中のそのマーカーが表5に記載されている前記遺伝子の少なくとも10個のそれぞれの発現レベルと、前記遺伝子の前記少なくとも10個の前記それぞれの対照レベルとを比較することを含み、前記少なくとも10個の遺伝子の前記対照発現レベルは、初診から5年以内に遠隔転移が起こらなかった乳癌患者から得た腫瘍サンプルのプール中の前記少なくとも10個の遺伝子のそれぞれ平均発現レベルである。本方法の別の具体的な実施形態では、前記比較ステップ(a)は、前記細胞サンプル中のそのマーカーが表5に記載されている前記遺伝子の少なくとも25個のそれぞれの発現レベルと、前記少なくとも25個の遺伝子の前記それぞれの対照発現レベルとを比較することを含み、前記少なくとも25個の遺伝子の前記対照発現レベルは、初診から5年以内に遠隔転移が起こらなかった乳癌患者から得た腫瘍サンプルのプール中の前記少なくとも25個の遺伝子のそれぞれの平均発現レベルである。本方法の別の具体的な実施形態では、前記比較ステップ(a)は、前記細胞サンプル中のそのマーカーが表6に記載されている前記遺伝子のそれぞれの発現レベルと、そのマーカーが表6に記載されている前記遺伝子のそれぞれの前記それぞれの対照発現レベルとを比較することを含み、そのマーカーが表6に記載されている前記遺伝子のそれぞれの前記対照発現レベルは、初診から5年以内に遠隔転移が起こらなかった乳癌患者から得た腫瘍サンプルのプール中の前記遺伝子のそれぞれの平均発現レベルである。
本発明はさらに、予後に従って乳癌患者を分類するための方法であって、(a)前記乳癌患者から採取した細胞サンプル中のそのマーカーが表5に記載されている少なくとも5個の遺伝子のそれぞれの発現レベルと、それぞれの前記少なくとも5個の遺伝子の対照発現レベルとの類似度を決定して患者の類似度値を得ること;(b)前記少なくとも5個の遺伝子のそれぞれの前記発現レベルと前記対照発現レベルとの類似度の選択した第1および第2の閾値を与えることによって、それぞれ第1および第2の類似度の閾値を得て、前記第2の類似度の閾値は前記第1の類似度の閾値よりも前記対照に対して高い類似度を示すこと;ならびに(c)前記患者の類似度値が前記第1および前記第2の類似度の閾値を超える場合は前記乳癌患者が第1の予後を有すると分類し、前記遺伝子の前記発現レベルが前記第1の類似度の閾値を超えるが前記第2の類似度の閾値を超えない場合は第2の予後を有すると分類し、前記遺伝子の前記発現レベルが前記第1の類似度の閾値も前記第2の類似度の閾値も超えない場合は第3の予後を有すると分類することを含む方法を提供する。本方法の具体的な実施形態は、ステップ(a)の前に、前記少なくとも5個の遺伝子の前記発現レベルを決定することを含む。本方法の別の具体的な実施形態では、ステップ(a)における前記決定は、前記乳癌患者から採取したサンプル中の前記少なくとも5個の遺伝子のそれぞれの発現レベルと、初診から5年以内に乳癌が再発しなかった複数の乳癌患者中の前記少なくとも5個の遺伝子のそれぞれの発現レベルとの類似度の程度を決定することを含む方法によって実施する。本方法の別の具体的な実施形態では、ステップ(a)における前記決定は、前記少なくとも5個の遺伝子のそれぞれの絶対発現レベルと、初診から5年以内に乳癌が再発しなかった複数の乳癌患者から得た腫瘍サンプルのプール中の前記少なくとも5個の遺伝子のそれぞれの平均発現レベルとの差を決定することを含む方法によって実施する。本方法の別の具体的な実施形態では、前記第1の閾値および前記第2の閾値は、初診から5年以内に乳癌が再発しなかった複数の乳癌患者から得た腫瘍サンプルのプール中の前記少なくとも5個の遺伝子のそれぞれの平均発現レベルの相関係数である。本方法のより具体的な実施形態では、前記第1の類似度値の閾値および前記第2の類似度値の閾値は、(a)各前記腫瘍サンプル中の前記少なくとも5個の遺伝子のそれぞれの発現レベルと、前記プールを構成する残りの腫瘍サンプルの前記少なくとも5個の遺伝子の平均発現レベルとの類似度の程度によって前記腫瘍サンプルのプールを構成する前記腫瘍サンプルを降順に順位づけて、順位リストを得ることであり、前記類似度の程度は類似度値として表される;(b)前記分類ステップにおいて許容される偽陰性の数を決定することであり、偽陰性は、細胞サンプル中の前記少なくとも5個の遺伝子の発現レベルにより初診から最初の5年以内に遠隔転移を起こさないと予測されたが、初診から最初の5年以内に遠隔転移を起こした乳癌患者である;(c)前記順位リストにおいて前記許容される腫瘍サンプルの数よりも少ない腫瘍サンプルが偽陰性となる値よりも高い類似度値を決定すること;(d)ステップ(c)で決定した前記類似度値を前記第1の類似度値の閾値として選択すること;および(e)前記第1の類似度値よりも大きい第2の類似度値を前記第2の類似度値の閾値として選択することを含む方法によって選択される。本方法のさらにより具体的な実施形態では、前記第2の類似度値の閾値は、前記順位リスト中の、初診から最初の5年以内に遠隔転移が起こった前記乳癌患者から採取した前記腫瘍サンプルのどれが最大の類似度値を有するかを決定すること、および前記最大の類似度値を前記第2の類似度値の閾値として選択することを含む方法によってステップ(e)で選択される。本方法の別のさらにより具体的な実施形態では、前記第1および第2の類似度値の閾値は相関係数であり、前記第1の類似度値の閾値は0.4であり、前記第2の類似度値の閾値は0.4より高い。本方法の別のさらにより具体的な実施形態では、前記第1および第2の類似度値の閾値は相関係数であり、前記第2の類似度値の閾値は0.636である。
本発明はさらに、予後に従って乳癌患者を分類する方法であって、(a)ハイブリダイゼーションが起こり得るような条件下で前記乳癌患者から採取した腫瘍サンプル由来の第1の核酸および初診から5年以内に遠隔転移が起こらなかった乳癌患者の2つ以上の腫瘍サンプル由来の第2の核酸とアレイとを接触させ、前記アレイは、固体支持体に結合したポリヌクレオチドプローブの位置がアドレス可能な規則正しく配列されたアレイを含み、前記ポリヌクレオチドプローブは、そのそれぞれのマーカーが表5に記載されている遺伝子または前記遺伝子にコードされているRNAの少なくとも5個に対して相補的かつハイブリダイゼーション可能であり、前記アレイ上のプローブの少なくとも50%が、そのそれぞれのマーカーが表5に記載されている遺伝子または前記遺伝子にコードされているRNAにハイブリダイゼーション可能であるステップと;(b)前記アレイ上の複数の別個の所在地のそれぞれにおいて、前記第1の核酸からの第1の蛍光発光シグナルおよび前記条件下で前記アレイに結合している前記第2の核酸からの第2の蛍光発光シグナルを検出するステップと;(c)そのそれぞれのマーカーが表5に記載されている前記少なくとも5個の遺伝子にわたる前記第1の蛍光発光シグナルと前記第2の蛍光発光シグナルとの類似度を計算するステップと;(d)そのそれぞれのマーカーが表5に記載されている前記少なくとも5個の遺伝子にわたる前記第1の蛍光発光シグナルと前記第2の蛍光発光シグナルとの類似度に基づいて、前記乳癌患者をその乳癌の予後に従って分類するステップとを含む方法を提供する。
本発明はさらに、乳癌患者に治療法を指定する方法を提供する。一実施形態では、本発明は、乳癌患者に治療法を指定する方法であって、(a)そのマーカーが表5に記載されている少なくとも5個の遺伝子の発現レベルに基づいて、前記患者を「予後不良」、「予後中等度」、または「予後優良」であると分類すること;ならびに(b)前記患者に治療法を指定すること(すなわち、前記治療法は、(i)患者がリンパ節陰性であり、かつ予後良好もしくは予後中等度であると分類された場合は補助化学療法を含まない、または(ii)リンパ節状態および発現プロファイルの任意の他の組合せを有する場合は化学療法を含む)を含む方法を提供する。
本発明はまた、乳癌患者に治療法を指定する方法であって、(a)前記患者のリンパ節状態を決定すること;(b)前記患者からの細胞サンプル中の、そのマーカーが表5に記載されている少なくとも5個の遺伝子の発現レベルを決定することによって発現プロファイルを作製すること;(c)前記発現プロファイルに基づいて前記患者を「予後不良」、「予後中等度」、または「予後優良」であると分類すること;および(d)前記患者に治療法を指定すること(すなわち、前記治療法は、患者がリンパ節陰性であり、かつ予後良好もしくは予後中等度であると分類された場合は補助化学療法を含まず、または前記患者がリンパ節状態および分類の任意の他の組合せを有する場合は化学療法を含む)を含む方法を提供する。本方法の具体的な実施形態では、「予後中等度」であると分類されたリンパ節陰性患者に指定した前記治療法は、さらに補助ホルモン療法を含む。本方法の別の具体的な実施形態では、前記分類ステップ(c)は、(a)各前記腫瘍サンプル中の前記少なくとも5個の遺伝子の発現レベルと前記プールを構成する残りの腫瘍サンプル全体の前記少なくとも5個の遺伝子の発現レベルとの類似度の程度によって乳癌腫瘍サンプルのプールを構成する複数の乳癌腫瘍サンプルを降順に順位づけすることであり、前記類似度の程度は類似度値として表される;(b)前記分類ステップにおいて許容される偽陰性の数を決定することであり、偽陰性は、細胞サンプル中の前記少なくとも5個の遺伝子の発現レベルにより初診から最初の5年以内に遠隔転移を起こさないと予測されたが、初診から最初の5年以内に遠隔転移を起こした乳癌患者である;(c)前記順位リストにおいて前記許容される腫瘍サンプルの数以下の腫瘍サンプルが偽陰性となる値よりも高い類似度値を決定すること;(d)ステップ(c)で決定した前記類似度値を第1の類似度値の閾値として選択すること;(e)前記第1の類似度値よりも高い第2の類似度値を第2の類似度値の閾値として選択すること;および(f)乳癌患者からの乳癌腫瘍サンプル中の前記少なくとも5個の遺伝子のそれぞれの発現レベルと前記プール中の前記それぞれの少なくとも5個の遺伝子のそれぞれの発現レベルとの類似度を決定して患者の類似度値を得ることであり、前記患者の類似度値が前記第2の類似度値の閾値に等しいまたはそれを超える場合は、前記患者は「予後優良」であると分類され;前記患者の類似度値が前記第1の類似度値の閾値に等しいまたはそれを超えるが、前記第2の類似度値の閾値未満である場合は、前記患者は「予後中等度」であると分類され;前記患者の類似度値が前記第1の類似度値の閾値未満である場合は、前記患者は「予後不良」であると分類されることを含む方法によって実施する。本方法の別の具体的な実施形態は前記患者のエストロゲン受容体(ER)の状態を決定することを含み、前記患者がER陽性かつリンパ節陰性である場合は、前記患者に指定した前記治療法はさらに補助ホルモン療法を含む。本方法の別の具体的な実施形態では、前記患者は52歳以下である。本方法の別の具体的な実施形態では、前記患者は第I期または第II期の乳癌を有する。本方法のさらに別の具体的な実施形態では、前記患者は閉経前である。
上記方法はコンピュータを用いて実施し得る。したがって、別の実施形態では、本発明は、予後に従って乳癌患者を分類するためのコンピュータプログラム製品であって、コンピュータプログラム製品はメモリおよびプロセッサを備えたコンピュータと共に使用するためのものであり、コンピュータプログラムをコード化した、コンピュータで読取り可能なストレージ媒体を含み、前記コンピュータプログラム製品はコンピュータの1つまたは複数のメモリユニット中にロードでき、コンピュータの1つまたは複数のプロセッサユニットに以下のステップ、すなわち(a)前記患者から採取した細胞サンプル中の、そのマーカーが表5に記載されている少なくとも5個の遺伝子のそれぞれの発現レベルを含む第1のデータ構造を受信するステップと;(b)前記少なくとも5個の遺伝子のそれぞれの発現レベルと前記少なくとも5個の遺伝子のそれぞれの対照発現レベルとの類似度を決定して患者の類似度値を得るステップと;(c)前記少なくとも5個の遺伝子のそれぞれの前記それぞれの発現レベルの選択した第1および第2の類似度の閾値に対する前記患者の類似度値と前記少なくとも5個の遺伝子の前記それぞれの対照発現レベルとを比較するステップであって、前記第2の類似度の閾値が、前記少なくとも5個の遺伝子の前記それぞれの対照発現レベルに対して前記第1の類似度の閾値よりも高い類似度を示すステップと;(d)前記患者の類似度値が前記第1および前記第2の類似度値の閾値を超える場合は前記患者が第1の予後を有すると分類し;前記患者の類似度値が前記第1の類似度値の閾値を超えるが前記第2の類似度値の閾値を超えない場合は第2の予後を有すると分類し;前記患者の類似度値が前記第1の類似度値の閾値も前記第2の類似度値の閾値も超えない場合は第3の予後を有すると分類するステップとを実行させるコンピュータプログラム製品を提供する。コンピュータプログラム製品の具体的な実施形態では、前記第1の類似度の閾値および前記第2の類似度の閾値は前記コンピュータに記憶される値である。コンピュータプログラム製品の別の具体的な実施形態では、前記少なくとも5個の遺伝子の前記それぞれの対照発現レベルは前記コンピュータに記憶される。コンピュータプログラム製品の別の具体的な実施形態では、前記第1の予後は「予後優良」であり、前記第2の予後は「予後中等度」であり、前記第3の予後は「予後不良」であり、前記コンピュータプログラムをメモリ中にロードでき、患者がリンパ節陰性であり、かつ予後良好もしくは予後中等度であると分類された場合は補助化学療法を含まず、またはリンパ節状態および発現プロファイルの任意の他の組合せを有する場合は化学療法を含む治療法を前記乳癌患者に指定するステップを前記コンピュータの前記1つまたは複数のプロセッサユニットにさらに実行させる。より具体的な実施形態では、前記臨床データは前記乳癌患者のリンパ節およびエストロゲン受容体(ER)の状態を含む。さらに別の具体的な実施形態では、前記コンピュータプログラムをメモリ中にロードでき、前記乳癌患者に特異的な臨床データを含むデータ構造を受信するステップを前記コンピュータの1つまたは複数のプロセッサユニットにさらに実行させる。別の具体的な実施形態では、前記少なくとも5個の遺伝子の前記それぞれの対照発現レベルは、前記少なくとも5個の遺伝子のそれぞれについての、一セットの単チャンネルハイブリダイゼーション平均強度値を含み、これは前記コンピュータで読取り可能なストレージ媒体に記憶される。このコンピュータプログラム製品のより具体的な実施形態では、前記単チャンネルハイブリダイゼーション平均強度値は対数変換される。コンピュータプログラム製品の別の具体的な実施形態では、前記コンピュータプログラム製品は、前記乳癌患者から採取した前記細胞サンプル中の前記少なくとも5個の遺伝子のそれぞれの発現レベルと前記少なくとも5個の遺伝子の前記それぞれの対照発現レベルとの差を計算することによって前記比較ステップ(c)を前記処理ユニットに行わせる。コンピュータプログラム製品の別の具体的な実施形態では、前記コンピュータプログラム製品は、前記対照中の前記少なくとも5個の遺伝子のそれぞれの発現レベルの平均対数を計算してそれぞれの遺伝子について対照平均対数発現レベルを得て、前記患者からの乳癌サンプル中の前記少なくとも5個の遺伝子のそれぞれの対数発現レベルを計算して患者の対数発現レベルを得て、また患者の対数発現レベルと前記少なくとも5個の遺伝子のそれぞれの対照平均対数発現レベルとの差を計算することによって、前記比較ステップ(c)を前記処理ユニットに行わせる。コンピュータプログラム製品の別の具体的な実施形態では、前記コンピュータプログラム製品は、前記患者から採取した前記細胞サンプル中の前記少なくとも5個の遺伝子のそれぞれの発現レベルと前記少なくとも5個の遺伝子の前記それぞれの対照発現レベルとの類似度を計算することによって、前記比較ステップ(c)を前記処理ユニットに行わせ、前記類似度は類似度値として表される。このコンピュータプログラム製品のより具体的な実施形態では、前記類似度値は相関係数である。
5.発明の詳細な説明
5.1 序論
本発明は、発現パターンが、乳癌腫瘍の重要な特徴、すなわち、エストロゲン受容体(ER)の状態、BRCA1の状態、および再発(すなわち、遠隔転移または予後不良)の尤度と相関する遺伝子マーカーのセットに関する。より詳細には、本発明により、次の3つの病態を識別できる遺伝子マーカーのセットが提供される。第1に、本発明は、発現が患者のER状態と相関し、ER(+)患者をER(−)患者から識別するために使用できるマーカーセットに関する。ER状態は、有用な予後因子であり、患者がタモキシフェンなどの特定の治療法に応答する尤度の標識である。また、ER陽性である女性のうち、ホルモン療法に対する応答率(50%を上回る)は、ER状態が陰性の患者における応答率(10%低い)よりもずっと高い。ER陽性の腫瘍をもつ患者では、ホルモン応答を達成する確率は、レベルERに直接に比例する(P. CalabresiおよびP. S. Schein, MEDICAL ONCOLOGY (2ND ED.), McGraw-Hill, Inc., New York (1993))。第2に、本発明は、さらに、発現がBRCA1突然変異の存在と相関し、BRCA1タイプの腫瘍を散発性腫瘍から識別するのに使用できるマーカーセットに関する。第3に、本発明は、発現が臨床予後と相関し、予後良好(すなわち、5年以内の腫瘍の遠隔転移がない)の患者を予後不良(すなわち、5年以内の腫瘍の遠隔転移)から識別するのに使用できる遺伝子マーカーに関する。こうした患者群の間で識別を行い、治療の一般的方針を決めるためにこれらのマーカーを使用する方法が提供される。また、これらのマーカーを含むマイクロアレイ、ならびにそのようなマイクロアレイを構築する方法が提供される。各マーカーは、ヒトゲノム中の1個の遺伝子に対応する。すなわち、そのようなマーカーは、1個の遺伝子の全体または一部分として同定可能である。最後に、上記マーカーのそれぞれは、特定の乳癌に関連する病態と相関するため、マーカー、またはそれらがコードするタンパク質は、乳癌に対する薬物についての標的であることが見込まれる。
5.2 定義
本明細書で使用する「BRCA1腫瘍」とは、BRCA1遺伝子座の突然変異を含む細胞を有する腫瘍を意味する。
相関の式の「大きさの絶対値」とは、正でも負でも、値0からの距離を意味する。すなわち、相関係数−0.35と0.35は、どちらも、大きさの絶対値は0.35である。
「状態」とは、その発現が特定の表現型と強い相関を示す1セットの遺伝子マーカーの遺伝子発現状態を意味する。例えば、「ER状態」とは、その発現がESR1(エストロゲン受容体遺伝子)の発現と強い相関を示す1セットの遺伝子マーカーの遺伝子発現状態を意味し、これらの遺伝子の発現パターンは、受容体を発現する腫瘍と受容体を発現しない腫瘍との間で異なることが検出できる。
「予後良好」とは、ある患者が、乳癌の初診から5年以内に、乳癌の遠隔転移がないものと予期されることを意味する。
「予後不良」とは、ある患者が、乳癌の初診から5年以内に、乳癌の遠隔転移があるものと予期されることを意味する。
「マーカー」とは、発現またはレベルが特定の条件の間で変わる、遺伝子全体、またはその遺伝子由来のESTを意味する。遺伝子の発現がある特定の条件と相関する場合、その遺伝子はその条件に対するマーカーである。
「マーカー由来のポリヌクレオチド」とは、あるマーカー遺伝子から転写したRNA、これから産生した任意のcDNAまたはcRNA、および、これに由来する、マーカー遺伝子に対応する遺伝子に由来する配列をもつ合成核酸などの任意の核酸を意味する。
「類似度値」とは、比較している2つの事柄の間の類似の程度を表す数である。たとえば、類似度値は、特定の表現型関連のマーカーを用いたある患者の発現プロファイルと、その表現型に特異的な対照との間の全体的な類似度を示す数とすることができる(たとえば、表現型が予後良好である場合の、「予後良好」テンプレートに対する類似度)。類似度値は、相関係数などの類似度尺度として表現することもでき、または、単に、患者サンプルとテンプレートとの間の、発現レベル差、または発現レベル差の総量として表現することもできる。
5.3 乳癌の診断および予後において有用なマーカー
5.3.1 マーカーセット
本発明では、発現がクラスター化解析によって乳癌の存在と相関させられる4986個の遺伝子マーカーのセットを提供する。これらのマーカーのうちの、診断または予後に有用なものとして同定したサブセットを、配列番号:1−2699として列挙してある。また、本発明では、これらのマーカーを使用して、腫瘍のタイプの識別を診断または予後において行う方法を提供する。
一実施形態では、本発明は、乳癌患者の分類をエストロゲン受容体(ER)の状態によって行うことができる、すなわち、ER(+)とER(−)の患者またはこれらの患者由来の腫瘍の間の識別を行うことができる2460個の遺伝子マーカーからなるセットを提供する。ER状態は、ある患者の何らかの化学療法(すなわち、タモキシフェン)に対する応答の尤度の重要な標識である。これらのマーカーを表1に示す。また、本発明では、2460個のマーカーからなるセットから抜き出され、これもER(+)およびER(−)の患者または腫瘍の識別を行う、少なくとも5、10、25、50、100、200、300、400、500、750、1000、1250、1500、1750、または2000個の遺伝子マーカーからなるサブセットを提供する。好ましくは、マーカーの数は550個である。本発明では、さらに、ER状態の識別に最適である2460個のマーカーのうち550個からなるセットを提供する(表2)。また、本発明では、これらのマーカーを使用して、ER(+)とER(−)の患者またはこれら患者由来の腫瘍の間の識別を行う方法を提供する。
別の実施形態では、本発明は、ER(−)乳癌患者の分類をBRCA1の状態によって行うことができる、すなわち、BRCA1突然変異を含む腫瘍と散発性腫瘍との間の識別を行うことのできる430個の遺伝子マーカーからなるセットを提供する。本発明では、さらに、430個のマーカーからなるセットから抜き出し、これもBRCA1突然変異を含む腫瘍と散発性腫瘍との間の識別を行う、少なくとも5、10、20、30、40、50、75、100、150、200、250、300、または350個のマーカーからなるサブセットを提供する。好ましくは、マーカーの数は100個である。100個のマーカーからなる好ましいセットを表4に与えている。また、本発明では、これらのマーカーを使用して、BRCA1と散発性な患者またはこれ由来の腫瘍の間の識別を行う方法を提供する。
別の実施形態では、本発明は、乳癌の予後の良好である患者(5年以内の乳癌腫瘍遠隔転移がない)と、乳癌の予後の不良である患者(5年以内の腫瘍遠隔転移)との間の識別を行える231個の遺伝子マーカーからなるセットを提供する。これらのマーカーを表5に列挙してある。また、本発明では、231個からなるセットから抜き出し、これも予後が良好と不良の患者の間の識別を行う、少なくとも5、10、20、30、40、50、75、100、150、または200個のマーカーからなるサブセットを提供する。70個のマーカーからなる好ましいセットを表6に与えている。具体的な実施形態では、このマーカーのセットは、ここに列挙した12個のキナーゼ関連のマーカーおよび7個の細胞分裂または有糸分裂に関連のマーカーからなる。また、本発明では、上記マーカーを使用して、予後の良好または不良である患者の間の識別を行う方法を提供する。別の実施形態では、本発明は、予後関連マーカーを使用して、予後優良、予後中等度、予後不良である患者の間の識別を行い、これにより、補助療法またはホルモン療法の適切な組み合わせを決定する方法を提供する。
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
Figure 2006519591
表1〜6に列挙したマーカーのセットは、部分的に重複している。言い換えると、マーカーによって、複数のセットに現れるものと、あるセットに特有なものがある(図1)。したがって、一実施形態では、本発明は、ER(+)とER(−)との間の、またBRCA1腫瘍と散発性腫瘍との間の識別を行う(すなわち、ある腫瘍をER(−)またはER(−)およびBRCA1関連または散発性として分類する)ことのできる256個の遺伝子マーカーからなるセットを提供する。より具体的な実施形態では、本発明は、ある腫瘍をER(−)またはER(−)およびBRCA1関連または散発性として分類できる、256個のマーカーからなるセットのうちの少なくとも20個、少なくとも50個、少なくとも100個、または少なくとも150個からなるサブセットを提供する。別の実施形態では、本発明は、ER(+)とER(−)との間の、また予後が良好対不良の患者の間の識別を行う(すなわち、ある腫瘍をER(−)またはER(+)として、および予後良好または予後不良の患者から取り出したものとして分類する)ことのできる165個のマーカーを提供する。より具体的な実施形態では、本発明は、さらに、またある腫瘍をER(−)またはER(+)として、および予後良好または予後不良の患者から取り出したものとして分類する、165個のマーカーからなる完全なセットのうちの少なくとも20、50、100、または125個からなるサブセットを提供する。本発明では、さらに、BRCA1腫瘍と散発性腫瘍との間の、および予後が良好対不良の患者の間の識別を行うことのできる12個のマーカーからなるセットを提供する。最後に、本発明では、3つの状態すべてを識別する能力のある11個のマーカーを提供する。逆に、本発明では、2460個のER状態マーカーのうち、ER状態だけを決定できる2050個と、430個のBRCA1対散発性マーカーのうち、BRCA1対散発性の状態だけを決定できる173個と、231個の予後マーカーのうち、予後だけを決定できる165個とを提供する。より具体的な実施形態では、本発明は、また、ER状態だけを決定できる2050個のER状態マーカーのうち、少なくとも20、50、100、200、500、1000、1500、または2000個からなるサブセットを提供する。また、本発明は、またBRCA1対散発性の状態だけを決定できる173個のマーカーのうち、少なくとも20、50、100、または150個からなるサブセットを提供する。本発明は、さらに、また予後の状態だけを決定できる65個の予後マーカーのうち、少なくとも20、30、40、または50個からなるサブセットを提供する。
上で提供したマーカーのセットのどれも、特異的に単独で、またはそのセット以外のマーカーと組み合わせて使用することができる。たとえば、ER状態を識別するマーカーは、BRCA1対散発性マーカーと、または予後マーカーと、あるいはそのいずれもと、組み合わせて使用することができる。また、上で提供したマーカーのセットのどれも、乳癌に関する、あるいは、他のどのような臨床的または生理学的な条件に関するマーカーとも組み合わせて使用することができる。
マーカーセット間の関係を、図1に図示している。
5.3.2 マーカーの同定
本発明では、乳癌に付随する病態または徴候の同定のためのマーカーのセットを提供する。一般に、マーカーのセットの同定は、約25000個のヒトのマーカーのうちで、どれがその病態または徴候と相関する発現パターンを有したかを決定することによって行った。
一実施形態では、マーカーのセットを同定するための方法は、次のようである。標的ポリヌクレオチドの抽出および標識化の後、サンプルX中の全マーカー(遺伝子)の発現を標準または対照中の全マーカーの発現と比較する。一実施形態では、この標準または対照は、健常な個人(すなわち、乳癌にかかっていない個人)からのサンプル由来の標的ポリヌクレオチド分子を含んでいる。好ましい一実施形態では、この標準または対照は、標的ポリヌクレオチド分子のプールである。このプールは、何人もの健常な個人からの集めたサンプルに由来するものとすることができる。好ましい一実施形態では、このプールは、散発性タイプの腫瘍をもつ何人もの個人から採取したサンプルを含んでいる。別の好ましい実施形態では、このプールは、腫瘍サンプルに由来するマーカー由来の核酸のプール中に見られる各マーカー由来の核酸のレベルを近似するように設計された核酸の人工的に生成した集団を含んでいる。また別の好ましい実施形態では、このプールのは、正常なまたは乳癌の細胞系または細胞系サンプルに由来する。
この比較は、当技術分野に知られているどのような手段によっても達成することができる。たとえば、様々なマーカーの発現レベルの評価は、マーカー由来の標的ポリヌクレオチド分子(たとえば、RNAまたはcDNA)のアガロースまたはポリアクリルアミドのゲル中での分離、およびそれに続くマーカー特異的オリゴヌクレオチドプローブとのハイブリダイゼーションによって行うことができる。あるいは、この比較は、標的ポリヌクレオチド分子の標識化およびそれに続く配列決定用ゲル上での分離によって達成することもできる。ポリヌクレオチドのサンプルは、ゲル上に、患者と対照または標準のポリヌクレオチドが隣接するレーンにあるように置く。発現レベルの比較は、視認によって、または密度計によって達成される。好ましい一実施形態では、全マーカーの発現の評価を、マイクロアレイへのハイブリダイゼーションによって同時に行う。それぞれの手法で、特定の基準を満たすマーカーを、乳癌と関連ありと特定する。
マーカーの選択は、サンプル中での発現を、標準または対照の条件と比較した際の有意差に基づいて行われる。選択は、患者サンプル中でのマーカーの有意なアップレギュレーションまたはダウンレギュレーションに基づいて行うことができる。また、選択は、マーカーの発現と病態または徴候の間の相関の統計上の有意性(すなわち、p値)の計算によって行うこともできる。好ましくは、どちらの選択基準も使用する。したがって、本発明の一実施形態では、乳癌に関連するマーカーを選択するのは、そのマーカーが、発現の標準と比較して2倍を上回る変化(増加または減少)と、乳癌の存在とマーカー発現の変化の間の相関に関するp値が0.01以下である(すなわち、統計的に有意である)ことのどちらも示している場合である。
次いで、同定した乳癌関連のマーカーの発現を使用して、腫瘍を臨床型に識別できるマーカーを同定する。数多くの腫瘍サンプルを用いる具体的な実施形態では、マーカーの同定は、臨床カテゴリーまたは臨床パラメータと、発現率の線形、対数、または任意の変換の間の相関係数を、個々の遺伝子ごとに全サンプルにわたって計算することによって行う。具体的には、相関係数は、
Figure 2006519591
として計算し、ここで
Figure 2006519591
は臨床パラメータまたはカテゴリーを表し、
Figure 2006519591
はサンプルと対照の間の発現の比の線形、対数、または任意の変換を表す。相関係数があるカットオフを超えるマーカーを、特定の臨床型に特異的な乳癌関連のマーカーとして同定する。そのようなカットオフまたは閾値は、モンテカルロシミュレーションで得られる、判別遺伝子の特定の有意性に対応している。この閾値は、使用するサンプルの数に依存する。閾値は、
Figure 2006519591
として計算することができ、ここで
Figure 2006519591
は分布幅であり、n=サンプルの数である。具体的な実施形態では、マーカーを、相関係数が約0.3より大きいか、または約−0.3より小さい場合に選ぶ。
次に、相関の有意性を計算する。この有意性の計算は、そのような有意性を計算するためのどのような統計的な手段によっても行うことができる。特定の例では、特定のマーカーの発現の差と臨床カテゴリーの間の連関をランダム化するために、1セットの相関データを、モンテカルロ法を用いて生成する。相関係数の計算による基準を満たすマーカーの頻度分布を、モンテカルロ法によって生成したデータ中で基準を満たすマーカーの数と比較する。モンテカルロ試行で基準を満たすマーカーの頻度分布を使用して、臨床データとの相関によって選択したマーカーの数が有意であるかどうかを決定する。実施例4を参照されたい。
マーカーのセットの同定が済むと、それらマーカーを判別の有意性の順に順位付けすることができる。ある順位付けの手段は、マーカーの遺伝子発現の変化と判別を行っている特定の条件との間の相関の大きさによる。別の、好ましい手段は、統計的尺度を使用することである。特定の実施形態では、その尺度はフィッシャー統計量に類似した量である:
Figure 2006519591
この等式で、
Figure 2006519591
は、第1の診断群(たとえば、ER(−))の内部の転写産物の発現測定値のlog比の誤差で重み付けをした平均であり、
Figure 2006519591
は、第2の、関連する診断群(たとえば、ER(+))の内部のlog比の誤差で重み付けをした平均であり、σは、ER(−)群の内部のlog比の分散であり、nは、log比の有効な測定値が利用可能なサンプルの数である。σは、第2の診断群(たとえば、ER(+))の内部のlog比の分散であり、nは、log比の有効な測定値が利用可能なサンプルの数である。このt値は、分散を補償した、2つの平均の間の差となっている。
順位付けしたマーカーのセットを使用して、そのセットの中で判別に使用するマーカーの数を最適化するために使用することができる。これは、一般に、次の「一点除外」(leave−one−out)法で達成される。1回目の試行では、ランク付けしたリストの上位から、たとえば5個の、マーカーからなるサブセットを使用して、テンプレートを生成するが、ここで、X個のサンプルのうちのX−1個を使用してテンプレートを生成し、残るサンプル1個の状態を予測する。このプロセスを、あらゆるサンプルについて、X個のサンプルのうちのどれも1度は予測するまで繰り返す。2回目の試行では、さらにマーカーを、たとえば5個、追加し、その結果、今度は1つのテンプレートが10個のマーカーから生成されることになるが、残りのサンプル1個の結果を予測する。このプロセスを、マーカーのセット全体を使用してテンプレートを生成するまで繰り返す。試行ごとに、第1種の過誤(偽陰性)および第2種の過誤(偽陽性)をカウントする。最適なマーカーの個数は、第1種の過誤率もしくは第2種の過誤率、または、好ましくは、第1種および第2種の過誤率の合計が最低となる個数である。
予後マーカーについては、マーカーのセットの検証は、さらにもう1つの統計、すなわち生存時間モデルによって達成することができる。この統計では、腫瘍遠隔転移の確率を、初診からの時間の関数として生成する。ワイブル(Weibull)、正規、対数正規、対数ロジスティック、対数-指数または対数レイリー(log−Rayleigh)を含めて、いくつものモデルを使用することができる(Chapter12 "Life Testing", S-PLUS 2000 GUIDE TO STATISTICS, Vol.2, p.368 (2000))。「正規」モデルでは、時間tでの遠隔転移の確率Pは、
Figure 2006519591
として計算し、ここでαは固定で1に等しく、τは当てはめるべきパラメータであり、「余命」の尺度である。
上の方法、特に上で説明した統計的な方法は、乳癌に関連するマーカーの同定に限定されるものではなく、任意の表現型に関連するマーカー遺伝子のセットの同定に使用できることは、当業者には明らかであろう。表現型は、癌などの疾病の存在または不在、あるいは、その癌に付随する識別性病態の存在または不在とすることもできる。疾病に関しては、表現型は、生存時間、病態の遠隔転移の確率、または治療法または予防法に対する特定の応答の可能性などの予後とすることができる。表現型は、癌または疾病である必要はない。表現型は、健康な個人に関わる名目的な特性であっても良い。
5.3.3 サンプル収集
本発明では、標的ポリヌクレオチド分子を、乳癌にかかっている個人から採取したサンプルから抽出する。サンプルの収集は、臨床的に受け入れられるどのような形でも行うことができるが、マーカー由来のポリヌクレオチド(すなわち、RNA)が保存されるように収集しなければならない。mRNAまたはこれに由来する核酸(すなわち、cDNAまたは増幅したDNA)の標識化を、好ましくは、標準または対照のポリヌクレオチド分子から識別できるように行い、この両方のハイブリダイゼーションを、同時にまたは独立に、上で説明したマーカーまたはマーカーのセットもしくはサブセットの一部または全部を含むマイクロアレイに対して行う。あるいは、mRNAまたはこれに由来する核酸の標識化は、標準または対照のポリヌクレオチド分子と同じ標識で行うことができ、特定のプローブにおいてそれぞれのハイブリダイゼーションの強度を比較する。サンプルは、腫瘍生検や穿刺吸引細胞診(fine needle aspirate)など、任意の臨床的に関連性のある組織サンプル、または、血液、血漿、血清、リンパ液、腹水、嚢胞液、尿、または乳頭滲出液などの体液のサンプルを含むことができる。サンプルの採取は、ヒトから、あるいは、獣医学に関しては、反芻動物、ウマ、ブタ、またはヒツジなどの非ヒト動物から、または、ネコやイヌなどの飼育伴侶動物(domestic companion animal)から行うことができる。
全体およびpoly(A)+ RNAを用意する方法は、よく知られており、一般的な記述が、Sambrookら, MOLECULAR CLONING - A LABORATORY MANUAL (2ND ED.), Vols. 1-3, Cold Spring Harbor Laboratory, Cold Sprint Harbor, New York (1989)、および、Ausubelら, CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, vol. 2, Current Protocols Publishing, New York (1994)にある。
RNAの有核細胞からの単離は、細胞の溶解およびそれに含まれるタンパク質の変性を含む手順によって行うことができる。本発明で対象となる細胞は、野生型細胞(すなわち、非癌性)、薬物暴露野生型細胞、腫瘍細胞または腫瘍由来細胞、改変細胞、正常細胞または腫瘍細胞系細胞、および薬物暴露改変細胞を含む。
DNAの取り出しには、さらに別のステップを使用することができる。細胞溶解は、非イオン性界面活性剤と、それに続く微量遠心分離によって達成することができ、後者では核が、またそこから細胞DNAの大部分が取り出される。一実施形態では、RNAの抽出を、本発明で対象となる様々なタイプの細胞から、グアニジニウムチオシアネート溶解と、それに続くDNAからRNAを分離するためのCsCl遠心分離を用いて行う(Chirgwinら, Biochemistry 18:5294-5299 (1979))。ポリ(A)+ RNAの選択は、オリゴ−dTセルロースを用いた選択によって行う(Sambrookら, MOLECULAR CLONING - A LABORATORY MANUAL (2ND ED.), Vols. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York (1989)を参照されたい)。あるいは、RNAのDNAからの分離は、たとえば、高温のフェノールまたはフェノール/クロロホルム/イソアミルアルコールによる組織抽出によって達成することができる。
望ましい場合には、RNAse阻害剤を溶解バッファーに加えることができる。同様に、特定の細胞タイプでは、プロトコルに、タンパク質変性/消化のステップを追加することが望ましいこともある。
多くの適用例では、mRNAを、転移RNA(tRNA)やリボソームRNA(rRNA)など、他の細胞RNAに対して優先的に濃縮することが望ましい。ほとんどのmRNAは、その3’末端にポリ(A)テールを含んでいる。これにより、mRNAの濃縮が、たとえば、セルロースまたはSephadex(商標)などの固体支持体に結合したオリゴ(dT)またはポリ(U)を用いた、アフィニティクロマトグラフィーによって可能となる(Ausubelら, CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, vol. 2, Current Protocols Publishing, New York (1994)を参照されたい)。結合させた後、ポリ(A)+ mRNAのアフィニティカラムからの溶離を、2mM EDTA/0.1% SDSを用いて行う。
RNAのサンプルは、複数の異なるmRNA分子を含むことができ、その異なるmRNA分子はそれぞれ、異なるヌクレオチド配列を有する。具体的な実施形態では、RNAサンプル中のmRNA分子は、少なくとも100個の異なるヌクレオチド配列を含む。より好ましくは、RNAサンプルのmRNA分子は、マーカー遺伝子のそれぞれに対応するmRNA分子を含む。別の具体的な実施形態では、RNAサンプルは、哺乳類のRNAサンプルである。
具体的な実施形態では、細胞からの全RNAまたはmRNAを、本発明の方法で使用する。RNAの採取源は、植物または動物、ヒト、哺乳類、霊長類、非ヒト動物、イヌ、ネコ、マウス、ラット、鳥類、酵母、有核生物、原生生物などの細胞とすることができる。具体的な実施形態では、本発明の方法を、1×10個以下の細胞からの全mRNAまたは全RNAを含むサンプルとともに使用する。別の実施形態では、タンパク質の以上の採取源からの単離を、当技術分野に知られている、タンパク質レベルでの発現解析で使用する方法によって行うことができる。
本明細書に開示するマーカー配列の相同体に対するプローブは、好ましくは、非ヒト核酸のアッセイを行う際に使用することができる。
5.4 乳癌のマーカーのセットを用いた方法
5.4.1 診断方法
本発明では、マーカーのセットを使用して、ある個人からのサンプルの分析を、その個人の腫瘍の分子レベルでのタイプまたはサブタイプ、ある腫瘍がER(+)またはER(−)タイプであるかどうか、その腫瘍がBRCA1関連または散発性であるかどうかを決定するために行う方法を提供する。その個人は、実際に乳癌にかかっていなくてもよい。基本的には、その個人、またはその個人から採取したサンプルの中の特定のマーカー遺伝子の発現を、標準または対照と比較する。たとえば、乳癌関連の2つの病態、XとYがあるとしよう。ある個人における病態Xに対する乳癌予後マーカーの発現のレベルを、対照におけるマーカー由来のポリヌクレオチドのレベルと比較することができ、ここで、そのレベルは、病態Xを有するサンプルの示す発現のレベルである。この例では、その個人のサンプル中のマーカーの発現が実質的に(すなわち、統計的に)対照のそれとは異なる場合、その個人は病態Xをもたない。ここでのように、選択が二方式である場合(すなわち、あるサンプルはXかYかである)には、その個人はさらに病態Yを有するということができる。もちろん、病態Yに相当する対照との比較も行うことができる。好ましくは、そのどちらも同時に行い、対照それぞれが、陽性の対照と陰性の対照のどちらとしても働くようにする。したがって、識別を行う結果は、その対照の表す発現レベル(すなわち、マーカー由来のRNA、またはこれに由来するポリヌクレオチドの量)からの証明可能な差、または有意差のないこととすることができる。
したがって、一実施形態では、ある個人の特定の腫瘍関連の状態を決定する方法は、(1)ある個人からの標識化した標的ポリヌクレオチドを上記マーカーのセットのうちの1つを含むマイクロアレイにハイブリダイズするステップ、(2)標準または対照のポリヌクレオチド分子をマイクロアレイにハイブリダイズするステップであって、標準または対照の分子は、標的の分子からは示差的に標識化してあるステップ、および、(3)標的と標準または対照の転写産物レベルの差、またはその差がないことを決定するステップであって、その差、またはその差のないことにより、その個人の腫瘍関連の状態が決定されるステップを含む。より具体的な実施形態では、標準または対照分子は、健常な個人からのサンプルのプール、または散発性タイプの腫瘍をもつ個人からの腫瘍サンプルのプールからのマーカー由来のポリヌクレオチドを含む。好ましい一実施形態では、標準または対照は、マーカー由来のポリヌクレオチドの人工的に生成したプールであり、そのプールの設計は、特定の臨床的徴候(すなわち、癌性または非癌性、ER(+)またはER(−)の腫瘍、BRCA1タイプまたは散発性タイプの腫瘍)を有する正常なまたは乳癌腫瘍の組織の臨床サンプルの示すマーカー発現のレベルを模倣するように行う。別の具体的な実施形態では、対照の分子は、正常なまたは乳癌の細胞系に由来するプールを含む。
本発明では、ER(+)をER(−)腫瘍タイプから識別するのに有用なマーカーのセットを提供する。したがって、上記の方法の一実施形態では、ある個人からのサンプル中の、表1に与えているマーカーから発現したポリヌクレオチド(すなわち、mRNAまたはこれ由来のポリヌクレオチド)のレベルを、対照からの同じマーカー発現のレベルと比較するが、ここで、この対照は、ER(+)サンプル、ER(−)サンプル、またはそのどちらからも導出したマーカー関連ポリヌクレオチドを含む。好ましくは、この比較は、ER(+)とER(−)のどちらにも対するものでもあり、また、好ましくは、この比較は、それぞれ数多くのER(+)およびER(−)サンプルからのポリヌクレオチドプールに対するものである。その個人のマーカー発現が、ER(+)の対照に最もよく類似または相関しており、ER(−)の対照には類似または相関していない場合、その個人をER(+)と分類する。プールが純粋なER(+)またはER(−)でない場合は、たとえば、散発性プールを使用する。ER状態のわかっている個人からの核酸をこのプールに対してハイブリダイズする1セットの実験を、ER(+)およびER(−)群に関する発現テンプレートを定義するために行うべきである。ER状態のわかっていない各個人からの核酸のハイブリダイゼーションは、同一のプールに対して行い、発現プロファイルをそのテンプレートと比較して、その個人のER状態を決定する。
本発明では、BRCA1関連腫瘍を散発性腫瘍から識別するのに有用なマーカーセットを提供する。したがって、方法は、ただしマーカーが表3および4に列挙してあるものであり、対照マーカーが、BRCA1腫瘍サンプルからのマーカー由来のポリヌクレオチドのプール、および散発性腫瘍からのマーカー由来のポリヌクレオチドのプールであることを除き、実質的にER(+/−)の決定の場合のように行うことができる。患者がBRCA1生殖系列の突然変異を有すると決定するのは、その個人のマーカー由来のポリヌクレオチドの発現が、BRCA1の対照の発現に最もよく類似しているか、最もよく相関している場合である。対照が純粋なBRCA1または散発性でない場合には、2つのテンプレートの定義を、上で説明したER状態に関するそれに似た形で行うことができる。
方法の上記の2つの実施形態では、マーカーのセット全部を使用するのでもよい(すなわち、表1または3の完全なマーカーのセット)。他の実施形態では、これらマーカーのサブセットを使用するのでもよい。好ましい実施形態では、表2または4に列挙してある好ましいマーカーを使用する。
ある個人のマーカーの発現プロファイルと対照のそれの間の類似度は、いくつもの手法で評価することができる。最も単純な場合には、プロファイルの比較は、発現差データのプリントアウトで視認によって行うことができる。あるいは、類似度を数学的に計算することができる。
一実施形態では、2人の患者xとy、または患者xとテンプレートyの間の、ある類似度値で表す類似度を、次の等式を用いて計算することができる:
Figure 2006519591
この式では、xおよびyは、xおよびy(i=1、2、...、N=4986)というlog比の成分をもつ2人の患者である。xのどの値にも誤差
Figure 2006519591
が付随する。
Figure 2006519591
の値が小さいほど、尺度xはより信頼できる。
Figure 2006519591
は、誤差加重算術平均である。
好ましい一実施形態では、テンプレートの作製を、サンプル比較のために行う。テンプレートは、特定の乳癌関連の病態を識別することのできる、マーカー遺伝子の群に関する発現差の誤差で重み付けをしたlog比の平均と定義する。たとえば、テンプレートは、ER(+)サンプルに対しておよびER(−)サンプルに対して定義される。次に、分類器パラメータを計算する。このパラメータの計算は、サンプルとテンプレートの間の発現レベル差を用いて、または相関係数の計算によって行うことができる。そのような係数Pは、次の等式を用いて計算することができる:
Figure 2006519591
[式中、
は発現テンプレートiであり、yはある患者の発現プロファイルである]。
したがって、より具体的な実施形態では、ある個人の特定の腫瘍関連の状態を決定する上の方法は、(1)ある個人からの標識化した標的ポリヌクレオチドを上記マーカーセットのうちの1つを含むマイクロアレイにハイブリダイズするステップ、(2)標準または対照のポリヌクレオチド分子をマイクロアレイにハイブリダイズするステップであって、標準または対照の分子は、標的の分子からは示差的に標識化してあるステップ、(3)2つのチャンネル(個人と対照)の間の転写産物レベルの比(または差)、または単にその個人の転写産物レベルを決定するステップ、および、(4)(3)からの結果を所定のテンプレートと比較するステップであって、決定するステップは、等式1または等式5の統計量によって達成され、差またはその差のないことにより、その個人の腫瘍関連の状態が決定されるステップを含む。
5.4.2 予後方法
本発明では、患者を異なる予後カテゴリーに分類するのに有用なマーカーのセットを提供する。たとえば、本発明では、さらに、これらマーカーを使用して、乳癌にかかっている個人の臨床的予後が良好になるか不良になるかを決定する方法を提供する。本発明では、さらに、「予後良好」の患者をさらに、2つの群、すなわち「予後の優良である」患者と、「予後の中等度」である患者に分類する方法を提供する。上記の分類それぞれに対して、本発明では、さらに、推奨する治療法を提供する。
この方法では、表5に列挙してある完全なマーカーのセットを使用することができる。しかし、また、表5に列挙してあるマーカーのサブセットを使用することもできる。好ましい一実施形態では、表6に列挙してある70個のマーカーのサブセットを使用する。表6のマーカーのうち、少なくとも5、10、15、20、25、30、40、50、60、または70個すべてを使用するのでもよい。
あるサンプルを「予後良好」または「予後不良」として分類することは、実質的に上で説明した診断マーカーの場合のように達成されるが、そこでは、サンプル中のマーカー発現レベルを比較するテンプレートを生成する。
したがって、上記の方法の一実施形態では、個々の乳癌患者からのサンプル中の、表5に与えているマーカーから発現させたポリヌクレオチドのレベル(すなわち、mRNAまたはこれ由来のポリヌクレオチド)を、対照からの同じマーカーの発現のレベルと比較し、そこでは、対照は、臨床的に予後良好と決定した乳癌患者(「予後良好」の対照)、臨床的に予後不良と決定した乳癌患者(「予後不良」の対照)、またはそのどちらからも採取した乳癌腫瘍サンプルに由来するマーカー関連のポリヌクレオチドを含む。この比較は、予後良好と予後不良のどちらの対照にも対するものでもあってもよく、また、好ましくは、この比較は、それぞれ数多くの予後良好および予後不良サンプルからのポリヌクレオチドプールに対するものである。その個人のマーカー発現が、予後良好の対照に最もよく類似または相関しており、予後不良の対照には類似または相関していない場合、その個人を、予後が良好であるものと分類する。プールが純粋な「予後良好」または「予後不良」でない場合は、結果のわかっている個人からのサンプル由来の核酸をこのプールに対してハイブリダイズする1セットの実験を、予後良好および予後不良群に関する発現テンプレートを定義するために行うべきである。結果のわかっていない各個人からの核酸のハイブリダイゼーションは、同一のプールに対して行い、その結果の発現プロファイルをこのテンプレートと比較して、その結果を予測する。
対照または標準は、いくつもの異なるフォーマットで表すことができる。たとえば、乳癌腫瘍サンプル中のマーカー遺伝子の発現を比較する対照、またはテンプレートは、複数の乳癌患者から得た乳癌腫瘍サンプルからプールしたマーカー由来の核酸のプール中の遺伝子のそれぞれの発現の平均の絶対的なレベルとすることができる。この場合、対照中および乳癌患者からのサンプル中のこれら遺伝子の発現の絶対的なレベルの間の差から、患者サンプルおよび対照中の発現のレベルの類似性または非類似性の程度が提供される。発現の絶対的なレベルは、核酸のアレイに対するハイブリダイゼーションの強度によって測定することができる。他の実施形態では、患者サンプルと対照のどちらの中のマーカーの発現レベルに関する値にも、変換を行う(セクション5.4.3を参照されたい)。たとえば、選択したマーカー遺伝子のそれぞれに対して、患者に関する発現レベル値、およびプールに関する平均の発現レベル値の変換は、その値の対数を取ることによって行うことができる。しかも、発現レベル値の正規化を、たとえば、プールを構成するサンプルのすべてのハイブリダイゼーション強度の中央値で割ることによって行うことができる。対照は、患者サンプルの発現データと同時に得られるハイブリダイゼーションデータから導出することもでき、または、コンピュータ上、またはコンピュータ可読媒体上に格納する1セットの数値を構成することができる。
一実施形態では、本発明は、乳癌にかかっているある個人が、初診から5年以内に再発をおそらく経験することになるかどうか(すなわち、個人が予後不良を有するかどうか)を決定する方法であって、(1)その個人から採取したサンプル中の、表5に列挙してあるマーカーの発現のレベルを、標準または対照中の同じマーカーのレベルと比較すること(ここで、標準または対照のレベルは、予後不良の個人において見られるものに相当する)、および、(2)その個人からのサンプル中のマーカー関連のポリヌクレオチドのレベルが、対照のそれと実質的に異なるかどうかを決定することを含み、実質的な差が見られなかった場合は、その患者は予後が不良であり、実質的な差が見られた場合は、その患者は予後が良好であるとする方法を提供する。予後良好に関連するマーカーは、対照としても使用できることが、当業者には容易に理解されよう。より具体的な実施形態では、どちらの対照も使用される。
乳癌の予後不良は、腫瘍が比較的攻撃的であることを示す場合があり、予後良好は、腫瘍が比較的非攻撃的であることを示しうる。したがって、本発明では、乳癌患者の治療の方針を決定する方法であって、表5の231個のマーカー、またはそのサブセットの発現のレベルが、予後良好の発現パターンと予後不良のパターンのどちらに相当するサンプル中のこれらのマーカーのレベルと相関するかを決定すること、および、治療の方針を決定することを含み、発現が予後不良のパターンと相関する場合には、腫瘍を攻撃的な腫瘍として治療するものとする方法を提供する。
発現プロファイルが予後良好プロファイルと相関する患者を、さらに、「予後優良」と「予後中等度」群に分割することができる。70個の最適な予後マーカー遺伝子の決定に使用した元の78個のサンプル中で、発現プロファイルが平均「予後良好」発現プロファイルと相関した(すなわち、相関係数が0.40を下回った)患者は、「予後良好」であると分類した。続いて、発現プロファイルが平均「予後良好」発現プロファイルに対する相関係数で0.636を上回った腫瘍では、遠隔転移を起こしていなかったことを見出した。これらの患者は、腫瘍の「予後良好」発現プロファイルが平均「予後良好」発現プロファイルに対して弱い相関をもつ患者とは、異なる治療法を受けてもよい。このため、患者の分類を、相関係数が0.636を超えていた場合は、「予後優良」発現プロファイルをもつとし、その発現プロファイル相関係数が0.39以下で、0.636以下であった場合は、「予後中等度」とした。これら78人の患者に対する、表6に列挙した70個の遺伝子に関するデータを、表7にリストしている。
この手順は、他の群の患者からのデータを使用し、一群の患者が、後続の乳癌患者の分類に使用すべき臨床および発現のデータを提供することになっている状況に一般化することができる。臨床および追跡データが、初診の後少なくとも5年間利用可能な、一群の患者を選択する。好ましくは、その群の中の患者を、連続する系列として選択して、選択バイアスを低減または除去する。乳癌腫瘍サンプルを各患者から採り、マーカー関連ポリヌクレオチドを生成する。表5に列挙したマーカー遺伝子、または、そのサブセット、好ましくは、表6に列挙したマーカー遺伝子のうち少なくとも5個のそれぞれの発現レベルを、腫瘍サンプルごと(すなわち、患者ごと)に決定して、患者発現プロファイルを生成する。予後良好(すなわち、初診から5年以内に遠隔転移がない)と臨床的に決定された群の中の患者からのマーカー由来のポリヌクレオチドをプールし、予後関連のマーカー遺伝子ごとの平均の発現レベルを決定して対照発現プロファイルを得る。次いで、患者を、患者発現プロファイルの対照発現プロファイルに対する類似度の降順に順位付けして、患者の順位付けリストを作製する。ただし、ここで類似度とは、1つの相関係数など、単一の類似度尺度で表現された1つの値である。次いで、第1の閾値類似度値を選択し、これにより、患者群は、予後良好と予測される患者と予後不良と予測される患者とに分かれる。この第1の閾値類似度値は、臨床結果を最も正確に予測する(すなわち、実際の臨床結果と比べたとき、分類過誤が最も少なくなる発現プロファイル分類になる)類似度値、または、群内の偽陰性が特定の数またはパーセンテージになる類似度値とすることができる。ここで偽陰性とは、初診後5年以内に遠隔転移を実際に引き起こす乳癌患者に対する、発現に基づいた予後良好という予測である。次いで、第2の閾値類似度値を選択し、これにより、「予後良好」群は、2つの群に分かれる。この閾値類似度値は、5年の期間内に実際に遠隔転移があった患者の順位付けリスト上の最上位の患者に対する類似度値として、経験的に決定する。この第2の閾値類似度値により、「予後良好」群は、「予後優良」の患者の群、すなわち、類似度値が、第2の閾値類似度値に等しいまたはそれより高い者と、「予後中等度」群、すなわち、類似度値が、第1の閾値類似度値に等しいまたはそれより高いが、第2の閾値類似度値より小さい者とに分かれる。類似度値が第1の閾値類似度値より小さい患者は、「予後不良」と分類する。その後の患者の分類も、同様に、その患者に対する類似度値の計算を、対照を「予後良好」テンプレートまたは発現プロファイルとして行うこと、および、この類似度尺度を上で得た類似度尺度と比較することによって、可能となる。
したがって、一実施形態では、本発明は、乳癌患者を予後に従って分類する方法であって、その乳癌患者から採取した細胞サンプルでの、マーカーが表5に列挙してある遺伝子のうちの少なくとも5個の発現のレベルを、その少なくとも5個の遺伝子の発現の対照レベルと比較すること、および、その乳癌患者の分類を、細胞サンプルでの発現のレベルと対照レベルの間の類似度に基づくその患者の乳癌の予後に基づいて行うことを含む方法を提供する。より具体的な一実施形態では、この方法の第2のステップは、類似度が、類似度の1つまたは複数の所定の閾値を超えているかどうかを決定することを含む。この方法のより具体的な別の実施形態では、対照レベルは、初診から5年以内に遠隔転移のない複数の乳癌患者から得た腫瘍サンプルのプールの中の少なくとも5個の遺伝子のそれぞれの発現の平均のレベルである。この方法のより具体的な別の実施形態では、対照レベルは、初診から5年以内に遠隔転移がなかった複数の乳癌患者の中の遺伝子の発現レベルを含む。この方法のより具体的なまた別の実施形態では、対照レベルは、マーカーが表5に列挙してある遺伝子のうちの少なくとも5個のそれぞれに対して、コンピュータ上に格納した平均対数強度値を含む。この方法のより具体的なまた別の実施形態では、対照レベルは、マーカーが表6に列挙してある遺伝子のうちの少なくとも5個のそれぞれに対して、コンピュータ上に格納した平均対数強度値を含む。この方法のより具体的な別の実施形態では、対照レベルは、表6に列挙してある少なくとも5個の遺伝子のそれぞれに対して、表7に列挙してある平均対数強度値を含む。この表に列挙してある平均対数強度値のセットは、本明細書で説明する予後方法のいずれに対する「予後良好」テンプレートとしても使用することができる。また、上記の方法では、マーカーが表5に列挙してある、少なくとも10、20、30、40、50、75、100、またはそれ以上の個数の遺伝子の発現のレベルを比較することができ、または、マーカーが表6に列挙してある70個の好ましい遺伝子を使用することができる。
また、本発明では、乳癌患者の3つの予後カテゴリーのうちの1つへの分類であって、(a)マーカーが表5に列挙してある遺伝子のうちの少なくとも5個の発現のレベルの、発現の対照レベルに対する類似度を決定して、患者の類似度値を得ること、(b)予後良好の人を予後不良の人から識別する第1の閾値類似度値を提供し、第1の類似度値よりも、遺伝子の発現の対照に対してより高い類似性を示す、第2の閾値類似度値を決定すること、および、(c)乳癌患者を、患者の類似度値が第1および第2の閾値類似度値を超えている場合には、第1の予後カテゴリーに、患者の類似度値が第1の閾値類似度値に等しいまたは超えているが、第2の閾値類似度値はそうではない場合には、第2の予後カテゴリーに、患者の類似度値が第1の閾値類似度値よりも小さい場合は、第3の予後カテゴリーに分類することを含む分類を提供する。より具体的な実施形態では、少なくとも5個の遺伝子のそれぞれの発現のレベルの決定を、最初に行う。上と同様に、対照は、臨床的に予後良好と決定された乳癌患者(「予後良好」の対照)、臨床的に予後不良と決定された乳癌患者(「予後不良」の対照)、またはそのどちらもから採取した乳癌腫瘍サンプルに由来するマーカー関連のポリヌクレオチドを含む。好ましい実施形態では、対照は、「予後良好」の対照またはテンプレート、すなわち、初診から5年以内に遠隔転移がなかった乳癌患者の中の遺伝子の発現の平均のレベルを含む対照またはテンプレートである。別のより具体的な実施形態では、対照レベルは、1セットの値、たとえば、コンピュータ上に格納した、好ましくは正規化した、平均対数強度値を含む。より具体的な実施形態では、対照またはテンプレートは、表7に示している平均対数強度値のセットである。別の具体的な実施形態では、ステップ(a)における決定することは、遺伝子のそれぞれの絶対的な発現レベルと、初診から5年以内に乳癌の再発がなかった複数の乳癌患者から得た腫瘍サンプルのプールの中の同じ遺伝子の平均の発現レベルとの差を決定することを含む方法によって達成することができる。別の具体的な実施形態では、ステップ(a)における決定は、乳癌患者から採取した乳癌腫瘍サンプル中の遺伝子のそれぞれの発現のレベルと、初診から5年以内に乳癌の再発がなかった複数の乳癌患者から得た腫瘍サンプルのプールの中の同じ遺伝子の発現のレベルとの類似性の程度を決定することを含む方法によって達成することができる。
上記の方法の具体的な一実施形態では、第1の閾値類似度値および第2の閾値類似度値の選択は、(a)腫瘍サンプルのプールを構成する腫瘍サンプルの降順での順位付けを、腫瘍サンプルのそれぞれの中の遺伝子の発現のレベルと、プールを構成する残りの腫瘍サンプルの同じ遺伝子の発現の平均レベルの間の、類似度値として表現される類似性の程度によって行って、順位付けたリストを得ること、(b)分類することにおける受け入れ可能な偽陰性の数を決定すること(偽陰性は、細胞サンプル中の、マーカーが表5に列挙してある遺伝子のうちの少なくとも5個の発現レベルから、その患者が、初診後5年以内に遠隔転移がないと予測されるが、初診後5年以内に遠隔転移があった乳癌患者である)、(c)その値を上回ると、順位付けリスト中で、受け入れ可能な数より少ない腫瘍サンプルが偽陰性となる類似度値を決定すること、(d)ステップ(c)で決定した類似度値を、第1の閾値類似度値として選択すること、および、(e)第1の類似度値よりも大きな、第2の類似度値を、第2の閾値類似度値として選択することを含む方法によって行う。この方法のさらに特定の実施形態では、第2の閾値類似度値の選択を、ステップ(e)で、初診から五年以内に遠隔転移のあった患者から採取した、順位付けリストの中の腫瘍サンプルのうちのどれが、最大の類似度値が有するかを決定すること、および、その最大の類似度値を、第2の閾値類似度値として選択することを含む方法によって行う。さらに特定の実施形態では、第1および第2の閾値類似度値は、相関係数であり、第1の閾値類似度値は0.4であり、第2の閾値類似度値は0.4より大きい。表7に与えてあるテンプレートデータを用いる、別のさらに特定の実施形態では、第1および第2の閾値類似度値は相関係数であり、第2の閾値類似度値は0.636である。別の具体的な実施形態では、第1の類似度値は、それを超えると、腫瘍の訓練セット内で偽陰性が高々10%しかないと予測される類似度値であり、第2の相関係数は、それを超えると、その腫瘍の訓練セット内で偽陰性が高々5%しかないと予測される係数である。別の具体的な実施形態では、第1の相関係数は、それを超えると、腫瘍の訓練セット内で偽陰性が10%と予測される係数であり、第2の相関係数は、それを超えると、その腫瘍の訓練セット内で偽陰性がないと予測される係数である。上記および他の実施形態では、「偽陰性」とは、マーカー遺伝子の発現によって予後良好と分類され、または、そのような発現によって予後良好と予測されるが、5年以内に実際には遠隔転移がある患者である。
上記の方法の具体的な一実施形態では、第1、第2,および第3の予後カテゴリーは、それぞれ「予後優良」、「予後中等度」、および「予後不良」である。第1の予後カテゴリー(「予後優良」)に分類される患者は、初診から5年以内の遠隔転移はないものと見込まれる。「予後中等度」と分類される患者も、初診から5年以内に遠隔転移がないものと見込まれるが、「予後優良」マーカー遺伝子発現プロファイル(下を参照されたい)を有する患者とは異なる治療法を受けるように勧めることができる。第3の予後カテゴリー(「予後不良」)に分類される患者は、初診から5年以内に遠隔転移があるものと見込まれる。
より具体的な一実施形態では、類似度値は、ある乳癌患者から採取した腫瘍サンプル中の遺伝子のそれぞれの発現の絶対的な(すなわち、変換していない)レベルと、対照中の同じ遺伝子の発現の平均の絶対的なレベルの間の相違の程度である。別のより具体的な実施形態では、類似度値は、変換した発現レベルデータを用いて計算する(セクション5.4.3を参照されたい)。別のより具体的な実施形態では、類似度値は、相関係数などの類似度尺度として表現され、腫瘍サンプル中のマーカー遺伝子の発現のレベルと、乳癌患者から採取した複数の乳癌腫瘍サンプル中の同じ遺伝子の発現の平均レベルとの間の類似性を表す。
別の具体的な実施形態では、第1および第2の類似度値は、患者の発現レベルデータを得たのと同じハイブリダイゼーション実験で得た対照発現データから導出する。別の具体的な実施形態では、第1および第2の類似度値は、発現データの既存のセットから導出する。より具体的な一実施形態では、第1および第2の相関係数は、数学的サンプルプールから導出する(セクション5.4.3、実施例9を参照されたい)。たとえば、新しい腫瘍サンプル中のマーカー遺伝子の発現の比較は、最初の調査の78人の患者に対するこれらの遺伝子に関して決定したあらかじめ存在したテンプレートに対するものとすることができる。テンプレート、または70個の遺伝子のそれぞれの平均の発現レベルを、どの腫瘍サンプルに対しても参照または対照として使用することが可能である。好ましくは、比較は、臨床的に予後良好と決定された、78人中44人に対する表6に列挙してある70個の遺伝子のうちの少なくとも5個の平均の発現レベルを含むテンプレートに対するものである。次いで、腫瘍サンプル中のこれらの遺伝子の発現のレベルの、44人の「予後良好」患者のテンプレートに対する相関係数を、決定して腫瘍相関係数を作製する。この対照患者セットに対して、2つの類似度値を導出している。すなわち、表6に列挙してある70個のマーカー遺伝子セットを用いて導出した、0.4という第1の相関係数、および、0.636という第2の相関係数である。これらのマーカー遺伝子の発現の、44人の患者の「予後良好」テンプレートとの相関係数が0.636以上の新しい乳癌患者は、「予後優良」と分類され、相関係数が0.4と0.635の間である乳癌患者は、「予後中等度」と分類され、相関係数が0.39以下の乳癌患者は、「予後不良」と分類される。
上記の方法では、蛍光標識したマーカー由来の標的核酸をハイブリダイズするアレイを利用できるため、本発明では、また、ある乳癌患者を予後に従って分類する方法であって、(a)その乳癌患者から採取した腫瘍サンプルに由来する第1の核酸、および、初診から5年以内に遠隔転移のなかった乳癌患者からの2つ以上の腫瘍サンプルに由来する第2の核酸を、ハイブリダイゼーションを起こりうる条件下にあるアレイに接触させ、アレイ上の複数の個別の所在地のそれぞれのところで、その条件下にあるアレイに結合した、第1の核酸からの第1の蛍光発光シグナルおよび第2の核酸からの第2の蛍光発光シグナルを検出するステップであって、アレイは、マーカーが表5に列挙してある遺伝子のうちの少なくとも5個を含み、アレイ上のプローブの少なくとも50%が表5に列挙してあるものとするステップ、(b)第1の蛍光発光シグナルと第2の蛍光発光シグナルの間の類似度の計算を少なくとも5個の遺伝子にわたって行うステップ、および、(c)その乳癌患者の、その乳癌患者の予後による分類を、第1の蛍光発光シグナルと第2の蛍光発光シグナルの間の少なくとも5個の遺伝子にわたる類似度に基づいて行うステップを含む方法を提供する。
患者を「予後優良」、「予後中等度」、または「予後不良」と分類した後、この情報をその患者の臨床データと組み合わせて、適切な治療法を決定することができる。一実施形態では、その患者のリンパ節転移の状態(すなわち、その患者がpN+であるかまたはpN0であるか)を決定する。pN0であり、「予後優良」または「中等度」の発現プロファイルをもつ患者は、補助化学療法をなしで治療することができる。他の患者にはすべて、補助化学療法による治療を行うべきである。より具体的な実施形態では、その患者のエストロゲン受容体の状態の同定(すなわち、その患者がER(+)であるかER(−)であるか)も行う。ここで、「予後中等度」または「予後不良」と分類したがER(+)である患者には、さらに補助ホルモン療法を含む治療法を指定する。
したがって、本発明では、治療法を乳癌患者に指定する方法であって、(a)その患者を「予後不良」、「予後中等度」、または「予後優良」であると分類することを、マーカーが表5に列挙してある遺伝子のうちの少なくとも5個の発現のレベルに基づいて行うこと、および、(b)その患者への治療法の指定を、その治療法は、その患者がリンパ節陰性であり、予後良好または予後中等度であると分類した場合には、補助化学療法を含まず、その患者のリンパ節状態と発現プロファイルの組み合わせが他のいずれかである場合、化学療法を含むものとして行うことを含む方法を提供する。別の実施形態では、本発明は、治療法を乳癌患者に指定する方法であって、その患者に関するリンパ節状態を決定すること、その患者からの腫瘍サンプル中の、表5に列挙してある遺伝子のうち少なくとも5個の発現のレベルを決定し、これにより、発現プロファイルを生成すること、その患者を「予後不良」、「予後中等度」、または「予後優良」であると分類することを、その発現プロファイルに基づいて行うこと、および、その患者がリンパ節陰性であり、予後良好または予後中等度であると分類した場合には、補助化学療法を含まない治療法を、または、その患者のリンパ節状態と発現プロファイルの組み合わせが他の任意のものである場合には、化学療法を含む治療法を、その患者に指定することを含むものとして行う方法を提供する。上記の方法のより具体的な実施形態では、その患者のER状態をさらに決定し、その乳癌患者がER(+)であり、予後中等度または不良である場合には、治療法はホルモン療法をさらに含む。78人の乳癌患者の訓練セット中、予後中等度の患者の大多数がER(+)でもあると決定されたことから(実施例10を参照されたい)、別のより具体的な実施形態では、リンパ節状態と発現プロファイルを決定し、予後中等度の患者に補助ホルモン療法を(ER状態が決定されていてもいなくても)指定することになる。別の具体的な実施形態では、乳癌患者は、年齢が52歳以下である。別の具体的な実施形態では、乳癌患者は、閉経前である。別の具体的な実施形態では、乳癌患者の乳癌は、第I期または第II期である。
マーカーのセットの使用は、乳癌関連の病態の予後に制限されるものではなく、遺伝子発現がある役割を演じる、様々な表現型あるいは臨床上または実験上の状態において、適用が可能である。2つ以上の表現型に対応する1セットのマーカーを同定している場合には、そのマーカーのセットを使用してこれらの表現型を識別することができる。たとえば、その表現型は、臨床状態の診断および/または予後、または他の癌、他の疾患もしくは症状、または他の生理学的条件に関連する表現型とすることができ、発現レベルのデータは、特定の生理学的なまたは疾病の状態と相関する遺伝子のセットに由来することが可能である。さらに、他のタイプの癌に特異的なマーカーの発現を使用すると、患者または患者集団を、異なる治療法の指示される癌に関して識別することができる。
5.4.3 発現レベル差に対する感度の改善
本明細書で開示したマーカーを使用して、また実際に、マーカーの任意のセットを使用して、ある表現型を有する個人を第2の表現型を有する別の個人から識別する際にも、あるサンプル中のマーカーのそれぞれの絶対的発現を、ある対照と比較することができる。たとえば、この対照は、それぞれ、複数の個人のプール中の、マーカーのそれぞれの発現の平均レベルとすることができる。しかし、比較の感度を上げるために、好ましくは、発現レベルの値をいくつもの手法で変換する。
たとえば、マーカーのそれぞれの発現レベルの正規化は、発現レベルの決定されたマーカーすべての平均の発現レベルによって、またはある対照遺伝子のセットの平均の発現レベルによって行うことができる。このため、一実施形態では、マーカーがマイクロアレイ上のプローブによって表されており、マーカーのそれぞれの発現レベルの正規化を、任意の非マーカー遺伝子も含めて、そのマイクロアレイ上に表される遺伝子のすべてにわたる発現レベルの平均値または中央値によって行う。具体的な一実施形態では、正規化は、マイクロアレイ上の遺伝子のすべての発現レベルの中央値または平均値を割ることによって行われる。別の実施形態では、マーカーの発現レベルの正規化は、対照マーカーのセットの発現のレベルの平均値または中央値によって行われる。具体的な一実施形態では、対照マーカーは、ハウスキーピング遺伝子のセットを含む。別の具体的な実施形態では、正規化は、対照遺伝子の発現レベルの中央値または平均値で割ることによって達成される。
マーカーベースのアッセイの感度も、個々のマーカーの発現レベルを、サンプルのプール中の同じマーカーの発現と比較する場合には、上がることになる。好ましくは、その比較は、そのサンプルのプール中のマーカー遺伝子のそれぞれの発現レベルの平均値または中央値に対するものである。そのような比較は、たとえば、マーカーのそれぞれに対するプールの発現レベルの平均値または中央値でサンプル中のマーカーのそれぞれの発現レベルから割ることによって達成することができる。これには、そのサンプル中のマーカーとそのプール全体中のマーカーとの発現の相対的な差を強調する効果があり、これにより、比較の感度がより上がり、単に絶対的な発現レベルだけを使用するよりも意味のある結果を得やすくなる。発現レベルのデータの変換は、好都合などのような手法でも行うことができる。好ましくは、全部に対する発現レベルデータの対数変換を、平均値または中央値を取る前に行う。
プールに対する比較を行う際、2つの手法を使用することができる。まず、サンプル中のマーカーの発現レベルをプール中のそれらのマーカーの発現レベルと比較することができ、そこでは、サンプル由来の核酸とプール由来の核酸を、単一の実験の進行中にハイブリダイズする。そのような手法では、新しいプールの核酸を、1回のまたは限られた数の比較ごとに生成する必要があり、このため、利用可能な核酸の量によって制限される。代替方法として、また好ましくは、あるプール中の発現レベルを、正規化および/または変換を行うにせよそうでないにせよ、コンピュータ上、またはコンピュータ可読媒体上に保存して、そのサンプル(すなわち、単チャンネルデータ)からの個々の発現レベルのデータに対する比較において使用できるようにする。
したがって、本発明では、第1の細胞または生物が、少なくとも2つの異なる表現型のうちの1つをもつものとして分類する次の方法を提供するが、ここで、その異なる表現型は、第1の表現型および第2の表現型を含む。第1の細胞または生物からの第1のサンプル中の複数の遺伝子それぞれの発現のレベルを、それぞれ、複数の細胞または生物からのプールしたサンプル中の遺伝子それぞれの発現のレベルと、それぞれ比較し、この複数の細胞または生物は、少なくとも2つの異なる表現型を示す異なる細胞または生物を、それぞれ含んで、第1の比較値が得られる。次いで、この第1の比較値を、第2の比較値と比較するが、その第2の比較値は、第1の表現型をもつことを特徴とする細胞または生物からのサンプル中の遺伝子それぞれの発現のレベルを、プールしたサンプル中の遺伝子それぞれの発現のレベルと、それぞれ比較することを含む方法の産物である。次いで、第1の比較値を第3の比較値と比較するが、その第3の比較値は、第2の表現型をもつことを特徴とする細胞または生物からのサンプル中の遺伝子それぞれの発現のレベルを、プールしたサンプル中の遺伝子それぞれの発現のレベルと、それぞれ比較することを含む方法の産物である。自由選択で、第1の比較値を、追加の比較値と、それぞれ比較することができ、ここで、追加の比較値はそれぞれ、第1および第2の表現型とは異なるが、少なくとも2つの異なる表現型のうちに含まれている表現型をもつことを特徴とする細胞または生物からのサンプル中の遺伝子それぞれの発現のレベルを、プールしたサンプル中の遺伝子それぞれの発現のレベルと、それぞれ比較することを含む方法の産物である。最後に、第2、第3、および、存在する場合は、1つまたは複数の追加の比較値のうちのどれに、第1の比較値が最も類似しているかの決定を行い、第1の細胞または生物は、第1の比較値に最も類似している比較値を得るのに使用された細胞または生物の表現型をもつと決定する。
この方法の具体的な実施形態では、比較値は、それぞれ、遺伝子それぞれの発現のレベルの比である。別の具体的な実施形態では、プールしたサンプル中の遺伝子それぞれの発現レベルのそれぞれの正規化を、比較するステップのどれよりも前に行う。より具体的な実施形態では、発現のレベルの正規化は、遺伝子それぞれの発現の中央値または平均値のレベルで割ることによって、または、細胞または生物からのプールしたサンプル中の1つまたは複数のハウスキーピング遺伝子の発現の平均値または中央値のレベルで割ることによって行う。別の具体的な実施形態では、正規化した発現のレベルに対数変換を適用し、比較するステップは、サンプル中の遺伝子それぞれの発現のレベルの対数からこの対数変換を差し引くことを含む。別の具体的な実施形態では、この2つ以上の異なる表現型は、ある疾病または障害の異なる段階である。さらに別の具体的な実施形態では、この2つ以上の異なる表現型は、ある疾病または障害の異なる予後である。さらに別の具体的な実施形態では、プールしたサンプル中の遺伝子それぞれの発現のレベルをそれぞれ、あるいは、第1の表現型、第2の表現型、または第1および第2の表現型とは異なる表現型をもつことを特徴とする細胞または生物からのサンプル中の遺伝子それぞれの発現のレベルをそれぞれ、コンピュータ上またはコンピュータ可読媒体上に保存する。
別の具体的な実施形態では、2つの表現型は、ER(+)またはER(−)という状態である。別の具体的な実施形態では、2つの表現型は、BRCA1または散発性腫瘍タイプの状態である。さらに別の具体的な実施形態では、2つの表現型は、予後良好および予後不良である。
別の具体的な実施形態では、サンプル中の遺伝子それぞれの発現と2つ以上の表現型のうちの1つだけを表すプール中の同じ遺伝子の発現の間の比較を行う。予後関連遺伝子の背景では、たとえば、あるサンプル中の予後関連遺伝子の発現レベルを、(予後不良および予後良好の患者からのサンプルを含むサンプルのプールに対して)サンプルの「予後良好」プール中の同じ遺伝子の発現の平均レベルと比較することができる。したがって、この方法では、サンプルが予後良好であると分類するのは、予後関連遺伝子の発現のレベルが、平均の「予後良好」発現プロファイルに対するある選ばれた相関係数を超える(すなわち、「予後良好」である患者からのサンプルのプール中の予後関連の遺伝子の発現のレベル)場合である。発現レベルが「予後良好」発現プロファイルと最も弱く相関する(すなわち、相関係数が、選ばれた係数を超えられない)患者は、予後不良であると分類する。この方法は、これらの予後のクラスの下位区分に適用することができる。たとえば、具体的な一実施形態では、その表現型は予後良好であり、その決定は、(1)サンプル中の複数の遺伝子およびプールしたサンプル中の同じ遺伝子の発現の間の相関係数を決定すること、(2)第1の相関係数の値を0.4と+1の間で、第2の相関係数の値を0.4と+1の間で、第2の値が第1の値よりも大きくなるように選択すること、および、(3)そのサンプルを、その相関係数が第2の相関係数の値に等しいか大きい場合には「予後優良」であると、その相関係数が第1の相関係数の値に等しいか超える場合には「予後中等度」であると、または、その相関係数が第1の相関係数の値より小さい場合には「予後不良」であると分類することを含む。
もちろん、単チャンネルデータは、数学的サンプルプールに対する特定の比較なしでも使用することができる。たとえば、あるサンプルを、第1または第2の表現型をもつものとして、ただしその第1と第2の表現型は関連するものとして、分類することは、サンプル中の少なくとも5個の、ただし、第1または第2の表現型と相関する、マーカーの発現と、同じマーカーの第1の表現型テンプレートおよび第2の表現型テンプレートにおける発現の間の類似度を計算することを、(a)あるサンプル由来の核酸を蛍光体で標識して、蛍光体標識した核酸のプールを得ること、(b)その蛍光体標識した核酸をマイクロアレイと接触させることを、ハイブリダイゼーションが起きるような条件下で行い、マイクロアレイ上の複数の個別の所在地のそれぞれのところで、そのマイクロアレイにその条件下で結合した蛍光体標識した核酸からの蛍光発光シグナルを検出すること、および(c)個々のサンプル中のマーカー遺伝子の発現の第1および第2のテンプレートに対する類似度を、その発現が第1のテンプレートにより類似する場合は、そのサンプルを第1の表現型をもつとして分類し、その発現が第2のテンプレートにより類似する場合は、そのサンプルを第2の表現型をもつとして分類して決定することによって行うことによって可能である。
5.5 マーカー遺伝子発現レベルの決定
5.5.1 方法
あるサンプル中のマーカー遺伝子の発現レベルの決定は、当技術分野に知られているどのような手段によっても行うことができる。発現レベルの決定は、マーカー遺伝子それぞれから転写した核酸の単離および核酸のレベル(すなわち、量)の決定によって行うことができる。あるいは、または追加として、あるマーカー遺伝子から転写したmRNAから翻訳した特定のタンパク質のレベルを決定することもできる。
特定のマーカー遺伝子の発現のレベルは、サンプル中に存在する、mRNAの量、またはこれに由来するポリヌクレオチドを決定することによって達成することができる。RNAレベルを決定するためのどのような方法も使用することができる。たとえば、RNAは、あるサンプルから単離し、アガロースゲル上で分離する。次いで、分離したRNAを、フィルターなどの固体支持体へと転写する。次いで、1つまたは複数のマーカーに相当する核酸プローブのそのフィルターへのハイブリダイゼーションを、ノーザンハイブリダイゼーションによって行い、マーカー由来のRNAの量を決定する。そのような決定は、視認によるか、またはたとえば、密度計の使用による装置支援とすることができる。RNAレベルを決定する別の方法は、ドットブロットまたはスロットブロットの使用によるものである。この方法では、あるサンプルからのRNA、またはこれに由来する核酸を標識する。次いで、そのRNAまたはこれに由来する核酸を、1つまたは複数のマーカー遺伝子に由来するオリゴヌクレオチドを含むフィルターへとハイブリダイズするが、オリゴヌクレオチドは、そのフィルター上で、個別の、容易に同定可能な場所に配置する。標識したRNAの、フィルターに結合したオリゴヌクレオチドに対するハイブリダイゼーション、またはその欠如を、視認により、または密度計によって決定する。ポリヌクレオチドの標識は、放射性標識または蛍光性(すなわち、可視的な)標識を用いて行うことができる。
こうした例は、制限的なものではない。RNA存在量を決定する他の方法も当技術分野には知られている。
また、特定のマーカー遺伝子の発現のレベルの評価は、そのマーカー遺伝子から発現した特定のタンパク質のレベルを決定することによっても行うことができる。これは、たとえば、ウェスタンブロット法で、タンパク質をあるサンプルからポリアクリルアミドゲル上で分離し、続いて、特定のマーカー由来のタンパク質を抗体を用いて同定することによって達成することができる。あるいは、タンパク質の分離は2次元ゲル電気泳動システムによって行うこともできる。2次元ゲル電気泳動法は、当技術分野にはよく知られており、通常、第1の次元方向の等電点フォーカシングと、それに続く第2の次元方向のSDS−PAGE電気泳動を行うことを含む。たとえば、Hamesら, 1990, GEL ELECTROPHORESIS OF PROTEINS: A PRACTICAL APPROACH, IRL Press, New York;Shevchenkoら, Proc. Nat'l Acal. Sci. USA 93:1440-1445 (1996);Saglioccoら, Yeast 12:1519-1533 (1996);Lander, Science 274:536-539 (1996)を参照されたい。結果である電気泳動図の分析は、質量分析技法、ウエスタンブロッティング、および、ポリクローナルおよびモノクローナル抗体を用いた免疫ブロット解析を含む、多くの技法によって行うことができる。
あるいは、マーカー由来のタンパク質のレベルの決定は、結合部位に、細胞ゲノムがコードする複数のタンパク種に特異的な、固定化された、好ましくはモノクローナルの抗体を含む抗体マイクロアレイを構築することによって行うことができる。好ましくは、抗体は、対象とするマーカー由来タンパク質の実質的な割合に対して存在する。モノクローナル抗体を作製する方法はよく知られている(たとえば、HarlowおよびLane, 1988, ANTIBODIES: A LABORATORY MANUAL, Cold Spring Harbor, New Yorkを参照されたい。この全体をあらゆる目的のために組み込む。)。一実施形態では、モノクローナル抗体を、その細胞のゲノム配列に基づいて設計した合成ペプチド断片に対して作る。そのような抗体アレイがある場合は、その細胞からのタンパク質をそのアレイに接触させ、その結合のアッセイを当技術分野に知られているアッセイによって行う。一般に、診断または予後の対象となるタンパク質の発現、および発現のレベルの検出は、組織スライスまたは切片の免疫組織化学染色によって行うことができる。
最後に、多くの組織標本内のマーカー遺伝子の発現は、「組織アレイ」を用いて特徴付けることができる(Kononenら, Nat. Med 4(7):844-7 (1998))。組織アレイでは、複数の組織サンプルの評価を同じマイクロアレイ上で行う。このアレイにより、RNAおよびタンパク質のレベルのin situ検出が可能になる。連続する切片により、複数のサンプルの分析が同時に可能になる。
5.5.2 マイクロアレイ
好ましい実施形態では、ポリヌクレオチドマイクロアレイを使用して発現を計測し、その結果、上記のマーカーそれぞれの発現の状態は同時に評価される。具体的な一実施形態では、本発明は、上で説明したマーカーセットのそれぞれに対応する遺伝子に対してハイブリダイズ可能なプローブを含むオリゴヌクレオチドまたはcDNAのアレイを提供する(すなわち、ある腫瘍の分子タイプまたはサブタイプを決定するマーカー、ER状態を識別するマーカー、BRCA1を散発性腫瘍から識別するマーカー、良好の患者を予後不良の患者に対して識別するマーカー、ER(+)をER(−)からと、BRCA1腫瘍を散発性腫瘍からの識別をどちらも行うマーカー、ER(+)をER(−)から、および予後良好の患者を予後不良の患者から識別するマーカー、BRCA1腫瘍を散発性腫瘍から、および予後良好の患者を予後不良の患者から識別するマーカー、ER(+)をER(−)から、BRCA1腫瘍を散発性腫瘍から、および予後良好の患者を予後不良の患者から識別することのできるマーカー、および状態それぞれに特有のマーカー)。
本発明の提供するマイクロアレイは、上に記した臨床的症状のうちの1つ、2つ、または3つすべての状態を識別することのできるマーカーに対応する遺伝子に対してハイブリダイズ可能なプローブを含むことができる。特に、本発明では、ER(+)とER(−)の患者または腫瘍を識別する、2460個のマーカーからなる完全なセットに至るまでの、少なくとも50、100、200、300、400、500、750、1000、1250、1500、1750、2000、または2250個の遺伝子マーカーからなるサブセットに対するプローブを含むポリヌクレオチドアレイを提供する。また、本発明では、ER(−)群の腫瘍の内部で、BRCA1突然変異を含む腫瘍と散発性腫瘍の間の識別を行う、430個のマーカーからなる完全なセットに至るまでの、少なくとも20、30、40、50、75、100、150、200、250、300、350、または400個のマーカーからなるサブセットに対するプローブを提供する。また、本発明では、散発性腫瘍の内部で、予後が良好と不良の患者の間の識別を行う、231個のマーカーからなる完全なセットに至るまでの、少なくとも20、30、40、50、75、100、150、または200個のマーカーからなるサブセットに対するプローブを提供する。具体的な一実施形態では、アレイは、臨床的症状のうちのいずれか2つを対象とするマーカーのセットまたはサブセットに対するプローブを含む。より具体的な一実施形態では、アレイは、3つの臨床的症状すべてを対象とするマーカーのセットまたはサブセットに対するプローブを含む。
具体的な実施形態では、本発明は、本明細書で説明する乳癌関連のマーカーが、アレイ上のプローブのうちの少なくとも50%、60%、70%、80%、85%、90%、95%、または98%を含むポリヌクレオチドアレイを提供する。別の具体的な実施形態では、本発明は、表1から選択したER状態関連のマーカーが、アレイ上のプローブのうちの少なくとも50%、60%、70%、80%、85%、90%、95%、または98%を含むポリヌクレオチドアレイを提供する。別の具体的な実施形態では、本発明は、表3から選択したBRCA1/散発性マーカーが、アレイ上のプローブのうちの少なくとも50%、60%、70%、80%、85%、90%、95%、または98%を含むポリヌクレオチドアレイを提供する。別の具体的な実施形態では、本発明は、表5から選択した予後マーカーが、アレイ上のプローブのうちの少なくとも50%、60%、70%、80%、85%、90%、95%、または98%を含むポリヌクレオチドアレイを提供する。
また別の具体的な実施形態では、本明細書で開示する方法で使用するマイクロアレイは、自由選択で、表1〜6に列挙してあるマーカーのうちの少なくとも一部に追加されるマーカーを含む。たとえば、具体的な一実施形態では、マイクロアレイは、Altschulerらの2002年3月7日公開の国際公開WO02/18646およびSchererらの2002年2月28日公開の国際公開WO02/16650に記載のスクリーニングまたはスキャニング用アレイである。このスキャニングおよびスクリーニング用アレイは、発現済みでも未発現でも、ゲノム核酸配列に由来する、規則的に配置され、位置がアドレス可能なプローブを含む。そのようなアレイは、表1〜6に列挙してあるマーカーのサブセット、またはすべて、あるいは、上で説明したそれらのサブセットに対応するプローブを含むことができ、これを使用すると、マーカーの発現のモニターを、表1〜6に列挙してあるマーカーだけを含むマイクロアレイと同じ手法で行うことができる。
また別の具体的な実施形態では、マイクロアレイは、表1〜6に列挙してあるマーカーのうちの少なくとも5個を含む市販のcDNAマイクロアレイである。好ましくは、市販のcDNAマイクロアレイは、表1〜6に列挙してあるマーカーのすべてを含む。しかし、そのようなマイクロアレイは、表中の最大数のマーカーに至るまでの、表1〜6のいずれかの中のマーカーのうちの5、10、15、25、50、100、150、250、500、1000個、またはそれ以上を含むことができ、表1〜6のうちのどれか1つの中のマーカーのすべておよび表1〜6のうちの別のもののサブセット、または、上で説明したそれぞれのサブセットを含むことができる。本明細書で開示する方法で使用するマイクロアレイの具体的な一実施形態では、表1〜6のすべてまたは一部であるマーカーは、マイクロアレイ上のプローブのうちの少なくとも50%、60%、70%、80%、90%、95%、または98%を構成する。
上記のマーカーセットおよび/またはサブセットを含むマイクロアレイの構築に関する一般的な方法をこの後のセクションで述べる。
5.5.2.1 マイクロアレイの構築
マイクロアレイの調製は、ポリヌクレオチド配列を含むプローブを選択し、次いでそのようなプローブを固体支持体または表面へと固定することによって行う。たとえば、プローブは、DNA配列、RNA配列、またはDNAとRNAのコポリマー配列を含むことができる。また、プローブのポリヌクレオチド配列は、DNAおよび/またはRNAのアナログ、またはその組み合わせを含むことができる。たとえば、プローブのポリヌクレオチド配列は、ゲノムDNAの完全または一部の断片を含むことができる。プローブのポリヌクレオチド配列は、合成オリゴヌクレオチド配列などの、合成ヌクレオチド配列とすることもできる。プローブ配列は、in vivoで酵素的に、in vitroで酵素的に(たとえば、PCRによって)、またはin vitroで非酵素的に合成することができる。
本発明の方法で使用するプローブは、好ましくは、多孔質でも非多孔質でもよい固体支持体へと固定する。たとえば、本発明のプローブは、ニトロセルロースまたはナイロンの膜またはフィルターに、ポリヌクレオチドの3’または5’末端のところで共有結合で結合させたポリヌクレオチド配列とすることができる。そのようなハイブリダイゼーションプローブは、当技術分野にはよく知られている(たとえば、Sambrookら, MOLECULAR CLONING - A LABORATORY MANUAL (2ND ED.), Vols. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York (1989)を参照されたい)。あるいは、固体支持体または表面は、ガラスまたはプラスチックの表面とすることができる。特に好ましい実施形態では、ハイブリダイゼーションのレベルは、DNAまたはDNA模倣物質の集団、または、これに代えて、RNAまたはRNA模倣物質の集団などのポリヌクレオチドの集団を表面上に固定した固相からなるプローブのマイクロアレイ上で測定する。固相は、非多孔質、または自由選択で、ゲルなど多孔質の材料とすることができる。
好ましい実施形態では、マイクロアレイは、本明細書で説明するマーカーのうちの1つにそれぞれが相当する結合(たとえば、ハイブリダイゼーション)部位または「プローブ」の順序付けられたアレイを伴う支持体または表面を含む。好ましくは、マイクロアレイは、アドレス可能なアレイであり、より好ましくは、位置がアドレス可能なアレイである。より具体的には、アレイの各プローブは、好ましくは、固体支持体上の既知の所定の位置に、各プローブの素姓(すなわち、その配列)がアレイ内の(すなわち、支持体または表面上の)位置から決定できるように配置する。好ましい実施形態では、各プローブは、固体支持体に単一部位で共有結合で結合される。
マイクロアレイは、いくつもの手法で作製することができ、そのうちのいくつかを下で説明する。どのように作製しても、マイクロアレイは特定の特徴を共有する。アレイは再現可能であり、これにより、所与のアレイの複数のコピーを作製し、互いに容易に比較することができるようになる。好ましくは、マイクロアレイは、結合する(たとえば、核酸ハイブリダイゼーション)条件下で安定な材料から作製する。マイクロアレイは、好ましくは、小さく、たとえば、1cmと25cmの間、12cmと13cmの間、または3cmである。しかし、より大きなアレイも企図するものであり、たとえば、スクリーニング用アレイでの使用には好ましい可能性がある。好ましくは、マイクロアレイ内のある所与の結合部位、または結合部位の一意的なセットは、特に、ある細胞中の単一の遺伝子の産物に(たとえば、特定のmRNAに、またはそれに由来する特定のcDNAに)特異的に結合(たとえば、ハイブリダイズ)することになる。しかし、一般に、他の関連のまたは類似の配列は、ある所与の結合部位にクロスハイブリダイズすることになる。
本発明のマイクロアレイは、1つまたは複数の試験プローブを含み、そのそれぞれが、検出すべきRNAまたはDNAの部分配列に相補的であるポリヌクレオチド配列を有する。好ましくは、固相表面上の各プローブの位置は既知である。実際、マイクロアレイは、好ましくは、位置がアドレス可能なアレイである。具体的には、アレイの各プローブは、好ましくは、固体支持体上の既知の所定の位置に、各プローブの素姓(すなわち、その配列)がアレイ内の(すなわち、支持体または表面上の)位置から決定できるように配置する。
本発明によれば、マイクロアレイは、位置それぞれが本明細書で説明するマーカーのうちの1つに相当するアレイ(すなわち、その行列)である。たとえば、位置は、それぞれDNAまたはDNAアナログを、その遺伝子マーカーから転写した特定のRNAまたはcDNAが特異的にハイブリダイズすることの可能なゲノムDNAに基づいて含むことができる。DNAまたはDNAアナログは、たとえば、合成オリゴマーまたは遺伝子断片とすることができる。一実施形態では、マーカーのそれぞれに相当するプローブがアレイ上に存在する。好ましい実施形態では、アレイは、2460個のREの状態マーカーのうちの550個、BRCA1/散発性マーカーのうちの70個、および予後マーカーのうち231個すべてを含む。
5.5.2.2 マイクロアレイ用プローブの調製
上で触れたように、本発明による、特定のポリヌクレオチド分子が特異的にハイブリダイズする「プローブ」は、相補的なゲノムポリヌクレオチド配列を含む。マイクロアレイのプローブは、好ましくは、1000ヌクレオチド以下のヌクレオチド配列からなる。一部の実施形態では、アレイのプローブは、10〜1000ヌクレオチドのヌクレオチド配列からなる。好ましい一実施形態では、プローブのヌクレオチド配列は、長さが10〜200ヌクレオチドの範囲にあり、1つの種の生物のゲノム配列であって、複数の異なるプローブが、そのような1つの種の生物のゲノムと相補的であり、したがってハイブリダイズできる配列を、そのようなゲノムの全体または一部にわたって順次敷き詰めたものとなっている。他の具体的な実施形態では、プローブは、長さ10〜30ヌクレオチドの範囲、長さ10〜40ヌクレオチドの範囲、長さ20〜50ヌクレオチドの範囲、長さ40〜80ヌクレオチドの範囲、長さ50〜150ヌクレオチドの範囲、長さ80〜120ヌクレオチドの範囲にあり、最も好ましくは、長さは60ヌクレオチドである。
プローブは、ある生物のゲノムの一部に対応するDNAまたはDNA「模倣物質」(たとえば、誘導体およびアナログ)を含むことができる。別の実施形態では、マイクロアレイのプローブは、相補的なRNAまたはRNA模倣物質である。DNA模倣物質は、DNAとの特定の、ワトソン−クリック様ハイブリダイゼーションの、または、RNAとの特定のハイブリダイゼーションの可能なサブユニットからなるポリマーである。核酸は、塩基部分、糖部分、またはリン酸骨格で改変することができる。例示的なDNA模倣物質としては、たとえば、ホスホロチオエートがある。
DNAは、たとえば、ゲノムDNAまたはクローニングした配列のポリメラーゼ連鎖反応(PCR)増幅によって得ることができる。PCRプライマーの選択は、好ましくは、ゲノムDNAの特定の断片の増幅が生じることになるゲノムの既知の配列に基づいて行う。当技術分野によく知られているコンピュータプログラムは、Oligo バージョン5.0(National Biosciences)など、必要な特異性および最適な増幅特性をもつプライマーの設計に有用である。通常、マイクロアレイ上の各プローブは、10塩基と50000塩基の間であり、普通、長さは300塩基と1000塩基の間であろう。PCR法は、当技術分野にはよく知られており、その記述は、たとえば、Innisら, eds., PCR PROTOCOLS: A GUIDE TO METHODS AND APPLICATIONS, Academic Press Inc., San Diego, CA (1990)にある。制御されたロボットシステムが核酸の単離および増幅に有用であることは、当業者には明らかであろう。
マイクロアレイのポリヌクレオチドプローブを生成する代替の好ましい一手段は、合成ポリヌクレオチドまたはオリゴヌクレオチドの合成によるもの、たとえば、N−ホスホネートまたはホスホルアミダイト化学を用いるものである(Froehlerら, Nucleic Acid Res. 14:5399-5407 (1986);McBrideら, Tetrahedron Lett. 24:246-248 (1983))。合成配列は、典型的には、長さが約10と約500塩基の間であり、より典型的には、約20と約100塩基の間であり、最も好ましくは、長さが約40と約70塩基の間である。一部の実施形態では、合成核酸は、イノシンなどの非天然塩基を含むが、決してこれに限定されるものではない。上で触れたように、核酸アナログをハイブリダイゼーションのための結合部位として使用することができる。適切な核酸アナログの例は、ペプチド核酸である(たとえば、Egholmら, Nature 363:566-568 (1993);米国特許第5,539,083号を参照されたい)。
プローブの選択は、好ましくは、結合エネルギー、塩基組成、配列の複雑さ、交差ハイブリダイゼーション結合エネルギー、および二次構造を考慮に入れたアルゴリズムを用いて行う(Friendら,2001年1月25日公開の国際公開WO01/05935;Hughesら,Nat. Biotech. 19:342-7 (2001)を参照されたい)。
陽性対照プローブ、たとえば、標的ポリヌクレオチド分子中の配列に対して相補的でハイブリダイズ可能であることが知られているプローブ、および陰性対照プローブ、たとえば、標的ポリヌクレオチド分子中の配列に対して相補的でなく、ハイブリダイズ可能ではないことが知られているプローブをアレイ上に含めるべきであることが、当業者には理解されよう。一実施形態では、陽性対照の合成は、アレイの周囲に沿って行う。別の実施形態では、陽性対照の合成は、アレイと交差する斜線縞状に行う。また別の実施形態では、各プローブに対する逆順相補体(reverse complement)の合成を、陰性対照として役立つプローブの位置の隣で行う。また別の実施形態では、他の生物種からの配列を、陰性対照または「スパイク−イン」対照として使用する。
5.5.2.3 プローブの固体表面への結合
プローブは、固体支持体または表面へと結合させるが、これは、たとえば、ガラス、プラスチック(たとえば、ポリプロピレン、ナイロン)、ポリアクリルアミド、ニトロセルロース、ゲル、または他の多孔質または非多孔質の素材から作製することができる。核酸を表面へと結合させる好ましい方法は、ガラスプレート上にプリントすることであり、これはSchena et al.、Science 270:467-470 (1995)で一般的に説明されている通りである。この方法は、cDNAのマイクロアレイを調製するのに特に有用である(DeRisi et al., Nature Genetics 14:457-460 (1996);Sharon et al., Genome Res. 6:639-645 (1996);および、Schena et al., Proc. Natl. Acad. Sci. U.S.A. 93:10539-11286 (1995)も参照されたい)。
マイクロアレイを作製する第2の好ましい方法は、高密度のオリゴヌクレオチドアレイを作製することによるものである。定められた配列に相補的な数千のオリゴヌクレオチドを含むアレイの製造を、表面上定められた場所に、in situ合成のためのフォトリソグラフィー技法を用いて行うための技法(Fodor et al., 1991, Science 251:767-773;Peaseら, 1994, Proc. Natl. Acad. Sci. U.S.A. 91:5022-5026;Lockhart et al., 1996, Nature Biotechnology 14:1675;米国特許第5,578,832号;第5,556,752号;第5,510,270号を参照されたい)、または定められたオリゴヌクレオチドの迅速な合成および沈殿のための他の方法(Blanchard et al., Biosensors & Bioelectronics 11:687-690)が知られている。こうした方法を使用するときには、配列が既知のオリゴヌクレオチド(たとえば、60mer)を、ガラススライド誘導体などの表面上に直接に合成する。通常、製造したアレイは重複性で、RNA1つあたりいくつかのオリゴヌクレオチド分子がある。
たとえば、マスキング(Maskos and Southern, 1992, Nuc. Acids. Res. 20:1679-1684)による、マイクロアレイを作製する他の方法も使用することができる。基本的に、また上記のように、任意のタイプのアレイ、たとえば、ハイブリダイゼーション用ナイロン膜上のドットブロット(Sambrookら, MOLECULAR CLONING - A LABORATORY MANUAL (2ND ED.), Vols. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York (1989)を参照されたい)を使用できよう。しかし、当業者に理解されるように、非常に小さいアレイがしばしば好ましく、これは、ハイブリダイゼーションの量がより小さいためである。
一実施形態では、本発明のアレイの調製は、ポリヌクレオチドプローブを支持体上に合成することによって行う。そのような一実施形態では、ポリヌクレオチドプローブの支持体上への結合を、共有結合によりポリヌクレオチドの3’または5’末端で行う。
特に好ましい一実施形態では、本発明のマイクロアレイの製造は、オリゴヌクレオチド合成用のインクジェット印刷装置によって、たとえば、Blanchardが米国特許第6,028,189号;Blanchardら, 1996, Biosensors and Bioelectronics 11:687-690;Blanchard, 1998, in SYNTHETIC DNA ARRAYS IN GENETIC ENGINEERING, Vol.20, J.K.Setlow, Ed., Plenum Press, New York, 111-123ページで説明する方法およびシステムを用いて行う。特に、そのようなマイクロアレイ中のオリゴヌクレオチドプローブの合成は、好ましくは、アレイ中で、たとえば、ガラススライド上で、個々のヌクレオチド塩基を、炭酸プロピレンなどの高表面張力の溶剤の「微小液滴」中で順次沈殿させることによって行う。微小液滴は体積が小さく(たとえば、100pL以下、より好ましくは50pL以下)、マイクロアレイ上で(たとえば、疎水性領域により)互いに分離されて、アレイ要素(すなわち、異なるプローブ)の場所を定める円形の表面張力ウェルを形成する。このインクジェット法によって製造されたマイクロアレイは、通常、高密度であり、好ましくは1cmあたり少なくとも約2500の異なるプローブの密度を有する。ポリヌクレオチドプローブの支持体への結合は、共有結合により、ポリヌクレオチドの3’または5’末端のところで行う。
5.5.2.4 標的ポリヌクレオチド分子
本発明によって分析することのできるポリヌクレオチド分子(「標的ポリヌクレオチド分子」)は任意の臨床的採取源からのものとすることができるが、天然に存在する核酸分子並びに合成核酸分子を含めて、発現したRNAまたはこれに由来する核酸(たとえば、cDNA、または、RNAポリメラーゼプロモーターを取り込むcDNAに由来する増幅したRNA)である。一実施形態では、標的ポリヌクレオチド分子は、RNAを含み、これは、全細胞RNA,ポリ(A)メッセンジャーRNA(mRNA)またはその一部、細胞質mRNA、またはcDNAから転写されたRNA(すなわち、cRNA。たとえば、1999年10月4日出願のLinsley & Schelter,米国特許出願第09/411,074号、または米国特許第5,545,522号、第5,891,636号または第5,716,785号を参照されたい)を含むが、決してこれに限定されるものではない。全RNAおよびポリ(A)RNAを調製する方法は当技術分野にはよく知られており、その一般的な記述が、たとえば、Sambrookら, MOLECULAR CLONING - A LABORATORY MANUAL (2ND ED), Vols. 1-3, Cold Spring Harbor Laboratory, Cold Sprint Harbor, New York (1989)にある。一実施形態では、RNAの抽出を、本発明で対象となる多種の細胞から、グアニジニウムチオシアネート溶解と、それに続くCsCl遠心分離を用いて行う(Chirgwinら, 1979, Biochemistry 18:5294-5299)。別の実施形態では、全RNAの抽出を、シリカゲルベースのカラムを用いて行うが、その市販例としては、RNeasy(カリフォルニア州Valencia、Qiagen)およびStrataPrep(カリフォルニア州La Jolla、Stratagene)がある。S. cerevisiaeの場合に好ましい一代替実施形態では、RNAの細胞からの抽出をフェノールおよびクロロホルムを用いて行うが、その記述が、Ausubel et.al., eds, 1989, CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, Vol III, Green Publishing Associates, Inc., John Wiley & Sons, Inc., New York, pp. 13.12.1-13.12.5にある。ポリ(A) RNAの選択は、たとえば、オリゴ−dTセルロースによる選択によって、または、代替方法として、全細胞RNAのオリゴ−dTプライミング逆転写によって行うことができる。一実施形態では、RNAの断片化を、当技術分野に知られている方法によって、たとえば、RNAの断片を生成するためのZnClによるインキュベーションによって、行うことができる。別の実施形態では、本発明によって分析するポリヌクレオチド分子は、cDNA、増幅したRNAまたはcDNAのPCR産物を含む。
一実施形態では、全RNA、mRNA、またはこれに由来する核酸を、乳癌にかかっている人から採取したサンプルから単離する。特定の細胞中では発現の少ない標的ポリヌクレオチド分子は、規準化技法を用いて濃縮することができる(Bonaldo et al., 1996, Genome Res. 6: 791-806)。
上で説明したように、標的ポリヌクレオチドを、1つまたは複数のヌクレオチドのところで検出可能に標識する。当技術分野に知られているどのような方法も、標的ポリヌクレオチドを検出可能に標識するために使用することができる。好ましくは、この標識化により、標識をRNAの長手方向に一様に組み込み、より好ましくは、標識化は高い効率で行う。この標識化のための一実施形態では、オリゴ−dTプライミング逆転写を使用して標識を組み込む。しかし、この方法の従来の諸方法は、3’末端の断片を生成する方向に偏っている。このため、好ましい一実施形態では、ランダムプライマー(たとえば、9mer)を逆転写において使用して、標識したヌクレオチドの一様な組み込みを標的ポリヌクレオチドの全長にわたって行う。あるいは、ランダムプライマーは、標的ポリヌクレオチドを増幅するために、PCR法またはT7プロモーターベースのin vitro転写方法と併せて使用することもできる。
好ましい一実施形態では、検出可能な標識は、発光標識である。たとえば、蛍光標識、生物発光標識、化学発光標識、および比色標識を、本発明では使用することができる。非常に好ましい一実施形態では、標識は、フルオレセイン、蛍燐光体、ローダミン、またはポリメチン色素誘導体などの蛍光標識である。市販の蛍光標識の例としては、たとえば、FluorePrime(ニュージャージー州Piscataway、Amersham Pharmacia)、Fluoredite(マサチューセッツ州Bedford、Millipore)、FAM(カリフォルニア州Foster City、ABI)、およびCy3またはCy5(ニュージャージー州Piscataway、Amersham Pharmacia)などの蛍光ホスホルアミダイトがある。別の実施形態では、検出可能な標識は、放射性標識したヌクレオチドである。
さらに好ましい一実施形態では、患者サンプルからの標的ポリヌクレオチド分子の標識化を、標準の標的ポリヌクレオチド分子とは異なる形で行う。この標準は、健常な個人(すなわち、乳癌にかかっていない個人)からの標的ポリヌクレオチド分子を含むことができる。非常に好ましい一実施形態では、この標準は、健常な個人からのサンプルまたは散発性タイプの乳房腫瘍を有する個人からの腫瘍サンプルからプールした標的ポリヌクレオチド分子を含む。別の実施形態では、標的ポリヌクレオチド分子は、同じ個人に由来するが、異なる時点で採取され、したがって、治療の有効性を、治療(すなわち、化学療法、放射線療法、または凍結療法)の間および後のマーカーの発現における変化、またはその欠如によって示すが、マーカーの発現が予後不良パターンから予後良好パターンへと変わることは、その治療が有効であることを示す。この実施形態では、異なる時点に異なる標識化を行う。
5.5.2.5 マイクロアレイへのハイブリダイゼーション
核酸のハイブリダイゼーションおよび洗浄の条件は、標的ポリヌクレオチド分子が、アレイの相補的ポリヌクレオチド配列に対して、好ましくは、その相補的DNAを配置してある特定のアレイ部位に対して、特異的に結合または特異的にハイブリダイズするように選ぶ。
二本鎖プローブDNAをその上に含むアレイを、好ましくは、変性条件にさらして、そのDNAの一本鎖化を、標的ポリヌクレオチド分子と接触させる前に行う。一本鎖プローブDNAを含むアレイ(たとえば、合成オリゴデオキシリボ核酸)は、標的ポリヌクレオチド分子との接触、たとえば、自己相補性配列のために形成されるヘアピンまたはダイマーの除去の前に、変性させる必要があることがある。
最適なハイブリダイゼーション条件は、プローブおよび標的核酸の長さ(たとえば、オリゴマーに対して200塩基を超えるポリヌクレオチド)およびタイプ(たとえば、RNAまたはDNA)に依存することになる。オリゴヌクレオチドが短くなると、その長さを調整して、満足なハイブリダイゼーション結果のために比較的一様な融解温度を達成することが必要になる可能性のあることが、当業者には理解されよう。核酸に対する特異的な(すなわち、ストリンジェントな)ハイブリダイゼーション条件に関する一般的なパラメータの記述が、Sambrookら, MOLECULAR CLONING - A LABORATORY MANUAL (2ND ED.), Vols. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York (1989)、およびAusubelら, CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, Vol. 2, Current Protocols Publisihng, New York (1994)にある。SchenaらのcDNAマイクロアレイに対する典型的なハイブリダイゼーション条件は、5×SSCおよび0.2%SDSの中での65℃で4時間のハイブリダイゼーションと、それに続く25℃で低ストリンジェンシー洗浄バッファー(1×SSCおよび0.2%SDS)中での洗浄と、それに続く25℃で高ストリンジェンシー洗浄バッファー(0.1×SSCおよび0.2%SDS)中での10分間とである(Schenaら, Proc. Natl. Acad. Sci. U.S.A. 93:10614 (1993))。有用なハイブリダイゼーション条件は、たとえば、Tijessen, 1993, HYBRIDIZATION WITH NUCLEIC ACID PROBES, Elsevier Science Publishers B.V.; およびKricka, 1992, NONISOTOPIC DNA PROBE TECHNIQUES, Academic Press, San Diego, CA.にも与えられている。
特に好ましいハイブリダイゼーション条件は、プローブの平均溶融温度またはその近く(たとえば、5℃以内、より好ましくは2℃以内)での温度で、1M NaCl、50mM MESバッファー(pH6.5)、0.5%サルコシンナトリウム、および30%ホルムアミド中のハイブリダイゼーションを含む。
5.5.2.6 シグナル検出およびデータ分析
蛍光標識したプローブの使用時には、マイクロアレイの各部位における蛍光発光を、好ましくは走査共焦点レーザー顕微鏡によって検出することができる。一実施形態では、適切な励起線を用いて、別個の走査を、使用している2種の蛍光体のそれぞれに対して行う。あるいは、2種の蛍光体に特異的な波長で試料の同時照射を可能とするレーザーを使用することができ、2種の蛍光体からの発光を同時に分析することができる(Shalonら, 1996, 「A DNA microarray system for anlyzying complex DNA samples using two-color fluorescent probe hybridization,」Genome Research 6:639-645を参照されたい。この全体を参照によりあらゆる目的に応じて組み込む)。好ましい一実施形態では、アレイの走査を、コンピュータ制御のX−Yステージおよび顕微鏡対物レンズ付きのレーザー蛍光スキャナーで行うことができる。2種の蛍光体の逐次励起が、マルチライン混合ガスレーザーによって達成され、放出された光は波長で分割し、2つの光増幅管で検出する。蛍光レーザー走査装置の記述は、Schenaら, Genome Res. 6:639-645 (1996)、および本明細書で引用する他の参考文献にある。あるいは、Fergusonら, Nature Biotech. 14:1681-1684 (1996)の記述する光ファイバー束を使用すると、mRNA存在量レベルを多数の部位で同時にモニターすることができる。
シグナルは記録し、好ましい一実施形態では、コンピュータによって、たとえば、12または16ビットのA/D変換ボードを用いて分析する。一実施形態では、走査した画像のノイズ除去(despeckle)をグラフィックスプログラム(たとえば、Hijaak Graphics Suite)を用いて行い、次いで、その解析を、平均のハイブリダイゼーションのスプレッドシートを波長ごと、部位ごとで作製する画像グリッド化プログラムを用いて行うことができる。必要な場合には、2種の蛍光体用のチャンネル間の「クロストーク」(またはオーバーラップ)に対する実験的に決定した補正を行うことができる。転写産物アレイ上のどの特定のハイブリダイゼーション部位に対しても、2種の蛍光体の放出の比を計算することができる。この比は、対応遺伝子(cognate gene)の発現レベルの絶対量とは独立であるが、発現が乳癌関連の異なる病態との関連で顕著に調節されている遺伝子には有用である。
5.6 コンピュータ支援分析
本発明では、さらに、上記のマーカーセットを含むキットを提供する。好ましい一実施形態では、キットは、標的ポリヌクレオチド分子に対するハイブリダイゼーションができるようになっているマイクロアレイ、および上で説明したデータ解析のためのソフトウェアを含む。
ここまでのセクションで説明した解析方法は、次のコンピュータシステムの使用により、次のプログラムおよび方法に従って、実行することができる。コンピュータシステムは、外部構成要素にリンクされた内部構成要素を含む。典型的なコンピュータシステムの内部構成要素は、主メモリと相互接続されるプロセッサ要素を含む。たとえば、コンピュータシステムは、好ましくは32MB以上の主メモリ付きのIntel 8086、80386、80486、Pentium(商標)またはPentium(商標)をベースとするプロセッサとすることができる。また、コンピュータシステムは、MacintoshまたはMacintoshベースのシステムとすることもできるが、ミニコンピュータまたはメインフレームとすることもできる。
外部構成要素は、マスストレージを含むことができる。このマスストレージは、1つまたは複数のハードディスクとすることができる(これは、通常、プロセッサおよびメモリと一緒に収容されている)。そのようなハードディスクは、好ましくは、ストレージ容量が1GB以上である。他の外部構成要素としては、「マウス」とすることができる入力装置、または他のグラフィック入力装置、および/またはキーボードとともに、モニターとすることができるユーザインターフェース装置がある。また、印刷装置もコンピュータに接続することが可能である。
通常、コンピュータシステムは、ネットワークリンクへとリンクすることもでき、これは、他のローカルコンピュータシステム、リモートコンピュータシステム、またはインターネットなどの広域通信ネットワークにリンクするイーサネットの一部とすることができる。このネットワークリンクにより、コンピュータシステムは、データおよび処理タスクを他のコンピュータシステムと共用することができる。
このシステムの動作中にメモリへとロードされるのが、いくつかのソフトウェアコンポーネントであるが、これは、当技術分野にとっては標準であり、本発明にとっては特別である。こうしたソフトウェアコンポーネントは、総量として、コンピュータシステムを本発明の方法に従って機能させる。こうしたソフトウェアコンポーネントは、通常、マスストレージ装置上に格納されている。あるソフトウェアコンポーネントは、オペレーティングシステムを含み、これはコンピュータシステムおよびそのネットワーク相互接続を管理する役目をもつ。このオペレーティングシステムは、たとえば、Windows 3.1、Windows 95、Windows 98、Windows 2000、またはWindows NTなどのMicrosoft Windows(登録商標)ファミリのものとすることができ、またはMacintosh OSファミリのものとすることもでき、またはUNIX、またはミニコンピュータまたはメインフレームに特有なオペレーティングシステムとすることもできる。このソフトウェアコンポーネントは、本発明に特有な方法を実行するプログラムを補助するために、このシステム上に存在することが好都合な、一般的な言語および機能を表現する。多くの高水準または低水準のコンピュータ言語が、本発明の解析方法をプログラムするのに使用可能である。命令は、ランタイム時に解釈実行、またはコンパイルすることができる。好ましい言語としては、C/C++、FORTRAN、JAVAがある。最も好ましくは、本発明の諸方法のプログラミングは、式を記号で入力し、使用すべきアルゴリズムの一部またはすべてを含めて、処理を高水準で指定することができるようにする数学ソフトウェアパッケージで行い、これにより、ユーザを、個々の式またはアルゴリズムを手続き的にプログラムする必要から解放する。そのようなパッケージとしては、Mathworks(マサチューセッツ州Natick)製のMathlab、Wolfram Research(イリノイ州Champaign)製のMathematica(登録商標)、またはMath Soft(マサチューセッツ州Cambridge)製のS−Plus(登録商標)がある。具体的には、ソフトウェアコンポーネントは、手続き型言語または記号パッケージでプログラムした本発明の解析方法を含む。
キットにともに含めることになるソフトウェアは、本明細書で開示する発明のデータ解析方法を含む。特に、このソフトウェアは、臨床カテゴリー(たとえば、ER状態)およびマーカー発現の間の類似度値の計算を含めて、マーカー発見のための数学的ルーチンを含むことができる。また、このソフトウェアは、サンプルマーカー発現と対照マーカー発現の間の類似度の計算を、アレイで生成した蛍光データを用いて、サンプルの臨床上の分類を決定するために行うための数学的ルーチンを含むことができる。
さらに、このソフトウェアは、特定の乳癌患者に対する予後の結果および推奨される治療法計画を決定するための数学的ルーチンを含むこともできる。そのようなソフトウェアは、その乳癌患者から得た乳癌腫瘍サンプル中の、表5に列挙してあるマーカー遺伝子のうちの5個以上の発現のレベル、対照またはテンプレート中の同じ遺伝子の発現の平均レベル、および、リンパ節およびER状態を含むその乳癌患者の臨床情報を含むデータ構造を受け取るための、そのコンピュータシステムのプロセッサ用の命令を含むはずである。このソフトウェアは、さらに、ハイブリダイゼーションデータの変換のための、およびその患者の乳癌腫瘍サンプルと対照またはテンプレート中のマーカー遺伝子に関する発現レベルの間の類似度の計算のための数学的ルーチンを含むことができる。具体的な一実施形態では、このソフトウェアは、患者の乳癌腫瘍サンプルと対照またはテンプレート中のマーカー遺伝子に関する発現レベルの間の類似度に相当し、類似度をその類似度尺度で表現する相関係数などの、類似度尺度を計算するための数学的ルーチンを含む。
このソフトウェアは、患者の臨床データおよびマーカー遺伝子発現データを統合し、治療方針を推奨する判断ルーチンを含むことになろう。一実施形態では、たとえば、このソフトウェアにより、プロセッサユニットは、患者の腫瘍サンプルに関する発現データを受け取り、こうした発現値と、テンプレートまたは対照中の同じ遺伝子に関する値の類似度の尺度を計算し、この類似度尺度を、予後群を識別する予備選択した1つまたは複数の類似度尺度閾値と比較し、患者を予後群に割り当て、その予後群に基づいて、推奨される治療法計画を指定することになる。具体的な一例では、このソフトウェアにより、さらに、プロセッサユニットは、乳癌患者についての臨床情報を含むデータ構造を受け取ることになる。より具体的な一例では、そのような臨床情報は、患者の年齢、乳癌の期、エストロゲン受容体の状態、およびリンパ節状態を含む。
対照が、一群の乳癌患者内でマーカー遺伝子に関する発現値を備えた発現テンプレートである場合、この対照は、患者の個々のハイブリダイゼーションデータと同時に(すなわち、同じハイブリダイゼーション実験で)得たハイブリダイゼーションデータを含むことができ、あるいは、コンピュータ上、またはコンピュータ可読媒体上に格納されるハイブリダイゼーションまたはマーカー発現値からなるセットとすることができる。後者を使用する場合、当初または追跡の調査時の腫瘍サンプル、あるいは腫瘍と疑われるサンプルから得た、選択したマーカー遺伝子に関する新しい患者のハイブリダイゼーションデータを、追加の対照ハイブリダイゼーションの必要なしに、同じ遺伝子に関する格納してある値と比較することができる。しかし、このソフトウェアは、さらに、対照データセットを更新するための、すなわち、追加の乳癌患者からの情報を追加しまたは既存の対照データセットのメンバを取り除くための、したがって、テンプレートを含む平均の発現レベルの値を再計算するためのルーチンを含むことができる。別の具体的な実施形態では、この対照は、コンピュータ可読媒体上に格納された、遺伝子のうちの少なくとも5個のそれぞれに対して、単チャンネルハイブリダイゼーション強度値の平均値からなるセットを含む。
乳癌患者に関する、本発明のコンピュータプログラム製品で使用する臨床データは、患者ごとの情報を別々のレコードで維持する、臨床データのデータベースに容れることができるが、レコードは、患者、患者の病歴、治療、予後、または、治験または臨床研究への参加に関するどのような情報も、初診の一部として生成した、または治療中に乳癌の進行をたどるための、発現プロファイルデータを含めて、含むことができる。
したがって、本発明の一実施形態では、乳癌患者を予後に従って分類するための、メモリおよびプロセッサを有するコンピュータと組み合わせて使用する、コンピュータプログラム製品を提供するが、このコンピュータプログラム製品は、コンピュータプログラム機構がその上にエンコードされているコンピュータ可読ストレージ媒体を含み、そのコンピュータプログラム製品は、コンピュータの1つまたは複数のメモリユニットへとロードすることができ、そのコンピュータの1つまたは複数のプロセッサユニットに次のステップを実行させることができる。すなわち、(a)前記乳癌患者から採取した細胞サンプル中の、マーカーが表5に列挙してある遺伝子のうちの少なくとも5個の発現のレベルを含む第1のデータ構造を受け取るステップ、(b)その少なくとも5個の遺伝子の発現のレベルの、その少なくとも5個の遺伝子の発現の対照レベルに対する類似度を決定し、患者類似度値を得るステップ、(c)その患者類似度値を、その遺伝子の発現のレベルの、発現の対照レベルに対する類似度の選択した第1と第2の閾値と比較して、それぞれ、第1と第2の類似度閾値を得るステップであって、第2の類似度閾値は、第1の類似度閾値よりも大きな、発現の対照レベルに対する類似度を示すステップ、(d)その乳癌患者を、患者類似度値が第1および第2の閾値類似度値を超える場合には、第1の予後を、患者類似度値が第1の閾値類似度値を超えるが、第2の閾値類似度値を超えない場合には、第2の予後を、患者類似度値が第1の閾値類似度値または第2の閾値類似度値を超えない場合には、第3の予後をもつものとして分類するステップである。このコンピュータプログラム製品の具体的な一実施形態では、類似度の第1の閾値および類似度の第2の閾値は、コンピュータに格納された値である。別のより具体的な実施形態では、第1の予後は「予後優良」であり、第2の予後は「予後中等度」であり、第3の予後は「予後不良」であり、コンピュータプログラム機構は、これをメモリへとロードすることができ、さらに、コンピュータの1つまたは複数のプロセッサユニットに、次のステップを実行させることができる。すなわち、乳癌患者に、その患者がリンパ節陰性であり、予後良好または予後中等度であると分類される場合には、補助化学療法を含まず、または、患者のリンパ節状態と発現プロファイルの組み合わせが他の任意のものである場合には、化学療法を含む治療法計画を指定するステップである。別の具体的な一実施形態では、コンピュータプログラム機構は、これをメモリへとロードし、さらに、コンピュータの1つまたは複数のプロセッサユニットに、乳癌患者に特有の臨床データを含むデータ構造を受け取るステップを実行させることができる。より具体的な実施形態では、臨床データは、その乳癌患者のリンパ節およびエストロゲン受容体(ER)の状態を含む。より具体的な実施形態では、単チャンネルのハイブリダイゼーション強度の値には、対数変換を行う。しかし、この方法のコンピュータ実行では、所望のどのような変換方法も使用することができる。別の具体的な実施形態では、コンピュータプログラム製品は、処理ユニットに比較ステップ(c)の実行を、乳癌患者から採取した細胞サンプル中の各遺伝子の発現レベルと対照中の同一の遺伝子の発現レベルとの間の差を計算することによって行わせる。別の具体的な実施形態では、コンピュータプログラム製品は、処理ユニットに、比較するステップ(c)の実行を、対照中の遺伝子のそれぞれの発現のレベルの対数の平均値を計算して、遺伝子ごとの対照平均値対数発現レベルを得ること、乳癌患者からの乳癌サンプル中の遺伝子のそれぞれに対する対数発現レベルを計算して、患者対数発現レベルを得ること、および、遺伝子のそれぞれに対する患者対数発現レベルと対照平均値対数発現の差を計算することによって行わせる。別の具体的な一実施形態では、コンピュータプログラム製品は、処理ユニットに、比較するステップ(c)の実行を、乳癌患者から採取した細胞サンプル中の遺伝子のそれぞれの発現のレベルと、対照中の同じ遺伝子の発現のレベルの間の、類似度値として表現される類似度を計算することによって行わせる。より具体的な実施形態では、この類似度値は相関係数である。しかし、この類似度値は、当技術分野に知られているどのような類似度尺度として表現することもできる。
例示的な実行形態では、本発明の諸方法を実施するために、ユーザは、まず、実験データをコンピュータシステムへとロードする。こうしたデータの入力は、ユーザが直接にモニター、キーボードから、またはネットワーク接続でリンクされた他のコンピュータシステムから、あるいは、CD−ROM、フロッピーディスク(例示せず)、テープドライブ(例示せず)、ZIP(登録商標)ドライブ(例示せず)などのリムーバブルストレージ媒体上で、またはネットワークを通して、行うことができる。次に、ユーザは、本発明の諸方法を実行する発現プロファイル解析ソフトウェアを実行させる。
別の例示的な実行形態では、ユーザは、まず、実験データおよび/またはデータベースをコンピュータシステムへとロードする。このデータのメモリへのロードは、ストレージ媒体またはリモートコンピュータから、好ましくは、動的な遺伝子セットデータベースシステムからネットワークを通して行う。次に、ユーザは、本発明の諸ステップを実行するソフトウェアを実行させる。
さらに、本発明のソフトウェアおよびコンピュータシステム製品で得て解析したデータは秘密であるため、ソフトウェアおよび/またはコンピュータシステムは、アクセス制御またはアクセス制御ルーチンを含む。
本発明の解析方法を実行するための代替のコンピュータシステムおよびソフトウェアは、当業者には明らかであると思われ、添付の特許請求の範囲の範囲内に包摂されるものとする。特に、添付の特許請求の範囲は、当業者に直ちに明らかと思われる、本発明の諸方法を実行するための代替のプログラム構造を含むものとする。
6.実施例
実験材料および方法
乳癌患者からの117個の腫瘍サンプルを収集した。次いで、RNAサンプルを用意し、各RNAサンプルのプロファイリングをインクジェット印刷したマイクロアレイを用いて行った。次いで、マーカー遺伝子の同定を、発現パターンに基づいて行った。次いで、これらの遺伝子を使用して分類器の訓練を行い、分類器で、これらのマーカー遺伝子を使用して腫瘍を診断および予後カテゴリーへと分類した。最後に、これらのマーカー遺伝子を使用して、個人からなるグループに対して診断および予後の結果を予測した。
1.サンプル収集
オランダ アムステルダムのThe Netherlands Cancer Institute/Antoni van Leeuwenhoek Hospitalで治療の行われた117例の乳癌患者を、次の臨床基準に基づいて選択した(NKI/AvL Tumor Register、Biometrics Departmentの医療記録から抽出したデータ)。
グループ1(n=97、78は訓練用、19は独立のテスト用)の選択は、次の基準に基づいて行った。すなわち、(1)原発浸潤性乳癌<5cm(T1またはT2)、(2)腋窩転移なし(N0)、(3)診断時の年齢<55歳、(4)診断の暦年 1983〜1996、(5)既往の悪性腫瘍なし(子宮頸部上皮内癌(carcinoma in situ of the cervix)または皮膚の基底細胞癌を除く)。患者全員の治療が、腋窩リンパ節廓清を含む、非定型的乳房切除術(modified radical mastectomy)(n=34)、または、乳房温存治療(n=64)によって行われた。乳房温存治療は、腫瘍の摘出、それに続く乳房全体に対する線量50Gyの照射、およびそれに続く15から25Gyまで変化するブースト照射(boost)からなっていた。5例の患者が化学療法(n=3)またはホルモン療法(n=2)からなる補助全身療法を受けたが、他の患者はすべて追加治療を受けなかった。患者すべての追跡が、少なくとも年1回、少なくとも5年間行われた。患者の追跡情報は、Biometrics DepartmentのTumor Registryから抽出した。
グループ2(n=20)の選択は、(1)BRCA1またはBRCA2における生殖系列突然変異の保持者、および(2)原発浸潤性乳癌を有するとして行った。選択または除外を、腫瘍の大きさ、リンパ節状態、診断時の年齢、診断時の暦年、他の悪性腫瘍に基づいて行わなかった。生殖系列突然変異の状態は、この研究プロトコルに先立って知られていた。
腫瘍サンプルを収集する個人についての情報は、生年、性別、その個人が閉経前か閉経後か、診断の年、陽性リンパ節の数およびリンパ節の総数、手術を受けたことがあるかどうか、またそうである場合、その手術が乳房保存であったか、根治的であったか、放射線療法、化学療法、またはホルモン療法を受けたかどうかを含む。腫瘍の採点は、P=TNMという式に従って行われ、ここで、Tは腫瘍の大きさ(0〜5のスケール上)であり、Nは陽性であるリンパ節の数(0〜4のスケール上)であり、Mは転移である(0=なし、1=あり)。また、腫瘍の分類は、期、腫瘍タイプ(in situか浸潤性か、小葉癌(lobular)か乳管癌(ductal)か、進行度)、および、エストロゲンおよびプロゲステロン受容体の存在または不在に従っても行われた。癌の進行の記述は(適用可能な場合に限り)、遠隔転移、遠隔転移した年、死亡した年、最後に追跡を行った年、およびBRCA1遺伝子型によって行われた。
2.腫瘍
末梢血リンパ球から単離したDNA上のBRCA1およびBRCA2の生殖系列突然変異試験は、BRCA1のエキソン11ならびにBRCA2のエキソン10および11のタンパク質末端切断試験(Protein Truncation Test:PTT)と、エキソン13および22のBRCA1ゲノム欠失の欠失PCR(deletion PCR)と、残りのエキソンの変性濃度勾配ゲル電気泳動(Denaturing Gradient Gel Electrophoresis:DGGE)による突然変異スクリーニングを含む。異常バンドはすべて、ABI3700自動シーケンサー上で解析したゲノム配列決定による確認、および独立のDNAサンプル上での確認を行った。
全例から、腫瘍材料の瞬間冷凍が、液体窒素中で術後1時間以内に行われた。冷凍された腫瘍材料から、H&E(ヘマトキシリン−エオジン)染色した切片を、RNA単離用のスライドの切断前後に調製した。これらのH&E冷凍切片の評価を、腫瘍細胞のパーセンテージに関して行い、腫瘍細胞が50%を超えるサンプルだけを、それ以降の研究用に選択した。
腫瘍すべてに関して、ホルムアルデヒド中で固定しパラフィンに埋め込んだ切除標本の評価を、標準の病理組織学的手順に従って行った。H&E染色したパラフィン切片を検査して、腫瘍タイプ(たとえば、小葉癌か乳管癌かのWHO分類による)の評価、組織学上の進行度のElstonおよびEllisの記述する方法による評価(進行度1〜3)、ならびに、リンパ管侵襲性増殖の存在および広範なリンパ球侵襲の存在の評価を行った。組織学的因子すべての評価は、2人の病理学者(MVおよびJL)が独立に行い、スライドを一緒に検査することによって相違に関するコンセンサスに達した。各腫瘍の代表となるスライドを使用して、エストロゲンおよびプロゲステロン受容体に対する抗体による免疫組織化学染色を標準の手順によって行った。染色の結果は、陽性染色された核のパーセンテージとして採点した(0%、10%、20%など、100%まで)。
3.増幅、標識化、およびハイブリダイゼーション
マーカー由来の核酸の産出および核酸のマイクロアレイへのハイブリダイゼーションの概要を、図2に示している。30個の厚さ30μMの冷凍切片を使用して、瞬間冷凍した腫瘍標本それぞれの全RNA単離を行った。全RNAの単離は、RNAzol(商標)B(オランダ Veenendaal、Campro Scientific)により、メーカーのプロトコルに従って、Polytron PT−MR2100(オランダ アムステルダム、Merck)を用いた組織のホモジナイゼーションを含めて行い、最後に、RNAse非含有の水の中で溶解させた。全RNAの品質評価は、A260/A280比が1.7と2.1の間になければならず、またアガロースゲル上のRNAの視認では、28SリボソームRNAバンドが、18SリボソームRNAバンドに比べて、より強く示されているべきであるとした。この後、25μgの全RNAのDNase処理を、Qiagen RNASE−free DNaseキットおよびRNeasyスピンカラム(ドイツ、Qiagen Inc,GmbH)を用いて、メーカーのプロトコルに従って行った。DNase処理した全RNAは、RNase非含有の水の中で溶解させ、最終的な濃度を0.2μg/μlとした。
5μgの全RNAを入力として使用して、cRNA合成を行った。T7 RNAポリメラーゼプロモーター配列を含むオリゴ−dTプライマーを使用して、第1鎖cDNA合成のプライミングを行い、ランダムプライマー(pdN6)を使用して、第2鎖cDNA合成のプライミングをMMLV逆転写酵素によって行った。この反応により、T7 RNAポリメラーゼ(T7RNAP)プロモーターを含む2本鎖cDNA配列を産出した。次いで、2本鎖cDNAのcRNAへの転写を、T7RNAPによって行った。
cRNAの標識化を、Cy3またはCy5染料により、2段法を用いて行った。まず、アリルアミン誘導体化ヌクレオチドを、cRNA産物の中に酵素的に組み込んだ。cRNA標識化のために、5−(3−アミノアリル)ウリジン5’−3リン酸(Sigma)とUTPの3:1混合物をUTPに、in vitro転写(IVT)反応で並べ換えした。次いで、アリルアミン誘導体化cRNA産物を、Cy3またはCy5(CyDye、Amersham Pharmacia Biotech)のN−ヒドロキシスクシンイミドエステルと反応させた。ある乳癌患者からの5μgのCy5標識したcRNAを、別々の散発性患者それぞれからの等量のcRNAプールからの同量のCy3標識した産物と混合した。
マイクロアレイハイブリダイゼーションは、蛍光体を入れ替えて2回ずつ行った。ハイブリダイゼーション前に、標識したcRNAを平均サイズ50〜100nt程度に断片化するために、10mM ZnClの存在下で60℃で加熱した。断片化したcRNAを、1M NaCl、0.5%サルコシンナトリウム、および50mM MESを含むpH6.5のハイブリダイゼーションバッファーに加え、そのストリンジェンシーの調節は、ホルムアミドを加えて最終濃度を30%にすることによって行った。ハイブリダイゼーションは、40℃での最終容積を3mlとして、ハイブリダイゼーションオーブン(Robbins Scientific)内の回転架台上で48時間行った。ハイブリダイゼーション後には、スライドを洗浄し、共焦点レーザースキャナー(Agilent Technologies)を用いて走査した。走査した画像上の蛍光強度の量子化、正規化、および較正を行った。
4.サンプルのプール形成
参照cRNAプールは、別々の散発性患者それぞれ(合計78個の腫瘍)からの等量のcRNAをプールすることによって形成した。
5.25kヒトマイクロアレイ
表面結合したオリゴヌクレオチドの合成は、基本的には、Blanchardら, Biosens. Bioelectron. 6(7):687-690 (1996)の提案するように行った。Hughesら, Nature Biotech. 19(4):342-347 (2000)も参照されたい。露出したヒドロキシル基を含む疎水性ガラス面(3インチ×3インチ)をヌクレオチド合成のための基層として使用した。ホスホルアミダイトモノマーを、ガラス面上のコンピュータで決定した位置へ、インクジェットプリンタのヘッドを用いて送達した。次いで、未反応のモノマーを洗浄で除去し、延長されたオリゴヌクレオチド末端の脱保護を行った。このモノマーの結合、洗浄、および脱保護のサイクルを、ヌクレオチド合成の所望の各層に対して繰り返した。プリントすべきオリゴヌクレオチド配列はコンピュータファイルによって指定した。
約25000個のヒト遺伝子配列を含むマイクロアレイ(Hu25Kマイクロアレイ)を、この研究のために使用した。マイクロアレイ用の配列は、RefSeq(非重複性(non−redundant)mRNA配列のコレクションであり、インターネット上のnlm.nih.gov/LocusLink/refseq.htmlにある)およびPhil Green EST contigsから選択した。後者は、ワシントン大学(University of Washington)のPhil Green博士が構築したESTコンティグのコレクションであり(EwingおよびGreen, Nat. Genet 25(2):232-4 (2000))インターネット上のphrap.org/est_assembly/index.htmlにおいて利用可能である。mRNAまたはESTコンティグは、それぞれ、Hu25Kマイクロアレイ上では、単一の60merオリゴヌクレオチドによって代表されていた。これは、基本的には、Hughesら, Nature Biotech. 19(4):342-347、ならびに、2001年1月25日公開の国際公開WO01/06013および2001年1月25日公開の国際公開WO01/05935に記載の通りであるが、ただし、オリゴスクリーニングに関する規則を修正して、Cが30%を超える、または連続C残基が6以上あるオリゴヌクレオチドを取り除いた点が異なる。
実施例1:乳癌腫瘍の制御が異なる遺伝子セットおよび全発現パターン
マイクロアレイ上に代表させた約25000個の配列のうち、サンプルからなる群にわたって有意に制御された約5000個の遺伝子からなる群を選択した。ある遺伝子を、乳房の癌に関する制御が有意に異なると決定したのは、その遺伝子が2倍を超える転写産物の変化を散発性腫瘍プールに比べて示した場合、および異なる制御に対するp値(Hughesら, Cell 102:109-126 (2000))が、98個の腫瘍サンプルのうち少なくとも5個において、上側または下側のどちらかで0.01未満であった場合である。
教師なしクラスター化アルゴリズムにより、本発明者らは、患者のクラスター化を、この約5000個の有意な遺伝子のセットの全体にわたって測定した、その類似度に基づいて行うことができた。2人の患者xおよびyの間の類似度を、
Figure 2006519591
と定義する。等式(5)で、xおよびyは、log比xおよびy(i=1、...、N=5100)という成分を有する2人の患者である。xのどの値にも誤差
Figure 2006519591
が付随する。
Figure 2006519591
の値が小さいほど、尺度xはより信頼できる。
Figure 2006519591
は、誤差加重算術平均である。相関を類似度の尺度として使用することにより、クラスター化において、共通制御の重要度が、制御の大きさよりも強調される。
約5000個の遺伝子のセットのクラスター化は、98個の腫瘍サンプルからなる群の全体にわたって測定したその類似度に基づいて行うことが可能である。2個の遺伝子の間の類似度は、この場合は遺伝子ごとにlog比測定値である98個の成分がある点を除き、等式(5)と同じように定義した。
そのような2次元クラスター化の結果を図3に示している。2つの異なるパターンが、このクラスター化から明らかになる。最初のパターンは、プロットの下部にある患者の群からなり、その制御は散発性プールとは非常に異なっている。もう一方のパターンは、プロットの上方の患者の群からなり、その発現は、散発性プールに比較して穏やかにしか制御されていない。これらの支配的なパターンから、この腫瘍を2つのはっきり別のタイプへと疑いなく分割することが、この約5000個の有意な遺伝子のセットに基づいて可能であることが示唆される。
こうしたパターンの理解を助けるために、これらをエストロゲン受容体(ER)、プロエストロゲン受容体(PR)、腫瘍進行度、リンパ球浸潤の存在、および脈管侵襲と関連付けた(図3)。図3の下の群は、支配的なパターンをなしているが、36人の患者からなる。39人のER陰性患者のうち、34人の患者をクラスター化してこの群にまとめた。図4から、エストロゲン受容体アルファ遺伝子ESR1の発現および共通制御された遺伝子の大きな群が、この発現パターンと一貫性をもつことが認められた。
図3および図4から、遺伝子発現パターンを使用すると、腫瘍サンプルを診断上本発明で対象となるサブグループへと分類できると結論した。したがって、98個の腫瘍サンプルの全体にわたって共通制御された遺伝子は、乳癌の分子的基盤についての情報を含んでいる。臨床データとマイクロアレイで測定したESR1の遺伝子存在量を組み合わせると、このはっきり別のタイプが、ER状態に関連し、または少なくともそれによって報告されることが示される。
実施例2:エストロゲン受容体(+)をエストロゲン受容体(−)の患者から識別する遺伝子マーカーの同定
この実施例で説明する結果により、2つの主要なタイプの腫瘍細胞、すなわち、「ER陰性」群と「ER陽性」群を識別する発現マーカー遺伝子の同定が可能になる。ER(+)の状態によるサンプルの識別は、4つのステップで達成される。すなわち(1)ERレベルと相関する候補マーカー遺伝子のセットの同定、(2)これらの候補遺伝子を相関の強さによって順位付けすること、(3)マーカー遺伝子の個数の最適化、および(4)サンプルをこれらのマーカー遺伝子に基づいて分類すること、である。
1.候補判別遺伝子の選択
第1のステップでは、候補判別遺伝子のセットの同定を、訓練サンプルの遺伝子発現データに基づいて行った。具体的には、本発明者らは、カテゴリー番号またはERレベルと、サンプルすべてにわたる対数発現比
Figure 2006519591
の間の相関係数ρを別々の遺伝子ごとに計算した:
Figure 2006519591
結果となる相関係数のヒストグラムを図5Aに灰色の線として示している。相関または逆相関の大きさは、大部分の遺伝子に対しては小さいが、一部の遺伝子に対しては0.5程度と大きい。発現比が、対象となる診断カテゴリーとよく相関または逆相関する遺伝子を、そのカテゴリーに対するレポーター遺伝子として使用する。
遺伝子で相関係数が0.3より大きい(「相関する遺伝子」)または−0.3より小さい(「逆相関する遺伝子」)ものを、レポーター遺伝子として選択した。0.3という閾値は、現実の相関が存在しないケースの相関の分布(並べ換え(permutation)を使用するとこの分布を決定できる)に基づいて選択した。統計的には、この分布幅は、相関の計算に使用するサンプルの数に依存する。対照ケース(現実の相関がない)の分布幅は、およそ
Figure 2006519591
であり、ここでnはサンプルの数である。本発明者らのケースでは、n=98である。したがって、0.3という閾値は、この分布における3−σにほぼ対応する(3×
Figure 2006519591
)。
2460個のそのような遺伝子が、この基準を満たすことが判明した。各遺伝子のERレベルとの相関係数の有意性を評価するために、ブートストラップ法を使用して、サンプルの遺伝子発現データとそのカテゴリーの間の連関をランダム化するモンテカルロデータを生成した。1回のモンテカルロ試行から得られる相関係数の分布を、図5Aに破線で示している。2460個のマーカー遺伝子をひとまとめにした有意性を評価するために、モンテカルロ法の実験10000回を生成した。10000回のそのようなモンテカルロ試行の収集データから、帰無仮説が形成される。モンテカルロデータを得るための同じ基準を満たす遺伝子の数は、実験毎に異なる。モンテカルロ法の実験10000回から得られる、相関係数が>0.3または<−0.3である遺伝子の数の頻度分布を図5Bに示している。平均値と最大値はどちらも、2460よりずっと小さい。したがって、この遺伝子群のER(+)とER(−)サンプルの間の判別遺伝子セットとしての有意性は、99.99%よりも大きいと推定される。
2.候補判別遺伝子の順位付け
第2のステップでは、候補リスト上にある遺伝子の順位付けを、各遺伝子の判別遺伝子としての有意性に基づいて行った。マーカーの順位付けは、相関の大きさによって、またはフィッシャー統計量に類似の尺度、すなわち
Figure 2006519591
を使用することによって行った。
等式(3)では、
Figure 2006519591
はER(−)内部の誤差加重log比の平均であり、
Figure 2006519591
はER(+)群内の誤差加重log比の平均である。σはER(−)群内のlog比の分散であり、nはlog比の測定値が有効であったサンプルの数である。σはER(+)群内のlog比の分散であり、nはlog比の測定値が有効であったサンプルの数である。等式(3)のt値は、2つの平均値の間の分散を補償した差を表す。候補リスト中の各遺伝子の有意水準の評価を、実際のデータセットから導出した帰無仮説に対して、ブートストラップ法を用いて行った。すなわち、多くの人工的データセットを、臨床データと遺伝子発現データの間の連関をランダム化することによって生成した。
3.マーカー遺伝子の数の最適化
判別遺伝子を最適化するために、一点除外法を使用して相互検証を行った。順位付けした候補リストからのマーカー遺伝子のセットでは、分類器(classifier)を97個のサンプルで訓練し、これを使用して残りのサンプルの状態を予測した。この手順をプール内のサンプルのそれぞれに対して繰り返し、抜き出した1個に対する予測が誤っているまたは正しい場合の数をカウントした。
一点除外相互検証からの上記の性能評価を、候補リストからより多くのマーカー遺伝子を順次追加することによって繰り返した。マーカー遺伝子の数の関数としての性能を図6に示している。第1種および第2種の過誤に対する過誤率は、使用したマーカー遺伝子の数によって変わったが、どちらも最小であったのは、マーカー遺伝子の数が550前後のときであった。したがって、この550個の遺伝子のセットが、乳癌腫瘍を「ER陰性」群と「ER陽性」群に分類するのに使用できるマーカー遺伝子の最適なセットとみられると本発明者らは考えた。図7に、患者をER(+)またはER(−)としてこの550個のマーカーセットに基づいて分類したものを示している。図8には、各腫瘍のER陰性テンプレートに対する相関と、各腫瘍のER陽性テンプレートに対する相関とを比較して示している。
4.マーカー遺伝子に基づく分類
第3のステップでは、分類器パラメータのセットの計算を、訓練データセットのタイプごとに、上記の順位付け方法のうちのどちらかに基づいて行った。ER(−)群(
Figure 2006519591
)に対するテンプレートの生成を、遺伝子からなる選択した群の誤差加重log比の平均を用いて行った。同様に、ER(+)群(
Figure 2006519591
と呼ぶ)に対するテンプレートの生成は、遺伝子からなる選択した群の誤差加重log比の平均を用いて行った。2つの分類器パラメータ(PおよびP)は、相関または距離に基づいて定義した。Pは、この遺伝子からなる選択した群全体にわたるあるサンプル
Figure 2006519591
とER(−)テンプレート
Figure 2006519591
の間の類似度の尺度である。Pは、この遺伝子からなる選択した群全体にわたるあるサンプル
Figure 2006519591
とER(+)テンプレート
Figure 2006519591
の間の類似度の尺度である。相関Pは、
Figure 2006519591
として定義される。
一点除外法を使用して、マーカー遺伝子に基づいて作製した分類器の相互検証を行った。この方法では、分類器を訓練するごとに、1個のサンプルを保留して相互検証を行った。550個の最適なマーカー遺伝子のセットに関して、分類器を98個のサンプルのうちの97個で訓練し、残りのサンプルの状態を予測した。この手順を、98人の患者のそれぞれについて行った。予測が誤ったまたは正しかったケースの数をカウントした。さらに、2460個の遺伝子のうちの約50個程度しかないサブセットでも、腫瘍のER(+)またはER(−)としての分類を、全セットを用いるのとほぼ同程度に行うことができると判断された。
少数のケースで、550個のマーカーセットによる分類と臨床上の分類との間に不一致が存在した。マイクロアレイで測定したESR1に関する発現のlog比を、患者ごとのER状態の臨床上の二分割の判定(陰性または陽性)と比較すると、測定した発現は、大部分の腫瘍に関して、臨床上の測定値の質的カテゴリー(2つの方法の混合)と一貫性をもつことがわかった。たとえば、臨床的にER(+)と診断された2人の患者は、実際に、マイクロアレイによる測定値からはESR1の低い発現を示し、550個のマーカー遺伝子でER陰性と分類された。さらに、臨床的にER(−)と診断された3人の患者は、マイクロアレイによる測定値からはESR1の高い発現を示し、同じ550個のマーカー遺伝子でER(+)と分類された。しかし、統計的には、マイクロアレイで測定したESR1の遺伝子発現は、臨床的に判定したER状態よりも支配的なパターンとよく相関していた。
実施例3:エストロゲン受容体(−)患者のうちでBRCA1腫瘍を散発性腫瘍から区別する遺伝子マーカーの同定
BRCA1突然変異は、乳癌腫瘍における主要な臨床カテゴリーの1つである。ER(−)群中の38人の患者の腫瘍のうち、17個がBRCA1突然変異を示し、21個は散発性腫瘍であった。このため、ER(−)群の中で17個のBRCA1突然変異の腫瘍を21個の散発性腫瘍から識別することのできる一方法を作製した。
1.候補判別遺伝子の選択
第1のステップでは、候補遺伝子のセットの同定を、これら38サンプルの遺伝子発現パターンに基づいて行った。本発明者らは、まず、BRCA1突然変異のカテゴリー番号と、発現比の間の相関の計算を、38個のサンプルすべてにわたって、個々の遺伝子ごとに、等式(2)を用いて行った。相関係数の分布を、実線で描いたヒストグラムとして図9Aに示している。本発明者らは、大部分の遺伝子はBRCA1突然変異の状態と相関しないが、遺伝子のある小さな群が有意なレベルで相関したことを認めた。相関係数のより大きな遺伝子は、ER(−)群の内部で、BRCA1突然変異保持者の腫瘍を散発性腫瘍から判別するレポーターとして役立つはずであることが見込まれる。
各相関係数の有意性を、そのような相関係数が偶然に得られる可能性があるという帰無仮説に対して評価するために、ブートストラップ法を使用して、サンプルの遺伝子発現データとそのカテゴリーの間の連関をランダム化するモンテカルロデータを生成した。マーカー遺伝子をひとまとめにした有意性を評価するために、そのようなモンテカルロ法の実験10000回を対照として生成した。(相関でも逆相関でも)相関係数の大きさの絶対値での0.35という閾値は、現実のデータとモンテカルロデータのどちらにも適用した。この方法に従えば、430個の遺伝子が、実験データに対するこの基準を満たすことが判明した。10000回のモンテカルロ試行に照らして見積もった有意性のp値は、約0.0048である(図9B)。すなわち、この430個の遺伝子のセットにBRCA1様腫瘍対散発性腫瘍についての有用な情報が含まれていた確率は、99%を超えている。
2.候補判別遺伝子の順位付け
第2のステップでは、候補リスト上の遺伝子の順位付けを、遺伝子それぞれの判別遺伝子としての有意性に基づいて行った。ここでは、本発明者らは、相関係数の大きさの絶対値を使用して、マーカー遺伝子の順位付けを行った。
3.判別遺伝子の最適化
第3のステップでは、この順位付けたリストの上位からの遺伝子からなるサブセットを使用して分類を行った。本発明者らは、BRCA1群テンプレート(
Figure 2006519591
と呼ぶ)を、遺伝子からなる選択した群の誤差加重log比の平均を用いて定義した。同様に、本発明者らは、非BRCA1群テンプレート(
Figure 2006519591
と呼ぶ)を、遺伝子からなる選択した群の誤差加重log比の平均を用いて定義した。2つの分類器パラメータ(P1およびP2)は、相関または距離に基づいて定義した。P1は、この遺伝子からなる選択した群全体にわたるあるサンプル
Figure 2006519591
とBRCA1テンプレート
Figure 2006519591
の間の類似度の尺度である。P2は、この遺伝子からなる選択した群全体にわたるあるサンプル
Figure 2006519591
と非BRCA1テンプレート
Figure 2006519591
の間の類似度の尺度である。相関に関しては、P1およびP2を等式(4)と同様に定義した。
判別遺伝子を最適化するために、一点除外法を使用して、相互検証を、実施例2に説明したように行った。順位付けた候補リストからのマーカー遺伝子のセットに関して、分類器を37個のサンプルで訓練し、残りの1個を予測した。この手順を、プール中のサンプルすべてに関して繰り返し、除外した1個に対する予測が誤っているまたは正しいケースの数をカウントした。
実行可能なサブセットを構成するマーカーの数を決定するために、一点除外法による相互検証からの上記の性能評価を、候補リストからマーカー遺伝子をさらに累積的に追加することによって繰り返した。性能を、マーカー遺伝子の数の関数として、図10に示している。第1種(偽陰性)および第2種(偽陽性)の過誤(BendatおよびPiersol, RANDOM DATA ANALYSIS AND MEASUREMENT PROCEDURES, 2ND ED., Wiley Interscience, p. 89)に関する過誤率が最適な範囲に達したのは、マーカー遺伝子の数が約100個のときであった。このため、約100個の遺伝子からなるセットが、ER(−)群内の腫瘍をBRCA1関連の腫瘍または散発性腫瘍として分類するのに使用できるマーカー遺伝子の最適なセットと考えられる。
最適な100個の遺伝子を用いた分類結果を図11Aおよび図11Bに示している。図11Aに示すように、散発性患者の共通制御パターンは、BRCA1患者のそれとは、主に制御の大きさの点で異なっている。1個の散発性腫瘍だけが、BRCA1群に分類された。散発性群の中の患者は、必ずしもBRCA1突然変異陰性ではない。しかし、散発性腫瘍のうち約5%だけは、実際にBRCA1突然変異保持者であると推定される。
実施例4:生存期間が>5年に対して<5年の散発性腫瘍患者を区別する遺伝子マーカーの同定
散発性乳癌患者からの78個の腫瘍を使用して、遺伝子発現データからの予後予測変数(predictor)の検討を行った。この散発性乳癌群の中の78個のサンプルのうち、44個のサンプルでは、最初の診察から5年以内に遠隔転移がなかった(「非遠隔転移群」)ことが臨床的に知られており、34個のサンプルでは、最初の診察から5年以内に遠隔転移があった(「遠隔転移群」)。この2つの群の間の識別を可能にした231個のマーカーからなる群、および最適には70個のマーカーからなる群を同定した。
1.候補判別遺伝子の選択
第1のステップでは、候補判別遺伝子のセットの同定を、これら78個のサンプルの遺伝子発現データに基づいて行った。予後カテゴリー番号(遠隔転移に対して遠隔転移なし)と対数発現比の間の相関の計算を、サンプル全てにわたって個々の遺伝子ごとに、等式(2)を用いて行った。相関係数の分布を、実線として図12Aに示している。また、図12Aには、1回のモンテカルロ実験の結果を破線として示している。本発明者らは、大部分の遺伝子が予後カテゴリーと相関していないにしても、遺伝子のある小さな群は相関していることを認める。相関係数のより大きな遺伝子は、対象となる予後、すなわち遠隔転移群と無遠隔転移群のレポーターとしてより有用なはずであることが見込まれる。
各相関係数の有意性を、そのような相関係数が偶然に得られる可能性があるという帰無仮説に対して評価するために、本発明者らは、ブートストラップ法を使用してモンテカルロ法実験10000回からのデータを対照として生成した(図12B)。次いで、本発明者らは、遺伝子で相関係数が0.3より大きい(「相関する遺伝子」)かまたは−0.3より小さい(「逆相関する遺伝子」)ものを選択した。同じ選択基準を、現実のデータとモンテカルロデータのどちらにも適用した。この比較を用いて、この基準を満たす、実験データからの231個のマーカーを同定した。患者を遠隔転移群と無遠隔転移群の間で判別するためのこの遺伝子セットがランダムなゆらぎで選ばれる確率は、約0.003である。
2.候補判別遺伝子の順位付け
第2のステップでは、候補リスト上の遺伝子の順位付けを、各遺伝子の判別遺伝子としての有意性に基づいて行った。具体的には、等式(3)で定義する、「フィッシャー(Fisher)」統計量に類似の尺度を、順位付けの目的で使用した。候補リスト中の各遺伝子の有意水準の評価を、実際のデータセットから導出した帰無仮説に対して、ブートストラップ法を用いて行った。また、候補リスト中の遺伝子は、相関係数の大きさによってランク付けすることもできる。
3.判別遺伝子の最適化
第3のステップとして、この順位付けたリストの上位から5個の遺伝子からなるサブセットを選択して、78個の腫瘍を「遠隔転移群」または「無遠隔転移群」へと分類する判別遺伝子として使用した。一点除外法を使用して相互検証を行った。具体的には、77個のサンプルにより、分類器の定義を、選択した判別遺伝子のセットに基づいて行い、これらを使用して残りのサンプルを予測した。この手順を繰り返しては78個のサンプルのそれぞれを予測した。予測が誤っていたまたは正しかった場合の数をカウントした。分類器の性能は、この選択した遺伝子セットに関する第1種および第2種の過誤率によって測定した。
本発明者らは、上記の性能評価手順を、その都度候補リストの上位からマーカー遺伝子をさらに5個くわえながら、231個の遺伝子すべてを使用するまで繰り返した。図13に示すように、第1種および第2種の過誤である誤った予測の数は、使用したマーカー遺伝子の数とともに劇的に変化する。組み合わせた過誤率が最小に達するのは、本発明者らの候補リストの上位から70個のマーカー遺伝子を使用したときであった。したがって、70個の遺伝子からなるこのセットが、散発性腫瘍患者の遠隔転移または無遠隔転移の群への分類に有用なマーカー遺伝子の、最適な、好ましいセットである。マーカーはより多くてもより少なくても予測変数として働くが、過誤率がより高くなるか統計的ノイズが持ち込まれるために、効率は劣る。
4.再発確率曲線
散発性乳癌腫瘍をもつ78人の患者の、2つのはっきり別のサブグループへの予後分類の予測を、70個の最適なマーカー遺伝子の発現に基づいて行った(図14および15)。
散発性患者の予後分類を評価するために、本発明者らは、残りの77人の患者で訓練した分類器からの患者それぞれの結果を、70個の最適なマーカー遺伝子によって予測した。図16では、2つの予測された群についての初診以来の時間の関数として遠隔転移の確率をプロットする。これら2つの再発曲線の間の差は有意である。χ検定(S-PLUS 2000 Guide to Statistics, vol. 2, MathSoft, p. 44)を使用すると、p値は約10−9と推定される。また、最初の診察からの時間の関数としての遠隔転移確率の比較を、ER(+)とER(−)の個人の間(図17)、PR(+)とPR(−)の個人の間(図18)、および腫瘍進行度の異なる個人の間(図19A、19B)で比較した。比較として、2つの予後群の間の差に関するp値は、臨床データに基づくものでは遺伝子発現データに基づくものよりもずっと有意でなく、範囲は10−3から1にわたる。
初診からの時間の関数としての再発確率をパラメータ表示するために、この曲線を、1種の生存時間モデル、「正規」モデル、すなわち
Figure 2006519591
に当てはめた。固定したα=1に対しては、無遠隔転移群の患者ではτ=125か月であり、遠隔転移群の患者ではτ=36か月であることを本発明者らは見出した。腫瘍進行度を使用すると、腫瘍進行度が1および2の患者ではτ=100か月であり、腫瘍進行度が3の患者ではτ=60であることを本発明者らは見出した。腫瘍進行度が利用可能な最良の予後予測変数であることは、臨床的に受け入れられている。しかし、70個のマーカー遺伝子に基づいて分類した2つの予後群の間の差は、利用可能な最良の臨床情報によって分類したそれよりもずっと有意である。
5.19例の独立の散発性腫瘍に対する予後予測
提案した予後分類器を確認し、70個の最適な予後マーカー遺伝子の再現性、頑健性、および予測力を保証するために、本発明者らは、The Netherlands Cancer Institute(NKI)で別個に調製された、散発性乳癌患者からの19例の独立の腫瘍サンプルに同じ分類器を適用した。使用したのは同じ参照プールであった。
19例の独立した散発性腫瘍の分類結果を、図20に示している。図20Aに示すのは、同じ70個の最適なマーカー遺伝子の発現制御のlog比である。本発明者らの分類器モデルに基づき、19(6+7)/78=3.2例の腫瘍の誤分類を本発明者らは予測した。これと一貫する形で、19例のうち(1+3)=4例の腫瘍が誤分類された。
6.1群としての臨床パラメータ対マイクロアレイデータ−ロジスティック回帰の結果
前のセクションでは、個々の臨床パラメータそれぞれの予測力を発現データのそれと比較した。しかし、臨床パラメータをすべて組み合わせてひとまとめにした上で、それを発現データと比較することのほうが、より意味がある。これには、多変量モデリングが必要であるが、選んだ方法は、ロジスティック回帰であった。また、そのような手法からは、どれだけの改善がマイクロアレイの手法により臨床データの結果に付け加えられるかが示される。
多変量モデリングに使用した臨床パラメータは、(1)腫瘍進行度、(2)ER状態、(3)プロゲストゲン受容体(PR)の存在または不在、(4)腫瘍サイズ、(5)患者の年齢、および、(6)脈管侵襲の存在または不在であった。マイクロアレイデータとしては、2つの相関係数を使用した。1つは、予後良好群(C1)の平均値に対する相関であり、もう1つは、予後不良群(C2)の平均値に対する相関である。所与の1人の患者に対する相関係数を計算するときには、この患者は、2つの平均値のどちらからも除外する。
ロジスティック回帰により、各入力パラメータの係数を最適化して、各患者の結果を最もよく予測するようにする。各入力パラメータの予測力を判断する1つの手法は、どれだけの逸脱度(deviance)(線形回帰におけるカイ2乗に似たものであり、たとえば、HasomerおよびLemeshow, APPLIED LOGISTIC REGRESSION, John Wiley & Sons, (2000)を参照されたい)をそのパラメータが占めるかによるものである。最良の予測変数は、逸脱度の大部分を占めるはずである。予測力の評価を公平に行うために、各パラメータのモデル化は独立に行った。マイクロアレイのパラメータは、逸脱度のほとんどを占めており、したがって強力な予測変数である。
次いで、臨床パラメータ、および2つのマイクロアレイパラメータを、ひとまとめにしてモニターした。6個の臨床パラメータの説明する逸脱度の合計は31.5であり、マイクロアレイパラメータの説明した逸脱度の合計は39.4であった。しかし、臨床データをまずモデル化し、2つのマイクロアレイパラメータを追加したときには、最終的な逸脱度は、57.0を占めている。
ロジスティック回帰により、ある患者が予後良好または不良群に属する尤度が計算される。図21Aおよび21Bに、感度と(1−特異性)の比較を示している。このプロットは、モデルの予測する尤度に対する閾値を変えることによって生成した。左上隅を通過する曲線が最良である(特異性が高くて感度が高い)。マイクロアレイは、臨床データの性能を大幅に上回った。たとえば、約80%に感度を固定すると、予後良好群では、特異性はマイクロアレイデータからは約80%であり、臨床データからは約65%であった。予後不良群では、対応する特異性は、やはり感度を80%に固定して、約80%および約70%であった。マイクロアレイデータを臨床データと組み合わせることにより、結果はさらに改善された。また、その結果は、図21Cの閾値の関数としての過誤率の合計として、示すことができる。可能な閾値すべてにおいて、マイクロアレイからの過誤率は、常に臨床データからのそれよりも小さかった。マイクロアレイデータを臨床データに追加することによって、過誤率はさらに低減され、これは図21Cに見ることができる通りである。
オッズ率表を、ロジスティック回帰の予測から作製することができる。ある患者が予後良好群に入る確率を、ロジスティック回帰により、入力パラメータ(臨床および/またはマイクロアレイ)の異なる組み合わせに基づいて計算した。患者を、次の4つの群に、予測と実際の結果に従って分けた。すなわち、(1)良好と予測し、実際に良好であった、(2)良好と予測したが、実際には不良であった、(3)不良と予測したが、実際には良好であった、(4)不良と予測し、実際に不良であった。群(1)および(4)は、正しい予測に相当するが、群(2)および(3)は、予測過誤に相当する。予測に関する境界は50%の確率のところに設定したが、他の閾値も使用することができる。結果を表8に示している。
表8からは、マイクロアレイプロファイリング(表8.3および8.10)の能力が、どの単一の臨床データ(表8.4〜8.9)および臨床データの組み合わせ(表8.2)よりも優れていることが明らかである。臨床データにさらにマイクロアレイプロファイリングを加えると、最良の結果が得られる(表8.1)。
また、マイクロアレイプロファイリングでは、類似の表(表8.11)をロジスティック回帰を使用しなくても作製することができる。この場合、予測は、単にC1−C2に基づいた(0を上回ると予後良好を意味し、0を下回ると予後不良を意味する)。
Figure 2006519591
Figure 2006519591
実施例5:診断目的のミニアレイの概念
診断および予後を目的とするマーカー遺伝子リスト上の遺伝子はすべて、小規模なマイクロアレイ上で、インクジェット技術を用いて合成することができる。遺伝子が診断および予後用のマイクロアレイは、それぞれまたはまとめて作製することができる。リスト上の各遺伝子は、ゲノム全体でのその配列の特有性に応じて、単一または複数のオリゴヌクレオチドプローブによって代表されている。この注文設計のミニアレイは、サンプル調製プロトコルと組み合わせて、診療所での診断/予後キットとして使用することができる。
実施例6:診断マーカー遺伝子の生物学的有意性
表3のBRCA1診断用の430個のマーカー遺伝子に関する利用可能な機能注解に関して、パブリックドメインの検索を行った。表3の430個の診断遺伝子は、2つの群に分けることができる。すなわち、(1)発現がBRCA1様群で高発現する196個の遺伝子、および、(2)発現が散発性群で高発現する234個の遺伝子である。196個のBRCA1群遺伝子のうちでは、94個が注解付きである。234個の散発性群の遺伝子のうちでは、100個が注解付きである。「T細胞」、「B細胞」、または「免疫グロブリン」という用語が、それぞれ、94個の注解付き遺伝子のうちの13個、および100個の注解付き遺伝子のうちの1個に関係している。マイクロアレイ上で代表された24479個の遺伝子のうち、現在、注解付き遺伝子は7586個ある。「T細胞」、「B細胞」、および「免疫グロブリン」は、これら7586個の遺伝子のうちの207個の中に見出される。これを前提にすると、BRCA1群中の13個の「T細胞」、「B細胞」、または「免疫グロブリン」遺伝子のp値は、非常に有意である(p値=1.1×10−6)。これに比べ、散発性群中に「T細胞」、「B細胞」、または「免疫グロブリン」に関する遺伝子1個の観察は、有意ではない(p値=0.18)。
BRCA1患者ではリンパ球(T細胞およびB細胞)遺伝子が高発現するという観察は、BRCA1乳癌が、散発性の症例よりも頻繁に著しいリンパ球浸潤と関連しているという、病理学からの知見と一致する(Chappuisら, 2000, Semin Surg Oncol 18:287-295)。
実施例7:予後マーカー遺伝子の生物学的有意性
231個の予後マーカー遺伝子(表5)に関する利用可能な機能注解の検索を行った。マーカーは2つの群に分かれる。すなわち、(1)発現が予後不良群で高発現する156個のマーカー、および(2)発現が予後良好群で高発現する75個の遺伝子である。156個のマーカーのうち、72個の遺伝子が注解付きであり、75個の遺伝子のうち、28個の遺伝子が注解付きである。
72個のマーカーのうちの12個が、ただし28個のマーカーのうちの0個が、キナーゼであるか、これに関連する。これとは対照的に、現在マイクロアレイ上の7586個の注解付き遺伝子のうち、471個だけがキナーゼに関与する。これを基にすると、予後不良群中の12個のキナーゼ関連のマーカーのp値は、有意である(p値=0.001)。キナーゼは、細胞の増殖、分化、およびアポトーシスを仲介する細胞内シグナル伝達経路の重要な調節因子である。その活性は、正常では、厳密に制御され調節されている。特定のキナーゼの過剰発現が発癌に関係していることはよく知られており、血管内皮増殖因子受容体1(VEGFR1またはFLT1)などがそれである。これは、予後不良群中のチロシンキナーゼの1つであり、腫瘍の血管新生において非常に重要な役割を果たす。興味深いことに、血管内皮増殖因子(VEGF)、すなわちVEGFRのリガンドも、予後群中にあり、これは、リガンドと受容体のどちらも、予後不良の個人においてアップレギュレーションが未知の機構によって行われていることを意味する。
同様に、72個のマーカーのうちの16個、および28個のマーカーのうちの2個だけが、ATP結合またはGTP結合のタンパク質であるか、これに関連する。これとは対照的に、現在マイクロアレイ上の7586個の注解付き遺伝子のうち、714個および153個だけが、それぞれ、ATP結合およびGTP結合に関与する。これを基にすると、予後不良群中の16個のGTPまたはATP結合関連のマーカーのp値は有意である(p値は0.001および0.0038)。したがって、72個のマーカーの内部のキナーゼおよびATPまたはGTP結合に関連のマーカーを、予後因子として使用することができる。
癌は、調節不全の細胞増殖を特徴とする。最も単純なレベルでは、これには細胞の分裂または有糸分裂が必要である。本発明者らは、キーワード検索により、「細胞分裂」または「有糸分裂」が、156個の予後不良マーカーからの72個のマーカー中、それぞれ7個の遺伝子の注解に含まれているが、75個の予後良好マーカーからの28個の注解付き遺伝子ではどれにも含まれていないことを見出した。注解のある7586個のマイクロアレイマーカーのうち、「細胞分裂」は62件の注解中にあり、「有糸分裂」は37件の注解中にある。こうした知見に基づいて、7個の細胞分裂または有糸分裂関連のマーカーが予後不良群中にあるp値は、高度の有意(p値=3.5×10−5)であると推定される。これと比較して、細胞分裂または有糸分裂関連のマーカーが予後良好群中に存在しないことは、有意ではない(p値=0.69)。したがって、この7個の細胞分裂または有糸分裂関連のマーカーを、予後不良に関するマーカーとして使用することができる。
実施例8:人工的参照プールの構築
上記の諸実施例での発現プロファイリング用の参照プールの作製は、散発性群中の個々の患者それぞれからの等量のcRNAを使用して行った。信頼でき、作製が簡単で、大量の参照プールを得るために、乳癌の診断および予後のための参照プールの構築を、マーカー遺伝子それぞれを代表する、またはそれに由来する合成核酸を用いて行うことができる。個々の患者サンプルに関するマーカー遺伝子の発現をモニターする際、突き合わせを行うのは、この参照プールのみであり、他の患者に由来するプールではない。
参照プールを作製するには、60merオリゴヌクレオチドを、60merインクジェットアレイプローブ配列に従って診断/予後レポーター遺伝子ごとに合成し、次いで2本鎖とし、pBluescript SKベクター(カリフォルニア州La Jolla、Stratagene)中に、T7プロモーター配列に隣接してクローニングする。個々のクローンを単離し、そのインサートの配列を、DNA配列決定によって検証する。合成RNAを生成するために、クローンをEcoRIで線状とし、T7によるin vitro転写(IVT)反応をMegaScriptキット(テキサス州オースチン、Ambion)に従って行う。IVTに続いて、該産物のDNase処理を行う。合成RNAは、RNeasyカラム(カリフォルニア州Valencia、Qiagen)上で精製する。こうした合成RNAの転写、増幅、標識化、および混合を行って、参照プールを作製する。その合成RNAの存在量は、本物の腫瘍プール中のマーカー由来の対応する転写産物の存在量を近似するように調整する。
実施例9:単チャンネルデータおよび保存値で表わしたサンプルプールの使用
1.保存値の参照プールの作製(「数学的サンプルプール」)
上で、実施例1〜7に使用した比ベースのデータの使用には、物質的な参照サンプルが必要である。上記の諸実施例では、散発性腫瘍サンプルのプールを参照として使用した。そのような参照の使用は、頑健な予後および診断の予測を可能にするが、プールは通常限られた資源であるために、問題となる可能性がある。このため、物質的なサンプルプールを必要としない分類器方法を開発し、この予測および診断の技法の臨床上の応用における適用をより簡単なものとした。
単チャンネルデータが使用できるかどうかを検査するために、次の手順を開発した。まず、実施例4で説明した70個の最適な遺伝子に関する、実験材料および方法で説明した78個の散発性の訓練サンプルからの単チャンネル強度データを、散発性サンプル対腫瘍プールのハイブリダイゼーションデータから選択した。78個のサンプルは、予後良好である患者からの44個のサンプルおよび予後不良である患者からの34個のサンプルからなっていた。次に、これらサンプルに対するハイブリダイゼーション強度の正規化を、同じマイクロアレイ上の生物学的スポットすべての強度の中央値で割ることによって行った。サンプルあたり複数のマイクロアレイを使用したところでは、平均をそのマイクロアレイのすべてにわたって取った。対数変換を、70個の遺伝子のそれぞれに関する強度データに対して、または、2個以上のマイクロアレイをハイブリダイズしたところでは、70個の遺伝子それぞれに関する平均の強度に対して行い、78個の散発性サンプルにわたる遺伝子ごとの平均対数強度を計算した。サンプルごとに、こうして計算した平均対数強度を、個々のサンプルの対数強度から差し引いた。次いで、この数値、すなわち平均対数(強度)差を、等式(5)への代入によって、その分類器に対する2色log(比)として扱った。新しいサンプルに対しては、平均対数強度を上記と同じように差し引き、平均対数(強度)差を計算した。
ハイブリダイズした遺伝子ごとに1セットの平均対数強度を作製することにより、量の限られた「物質的サンプルプール」に取って代わる「数学的サンプルプール」が作製される。次いで、この数学的サンプルプールを、手元にあるサンプルおよび将来収集されるサンプルを含めて、どのようなサンプルにも適用することができる。この「数学的サンプルプール」は、サンプルがさらに利用可能になり次第、更新が可能である。
2.結果
数学的サンプルプールにより、サンプル参照プールに等価な機能が果たされることを実証するために、平均対数(強度)差(単チャンネルデータ、数学的プールに対するもの)とlog(比)(ハイブリダイゼーション、サンプルプールに対するもの)を比較して、70個の最適なレポーター遺伝子に関して、78個の散発性サンプルにわたってプロットし、これを図22に示している。比と単チャンネル量は、相関が高く、これは、どちらも遺伝子発現の相対的変化を報告するだけの能力があることを示している。次いで、分類器の構築を、平均対数(強度)差を用いて、実施例4のような、比のデータを用いたときに従ったのとまったく同じ手順に従って行った。
図23Aおよび23Bに示すように、単チャンネルデータでは、サンプルの分類が遺伝子発現パターンに基づいてうまく行われた。図23Aには、単チャンネルハイブリダイゼーションデータを用いた予後に従って区分したサンプルを示している。白い線により、予後不良(下側)および予後良好(上側)であると分類した患者からのサンプルを分離している。図23Bには、各サンプルの発現データが予後良好(白丸)または不良(黒四角)の分類器パラメータと相関するので、各サンプルがプロットされている。「一点除外」相互検証法を用いた分類器からの予測は、予後良好である患者からの44個のサンプルからの10個の偽陽性、および予後不良である患者からの34個のサンプルから6個の偽陰性であった。ただし、ここでは予後不良を「陽性」とみなしている。この結果は、それぞれ44個のうちで7個を、34個のうちで6個を予測した、比ベースの分類器の使用に匹敵する。
臨床上の応用では、偽陰性がほとんどなく、結果的に治療の不十分な患者が減少することが非常に望ましい。この優先度にその結果が適合するように、分類器の構築を、患者サンプルを「予後良好」テンプレートに対する相関係数に従ってランク付けし、この相関係数に関する閾値を選ぶのに約10%の偽陰性、すなわち、予後不良である患者からのサンプルを予後良好である患者からのものと分類することを許すようにして行った。本明細書で使用した34個の予後不良サンプルのうちでは、これは、34人のうち誤って分類した3人の予後不良患者を許容することに相当する。この許容限界は、「予後良好」テンプレートに対する相関係数0.2727という閾値に対応する。この閾値を用いた結果を図24Aおよび図24Bに示している。図24Aに示すのは、予後良好分類器との相関係数に従ってランク付けした、サンプルに対する単チャンネルハイブリダイゼーションデータである。「予後良好」と分類されたサンプルは白い線より上にあり、「予後不良」と分類されたサンプルは白い線より下にある。図24Bに示すのは、サンプル相関係数の散布図であり、3個の誤って分類されたサンプルは閾値である相関係数の値より右側にある。この閾値を用いると、分類器の偽陽性の割合は、44個の予後良好サンプル中15個であった。この結果は、比ベースの分類器の44個中12個という過誤率と比べ、それほど異なるわけではない。
まとめると、70個のレポーター遺伝子は、予後について頑健な情報を担っており、単チャンネルデータは、腫瘍の結果の予測を、比ベースのデータとほとんど同じぐらい良好に行えるが、臨床の状況ではより好都合である。
実施例10:70個の最適な遺伝子の予測力の臨床予測変数との比較、および3つの予後カテゴリーの開発
本発明者らは、インクジェット合成したオリゴヌクレオチドマイクロアレイを用いて、乳癌における予後に関連する遺伝子発現プロファイルを定義してきた。この遺伝子発現プロファイルを同定するために、55歳未満のリンパ節陰性患者からの5cm未満の腫瘍を使用した。驚くべきことに、70遺伝子ベースの分類器の能力は、5年以内の遠隔転移の予測において、臨床パラメータすべてよりも優れていた。遺伝子発現パターンに基づく「予後不良」対「予後良好」シグネチャ群の転移に関するオッズ比は、相互検証手順により、約15であると推定された。こうした結果は非常に有望ではあったが、この最初の研究の限界は、こうした結果を引き出し、テストを行ったのが、結果のために選択した患者からなる2群、すなわち、5年以内に遠隔転移を発生させた患者からなる群と、少なくとも5年間無疾患のままであった患者の群であったことである。
予後シグネチャに関連づけられている転移のリスクのより正確な推定を提供し、遺伝子発現プロファイルが臨床的に有意義なツールであることをさらに実証するために、リンパ節陰性と陽性どちらの患者も含む295人の若い乳癌患者のコホート研究を行った。その知見からは、予後プロファイルが、現在使用されている基準より強力な疾患結果の予測変数であることが確認される。
1.乳房腫瘍の選択基準
腫瘍295例の逐次系列を、Netherlands Cancer Institute(NKI)の新たに凍結された組織バンクから、次の患者選択基準に従って選択した。すなわち、病理所見で5cm未満の原発浸潤性乳癌(pT1またはpT2)、陰性の鎖骨下リンパ節生検によって決定される腫瘍陰性の上腋窩リンパ節、診断時年齢52歳以下、診断の暦年1984〜1995、および、既往の悪性腫瘍なしである。患者すべての治療は、腋窩リンパ節廓清を含む、非定型的乳房切除術(modified radical mastectomy)または乳房温存術(breast conserving surgery)と、必要な場合にはこれに続く放射線療法により行われていた。295個の腫瘍サンプルは、リンパ節陰性(病理所見pN0)の患者から採取した151個、および144人のリンパ節陽性(pN+)患者のものを含んでいた。151人中10人のリンパ節陰性患者および144人中120人のリンパ節陽性患者に、化学療法(n=90)、ホルモン療法(n=20)、またはその両方(n=20)からなる補助全身療法が施されていた。患者すべての追跡が、少なくとも年1回、少なくとも5年間行われた。患者の追跡情報は、NKI Medical Registryから抽出した。転移を第1の事象としない患者270人の追跡期間中央値が、7.8年(範囲は0.05〜18.3)であるのに対して、追跡期間中転移を第1の事象とする患者88人では、2.7年(0.3〜14.0)であった。295人の患者すべてに対する追跡期間中央値は6.7年(0.05〜18.3)である。欠失データはなかった。この研究は、Netherlands Cancer Instituteの医療倫理委員会(Medical Ethical Committee)によって承認された。
臨床病理的パラメータの決定は、上で、実験材料および方法で説明したように行った。エストロゲン受容体(ER)の発現の評価を、マイクロアレイ実験から得たハイブリダイゼーション強度によって行った。このアッセイを用いて、295例の腫瘍サンプルのコホートが、69例のER陰性(ER_log10強度比が−0.65ユニット未満であり、免疫組織化学による染色が陽性となる核が10%未満であることに対応する)および226例のER陽性の腫瘍を含むものと判定した。組織学的進行度の評価は、ElstonおよびEllis, Histopathol. 19(5):403−410 (1991)で記述されている方法を用いて行った。脈管侵襲(vascular invasion)の評価は、無(−)、小(1〜3本の脈管、+/−)、大(>3本の脈管)とした。
2.RNA単離とマイクロアレイ発現プロファイリング
RNA単離、cRNA標識化、25Kオリゴヌクレオチドマイクロアレイ、およびハイブリダイゼーション実験は、実験材料および方法で説明した通りであった。発現比にp値を割り当てる統計誤差モデルは、実施例4に説明した通りであった。ハイブリダイゼーション後に、スライドを洗浄し、共焦点レーザースキャナー(Agilent Technologies)を用いて走査した(Hughesら, Nat. Biotechnol. 19(4):342-347 (2001)を参照されたい)。
3.マイクロアレイデータとこれまでに決定された予後プロファイルとの相関
乳癌患者からなる逐次系列中の遺伝子発現プロファイルの予後上の価値の決定を、実施例4で説明した実験によって同定した70個のマーカー遺伝子を用いて行った。この逐次系列を得るために、70個の遺伝子の予後プロファイルの構築に使用した訓練系列の一部でもあった、pN0患者のうちの61人も含めた。これらの患者を除外することは選択バイアスとなる。その理由は、第1の系列が、5年以内に遠隔転移を発生させた患者を不釣り合いなほど多数含んでいたためである。この295個の腫瘍サンプルのコホート中の234個の新しい腫瘍のそれぞれに対して、本発明者らは、予後良好の患者(C1)の腫瘍中での、70個の遺伝子の発現と、以前に決定したこれら遺伝子の平均プロファイルとの相関係数を計算した(実施例4を参照されたい)。次いで、相関係数>0.4である腫瘍(偽陰性を10%許した78個の腫瘍からなる訓練セットで以前に決定した閾値)を、「予後良好」シグネチャ群に割り当て、他の腫瘍すべては「予後不良」シグネチャ群に割り当てた。61人の以前に使用したpN0患者による過剰適合(overfitting)を避けるために、性能の相互検証を行った相関係数を使用して、予後分類を閾値となる相関係数の値を0.55(この相互検証済みの分類器の10%偽陰性に対する閾値に対応する)として行った。
4.統計的分析
無遠隔転移確率の分析では、第1の事象が遠隔転移であった患者は失敗としてカウントした。この他の患者は、すべて、最終追跡の日付、非乳癌による死亡、局所局部再発、または、対側乳癌を含む第2の原発性悪性腫瘍の時点で打ち切った。期間の開始は手術の日付からとした。無転移の曲線を、カプラン−マイヤーの方法を用いて描き、ログランク検定を用いて比較した。無転移のパーセンテージの標準誤差(SE)の計算には、Tsiatisの方法(Klein, Scand. J. of Statistics 18:333-340 (1991))を用いた。
比例ハザード回帰分析(Cox, J. R. Statist. Soc. B 34:187-220 (1972))を使用して、相関係数C1と転移の間の連関を他の変数に関して調整した。SEの計算には、サンドイッチ推定量(sandwich estimator)(LinおよびWei, J. Amer Stat. Assoc. 84:1074-1079 (1989))を用いた。組織学的進行度、脈管侵襲、および腋窩リンパ節転移の数(0対1〜3対≧4)を変数として使用した。ln(相対ハザード)と、腫瘍径、年齢、およびERの発現レベルの間の関係の線形性の検定には、制限付き3次スプラインの非線形成分に関するWald検定(Therneauら、Biometrika 77:147-160 (1990))を用いた。非線形性に関する根拠は見出されなかった(年齢:p=0.83、腫瘍径:p=0.75、陽性のリンパ節の数:p=0.65、およびER発現レベル:p=0.27)。ハザードの非比例性の検定には、GrambschおよびTherneauの方法(GrambschおよびTherneau, Biometrika 81:515-526 (1994))を用いた。さらに、C1については、5年後の追跡の前と後のln(ハザード比)の間の差の検定を、Wald検定を用いて行った。計算にはすべて、Splus2000またはSplus6統計パッケージを用いた。
5.295個の乳癌の予後シグネチャ
295個の腫瘍のそれぞれから、全RNAを単離し、これを使用してcRNAを生成し、これを標識化し、約25000個のヒト遺伝子を含むマイクロアレイへとハイブリダイズした(実験材料および方法を参照されたい)。走査した画像の蛍光強度の定量化および正規化を行って、遺伝子の転写産物の存在量を、組み合わせた腫瘍すべての等量のcRNAから作ったcRNAの参照プールと比べた強度比として出力した。この研究で295個の腫瘍すべてに関して以前に決定した70個の予後マーカー遺伝子の遺伝子発現比を、図25Aに示している。以前に決定した閾値(点線)より上の(すなわち、それより相関係数が大きい)腫瘍を、「予後良好」カテゴリー(n=115)に割り当てた。この線よりも下の腫瘍は、「予後不良」カテゴリー(n=180)に割り当てた。図25Bに示すのは、第1の事象としての遠隔転移までの期間(黒い点)、または他の患者すべてに関する追跡期間である(灰色の点、方法を参照されたい)。図25Cには、295人の患者すべてに関するリンパ節状態、遠隔転移、および生存状況を示している。図25A、25B、および25Cを比較することによって、予後良好シグネチャを有することと(早期)遠隔転移または死亡が見られないことの間に強い相関があることがわかる。リンパ節陰性と陽性の患者は偏りなく分布しており、これは、予後プロファイルがリンパ節状態とは独立であることを示している。
表9に要約して示しているのは、予後プロファイルと臨床パラメータの間の連関であり、これから、予後プロファイルは、組織学的進行度、ER状態、および年齢とは関連するが、腫瘍径、脈管侵襲、陽性リンパ節の数、または治療とは有意には関連しないことがわかる。
Figure 2006519591
Figure 2006519591
6.遺伝子発現シグネチャの予後上の価値
無遠隔転移確率および総合生存率の計算を、腫瘍が「予後良好」または「不良」シグネチャを有する患者すべてに関して行った(図26Aおよび26B、表10)。その結果のカプラン−マイヤー曲線で示されているのは、「予後良好」と「予後不良」シグネチャの患者の間の転移率および総合生存率における大きな差である。第1の事象としての転移では、全追跡期間にわたる「不良」と「良好」シグネチャの対比に関するハザード比(HR)は、5.1と推定される(95%信頼区間(CI):2.9〜9.0、p<0.0001)。予後プロファイルは、最初の5年間(HR 8.8、95%CI:3.8〜20、p<0.0001)では、5年後の1.8というHR(95%CI:0.69〜4.5、p=0.24)に比べ、はるかに有意であった。総合生存率に関するHRは、8.6である(95%CI:4〜19、p<0.0001)。
最初に、予後プロファイルの同定をリンパ節陰性患者からなる選択した群の内部で行った。ここで、本発明者らは、予後シグネチャのリンパ節陰性と陽性の患者のどちらにもおける性能を決定したいと考えていた。(295人の患者コホートのうちの)151人のリンパ節陰性患者の系列では、予後プロファイルの性能は、疾患の結果の予測の点できわめてよかった(図26C、26D、表10)。患者からなるこの群では、遠隔転移を発生させるHRは5.5である(95%CI 2.5〜12.2、p<0.0001)。本発明者らのこれまでの研究の5年以内の転移発生に関する本発明者らの推定したオッズ比を検証するために(相互検証したオッズ比は15(95%CI 4〜56、p<0.0001))、本発明者らは、依然と同じ手法で選択した新しいpN0患者67人に関するオッズ比を計算した(5年以内の遠隔転移のある(n=12)、または少なくとも5年間の追跡を行って無疾患のままであった(n=55)患者)。この検証セットでの5年以内の転移に関する予後分類器のオッズ比は、15.3であり(95%CI 1.9〜125、p=0.011)(2分割表(2x2 table)、データは示さず)、これは本発明者らのこれまでの知見とよく一致する。腫瘍からなる2つのセット上で性能に関する結果がこのように一貫していることにより、予後プロファイルの価値およびプロファイリング技術の頑健さが浮き彫りになる。重要なことに、リンパ節陽性患者144人からなる残りの群でも、予後プロファイルは、結果と強く関連していた(図26E、26F、表10)。ここで、遠隔転移を発生させることに関するハザード比は、4.5である(95%CI 2.0〜10.2、p=0.0003)。
Figure 2006519591
7.多変量解析
第1の事象としての遠隔転移の多変量解析の結果を、年齢、直径、陽性リンパ節の数、進行度、脈管侵襲、ER発現、治療、および遺伝子発現プロファイルを含めて、表11に示している。70個の遺伝子の発現プロファイル、腫瘍径、および補助化学療法だけが、独立の予測変数であった。これら患者が治療を受けた期間中、閉経前のリンパ節陽性患者の大部分が補助化学療法を受けた。リンパ節陰性患者は、普通、補助療法を受けていなかった。生存率に改善がみられたのは、この腫瘍の症例中では、補助化学療法を受けた患者であった。70個の遺伝子の発現プロファイルは、全体のハザード比が4.6で(95%CI 2.3〜9.2、p<0.0001)、遠隔転移に対する抜群に強力な予測変数である。これは意外ではない。というのも、予後プロファイルは、5年以内に全員が遠隔転移を発生させた患者からの腫瘍に基づいて確立されたものだからである。
Figure 2006519591
また、予後プロファイルは、リンパ節陽性患者からなる群の内部で遠隔転移を発生させることに対する強い予測変数でもある(図26E、26Fを参照されたい)。リンパ節転移の存在自体は、生存率が不良であることの強い予測変数なのであるから、これは注目すべきことである。本発明者らの研究ではリンパ節陽性乳癌の患者はほとんどが補助化学療法または補助ホルモン療法を受けていた(144人中120人の患者)ため、未治療のリンパ節陽性患者におけるプロファイルの予後上の価値を与えることは可能ではない。しかし、補助化学療法を受けた患者とそうでない患者の間で予後プロファイルの予後上の価値に差があることを示すものはなにもない(データは示さず)。
1つの重要な問題は、予後プロファイルが、補助全身療法に対する適格性を判定するための臨床上のツールとして、現在使用されている「St.Gallen」および「NIHコンセンサス」基準よりも、有用かどうか、ということである。これらの基準は、組織学的および臨床的特徴に基づいている(Goldhirschら、Meeting Highlights: International Concensus Panel on the Treatment of Primary Breast Cancer, Seventh International Conference on Adjuvant Therapy of Primary Breast Cancer, J. Clin. Oncol. 19(18):3817-3827 (2001);Eifelら, National Institutes of Health Consensus Development Conference Statement; Adjuvant Therapy for Breast Cancer, November 1-3, 2000, J.Natl. Cancer Inst. 93(13):979-989 (2001)を参照されたい)。図27に、151人のリンパ節陰性患者に関する無転移のカプラン−マイヤー曲線を示してあり、患者の「予後良好/低リスク」または「予後不良/高リスク」としての分類は、予後プロファイル(図27A)、「St.Gallen」(図27B)、または「NIHコンセンサス」基準(図27C)を用いて行った。
この比較から、大きな結論を2つ引き出すことができる。第1に、予後プロファイルにより、従来の方法よりもずっと多くのpN0患者が低リスク群に割り当てられている(「プロファイル」では38%であるのに対して、「St.Gallen」では15%、「NIHコンセンサス」では7%)。第2に、発現プロファイリングによって同定した低リスク患者は、「St.Gallen」または「NIHコンセンサス」基準によって分類した患者よりも無転移生存率がよい。逆に、患者の発現プロファイルに従って高リスクと分類した患者は、高リスクの「St.Gallen」または「NIHコンセンサス」の患者よりも、遠隔転移をよりしばしば発生させる傾向がある。このことは、「St.Gallen」と「NIH」基準により、かなりの数の患者が誤分類されていることを示している。実際、「NIHコンセンサス」基準によって定義される高リスク群は、「予後良好」シグネチャおよび対応する結果を有するかなりの数の患者を含んでいる(図27E)。逆に、低リスクのNIH群は、「予後不良」のシグネチャおよび結果を有する患者を含んでいる(図27G)。類似のサブグループを、「St.Gallen」の低および高リスク患者の内部に同定することができる(図27D、27F)。「St.Gallen」と「NIH」サブグループは、どちらも誤分類された(予後シグネチャによってよりよく同定できる)患者を含むということは、こうした患者は、現在の臨床体制では、過剰に、または不十分に治療されていることになる。
腫瘍の大きさは、「NIHコンセンサス」基準において補助療法の選択のために使用されている主要なパラメータである。しかし、上のデータ(表9を参照されたい)は、遠隔転移を発生させる能力は、腫瘍の大きさには部分的にしか依存しないことを示しており、多くの腫瘍で転移能力が、早期の、固有の遺伝的特性であることを示唆している。
「予後良好群」は、治療法の異なる2つの群に下位区分することができる。サブグループの決定は、平均プロファイルと予後良好腫瘍との相関における別の閾値を用いて行った。予後良好と相関するマーカーを同定した初期の研究で(実施例4を参照されたい)、本発明者らは、相関係数が0.636を上回る(すなわち、発現プロファイルが最も強く「予後良好」群の平均発現プロファイルと相関する)腫瘍は、遠隔転移を発生させていないことを見出した。このことは、78人の患者の腫瘍サンプルに関して経験的に決定したが、それを、ランク付けしたリスト中で、それを上回ると患者が遠隔転移を発生させない相関係数を決定することによって行った(データは示さず)。このため、これまでに「予後良好」シグネチャを有すると同定した腫瘍のうちで、相関係数が0.636を超えた腫瘍を、「予後優良」シグネチャを有するものとして分類した。腫瘍中にそのような「予後優良」シグネチャを有するこうした患者(図28A〜28F、上の線)は、疾患の結果が、「予後中等度」シグネチャ(「予後良好」シグネチャを有する残りの患者であり、相関係数は0.4と0.636の間、図28A〜28F、中央の線)を有する患者よりも、さらによい。このことは、コホート全体(図28A、28B)、ならびに、リンパ節陰性(図28C、28D)および陽性の患者で、別々にあてはまる(図28E、28F)。
以上を併せて、本発明者らのデータが示しているのは、予後プロファイルが、リンパ節陰性の閉経前の患者を補助全身療法に関して選択するツールとして、現在使用されているコンセンサス基準よりも正確であり、リンパ節陽性の患者において補助療法の指針を与えるのに有用でさえある可能性がある、ということである。本発明者らは、特定のマーカー発現シグネチャに基づく次の治療法を提案するものである。すなわち、
(1)腫瘍が「予後優良」シグネチャを有するリンパ節陰性の患者は、補助全身療法なしで治療することが可能である。
(2)腫瘍が「予後中等度」シグネチャを有するリンパ節陰性の患者は、補助ホルモン療法だけで治療することが可能である。「予後中等度」シグネチャを有する腫瘍の97%がER陽性であることから、この群の患者は、補助ホルモン治療から利益を受けるはずである。この患者群の治療法に化学療法を追加しても、生存率にはわずかしか有益でないと思われる。
(3)この他の患者はすべて、補助化学療法を受けるべきである。腫瘍がER+である場合には、ホルモン療法も推奨される。
乳癌診断における予後プロファイルの使用を実施することにより、補助全身治療は改善され、患者に合ったものとなり、過剰な、および不十分な治療が低減されるはずである。
7.引用した参考文献
本明細書中に引用した参考文献はすべて、本明細書に参照によりその全体をあらゆる目的に応じて組み込むが、その程度は、個々の刊行物または特許または特許出願それぞれに参照によりその全体をあらゆる目的に応じて組み込むと具体的かつ個別に示してある場合と同様とする。
本発明の多くの改変および変形を、その精神および範囲から逸脱することなく行えるが、これは当業者には明らかであろう。本明細書に説明した具体的な諸実施形態は、例として提供しているのに過ぎず、本発明の限定は、添付の特許請求の範囲と並んでそのような特許請求の範囲が権利を付与される均等物の全範囲によってのみ行われる。
図1は、2,460個のERマーカー、430個のBRCA1/散発性マーカー、および231個の予後用レポーターを含めた、本明細書中で開示したマーカーのセット間の重複を示すベン図である。 図2は、本研究で使用した乳癌腫瘍中のmRNA転写量の示差的変化を測定する実験手順を示す図。各実験において、1つの腫瘍XからのCy5標識したcRNAを、腫瘍1、2、...NからのcRNAサンプルから作製したCy3標識したcRNAプールと共に25kのヒトマイクロアレイ上にハイブリダイゼーションさせる。スキャニングおよび画像処理によってデジタル発現データを得た。誤差モデリングによってそれぞれの転写率の測定値にp値を割り当てることができた。 二次元クラスター化により2つの明白に異なる腫瘍の種類が明らかになる。クラスター化は、98個の乳癌腫瘍における4986個の有意な遺伝子の遺伝子発現データに基づいた。濃い灰色(赤色)はアップレギュレーションを示し、薄い灰色(緑色)はダウンレギュレーションを示し、黒色は発現に変化がなかったことを示し、灰色はデータが入手不可であることを示す。5回を超える実験数において2倍を超える発現率の変化を示した4986個の遺伝子を選択した。BRCA1突然変異、エストロゲン受容体(ER)、およびプロエストロゲン受容体(PR)の試験結果、腫瘍進行度、リンパ球浸潤、ならびに脈管侵襲についての選択した臨床データを右側に示す。黒色は陰性を示し、白色は陽性を示す。下部の主要なパターンは36人の患者からなり、そのうち34人がER陰性(計39)であり、16人がBRCA1突然変異保有者(計18)である。 図3に示した教師なしクラスター化の結果の一部である。ESR1(エストロゲン受容体遺伝子)が、強く同時調節されて主要なパターンを形成している一セットの遺伝子と同時調節されている。 図5Aは、有意な遺伝子におけるその発現率とエストロゲン−受容体(ER)の状態(すなわちERレベル)との相関係数を示すヒストグラムである。実験データのヒストグラムを灰色の線として示す。1回のモンテカルロ試験の結果を黒い実線で示す。その発現データがER状態と0.3を超えるレベルで相関するか、または−0.3より低いレベルでER状態と逆相関する遺伝子が、2,460個存在する。図5Bは10,000回のモンテカルロ試験から同じ選択基準(0.3を超える相関の大きさ)を満たした遺伝子数の分布を示す図である。2,460個の遺伝子のこのセットは、p>99.99%の信頼水準でER状態を示すと推定される。 分類器において使用した(2,460個の中から)マーカー遺伝子数の関数としての、分類の第1種および第2種の過誤率を示す図である。合わせた過誤率は約550個のマーカー遺伝子を使用した場合に最も低い。 550個の最適なマーカー遺伝子の発現レベルに基づいて、98個の腫瘍サンプルをER(+)またはER(−)とする分類を示す図である。ER(+)サンプル(白線より上)は、ER(−)サンプル(白線より下)とは明らかに異なる発現パターンを示す。 各患者由来のサンプル中の発現レベルとER(−)群の平均プロファイルとの相関対ER(+)群との相関を示す図である。正方形は臨床的にER(−)である患者由来のサンプルを表し、点は臨床的にER(+)である患者由来のサンプルを表す。 図9Aにおいて、それぞれの有意な遺伝子の遺伝子発現率とBRCA1突然変異の状態との相関係数を示すヒストグラムを実線として示す。破線は1回のモンテカルロ試験から得た頻度分布を示す。430個の遺伝子が0.35より高い大きさの相関または逆相関を示した。図9Bは、10,000回のモンテカルロ試験対照において0.35より高い大きさの相関または逆相関を示す遺伝子数の頻度分布を示す図である。平均=115p(n>430)=0.48%およびp(>430/2)=9.0%。 分類器において使用した判別用遺伝子(テンプレート)の数の関数としての、分類の第1種および第2種の過誤率を示す図である。合わせた過誤率は約100個の判別用マーカー遺伝子を使用した場合に最も低い。 図11Aは、100個の判別用マーカー遺伝子の最適なセットを用いて行った、ER(−)群中の38個の腫瘍を、2つのサブグループ、すなわちBRCA1および散発性とする分類を示す図である。白線より上の患者はBRCA1に関連するパターンによって特徴づけられている。 図11Bは、各ER(−)患者由来のサンプル中の発現レベルとBRCA1群の平均プロファイルとの相関対散発性群との相関を示す図である。正方形は散発性型の腫瘍を有する患者由来のサンプルを表し、点はBRCA1突然変異を保有する患者由来のサンプルを表す。 図12Aにおいて、それぞれの有意な遺伝子の遺伝子発現率と予後用のカテゴリー(遠隔転移群および無遠隔転移群)との相関係数のヒストグラムを実線として示す。1回のモンテカルロ試験から得た分布を破線で示す。231個のマーカー遺伝子の相関または逆相関の大きさは0.3より高い。図12Bは、10,000回のモンテカルロ試験において、相関または逆相関のその大きさが0.3より高かった遺伝子の数の頻度分布を示す図である。 分類器において使用した判別用遺伝子数の関数としての、遠隔転移群の分類の第1種および第2種の過誤率を示す図である。合わせた過誤率は約70個の判別用マーカー遺伝子を使用した場合に最も低い。 70個の判別用マーカー遺伝子の最適なセットを用いて行った、78個の散発性腫瘍を、2つの予後用の群、すなわち遠隔転移あり(予後不良)および遠隔転移なし(予後良好)とする分類を示す図である。白線より上の患者は予後良好によって特徴づけられている。白線より下の患者は予後不良によって特徴づけられている。 各患者由来のサンプル中の発現レベルと予後良好群の平均プロファイルとの相関対予後不良群との相関を示す図である。正方形は予後不良である患者由来のサンプルを表し、点は予後良好である患者由来のサンプルを表す。黒四角は「再発した」患者を表し、灰色の点は「再発していない」患者を表す。78人のうち計13人の分類が誤っていた。 診断以降の時間の関数としての、再発の確率を示す図である。グループAおよびグループBは、70個の判別用マーカー遺伝子の最適セットに基づいた一点除外法を用いることによって予測した。グループA中の43人の患者は、無遠隔転移群からの37人の患者および遠隔転移群からの6人の患者からなる。グループBの35人の患者は、遠隔転移群からの28人の患者および無遠隔転移群からの7人の患者からなる。 ER(+)(あり(yes))またはER(−)(なし(no))の個体における、診断以降の時間の関数としての遠隔転移の確率を示す図である。 プロゲステロン受容体(PR)(+)(あり(yes))またはPR(−)(なし(no))の個体における、診断以降の時間の関数としての遠隔転移の確率を示す図である。 図19Aは、診断以降の時間の関数としての遠隔転移の確率を示す図である。腫瘍進行度によってグループを定義した。 図19Bは、診断以降の時間の関数としての遠隔転移の確率を示す図である。腫瘍進行度によってグループを定義した。 図20Aは、70個の最適なマーカー遺伝子を用いて行った、19例の個別の散発性腫瘍を、2つの予後用の群、すなわち遠隔転移ありおよび遠隔転移なしとする分類を示す図である。白線より上の患者は予後が良好である。白線より下の患者は予後が不良である。 図20Bにおいて、各患者の発現率と予後良好群の平均発現率との相関は、訓練セット対各患者の発現率と予後不良の訓練セットの平均発現率との相関によって定義される。予後良好群の9人の患者のうち3人が「遠隔転移群」からであり、予後良好群の10人の患者のうち、1人の患者が「無遠隔転移群」からである。この19人中4人の過誤率は、最初の78人の患者における78人中13人と一貫している。 図20Cは、2つの群について、最適な70個のマーカー遺伝子の発現に基づいて予測した診断以降の時間の関数としての再発の確率を示す図である。 図21Aは、予後良好の分類における感度対1−特異性を示す図である。 図21Bは、予後不良の分類における感度対1−特異性を示す図である。 図21Cは、モデリングした尤度の閾値の関数としての総過誤率を示す図である。6つの臨床的パラメータ(ER状態、PRの状態、腫瘍進行度、腫瘍の大きさ、患者の年齢、および脈管侵襲の存在又は不在)を用いて臨床的モデリングを行った。 78個の散発性腫瘍サンプル中の70個のレポーター遺伝子について、「物的サンプルプール」を用いた個々のサンプルの対数(比)対「数学的サンプルプール」を用いた平均対数(強度)差の比較を示す図である。「物的サンプルプール」は、78個の散発性腫瘍サンプルから構築した。 図23Aは、単チャンネルデータに基づいた「一点除外」交差検証の結果を示す図である。サンプルは、各サンプルにおける、検査した70個の遺伝子の平均「予後良好」プロファイルおよび平均「予後不良」プロファイルに対する相関係数に従ってグループに分ける。白線によって患者由来のサンプルを予後不良(下)および予後良好(上)に分類する。 図23Bは、「予後良好」サンプルおよび「予後不良」サンプル中の平均発現量の相関係数を示す散布図である。偽陽性率(すなわち、予後良好の患者由来であるサンプルを予後不良の患者由来であると不正確に分類する率)は44個中10個であり、偽陰性率は34個中6個である。 図24Aは、予後良好の分類器を用いて相関係数に従って順位付けしたサンプルの、単チャンネルハイブリダイゼーションのデータを示す図である。「予後良好」と分類されたサンプルは白線の上に示され、「予後不良」と分類されたサンプルは下に示される。 図24Bは、サンプルの相関係数を示す散布図であり、3つの不正確に分類されたサンプルが閾値相関係数の値の右側に示される。偽陰性をサンプルの約10%に制限するために閾値の相関値を0.2727に設定した。 図25Aは、295個の乳癌の逐次系列における、70個の最適な予後用マーカー遺伝子(実施例4参照)の遺伝子発現パターンを示す図である。それぞれの列は1つの腫瘍における70個のマーカー遺伝子の予後用プロファイルを表し、それぞれのカラムは1つの遺伝子の相対的な発現量を表す。濃い灰色は、参照mRNA(すべての腫瘍サンプルからプールしたmRNA)と比較して当該腫瘍中でmRNA発現が高いことを表し、薄い灰色は、参照mRNAと比較して発現が低いことを表す。水平の点線は、予後良好および予後不良のシグネチャサブグループ間の事前に決定した仕切りである。予後が良好な患者(C1)の腫瘍中の平均プロファイルに対するその相関に従って腫瘍を順位づけ、相関が最も高い腫瘍をプロットの上部に示す。図25Bは、最初の事象としての遠隔転移までの時間(黒色の点)またはすべての他の患者について経過観察の時間(灰色の点)を年単位で示す図である。図25Cは、選択した臨床的特徴を示す:リンパ節状態(黒=pN+、白=pN0);最初の事象としての転移(黒=あり、白=なし);死亡(黒=あり、白=なし)。 図26は、295人の乳癌患者のコホートのカプランマイヤープロットである。図26Aは、「予後良好」(n=115、上側の線)および「予後不良」(n=180、下側の線)シグネチャに従った、295人の患者すべてにおける転移が存在しない確率を示す。図26Bは、「予後良好」および「予後不良」シグネチャに従った295人の患者すべてにおける全体的な生存率を示す。プロットのそれぞれで、「良好シグネチャ」の患者(上側の線;上側の数字の列)または「不良シグネチャ」の患者(下側の線;下側の数字の列)において、転移が存在しない患者数(図26A、C、E)または生存した患者数(図26B、D、F)、および情報が入手可能な者についてはどの時点(年数)におけるものかを示す。それぞれのプロットにおいて、Pは対数順位検定のP値を表す。 図26は、295人の乳癌患者のコホートのカプランマイヤープロットである。図26Cは、295人の腫瘍コホート内のリンパ節陰性患者において転移が存在しない確率を示す。図26Dは、リンパ節陰性患者における全体的な生存率を示す。プロットのそれぞれで、「良好シグネチャ」の患者(上側の線;上側の数字の列)または「不良シグネチャ」の患者(下側の線;下側の数字の列)において、転移が存在しない患者数(図26A、C、E)または生存した患者数(図26B、D、F)、および情報が入手可能な者についてはどの時点(年数)におけるものかを示す。それぞれのプロットにおいて、Pは対数順位検定のP値を表す。 図26は、295人の乳癌患者のコホートのカプランマイヤープロットである。図26Eは、リンパ節陽性患者において転移が存在しない確率を示す。図26Fは、リンパ節陽性患者における全体的な生存率を示す。プロットのそれぞれで、「良好シグネチャ」の患者(上側の線;上側の数字の列)または「不良シグネチャ」の患者(下側の線;下側の数字の列)において、転移が存在しない患者数(図26A、C、E)または生存した患者数(図26B、D、F)、および情報が入手可能な者についてはどの時点(年数)におけるものかを示す。それぞれのプロットにおいて、Pは対数順位検定のP値を表す。 図27は、295人の腫瘍コホート内の151人のリンパ節陰性乳癌患者において転移が存在しない確率を示すカプランマイヤープロットである。図27Aは、70個の最適なマーカー遺伝子(すなわち「予後良好」および「予後不良」シグネチャ;実施例4参照)を用いた分子プロファイリングによって同定した、「予後良好」および「予後不良」群における転移が存在しない確率を示す。それぞれの時点(年数;図26の説明参照)においてリスクのある患者を、各プロット中に「良好シグネチャ」患者(上側の線;上側の数字の列)または「不良シグネチャ」患者(下側の線;下側の数字の列)について示す。Pは対数順位検定のP値を表す。 図27は、295人の腫瘍コホート内の151人のリンパ節陰性乳癌患者において転移が存在しない確率を示すカプランマイヤープロットである。図27Bは、「St.Gallen」基準によって同定した、「低リスク」および「高リスク」群における転移が存在しない確率を示す。それぞれの時点(年数;図26の説明参照)においてリスクのある患者を、各プロット中に「良好シグネチャ」患者(上側の線;上側の数字の列)または「不良シグネチャ」患者(下側の線;下側の数字の列)について示す。Pは対数順位検定のP値を表す。 図27は、295人の腫瘍コホート内の151人のリンパ節陰性乳癌患者において転移が存在しない確率を示すカプランマイヤープロットである。図27Cは、「NIHコンセンサス」基準によって同定した、「低リスク」および「高リスク」シグネチャ群における転移が存在しない確率を示す。それぞれの時点(年数;図26の説明参照)においてリスクのある患者を、各プロット中に「良好シグネチャ」患者(上側の線;上側の数字の列)または「不良シグネチャ」患者(下側の線;下側の数字の列)について示す。Pは対数順位検定のP値を表す。 図27は、295人の腫瘍コホート内の151人のリンパ節陰性乳癌患者において転移が存在しない確率を示すカプランマイヤープロットである。図27Dは、プロファイリングによって「予後良好」および「予後不良」シグネチャ群に分類した「St.Gallen」「高リスク」群(n=129)を示す。それぞれの時点(年数;図26の説明参照)においてリスクのある患者を、各プロット中に「良好シグネチャ」患者(上側の線;上側の数字の列)または「不良シグネチャ」患者(下側の線;下側の数字の列)について示す。Pは対数順位検定のP値を表す。 図27は、295人の腫瘍コホート内の151人のリンパ節陰性乳癌患者において転移が存在しない確率を示すカプランマイヤープロットである。図27Eは、プロファイリングによって「予後良好」および「予後不良」シグネチャ群に分類した「NIH」「高リスク」群(n=140)を示す。それぞれの時点(年数;図26の説明参照)においてリスクのある患者を、各プロット中に「良好シグネチャ」患者(上側の線;上側の数字の列)または「不良シグネチャ」患者(下側の線;下側の数字の列)について示す。Pは対数順位検定のP値を表す。 図27は、295人の腫瘍コホート内の151人のリンパ節陰性乳癌患者において転移が存在しない確率を示すカプランマイヤープロットである。図27Fは、プロファイリングによって「予後良好」および「予後不良」シグネチャ群に分類した「St.Gallen」「低リスク」群(n=22)を示す。それぞれの時点(年数;図26の説明参照)においてリスクのある患者を、各プロット中に「良好シグネチャ」患者(上側の線;上側の数字の列)または「不良シグネチャ」患者(下側の線;下側の数字の列)について示す。Pは対数順位検定のP値を表す。 図27は、295人の腫瘍コホート内の151人のリンパ節陰性乳癌患者において転移が存在しない確率を示すカプランマイヤープロットである。図27Gは、プロファイリングによって「予後良好」および「予後不良」シグネチャ群に分類した「NIH」「低リスク」群(n=11)を示す。それぞれの時点(年数;図26の説明参照)においてリスクのある患者を、各プロット中に「良好シグネチャ」患者(上側の線;上側の数字の列)または「不良シグネチャ」患者(下側の線;下側の数字の列)について示す。Pは対数順位検定のP値を表す。 図28は、「予後優良」、「予後中等度」、および「予後不良」の群に分類された295人の乳癌患者のカプランマイヤープロットである。図28Aは、「予後優良」、「予後中等度」および「予後不良」シグネチャに従った、295人の患者すべてにおける転移が存在しない確率を示す。図28Bは、「予後優良」、「予後中等度」、および「予後不良」シグネチャに従った、295人の患者すべてにおける全体的な生存率を示す。それぞれの時点(年数;図26の説明参照)においてリスクのある患者を、各プロット中に「予後優良」シグネチャ患者(上側の線;上側の数字の列)、「予後中等度」シグネチャ患者(真中の線;真中の数字の列)または「予後不良」シグネチャ患者(下側の線;下側の数字の列)の患者について示す。Pは対数順位検定のP値を表す。 図28は、「予後優良」、「予後中等度」、および「予後不良」の群に分類された295人の乳癌患者のカプランマイヤープロットである。図28Cは、同様に分類されたリンパ節陰性患者における転移が存在しない確率を示す。図28Dは、このように分類されたリンパ節陰性患者における全体的な生存率を示す。それぞれの時点(年数;図26の説明参照)においてリスクのある患者を、各プロット中に「予後優良」シグネチャ患者(上側の線;上側の数字の列)、「予後中等度」シグネチャ患者(真中の線;真中の数字の列)または「予後不良」シグネチャ患者(下側の線;下側の数字の列)の患者について示す。Pは対数順位検定のP値を表す。 図28は、「予後優良」、「予後中等度」、および「予後不良」の群に分類された295人の乳癌患者のカプランマイヤープロットである。図28Eは、このように分類されたリンパ節陽性患者における転移が存在しない確率を示す。図28Fは、このように分類されたリンパ節陽性患者における全体的な生存率を示す。それぞれの時点(年数;図26の説明参照)においてリスクのある患者を、各プロット中に「予後優良」シグネチャ患者(上側の線;上側の数字の列)、「予後中等度」シグネチャ患者(真中の線;真中の数字の列)または「予後不良」シグネチャ患者(下側の線;下側の数字の列)の患者について示す。Pは対数順位検定のP値を表す。

Claims (28)

  1. 予後に従って乳癌患者を分類するための方法であって、
    a.前記乳癌患者から採取した細胞サンプル中の、そのマーカーが表5に記載されている少なくとも5個の遺伝子のそれぞれの発現レベルと、前記少なくとも5個の遺伝子のそれぞれの対照発現レベルとの類似度を決定することにより、患者の類似度値を得るステップ、
    b.前記少なくとも5個の遺伝子のそれぞれの前記発現レベルと前記対照発現レベルとの類似度の選択した第1および第2の閾値を与えることによって、それぞれ第1および第2の類似度の閾値を得るステップであって、前記第2の類似度の閾値が前記対照に対して前記第1の類似度の閾値よりも高い類似度を示すステップ、ならびに
    c.前記患者の類似度値が前記第1および前記第2の類似度の閾値を超える場合は、前記乳癌患者を第1の予後を有すると分類し、前記遺伝子の前記発現レベルが前記第1の類似度の閾値を超えるが前記第2の類似度の閾値を超えない場合は、第2の予後を有すると分類し、前記遺伝子の前記発現レベルが前記第1の類似度の閾値も前記第2の類似度の閾値も超えない場合は第3の予後を有すると分類するステップ、
    を含む方法。
  2. ステップ(a)の前に、前記少なくとも5個の遺伝子の前記発現レベルを決定することをさらに含む、請求項1に記載の方法。
  3. ステップ(a)における前記決定を、前記乳癌患者から採取したサンプル中の前記少なくとも5個の遺伝子のそれぞれの発現レベルと、初診から5年以内に乳癌が再発しなかった複数の乳癌患者中の前記少なくとも5個の遺伝子のそれぞれの発現レベルとの間の類似度の程度を決定することを含む方法によって実施する、請求項1に記載の方法。
  4. ステップ(a)における前記決定を、前記少なくとも5個の遺伝子のそれぞれの絶対発現レベルと、初診から5年以内に乳癌が再発しなかった複数の乳癌患者から得た腫瘍サンプルのプール中の前記少なくとも5個の遺伝子のそれぞれの平均発現レベルとの差を決定することを含む方法によって実施する、請求項1に記載の方法。
  5. 前記第1の閾値および前記第2の閾値が、初診から5年以内に乳癌が再発しなかった複数の乳癌患者から得た腫瘍サンプルのプール中の前記少なくとも5個の遺伝子のそれぞれの平均発現レベルに対する相関係数である、請求項1に記載の方法。
  6. 前記第1の類似度値の閾値および前記第2の類似度値の閾値が、
    a.腫瘍サンプルの前記プールを構成する前記腫瘍サンプルの各々における前記少なくとも5個の遺伝子のそれぞれの発現レベルと、前記プールを構成する残りの腫瘍サンプルの前記少なくとも5個の遺伝子の平均発現レベルとの間の類似度の程度によって、前記腫瘍サンプルを降順に順位づけすることにより、順位リストを得るステップであって、前記類似度の程度が類似度値として表されるステップ、
    b.前記分類ステップにおいて偽陰性の許容数を決定するステップであって、偽陰性は、前記細胞サンプル中の前記少なくとも5個の遺伝子の発現レベルから、初診から最初の5年以内に遠隔転移を起こさないと予測されたが、初診から最初の5年以内に遠隔転移を起こした乳癌患者であるステップ、
    c.前記順位リストにおいて、腫瘍サンプルの前記許容数よりも少ない腫瘍サンプルが、その値を超えると偽陰性となる類似度値を決定するステップ、
    d.ステップ(c)で決定した前記類似度値を前記第1の類似度値の閾値として選択するステップ、および
    e.前記第1の類似度値よりも大きい第2の類似度値を前記第2の類似度値の閾値として選択するステップ、
    を含む方法によって選択される、請求項5に記載の方法。
  7. 前記順位リスト中の、初診から最初の5年以内に遠隔転移が起こった前記乳癌患者から採取した前記腫瘍サンプルのいずれが、最大の類似度値を有するかを決定すること、および前記最大の類似度値を前記第2の類似度値の閾値として選択することを含む方法によって、前記第2の類似度値の閾値をステップ(e)で選択する、請求項6に記載の方法。
  8. 前記第1および第2の類似度値の閾値が相関係数であり、前記第1の類似度値の閾値が0.4であり、前記第2の類似度値の閾値が0.4より大きい、請求項6に記載の方法。
  9. 前記第1および第2の類似度値の閾値が相関係数であり、前記第2の類似度値の閾値が0.636である、請求項6に記載の方法。
  10. a.そのマーカーが表5に記載されている少なくとも5個の遺伝子の発現レベルに基づいて、乳癌患者を「予後不良」、「予後中等度」、または「予後優良」であると分類するステップ、および
    b.前記患者に治療法を指定するステップであって、前記治療法は(i)前記患者がリンパ節陰性であり、予後良好もしくは予後中等度であると分類された場合は補助化学療法を含まず、または(ii)リンパ節状態および発現プロファイルの任意の他の組合せを有する場合は化学療法を含むステップ、
    を含む、乳癌患者に治療法を指定する方法。
  11. a.乳癌患者のリンパ節状態を決定するステップ、
    b.前記患者からの細胞サンプル中の、そのマーカーが表5に記載されている少なくとも5個の遺伝子の発現レベルを決定し、それにより発現プロファイルを作製するステップ、
    c.前記発現プロファイルに基づいて前記患者を「予後不良」、「予後中等度」、または「予後優良」であると分類するステップ、および
    d.前記患者に治療法を指定するステップであって、前記治療法は、前記患者がリンパ節陰性であり、予後良好もしくは予後中程度であると分類された場合は補助化学療法を含まず、またはリンパ節状態および分類の任意の他の組合せを有する場合は化学療法を含むステップ、
    を含む、乳癌患者に治療法を指定する方法。
  12. 「予後中等度」であると分類されたリンパ節陰性患者に指定する前記治療法が、さらに補助ホルモン療法を含む、請求項11に記載の方法。
  13. 前記分類ステップ(c)を、
    a.乳癌腫瘍サンプルのプールを構成する複数の乳癌腫瘍サンプルの各々における前記少なくとも5個の遺伝子の発現レベルと、前記プールを構成する残りの腫瘍サンプル全体の前記少なくとも5個の遺伝子の発現レベルとの間の類似度の程度によって前記腫瘍サンプルを降順に順位づけするステップであって、前記類似度の程度が類似度値として表されるステップ、
    b.前記分類ステップにおいて偽陰性の許容数を決定するステップであって、偽陰性は、前記細胞サンプル中の前記少なくとも5個の遺伝子の発現レベルから、初診から最初の5年以内に遠隔転移を起こさないと予測されたが、初診から最初の5年以内に遠隔転移を起こした乳癌患者であるステップ、
    c.前記順位リストにおいて、腫瘍サンプルの前記許容数以下の腫瘍サンプルが、その値を超えると偽陰性となる類似度値を決定するステップ、
    d.ステップ(c)で決定された前記類似度値を第1の類似度値の閾値として選択するステップ、
    e.前記第1の類似度値よりも大きい第2の類似度値を第2の類似度値の閾値として選択するステップ、および
    f.乳癌患者からの乳癌腫瘍サンプル中の前記少なくとも5個の遺伝子のそれぞれの発現レベルと、前記プール中の前記少なくとも5個の遺伝子のそれぞれの発現レベルとの間の類似度を決定することにより、患者の類似度値を得るステップ
    を含み、
    前記患者の類似度値が前記第2の類似度値の閾値以上の場合は、前記患者を「予後優良」であると分類し、前記患者の類似度値が前記第1の類似度値の閾値以上であるが、前記第2の類似度値の閾値未満の場合は、前記患者を「予後中等度」であると分類し、前記患者の類似度値が前記第1の類似度値の閾値未満の場合は、前記患者を「予後不良」であると分類すること、
    を含む方法によって実施する、請求項11に記載の方法。
  14. 前記患者のエストロゲン受容体(ER)の状態を決定することをさらに含み、前記患者がER陽性かつリンパ節陰性である場合は、前記患者に指定した前記治療法が、さらに補助ホルモン療法を含む、請求項11に記載の方法。
  15. 前記患者が52歳以下である、請求項11に記載の方法。
  16. 前記患者がI期またはII期の乳癌を有する、請求項11または15に記載の方法。
  17. 前記患者が閉経前である、請求項11に記載の方法。
  18. 予後に従って乳癌患者を分類するためのコンピュータプログラム製品であって、前記コンピュータプログラム製品は、メモリおよびプロセッサを備えたコンピュータ共に使用するためのものであり、その上にコード化されたコンピュータプログラムを有するコンピュータで読取り可能なストレージ媒体を含み、前記コンピュータプログラム製品はコンピュータの1つまたは複数のメモリユニット中にロードでき、コンピュータの1つまたは複数のプロセッサユニットに以下のステップ、
    a.前記患者から採取した細胞サンプル中の、そのマーカーが表5に記載されている少なくとも5個の遺伝子のそれぞれの発現レベルを含む第1のデータ構造を受信するステップと、
    b.前記少なくとも5個の遺伝子のそれぞれの発現レベルと前記少なくとも5個の遺伝子のそれぞれの対照発現レベルとの類似度を決定して患者の類似度値を得るステップと、
    c.前記少なくとも5個の遺伝子のそれぞれの発現レベルの選択した第1および第2の類似度の閾値に対する前記患者の類似度値と、前記少なくとも5個の遺伝子の前記それぞれの対照発現レベルとを比較するステップであって、前記第2の類似度の閾値が、前記少なくとも5個の遺伝子の前記それぞれの対照発現レベルに対して前記第1の類似度の閾値よりも高い類似度を示すステップと、
    d.前記患者の類似度値が前記第1および前記第2の類似度値の閾値を超える場合は、前記患者が第1の予後を有すると分類し、前記患者の類似度値が前記第1の類似度値の閾値を超えるが、前記第2の類似度値の閾値を超えない場合は、第2の予後を有すると分類し、前記患者の類似度値が前記第1の類似度値の閾値、前記第2の類似度値の閾値のいずれも超えない場合は、第3の予後を有すると分類するステップと、
    を実行させる、コンピュータプログラム製品。
  19. 前記第1の類似度の閾値および前記第2の類似度の閾値が前記コンピュータに記憶される値である、請求項18に記載のコンピュータプログラム製品。
  20. 前記少なくとも5個の遺伝子の前記それぞれの対照発現レベルが前記コンピュータに記憶される、請求項18に記載のコンピュータプログラム製品。
  21. 前記第1の予後が「予後優良」であり、前記第2の予後が「予後中等度」であり、前記第3の予後が「予後不良」であり、前記コンピュータプログラムをメモリ中にロードでき、前記コンピュータの前記1つまたは複数のプロセッサユニットに、乳癌患者がリンパ節陰性であり、予後良好もしくは予後中等度であると分類された場合は、補助化学療法を含まず、または前記患者がリンパ節状態および発現プロファイルの任意の他の組合せを有する場合は、化学療法を含む治療法を前記乳癌患者に指定するステップをさらに実行させる、請求項18に記載のコンピュータプログラム製品。
  22. 前記コンピュータプログラムをメモリ中にロードでき、コンピュータの前記1つまたは複数のプロセッサユニットに、前記乳癌患者に特異的な臨床データを含むデータ構造を受信するステップをさらに実行させる、請求項18に記載のコンピュータプログラム製品。
  23. 前記少なくとも5個の遺伝子の前記それぞれの対照発現レベルが、前記コンピュータで読取り可能なストレージ媒体に記憶された、前記少なくとも5個の遺伝子のそれぞれについての一セットの単チャンネルハイブリダイゼーション平均強度値を含む、請求項18に記載のコンピュータプログラム製品。
  24. 前記単チャンネルハイブリダイゼーション平均強度値が対数変換される、請求項23に記載のコンピュータプログラム製品。
  25. 前記コンピュータプログラム製品は、前記乳癌患者から採取した前記細胞サンプル中の前記少なくとも5個の遺伝子のそれぞれの発現レベルと前記少なくとも5個の遺伝子の前記それぞれの対照発現レベルとの差を計算することによって、前記比較ステップ(c)を前記処理ユニットに行わせる、請求項18に記載のコンピュータプログラム製品。
  26. 前記コンピュータプログラム製品は、前記対照中の前記少なくとも5個の遺伝子のそれぞれの発現レベルの平均対数を計算してそれぞれの遺伝子について対照平均対数発現レベルを得ることと、前記患者からの乳癌サンプル中の前記少なくとも5個の遺伝子のそれぞれの対数発現レベルを計算して患者の対数発現レベルを得ることと、前記患者の対数発現レベルと前記少なくとも5個の遺伝子のそれぞれの前記対照平均対数発現レベルとの差を計算することとによって、前記処理ユニットに前記比較ステップ(c)を行わせる、請求項18に記載のコンピュータプログラム製品。
  27. 前記コンピュータプログラム製品は、前記患者から採取した前記細胞サンプル中の前記少なくとも5個の遺伝子のそれぞれの発現レベルと、前記少なくとも5個の遺伝子の前記それぞれの対照発現レベルとの間の類似度を計算することによって、前記処理ユニットに前記比較ステップ(c)を行わせ、前記類似度を類似度値として表す、請求項18に記載のコンピュータプログラム製品。
  28. 前記類似度値が相関係数である、請求項27に記載のコンピュータプログラム製品。
JP2006500977A 2003-01-15 2004-01-15 乳癌患者の診断および予後 Expired - Lifetime JP4619350B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/342,887 US7171311B2 (en) 2001-06-18 2003-01-15 Methods of assigning treatment to breast cancer patients
PCT/US2004/001100 WO2004065545A2 (en) 2003-01-15 2004-01-15 Diagnosis and prognosis of breast cancer patients

Publications (2)

Publication Number Publication Date
JP2006519591A true JP2006519591A (ja) 2006-08-31
JP4619350B2 JP4619350B2 (ja) 2011-01-26

Family

ID=32770203

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006500977A Expired - Lifetime JP4619350B2 (ja) 2003-01-15 2004-01-15 乳癌患者の診断および予後

Country Status (5)

Country Link
US (1) US7171311B2 (ja)
EP (1) EP1590433A4 (ja)
JP (1) JP4619350B2 (ja)
CA (1) CA2513642A1 (ja)
WO (1) WO2004065545A2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7728113B2 (en) 2003-09-10 2010-06-01 Amgen Fremont Inc. Methods of treating arthritic conditions with antibodies to M-CSF
JP2011526487A (ja) * 2008-07-02 2011-10-13 セントロ・デ・インベステイガイシオネス・エネルゲテイカス,メデイオアムビエンタレス・イ・テクノロヒカス・(セ.イ.エ.エメ.ア.テ.) 乳癌のゲノムフィンガープリント
JP2015505359A (ja) * 2011-10-24 2015-02-19 アトッサ ジェネティクス,インク. 乳がん検出のための吸収紙及びその使用

Families Citing this family (202)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6984522B2 (en) 2000-08-03 2006-01-10 Regents Of The University Of Michigan Isolation and use of solid tumor stem cells
US8641644B2 (en) 2000-11-21 2014-02-04 Sanofi-Aventis Deutschland Gmbh Blood testing apparatus having a rotatable cartridge with multiple lancing elements and testing means
US7271240B2 (en) 2001-03-14 2007-09-18 Agensys, Inc. 125P5C8: a tissue specific protein highly expressed in various cancers
US20050260572A1 (en) * 2001-03-14 2005-11-24 Kikuya Kato Method of predicting cancer
US9427532B2 (en) 2001-06-12 2016-08-30 Sanofi-Aventis Deutschland Gmbh Tissue penetration device
US9795747B2 (en) 2010-06-02 2017-10-24 Sanofi-Aventis Deutschland Gmbh Methods and apparatus for lancet actuation
US7041068B2 (en) 2001-06-12 2006-05-09 Pelikan Technologies, Inc. Sampling module device and method
CA2451074C (en) * 2001-06-18 2014-02-11 Rosetta Inpharmatics, Inc. Diagnosis and prognosis of breast cancer patients
ES2390531T3 (es) * 2001-09-18 2012-11-13 Genentech, Inc. Composiciones y procedimientos para el diagnósitco y tratamiento de tumor
US20060194265A1 (en) * 2001-10-23 2006-08-31 Morris David W Novel therapeutic targets in cancer
US9222938B2 (en) * 2001-12-04 2015-12-29 Michael Tainsky Neoepitope detection of disease using protein arrays
AU2003212954A1 (en) * 2002-02-08 2003-09-02 Integriderm, Inc. Skin cell biomarkers and methods for identifying biomarkers using nucleic acid microarrays
CN1643163A (zh) * 2002-02-20 2005-07-20 Ncc技术投资私人有限公司 关于癌症诊断的材料和方法
CA2485142A1 (en) * 2002-03-14 2003-09-18 National Institute Of Advanced Industrial Science And Technology Novel n-acetylglucosamine transferase, nucleic acid encoding the same and use thereof in diagnosing cancer and/or tumor
US9795334B2 (en) 2002-04-19 2017-10-24 Sanofi-Aventis Deutschland Gmbh Method and apparatus for penetrating tissue
US9248267B2 (en) 2002-04-19 2016-02-02 Sanofi-Aventis Deustchland Gmbh Tissue penetration device
US8702624B2 (en) 2006-09-29 2014-04-22 Sanofi-Aventis Deutschland Gmbh Analyte measurement device with a single shot actuator
US8784335B2 (en) 2002-04-19 2014-07-22 Sanofi-Aventis Deutschland Gmbh Body fluid sampling device with a capacitive sensor
US8579831B2 (en) 2002-04-19 2013-11-12 Sanofi-Aventis Deutschland Gmbh Method and apparatus for penetrating tissue
US20060089493A1 (en) * 2002-04-30 2006-04-27 Biogen Idec Inc. Novel gene targets and ligands that bind thereto for treatment and diagnosis of colon carcinomas
WO2004016733A2 (en) 2002-08-16 2004-02-26 Agensys, Inc. Nucleic acid and corresponding protein entitled 251p5g2 useful in treatment and detection of cancer
KR20050048615A (ko) * 2002-08-19 2005-05-24 제넨테크, 인크. 종양의 진단 및 치료를 위한 조성물 및 방법
US7517648B2 (en) * 2002-08-26 2009-04-14 The Regents Of The University Of Michigan NPHP nucleic acids and proteins
JP4484707B2 (ja) * 2002-09-27 2010-06-16 昇志 佐藤 腫瘍抗原タンパク質及びその利用
US7217515B2 (en) * 2002-09-30 2007-05-15 Chi Mei Foundation Medical Center HURP gene as a molecular marker for bladder cancer
US10533998B2 (en) 2008-07-18 2020-01-14 Bio-Rad Laboratories, Inc. Enzyme quantification
US20060078893A1 (en) 2004-10-12 2006-04-13 Medical Research Council Compartmentalised combinatorial chemistry by microfluidic control
GB0307403D0 (en) * 2003-03-31 2003-05-07 Medical Res Council Selection by compartmentalised screening
GB0307428D0 (en) * 2003-03-31 2003-05-07 Medical Res Council Compartmentalised combinatorial chemistry
US7306910B2 (en) 2003-04-24 2007-12-11 Veridex, Llc Breast cancer prognostics
JP4434621B2 (ja) * 2003-05-07 2010-03-17 キヤノン株式会社 医療用画像形成装置及び方法
WO2005005601A2 (en) * 2003-06-09 2005-01-20 The Regents Of The University Of Michigan Compositions and methods for treating and diagnosing cancer
US7473531B1 (en) * 2003-08-08 2009-01-06 Colora Corporation Pancreatic cancer targets and uses thereof
US20060003391A1 (en) * 2003-08-11 2006-01-05 Ring Brian Z Reagents and methods for use in cancer diagnosis, classification and therapy
US20050112622A1 (en) * 2003-08-11 2005-05-26 Ring Brian Z. Reagents and methods for use in cancer diagnosis, classification and therapy
DE10344799A1 (de) * 2003-09-26 2005-04-14 Ganymed Pharmaceuticals Ag Identifizierung von Oberflächen-assoziierten Antigenen für die Tumordiagnose und -therapie
US20050069863A1 (en) * 2003-09-29 2005-03-31 Jorge Moraleda Systems and methods for analyzing gene expression data for clinical diagnostics
US8321137B2 (en) * 2003-09-29 2012-11-27 Pathwork Diagnostics, Inc. Knowledge-based storage of diagnostic models
JP2007507770A (ja) 2003-09-29 2007-03-29 パスワーク インフォーマティクス,インコーポレーテッド 生物学的特徴を検出するためのシステムおよび方法
GB0323225D0 (en) * 2003-10-03 2003-11-05 Ncc Technology Ventures Pte Lt Materials and methods relating to breast cancer classification
JP2007512807A (ja) * 2003-10-28 2007-05-24 バイエル ヘルスケア アーゲー 悪性腫瘍の処置に対する応答予測のための方法および組成物
FR2861744A1 (fr) * 2003-11-05 2005-05-06 Biomerieux Sa Procede pour le pronostic du cancer du sein
US8668656B2 (en) 2003-12-31 2014-03-11 Sanofi-Aventis Deutschland Gmbh Method and apparatus for improving fluidic flow and sample capture
JP5180478B2 (ja) * 2004-02-10 2013-04-10 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ゲノムベースの医療診断テストを最適化する遺伝アルゴリズム
JP2005230011A (ja) * 2004-02-20 2005-09-02 Samsung Electronics Co Ltd 乳ガン関連蛋白質、それをコーディングする遺伝子、及び該蛋白質及び該遺伝子を利用した乳ガンの診断方法
US20050186577A1 (en) 2004-02-20 2005-08-25 Yixin Wang Breast cancer prognostics
US20060195266A1 (en) 2005-02-25 2006-08-31 Yeatman Timothy J Methods for predicting cancer outcome and gene signatures for use therein
EP1730308A4 (en) * 2004-03-05 2008-10-08 Rosetta Inpharmatics Llc CLASSIFICATION OF PATIENTS OF BREAST CANCER USING A COMBINATION OF CLINICAL CRITERIA AND GENETIC INFORMATIVE SETS
AU2005224620A1 (en) * 2004-03-12 2005-09-29 Exelixis, Inc. C20ORF23 as modifier of the IGFR pathway and methods of use
US20050221339A1 (en) * 2004-03-31 2005-10-06 Medical Research Council Harvard University Compartmentalised screening by microfluidic control
JP2007532111A (ja) * 2004-04-06 2007-11-15 ザ・レジェンツ・オブ・ザ・ユニバーシティ・オブ・カリフォルニア 乳癌における標的としてのオーファン受容体チロシンキナーゼ
DK2163650T3 (en) * 2004-04-09 2015-11-02 Genomic Health Inc Genekspressionsmarkører for prediction of response to chemotherapy
EP1737981A2 (en) * 2004-04-23 2007-01-03 Exagen Diagnostics, Inc. Breast cancer gene expression biomarkers
JP2007530075A (ja) * 2004-04-23 2007-11-01 エグザジェン ダイアグノスティクス インコーポレイテッド 乳がんの予後診断のための組成物および方法
US7593483B2 (en) * 2004-05-07 2009-09-22 Broadcom Corporation Nonlinear mapping in digital-to-analog and analog-to-digital converters
US8828203B2 (en) 2004-05-20 2014-09-09 Sanofi-Aventis Deutschland Gmbh Printable hydrogels for biosensors
US20080318803A1 (en) * 2004-05-27 2008-12-25 Vertex Pharmaceuticals Biomarkers for Monitoring Impdh Pathway Inhibition
EP2474616B1 (en) * 2004-05-28 2015-07-08 Asuragen, Inc. Methods and compositions involving microRNA
EP1756309A2 (en) * 2004-06-03 2007-02-28 Bayer HealthCare AG Methods for predicting and monitoring response to cancer therapy
US8019801B1 (en) * 2004-06-23 2011-09-13 Mayo Foundation For Medical Education And Research Techniques to rate the validity of multiple methods to process multi-dimensional data
US20090239214A1 (en) * 2004-07-30 2009-09-24 Hongyue Dai Prognosis of breast cancer patients
US20080131916A1 (en) * 2004-08-10 2008-06-05 Ring Brian Z Reagents and Methods For Use In Cancer Diagnosis, Classification and Therapy
CA2580042A1 (en) * 2004-09-10 2006-03-16 Pfizer Products Inc. Methods of treating cognitive disorders using pyridyloxymethyl and benzisoxazole azabicyclic derivatives
FR2875512B1 (fr) * 2004-09-17 2011-02-04 Diagnogene S A Biopuce de diagnostic du caractere metastatique ou localise d'une tumeur mammaire, procede et kit d'utilisation
US20080299550A1 (en) * 2004-09-20 2008-12-04 Bayer Healthcare Ag Methods and Kits For the Prediction of Therapeutic Success and Recurrence Free Survival In Cancer Therapy
BRPI0515581A (pt) * 2004-09-22 2008-07-29 Tripath Imaging Inc métodos e produtos de programa de computador para análise e otimização de candidatos marcadores para prognóstico de cáncer
US20060211008A1 (en) * 2004-09-22 2006-09-21 Perry Mongroo Beta-parvin expression for use in diagnostic methods for assessment of breast cancer
GB0421838D0 (en) * 2004-09-30 2004-11-03 Congenia S R L Cancer markers
US8747867B2 (en) 2004-09-30 2014-06-10 Ifom Fondazione Instituto Firc Di Oncologia Molecolare Cancer markers
US8065093B2 (en) * 2004-10-06 2011-11-22 Agency For Science, Technology, And Research Methods, systems, and compositions for classification, prognosis, and diagnosis of cancers
US7968287B2 (en) 2004-10-08 2011-06-28 Medical Research Council Harvard University In vitro evolution in microfluidic systems
NZ554895A (en) * 2004-11-03 2009-06-26 Almac Diagnostics Ltd Transcriptome microarray technology and methods of using the same
WO2008073922A2 (en) * 2006-12-08 2008-06-19 Asuragen, Inc. Functions and targets of let-7 micro rnas
EP2281887A1 (en) * 2004-11-12 2011-02-09 Asuragen, Inc. Methods and compositions involving miRNA and miRNA inhibitor molecules
WO2006061430A2 (en) * 2004-12-10 2006-06-15 Proskelia Bone metastasis markers as a target regulating bone metastasis and bone development
EP1851543A2 (en) * 2005-02-24 2007-11-07 Compugen Ltd. Novel diagnostic markers, especially for in vivo imaging, and assays and methods of use thereof
DE102005013846A1 (de) * 2005-03-24 2006-10-05 Ganymed Pharmaceuticals Ag Identifizierung von Oberflächen-assoziierten Antigenen für die Tumordiagnose und -therapie
US20060223075A1 (en) * 2005-03-29 2006-10-05 Exagen Diagnostics, Inc. Unique sequence hybridization probes (USP)
US7919246B2 (en) * 2005-04-07 2011-04-05 Novartis Vaccines And Diagnostics, Inc. SEMA4D in cancer diagnosis, detection and treatment
US7557198B2 (en) * 2005-05-04 2009-07-07 Exagen Diagnostics, Inc. Acute myelogenous leukemia biomarkers
US8046777B2 (en) * 2005-06-02 2011-10-25 The Mathworks, Inc. Calling of late bound functions from an external program environment
JP2009502113A (ja) * 2005-07-25 2009-01-29 オンコセラピー・サイエンス株式会社 乳癌を治療するための組成物および方法
IL177006A0 (en) * 2005-08-02 2006-12-10 Veridex Llc Predicting bone relapse of breast cancer
WO2007021807A1 (en) 2005-08-12 2007-02-22 Schering Corporation Mcp1 fusions
WO2007030611A2 (en) * 2005-09-09 2007-03-15 The Board Of Regents Of The University Of Texas System A calculated index of genomic expression of estrogen receptor (er) and er related genes
US7582441B1 (en) 2005-10-17 2009-09-01 Celera Corporation Methods and compositions for treating and diagnosing disease
EP1954820A1 (en) * 2005-10-25 2008-08-13 Het Nederlands Kanker Instituut Prediction of local recurrence of breast cancer
FR2892730A1 (fr) * 2005-10-28 2007-05-04 Biomerieux Sa Methode pour detecter la presence ou le risque de developper un cancer
AU2006344359B2 (en) 2005-10-31 2013-08-15 Oncomed Pharmaceuticals, Inc. Compositions and methods for diagnosing and treating cancer
US7723477B2 (en) 2005-10-31 2010-05-25 Oncomed Pharmaceuticals, Inc. Compositions and methods for inhibiting Wnt-dependent solid tumor cell growth
US8014957B2 (en) * 2005-12-15 2011-09-06 Fred Hutchinson Cancer Research Center Genes associated with progression and response in chronic myeloid leukemia and uses thereof
US7875274B2 (en) * 2005-12-16 2011-01-25 The Board Of Trustees Of The Leland Stanford Junior University Protein modulators of resistance to alkylating agents
EP2363205A3 (en) 2006-01-11 2014-06-04 Raindance Technologies, Inc. Microfluidic Devices And Methods Of Use In The Formation And Control Of Nanoreactors
US7459280B2 (en) * 2006-02-27 2008-12-02 Picobella, Llc Methods for diagnosing and treating kidney cancer
WO2007123772A2 (en) 2006-03-31 2007-11-01 Genomic Health, Inc. Genes involved in estrogen metabolism
US20070237713A1 (en) 2006-04-04 2007-10-11 Fan Rong A PCan065 Antibody Compositions and Methods of Use
WO2007120753A2 (en) * 2006-04-11 2007-10-25 Corixa Corporation Methods, compositions, and kits for the detection and monitoring of bladder cancer
EP2012801A4 (en) * 2006-04-24 2009-08-05 Gloucester Pharmaceuticals Inc GEMCITABINE COMBINATION THERAPY
CA2651185C (en) 2006-05-09 2022-08-30 The University Of British Columbia Dissolved protein arthritis markers
US20080014589A1 (en) 2006-05-11 2008-01-17 Link Darren R Microfluidic devices and methods of use thereof
US9562837B2 (en) 2006-05-11 2017-02-07 Raindance Technologies, Inc. Systems for handling microfludic droplets
WO2007146730A2 (en) * 2006-06-08 2007-12-21 Gloucester Pharmaceuticals Deacetylase inhibitor therapy
DE602007013405D1 (de) * 2006-07-14 2011-05-05 Us Government Verfahren zur bestimmung der prognose eines adenokarzinoms
US7502767B1 (en) * 2006-07-21 2009-03-10 Hewlett-Packard Development Company, L.P. Computing a count of cases in a class
US9012390B2 (en) 2006-08-07 2015-04-21 Raindance Technologies, Inc. Fluorocarbon emulsion stabilizing surfactants
US7615349B2 (en) * 2006-09-07 2009-11-10 H. Lee Moffitt Cancer Center And Research Institute, Inc. Melanoma gene signature
EP2145001A2 (en) * 2006-09-19 2010-01-20 Asuragen, Inc. Mir-15, mir-26, mir -31,mir -145, mir-147, mir-188, mir-215, mir-216 mir-331, mmu-mir-292-3p regulated genes and pathways as targets for therapeutic intervention
EP2066805B1 (en) * 2006-09-27 2016-07-27 Sividon Diagnostics GmbH Methods for breast cancer prognosis
WO2008049953A1 (es) 2006-10-23 2008-05-02 Neocodex, S.L. Método de pronóstico y/o diagnóstico in vitro de hipersensibilidad a estrógenos o a sustancias con actividad estrogénica
WO2008061672A2 (en) * 2006-11-24 2008-05-29 Synthon B.V. Genetic risk factor for cancer
CN101622349A (zh) * 2006-12-08 2010-01-06 奥斯瑞根公司 作为治疗性干预靶标的miR-21调节的基因和途径
WO2008073919A2 (en) * 2006-12-08 2008-06-19 Asuragen, Inc. Mir-20 regulated genes and pathways as targets for therapeutic intervention
CA2671294A1 (en) * 2006-12-08 2008-06-19 Asuragen, Inc. Mir-21 regulated genes and pathways as targets for therapeutic intervention
US20090175827A1 (en) * 2006-12-29 2009-07-09 Byrom Mike W miR-16 REGULATED GENES AND PATHWAYS AS TARGETS FOR THERAPEUTIC INTERVENTION
WO2008097559A2 (en) 2007-02-06 2008-08-14 Brandeis University Manipulation of fluids and reactions in microfluidic systems
CA2682868A1 (en) * 2007-04-05 2008-10-16 Source Precision Medicine, Inc. D/B/A Source Mdx Gene expression profiling for identification, monitoring, and treatment of breast cancer
US8592221B2 (en) 2007-04-19 2013-11-26 Brandeis University Manipulation of fluids, fluid components and reactions in microfluidic systems
US20090232893A1 (en) * 2007-05-22 2009-09-17 Bader Andreas G miR-143 REGULATED GENES AND PATHWAYS AS TARGETS FOR THERAPEUTIC INTERVENTION
US9551033B2 (en) 2007-06-08 2017-01-24 Genentech, Inc. Gene expression markers of tumor resistance to HER2 inhibitor treatment
EP2171090B1 (en) * 2007-06-08 2013-04-03 Genentech, Inc. Gene expression markers of tumor resistance to her2 inhibitor treatment
US20090227533A1 (en) * 2007-06-08 2009-09-10 Bader Andreas G miR-34 Regulated Genes and Pathways as Targets for Therapeutic Intervention
US8361714B2 (en) 2007-09-14 2013-01-29 Asuragen, Inc. Micrornas differentially expressed in cervical cancer and uses thereof
WO2009052386A1 (en) * 2007-10-18 2009-04-23 Asuragen, Inc. Micrornas differentially expressed in lung diseases and uses thereof
JP5781764B2 (ja) 2007-11-27 2015-09-24 ザ・ユニバーシティ・オブ・ブリティッシュ・コロンビア 14−3−3η抗体、並びに関節炎の診断及び治療のためのその使用
US8071562B2 (en) * 2007-12-01 2011-12-06 Mirna Therapeutics, Inc. MiR-124 regulated genes and pathways as targets for therapeutic intervention
FR2924946B1 (fr) * 2007-12-18 2010-02-26 Oreal Utilisation cosmetique de proteines de type ceramidase acide
US20090192114A1 (en) * 2007-12-21 2009-07-30 Dmitriy Ovcharenko miR-10 Regulated Genes and Pathways as Targets for Therapeutic Intervention
WO2009100430A2 (en) * 2008-02-08 2009-08-13 Asuragen, Inc miRNAs DIFFERENTIALLY EXPRESSED IN LYMPH NODES FROM CANCER PATIENTS
US8105777B1 (en) 2008-02-13 2012-01-31 Nederlands Kanker Instituut Methods for diagnosis and/or prognosis of colon cancer
US20110130296A1 (en) * 2008-03-14 2011-06-02 The Regents Of The University Of California Multi-gene classifiers and prognostic indicators for cancers
JP2011514162A (ja) * 2008-03-14 2011-05-06 エグザジェン ダイアグノスティクス インコーポレイテッド 炎症性腸疾患および過敏性腸症候群のバイオマーカー
EP2271757A2 (en) * 2008-03-26 2011-01-12 Asuragen, INC. Compositions and methods related to mir-16 and therapy of prostate cancer
WO2009126726A1 (en) * 2008-04-08 2009-10-15 Asuragen, Inc Methods and compositions for diagnosing and modulating human papillomavirus (hpv)
WO2009137807A2 (en) 2008-05-08 2009-11-12 Asuragen, Inc. Compositions and methods related to mirna modulation of neovascularization or angiogenesis
BRPI0908290A2 (pt) * 2008-05-09 2015-07-21 Koninkl Philips Electronics Nv "sistema de apoio à decisão clínica baseado em diretrizes (cdss)"
US8093000B2 (en) 2008-05-09 2012-01-10 The Regents Of The University Of California Methods for predicting and treating tumors resistant to drug, immunotherapy, and radiation
EP2133433A1 (en) * 2008-06-09 2009-12-16 Centre Georges François Leclerc A method for predicting responsiveness to a treatment with an anti-HER2 antibody
WO2010009365A1 (en) 2008-07-18 2010-01-21 Raindance Technologies, Inc. Droplet libraries
CN103002911B (zh) 2008-09-26 2015-08-26 昂考梅德药品有限公司 卷曲蛋白结合药剂及其应用
WO2010047310A1 (ja) * 2008-10-20 2010-04-29 大日本住友製薬株式会社 腫瘍抗原ペプチド及びその利用
US20100179213A1 (en) * 2008-11-11 2010-07-15 Mirna Therapeutics, Inc. Methods and Compositions Involving miRNAs In Cancer Stem Cells
ES2343996B1 (es) * 2008-12-11 2011-06-20 Fundacion Para La Investigacion Biomedica Del Hospital Universitario La Paz Metodo para la subclasificacion de tumores.
WO2010088386A1 (en) 2009-01-28 2010-08-05 University Of Notre Dame Du Lac Accelerated progression relapse test
WO2010093872A2 (en) 2009-02-13 2010-08-19 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Molecular-based method of cancer diagnosis and prognosis
DK2406633T3 (en) 2009-03-11 2019-04-01 Augurex Life Sciences Corp COMPOSITIONS AND PROCEDURES FOR CHARACTERIZING ARTHRITIC CONDITIONS
EP3415235A1 (en) 2009-03-23 2018-12-19 Raindance Technologies Inc. Manipulation of microfluidic droplets
EP2425021A4 (en) * 2009-05-01 2013-03-06 Nuvera Biosciences Inc INDEX OF GENOMEXPRESSION OF ESTROGEN RECEPTOR (ER) AND ER-ASSOCIATED GENES
WO2011017687A1 (en) * 2009-08-06 2011-02-10 Ray Partha S Diagnosis of primary and metastatic basal-like breast cancer and other cancer types
US9555089B2 (en) 2009-08-18 2017-01-31 The Rockefeller University Modification of recombinant adenovirus with immunogenic plasmodium circumsporozoite protein epitopes
WO2011038461A1 (en) * 2009-10-01 2011-04-07 Chipdx Llc System and method for classification of patients
WO2011042564A1 (en) 2009-10-09 2011-04-14 Universite De Strasbourg Labelled silica-based nanomaterial with enhanced properties and uses thereof
EP2504451B1 (en) * 2009-11-23 2019-06-05 Genomic Health, Inc. Methods to predict clinical outcome of cancer
WO2011079176A2 (en) 2009-12-23 2011-06-30 Raindance Technologies, Inc. Microfluidic systems and methods for reducing the exchange of molecules between droplets
TWI535445B (zh) 2010-01-12 2016-06-01 安可美德藥物股份有限公司 Wnt拮抗劑及治療和篩選方法
US9399797B2 (en) 2010-02-12 2016-07-26 Raindance Technologies, Inc. Digital analyte analysis
CA2789425C (en) 2010-02-12 2020-04-28 Raindance Technologies, Inc. Digital analyte analysis with polymerase error correction
US10351905B2 (en) 2010-02-12 2019-07-16 Bio-Rad Laboratories, Inc. Digital analyte analysis
US9366632B2 (en) 2010-02-12 2016-06-14 Raindance Technologies, Inc. Digital analyte analysis
JP2013530929A (ja) 2010-04-01 2013-08-01 オンコメッド ファーマシューティカルズ インコーポレイテッド frizzled結合剤およびその使用
JP5932778B2 (ja) * 2010-05-28 2016-06-15 ビオメリューBiomerieux 乳癌と良性乳房疾患を識別するための方法及びキット
US20120190817A2 (en) 2010-07-12 2012-07-26 Celgene Corporation Romidepsin solid forms and uses thereof
US8859502B2 (en) 2010-09-13 2014-10-14 Celgene Corporation Therapy for MLL-rearranged leukemia
RS57483B1 (sr) 2010-09-29 2018-10-31 Agensys Inc Konjugati antitela i leka (adc) koji se vezuju za 191p4d12 proteine
US9562897B2 (en) 2010-09-30 2017-02-07 Raindance Technologies, Inc. Sandwich assays in droplets
EP2652656A1 (en) * 2010-12-16 2013-10-23 Koninklijke Philips N.V. System and method for clinical decision support for therapy planning using case-based reasoning
KR101287600B1 (ko) * 2011-01-04 2013-07-18 주식회사 젠큐릭스 초기유방암의 예후 예측용 유전자 및 이를 이용한 초기유방암의 예후예측 방법
US9222085B2 (en) 2011-02-03 2015-12-29 Mirna Therapeutics, Inc. Synthetic mimics of MIR-124
WO2012109600A2 (en) 2011-02-11 2012-08-16 Raindance Technologies, Inc. Methods for forming mixed droplets
EP2675819B1 (en) 2011-02-18 2020-04-08 Bio-Rad Laboratories, Inc. Compositions and methods for molecular labeling
US20120252689A1 (en) 2011-04-01 2012-10-04 Zhong Wu Gene expression signature for wnt/b-catenin signaling pathway and use thereof
US8841071B2 (en) 2011-06-02 2014-09-23 Raindance Technologies, Inc. Sample multiplexing
US8658430B2 (en) 2011-07-20 2014-02-25 Raindance Technologies, Inc. Manipulating droplet size
WO2013040251A2 (en) 2011-09-13 2013-03-21 Asurgen, Inc. Methods and compositions involving mir-135b for distinguishing pancreatic cancer from benign pancreatic disease
DK2768851T3 (en) 2011-10-21 2017-09-18 Augurex Life Sciences Corp ANTIGENS DERIVED BY CITRULLINATED 14-3-3 AND APPLICATIONS THEREOF IN THE DIAGNOSIS OF RHEUMATOID ARTHRITIS
JP5939705B2 (ja) * 2012-02-08 2016-06-22 カシオ計算機株式会社 被写体判定装置、被写体判定方法及びプログラム
WO2013120089A1 (en) 2012-02-10 2013-08-15 Raindance Technologies, Inc. Molecular diagnostic screening assay
US20130218593A1 (en) * 2012-02-19 2013-08-22 International Business Machines Corporation Usage of assigned treatment in clinical decision support systems
EP2844768B1 (en) 2012-04-30 2019-03-13 Raindance Technologies, Inc. Digital analyte analysis
CN104603291B (zh) 2012-06-22 2018-04-06 Htg分子诊断有限公司 黑素细胞病变中的分子恶性肿瘤
AU2013202506B2 (en) 2012-09-07 2015-06-18 Celgene Corporation Resistance biomarkers for hdac inhibitors
AU2013334790A1 (en) 2012-10-23 2015-04-30 Oncomed Pharmaceuticals, Inc. Methods of treating neuroendocrine tumors using Wnt pathway-binding agents
AU2013202507B9 (en) 2012-11-14 2015-08-13 Celgene Corporation Inhibition of drug resistant cancer cells
CA2899353A1 (en) 2013-02-04 2014-08-07 Oncomed Pharmaceuticals, Inc. Methods and monitoring of treatment with a wnt pathway inhibitor
US9168300B2 (en) 2013-03-14 2015-10-27 Oncomed Pharmaceuticals, Inc. MET-binding agents and uses thereof
EP2986762B1 (en) 2013-04-19 2019-11-06 Bio-Rad Laboratories, Inc. Digital analyte analysis
TW201546640A (zh) 2013-09-16 2015-12-16 Biodesix Inc 使用微分類器及規則化之組合的分類器產生方法與其用途
US11901041B2 (en) 2013-10-04 2024-02-13 Bio-Rad Laboratories, Inc. Digital analysis of nucleic acid modification
US9944977B2 (en) 2013-12-12 2018-04-17 Raindance Technologies, Inc. Distinguishing rare variations in a nucleic acid sequence from a sample
NZ630311A (en) 2013-12-27 2016-03-31 Celgene Corp Romidepsin formulations and uses thereof
WO2015103367A1 (en) 2013-12-31 2015-07-09 Raindance Technologies, Inc. System and method for detection of rna species
GB201502840D0 (en) * 2015-02-20 2015-04-08 Univ Cardiff Cancer prognostic
JP2018514586A (ja) * 2015-04-24 2018-06-07 パトリック リーブス 癌の治療のための組成物
US10647981B1 (en) 2015-09-08 2020-05-12 Bio-Rad Laboratories, Inc. Nucleic acid library generation methods and compositions
US10861604B2 (en) 2016-05-05 2020-12-08 Advinow, Inc. Systems and methods for automated medical diagnostics
US20180330059A1 (en) * 2017-05-09 2018-11-15 James Stewart Bates Patient treatment systems and methods
US11164679B2 (en) 2017-06-20 2021-11-02 Advinow, Inc. Systems and methods for intelligent patient interface exam station
US10998178B2 (en) 2017-08-28 2021-05-04 Purdue Research Foundation Systems and methods for sample analysis using swabs
US11348688B2 (en) 2018-03-06 2022-05-31 Advinow, Inc. Systems and methods for audio medical instrument patient measurements
US10939806B2 (en) 2018-03-06 2021-03-09 Advinow, Inc. Systems and methods for optical medical instrument patient measurements
US20210198753A1 (en) * 2018-06-21 2021-07-01 Arizona Board Of Regents On Behalf Of The University Of Arizona Systems and methods for determining a treatment course of action
CN112379093B (zh) * 2020-10-22 2023-06-16 上海良润生物医药科技有限公司 CST-Cathepsin复合物作为肿瘤诊断标志物的应用
CN116773815B (zh) * 2023-08-14 2023-11-10 四川省医学科学院·四川省人民医院 Slc2a6作为治疗靶点和筛查靶点的用途及乳腺癌筛查试剂盒

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5143854A (en) * 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
US5545522A (en) * 1989-09-22 1996-08-13 Van Gelder; Russell N. Process for amplifying a target polynucleotide sequence using a single primer-promoter complex
US6342491B1 (en) * 1991-05-21 2002-01-29 American Home Products Corporation Method of treating estrogen receptor positive carcinoma with 17 α-dihydroequilin
US5677125A (en) * 1994-01-14 1997-10-14 Vanderbilt University Method of detection and diagnosis of pre-invasive cancer
WO1995019369A1 (en) * 1994-01-14 1995-07-20 Vanderbilt University Method for detection and treatment of breast cancer
US5578832A (en) * 1994-09-02 1996-11-26 Affymetrix, Inc. Method and apparatus for imaging a sample on a device
US5539083A (en) * 1994-02-23 1996-07-23 Isis Pharmaceuticals, Inc. Peptide nucleic acid combinatorial libraries and improved methods of synthesis
US5556752A (en) * 1994-10-24 1996-09-17 Affymetrix, Inc. Surface-bound, unimolecular, double-stranded DNA
DE69632870T2 (de) * 1995-03-17 2005-07-14 John Wayne Cancer Institute, Santa Monica Nachweis von melanomenmetastasen unter verwendung eines mehrfachmarker-tests
WO1997020931A1 (en) * 1995-12-08 1997-06-12 The Government Of The United States Of America, Represented By The Secretary, Department Of Health And Human Services Method and compositions for monitoring dna binding molecules in living cells
CA2279361A1 (en) 1997-01-31 1998-08-06 Fred Hutchinson Cancer Research Center Prognosis of cancer patients by determining expression of cell cycle regulators p27 and cyclin e
US6028189A (en) * 1997-03-20 2000-02-22 University Of Washington Solvent for oligonucleotide synthesis and methods of use
US6432707B1 (en) * 1997-12-24 2002-08-13 Corixa Corporation Compositions and methods for the therapy and diagnosis of breast cancer
US6358682B1 (en) * 1998-01-26 2002-03-19 Ventana Medical Systems, Inc. Method and kit for the prognostication of breast cancer
US6107034A (en) * 1998-03-09 2000-08-22 The Board Of Trustees Of The Leland Stanford Junior University GATA-3 expression in human breast carcinoma
AU3395900A (en) 1999-03-12 2000-10-04 Human Genome Sciences, Inc. Human lung cancer associated gene sequences and polypeptides
US6647341B1 (en) * 1999-04-09 2003-11-11 Whitehead Institute For Biomedical Research Methods for classifying samples and ascertaining previously unknown classes
WO2001006013A1 (en) 1999-07-16 2001-01-25 Rosetta Inpharmatics, Inc. Methods for determining the specificity and sensitivity of oligonucleotides for hybridization
US7013221B1 (en) 1999-07-16 2006-03-14 Rosetta Inpharmatics Llc Iterative probe design and detailed expression profiling with flexible in-situ synthesis arrays
US6271002B1 (en) * 1999-10-04 2001-08-07 Rosetta Inpharmatics, Inc. RNA amplification method
WO2001046697A2 (en) 1999-12-21 2001-06-28 Millennium Predictive Medicine Identification, assessment, prevention, and therapy of breast cancer
AU2001229340A1 (en) 2000-01-14 2001-07-24 Millennium Pharmaceuticals, Inc. Genes compositions, kits, and methods for identification, assessment, prevention, and therapy of breast cancer
AU2001277172A1 (en) * 2000-07-26 2002-02-05 Applied Genomics, Inc. Bstp-trans protein and related reagents and methods of use thereof
US6713257B2 (en) 2000-08-25 2004-03-30 Rosetta Inpharmatics Llc Gene discovery using microarrays
US7807447B1 (en) 2000-08-25 2010-10-05 Merck Sharp & Dohme Corp. Compositions and methods for exon profiling
WO2002085298A2 (en) 2001-04-20 2002-10-31 Millennium Pharmaceutical, Inc. Method for detecting breast cancer cells
CA2451074C (en) * 2001-06-18 2014-02-11 Rosetta Inpharmatics, Inc. Diagnosis and prognosis of breast cancer patients
WO2005008213A2 (en) * 2003-07-10 2005-01-27 Genomic Health, Inc. Expression profile algorithm and test for cancer prognosis
TW200512927A (en) 2003-08-08 2005-04-01 Koninkl Philips Electronics Nv Method for determining optimal resist thickness
EP1730308A4 (en) 2004-03-05 2008-10-08 Rosetta Inpharmatics Llc CLASSIFICATION OF PATIENTS OF BREAST CANCER USING A COMBINATION OF CLINICAL CRITERIA AND GENETIC INFORMATIVE SETS

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
JPN6009058267, Nature, vol. 415, pages 530−536 (2002) *
JPN6009058268, Hum. Mol. Genet., vol. 11, pages 863−872 (2002) *
JPN6009058270, Breast Cancer Res., vol. 4, R3/1−8 (2002) *
JPN6009058272, Poc. Natl. Acad. Sci. USA, pages 11462−11467 (2001) *
JPN6010029690, N. Engl. J. Med., vol. 347, pages 1999−2009 (2002) *
JPN6010029692, Lancet, vol. 352, pages 930−942 (1998) *
JPN7009004897, Poc. Natl. Acad. Sci. USA, pages 10869−10874 (2001) *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7728113B2 (en) 2003-09-10 2010-06-01 Amgen Fremont Inc. Methods of treating arthritic conditions with antibodies to M-CSF
US8188249B2 (en) 2003-09-10 2012-05-29 Amgen Fremont Inc. Nucleic acid molecules encoding antibodies to M-CSF
US9718883B2 (en) 2003-09-10 2017-08-01 Amgen Fremont Inc. Antibodies to M-CSF
US10280219B2 (en) 2003-09-10 2019-05-07 Amgen Fremont Inc. Antibodies to M-CSF
JP2011526487A (ja) * 2008-07-02 2011-10-13 セントロ・デ・インベステイガイシオネス・エネルゲテイカス,メデイオアムビエンタレス・イ・テクノロヒカス・(セ.イ.エ.エメ.ア.テ.) 乳癌のゲノムフィンガープリント
JP2015505359A (ja) * 2011-10-24 2015-02-19 アトッサ ジェネティクス,インク. 乳がん検出のための吸収紙及びその使用

Also Published As

Publication number Publication date
CA2513642A1 (en) 2004-08-05
US20040058340A1 (en) 2004-03-25
US7171311B2 (en) 2007-01-30
EP1590433A2 (en) 2005-11-02
EP1590433A4 (en) 2008-10-01
WO2004065545A3 (en) 2005-06-02
WO2004065545A2 (en) 2004-08-05
JP4619350B2 (ja) 2011-01-26

Similar Documents

Publication Publication Date Title
JP4619350B2 (ja) 乳癌患者の診断および予後
JP5237076B2 (ja) 乳癌患者の診断および予後
US8019552B2 (en) Classification of breast cancer patients using a combination of clinical criteria and informative genesets
JP6404304B2 (ja) メラノーマ癌の予後予測
WO2006015312A2 (en) Prognosis of breast cancer patients
JP2008536094A (ja) 乳癌患者における化学療法反応性を予測する方法
EP2419540B1 (en) Methods and gene expression signature for assessing ras pathway activity
US20030104426A1 (en) Signature genes in chronic myelogenous leukemia
US8105777B1 (en) Methods for diagnosis and/or prognosis of colon cancer

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070112

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091110

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100204

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100430

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100601

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100831

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100928

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101026

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131105

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4619350

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250