本発明の詳細な説明
本開示では、乳癌を有する対象の転帰を予測する方法であって、前記対象由来の腫瘍サンプルを供し;少なくとも表1のNANO46内因性遺伝子リストの遺伝子について、前記腫瘍サンプルにおける発現を決定し;NANO46内因性遺伝子リストの遺伝子の発現に基づいて前記腫瘍サンプルの内因性サブタイプを決定し、ここで前記内因性サブタイプは、少なくとも基底様、ルミナルA、ルミナルB又はHER2豊富からなる群より選択され、前記NANO46内因性遺伝子リストにおける増殖遺伝子のサブセットの発現に基づいて増殖スコアを決定し、前記内因性サブタイプと、増殖スコアと、任意により腫瘍サイズ、結節状態又は組織学的グレード等の1又は複数の臨床病理学的変数との加重和を用いて、再発リスクスコアを算出し、前記再発リスクスコアに基づいて、前記対象の再発リスクの高低を決定することを含む方法を示す。ある態様によれば、スコアが低いほど転帰が良好であり、スコアが高いほど転帰が不良である。
内因性遺伝子は、同じ個体からの生物サンプル反復間で低い発現変動を有し、異なる個体からのサンプル全体では高い発現変動を有するように、統計学的に選択される。即ち、内因性遺伝子は、乳癌分類のための分類遺伝子として使用される。乳癌内因性サブタイプを導くために臨床情報を使用しなかったにもかかわらず、この分類は予後的意義を有することが判明した。内因性遺伝子スクリーニングを用いることにより、乳癌を5種類の分子的に異なる内因性サブタイプ、ルミナルA(LumA)、ルミナルB(LumB)、HER2豊富及び基底様に分類することができる(Perou et al. Nature, 406(6797):747-52 (2000); Sorlie et al. PNAS, 98(19):10869-74 (2001))。
本明細書に記載されるNANO46遺伝子発現アッセイによれば、標準的なホルマリン固定パラフィン包埋腫瘍組織から内因性サブタイプを同定できる。本方法は、乳癌内因性サブタイプに従って対象サンプルを分類するために、教師付きアルゴリズムを利用する。本明細書でNANO46分類モデルと呼ばれるこのアルゴリズムは、乳癌内因性サブタイプを分類するのに優れていると本明細書で特定された内因性遺伝子の既定のサブセットの遺伝子発現プロファイルに基づく。遺伝子のサブセットを、それらの検出に利用される標的特異的配列のプライマーとともに表1に示す。表1Aは、表1で利用された各遺伝子を検出するための標的特異的プローブ配列の配列を提供する。表1Aで提供された配列は代表例にすぎず、本発明を限定するものではない。当業者であれば、表1の遺伝子のいずれか(又はその各々)を検出するために、あらゆる標的配列特異的プローブを利用できる。
表2に、表1のNANO46遺伝子のために選択された配列を示す。
遺伝子発現データの階層クラスタ化解析を用いて、FFPE乳房腫瘍サンプルのトレーニングセットから、4つの内因性サブタイプの典型的な遺伝子発現プロファイル(即ちセントロイド)を予め定義した。これら4つのサブタイプの典型的な遺伝子発現プロファイル(即ちセントロイド)のヒートマップを図1に示す。図1では発現レベルをヒートマップにより図示している。表3には実際の値を示す。
乳癌腫瘍試験サンプル及び試験キットの一部として提供される基準サンプルを用いて乳癌内因性サブタイプ分類試験を実施した後に、ピアソンの相関に基づく計算アルゴリズムでは、試験サンプルのNANO46内因性遺伝子セットに関する正規化・スケール化遺伝子発現プロファイルを4つの乳癌内因性サブタイプの典型的な発現特性と比較する(具体的には、内因性サブタイプ分析は、NANO50セットの遺伝子を用いて決定され、そして、再発リスク(「ROR」)は、NANO46セットの遺伝子を使用することで決定される)。図6では具体的なアルゴリズム変換の模式図を示している。腫瘍サンプルには、そのサンプルに対して最も大きい正の相関を有するサブタイプが割り当てられる。未処置の乳癌患者の実証のトレーニングセットから作成されたカプラン・マイヤー生存曲線は、エストロゲン受容体陽性/陰性及びHER2陽性/陰性患者の両方を含むこの試験集団において、内因性サブタイプが無再発生存率(RFS)に関する予後指標であることを証明している(図2)。
タモキシフェン治療を受けた結節陰性、エストロゲン受容体陽性患者コホートに対する独立した試験では、ルミナルB患者に比べてルミナルA患者がより良好な転帰を示す、ルミナルA及びBサブタイプ患者が圧倒的であることを示す(図3)。ルミナルA患者の転帰は、より現代的な治療計画(すなわち、アロマターゼ阻害剤)を使用し、且つ、転帰を改善するであろう療法に対してより忠実である臨床試験標本を使用することでより一層改善すると予想される。
十分に定義された臨床的特徴及び臨床転帰データを有するFFPE乳房腫瘍サンプルのトレーニングセットが、連続的な再発リスク(ROR)スコアを確立するのに使用された。前記スコアは、内因性サブタイプ、増殖スコア(46個の遺伝子のうちの18個のサブセットの平均遺伝子発現)、及び腫瘍サイズの各々の相関を含めたCoxモデルから係数を使用することで算出される(表4)。
表4の試験変数が対応する係数が掛けられ、そして、合計されて、リスクスコア(「ROR−PT」)がもたらされる。
ROR−PT式=−0.0067×A+0.4317×B+−0.3172×C+0.4894×D+0.1981×E+0.1133×F
これまでの試験では、RORスコアは、5年間タモキシフェン治療を受けたER陽性、結節陰性患者の再発リスクの連続推定値を提供した(Nielsen et al. Clin. Cancer Res., 16(21):5222-5232 (2009))。この結果は、同じコホートからのER陽性、結節陰性患者に対して検証された(図4)。RORスコアはまた、この試験集団内のRFS決定に基づく臨床モデル全体にわたり統計的有意性の改善も示し、そして、従来の臨床病理学的計測と比較したときに、この意思決定ツールの改善された精度のさらなる証明を提供した(Nielsen et al. Clin. Cancer Res., 16(21):5222-5232 (2009))。
遺伝子セットは、増殖に関する既知のマーカーである複数の遺伝子を含む。本発明の方法は、増殖特性(proliferation signature)を提供する遺伝子サブセットの決定を提供する。本発明の方法は、ANLN、CCNE1、CDC20、CDC6、CDCA1、CENPF、CEP55、EXO1、KIF2C、KNTC2、MELK、MKI67、ORC6L、PTTG1、RRM2、TYMS、UBE2C、及び/又はUBE2Tから選択されるNANO46内因性遺伝子の少なくとも1つ、複数の組み合わせ、その各々、或いはそのうちの18個の遺伝子のサブセットの発現を決定することを含んでいてもよい。これらの遺伝子の1つ以上の発現が決定されてもよく、そして、増殖特性指数は、サンプル中でのこれらの遺伝子のうちの1つ以上の正規化された発現推定値を平均することによってもたらされる。サンプルは、高い増殖特性、中程度又は中間の増殖特性、低い増殖特性又は非常に低い増殖特性に割り当てられることができる。生物学的サンプルから増殖特性を決定する方法は、Nielsen et al. Clin. Cancer Res., 16(21):5222-5232 (2009)及び補足のオンラインコンテンツに記載されているとおりである(これらの文書の全体が、援用により本明細書に組み込まれる)。
内因性サブタイプ生物学の説明
ルミナルサブタイプ:乳癌の最も一般的なサブタイプはルミナルサブタイプであるルミナルA及びルミナルBである。これまでの試験では、全乳癌のうちルミナルAが約30%〜40%を占め、ルミナルBが約20%を占めることが示唆されたが、それらはホルモン受容体陽性乳癌の90%超に相当する(Nielsen et al. Clin. Cancer Res., 16(21):5222-5232 (2009))。これらのサブタイプの遺伝子発現パターンは、乳房のルミナル上皮成分に類似している。これらの腫瘍は、エストロゲン受容体(ER)、プロゲステロン受容体(PR)、及びER活性化に関連する遺伝子、例えばLIV1や、GATA3や、サイクリンD1等の高発現、並びにルミナルサイトケラチン8及び18の発現を特徴とする(Lisa Carey & Charles Perou (2009). Gene Arrays, Prognosis, and Therapeutic Interventions. Jay R. Harris et al. (4th ed.), Diseases of the breast (pp. 458-472). Philadelphia, PA: Lippincott Williams & Wilkins)。
ルミナルA:ルミナルA(LumA)乳癌は、細胞周期活性化に関連する遺伝子及びERBB2クラスタについて低レベルの発現しか示さず、ルミナルBより良好な予後をもたらす。ルミナルAサブグループは、全てのサブタイプのうちで最も好ましい予後を有するので、内分泌療法応答腫瘍が豊富になる。
ルミナルB:ルミナルB(LumB)乳癌もまた、ER及びER関連遺伝子を発現する。細胞周期活性化に関連する遺伝子が高度に発現されているので、この腫瘍型は、HER2(+)(〜20%)又はHER2(−)であることができる。(ER発現にもかかわらず)予後は好ましくなく、且つ、内分泌療法応答性は通常、LumAに対して低い。
HER2豊富:HER2豊富サブタイプは、ERBB2やGRB7を含めたERBB2クラスタが高発現の症例の大部分で、通常ER陰性であり、且つ、HER2陽性である。細胞周期活性化に関連する遺伝子が高度に発現されているので、これらの腫瘍は不良な転帰を有する。
基底様:基底様サブタイプは、通常ER陰性であり、ほぼ常に臨床的にHER2陰性であり、且つ、基底上皮サイトケラチン(CK)や上皮生長因子受容体(EGFR)を含めた一連の「基底」バイオマーカーを発現している。細胞周期活性化に関連する遺伝子は高度に発現されている。
臨床変数
本明細書に記載のNANO46分類モデルは、再発(ROR)予測因子の連続的危険を生成するために、臨床変数に関する情報と更に組み合わせることができる。本明細書に記載のように、いくつかの臨床上及び予後の乳癌因子が当技術分野で公知であり、治療予後及び疾患再発の可能性を予測するために用いられる。そのような因子には、例えば、リンパ節関与、腫瘍サイズ、組織学的度数、エストロゲン及びプロゲステロンホルモン受容体の状態、HER−2レベル及び腫瘍倍数性(tumor ploidy)が含まれる。ある態様によれば、再発危険(ROR)スコアは、乳癌と診断されるか又はそれが疑われる対象のために提供される。このスコアは、NANO46分類モデルを、結節の状態(N)及び腫瘍サイズ(T)の臨床上の因子と一緒に用いる。臨床変数の評価は、乳癌病期診断のためのAmerican Joint Committee on Cancer(AJCC)の標準システムに基づく。このシステムでは、一次腫瘍サイズは、0〜4のスケール(T0:一次腫瘍の証拠がない;T1:≦2cm;T2:>2cm〜≦5cm;T3:>5cm;T4:胸壁又は皮膚への直接的拡大を有する任意のサイズの腫瘍)で分類される。リンパ節の状態は、N0〜N3に分類される(N0:所属リンパ節の転移がない;N1:可動性の同側腋窩リンパ節への転移;N2:お互いに、又は他の構造に固定される同側リンパ節への転移;N3:胸骨下の同側リンパ節への転移)。乳癌患者を特定して疾患を病期診断する方法は周知であり、手動検査、生検、患者及び/又は家族の病歴の精査、及び画像化技術、例えばマモグラフィー、磁気共鳴画像化(MRI)及び陽電子放出断層撮影法(PET)を含めることができる。
サンプル源
本開示のある態様によれば、乳癌サブタイプは、1つ又は複数の対象サンプル中の、表1に列挙される内因性遺伝子の発現のパターン又はプロファイルの評価を通して調査される。議論において、用語対象、又は対象サンプルとは、健康状態及び/又は疾患状態に関係なく個体を指す。対象は、対象、試験参加者、対照対象、スクリーニング対象、又は本開示の文脈でサンプルが得られ、評価される任意の他のクラスの個体であることができる。従って、対象は、乳癌と診断されていてもよく、乳癌の1つ又は複数の症状、又は家族歴(遺伝性)又は病歴(医療)因子などの乳癌の素因を抱えてもよく、乳癌のための治療又は療法を受けていてもよい、などである。或いは、対象は、前記の因子又は基準のいずれかに関して健康であってもよい。用語「健康」は、任意の絶対的評価又は状態に対応するように定義することができないので、本明細書で用いる用語「健康」は、乳癌状態と比較したものであることが理解される。従って、任意の特定の疾患又は疾患基準に関して健康と定義される個体は、実際、乳癌以外の1つ又は複数の癌を含む任意の他の1つ又は複数の疾患と診断することができるか、又は任意の他の1つ又は複数の疾患基準を示すことができる。しかし、健康な対照は、好ましくはいかなる癌も有しない。
特定の態様によれば、乳癌内因性サブタイプを予測する方法は、癌の細胞又は組織を含む生体サンプル、例えば乳房組織サンプル又は一次乳房腫瘍組織サンプルを収集することを含む。「生体サンプル」は、内因性遺伝子の発現を検出することができる細胞、組織又は体液の任意のサンプリングを意味するものとする。そのような生体サンプルの例には、生検材料及び塗抹標本が含まれるが、これらに限定されない。本発明で有用な体液には、血液、リンパ、尿、唾液、乳首吸引液、婦人科体液又は任意の他の体分泌物又はそれらの派生物が含まれる。血液には、全血、血漿、血清、又は血液の任意の派生物を含めることができる。一部の態様によれば、生体サンプルには、乳房細胞、特に生検からの乳房組織、例えば乳房腫瘍組織サンプルが含まれる。生体サンプルは、例えば、領域を削り取るかスワビングすること、針を用いて細胞もしくは体液を吸引すること、又は組織サンプル(生検材料)を取り出すことを含む、様々な技術によって対象から得ることができる。様々な生体サンプルを収集する方法は、当技術分野で周知である。一部の態様によれば、乳房組織サンプルは、例えば針吸引生検、コア針生検又は摘出生検によって得られる。検体を保存するために、及び検査を容易にするために、固定剤及び染色溶液を細胞又は組織に加えてもよい。生体サンプル、特に乳房組織サンプルをスライドガラスへ移し、拡大して観察してもよい。ある態様によれば、生体サンプルはホルマリン固定され、パラフィン包埋された乳房組織サンプル、特に一次乳房腫瘍サンプルである。様々な態様によれば、組織サンプルは、病理学者によって導かれた組織コアサンプルから得られる。
発現プロファイリング
様々な態様によれば、本開示は、対象で乳癌を分類するか、予後を決定するか、又は監視するための方法を提供する。この態様によれば、内因性遺伝子の発現の分析から得られるデータを、1つ又は複数のパターン認識アルゴリズムを用いて評価する。そのような分析法は、試験データを分類するために用いることができる、予測モデルを形成するために用いることができる。例えば、第一に公知のサブタイプのサンプル(例えば、特定の乳癌内因性サブタイプ、LumA、LumB、基底様、HER2豊富又は正常様を有することが公知の対象から)からのデータ(「モデル化データ」)を用いてモデル(「予測数理モデル」)を形成し、第二にサブタイプに従って未知のサンプル(例えば、「試験サンプル」)を分類するために、1つの便利で特に有効な分類方法は、多変量解析モデル化を使用する。パターン認識法は、例えば、言語学、フィンガープリント、化学及び心理学にわたる多くの異なる種類の問題を特徴づけるために、広く用いられている。本明細書に記載の方法との関連では、パターン認識は、データを分析し、それによってサンプルを分類し、様々な観察値に基づいていくつかの従属変数の値を予測するための、パラメトリック及びノンパラメトリックの両方の多変量統計学の使用である。2つの主な手法がある。1セットの方法は「教師なし」と言われ、これらは単に合理的な方法でデータの複雑性を低減させ、更に、ヒトの目によって解釈することができるディスプレイプロットを生成する。しかし、この種の手法は、予測アルゴリズムを養成するために用いられる最初のサンプル集団とは独立に、対象に由来するサンプルを分類するために用いることができる臨床アッセイの開発には適さないかもしれない。
他の手法は「教師付き」と呼ばれ、それによって、独立した検証データセットで次に評価される数理モデルを生成するために、公知のクラス又は予後を有するサンプルのトレーニングセットが用いられる。ここでは、内因性遺伝子発現データの「トレーニングセット」は、各サンプルの「サブタイプ」を正しく予測する統計モデルを構築するために用いられる。このトレーニングセットを、独立データ(検定セット又は検証セットと呼ばれる)で次に検定し、コンピュータに基づくモデルの頑健性を決定する。これらのモデルは「エキスパートシステム」と呼ばれることもあるが、様々な異なる数学的手法に基づくことができる。教師付き方法は減少した次元数(例えば、最初の数主成分)のデータセットを用いることができるが、一般的に、全次元数の未削減データを用いる。すべての場合に、本方法は、その内因性遺伝子発現プロファイルに関して各サブタイプを特徴づけて、分離する、多変量境界の定量的な記述を可能にする。任意の予測に関して、例えば適合度に置かれる確率のレベルなどの信頼限界を得ることも可能である。選択されたサンプルを分析から除外することによって、交差検証を用いて、予測モデルの頑健性を確認することもできる。
本明細書に記載のNANO46分類モデルは、表1に記載される内因性遺伝子を用いて、複数の対象サンプルの遺伝子発現プロファイルに基づく。複数のサンプルは、各サブタイプクラスに属する対象に由来する十分な数のサンプルを含む。この関係において「十分なサンプル」又は「代表的な数」は、各サブタイプに由来する、各サブタイプと群の他のすべてとを確実に区別することができる分類モデルを構築するのに十分であるサンプルの数量を意味するものとする。教師付き予測アルゴリズムは、アルゴリズムを「養成する」ための、客観的に選択されたプロトタイプサンプルのプロファイルに基づいて開発される。拡張された内因性遺伝子を用い、援用によりその全体が本明細書に組み込まれる国際特許出願公開第WO2007/061876号に開示される方法によってサンプルを選択し、サブタイプに分ける。或いは、サンプルは、乳癌サブタイプの分類のための任意の公知のアッセイによってサブタイプに分けることができる。サブタイプに従ってトレーニングサンプルを層化した後に、セントロイド(centroid)に基づく予測アルゴリズムを用いて、表1に列挙される内因性遺伝子セットの発現プロファイルに基づいてセントロイドを構築する。
ある態様によれば、予測アルゴリズムは、援用によりその全体が本明細書に組み込まれるNarashiman and Chu (2002) PNAS 99:6567-6572に記載されているものに関係がある、最近傍セントロイド方法論である。本開示では、本方法は各サブタイプの正規化されたセントロイドを計算する。このセントロイドは、その遺伝子のクラス内の標準偏差によって割った、各サブタイプ(又は「クラス」)の各遺伝子の平均遺伝子発現である。最近傍セントロイド分類は、新しいサンプルの遺伝子発現プロファイルをとり、それをこれらのクラスセントロイドの各々と比較する。サブタイプ予測は、5個のセントロイドとの各試験例のスピアマン順位相関を計算し、最近傍セントロイドに基づいてサンプルをサブタイプに割り当てることによって実行される。
内因性遺伝子の発現の検出
表1に列挙される内因性遺伝子の発現を検出するために当技術分野で利用可能な任意の方法が、本明細書に包含される。「発現を検出する」ことは、内因性遺伝子のRNA転写産物又はその発現生成物の量又は存在を決定することを意味するものとする。本開示の内因性遺伝子の発現を検出する方法、すなわち遺伝子発現プロファイリングには、ポリヌクレオチドのハイブリダイゼーション分析に基づく方法、ポリヌクレオチドの配列決定に基づく方法、免疫組織化学方法及びプロテオミクスに基づく方法が含まれる。これらの方法は、一般に、表1に列挙される内因性遺伝子の発現生成物(例えば、mRNA)を検出する。好ましい態様によれば、PCRに基づく方法、例えば逆転写PCR(RT−PCR)(Weis et al., TIG 8:263- 64, 1992)、及びアレイに基づく方法、例えばマイクロアレイ(Schena et al., Science 270:467- 70, 1995)が用いられる。「マイクロアレイ」は、ハイブリダイズすることが可能なアレイ要素、例えばポリヌクレオチドプローブの、基質上での順序とおりの配置を意味するものとする。用語「プローブ」は、特異的に目的とする標的生体分子、例えば、内因性遺伝子によってコードされるか又はそれに対応するヌクレオチド転写産物又はタンパク質に選択的に結合することができる任意の分子を指す。プローブは、当業技術者が合成することができるか、又は適当な生物学的調製物から得ることができる。プローブは、標識されるように特異的に設計することができる。プローブとして利用することができる分子の例には、RNA、DNA、タンパク質、抗体及び有機分子が含まれるが、これらに限定されない。
多くの発現検出方法が、単離されたRNAを用いる。一般的に、出発物質は、生体サンプル、例えば腫瘍又は腫瘍細胞系、及びそれぞれ対応する正常な組織又は細胞系から単離される総RNAである。RNAの原料が一次腫瘍である場合、RNA(例えば、mRNA)は、例えば、凍結又はアーカイブされた、パラフィン包埋及び固定された(例えば、ホルマリン固定)組織サンプル(例えば、病理学者によって導かれた組織コアサンプル)から抽出することができる。
RNA抽出のための一般方法は当技術分野で周知であって、Ausubel et al., ed., Current Protocols in Molecular Biology, John Wiley & Sons, New York 1987-1999を含む、分子生物学の標準教科書に開示されている。パラフィン包埋組織からのRNA抽出の方法は、例えば、Rupp and Locker, Lab Invest. 56:A67, (1987); and De Andres et al. Biotechniques 18:42-44, (1995)に開示されている。詳細には、RNA単離は、Qiagen(Valencia、CA)などの民間の製造業者からの精製キット、緩衝液セット及びプロテアーゼを製造業者の指示とおりに用いて実施することができる。例えば、培養細胞からの総RNAは、Qiagen RNeasyミニカラムを用いて単離することができる。他の市販のRNA単離キットには、MASTERPURE(商標)完全DNA及びRNA精製キット(Epicentre、Madison、Wis.)及びパラフィンブロックRNA単離キット(Ambion、Austin、TX)が含まれる。組織サンプルからの総RNAは、例えばRNA Stat−60(Tel-Test、Friendswood、TX)を用いて単離することができる。FFPEからの全RNAは、例えば、High Pure FFPE RNA Microkit, Cat No. 04823125001(Roche Applied Science, Indianapolis, IN)を使用することで単離することができる。腫瘍から調製されるRNAは、例えば塩化セシウム密度勾配遠心法によって単離することができる。更に、当業者に周知である技術、例えばChomczynski(米国特許第4,843,155号)のシングルステップRNA単離法を用いて、多数の組織サンプルを容易に処理することができる。
単離されたRNAは、それらに限定されないがPCR分析及びプローブアレイを含む、ハイブリダイゼーション又は増幅アッセイで用いることができる。RNAレベルの検出のための1つの方法は、単離されたRNAを、検出する遺伝子によってコードされるmRNAにハイブリダイズすることができる核酸分子(プローブ)と接触させることを含む。核酸プローブは、例えば完全長cDNA又はその部分、例えば長さが少なくとも7、15、30、60、100、250又は500個のヌクレオチドであり、ストリンジェントな条件の下で本開示の内因性遺伝子又は任意の誘導体DNAもしくはRNAに特異的にハイブリダイズするのに十分であるオリゴヌクレオチドであってもよい。プローブとのmRNAのハイブリダイゼーションは、問題の内因性遺伝子が発現されていることを示す。
ある態様によれば、例えば単離されたmRNAをアガロースゲルの上に流し、ゲルからニトロセルロースなどの膜へmRNAを移すことによって、mRNAを固体表面に固定し、プローブと接触させる。代替の態様によれば、例えばAgilent遺伝子チップアレイで、プローブを固体表面に固定し、mRNAをプローブと接触させる。当業者は、本開示の内因性遺伝子の発現レベルの検出で用いるために、公知のmRNA検出方法を容易に応用することができる。
サンプル中の内因性遺伝子の発現生成物のレベルを測定するための代替法は、例えば、RT−PCR(米国特許第4,683,202号)、リガーゼ連鎖反応(Barany, PNAS USA 88: 189-93, (1991))、自律的配列複製(Guatelli et al., Proc. Natl. Acad. Sci USA 87: 1874-78, (1990))、転写増幅系(Kwoh et al., Proc. Natl. Acad. ScL USA 86: 1173-77, (1989))、Q−βレプリカーゼ(Lizardi et al., Bio/Technology 6:1197, (1988))、ローリングサークル複製(米国特許第5,854,033号)による核酸増幅のプロセス、又は任意の他の核酸増幅法と、それに続く、当業者に周知である技術を用いる増幅分子の検出とを含む。これらの検出スキームは、そのような分子が非常に少数存在する場合、核酸分子の検出に特に有用である。
本開示の特定の側面では、内因性遺伝子の発現は、定量的RT−PCRによって評価される。多数の異なるPCR又はQPCRプロトコールが当技術分野で公知であり、本明細書の下に例示されており、表1に列挙される内因性遺伝子の検出及び/又は定量のためのここに記載の組成物を用いる用途のために、直接に適用又は応用することができる。一般に、PCRでは、標的ポリヌクレオチド配列は、少なくとも1つのオリゴヌクレオチドプライマー又は1対のオリゴヌクレオチドプライマーとの反応によって増幅される。プライマーは標的核酸の相補的領域にハイブリダイズし、DNAポリメラーゼは標的配列を増幅するためにプライマーを伸長させる。ポリメラーゼに基づく核酸増幅生成物を提供するのに十分な条件の下で、1つのサイズの核酸断片が反応生成物(増幅生成物である標的ポリヌクレオチド配列)を支配する。単一の標的ポリヌクレオチド配列の濃度を高めるために、増幅サイクルを繰り返す。PCRのために通常用いられる任意のサーモサイクラーで反応を実行することができる。しかし、リアルタイム蛍光測定能力を有するサイクラー、例えば、SMARTCYCLER(登録商標)(Cepheid、Sunnyvale、CA)、ABI PRISM 7700(登録商標)(Applied Biosystems、Foster City、Calif.)、ROTOR-GENE(商標)(Corbett Research、Sydney、Australia)、LIGHTCYCLER(登録商標)(Roche Diagnostics Corp.、Indianapolis、Ind.)、ICYCLER(登録商標)(Biorad Laboratories、Hercules、Calif.)及びMX4000(登録商標)(Stratagene、La Jolla、Calif.)が好ましい。
本開示の別の態様によれば、発現プロファイリングのためにマイクロアレイが用いられる。マイクロアレイは、異なる実験の間の再現性のために、この目的のために特によく適している。DNAマイクロアレイは、多数の遺伝子の発現レベルの同時測定のために、1つの方法を提供する。各アレイは、固体支持体に結合されている捕捉プローブの再現性の高いパターンからなる。標識RNA又はDNAは、アレイ上の相補的プローブにハイブリダイズされ、レーザー走査によって次に検出される。アレイ上の各プローブのハイブリダイゼーション強度が判定され、相対遺伝子発現レベルを表す定量値に変換される。例えば、米国特許第6,040,138号、第5,800,992号及び第6,020,135号、第6,033,860号及び第6,344,316号を参照。サンプル中の多数のRNAの遺伝子発現プロファイルを決定するために、高密度のオリゴヌクレオチドアレイが特に有用である。
好ましい態様によれば、nCounter(登録商標)分析システムは、内因性遺伝子発現を検出するのに使用される。nCounter(登録商標)分析システムの基本は、アッセイされるべき各々の核酸標的に割り当てられた特有のコードである(国際特許出願公開WO08/124847及びGeiss et al. Nature Biotechnology. 2008. 26(3): 317-325;それらの内容の全体が援用によって本明細書中に組み込まれる。前記コードは、アッセイされるべき各標的の特有のバーコードを作り出す発色蛍光スポットの規則正しいシリーズから構成される。プローブ対は、各DNA又はRNA標的、ビオチン化捕捉プローブ及び蛍光バーコードを有するレポータープローブに対して設計される。このシステムはまた、本明細書中でナノレポーターコードシステムとも呼ばれる。
特異的レポーター及び捕捉プローブは、各標的に対して合成される。簡単に言えば、配列特異的DNAオリゴヌクレオチドプローブが、コード特異的レポーター分子に取り付けられる。捕捉プローブは、各標的に対する第2の配列特異的DNAオリゴヌクレオチドにビオチンを含むユニバーサルオリゴヌクレオチドに連結することによって作製される。レポータープローブ及び捕捉プローブは、単一のハイブリダイゼーション混合物「プローブライブラリ」へと全てプールされる。
各標的の相対的量は、単一の多重ハイブリダイゼーション反応において測定される。サンプルはプローブライブラリと組み合わせられ、そして溶液中でハイブリダイゼーションが起こる。ハイブリダイゼーション後に、三部分ハイブリダイズ複合体は、捕捉及びレポータープローブ上に存在しているユニバーサル配列に相補的なオリゴヌクレオチドに連結された磁性ビーズを使用した、ツーステップ手順で精製される。この二段階の精製プロセスは、ハイブリダイゼーション反応が大過剰の標的特異的プローブを用いて完了まで運転されることを可能にする。なぜなら、前記標的特異的プローブは、最終的に取り除かれるので、それにより、サンプルの結合及び画像化を妨げない。全てのハイブリダイゼーション後ステップは、特注の液体取り扱いロボット(プレップステーション, NanoString Technologies)によりロボット制御で扱われる。
精製反応物は、プレップステーションによってサンプルカートリッジの個々のフローセル内に移され、前記捕捉プローブを介してストレプトアビジン被覆表面に結合され、電気泳動にかけられ、前記レポータープローブを伸長させ、そして、固定される。処理後に、前記サンプルカートリッジは、完全に自動化された画像化及びデータ集積デバイス(Digital Analyzer, NanoString Technologies)へと移される。標的の発現レベルは、各サンプルを画像化し、その標的が検出されるコードの倍数を計算することによって決定される。データは、サンプルあたりの計数/標的を列挙する単一のスプレッドシート形式で出力される。
このシステムはナノレポーターと共に使用されてもよい。ナノレポーターに関する追加的な開示は、国際特許出願公開WO07/076129及びWO07/076132で見られ、それらの内容はその全体が本明細書中に組み込まれる。更に、核酸プローブ及びナノレポーターという用語には、国際特許出願公開WO2010/019826に記載の合理的に設計されたもの(例えば合成配列)を含んでいてもよい。前記文献はその全体が援用によって本明細書中に組み込まれる。
データ処理
例えば、欠落データ、翻訳、スケール化、正規化、重み付け、その他に対処することによって、遺伝子発現データを前処理することがしばしば有用である。多変量予測法、例えば主成分解析(PCA)及び部分最小二乗解析(PLS)は、いわゆるスケール化感受性法である。研究するデータの種類についての事前の知識及び経験を用いることにより、多変量モデル化の前のデータの品質は、スケール化及び/又は重み付けによって高めることができる。十分なスケール化及び/又は重み付けは、データ内に隠されている重要で興味深い変動を明らかにすることができ、従って、以降の多変量モデル化をより効率的にすることができる。スケール化及び重み付けは、研究系についての知識及び経験に基づいてデータを正しい基準に置くために用いることができ、従って、データに既に本来的に存在するパターンを明らかにすることができる。
可能な場合、欠落データ、例えばカラム値のギャップは回避するべきである。しかし、必要に応じて、そのような欠落データは、例えば、カラムの平均値(「平均充足」);ランダムな値(「ランダム充足」);又は主成分解析に基づく値(「主成分充足」)で置換又は「充足」することができる。
記述子座標軸の「翻訳」が有用となることがある。そのような翻訳の例には、正規化及び平均センタリングが含まれる。「正規化」は、サンプル間の変動を除去するために用いることができる。マイクロアレイデータについては、正規化の過程は、2つの標識色素の蛍光強度のバランスをとることによって系統的誤差を除去することを目的とする。色素の偏りは、色素標識効率、熱及び光感度の差、ならびに2つのチャンネルを走査するためのスキャナ設定を含む様々な発生源から来る可能性がある。正規化因子を算出するために通常用いられるいくつかの方法には、以下のものが含まれる。(i)アレイ上のすべての遺伝子を用いる全体的正規化、(ii)継続的に発現されるハウスキーピング/不変遺伝子を用いるハウスキーピング遺伝子正規化、及び(iii)ハイブリダイゼーションの間に加えられる外来対照遺伝子の公知の量を用いる内部対照正規化(Quackenbush Nat. Genet. 32 (Suppl.), 496-501 (2002))。ある態様によれば、本明細書に開示される内因性遺伝子は、対照ハウスキーピング遺伝子に正規化することができる。例えば、援用によりその全体が本明細書に組み込まれる、米国特許出願公開第2008/0032293号に記載のハウスキーピング遺伝子を正規化のために用いることができる。例示的なハウスキーピング遺伝子には、MRPL19、PSMC4、SF3A1、PUM1、ACTB、GAPD、GUSB、RPLP0及びTFRCが含まれる。本明細書に開示される方法は、任意の特定のハウスキーピング遺伝子への正規化に縛られず、当技術分野で公知である任意の適するハウスキーピング遺伝子を用いることができることは、当業技術者に理解されよう。
多くの正規化手法が可能であり、それらは分析のいくつかのポイントのいずれかで、しばしば適用することができる。ある態様によれば、正規化機能を平滑化する全体的局所的に加重される散布図である、LOWESS法を用いてマイクロアレイデータを正規化する。別の態様によれば、qPCRデータは、複数のハウスキーピング遺伝子のセットの幾何平均に正規化される。
解釈を単純化するために、「平均センタリング」を用いることもできる。通常、各記述子について、すべてのサンプルのその記述子の平均値が引かれる。この方法で、記述子の平均は起点と一致し、すべての記述子はゼロに「センタリング」される。「単位分散スケール化」では、データを同等の分散にスケール化することができる。通常、各記述子の値は、1/StDevによってスケール化され、そこにおいて、StDevはすべてのサンプルについてその記述子の標準偏差である。「パレートスケール化」は、ある意味では、平均センタリングと単位分散スケール化との間の中間である。パレートスケール化では、各記述子の値は、1/sqrt(StDev)スケール化され、そこにおいて、StDevはすべてのサンプルについてその記述子の標準偏差である。この方法で、各記述子は、その最初の標準偏差に数値的に同等である分散を有する。パレートスケール化は、例えば、生データ又は平均センタリングデータについて実施することができる。
データが正のスキューを有する場合、及び/又はデータが大幅に、例えば数桁にわたって広がる場合に解釈を支援するために、「対数スケール化」を用いることができる。通常、各記述子について、値はその値の対数によって置換される。「同等範囲スケール化」では、各記述子は、すべてのサンプルについてその記述子の範囲で割られる。この方法で、すべての記述子は、同じ範囲、すなわち1を有する。しかし、この方法は、外れ点の存在に影響される。「自動スケール化」では、各データベクターは平均センタリングされ、単位分散がスケール化される。この技術は非常に有用であるが、その理由は、各記述子が次に等しく加重され、大きな値及び小さな値が同等の強調で処理されるからである。このことは、非常に低いが、まだ検出可能なレベルで発現される遺伝子にとって重要となることがある。
ある態様によれば、1つ又は複数の試験サンプルについてデータを収集し、本明細書に記載のNANO46分類モデルを用いて分類する。複数の分析からのデータを比較する場合(例えば、1つ又は複数の試験サンプルの発現プロファイルを、独立した試験で収集、分析されたサンプルから構築されたセントロイドと比較する)、これらのデータセット全般にわたってデータを正規化する必要が生じる。ある態様によれば、これらのデータセットを一緒にするために、基準加重識別(DWD)が用いられる(Benito et al. (2004) Bioinformatics 20(1): 105-114、その全体が援用により本明細書に組み込まれる)。DWDは、別々のデータセットに存在する系統的偏りを特定し、これらの偏りを補償するために次に全体的に調整することができる多変量解析ツールである。本質的には、各別々のデータセットはデータポイントの多次元クラウドであり、DWDは2つのポイントのクラウドをとり、それがより最適に他に重なるように1つをシフトさせる。
その方法を実施すること、及び/又は結果を記録することができる任意の装置を用いて、本明細書に記載の方法を実施すること、及び/又は結果を記録することができる。用いることができる装置の例には、すべての型のコンピュータを含む電子算出装置が含まれるが、これらに限定されない。本明細書に記載の方法を実施し、及び/又はコンピュータに記録する場合、その方法のプロセスを実施するためのコンピュータを構成するために用いることができるコンピュータプログラムは、コンピュータプログラムを内蔵することができる任意のコンピュータ可読媒体に内蔵されてもよい。用いることができるコンピュータ可読媒体の例には、ディスケット、CD−ROM、DVD、ROM、RAM、ならびに他のメモリ及びコンピュータ記憶装置が含まれるが、これらに限定されない。これらの方法のプロセスを実施し、及び/又は結果を記録するためのコンピュータを構成するために用いることができるコンピュータプログラムは、電子ネットワーク上で、例えばインターネット、イントラネット又は他のネットワーク上で提供されてもよい。
再発リスクの算出
内因性サブタイプ及び任意選択で他の臨床変数との関連で乳癌予後を予測する方法が、本明細書で提供される。予後は、全体のもしくは疾患特異的生存期間、無事象生存期間、又は特定の治療もしくは療法に応じる予後を指すことができる。特に、本方法は、長期の、無病生存期間の確率を予測するために用いることができる。「乳癌患者の生存確率を予測する」ことは、患者が根底にある乳癌の結果として死に至るリスクを評価することを意味するものとする。「長期の、無病生存期間」は、患者が、初期診断又は治療から少なくとも5年又は少なくとも10年以上の間に根底にある乳癌から死亡しないか、又はその再発を起こさないことを意味するものとする。
ある態様によれば、予後は、サブタイプに従う対象の分類に基づいて予測される。サブタイプ帰属を提供することに加えて、NANO46バイオインフォマティクスモデルは、疾患状態及び治療選択肢に関係なく任意の患者集団で用いることができる再発リスク(ROR)スコアに翻訳される、全4つのサブタイプへの試験サンプルの類似性の測定法を提供する。内因性サブタイプ及びRORは、例えば、ネオアジュバントのタキサン及びアントラサイクリンによる化学療法で治療される女性での、病理学的著効の予測においても価値がある(Rouzier et al., J Clin Oncol 23:8331-9 (2005)、その全体が援用により本明細書中に組み込まれる)。従って、本開示の様々な態様によれば、予後を予測するために再発リスク(ROR)モデルが用いられる。これらのリスクモデルを用いて、対象を、低、中、高の再発リスク群に層化することができる。RORの算出は、治療決定の指針となる、及び/又は療法への応答を監視するための予後情報を提供することができる。
本明細書に記載の一部の態様によれば、NANO46によって規定される内因性サブタイプ及び/又は他の臨床パラメータの予後診断性能は、リスク率及びその信頼区間の推定を提供する生存データのための回帰法である、Cox Proportional Hazards Model解析を用いて評価される。Coxモデルは、患者の生存と特定の変数との間の関係を探究するための、よく認識されている統計技術である。この統計的方法は、彼らの予後変数(例えば、本明細書に記載のように、追加の臨床因子を有するか又は有しない内因性遺伝子発現プロファイル)が与えられると、個人のリスク(すなわち、リスク)の推定を可能にする。「リスク率」は、特定の予後変数を提示する患者の、任意の所与の時点での死のリスクである。一般には、Spruance et al., Antimicrob. Agents & Chemo. 48:2787-92 (2004)を参照。
上記のように、本明細書に記載のNANO46分類モデルは、サブタイプ基準(又は相関関係)を単独で用いるか、又はサブタイプ基準を臨床変数と一緒に用いて、再発リスクについて養成することができる。ある態様によれば、試験サンプルのリスクスコアは、下記式を用いて内因性サブタイプ基準を単独で用いて算出される。
ROR=0.05×Basal+0.11×Her2+−0.25×LumA+0.07×LumB+−0.11×正常、式中、変数「Basal」、「Her2」、「LumA」、「LumB」及び「正常」は、試験サンプルからの発現プロファイルを、Gene Expression Omnibus(GEO)に寄託されている遺伝子発現データを用いて構築されるセントロイドと比較したときの、各分類それぞれについてのセントロイドまでの基準である。
リスクスコアは、同じく、試験発現プロファイルを、受入番号GSE2845としてGEOに寄託されている遺伝子発現データを用いて構築されたセントロイドと比較する場合、乳癌サブタイプと臨床変数腫瘍サイズ(T)及び結節の状態(N)との組み合わせを用いて、下記式、ROR(完全)=0.05×Basal+0.1×Her2+−0.19×LumA+0.05×LumB+−0.09×正常+0.16×T+0.08×N、を用いて算出することもできる。
更に別の態様によれば、試験サンプルのリスクスコアは、下記式を用いて内因性サブタイプ基準を単独で用いて算出される:
ROR−S=0.05×Basal+0.12×Her2+−0.34×LumA+0.0.23×LumB、式中、変数「Basal」、「Her2」、「LumA」及び「LumB」は上記のとおりであり、試験発現プロファイルは、受入番号GSE2845としてGEOに寄託されている遺伝子発現データを用いて構築されたセントロイドと比較される。更に別の態様によれば、リスクスコアは、乳癌サブタイプと臨床変数腫瘍サイズ(T)との組み合わせを用いて、下記式(変数は上記のとおり)
ROR−C=0.05×基底+0.11×Her2+−0.23×LumA+0.09×LumB+0.17×Tを用いて算出することもできる。
更に別の態様によれば、試験サンプルのリスクスコアは、下記式を用いて増殖特性(「Prolif」)と組み合わせて内因性サブタイプを用いて算出される:
ROR−P=−0.001×Basal+0.7×Her2+−0.95×LumA+0.49×LumB+0.34×Prolif、式中、変数「Basal」、「Her2」、「LumA」、「LumB」及び「Prolif」は上記のとおりであり、試験発現プロファイルは、受入番号GSE2845としてGEOに寄託されている遺伝子発現データを用いて構築されたセントロイドと比較される。
更に別の態様によれば、リスクスコアは、乳癌サブタイプと、増殖特性と、臨床変数腫瘍サイズ(T)との組み合わせを用いて、前記表3との組み合わせを用いて、ROR−PTを用いて算出することもできる。
サブタイプの検出
エストロゲン(ER)、プロゲステロン(PgR)、HER2、及びKi67の免疫組織化学を、色原体として3,3’−ジアミノベンジジンを用いる標準的なストレプトアビジン−ビオチン複合体法で連続切片に対して同時に行った。ER、PgR、及びHER2の解釈のための染色を、既に説明したように実施することもできるが(Cheang et al., Clin Cancer Res. 2008;14(5):1368-1376.)、当分野で公知の任意の方法を使用することもできる。
例えば、Ki67抗体(クローンSP6;ThermoScientific, Fremont, CA)を1:200の希釈となるように添加して32分間インキュベートし、次いでVentana Benchmark自動免疫染色装置(Ventana,Tucson AZ)の標準的なCell Conditioner 1(商品名CC1の緩衝液)プロトコールに従って98℃で30分間インキュベートした。ER抗体(クローンSP1;ThermoFisher Scientific,Fremont CA)を、1:250の希釈で使用し、10分間インキュベートし、8分間のマイクロウエーブ後、抗原を10mMのクエン酸ナトリウム(pH 6.0)で回収することができる。すぐに使用できるPR抗体(クローン1E2;Ventana)を、上記のようにCC1プロトコールに従って使用することができる。HER2染色を、スチーマで30分間、95℃で加熱して0.05Mのトリス緩衝液(pH 10.0)で抗原を回収した後に、1:100に希釈したSP3抗体(ThermoFisher Scientific)で行うことができる。HER2蛍光in situハイブリダイゼーション(FISH)アッセイでは、製造業者の取扱説明書に従うが、既に説明したように前処置及びハイブリダイゼーションに変更を加えて、PathVysion HER-2 DNAプローブキット(Abbott Molecular,Abbott Park,IL)を使用することにより、スライドを、プローブを用いてLSI(領域特異的プローブ(locus-specific identifier))HER2/neu及び動原体17にハイブリダイズさせることができる(Brown LA, Irving J, Parker R, et al. Amplification of EMSY, a novel oncogene on 11q13, in high grade ovarian surface epithelial carcinomas. Gynecol Oncol. 2006;100(2):264-270)。次いで、スライドを4’,6-ジアミジノ-2-フェニルインドールで対比染色することができ、染色された物質を、Zeiss Axioplan落射蛍光顕微鏡で可視化し、そしてMetafer画像収集システム(Metasystems,Altlussheim,Germany)でシグナルを分析した。次いで、免疫組織化学アッセイによるバイオマーカーの発現に2人の病理学者がスコアを付けることができ、これらの病理学者は、臨床病理学的特性及び転帰について盲検化され、他の乳癌のコホートに対して開発されたバイオマーカー発現レベルについての、既に確立されて公表された基準を使用した。
既に説明したように、腫瘍核の1%を超えて免疫染色が観察された場合、腫瘍は、ER又はPRに対して陽性であると見なされた。免疫染色が、HercepTest基準に従って3+のスコアが付けられた場合は、腫瘍は、HER2に対して陽性であると見なされ、蛍光in situハイブリダイゼーションの増幅比2.0以上が、免疫組織化学的に曖昧な腫瘍(2+のスコア)を分離するために使用されるカットポイントである(Yaziji, et al., JAMA, 291(16):1972-1977 (2004))。Ki67には、2人の病理学者によって、陽性免疫染色が背景レベルよりも高い腫瘍細胞核の割合について視覚的にスコアが付けられた。
他の方法を用いてサブタイプを検出することもできる。斯かる技術としては、ELISA、ウエスタンブロット、ノーザンブロット、又はFACS分析が挙げられる。
キット
本開示はまた、乳癌内因性サブタイプを分類するために、及び/又は予後情報を提供するために有用なキットも説明する。これらのキットは、表1に列挙される内因性遺伝子に特異的な捕捉プローブ及び/又はプライマーのセット、ならびに内因性遺伝子の発現生成物の検出及び/又は定量化を促進するのに十分な試薬を含む。キットは、コンピュータ可読媒体をさらに含むことができる。
本開示のある態様によれば、捕捉プローブは、アレイの上に固定化される。「アレイ」は、ペプチド又は核酸プローブがその支持体又は基質に結合している、固体支持体又は基質を意味するものとする。アレイは、異なる公知の場所にある基質の表面に結合している、複数の異なる捕捉プローブを一般に含む。本発明のアレイは、内因性遺伝子の発現生成物に特異的に結合することができる複数の捕捉プローブを有する基質を含む。基質上の捕捉プローブの数は、アレイの目的によって異なる。アレイは、低密度アレイ又は高密度アレイであることができ、4個以上、8個以上、12個以上、16個以上、32個以上のアドレスを含むことができるが、表1に記載の46個の内因性遺伝子のための捕捉プローブを最小限含む。
物理的合成法を用いるこれらのアレイの合成技術は、例えば、すべての目的のために援用によりその全体が本明細書に組み込まれる米国特許第5,384,261号に記載されている。このアレイは、実質的にいかなる形の表面にも、又は複数の表面にさえ形成することができる。アレイは、ビーズ、ゲル、重合体表面、光ファイバーなどの線維、ガラス又は他の任意の適当な基質の上のプローブ(例えば、核酸結合性プローブ)であることができる。それぞれはすべての目的のために本明細書にその全体が組み込まれる、米国特許第5,770,358号、第5,789,162号、第5,708,153号、第6,040,193号及び第5,800,992号を参照。アレイは、装置の上で診断又は他の操作を可能にする方法でパックすることができる。例えば、援用により本明細書に組み込まれる、米国特許第5,856,174号及び第5,922,591号を参照。
別の態様によれば、キットは、表1に列挙される内因性遺伝子の各々の検出及び/又は定量化に十分な、オリゴヌクレオチドプライマーセットを含む。オリゴヌクレオチドプライマーは、凍結乾燥又は再構成された形で提供されてもよく、又はヌクレオチド配列セットとして提供されてもよい。ある態様によれば、プライマーはマイクロプレートフォーマットで提供され、そこでは各プライマーセットがマイクロプレートの1つのウェル(又は反復試験区の場合のように複数のウェル)を占める。下に述べるように、マイクロプレートは、1つ又は複数のハウスキーピング遺伝子の検出に十分なプライマーをさらに含むことができる。キットは、表1に記載の遺伝子からの発現生成物の増幅に十分な、試薬及び指示書をさらに含むことができる。
例えば、比較、精査、回収及び/又は改変のために速いアクセスを容易にするために、分子シグナチュア/発現プロファイルは、一般的にデータベースに記録される。最も一般的には、データベースはコンピュータ装置によってアクセス可能なリレーショナルデータベースであるが、他のフォーマット、例えば、写真、アナログ又はデジタル画像読み出し情報、表算出ソフト、その他のような、手動でアクセス可能な発現プロファイルの索引ファイルを用いることができる。最初に記録される発現パターンの性質がアナログ又はデジタルであるかを問わず、発現パターン、発現プロファイル(総体的な発現パターン)及び分子シグナチュア(相関する発現パターン)はデジタル的に保存され、データベースによってアクセスされる。一般的に、データベースは編集され、中央設備に維持されて、アクセスはローカルに及び/又は遠隔操作で利用可能である。
デバイス及び試験
概要−NanoString nCounter分析システムは、比較的豊富な数百のmRNA転写産物のデジタル読み取りを介して、遺伝子発現の直接的な多重測定を実行する。nCounter(登録商標)分析システムは、一緒に混合されてコードセットと呼ばれる単一試薬を形成する遺伝子特異的プローブ対を使用する。前記プローブ対は、結果において、バイアスを導入し得る任意の酵素反応を取り除く、溶液中のmRNAサンプルと直接的にハイブリダイズする。
ハイブリダイゼーション後、全てのサンプル処理プロセスは、nCounter(登録商標)プレップステーション上で自動化される。まず、過剰の捕捉及びレポータープローブは、除去され、その後、ストレプトアビジン−ビオチン結合を介してnCounter(登録商標)カートリッジの表面上のランダムな位置にプローブ−標的複合体が結合する。
最後に、プローブ/標的複合体は、nCounter(登録商標)カートリッジにおいて整列及び固定化される。該レポータープローブは、蛍光シグナルを運び;該捕捉プローブは、複合体がデータ収集のために固定化することを可能にする。特定の遺伝子にそれぞれ特異的な最大800対のプローブは、CodeSetを形成する一連の内部対照と組み合わされ得る。
サンプル処理の完了後、サンプルカートリッジは、データ収集のために、nCounter(登録商標)Digital Analyzer中に置かれる。対象の各標的分子は、レポータープローブ上に存在する6つの整列した蛍光スポットにより生成される「カラーコード」により同定される。カートリッジの表面上のレポータープローブは、その後各標的分子について計測され、集計される。
試薬及び試験要素−乳癌試験は、それらの遺伝子に対して特別に設計されたnCounterコードセットを使用することで1回のハイブリダイゼーション反応で、NANO46と8つのハウスキーピング遺伝子の発現レベルを同時に計測する。各アッセイはまた、線形力価の試験管内転写RNA転写物と対応するプローブを含む陽性アッセイ対照、並びに陰性対照として使用される、ヒトRNA配列に配列相同性を持たない1セットのプローブも含んでいる。各々のアッセイ操作は、標的の試験管内転写RNA及び正規化のためのハウスキーピング遺伝子からなる基準サンプルを含んでいる。乳房腫瘍サンプルの正規化された遺伝子発現プロファイルは、乳房腫瘍のトレーニングセットから同定された4つの乳癌内因性サブタイプ(ルミナルA、ルミナルB、HER2豊富、又は基底様)の典型的な遺伝子発現プロファイルに関連する。遺伝子発現プロファイルは、選択された臨床レベルでの変化と組み合わせて、乳癌の遠隔再発のリスクに関する予後指標としての養成したアルゴリズムの一部として使用される。
nCounter分析システムの乳癌試験に関連するアッセイプロセスが、本明細書中に記載される。
FFPE組織抽出−乳癌試験は、乳房の浸潤性癌と診断されたホルマリン固定パラフィン包埋(FFPE)組織から抽出されたRNAを使用する。病理学者は最初に、スライドガラス上に封入した腫瘍切片のH&E染色をおこなって、最小閾値を超える腫瘍含量を含んでいる浸潤性乳癌の領域を特定する。病理学者はH&Eスライド上の領域を円で囲む。そして、病理学者は、スライドとマークへの未染色の組織切片をスライドガラス上に乗せ、浸潤性癌を含むスライドの領域に印を付ける。より大きい腫瘍(>100mm2のH&Eスライド上の生存浸潤性癌)に関しては、試験にはたった1つの10μm切片しか必要としない。より小さい腫瘍(<100mm2)に関しては、試験には3つの切片を必要とする。スライド上に十分な腫瘍含有量を含む生存浸潤性乳癌の特定領域は、RNA抽出前に大きく刻まれる。採取部位から試験部位へとFFPE組織スライドを送る手順は、手順の一部として定義されている。
全RNAの抽出とゲノムDNAの除去に続いて、260nmと280nmの波長で吸光度が計測されて、収率と純度の両方が決定される。その後のハイブリダイゼーションステップのために、アッセイ手順には、125〜500ngの入力範囲の全RNAを必要とする。このRNAの入力範囲が正当であると確認するためのNanoString計画は、nCounter分析システムによるアッセイを再現性良く実施するのに十分である。更に、RNA特質は、2.5の上限を有する1.7以上の標的比を有するOD260/280読み取り値を使用することで計測される。所望であれば、下流の処理がもっと後のある時点で実施されるように、RNAを保存する手順がユーザーに提供される。
RNA抽出後の収率と純度を計測するための分光光度計に関する要件−FFPEサンプルからのRNA単離では、30μLの最終サンプル量を得た。この量は、キュベットタイプのUV−Vis分光光度計で吸光度計測を使用した核酸存在量の定量化には少なすぎる;そのため、NanoStringのプロトコールには、NanoDrop(商標)分光光度計等の低容量分光光度計を使用した全RNAを定量するためのステップが含まれている。NanoStringは、試験のために推薦されるRNA入力の範囲が低容量分光光度計の検出限界を超えるように、且つ、再現性良く計測可能であるように、その分光光度計の性能仕様を定義するであろう。
ハイブリダイゼーション−最大10個のRNAのサンプルの各々のセットに関して、ユーザーは、12連反応チューブ内の別々のチューブ内に一定量のRNAをピペットで計り入れ、そして、コードセットとハイブリダイゼーションバッファーを加える。基準サンプルが、コードセットとハイブリダイゼーションバッファーが入った残りの2本のチューブにピペットで計り入れられる。コードセットは、標的とされる各遺伝子のためのプローブ、内因性「ハウスキーピング」正規化遺伝子、並びに陽性及び陰性対照のための追加のプローブからなる。4つの群(標的遺伝子、ハウスキーピング遺伝子、並びに陽性及び陰性対照)の中のこれらの遺伝子の各々に関係するコードセット中のプローブは、特有のコードが各々に割り当てられているので、各実施中に個別に同定可能である。基準サンプルは、標的とされた遺伝子とハウスキーピング遺伝子の試験管内転写RNAからなる。各々のチューブにハイブリダイゼーション試薬が加えられた時点で、ユーザーは、設定温度にて指定された期間、加熱蓋付ヒートブロック内にストリップチューブを移す。
ハイブリダイゼーションステップのための加熱蓋付ヒートブロックに関する要件−nCounterアッセイは、等温条件下での一晩のハイブリダイゼーションを含んでいる。一晩のハイブリダイゼーションは高温にて少量で行われるので、蒸発を避けるように注意しなければならない。多くの市販のPCRサーモサイクラーは、少量の液体の蒸発を防ぐ加熱蓋を備えている。前記アッセイは細かい温度変動の制御を必要としないので、NanoStringチューブに合った寸法のプログラム式加熱蓋とヒートブロックを備えたいずれのヒートブロックであっても、NanoStringアッセイに使用できる。NanoStringには、前記アッセイ要件を満たすヒートブロックの使用を提供する計画がある。
精製とプレップステーションへの結合−ハイブリダイゼーション完了後、次に、ユーザーは、10個のアッセイサンプルと2個の基準サンプルのセットを含むストリップチューブを必要な包装済み試薬及び表1に記載の使い捨て用品と共にnCounterプレップステーションに移す。プレッププレートは、余剰のプローブの精製とカートリッジへの結合に必要な試薬を含んでいる(精製プロセスの詳述に関する以下のIIIC項を参照)。プレッププレートは、プレップステーションのデッキ上に置かれる前にスイングバケット遠心分離機で遠心分離される。そして、自動化された精製プロセスでは、2回の連続したハイブリダイゼーションによって引き起こされる磁性ビーズ捕捉ステップを通じて余剰の捕捉及びレポータープローブが取り除かれる。そして、nCounterプレップステーションでは、精製された標的/プローブ複合体が、ガラススライドへの捕捉のためのnCounterカートリッジ内に移される。実行完了に続いて、ユーザーは、プレップステーションからカートリッジを取り出し、そして、接着フィルムでそれを密閉する。
デジタルアナライザによる画像化及び分析−次に、密閉したカートリッジは、溶液中の標的の量に相当する、各遺伝子のスライド上に捕捉されたプローブ数をカウントするnCounterデジタルアナライザ内に挿入される。次に、自動化されたソフトウェアが、ハウスキーピング遺伝子、基準サンプル、並びに陽性及び陰性対照の閾値をチェックして、各アッセイを適格にし、且つ、手順が正しく行われたことを保証する。ハウスキーピング遺伝子は、RNA保全の尺度を提供し、そして、その閾値は、試験されたRNAサンプルが組織又はRNAの不適当な取り扱い又は保存(例えば、不適当な腫瘍固定化、FFPEブロック保存、RNA保存、RNaseが導入されたRNAの取り扱い)によって試験で分析できないほど分解していることを明らかにする。陽性及び陰性アッセイ対照は、アッセイプロセスの過失(例えば、コードセットとサンプルの混合等のアッセイの段取りの誤り、又は温度等のサンプル処理の誤り)を明らかにする。各々のサンプルのシグナルは続いて、入力サンプルの品質を制御するために、ハウスキーピング遺伝子を使用して正規化される。次に、シグナルは、実施ごとの変動を制御するために、各実施中の基準サンプルに対して正規化される。得られた正規化データは、乳癌内因性サブタイプ分類アルゴリズムに入力されて、腫瘍内因性サブタイプ、再発リスクスコア、及びリスク分類が決定される。
nCounter分析システムは、ハイブリダイゼーション後の処理に用いられるnCounterプレップステーション、及びデータ収集及び解析に用いられるDigital Analyzerの2つの装置からなる。
nCounterプレップステーション−nCounterプレップステーションは、nCounterデジタルアナライザ上でのデータ回収のためにこれらを調製するために、ハイブリダイゼーション後にサンプルを処理する自動液体ハンドリングロボットである。プレップステーション上での処理の前に、FFPE(ホルマリン固定パラフィン包理)組織サンプル又は他のサンプル種から抽出された全RNAは、先に記載のnCounterプロトコールに従って、NanoStringレポータープローブ及び捕捉プローブとハイブリダイズする。
標的RNAとのハイブリダイゼーションは、過剰なNanoStringプローブにより行われる。これらのハイブリダイズした分子を正確に分析するために、これらは、ハイブリダイゼーション反応中の残る過剰なプローブから、まず精製される。プレップステーションは、2つの連続する磁性ビーズ精製工程を用いて、過剰なレポーター及び捕捉プローブからハイブリダイズしたmRNA分子を単離する。これらのアフィニティー精製は、捕捉プローブ及びレポータープローブの双方と結合するmRNA分子の3つの部分からなる複合体のみを保持するカスタムオリゴヌクレオチド修飾された磁性ビーズを用いる。
次に、3つの部分からなる複合体のこの溶液は、NanoStringサンプルカートリッジ中のフローセルを介して洗浄される。このフローセルの1つの表面は、共有結合したストレプトアビジンを密に含浸させたポリエチレングリコール(PEG)ハイドロゲルでコートされる。溶液がフローセルを通過するので、3つの部分からなる複合体は、各捕捉プローブに組み込まれるビオチン分子を介してハイドロゲル中のストレプトアビジンと結合する。PEGハイドロゲルは、3つの部分からなる複合体が、特異的に結合し得るストレプトアビジン濃厚表面を提供するだけではなく、任意の残る過剰なレポータープローブの非特異的な結合も阻害する。
複合体がフローセル表面と結合した後、電場は、各レポータープローブを構成する蛍光スポットの光学的同定及び整列を容易にするために、各サンプルカートリッジフローセルの長さに従って適用される。レポータープローブは、帯電した核酸であるので、印加電圧は、電場に従って、これらを均一に伸長及び方向付けるこれらに力を与える。電圧は印加される一方で、プレップステーションは、場が除去された後、細長い配置中のレポーターを閉じ込める固定化試薬を添加する。一度レポーターが固定化されると、カートリッジは、データ収集のためにnCounterデジタルアナライザに移され得る。プレップステーション上でのサンプル処理のために要求される消耗される構成要素及び試薬は、nCounterMasterキットで提供される。これらの試薬は、nCounterプレップステーションのデッキ上でロードする準備がされ、約2.5時間において、1運転当たり10個のサンプルと2個の基準サンプルを含むサンプルカートリッジを処理することができる。
nCounterデジタルアナライザ−nCounterデジタルアナライザは、顕微鏡対物レンズを介してCCDカメラを用いたサンプルカートリッジ中の固定化された蛍光レポーターのイメージを得ることによりデータを収集する。蛍光レポータープローブは、可視光の波長よりも小さい特徴を有する小さい、単一の分子バーコードであるので、デジタルアナライザは、蛍光バーコード中のスポットの配列を解明するために、高い磁場、回折限界イメージングを用いる。
デジタルアナライザは、数百又は数千の別々のレポータープローブをそれぞれ含み得る数百の連続する視野(FOV)を捕捉する。各FOVは、異なる波長において捕捉される4つの単色イメージの組み合わせである。得られる重ね合わせは、青、緑、黄、及び赤の4色のイメージであると考えられ得る。各4色のFOVは、サンプル中の各蛍光バーコードについて「カウント」を提供するために、リアルタイムで処理される。各バーコードは、単一のmRNA分子を特異的に同定するので、デジタルアナライザからの結果として生じるデータは、生体サンプル中の豊富な対象の各mRNAの正確な目録である。
ソフトウェア−プレップステーション及びデジタルアナライザは、外部PCへの接続を必要としないスタンドアローンユニットであるが、ローカルエリアネットワーク(LAN)を使用することで互いにネットワークでつながれていなくてはならない。nCounterシステムソフトウェアは、ユーザーアカウントと認証によって安全に管理された作業である。両装置は、アッセイのサンプル処理とデータ収集ステップを通してユーザーを誘導するための内蔵タッチスクリーンユーザーインタフェースによって設定及び処理ウィザードを使用する。ユーザーは、プレップステーションとデジタルアナライザによる段階的な指示によって手順を通して導かれる。装置のタッチスクリーンは、運転を制御するのに圧力感知式を使用しているので、ユーザーがスクリーン上の選択肢に触れることによってシステムと交信相することを可能にしている。タッチスクリーンは、データ入力に関して限されたヒューマンインターフェースしか提供しないので、前記システムはまた、ユーザーアカウントマネジメント、サンプルバッチ定義、及びサンプル状況のトラッキングのためのウェブベースのアプリケーションのホストにもなる。
サンプルが処理されるとき、システムソフトはデータの中央情報保管領域内の各サンプルについてユーザーアカウントと各試薬のロットを追跡する。サンプルの発現データがデジタルアナライザによって取得された後、それは最初に、全てのあらかじめ指定された品質の管理基準が満たされていることを保証するために分析される。次に、適切なデータは、固定されたPAM50アルゴリズムで処理されて、内因性サブタイプ及び再発リスク(ROR)スコアの入った報告書が作成される。サンプル報告書は、正しく認証されたユーザーによってダウンロードのために安全にアクセスできる中央情報保管領域に移される。
乳癌内因性サブタイプ分類アルゴリズム−nCounterシステムは、元々PAM50と称した50個の遺伝子の分類アルゴリズムを使用して、切除された浸潤性乳癌の内因性サブタイプを同定するために使用される(Parker J.S., et al. Supervised Risk Predictor of Breast Cancer Based on Intrinsic Subtypes. Journal of Clinical Oncology, 27: 1160-1167 (2009))。遺伝子発現プロファイルは、4つの分子クラス又は内因性サブタイプ:基底様、ルミナルA、ルミナルB、及びHER2豊富のうちの1つに乳癌を割り当てる。各々のサブタイプの簡単な説明を以下に示す。
ルミナルサブタイプ:乳癌の最も一般的なサブタイプは、ホルモン受容体陽性集団ではルミナルサブタイプであるルミナルA及びルミナルBである。これまでの試験では、乳癌2のうちルミナルAが約30%〜40%を占め、ルミナルBが約20%を占めることが示唆され、ホルモン受容体陽性乳癌の90%超に相当する。これらのサブタイプの遺伝子発現パターンは、乳房のルミナル上皮成分に類似している(Nielsen, TO et al. A comparison of PAM50 intrinsic subtyping with immunohistochemistry and clinical prognostic factors in tamoxifen-treated estrogen receptor positive breast cancer. Clinical Cancer Research, 16:5222-5232 (2010))。これらの腫瘍は、エストロゲン受容体(ER)、プロゲステロン受容体(PR)、及びER活性化に関連する遺伝子、例えばLIV1や、GATA3や、サイクリンD1等の高発現、並びにルミナルサイトケラチン8及び18の発現を特徴とする。
ルミナルA:ルミナルA(LumA)乳癌は、細胞周期活性化に関連する遺伝子及びERBB2クラスタについて低レベルの発現しか示さず、ルミナルBより良好な予後をもたらす。ルミナルAサブグループは、全てのサブタイプのうちで最も好ましい予後を有するので、内分泌療法応答腫瘍が豊富になる。
ルミナルB:ルミナルB(LumB)乳癌は、ER及びER関連遺伝子を発現しているが、LumAより低程度である。細胞周期活性化に関連する遺伝子が高度に発現されているので、この腫瘍型は、HER2(+)又はHER2(−)であることができる。(ER発現にもかかわらず)予後は好ましくなく、且つ、内分泌療法応答性は通常、LumAに対して低い。
基底様:基底様サブタイプは、通常ER陰性であり、ほぼ常に臨床的にHER2陰性であり、且つ、基底上皮サイトケラチン(CK)や上皮生長因子受容体(EGFR)を含めた一連の「基底」バイオマーカーを発現している。細胞周期活性化に関連する遺伝子は高度に発現されている。
HER2豊富:HER2豊富サブタイプは、ERBB2やGRB7を含めたERBB2クラスタが高発現の症例の大部分で、通常ER陰性であり、且つ、HER2陽性である。細胞周期活性化に関連する遺伝子が高度に発現されているので、これらの腫瘍は不良な転帰を有する。
内因性サブタイプ分類アルゴリズムのカットオフは、次の:1)内因性サブタイプセントロイド(すなわち、各々のサブタイプの典型的な遺伝子発現プロファイル)、2)再発リスク(ROR)スコアのための係数、及び3)リスク分類(低い/中程度/高い)を定義したトレーニングセットから事前に定義される。内因性サブタイプセントロイド(基底様、ルミナルA、ルミナルB、Her2豊富)は、複数の部位から採取された、保存されたFFPE乳房腫瘍標本の臨床的に代表的なセットを使用して養成した。FFPE乳房腫瘍サンプルからの遺伝子発現データの階層クラスタ化分析は、各々のサブタイプの典型的な発現プロファイル(すなわち、セントロイド)を定義するために、乳房腫瘍生物学(すなわち、以前に定義されていた内因性サブタイプの遺伝子発現)と組み合わせられた。計算アルゴリズムは、4つの乳癌内因性サブタイプの典型的な発現特性の各々に未知の乳癌腫瘍サンプルの正規化された50遺伝子発現プロファイルを関連づける。その腫瘍サンプルは、そのサンプルに対して最も大きい正の相関を有するサブタイプに割り当てられる。
十分に定義された臨床的特徴及び臨床転帰データを有する304の特有の腫瘍サンプルが、RORスコアを確立するのに使用された。RORスコアは、下記式で示されているように、各々の内因性サブタイプに対するピアソン相関(R)、増殖スコア(P)、及び腫瘍サイズ(T)を含むCoxモデルからの係数を使用することで算出される。
ROR=aRLumA+bRLumB+cRHer2e+dRbasal+eP+fT
腫瘍サンプルをそれらの算出されたRORスコアに基づいて具体的なリスク群(低リスク/中程度のリスク/高リスク)に分類するために、内分泌療法単独で治療されたホルモン受容体陽性の閉経後の患者からなる患者集団における無再発生存率の確率に基づいてカットオフ値を設定した。
臨床検査におけるNanoString乳癌試験の予想される用途−腫瘍学者は現在、乳癌患者用の治療プロトコールを開発するために一連の試験を使用している。これらに含まれるものは、ER/PR IHCやHER2 IHC/FISH等のIHC/FISH試験、Agendia MammaPrint(登録商標)アッセイ及びGenomic Health Oncotype Dx(登録商標)試験である。これらの試験は、患者の予後及び推奨される治療計画に関する追加情報を腫瘍学者に提供する。
しかし、これらの試験にも限界がある。ER、PgR、及びHer2試験は、病理学者と委託研究所によって限局的に行われているが、IHC及びFISH試験の広範囲にわたる規格化の直面する課題は、十分に立証されている(Lester, J et al. Assessment of Tissue Estrogen and Progesterone Receptor Levels: A Survey of Current Practice, Techniques, and Quantitation Methods. The Breast Journal, 6:189-196 (2000); Wolff, A et al. American Society of Clinical Oncology / College of American Pathologists Guideline Recommendations for Human Epidermal Growth Factor Receptor 2 Testing in Breast Cancer. Archives of Pathology and Laboratory Medicine, 131:18-43 (2007))。MammaPrint試験は、使用のために凍っているか又は新鮮な保存組織サンプルを用いた使用に限ってFDAに承認されているが、米国で採取された腫瘍サンプルの大部分が新鮮な冷凍よりむしろFFPEである。この試験はまた、流通されていないので、Agendia委託研究所を通してしか入手できない。Oncotype Dx試験は、アジュバントタモキシフェン療法を受けている、並びにシクロホスファミド/メトトレキサート/5−フルオロウラシル(CMF)化学療法に対して感受性の病期I/II、結節陰性、エストロゲン受容体陽性の患者の再発リスクを予測するのに使用できる。しかし、この試験は、Genomic HealthのCLIA研究所による研究所開発型(LDT)試験としてしか提供されていないので、予後使用に関してFDAに承認されていないか、又は化学療法応答を予測するためにFDAが承認した。
NanoStringは、選択された患者区分において乳癌予後のために腫瘍学者が現在入手可能な他の起源の臨床データを一緒に使用した乳癌試験を有するであろうモデルを想定している。その乳癌試験は、乳癌患者を有する患者を管理する際に腫瘍学者によって使用される確立された臨床パラメータ(すなわち、腫瘍サイズ、結節状態)に有意な価値を追加する予測情報の更なる起源になるであろう。
方法、アッセイ及びキット
本発明の方法、アッセイ及びキットには、アッセイ中に自動的に各サンプルに適用される一連の品質管理基準が含まれている。これらの基準は、結果が期待値の中に入っているか否か決定するためにアッセイの成果を評価している。これらの品質管理基準に関して成功した分析では、アッセイは以下の結果をもたらす。
内因性サブタイプ
乳房癌腫瘍の内因性サブタイプは、初期乳癌における予後に関連があることを示した。平均的に、ルミナルA腫瘍に罹患している患者は、ルミナルB、HER2豊富、又は基底様腫瘍に罹患している患者より有意に良好な転帰を有する。
内因性サブタイプは、未知のサンプルにおける50個の遺伝子の遺伝子発現プロファイルを、4つの内因性サブタイプに関して予想される発現プロファイルと比較することによって同定される。最も類似したプロファイルを有するサブタイプが、未知のサンプルに割り当てられる。
乳癌の最も一般的なサブタイプは、ルミナルサブタイプであるルミナルA(LumA)とルミナルB(LumB)である。以前の試験では、ルミナルAが乳癌の約30%〜40%を占め、ルミナルBが約20%を占めることが示唆されている。しかし、ホルモン受容体陽性患者の90%超がルミナル腫瘍を有している。これらのサブタイプの遺伝子発現パターンは乳房組織のルミナル上皮成分に類似している。これらの腫瘍は、エストロゲン受容体(ER)、プロゲステロン受容体(PR)、及びLIV1やGATA3やサイクリンD1等のER活性化関連遺伝子の高発現、並びにルミナルサイトケラチン8及び18の発現を特徴としている。ルミナルA乳癌は、ルミナルB乳癌と比較すると、細胞周期活性化に関連する遺伝子の低発現を呈しており、そしてより良好な予後をもたらす。
以前の試験では、HER2豊富サブタイプ(Her2E)は乳癌の約20%を占めることが示唆されている。しかし、HER2豊富腫瘍は通常ER陰性であるので、試験されたER陽性患者集団の5%しかHER2豊富乳癌を有していないことがわかった。ERの状態にかかわらず、HER2豊富腫瘍は、ERBB2及びGRB7を含めたERBB2クラスタの高発現を伴ったHER2陽性である場合が多い。細胞周期活性化に関連する遺伝子もまた高度に発現されている。
公表データでは、基底様サブタイプが乳癌の約20%を占めることが示唆されている。しかし、基底様腫瘍は通常ER陰性であるので、ホルモン受容体陽性患者の1%しか基底様乳癌を有していない。基底様サブタイプは、ほぼ常に臨床的にHER2陰性であり、基底上皮サイトケラチン(CK)や上皮生長因子受容体(EGFR)を含めた一連の「基底」バイオマーカーを発現している。細胞周期活性化に関連する遺伝子が高度に発現されている。
RORスコア
RORスコアは、規定した用途集団に関する10年以内の個々の患者の遠隔再発の確率に関連する0〜100等級の整数値である。RORスコアは、4つの異なった関連値を算出するために、上記のように、未知のサンプルにおける46個の遺伝子発現プロファイルを4つの内因性サブタイプの予想されるプロファイルと比較することによって算出される。次に、RORスコアを算出するために、これらの関連値が増殖スコア及び腫瘍サイズと組み合わせられる。
10年間遠隔再発の確率
外科手術及び5年間のアジュバント内分泌療法での治療と、それに続く5年間の観察の後に、ホルモン受容体陽性の初期乳癌を有する閉経後女性コホートのRORスコアが、無遠隔再発生存率と比較された。この試験では、95%の信頼区間でこの試験患者集団における遠隔再発の確率にRORスコアが関係するモデルをもたらした。
リスク分類
リスク分類もまた、試験患者集団において臨床転帰と関係があるカットオフを使用することによってRORスコアを解釈できるように提供される。
品質管理
アッセイ要素の各ロットは、予定された仕様を用いて試験される。全てのキットレベルのアイテムがロットで追跡され、そして、各キット中に含まれた必須要素が一緒に試験されて、マスターロットとして発売される。
アッセイキットには、個別のサンプル全体及びその各々として各実施セットの品質を評価するのに使用される一連の内部対照を含んでいる。これらの対照は以下に記載されている。
バッチ対照セット:試験管内転写RNA基準サンプル
合成RNA基準サンプルが、対照としてアッセイキット中に含まれている。基準サンプルは、50アルゴリズム由来の試験管内転写RNA標的と8つのハウスキーピング遺伝子から構成されている。基準サンプルは、12連反応チューブ中で一連の最大10個の未知の乳房腫瘍RNAサンプルと共に、各々のアッセイ実施において二連で処理される。基準サンプルからのシグナルは、実施を適格にするために既定の閾値に対して分析される。
乳房腫瘍RNAサンプルの50のアルゴリズム遺伝子の各々からのシグナルは、基準サンプルの対応遺伝子に対して正規化される。
陽性対照セット:試験管内転写RNA標的、並びに対応する捕捉及びレポータープローブ
合成RNA標的が、アッセイの陽性対照(PC)として使用される。External RNA Control Consortium(ERCC)DNA配列ライブラリからPC標的配列を取得する。RNA標的は、DNAプラスミドから試験管内転写される。4倍力価シリーズ(128〜0.125fMのハイブリダイゼーション反応の終濃度)のアッセイキット中には、対応する捕捉及びレポータープローブと共に、6個のRNA標的が含まれている。PCは、Prosigna Assayと共に試験される各乳房腫瘍RNAサンプル及び基準RNAサンプルに追加される。PCからのシグナル強度が既定の閾値を満たさない場合、サンプルは更なる分析には不適格と見なされる。
陰性対照セット:標的のない外来プローブ
陰性対照(NC)標的配列をERCCのDNA配列ライブラリから取得する。これらの標的配列を検出するように設計されたプローブが、対応する標的配列なしにアッセイキットの一部として含まれている。陰性対照(NC)は、品質管理の指標として、Prosigna Assayで試験される各乳房腫瘍RNAサンプルと基準サンプルに追加される。NCからのシグナル強度が既定の閾値を満たさない場合、サンプルは更なる分析には不適格と見なされる。
RNA整合性対照セット:ハウスキーピング遺伝子
8つのハウスキーピング遺伝子と50のアルゴリズム遺伝子を検出するように設計された捕捉及びレポータープローブが、キットの一部として含まれている。8つのハウスキーピング遺伝子の発現レベルは、FFPE組織サンプルから抽出され、そしてアッセイに入力されたRNAの品質を判断するために分析される。ハウスキーピング遺伝子の発現レベルが既定の閾値より下がった場合、サンプルは更なる分析には不適格と見なされる。
ハウスキーピング遺伝子はまた、基準サンプル正規化の前にサンプルの完全なRNA量のあらゆる違いを正規化するのに使用される。
定義
本発明のために、「乳癌」は、例えば、生検又は組織像によって悪性の病状と分類される状態を含む。乳癌診断の臨床上の描写は、医学では周知である。当業技術者は、乳癌が、例えば癌腫及び肉腫を含む、乳房組織のあらゆる悪性腫瘍を指すことを理解する。乳癌の特定の形態には、非浸潤性乳管癌(DCIS)、非浸潤性小葉癌(LCIS)又は粘液癌が含まれる。乳癌は、浸潤性の乳管癌(IDC)又は浸潤性の小葉癌(ILC)も指す。本発明のほとんどの態様によれば、関心のある対象は、乳癌が疑われるか、又は実際に乳癌と診断されるヒト患者である。
本明細書で用いられる冠詞“a”及び“an”は、当該冠詞の文法上の目的語が単数か複数(即ち、少なくとも1つ)であることを意味する。例として“an element”(要素)は、1又は複数の要素を意味する。
本明細書全体を通じて、単語「含んでいる」(“comprising”)又はその活用形、例えば「含む」(“comprises”)や「含んでいる」(“comprising”)などは、指示される要素、整数値又は工程、或いはそれらの群を含むことを意味するが、但し他のいかなる要素、整数値又は工程、或いはそれらの群を含むことも排除されないと理解すべきである。
実施例1.NANO46サブタイプ分類試験
図5では、乳癌内因性サブタイプ分類試験に関連するアッセイプロセスについて概説している。RNA単離に続いて、試験では、46個の標的遺伝子と8個のハウスキーピング遺伝子の発現レベルを、それらの遺伝子に特異的に設計されたnCounterコードセットを使用した単一ハイブリダイゼーション反応において同時に計測する。例えば、援用によりその全体が本明細書に組み込まれる、米国特許出願公開第2008/0032293号に記載のハウスキーピング遺伝子を正規化のために用いることができる。例示的なハウスキーピング遺伝子には、MRPL19、PSMC4、SF3A1、PUM1、ACTB、GAPD、GUSB、RPLP0及びTFRCが含まれる。ハウスキーピング遺伝子は、腫瘍サンプルの発現を正規化するのに使用される。各アッセイの実施にはまた、正規化を目的とした、58個の標的の試験管内転写RNAからなる基準サンプルも含まれている。
FFPE組織の再検討/入手及びRNA抽出:乳癌内因性サブタイプ分類試験では、浸潤性乳癌と診断されたホルマリン固定パラフィン包埋(FFPE)組織から抽出されたRNAを使用する。病理学者は、試験のための十分な腫瘍組織含量を含む組織領域を同定するためにH&E染色したスライドを再検討する。隣接する正常組織を全て取り除くために、組織切片を封入した無染色のスライドは、各スライド上の同定された腫瘍領域を巨視的に切り出すことで処理される。その後、RNAが腫瘍組織から単離され、そしてDNAがサンプルから取り除かれる。
アッセイの段取り及びハイブリダイゼーションの開始:乳房腫瘍から単離された最大10個のRNAサンプルの各バッチのために、ユーザーは、サンプル処理、試薬のロット、及び各サンプルの結果を追跡するnCounter分析x5システムソフトウェアを使用した実施の段取りをする。アッセイを開始するために、ユーザーは、12連反応チューブ内の別々のチューブ内に一定量のRNAをピペットで計り入れ、そして、コードセットとハイブリダイゼーションバッファーを加える。基準サンプルが、コードセットとハイブリダイゼーションバッファーが入った残りの2本のチューブにピペットで計り入れられる。コードセットは、標的とされる各遺伝子のためのプローブ、内因性「ハウスキーピング」正規化遺伝子、並びにそのアッセイに混ぜ込まれる陽性及び陰性対照のための追加のプローブからなる。基準サンプルは、標的とされた遺伝子とハウスキーピング遺伝子の試験管内転写RNAからなる。各々のチューブにハイブリダイゼーション試薬が加えられた時点で、ユーザーは、設定温度にて指定された期間、加熱蓋付ヒートブロック内にストリップチューブを移す。
精製とプレップステーションへの結合:ハイブリダイゼーション完了後、ユーザーは、10個のアッセイサンプルと2個の基準サンプルのセットを含むストリップチューブを必要な包装済み試薬及び使い捨て用品と共にnCounterプレップステーション内に移す。そして、自動化された精製プロセスでは、2回の連続したハイブリダイゼーションによって引き起こされる磁性ビーズ捕捉ステップを通じて余剰の捕捉及びレポータープローブが取り除かれる。そして、nCounterプレップステーションでは、精製された標的/プローブ複合体が、ガラススライドへの捕捉のためのnCounterカートリッジ内に移される。実行完了に続いて、ユーザーは、プレップステーションからカートリッジを取り出し、そして、接着フィルムでそれを密閉する。
デジタルアナライザによる画像化及び分析:次に、カートリッジは、密閉され、そして、溶液中の標的の量に相当する、各遺伝子のスライド上に捕捉されたプローブ数をカウントするnCounterデジタルアナライザ内に挿入される。次に、自動化されたソフトウェアが、ハウスキーピング遺伝子、基準サンプル、並びに陽性及び陰性対照の閾値をチェックして、各アッセイを適格にし、且つ、手順が正しく行われたことを保証する。各々のサンプルのシグナルは続いて、入力サンプルの品質を制御するために、ハウスキーピング遺伝子を使用して正規化される。次に、シグナルは、実施ごとの変動を制御するために、各実施中の基準サンプルに対して正規化される。得られた正規化データは、乳癌内因性サブタイプ分類アルゴリズムに入力されて、腫瘍内因性サブタイプ及び再発リスクスコアが決定される。
実施例2.結節陽性初期乳癌の再発リスク
結節陽性HR+EBCを有する閉経後女性はほとんどがアジュバント化学療法を受けている。我々は、RORスコア及びISを使用した内分泌療法後の残存リスクに関する分子ベースの特徴づけが、臨床処置スコア(CTS)のみによる臨床病理リスク評価よりも上手く、内分泌療法後に長期再発リスクが限定的である結節陽性患者サブグループを同定し得ると仮説を立てた。
長期追跡調査と組織サンプルを、ABCSG-8(N=1478人)及びtransATAC(N=1007人)臨床試験の2485人の閉経後HR+患者から得た。PAM50試験を、NanoString nCounter Analysisシステムを使用してパラフィンブロックから抽出したRNAに対して実施した。CTSに予測情報を追加するROR、IS及びROR規定リスク群(ROR−RG)の能力を、予め定義済みの解析計画における尤度比検定によって評価した。
複合データセットの患者を、陽性結節数によって1個(N1)、2個(N2)、或いは2又は3個(N2−3)に分類し、これらのサブグループのベースライン障害は2つの臨床試験で同様であった。RORスコア、IS及びROR−RGは、すべての群でCTSを超える統計的に有意な予測情報(10年遠隔再発リスク)を追加した。1つの陽性結節を有する患者では、遠隔再発に関する10年絶対リスクは、PAM-50低リスク群(40%の患者)において6.6%[95%のCI:3.3%−12.8%]であり、ルミナルAサブグループ(69%の患者)において8.4%[5.3%−13.3%]であった。結果を表5に示す。
この複合解析結果は、N1 EBC患者のかなりの割合が非常に限定的な長期再発リスクしか有しておらず、N2患者の一部と同じであることが示唆されることを実証する。PAM50 RORスコア、IS及びROR−RGは、CTSを超える追加的な予測情報を信頼性良く提供するので、結節陽性HR+EBCを有する女性がアジュバント化学療法を回避できるか決定する際に有用であり得る。