発明の詳細な説明
全ヒト遺伝子の4分の3は選択的スプライシングを受ける。したがって、がん特異的なスプライス変異体を同定し、明確にすることは、バイオマーカーアッセイの開発にとって有益である。ここに記載する態様は、NETマーカー遺伝子の特定のがん特異的スプライス変異体を使って、バイオマーカー診断方法における新形成試料と正常試料との間の相違を最大化することができるという、驚くべき発見から派生するものである。
本発明は、膵・消化管神経内分泌新生物(GEP-NEN)の検出を必要とする対象においてGEP-NENを検出するための方法であって、対象からの検査試料を、APLP2、ARAF、ATP6V1H、BNIP3L、BRAF、CD59、COMMD9、CTGF、FZD7、GLT8D1、KRAS、MKI67/KI67、MORF4L2、NAP1L1、NOL3、OAZ2、PANK2、PHF21A、PLD3、PNMA2、PQBP1、RAF1、RNF41、RSF1、SLC18A1/VMAT1、SLC18A2/VMAT2、SMARCD3、SPATA7、SSTR1、SSTR3、SSTR4、SSTR5、TECPR2、TPH1、TRMT112、WDFY3、ZFHX3およびZZZ3からなる群より選択される少なくとも22のバイオマーカーの発現の検出に特異的な複数の作用物質と接触させることによって、検査試料から前記少なくとも22のバイオマーカーの発現レベルを決定する工程;参照試料を、前記少なくとも22のバイオマーカーの発現の検出に特異的な作用物質と接触させることによって、参照試料から前記少なくとも22のバイオマーカーの発現レベルを決定する工程;検査試料における前記少なくとも22のバイオマーカーの発現レベルを参照試料における前記少なくとも22のバイオマーカーの発現レベルに対して標準化する工程;検査試料における前記少なくとも22のバイオマーカーの標準化された発現レベルを、所定のカットオフ値と比較する工程;標準化された発現レベルが所定のカットオフ値以上である場合に、対象におけるGEP-NENの存在を決定し、または標準化された発現レベルが所定のカットオフ値未満である場合に、対象におけるGEP-NENの非存在を決定する工程を含み、所定のカットオフ値は0〜8のMAARC-NETスコアリングシステムスケールで2であるか、0〜100%のスケールで0%である、方法を提供する。
スコアは「多数決」戦略に基づき、試料を「正常」とコールして0のスコアを与えるか、「腫瘍」とコールして「1」のスコアを付す、二項分類システムから開発された。スコアは、0(4つのコールがすべて「正常」)から4(4つのコールがすべて「腫瘍」)までの範囲に及びうる。各「コール」は、4つの異なる学習アルゴリズム、すなわちサポートベクターマシン(SVM)、線形判別分析(LDA)、K最近傍法(KNN)、および単純ベイズ(ベイズ)のうちの1つの二値結果(正常に対する「0」であるか、腫瘍に対する「1」のいずれか)である。これら4つの学習アルゴリズムのそれぞれを、67の対照と63のGEP-NENを含む内部トレーニングセットでトレーニングした。このトレーニングセットにおいて、差次的に発現する遺伝子(対照対GEP-NEN)は、t検定を使って有意と同定された。トレーニングセットに基づいて、学習アルゴリズムのそれぞれを、正常遺伝子発現と腫瘍遺伝子発現とを少なくともp<0.05の有意水準内まで弁別するようにトレーニングした。多数決戦略に従って、「正常」コールが2つ未満である試料をGEP-NENと分類する。
前記少なくとも22のバイオマーカーは、APLP2、ARAF、CD59、CTGF、FZD7、KRAS、MKI67/KI67、MORF4L2、NAP1L1、NOL3、PNMA2、RAF1、RSF1、SLC18A2/VMAT2、SMARCD3、SPATA7、SSTR1、SSTR3、SSTR4、SSTR5、TPH1、TRMT112、およびZFHX3を含むことができる。
本方法は、標準化された発現レベルが所定のカットオフ値以上である場合に、対象における進行性GEP-NENの存在を決定する工程をさらに含むことができ、ここで、所定のカットオフ値は0〜8のスケールで5であるか、0〜100%のスケールで55%未満である。
本方法は、対象が進行性GEP-NENを発生させるリスクのレベルを同定する工程をさらに含むことができ、本方法は、標準化された発現レベルが、0〜8のスケールで5という所定のカットオフ値未満であるか、0〜100%のスケールで55%未満である場合に、低レベルの進行性GEP-NEN発生リスクを同定し;標準化された発現レベルが、0〜8のスケールで5という所定のカットオフ値以上、かつ7という所定のカットオフ値未満であるか、0〜100%のスケールで55%以上、かつ75%未満である場合に、中間レベルの進行性GEP-NEN発生リスクを同定し;または標準化された発現レベルが、0〜8のスケールで7という所定のカットオフ値以上であるか、0〜100%のスケールで75%以上である場合に、高レベルの進行性GEP-NEN発生リスクを同定する工程をさらに含む。
バイオマーカーは、RNA、cDNA、またはタンパク質であることができる。バイオマーカーがRNAである場合は、そのRNAを(例えばRT-PCRによって)逆転写してcDNAを生産することができ、生産されたcDNAの発現レベルを検出する。バイオマーカーの発現レベルは、バイオマーカーと標識プローブまたはプライマーとの間の複合体を形成させることによって検出することができる。バイオマーカーがRNAまたはcDNAである場合、そのRNAまたはcDNAは、RNAまたはcDNAと標識核酸プローブまたはプライマーとの間の複合体を形成させることによって検出される。RNAまたはcDNAと標識核酸プローブまたはプライマーとの間の複合体は、ハイブリダイゼーション複合体であることができる。バイオマーカーがタンパク質である場合は、タンパク質と標識抗体との間の複合体を形成させることによって、そのタンパク質を検出することができる。標識は、例えば蛍光標識、化学発光標識、放射性標識など、任意の標識であることができる。
検査試料は、対象から得られる任意の生物学的液体であることができる。検査試料は、血液、血清、血漿、または新生物組織であることが好ましい。参照試料は、新生物疾患を有さない、または新生物疾患の症状を示さない、または新生物疾患と診断されていない対象から得られた任意の生物学的液体であることができる。参照試料は、血液、血清、血漿または非新生物組織であることが好ましい。
GEP-NENの検出を必要とする対象は、GEP-NENと診断された対象、少なくとも1つのGEP-NEN症状を有する対象、またはGEP-NENを発生させる素因もしくは家族歴を有する対象であることができる。対象は任意の哺乳動物であることができる。好ましくは、対象はヒトである。対象および患者という用語は本明細書では可換的に使用される。
本方法は、中間レベルまたは高レベルの進行性GEP-NEN発生リスクを有すると同定された対象を手術または薬物療法で処置する工程を、さらに含むことができる。薬物療法はソマトスタチン類似体処置またはペプチド受容体放射線療法(PRRT)であることができる。本方法は、低レベルの進行性GEP-NEN発生リスクを有すると同定された対象を、少なくとも6ヶ月間、12ヶ月間、18ヶ月間、または24ヶ月間にわたる定期的または周期的モニタリングで処置する工程を、さらに含むことができる。
本発明は、対象における安定GEP-NENと進行性GEP-NENとを弁別するための方法であって、本発明の方法に従って、対象からの検査試料から、前記少なくとも22のバイオマーカーの標準化された発現レベルが、5という所定のカットオフ値以上であり、かつ6という所定のカットオフ値未満であることを決定する工程;検査試料および参照試料を、SMARCD3の発現およびTPH1の発現の検出に特異的な複数の作用物質と接触させることによって、検査試料および参照試料からSMARCD3およびTPH1の発現レベルを検出する工程;検査試料におけるSMARCD3およびTPH1の発現レベルを参照試料におけるSMARCD3およびTPH1の発現レベルに対して標準化する工程;検査試料におけるSMARCD3およびTPH1の標準化された発現レベルを、それぞれ第1および第2の所定のカットオフ値と比較する工程;ならびに、SMARCD3の標準化された発現レベルが第1の所定のカットオフ値より大きく、かつTPH1の発現レベルが第2の所定のカットオフ値以上である場合に、対象における安定GEP-NENの存在を決定し、またはSMARCD3の標準化された発現レベルが第1の所定のカットオフ値以下であり、かつTPH1の発現レベルが第2の所定のカットオフ値未満である場合に、対象における進行性GEP-NENの存在を決定する工程を含み、第1の所定のカットオフ値は0〜8のスケールで1.3であり、第2の所定のカットオフ値は0〜8のスケールで4である方法も提供する。
1.3という第1の所定のカットオフ値は0〜100%のスケールでは12%に対応し、4という第2の所定のカットオフ値は0〜100%のスケールでは41%に対応する。
本発明は、対象において安定GEP-NENと進行性GEP-NENとを弁別するための方法であって、本発明の方法に従って、対象からの検査試料から、前記少なくとも22のバイオマーカーの標準化された発現レベルが、6という所定のカットオフ値以上、かつ7という所定のカットオフ値未満であることを決定する工程;検査試料および参照試料を、VMAT1の発現およびPHF21Aの発現の検出に特異的な複数の作用物質と接触させることによって、検査試料および参照試料から、VMAT1およびPHF21Aの発現レベルを検出する工程;検査試料におけるVMAT1およびPHF21Aの発現レベルを、参照試料におけるVMAT1およびPHF21Aの発現レベルに対して標準化する工程;検査試料におけるVMAT1およびPHF21Aの標準化された発現レベルをそれぞれ第1および第2の所定のカットオフ値と比較する工程;ならびに、VMAT1の標準化された発現レベルが第1の所定のカットオフ値以上であり、かつPHF21Aの発現レベルが第2の所定のカットオフ値未満である場合に、対象における安定GEP-NENの存在を決定し、またはVMAT1の標準化された発現レベルが第1の所定のカットオフ値以上であり、かつPHF21Aの発現レベルが第2の所定のカットオフ値以上である場合に、対象における進行性GEP-NENの存在を決定する工程を含み、第1の所定のカットオフ値は0〜8のスケールで0であり、第2の所定のカットオフ値は0〜8のスケールで1.2である方法も提供する。
0という第1の所定のカットオフ値は0〜100%のスケールでは0%に対応し、1.2という第2の所定のカットオフ値は0〜100%のスケールでは8%に対応する。
本発明は、対象において安定GEP-NENと進行性GEP-NENとを弁別するための方法であって、本発明の方法に従って、対象からの検査試料から、前記少なくとも22のバイオマーカーの標準化された発現レベルが、7という所定のカットオフ値以上、かつ8という所定のカットオフ値未満であることを決定する工程;検査試料および参照試料を、VMAT1の発現およびPHF21Aの発現の検出に特異的な複数の作用物質と接触させることによって、検査試料および参照試料から、VMAT1およびPHF21Aの発現レベルを検出する工程;検査試料におけるVMAT1およびPHF21Aの発現レベルを参照試料におけるVMAT1およびPHF21Aの発現レベルに対して標準化する工程;検査試料におけるVMAT1およびPHF21Aの標準化された発現レベルをそれぞれ第1および第2の所定のカットオフ値と比較する工程;ならびに、VMAT1の標準化された発現レベルが第1の所定のカットオフ値以上であり、かつPHF21Aの発現レベルが第2の所定のカットオフ値より大きい場合に、対象における安定GEP-NENの存在を決定し、またはVMAT1の標準化された発現レベルが第1の所定のカットオフ値以上であり、かつPHF21Aの発現レベルが第2の所定のカットオフ値以下である場合に、対象における進行性GEP-NENの存在を決定する工程を含み、第1の所定のカットオフ値は0〜8のスケールで0であり、第2の所定のカットオフ値は0〜8のスケールで1である方法も提供する。
0という第1の所定のカットオフ値は0〜100%のスケールでは0%に対応し、1という第2の所定のカットオフ値は0〜100%のスケールでは7%に対応する。
本発明は、対象において安定GEP-NENと進行性GEP-NENとを弁別するための方法であって、本発明の方法に従って、対象からの検査試料から、前記少なくとも22のバイオマーカーの標準化された発現レベルが、8という所定のカットオフ値に等しいことを決定する工程;検査試料および参照試料を、ZZZ3の発現の検出に特異的な少なくとも1つの作用物質と接触させることによって、検査試料および参照試料からZZZ3の発現レベルを検出する工程;検査試料におけるZZZ3の発現レベルを参照試料におけるZZZ3の発現レベルに対して標準化する工程;検査試料におけるZZZ3の標準化された発現レベルを所定のカットオフ値と比較する工程;および、ZZZ3の標準化された発現レベルが所定のカットオフ値以下である場合に、対象における進行性GEP-NENの存在を決定する工程を含み、所定のカットオフ値は0〜8のスケールで1である方法も提供する。
1という所定のカットオフ値は0〜100%のスケールでは18%に対応する。
本発明の方法は、対象からの検査試料および参照試料を、Ki67、NAP1L1、NOL3、TECPR2、ARAF1、BRAF、KRAS、RAF1、PQBP1、TPH1、COMMD9、MORF4L2、RNF41、RSF1、SMARCD3、およびZFHX3を含む16のバイオマーカーのそれぞれの発現の検出に特異的な複数の作用物質と接触させることによって、検査試料および参照試料から、前記16のバイオマーカーのそれぞれの発現レベルを決定する工程;検査試料の前記16のバイオマーカーのそれぞれの発現レベルを合計することで進行性診断I総検査値を生成し、参照試料の前記16のバイオマーカーのそれぞれの発現レベルを合計することで進行性診断I総参照値を生成する工程をさらに含み、ここで、進行性診断I総参照値と比較して増加している進行性診断I総検査値の値は対象における進行性GEP-NENの存在を示す。
本発明の方法は、対象からの検査試料および参照試料を、ARAF1、BRAF、KRAS、RAF1、Ki67、NAP1L1、NOL3、GLT8D1、PLD3、PNMA2、VMAT2、TPH1、FZD7、MORF4L2、およびZFHX3を含む15のバイオマーカーのそれぞれの量の検出に特異的な複数の作用物質と接触させることによって、検査試料および参照試料から、前記15のバイオマーカーのそれぞれの発現レベルを決定する工程;検査試料の前記15のバイオマーカーのそれぞれの発現レベルを平均することで進行性診断II検査値を生成し、参照試料の前記15のバイオマーカーのそれぞれの発現レベルを平均することで進行性診断II参照値を生成する工程をさらに含み、ここで、進行性診断II参照値と比較して増加している進行性診断II検査値の値は対象における進行性GEP-NENの存在を示す。
本発明の方法は、対象からの検査試料および参照試料を、PNMA2、VMAT2、COMMD9、SSTR1、SSTR3、SSTR4、およびSSTR5を含む7つのバイオマーカーのそれぞれの量の検出に特異的な複数の作用物質と接触させることによって、検査試料および参照試料から、前記7つのバイオマーカーのそれぞれの発現レベルを決定する工程;検査試料の前記7つのバイオマーカーのそれぞれの発現レベルを合計することで進行性診断III総検査値を生成し、参照試料の前記7つのバイオマーカーのそれぞれの発現レベルを合計することで進行性診断III総参照値を生成する工程をさらに含み、ここで、進行性診断III総参照値と比較して増加している進行性診断III総検査値の値は対象における進行性GEP-NENの存在を示す。
本発明の方法は、対象からの検査試料および参照試料を、Ki67、NAP1L1、NOL3、TECPR2、PQBP1、TPH1、MORF4L2、RNF41、RSF1、SMARCD3、およびZFHX3を含む11のバイオマーカーのそれぞれの量の検出に特異的な複数の作用物質と接触させることによって、検査試料および参照試料から、前記11のバイオマーカーのそれぞれの発現レベルを決定する工程;検査試料の前記11のバイオマーカーのそれぞれの発現レベルを合計することで進行性診断IV総検査値を生成し、参照試料の前記11のバイオマーカーのそれぞれの発現レベルを合計することで進行性診断IV総参照値を生成する工程をさらに含み、ここで、進行性診断IV総参照値と比較して増加している進行性診断IV総検査値の値は対象における進行性GEP-NENの存在を示す。
本発明は、手術後の対象において進行性GEP-NENが再燃または再発するリスクを決定するための方法であって、対象からの検査試料を、APLP2、ARAF、ATP6V1H、BNIP3L、BRAF、CD59、COMMD9、CTGF、FZD7、GLT8D1、KRAS、MKI67/KI67、MORF4L2、NAP1L1、NOL3、OAZ2、PANK2、PHF21A、PLD3、PNMA2、PQBP1、RAF1、RNF41、RSF1、SLC18A1/VMAT1、SLC18A2/VMAT2、SMARCD3、SPATA7、SSTR1、SSTR3、SSTR4、SSTR5、TECPR2、TPH1、TRMT112、WDFY3、ZFHX3、およびZZZ3からなる群より選択される少なくとも22のバイオマーカーの発現の検出に特異的な複数の作用物質と接触させることによって、検査試料から、前記少なくとも22のバイオマーカーの発現レベルを決定する工程;参照試料を、前記少なくとも22のバイオマーカーの発現の検出に特異的な複数の作用物質と接触させることによって、参照試料から、前記少なくとも22のバイオマーカーの発現レベルを決定する工程;検査試料における前記少なくとも22のバイオマーカーの発現レベルを、参照試料における前記少なくとも22のバイオマーカーの発現レベルに対して標準化する工程;検査試料における前記少なくとも22のバイオマーカーの標準化された発現レベルを所定のカットオフ値と比較する工程;標準化された発現レベルが、0〜8のスケールで2という所定のカットオフ値未満であるか、0〜100%のスケールで0%未満である場合に、手術後に進行性GEP-NENが再燃または再発するリスクの非存在を同定し;標準化された発現レベルが、0〜8のスケールで5という所定のカットオフ値未満であるか、0〜100%のスケールで55%未満である場合に、手術後に進行性GEP-NENが再燃または再発する低レベルのリスクを同定し;標準化された発現レベルが、0〜8のスケールで5という所定のカットオフ値以上、かつ7という所定のカットオフ値未満であるか、0〜100%のスケールで55%以上、かつ75%未満である場合に、手術後に進行性GEP-NENが再燃または再発する中間レベルのリスクを同定し;または標準化された発現レベルが、0〜8のスケールで7という所定のカットオフ値以上、もしくは0〜100%のスケールで75%以上である場合に、手術後に進行性GEP-NENが再燃または再発する高レベルのリスクを同定する工程を含む方法も提供する。
本発明は、ソマトスタチンで処置された対象において進行性GEP-NENが再燃または再発するリスクを決定するための方法であって、対象からの検査試料を、APLP2、ARAF、ATP6V1H、BNIP3L、BRAF、CD59、COMMD9、CTGF、FZD7、GLT8D1、KRAS、MKI67/KI67、MORF4L2、NAP1L1、NOL3、OAZ2、PANK2、PHF21A、PLD3、PNMA2、PQBP1、RAF1、RNF41、RSF1、SLC18A1/VMAT1、SLC18A2/VMAT2、SMARCD3、SPATA7、SSTR1、SSTR3、SSTR4、SSTR5、TECPR2、TPH1、TRMT112、WDFY3、ZFHX3、およびZZZ3からなる群より選択される少なくとも22のバイオマーカーの発現の検出に特異的な複数の作用物質と接触させることによって、検査試料から、前記少なくとも22のバイオマーカーの発現レベルを決定する工程;参照試料を、前記少なくとも22のバイオマーカーの発現の検出に特異的な複数の作用物質と接触させることによって、参照試料から、前記少なくとも22のバイオマーカーの発現レベルを決定する工程;検査試料における前記少なくとも22のバイオマーカーの発現レベルを参照試料における前記少なくとも22のバイオマーカーの発現レベルに対して標準化する工程;検査試料における前記少なくとも22のバイオマーカーの標準化された発現レベルを所定のカットオフ値と比較する工程;標準化された発現レベルが、所定のカットオフ値以上である場合に、対象におけるGEP-NENの存在を決定し、または標準化された発現レベルが所定のカットオフ値未満である場合に、対象におけるGEP-NENの非存在を決定し、所定のカットオフ値は0〜8のMAARC-NETスコアリングシステムスケールで2であるか、0〜100%のスケールで0%である工程;GEP-NENが存在する場合には、対象からの検査試料および参照試料を、Ki67、NAP1L1、NOL3、TECPR2、SSTR1、SSTR2、SSTR4、およびSSTR5を含む8つのバイオマーカーのそれぞれの発現の検出に特異的な複数の作用物質と接触させることによって、検査試料および参照試料から、前記8つのバイオマーカーのそれぞれの発現レベルを決定する工程;検査試料の前記8つのバイオマーカーのそれぞれの発現レベルを合計することで進行性診断V総検査値を生成し、参照試料の前記8つのバイオマーカーのそれぞれの発現レベルを合計することで進行性診断V総参照値を生成する工程を含み、進行性診断V総参照値と比較して増加している進行性診断V総検査値の値は対象における再燃または再発進行性GEP-NENの存在を示す方法も提供する。
本発明は、GEP-NENのペプチド受容体放射性ヌクレオチド療法(PRRT)の応答を決定する必要がある対象における同療法の応答を決定するための方法であって、対象からの検査試料および参照試料を、ARAF1、BRAF、KRAS、RAF1、ATP6V1H、OAZ2、PANK2、PLD3を含む8つのバイオマーカーのそれぞれの発現の検出に特異的な複数の作用物質と接触させることによって、検査試料および参照試料から、前記8つのバイオマーカーのそれぞれの発現レベルを決定する工程;検査試料における前記8つのバイオマーカーの発現レベルを参照試料における前記8つのバイオマーカーの発現レベルに対して標準化する工程;検査試料における前記8つのバイオマーカーの標準化された発現レベルを所定のカットオフ値と比較する工程;前記8つのバイオマーカーの標準化された発現レベルが所定のカットオフ値より大きい場合に、対象におけるPRRT応答性GEP-NENの存在を決定する工程を含み、所定のカットオフ値は0〜8のスケールで5.9である方法も提供する。
本発明は、GEP-NENのペプチド受容体放射性ヌクレオチド療法(PRRT)の応答を決定する必要がある対象における同療法の応答を決定するための方法であって、(a)PRRT療法の第1サイクル後に:第1サイクル検査試料を、APLP2、ARAF、ATP6V1H、BNIP3L、BRAF、CD59、COMMD9、CTGF、FZD7、GLT8D1、KRAS、MKI67/KI67、MORF4L2、NAP1L1、NOL3、OAZ2、PANK2、PHF21A、PLD3、PNMA2、PQBP1、RAF1、RNF41、RSF1、SLC18A1/VMAT1、SLC18A2/VMAT2、SMARCD3、SPATA7、SSTR1、SSTR3、SSTR4、SSTR5、TECPR2、TPH1、TRMT112、WDFY3、ZFHX3、およびZZZ3からなる群より選択される少なくとも22のバイオマーカーの発現の検出に特異的な複数の作用物質と接触させることによって、第1サイクル検査試料から、前記少なくとも22のバイオマーカーの発現レベルを決定する工程;参照試料を、前記少なくとも22のバイオマーカーの発現の検出に特異的な複数の作用物質と接触させることによって、参照試料から、前記少なくとも22のバイオマーカーの発現レベルを決定する工程;第1サイクル検査試料における前記少なくとも22のバイオマーカーの発現レベルを参照試料における前記少なくとも22のバイオマーカーの発現レベルに対して標準化する工程;(b)PRRT療法の第2サイクル後に、対象からの第2サイクル検査試料を、APLP2、ARAF、ATP6V1H、BNIP3L、BRAF、CD59、COMMD9、CTGF、FZD7、GLT8D1、KRAS、MKI67/KI67、MORF4L2、NAP1L1、NOL3、OAZ2、PANK2、PHF21A、PLD3、PNMA2、PQBP1、RAF1、RNF41、RSF1、SLC18A1/VMAT1、SLC18A2/VMAT2、SMARCD3、SPATA7、SSTR1、SSTR3、SSTR4、SSTR5、TECPR2、TPH1、TRMT112、WDFY3、ZFHX3、およびZZZ3からなる群より選択される少なくとも22のバイオマーカーの発現の検出に特異的な複数の作用物質と接触させることによって、検査試料から、前記少なくとも22のバイオマーカーの発現レベルを決定する工程;参照試料を、前記少なくとも22のバイオマーカーの発現の検出に特異的な複数の作用物質と接触させることによって、参照試料から、前記少なくとも22のバイオマーカーの発現レベルを決定する工程;第2サイクル検査試料における前記少なくとも22のバイオマーカーの発現レベルを参照試料における前記少なくとも22のバイオマーカーの発現レベルに対して標準化する工程;(c)(a)の標準化された発現レベルから(b)の標準化された発現レベルへの変化率を決定する工程;(d)変化率がPRRT療法前カットオフ値より大きい場合に、PRRT応答性GEP-NENの存在を決定する工程を含み、PRRT療法前カットオフ値は0〜8のスケールで1である方法も提供する。
本発明は、GEP-NENの進行を決定する必要がある対象におけるGEP-NENの進行を決定するための方法であって、対象からの検査試料を、ZFHX3の発現の検出に特異的な作用物質と接触させることにより、検査試料から、ZFHX3の発現レベルを決定する工程;参照試料を、ZFHX3の発現の検出に特異的な作用物質と接触させることにより、参照試料から、ZFHX3の発現レベルを決定する工程;検査試料におけるZFHX3の発現レベルを参照試料におけるZFHX3の発現レベルに対して標準化する工程;検査試料におけるZFHX3の標準化された発現レベルを所定のカットオフ値と比較する工程;標準化された発現レベルが所定のカットオフ値以上である場合に、対象におけるGEP-NENの進行を決定する工程を含み、所定のカットオフ値は0〜8のスケールで0.5である方法も提供する。
本発明は、GEP-NENの腫瘍増殖を予測する必要がある対象におけるGEP-NENの腫瘍増殖を予測するための方法であって、(a)対象からの検査試料を、APLP2、ARAF、ATP6V1H、BNIP3L、BRAF、CD59、COMMD9、CTGF、FZD7、GLT8D1、KRAS、MKI67/KI67、MORF4L2、NAP1L1、NOL3、OAZ2、PANK2、PHF21A、PLD3、PNMA2、PQBP1、RAF1、RNF41、RSF1、SLC18A1/VMAT1、SLC18A2/VMAT2、SMARCD3、SPATA7、SSTR1、SSTR3、SSTR4、SSTR5、TECPR2、TPH1、TRMT112、WDFY3、ZFHX3、およびZZZ3からなる群より選択される少なくとも22のバイオマーカーの発現の検出に特異的な複数の作用物質と接触させることによって、検査試料から、前記少なくとも22のバイオマーカーの発現レベルを決定する工程;参照試料を、前記少なくとも22のバイオマーカーの発現の検出に特異的な複数の作用物質と接触させることによって、参照試料から、前記少なくとも22のバイオマーカーの発現レベルを決定する工程;検査試料における前記少なくとも22のバイオマーカーの発現レベルを参照試料における前記少なくとも22のバイオマーカーの発現レベルに対して標準化する工程;検査試料における前記少なくとも22のバイオマーカーの標準化された発現レベルを所定のカットオフ値と比較する工程;標準化された発現レベルが所定のカットオフ値以上である場合に、対象におけるGEP-NENの存在を決定し、または標準化された発現レベルが所定のカットオフ値未満である場合に、対象におけるGEP-NENの非存在を決定する工程を含み、所定のカットオフ値は0〜8のMAARC-NETスコアリングシステムスケールで2であるか、0〜100%のスケールで0%であり;(b)GEP-NENが存在する場合には、対象からの検査試料および参照試料を、KRAS、SSTR4、およびVPS13Cを含む3つのバイオマーカーのそれぞれの発現の検出に特異的な複数の作用物質と接触させることによって、検査試料および参照試料から、前記3つのバイオマーカーのそれぞれの発現レベルを決定する工程;検査試料の前記3つのバイオマーカーのそれぞれの発現レベルを合計することで進行性診断VI総検査値を生成し、参照試料の前記3つのバイオマーカーのそれぞれの発現レベルを合計することで進行性診断VI総参照値を生成する工程を含み、ここで、進行性診断VI総参照値と比較して増加している進行性診断VI総検査値の値は対象におけるGEP-NENの腫瘍増殖の存在を示す方法も提供する。
(b)が、対象からの検査試料および参照試料を、SSTR1、SSTR2、およびSSTR5を含む3つのバイオマーカーのそれぞれの発現の検出に特異的な複数の作用物質と接触させることによって、検査試料および参照試料から、前記3つのバイオマーカーのそれぞれの発現レベルを決定する工程;検査試料の前記3つのバイオマーカーのそれぞれの発現レベルを合計することで進行性診断VII総検査値を生成し、参照試料の前記3つのバイオマーカーのそれぞれの発現レベルを合計することで進行性診断VII総参照値を生成する工程をさらに含み、ここで、進行性診断VII総参照値と比較して増加している進行性診断VII総検査値の値は対象におけるGEP-NENの腫瘍増殖の存在を示す方法。
本明細書において使用する用語「GEP-NENバイオマーカー」および「NETバイオマーカー」は、同義語として、その発現または存在(例えば発現レベルまたは発現プロファイル)が、それだけで、または1つもしくは複数の他のバイオマーカーと比較して(例えば相対的発現)、GEP-NEN疾患の存在、非存在、タイプ、クラス、重症度、転移、場所、ステージ、予後判定、関連症状、アウトカム、リスク、見込み(likelihood)もしくは処置応答性、または予後に依存して相違している(すなわち増加または減少している)か、その予測のそのような因子に正または負に関連している、遺伝子産物などの生体分子を指す。
本明細書において使用する用語「ポリヌクレオチド」または核酸分子とは、長さが少なくとも10塩基または10塩基対であるポリマー型のヌクレオチド(リボヌクレオチドもしくはデオキシヌクレオチドのいずれか、またはいずれかのタイプのヌクレオシドの修飾型)を意味し、一本鎖型および二本鎖型のDNAを包含するものとする。本明細書において、マイクロアレイ分析でプローブとして役立つ核酸分子または核酸配列は、好ましくは、ヌクレオチドの鎖、より好ましくはDNAおよび/またはRNAを含む。別の態様において、核酸分子または核酸配列は、例えばDNA/RNAヘリックス、ペプチド核酸(PNA)、ロックト核酸(LNA)および/またはリボザイムなどといった他の種類の核酸構造を含む。したがって本明細書において使用する用語「核酸分子」は、天然ヌクレオチドと同じ機能を呈する非天然ヌクレオチド、修飾ヌクレオチドおよび/または非ヌクレオチドビルディングブロックを含む鎖も包含する。
ポリヌクレオチドに関連して本明細書において使用する用語「ハイブリダイズする」(hybridize、hybridizing、hybridizesなど)は、従来のハイブリダイゼーション条件、好ましくは、50%ホルムアミド/6×SSC/0.1%SDS/100μg/ml ssDNAにおけるハイブリダイゼーションであって、ハイブリダイゼーションの温度が37℃を上回り、0.1×SSC/0.1%SDSでの洗浄時の温度が55℃を上回るもの、最も好ましくはストリンジェントなハイブリダイゼーション条件を指すものとする。
「血液生検」という用語は、症状を呈する患者が良性(低活動性)または悪性(高活動性/転移性)のどちらかとして分類されうるコンディションにあるかどうかを決定するための、血液の診断検査を指す。
GEP-NENの異なるタイプまたはステージに関して本明細書において使用する「分類する」という用語は、統計的技法を使ってGEP-NENのステージまたはタイプの診断において役立つ分類を行うために、発現データを編集し解析する行為を指す。
本明細書において使用する用語「分類器」は、疾患状態を所定の統計的有意水準で区別するアルゴリズムを指す。二項分類器は、試料からの測定で得たデータポイントを使用し、データを2つのグループのうちの一方に分類するアルゴリズムである。多項分類器は、試料からの測定で得たデータポイントを使用し、データポイントを多数の群の一つに分類するアルゴリズムである。「分類器」は、ランダムに選択されたがん試料をランダムに選択された良性試料から識別する確率、すなわち受信者動作特性(ROC)曲線の曲線下面積(AUC)を最大化する。
本明細書において使用する用語「標準化」または「ノーマライザー(normalizer)」は、試料中のタンパク質濃度の生物学的変動ではなく試料のハンドリング、試料調製および質量分析測定による技術的変動に起因する効果について調節するための、標準値に着目した示差的値(differential value)の表現を指す。例えば、差次的に発現しているタンパク質の発現を測定する場合、タンパク質の発現に関する絶対値は、発現が実質的に一定である標準タンパク質の発現に関する絶対値に着目して表現することができる。
本明細書において使用する「コンディション(condition)」という用語は、一般に、疾患、イベント、または健康状況の変化を指す。
「診断」および「診断法」という用語は、それぞれ「予後判定」および「予後判定法」という用語、ならびに診断および/または予後判定を経時的にモニタリングするための2つ以上の時点にわたるそのような手順の適用、およびそれに基づく統計的モデル化も包含する。さらにまた、診断という用語は、a.予測(患者が攻撃性の疾患(過剰増殖性/侵襲性)を発生させそうかどうかを決定すること)、b.予後判定(前もって選択された将来の時点において患者のアウトカムが良くなっているか、悪くなっているかを予測すること)、c.治療法選択、d.治療薬モニタリング、およびe.再燃モニタリングも包含する。
生物学的試料に関して本明細書において使用する「用意する」という用語は、対象から生物学的試料を直接的または間接的に得ることを指す。例えば「用意する」とは、対象から生物学的試料を(例えば採血、組織生検、灌注などによって)直接的に得る行為を指しうる。同様に「用意する」とは、生物学的試料を間接的に得る行為も指しうる。例えば、用意するとは、試料を直接的に得た当事者から試料を受け取るという検査室の行為、または保存機関から試料を得る行為を指しうる。
「正確度」とは、測定または算出された量(検査報告値)がその実際の(すなわち真の)値に一致する程度を指す。臨床的正確度は、真のアウトカム(真陽性(TP)または真陰性(TN))と、誤って分類されたアウトカム(偽陽性(FP)または偽陰性(FN))との比率に関係し、感度、特異度、陽性予測値(PPV)もしくは陰性適中度(NPV)、または見込み、オッズ比などと呼ばれうる。
本明細書において使用する用語「生物学的試料」は、潜在的に1種または複数種のバイオマーカータンパク質を含有する可能性がある、生物学的起源の任意の試料を指す。生物学的試料の例には、組織、器官、または体液、例えば全血、血漿、血清、組織、洗浄液、または疾患の検出に使用される他の任意の検体が含まれる。
本明細書において使用する用語「対象」は、哺乳動物、好ましくはヒトを指す。
コンディションに関して本明細書において使用する「処置する」または「処置」は、そのコンディションを防止すること、そのコンディションの開始または発生速度を減速すること、そのコンディションが発生するリスクを低減すること、そのコンディションに関連する症状の発生を防止しまたは遅延させること、そのコンディションに関連する症状を低減しまたは終わらせること、そのコンディションの完全なまたは部分的な退縮を生じさせること、またはそれらの何らかの組み合わせを指しうる。
バイオマーカーレベルは疾患の処置に起因して変化しうる。バイオマーカーレベルの変化は本発明によって測定されうる。バイオマーカーレベルの変化は、疾患または治療の進行をモニタリングするために使用しうる。
「変化した」「変わった」または「有意に相違する」とは、合理的に比較しうる状態、プロファイル、または測定などからの検出可能な変化または相違を指す。そのような変化は全か無かであってもよい。変化は段階的変化であってもよく、線形である必要はない。変化は桁の相違であってもよい。変化は、1%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%、100%、もしくはそれ以上、または0%と100%の間の任意の値の増加または減少であってもよい。あるいは、変化は、1倍、1.5倍2倍、3倍、4倍、5倍、もしくはそれ以上、または1倍と5倍の間の任意の値であってもよい。変化は、0.1、0.05、0.001、または0.0001のp値で、統計的に有意でありうる。
「疾患有病率」という用語は、ある特定期間中のすべての新旧疾患症例数またはイベント発生数を指す。有病率は、イベントの数を分子とし、リスクがある個体の数を分母とする比として表される。
「疾患罹患数(率)」という用語は、指定された期間内に何らかの新しいコンディションが発生するリスクの尺度を指し、何らかの期間中の新しい症例の数が、より好ましくは、分母による比率または率として表される。
「安定疾患」という用語は、GEP-NENの存在に関する診断を指すが、GEP-NENは処置されており、安定したコンディションを保っている、すなわち、イメージングデータおよび/または最善の臨床判断による決定で、進行性ではないものである。
「進行性疾患」という用語は、活動性が高い状態のGEP-NEN、すなわち、イメージングデータおよび/または最善の臨床判断による決定で、処置されておらず安定していないか、処置されたが治療に応答していないか、処置されたが活動性の疾患が残っているものの存在に関する診断である。
「発現レベルスコア」または「NETestスコア」という用語は、分類アルゴリズムの組み合わせ、すなわちSVM、LDA、KNN、およびベイズから作成された数学的に導出される分類器アルゴリズムの出力を指す。このスコアは0〜100%の範囲にある。検査試料からの発現レベルスコアは、参照試料または対照試料に関する発現レベルスコアと比較すれば、GEP-NENの存在、ステージの異なるGEP-NENの存在を診断し、あるステージのGEP-NENにかかるリスクを予測し、または治療後のヒト患者においてGEP-NENが再発するリスクを決定するために使用することができる。GEP-NEN疾患状態間の区別は、本願においてさらに詳しく規定する所定の発現レベルスコア閾および/または範囲に基づく。
GEP-NENの診断および予後判定は困難であった。その理由は、一つには、何年間も無症候性のままであることも少なくないこの疾患のありきたりな症状および症候群、例えばカルチノイド症候群、下痢、潮紅、発汗、気管支収縮、消化管出血、心疾患、間欠性腹痛などである。利用することができる診断方法には、解剖学的局在、例えばX線、消化管内視鏡検査、腹部コンピュータ断層撮影法(CT)、複合定位放射線照射(SRS)/CT、およびMRIなどのイメージングによるもの、ならびに何らかの遺伝子産物、例えばクロモグラニンAの検出が含まれる。公知の方法には、例えば低い特異度および/もしくは感度による制約、ならびに/または早期疾患を検出する能力に制約がある。
単一のバイオマーカーの検出は、例えばヒト血液試料中の悪性疾患を同定したり、線維症や転移のような複雑なアウトカムを予測したりするには、十分に満足できるものではなかった。Michiels S, Koscielny S, Hill C,「Interpretation of microarray data in cancer」Br J Cancer 2007;96(8):1155-8を参照されたい。利用可能な方法における制約は、病理学的分類、疾患ステージ分類、および予測、処置の開発、治療効果のモニタリングにおける難題の一因となってきた。ここに提供する態様には、これらの制約に対処する方法および組成物が含まれる。
一局面において、本願は、GEP-NENバイオマーカーおよびそのようなバイオマーカーのパネルの、例えば生物学的試料における検出および同定に関する。生物学的試料において、典型的には血液試料において、前記バイオマーカーを検出し、前記バイオマーカーの発現レベルを決定し、前記バイオマーカーを認識し、または前記バイオマーカーに結合するための方法および組成物(例えばポリヌクレオチドなどの作用物質)を提供する。
GEP-NENおよび付随するアウトカムを予測し、分類し、評価するための、例えばリスクの程度、処置に対する応答性、転移または攻撃性を予測するための、およびGEP-NENサブタイプを決定するための、モデルおよび生物数学的アルゴリズム、例えば教師つき学習アルゴリズム、ならびにそれらを使用する方法も提供する。
ここに提供する態様を使った前記バイオマーカーの検出は、GEP-NEN診断法および予後判定法を改良するのに役立ち、処置プロトコールに情報を提供するのに役立つ。いくつかの局面において、ここに提供する態様による前記バイオマーカーの検出および/または発現レベルは、GEP-NEN、またはGEP-NEN細胞、例えば循環GEP-NEN細胞(CNC)の存在、非存在、ステージ、クラス、場所、サブタイプ、攻撃性、悪性度、転移、予後判定、または他のアウトカムを確認し、または示す。ここに提供する方法および組成物は、腫瘍の位置確認、転移、微小転移および小さな病変の予測もしくは検出、ならびに/または再発のリスクの程度、見込み、処置応答性または寛解を決定し、適当な処置コースに情報提供するのに役立つ。例えば前記バイオマーカーを、例えば循環中に検出することは、早期および原発性GEP-NENを検出するために使用しうる。例えば循環におけるバイオマーカーの検出は、早期および原発性GEP-NENを検出するために、(例えば解剖学的局在などといった別のアプローチによって以前に「陰性」とみなされた患者において、GEP-NEN疾患または転移を同定するために)使用しうる。
ここに提供する方法および組成物は、患者特異的処置戦略を含む処置戦略を設計し、実装し、モニタリングするために使用しうる。一例において、検出されたGEP-NENバイオマーカーの発現レベルは、処置効力に関する代用マーカーとして、例えば腫瘍の除去などの外科的治療、腫瘍分泌/増殖の阻害などの標的内科的治療、および他の治療的アプローチの効果を、腫瘍の寛解または再発を小さな微小転移の形態にあるものでさえ検出することによって、モニタリングするために役立つ。本方法は、臨床症状およびアウトカムの評価、ならびにGEP-NENの組織学的グレード分けおよび分子キャラクタリゼーションにも使用しうる。
ここに提供するバイオマーカーには、GEP-NENバイオマーカー、ならびにそのサブセットおよびパネルが含まれる。ここに提供するGEP-NENバイオマーカーには、GEP-NEN疾患において、および/またはGEP-NENの異なるステージもしくはサブタイプにおいて、または異なるGEP-NEN腫瘍において差次的に発現する遺伝子産物、例えばDNA、RNA(例えば転写産物)およびタンパク質、例えば転移性腫瘍と非転移性腫瘍において、攻撃性の程度が異なる腫瘍において、高リスク腫瘍と低リスク腫瘍において、応答性腫瘍と非応答性腫瘍において、呈示する病理学的分類および/または特定の処置コースに対する応答の見込みが異なる腫瘍において差次的に発現する遺伝子産物、ならびにGEP-NEN疾患、ステージ、またはタイプの特徴に関連する遺伝子産物、または内分泌細胞もしくは関連細胞タイプに関連する遺伝子産物が含まれる。
例えば、本バイオマーカーには、その発現が造腫瘍性、転移、もしくはホルモン生産、または原発性もしくは転移性GEP-NENの表現型、例えば接着、遊走、増殖、アポトーシス、転移、およびホルモン分泌などと関連する、または関係づけられている遺伝子産物、および新生物または悪性疾患全般と関連する遺伝子産物が含まれる。
本バイオマーカーには、ホルモンおよびアミンを含むGEP-NEN細胞分泌産物、例えばガストリン、グレリン、膵ポリペプチド、サブスタンスP、ヒスタミン、およびセロトニン、ならびに循環中に検出されうる腫瘍増殖因子-ベータ(TGF-β)および結合組織増殖因子(CTGF)などの増殖因子が含まれる。分泌産物は腫瘍のサブタイプおよび起源によってさまざまでありうる。
一例において、本バイオマーカーは、さまざまなGEP-NENのサブタイプ、ステージ、攻撃性の程度、または処置応答性の基礎にある調節遺伝子型(すなわち接着、遊走、増殖、アポトーシス、転移、および/またはホルモン分泌)に関連する遺伝子産物である。
GEP-NENの診断、予後判定、および/またはモニタリングのために、合計51の差次的に発現するバイオマーカー遺伝子が見いだされた。それら51の差次的に発現するGEP-NENバイオマーカーならびにハウスキーピング遺伝子ALG9に関するさらなる詳細を表1に示す。
(表1)GEP-NENバイオマーカー/ハウスキーパー配列情報
51のGEP-NENバイオマーカーには、AKAP8L(Aキナーゼ(PRKA)アンカータンパク質8様)、APLP2(アミロイドベータ(A4)前駆体様タンパク質2)、ARAF1(v-rafマウス肉腫3611ウイルスがん遺伝子ホモログ)、ATP6V1H(ATPase、H+輸送、リソソーム50/57kDa、VIサブユニットH)、BNIP3L(BCL2/アデノウイルスE1B 19kDa相互作用タンパク質3様)、BRAF(v-rafマウス肉腫ウイルスがん遺伝子ホモログB1)、C21ORF7(染色体21オープンリーディングフレーム7)、CD59(CD59分子、補体調節タンパク質)、COMMD9(COMMドメイン含有9)、CTGF(結合組織増殖因子)、ENPP4(エクトヌクレオチドピロホスファターゼ/ホスホジエステラーゼ4)、FAM131A(配列類似ファミリー131(family with sequence similarity 131)、メンバーA、転写産物変異体2)、FLJ10357(Rhoグアニンヌクレオチド交換因子(GEF)40(ARHGEF40)、FZD7(frizzledホモログ7(ショウジョウバエ(Drosophila)))、GLT8D1(グリコシルトランスフェラーゼ8ドメイン含有1、転写産物変異体3)、HDAC9(ヒストンデアセチラーゼ9、転写産物変異体6)、HSF2(熱ショック転写因子2、転写産物変異体1)、Ki-67(モノクローナル抗体Ki-67によって同定される抗原)、KRAS(v-Ki-ras2 Kirstenラット肉腫ウイルスがん遺伝子ホモログ)、LEOl(Pafl/RNAポリメラーゼII複合体コンポーネントホモログ(S.セレビシエ(S. cerevisiae)))、MORF4L2(モータリティ因子(mortality factor)4様2、転写産物変異体1)、NAP1L1(ヌクレオソームアセンブリタンパク質1様1)、NOL3(核小体タンパク質3(CARDドメインを持つアポトーシス抑制因子)、転写産物変異体3)、NUDT3(nudix(ヌクレオシド二リン酸結合成分X)型モチーフ3)、OAZ2(オルニチンデカルボキシラーゼアンチザイム2)、PANK2(パントテン酸キナーゼ2)、PHF21A(PHDフィンガータンパク質21A、転写産物変異体1)、PKD1(多発性嚢胞腎1(常染色体優性)、転写産物変異体2)、PLD3(ホスホリパーゼDファミリー、メンバー3、転写産物変異体1)、PNMA2(パラネオプラスチック抗原MA2)、PQBP1(ポリグルタミン結合タンパク質1、転写産物変異体2)、RAF1(v-raf-1マウス白血病ウイルスがん遺伝子ホモログ1)、RNF41(リングフィンガータンパク質41、転写産物変異体4)、RSF1(リモデリングおよびスペーシング因子1)、RTN2(レティキュロン2、転写産物変異体1)、SMARCD3(SWI/SNF関連、マトリックス関連、クロマチンのアクチン依存性レギュレーター、サブファミリーd、メンバー3、転写産物変異体3)、SPATA7(精子形成関連7、転写産物変異体2)、SST1(ソマトスタチン受容体1)、SST3(ソマトスタチン受容体3)、SST4(ソマトスタチン受容体4)、SST5(ソマトスタチン受容体5、転写産物変異体1)、TECPR2(テクトニンベータ-プロペラリピート含有2、転写産物変異体2)、TPH1(トリプトファンヒドロキシラーゼ1)、TRMT112(tRNAメチルトランスフェラーゼ11-2ホモログ(S.セレビシエ))、VMAT1(溶質輸送体ファミリー18(小胞モノアミン)、メンバー1)、VMAT2(溶質輸送体ファミリー18(小胞モノアミン)、メンバー2)、VPS13C(液胞タンパク質選別13ホモログC(S.セレビシエ)、転写産物変異体2B)、WDFY3(WDリピートおよびFYVEドメイン含有3)、ZFHX3(ジンクフィンガーホメオボックス3、転写産物変異体B)、ZXDC(ジンクフィンガーC、転写産物変異体2)、およびZZZ3(ジンクフィンガー、ZZタイプ含有3)があり、これらには、遺伝子産物、典型的にはヒト遺伝子産物、例えば転写産物、mRNA、cDNA、コード配列、タンパク質およびポリペプチド、ならびにアレル変異体、スプライス変異体、転写産物変異体、および一塩基多型(SNP)変異体などの自然変異体を含む、タンパク質およびポリペプチドをコードするポリヌクレオチド(核酸)が含まれる。例えばバイオマーカーには、本明細書に開示する配列を有するポリヌクレオチド、タンパク質、およびポリペプチド、ならびにそれらの変異体が含まれる。
これら51のマーカー遺伝子の発現を標準化するために使用したハウスキーピング遺伝子は、ヒトALG9(アスパラギン結合グリコシル化9、アルファ-1,2-マンノシルトランスフェラーゼホモログ)である。
これら51の差次的に発現するバイオマーカー遺伝子のうち、38のバイオマーカー遺伝子は、GEP-NENおよび/または異なる状態のGEP-NENの存在を診断し、モニタリングし、かつ/または予後判定するための数学的に導出される発現レベルスコアの生成に有用である。それら38のGEP-NENバイオマーカーには、PNMA2、NAP1L1、FZD7、SLC18A2/VMAT2、NOL3、SSTR5、TPH1、RAF1、RSF1、SSTR3、SSTR1、CD59、ARAF、APLP2、KRAS、MORF4L2、TRMT112、MKI67/KI67、SSTR4、CTGF、SPATA7、ZFHX3、PHF21A、SLC18A1/VMAT1、ZZZ3、TECPR2、ATP6V1H、OAZ2、PANK2、PLD3、PQBP1、RNF41、SMARCD3、BNIP3L、WDFY3、COMMD9、BRAF、およびGLT8D1が含まれる。
GEP-NENの存在を診断し、モニタリングし、かつ/または予後判定するための数学的に導出される発現レベルスコアの生成に有用な38のバイオマーカー遺伝子のうち、少なくとも22のバイオマーカー遺伝子は、妥当な分類器を生成するために必要となりうる。それら少なくとも22のバイオマーカー遺伝子には、PNMA2、NAP1L1、FZD7、SLC18A2、NOL3、SSTR5、TPH1、RAF1、RSF1、SSTR3、SSTR1、CD59、ARAF、APLP2、KRAS、MORF4L2、TRMT112、MKI67、SSTR4、CTGF、SPATA7、およびZFHX3が含まれる。
ALG9バイオマーカー/ハウスキーピング遺伝子にはヒトALG9遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、ALG9バイオマーカー/ハウスキーピング遺伝子は、SEQ ID NO:1に示すヌクレオチド配列(NM_024740.2に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
AKAP8LバイオマーカーにはヒトAKAP8L遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、AKAP8Lバイオマーカーは、SEQ ID NO:2に示すヌクレオチド配列(NM_014371.3に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
APLP2バイオマーカーにはヒトAPLP2遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、APLP2バイオマーカーは、SEQ ID NO:3に示すヌクレオチド配列(NM_001142276.1に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
ARAF1バイオマーカーにはヒトARAF1遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、ARAF1バイオマーカーは、SEQ ID NO:4に示すヌクレオチド配列(NM_001654.4に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
ATP6V1HバイオマーカーにはヒトATP6V1H遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、ATP6V1Hバイオマーカーは、SEQ ID NO:5に示すヌクレオチド配列(NM_015941.3に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
BNIP3LバイオマーカーにはヒトBNIP3L遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、BNIP3Lバイオマーカーは、SEQ ID NO:6に示すヌクレオチド配列(NM_004331.2に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
BRAFバイオマーカーにはBRAF遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、BRAFバイオマーカーは、SEQ ID NO:7に示すヌクレオチド配列(NM_004333.4に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
C21ORF7バイオマーカーにはC21ORF7遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、C21ORF7バイオマーカーは、SEQ ID NO:8に示すヌクレオチド配列(NM_020152.3に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
CD59バイオマーカーにはCD59遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、CD59バイオマーカーは、SEQ ID NO:9に示すヌクレオチド配列(NM_203331.2に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
COMMD9バイオマーカーにはCOMMD9遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、COMMD9バイオマーカーは、SEQ ID NO:10に示すヌクレオチド配列(NM_001101653.1に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
CTGFバイオマーカーにはCTGF遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、CTGFバイオマーカーは、SEQ ID NO:11に示すヌクレオチド配列(NM_001901.2に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
ENPP4バイオマーカーにはENPP4遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、ENPP4バイオマーカーは、SEQ ID NO:12に示すヌクレオチド配列(NM_014936.4に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
FAM131AバイオマーカーにはFAM131A遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、FAM131Aバイオマーカーは、SEQ ID NO:13に示すヌクレオチド配列を有するポリヌクレオチド(NM_001171093.1に掲載されている)、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
FLJ1035バイオマーカーにはFLJ1035遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、FLJ 1035バイオマーカーは、SEQ ID NO:14に示すヌクレオチド配列(NM_018071.4に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
FZD7バイオマーカーにはFZD7遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、FZD7バイオマーカーは、SEQ ID NO:15に示すヌクレオチド配列(NM_003507.1に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
GLT8D1バイオマーカーにはGLT8D1遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、GLT8D1バイオマーカーは、SEQ ID NO:16に示すヌクレオチド配列(NM_001010983.2に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
HDAC9バイオマーカーにはHDAC9遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、HDAC9バイオマーカーは、SEQ ID NO:17に示すヌクレオチド配列(NM_001204144.1に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
HSF2バイオマーカーにはHSF2遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、HSF2バイオマーカーは、SEQ ID NO:18に示すヌクレオチド配列(NM_004506.3に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
Ki-67バイオマーカーにはKi-67遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、Ki-67バイオマーカーは、SEQ ID NO:19に示すヌクレオチド配列(NM_001145966.1に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
KRASバイオマーカーにはKRAS遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、KRASバイオマーカーは、SEQ ID NO:20に示すヌクレオチド配列(NM_004985.4に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
LEO1バイオマーカーにはLEO1遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、LEO1バイオマーカーは、SEQ ID NO:21に示すヌクレオチド配列(NM_138792.3に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
MORF4L2バイオマーカーにはMORF4L2遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、MORF4L2バイオマーカーは、SEQ ID NO:22に示すヌクレオチド配列(NM_001142418.1に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
NAP1L1バイオマーカーにはNAP1L1遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、NAP1L1バイオマーカーは、SEQ ID NO:23に示すヌクレオチド配列(NM_139207.2に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
NOL3バイオマーカーにはNOL3遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、NOL3バイオマーカーは、SEQ ID NO:24に示すヌクレオチド配列(NM_001185057.2に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
NUDT3バイオマーカーにはNUDT3遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、NUDT3バイオマーカーは、SEQ ID NO:25に示すヌクレオチド配列(NM_006703.3に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
OAZ2バイオマーカーにはOAZ2遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、OAZ2バイオマーカーは、SEQ ID NO:26に示すヌクレオチド配列(NM_002537.3に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
PANK2バイオマーカーにはPANK2遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、PANK2バイオマーカーは、SEQ ID NO:27に示すヌクレオチド配列(NM_024960.4に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
PHF21AバイオマーカーにはPHF21A遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、PHF21Aバイオマーカーは、SEQ ID NO:28に示すヌクレオチド配列を有するポリヌクレオチド(NM_001101802.1に掲載されている)、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
PKD1バイオマーカーにはPKD1遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、PKD1バイオマーカーは、SEQ ID NO:29に示すヌクレオチド配列(NM_000296.3に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
PLD3バイオマーカーにはPLD3遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、PLD3バイオマーカーは、SEQ ID NO:30に示すヌクレオチド配列を有するポリヌクレオチド(NM_001031696.3に掲載されている)、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
PNMA2バイオマーカーにはPNMA2遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、PNMA2バイオマーカーは、SEQ ID NO:31に示すヌクレオチド配列(NM_007257.5に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
PQBP1バイオマーカーにはPQBP1遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、PQBP1バイオマーカーは、SEQ ID NO:32に示すヌクレオチド配列(NM_001032381.1に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
RAF1バイオマーカーにはRAF1遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、RAF1バイオマーカーは、SEQ ID NO:33に示すヌクレオチド配列(NM_002880.3に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
RNF41バイオマーカーにはRNF41遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、RNF41バイオマーカーは、SEQ ID NO:34に示すヌクレオチド配列(NM_001242826.1に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
RSF1バイオマーカーにはRSF1遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、RSF1バイオマーカーは、SEQ ID NO:35に示すヌクレオチド配列(NM_016578.3に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
RTN2バイオマーカーにはRTN2遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、RTN2バイオマーカーは、SEQ ID NO:36に示すヌクレオチド配列(NM_005619.4に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
SMARCD3バイオマーカーにはSMARCD3遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、SMARCD3バイオマーカーは、SEQ ID NO:37に示すヌクレオチド配列(NM_001003801.1に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
SPATA7バイオマーカーにはSPATA7遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、SPATA7バイオマーカーは、SEQ ID NO:38に示すヌクレオチド配列(NM_001040428.3に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
SSTR1バイオマーカーにはSSTR1遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、SSTR1バイオマーカーは、SEQ ID NO:39に示すヌクレオチド配列(NM_001049.2に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
SSTR3バイオマーカーにはSSTR3遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、SSTR3バイオマーカーは、SEQ ID NO:40に示すヌクレオチド配列(NM_001051.4に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
SST4バイオマーカーにはSST4遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、SST4バイオマーカーは、SEQ ID NO:41に示すヌクレオチド配列(NM_001052.2に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
SST5バイオマーカーにはSST5遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、SST5バイオマーカーは、SEQ ID NO:42に示すヌクレオチド配列を有するポリヌクレオチド(NM_001053.3に掲載されている)、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
TECPR2バイオマーカーにはTECPR2遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、TECPR2バイオマーカーは、SEQ ID NO:43に示すヌクレオチド配列(NM_001172631.1に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
TPH1バイオマーカーにはTPH1遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、TPH1バイオマーカーは、SEQ ID NO:44に示すヌクレオチド配列(NM_004179.2に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
TRMT112バイオマーカーにはTRMT112遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、TRMT112バイオマーカーは、SEQ ID NO:45に示すヌクレオチド配列(NM_016404.2に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
VMAT1バイオマーカーにはVMAT1遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、VMAT1バイオマーカーは、SEQ ID NO:46に示すヌクレオチド配列(NM_003053.3に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
VMAT2バイオマーカーにはVMAT2遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、VMAT2バイオマーカーは、SEQ ID NO:47に示すヌクレオチド配列(NM_003054.4に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
VPS13CバイオマーカーにはVPS13C遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、VPS13Cバイオマーカーは、SEQ ID NO:48に示すヌクレオチド配列(NM_001018088.2に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
WDFY3バイオマーカーにはWDFY3遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、WDFY3バイオマーカーは、SEQ ID NO:49に示すヌクレオチド配列(NM_014991.4に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
ZFHX3バイオマーカーにはZFHX3遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、ZFHX3バイオマーカーは、SEQ ID NO:50に示すヌクレオチド配列(NM_001164766.1に掲載されている)を有するポリヌクレオチド、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
ZXDCバイオマーカーにはZXDC遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、ZXDCバイオマーカーは、SEQ ID NO:51に示すヌクレオチド配列を有するポリヌクレオチド(NM_001040653.3に掲載されている)、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
ZZZ3バイオマーカーにはZZZ3遺伝子産物が含まれ、これには、その自然変異体、例えばアレル変異体、ならびにホモログおよび類似体も含まれる。一例において、ZZZ3バイオマーカーは、SEQ ID NO:52に示すヌクレオチド配列を有するポリヌクレオチド(NM_015534.4に掲載されている)、またはそのタンパク質コード部分を含有するもの、もしくはそれらの自然変異体、またはそのようなポリヌクレオチドによってコードされるタンパク質である。
いくつかの態様において、ポリヌクレオチドのパネルは、「ハウスキーピング」遺伝子、すなわち参照遺伝子、例えばその発現量の相違が、分析される変数の相違と相関すること、例えばGEP-NENまたは他の新生物疾患の存在もしくは非存在、またはさまざまなGEP-NENサブタイプの分化、転移、粘膜タイプまたは他の組織タイプ、予後指摘、および/または他の表現型、予測、もしくはアウトカムと相関することが知られていないか、相関するとは予想されない遺伝子に特異的にハイブリダイズすることができる1種または複数種のポリヌクレオチドを、さらに含む。いくつかの局面では、そのようなハウスキーピング遺伝子の発現レベルを検出して、全体的発現レベルの標準として、例えばさまざまな試料で得られたGEP-NENバイオマーカーに関する発現データを標準化するために使用される。
ハウスキーピング遺伝子は当技術分野において周知である。典型的には、ハウスキーピング遺伝子には、GEP-NEN試料を分析するのにとりわけ適当であると特徴づけられる、ALG9などの1種または複数種の遺伝子が含まれる。Kidd M, et al.「GeneChip, geNorm and Gastrointestinal tumors: novel reference genes for real-time PCR」Physiol Genomics 2007;30:363-70参照。本願では、ALG9が最適なハウスキーピング遺伝子である。
本発明は、GEP-NENバイオマーカーを検出するための、そしてGEP-NENバイオマーカーを発現する腫瘍および細胞を同定し、単離し、濃縮するための、方法、組成物、およびシステムを提供する。例えば、GEP-NENバイオマーカーを検出するための作用物質、作用物質のセット、およびシステム、ならびにそれらの使用方法、例えば診断および予後判定へのそれらの使用が提供される。
一態様において、作用物質は、GEP-NENバイオマーカーに特異的に結合する、または特異的にハイブリダイズする、タンパク質、ポリヌクレオチドまたは他の分子である。作用物質には、mRNAなどのポリヌクレオチドバイオマーカーに対して同一性または相補性を有するプローブおよびプライマーなどのポリヌクレオチド、例えばセンスPCRプライマーおよびアンチセンスPCRプライマー、またはそのようなバイオマーカーに特異的に結合する抗体などのタンパク質である。バイオマーカーのパネルに特異的にハイブリダイズしまたは結合する作用物質などといった、作用物質を含有するセットおよびキットも提供する。
したがって、ここに提供するシステム、例えばマイクロアレイ、ポリヌクレオチドのセット、およびキットには、核酸分子、典型的にはプライマーおよびプローブなどのDNAオリゴヌクレオチドを伴うものが含まれ、その長さは、典型的には、15塩基〜数キロ塩基、例えば20塩基〜1キロ塩基、40〜100塩基、および50〜80ヌクレオチド、または20〜80ヌクレオチドの範囲で、さまざまである。一局面において、ヌクレオチドマイクロアレイ、キット、または他のシステムの核酸分子の大半(すなわち少なくとも60%)は、GEP-NENバイオマーカーにハイブリダイズする能力を有する。
一例では、ここに提供する方法に従ってバイオマーカーの発現レベルの変化を検出し、測定し、バイオマーカーの発現プロファイルを決定するために、バイオマーカーに特異的にハイブリダイズするポリヌクレオチドを含有するシステム、例えば核酸マイクロアレイを提供する。そのようなシステム、例えばマイクロアレイには、少なくとも22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、80、85、90、95、もしくは100、またはそれ以上のバイオマーカー、例えば少なくとも22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、または51のバイオマーカー、および/または次に挙げるバイオマーカーセットのすべてにハイブリダイズすることができるポリヌクレオチドを含むものがある。
PNMA2、NAP1L1、FZD7、SLC18A2/VMAT2、NOL3、SSTR5、TPH1、RAF1、RSF1、SSTR3、SSTR1、CD59、ARAF、APLP2、KRAS、MORF4L2、TRMT112、MKI67/KI67、SSTR4、CTGF、SPATA7、ZFHX3、PHF21A、SLC18A1/VMAT1、ZZZ3、TECPR2、ATP6V1H、OAZ2、PANK2、PLD3、PQBP1、RNF41、SMARCD3、BNIP3L、WDFY3、COMMD9、BRAF、およびGLT8D1遺伝子産物。
いくつかの局面では、システム、例えばマイクロアレイの核酸分子の少なくとも60%、もしくは少なくとも70%、少なくとも80%、またはそれ以上が、バイオマーカーのパネル中のバイオマーカーにハイブリダイズすることができる。一例において、そのようなヌクレオチドマイクロアレイ上に固定化されたプローブは、少なくとも22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49, 50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、80、85、90、95、もしくは100、またはそれ以上のバイオマーカーを含む。例えば少なくとも2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、80、85、90、95、もしくは100、またはそれ以上のバイオマーカーにハイブリダイズすることができる、例えばバイオマーカーのうちの少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、もしくは51またはそれ以上にハイブリダイズすることができる、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、もしくは51、またはそれ以上の核酸分子を含み、それら核酸分子は、少なくともその数に相当する異なるバイオマーカーを結合することができるように、そのそれぞれが、バイオマーカーのうちの異なる1つに特異的にハイブリダイズする能力を有する。
一例において、残りの核酸分子、例えばマイクロアレイ上の核酸分子またはポリヌクレオチドのセット中の核酸分子のうちの40%、または多くて40%は、例えば系統的バイアスを低減するための標準化用の参照遺伝子のセットまたは標準化遺伝子(例えばハウスキーピング遺伝子)のセットにハイブリダイズすることができる。系統的バイアスは、総合的性能のアレイ間での相違による変動(これは、アレイの製作、染色およびスキャニングにおける一貫性のなさなどに起因しうる)および標識RNA試料間の変動(これは、例えば純度の変動に起因しうる)をもたらす。系統的バイアスはマイクロアレイ実験における試料のハンドリング中に導入されうる。系統的バイアスを低減するために、決定されたRNAレベルを、好ましくは、バックグラウンドの非特異的ハイブリダイゼーションに関して補正し、標準化する。
そのような参照プローブの使用は有益であるが、必須ではない。一態様では、核酸配列の少なくとも90%がGEP-NENバイオマーカーにハイブリダイズすることができるポリヌクレオチドのセットまたはシステム、例えばマイクロアレイが提供される。また、さらなる態様は、ポリヌクレオチドの少なくとも95%、さらには100%がバイオマーカーにハイブリダイズするそのようなシステムまたはセットを包含する。
本明細書には、適切な例示的ポリヌクレオチド、例えばPCRプライマーを開示する。バイオマーカーの異なる領域にハイブリダイズすることができる他の核酸プローブおよびプライマーも、もちろん、ここに提供するシステム、キットおよび方法と共に使用するのに適している。
本発明は、バイオマーカーを検出し定量する方法(バイオマーカーの存在、非存在、量または相対量を検出する方法、例えばバイオマーカーの発現レベルまたは発現プロファイルを検出する方法を含む)提供する。典型的には、本方法は、例えばバイオマーカーmRNA発現の存在、量または発現レベルを測定する、核酸に基づく方法である。そのような方法は、典型的には、例えば試料中の核酸バイオマーカー(例えばmRNA)の発現レベルを定量するために、ポリヌクレオチド作用物質を生物学的試料、例えば検査試料ならびに正常試料および参照試料に接触させることによって実行される。
ここに提供する態様によるバイオマーカーの検出および分析は、当技術分野において公知である任意の適切な方法で行うことができる。例えばバイオマーカーがRNAバイオマーカーである場合は、RNAの検出および定量方法が使用される。
核酸発現レベル、例えばmRNA発現を定量または検出するための例示的方法は周知であり、これには、ノーザンブロット法およびインサイチューハイブリダイゼーション(Parker and Barnes, Methods in Molecular Biology 106:247-283,1999); RNAse保護アッセイ(Hod, Biotechniques 13:852-854, 1992);および定量または半定量逆転写ポリメラーゼ連鎖反応(RT-PCR)(Weis et al., Trends in Genetics 8:263-264, 1992)が含まれ、シーケンシングに基づく遺伝子発現分析のための代表的方法には、SAGE(Serial Analysis of Gene Expression)法、およびMPSS(massively parallel signature sequencing)による遺伝子発現分析法がある。
したがって一態様において、バイオマーカーまたはバイオマーカーパネルの発現にはRNA発現が含まれ、本方法は、バイオマーカーのRNA、例えば患者の試料から得られかつ/または患者の試料中に存在するRNAのレベルを決定する工程、および前記バイオマーカーまたはバイオマーカーのパネルについて決定されたRNA発現レベルに基づいて分析、診断、または予測的決定を行う工程を含む。
RNA試料は、当業者には公知であるとおり、数多くの方法で処理することができる。試料からRNAを単離するための方法には、例えば登録商標製剤TRIZOL(登録商標)試薬を使って実行することができるグアニジニウムチオシアネート-フェノール-クロロホルム抽出など、周知のものがいくつかある(Chomczynski P, Sacchi N(2006)「The single-step method of RNA isolation by acid guanidinium thiocyanate-phenol-chloroform extraction: twenty-something years on」Nat Protoc 1(2):581-5参照)。この方法では、TRIZOL(登録商標)を使ってRNAおよびDNAを抽出し、遠心分離を使ってRNAを他の核酸から分離した後、そのRNA試料を浄化するためにエタノールで一連の洗浄を行う。
RNA試料は、試料、例えば細胞または組織から、収穫の時点で新鮮に調製することができる。あるいは、試料調製のために処理するまで-70℃で保存しておいた試料から調製することもできる。あるいは、RNAの品質を保持するために、組織試料または細胞試料を、例えば、ホルマリンまたは類似の作用物質などによる固定;RNAsin(登録商標)(Pharmingen)またはRNasecure(登録商標)(Ambion)などのRNase阻害剤とのインキュベーション;RNAlater(登録商標)(Assuragen)、HOPE(Hepes-Glutamic acid buffer mediated Organic solvent Protection Effect)、およびRCL2(Alphelys)などの水溶液;ならびにUniversal Molecular Fixative(Sakura Finetek USA Inc.)などの非水性溶液などといった、当技術分野において公知の他の条件下で保存しかつ/またはそのような条件に付すことができる。RNA単離にはカオトロピック核酸単離溶解緩衝液(Boom法、Boom et al. J Clin Microbiol. 1990;28:495-503)も使用しうる。
一態様では、試料をTRIZOL(登録商標)と共にインキュベートした後、RNA浄化を行うことによって、バフィーコートからRNAを単離する。RNAの量を評価するために、RNAをピロ炭酸ジエチル水に溶解し、分光光度法で測定し、一部をバイオアナライザ(Agilent Technologies、カリフォルニア州パロアルト)で分析する(Kidd M, et al.「The role of genetic markers-NAP1L1, MAGE-D2, and MTA1-in defining small-intestinal carcinoid neoplasia」Ann Surg Oncol 2006;13(2):253-62)。もう一つの態様では、QIAamp RNA Blood Miniキットを使って血漿からRNAを単離するが、いくつかの例において、この方法を使用すると、TRIZOL(登録商標)アプローチと比較して有意に多い血漿からのハウスキーピング遺伝子のリアルタイムPCRにより、より良い検出が可能になる。もう一つの態様では、例えばQIAamp RNA Blood Miniキットを同様に使用して、RNAを全血から直接単離する。
RNA供給源としての固定パラフィン包埋組織からRNAを単離するための方法は周知であり、一般にmRNAの単離、精製、プライマー伸長および増幅を含む(例えばT. E. Godfrey et al., Molec. Diagnostics 2:84-91[2000]; K. Specht et al., Am. J. Pathol. 158:419-29[2001])。一例において、RNAは、血漿試料などの試料から、QIAamp RNA Blood MiniキットRNAを使って単離される。典型的には、組織からRNAを抽出した後、タンパク質およびDNAの除去、ならびにRNA濃度の分析を行う。RT-PCRのためのRNAの逆転写工程などといった、RNAの修復および/または増幅工程を含めてもよい。
RNAバイオマーカーの発現レベルまたは量は、例えばハウスキーピング遺伝子と比較したRNA発現の定量または同時に測定される他の遺伝子のRNAレベルとの関連におけるRNA発現の定量など、当技術分野において公知である任意の方法で決定または定量してよい。遺伝子のRNAレベルを決定するための方法は当業者には公知であり、これには、ノーザンブロット法、(定量)PCR、およびマイクロアレイ解析などがあるが、それらに限定されるわけではない。
RNAバイオマーカーを逆転写してcDNAを生産することができ、本発明の方法は、生産されたそのcDNAを検出し、定量する工程を含むことができる。いくつかの態様において、cDNAは標識プローブとの複合体を形成することによって検出される。いくつかの態様では、RNAバイオマーカーが、標識プローブまたはプライマーとの複合体を形成することによって直接検出される。
特定のバイオマーカー遺伝子または遺伝子産物のRNAを定量するために、そのRNAと特異的に相互作用する標識プローブをハイブリダイズさせてから、ゲル電気泳動でRNAを分離することにより、ノーザンブロッティングを行ってもよい。プローブは例えば放射性同位体または化学発光基質で標識される。核酸発現産物と相互作用した標識プローブの定量は、発現のレベルを決定するための尺度として役立つ。決定された発現のレベルは、例えば内部較正物質または外部較正物質を使って、試料間で発現レベルが相違しないことがわかっている遺伝子の発現のレベルを比較することによって、または発現レベルを決定する前に既知量のRNAを添加することによって、2つの個別試料間の核酸発現産物の総量の相違に関して標準化することができる。
RT-PCRの場合は、バイオマーカーRNAをcDNAに逆転写する。逆転写酵素ポリメラーゼ連鎖反応(RT-PCR)は、例えば関心対象のRNA配列にハイブリダイズする特異的プライマーと逆転写酵素とを使って行われる。さらにまた、RT-PCRは、RNAに沿ってランダムにハイブリダイズする例えばランダムヘキサマーまたはランダムデカマーなどのランダムプライマー、またはmRNAのポリ(A)テールにハイブリダイズするオリゴd(T)と、逆転写酵素とを使って行うこともできる。
いくつかの態様において、試料(例えばGEP-NENまたは関連症状もしくは関連症候群を患っているか、それらを患っている疑いがある患者からのもの)中のバイオマーカーのRNA発現レベルは、リアルタイムrt-PCR(qPCR)またはマイクロアレイ解析によるなど、定量的方法を使って決定することができる。いくつかの態様では、定量ポリメラーゼ連鎖反応(QPCR)を使って核酸の発現レベルを定量する。一局面では、例えば異なる試料集団におけるバイオマーカーRNA、例えばmRNA、または他の発現産物のレベルを比較し、遺伝子発現のパターンを特徴づけ、密接に関連するmRNA同士を区別し、RNA構造を分析するために、バイオマーカーの発現レベルの検出および決定が、RT-PCR、GeneChip解析、定量リアルタイムPCR(Q RT-PCR)、またはカルチノイド組織マイクロアレイ(TMA)、免疫染色/定量を使って実行される。
一例において、QPCRは、増幅反応中に産物の量がモニタリングされるリアルタイムPCR(RTPCR)を使って行われるか、最終産物の量が決定される終点測定によって行われる。当業者には公知であるとおり、rtPCRは、例えば、生成したすべての二本鎖産物と相互作用して増幅中に蛍光の増加をもたらす臭化エチジウムまたはSYBR(登録商標)Green I色素などの核酸インターカレーターを利用することによって、または例えば生成した関心対象の遺伝子の二本鎖産物と特異的に反応する標識プローブを利用することによって行われる。使用することができる代替的検出方法は、なかんずく、デンドリマーシグナル増幅、ハイブリダイゼーションシグナル増幅、および分子ビーコンによって提供される。
一態様では、全RNAでの逆転写が、High Capacity cDNA Archiveキット(Applied Biosystems(ABI)、カリフォルニア州フォスターシティ)を使って、製造者の提案するプロトコールに従って実行される(簡単に述べると、水50マイクロリットル中、2マイクログラムの全RNAを使用し、逆転写緩衝液、デオキシヌクレオチド三リン酸溶液、ランダムプライマー、およびMultiscribe逆転写酵素が入っている50μLの2×RT混合物と混合する)。RT反応条件は周知である。一例では、以下の熱サイクル条件を使ってRT反応が行われる:10分、25℃; 120分、37℃(Kidd M, et al.「The role of genetic markers-NAP1L1, MAGE-D2, and MTA1-in defining small-intestinal carcinoid neoplasia」Ann Surg Oncol 2006;13(2):253-62)。
個々の転写産物レベルを測定するために、一態様では、Assays-on-Demand(商標)製品をABI 7900 Sequence Detection Systemと共に、製造者の提案に従って使用する(Kidd M, Eick G, Shapiro MD, et al.「Microsatellite instability and gene mutations in transforming growth factor-beta type II receptor are absent in small bowel carcinoid tumors」Cancer 2005;103(2):229-36参照)。一例では、水7.2μL中のcDNA、0.8μLの20・Assays-on-Demandプライマーおよびプローブミックス、ならびに8μLの2×TaqMan Universal Masterミックスを384穴オプティカル反応プレート中、以下の条件下で混合することにより、TaqMan(登録商標)Universal PCR Master Mixプロトコールを使用し、標準条件下でサイクリングを行う:50℃、2分; 95℃; 10分; 95℃で15分、60°で1分を50サイクル(Kidd M, et al.「The role of genetic markers-NAP1L1, MAGE-D2, and MTA1-in defining small-intestinal carcinoid neoplasia」Ann Surg Oncol 2006;13(2);253-62)。
典型的には、リアルタイムPCRからの結果を、内部標準を使って、かつ/またはハウスキーピング遺伝子に関する発現レベルとの比較によって、標準化する。例えば、一態様では、上述のQPCRからの生ACT(デルタCT=増幅の関数としてのサイクルタイムの変化)データを、geNorm(Vandesompele J, De Preter K, Pattyn F, et al.「Accurate normalization of real-time quantitative RT-PCR data by geometric averaging of multiple internal control genes」Genome Biol 2002;3(7):RESEARCH0034参照)などの周知の方法を使って標準化する。ハウスキーピング遺伝子発現レベルによる標準化も周知である。Kidd M, et al.「GeneChip, geNorm, and gastrointestinal tumors: novel reference genes for real-time PCR」Physiol Genomics 2007;30(3):363-70を参照されたい。
マイクロアレイ解析では、選択された核酸分子が表面上に固定化されているものを使用する。プローブと呼ばれるこれらの核酸分子は、核酸発現産物にハイブリダイズすることができる。好ましい一態様では、標識された試料核酸にプローブを曝露し、ハイブリダイズさせ、洗浄し、プローブに相補的な試料中の核酸発現産物の(相対)量を決定する。マイクロアレイ解析により、多数の遺伝子の核酸発現レベルの同時決定が可能になる。本発明の方法では、本発明による遺伝子を少なくとも5種は同時に測定することが好ましい。
バックグラウンド補正は、例えばバックグラウンド差し引き後の負の強度値を避ける「オフセット」法に従って行うことができる。さらにまた、各単一アレイ上の2つのチャンネルを比較可能にするために、例えばグローバルloess標準化、およびアレイ間で中央絶対偏差(MAD)が同じになるようにlog比がスケーリングされることを保証するスケール標準化を使って、標準化を行うことができる。
タンパク質レベルは、例えば抗体ベースの結合アッセイを使って測定することができる。タンパク質の検出には、酵素標識、放射性標識または蛍光標識抗体を使用しうる。例示的アッセイには、酵素結合免疫吸着アッセイ(ELISA)、ラジオイムノアッセイ(RIA)、ウェスタンブロットアッセイおよび免疫組織学的染色アッセイがある。あるいは、複数のタンパク質の発現レベルを同時に決定するために、抗体アレイなどのタンパク質アレイを使用する。
典型的には、組織試料または流体試料などの生物学的試料、例えば全血、血漿、血清、糞便、尿、唾液、涙液、血清もしくは精液試料、またはそのような組織もしくは流体から調製された試料、例えば細胞調製物(血液、唾液、または組織、例えば腸粘膜、腫瘍組織、およびGEP-NEN転移または脱落した腫瘍細胞を含有するかつ/または含有すると疑われる組織、例えば肝臓、骨、および血液からの細胞の調製物を含む)中のバイオマーカーおよびハウスキーピングマーカーを検出する。一態様では、組織または流体、例えば粘膜、例えば腸粘膜、血液またはバフィーコート試料からの細胞懸濁液または流体の蛍光活性化細胞選別(FACS)によって、特定の細胞調製物が得られる。
いくつかの態様では、GEP-NEN患者、GEP-NENを有すると疑われる患者、がん一般を有する患者および/またはがん一般を有すると疑われる患者、1つまたは複数のGEP-NEN症状またはGEP-NEN症候群を呈する患者、またはGEP-NENのリスクがあると決定された患者、または処置を受けているか処置を完了したGEP-NEN患者(疾患が寛解状態にある、および/または寛解状態にあると考えられる患者を含む)から、試料を採取する。
別の態様では、GEP-NEN疾患を持たないヒト、例えば健常個体、または異なるタイプのがん、例えば腺癌、例えば消化管腺癌、または乳がん、前立腺がん、膵臓がん、胃がんもしくは肝がんのいずれか、例えば食道がん、膵臓がん、胆嚢がん、大腸がん、または直腸がんなどを有する個体から、試料を採取する。
いくつかの態様では、GEP-NEN腫瘍または転移から試料を採取する。別の態様では、試料をGEP-NEN患者から採取するが、GEP-NENまたはGEP-NEN細胞を含有するとは予想されない組織または流体から採取する。そのような試料は参照試料または正常試料として使用することができる。あるいは、GEP-NEN疾患を持たない患者からの組織もしくは流体または他の生物学的試料、例えば対応する組織、流体または他の試料、例えば正常血液試料、正常小腸(SI)粘膜試料、正常腸クロム親和性(EC)細胞調製物を、正常試料または参照試料とすることもできる。
いくつかの態様では、試料が全血試料である。神経内分泌腫瘍は、転移する時、典型的には血中に細胞を脱落させる。したがって、ここに提供するGEP-NENバイオマーカーのパネルの血漿試料および血液試料における検出は、例えばたとえ解剖学的局在検査が陰性であったとしても、早い時点におけるGEP-NENの同定、および腫瘍転移の存在の予測に使用しうる。したがって、ここに提供する作用物質および方法は、早期診断に有用である。
したがって、いくつかの態様において、本方法は、1mLまたは約1mLの全血においてGEP-NENの分子シグネチャまたは発現プロファイルを同定することができる。いくつかの局面において、分子シグネチャまたは発現プロファイルは、凍結前でも4時間までは安定である(例えば静脈切開後に試料を4〜8℃に冷蔵した場合)。一局面において、腫瘍組織から得た試料を使って所与のGEP-NEN関連アウトカムを診断し、予後判定し、または予測することができるアプローチであれば、同じ診断、予後判定、または予測を、血液試料を使って行うこともできる。
既存の検出および診断方法論のいくつかは、陽性疑い結果を得るまでに、7〜10日を要し、コストがかさむ場合がある。したがって一局面において、ここに提供する方法および組成物は、GEP-NEN診断に関連する簡単さを改良し、コストを低減するのに有用であり、早期診断を実施可能にする。
したがって一例では、例えば血清、血漿、バフィーコートから得られる細胞、例えば末梢血単核球(PBMC)、または全血試料などの血液試料における検出によって、循環中のバイオマーカーを検出する。
一部のがんでは、腫瘍特異的転写産物が、全血中に検出されている。Sieuwerts AM, et al.「Molecular characterization of circulating tumor cells in large quantities of contaminating leukocytes by a multiplex real-time PCR」Breast Cancer Res Treat 2009;118(3):455-68、およびMimori K, et al.「A large-scale study of MT1-MMP as a marker for isolated tumor cells in peripheral blood and bone in gastric cancer cases」Ann Surg Oncol 2008;15(10):2934-42参照。
CellSearch(商標)CTC Test(Veridex LLC)(Kahan L.「Medical devices; immunology and microbiology devices; classification of the immunomagnetic circulating cancer cell section and enumeration system. Final rule」Fed Regist 2004;69:26036-8に記載されている)では、Sieuwerts AM, Kraan J, Bolt-de Vries J, et al.「Molecular characterization of circulating tumor cells in large quantities of contaminating leukocytes by a multiplex real-time PCR」Breast Cancer Res Treat 2009;118(3):455-68に記載されているように、上皮細胞(CK-8/18/19)および白血球(CD45)を検出するEpCAM特異的抗体でコーティングされた磁気ビーズを使用する。この方法は、転移性の前立腺がん(Danila DC, Heller G, Gignac GA,et al.「Circulating tumor cell number and prognosis in progressive castration-resistant prostate cancer」Clin Cancer Res 2007;13(23):7053-8)、結腸直腸がん(Cohen SJ, Alpaugh RK, Gross S, et al. 「Isolation and characterization of circulating tumor cells in patients with metastatic colorectal cancer」Clin Colorectal Cancer 2006;6(2):125-32)、および乳がん(Cristofanilli M, Budd GT, Ellis MJ, et al「Circulating tumor cells, disease progression, and survival in metastatic breast cancer」N Engl J Med 2004;351(8):781-91)において、循環腫瘍細胞(CTC)を検出し、疾患進行および治療効力をモニタリングするために、使用されている。
この、そして他の、既存のアプローチは、可変的な発現を呈する場合がありかつ/またはサイトケラチンを発現することができないGEP-NEN細胞の検出には十分に満足できるものではなかった(Van Eeden S, et al.「Classification of low-grade neuroendocrine tumors of midgut and unknown origin」Hum Pathol 2002;33(11):1126-32; Cai YC, et al.「Cytokeratin 7 and 20 and thyroid transcription factor 1 can help distinguish pulmonary from gastrointestinal carcinoid and pancreatic endocrine tumors」Hum Pathol 2001;32(10):1087-93、および29のGEP-NEN試料のうちの2つでEpCAM転写産物発現を検出した本明細書に記載の研究を参照されたい)。
利用可能な循環腫瘍細胞検出方法において考慮すべき因子は、末梢血中の細胞数が、典型的には106個の末梢血単核球(PBMC)につき約1個と、比較的少ないこと(Ross AA, et al.「Detection and viability of tumor cells in peripheral blood stem cell collections from breast cancer patients using immunocytochemical and clonogenic assay techniques」Blood 1993;82(9):2605-10参照)、および白血球汚染の潜在的可能性(Sieuwerts AM, et al.「Molecular characterization of circulating tumor cells in large quantities of contaminating leukocytes by a multiplex real-time PCR」Breast Cancer Res Treat 2009;118(3):455-68; Mimori K, et al参照)、および利用可能なアプローチの技術的複雑さである。これらの因子ゆえに、利用可能な方法は臨床検査室における使用には十分に満足できないものになりうる。
いくつかの態様では、Kidd M, et al.「Isolation, Purification and Functional Characterization of the Mastomys EC cell」Am J Physiol 2006;291:G778-91; Modlin EVI, et al.「The functional characterization of normal and neoplastic human enterochromaffin cells」Clin Endocrinol Metab 2006;91(6):2340-8に記載されているように、アクリジンオレンジ(AO)染色およびアクリジンオレンジの取り込み後に、公知の方法を使って、神経内分泌細胞が不均一な状態へとFACS選別される。
いくつかの態様では、ここに提供する検出方法を使って、2〜3mL以下の血液中のGEP-NEN細胞および/またはバイオマーカーを検出し、単離し、または濃縮する。本方法は、標準的な検査室の装置を使って行われるので、臨床検査室環境での実施が容易である。一例において、リードアウトは12時間以内に1試料あたりおよそ20〜30の平均コストで得られる。
本発明は、ここに提供する作用物質および検出方法の診断的、予後判定的、および予測的使用、例えばGEP-NEN、関連アウトカム、および処置応答性を診断し、予後判定し、予測するための使用を提供する。例えば利用可能なGEP-NEN分類方法は限られているが、その理由の一部は、不正確な分類、および個々の病巣または腫瘍が異なるGEP-NENサブタイプまたはパターンへと発展し、かつ/または2つ以上のGEP-NENサブタイプを含有しうることである。公知の分類フレームワークは、例えば処置に対する応答を予測する能力、または臨床経過面および処置応答面では大きく異なりうる類似の病理組織学的特徴を持つ腫瘍同士を正確に区別する能力、そして処置応答性を予測する能力に限界がある。
したがって、分子または遺伝子に基づく分類スキームが必要とされている。ここに提供する方法およびシステムは、遺伝子に基づくGEP-NEN特異的予測モデルを含めて、これらの問題に対処するものであり、生物学的挙動を予測する分子パラメータの同定および分析、ならびにそのようなパラメータに基づく予測において使用することができる。
ここに提供する診断方法、予後判定方法、および予測方法には、GEP-NENバイオマーカーおよびハウスキーピング遺伝子などの他のマーカーの発現に関して検出された情報を分析するために、統計的解析および生物数学的アルゴリズムならびに予測モデルを使用するものが含まれる。いくつかの態様では、発現レベル、検出された結合または他の情報を、正常試料または標準における発現レベルなどの参照値と対比して、標準化し、評価する。ここに提供する態様には、例えば分類、ステージ分類、予後判定、処置計画、処置選択肢の評価、およびGEP-NEN疾患アウトカムの予測、例えば転移発生の予測において、GEP-NENバイオマーカーの発現に関して検出され測定された情報を使って、GEP-NENを分類および予測するための方法およびシステムが含まれる。
いくつかの態様において、本方法は、GEP-NEN診断、例えば早期疾患または転移の診断または検出を確立するために、疾患の程度を規定または予測するために、早期伝播または転移を同定するために、アウトカムまたは予後を予測するために、進行を予測するために、疾患活動性を分類するために、処置応答性をモニタリングするために、再発を検出またはモニタリングするために、および治療的早期介入を容易にするために、使用される。例えば、ここに提供する方法およびアルゴリズムには、分類、ステージ分類、予後判定、処置計画、処置選択肢の評価、およびGEP-NEN疾患アウトカムの予測、例えば転移発生の予測に使用するためのものが含まれる。
一態様において、本方法、アルゴリズムおよびモデルは、診断的サーベイランス、例えばルーチンサーベイランスおよび患者経過観察に役立つ。いくつかの態様において、本方法、アルゴリズムおよびモデルは早期診断を提供する。一局面において、本方法は、疾患の初期における検出、例えば血液1ミリリットルあたり3つまたはその前後というわずかな数の循環GEP-NEN細胞の検出を含む、小体積腫瘍検出能、および循環腫瘍細胞検出能を有する。いくつかの態様において、早期の疾患の証拠は、治療がより有効である時点での早期の治療的介入を可能にし、それが生存率および疾患アウトカムを改善しうる。
例えば一態様において、本方法は、例えば処置後の、例えば外科的介入または化学的介入後の、GEP-NENの再発および/または転移の早期検出に役立つ。いくつかの局面において、本法は、治療的介入後、週に1回または月に1回、例えばヒト血液試料で行われる。いくつかの局面において、本方法は、小さすぎてイメージング法などによる従来の手段では検出できない微小転移を検出する能力を有する。例えば一局面において、本方法は、肝臓などにおける、1センチメートル(cm)未満の転移、例えば1cm、0.9cm、0.8cm、0.7cm、0.6cm、0.5cm、0.4cm、0.3cm、0.2cm、もしくは0.1cmまたはその前後の転移を検出する能力を有する。
例えば、ここに提供する方法およびシステムには、対照または試料におけるGEP-NENの存在または非存在(または両方)を、56%〜92%の正答率で、例えば少なくともまたは少なくとも約65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の正答率で決定するものが含まれる。いくつかの例において、本方法は、少なくともまたは少なくとも約70%、7%5、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%の特異度または感度での診断に役立つ。
別の局面において、本方法は、処置後に、または早期疾患進行中に、イメージングおよび利用可能なバイオマーカーの検出などといった他の診断方法と比較して早い段階で、GEP-NENの再発、転移、または伝播を検出する能力を有する。いくつかの局面において、検出されたバイオマーカーの発現レベルおよび/または発現シグネチャは、疾患の進行、疾患の重症度または攻撃性、処置応答性の欠如、処置効力の低減、GEP-NEN関連イベント、リスク、予後判定、GEP-NENのタイプもしくはクラス、または疾患ステージと有意に相関する。
ここに提供する態様には、処置の開発、処置戦略、および処置モニタリング(処置に対する応答の評価、ならびに予想される腫瘍の自然歴および患者の全身的健康状態を考慮した、患者特異的な、すなわち個別化された処置戦略を含む)において、ここに提供するバイオマーカーおよびその検出を使用する方法が含まれる。
GEP-NEN管理戦略には、手術-根治(根治が達成されることはめったにない)またはがん細胞減量を目的とするもの、放射線医学的介入-例えば化学塞栓療法またはラジオ波焼灼療法によるもの、化学療法、凍結融解壊死治療、ならびに放出されたペプチドおよび神経アミンが引き起こす症状を管理するためのソマトスタチンおよびソマトスタチン類似体による処置(例えばSandostatin LAR(登録商標)(酢酸オクトレオチド注射))がある。インターフェロンおよびホルモン療法を含む生物学的製剤、およびソマトスタチンタグを付けた放射性ヌクレオチドは、現在開発中である。
一例において、Mazzaglia PJ. et al.「Laparoscopic radiofrequency ablation of neuroendocrine liver metastases: a 10-year experience evaluating predictors of survival」Surgery 2007;142(1):10-9に記載されているように、凍結融解壊死治療はGEP-NEN組織を遊離させて血中に進入させ、次にそれが症状を誘発する。化学療法剤、例えば全身性細胞毒性化学療法剤には、エトポシド、シスプラチン、5-フルオロウラシル、ストレプトゾトシン、ドキソルビシン、血管内皮成長因子阻害剤、受容体チロシンキナーゼ阻害剤(例えばスニチニブ、ソラフェニブ、およびバタラニブ)、および哺乳類ラパマイシン標的タンパク質(mTOR)阻害剤(例えばテムシロリムスおよびエベロリムス)、ならびにそれらの併用、例えば散在性および/または低分化/攻撃性疾患を処置するためのものなどがある。他の処置アプローチも周知である。
いくつかの態様では、例えば処置前および/または処置後に本方法を週に1回または月に1回行うことによって、本検出および診断方法を処置と合わせて使用する。いくつかの局面において、発現レベルおよび発現プロファイルは、疾患の進行、処置の無効性または有効性、および/または疾患の再発もしくはその欠如と相関する。いくつかの局面において、発現情報は異なる処置戦略が好ましいことを示す。したがって、本GEP-NENバイオマーカー検出方法を処置に先だって行い、次に、治療効果をモニタリングするためにGEP-NENバイオマーカー検出方法を使用する治療方法が、ここに提供される。
処置開始後または処置再開後のさまざまな時点におけるバイオマーカーの発現レベルまたは発現プロファイルの有意な変化(例えば処置前または処置後の他のいずれかの時点における発現または発現プロファイル、および/または正常試料もしくは参照試料における発現または発現プロファイルと比較した時の変化)は、治療戦略が奏功していること、または奏功していないこと、疾患が再発していること、または異なる治療アプローチを使用すべきであることを示す。いくつかの態様では、本検出方法の実施後に、例えば現在のアプローチに加えてまたは現在のアプローチの代わりに異なる治療的介入を加えることによって、現在のアプローチの積極性または頻度を増減することによって、または処置レジメンを中止または再開することによって、治療戦略を変更する。
もう一つの局面では、検出されたバイオマーカーの発現レベルまたは発現プロファイルにより、GEP-NEN疾患が初めて同定されるか、GEP-NEN疾患の初めての確定診断もしくは分類が得られる。この態様のいくつかの局面では、処置アプローチが、発現レベルもしくは発現プロファイル、および/または決定された分類に基づいて計画される。本方法には反復アプローチが含まれる。このアプローチでは、バイオマーカー検出方法の後に、治療的介入の開始または変更を行い、その後に継続的定期モニタリング、再評価、および治療アプローチの変更、停止、または新しい治療アプローチの付加を行うと共に、任意で継続的モニタリングを行う。
いくつかの局面において、本方法およびシステムは、アッセイ対象が処置に対して応答性であるかどうか、例えば臨床的に完全寛解状態にあるまたは安定疾患を呈すると類別される対象であるかどうかを決定する。いくつかの局面において、本方法およびシステムは、対象が未処置であるかどうか(または処置-I(treatment-I)、すなわちまだ処置を受けたことがないかどうか)、または非応答性であるかどうか(すなわち臨床的に「進行性」と類別されるかどうか)を決定する。例えば、処置応答性患者と処置非応答性患者とを識別する方法および安定疾患を有する患者または完全寛解状態にある患者と進行性疾患を有する患者とを識別する方法が提供される。さまざまな局面において、本方法およびシステムは、そのようなコールを、少なくとも65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、もしくは100%またはその前後の正答率(すなわち正確度)、特異度、または感度で行う。
いくつかの局面において、診断結果または予測結果もしくは予後判定結果に関する感度または正答率は、公知の診断方法または予後判定方法、例えば循環CgAまたは他の単一タンパク質の検出および測定などを使って得られるものよりも高い(例えば有意に高い)。
典型的には、多くの場合、初期段階における本診断方法、予後判定方法、および予測方法は、バイオマーカーのサブセットを、GEP-NENおよび/または異なるステージのGEP-NENを正確に予測および分類しうる分類器を構築するそれらの能力に基づいて選択する。
遺伝子発現の相違を評価するためのいくつかの周知の方法はどれでも、バイオマーカーのサブセットを選択するために使用することができる。例えば、正確な分類器は、トポグラフィックパターン認識に基づくプロトコール、例えばサポートベクターマシン(SVM)に基づきうる(Noble WS「What is a support vector machine?」Nat Biotechnol. 2006;24(12):1565-7)。機械学習に基づく技法は、高次元マルチモーダル生物医学データを解析するための洗練された自動および/またはオブジェクティブアルゴリズム(objective algorithm)を開発するのに、典型的に望ましい。いくつかの例では、教師つき学習アルゴリズムの一変法であるSVMを、ここに提供する方法およびシステムと共に使用する。SVMを使用して、星状細胞腫のグレード分けが>90の正確度で、また前立腺癌が74〜80%の正確度で予測されている(Glotsos D, Tohka J, Ravazoula P, Cavouras D, Nikiforidis G.「Automated diagnosis of brain tumours astrocytomas using probabilistic neural network clustering and support vector machines」Int J Neural Syst 2005;15(1-2):1-11 ; Glotsos D, Tohka J, Ravazoula P, Cavouras D, Nikiforidis G.「Automated diagnosis of brain tumours astrocytomas using probabilistic neural network clustering and support vector machines」Int J Neural Syst 2005;15(1-2):1-11)。
正確な分類器を構築するための他のアルゴリズムには、線形判別分析(LDA)、単純ベイズ(NB)、およびK最近傍(KNN)プロトコールがある。そのようなアプローチは、新生物コンディションの個々の変数または多変数の変化を同定するのに有用である(Drozdov I, Tsoka S, Ouzounis CA, Shah AM.「Genome-wide expression patterns in physiological cardiac hypertrophy」BMC Genomics. 2010;11:55; Freeman TC, Goldovsky L, Brosch M, et al.「Construction, visualization, and clustering of transcription networks from microarray expression data」PLoS Comput Biol 2007;3(10):2032-42; Zampetaki A, Kiechi S, Drozdov I, et al.「Plasma microRNA profiling reveals loss of endothelial miR-126 and other microRNAs in type 2 diabetes」Circ Res. 2010;107(6):810-7.Epub 2010 Jul 22; Dhawan M, Selvaraja S, Duan ZH.「Application of committee kNN classifiers for gene expression profile classification」Int J Bioinform Res Appl. 2010;6(4):344-52; Kawarazaki S, Taniguchi K, Shirahaia M, et al.「Conversion of a molecular classifier obtained by gene expression profiling into a classifier based on real-time PCR: a prognosis predictor for gliomas」BMC Med Genomics. 2010;3:52; Vandebriel RJ, Van Loveren H, Meredith C.「Altered cytokine(receptor)mRNA expression as a tool in immunotoxicology」Toxicology, 1998;130(1):43-67; Urgard E, Vooder T, Vosa U, et al.「Metagenes associated with survival in non-small cell lung cancer」Cancer Inform. 2011;10:175-83.Epub 2011 Jun 2; Pimentel M, Amichai M, Chuak, Braham L.「Validating a New Genomic Test for Irritable Bowel Syndrome」Gastroenterology 2011;140(Suppl 1):S-798; Lawlor G, Rosenberg L, Ahmed A, et al.「Increased Peripheral Blood GATA-3 Expression in Asymptomatic Patients With Active Ulcerative Colitis at Colonoscopy」Gastroenterology 2011, 140(Suppl 1))。
いくつかの態様において、GEP-NENおよび/またはGEP-NENの異なるステージに関する正確な分類器は、SVM、LDA、NB、およびKNNプロトコールの組み合わせに基づく。これをNETに関する多分析物リスク分類(Multi-Analyte-Algorithm Risk Classifier for NETs: MAARC-NET)と呼ぶ。
予測アルゴリズムおよび予測モデルを使用する方法では、統計的解析およびデータ圧縮法、例えば当技術分野において周知のものを使用する。例えば発現データを変換し(例えばIn変換し)、例えば統計的解析プログラム、例えばPartek(登録商標)Genomic Suite(「Partek」、Partek(登録商標)Genomics Suite(商標), ed. Revision 6.3、セント・ルイス、Partek Inc、2008)または類似のプログラムにインポートすることができる。データを圧縮し、比較のために分析する。
発現レベルのスコアまたは値の相違が有意とみなされるかどうかは、周知の統計的アプローチによって決定することができ、典型的には、特定の統計的パラメータに閾を指定すること、例えば閾p値(例えばp<0.05)、閾S値(例えば+0.4、S<-0.4またはS>0.4)、またはその値において相違が有意であるとみなされる他の値、例えば2つの異なるGEP-NENサブタイプ、腫瘍、ステージ、局在、攻撃性、もしくはGEP-NENの他の局面、または正常試料もしくは参照試料を代表する2つの異なる試料間で、バイオマーカーの発現がそれぞれ有意にダウンレギュレートまたはアップレギュレートされているとみなされる値などを指定することによって行われる。
一局面において、本アルゴリズム、予測モデル、および方法は、さまざまなGEP-NENサブタイプの基礎にある調節遺伝子クラスター(すなわち、SSTRオーム、プロリフェローム、シグナローム、メタボローム、セクレトーム、セクレトーム、プルローム、エピゲノム、およびアポプトーム)と関連する遺伝子から発現されるバイオマーカーに基づく。
一局面において、本方法は、具体的カットオフポイント、例えば正常試料とGEP-NEN試料、GEP-NENと他のがん、ならびにさまざまなサブタイプ同士、ステージ同士、および疾患または疾患アウトカムの他の局面同士を識別する所定の発現レベルスコアを同定する数学的な定式化、アルゴリズムまたはモデルを応用する。もう一つの局面では、予測、分類、予後判定、ならびに処置モニタリングおよび処置計画のために本方法が使用される。一局面において、予測態様は、生物学的挙動を予測する分子パラメータを同定するのに役立ち、それらのパラメータを使ったさまざまなGEP-NEN関連アウトカムの予測に役立つ。これらの態様の一局面では、高次元マルチモーダル生物医学データを解析するための洗練された自動オブジェクティブアルゴリズムを開発するために、機械学習アプローチが使用される。
本明細書にいう「ROC曲線」とは、二項分類器システムに関してその区別閾を変化させた時の偽陽性率(特異度)に対する真陽性率(感度)のプロットを指す。ROC曲線は、陽性中の真陽性の分率(TPR=真陽性率)を陰性中の偽陽性の分率(FPR=偽陽性率)に対してプロットすることによって等価に表すことができる。ROC曲線上の各点は特定の決定閾に対応する感度/特異度対を表す。
AUCはROC曲線下面積を表す。AUCは、1)GEP-NENバイオマーカーのサブセットまたはパネルおよび2)ROC曲線の診断正確度の総合的指標である。AUCは「台形公式」によって決定される。所与の曲線について、データポイントを直線分でつなぎ、横座標から各データポイントに垂線を引き、そうして構築された三角形および台形の面積の和を算出する。ここに提供する方法の一定の態様では、GEP-NENのサブセットまたはパネルが約0.75〜1.0の範囲のAUCを有する。これらの態様の一部では、AUCが約0.50〜0.85、0.85〜0.9、0.9〜0.95、または0.95〜1.0の範囲にある。
発現レベルスコアまたは他の値の比較のために、そしてGEP-NENバイオマーカー発現に基づいて発現プロファイル(発現シグネチャ)または調節シグネチャを同定するために、データを圧縮する。圧縮は典型的には主成分分析(PCA)または高次元データの構造を記述し視覚化するための類似の技法による。PCAにより、異なる試料間での、例えば正常試料または参照試料と検査試料との間での、および異なる腫瘍タイプ間での、GEP-NENバイオマーカー発現の視覚化および比較、ならびに発現プロファイル(発現シグネチャ、発現パターン)の決定および比較が可能になる。
いくつかの態様では、例えばリアルタイムPCRなどによって発現レベルデータを取得し、例えば主成分に縮約または圧縮する。
PCAを使って、データにおける分散の大部分、例えば分散の約50%、60%、70%、75%、80%、85%、90%、95%、または99%を説明または表現する相関のない主成分(PC)へと、データ(例えば測定された発現値)の次元を縮約する。
一例において、PCAは、分散の大半を、例えばデータ中の約75%、80%、85%、90%、またはそれ以上の分散を、集合的に表現する3つのPCを使用する3成分PCAである(Jolliffe IT,「Principle Component Analysis」Springer, 1986)。
PCAマッピング、例えば3成分PCAマッピングを使って、例えば第1(1st)PC、第2(2nd)PC、および第3(3rd)PCをそれぞれX軸、Y軸、およびZ軸に割り当てることによって、視覚化のためにデータを三次元空間にマッピングする。
PCAは、さまざまな試料におけるバイオマーカーの発現プロファイルを決定するために使用することができる。例えば、個々の試料タイプ(例えば各腫瘍タイプ、サブタイプもしくはグレード、または正常試料タイプ)に関する縮約された発現データをPCA座標システムにおいて局在し、局在されたデータを使って、個々の転写産物発現プロファイルまたは転写産物発現シグネチャを決定する。
一局面では、バイオマーカーのパネルに関してPCAによって決定される主成分ベクターが与えるその試料の個別の転写産物発現プロファイル(調節シグネチャ)に相当するまたはそれを表す重心(質量中心;平均発現)をプロットし、または規定することによって、各試料について発現プロファイルを決定する。
一般に、この座標システムにおいて比較的大きな距離で隔てられた2つの重心または局在点は、2つの比較的異なる転写産物プロファイルを表す。同様に、比較的近い重心は、比較的類似するプロファイルを表す。この表現において、重心間の距離は、異なる試料に関する類似性尺度と逆に等価(inversely equivalent)(距離が大きい=類似性が低い)であるので、重心間の大きな距離または大きな隔たりは、異なる転写産物発現シグネチャを有する試料を示すことになる。重心の近接は試料間の類似性を示す。例えば、異なるGEP-NEN腫瘍試料の重心間の相対距離は、それらの調節シグネチャまたは転写産物発現プロファイルの相対的類似性を表す。
一局面において、統計的解析および比較解析は、2つのバイオマーカーに関する発現レベルまたは値間の逆相関関係を決定する工程を含む。一例において、この相関関係および個々の発現ベクトル間の角度(角度が大きい=類似性が低い)の余弦は、関連遺伝子発現クラスターを同定するために使用される(Gabriel KR,「The biplot graphic display of matrices with application to principal component analysis」Biometrika 1971;58(3):453)。
いくつかの態様では、2種以上のバイオマーカーの発現レベル、および/またはGEP-NENの存在もしくは非存在、サブタイプ、ステージ、もしくは他のアウトカムの間に、線形相関関係がある。一局面では、ここに提供するGEP-NENバイオマーカーと生物学的試料の特徴との間、例えばバイオマーカー(およびその発現レベル)とさまざまなGEP-NENサブタイプ(例えば良性か活動性疾患か)との間には、発現依存的相関関係がある。
値のペア間の、例えば異なる生物学的試料(例えば腫瘍サブタイプ)に関するバイオマーカーの発現レベル間の、およびバイオマーカーのペア間の、線形関係(相関関係)の評価には、ピアソンの相関(PC)係数(R2)を使用することができる。この解析は、バイオマーカーの個々のペア(個々の類似性マトリックスのx軸およびy軸にプロットされるもの)についてPC係数を算出することによって発現パターンにおける分布を線形分離するために使用することができる。さまざまな線形相関度に関する閾、例えば(R>0.50または0.40)の高い線形相関に関する閾を、設定することができる。線形分類器をデータセットに適用することができる。一例において、相関係数は1.0である。
一態様において、調節クラスターは、例えばバイオマーカーのパネルのサブセットで構成される調節クラスターを同定するために、統計的解析を使って相関関係のネットワークを構築することによって決定される。一例では、PC相関係数が決定され、そのような相関関係のネットワークを構築するために使用される。一例において、ネットワークは、既定の閾を上回るRを有する転写産物ペア間のエッジ(edge)を描くことによって同定される。相関度は、再現性およびロバスト性に関する情報を与えることができる。
オブジェクティブアルゴリズム、予測モデル、およびトポグラフィック解析法、ならびに高次元マルチモーダル生物医学データ(例えばGEP-NENバイオマーカーパネルの発現を検出するためのここに提供する方法を使って得られるデータ)を解析するためにそれらを使用する方法も、ここに提供する。上述のように、本オブジェクティブアルゴリズム、モデル、および解析方法には、トポグラフィックパターン認識に基づくプロトコール、例えばサポートベクターマシン(SVM)(Noble WS.「What is a support vector machine?」Nat Biotechnol. 2006;24(12):1565-7)、線形判別分析(LDA)、単純ベイズ法(NB)、およびK最近傍法(KNN)プロトコール、ならびに他の教師つき学習アルゴリズムおよびモデル、例えば決定木、パーセプトロン、および正則化判別分析(RDA)、ならびに当技術分野において周知の類似するモデルおよびアルゴリズムに基づく数学的解析が含まれる(Gallant SI,「Perceptron-based learning algorithm」Perceptron-based learning algorithms 1990;1(2):179-91)。
いくつかの態様では、GEP-NENバイオマーカー発現データセットなどのデータセットから最も冗長な特徴を除去して、GEP-NENバイオマーカーの関連サブセットを生成するために、特徴選択(FS)が適用される。FSは、汎化能力を強化し、学習過程を加速し、モデルの解釈可能性を改良する。一局面では、ロバストな学習モデルのために最も妥当な特徴のサブセットを選択する「グリーディ・フォワード(greedy forward)」選択アプローチを使って、FSを使用する(Peng H, Long F, Ding C,「Feature selection based on mutual information: criteria of max-dependency, max-relevance, and min-redundancy」IEEE Transactions on Pattern Analysis and Machine Intelligence, 2005;27(8):1226-38)。
いくつかの態様では、nデータセット間のマージンを増加させることによるデータの分類にサポートベクターマシン(SVM)アルゴリズムを使用する(Cristianini N, Shawe-Taylor J.「An Introduction to Support Vector Machines and other kernel-based learning methods」Cambridge: Cambridge University Press, 2000)。
いくつかの態様において、予測モデルは、ある項目に関する知見をそのターゲット値に関する結論にマッピングする決定木を含む(Zhang H, Singer B.「Recursive Partitioning in the Health Sciences」(Statistics for Biology and Health)Springer, 1999)。決定木の葉は分類を表し、枝は個々の分類へと至る特徴の連結を表す。これは転移性乳がん(Yu L et al.「TGF-beta receptor-activated p38 MAP kinase mediates Smad-independent TGF-beta responses」Embo J 2002;21(14):3749-59)および大腸がん(Zhang H et al「Recursive partitioning for tumor classification with gene expression microarray data」Proc Natl Acad Sci U SA 2001 ;98(12):6730-5)の予後の予測に効果的(70〜90%)に使用され、星状細胞腫のグレード分けの予測に>90%の正確度で使用され(Glotsos D et al「Automated diagnosis of brain tumours astrocytomas using probabilistic neural network clustering and support vector machines」Int J Neural Syst 2005;15(1-2):1-11)、前立腺癌のグレード分けの予測に74〜80%の正確度で使用されている(Mattfeldt T et al.「Classification of prostatic carcinoma with artificial neural networks using comparative genomic hybridization and quantitative stereological data」Pathol Res Pract 2003;199(12):773-84)。この技法の有効性は10分割交差検証によって測られている(Pirooznia M et al「A comparative study of different machine learning methods on microarray gene expression data」BMC Genomics 2008;9 Suppl 1:S13)。
予測モデルおよびアルゴリズムは、フィードバックニューラルネットワークを形成し、インプット変数を二項分類器にマッピングする線形分類器パーセプトロンを、さらに含む(Gallant SI.「Perceptron-based learning algorithms」Perceptron-based learning algorithm 1990;1(2):179-91)。これは乳がんの悪性度の予測に使用されている(Markey MK et al.「Perceptron error surface analysis: a case study in breast cancer diagnosis」Comput Biol Med 2002;32(2);99-109)。このモデルにおいて、学習率は学習の速度を調節する定数である。学習率を下げると分類モデルは改良される一方、変数を処理するための時間は増加する(Markey MK et al.「Perceptron error surface analysis: a case study in breast cancer diagnosis」Comput Biol Med 2002;32(2):99-109)。一例では、0.05の学習率が使用される。一局面では、限局性腫瘍または原発腫瘍と、対応する転移性腫瘍とを識別するために、パーセプトロンアルゴリズムが使用される。一局面では、データをクラスへと明示的に分離する決定境界を生成するために、3回のデータスキャンが使用される。
予測モデルおよびアルゴリズムはさらに正則化判別分析(RDA)を含み、これは、線形判別分析および二次判別分析(LDA、QDA)を含む他のデータマイニング技法に代わるフレキシブルな代替として使用することができる(Lilien RH, Farid H, Donald BR.「Probabilistic disease classification of expression-dependent proteomic data from mass spectrometry of human serum」J Comput Biol 2003;10(6):925-46; Cappellen D, Luong-Nguyen NH, Bongiovanni S, et al.「Transcriptional program of mouse osteoclast differentiation governed by the macrophage colony-stimulating factor and the ligand for the receptor activator of NFkappa B」J Biol Chem 2002;277(24):21971-82)。RDAの正則化パラメータγおよびλを使って、LDAとQDAの間の中間分類器をデザインする。QDAは、γ=0およびλ^0の場合に行われ、LDAは、γ=0およびλ=1の場合に行われる(Picon A, Gold LI, Wang J, Cohen A, Friedman E.「A subset of metastatic human colon cancers expresses elevated levels of transforming growth factor beta 1」Cancer Epidemiol.Biolmakers Prev. 1998;7(6):497-504)。
過剰適合を減らすために、RDAのパラメータは、0.0001に不等としながら交差検証誤差を最小化するように選択され、こうしてRDAに、LDA、QDA、およびL2間の分類器を作出させる(Pima I, Aladjem M.「Regularized discriminant analysis for face recognition」, Pattern Recognition 2003;37(9):1945-48)。最後に、正則化それ自体は、機械学習における過剰適合を克服するために広く用いられている(Evgeniou T, Pontil M, Poggio T.「Regularization Networks and Support Vector Machines」Advances in Computational Math 2000;13(1):1-50.; Ji S, Ye J. Kernel「Uncorrelated and Regularized Discriminant Analysis: A Theoretical and Computational Study」IEEE Transactions on Knowledge and Data Engineering 2000;20(10):1311-21)。
一例において正則化パラメータはγ=0.002およびλ=0と規定される。一例では、クラスペアごとに、S値をすべての転写物に割り当て、次にそれらをS値が減少する順に並べる。RDAは、N番目の繰り返しが上位Nのスコアリング転写物からなるように、例えば21回行われる。誤差推定はRDA分類器の10分割交差検証により行われうる。これは、組織データセットを相補サブセットに区分化し、一方のサブセット(トレーニングセットと呼ばれる)に関して分析を行い、他方のサブセット(検証セットまたは試験セットと呼ばれる)に関する分析を検証することにより行われうる。
一例において、誤分類エラーは、全体の予測評価のばらつきを減らすように平均化され、これにより、ブートストラッピングおよび一個抜き交差検証を含む他のアプローチと比べて、誤差推定に対するさらに正確なアプローチが提供されうる(Kohavi R.「A study of cross-validation and bootstrap for accuracy estimation and model selection」Proceedings of the Fourteenth International Joint Conference on Artificial Intelligence, 1995;2(12):1137-43)。
一例において、例えば、遺伝子ごとの、およびクラスペアごとの、ランクスコア(S)を、以下のように計算することにより、組織分類のための選択が行われる:
式中、μ
C1およびμ
C2はそれぞれ第1クラスおよび第2クラスの平均を表し、σ
C1およびσ
C2はクラス間標準偏差である。大きいS値は各クラス内での大幅な差次的発現(「倍率変化」)および低い標準偏差(「転写物安定性」)を示す。S値が減少する順に遺伝子をソートして、正則化判別分析アルゴリズム(RDA)のためのインプットとして使用することができる。
アルゴリズムおよびモデルは、例えばモデルの予測能および分類能を検証するために、また特異度および感度を評価するために、評価し、検証し、交差検証することができる。一例では、放射基底関数がカーネルとして用いられ、分類の感度を測るために10分割交差検証が用いられる(Cristianini N, Shawe-Taylor J.「An Introduction to Support Vector Machines and other kernel-based learning methods」Cambridge: Cambridge University Press, 2000)。さまざまな分類モデルおよびアルゴリズムを、ここに提供する方法によって、例えば特定のアウトカムを予測するための予測モデルの性能を比較するために、ここに提供するトレーニングおよび交差検証を使って、比較することができる。
ここに提供する方法、システム、および予測モデルの態様には再現性があり、ダイナミックレンジが広く、データのわずかな変化を検出することができ、簡単な方法を使って、低いコストで、例えば臨床検査室における実施のために行われる。
本明細書に記載する診断的応用、予後判定的応用、予測的応用、および治療的応用において使用するために、キットおよび他の製造品が提供される。いくつかの態様において、キットは、バイアル、チューブ、プレートおよびウェルなどといった1つまたは複数の容器を収容するように区画化されたキャリア、パッケージまたは包装材料を含み、その中で、各容器は、ここに提供する方法において使用するための個別の要素の一つを含み、またいくつかの局面では、本明細書に記載する使用などの使用に関する説明が記されたラベルまたは添付文書をさらに含む。一例において、個々の容器は、ここに提供するGEP-NENバイオマーカーを検出するための個々の作用物質を含み、いくつかの例では、個々の容器が、ハウスキーピング遺伝子の検出および/または標準化のための作用物質を含む。
例えば、容器は、検出可能に標識されているか検出可能に標識することができるプローブまたはプライマーなどの作用物質を含むことができる。本方法が検出に核酸ハイブリダイゼーションを利用する場合、キットは、標的核酸配列を増幅するためのヌクレオチドが入っている容器も有しうる。キットは、酵素標識、蛍光標識または放射性同位体標識などのレポーター分子に結合されたレポーター、例えばアビジンまたはストレプトアビジンなどのビオチン結合タンパク質が入っている容器を含むこともでき、そのようなレポーターを例えば核酸または抗体と共に使用することができる。
キットは、典型的には、上述の容器と、それ(ら)に付随する1つまたは複数の他の容器であって、商業上の観点および使用者の観点から望ましい材料、例えば緩衝液、希釈剤、フィルタ、針、シリンジを含んでいるもの、内容物および/または使用説明が掲載されたキャリアラベル、パッケージラベル、容器ラベル、バイアルラベルおよび/またはチューブラベル、ならびに使用説明が記載された添付文書を含むであろう。
ラベルは、その組成物が特別な治療的応用または非治療的応用、例えば予後判定的、予防的、診断的応用もしくは検査室での応用に使用されることを示すために、容器上にまたは容器と共に提供され、インビボまたはインビトロでの使用に関する指示、例えば本明細書に記載するものを示すこともできる。指示および/または他の情報は、キットと同梱のまたはキット上の添付文書またはラベルに含めることもできる。ラベルは容器上にあっても、容器に添付されていてもよい。ラベルを形成する文字、数字または他の記号が容器そのものに成形されるかエッチングされる場合、ラベルは容器上にあるといえる。また、例えば添付文書のようにラベルが受器またはキャリア内にあって、その受器またはキャリアが容器も保持している場合、ラベルは容器に添付されているといえる。ラベルは、組成物が、GEP-NENなどのコンディションを診断、処置、予防、または予後判定するために使用されることを示しうる。
別の一態様では、アミノ酸配列、小分子、核酸配列および/または抗体などの組成物、例えばGEP-NENの診断、予後判定または治療に有用な材料を含有する製造品を提供する。本製造品は、典型的には、少なくとも1つの容器および少なくとも1つのラベルを含む。適切な容器には、例えば瓶、バイアル、シリンジ、および試験管がある。容器は、ガラス、金属またはプラスチックなどといったさまざまな材料で形成されていてよい。容器は、アミノ酸配列、小分子、核酸配列、細胞集団および/または抗体を保持することができる。一態様において、容器は、細胞のmRNA発現プロファイルの検討に使用するためのポリヌクレオチドを、その目的に使用される試薬類と一緒に保持する。別の一態様において、容器は、血液または細胞および組織などの生物学的試料におけるGEP-NENバイオマーカーのタンパク質発現の評価に使用するための、または関連する検査、予後判定、診断、予防、および治療目的に使用するための、抗体、その結合性フラグメント、または特異的結合タンパク質を含み、適応および/またはそのような使用に関する指示が、その容器上にまたはその容器と共に含まれていてもよく、また、それらの目的に使用される試薬類および他の組成物またはツールも同様である。
製造品はさらに、薬学的に許容される緩衝液、例えばリン酸緩衝食塩水、リンゲル液および/またはデキストロース溶液を含む第2の容器を含むことができる。製造品はさらに、他の緩衝液、希釈剤、フィルタ、スターラー、針、シリンジ、ならびに/または適応および/もしくは使用説明が記載された添付文書を含むことができる。
NETマーカーGENESIN Primary NETの差次的発現-Affymetrix Human Exon 1.0 STアレイを使った限局性小腸NETのエクソンレベルスクリーニングを行って、神経内分泌腫瘍組織における選択的スプライシングイベントを対照(正常腸粘膜)との比較で明らかにした。エクソン発現解析により、正常腸粘膜とNET腫瘍組織との間で、1287の差次的に発現する遺伝子が同定された。529の遺伝子がアップレギュレートされ、758の遺伝子がダウンレギュレートされていた。一例として、NETマーカー遺伝子のサブセット、特にCgA、Tph1、VMAT2、SCG5、およびPTPRN2に焦点を合わせた。正常試料(緑)および腫瘍試料(赤)におけるこのサブセット中のNETマーカー遺伝子のRMA標準化エクソン発現を図1に示す。これらの遺伝子のうち、Tph1は腫瘍中ですべてのエクソンが差次的に発現している唯一の遺伝子であり(FC>1.5、p<0.05)、一方、CgAは腫瘍試料と正常試料の間ですべてのエクソン発現が一定に保たれている唯一の遺伝子であった。
差次的に発現しているエクソンは、VMAT2では17中2つ、SCG5では9つ中8つ、同定された。PTPRN2では、30中6つのエクソンが差次的に発現していた。これらの結果は、新形成遺伝子発現と正常遺伝子発現との相違を最大化するには特異的プライマー/プローブセットが必要であることを明示している。
NETマーカー遺伝子における選択的スプライシングのRT-PCRによる検証-図2との関連において述べると、逆転写酵素ポリメラーゼ連鎖反応(RT-PCR)を使って、差次的エクソン転写産物レベルの知見を検証した。Tph11-2、VMAT29-10、SCG52-3、およびPTPRN212-13を含むマーカー遺伝子エクソンは、CgA4-5を除けばすべて、正常粘膜との対比で腫瘍試料では差次的に発現していることが確認された。
それぞれ図1および図2のゲノムデータおよびRT-PCRデータにより、NETでは差次的スプライシングが起こること、およびターゲット転写産物の発現の相違を効果的に捕捉するために、VMAT2などの候補バイオマーカーは、特異的プライマー/プローブセットの使用を必要とすることが明確になった。
血液における関連性を評価するために、末梢NET血液試料のマイクロアレイ解析を行った。アップレギュレートされた遺伝子(n=1,397)には、「RNAスプライシング(RNA splicing)」、「小胞媒介輸送(Vesicle-mediated transport)」、および「クロマチン修飾(Chromatin modification)」などのGO-Fatタームが含まれていた。このことは、NET病理生理学におけるこれらのプロセスの公知の役割と合致している。血液トランスクリプトームをGEP-NETトランスクリプトームと比較したところ、236のアップレギュレートされた遺伝子が同定され、そのうちの72を、バイオマーカーとしての有用性について調べた。予備的スクリーニングでは51の遺伝子が対照と比較して腫瘍血液試料においてアップレギュレートされていると同定された。42の遺伝子(83%)は複数のエクソンから転写されていた。最低でも2セットのプライマー/プローブを血中のこれらの遺伝子について検査することで、ターゲット増幅用に最も適切な組み合わせを規定した。ハウスキーピング遺伝子と、プライマー/プローブの対象となる51の検証済みターゲットおよびエクソンを、表2に示す。表2中の各GEN-NENバイオマーカーについて同定されたアンプリコンの位置は、表1において下線付きの配列として同定されている。
数学的に導出される(MAARC-NET)スコアリングシステムのための最小遺伝子セットの説明-四つの分類アルゴリズム(SVM、LDA、KNN、およびベイズ)ならびに10分割交差検証デザインを使って、血液におけるGEP-NETの同定のための分類器を構築した。Modlin I, Drozdov I, Kidd M「The Identification of gut neuroendocrine tumor disease by multiple synchronous transcript analysis in blood」Plos One 2013, e63364参照。これらの分類器をトレーニングセットで構築し、対照例と腫瘍例との間で有意にアップレギュレートされている特徴を、t検定によって計算した。図3との関連において述べると、表2に取り上げた51の遺伝子を調べることにより、少なくとも22の遺伝子を含めれば、正確な(>0.85)分類器を構築するのに十分であることが確かめられた。図3は、10分割交差検証の結果を使って得られた、GEP-NET試料中で有意にアップレギュレートされている遺伝子(p<0.05)の27個までの逐次的付加を使った各分類器アルゴリズムの予測正確度を示している。逐次的に付加された27の遺伝子を使ってGEP-NET血液試料を対照血液試料から識別するためのSVM、LDA、KNN、およびベイズアルゴリズムの平均正確度は同等であった-それぞれ0.89(0.85〜1.0)、0.89(0.86〜0.93)、0.88(0.85〜0.93)、および0.86(0.85〜0.93)。4つの分類器の「多数決」的組み合わせにより、0.88の正確度が達成された。正確な分類器を構築するのに十分な前記少なくとも22の遺伝子を使ってMAARC-NETスコアリングシステムを開発した。それら22の遺伝子を表3に取り上げる。
(表3)数学的に導出されるMAARC-NETスコアリングシステムに含まれる22の遺伝子
数学的に導出されるMAARC-NETスコアリングシステムの精密化-PCRに基づく個々の遺伝子発現をスコアに含める。Modlin I, Drozdov I, Kidd M, Plos One 2013参照。このスコアは「多数決」戦略に基づいており、試料を「正常」とコールして0のスコアを与えるか、「腫瘍」とコールして「1」とスコアリングする二項分類システムから開発された。スコアは0(4つがすべて「正常」とコール)から4(4つがすべて「腫瘍」とコール)までの範囲をとりうる。各「コール」は、4つの異なる学習アルゴリズム、すなわちサポートベクターマシン(SVM)、線形判別分析(LDA)、K最近傍法(KNN)、および単純ベイズ(Bayes)のうちの1つの二値結果(正常に対する「0」か腫瘍に対する「1」のどちらか)である。これら4つの学習アルゴリズムのそれぞれを、67の対照と63のGEP-NENを含む内部トレーニングセットでトレーニングした。このトレーニングセットでは、t検定を使って、差次的に発現する遺伝子(対照対GEP-NEN)を有意と同定した。このトレーニングセットに基づいて、学習アルゴリズムのそれぞれを、正常遺伝子発現と腫瘍遺伝子発現とを少なくともp<0.05の有意水準内で弁別するようにトレーニングした。多数決戦略に従い、「正常」コールが2つ未満の試料はGEP-NENと分類される。図4Aとの関連において述べると、試料の監査により、対照の85%はスコア「0」を呈することが確かめられた。「0」とスコアリングされた腫瘍はなかった。ROC分析では、正常試料(対照)対腫瘍に関して、2というスコアがカットオフであることが確かめられた(スコア>2)。このアプローチは、2つの独立セットにおけるGEP-NETの同定に関して、91〜97%の正答率を呈し、感度および特異度は85〜98%および93〜97%であった。Modlin I, Drozdov I, Kidd M, Plos One 2013参照。
これらのデータは、最初に130試料(対照はn=67、NETはn=63)の試験データセットから得られた。この試験セットは、処置済みの安定疾患(SD: n=35)および無処置の進行性疾患(PD: n=28)と臨床的に規定される2種類のNETを伴っている。分類アルゴリズムも、腫瘍コールを「処置済み」および「無処置」という2つのユニットに分離した。そこで、各特定試料に対して「正常」、「腫瘍(処置済み)」および「腫瘍(無処置)」という3つの可能なコールを表現するように、0〜4の二項分類を修正した。
修正された多数決戦略を生成するためにいくつかの規則を実装した。「正常」コールには0という値を割り当て、腫瘍「処置済み」コールには1という値を割り当て、腫瘍「無処置」コールには2という値を割り当てた。例えば、もし試料が4つの「正常」コールをもたらすなら、各コールに対して0という値が割り当てられるので、スコアは合計0になる。もし試料が4つの腫瘍「処置済み」コールをもたらすなら、コールには1という値が割り当てられ、よってスコアは合計4になる。試料が4つの腫瘍「無処置」コールをもたらすなら、それぞれに「2」が割り当てられ、よってスコアは合計8になる。したがってこの修正多数決戦略におけるスコアは0と8の間で変化する。
試験データセット(n=130)の検査を使って、この修正された多数決によるスコアが「処置」応答の尺度として役立ちうるかどうかを確立した。図4Aに示す公表された0〜4のスコアと同様に、NET患者の対部分は、図4Bに示すように、>2の修正多数決スコアを呈した。図4Cとの関連において述べると、多数決スコアと修正多数決スコアとは有意に関連した(R2=0.89、p<0.0001)。
図5Aとの関連において述べると、試験セット中のデータの解析により、修正された数学的に導出されるスコア(0〜8)は対照と比較して腫瘍では有意に上昇しており、SDと対比してPDでは最も高いことが確かめられた。
図5Bとの関連において述べると、対照対GEP-NET(SDとPDを合わせたもの)の受信者動作特性(ROC)曲線を作成した。ROC曲線は、予測因子にとって可能な感度と特異度の潜在的組み合わせのセットの一般化である。ROC曲線は、診断テストの可能な異なるカットポイントについて、真陽性率(感度)を偽陽性率(1-特異度)に対してプロットしたものである。図5Bは、試験セットおよび対照試料のコホートにおける感度値の分布と特異度値の分布との間の機能的関係のグラフ表現である。曲線下面積(AUC)は(1)修正された数学的に導出されるスコアおよび(2)受信者動作特性(ROC)曲線の診断正確度の総合的指標である。AUCは「台形公式」によって決定することができる。所与のROC曲線について、データポイントを直線分でつなぎ、横座標から各データポイントに垂線を引き、そうして構築された三角形および台形の面積の和を算出する。
図5BのROC曲線により、修正された数学的に導出されるスコアは、対照とGEP-NETとを弁別するために利用しうることが確かめられる-AUC>0.98およびp<0.0001;*対照に対してp<0.05;#SDに対してp<0.05(両側マン・ホイットニーU検定)を呈する。
次に、修正された数学的に導出されるスコアを、独立セット(SD: n=111、PD: n=48)で検討した。図6Aとの関連において述べると、この独立セットではスコアが有意に上昇しており、p<0.0001を呈した。図6Bとの関連において述べると、SD患者およびPD患者における修正された数学的に導出されるスコアの頻度分布プロットにより、PD試料の方が高いスコアを呈し、#SDに対してp<0.0001(両側マン・ホイットニーU検定)であることが確認された。
図7Aに関して述べると、修正された数学的に導出されるスコアを利用してSDをPDから弁別することができるかどうかを決定するために、第2のROC曲線を作成した。この試験セット(SD: n=35、PD: n=28)では、ROC分析により、このスコアを使ってPD腫瘍をSD腫瘍から0.93のAUCで弁別できることが確かめられた。>6.5のスコアカットオフ(すなわち≧7のスコア)は、PDの検出に関して85%の感度および83%の特異度を有した(尤度比:4.97)。
図7Bとの関連において述べると、独立セット(SDはn=111、PDはn=48)においてSDとPDとを弁別するための、修正された数学的に導出されるスコアリングシステムの有用性を評価した。正しくコールされたパーセンテージは、≧7のカットオフを使うと、70〜90%の範囲で変化した。SDの場合、≧7というカットオフを使うと、NETの89%は正しく予測され、一方、PDの67%は正しく予測された。性能マトリックスは感度=67%、特異度=89%、PPV=73%およびNPV=86%であった。したがってこのデータは、0〜8の範囲にわたる数学的に導出されるMAARC-NETスコアが、対照とGEP-NETとを区別することに関して有用性を有することを示している。
「NETEST1」へのスコアリングシステムの応用およびノモグラムの開発-対照とNETとの弁別に関して、≧3のカットオフは95%の感度および94%の特異度を有する。≧2のカットオフを使用すれば感度を98%に改良することができる。SDとPDとを弁別するには、≧7のカットオフを使用することができる(85%の感度および83%の特異度)。≧5のカットオフを使用すれば感度を96%に改良することができる。
したがって数学的に導出されるMAARC-NETスコアは、0〜2(対照); 2〜5(SD);および5〜8(PD)の範囲をとる。これらのスコアは表4に表示するようにパーセンテージに変換することができる。
図8との関連において述べると、表4のスコアパーセンテージは「NETest1」を表現するノモグラム内に表示することができる。NETest1ノモグラムは、修正された数学的に導出されるスコアが得られる様子、およびそれが患者をGEP-NENの異なるクラス(疾患なし、安定疾患、または進行性疾患)に類別する様子を明示している。
図9との関連において述べると、NETest1ノモグラムの有用性を評価した。図8のNETest1ノモグラムを使ったSDおよびPDの正しい予測に関する値を示す。総合すると、NETest1ノモグラムは、SD患者の80%を、低または中間疾患活動性を呈すると同定し、PD患者の84%を、高疾患活動性を呈すると同定した。
「NETEST2」へのスコアリングシステムの応用およびノモグラムの開発-安定疾患または進行性疾患であると臨床的に規定された患者(最善の臨床判断および/またはイメージングデータ)におけるMAARC-NETによるNETestスコア(0〜8)を調べた。試験セット(図10A)と独立セット(図10B)のどちらにおいても、サブタイプごとのスコアの分布頻度は、SD患者が4というNETest中央値を有し、PD患者は7〜8の範囲にあることを明示している。ただし、SD患者が>4のMAARC-NETによるスコアを有する場合も、PDが<7のスコアを呈する場合もある。
全患者群(試験セット+独立セット)を評価したところ、最も高頻度のSDスコアは4であり(30%-図11A)、一方、PDの46%は8のスコアを有すること(図11A)が明示された。リスク確率評価により、0〜5の範囲にあるNETestスコアは>90%の確かさでSDと関連していることが確かめられた(図11B)。8のスコアはほぼ間違いなくPDであった(>90%)。しかし、6および7のスコアではSDとPDとを正確に弁別することができなかった。
図11Aおよび図11Bでのこれらの結果に基づいて、リスク値を含むように図8のNETest1ノモグラムを改訂した。図12のNETest2aノモグラムは、NETestを含むと共に、スコアおよびリスク類別を含んでいる。
リスク評価NETest2aノモグラムを改訂するために、SD試料およびPD試料における個々の遺伝子発現を評価することができる。SD試料およびPD試料中で最も差次的に発現している遺伝子を同定し、それらを決定木に使って、あるNETestスコアがSDであるかPDであるかを規定するための規則を作成した。このアプローチがNETest2の基礎となる。
5というNETestスコアではSD試料が同定される見込みが>90%になる(図11〜12に示すとおり)。5とスコアリングされた患者間(SD対PD)で個々の51の遺伝子発現プロファイルを比較したところ、候補分別マーカーとしてSMARCD3およびTPH1の発現が同定された。
SMARCD3≦0.13かつTPH1<4であれば、PDとコールする
という規則を使用する。
これにより、進行性疾患の規定における100%の正確度が可能になった。
6というNETestスコアでは、SD試料をPD試料から弁別する見込みが約50%になる。遺伝子発現プロファイル分析により、VMAT1およびPHF21Aが候補として同定された。ROC分析により、PDをSDから弁別するためのそれぞれのAUCは、次のように規定された。
VMAT1:ROC=0.835
PHF21A:ROC=0.733
VMAT1≧0かつPHF21A<1.2であれば、SD
VMAT1≧0かつPHF21A≧1.2であれば、PD
という規則を使用する。
これにより、進行性疾患の規定における100%の正確度が、またSDの規定における90%の正確度が可能になった。総合正確度は93%であった。
7というNETestスコアでは、SD試料をPD試料から弁別する見込みが約50%になる。NETestが6である場合と同様に、遺伝子発現プロファイル分析により、VMAT1とPHF21Aとの両方が候補として同定された。ROC分析により、PDをSDから弁別するためのそれぞれのAUCは、次のように規定された。
VMAT1:ROC=0.835
PHF21A:ROC=0.733
VMAT1≧0かつPHF21A>1であれば、SD
VMAT1≧0かつPHF21A≦1であれば、PD
という規則を使用する。
これにより、進行性疾患の規定に関して100%の正確度が、またSDについては95%の正確度が可能になった。総合的正確度は97.5%であった。
8というNETestスコアでは、試料がPDと同定される見込みが≧90%になる。ZZZ3の発現が候補として同定された。ROC分析により、この遺伝子に関して、AUCは1.0であると規定された。
ZZZ3≦14であれば、PD
という規則を使用する。
これにより、進行性疾患の規定およびSDからの弁別に関して、100%の正確度が可能になった。
図13との関連において述べると、この個別遺伝子発現情報を使って、患者に関して正確な疾患類別プロファイルを与える「NETest2」ノモグラムを仕上げた。図13のNESTest2ノモグラムに使用したNETestスコアと個別遺伝子発現情報との組み合わせを、表5にさらに詳述する。
臨床上重要な遺伝子を規定する-スコアリングシステムをさらに精密化するために、遺伝子クラスター発現を調べ、情報を捕捉するためのアルゴリズムを開発した。個々の遺伝子クラスターには数学的に導出されるMAARC-NETスコアリングシステムを増強しうる生物学的情報が組み込まれている。焦点の一つは、文献によって精選された遺伝子クラスターに合わせることができ、それらを表6に記載する。
図14Aには、新形成の特徴が、腫瘍(腺癌)由来の特徴の描写を含めて図解されている。図14Bには、HanahanとWeinbergの分類に基づくNETの特徴が図解されている。
図14に挙げた9つのクラスターに関する値は遺伝子付加から導き出した。遺伝子クラスターに加えて、次に挙げる2つのアルゴリズムも評価した:
1)プロリフェローム、シグナローム、セクレトームII、プルロームおよびエピゲノムの和を含む「PDA」アルゴリズム(PDAアルゴリズムを進行性診断Iともいう);
2)疾患に関連する15の遺伝子の発現を含む「NDA」アルゴリズム:これらの遺伝子にはARAF1、BRAF、KRAS、RAF1、Ki67、NAP1L1、NOL3、GLT8D1、PLD3、PNMA2、VMAT2、TPH1、FZD7、MORF4L2およびZFHX3(NDAアルゴリズムを進行性診断IIともいう)。遺伝子を合計し、平均値を導いた。
血液試料において前記9つの遺伝子クラスターおよび2つのアルゴリズムの値を評価する前に、これらがNETに関連することを確認するために、NET腫瘍組織におけるそれらの発現を評価した。図15Bおよび図15Aでは、それぞれ、22のNETにおける発現を、正常粘膜(n=10)における発現と比較することができる。評価したところ、これらの9つのクラスターのうちの7つは(正常粘膜との比較で)NETに特異的であることが確かめられた。具体的には、シグナローム、メタボローム、セクレトーム(I)および(II)、エピゲノム、アポプトームおよびSSTRオームの発現が、NETにおいて上昇していた(p<0.05)。アポプトーム中の遺伝子はNETでは減少しており、一方、プロリフェロームはNETと正常粘膜との間で相違しなかった。これらのアルゴリズムに関して、図16は、PDAとNDAのそれぞれが、正常粘膜と比較してNET腫瘍組織では有意に増加していたこと(p<0.05)を示している。
その後、血液試料で各クラスターの発現を評価した。本発明者らは、試験セット(n=130)を調べ、それらがSDまたはPDに関係するかどうかを評価した。図17および表7に示すように対照とSD/PDとの間で遺伝子発現に有意差が認められた。
(表7)遺伝子クラスターと臨床アウトカム
ns=有意差なし
両側マン・ホイットニーU検定
これらのデータは、SDおよびPDを対照から弁別するために、またSDとPDとの間の相違を同定するために、遺伝子クラスターを使用できることを明示している。
図18では、遺伝子クラスター結果を独立セット(n=159)で検討し、SDとPDにおいて各クラスターを評価した。独立セットにおいて、プロリフェローム、セクレトーム(II)、プルロームおよびエピゲノムは有意に増加していた。
次に、PDAおよびNDAを、2つのデータセット(独立セットおよび試験セット)のそれぞれにおいて評価した。図19Aについて述べると、試験セットでは、2つのアルゴリズムのどちらについても、SDとPDとの間に有意差は同定されなかった。図19Bについて述べると、独立セットではPDAとNDAのそれぞれが上昇していた。
次に、各アルゴリズムを複合セット(試験+独立: n=222)に含め、SDとPDとを対比して予測する上でのそれらの有用性を評価した。図20Aについて述べると、複合セットでは、PDAとNDAはどちらも、SDと比較してPDにおいて上昇していた。図20Bについて述べると、ROC分析により、PDAおよびNDAに関して、表8に列挙する以下のパラメータが確かめられた。
(表8)ROC分析パラメータ、複合セットにおけるPDAおよびNDA
試験セット(TDA)および独立セット(IDA)における遺伝子クラスター発現の相違に基づく2つの追加アルゴリズムを評価した。TDAは、試験セットにおいてSDとPDの間で有意に異なる遺伝子クラスターの和を含んだ。
これらは、TDA:セクレトーム(I)、プルロームおよびSSTRオーム(TDAアルゴリズムを進行性診断IIIともいう)、ならびにIDA:プロリフェローム、セクレトーム(II)、プルロームおよびエピゲノム(IDAアルゴリズムを進行性診断IVともいう)を含んだ。
試験セットおよび独立セットにおいてアルゴリズムのそれぞれを評価した。図21Aとの関連において述べると、試験セットにおいて、TDAは、SDと比較してPDにおいて有意に上昇していた。図21Bとの関連において述べると、独立セットでは、TDAアルゴリズムとIDAアルゴリズムがどちらも有意に上昇していた。
次に、複合データセットにおいて両アルゴリズムでROC分析を行った。このROC分析により、TDAおよびIDAについて、表9に列挙する以下のパラメータが確かめられた。
(表9)ROC分析パラメータ、複合セットにおけるTDAおよびIDA
SDとPDとを弁別するためのTDAおよびIDAのアルゴリズム生成ROC曲線を図22Aに示す。SDとPDとを弁別するための各クラスターに関するアルゴリズム生成ROC曲線を図22Bに示す。図22Aおよび図22BのROC曲線は、SDとPDとの弁別に関してAUCが0.51(GFシグナローム)から0.72(プルローム)までの範囲にあることを明示している。
したがって、個々の遺伝子クラスター発現と、その情報を捕捉するアルゴリズムは、臨床観察と相関する生物学的に重要な情報を含有している。これらは臨床上重要なMAARC-NETスコアリングシステムを規定するための基礎になる。
NETEST遺伝子の臨床的有用性の実証-NETestスコアならびに関連する遺伝子クラスターおよびアルゴリズムからのスコアの臨床的有用性を以下に明らかにする。NETの外科的除去が循環遺伝子シグネチャをどのように変化させるかの調査を行うことで、この検査が外科的治療の完全性の尺度としての有用性を有する様子を明らかにした。
外科処置を受けた29人の患者における手術前のパラメータと手術の>1ヶ月後のパラメータとを調べた。図23Aに示すように、MAARC-NETスコアは、群として、6.58±1.48の平均から3.65±1.6の平均へと有意に減少した(p<0.0001)。NETのための既知の単一バイオマーカーアッセイにおいて使用される遺伝子クロモグラニンA(CgA)は、図23Bに示すように、有意には減少しなかった(58.5±137.9ng/ml対55.25±154.8)。
NETest1がどのように機能するかの検討、すなわち外科的治療前と外科的治療後のNETestスコアの変化を図24に含める。手術前は患者の62%が高疾患区分に含まれており、手術後はそれが0%であった(χ2=24、p=5×10-8)。
手術による疾患状況への影響の代替的評価は、外科的アプローチにおけるパーセンテージ変化によって与えられる-残存疾患の証拠なし(R0)と、転移を含む残存疾患の証拠。図25Aに関して述べると、MAARC-NETスコアのレベルは、R0群(完全な切除)では、R1/R2群(不完全切除)と比較して、有意に減少した(p<0.003)。
手術の役割をより明確にするために、4つのアルゴリズムのそれぞれを調べた。有意な減少がPDA(99.3±21対41.1±7.5、p<0.0001;図26A)、NDA(45.8±10.3対29.6±7.8、p<0.01;図26B)、TDA(133.3±32.3対43.8±9.3、p<0.0001;図26C)およびIDA(86.1±19.3対34.1±7.2、p<0.0001;図26D)に確かめられた(手術後)。
図27に関して述べると、個々のクラスターを調べたところ、手術前と手術後とで、SSTRオーム、プロリフェローム、GFシグナローム、メタボローム、セクレトームI/II、およびエピゲノムの有意な減少が確かめられた。
表10に関して述べると、腫瘍組織の外科的除去は、4つのアルゴリズムのうちのそれぞれおよび9つの遺伝子クラスターのうちの6つについて、SDに関するROCカットオフ値と相違しないか、それ未満のレベルへの循環遺伝子発現の減少を伴った。
(表10)外科的摘出、遺伝子クラスター、および各アルゴリズム間の関係
手術を受ける患者は、全員、進行性/活動性疾患を呈するとみなすことができる。手術後に、スコアまたはアルゴリズムは、使用したアルゴリズムに依存して29人の患者中、3〜7人(10〜24%)で、進行性疾患を示した。
外科手術は循環腫瘍シグネチャを有意に低減し、腫瘍除去の程度についても、残存活動性疾患の証拠についても、証拠を与えることができる。
このように、この検査の臨床的有用性は、スコア、アルゴリズムおよびクラスターの検討と、手術前血液と比較した評価とによって、明らかになる。手術後の試料における例えばPDAまたはプロリフェロームの発現上昇の証拠は、残存進行性(高活動性疾患)を示す。
図28に、手術に関連するアルゴリズムおよび遺伝子クラスターを含めたNETest3ノモグラムを図解する。組み合わせスコア、および遺伝子クラスターの変化、例えばプロリフェロームの有意な増加が、手術後の疾患再成長を示すであろう。注目すべきは、手術後イメージングではR0患者のうちのn=1(10%)に疾患が同定されたのに対し、1ヶ月の時点で6人(60%)において、遺伝子スコアの上昇が明白であったことである。その後、2人のR0患者が6ヶ月時点で陽性イメージングを発生した。
循環NETシグネチャに対する標準薬物療法の効果-標準的な薬学的NET治療法であるソマトスタチン(患者の>80%の処置に使用される)の効力を、循環NETシグネチャについて評価した。ソマトスタチン類似体による処置を受けた患者であって、イメージングおよび最善の臨床判断によってSD(n=63)またはPD(n=26)のどちらかとみなされた患者において、シグネチャを評価した。ソマトスタチン類似体の投与を受けていてSDである患者は安定処置患者であるとみなし、一方、ソマトスタチン類似体の投与を受けていてPDである患者は治療に失敗しているとみなした。
図29Aに関して述べると、SD群では治療に失敗している患者よりもMAARC-NETスコアが有意に低かった:3.33±0.21対5.77±0.3(p<0.001)。図29Bに関して述べると、クロモグラニンAは2つの群において有意には相違しなかった(44.7±17.2ng/ml対102.4±58.7)。
アルゴリズムを評価したところ、PDとの比較でSDでは、それらのそれぞれにおいて有意差が明示された。具体的には、PDA(62.8±11.4対153.9±36.2、p<0.002;図30A)、NDA(6±0.6対13.5±3、p<0.03;図30B)、TDA(56.8±7.4対154±37.2、p<0.02;図30C)およびIDA(51.7±11.1対140.5±36、p<0.0005;図30D)。
図31に関して述べると、個々のクラスターを検討したところ、SSTRオーム、プロリフェローム、セクレトームII、プルロームおよびエピゲノムは、PD群と比較してSD群では有意に低いことが確かめられた。
これらのデータは、ソマトスタチン類似体(SSA)療法を受けているにもかかわらず進行性疾患を呈する患者が、MAARC-NETスコアの増加を呈すると共に、4つのアルゴリズムならびに増殖およびエピゲノムの増加を含む特定遺伝子クラスターのそれぞれの増加を呈することを明示している。それゆえに、SSA処置が有効かどうかを評価するための機序の一つは、これらのパラメータに関するスコアが変化するかどうかを評価することである。しかし、SD群とPD群との間でこれらのパラメータのそれぞれにオーバーラップがあることを考えると、PD群をより良く規定することが役に立つであろう。これを行うために、治療に失敗している患者における循環シグネチャの発現を比較することができる。このアプローチの背後にある仮説は、有効な治療(すなわちSD)はシグネチャを標準化するだろうということである。必然的結果は、PDは正常とは有意に異なるであろうというものである。これを確証するために、ROC分析を使って正常循環転写産物を調べ、PDと比較した。4つのアルゴリズムのすべてと遺伝子クラスターとを調べた。
図32では、データの分析により、アルゴリズム(図32A)および選択されたクラスター(図32B)は、対照を、SSAで処置されたPDから弁別することが確かめられた。個々のクラスターに関するデータを表11に含める。
(表11)不全SSA治療および対照に関する遺伝子クラスターとアルゴリズムのそれぞれとの関係
表11のデータに基づいて、SD症例におけるNDAおよびTDA、ならびにSSTRオーム、プロリフェローム、およびセクレトーム(I)を調べて、これらのパラメータが治療効力の臨床評価と相関するかどうかを評価した。
個々のアルゴリズムまたは遺伝子クラスターを評価したところ、試料は、症例の33〜75%において、疾患を呈すると類別されることが確かめられた(図33A)。ベストオブスリー(best of 3)スコア(56%)と比較して、SSTRオームおよびプロリフェロームの上昇の組み合わせでは、進行性疾患を呈すると予測された症例数が最も少なかった(28%)(図33B)。したがって、図34を参照しながら述べるが、「NETest4」と名付けたソマトスタチン類似体処置患者に関するノモグラムには、MAARC-NETスコアならびにSSTRオーム、プロリフェロームおよびそれらの組み合わせを含める。
ソマトスタチン類似体効力の予測に関するNETESTおよび遺伝子発現の有用性-治療におけるNETestの有用性を評価するために、SSAと、臨床的に規定されたアウトカム(RECIST基準によるもの)との間の関係を評価した。28人の患者で、治療前に試料を収集すると共に、毎月1回、試料を収集した。治療前および治療中は、疾患ステージ分類および疾患パターンの類別を行うために、イメージングを利用することができた(12ヶ月経過観察まで)。この前向き(prospective)試料セットにおいて、SSAは、進行性疾患患者の数を有意に低減させた(図35A)。
早期の変化によってアウトカム、すなわち治療に対する応答が予測されるかどうかを評価するために、SSA処置前に収集した血液試料およびSSA処置中に毎月1回収集した血液試料でもスコアを決定した。
図35Bを参照して説明すると、治療中のどの時点で測定されたNETestスコアの上昇(活動性80〜100%)も、治療応答性を予測することが、結果から確かめられる。図36Aを参照して説明すると、NETestの有意な上昇(80〜100%)は、臨床的に有意な疾患(PD)が検出される48〜252日(平均105日)前に起こった。CgAの場合は平均時間が70日であった(範囲:0〜196日)。NETestの方が情報価値は高く、CgAより早い時点で(p=0.04)、CgAより多くの患者に現れた(100%に高活動性が確認された)(CgAでは、57%が>25%の上昇を呈した。p=0.016)。
図36Bを参照して説明すると、NETestの上昇(スコア80〜100%)は、14人の患者において、画像による同定が可能な疾患進行(241日)より有意に早い時点(94.5日)で起こった(*p<0.0001、カイ2=19)。CgAについて同様の分析を行ったところ、これは画像に基づく評価と相違しないことが確かめられた(図36B、185.5日対241日)。CgAの変化が起こるのはNETestより有意に遅かった(p=0.002、カイ2=13.6)。
疾患再発の予測に関するNETESTおよび遺伝子発現の有用性-NETESTの有用性。NETest疾患再発の有用性を評価するために、長期前向き研究において、NETestと臨床的に規定されたアウトカム(RECIST基準によるもの)との間の関係を評価した。34人の患者において、試料を治療前に収集すると共に、試料を最大5年の間隔で収集した。治療前および治療中は、疾患ステージ分類および疾患パターンの類別を行うために、イメージングを利用することができた(65ヶ月経過観察まで)。
この前向き試料セットでは、初期NETestスコアが、PD患者(中央値:75%、範囲53〜94%)ではSD患者(中央値:26%、範囲7〜94%; p=0.01)と比較して有意に上昇していた(図37A)。8人のSD患者が>40%のレベルを有した。そのうちの7人は、中央値で12.2ヶ月(範囲3.6〜57.7;図37B)で疾患再発を起こした。図37Cを参照して説明すると、初期SD患者のうちの7人(NETestスコアが低い者)は、再発疾患を生じなかった。中央経過観察時間は58ヶ月(範囲:32〜64)であった。
時間の経過と共に16の進行性疾患イベントが同定された。それぞれが、上昇したNETest(スコア>80%)と関連していた。図37Dを参照して説明すると、スコアが上昇していた患者に関して進行までの中央時間は13.4ヶ月(範囲:3.6〜57)であった。
総合すると、NETestが上昇していた24イベント中の23イベントが、中央値約13ヶ月で疾患再発の発生と関連した。一貫して低スコアであった7人中7人が無病(最大5年)であった。この検査の正確度は97%であった。
腫瘍増殖およびイメージングの代用尺度としてのNET遺伝子の有用性-組織病理学的パラメータおよびイメージングパラメータの代用マーカーとして機能するNETest遺伝子および遺伝子のクラスターの有用性を評価した。特に、Ki-67インデックス(腫瘍増殖のマーカー)と、ソマトスタチンに基づくイメージング、例えば68Ga-PETとに、焦点を当てた。これは、NETestおよびその要素が標準的臨床尺度の補助として臨床的有用性を有しうることを実証するために企てた。一例として、Ki-67測定は組織ベースであり、したがって侵襲性である。血液由来の相関を実証することにより、生検を必要としない腫瘍成長のリアルタイム尺度が提供されるであろう。
これらの解析を、2つの別個のデータセット、すなわちデータセット1(n=28)およびデータセット2(n=22)で行った。データセット1には、治療的介入、すなわちペプチド受容体放射性ヌクレオチド療法(PRRT)のために集められた患者が含まれた。データセット2には、安定疾患を呈し、定期的経過観察を受けている患者が含まれた。
Ki-67インデックスの代用物:多変量回帰分析では、二つの群のどちらにも、個々の遺伝子発現とKi-67インデックス(腫瘍増殖のマーカー)との間に何ら有意な相関関係は同定されなかった。図38Aおよび図38Bを参照して説明すると、ソマトスタチン受容体発現を調べたところ、各腫瘍群中のKi67との有意な相関関係(R=0.9、p=2×10-8)が確かめられた。
NETest中の全遺伝子を調べたところKi-67との有意に高い相関関係が確かめられた(R=0.93〜98、p=10-9〜10-13、図38C〜E)。最も情報価値の高い一つの遺伝子はSSTR4だった(図38D〜F)。これらのデータは、第1に、NETestが、全体として、腫瘍の増殖インデックスを決定するための液状生検として使用できること、すなわち組織に基づく組織病理学的測定に代わる代用マーカーになることを実証している。第2に、循環ソマトスタチン受容体遺伝子の発現も、腫瘍増殖の尺度として使用することができる。
プロリフェローム+SSTRオームアルゴリズムを進行性診断Vともいい、高関連性遺伝子(KRAS、SSTR4、およびVPS13C)アルゴリズムを進行性診断VIともいい、高関連性遺伝子+SSTRオームアルゴリズムを進行性診断VIIともいう。
図39には、遺伝子クラスター(SSTRオームおよびプロリフェローム)またはアルゴリズムのそれぞれとKi-67インデックスとの間の相関関係(線形回帰)を示す。個々の遺伝子クラスターを調べたところ、SSTRオームおよびプロリフェロームはKi-67インデックスと相関することが確認された(R=0.16〜0.25、p<0.05、図39A、図39C)。アルゴリズムの解析により、NDAアルゴリズムおよびTDAアルゴリズムはKi-67インデックスと高度に相関し(R=0.34〜0.42、p<0.002、図39B、図39F)、一方、PDAおよびIDAはそれほどよくは相関しない(R=0.14〜0.17、p=0.06、図39D、図39E)ことが確かめられた。これらの結果は、生物学的に関連する腫瘍情報を含む例えばSSTRオームなどの遺伝子クラスターおよびアルゴリズムを、腫瘍組織増殖の尺度として利用できることを明示している。
ソマトスタチンに基づくイメージングとの関連:次に、検査中の遺伝子がソマトスタチンに基づくイメージングから得られる2つの変量、すなわちSUVbmax(腫瘍取り込み量-受容体密度/ターゲット利用可能性の尺度)およびMTV(分子腫瘍体積-腫瘍量の尺度)と相関するかどうかを調べた。多変量回帰分析では、どの単一遺伝子も、SUVmaxと相関することは確かめられなかった。しかし、SSTRオームと、グループとしてのNETest遺伝子はどちらもSUVmaxとよく相関した。両グループにおける相関関係は、SSTRオーム(図40A〜B)についてはR=0.88〜0.94(p<10-7)、NET遺伝子セット(図40C〜D)についてはR=0.97〜0.98、p<10-13の範囲にあった。
多変量回帰分析により、グループ1ではMTVのマーカーとしてZFHX3が同定され(R=0.98、図41A)、一方、グループ2ではTPH1がMTVと相関した(R=0.76、図41B)。
SUVmaxと同様に、SSTRオームと、グループとしてのNETest遺伝子は、MTVとよく相関した。両グループにおける相関関係は、SSTRオーム(図41C〜E)についてはR=0.72〜0.77(p<10-4)、NET遺伝子セット(図41D〜F)についてはR=0.91-0.95、p<10-12の範囲にあった。
これらのデータは、NETest中の遺伝子がソマトスタチン類似体に基づく治療法のターゲット利用可能性と相関し、それらを見積もるために使用することができると共に、腫瘍量の尺度にもなることを明示している。治療を指揮すると共に、治療の効力を測定するには、これらの局面はどちらも極めて重要である。
疾患評価のためのマーカーとしてのZFHX3:図41Aに示すようにZFHX3がMTVの最善のマーカーであると同定されたことから、この遺伝子の発現は腫瘍量およびその変化の尺度として臨床的有用性を有しうることが示唆される。ZFHX3は、細胞周期停止の制御によるニューロン分化の調節に関与するジンクフィンガータンパク質である。それゆえに、ZFHX3発現の喪失と、それに続く細胞周期停止の喪失は、腫瘍増殖ならびに新しい病巣の発生および/または疾患の進行と関係する。
ZFHX3の測定値がNETにおける新しい成長/進行のマーカーを与えうるかどうか、そしてZFHX3の変化が治療に対する応答または治療不全(進行)を反映しうるかどうかを調べた。この遺伝子の発現を、まず、新しい病変の証拠がある患者において評価した。
図42Aを参照して説明すると、新しい病変(イメージングによって同定されるもの)を発生させていた患者が発現するZFHX3は、有意に減少していた。図42Bを参照して説明すると、SDと決定された患者も、進行性の患者より有意に高いレベルを有している。さらにまた、図42Cを参照して説明すると、この遺伝子の発現は、手術後に増加した。
図43を参照して説明すると、ある群における長期経過観察(>3年)により、安定なままの患者は、この期間に、ZFHX3発現の変化を示さなかったのに対し、進行性疾患を発生させた患者での発現レベルは有意に低かったことが確かめられた。
これらのデータは、ZFHX3発現が新しい病変の発生と相関すること、そして疾患進行を明確にするために発現の減少を使用できることを明示している。
治療効力の予測に関するNETESTおよび遺伝子発現の有用性-治療におけるNETestの有用性をさらに評価するために、PRRTと、臨床的に規定される(RECIST基準による)アウトカムとの間の関係を評価した。44人の患者において、試料を治療前にも、経過観察時にも収集した。治療前および治療後(3ヶ月および6ヶ月経過観察時)は、疾患ステージ分類および疾患パターンの類別を行うために、イメージングを利用することができた。
この前向き試料セットでは、放射線治療が、有意に、進行性疾患を伴う患者の数の減少をもたらした(図44A)。治療に応答しなかった患者、すなわち6ヶ月経過観察期間時点で進行性疾患と類別された患者は、NETestスコアの増加を呈した。このスコアは、この時点においてSDを伴う患者では有意に低減していた(図44B)。CgAについては有意な変化が認められなかった(図44C)。
NETestの変化は治療応答の変化と一致した(図45)。バイオマーカーとアウトカムに関するマトリックスにより、NETestは89%の正確度、感度75%、特異度100%、PPV100%およびNPV83%を有することが確かめられた(図46A)。図46Bを参照して説明すると、CgAは24%の正確度、感度17%、特異度40%、PPV40%およびNPV17%を有した。NETestはCgAより有意に優れていた(カイ二乗=27.4; p=1.2×10-7)。
処置前のNETestスコアおよびグレード分けが利用可能であったので、それらを使って、遺伝子発現と臨床パラメータの組み合わせがアウトカム、すなわち治療に対する応答を予測するかどうかを確かめた。
図47Aを参照して説明すると、治療前にレスポンダーとノンレスポンダーとの間でNETest遺伝子発現レベルのサブセットに有意差があった。これらには、増殖シグナリングに関係する遺伝子(GFシグナローム: ARAF1、BRAF、KRASおよびRAF1)ならびに代謝に関係する遺伝子(ATP6V1H、OAZ2、PANK2、PLD3)が含まれた。具体的に述べると、PRRTレスポンダーは、PRRT前に、有意に上昇した増殖因子シグナリング(9.4±1.3対5.3±0.7、p=0.05)および有意に上昇したメタボローム遺伝子発現(4.37対2.3±0.6、p=0.03)を呈した。これら2つの「クラスター」(GFシグナローム+メタボローム)を遺伝子発現の和によって「生物学的インデックス」に統合することにより、未来のPRRTレスポンダーをノンレスポンダーから予測することが可能になった。5.9(標準化された遺伝子発現)のカットオフは、応答の予測に関して>85%の特異度を呈し(>5.9でPRRTレスポンダーが予測され)、0.74±0.08のAUCをもたらした(z統計量=2.915、p=0.0036)(図47B)。
腫瘍グレードを除けば臨床パラメータはPRRT応答を予測するものではなかった。低グレード腫瘍は治療に対して応答し(77%)、一方、高グレード病変の約50%は応答と関連した。グレード分けだけでは65%しか正確でなかった(p=0.1)。対照的に、生物学的インデックス(「GFシグナローム」+「メタボローム」)と腫瘍グレードとの組み合わせを含む「予測指数」の方が有意に正確だった(92%)。予測指数は、処置応答の予測に関して組織学的グレード単独(AUC=0.66)より有意に良いAUC(0.90±0.07)(面積間の差0.23、z統計量2.25、p=0.024)を有した(図47C)。
予測指数は臨床的に有用であった。患者は、低グレード/高オーム群と高グレード/低オーム群に分離することができた。後者は、低グレード/高オーム群より有意に低いPFS(17ヶ月)を有した(PFSに到達せず、Logランク:26.8; p<0.0001:図47D)。ハザード比は53.3だった。
これらの結果は、スコアの変化が処置応答と相関すること、および治療前の循環NET転写産物測定値によってPRRTに対するアウトカムが予測されることを明示している。