JP2021506308A - 遺伝子発現プロファイルを使用して肺癌を診断するための組成物および方法 - Google Patents

遺伝子発現プロファイルを使用して肺癌を診断するための組成物および方法 Download PDF

Info

Publication number
JP2021506308A
JP2021506308A JP2020534292A JP2020534292A JP2021506308A JP 2021506308 A JP2021506308 A JP 2021506308A JP 2020534292 A JP2020534292 A JP 2020534292A JP 2020534292 A JP2020534292 A JP 2020534292A JP 2021506308 A JP2021506308 A JP 2021506308A
Authority
JP
Japan
Prior art keywords
gene
genes
expression
sample
polynucleotide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020534292A
Other languages
English (en)
Inventor
ショウエ,マイケル
ショウエ,ルイーズ・シー
コセンコフ,アンドリュー・ヴィー
Original Assignee
ザ・ウイスター・インステイテユート・オブ・アナトミー・アンド・バイオロジー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ザ・ウイスター・インステイテユート・オブ・アナトミー・アンド・バイオロジー filed Critical ザ・ウイスター・インステイテユート・オブ・アナトミー・アンド・バイオロジー
Publication of JP2021506308A publication Critical patent/JP2021506308A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57423Specifically defined cancers of lung
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Abstract

疾患に特徴的である対象の血液からの7個以上の選択された遺伝子、例えば、遺伝子発現プロファイルを使用することにより、哺乳動物対象において肺癌を診断するための方法および組成物が提供される。遺伝子発現プロファイルには、本明細書の表I、表II、表III、表IV、または表IXの7個以上の遺伝子が含まれる。

Description

連邦支援による研究または開発に関する声明
本発明は、National Institutes of Healthによって授与された助成金番号CA010815、およびPA Department of Healthによって授与された助成金番号4100059200(Diagnostic Markers for Early−stage Lung Cancer in PAX Gene Blood Samples)の下で、政府の支援により成された。政府は本発明において一定の権利を有する。
肺癌は、世界中で最もよく見られる、癌による死因である。米国において、肺癌は、男女ともに2番目に多い癌であり、年間174,000例を超える新規症例および162,000人を超える癌による死亡者を占める。実際に、肺癌は、毎年、乳癌、前立腺癌、および大腸癌の合計よりも多くの死亡者を構成する。
過去30年で改善がほとんどまたは全く見られない高い死亡率(5年で80〜85%)により、所属リンパ節にまたは肺を越えて転移する前の早期の診断を促進するための新しく効果的なツールの必要性が強調される。
高リスク集団には、喫煙者、元喫煙者、および遺伝性素因と関連付けられるマーカーを有する個人が含まれる。早期腫瘍の外科的除去が依然として最も効果的な肺癌治療であるため、低線量スパイラルCT(LDCT)による高リスク患者のスクリーニングに、大きな関心が寄せられている。この戦略により、高リスク個体の約30〜70%で非石灰化肺結節が特定されるが、最終的に肺癌と診断される結節の割合はわずか(0.4〜2.7%)である。これらの大量の結節が検出されると、過剰治療が生じ、医療システムに負担をかけることになる可能性が高い。現在、良性病因の肺結節を有する対象と悪性結節を有する対象とを区別する唯一の方法は、侵襲性生検、手術、またはスキャンを繰り返す長期間の観察である。最良の臨床アルゴリズムを使用しても、不確定肺結節に対する手術による肺生検を受けるために選択された患者の20〜55%は良性疾患であることが判明し、すぐに生検または切除を受けない患者については、連続的な画像検査を必要とする。この患者群における連続したCTの使用は、繰り返しのスキャンのコスト、微量ではない放射線量、および患者の不安とともに、可能性のある治癒可能な治療を遅らせるリスクを負う。
理想的には、診断試験は、簡単にアクセスでき、安価で、高い感度および特異性を示し、患者の転帰を(医学的にも経済的にも)改善するものである。その他、上皮細胞を利用する分類子の精度が高いことが示されている。しかしながら、これらの細胞を採取するには、侵襲性の気管支鏡検査が必要とされる。参照により本明細書に組み込まれる、Silvestri et al,N Engl J Med.2015 July 16;373(3):243−251を参照されたい。
痰、血液、または血清を使用する非侵襲性診断を開発し、腫瘍細胞、メチル化腫瘍DNA、単一ヌクレオチド多型(SNP)発現メッセンジャーRNAまたはタンパク質の産物について分析する取り組みが進められている。肺癌の早期診断に有用である可能性のあるこの幅広い分子検査は文献で考察されている。これらのアプローチにはそれぞれメリットがあるものの、高リスクグループであっても早期肺癌患者、または放射線学的および他の臨床的要因に基づく予備診断を有する患者を検出する取り組みにおいては、いずれも未だ調査段階を通過していない。定期的な来院に関連する日常検診である簡単な血液検査が、
理想的な診断検査であろう。
一態様では、哺乳動物対象における肺癌を診断または評価するための組成物またはキットは、少なくとも7個以上のポリヌクレオチドまたはオリゴヌクレオチドを含み、患者試料中の各ポリヌクレオチドまたはオリゴヌクレオチドは、異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズする。各遺伝子、遺伝子断片、遺伝子転写産物、または発現産物は、表I、表II、表III、表IV、または表IXの遺伝子から選択される。一実施形態では、少なくとも1つのポリヌクレオチドまたはオリゴヌクレオチドは、検出可能な標識に結合する。一実施形態では、組成物またはキットは、表I、表II、表III、表IV、または表IXの遺伝子の各々の遺伝子、遺伝子断片、遺伝子転写産物、または発現産物を検出するポリヌクレオチドまたはオリゴヌクレオチドを含む。一態様では、哺乳動物対象における肺癌を診断または評価するための組成物またはキットは、少なくとも8個以上のポリヌクレオチドまたはオリゴヌクレオチドを含み、各ポリヌクレオチドまたはオリゴヌクレオチドは、患者試料中の異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズする。一実施形態では、遺伝子は、表I、表II、表III、表IV、または表IXから選択される。一態様では、哺乳動物対象における肺癌を診断または評価するための組成物またはキットは、少なくとも15個以上のポリヌクレオチドまたはオリゴヌクレオチドを含み、各ポリヌクレオチドまたはオリゴヌクレオチドは、患者試料中の異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズする。一実施形態では、遺伝子は、表II、表III、表IV、または表IXから選択される。一態様では、哺乳動物対象における肺癌を診断または評価するための組成物またはキットは、少なくとも41個以上のポリヌクレオチドまたはオリゴヌクレオチドを含み、各ポリヌクレオチドまたはオリゴヌクレオチドは、患者試料中の異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズする。一実施形態では、表II、表III、表IV、または表IXから選択される。一態様では、哺乳動物対象における肺癌を診断または評価するための組成物またはキットは、少なくとも50個以上のポリヌクレオチドまたはオリゴヌクレオチドを含み、各ポリヌクレオチドまたはオリゴヌクレオチドは、患者試料中の異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズする。一実施形態では、遺伝子は、表II、表III、表IV、または表IXから選択される。
別の態様では、哺乳動物対象における肺癌を診断または評価するための組成物またはキットは、7個以上のリガンドを含み、各リガンドは、患者試料中の異なる遺伝子発現産物にハイブリダイズする。各遺伝子発現産物は、表I、表II、表III、表IV、または表IXの遺伝子から選択される。一実施形態では、少なくとも1つのリガンドは、検出可能な標識に結合する。一実施形態では、組成物またはキットは、表I、表II、表III、表IV、または表IXにおける遺伝子の各々の発現産物を検出するリガンドを含む。別の実施形態では、組成物またはキットは、少なくとも8個の遺伝子の発現産物を検出するリガンドを含む。別の実施形態では、組成物またはキットは、少なくとも15個の遺伝子の発現産物を検出するリガンドを含む。別の実施形態では、組成物またはキットは、少なくとも41個の遺伝子の発現産物を検出するリガンドを含む。別の実施形態では、組成物またはキットは、少なくとも50個の遺伝子の発現産物を検出するリガンドを含む。一実施形態では、遺伝子は、表II、表III、表IV、または表IXから選択される。
本明細書に記載の組成物は、対象の遺伝子発現プロファイルにおける遺伝子中の発現の、参照遺伝子発現プロファイルのものからの変化の検出を可能にする。様々な参照遺伝子発現プロファイルを以下で説明する。一実施形態では、組成物は、癌性腫瘍を非癌性結節から区別する能力を提供する。
別の態様では、哺乳動物対象における肺癌を診断または評価するための方法には、表I、表II、表III、表IV、または表IXの遺伝子から選択される、対象の試料中の3個以上の遺伝子の発現における変化を特定することと、対象の遺伝子発現レベルを参照または対照における同じ遺伝子のレベルと比較することとが伴い、該遺伝子発現の発現における変化は、肺癌の診断または評価と相関する。一実施形態では、該遺伝子発現の発現における変化により、癌性腫瘍を非癌性結節から区別できるようになる。
別の態様では、哺乳動物対象における肺癌を診断または評価するための方法には、対象の血液中の遺伝子発現プロファイルを特定することが伴い、この遺伝子発現プロファイルは、本明細書に記載される8個以上の情報提供性遺伝子の7個以上の遺伝子発現産物を含む。7個以上の情報提供性遺伝子が、表I、表II、表III、表IV、または表IXの遺伝子から選択される。一実施形態では、8個以上の情報提供性遺伝子が、表I、表II、表III、表IV、または表IXの遺伝子から選択される。一実施形態では、遺伝子発現プロファイルは、表II、表III、表IV、または表IXから選択される15個以上の遺伝子を含む。一実施形態では、遺伝子発現プロファイルは、表II、表III、表IV、または表IXから選択される41個の遺伝子を含む。対象の遺伝子発現プロファイルは、以下に記載の様々な供給源に由来する参照遺伝子発現プロファイルと比較される。情報提供性遺伝子の発現における変化は、肺癌の診断または評価と相関する。一実施形態では、該遺伝子発現の発現における変化により、癌性腫瘍を非癌性結節から区別できるようになる。
別の態様では、患者における肺癌を検出する方法が提供される。本方法は、患者から試料を得ることと、試料を、表I、表II、表III、表IV、または表IXの少なくとも8個の遺伝子の各異なる遺伝子転写産物または発現産物に特異的なオリゴヌクレオチド、ポリヌクレオチド、またはリガンドを含む組成物と接触させることによって、対照と比較して、患者試料中の表I、表II、表III、表IV、または表IXから選択される少なくとも7個の遺伝子における発現の変化を検出し、オリゴヌクレオチド、ポリヌクレオチド、またはリガンドと遺伝子産物または発現産物との間の結合を検出することと、を含む。
また別の態様では、対象における肺癌を診断する方法が提供される。本方法は、対象から血液試料を得ることと、試料を、表I、表II、表III、表IV、または表IXの少なくとも7個の遺伝子の各異なる遺伝子転写産物または発現産物に特異的なオリゴヌクレオチド、ポリヌクレオチド、またはリガンドを含む組成物と接触させることによって、対照と比較して、患者試料中の表I、表II、表III、表IV、または表IXから選択される少なくとも8個の遺伝子における発現の変化を検出し、オリゴヌクレオチド、ポリヌクレオチド、またはリガンドと、遺伝子産物または発現産物との間の結合を検出することと、対象の遺伝子の発現における参照の発現からの変化が検出されるときに、対照を癌と診断することと、を含む。
別の態様では、腫瘍成長を有する対象における肺癌を診断および治療する方法が提供される。本方法は、対象から血液試料を得ることと、血液RNAを抽出し、表I、表II、表III、表IV、または表IXの少なくとも7個の遺伝子の各異なる遺伝子転写産物または発現産物に特異的なオリゴヌクレオチド、ポリヌクレオチド、またはリガンドを含む組成物と接触させることによって、対照と比較して、患者RNA試料中の表I、表II、表III、表IV、または表IXから選択される少なくとも7個の遺伝子における発現の変化を検出し、オリゴヌクレオチド、ポリヌクレオチド、またはリガンドと、遺伝子産物または発現産物との間の結合を検出することと、対象の遺伝子の発現における参照の発現からの変化が検出されるときに、対照を癌と診断することと、腫瘍成長を除去することと、を含む。他の適当な治療も提供され得る。
これらの組成物および方法の他の態様および利点は、その好ましい実施形態の以下の詳細な説明においてさらに説明される。
SVM−RFEプロセスの異なる反復にわたるIllumina遺伝子発現の性能を示す代表的なグラフである。図1Aは、訓練セットの性能である。図1Bは、試験セットの性能である。 nLNCの分類精度を示す。図2Aは、SVM分類ですべての遺伝子を使用する、訓練セットおよび8〜20mm病変検証セットROC曲線である。図2Bは、RFEによって選択された上位100個の遺伝子を使用する訓練および検証セットの性能である。図2Cは、上位50個の遺伝子を使用する訓練および検証セットの性能である。図2Dは、上位15個の遺伝子を使用する訓練および検証セットの性能である。 試験設計を示す。本試験では、合計821個の固有の試料を分析した。Illumina HT12v4マイクロアレイおよびNanoString PCIパネルを使用して、全283個の試料を使用して候補バイオマーカープローブを選択した。マイクロアレイ上のバイオマーカー選択に264個の試料を使用し、264個のうちの201個+19個の新しい試料を使用して、PCIパネルからバイオマーカーを選択した。検証に使用した51個の試料は、いずれのバイオマーカー選択においても使用しなかった。マイクロアレイおよびPCIパネル分析から選択される559個のバイオマーカーを、NanoStringカスタムパネルのために設計することに成功した。新しいプラットフォームがマイクロアレイ結果を正常に再現することを保証するために、プローブ選択で使用される237個の試料と、以前にいずれのプラットフォームでもアッセイされなかった追加の346個の独立した試料とを用いて(合計583個)、カスタムパネルをアッセイした。583個の訓練試料を使用して、NanoString肺結節分類子(nPNC)を創出した。NanoStringプローブ選択に全く関与しなかった追加の158個の試料を、合計821個の独立した試料のためにNanostringカスタムプラットフォームに使用した(訓練用346個、検証用141個)。 NanoString肺結節分類子の分類性能を示す。図4A〜図4Dは、プローブの数を漸減させた、訓練および検証セット中のROC−AUCの比較である。図4Eは、41−プローブnPNCを使用した異なる分類得点についての個々の結節の悪性腫瘍の計算した確率である。 6〜20mmの範囲にあるBNおよびMNの41プローブnPNCの性能を示す。図5Aは、The Brock University、Mayo Clinic、およびVeteran’s Affairs(VA)の肺癌リスク臨床モデルに対する比較である。図5Bは、結節最大直径による分類に対する比較である。 異なる結節サイズ範囲にわたる分類性能を示す。性能値(左がROC−AUC、右が90%感度での特異性)が、訓練(上のパネル)、検証(中間)、および組み合わせたデータセット(下)について付与される。各列は図の左側に表示を付けてあり、下限結節サイズ範囲は最小(任意のサイズ)から10mmである。下のカラム表示は、10mm〜最大(任意のサイズ)の上限結節サイズ範囲に対応する。次いで、パネルの四角形の各々は、BNクラスおよびMNクラスの両方について比較される結節の数とともに、mm単位で下限から上限サイズまでの範囲に収まる良性結節と悪性結節とを区別する分類性能を示す。色の強度は、視覚的なアクセントのために使用され、報告された性能値に比例し、カラースケールはパネルの上部に示される。例えば、nPNCは、8〜10mmの結節(セットは6MNおよび14BNを含む)を区別する際に、0.87の最良のROC−AUC性能、および90%感度で0.64の特異性を示した。 肺結節分類子の性能を示す。A.SVM−RFEプロセスの異なる反復にわたるIlluminaマイクロアレイ訓練セットの性能。ボックスは、選択された最適な遺伝子数を強調するものである。B.試験セット性能。C.訓練セットと検証セットとの間の311個の遺伝子プローブの発現に基づくIllumina遺伝子発現分類子のROC−AUC性能の比較。D.訓練セットに対するNanoString PanCancer Immuneパネルからの遺伝子発現の10倍相互検証性能。AUC=ROC曲線下面積、ACC=精度、SE=感度、SP=特異性。 IlluminaおよびNanoString分類の比較を示す。図8Aでは、プロットは、IlluminaプラットフォームからSVMによって選択された遺伝子を10回使用して10倍の交差検証再サンプリングに基づいて、SVMモデルからの個々の試料分類スコアを示す。図8Bは、SVM−RFEによってIlluminaから選択される遺伝子を使用して、NanoStringおよびIlluminaの両方で実行した199個の試料を分類した結果生じるROC曲線である。 異なる数の遺伝子を使用して、訓練セット、試験セット、およびすべての試料セットに対するNanoString肺結節分類子の性能を示す。図9A.訓練セット:訓練セットにおける10倍の各回に行った再帰的特性除去である。フォールドを10回再サンプリングした。10回の再サンプリングからの得点の平均の性能を示す。X軸上に、フォールドあたりの残っている遺伝子の数が示される。図9B−検証セット。上位遺伝子を各反復時に全100個の遺伝子リストから選択し、それらの性能を訓練セット上で評価した。図9C−組み合わせセット。741個すべての試料が、プローブをランク付けするためにSVM−RFEによって使用された。 異なる数の遺伝子についてのROC曲線比較としてのナノストリングカスタムパネル性能のグラフを示す。
本明細書に記載の方法および組成物は、肺癌の検出および診断のための血液スクリーニングに遺伝子発現技術を応用する。本明細書に記載の組成物および方法により、哺乳動物、好ましくはヒト対象の血液の遺伝子の特徴的RNA発現プロファイルを決定することによって、癌性腫瘍を非癌性結節から区別できるようになる。特徴的な遺伝子発現プロファイルを、同じクラスの1つ以上の対象(例えば、肺癌または非癌性結節を有する患者)または対照のプロファイルと比較して、遺伝子発現プロファイルがどのクラスに最も類似しているかを確認し、有用な診断を提供する。
これらの肺癌スクリーニング方法は、前立腺癌の診断およびその進行の追跡を助けるために前立腺特異的抗原を使用するのとほぼ同様の方法で、追加の胸部X線PETもしくはCTスキャン、気管支鏡検査、または生検などのさらなる検査を行うように患者および医師に注意喚起し得る遺伝子発現プロファイリングを使用して、単純で費用効果の高い、非侵襲的な血液検査を実施するのに好適な組成物を用いる。これらのプロファイルを適用することで、疾患が悪性か非悪性かについての最初の試験から開始して、肺疾患の種類の重複診断および確認診断が得られる。
「患者」または「対象」は、本明細書で使用される場合、ヒト、獣医学的動物または農業用動物、家畜または愛玩動物、ならびに臨床研究に通常使用される動物を含む、哺乳動物を意味する。一実施形態では、これらの方法および組成物の対象は、ヒトである。
「対照」または「対照対象」は、本明細書で使用される場合、参照遺伝子発現プロファイルのソース、ならびに本明細書に記載される対照対象の特定のパネルを指す。一実施形態では、対照または参照レベルは、単一の対象に由来する。別の実施形態では、対照または参照レベルは、特定の特徴を共有する個体の集団に由来する。
さらに別の実施形態では、対照または参照レベルは、特定の対照個体または集団のレベルと相関する割り当てられた値であるが、必ずしも試験対象の試料をアッセイする時点で測定されるとは限らない。一実施形態では、対照対象または参照は、非癌性結節を有する患者(または集団)に由来する。別の実施形態では、対照対象または参照は、癌性腫瘍を有
する患者(または集団)に由来する。他の実施形態では、対照対象は、肺癌を有する対象または集団、例えば、悪性疾患を有する現行または元喫煙者である対象、固形肺腫瘍を、それを除去するための手術前に有する対象、固形肺腫瘍を、該腫瘍を外科的に除去した後に有する対象、固形肺腫瘍を、それに対する治療前に有する対象、および固形肺腫瘍を、それに対する治療中または治療後に有する対象であり得る。
他の実施形態では、本明細書に記載される組成物および方法の目的のための対照には、肺癌を有しない参照ヒト対象の以下のクラスの任意のものが含まれる。そのような非健康対照(NHC)には、非悪性疾患を有する喫煙者、非悪性疾患を有する元喫煙者(肺結節を有する患者を含む)、慢性閉塞性肺疾患(COPD)を有する非喫煙者、およびCOPDを有する元喫煙者が含まれる。また他の実施形態では、対照対象は、疾患を有しない健康な非喫煙者または疾患を有しない健康な喫煙者である。
「試料」は、本明細書で使用される場合、免疫細胞および/または癌細胞を含む任意の生体液または組織を意味する。本発明で使用するのに最も好適な試料としては、全血が挙げられる。他の有用な生体試料としては、末梢血単核細胞、血漿、唾液、尿、滑液、骨髄、脳脊髄液、膣粘液、頸管粘液、鼻汁、痰、精液、羊水、気管支鏡検査試料、気管支肺洗浄液、鼻擦過物、および癌を有する患者からの他の細胞滲出物が挙げられるが、これらに限定されない。そのような試料は、生理食塩水、緩衝液、または生理学的に許容される希釈剤でさらに希釈されてもよい。あるいは、そのような試料は、従来の手段によって濃縮される。
本明細書で使用される場合、「癌」という用語は、典型的には制御されていない細胞増殖を特徴とする、哺乳動物における生理学的状態を指すか、またはそれを説明する。より具体的には、本明細書で使用される場合、「癌」という用語は、任意の肺癌を意味する。一実施形態では、肺癌は非小細胞肺癌(NSCLC)である。より具体的な実施形態では、肺癌は肺腺癌(ACまたはLAC)である。別のより具体的な実施形態では、肺癌は肺扁平上皮癌(SCCまたはLSCC)である。別の実施形態では、肺癌はI期またはII期のNSCLCである。さらに別の実施形態では、肺癌は、早期および末期ならびに種類が混ざったNSCLCである。
「腫瘍」という用語は、本明細書で使用される場合、悪性であるか良性であるかにかかわらず、すべての腫瘍細胞成長および増殖、ならびにすべての前癌性および癌性の細胞および組織を指す。「結節」という用語は、悪性または良性であり得る組織の異常な蓄積を指す。「癌性腫瘍」という用語は、悪性腫瘍を指す。
「診断」または「評価」は、肺癌の診断、肺癌の段階の診断、肺癌の種類もしくは分類の診断、肺癌の再発の診断もしくは検出、肺癌の退行の診断もしくは検出、肺癌の予後、または外科的もしくは非外科的療法に対する肺癌の応答の評価を意味する。一実施形態では、「診断」または「評価」は、癌性腫瘍と良性肺結節とを区別することを指す。
本明細書で使用される場合、「感受性」(真陽性率とも呼ばれる)は、陽性と正しく識別される陽性の割合(例えば、病態を有すると正しく識別される病人の割合)を測定する。
本明細書で使用される場合、「特異性」(真陰性率とも呼ばれる)は、陰性と正しく識別される陰性の割合(例えば、病態を有しないと正しく識別される健常者の割合)を測定する。
「発現の変化」は、参照もしくは対照と比較した1つ以上の選択された遺伝子の上方調節、参照もしくは対照と比較した1つ以上の選択された遺伝子の下方調節、またはある特
定の上方調節された遺伝子と下方調節された遺伝子との組み合わせを意味する。
「治療試薬」または「レジメン」は、化学療法医薬品、生物学的応答修飾剤、放射線、食事、ビタミン療法、ホルモン療法、遺伝子療法、外科的切除などを非限定的に含む、固形腫瘍の有無にかかわらない癌の治療に用いられる任意の種類の治療を意味する。
本明細書で使用される場合、「情報提供性遺伝子」は、発現が肺癌の存在下で特徴として変化する(上方制御または下方制御のいずれかで)遺伝子を意味する。したがって、統計的に有意な数のそのような情報提供性遺伝子は、本方法および組成物における使用に好適な遺伝子発現プロファイルを形成する。そのような遺伝子は、以下の表I、表II、表III、表IV、および表IXに示される。そのような遺伝子が「発現プロファイル」を構成する。
本発明の文脈における「統計的に有意な数の遺伝子」という用語は、観察される遺伝子発現の変化の程度に応じて異なる。遺伝子発現の変化の程度は、癌の種類、および癌または固形腫瘍のサイズまたは広がりによって異なる。変化の程度も個体の免疫応答によって異なり、個体ごとの検証に供される。例えば、本発明の一実施形態では、少数の遺伝子、例えば、約5〜8個の遺伝子における大きな変化、例えば、2〜3倍の増減は、統計的に有意である。別の実施形態において、約15個以上の遺伝子におけるより小さな相対的変化は、統計的に有意である。
したがって、本明細書に記載の方法および組成物は、単一のプロファイルにおける5〜約50個の遺伝子の範囲の「統計的に有意な数の遺伝子」の発現プロファイルの検討を企図する。一実施形態では、遺伝子は表Iから選択される。別の実施形態では、遺伝子は表IIから選択される。別の実施形態では、遺伝子は表IIIから選択される。一実施形態では、遺伝子プロファイルは、統計的に有意な数の5個以上の遺伝子によって形成される。一実施形態では、遺伝子プロファイルは、統計的に有意な数の7個以上の遺伝子によって形成される。一実施形態では、遺伝子プロファイルは、統計的に有意な数の8個以上の遺伝子によって形成される。一実施形態では、遺伝子プロファイルは、統計的に有意な数の10個以上の遺伝子によって形成される。別の実施形態では、遺伝子プロファイルは、統計的に有意な数の15個以上の遺伝子によって形成される。別の実施形態では、遺伝子プロファイルは、統計的に有意な数の20個以上の遺伝子によって形成される。別の実施形態では、遺伝子プロファイルは、統計的に有意な数の25個以上の遺伝子によって形成される。別の実施形態では、遺伝子プロファイルは、統計的に有意な数の30個以上の遺伝子によって形成される。別の実施形態では、遺伝子プロファイルは、統計的に有意な数の35個以上の遺伝子によって形成される。別の実施形態では、遺伝子プロファイルは、統計的に有意な数の40個以上の遺伝子によって形成される。別の実施形態では、遺伝子プロファイルは、統計的に有意な数の41個以上の遺伝子によって形成される。別の実施形態では、遺伝子プロファイルは、統計的に有意な数の45個以上の遺伝子によって形成される。別の実施形態では、遺伝子プロファイルは、統計的に有意な数の50個以上の遺伝子によって形成される。別の実施形態では、遺伝子プロファイルは、表Iの1、2、3、4、5、6、7、または8個の遺伝子によって形成される。別の実施形態では、遺伝子プロファイルは、表IIの1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50個の遺伝子によって形成される。別の実施形態では、遺伝子プロファイルは、表IIIの1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45
、46、47、48、49、または50個の遺伝子によって形成される。別の実施形態では、遺伝子プロファイルは、表IVの1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、または100個によって形成される。別の実施形態では、遺伝子プロファイルは、表IXの1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、または41個の遺伝子によって形成される。
以下の表I、表II、表III、表IV、および表IXは、肺癌、例えばNSCLCを有する対象と、良性(非悪性)肺結節を有する対象とを識別するのに有用な既知の遺伝子のコレクションに言及する。表I、表II、表III、表IV、および表IXで特定される遺伝子の配列は、公開されている。当業者であれば、遺伝子の配列を使用することによって、本明細書に記載の組成物及および方法を容易に再現することができ、これらのすべては、GenBankなどの従来のソースから公開されている。各遺伝子のGenBank受託番号が提供される。
「マイクロアレイ」という用語は、基質上のハイブリダイズ可能なアレイ要素、好ましくはポリヌクレオチドまたはオリゴヌクレオチドプローブの秩序配列を指す。
「ポリヌクレオチド」という用語は、単数形または複数形で使用される場合、概して、非修飾RNAもしくはDNAまたは修飾RNAまたはDNAであり得る任意のポリリリボヌクレオチドまたはポリデオキシリボヌクレオチドを指す。このため、例えば、本明細書で定義されるポリヌクレオチドには、一本鎖および二本鎖DNA、一本鎖および二本鎖領域を含むDNA、一本鎖および二本鎖RNA、ならびに一本鎖および二本鎖領域を含むRNA、一本鎖もしくはより典型的には二本鎖であってもよい、または一本鎖および二本鎖領域を含む、DNAおよびRNAを含むハイブリッド分子が含まれるが、これらに限定されない。加えて、本明細書で使用される「ポリヌクレオチド」という用語は、RNAもしくはDNAまたはRNAとDNAとの両方を含む三本鎖領域を指す。かかる領域における鎖は、同じ分子に由来しても異なる分子に由来してもよい。領域は、分子のうちの1つ以上のすべてを含み得るが、より典型的には、いくつかの分子のうち1つの領域のみを伴い得る。三重らせん領域の分子のうちの1つは、オリゴヌクレオチドであることが多い。「ポリヌクレオチド」という用語は、cDNAを具体的に含む。本用語には、1つ以上の修飾された塩基を含むDNA(cDNAを含む)およびRNAが含まれる。このため、安定性または他の理由により骨格が修飾されたDNAまたはRNAは、その用語が本明細書で意図されるように、「ポリヌクレオチド」である。さらに、イノシンなどの独特な塩基またはトリチウム塩基などの修飾された塩基を含むDNAおよびRNAが、本明細書で定義される「ポリヌクレオチド」という用語に含まれる。概して、「ポリヌクレオチド」という用語は、非修飾ポリヌクレオチドのすべての化学的、酵素的および/または代謝的修飾形態、ならびに単純細胞および複雑細胞を含むウイルスおよび細胞に特有のDNAおよびRNAの化学形態を包含する。
「オリゴヌクレオチド」という用語は、限定するものではないが、一本鎖デオキシリボヌクレオチド、一本鎖または二本鎖リボヌクレオチド、RNA:DNAハイブリッド、および二本鎖DNAを含む、比較的短いポリヌクレオチドを指す。一本鎖DNAプローブオ
リゴヌクレオチドなどのオリゴヌクレオチドは、多くの場合、例えば、市販されている自動オリゴヌクレオチド合成器を使用して、化学的方法によって合成される。
しかしながら、オリゴヌクレオチドは、インビトロ組換えDNA媒介技術を含む様々な他の方法、ならびに細胞および生物におけるDNAの発現によって作製され得る。
互換的に使用される用語「差異的に発現された遺伝子」、「差異的な遺伝子発現」、およびそれらの同義語は、疾患、具体的には肺癌などの癌に罹患している対象における発現が、良性結節を有する対象などの対照対象における発現と比べて、より高いまたはより低いレベルに活性化される遺伝子を指す。これらの用語には、同じ疾患の異なる段階で発現がより高いまたはより低いレベルに活性化される遺伝子も含まれる。差異的に発現された遺伝子は、核酸レベルまたはタンパク質レベルで活性化または阻害されてもよく、あるいは異なるポリペプチド産物をもたらすために代替的スプライシングに供されてもよい。そのような違いは、例えば、ポリペプチドのmRNAレベル、表面発現、分泌、または他の分割における変化によって証明され得る。差異的な遺伝子発現は、2つ以上の遺伝子もしくはその遺伝子産物間の発現の比較、または2つ以上の遺伝子もしくはその遺伝子産物間の発現の比率の比較、またはさらには通常の対象、疾患、具体的には癌に罹患している非健康対照および対象、または同じ疾患の様々な段階の間で異なる、同じ遺伝子で異なる処理をされた2つの遺伝子産物の比較を含んでもよい。差異的な発現には、例えば、正常細胞および罹患細胞間、または異なる疾患事象または病期を受けた細胞間の、遺伝子またはその発現産物における時間的または細胞発現パターンにおける量的差異と質的差異との両方が含まれる。本発明の目的では、対象試料と対照試料との間に統計学的に有意な(p<0.05)遺伝子発現の差がある場合、「差異的な遺伝子発現」が存在すると見なされる。
RNA転写産物に関する「過剰発現」という用語は、標本または特定の参照mRNAセット内のすべての測定された転写産物であり得る、参照mRNAのレベルへの正規化によって決定される転写産物のレベルを指すために使用される。
「遺伝子増幅」という語句は、遺伝子または遺伝子断片の複数のコピーが特定の細胞または細胞株内に形成されるプロセスを指す。重複領域(増幅DNAのストレッチ)は、多くの場合、「アンプリコン」と称される。通常、産生されるメッセンジャーRNA(mRNA)の量、すなわち、遺伝子発現のレベルは、発現される特定の遺伝子から作製されるコピー数の割合において増加する。
本明細書に記載の組成物および方法との関連で、表I、表II、表III、表IV、または表IXに列挙される遺伝子の「7個以上」、「少なくとも7個」などへの言及は、列挙される遺伝子のいずれか1つまたはありとあらゆる組み合わせを意味する。例えば、好適な遺伝子発現プロファイルには、表IIからの少なくとも7個〜50個の間のいずれかの数の遺伝子を含むプロファイルが含まれる。別の例では、好適な遺伝子発現プロファイルには、表IIIからの少なくとも8個〜50個の間のいずれかの数の遺伝子を含むプロファイルが含まれる。例えば、好適な遺伝子発現プロファイルには、表IVからの少なくとも7個〜100個の間のいずれかの数の遺伝子を含むプロファイルが含まれる。例えば、好適な遺伝子発現プロファイルには、表IXからの少なくとも7個〜41個の間のいずれかの数の遺伝子を含むプロファイルが含まれる。一実施形態では、表から選択される遺伝子によって形成される遺伝子プロファイルは、順位順に使用され、例えば、リストの上位にランク付けされた遺伝子は、試験においてより有意な差別的結果を示し、したがって、より低い順位の遺伝子よりもプロファイルにおいて有意であり得る。しかしながら、他の実施形態では、有用な遺伝子プロファイルを形成する遺伝子は、順位順である必要はなく、表からのいずれの遺伝子であってもよい。「表I、表II、表III、表IV、または表IX」を参照する場合、それらを組み合わせて、本明細書で有用な分類子を提供し得
ることも企図される。
本明細書で使用される場合、「標識」または「レポーター分子」は、核酸(単一ヌクレオチドを含む)、ポリヌクレオチド、オリゴヌクレオチド、またはタンパク質リガンド、例えば、アミノ酸または抗体の標識に有用な化学的または生化学的部分である。「標識」および「レポーター分子」には、蛍光剤、化学発光剤、発色剤、クエンチ剤、放射性ヌクレオチド、酵素、基質、補因子、阻害剤、磁性粒子、および当該技術分野で既知の他の部分が含まれる。「標識」または「レポーター分子」は、測定可能なシグナルを生成することができ、オリゴヌクレオチドまたはヌクレオチド(例えば、非天然ヌクレオチド)またはリガンドに共有的または非共有的に接合または結合し得る。
本明細書で別途定義されない限り、本明細書で使用される技術用語および科学用語は、本発明が属する分野の当業者により、ならびに本出願に使用される用語の多くに対する一般的な指導を提供する刊行されている教書の参照により一般に理解されるのと同じ意味を有する。
I.遺伝子発現プロファイル
肺癌患者の全血の遺伝子発現プロファイルは、非癌性肺結節を有する患者において見られるものと有意に異なることが示された。例えば、表I、表II、表III、表IV、および/または表IXの遺伝子の遺伝子発現産物における変化が、早期固形肺腫瘍を有する患者の正常な循環血中で、本発明の方法によって観察および検出され得る。
本明細書に記載の遺伝子発現プロファイルは、肺癌の早期検出のための新しい診断マーカーを提供し、患者が良性結節の手術または生検に関連する不要な処置を受けることを防止することができる。リスクが非常に低いので、リスク対効果比が非常に高い。一実施形態では、本明細書に記載の方法および組成物は、肺結節を有する患者の管理方法について医師がより正確な決定を下すのを助けるために、臨床リスク因子と併せて使用されてもよい。本発明の別の利点は、診断が、早期肺癌においては失われていく少量でしか存在しない循環腫瘍細胞の検出に依存しないため、早期に行われ得ることである。
一態様では、哺乳動物対象において結節を癌性または良性として分類するための組成物が提供される。一実施形態では、組成物は、少なくとも7個のポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドを含み、各ポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドは、表I、表II、表III、表IV、または表IXの遺伝子から選択される試料中の異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズする。一実施形態では、遺伝子は、表IVに列挙される最初の7個の遺伝子である。一実施形態では、組成物は、少なくとも8個のポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドを含み、各ポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドは、表I、表II、表III、表IV、または表IXの遺伝子から選択される試料中の異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズする。一実施形態では、遺伝子は表Iのものである。別の実施形態では、組成物は、少なくとも15個のポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドを含み、各ポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドは、表II、表III、表IV、または表IXの遺伝子から選択される試料中の異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズする。一実施形態では、遺伝子は、表IIの最初の15個の遺伝子である。一実施形態では、遺伝子は、表IIIの最初の15個の遺伝子である。一実施形態では、遺伝子は、表IVの最初の15個の遺伝子である。一実施形態では、遺伝子は、表IXの最初の15個の遺伝子である。別の実施形態では、組成物は、少なくとも41個のポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドを含み、各ポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドは、表II、表III、表IV、また
は表IXの遺伝子から選択される試料中の異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズする。一実施形態では、遺伝子は、表IXの遺伝子である。別の実施形態では、組成物は、少なくとも50個のポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドを含み、各ポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドは、表II、表III、表IV、または表IXの遺伝子から選択される試料中の異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズする。一実施形態では、遺伝子は、表IIの遺伝子である。別の実施形態では、遺伝子は、表IIIの遺伝子である。別の実施形態では、遺伝子は、表IVの遺伝子である。一実施形態では、ポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドは、mRNAにハイブリダイズする。
一実施形態では、新規の遺伝子発現プロファイルまたは特徴は、癌性腫瘍を有する患者を、良性結節を有する患者から識別および区別することができる。例えば、好適な遺伝子発現プロファイルを形成し得る、例えば、表I、表II、表III、表IV、および表IXで特定される遺伝子を参照されたい。別の実施形態では、表Iの遺伝子の一部が好適なプロファイルを形成する。さらに別の実施形態では、表IIの遺伝子の一部が好適なプロファイルを形成する。さらに別の実施形態では、表IIIの遺伝子の一部が好適なプロファイルを形成する。さらに別の実施形態では、表IVの遺伝子の一部が好適なプロファイルを形成する。さらに別の実施形態では、表IXの遺伝子の一部が好適なプロファイルを形成する。本明細書で考察されるように、これらのプロファイルは、以下に例示されるように、遺伝子発現プロファイルの違いに基づいて判別スコアを生成することによって、癌性腫瘍と非癌性腫瘍とを区別するために使用される。これらの特徴の妥当性は、肺結節の診断を受けていない患者のコホート内の異なるグループによって異なる場所で収集された試料において確立された。実施例ならびに図1および2を参照されたい。本明細書で特定される肺癌の特徴または遺伝子発現プロファイル(すなわち、表I、表II、表III、表IV、または表IX)をさらに最適化して、必要な遺伝子発現産物の数を減少させ、診断の精度を増加させることができる。
一実施形態では、組成物は、約7個またはポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドを含み、各ポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドは、表I、表II、表III、表IV、または表IXの遺伝子から選択された試料中の異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズする。別の実
施形態では、組成物は、約5〜約50個のポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドを含み、各ポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドは、表IIの遺伝子から選択された試料中の異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズする。別の実施形態では、組成物は、約5〜約50個のポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドを含み、各ポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドは、表IIIの遺伝子から選択された試料中の異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズする。別の実施形態では、組成物は、約5〜約50個のポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドを含み、各ポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドは、表IVの遺伝子から選択された試料中の異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズする。別の実施形態では、組成物は、1、2、3、4、5、6、7、または8個のポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドを含み、各ポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドは、表Iの遺伝子から選択された試料中の異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズする。別の実施形態では、組成物は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50個のポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドを含み、各ポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドは、表IIの遺伝子から選択された試料中の異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズする。別の実施形態では、組成物は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50個のポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドを含み、各ポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドは、表IIIの遺伝子から選択された試料中の異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズする。別の実施形態では、組成物は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、または100個のポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドを含み、各ポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドは、表IVの遺伝子から選択された試料中の異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズする。別の実施形態では、組成物は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、または41個のポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドを含み、各ポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドは、表IXの遺伝子から選択された試料中の異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズする。一実施形態では、組成物は、少なくとも3個のポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドを含み、各ポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドは、表I、表II、表III、表IV、または表IXの遺伝子から選択された試料中の異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズする。一実施形態では、組成物は、少なくとも5個のポリヌクレオチドまたはオリゴヌクレオチ
ドまたはリガンドを含み、各ポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドは、表I、表II、表III、表IV、または表IXの遺伝子から選択された試料中の異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズする。一実施形態では、組成物は、少なくとも7個のポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドを含み、各ポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドは、表I、表II、表III、表IV、または表IXの遺伝子から選択された試料中の異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズする。一実施形態では、組成物は、少なくとも8個のポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドを含み、各ポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドは、表I、表II、表III、表IV、または表IXの遺伝子から選択された試料中の異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズする。一実施形態では、組成物は、少なくとも10個のポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドを含み、各ポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドは、表II、表III、表IV、または表IXの遺伝子から選択された試料中の異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズする。一実施形態では、組成物は、少なくとも15個のポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドを含み、各ポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドは、表II、表III、表IV、または表IXの遺伝子から選択された試料中の異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズする。一実施形態では、組成物は、少なくとも20個のポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドを含み、各ポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドは、表II、表III、表IV、または表IXの遺伝子から選択された試料中の異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズする。一実施形態では、組成物は、少なくとも25個のポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドを含み、各ポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドは、表II、表III、表IV、または表IXの遺伝子から選択された試料中の異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズする。一実施形態では、組成物は、少なくとも30個のポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドを含み、各ポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドは、表II、表III、表IV、または表IXの遺伝子から選択された試料中の異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズする。一実施形態では、組成物は、少なくとも35個のポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドを含み、各ポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドは、表II、表III、表IV、または表IXの遺伝子から選択された試料中の異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズする。一実施形態では、組成物は、少なくとも40個のポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドを含み、各ポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドは、表II、表III、表IV、または表IXの遺伝子から選択された試料中の異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズする。
一実施形態では、組成物は、少なくとも45個のポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドを含み、各ポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドは、表II、表III、表IV、または表IXの遺伝子から選択された試料中の異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズする。一実施形態では、組成物は、少なくとも50個のポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドを含み、各ポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドは、表II、表III、表IV、または表IXの遺伝子から選択された試料中の異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズする。一実施形態では、組成物は、少なくとも55個のポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドを含み、各ポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドは、表IVの遺伝子から選択された試料中の異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産
物にハイブリダイズする。一実施形態では、組成物は、少なくとも60個のポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドを含み、各ポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドは、表IVの遺伝子から選択された試料中の異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズする。一実施形態では、組成物は、少なくとも65個のポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドを含み、各ポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドは、表IVの遺伝子から選択された試料中の異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズする。一実施形態では、組成物は、少なくとも70個のポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドを含み、各ポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドは、表IVの遺伝子から選択された試料中の異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズする。一実施形態では、組成物は、少なくとも75個のポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドを含み、各ポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドは、表IVの遺伝子から選択された試料中の異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズする。一実施形態では、組成物は、少なくとも80個のポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドを含み、各ポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドは、表IVの遺伝子から選択された試料中の異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズする。一実施形態では、組成物は、少なくとも85個のポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドを含み、各ポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドは、表IVの遺伝子から選択された試料中の異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズする。一実施形態では、組成物は、少なくとも90個のポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドを含み、各ポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドは、表IVの遺伝子から選択された試料中の異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズする。一実施形態では、組成物は、少なくとも95個のポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドを含み、各ポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドは、表IVの遺伝子から選択された試料中の異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズする。一実施形態では、組成物は、少なくとも100個のポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドを含み、各ポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドは、表IVの遺伝子から選択された試料中の異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズする。
さらに別の実施形態では、発現プロファイルは、表I、表II、表III、表IV、または表IXの順位順に最初の3個の遺伝子によって形成される。さらに別の実施形態では、発現プロファイルは、表I、表II、表III、表IV、または表IXの順位順に最初の5個の遺伝子によって形成される。さらに別の実施形態では、発現プロファイルは、表I、表II、表III、表IV、または表IXの順位順に最初の8個の遺伝子によって形成される。さらに別の実施形態では、発現プロファイルは、表II、表III、表IV、または表IXの順位順に、最初の15個の遺伝子によって形成される。さらに別の実施形態では、発現プロファイルは、表II、表III、表IV、または表IXの順位順に最初の20個の遺伝子によって形成される。別の実施形態では、発現プロファイルは、表II、表III、表IV、または表IXの順位順に最初の25個の遺伝子によって形成される。さらに別の実施形態では、発現プロファイルは、表II、表III、表IV、または表IXの順位順に最初の30個の遺伝子によって形成される。別の実施形態では、発現プロファイルは、表II、表III、表IV、または表IXの順位順に最初の35個の遺伝子によって形成される。別の実施形態では、発現プロファイルは、表II、表III、表IV、または表IXの順位順に最初の40個の遺伝子によって形成される。別の実施形態では、発現プロファイルは、表II、表III、表IV、または表IXの順位順に最初の41個の遺伝子によって形成される。別の実施形態では、発現プロファイルは、表II、表
III、または表IVの順位順に最初の45個の遺伝子によって形成される。さらに別の実施形態では、発現プロファイルは、表II、表III、または表IVの順位順に最初の50個の遺伝子によって形成される。さらに別の実施形態では、発現プロファイルは、表IVの順位順に最初の51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、
81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100個の遺伝子によって形成される。
以下に考察されるように、本明細書に記載される組成物は、当該技術分野において既知である遺伝子発現プロファイリング方法と共に使用され得る。よって、組成物は、その使用が意図されている方法に合わせて適合させることができる。一実施形態では、少なくとも1つのポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドは、検出可能な標識に結合する。ある特定の実施形態では、各ポリヌクレオチドまたはオリゴヌクレオチドは、各々独立して検出することができる異なる検出可能な標識に結合する。そのような試薬は、以下に記載されるようなnCounterなどのアッセイにおいて、および本明細書に記載される診断方法で有用である。
別の実施形態では、組成物は、少なくとも1つのポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドにハイブリダイズする捕捉オリゴヌクレオチドまたはリガンドを含む。一実施形態では、そのような捕捉オリゴヌクレオチドまたはリガンドは、目的の遺伝子に特異的なオリゴヌクレオチドまたはポリヌクレオチドまたはリガンドの一部に特異的な核酸配列を含んでもよい。捕捉リガンドは、目的の遺伝子に対するリガンドに特異的なペプチドまたはポリペプチドであってもよい。一実施形態では、捕捉リガンドは、サンドイッチELISAにあるような抗体である。
捕捉オリゴヌクレオチドは、基質との結合を可能にする部分も含む。そのような基質には、プレート、ビーズ、スライド、ウェル、チップ、またはチャンバが含まれるが、これらに限定されない。一実施形態では、組成物は、目的の遺伝子に特異的な各異なるポリヌクレオチドまたはオリゴヌクレオチドの捕捉オリゴヌクレオチドを含む。各捕捉オリゴヌクレオチドは、同じ基質との結合を可能にする同じ部分を含んでもよい。一実施形態では、結合部分はビオチンである。
このため、本明細書に記載される哺乳動物対象におけるそのような診断または評価のための組成物は、キットまたは試薬であり得る。例えば、組成物の一実施形態は、基質を含み、この基質に、mRNAを検出し定量化するために使用されるリガンドが固定される。試薬は、一実施形態では、mRNAの核酸配列を増幅し検出する増幅核酸プライマー(RNAプライマーなど)またはプライマー対である。別の実施形態では、試薬は、標的配列にハイブリダイズするポリヌクレオチドプローブである。別の実施形態では、標的配列は表IIIに示される。別の実施形態では、試薬は、抗体または抗体の断片である。試薬は、表I、表II、表III、表IV、または表IXの少なくとも1つの遺伝子、遺伝子断片、または発現産物に各々特異的な該プライマー、プローブ、または抗体を含み得る。任意選択で、試薬は、従来の検出可能な標識と関連し得る。
別の実施形態では、組成物は、関連する複数のポリヌクレオチドまたはオリゴヌクレオチドプローブまたはリガンド、それらのための任意選択の検出可能な標識、固定化基質、酵素標識のための任意選択の基質、および他の研究室用物品を含むキットである。さらに別の実施形態では、少なくとも1つのポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドは、検出可能な標識と関連する。ある特定の実施形態では、試薬は基質に固定される。例示的な基質には、マイクロアレイ、チップ、マイクロ流体カード、またはチャン
バが挙げられる。
一実施形態では、組成物は、以下でさらに考察されるように、nCounter Nanostringシステムと共に使用するように設計されたキットである。
II.遺伝子発現プロファイリング方法
本明細書に記載の組成物および方法に有用なプロファイルを生成するために、または本明細書に記載の組成物を使用して診断ステップを実行するために使用された遺伝子発現プロファイリングの方法は既知であり、米国特許第7,081,340号に十分に要約されている。そのような遺伝子発現プロファイリング方法には、ポリヌクレオチドのハイブリダイゼーション分析に基づく方法、ポリヌクレオチドの配列決定に基づく方法、およびプロテオミクスに基づく方法が挙げられる。試料中のmRNA発現の定量化のために当該技術分野で既知の最も一般的に使用される方法としては、ノーザンブロッティングおよびin
situ ハイブリダイゼーション、RNAse保護アッセイ、nCounter(登録商標)分析、ならびにRT−PCRなどのPCRに基づく方法が挙げられる。あるいは、DNA二本鎖、RNA二本鎖、およびDNA−RNAハイブリッド二本鎖またはDNA−タンパク質二本鎖を含む特定の二本鎖を認識することができる抗体を用いてもよい。配列決定に基づく遺伝子発現分析の代表的な方法としては、遺伝子発現連鎖分析(SAGE)、および大規模並列シグネチャー配列決定(MPSS)による遺伝子発現分析が挙げられる。
ある特定の実施形態では、本明細書に記載の組成物は、本明細書に記載の遺伝子発現プロファイリングおよび/または診断の方法、ならびに当該技術分野で既知のものに使用するために適合される。
A.患者試料
「試料」または「生体試料」は、本明細書で使用される場合、免疫細胞および/または癌細胞を含有する任意の生体液または組織を意味する。一実施形態では、好適な試料は全血である。別の実施形態では、試料は静脈血であってもよい。別の実施形態では、試料は動脈血であってもよい。別の実施形態では、本明細書に記載の方法における使用に好適な試料は、末梢血、より具体的には末梢血単核細胞を含む。他の有用な生体試料としては、血漿または血清が挙げられるが、これらに限定されない。さらに他の実施形態では、試料は、唾液、尿、滑液、骨髄、脳脊髄液、膣粘液、頸管粘液、鼻汁、鼻擦過物、痰、精液、羊水、気管支肺洗浄液、および肺疾患を有する疑いのある対象からの他の細胞滲出物である。そのような試料は、生理食塩水、緩衝液、または生理学的に許容される希釈剤でさらに希釈されてもよい。あるいは、そのような試料は、従来の手段によって濃縮される。任意の1つの生体試料に対する本明細書全体にわたる使用または参照は、例示的なものに過ぎないことを理解されたい。例えば、本明細書において試料が全血と称される場合、他の試料、例えば、血清、血漿なども別の実施形態で用いられ得ることが理解される。
一実施形態では、生体試料は全血であり、本方法は、PaxGene Blood RNA Workflowシステム(Qiagen)を採用する。このシステムは、血液採取(例えば、1回の採血)およびRNA安定化、続いて輸送および貯蔵、続いて総RNAの精製および分子RNA試験の精製を伴う。このシステムは、即時のRNA安定化および一貫した採血量を提供する。血液は医師の診察室またはクリニックで採取することができ、検体は同じ試験管中で輸送および保管される。短期RNA安定性は、18〜25℃で3日間、または2〜8℃で5日間である。長期RNA安定性は、−20〜−70℃で4年間である。この試料収集システムは、使用者が全血中の遺伝子発現に関するデータを確実に取得することを可能にする。一実施形態では、生体試料は全血である。PAXgeneシステムはPBMCを生体試料源として使用する場合よりもノイズが多いが、PAXgene試料収集の利点は問題を補って余りある。ノイズは、当業者であれば、バイオインフォ
マティクスにより取り去ることができる。
一実施形態において、生体試料は、独自のPaxGene Blood RNA System(PreAnalytiX,a Qiagen,BD company)を使用して収集され得る。PAXgene Blood RNA Systemは、2つの統合された構成要素、PAXgene Blood RNA TubeおよびPAXgene
Blood RNA Kitからなる。標準的な静脈切除技術により、血液試料をPAXgene Blood RNA試験管に直接採取する。これらの試験管には、直ちに細胞内RNAを安定させ、RNA転写産物の体外分解または上方調節を最小限に抑える独自の試薬が含まれる。冷凍を排除し、試料をまとめ、収集後の試料処理の緊急性を最小限に抑えることができることにより、研究室効率が大幅に高まり、コストが削減される。
その後、様々なアッセイを使用してmiRNAを検出および/または測定する。
B.Nanostring分析
本明細書に記載の組成物および方法との使用に好適な感度および順応性の高い定量的方法は、nCounter(登録商標)Analysisシステム(NanoString
Technologies,Inc.,Seattle WA)である。nCounter Analysis Systemは、遺伝子発現の直接多重測定に基づくデジタルの色分けされたバーコード技術を利用し、高レベルの精度および感度を提供する(細胞あたり1コピー未満)。この技術は、分子「バーコード」および単一の分子イメージングを使用して、単一の反応で何百もの固有の転写産物を検出し、計数する。各色分けされたバーコードは、目的の遺伝子、すなわち、表I、表II、表III、表IV、または表IXの遺伝子に対応する単一の標的特異的プローブ(すなわち、ポリヌクレオチド、オリゴヌクレオチド、またはリガンド)に結合する。これらは、対照と一緒に混合されると、多重のCodeSetを形成する。一実施形態では、CodeSetは、表Iの遺伝子の8個すべてを含む。一実施形態では、CodeSetは、表II、表III、表IV、または表IXの最初の7個の遺伝子を含む。別の実施形態では、CodeSetは、表IIの50個すべての遺伝子を含む。別の実施形態では、CodeSetは、表IIIの50個すべての遺伝子を含む。別の実施形態では、CodeSetは、表I、表II、表III、表IV、または表IXの少なくとも3個の遺伝子を含む。別の実施形態では、CodeSetは、表I、表II、表III、表IV、または表IXの少なくとも5個の遺伝子を含む。別の実施形態では、CodeSetは、表I、表II、表III、表IV、または表IXの少なくとも8個の遺伝子を含む。別の実施形態では、CodeSetは、表II、表III、表IV、または表IXの少なくとも10個の遺伝子を含む。別の実施形態では、CodeSetは、表II、表III、表IV、または表IXの少なくとも15個の遺伝子を含む。別の実施形態では、CodeSetは、表II、表III、表IV、または表IXの少なくとも20個の遺伝子を含む。別の実施形態では、CodeSetは、表II、表III、表IV、または表IXの少なくとも25個の遺伝子を含む。別の実施形態では、CodeSetは、表II、表III、表IV、または表IXの少なくとも30個の遺伝子を含む。さらに別の実施形態では、CodeSetは、表II、表III、表IV、または表IXの少なくとも40個の遺伝子を含む。さらに別の実施形態では、CodeSetは、表II、表III、表IV、または表IXの少なくとも41個の遺伝子を含む。さらに別の実施形態では、CodeSetは、表II、表III、表IV、または表IXの少なくとも50個の遺伝子を含む。別の実施形態では、CodeSetは、表III、表IV、または表IXの少なくとも60個の遺伝子を含む。別の実施形態では、CodeSetは、表III、表IV、または表IXの少なくとも70個の遺伝子を含む。さらに別の実施形態では、CodeSetは、表III、表IV、または表IXの少なくとも80個の遺伝子を含む。さらに別の実施形態では、CodeSetは、表III、表IV、または表IXの少なくとも90個の遺伝子を含む。別の実施形態では、CodeSetは、表III、表IV、または表IXの100個すべての遺伝子を含む。さらに別の実
施形態では、CodeSetは、本明細書に記載されるように、組み合わせを含む、表I、表II、表III、表IV、または表IXの遺伝子の任意のサブセットを含む。
NanoStringプラットフォームは、溶液中でハイブリダイズするmRNAあたり2〜50個の塩基プローブを用いる。レポータープローブは信号を運び、捕捉プローブは、データ収集のために複合体を固定することを可能にする。プローブは、患者試料と混合される。ハイブリダイゼーションの後、過剰なプローブが除去され、プローブ/標的複合体は、例えばnCounter Cartridge内の基質に整列し固定される。
表I、表II、表III、表IV、および表IXの遺伝子の各々について以下の実施例で利用される標的配列は、以下の表Vに示され、配列表中に複写されている。これらの配列は、これらの遺伝子の公開された配列の一部である。当業者であれば好適な代替を容易に設計し得る。
試料カートリッジは、データ収集のためにデジタル分析器に置く。カートリッジ表面のカラーコードを標的分子ごとに計数し一覧にする。
NanoString nCounterカウンターシステムを使用する利点は、検出および定量化を行うためにmRNAの増幅が必要でないことである。しかしながら、代替の実施形態では、他の好適な定量的方法が使用される。例えば、参照により全体が本明細書に組み込まれる、Geiss et al,Direct multiplexed measurement of gene expression with color−coded probe pairs,Nat Biotechnol.
2008 Mar;26(3):317−25.doi:10.1038/nbt1385.Epub 2008 Feb 17を参照されたい。
C.ポリメラーゼ連鎖反応(PCR)技術
別の好適な定量的方法はRT−PCRであり、これは、正常および腫瘍組織における異なる試料集団中のmRNAレベルを比較して、遺伝子発現のパターンを特徴付け、密接に関連するmRNA間の区別を行い、RNA構造を分析するために使用することができる。第1のステップは、標的試料(例えば、典型的には、ヒトPBMCから単離された総RNA)からのmRNAの単離である。mRNAは、例えば、凍結またはアーカイブされたパラフィン包埋および固定(例えば、ホルマリン固定)組織試料から抽出することができる。
mRNA抽出のための一般的な方法は、当該技術分野、かかる分子生物学の標準的な教書において周知である。特に、RNA単離は、製造業者の説明書に従って、商用製造業者からの精製キット、緩衝液セット、およびプロテアーゼを使用して行うことができる。例示的な市販製品としては、TRI−REAGENT、Qiagen RNeasy mini−columns、MASTERPURE Complete DNA and RNA Purification Kit(EPICENTRE(登録商標),Madison,Wis.)、Paraffin Block RNA Isolation Kit(Ambion,Inc.)、およびRNA Stat−60(Tel−Test)が挙げられる。塩化セシウム密度勾配遠心分離などの従来技術を用いることもできる。
RT−PCRによる遺伝子発現プロファイリングの第1のステップは、RNA鋳型のcDNAへの逆転写、続くPCR反応におけるその指数関数的増幅である。最も一般的に使用される2つの逆転写酵素は、アビロ骨髄芽球症ウイルス逆転写酵素(AMV−RT)およびモロニーマウス白血病ウイルス逆転写酵素(MMLV−RT)である。逆転写ステップは、典型的には、状況および発現プロファイリングの目的に応じて、特異的プライマー
、ランダムヘキサマー、またはオリゴdTプライマーを使用してプライミングされる。例えば、製品GENEAMP RNA PCRキット(Perkin Elmer,Calif.,USA)に添付の製造業者の説明書を参照されたい。次いで、得られたcDNAを、続くRT−PCR反応における鋳型として使用することができる。
PCRステップは、一般に、5’−3’ヌクレアーゼ活性を有するが、3’−5’プルーフリーディングエンドヌクレアーゼ活性を有しないTaqDNAポリメラーゼなどの熱安定性DNA依存性DNAポリメラーゼを使用する。このため、TAQMAN(登録商標)PCRは、典型的には、TaqまたはTthポリメラーゼの5’−ヌクレアーゼ活性を利用して、その標的アンプリコンに結合したハイブリダイゼーションプローブを加水分解するが、同等の5’ヌクレアーゼ活性を有するいずれの酵素も使用することができる。2つのオリゴヌクレオチドプライマーを使用して、PCR反応に典型的なアンプリコンが生成される。一実施形態では、標的配列は、表Vに示される。第3のオリゴヌクレオチド、またはプローブは、2つのPCRプライマーの間に位置するヌクレオチド配列を検出するように設計される。プローブは、TaqDNAポリメラーゼ酵素によって伸長不可能であり、レポーター蛍光色素およびクエンチャー蛍光色素で標識される。レポーター色素からのレーザー誘起発光は、2つの色素がプローブ上にあるように近接して位置する場合に、クエンチング色素によってクエンチされる。増幅反応の間、TaqDNAポリメラーゼ酵素は、鋳型依存的な様式でプローブを切断する。得られたプローブ断片は、溶液中で解離し、放出されたレポーター色素からのシグナルは、第2のフルオロフォアのクエンチ効果を免れる。レポーター色素の1分子は、合成された新しい分子ごとに遊離され、クランチされていないレポーター色素の検出により、データの定量的解釈の基礎が提供される。
TaqMan(登録商標)RT−PCRは、市販の装置を使用して実施することができる。好ましい実施形態では、5’ヌクレアーゼの手順は、ABI PRISM7900(登録商標)Sequence Detection System(登録商標)などのリアルタイム定量PCR装置上で実行される。このシステムは、サーモサイクラー上、96ウェルのフォーマットで試料を増幅する。増幅中、レーザー誘起蛍光シグナルは、すべての96ウェルについて、光ファイバーケーブルを介してリアルタイムで収集され、CCDで検出される。システムには、装置を動作させ、データを解析するためのソフトウェアが含まれる。5’−ヌクレアーゼアッセイデータは、最初にCtまたは閾値サイクルとして表される。上で考察したように、蛍光値は、各サイクル中に記録され、増幅反応におけるその時点まで増幅された産物の量を表す。蛍光シグナルが統計的に有意であるとして最初に記録される時が、閾値サイクル(C)である。
誤差および試料間の変動の影響を最小限に抑えるために、RT−PCRは、通常内部標準を用いて行われる。理想的な内部標準は、異なる組織間において一定レベルで発現され、実験治療の影響を受けない。遺伝子発現のパターンを正規化するために最も頻繁に使用されるRNAは、ハウスキーピング遺伝子のグリセルアルデヒド−3−リン酸−デヒドロゲナーゼ(GAPDH)およびβ−アクチンのmRNAである。
リアルタイムPCRは、各標的配列の内部競合物質が正規化に使用される定量的競合PCRと、試料中に含まれる正規化遺伝子またはRT−PCRのためのハウスキーピング遺伝子を使用する定量的比較PCRとの両方と同等である。
別のPCR法、すなわち、Mass ARRAYベースの遺伝子発現プロファイリング法(Sequenom,Inc.,San Diego,CA)では、RNAの単離および逆転写の後、得られたcDNAを合成DNA分子(競合物質)でスパイクし、これは、単一の塩基を除くすべての位置の標的とされたcDNA領域と一致し、内部標準として働く。cDNA/競合物質の混合物は、PCRで増幅され、PCR後のエビアルカリホスフ
ァターゼ(SAP)酵素処理に供され、残りのヌクレオチドの脱リン酸化をもたらす。アルカリホスファターゼの不活性化の後、競合物質およびcDNAからのPCR産物は、プライマー伸長に供され、競合物質由来のPCR産物およびcDNA由来のPCR産物のために個別の質量シグナルを生成する。精製後、これらの生成物は、マトリックス支援レーザー脱離イオン化飛行時間型質量分析法(MALDI−TOF MS)の分析を用いて、分析に必要な成分を予め装填したチップアレイ上に分配される。次いで、反応中に存在するcDNAは、生成されたマススペクトルにおけるピーク領域の比を分析することによって定量される。
当該技術分野で既知であり、遺伝子発現プロファイリングに使用され得るPCRに基づく技術のさらに他の実施形態には、例えば、差動ディスプレイ、増幅断片長多型(iAFLP)、および遺伝子発現の迅速アッセイにおいて、市販されているLuminex100 LabMAPシステムおよび複数の色分けされたマイクロスフェア(Luminex
Corp.,Austin,Tex.)を使用する、BeadArray(商標)技術(Illumina,San Diego,CA)、ならびにハイカバレージ発現プロファイリング(HiCEP)分析が含まれる。
D.マイクロアレイ
差次的遺伝子発現も、マイクロアレイ技術を使用して、特定または確認され得る。このため、肺癌関連遺伝子の発現プロファイルは、マイクロアレイ技術を使用して、新鮮な組織またはパラフィン包埋組織のいずれかで測定され得る。この方法では、目的のポリヌクレオチド配列(cDNAおよびオリゴヌクレオチドを含む)は、マイクロチップ基質上にプレーティングまたはアレイ化される。次いで、アレイ化配列は、目的の細胞または組織由来の特定のDNAプローブとハイブリダイズされる。本明細書の他の方法および組成物と同様に、mRNAの供給源は、対照および患者対象の全血から単離された全RNAである。
マイクロアレイ技術の一実施形態において、cDNAクローンのPCR増幅挿入物は、高密度アレイの基質に適用される。一実施形態では、表IIIからの559個のヌクレオチド配列すべてが基質に適用される。マイクロチップに固定されたマイクロアレイ化遺伝子は、ストリンジェントな条件下でのハイブリダイゼーションに好適である。目的の組織から抽出されたRNAの逆転写による蛍光ヌクレオチドの取り込みにより、蛍光標識されたcDNAプローブが生成され得る。チップに適用された標識されたcDNAプローブは、アレイ上のDNAの各スポットに特異性をもってハイブリダイズする。非特異的に結合したプローブを除去するために、ストリンジェントな洗浄を行った後、共焦点レーザー顕微鏡法またはCCDカメラなどの別の検出方法によって、チップがスキャンされる。各アレイ化された要素のハイブリダイゼーションの定量化により、対応するmRNA存在量の評価が可能となる。二色蛍光を用いて、2つのRNA源から生成された別々に標識されたcDNAプローブが、アレイに対でハイブリダイズされる。このようにして、各指定遺伝子に対応する2つの供給源からの転写産物の相対的存在量が同時に決定される。ハイブリダイゼーションの小型化により、多数の遺伝子の発現パターンの簡便で迅速な評価ができるようになる。そのような方法は、細胞あたり数コピーで発現する稀な転写産物を検出するために必要な感度を有し、発現レベルの少なくとも約2倍の差を再現可能に検出することが示されている。マイクロアレイ分析は、製造業者のプロトコルにしたがって、市販の装置によって行われ得る。
米国特許第7,081,340号によって要約され、参照により本明細書に組み込まれる他の有用な方法には、遺伝子発現連鎖分析(SAGE)、および大規模並列シグネチャー配列決定(MPSS)が含まれる。簡単に説明すると、遺伝子発現連鎖分析(SAGE)は、各転写産物に対して、個々のハイブリダイゼーションプローブを提供する必要なく
、多数の遺伝子転写産物の同時および定量分析を可能にする方法である。最初に、転写産物を独特に特定するのに十分な情報を含む短い配列タグ(約10〜14bp)が生成されるが、このタグは、各転写産物内の独特な位置から得られる。次いで、多くの転写産物が一緒に連結して長い連続分子を形成し、これが配列決定されて、複数のタグの身元が同時に明らかとなり得る。転写産物の任意の集団の発現パターンは、個々のタグの存在量を決定し、各タグに対応する遺伝子を特定することによって、定量的に評価され得る。詳細については、例えば、ともに参照により本明細書に組み込まれる、Velculescu et al.,Science 270:484487(1995)、およびVelculescu et al.,Cell 88:243 51(1997)を参照されたい。
Brenner et al.,Nature Biotechnology 18:630634(2000)(参照により本明細書に組み込まれる)に記載されている大規模並列シグネチャー配列決定(MPSS)による遺伝子発現分析は、非ゲルベースのシグネチャー配列決定と、別個の直径5μmのマイクロビーズ上の何百万もの鋳型のインビトロクローニングとを組み合わせた配列決定のアプローチである。最初に、インビトロクローニングによって、DNA鋳型のマイクロビーズライブラリーが構築される。これに続いて、高密度(典型的には、3×10マイクロビーズ/cmより大きい)で、フローセルにおける鋳型を含有しているマイクロビーズの平面アレイを組み立てる。DNA断片分離を必要としない蛍光ベースのシグネチャー配列決定法を使用して、各マイクロビーズ上のクローン化された鋳型の遊離末端が同時に解析される。この方法は、酵母cDNAライブラリー由来の数十万個の遺伝子シグネチャー配列を、一回の操作で同時に正確に提供することが示されている。
E.免疫組織化学
免疫組織化学法は、本明細書における方法および組成物における使用について記載される情報提供性遺伝子の遺伝子発現産物の発現レベルを検出するのにも好適である。抗体または抗血清、好ましくはポリクローナル抗血清、および最も好ましくはモノクローナル抗体、または各マーカーに特異的な他のタンパク質結合リガンドを使用して、発現を検出する。抗体は、例えば、放射性標識、蛍光標識、ビオチンなどのハプテン標識、または西洋ワサビペルオキシダーゼもしくはアルカリホスファターゼなどの酵素で抗体自体を直接標識することによって検出され得る。あるいは、標識されていない一次抗体を、一次抗体に特異的な抗血清、ポリクローナル抗血清、またはモノクローナル抗体を含む標識された二次抗体と併せて使用する。免疫組織化学分析のためのプロトコルおよびキットは、当該技術分野において周知であり、市販されている。
III.本発明の組成物
定義された遺伝子発現プロファイルを利用する本明細書に記載の肺癌を診断するための方法により、非癌性結節に対して、肺癌、例えばNSCLCを診断するための簡易診断ツールの開発が可能となる。このため、本明細書に記載の哺乳動物対象における肺癌を診断するための組成物は、キットまたは試薬であり得る。例えば、組成物の一実施形態は、基質を含み、この基質に、該ポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドまたはリガンドが固定される。別の実施形態では、組成物は、関連する5個以上のポリヌクレオチドまたはオリゴヌクレオチドまたはリガンド、それらのための任意選択の検出可能な標識、固定化基質、酵素標識のための任意選択の基質、および他の研究室用物品を含むキットである。さらに別の実施形態では、少なくとも1つのポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドは、検出可能な標識と関連する。
一実施形態では、哺乳動物対象における肺癌を診断するための組成物は、7個以上のPCRプライマープローブセットを含む。各プライマープローブセットは、対象の血液中に
見られる7個以上の情報提供性遺伝子の遺伝子発現産物とは異なるポリヌクレオチド配列を増幅する。これらの情報提供性遺伝子は、肺癌を有する対象と、非癌性結節を有する対象とで区別可能である遺伝子発現プロファイルまたは特徴を形成するように選択される。遺伝子発現プロファイルにおける遺伝子の発現の、参照遺伝子発現プロファイルのものからの変化は、非小細胞肺癌(NSCLC)などの肺癌と相関する。
この組成物の一実施形態では、情報提供性遺伝子は、表Iに特定される遺伝子の中から選択される。この組成物の別の実施形態では、情報提供性遺伝子は、表IIに特定される遺伝子の中から選択される。この組成物の別の実施形態では、情報提供性遺伝子は、表IIIに特定される遺伝子の中から選択される。
この組成物の別の実施形態では、情報提供性遺伝子は、表IVに特定される遺伝子の中から選択される。この組成物の別の実施形では、情報提供性遺伝子は、表IXに特定される遺伝子の中から選択される。この遺伝子のコレクションは、遺伝子産物発現が、参照対照(すなわち、非癌性結節を有する患者)の血液中の同じ遺伝子産物発現に対して改変される(すなわち、増加または減少する)ものである。一実施形態では、ポリヌクレオチドまたはオリゴヌクレオチドまたはリガンド、すなわち、プローブは、組成物中で使用するために、表I、表II、表III、表IV、および/または表IXからの7個以上の情報提供性遺伝子に対して生成される(CodeSet)。このような組成物の一例は、表Iの遺伝子の標的部分へのプローブを含有する。別の実施形態では、プローブは、組成物中で使用するために、表Iからの8個すべての遺伝子に対して生成される。別の実施形態では、プローブは、組成物中で使用するために、表IIからの最初の15個の遺伝子に対して生成される。別の実施形態では、プローブは、組成物中で使用するために、表IIIからの最初の15個の遺伝子に対して生成される。別の実施形態では、プローブは、組成物中で使用するために、表IXからの最初の41個の遺伝子に対して生成される。別の実施形態では、プローブは、組成物中で使用するために、表IIからの50個の遺伝子に対して生成される。別の実施形態では、プローブは、組成物中で使用するために、表IIIからの50個の遺伝子に対して生成される。別の実施形態では、プローブは、組成物中で使用するために、表IVからの最初の7個の遺伝子に対して生成される。別の実施形態では、プローブは、組成物中で使用するために、表Iからの最初の15個の遺伝子に対して生成される。別の実施形態では、プローブは、組成物中で使用するために、表IVからの最初の50個の遺伝子に対して生成される。別の実施形態では、プローブは、組成物中で使用するために、表I、表II、表III、表IV、または表IXからの最初の3個の遺伝子に対して生成される。別の実施形態では、プローブは、組成物中で使用するために、表I、表II、表III、表IV、または表IXからの最初の5個の遺伝子に対して生成される。別の実施形態では、プローブは、組成物中で使用するために、表II、表III、表IV、または表IXからの最初の10個の遺伝子に対して生成される。別の実施形態では、プローブは、組成物中で使用するために、表II、表III、表IV、または表IXからの最初の15個の遺伝子に対して生成される。
別の実施形態では、プローブは、組成物中で使用するために、表II、表III、表IV、または表IXからの最初の20個の遺伝子に対して生成される。別の実施形態では、プローブは、組成物中で使用するために、表II、表III、表IV、または表IXからの最初の25個の遺伝子に対して生成される。
さらに別の実施形態では、プローブは、組成物中で使用するために、表II、表III、表IV、または表IXからの最初の30個の遺伝子に対して生成される。さらに別の実施形態では、プローブは、組成物中で使用するために、表II、表III、表IV、または表IXからの最初の35個の遺伝子に対して生成される。さらに別の実施形態では、プローブは、組成物中で使用するために、表II、表III、表IV、または表IXからの最初の40個の遺伝子に対して生成される。さらに別の実施形態では、プローブは、組成物中で使用するために、表II、表III、表IV、または表IXからの最初の45個の遺伝子に対して生成される。さらに別の実施形態では、プローブは、組成物中で使用するた
めに、表II、表III、表IV、または表IXからの最初の50個の遺伝子に対して生成される。さらに別の実施形態では、プローブは、組成物中で使用するために、表IVからの最初の55、60、65、70、75、80、85、90、95、または100個の遺伝子に対して生成される。表からの選択された遺伝子は、順位順である必要はなく、むしろ、参照対照と罹患患者との間の発現の差を明確に示す任意の組み合わせが、そのような組成物において有用である。
上記の組成物の一実施形態では、参照対照は、上記のように、非健康対照(NHC)である。他の実施形態では、参照対照は、「定義」で上述したいずれのクラスの対照であってもよい。
任意選択で検出可能な標識と関連した、本明細書に記載される表I、表II、表III、表IV、または表IXから選択される遺伝子に基づく組成物は、上記のNanostring、PCR、RT−PCR、またはQ PCR技術と共に使用するために適合されるマイクロ流体カード、チップもしくはチャンバ、またはキットの形式で提示され得る。一態様では、そのような形式は、TAQMAN(登録商標)Quantitative PCR低密度アレイを使用する診断アッセイである。別の態様では、このような形式は、Nanostring nCounterプラットフォームを使用する診断アッセイである。
上述の組成物中で使用するために、PCRプライマーおよびプローブは、好ましくは、遺伝子発現プロファイルから選択される増幅される遺伝子(複数可)に存在するイントロン配列に基づいて設計される。例示的な標的配列が表IVに示される。プライマーおよびプローブ配列の設計は、特定の遺伝子標的が選択されれば後は当業者の技術範囲内である。プライマーおよびプローブ設計のために選択される特定の方法、ならびに特定のプライマーおよびプローブ配列は、これらの組成物の非限定的な特徴である。当業者が利用可能なプライマーおよびプローブ設計技術の即時の説明は、一般ユーザーおよび生物学者プログラマーのためのワールドワイドウェブ上のDNA BLASTソフトウェア、Repeat Maskerプログラム(Baylor College of Medicine)、Primer Express(Applied Biosystems);MGB assay−by−design(Applied Biosystems);Primer3(Steve Rozen and HelenJ.Skaletsky(2000)Primer3などの一般に利用可能なツールを参照して、米国特許第7,081,340号に要約されている。
一般に、本明細書に記載の組成物中で使用される最適なPCRプライマーおよびプローブは、概して17〜30塩基長であり、例えば約50〜60%など、約20〜80%のG+C塩基を含有する。50〜80℃、例えば、約50〜70℃の溶融温度が典型的に好ましい。
別の態様では、哺乳動物対象における肺癌を診断するための組成物は、基質に固定された複数のポリヌクレオチドを含み、複数のゲノムプローブが、対象の血液における遺伝子発現プロファイルから選択される8個以上の情報提供性遺伝子の8個以上の遺伝子発現産物にハイブリダイズし、この遺伝子発現プロファイルは、表I、表II、表III、表IV、または表IXから選択される遺伝子を含む。別の態様では、哺乳動物対象における肺癌を診断するための組成物は、基質に固定された複数のポリヌクレオチドを含み、複数のゲノムプローブが、対象の血液における遺伝子発現プロファイルから選択される8個以上の情報提供性遺伝子の8個以上の遺伝子発現産物にハイブリダイズし、この遺伝子発現プロファイルは、表I、表II、表III、表IV、または表IXから選択される遺伝子を含む。別の実施形態では、哺乳動物対象における肺癌を診断するための組成物は、基質に
固定された複数のポリヌクレオチドを含み、複数のゲノムプローブが、対象の血液における遺伝子発現プロファイルから選択される15個以上の情報提供性遺伝子の15個以上の遺伝子発現産物にハイブリダイズし、この遺伝子発現プロファイルは、表II、表III、表IV、または表IXから選択される遺伝子を含む。この種の組成物は、Nanostring組成物について上で説明したものと同じ遺伝子プロファイルの認識に依存するが、cDNAアレイの技術を用いる。患者対象の血液中に存在する遺伝子発現産物への組成物中の固定されたポリヌクレオチドのハイブリダイゼーションを用いて、表I、表II、表III、表IV、および表IXに特定される遺伝子の中から選択される情報提供性遺伝子の発現を定量化して、患者のための遺伝子発現プロファイルを生成し、次いでこれを、参照試料のものと比較する。上記のように、プロファイル(すなわち、表Iの遺伝子またはそのサブセットのもの、表IIの遺伝子またはそのサブセットのもの、表IIIの遺伝子またはそのサブセットのもの、表IVの遺伝子またはそのサブセットのもの)の特定に応じて、この組成物は、NSCLC肺癌の診断および予後診断を可能にする。ここでも、組成物中で使用されるポリヌクレオチド配列、それらの長さおよび標識の選択は、どの遺伝子が肺癌の診断および予後診断に好適な遺伝子発現プロファイルを形成することができるかという教示を鑑みて、当業者によって行われる日常的な決定である。
また別の態様では、本明細書に記載の方法において有用な組成物またはキットは、対象の血液中の遺伝子発現プロファイルから選択される7個以上の情報提供性遺伝子の7個以上の遺伝子発現産物に結合する複数のリガンドを含む。別の実施形態では、本明細書に記載の方法において有用な組成物またはキットは、対象の血液中の遺伝子発現プロファイルから選択される8個以上の情報提供性遺伝子の8個以上の遺伝子発現産物に結合する複数のリガンドを含む。遺伝子発現プロファイルは、他の組成物について上に記載したように、表I、表II、表III、表IV、または表IXの遺伝子を含む。別の実施形態では、本明細書に記載の方法において有用な組成物またはキットは、対象の血液中の遺伝子発現プロファイルから選択される15個以上の情報提供性遺伝子の15個以上の遺伝子発現産物に結合する複数のリガンドを含む。遺伝子発現プロファイルは、他の組成物について上に記載したように、表I、表II、表III、表IV、または表IXの遺伝子を含む。別の実施形態では、本明細書に記載の方法において有用な組成物またはキットは、対象の血液中の遺伝子発現プロファイルから選択される50個以上の情報提供性遺伝子の50個以上の遺伝子発現産物に結合する複数のリガンドを含む。遺伝子発現プロファイルは、他の組成物について上に記載したように、表I、表II、表III、表IV、または表IXの遺伝子を含む。この組成物により、示された表中の遺伝子によって発現されるタンパク質の検出が可能となる。好ましくは、リガンドは、プロファイル中の遺伝子によってコードされるタンパク質に対する抗体であるが、様々な形態の抗体、例えば、ポリクローナル、モノクローナル、組換え、キメラ、ならびに断片および構成要素(例えば、CDR、一本鎖可変領域など)を抗体の代わりに使用してもよいことが、当業者には明らかであろう。そのようなリガンドは、対象の血液との接触に好適な基質上に固定され、従来の様式で分析され得る。ある特定の実施形態では、リガンドは、検出可能な標識と関連する。また、これらの組成物により、遺伝子発現プロファイルにおける遺伝子によってコードされるタンパク質の、参照遺伝子発現プロファイルのものからの変化を検出することが可能となる。
そのような変化は、上記のPCRおよびポリヌクレオチド含有組成物と類似の様式で肺癌と相関する。
診断用/予後診断用組成物の上記の形態のすべてについて、遺伝子発現プロファイルは、一実施形態において、表II、表III、表IV、または表IXの情報提供性遺伝子の少なくとも最初の7個または8個を含み得る。診断用/予後診断用組成物の上記の形態のすべてに関する別の実施形態では、遺伝子発現プロファイルは、一実施形態において、表II、表III、表IV、または表IXの情報提供性遺伝子の少なくとも最初15個を含
み得る。診断用/予後診断用組成物の上記の形態のすべてに関する別の実施形態では、遺伝子発現プロファイルは、表II、表III、表IV、または表IXの情報提供性遺伝子を50個以上含み得る。診断用/予後診断用組成物の上記の形態のすべてに関する別の実施形態では、遺伝子発現プロファイルは、表II、表III、表IV、または表IXの情報提供性遺伝子を20個以上含み得る。診断用/予後診断用組成物の上記の形態のすべてに関する別の実施形態では、遺伝子発現プロファイルは、表II、表III、表IV、または表IXの情報提供性遺伝子を30個以上含み得る。診断用/予後診断用組成物の上記の形態のすべてに関する別の実施形態では、遺伝子発現プロファイルは、表II、表III、表IV、または表IXの情報提供性遺伝子を40個以上含み得る。診断用/予後診断用組成物の上記の形態のすべてに関する別の実施形態では、遺伝子発現プロファイルは、表II、表III、表IV、または表IXの情報提供性遺伝子を50個以上含み得る。診断用/予後診断用組成物の上記の形態のすべてに関する別の実施形態では、遺伝子発現プロファイルは、表IVの情報提供性遺伝子を60個以上含み得る。診断用/予後診断用組成物の上記の形態のすべてに関する別の実施形態では、遺伝子発現プロファイルは、表IVの情報提供性遺伝子を70個以上含み得る。診断用/予後診断用組成物の上記の形態のすべてに関する別の実施形態では、遺伝子発現プロファイルは、表IVの情報提供性遺伝子を80個以上含み得る。診断用/予後診断用組成物の上記の形態のすべてに関する別の実施形態では、遺伝子発現プロファイルは、表IVの情報提供性遺伝子を90個以上含み得る。診断用/予後診断用組成物の上記の形態のすべてに関する別の実施形態では、遺伝子発現プロファイルは、表IVの情報提供性遺伝子を100個すべて含み得る。
これらの組成物を使用して、I期またはII期のNSCLCなどの肺癌を診断し得る。さらにこれらの組成物は、病因不明の肺結節を有する対象における補足的または元の診断を提供するのに有用である。
IV.本発明の診断方法
上記の組成物はすべて、対象における病態の血液ベースの非侵襲的評価を可能にする様々な診断ツールを提供する。胸部X線またはCTスキャンなどの他のスクリーニング検査と組み合わせてもよい、診断検査におけるこれらの組成物の使用は、診断精度を高め、かつ/または追加検査を導く。
よって、一態様では、哺乳動物対象における肺癌を診断するための方法が提供される。この方法は、哺乳動物、好ましくはヒト対象の血液中の遺伝子発現プロファイルを特定することを伴う。一実施形態では、遺伝子発現プロファイルは、肺癌における発現が増加または減少した7、8、15、41、50個以上の情報提供性遺伝子の7、8、15、41、50個以上の遺伝子発現産物を含む。遺伝子発現プロファイルは、表I、表II、表III、表IV、または表IXの遺伝子から選択される7、8、15、41、50個以上の情報提供性遺伝子の選択によって形成される。別の実施形態では、遺伝子発現プロファイルは、肺癌における発現が増加または減少した7個以上の情報提供性遺伝子の7個以上の遺伝子発現産物を含む。遺伝子発現プロファイルは、表I、表II、表III、表IV、または表IXの遺伝子からの7個以上の情報提供性遺伝子の選択によって形成される。一実施形態では、遺伝子は、表IVの最初の7個の遺伝子である。別の実施形態では、遺伝子は、表IVの最初の15個の遺伝子である。別の実施形態では、遺伝子は、表IVの最初の50個の遺伝子である。別の実施形態では、遺伝子発現プロファイルは、表II、表III、表IV、または表IXの遺伝子からの15個以上の情報提供性遺伝子の選択によって形成される。対象の遺伝子発現プロファイルを参照遺伝子発現プロファイルと比較することで、肺癌(例えば、NSCLC)と相関する情報提供性遺伝子の発現における変化が特定できる。この方法は、上記の組成物のうちのいずれかを使用して行われ得る。一実施形態では、本方法により、良性結節から癌性腫瘍を見分ける診断が可能となる。
別の態様では、対象における肺癌を診断するための本明細書に記載される組成物のいず
れかの使用が提供される。
本明細書に記載の診断組成物および方法は、現在の診断方法と比べて様々な利点を提供する。そのような利点の中には、以下のものがある。本明細書に例示されるように、癌性腫瘍を有する対象が良性結節を有する対象と区別される。これらの方法および組成物は、小さな結節を有して肺クリニックを訪れる患者が悪性疾患を有するかどうかの、実用的な診断問題に対する解決策を提供する。中リスクの結節を有する患者は、非常に低い可能性が非常に低い疾患リスクカテゴリーまたは可能性が非常に高い疾患リスクカテゴリーのいずれかに患者を移す非侵襲的検査から明らかに恩恵を受けるであろう。ゲノムプロファイルに基づいた正確な悪性度の推定(すなわち、所与の患者は癌を有する確率が90%であるという推定、これに対して、患者は癌を有する確率が5%のみであるという推定)は、良性疾患の手術の減少、治癒可能なステージでの早期腫瘍の除去、経過観察のCTスキャンの減少、および結節の心配に対する深刻な心理的負担の削減につながる。肺癌のCTスクリーニングに関連する追加の健康管理の現在の推定コスト、すなわち、得られた質調整生存年につき116,000ドルを削減するなど、経済的影響も大きい可能性がある。十分な感度および特異性を有する非侵襲的な血液ゲノミクス試験は、悪性腫瘍の検査後の確率、したがって、その後の臨床的ケアを大きく改変するであろう。
既存の方法と比べたこれらの方法の望ましい利点は、それらが低侵襲処置から、すなわち、血液試料を採取することによって、病態を特徴付けることができることである。対照的に、遺伝子発現プロファイルからの癌腫瘍の分類のための慣例は、組織試料、通常は腫瘍由来の試料に依存する。非常に小さな腫瘍の場合、生検は問題があり、明らかに、腫瘍が分かっていないまたは目に見えない場合、生検からの試料は不可能である。腫瘍試料が分析される場合のように、腫瘍の精製は必要とされない。最近公開された方法は、気管支鏡検査中に、肺由来の上皮細胞の擦過に依存し、これは血液試料の採取よりもかなり侵襲的である。血液試料は、後の分析のために材料が容易に調製され安定化されるというさらなる利点を有し、これは、メッセンジャーRNAが分析される場合に重要である。
本明細書に記載の7、8、15、41、50、および100個の遺伝子分類子は、発明者らによって以前に報告された559個のマーカー分類子と同様に働いた。以下の実施例および表VIIを参照されたい。例えば、表IVの最初の50個の遺伝子からなる分類子は、559個の遺伝子からなる分類子と同様に働いた。これらの組成物および方法により、肺癌のより正確な診断および治療が可能となる。このため、一実施形態では、記載される方法は、肺癌の治療を含む。治療は、腫瘍成長の除去、化学療法、および/または当技術分野で既知であるか、もしくは本明細書に記載される他の治療であってもよい。
一実施形態では、哺乳動物対象における肺癌の存在を診断または肺癌を評価するための方法が提供され、本方法は、該対象の試料中の7個、8個、15個、41個、50個以上の遺伝子の発現の変化を特定することを含み、該遺伝子は、表I、表II、表III、表IV、または表IXの遺伝子から選択される。対象の遺伝子発現レベルは、参照または対照における同じ遺伝子のレベルと比較され、対象の遺伝子の発現の、参照の発現からの変化は、肺癌の診断または評価と相関する。
一実施形態では、診断または評価は、肺癌の診断、良性結節の診断、肺癌の病期の診断、肺癌の種類もしくは分類の診断、肺癌の可能性のある再発の診断もしくは検出、肺癌の退行の診断もしくは検出、肺癌の予後、外科的もしくは非外科的療法に対する肺癌の応答の評価のうちの1つ以上を含む。
別の実施形態では、変化は、該参照もしくは対照と比較した1つ以上の選択された遺伝子の上方調節、または該参照または対照と比較した1つ以上の選択された遺伝子の下方調節を含む。
別の実施形態では、参照または対照は、少なくとも1つの参照対象の表I試料の3個以上の遺伝子を含む。参照対象は、(a)悪性疾患を有する喫煙者、(b)非悪性疾患を有する喫煙者、(c)非悪性疾患を有する元喫煙者、(d)疾患を有しない健康な非喫煙者、(e)慢性閉塞性肺疾患(COPD)を有する非喫煙者、(f)COPDを有する元喫煙者、(g)固形肺腫瘍を、それを除去するための手術前に有する対象、(h)固形肺腫瘍を、腫瘍を外科的に除去した後に有する対象、(i)固形肺腫瘍を、それに対する治療前に有する対象、および(j)固形肺腫瘍を、それに対する治療中または治療後に有する対象からなる群から選択されてもよい。一実施形態では、参照または対照対象(a)〜(j)は、時間的に早い時点の同じ試験対象である。
試料は、本明細書に記載されるものから選択される。一実施形態では、試料は末梢血である。試料中の核酸は、いくつかの実施形態では、遺伝子発現レベルの変化を特定する前に安定化されている。そのような安定化は、例えば、本明細書に記載されるPax Gene系を使用して達成されてもよい。
一実施形態では、患者における肺癌を検出する方法は、
a.患者から試料を得ることと、
b.試料を、表I、表II、表III、表IV、または表IXの少なくとも7個の遺伝子の各異なる遺伝子転写産物または発現産物に特異的なオリゴヌクレオチド、ポリヌクレオチド、またはリガンドを含む組成物と接触させることによって、対照と比較して、患者試料中の表I、表II、表III、表IV、または表IXから選択される少なくとも7個の遺伝子における発現の変化を検出し、オリゴヌクレオチド、ポリヌクレオチド、またはリガンドと遺伝子産物または発現産物との間の結合を検出することと、を含む。
別の実施形態では、対象における肺癌を診断する方法は、
a.対象から血液試料を得ることと、
b.試料を、表I、表II、表III、表IV、または表IXの少なくとも7個の遺伝子の各異なる遺伝子転写産物または発現産物に特異的なオリゴヌクレオチド、ポリヌクレオチド、またはリガンドを含む組成物と接触させることによって、対照と比較して、患者試料中の表I、表II、表III、表IV、または表IXから選択される少なくとも7個の遺伝子における発現の変化を検出し、オリゴヌクレオチド、ポリヌクレオチド、またはリガンドと遺伝子産物または発現産物との間の結合を検出することと、
c.対象の遺伝子の発現において参照のものからの変化が検出される場合に、対象を癌と診断することと、を含む。
さらに別の実施形態では、本方法は、
a.対象から血液試料を得ることと、
b.試料を、表I、表II、表III、表IV、または表IXの少なくとも7個の遺伝子の各異なる遺伝子転写産物または発現産物に特異的なオリゴヌクレオチド、ポリヌクレオチド、またはリガンドを含む組成物と接触させることによって、対照と比較して、患者試料中の表I、表II、表III、表IV、または表IXから選択される少なくとも7個の遺伝子における発現の変化を検出し、オリゴヌクレオチド、ポリヌクレオチド、またはリガンドと遺伝子産物または発現産物との間の結合を検出することと、
c.対象の遺伝子の発現において参照のものからの変化が検出される場合に、対象を癌と診断することと、
d.腫瘍成長を除去することと、を含む。
V実施例
ここで、以下の実施例を参照して本発明を説明する。これらの実施例は例示のみを目的
として提供され、本発明はこれらの実施例に限定されると決して解釈されるべきではなく、本明細書に提供される教示の結果として明らかになる任意のおよびすべての変形例を包含すると解釈されるべきである。
実施例1:患者集団−分析A
本明細書に記載される遺伝子分類子の開発のために、血液試料および臨床情報を様々な対象から収集した。以下の表で特定するように、数名は肺癌の診断を有し、数名は良性結節の診断を有した。患者の特徴を以下の表VIに示す。
良性肺または悪性肺のいずれかと診断された患者を5つの病院から募集した:Christiana Care Health System、New York University Langone Medical Center、The Hospital of the University of Pennsylvania、Roswell Park、およびTemple University Hospital。対象を、LDCTまたは胸部x線によって肺癌の存在について評価、または偶発的に肺結節と診断した。高リスク個体の試験集団は、年齢が50歳超、喫煙年数が20年超であった。
「対照」コホートは、良性肺結節(例えば、すりガラス陰影、単一結節、肉芽腫、または過誤腫)を有する患者から得た。これらの患者に、肺疾患クリニックで評価を受けさせるか、または肺結節の胸部手術を施した。すべての試料を手術前に採取し、生検、気管支鏡検査、または結節は、少なくとも2年間の画像診断フォローアップの後で検出可能なサイズの変化がない場合に非癌と分類した。
以下で述べるように、T1は、NanoString Platformのための遺伝子を選択するためにマイクロアレイ上で実行された試料であり、VIは、NanoString紙で使用されるNYU試料検証セットであり、SIは、遺伝子を選択するためにマイクロアレイで使用されない「クリーンな」試料のフルセットである(V1を含む)。
実施例2:試料収集プロトコルおよび処理
組織採取技術者がクリニックで血液試料を採取した。標準的な静脈切除技術により、血液試料をPAXgene Blood RNA試験管に直接採取した。これらの試験管には、直ちに細胞内RNAを安定させ、RNA転写産物の体外分解または上方調節を最小限に抑える独自の試薬が含まれる。冷凍を排除し、試料をまとめ、収集後の試料処理の緊急性を最小限に抑えることができることにより、研究室効率が大幅に高まり、コストが削減される。
実施例3−RNA精製および品質評価
PAXgene RNAは、mRNAおよびmiRNAの精製を可能にするQiagen(商標)製の標準的な市販キットを使用して調製する。得られた総RNAをmRNAプロファイリングに使用する。Bioanalyzerを使用して、RNAの品質を決定する。RNA完全性数が3を超える試料のみをnCounter上で使用した。
簡潔に述べると、RNAは以下のように単離する。シェーカーインキュベーターをオンにし、55℃に設定してから開始する。別途記載がない限り、遠心分離ステップを含む本
プロトコルのすべてのステップは、室温(15〜25℃)で行うこと。本プロトコルは、試料が−80℃で保存されていることを想定する。Qiagenプロトコルに従い最低2時間室温に置いた未凍結試料を同じように処理すること。
プラスチックラック中、Paxgene管を直立させて解凍する。試験管を少なくとも10回を反転させて混合した後、単離を開始する。すべての必要な試験管を準備する。各試料には以下のものが必要である。番号をふった1.5mlエッペンドルフ型試験管2つ、試料情報付きのエッペンドルフ試験管1つ(これは最終試験管である)、Lilac Paxgeneスピンカラム1つ、Red Paxgeneスピンカラム1つ、および処理試験管5つ。
Qiagen遠心分離器中のスイングアウトローターを使用して、PAXgene Blood RNA Tubeを5000×gで10分間遠心分離する。(Sigma4〜15℃遠心分離器、ローター:Sigma Nr.11140、7/01、5500/分、ホルダー:Sigma 13115、286g 14/D、内部試験管ホルダー:18010、125g)。注記:解凍後、血液細胞の完全な溶解を達成するために、血液試料がPAXgene Blood RNA Tube内で室温(15〜25℃)で最低2時間インキュベートされていることを確認する。
フード下で上清を漂白剤にデカントして除去する。上清をデカントしたら、ペレットを乱さないように注意し、試験管の縁を清潔なペーパータオルで乾燥させる。凝固血液を、袋に入れた後、感染性廃棄物に入れて、デカントした上清を廃棄し、流体部分を流しに捨て、大量の水で洗い流す。ペレットに4mlのRNaseを含まない水を加え、新しい第2のHemogard閉鎖具を使用して試験管を閉じる。
ペレットが目に見えて溶解するまでボルテックスする。再度、遠心分離ホルダー内で試験管を計量して、平衡であることを確認し、スイングアウトローターQiagen遠心分離器を使用して5000×gで10分間遠心分離する。ボルテックス後、遠心分離前に上清に残っている小さな残屑は、手順に影響しない。
上清全体を除去して廃棄する。試験管を逆さまにして1分間放置し、すべての上清を流出させる。上清の除去が不完全であると、溶解が妨げられ、溶解物が希釈されるため、RNAをPAXgene膜に結合させるための条件に影響が出る。
350μLの緩衝液BM1を加え、上下にピペットし、ペレットを溶解させる。
再懸濁した試料を、ラベル付けした1.5mlマイクロ遠心分離管にピペットする。300μlの緩衝液BM2を加える。その後、40μlのプロテイナーゼKを加える。5秒間ボルテックスして混合し、エッペンドルフサーモミキサー上、800rpm、最大速度でシェーカーインキュベーターを使用して、55℃で10分間インキュベートする。(サーモミキサーの代わりに振動水浴を使用する場合は、試料をインキュベーション中2〜3分おきに素早くボルテックスする。ボルテックス器をインキュベーターの横に置いておく)。
溶解物を2ml処理試験管内に置いたPAXgene Shredderスピンカラム(ライラック試験管)に直接ピペットし、TOMY Microtwin遠心分離器中、18,500xg、24℃で、3分間遠心分離する。溶解物を慎重にスピンカラムにピペットし、溶解物が完全にスピンカラムに移されていることを目視確認する。カラムおよび試験管の損傷を防ぐため、20,000×gを超えないこと。
流入部分の上清全体を、処理試験管内のペレットを乱すことなく、新たな1.5mlマイクロ遠心分離管に慎重に移す。処理試験管内のペレットを廃棄する。
700μLのイソプロパノール(100%)を上清に加える。ボルテックスにより混合する。
690μlの試料を、2ml処理試験管内に置いたPAXgene RNAスピンカラム(赤色)にピペットし、10,000xgで1分間遠心分離する。スピンカラムを新たな2ml処理試験管内に置き、素通り分を含む古い処理試験管を廃棄する。
残りの試料をPAXgene RNAスピンカラム(赤色)にピペットし、18,500xgで1分間遠心分離する。スピンカラムを新たな2ml処理試験管内に置き、素通り分を含む古い処理試験管を廃棄する。試料を慎重にスピンカラムにピペットし、試料が完全にスピンカラムに移されていることを目視確認する。
350μlの緩衝液BM3をPAXgene RNAスピンカラムにピペットする。10,000xgで15秒間遠心分離する。スピンカラムを新たな2ml処理試験管内に置き、素通り分を含む古い処理試験管を廃棄する。
ステップ13のためにDNase Iインキュベーションミックスを調製する。10μlのDNase Iストック溶液を、1.5mlマイクロ遠心分離管内の70μlの緩衝液RDDに加える。試験管を軽く振ることによって混合し、手短に遠心分離して、試験管の横から残留液を収集する。
DNase Iインキュベーションミックス(80μl)をPAXgene RNAスピンカラム膜に直接ピペットし、15分間ベンチトップ(20〜30℃)に置く。DNase Iインキュベーションミックスが膜に直接置かれていることを確認する。ミックスの一部がスピンカラムの壁またはOリングに塗布されるかまたはその上に残っていると、DNaseの消化は不完全となる。
350μlの緩衝液BM3をPAXgene RNAスピンカラムにピペットし、18,500xgで15秒間遠心分離する。スピンカラムを新たな2ml処理試験管内に置き、素通り分を含む古い処理試験管を廃棄する。
500μlの緩衝液BM4をPAXgene RNAスピンカラムにピペットし、10,000xgで15秒間遠心分離する。スピンカラムを新たな2ml処理試験管内に置き、素通り分を含む古い処理試験管を廃棄する。
別の500μlの緩衝液BM4をPAXgene RNAスピンカラムに加える。18,500xgで2分間遠心分離する。
素通り分を含む試験管を廃棄し、PAXgene RNAスピンカラムを新たな2ml処理試験管内に置く。18,500×gで1分間遠心分離する。
素通り分を含む試験管を廃棄する。PAXgene RNAスピンカラムを、ラベル付けした1.5mlマイクロ遠心分離管(最終試験管)内に置き、40μlの緩衝液BR5をPAXgene RNAスピンカラム膜に直接ピペットする。10,000xgで1分間遠心分離して、RNAを溶出させる。最大限の溶出効率を達成するために、膜全体を緩衝液BR5で湿潤することが重要である。
40μLの緩衝液BR5および同じマイクロ遠心分離管を使用して、記載のように溶出ステップを繰り返す。20,000×gで1分間遠心分離して、RNAを溶出させる。
溶出物を、シェーカーインキュベーター内で、65℃で5分間、振らずにインキュベートする。インキュベーション後、直ちに氷上で冷やす。この65℃でのインキュベーションにより、下流用途のためにRNAを変性させる。インキュベーター時間または温度を超えないこと。
RNA試料を直ちに使用しない場合は、−20℃または−70℃で保管する。RNAは繰り返し凍結および解凍すると変性したままとなるため、65℃でのインキュベーションを繰り返す必要はない。
実施例4:RNAレベルの測定
肺癌を診断するために臨床診療で使用され得るバイオマーカーシグネチャーを提供するため、表Iで特定される遺伝子の8個以上、および表II、表III、表IV、または表IXで特定される遺伝子の15個以上、または表IVで特定される7個以上の遺伝子を使用することにより、満足できる精度を維持する遺伝子の数が最も少ない遺伝子発現プロファイルが提供される。これらの遺伝子プロファイルまたはシグネチャーにより、標準的な臨床検査室で使用するのが簡単である、より単純で実用的な検査が可能となる。差別的遺伝子の数が十分に少ないので、これらの遺伝子発現プロファイルを使用して、NanoString nCounter(登録商標)プラットフォームが開発される。
A.NANOSTRING NCOUNTER(登録商標)プラットフォーム遺伝子発現アッセイのプロトコル
上記のように、Paxgene Blood miRNAキットを使用して、全血から全RNAを単離し、RNA品質について試料を検査した。RNA Nanoチップ上のAgilent 2100 Bioanalyzerを用いて、試料の完全性を確認する指標として、RINスコアおよびエレクトロフェログラム画像を使用して、試料を分析した。また、Nanodrop(ND−1000分光光度計)で試料を定量すると、260/280および260/230の測定値が記録され、これをNanostring適合性について評価した。Nanodropにより得られた濃度から、ヌクレアーゼを含まない水を希釈剤として、Nanostringが提供するチューブストリップに5μL中100ngを含むように、全RNA試料を正規化した。Nanostring nCounter Reporter CodeSetとハイブリダイゼーション緩衝液との混合物の8μLのアリコート(70μLのハイブリダイゼーション緩衝液、12アッセイあたり42μLのReporter CodeSet)、および2μLのCapture ProbeSetを、各5μLのRNA試料に加えた。サーモサイクラー(Eppendorf)中で、試料を65℃で19時間ハイブリダイズさせた。ハイブリダイゼーションの間、ユーザーにとって関心のある各mRNAに特異的な蛍光バーコードを有するレポータープローブ、およびビオチン化捕捉プローブは、それらの関連する標的mRNAに結合して、標的−プローブ複合体を創出する。ハイブリダイゼーションが完了した後、続いて、試料を標準プロトコル設定(実行時間:2時間35分)を使用して、処理のためにnCounter Prep Stationに移した。Prep Stationロボットは、標準プロトコルの間に、試料を洗浄して、過剰なレポーターおよび捕捉プローブを除去する。試料をストレプトアビジンでコーティングしたカートリッジに移動させ、ここで、nCounter Digital Analyzerによるイメージングの準備のために、精製された標的−プローブ複合体を固定した。完了時、カートリッジを密封し、555で視野(FOV)設定を使用して、Digital Analyzerに置いた。蛍光顕微鏡は、標的mRNAに関連する各固有のバーコードの粗数を集計した。収集したデータは、.csvファイルに保存し、製造業者の説明書にしたがって、分析のためにバイオインフ
ォマティクス施設に転送した。
実施例5:バイオマーカーの選択
Support Vector Machine(SVM)は、遺伝子機能の発見および分類のための遺伝子発現データセットに適用され得る。SVMは、より密接に関連する症例とそのマージンに存在する対照とを区別するのに最も効率的であることが判明している。主に、SVM−RFE(48、54)を使用して、臨床的に定義されたクラスの患者を、臨床的に定義されたクラスの対照(喫煙者、非喫煙者、COPD、肉芽腫など)と区別する遺伝子発現分類子を開発した。SVM−RFEは、再帰的に、分析される2つのクラスの間の識別に貢献することに基づいて、遺伝子を除去する当該分野で利用されるSVMベースのモデルである。係数加重による最も低い得点の遺伝子を除去し、残りの遺伝子を再度採点し、少数の遺伝子のみが残るまで手順を繰り返した。この方法は、分類および遺伝子選択の作業を行うために、いくつかの研究で使用されてきた。しかしながら、アルゴリズムパラメータ(ペナルティパラメータ、カーネル関数など)の適切な値を選択することは、多くの場合、性能に影響し得る。
SVM−RCEは、SVM−RFEのように、分類子への遺伝子の相対寄与を評価するという点で、関係のあるSVMベースのモデルである。SVM−RCEは、個々の遺伝子の代わりに、相関遺伝子のグループの寄与を評価する。加えて、両方法ともに、各ステップで最も重要でない遺伝子を除去するが、SVM−RCEは、遺伝子クラスターを採点して除去し、一方、SVM−RFEは、アルゴリズムの各ラウンドで単一または少数の遺伝子を採点して除去する。
ここでは、SVM−RCE法について簡単に説明する。低発現遺伝子(平均発現は、2倍未満のバックグラウンド)を除去し、分位正規化を実施し、次いで、発現値の中央値がデータセットの中央値から3シグマ超異なる「外れ値」アレイを除去した。残りの試料は、アルゴリズムの10倍相互検証の10回の反復を使用するSVM−RCEに供した。遺伝子は、t検定(訓練セットに適用)により、最終的な結果において、最高精度を生じる実験的に決定された最適値まで減少させた。これらの開始遺伝子は、K平均により、平均サイズが3〜5遺伝子である相関遺伝子のクラスターにクラスター化した。3倍の再サンプリングを5回繰り返して、各クラスターにSVM分類採点を行い、得点が最低であったクラスターを排除した。試料の残された10%(試験セット)を使用して、生存している遺伝子プールについて精度を決定し、上位得点の100個の遺伝子を記録した。この手順をクラスター化ステップから2クラスターの終点まで繰り返した。最適遺伝子パネルは、最も頻繁に選択された遺伝子から始まる、最大精度を付与する遺伝子の最小数であるように取った。このパネル内の個々の遺伝子のアイデンティティが決まっていないのは、順序が、所与の遺伝子が上位100個の情報提供性遺伝子の中で選択された回数を反映しており、この順序はある程度の変動を受けるからである。
A.バイオマーカーの選択
良性結節から癌性腫瘍を識別する際に得点が最も高い(SVMによる)遺伝子を、臨床検査に対するそれらの有用性について試験した。考慮される要因には、クラス間の発現レベルのより高い差異、およびクラス内の低い変動性が含まれる。検証のためにバイオマーカーを選択するときには、相関遺伝子の選択を回避し、PCRおよび/または免疫組織化学を含む代替技術によって、堅牢な差次的発現レベルを有する遺伝子を特定するために、異なる発現プロファイルを有する遺伝子を選択する努力がなされた。
B.検証
3つの検証方法を検討した。
相互検証:データセット内のオーバーフィットを最小限に抑えるために、データセットをK個のパートにランダムに分割し、K−1個のパートを訓練用に、1個を試験用に使用する場合、K倍の相互検証(通常Kは10に等しい)を使用した。このため、K=10の場合、アルゴリズムを、患者の90%および対照の90%のランダム選択で訓練し、次いで、残りの10%で試験した。これを、すべての試料が試験対象として用いられ、累積された分類子がすべての試料を使用するまで繰り返したが、いずれの試料も、それが一部である訓練セットを使用しては試験しなかった。ランダム化の影響を軽減するために、K倍分離をM回行って、毎回K倍の各々において患者と対照との異なる組み合わせを生成した。したがって、個々のデータセットについて、訓練セットおよび試験セットの順列選択のM*Kラウンドを、遺伝子の各セットについて使用した。
独立した検証:データの再現性および分類子の一般性を推定するには、1つのデータセットを使用して構築された分類子を調べ、別のデータセットを使用して試験して、分類子の性能を推定する必要がある。性能を推定するために、元のデータセットで開発した分類子を使用して、第2のセットの検証を実行した。
さらなる検証:このようにして開発された分類子の一般性を試験するために、これを、分類子の開発に使用されなかった独立した試料セットを分類するために使用した。順列分類子と元の分類子との相互検証精度を独立した試験セットで比較し、新しい試料の分類におけるその妥当性を確認した。
C.分類子の性能
各分類子の性能を異なる方法によって推定し、いくつかの性能測定値を使用して、分類子を互いに比較した。これらの測定値には、精度、ROC曲線下面積、感度、特異性、真陽性率、および真陰性率が含まれる。目的の分類の必要な特性に基づいて、異なる性能測定値を使用して、最適な分類子を選択することができ、例えば、集団全体のスクリーニングで使用する分類子は、疾患のわずかな(約1%)有病率を補い、したがって多数の偽陽性ヒットを回避するために、より良い特異性を必要とする一方で、入院中の患者の診断分類子はより感度が高くあるべきである。
良性結節から癌性腫瘍を診断するには、患者が既に高リスクであるため、特異性より感度が高いことが望ましい。
実施例6:分類子の試験
末梢血液試料をすべてPAXgene RNA安定化試験管に採取し、RNAを製造業者に従って抽出した。試料を559個のプローブのカスタムパネル(表V)に対してNanostring nCounter(商標)で試験した(上記のとおり)。
559個の分類子について、432個は以前のマイクロアレイデータに基づいて選択し、107個のプローブはNanostring試験から選択し、20個はハウスキーピング遺伝子であった。QCについては、Universal RNA standard(Agilent)を、試験した36個の試料の各バッチに含めた。プローブ発現値を、20個のハウスキーピング遺伝子、ならびにNanostring(分類子に含まれる)によって供給されるスパイクイン陽性対照および陰性対照を使用して正規化した。Zscores were calculated for probe count values and served as the input to a Support Vector Machine (SVM)
classifier using a polynomial kernel.分類性能を、試料の10倍の相互検証によって評価した。
A.分類子
以下の表VIIおよび図1A〜IBに示されるように、すべての試料上の開発された559の分類子が、訓練セット(図1A)で0.86、試験セット(図IB)で0.85のROC−AUCを示した。90%に設定した感度では、特異性は、それぞれ、62.9%および55.1%である。
訓練セット試料および試験セット試料からのデータを、パネル全体で達成された性能を維持するために必要な最小数のプローブを特定するために、Nanostringプラットフォーム上でW559によって分析した。前述のように、プローブ選択にはSVM−RFEを使用した。以下の表VIIに示すように、試料を訓練セットおよび試験セットのためにランダムに選択した。試験セットで得られた精度を図IBに示す。分類子のROC曲線を図2に示す。
表IVの最初の100個の遺伝子について、感度90%で、訓練セットでは約63%、検証セットでは約58%の特異性が示された。
表IVの最初の50個の遺伝子について、感度90%で、訓練セットでは約58%、検証セットでは約56%の特異性が示された。表IVの最初の15個の遺伝子について、感度90%で、訓練セットでは約51%、検証セットでは約46%の特異性が示された。表IVの最初の7個の遺伝子について、感度90%で、訓練セットでは約67%、検証セットでは約46%の特異性が示された。
B.さらなる分析
さらなる分析を行い、表I、II、およびIIIの遺伝子分類子を開発した。
実施例7:15マーカーパネル
肺癌は、依然として世界中で癌に関連した死亡の主因であり、これは、一部には十分な早期発見プロトコルが不足しているため、一部には一般的な早期症状が無視されやすいた
めである。低線量コンピュータ断層撮影(LDCT)による肺癌スクリーニングが、高リスクの現喫煙者および元喫煙者(50歳超、箱年30超)の死亡率を低減することができるという実証(1、2)により、LDCT肺スクリーニングが顕著に増加している。LDCTは従来のX線よりも著しく小さい結節を特定することができるが、この能力は、比率の小さい悪性の結節を比率の大きい良性の結節から区別するという後続の課題を伴う(3)。NLSTは、患者56の40%において直径4mm以上の肺結節を検出し、陽性スキャンの96.4%が偽陽性でスクリーニングした(4)。これは、4〜20mmの範囲の不定肺結節(IPN)のクラスにとって特に問題である(4)。
ますます多くのLDCTスキャンによって検出されるIPNSは臨床的ジレンマを表すが、それらはまた、増殖の最初期段階で肺癌を発見し得る機会を提供する。発明者らによる以前の研究において、急速に精製された(2時間以内)PBMCは、高精度で良性肺結節を悪性肺結節から正確に区別することができる遺伝子発現データを含んでいることが実証された(ROC−AUC0.86)(5)。発明者らは、PAXgene血液RNA安定化チューブにより、試料収集時にRNAプロファイルが捕捉されて、多くの異なる臨床環境で試料を収集できる可能性が提供されることをここに報告する。PAXgene RNAは室温で5〜7日間安定であり、これにより、多くの他の日常的血液検査と同様に、中央検査施設に移すことができる(6〜8)。RNAが−20℃〜−80℃で7年超の間安定であることは、大型研究にとってさらなる利点である。この収集および安定化の容易さには、全血RNAが、PBMC試料に含まれない顆粒球および好中球を含むより広範な種類の血液細胞からの情報を含むこと、ならびに結果として、正確な遺伝子発現シグネチャーを識別することがより複雑であり得るという注意が伴う。この研究の主な目的は、(i)全血由来のPAXgene安定化RNAが、LDCTによって検出された悪性肺結節と良性肺結節とを正確に区別することができる遺伝子発現情報を取り出すことに成功することができるかどうかを実証すること、および(ii)全転写産物Illuminaマイクロアレイ上で開発された診断シグネチャーが、Prosigna(商標)Breast Cancer予後アッセイのためにFDAが承認したより堅牢で臨床的に確立されたNanoString nCounterプラットフォームに移行することができるかどうかを判定することであった(9)。
発明者らは、独立した検証において0.847のROC−AUCでIllumina全ゲノムマイクロアレイに基づく肺結節分類子(LNC)の開発に成功したことをここに報告する。発明者らはさらに、そのマイクロアレイ分類子を、独立した検証において0.846の実証ROC−AUCで、NanoString nCounter(商標)プラットフォームに移行させることに成功したことを記載する。このnLNCは、現在のIPNジレンマに対処する可能性、および肺癌過剰治療に対する可能性を有する。
全血遺伝子発現は悪性肺結節をLDCTによって検出された良性肺結節から区別する。
血液試料は、5つの臨床施設において、RNA安定化PAXgeneチューブに前向きに採取した。試料は、全員肺結節がLDCTまたはX線によって検出されている、肺癌のリスクが高い患者(50歳超、箱年20超)から得られた。結節を、気管支鏡検査、生検、および/もしくは肺切除によって、または少なくとも2年間のLDCTフォローアップによって、悪性(MN)または良性(BN)として確認した。精製されたPAXgene試料RNA(方法を参照)をIllumina H12v4マイクロアレイ上でアッセイし、PBMCからのRNAを使用して達成したものと同様の精度で、肺結節分類子を開発するためにPAXgene RNAを使用することの実現可能性を評価した(5)。マイクロアレイ試験に使用した患者の人口統計を表VIIIに示す。試験患者は、主に、喫煙歴が箱年20超である50歳超の喫煙者および元喫煙者である。モデルを開発するために使用した癌は早期であり、試験集団の84%がI期およびII期の癌、検証セットの癌の100%がI期である。データを、前述のようにSVM−RFEを使用して分析した(5、10)。
悪性および良性肺結節を最も正確に区別した遺伝子プローブ分類子を特定し、10倍の10再サンプリング相互検証SVM−RFE法を使用して、漸減する遺伝子プローブの数による分類性能の変化を評価するために、264個の試料の訓練セット(表VIII)を分析した(5、10)。分類の精度は広範囲のプローブ数にわたって安定していたが、ROC曲線下面積(AUC)は、プローブを排除するにつれてわずかに減少した。1000個のプローブを使用すると、0.88のAUCが達成され、150個では、0.85のAUCが生成された。わずか15個の遺伝子であっても、0.8超のAUCで訓練セットを分類するのに十分であった。1000個の遺伝子によって達成されたAUCの1%以内にAUCを維持する最小数の遺伝子プローブを選択し、0.866のAUCを生成した311個の遺伝子プローブの分類子を特定した(データ図示せず)。この性能は、分類子を独立した患者検証セットに適用したときに維持され(表VIII列右)、0.847のAUCを達成して(データは図示せず)、肺癌の存在に関連する堅牢なシグナルが、発明者らの以前に公開したPBMC結果と同様の全体的な性能で、PAXgene RNAにおいて検出され得ることが確認された。
PAXgene試料からのRNAが、高い精度で、イメージングによって検出された悪性肺結節と良性肺結節とを区別できることを検証した後、発明者らは、マイクロアレイに
基づくLNCを臨床的により適切なNanoString nCounterプラットフォームに移行させる戦略を開発した(9)。
NanoStringプラットフォームへの移行
NanoString診断遺伝子発現パネルに対するプローブを選択するために、いくつかの検討事項を考慮した。NanoString遺伝子発現測定値がIlluminaマイクロアレイプラットフォームの性能をどの程度再現するか分からないまま、プラットフォームの違いを克服することができるように十分な冗長性を含むように独自のカスタムパネルを設計し、異なる基準によって選択された遺伝子プローブを含めた。選択に使用した主な方法はSVM−RFEであった。SVMは分類モデルを開発するための強力なツールであるが、マイクロアレイ上で良好に性能を発揮するいくつかのプローブがNanoStringプラットフォーム上では同等の性能を発揮しない可能性を考慮した。発明者らの関係のある遺伝子のプールを増大させるために、比較全体でp値が最小(p<10−4)の59個のプローブ、および分類においてp<0.01で倍数変化が最大である76個のプローブも選択した。また、マイクロアレイのバックグラウンドの5倍超で発現した候補のハウスキーピング遺伝子を特定し、絶対値では変動係数が20%未満、対数2スケールの発現値では2.5%未満であった。上位12個の最小可変候補および8個の追加の既知のNanoStringハウスキーピング遺伝子を、20個のハウスキーピング遺伝子の最終リストに選択した。
マイクロアレイとNanoStringプラットフォームとの間の大きな違いの1つは、NanoString上の遺伝子発現を評価するために酵素処理を必要としないことである。これは、逆転写、および遺伝子標的のPCR増幅が分析に関連しないことを意味する。この試料処理の最小化により、増幅バイアスの可能性が排除され、プラットフォームが臨床用途に魅力的となるが、選択されたバイオマーカーのいくつかは、PCR増幅なしで検出するには低すぎるレベルで発現される可能性がある。この問題に対処するために、発明者らは、NanoString PanCancer Immuneパネル(カタログ番号XT−CSO−HIP1−12)上のIlluminaマイクロアレイ訓練セットからの試料の大部分を分析して、各プラットフォームによって検出され得る遺伝子発現のレベルを相関させた。115個のMN試料および105個のBN試料を含む220個の訓練試料を分析した。NanoString PanCancer Immuneパネルに示された770個の遺伝子のうち755個がマイクロアレイプラットフォームにも示されたが、遺伝子プローブは異なった。2つのプラットフォーム間で厳密なプローブは異なったが、この分析により、両方のプラットフォームで堅牢に検出することができる遺伝子発現レベルの推定が提供された。試験により、5倍のマイクロアレイのバックグラウンドレベルで検出されたプローブが、NanoString上で堅牢に検出されたことが示唆された。
また、これらのプローブがNanoStringプラットフォーム上で良好に連携していることがすでに十分に検証されているため、PanCancer Immuneパネル試験を追加の発見プラットフォームとして使用した。NanoString PanCancer Immuneパネルパネルの性能精度を推定するために、10倍の10再サンプリングSVMを使用した。NanoStringパネルは、AUCがマイクロアレイ訓練セットで達成された0.866と比較して0.754と低い性能を示したが、感度90%では、特異性は依然として37%であり、発明者らのカスタムパネルに含めるためにセットの106個のプローブを選択した。また、今後の試験で検討するために、発明者らの以前のPBMC試験において、診断、転帰、および/または切除後遺伝子発現変化に関連していると特定された追加の55個のプローブを追加した(11、13)。
IlluminaプラットフォームとNanoStringプラットフォームとを使用した分類間の類似性を評価するために、プローブの差異および2つのプラットフォーム技
術の差異を考慮して、276個のSVM−RFEプローブを使用して両方のプラットフォームで実行した222個の訓練セット試料。276個のSVM−RFEプローブのみを考慮して、両方のプラットフォームを使用してこれらの試料の相互検証SVM得点を比較すると、プラットフォーム間で0.72のスピアマン相関が観察され、これを新たな試料の評価に進むのに十分であるとみなした。414個の試料を559プローブカスタムNanoStringパネル上でアッセイした。目的のIPN集団を構成する範囲である8〜20mmの病変を有する142個の試料を利用した。残りの272個の試料をモデルの訓練に使用した。この訓練セット上で開発されたモデルは、0.813のAucを示し、検証セット上では0.820のAUCを達成した(データ図示せず)。これにより、遺伝子選択アプローチが有効であったことが確認された。
再帰的特徴排除(RFE)を使用して、モデルをさらに精緻化した。SVM−RFEを訓練セットに適用すると、分類子性能が15のNanoStringプローブまで安定しており、nLNCは訓練AUC=0.867を返すことが明らかになった(図2)。独立した検証セットに対して決定されるAUCは、15個の遺伝子についてAUC=0.843で同様に安定しているが、分類において50個未満のプローブを使用すると、AUCの検証可能性が増加し、90%感度での特異性がわずかに低下し始める。一実施形態では、15または50個の遺伝子は、表IIまたは表IIIの遺伝子から選択される。
正規化された条件下で収集されたPBMCのRNAにおける遺伝子発現に関する発明者らのこれまでの試験により、末梢血が、悪性肺結節を良性肺結節から区別するための情報を含んでいるだけでなく、予後と相関する情報も含んでいることが示された。現試験で、発明者らは、1)試料収集の簡素化、および2)アッセイを臨床的にアクセス可能なプラットフォームに移動するという2つの目標に取り組んだ。最初の目標に取り組むにあたって、PAXgene収集チューブを使用した単純で正規化が容易な試料収集方法を実施した。これにより、大学センターだけでなく、これまでの試験では簡単には含められなかった地域センターでも試料の収集が可能となった。このパイロット試験により、PAXgeneチューブに収集された全血RNAを使用して、悪性肺結節を有する患者を、ますます多くのスクリーニングプログラムによって検出された良性肺結節を有する多数の個体からを正確に区別することの実現可能性が確立される。Paxgene試料収集が容易であることにより、肺癌の多様性に対処するために必要な大規模な試験を請け負うことができた。この試験では、主に、肺癌の中で最も一般的なNSCLC、より小さい早期癌、ならびにリスクの高い喫煙者および元喫煙者に焦点を当てた。
設定した第2の目標は、LNCをマイクロアレイ発見プラットフォームから臨床的に適切な検出プラットフォームに移動させることであった。試料の扱いやすさ、ならびに発明者らのPBMC試験で見出したバイアスおよびバッチ効果をもたらすことが知られている酵素ステップの多くを排除できることを根拠に、NanoString nCounterプラットフォームを選択した。また、必要な試験試料の量も簡単に得られる。ここで報告するNanoStringアッセイのすべてに100ngのRNAを使用したが、わずか10ngでも可能である。より多くの量のRNAがプラットフォームと適合性があるが、RNAの量を増加させるよりも、FOV 550のより高感度の走査設定を使用することのほうが、シグナルの増加により有効であることを見出した。
試薬バッチ、担当者の変更、および試料供給源と関係したNanoString遺伝子パネルの安定性も試験し、顕著なバッチ効果は検出されなかった。
万能ヒトRNA標準を、最初に各12個の試料カセットに含めた。スキャナおよびアッセイ性能を評価するために、これを週に1回に減らした。マイクロアレイ試験のためには、RNA完全性数(RIN)が7.5超である必要であり、かつPAXgene RINは慣習的には8.0超であるが、解凍し、−80℃の冷凍庫故障下で再凍結させたPAXg
ene試料由来のRNAもアッセイすることができた。RINがわずか3.2である5個のRNA試料を評価した。全体的なシグナル強度は、十分にNanoString品質制御パラメータ内であった。加えて、スキャントラブルが発生した場合、NanoStringが推奨するように保管されていれば、情報の損失がほとんどまたは一切なく、カセットを24時間以内に再度スキャンすることができる。
実施例8:41マーカーパネル(表IX)
タバコの喫煙が認められた根本原因であるため、肺癌は依然として世界中で癌に関連した死亡の主因である。これは、一部には早期発見プロトコルが十分でないこと、一部には早期症状が極めて潜行性であることに起因する。低線量コンピュータ断層撮影(LDCT)による肺癌スクリーニングが、高リスクの現喫煙者および元喫煙者(55歳超、箱年30超)の死亡率を低減するという実証(1〜3)は、LDCTスクリーニングプログラムにおける全体的な増加に繋がった。(4)LDCTは確かに従来のX線に比べて著しく小さい結節を特定するが、この能力は、比率の小さい悪性の結節を比率の大きい良性と検出された結節から区別する課題を伴う(5)。National Lung Screening Trial(NLST)では、スクリーニングした患者の40%において直径4mm以上の肺結節が検出され、3ラウンドのスクリーニングで96.4%が偽陽性であった(6)。この高いFPRを低減するために、最近の肺−RAD分類(7)およびFleischner群からの新しいガイドライン(8)は、6mm以上の結節の検出を陽性閾値として設定した。しかしながら、陽性CTスキャンは、最良の臨床行動指針が明確に定められていない、サイズが6〜20mmの範囲のクラスの不定肺結節(IPN)について特に問題が残っている(6)。
発明者らによる以前の研究により、急速に精製された(2時間以内)末梢血単核細胞(PBMC)は、高精度で良性肺結節を悪性肺結節から区別することができる遺伝子発現データを含んでいることが実証された(9)。本研究は、肺癌の初期段階であっても、悪性腫瘍を予測するPBMCにおける遺伝子発現が影響を受けることを示すことによって、結節診断における新たなパラダイムを確立した。しかしながら、このアプローチは、試料の一貫性およびRNAの完全性を維持するために、血液試料からPBMCを迅速に精製する必要性によって制限された。これにより、ほとんどの地域のクリニックおよび診療所を含む、PBMCの迅速な単離ができない環境での試料の収集が困難であった。加えて、診断開発に非常に有用であったマイクロアレイは、技術的に複雑であり、試薬バッチおよび酵素処理に関連する可変性を生じやすいため、臨床用途にあまり適していない。マイクロアレイ試験に必要な高品質のRNAは、患者由来の試料を用いた試験にも問題となる可能性がある(10)。本後向き/前向き研究は、発明者らのPBMC試験(9)で達成したものと同様の精度を、RNA安定化PAXgene(商標)チューブ内に収集した全血由来のRNAで達成することができるかどうかを決定することを試みるものであった。PAXgene RNAは、収集時に安定化され、直ちに遺伝子発現パターンを固定する。RNAは、15〜25℃で5日間、および−20〜−70℃で8年間安定である。これにより、貯蔵または細胞精製のための特別な機器を必要とせずに血液を採取する任意の臨床環境で試料を採取することができ(11〜13)、他の血液検査と同様に日常的に、試料を中央施設に移して検査することができるようになる。加えて、RNAの完全性を損なわない長期貯蔵により、システムが後向き分析に十分に適したものとなる。また、Illuminaマイクロアレイ上で開発されたPAXgeneシグネチャーが、Prosigna(商標)乳癌予後アッセイ(14)のために既にFDAにより承認され、より最近ではPD−1チェックポイント遮断に対する臨床応答を予測する臨床グレードアッセイを開発するために使用されているNanoString nCounterプラットフォームに移行させることができるかどうかも問うた。このPD−1アッセイは、進行中のペムブロリズマブ臨床試験において現在評価されている(15)。NanoStringアッセイは、いずれの酵素反応または増幅ステップも含まないため、このシステムは、試料の取り扱い
を最小限に抑えることによって交差汚染の機会を減少させながら、可能性のある試薬バッチ効果およびPCRバイアスを回避する。全血由来の遺伝子発現プロファイルがより複雑であり、重要な診断シグナルの低減をもたらす可能性があることは認識していたが、重要な追加の細胞型が分類子性能に貢献し得るという見込みもあった。
ここでは、PAXgene RNA安定化チューブを使用して収集された全血中の遺伝子発現が、独立した検証においてLDCTによって検出された良性肺結節と悪性肺結節とを高い精度で区別することができたこと、およびこの肺結節分類子をマイクロアレイ開発プラットフォームからNanoString nCounter(商標)プラットフォームに移行させることに成功したことを報告する。
試験設計
すべての研究にわたるバイオマーカーの選択および検証のプロセスを、図
3に要約する。悪性(MN)および良性(BN)の肺結節を有する患者からの合計821個の試料を、3つのプラットフォーム、Illuminaマイクロアレイ、NanoString Pan Cancer Immune(PCI)パネル、および最後に特注のNanoStringカスタムパネルにわたって分析し、4臨床施設からの264個の患者試料由来のマイクロアレイデータ(表VIII、表XIII)をマイクロアレイモデル開発に使用した。性能の推定は、51個の試料の独立した検証セットに基づいた。加えて、264個のマイクロアレイ試料のうちの201個を含む220個の試料を、NanoString PCIプラットフォーム上で分析し、カスタムNanoStringパネルに含める追加のバイオマーカーを選択した。バイオマーカー選択プロセスに含まれなかった第5の収集施設からの試料は、カスタムNanoStringプラットフォーム上でのみ分析した。最終的なnPNCを、583個の訓練試料(元々マイクロアレイ訓練セットで使用した215個の試料、およびバイオマーカー選択に使用したことのない368個の試料(70%)を含む)を使用してカスタムNanostringパネルから生成されたデータ上で開発し、プローブ選択に関与したことのない158個の独立した試料のセットを使用して検証した。
試験集団
試料は、Helen F.Graham Cancer Center、The Hospital of the University of Pennsylvania、Roswell Park Comprehensive Cancer Center、Temple University Hospital、およびNew York
University Langone Medical Centerからの対象を含む5つの臨床施設からの陽性LDCTを有する偶生対象から前向きに収集した。NYU対象には、NYUでEDRN肺スクリーニングプログラムの一部として組み入れられた患者が含まれた。この試験は、各参加施設でIRB承認され、ヘルシンキ宣言に示された原則に従って実施された。参加者全員が登録前にインフォームドコンセントに署名した。試験集団は、主として、50歳超であり、箱年20の喫煙歴を有し、過去5年に癌の病歴がない(非黒色腫皮膚癌を除く)喫煙者および元喫煙者であった。結節は、反復イメージングによりまたは気管支鏡検査、生検、および/もしくは肺切除を介した病理診断によって、悪性(MN)または良性(BN)であることを確認した。加えて、97%の超の良性結節は4年以上の経過観察を有し、残りは分析時に2年以上の経過観察を有した。MNに関
連する試料は、確定診断から3ヶ月以内に、または治癒手術を含む任意の侵襲的手術の前に採取した。少人数の参加者は、アッセイを受けた後、喫煙したことがないことが判明した。これらの試料を含むことによる分類子性能への影響を評価した。複数の結節が存在する場合、最大の結節の直径を報告した。
RNA精製、品質評価、およびマイクロアレイ
各収集施設には、Preanalytixによって指定された試料収集および保管のための標準的なプロトコルが提供された(PAXgene Blood RNA Tube(IVD)について、https://www.preanalytix.com/products/blood/rna)。試料は、施設で保管し、その後、ドライアイス上で一晩かけて一括移送したか、あるいは収集日に宅配便でWistarに移送し、処理まで−70℃で保管した。PAXgene miRNA Kit(Qiagen)を使用して総RNAを単離し、miRNAおよびmRNAを捕捉した。試料を、NanoDrop
1000 Spectrophotometer(Thermo Fisher Scientific)上で定量し、Agilent 2100 BioAnalyzer上のRNA完全性についてアッセイした。平均RNA収率は、3μg/血液2.5mlであり、平均RIN数は、8超である。マイクロアレイ試験には、RNA完全性数(RIN)が7.5超である試料のみを使用した。定量(100ng)の総RNAを、Illuminaで承認されたRNA増幅キット(Epicenter)を使用して増幅し(aRNA)、ヒト−HT12 v4ヒト全ゲノムビーズアレイにハイブリダイズさせた。マイクロアレイを48個セットで処理し、可能性のあるバッチ効果を最小限に抑えた。
NanoStringアッセイ条件
NanoStringハイブリダイゼーションを65℃で一定した19時間(推奨されている12〜25時間以内)実行した。nCounter Prep Stationにおけるハイブリダイゼーション後の処理には、標準設定を使用した。カセット走査パラメータを高(555FOV)に設定した。555FOV設定により、全体の信号が大幅に増加する。(データは図示せず)。すべてのアッセイを、この設定を使用して行った。標準試料サイズは100ngで、これは、すべての試料において有すると予想した量であった。Universal Human RNA(UHR)対照試料の複数の反復にわたるアッセイの安定性を見出した。(データは図示せず)。50以上の検出カウントが遺伝子プローブの大部分について、5%未満の変動が観察された。大部分の試料のRIN数は8超であったが、RINが3以下である試料であっても、4個のNanoString品質測定値のすべてを満たしたことが分かり、これにより、劣化したRNA試料でのプラットフォームの有用性が支持された。劣化したRNAの全体的な発現プロファイルに顕著な影響は見られなかった。(データは図示せず)。
データ分析
マイクロアレイ:マイクロアレイ生発現データを、Genome Studioソフトウェアを使用して、分析のためにエクスポートした。生データを分位正規化し、ログスケール化した。平均発現値がバックグラウンドレベルの2倍以上である遺伝子を使用して、SVM−RFEおよび10倍の10再サンプリング相互検証を使用して、PNCを開発した(以下の詳細を参照されたい)。悪性結節を良性結節から最も正確に区別した上位順位のプローブ(ボルダ評点)をNanoStringカスタムパネルの候補に選択した。また、SVM訓練セットを、より小さな結節ならびにI期およびII期の癌を含むサブセットAと、病変サイズについて平衡させた悪性および良性結節を含むサブセットBとに層別化した(補足表SI)。セットAおよびBの追加の分析は、観察された遺伝子発現各々の線形回帰モデルにおける因子として、結節クラス単独(MNまたはBN)または試料クラスおよび収集施設のいずれかを考慮した。これにより、6つの異なる回帰モデルが得られ、以下のパラメータに基づいて、NanoStringモデルに含めるために、これら
の分析から2つの追加の遺伝子セットを選択した:(i)p値<10−4閾値を用いた比較にわたって最小p値を有する59個の遺伝子、および(ii)p値<0.01で最大回帰係数b>log(1.2)を有する76個の遺伝子。ハウスキーピング(HK)遺伝子は、それぞれ、20%未満および2.5%未満の絶対およびログスケール化発現についての変動係数(CV)を有する良好に発現された遺伝子(バックグラウンドの5倍以上)の候補プールから選択した。候補HK遺伝子20個を最終的に選択した。CVが最小のHK候補遺伝子が12個、および既存のNanoString HKプローブと重複した候補遺伝子が8個であった。
NanoString:陰性対照の計数の幾何平均を差し引いて、NanoString
PanCancer Immune Panel試料に対してバックグラウンド補正を行った。すべての試料にわたる対照遺伝子計数の全幾何平均に対する試料対照の幾何平均の割合によって全値をスケーリングすることによって、試料計数を正規化した。これは、スパイクイン陽性対照とハウスキーピング遺伝子との両方に対して行った。NanoStringカスタムパネルを分位正規化し、NanoStringの推奨に従って、コードセット間で複製されたサンプルの発現比を使用して、NanoStringコードセットのバッチ差を補正した。Zスコアをカスタムパネル計数の最終値から計算し、SVM−RFEの入力として使用した。
SVM−RFEデータ分析:再帰的特徴排除(RFE)を有する線形カーネルSupport Vector Machine(SVM)を使用した監視下分類(16)を使用して、zスコア変換遺伝子発現データセットを分析し、MN患者クラスとBN患者クラスを区別することができる訓練セットに基づいてマイクロアレイ分類子を開発した。SVMが最も正確な分類子の開発に平衡入力を必要とすることが示されているため、平衡した症例対照セットを分類子開発に使用した(17)。訓練において開発された分類子の妥当性を全く新しい試料セットで試験する独立した検証は、症例または対照のいずれかとしての試料の特定に左右されない。前述(9)のように、フォールドを10回サンプリングする10倍の相互検証アプローチを採用した(100の訓練−試験スプリットモデル)。マイクロアレイデータの各スプリットについて、p値によってランク付けされた上位1000個のプローブ(9フォールドの両側t検定)を選択し、線形カーネルSVMを9フォールドで訓練し、残りのフォールドで試験した。各RFE反復はGuy on et alによって説明されるように、各ラウンドにおいて、最小絶対モデル重量で特徴の10%を排除した(16)。NanoStringデータ分析には、SVM反復ごとに単一の特徴排除を使用した。最終平均点を以下のように計算した。訓練セット内の任意の試料の最終スコアは、すべての試験フォールド(100個すべてのスプリットの中でそのようなフォールドは10)においてその試料に生成されたスコアのうちの平均として計算する。検証セット内の任意の独立した試料の最終得点は、100個すべてのスプリットモデルのうちの平均として計算する。次いで、各試料を、最終平均得点、および訓練セットから決定されたスコア閾値(偏りのない精度には0、または感度90%に対応する固定閾値で)を使用してクラスに割り当て、感度、特異性、および精度を計算した。100個すべてのスプリットにわたるプローブ順位を、ボルダ評点方式に基づいて以下の手順に従って組み合わせた。各順位リストN中、各遺伝子iにスコアを割り当てた。
式中、rは、リストn中の遺伝子iの順位である。各遺伝子iの最終スコアFSは、100個すべてのリストにわたる遺伝子iのスコアの合計をとることによって計算した。
次いで、各遺伝子について得られた最終スコアを使用して、分類子におけるそれらの順位を割り当てた。プローブの最終順位を、利用可能な741個すべてのNanoString 試料を使用して生成した。
マイクロアレイデータのためのプローブの最適数を、上位1000個の遺伝子プローブによるSVMによって達成されたROC−AUCの1%以内のROC−AUCを維持したプローブの最小数として決定した。NanoStringカスタムパネルについて、追加の遺伝子/プローブの除去が分類性能の低下をもたらした点を決定することによって、遺伝子の最適数を選択した。平滑化ウィンドウサイズ5で移動平均を使用して、各遺伝子を除去した後のROC−AUCを決定することによって、性能を評価した。ROC−AUCが最大であったプローブ数を最終の最適分類子として選択した。
結果
末梢血RNAを用いた肺癌関連遺伝子シグネチャーの検査
マイクロアレイ肺癌シグネチャーを開発および検証するために使用する315人の患者の人口学的特徴を表VIIIに示す。モデル構築に使用する試料は、主に早期のNSCLCであり、I期およびII期の癌が訓練セット集団の84%を構成し、独立した検証セットの癌の100%がI期であった。
264個の試料(表VIII、Illumina訓練セット)からの遺伝子発現を使用して、SVM−RFEを使用して悪性肺結節を良性肺結節から最も正確に区別したマイクロアレイ遺伝子シグネチャーを選択した(9、16)。分類の精度は、広範囲のプローブ数にわたって安定であり(図7A)、1000個の最高順位のプローブのパネルは、0.878のROC−AUCを達成した。より低い順位のプローブの排除とともに性能が徐々に低下するにつれて、上位1000個のSVM遺伝子プローブによって達成された0.878の1%以内にROC−AUCを維持した最小数のプローブを選択した。訓練セットにおいて0.866のAUC(95% CI:0.824〜0.910)を戻した311個のプローブを特定した(感度77.9%、特異性74.4%)。この性能は、独立した検証(表VIII、Illumina検証)で良好に維持され、0.847のAUC(95% CI:0.742〜0.951)を達成し(感度72.7%、特異性88.9%)、これは、訓練セットの性能と同様であった(図7B〜C)。この実証された予測精度は、発明者らの精製PBMC試験(9)から報告された29個の遺伝子分類子の予測精度と同様であり、肺における癌の存在が、PAXgeneで収集された血液RNAにおいても、等しく、または一部の場合にはより良好に検出され得ることを示す。重要なことに、プローブの数が減少するにつれて性能が維持され(図7A〜B)、これは、堅牢なシグネチャーが異なる数の遺伝子にわたって維持されることを示す。
マイクロアレイからのNanoString PlatformへのPNCの移行
PAXgene試料からのmRNA発現が悪性肺結節を良性肺結節から区別できることを検証した結果、発明者らは、マイクロアレイに基づく肺結節分類子(PNC)をNanoString nCounterプラットフォームに移行させる戦略を開発した(14)。マイクロアレイ発現測定値がNanoStringプラットフォーム上でどのように複製されるかを先験的に知ることが困難であったため、プラットフォームの違いを軽減するのに十分な冗長性を含むようにカスタムパネルを設計した。SVM−RFE分析によって特定されたIllumina遺伝子パネルからの上位300個のバイオマーカーを含めた。また、10−4未満のp値で最も顕著に差異的に発現されたプローブ、および0.0
1未満のp値を維持しながらMN群とBN群との間で発現の最大倍数変化を呈した79個のプローブを表す、59個のマーカーの追加セットを含めた。マイクロアレイ上で最も一貫した発現を有する20個のハウスキーピング(HK)遺伝子のセットも加えた(方法および材料を参照)。NanoStringプラットフォーム上で処理するmRNA試料は、逆転写およびPCR増幅を受けなかったため、選択したマイクロアレイプローブのいくつかは、増幅なしで検出するには低すぎるレベルで発現される可能性があることを懸念した。性能基準を確立するために、PanCancer Immune(PCI)パネル(カタログXT−CSO−HIP1−12)を用いて220個のmRNA試料(115個のMN、105個のBN)を分析した。実際のプローブはIlluminaプローブと同一ではなかったが、PCIパネルに表される770個の遺伝子のうち755個もマイクロアレイプラットフォームに表された。この試験により、2つのプラットフォーム間で検出可能なレベルの遺伝子発現を相関させることができるようになり、両方のプラットフォームで堅牢に検出することができる発現レベルの推定を得ることができた。結果は、マイクロアレイ上の2倍のバックグラウンドレベルで検出されたプローブが、NanoStringプラットフォーム上で堅牢に検出されたことを示唆した。
10倍の10再サンプリング相互検証を伴うSVM−RFEを使用してPCIデータも分析すると、PCIパネルは、マイクロアレイで達成された0.866と比較してROC−AUC=0.754しか示さなかったが(図7D)、発明者らのカスタムパネルに含めるために106個の最も差別的なPCIプローブを選択した。発明者らのPBMCマイクロアレイ試験(18、19)において転帰と関連していると特定された遺伝子に対する追加の55個のプローブも加え、その数はNanoStringカスタムパネルの可能性のあるプローブの数は619個となった。図12は、カスタムNanoStringパネルに選択された候補バイオマーカーの最終リストのソースを要約する。次いで、NanoStringプローブを、可能な限り、Illuminaマイクロアレイプローブによって標的となるものと同じまたは近接して位置するトランスクリプトーム領域を標的にするように設計した。NanoString品質管理基準を満たしたプローブを、619個の選択されたバイオマーカーのうちの559個について設計することに成功した(データは図示せず)。
NanoString肺結節分類子の開発、精緻化、および検証
まず、マイクロアレイ訓練セットからの199個の試料を再アッセイすることによって、分類精度がIlluminaプラットフォームとNanoStringプラットフォームとの間でどの程度維持されていたかを評価した。分類精度の比較のために、NanoStringプローブとして設計に成功した276個のマイクロアレイバイオマーカーのみを使用した。2つのプラットフォーム間の試料分類得点について、0.73のスピアマン相関rho(p値<10−12)が観察された(図8A)。276個のプローブに基づくROC−AUCは、マイクロアレイについて0.881、NanoStringについて0.838であり(図8B)、プラットフォーム移行が成功したことを示す。
カスタムパネルの性能の偏りのない評価を行うために、新しい5番目の収集施設からの試料を含む合計741個の患者試料を分析した。583試料の最終nPNC訓練セットおよび158試料の検証は、良好な感度および特異性を有する分類子を選択するための最良の条件を提供するように、バランスの取れた数のMNおよびBN試料を有した(表XI)(17)。
表XI−カスタムパネルを用いてアッセイした試料の人口統計。連続値に対して中央値±IQRを付与し、p値は悪性結節群と良性結節群との比較の意義を示す。
559個すべてのプローブを使用した分類モデルは、訓練セットで0.833のROC−AUC(95% Cl:0.799〜0.864)、独立した検証セットで0.826のROC−AUC(95% CI:0.760〜0.891)を示した(図4A)。再帰的特徴排除処理中、訓練セットの性能は安定したままであった(図9A)。漸減するプローブセットは、同様のROC−AUCを達成した(図2B〜D、図9B)。感度、特異性、ならびに陽性および陰性予測値(PPV、NPV)も、訓練セットと検証セットとの両方において同様である(表XII)。
41プローブ分類子(表IX)が、訓練について0.834(95% CI:0.800〜0.865)、独立した検証について0.825のAUC(95% CI:0.759〜0.890)を達成した一方(図4C)、検証セット性能ではわずかな下降があったものの、わずか6個のプローブしか使用しなくても、ROC−AUCが0.8超に維持された(図4D)。
最適な41遺伝子シグネチャー(表IX)は、それぞれ、68.1%および82.1%の偏りのない感度および特異性を有した。これは、訓練および検証の両方について90%の感度で51%の特異性を達成した。独立した検証について、NPV値およびPPV値はそれぞれ0.99および0.0066であった。分類子は、I期については64%の感度、末期の癌については70%の感度で癌を検出した。様々なnPNC分類得点にわたる悪性腫瘍の確率を図4Eに示す。分析には、喫煙歴のない悪性または良性肺結節を有する少数の個体が含まれていたことに留意されたい。これらの対象を試験から除去しても、41プローブ分類子(AUC差0.001)または全559プローブ分類子(AUC差0.010)のAUC検証性能は変化しなかった。追加の因子として、年齢、性別、人種、および喫煙歴を加えても、分類に影響はなく、遺伝子発現のみを使用した場合の0.840と比較して、0.837のROC−AUCが生成された。
nPNC分類子の性能は既存の臨床モデルより優れている
41のバイオマーカーパネル分類子に焦点を当てて、評価が困難なサイズが6〜20mmの範囲にあるすべての試料に対するnPNCの性能を、高リスク集団中で開発したBrock University(20、21)、ならびにより偶生の結節集団からのデータを使用して開発したMayo Clinic(22)およびVA(23)モデルという3つの臨床アルゴリズムの性能と比較した。これらのアルゴリズムは、結節のサイズおよび位置を含む多様な人口統計的および病理的パラメータに基づいて肺結節の癌リスクを評
価する(図5A)。nPNCは、直径6〜20mmの範囲の結節において、3つの臨床モデルすべてを上回る性能を有する。結節サイズは、臨床モデルの各々に含まれる広く認められている危険因子であるため、6〜20mmの範囲の試料のサイズのみを使用した分類と比較して、分類の増大した精度も実証する(図5B)。
異なる結節サイズ範囲に対する分類子性能
結節のサイズは重要な危険因子であり、指針の変更により、IPNの定義はあまりよく定義されていない(6)ため、サイズ範囲が類似していた悪性結節と良性肺結節とを比較したときの性能を調べた。NLST試験(24)からの4mm、Fleischner Society(8)およびLung Rads(7)からの最近の報告において考察されている6mmおよび8mmのベースライン陽性閾値、ならびに10mmのベースライン閾値を使用して、様々な結節サイズ範囲にわたって41プローブ分類子の性能を計算した。ROC−AUCおよび感度が90%の性能で保持されるときの特異性を、訓練セットおよび独立した検証セットに選択された閾値に対するすべての可能な範囲について計算した(図6)。全体として、訓練および検証セット性能は、より小さい検証セットにおいて明らかであるように、わずかな検証セット試料のみが特定のサイズ範囲内に入る場合を除いて、すべてのサイズ範囲にわたって高度に保存された。41プローブnPNCは、結節が診断の困難な8〜14mmの範囲である独立した検証において特に性能が良好であり、90%の感度で64%の特異性を達成するが、より大きな組み合わせデータセットでは特異性は48%に下降する。陽性スクリーンに使用された閾値が4mmであっても6mmであっても、発明者らの分類子は、組み合わせデータセットにおいてROC−AUCがそれぞれ0.83および0.81であるすべての範囲にわたって良好な性能を発揮することによって、IPNの分類におけるその有用性を実証し、閾値8mmのみがAUCを0.80に減少させる。感度90%での特異性は同様に安定であり、4、6、および8mmについてそれぞれ0.50、0.46、および0.48として計算される。
考察
LDCTを用いた肺癌スクリーニングプログラムの全体的な利点は、患者生存率の20%増加が報告されていることに明らかである。しかしながら、この成功には、検出される多数の主に良性のIPNをどのように評価するかという関連する問題と、過剰管理の懸念が伴う(25)。最近の肺−RAD評価はまた、NLST試験で使用される4mmではなく6〜7mmの陽性スクリーニング閾値の実施が肺癌スクリーニング結果の管理においてより適切であり得ること(7)、およびこの変化が、患者ケアへの影響を最小限にしてIPN問題の重大さを軽減し得ることを示唆している(8)。新たな指針をもってしても、米国内で毎年検出される160万と推定される肺結節の過剰管理の可能性は、悪性のリスクが約8〜64%の範囲であり得る6mm以上20mm以下未満の結節について特に顕著な課題のままである(26)。臨床的に意義のある方法でこれらのIPNを評価するための代替的な非侵襲的アプローチの開発が、呼吸器病学における重要な目標である。
ほとんどの非侵襲的早期検出アプローチは、血液、血漿、血清、または痰中に存在する腫瘍由来核酸、抗体、またはタンパク質の特定に依存しているが(27〜29)、ただし、これらの分析物は、治癒手術に最も適しており、現在ではより容易にLDCTによって検出されている、より小さい早期癌の存在下で希少であることが多い。この問題を回避した追加の試験は、気管支鏡検査を、正常な気道上皮細胞における遺伝子発現または鼻擦過物と関連する遺伝子発現と組み合わせた。このアプローチは、腫瘍が悪性または良性肺結節の存在と異なる非病変呼吸器における遺伝子発現改変を誘発する「領域癌化」の概念に基づいている。これらのアプローチは、気管支鏡検査によってアクセスされる可能性が高い結節に対して良好に機能するが(27、30、31)、より小さなIPNではあまり有効ではなく、これは大きな管理上の懸念も表す。
発明者らは、PBMC由来RNAにおける遺伝子発現が悪性肺結節を良性肺結節から効率的に区別するため、肺の悪性病変は肺癌分野を超えて末梢血に影響を及ぼし得ることを以前に示した(9)。この肺外効果の存在は、肺癌のマウスモデルからの初期の報告によって裏付けられ、肺の前悪性病変によって生成される可溶性因子が、骨髄マクロファージにおける特定の活性化マーカーの発現に影響を及ぼし、この効果が腫瘍の進行とともに増強されたことを実証している(32〜34)。PBMC研究は、余分な肺関与の原理の重要な証拠を提供したが、転写プロファイルを安定化するためにPBMC試料の迅速な精製の必要性は、学術的環境以外の収集施設への拡大および堅牢な臨床プラットフォームの開発の妨げであった。発明者らは、PAXgene RNA安定化チューブで容易に収集された全血由来RNAも、悪性肺結節を良性肺結節から区別する遺伝子発現情報のために取り出すことができることを実証した。この低侵襲性の2.5ml採血システムにより、主要な医療センターだけでなく、日常的に採血が行われている場所であればどこでも、試料を収集できるようになる。室温で5日間にわたるRNA安定性は、試料の完全性を維持するために特別な貯蔵システムを必要としないことを意味し、それにより、試料を収集すること、およびその後で遠隔地からであっても中央試験施設に移すことが容易になる。RNAの品質により、これは、高品質RNAを必要とする配列決定プラットフォームを含む多種多様なプラットフォームに対する分析に適切となる。
4つの学術肺センターおよび地域病院で収集された試料を使用して、PAXgene収集システムの有用性を検証した。試料は、一括して収集、貯蔵、および移送するか、またはプラットフォームの性能に何ら検出可能な影響を及ぼすことなく貯蔵および最終処理を行うために、毎日収集した後、発明者らの試験施設に宅配便で移送した。主にI期(69%)およびII期(17%)であった癌、ならびに1%未満〜64%の悪性リスクの範囲にわたる、4mmのNLST試験の閾値測定値から20mmまでのサイズ範囲の結節を用いて、Illuminaマイクロアレイ上でアッセイしたグローバル遺伝子発現から、診断モデルを構築した(8)。重要なことに、発明者らのPAXgeneマイクロアレイ分類子は、独立した検証で0.847(95% CI:0.742〜0.951)のROC−AUCを維持し、これは、分類子開発に使用した訓練セットのものとほぼ同一であった。多くの試験において、検証セットの精度はやや低下しており、分類子開発に使用されるモデルが、可能性のある対象の多様性を十分に捕捉するために十分に大きくなかったことが示唆される(9、35、36)。マイクロアレイ開発プラットフォームから前進して、発明者らは、結節分類子をNanoString nCounterプラットフォームに移行することに成功した。nCounterプラットフォームは、最小限の試料の取り扱いが最低限でよく、技術的に単純であり、同じアッセイにおいて分解および非分解RNAを評価する能力を有する。PAM 50遺伝子シグネチャーに基づいたNanoStringベースのProsigna(商標)乳癌予後アッセイ(14)のFDA承認と、PD1遮断に対する臨床応答を予測するNanoStringベースの免疫シグネチャーのより最近の開発(37)は、このプラットフォームの臨床的有用性をさらに裏付ける。
発明者らのNanoStringベースの分類子の予備遺伝子パネルには559個のバイオマーカーが含まれていたが、その数は、ROC−AUCを維持しながら41個のプローブに減少させることができるため、試験プラットフォームを簡素化する可能性を示唆する。41個のプローブに表される様々なプローブの寄与を評価する際に、上位ランクのプローブの46%がSVM分析に由来し、29%がPCIパネルに由来し、最も少ない候補はp値によって選択された。PMBC試験における生存に関連する骨髄関連遺伝子(18)は、41のプローブ分類子には表されなかったが、上位100個にランク付けされたプローブにおいてはよく表され、一方でNK関連プローブは、大部分がプローブセットの下半分であり、これはNKシグナルがPAXgene試料中で著しく希釈されるためであろう。患者の転帰データが蓄積されると、発明者らの以前のPBMC試験(18、19、38)において再発/生存と関連性があるために選択された発明者らのパネルに含まれる予
後バイオマーカーの有用性をさらに評価することにする。
堅牢な技術性能はどの臨床プラットフォームにとっても重要であるが、結果として生じる患者への利益が最も重要である。発明者らのNanoStringカスタムパネルのそのプラットフォーム上で分析された741個の試料に対する性能は、IPNの診断が困難ないくつかのクラスを評価するための侵襲的アプローチの使用に影響を及ぼす可能性がある重大な臨床的意義を有する。発明者らの研究は、存在がより進行した癌とより一致する循環腫瘍細胞、腫瘍タンパク質、または腫瘍RNAの存在に依存しない。この試験では、主に、直径6〜20mmであり、中〜高リスク(39)であり、気管支鏡検査または細針生検のいずれによってもアクセスが容易でない不定肺結節のクラス、および外科的アプローチに最も適している早期癌に取り組んだ。また、悪性腫瘍のリスクは小さいが、依然としてその存在がある程度懸念され得る4〜6mmの範囲の小さい結節での性能を評価した。
重要なことに、発明者らのnPNCは、Brock University(20、21)、Mayo Clinic(22)、および6〜20mmの範囲のVA(23)の臨床モデルを含む治療または経過観察のためのIPNを有する候補を層別化するために現在使用されている臨床アルゴリズムよりも高性能である。これらのアルゴリズムは、ほとんどがより小さい良性結節およびより大きい癌を含むデータセットに適用されると良好に働くが、問題のあるサイズ範囲のMNおよびBNのみに適用されると、性能がやや低下する。発明者らが分析した肺結節のサイズ範囲は重要であるものの、発明者らの試験において、MNとBNとの間の中央サイズには大きな差がある。BNおよびMN結節のサイズがより密接に一致し、臨床アルゴリズムの性能が不良である可能性が高い場合、バイオマーカーおよび臨床アルゴリズムがどの程度機能するかに対処することが重要であろう。図4に示すように、この種類の比較を試みた。全体的なAUC、感度、および特異性は、4、6、または8mmを陽性閾値として使用するかどうかにかかわらず、十分に保存されているが、比較がより細かくなるにつれて、いくつかの比較は、他のものよりも著しく正確であり、これは、試料数がより少ない検証試験において特に明らかである。8〜14mmのサイズ範囲のBNおよびMNについて感度90%で64%の特異性を達成し、これは6〜14mmの範囲で40%に低下した。
結節のサイズは、IPNの治療方法における主な考慮事項である(40)。この研究は多数の患者試料を調べ、可能性のある有用性を実証してきたが、MNおよびBNがよりサイズについてより密接に関連している試料を数多く用いるさらなる評価は、サイズが情報提供性でなくなるシナリオであるため、その有用性を拡大することになる。先に進むにあたって、問題の残る結節サイズの範囲にわたって同様のサイズのBNおよびMNを比較することによって、この問題により完全に対処することが重要であろう。様々な場所から一貫した品質の大量の試料を取得するための極めて簡素化され実績のある方法が、このプロセスを容易にする。また、広範な試験により、患者クラス間で検出されている差異の生物学的根拠に取り組み、それらの差異が治療上の意義を有し得るかどうかを評価することが可能となる。
国際特許出願第PCT/US17/38571号を含む、ありとあらゆる特許、特許出願、刊行物、および本開示を通じて引用される一般に利用可能な遺伝子配列は、参照によりその全体が明示的に本明細書に組み込まれる。優先権文書類である2017年12月19日に出願された米国特許出願第62/607,756号および2018年10月29日に出願された米国特許出願第62/752,163号もまた、参照により組み込まれる。本発明は、特定の実施形態を参照して開示されたが、本発明の真の趣旨および範囲から逸脱することなく、本発明の他の実施形態および変形形態が当業者によって案出されることは明らかである。添付の特許請求の範囲は、そのような実施形態および同等の変形を含む。

Claims (34)

  1. 哺乳動物対象における肺癌の存在を診断するまたはその進行を評価するための組成物であって、前記組成物が、少なくとも7個のポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドを含み、各ポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドが、表I、表II、表III、表IV、または表IXの遺伝子から選択される試料中の異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズする、組成物。
  2. 少なくとも1つのポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドが、検出可能な標識に結合する、請求項1に記載の組成物。
  3. 各ポリヌクレオチドまたはオリゴヌクレオチドまたはリガンドが、異なる検出可能な標識に結合する、請求項2に記載の組成物。
  4. 少なくとも1つのポリヌクレオチドまたはオリゴヌクレオチドにハイブリダイズする捕捉オリゴヌクレオチドをさらに含む、請求項1に記載の組成物。
  5. 前記捕捉オリゴヌクレオチドが、各ポリヌクレオチドまたはオリゴヌクレオチドにハイブリダイズすることができる、請求項4に記載の組成物。
  6. 前記捕捉オリゴヌクレオチドが、基質に結合する、請求項4または請求項5に記載の組成物。
  7. 前記捕捉オリゴヌクレオチドが結合する基質をさらに含む、請求項6に記載の組成物。
  8. 少なくとも15個のポリヌクレオチドまたはオリゴヌクレオチドを含む、請求項1に記載の組成物。
  9. 少なくとも20個のポリヌクレオチドまたはオリゴヌクレオチドを含む、請求項1に記載の組成物。
  10. 少なくとも25個のポリヌクレオチドまたはオリゴヌクレオチドを含む、請求項1に記載の組成物。
  11. 少なくとも41個または少なくとも50個のポリヌクレオチドまたはオリゴヌクレオチドを含む、請求項1に記載の組成物。
  12. 表Iに列挙される各異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズすることができるポリヌクレオチドまたはオリゴヌクレオチドを含む、請求項1に記載の組成物。
  13. 表IIに列挙される各異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズすることができるポリヌクレオチドまたはオリゴヌクレオチドを含む、請求項1に記載の組成物。
  14. 表IIIに列挙される各異なる遺伝子、遺伝子断片、遺伝子転写産物、または発現産物にハイブリダイズすることができるポリヌクレオチドまたはオリゴヌクレオチドを含む、請求項1に記載の組成物。
  15. 表IIに列挙される最初の15個の遺伝子、遺伝子断片、遺伝子転写産物、または発現
    産物の各々にハイブリダイズすることができるポリヌクレオチドまたはオリゴヌクレオチドを含む、請求項1に記載の組成物。
  16. 表IIIに列挙される最初の15個の遺伝子、遺伝子断片、遺伝子転写産物、または発現産物の各々にハイブリダイズすることができるポリヌクレオチドまたはオリゴヌクレオチドを含む、請求項1に記載の組成物。
  17. 表IVに列挙される最初の15個の遺伝子、遺伝子断片、遺伝子転写産物、または発現産物の各々にハイブリダイズすることができるポリヌクレオチドまたはオリゴヌクレオチドを含む、請求項1に記載の組成物。
  18. 表IIIに列挙される最初の50個の遺伝子、遺伝子断片、遺伝子転写産物、または発現産物の各々にハイブリダイズすることができるポリヌクレオチドまたはオリゴヌクレオチドを含む、請求項1に記載の組成物。
  19. 請求項1〜18のいずれか一項に記載の組成物と、試料採取のための装置と、を含む、キット。
  20. 前記試料採取のための装置が、前記試料を安定させる試薬を含む、血液を保持するための試験管を備える、請求項19に記載のキット。
  21. 前記試薬が、前記試料中のmRNAを安定させる、請求項20に記載のキット。
  22. 哺乳動物対象における肺癌の存在を診断するまたはそれを評価するための方法であって、前記表Iの遺伝子または前記表IIの遺伝子または前記表IIIの遺伝子または前記表IVの遺伝子から選択される前記対象の前記試料における7個以上の遺伝子の前記発現の変化を特定することと、前記対象の遺伝子発現レベルを参照または対照における同じ遺伝子のレベルと比較することと、を含み、前記対象の遺伝子の発現の前記参照のものからの変化が、肺癌の診断または評価と相関する、方法。
  23. 前記診断または評価が、肺癌の診断、良性結節の診断、肺癌の病期の診断、肺癌の種類もしくは分類の診断、肺癌の再発の診断もしくは検出、肺癌の退行の診断もしくは検出、肺癌の予後、または外科的もしくは非外科的療法に対する肺癌の応答の評価のうちの1つ以上を含む、請求項22に記載の方法。
  24. 前記変化が、前記参照もしくは対照と比較した1つ以上の選択された遺伝子の上方調節、または前記参照または対照と比較した1つ以上の選択された遺伝子の下方調節を含む、請求項23に記載の方法。
  25. 前記対象における肺結節のサイズを特定することをさらに含む、請求項23に記載の方法。
  26. 請求項1〜21のいずれか一項に記載の組成物を前記診断に使用することをさらに含む、請求項22に記載の方法。
  27. 前記参照または対照が、少なくとも1つの参照対象の前記試料からの表I、表II、表III、表IV、または表IXの7個以上の遺伝子を含み、前記参照対象が、(a)悪性疾患を有する喫煙者、(b)非悪性疾患を有する喫煙者、(c)非悪性疾患を有する元喫煙者、(d)疾患を有しない健康な非喫煙者、(e)慢性閉塞性肺疾患(COPD)を有する非喫煙者、(f)COPDを有する元喫煙者、(g)固形肺腫瘍を、それを除去する
    ための手術前に有する対象、(h)固形肺腫瘍を、前記腫瘍を外科的に除去した後に有する対象、(i)固形肺腫瘍を、それに対する治療前に有する対象、および(j)固形肺腫瘍を、それに対する治療中または治療後に有する対象からなる群から選択される、請求項26に記載の方法。
  28. 前記参照または対照対象(a)〜(j)が、時間的に早い時点の同じ試験対象である、請求項27に記載の方法。
  29. 前記試料が、末梢血である、請求項21〜28のいずれか一項に記載の方法。
  30. 前記試料中の核酸が、前記遺伝子発現レベルの変化を特定する前に安定化されている、請求項29に記載の方法。
  31. 患者における肺癌の検出方法であって、
    a.前記患者から試料を得ることと、
    b.前記試料を、表I、表II、表III、表IV、または表IXの少なくとも7個の遺伝子の各異なる遺伝子転写産物または発現産物に特異的なオリゴヌクレオチド、ポリヌクレオチド、またはリガンドを含む組成物と接触させること、および前記オリゴヌクレオチド、ポリヌクレオチド、またはリガンドと、前記遺伝子産物または発現産物との間の結合を検出することによって、対照と比較して、前記患者試料中の表I、表II、表III、表IV、または表IXから選択される前記少なくとも7個の遺伝子における発現の変化を検出することと、を含む、方法。
  32. 対象における肺癌の診断方法であって、
    a.対象から血液試料を得ることと、
    b.前記試料を、表I、表II、表III、表IV、または表IXの少なくとも7個の遺伝子の各異なる遺伝子転写産物または発現産物に特異的なオリゴヌクレオチド、ポリヌクレオチド、またはリガンドを含む組成物と接触させること、および前記オリゴヌクレオチド、ポリヌクレオチド、またはリガンドと、前記遺伝子産物または発現産物との間の結合を検出することによって、対照と比較して、前記患者試料中の表I、表II、表III、表IV、または表IXから選択される前記少なくとも7個の遺伝子における発現の変化を検出することと、
    c.前記対象の遺伝子の発現において前記参照のものからの変化が検出される場合に、前記対象を癌と診断することと、を含む、方法。
  33. 腫瘍成長を有する対象における肺癌の診断および撃退方法であって、
    a.対象から血液試料を得ることと、
    b.前記試料を、表I、表II、表III、表IV、または表IXの少なくとも7個の遺伝子の各異なる遺伝子転写産物または発現産物に特異的なオリゴヌクレオチド、ポリヌクレオチド、またはリガンドを含む組成物と接触させること、および前記オリゴヌクレオチド、ポリヌクレオチド、またはリガンドと前記遺伝子産物または発現産物との間の結合を検出することによって、対照と比較して、前記患者試料中の表I、表II、表III、表IV、または表IXから選択される前記少なくとも7個の遺伝子における発現の変化を検出することと、
    c.前記対象の遺伝子の発現において前記参照のものからの変化が検出される場合に、前記対象を癌と診断することと、
    d.前記腫瘍成長を除去することと、を含む、方法。
  34. 表IXに列挙される最初の41個の遺伝子、遺伝子断片、遺伝子転写産物、または発現産物の各々にハイブリダイズすることができるポリヌクレオチドまたはオリゴヌクレオチ
    ドを含む、請求項1に記載の組成物。
JP2020534292A 2017-12-19 2018-12-19 遺伝子発現プロファイルを使用して肺癌を診断するための組成物および方法 Pending JP2021506308A (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201762607756P 2017-12-19 2017-12-19
US62/607,756 2017-12-19
US201862752163P 2018-10-29 2018-10-29
US62/752,163 2018-10-29
PCT/US2018/066531 WO2019126343A1 (en) 2017-12-19 2018-12-19 Compositions and methods for diagnosing lung cancers using gene expression profiles

Publications (1)

Publication Number Publication Date
JP2021506308A true JP2021506308A (ja) 2021-02-22

Family

ID=66993904

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020534292A Pending JP2021506308A (ja) 2017-12-19 2018-12-19 遺伝子発現プロファイルを使用して肺癌を診断するための組成物および方法

Country Status (6)

Country Link
US (1) US20210079479A1 (ja)
EP (1) EP3728630A4 (ja)
JP (1) JP2021506308A (ja)
BR (1) BR112020012280A2 (ja)
CA (1) CA3085464A1 (ja)
WO (1) WO2019126343A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2018145532A (ru) 2016-06-21 2020-07-23 Зе Уистар Инститьют Оф Анатоми Энд Байолоджи Композиции и способы диагностирования раковых заболеваний легких с помощью профилей экспрессии генов
WO2023106941A2 (en) * 2021-12-09 2023-06-15 Synergenz Bioscience Limited Systems and methods for disease assessments

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070099209A1 (en) * 2005-06-13 2007-05-03 The Regents Of The University Of Michigan Compositions and methods for treating and diagnosing cancer
US8476420B2 (en) * 2007-12-05 2013-07-02 The Wistar Institute Of Anatomy And Biology Method for diagnosing lung cancers using gene expression profiles in peripheral blood mononuclear cells
WO2010064702A1 (ja) * 2008-12-05 2010-06-10 国立大学法人 東京大学 癌の予後を予測するためのバイオマーカー
US20140227372A1 (en) * 2011-05-25 2014-08-14 Novartis Ag Biomarkers for lung cancer
RU2018145532A (ru) * 2016-06-21 2020-07-23 Зе Уистар Инститьют Оф Анатоми Энд Байолоджи Композиции и способы диагностирования раковых заболеваний легких с помощью профилей экспрессии генов

Also Published As

Publication number Publication date
EP3728630A1 (en) 2020-10-28
CA3085464A1 (en) 2019-06-27
US20210079479A1 (en) 2021-03-18
BR112020012280A2 (pt) 2020-11-24
WO2019126343A1 (en) 2019-06-27
EP3728630A4 (en) 2021-11-17

Similar Documents

Publication Publication Date Title
JP6246845B2 (ja) 遺伝子発現を用いた前立腺癌の予後を定量化する方法
JP6140202B2 (ja) 乳癌の予後を予測するための遺伝子発現プロフィール
JP6190434B2 (ja) 化学療法剤に対する応答を予測するための遺伝子発現マーカー
JP6351112B2 (ja) 前立腺癌の予後を定量化するための遺伝子発現プロフィールアルゴリズムおよび試験
JP5405110B2 (ja) 原発不明がんの原発巣を同定するための方法および材料
JP5486719B2 (ja) 結腸直腸癌の予後のための遺伝子発現マーカー
TWI582236B (zh) 黑色素癌之預後預測
US20230366034A1 (en) Compositions and methods for diagnosing lung cancers using gene expression profiles
JP2009528825A (ja) デュークスb大腸がんの再発を予測するための分子的解析
JP2018524972A (ja) 肺癌の診断または検出のための方法及び組成物
JP2021506308A (ja) 遺伝子発現プロファイルを使用して肺癌を診断するための組成物および方法
EP3810807A1 (en) Methods and compositions for the analysis of cancer biomarkers