JPWO2009084740A1 - Methods and compositions for predicting postoperative recurrence in patients with lung adenocarcinoma - Google Patents

Methods and compositions for predicting postoperative recurrence in patients with lung adenocarcinoma Download PDF

Info

Publication number
JPWO2009084740A1
JPWO2009084740A1 JP2009548133A JP2009548133A JPWO2009084740A1 JP WO2009084740 A1 JPWO2009084740 A1 JP WO2009084740A1 JP 2009548133 A JP2009548133 A JP 2009548133A JP 2009548133 A JP2009548133 A JP 2009548133A JP WO2009084740 A1 JPWO2009084740 A1 JP WO2009084740A1
Authority
JP
Japan
Prior art keywords
recurrence
gene
lung adenocarcinoma
expression
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009548133A
Other languages
Japanese (ja)
Other versions
JP5407018B2 (en
Inventor
隆 高橋
隆 高橋
秀太 冨田
秀太 冨田
俊幸 竹内
俊幸 竹内
恭 谷田部
恭 谷田部
徹哉 光冨
徹哉 光冨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oncomics
Original Assignee
Oncomics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oncomics filed Critical Oncomics
Priority to JP2009548133A priority Critical patent/JP5407018B2/en
Publication of JPWO2009084740A1 publication Critical patent/JPWO2009084740A1/en
Application granted granted Critical
Publication of JP5407018B2 publication Critical patent/JP5407018B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57423Specifically defined cancers of lung
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/54Determining the risk of relapse

Abstract

この発明は、特定の遺伝子セットを用いて肺腺癌患者において肺癌の外科切除後の肺腺癌の再発を予測するための方法、及びこれらの方法に使用するための組成物を提供する。The present invention provides methods for predicting recurrence of lung adenocarcinoma after surgical resection of lung cancer in lung adenocarcinoma patients using specific gene sets, and compositions for use in these methods.

Description

本発明は、肺腺癌患者の術後再発を予測するための方法及び組成物に関する。   The present invention relates to methods and compositions for predicting postoperative recurrence in lung adenocarcinoma patients.

肺癌は、先進諸国において癌関連死亡原因のトップである。肺癌は、小細胞癌と非小細胞癌に大別され、さらに非小細胞癌は主として腺癌、扁平上皮癌、大細胞癌に分類される。肺非小細胞癌の中で肺腺癌は非小細胞癌の約半数を占め、我国では最も発生頻度が高いことが知られている。また、非小細胞癌患者の10年生存率は約10%と非常に低く、その患者の約25〜30%はステージIの患者で外科切除を受けただけであり、そのような患者のうち約35〜50%が5年以内に再発している。
近年、マイクロアレイや質量分析などの技術の進歩により、これらを利用したバイオインフォマティクス、プロテオミクスなどの新しい技術領域が開発されている。癌研究においても、癌の診断や治療を目的として、このような技術を利用した遺伝子発現の網羅的解析が盛んに行われている。
肺癌についても、肺癌患者における肺癌の分類、転移の予測及び再発の予測と、遺伝子発現パターンや臨床パラメーターとの相関性を追求する研究が行われている(非特許文献1)。
本発明者らもこれまでに、肺癌を中心に、遺伝子発現パターンの網羅的解析を行い、転移や予後の予測に関連する発現パターンを解析してきた(非特許文献2)。また、本発明者らは、最近、肺腺癌をTRU−a型、TRU−b型及び非TRU型に分類し、この分類に基づいて肺腺癌患者の術後予後を予測するための方法及び組成物を開示している(特許文献1)。
肺腺癌に関して、さらに別のグループが、肺腺癌を判別するための遺伝子セット、肺腺癌の胸膜浸潤を判別するための遺伝子セット、及び肺腺癌の再発を予測するための遺伝子セットを開示している(特許文献2〜4)。このうち、特許文献4には、肺腺癌の術後再発を予測するための方法及び45個の遺伝子のセットが記載されており、この遺伝子セットによる肺腺癌の判別率が50%以上であると記載している。また、非特許文献3には、54個の遺伝子セットによる肺腺癌の再発の予測を開示しており、ここにはまた、肺腺癌患者の予後を判定する従来の方法による再発の正確な予測の難しさが記載されている。
国際公開WO2007/043418 特開2007−6791 特開2007−6792 特開2007−135466 D.G.Beerら,Nature Medicine 2002,8(8):816−824 冨田秀太及び高橋隆,「発現プロファイル解析に基づく肺癌の診断・治療の新展開」実験医学2004,22(14):45−50,羊土社(日本) J.E.Larsenら,Clinical Cancer Research 2007,13:2946−2954
Lung cancer is the leading cause of cancer-related death in developed countries. Lung cancer is roughly classified into small cell cancer and non-small cell cancer, and non-small cell cancer is mainly classified into adenocarcinoma, squamous cell carcinoma, and large cell carcinoma. Among non-small cell lung cancers, lung adenocarcinoma accounts for about half of non-small cell cancers and is known to occur most frequently in Japan. In addition, the 10-year survival rate of patients with non-small cell carcinoma is very low, about 10%, and about 25-30% of those patients have only undergone surgical resection in stage I patients. About 35-50% have relapsed within 5 years.
In recent years, with the advancement of technologies such as microarrays and mass spectrometry, new technical fields such as bioinformatics and proteomics using these have been developed. In cancer research, comprehensive analysis of gene expression using such techniques is actively performed for the purpose of diagnosis and treatment of cancer.
Regarding lung cancer, research is being conducted to investigate the correlation between classification of lung cancer in patients with lung cancer, prediction of metastasis and prediction of recurrence, and gene expression patterns and clinical parameters (Non-patent Document 1).
To date, the present inventors have also conducted a comprehensive analysis of gene expression patterns mainly in lung cancer, and analyzed expression patterns related to metastasis and prognosis prediction (Non-patent Document 2). In addition, the present inventors recently classified lung adenocarcinoma into TRU-a type, TRU-b type and non-TRU type, and a method for predicting the postoperative prognosis of patients with lung adenocarcinoma based on this classification And a composition are disclosed (Patent Document 1).
With regard to lung adenocarcinoma, yet another group has a gene set for identifying lung adenocarcinoma, a gene set for determining pleural infiltration of lung adenocarcinoma, and a gene set for predicting recurrence of lung adenocarcinoma (Patent Documents 2 to 4). Among these, Patent Literature 4 describes a method for predicting postoperative recurrence of lung adenocarcinoma and a set of 45 genes, and the discrimination rate of lung adenocarcinoma by this gene set is 50% or more. It is described that there is. Non-Patent Document 3 discloses the prediction of recurrence of lung adenocarcinoma by 54 gene sets, which also describes the accuracy of recurrence by a conventional method for determining the prognosis of lung adenocarcinoma patients. The difficulty of prediction is described.
International Publication WO2007 / 043418 JP2007-6791A JP2007-6792A JP2007-135466 D. G. Beer et al., Nature Medicine 2002, 8 (8): 816-824. Shuta Hamada and Takahashi Takahashi, “New development of diagnosis and treatment of lung cancer based on expression profile analysis” Experimental Medicine 2004, 22 (14): 45-50, Yodosha (Japan) J. et al. E. Larsen et al., Clinical Cancer Research 2007, 13: 2946-2954.

癌患者のなかには、腫瘍の外科切除後に転移、再発などによって予後が著しく悪く5年以内に死亡する患者もいれば、逆に、転移や再発のない、すなわち予後が良好である患者もいる。本発明者らは、我国の肺癌患者に比較的多い肺腺癌患者において、肺癌の予後予測において特に再発の予測を高い確度で可能とする方法がないことに注目してきた。肺癌の外科手術後の再発予測は様々な要因が関連するため、その予測が非常に困難である。もし肺腺癌患者の再発を極めて高い確度で予測可能であれば、現在手術後に後治療なしで経過観察の対象となっている患者群のなかに治療を必要とする一群を同定することが可能となり、その予後を改善できる可能性があると考えられる。
従来の肺腺癌の再発予測法では、leave−one−out cross−validationを利用して再発リスクを予測することができる遺伝子セットを同定している。このとき、もし判定不能という判定基準を用いるときには、判定不能症例がどの程度の割合で含まれるかによって見かけの判別率と真の判別率が極端に異なる場合がある。また、leave−one−out cross−validationでは、解析対象となるデータが極めて少ない場合において、繰り返し計算も少なく、予測モデルの精度を評価する有効な手法ではあるが、望むらくは、解析対象データを増やし、かつ、10−foldクロスバリデーション法とランダム分割を取り入れた繰り返し計算を行い、より精確なモデルの評価を行うことが好ましい。
さらにまた、マイクロアレイを利用した癌細胞の網羅的遺伝子発現プロファイリングと臨床アウトカムを関連付ける際には、サンプリングの仕方、プラットフォームの違い、統計解析の違いなどによって、再現性や信頼性に疑義が生じることがあると指摘されている(例えば、松井茂之,実験医学2007,25(17):72−78(増刊)羊土社(日本))。
本発明の目的は、肺腺癌患者において肺癌の外科切除後の肺腺癌の再発を予測する際に、肺腺癌の再発を極めて高い確度で予測するための方法及び組成物を提供することである。
本発明者らは、判定不能の判定手法と異なる、全ての症例に高再発リスクか低再発リスクのいずれかの判定を提示する手法であること、また、従来の再発予測遺伝子セットと異なる、82種類の遺伝子からなる新規の遺伝子セットを該判定のために使用することによって、評価モデルにおいて70%超の確度で再発の有無を予測することを可能にし、本発明を完成した。
本発明は、要約すると、以下の特徴を包含する。
本発明は、第1の態様において、肺腺癌患者において肺癌の外科切除後の肺腺癌の再発を予測するための方法であって、配列番号1〜82の各ヌクレオチド配列を含む遺伝子からなる群から選択される2〜82個の遺伝子の遺伝子セットの発現を該患者由来の生物学的サンプルにおいて測定することを含み、ここで、配列番号1〜5、8〜9、12、14〜15、17、19〜21、23〜28、30〜33、35〜59、61〜68、70〜82のいずれかのヌクレオチド配列を含む遺伝子の発現が術後無再発症例と比べて相対的に高い場合、或いは、配列番号6〜7、10〜11、13、16、18、22、29、34、60、69のいずれかのヌクレオチド配列を含む遺伝子の発現が術後無再発症例と比べて相対的に低い場合、肺腺癌の再発が高いと予測することを特徴とする、上記方法を提供する。
本発明の実施形態によれば、上記遺伝子セットの遺伝子数は5以上82以下である。
本発明の別の実施形態によれば、上記遺伝子セットの発現の測定は、上記遺伝子に対応する核酸又はタンパク質の存在もしくは量を測定することによって行なわれる。
本発明の別の実施形態によれば、上記遺伝子セットの発現の測定は、ハイブリダイゼーション法又は定量PCR法によって行なわれる。
本発明の実施形態によれば、上記ハイブリダイゼーション法は、マイクロアレイ法又はブロット法である。
本発明の実施形態によれば、上記ハイブリダイゼーション法は、上記遺伝子由来のRNA転写産物、cRNA、aRNA又はcDNAとハイブリダイズする核酸を用いて行なわれる。
本発明の別の実施形態によれば、上記遺伝子セットの発現の測定は、免疫学的方法によって行なわれる。
本発明の実施形態によれば、上記免疫学的方法は、上記遺伝子によってコードされるタンパク質又はその断片に対する抗体を用いて行なわれる。
本発明は、第2の態様において、肺腺癌患者において肺癌の外科切除後の肺腺癌の再発を予測するための組成物であって、該組成物が、配列番号1〜82のいずれかのヌクレオチド配列を含む2以上の異なる遺伝子の発現を測定することを可能にする複数の核酸を含み、該核酸が、
(1)配列番号1〜82に示されるヌクレオチド配列、それに相補的なヌクレオチド配列、或いはそれらのヌクレオチド配列中の連続する15塩基から全塩基数未満の部分配列を有する核酸、及び
(2)配列番号1〜82に示されるヌクレオチド配列又はそれに相補的なヌクレオチド配列を含む核酸とハイブリダイズする核酸、或いは該ハイブリダイズする核酸の連続する15塩基から全塩基数未満の部分配列を有する核酸、
からなる群から選択されることを特徴とする、上記組成物を提供する。
本発明の実施形態において、上記組成物は、キット、マイクロアレイ又はプライマーセットの形態である。
本発明の別の実施形態において、上記核酸は、5種類以上から82種類以下の遺伝子の発現の測定を可能にする。
本発明の別の実施形態において、上記組成物は、本発明の上記方法で使用するためのものである。
本発明は、第3の態様において、肺腺癌患者において肺癌の外科切除後の肺腺癌の再発を予測するための組成物であって、該組成物が、配列番号1〜82のいずれかのヌクレオチド配列を含む2以上の異なる遺伝子の発現産物を測定することを可能にする複数の抗体を含み、該抗体が、配列番号1〜82に示されるいずれかのヌクレオチド配列によってコードされるタンパク質又は該タンパク質のアミノ酸配列の連続する少なくとも8アミノ酸残基からなるポリペプチドと免疫学的に反応する抗体、及び該抗体の断片、からなる群から選択されることを特徴とする、上記組成物を提供する。
本発明の実施形態において、上記組成物は、キットの形態である。
本発明の別の実施形態において、上記抗体プローブは、5種類以上から82種類以下の遺伝子の発現産物の測定を可能にする。
本発明の別の実施形態において、上記組成物は、本発明の上記方法で使用するためのものである。
本明細書中、「術後再発」は、肺腺癌の外科切除後に患者が肺腺癌を再発することを意味する。再発すると予測された患者は、高再発リスクであると判定され、低い生存率を有する。これに対して、無再発と予測された患者は、低再発リスクであると判定され、高い生存率を有する。
本明細書中、「患者」は、ヒトを含む哺乳動物を指し、好ましい哺乳動物はヒトである。
本明細書中、「核酸」は、DNA又はRNAのいずれかであり、例えば各遺伝子の転写産物(mRNA)、cRNA、aRNA、cDNAなどが含まれる。
本明細書中、「遺伝子」は、特定のタンパク質をコードし、エクソン、イントロン、5’−及び3’−非翻訳領域などによって構成され、その転写によって前駆体mRNAの形成を可能にし、さらにスプライシング事象を経てmRNAとなり、タンパク質へと翻訳される。
本明細書中、「タンパク質」は、特定の遺伝子によってコードされるタンパク質、その変異体又はその断片を包含する。このような変異体は、スプライシング、多型性などの天然事象に基づく変異体を含む。また、このような断片は、生体内でプロテアーゼ、ペプチダーゼなどの酵素作用によって自然発生的に生じたタンパク質断片である。
本明細書中、「ハイブリダイゼーション」は、核酸と核酸との塩基対合による二本鎖の形成反応である。ハイブリダイゼーションには、DNA−DNAハイブリダイゼーション、DNA−RNAハイブリダイゼーション、及びRNA−RNAハイブリダイゼーションが含まれる。ハイブリダイゼーションは、通常、固体支持体上に固定された核酸プローブを用いて行われる。固体支持体は、プラスチック又はポリマー、ガラスなどの材質で、テストプレート、試験管、試験片、チップなどの形状としうる。ハイブリダイゼーションでは、温度、イオン強度、界面活性剤の濃度、ホルムアミドの有無、核酸のGC含量などが、ハイブリッドの安定性やハイブリダイゼーション速度に影響を与える。一般に、温度が高い、又はイオン強度が高いほど、すなわち厳しい(ストリンジェントな)条件ほど、ハイブリッドの安定性は低下し、逆にハイブリダイゼーションの特異性が増大する。ハイブリダイゼーションについては、Ausbel FMら,Short Protocols in Molecular Biology(3版)A Compendium of Method s from Current Protocols in Molecular Biology,1995年,John Wiley & Sons,Inc.(米国)に記載されている。
本明細書中、「免疫学的」とは、抗原と抗体との複合体を形成することを意味する。このような複合体を形成する反応を、免疫学的反応と称し、この反応を利用して抗原又は抗体を検出又は定量する方法を、免疫学的方法と称する。免疫学的方法は、固相又は液相、均一又は不均一などの条件下で行うことができ、このとき抗原−抗体複合体の検出は、標識(例えば色素、蛍光性物質、放射性同位元素、酵素など)を利用する方法、凝集を利用する方法(例えばラテックス法など)、濁度を利用する方法、免疫沈降を利用する方法、二次抗体を利用する方法(例えばサンドイッチ法)などによって行うことができる。
本明細書は本願の優先権の基礎である日本国特許出願2007−339214号の明細書および/または図面に記載される内容を包含する。
Some cancer patients have a very poor prognosis due to metastasis or recurrence after surgical resection of the tumor, and die within 5 years. Conversely, some patients have no metastasis or recurrence, that is, have a good prognosis. The inventors of the present invention have noted that there is no method that enables prediction of recurrence with high accuracy in lung cancer prognosis prediction in lung adenocarcinoma patients, which is relatively common among lung cancer patients in Japan. Predicting recurrence after surgery for lung cancer is very difficult because it involves various factors. If the recurrence of patients with lung adenocarcinoma can be predicted with extremely high accuracy, it is possible to identify a group of patients who need treatment in the group of patients currently undergoing follow-up without post-treatment after surgery Therefore, the prognosis may be improved.
In a conventional method for predicting recurrence of lung adenocarcinoma, a gene set capable of predicting recurrence risk is identified using leave-one-out cross-validation. At this time, if the determination criterion that determination is impossible is used, the apparent discrimination rate and the true discrimination rate may be extremely different depending on the percentage of cases where the determination is not possible. In addition, leave-one-out cross-validation is an effective method for evaluating the accuracy of a prediction model with few repetitive calculations when the data to be analyzed is very small. It is preferable to perform a more accurate evaluation of the model by increasing and performing repeated calculation incorporating the 10-fold cross-validation method and random division.
Furthermore, when comprehensive gene expression profiling of cancer cells using microarrays is associated with clinical outcomes, reproducibility and reliability may be questioned due to sampling methods, platform differences, statistical analysis differences, etc. It has been pointed out (for example, Shigeyuki Matsui, Experimental Medicine 2007, 25 (17): 72-78 (Special Issue) Yodosha (Japan)).
An object of the present invention is to provide a method and composition for predicting recurrence of lung adenocarcinoma with extremely high accuracy when predicting recurrence of lung adenocarcinoma after surgical resection of lung cancer in patients with lung adenocarcinoma. It is.
The present inventors are a method for presenting a determination of either high recurrence risk or low recurrence risk to all cases, which is different from the determination method incapable of determination, and is different from the conventional recurrence prediction gene set, 82 By using a new gene set consisting of different types of genes for the determination, it was possible to predict the presence or absence of recurrence with an accuracy of more than 70% in the evaluation model, thereby completing the present invention.
In summary, the present invention encompasses the following features.
In the first aspect, the present invention is a method for predicting recurrence of lung adenocarcinoma after surgical resection of lung cancer in a lung adenocarcinoma patient, comprising a gene comprising each nucleotide sequence of SEQ ID NOs: 1 to 82 Measuring the expression of a gene set of 2 to 82 genes selected from the group in a biological sample from said patient, wherein SEQ ID NOs: 1-5, 8-9, 12, 14-15 , 17, 19-21, 23-28, 30-33, 35-59, 61-68, 70-82, the expression of the gene is relatively high compared to post-operative relapse-free cases Or the expression of a gene containing any one of the nucleotide sequences of SEQ ID NOs: 6-7, 10-11, 13, 16, 18, 22, 29, 34, 60, 69 is relative to that of a case without recurrence after surgery. Low, lung adenocarcinoma Recurrence and wherein the predicting high, provides the above method.
According to an embodiment of the present invention, the number of genes in the gene set is 5 or more and 82 or less.
According to another embodiment of the present invention, the expression of the gene set is measured by measuring the presence or amount of a nucleic acid or protein corresponding to the gene.
According to another embodiment of the present invention, the measurement of the expression of the gene set is performed by a hybridization method or a quantitative PCR method.
According to an embodiment of the present invention, the hybridization method is a microarray method or a blot method.
According to an embodiment of the present invention, the hybridization method is performed using a nucleic acid that hybridizes with an RNA transcript, cRNA, aRNA or cDNA derived from the gene.
According to another embodiment of the present invention, the measurement of the expression of the gene set is performed by an immunological method.
According to an embodiment of the present invention, the immunological method is performed using an antibody against a protein encoded by the gene or a fragment thereof.
In the second aspect, the present invention provides a composition for predicting recurrence of lung adenocarcinoma after surgical resection of lung cancer in a patient with lung adenocarcinoma, wherein the composition is any one of SEQ ID NOs: 1 to 82. Comprising a plurality of nucleic acids that make it possible to measure the expression of two or more different genes comprising the nucleotide sequence of:
(1) a nucleotide sequence represented by SEQ ID NOs: 1 to 82, a nucleotide sequence complementary thereto, or a nucleic acid having a partial sequence of 15 bases to less than the total number of bases in these nucleotide sequences, and (2) SEQ ID NO: A nucleic acid that hybridizes with a nucleic acid comprising the nucleotide sequence shown in 1-82 or a nucleotide sequence complementary thereto, or a nucleic acid having a partial sequence of less than the total number of bases from 15 consecutive bases of the hybridizing nucleic acid,
There is provided a composition as described above, characterized in that it is selected from the group consisting of:
In an embodiment of the invention, the composition is in the form of a kit, microarray or primer set.
In another embodiment of the invention, the nucleic acid allows measurement of the expression of 5 or more and 82 or less genes.
In another embodiment of the invention, the composition is for use in the method of the invention.
In the third aspect, the present invention provides a composition for predicting recurrence of lung adenocarcinoma after surgical resection of lung cancer in a lung adenocarcinoma patient, wherein the composition is any one of SEQ ID NOs: 1 to 82. A plurality of antibodies that make it possible to measure the expression products of two or more different genes comprising the nucleotide sequence of the protein encoded by any of the nucleotide sequences set forth in SEQ ID NOs: 1-82 or The composition is selected from the group consisting of an antibody that immunologically reacts with a polypeptide comprising at least 8 consecutive amino acid residues in the amino acid sequence of the protein, and a fragment of the antibody. To do.
In an embodiment of the invention, the composition is in the form of a kit.
In another embodiment of the present invention, the antibody probe allows measurement of expression products of 5 or more to 82 or less genes.
In another embodiment of the invention, the composition is for use in the method of the invention.
As used herein, “post-surgical recurrence” means that the patient relapses with lung adenocarcinoma after surgical resection of lung adenocarcinoma. Patients predicted to relapse are determined to be at high risk of relapse and have a low survival rate. In contrast, patients predicted to have no recurrence are determined to be at low risk of recurrence and have a high survival rate.
As used herein, “patient” refers to mammals including humans, and preferred mammals are humans.
In the present specification, the “nucleic acid” is either DNA or RNA, and includes, for example, transcription products (mRNA), cRNA, aRNA, cDNA and the like of each gene.
In the present specification, a “gene” encodes a specific protein and is composed of exons, introns, 5′- and 3′-untranslated regions, etc., and enables the formation of a precursor mRNA by its transcription, and further splicing After an event, it becomes mRNA and is translated into protein.
In the present specification, the “protein” includes a protein encoded by a specific gene, a variant thereof or a fragment thereof. Such variants include variants based on natural events such as splicing, polymorphisms and the like. Moreover, such a fragment is a protein fragment naturally generated by an enzyme action such as protease or peptidase in a living body.
In the present specification, “hybridization” is a reaction for forming a double strand by base pairing between a nucleic acid and a nucleic acid. Hybridization includes DNA-DNA hybridization, DNA-RNA hybridization, and RNA-RNA hybridization. Hybridization is usually performed using a nucleic acid probe immobilized on a solid support. The solid support is made of a material such as plastic, polymer, or glass, and may be in the shape of a test plate, a test tube, a test piece, a chip, or the like. In hybridization, temperature, ionic strength, surfactant concentration, presence or absence of formamide, GC content of nucleic acid, and the like affect the stability and hybridization rate of the hybrid. In general, the higher the temperature or the higher the ionic strength, that is, the more stringent (stringent) conditions, the lower the stability of the hybrid and, conversely, the higher the specificity of hybridization. For hybridization, see Ausbel FM et al., Short Protocols in Molecular Biology (3rd edition) A Complementum Methods from Current Protocols in Molecular Biology, 1995, John Ins. (United States).
In the present specification, “immunological” means forming a complex of an antigen and an antibody. A reaction that forms such a complex is referred to as an immunological reaction, and a method of detecting or quantifying an antigen or antibody using this reaction is referred to as an immunological method. The immunological method can be performed under conditions such as solid phase or liquid phase, homogeneous or heterogeneous, wherein the detection of the antigen-antibody complex is performed by labeling (eg, dye, fluorescent material, radioisotope, Enzymes, etc.), aggregation methods (eg, latex method), turbidity methods, immunoprecipitation methods, secondary antibody methods (eg, sandwich method), etc. Can do.
This specification includes the contents described in the specification and / or drawings of Japanese Patent Application No. 2007-339214, which is the basis of the priority of the present application.

図1は、訓練セットをランダムに10分割する10−fold cross−validationを100回繰り返すことを使用して再発関連シグネチャを同定するための訓練−有効性戦略の概略図を示す。
図2は、再発関連シグネチャを同定するための訓練手順の結果を示す。図2Aは、再発関連シグネチャを規定するための最適プローブ数の探索結果を示す。Kaplan−Meier生存曲線を用いて訓練群における生存率を評価した。全ステージ(図2B)及びステージI(図2C)における患者の再発関連曲線も示す。
図3は、訓練データセットにおけるEGFR変異(図3A)、K−ras変異(図3B)及びp53変異(図3C)の存在又は非存在におけるKaplan−Meier生存曲線を示す。
図4は、評価セットIおよび評価セットIIを用いたRRS−82シグネチャの有効性を示す。Kaplan−Meier生存曲線を、RRS−82に基いて予測したリスクに従って示した。図4Aは全ステージの無再発生存曲線を示し、図4Bは全ステージの全生存曲線、図4CはステージIの無再発生存曲線、また、4DステージIの全生存曲線を示す。また、ステージIのみのサンプルからなる評価セットIIを用いた無再発生存曲線を図4Eに、全生存曲線を図4Fに示した。さたに、評価セットI+IIにおける無再発生存曲線を図4G、全生存曲線を図4Hに示す。
図5は、RRS−82に基づくリスク群とTNMステージとの関係を示す。図5Aは、低リスクRRS−82シグネチャをもつ患者の無再発生存曲線、図5Bは、高リスクRRS−82シグネチャをもつ患者の無再発生存曲線をそれぞれ示す。
図6は、独立したデータセットの解析により、RRS−82シグネチャの有効性を示す。図6Aは、39個の肺腺癌からなるDuke大学のデータセットに、RRS−82シグネチャの構成成分を用いて行った教師無し階層的クラスタリング解析結果を示し、図6BはクラスターI及びIIのKaplan−Meier生存曲線を示す。また、図6CはMichigan大学のデータセットを用いて、予測モデルを構築する概念図を示す。図6Dは図6Cにより構築されたモデルを用いて、Memorial Sloan−Ketteringがんセンターの遺伝子発現データ104サンプルを解析したKaplan−Meier生存曲線を示す。
図7は、訓練データセットでのKaplan−Meier生存の評価を示す。図7Aは、全ステージの複数の患者でのRRS−82シグネチャによる全生存曲線を示し、また、図7Bは、ステージIの複数の患者でのRRS−82シグネチャによる全生存曲線を示す。
図8は、評価セットI中ステージII〜III症例での、RRS−82シグネチャによるKaplan−Meier生存の評価を示す。ステージII〜III患者のうち、無再発(図8A)及び全生存(図8B)は、高リスクシグネチャを有する患者と比べて低リスクRRS−82シグネチャを有する患者の場合に良好となる傾向があったが統計的に有意ではなかった。
図9は、評価セットIにおいて、RRS−82シグネチャとステージの関連性を、Kaplan−Meier生存曲線を用いて評価した。図9Aに示す低リスク群では、ステージI症例とステージII−III症例の比較において、統計的に有意ではないが、ステージI症例の全生存曲線が良好となる傾向がある。図9Bに示す高リスク群では、ステージI症例とステージII−III症例の比較において、全生存曲線はほぼ同一曲線となっている。
FIG. 1 shows a schematic diagram of a training-effectiveness strategy for identifying recurrence-related signatures using 100 iterations of 10-fold cross-validation that randomly divides a training set into ten.
FIG. 2 shows the results of a training procedure for identifying recurrence-related signatures. FIG. 2A shows the search result of the optimal number of probes for defining the recurrence-related signature. Survival in the training group was assessed using the Kaplan-Meier survival curve. Also shown are patient-related recurrence-related curves at all stages (Figure 2B) and Stage I (Figure 2C).
FIG. 3 shows Kaplan-Meier survival curves in the presence or absence of EGFR mutation (FIG. 3A), K-ras mutation (FIG. 3B) and p53 mutation (FIG. 3C) in the training data set.
FIG. 4 shows the effectiveness of the RRS-82 signature using evaluation set I and evaluation set II. Kaplan-Meier survival curves were shown according to the predicted risk based on RRS-82. 4A shows the relapse-free survival curve for all stages, FIG. 4B shows the overall survival curve for all stages, FIG. 4C shows the relapse-free survival curve for stage I, and the overall survival curve for 4D stage I. In addition, a recurrence-free survival curve using evaluation set II consisting of samples of stage I only is shown in FIG. 4E, and an overall survival curve is shown in FIG. 4F. Furthermore, the recurrence-free survival curve in evaluation set I + II is shown in FIG. 4G, and the overall survival curve is shown in FIG. 4H.
FIG. 5 shows the relationship between the risk group based on RRS-82 and the TNM stage. FIG. 5A shows a relapse-free survival curve for a patient with a low-risk RRS-82 signature, and FIG. 5B shows a relapse-free survival curve for a patient with a high-risk RRS-82 signature.
FIG. 6 shows the validity of the RRS-82 signature by analysis of an independent data set. FIG. 6A shows the results of unsupervised hierarchical clustering analysis performed on the Duke University data set of 39 lung adenocarcinomas using components of the RRS-82 signature, and FIG. 6B shows Kaplan for clusters I and II. -Show Meier survival curves. FIG. 6C shows a conceptual diagram for constructing a prediction model using a Michigan University data set. FIG. 6D shows a Kaplan-Meier survival curve in which 104 samples of gene expression data from the Memorial Sloan-Kettering cancer center were analyzed using the model constructed according to FIG. 6C.
FIG. 7 shows an assessment of Kaplan-Meier survival on a training data set. FIG. 7A shows the overall survival curve with the RRS-82 signature for multiple patients at all stages, and FIG. 7B shows the overall survival curve with the RRS-82 signature for multiple patients at stage I.
FIG. 8 shows an evaluation of Kaplan-Meier survival with RRS-82 signature in stage II-III cases in Evaluation Set I. Of stage II-III patients, recurrence free (FIG. 8A) and overall survival (FIG. 8B) tended to be better for patients with a low risk RRS-82 signature compared to patients with a high risk signature. However, it was not statistically significant.
FIG. 9 evaluated the relationship between RRS-82 signature and stage in evaluation set I using a Kaplan-Meier survival curve. In the low-risk group shown in FIG. 9A, in the comparison between the stage I case and the stage II-III case, the overall survival curve of the stage I case tends to be good, although it is not statistically significant. In the high-risk group shown in FIG. 9B, the overall survival curve is almost the same curve in the comparison between the stage I case and the stage II-III case.

本発明は、上記のとおり、肺腺癌患者において肺癌の外科切除後の肺腺癌の再発を高い確度で予測するための方法を提供する。このような高い確度での予測を可能にしたのは、一部には、肺腺癌患者のうち術後再発症例及び術後無再発症例を専門医の見識と経験に基いて厳密に選択し、信頼性の高い統計学的手法を使用するなどの条件下で、肺腺癌患者での術後再発/無再発に関連して従来未公表の82個の遺伝子セットを見出したことに基づいている。
<遺伝子セットの決定>
本発明では、肺腺癌患者において肺癌の外科切除後の肺腺癌の再発を予測するための82個の異なる遺伝子からなるセットを見出したが、この遺伝子セットを決定した手順について以下に説明する。
背景技術に記載したように、肺腺癌の術後再発を予測するための遺伝子セットがいくつかのグループによって報告されているが、数万の遺伝子群から予測可能であると記載される遺伝子セットの各々は、互いに重複がないか、さもなくば重複が極めて低い。本発明者らが見出した82遺伝子セットについても、例えば特開2007−135466に記載された45遺伝子セットと重複する遺伝子はないし、また、J.E.Larsenら,Clinical Cancer Research 2007,13:2946−2954に記載された54遺伝子セットと重複する遺伝子はわずかに1個のみである。しかし、図2Aで証明されるように、単一の遺伝子を用いて再発予測を実施するときの正答率(すなわち、[正答数/(正答数+誤答数)]×100(%))は、著しく低下する。正答率を高めるためには、複数の、好ましくは5以上の、より好ましくは10以上の、さらに好ましくは30以上の、最も好ましくは82の遺伝子からなるセットを使用することが望ましい。たとえ82超の遺伝子を使用したとしても正答率はよくなるどころか逆に悪化する傾向を、図2Aは示している。
後述の実施例に記載するように、本発明者らは、切除手術を受けた肺腺癌患者から87の肺腺癌サンプルを用意し、このうち60をランダムに訓練セットに割り当て、残りの27を評価セットとして用いた。訓練セットのサンプルについて、バックグラウンドの発現量を超えるプローブを選択し、このフィルタリング基準を満たしたプローブシグナルを用いて、教師付きクラス分類技術(重み付き投票アルゴリズム;Yanagisawaら,J.Natl.Cancer Inst.99:858−67,2007)によって、再発の高リスク又は低リスクを平均75%以上の高い確度で予測可能にする82遺伝子を再発関連シグネチャ(すなわち、再発するか又は再発するリスクが高い、あるいは、再発しないか又は再発するリスクが低い)として同定した。このとき、無再発シグネチャを同定するプローブシグナルの選択するために、10−foldクロスバリデーション法を用いた。この方法の概略は図1に示されている。
10−foldクロスバリデーション法は、例えば100サンプルを10サンプルずつに10分割し、この10分割から1分割を除いた残り9分割について特性(再発関連シグネチャ)の選択を行い、選択されたトップ1位から最大200位までの予測プローブからなる分類器を構築し、除いた1分割の分類を行う。次に、除いた1分割を元に戻した10分割の中から別の1分割を除いた残り9分割について同様にシグネチャの選択を行い、選択されたトップ1位から最大200位までの予測されたプローブからなる分類器を構築し、除いた別の1分割の分類を行う。同様の操作を合計10回行う。ここで、例えば100サンプルを10分割する割り当て方は無数に存在する事を考慮し、割り当て方による偏りを低減するために、無作為(ランダム)に100通りの方法で100サンプルを10分割した。このようにして、100通りの無作為分割毎に10−foldクロスバリデーション法を施行した計1000個の独立したセットに対して、最大200個の予測プローブからなる分類器を構築した。その結果、学習エラーが最小となる予測プローブ数82を見出し(図2A)、独立した1,000個のセット間で最も高頻度に共有されている82個のプローブを再発関連シグネチャとして同定し、このようにして最終分類器を構築する。
上記のように構築された分類器を使用して、テストサンプルの分類を行う。テストサンプルとして、ランダムに選択された肺腺癌患者から切除された肺腺癌の27評価サンプルが使用された。Kaplan−Meier生存曲線とCox比例ハザードモデル分析を用いて、評価サンプルから得られた再発関連シグネチャと、全生存(overall survival)及び無再発生存(relapse−free survival)との関係を分析する。その結果、本発明の82遺伝子セット(「RRS−82」という)は、再発・死亡の高リスク患者と、無再発・高生存の低リスク患者とを75%以上、好ましくは80%以上、さらに好ましくは90%以上の高い確度で判別することができる。
RRS−82は、配列番号1〜82の各ヌクレオチド配列を含む82種の遺伝子からなるセットである、この遺伝子セットを表1に示す、
上記表中のNo.1からNo.82はそれぞれ、配列番号1から配列番号82に対応している。82種の遺伝子を、術後無再発症例との相対的発現差を基に、再発関連シグネチャ、すなわち再発(死亡)シグネチャ又は高再発リスクシグネチャ及び無再発シグネチャ又は低再発リスクシグネチャ、について分類すると、次の2つの群に分けることができた。
(1)配列番号1〜5、8〜9、12、14〜15、17、19〜21、23〜28、30〜33、35〜59、61〜68、70〜82の各ヌクレオチド配列を含む遺伝子の発現が術後無再発症例と比べて相対的に高い場合、肺腺癌の再発が高いと予測できる群(あるいは、相対的発現が低い場合、肺腺癌の再発が低いと予測できる群)、及び
(2)配列番号6〜7、10〜11、13、16、18、22、29、34、60、69の各ヌクレオチド配列を含む遺伝子の発現が術後無再発症例と比べて相対的に低い場合、肺腺癌の再発が高いと予測できる群(あるいは、相対的発現が高い場合、肺腺癌の再発が低いと予測される)。
すなわち、上記(1)群の遺伝子の場合、肺腺癌患者を、相対的発現が高いか低いかによって再発(死亡)患者又は高リスク患者、あるいは、無再発患者又は低再発リスク患者として予測・分類することができる。また、上記(2)群の遺伝子の場合、逆に、肺腺癌患者を、相対的発現が低いか高いかによって無再発患者又は低リスク患者、あるいは、再発(死亡)患者又は高リスク患者として予測・分類することができる。
本発明方法によって再発又は高リスクと判定されたならば、肺腺癌患者の術後再発を抑制するための治療計画を早期に立案することが可能になるし、一方、無再発又は低リスクと判定されたならば、無用の化学療法や放射線治療を避けるための判断材料ともなりうる。
上記遺伝子の相対的発現レベルを比較する際の対照は、術後無再発症例であり、上記の予測を可能にするならば、術後一定期間(例えば3年、好ましくは5年、より好ましくは10年)無再発と判定された患者由来のサンプル(肺腺癌組織又は細胞)である。
本発明におけるRRS−82と、EGFR、K−ras又はp53遺伝子変異との間に統計的に有意な関連は見出されていない(図3)。
本発明におけるRRS−82の判別能力を、評価セット(27肺腺癌サンプル)を用いて検証したときには、RRS−82の高リスクシグネチャを示した全ての患者が5年以内に肺腺癌を再発し、一方、低リスクシグネチャを示した患者の約70%が5年後に再発の兆候を示さなかった(図4)。この意味では、本発明の方法は、肺腺癌患者における術後再発の高リスク群を予測するうえで極めて有効であるといえる。
本発明の方法による再発・無再発予測は、腫瘍のステージに関わらず実施可能であり、興味深いことに早期のステージであっても実施可能である。
<肺腺癌の術後再発の予測法>
本発明は、その一の態様において、肺腺癌患者において肺癌の外科切除後の肺腺癌の再発を予測するための方法であって、配列番号1〜82の各ヌクレオチド配列を含む遺伝子からなる群から選択される2〜82個の遺伝子の遺伝子セットの発現を該患者由来の生物学的サンプルにおいて測定することを含み、ここで、配列番号1〜5、8〜9、12、14〜15、17、19〜21、23〜28、30〜33、35〜59、61〜68、70〜82のいずれかのヌクレオチド配列を含む遺伝子の発現が術後無再発症例と比べて相対的に高い場合、或いは、配列番号6〜7、10〜11、13、16、18、22、29、34、60、69のいずれかのヌクレオチド配列を含む遺伝子の発現が術後無再発症例と比べて相対的に低い場合、肺腺癌の再発が高いと予測することを特徴とする上記方法を提供する。
上記82種の遺伝子は、上記のとおり、配列番号1〜82によって示されるヌクレオチド配列を含むヒト遺伝子である。生物由来の遺伝子であるがゆえに、多型変異、スプライス変異、突然変異などの変異が生じることもあると考えられる。したがって、本発明の対象遺伝子は、配列番号1〜82によって示されるヌクレオチド配列だけでなく、これらの配列中に1もしくは数個のヌクレオチドの欠失、置換又は付加を含むことができるし、あるいは、これらの配列に対し少なくとも95%、好ましくは少なくとも97%、より好ましくは少なくとも98%、最も好ましくは少なくとも99%の同一性を有しうる。
本明細書で使用する「同一性(%)」という用語は、ギャップを導入した或いはギャップを導入しない公知のBLAST又はFASTAアルゴリズムを用いて決定することができる(Karlin及びAltschul,1993,Proc.Natl.Acad.Sci.U.S.A.,90:5873−5877;Karlin及びAltschul,1990,Proc.Natl.Acd.Sci.U.S.A.,87:2264−2268;Altschulら,1990,J.Mol.Biol.,215:403;Altschulら,1997,Nucleic Acids Res.,25:3389−3402)。一般に、全塩基数に対する一致した塩基数の百分率として同一性(%)を算出できる。
本明細書で使用する「数個」という用語は、2から10までの整数を指し、すなわち2、3、4、5、6、7、8、9又は10のいずれかであり、好ましくは2から5までの整数、より好ましくは2又は3である。
本発明では、遺伝子セットにおける遺伝子数が2〜全数(82)であり、この範囲の遺伝子数であれば、術後再発を予測することができる。しかしながら、予測確度(又は精度)をより高めるためには、遺伝子数を5〜82とすることが好ましく、さらに好ましい範囲は10〜82、もっと好ましい範囲は30〜82、例えば40〜82、50〜82、60〜82,70〜82であり、最も好ましい遺伝子数は82である。
遺伝子の発現は、核酸か又はタンパク質の量又は存在について測定することができる。核酸の測定においては、各遺伝子の転写産物であるmRNA及びその誘導体核酸、例えばcDNA、cRNA及びaRNA(antisense amplified RNA)を測定対象とすることができる。一方、タンパク質の測定においては、各遺伝子によってコードされるタンパク質(発現産物又は遺伝子産物ともいう)、その断片又はその翻訳後修飾産物(例えば糖などによる修飾)を測定対象としうる。
以下に、上記の82遺伝子の発現を、核酸及びタンパク質レベルで測定するための手法について説明する。
テストサンプルは、肺腺癌患者の肺腺癌組織又細胞であり、これは手術によって切除された癌組織、あるいは、生検によって得られた組織又は細胞などである。
核酸による遺伝子発現の測定
本発明方法において、82種の遺伝子の発現を検出するために、以下の核酸をプローブ又はプライマーとして使用することができる。
(1)配列番号1〜82に示されるヌクレオチド配列、それに相補的なヌクレオチド配列、或いはそれらのヌクレオチド配列中の連続する15塩基から全塩基数未満の部分配列を有する核酸、及び
(2)配列番号1〜82に示されるヌクレオチド配列又はそれに相補的なヌクレオチド配列を含む核酸とハイブリダイズする核酸、或いは該ハイブリダイズする核酸の連続する15塩基から全塩基数未満の部分配列を有する核酸。
上記の部分配列からなる核酸断片のサイズは、15塩基から全塩基数未満であり、例えば17塩基以上、20塩基以上、30塩基以上、50塩基以上、70塩基以上、100塩基以上、150塩基以上、200塩基以上、300塩基以上、400塩基以上又は500塩基以上から全塩基数未満の範囲である。
上記核酸は、約100塩基以下のDNA分子であれば、ホスホアミダイト法などを利用する市販のDNA自動合成装置を用いて合成するか、或いは、約100塩基超のDNA分子であれば、cDNAクローニングやポリメラーゼ連鎖反応(PCR)によって作製することができる。また、cRNAやaRNAは、市販キット等を用いてcDNAから作製しうる。
cDNAクローニング及びPCR法では、肺腺癌組織から全RNAを取得し、オリゴdTセルロースカラム処理によってポリA(+)RNAを得たのち、逆転写−ポリメラーゼ連鎖反応(RT−PCR)法によってcDNAライブラリーを作製し、このライブラリーから、配列番号1〜82に示されたヌクレオチド配列に基づいて作製した15塩基以上の長さのプローブ又はプライマーを用いて目的の遺伝子に対応するcDNAを選抜/クローニング又はPCR増幅することができる。プローブは、cDNA配列に相補的な配列を有し、その長さは、好ましくは20塩基以上、より好ましくは30塩基以上、さらに好ましくは50塩基以上である。また、プライマーは、センスプライマー及びアンチセンスプライマーからなり、その長さは、好ましくは15〜50塩基、より好ましくは17〜30塩基、さらに好ましくは20〜25塩基である。
上記のようにして得られたDNAは、市販又は文献記載のベクターに挿入したのち、原核又は真核生物の宿主細胞に導入し、増幅することができるし、或いは、目的DNAが挿入されたベクターを鋳型にしてPCR増幅することができる。
ベクターは、プラスミド、ファージ、プラスミド、ウイルスなどのベクターであり、例えばpBluescript系、pUC系、pBR系などのプラスミドである。ベクターは、目的DNAの他に、プロモーター、複製開始点、リボソーム結合配列(又はシャイン−ダルガルノ配列)、ターミネーター、選択マーカー配列(例えば薬剤耐性遺伝子)、マルチクローニングサイトなどを含むことができる。宿主細胞に適したベクターが市販されているのでそれを使用するのが望ましい。
原核宿主細胞は、細菌細胞であり、一般に大腸菌、枯草菌、シュードモナス属細菌などを含む。また、真核宿主細胞は、酵母、真菌、担子菌、動物細胞(昆虫細胞、哺乳動物細胞など)、植物細胞などを含む。
ベクターを宿主細胞に導入する方法もまた公知であり、例えばエレクトロポレーション、リン酸カルシウム法、スフェロプラスト融合法、プロトプラスト融合法、マイクロインジェクション、遺伝子銃法、アグロバクテリウム法などが含まれる。
上記の技術の詳細は、例えばJ.Sambrookら,Molecular Cloning A Laboratory Manual,1989年,Cold Spring Harbor Laboratory Press(米国);F.M.Ausbelら,Short Protocols in Molecular Biology(3版)A Compendium of Methods from Current Protocols in Molecular Biology,1995年,John Wiley & Sons,Inc.(米国)などに記載されている。
本発明方法で使用可能な核酸には、上記(2)のとおり、配列番号1〜82に示されるヌクレオチド配列又はそれに相補的なヌクレオチド配列を含む核酸とハイブリダイズする核酸、或いは該ハイブリダイズする核酸の連続する15塩基から全塩基数未満の部分配列を有する核酸である。ハイブリダイゼーションは、ストリンジェントな条件下のハイブリダイゼーションが好ましく、この条件では、上記ヌクレオチド配列と90%以上、好ましくは95%以上、より好ましくは98以上、最も好ましくは99%以上の同一性を有する配列の核酸とハイブリダイゼーションを起こすことができる。
上記の核酸を用いて82遺伝子セットの発現の測定を行う。好ましい測定法は、ハイブリダイゼーション法又は定量PCR法(例えばリアルタイムPCR法など)を含む。
ハイブリダイゼーションは、固体支持体の表面上に付着又は結合した核酸プローブに対し、それに部分的又は完全に相補的な核酸を、塩基対合を介して結合させて二本鎖を形成する手法をいう。固体支持体は、例えばテストプレート、試験管、試験片、アレイなどを含み、その材質は、通常、ポリマー(又はプラスチック、樹脂)、ガラスなどである。本発明方法で使用されるハイブリダイゼーションは、DNA−DNAハイブリダイゼーション、DNA−RNAハイブリダイゼーション又はRNA−RNAハイブリダイゼーションのいずれであってもよく、その方法には、非限定的に、例えばマイクロアレイ法、ブロット法、例えばノザンブロット、サザンブロット、ノザンハイブリダイゼーション、サザンハイブリダイゼーション、in situハイブリダイゼーションなどが含まれる。
マイクロアレイ法では、配列番号1〜82のヌクレオチド配列を含む遺伝子又はそれに対応する核酸(mRNA、cDNA、cRNA又はaRNA)とハイブリダイズする15塩基以上の核酸プローブを支持体に結合したマイクロアレイ(又はDNAチップ)を作製し使用する。マイクロアレイの表面には、核酸プローブを共有結合するための反応性基を含むスペーサーやクロスリンカーを導入することができる。アレイ表面と核酸プローブとの結合は、例えば光や熱による化学反応を介して行うことができる。
上記のハイブリダイゼーションは、ストリンジェントな条件下でハイブリダイゼーションを行うときには、核酸プローブとテスト用核酸との間でより特異的な結合が可能になる。ストリンジェントな条件は、上に定義した条件を含むが、ハイブリダイゼーション法の種類に応じて適宜最適な条件を決定することが望ましい。一般に、ストリンジェンシー(stringency)は、温度、溶液のイオン強度、ホルムアミドの存在、核酸の相対GC含量、インキュベーション時間などによって大きく左右される。温度は、オリゴヌクレオチドの50%がその相補鎖と解離するときの温度(Tm)の前後の温度範囲から最適温度を決めることができる。ストリンジェントな条件での温度は、通常、42〜68℃の範囲内の温度である。高ストリンジェントなハイブリダイゼーション条件は、例えば6×SSC、0.01M EDTA、1×デンハルト液、0.5%SDS中、68℃でのハイブリダイゼーション;1M NaCl、0.5%サルコシル、30%ホルムアミド中、60℃でのハイブリダイゼーション;0.1×SSC、0.1%SDS中、55℃での洗浄などである。ここで、1×SSCは150mM塩化ナトリウムと15mMクエン酸ナトリウム水溶液(pH7.2)である。
核酸プローブの固相化は、特に制限はないが、一般的な方法、例えばスポッター又はアレイヤーと呼ばれる高密度分注機を用いてDNAをスポットする方法、ノズルから液滴を噴射するインクジェット方式などの方法を用いて実施することができる。
肺腺癌患者から外科切除された肺腺癌組織テストサンプル由来のmRNAから誘導されたcDNA、cRNA、aRNAなどの核酸を、Cy染料(例えばCr3、Cy5)などの蛍光物質で標識し、マイクロアレイ上のプローブとハイブリダイズさせる。レーザースキャンによる読み取り装置を用いて蛍光強度を読み取り、コンピュータでデータ解析する。
ブロット法では、本発明の上記核酸プローブを放射性同位元素(例えば、32P及び35S)や蛍光物質(フルオレサミン、ローダミン、それらの誘導体、Cy染料など)などで標識したのち、ポリマーメンブレンに転写したテストサンプル中のmRNA、cDNA、cRNA、aRNAなどの核酸との間でハイブリダイゼーションを行う。シグナルを、放射線検出器又は蛍光検出器を用いて検出し、その強度を測定する。
定量リアルタイムPCR法では、肺腺癌組織テストサンプル中のmRNAから作製したcDNAを鋳型として標的の各遺伝子の領域が増幅できるように、プライマーをcDNAとアニーリングさせてPCRを行い、リアルタイムで増幅産物二本鎖DNAを検出する。増幅産物は1サイクル毎に指数関数的に増幅し、やがてプラトーに達する。段階希釈した標準サンプルを用いてリアルタイムPCRを行い、サイクル数を横軸に、PCR増幅量を縦軸にとり、サイクル数毎の増幅曲線を作成する。閾値を設定し、閾値と増幅曲線が交わる点Ct値(thresholdcycle)を算出する。Ct値は、PCR産物が一定量に達したときのサイクル数である。Ct値と初期鋳型DNA量の間に直線関係があるので、検量線を作成する。
増幅産物の検出は、インターカレーター法、蛍光標識プローブ法などの方法を用いて行うことができる。インターカレーター法は、例えばハイブリダイゼーションによって形成されたDNAの二本鎖の間に蛍光物質が結合する性質を利用して増幅産物量をモニターする方法である。蛍光標識プローブ法では、プローブを蛍光物質で標識し、増幅産物量を蛍光シグナルによってモニターする。この方法のなかには、5’末端に蛍光物質及び3’末端にクエンチャーを結合したプローブを使用する方法も知られている。
リアルタイムPCR装置が市販されているので、これを用いてリアルタイムPCR法を実施することができる。
PCRを実施する際の条件として、増幅サイズは80〜150bpの範囲とすること、プライマーサイズは17〜25塩基の範囲とすること、プライマー全体のGC含量は40〜60%の範囲とすること、プライマーの3’末端はG又はC、プライマー内部やプライマー間に3塩基以上相補する配列がないこと、上流プライマーと下流プライマーのTm値を2℃以内にそろえること、鋳型特異的プライマーを設計すること、などが知られている。
PCR条件は、例えば変性:92〜94℃で30〜60秒;アニーリング:50〜55℃で30〜60秒;伸長:68〜72℃で30〜60秒を1サイクルとして30〜40サイクルの反応を含む。逆転写酵素は、市販の酵素、例えばSuperScriptTM III(Invitrogen)、AMV Reverse Transcriptase、M−MLV Reverse Transcriptase(Promega)、SYBR Premix Ex Taq(タカラバイオ)などを使用することができる。
本発明において、再発と無再発との相対的発現レベル差は、1.1倍以上、好ましくは1.5倍以上、より好ましくは2.0倍以上である。
タンパク質による遺伝子発現の測定
本発明方法では、配列番号1〜82によって示されるヌクレオチド配列を含む遺伝子によってコードされるタンパク質又はその断片の量を測定することによって、遺伝子発現を測定することができる。この発現レベルの代替的測定法は、免疫学的方法である。
抗体を作製するためのタンパク質は、cDNAクローニング及び遺伝子組み換え技術を利用して作製することができる。
簡単に説明すると、例えば肺腺癌組織からcDNAライブラリーを作製し、配列番号1〜82の各ヌクレオチド配列に基いて合成したプライマーを用いるPCR法によってcDNAクローンを作製し、得られたcDNAクローンを発現ベクターに組み込み、該ベクターによって形質転換又はトランスフェクションされた原核又は真核宿主細胞を培養することによって該細胞又は培養上清から得ることができる。このとき、発現ベクターは市販又は文献記載のものを使用することができ、例えばプラスミド、コスミド、ファージなどである。ベクターは、目的タンパク質をコードするDNA、プロモーター、ポリアデニル化シグナル、リボソーム結合配列、複製開始点、ターミネーター、選択マーカーなどを含むことができる。ポリペプチドの分離・精製を容易にするために、標識(ポリ)ペプチド(例えばβ−ガラクトシダーゼ遺伝子など)、(His)6−10タグ、FLAGタグ(アミノ酸配列:DYKDDDDK(配列番号150))、GFP(緑色蛍光タンパク質)などのタンパク質又はオリゴペプチドと、目的タンパク質との融合タンパク質が形成されるように、それらに対応するDNA配列を含有させることもできる。
宿主細胞は、細菌などの原核細胞(例えば大腸菌、枯草菌、シュウドモナス属細菌など)、酵母(例えばサッカロマイセス属、シゾサッカロマイセス属、ピチア属など)、昆虫細胞(例えばSf細胞)、哺乳動物細胞(例えばCHO、COS、BHK、HEK293、NIH3T3など)などを含む。
上記のcDNAクローニング及び遺伝子組換え技術については、Sambrookら(上記)、Ausbelら(上記)などに記載されている。
このようにして得られた目的タンパク質は、ゲルろ過、イオン交換クロマトグラフィー、アフィニティクロマトグラフィー、疎水性クロマトグラフィー、等電点電気泳動、電気泳動、限外ろ過、塩析、透析などを単独で又は組み合わせて精製することができる。
本発明の遺伝子によってコードされるタンパク質は、配列番号83〜149に示されるアミノ酸配列を含む(この配列はそれぞれ、配列番号15〜21、23〜82のヌクレオチド配列によってコードされる。)。また、アミノ酸配列を記載していないタンパク質の配列は、GenBank(米国)、EMBL(欧州)などのデータベースにアクセスすることによって入手可能であるか、あるいは、それらに対応するヌクレオチド配列を利用するcDNAクローニング及びシークエンシングによって目的タンパク質のアミノ酸配列を決定することができる。
免疫学的方法では、上記の手法で得られたタンパク質又はその断片を抗原として用いてウサギ、マウス、ラット、ウマなどの哺乳動物を免疫し、それらの抗原に対する抗体を産生し、精製する。
抗体は、ポリクローナル抗体、モノクローナル抗体、抗ペプチド抗体、それらの抗体断片などを含む。
ポリクローナル抗体は、前記動物を適量(通常、μgオーダー)の抗原で皮下に免疫し、さらに約2〜3週間後に追加免疫し、初回免疫から約3週間〜2か月後に採血し、抗血清から目的のポリクローナル抗体を含むIgG成分を硫安分画、イオン交換クロマトグラフィーを使用して分離することによって作製することができる。このとき抗原に対する抗体の特異性を高めるために、得られたIgGを、目的タンパク質をセルロース又はアガロースなどの担体に結合して作製されたカラムに結合させたのち、高塩濃度のバッファーで溶出し、透析や限外ろ過などの方法で脱塩して、特異的ポリクローナル抗体を得ることができる。抗体価は、通常の免疫測定法、例えば酵素免疫測定法(ELISA)、放射性免疫測定法(RIA)、蛍光抗体法などによって測定することができる。
モノクローナル抗体は、例えば以下の一般的方法によって作製することができる(例えば長宗秀明と寺田弘,単クローン抗体−調製とキャラクタリゼーション,1990,広川書店;佐渡義一(2001)「ラットモノクローナル抗体作製の省力化」生化学73:1163−1167など)。
標的タンパク質又はその断片を、ポリクローナル抗体の作製と同様にマウス又はラット(例えばBalb/cマウス)の皮下に投与し、1〜4週間間隔で、約2〜4回追加免疫を行う。抗体価がプラトーに達したとき、抗原を静脈内または腹腔内に注射し、最終免疫とする。2〜5日後、抗体産生細胞(例えば脾臓細胞又はリンパ節細胞)を採取する。次いで、抗体産生細胞を骨髄腫細胞株(好ましくは、ヒポキサンチン・グアニン・ホスホリボシル・トランスフェラーゼ(HGPRT)欠損細胞株)に融合させてハイブリドーマ細胞を生成し、HAT(ヒポキサンチン、アミノプテリン、チミジン)選択を行う。細胞融合は、血清を含まないDMEM、RPMI−1640培地などの動物細胞培養用培地中で、抗体産生細胞と骨髄腫細胞株とを適当な割合で混合し、ポリエチレングリコールなどの細胞融合促進剤の存在下で実施する。目的の抗体かどうかの確認は、上記の免疫測定法によって行うことができる。さらに、ハイブリドーマの増殖のために、マウスの腹腔内にハイブリドーマを投与し、ハイブリドーマを増殖させたのち、1〜2週間後に腹水を採取する。抗体の精製は、硫安分画、イオン交換クロマトグラフィー、アフィニティクロマトグラフィー、ゲルクロマトグラフィーなどの方法を適宜組み合わせて行うことができる。
抗ペプチド抗体は、タンパク質の表面上のリニアーなペプチドに対する抗体であり、免疫学的特異性を高めることができる。そのようなペプチドは、例えばKyte−Doolittleらの親水性−疎水性領域の推定法、Eminiらによるタンパク質分子上の特定ペプチド部位の表面に位置する確率、ポリペプチド鎖の折れ曲がり程度、例えばChou−Fasmanらなどのαヘリックス、βシート、ターンを表示するタンパク質の二次構造予測、等を単独で又は組み合わせて使用して推定しうる。次いで、推定されたペプチドは、ペプチド合成機を用いて合成することができる。
上記の抗体類を、肺腺癌組織テストサンプル中の標的タンパク質又はその断片の検出のために使用することができる。多数の抗体をマイクロアレイ支持体上に結合した抗体マイクロアレイを作製することによって、或いは、多数の抗体をPVDF膜などのポリマー膜(フィルター)上にドットスポットするか、又はマルチウエルプレートなどの固相の表面に抗体を吸着させることによって、一度に多数の標的タンパク質を検出又は定量することが可能になる。また、慣用の免疫学的測定法、例えば酵素免疫測定法(ELISA、EIA)、蛍光抗体法、放射性免疫測定法(RIA)、発光免疫測定法、免疫比濁法、ラテックス凝集反応、ラテックス比濁法、赤血球凝集反応、粒子凝集反応またはウェスタンブロット法などによって、テストサンプル中の標的タンパク質又はその断片を検出又は定量することができる。
固相上で反応を行うときには、固相支持体として、ポリスチレン、ポリカーボネート、ポリエチレンなどのポリマーの膜、マルチウエルプレート、試験管、試験片(テストストリップ)、ラテックス、磁性体粒子などが含まれる。固定化は、物理的吸着か或いは化学的に行うことができる。化学的結合のためには、例えばマレイル化試薬、臭化シアンなどの試薬で固相を処理し、タンパク質のアミノ基などと反応する官能基を固相に導入することができる。
標識の例は、西洋ワサビペルオキシダーゼ、アルカリホスファターゼなどの酵素、フルオレセイン、ローダミン、それらの誘導体などの蛍光物質、ルシフェラーゼ系、ルミノール系などの発光物質、32P、125Iなどの放射性同位元素などが含まれる。標識化は、例えばグルタルアルデヒド法、マレイミド法、ピリジルジスルフィド法、クロラミンT法、ボルトンハンター法などを含む。
<術後再発予測用組成物>
本発明はまた、肺腺癌患者において肺癌の外科切除後の肺腺癌の再発を予測するための組成物であって、該組成物が、配列番号1〜82のいずれかのヌクレオチド配列を含む2以上から82種、好ましくは5以上から82種の異なる遺伝子の発現を測定することを可能にする複数の核酸を含み、該核酸が、
(1)配列番号1〜82に示されるヌクレオチド配列、それに相補的なヌクレオチド配列、或いはそれらのヌクレオチド配列中の連続する15塩基から全塩基数未満の部分配列を有する核酸、及び
(2)配列番号1〜82に示されるヌクレオチド配列又はそれに相補的なヌクレオチド配列を含む核酸とハイブリダイズする核酸、或いは該ハイブリダイズする核酸の連続する15塩基から全塩基数未満の部分配列を有する核酸、
からなる群から選択されることを特徴とする上記組成物を提供する。
本発明の組成物を構成する複数の核酸は、該組成物が、配列番号1〜82のいずれかのヌクレオチド配列を含む2以上から82種、好ましくは5以上から82種、より好ましくは10以上から82種、さらに好ましくは30以上から82種、さらにより好ましくは40以上から82種の異なる遺伝子の発現を測定することを可能にする限り、上記(1)及び(2)に記載した核酸のいずれの組み合わせであってもよい。
上記(1)の核酸は、
(a)配列番号1〜82に示されるヌクレオチド配列、
(b)上記(a)のヌクレオチド配列に相補的なヌクレオチド配列、及び
(c)上記(a)のヌクレオチド配列又は上記(b)のヌクレオチド配列において連続する15塩基から全塩基数未満、好ましくは17塩基以上、20塩基以上、30塩基以上、50塩基以上、70塩基以上、100塩基以上、150塩基以上、200塩基以上、300塩基以上、400塩基以上又は500塩基以上から全塩基数未満の部分配列、
を有する核酸である。
上記(2)の核酸は、上記(1)の(a)又は(b)のヌクレオチド配列とハイブリダイズするヌクレオチド配列を有する核酸であるか、あるいは、その核酸のヌクレオチド配列において連続する15塩基から全塩基数未満、好ましくは17塩基以上、20塩基以上、30塩基以上、50塩基以上、70塩基以上、100塩基以上、150塩基以上、200塩基以上、300塩基以上、400塩基以上又は500塩基以上から全塩基数未満の部分配列、を有する核酸である。好ましくは、このような核酸は、上記(1)の(a)又は(b)のヌクレオチド配列と90%以上、好ましくは95%以上、より好ましくは98以上、最も好ましくは99%以上の同一性を有する配列の核酸、又はその15塩基から全塩基数未満の断片である。
好ましい核酸は、上記(1)の核酸、特に上記(1)(c)の核酸である。
本発明の組成物は、核酸構成成分を単に混合した形態の混合物だけでなく、キット、マイクロアレイ又はプライマーセットの形態であってもよい。むしろ、このような後者の形態が好ましい。ここで、キットの場合、上記核酸を個々に包装するかあるいは複数の核酸の混合形態で包装することができ、キットにはさらに、ハイブリダイゼーションのためのバッファ、検出用試薬(酵素類など)、使用説明書などを含ませることができる。マイクロアレイやプライマーセットについては、上記の説明のとおりである。
本発明の組成物は、上記記載のとおり、肺腺癌患者において肺癌の外科切除後の肺腺癌の再発を予測するための方法に使用できる。本発明の方法については、上記の説明のとおりである。
本発明はさらに、肺腺癌患者において肺癌の外科切除後の肺腺癌の再発を予測するための組成物であって、該組成物が、配列番号1〜82のいずれかのヌクレオチド配列を含む2以上から82種、好ましくは5以上から82以下、より好ましくは10以上、さらに好ましくは30以上、さらにより好ましくは40以上から82以下の異なる遺伝子の発現を測定することを可能にする複数の抗体を含み、該抗体が、配列番号1〜82に示されるヌクレオチド配列によってコードされるタンパク質又は該タンパク質のアミノ酸配列の連続する少なくとも8アミノ酸残基からなるポリペプチドと免疫学的に反応する抗体、及び該抗体の断片、からなる群から選択されることを特徴とする、上記組成物と提供する。
抗体の作製については、上記の説明のとおりである。
抗体は、上記の方法で作製されるようなポリクローナル抗体、モノクローナル抗体、抗ペプチド抗体などであるが、それらに限定されないものとする。抗体の種類は、いずれのタイプ、クラス、サブクラスでもよく、例えばIgG、IgM、IgE、IgD、IgAなどを含む。また、抗体の断片は、Fab、(Fab’)、Fv、scFvなどを含む。
本発明の組成物は、抗体構成成分を単に混合した形態の混合物だけでなく、キット、抗体結合支持体又は抗体マイクロアレイの形態であってもよい。固相支持体として、ポリスチレン、ポリカーボネート、ポリエチレンなどのポリマーの膜、マルチウエルプレート、試験管、試験片(テストストリップ)、ラテックス、磁性体粒子などが含まれる。アレイの材質として、ポリマー、ガラスなどが含まれる。
本発明の抗体含有組成物は、上記記載のとおり、肺腺癌患者において肺癌の外科切除後の肺腺癌の再発を予測するための方法に使用できる。本発明の方法については、免疫学的方法であり、上記の説明のとおりである。
本発明を以下の実施例によってさらに具体的に説明するが、本発明はそれらの実施例によって制限されないものとする。
  As described above, the present invention provides a method for predicting recurrence of lung adenocarcinoma with high accuracy after surgical resection of lung cancer in patients with lung adenocarcinoma. In part, it was possible to make a prediction with such a high degree of accuracy. In some cases, patients with lung adenocarcinoma were selected rigorously after and after surgery without recurrence. Based on the discovery of 82 previously unpublished gene sets related to postoperative recurrence / no recurrence in patients with lung adenocarcinoma under conditions such as using reliable statistical methods .
<Determination of gene set>
  In the present invention, a set of 82 different genes for predicting recurrence of lung adenocarcinoma after surgical resection of lung cancer in lung adenocarcinoma patients was found, and the procedure for determining this gene set will be described below. .
  As described in the background art, gene sets for predicting postoperative recurrence of lung adenocarcinoma have been reported by several groups, but gene sets described as predictable from tens of thousands of gene groups Are not overlapped with each other, or the overlap is very low. Regarding the 82 gene set found by the present inventors, for example, there is no gene overlapping with the 45 gene set described in JP-A-2007-135466. E. There is only one gene that overlaps the 54 gene set described in Larsen et al., Clinical Cancer Research 2007, 13: 2946-2954. However, as proved in FIG. 2A, the correct answer rate (that is, [number of correct answers / (number of correct answers + number of incorrect answers)] × 100 (%)) when performing recurrence prediction using a single gene is , Significantly lower. In order to increase the correct answer rate, it is desirable to use a set of a plurality of genes, preferably 5 or more, more preferably 10 or more, further preferably 30 or more, and most preferably 82 genes. Even if more than 82 genes are used, FIG. 2A shows that the correct answer rate tends to deteriorate rather than improve.
  As described in the examples below, the inventors have prepared 87 lung adenocarcinoma samples from lung adenocarcinoma patients who have undergone resection surgery, of which 60 are randomly assigned to the training set and the remaining 27 Was used as an evaluation set. For a sample of the training set, a probe that exceeds the background expression level is selected and a probe signal that satisfies this filtering criterion is used to create a supervised classification technique (weighted voting algorithm; Yanagisawa et al., J. Natl. Cancer Inst. .99: 858-67, 2007) makes 82 genes recurrence-related signatures (ie high risk of recurrence or recurrence) predicting high risk or low risk of recurrence with an average accuracy of 75% or higher, Alternatively, it was identified as having no recurrence or low risk of recurrence). At this time, a 10-fold cross-validation method was used to select a probe signal for identifying a recurrence-free signature. An overview of this method is shown in FIG.
  The 10-fold cross-validation method, for example, divides 100 samples into 10 samples every 10 samples, and selects the characteristics (relapse related signatures) for the remaining 9 divisions by subtracting 1 division from the 10 divisions, and the top 1 selected A classifier consisting of prediction probes up to a maximum of 200 is constructed, and classification is performed by dividing the classifier. Next, signatures are selected in the same manner for the remaining 9 divisions excluding the other 1 division from the 10 divisions obtained by reverting the removed 1 division, and predictions from the selected top 1 to the maximum 200 are performed. A classifier consisting of the probes is constructed, and another one-segment classification is performed. The same operation is performed 10 times in total. Here, for example, in consideration of the fact that there are an infinite number of allocation methods that divide 100 samples into 10, in order to reduce the bias due to the allocation method, 100 samples were divided into 10 by random (random) 100 methods. In this manner, a classifier composed of a maximum of 200 prediction probes was constructed for a total of 1000 independent sets subjected to the 10-fold cross-validation method every 100 random divisions. As a result, the number of predicted probes 82 with the smallest learning error is found (FIG. 2A), and 82 probes that are most frequently shared among 1,000 independent sets are identified as recurrence-related signatures. In this way, a final classifier is constructed.
  The test sample is classified using the classifier constructed as described above. As test samples, 27 evaluation samples of lung adenocarcinoma excised from randomly selected lung adenocarcinoma patients were used. Kaplan-Meier survival curves and Cox proportional hazards model analysis are used to analyze the relationship between recurrence-related signatures obtained from the evaluation samples and overall survival and relapse-free survival. As a result, the 82 gene set of the present invention (referred to as “RRS-82”) has a high-risk patient with relapse / death and a low-risk patient with no relapse / high survival of 75% or more, preferably 80% or more, Preferably, the determination can be made with a high accuracy of 90% or more.
  RRS-82 is a set consisting of 82 genes including each nucleotide sequence of SEQ ID NOs: 1 to 82. This gene set is shown in Table 1.
  No. in the above table. 1 to No. 82 correspond to SEQ ID NO: 1 to SEQ ID NO: 82, respectively. Classifying the 82 genes based on relative expression differences from post-operative relapse-free cases, relapse-related signatures: relapse (death) signature or high recurrence risk signature and no recurrence signature or low recurrence risk signature, It could be divided into the following two groups.
(1) Includes each nucleotide sequence of SEQ ID NOs: 1-5, 8-9, 12, 14-15, 17, 19-21, 23-28, 30-33, 35-59, 61-68, 70-82 A group in which the recurrence of lung adenocarcinoma can be predicted to be high when the gene expression is relatively high compared to post-operative recurrence cases (or a group in which recurrence of lung adenocarcinoma can be predicted to be low if the relative expression is low ),as well as
(2) Expression of the gene containing each nucleotide sequence of SEQ ID NOs: 6-7, 10-11, 13, 16, 18, 22, 29, 34, 60, 69 is relatively low compared to post-operative relapse-free cases Group that can be predicted to have a high recurrence of lung adenocarcinoma (or, if the relative expression is high, the recurrence of lung adenocarcinoma is predicted to be low).
  That is, in the case of the gene of the above group (1), a lung adenocarcinoma patient is predicted as a relapse (death) patient or a high risk patient, or a non-relapse patient or a low relapse risk patient depending on whether the relative expression is high or low. Can be classified. In the case of the gene of the group (2), conversely, a lung adenocarcinoma patient is classified as a non-relapsed patient or a low-risk patient, or a relapsed (death) patient or a high-risk patient depending on whether the relative expression is low or high. Can be predicted and classified.
  If it is determined as recurrence or high risk by the method of the present invention, it becomes possible to devise a treatment plan for suppressing postoperative recurrence of lung adenocarcinoma patients at an early stage, while no recurrence or low risk. Once determined, it can also be used to determine unnecessary chemotherapy and radiation therapy.
  The control in comparing the relative expression levels of the genes is a non-relapsed postoperative case, and if the above prediction is possible, a certain period after the operation (eg 3 years, preferably 5 years, more preferably 10 years) A patient-derived sample (lung adenocarcinoma tissue or cells) determined to have no recurrence.
  No statistically significant association has been found between RRS-82 in the present invention and EGFR, K-ras or p53 gene mutations (FIG. 3).
  When the discriminating ability of RRS-82 in the present invention was verified using an evaluation set (27 lung adenocarcinoma samples), all patients who showed a high risk signature of RRS-82 relapsed with lung adenocarcinoma within 5 years. However, about 70% of patients who showed a low risk signature showed no signs of recurrence after 5 years (Figure 4). In this sense, it can be said that the method of the present invention is extremely effective in predicting a high-risk group of postoperative recurrence in lung adenocarcinoma patients.
  The recurrence / no recurrence prediction by the method of the present invention can be performed regardless of the stage of the tumor, and interestingly, it can be performed even at an early stage.
<Prediction of postoperative recurrence of lung adenocarcinoma>
  In one aspect thereof, the present invention is a method for predicting recurrence of lung adenocarcinoma after surgical resection of lung cancer in a lung adenocarcinoma patient, comprising a gene comprising each nucleotide sequence of SEQ ID NOs: 1 to 82 Measuring the expression of a gene set of 2 to 82 genes selected from the group in a biological sample from said patient, wherein SEQ ID NOs: 1-5, 8-9, 12, 14-15 , 17, 19-21, 23-28, 30-33, 35-59, 61-68, 70-82, the expression of the gene is relatively high compared to post-operative relapse-free cases Or the expression of a gene containing any one of the nucleotide sequences of SEQ ID NOs: 6-7, 10-11, 13, 16, 18, 22, 29, 34, 60, 69 is relative to that of a case without recurrence after surgery. Pulmonary gland Provides the above method characterized by recurrent predict high.
  The 82 genes are human genes including the nucleotide sequences represented by SEQ ID NOs: 1 to 82 as described above. Since it is a gene derived from an organism, it is considered that mutations such as polymorphic mutations, splice mutations and mutations may occur. Thus, the subject gene of the present invention can include not only the nucleotide sequences represented by SEQ ID NOs: 1 to 82 but also deletions, substitutions or additions of one or several nucleotides in these sequences, or It may have at least 95% identity to these sequences, preferably at least 97%, more preferably at least 98%, most preferably at least 99%.
  As used herein, the term “% identity” can be determined using known BLAST or FASTA algorithms with or without gaps introduced (Karlin and Altschul, 1993, Proc. Natl). Acad.Sci.U.S.A., 90: 5873-5877; Karlin and Altschul, 1990, Proc.Natl.Acd.Sci.U.S.A., 87: 2264-2268; J. Mol. Biol., 215: 403; Altschul et al., 1997, Nucleic Acids Res., 25: 3389-3402). In general, identity (%) can be calculated as a percentage of the number of matched bases relative to the total number of bases.
  As used herein, the term “several” refers to an integer from 2 to 10, ie any of 2, 3, 4, 5, 6, 7, 8, 9 or 10, preferably 2 Is an integer from 1 to 5, more preferably 2 or 3.
  In the present invention, the number of genes in the gene set is 2 to the total number (82). If the number of genes is within this range, postoperative recurrence can be predicted. However, in order to further improve the prediction accuracy (or accuracy), the number of genes is preferably 5 to 82, more preferably 10 to 82, and even more preferably 30 to 82, for example 40 to 82, 50 to 82, 60 to 82, 70 to 82, and 82 is the most preferable number of genes.
  Gene expression can be measured for the amount or presence of either nucleic acid or protein. In the measurement of nucleic acid, mRNA that is a transcription product of each gene and its derivative nucleic acid, for example, cDNA, cRNA, and aRNA (antisense amplified RNA) can be measured. On the other hand, in protein measurement, a protein encoded by each gene (also referred to as an expression product or a gene product), a fragment thereof, or a post-translational modification product (for example, modification with a sugar or the like) can be measured.
  Below, the method for measuring the expression of said 82 gene at a nucleic acid and protein level is demonstrated.
  The test sample is a lung adenocarcinoma tissue or cell of a lung adenocarcinoma patient, such as a cancer tissue excised by surgery or a tissue or cell obtained by biopsy.
Measuring gene expression with nucleic acids
  In the method of the present invention, the following nucleic acids can be used as probes or primers in order to detect the expression of 82 genes.
  (1) a nucleotide sequence represented by SEQ ID NOs: 1 to 82, a nucleotide sequence complementary thereto, or a nucleic acid having a partial sequence of 15 bases to less than the total number of bases in these nucleotide sequences, and
  (2) A nucleic acid that hybridizes with a nucleic acid comprising the nucleotide sequence shown in SEQ ID NOs: 1 to 82 or a nucleotide sequence complementary thereto, or a partial sequence that is less than the total number of bases from 15 consecutive bases of the hybridizing nucleic acid Nucleic acid.
  The size of the nucleic acid fragment consisting of the partial sequence is from 15 bases to less than the total number of bases, for example, 17 bases or more, 20 bases or more, 30 bases or more, 50 bases or more, 70 bases or more, 100 bases or more, 150 bases or more. , 200 bases or more, 300 bases or more, 400 bases or more, or 500 bases or more and less than the total number of bases.
  If the nucleic acid is a DNA molecule of about 100 bases or less, it is synthesized using a commercially available DNA automatic synthesizer utilizing the phosphoramidite method or the like, or if it is a DNA molecule of about 100 bases or more, cDNA cloning is performed. Or polymerase chain reaction (PCR). Moreover, cRNA and aRNA can be produced from cDNA using a commercially available kit or the like.
  In the cDNA cloning and PCR methods, total RNA is obtained from lung adenocarcinoma tissue, poly A (+) RNA is obtained by oligo dT cellulose column treatment, and then cDNA live is obtained by reverse transcription-polymerase chain reaction (RT-PCR) method. A library corresponding to the gene of interest is selected / cloned from this library using a probe or primer having a length of 15 bases or more prepared based on the nucleotide sequence shown in SEQ ID NOs: 1 to 82. Or it can be PCR amplified. The probe has a sequence complementary to the cDNA sequence, and the length thereof is preferably 20 bases or more, more preferably 30 bases or more, and further preferably 50 bases or more. Moreover, a primer consists of a sense primer and an antisense primer, The length becomes like this. Preferably it is 15-50 bases, More preferably, it is 17-30 bases, More preferably, it is 20-25 bases.
  The DNA obtained as described above can be introduced into a prokaryotic or eukaryotic host cell after being inserted into a commercially available or documented vector, and amplified, or a vector into which the target DNA has been inserted Can be used as a template for PCR amplification.
  The vector is a vector such as a plasmid, a phage, a plasmid, or a virus, such as a plasmid such as a pBluescript system, a pUC system, or a pBR system. The vector can contain a promoter, a replication origin, a ribosome binding sequence (or Shine-Dalgarno sequence), a terminator, a selection marker sequence (for example, a drug resistance gene), a multicloning site and the like in addition to the target DNA. Since a vector suitable for the host cell is commercially available, it is desirable to use it.
  Prokaryotic host cells are bacterial cells and generally include Escherichia coli, Bacillus subtilis, Pseudomonas bacteria and the like. In addition, eukaryotic host cells include yeast, fungi, basidiomycetes, animal cells (insect cells, mammalian cells, etc.), plant cells and the like.
  Methods for introducing vectors into host cells are also known, and include, for example, electroporation, calcium phosphate method, spheroplast fusion method, protoplast fusion method, microinjection, gene gun method, Agrobacterium method and the like.
  Details of the above technique can be found, for example, in J. Org. Sambrook et al., Molecular Cloning A Laboratory Manual, 1989, Cold Spring Harbor Laboratory Press (USA); M.M. Ausbel et al., Short Protocols in Molecular Biology (3rd edition) A Compendium of Methods from Current Protocols in Molecular Biology, 1995, John Wiley & Son. (US) etc.
  The nucleic acid that can be used in the method of the present invention includes, as described in (2) above, a nucleic acid that hybridizes with a nucleic acid comprising the nucleotide sequence shown in SEQ ID NOs: 1 to 82 or a nucleotide sequence complementary thereto, or the hybridizing nucleic acid A nucleic acid having a partial sequence of 15 bases to less than the total number of bases. Hybridization is preferably performed under stringent conditions. Under these conditions, the nucleotide sequence has 90% or more, preferably 95% or more, more preferably 98 or more, and most preferably 99% or more identity. Hybridization can occur with nucleic acids of the sequence.
  The expression of 82 gene sets is measured using the above nucleic acid. Preferred measurement methods include hybridization methods or quantitative PCR methods (for example, real-time PCR methods).
  Hybridization refers to a technique in which a nucleic acid probe attached or bound on the surface of a solid support is bound to a partially or completely complementary nucleic acid via base pairing to form a double strand. . The solid support includes, for example, a test plate, a test tube, a test piece, an array, and the like, and the material is usually a polymer (or plastic, resin), glass, or the like. The hybridization used in the method of the present invention may be any of DNA-DNA hybridization, DNA-RNA hybridization, or RNA-RNA hybridization, including, but not limited to, a microarray method, Blot methods such as Northern blot, Southern blot, Northern hybridization, Southern hybridization, in situ hybridization and the like are included.
  In the microarray method, a microarray (or DNA chip) in which a nucleic acid probe of 15 bases or more that hybridizes with a gene comprising the nucleotide sequence of SEQ ID NOs: 1 to 82 or a corresponding nucleic acid (mRNA, cDNA, cRNA or aRNA) is bound to a support. ) Is used. A spacer or a crosslinker containing a reactive group for covalently binding a nucleic acid probe can be introduced on the surface of the microarray. The binding between the array surface and the nucleic acid probe can be performed through a chemical reaction by light or heat, for example.
  The hybridization described above enables more specific binding between a nucleic acid probe and a test nucleic acid when hybridization is performed under stringent conditions. Stringent conditions include those defined above, but it is desirable to determine optimal conditions as appropriate according to the type of hybridization method. In general, stringency is highly dependent on temperature, ionic strength of the solution, presence of formamide, relative GC content of nucleic acids, incubation time, and the like. The optimum temperature can be determined from the temperature range before and after the temperature (Tm) when 50% of the oligonucleotide dissociates from its complementary strand. The temperature under stringent conditions is usually within the range of 42 to 68 ° C. High stringency hybridization conditions include, for example, 6 × SSC, 0.01M EDTA, 1 × Denhardt's solution, hybridization in 0.5% SDS at 68 ° C .; 1M NaCl, 0.5% sarkosyl, 30% formamide Medium, hybridization at 60 ° C .; washing in 0.1 × SSC, 0.1% SDS, 55 ° C., etc. Here, 1 × SSC is 150 mM sodium chloride and 15 mM sodium citrate aqueous solution (pH 7.2).
  The solid phase immobilization of the nucleic acid probe is not particularly limited, but a general method such as a method of spotting DNA using a high-density dispenser called a spotter or an arrayer, an ink jet method of ejecting droplets from a nozzle, or the like This method can be used.
  Nucleic acids such as cDNA, cRNA, and aRNA derived from mRNA derived from lung adenocarcinoma tissue test samples surgically excised from lung adenocarcinoma patients are labeled with a fluorescent substance such as Cy dye (eg Cr3, Cy5), and then on the microarray. Hybridize with the probe. The fluorescence intensity is read using a laser scanning reader, and the data is analyzed by a computer.
  In blotting, the above-described nucleic acid probe of the present invention is combined with a radioisotope (eg,32P and35S) and fluorescent substances (fluoresamine, rhodamine, derivatives thereof, Cy dye, etc.), etc., and then hybridization with nucleic acids such as mRNA, cDNA, cRNA, aRNA in the test sample transferred to the polymer membrane Do. The signal is detected using a radiation detector or a fluorescence detector and its intensity is measured.
  In the quantitative real-time PCR method, primers are annealed with cDNA so as to amplify each target gene region using cDNA prepared from mRNA in a lung adenocarcinoma tissue test sample as a template, and PCR is performed in real time. Double-stranded DNA is detected. The amplification product is amplified exponentially every cycle and eventually reaches a plateau. Real-time PCR is performed using a standard sample that is serially diluted, and an amplification curve for each cycle number is created with the number of cycles on the horizontal axis and the amount of PCR amplification on the vertical axis. A threshold value is set, and a point Ct value (thresholdcycle) where the threshold value and the amplification curve intersect is calculated. The Ct value is the number of cycles when the PCR product reaches a certain amount. Since there is a linear relationship between the Ct value and the initial template DNA amount, a calibration curve is created.
  Detection of the amplification product can be performed using a method such as an intercalator method or a fluorescent labeling probe method. The intercalator method is a method of monitoring the amount of amplification product by utilizing the property that a fluorescent substance binds between double strands of DNA formed by hybridization, for example. In the fluorescent labeling probe method, a probe is labeled with a fluorescent substance, and the amount of amplification product is monitored by a fluorescent signal. Among these methods, a method using a probe having a fluorescent substance at the 5 'end and a quencher bound at the 3' end is also known.
  Since a real-time PCR apparatus is commercially available, a real-time PCR method can be performed using this apparatus.
  As conditions for carrying out PCR, the amplification size should be in the range of 80-150 bp, the primer size should be in the range of 17-25 bases, and the GC content of the entire primer should be in the range of 40-60%, The 3 'end of the primer is G or C, there is no sequence that complements more than 3 bases inside or between the primers, the Tm values of the upstream primer and the downstream primer are within 2 ° C, and a template-specific primer is designed. , Etc. are known.
  PCR conditions are, for example, denaturation: 92 to 94 ° C. for 30 to 60 seconds; annealing: 50 to 55 ° C. for 30 to 60 seconds; extension: 68 to 72 ° C. for 30 to 60 seconds, and 30 to 40 cycles of reaction. including. Reverse transcriptase is a commercially available enzyme such as SuperScript.TM  III (Invitrogen), AMV Reverse Transscriptase, M-MLV Reverse Transscriptase (Promega), SYBR Premix Ex Taq (Takara Bio) and the like can be used.
  In the present invention, the relative expression level difference between relapse and non-relapse is 1.1 times or more, preferably 1.5 times or more, more preferably 2.0 times or more.
Measurement of protein gene expression
  In the method of the present invention, gene expression can be measured by measuring the amount of a protein encoded by a gene comprising the nucleotide sequence represented by SEQ ID NOs: 1 to 82 or a fragment thereof. An alternative method of measuring this expression level is an immunological method.
  Proteins for producing antibodies can be produced using cDNA cloning and gene recombination techniques.
  Briefly, for example, a cDNA library is prepared from lung adenocarcinoma tissue, a cDNA clone is prepared by PCR using primers synthesized based on each nucleotide sequence of SEQ ID NOs: 1 to 82, and the obtained cDNA clone is It can be obtained from the cell or culture supernatant by culturing a prokaryotic or eukaryotic host cell that is incorporated into an expression vector and transformed or transfected with the vector. In this case, the expression vector can be commercially available or used in the literature, for example, a plasmid, cosmid, phage or the like. The vector can contain DNA encoding the target protein, promoter, polyadenylation signal, ribosome binding sequence, replication origin, terminator, selectable marker, and the like. In order to facilitate separation and purification of the polypeptide, a labeled (poly) peptide (eg, β-galactosidase gene), (His)6-10Tags, FLAG tags (amino acid sequence: DYKDDDDK (SEQ ID NO: 150)), GFP (green fluorescent protein), and other DNA sequences corresponding to the proteins so that a fusion protein of the target protein is formed with the target protein It can also be contained.
  Host cells include prokaryotic cells such as bacteria (eg, E. coli, Bacillus subtilis, Pseudomonas bacteria, etc.), yeast (eg, Saccharomyces, Schizosaccharomyces, Pichia, etc.), insect cells (eg, Sf cells), mammalian cells ( For example, CHO, COS, BHK, HEK293, NIH3T3, etc.) are included.
  The above-mentioned cDNA cloning and gene recombination techniques are described in Sambrook et al. (Above), Ausbel et al. (Above), and the like.
  The target protein thus obtained may be gel filtration, ion exchange chromatography, affinity chromatography, hydrophobic chromatography, isoelectric focusing, electrophoresis, ultrafiltration, salting out, dialysis, etc. alone or It can be purified in combination.
  The protein encoded by the gene of the present invention comprises the amino acid sequence shown in SEQ ID NOs: 83-149 (the sequences are encoded by the nucleotide sequences of SEQ ID NOs: 15-21, 23-82, respectively). In addition, protein sequences that do not describe amino acid sequences can be obtained by accessing databases such as GenBank (USA) and EMBL (Europe), or cDNA cloning using nucleotide sequences corresponding to them. And the amino acid sequence of the target protein can be determined by sequencing.
  In the immunological method, mammals such as rabbits, mice, rats, and horses are immunized using the protein obtained by the above-described method or a fragment thereof as an antigen, and antibodies against these antigens are produced and purified.
  Antibodies include polyclonal antibodies, monoclonal antibodies, anti-peptide antibodies, antibody fragments thereof and the like.
  Polyclonal antibody immunizes the animal subcutaneously with an appropriate amount (usually in the order of μg) of the antigen, further boosts about 2-3 weeks later, collects blood about 3 weeks to 2 months after the initial immunization, The IgG component containing the target polyclonal antibody can be prepared by separation using ammonium sulfate fractionation and ion exchange chromatography. At this time, in order to increase the specificity of the antibody for the antigen, the obtained IgG is bound to a column prepared by binding the target protein to a carrier such as cellulose or agarose, and then eluted with a high salt concentration buffer. By desalting by a method such as dialysis or ultrafiltration, a specific polyclonal antibody can be obtained. The antibody titer can be measured by a conventional immunoassay, for example, an enzyme immunoassay (ELISA), a radioimmunoassay (RIA), a fluorescent antibody method, or the like.
  The monoclonal antibody can be prepared, for example, by the following general method (for example, Hideaki Nagamune and Hiroshi Terada, monoclonal antibody-preparation and characterization, 1990, Hirokawa Shoten; Yoshikazu Sado (2001) Biochemistry 73: 1163-1167, etc.).
  The target protein or a fragment thereof is administered subcutaneously to mice or rats (for example, Balb / c mice) in the same manner as polyclonal antibody production, and booster immunization is performed about 2 to 4 times at intervals of 1 to 4 weeks. When the antibody titer reaches a plateau, the antigen is injected intravenously or intraperitoneally for final immunization. After 2 to 5 days, antibody-producing cells (eg spleen cells or lymph node cells) are collected. The antibody-producing cells are then fused to a myeloma cell line (preferably a hypoxanthine / guanine / phosphoribosyl transferase (HGPRT) deficient cell line) to produce hybridoma cells, and HAT (hypoxanthine, aminopterin, thymidine) is selected. I do. In cell fusion, antibody-producing cells and myeloma cell lines are mixed at an appropriate ratio in animal cell culture media such as serum-free DMEM and RPMI-1640 media, and cell fusion promoters such as polyethylene glycol are used. Perform in the presence. Confirmation of the target antibody can be performed by the immunoassay described above. Furthermore, in order to proliferate the hybridoma, the hybridoma is administered into the abdominal cavity of the mouse, and after the hybridoma is proliferated, ascites is collected after 1 to 2 weeks. Antibody purification can be performed by appropriately combining methods such as ammonium sulfate fractionation, ion exchange chromatography, affinity chromatography, and gel chromatography.
  Anti-peptide antibodies are antibodies against linear peptides on the surface of proteins and can increase immunological specificity. Such peptides include, for example, the estimation of hydrophilic-hydrophobic regions by Kyte-Doolittle, et al., The probability of being located on the surface of a specific peptide site on a protein molecule by Emini et al., The degree of bending of a polypeptide chain, such as Chou-Fasman Can be estimated using an α helix, β sheet, secondary structure prediction of a protein indicating a turn, etc. alone or in combination. The estimated peptide can then be synthesized using a peptide synthesizer.
  The above antibodies can be used for the detection of target proteins or fragments thereof in lung adenocarcinoma tissue test samples. By creating an antibody microarray in which a large number of antibodies are bound on a microarray support, or by dot spotting a large number of antibodies on a polymer membrane (filter) such as a PVDF membrane, or on a solid phase such as a multiwell plate By adsorbing antibodies on the surface, it becomes possible to detect or quantify a large number of target proteins at once. Also, conventional immunological measurement methods such as enzyme immunoassay (ELISA, EIA), fluorescent antibody method, radioimmunoassay (RIA), luminescence immunoassay, immunoturbidimetric method, latex agglutination, latex turbidimetric The target protein or a fragment thereof in the test sample can be detected or quantified by a method, hemagglutination reaction, particle agglutination reaction, Western blotting, or the like.
  When the reaction is carried out on a solid phase, solid phase supports include polymer films such as polystyrene, polycarbonate, polyethylene, multi-well plates, test tubes, test pieces (test strips), latex, magnetic particles and the like. Immobilization can be performed by physical adsorption or chemically. For chemical coupling, the solid phase can be treated with a reagent such as a maleating reagent or cyanogen bromide to introduce a functional group that reacts with the amino group of the protein into the solid phase.
  Examples of labels include enzymes such as horseradish peroxidase and alkaline phosphatase, fluorescent materials such as fluorescein, rhodamine and derivatives thereof, luminescent materials such as luciferase and luminol,32P,125Radioisotopes such as I are included. Labeling includes, for example, glutaraldehyde method, maleimide method, pyridyl disulfide method, chloramine T method, Bolton Hunter method and the like.
<Composition for predicting recurrence after surgery>
  The present invention also provides a composition for predicting recurrence of lung adenocarcinoma after surgical resection of lung cancer in a patient with lung adenocarcinoma, wherein the composition comprises any nucleotide sequence of SEQ ID NOs: 1 to 82 Comprising a plurality of nucleic acids that allow the measurement of the expression of 2 or more to 82, preferably 5 or more to 82 different genes,
  (1) a nucleotide sequence represented by SEQ ID NOs: 1 to 82, a nucleotide sequence complementary thereto, or a nucleic acid having a partial sequence of 15 bases to less than the total number of bases in these nucleotide sequences, and
  (2) A nucleic acid that hybridizes with a nucleic acid comprising the nucleotide sequence shown in SEQ ID NOs: 1 to 82 or a nucleotide sequence complementary thereto, or a partial sequence that is less than the total number of bases from 15 consecutive bases of the hybridizing nucleic acid Nucleic acid,
The composition is selected from the group consisting of:
  The plurality of nucleic acids constituting the composition of the present invention is 2 to 82, preferably 5 to 82, more preferably 10 or more, wherein the composition comprises any one of the nucleotide sequences of SEQ ID NOs: 1 to 82. Of the nucleic acids described in (1) and (2) above, so long as it is possible to measure the expression of the different genes from 30 to 82, more preferably from 30 to 82, and even more preferably from 40 to 82. Any combination may be used.
  The nucleic acid of (1) above is
  (A) the nucleotide sequence shown in SEQ ID NO: 1-82,
  (B) a nucleotide sequence complementary to the nucleotide sequence of (a) above, and
  (C) The nucleotide sequence of (a) above or the nucleotide sequence of (b) above is less than the total number of bases, preferably 17 bases or more, 20 bases or more, 30 bases or more, 50 bases or more, 70 bases or more. , 100 bases or more, 150 bases or more, 200 bases or more, 300 bases or more, 400 bases or more, or 500 bases or more to a partial sequence of less than the total number of bases,
A nucleic acid having
  The nucleic acid of (2) above is a nucleic acid having a nucleotide sequence that hybridizes with the nucleotide sequence of (a) or (b) of (1) above, or all 15 bases continuous in the nucleotide sequence of the nucleic acid. Less than the number of bases, preferably 17 bases or more, 20 bases or more, 30 bases or more, 50 bases or more, 70 bases or more, 100 bases or more, 150 bases or more, 200 bases or more, 300 bases or more, 400 bases or more or 500 bases or more A nucleic acid having a partial sequence of less than the total number of bases. Preferably, such a nucleic acid has 90% or more, preferably 95% or more, more preferably 98 or more, most preferably 99% or more identity with the nucleotide sequence of (1) (a) or (b) above. Or a fragment of 15 bases to less than the total number of bases.
  A preferred nucleic acid is the nucleic acid of (1) above, particularly the nucleic acid of (1) (c) above.
  The composition of the present invention may be in the form of a kit, a microarray, or a primer set, as well as a mixture in which nucleic acid components are simply mixed. Rather, the latter form is preferred. Here, in the case of a kit, the above nucleic acids can be individually packaged or packaged in a mixed form of a plurality of nucleic acids. The kit further includes a buffer for hybridization, a reagent for detection (such as enzymes), Instructions for use can be included. The microarray and primer set are as described above.
  The composition of the present invention can be used in a method for predicting recurrence of lung adenocarcinoma after surgical resection of lung cancer in lung adenocarcinoma patients as described above. The method of the present invention is as described above.
  The present invention further provides a composition for predicting recurrence of lung adenocarcinoma after surgical resection of lung cancer in a patient with lung adenocarcinoma, wherein the composition comprises any one of the nucleotide sequences of SEQ ID NOs: 1 to 82 A plurality of two or more to 82 species, preferably 5 or more to 82 or less, more preferably 10 or more, even more preferably 30 or more, even more preferably 40 to 82 or less An antibody comprising an antibody, wherein the antibody immunologically reacts with a protein encoded by the nucleotide sequence shown in SEQ ID NOs: 1 to 82 or a polypeptide consisting of at least 8 consecutive amino acid residues of the amino acid sequence of the protein, And a fragment of said antibody, provided with said composition, characterized in that it is selected from the group consisting of
  The production of the antibody is as described above.
  The antibody is a polyclonal antibody, a monoclonal antibody, an anti-peptide antibody or the like as prepared by the above method, but is not limited thereto. The type of antibody may be any type, class, subclass, and includes, for example, IgG, IgM, IgE, IgD, IgA and the like. Antibody fragments are Fab, (Fab ')2, Fv, scFv and the like.
  The composition of the present invention may be in the form of a kit, an antibody-binding support or an antibody microarray, as well as a mixture in the form of simply mixing antibody components. Examples of the solid support include films of polymers such as polystyrene, polycarbonate, and polyethylene, multi-well plates, test tubes, test pieces (test strips), latex, and magnetic particles. Array materials include polymers, glass, and the like.
  As described above, the antibody-containing composition of the present invention can be used in a method for predicting recurrence of lung adenocarcinoma after surgical resection of lung cancer in a lung adenocarcinoma patient. The method of the present invention is an immunological method as described above.
  The present invention will be described more specifically with reference to the following examples. However, the present invention is not limited to these examples.

材料及び方法
患者
1995年12月〜1999年8月の間に治癒の可能性のある切除手術を受けた患者の87肺腺癌事例を、愛知県がんセンター及び名古屋大学の倫理委員会の承認と患者の同意書を得て愛知県がんセンター(名古屋市)にて取得した。どの事例も補助化学療法は受けなかった。最終フォローアップの時点で生存していた患者のフォローアップ期間の中央値は90ヶ月であった(範囲:64〜108ヶ月)。腫瘍検体はすべてOCT化合物(サクラ精機株式会社、日本国、東京)に埋め込み、−80℃で保存した。患者人数の3分の2(n=60)をランダムに訓練セットに割り当て、残りの3分の1(n=27)を評価セットIとした。また、同様に2002年2月から2004年12月の間で切除手術を受けた患者の肺腺癌サンプルのうちステージIと診断された30サンプルを評価セットIIとして用いた(表2)。
RNAの単離
腫瘍検体の凍結組織を病理学者(Y.Y.)の指導の下で、ギムザ染色した10枚毎の切片を用いてグロス顕微解剖に供した。トータルRNAをRNeasyキット(Qiagen、カリフォルニア州バレンシア)を用いて抽出し、DNaseIで処理した。RNA量はNanoDrop(R)ND−1000UV−Vis分光光度計(NanoDrop Technologies、デラウェア州ウィルミントン)を用いて測定し、RNAの性質はAgilent2100バイオアナライザーを用いて観察しRNA完全数値(RIN)として示した(Agilent Technologies、カリフォルニア州パロアルト)。全ての主要な肺癌の組織型を示す20の肺細胞株を用いて、共通標準RNAを大量に用意した。
EGFR、p53及びK−rasの発現プロファイル及び突然変異状態の取得
500ngのトータルRNAから、モロニーマウス白血病ウイルス逆転写酵素(Agilent Technologies、カリフォルニア州パロアルト)及びT7プロモーターを含むポリdTプライマーを用いて、二本鎖cDNAを合成した。Low RNA Fluorescent Linear Amplificationキット(Agilent Technologies)を用いてcRNAを生成し、Cy3又はCy5により標識した。Cy5−サンプルcRNAとCy3−共通標準cRNAを41,000個の異なるプローブを有するWhole Human Genome oligo DNAマイクロアレイキット(G4112F、Agilent Technologies)にハイブリダイズさせた。ハイブリダイゼーション及び洗浄の後、AgilentDNAマイクロアレイスキャナー(G2505B、Agilent Technologies)を用いてスライドをスキャンした。発現データは、Agilent Feature Extractionソフトウェア9.5.1(Agilent Technologies)を用いて取得した。EGFR、p53及びK−rasの突然変異状態は同じ患者のセットに関して既に報告されている(Takeuchiら、JCO、2006)。Dukeデータセットは、受託番号GSE3593でGene Expression Omnibus(http://www.ncbi.nlm.nih.gov/geo/)よりダウンロードし、生存期間(月)、状況、細胞型などの臨床情報に関してはDuke Institute for Genome Sciences and Policy(http://www.genome.duke.edu/)からダウンロードした。45の腺癌サンプルのうち、臨床情報に関する注釈付きの39腺癌サンプルを本分析に用いた。
統計的方法
まず、少なくとも90%のサンプルでバックグラウンドを超える発現量のプローブを選択した。このフィルタリング基準を通過したシグナルを用いて再発関連シグネチャを同定するために、教師付きクラス分類の確立された技術である、重み付き投票アルゴリズム(各加重値はSN比として計算され、既に詳細に説明した方法(Yanagisawaら、J.Natl.Cancer Inst.99:858−67,2007)を用いた。簡単に言うと、訓練データセットに特異的な過学習をすることなく、一般的に使用可能な分類器を取得するために、本発明者らは、無再発シグネチャを同定するためのプローブシグナルを選択する際に、100のランダム相互作用を行う10−foldクロスバリデーション方法を用いた(AM Molinaroら,Bioinformatics 21:3301−7,2005)。そこで、分類器構築の全工程を、一定数の予測される遺伝子を有する分類器ごとに1000回繰り返す。Kaplan−Meier生存曲線及びCox比例ハザードモデル分析(Stataバージョン7.0)を用いて、27名の患者の評価用セット中の得られた再発関連シグネチャと全生存及び無再発生存との関係を分析した。死亡と再発のハザード比をそれぞれ示す。多変数Coxモデルに提示されたP値は同様の比試験で取得した。全ての統計的検定を両側検定とした。Clusterプログラム(MB Eisenら,Proc.Natl.Acad.Sci.USA 95:14863−8,1998)を用いて、遺伝子と症例との間の平均連関階層的クラスタリングを行った。このとき、表示は、Treeviewプログラムを使用した(MB Eisenら,上記)。
結果
再発関連シグネチャの同定
本発明者らは、訓練セット/評価セットI間の情報漏洩なく外科的治療を受けた肺腺癌患者の再発と死亡に関する遺伝子発現シグネチャを構築し検証した(図1)。まず、87事例の発現プロファイルデータを60の訓練セットと27の評価セットIに分類した。次に、60の訓練セットのうち、再発により、外科的切除後5年以内に死亡した21人の患者が腫瘍中に一般的な高リスクシグネチャを有しているのに対し、全フォローアップ期間中再発の兆候を示すことなく5年以上生存した28人の患者は前述のシグネチャを腫瘍中に有さなかったと仮定した。訓練セット中残る11名の患者は、腫瘍の悪性度が不明確なことから、再発関連シグネチャを同定する工程から除外された。除外された患者のうち、5名はフォローアップ期間中なんらかの再発の兆候を示しつつ5年以上生存し、5名は5年以上生存した後に癌により死亡し、1名は再発の証拠はないが死亡した。
全ゲノムマイクロアレイ(Agilent社製;Whole Human Genome(4×44K)Oligo Microarray Kit;型番G4112F)上の41,000個のプローブのうち、23,828個のプローブが情報伝達的プローブを選択する最初のフィルタリング基準を通過しSN計測基準に基づいて分類され、再発により死亡した患者と手術により治癒した患者を識別する最良の再発関連シグネチャを同定するのに用いられた。増加する数の予測プローブを適用した各モデルに関する学習エラーは、10−foldクロスバリデーションにより計算し、計算は新しくランダムに分けられたデータセットを用いて100回繰り返した。最大200個の予測プローブからなる1,000個の独立したセットは、再発関連シグネチャを用いた分類器を構築するために選択された。その結果、82個の予測プローブの使用により最小学習エラーが発生することがわかり(図2A)、各82個の予測プローブからなる独立した1,000個のセット間で最も高頻度に共有されている82個のプローブが再発関連シグネチャとして同定された(以下「RRS−82」と称する。上記表1参照)。RRS−82シグネチャは、全ステージ又はステージIを考慮した際に極めて予後が不良な患者群を識別することができるように思われる(無再発生存に関しては図2B及び2C、全生存に関しては図7を参照)。
RRS−82と様々な遺伝的変化の関係と比較
肺癌は、遺伝的変化を有する患者の臨床的性質に影響を与えるかもしれない様々な遺伝的変化を隠匿することが知られている。そこで、本発明者らはRRS−82とEGFR、K−ras又はp53遺伝子変異の存在との関連を分析した。しかしながら、それらの間に統計的に有意な関連は発見されなかった。更に、その遺伝的変化の予後的有意性も同じ患者のサンプルセットを用いて分析し、それによりRRS−82を用いる予後予測分類器を構築した、EGFR変異の存在と術後予後間の関連は観察されなかった(図3A)。K−ras変異(図3B)又はp53変異(図3C)を有する患者と有さない患者間に、全生存に関する統計的有意差はなかった。
評価セットを用いたRRS−82の検証
RRS−82のロバスト性を評価するために、肺腺癌27サンプルの独立した評価セットIを用いてRRS−82の識別能力を分析した。評価セットIを用いて得られた結果は、RRS−82が再発及び死亡の高リスク患者と低リスク患者を識別できることを示した。無再発生存は2群間で有意に異なり、高リスク群の8名の患者の無再発生存期間中央値が292日間なのに対し、低リスク群の18名の患者では108ヶ月間であった(P<0.0003、図4A)。高リスク群及び低リスク群中の無再発患者の割合は2年の時点でそれぞれ38%、78%だった。注目すべきは、RRS−82の高リスクシグネチャを示す8名の患者全てが5年以内のフォローアップ期間中に再発を経験したのに対して、RRS−82の低リスクシグネチャを示す患者の67%が術後5年後に再発の兆候を示していなかった。高リスク群の患者のうち、外科的切除後の全生存率は、低リスク群患者の生存率に比して有意に低かった(P=0.026、図4B)。多変量Cox比例ハザードモデルにおいて、RRS−82は無再発生存(P=0.03)及び全体的生存(P=0.03)の両方を予測する独立した有意な予後的因子であることが判った。また、評価セットIとIIを加えたときの多変量Cox比例ハザードモデルにおいても、RRS−82は無再発生存(P<0.001)及び全体的生存(P=0.005)の両方を予測する独立した有意な予後的因子であることが判った(表3)。
ステージI患者におけるRRS−82の有用性
本発明者らは、早期またはより進行した疾病を持つ腺癌事例のサブグループのRRS−82の識別力を、評価セットI中ステージIの16サンプルを用いて更に評価した。RRS−82に基づいて高リスクと予測されたステージI患者は全員5年以内に再発を経験し、フォローアップ期間中に死亡した(無再発生存については図4C(P=0.0008)、全生存については図4D(P=0.043)に示す。両件とも対数順位検定による)。また、すべてステージIからなる評価セットIIの30サンプルを用いても、統計的有意であることが確認された(図4E、4F)。さらに、評価セットIのステージIの16サンプルと評価セットIIの30サンプルを合わせた46サンプルの解析においても、RRS−82の識別力は統計的有意であることが確認された(図4G、4H)。
ステージII〜III患者のうち、無再発及び全生存は、高リスクシグネチャを有する患者と比べて低リスクRRS−82シグネチャを有する患者の場合に良好となる傾向があったが統計的に有意ではなかった(図8A及び8B)。
本発明者らは、別の側面からもRRS−82とTNM診断(T:原発腫瘍の拡がり;N:所属リンパ節転移の有無と拡がり;M:遠隔転移の有無)(例えば肺癌・食道癌・乳癌・取扱い規約(抜粋)金原出版)の関係を調査した。低リスク群の患者のうち、無再発生存のKaplan−Meier曲線(図5A)及び全生存のKaplan−Meier曲線(図9A)が共に、病理学的な疾病のステージと適度な関係を示す傾向があった(無再発生存に関してはP=0.15、全生存に関してはP=0.18)。一方、高リスク群の患者では、無再発生存(図5B)及び全生存曲線(図9B)が共に、病理学的な疾病のステージとは無関係であった(無再発生存に関してはP=0.71、全生存に関してはP=0.87)。
本発明の上記テストの結果、訓練セットと評価セットIそれぞれにおける高リスクRRS−82シグネチャと判定した症例の86%、100%に再発が認められた。これは、Dukeら(DG Beer,Nat.Med.8:816−24,2002)が報告したACOSOG及びCALGB有効性評価データセットのそれぞれの69%、79%で再発を高リスクmetageneシグネチャが予測した結果に比べると、格段に判定の確度(又は精度)が向上していることが分かる。
独立したデータセットを用いたRRS−82の一般適用性の確認
肺腺癌の生存可能性を予測する際のRRS−82のロバスト性は、39サンプルの肺腺癌に関する他の完全に異なるデータセットとDuke大学の遺伝子発現データセットを用いて更に検証した。Agilentプラットフォーム上のRRS−82中46個の遺伝子のみが比較的新しいバージョンのAffymetrixプラットフォームのDuke大学データセットプローブに対応するので(表4)、RRS−82を用いた分類器を直接適用することは不可能であった。そこで、教師無しの階層クラスタリングにより46個の対応する遺伝子の発現プロファイルに基づき分析した。29サンプルの腺癌が、有意に異なる術後生存可能性を示す(P=0.028、図6B)明らかに2つの違うサブセットにクラスター分類された(図6A)。また、Michigan大学の遺伝子発現データセットを用いてRRS−82と重複する31遺伝子を抽出し、予測モデルの構築を行った(図6C)。そのモデルを用いて、Memorial Sloan−Ketteringがんセンターの遺伝子発現データ104サンプルを解析したところ、このモデルにより判別された高リスク群と低リスク群には、無再発生存に関して統計学的に有意な違いを認めた。(P=0.0003)(図6D)。これらの結果により、RRS−82に含まれる遺伝子は、再発リスク評価に関連する汎用性(一般適用性)を有する事が示された。
Materials and methods
Patients received 87 cases of lung adenocarcinoma from patients who had undergone resection surgery between December 1995 and August 1999, and were approved by the Aichi Cancer Center and Nagoya University Ethics Committee and Obtained consent form and obtained at Aichi Cancer Center (Nagoya City). None of the cases received adjuvant chemotherapy. The median follow-up period for patients who were alive at the time of the last follow-up was 90 months (range: 64-108 months). All tumor specimens were embedded in an OCT compound (Sakura Seiki Co., Ltd., Tokyo, Japan) and stored at −80 ° C. Two-thirds of patients (n = 60) were randomly assigned to the training set, and the remaining one-third (n = 27) was evaluated set I. Similarly, 30 samples diagnosed as stage I among lung adenocarcinoma samples of patients undergoing resection surgery between February 2002 and December 2004 were used as evaluation set II (Table 2).
Isolation of RNA Frozen tissue of tumor specimens was subjected to gross microdissection using Giemsa-stained sections of 10 sheets under the guidance of a pathologist (YY). Total RNA was extracted using the RNeasy kit (Qiagen, Valencia, CA) and treated with DNaseI. RNA levels were measured using a NanoDrop (R) ND-1000 UV-Vis spectrophotometer (NanoDop Technologies, Wilmington, Del.) And RNA properties were observed using an Agilent 2100 Bioanalyzer and expressed as RNA complete values (RIN) (Agilent Technologies, Palo Alto, CA). A large amount of common standard RNA was prepared using 20 lung cell lines showing all major lung cancer histology.
Obtaining EGFR, p53 and K-ras expression profiles and mutational status From 500 ng of total RNA, using poly dT primers containing Moloney murine leukemia virus reverse transcriptase (Agilent Technologies, Palo Alto, Calif.) And T7 promoter, Single-stranded cDNA was synthesized. CRNA was generated using Low RNA Fluorescent Linear Amplification kit (Agilent Technologies) and labeled with Cy3 or Cy5. Cy5-sample cRNA and Cy3-common standard cRNA were hybridized to a Whole Human Genome oligo DNA microarray kit (G4112F, Agilent Technologies) with 41,000 different probes. After hybridization and washing, slides were scanned using an Agilent DNA microarray scanner (G2505B, Agilent Technologies). Expression data was obtained using Agilent Feature Extraction software 9.5.1 (Agilent Technologies). Mutation status of EGFR, p53 and K-ras has already been reported for the same set of patients (Takeuchi et al., JCO, 2006). The Duke data set can be downloaded from Gene Expression Omnibus (http://www.ncbi.nlm.nih.gov/geo/) under the accession number GSE3593. Regarding clinical information such as survival period (month), situation, cell type, etc. Downloaded from Duke Institute for Genome Sciences and Policy (http://www.genome.duke.edu/). Of the 45 adenocarcinoma samples, 39 adenocarcinoma samples annotated for clinical information were used for this analysis.
Statistical methods First, probes with expression levels above background in at least 90% of the samples were selected. A weighted voting algorithm (each weighted value is calculated as a signal-to-noise ratio, which is an established technique of supervised classification) to identify recurrence-related signatures using signals that have passed this filtering criterion. (Yanagisawa et al., J. Natl. Cancer Inst. 99: 858-67, 2007) In short, it can be used generally without overtraining specific to the training data set. In order to obtain a classifier, we used a 10-fold cross-validation method with 100 random interactions in selecting probe signals to identify relapse-free signatures (AM Molinaro et al. , Bioinformatics 21: 3301-7, 2005). The entire construction process is repeated 1000 times for each classifier with a certain number of predicted genes, using the Kaplan-Meier survival curve and Cox proportional hazards model analysis (Stat version 7.0) for 27 patients. The relationship between the obtained relapse-related signatures in the evaluation set and overall survival and relapse-free survival was analyzed, showing the hazard ratio between death and relapse, respectively.P value presented in multivariable Cox model is similar ratio test All statistical tests were two-sided, using the Cluster program (MB Eisen et al., Proc. Natl. Acad. Sci. USA 95: 14863-8, 1998) between genes and cases. Average associative hierarchical clustering was performed, where the display used the Treeview program (MB isen et al., supra).
result
Identification of Recurrence-Related Signatures We have constructed and verified gene expression signatures for recurrence and death of lung adenocarcinoma patients who received surgical treatment without information leakage between training set / evaluation set I (FIG. 1). First, 87 cases of expression profile data were classified into 60 training sets and 27 evaluation sets I. Next, of the 60 training sets, 21 patients who died within 5 years after surgical resection due to recurrence had a common high-risk signature in the tumor, compared to the entire follow-up period It was assumed that 28 patients who survived for more than 5 years without showing signs of moderate recurrence did not have the aforementioned signature in the tumor. The remaining 11 patients in the training set were excluded from the process of identifying recurrence-related signatures because of the unclearness of the tumor. Of the excluded patients, 5 survived for more than 5 years with some signs of recurrence during the follow-up period, 5 died of cancer after surviving for more than 5 years, and 1 had no evidence of recurrence Died.
Out of 41,000 probes on a whole genome microarray (Agilent; Whole Human Genome (4 × 44K) Oligo Microarray Kit; model number G4112F), 23,828 probes select the first informational probes It was classified based on the SN metric that passed the filtering criteria and was used to identify the best recurrence-related signatures that discriminate between patients who died from recurrence and patients who were cured by surgery. The learning error for each model with an increasing number of predictive probes applied was calculated by 10-fold cross-validation, and the calculation was repeated 100 times using a new randomly divided data set. 1,000 independent sets of up to 200 predictive probes were selected to build a classifier using recurrence-related signatures. As a result, it can be seen that the use of 82 prediction probes causes a minimum learning error (FIG. 2A), which is most frequently shared among 1,000 independent sets of 82 prediction probes each. 82 probes were identified as recurrence-related signatures (hereinafter referred to as “RRS-82”, see Table 1 above). The RRS-82 signature appears to be able to identify patient groups with very poor prognosis when considering all stages or stage I (FIGS. 2B and 2C for relapse-free survival and FIG. 7 for overall survival). See).
Relationship between RRS-82 and various genetic changes and comparison Lung cancer is known to conceal various genetic changes that may affect the clinical nature of patients with genetic changes. Therefore, the present inventors analyzed the relationship between RRS-82 and the presence of EGFR, K-ras or p53 gene mutation. However, no statistically significant association was found between them. Furthermore, the prognostic significance of the genetic change was also analyzed using the same patient sample set, thereby establishing a prognostic classifier using RRS-82. The relationship between the presence of EGFR mutations and postoperative prognosis Not observed (Figure 3A). There was no statistically significant difference in overall survival between patients with and without the K-ras mutation (FIG. 3B) or p53 mutation (FIG. 3C).
Validation of RRS-82 using an evaluation set To assess the robustness of RRS-82, the discriminatory ability of RRS-82 was analyzed using an independent evaluation set I of 27 lung adenocarcinoma samples. The results obtained using Evaluation Set I showed that RRS-82 can distinguish between high-risk and low-risk patients with relapse and death. Relapse-free survival was significantly different between the two groups, with a median relapse-free survival of 8 patients in the high-risk group being 292 days, compared to 108 months in the 18 patients in the low-risk group (P <0.0003, FIG. 4A). The proportion of relapse-free patients in the high-risk group and low-risk group was 38% and 78%, respectively, at 2 years. Of note, all 8 patients with a high risk signature of RRS-82 experienced a relapse during a follow-up period of less than 5 years, compared with 67 patients with a low risk signature of RRS-82. % Showed no signs of recurrence 5 years after surgery. Among high-risk group patients, overall survival after surgical resection was significantly lower than that of low-risk group patients (P = 0.026, FIG. 4B). In a multivariate Cox proportional hazard model, RRS-82 was found to be an independent and significant prognostic factor predicting both relapse-free survival (P = 0.03) and overall survival (P = 0.03). It was. In addition, RRS-82 predicts both relapse-free survival (P <0.001) and overall survival (P = 0.005) in the multivariate Cox proportional hazards model when evaluation sets I and II are added It was found to be an independent and significant prognostic factor (Table 3).
Usefulness of RRS-82 in stage I patients We used 16 samples of stage I in evaluation set I to assess the discriminatory power of RRS-82 in a subgroup of adenocarcinoma cases with early or more advanced disease. And further evaluated. All stage I patients predicted to be high risk based on RRS-82 experienced recurrence within 5 years and died during the follow-up period (FIG. 4C (P = 0.0008) for recurrence-free survival, all Survival is shown in FIG. 4D (P = 0.043), both cases by log rank test). Further, even when 30 samples of evaluation set II consisting of all stages I were used, it was confirmed that they were statistically significant (FIGS. 4E and 4F). Further, in the analysis of 46 samples including 16 samples of stage I of evaluation set I and 30 samples of evaluation set II, it was confirmed that the discriminatory power of RRS-82 was statistically significant (FIGS. 4G and 4H). ).
Of stage II-III patients, relapse-free and overall survival tended to be better in patients with low-risk RRS-82 signatures compared to patients with high-risk signatures, but not statistically significant (FIGS. 8A and 8B).
From another aspect, the present inventors also diagnosed RRS-82 and TNM (T: primary tumor spread; N: presence / absence of regional lymph node metastasis; M: presence / absence of distant metastasis) (for example, lung cancer / esophageal cancer / We investigated the relationship between breast cancer and handling rules (excerpt) published by Kanehara. Among patients in the low-risk group, both the relapse-free survival Kaplan-Meier curve (FIG. 5A) and the overall survival Kaplan-Meier curve (FIG. 9A) tend to show a reasonable relationship with the stage of pathological disease. (P = 0.15 for relapse-free survival, P = 0.18 for overall survival). On the other hand, in the high-risk group of patients, both relapse-free survival (FIG. 5B) and overall survival curve (FIG. 9B) were independent of the pathological stage of disease (P = 0. 71, P = 0.87 for overall survival).
As a result of the above test of the present invention, recurrence was observed in 86% and 100% of cases judged as high-risk RRS-82 signatures in the training set and evaluation set I, respectively. This is because high-risk metadata signatures predicted relapse in 69% and 79% of the ACOSOG and CALGB efficacy assessment data sets reported by Duke et al. (DG Beer, Nat. Med. 8: 816-24, 2002), respectively. Compared to the results, it can be seen that the accuracy (or accuracy) of the determination is significantly improved.
Confirmation of general applicability of RRS-82 using independent data sets The robustness of RRS-82 in predicting lung adenocarcinoma viability was compared to 39 completely different data sets for lung adenocarcinoma And further validation using the Duke University gene expression data set. Since only 46 genes in RRS-82 on the Agilent platform correspond to a relatively new version of the Affymetrix platform Duke University dataset probe (Table 4), applying a classifier using RRS-82 directly It was impossible. Therefore, analysis was performed based on the expression profiles of 46 corresponding genes by unsupervised hierarchical clustering. Twenty-nine samples of adenocarcinoma showed significantly different postoperative viability (P = 0.028, FIG. 6B) and were clearly clustered into two different subsets (FIG. 6A). In addition, 31 genes overlapping with RRS-82 were extracted using a gene expression data set of Michigan University, and a prediction model was constructed (FIG. 6C). Using the model, 104 samples of gene expression data from the Medical Sloan-Kettering Cancer Center were analyzed. The high-risk group and low-risk group identified by this model were statistically significant in terms of recurrence-free survival. Recognized the difference. (P = 0.0003) (FIG. 6D). From these results, it was shown that the gene contained in RRS-82 has versatility (general applicability) related to recurrence risk assessment.

本発明の方法により、肺腺癌患者の術後再発の可能性を極めて高い確度で予測することができる。この方法は、ステージIの患者の場合であっても高い確度の予測を可能にする。これによって、再発のリスクが高い患者に対して生存率を改善するための治療計画を、術後早い段階で、立てることができるようになる。
本発明により、肺腺癌患者において腺癌の術後再発を予測することが可能となるため、術後の患者に適した治療計画を立てることができる。このように、本発明は、肺腺癌の治療のために医療産業に寄与することが可能である。
本明細書で引用した全ての刊行物、特許および特許出願をそのまま参考として本明細書にとり入れるものとする。
[配列表]
By the method of the present invention, the possibility of recurrence after surgery in lung adenocarcinoma patients can be predicted with extremely high accuracy. This method allows for high accuracy predictions even for stage I patients. This makes it possible to develop a treatment plan for improving the survival rate for patients at a high risk of recurrence at an early stage after the operation.
According to the present invention, it becomes possible to predict postoperative recurrence of adenocarcinoma in lung adenocarcinoma patients, so that a treatment plan suitable for postoperative patients can be made. Thus, the present invention can contribute to the medical industry for the treatment of lung adenocarcinoma.
All publications, patents and patent applications cited herein are incorporated herein by reference in their entirety.
[Sequence Listing]

Claims (16)

肺腺癌患者において肺癌の外科切除後の肺腺癌の再発を予測するための方法であって、配列番号1〜82の各ヌクレオチド配列を含む遺伝子からなる群から選択される2〜82個の遺伝子の遺伝子セットの発現を該患者由来の生物学的サンプルにおいて測定することを含み、ここで、配列番号1〜5、8〜9、12、14〜15、17、19〜21、23〜28、30〜33、35〜59、61〜68、70〜82のいずれかのヌクレオチド配列を含む遺伝子の発現が術後無再発症例と比べて相対的に高い場合、或いは、配列番号6〜7、10〜11、13、16、18、22、29、34、60、69のいずれかのヌクレオチド配列を含む遺伝子の発現が術後無再発症例と比べて相対的に低い場合、肺腺癌の再発が高いと予測することを特徴とする、前記方法。   A method for predicting recurrence of lung adenocarcinoma after surgical resection of lung cancer in a patient with lung adenocarcinoma, comprising 2 to 82 selected from the group consisting of genes comprising each nucleotide sequence of SEQ ID NOs: 1 to 82 Measuring the expression of a gene set of genes in a biological sample from said patient, wherein SEQ ID NOs: 1-5, 8-9, 12, 14-15, 17, 19-21, 23-28 , 30-33, 35-59, 61-68, 70-82, the expression of the gene is relatively high compared to postoperative recurrence-free cases, or SEQ ID NOs: 6-7, Lung adenocarcinoma recurrence when the expression of a gene comprising any nucleotide sequence of 10-11, 13, 16, 18, 22, 29, 34, 60, 69 is relatively low compared to post-operative recurrence-free cases Is expected to be high And to the method. 前記遺伝子セットの遺伝子数が5〜82である、請求項1に記載の方法。   The method according to claim 1, wherein the number of genes in the gene set is 5-82. 前記遺伝子セットの発現の測定を、前記遺伝子に対応する核酸又はタンパク質の存在もしくは量を測定することによって行う、請求項1に記載の方法。   The method according to claim 1, wherein the expression of the gene set is measured by measuring the presence or amount of a nucleic acid or protein corresponding to the gene. 前記遺伝子セットの発現の測定を、ハイブリダイゼーション法又は定量PCR法によって行う、請求項1に記載の方法。   The method according to claim 1, wherein the expression of the gene set is measured by a hybridization method or a quantitative PCR method. 前記ハイブリダイゼーション法が、マイクロアレイ法又はブロット法である、請求項4に記載の方法。   The method according to claim 4, wherein the hybridization method is a microarray method or a blot method. 前記ハイブリダイゼーション法を、前記遺伝子由来のRNA転写産物、cRNA、aRNA又はcDNAとハイブリダイズする核酸を用いて行う、請求項4又は5に記載の方法。   The method according to claim 4 or 5, wherein the hybridization method is performed using a nucleic acid that hybridizes with an RNA transcript, cRNA, aRNA or cDNA derived from the gene. 前記遺伝子セットの発現の測定を、免疫学的方法によって行う、請求項1に記載の方法。   The method according to claim 1, wherein the expression of the gene set is measured by an immunological method. 前記免疫学的方法を、前記遺伝子によってコードされるタンパク質又はその断片に対する抗体を用いて行う、請求項7に記載の方法。   The method according to claim 7, wherein the immunological method is performed using an antibody against a protein encoded by the gene or a fragment thereof. 肺腺癌患者において肺癌の外科切除後の肺腺癌の再発を予測するための組成物であって、該組成物が、配列番号1〜82のいずれかのヌクレオチド配列を含む2以上の異なる遺伝子の発現を測定することを可能にする複数の核酸を含み、該核酸が、
(1)配列番号1〜82に示されるヌクレオチド配列、それに相補的なヌクレオチド配列、或いはそれらのヌクレオチド配列中の連続する15塩基から全塩基数未満の部分配列を有する核酸、及び
(2)配列番号1〜82に示されるヌクレオチド配列又はそれに相補的なヌクレオチド配列を含む核酸とハイブリダイズする核酸、或いは該ハイブリダイズする核酸の連続する15塩基から全塩基数未満の部分配列を有する核酸、
からなる群から選択されることを特徴とする、前記組成物。
A composition for predicting recurrence of lung adenocarcinoma after surgical resection of lung cancer in a patient with lung adenocarcinoma, wherein the composition comprises two or more different genes comprising any nucleotide sequence of SEQ ID NOs: 1 to 82 Comprising a plurality of nucleic acids that allow measuring the expression of
(1) a nucleotide sequence represented by SEQ ID NOs: 1 to 82, a nucleotide sequence complementary thereto, or a nucleic acid having a partial sequence of 15 bases to less than the total number of bases in these nucleotide sequences, and (2) SEQ ID NO: A nucleic acid that hybridizes with a nucleic acid comprising the nucleotide sequence shown in 1-82 or a nucleotide sequence complementary thereto, or a nucleic acid having a partial sequence of less than the total number of bases from 15 consecutive bases of the hybridizing nucleic acid,
The composition is selected from the group consisting of:
前記組成物がキット、マイクロアレイ又はプライマーセットの形態である、請求項9に記載の組成物。   The composition according to claim 9, wherein the composition is in the form of a kit, a microarray or a primer set. 前記核酸が5種類以上から82種類以下の遺伝子の発現の測定を可能にする、請求項9に記載の組成物。   The composition according to claim 9, wherein the nucleic acid enables measurement of the expression of 5 to 82 genes. 請求項1に記載の方法で使用するためのものである、請求項9に記載の組成物。   The composition of claim 9 for use in the method of claim 1. 肺腺癌患者において肺癌の外科切除後の肺腺癌の再発を予測するための組成物であって、該組成物が、配列番号1〜82のいずれかのヌクレオチド配列を含む2以上の異なる遺伝子の発現産物を測定することを可能にする複数の抗体を含み、該抗体が、配列番号1〜82に示されるいずれかのヌクレオチド配列によってコードされるタンパク質又は該タンパク質のアミノ酸配列の連続する少なくとも8アミノ酸残基からなるポリペプチドと免疫学的に反応する抗体、及び該抗体の断片、からなる群から選択されることを特徴とする、前記組成物。   A composition for predicting recurrence of lung adenocarcinoma after surgical resection of lung cancer in a patient with lung adenocarcinoma, wherein the composition comprises two or more different genes comprising any nucleotide sequence of SEQ ID NOs: 1 to 82 A plurality of antibodies that make it possible to measure the expression product of the protein encoded by any one of the nucleotide sequences shown in SEQ ID NOs: 1 to 82 or the amino acid sequence of the protein at least 8 consecutive The composition is selected from the group consisting of an antibody that immunologically reacts with a polypeptide comprising amino acid residues, and a fragment of the antibody. 前記組成物がキットの形態である、請求項13に記載の組成物。   The composition of claim 13, wherein the composition is in the form of a kit. 前記抗体が5種類以上から82種類以下の遺伝子の発現産物の測定を可能にする、請求項13に記載の組成物。   14. The composition of claim 13, wherein the antibody allows measurement of expression products of 5 to 82 genes. 請求項1に記載の方法で使用するためのものである、請求項13に記載の組成物。   14. A composition according to claim 13 for use in the method of claim 1.
JP2009548133A 2007-12-28 2008-12-26 Methods and compositions for predicting postoperative recurrence in patients with lung adenocarcinoma Expired - Fee Related JP5407018B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009548133A JP5407018B2 (en) 2007-12-28 2008-12-26 Methods and compositions for predicting postoperative recurrence in patients with lung adenocarcinoma

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2007339214 2007-12-28
JP2007339214 2007-12-28
PCT/JP2008/073982 WO2009084740A1 (en) 2007-12-28 2008-12-26 Method and composition for predicting the postsurgical recurrence in patient suffering from pulmonary adenocarcinoma
JP2009548133A JP5407018B2 (en) 2007-12-28 2008-12-26 Methods and compositions for predicting postoperative recurrence in patients with lung adenocarcinoma

Publications (2)

Publication Number Publication Date
JPWO2009084740A1 true JPWO2009084740A1 (en) 2011-05-19
JP5407018B2 JP5407018B2 (en) 2014-02-05

Family

ID=40824443

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009548133A Expired - Fee Related JP5407018B2 (en) 2007-12-28 2008-12-26 Methods and compositions for predicting postoperative recurrence in patients with lung adenocarcinoma

Country Status (2)

Country Link
JP (1) JP5407018B2 (en)
WO (1) WO2009084740A1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107058480B (en) * 2016-12-14 2018-07-13 河北医科大学第四医院(河北省肿瘤医院) Long-chain non-coding RNA marker for diagnosing adenocarcinoma of lung

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008536488A (en) * 2005-03-16 2008-09-11 シドニー キンメル キャンサー センター Methods and compositions for predicting cancer death and prostate cancer survival using gene expression signatures
JP5688497B2 (en) * 2005-10-04 2015-03-25 国立大学法人名古屋大学 Methods and compositions for predicting postoperative prognosis in patients with lung adenocarcinoma
JP2007135466A (en) * 2005-11-17 2007-06-07 Hitachi Software Eng Co Ltd Gene set for forecasting relapse of lung adenocarcinoma
JP2007263896A (en) * 2006-03-29 2007-10-11 Univ Nagoya Biological marker for estimating post-operative prediction of lung cancer patient, and method therefor

Also Published As

Publication number Publication date
WO2009084740A1 (en) 2009-07-09
JP5407018B2 (en) 2014-02-05

Similar Documents

Publication Publication Date Title
JP6404304B2 (en) Prognosis prediction of melanoma cancer
WO2008058384A1 (en) Materials and methods for prognosing lung cancer survival
US20130065789A1 (en) Compositions and methods for classifying lung cancer and prognosing lung cancer survival
JP2014522665A (en) Predicting response to anti-CD20 therapy in patients with diffuse large B-cell lymphoma (DLBCL)
CN109111522B (en) Methods and kits for predicting response of esophageal cancer to anti-ERBB 3 antibody therapy
KR101966493B1 (en) Biomarkers for Predicting Triple Negative Breast Cancer Prognostication
CA2851314A1 (en) Predicting tumor response to anti-erbb3 antibodies
WO2009150256A1 (en) Markers for predicting response and survival in anti-egfr treated patients
Schulten et al. Microarray expression profiling identifies genes, including cytokines, and biofunctions, as diapedesis, associated with a brain metastasis from a papillary thyroid carcinoma
JP5422785B2 (en) Methods and biomarkers for blood detection of multiple carcinomas using mass spectrometry
CA2934828A1 (en) Prostate cancer gene profiles and methods of using the same
JP2019514344A (en) Epigenetic profiling of cancer
JP2021016350A (en) Differentiation marker gene set for differentiating or classifying breast cancer subtype, and method and kit
WO2007114485A1 (en) Biological marker for predicting postoperative prognosis of lung cancer patient and method therefor
KR101847815B1 (en) A method for classification of subtype of triple-negative breast cancer
KR101054952B1 (en) UCCR, a marker for diagnosing liver cancer and predicting patient survival, a kit including the same, and prediction of liver cancer patient survival using the marker
JP5688497B2 (en) Methods and compositions for predicting postoperative prognosis in patients with lung adenocarcinoma
JP5407018B2 (en) Methods and compositions for predicting postoperative recurrence in patients with lung adenocarcinoma
JP6617225B2 (en) How to differentiate esophageal basal cell carcinoma
JP5760247B2 (en) Composition and method for predicting postoperative prognosis or metastatic potential of cancer patients
KR101622454B1 (en) Predictive biomarkers for EGFR tyrosine kinase inhibitors as anticancer therapy
WO2012121324A1 (en) Method for selecting effective group of cancer treatments combining use of three agents of taxane-based anticancer agent, platinum complex-based anticancer agent, and pyrimidine fluoride-based anticancer agent
KR102326119B1 (en) Biomarkers for predicting prognosis after immunotherapy of cancer
BG67180B1 (en) Method and kit for detection of oncofusion protein

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111222

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130716

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130809

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees