WO2009084740A1 - Method and composition for predicting the postsurgical recurrence in patient suffering from pulmonary adenocarcinoma - Google Patents

Method and composition for predicting the postsurgical recurrence in patient suffering from pulmonary adenocarcinoma Download PDF

Info

Publication number
WO2009084740A1
WO2009084740A1 PCT/JP2008/073982 JP2008073982W WO2009084740A1 WO 2009084740 A1 WO2009084740 A1 WO 2009084740A1 JP 2008073982 W JP2008073982 W JP 2008073982W WO 2009084740 A1 WO2009084740 A1 WO 2009084740A1
Authority
WO
WIPO (PCT)
Prior art keywords
recurrence
expression
gene
nucleic acid
lung adenocarcinoma
Prior art date
Application number
PCT/JP2008/073982
Other languages
French (fr)
Japanese (ja)
Inventor
Takashi Takahashi
Shuta Tomida
Toshiyuki Takeuchi
Yasushi Yatabe
Tetsuya Mitsudomi
Original Assignee
National University Corporation Nagoya University
Oncomics Co., Ltd.
Aichi Prefecture
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National University Corporation Nagoya University, Oncomics Co., Ltd., Aichi Prefecture filed Critical National University Corporation Nagoya University
Priority to JP2009548133A priority Critical patent/JP5407018B2/en
Publication of WO2009084740A1 publication Critical patent/WO2009084740A1/en

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57423Specifically defined cancers of lung
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/54Determining the risk of relapse

Definitions

  • the present invention relates to methods and compositions for predicting post-operative recurrence of lung adenocarcinoma patients.
  • Lung cancer is the leading cause of cancer-related mortality in developed countries. Lung cancer is roughly divided into small cell carcinoma and non-small cell carcinoma, and non-small cell carcinoma is mainly adenocarcinoma, squamous cell carcinoma, large cell carcinoma.
  • lung adenocarcinoma accounts for about half of non-small cell cancer and is known to occur most frequently in Japan.
  • the 10-year survival rate of patients with non-small cell carcinoma is very low at about 10%, and about 25-30% of the patients have only undergone surgical resection in stage I patients, Approximately 35 to 50% of these patients have relapsed within 5 years.
  • Non-patent Document 1 Japanese Patent Application Laid Generation
  • Non-patent Document 2 The present inventors have also comprehensively analyzed gene expression patterns, focusing on lung cancer, and analyzed expression patterns associated with metastasis and prognosis prediction.
  • Non-patent Document 2 the present inventors recently classified lung adenocarcinoma into TRU-a, TRU-b, and non-TRU types, and based on this classification, a method for predicting the postoperative prognosis of lung adenocarcinoma patients And discloses a composition (Patent Document 1).
  • lung adenocarcinoma yet another group has a set of genes to distinguish lung adenocarcinoma, a set of genes to distinguish pleural invasion of lung adenocarcinoma, and a prediction of recurrence of lung adenocarcinoma.
  • a gene set for the gene expression (patent documents 2 to 4).
  • Patent Document 4 describes a method for predicting postoperative recurrence of lung adenocarcinoma and a set of 45 genes, and the discrimination rate of lung adenocarcinoma by this gene set is 50% or more.
  • Non-Patent Document 3 discloses the prediction of recurrence of lung adenocarcinoma by a set of 54 genes, which also accurately indicates the recurrence by the conventional method for determining the prognosis of patients with lung adenocarcinoma. The difficulty of prediction is stated.
  • Patent Document 1 International Publication WO 200 7/04341 8
  • Patent Document 2 Japanese Patent Application Laid-Open No. 2007-679 1
  • Patent Document 3 Japanese Patent Application Laid-Open No. 200 7- 6 792
  • Patent Document 4 Japanese Patent Application Laid-Open No. 200 7-1 3 5466
  • Non-patent literature 1 D. G. B e er et al., Na t u r e Med ic i n e 2 002, 8 (8): 8 1 6-8 24
  • Non-patent literature 2 Shuta Kuwata and Takashi Takahata, "Diagnosis of treatment of lung cancer based on expression profile analysis' New development of treatment” Experimental medicine 2004, 22 (14): 45-50, Yodosha (Japan) Non-patent literature 3 J E. L Arsen et al., C Clinical Cancer R esearch 200 7, 1 3: 2946-29 54 Disclosure of the Invention
  • Some cancer patients have a significantly worse prognosis due to metastasis, recurrence, etc. after surgical removal of the tumor and some patients die within 5 years; conversely, there are patients without metastasis or recurrence, that is, the prognosis is good.
  • the present inventors have focused on the fact that there is no method that enables the prediction of recurrence particularly with high accuracy in predicting the prognosis of lung cancer in lung adenocarcinoma patients relatively many in lung cancer patients in Japan. The prediction of recurrence after surgery for lung cancer is very difficult because it is related to various factors.
  • the conventional recurrence prediction method for lung adenocarcinoma is a set of genes that can predict the risk of recurrence using leave—one—outcross-va 1 identification. Have been identified. At this time, when using the determination criteria that determination is impossible, the apparent determination rate and the true determination rate may be extremely different depending on the proportion of undecidable cases included. In addition, in leave-one-outcross-va 1 identification, even when there are very few data to be analyzed, the number of repetitive calculations is small, and this is an effective method for evaluating the accuracy of the prediction model. It is preferable to perform more accurate model evaluation by increasing the data and performing iterative calculations incorporating the 10 0 fo 1 d cross-parison method and random division.
  • the object of the present invention is to provide a method and composition for predicting the recurrence of lung adenocarcinoma with extremely high accuracy in predicting the recurrence of lung adenocarcinoma after surgical removal of lung cancer in patients with lung adenocarcinoma. It is.
  • the present inventors are different from the judgment method of undecidable, that it is a method that presents judgment of either high recurrence risk or low recurrence risk to all cases, and is different from the conventional recurrence prediction gene set, 82
  • the use of a novel set of genes consisting of different types of genes for the determination made it possible to predict the presence or absence of recurrence with a probability of more than 70% in the evaluation model and completed the present invention.
  • the invention in summary, includes the following features.
  • the present invention relates, in a first aspect, to a method for predicting recurrence of lung adenocarcinoma after surgical removal of lung cancer in lung adenocarcinoma patients, comprising a gene comprising each nucleotide sequence of SEQ ID NO: 1-82 Measuring the expression of a gene set of 2 to 82 genes selected from the group: in a biological sample derived from the patient, wherein SEQ ID NOs: 1 to 5, 8 to 9, 12, 14 ⁇ : 1 5, 17, 19-21, 23-28, 3
  • the number of genes of the gene set is 5 or more and 82 or less.
  • the measurement of the expression of the set of genes is performed by measuring the presence or the amount of the nucleic acid or the protein corresponding to the gene.
  • the measurement of the expression of the gene set is performed by a hybridization method or a quantitative PCR method.
  • the hyperprime method is a microarray method or a plotting method.
  • the hybridization method is carried out using nucleic acid which hybridizes to the RNA transcript derived from the gene, cDNA, aRNA or cDNA.
  • the measurement of the expression of the gene set is performed by an immunological method.
  • said immunological method is performed using an antibody against the protein encoded by said gene or a fragment thereof.
  • the present invention relates to a composition for predicting recurrence of lung adenocarcinoma after surgical removal of lung cancer in lung adenocarcinoma patients, which composition is one of SEQ ID NOS: 1-82.
  • a plurality of nucleic acids which make it possible to measure the expression of two or more different genes comprising different nucleotide sequences, said nucleic acids comprising
  • nucleotide sequences as shown in SEQ ID NOs: 1 to 2 nucleotide sequences complementary thereto, or nucleic acids having partial sequences of 15 bases to less than the total number of bases in their nucleotide sequences, and
  • nucleic acid hybridizing with a nucleic acid comprising the nucleotide sequence shown in SEQ ID NO: 1 to 82 or a nucleotide sequence complementary thereto, or the hybridizing agent
  • the above composition is provided, which is selected from the group consisting of: a nucleic acid having a partial sequence consisting of 15 contiguous bases to less than the total number of bases of the nucleic acid of W.
  • the composition is in the form of a kit, a microarray or a set of primers.
  • the above nucleic acid enables measurement of the expression of 5 or more to 82 or less genes.
  • composition is for use in the above method of the present invention.
  • a composition for predicting recurrence of lung adenocarcinoma after surgical removal of lung cancer in a lung adenocarcinoma patient comprising the composition of SEQ ID NO: 1 to 82.
  • Comprising a plurality of antibodies which make it possible to measure the expression products of two or more different genes comprising different nucleotide sequences said antibodies comprising any of the nucleotide sequences shown in SEQ ID NO: 1 to 82.
  • Selected from the group consisting of: an antibody which immunologically reacts with a protein encoded by or a polypeptide consisting of at least 8 consecutive amino acid residues of the amino acid sequence of said protein, and a fragment of said antibody is provided.
  • the composition is in the form of a kit.
  • the above-mentioned antibody probe enables measurement of the expression product of 5 or more to 82 or less genes.
  • composition is for use in the above method of the present invention.
  • post-operative recurrence means that the patient recurs lung adenocarcinoma after surgical removal of the lung adenocarcinoma. Patients who are predicted to relapse are determined to be at high risk for recurrence and have a low survival rate. In contrast, patients who are predicted to have no recurrence are judged to have a low risk of recurrence and have high survival rates.
  • patient refers to a mammal, including humans, with a preferred mammal being humans.
  • nucleic acid is either DNA or RNA, and includes, for example, transcripts (mRNA) of each gene, cDNA, aRNA, cDNA and the like.
  • mRNA transcripts
  • a “gene” encodes a specific protein and is composed of: exon, intron, 5, 1 and 3 '-untranslated region, etc., which enables the formation of precursor mRNA by its transcription, and Through splicing events, they become mRNA, which is translated into protein.
  • protein includes a protein encoded by a specific gene, a variant thereof or a fragment thereof.
  • variants include variants based on natural events such as splicing, polymorphism and the like.
  • a fragment is a protein fragment naturally generated in vivo by the action of an enzyme such as a protease or peptidase.
  • hybridization is a reaction for forming a double strand by base pairing of nucleic acid and nucleic acid.
  • the hybridizations include DNA-DNA hybridization, DNA-RNA hybridisation, and RNA-RNA hybridization.
  • Hybridization is usually performed using a nucleic acid probe immobilized on a solid support.
  • the solid support may be made of plastic, polymer, glass, etc., and may be in the form of a test plate, test tube, test strip, chip or the like.
  • temperature, ionic strength, surfactant concentration, presence or absence of formamide, GC content of nucleic acid, etc. affect the stability of the hybrid and the hybridization rate.
  • a reaction that forms such a complex is referred to as an immunological reaction, and a method of detecting or quantifying an antigen or antibody utilizing this reaction is referred to as an immunological method.
  • Immunological methods can be performed under conditions such as solid phase or liquid phase, homogeneous or heterogeneous, etc.
  • a method using a label eg, a dye, a fluorescent substance, a radioactive isotope, an enzyme, etc.
  • a method using aggregation eg, latex method
  • turbidity It can be performed by a method using immunoprecipitation, a method using a secondary antibody (eg, sandwich method), and the like.
  • FIG. 1 shows a schematic of a training-one efficacy strategy for identifying relapse-associated signatures using 100 iterations of the training set randomly divided into 10 1 0 ⁇ f o d c r o s s ⁇ v a i i d a t i o n.
  • Figure 2 shows the results of a training procedure to identify relapse-associated signatures.
  • Figure 2A shows the results of the search for the optimal number of probes to define recurrence related signatures. Survival rates in the training group were assessed using K ap 1 a n -Me i e r survival curves. The patient's recurrence related curves at all stages ( Figure 2B) and at stage I ( Figure 2C) are also shown.
  • FIG. 3 shows K ap 1 a n -Me ier survival in the presence or absence of EGFR mutations (FIG. 3 A), K 1 ras mutations (FIG. 3 B) and p 5 3 mutations (FIG. 3 C) in the training data set Indicates the fountain.
  • FIG. 4 shows the effectiveness of the RR S-82 signature using evaluation set I and evaluation set I I.
  • Ka p 1 a n -Me i er survival curves were presented according to the risk predicted based on RRS-82.
  • FIG. 4A shows all-stage recurrence-free survival curves
  • FIG. 4B shows all-stage overall survival curves
  • FIG. 4C shows stage I recurrence-free survival curves
  • 4D stage I overall survival curves.
  • the recurrence-free survival curve and the overall survival curve are shown in FIG. 4E and FIG. 4F, respectively, using the evaluation set II consisting of the stage I only samples.
  • the recurrence-free survival curves in the evaluation set I + I I are shown in FIG. 4G, and the overall survival curves are shown in FIG. 4H.
  • Figure 5 shows the relationship between RRS- 82 based risk groups and the TNM stage.
  • FIG. 5A is a recurrence-free survival curve for patients with low-risk RR S-82, Figure 5B. Each shows a relapse-free survival curve for patients with high-risk RRS—82 signatures.
  • Figure 6 shows the effectiveness of the RR S _ 82 signature by analysis of independent data sets.
  • Figure 6A shows the results of an unsupervised hierarchical clustering analysis performed using the components of RR S _ 82 2 signatures in the data set of University of Duke consisting of 39 lung adenocarcinomas.
  • B shows Kaplan-Meier survival curves of clusters I and II.
  • Fig. 6C shows a conceptual diagram of constructing a prediction model using the data set of the University of Michigan.
  • Fig. 6D shows Ka a n-Me i survival curves obtained by analyzing the gene expression data of the cancer center's cancer center gene 104 using the model constructed by Fig. 6 C.
  • FIG. 7 shows the assessment of K ap 1 an ⁇ Mei er survival in the training data set.
  • Figure 7A shows the overall survival curve with RR S-82 signatures in multiple patients at all stages
  • Figure 7B shows the overall survival with RR S- 82 signatures in multiple patients with stage I. The survival curve is shown.
  • FIG. 8 shows the evaluation of K a l one i me i e r survival by R R S s-2 in an evaluation set I middle stage I I to I I I cases.
  • stage II-III patients recurrence-free ( Figure 8A) and overall survival ( Figure 8B) are better for patients with low risk RR S-82 signatures compared to patients with high risk signatures. There was a trend but it was not statistically significant.
  • FIG. 9 shows that in the evaluation set I, the association between RR S-82 and the stage was evaluated using the K ap 1 an -Me ier survival curve.
  • the overall survival curve of stage I cases tends to be better, although not statistically significant, in comparing stage I cases with stage I cases.
  • the overall survival curves are almost the same in the comparison of Stage I and Stage I I I I I cases.
  • the present invention is a method of rescuing lung adenocarcinoma after surgical removal of lung cancer in lung adenocarcinoma patients.
  • the reason why such high-accuracy prediction has been made possible is, in part, the rigorous selection of postoperative recurrence cases and recurrence-free cases among lung adenocarcinoma patients based on the expertise and experience of specialists. Under conditions such as using reliable statistical methods, based on finding previously unpublished 82 gene sets related to postoperative recurrence / no recurrence in lung adenocarcinoma patients. There is.
  • the correct answer rate when performing recurrence prediction using a single gene drops significantly.
  • Figure 2A shows that even if more than 82 genes are used, the correct answer rate tends to get better or worse.
  • the present inventors prepared 87 lung adenocarcinoma samples from lung adenocarcinoma patients who underwent excision surgery, of which 60 were randomly assigned to the training set. The remaining 27 were used as the evaluation set.
  • a supervised classification technique weighted voting algorithm; Y anagisa wa et al., J. Na tl t) using a probe signal that exceeds background expression levels for the training set samples and uses probe signals that meet this filtering criteria.
  • the 10 0-fo 1 d cross validation method divides 10 0 samples into 10 samples at 1 0, and the remaining 9 divisions excluding 1 division from this 1 ⁇ division have characteristics (relapse related signatures).
  • Make a selection construct a classifier consisting of the selected top 1 to a maximum of 2 0 0 predicted probes, and perform 1-division classification without exclusion.
  • From the top of the selected 1st place up to a maximum of 0.
  • the 82 gene set of the present invention (referred to as "RRS-82") is preferably 75% or more of high risk patients with relapse-death and low risk patients with no recurrence and high survival. It is possible to determine with a high degree of accuracy of 80 ° / 0 or more, and more preferably 90% or more.
  • RR S-82 is a set of 82 kinds of genes including each nucleotide sequence of SEQ ID NOs: 1 to 82. This gene set is shown in Table 1.
  • No. 2 to No. 8 2 in the above table respectively correspond to SEQ ID NO: 2 to SEQ ID NO: 2 It corresponds to 8
  • Two types of genes are classified according to relative expression difference with postoperative recurrence-free cases, ie, for recurrence-associated siginthia, ie recurrence (death) signet or high relapse risk signal sign and relapse-free sign or low recurrence risk signet, Then I was able to divide it into the following two groups.
  • lung adenocarcinoma patients are predicted as relapse (death) patients or high risk patients, or non-relapse patients or low recurrence risk patients depending on whether the relative expression is high or low. ⁇ Can be classified. Also, in the case of the gene of the above-mentioned (2) group, the lung adenocarcinoma patient is conversely a non-relapsed patient or a low risk patient depending on whether the relative expression is low or high, or a relapse (death) patient or Predictable as high risk patients-can be classified.
  • the method of the present invention is a recurrence or high risk, it will be possible to formulate an early treatment plan for suppressing postoperative recurrence of lung adenocarcinoma patients, while, on the other hand, no recurrence or low risk. If determined, it can also serve as a basis for avoiding useless chemotherapy and radiation therapy.
  • the control in comparing the relative expression levels of the above genes is a postoperative non-recurring case, and if the above prediction can be made, a predetermined period after surgery (eg 3 years, preferably 5 years, more preferably 10) It is a sample (lung adenocarcinoma tissue or cells) derived from a patient who is judged to have no recurrence.
  • the recurrence / no recurrence prediction according to the method of the present invention can be performed regardless of the tumor stage, and interestingly, even in the early stage.
  • the present invention is, in one aspect thereof, a method for predicting recurrence of lung adenocarcinoma after surgical removal of lung cancer in lung adenocarcinoma patients, comprising a gene comprising each nucleotide sequence of SEQ ID NO: 1-82 Measuring the expression of a gene set of 2 to 2 genes selected from the group in a biological sample derived from said patient, wherein: SEQ ID NOs: 1 to 5, 8 to 9, 12, 14 Expression of a gene containing a nucleotide sequence of any one of 1 to 15, 1 7, 19 to 21, 1, 23 to 28, 30 to 33, 35 to 59, 6 to 68, 70 to 82 Is relatively high compared to the postoperative recurrence-free cases, or array numbers 6 to 7, 1 0 to: 1 1, 13, 16, 18, 22, 29, 34, 60, If the expression of a gene containing any of the 69 nucleotide sequences is relatively low compared to post-surgery recurrence-free cases, it is characterized
  • the above 82 genes are human genes comprising the nucleotide sequences shown by SEQ ID NOs: 1-8, as described above. Since it is a gene derived from an organism, it is considered that mutations such as polymorphic mutation, splice mutation, mutation may occur. Therefore, the target gene of the present invention may contain not only nucleotide sequences represented by SEQ ID NOs: 1 to 2 but also deletions, substitutions or additions of one or several nucleotides in these sequences, Or at least for these sequences
  • It may have an identity of 95%, preferably at least 97%, more preferably at least 98%, most preferably at least 99%.
  • identity (%) introduces a gap or It can be determined using a known BL AS T or FA S TA algorithm without introducing a gap (K ar 1 in and AI t ch ul, 199 3, P roc. N atl. A ca d. S ci. USA, 90: 58 73- 5 8 77; Karlin and A 1 tschu 1, 1 990, Pr o C. N at 1. A cd S. USA, 8 7: 2264-22 68; A ltschul et al., 1 9 90, J. Mo 1. Biol., 215: 403; Altschul et al., 1 9 9 7, Nucleic Acids Res 25: 3389- 3402). In general, identity (%) can be calculated as a percentage of the number of matched bases relative to the total number of bases.
  • serial refers to an integer from 2 to 10, that is, any of 2, 3, 4, 5, 6, 7, 8, 9 or 10 , Preferably an integer of 2 to 5, more preferably 2 or 3.
  • the number of genes in the gene set is 2 to 100 (82), and the number of genes in this range can predict post-operative recurrence.
  • Gene expression can be measured for the amount or presence of nucleic acids or proteins.
  • nucleic acid the transcripts of each gene, mRNA and its derivative nucleic acid, for example, cDNA, cRNA, RNA (an RNAi RNAi) can be used as a measurement target.
  • RNAi RNAi RNAi RNAi
  • protein a protein encoded by each gene (also referred to as an expression product or gene product), a fragment thereof or a post-translational modification product (for example, modification by sugar etc.) can be the measurement target.
  • the following describes a method for measuring the expression of the above-mentioned 82 genes at the nucleic acid and protein levels.
  • test sample is lung adenocarcinoma tissue or cells of a lung adenocarcinoma patient, such as cancer tissue resected by surgery or tissue or cells obtained by biopsy. Measurement of gene expression by nucleic acid
  • nucleic acids can be used as probes or primers to detect the expression of 82 genes.
  • nucleotide sequences as shown in SEQ ID NOs: 1 to 2 nucleotide sequences complementary thereto, or nucleic acids having partial sequences of 15 bases to less than the total number of bases in their nucleotide sequences, and
  • nucleic acid that hybridizes to a nucleic acid comprising the nucleotide sequence shown in SEQ ID NO: 1 to 8 or a nucleotide sequence complementary thereto, or alternatively, from 15 bases to less than the total number of bases of the hybridizing nucleic acid. Nucleic acid having a partial sequence.
  • the size of the nucleic acid fragment consisting of the above partial sequence is 15 bases to less than the total number of bases, for example, 17 bases or more, 20 bases or more, 30 bases or more, 30 bases or more, 50 bases or more, 70 bases or more, 100 bases
  • the above is the range of 150 bases or more, 200 bases or more, 300 bases or more, 400 bases or more, or 500 bases or more to less than the total number of bases.
  • the above-mentioned nucleic acid is a DNA molecule having a size of about 100 bases or less, the ability to be synthesized using a commercially available automatic DNA synthesizer using a phosphoramidite method or the like, or a DNA molecule having a size of about 100 bases or more.
  • C DNA can be prepared by cloning and polymerase chain reaction (PCR).
  • PCR polymerase chain reaction
  • cDNA and a RNA can be prepared from cDNA using a commercial kit and the like.
  • RNA is obtained from lung adenocarcinoma tissue, and poly A (+) RNA is obtained by oligo d T cellulose column treatment, followed by reverse transcription-polymerase chain reaction (RT-PCR) method.
  • a cDNA library is prepared by the method described above, and a 15 base or longer probe or primer generated from this library based on the nucleotide sequences shown in SEQ ID NOS: 1-82 corresponds to the target gene.
  • the cDNA can be selected / cloned or PCR amplified.
  • the probe has a sequence complementary to the cDNA sequence, and its length is preferably
  • a primer consists of a sense primer and an antisense primer, and the length thereof is preferably 15 to 50 bases, more preferably 17 to 30 bases, and still more preferably 20 to 25 bases.
  • the DNA obtained as described above may be inserted into a commercially available or literature vector, introduced into a prokaryotic or eukaryotic host cell and amplified, or the DNA of interest may be inserted.
  • the PCR can be amplified by PCR.
  • the vector is a vector such as plasmid, phage, plasmid or virus, for example, plasmid such as pBluescript system, pUC system, pBR system.
  • the vector I includes, in addition to the target DNA, a promoter, an origin of replication, a ribosomal binding sequence (or Shine-Dalgarno sequence), a terminator I, a selective marker sequence (eg, a drug resistance gene), a multicloning site, etc. Can be included.
  • Vectors suitable for the host cell are commercially available and it is desirable to use them.
  • Prokaryotic host cells are bacterial cells, and generally include E. coli, B. subtilis, Pseudomonas bacteria, and the like.
  • Eukaryotic host cells also include yeast, fungi, basidiomycetes, animal cells (such as insect cells and mammalian cells), plant cells and the like.
  • Methods for introducing the vector into host cells include, for example, electroporation, calcium phosphate method, Spheroplast fusion method, protoplast fusion method, microinjection, gene gun method, globulin method and the like.
  • Nucleic acids that can be used in the method of the present invention include, as described in (2) above, a nucleic acid that hybridizes with a nucleic acid comprising the nucleotide sequence shown in SEQ ID NO: 1-8 or a nucleotide sequence complementary thereto It is a nucleic acid having a partial sequence of 15 consecutive bases to less than the total number of bases of the nucleic acid. Hydridization is preferably carried out under stringent conditions. It is possible to cause hybridization with a nucleic acid having a sequence identity of at least 90%, preferably at least 95%, more preferably at least 98, most preferably at least 99% to the above-mentioned nucleotide sequence.
  • the expression of 82 gene set is measured using the above nucleic acid.
  • Preferred measurement methods include hybridization methods or quantitative PCR methods (such as real-time PCR methods).
  • a nucleic acid probe attached or bound on the surface of a solid support is bound to a partially or completely complementary nucleic acid via base pairing to form a double strand. It means the method to form.
  • the solid support includes, for example, a test plate, a test tube, a test piece, an array and the like, and the material is usually a polymer (or plastic, resin), glass or the like.
  • the hybridization used in the method of the present invention may be any of DNA-DNA hybridization, DNA-RNA hybridization or RNA-RNA hybridization, and the method is not limited to this method. For example, microarray method, blotting method such as Northern blot, Southern blot, Northern hybridization, Southern hybridization, in situ hybridization etc. are included.
  • a 15 base or more nucleic acid probe that hybridizes with a gene containing the nucleotide sequence of SEQ ID NO: 1 to 8 or a corresponding nucleic acid (mRNA, cDNA, RNA or RNA) is bound to a support
  • a spacer crosslinker containing a reactive group for covalently binding a nucleic acid probe On the surface of the microarray, it is possible to introduce a spacer crosslinker containing a reactive group for covalently binding a nucleic acid probe. Binding of the array surface to the nucleic acid probe can be performed, for example, through a chemical reaction with light or heat.
  • Stringent conditions include the conditions defined above, but it is desirable to appropriately determine optimum conditions according to the type of hybridization method.
  • stringency refers to temperature, ion strength of solution, presence of formamide, relative GC content of nucleic acid, incubation time It greatly depends on etc.
  • the temperature can be determined from the temperature range before and after the temperature (Tm) at which 50% of the oligonucleotide dissociates from its complementary strand.
  • Tm temperature at which 50% of the oligonucleotide dissociates from its complementary strand.
  • the temperature under stringent conditions is usually a temperature within the range of 42 to 68 ° C.
  • High stringency hybridisation conditions include, for example, hybridization with 6 X SSC, 0.1 M EDTA, IX Denhardt's solution, 0.5% SDS at 68 ° C .; 1 MN a C 1, Hybridization at 60 ° C in 0.5% sarkosyl, 30% formaldehyde; washing at 55 ° C in 0.1 X SSC, 0.1% SDS, and so on.
  • 1 X SSC is 15 OmM sodium chloride and 15mM sodium taenoate aqueous solution (p H 7.2).
  • the immobilization of the nucleic acid probe is not particularly limited, but a general method, for example, a method of spotting the DNA using a high-density dispenser called spotter or arrayer, or a method of jetting droplets from the nozzle It can be implemented using methods such as methods.
  • a nucleic acid such as cDNA, cDNA, or a RNA derived from a lung adenocarcinoma tissue test sample surgically resected from a lung adenocarcinoma patient, such as a C y dye (for example, C r 3 or C y 5) Label with fluorescent substance and hybridize with the probe on the microarray.
  • the fluorescence intensity is read using a laser scanning reader and data is analyzed by a computer.
  • nucleic acid probe of the present invention is labeled with a radioactive isotope (for example, 32 P and 35 S), a fluorescent substance (fluoresamine, rhodamine, derivatives thereof, C y dye etc.), etc.
  • a radioactive isotope for example, 32 P and 35 S
  • fluorescent substance fluoresamine, rhodamine, derivatives thereof, C y dye etc.
  • Hybridization is performed with the nucleic acid such as mRNA, cDNA, RNA, and RNA in the test sample that has been transcribed.
  • the signal is detected using a radiation detector or fluorescence detector and its intensity is measured.
  • the cDNA is paired with cDNA so that cDNA regions prepared from mRNA in lung adenocarcinoma tissue test samples can be used as templates to amplify the regions of each target gene.
  • PCR is performed to detect the amplification product double-stranded DNA in real time.
  • the amplification product is exponentially amplified every cycle and eventually reaches a plateau.
  • Real-time PCR using serially diluted standard samples Conduct the cycle number on the horizontal axis and the PCR width amount on the vertical axis to create an amplification curve for each cycle number. Set the threshold and calculate the Ct value (threshold cycle) at which the threshold and the amplification curve intersect.
  • the Ct value is the number of cycles when a constant amount of PCR product is reached. Since there is a linear relationship between the C 1: value and the amount of initial template DNA, create a calibration curve.
  • the detection of the amplification product can be carried out using a method such as an intercalator method or a fluorescent labeling method.
  • the intercalator method is, for example, a method of monitoring the amount of amplification product utilizing the property that a fluorescent substance is bound between double strands of DNA formed by hybridization.
  • the probe is labeled with a fluorescent substance, and the amount of amplification product is monitored by a fluorescent signal.
  • real-time PCR systems are commercially available, they can be used to perform real-time PCR.
  • the amplification size should be in the range of 80 to 150 bp
  • the primer size should be in the range of 1 to 25 bases
  • the GC content of the entire primer should be 40 to 60. %
  • the 3 'end of the primer is G or C
  • the Tm values of the upstream primer and the downstream primer are within 2 ° C. It is known that designing template-specific primers.
  • PCR conditions are, for example, denaturation: 30 to 60 seconds at 92 to 94 ° C .; amino rings: 30 to 60 seconds at 50 to 55 ° C .; elongation: 30 to 60 seconds at 68 to 72 °
  • One cycle includes 30 to 40 cycles of reaction.
  • the reverse transcriptase is a commercially available enzyme, for example, S.sup.Script.TM. III (Invitrogen), AMV R.E.Transcriptase ⁇ M-MLV R.E.T. transcriptase (P. rome ga), SYBR P remix E x T aq Carabio etc. can be used.
  • the relative expression level difference between relapse and no relapse is 1.1 times or more, preferably 1.5 times or more, more preferably 2.0 times or more.
  • gene expression can be measured by measuring the amount of a protein encoded by a gene comprising a nucleotide sequence represented by SEQ ID NO: 1-8 or a fragment thereof.
  • An alternative measure of this expression level is an immunoepidemiological method.
  • Proteins for producing antibodies can be produced using cDNA cloning and gene recombination technology.
  • a cDNA library is prepared from lung adenocarcinoma tissue, and a cDNA clone is prepared by PCR using a primer synthesized based on each nucleotide sequence of SEQ ID NO: 1 to 82.
  • the obtained c DNA clone can be incorporated into an expression vector and obtained from the cell or culture supernatant by culturing a prokaryotic or eukaryotic host cell transformed or transfected with the vector.
  • expression vectors can be commercially available or those described in the literature, and examples thereof include plasmids, cosmids, phages and the like.
  • the vector can contain a DNA encoding a target protein, a promoter, a polyadenylation signal, a liposome binding sequence, an origin of replication, a terminator, a selectable marker, and the like.
  • a labeled (poly) peptide eg, mono-galactosidase gene etc.
  • (His) 6 — 10 tag e.g., mono-galactosidase gene etc.
  • F LAG tag amino acid sequence: DYKDDDDK (SEQ ID NO: 1) 50
  • a protein or an oligopeptide such as GF P (green fluorescent protein) and a corresponding DNA sequence may be contained so as to form a fusion protein with the target protein.
  • Host cells include prokaryotic cells such as bacteria (eg, E. coli, Bacillus subtilis, Pseudomonas bacteria, etc.), yeast (eg, Saccharomyces, Schizosaccharomyces, Pichia etc.), insect cells (eg, S f cells), mammalian cells (Eg CHO, COS, BHK, HEK2 93, NI H3 T3 etc) etc.
  • prokaryotic cells such as bacteria (eg, E. coli, Bacillus subtilis, Pseudomonas bacteria, etc.), yeast (eg, Saccharomyces, Schizosaccharomyces, Pichia etc.), insect cells (eg, S f cells), mammalian cells (Eg CHO, COS, BHK, HEK2 93, NI H3 T3 etc) etc.
  • the target protein thus obtained can be gel filtration, ion exchange chromatography, affinity chromatography, hydrophobic chromatography, isoelectric focusing, electrophoresis, ultrafiltration, salting out, dialysis etc. alone. Or in combination It can be made.
  • the protein encoded by the gene of the present invention comprises the amino acid sequence shown in SEQ ID NO: 83 to 149 (this sequence corresponds to SEQ ID NO: 15 to 2 1, 23 respectively).
  • sequences of proteins whose amino acid sequences are not described can be obtained by accessing a database such as G en B ank (US), EMB L (Europe) or the corresponding nucleotide sequences.
  • the amino acid sequence of the target protein can be determined by cDNA cloning and sequencing.
  • mammals such as rabbits, mice, rats, and animals are immunized with the protein obtained by the above-described method or a fragment thereof as an antigen, and antibodies against the antigens are produced and purified. .
  • the antibodies include polyclonal antibodies, monoclonal antibodies, anti-peptide antibodies, antibody fragments thereof and the like.
  • the polyclonal antibody is used to immunize the animal subcutaneously with an appropriate amount (usually, ⁇ g order) of antigen, followed by boosting after about 2 to 3 weeks, and collecting blood about 3 weeks to 2 months after the primary immunization, and antiserum.
  • the obtained Ig G is bound to a carrier prepared by binding the target protein to a carrier such as cellulose or agarose, and then a high salt buffer is prepared.
  • the antibody titer can be measured by a conventional immunoassay, such as enzyme-linked immunosorbent assay (ELISA), radioimmunoassay (RIA), fluorescent antibody assay and the like.
  • ELISA enzyme-linked immunosorbent assay
  • RIA radioimmunoassay
  • fluorescent antibody assay and the like.
  • a monoclonal antibody can be prepared, for example, by the following general method (for example, Hideaki Nagamune and Hiroshi Terada, preparation and characterization of monoclonal antibody, 1 990, Hirokawa Shoten; Yoshi Sado (200 1) “Saving antibody production” Biochemistry 7 3: 1 1 6 3 1 1 6 7 etc.).
  • the target protein or a fragment thereof is administered subcutaneously to mice or rats (eg, B a 1 b / c mice) as in the preparation of polyclonal antibodies, and at intervals of 1 to 4 weeks, approximately Perform 2-4 boosts.
  • mice or rats eg, B a 1 b / c mice
  • the antigen is injected intravenously or intraperitoneally for final immunization.
  • antibody-producing cells eg, spleen cells or lymph node cells
  • antibody-producing cells are fused to a myeloma cell line (preferably a hypoxanthine guanine phosphoribosyl transferase (HG PRT) deficient cell line) to generate hybridoma cells, and HAT (hypoxanthine, aminopterin, etc.) is generated. , Thymidine) selection.
  • a myeloma cell line preferably a hypoxanthine guanine phosphoribosyl transferase (HG PRT) deficient cell line
  • HAT hypoxanthine, aminopterin, etc.
  • Thymidine selection.
  • antibody-producing cells and a myeloma cell line are mixed in an appropriate ratio in a medium for animal cell culture such as serum-free DMEM, R PM I- 1640 medium, polyethylene polyethylene glycol, etc. It is carried out in the presence of a cell fusion promoter.
  • Hybridomassay Confirmation of the target antibody can be performed by the above-mentioned immunoassay. Furthermore, for the growth of hybridomas, hybridomas are administered intraperitoneally to mice, and after hybridomas are allowed to grow, ascites fluid is collected 1 to 2 weeks later. Purification of the antibody can be carried out by appropriately combining methods such as ammonium sulfate fractionation, ion exchange chromatography, affinity chromatography, and generoch chromatography.
  • An anti-peptide antibody is an antibody to a linear peptide on the surface of a protein, and can enhance immunological specificity.
  • Such peptides may be used, for example, to estimate the hydrophilic-hydrophobic region of Kyte-D oolittle et al., Probability of being located on the surface of a specific peptide site on a protein molecule according to E mini et al., Polypeptide chain
  • the degree of bending, for example, ⁇ -helitas such as Chou-Fasman et al., ⁇ -sheet, secondary structure prediction of a protein indicating a turn, etc. can be estimated using alone or in combination.
  • the deduced peptide can then be synthesized using a peptide synthesizer.
  • the antibodies described above can be used for detection of target proteins or fragments thereof in lung adenocarcinoma tissue test samples.
  • a large number of antibodies are bound on a microarray support, or by spotting a large number of antibodies on a polymer membrane (filter), such as a VDF membrane, or a solid phase, such as a multiwell plate.
  • a polymer membrane such as a VDF membrane
  • a solid phase such as a multiwell plate.
  • immunological assays such as enzyme-linked immunosorbent assay (EL ISA, EI ⁇ ), fluorescent antibody, radioactive immunity
  • EL ISA, EI ⁇ enzyme-linked immunosorbent assay
  • RIA epilepsy assay
  • luminescence immunoassay immunoturbidimetric assay
  • latex agglutination latex turbidimetric assay
  • hemagglutination particle agglutination
  • Western blot etc. Fragments can be detected or quantified.
  • solid phase supports include membranes of polymers such as polystyrene, polycarbonate and polyethylene, multi-well plates, test tubes, test strips (test strips), latex, magnetic particles, etc.
  • Be Immobilization can be physical adsorption or chemical.
  • a solid phase can be treated with a reagent such as a maleylation reagent, cyanogen bromide or the like to introduce a functional group that reacts with an amino group or the like of a protein onto the solid phase.
  • labels include Western Wa rust pel O Kishida over peptidase, enzymes such as alkaline phosphatase, Furuoresin, rhodamine, a fluorescent substance, luciferase system, such as their derivatives, luminescent substances such as luminol, 3 2 P, 1 2 5 Radioactive isotopes such as I are included. Labeling includes, for example, the Daltal aldehyde method, the maleimide method, the pyridyl disulfide method, the chloramine T method, the Bolton hunter method and the like.
  • the present invention is also a composition for predicting recurrence of lung adenocarcinoma after surgical removal of lung cancer in lung adenocarcinoma patients, wherein the composition comprises the nucleotide sequence of any one of SEQ ID NO: 182. And a plurality of nucleic acids that make it possible to measure the expression of two or more, preferably two or more, of two different genes, including
  • nucleotide sequences as shown in SEQ ID NOs: 1 to 2 nucleotide sequences complementary thereto, or nucleic acids having partial sequences of 15 bases to less than the total number of bases in their nucleotide sequences, and
  • nucleic acid that hybridizes to a nucleic acid containing the nucleotide sequence shown in SEQ ID NO: 1 to 8 or a nucleotide sequence complementary thereto, or alternatively, from 15 bases to less than the total number of bases of the hybridizing nucleic acid.
  • the above composition is characterized in that it is selected from the group consisting of: a nucleic acid having a partial sequence.
  • the plurality of nucleic acids constituting the composition of the present invention may be selected from 2 or more to 82, preferably 5 or more, of which the composition comprises any of the nucleotide sequences of SEQ ID NOS: 1-82. As long as it makes it possible to measure the expression of different genes, more preferably 10 or more to 82, more preferably 30 or more to 82, even more preferably 40 or more to 82 different genes. It may be any combination of the nucleic acids described in (1) and (2) above.
  • the nucleic acid of (1) above is N-(2-aminoethyl)-2-aminoethyl-N-(2-aminoethyl)-2-aminoethyl-N-(2-aminoethyl)-2-aminoethyl-N-(2-aminoethyl)-2-aminoethyl-N-(2-aminoethyl)-2-aminoethyl
  • nucleotide sequence complementary to the nucleotide sequence of the above (a), and (c) 15 bases or less of the total number of bases continuous in the nucleotide sequence of the above (a) or the nucleotide sequence of the above (b) Preferably, 17 bases or more, 20 bases or more, 30 bases or more, 50 bases or more, 70 bases or more, 100 bases or more, 150 bases or more, 200 bases or more, 300 bases Partial sequence of the above, or more than 400 bases or more than 500 bases to less than the total number of bases,
  • a nucleic acid having the following amino acids having the following amino acids having the following amino acids having the following amino acids having the following amino acids having the following amino acids having the following amino acids having the following amino acids having the following amino acids having the following amino acids having the following amino acids having the following amino acids having the following amino acids having the following amino acids having the following amino acids having the following amino acids having the following amino acids having the following amino acids having the following amino acids having the following amino acids having the following amino acids having the
  • the nucleic acid of (2) above is a nucleic acid having a nucleotide sequence that hybridizes with the nucleotide sequence of (a) or (b) above, or alternatively, from 15 consecutive bases in the nucleotide sequence of the nucleic acid Less than the total number of bases, preferably 17 bases or more, 20 bases or more, 30 bases or more, 50 bases or more, 70 bases or more, 100 bases or more, 150 bases or more, 200 bases or more, It is a nucleic acid having a partial sequence of 300 bases or more, 400 bases or more, or 500 bases or more to less than the total number of bases.
  • such a nucleic acid is 90% or more, preferably 95% or more, more preferably 98 or more, most preferably 9 9 or more, with the nucleotide sequence of (a) or (b) in (1) above. It is a nucleic acid of a sequence having% identity or more, or a fragment of 15 bases to less than the total number of bases.
  • nucleic acids are the nucleic acids of (1) above, in particular the nucleic acids of (1) (c) above.
  • the compositions of the present invention may be in the form of kits, microarrays or primer sets, as well as mixtures in the form of a simple mixture of nucleic acid components. Rather, this latter form is preferred.
  • the above nucleic acids can be packaged individually or in the form of a mixture of multiple nucleic acids, and the kit further contains a buffer for hybridization, detection reagents (enzymes, etc.) , Instructions for use Can be included.
  • the microarray and the primer set are as described above.
  • composition of the present invention can be used in a method for predicting recurrence of lung adenocarcinoma after surgical removal of lung cancer in lung adenocarcinoma patients as described above.
  • the method of the present invention is as described above.
  • the present invention is further directed to a composition for predicting recurrence of lung adenocarcinoma after surgical removal of lung cancer in lung adenocarcinoma patients, wherein the composition comprises the nucleotide sequence of any one of SEQ ID NOS: 1-22.
  • the antibody is a protein encoded by the nucleotide sequence shown in SEQ ID NOs: 1 to 2 or a contiguous at least 8 amino acid residue of the amino acid sequence of the protein
  • the above composition is provided with an antibody immunologically reactive with the polypeptide consisting of: and a fragment of the antibody, characterized in that it is selected from the group consisting of:
  • the antibodies include, but are not limited to, polyclonal antibodies, monoclonal antibodies, anti-peptide antibodies, etc. as produced by the above method.
  • the type of antibody may be any type, class, or subclass, including, for example, IgG, IgM, IgE, IgD, IgA, and the like.
  • antibody fragments include Fab, (Fab ') 2 , Fv, scFv and the like.
  • the composition of the present invention may be in the form of a kit, an antibody binding support or an antibody microarray, as well as a mixture of the form in which the antibody components are simply mixed.
  • Solid phase supports include membranes of polymers such as polystyrene, polycarbonate and polyethylene, multiwell plates, test tubes, test strips (test strips), latex, magnetic particles and the like.
  • Materials of the array include polymers, glass and the like.
  • the antibody-containing composition of the present invention can be used in a method for predicting the recurrence of lung adenocarcinoma after surgical resection of lung cancer in lung adenocarcinoma patients. 'The method of the present invention is an immunological method, as described above.
  • RNA samples of the tumor specimens were subjected to DAROS microdissection under the guidance of a pathologist (Y. Y.) using Giemsa-stained sections.
  • the total RNA is extracted using the RNae ay kit (Qia g e n, Valencia, Calif.), And the DN as e
  • RNA is Nano D rop (R) ND — 1 000 UV — V s Spectrophotometer (Nano D rop T cnnologies, Winnore De La Wa
  • the properties of the RNA were observed using an Ag i ent 2 1 00 Pio analyzer and shown as complete RNA numbers (RIN) (Agilent Technologies, Palo Alto, Calif.).
  • RIN complete RNA numbers
  • EGFR from p 5 3 and K over r the as expression profiles and mutation status of acquiring 5 00 ng of total RNA, Moroni one murine leukemia virus reverse transcriptase
  • Double-stranded cDNA was synthesized using poly dT primers containing (Agilent T e cho n o i g i s, Palo Anoret, Calif.) And a T 7 promoter.
  • a pair of L o w R N A B o U o s e x n. JU ⁇ n 6 a r ⁇ .
  • M p 1 ⁇ f i c i a t i n kit (Agilent T e c o n o l i o i s) was used to generate cRNA and labeled with C y 3 or C y 5.
  • Weighted voting algorithm which is an established technique of supervised classification, to identify recurrence related signatures using signals that have passed this filtering criterion (each weighted value is calculated as the signal-to-noise ratio and is already detailed
  • the method described (Yanagisa wa b J. N atl. C incer. I nst. 9 9: 85 8-6 7, 200 7) was used, in a nutshell, overtraining specific to the training data set.
  • the present inventors constructed and verified a gene expression signature for recurrence and death of lung adenocarcinoma patients surgically treated without information leakage between training set / evaluation set I ( Figure
  • the S-82 signature seems to be able to identify patients with a very poor prognosis when considering all stages or stage I (see figure for recurrence free survival).
  • Lung cancer is known to conceal various genetic changes that may affect the clinical nature of patients with hereditary changes. Therefore, we analyzed the association of RRS-82 with the presence of EGFR, K-ras or p53 gene mutations. However, no statistically significant association was found between them. Furthermore, the prognostic significance of the genetic change was also analyzed using the same patient sample set, thereby constructing a prognostic classifier using RR S-82. With the presence of EGFR mutations No association between postoperative prognosis was observed (Figure 3A). There was no statistically significant difference in overall survival between patients with and without the K-ras mutation (Figure 3B) or the P53 mutation (Figure 3C).
  • RRS-82 In order to evaluate the buccal properties of RRS-82, the discrimination ability of RRS-82 was analyzed using an independent evaluation set I of lung adenocarcinoma 27 samples. Results obtained using Evaluation Set I indicated that RRS-82 can distinguish high-risk and low-risk patients with relapse and death. Recurrence-free survival is significantly different between the two groups, with a median recurrence-free survival of 29 patients in the high-risk group of 29 days compared with 108 months in the low-risk group of 18 patients. (P. 0. 0003, Fig. 4A). The proportion of recurrence-free patients in the high-risk and low-risk groups was 38% and 78% at two years, respectively.
  • the present inventors have also diagnosed RR S-82 and TNM (T: spread of primary tumor; N: presence or absence of regional lymph node metastasis; M: presence or absence of distant metastasis) (eg lung cancer ⁇ esophagus)
  • T spread of primary tumor
  • N presence or absence of regional lymph node metastasis
  • M presence or absence of distant metastasis
  • K ap 1 an-Me ier curve for recurrence-free survival Fig. 5 A
  • the K ap 1 an-Me ier curve for overall survival Fig. 9 A
  • the possibility of postoperative recurrence of lung adenocarcinoma patients can be predicted with extremely high accuracy.
  • This method allows prediction with high accuracy even in the case of stage I patients. This will make it possible to develop a treatment plan early in the postoperative period to improve the survival rate for patients at high risk of recurrence.
  • the present invention makes it possible to predict post-operative recurrence of adenocarcinoma in lung adenocarcinoma patients, so that it is possible to make a treatment plan suitable for patients after surgery.
  • the present invention can contribute to the medical industry for the treatment of lung adenocarcinoma.

Abstract

Disclosed is a method for predicting the recurrence of pulmonary adenocarcinoma after surgically removing lung cancer in a patient suffering from pulmonary adenocarcinoma by using a specific gene set. Also disclosed is a composition for use in the method.

Description

肺腺癌患者の術後再発を予測するための方法及び組成物 技術分野  Methods and compositions for predicting postoperative recurrence of lung adenocarcinoma patients
本発明は、 肺腺癌患者の術後再発を予測するための方法及び組成物に関する。 背景技術 明  The present invention relates to methods and compositions for predicting post-operative recurrence of lung adenocarcinoma patients. Background art
肺癌は、 先進諸国において癌関連死亡原因のトップである。 肺癌は、 小細胞癌 と非小細胞癌に大別され、 さらに非小細胞癌は主として腺癌、 扁平上皮癌、 大細 書  Lung cancer is the leading cause of cancer-related mortality in developed countries. Lung cancer is roughly divided into small cell carcinoma and non-small cell carcinoma, and non-small cell carcinoma is mainly adenocarcinoma, squamous cell carcinoma, large cell carcinoma.
胞癌に分類される。 肺非小細胞癌の中で肺腺癌は非小細胞癌の約半数を占め、 我 国では最も発生頻度が高いことが知られている。 また、 非小細胞癌患者の 1 0年 生存率は約 1 0 %と非常に低く、 その患者の約 2 5 ~ 3 0 %はステージ Iの患者 で外科切除を受けただけであり、 そのような患者のうち約 3 5〜5 0 %が 5年以 内に再発している。 Cell carcinoma. Among non-small cell lung cancer, lung adenocarcinoma accounts for about half of non-small cell cancer and is known to occur most frequently in Japan. In addition, the 10-year survival rate of patients with non-small cell carcinoma is very low at about 10%, and about 25-30% of the patients have only undergone surgical resection in stage I patients, Approximately 35 to 50% of these patients have relapsed within 5 years.
近年、 マイクロアレイや質量分析などの技術の進歩により、 これらを利用した バイオインフォマティクス、 プロテオミクスなどの新しい技術領域が開発されて いる。 癌研究においても、 癌の診断や治療を目的として、 このような技術を利用 した遺伝子発現の網羅的解析が盛んに行われている。  In recent years, with advances in technologies such as microarrays and mass spectrometry, new technology areas such as bioinformatics and proteomics using these have been developed. Also in cancer research, comprehensive analysis of gene expression using such technology is actively conducted for the purpose of diagnosis and treatment of cancer.
肺癌についても、肺癌患者における肺癌の分類、転移の予測及び再発の予測と、 遺伝子発現パターンや臨床パラメーターとの相関性を追求する研究が行われてい る (非特許文献 1 )。  With regard to lung cancer, research has also been conducted to pursue correlation between classification of lung cancer, prediction of metastasis and prediction of recurrence in lung cancer patients and gene expression patterns and clinical parameters (Non-patent Document 1).
本発明者らもこれまでに、 肺癌を中心に、 遺伝子発現パターンの網羅的解析を 行い、転移や予後の予測に関連する発現パターンを解析してきた(非特許文献 2 )。 また、 本発明者らは、 最近、 肺腺癌を T R U— a型、 T R U— b型及び非 T R U 型に分類し、 この分類に基づいて肺腺癌患者の術後予後を予測するための方法及 ぴ組成物を開示している (特許文献 1 )。  The present inventors have also comprehensively analyzed gene expression patterns, focusing on lung cancer, and analyzed expression patterns associated with metastasis and prognosis prediction (Non-patent Document 2). In addition, the present inventors recently classified lung adenocarcinoma into TRU-a, TRU-b, and non-TRU types, and based on this classification, a method for predicting the postoperative prognosis of lung adenocarcinoma patients And discloses a composition (Patent Document 1).
肺腺癌に関して、 さらに別のグループが、 肺腺癌を判別するための遺伝子セッ ト、 肺腺癌の胸膜浸潤を判別するための遺伝子セット、 及ぴ肺腺癌の再発を予測 するための遺伝子セットを開示している (特許文献 2〜4)。 このうち、特許文献 4には、 肺腺癌の術後再発を予測するための方法及び 45個の遺伝子のセットが 記載されており、 この遺伝子セットによる肺腺癌の判別率が 5 0%以上であると 記載している。 また、 非特許文献 3には、 54個の遺伝子セットによる肺腺癌の 再発の予測を開示しており、 ここにはまた、 肺腺癌患者の予後を判定する従来の 方法による再発の正確な予測の難しさが記載されている。 With regard to lung adenocarcinoma, yet another group has a set of genes to distinguish lung adenocarcinoma, a set of genes to distinguish pleural invasion of lung adenocarcinoma, and a prediction of recurrence of lung adenocarcinoma. Discloses a gene set for the gene expression (patent documents 2 to 4). Among them, Patent Document 4 describes a method for predicting postoperative recurrence of lung adenocarcinoma and a set of 45 genes, and the discrimination rate of lung adenocarcinoma by this gene set is 50% or more. It is stated that In addition, Non-Patent Document 3 discloses the prediction of recurrence of lung adenocarcinoma by a set of 54 genes, which also accurately indicates the recurrence by the conventional method for determining the prognosis of patients with lung adenocarcinoma. The difficulty of prediction is stated.
特許文献 1 国際公開 WO 200 7/04341 8  Patent Document 1 International Publication WO 200 7/04341 8
特許文献 2 特開 2007— 6 79 1  Patent Document 2 Japanese Patent Application Laid-Open No. 2007-679 1
特許文献 3 特開 200 7— 6 792  Patent Document 3 Japanese Patent Application Laid-Open No. 200 7- 6 792
特許文献 4 特開 200 7— 1 3 5466  Patent Document 4 Japanese Patent Application Laid-Open No. 200 7-1 3 5466
非特許文献, 1 D. G. B e e rら, Na t u r e Me d i c i n e 2 002, 8 (8) : 8 1 6-8 24  Non-patent literature, 1 D. G. B e er et al., Na t u r e Med ic i n e 2 002, 8 (8): 8 1 6-8 24
非特許文献 2 冨田秀太及び高撟隆,「発現プロファイル解析に基づく肺癌の 診断 '治療の新展開」 実験医学 2004, 2 2 (14) : 45 - 5 0,羊土社(日本) 非特許文献 3 J . E. L a r s e nら, C l i n i c a l C a n c e r R e s e a r c h 200 7, 1 3 : 2946 - 29 54 発明の開示  Non-patent literature 2 Shuta Kuwata and Takashi Takahata, "Diagnosis of treatment of lung cancer based on expression profile analysis' New development of treatment" Experimental medicine 2004, 22 (14): 45-50, Yodosha (Japan) Non-patent literature 3 J E. L Arsen et al., C Clinical Cancer R esearch 200 7, 1 3: 2946-29 54 Disclosure of the Invention
癌患者のなかには、 腫瘍の外科切除後に転移、 再発などによって予後が著しく 悪く 5年以内に死亡する患者もいれば、 逆に、 転移や再発のない、 すなわち予後 が良好である患者もいる。 本発明者らは、 我国の肺癌患者に比較的多い肺腺癌患 者において、 肺癌の予後予測において特に再発の予測を高い確度で可能とする方 法がないことに注目してきた。 肺癌の外科手術後の再発予測は様々な要因が関連 するため、 その予測が非常に困難である。 もし肺腺癌患者の再発を極めて高い確 度で予測可能であれば、 現在手術後に後治療なしで経過観察の対象となっている 患者群のなかに治療を必要とする一群を同定することが可能となり、 その予後を 改善できる可能性があると考えられる。  Some cancer patients have a significantly worse prognosis due to metastasis, recurrence, etc. after surgical removal of the tumor and some patients die within 5 years; conversely, there are patients without metastasis or recurrence, that is, the prognosis is good. The present inventors have focused on the fact that there is no method that enables the prediction of recurrence particularly with high accuracy in predicting the prognosis of lung cancer in lung adenocarcinoma patients relatively many in lung cancer patients in Japan. The prediction of recurrence after surgery for lung cancer is very difficult because it is related to various factors. If the recurrence of lung adenocarcinoma patients can be predicted with a very high degree of certainty, it is necessary to identify a group that needs treatment among those currently being followed up without further treatment after surgery. It is possible that it will be possible and improve the prognosis.
従来の肺腺癌の再発予測法では、 l e a v e— o n e— o u t c r o s s - v a 1 i d a t i o nを利用して再発リスクを予測することができる遺伝子セッ トを同定している。 このとき、 もし判定不能という判定基準を用いるときには、 判定不能症例がどの程度の割合で含まれるかによつて見かけの判別率と真の判別 率が極端に異なる場合がある。 また、 l e a v e— o n e— o u t c r o s s - v a 1 i d a t i o nでは、 解析対象となるデータが極めて少ない場合におい て、繰り返し計算も少なく、予測モデルの精度を評価する有効な手法ではあるが、 望むらくは、 解析対象データを増やし、 かつ、 1 0 _ f o 1 dクロスパリデーシ ョン法とランダム分割を取り入れた繰り返し計算を行い、 より精確なモデルの評 価を行うことが好ましい。 The conventional recurrence prediction method for lung adenocarcinoma is a set of genes that can predict the risk of recurrence using leave—one—outcross-va 1 identification. Have been identified. At this time, when using the determination criteria that determination is impossible, the apparent determination rate and the true determination rate may be extremely different depending on the proportion of undecidable cases included. In addition, in leave-one-outcross-va 1 identification, even when there are very few data to be analyzed, the number of repetitive calculations is small, and this is an effective method for evaluating the accuracy of the prediction model. It is preferable to perform more accurate model evaluation by increasing the data and performing iterative calculations incorporating the 10 0 fo 1 d cross-parison method and random division.
さらにまた、 マイクロアレイを利用した癌細胞の網羅的遺伝子発現プロフアイ リングと臨床アウトカムを関連付ける際には、 サンプリングの仕方、 プラットフ オームの違い、 統計解析の違いなどによって、 再現性や信頼性に疑義が生じるこ とがあると指摘されている(例えば、 松井茂之,実験医学 2007, 25 (1 7) : 72- 78 (増刊) 羊土社(日本))。  Furthermore, when linking clinical gene to comprehensive gene expression profiling of cancer cells using microarrays, there are doubts about reproducibility and reliability due to differences in sampling methods, platform differences, statistical analysis, etc. It is pointed out that there is a problem (for example, Shigeyuki Matsui, Experimental Medicine 2007, 25 (17): 72- 78 (extra edition) Yodosha (Japan)).
本発明の目的は、 肺腺癌患者において肺癌の外科切除後の肺腺癌の再発を予測 する際に、 肺腺癌の再発を極めて高い確度で予測するための方法及ぴ組成物を提 供することである。  The object of the present invention is to provide a method and composition for predicting the recurrence of lung adenocarcinoma with extremely high accuracy in predicting the recurrence of lung adenocarcinoma after surgical removal of lung cancer in patients with lung adenocarcinoma. It is.
本発明者らは、 判定不能の判定手法と異なる、 全ての症例に高再発リスクか低 再発リスクのいずれかの判定を提示する手法であること、 また、 従来の再発予測 遺伝子セットと異なる、 82種類の遺伝子からなる新規の遺伝子セットを該判定 のために使用することによって、 評価モデルにおいて 70%超の確度で再発の有 無を予測することを可能にし、 本発明を完成した。  The present inventors are different from the judgment method of undecidable, that it is a method that presents judgment of either high recurrence risk or low recurrence risk to all cases, and is different from the conventional recurrence prediction gene set, 82 The use of a novel set of genes consisting of different types of genes for the determination made it possible to predict the presence or absence of recurrence with a probability of more than 70% in the evaluation model and completed the present invention.
本発明は、 要約すると、 以下の特徴を包含する。  The invention, in summary, includes the following features.
本発明は、 第 1の態様において、 肺腺癌患者において肺癌の外科切除後の肺腺 癌の再発を予測するための方法であって、 配列番号 1〜82の各ヌクレオチド配 列を含む遺伝子からなる群から選択される 2〜82個の遺伝子の遺伝子セットの 発現を該患者由来の生物学的サンプルにおいて測定することを含み、 ここで、 配 列番号 1〜5、 8〜9、 12、 14〜: 1 5、 17、 19〜21、 23〜28、 3 The present invention relates, in a first aspect, to a method for predicting recurrence of lung adenocarcinoma after surgical removal of lung cancer in lung adenocarcinoma patients, comprising a gene comprising each nucleotide sequence of SEQ ID NO: 1-82 Measuring the expression of a gene set of 2 to 82 genes selected from the group: in a biological sample derived from the patient, wherein SEQ ID NOs: 1 to 5, 8 to 9, 12, 14 ~: 1 5, 17, 19-21, 23-28, 3
0〜33、 35〜59、 61〜68、 70〜82のいずれかのヌクレオチド配列 を含む遺伝子の発現が術後無再発症例と比べて相対的に高い場合、 或いは、 配列 番号 6〜7、 1 0〜: 1 1、 1 3、 1 6、 1 8、 22、 29、 34、 60、 69の いずれかのヌクレオチド配列を含む遺伝子の発現が術後無再発症例と比べて相対 的に低い場合、 肺腺癌の再発が高いと予測することを特徴とする、 上記方法を提 供する。 When the expression of a gene containing a nucleotide sequence of any of 0 to 33, 35 to 59, 61 to 68, 70 to 82 is relatively high compared to a postoperative recurrence-free case, or The expression of the gene containing the nucleotide sequence of any of the numbers 6 to 7, 10 to 11: 11, 13, 16, 18, 22, 29, 34, 60, 69 compared with the postoperative recurrence-free case The above method is provided, which is characterized in that the recurrence of lung adenocarcinoma is predicted to be high when it is relatively low.
本発明の実施形態によれば、 上記遺伝子セットの遺伝子数は 5以上 8 2以下で ある。  According to an embodiment of the present invention, the number of genes of the gene set is 5 or more and 82 or less.
本発明の別の実施形態によれば、 上記遺伝子セットの発現の測定は、 上記遺伝 子に対応する核酸又はタンパク質の存在もしくは量を測定することによって行な われる。  According to another embodiment of the present invention, the measurement of the expression of the set of genes is performed by measuring the presence or the amount of the nucleic acid or the protein corresponding to the gene.
本発明の別の実施形態によれば、 上記遺伝子セットの発現の測定は、 ハイプリ ダイゼーション法又は定量 P CR法によって行なわれる。  According to another embodiment of the present invention, the measurement of the expression of the gene set is performed by a hybridization method or a quantitative PCR method.
本発明の実施形態によれば、 上記ハイプリダイゼーシヨン法は、 マイクロアレ ィ法又はプロット法である。  According to an embodiment of the present invention, the hyperprime method is a microarray method or a plotting method.
本発明の実施形態によれば、 上記ハイブリダィゼーシヨン法は、 上記遺伝子由 来の RNA転写産物、 c RNA、 a RNA又は c DNAとハイブリダィズする核 酸を用いて行なわれる。  According to an embodiment of the present invention, the hybridization method is carried out using nucleic acid which hybridizes to the RNA transcript derived from the gene, cDNA, aRNA or cDNA.
本発明の別の実施形態によれば、 上記遺伝子セットの発現の測定は、 免疫学的 方法によつて行なわれる。  According to another embodiment of the present invention, the measurement of the expression of the gene set is performed by an immunological method.
本発明の実施形態によれば、 上記免疫学的方法は、 上記遺伝子によってコード されるタンパク質又はその断片に対する抗体を用いて行なわれる。  According to an embodiment of the present invention, said immunological method is performed using an antibody against the protein encoded by said gene or a fragment thereof.
本発明は、 第 2の態様において、 肺腺癌患者において肺癌の外科切除後の肺腺 癌の再発を予測するための組成物であって、 該組成物が、 配列番号 1〜8 2のい ずれかのヌクレオチド配列を含む 2以上の異なる遺伝子の発現を測定することを 可能にする複数の核酸を含み、 該核酸が、  In the second aspect, the present invention relates to a composition for predicting recurrence of lung adenocarcinoma after surgical removal of lung cancer in lung adenocarcinoma patients, which composition is one of SEQ ID NOS: 1-82. A plurality of nucleic acids which make it possible to measure the expression of two or more different genes comprising different nucleotide sequences, said nucleic acids comprising
(1) 配列番号 1〜8 2に示されるヌクレオチド配列、 それに相補的なヌクレ ォチド配列、 或いはそれらのヌクレオチド配列中の連続する 1 5塩基から全塩基 数未満の部分配列を有する核酸、 及び  (1) Nucleotide sequences as shown in SEQ ID NOs: 1 to 2, nucleotide sequences complementary thereto, or nucleic acids having partial sequences of 15 bases to less than the total number of bases in their nucleotide sequences, and
(2) 配列番号 1〜82に示されるヌクレオチド配列又はそれに相補的なヌク レオチド配列を含む核酸とハイプリダイズする核酸、 或いは該ハイブリダィズす W る核酸の連続する 1 5塩基から全塩基数未満の部分配列を有する核酸、 からなる群から選択されることを特徴とする、 上記組成物を提供する。 (2) A nucleic acid hybridizing with a nucleic acid comprising the nucleotide sequence shown in SEQ ID NO: 1 to 82 or a nucleotide sequence complementary thereto, or the hybridizing agent The above composition is provided, which is selected from the group consisting of: a nucleic acid having a partial sequence consisting of 15 contiguous bases to less than the total number of bases of the nucleic acid of W.
本発明の実施形態において、 上記組成物は、 キット、 マイクロアレイ又はブラ イマ一セットの形態である。  In an embodiment of the invention, the composition is in the form of a kit, a microarray or a set of primers.
本発明の別の実施形態において、 上記核酸は、 5種類以上から 8 2種類以下の 遺伝子の発現の測定を可能にする。  In another embodiment of the present invention, the above nucleic acid enables measurement of the expression of 5 or more to 82 or less genes.
本発明の別の実施形態において、 上記組成物は、 本発明の上記方法で使用する ためのものである。  In another embodiment of the present invention, the composition is for use in the above method of the present invention.
本発明は、 第 3の態様において、 肺腺癌患者において肺癌の外科切除後の肺腺 癌の再発を予測するための組成物であって、 該組成物が、 配列番号 1 ~ 8 2のい ずれかのヌクレオチド配列を含む 2以上の異なる遺伝子の発現産物を測定するこ とを可能にする複数の抗体を含み、 該抗体が、 配列番号 1 〜 8 2に示されるいず れかのヌクレオチド配列によってコードされるタンパク質又は該タンパク質のァ ミノ酸配列の連続する少なくとも 8ァミノ酸残基からなるポリぺプチドと免疫学 的に反応する抗体、 及ぴ該抗体の断片、 からなる群から選択されることを特徴と する、 上記組成物を提供する。  In the third aspect of the present invention, there is provided a composition for predicting recurrence of lung adenocarcinoma after surgical removal of lung cancer in a lung adenocarcinoma patient, the composition comprising the composition of SEQ ID NO: 1 to 82. Comprising a plurality of antibodies which make it possible to measure the expression products of two or more different genes comprising different nucleotide sequences, said antibodies comprising any of the nucleotide sequences shown in SEQ ID NO: 1 to 82. Selected from the group consisting of: an antibody which immunologically reacts with a protein encoded by or a polypeptide consisting of at least 8 consecutive amino acid residues of the amino acid sequence of said protein, and a fragment of said antibody The above composition is provided.
本発明の実施形態において、 上記組成物は、 キットの形態である。  In an embodiment of the invention, the composition is in the form of a kit.
本発明の別の実施形態において、 上記抗体プローブは、 5種類以上から 8 2種 類以下の遺伝子の発現産物の測定を可能にする。  In another embodiment of the present invention, the above-mentioned antibody probe enables measurement of the expression product of 5 or more to 82 or less genes.
本発明の別の実施形態において、 上記組成物は、 本発明の上記方法で使用する ためのものである。  In another embodiment of the present invention, the composition is for use in the above method of the present invention.
本明細書中、 「術後再発」 は、肺腺癌の外科切除後に患者が肺腺癌を再発するこ とを意味する。 再発すると予測された患者は、 高再発リスクであると判定され、 低い生存率を有する。 これに対して、 無再発と予測された患者は、 低再発リスク であると判定され、 高い生存率を有する。  As used herein, "post-operative recurrence" means that the patient recurs lung adenocarcinoma after surgical removal of the lung adenocarcinoma. Patients who are predicted to relapse are determined to be at high risk for recurrence and have a low survival rate. In contrast, patients who are predicted to have no recurrence are judged to have a low risk of recurrence and have high survival rates.
本明細書中、 「患者」 は、 ヒ トを含む哺乳動物を指し、 好ましい哺乳動物はヒ ト である。  As used herein, "patient" refers to a mammal, including humans, with a preferred mammal being humans.
本明細書中、 「核酸」 は、 D N A又は R N Aのいずれかであり、 例えば各遺伝子 の転写産物 (m R N A)、 c R N A、 a R N A , c D N Aなどが含まれる。 本明細書中、 「遺伝子」 は、 特定のタンパク質をコードし、 ェクソン、 イントロ ン、 5, 一及び 3 ' —非翻訳領域などによって構成され、 その転写によって前駆 体 mRNAの形成を可能にし、さらにスプライシング事象を経て mRNAとなり、 タンパク質へと翻訳される。 In the present specification, "nucleic acid" is either DNA or RNA, and includes, for example, transcripts (mRNA) of each gene, cDNA, aRNA, cDNA and the like. As used herein, a "gene" encodes a specific protein and is composed of: exon, intron, 5, 1 and 3 '-untranslated region, etc., which enables the formation of precursor mRNA by its transcription, and Through splicing events, they become mRNA, which is translated into protein.
本明細書中、「タンパク質」は、特定の遺伝子によってコードされるタンパク質、 その変異体又はその断片を包含する。 このような変異体は、 スプライシング、 多 型性などの天然事象に基づく変異体を含む。 また、 このような断片は、 生体内で プロテアーゼ、 ぺプチダーゼなどの酵素作用によって自然発生的に生じたタンパ ク質断片である。  As used herein, "protein" includes a protein encoded by a specific gene, a variant thereof or a fragment thereof. Such variants include variants based on natural events such as splicing, polymorphism and the like. In addition, such a fragment is a protein fragment naturally generated in vivo by the action of an enzyme such as a protease or peptidase.
本明細書中、 「ハイプリダイゼーシヨン」 は、核酸と核酸との塩基対合による二 本鎖の形成反応である。 ハイプリダイゼーシヨンには、 DNA— DNAハイプリ ダイゼーシヨン、 DNA— RNAハイブリダィゼーシヨン、 及び RNA— RNA ハイプリダイゼ一シヨンが含まれる。 ハイブリダィゼーシヨンは、 通常、 固体支 持体上に固定された核酸プローブを用いて行われる。 固体支持体は、 プラスチッ ク又はポリマー、 ガラスなどの材質で、 テストプレート、 試験管、 試験片、 チッ プなどの形状としうる。 ハイブリダィゼーシヨンでは、 温度、 イオン強度、 界面 活性剤の濃度、 ホルムアミ ドの有無、 核酸の GC含量などが、 ハイブリッドの安 定性やハイプリダイゼーシヨン速度に影響を与える。 一般に、 温度が高い、 又は イオン強度が高いほど、 すなわち厳しい (ストリンジェントな) 条件ほど、 ハイ プリッ ドの安定性は低下し、 逆にハイプリダイゼーションの特異性が増大する。 ハイブリダィゼ一シヨンについては、 Au s b e 1 FMら' S h o r t P r o t o c o l s i n Mo l e c u l a r B i o l o g y { ό片反) A し omp e n d i um o f Me t h o d s f r om C u r r e n t P r o t o c o l s i n Mo l e c u l a r B i o l o g y, 1 9 9 5年, J o h n Wi l e y & S o n s , I n c . (米国) に記載されている。 本明細書中、 「免疫学的」 とは、抗原と抗体との複合体を形成することを意味す る。 このような複合体を形成する反応を、 免疫学的反応と称し、 この反応を利用 して抗原又は抗体を検出又は定量する方法を、 免疫学的方法と称する。 免疫学的 方法は、 固相又は液相、 均一又は不均一などの条件下で行うことができ、 このと き抗原一抗体複合体の検出は、標識(例えば色素、蛍光性物質、放射性同位元素、 酵素など) を利用する方法、 凝集を利用する方法 (例えばラテックス法など)、 濁 度を利用する方法、 免疫沈降を利用する方法、 二次抗体を利用する方法 (例えば サンドィツチ法) などによって行うことができる。 In the present specification, "hyperdilution" is a reaction for forming a double strand by base pairing of nucleic acid and nucleic acid. The hybridizations include DNA-DNA hybridization, DNA-RNA hybridisation, and RNA-RNA hybridization. Hybridization is usually performed using a nucleic acid probe immobilized on a solid support. The solid support may be made of plastic, polymer, glass, etc., and may be in the form of a test plate, test tube, test strip, chip or the like. In hybridization, temperature, ionic strength, surfactant concentration, presence or absence of formamide, GC content of nucleic acid, etc. affect the stability of the hybrid and the hybridization rate. In general, the higher the temperature or the higher the ionic strength, that is, the more stringent (stringent) conditions, the lower the stability of the hybrid and conversely, the specificity of the hybridization. For hybridism, Au sbe 1 FM et al. 'S hort P rotocolsin Molecular biology {反 反 し A omp endi um of Me thodsfr om C urrent P rotocolsin Mocular B iology, 19 9 5 J, J ohn Wi ley & Sons, Inc. (US). As used herein, "immunologically" means forming a complex of an antigen and an antibody. A reaction that forms such a complex is referred to as an immunological reaction, and a method of detecting or quantifying an antigen or antibody utilizing this reaction is referred to as an immunological method. Immunological methods can be performed under conditions such as solid phase or liquid phase, homogeneous or heterogeneous, etc. For detection of the antigen-antibody complex, a method using a label (eg, a dye, a fluorescent substance, a radioactive isotope, an enzyme, etc.), a method using aggregation (eg, latex method), a method using turbidity, It can be performed by a method using immunoprecipitation, a method using a secondary antibody (eg, sandwich method), and the like.
本明細書は本願の優先権の基礎である日本国特許出願 200 7-3 39 2 14 号の明細書および/または図面に記載される内容を包含する。 図面の簡単な説明  The present specification includes the contents described in the specification and / or drawings of Japanese Patent Application No. 200 7-3 39 2 14 which is the basis of the priority of the present application. Brief description of the drawings
図 1は、 訓練セットをランダムに 1 0分割する 1 0— f o l d c r o s s - v a l i d a t i o nを 1 00回繰り返すことを使用して再発関連シグネチヤを 同定するための訓練一有効性戦略の概略図を示す。  FIG. 1 shows a schematic of a training-one efficacy strategy for identifying relapse-associated signatures using 100 iterations of the training set randomly divided into 10 1 0 − f o d c r o s s − v a i i d a t i o n.
図 2は、 再発関連シグネチヤを同定するための訓練手順の結果を示す。 図 2 A は、 再発関連シグネチヤを規定するための最適プローブ数の探索結果を示す。 K a p 1 a n-Me i e r生存曲線を用いて訓練群における生存率を評価した。 全 ステージ (図 2 B) 及びステージ I (図 2 C) における患者の再発関連曲線も示 す。  Figure 2 shows the results of a training procedure to identify relapse-associated signatures. Figure 2A shows the results of the search for the optimal number of probes to define recurrence related signatures. Survival rates in the training group were assessed using K ap 1 a n -Me i e r survival curves. The patient's recurrence related curves at all stages (Figure 2B) and at stage I (Figure 2C) are also shown.
図 3は、訓練データセットにおける EGFR変異(図 3 A)、 K一 r a s変異(図 3 B) 及び p 5 3変異 (図 3 C) の存在又は非存在における K a p 1 a n-Me i e r生存曲泉を示す。  FIG. 3 shows K ap 1 a n -Me ier survival in the presence or absence of EGFR mutations (FIG. 3 A), K 1 ras mutations (FIG. 3 B) and p 5 3 mutations (FIG. 3 C) in the training data set Indicates the fountain.
図 4は、 評価セット Iおよび評価セット I Iを用いた RR S— 82シグネチヤ の有効性を示す。 Ka p 1 a n-Me i e r 生存曲線を、 RRS— 82に基いて 予測したリスクに従って示した。 図 4 Aは全ステージの無再発生存曲線を示し、 図 4 Bは全ステージの全生存曲線、図 4 Cはステージ Iの無再発生存曲線、また、 4 Dステージ Iの全生存曲線を示す。 また、 ステージ Iのみのサンプルからなる 評価セット I Iを用いた無再発生存曲線を図 4 Eに、 全生存曲線を図 4 Fに示し た。 さたに、 評価セット I + I Iにおける無再発生存曲線を図 4 G、 全生存曲線 を図 4 Hに示す。  Figure 4 shows the effectiveness of the RR S-82 signature using evaluation set I and evaluation set I I. Ka p 1 a n -Me i er survival curves were presented according to the risk predicted based on RRS-82. FIG. 4A shows all-stage recurrence-free survival curves, FIG. 4B shows all-stage overall survival curves, FIG. 4C shows stage I recurrence-free survival curves, and 4D stage I overall survival curves. In addition, the recurrence-free survival curve and the overall survival curve are shown in FIG. 4E and FIG. 4F, respectively, using the evaluation set II consisting of the stage I only samples. The recurrence-free survival curves in the evaluation set I + I I are shown in FIG. 4G, and the overall survival curves are shown in FIG. 4H.
図 5は、 RRS— 82に基づくリスク群と TNMステージとの関係を示す。 図 Figure 5 shows the relationship between RRS- 82 based risk groups and the TNM stage. Figure
5 Aは、 低リスク RR S— 82シグネチヤをもつ患者の無再発生存曲線、 図 5 B は、 高リスク RRS— 8 2シグネチヤをもつ患者の無再発生存曲線をそれぞれ示 す。 5A is a recurrence-free survival curve for patients with low-risk RR S-82, Figure 5B. Each shows a relapse-free survival curve for patients with high-risk RRS—82 signatures.
図 6は、 独立したデータセッ トの解析により、 RR S _ 82シグネチヤの有効 性を示す。 図 6 Aは、 3 9個の肺腺癌からなる D u k e大学のデータセットに、 RR S _ 8 2シグネチヤの構成成分を用いて行った教師無し階層的クラスタリン グ解析結果を示し、 図 6 Bはクラスター I及び I Iの K a p l a n一 Me i e r 生存曲線を示す。また、図 6 Cは M i c h i g a n大学のデータセットを用いて、 予測モデルを構築する概念図を示す。 図 6 Dは図 6 Cにより構築されたモデルを 用いて、 Memo r i a l S l o a n—Ke t t e r i n gがんセンターの遺 伝子発現データ 1 04サンプルを解析した K a 1 a n— Me i e r生存曲線を 示す。  Figure 6 shows the effectiveness of the RR S _ 82 signature by analysis of independent data sets. Figure 6A shows the results of an unsupervised hierarchical clustering analysis performed using the components of RR S _ 82 2 signatures in the data set of University of Duke consisting of 39 lung adenocarcinomas. B shows Kaplan-Meier survival curves of clusters I and II. Also, Fig. 6C shows a conceptual diagram of constructing a prediction model using the data set of the University of Michigan. Fig. 6D shows Ka a n-Me i survival curves obtained by analyzing the gene expression data of the cancer center's cancer center gene 104 using the model constructed by Fig. 6 C.
図 7は、 訓練データセッ トでの K a p 1 a n— Me i e r生存の評価を示す。 図 7 Aは、 全ステージの複数の患者での RR S - 82シグネチヤによる全生存曲 線を示し、 また、 図 7 Bは、 ステージ Iの複数の患者での RR S— 8 2シグネチ ャによる全生存曲線を示す。  FIG. 7 shows the assessment of K ap 1 an −Mei er survival in the training data set. Figure 7A shows the overall survival curve with RR S-82 signatures in multiple patients at all stages, and Figure 7B shows the overall survival with RR S- 82 signatures in multiple patients with stage I. The survival curve is shown.
図 8は、 評価セット I中ステージ I I〜 I I I症例での、 R R S— 8 2シグネ チヤによる K a l a n一 Me i e r生存の評価を示す。 ステージ I I〜 I I I 患者のうち、 無再発 (図 8A) 及び全生存 (図 8 B) は、 高リスクシグネチヤを 有する患者と比べて低リスク RR S - 82シグネチヤを有する患者の場合に良好 となる傾向があったが統計的に有意ではなかった。  FIG. 8 shows the evaluation of K a l one i me i e r survival by R R S s-2 in an evaluation set I middle stage I I to I I I cases. Of the stage II-III patients, recurrence-free (Figure 8A) and overall survival (Figure 8B) are better for patients with low risk RR S-82 signatures compared to patients with high risk signatures. There was a trend but it was not statistically significant.
図 9は、 評価セット Iにおいて、 RR S— 82シグネチヤとステージの関連性 を、 K a p 1 a n— Me i e r生存曲線を用いて評価した。 図 9 Aに示す低リス ク群では、 ステージ I症例とステージ I I一 I I I症例の比較において、 統計的 に有意ではないが、 ステージ I症例の全生存曲線が良好となる傾向がある。 図 9 Bに示す髙リスク群では、 ステージ I症例とステージ I I一 I I I症例の比較に おいて、 全生存曲線はほぼ同一曲線となっている。 発明を実施するための最良の形態  FIG. 9 shows that in the evaluation set I, the association between RR S-82 and the stage was evaluated using the K ap 1 an -Me ier survival curve. In the low-risk group shown in Figure 9A, the overall survival curve of stage I cases tends to be better, although not statistically significant, in comparing stage I cases with stage I cases. In the 髙 at risk group shown in Fig. 9B, the overall survival curves are almost the same in the comparison of Stage I and Stage I I I I I I cases. BEST MODE FOR CARRYING OUT THE INVENTION
本発明は、 上記のとおり、 肺腺癌患者において肺癌の外科切除後の肺腺癌の再 発を高い確度で予測するための方法を提供する。 このような高い確度での予測を 可能にしたのは、 一部には、 肺腺癌患者のうち術後再発症例及び術後無再発症例 を専門医の見識と経験に基いて厳密に選択し、 信頼性の高い統計学的手法を使用 するなどの条件下で、肺腺癌患者での術後再発/無再発に関連して従来未公表の 8 2個の遺伝子セットを見出したことに基づいている。 The present invention, as described above, is a method of rescuing lung adenocarcinoma after surgical removal of lung cancer in lung adenocarcinoma patients. Provide a method to predict the development with high accuracy. The reason why such high-accuracy prediction has been made possible is, in part, the rigorous selection of postoperative recurrence cases and recurrence-free cases among lung adenocarcinoma patients based on the expertise and experience of specialists. Under conditions such as using reliable statistical methods, based on finding previously unpublished 82 gene sets related to postoperative recurrence / no recurrence in lung adenocarcinoma patients. There is.
<遺伝子セットの決定 > <Determination of gene set>
本発明では、 肺腺癌患者において肺癌の外科切除後の肺腺癌の再発を予測する ための 82個の異なる遺伝子からなるセットを見出したが、 この遺伝子セットを 決定した手順について以下に説明する。  In the present invention, a set of 82 different genes for predicting recurrence of lung adenocarcinoma after surgical removal of lung cancer in lung adenocarcinoma patients was found, and the procedure for determining this gene set will be described below. .
背景技術に記載したように、 肺腺癌の術後再発を予測するための遺伝子セット がいくつかのグループによって報告されているが、 数万の遺伝子群から予測可能 であると記載される遺伝子セッ トの各々は、 互いに重複がないか、 さもなくば重 複が極めて低い。 本発明者らが見出した 8 2遺伝子セットについても、 例えば特 開 200 7— 1 3546 6に記載された 4 5遺伝子セットと重複する遺伝子はな レヽし、 また、 J . E. L a r s e nら, C l i n i c a l C a n c e r R e s e a r c h 200 7, 1 3 : 2 94 6-2 954に記載された 54遺伝子 セットと重複する遺伝子はわずかに 1個のみである。 しカゝし、 図 2 Aで証明され るように、単一の遺伝子を用いて再発予測を実施するときの正答率(すなわち、 [正 答数/ (正答数 +誤答数) ] X 1 00 (%)) は、 著しく低下する。 正答率を高める ためには、 複数の、 好ましくは 5以上の、 より好ましくは 1 0以上の、 さらに好 ましくは 3 0以上の、 最も好ましくは 82の遺伝子からなるセットを使用するこ とが望ましい。 たとえ 8 2超の遺伝子を使用したとしても正答率はよくなるどこ ろか逆に悪化する傾向を、 図 2 Aは示している。  As described in the background art, although a set of genes for predicting postoperative recurrence of lung adenocarcinoma has been reported by some groups, a set of genes described as being predictable from tens of thousands of gene groups Each have no overlap with one another or very low overlap. Also with regard to the 82 gene set found by the present inventors, genes overlapping with the 45 gene set described in, for example, Japanese Patent Application Laid-Open No. 2007-135466 are evaluated, and J. E. Larsen et al., Only 1 gene overlaps with the 54 gene set described in C clinical Cancer Research 2001, 1 3: 2 946-2 954. However, as shown in Fig. 2A, the correct answer rate when performing recurrence prediction using a single gene (ie, [number of correct answers / (number of correct answers + number of incorrect answers)] X 1 00 (%) drops significantly. In order to increase the correct answer rate, it is possible to use a set of multiple, preferably 5 or more, more preferably 10 or more, more preferably 30 or more, most preferably 82 genes. desirable. Figure 2A shows that even if more than 82 genes are used, the correct answer rate tends to get better or worse.
後述の実施例に記載するように、 本発明者らは、 切除手術を受けた肺腺癌患者 から 8 7の肺腺癌サンプルを用意し、 このうち 6 0をランダムに訓練セットに害 り当て、残りの 27を評価セットとして用いた。訓練セットのサンプルについて、 バックグラウンドの発現量を超えるプローブを選択し、 このフィルタリング基準 を満たしたプローブシグナルを用いて、 教師付きクラス分類技術 (重み付き投票 アルゴリズム ; Y a n a g i s a waら, J . Na t l . C a n c e r I n s t . 9 9 : 8 5 8— 6 7, 2 0 0 7 ) によって、 再発の高リスク又は低リ スクを平均 7 5 %以上の高い確度で予測可能にする 8 2遺伝子を再発関連シグネ チヤ (すなわち、 再発するか又は再発するリスクが高い、 あるいは、 再発しない か又は再発するリスクが低い) として同定した。 このとき、 無再発シグネチヤを 同定するプローブシグナルの選択するために、 1 0 _ f o 1 dクロスバリデーシ ョン法を用いた。 この方法の概略は図 1に示されている。 As described in the examples below, the present inventors prepared 87 lung adenocarcinoma samples from lung adenocarcinoma patients who underwent excision surgery, of which 60 were randomly assigned to the training set. The remaining 27 were used as the evaluation set. A supervised classification technique (weighted voting algorithm; Y anagisa wa et al., J. Na tl t) using a probe signal that exceeds background expression levels for the training set samples and uses probe signals that meet this filtering criteria. C cancelr I nst. 9 9: 8 5 8 – 6 7, 2 0 0 7), which allows 82 genes that can predict high risk or low risk of relapse with a high degree of certainty on average of more than 75%. That is, they were identified as having a high risk of recurrence or recurrence, or no risk of recurrence or low recurrence). At this time, a 10 — fo 1 d cross validation method was used to select a probe signal to identify a recurrence free signal. The outline of this method is shown in FIG.
1 0— f o 1 dクロスバリデーション法は、 例えば 1 0 0サンプルを 1 0サン プルずつに 1 0分割し、 この 1◦分割から 1分割を除いた残り 9分割について特 性 (再発関連シグネチヤ) の選択を行い、 選択されたトップ 1位から最大 2 0 0 位までの予測プローブからなる分類器を構築し、 除いた 1分割の分類を行う。 次 に、 除いた 1分割を元に戻した 1 0分割の中から別の 1分割を除いた残り 9分割 について同様にシグネチヤの選択を行い、 選択されたトップ 1位から最大 2 0 0 位までの予測されたプローブからなる分類器を構築し、 除いた別の 1分割の分類 を行う。 同様の操作を合計 1 0回行う。 ここで、 例えば 1 0 0サンプルを 1 0分 割する割り当て方は無数に存在する事を考慮し、 割り当て方による偏りを低減す るために、 無作為 (ランダム) に 1 0 0通りの方法で 1 0◦サンプルを 1 0分割 した。 このようにして、 1 0 0通りの無作為分割毎に 1 0— f o 1 dクロスバリ デーション法を施行した計 1 0 0 0個の独立したセットに対して、 最大 2 0 0個 の予測プローブからなる分類器を構築した。 その結果、 学習エラーが最小となる 予測プローブ数 8 2を見出し (図 2 A)、独立した 1, 0 0 0個のセット間で最も 高頻度に共有されている 8 2個のプローブを再発関連シグネチヤとして同定し、 このようにして最終分類器を構築する。  For example, the 10 0-fo 1 d cross validation method divides 10 0 samples into 10 samples at 1 0, and the remaining 9 divisions excluding 1 division from this 1 分割 division have characteristics (relapse related signatures). Make a selection, construct a classifier consisting of the selected top 1 to a maximum of 2 0 0 predicted probes, and perform 1-division classification without exclusion. Next, from the top of the selected 1st place up to a maximum of 0. Construct a classifier consisting of predicted probes of, and perform another one-division classification without. Do the same operation a total of 10 times. Here, for example, in consideration of the fact that there are innumerable allocation methods for dividing 100 samples into 10 0, in order to reduce bias due to allocation methods, random (random) methods are used in 100 methods. 10 ◦ divided the sample into 10 In this way, a maximum of 200 predicted probes can be generated for a total of 100 0 independent sets that have undergone 1 0-fo 1 d cross-validation methods for every 1 0 0 0 random partitions. Was built. As a result, we find that the number of predicted probes is 82, which leads to the least learning error (Fig. 2A), and that the most frequently shared 8 2 probes among independent 1, 00 0 sets are associated with recurrence Identify it as a signet, and build the final classifier in this way.
上記のように構築された分類器を使用して、 テストサンプルの分類を行う。 テ ストサンプルとして、 ランダムに選択された肺腺癌患者から切除された肺腺癌の Classify test samples using the classifier constructed above. As a test sample, lung adenocarcinoma resected from randomly selected lung adenocarcinoma patients
2 7評価サンプルが使用された。 Kaplan - Meier生存曲線と Cox比例ハザードモデ ル分析を用いて、 評価サンプルから得られた再発関連シグネチヤと、 全生存2 7 evaluation samples were used. Recurrence-associated signatures obtained from evaluation samples using Kaplan-Meier survival curves and Cox proportional hazards model analysis, and overall survival
(overal l survival)及び無再発生存 (relapse-free survival)との関係を分析す る。 その結果、 本発明の 8 2遺伝子セット (「R R S— 8 2」 という) は、 再発 - 死亡の高リスク患者と、 無再発 .高生存の低リスク患者とを 7 5 %以上、 好まし くは 8 0°/0以上、 さらに好ましくは 9 0%以上の高い確度で判別することができ る。 Analyze the relationship between (overal l survival) and relapse-free survival (relapse-free survival). As a result, the 82 gene set of the present invention (referred to as "RRS-82") is preferably 75% or more of high risk patients with relapse-death and low risk patients with no recurrence and high survival. It is possible to determine with a high degree of accuracy of 80 ° / 0 or more, and more preferably 90% or more.
RR S— 8 2は、 配列番号 1〜 8 2の各ヌクレオチド配列を含む 8 2種の遺伝 子からなるセットである。 この遺伝子セットを表 1に示す。  RR S-82 is a set of 82 kinds of genes including each nucleotide sequence of SEQ ID NOs: 1 to 82. This gene set is shown in Table 1.
表 1 table 1
Figure imgf000014_0001
Figure imgf000014_0001
Figure imgf000015_0001
Figure imgf000015_0001
上記表中の N o . から N o . 8 2はそれぞれ、 配列番号 から配列番号 8 2 に対応している。 8 2種の遺伝子を、 術後無再発症例との相対的発現差を基に、 再発関連シグネチヤ、 すなわち再発 (死亡) シグネチヤ又は高再発リスクシグネ チヤ及び無再発シグネチヤ又は低再発リスクシグネチヤ、 について分類すると、 次の 2つの群に分けることができた。 No. 2 to No. 8 2 in the above table respectively correspond to SEQ ID NO: 2 to SEQ ID NO: 2 It corresponds to 8 Two types of genes are classified according to relative expression difference with postoperative recurrence-free cases, ie, for recurrence-associated siginthia, ie recurrence (death) signet or high relapse risk signal sign and relapse-free sign or low recurrence risk signet, Then I was able to divide it into the following two groups.
( 1 ) 配列番号 1〜5、 8〜9、 1 2、 1 4〜1 5、 1 7、 1 9〜2 1、 2 3〜 28、 30〜33、 35〜5 9、 6 1〜68、 70〜 82の各ヌクレオチド酉己列 を含む遺伝子の発現が術後無再発症例と比べて相対的に高い場合、 肺腺癌の再発 が高いと予測できる群 (あるいは、 相対的発現が低い場合、 肺腺癌の再発が低い と予測できる群)、 及び  (1) SEQ ID NOs: 1 to 5, 8 to 9, 12, 14, 15 to 17, 17 to 19, 21 to 2, 2 to 28, 30 to 33, 35 to 59, 6 to 68, A group in which the recurrence of lung adenocarcinoma can be predicted to be high (or the relative expression is low) if the expression of a gene containing 70 to 82 nucleotide sequences is relatively high compared to a postoperative recurrence-free case. A group where recurrence of lung adenocarcinoma can be predicted to be low), and
( 2 ) 配列番号 6〜7、 1 0〜: 1 1、 1 3、 1 6、 1 8、 22、 29、 34、 6 0, 6 9の各ヌクレオチド配列を含む遺伝子の発現が術後無再発症例と比べて相 対的に低い場合、 肺腺癌の再発が高いと予測できる群 (あるいは、 相対的発現が 高'い場合、 肺腺癌の再発が低いと予測される)。  (2) SEQ ID NOs: 6 to 7, 1 to 0: 1, 1, 13, 16, 18, 22, 29, 34, 60, 69 The expression of a gene containing each nucleotide sequence does not cause any recurrence after surgery A group whose lung cancer recurrence can be predicted to be high if it is relatively low compared to cases (or, if the relative expression is high, lung cancer recurrence is predicted to be low).
すなわち、 上記 (1) 群の遺伝子の場合、 肺腺癌患者を、 相対的発現が高いか 低いかによつて再発 (死亡) 患者又は高リスク患者、 あるいは、 無再発患者又は 低再発リスク患者として予測 ·分類することができる。 また、 上記 (2) 群の遺 伝子の場合、 逆に、 肺腺癌患者を、 相対的発現が低いか高いかによつて無再発患 者又は低リスク患者、 あるいは、再発 (死亡) 患者又は高リスク患者として予測 - 分類することができる。  That is, in the case of genes of group (1) above, lung adenocarcinoma patients are predicted as relapse (death) patients or high risk patients, or non-relapse patients or low recurrence risk patients depending on whether the relative expression is high or low. · Can be classified. Also, in the case of the gene of the above-mentioned (2) group, the lung adenocarcinoma patient is conversely a non-relapsed patient or a low risk patient depending on whether the relative expression is low or high, or a relapse (death) patient or Predictable as high risk patients-can be classified.
本発明方法によって再発又は高リスクと判定されたならば、 肺腺癌患者の術後 再発を抑制するための治療計画を早期に立案することが可能になるし、 一方、 無 再発又は低リスクと判定されたならば、 無用の化学療法や放射線治療を避けるた めの判断材料ともなり うる。  If it is determined that the method of the present invention is a recurrence or high risk, it will be possible to formulate an early treatment plan for suppressing postoperative recurrence of lung adenocarcinoma patients, while, on the other hand, no recurrence or low risk. If determined, it can also serve as a basis for avoiding useless chemotherapy and radiation therapy.
上記遺伝子の相対的発現レベルを比較する際の対照は、術後無再発症例であり、 上記の予測を可能にするならば、 術後一定期間 (例えば 3年、 好ましくは 5年、 より好ましくは 1 0年) 無再発と判定された患者由来のサンプル (肺腺癌組織又 は細胞) である。  The control in comparing the relative expression levels of the above genes is a postoperative non-recurring case, and if the above prediction can be made, a predetermined period after surgery (eg 3 years, preferably 5 years, more preferably 10) It is a sample (lung adenocarcinoma tissue or cells) derived from a patient who is judged to have no recurrence.
本発明における RRS— 82と、 EGFR、 K一 r a s又は p 53遺伝子変異 との間に統計的に有意な関連は見出されていない (図 3)。 本発明における R R S— 82の判別能力を、評価セット ( 2 7肺腺癌サンプル) を用いて検証したときには、 RR S _ 82の高リスクシグネチヤを示した全ての 患者が 5年以内に肺腺癌を再発し、 一方、 低リスクシグネチヤを示した患者の約 70%が 5年後に再発の兆候を示さなかった (図 4)。 この意味では、本発明の方 法は、 肺腺癌患者における術後再発の高リスク群を予測するうえで極めて有効で あるとレヽ る。 No statistically significant association was found between RRS-82 of the present invention and EGFR, K-ras or p53 gene mutations (FIG. 3). When the discriminatory ability of RRS-82 in the present invention was verified using an evaluation set (27 lung adenocarcinoma samples), all patients showing a high risk sign of RR S _ 82 had lung glands within 5 years. About 70% of patients who relapsed cancer, but showed low risk signs did not show signs of recurrence after 5 years (Figure 4). In this sense, it is concluded that the method of the present invention is extremely effective in predicting a high risk group of postoperative recurrence in lung adenocarcinoma patients.
本発明の方法による再発 ·無再発予測は、 腫瘍のステージに関わらず実施可能 であり、 興味深いことに早期のステージであっても実施可能である。  The recurrence / no recurrence prediction according to the method of the present invention can be performed regardless of the tumor stage, and interestingly, even in the early stage.
<肺腺癌の術後再発の予測法 > <Prediction of postoperative recurrence of lung adenocarcinoma>
本発明は、 その一の態様において、 肺腺癌患者において肺癌の外科切除後の肺 腺癌の再発を予測するための方法であって、 配列番号 1〜82の各ヌクレオチド 配列を含む遺伝子からなる群から選択される 2〜8 2個の遺伝子の遺伝子セット の発現を該患者由来の生物学的サンプルにおいて測定することを含み、 ここで、 配列番号 1〜5、 8〜9、 1 2、 14〜1 5、 1 7、 1 9〜2 1、 23〜28、 3 0〜33、 3 5〜5 9、 6 1〜68、 70〜 8 2のいずれかのヌクレオチド酉己 列を含む遺伝子の発現が術後無再発症例と比べて相対的に高い場合、 或いは、 配 列番号 6〜7、 1 0〜: 1 1、 1 3、 1 6、 1 8、 22、 2 9、 34、 6 0、 69 のいずれかのヌクレオチド配列を含む遺伝子の発現が術後無再発症例と比べて相 対的に低い場合、 肺腺癌の再発が高いと予測することを特徴とする上記方法を提 供する。  The present invention is, in one aspect thereof, a method for predicting recurrence of lung adenocarcinoma after surgical removal of lung cancer in lung adenocarcinoma patients, comprising a gene comprising each nucleotide sequence of SEQ ID NO: 1-82 Measuring the expression of a gene set of 2 to 2 genes selected from the group in a biological sample derived from said patient, wherein: SEQ ID NOs: 1 to 5, 8 to 9, 12, 14 Expression of a gene containing a nucleotide sequence of any one of 1 to 15, 1 7, 19 to 21, 1, 23 to 28, 30 to 33, 35 to 59, 6 to 68, 70 to 82 Is relatively high compared to the postoperative recurrence-free cases, or array numbers 6 to 7, 1 0 to: 1 1, 13, 16, 18, 22, 29, 34, 60, If the expression of a gene containing any of the 69 nucleotide sequences is relatively low compared to post-surgery recurrence-free cases, it is characterized in that the recurrence of lung adenocarcinoma is predicted to be high. How to provide.
上記 82種の遺伝子は、 上記のとおり、 配列番号 1〜8 2によって示されるヌ クレオチド配列を含むヒ ト遺伝子である。 生物由来の遺伝子であるがゆえに、 多 型変異、スプライス変異、突然変異などの変異が生じることもあると考えられる。 したがって、 本発明の対象遺伝子は、 配列番号 1〜8 2によって示されるヌクレ ォチド配列だけでなく、これらの配列中に 1もしくは数個のヌクレオチドの欠失、 置換又は付加を含むことができるし、 あるいは、 これらの配列に対し少なくとも The above 82 genes are human genes comprising the nucleotide sequences shown by SEQ ID NOs: 1-8, as described above. Since it is a gene derived from an organism, it is considered that mutations such as polymorphic mutation, splice mutation, mutation may occur. Therefore, the target gene of the present invention may contain not only nucleotide sequences represented by SEQ ID NOs: 1 to 2 but also deletions, substitutions or additions of one or several nucleotides in these sequences, Or at least for these sequences
95 %、 好ましくは少なくとも 9 7 %、 より好ましくは少なく とも 98 %、 最も 好ましくは少なくとも 9 9%の同一性を有しうる。 It may have an identity of 95%, preferably at least 97%, more preferably at least 98%, most preferably at least 99%.
本明細書で使用する 「同一性 (%)」 という用語は、 ギャップを導入した或いは ギヤップを導入しない公知の B L AS T又は FAS TAアルゴリズムを用いて決 定することができる (K a r 1 i n及び A I ts c h ul, 1 99 3, P r o c . N a t l . A c a d. S c i . U. S. A., 90 : 58 73— 5 8 77 ; Ka r l i n及び A 1 t s c h u 1 , 1 990, P r o c . N a t 1. A c d . S c i . U. S. A., 8 7 : 2264- 22 68 ; A l t s c h u l ら, 1 9 90, J . Mo 1. B i o l ., 2 1 5 : 40 3 ; A l t s c h u l ら, 1 9 9 7, Nu c l e i c Ac i d s R e s 25 : 3389— 3402)。 一般に、 全塩基数に対する一致した塩基数 の百分率として同一性 (%) を算出できる。 As used herein, the term "identity (%)" introduces a gap or It can be determined using a known BL AS T or FA S TA algorithm without introducing a gap (K ar 1 in and AI t ch ul, 199 3, P roc. N atl. A ca d. S ci. USA, 90: 58 73- 5 8 77; Karlin and A 1 tschu 1, 1 990, Pr o C. N at 1. A cd S. USA, 8 7: 2264-22 68; A ltschul et al., 1 9 90, J. Mo 1. Biol., 215: 403; Altschul et al., 1 9 9 7, Nucleic Acids Res 25: 3389- 3402). In general, identity (%) can be calculated as a percentage of the number of matched bases relative to the total number of bases.
本明細書で使用する 「数個」 という用語は、 2から 1 0までの整数を指し、 す なわち 2、 3、 4、 5、 6、 7、 8、 9又は 1 0のいずれかであり、 好ましくは 2から 5までの整数、 より好ましくは 2又は 3である。  The term "several" as used herein refers to an integer from 2 to 10, that is, any of 2, 3, 4, 5, 6, 7, 8, 9 or 10 , Preferably an integer of 2 to 5, more preferably 2 or 3.
本発明では、 遺伝子セットにおける遺伝子数が 2〜全数 (82) であり、 この 範囲の遺伝子数であれば、 術後再発を予測することができる。 しかしながら、 予 測確度 (又は精度) をより高めるためには、 遺伝子数を 5〜8 2とすることが好 ましく、 さらに好ましい範囲は 1 0〜82、 もっと好ましい範囲は 30〜 8 2、 例えば 40〜8 2、 50〜8 2、 60〜8 2, 70〜 82であり、 最も好ましい 遺伝子数は 82である。  In the present invention, the number of genes in the gene set is 2 to 100 (82), and the number of genes in this range can predict post-operative recurrence. However, to further improve the prediction accuracy (or accuracy), it is preferable to set the number of genes to 5 to 82, more preferably 10 to 82, and still more preferably 30 to 82, for example 40 to 82, 50 to 82, 60 to 80, 70 to 82, and the most preferable number of genes is 82.
遺伝子の発現は、 核酸か又はタンパク質の量又は存在について測定することが できる。 核酸の測定においては、 各遺伝子の転写産物である mRN A及ぴその誘 導体核酸、 例えば c DN A、 c R N ARX a RNA (a n t i s e n s e am p 1 i f i e d RNA) を測定対象とすることができる。 一方、 タンパク質の 測定においては、各遺伝子によってコードさ'れるタンパク質(発現産物又は遺伝子 産物ともいう)、 その断片又はその翻訳後修飾産物 (例えば糖などによる修飾) を 測定対象としうる。  Gene expression can be measured for the amount or presence of nucleic acids or proteins. In the measurement of nucleic acid, the transcripts of each gene, mRNA and its derivative nucleic acid, for example, cDNA, cRNA, RNA (an RNAi RNAi) can be used as a measurement target. On the other hand, in the measurement of protein, a protein encoded by each gene (also referred to as an expression product or gene product), a fragment thereof or a post-translational modification product (for example, modification by sugar etc.) can be the measurement target.
以下に、 上記の 8 2遺伝子の発現を、 核酸及びタンパク質レベルで測定するた めの手法について説明する。  The following describes a method for measuring the expression of the above-mentioned 82 genes at the nucleic acid and protein levels.
テス トサンプルは、 肺腺癌患者の肺腺癌組織又細胞であり、 これは手術によつ て切除された癌組織、あるいは、生検によって得られた組織又は細胞などである。 核酸による遺伝子発現の測定 The test sample is lung adenocarcinoma tissue or cells of a lung adenocarcinoma patient, such as cancer tissue resected by surgery or tissue or cells obtained by biopsy. Measurement of gene expression by nucleic acid
本発明方法において、 82種の遺伝子の発現を検出するために、 以下の核酸を プローブ又はプライマーとして使用することができる。  In the method of the present invention, the following nucleic acids can be used as probes or primers to detect the expression of 82 genes.
(1) 配列番号 1〜8 2に示されるヌクレオチド配列、 それに相補的なヌクレ ォチド配列、 或いはそれらのヌクレオチド配列中の連続する 1 5塩基から全塩基 数未満の部分配列を有する核酸、 及び  (1) Nucleotide sequences as shown in SEQ ID NOs: 1 to 2, nucleotide sequences complementary thereto, or nucleic acids having partial sequences of 15 bases to less than the total number of bases in their nucleotide sequences, and
(2) 配列番号 1〜8 2に示されるヌクレオチド配列又はそれに相補的なヌク レオチド配列を含む核酸とハイブリダイズする核酸、 或いは該ハイブリダイズす る核酸の連続する 1 5塩基から全塩基数未満の部分配列を有する核酸。  (2) A nucleic acid that hybridizes to a nucleic acid comprising the nucleotide sequence shown in SEQ ID NO: 1 to 8 or a nucleotide sequence complementary thereto, or alternatively, from 15 bases to less than the total number of bases of the hybridizing nucleic acid. Nucleic acid having a partial sequence.
上記の部分配列からなる核酸断片のサイズは、 1 5塩基から全塩基数未満であ り、 例えば 1 7塩基以上、 20塩基以上、 30塩基以上、 50塩基以上、 70塩 基以上、 1 00塩基以上、 1 50塩基以上、 200塩基以上、 300塩基以上、 400塩基以上又は 500塩基以上から全塩基数未満の範囲である。  The size of the nucleic acid fragment consisting of the above partial sequence is 15 bases to less than the total number of bases, for example, 17 bases or more, 20 bases or more, 30 bases or more, 30 bases or more, 50 bases or more, 70 bases or more, 100 bases The above is the range of 150 bases or more, 200 bases or more, 300 bases or more, 400 bases or more, or 500 bases or more to less than the total number of bases.
上記核酸は、 約 1 00塩基以下の DNA分子であれば、 ホスホアミダイ ト法な どを利用する市販の DNA自動合成装置を用いて合成する力 或いは、 約 1 00 塩基超の DN A分子であれば、 c DN Aクローユングやポリメラーゼ連鎖反応(P CR) によって作製することができる。 また、 c RNAや a RNAは、 巿販キッ ト等を用いて c DN Aから作製しうる。  The above-mentioned nucleic acid is a DNA molecule having a size of about 100 bases or less, the ability to be synthesized using a commercially available automatic DNA synthesizer using a phosphoramidite method or the like, or a DNA molecule having a size of about 100 bases or more. C DNA can be prepared by cloning and polymerase chain reaction (PCR). In addition, cDNA and a RNA can be prepared from cDNA using a commercial kit and the like.
c DNAクローニング及び P CR法では、 肺腺癌組織から全 RNAを取得し、 オリゴ d Tセルロースカラム処理によってポリ A ( + ) RNAを得たのち、 逆転 写-ポリメラーゼ連鎖反応 (RT- PCR) 法によって c DNAライブラリーを作 製し、 このライブラリーから、 配列番号 1〜82に示されたヌクレオチド配列に 基づいて作製した 1 5塩基以上の長さのプローブ又はプライマーを用いて目的の 遺伝子に対応する c DNAを選抜/クローニング又は P CR增幅することができ る。 プローブは、 c DN A配列に相補的な配列を有し、 その長さは、 好ましくは c In DNA cloning and PCR, total RNA is obtained from lung adenocarcinoma tissue, and poly A (+) RNA is obtained by oligo d T cellulose column treatment, followed by reverse transcription-polymerase chain reaction (RT-PCR) method. A cDNA library is prepared by the method described above, and a 15 base or longer probe or primer generated from this library based on the nucleotide sequences shown in SEQ ID NOS: 1-82 corresponds to the target gene. The cDNA can be selected / cloned or PCR amplified. The probe has a sequence complementary to the cDNA sequence, and its length is preferably
20塩基以上、 より好ましくは 3 0塩基以上、 さらに好ましくは 50塩基以上で ある。 また、 プライマーは、 センスプライマー及びアンチセンスプライマ一から なり、その長さは、好ましくは 1 5〜50塩基、より好ましくは 1 7〜30塩基、 さらに好ましくは 20〜 25塩基である。 上記のようにして得られた DN Aは、 市販又は文献記載のベクターに挿入した のち、原核又は真核生物の宿主細胞に導入し、増幅することができるし、或いは、 目的 D N Aが挿入されたべクターを铸型にして P C R増幅することができる。 ベクターは、 プラスミ ド、 ファージ、 プラスミ ド、 ウィルスなどのベクターで あり、 例えば p B l u e s c r i p t系、 pUC系、 p B R系などのプラスミ ド である。 ベクタ一は、 目的 DNAの他に、 プロモーター、 複製開始点、 リボソ一 ム結合配列 (又はシャインーダルガルノ配列)、 ターミネータ一、選択マーカー配 列(例えば薬剤耐性遺伝子)、マルチクローニングサイ トなどを含むことができる。 宿主細胞に適したベクターが市販されているのでそれを使用するのが望ましい。 原核宿主細胞は、 細菌細胞であり、 一般に大腸菌、 枯草菌、 シユードモナス属 細菌などを含む。 また、 真核宿主細胞は、 酵母、 真菌、 担子菌、 動物細胞 (昆虫 細胞、 哺乳動物細胞など)、 植物細胞などを含む。 It is 20 bases or more, more preferably 30 bases or more, still more preferably 50 bases or more. Moreover, a primer consists of a sense primer and an antisense primer, and the length thereof is preferably 15 to 50 bases, more preferably 17 to 30 bases, and still more preferably 20 to 25 bases. The DNA obtained as described above may be inserted into a commercially available or literature vector, introduced into a prokaryotic or eukaryotic host cell and amplified, or the DNA of interest may be inserted. The PCR can be amplified by PCR. The vector is a vector such as plasmid, phage, plasmid or virus, for example, plasmid such as pBluescript system, pUC system, pBR system. The vector I includes, in addition to the target DNA, a promoter, an origin of replication, a ribosomal binding sequence (or Shine-Dalgarno sequence), a terminator I, a selective marker sequence (eg, a drug resistance gene), a multicloning site, etc. Can be included. Vectors suitable for the host cell are commercially available and it is desirable to use them. Prokaryotic host cells are bacterial cells, and generally include E. coli, B. subtilis, Pseudomonas bacteria, and the like. Eukaryotic host cells also include yeast, fungi, basidiomycetes, animal cells (such as insect cells and mammalian cells), plant cells and the like.
ベクターを宿主細胞に導入する方法もまた公知であり、 例えばエレクトロポレ ーシヨン、 リン酸カルシウム法、 スフエロプラス ト融合法、 プロ トプラスト融合 法、 マイクロインジェクション、 遺伝子銃法、 ァグロパクテリゥム法などが含ま れる。  Methods for introducing the vector into host cells are also known, and include, for example, electroporation, calcium phosphate method, Spheroplast fusion method, protoplast fusion method, microinjection, gene gun method, globulin method and the like.
上記の技術の詳細は、 例えば J . S amb r o o kら, Mo l e c u l a r C l o n i n g A L a b o r a t o r y Ma n u a l , 1 98 9年, C o l d S p r i n g H a r b o r L a b o r a t o r y P r e s s The details of the above-mentioned techniques can be found in, for example, J.Sambrook et al., Mol.Cla.I.Cloin.g.L.a.b.r. Ma.
(米国) ; F. M. A u s b e l ら, S h o r t P r o t o c o l s i n Mo l e c u l a r B i o l o g y (3版) A C omp e n d i um o f Me t h o d s f r om Cu r r e n t P r o t o c o l s i n Mo l e c u l a r B i o l o g y, 1 9 95年, J o h n W i l e y & S o n s , I n c . (米国) などに記載されている。 (US); FM A usbel et al, S Hort Protocols, Molecular Biology (3 ed.) AC ompendi um of Memo ds fr om C o rrent Protocolsin, Molecular biology, 19 95, J ohn W iley & Sons , I nc. (US) etc.
本発明方法で使用可能な核酸には、 上記 (2) のとおり、 配列番号 1〜8 2に 示されるヌクレオチド配列又はそれに相補的なヌクレオチド配列を含む核酸とハ イブリダイズする核酸、 或いは該ハイブリダイズする核酸の連続する 1 5塩基か ら全塩基数未満の部分配列を有する核酸である。 ハイプリダイゼーシヨンは、 ス トリンジェントな条件下のハイプリダイゼーションが好ましく、 この条件では、 上記ヌクレオチド配列と 90 %以上、 好ましくは 95 %以上、 より好ましくは 9 8以上、 最も好ましくは 99%以上の同一性を有する配列の核酸とハイプリダイ ゼーションを起こすことができる。 Nucleic acids that can be used in the method of the present invention include, as described in (2) above, a nucleic acid that hybridizes with a nucleic acid comprising the nucleotide sequence shown in SEQ ID NO: 1-8 or a nucleotide sequence complementary thereto It is a nucleic acid having a partial sequence of 15 consecutive bases to less than the total number of bases of the nucleic acid. Hydridization is preferably carried out under stringent conditions. It is possible to cause hybridization with a nucleic acid having a sequence identity of at least 90%, preferably at least 95%, more preferably at least 98, most preferably at least 99% to the above-mentioned nucleotide sequence.
上記の核酸を用いて 8 2遺伝子セッ トの発現の測定を行う。好ましい測定法は、 ハイプリダイゼーション法又は定量 P CR法(例えばリアルタイム P CR法など) を含む。  The expression of 82 gene set is measured using the above nucleic acid. Preferred measurement methods include hybridization methods or quantitative PCR methods (such as real-time PCR methods).
ハイブリダィゼーションは、 固体支持体の表面上に付着又は結合した核酸プロ ーブに対し、 それに部分的又は完全に相補的な核酸を、 塩基対合を介して結合さ せて二本鎖を形成する手法をいう。 固体支持体は、 例えばテス トプレート、 試験 管、 試験片、 アレイなどを含み、 その材質は、 通常、 ポリマー (又はプラスチッ ク、 樹脂)、 ガラスなどである。 本発明方法で使用されるハイプリダイゼーシヨン は、 DNA— DNAハイブリダィゼーシヨン、 DNA— RNAハイブリダィゼー ション又は RN A— RN Aハイブリダイゼーションのいずれであってもよく、 そ の方法には、 非限定的に、 例えばマイクロアレイ法、 ブロット法、 例えばノザン ブロット、 サザンブロッ ト、 ノザンハイブリダイゼーシヨン、 サザンハイブリダ ィゼーション、 i n s i t uハイブリダィゼーシヨンなどが含まれる。  In hybridization, a nucleic acid probe attached or bound on the surface of a solid support is bound to a partially or completely complementary nucleic acid via base pairing to form a double strand. It means the method to form. The solid support includes, for example, a test plate, a test tube, a test piece, an array and the like, and the material is usually a polymer (or plastic, resin), glass or the like. The hybridization used in the method of the present invention may be any of DNA-DNA hybridization, DNA-RNA hybridization or RNA-RNA hybridization, and the method is not limited to this method. For example, microarray method, blotting method such as Northern blot, Southern blot, Northern hybridization, Southern hybridization, in situ hybridization etc. are included.
マイクロアレイ法では、 配列番号 1〜 8 2のヌクレオチド配列を含む遺伝子又 はそれに対応する核酸 (mRNA、 c DNA、 c RNA又は a RNA) とハイブ リダイズする 1 5塩基以上の核酸プローブを支持体に結合したマイクロアレイ (又は DN Aチップ) を作製し使用する。 マイクロアレイの表面には、 核酸プロ ーブを共有結合するための反応性基を含むスぺーサーゃクロスリンカーを導入す ることができる。 アレイ表面と核酸プローブとの結合は、 例えば光や熱による化 学反応を介して行うことができる。  In the microarray method, a 15 base or more nucleic acid probe that hybridizes with a gene containing the nucleotide sequence of SEQ ID NO: 1 to 8 or a corresponding nucleic acid (mRNA, cDNA, RNA or RNA) is bound to a support Make and use the microarray (or DNA chip). On the surface of the microarray, it is possible to introduce a spacer crosslinker containing a reactive group for covalently binding a nucleic acid probe. Binding of the array surface to the nucleic acid probe can be performed, for example, through a chemical reaction with light or heat.
上記のハイブリダイゼーションは、 ストリンジヱントな条件下でハイブリダイ ゼーシヨンを行うときには、 核酸プローブとテス ト用核酸との間でより特異的な 結合が可能になる。 ストリンジェントな条件は、 上に定義した条件を含むが、 ハ ィブリダイゼーション法の種類に応じて適宜最適な条件を決定することが望まし い。 一般に、 ストリンジエンシー ( s t r i n g e n c y) は、 温度、 溶液のィ オン強度、 ホルムアミ ドの存在、 核酸の相対 GC含量、 インキュベーション時間 などによって大きく左右される。 温度は、 オリゴヌクレオチドの 5 0%がその相 補鎖と解離するときの温度 (Tm) の前後の温度範囲から最適温度を決めること ができる。 ストリンジェントな条件での温度は、 通常、 4 2〜6 8°Cの範囲内の 温度である。 高ストリンジヱントなハイブリダィゼーシヨン条件は、 例えば 6 X S S C、 0. 0 1 M EDTA、 I Xデンハルト液、 0. 5 %S D S中、 6 8 °C でのハイプリダイゼーシヨン; 1 M N a C l、 0. 5%サルコシル、 3 0%ホ ルムアミ ド中、 6 0 °Cでのハイブリダイゼーシヨン; 0. 1 X S S C、 0. 1 % S D S中、 5 5 °Cでの洗浄などである。 ここで、 1 X S S Cは 1 5 OmM塩化ナ トリウムと 1 5 mMタエン酸ナトリゥム水溶液(p H 7. 2)である。 The above hybridization enables more specific binding between the nucleic acid probe and the test nucleic acid when hybridization is performed under stringent conditions. Stringent conditions include the conditions defined above, but it is desirable to appropriately determine optimum conditions according to the type of hybridization method. In general, stringency refers to temperature, ion strength of solution, presence of formamide, relative GC content of nucleic acid, incubation time It greatly depends on etc. The temperature can be determined from the temperature range before and after the temperature (Tm) at which 50% of the oligonucleotide dissociates from its complementary strand. The temperature under stringent conditions is usually a temperature within the range of 42 to 68 ° C. High stringency hybridisation conditions include, for example, hybridization with 6 X SSC, 0.1 M EDTA, IX Denhardt's solution, 0.5% SDS at 68 ° C .; 1 MN a C 1, Hybridization at 60 ° C in 0.5% sarkosyl, 30% formaldehyde; washing at 55 ° C in 0.1 X SSC, 0.1% SDS, and so on. Here, 1 X SSC is 15 OmM sodium chloride and 15mM sodium taenoate aqueous solution (p H 7.2).
核酸プローブの固相化は、 特に制限はないが、 一般的な方法、 例えばスポッタ 一又はアレイヤーと呼ばれる高密度分注機を用いて DN Aをスポッ トする方法、 ノズルから液滴を噴射するィンクジヱット方式などの方法を用いて実施すること ができる。  The immobilization of the nucleic acid probe is not particularly limited, but a general method, for example, a method of spotting the DNA using a high-density dispenser called spotter or arrayer, or a method of jetting droplets from the nozzle It can be implemented using methods such as methods.
肺腺癌患者から外科切除された肺腺癌組織テストサンプル由来の mRNAから 誘導された c DNA、 c RNA、 a RNAなどの核酸を、 C y染料 (例えば C r 3、 C y 5) などの蛍光物質で標識し、 マイクロアレイ上のプローブとハイプリ ダイズさせる。 レーザースキャンによる読み取り装置を用いて蛍光強度を読み取 り、 コンピュータでデータ解析する。  A nucleic acid such as cDNA, cDNA, or a RNA derived from a lung adenocarcinoma tissue test sample surgically resected from a lung adenocarcinoma patient, such as a C y dye (for example, C r 3 or C y 5) Label with fluorescent substance and hybridize with the probe on the microarray. The fluorescence intensity is read using a laser scanning reader and data is analyzed by a computer.
プロット法では、 本発明の上記核酸プローブを放射性同位元素 (例えば、 32 P 及び35 S) や蛍光物質 (フルォレサミン、 ローダミン、 それらの誘導体、 C y染 料など) などで標識したのち、 ポリマーメンプレンに転写したテストサンプル中 の mRNA、 c DNA、 c RNA、 a R N Aなどの核酸との間でハイブリダィゼ ーシヨンを行う。 シグナルを、 放射線検出器又は蛍光検出器を用いて検出し、 そ の強度を測定する。 In the plotting method, after the above-mentioned nucleic acid probe of the present invention is labeled with a radioactive isotope (for example, 32 P and 35 S), a fluorescent substance (fluoresamine, rhodamine, derivatives thereof, C y dye etc.), etc. Hybridization is performed with the nucleic acid such as mRNA, cDNA, RNA, and RNA in the test sample that has been transcribed. The signal is detected using a radiation detector or fluorescence detector and its intensity is measured.
定量リアルタイム P CR法では、 肺腺癌組織テストサンプル中の mRNAから 作製した c DNAを铸型として標的の各遺伝子の領域が増幅できるように、 ブラ イマ一を c DN Aとァ -ーリングさせて P CRを行い、 リアルタイムで増幅産物 二本鎖 DN Aを検出する。 増幅産物は 1サイクル毎に指数関数的に増幅し、 やが てブラトーに達する。 段階希釈した標準サンプルを用いてリアルタイム P CRを 行い、 サイクル数を横軸に、 P CR增幅量を縦軸にとり、 サイクル数毎の増幅曲 線を作成する。 閾値を設定し、 閾値と増幅曲線が交わる点 C t値(threshold cycle)を算出する。 C t値は、 P C R産物が一定量に達したときのサイクル数で ある。 C 1:値と初期铸型 D N A量の間に直線関係があるので、検量線を作成する。 増幅産物の検出は、 インターカレーター法、 蛍光標識プローブ法などの方法を 用いて行うことができる。 インターカレーター法は、 例えばハイプリダイゼーシ ヨンによって形成された D N Aの二本鎖の間に蛍光物質が結合する性質を利用し て増幅産物量をモニターする方法である。 蛍光標識プローブ法では、 プローブを 蛍光物質で標識し、 増幅産物量を蛍光シグナルによってモニターする。 この方法 のなかには、 5 '末端に蛍光物質及び 3 '末端にクェンチヤ一を結合したプローブ を使用する方法も知られている。 In the quantitative real-time PCR method, the cDNA is paired with cDNA so that cDNA regions prepared from mRNA in lung adenocarcinoma tissue test samples can be used as templates to amplify the regions of each target gene. PCR is performed to detect the amplification product double-stranded DNA in real time. The amplification product is exponentially amplified every cycle and eventually reaches a plateau. Real-time PCR using serially diluted standard samples Conduct the cycle number on the horizontal axis and the PCR width amount on the vertical axis to create an amplification curve for each cycle number. Set the threshold and calculate the Ct value (threshold cycle) at which the threshold and the amplification curve intersect. The Ct value is the number of cycles when a constant amount of PCR product is reached. Since there is a linear relationship between the C 1: value and the amount of initial template DNA, create a calibration curve. The detection of the amplification product can be carried out using a method such as an intercalator method or a fluorescent labeling method. The intercalator method is, for example, a method of monitoring the amount of amplification product utilizing the property that a fluorescent substance is bound between double strands of DNA formed by hybridization. In the fluorescent labeling method, the probe is labeled with a fluorescent substance, and the amount of amplification product is monitored by a fluorescent signal. Among these methods, there is also known a method using a probe having a fluorescent substance at the 5 'end and a quencher at the 3' end.
リアルタイム P CR装置が市販されているので、 これを用いてリアルタイム P CR法を実施することができる。  Because real-time PCR systems are commercially available, they can be used to perform real-time PCR.
P CRを実施する際の条件として、 増幅サイズは 80〜 1 5 0 b pの範囲とす ること、 プライマーサイズは 1 7〜 25塩基の範囲'とすること、 プライマー全体 の GC含量は 40〜60%の範囲とすること、 プライマーの 3'末端は G又は C、 プライマー内部やプライマー間に 3塩基以上相補する配列がないこと、 上流ブラ イマ一と下流プライマーの Tm値を 2°C以内にそろえること、 鎵型特異的プライ マーを設計すること、 などが知られている。  As conditions for carrying out PCR, the amplification size should be in the range of 80 to 150 bp, the primer size should be in the range of 1 to 25 bases, and the GC content of the entire primer should be 40 to 60. %, The 3 'end of the primer is G or C, there is no complementary sequence inside or between the primers and the primers, and the Tm values of the upstream primer and the downstream primer are within 2 ° C. It is known that designing template-specific primers.
P C R条件は、 例えば変性: 9 2〜 94 °Cで 3 0〜 60秒;ァニーリング : 5 0〜 5 5 °Cで 3 0〜 60秒;伸長: 68〜72°< で3 0〜60秒を 1サイクルと して 30〜40サイクルの反応を含む。 逆転写酵素は、 市販の酵素、 例えば S u p e r S c r i p t™ I I I ( I n v i t r o g e n), AMV R e v e r s e T r a n s c r i p t a s e ^ M— MLV R e v e r s e T r a n s c r i p t a s e (P r ome g a), SYBR P r e m i x E x T a q (タ カラバイオ) などを使用することができる。  PCR conditions are, for example, denaturation: 30 to 60 seconds at 92 to 94 ° C .; amino rings: 30 to 60 seconds at 50 to 55 ° C .; elongation: 30 to 60 seconds at 68 to 72 ° One cycle includes 30 to 40 cycles of reaction. The reverse transcriptase is a commercially available enzyme, for example, S.sup.Script.TM. III (Invitrogen), AMV R.E.Transcriptase ^ M-MLV R.E.T. transcriptase (P. rome ga), SYBR P remix E x T aq Carabio etc. can be used.
本発明において、 再発と無再発との相対的発現レベル差は、 1. 1倍以上、 好 ましくは 1. 5倍以上、 より好ましくは 2. 0倍以上である。  In the present invention, the relative expression level difference between relapse and no relapse is 1.1 times or more, preferably 1.5 times or more, more preferably 2.0 times or more.
タンパク質による遺伝子発現の測定 本発明方法では、 配列番号 1〜8 2によって示されるヌクレオチド配列を含む 遺伝子によってコードされるタンパク質又はその断片の量を測定することによつ て、 遺伝子発現を測定することができる。 この発現レベルの代替的測定法は、 免 疫学的方法である。 Measurement of gene expression by protein In the method of the present invention, gene expression can be measured by measuring the amount of a protein encoded by a gene comprising a nucleotide sequence represented by SEQ ID NO: 1-8 or a fragment thereof. An alternative measure of this expression level is an immunoepidemiological method.
抗体を作製するためのタンパク質は、 c DN Aクロ ニング及ぴ遺伝子組み換 え技術を利用して作製することができる。  Proteins for producing antibodies can be produced using cDNA cloning and gene recombination technology.
簡単に説明すると、 例えば肺腺癌組織から c DNAライブラリーを作製し、 配 列番号 1〜 8 2の各ヌクレオチド配列に基いて合成したプライマーを用いる P C R法によって c DN Aクローンを作製し、 得られた c DNAクローンを発現べク ターに組み込み、 該ベクターによって形質転換又はトランスフエクションされた 原核又は真核宿主細胞を培養することによって該細胞又は培養上清から得ること ができる。 このとき、 発現ベクターは市販又は文献記載のものを使用することが でき、 例えばプラスミド、 コスミ ド、 ファージなどである。 ベクターは、 目的タ ンパク質をコードする DNA、 プロモーター、 ポリアデニル化シグナル、 リポソ ーム結合配列、 複製開始点、 ターミネータ一、 選択マーカーなどを含むことがで きる。 ポリペプチドの分離 ·精製を容易にするために、標識 (ポリ) ペプチド (例 えば 一ガラクトシダーゼ遺伝子など)、 (H i s)610タグ、 F LAGタグ (ァ ミノ酸配列: DYKDDDDK (配列番号 1 50))、 GF P (緑色蛍光タンパク質) などのタンパク質又はオリゴぺプチドと、 目的タンパク質との融合タンパク質が 形成されるように、 それらに対応する DNA配列を含有させることもできる。 宿主細胞は、 細菌などの原核細胞 (例えば大腸菌、 枯草菌、 シュウドモナス属 細菌など)、 酵母 (例え サッカロマイセス属、 シゾサッカロマイセス属、 ピチア 属など)、 昆虫細胞 (例えば S f 細胞)、 哺乳動物細胞 (例えば CHO、 COS, BHK、 HEK2 93、 N I H3 T 3など) などを含む。 Briefly, for example, a cDNA library is prepared from lung adenocarcinoma tissue, and a cDNA clone is prepared by PCR using a primer synthesized based on each nucleotide sequence of SEQ ID NO: 1 to 82. The obtained c DNA clone can be incorporated into an expression vector and obtained from the cell or culture supernatant by culturing a prokaryotic or eukaryotic host cell transformed or transfected with the vector. At this time, expression vectors can be commercially available or those described in the literature, and examples thereof include plasmids, cosmids, phages and the like. The vector can contain a DNA encoding a target protein, a promoter, a polyadenylation signal, a liposome binding sequence, an origin of replication, a terminator, a selectable marker, and the like. In order to facilitate separation and purification of the polypeptide, a labeled (poly) peptide (eg, mono-galactosidase gene etc.), (His) 610 tag, F LAG tag (amino acid sequence: DYKDDDDK (SEQ ID NO: 1) 50)) A protein or an oligopeptide such as GF P (green fluorescent protein) and a corresponding DNA sequence may be contained so as to form a fusion protein with the target protein. Host cells include prokaryotic cells such as bacteria (eg, E. coli, Bacillus subtilis, Pseudomonas bacteria, etc.), yeast (eg, Saccharomyces, Schizosaccharomyces, Pichia etc.), insect cells (eg, S f cells), mammalian cells (Eg CHO, COS, BHK, HEK2 93, NI H3 T3 etc) etc.
上記の c DN Aクローニング及ぴ遺伝子組換え技術については、 S amb r o o kら (上記)、 Au s b e 1 ら (上記) などに記載されている。  The above-mentioned cDNA cloning and gene recombination techniques are described in, for example, Sammborok et al. (Above), Ausbe 1 et al. (Above) and the like.
このようにして得られた目的タンパク質は、 ゲルろ過、 イオン交換クロマトグ ラフィー、 ァフィ二ティクロマトグラフィー、 疎水性クロマトグラフィー、 等電 点電気泳動、 電気泳動、 限外ろ過、 塩析、 透析などを単独で又は組み合わせて精 製することができる。 The target protein thus obtained can be gel filtration, ion exchange chromatography, affinity chromatography, hydrophobic chromatography, isoelectric focusing, electrophoresis, ultrafiltration, salting out, dialysis etc. alone. Or in combination It can be made.
本発明の遺伝子によってコードされるタンパク質は、 配列番号 8 3〜 149に 示されるアミノ酸配列を含む (この配列はそれぞれ、 配列番号 1 5〜2 1、 23 The protein encoded by the gene of the present invention comprises the amino acid sequence shown in SEQ ID NO: 83 to 149 (this sequence corresponds to SEQ ID NO: 15 to 2 1, 23 respectively).
〜8 2のヌクレオチド配列によってコードされる。)。 また、 アミノ酸配列を記載 していないタンパク質の配列は、 G e n B a n k (米国)、 EMB L (欧州) など のデータベースにアクセスすることによって入手可能であるか、 あるいは、 それ らに対応するヌクレオチド配列を利用する c DNAクローニング及びシークェン シングによって目的タンパク質のアミノ酸配列を決定することができる。 Encoded by a nucleotide sequence of -82. ). In addition, the sequences of proteins whose amino acid sequences are not described can be obtained by accessing a database such as G en B ank (US), EMB L (Europe) or the corresponding nucleotide sequences. The amino acid sequence of the target protein can be determined by cDNA cloning and sequencing.
免疫学的方法では、 上記の手法で得られたタンパク質又はその断片を抗原とし て用いてゥサギ、 マウス、 ラット、 ゥマなどの哺乳動物を免疫し、 それらの抗原 に対する抗体を産生し、 精製する。  In the immunological method, mammals such as rabbits, mice, rats, and animals are immunized with the protein obtained by the above-described method or a fragment thereof as an antigen, and antibodies against the antigens are produced and purified. .
抗体は、 ポリクローナル抗体、 モノクローナル抗体、 抗ペプチド抗体、 それら の抗体断片などを含む。  The antibodies include polyclonal antibodies, monoclonal antibodies, anti-peptide antibodies, antibody fragments thereof and the like.
ポリクローナル抗体は、 前記動物を適量 (通常、 ^ gオーダー) の抗原で皮下 に免疫し、 さらに約 2〜 3週間後に追加免疫し、 初回免疫から約 3週間〜 2か月 後に採血し、抗血清から目的のポリクローナル抗体を含む I g G成分を硫安分画、 イオン交換クロマトグラフィーを使用して分離することによつて作製することが できる。このとき抗原に対する抗体の特異性を高めるために、得られた I g Gを、 目的タンパク質をセルロース又はァガロースなどの担体に結合して作製された力 ラムに結合させたのち、 高塩濃度のバッファーで溶出し、 透析や限外ろ過などの 方法で脱塩して、 特異的ポリクローナル抗体を得ることができる。 抗体価は、 通 常の免疫測定法、 例えば酵素免疫測定法 (E L I SA)、 放射性免疫測定法 (R I A)、 蛍光抗体法などによって測定することができる。  The polyclonal antibody is used to immunize the animal subcutaneously with an appropriate amount (usually, ^ g order) of antigen, followed by boosting after about 2 to 3 weeks, and collecting blood about 3 weeks to 2 months after the primary immunization, and antiserum. Can be prepared by separating the IgG component containing the desired polyclonal antibody from ammonium sulfate by ion exchange chromatography. At this time, in order to increase the specificity of the antibody for the antigen, the obtained Ig G is bound to a carrier prepared by binding the target protein to a carrier such as cellulose or agarose, and then a high salt buffer is prepared. And then desalted by a method such as dialysis or ultrafiltration to obtain a specific polyclonal antibody. The antibody titer can be measured by a conventional immunoassay, such as enzyme-linked immunosorbent assay (ELISA), radioimmunoassay (RIA), fluorescent antibody assay and the like.
モノクローナル抗体は、 例えば以下の一般的方法によって作製することができ る (例えば長宗秀明と寺田弘,単クローン抗体一調製とキャラクタリゼーション, 1 990,広川書店;佐渡義ー (200 1) 「ラットモノクローナル抗体作製の省 力化」 生化学 7 3 : 1 1 6 3— 1 1 6 7など)。  A monoclonal antibody can be prepared, for example, by the following general method (for example, Hideaki Nagamune and Hiroshi Terada, preparation and characterization of monoclonal antibody, 1 990, Hirokawa Shoten; Yoshi Sado (200 1) “Saving antibody production” Biochemistry 7 3: 1 1 6 3 1 1 6 7 etc.).
標的タンパク質又はその断片を、 ポリクローナル抗体の作製と同様にマウス又 はラット (例えば B a 1 b/cマウス) の皮下に投与し、 1〜4週間間隔で、 約 2〜4回追加免疫を行う。 抗体価がプラトーに達したとき、 抗原を静脈内または 腹腔内に注射し、 最終免疫とする。 2〜5日後、 抗体産生細胞 (例えば脾臓細胞 又はリンパ節細胞) を採取する。 次いで、 抗体産生細胞を骨髄腫細胞株 (好まし くは、 ヒポキサンチン · グァニン ·ホスホリボシル · トランスフェラーゼ (HG PRT) 欠損細胞株) に融合させてハイプリ ドーマ細胞を生成し、 HAT (ヒポ キサンチン、 アミノプテリン、 チミジン) 選択を行う。 細胞融合は、 血清を含ま ない DMEM、 R PM I - 1 640培地などの動物細胞培養用培地中で、 抗体産 生細胞と骨髄腫細胞株とを適当な割合で混合し、 ポリエチレンダリコールなどの 細胞融合促進剤の存在下で実施する。 目的の抗体かどうかの確認は、 上記の免疫 測定法によって行うことができる。 さらに、 ハイプリ ドーマの増殖のために、 マ ウスの腹腔内にハイプリ ドーマを投与し、 ハイプリ ドーマを増殖させたのち、 1 〜 2週間後に腹水を採取する。 抗体の精製は、 硫安分画、 イオン交換クロマトグ ラフィー、 ァフィ二ティクロマトグラフィー、 ゲノレク口マトグラフィ一などの方 法を適宜組み合わせて行うことができる。 The target protein or a fragment thereof is administered subcutaneously to mice or rats (eg, B a 1 b / c mice) as in the preparation of polyclonal antibodies, and at intervals of 1 to 4 weeks, approximately Perform 2-4 boosts. When the antibody titer reaches a plateau, the antigen is injected intravenously or intraperitoneally for final immunization. After 2 to 5 days, antibody-producing cells (eg, spleen cells or lymph node cells) are collected. Then, antibody-producing cells are fused to a myeloma cell line (preferably a hypoxanthine guanine phosphoribosyl transferase (HG PRT) deficient cell line) to generate hybridoma cells, and HAT (hypoxanthine, aminopterin, etc.) is generated. , Thymidine) selection. For cell fusion, antibody-producing cells and a myeloma cell line are mixed in an appropriate ratio in a medium for animal cell culture such as serum-free DMEM, R PM I- 1640 medium, polyethylene polyethylene glycol, etc. It is carried out in the presence of a cell fusion promoter. Confirmation of the target antibody can be performed by the above-mentioned immunoassay. Furthermore, for the growth of hybridomas, hybridomas are administered intraperitoneally to mice, and after hybridomas are allowed to grow, ascites fluid is collected 1 to 2 weeks later. Purification of the antibody can be carried out by appropriately combining methods such as ammonium sulfate fractionation, ion exchange chromatography, affinity chromatography, and generoch chromatography.
抗ぺプチド抗体は、 タンパク質の表面上のリニア一なぺプチドに対する抗体で あり、 免疫学的特異性を高めることができる。 そのようなペプチドは、 例えば K y t e -D o o l i t t l eらの親水性-疎水性領域の推定法、 E m i n i らによ るタンパク質分子上の特定べプチド部位の表面に位置する確率、 ポリべプチド鎖 の折れ曲がり程度、 例えば C h o u - F a s m a nらなどの αヘリッタス、 βシ ート、 ターンを表示するタンパク質の二次構造予測、 等を単独で又は組み合わせ て使用して推定しうる。 次いで、 推定されたペプチドは、 ペプチド合成機を用い て合成することができる。  An anti-peptide antibody is an antibody to a linear peptide on the surface of a protein, and can enhance immunological specificity. Such peptides may be used, for example, to estimate the hydrophilic-hydrophobic region of Kyte-D oolittle et al., Probability of being located on the surface of a specific peptide site on a protein molecule according to E mini et al., Polypeptide chain The degree of bending, for example, α-helitas such as Chou-Fasman et al., Β-sheet, secondary structure prediction of a protein indicating a turn, etc. can be estimated using alone or in combination. The deduced peptide can then be synthesized using a peptide synthesizer.
上記の抗体類を、 肺腺癌組織テストサンプル中の標的タンパク質又はその断片 の検出のために使用することができる。 多数の抗体をマイクロアレイ支持体上に 結合した抗体マイクロアレイを作製することによって、 或いは、 多数の抗体を Ρ VDF膜などのポリマー膜 (フィルター) 上にドットスポットするカ 又はマル チウエルプレートなどの固相の表面に抗体を吸着させることによって、 一度に多 数の標的タンパク質を検出又は定量することが可能になる。 また、 慣用の免疫学 的測定法、 例えば酵素免疫測定法 (EL I S A、 E I Α)、 蛍光抗体法、 放射性免 疫測定法 (R I A)、 発光免疫測定法、免疫比濁法、 ラテックス凝集反応、 ラテツ タス比濁法、 赤血球凝集反応、 粒子凝集反応またはウェスタンプロット法などに よって、 テストサンプル中の標的タンパク質又はその断片を検出又は定量するこ とができる。 The antibodies described above can be used for detection of target proteins or fragments thereof in lung adenocarcinoma tissue test samples. By preparing antibody microarrays, in which a large number of antibodies are bound on a microarray support, or by spotting a large number of antibodies on a polymer membrane (filter), such as a VDF membrane, or a solid phase, such as a multiwell plate. By adsorbing the antibody to the surface of the protein, it becomes possible to detect or quantify a large number of target proteins at one time. In addition, conventional immunological assays, such as enzyme-linked immunosorbent assay (EL ISA, EI Α), fluorescent antibody, radioactive immunity The target protein or its protein in the test sample by epilepsy assay (RIA), luminescence immunoassay, immunoturbidimetric assay, latex agglutination, latex turbidimetric assay, hemagglutination, particle agglutination, Western blot, etc. Fragments can be detected or quantified.
固相上で反応を行うときには、 固相支持体として、 ポリスチレン、 ポリカーボ ネート、 ポリエチレンなどのポリマーの膜、 マルチウエルプレート、 試験管、 試 験片 (テストストリップ)、 ラテックス、 磁性体粒子などが含まれる。 固定化は、 物理的吸着か或いは化学的に行うことができる。 化学的結合のためには、 例えば マレィル化試薬、 臭化シアンなどの試薬で固相を処理し、 タンパク質のアミノ基 などと反応する官能基を固相に導入することができる。  When the reaction is carried out on a solid phase, solid phase supports include membranes of polymers such as polystyrene, polycarbonate and polyethylene, multi-well plates, test tubes, test strips (test strips), latex, magnetic particles, etc. Be Immobilization can be physical adsorption or chemical. For chemical binding, for example, a solid phase can be treated with a reagent such as a maleylation reagent, cyanogen bromide or the like to introduce a functional group that reacts with an amino group or the like of a protein onto the solid phase.
標識の例は、 西洋ヮサビペルォキシダーゼ、 アルカリホスファターゼなどの酵 素、 フルォレセィン、 ローダミン、 それらの誘導体などの蛍光物質、 ルシフェラ ーゼ系、 ルミノール系などの発光物質、 3 2 P、 1 2 5 Iなどの放射性同位元素など が含まれる。 標識化は、 例えばダルタルアルデヒ ド法、 マレイミ ド法、 ピリジル ジスルフイ ド法、 クロラミン T法、 ボルトンハンター法などを含む。 Examples of labels include Western Wa rust pel O Kishida over peptidase, enzymes such as alkaline phosphatase, Furuoresin, rhodamine, a fluorescent substance, luciferase system, such as their derivatives, luminescent substances such as luminol, 3 2 P, 1 2 5 Radioactive isotopes such as I are included. Labeling includes, for example, the Daltal aldehyde method, the maleimide method, the pyridyl disulfide method, the chloramine T method, the Bolton hunter method and the like.
<術後再発予測用組成物 > <Composition for predicting postoperative recurrence>
本発明はまた、 肺腺癌患者において肺癌の外科切除後の肺腺癌の再発を予測す るための組成物であって、 該組成物が、 配列番号 1 8 2のいずれかのヌクレオ チド配列を含む 2以上から 8 2種、 好ましくは 5以上から 8 2種の異なる遺伝子 の発現を測定することを可能にする複数の核酸を含み、 該核酸が、  The present invention is also a composition for predicting recurrence of lung adenocarcinoma after surgical removal of lung cancer in lung adenocarcinoma patients, wherein the composition comprises the nucleotide sequence of any one of SEQ ID NO: 182. And a plurality of nucleic acids that make it possible to measure the expression of two or more, preferably two or more, of two different genes, including
( 1 ) 配列番号 1〜8 2に示されるヌクレオチド配列、 それに相補的なヌクレ ォチド配列、 或いはそれらのヌクレオチド配列中の連続する 1 5塩基から全塩基 数未満の部分配列を有する核酸、 及び  (1) Nucleotide sequences as shown in SEQ ID NOs: 1 to 2, nucleotide sequences complementary thereto, or nucleic acids having partial sequences of 15 bases to less than the total number of bases in their nucleotide sequences, and
( 2 ) 配列番号 1〜8 2に示されるヌクレオチド配列又はそれに相補的なヌク レオチド配列を含む核酸とハイブリダイズする核酸、 或いは該ハイブリダイズす る核酸の連続する 1 5塩基から全塩基数未満の部分配列を有する核酸、 からなる群から選択されることを特徴とする上記組成物を提供する。  (2) A nucleic acid that hybridizes to a nucleic acid containing the nucleotide sequence shown in SEQ ID NO: 1 to 8 or a nucleotide sequence complementary thereto, or alternatively, from 15 bases to less than the total number of bases of the hybridizing nucleic acid. The above composition is characterized in that it is selected from the group consisting of: a nucleic acid having a partial sequence.
本発明の組成物を構成する複数の核酸は、 該組成物が、 配列番号 1〜8 2のい ずれかのヌクレオチド配列を含む 2以上から 8 2種、 好ましくは 5以上から 8 2 種、より好ましくは 1 0以上から 8 2種、さらに好ましくは 3 0以上から 8 2種、 さらにより好ましくは 4 0以上から 8 2種の異なる遺伝子の発現を測定すること を可能にする限り、 上記 (1 ) 及び (2) に記載した核酸のいずれの組み合わせ であってもよい。 The plurality of nucleic acids constituting the composition of the present invention may be selected from 2 or more to 82, preferably 5 or more, of which the composition comprises any of the nucleotide sequences of SEQ ID NOS: 1-82. As long as it makes it possible to measure the expression of different genes, more preferably 10 or more to 82, more preferably 30 or more to 82, even more preferably 40 or more to 82 different genes. It may be any combination of the nucleic acids described in (1) and (2) above.
上記 (1 ) の核酸は、  The nucleic acid of (1) above is
(a ) 配列番号 1〜8 2に示されるヌクレオチド配列、  (a) The nucleotide sequences shown in SEQ ID NOs: 1-8,
( b ) 上記 ( a ) のヌクレオチド配列に相補的なヌクレオチド配列、 及び (c) 上記 (a) のヌクレオチド配列又は上記 (b) のヌクレオチド配列にお いて連続する 1 5塩基から全塩基数未満、 好ましくは 1 7塩基以上、 2 0塩基以 上、 3 0塩基以上、 5 0塩基以上、 7 0塩基以上、 1 0 0塩基以上、 1 5 0塩基 以上、 2 0 0塩基以上、 3 0 0塩基以上、 4 0 0塩基以上又は 5 0 0塩基以上か ら全塩基数未満の部分配列、  (b) A nucleotide sequence complementary to the nucleotide sequence of the above (a), and (c) 15 bases or less of the total number of bases continuous in the nucleotide sequence of the above (a) or the nucleotide sequence of the above (b) Preferably, 17 bases or more, 20 bases or more, 30 bases or more, 50 bases or more, 70 bases or more, 100 bases or more, 150 bases or more, 200 bases or more, 300 bases Partial sequence of the above, or more than 400 bases or more than 500 bases to less than the total number of bases,
を有する核酸である。 A nucleic acid having
上記 (2) の核酸は、 上記 (1 ) の (a ) 又は (b) のヌクレオチド配列とハ イブリダィズするヌクレオチド配列を有する核酸であるか、 あるいは、 その核酸 のヌクレオチド配列において連続する 1 5塩基から全塩基数未満、 好ましくは 1 7塩基以上、 2 0塩基以上、 3 0塩基以上、 5 0塩基以上、 7 0塩基以上、 1 0 0塩基以上、 1 5 0塩基以上、 2 0 0塩基以上、 3 0 0塩基以上、 4 0 0塩基以 上又は 5 0 0塩基以上から全塩基数未満の部分配列、 を有する核酸である。 好ま しくは、 このような核酸は、 上記 (1 ) の (a) 又は (b) のヌクレオチド配列 と 9 0 %以上、 好ましくは 9 5%以上、 より好ましくは 9 8以上、 最も好ましく は 9 9 %以上の同一性を有する配列の核酸、 又はその 1 5塩基から全塩基数未満 の断片である。  The nucleic acid of (2) above is a nucleic acid having a nucleotide sequence that hybridizes with the nucleotide sequence of (a) or (b) above, or alternatively, from 15 consecutive bases in the nucleotide sequence of the nucleic acid Less than the total number of bases, preferably 17 bases or more, 20 bases or more, 30 bases or more, 50 bases or more, 70 bases or more, 100 bases or more, 150 bases or more, 200 bases or more, It is a nucleic acid having a partial sequence of 300 bases or more, 400 bases or more, or 500 bases or more to less than the total number of bases. Preferably, such a nucleic acid is 90% or more, preferably 95% or more, more preferably 98 or more, most preferably 9 9 or more, with the nucleotide sequence of (a) or (b) in (1) above. It is a nucleic acid of a sequence having% identity or more, or a fragment of 15 bases to less than the total number of bases.
好ましい核酸は、 上記 (1 ) の核酸、 特に上記 (1 ) ( c) の核酸である。 本発明の組成物は、 核酸構成成分を単に混合した形態の混合物だけでなく、 キ ット、 マイクロアレイ又はプライマーセッ トの形態であってもよい。 むしろ、 こ のような後者の形態が好ましい。 ここで、 キットの場合、 上記核酸を個々に包装 するかあるいは複数の核酸の混合形態で包装することができ、キットにはさらに、 ハイプリダイゼーションのためのバッファ、検出用試薬 (酵素類など)、使用説明 書などを含ませることができる。マイクロアレイやプライマーセットについては、 上記の説明のとおりである。 Preferred nucleic acids are the nucleic acids of (1) above, in particular the nucleic acids of (1) (c) above. The compositions of the present invention may be in the form of kits, microarrays or primer sets, as well as mixtures in the form of a simple mixture of nucleic acid components. Rather, this latter form is preferred. Here, in the case of a kit, the above nucleic acids can be packaged individually or in the form of a mixture of multiple nucleic acids, and the kit further contains a buffer for hybridization, detection reagents (enzymes, etc.) , Instructions for use Can be included. The microarray and the primer set are as described above.
本発明の組成物は、 上記記載のとおり、 肺腺癌患者において肺癌の外科切除後 の肺腺癌の再発を予測するための方法に使用できる。 本発明の方法については、 上記の説明のとおりである。  The composition of the present invention can be used in a method for predicting recurrence of lung adenocarcinoma after surgical removal of lung cancer in lung adenocarcinoma patients as described above. The method of the present invention is as described above.
本発明はさらに、 肺腺癌患者において肺癌の外科切除後の肺腺癌の再発を予測 するための組成物であって、 該組成物が、 配列番号 1〜 8 2のいずれかのヌクレ ォチド配列を含む 2以上から 8 2種、 好ましくは 5以上から 8 2以下、 より好ま しくは 1 0以上、 さらに好ましくは 3 0以上、 さらにより好ましくは 4 0以上か ら 8 2以下の異なる遺伝子の発現を測定することを可能にする複数の抗体を含み、 該抗体が、 配列番号 1〜 8 2に示されるヌクレオチド配列によってコードされる タンパク質又は該タンパク質のァミノ酸配列の連続する少なくとも 8ァミノ酸残 基からなるポリペプチドと免疫学的に反応する抗体、 及ぴ該抗体の断片、 からな る群から選択されることを特徴とする、 上記組成物と提供する。  The present invention is further directed to a composition for predicting recurrence of lung adenocarcinoma after surgical removal of lung cancer in lung adenocarcinoma patients, wherein the composition comprises the nucleotide sequence of any one of SEQ ID NOS: 1-22. 2 or more, preferably 5 or more to 82, more preferably 10 or more, still more preferably 30 or more, still more preferably 40 or more to 82 or less different genes including A plurality of antibodies that make it possible to measure the protein, wherein the antibody is a protein encoded by the nucleotide sequence shown in SEQ ID NOs: 1 to 2 or a contiguous at least 8 amino acid residue of the amino acid sequence of the protein The above composition is provided with an antibody immunologically reactive with the polypeptide consisting of: and a fragment of the antibody, characterized in that it is selected from the group consisting of:
抗体の作製については、 上記の説明のとおりである。  The preparation of antibodies is as described above.
抗体は、 上記の方法で作製されるようなポリクローナル抗体、 モノクローナル 抗体、 抗ペプチド抗体などであるが、 それらに限定されないものとする。 抗体の 種類は、 いずれのタイプ、 クラス、 サブクラスでもよく、例えば I g G、 I g M、 I g E、 I g D、 I g Aなどを含む。 また、 抗体の断片は、 F a b、 ( F a b ' ) 2、 F v、 s c F vなどを含む。 The antibodies include, but are not limited to, polyclonal antibodies, monoclonal antibodies, anti-peptide antibodies, etc. as produced by the above method. The type of antibody may be any type, class, or subclass, including, for example, IgG, IgM, IgE, IgD, IgA, and the like. Furthermore, antibody fragments include Fab, (Fab ') 2 , Fv, scFv and the like.
本発明の組成物は、 抗体構成成分を単に混合した形態の混合物だけでなく、 キ ット、 抗体結合支持体又は抗体マイクロアレイの形態であってもよい。 固相支持 体として、ポリスチレン、ポリカーボネート、ポリエチレンなどのポリマーの膜、 マルチウエルプレート、 試験管、 試験片 (テストストリップ)、 ラテックス、 磁性 体粒子などが含まれる。アレイの材質として、ポリマー、ガラスなどが含まれる。 本発明の抗体含有組成物は、 上記記載のとおり、 肺腺癌患者において肺癌の外 科切除後の肺腺癌の再発を予測するための方法に使用できる。'本発明の方法につ いては、 免疫学的方法であり、 上記の説明のとおりである。  The composition of the present invention may be in the form of a kit, an antibody binding support or an antibody microarray, as well as a mixture of the form in which the antibody components are simply mixed. Solid phase supports include membranes of polymers such as polystyrene, polycarbonate and polyethylene, multiwell plates, test tubes, test strips (test strips), latex, magnetic particles and the like. Materials of the array include polymers, glass and the like. As described above, the antibody-containing composition of the present invention can be used in a method for predicting the recurrence of lung adenocarcinoma after surgical resection of lung cancer in lung adenocarcinoma patients. 'The method of the present invention is an immunological method, as described above.
本発明を以下の実施例によってさらに具体的に説明するが、 本発明はそれらの 実施例によって制限されないものとする。 実施例 The invention is further illustrated by the following examples, which illustrate the invention. It shall not be restricted by the example. Example
材料及び方法 Materials and methods
患者 Patient
1 9 9 5年 1 2月〜 1 999年 8月の間に治癒の可能性のある切除手術を受け た患者の 8 7肺腺癌事例を、 愛知県がんセンター及び名古屋大学の倫理委員会の 承認と患者の同意書を得て愛知県がんセンター (名古屋巿) にて取得した。 どの 事例も補助化学療法は受けなかった。 最終フォローァップの時点で生存していた 患者のフォローアップ期間の中央値は 90ヶ月であった (範囲: 64〜 1 08ケ 月)。 腫瘍検体はすべて OCT化合物 (サクラ精機株式会社、 日本国、 東京) に埋 め込み、 -80°Cで保存した。 患者人数の 3分の 2 (n = 60) をランダムに訓練 セットに割り当て、 残りの 3分の 1 ( n = 27 ) を評価セット I とした。 また、 同様に 2002年 2月から 2004年 1 2月の間で切除手術を受けた患者の肺腺 癌サンプルのうちステージ I と診断された 30サンプルを評価セット I I として 用いた (表 2)。  1 9 9 5 1 1 February 1 999 8 7 cases of lung adenocarcinoma of the patient who underwent resection surgery with possibility of healing, and ethics committee of Aichi Cancer Center and Nagoya University The patient's consent was obtained from the Aichi Cancer Center (Nagoya Sakai). None of the cases received adjuvant chemotherapy. The median follow-up period for patients who survived at the final follow-up was 90 months (range: 64-1 08 months). All tumor specimens were embedded in OCT compound (Sakura Seiki Co., Ltd., Tokyo, Japan) and stored at -80 ° C. Two-thirds of the patients (n = 60) were randomly assigned to the training set, and the remaining one-third (n = 27) was considered evaluation set I. Similarly, among the lung adenocarcinoma samples of patients who underwent surgery between February 2002 and February 2004, 30 samples diagnosed as Stage I were used as evaluation set I I (Table 2).
表 2 Table 2
Figure imgf000031_0001
Figure imgf000031_0001
RNAの単離 RNA isolation
腫瘍検体の凍結組織を病理学者 (Y. Y.) の指導の下で、 ギムザ染色した 1 0 枚毎の切片を用いてダロス顕微解剖に供した。トータル RNAを RNe a s yキッ ト (Q i a g e n、 カリフォルニァ州バレンシア) を用いて抽出し、 DN a s e Frozen tissues of the tumor specimens were subjected to DAROS microdissection under the guidance of a pathologist (Y. Y.) using Giemsa-stained sections. The total RNA is extracted using the RNae ay kit (Qia g e n, Valencia, Calif.), And the DN as e
Iで処理した。 RNA量は N a n o D r o p (R)ND— 1 000UV— V i s分光 光度計 (Na n oD r o p T e c h n o l o g i e s、 デラウエァ州ウイノレミ ントン) を用いて測定し、 RNAの性質は Ag i 1 e n t 21 00パイオアナラ ィザーを用いて観察し RNA完全数値 (R I N) として示した (A g i l e n t T e c h n o l o g i e s、 カリフォルニァ州パロアルト)。全ての主要な肺癌の 組織型を示す 20の肺細胞株を用いて、 共通標準 RNAを大量に用意した。 Treated with I The amount of RNA is Nano D rop (R) ND — 1 000 UV — V s Spectrophotometer (Nano D rop T cnnologies, Winnore De La Wa The properties of the RNA were observed using an Ag i ent 2 1 00 Pio analyzer and shown as complete RNA numbers (RIN) (Agilent Technologies, Palo Alto, Calif.). A large amount of common standard RNA was prepared using 20 lung cell lines showing all major lung cancer histotypes.
EGFR、 p 5 3及びKー r a sの発現プロファイル及び突然変異状態の取得 5 00 n gのトータル RNAから、 モロニ一マウス白血病ウィルス逆転写酵素EGFR, from p 5 3 and K over r the as expression profiles and mutation status of acquiring 5 00 ng of total RNA, Moroni one murine leukemia virus reverse transcriptase
(Ag i l e n t T e c h n o l o g i e s、 カリフオノレニァ州パロアノレ ト) 及び T 7プロモーターを含むポリ dTプライマーを用いて、 二本鎖 c DNAを合 成し 。 L o w R N A B l U o e s c e n x. JU ι n 6 a r Ά. m p 1 ι f i c a t i o nキット (Ag i l e n t T e c h n o l o g i e s) を用レヽ て c RNAを生成し、 C y 3又は C y 5により標識した。 Cy 5—サンプル c R NAと C y 3—共通標準 c RNAを 4 1, 000個の異なるプローブを有する W h o l e Huma n G e n ome o l i g o D N Aマイクロアレイキッ ト (G41 1 2 F、 A g i l e n t T e c h n o l o g i e s) にノヽィプリダ ィズさせた。 ハイブリダィゼーシヨン及び洗浄の後、 Ag i 1 e n t DNAマイ クロアレイスキャナー (G250 5 B、 A g i l e n t T e c h n o l o g i e s) を用いてスライ ドをスキャンした。 発現データは、 Ag i l e n t F e a t u r e E x t r a c t i o nソフトウェア 9. 5. 1 (Ag i l e n t T e c h n o l o g i e s ) を用いて取得した。 EGFR、 p 5 3及び K— r a s の突然変異状態は同じ患者のセッ トに関して既に報告されている (T a k e u c h i ら、 J C〇、 200 6)。 Du k eデータセッ トは、 受託番号 GS E 3 59 3 "d e n e E x p r e s s i o n Omn i b u s h t t p : / / www. n c b i . n l m. n i h. g o v/g e o ) よりダウンロードし、 生存期間Double-stranded cDNA was synthesized using poly dT primers containing (Agilent T e cho n o i g i s, Palo Anoret, Calif.) And a T 7 promoter. A pair of L o w R N A B o U o s e x n. JU ι n 6 a r Ά. M p 1 ι f i c i a t i n kit (Agilent T e c o n o l i o i s) was used to generate cRNA and labeled with C y 3 or C y 5. Cy 5-sample c RNA and C y 3-common standard cDNA with 4 thousand different probes Whole Human G ome oligo DNA microarray kit (G41 1 2 F, Agilent Technology) I was given a noize idea. After hybridisation and washing, the slides were scanned using an Agi l ent DNA microarray scanner (G250 5 B, Ag l l t t e n o g i o s). Expression data were acquired using Ag ile t F e t r E r E ソ フ ト ウ ェ ア E E E t ソ フ ト ウ ェ ア t ソ フ ト ウ ェ ア ソ フ ト ウ ェ ア ソ フ ト ウ ェ ア ソ フ ト ウ ェ ア 9. software 9.5. 1 (A g i l t t c t c n n n i i i i s s). The mutational status of EGFR, p53 and K-ra as has already been reported for the same set of patients (Takyu et al., JC〇, 2006). Duke data set is downloaded from Accession No. GS E 359 3 "d ene e x p s s s s o om om n i b u s h t t p: / / www. N c b i. N l m.
(月)、 状況、 細胞型などの臨床情報に関しては D u k e I n s t i t u t e f o r - e n o m e S c i e n c e s a n d P o l i c y (h t t p : / / www. g e n ome , d u k e , e d u /) 力、らダウンロードした。 45の腺癌サンプルのうち、 臨床情報に関する注釈付きの 3 9腺癌サンプルを本 分析に用いた。 (Mon.) For clinical information such as the situation and cell type, D D u I I I I s s t t f-------S S S S S c h h h h h h h h h h h h h www www www www www www www www. Of the 45 adenocarcinoma samples, 3 9 adenocarcinoma samples annotated with clinical information were used for this analysis.
統計的方法 まず、 少なくとも 90%のサンプルでバックグラウンドを超える発現量のプロ ーブを選択した。 このフィルタリング基準を通過したシグナルを用いて再発関連 シグネチヤを同定するために、 教師付きクラス分類の確立された技術である、 重 み付き投票アルゴリズム (各加重値は SN比として計算され、 既に詳細に説明し た方法 (Y a n a g i s a wa b J . N a t l . C a n c e r I n s t . 9 9 : 85 8 - 6 7, 200 7) を用いた。 簡単に言うと、 訓練データセットに 特異的な過学習をすることなく、 一般的に使用可能な分類器を取得するために、 本発明者らは、 無再発シグネチヤを同定するためのプローブシグナルを選択する 際に、 1 00のランダム相互作用を行う 1 0— f o 1 dクロスバリデーション方 法を用いた(AM Mo l i n a r oら, B i o i n f o r ma t i c s 2 1 : 3 30 1 - 7, 2005)。 そこで、 分類器構築の全工程を、 一定数の予測され る遺伝子を有する分類器ごとに 1 000回繰り返す。 K a p 1 a n- Me i e r生 存曲線及び C o x比例ハザードモデル分析 ( S t a t aパージヨン 7. 0 ) を用 いて、 27名の患者の評価用セット中の得られた再発関連シグネチヤと全生存及 び無再発生存との関係を分析した。 死亡と再発のハザード比をそれぞれ示す。 多 変数 C o Xモデルに提示された P値は同様の比試験で取得した。 全ての統計的検 定を両側検定とした。 C l u s t e rプログラム ('MB E i s e nら, P r o c . Na t l . Ac a d. S c i . USA 9 5 : 1 48 63— 8, 1 9 98) を用いて、 遺伝子と症例との間の平均連関階層的クラスタリングを行つ た。 このとき、 表示は、 T r e e V i e wプログラムを使用した (MB E i s e nら, 上記)。 Statistical method First, at least 90% of the samples were selected for expression levels above background. Weighted voting algorithm, which is an established technique of supervised classification, to identify recurrence related signatures using signals that have passed this filtering criterion (each weighted value is calculated as the signal-to-noise ratio and is already detailed The method described (Yanagisa wa b J. N atl. C incer. I nst. 9 9: 85 8-6 7, 200 7) was used, in a nutshell, overtraining specific to the training data set. In order to obtain a classifier that can generally be used without doing, we perform 100 100 random interactions in selecting a probe signal to identify a recurrence free signal. — The fo 1 d cross-validation method was used (AM Molinaro et al., Bioinformatics 2 1: 3 30 1-7, 2005) Therefore, the whole process of classifier construction is a fixed number of predicted genes. Repeat 1 000 times for each classifier with K ap 1 an -Obtained relapse-associated signatures, overall survival and relapse-free survival in a set for evaluation of 27 patients, using Meier's survival curve and Cox proportional hazards model analysis (Stata purgeon 7.0) The hazard ratios of death and relapse are analyzed respectively The P values presented in the multivariate Co x model were obtained in a similar ratio test All statistical tests were two-tailed C Average linkage hierarchy between genes and cases using the luster program ('MB E isen et al., Pr. N. Ac. d. Sci. USA 95: 1 48 63-8, 1 9 98) At this time, the display used the program Trie V iew (MB E isen et al., Above).
結果 Result
再発関連シグネチヤの同定 Identification of relapse-associated signatures
本発明者らは、 訓練セット /評価セット I間の情報漏洩なく外科的治療を受け た肺腺癌患者の再発と死亡に関する遺伝子発現シグネチヤを構築し検証した (図 The present inventors constructed and verified a gene expression signature for recurrence and death of lung adenocarcinoma patients surgically treated without information leakage between training set / evaluation set I (Figure
1)。 まず、 8 7事例の発現プロファイルデータを 60の訓練セットと 2 7の評価 セット Iに分類した。 次に、 60の訓練セットのうち、 再発により、 外科的切除 後 5年以内に死亡した 2 1人の患者が腫瘍中に一般的な高リスクシグネチヤを有 しているのに対し、 全フォローアップ期間中再発の兆候を示すことなく 5年以上 生存した 28人の患者は前述のシグネチヤを腫瘍中に有さなかったと仮定した。 訓練セット中残る 1 1名の患者は、 腫瘍の悪性度が不明確なことから、 再発関連 シグネチヤを同定する工程から除外された。 除外された患者のうち、 5名はフォ ローァップ期間中なんらかの再発の兆候を示しつつ 5年以上生存し、 5名は 5年 以上生存した後に癌により死亡し、 1名は再発の証拠はないが死亡した。 1). First, the expression profile data of 87 cases were classified into 60 training sets and 27 evaluation sets I. Second, out of the 60 training sets, 21 patients who died within 5 years of surgical resection have general high-risk signatures in their tumors due to recurrence, whereas all follow-up 5 years or more without showing signs of recurrence during the up period It was hypothesized that the 28 patients who survived did not have any of the aforementioned signs in the tumor. One remaining patient in the training set was excluded from the process of identifying recurrence-related signatures because of the unclear grade of the tumor. Of the excluded patients, 5 survive for more than 5 years with some signs of recurrence during follow-up, 5 survive for 5 or more years and die from cancer, and 1 has no evidence of recurrence. I died.
全ゲノムマイクロアレイ (A g i 1 e n t社製; Wh o 1 e Huma n G e n ome ( 4 X 44 K) O l i g o M i c r o a r r a y K i t ; 型 番 G 4 1 1 2 F) 上の 4 1, 000個のプローブのうち、 23, 828個のプロ ープが情報伝達的プローブを選択する最初のフィルタリング基準を通過し S N計 測基準に基づいて分類され、 再発により死亡した患者と手術により治癒した患者 を識別する最良の再発関連シグネチヤを同定するのに用いられた。 増加する数の 予測プローブを適用した各モデルに関する学習エラーは、 1 0_ f o l dクロス バリデーションにより計算し、 計算は新しくランダムに分けられたデータセット を用いて 1 00回繰り返した。 最大 200個の予測プローブからなる 1, 0 00 個の独立したセットは、 再発関連シグネチヤを用いた分類器を構築するために選 択された。 その結果、 8 2個の予測プローブの使用により最小学習エラーが発生 することがわかり (図 2 A)、各 82個の予測プローブからなる独立した 1 , 00 Total genome microarray (Agi 1 ent; Who 1 e Humen G en ome (4 x 44 K) O ligo M icroarray Kit it; No. G 4 1 1 2 F) 4 thousand pieces Of the probes, 23, 828 probes passed the first filtering criteria to select informative probes and were classified based on SN metrics to distinguish between patients who died from recurrence and those who were cured by surgery. Were used to identify the best relapse-associated signature. The training error for each model to which increasing numbers of prediction probes were applied was calculated by 10_f o d cross validation, and the calculation was repeated 1000 times with the new randomly divided data set. A set of 1000 independent sets of up to 200 predicted probes was selected to construct a classifier using recurrence related signatures. As a result, it can be seen that the use of 82 prediction probes causes a minimum learning error (Fig. 2A), and the independent 1, 00 consisting of 82 prediction probes.
0個のセット間で最も高頻度に共有されている 8 2個のプローブが再発関連シグ ネチヤとして同定された (以下 「RRS— 8 2」 と称する。 上記表 1参照)。 RRThe 82 most frequently shared probes among the 0 sets were identified as recurrence related signatures (hereinafter referred to as "RRS-82". See Table 1 above). RR
S - 82シグネチヤは、 全ステージ又はステージ Iを考慮した際に極めて予後が 不良な患者群を識別することができるように思われる (無再発生存に関しては図The S-82 signature seems to be able to identify patients with a very poor prognosis when considering all stages or stage I (see figure for recurrence free survival).
2 B及び 2 C、 全生存に関しては図 7を参照)。 2 B and 2 C, see Figure 7 for overall survival).
RR S - 8 2と様々な遗伝的変化の関係と比較  Comparison and comparison of RR S-82 and various genetic changes
肺癌は、 遺伝的変化を有する患者の臨床的性質に影響を与えるかもしれない 様々な遺伝的変化を隠匿することが知られている。 そこで、 本発明者らは RRS 一 82と EGFR、K一 r a s又は p 5 3遺伝子変異の存在との関連を分析した。 しかしながら、 それらの間に統計的に有意な関連は発見されなかった。 更に、 そ の遺伝的変化の予後的有意性も同じ患者のサンプルセットを用いて分析し、 それ により RR S— 82を用いる予後予測分類器を構築した。 EGFR変異の存在と 術後予後間の関連は観察されなかった (図 3A)。 K一 r a s変異 (図 3 B) 又は P 53変異 (図 3 C) を有する患者と有さない患者間に、 全生存に関する統計的 有意差はなかった。 Lung cancer is known to conceal various genetic changes that may affect the clinical nature of patients with hereditary changes. Therefore, we analyzed the association of RRS-82 with the presence of EGFR, K-ras or p53 gene mutations. However, no statistically significant association was found between them. Furthermore, the prognostic significance of the genetic change was also analyzed using the same patient sample set, thereby constructing a prognostic classifier using RR S-82. With the presence of EGFR mutations No association between postoperative prognosis was observed (Figure 3A). There was no statistically significant difference in overall survival between patients with and without the K-ras mutation (Figure 3B) or the P53 mutation (Figure 3C).
評価セットを用いた RRS— 82の検証 Verification of RRS-82 using evaluation set
RRS— 82の口バスト性を評価するために、 肺腺癌 2 7サンプルの独立した 評価セット Iを用いて RRS— 8 2の識別能力を分析した。 評価セット Iを用い て得られた結果は、 RRS— 82が再発及び死亡の高リスク患者と低リスク患者 を識別できることを示した。 無再発生存は 2群間で有意に異なり、 高リスク群の 8名の患者の無再発生存期間中央値が 29 2日間なのに対し、 低リスク群の 1 8 名の患者では 1 08ヶ月間であった (Pく 0. 0003、 図 4A)。 高リスク群及 び低リスク群中の無再発患者の割合は 2年の時点でそれぞれ 38%、 78%だつ た。 注目すべきは、 RRS— 82の高リスクシグネチヤを示す 8名の患者全てが 5年以内のフォローアップ期間中に再発を経験したのに対して、 RRS— 8 2の 低リスクシグネチヤを示す患者の 6 7%が術後 5年後に再発の兆候を示していな かった。 高リスク群の患者のうち、 外科的切除後の全生存率は、 低リスク群患者 の生存率に比して有意に低かった (P = 0. 026、 図 4 B)。 多変量 C o X比例 ハザードモデルにおいて、 RRS— 82は無再発生存 (P = 0. 03) 及び全体的 生存 (P = 0. 03) の両方を予測する独立した有意な予後的因子であることが 判った。 また、 評価セット I と I Iを加えたときの多変量 C 0 X比例ハザードモ デルにおいても、 RRS— 8 2は無再発生存 (P< 0. 001) 及び全体的生存 (P= 0. 005) の両方を予測する独立した有意な予後的因子であることが判 つた (表 3)。  In order to evaluate the buccal properties of RRS-82, the discrimination ability of RRS-82 was analyzed using an independent evaluation set I of lung adenocarcinoma 27 samples. Results obtained using Evaluation Set I indicated that RRS-82 can distinguish high-risk and low-risk patients with relapse and death. Recurrence-free survival is significantly different between the two groups, with a median recurrence-free survival of 29 patients in the high-risk group of 29 days compared with 108 months in the low-risk group of 18 patients. (P. 0. 0003, Fig. 4A). The proportion of recurrence-free patients in the high-risk and low-risk groups was 38% and 78% at two years, respectively. Of note, all eight patients with RRS-82 high risk signs have relapsed during the five-year follow-up period, while RRS-82 shows low risk signs. Sixty-seven percent of the patients showed no signs of recurrence 5 years after surgery. Among patients in the high-risk group, overall survival after surgical resection was significantly lower than those in patients in the low-risk group (P = 0.226, Figure 4B). In a multivariate Co X proportional hazards model, RRS—82 is an independent and significant prognostic factor that predicts both relapse-free survival (P = 0. 03) and overall survival (P = 0. 03) I understand. In addition, also in the multivariate C 0 X proportional hazards model when evaluation sets I and II are added, RRS-8 2 has no recurrence (P <0. 001) and overall survival (P = 0. 005). It was found to be an independent significant prognostic factor that predicts both (Table 3).
表 3 多変量 COX回帰分析 Table 3 Multivariate COX regression analysis
評価セット I (n=27) 評価セット I+II (n=57)  Evaluation Set I (n = 27) Evaluation Set I + II (n = 57)
不良/良 ハザード比 95%CI* P ハザード比 95%Gf P Bad / Good Hazard Ratio 95% CI * P Hazard Ratio 95% Gf P
>61 /<61 1.60 0.44-4.28 0.594 0.91 0.41 -2.02 0.817 性ス年ス全性 ^無年 男性/女性 1.30 0.42-4.03 0.651 1.19 0.54-2.60 0.668 ^テテ齢别再齢别生 ΙΙ-ΙΠ/Ι 1.92 0.64-5.77 0.246 2.00 0.84— 4.72 0.1 15 † ^存、 高リスク/低リスク 6.12 1.87-20.1 0.003 4.92 2.17-1 1.2 く 0.001 存 > 61 / <61 1.60 0.44-4.28 0.594 0.91 -2.02 0.817 Sex Sity ^ Annual Male / Female 1.30 0.42-4.03 0.651 1.19 0.54-2.60 0.668 ^ Tete Age Regained Age Renewal Growth--/ / 1.92 0.64-5.77 0.246 2.00 0.84-4.72 0.1 15 † ^, high risk / low risk 6.12 1.87-20.1 0.003 4.92 2.17-1 1.2 0.001 0.001
>61 /<61 1.84 0.54-6.23 0.329 1.21 0.50-2.91 0.668 男性/女性 1.31 0.40-4.31 0.653 1.33 0.55-3.19 0.526 > 61 / <61 1.84 0.54-6.23 0.329 1.21 0.50-2.91 0.668 male / female 1.31 0.40-4.31 0.653 1.33 0.55-3.19 0.526
Π-ΙΠ/Ι 1.72 0.52-5.65 0.370 2.15 0.84—5.47 0.106 リスク/低リスク 3.79 1.14-12.6 0.030 3.60 1.48-8.77 0.005Π-ΙΠ / Ι 1.72 0.52-5.65 0.370 2.15 0.84-5.47 0.106 Risk / low risk 3.79 1.14-12.6 0.030 1.60 1.48-8.77 0.005
, * 95%CI : 95%信頼区間 , * 95% CI: 95% confidence interval
ステージ I患者における RR S - 8 2の有用性 Usefulness of RR S-82 in stage I patients
本発明者らは、 早期またはより進行した疾病を持つ腺癌事例のサブグループの RR S— 8 2の識別力を、 評価セット I中ステージ Iの 1 6サンプルを用いて更 に評価した。 RR S— 82に基づいて高リスクと予測されたステージ I患者は全 員 5年以内に再発を経験し、 フォローアップ期間中に死亡した (無再発生存につ いては図 4 C (P= 0. 0008)、 全生存については図 4D (P= 0. 043) に示す。 両件とも対数順位検定による)。 また、 すべてステージ Iからなる評価セ ット I Iの 30サンプルを用いても、 統計的有意であることが確認された (図 4 E、 4 F)。 さらに、評価セット Iのステージ Iの 1 6サンプルと評価セッ ト I I の 30サンプルを合わせた 46サンプルの解析においても、 RR S— 8 2の識別 力は統計的有意であることが確認された (図 4G、 4H)0 We further evaluated the discrimination of RR S- 82 in the subgroup of adenocarcinoma cases with early or more advanced disease using 16 samples of Stage I in Evaluation Set I. Stage I patients predicted to be at high risk based on RR S-82 experienced relapses within 5 years, and died during follow-up (see Figure 4 C (P = 0 for recurrence free survival). 0008), Overall survival is shown in Figure 4D (P = 0. 043) Both cases by log rank test). In addition, using 30 samples of evaluation set II, which consisted of all stage I, was confirmed to be statistically significant (Fig. 4 E, 4 F). Furthermore, in the analysis of 46 samples in which 16 samples of evaluation set I and 16 samples of evaluation stage I were combined with 30 samples of evaluation set II, the discrimination power of RR S- 82 was confirmed to be statistically significant ( Figure 4G, 4H) 0
ステージ I I〜 I I I患者のうち、 無再発及び全生存は、 高リスクシグネチヤ を有する患者と比べて低リスク RR S— 8 2シグネチヤを有する患者の場合に良 好となる傾向があつたが統計的に有意ではなかった (図 8 A及び 8 B)。  Of the stage II-III patients, recurrence-free and overall survival tended to be better for patients with low risk RR S-82 signature compared to those with high risk signaling. Was not significant (Figures 8A and 8B).
本発明者らは、 別の側面からも RR S— 82と TNM診断 (T :原発腫瘍の拡 がり ; N:所属リンパ節転移の有無と拡がり ; M:遠隔転移の有無) (例えば肺癌 · 食道癌,乳癌,取扱い規約 (抜粋) 金原出版) の関係を調査した。 低リスク群の 患者のうち、 無再発生存の K a p 1 a n— Me i e r曲線 (図 5 A) 及び全生存 の Ka p 1 a n— Me i e r曲線 (図 9 A) が共に、 病理学的な疾病のステージ と適度な関係を示す傾向があった (無再発生存に関しては P = 0. 1 5、 全生存 に関しては P= 0. 1 8)。 一方、 高リスク群の患者では、 無再発生存 (図 5 B) 及び全生存曲線 (図 9 B) が共に、 病理学的な疾病のステージとは無関係であつ た (無再発生存に関しては P = 0. 7 1、 全生存に関しては P = 0. 8 7)。 本発明の上記テストの結果、 訓練セットと評価セット Iそれぞれにおける髙リ スク R R S— 8 2シグネチヤと判定した症例の 8 6%、 1 00%に再発が認めら れた。 これは、 Du k eら (DG B e e r, N a t . Me d. 8 : 8 1 6 -2 From another aspect, the present inventors have also diagnosed RR S-82 and TNM (T: spread of primary tumor; N: presence or absence of regional lymph node metastasis; M: presence or absence of distant metastasis) (eg lung cancer · esophagus) We investigated the relationship between cancer, breast cancer, and handling regulations (excerpt) Kinbara Publishing. Among patients in the low-risk group, the K ap 1 an-Me ier curve for recurrence-free survival (Fig. 5 A) and the K ap 1 an-Me ier curve for overall survival (Fig. 9 A) are both pathological diseases. There was a tendency to show a moderate relationship with the stage of (P = 0.15 for recurrence-free survival, P = 0.18 for overall survival). On the other hand, in patients in the high-risk group, recurrence-free survival (Fig. 5B) and overall survival curve (Fig. 9B) were both unrelated to the stage of the pathological disease (P = for recurrence-free survival) 0. 7 1, P = 0. 8 7 for overall survival. As a result of the above-described test of the present invention, relapses were observed in 86% and 100% of the cases judged as risk R RS-2 in the training set and evaluation set I respectively. This is described by Duke et al. (DG B e er, N a t. Med. 8: 8 16-2
4, 2002) が報告した ACOSOG及び CALGB有効性評価データセット のそれぞれの 6 9%、 79%で再発を高リスク me t a g e n eシグネチヤが予 測した結果に比べると、 格段に判定の確度 (又は精度) .が向上していることが分 かる。 4, 2002) report high risk of recurrence in 69% and 79% of the ACOSOG and CALGB efficacy assessment data sets, respectively. It can be seen that the accuracy (or precision) of the judgment is significantly improved compared to the measured results.
独立したデータセットを用いた RRS— 8 2の一般適用性の確認 Checking the General Applicability of RRS-2 Using Independent Data Sets
肺腺癌の生存可能性を予測する際の RRS— 8 2のロバスト性は、 3 9サンプ ルの肺腺癌に関する他の完全に異なるデータセットと Du k e大学の遺伝子発現 データセットを用いて更に検証した。 A g i 1 e n tプラットフォーム上の RR S— 8 2中 46個の遺伝子のみが比較的新しいバージョンの A f f y m e t r i xプラッ 1、フォームの D u k e大学データセットプローブに対応するので(表 4 )、 RRS— 8 2を用いた分類器を直接適用することは不可能であった。 そこで、 教 師無しの階層クラスタリングにより 46個の対応する遺伝子の発現プロファイル に基づき分析した。 29サンプルの腺癌が、 有意に異なる術後生存可能性を示す (P = 0. 028、 図 6 B) 明らかに 2つの違うサブセットにクラスター分類さ れた (図 6 A)。 また、 M i c h i g a n大学の遺伝子発現データセットを用いて RRS-8 2と重複する 3 1遺伝子を抽出し、 予測モデルの構築を行った (図 6 C)。そのモデノレを用いて、 Memo r i a l S l o a n-K e t t e r i n g がんセンターの遺伝子発現データ 1 04サンプルを解析したところ、 このモデル により判別された高リスク群と低リスク群には、 無再発生存に関して統計学的に 有意な違いを認めた。 (P= 0. 0003) (図 6 D)。 これらの結果により、 RR S— 82に含まれる遺伝子は、 再発リスク評価に関連する汎用性 (一般適用性) を有する事が示された。  The robustness of RRS-2 in predicting the viability of lung adenocarcinoma is further evaluated using other completely different data sets for 39 samples of lung adenocarcinoma and the gene expression dataset from Duke University. Verified. As only 46 genes out of RR S-82 on Agi 1 ent platform correspond to newer version of Affymetrix platform 1, form Duke University dataset probe (Table 4), RRS- 82 It was not possible to apply the classifier directly using. Therefore, we analyzed based on the expression profiles of 46 corresponding genes by hierarchical clustering without teacher. Twenty-nine samples of adenocarcinomas showed significantly different post-operative viability (P = 0. 028, Figure 6 B) Clearly clustered into two different subsets (Figure 6 A). In addition, 31 genes overlapping with RRS-8 2 were extracted using the gene expression data set of Michigan University, and a prediction model was constructed (Fig. 6C). The gene expression data of Memorial S loo n K ettering Cancer Center 1 04 samples were analyzed using the modelle, and the high risk group and low risk group identified by this model were statistically related to recurrence free survival. Significant differences were observed. (P = 0. 0003) (Figure 6 D). These results indicated that the genes contained in RR S-82 have generality (general applicability) related to risk assessment for recurrence.
表 4 Table 4
-LZ- -LZ-
Figure imgf000039_0001
Figure imgf000039_0001
ZS6 L0/800Zdr/13d 01 ^蘭 600Z OAV
Figure imgf000040_0001
ZS6 L0 / 800 Zdr / 13d 01 ^ orchid 600Z OAV
Figure imgf000040_0001
産業上の利用可能性 Industrial applicability
本発明の方法により、 肺腺癌患者の術後再発の可能性を極めて高い確度で予測 することができる。 この方法は、 ステージ Iの患者の場合であっても高い確度の 予測を可能にする。 これによつて、 再発のリスクが高い患者に対して生存率を改 善するための治療計画を、 術後早い段階で、 立てることができるようになる。 本発明により、 肺腺癌患者において腺癌の術後再発を予測することが可能とな るため、 術後の患者に適した治療計画を立てることができる。 このように、 本発 明は、 肺腺癌の治療のために医療産業に寄与することが可能である。 According to the method of the present invention, the possibility of postoperative recurrence of lung adenocarcinoma patients can be predicted with extremely high accuracy. This method allows prediction with high accuracy even in the case of stage I patients. This will make it possible to develop a treatment plan early in the postoperative period to improve the survival rate for patients at high risk of recurrence. The present invention makes it possible to predict post-operative recurrence of adenocarcinoma in lung adenocarcinoma patients, so that it is possible to make a treatment plan suitable for patients after surgery. Thus, the present invention can contribute to the medical industry for the treatment of lung adenocarcinoma.
本明細書で引用した全ての刊行物、 特許および特許出願をそのまま参考として 本明細書にとり入れるものとする。  All publications, patents and patent applications cited herein are incorporated herein by reference in their entirety.

Claims

請求の範囲 The scope of the claims
1. 肺腺癌患者において肺癌の外科切除後の肺腺癌の再発を予測するための 方法であって、 配列番号 1〜82の各ヌクレオチド配列を含む遺伝子からなる群 から選択される 2〜 82個の遺伝子の遺伝子セットの発現を該患者由来の生物学 的サンプルにおいて測定することを含み、 ここで、 配列番号 1〜5、 8〜9、 1 2、 14〜 1 5、 1 7、 1 9〜2 1、 23〜28、 3 0〜33、 3 5〜59、 6 1〜68、 70〜8 2のいずれかのヌクレオチド配列を含む遺伝子の発現が術後 無再発症例と比べて相対的に高い場合、 或いは、 配列番号 6〜7、 1 0〜1 1、 1 3、 1 6、 1 8、 22、 29、 34、 60、 6 9のいずれかのヌクレオチド配 列を含む遺伝子の発現が術後無再発症例と比べて相対的に低い場合、 肺腺癌の再 発が高いと予測することを特徴とする、 前記方法。 1. A method for predicting recurrence of lung adenocarcinoma after surgical removal of lung cancer in lung adenocarcinoma patients, which is selected from the group consisting of genes comprising the nucleotide sequences of SEQ ID NO: 1 to 82. 2-82 Measuring the expression of a gene set of individual genes in a biological sample derived from said patient, wherein: SEQ ID NOs: 1-5, 8-9, 12, 14, 15. 15, 17. The expression of a gene containing a nucleotide sequence of any of 2-21, 23-28, 30-33, 35-59, 61-68, 70-82 is relatively postoperative compared with the case without recurrence If it is high, alternatively, expression of a gene containing a nucleotide sequence of any one of SEQ ID NOs: 6 to 7, 10 to 11, 13, 16, 18, 22, 29, 34, 60, 69 The method is characterized in that the recurrence of lung adenocarcinoma is predicted to be high when it is relatively low compared to the case without recurrence.
2. 前記遺伝子セットの遺伝子数が 5〜 82である、請求項 1に記載の方法。 2. The method according to claim 1, wherein the number of genes of the gene set is 5-82.
3. 前記遺伝子セットの発現の測定を、 前記遺伝子に対応する核酸又はタン パク質の存在もしくは量を測定することによって行う、 請求項 1に記載の方法。 3. The method according to claim 1, wherein the measurement of the expression of the gene set is performed by measuring the presence or amount of a nucleic acid or protein corresponding to the gene.
4. 前記遺伝子セットの発現の測定を、 ハイプリダイゼーション法又は定量 PCR法によって行う、 請求項 1に記載の方法。  4. The method according to claim 1, wherein the measurement of the expression of the gene set is performed by a hybridization method or a quantitative PCR method.
5. 前記ハイブリダイゼ——ンョン法が、 マイクロアレイ法又はブロット法で ある、 請求項 4に記載の方法。  5. The method according to claim 4, wherein the hybridization method is a microarray method or a blotting method.
6. 前記ハイプリダイゼーシヨン法を、 前記遺伝子由来の RN A転写産物、 c RNA、 a RNA又は c DNAとハイプリダイズする核酸を用いて行う、 請求 項 4又は 5に記載の方法。  6. The method according to claim 4 or 5, wherein the hybridization method is performed using a nucleic acid that hybridizes with the RNA transcript, cRNA, aRNA or cDNA derived from the gene.
7. 前記遺伝子セットの発現の測定を、 免疫学的方法によって行う、 請求項 1に記載の方法。  7. The method according to claim 1, wherein the measurement of the expression of the gene set is performed by an immunological method.
8. 前記免疫学的方法を、 前記遺伝子によってコードされるタンパク質又は その断片に対する抗体を用いて行う、 請求項 7に記載の方法。  8. The method according to claim 7, wherein the immunological method is performed using an antibody against a protein encoded by the gene or a fragment thereof.
9. 肺腺癌患者において肺癌の外科切除後の肺腺癌の再発を予測するための 組成物であって、 該組成物が、 配列番号 1〜82のいずれかのヌクレオチド配列 を含む 2以上の異なる遺伝子の発現を測定することを可能にする複数の核酸を含 み、 該核酸が、 9. A composition for predicting recurrence of lung adenocarcinoma after surgical removal of lung cancer in lung adenocarcinoma patients, wherein the composition comprises at least two nucleotide sequences of any one of SEQ ID NOs: 1-82 Contains multiple nucleic acids that make it possible to measure the expression of different genes The nucleic acid is
( 1 ) 配列番号 1〜8 2に示されるヌクレオチド配列、 それに相補的なヌクレ ォチド配列、 或いはそれらのヌクレオチド配列中の連続する 1 5塩基から全塩基 数未満の部分配列を有する核酸、 及び  (1) Nucleotide sequences as shown in SEQ ID NOs: 1 to 2, nucleotide sequences complementary thereto, or nucleic acids having partial sequences of 15 bases to less than the total number of bases in their nucleotide sequences, and
( 2 ) 配列番号 1〜8 2に示されるヌクレオチド配列又はそれに相補的なヌク レオチド配列を含む核酸とハイブリダィズする核酸、 或いは該ハイプリダイズす る核酸の連続する 1 5塩基から全塩基数未満の部分配列を有する核酸、 からなる群から選択されることを特徴とする、 前記組成物。  (2) A nucleic acid hybridizing with a nucleic acid comprising the nucleotide sequence shown in SEQ ID NOs: 1 to 2 or a nucleotide sequence complementary thereto, or a portion from 15 contiguous bases to less than the total number of bases of the hybridized nucleic acid A nucleic acid having a sequence, characterized in that it is selected from the group consisting of
1 0 . 前記組成物がキット、 マイクロアレイ又はプライマーセットの形態で ある、 請求項 9に記載の組成物。  10. The composition according to claim 9, wherein the composition is in the form of a kit, a microarray or a set of primers.
1 1 . 前記核酸が 5種類以上から 8 2種類以下の遺伝子の発現の測定を可能 にする、 請求項 9に記載の組成物。  The composition according to claim 9, wherein the nucleic acid enables measurement of the expression of 5 or more to 82 or less genes.
1 2 . 請求項 1に記載の方法で使用するためのものである、 請求項 9に記載 の組成物。  A composition according to claim 9, which is for use in the method according to claim 1.
1 3 . 肺腺癌患者において肺癌の外科切除後の肺腺癌の再発を予測するため の組成物であって、 該組成物が、 配列番号 1〜 8 2のいずれかのヌクレオチド配 列を含む 2以上の異なる遺伝子の発現産物を測定することを可能にする複数の抗 体を含み、 該抗体が、 配列番号 1〜8 2に示されるいずれかのヌクレオチド配列 によってコードされるタンパク質又は該タンパク質のアミノ酸配列の連続する少 なくとも 8アミノ酸残基からなるポリべプチドと免疫学的に反応する抗体、 及び 該抗体の断片、 からなる群から選択されることを特徴とする、 前記組成物。  A composition for predicting recurrence of lung adenocarcinoma after surgical removal of lung cancer in patients with lung adenocarcinoma, the composition comprising a nucleotide sequence of any one of SEQ ID NOS: 1 to 82. A protein encoded by any of the nucleotide sequences set forth in SEQ ID NOs: 1-8 or comprising a plurality of antibodies which make it possible to measure the expression products of two or more different genes. An antibody which immunologically reacts with a polypeptide consisting of at least 8 consecutive amino acid residues of the amino acid sequence, and a fragment of the antibody.
1 4 . 前記組成物がキットの形態である、 請求項 1 3に記載の組成物。 14. The composition of claim 13, wherein the composition is in the form of a kit.
1 5 . 前記抗体が 5種類以上から 8 2種類以下の遺伝子の発現産物の測定を 可能にする、 請求項 1 3に記載の組成物。 The composition according to claim 13, wherein the antibody enables measurement of an expression product of 5 or more to 82 or less genes.
1 6 . 請求項 1に記載の方法で使用するためのものである、 請求項 1 3に記 載の組成物。  A composition according to claim 13, which is for use in the method according to claim 1.
PCT/JP2008/073982 2007-12-28 2008-12-26 Method and composition for predicting the postsurgical recurrence in patient suffering from pulmonary adenocarcinoma WO2009084740A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009548133A JP5407018B2 (en) 2007-12-28 2008-12-26 Methods and compositions for predicting postoperative recurrence in patients with lung adenocarcinoma

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2007-339214 2007-12-28
JP2007339214 2007-12-28

Publications (1)

Publication Number Publication Date
WO2009084740A1 true WO2009084740A1 (en) 2009-07-09

Family

ID=40824443

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2008/073982 WO2009084740A1 (en) 2007-12-28 2008-12-26 Method and composition for predicting the postsurgical recurrence in patient suffering from pulmonary adenocarcinoma

Country Status (2)

Country Link
JP (1) JP5407018B2 (en)
WO (1) WO2009084740A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107058480A (en) * 2016-12-14 2017-08-18 河北医科大学第四医院(河北省肿瘤医院) Long-chain non-coding RNA mark for diagnosing adenocarcinoma of lung

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006110264A2 (en) * 2005-03-16 2006-10-19 Sidney Kimmel Cancer Center Methods and compositions for predicting death from cancer and prostate cancer survival using gene expression signatures
WO2007043418A1 (en) * 2005-10-04 2007-04-19 National University Corporation Nagoya University Method for prediction of postoperative prognosis for patient with pulmonary adenocarcinoma, and composition for use in the prediction
JP2007135466A (en) * 2005-11-17 2007-06-07 Hitachi Software Eng Co Ltd Gene set for forecasting relapse of lung adenocarcinoma
JP2007263896A (en) * 2006-03-29 2007-10-11 Univ Nagoya Biological marker for estimating post-operative prediction of lung cancer patient, and method therefor

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006110264A2 (en) * 2005-03-16 2006-10-19 Sidney Kimmel Cancer Center Methods and compositions for predicting death from cancer and prostate cancer survival using gene expression signatures
WO2007043418A1 (en) * 2005-10-04 2007-04-19 National University Corporation Nagoya University Method for prediction of postoperative prognosis for patient with pulmonary adenocarcinoma, and composition for use in the prediction
JP2007135466A (en) * 2005-11-17 2007-06-07 Hitachi Software Eng Co Ltd Gene set for forecasting relapse of lung adenocarcinoma
JP2007263896A (en) * 2006-03-29 2007-10-11 Univ Nagoya Biological marker for estimating post-operative prediction of lung cancer patient, and method therefor

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
AMBROISE, C. ET AL.: "Selection bias in gene extraction on the basis of microarray gene-expression data", PROC. NATL. ACAD. SCI. USA, vol. 99, no. 10, 2002, pages 6562 - 6566 *
BEER, D. G. ET AL.: "Gene-expression profiles predict survival of patients with lung adenocarcinoma", NATURE MEDICINE, vol. 8, no. 8, 2002, pages 816 - 824 *
GOLUB, T. R. ET AL.: "Molecular classification of cancer: Class discovery and class prediction by gene expression monitoring", SCIENCE, vol. 286, 1999, pages 531 - 537, XP002207658, DOI: doi:10.1126/science.286.5439.531 *
LARSEN, J. E. ET AL.: "Gene expression signature predicts recurrence in lung adenocarcinoma", CLIN. CANCER RES., vol. 13, no. 10, May 2007 (2007-05-01), pages 2946 - 2954, XP008123438, DOI: doi:10.1158/1078-0432.CCR-06-2525 *
MOLINARO, A. M. ET AL.: "Prediction error estimation: a comparison of resampling methods", BIOINFORMATICS, vol. 21, no. 15, 2005, pages 3301 - 3307 *
SIMON, R. ET AL.: "Pitfalls in the use of DNA microarray data for diagnostic and prognostic classification", J. NATL. CANCER INST., vol. 95, no. 1, 2003, pages 14 - 18, XP002493056 *
YANAGISAWA, K. ET AL.: "A 25-signal proteomic signature and outcome for patients with resected non-small-cell lung cancer", J. NATL. CANCER INST., vol. 99, no. 11, June 2007 (2007-06-01), pages 858 - 867, XP002545290 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107058480A (en) * 2016-12-14 2017-08-18 河北医科大学第四医院(河北省肿瘤医院) Long-chain non-coding RNA mark for diagnosing adenocarcinoma of lung
CN107058480B (en) * 2016-12-14 2018-07-13 河北医科大学第四医院(河北省肿瘤医院) Long-chain non-coding RNA marker for diagnosing adenocarcinoma of lung

Also Published As

Publication number Publication date
JP5407018B2 (en) 2014-02-05
JPWO2009084740A1 (en) 2011-05-19

Similar Documents

Publication Publication Date Title
JP6592468B2 (en) Estimation of tumor response to anti-ERBB3 antibody
JP2020150949A (en) Prognosis prediction for melanoma cancer
CA2959670C (en) Compositions, methods and kits for diagnosis of a gastroenteropancreatic neuroendocrine neoplasm
US9181589B2 (en) Molecular-based method of cancer diagnosis and prognosis
JP5422785B2 (en) Methods and biomarkers for blood detection of multiple carcinomas using mass spectrometry
KR101801980B1 (en) A composition for diagnosis of primary central nervous system lymphoma and a diagnosing kit comprising the same
EP3644062B1 (en) Method for predicting esophagus cancer response to anti-erbb3 antibody treatment
CN109633156B (en) Application of biomarker in evaluating oral squamous carcinoma risk degree
JP2007263896A (en) Biological marker for estimating post-operative prediction of lung cancer patient, and method therefor
KR101847815B1 (en) A method for classification of subtype of triple-negative breast cancer
US11913076B2 (en) Prostate cancer gene profiles and methods of using the same
KR101054952B1 (en) UCCR, a marker for diagnosing liver cancer and predicting patient survival, a kit including the same, and prediction of liver cancer patient survival using the marker
JP6617225B2 (en) How to differentiate esophageal basal cell carcinoma
WO2009084740A1 (en) Method and composition for predicting the postsurgical recurrence in patient suffering from pulmonary adenocarcinoma
JP6496899B2 (en) Reagent for discriminating invasive meningiomas and method for discriminating the same
JP5760247B2 (en) Composition and method for predicting postoperative prognosis or metastatic potential of cancer patients
KR101622454B1 (en) Predictive biomarkers for EGFR tyrosine kinase inhibitors as anticancer therapy
KR102615451B1 (en) Novel biomarker for predicting prognosis of treatment of HER2 positive breast cancer and uses thereof
KR102326119B1 (en) Biomarkers for predicting prognosis after immunotherapy of cancer
CN113403382B (en) Application of UBE2F in diagnosis and treatment of femoral head necrosis

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 08866447

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2009548133

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 08866447

Country of ref document: EP

Kind code of ref document: A1