WO2016121715A1 - 肺がん患者の予後を評価するための情報を提供する方法、肺がん患者の予後予測方法、内部標準、抗体、肺がん患者の予後予測装置、予後予測装置のプログラム及び記録媒体 - Google Patents

肺がん患者の予後を評価するための情報を提供する方法、肺がん患者の予後予測方法、内部標準、抗体、肺がん患者の予後予測装置、予後予測装置のプログラム及び記録媒体 Download PDF

Info

Publication number
WO2016121715A1
WO2016121715A1 PCT/JP2016/052072 JP2016052072W WO2016121715A1 WO 2016121715 A1 WO2016121715 A1 WO 2016121715A1 JP 2016052072 W JP2016052072 W JP 2016052072W WO 2016121715 A1 WO2016121715 A1 WO 2016121715A1
Authority
WO
WIPO (PCT)
Prior art keywords
lung cancer
prognosis
proteins
cancer patient
predicting
Prior art date
Application number
PCT/JP2016/052072
Other languages
English (en)
French (fr)
Inventor
隆 高橋
聖 柳澤
晃弘 平川
昌弘 中杤
Original Assignee
国立大学法人名古屋大学
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 国立大学法人名古屋大学 filed Critical 国立大学法人名古屋大学
Priority to JP2016572030A priority Critical patent/JPWO2016121715A1/ja
Publication of WO2016121715A1 publication Critical patent/WO2016121715A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids

Definitions

  • the present invention relates to a method for providing information for evaluating the prognosis of a lung cancer patient, a prognosis prediction method for a lung cancer patient, an internal standard, an antibody, a prognosis prediction device for a lung cancer patient, a program for a prognosis prediction device, and a recording medium.
  • the present invention relates to a method for providing information for evaluating a prognosis of a lung cancer patient used in a prognosis prediction method, an internal standard, an antibody, a prognosis prediction apparatus for a lung cancer patient, a program for a prognosis prediction apparatus, and a recording medium.
  • lung cancer In most developed countries, including Japan, death from lung cancer is the first among deaths by region due to cancer. For lung cancer, various treatments have been improved and testing methods for early detection have been improved. In Japan, about 70,000 lung cancer patients (hereinafter simply referred to as “patients”) are used every year. May have died).
  • follow-up is the mainstream for stage I patients with relatively mild symptoms.
  • some stage I patients include advanced patients.
  • Patent Document 1 the method described in Patent Document 1 is limited to lung adenocarcinoma among lung cancers, and it is not clear whether it can be applied to other lung cancers such as squamous epithelium, adenosquamous epithelium, large cells, etc. There's a problem.
  • the present invention has been made in order to solve the above-mentioned conventional problems. As a result of extensive research, at least g1027 (Accession No.
  • an object of the present invention is to provide a method for providing information for evaluating the prognosis of a lung cancer patient, a prognosis prediction method for a lung cancer patient, an internal standard, an antibody, a prognosis prediction device for a lung cancer patient, a program for a prognosis prediction device, and a recording medium Is to provide.
  • the present invention provides a method for providing information for evaluating the prognosis of a lung cancer patient, a prognosis prediction method for a lung cancer patient, an internal standard, an antibody, a prognosis prediction device for a lung cancer patient, a program for a prognosis prediction device, and a recording medium About.
  • a method for providing information for predicting the prognosis of a patient with lung cancer In samples derived from lung cancer patients, at least g1027 (Accession No. sp
  • (3) predicting the likelihood of recurrence of the lung cancer patient A step of calculating a risk score by applying expression levels of at least four proteins described in (1) above to a final prognosis prediction model constructed based on Partial Cox regression analysis using a protein group including at least four types of proteins , The prognosis prediction method of the lung cancer patient as described in said (2) containing.
  • a storage means storing a final prognosis prediction model or a threshold constructed based on the expression level of a protein group including at least four types of proteins described in (1) above,
  • the final prognosis prediction model stored in the storage means, calculating the risk score, or comparing the risk score with the threshold value, the possibility of recurrence of the lung cancer patient Prediction means to predict, Prognostic device for lung cancer patients including (5) The lung cancer patient prognosis prediction device according to (4), wherein the final prediction model is a model constructed based on Partial Cox regression analysis.
  • the possibility of recurrence can be predicted regardless of the type of lung cancer at the initial stage. . Therefore, unnecessary anticancer drug treatment can be avoided for patients with a low probability of recurrence, and conversely, patients with a high probability of recurrence should be treated at an early stage after surgery. Appropriate anticancer drug treatment can be performed.
  • Appropriate postoperative treatment is performed for patients at hospitals in remote areas with few cases by inputting information for predicting the prognosis of lung cancer patients using the Internet line to the prognosis prediction apparatus of the present invention. can do.
  • the absolute value of the expression level of the protein contained in the sample obtained from the patient can be easily analyzed.
  • FIG. 1 is a diagram showing an outline of a prognosis prediction apparatus for lung cancer patients.
  • FIG. 2 is a diagram showing a process for predicting a patient's prognosis using the prognosis prediction apparatus of the present invention.
  • FIG. 3 is a diagram showing a statistical processing procedure for identifying a prognostic protein.
  • FIG. 4 is a graph showing an average c-index value in the Cross validation test when 4 to 100 types of proteins used for Partial Cox regression analysis are selected.
  • FIG. 5 is a graph showing the correlation between the result predicted by the final prognosis prediction model created in Example 2 and the actually observed prognosis.
  • FIG. 1 is a diagram showing an outline of a prognosis prediction apparatus for lung cancer patients.
  • FIG. 2 is a diagram showing a process for predicting a patient's prognosis using the prognosis prediction apparatus of the present invention.
  • FIG. 3 is a diagram showing a statistical processing procedure for identifying a prognostic
  • FIG. 6 is a graph in which 115 samples of the teacher group are predicted to be a low risk group (46 samples) and a high risk group (69 samples) using the final prognosis prediction model constructed in Example 2, and 58 samples of the verification group are low risk.
  • the graph predicted for the group (35 samples) and the high risk group (23 samples) is shown.
  • FIG. 7 is a graph in which the teacher group 55 samples are predicted as a low risk group (34 samples) and a high risk group (21 samples) using the final prognosis prediction model constructed in Example 3, and the verification group 39 samples are low risk.
  • the graph predicted for the group (28 samples) and the high risk group (11 samples) is shown.
  • a method for providing information for evaluating the prognosis of a lung cancer patient according to the present invention a prognosis prediction method for a lung cancer patient, an internal standard, an antibody, a prognosis prediction device for a lung cancer patient, a program for a prognosis prediction device, and a recording medium will be described in detail. explain.
  • types of “lung cancer” in the present invention include adenocarcinoma, squamous cell carcinoma, adenosquamous cell carcinoma, large cell carcinoma, and the like.
  • Sample derived from a lung cancer patient means a sample capable of measuring protein, such as cancer cells collected at the time of surgery, blood, urine, alveolar lavage fluid, lung cancer-derived protein contained in exhaled breath, etc. Is mentioned.
  • the method for providing information for evaluating the prognosis of a lung cancer patient is the expression level of at least g1027, g1237, g1463 and g1821 proteins among various proteins expressed in a sample derived from a lung cancer patient. It is characterized by measuring.
  • “measuring protein expression level” is not particularly limited as long as the target protein expression level can be measured. For example, a full-length protein may be measured, You may measure the expression level of the target protein by measuring the process body (protein fragment) of the target protein.
  • the at least four kinds of proteins are involved in cancer recurrence after surgery. Therefore, the possibility of recurrence of a patient can be predicted by providing information on the expression levels of the at least four types of proteins. Accordingly, it is possible to provide a prognosis prediction for appropriate postoperative treatment for each patient, such as administration of an anticancer agent after surgery or administration of a more appropriate anticancer agent.
  • the method for predicting prognosis of a lung cancer patient according to the present invention is characterized by predicting prognosis based on the expression levels of at least four types of proteins.
  • the prediction of prognosis is not particularly limited as long as it can predict the prognosis based on the measured expression levels of the at least four kinds of proteins.
  • the procedure for creating a final prognosis prediction model (discriminant) using statistical means from the results of comparative quantification of protein expression levels in a sample using mass spectrometry (MS) and predicting the prognosis is shown below. (1) Divide a certain number of collected and stored patients into a teacher group and a verification group.
  • Proteins in samples can be obtained by performing mass spectrometry on samples assigned to a teacher group using iTRAQ (registered trademark) reagent (ABSciex) that can comprehensively compare protein abundance among multiple samples. Measure the expression level and create a database. When creating the database, the measured protein expression level is associated with information such as the actual prognosis of the patient, for example, recurrence 3 months after surgery, recurrence 5 years, no recurrence 9 years, etc. And remember. (3) The data obtained in the above (2) is statistically processed to identify a protein group having a high possibility of recurrence after surgery.
  • the sample is divided into a training group and a validation group
  • the teacher group is further randomly divided into training data and test data
  • the effect of multivariables on the training data is examined.
  • Candidate proteins associated with recurrence are limited using a Cox regression analysis, which is a regression model.
  • a prognostic prediction model is created using Partial Cox regression analysis that can construct a prediction model of the candidate protein group defined in (3) above using a plurality of variables.
  • the created prognostic prediction model evaluates prediction performance based on c-index (concordance indices) using test data.
  • (5) By repeating the above (4) while reducing the candidate proteins by 10%, sets having different numbers (m) of candidate proteins are created.
  • n sets in which the number of candidate proteins is m can be created.
  • the accuracy of discriminant models with different numbers of candidate proteins is evaluated using c-index as an index, and the number M of candidate proteins appropriate for creating the final prognosis prediction model is determined.
  • M ⁇ n proteins including duplicates
  • M proteins are selected, and a final prognostic prediction model (discriminant) based on the Partial Cox regression analysis is constructed using the selected proteins.
  • the final prognosis prediction model is based on the partial cox regression analysis so that all cases in the teacher group can be predicted based on M proteins selected from M ⁇ n candidate proteins (including duplicates). This means the created model, which is different from the prediction model (4) (m selected model). (7) The reliability of the created final prognosis prediction model can be evaluated by verifying the constructed final prognosis prediction model using data of a verification group different from the teacher group used for the creation. . (8) And in order to predict the prognosis, the expression level of the protein in the sample is measured, the measured expression level is applied to the final prognosis prediction model, and the risk score is calculated to predict the risk of recurrence. do it.
  • the procedure shown above shows an example of statistical means, and is not limited to the above means.
  • the final prognosis prediction model may be created using a model such as support vector machine (support vector machines) which is one of pattern recognition models using weighted vote classification and supervised learning.
  • the method described above shows the procedure for creating a final prognostic prediction model from the results of comparative quantification of the expression levels of various proteins in the sample.
  • the prognosis is determined based on the absolute value of the measured protein expression level.
  • a final prognosis prediction model for prediction may be created. Even when based on the absolute value, it is possible to create a final prognosis prediction model by applying Partial cox regression analysis, weighted vote, support vector machine, and the like.
  • Partial cox regression analysis weighted vote, support vector machine, and the like.
  • the absolute values of the expression levels of the at least four types of proteins are examined.
  • Data processing may be performed to determine whether the risk is high, and a threshold value may be set and compared with the threshold value to predict the possibility of recurrence.
  • a known method such as liquid chromatography mass spectrometry (LC-MS / MS), ELISA (Enzyme-Linked Immunosorbent Assay), immunohistochemical staining, or the like can be used.
  • the internal standard When using LC-MS / MS, analyze the internal standard of the same amino acid sequence as the protein to be measured in the sample at the same time, and compare the measured value with the internal standard to obtain the absolute value of the expression level of the protein to be measured. Can be measured.
  • a synthetic protein obtained by synthesizing a part of the protein to be measured for example, only the terminal amino acid using an isotope-labeled artificial amino acid such as 2 H, 13 C, and 15 N may be used.
  • an isotope-labeled artificial amino acid such as 2 H, 13 C, and 15 N
  • the internal standard may be made of an isotope-labeled synthetic protein corresponding to the protein of each model.
  • An internal standard can be obtained from a reagent manufacturer such as SIGMA, for example, provided the sequence is provided.
  • an antibody that specifically recognizes only the protein to be measured may be prepared, and the expression level of the protein to be measured may be measured by a known procedure.
  • the expression level may be measured by a known procedure.
  • the internal standard and the antibody may be used as a kit together with reagents necessary for measuring the expression level.
  • a protein that serves as an index for predicting prognosis was identified by analyzing a sample associated with prognostic information actually observed after surgery. It has also been clarified that the prognosis of a patient can be predicted by using a final prognosis prediction model constructed based on the expression level of the protein. Therefore, the computer can also be used as a prognosis prediction device for lung cancer patients by storing the final prognosis prediction model and the threshold value in the storage means of the computer.
  • FIG. 1 is a diagram showing an outline of a prognosis prediction apparatus for lung cancer patients.
  • the prognosis prediction apparatus 1 includes at least an input means 2, a storage means 3 for storing a final prognosis prediction model or a threshold, a prediction means 4, a control unit 5, and a program memory 6.
  • the input means 2 is not particularly limited as long as the information on the expression level obtained from the patient sample can be input to the prognosis prediction apparatus 1, and examples thereof include a keyboard and a USB.
  • the input means 2 may use an internet line. For example, information on the expression level of a patient sample acquired at a remote hospital using an Internet line is transmitted to and input to the prognosis prediction apparatus 1, and a prognosis prediction result is transmitted via the Internet line to a patient at a remote hospital. Appropriate postoperative treatment can also be performed.
  • the storage means 3 stores a final prognosis prediction model or threshold value for predicting the prognosis of a patient.
  • the predicting unit 4 calculates the risk score by applying the expression level information obtained from the patient sample input by the input unit 2 to the final prognosis prediction model stored in the storage unit 3, or by comparing the risk score with a threshold value. Can predict the risk of recurrence.
  • the program memory 6 stores, for example, a program for causing the computer shown in FIG. 1 to function as the prognosis prediction device 1. When the program is read and executed by the control unit 5, operation control of the input unit 2, the storage unit 3 and the prediction unit 4 is performed.
  • the program may be stored in advance in a computer, or may be recorded on a recording medium together with a final prognosis prediction model and a threshold value, and stored in the program memory 6 using an installation unit.
  • FIG. 2 is a diagram showing a process for predicting the prognosis of a patient using the prognosis prediction apparatus of the present invention.
  • the program stored in the program memory 6 is read and executed by the control unit 5, and first, the expression level of the protein in the sample is input by the input means 2 (S100). Note that the expression level of the protein in the sample may be input directly from the measurement result of the expression level measurement apparatus connected to the prognosis prediction apparatus, or may be input from a separately measured measurement value.
  • the risk score is calculated by applying the expression level information input by the input unit 2 to the final prognosis prediction model stored in the storage unit 3 or compared with a threshold value (S110). And the prediction result of the obtained prognosis is displayed (S120).
  • the display method may be displayed on a display means of a computer, or may be printed out on paper or the like.
  • Example 1 The following procedures identified the proteins required to predict the prognosis of lung cancer patients and constructed a prognosis prediction model.
  • sample ⁇ 173 samples were prepared from surgically removed lung cancer samples collected from patients with lung cancer and had information on the prognosis actually observed after surgery (the longest was follow-up until 9 years after surgery).
  • a peptide is prepared by enzymatic digestion from a protein extracted from the above control sample and a surgically isolated lung cancer tissue sample, or from a protein extracted from normal lung, and then labeled with iTRAQ (registered trademark) reagent (ABSciex). went.
  • iTRAQ registered trademark
  • All labeled peptide samples were mixed, and after fractionation by liquid chromatography, analysis was performed using a mass spectrometer (ABSciex) to obtain the results of relative comparative quantification of proteins in the sample.
  • ABSciex mass spectrometer
  • the analysis result was compiled into a database by associating the expression level of the protein and the disease-free recurrence period of the patient of the sample.
  • the sample of the verification group was also analyzed in the same procedure as the teacher group.
  • the candidate protein was reduced by 10%, and the step (3) was repeated.
  • a decimal point when reduced by 10% a rounded integer candidate protein was selected.
  • integer candidate proteins were selected by rounding off in the same manner. Specifically, 100, 90, 81, 73... 21, 19, 17, 15, 14, 12, 11, 10, 9, 8, 7, 6, 5, and 4 types of 29 patterns in total are candidates. Protein was selected. (The procedures (1) to (4) are described as “Random 5-fold cross validation”.) (5) The above procedures (1) to (4) were repeated 1000 times. (6) Table 1 shows a method for selecting candidate proteins when candidate proteins are reduced by 10% and reduced to 11 types.
  • the candidate proteins are the 11 proteins selected during the first “Random 5-fold cross validation” (described as “CV1” in Table 1), and the second “Random 5-fold cross validation” (Table 11 described as “CV2”).
  • 11 proteins selected in 1,000th “Random 5-fold cross validation” (described as “CV1000” in Table 1).
  • the types of proteins were listed, and 11 types of proteins were selected in descending order of the number selected in a total of 1000 “Random 5-fold cross validation”. The same procedure was performed when 4, 5, 6, 7, 8, 9,... 73, 81, 90, 100 types of candidate proteins were selected.
  • Tables 3 to 16 show the total number of top protein selections when 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 17, 19, and 21 types of proteins are selected ( The number of times selected in 1000 times) and its Accession number.
  • FIG. 4 is a graph showing the average c-index value in the Cross validation test when 4 to 100 candidate proteins are selected using Partial Cox regression analysis. In any case where the number of selected proteins is 4 to 100, the c-index value is between 0.61 and 0.62, which can be said to be a high correct answer rate.
  • “coefficent1” and “mean1” are values obtained at the time of Partial Cox regression analysis, and the protein ranked first in the number of selections shown in Table 17 below. “-0.4441” and “0.0142”, which are the values of "coefficient” and “mean”. “Coefficent2” and “mean2”... Indicate the “coefficent” and “mean” values of the proteins in the second rank. “Protein1”, “protein2”... Means that “expression amount of protein ranked first”, “expression amount of protein ranked second” expressed in individual samples of 115 samples. -Represents.
  • the risk score of each sample was calculated. Even in the case of a final prognosis prediction model (discriminant) other than 11 proteins, the risk score can be calculated by performing the same calculation.
  • FIG. 5 is a graph showing the correlation for the 115 samples of the teacher group, and the actual prognosis of the patients observed without recurrence (patient who did not relapse after 5 years after surgery) and recurrence (after surgery, It is a graph in which the samples of those patients are plotted based on the risk score (risk) predicted by the final prognosis prediction model.
  • the risk score of “0” is defined as the boundary between the low risk group and the high risk group.
  • FIG. 6 is a graph in which 115 samples of the teacher group are predicted to be a low risk group (46 samples) and a high risk group (69 samples) using the constructed final prognosis prediction model, and 58 samples of the verification group are low risk groups (35 samples). ) And high risk groups (23 samples).
  • the low risk group shown in FIG. 6 is a sample classified into the low risk group by the boundary shown in FIG. 5, and the high risk group is a sample classified into the high risk group by the boundary shown in FIG.
  • the solid line in FIG. 6 indicates information regarding the actually observed prognosis after surgery of the surgically isolated lung cancer sample 173 samples classified into the high risk group or the low risk group, and the broken line indicates the 95% confidence interval. Show.
  • the prognosis can be predicted with high accuracy regardless of the type of lung cancer by using the final prognosis prediction model of the present invention.
  • Example 3> From the above 173 samples, only 94 samples that are cases of stage I, which is the initial stage, are selected as lung cancer, and the 94 samples are divided into a teacher group (55 samples) and a verification group (39 samples). The final prognosis prediction model was verified in the same procedure as in ⁇ Example 2>.
  • FIG. 7 is a graph in which the teacher group 55 samples are predicted as a low risk group (34 samples) and a high risk group (21 samples) using the final prognosis prediction model constructed in Example 3, and the verification group 39 samples are low risk.
  • the graph which estimated to the group (28 samples) and the high risk group (11 samples) is shown.
  • p ⁇ 0.05 is statistically significant, it can be said that the reliability of the created final prognosis prediction model is high. From the above results, it became clear that the final prognosis prediction model of the present invention can predict the prognosis with high accuracy even from samples of lung cancer patients at an early stage.
  • the prognosis of lung cancer patients according to the present invention can be used to predict the prognosis of lung cancer patients with high accuracy. Therefore, postoperative treatment suitable for patients can be performed, which is useful for examination and research of lung cancer patients in medical institutions and research institutions such as university medical departments.

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Cell Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

 初期段階の肺がんであっても種類を問わず再発可能性を予測できる方法を提供する。肺がん患者の予後を予測するための情報を提供する方法であって、肺がん患者由来のサンプルにおいて、少なくとも、g1027(Accession No.sp|P12814|ACTN1_HUMAN)、g1237(Accession No.sp|P22392-2|NDKB_HUMAN)、g1463(Accession No.sp|P35221|CTNA1_HUMAN)及びg1821(Accession No.sp|P51690|ARSE_HUMAN)の4種類のタンパク質の発現量を測定する工程、を含む肺がん患者の予後を予測するための情報を提供する方法により、初期段階の肺がんであっても種類を問わず再発可能性を予測できる。

Description

肺がん患者の予後を評価するための情報を提供する方法、肺がん患者の予後予測方法、内部標準、抗体、肺がん患者の予後予測装置、予後予測装置のプログラム及び記録媒体
 本発明は、肺がん患者の予後を評価するための情報を提供する方法、肺がん患者の予後予測方法、内部標準、抗体、肺がん患者の予後予測装置、予後予測装置のプログラム及び記録媒体に関する。特に、肺がん患者由来のサンプル中の特定タンパク質の発現量を測定することで肺がん患者の手術後の再発可能性を予測し、肺がん患者に最適な術後治療を実施すための肺がん患者の予後予測方法、予後予測方法に用いられる肺がん患者の予後を評価するための情報を提供する方法、内部標準、抗体、肺がん患者の予後予測装置、予後予測装置のプログラム及び記録媒体に関する。
 日本を含む殆どの先進諸国において、癌による部位別死亡者数の中で、肺がんによる死亡は第1位を占めている。肺がんに対しては、様々な治療法の改良及び早期発見用の検査方法の改良が行われているが、日本においは毎年約70,000人の肺がん患者(以下、単に「患者」と記載することがある。)が死亡している。
 患者の手術後の主な死亡原因は転移による再発である。そのため、日本においては、画像診断や手術時の目視では発見しきれないがん細胞の転移を抑えるため、手術後にテガフール・ウラシル(UFT(登録商標))等の副作用が比較的少ない抗がん剤を約2年程度飲み続ける術後治療が行われている。この術後治療により、手術のみで経過観察を行う治療方法より、患者の再発を抑えることができる。しかしながら、統計的には、患者の約7割は手術により治癒するといわれている。そのため、約7割の患者は、本来は不要である抗がん剤治療を術後に受けることになり、体にダメージを与えるのみでなく、経済的にも大きな負担になっている。
 一方、残りの約3割については、手術ではがん細胞を取り切れずに、再発すると言われている。この約3割の患者に対しては、手術後に、UFTより更に強い抗がん剤治療を施すことが望ましい。しかしながら、現状では手術後は一律にUFT等の抗がん剤を投与している。したがって、手術後の患者毎に再発の可能性の有無を調べ、患者に最も適した術後治療を施すことが望ましい。
 また、欧米においては、比較的症状の軽いI期の場合は「経過観察」が主流である。しかしながら、I期の患者の中には進行性の患者も含まれている。そのため、進行性の患者に対しては、手術や抗がん剤投与等の適切な治療を早期に実施することが望ましいが、現状では、一律に経過観察が行われている。
 患者の手術後の予後を予測する方法としては、肺腺がん患者から採取した生体由来試料における、ミオシンIIA及び/又はビメンチン発現量を測定することで、予後を予測する方法が知られている(特許文献1参照)。
特許第5147852号公報
 しかしながら、特許文献1に記載されている方法は、肺がんの中でも肺腺がんに限定されており、他の肺がんである、扁平上皮、腺扁平上皮、大細胞等に応用できるのか明らかではないという問題がある。本発明は、上記従来の問題を解決するためになされた発明であり、鋭意研究を行ったところ、患者由来のサンプルにおいて、少なくとも、g1027(Accession No.sp|P12814|ACTN1_HUMAN)、g1237(Accession No.sp|P22392-2|NDKB_HUMAN)、g1463(Accession No.sp|P35221|CTNA1_HUMAN)及びg1821(Accession No.sp|P51690|ARSE_HUMAN)の4種類のタンパク質の発現量を測定し、当該発現量に基づき肺がん患者の再発可能性を予測することで、初期段階の肺がんであっても種類を問わず再発可能性を予測できることを新たに見出した。なお、本発明のAccession No.は、全てUniprotデータベースの番号である。
 すなわち、本発明の目的は、肺がん患者の予後を評価するための情報を提供する方法、肺がん患者の予後予測方法、内部標準、抗体、肺がん患者の予後予測装置、予後予測装置のプログラム及び記録媒体を提供することである。
 本発明は、以下に示す、肺がん患者の予後を評価するための情報を提供する方法、肺がん患者の予後予測方法、内部標準、抗体、肺がん患者の予後予測装置、予後予測装置のプログラム及び記録媒体に関する。
(1)肺がん患者の予後を予測するための情報を提供する方法であって、
 肺がん患者由来のサンプルにおいて、少なくとも、g1027(Accession No.sp|P12814|ACTN1_HUMAN)、g1237(Accession No.sp|P22392-2|NDKB_HUMAN)、g1463(Accession No.sp|P35221|CTNA1_HUMAN)及びg1821(Accession No.sp|P51690|ARSE_HUMAN)の4種類のタンパク質の発現量を測定する工程、
を含む肺がん患者の予後を予測するための情報を提供する方法。
(2)上記(1)に記載の少なくとも4種類のタンパク質の発現量に基づいて、肺がん患者の再発可能性を予測する工程、
を含む肺がん患者の予後予測方法。
(3)前記肺がん患者の再発可能性を予測する工程が、
 前記少なくとも4種類のタンパク質を含むタンパク質群を用いてPartial Cox regression解析に基づき構築した最終予後予測モデルに、上記(1)に記載の少なくとも4種類のタンパク質の発現量を当てはめリスクスコアを算出する工程、
を含む上記(2)に記載の肺がん患者の予後予測方法。
(4)上記(1)に記載の少なくとも4種類のタンパク質を含むタンパク質群の発現量に基づき構築した最終予後予測モデル又は閾値を格納した記憶手段、
 肺がん患者のサンプルに含まれる前記少なくとも4種類のタンパク質の発現量を、前記記憶手段に記憶された最終予後予測モデルに当てはめリスクスコアを算出、又は閾値と比較することで肺がん患者の再発可能性を予測する予測手段、
を含む肺がん患者の予後予測装置。
(5)前記最終予測モデルが、Partial Cox regression解析に基づき構築したモデルであることを特徴とする上記(4)に記載の肺がん患者の予後予測装置。
(6)コンピュータを、上記(4)又は(5)に記載の肺がん患者の予後予測装置として機能させるためのプログラム。
(7)上記(6)に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
(8)上記(1)に記載の少なくとも4種類のタンパク質と同じアミノ酸配列を有する合成タンパク質を含み、
 前記合成タンパク質の各々が、同位体標識されたアミノ酸を含む内部標準。
(9)上記(1)に記載の少なくとも4種類のタンパク質を検出するための抗体。
 患者由来のサンプル中の、少なくとも、g1027、g1237、g1463、及びg1821タンパク質の発現量に基づき再発可能性を予測することで、初期段階の肺がんであっても種類を問わず再発可能性を予測できる。したがって、再発の可能性が低い患者に対しては不要な抗がん剤治療を回避することができ、逆に、再発の可能性が高い患者に対しては、手術後の早い段階から患者に適した抗がん剤治療を行うことができる。
 本発明の予後予測装置に、インターネット回線を用いて肺がん患者の予後を予測するための情報を入力することで、症例の少ない遠隔地等の病院の患者に対しても適切な術後治療を実施することができる。
 コンピュータを肺がん患者の予後予測装置として機能させるプログラム、当該プログラムを記録したコンピュータ読み取り可能な記録媒体を提供することで、症例の少ない遠隔地等の病院のコンピュータを予後予測装置として機能させることができるので、遠隔地の患者に対しても適切な術後治療を実施することができる。
 また、内部標準、抗体を提供することで、患者から得られたサンプルに含まれるタンパク質の発現量の絶対値を簡単に分析することができる。
図1は、肺がん患者の予後予測装置の概略を示す図である。 図2は、本発明の予後予測装置を用いて、患者の予後を予測するための工程を示す図である。 図3は、予後予測タンパク質を同定するための統計処理手順を示す図である。 図4は、Partial Cox regression解析に用いられるタンパク質を4~100種類に選択した際のCross validation testにおける平均c-index値を示すグラフである。 図5は、実施例2で作成した最終予後予測モデルにより予測した結果と、実際に観察された予後との相関を示すグラフである。 図6は、実施例2で構築した最終予後予測モデルを用いて、教師群115サンプルを低危険群(46サンプル)と高危険群(69サンプル)に予測したグラフ、検証群58サンプルを低危険群(35サンプル)と高危険群(23サンプル)に予測したグラフを示している。 図7は、実施例3で構築した最終予後予測モデルを用いて、教師群55サンプルを低危険群(34サンプル)と高危険群(21サンプル)に予測したグラフ、検証群39サンプルを低危険群(28サンプル)と高危険群(11サンプル)に予測したグラフを表している。
 以下に、本発明の肺がん患者の予後を評価するための情報を提供する方法、肺がん患者の予後予測方法、内部標準、抗体、肺がん患者の予後予測装置、予後予測装置のプログラム及び記録媒体について詳しく説明する。
 先ず、本発明における「肺がん」の種類は、腺がん、扁平上皮がん、腺扁平上皮がん、大細胞がん、等が挙げられる。「肺がん患者由来のサンプル」とは、タンパク質を測定することができるサンプルを意味し、例えば、手術の際に採取したがん細胞、血液、尿、肺胞洗浄液、呼気に含まれる肺がん由来タンパク質等が挙げられる。
 本発明の、肺がん患者の予後を評価するための情報を提供する方法は、肺がん患者由来のサンプル中で発現している各種タンパク質の内、少なくとも、g1027、g1237、g1463、及びg1821タンパク質の発現量を測定することを特徴としている。なお、本発明の「タンパク質の発現量を測定する」とは、目的とするタンパク質の発現量を測定できれば方法等については特に制限は無く、例えば、完全長のタンパク質を測定してもよいし、目的とするタンパク質のプロセス体(タンパク質断片)を測定することで、目的とするタンパク質の発現量を測定してもよい。
 後述する実施例に示すとおり、前記少なくとも4種類のタンパク質は術後のがんの再発に関与している。そのため、前記少なくとも4種類のタンパク質の発現量の情報を提供することで、患者の再発可能性を予測することができる。したがって、手術後の抗がん剤の投与が不要、又はより適切な抗がん剤の投与等、患者毎の適切な術後治療のための予後予測を提供することができる。
 本発明の、肺がん患者の予後予測方法は、上記の少なくとも4種類のタンパク質の発現量に基づいて、予後を予測することを特徴としている。予後の予測は、測定した上記少なくとも4種類のタンパク質の発現量に基づいて、予後を予測できるものであれば特に制限はない。以下に、質量分析(MS)を用いたサンプル中のタンパク質の発現量の比較定量結果から、統計的手段を用いて最終予後予測モデル(判別式)を作成し、予後を予測する手順を示す。
(1)採取・保存した患者の一定数のサンプルを教師群と検証群に分ける。
(2)教師群に割り当てられたサンプルを、複数サンプル間でタンパク質の存在量を網羅的に比較できるiTRAQ(登録商標)試薬(ABSciex社)等を用いて質量分析を行うことでサンプル中のタンパク質の発現量を測定し、データベース化する。なお、データベース化の際には、測定したタンパク質の発現量とその患者の実際に観察された予後、例えば、手術した3か月間後に再発、5年後に再発、9年間無再発等の情報を関連付けて記憶しておく。
(3)上記(2)で得られたデータを、統計処理し、手術後に再発の可能性が高いタンパク質群を同定する。統計処理は、例えば、サンプルを教師群(training dataset)と検証群(Validation dataset)に分け、教師群を更にランダムにtraining dataとtest dataに分け、training dataを生存に関わる多変数の効果を調べる回帰モデルであるコックス比例ハザードモデル(Cox regression analysis)を用いて、再発に関連する候補タンパク質を限定する。
(4)上記(3)で限定した候補タンパク質群を、複数の変数を用いて予測モデルを構築できるPartial Cox regression解析を用いて、予後予測モデルの作成を行う。作成した予後予測モデルは、test dataを利用してc-index(concordance indices)に基づいた予測性能の評価を行う。
(5)候補タンパク質を10%ずつ減らしながら、上記(4)を繰り返すことで、候補タンパク質の数(m)が異なるセットを作成する。
(6)更に、(3)~(5)をn回繰り返すことで、候補タンパク質の数がmであるセットをn個作成することができる。作成した候補タンパク質の数が異なる判別モデルの精度をc-indexを指標に評価を行い、最終予後予測モデル作成に適切な候補タンパク質数Mを決定する。候補タンパク質の数がMであるセットをn個作成することで、M×n個のタンパク質(重複を含む)が得られ、n個のモデルの中で最も高い頻度で選択されたタンパク質からM番目までのタンパク質をM個選択し、当該選択したタンパク質を用いてPartial Cox regression解析に基づく最終予後予測モデル(判別式)を構築する。なお、最終予後予測モデルとは、M×n個の候補タンパク質(重複を含む)の中から選択したタンパク質M個に基づいて、教師群の全症例を予測できるようにPartial Cox regression解析を用いて作成したモデルを意味し、(4)の予測モデル(m個を選択したモデル)とは異なる。
(7)構築した最終予後予測モデルは、作成に用いた教師群とは別の検証群のデータを用いて検証を行うことで、作成した最終予後予測モデルの信頼性の評価をすることができる。
(8)そして、予後を予測するためには、サンプル中のタンパク質の発現量を測定し、測定した発現量を最終予後予測モデルに当てはめ、リスクスコアを算出することで、再発の危険度を予測すればよい。
 なお、上記に示す手順は、統計的手段の一例を示すもので、上記の手段に限定されるものではない。例えば、重み付け得票分類(weighted-voting)、教師あり学習を用いるパターン認識モデルの一つであるサポートベクターマシン(support vector machines)等のモデルを用いて、最終予後予測モデルを作成してもよい。
 また、上記に示す方法は、サンプル中の各種タンパク質の発現量の比較定量結果から、最終予後予測モデルを作成する手順を示しているが、測定したタンパク質の発現量の絶対値に基づき、予後を予測する最終予後予測モデルを作成してもよい。絶対値に基づく場合でも、Partial cox regression解析、weighted voting、support vector machineなどを応用して、最終予後予測モデルを作成することができる。また、絶対値の場合、手術後の実際に観察された予後に関する情報が分かっているサンプルについて、上記少なくとも4種類のタンパク質の発現量の絶対値を調べ、どの程度の発現量であれば再発するリスクが高いのかデータ処理して閾値を設定し、当該閾値と比較することで再発可能性を予測できるようにしてもよい。タンパク質の発現量の絶対値の測定は、例えば、液体クロマトグラフィー質量分析法(LC-MS/MS)、ELISA(Enzyme-Linked ImmunoSorbent Assay)、免疫組織染色等、公知の方法を用いることができる。
 LC-MS/MSを用いる場合は、サンプル中の測定対象タンパク質と同様のアミノ酸配列の内部標準を同時に分析し、内部標準との測定値を比較することで測定対象タンパク質の発現量の絶対値を測定することができる。内部標準は、測定対象タンパク質の一部、例えば、末端のアミノ酸のみを、2H、13C、15N等の同位体標識した人工アミノ酸を用いて合成した合成タンパク質を用いればよい。後述するように、本発明では、予後を予測するタンパク質を4、5、6、7、8、9、10、11、12、14、15、17、19、21種類選択したモデルを作成している。内部標準は、それぞれのモデルのタンパク質に対応する同位体標識した合成タンパク質で作成すればよい。内部標準は、配列を提供すれば、例えば、SIGMA社等の試薬メーカーから入手することができる。
 ELISAの場合は、測定対象タンパク質のみを特異的に認識する抗体を作成し、公知の手順で測定対象タンパク質の発現量を測定すればよい。また、免疫組織染色についても、公知の手順で発現量を測定すればよい。内部標準、抗体は、発現量の測定に必要な試薬と共に、キットとしてもよい。
 なお、後述する実施例に示すとおり、本発明では、予後を予測するタンパク質を4、5、6、7、8、9、10、11、12、14、15、17、19、21種類選択したモデルを作成しているが、最終予後予測モデルの精度が高ければ、タンパク質の組み合わせ数及び種類を適宜変更してもよい。例えば、表2に示す29,000セットのタンパク質の中で選択された回数の多いタンパク質を単独、又は適宜組み合わせてタンパク質群を作成してもよい。
 本発明では、後述する実施例に示すように、手術後の実際に観察された予後の情報を関連付けたサンプルを分析することで、予後予測の指標となるタンパク質を同定した。また、当該タンパク質の発現量に基づいて構築した最終予後予測モデルを用いることで、患者の予後を予測ができることを明らかにしている。そのため、当該最終予後予測モデルや閾値をコンピュータの記憶手段に記憶しておくことで、コンピュータを肺がん患者の予後予測装置として用いることもできる。
 図1は、肺がん患者の予後予測装置の概略を示す図である。予後予測装置1は、入力手段2、最終予後予測モデル又は閾値を記憶する記憶手段3、予測手段4、制御部5及びプログラムメモリ6を少なくとも含んでいる。
 入力手段2は、予後予測装置1に、患者サンプルから得られた発現量の情報を入力できれば特に制限はなく、キーボード、USB等が挙げられる。また、入力手段2はインターネット回線を使用しても良い。例えば、インターネット回線を用いて遠隔地の病院で取得した患者サンプルの発現量の情報を予後予測装置1に送信・入力し、インターネット回線を通じて予後予測結果を送付することで遠隔地の病院の患者に対しても適切な術後治療を実施することができる。
 記憶手段3には、患者の予後を予測する為の最終予後予測モデル又は閾値が記憶されている。予測手段4は、入力手段2により入力された患者サンプルから得られた発現量の情報を記憶手段3に記憶されている最終予後予測モデルに当てはめリスクスコアを算出する、又は閾値と比較することで、再発の危険度を予測することができる。プログラムメモリ6には、例えば、図1に示すコンピュータを予後予測装置1として機能させるためのプログラムが格納されている。このプログラムが制御部5により読み出され実行されることで、入力手段2、記憶手段3及び予測手段4の動作制御が行われる。プログラムは、予めコンピュータに記憶しておいても良いし、記録媒体に最終予後予測モデル、閾値と共に記録され、インストール手段を用いてプログラムメモリ6に格納されるようにしてもよい。
 図2は、本発明の予後予測装置を用いて、患者の予後を予測するための工程を示す図である。プログラムメモリ6に格納されたプログラムが制御部5に読み出されて実行し、先ず、入力手段2により、サンプル中のタンパク質の発現量を入力する(S100)。なお、サンプル中のタンパク質の発現量は、予後予測装置と接続している発現量の測定装置の測定結果を直接入力してもよいし、別途測定した測定値を入力してもよい。次に、入力手段2により入力された発現量の情報を、記憶手段3に記憶されている最終予後予測モデルに当てはめリスクスコアを算出する、又は閾値と比較する(S110)。そして、得られた予後の予測結果を表示する(S120)。表示方法は、コンピュータの表示手段に表示してもよいし、紙等にプリントアウトしてもよい。
 以下に実施例を掲げ、本発明を具体的に説明するが、この実施例は単に本発明の説明のため、その具体的な態様の参考のために提供されているものである。これらの例示は本発明の特定の具体的な態様を説明するためのものであるが、本願で開示する発明の範囲を限定したり、あるいは制限することを表すものではない。
<実施例1>
 以下の手順により、肺がん患者の予後を予測するために必要なタンパク質の同定と予後予測モデルの構築を行った。
〔サンプル〕
 肺がん患者から採取した手術摘出肺がん試料であって、手術後の実際に観察された予後に関する情報(最長は手術後9年まで経過観察)を有する173サンプルを準備した。
〔タンパク質発現量の比較定量及びデータベースの作製〕
(1)上記173サンプルを、
・教師群:115サンプル(腺:73症例、扁平上皮:24症例、腺扁平上皮:5症例、大細胞:13症例)
・検証群:58サンプル(腺:37症例、扁平上皮:12症例、腺扁平上皮:2症例、大細胞:7症例)に割り当てを行った。
(2)教師群のサンプル中に特異的に発現しているタンパク質を探索するために、先ず、次の手順により、サンプル内タンパク質の網羅的解析を行った。
(i)対照として、肺がん細胞株20種類から抽出したタンパク質を混合した試料を準備した。
(ii)上記対照試料と手術摘出肺がん組織試料から抽出したタンパク質、或いは、正常肺から抽出したタンパク質から、酵素消化によりペプチドを作成した後、iTRAQ(登録商標)試薬(ABSciex社)を用い標識を行った。
(iii)標識したペプチド試料を全て混合し、液体クロマトグラフィーによる分画化後に、質量分析装置(ABSciex社)を用いて解析を行い、試料中のタンパク質の相対比較定量結果を取得した。
(iv)分析したサンプル毎に、タンパク質の発現量及びそのサンプルの患者の無病再発期間を関連付けて分析結果をデータベース化した。検証群のサンプルについても、教師群と同様の手順で分析した。
〔統計処理及び予後予測タンパク質の同定〕
 上記〔タンパク質発現量の比較定量及びデータベースの作製〕で作製したデータベースを用い、図3に示す手順で統計処理を行った。
(1)教師群の115サンプルを、ランダムにtraining data(92サンプル)とtest data(23サンプル)に分けた。
(2)発現量の分散値とCox regression analysisの結果により、候補タンパク質を100個まで限定した。
(3)次に、Partial Cox regression解析を用いて、実際に観察された予後の情報(再発までの時間軸の情報)を考慮した予測モデルをtraining data(92サンプル)を用いて作成した。作成した予測モデルの予測性能は、test dataを用いCross validation testを行い、c-indexに基づいて評価した。なお、c-indexは、Cross validation testにおける正答率を意味する。
(4)次に、候補タンパク質を10%ずつ減らし、上記(3)の工程を繰り返した。なお、10%減らした際に、候補タンパク質が小数点になる場合は四捨五入した整数の候補タンパク質を選定した。次に10%を減らす際にも、同様に四捨五入し整数の候補タンパク質を選定した。具体的には、100、90、81、73・・・21、19、17、15、14、12、11、10、9、8、7、6、5及び4種類の合計29パターンについて、候補タンパク質を選定した。((1)~(4)の手順を“Random 5-fold cross validation”と記載する。)
(5)上記(1)~(4)の手順を1000回繰り返した。
(6)表1は、候補タンパク質を10%ずつ減らし、11種類まで減らした際の候補タンパク質の選択方法を示している。候補タンパク質は、1回目の“Random 5-fold cross validation”(表1では“CV1”と記載。)の際に選択された11種類のタンパク質、2回目の“Random 5-fold cross validation”(表1では“CV2”と記載。)で選択された11種類のタンパク質、・・・1,000回目の“Random 5-fold cross validation”(表1では“CV1000”と記載。)で選択された11種類のタンパク質をリストアップし、合計1000回の“Random 5-fold cross validation”で選択された回数の多い順に11種類のタンパク質を選択した。候補タンパク質を、4、5、6、7、8、9、・・・73、81、90、100種類選択する場合も、同様の手順で行った。
Figure JPOXMLDOC01-appb-T000001
 表2は、4、・・・100種類(29パターン)のタンパク質を選択した際(29×1,000回=29,000回)に、選択回数が上位50種類のタンパク質の合計選択回数及びそのタンパク質のAccession番号を表す。
Figure JPOXMLDOC01-appb-T000002
 表3~16は、それぞれ、タンパク質を4、5、6、7、8、9、10、11、12、14、15、17、19、21種類選択した際の、上位タンパク質の合計選択回数(1000回中で選択された回数)及びそのAccession番号を表す。
Figure JPOXMLDOC01-appb-T000003
Figure JPOXMLDOC01-appb-T000004
Figure JPOXMLDOC01-appb-T000005
Figure JPOXMLDOC01-appb-T000006
Figure JPOXMLDOC01-appb-T000007
Figure JPOXMLDOC01-appb-T000008
Figure JPOXMLDOC01-appb-T000009
Figure JPOXMLDOC01-appb-T000010
Figure JPOXMLDOC01-appb-T000011
Figure JPOXMLDOC01-appb-T000012
Figure JPOXMLDOC01-appb-T000013
Figure JPOXMLDOC01-appb-T000014
Figure JPOXMLDOC01-appb-T000015
Figure JPOXMLDOC01-appb-T000016
 表2~16に示すように、順位は異なるものの、選択回数が上位のタンパク質には共通性が見られた。具体的には、(1)4種類までタンパク質を絞り込んだ表3のg1027、g1237、g1463及びg1821については、表4~表16においてもすべて含まれること、(2)表3~表16のタンパク質は、表2に示す29,000回でヒットした上位34タンパク質内に全て含まれていること、を確認した。したがって、予後予測には、上記4種類のタンパク質の発現量を少なくとも調べることが重要であることが判明した。
 図4は、Partial Cox regression解析を用いて候補タンパク質を4~100種に選択した際のCross validation testにおける平均c-index値を示すグラフである。選択したタンパク質の数が4~100種類の何れの場合もc-index値は0.61~0.62の間で、高い正答率といえる。
〔最終予後予測モデルの検証〕
<実施例2>
 上記のとおり、29種類の判別モデルにおけるc-indexの平均値に基づく各モデルの診断精度の評価は何れも高い正答率であったが、その中で、最も診断精度が高かった11タンパク質を用いた判別モデルを最終予後予測モデルとした。表1及び10に示すように、1000回の11タンパク質モデル構築の際に、最も多く選出されたタンパク質から11番目までを最終モデルを構築するための因子として、Partial Cox regression解析に基づく最終予後予測モデル(判別式)を、教師群全115症例を用いて、「Hongzhe Li et. al.,“Partial Cox regression analysis for high-dimensional microarray gene expression data”, BIOINFORMATICS,Vol.20 Suppl.1, 2004,pi208-i215」に記載されている手順で構築した。得られた最終予後予測モデル(判別式)を以下に示す。
coefficent1×(protein1 - mean1)+coefficent2×(protein2 - mean2)+・・・coefficent10×(protein10 - mean10)+coefficent11×(protein11 - mean11)
 なお、上記最終予後予測モデル(判別式)の、“coefficent1”及び“mean1”とは、Partial Cox regression解析の際に得られた値で、下記表17に示す選択回数の順位が1位のタンパク質の“coefficent”及び“mean”の値である“-0.4441”、“0.0142”である。“coefficent2”及び“mean2”・・・は、順位が2位・・・のタンパク質の“coefficent”及び“mean”の値を示す。また、“protein1”、“protein2”・・・とは、115サンプル中の個々のサンプル中で発現している“順位1位のタンパク質の発現量”、“順位2位のタンパク質の発現量”・・・を表している。
 上記の最終予後予測モデル(判別式)に115サンプルを当てはめることで、各々のサンプルのリスクスコアを算出した。タンパク質が11個以外の最終予後予測モデル(判別式)の場合も、同様に計算をすることでリスクスコアを算出できる。
Figure JPOXMLDOC01-appb-T000017
 本発明のサンプルは、手術後に実際に観察された予後が明らかなサンプルを使用している。そのため、実施例2で作成した最終予後予測モデルにより予測した結果と、実際に観察された予後との相関を調べた。図5は、教師群115サンプルについての相関を示すグラフで、実際に観察された患者の予後を無再発生存(手術後、5年経過した段階で再発しなかった患者)及び再発(手術後、5年以内に再発)に分け、それらの患者のサンプルを最終予後予測モデルで予測したリスクスコア(危険度)に基づいてプロットしたグラフである。なお、図5では、リスクスコアが“0”の場合を、低危険群と高危険群の境界とした。図5から明らかなように、実際に観察された予後が無再発生存のサンプルの多くは低危険群に予測され、実際に観察された予後が再発のサンプルの多くは高危険群に予測されていた。したがって、実施例2で作成した最終予後予測モデルの精度が高いことが明らかとなった。
 図6は、構築した最終予後予測モデルを用いて、教師群115サンプルを低危険群(46サンプル)と高危険群(69サンプル)に予測したグラフ、検証群58サンプルを低危険群(35サンプル)と高危険群(23サンプル)に予測したグラフを示している。なお、図6に示す低危険群とは、図5に示す境界により低危険群に分類されたサンプルで、高危険群とは図5に示す境界により高危険群に分類されたサンプルである。また、図6中の実線は、高危険群又は低危険群に分類された手術摘出肺がん試料173サンプルの手術後の実際に観察された予後に関する情報を示しており、破線は95%信頼区間を示している。実施例2で構築した最終予後予測モデルは、教師群のサンプルを用いて作成したモデルであることから、p値はp=6.8×10-9と非常に小さく、信頼性が高い。そして、作成した最終予後予測モデルを検証群に適用した際のp値はp=1.1×10-5であり、作成した最終予後予測モデルを適用した検証群の予測も、信頼度が高いことが明らかとなった。
 表18は、教師群中で低危険群(n=46)及び高危険群(n=69)に予測されたサンプル、並びに、検証群中で低危険群(n=35)及び高危険群(n=23)に予測されたサンプルの肺がんの種類を表している。表18から明らかなように、本発明の最終予後予測モデルを用いることで、肺がんの種類によらず高精度に予後を予測できることが明らかとなった。
Figure JPOXMLDOC01-appb-T000018
<実施例3>
 上記の173のサンプルから、肺がんとしては初期の段階であるI期の症例である94サンプルのみを選択し、当該94サンプルを教師群(55サンプル)及び検証群(39サンプル)に分けた以外は、<実施例2>と同様の手順で、最終予後予測モデルの検証を行った。
 図7は、実施例3で構築した最終予後予測モデルを用いて、教師群55サンプルを低危険群(34サンプル)と高危険群(21サンプル)に予測したグラフ、検証群39サンプルを低危険群(28サンプル)と高危険群(11サンプル)に予測したグラフを示している。実施例3で構築した最終予後予測モデルのp値はp=2.0×10-4であった。そして、作成した最終予後予測モデルを検証群に適用した際のp値はp=6.2×10-4であった。一般的に、p<0.05であれば統計学的に有意であると言えることから、作成した最終予後予測モデルの信頼度は高いと言える。以上の結果より、本発明の最終予後予測モデルは、初期段階の肺がん患者のサンプルからでも、高い精度で予後の予測ができることが明らかとなった。
 本発明に係る肺がん患者の予後予測方法及び予後予測装置を用いることで、肺がん患者の予後を高い精度で予測することができる。そのため、患者に適した術後治療を実施することができることから、医療機関や大学医学部などの研究機関等における肺がん患者の検査及び研究に有用である。

Claims (9)

  1.  肺がん患者の予後を予測するための情報を提供する方法であって、
     肺がん患者由来のサンプルにおいて、少なくとも、g1027(Accession No.sp|P12814|ACTN1_HUMAN)、g1237(Accession No.sp|P22392-2|NDKB_HUMAN)、g1463(Accession No.sp|P35221|CTNA1_HUMAN)及びg1821(Accession No.sp|P51690|ARSE_HUMAN)の4種類のタンパク質の発現量を測定する工程、
    を含む肺がん患者の予後を予測するための情報を提供する方法。
  2.  請求項1に記載の少なくとも4種類のタンパク質の発現量に基づいて、肺がん患者の再発可能性を予測する工程、
    を含む肺がん患者の予後予測方法。
  3.  前記肺がん患者の再発可能性を予測する工程が、
     前記少なくとも4種類のタンパク質を含むタンパク質群を用いてPartial Cox regression解析に基づき構築した最終予後予測モデルに、請求項1に記載の少なくとも4種類のタンパク質の発現量を当てはめリスクスコアを算出する工程、
    を含む請求項2に記載の肺がん患者の予後予測方法。
  4.  請求項1に記載の少なくとも4種類のタンパク質を含むタンパク質群の発現量に基づき構築した最終予後予測モデル又は閾値を格納した記憶手段、
     肺がん患者のサンプルに含まれる前記少なくとも4種類のタンパク質の発現量を、前記記憶手段に記憶された最終予後予測モデルに当てはめリスクスコアを算出、又は閾値と比較することで肺がん患者の再発可能性を予測する予測手段、
    を含む肺がん患者の予後予測装置。
  5.  前記最終予測モデルが、Partial Cox regression解析に基づき構築したモデルであることを特徴とする請求項4に記載の肺がん患者の予後予測装置。
  6.  コンピュータを、請求項4又は5に記載の肺がん患者の予後予測装置として機能させるためのプログラム。
  7.  請求項6に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
  8.  請求項1に記載の少なくとも4種類のタンパク質と同じアミノ酸配列を有する合成タンパク質を含み、
     前記合成タンパク質の各々が、同位体標識されたアミノ酸を含む内部標準。
  9.  請求項1に記載の少なくとも4種類のタンパク質を検出するための抗体。
PCT/JP2016/052072 2015-01-26 2016-01-26 肺がん患者の予後を評価するための情報を提供する方法、肺がん患者の予後予測方法、内部標準、抗体、肺がん患者の予後予測装置、予後予測装置のプログラム及び記録媒体 WO2016121715A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016572030A JPWO2016121715A1 (ja) 2015-01-26 2016-01-26 肺がん患者の予後を評価するための情報を提供する方法、肺がん患者の予後予測方法、内部標準、抗体、肺がん患者の予後予測装置、予後予測装置のプログラム及び記録媒体

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2015-012728 2015-01-26
JP2015012728 2015-01-26

Publications (1)

Publication Number Publication Date
WO2016121715A1 true WO2016121715A1 (ja) 2016-08-04

Family

ID=56543328

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2016/052072 WO2016121715A1 (ja) 2015-01-26 2016-01-26 肺がん患者の予後を評価するための情報を提供する方法、肺がん患者の予後予測方法、内部標準、抗体、肺がん患者の予後予測装置、予後予測装置のプログラム及び記録媒体

Country Status (2)

Country Link
JP (1) JPWO2016121715A1 (ja)
WO (1) WO2016121715A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018101450A1 (ja) * 2016-12-01 2018-06-07 味の素株式会社 癌モニタリングの方法、算出方法、評価装置、算出装置、評価プログラム、算出プログラム、評価システム、及び端末装置
WO2021241527A1 (ja) * 2020-05-25 2021-12-02 国立大学法人東海国立大学機構 非小細胞肺がんの化学療法の効果を予測するための情報を提供する方法および情報提供用キット、非小細胞肺がんの化学療法の効果を予測する方法、非小細胞肺がんの化学療法の効果を予測する予測装置、予測装置のプログラムおよび記録媒体

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003004640A1 (fr) * 2001-07-05 2003-01-16 Taiho Pharmaceutical Co., Ltd. Reseaux d'adn permettant de mesurer la sensibilite a un agent anticancereux
JP2003523732A (ja) * 1999-06-25 2003-08-12 フラームス・インテルウニフェルシタイル・インステイチュート・フォール・ビオテヒノロヒー・ヴェーゼットウェー マルチジンクフィンガー転写因子の核酸との結合
JP2006517412A (ja) * 2003-02-11 2006-07-27 トランスカリヨティック セラピーズ インコーポレーテッド 多重スルファターゼ欠損症およびその他のスルファターゼ欠損症の診断および治療
US20080166729A1 (en) * 2007-01-09 2008-07-10 Samsung Electronics Co., Ltd. Method of predicting risk of lung cancer recurrence, and a composition, kit and microarray for the same
JP2009523011A (ja) * 2005-12-01 2009-06-18 メディカル プログノシス インスティテュート 治療反応のバイオマーカーを同定するための方法および装置、ならびに治療効果を推定するためのその使用
JP2010540960A (ja) * 2007-10-03 2010-12-24 オーエスアイ・ファーマスーティカルズ・インコーポレーテッド インスリン様成長因子−1受容体キナーゼ阻害剤に対する抗癌反応を予測する生物学的マーカー
JP2011501660A (ja) * 2007-10-03 2011-01-13 オーエスアイ・ファーマスーティカルズ・インコーポレーテッド インスリン様成長因子−1受容体キナーゼ阻害剤に対する抗癌反応を予測する生物学的マーカー
JP4921522B2 (ja) * 2002-09-30 2012-04-25 オンコセラピー・サイエンス株式会社 非小細胞肺癌の診断のための方法
JP2012517238A (ja) * 2009-02-11 2012-08-02 カリス エムピーアイ インコーポレイテッド 腫瘍の分子プロファイリング法
JP2013507987A (ja) * 2009-10-26 2013-03-07 アボット・ラボラトリーズ 非小細胞肺癌の予後を決定するための診断方法
WO2014116170A1 (en) * 2013-01-22 2014-07-31 Neoproteomics Ab Platelet biomarkers in cancer diagnosis
WO2015008453A1 (ja) * 2013-07-16 2015-01-22 国立大学法人熊本大学 質量分析におけるペプチドピークの同定・定量のためのデータベース作成方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003523732A (ja) * 1999-06-25 2003-08-12 フラームス・インテルウニフェルシタイル・インステイチュート・フォール・ビオテヒノロヒー・ヴェーゼットウェー マルチジンクフィンガー転写因子の核酸との結合
WO2003004640A1 (fr) * 2001-07-05 2003-01-16 Taiho Pharmaceutical Co., Ltd. Reseaux d'adn permettant de mesurer la sensibilite a un agent anticancereux
JP4921522B2 (ja) * 2002-09-30 2012-04-25 オンコセラピー・サイエンス株式会社 非小細胞肺癌の診断のための方法
JP2006517412A (ja) * 2003-02-11 2006-07-27 トランスカリヨティック セラピーズ インコーポレーテッド 多重スルファターゼ欠損症およびその他のスルファターゼ欠損症の診断および治療
JP2009523011A (ja) * 2005-12-01 2009-06-18 メディカル プログノシス インスティテュート 治療反応のバイオマーカーを同定するための方法および装置、ならびに治療効果を推定するためのその使用
US20080166729A1 (en) * 2007-01-09 2008-07-10 Samsung Electronics Co., Ltd. Method of predicting risk of lung cancer recurrence, and a composition, kit and microarray for the same
JP2010540960A (ja) * 2007-10-03 2010-12-24 オーエスアイ・ファーマスーティカルズ・インコーポレーテッド インスリン様成長因子−1受容体キナーゼ阻害剤に対する抗癌反応を予測する生物学的マーカー
JP2011501660A (ja) * 2007-10-03 2011-01-13 オーエスアイ・ファーマスーティカルズ・インコーポレーテッド インスリン様成長因子−1受容体キナーゼ阻害剤に対する抗癌反応を予測する生物学的マーカー
JP2012517238A (ja) * 2009-02-11 2012-08-02 カリス エムピーアイ インコーポレイテッド 腫瘍の分子プロファイリング法
JP2013507987A (ja) * 2009-10-26 2013-03-07 アボット・ラボラトリーズ 非小細胞肺癌の予後を決定するための診断方法
WO2014116170A1 (en) * 2013-01-22 2014-07-31 Neoproteomics Ab Platelet biomarkers in cancer diagnosis
WO2015008453A1 (ja) * 2013-07-16 2015-01-22 国立大学法人熊本大学 質量分析におけるペプチドピークの同定・定量のためのデータベース作成方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JUN'ICHI OGAWA ET AL.: "2. Expression and prognosis of transition relation gene using postoperative fixed sample of the lung cancer", THE JAPANESE JOURNAL OF THORACIC AND CARDIOVASCULAR SURGERY, vol. 45, no. 3, 1997, pages 394 - 396 *
KIMURA K ET AL., CLINICAL SIGNIFICANCE OF S 100A4 AND E-CADHERIN-RELATED ADHESION MOLECULES IN NON-SMALL CELL LUNG CANCER, vol. 16, no. 6, 2000, pages 1125 - 1131 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018101450A1 (ja) * 2016-12-01 2018-06-07 味の素株式会社 癌モニタリングの方法、算出方法、評価装置、算出装置、評価プログラム、算出プログラム、評価システム、及び端末装置
JP2022090070A (ja) * 2016-12-01 2022-06-16 味の素株式会社 癌モニタリングの方法、算出方法、評価装置、算出装置、評価プログラム、算出プログラム、および評価システム
WO2021241527A1 (ja) * 2020-05-25 2021-12-02 国立大学法人東海国立大学機構 非小細胞肺がんの化学療法の効果を予測するための情報を提供する方法および情報提供用キット、非小細胞肺がんの化学療法の効果を予測する方法、非小細胞肺がんの化学療法の効果を予測する予測装置、予測装置のプログラムおよび記録媒体

Also Published As

Publication number Publication date
JPWO2016121715A1 (ja) 2017-11-02

Similar Documents

Publication Publication Date Title
EP2016405B1 (en) Methods and apparatus for identifying disease status using biomarkers
Porzycki et al. Modern biomarkers in prostate cancer diagnosis
US10713590B2 (en) Bagged filtering method for selection and deselection of features for classification
US9238841B2 (en) Multi-biomarker-based outcome risk stratification model for pediatric septic shock
US9940383B2 (en) Method, an arrangement and a computer program product for analysing a biological or medical sample
Yang et al. Similarities of ordered gene lists
CN106714556A (zh) 用于测定自闭症谱系病症风险的方法和系统
CN115144599B (zh) 蛋白组合在制备对儿童甲状腺癌进行预后分层的试剂盒中的用途及其试剂盒、系统
Papiez et al. BatchI: Batch effect Identification in high-throughput screening data using a dynamic programming algorithm
US20200024663A1 (en) Method for detecting mood disorders
WO2016121715A1 (ja) 肺がん患者の予後を評価するための情報を提供する方法、肺がん患者の予後予測方法、内部標準、抗体、肺がん患者の予後予測装置、予後予測装置のプログラム及び記録媒体
CN109735619B (zh) 与非小细胞肺癌预后相关的分子标志物及其应用
CN116312800A (zh) 一种基于血浆中循环rna全转录组测序的肺癌特征识别方法、装置和存储介质
KR102217272B1 (ko) 유전체 변이 정보를 이용한 질병 진단 바이오마커 추출 방법
US20180181705A1 (en) Method, an arrangement and a computer program product for analysing a biological or medical sample
Gacesa et al. A combination of fecal calprotectin and human beta-defensin 2 facilitates diagnosis and monitoring of inflammatory bowel disease
Campbell et al. Applying gene expression microarrays to pulmonary disease
WO2017221744A1 (ja) 肺がん検査用の情報を提供する方法、肺がんの検査方法、肺がんの検査装置、肺がんの検査装置のプログラム及び記録媒体、並びに肺がん検査用のmiRNA測定用キット
US20210272694A1 (en) Predicting biochemical recurrence based on computerized quantification of cribriform morphology
JP5307996B2 (ja) 判別因子セットを特定する方法、システム及びコンピュータソフトウェアプログラム
Karageorgiou The logic of exploratory and confirmatory data analysis
Lumbreras et al. Sources of error and its control in studies on the diagnostic accuracy of “‐omics” technologies
US20190385696A1 (en) Method for predicting disease risk based on analysis of complex genetic information
WO2021241527A1 (ja) 非小細胞肺がんの化学療法の効果を予測するための情報を提供する方法および情報提供用キット、非小細胞肺がんの化学療法の効果を予測する方法、非小細胞肺がんの化学療法の効果を予測する予測装置、予測装置のプログラムおよび記録媒体
JP6041331B1 (ja) 情報処理装置と情報処理プログラム並びに情報処理方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 16743318

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2016572030

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 16743318

Country of ref document: EP

Kind code of ref document: A1