WO2016159191A1 - 評価方法、評価装置、評価プログラム、評価システム、及び端末装置 - Google Patents

評価方法、評価装置、評価プログラム、評価システム、及び端末装置 Download PDF

Info

Publication number
WO2016159191A1
WO2016159191A1 PCT/JP2016/060576 JP2016060576W WO2016159191A1 WO 2016159191 A1 WO2016159191 A1 WO 2016159191A1 JP 2016060576 W JP2016060576 W JP 2016060576W WO 2016159191 A1 WO2016159191 A1 WO 2016159191A1
Authority
WO
WIPO (PCT)
Prior art keywords
evaluation
value
lung cancer
concentration
state
Prior art date
Application number
PCT/JP2016/060576
Other languages
English (en)
French (fr)
Inventor
直子 嵐田
瑠美 西本
和高 新保
英寛 中村
菜摘 西方
今泉 明
Original Assignee
味の素株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 味の素株式会社 filed Critical 味の素株式会社
Priority to JP2017510159A priority Critical patent/JP6687020B2/ja
Priority to KR1020237011364A priority patent/KR102564592B1/ko
Priority to KR1020177031516A priority patent/KR102519764B1/ko
Publication of WO2016159191A1 publication Critical patent/WO2016159191A1/ja
Priority to US15/715,389 priority patent/US20180017570A1/en

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6893Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids related to diseases not provided for elsewhere
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6806Determination of free amino acids
    • G01N33/6812Assays for specific amino acids
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57423Specifically defined cancers of lung
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/56Staging of a disease; Further complications associated with the disease

Definitions

  • the present invention relates to an evaluation method, an evaluation device, an evaluation program, an evaluation system, and a terminal device.
  • Lung cancer is a cancer that is difficult to cure, and when it is discovered, there are more than half of those that have already progressed and cannot be operated on.
  • stage I-II the 5-year survival rate for early stage lung cancer is 50% or more, especially for stage IA lung cancer (tumor is 3 cm or less with no lymph node metastasis and invasion of surrounding organs). The rate is about 90%, and early detection is important for lung cancer healing.
  • Diagnosis of lung cancer includes radiographs, CT, MRI, PET and other images, sputum cytology, bronchoscopic lung biopsy, percutaneous needle lung biopsy, test thoracotomy or thoracoscopic lung biopsy, etc. .
  • diagnosis based on images is not a definitive diagnosis.
  • the presence rate in chest X-ray examination is 20%, whereas the specificity is 0.1%, and the presence is found. Most of them are false positives.
  • the detection sensitivity is low, and according to the results of examination by the Ministry of Health, Labor and Welfare, there are reports that about 80% of lung cancer patients were overlooked in the chest X-ray examination in the case of indirect radiography. In particular, in early lung cancer, there is a concern that these methods may further reduce both detection sensitivity and detection specificity.
  • CT, MRI, PET, etc. have problems in carrying out a mass examination in terms of equipment and cost.
  • Lung biopsy with bronchoscope, percutaneous needle, test thoracotomy and thoracoscope is a definitive diagnosis, but it is a highly invasive examination, and lung biopsy is performed on all patients suspected of having lung cancer by diagnostic imaging Is not practical.
  • invasive diagnoses are burdensome, such as being painful for the patient, and there is also a risk of bleeding due to examination. It is desirable to select subjects with a high likelihood of developing lung cancer using a less invasive method and obtain a definitive diagnosis of lung cancer by lung biopsy. It is desirable from the aspect.
  • Non-Patent Document 1 glutamine is mainly used as an oxidative energy source, arginine is used as a nitrogen oxide, As a polyamine precursor, methionine has been reported to increase in consumption in cancer cells by activating methionine uptake ability of cancer cells.
  • Non-patent Document 2 Proenza et al.
  • Non-patent Document 3 Caszino
  • Non-Patent Document 4 an increase in arginase I gene expression and enzyme activity is observed in bone marrow cells in contact with cancer cells, resulting in a decrease in plasma arginine concentration. There is a report.
  • Patent Document 3 relating to a method for evaluating the state of lung cancer using amino acid concentration is disclosed. Further, Patent Documents 4-6 relating to a method for associating amino acid concentration with a biological state are disclosed.
  • the present invention has been made in view of the above, and provides an evaluation method, an evaluation device, an evaluation program, an evaluation system, and a terminal device that can provide highly reliable information that can be helpful in knowing the state of lung cancer.
  • the purpose is to provide.
  • the evaluation method according to the present invention comprises 15 kinds of metabolites (Homoargine (homoarginine), GABA ( ⁇ -aminobutyric acid) ( ⁇ -) in the blood to be evaluated.
  • Homoargine homoarginine
  • GABA ⁇ -aminobutyric acid
  • Aminobutyric acid 3-Me-His (3-methyl-histidine) (3-methylhistidine), ADMA (asymmetric dimethylargine) (asymmetric dimethylarginine), spermine, spermidine, cystathionine, cystathionine Sarcosine (sarcosine), aAiBA ( ⁇ -amino-iso-butyric acid) ( ⁇ -aminoisobutyric acid), bAiBA ( ⁇ -amino-iso-) butyric acid) ( ⁇ -aminoisobutyric acid), putrescine (putrescine), N-acetyl-L-lys (N-acetyl-L-lysine) (N-acetyl-L-lysine), hypotaurine (hypotaurine), bABA ( ⁇ - The method includes an evaluation step of evaluating the state of lung cancer with respect to the evaluation object using at least one concentration value of aminobutyric acid ( ⁇ -aminobutyric acid) and
  • 19 kinds of amino acids (Asn, His, Thr, Ala, Cit, Arg, Tyr, Val, Met, (Lys, Trp, Gly, Pro, Orn, Ile, Leu, Phe, Ser, Gln) is further used.
  • an expression including a variable into which at least one concentration value of the 15 types of metabolites is substituted (hereinafter, an evaluation expression and Is further used to calculate the value of the formula (hereinafter may be referred to as the value of the evaluation formula or the evaluation value), thereby evaluating the state of lung cancer for the evaluation target. It is characterized by this.
  • the evaluation step further uses a concentration value of at least one of the 19 kinds of amino acids in the blood to be evaluated. It further includes a variable to which at least one concentration value of the amino acids of the types is substituted.
  • the evaluation apparatus is an evaluation apparatus including a control unit, and the control unit uses a concentration value of at least one of the 15 types of metabolites in the blood to be evaluated, An evaluation means for evaluating the state of lung cancer is provided for the evaluation object.
  • the evaluation method according to the present invention is an evaluation method executed in an information processing apparatus including a control unit, and is executed by the control unit among the 15 types of metabolites in the blood to be evaluated. And an evaluation step of evaluating a state of lung cancer for the evaluation object using at least one concentration value.
  • the evaluation program according to the present invention is an evaluation program for execution in an information processing apparatus provided with a control unit, and the 15 types of metabolites in the blood to be evaluated for execution in the control unit.
  • a recording medium is a non-transitory computer-readable recording medium, and includes a programmed instruction for causing an information processing apparatus to execute the evaluation method.
  • the evaluation system includes an evaluation device including a control unit and a control unit, and provides concentration data regarding at least one concentration value of the 15 types of metabolites in the blood to be evaluated.
  • An evaluation system configured by connecting a terminal device to be communicable via a network, wherein the control unit of the terminal device transmits concentration data to be evaluated to the evaluation device.
  • a result receiving means for receiving an evaluation result relating to a state of lung cancer in the evaluation target, transmitted from the evaluation apparatus, wherein the control unit of the evaluation apparatus transmits the evaluation transmitted from the terminal apparatus.
  • the density data receiving means for receiving the density data of the target, and the density data of the evaluation target received by the density data receiving means A result of transmitting the evaluation result obtained by the evaluation means to the terminal device using the concentration value of at least one of the metabolites of the class, and evaluating the lung cancer state for the evaluation object And a transmission means.
  • the terminal device is a terminal device including a control unit, and the control unit includes a result acquisition unit that acquires an evaluation result regarding a state of lung cancer in an evaluation target, and the evaluation result is It is a result of evaluating the state of lung cancer with respect to the evaluation object using the concentration value of at least one of the 15 types of metabolites in the blood of the evaluation object.
  • the terminal device is configured to be communicably connected to an evaluation device that evaluates the state of lung cancer for the evaluation target via the network in the terminal device.
  • the apparatus further comprises concentration data transmitting means for transmitting concentration data related to the concentration value of at least one of the 15 types of metabolites in the blood to be evaluated to the evaluation apparatus, and the result acquisition means transmits from the evaluation apparatus Receiving the evaluated result.
  • the evaluation apparatus is connected to a terminal device that provides concentration data related to the concentration value of at least one of the 15 types of metabolites in the blood to be evaluated via a network
  • An evaluation apparatus including a control unit, wherein the control unit receives density data of the evaluation target transmitted from the terminal device, and the evaluation target received by the density data receiving unit Obtained by the evaluation means for evaluating the state of lung cancer for the evaluation object using the concentration value of at least one of the 15 types of metabolites included in the concentration data of And a result transmitting means for transmitting the evaluation result to the terminal device.
  • the state of lung cancer is evaluated for the evaluation object using the concentration value of at least one of the 15 types of metabolites in the blood of the evaluation object, it is useful for knowing the state of lung cancer. It is possible to provide highly reliable information that can be.
  • FIG. 1 is a principle configuration diagram showing the basic principle of the first embodiment.
  • FIG. 2 is a principle configuration diagram showing the basic principle of the second embodiment.
  • FIG. 3 is a diagram illustrating an example of the overall configuration of the present system.
  • FIG. 4 is a diagram showing another example of the overall configuration of the present system.
  • FIG. 5 is a block diagram showing an example of the configuration of the evaluation apparatus 100 of this system.
  • FIG. 6 is a diagram illustrating an example of information stored in the user information file 106a.
  • FIG. 7 is a diagram showing an example of information stored in the density data file 106b.
  • FIG. 8 is a diagram illustrating an example of information stored in the index state information file 106c.
  • FIG. 9 is a diagram illustrating an example of information stored in the designated index state information file 106d.
  • FIG. 10 is a diagram illustrating an example of information stored in the evaluation formula file 106e1.
  • FIG. 11 is a diagram illustrating an example of information stored in the evaluation result file 106f.
  • FIG. 12 is a block diagram illustrating a configuration of the evaluation unit 102i.
  • FIG. 13 is a block diagram illustrating an example of the configuration of the client device 200 of the present system.
  • FIG. 14 is a block diagram showing an example of the configuration of the database apparatus 400 of this system.
  • FIG. 15 is a diagram showing a list of logistic regression equations.
  • FIG. 16 is a diagram showing a list of logistic regression equations.
  • FIG. 17 is a diagram showing a list of logistic regression equations.
  • FIG. 18 is a diagram showing a list of logistic regression equations.
  • FIG. 19 is a diagram showing a list of logistic regression equations.
  • FIG. 20 is a diagram showing a list of logistic regression equations.
  • FIG. 21 is a diagram showing a list of logistic regression equations.
  • FIG. 22 is a diagram showing a list of logistic regression equations.
  • FIG. 23 is a diagram showing a list of logistic regression equations.
  • FIG. 24 is a diagram showing a list of logistic regression equations.
  • FIG. 25 is a diagram showing a list of logistic regression equations.
  • FIG. 26 is a diagram showing a list of logistic regression equations.
  • FIG. 27 is a diagram showing a list of logistic regression equations.
  • FIG. 28 is a diagram showing a list of logistic regression equations.
  • FIG. 29 is a diagram showing a list of logistic regression equations.
  • FIG. 20 is a diagram showing a list of logistic regression equations.
  • FIG. 21 is a diagram showing a list of logistic regression equations.
  • FIG. 22 is a diagram
  • FIG. 30 is a diagram showing a list of logistic regression equations.
  • FIG. 31 is a diagram showing a list of logistic regression equations.
  • FIG. 32 is a diagram showing a list of logistic regression equations.
  • FIG. 33 is a diagram showing a list of logistic regression equations.
  • FIG. 34 is a diagram showing a list of logistic regression equations.
  • FIG. 35 is a diagram showing a list of logistic regression equations.
  • FIG. 36 is a diagram showing a list of logistic regression equations.
  • FIG. 37 is a diagram showing a list of logistic regression equations.
  • FIG. 38 is a diagram showing a list of logistic regression equations.
  • FIG. 39 is a diagram showing a list of logistic regression equations.
  • FIG. 40 is a diagram showing a list of logistic regression equations.
  • FIG. 40 is a diagram showing a list of logistic regression equations.
  • FIG. 41 is a diagram showing a list of logistic regression equations.
  • FIG. 42 is a diagram showing a list of logistic regression equations.
  • FIG. 43 is a diagram showing a list of logistic regression equations.
  • FIG. 44 is a diagram showing a list of logistic regression equations.
  • FIG. 45 is a diagram showing a list of logistic regression equations.
  • FIG. 46 is a diagram showing a list of logistic regression equations.
  • FIG. 47 is a diagram showing a list of logistic regression equations.
  • FIG. 48 is a diagram showing a list of logistic regression equations.
  • FIG. 49 is a diagram showing a list of logistic regression equations.
  • FIG. 50 is a diagram showing a list of logistic regression equations.
  • FIG. 51 is a diagram showing a list of logistic regression equations.
  • FIG. 52 is a diagram showing a list of logistic regression equations.
  • FIG. 53 is a diagram showing a list of logistic regression equations.
  • FIG. 54 is a diagram showing a list of logistic regression equations.
  • FIG. 55 is a diagram showing a list of logistic regression equations.
  • FIG. 56 is a diagram showing a list of logistic regression equations.
  • FIG. 57 is a diagram showing a list of logistic regression equations.
  • FIG. 58 is a diagram showing a list of logistic regression equations.
  • FIG. 59 is a diagram showing a list of logistic regression equations.
  • FIG. 60 is a diagram showing a list of logistic regression equations.
  • FIG. 61 is a diagram showing a list of logistic regression equations.
  • FIG. 62 is a diagram showing a list of logistic regression equations.
  • FIG. 63 is a diagram showing a list of logistic regression equations.
  • FIG. 64 is a diagram showing a list of logistic regression equations.
  • FIG. 65 is a diagram showing chromatograms when the pool plasma of healthy subjects and the pool plasma of lung cancer patients were measured.
  • FIG. 66 is a diagram showing a list of logistic regression equations.
  • FIG. 67 is a diagram showing a list of logistic regression equations.
  • FIG. 68 is a diagram showing a list of logistic regression equations.
  • FIG. 69 is a diagram showing a list of logistic regression equations.
  • FIG. 70 is a diagram showing a list of logistic regression equations.
  • FIG. 71 is a diagram showing a list of logistic regression equations.
  • FIG. 72 is a diagram showing a list of logistic regression equations.
  • Embodiments of an evaluation method according to the present invention (first embodiment) and embodiments of an evaluation apparatus, an evaluation method, an evaluation program, a recording medium, an evaluation system, and a terminal device according to the present invention (second embodiment) ) Will be described in detail with reference to the drawings. Note that the present invention is not limited to these embodiments.
  • FIG. 1 is a principle configuration diagram showing the basic principle of the first embodiment.
  • At least one of the above-mentioned 15 types of metabolites and the 19 types of amino acids in blood is acquired (step S11).
  • concentration data relating to the blood substance measured by a company or the like that performs concentration value measurement may be acquired.
  • the blood substance concentration value is measured by measuring the blood substance concentration value from the blood collected from the evaluation object by, for example, the following measurement method (A), (B), or (C).
  • Concentration data may be acquired.
  • the unit of the concentration value of the blood substance may be, for example, a molar concentration, a weight concentration or an enzyme activity, and may be obtained by adding / subtracting / subtracting an arbitrary constant to / from these concentrations.
  • Plasma is separated from blood by centrifuging the collected blood sample. All plasma samples are stored frozen at ⁇ 80 ° C. until the concentration value is measured.
  • concentration value measurement acetonitrile was added to remove protein, followed by precolumn derivatization using a labeling reagent (3-aminopyridyl-N-hydroxysuccinimidyl carbamate), and liquid chromatograph mass spectrometry The concentration value is analyzed by a meter (LC / MS) (see International Publication No. 2003/069328, International Publication No. 2005/116629).
  • LC / MS liquid chromatograph mass spectrometry
  • sulfosalicylic acid is added to remove the protein, and then the concentration value is analyzed by an amino acid analyzer based on the post-column derivatization method using a ninhydrin reagent.
  • C The collected blood sample is subjected to blood cell separation using a membrane, MEMS technology, or the principle of centrifugation to separate plasma or serum from the blood. Plasma or serum samples that are not measured immediately after plasma or serum are obtained are stored frozen at ⁇ 80 ° C. until the concentration is measured.
  • the concentration value is analyzed by quantifying a substance that increases or decreases by substrate recognition or a spectroscopic value using a molecule that reacts with or binds to a target blood substance such as an enzyme or an aptamer.
  • At least one concentration value of the 15 types of metabolites and the 19 types of amino acids included in the concentration data acquired in step S11 is used as an evaluation value for evaluating the state of lung cancer. Then, the state of lung cancer is evaluated for the evaluation target (step S12). Note that before executing step S12, data such as missing values and outliers may be removed from the density data acquired in step S11.
  • concentration data to be evaluated is acquired in step S11, and in step S12, the 15 types of metabolites included in the evaluation object concentration data acquired in step S11 and the above-described concentration data.
  • concentration data to be evaluated is acquired in step S11, and in step S12, the 15 types of metabolites included in the evaluation object concentration data acquired in step S11 and the above-described concentration data.
  • the state of lung cancer is evaluated for the evaluation object. Thereby, it is possible to provide highly reliable information that can be helpful in knowing the state of lung cancer.
  • the concentration value of at least one of the 15 types of metabolites and the 19 types of amino acids reflects the state of lung cancer for the evaluation target. It may be determined that the value after conversion is reflected by the lung cancer state of the evaluation target. In other words, the density value or the converted value itself may be treated as an evaluation result regarding the state of lung cancer for the evaluation target.
  • the possible range of the density value is a predetermined range (for example, a range from 0.0 to 1.0, a range from 0.0 to 10.0, a range from 0.0 to 100.0, or -10.0 to
  • a predetermined range for example, exponential conversion, logarithmic conversion, Conversion by angle conversion, square root conversion, probit conversion, reciprocal conversion, Box-Cox conversion, power conversion, etc., and by combining these calculations for density values, the density values are converted. May be.
  • the value of an exponential function with the concentration value as the index and the Napier number as the base (specifically, the probability p that the state of the lung cancer is a predetermined state (for example, a state exceeding the reference value, etc.) is defined.
  • the natural logarithm ln (p / (1-p)) when the natural logarithm ln is equal to the concentration value) may be further calculated, and the calculated exponential function value may be 1 And a value divided by the sum of the value and the value (specifically, the value of the probability p) may be further calculated. Further, the density value may be converted so that the value after conversion under a specific condition becomes a specific value.
  • the density value may be converted so that the value after conversion when the specificity is 80% is 5.0 and the value after conversion when the specificity is 95% is 8.0.
  • the concentration distribution may be converted into a normal distribution and then converted into a deviation value so that the average is 50 and the standard deviation is 10.
  • position information regarding the position of a predetermined mark on a predetermined ruler that is visibly displayed on a display device such as a monitor or a physical medium such as paper is obtained from at least the 15 types of metabolites and the 19 types of amino acids.
  • the predetermined ruler is used for evaluating the state of lung cancer.
  • the ruler is a ruler with a scale, and the range of the concentration value or the value after conversion, That is, at least a scale corresponding to the upper limit value and the lower limit value in “part” is shown.
  • the predetermined mark corresponds to the density value or the value after conversion, and is, for example, a circle mark or a star mark.
  • the concentration value of at least one of the 15 kinds of metabolites and the 19 kinds of amino acids is a predetermined value (mean value ⁇ 1SD, 2SD, 3SD, N quantile, N percentile, or clinical significance is recognized.
  • the condition of lung cancer may be evaluated with respect to the evaluation target when the value is lower than or lower than a predetermined value or higher than the predetermined value or higher than the predetermined value.
  • a concentration deviation value (a value obtained by normalizing the concentration distribution by gender for each metabolite and each amino acid and then making the deviation value so that the average is 50 and the standard deviation is 10) It may be used.
  • the evaluation subject is lung cancer.
  • the state may be evaluated.
  • the condition of lung cancer may be evaluated for the evaluation object by calculating the value of the expression using an expression including
  • the calculated formula value may be determined to reflect the state of lung cancer about the evaluation target, and further, the formula value is converted by, for example, the following method, and the converted value is You may determine that it reflects the state of the lung cancer about evaluation object. In other words, the value of the expression or the converted value itself may be treated as an evaluation result regarding the state of lung cancer for the evaluation target.
  • a possible range of the value of the evaluation formula is a predetermined range (for example, a range from 0.0 to 1.0, a range from 0.0 to 10.0, a range from 0.0 to 100.0, or ⁇ 10.
  • an arbitrary value is added / subtracted / divided / divided with respect to the value of the evaluation expression, or the value of the evaluation expression is converted into a predetermined conversion method (for example, Such as exponential transformation, logarithmic transformation, angular transformation, square root transformation, probit transformation, reciprocal transformation, Box-Cox transformation, or exponentiation transformation), or a combination of these calculations for the value of the evaluation expression By doing so, the value of the evaluation formula may be converted.
  • a predetermined conversion method for example, Such as exponential transformation, logarithmic transformation, angular transformation, square root transformation, probit transformation, reciprocal transformation, Box-Cox transformation, or exponentiation transformation
  • a value p of an exponential function having an evaluation formula value as an index and a Napier number as a base is defined.
  • a probability p that a lung cancer state is a predetermined state for example, a state exceeding a reference value, etc.
  • the natural logarithm ln (p / (1-p)) is equal to the value of the evaluation formula)
  • the calculated exponential function may be calculated.
  • a value obtained by dividing the value of 1 by the sum of 1 and the value (specifically, the value of probability p) may be further calculated.
  • the value of the evaluation expression may be converted so that the value after conversion under a specific condition becomes a specific value.
  • the value of the evaluation expression may be converted so that the value after conversion when the specificity is 80% is 5.0 and the value after conversion when the specificity is 95% is 8.0.
  • the deviation value may be converted to an average of 50 and a standard deviation of 10. These conversions may be performed by gender or age.
  • the evaluation value in this specification may be the value of the evaluation formula itself, or may be a value after converting the value of the evaluation formula.
  • the position information on the position of a predetermined mark on a predetermined ruler that is visible on a display device such as a monitor or a physical medium such as paper is converted into an expression value or the value of the expression It may be generated using a later value and it may be determined that the generated position information reflects the state of lung cancer for the evaluation target.
  • the predetermined ruler is for evaluating the state of lung cancer.
  • the ruler is a ruler with a scale, and the expression range or the range after conversion can be taken, or the range , A scale corresponding to the upper limit value and the lower limit value in “part of” is shown at least.
  • the predetermined mark corresponds to the value of the expression or the value after conversion, and is, for example, a circle mark or a star mark.
  • the degree of possibility that the evaluation target suffers from lung cancer may be qualitatively evaluated.
  • “at least one concentration value of the 15 types of metabolites and the 19 types of amino acids and one or more preset threshold values” or “the 15 types of metabolites and the 19 types of metabolites” An evaluation formula including a variable to which at least one concentration value of the amino acids of the above-mentioned amino acids, at least one concentration value of the 15 types of metabolites and the 19 types of amino acids are substituted, and one or more preset values
  • the evaluation target may be classified into any one of a plurality of categories defined in consideration of at least the degree of possibility of suffering from lung cancer.
  • categories for example, described in the examples for belonging to subjects who are highly likely to be affected by lung cancer (for example, subjects considered to be affected by lung cancer) Rank C or the like), a category (for example, Rank A or the like described in the examples) for assigning a subject having a low possibility of suffering from lung cancer (for example, a subject regarded as not having lung cancer) ), And a category (for example, rank B described in the examples) for belonging to a subject having a moderate possibility of suffering from lung cancer may be included.
  • a plurality of categories include a category for assigning a subject having a high possibility of suffering from lung cancer (for example, the lung cancer category described in Examples), and a possibility of suffering from lung cancer.
  • categories for belonging to subjects with a low degree of disease for example, healthy categories for belonging to subjects that are highly likely to be healthy (for example, subjects that are considered healthy) described in the Examples) It may be.
  • the density value or the expression value may be converted by a predetermined method, and the evaluation target may be classified into any one of a plurality of categories using the converted value.
  • the form of the formula is not particularly limited.
  • multiple regression formula based on least square method linear discriminant, linear model such as principal component analysis, canonical discriminant analysis, logistic regression based on maximum likelihood method, Cox regression, etc.
  • Formulas created by cluster analysis such as generalized linear models, generalized linear models plus generalized linear mixed models that take into account random effects such as inter-individual differences and inter-facility differences, K-means method, hierarchical cluster analysis, etc.
  • MCMC Markov chain Monte Carlo method
  • Bayesian network Hierarchical Bayes method
  • formulas created based on Bayesian statistics formulas created by class classification such as support vector machines and decision trees, fractional formulas, methods that do not belong to the above categories
  • class classification such as support vector machines and decision trees
  • fractional formulas methods that do not belong to the above categories
  • any one of the formulas created by and the sum of different types of formulas any one of the formulas created by and the sum of different types of formulas.
  • the formula adopted as the evaluation formula is described in, for example, the method described in International Publication No. 2004/052191 that is an international application by the present applicant or International Publication No. 2006/098192 that is an international application by the present applicant. You may create by the method of. It should be noted that the formulas obtained by these methods are suitable for evaluating the state of lung cancer regardless of the metabolite and / or amino acid concentration value unit in the concentration data as input data. Can be used.
  • a coefficient and a constant term are added to each variable.
  • the coefficient and the constant term are preferably real numbers, and more preferably May be any value belonging to the range of the 99% confidence interval of the coefficient and constant term obtained for performing the various classifications from the data, and more preferably, the value obtained for performing the various classifications from the data. Any value may be used as long as it falls within the 95% confidence interval of the obtained coefficient and constant term.
  • the value of each coefficient and its confidence interval may be obtained by multiplying it by a real number, and the value of the constant term and its confidence interval may be obtained by adding / subtracting / multiplying / dividing an arbitrary real constant thereto.
  • the fractional expression means that the numerator of the fractional expression is represented by the sum of variables A, B, C,... And / or the denominator of the fractional expression is the sum of variables a, b, c,. It is represented by
  • the fractional expression includes a sum of fractional expressions ⁇ , ⁇ , ⁇ ,.
  • the fractional expression also includes a divided fractional expression. Note that each variable used in the numerator and denominator may have an appropriate coefficient. The variables used for the numerator and denominator may overlap. Further, an appropriate coefficient may be attached to each fractional expression. Further, the value of the coefficient of each variable and the value of the constant term may be real numbers.
  • the fractional expression includes one in which the numerator variable and the denominator variable are interchanged.
  • Albumin total protein, triglyceride (neutral fat), HbA1c, glycated albumin, insulin resistance index, total cholesterol, LDL cholesterol, HDL cholesterol, amylase, total bilirubin, creatinine, estimated glomerular filtration rate (eGFR), uric acid, GOT (AST), GPT (ALT), GGTP ( ⁇ -GTP), glucose (blood glucose level), CRP (C-reactive protein), red blood cells, hemoglobin, hematocrit, MCV, MCH, MCHC, white blood cells, platelet count, etc.
  • FIG. 2 is a principle configuration diagram showing the basic principle of the second embodiment.
  • the description overlapping the first embodiment described above may be omitted.
  • the value of the evaluation formula or the value after the conversion is used as an example when evaluating the state of lung cancer is described here, for example, “the above 15 types of metabolites and the above 19 types of metabolites”
  • a concentration value of at least one of “amino acids” or a value after the conversion may be used.
  • the control unit is included in the concentration data of the evaluation target (for example, an individual such as an animal or a human) acquired in advance regarding the concentration value of at least one of the 15 types of metabolites and the 19 types of amino acids in the blood. , At least one concentration value of the 15 metabolites and the 19 amino acids, and a variable to which at least one concentration value of the 15 metabolites and the 19 amino acids is substituted.
  • the state of the lung cancer is evaluated for the evaluation target by calculating the value of the expression using the expression stored in advance in the storage unit (step S21).
  • step S21 at least one concentration value of the 15 kinds of metabolites and the 19 kinds of amino acids included in the concentration data to be evaluated, and the evaluation formula By calculating the value of the evaluation formula using an expression including a variable to which at least one concentration value of the 15 types of metabolites and the 19 types of amino acids stored in the storage unit is substituted. Evaluate the status of lung cancer for the subject to be evaluated. Thereby, it is possible to provide highly reliable information that can be helpful in knowing the state of lung cancer.
  • step 1 to step 4 the outline of the evaluation formula creation process (step 1 to step 4) will be described in detail. Note that the processing described here is merely an example, and the method of creating the evaluation formula is not limited to this.
  • control unit is a candidate formula (evaluation formula candidate) based on a predetermined formula creation method from index state information stored in advance in the storage unit including concentration data and index data relating to an index representing the state of lung cancer.
  • y a1x1 + a2x2 +... + Anxn
  • y index data
  • xi density data
  • ai constant
  • i 1, 2,..., N
  • step 1 multiple different formula creation methods (principal component analysis and discriminant analysis, support vector machine, multiple regression analysis, Cox regression analysis, logistic regression analysis, k-means method, cluster analysis, determination from index state information
  • a plurality of candidate expressions may be created using a combination of multivariate analysis such as trees).
  • index state information which is multivariate data composed of concentration data and index data obtained by analyzing blood obtained from many healthy groups and lung cancer groups.
  • a plurality of groups of candidate formulas may be created concurrently.
  • discriminant analysis and logistic regression analysis may be performed simultaneously using different algorithms to create two different candidate formulas.
  • the candidate formulas may be created by converting index state information using candidate formulas created by performing principal component analysis and performing discriminant analysis on the converted index status information. Thereby, finally, an optimal evaluation formula can be created.
  • the candidate formula created using the principal component analysis is a linear formula including each variable that maximizes the variance of all density data.
  • Candidate formulas created using discriminant analysis are high-order formulas (including exponents and logarithms) that contain variables that minimize the ratio of the sum of variances within each group to the variance of all concentration data. is there.
  • the candidate formula created using the support vector machine is a high-order formula (including a kernel function) including variables that maximize the boundary between groups.
  • the candidate formula created using the multiple regression analysis is a high-order formula including each variable that minimizes the sum of the distances from all density data.
  • the candidate formula created using Cox regression analysis is a linear model including a log hazard ratio, and is a linear expression including each variable and its coefficient that maximize the likelihood of the model.
  • the candidate formula created using logistic regression analysis is a linear model that represents log odds of probability, and is a linear formula that includes each variable that maximizes the likelihood of the probability.
  • k-means method k neighborhoods of each density data are searched, the largest group among the groups to which the neighboring points belong is defined as the group to which the data belongs, and the group to which the input density data belongs. This is a method for selecting a variable that best matches the group defined as.
  • Cluster analysis is a technique for clustering (grouping) points that are closest to each other in all density data. Further, the decision tree is a technique for predicting a group of density data from patterns that can be taken by variables with higher ranks by adding ranks to the variables.
  • control unit verifies (mutually verifies) the candidate formula created in step 1 based on a predetermined verification method (step 2).
  • Candidate expressions are verified for each candidate expression created in step 1.
  • step 2 the discrimination rate, sensitivity, specificity, information criterion, ROC_AUC (reception of candidate expressions) based on at least one of the bootstrap method, holdout method, N-fold method, leave one-out method, etc.
  • the area under the curve of the person characteristic curve may be verified.
  • the discrimination rate is a lung cancer evaluation method according to the present embodiment.
  • An evaluation object whose true state is negative for example, an evaluation object that does not suffer from lung cancer
  • the true state Is a rate at which an evaluation object (for example, an evaluation object suffering from lung cancer) is correctly evaluated as positive.
  • Sensitivity is the rate at which an evaluation object whose true state is positive is correctly evaluated as positive in the lung cancer evaluation method according to the present embodiment.
  • the specificity is a ratio in which the evaluation object whose true state is negative is correctly evaluated as negative in the lung cancer evaluation method according to the present embodiment.
  • the Akaike Information Criterion is a standard that expresses how closely the observed data matches the statistical model in the case of regression analysis, etc., and is expressed as “ ⁇ 2 ⁇ (maximum log likelihood of statistical model) + 2 ⁇ (statistics).
  • the model having the smallest value defined by “the number of free parameters of the model)” is determined to be the best.
  • ROC_AUC area under the curve of the receiver characteristic curve
  • ROC receiver characteristic curve
  • the value of ROC_AUC is 1 in complete discrimination, and the closer this value is to 1, the higher the discriminability.
  • the predictability is an average of the discrimination rate, sensitivity, and specificity obtained by repeating the verification of candidate formulas.
  • Robustness is the variance of discrimination rate, sensitivity, and specificity obtained by repeating verification of candidate formulas.
  • control unit selects a variable of the candidate formula based on a predetermined variable selection method, so that the combination of density data included in the index state information used when creating the candidate formula is selected. Select (step 3).
  • the selection of variables may be performed for each candidate formula created in step 1. Thereby, the variable of a candidate formula can be selected appropriately.
  • Step 1 is executed again using the index state information including the density data selected in Step 3.
  • the candidate expression variable may be selected from the verification result in step 2 based on at least one of the stepwise method, the best path method, the neighborhood search method, and the genetic algorithm.
  • the best path method is a method of selecting variables by sequentially reducing the variables included in the candidate formula one by one and optimizing the evaluation index given by the candidate formula.
  • the control unit repeatedly executes the above-described step 1, step 2, and step 3, and adopts it as an evaluation formula from a plurality of candidate formulas based on the verification results accumulated thereby.
  • An evaluation formula is created by selecting candidate formulas (step 4).
  • the selection of candidate formulas includes, for example, selecting an optimal formula from candidate formulas created by the same formula creation method and selecting an optimal formula from all candidate formulas.
  • evaluation formula creation process processing related to creation of candidate formulas, verification of candidate formulas and selection of variables of candidate formulas is systematized (systemized) based on the index status information. This makes it possible to create an optimal evaluation formula for evaluating lung cancer.
  • the concentration of the blood substance containing at least one of the 15 types of metabolites and the 19 types of amino acids is used for multivariate statistical analysis, and an optimal and robust set of variables is set.
  • an evaluation formula with high evaluation performance is extracted by combining the variable selection method and cross validation.
  • FIG. 3 is a diagram showing an example of the overall configuration of the present system.
  • FIG. 4 is a diagram showing another example of the overall configuration of the present system.
  • the present system includes an evaluation apparatus 100 that evaluates the state of lung cancer for an individual to be evaluated, and at least one of the 15 types of metabolites and the 19 types of amino acids in blood.
  • a client device 200 (corresponding to the terminal device of the present invention) that provides individual concentration data relating to the concentration value of the contained blood substance is connected via a network 300 so as to be communicable.
  • the present system is used when evaluating the index state information used when creating an evaluation formula in the evaluation device 100 and the state of lung cancer, as shown in FIG.
  • the database apparatus 400 storing the evaluation formula and the like may be configured to be communicably connected via the network 300.
  • information that is useful for knowing the state of lung cancer is provided from the evaluation apparatus 100 to the client apparatus 200 or the database apparatus 400, or from the client apparatus 200 or the database apparatus 400 to the evaluation apparatus 100 via the network 300.
  • the information that is helpful in knowing the state of lung cancer is, for example, information about values measured for specific items related to the state of lung cancer of organisms including humans.
  • information that is useful for knowing the state of lung cancer is generated by the evaluation apparatus 100, the client apparatus 200, and other apparatuses (for example, various measurement apparatuses) and is mainly stored in the database apparatus 400.
  • FIG. 5 is a block diagram showing an example of the configuration of the evaluation apparatus 100 of the present system, and conceptually shows only the portion related to the present invention in the configuration.
  • the evaluation apparatus 100 can communicate the evaluation apparatus with the network 300 via a control unit 102 such as a CPU that comprehensively controls the evaluation apparatus, a communication apparatus such as a router, and a wired or wireless communication line such as a dedicated line.
  • the evaluation apparatus 100 may be configured in the same housing as various analysis apparatuses (for example, an amino acid analysis apparatus).
  • a configuration for calculating (measuring) and outputting (printing, monitor display, etc.) a concentration value of a predetermined blood substance containing at least one of the 15 kinds of metabolites and 19 kinds of amino acids in the blood In a small analyzer equipped with hardware and software, an evaluation unit 102i described later may be further provided, and a result obtained by the evaluation unit 102i may be output using the above configuration.
  • the storage unit 106 is a storage means, and for example, a memory device such as a RAM / ROM, a fixed disk device such as a hard disk, a flexible disk, an optical disk, or the like can be used.
  • the storage unit 106 stores a computer program for giving instructions to the CPU and performing various processes in cooperation with an OS (Operating System).
  • the storage unit 106 includes a user information file 106a, a density data file 106b, an index state information file 106c, a specified index state information file 106d, an evaluation formula related information database 106e, and an evaluation result file 106f. , Store.
  • the user information file 106a stores user information related to users.
  • FIG. 6 is a diagram illustrating an example of information stored in the user information file 106a.
  • the information stored in the user information file 106a includes a user ID for uniquely identifying a user and authentication for whether or not the user is a valid person.
  • the concentration data file 106b stores concentration data relating to concentration values of blood substances including at least one of the 15 types of metabolites and the 19 types of amino acids in the blood.
  • FIG. 7 is a diagram showing an example of information stored in the density data file 106b.
  • the information stored in the density data file 106b is configured by associating an individual number for uniquely identifying an individual (sample) to be evaluated with density data.
  • the density data is handled as a numerical value, that is, a continuous scale, but the density data may be a nominal scale or an order scale. In the case of a nominal scale or an order scale, analysis may be performed by giving an arbitrary numerical value to each state.
  • values related to other biological information may be combined with the density data.
  • the index state information file 106c stores the index state information used when creating the evaluation formula.
  • FIG. 8 is a diagram illustrating an example of information stored in the index state information file 106c.
  • the information stored in the index state information file 106c includes an individual number and index data (T) relating to an index (index T1, index T2, index T3,...) Representing a lung cancer state, Concentration data is associated with each other.
  • the index data and the density data are handled as numerical values (that is, continuous scales), but the index data and the density data may be nominal scales or order scales. In the case of a nominal scale or an order scale, analysis may be performed by giving an arbitrary numerical value to each state.
  • the index data is a known index that serves as a marker of lung cancer status, and numerical data may be used.
  • the designated index state information file 106d stores the index state information designated by the index state information designation unit 102g described later.
  • FIG. 9 is a diagram illustrating an example of information stored in the designated index state information file 106d. As shown in FIG. 9, the information stored in the designated index state information file 106d is configured by associating an individual number, designated index data, and designated density data with each other.
  • the evaluation formula related information database 106e includes an evaluation formula file 106e1 that stores an evaluation formula created by the evaluation formula creation unit 102h described later.
  • the evaluation formula file 106e1 stores the evaluation formula.
  • FIG. 10 is a diagram illustrating an example of information stored in the evaluation formula file 106e1.
  • the information stored in the evaluation formula file 106e1 includes the rank, the evaluation formula (in FIG. 10, Fp (Homo,%), Fp (Homo, GABA, Asn), Fk (Homo, GABA, Asn, etc), A threshold value corresponding to each formula creation method, and a verification result of each evaluation formula (for example, an evaluation value of each evaluation formula) are associated with each other.
  • the letters “Homo” mean Homoargine.
  • FIG. 11 is a diagram illustrating an example of information stored in the evaluation result file 106f.
  • Information stored in the evaluation result file 106f includes an individual number for uniquely identifying an individual (sample) to be evaluated, concentration data of the individual acquired in advance, and an evaluation result regarding the state of lung cancer (for example, described later)
  • the value of the evaluation formula calculated by the calculation unit 102i1 the value after converting the value of the evaluation formula by the conversion unit 102i2 described later, the position information generated by the generation unit 102i3 described later, or the classification unit 102i4 described later Classification results, etc.
  • the storage unit 106 stores various types of Web data for providing the Web site to the client device 200, CGI programs, and the like as other information in addition to the information described above.
  • the Web data includes data for displaying various Web pages, which will be described later, and the data is formed as a text file described in, for example, HTML or XML.
  • a part file, a work file, and other temporary files for creating Web data are also stored in the storage unit 106.
  • the storage unit 106 stores audio for transmission to the client device 200 as an audio file such as WAVE format or AIFF format, and stores still images and moving images as image files such as JPEG format or MPEG2 format as necessary. Or can be stored.
  • the communication interface unit 104 mediates communication between the evaluation device 100 and the network 300 (or a communication device such as a router). That is, the communication interface unit 104 has a function of communicating data with other terminals via a communication line.
  • the input / output interface unit 108 is connected to the input device 112 and the output device 114.
  • a monitor including a home television
  • a speaker or a printer can be used as the output device 114 (hereinafter, the output device 114 may be described as the monitor 114).
  • the input device 112 a monitor that realizes a pointing device function in cooperation with a mouse can be used in addition to a keyboard, a mouse, and a microphone.
  • the control unit 102 has an internal memory for storing a control program such as an OS (Operating System), a program that defines various processing procedures, and necessary data, and performs various information processing based on these programs. Execute. As shown in the figure, the control unit 102 is roughly divided into a request interpretation unit 102a, a browsing processing unit 102b, an authentication processing unit 102c, an e-mail generation unit 102d, a web page generation unit 102e, a reception unit 102f, and an index state information designation unit 102g. An evaluation formula creation unit 102h, an evaluation unit 102i, a result output unit 102j, and a transmission unit 102k are provided. The control unit 102 removes data with missing values, removes data with many outliers, and has data with missing values from the index state information sent from the database device 400 and the density data sent from the client device 200. Data processing such as removal of many variables is also performed.
  • OS Operating System
  • the request interpretation unit 102a interprets the request content from the client device 200 or the database device 400, and passes the processing to each unit of the control unit 102 according to the interpretation result.
  • the browsing processing unit 102b Upon receiving browsing requests for various screens from the client device 200, the browsing processing unit 102b generates and transmits Web data for these screens.
  • the authentication processing unit 102c makes an authentication determination.
  • the e-mail generation unit 102d generates an e-mail including various types of information.
  • the web page generation unit 102e generates a web page that the user browses on the client device 200.
  • the receiving unit 102f receives information (specifically, concentration data, index state information, evaluation formulas, etc.) transmitted from the client device 200 or the database device 400 via the network 300.
  • the index state information specifying unit 102g specifies target index data and density data when creating an evaluation formula.
  • the evaluation formula creating unit 102h creates an evaluation formula based on the index status information received by the receiving unit 102f and the index status information specified by the index status information specifying unit 102g.
  • the evaluation formula creation unit 102h creates the evaluation formula by selecting a desired evaluation formula from the storage unit 106. Also good. Further, the evaluation formula creation unit 102h may create an evaluation formula by selecting and downloading a desired evaluation formula from another computer device (for example, the database device 400) that stores the evaluation formula in advance.
  • the evaluation unit 102i is a formula obtained in advance (for example, an evaluation formula created by the evaluation formula creation unit 102h or an evaluation formula received by the reception unit 102f) and the concentration data of the individual received by the reception unit 102f.
  • the evaluation unit 102i uses the concentration value of at least one of the 15 types of metabolites and the 19 types of amino acids or the converted value of the concentration value (for example, the concentration deviation value) for an individual for lung cancer. The state may be evaluated.
  • FIG. 12 is a block diagram showing the configuration of the evaluation unit 102i, and conceptually shows only the portion related to the present invention.
  • the evaluation unit 102i further includes a calculation unit 102i1, a conversion unit 102i2, a generation unit 102i3, and a classification unit 102i4.
  • the calculation unit 102i1 substitutes at least one concentration value of the 15 types of metabolites and the 19 types of amino acids and at least one concentration value of the 15 types of metabolites and the 19 types of amino acids.
  • the value of the evaluation formula is calculated using the evaluation formula including at least the variable to be processed. Note that the evaluation unit 102i may store the value of the evaluation formula calculated by the calculation unit 102i1 as an evaluation result in a predetermined storage area of the evaluation result file 106f.
  • the conversion unit 102i2 converts the value of the evaluation formula calculated by the calculation unit 102i1 using, for example, the conversion method described above.
  • the evaluation unit 102i may store the value after conversion by the conversion unit 102i2 as an evaluation result in a predetermined storage area of the evaluation result file 106f.
  • the conversion unit 102i2 may convert at least one concentration value of the 15 types of metabolites and the 19 types of amino acids included in the concentration data by, for example, the conversion method described above.
  • the generation unit 102i3 uses the value of the expression calculated by the calculation unit 102i1 or the conversion unit 102i2 for position information regarding the position of the predetermined mark on a predetermined ruler that is visibly displayed on a display device such as a monitor or a physical medium such as paper. It is generated using the value after conversion in (which may be a density value or a value after conversion of the density value). Note that the evaluation unit 102i may store the position information generated by the generation unit 102i3 in a predetermined storage area of the evaluation result file 106f as an evaluation result.
  • the classification unit 102i4 uses the value of the evaluation formula calculated by the calculation unit 102i1 or the value converted by the conversion unit 102i2 (which may be a concentration value or a value after conversion of the concentration value) to cause an individual to suffer from lung cancer. And classifying it into any one of a plurality of categories defined in consideration of at least the degree of the possibility of being performed.
  • the result output unit 102j outputs the processing result (including the evaluation result obtained by the evaluation unit 102i) in each processing unit of the control unit 102 to the output device 114.
  • the transmission unit 102k transmits the evaluation result to the client device 200 that is the transmission source of the individual concentration data, or transmits the evaluation formula and the evaluation result created by the evaluation device 100 to the database device 400.
  • FIG. 13 is a block diagram showing an example of the configuration of the client device 200 of the present system, and conceptually shows only the portion related to the present invention in the configuration.
  • the client device 200 includes a control unit 210, a ROM 220, an HD 230, a RAM 240, an input device 250, an output device 260, an input / output IF 270, and a communication IF 280. These units are communicably connected via an arbitrary communication path. Has been.
  • the control unit 210 includes a web browser 211, an electronic mailer 212, a reception unit 213, and a transmission unit 214.
  • the web browser 211 interprets the web data and performs a browsing process for displaying the interpreted web data on a monitor 261 described later. Note that the web browser 211 may be plugged in with various software such as a stream player having a function of receiving, displaying, and feedbacking the stream video.
  • the electronic mailer 212 transmits and receives electronic mail according to a predetermined communication protocol (for example, SMTP (Simple Mail Transfer Protocol), POP3 (Post Office Protocol version 3), etc.).
  • the receiving unit 213 receives various types of information such as an evaluation result transmitted from the evaluation device 100 via the communication IF 280.
  • the transmission unit 214 transmits various information such as individual concentration data to the evaluation apparatus 100 via the communication IF 280.
  • the input device 250 is a keyboard, a mouse, a microphone, or the like.
  • a monitor 261 which will be described later, also realizes a pointing device function in cooperation with the mouse.
  • the output device 260 is an output unit that outputs information received via the communication IF 280, and includes a monitor (including a home television) 261 and a printer 262. In addition, the output device 260 may be provided with a speaker or the like.
  • the input / output IF 270 is connected to the input device 250 and the output device 260.
  • the communication IF 280 connects the client device 200 and the network 300 (or a communication device such as a router) so that they can communicate with each other.
  • the client device 200 is connected to the network 300 via a communication device such as a modem, TA, or router and a telephone line, or via a dedicated line.
  • the client apparatus 200 can access the evaluation apparatus 100 according to a predetermined communication protocol.
  • an information processing device for example, a known personal computer, workstation, home game device, Internet TV, PHS terminal, portable terminal, mobile body
  • peripheral devices such as a printer, a monitor, and an image scanner as necessary.
  • the client apparatus 200 may be realized by mounting software (including programs, data, and the like) that realizes a Web data browsing function and an electronic mail function in a communication terminal / information processing terminal such as a PDA.
  • control unit 210 of the client device 200 may be realized by a CPU and a program that is interpreted and executed by the CPU and all or any part of the processing performed by the control unit 210.
  • the ROM 220 or the HD 230 stores computer programs for giving instructions to the CPU in cooperation with an OS (Operating System) and performing various processes.
  • the computer program is executed by being loaded into the RAM 240, and constitutes the control unit 210 in cooperation with the CPU.
  • the computer program may be recorded in an application program server connected to the client apparatus 200 via an arbitrary network, and the client apparatus 200 may download all or a part thereof as necessary. .
  • all or any part of the processing performed by the control unit 210 may be realized by hardware such as wired logic.
  • control unit 210 includes an evaluation unit 210a (a calculation unit 210a1, a conversion unit 210a2, a generation unit 210a3, a classification unit, and a classification unit having functions similar to the functions of the evaluation unit 102i provided in the control unit 102 of the evaluation apparatus 100. Part 210a4). And when the evaluation part 210a is provided in the control part 210, the evaluation part 210a changes the value of an expression in the conversion part 210a2 according to the information contained in the evaluation result transmitted from the evaluation apparatus 100.
  • the network 300 has a function of connecting the evaluation apparatus 100, the client apparatus 200, and the database apparatus 400 so that they can communicate with each other, such as the Internet, an intranet, or a LAN (including both wired and wireless).
  • the network 300 includes a VAN, a personal computer communication network, a public telephone network (including both analog / digital), a dedicated line network (including both analog / digital), a CATV network, and a mobile line switching network.
  • mobile packet switching network including IMT2000 system, GSM (registered trademark) system or PDC / PDC-P system
  • wireless paging network including local wireless network such as Bluetooth (registered trademark)
  • PHS network including CS, BS or ISDB
  • satellite A communication network including CS, BS or ISDB
  • FIG. 14 is a block diagram showing an example of the configuration of the database apparatus 400 of this system, and conceptually shows only the portion related to the present invention in the configuration.
  • the database device 400 has a function of storing index state information used when creating an evaluation formula in the evaluation device 100 or the database device, an evaluation formula created in the evaluation device 100, an evaluation result in the evaluation device 100, and the like.
  • the database device 400 includes a control unit 402 such as a CPU that controls the database device in an integrated manner, a communication device such as a router, and a wired or wireless communication circuit such as a dedicated line.
  • a communication interface unit 404 that connects the apparatus to the network 300 to be communicable, a storage unit 406 that stores various databases, tables, and files (for example, files for Web pages), and an input unit that connects to the input unit 412 and the output unit 414.
  • the output interface unit 408 is configured to be communicable via an arbitrary communication path.
  • the storage unit 406 is a storage means, and for example, a memory device such as a RAM / ROM, a fixed disk device such as a hard disk, a flexible disk, an optical disk, or the like can be used.
  • the storage unit 406 stores various programs used for various processes.
  • the communication interface unit 404 mediates communication between the database device 400 and the network 300 (or a communication device such as a router). That is, the communication interface unit 404 has a function of communicating data with other terminals via a communication line.
  • the input / output interface unit 408 is connected to the input device 412 and the output device 414.
  • the output device 414 in addition to a monitor (including a home television), a speaker or a printer can be used as the output device 414 (hereinafter, the output device 414 may be described as the monitor 414).
  • the input device 412 can be a monitor that realizes a pointing device function in cooperation with the mouse.
  • the control unit 402 has an internal memory for storing a control program such as an OS (Operating System), a program that defines various processing procedures, and necessary data, and performs various information processing based on these programs. Execute. As shown in the figure, the control unit 402 is roughly divided into a request interpretation unit 402a, a browsing processing unit 402b, an authentication processing unit 402c, an email generation unit 402d, a Web page generation unit 402e, and a transmission unit 402f.
  • OS Operating System
  • the request interpretation unit 402a interprets the request content from the evaluation apparatus 100, and passes the processing to each unit of the control unit 402 according to the interpretation result.
  • the browsing processing unit 402b Upon receiving browsing requests for various screens from the evaluation apparatus 100, the browsing processing unit 402b generates and transmits Web data for these screens.
  • the authentication processing unit 402c makes an authentication determination.
  • the e-mail generation unit 402d generates an e-mail including various types of information.
  • the web page generation unit 402e generates a web page that the user browses on the client device 200.
  • the transmission unit 402f transmits various types of information such as index state information and an evaluation formula to the evaluation apparatus 100.
  • the evaluation apparatus 100 executes from the reception of the density data to the calculation of the value of the evaluation formula, the classification into the individual categories, and the transmission of the evaluation result, and the client apparatus 200 receives the evaluation result.
  • the case of execution is given as an example, but when the evaluation unit 210a is provided in the client device 200, it is sufficient for the evaluation device 100 to calculate the value of the evaluation formula.
  • conversion of the value of the evaluation formula The generation of position information, the classification into individual sections, and the like may be appropriately shared by the evaluation apparatus 100 and the client apparatus 200.
  • the evaluation unit 210a converts the value of the evaluation formula in the conversion unit 210a2, or the value or conversion of the evaluation formula in the generation unit 210a3.
  • Position information corresponding to a later value may be generated, or the classification unit 210a4 may classify the individual into one of a plurality of categories using the value of the expression or the value after conversion.
  • the evaluation unit 210a generates position information corresponding to the converted value in the generation unit 210a3, or converts it in the classification unit 210a4.
  • An individual may be classified into any one of a plurality of divisions using a later value.
  • the evaluation unit 210a uses the classification unit 210a4 to set the value of the evaluation formula or the value after conversion.
  • the individual may be classified into any one of a plurality of sections.
  • each illustrated component is functionally conceptual and does not necessarily need to be physically configured as illustrated.
  • each processing function performed by the control unit 102 all or any part of the processing functions is implemented in a CPU (Central Processing Unit) and a program that is interpreted and executed by the CPU. Alternatively, it may be realized as hardware based on wired logic.
  • the program is recorded on a non-transitory computer-readable recording medium including programmed instructions for causing the information processing apparatus to execute the evaluation method according to the present invention, and is stored in the evaluation apparatus 100 as necessary. Read mechanically. That is, in the storage unit 106 such as a ROM or an HDD, computer programs for performing various processes by giving instructions to the CPU in cooperation with an OS (Operating System) are recorded. This computer program is executed by being loaded into the RAM, and constitutes a control unit in cooperation with the CPU.
  • OS Operating System
  • this computer program may be stored in an application program server connected to the evaluation apparatus 100 via an arbitrary network, and the whole or a part of the computer program can be downloaded as necessary.
  • the evaluation program according to the present invention may be stored in a computer-readable recording medium that is not temporary, and may be configured as a program product.
  • the “recording medium” means a memory card, USB memory, SD card, flexible disk, magneto-optical disk, ROM, EPROM, EEPROM (registered trademark), CD-ROM, MO, DVD, and Blu-ray. (Registered trademark) It shall include any “portable physical medium” such as Disc.
  • the “program” is a data processing method described in an arbitrary language or description method, and may be in the form of source code or binary code. Note that the “program” is not necessarily limited to a single configuration, but is distributed in the form of a plurality of modules and libraries, or in cooperation with a separate program typified by an OS (Operating System). Including those that achieve the function. In addition, a well-known structure and procedure can be used about the specific structure and reading procedure for reading a recording medium in each apparatus shown to embodiment, the installation procedure after reading, etc.
  • Various databases and the like stored in the storage unit 106 are storage devices such as a memory device such as a RAM and a ROM, a fixed disk device such as a hard disk, a flexible disk, and an optical disk. Programs, tables, databases, web page files, and the like.
  • the evaluation apparatus 100 may be configured as an information processing apparatus such as a known personal computer or workstation, or may be configured as the information processing apparatus connected to an arbitrary peripheral device.
  • the evaluation apparatus 100 may be realized by installing software (including a program or data) that causes the information processing apparatus to realize the evaluation method of the present invention.
  • the specific form of distribution / integration of the devices is not limited to that shown in the figure, and all or a part of them may be functionally or physically in arbitrary units according to various additions or according to functional loads. It can be configured to be distributed and integrated. That is, the above-described embodiments may be arbitrarily combined and may be selectively implemented.
  • lung cancer group: 72 From the plasma samples of lung cancer patients (lung cancer group: 72) for whom a definitive diagnosis of lung cancer was performed, and healthy subjects who have no history or history of cancer (healthy group: 69), the metabolite analysis method described above ( The metabolite concentration in blood was measured by A).
  • Example 1 The sample data obtained in Example 1 was used.
  • the logistic regression equation was used as the multivariate discriminant.
  • a combination of two variables to be included in the logistic regression equation requires 19 kinds of amino acids (Asn, His, Thr, Ala, Cit, Arg, Tyr, Val, Met, Lys, Trp, Gly, Pro, Orn, Ile, Leu, Phe, Ser, Gln) and the above 14 kinds of metabolites, and a logistic regression equation with good discrimination ability between the lung cancer group and the healthy group A search was conducted.
  • FIGS. A list of logistic regression equations in which the ROC_AUC value of the lung cancer group and the healthy group is 0.597 (minimum value of ROC_AUC significant for a single metabolite) or more and the number of variables is two is shown in FIGS. . These logistic regression equations have high ROC_AUC values, and are considered useful in the above evaluation.
  • Example 1 The sample data used in Example 1 was used.
  • the logistic regression equation was used as the multivariate discriminant. As in Example 2, the combination of the three variables included in the logistic regression equation requires at least one of the 14 types of metabolites, the 19 types of amino acids, and the 14 types of metabolites. We searched for a logistic regression equation with good discrimination between the lung cancer group and the healthy group.
  • FIG. 21 to FIG. 48 show a list of logistic regression equations in which the ROC_AUC value of the lung cancer group and the healthy group is 0.771 (maximum value of ROC_AUC significant for a single metabolite) or more and the number of variables is three. . These logistic regression equations have high ROC_AUC values, and are considered useful in the above evaluation.
  • Example 1 The sample data used in Example 1 was used.
  • the logistic regression equation was used as the multivariate discriminant.
  • the combination of 6 variables included in the logistic regression equation was searched from the 19 kinds of amino acids and the 14 types of metabolites, and a logistic regression equation having good discrimination ability between the lung cancer group and the healthy group was searched.
  • the appearance frequency of amino acid variables included in the 383 equation with ROC_AUC of 0.95 or more was determined.
  • a list of logistic regression equations is shown in FIG. 49 to FIG. From this, it was shown that the appearance frequency of Pro, Cit, Phe, His, Trp, ADMA, and Cystathionine is as high as 50 or more.
  • the appearance frequency of Pro, Cit, Phe, His, Trp, and ADMA was shown to be as high as 100 or more.
  • the appearance frequency of Pro, Cit, His, and ADMA was shown to be as high as 300 or more.
  • the value of the formula is calculated using the index formula 1 and the amino acid and metabolite concentration values ( ⁇ mol / L) of the lung cancer group, and the calculated formula value and the preset cutoff value are used.
  • Each case of the lung cancer group was classified into one of a plurality of categories set as shown below.
  • the cut-off value candidates the value of the equation when the specificity was 80% and the value of the equation when the specificity was 95% were found to be -1.016 and 0.816, respectively. Note that the sensitivity when these values are cut off values is 93% and 79%, respectively.
  • the value 0.816 of the formula when the specificity is 95% is set as the cutoff value, and if the value of the formula is higher than the cutoff value, it is positive (corresponding to the lung cancer category) and lower than the cutoff value Is defined as negative (corresponding to the healthy category), and the case where the value of the expression is 13.7 is classified as either positive or negative. Since the value of this expression is higher than the cut-off value, Cases were classified as positive.
  • the value of -1.016 is set as the first cutoff value when the specificity is 80%, and the value of 0.816 when the specificity is 95% is set as the second cutoff value. If the value of the formula is lower than the first cut-off value, rank A (which means that the possibility (probability, risk) of lung cancer is low) is higher than the first cut-off value and If it is lower than the cut-off value of rank B, it is rank B (a category that means that the possibility of lung cancer is moderate), and if it is higher than the second cut-off value, rank C (highly likely to be lung cancer) And the case where the value of the formula was 13.7 was classified into one of three ranks, the value of this formula was calculated from the second cutoff value. Due to the high cost, this case was classified as rank C.
  • Example 5 pooled plasma obtained by collecting plasma from 19 healthy subjects and plasma from 20 lung cancer patients from the blood samples used in Example 1 was used, and the metabolite analysis method (A ) was used for qualitative analysis.
  • Example 2 In addition to the 14 types of metabolites measured in Example 1, “ACQUITY TM UPLC” (Waters) was used (analysis column: “Inertcil ODS-3 (particle diameter: 2.0 ⁇ m, inner diameter: 2.1 mm, length: (100 mm) "(GL Sciences Inc.), guard column:” Cartridge Guard Column E Inertsil ODS-3 (particle diameter: 3.0 ⁇ m, inner diameter: 1.5 mm, length: 10 mm) "(GL Sciences Inc.)), column temperature
  • the eluent A is APDS Amino Tag Wako eluent (Wako Pure Chemical Industries) as eluent A, and acetonitrile / water (60:40, v / v) is used as eluent B at 0.5 mL / min.
  • eluent B was stepped over time as follows: Was varied, the peak (m / z 224) was appeared in the vicinity of a retention time 3.5 minutes, eluting immediately after the ⁇ - aminoisobutyric acid in the vicinity of 3.3 minutes. And the area value of this peak was 202,000 in the plasma pool of a healthy person, and 2,790,000 in the pool plasma of a lung cancer patient. That is, an increase in area value of about 13.8 times was observed in pooled plasma of lung cancer patients.
  • the chromatogram at that time is shown in FIG. 0.00 minutes to 0.01 minutes: 5% to 6% 0.01 min-3.50 min: 6% 3.
  • Example 1 Using the sample of Example 1, in addition to the blood metabolite concentration of Example 1 and the above-described metabolite analysis method (A), the concentration of Ethylglycine in blood was measured.
  • the discriminability between the lung cancer group and the healthy group was evaluated by ROC_AUC using the plasma concentration value (ethylmol / ml) data of ethylglycine.
  • Table 3 shows ROC_AUC that serves as an index when evaluating the discriminability of ethylglycine.
  • Example 6 The sample data obtained in Example 6 was used.
  • the logistic regression equation was used as the multivariate discriminant. Logistic regression with good discrimination between lung cancer group and healthy group by searching for the combination of two variables to be included in the logistic regression equation from the above 19 kinds of amino acids and the above 14 kinds of metabolites after making ethylglycine essential An expression search was performed.
  • FIG. 66 shows a list of logistic regression equations (combinations of variables) in which the ROC_AUC value of the lung cancer group and the healthy group is 0.779 (ROC_AUC value of Ethylglycine alone) and the number of variables is two.
  • the numerical values of the coefficients of the variables may be arbitrary numerical values excluding zero, and the constant numerical values may be arbitrary numerical values.
  • These logistic regression equations have high ROC_AUC values, and are considered useful in the above evaluation.
  • Example 6 The sample data used in Example 6 was used.
  • the logistic regression equation was used as the multivariate discriminant. As in Example 7, the combination of the three variables included in the logistic regression equation is searched for from the 19 amino acids and the 14 metabolites after making the ethylglycine essential, and the lung cancer group and the healthy group A logistic regression equation with good discrimination was searched.
  • FIGS. 67 to 69 A list of logistic regression equations (combinations of variables) in which the ROC_AUC value of the lung cancer group and the healthy group is 0.779 (ROC_AUC value of Ethylglycine alone) and the number of variables is 3 is shown in FIGS. 67 to 69, the numerical values of the coefficients of the variables may be arbitrary numerical values excluding zero, and the constant numerical values may be arbitrary numerical values. These logistic regression equations have high ROC_AUC values, and are considered useful in the above evaluation.
  • Example 6 The sample data used in Example 6 was used.
  • the logistic regression equation was used as the multivariate discriminant. As in Example 7, the combination of 6 variables included in the logistic regression equation was searched for from the 19 amino acids and the 14 metabolites after making the ethylglycine essential, and the lung cancer group and the healthy group A logistic regression equation with good discrimination was searched.
  • the frequency of occurrence of amino acid variables included in the 122 equation having a ROC_AUC value of 0.95 or more for the lung cancer group and the healthy group was determined.
  • a list of logistic regression equations is shown in FIGS. 70 to 72, the numerical value of the coefficient of each variable may be an arbitrary numerical value excluding zero, and the numerical value of the constant may be an arbitrary numerical value. From this, it was shown that the appearance frequency of Pro, Cit, Phe, His, GABA, ADMA, cystathionine, and ethylglycine is as high as 20 or more. In particular, it was shown that the appearance frequency of Cit, His, ADMA, and Ethylglycine was as high as 100 or more.
  • the value of the formula is calculated using the index formula 2 and the amino acid and metabolite concentration values ( ⁇ mol / L) of the lung cancer group, and the calculated formula value and the preset cutoff value are used.
  • Each case of the lung cancer group was classified into one of a plurality of categories set as shown below.
  • the cut-off value candidates the value of the equation when the specificity was 80% and the value of the equation when the specificity was 95% were found to be ⁇ 0.7765 and 0.5558, respectively. Note that the sensitivity when these values are cut off values is 93% and 79%, respectively.
  • the formula value 0.5558 when the specificity is 95% is set as the cutoff value, and if the formula value is higher than the cutoff value, it is positive (corresponding to the lung cancer category) and lower than the cutoff value Is defined as negative (corresponding to the healthy category), and the case where the value of the expression was 21.7 was classified as either positive or negative. Since the value of this expression is higher than the cut-off value, Cases were classified as positive.
  • the value of -0.7765 of the equation when the specificity is 80% is set as the first cutoff value
  • the value of 0.5558 when the specificity is 95% is set as the second cutoff value. If the value of the formula is lower than the first cut-off value, rank A (which means that the possibility (probability, risk) of lung cancer is low) is higher than the first cut-off value and If it is lower than the cut-off value of rank B, it is rank B (a category that means that the possibility of lung cancer is moderate), and if it is higher than the second cut-off value, rank C (highly likely to be lung cancer) And the case where the value of the formula was 21.7 was classified into one of three ranks, the value of this formula was calculated from the second cutoff value. Due to the high cost, this case was classified as rank C.
  • the present invention can be widely implemented in many industrial fields, in particular, in fields such as pharmaceuticals, foods, and medical care, and in particular, lung cancer state progression prediction, disease risk prediction, proteome, metabolome analysis, etc. It is extremely useful in the field of bioinformatics.

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • Biomedical Technology (AREA)
  • Hematology (AREA)
  • Chemical & Material Sciences (AREA)
  • Urology & Nephrology (AREA)
  • Physics & Mathematics (AREA)
  • Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

 肺癌の状態を知る上で参考となり得る信頼性の高い情報を提供することができる評価方法などを提供することを課題とする。本実施形態では、評価対象の血液中のHomoarginine,GABA,3-Me-His,ADMA,Spermine,Spermidine,Cystathionine,Sarcosine,aAiBA,bAiBA,Putrescine,N-Acetyl-L-lys,Hypotaurine,bABA,Ethylglycineのうちの少なくとも1つの濃度値を用いて、評価対象について、肺癌の状態を評価する。

Description

評価方法、評価装置、評価プログラム、評価システム、及び端末装置
 本発明は、評価方法、評価装置、評価プログラム、評価システム、及び端末装置に関するものである。
 日本における肺癌による死亡は2003年で男41634人、女15086人で全ての癌による死亡の18.3%を占め、男では癌による死亡の第一位となっている。女性では癌による死亡の第3位であるが、年々増加しつつあり、遠からず第一位になるのは確実視されている現状である。
 肺癌は治癒の困難な癌であり、発見されたときにはすでに進行していて手術ができないものが半数以上あるのが現状である。一方、初期(I~II期)の肺癌の5年生存率は50%以上、特にIA期の肺癌(腫瘍が3cm以下でリンパ節転移、周りの臓器への浸潤がないもの)では5年生存率は約90%であり、早期発見が肺癌治癒にとっては重要である。
 肺癌の診断は、レントゲン写真、CT、MRI、PETなど画像によるもの、喀痰細胞診、気管支鏡による肺生検、経皮針による肺生検、試験開胸または胸腔鏡による肺生検などがある。
 しかし、画像による診断は確定診断とはならず、例えば胸部X線検査(間接撮影)での有所見率は20%であるのに対して、特異度は0.1%であり、有所見者のほとんどは偽陽性である。また、検出感度も低く、厚生労働省の検討結果では、間接撮影検査の場合約80%の肺癌発症者は胸部X線検査では見落とされていたという報告もある。特に、初期の肺癌においてはこれらの方法では検出感度、検出特異度共に更に低くなることが懸念される。一方、胸部X線検査においては、被験者の放射線被爆の問題もある。一方、CT、MRI、PETなどは設備、コスト面で集団検診で実施するには問題がある。
 また、喀痰細胞診は2~3割の患者の確定診断しか可能ではない。気管支鏡、経皮針、試験開胸および胸腔鏡によるによる肺生検は確定診断になるが、侵襲度の高い検査であり、画像診断により肺癌の疑いのある患者全員に肺生検を施行するのは実際的でない。さらにこうした侵襲的診断は患者の苦痛を伴うなど負担があり、また検査による出血などのリスクも起こりえる。望むべくは肺癌発症の可能性の高い被験者を、侵襲の少ない方法で選択し、肺生検により肺癌の確定診断を得て治療の対象とすることが、患者に対する身体的負担および費用対効果の面から望ましい。
 ところで、LC-MSやLC-MS/MSといった測定機器の開発により、アミノ酸よりも血液中濃度が低い代謝物も肺癌患者でその血液中濃度が変動していることが明らかになりつつある。例えば特許文献1によれば、肺癌患者の血清中ADMA濃度が上昇するとの報告がある。特許文献2によれば、肺癌患者の血清中サルコシン濃度が上昇するとの報告がある。
 なお、血中アミノ酸の濃度が、癌発症により変化することについては知られており、例えばシノベール(非特許文献1)によれば、例えばグルタミンは主に酸化エネルギー源として、アルギニンは窒素酸化物やポリアミンの前駆体として、メチオニンは癌細胞がメチオニン取り込み能の活性化により、それぞれ癌細胞での消費量が増加するという報告がある。また、プロエンツァら(非特許文献2)やカスツィーノ(非特許文献3)によれば、肺癌患者の血漿中アミノ酸組成は健常者と異なっていることが報告されている。更に、例えばロドリゲスら(非特許文献4)によれば、癌細胞と接触した骨髄細胞においてはアルギナーゼIの遺伝子発現、酵素活性の上昇が認められ、その結果として血漿中のアルギニン濃度が低下するとの報告がある。
 また、アミノ酸濃度を用いて肺癌の状態を評価する方法に関する特許文献3が公開されている。また、アミノ酸濃度と生体状態とを関連付ける方法に関する特許文献4-6が公開されている。
国際公開第2011/096210号 特開2011-247869号公報 国際公開第2008/016111号 国際公開第2004/052191号 国際公開第2006/098192号 国際公開第2009/054351号
Cynober, L. ed., Metabolic and therapeutic aspects of amino acids in clinical nutrition. 2nd ed., CRC Press. Proenza, A.M., J. Oliver, A. Palou and P. Roca, Breast and lung cancer are associated with a decrease in blood cell amino acid content. J Nutr Biochem, 2003. 14(3): p. 133-8. Cascino, A., M. Muscaritoli, C. Cangiano, L. Conversano, A. Laviano, S. Ariemma, M.M. Meguid and F. Rossi Fanelli, Plasma amino acid imbalance in patients with lung and breast cancer. Anticancer Res, 1995. 15(2): p. 507-10. Rodriguez, P.C., C.P. Hernandez, D. Quiceno, S.M. Dubinett, J. Zabaleta, J.B. Ochoa, J. Gilbert and A.C. Ochoa, Arginase I in myeloid suppressor cells is induced by COX-2 in lung carcinoma. J Exp Med, 2005. 202(7): p. 931-9.
 しかしながら、これまでに、血液中の代謝物を腫瘍マーカーとして肺癌を診断する技術の開発は、行われていない又は実用化されていない、という問題点があった。
 本発明は、上記に鑑みてなされたもので、肺癌の状態を知る上で参考となり得る信頼性の高い情報を提供することができる評価方法、評価装置、評価プログラム、評価システム、及び端末装置を提供することを目的とする。
 上述した課題を解決し、目的を達成するために、本発明にかかる評価方法は、評価対象の血液中の15種類の代謝物(Homoarginine(ホモアルギニン),GABA(γ-aminobutyric acid)(γ-アミノ酪酸),3-Me-His(3-methyl-histidine)(3-メチルヒスチジン),ADMA(asymmetric dimethylarginine)(非対称性ジメチルアルギニン),Spermine(スペルミン),Spermidine(スペルミジン),Cystathionine(シスタチオニン),Sarcosine(サルコシン),aAiBA(α-amino-iso-butyric acid)(α-アミノイソ酪酸),bAiBA(β-amino-iso-butyric acid)(β-アミノイソ酪酸),Putrescine(プトレシン),N-Acetyl-L-lys(N-Acetyl-L-lysine)(N-アセチル-L-リジン),Hypotaurine(ヒポタウリン),bABA(β-aminobutyric acid)(β-アミノ酪酸),Ethylglycine(エチルグリシン))のうちの少なくとも1つの濃度値を用いて、前記評価対象について、肺癌の状態を評価する評価ステップを含むこと、を特徴とする。
 また、本発明にかかる評価方法は、前記の評価方法において、前記評価ステップでは、評価対象の血液中の19種類のアミノ酸(Asn,His,Thr,Ala,Cit,Arg,Tyr,Val,Met,Lys,Trp,Gly,Pro,Orn,Ile,Leu,Phe,Ser,Gln)のうちの少なくとも1つの濃度値をさらに用いること、を特徴とする。
 ここで、本明細書では各種アミノ酸を主に略称で表記するが、それらの正式名称は以下の通りである。
(略称)   (正式名称)
Ala   Alanine
Arg   Arginine
Asn   Asparagine
Cit   Citrulline
Gln   Glutamine
Gly   Glycine
His   Histidine
Ile   Isoleucine
Leu   Leucine
Lys   Lysine
Met   Methionine
Orn   Ornithine
Phe   Phenylalanine
Pro   Proline
Ser   Serine
Thr   Threonine
Trp   Tryptophan
Tyr   Tyrosine
Val   Valine
 また、本発明にかかる評価方法は、前記の評価方法において、前記評価ステップでは、上記15種類の代謝物のうちの少なくとも1つの濃度値が代入される変数を含む式(以下では、評価式と記す場合がある。)をさらに用いて、前記式の値(以下では、評価式の値又は評価値と記す場合がある。)を算出することで、前記評価対象について、肺癌の状態を評価すること、を特徴とする。
 また、本発明にかかる評価方法は、前記の評価方法において、前記評価ステップでは、評価対象の血液中の上記19種類のアミノ酸のうちの少なくとも1つの濃度値をさらに用い、前記式は、上記19種類のアミノ酸のうちの少なくとも1つの濃度値が代入される変数をさらに含むものであること、を特徴とする。
 また、本発明にかかる評価装置は、制御部を備えた評価装置であって、前記制御部は、評価対象の血液中の上記15種類の代謝物のうちの少なくとも1つの濃度値を用いて、前記評価対象について、肺癌の状態を評価する評価手段を備えたこと、を特徴とする。
 また、本発明にかかる評価方法は、制御部を備えた情報処理装置において実行される評価方法であって、前記制御部において実行される、評価対象の血液中の上記15種類の代謝物のうちの少なくとも1つの濃度値を用いて、前記評価対象について、肺癌の状態を評価する評価ステップを含むこと、を特徴とする。
 また、本発明にかかる評価プログラムは、制御部を備えた情報処理装置において実行させるための評価プログラムであって、前記制御部において実行させるための、評価対象の血液中の上記15種類の代謝物のうちの少なくとも1つの濃度値を用いて、前記評価対象について、肺癌の状態を評価する評価ステップを含むこと、を特徴とする。
 また、本発明にかかる記録媒体は、一時的でないコンピュータ読み取り可能な記録媒体であって、情報処理装置に前記評価方法を実行させるためのプログラム化された命令を含むこと、を特徴とする。
 また、本発明にかかる評価システムは、制御部を備えた評価装置と、制御部を備え、評価対象の血液中の上記15種類の代謝物のうちの少なくとも1つの濃度値に関する濃度データを提供する端末装置とを、ネットワークを介して通信可能に接続して構成された評価システムであって、前記端末装置の前記制御部は、前記評価対象の前記濃度データを前記評価装置へ送信する濃度データ送信手段と、前記評価装置から送信された、前記評価対象における肺癌の状態に関する評価結果を受信する結果受信手段と、を備え、前記評価装置の前記制御部は、前記端末装置から送信された前記評価対象の前記濃度データを受信する濃度データ受信手段と、前記濃度データ受信手段で受信した前記評価対象の前記濃度データに含まれている、上記15種類の代謝物のうちの少なくとも1つの前記濃度値を用いて、前記評価対象について、肺癌の状態を評価する評価手段と、前記評価手段で得られた前記評価結果を前記端末装置へ送信する結果送信手段と、を備えたこと、を特徴とする。
 また、本発明にかかる端末装置は、制御部を備えた端末装置であって、前記制御部は、評価対象における肺癌の状態に関する評価結果を取得する結果取得手段を備え、前記評価結果は、前記評価対象の血液中の上記15種類の代謝物のうちの少なくとも1つの濃度値を用いて、前記評価対象について、肺癌の状態を評価した結果であること、を特徴とする。
 また、本発明にかかる端末装置は、前記の端末装置において、前記評価対象について肺癌の状態を評価する評価装置とネットワークを介して通信可能に接続して構成されており、前記制御部は、前記評価対象の血液中の上記15種類の代謝物のうちの少なくとも1つの前記濃度値に関する濃度データを前記評価装置へ送信する濃度データ送信手段をさらに備え、前記結果取得手段は、前記評価装置から送信された前記評価結果を受信すること、を特徴とする。
 また、本発明にかかる評価装置は、評価対象の血液中の上記15種類の代謝物のうちの少なくとも1つの濃度値に関する濃度データを提供する端末装置とネットワークを介して通信可能に接続された、制御部を備えた評価装置であって、前記制御部は、前記端末装置から送信された前記評価対象の前記濃度データを受信する濃度データ受信手段と、前記濃度データ受信手段で受信した前記評価対象の前記濃度データに含まれている、上記15種類の代謝物のうちの少なくとも1つの前記濃度値を用いて、前記評価対象について、肺癌の状態を評価する評価手段と、前記評価手段で得られた評価結果を前記端末装置へ送信する結果送信手段と、を備えたこと、を特徴とする。
 本発明によれば、評価対象の血液中の上記15種類の代謝物のうちの少なくとも1つの濃度値を用いて、評価対象について、肺癌の状態を評価するので、肺癌の状態を知る上で参考となり得る信頼性の高い情報を提供することができるという効果を奏する。
図1は、第1実施形態の基本原理を示す原理構成図である。 図2は、第2実施形態の基本原理を示す原理構成図である。 図3は、本システムの全体構成の一例を示す図である。 図4は、本システムの全体構成の他の一例を示す図である。 図5は、本システムの評価装置100の構成の一例を示すブロック図である。 図6は、利用者情報ファイル106aに格納される情報の一例を示す図である。 図7は、濃度データファイル106bに格納される情報の一例を示す図である。 図8は、指標状態情報ファイル106cに格納される情報の一例を示す図である。 図9は、指定指標状態情報ファイル106dに格納される情報の一例を示す図である。 図10は、評価式ファイル106e1に格納される情報の一例を示す図である。 図11は、評価結果ファイル106fに格納される情報の一例を示す図である。 図12は、評価部102iの構成を示すブロック図である。 図13は、本システムのクライアント装置200の構成の一例を示すブロック図である。 図14は、本システムのデータベース装置400の構成の一例を示すブロック図である。 図15は、ロジスティック回帰式の一覧を示す図である。 図16は、ロジスティック回帰式の一覧を示す図である。 図17は、ロジスティック回帰式の一覧を示す図である。 図18は、ロジスティック回帰式の一覧を示す図である。 図19は、ロジスティック回帰式の一覧を示す図である。 図20は、ロジスティック回帰式の一覧を示す図である。 図21は、ロジスティック回帰式の一覧を示す図である。 図22は、ロジスティック回帰式の一覧を示す図である。 図23は、ロジスティック回帰式の一覧を示す図である。 図24は、ロジスティック回帰式の一覧を示す図である。 図25は、ロジスティック回帰式の一覧を示す図である。 図26は、ロジスティック回帰式の一覧を示す図である。 図27は、ロジスティック回帰式の一覧を示す図である。 図28は、ロジスティック回帰式の一覧を示す図である。 図29は、ロジスティック回帰式の一覧を示す図である。 図30は、ロジスティック回帰式の一覧を示す図である。 図31は、ロジスティック回帰式の一覧を示す図である。 図32は、ロジスティック回帰式の一覧を示す図である。 図33は、ロジスティック回帰式の一覧を示す図である。 図34は、ロジスティック回帰式の一覧を示す図である。 図35は、ロジスティック回帰式の一覧を示す図である。 図36は、ロジスティック回帰式の一覧を示す図である。 図37は、ロジスティック回帰式の一覧を示す図である。 図38は、ロジスティック回帰式の一覧を示す図である。 図39は、ロジスティック回帰式の一覧を示す図である。 図40は、ロジスティック回帰式の一覧を示す図である。 図41は、ロジスティック回帰式の一覧を示す図である。 図42は、ロジスティック回帰式の一覧を示す図である。 図43は、ロジスティック回帰式の一覧を示す図である。 図44は、ロジスティック回帰式の一覧を示す図である。 図45は、ロジスティック回帰式の一覧を示す図である。 図46は、ロジスティック回帰式の一覧を示す図である。 図47は、ロジスティック回帰式の一覧を示す図である。 図48は、ロジスティック回帰式の一覧を示す図である。 図49は、ロジスティック回帰式の一覧を示す図である。 図50は、ロジスティック回帰式の一覧を示す図である。 図51は、ロジスティック回帰式の一覧を示す図である。 図52は、ロジスティック回帰式の一覧を示す図である。 図53は、ロジスティック回帰式の一覧を示す図である。 図54は、ロジスティック回帰式の一覧を示す図である。 図55は、ロジスティック回帰式の一覧を示す図である。 図56は、ロジスティック回帰式の一覧を示す図である。 図57は、ロジスティック回帰式の一覧を示す図である。 図58は、ロジスティック回帰式の一覧を示す図である。 図59は、ロジスティック回帰式の一覧を示す図である。 図60は、ロジスティック回帰式の一覧を示す図である。 図61は、ロジスティック回帰式の一覧を示す図である。 図62は、ロジスティック回帰式の一覧を示す図である。 図63は、ロジスティック回帰式の一覧を示す図である。 図64は、ロジスティック回帰式の一覧を示す図である。 図65は、健常者のプール血漿および肺癌患者のプール血漿を測定したときのクロマトグラムを示す図である。 図66は、ロジスティック回帰式の一覧を示す図である。 図67は、ロジスティック回帰式の一覧を示す図である。 図68は、ロジスティック回帰式の一覧を示す図である。 図69は、ロジスティック回帰式の一覧を示す図である。 図70は、ロジスティック回帰式の一覧を示す図である。 図71は、ロジスティック回帰式の一覧を示す図である。 図72は、ロジスティック回帰式の一覧を示す図である。
 以下に、本発明にかかる評価方法の実施形態(第1実施形態)、及び、本発明にかかる評価装置、評価方法、評価プログラム、記録媒体、評価システム及び端末装置の実施形態(第2実施形態)を、図面に基づいて詳細に説明する。なお、本発明はこれらの実施形態により限定されるものではない。
[第1実施形態]
[1-1.第1実施形態の概要]
 ここでは、第1実施形態の概要について図1を参照して説明する。図1は第1実施形態の基本原理を示す原理構成図である。
 まず、評価対象(例えば動物やヒトなどの個体)から採取した血液(例えば血漿、血清などを含む)中の物質(「上記15種類の代謝物および上記19種類のアミノ酸」のうちの少なくとも1つを含む血中物質)の濃度値に関する濃度データを取得する(ステップS11)。
 なお、ステップS11では、例えば、濃度値測定を行う企業等が測定した上記血中物質に関する濃度データを取得してもよい。また、評価対象から採取した血液から、例えば以下の(A)、(B)、または(C)などの測定方法により上記血中物質の濃度値を測定することで上記血中物質の濃度値に関する濃度データを取得してもよい。ここで、上記血中物質の濃度値の単位は、例えばモル濃度、重量濃度又は酵素活性であってもよく、これらの濃度に任意の定数を加減乗除することで得られるものでもよい。
(A)採取した血液サンプルを遠心することにより血液から血漿を分離する。全ての血漿サンプルは、濃度値の測定時まで-80℃で凍結保存する。濃度値測定時には、アセトニトリルを添加し除蛋白処理を行った後、標識試薬(3-アミノピリジル-N-ヒドロキシスクシンイミジルカルバメート)を用いてプレカラム誘導体化を行い、そして、液体クロマトグラフ質量分析計(LC/MS)により濃度値を分析する(国際公開第2003/069328号、国際公開第2005/116629号を参照)。
(B)採取した血液サンプルを遠心することにより血液から血漿を分離する。全ての血漿サンプルは、濃度値の測定時まで-80℃で凍結保存する。濃度値測定時には、スルホサリチル酸を添加し除蛋白処理を行った後、ニンヒドリン試薬を用いたポストカラム誘導体化法を原理としたアミノ酸分析計により濃度値を分析する。
(C)採取した血液サンプルを、膜やMEMS技術または遠心分離の原理を用いて血球分離を行い、血液から血漿または血清を分離する。血漿または血清取得後すぐに濃度値の測定を行わない血漿または血清サンプルは、濃度値の測定時まで-80℃で凍結保存する。濃度値測定時には、酵素やアプタマーなど、標的とする血中物質と反応または結合する分子等を用い、基質認識によって増減する物質や分光学的値を定量等することにより濃度値を分析する。
 つぎに、ステップS11で取得した濃度データに含まれている、上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値を、肺癌の状態を評価するための評価値として用いて、評価対象について肺癌の状態を評価する(ステップS12)。なお、ステップS12を実行する前に、ステップS11で取得した濃度データから欠損値や外れ値などのデータを除去してもよい。
 以上、第1実施形態によれば、ステップS11では評価対象の濃度データを取得し、ステップS12では、ステップS11で取得した評価対象の濃度データに含まれている、上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値を評価値として用いて、評価対象について肺癌の状態を評価する。これにより、肺癌の状態を知る上で参考となり得る信頼性の高い情報を提供することができる。
 また、上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値が評価対象についての肺癌の状態を反映したものであると決定してもよく、さらに、濃度値を例えば以下に挙げた手法などで変換し、変換後の値が評価対象についての肺癌の状態を反映したものであると決定してもよい。換言すると、濃度値又は変換後の値そのものを、評価対象についての肺癌の状態に関する評価結果として扱ってもよい。
 濃度値の取り得る範囲が所定範囲(例えば0.0から1.0までの範囲、0.0から10.0までの範囲、0.0から100.0までの範囲、又は-10.0から10.0までの範囲、など)に収まるようにするためなどに、例えば、濃度値に対して任意の値を加減乗除したり、濃度値を所定の変換手法(例えば、指数変換、対数変換、角変換、平方根変換、プロビット変換、逆数変換、Box-Cox変換、又はべき乗変換など)で変換したり、また、濃度値に対してこれらの計算を組み合わせて行ったりすることで、濃度値を変換してもよい。例えば、濃度値を指数としネイピア数を底とする指数関数の値(具体的には、肺癌の状態が所定の状態(例えば、基準値を超えた状態、など)である確率pを定義したときの自然対数ln(p/(1-p))が濃度値と等しいとした場合におけるp/(1-p)の値)をさらに算出してもよく、また、算出した指数関数の値を1と当該値との和で割った値(具体的には、確率pの値)をさらに算出してもよい。
 また、特定の条件のときの変換後の値が特定の値となるように、濃度値を変換してもよい。例えば、特異度が80%のときの変換後の値が5.0となり且つ特異度が95%のときの変換後の値が8.0となるように濃度値を変換してもよい。
 また、各代謝物および各アミノ酸ごとに、濃度分布を正規分布化した後、平均50、標準偏差10となるように偏差値化してもよい。
 なお、これらの変換は、男女別や年齢別に行ってもよい。
 また、モニタ等の表示装置又は紙等の物理媒体に視認可能に示される所定の物差し上における所定の目印の位置に関する位置情報を、上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値又は当該濃度値を変換した場合にはその変換後の値を用いて生成し、生成した位置情報が評価対象についての肺癌の状態を反映したものであると決定してもよい。なお、所定の物差しとは、肺癌の状態を評価するためのものであり、例えば、目盛りが示された物差しであって、「濃度値又は変換後の値の取り得る範囲、又は、当該範囲の一部分」における上限値と下限値に対応する目盛りが少なくとも示されたもの、などである。また、所定の目印とは、濃度値又は変換後の値に対応するものであり、例えば、丸印又は星印などである。
 また、上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値が、所定値(平均値±1SD、2SD、3SD、N分位点、Nパーセンタイル又は臨床的意義の認められたカットオフ値など)より低い若しくは所定値以下の場合又は所定値以上若しくは所定値より高い場合に、評価対象について、肺癌の状態を評価してもよい。その際、濃度値そのものではなく、濃度偏差値(各代謝物および各アミノ酸ごとに、男女別に濃度分布を正規分布化した後、平均50、標準偏差10となるように偏差値化した値)を用いてもよい。例えば、濃度偏差値が平均値-2SD未満の場合(濃度偏差値<30の場合)又は濃度偏差値が平均値+2SDより高い場合(濃度偏差値>70の場合)に、評価対象について、肺癌の状態を評価してもよい。
 また、上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値、および、上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値が代入される変数を含む式を用いて、式の値を算出することで、評価対象について肺癌の状態を評価してもよい。
 また、算出した式の値が評価対象についての肺癌の状態を反映したものであると決定してもよく、さらに、式の値を例えば以下に挙げた手法などで変換し、変換後の値が評価対象についての肺癌の状態を反映したものであると決定してもよい。換言すると、式の値又は変換後の値そのものを、評価対象についての肺癌の状態に関する評価結果として扱ってもよい。
 評価式の値の取り得る範囲が所定範囲(例えば0.0から1.0までの範囲、0.0から10.0までの範囲、0.0から100.0までの範囲、又は-10.0から10.0までの範囲、など)に収まるようにするためなどに、例えば、評価式の値に対して任意の値を加減乗除したり、評価式の値を所定の変換手法(例えば、指数変換、対数変換、角変換、平方根変換、プロビット変換、逆数変換、Box-Cox変換、又はべき乗変換など)で変換したり、また、評価式の値に対してこれらの計算を組み合わせて行ったりすることで、評価式の値を変換してもよい。例えば、評価式の値を指数としネイピア数を底とする指数関数の値(具体的には、肺癌の状態が所定の状態(例えば、基準値を超えた状態、など)である確率pを定義したときの自然対数ln(p/(1-p))が評価式の値と等しいとした場合におけるp/(1-p)の値)をさらに算出してもよく、また、算出した指数関数の値を1と当該値との和で割った値(具体的には、確率pの値)をさらに算出してもよい。
 また、特定の条件のときの変換後の値が特定の値となるように、評価式の値を変換してもよい。例えば、特異度が80%のときの変換後の値が5.0となり且つ特異度が95%のときの変換後の値が8.0となるように評価式の値を変換してもよい。
 また、平均50、標準偏差10となるように偏差値化してもよい。
 なお、これらの変換は、男女別や年齢別に行ってもよい。
 なお、本明細書における評価値は、評価式の値そのものであってもよく、評価式の値を変換した後の値であってもよい。
 また、モニタ等の表示装置又は紙等の物理媒体に視認可能に示される所定の物差し上における所定の目印の位置に関する位置情報を、式の値又は当該式の値を変換した場合にはその変換後の値を用いて生成し、生成した位置情報が評価対象についての肺癌の状態を反映したものであると決定してもよい。なお、所定の物差しとは、肺癌の状態を評価するためのものであり、例えば、目盛りが示された物差しであって、「式の値又は変換後の値の取り得る範囲、又は、当該範囲の一部分」における上限値と下限値に対応する目盛りが少なくとも示されたもの、などである。また、所定の目印とは、式の値又は変換後の値に対応するものであり、例えば、丸印又は星印などである。
 また、評価対象が肺癌に罹患している可能性の程度を定性的に評価してもよい。具体的には、「上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値および予め設定された1つまたは複数の閾値」または「上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値、上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値が代入される変数を含む評価式、および予め設定された1つまたは複数の閾値」を用いて、評価対象を、肺癌に罹患している可能性の程度を少なくとも考慮して定義された複数の区分のうちのどれか1つに分類してもよい。なお、複数の区分には、肺癌に罹患している可能性の程度が高い対象(例えば、肺癌に罹患していると見做す対象)を属させるための区分(例えば、実施例に記載したランクCなど)、肺癌に罹患している可能性の程度が低い対象(例えば、肺癌に罹患していないと見做す対象)を属させるための区分(例えば、実施例に記載したランクAなど)、および肺癌に罹患している可能性の程度が中程度である対象を属させるための区分(例えば、実施例に記載したランクBなど)が含まれていてもよい。また、複数の区分には、肺癌に罹患している可能性の程度が高い対象を属させるための区分(例えば、実施例に記載した肺癌区分など)、および、肺癌に罹患している可能性の程度が低い対象を属させるための区分(例えば、実施例に記載した、健常である可能性が高い対象(例えば健常であると見做す対象)を属させるための健常区分など)が含まれていてもよい。また、濃度値又は式の値を所定の手法で変換し、変換後の値を用いて評価対象を複数の区分のうちのどれか1つに分類してもよい。
 また、式の形式は特に問わないが、例えば、最小二乗法に基づく重回帰式、線形判別式、主成分分析、正準判別分析などの線形モデル、最尤法に基づくロジスティック回帰、Cox回帰などの一般化線形モデル、一般化線形モデルに加えて個体間差、施設間差などの変量効果を考慮した一般化線形混合モデル、K-means法、階層的クラスタ解析などクラスタ解析で作成された式、MCMC(マルコフ連鎖モンテカルロ法)、ベイジアンネットワーク、階層ベイズ法などベイズ統計に基づき作成された式、サポートベクターマシンや決定木などクラス分類により作成された式、分数式など上記のカテゴリに属さない手法により作成された式、および異なる形式の式の和で示されるような式のうちのいずれか1つでもよい。
 ここで、評価式として採用する式を、例えば、本出願人による国際出願である国際公開第2004/052191号に記載の方法又は本出願人による国際出願である国際公開第2006/098192号に記載の方法で作成してもよい。なお、これらの方法で得られた式であれば、入力データとしての濃度データにおける代謝物および/またはアミノ酸の濃度値の単位に因らず、当該式を肺癌の状態を評価するのに好適に用いることができる。
 ここで、重回帰式、多重ロジスティック回帰式、正準判別関数などにおいては各変数に係数及び定数項が付加されるが、この係数及び定数項は、好ましくは実数であれば構わず、より好ましくは、データから前記の各種分類を行うために得られた係数及び定数項の99%信頼区間の範囲に属する値であれば構わず、さらに好ましくは、データから前記の各種分類を行うために得られた係数及び定数項の95%信頼区間の範囲に属する値であれば構わない。また、各係数の値、及びその信頼区間は、それを実数倍したものでもよく、定数項の値、及びその信頼区間は、それに任意の実定数を加減乗除したものでもよい。ロジスティック回帰式、線形判別式、重回帰式などを評価式として用いる場合、線形変換(定数の加算、定数倍)及び単調増加(減少)の変換(例えばlogit変換など)は評価性能を変えるものではなく変換前と同等であるので、これらの変換が行われた後のものを用いてもよい。
 なお、分数式とは、当該分数式の分子が変数A,B,C,・・・の和で表わされ及び/又は当該分数式の分母が変数a,b,c,・・・の和で表わされるものである。また、分数式には、このような構成の分数式α,β,γ,・・・の和(例えばα+βのようなもの)も含まれる。また、分数式には、分割された分数式も含まれる。なお、分子や分母に用いられる変数にはそれぞれ適当な係数がついても構わない。また、分子や分母に用いられる変数は重複しても構わない。また、各分数式に適当な係数がついても構わない。また、各変数の係数の値や定数項の値は、実数であれば構わない。ある分数式と、当該分数式において分子の変数と分母の変数が入れ替えられたものとでは、目的変数との相関の正負の符号が概して逆転するものの、それらの相関性は保たれるが故に、評価性能も同等と見做せるので、分数式には、分子の変数と分母の変数が入れ替えられたものも含まれる。
 そして、肺癌の状態を評価する際、上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値以外に、他の生体情報に関する値(例えば、以下に挙げた値など)をさらに用いても構わない。また、評価式として採用する式には、上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値が代入される変数以外に、他の生体情報に関する値(例えば、以下に挙げた値など)が代入される1つ又は複数の変数がさらに含まれていてもよい。
1.アミノ酸以外の他の血中の代謝物(アミノ酸代謝物・糖類・脂質等)、タンパク質、ペプチド、ミネラル、ホルモン等の濃度値
2.アルブミン、総蛋白、トリグリセリド(中性脂肪)、HbA1c、糖化アルブミン、インスリン抵抗性指数、総コレステロール、LDLコレステロール、HDLコレステロール、アミラーゼ、総ビリルビン、クレアチニン、推算糸球体濾過量(eGFR)、尿酸、GOT(AST)、GPT(ALT),GGTP(γ-GTP)、グルコース(血糖値)、CRP(C反応性蛋白)、赤血球、ヘモグロビン、ヘマトクリット、MCV、MCH,MCHC、白血球、血小板数等の血液検査値
3.超音波エコー、X線、CT、MRI、内視鏡像等の画像情報から得られる値
4.年齢、身長、体重、BMI、腹囲、収縮期血圧、拡張期血圧、性別、喫煙情報、食事情報、飲酒情報、運動情報、ストレス情報、睡眠情報、家族の既往歴情報、疾患歴情報(糖尿病等)等の生体指標に関する値
[第2実施形態]
[2-1.第2実施形態の概要]
 ここでは、第2実施形態の概要について図2を参照して説明する。図2は第2実施形態の基本原理を示す原理構成図である。なお、本第2実施形態の説明では、上述した第1実施形態と重複する説明を省略する場合がある。特に、ここでは、肺癌の状態を評価する際に、評価式の値又はその変換後の値を用いるケースを一例として記載しているが、例えば、「上記15種類の代謝物および上記19種類のアミノ酸」のうちの少なくとも1つの濃度値又はその変換後の値(例えば濃度偏差値など)を用いてもよい。
 制御部は、血液中の上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値に関する予め取得した評価対象(例えば動物やヒトなどの個体)の濃度データに含まれている、上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値、および、上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値が代入される変数を含む予め記憶部に記憶された式を用いて、式の値を算出することで、評価対象について肺癌の状態を評価する(ステップS21)。
 以上、第2実施形態によれば、ステップS21では、評価対象の濃度データに含まれている、上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値、および、評価式として記憶部に記憶された、上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値が代入される変数を含む式を用いて、評価式の値を算出することで、評価対象について肺癌の状態を評価する。これにより、肺癌の状態を知る上で参考となり得る信頼性の高い情報を提供することができる。
 ここで、評価式作成処理(工程1~工程4)の概要について詳細に説明する。なお、ここで説明する処理はあくまでも一例であり、評価式の作成方法はこれに限定されない。
 まず、制御部は、濃度データと肺癌の状態を表す指標に関する指標データとを含む予め記憶部に記憶された指標状態情報から所定の式作成手法に基づいて、評価式の候補である候補式(例えば、y=a1x1+a2x2+・・・+anxn、y:指標データ、xi:濃度データ、ai:定数、i=1,2,・・・,n)を作成する(工程1)。なお、事前に、指標状態情報から欠損値や外れ値などを持つデータを除去してもよい。
 なお、工程1において、指標状態情報から、複数の異なる式作成手法(主成分分析や判別分析、サポートベクターマシン、重回帰分析、Cox回帰分析、ロジスティック回帰分析、k-means法、クラスター解析、決定木などの多変量解析に関するものを含む。)を併用して複数の候補式を作成してもよい。具体的には、多数の健常群および肺癌群から得た血液を分析して得た濃度データおよび指標データから構成される多変量データである指標状態情報に対して、複数の異なるアルゴリズムを利用して複数群の候補式を同時並行的に作成してもよい。例えば、異なるアルゴリズムを利用して判別分析およびロジスティック回帰分析を同時に行い、2つの異なる候補式を作成してもよい。また、主成分分析を行って作成した候補式を利用して指標状態情報を変換し、変換した指標状態情報に対して判別分析を行うことで候補式を作成してもよい。これにより、最終的に、最適な評価式を作成することができる。
 ここで、主成分分析を用いて作成した候補式は、全ての濃度データの分散を最大にするような各変数を含む一次式である。また、判別分析を用いて作成した候補式は、各群内の分散の和の全ての濃度データの分散に対する比を最小にするような各変数を含む高次式(指数や対数を含む)である。また、サポートベクターマシンを用いて作成した候補式は、群間の境界を最大にするような各変数を含む高次式(カーネル関数を含む)である。また、重回帰分析を用いて作成した候補式は、全ての濃度データからの距離の和を最小にするような各変数を含む高次式である。また、Cox回帰分析を用いて作成した候補式は、対数ハザード比を含む線形モデルで、そのモデルの尤度を最大とするような各変数とその係数を含む1次式であるである。また、ロジスティック回帰分析を用いて作成した候補式は、確率の対数オッズを表す線形モデルであり、その確率の尤度を最大にするような各変数を含む一次式である。また、k-means法とは、各濃度データのk個近傍を探索し、近傍点の属する群の中で一番多いものをそのデータの所属群と定義し、入力された濃度データの属する群と定義された群とが最も合致するような変数を選択する手法である。また、クラスター解析とは、全ての濃度データの中で最も近い距離にある点同士をクラスタリング(群化)する手法である。また、決定木とは、変数に序列をつけて、序列が上位である変数の取りうるパターンから濃度データの群を予測する手法である。
 評価式作成処理の説明に戻り、制御部は、工程1で作成した候補式を、所定の検証手法に基づいて検証(相互検証)する(工程2)。候補式の検証は、工程1で作成した各候補式に対して行う。
 なお、工程2において、ブートストラップ法やホールドアウト法、N-フォールド法、リーブワンアウト法などのうち少なくとも1つに基づいて候補式の判別率や感度、特異度、情報量基準、ROC_AUC(受信者特性曲線の曲線下面積)などのうち少なくとも1つに関して検証してもよい。これにより、指標状態情報や評価条件を考慮した予測性または頑健性の高い候補式を作成することができる。
 ここで、判別率とは、本実施形態にかかる肺癌評価手法で、真の状態が陰性である評価対象(例えば、肺癌に罹患していない評価対象など)を正しく陰性と評価し、真の状態が陽性である評価対象(例えば、肺癌に罹患している評価対象など)を正しく陽性と評価している割合である。また、感度とは、本実施形態にかかる肺癌評価手法で、真の状態が陽性である評価対象を正しく陽性と評価している割合である。また、特異度とは、本実施形態にかかる肺癌評価手法で、真の状態が陰性である評価対象を正しく陰性と評価している割合である。また、赤池情報量規準とは、回帰分析などの場合に,観測データが統計モデルにどの程度一致するかを表す基準であり、「-2×(統計モデルの最大対数尤度)+2×(統計モデルの自由パラメータ数)」で定義される値が最小となるモデルを最もよいと判断する。また、ROC_AUC(受信者特性曲線の曲線下面積)は、2次元座標上に(x,y)=(1-特異度,感度)をプロットして作成される曲線である受信者特性曲線(ROC)の曲線下面積として定義され、ROC_AUCの値は完全な判別では1となり、この値が1に近いほど判別性が高いことを示す。また、予測性とは、候補式の検証を繰り返すことで得られた判別率や感度、特異性を平均したものである。また、頑健性とは、候補式の検証を繰り返すことで得られた判別率や感度、特異性の分散である。
 評価式作成処理の説明に戻り、制御部は、所定の変数選択手法に基づいて候補式の変数を選択することで、候補式を作成する際に用いる指標状態情報に含まれる濃度データの組み合わせを選択する(工程3)。変数の選択は、工程1で作成した各候補式に対して行ってもよい。これにより、候補式の変数を適切に選択することができる。そして、工程3で選択した濃度データを含む指標状態情報を用いて再び工程1を実行する。
 なお、工程3において、工程2での検証結果からステップワイズ法、ベストパス法、近傍探索法、遺伝的アルゴリズムのうち少なくとも1つに基づいて候補式の変数を選択してもよい。
 ここで、ベストパス法とは、候補式に含まれる変数を1つずつ順次減らしていき、候補式が与える評価指標を最適化することで変数を選択する方法である。
 評価式作成処理の説明に戻り、制御部は、上述した工程1、工程2および工程3を繰り返し実行し、これにより蓄積した検証結果に基づいて、複数の候補式の中から評価式として採用する候補式を選出することで、評価式を作成する(工程4)。なお、候補式の選出には、例えば、同じ式作成手法で作成した候補式の中から最適なものを選出する場合と、すべての候補式の中から最適なものを選出する場合とがある。
 以上、説明したように、評価式作成処理では、指標状態情報に基づいて、候補式の作成、候補式の検証および候補式の変数の選択に関する処理を一連の流れで体系化(システム化)して実行することにより、肺癌の評価に最適な評価式を作成することができる。換言すると、評価式作成処理では、上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つを含む血中物質の濃度を多変量の統計解析に用い、最適でロバストな変数の組を選択するために変数選択法とクロスバリデーションとを組み合わせて、評価性能の高い評価式を抽出する。
[2-2.第2実施形態の構成]
 ここでは、第2実施形態にかかる評価システム(以下では本システムと記す場合がある。)の構成について、図3から図14を参照して説明する。なお、本システムはあくまでも一例であり、本発明はこれに限定されない。特に、ここでは、肺癌の状態を評価する際に、評価式の値又はその変換後の値を用いるケースを一例として記載しているが、例えば、「上記15種類の代謝物および上記19種類のアミノ酸」のうちの少なくとも1つの濃度値又はその変換後の値(例えば濃度偏差値など)を用いてもよい。
 まず、本システムの全体構成について図3および図4を参照して説明する。図3は本システムの全体構成の一例を示す図である。また、図4は本システムの全体構成の他の一例を示す図である。本システムは、図3に示すように、評価対象である個体について肺癌の状態を評価する評価装置100と、血液中の上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つを含む血中物質の濃度値に関する個体の濃度データを提供するクライアント装置200(本発明の端末装置に相当)とを、ネットワーク300を介して通信可能に接続して構成されている。
 なお、本システムは、図4に示すように、評価装置100やクライアント装置200の他に、評価装置100で評価式を作成する際に用いる指標状態情報や、肺癌の状態を評価する際に用いる評価式などを格納したデータベース装置400を、ネットワーク300を介して通信可能に接続して構成されてもよい。これにより、ネットワーク300を介して、評価装置100からクライアント装置200やデータベース装置400へ、あるいはクライアント装置200やデータベース装置400から評価装置100へ、肺癌の状態を知る上で参考となる情報などが提供される。ここで、肺癌の状態を知る上で参考となる情報とは、例えば、ヒトを含む生物の肺癌の状態に関する特定の項目について測定した値に関する情報などである。また、肺癌の状態を知る上で参考となる情報は、評価装置100やクライアント装置200や他の装置(例えば各種の計測装置等)で生成され、主にデータベース装置400に蓄積される。
 つぎに、本システムの評価装置100の構成について図5から図12を参照して説明する。図5は、本システムの評価装置100の構成の一例を示すブロック図であり、該構成のうち本発明に関係する部分のみを概念的に示している。
 評価装置100は、当該評価装置を統括的に制御するCPU等の制御部102と、ルータ等の通信装置および専用線等の有線または無線の通信回線を介して当該評価装置をネットワーク300に通信可能に接続する通信インターフェース部104と、各種のデータベースやテーブルやファイルなどを格納する記憶部106と、入力装置112や出力装置114に接続する入出力インターフェース部108と、で構成されており、これら各部は任意の通信路を介して通信可能に接続されている。ここで、評価装置100は、各種の分析装置(例えばアミノ酸分析装置等)と同一筐体で構成されてもよい。例えば、血液中の上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つを含む所定の血中物質の濃度値を算出(測定)・出力(印刷やモニタ表示など)する構成(ハードウェアおよびソフトウェア)を備えた小型分析装置において、後述する評価部102iをさらに備え、当該評価部102iで得られた結果を前記構成を用いて出力すること、を特徴とするものでもよい。
 記憶部106は、ストレージ手段であり、例えば、RAM・ROM等のメモリ装置や、ハードディスクのような固定ディスク装置、フレキシブルディスク、光ディスク等を用いることができる。記憶部106には、OS(Operating System)と協働してCPUに命令を与え各種処理を行うためのコンピュータプログラムが記録されている。記憶部106は、図示の如く、利用者情報ファイル106aと、濃度データファイル106bと、指標状態情報ファイル106cと、指定指標状態情報ファイル106dと、評価式関連情報データベース106eと、評価結果ファイル106fと、を格納する。
 利用者情報ファイル106aは、利用者に関する利用者情報を格納する。図6は、利用者情報ファイル106aに格納される情報の一例を示す図である。利用者情報ファイル106aに格納される情報は、図6に示すように、利用者を一意に識別するための利用者IDと、利用者が正当な者であるか否かの認証を行うための利用者パスワードと、利用者の氏名と、利用者の所属する所属先を一意に識別するための所属先IDと、利用者の所属する所属先の部門を一意に識別するための部門IDと、部門名と、利用者の電子メールアドレスと、を相互に関連付けて構成されている。
 図5に戻り、濃度データファイル106bは、血液中の上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つを含む血中物質の濃度値に関する濃度データを格納する。図7は、濃度データファイル106bに格納される情報の一例を示す図である。濃度データファイル106bに格納される情報は、図7に示すように、評価対象である個体(サンプル)を一意に識別するための個体番号と、濃度データとを相互に関連付けて構成されている。ここで、図7では、濃度データを数値、すなわち連続尺度として扱っているが、濃度データは名義尺度や順序尺度でもよい。なお、名義尺度や順序尺度の場合は、それぞれの状態に対して任意の数値を与えることで解析してもよい。また、濃度データに、他の生体情報に関する値(上記参照)を組み合わせてもよい。
 図5に戻り、指標状態情報ファイル106cは、評価式を作成する際に用いる指標状態情報を格納する。図8は、指標状態情報ファイル106cに格納される情報の一例を示す図である。指標状態情報ファイル106cに格納される情報は、図8に示すように、個体番号と、肺癌の状態を表す指標(指標T1、指標T2、指標T3・・・)に関する指標データ(T)と、濃度データと、を相互に関連付けて構成されている。ここで、図8では、指標データおよび濃度データを数値(すなわち連続尺度)として扱っているが、指標データおよび濃度データは名義尺度や順序尺度でもよい。なお、名義尺度や順序尺度の場合は、それぞれの状態に対して任意の数値を与えることで解析してもよい。また、指標データは、肺癌の状態のマーカーとなる既知の指標などであり、数値データを用いてもよい。
 図5に戻り、指定指標状態情報ファイル106dは、後述する指標状態情報指定部102gで指定した指標状態情報を格納する。図9は、指定指標状態情報ファイル106dに格納される情報の一例を示す図である。指定指標状態情報ファイル106dに格納される情報は、図9に示すように、個体番号と、指定した指標データと、指定した濃度データと、を相互に関連付けて構成されている。
 図5に戻り、評価式関連情報データベース106eは、後述する評価式作成部102hで作成した評価式を格納する評価式ファイル106e1、で構成される。
 評価式ファイル106e1は、評価式を格納する。図10は、評価式ファイル106e1に格納される情報の一例を示す図である。評価式ファイル106e1に格納される情報は、図10に示すように、ランクと、評価式(図10では、Fp(Homo,・・・)やFp(Homo,GABA,Asn)、Fk(Homo,GABA,Asn,・・・)など)と、各式作成手法に対応する閾値と、各評価式の検証結果(例えば各評価式の評価値)と、を相互に関連付けて構成されている。なお、“Homo”という文字は、Homoarginineを意味するものである。
 図5に戻り、評価結果ファイル106fは、後述する評価部102iで得られた評価結果を格納する。図11は、評価結果ファイル106fに格納される情報の一例を示す図である。評価結果ファイル106fに格納される情報は、評価対象である個体(サンプル)を一意に識別するための個体番号と、予め取得した個体の濃度データと、肺癌の状態に関する評価結果(例えば、後述する算出部102i1で算出した評価式の値、後述する変換部102i2で評価式の値を変換した後の値、後述する生成部102i3で生成した位置情報、又は、後述する分類部102i4で得られた分類結果、など)と、を相互に関連付けて構成されている。
 図5に戻り、記憶部106には、上述した情報以外にその他情報として、Webサイトをクライアント装置200に提供するための各種のWebデータや、CGIプログラム等が記録されている。Webデータとしては後述する各種のWebページを表示するためのデータ等があり、これらデータは例えばHTMLやXMLで記述されたテキストファイルとして形成されている。また、Webデータを作成するための部品用のファイルや作業用のファイルやその他一時的なファイル等も記憶部106に記憶される。記憶部106には、必要に応じて、クライアント装置200に送信するための音声をWAVE形式やAIFF形式の如き音声ファイルで格納したり、静止画や動画をJPEG形式やMPEG2形式の如き画像ファイルで格納したりすることができる。
 通信インターフェース部104は、評価装置100とネットワーク300(またはルータ等の通信装置)との間における通信を媒介する。すなわち、通信インターフェース部104は、他の端末と通信回線を介してデータを通信する機能を有する。
 入出力インターフェース部108は、入力装置112や出力装置114に接続する。ここで、出力装置114には、モニタ(家庭用テレビを含む)の他、スピーカやプリンタを用いることができる(なお、以下では、出力装置114をモニタ114として記載する場合がある。)。入力装置112には、キーボードやマウスやマイクの他、マウスと協働してポインティングデバイス機能を実現するモニタを用いることができる。
 制御部102は、OS(Operating System)等の制御プログラム・各種の処理手順等を規定したプログラム・所要データなどを格納するための内部メモリを有し、これらのプログラムに基づいて種々の情報処理を実行する。制御部102は、図示の如く、大別して、要求解釈部102aと閲覧処理部102bと認証処理部102cと電子メール生成部102dとWebページ生成部102eと受信部102fと指標状態情報指定部102gと評価式作成部102hと評価部102iと結果出力部102jと送信部102kとを備えている。制御部102は、データベース装置400から送信された指標状態情報やクライアント装置200から送信された濃度データに対して、欠損値のあるデータの除去・外れ値の多いデータの除去・欠損値のあるデータの多い変数の除去などのデータ処理も行う。
 要求解釈部102aは、クライアント装置200やデータベース装置400からの要求内容を解釈し、その解釈結果に応じて制御部102の各部に処理を受け渡す。閲覧処理部102bは、クライアント装置200からの各種画面の閲覧要求を受けて、これら画面のWebデータの生成や送信を行なう。認証処理部102cは、クライアント装置200やデータベース装置400からの認証要求を受けて、認証判断を行う。電子メール生成部102dは、各種の情報を含んだ電子メールを生成する。Webページ生成部102eは、利用者がクライアント装置200で閲覧するWebページを生成する。
 受信部102fは、クライアント装置200やデータベース装置400から送信された情報(具体的には、濃度データや指標状態情報、評価式など)を、ネットワーク300を介して受信する。指標状態情報指定部102gは、評価式を作成するにあたり、対象とする指標データおよび濃度データを指定する。
 評価式作成部102hは、受信部102fで受信した指標状態情報や指標状態情報指定部102gで指定した指標状態情報に基づいて評価式を作成する。なお、評価式が予め記憶部106の所定の記憶領域に格納されている場合には、評価式作成部102hは、記憶部106から所望の評価式を選択することで、評価式を作成してもよい。また、評価式作成部102hは、評価式を予め格納した他のコンピュータ装置(例えばデータベース装置400)から所望の評価式を選択しダウンロードすることで、評価式を作成してもよい。
 評価部102iは、事前に得られた式(例えば、評価式作成部102hで作成した評価式、又は、受信部102fで受信した評価式など)、及び、受信部102fで受信した個体の濃度データに含まれる、上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値を用いて、評価式の値を算出することで、個体について肺癌の状態を評価する。なお、評価部102iは、上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値又は当該濃度値の変換後の値(例えば濃度偏差値)を用いて、個体について肺癌の状態を評価してもよい。
 ここで、評価部102iの構成について図12を参照して説明する。図12は、評価部102iの構成を示すブロック図であり、該構成のうち本発明に関係する部分のみを概念的に示している。評価部102iは、算出部102i1と、変換部102i2と、生成部102i3と、分類部102i4と、をさらに備えている。
 算出部102i1は、上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値、および、上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値が代入される変数を少なくとも含む評価式を用いて、評価式の値を算出する。なお、評価部102iは、算出部102i1で算出した評価式の値を評価結果として評価結果ファイル106fの所定の記憶領域に格納してもよい。
 変換部102i2は、算出部102i1で算出した評価式の値を例えば上述した変換手法などで変換する。なお、評価部102iは、変換部102i2で変換した後の値を評価結果として評価結果ファイル106fの所定の記憶領域に格納してもよい。また、変換部102i2は、濃度データに含まれている、上記15種類の代謝物および上記19種類のアミノ酸のうちの少なくとも1つの濃度値を、例えば上述した変換手法などで変換してもよい。
 生成部102i3は、モニタ等の表示装置又は紙等の物理媒体に視認可能に示される所定の物差し上における所定の目印の位置に関する位置情報を、算出部102i1で算出した式の値又は変換部102i2で変換した後の値(濃度値又は当該濃度値の変換後の値でもよい)を用いて生成する。なお、評価部102iは、生成部102i3で生成した位置情報を評価結果として評価結果ファイル106fの所定の記憶領域に格納してもよい。
 分類部102i4は、算出部102i1で算出した評価式の値又は変換部102i2で変換した後の値(濃度値又は当該濃度値の変換後の値でもよい)を用いて、個体を、肺癌に罹患している可能性の程度を少なくとも考慮して定義された複数の区分のうちのどれか1つに分類する。
 結果出力部102jは、制御部102の各処理部での処理結果(評価部102iで得られた評価結果を含む)等を出力装置114に出力する。
 送信部102kは、個体の濃度データの送信元のクライアント装置200に対して評価結果を送信したり、データベース装置400に対して、評価装置100で作成した評価式や評価結果を送信したりする。
 つぎに、本システムのクライアント装置200の構成について図13を参照して説明する。図13は、本システムのクライアント装置200の構成の一例を示すブロック図であり、該構成のうち本発明に関係する部分のみを概念的に示している。
 クライアント装置200は、制御部210とROM220とHD230とRAM240と入力装置250と出力装置260と入出力IF270と通信IF280とで構成されており、これら各部は任意の通信路を介して通信可能に接続されている。
 制御部210は、Webブラウザ211、電子メーラ212、受信部213、送信部214を備えている。Webブラウザ211は、Webデータを解釈し、解釈したWebデータを後述するモニタ261に表示するブラウズ処理を行う。なお、Webブラウザ211には、ストリーム映像の受信・表示・フィードバック等を行う機能を備えたストリームプレイヤ等の各種のソフトウェアをプラグインしてもよい。電子メーラ212は、所定の通信規約(例えば、SMTP(Simple Mail Transfer Protocol)やPOP3(Post Office Protocol version 3)等)に従って電子メールの送受信を行う。受信部213は、通信IF280を介して、評価装置100から送信された評価結果などの各種情報を受信する。送信部214は、通信IF280を介して、個体の濃度データなどの各種情報を評価装置100へ送信する。
 入力装置250はキーボードやマウスやマイク等である。なお、後述するモニタ261もマウスと協働してポインティングデバイス機能を実現する。出力装置260は、通信IF280を介して受信した情報を出力する出力手段であり、モニタ(家庭用テレビを含む)261およびプリンタ262を含む。この他、出力装置260にスピーカ等を設けてもよい。入出力IF270は入力装置250や出力装置260に接続する。
 通信IF280は、クライアント装置200とネットワーク300(またはルータ等の通信装置)とを通信可能に接続する。換言すると、クライアント装置200は、モデムやTAやルータなどの通信装置および電話回線を介して、または専用線を介してネットワーク300に接続される。これにより、クライアント装置200は、所定の通信規約に従って評価装置100にアクセスすることができる。
 ここで、プリンタ・モニタ・イメージスキャナ等の周辺装置を必要に応じて接続した情報処理装置(例えば、既知のパーソナルコンピュータ・ワークステーション・家庭用ゲーム装置・インターネットTV・PHS端末・携帯端末・移動体通信端末・PDA等の情報処理端末など)に、Webデータのブラウジング機能や電子メール機能を実現させるソフトウェア(プログラム、データ等を含む)を実装することにより、クライアント装置200を実現してもよい。
 また、クライアント装置200の制御部210は、制御部210で行う処理の全部または任意の一部を、CPUおよび当該CPUにて解釈して実行するプログラムで実現してもよい。ROM220またはHD230には、OS(Operating System)と協働してCPUに命令を与え、各種処理を行うためのコンピュータプログラムが記録されている。当該コンピュータプログラムは、RAM240にロードされることで実行され、CPUと協働して制御部210を構成する。また、当該コンピュータプログラムは、クライアント装置200と任意のネットワークを介して接続されるアプリケーションプログラムサーバに記録されてもよく、クライアント装置200は、必要に応じてその全部または一部をダウンロードしてもよい。また、制御部210で行う処理の全部または任意の一部を、ワイヤードロジック等によるハードウェアで実現してもよい。
 ここで、制御部210は、評価装置100の制御部102に備えられている評価部102iが有する機能と同様の機能を有する評価部210a(算出部210a1、変換部210a2、生成部210a3、及び分類部210a4を含む)を備えていてもよい。そして、制御部210に評価部210aが備えられている場合には、評価部210aは、評価装置100から送信された評価結果に含まれている情報に応じて、変換部210a2で式の値を変換したり、生成部210a3で式の値又は変換後の値(濃度値又は当該濃度値の変換後の値でもよい)に対応する位置情報を生成したり、分類部210a4で式の値又は変換後の値(濃度値又は当該濃度値の変換後の値でもよい)を用いて個体を複数の区分のうちのどれか1つに分類したりしてもよい。
 つぎに、本システムのネットワーク300について図3、図4を参照して説明する。ネットワーク300は、評価装置100とクライアント装置200とデータベース装置400とを相互に通信可能に接続する機能を有し、例えばインターネットやイントラネットやLAN(有線/無線の双方を含む)等である。なお、ネットワーク300は、VANや、パソコン通信網や、公衆電話網(アナログ/デジタルの双方を含む)や、専用回線網(アナログ/デジタルの双方を含む)や、CATV網や、携帯回線交換網または携帯パケット交換網(IMT2000方式、GSM(登録商標)方式またはPDC/PDC-P方式等を含む)や、無線呼出網や、Bluetooth(登録商標)等の局所無線網や、PHS網や、衛星通信網(CS、BSまたはISDB等を含む)等でもよい。
 つぎに、本システムのデータベース装置400の構成について図14を参照して説明する。図14は、本システムのデータベース装置400の構成の一例を示すブロック図であり、該構成のうち本発明に関係する部分のみを概念的に示している。
 データベース装置400は、評価装置100または当該データベース装置で評価式を作成する際に用いる指標状態情報や、評価装置100で作成した評価式、評価装置100での評価結果などを格納する機能を有する。図14に示すように、データベース装置400は、当該データベース装置を統括的に制御するCPU等の制御部402と、ルータ等の通信装置および専用線等の有線または無線の通信回路を介して当該データベース装置をネットワーク300に通信可能に接続する通信インターフェース部404と、各種のデータベースやテーブルやファイル(例えばWebページ用ファイル)などを格納する記憶部406と、入力装置412や出力装置414に接続する入出力インターフェース部408と、で構成されており、これら各部は任意の通信路を介して通信可能に接続されている。
 記憶部406は、ストレージ手段であり、例えば、RAM・ROM等のメモリ装置や、ハードディスクのような固定ディスク装置や、フレキシブルディスクや、光ディスク等を用いることができる。記憶部406には、各種処理に用いる各種プログラム等を格納する。通信インターフェース部404は、データベース装置400とネットワーク300(またはルータ等の通信装置)との間における通信を媒介する。すなわち、通信インターフェース部404は、他の端末と通信回線を介してデータを通信する機能を有する。入出力インターフェース部408は、入力装置412や出力装置414に接続する。ここで、出力装置414には、モニタ(家庭用テレビを含む)の他、スピーカやプリンタを用いることができる(なお、以下で、出力装置414をモニタ414として記載する場合がある。)。また、入力装置412には、キーボードやマウスやマイクの他、マウスと協働してポインティングデバイス機能を実現するモニタを用いることができる。
 制御部402は、OS(Operating System)等の制御プログラム・各種の処理手順等を規定したプログラム・所要データなどを格納するための内部メモリを有し、これらのプログラムに基づいて種々の情報処理を実行する。制御部402は、図示の如く、大別して、要求解釈部402aと閲覧処理部402bと認証処理部402cと電子メール生成部402dとWebページ生成部402eと送信部402fとを備えている。
 要求解釈部402aは、評価装置100からの要求内容を解釈し、その解釈結果に応じて制御部402の各部に処理を受け渡す。閲覧処理部402bは、評価装置100からの各種画面の閲覧要求を受けて、これら画面のWebデータの生成や送信を行う。認証処理部402cは、評価装置100からの認証要求を受けて、認証判断を行う。電子メール生成部402dは、各種の情報を含んだ電子メールを生成する。Webページ生成部402eは、利用者がクライアント装置200で閲覧するWebページを生成する。送信部402fは、指標状態情報や評価式などの各種情報を、評価装置100へ送信する。
 なお、本説明では、評価装置100が、濃度データの受信から、評価式の値の算出、個体の区分への分類、そして評価結果の送信までを実行し、クライアント装置200が評価結果の受信を実行するケースを例として挙げたが、クライアント装置200に評価部210aが備えられている場合は、評価装置100は評価式の値の算出を実行すれば十分であり、例えば評価式の値の変換、位置情報の生成、及び、個体の区分への分類などは、評価装置100とクライアント装置200とで適宜分担して実行してもよい。
 例えば、クライアント装置200は、評価装置100から評価式の値を受信した場合には、評価部210aは、変換部210a2で評価式の値を変換したり、生成部210a3で評価式の値又は変換後の値に対応する位置情報を生成したり、分類部210a4で式の値又は変換後の値を用いて個体を複数の区分のうちのどれか1つに分類したりしてもよい。
 また、クライアント装置200は、評価装置100から変換後の値を受信した場合には、評価部210aは、生成部210a3で変換後の値に対応する位置情報を生成したり、分類部210a4で変換後の値を用いて個体を複数の区分のうちのどれか1つに分類したりしてもよい。
 また、クライアント装置200は、評価装置100から評価式の値又は変換後の値と位置情報とを受信した場合には、評価部210aは、分類部210a4で評価式の値又は変換後の値を用いて個体を複数の区分のうちのどれか1つに分類してもよい。
[2-3.他の実施形態]
 本発明にかかる評価装置、評価方法、評価プログラム、評価システム、および情報通信端末装置は、上述した第2実施形態以外にも、特許請求の範囲に記載した技術的思想の範囲内において種々の異なる実施形態にて実施されてよいものである。
 また、第2実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。
 このほか、上記文献中や図面中で示した処理手順、制御手順、具体的名称、各処理の登録データや検索条件等のパラメータを含む情報、画面例、データベース構成については、特記する場合を除いて任意に変更することができる。
 また、評価装置100に関して、図示の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。
 例えば、評価装置100が備える処理機能、特に制御部102にて行われる各処理機能については、その全部または任意の一部を、CPU(Central Processing Unit)および当該CPUにて解釈実行されるプログラムにて実現してもよく、また、ワイヤードロジックによるハードウェアとして実現してもよい。尚、プログラムは、情報処理装置に本発明にかかる評価方法を実行させるためのプログラム化された命令を含む一時的でないコンピュータ読み取り可能な記録媒体に記録されており、必要に応じて評価装置100に機械的に読み取られる。すなわち、ROMまたはHDDなどの記憶部106などには、OS(Operating System)と協働してCPUに命令を与え、各種処理を行うためのコンピュータプログラムが記録されている。このコンピュータプログラムは、RAMにロードされることによって実行され、CPUと協働して制御部を構成する。
 また、このコンピュータプログラムは評価装置100に対して任意のネットワークを介して接続されたアプリケーションプログラムサーバに記憶されていてもよく、必要に応じてその全部または一部をダウンロードすることも可能である。
 また、本発明にかかる評価プログラムを、一時的でないコンピュータ読み取り可能な記録媒体に格納してもよく、また、プログラム製品として構成することもできる。ここで、この「記録媒体」とは、メモリーカード、USBメモリ、SDカード、フレキシブルディスク、光磁気ディスク、ROM、EPROM、EEPROM(登録商標)、CD-ROM、MO、DVD、および、Blu-ray(登録商標) Disc等の任意の「可搬用の物理媒体」を含むものとする。
 また、「プログラム」とは、任意の言語または記述方法にて記述されたデータ処理方法であり、ソースコードまたはバイナリコード等の形式を問わない。なお、「プログラム」は必ずしも単一的に構成されるものに限られず、複数のモジュールやライブラリとして分散構成されるものや、OS(Operating System)に代表される別個のプログラムと協働してその機能を達成するものをも含む。なお、実施形態に示した各装置において記録媒体を読み取るための具体的な構成および読み取り手順ならびに読み取り後のインストール手順等については、周知の構成や手順を用いることができる。
 記憶部106に格納される各種のデータベース等は、RAM、ROM等のメモリ装置、ハードディスク等の固定ディスク装置、フレキシブルディスク、および、光ディスク等のストレージ手段であり、各種処理やウェブサイト提供に用いる各種のプログラム、テーブル、データベース、および、ウェブページ用ファイル等を格納する。
 また、評価装置100は、既知のパーソナルコンピュータまたはワークステーション等の情報処理装置として構成してもよく、また、任意の周辺装置が接続された当該情報処理装置として構成してもよい。また、評価装置100は、当該情報処理装置に本発明の評価方法を実現させるソフトウェア(プログラムまたはデータ等を含む)を実装することにより実現してもよい。
 更に、装置の分散・統合の具体的形態は図示するものに限られず、その全部または一部を、各種の付加等に応じてまたは機能負荷に応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。すなわち、上述した実施形態を任意に組み合わせて実施してもよく、実施形態を選択的に実施してもよい。
 肺癌の確定診断が行われた肺癌患者(肺癌群:72名)、及び、癌の既往歴、罹患歴がない健常者(健常群:69名)の血漿サンプルから、前述の代謝物分析法(A)により血中代謝物濃度を測定した。
 14種類の代謝物(Homoarginine,GABA,3-Me-His,ADMA,Spermine,Spermidine,Cystathionine,Sarcosine,aAiBA,bAiBA,Putrescine,N-Acetyl-L-lys,Hypotaurine,bABA)の血漿中濃度値(nmol/ml)のデータを用いて、各代謝物について肺癌群と健常群の判別能をROC_AUC(受信者特性曲線の曲線下面積)で評価した。表1に各代謝物の判別能を評価する際の指標となるROC_AUCを示す。
Figure JPOXMLDOC01-appb-T000001
 ノンパラメトリックの仮定のもとで帰無仮説を「ROC_AUC=0.5」とした場合の検定でROC_AUCが有意(p<0.05)であった代謝物は、Homoarginine,GABA,3-Me-His,ADMA,Spermine,Cystathionineであった。Homoarginine,GABA,3-Me-Hisは肺癌群で有意に減少し、ADMA,Spermine,Cystathionineは肺癌群で有意に増加した。これらの代謝物の濃度値は、ROC_AUCが有意であることから、健常の状態を考慮した、肺癌の状態の評価において有用なものであると考えられる。
 実施例1で得られたサンプルデータを用いた。血漿中の代謝物濃度値が代入される変数を含む、肺癌群と健常群との2群を判別するための多変量判別式(多変量関数)を求めた。
 多変量判別式としてロジスティック回帰式を用いた。ロジスティック回帰式に含める2個の変数の組み合わせを、上記14種類の代謝物のうち少なくとも1つを必須としたうえで、19種類のアミノ酸(Asn,His,Thr,Ala,Cit,Arg,Tyr,Val,Met,Lys,Trp,Gly,Pro,Orn,Ile,Leu,Phe,Ser,Gln)および上記14種類の代謝物から探索し、肺癌群と健常群の判別能が良好なロジスティック回帰式の探索を実施した。
 肺癌群と健常群のROC_AUC値が0.597(単独の代謝物で有意なROC_AUCの最小値)以上で、変数の個数が2個のロジスティック回帰式の一覧を、図15から図20に示した。これらのロジスティック回帰式は、ROC_AUC値が高いことから、前記の評価において有用なものであると考えられる。
 実施例1で用いたサンプルデータを用いた。血漿中の代謝物濃度値が代入される変数を含む、肺癌群と健常群との2群を判別するための多変量判別式(多変量関数)を求めた。
 多変量判別式としてロジスティック回帰式を用いた。ロジスティック回帰式に含める3個の変数の組み合わせを、実施例2と同様に、上記14種類の代謝物のうち少なくとも1つを必須としたうえで、上記19種類のアミノ酸および上記14種類の代謝物から探索し、肺癌群と健常群の判別能が良好なロジスティック回帰式の探索を実施した。
 肺癌群と健常群のROC_AUC値が0.771(単独の代謝物で有意なROC_AUCの最大値)以上で、変数の個数が3個のロジスティック回帰式の一覧を、図21から図48に示した。これらのロジスティック回帰式は、ROC_AUC値が高いことから、前記の評価において有用なものであると考えられる。
 実施例1で用いたサンプルデータを用いた。血漿中の代謝物濃度値が代入される変数を含む、肺癌群と健常群との2群を判別するための多変量判別式(多変量関数)を求めた。
 多変量判別式としてロジスティック回帰式を用いた。ロジスティック回帰式に含める6個の変数の組み合わせを、上記19種類のアミノ酸および上記14種類の代謝物から探索し、肺癌群と健常群の判別能が良好なロジスティック回帰式の探索を実施した。
 上記で得られたロジスティック回帰式のうち、ROC_AUCが0.95以上の383式に含まれるアミノ酸変数の出現頻度を求めた。ロジスティック回帰式の一覧を図49から図64に、出現頻度を表2に示した。これより、Pro,Cit,Phe,His,Trp,ADMA,Cystathionineの出現頻度は50以上と高いことが示された。特に、Pro,Cit,Phe,His,Trp,ADMAの出現頻度は100以上と高いことが示された。更に、Pro,Cit,His,ADMAの出現頻度は300以上と高いことが示された。
Figure JPOXMLDOC01-appb-T000002
 上記で得られたロジスティック回帰式のうち、例えば、変数の組「Pro,Cit,His,GABA,ADMA,Homoarginine」を持つ指標式1「6.0201+0.029344*Pro-0.17847*Cit-0.17485*His-22.9141*GABA+23.6129*ADMA-0.57734*homoarginine(Pro,Cit,His,GABA,ADMA,Homoarginineを変数として含む多変量判別式)の判別能は、ROC_AUC=0.9601,感度=0.903,特異度=0.899と良好なものであった。なお、上記感度及び特異度は、感度と特異度の平均が最も高くなる最高判別点をカットオフ値とした場合の値である。
 ここで、指標式1、並びに、肺癌群のアミノ酸及び代謝物濃度値(μmol/L)を用いて、式の値を算出し、そして、算出した式の値及び予め設定したカットオフ値を用いて、肺癌群の各症例を、以下に示す通り設定した複数の区分のうちのどれか1つに分類した。ここで、カットオフ値の候補として、特異度80%のときの式の値と特異度95%のときの式の値を求めたところ、それぞれ-1.016と0.816であった。なお、これらをカットオフ値とした場合の感度はそれぞれ93%、79%である。
 式の値が最も高かった1症例のアミノ酸濃度値はそれぞれ、Pro:209.6、Cit:24.5、His:35.1、GABA:0.100、ADMA:0.629、Homoarginine:0.812であり、この症例の式の値は13.7であった。ここで、「対数オッズln(p/(1-p))=式の値」という関係式(pは癌である確率)を定義して、この式の値13.7からオッズp/(1-p)を計算したところ、918043.4であった。さらに、このオッズから確率pを計算したところ、1.0であった。
 そして、カットオフ値として特異度95%のときの式の値0.816を設定し、そして、式の値がカットオフ値より高い場合は陽性(肺癌区分に相当)でカットオフ値より低い場合は陰性(健常区分に相当)と定義して、式の値が13.7であった前記症例を陽性及び陰性のどちらかに分類したところ、この式の値はカットオフ値より高いため、この症例は陽性に分類された。
 また、第一のカットオフ値として特異度80%のときの式の値-1.016を設定し、第二のカットオフ値として特異度95%のときの式の値0.816を設定し、そして、式の値が第一のカットオフ値より低い場合はランクA(肺癌である可能性(確率、リスク)が低いことを意味する区分)で、第一のカットオフ値より高く第二のカットオフ値より低い場合はランクB(肺癌である可能性が中程度であることを意味する区分)で、第二のカットオフ値より高い場合はランクC(肺癌である可能性が高いことを意味する区分)と定義して、式の値が13.7であった前記症例を3つのランクのうちのどれか1つに分類したところ、この式の値は第二のカットオフ値より高いため、この症例はランクCに分類された。
 本実施例5においては、実施例1で用いた血液サンプルの中から健常者19名分の血漿、肺癌患者20名分の血漿をそれぞれまとめたプール血漿を用い、前述の代謝物分析法(A)を用いて定性分析を行った。
 実施例1で測定した14種類の代謝物以外に、「ACQUITYTM UPLC」(ウォーターズ社)を用い(分析カラム:「Inertcil ODS-3(粒子径:2.0μm、内径:2.1mm、長さ:100mm)」(ジーエルサイエンス社)、ガードカラム:「Cartridge Guard Column E Inertsil ODS-3(粒子径:3.0μm、内径:1.5mm、長さ:10mm)」(ジーエルサイエンス社))、カラム温度を50℃とし、溶離液AにAPDSアミノタグワコー用溶離液(和光純薬工業)を用い、溶離液Bとしてアセトニトリル/水(60:40、v/v)を用いて、0.5mL/minの流量で分析を実施し、そして、この実施において、溶離液Bを、下記の通り、時間経過に合わせて段階的に変化させたところ、3.3分付近のβ-アミノイソ酪酸の直後に溶出する保持時間3.5分付近にピーク(m/z 224)が出現した。そして、このピークの面積値は、健常者の血漿プールで202,000、肺癌患者のプール血漿で2,790,000であった。つまり、肺癌患者のプール血漿で約13.8倍の面積値の上昇が認められた。そのときのクロマトグラムを図65に示した。
 0.00分~ 0.01分:5%~6%
 0.01分~ 3.50分:6%
 3.50分~ 5.00分:6%~8%
 5.00分~ 6.00分:8%~20%
 6.00分~ 8.50分:20%
 8.50分~ 9.50分:20%~24%
 9.50分~12.00分:24%
12.00分~12.01分:24%~35%
12.01分~15.00分:35%~80%
15.00分~15.10分:80%~95%
15.10分~17.00分:95%
17.01分~19.00分:5%
 上記のピークはその質量数および液体クロマトグラフィの保持時間からEthylglycineであることが示された。これより、Ethylglycineが、肺癌の状態を評価するのに有用であることが示された。
 実施例1のサンプルを用いて、前述の代謝物分析法(A)により実施例1の血中代謝物濃度に加え、血中のEthylglycine濃度を測定した。
 Ethylglycineの血漿中濃度値(nmol/ml)のデータを用いて、肺癌群と健常群の判別能をROC_AUCで評価した。表3にEthylglycineの判別能を評価する際の指標となるROC_AUCを示す。
Figure JPOXMLDOC01-appb-T000003
 Ethylglycineは、ノンパラメトリックの仮定のもとで帰無仮説を「ROC_AUC=0.5」とした場合の検定でROC_AUCが有意(p<0.05)であり、肺癌群で有意に増加した。Ethylglycineの濃度値は、ROC_AUCが有意であることから、健常の状態を考慮した、肺癌の状態の評価において有用なものであると考えられる。
 実施例6で得られたサンプルデータを用いた。血漿中の代謝物濃度値が代入される変数を含む、肺癌群と健常群との2群を判別するための多変量判別式(多変量関数)を求めた。
 多変量判別式としてロジスティック回帰式を用いた。ロジスティック回帰式に含める2個の変数の組み合わせを、Ethylglycineを必須としたうえで、上記19種類のアミノ酸および上記14種類の代謝物から探索し、肺癌群と健常群の判別能が良好なロジスティック回帰式の探索を実施した。
 肺癌群と健常群のROC_AUC値が0.779(Ethylglycine単独のROC_AUC値)以上で、変数の個数が2個のロジスティック回帰式(変数の組み合わせ)の一覧を図66に示した。なお、図66に示す各式について、各変数の係数の数値はゼロを除く任意の数値であればよく、また、定数の数値は任意の数値であればよい。これらのロジスティック回帰式は、ROC_AUC値が高いことから、前記の評価において有用なものであると考えられる。
 実施例6で用いたサンプルデータを用いた。血漿中の代謝物濃度値が代入される変数を含む、肺癌群と健常群との2群を判別するための多変量判別式(多変量関数)を求めた。
 多変量判別式としてロジスティック回帰式を用いた。ロジスティック回帰式に含める3個の変数の組み合わせを、実施例7と同様に、Ethylglycineを必須としたうえで、上記19種類のアミノ酸および上記14種類の代謝物から探索し、肺癌群と健常群の判別能が良好なロジスティック回帰式の探索を実施した。
 肺癌群と健常群のROC_AUC値が0.779(Ethylglycine単独のROC_AUC値)以上で、変数の個数が3個のロジスティック回帰式(変数の組み合わせ)の一覧を図67から図69に示した。なお、図67から図69に示す各式について、各変数の係数の数値はゼロを除く任意の数値であればよく、また、定数の数値は任意の数値であればよい。これらのロジスティック回帰式は、ROC_AUC値が高いことから、前記の評価において有用なものであると考えられる。
 実施例6で用いたサンプルデータを用いた。血漿中の代謝物濃度値が代入される変数を含む、肺癌群と健常群との2群を判別するための多変量判別式(多変量関数)を求めた。
 多変量判別式としてロジスティック回帰式を用いた。ロジスティック回帰式に含める6個の変数の組み合わせを、実施例7と同様に、Ethylglycineを必須としたうえで、上記19種類のアミノ酸および上記14種類の代謝物から探索し、肺癌群と健常群の判別能が良好なロジスティック回帰式の探索を実施した。
 上記で得られたロジスティック回帰式のうち、肺癌群と健常群のROC_AUC値が0.95以上の122式に含まれるアミノ酸変数の出現頻度を求めた。ロジスティック回帰式の一覧を図70から図72に、出現頻度を表4に示した。なお、図70から図72に示す各式について、各変数の係数の数値はゼロを除く任意の数値であればよく、また、定数の数値は任意の数値であればよい。これより、Pro,Cit,Phe,His,GABA,ADMA,Cystathionine,Ethylglycineの出現頻度は20以上と高いことが示された。特に、Cit,His,ADMA,Ethylglycineの出現頻度は100以上と高いことが示された。
Figure JPOXMLDOC01-appb-T000004
 上記で得られたロジスティック回帰式のうち、例えば、変数の組「Pro,Cit,His,ADMA,Homoarginine,Ethylglycine」を持つ指標式2「2.8645+0.024531*Pro-0.20356*Cit-0.15864*His+24.334*ADMA-0.74621*Homoarginine+3.7291*Ethylglycine(Pro,Cit,His,ADMA,Homoarginine,Ethylglycineを変数として含む多変量判別式)の判別能は、ROC_AUC=0.9599,感度=0.889,特異度=0.899と良好なものであった。なお、上記感度及び特異度は、感度と特異度の平均が最も高くなる最高判別点をカットオフ値とした場合の値である。
 ここで、指標式2、並びに、肺癌群のアミノ酸及び代謝物濃度値(μmol/L)を用いて、式の値を算出し、そして、算出した式の値及び予め設定したカットオフ値を用いて、肺癌群の各症例を、以下に示す通り設定した複数の区分のうちのどれか1つに分類した。ここで、カットオフ値の候補として、特異度80%のときの式の値と特異度95%のときの式の値を求めたところ、それぞれ-0.7765と0.5558であった。なお、これらをカットオフ値とした場合の感度はそれぞれ93%、79%である。
 式の値が最も高かった1症例のアミノ酸濃度値はそれぞれ、Pro:279.7、Cit:26.8、His:72.4、ADMA:0.572、Homoarginine:0.833、Ethylglycine:4.20であり、この症例の式の値は21.7であった。ここで、「対数オッズln(p/(1-p))=式の値」という関係式(pは癌である確率)を定義して、この式の値21.7からオッズp/(1-p)を計算したところ、2,655,768,756であった。さらに、このオッズから確率pを計算したところ、1.0であった。
 そして、カットオフ値として特異度95%のときの式の値0.5558を設定し、そして、式の値がカットオフ値より高い場合は陽性(肺癌区分に相当)でカットオフ値より低い場合は陰性(健常区分に相当)と定義して、式の値が21.7であった前記症例を陽性及び陰性のどちらかに分類したところ、この式の値はカットオフ値より高いため、この症例は陽性に分類された。
 また、第一のカットオフ値として特異度80%のときの式の値-0.7765を設定し、第二のカットオフ値として特異度95%のときの式の値0.5558を設定し、そして、式の値が第一のカットオフ値より低い場合はランクA(肺癌である可能性(確率、リスク)が低いことを意味する区分)で、第一のカットオフ値より高く第二のカットオフ値より低い場合はランクB(肺癌である可能性が中程度であることを意味する区分)で、第二のカットオフ値より高い場合はランクC(肺癌である可能性が高いことを意味する区分)と定義して、式の値が21.7であった前記症例を3つのランクのうちのどれか1つに分類したところ、この式の値は第二のカットオフ値より高いため、この症例はランクCに分類された。
 以上のように、本発明は、産業上の多くの分野、特に医薬品や食品、医療などの分野で広く実施することができ、特に肺癌の状態の進行予測や疾病リスク予測やプロテオームやメタボローム解析などを行うバイオインフォマティクス分野において極めて有用である。
 100 評価装置
 102 制御部
 102a 要求解釈部
 102b 閲覧処理部
 102c 認証処理部
 102d 電子メール生成部
 102e Webページ生成部
 102f 受信部
 102g 指標状態情報指定部
 102h 評価式作成部
 102i 評価部
 102i1 算出部
 102i2 変換部
 102i3 生成部
 102i4 分類部
 102j 結果出力部
 102k 送信部
 104 通信インターフェース部
 106 記憶部
 106a 利用者情報ファイル
 106b 濃度データファイル
 106c 指標状態情報ファイル
 106d 指定指標状態情報ファイル
 106e 評価式関連情報データベース
 106e1 評価式ファイル
 106f 評価結果ファイル
 108 入出力インターフェース部
 112 入力装置
 114 出力装置
 200 クライアント装置(端末装置(情報通信端末装置))
 300 ネットワーク
 400 データベース装置

Claims (10)

  1.  評価対象の血液中のHomoarginine,GABA,3-Me-His,ADMA,Spermine,Spermidine,Cystathionine,Sarcosine,aAiBA,bAiBA,Putrescine,N-Acetyl-L-lys,Hypotaurine,bABA,Ethylglycineのうちの少なくとも1つの濃度値を用いて、前記評価対象について、肺癌の状態を評価する評価ステップを含むこと、
     を特徴とする評価方法。
  2.  前記評価ステップでは、評価対象の血液中のAsn,His,Thr,Ala,Cit,Arg,Tyr,Val,Met,Lys,Trp,Gly,Pro,Orn,Ile,Leu,Phe,Ser,Glnのうちの少なくとも1つの濃度値をさらに用いること、
     を特徴とする請求項1に記載の評価方法。
  3.  前記評価ステップでは、Homoarginine,GABA,3-Me-His,ADMA,Spermine,Spermidine,Cystathionine,Sarcosine,aAiBA,bAiBA,Putrescine,N-Acetyl-L-lys,Hypotaurine,bABA,Ethylglycineのうちの少なくとも1つの濃度値が代入される変数を含む式をさらに用いて、前記式の値を算出することで、前記評価対象について、肺癌の状態を評価すること、
     を特徴とする請求項1に記載の評価方法。
  4.  前記評価ステップでは、評価対象の血液中のAsn,His,Thr,Ala,Cit,Arg,Tyr,Val,Met,Lys,Trp,Gly,Pro,Orn,Ile,Leu,Phe,Ser,Glnのうちの少なくとも1つの濃度値をさらに用い、
     前記式は、Asn,His,Thr,Ala,Cit,Arg,Tyr,Val,Met,Lys,Trp,Gly,Pro,Orn,Ile,Leu,Phe,Ser,Glnのうちの少なくとも1つの濃度値が代入される変数をさらに含むものであること、
     を特徴とする請求項3に記載の評価方法。
  5.  制御部を備えた評価装置であって、
     前記制御部は、
     評価対象の血液中のHomoarginine,GABA,3-Me-His,ADMA,Spermine,Spermidine,Cystathionine,Sarcosine,aAiBA,bAiBA,Putrescine,N-Acetyl-L-lys,Hypotaurine,bABA,Ethylglycineのうちの少なくとも1つの濃度値を用いて、前記評価対象について、肺癌の状態を評価する評価手段
     を備えたこと、
     を特徴とする評価装置。
  6.  制御部を備えた情報処理装置において実行される評価方法であって、
     前記制御部において実行される、
     評価対象の血液中のHomoarginine,GABA,3-Me-His,ADMA,Spermine,Spermidine,Cystathionine,Sarcosine,aAiBA,bAiBA,Putrescine,N-Acetyl-L-lys,Hypotaurine,bABA,Ethylglycineのうちの少なくとも1つの濃度値を用いて、前記評価対象について、肺癌の状態を評価する評価ステップ
     を含むこと、
     を特徴とする評価方法。
  7.  制御部を備えた情報処理装置において実行させるための評価プログラムであって、
     前記制御部において実行させるための、
     評価対象の血液中のHomoarginine,GABA,3-Me-His,ADMA,Spermine,Spermidine,Cystathionine,Sarcosine,aAiBA,bAiBA,Putrescine,N-Acetyl-L-lys,Hypotaurine,bABA,Ethylglycineのうちの少なくとも1つの濃度値を用いて、前記評価対象について、肺癌の状態を評価する評価ステップ
     を含むこと、
     を特徴とする評価プログラム。
  8.  制御部を備えた評価装置と、制御部を備え、評価対象の血液中のHomoarginine,GABA,3-Me-His,ADMA,Spermine,Spermidine,Cystathionine,Sarcosine,aAiBA,bAiBA,Putrescine,N-Acetyl-L-lys,Hypotaurine,bABA,Ethylglycineのうちの少なくとも1つの濃度値に関する濃度データを提供する端末装置とを、ネットワークを介して通信可能に接続して構成された評価システムであって、
     前記端末装置の前記制御部は、
     前記評価対象の前記濃度データを前記評価装置へ送信する濃度データ送信手段と、
     前記評価装置から送信された、前記評価対象における肺癌の状態に関する評価結果を受信する結果受信手段と、
     を備え、
     前記評価装置の前記制御部は、
     前記端末装置から送信された前記評価対象の前記濃度データを受信する濃度データ受信手段と、
     前記濃度データ受信手段で受信した前記評価対象の前記濃度データに含まれている、Homoarginine,GABA,3-Me-His,ADMA,Spermine,Spermidine,Cystathionine,Sarcosine,aAiBA,bAiBA,Putrescine,N-Acetyl-L-lys,Hypotaurine,bABA,Ethylglycineのうちの少なくとも1つの前記濃度値を用いて、前記評価対象について、肺癌の状態を評価する評価手段と、
     前記評価手段で得られた前記評価結果を前記端末装置へ送信する結果送信手段と、
     を備えたこと、
     を特徴とする評価システム。
  9.  制御部を備えた端末装置であって、
     前記制御部は、
     評価対象における肺癌の状態に関する評価結果を取得する結果取得手段
     を備え、
     前記評価結果は、前記評価対象の血液中のHomoarginine,GABA,3-Me-His,ADMA,Spermine,Spermidine,Cystathionine,Sarcosine,aAiBA,bAiBA,Putrescine,N-Acetyl-L-lys,Hypotaurine,bABA,Ethylglycineのうちの少なくとも1つの濃度値を用いて、前記評価対象について、肺癌の状態を評価した結果であること、
     を特徴とする端末装置。
  10.  評価対象の血液中のHomoarginine,GABA,3-Me-His,ADMA,Spermine,Spermidine,Cystathionine,Sarcosine,aAiBA,bAiBA,Putrescine,N-Acetyl-L-lys,Hypotaurine,bABA,Ethylglycineのうちの少なくとも1つの濃度値に関する濃度データを提供する端末装置とネットワークを介して通信可能に接続された、制御部を備えた評価装置であって、
     前記制御部は、
     前記端末装置から送信された前記評価対象の前記濃度データを受信する濃度データ受信手段と、
     前記濃度データ受信手段で受信した前記評価対象の前記濃度データに含まれている、Homoarginine,GABA,3-Me-His,ADMA,Spermine,Spermidine,Cystathionine,Sarcosine,aAiBA,bAiBA,Putrescine,N-Acetyl-L-lys,Hypotaurine,bABA,Ethylglycineのうちの少なくとも1つの前記濃度値を用いて、前記評価対象について、肺癌の状態を評価する評価手段と、
     前記評価手段で得られた評価結果を前記端末装置へ送信する結果送信手段と、
     を備えたこと、
     を特徴とする評価装置。
PCT/JP2016/060576 2015-03-31 2016-03-30 評価方法、評価装置、評価プログラム、評価システム、及び端末装置 WO2016159191A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2017510159A JP6687020B2 (ja) 2015-03-31 2016-03-30 取得方法、算出方法、評価装置、算出装置、評価プログラム、算出プログラムおよび評価システム
KR1020237011364A KR102564592B1 (ko) 2015-03-31 2016-03-30 평가 방법, 평가 장치, 평가 프로그램 제품, 평가 시스템, 및 단말 장치
KR1020177031516A KR102519764B1 (ko) 2015-03-31 2016-03-30 평가 방법, 평가 장치, 평가 프로그램 제품, 평가 시스템, 및 단말 장치
US15/715,389 US20180017570A1 (en) 2015-03-31 2017-09-26 Evaluating method, evaluating apparatus, evaluating program product, evaluating system, and terminal apparatus

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2015-071830 2015-03-31
JP2015071830 2015-03-31

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US15/715,389 Continuation US20180017570A1 (en) 2015-03-31 2017-09-26 Evaluating method, evaluating apparatus, evaluating program product, evaluating system, and terminal apparatus

Publications (1)

Publication Number Publication Date
WO2016159191A1 true WO2016159191A1 (ja) 2016-10-06

Family

ID=57007257

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2016/060576 WO2016159191A1 (ja) 2015-03-31 2016-03-30 評価方法、評価装置、評価プログラム、評価システム、及び端末装置

Country Status (4)

Country Link
US (1) US20180017570A1 (ja)
JP (3) JP6687020B2 (ja)
KR (2) KR102519764B1 (ja)
WO (1) WO2016159191A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018101450A1 (ja) * 2016-12-01 2018-06-07 味の素株式会社 癌モニタリングの方法、算出方法、評価装置、算出装置、評価プログラム、算出プログラム、評価システム、及び端末装置

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020180424A1 (en) 2019-03-04 2020-09-10 Iocurrents, Inc. Data compression and communication using machine learning
US10991185B1 (en) 2020-07-20 2021-04-27 Abbott Laboratories Digital pass verification systems and methods

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008016111A1 (en) * 2006-08-04 2008-02-07 Ajinomoto Co., Inc. Method for evaluation of lung cancer, lung cancer evaluation apparatus, lung cancer evaluation method, lung cancer evaluation system, lung cancer evaluation program, and recording medium
JP2008164517A (ja) * 2006-12-28 2008-07-17 Sentan Seimei Kagaku Kenkyusho:Kk メチル化ヘテロジニアス・ヌクレア・リボヌクレオプロテインの免疫学的分析方法及びその利用
WO2011096210A1 (en) * 2010-02-03 2011-08-11 Oncotherapy Science, Inc. Prmt1 and prmt6 for target genes of cancer therapy and diagnosis

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3895227B2 (ja) 2002-07-24 2007-03-22 帝人ファイバー株式会社 衣料関連商品
JP2006098192A (ja) 2004-09-29 2006-04-13 Scivax Kk 傾き検知方法および傾き検知装置、この方法および装置に用いる金型、この方法および装置を用いたパターン形成装置
JP4976764B2 (ja) 2006-07-05 2012-07-18 株式会社東芝 半導体記憶装置
JP5096075B2 (ja) 2007-08-24 2012-12-12 プライムアースEvエナジー株式会社 電池パック
JP5467845B2 (ja) 2009-09-29 2014-04-09 セイコーインスツル株式会社 ボルテージレギュレータ
JP2011247869A (ja) 2010-04-27 2011-12-08 Kobe Univ メタボローム解析手法を用いた特定疾患の検査方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008016111A1 (en) * 2006-08-04 2008-02-07 Ajinomoto Co., Inc. Method for evaluation of lung cancer, lung cancer evaluation apparatus, lung cancer evaluation method, lung cancer evaluation system, lung cancer evaluation program, and recording medium
JP2008164517A (ja) * 2006-12-28 2008-07-17 Sentan Seimei Kagaku Kenkyusho:Kk メチル化ヘテロジニアス・ヌクレア・リボヌクレオプロテインの免疫学的分析方法及びその利用
WO2011096210A1 (en) * 2010-02-03 2011-08-11 Oncotherapy Science, Inc. Prmt1 and prmt6 for target genes of cancer therapy and diagnosis

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
DEMPO K ET AL.: "Demonstration of gamma-glitamyl transferase, alkaline phosphatase, CEA and HCG in human lung cancer", ONCODEV BIOL MED., vol. 2, no. 1-2, 1981, pages 21 - 37 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018101450A1 (ja) * 2016-12-01 2018-06-07 味の素株式会社 癌モニタリングの方法、算出方法、評価装置、算出装置、評価プログラム、算出プログラム、評価システム、及び端末装置
KR20190089895A (ko) * 2016-12-01 2019-07-31 아지노모토 가부시키가이샤 암 모니터링의 방법, 산출 방법, 평가 장치, 산출 장치, 평가 프로그램, 산출 프로그램, 평가 시스템, 및 단말 장치
JPWO2018101450A1 (ja) * 2016-12-01 2019-10-24 味の素株式会社 癌モニタリングの方法、算出方法、評価装置、算出装置、評価プログラム、算出プログラム、評価システム、及び端末装置
KR102477319B1 (ko) * 2016-12-01 2022-12-15 아지노모토 가부시키가이샤 암 모니터링의 방법, 산출 방법, 평가 장치, 산출 장치, 평가 프로그램, 산출 프로그램, 평가 시스템, 및 단말 장치
JP7336850B2 (ja) 2016-12-01 2023-09-01 味の素株式会社 癌モニタリングの方法、算出方法、評価装置、算出装置、評価プログラム、算出プログラム、および評価システム

Also Published As

Publication number Publication date
JPWO2016159191A1 (ja) 2018-02-01
JP6687020B2 (ja) 2020-04-22
JP2022066387A (ja) 2022-04-28
JP2020101571A (ja) 2020-07-02
US20180017570A1 (en) 2018-01-18
KR102564592B1 (ko) 2023-08-09
KR20170132303A (ko) 2017-12-01
KR102519764B1 (ko) 2023-04-10
KR20230051606A (ko) 2023-04-18
JP7337018B2 (ja) 2023-09-01

Similar Documents

Publication Publication Date Title
JP5470848B2 (ja) 肺癌の評価方法、肺癌評価装置、肺癌評価方法、肺癌評価システム、肺癌評価プログラム、記録媒体、および、情報通信端末装置
JP7173240B2 (ja) 取得方法、算出方法、評価装置、算出装置、評価プログラム、算出プログラム、及び評価システム
US20210287802A1 (en) Method for evaluating pancreatic cancer, pancreatic cancer evaluating apparatus, pancreatic cancer evaluating method, pancreatic cancer evaluating program product, pancreatic cancer evaluating system and information communication terminal apparatus
JP7337018B2 (ja) 取得方法、算出方法、評価装置、算出装置、評価プログラム、算出プログラム、評価システム
JP2021081439A (ja) 取得方法、評価装置、評価プログラムおよび評価システム
JP2023101023A (ja) 取得方法、算出方法、評価装置、算出装置、評価プログラム、算出プログラム、及び評価システム
WO2019194144A1 (ja) 乳癌の評価方法、算出方法、評価装置、算出装置、評価プログラム、算出プログラム、記録媒体、評価システム、及び端末装置
JP7435856B2 (ja) 取得方法、算出方法、評価装置、算出装置、評価プログラム、算出プログラム、記録媒体、及び評価システム
JP7435855B2 (ja) 取得方法、算出方法、評価装置、算出装置、評価プログラム、算出プログラム、記録媒体、及び評価システム
JP7120027B2 (ja) 取得方法、算出方法、評価装置、算出装置、評価プログラム、算出プログラム、および評価システム
WO2020184660A1 (ja) サルコペニアの評価方法、算出方法、評価装置、算出装置、評価プログラム、算出プログラム、記録媒体、評価システム、及び端末装置
WO2016148155A1 (ja) 評価方法、評価装置、評価プログラム、評価システム、及び端末装置
JP6886241B2 (ja) 骨格筋面積の評価方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 16773072

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2017510159

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 20177031516

Country of ref document: KR

Kind code of ref document: A

122 Ep: pct application non-entry in european phase

Ref document number: 16773072

Country of ref document: EP

Kind code of ref document: A1