WO2013103197A1 - 암 진단 장치 - Google Patents

암 진단 장치 Download PDF

Info

Publication number
WO2013103197A1
WO2013103197A1 PCT/KR2012/010358 KR2012010358W WO2013103197A1 WO 2013103197 A1 WO2013103197 A1 WO 2013103197A1 KR 2012010358 W KR2012010358 W KR 2012010358W WO 2013103197 A1 WO2013103197 A1 WO 2013103197A1
Authority
WO
WIPO (PCT)
Prior art keywords
crc
cancer
ion
discrimination
mass ions
Prior art date
Application number
PCT/KR2012/010358
Other languages
English (en)
French (fr)
Inventor
유병철
김경희
김대용
김인후
박지원
오재환
이준화
이은숙
Original Assignee
국립암센터
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020120129390A external-priority patent/KR101461615B1/ko
Priority claimed from KR1020120134830A external-priority patent/KR101439981B1/ko
Priority claimed from KR1020120134825A external-priority patent/KR101439975B1/ko
Priority claimed from KR1020120134828A external-priority patent/KR101439977B1/ko
Application filed by 국립암센터 filed Critical 국립암센터
Priority to JP2015549231A priority Critical patent/JP6134809B2/ja
Priority to SG11201502499UA priority patent/SG11201502499UA/en
Publication of WO2013103197A1 publication Critical patent/WO2013103197A1/ko

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • A61B5/7267Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems involving training the classification device
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Definitions

  • the present invention relates to an apparatus for diagnosing cancer, and more particularly, a mass spectrum of low mass ions for cancer diagnosis is confirmed through biostatistic analysis on low mass ions extracted from a biological sample.
  • the present invention relates to a cancer diagnosis apparatus capable of diagnosing cancer using a spectrum.
  • Cancer is a disease in which cells proliferate indefinitely and interfere with normal cell functions. Representatives of lung cancer, gastric cancer (GC), breast cancer (BRC), and colorectal cancer (CRC) are typical. Can occur in any organization. Early cancer diagnosis was based on external changes in biological tissues as the cancer cells grew, but recently, the diagnosis is performed using trace biomolecules present in tissues or cells of organisms such as blood, glyco chains, and DNA. And detection is attempted. However, the most commonly used cancer diagnosis method is using a tissue sample obtained through biopsy or imaging.
  • biopsy has a disadvantage in that it causes a great pain for the patient, is expensive, and takes a long time to diagnose.
  • the patient actually has cancer there is a risk of cancer metastasis during the biopsy, and in the case where the biopsy can not obtain a tissue sample, the tissue suspected by surgical surgery.
  • the diagnosis of the disease is impossible until the extraction of.
  • cancer is determined based on an X-ray image or a nuclear magnetic resonance (NMR) image obtained using a contrast agent to which a disease target is attached.
  • NMR nuclear magnetic resonance
  • imaging diagnosis has the potential of being misdiagnosed according to the clinician's or reading skill's skill, and has a disadvantage in that it depends heavily on the precision of the device for obtaining the image.
  • the finest instruments are unable to detect tumors of several millimeters or less, which makes them difficult to detect in the early stages of development.
  • a patient or a disease-bearing person is exposed to high-energy electromagnetic waves that may cause mutation of genes to obtain an image, it may cause another disease as well as a limitation in the number of diagnosis through the image. .
  • the presence of a disease is usually determined by visual observation using an endoscope, but the process is very painful to the patient, and even when abnormalities are found through visual observation, a malignant / benign tumor or polyp In order to accurately identify the disease, a biopsy should be performed.
  • CRC in particular, is a common cancer with an incidence of less than three in the world, and the possibility of treatment depends heavily on the stage of the cancer. In other words, when found early in early diagnosis, it has a very high cure rate. Therefore, most of all, it is a disease where accurate early diagnosis is important, but it is common to recognize the disease as a change in color of the feces due to bleeding due to minor signs of abnormality as cancer progresses. Colonoscopy is common, and biopsy is essential for accurate disease identification. In summary, early diagnosis is important for CRC, and because colonoscopy and biopsy can involve a lot of time, cost, discomfort, and pain, it is a diagnostic method that can drastically reduce the number of people who need unnecessary colonoscopy and biopsy. This is necessary.
  • Genomics, proteomics and molecular pathology have provided a number of biomarker candidates of clinical potential. It is thought that the treatment effect can be improved by actively using them in the stage of cancer and customized treatment for each patient. However, many studies should be applied in the future in order to apply to clinical treatment.
  • Recent CRC screening tests are performed using colonoscopy to determine gross abnormality or to detect fecal occult blood tests (FOBT).
  • Colonoscopy has been the standard method for CRC screening, but invasive and acceptable patients are limited.
  • much effort has recently been focused on fecal examination because it is non-invasive, does not require intestinal lavage, and allows the transport of specimens.
  • Fecal markers can be classified as leaking from, secreted from, or detached from the tumor.
  • hemoglobin has been recognized as a type of marker that leaks from large-scale screening programs for diagnosing CRC, but the ability to distinguish markers known to date, including this, is not satisfactory.
  • a spectrum of mass ions in blood may be extracted using a matrix-assisted laser desorption / ionization-time of flight (MALDI-TOF) mass spectrometer.
  • MALDI-TOF matrix-assisted laser desorption / ionization-time of flight
  • the mass spectrum of the extracted low mass ions can be analyzed by MarkerView TM (version version 1.2, below), one of the conventional software.
  • the present inventors have analyzed the mass spectra of low mass ions extracted from serum of CRC patient group and normal control (control, CONT) using MarkerView TM , which will be described in detail with reference to FIG. 1.
  • CEA Carcinoembryonic antigen
  • the imported peak intensities were normalized (A12).
  • the normalization was performed using the "Normalization Using Total Area Sums" method. In this method, a subtotal of the intensity of each sample is obtained, and the average of the subtotals of each sample is obtained, and then each peak intensity is multiplied by a scaling factor for each sample so that the subtotal of the intensity of each sample coincides with this average. That is, after normalizing in this way, the subtotal of the intensity of each sample becomes the same.
  • normalized peak intensities were Pareto scaled (A13). That is, the peak intensities were Pareto scaled by subtracting the average value for each mass ion from each normalized peak intensity and dividing by the square root of the standard deviation.
  • PCA-DA principal component analysis-based linear discriminant analysis
  • DS discriminant score
  • the principal component analysis is performed in two steps to obtain factor loading, which is a weighting factor for each mass ion, multiply the Pareto scaled intensity by this factor loading value, and then add all the result values to each sample.
  • Star discrimination scores were calculated. Since the maximum number of peaks was 10,000 in the import conditions of Table 103 and enough samples were imported together, 10,000 factor loading values were calculated in this calculation, and thus one discrimination score was calculated by adding 10,000 terms.
  • FIG. 2 shows the distribution of discrimination scores calculated by the method of FIG. 1 for a set of 133 clinically determined CRC patient groups and 153 normal controls.
  • Table 104 shows the determination result according to the discrimination score shown in FIG. 2 using a confusion matrix.
  • the conventional principal component analysis-based linear discriminant analysis method described with reference to Figs. 1, 2 and Table 104 is very effective when applied individually to a set of specific samples, i.e. for discriminating individual training sets. Although good discrimination results are shown, the discriminant results in the validation set were not satisfactory (see Tables 124 and 126).
  • the reason why the discriminant is not robust despite the very good discriminant results for the training set is that a significant number of the mass ions of the 10,000 mass ions that make up the discriminant are not necessary at least for discrimination between CRC patients and normal controls.
  • the determination of the training set does not cause problems, but the determination of the test set contains mass ions that can potentially confuse the determination result. Therefore, it is necessary to find only the mass ions that are essential to obtain excellent and robust discrimination results by actively removing mass ions that are minimally unnecessary or potentially confusing. .
  • BRC has the highest increase rate in female incidence and prevalence after thyroid cancer.
  • the survival rate of BRCs is higher than thyroid cancer compared to high incidence.
  • the reason for this is that in addition to the development of effective drugs, the change of BRC perception and, above all, the contribution of mammography.
  • BRCs can improve survival by early detection and treatment. Survival rates of up to 90% have been reported for small BRCs with no lymph node metastasis, but especially when BRCs are found in other sites.
  • it is essential to have a doctor's examination and radiological breast exam in order to detect BRC early.
  • Mammography has low sensitivity of 60-70%, and the diagnosis rate decreases significantly in many dense breasts, especially in young women. There is this.
  • breast ultrasound is recommended, but breast ultrasound is highly dependent on the examiner's skill.
  • breast magnetic resonance imaging (MRI) is used for diagnosis, but due to the high cost, it is difficult to use for screening. This also has the disadvantage of having a high false positive rate.
  • Genomics, proteomics and molecular pathology have provided a number of biomarker candidates of clinical potential. It is thought that the treatment effect can be improved by actively using them in the stage of cancer and customized treatment for each patient. However, many studies should be applied in the future in order to apply to clinical treatment.
  • a spectrum of mass ions in blood may be extracted using a matrix-assisted laser desorption / ionization-time of flight (MALDI-TOF) mass spectrometer.
  • MALDI-TOF matrix-assisted laser desorption / ionization-time of flight
  • the mass spectrum of the extracted low mass ions can be analyzed by MarkerView TM (version version 1.2, below), one of the conventional software.
  • the present inventors analyzed the mass spectra of low-mass ions extracted from serum of the BRC patient group and the normal control (control, CONT) using MarkerView TM , which will be described in detail with reference to FIG. 3.
  • CEA Carcinoembryonic antigen
  • the imported peak intensities were normalized (B12).
  • the normalization was performed using the "Normalization Using Total Area Sums" method. In this method, a subtotal of the intensity of each sample is obtained, and the average of the subtotals of each sample is obtained, and then each peak intensity is multiplied by a scaling factor for each sample so that the subtotal of the intensity of each sample coincides with this average. That is, after normalizing in this way, the subtotal of the intensity of each sample becomes the same.
  • normalized peak intensities were Pareto scaled (B13). That is, the peak intensities were Pareto scaled by subtracting the average value for each mass ion from each normalized peak intensity and dividing by the square root of the standard deviation.
  • a principal component analysis-based linear discriminant analysis was performed on the Pareto scaled peak intensities to calculate a discriminant score (DS) (B14).
  • PCA-DA principal component analysis-based linear discriminant analysis
  • DS discriminant score
  • the principal component analysis is performed in two steps to obtain factor loading, which is a weighting factor for each mass ion, multiply the Pareto scaled intensity by this factor loading value, and then add all the result values to each sample.
  • Star discrimination scores were calculated. Since the maximum number of peaks was 10,000 at the import conditions of Table 203, and enough samples were imported together, 10,000 factor loading values were calculated in this calculation, and thus one discrimination score was calculated by adding 10,000 terms.
  • the positive applied to the BRC was determined to be a BRC patient group, a negative control to a normal control group.
  • FIG. 4 shows the distribution of discrimination scores calculated by the method of FIG. 3 for a set of 54 clinically determined BRC patient groups and 49 normal controls.
  • Table 204 summarizes the determination result according to the discrimination score shown in FIG. 4 using a confusion matrix.
  • the robustness of the equation must first be verified.
  • the mass spectra that have been measured once and additionally repeated several times for the set that constituted the discriminant should still show good discriminant results, and to the new BRC patient group and the normal control group that were not considered when constructing the discriminant.
  • the same discriminant should yield good discriminant results.
  • Repeated measurement of the mass spectrum may include freezing and dissolving the serum, or extracting the serum by mixing it with fresh methanol / chloroform.
  • the conventional principal component analysis-based linear discriminant analysis method described with reference to Figs. 3, 4 and Table 204 is very effective when applied individually to a set of specific samples, i.e. for discriminating individual training sets. Although good discriminant results are shown, the discriminant results in the validation set were not satisfactory (see Tables 224 and 226).
  • the reason why the discriminant is not robust despite the very good discriminant results for the training set is that a significant number of the mass ions of the 10,000 mass ions that make up the discriminant are not necessary at least for the discrimination of BRC patients and normal controls.
  • the determination of the training set does not cause problems, but the determination of the test set contains mass ions that can potentially confuse the determination result. Therefore, it is necessary to find only the mass ions that are essential to obtain excellent and robust discrimination results by actively removing mass ions that are minimally unnecessary or potentially confusing. .
  • GC is the most common cancer in Korea (18.3%) and the third most common cancer among males after BRC and thyroid cancer (major carcinoma fraction, 2003-2005, Statistics Korea).
  • the frequency of early detection is gradually increasing due to endoscopic examination of the general public and changes in public perception, the cancer-related mortality rate is the second highest after lung cancer and liver cancer (22%). Annual report, Statistics Korea).
  • Surgical treatment is the cure-based treatment. Recently, the incidence of early GC is about 50%, and the cure rate of early GC is over 90%. However, metastatic or recurrent GC has a very poor prognosis unlike early GC. Median survival time is less than 1 year and results in less than 5% in 5 year survival rate.
  • Palliative or recurrent GC has been shown to be effective in improving the quality of life as well as prolonging survival in phase III studies compared to best supportive care. It's a standard treatment.
  • Biomarkers can be used not only for early diagnosis of cancer but also as a target in the treatment of metastatic carcinoma.
  • the use of targeted therapies is effective in CRC, lung cancer, BRC, and pancreatic cancer, and much development and research is required in GC.
  • Genomics, proteomics and molecular pathology have provided a number of biomarker candidates of clinical potential. It is thought that the treatment effect can be improved by actively using them in the stage of cancer and customized treatment for each patient. However, many studies should be applied in the future in order to apply to clinical treatment.
  • a spectrum of mass ions in blood may be extracted using a matrix-assisted laser desorption / ionization-time of flight (MALDI-TOF) mass spectrometer.
  • MALDI-TOF matrix-assisted laser desorption / ionization-time of flight
  • the mass spectrum of the extracted low mass ions can be analyzed by MarkerView TM (version version 1.2, below), one of the conventional software.
  • the present inventors have analyzed the mass spectra of low mass ions extracted from the serum of the GC patient group and the normal control (control, CONT) using MarkerView TM , which will be described in detail with reference to FIG. 5.
  • Serum collected from a set (Set E 1 ) consisting of 49 GC patient groups in Table 301 and 84 normal controls in Table 302 was sampled using a MALDI-TOF mass spectrometer. Imported into TM (C11).
  • CEA Carcinoembryonic antigen
  • the imported peak intensities were normalized (C12).
  • the normalization was performed using the "Normalization Using Total Area Sums" method. In this method, a subtotal of the intensity of each sample is obtained, and the average of the subtotals of each sample is obtained, and then each peak intensity is multiplied by a scaling factor for each sample so that the subtotal of the intensity of each sample coincides with this average. That is, after normalizing in this way, the subtotal of the intensity of each sample becomes the same.
  • normalized peak intensities were Pareto scaled (C13). That is, the peak intensities were Pareto scaled by subtracting the average value for each mass ion from each normalized peak intensity and dividing by the square root of the standard deviation.
  • PCA-DA principal component analysis-based linear discriminant analysis
  • DS discriminant score
  • the principal component analysis is performed in two steps to obtain factor loading, which is a weighting factor for each mass ion, multiply the Pareto scaled intensity by this factor loading value, and add the calculated factor to determine the discrimination score for each sample. It was. Since the maximum number of peaks was 10,000 at the import conditions of Table 303, and enough samples were imported together, 10,000 factor loading values were calculated in this calculation, and thus one discrimination score was calculated by adding 10,000 terms.
  • FIG. 6 shows the distribution of discrimination scores calculated by the method of FIG. 5 for a set of 49 clinically determined GC patient groups and 84 normal controls.
  • Table 304 summarizes the determination result according to the discrimination score shown in FIG. 6 using a confusion matrix.
  • sensitivity, specificity, positive predictive value (PPV), and negative are determined through the linear discriminant analysis method based on the principal component analysis of the prior art MarkerView TM . Very good discriminant results with all of the predictive values (NPV) of 97% or more were obtained.
  • the conventional principal component analysis-based linear discriminant analysis method described with reference to Figs. 5, 6 and Table 304 is very effective when applied individually to a set of specific samples, i.e. for discriminating individual training sets. Although good discrimination results are shown, the discriminant results in the validation set were not satisfactory (see Tables 329 and 331).
  • the reason why the discriminant is not robust despite the very good discriminant results for the training set is that a significant number of the mass ions of the 10,000 mass ions that make up the discriminant are not necessary at least for the discrimination of GC patients and normal controls.
  • the determination of the training set does not cause problems, but the determination of the test set contains mass ions that can potentially confuse the determination result. Therefore, it is necessary to find only the mass ions that are essential to obtain excellent and robust discrimination results by actively removing mass ions that are minimally unnecessary or potentially confusing. .
  • a low-mass ion mass spectrum for diagnosing cancer is confirmed through biostatistic analysis on low-mass ions extracted from a biological sample, and the low-diameter ion mass spectrum can be used to diagnose cancer. Provide the device.
  • the mass spectra and new CRC patients and non We propose a discriminant that represents 85% or more of sensitivity, specificity, positive predictive value, and negative predictive value for all mass spectra measured repeatedly for a set of patients. It provides a cancer diagnostic device.
  • the mass spectra and new BRC patients and non We propose a discriminant that represents 85% or more of sensitivity, specificity, positive predictive value, and negative predictive value for all mass spectra measured repeatedly for a set of patients. It provides a cancer diagnostic device.
  • the present invention additionally measures mass spectra and new GC patients and non-repeated mass spectra for the GC patients and non-patient sets from which the discriminant was derived.
  • a discriminant that represents sensitivity, specificity, positive predictive value, and negative predictive value of at least about 80 to 90% for all mass spectra measured repeatedly for a set of patients.
  • a cancer diagnosis apparatus capable of diagnosing.
  • Cancer diagnosis device for solving the above problems, low mass ion detection unit for detecting a mass spectrum of low-mass ions from a biological sample of a number of cancer patients and non-patient cases; A cancer diagnosis unit for comparing and analyzing mass spectral patterns of the low mass ions to determine cancer diagnosis information; And a display unit for converting and displaying the cancer diagnosis information determined by the cancer diagnosis unit into an outputable form.
  • the low mass ion detection unit The mass intensity of the low mass ions may be extracted by detecting the peak intensity of the low mass ions from the biological sample.
  • the low mass ion detection unit may include a mass spectrometer.
  • the cancer diagnosis unit First alignment means for aligning low mass ion mass spectra of the cancer patient and non-patient cases that are a training candidate set; First discriminant score calculation means for performing a biostatistic analysis on the aligned mass spectra to calculate a discriminant score; Factor loading value calculation means for calculating sensitivity and specificity according to the discrimination score, and selecting a first training set based on this and calculating factor loading for each low mass ion; Cancer diagnosis ion selecting means for selecting low mass ions for cancer diagnosis based on discrimination performance among candidate low mass ions satisfying the candidate condition; Second sorting means for aligning the low mass ion mass spectrum of the biological sample to be discriminated with the first training set; Second discrimination score calculation means for calculating a discrimination score from the peak intensity of the low mass ions to be discriminated and the factor loading value; And cancer determination means for determining the determination object as positive or negative of the cancer according to the determination score.
  • the first discrimination score calculation means A normalization module for normalizing the peak intensities of the low mass ion mass spectra of the training candidate set; A scaling module for scaling the normalized peak intensities; And a discrimination score calculation module configured to calculate the discrimination score by performing the biostatistical analysis on the scaled peak intensities.
  • the scaling module It is desirable to perform Pareto scaling.
  • the determination score calculation module may include;
  • the biostatistical analysis may be performed using principal component analysis-based linear discriminant analysis (PCA-DA).
  • PCA-DA principal component analysis-based linear discriminant analysis
  • the determination score calculation module may include; The determination score may be calculated by using the factored loading value obtained by the principal component analysis-based linear discriminant analysis together with the scaled peak intensity.
  • the printing factor calculation means A first training set for performing a biostatistic analysis on the aligned mass spectrum and selecting training cases among the cancer patients and non-patient cases as the first training set based on the biostatistic analysis result; It includes a training set selection means, it is possible to calculate the factor loading value from the first training set.
  • the first training set selection means Cancer patients and non-patient cases when the sensitivity according to the biostatistic analysis result is greater than or equal to the threshold N 1 and the specificity is greater than or equal to the threshold N 2 may be set as the first training set.
  • the threshold values N 1 and N 2 are one.
  • the second discrimination score calculation means A normalization module for normalizing the peak intensities of the low mass ion mass spectrum of the discriminating object; A scaling module for scaling the normalized peak intensities; And a discrimination score calculation module for calculating the discrimination score through the scaled peak intensity and the factor loading value.
  • the scaling module It is desirable to perform Pareto scaling.
  • the determination score calculation module may include;
  • the discrimination score may be calculated based on the scaled peak intensity and the factor loading value of the low mass ions for cancer diagnosis.
  • the cancer determination means The determination object is determined to be positive or negative of the cancer according to the determination score, and if the determination score is greater than the reference value S, the cancer information of the determination target is determined to be positive. Cancer information of the determination target can be determined. It is preferable that the reference value S is zero.
  • the cancer determining means The cancer information of the determination target may be determined by an average value of the plurality of determination scores calculated for the plurality of low-mass ion mass spectra that are repeatedly measured by detecting the biological sample of the determination target.
  • the cancer diagnostic ion selecting means Candidate ion set selecting means for selecting candidate low mass ions satisfying candidate conditions from the selected first training set as candidate ion sets; And a final ion set selecting means for selecting low mass ions for cancer diagnosis as the final ion set based on the discrimination performance of the candidate low mass ions of the selected candidate ion set individually or in combination.
  • the candidate ion set selecting means The first low mass ions whose absolute value of the product of the peak intensity of the low mass ions and the low mass ion-specific factor loading values obtained through the biostatistical analysis for each of the training cases are greater than a threshold value T 1 . It may include a first low mass ion selection module for selecting for each training case.
  • the threshold value T 1 is preferably 0.1.
  • the candidate ion set selecting means And a candidate ion preselection module for selecting second low mass ions that are commonly present in the threshold T 2 percent or more of the entire training cases among the first low mass ions as the candidate ion set.
  • the threshold value T 2 is preferably 50.
  • the candidate ion set selecting means A sensitivity and specificity calculation module configured to calculate a discrimination score indicating a positive or negative cancer for each training case by using the second low mass ions, and calculate a sensitivity and specificity according to the discrimination score; And a candidate for changing the at least one of the T 1 and the T 2 when the sensitivity is smaller than the threshold N 3 or the specificity is smaller than the threshold N 4 , and repeating the process to select the candidate ion set.
  • the method may further include an ion assembly final selection module.
  • the threshold values N 3 and N 4 are 0.9.
  • the criterion of the discrimination performance of the final ion set selecting means is; Selecting ions in which the sum of sensitivity and specificity among the candidate low mass ions is greater than a reference value, or selecting a combination among the combinations to be compared whose combination of sensitivity and specificity for each combination composed of the candidate low mass ions It may include one criterion.
  • the criterion of the discrimination performance of the final ion set selecting means is;
  • the number of candidate low mass ions among the combinations of the candidate low mass ions may further include a second criterion for selecting the least combination among the combinations to be compared.
  • the criterion of the discrimination performance of the final ion set selecting means is;
  • the difference between the minimum discrimination score of the true positive case and the maximum discrimination score of the ture negative case among the combinations of the candidate low mass ions further includes a third criterion for selecting the largest combination among the combinations to be compared.
  • the discrimination score is calculated through the scaled peak intensity and the factor loading of the candidate low mass ions, preferably indicating positive or negative for cancer.
  • the final ion set selecting means; Sensitivity of the candidate low-mass ions included in the candidate ion set includes high-sensitivity low-mass ions having the sensitivity higher than the specificity and sorting the high-sensitivity low-mass ions in descending order of the sensitivity and the specificity Set ⁇ Sns 1 , Sns 2 , Sns 3 .
  • Ion separator module separated by Spc J ⁇ ; L low-sensitivity low-mass ions of the upper L in the sensitivity set ⁇ Sns 1 , Sns 2 , Sns 3 ... Sns L ⁇ and the upper L high specificity low mass ions ⁇ Spc 1 , Spc 2 , Spc 3 ...
  • a biomarker group preliminary selection module for selecting a group The biomarker group and at least one low-mass ion of the second-order M high-sensitivity low-mass ions in the high sensitivity set and the high-order M high-order low mass ions in the high specificity set Reselection of a biomarker group, wherein the combination selected by the criterion of the discrimination performance by at least one of the first criterion, the second criterion, and the third criterion among the candidate combinations added to the group is reselected as the biomarker group. module; And a biomarker group final selection module for finally selecting the biomarker group by repeating the reselection process until there are no second-order low-mass ions in the high sensitivity set and the high specificity set
  • the final ion set selecting means In the candidate ion set, the three biomarker group selection processes are repeatedly performed on the remaining candidate ion sets except for the low mass ions of the combination selected as the biomarker group obtained in the biomarker group final selection module.
  • a biomarker group additional selection module for further selecting the additional biomarker group until less than L mass ions remain in the high sensitivity set or the high sensitivity set; And selecting low mass ions of the combination of the top K biomarker groups as the low mass ions for cancer diagnosis based on the accuracy of true positive and true negative judgment among the biomarker group and the additional biomarker groups.
  • the diagnostic low mass ion final selection module may be further included. It is preferable that the said L value is 2, the said M value is 1, and the said K value is a natural number in any one of 1-3.
  • the final ion set selecting means performs a low mass ion selection process on a training set in which a second training set independent of the first training set is added to the first training set.
  • the plurality of cancer patient cases Cancer patient cases of any one of colorectal cancer patient cases, breast cancer patient cases and gastric cancer patient cases.
  • the low mass ion detection unit Extracting a mass spectrum of the low mass ions by detecting a peak intensity of the low mass ions using a mass spectrometer from a biological sample of a plurality of colorectal cancer patients and non-patient cases, and the cancer diagnosis unit; First alignment means for aligning low mass ion mass spectra of the colorectal cancer patient and non-patient cases that are a training candidate set; First discriminant score calculation means for performing a biostatistic analysis on the aligned mass spectra to calculate a discriminant score; Factor loading value calculation means for calculating sensitivity and specificity according to the discrimination score, and selecting a first training set based on the score to calculate factor loading value for each low-mass ion; Colon cancer diagnosis ion selecting means for selecting low mass ions for colorectal cancer diagnosis based on discrimination performance among candidate low mass ions satisfying the candidate condition; Second sorting means for aligning the low mass ion mass spectrum of the biological sample to be discriminated with the first training set; Second
  • the mass values of the low mass ions for diagnosing type 1 colorectal cancer are 18.0260, 22.9797, 74.0948, 76.0763, 102.0916, 105.1078, 106.0899, 107.0477, 118.0822, 123.0395, 137.0423, 137.0729, 147.0573, 147.1058, 169.0653, 181.0656, 190848.19049.
  • At least one mass value selected from the group consisting of .6209, 1016.6113, 1020.4817, 1206.5305, 1207.5571, 1465.6184, 1466.6096, 1467.5969, 2450.9701, 2451.9662 and 2452.9546 m / z (with an error range of ⁇ 0.1 m / z). .
  • the plurality of cancer patient cases other than colorectal cancer among the second type discrimination cases include at least one cancer patient case among breast cancer patient cases, non-Hodgkin lymphoma (NHL) patient cases, and gastric cancer patient cases.
  • the mass value of the low mass ions for diagnosing colorectal cancer of the second type is 60.0476, 138.0540, 172.6653, 173.1158, 179.1451, 191.1277, 279.0855, 280.0895, 280.2642, 281.1440, 296.2574, 312.3248, 332.3224, 333.3324, 369.3406, 465.3161,
  • it is at least one mass value selected from the group consisting of 486.6356, 488.6882, 544.8908, 551.3287, 566.8737, 707.3475 and 733.3569 m / z, with an error range of ⁇ 0.1 m / z.
  • the discrimination score includes a first kind discrimination score by the first kind of low mass ions and a second kind discrimination score by the second kind of low mass ions, wherein the first kind discrimination score is greater than CS 11.
  • the discriminating target is determined as positive for colon cancer
  • the type 1 discrimination score is less than CS 12 or when the type 2 discrimination score is less than CS 22
  • the determination object may be determined as colorectal cancer voice.
  • CS 11 , CS 12 , CS 21, and CS 22 may be 0.
  • Fibrinogen or fibrinogen alpha chains may be included in the low-mass ion group that distinguishes colon cancer patients from normal people obtained using the colorectal cancer diagnosis ion selection means.
  • the low mass ion group that distinguishes the colorectal cancer patient from a normal person may include transthyretin.
  • the low mass ion detection unit Extracting the mass spectrum of the low mass ions by detecting a peak intensity of the low mass ions using a mass spectrometer from a biological sample of a plurality of breast cancer patients and non-patient cases, and the cancer diagnosis unit; First alignment means for aligning low mass ion mass spectra of the breast cancer patient and non-patient cases that are a training candidate set; First discriminant score calculation means for performing a biostatistic analysis on the aligned mass spectra to calculate a discriminant score; Factor loading value calculation means for calculating sensitivity and specificity according to the discrimination score, and selecting a first training set based on the score to calculate factor loading value for each low-mass ion; Breast cancer diagnosis ion selection means for selecting low mass ions for diagnosing breast cancer based on discrimination performance among candidate low mass ions satisfying the candidate condition; Second sorting means for aligning the low mass ion mass spectrum of the biological sample to be discriminated with the first training set; Second discrimination score calculation means for calculating a
  • low mass ions for diagnosing breast cancer the low mass ions for diagnosing breast cancer, the low mass ions for diagnosing first kind of breast cancer, and the second
  • the low-mass ions for diagnosing two types of breast cancer and the low-mass ions for diagnosing the third type of breast cancer for the third type discrimination case may be distinguished.
  • the breast cancer non-patient cases of the first type discrimination cases include at least one of normal cases, colorectal cancer cases, non-Hodgkin lymphoma (NHL) patient cases, and gastric cancer patient cases.
  • the mass values of the low-mass ions for diagnosing Type 1 breast cancer are 74.0937, 74.1155, 76.0728, 136.1067, 173.4872, 193.0665, 208.0565, 212.0949, 231.0726, 258.1364, 279.0841, 280.0847, 282.2777, 313.2638, 331.2024, 332.3181, 401.0588.
  • error range is preferably at least one mass value selected from the group consisting of ⁇ 0.1 m / z. .
  • the mass value of the low-mass ions for diagnosing breast cancer of the second type is 38.9779, 46.0647, 74.1164, 76.0733, 97.0686, 122.0777, 123.0821, 130.1539, 185.7723, 191.1175, 208.0530, 212.0960, 225.1870, 229.0005, 231.0675, 244.0962, 281.0913, 284.3205, 3132618 , 332.3150, 342.2482, 368.2624, 398.3034, 416.0901, 424.3216, 426.3389, 428.1885, 497.3194, 513.3193, 532.6918, 538.3428, 540.3250, 570.3234, 580.3281, 581.2310, 581.3377, 610.3273, 959. 7286, 618.
  • the error range is preferably at least one mass value selected from the group consisting of ⁇ 0.1 m / z).
  • the plurality of cancer patient cases other than the breast cancer of the third type discrimination cases include at least one or more cancer patient cases of colorectal cancer patient cases, non-Hodgkin lymphoma patient cases, and gastric cancer patient cases, Mass values of low mass ions for diagnosing breast cancer are 38.9736, 38.9892, 44.0491, 44.0656, 74.0938, 87.0991, 104.1316, 104.3161, 105.1091, 136.1021, 155.1798, 156.0412, 172.3072, 178.1330, 182.0738, 189.9525, 192.1294, 193.0660, 196.0871, 212.323 , 222.0231, 228.0348, 231.0726, 234.0422, 260.1013, 279.0843, 280.0849, 282.2791, 289.2960, 298.3425, 313.2630, 316.3269, 331.2036, 332.3169, 333.3233, 337.1047, 424.3272, 426.340
  • the discrimination score is a first kind discrimination score by the first type low mass ions, and when the discrimination score is greater than BS 11 , the discrimination target is determined as positive for breast cancer, and the discrimination score is less than BS 12 .
  • the determination target can be determined as breast cancer negative.
  • BS 11 and BS 12 are preferably 0.
  • the discrimination score includes a discrimination score of the second kind by the low mass ions of the second kind and a discrimination score of the third kind by the low mass ions of the third kind, wherein the discrimination score of the second kind is greater than BS 21. If the type 3 discrimination score is greater than BS 31 , the discrimination target is determined as positive for breast cancer, and if the type 2 discrimination score is less than BS 22 or the type 3 discrimination score is less than BS 32 , the discrimination is determined. The subject may be judged to be breast cancer negative.
  • the BS 21 , BS 22 , BS 31 and BS 32 are preferably 0.
  • the low mass ion detection unit Extracting a mass spectrum of the low mass ions by detecting a peak intensity of the low mass ions using a mass spectrometer from a biological sample of a plurality of gastric cancer patients and non-patient cases, and the cancer diagnosis unit; First alignment means for aligning low mass ion mass spectra of the gastric cancer patient and non-patient cases that are a training candidate set; First discriminant score calculation means for performing a biostatistic analysis on the aligned mass spectra to calculate a discriminant score; Factor loading value calculation means for calculating sensitivity and specificity according to the discrimination score, and selecting a first training set based on the score to calculate factor loading value for each low-mass ion; Gastric cancer diagnostic ion selecting means for selecting low mass ions for diagnosing gastric cancer based on discrimination performance among candidate low mass ions satisfying the candidate condition; Second sorting means for aligning the low mass ion mass spectrum of the biological sample to be discriminated with the first training set; Second discrimination score calculation means
  • the type 3 discrimination cases, the type 4 discrimination cases and the type 5 discrimination cases are respectively executed, so that the low-mass ions for diagnosing gastric cancer are the first type of the first type discrimination case.
  • Low mass ions for longitudinal gastric cancer diagnosis, low mass ions for diagnosing type 2 gastric cancer for the second type discrimination case, low mass ions for diagnosing type 3 gastric cancer for the third type discrimination case, the fourth type discrimination case The low-mass ions for diagnosing gastric cancer of the fourth type and the low-mass ions for diagnosing gastric cancer of the fifth type for the fifth discrimination case.
  • the mass values of the low mass ions for diagnosing gastric cancer of the first type are 22.9851, 87.0959, 123.0842, 314.2151, 324.1365, 366.2424, 488.6538, 490.3374, 526.3426, 532.3719, 576.2893, 606.2658, 616.1397, and 1466.5612 m / z.
  • the mass values of the low-mass ions for diagnosing gastric cancer of the second type are 18.0260, 22.9830, 38.9752, 72.0788, 86.1216, 122.0584, 137.0721, 144.1092, 156.0171, 172.3740, 172.6583, 207.0729, 265.2034, 356.1278, 380.1643, 381.0949, 401.0680, 442.431.
  • the mass value of the low-mass ions for the diagnosis of the third type gastric cancer is 22.9852, 74.0764, 104.1387, 105.1157, 106.0555, 148.0788, 173.4924, 176.1198, 184.1123, 212.1032, 217.9461, 226.0798, 228.0046, 284.3291, 299.1308, 299.3423, 314.2316, 338.1143, , 387.9830, 426.3417, 427.3321, 430.3313, 432.9929, 456.2963, 459.2425, 480.3312, 481.3399, 482.3368, 487.3295, 488.3316, 490.3400, 496.8846, 506.9148, 509.3577, 532.3532, 534.2973, 535.3013, 537.3199, 550.330, 550.330 , 583.2274, 584.2345, 584.3355, 585.2423, 600.3366, 616.1446 m /
  • the mass value of the low-mass ions for diagnosing gastric cancer of the fourth type is 18.0264, 22.9798, 23.0539, 38.9638, 38.9937, 46.0666, 86.1328, 112.0850, 123.0738, 129.0710, 155.1762, 164.0701, 165.0955, 175.1219, 176.1298, 178.1388, 179.1466, 192.1245, 201.2036 , 204.1077, 212.3577, 213.0575, 229.0033, 232.0822, 234.0749, 235.0331, 240.0907, 251.9799, 274.0827, 284.3265, 314.2277, 326.3916, 383.0532, 417.0381, 429.3172, 430.3169, 434.2556, 456.3015, 459913 229.3314. , 534.2841, 569.3303 m / z, provided that the error range is at least one mass value selected from the
  • the mass value of the low-mass ions for the diagnosis of the fifth type gastric cancer is 38.9674, 76.0758, 123.0414, 156.0432, 163.1135, 164.0712, 184.1062, 184.1375, 190.1141, 193.0672, 215.0444, 228.0389, 230.0004, 256.3291, 257.2950, 265.9579, 267.9562, 289666.
  • the discrimination score is a first kind discrimination score by the first kind of low mass ions, a second kind discrimination score by the second kind of low mass ions, and a third kind discrimination by the third kind of low mass ions Scores and a fourth type discrimination score by the fourth type of low mass ions, wherein the first type discrimination score is greater than GS 11 , the second type discrimination score is greater than GS 21 , and the third type discrimination score If the score is greater than GS 31 and the fourth type discrimination score is greater than GS 41 , the determination object is determined to be positive for gastric cancer, and the first type discrimination score is less than GS 12 , or the second type discrimination score is If less than GS 22 , or the third type discrimination score is less than GS 32 , or the fourth type discrimination score is less than GS 42 , the determination object may be determined as a gastric cancer voice.
  • the discrimination score includes the first kind discrimination score by the first kind of low mass ions and the fifth kind discrimination score by the fifth kind of low mass ions, wherein the first kind discrimination score is greater than GS 11 If the type 5 discrimination score is greater than GS 51 , the discrimination target is determined to be positive for gastric cancer, and if the type 1 discrimination score is less than GS 12 or the type 5 discrimination score is less than GS 52 , the discrimination is determined. The subject can be judged as a gastric cancer voice.
  • GS 11 , GS 12 , GS 51 and GS 52 are each preferably 0.
  • the cancer diagnostic apparatus has an advantage in that CRC diagnosis has a very low analysis cost, a short analysis time, and large scale analysis. Briefly describing the process, the mass spectrum of low mass ions in the blood is measured, and peak intensities corresponding to the mass values of CRC diagnostic low mass ions are extracted, and simple calculations provide positive / negative information on the CRC. can do.
  • the discrimination performance is excellent and robust, the sensitivity, specificity, positive predictive value, and negative predictive value were all 85% or higher in the CRC.
  • it can be usefully applied to various diseases by changing the CRC patient and non-patient set to a patient and non-patient set of other diseases.
  • the blood in the case of CRC, can be used as an analytical sample when compared to FOBT, which has feces as an analytical sample, so that it can be analyzed together with other tests, thereby providing CRC information more conveniently and quickly than conventional technologies.
  • FOBT which has feces as an analytical sample
  • the cancer diagnosis apparatus has an advantage that the analysis cost is very low even in the case of BRC diagnosis, the analysis time is short, and large scale analysis is possible. Briefly describing the process, the mass spectrum of the low mass ions in the blood is measured, and peak intensities corresponding to the mass values of the low mass ions for BRC diagnosis are extracted, and simple calculations are performed to provide positive / negative information on the BRC. can do.
  • the discrimination performance was excellent and robust, and the sensitivity, specificity, positive predictive value, and negative predictive value were all 85% or higher not only in the training set but also in the test set.
  • it can be usefully applied to various diseases by changing the BRC patient and non-patient set to the patient and non-patient set of other diseases.
  • the cancer diagnosis apparatus has the advantage that the analysis cost is very low, the analysis time is short, and large scale analysis is possible even in the case of GC diagnosis. Briefly, the mass spectrum of low mass ions in blood is measured, and peak intensities corresponding to the mass values of GC diagnostic low mass ions are extracted and simple calculations are performed to provide positive / negative information on GC. can do.
  • the discrimination performance was excellent and robust, and the sensitivity, specificity, positive predictive value, and negative predictive value were all about 80-90% or higher in the determination of the test set as well as the training set.
  • it can be usefully applied to various diseases by changing the GC patient and non-patient set to a patient and non-patient set of other diseases.
  • FIG. 1 is a flowchart illustrating a process of determining a CRC using a low mass ion mass spectrum according to the prior art
  • Figure 2 is a graph showing the result of determining the set consisting of 133 CRC patient group and 153 normal control group according to the prior art
  • FIG. 3 is a flowchart illustrating a process of determining BRC using a low mass ion mass spectrum according to the prior art
  • Figure 4 is a graph showing the results of determining the set consisting of 54 BRC patient group and 49 normal control group according to the prior art
  • FIG. 5 is a flowchart illustrating a process of determining GC using a low mass ion mass spectrum according to the prior art
  • Figure 6 is a graph showing the results of determining the set consisting of 49 GC patient group and 84 normal control group according to the prior art.
  • FIG. 7 to 13 are views for explaining a cancer diagnostic apparatus according to an embodiment of the present invention.
  • Figure 7 is a block diagram showing a cancer diagnostic apparatus according to an embodiment of the present invention.
  • FIG. 8 is a block diagram illustrating the cancer diagnosis unit of FIG. 7 in more detail
  • FIG. 9 is a block diagram showing in more detail the first discrimination score calculating means of FIG. 8;
  • FIG. 10 is a block diagram showing in more detail the second discrimination score calculating means of FIG. 8;
  • FIG. 11 is a block diagram showing in more detail the cancer diagnostic ion selection means of FIG.
  • FIG. 12 is a block diagram showing in more detail the candidate ion set selecting means of FIG. 11;
  • FIG. 13 is a block diagram illustrating the final ion set selecting unit of FIG. 11 in more detail.
  • FIGS. 14 to 25 are diagrams for explaining a cancer diagnosis apparatus for diagnosing CRC according to an embodiment of the present invention.
  • FIG. 14 is a block diagram showing in more detail the cancer diagnosis unit of FIG. 7 for diagnosing CRC of the present invention.
  • 15 is a flowchart illustrating a process of selecting a first training set A 0 having a predetermined value of sensitivity and specificity according to the present invention and calculating weights for each mass ion;
  • 16 is a flowchart illustrating a process of applying a discrimination equation to a sample to be discriminated
  • 17 is a graph showing the result of determining the set A 1 by the weight for each mass ion calculated in the first training set A 01 ,
  • FIG. 19 is a flowchart illustrating a process of constructing a preliminary discriminant according to the present invention.
  • 22 is a flowchart illustrating a process of forming a final discriminant according to the present invention.
  • FIG. 23 is a graph showing a result of determining a mean DS by calculating a discriminant score according to the final discriminant of the present invention with respect to mass spectra of five times repeated measurements of set A;
  • FIG. 24 is a graph showing a result of determining Set B measured five times by calculating an average discrimination score according to the final discriminant of the present invention.
  • 25A is a graph showing the result of identifying 1465.6184 m / z of the mass values of the first type CRC diagnostic low mass ions confirmed by the method according to the present invention
  • FIG. 25B is a graph showing the results of identifying 2450.9701 m / z of the mass values of the first type CRC diagnostic low mass ions confirmed by the method according to the present invention.
  • FIG. 25B is a graph showing the results of identifying 2450.9701 m / z of the mass values of the first type CRC diagnostic low mass ions confirmed by the method according to the present invention.
  • 26 to 37 are diagrams for explaining a cancer diagnosis apparatus for diagnosing BRC according to an embodiment of the present invention.
  • 26 is a block diagram illustrating in more detail the cancer diagnosis unit of FIG. 7 for diagnosing BRC of the present invention
  • FIG. 27 is a flowchart illustrating a process of selecting a first training set C 0 having a predetermined value of sensitivity and specificity according to the present invention and calculating weights for each mass ion;
  • 29 is a graph showing the result of determining the set C 1 by the weight for each mass ion calculated in the first training set C 01 ,
  • Training set C 03 The set weight by mass ion calculated by One A graph showing the result of determining
  • FIG. 31 is a flowchart illustrating a process of constructing a preliminary discriminant according to the present invention.
  • 35 is a flowchart illustrating a process of constructing a final discriminant according to the present invention.
  • FIG. 37 is a graph showing a result of judging set D of five average measurements according to the final discrimination equation of the first type and the final discrimination equation of the second and third types, and calculating the average discrimination score. to be.
  • 38 to 54 are views for explaining a cancer diagnosis device for diagnosing GC according to an embodiment of the present invention.
  • FIG. 38 is a block diagram showing in more detail the cancer diagnosis unit of FIG. 7 for diagnosing GC of the present invention.
  • 39 is a flowchart illustrating a process of selecting a first training set E 0 having a predetermined sensitivity and specificity according to the present invention and calculating weights for each mass ion;
  • 40 is a flowchart illustrating a process of applying a discrimination equation to a sample to be discriminated
  • 41 is a graph showing the result of determining the set E 1 using the weights for each mass ion calculated in the first training set E 01 ,
  • 46 is a flowchart illustrating a process of constructing a preliminary discriminant according to the present invention.
  • 49 is a graph showing the result of determining the set E 1 by the third type preliminary discriminant equation
  • 51 is a graph showing the result of determining the set E 1 by the fifth type preliminary discriminant equation
  • FIG. 53 shows the result of determining the mean DS by calculating a mean score on the mass spectra of five times repeated measurements of the set E according to the first and fifth final discriminant of the present invention.
  • FIG. 54 is a graph showing a result of determining a set F of five repeated measurements by calculating an average discrimination score according to the final discrimination equations of the first and fifth species of the present invention.
  • biological sample includes samples such as whole blood, serum, plasma, urine, feces, sputum, saliva, tissue, cells, cell extracts, extracellular cell culture, etc. This is not restrictive. In the examples described below, serum from patients or non-patients was used as biological samples.
  • peak intensity refers to a value obtained from a MALDI-TOF mass spectrometer and has a correlation with the amount of mass ions corresponding to a peak.
  • normalization refers to matching the range of data or making the distribution similar, and may be normalized using a mean value, a median, and the like, but is not limited thereto. In some cases, various known methods may be applied.
  • subtotals of peak intensities of each sample are obtained, the subtotals of samples are averaged, and normalized by multiplying each peak intensity by a sample magnification factor such that the subtotals of the peak intensities of each sample coincide with this average. . That is, after normalizing in this way, the subtotal of the peak intensities for each sample becomes the same.
  • pareto scaling means subtracting the average value for each mass ion from each normalized peak intensity and dividing by the square root of the standard deviation.
  • Autoscaling a more common scaling method, completely cancels the size information of the data by dividing it by standard deviation, whereas in Pareto scaling, the amplification of the noise is avoided by partially maintaining the data size information. There is an advantage that it can.
  • weighting refers to a factor that adjusts the numerical size of the data after multiplying the weight to be proportional to the importance in the statistical viewpoint, which is obtained as a result of the principal component analysis-based linear discriminant analysis in the embodiments described below.
  • the factor loading value for each mass ion may be an example of weight.
  • low mass ion means an ion having a mass value of less than 1500 m / z obtained using a MALDI-TOF mass spectrometer or the like. Some of the low mass ions for CRC diagnostics have higher mass values than this range, but most of them fall within this range. In other words, the limit of 1500 m / z is used in the sense of approximate value, not definite value.
  • the mass value measured by the MALDI-TOF mass spectrometer includes an error range of " ⁇ 0.05 m / z". This is because some errors may occur in the mass measurement value depending on the experimental environment. For example, it is to be understood that the mass value of 1467.5969 m / z described in the claims actually ranges from 1467.5469 m / z to 1467.6469 m / z. Depending on the experimental environment, the margin of error may be " ⁇ 0.1 m / z".
  • the mass value measured by the MALDI-TOF mass spectrometer is a mass value obtained in the positive mode of the MALDI-TOF mass spectrometer.
  • the sign of the weight vector is adjusted so as to be determined as positive when the discrimination score is positive and as negative when it is negative.
  • the factor loading vector in the principal component analysis mathematically corresponds to an eigenvector, and the sign of the vector can be arbitrarily determined. In other words, even though the sign is changed by multiplying the calculated factor by mass ion by -1 as a whole, it is mathematically equivalent to the same eigenvalue problem, but it is positive if the discrimination score is negative. A positive case is determined as negative.
  • the sign of the eigenvector is adjusted so that the discrimination score is positive when it is positive and negative when it is negative, but the scope of the present invention is not limited thereto.
  • discrimination score is a value calculated through biostatistic analysis on a mass spectrum extracted from a biological sample, and based on this, it may determine the positive or negative of a specific cancer.
  • determination method a simple method of determining whether the calculated determination score is larger than a specific reference value may be used, or a function of outputting the determination result by using the calculated determination score as an input may be used.
  • the term "determined score” is specifically used, but the "determined score” defined in the present invention may be described in various forms of terms, such as a discrimination level and a discrimination value. Accordingly, the term “determined score” defined in the present invention is not limited to the term “determined score” in a dictionary meaning, and according to the definition of the present invention, all of the above-described level of discrimination, a discriminated value, or various similar terms mean It should be construed as including.
  • discrimination performance basically means indicating numerical values such as sensitivity, specificity, positive predictive value, negative predictive value, and accuracy. It also means the value calculated as a function of these indicators. For example, each value of sensitivity, specificity, positive predictive value, negative predictive value, and accuracy may be used as discrimination performance, or the sum of sensitivity and specificity, the sum of sensitivity and positive predictive value, negative predictive value, and the like. Two or more sums such as the sum of accuracy may be used as the discrimination performance.
  • FIG. 7 to 13 are views for explaining a cancer diagnostic apparatus according to an embodiment of the present invention.
  • Figure 7 is a block diagram showing a cancer diagnostic apparatus according to an embodiment of the present invention, as shown in the cancer diagnostic apparatus according to the present invention, a low mass from a biological sample of a plurality of cancer patients and non-patient cases
  • a low mass ion detection unit 1000 for detecting a mass spectrum of ions
  • a cancer diagnosis unit 2000 for comparing and analyzing mass spectral patterns of the low mass ions to determine cancer diagnosis information
  • a display unit 3000 for converting and displaying the cancer diagnosis information determined by the cancer diagnosis unit 2000 into an outputable form.
  • the low mass ion detection unit 1000 The peak intensity of the low mass ions can be detected from the biological sample to extract the mass spectrum of the low mass ions.
  • the low mass ion detection unit 1000 It may include a mass spectrometer.
  • the determined cancer diagnosis information can be converted into various forms such as letters, numbers, figures, and the like on a device such as a monitor screen or a liquid crystal screen of a portable terminal.
  • FIG. 8 is a block diagram illustrating the cancer diagnosis unit of FIG. 7 in more detail.
  • First alignment means (2100) for aligning low mass ion mass spectra of the cancer patient and non-patient cases that are a training candidate set;
  • First discrimination score calculation means (2200) for performing a biostatistic analysis on the aligned mass spectra to calculate a discrimination score;
  • Factor loading value calculating means (2300) for calculating sensitivity and specificity according to the discrimination score, and calculating a factor loading value for each low-mass ion by selecting a first training set based on the determination score;
  • Cancer diagnosis ion selecting means 2400 for selecting low mass ions for cancer diagnosis based on discrimination performance among candidate low mass ions satisfying the candidate condition;
  • Second alignment means (2500) for aligning the low mass ion mass spectrum of the biological sample to be discriminated with the first training set;
  • Second discrimination score calculation means (2600) for calculating a discrimination score from the peak intensity of the low mass ions to be
  • the factor loading value calculating means 2300 A first training set for performing a biostatistic analysis on the aligned mass spectrum and selecting training cases among the cancer patients and non-patient cases as the first training set based on the biostatistic analysis result; Training set selection means 2310 may be included, and the factor loading value may be calculated from the first training set.
  • the first training set selection means 2310 The first training set may be set for cancer patients and non-patient cases when the sensitivity according to the biostatistic analysis result is greater than or equal to the threshold N 1 and the specificity is greater than or equal to the threshold N 2 .
  • the thresholds N 1 and N 2 are preferably 1.
  • the cancer determining means (2700);
  • the determination object is determined to be positive or negative of the cancer according to the determination score, and if the determination score is greater than the reference value S, the cancer information of the determination target is determined to be positive. Cancer information of the determination target can be determined.
  • the reference value S is zero.
  • the cancer information of the determination target may be determined by an average value of the plurality of determination scores calculated for the plurality of low-mass ion mass spectra that are repeatedly measured by detecting the biological sample of the determination target.
  • FIG. 9 is a block diagram illustrating the first discrimination score calculating means of FIG. 8 in more detail, and as shown, the first discrimination score calculating means 2200; A normalization module (2210) for normalizing the peak intensities of the low mass ion mass spectra of the training candidate set; A scaling module 2220 for scaling the normalized peak intensities; And a discrimination score calculation module 2230 that calculates the discrimination score by performing the biostatistical analysis on the scaled peak intensities.
  • the scaling module 2220; Pareto scaling can be performed.
  • the determination score calculation module 2230; Principal component analysis based linear discriminant analysis can be used to perform the biostatistical analysis.
  • the determination score calculation module 2230; The determination score may be calculated by using the factored loading value obtained by the principal component analysis-based linear discriminant analysis together with the scaled peak intensity.
  • FIG. 10 is a block diagram illustrating the second discrimination score calculating means of FIG. 8 in more detail. As shown, the second discrimination score calculating means 2600 is shown; A normalization module (2610) for normalizing the peak intensities of the low mass ion mass spectrum of the object of determination; A scaling module (2620) for scaling the normalized peak intensities; And a determination score calculation module 2630 for calculating the determination score through the scaled peak intensity and the factor loading value.
  • a normalization module (2610) for normalizing the peak intensities of the low mass ion mass spectrum of the object of determination
  • a scaling module (2620) for scaling the normalized peak intensities
  • a determination score calculation module 2630 for calculating the determination score through the scaled peak intensity and the factor loading value.
  • the discrimination score may be calculated based on the scaled peak intensity and the factor loading value of the low mass ions for cancer diagnosis.
  • FIG. 11 is a block diagram showing the cancer diagnosis ion selecting means of FIG. 8 in more detail.
  • the cancer diagnosis ion selecting means 2400 includes; Candidate ion set selecting means (2410) for selecting candidate low mass ions satisfying candidate conditions from the selected first training set as candidate ion sets; And a final ion set selecting means 2420 for selecting cancer mass low ions as the final ion set based on the discrimination performance of the candidate low mass ions of the selected candidate ion set individually or in combination.
  • the criterion of the discrimination performance of the final ion set selecting means (2420) is; Selecting ions in which the sum of sensitivity and specificity among the candidate low mass ions is greater than a reference value, or selecting a combination among the combinations to be compared whose combination of sensitivity and specificity for each combination composed of the candidate low mass ions It may include one criterion.
  • the criterion of the discrimination performance of the final ion set selecting means (2420) is;
  • the number of candidate low mass ions among the combinations of the candidate low mass ions may further include a second criterion for selecting the least combination among the combinations to be compared.
  • the criterion of the discrimination performance of the final ion set selecting means (2420) is; Among the candidate low mass ions, the difference between the minimum discrimination score of the true positive case and the maximum discrimination score of the true negative case is further selected by a third criterion for selecting the largest combination among the combinations to be compared.
  • the discrimination score is calculated through the scaled peak intensity and the factor loading of the candidate low mass ions, and may indicate positive or negative for cancer.
  • the final ion set selecting unit 2420 may perform a low mass ion selection process for a training set in which a second training set independent of the first training set is added to the first training set.
  • FIG. 12 is a block diagram showing in detail the candidate ion set selecting means of FIG. 11, wherein the candidate ion set selecting means 2410 is shown;
  • the first low mass ions whose absolute value of the product of the peak intensity of the low mass ions and the low mass ion-specific factor loading values obtained through the biostatistical analysis for each of the training cases are greater than a threshold value T 1 .
  • the first low mass ion selection module 2411 may be selected for each training case.
  • the threshold value T 1 is preferably 0.1.
  • the candidate ion set selecting means 2410 The first bottom comprises a mass ion of the second low-candidate ion set is selected as the candidate ion aggregate mass ion pre-selection module 2412 that appears in common in the training case the threshold value of the entire or more T 2 peosenteu case of can do.
  • the threshold value T 2 is preferably 50.
  • the candidate ion set selecting means 2410 A sensitivity and specificity calculation module 2413 that calculates a discrimination score indicating a positive or negative for the cancer for each training case by using the second low mass ions, and calculates a sensitivity and specificity according to the discrimination score; And a candidate for changing the at least one of the T 1 and the T 2 when the sensitivity is smaller than the threshold N 3 or the specificity is smaller than the threshold N 4 , and repeating the process to select the candidate ion set.
  • the ion set final selection module 2414 may further include.
  • the thresholds N 3 and N 4 are preferably 0.9.
  • FIG. 13 is a block diagram showing the final ion set selecting means of FIG. 11 in more detail, wherein the final ion set selecting means 2420 is shown;
  • Sensitivity of the candidate low-mass ions included in the candidate ion set includes high-sensitivity low-mass ions having the sensitivity higher than the specificity and sorting the high-sensitivity low-mass ions in descending order of the sensitivity and the specificity Set ⁇ Sns 1 , Sns 2 , Sns 3 .
  • Sns I ⁇ and a high specificity set ⁇ Spc 1 comprising high specificity low mass ions having the specificity higher than the sensitivity and sorting the high specificity low mass ions in the descending order of the sensitivity and the specificity.
  • the final ion set selecting means (2420) is; In the candidate ion set, the three biomarker group selection processes are added to the remaining candidate ion sets except for the low mass ions of the combination selected as the biomarker group obtained in the biomarker group final selection module 2424.
  • the diagnostic low mass ion final selection module 2426 may be further included.
  • the L value is 2
  • the M value is 1
  • the K value is preferably any one of 1-3.
  • the plurality of cancer patient cases Cancer patient cases of any one of colorectal cancer patient cases, breast cancer patient cases and gastric cancer patient cases.
  • FIG. 14 is a block diagram illustrating in more detail the cancer diagnosis unit of FIG. 7 for diagnosing the CRC of the present invention.
  • the cancer diagnosis unit includes: first alignment means 4100 for aligning low mass ion mass spectra of the colorectal cancer patient and non-patient cases that are a training candidate set; First discrimination score calculation means 4200 for performing a biostatistic analysis on the aligned mass spectra to calculate a discrimination score; Factor loading value calculating means (4300) for calculating sensitivity and specificity according to the discrimination score, and calculating a factor loading value for each low-mass ion by selecting a first training set based on the determination score; Colon cancer diagnosis ion selecting means (4400) for selecting low mass ions for colorectal cancer diagnosis based on discrimination performance among candidate low mass ions satisfying the candidate condition; Second alignment means (4500) for aligning the low mass ion mass spectrum of the biological sample to be discriminated with the first training set; Second discrimination score calculating means (4600) for calculating a discrimination score from the peak intensity of the low mass ions to be discriminated and the factor loading value; And colore
  • the low mass ion detection unit 1000 Mass spectrometers of the low mass ions are extracted from a biological sample of a number of colorectal cancer patients and non-patient cases using a mass spectrometer to detect the peak intensity of the low mass ions.
  • cancer diagnosis unit for diagnosing the CRC are similar to those described with reference to FIGS. 9 to 13 in the above-described cancer diagnosis apparatus. Will be omitted, and one embodiment of the present invention will be described in detail below.
  • the apparatus for diagnosing cancer of the present invention may be composed of hardware or software by a program structure as shown in FIG. 14.
  • diagnosing a CRC composed of software may be performed. It will be described in detail for the cancer diagnostic device for.
  • the first training set was constructed by using the subset A 0 as described below with 462 as the set A 1 , and the weight of each mass ion (factor loading value) was determined through biostatistic analysis on the first training set. ) And a preliminary discriminant was obtained. Further, the set A 1 in addition to the table 108 144 CRC patients, table 109 set the 50 normal controls, 25 BRC patients, 15 NHL patients and 57 GC group of table 112 of the table 111 in the table 110 of the A 2 The training set was extended with (Training Set 2).
  • ASC Adenosquamous carcinoma
  • test set was composed of ovarian cancer (OVC) patient group and 19 Tis or Advanced Adenoma (TA) patient groups in Table 119 as set B.
  • OVC ovarian cancer
  • TA Advanced Adenoma
  • BRC-B1 F 45 ypN0 0 0% 0 0% 0 0.9 BRC-B2 F 59 pN0 0 0% 0 0% 3 1.1 BRC-B3 F 43 pN1 0 0% 0 0% 0 1.5 BRC-B4 F 46 pN1 8 100% 8 100% 0 1.3 BRC-B5 F 48 pN0 6 50-60% 5 10-20% 3 1.3 BRC-B6 F 39 pN0 0 0% 0 0% 0 0 2.2 BRC-B7 F 66 pN0 8 95% 8 95% 0 1.7 BRC-B8 F 39 ypN0 0 0% 0 0% 0 DCIS BRC-B9 F 37 pN0 7 70-80% 8 80% 3 1.5 BRC-B10 F 64 pN0 8 95% 8 95% 0 0.5 BRC-B11 F 44
  • Methanol / chloroform extract was mixed with a solution of alpha-cyano-4-hydroxycinnamic acid in 50% acetonitrile / 0.1% TFA (1:12, v / v), 1 ⁇ l of the mixture was placed on a MALDI-target plate.
  • Mass spectra of CRC patient and non-patient serum extracts were measured using the Proteomics Analyzer (Applied Biosystems, Foster City, CA, USA).
  • the mass spectral data is extracted as the average of the spectra measured 20 times.
  • the mass value intervals of all individual samples were adjusted so that the maximum mass value was about 2500 m / z.
  • various factors including the focus mass, laser intensity, target plate, and data acquisition time were checked.
  • the low mass ion detection means 4000 can extract the low mass ion mass spectrum from the serum sample through the same process using the MALDI-TOF mass spectrometer.
  • the CRC patient group should be distinguished from other cancer patients as well as the normal control group by the discriminant.
  • another cancer patient group is intended to use a BRC patient group, an NHL patient group, and a GC patient group.
  • Table 120 shows the results of applying the conventional principal component analysis-based linear discriminant analysis to distinguish between the CRC patient group and the non-patient group (normal control group, BRC patient group, NHL patient group and GC patient group) as one discriminant.
  • the specificity of the normal control group is low as 69.28%. From this, it can be seen that one discriminant cannot distinguish between the CRC patient group and the non-patient group.
  • the CRC patient group and the non-patient group are distinguished by CRC by using the type 1 discrimination formula for distinguishing the CRC patient group from the normal control group and the type 2 discrimination formula for distinguishing the CRC patient group from other cancer patient groups. If it is determined that the CRC patient, and if it is determined that the CRC non-patient in either one of the two discrimination equation can be performed through the method of determining the CRC non-patient.
  • the discrimination results shown in Table 104 and Table 121 are very good, neither sensitivity nor specificity is 100%.
  • the first training set A 0 having a predetermined value of sensitivity and specificity is selected, and the weight for each mass ion is calculated for the first training set A 0 . Both sensitivity and specificity are 100%.
  • the first discrimination score calculating means 4200 aligns and imports the low mass ion mass spectra of the CRC patient group and the normal control group in the set A 1 (D111) through the steps D111 to D114 shown in FIG. 15, and the imported peak. Intensities were normalized (D112), normalized peak intensities were Pareto scaled (D113), and biostatistical analysis was performed on the Pareto scaled peak intensities (D114).
  • the discriminant score can be calculated by selecting any one of various biostatistic analysis methods, but in this embodiment, a linear discriminant analysis based on principal component analysis was performed. Sensitivity and specificity were calculated through the discrimination score (D115), and the results are shown in FIG. 2 and Table 104 described above.
  • the sensitivity or specificity case is less than a respective threshold value false positives (false positive) or false negative (false negative) case by setting the threshold value CN 1 and the specific threshold value CN 2 in view of the sensitivity (D117).
  • the sensitivity of the found threshold value CN 1 and CN-specific threshold sensitivity and specificity, by setting to 1 all of the Figure 2 are both 100% in the first training set of Figure A 0. That is, two cases of false positives and two cases of false negatives shown in Table 104 were excluded, and steps D111 to D115 were performed again on the excluded sets. Sensitivity and specificity did not immediately reach 100% even though the steps D111 to D115 were performed again on the excluded set. 0 could be found (D118).
  • Such a series of processes may be performed through the factor loading value calculation means 4300.
  • the process of applying the constructed discriminant to the sample to be discriminated is as follows.
  • MarkerView TM has functions that can be used for similar purposes. That is, it is possible to apply the principal component analysis-based linear discrimination analysis to only some of the sample data imported together, it is possible to determine the remaining samples by the discrimination formula configured in this way. By using this function, the first training set and the sample to be discriminated are imported together, and then only the first training set is selected and the principal component analysis-based linear discriminant analysis is performed to determine how the sample to be discriminated is determined.
  • the peak alignment is performed during the import process of MarkerView TM , and since there is no function to align the peaks of the sample to be discriminated according to the first training set, the peak when only the first training set is imported
  • the first training set portion of the table (a matrix consisting of a peak table, a m / z column and a peak intensity column for each sample) and a peak table generated when the first training set and the sample to be discriminated are imported is not the same.
  • the peak intensity matrix portions are also different and the m / z values corresponding to the same peak intensity rows do not always appear the same.
  • the peaks generated when only the first training set is imported into the peak table generated when the first training set and the sample to be discriminated are imported together. Realignment to the table must be preceded.
  • the low mass ion mass spectra of the sample to be discriminated are aligned with the first training set and then imported (D211).
  • the low mass ion mass spectrum of the sample to be discriminated is imported after being imported together with the first training set.
  • a program was rearranged to the peak table created when only the first training set was imported to extract the low mass ion mass spectrum of the sample to be discriminated aligned with the first training set.
  • the discrimination score calculated in this way is greater than the reference value CS (D215), and if it is larger than the reference value CS, it is determined as positive (D216), and when it is smaller than the reference value CS, it is determined as negative (D217).
  • the reference value CS it is preferable that the reference value CS is zero.
  • Such a series of processes may be performed through the second alignment means 4500, the second discrimination score calculation means 4600, and the colorectal cancer determination means 4700.
  • the time to configure the first training set A 01 in the set A 1 to the discriminant one kinds of negative eight CRC patients and nine normal control samples and the first training set from set A 1 to the discriminant two kinds were A Discrimination scores were applied by applying the factor loading values by mass ions calculated in section (2-4) to the samples of 5 CRC patients, 1 BRC patient, 8 NHL patients and 1 GC patient group that were excluded when constructing 02 . I tried to calculate. Since the cases were already excluded when constructing the first training set A 01 and A 02 , it was expected to be classified as false-positive or false-negative cases. As a result of the calculation, it was determined as false-positive or false-negative cases. 17 and 18 show the result of determining the set A 1 by applying the factor loading value for each mass ion calculated in the section (2-4), where FIG. 17 is the first type discrimination equation and FIG. 18 is the second. Show the results of the species discriminant.
  • predetermined mass ions among 10,000 mass ions were selected to have a great influence on the discrimination score.
  • the number of predetermined mass ions selected for the first type discrimination equation was 278, and for the second type discrimination equation, 383.
  • the table 103 was the maximum number of peaks to 10,000 by the import condition hayeoteumeuro imported along a sufficient number of samples, it consists of 10,000 wherein the determination expression is configured by a principal component analysis based on a linear discriminant analysis method of MarkerView TM.
  • the mass ions were selected in two steps according to the procedure of FIG. . This step is a process of removing unnecessary mass ions in distinguishing CRC patients from non-patients among 10,000 mass ions.
  • the mass ions whose absolute value of the product of the peak intensity and the factor loading value for each mass ion were larger than the threshold CT 1 were selected for each case (D121).
  • the threshold CT 1 is preferably 0.1.
  • the mass ions commonly appearing in the cases with a threshold CT of 2 percent or more among the first training set total cases were secondarily selected (D122).
  • the threshold CT 2 is preferably 50.
  • a preliminary discriminant only consists of mass ions commonly appearing in at least 135 cases among the 269 cases that are the first training set.
  • the discrimination score was calculated again using only the selected mass ions through the above process, and the sensitivity and specificity were calculated accordingly (D123). Again, by setting the threshold value CN 3 and specificity threshold CN 4 of the sensitivity (D124), the sensitivity or specificity is less than the respective threshold value in the threshold value CT 1 and / or D122 step in D121 step The threshold CT 2 used was changed (D125) and the steps D121 to D124 were repeated. In this embodiment, it is preferred that the sensitivity of the threshold value and the threshold value of the CN 3 CN 4 Specificity of 0.9.
  • the preliminary candidate group of the low mass ions for CRC diagnosis was composed of the selected mass ions through these steps (D126).
  • 278 for the first type discrimination equation among 10,000 mass ions and the second type discrimination equation In the case of 383 mass ions were selected.
  • Table 122 and Table 123 show the results of discriminating the first training set A 01 and A 02 by the preliminary discriminant and the second preliminary discriminant.
  • the discriminant performance such as sensitivity and specificity is slightly lowered at 100%.
  • the result is calculated using only mass ions less than 3-4% of the total number of mass ions, it can be confirmed that the results show comparable excellent results compared with the use of total mass ions.
  • Figs. 20 and 21 show the result of determining the set A 1 as the preliminary discrimination equation.
  • Fig. 20 shows the results of the first type preliminary discrimination equation and FIG. While the number of mass ions used in the calculations has been drastically reduced, it can be seen that the range of discrimination scores is not, which indicates that not all 10,000 mass ions are needed to distinguish CRC patients and non-patients. have.
  • the series of processes as described above may be performed through the colon cancer diagnosis ion selecting means 4400 including the candidate ion selecting means.
  • the mass ions were extracted from the 10,000 mass ions imported. However, among the mass ions, no problem occurred in the first training set A 0 , but potentially in the determination of re-measured mass spectra for serum of the same CRC patient group and non-patient group, or for the determination of new CRC patient group and non-patient group. Since mass ions may be included, which may degrade the discrimination performance, these steps are also required to be actively removed. In the process of constructing the final discrimination equation, the low mass ions for CRC diagnosis are finally determined.
  • the experiment was measured 5 times for the first set of A 1 In order to verify the robustness of the discriminant, this independent, also, was performed 5 times repeated measures experiment also to a separate set of A 2 and set B to each other.
  • Repeated measurement of the mass spectrum involves freezing and dissolving the serum described above and extracting the serum by mixing it with fresh methanol / chloroform, as well as vaporization and desorption using a laser beam.
  • the ionization process may not be the same in the repeated experiments, and there is also room for disturbances from various causes that have not yet been identified. Therefore, it may not be excluded that a certain amount of deviation occurs in the discrimination score for the individual mass spectrum repeatedly measured. In this example, the average discrimination score was calculated for the sample repeatedly measured five times, and the determination was performed.
  • Table 124 shows the result of discriminating sets A and B by the 10,000 terms discriminant based on the principal component analysis-based linear discriminant analysis of MarkerView TM
  • Table 125 shows the type 1 preliminary discriminant with 278 terms and 383 terms.
  • CRC LOME colonrectal cancer low mass ion discriminant equation
  • CRC LOME 2 represents the second type discrimination equation
  • the number following it represents the number of low mass ions included in the discrimination equation. it means.
  • Table 126 discrimination performance is shown only for set B, which is a verification set.
  • the numbers in parentheses indicate discrimination performance when the TA patient group is included in the CRC patient group.
  • the TA patient group is more likely to develop into a CRC patient group, and it can be said that discriminating TA patient group into CRC patient group is a desirable result for the purpose of screening for early detection.
  • Table 126 shows that the discriminant formula consisting of 10,000 mass ions exhibits particularly low sensitivity in set B, despite the perfect discriminant performance in the first training set A 0 .
  • the first and second preliminary discriminant equations also showed very good discriminant performance (Tables 122 and 123) in the training set A 0 , but the discriminant in the set B was not satisfactory.
  • the steps of FIG. 22 are performed to improve the preliminary discriminant into a robust discriminant.
  • the mass ions of the preliminary candidate group were divided into a high sensitivity set and a high specificity set (D131).
  • the mass ions of the high sensitivity set are mass ions having a higher sensitivity than the specificity of the mass ions, and the mass ions of the high specific set are vice versa.
  • Criterion 1 The combination of sensitivity and specificity has higher performance.
  • Criterion 2 A combination with a smaller number of mass ions has higher performance.
  • Criterion 3 The combination of the difference between the minimum discrimination score in the true positive case and the maximum discrimination score in the true negative case is higher.
  • the next top 1 mass ions ⁇ Sns 3 , Spc 3 ⁇ of each of the high sensitivity set and the high sensitivity set are further taken to add the mass ions ⁇ Sns 3 ,) to the biomarker group and the biomarker group.
  • the method (D133) is repeated as described above, and when there are no mass ions to be added to either the high sensitivity set or the high sensitivity set, , Further taking the next higher mass ion ⁇ Sns i or Spc j ⁇ of the set with the remaining mass ions and combining the biomarker group and the biomarker group with the mass ions ⁇ Sns i or Spc j ⁇ The highest performance set of the two sets ⁇ biomarker group ⁇ , ⁇ biomarker group, Sns i or Spc j ⁇ is again selected as the biomarker group.
  • the biomarker group 1 (CG) is removed from the preliminary candidate group (D136), and the remaining mass ions again form a sensitivity set and a high specific set and repeat the above process. This process is repeated until either one of the high and high specificity sets has less than two mass ions (D137).
  • the CK biomarker groups are combined in the order of medium accuracy to form the final biomarker group.
  • Accuracy refers to the ratio of true positive and true negative cases out of the total cases.
  • CK is preferably a natural number between 1 and 3 (D138).
  • the mass ions of the final biomarker group are determined as low mass ions for CRC diagnosis (D139).
  • the series of processes as described above may be performed through the colon cancer diagnosis ion selection means 4400 including the final ion group selection means.
  • the determination result of the first and second type CRC diagnostic final discrimination equations using the first and second type CRC diagnostic low mass ions for the set B can be obtained according to the method of FIG. 16.
  • Figs. 23, 24 and Tables 126, 129. 23 and 24 show the results of the determination as the average discrimination score of the five discrimination scores, while FIG. 23 shows the determination result of the set A and FIG. 24.
  • set B which is a test set
  • sensitivity, specificity, positive predictive value, and negative predictive value are all 85% or more.
  • all of the discrimination performance is 90% or more, indicating a very good discrimination result.
  • Table 130 shows a comparison between the discrimination performance when the conventional FOBT analysis is performed and the discrimination performance of the present invention.
  • the FOBT results for 96 samples of the CRC patient group and 49 samples of the normal control group were 100% specificity but only 50% sensitive.
  • the results are less than 60 ⁇ 85% of the sensitivity of the commonly known FOBT.
  • the present invention is comparable to the FOBT in terms of specificity, even if compared with the general FOBT discrimination performance, and it can be seen that the differential performance is excellent in terms of sensitivity, which demonstrates the excellent discrimination performance of the present invention. Similar results can be obtained in the training set.
  • Table 131 shows the results of the FOBT determination and the determination according to the present invention for both the training set and the verification set.
  • 25A and 25B show the results of identifying 1465.6184 m / z and 2450.9701 m / z of the low-mass ions for the first type CRC diagnosis, respectively.
  • Both low-mass ions show the shape of a mass peak group of the same substance, with a mass value difference of about 1 m / z depending on the number of isotopes. This is a mass peak pattern specific to proteins or peptides that appears in the mass spectrometer.
  • the upper left figure of FIGS. 25A and 25B shows the mass spectra of each of the two low mass ions described above.
  • the spectrum indicated by the red line represents the peak intensity in the serum extract of the CRC patient group, and the spectrum indicated by the blue line is obtained from the normal control group. 1465.6184 m / z showed higher peak intensity in the CRC patient group, whereas 2450.9701 m / z showed lower peak intensity in the CRC patient group.
  • the upper right figure of FIGS. 25A and 25B shows the MS / MS analysis spectra of the two low mass ions described above, and the tables in FIGS.
  • the peak intensity of the low mass ion 1465.6184 m / z corresponding to the fibrinogen alpha chain corresponds to the high qualitative result of the CRC patient group. It was higher as progressed (see Table 133).
  • the peak intensity of the low mass ion 2450.9701 m / z corresponding to the transtyretin corresponds to the qualitative result that was low in the CRC patient group, and quantitatively determined that the level of transthyretin in the blood of the CRC patient was normal. Low (see Table 134). Summarized in the form of mean ⁇ standard deviation, the CRC patient group was 160.39 ⁇ 62.41 ng / mL and the normal control group was 171.19 ⁇ 30.86 ng / mL.
  • the low mass ion mass spectrum of serum was analyzed to determine CRC patients and non-patients with high discrimination performance.
  • FIG. 26 is a block diagram illustrating in more detail the cancer diagnosis unit of FIG. 7 for diagnosing the BRC of the present invention.
  • FIG. 26 is a block diagram illustrating in more detail the cancer diagnosis unit of FIG. 7 for diagnosing the BRC of the present invention.
  • the cancer diagnosis unit includes: first alignment means 5100 for aligning low mass ion mass spectra of the breast cancer patient and non-patient cases that are a training candidate set; First discrimination score calculation means (5200) for performing a biostatistic analysis on the aligned mass spectra to calculate a discrimination score; Factor loading value calculation means (5300) for calculating sensitivity and specificity according to the discrimination score, and calculating a factor loading value for each low-mass ion by selecting a first training set based on the determination score; Breast cancer diagnosis ion selection means 5400 for selecting low mass ions for diagnosing breast cancer based on discrimination performance among candidate low mass ions satisfying the candidate condition; Second alignment means (5500) for aligning the low mass ion mass spectrum of the biological sample to be discriminated with the first training set; Second discrimination score calculation means (5600) for calculating a discrimination score from the peak intensity of the low mass ions to be discriminated and the factor loading value; And breast cancer determination means 5700 for determining the
  • low mass ions for diagnosing breast cancer wherein the low mass ions for diagnosing breast cancer are low mass ions for diagnosing first type breast cancer for the first type discrimination case, and a second type for discriminating type 2 cases. It is characterized in that it is divided into low mass ions for diagnosing breast breast cancer and low mass ions for diagnosing type 3 breast cancer for the third type discrimination case.
  • the low mass ion detection unit 1000 A mass spectrometer of the low mass ions is extracted from a biological sample of a number of breast cancer patients and non-patient cases by detecting the peak intensity of the low mass ions.
  • the more detailed components of the cancer diagnosis unit for diagnosing the BRC is similar to the components described with reference to FIGS. 9 to 13 in the above-described cancer diagnosis apparatus, and thus, a detailed configuration and description thereof Will be omitted, and one embodiment of the present invention will be described in detail below.
  • the apparatus for diagnosing cancer of the present invention may be composed of hardware or software by a program structure, as shown in FIG. It will be described in detail the cancer diagnostic device for.
  • the first training set was composed of the subset C 0 using the 165 people as the set C 1 , and the weight for each mass ion (factor loading value) was obtained through a biostatistic analysis of the first training set. ) And a preliminary discriminant was obtained.
  • a set of seven NHL patients in this set C 1 in addition to the table 208 of 54 BRC patients, table 209 of 46 the control group, and Table 210 of the 29 CRC patients, Table 211 15 GC group, and Table 212 of the C 2
  • the training set was extended with (Training Set 2).
  • the OVC patient group is a patient group that is not reflected at all when obtaining weights for each mass ion or identifying low mass ions for BRC diagnosis.
  • the OVC patient group is included to examine how the patient group is distinguished by the discriminant of the present invention.
  • Methanol / chloroform extract was mixed with a solution of alpha-cyano-4-hydroxycinnamic acid in 50% acetonitrile / 0.1% TFA (1:12, v / v), 1 ⁇ l of the mixture was placed on a MALDI-target plate.
  • Mass spectra of BRC patient and non-patient serum extracts were measured using the Proteomics Analyzer (Applied Biosystems, Foster City, CA, USA).
  • the mass spectral data is extracted as the average of the spectra measured 20 times.
  • the mass value intervals of all individual samples were adjusted so that the maximum mass value was about 2500 m / z.
  • various factors including the focus mass, laser intensity, target plate, and data acquisition time were checked.
  • the low mass ion detection means 5000 may extract the low mass ion mass spectrum from the serum sample through the above process using a MALDI-TOF mass spectrometer.
  • the BRC patient group In order for the discriminant to be BRC-specific, the BRC patient group must be distinguished from other cancer patients as well as the normal control group by the discriminant.
  • the CRC patient group, the GC patient group, and the NHL patient group are used as other cancer patient groups.
  • Table 219 shows the results of applying the conventional principal component analysis-based linear discriminant analysis to distinguish between the BRC patient group and the non-patient group (normal control group, CRC patient group, GC patient group, and NHL patient group) as one discriminant. As shown in Table 204, it is not a perfect discrimination result, but it can be confirmed that the excellent discrimination performance is generally over 80%. From this, one discrimination equation can be used to distinguish the BRC patient group from the non-patient group.
  • the distinction between the BRC patient group and the non-patient group may adopt a method of using one discriminant and a method of using two discriminant equations, both of which are described in the embodiment.
  • this equation is referred to as a type 1 discrimination equation.
  • the distinction between the BRC patient group and the non-patient group is determined by BRC.
  • the discriminated case may be determined as a BRC patient, and when the non-BRC non-patient is determined as either of the two discriminant expressions, it may be performed through a method of determining the non-BRC patient.
  • a method of selecting the first training set C 0 having a predetermined value with sensitivity and specificity will be described with reference to FIG. 27.
  • the first discrimination score calculation unit 5200 arranges and imports the low mass ion mass spectra of the BRC patient group and the non-patient group in the set C 1 through the steps E111 to E114 of FIG. 27 (E111), and the imported peak. Intensities were normalized (E112), normalized peak intensities were Pareto scaled (E113), and biostatistical analysis was performed on the Pareto scaled peak intensities (E114).
  • the discriminant score can be calculated by selecting any one of various biostatistic analysis methods, but in this embodiment, a linear discriminant analysis based on principal component analysis was performed. Sensitivity and specificity were calculated using the discrimination score (E115), and the results are shown in Table 219 above.
  • the sensitivity or specificity case is less than a respective threshold value false positives (false positive) or false negative (false negative) case by setting the threshold value BN 1 and the specific threshold value BN 2 in view of the sensitivity (E117).
  • the threshold BN 1 of sensitivity and the threshold BN 2 of specificity are both set to 1 to find the first training set C 01 having 100% of both sensitivity and specificity. That is, all twelve cases of false positives shown in Table 219 were excluded, and steps E111 to E115 were performed on the excluded sets. Sensitivity and specificity did not become 100% immediately after performing the steps E111 to E115 again for the excluded set, and the first training set C having 100% of both sensitivity and specificity by repeating steps E111 to E117 several times. 01 could be found (E118).
  • the first training set C 01 was reached after excluding 15 false-positive cases (7 CONT, 3 CRC, 2 GC, and 3 NHL).
  • the first training set C 03 was reached after excluding one false-positive case (1 GC), with each first training set having sensitivity and specificity. Gives a 100% discriminant result.
  • Such a series of processes may be performed through the factor loading value calculation unit 5300.
  • the process of applying the constructed discriminant to the sample to be discriminated is as follows.
  • MarkerView TM has functions that can be used for similar purposes. That is, it is possible to apply the principal component analysis-based linear discrimination analysis to only some of the sample data imported together, it is possible to determine the remaining samples by the discrimination formula configured in this way. By using this function, the first training set and the sample to be discriminated are imported together, and then only the first training set is selected and the principal component analysis-based linear discriminant analysis is performed to determine how the sample to be discriminated is determined.
  • the peak alignment is performed during the import process of MarkerView TM , and since there is no function to align the peaks of the sample to be discriminated according to the first training set, the peak when only the first training set is imported
  • the first training set portion of the table (a matrix consisting of a peak table, a m / z column and a peak intensity column for each sample) and a peak table generated when the first training set and the sample to be discriminated are imported is not the same.
  • the peak intensity matrix portions are also different and the m / z values corresponding to the same peak intensity rows do not always appear the same.
  • the peaks generated when only the first training set is imported into the peak table generated when the first training set and the sample to be discriminated are imported together. Realignment to the table must be preceded.
  • a step of aligning and importing low mass ion mass spectra of a sample to be discriminated into a first training set is performed (E211).
  • the low mass ion mass spectrum of the sample to be discriminated is imported after being imported together with the first training set.
  • a program was rearranged to the peak table created when only the first training set was imported to extract the low mass ion mass spectrum of the sample to be discriminated aligned with the first training set.
  • the reference value BS is preferably 0.
  • the series of processes as described above may be performed through the second alignment means 5500, the second discrimination score calculation unit 5600, and the breast cancer determination unit 5700.
  • the time to configure the first training set of C 03 from the set of C 1 to 15 non-patient sample and a 3 class discriminant which was excluded when configuring the first training set of C 01 from the set C 1 in order to determine type 1 jong Discrimination scores were calculated by applying the factor loading value for each mass ion calculated in the above section (3-4) to one GC patient group that was excluded. Since the cases were excluded when constructing the training set C 01 and C 03 , it was expected to be a false-positive or false-negative case. Except for that, it was determined to be a false positive or false negative case. 29 and 30 show the results of determining the set C 1 by applying the factor loading value for each mass ion calculated in the above (3-4), where FIG. 29 is the first type discrimination equation and FIG. 30 is the third Show the results of the species identification.
  • predetermined mass ions having a large influence on the discrimination score among 10,000 mass ions were selected.
  • the number of predetermined mass ions selected for the first type discrimination equation was 376, the 353 type for the second type discrimination equation, and 345 for the third type discrimination equation.
  • the import condition as described above, with the table 203 was the maximum number of peaks to 10,000 hayeoteumeuro imported together enough sample consists of 10,000 wherein the determination expression is configured by a principal component analysis based on a linear discriminant analysis method of MarkerView TM.
  • the mass ions of the 10,000 mass ions which greatly influence the discrimination score, were selected in two steps according to the procedure of FIG. 31. . This step is a process of removing unnecessary mass ions in distinguishing BRC patients from non-patients among 10,000 mass ions.
  • the threshold BT 1 is preferably 0.1.
  • the threshold BT 2 is preferably 50. That is, in the case of the second type discriminant, the preliminary discriminant is composed of only mass ions commonly appearing in at least 52 cases among the 103 cases of the first training set.
  • the discrimination score was calculated again using only the selected mass ions through the above process, and the sensitivity and specificity were calculated accordingly (E123). Again, by setting the threshold value BN 3 and specificity threshold BN 4 of the sensitivity (E124), the sensitivity or specificity is less than the respective threshold value in the threshold value BT 1 and / or E122 step in E121 step The threshold BT 2 used was changed (E125) to repeat steps E121 to E124. In this embodiment, it is preferred that the sensitivity of the threshold value 3 and the threshold value of the BN BN specificity 4 of 0.9.
  • the preliminary candidate group of BRC diagnostic low-mass ions was composed of the selected mass ions through the above steps (E126).
  • 376 types of the first type discrimination equation and 10,000 types of the second type discrimination equation are used.
  • 353, 345 mass ions were selected for the type 3 discrimination equation.
  • the first training set C in Tables 221, 222, and 223 as the first, second, and third kind preliminary discrimination equations. 01 , C 02 , C 03
  • the results showed that the detection performance, such as sensitivity and specificity, was lowered at 100%, but the result was very good in spite of the calculation of only mass ions less than 4% of the total number of mass ions. Can be.
  • FIG. 32, 33, and 34 show the results of determining the set C 1 by the preliminary discrimination equation, where FIG. 32 is the first type preliminary discrimination equation, FIG. 33 is the second type preliminary discrimination equation, and FIG. 34 is the third type. Shows the result of the preliminary discriminant. While the number of mass ions used in the calculations has been drastically reduced, it can be seen that the range of discrimination scores is not, which indicates that not all 10,000 mass ions are required to distinguish BRC patients and non-patients. have.
  • Such a series of processes may be performed through the breast cancer diagnosis ion selecting means 5400 including the candidate ion selecting means.
  • the mass ions were extracted from the 10,000 mass ions imported. These mass ions, however, did not cause problems in the first training set C 0 , but were potential for determination of the re-measured mass spectrum for sera of the same BRC and non-patients or for the determination of new and non-patient BRC and non-patients. Since the mass ions may also be included, which may degrade the discrimination performance, it is necessary to actively remove them. During the construction of the final discrimination equation, the low mass ions for BRC diagnosis are finally determined.
  • Table 224 shows the result of discriminating the set C and D by the 10,000 terms discriminant based on the principal component analysis-based linear discriminant analysis of the prior art MarkerView TM
  • Table 225 shows the first type preliminary discriminant with 376 terms. The result of discriminating sets C and D by the type 2 preliminary discriminant with terms and the type 3 preliminary discriminant with 345 terms is shown.
  • BRC LOME breast cancer low-mass ion discriminant equation 1 is the first type discrimination equation
  • BRC LOME 2 is the second type discrimination equation
  • BRC LOME 3 is the third type discrimination equation
  • the number following it is It means the number of low mass ions included in the discriminant.
  • Table 226 the discrimination performance is shown only for the set D which is the verification set. The numbers in parentheses indicate the discrimination performance when the OVC patient group is excluded.
  • the steps of FIG. 35 are performed to improve the preliminary discriminant into a robust discriminant.
  • mass ions of the preliminary candidate group were divided into a high sensitivity set and a high specificity set (E131).
  • the mass ions of the high sensitivity set are mass ions having a higher sensitivity than the specificity of the mass ions, and the mass ions of the high specific set are vice versa.
  • Criterion 1 The combination of sensitivity and specificity has higher performance.
  • Criterion 2 A combination with a smaller number of mass ions has higher performance.
  • Criterion 3 The combination of the difference between the minimum discrimination score in the true positive case and the maximum discrimination score in the true negative case is higher.
  • the next top 1 mass ions ⁇ Sns 3 , Spc 3 ⁇ of each of the high sensitivity set and the high sensitivity set are further taken to add the mass ions ⁇ Sns 3 ,) to the biomarker group and the biomarker group.
  • the method (E133) is repeated as described above, and when there are no mass ions to be added to either the high sensitivity set or the high sensitivity set, And further taking the next higher mass ion ⁇ Sns i or Spc j ⁇ of the set with the remaining mass ions and combining the biomarker group and the biomarker group with the mass ions ⁇ Sns i or Spc j ⁇
  • the highest performance set of two sets ⁇ biomarker group ⁇ , ⁇ biomarker group, Sen i or Spc j ⁇ is again selected as a biomarker group.
  • the biomarker group 1 (BG) is removed from the preliminary candidate group (E136), and the remaining mass ions again form a sensitivity set and a high specific set and repeat the above process. This process is repeated until either one of the high and high specificity sets has less than two mass ions (E137).
  • the final biomarker group is formed by combining the BK biomarker groups in the order of accuracy.
  • Accuracy refers to the ratio of true positive and true negative cases out of the total cases.
  • BK is preferably a natural number between 1 and 3 (E138).
  • the mass ions of the final biomarker group are determined as BRC diagnostic low mass ions (E139).
  • the series of processes as described above may be performed through the breast cancer diagnosis ion selecting means 5400 including the final ion group selecting means.
  • a final discrimination equation for the first, or second, and third types of BRC diagnostics using low mass ions of the first, second, and third types of BRC diagnostics is applied according to the method of FIG.
  • the determination result can be obtained.
  • 36, 37 and Tables 226 and 230 show the results determined by the final discriminant.
  • 36 and 37 show the result of the determination as the average discrimination score of the five discrimination scores.
  • FIG. 36 shows the determination result of the set C and FIG. 37.
  • the final determinant of type 1 BRC diagnosis the sensitivity, specificity, positive predictive value, and negative predictive value in set D were all higher than 85% only when the OVC patient group that was not included in the training set was excluded from the test set. It was. However, in general, it can be said that the final discrimination equation for the first type of BRC diagnosis also shows excellent discrimination results.
  • the low mass ion mass spectrum of the serum was analyzed to determine the BRC patient and the non-patient with high discrimination performance.
  • FIG. 38 is a block diagram illustrating in more detail the cancer diagnosis unit of FIG. 7 for diagnosing GC of the present invention.
  • the cancer diagnosis unit includes: first alignment means 6100 for aligning low-mass ion mass spectra of the gastric cancer patient and non-patient cases that are a training candidate set; First discrimination score calculation means 6200 for performing a biostatistic analysis on the aligned mass spectra to calculate a discrimination score; Factor loading value calculating means (6300) for calculating sensitivity and specificity according to the discrimination score, and calculating a factor loading value for each low-mass ion by selecting a first training set based on the determination score; Gastric cancer diagnosis ion selecting means 6400 for selecting gastric cancer diagnostic low mass ions based on discrimination performance among candidate low mass ions satisfying the candidate condition; Second alignment means (6500) for aligning the low mass ion mass spectrum of the biological sample to be discriminated with the first training set; Second discrimination score calculation means (6600) for calculating a discrimination score from the peak intensity of the low mass ions to be discriminated and the factor loading value; And gastric cancer determination means 6700
  • the type 3 discrimination cases, the type 4 discrimination cases and the type 5 discrimination cases are respectively executed, so that the low-mass ions for diagnosing gastric cancer are the first type of the first type discrimination case.
  • Low mass ions for longitudinal gastric cancer diagnosis, low mass ions for diagnosing type 2 gastric cancer for the second type discrimination case, low mass ions for diagnosing type 3 gastric cancer for the third type discrimination case, the fourth type discrimination case It is characterized in that it is divided into low mass ions for diagnosing gastric cancer of the fourth type and low mass ions for diagnosing gastric cancer of the fifth type for the fifth discrimination case.
  • the low mass ion detection unit 1000 A mass spectrometer of the low mass ions is extracted from a biological sample of a number of gastric cancer patients and non-patient cases by detecting the peak intensity of the low mass ions.
  • cancer diagnosis unit for diagnosing the GC are similar to those described with reference to FIGS. 9 to 13 in the above-described cancer diagnosis apparatus. Will be omitted, and one embodiment of the present invention will be described in detail below.
  • the apparatus for diagnosing cancer of the present invention may be composed of hardware or software by a program structure as shown in FIG. It will be described in detail for the cancer diagnostic device for.
  • Serum was collected from 49 GC patient groups of Table 301, 84 normal controls of Table 302, 77 CRC patients of Table 305, 54 BRC patients of Table 306, and 24 non-Hodgkin lymphoma patients of Table 307, above. .
  • ASC Adenosquamous carcinoma
  • OVC patient groups 44 GC patient groups in Table 313, 81 normal controls in Table 314, 168 CRC patient groups in Table 315, 53 BRC patient groups in Table 316, 20 NHL patient groups in Table 317, 25 and Table 318, independent of set E.
  • a test set was constructed using the group F of ovarian cancer (OVC) patients.
  • the OVC patient group is a patient group that is not reflected at all when obtaining weights for each mass ion or when checking low mass ions for GC diagnosis.
  • the OVC patient group is included to examine how the patient group is distinguished by the discriminant of the present invention.
  • Methanol / chloroform extract was mixed with a solution of alpha-cyano-4-hydroxycinnamic acid in 50% acetonitrile / 0.1% TFA (1:12, v / v), 1 ⁇ l of the mixture was placed on a MALDI-target plate.
  • Mass spectra of GC patient and non-patient serum extracts were measured using the Proteomics Analyzer (Applied Biosystems, Foster City, CA, USA).
  • the mass spectral data is extracted as the average of the spectra measured 20 times.
  • the mass value intervals of all individual samples were adjusted so that the maximum mass value was about 2500 m / z.
  • various factors including the focus mass, laser intensity, target plate, and data acquisition time were checked.
  • the low mass ion detection means 6000 may extract the low mass ion mass spectrum from the serum sample through the above process using a MALDI-TOF mass spectrometer.
  • the GC patient group In order for the discriminant to be GC-specific, the GC patient group must be distinguished from other cancer patients as well as the normal control group by the discriminant.
  • the CRC patient group, the BRC patient group, and the NHL patient group are used as other cancer patient groups.
  • Table 319 shows the results of applying the conventional principal component analysis-based linear discriminant analysis to distinguish between the GC patient group and the non-patient group (normal control group, CRC patient group, BRC patient group and NHL patient group) as one discrimination equation.
  • the specificity of the NHL patient group was confirmed to be low as 25.00%. From this, it can be seen that one discriminant cannot distinguish between the GC patient group and the non-patient group.
  • distinguishing the GC patient group from the non-patient group is the first type discrimination formula for distinguishing the GC patient group from the normal control group, the second type discrimination formula for distinguishing the GC patient group and the CRC patient group, and the third class discriminating group for the GC patient group and the BRC patient group.
  • the fourth type discriminant that distinguishes the GC patient group and the NHL patient group the case in which all four discriminants are determined to be GC is determined as the GC patient, and the GC is determined by any one of the four discriminant equations. If it is determined that the non-patients can be performed through the method of determining the non-GC patients.
  • Table 323 shows a case in which the GC patient group, the normal control group and the other cancer patient group are distinguished, and generally show excellent discrimination results. Therefore, the GC patient group can be distinguished from the non-patient group by combining the discriminant and the first type of discriminant to distinguish the GC patient group and the normal control group from other cancer patient groups, and then distinguish the GC patient group from the normal control group.
  • the discriminant that distinguishes the GC patient group and the normal control group from other cancer patient groups is referred to as the fifth type discriminant.
  • a method of using four discriminant expressions and a method of using two discriminant expressions may be adopted. Both embodiments will be described in the embodiment.
  • a method of selecting a first training set E 0 having a predetermined value with sensitivity and specificity will be described with reference to FIG. 39.
  • the first discrimination score calculating means 6200 aligns and imports the low mass ion mass spectra of the GC patient group and the normal control group in the set E 1 (F111) through the steps F111 to F114 of FIG. 39, and the imported peak. Intensities were normalized (F112), normalized peak intensities were Pareto scaled (F113), and biostatistical analysis was performed on the Pareto scaled peak intensities (F114).
  • the discriminant score can be calculated by selecting any one of various biostatistic analysis methods, but in this embodiment, a linear discriminant analysis based on principal component analysis was performed. Sensitivity and specificity were calculated through the discrimination score (F115), and the results are shown in Table 304 above.
  • the sensitivity or the specific case is less than the respective threshold value false positives (false positive) or false negative (false negative) case by setting the threshold value GN 1 and the specific threshold value GN 2 in view of the sensitivity (F117).
  • the threshold GN 1 of sensitivity and the threshold GN 2 of specificity are both set to 1 to find the first training set E 0 having 100% of both sensitivity and specificity. That is, one case of false negatives shown in Table 304 was excluded, and steps F111 to F115 were performed on the excluded sets. In the case of the first type discrimination equation, it was confirmed that the sensitivity and specificity became 100% in this way, but the sensitivity and specificity did not always become 100% immediately even if the steps F111 to F115 were performed again on the excluded set. By repeating steps F111 to F117 several times, the first training set E 0 having 100% of both sensitivity and specificity was found (F118).
  • the first training set E 01 was reached after excluding one false negative case, and the second type discriminant that distinguished the GC patient group and the CRC patient group was 4. After excluding two false-negative cases and two false-positive cases, the first training set E 02 was reached, and the third discriminant that distinguished the GC and BRC patient groups excluded four false-negative cases and one false-positive case.
  • the first training set E 03 was reached, and in the fifth discrimination equation that distinguishes the GC patient group and the normal control group from other cancer patients, 11 false negative cases (5 GCs and 6 CONTs) and 21 false positive cases
  • the first training set E 05 was reached after the exclusion of the two (20 CRCs and one BRC), and each first training set gave a determination result of 100% of both sensitivity and specificity.
  • Such a series of processes may be performed through the factor loading value calculation means 6300.
  • the process of applying the constructed discriminant to the sample to be discriminated is as follows.
  • MarkerView TM has functions that can be used for similar purposes. That is, it is possible to apply the principal component analysis-based linear discrimination analysis to only some of the sample data imported together, it is possible to determine the remaining samples by the discrimination formula configured in this way. By using this function, the first training set and the sample to be discriminated are imported together, and then only the first training set is selected and the principal component analysis-based linear discriminant analysis is performed to determine how the sample to be discriminated is determined.
  • the peak alignment is performed during the import process of MarkerView TM , and since there is no function to align the peaks of the sample to be discriminated according to the first training set, the peak when only the first training set is imported
  • the first training set portion of the table (a matrix consisting of a peak table, a m / z column and a peak intensity column for each sample) and a peak table generated when the first training set and the sample to be discriminated are imported is not the same.
  • the peak intensity matrix portions are also different and the m / z values corresponding to the same peak intensity rows do not always appear the same.
  • the peak generated when only the first training set is imported to the peak table generated when the first training set and the sample to be discriminated are imported together. Realignment to the table must be preceded.
  • the low-mass ion mass spectra of the sample to be discriminated are aligned with the first training set and then imported (F211).
  • the low mass ion mass spectrum of the sample to be discriminated is imported after being imported together with the first training set.
  • a program was rearranged to the peak table created when only the first training set was imported to extract the low mass ion mass spectrum of the sample to be discriminated aligned with the first training set.
  • the discrimination score calculated in this way is greater than the reference value GS (F215), and if it is larger than the reference value GS, it is determined as positive (F216), and when it is smaller than the reference value GS, it is determined as negative (F217).
  • the reference value GS is preferably zero.
  • the series of processes as described above may be performed through the second alignment means 6500, the second discrimination score calculation means 6600, and the gastric cancer determination means 6700.
  • the time to configure the first training set of E 02 in the set E 1 for one GC patient sample the second kind discriminant which was excluded when configuring the first training set of E 01 in the set E 1 for the discriminant 1 jong 4 GC patient samples and 2 CRC patient samples that were excluded, 4 GC patient samples and 1 BRC patient sample that were excluded when constructing the first training set E 03 in set E 1 for the Type III discriminant,
  • the discriminant score was calculated by applying the factor loading value for each mass ion calculated in Section -4).
  • predetermined mass ions having a large influence on the discrimination score among 10,000 mass ions were selected.
  • the number of predetermined mass ions selected for the first type discrimination equation is 299, the 351 for the second type discrimination equation, 384 for the third type discrimination equation, and the type 4 discrimination equation.
  • the maximum number of peaks in the import condition was 10,000, and since enough samples were imported together, a discriminant formulated through the principal component analysis-based linear discriminant analysis method of the MarkerView TM consists of 10,000 terms. However, since 10,000 terms are not all equally important in distinguishing between GC patients and non-patients, the mass ions were selected in two steps according to the procedure of FIG. 46 which greatly influence the discrimination score among 10,000 mass ions. . This step is a process of removing unnecessary mass ions in distinguishing GC patients from non-patients among 10,000 mass ions.
  • the threshold GT 1 is preferably 0.1.
  • the mass ions commonly appearing in the cases of the threshold GT 2 percent or more among the first training set total cases were secondarily selected (F122).
  • the threshold GT 2 is preferably 50. That is, if the fourth type discrimination equation is described as an example, a preliminary discriminant only consists of mass ions commonly appearing in at least 37 cases among the 73 cases, which are the first training set.
  • the discrimination score was calculated again using only the selected mass ions through the above process, and the sensitivity and specificity were calculated accordingly (F123). Again, by setting the threshold value GN 3 and specificity threshold value GN 4 of the sensitivity (F124), the sensitivity or specificity is less than the respective threshold value in the threshold value T 1 and / or F122 step in F121 step The threshold T 2 used was changed (F125) to repeat steps F121 to F124. In this embodiment, it is preferable that the threshold value of the sensitivity threshold of N 3 and N 4 is the specificity of 0.9.
  • the preliminary candidate group of the low mass ions for GC diagnosis were composed of the selected mass ions through the above steps (F126).
  • 299 and 2 types of discrimination equations are used for the first type discrimination equation among 10,000 mass ions.
  • 384 types of discrimination equations, 384 types of discrimination equations, 348 types of discrimination equations, and 383 mass ions were selected.
  • Tables 324 to 328 show the results of discriminating the first training set E 01 to E 05 by the first to fifth preliminary discriminant equations. Although the results are calculated using only 4% of mass ions, it can be seen that the results are generally very good.
  • FIG. 47 to 51 show the result of determining the set E 1 by the preliminary discrimination equation, in which FIG. 47 is the first type preliminary discrimination equation, FIG. 48 is the second type preliminary discrimination equation, and FIG. 49 is the third type preliminary.
  • the discriminant equation, FIG. 50 shows the results of the preliminary discrimination equation of the fourth kind, and FIG. 51 shows the preliminary discrimination equation of the fifth kind. While the number of mass ions used in the calculations has been drastically reduced, it can be seen that the range of discriminant scores is not. From this, it can be seen that not all 10,000 mass ions are required to distinguish between GC patients and non-patients. have.
  • Such a series of processes may be performed through the stomach cancer diagnosis ion selecting means 6400 including the candidate ion selecting means.
  • the mass ions were extracted from the 10,000 mass ions imported. These mass ions, however, did not cause problems in the first training set E 0 , but were potential for discriminating against the re-measured mass spectra for sera from the same GC patient and non-patients, or for identifying new GC and non-patients. Since mass ions may also be included, which may degrade the discrimination performance, it is necessary to actively remove them. In the process of constructing the final discrimination equation, the low mass ions for GC diagnosis are finally determined.
  • Table 329 shows the results of discriminating the sets E and F as the discriminant of 10,000 terms, which is the result of linear discriminant analysis based on the principal component analysis of MarkerView TM
  • Table 330 shows the first type preliminary discriminant having 299 terms.
  • GC LOME gastric cancer low-mass ion discriminant equation 1 to 5 represent the first to fifth type discrimination equations, and the numbers following the mean number of low mass ions included in the discrimination equation.
  • Table 331 shows the discrimination performance only for the set F which is the verification set.
  • the discriminant formula consisting of 0,000 mass ions shows particularly low sensitivity and positive predictive value in the set F, despite the perfect discriminant performance in the first training set E 0 .
  • the first to fifth preliminary discriminant equations generally showed very good discriminant performance (Tables 324 to 328) in the first training set E 0 , the discriminant results in the set F were not satisfactory.
  • the steps of FIG. 52 are performed to improve the preliminary discriminant into a robust discriminant.
  • the mass ions of the preliminary candidate group were divided into a high sensitivity set and a high specificity set (F131).
  • the mass ions of the high sensitivity set are mass ions having a higher sensitivity than the specificity of the mass ions, and the mass ions of the high specific set are vice versa.
  • the mass ions of the high sensitivity set and the mass ions of the high specificity set are arranged in descending order of the sensitivity and specificity of each mass ion, and then ⁇ Sns 1 , Sns 2 , Sns 3 ... Sns I ⁇ ⁇ Spc 1 , Spc 2 , Spc 3 ... Spc J ⁇ , combinations that can take each of the top two mass ions and make up ⁇ Sns 1 , Sns 2 , Spc 1 , Spc 2 ⁇ , two or more mass ions of four mass ions (11) The combination of the best performances was selected as the biomarker group (F132).
  • Criterion 1 The combination of sensitivity and specificity has higher performance.
  • Criterion 2 A combination with a smaller number of mass ions has higher performance.
  • Criterion 3 The combination of the difference between the minimum discrimination score in the true positive case and the maximum discrimination score in the true negative case is higher.
  • the next top 1 mass ions ⁇ Sns 3 , Spc 3 ⁇ of each of the high sensitivity set and the high sensitivity set are further taken to add the mass ions ⁇ Sns 3 ,) to the biomarker group and the biomarker group.
  • a mass ion is a combination of the next higher one mass ion ⁇ Sns i or Spc j ⁇ add more by taking the mass ion ⁇ Sns i or Spc j ⁇ on the biomarker group and the bio-marker group, the one set of two The highest performance set among the sets ⁇ biomarker group ⁇ , ⁇ biomarker group, Sen i or Spc j ⁇ is again selected as a biomarker group.
  • the biomarker group 1 (GG) was removed from the preliminary candidate group (F136), and the remaining mass ions again form a high sensitivity set and a high specific set and repeat the above process. This process is repeated until either one of the high and high specificity sets has less than two mass ions (F137).
  • Biomarker Groups 1, 2,... GK biomarker groups are combined in the order of medium accuracy to form the final biomarker group. Accuracy here refers to the ratio of true positive and true negative cases out of the total cases.
  • GK is preferably a natural number between 1 and 3 (F138).
  • the mass ions of the final biomarker group are determined as GC diagnostic low mass ions (F139).
  • 14 were selected as the first type of GC diagnostic low mass ions, and the results for the samples for distinguishing the GC patient group from the CRC patient group.
  • 36 samples were selected as GC diagnostic low mass ions, and 50 samples were selected as GC diagnostic low mass ions, and GC and NHL patients were selected.
  • 46 samples were selected as a low-mass ion for the fourth type of GC diagnosis, and a sample for distinguishing the GC patient group, the normal control group, and the other cancer patients group was selected.
  • 55 were selected as mass ions.
  • the mass values of the first to fifth GC diagnostic low mass ions are shown in Tables 332 to 336. These low mass ions are referred to as “low mass ions for first class GC diagnostics”, “low mass ions for first class GC diagnostics”, “low mass ions for first class GC diagnostics”, and “low masses for first class GC diagnostics” Ions "and” Fifth class GC diagnostic low mass ions ", and finally determined using the discriminant according to the present invention” final discrimination for GC type 1 ",” final for GC diagnosis 2 " Discrimination Expression ",” Final Type GC Diagnosis Final Discrimination Formula ",” Fourth Type GC Diagnostic Final Discrimination Formula “, and” Fifth Class GC Diagnostic Final Discrimination Formula ".
  • the series of processes as described above may be performed through the stomach cancer diagnosis ion selection means 6400 including the final ion group selection means.
  • the final discrimination equations for the first to fourth, or the first and the fifth, GC diagnostics using the first to fourth, or the first and fifth GC diagnostic low mass ions are shown in the method of FIG. If applied accordingly, the determination result can be obtained.
  • 53, 54 and Tables 331 and 337 show the results determined by the final discrimination equation.
  • 53 and 54 show the result of the determination as the average discrimination score of the five discrimination scores.
  • FIG. 53 shows the determination result of the set E, and FIG.
  • the first to fourth GC diagnostic final discrimination equations are not shown in the figure because they must be expressed in a four-dimensional space, and only the first and fifth GC diagnostic final discrimination equations are used.
  • the sensitivity, specificity, positive predictive value, and negative predictive value in the set F were all 90% or more. Sensitivity, specificity, positive predictive value, and negative predictive value were all about 80% or more when the final discrimination equations for the first and fifth GC diagnostics were used. Therefore, it can be said that the final discriminant for the diagnosis of GC type 1 and 5 shows excellent results.
  • the low mass ion mass spectrum of serum was analyzed to determine GC patients and non-patients with high discrimination performance.
  • the present invention constitutes a formula for distinguishing between a specific cancer patient group and a normal control group in addition to colorectal cancer, breast cancer and gastric cancer through a similar process to the present embodiment, and also easily expands to construct a discrimination formula for distinguishing between different cancer patient groups.
  • the disease can be readily extended to diagnose not only cancer but also any other disease.
  • the cancer diagnosis apparatus has a very low analysis cost, a short analysis time, a large-scale analysis, and in case of CRC, sensitivity and specificity in determining not only a training set but also a verification set. , Positive predictive value and negative predictive value were all 85% or more.
  • it can be usefully applied to various diseases by changing the CRC patient and non-patient set to a patient and non-patient set of other diseases.
  • the cancer diagnosis apparatus has a very low analysis cost, a short analysis time, large-scale analysis, and in case of targeting BRC, sensitivity and specificity in the determination of a validation set as well as a training set. Also, the positive predictive value and the negative predictive value were all 85% or more. In addition, it can be usefully applied to various diseases by changing the BRC patient and non-patient set to the patient and non-patient set of other diseases.
  • the cancer diagnosis apparatus In the case of GC diagnosis, the cancer diagnosis apparatus according to the present invention has a very low analysis cost, a short analysis time, a large-scale analysis, and in the case of a GC, the sensitivity and specificity of the diagnosis set as well as the training set. Also, the positive predictive value and the negative predictive value were all about 80-90% or more. In addition, it can be usefully applied to various diseases by changing the GC patient and non-patient set to a patient and non-patient set of other diseases.

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Veterinary Medicine (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pathology (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physiology (AREA)
  • Psychiatry (AREA)
  • Signal Processing (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

본 발명은 생물학적 시료로부터 추출한 저질량 이온에 대해 생물통계학적 분석을 통하여 특정 암을 진단하기 위한 저질량 이온을 확인하고, 이 저질량 이온 질량 스펙트럼을 이용하여 특정 암을 진단할 수 있는 암 진단 장치를 제공하는 것으로, 본 발명에서는, 대장암, 유방암 및 위암 환자군을 각각 그 비환자군에 대해 강건하게 판별해 주는 판별식을 제안하고자 한다. 즉, 판별식을 도출하였던 훈련 집합뿐 아니라 이에 독립적인 검증 집합에 대해서도 매우 우수하며 강건한 판별 성능을 나타내는 판별식을 제안하고, 이를 구성하는 저질량 이온들을 확인하여 대장암, 유방암 및 위암 등을 진단할 수 있는 암 진단 장치를 제공한다.

Description

암 진단 장치
본 발명은 암을 진단하는 장치에 관한 것으로, 더욱 상세하게는 생물학적 시료로부터 추출한 저질량 이온에 대해 생물통계학적 분석을 통하여 암 진단을 위한 저질량 이온의 질량 스펙트럼을 확인하고, 이 저질량 이온 질량 스펙트럼을 이용하여 암을 진단할 수 있는 암 진단 장치에 관한 것이다.
암은 세포가 무한히 증식해 정상적인 세포의 기능을 방해하는 질병으로, 폐암, 위암(gastric cancer, GC), 유방암(breast cancer, BRC), 대장암(colorectal cancer, CRC) 등이 대표적이나, 실질적으로는 어느 조직에서나 발생할 수 있다. 초창기 암 진단은 암 세포의 성장에 따른 생체 조직의 외적 변화에 근거하였으나, 근래에 들어 혈액, 당쇄(glyco chain), 디엔에이(DNA) 등 생물의 조직 또는 세포에 존재하는 미량의 생체 분자를 이용한 진단 및 검출이 시도되고 있다. 그러나 가장 보편적으로 사용되는 암 진단 방법은 생체 조직 검사를 통해 얻어진 조직 샘플을 이용하거나, 영상을 이용한 진단이다.
그 중 생체 조직 검사는 환자에게 큰 고통을 야기하며, 고비용이 들 뿐만 아니라, 진단까지 긴 시간이 소요되는 단점이 있다. 또한, 환자가 실제 암에 걸린 경우, 생체 조직 검사 과정 중 암의 전이가 유발될 수 있는 위험이 있으며, 생체 조직 검사를 통해 조직 샘플을 얻을 수 없는 부위의 경우, 외과적인 수술을 통해 의심되는 조직의 적출이 이루어지기 전에는 질병의 진단이 불가능한 단점이 있다.
영상을 이용한 진단에서는 엑스레이(X-ray) 영상, 질병 표적 물질이 부착된 조영제를 사용하여 획득한 핵자기 공명(nuclear magnetic resonance, NMR) 영상 등을 기반으로 암을 판정한다. 그러나, 이러한 영상 진단은 임상의 또는 판독의의 숙련도에 따라 오진의 가능성이 있으며, 영상을 얻는 기기의 정밀도에 크게 의존하는 단점이 있다. 더 나아가, 가장 정밀한 기기조차도 수 mm 이하의 종양은 검출이 불가능하여, 발병 초기 단계에서는 검출이 어려운 단점이 있다. 또한, 영상을 얻기 위해 환자 또는 질병 보유 가능자가 유전자의 돌연변이를 유발할 수 있는 고에너지의 전자기파에 노출되므로, 또 다른 질병을 야기할 수 있을 뿐만 아니라, 영상을 통한 진단 횟수에 제한이 있는 단점이 있다.
소화기 계통의 경우 통상적으로 내시경을 이용한 육안 영상 관찰을 통해 질병의 유무를 판단하나, 그 과정이 환자에게 무척 고통스러우며, 육안 영상 관찰을 통해 이상이 발견된 경우라 할지라도, 악성/양성 종양, 용종 등의 정확한 질병 판별을 위해서는 생체 조직 검사가 필수적으로 수행되어야 한다.
특히 CRC는 세계적으로 발병률이 3위 이내인 흔한 암이며, 치료의 가능성이 암의 진행 단계(stage)에 크게 좌우되는 암이다. 즉, 조기 진단을 통해 초기 단계에서 발견되는 경우 매우 높은 완치율을 가진다. 따라서, 무엇보다 정확한 조기 진단이 중요한 질병이나, 암이 진행됨에 따라 동반되는 이상 징후가 미미하여 대부분 출혈에 의한 분변의 색깔 변화로 병을 인지하는 것이 보통이며, 환자 또는 질병 보유 가능자가 검사를 받는다 하더라도 대장 내시경을 통한 관찰이 통상적이며, 정확한 질병 판별을 위해서는 생체 조직 검사가 필수적으로 수행되어야 한다. 요약하면, CRC의 경우 조기 진단이 중요하며, 대장 내시경 및 생체 조직 검사는 많은 시간, 비용, 불편, 고통 등을 수반하므로, 불필요한 대장 내시경 및 생체 조직 검사의 대상자 수를 획기적으로 줄일 수 있는 진단 방법이 필요하다.
따라서, 새로운 분자적 접근을 적용하여 초기 단계에서 CRC를 스크리닝할 수 있다면 환자들에게 매우 유용할 것이다. 유전체학(genomics), 단백질체학(proteomics) 및 분자병리학(molecular pathology)은 임상적으로 잠재적인 가치를 지닌 여러 바이오마커(biomarker) 후보들을 제공해 왔다. 암의 병기(stage) 및 환자별 맞춤 치료에 이들을 적극적으로 활용하는 것을 통해 치료 효과를 향상시킬 수 있을 것으로 사료되나, 임상 치료에 적용하기 위해서는 앞으로도 많은 연구가 선행되어야 한다.
근래의 CRC 스크리닝 검사는 대장 내시경을 사용하여 이상(gross abnormality) 여부를 판단하거나 분변에서 혈액을 탐지(fecal occult blood test, FOBT)하는 것을 통해 수행된다. 대장 내시경은 CRC 스크리닝 검사에서 표준적인 방법으로 활용되어 왔으나, 침습적이며, 수용 가능한 환자가 제한되어 있다. 따라서 최근에 많은 노력이 분변 검사에 집중되어 왔는데, 이는 비침습적이고, 장세척이 요구되지 않으며, 표본의 운반이 가능하기 때문이다. 분변 마커(marker)는 종양으로부터 새어 나오는 것, 분비되는 것, 또는 종양으로부터 박리되는 것으로 분류될 수 있다. 예를 들어 전통적인 FOBT에서 헤모글로빈(hemoglobin)은 CRC를 진단하기 위한 대규모 스크리닝 프로그램에서 새어 나오는 종류의 마커로 인식되어 왔으나, 이것을 포함하여 현재까지 알려진 마커들의 판별 능력은 만족스럽지 못하다.
한편, MALDI-TOF(matrix-assisted laser desorption/ionization-time of flight) 질량분석기(mass spectrometer)를 이용하면 혈액 내 질량 이온(mass ion)의 스펙트럼(spectrum)을 추출할 수 있다. 기존 단백질체 연구들에 이용된 질량 분석은 주로 800 내지 2500 m/z의 질량값 범위를 분석 대상으로 하였는데, 그 범위가 단백질이 트립신(trypsin)으로 잘려졌을 경우 펩타이드(peptide)의 질량값 영역이기 때문이다. 또한, MALDI-TOF 질량분석기를 이용하면 저질량 이온(low-mass ion)의 질량 스펙트럼도 추출할 수 있다. 그러나 약 800 m/z 이하의 저질량 대역은 분석 대상이 아닌 매트릭스(matrix)의 질량 이온들이 혼재하는 영역이기 때문에 그동안 이 영역에 대한 연구가 활발하지는 않았다.
추출된 저질량 이온의 질량 스펙트럼은 종래의 소프트웨어(software) 중 하나인 MarkerViewTM(버전 version 1.2, 이하 버전 생략)에 의해 분석될 수 있다. 본 발명자들은 CRC 환자군 및 정상 대조군(control, CONT)의 혈청(serum)으로부터 추출된 저질량 이온의 질량 스펙트럼을 MarkerViewTM를 이용하여 분석해 보았는데, 도 1을 참조하여 그 방법을 상세히 설명한다.
표 101의 CRC 환자군 133명과 표 102의 정상 대조군 153명으로 구성된 집합(Set A1)으로부터 수집한 혈청을 시료로 하여 MALDI-TOF 질량분석기를 이용하여 추출한 T2D 파일 형식의 저질량 이온 질량 스펙트럼을 MarkerViewTM로 임포트(import)하였다(A11).
표 101
CRC Sex Ageyear Stage Location Cell Type CEAng/mL
CRC-A1 M 77 I A-colon AC 1.8
CRC-A2 M 50 I Rectum AC 1.9
CRC-A3 F 47 I S-colon AC 0.7
CRC-A4 F 56 III S-colon AC 1.2
CRC-A5 F 82 I A-colon AC 1.1
CRC-A6 M 59 I Rectum AC 1.9
CRC-A7 M 73 I Rectum AC 3.6
CRC-A8 M 71 I S-colon AC 3.6
CRC-A9 M 50 I S-colon AC 2.5
CRC-A10 M 56 I S-colon AC 7.3
CRC-A11 M 61 I Rectum AC 7.7
CRC-A12 F 78 I Rectum AC 2.6
CRC-A13 M 64 I S-colon AC 1.8
CRC-A14 F 50 I Rectum AC 1.6
CRC-A15 F 59 I Rectum AC 1.6
CRC-A16 M 73 I Rectum AC 1.9
CRC-A17 M 65 I S-colon AC 14.0
CRC-A18 M 72 I S-colon AC 4.6
CRC-A19 M 82 I Rectum AC 3.2
CRC-A20 M 52 III S-colon AC 3.2
CRC-A21 F 59 III S-colon AC 1.7
CRC-A22 F 73 III S-colon AC 5.7
CRC-A23 M 70 III S-colon AC 3.6
CRC-A24 M 75 II A-colon AC 2.1
CRC-A25 F 81 II S-colon AC 4.1
CRC-A26 F 76 II Rectum AC 25.3
CRC-A27 F 71 II A-colon AC 1.6
CRC-A28 M 72 II A-colon AC 3.8
CRC-A29 F 82 II S-colon AC 1.8
CRC-A30 F 68 II D-colon AC 1.7
CRC-A31 M 71 II S-colon AC 3.6
CRC-A32 F 67 II A-colon AC 1.9
CRC-A33 M 45 II D-colon MAC 3.3
CRC-A34 M 60 II S-colon AC 2.8
CRC-A35 M 74 II S-colon AC 5.3
CRC-A36 M 57 II Rectum AC 7.3
CRC-A37 F 65 II S-colon AC 2.1
CRC-A38 M 77 II A-colon AC 1.5
CRC-A39 M 71 II D-colon AC 4.1
CRC-A40 F 66 II Rectum AC 4.3
CRC-A41 F 49 II A-colon AC 1.6
CRC-A42 F 79 II A-colon AC 2.9
CRC-A43 M 69 II S-colon AC 4.2
CRC-A44 M 66 II S-colon AC 12.0
CRC-A45 M 74 II A-colon AC 1.5
CRC-A46 M 69 II T-colon AC 1.2
CRC-A47 M 43 II S-colon AC 2.2
CRC-A48 F 67 II A-colon AC 1.4
CRC-A49 M 72 II A-colon AC 4.9
CRC-A50 F 67 II A-colon AC 7.3
CRC-A51 F 75 II Rectum AC 12.6
CRC-A52 M 68 II D-colon AC 4.7
CRC-A53 F 60 II S-colon AC 3.3
CRC-A54 M 74 II S-colon AC 9.0
CRC-A55 M 68 III A-colon AC 9.2
CRC-A56 F 55 III Rectum AC 2.1
CRC-A57 F 61 III A-colon AC 12.7
CRC-A58 M 59 III S-colon AC 2.7
CRC-A59 M 67 III Rectum AC 9.5
CRC-A60 M 48 III S-colon AC 1.3
CRC-A61 M 58 III Rectum AC 1.7
CRC-A62 F 50 III S-colon AC 4.8
CRC-A63 F 51 III S-colon AC 7.0
CRC-A64 F 74 III T-colon AC 2.5
CRC-A65 M 60 III Rectum AC 3.5
CRC-A66 M 52 III S-colon AC 2.5
CRC-A67 M 54 III A-colon AC 5.3
CRC-A68 M 82 III S-colon AC 2.4
CRC-A69 M 54 III S-colon AC 5.3
CRC-A70 F 79 III Rectum AC 14.1
CRC-A71 F 44 III S-colon AC 1.4
CRC-A72 M 66 III Rectum AC 1.2
CRC-A73 M 53 III A-colon AC 4.2
CRC-A74 M 64 III T-colon AC 1.8
CRC-A75 F 42 III S-colon AC 0.8
CRC-A76 M 49 III Rectum AC 2.7
CRC-A77 M 68 III Rectum AC 3.9
CRC-A78 M 51 III S-colon AC 5.2
CRC-A79 M 64 III Rectum AC 7.7
CRC-A80 M 42 III S-colon AC 2.8
CRC-A81 F 43 III A-colon AC 4.7
CRC-A82 M 66 III S-colon AC 9.1
CRC-A83 M 37 III Rectum AC 3.7
CRC-A84 F 81 III Rectum AC 8.4
CRC-A85 F 73 III S-colon AC 1.7
CRC-A86 M 54 III Rectum AC 6.4
CRC-A87 F 58 III Rectum AC 21.3
CRC-A88 F 42 III Rectum AC 0.7
CRC-A89 F 50 III D-colon AC 6.4
CRC-A90 M 56 III S-colon AC 7.3
CRC-A91 F 58 III S-colon AC 2.1
CRC-A92 F 70 IV Rectum AC 3.9
CRC-A93 M 68 IV Rectum AC 6.0
CRC-A94 M 53 IV Rectum AC 54.7
CRC-A95 F 63 IV D-colon AC 12.3
CRC-A96 F 63 IV A-colon AC 1.4
CRC-A97 M 63 II D-colon AC 4.9
CRC-A98 F 66 II S-colon AC 4.2
CRC-A99 M 48 II Rectum AC 28.4
CRC-A100 M 68 II S-colon AC 2.3
CRC-A101 M 48 II S-colon AC 4.8
CRC-A102 F 81 II S-colon AC 2.4
CRC-A103 M 56 II A-colon AC 34.6
CRC-A104 M 71 III Rectum AC 16.5
CRC-A105 M 66 III S-colon AC 689.8
CRC-A106 M 65 III D-colon AC 3.4
CRC-A107 F 65 III S-colon MAC 2.7
CRC-A108 F 51 III Rectum AC 1.4
CRC-A109 M 58 III S-colon AC 2.8
CRC-A110 F 48 III A-colon AC 0.9
CRC-A111 M 71 III S-colon AC 6.0
CRC-A112 M 68 III A-colon AC 2.7
CRC-A113 F 54 III A-colon AC 1.7
CRC-A114 M 66 IV S-colon AC 6.4
CRC-A115 F 72 IV A-colon AC 73.4
CRC-A116 F 69 IV A-colon AC 49.0
CRC-A117 M 75 IV S-colon AC 16.7
CRC-A118 F 49 III S-colon AC 1.0
CRC-A119 F 63 III A-colon AC 58.2
CRC-A120 M 74 III A-colon AC 2.8
CRC-A121 F 54 III T-colon AC 2.2
CRC-A122 M 68 III Rectum AC 22.5
CRC-A123 M 66 III Rectum MAC 1.2
CRC-A124 M 72 IV Rectum SC 8.2
CRC-A125 M 73 IV Rectum AC 52.2
CRC-A126 M 54 IV A-colon AC 2.0
CRC-A127 F 54 IV S-colon AC 29.8
CRC-A128 M 43 IV Rectum AC 36.4
CRC-A129 F 52 IV A-colon MAC 9.0
CRC-A130 M 48 IV S-colon AC 15.9
CRC-A131 M 62 IV Rectum AC 6.3
CRC-A132 M 77 I D-colon AC 6.4
CRC-A133 M 78 I Rectum AC 2.7
AC: Adenocarcinoma
CEA : Carcinoembryonic antigen
MAC: Mucinous adenocarcinoma
표 102
Control Sex Ageyear CEAng/mL Control Sex Ageyear CEAng/mL
CONT-A1 M 39 1.3 CONT-A78 F 64 2.9
CONT-A2 F 70 1.2 CONT-A79 F 52 1.9
CONT-A3 M 66 1.3 CONT-A80 F 37 2.1
CONT-A4 M 53 0.8 CONT-A81 F 49 2.6
CONT-A5 F 69 1.0 CONT-A82 F 48 1.5
CONT-A6 F 68 1.8 CONT-A83 F 30 <0.5
CONT-A7 M 35 1.7 CONT-A84 F 56 1.4
CONT-A8 M 62 3.7 CONT-A85 F 50 1.2
CONT-A9 M 62 1.1 CONT-A86 F 49 2.1
CONT-A10 M 48 5.3 CONT-A87 F 38 0.6
CONT-A11 M 48 1.8 CONT-A88 F 59 1.6
CONT-A12 M 66 1.6 CONT-A89 F 51 1.0
CONT-A13 M 66 1.4 CONT-A90 F 41 1.8
CONT-A14 M 66 4.2 CONT-A91 F 48 1.2
CONT-A15 M 54 1.4 CONT-A92 F 39 0.5
CONT-A16 M 54 1.0 CONT-A93 F 51 1.1
CONT-A17 M 62 2.0 CONT-A94 F 44 1.5
CONT-A18 F 45 0.7 CONT-A95 F 38 1.5
CONT-A19 M 39 3.2 CONT-A96 F 48 1.9
CONT-A20 M 67 1.8 CONT-A97 F 70 4.8
CONT-A21 M 63 5.5 CONT-A98 F 54 2.8
CONT-A22 M 48 2.8 CONT-A99 F 38 2.8
CONT-A23 M 66 3.2 CONT-A100 F 50 1.1
CONT-A24 M 55 5.0 CONT-A101 F 54 1.8
CONT-A25 M 55 1.0 CONT-A102 M 49 1.2
CONT-A26 M 62 7.0 CONT-A103 F 38 0.9
CONT-A27 F 57 1.2 CONT-A104 F 44 -
CONT-A28 M 61 0.9 CONT-A105 M 52 -
CONT-A29 M 50 1.9 CONT-A106 F 45 -
CONT-A30 M 46 1.5 CONT-A107 F 54 -
CONT-A31 M 51 4.0 CONT-A108 F 51 3.1
CONT-A32 F 68 1.8 CONT-A109 M 54 6.4
CONT-A33 F 68 1.4 CONT-A110 M 46 1.1
CONT-A34 M 64 1.7 CONT-A111 M 47 1.8
CONT-A35 M 30 0.7 CONT-A112 M 49 1.7
CONT-A36 F 52 2.1 CONT-A113 F 55 <0.5
CONT-A37 F 59 1.2 CONT-A114 M 36 0.7
CONT-A38 M 53 1.6 CONT-A115 M 59 0.8
CONT-A39 F 69 1.2 CONT-A116 M 46 3.7
CONT-A40 F 68 1.0 CONT-A117 F 46 <0.5
CONT-A41 F 65 3.1 CONT-A118 F 50 0.9
CONT-A42 M 31 1.2 CONT-A119 M 58 -
CONT-A43 F 59 0.7 CONT-A120 M 34 1.7
CONT-A44 M 43 1.4 CONT-A121 M 53 2.9
CONT-A45 M 66 2.3 CONT-A122 M 45 3.7
CONT-A46 M 48 4.2 CONT-A123 M 47 4.5
CONT-A47 F 41 2.1 CONT-A124 F 34 0.6
CONT-A48 F 65 3.8 CONT-A125 F 58 1.5
CONT-A49 F 67 1.5 CONT-A126 F 54 -
CONT-A50 F 45 0.6 CONT-A127 M 35 1.8
CONT-A51 M 30 1.0 CONT-A128 M 49 1.4
CONT-A52 M 55 1.2 CONT-A129 M 48 3.2
CONT-A53 M 54 2.1 CONT-A130 F 34 <0.5
CONT-A54 M 69 2.8 CONT-A131 M 45 4.4
CONT-A55 M 53 1.8 CONT-A132 F 45 0.8
CONT-A56 F 47 1.7 CONT-A133 M 52 -
CONT-A57 M 31 1.7 CONT-A134 F 44 -
CONT-A58 M 53 3.2 CONT-A135 F 46 -
CONT-A59 F 49 1.4 CONT-A136 M 58 -
CONT-A60 M 62 1.7 CONT-A137 M 45 4.3
CONT-A61 M 31 2.3 CONT-A138 M 61 1.4
CONT-A62 M 40 0.8 CONT-A139 M 42 2.7
CONT-A63 F 49 1.4 CONT-A140 M 48 3.0
CONT-A64 F 33 1.7 CONT-A141 M 53 1.9
CONT-A65 M 51 3.4 CONT-A142 F 54 2.3
CONT-A66 M 52 2.0 CONT-A143 F 39 1.3
CONT-A67 F 66 1.3 CONT-A144 F 55 1.3
CONT-A68 M 56 1.9 CONT-A145 M 53 -
CONT-A69 F 65 1.4 CONT-A146 F 46 -
CONT-A70 M 50 1.4 CONT-A147 F 45 -
CONT-A71 M 54 1.3 CONT-A148 F 63 -
CONT-A72 M 68 1.6 CONT-A149 F 51 -
CONT-A73 M 59 2.5 CONT-A150 M 51 -
CONT-A74 F 51 2.1 CONT-A151 F 52 -
CONT-A75 F 39 0.8 CONT-A152 F 52 -
CONT-A76 F 40 1.5 CONT-A153 F 70 -
CONT-A77 F 50 1.9
임포트 조건으로 표 103의 조건들을 사용하였다.
표 103
Mass tolerance 100 ppm
Minimum required response 10.0
Maximum number of peaks 10000
다음, 임포트한 피크 강도(peak intensity)들을 정규화(normalization)하였다(A12). MarkerViewTM에는 다수의 정규화 방법이 존재하는데, "Normalization Using Total Area Sums" 방법을 사용하여 정규화를 수행하였다. 이 방법에서는 각 시료별 강도의 소계를 구하고, 시료별 소계들의 평균을 구한 후, 각 시료별 강도의 소계가 이 평균과 일치하도록 각 피크 강도에 시료별 배율 인자(scaling factor)를 곱한다. 즉, 이와 같이 정규화한 후에는 각 시료별 강도의 소계가 동일해진다.
다음, 정규화한 피크 강도들을 파레토 스케일링(Pareto scaling)하였다(A13). 즉, 정규화한 각 피크 강도에서 질량 이온별 평균값을 뺀 후 표준편차의 제곱근으로 나누어 피크 강도들을 파레토 스케일링하였다.
다음, 파레토 스케일링한 피크 강도들에 대해 주성분 분석 기반 선형 판별 분석(principal component analysis-based linear discriminant analysis, PCA-DA)을 수행하여 판별 점수(discriminant score, DS)를 계산하였다(A14). 즉, 두 단계로 주성분 분석을 수행하여 각 질량 이온별 가중치(weighting factor)인 인자적재값(factor loading)을 구하고, 파레토 스케일링된 강도에 이 인자적재값을 곱한 후 그 결과 값을 모두 더하여 각 시료별 판별 점수를 계산하였다. 표 103의 임포트 조건에서 피크의 최대 개수를 10,000개로 하였고, 충분히 많은 시료들을 함께 임포트하였으므로, 본 계산에서 인자적재값은 10,000개가 계산되었으며, 따라서 10,000개의 항을 더하여 한 개의 판별 점수가 계산되었다.
다음, 계산된 판별 점수가 양수인지 여부를 판단하여(A15), 양수인 경우 양성으로(A16), 음수인 경우 음성으로 판정하였다(A17). 즉, CRC에 적용되어 양수인 경우 CRC 환자군으로, 음수인 경우 정상 대조군으로 판정하였다.
도 2는 이미 임상적으로 판정된 CRC 환자군 133명과 정상 대조군 153명으로 구성된 집합에 대해 도 1의 방법으로 계산한 판별 점수의 분포를 나타낸다. 도 2에 나타낸 판별 점수에 따른 판정 결과를 혼동 행렬(confusion matrix)을 이용하여 정리하면 표 104와 같다.
표 104
Sensitivity 98.50%
Set A1 True CRC True CONT Specificity 98.69%
Predicted CRC 131 2 PPV 98.50%
Predicted CONT 2 151 NPV 98.69%
도 2 및 표 104를 통하여 알 수 있는 바와 같이, 종래 기술인 MarkerViewTM의 주성분 분석 기반 선형 판별 분석 방법을 통하여 민감도(sensitivity), 특이도(specificity), 양성예측도(positive predictive value, PPV), 음성예측도(negative predictive value, NPV)가 모두 98% 이상인 매우 우수한 판별 결과를 얻을 수 있었다.
그러나 이를 임상에서 사용할 수 있으려면 우선 식의 강건성(robustness)이 반드시 검증되어야 한다. 즉, 이미 한 번 측정했고 판별식을 구성했던 집합에 대하여 추가적으로 수회 반복 측정한 질량 스펙트럼들에 대해서도 여전히 좋은 판별 결과를 나타내어야 하며, 판별식을 구성할 때 고려하지 않았던 새로운 CRC 환자군 및 정상 대조군에 대해서도 동일한 판별식으로 좋은 판별 결과를 얻을 수 있어야 한다. 질량 스펙트럼을 반복 측정하는 과정에는 혈청을 얼리고 녹이는 과정이 포함되거나, 혈청을 새로 메탄올(methanol)/클로로포름(chloroform)과 혼합하여 추출하는 과정이 포함되기도 한다. 이와 같은 과정들은 질량 스펙트럼에 대한 통계 분석에 있어서 외란들(disturbances)로 볼 수 있는데, 이러한 외란들에 둔감한 판별식을 구성해야만 임상에 적용될 수 있다.
요컨대, 도 1, 2 및 표 104를 참조하여 설명한 종래의 주성분 분석 기반 선형 판별 분석 방법은 특정 시료들로 구성된 집합에 개별적으로 적용되는 경우에는, 즉 개별 훈련 집합(training set)에 대한 판별에서는 매우 우수한 판별 결과를 나타내기도 하나, 검증 집합(validation set)에서의 판별 결과는 만족스럽지 않았다(표 124, 126 참조). 훈련 집합에 대해서는 매우 우수한 판별 결과를 보임에도 불구하고 판별식이 강건성을 갖지 못한 이유는 판별식을 구성하고 있는 10,000개의 질량 이온들 중 상당한 개수의 질량 이온들이 CRC 환자군과 정상 대조군의 판별을 위해서는 최소한 불필요하며, 때로는 훈련 집합의 판별에서는 문제를 일으키지 않았으나 검증 집합의 판별에서는 잠재적으로 판별 결과를 혼동시킬 수 있는 질량 이온들을 포함하고 있기 때문으로 추정된다. 따라서 이와 같이 최소한 불필요하며, 또는 잠재적으로 판별 결과에 혼동을 줄 수 있는 질량 이온들을 적극적으로 제거하는 과정을 통해 우수하며 강건한 판별 결과를 얻기 위해 필수 불가결한 질량 이온들만을 찾아내는 작업이 필요할 것으로 사료된다.
한편, BRC는 매해 발생률과 유병률에 있어서 여성암 중 갑상선암 다음으로 높은 증가율을 보이고 있다. BRC는 높은 발생률에 비해 생존율 역시 갑상선암 다음으로 높은데 그 이유로는 효과적인 약제의 개발 외에도 BRC에 대한 인식의 변화와 무엇보다도 조기 검진 방법인 유방촬영술(mammography)의 기여가 크다고 할 수 있다. BRC도 다른 암종과 마찬가지로 조기 발견 및 치료로 생존율을 높일 수 있다. 림프절 전이가 없는 작은 크기의 BRC의 경우에는 생존율이 90%까지도 보고가 되고 있으나 특히 BRC이 다른 부위로 전이가 된 상태에서 발견되었을 경우에는 생존율이 10% 정도로 낮아진다. BRC를 조기에 발견하기 위해서는 자가 검진 외에도 의사의 진찰과 영상의학적 유방 검사가 필수적인데, 유방촬영술의 민감도는 60-70%로 낮으며 특히 젊은 여성에서 많은 치밀 유방의 경우에는 진단율이 현격히 감소되는 단점이 있다. 이런 여성들의 경우 유방 초음파가 권고되나 유방 초음파는 검사자의 기술에 대한 의존도가 높다는 단점이 있고, 그 외에 유방 MRI(magnetic resonance imaging)가 진단에 사용되고 있으나 고가의 비용으로 인해 검진용으로는 사용하기 어려우며 이 또한, 위양성율(false positive rate)이 높다는 단점이 있다.
따라서 새로운 분자적 접근을 적용하여 초기 단계에서 BRC를 스크리닝할 수 있다면 환자들에게 매우 유용할 것이다. 유전체학(genomics), 단백질체학(proteomics) 및 분자병리학(molecular pathology)은 임상적으로 잠재적인 가치를 지닌 여러 바이오마커(biomarker) 후보들을 제공해 왔다. 암의 병기(stage) 및 환자별 맞춤 치료에 이들을 적극적으로 활용하는 것을 통해 치료 효과를 향상시킬 수 있을 것으로 사료되나, 임상 치료에 적용하기 위해서는 앞으로도 많은 연구가 선행되어야 한다.
한편, MALDI-TOF(matrix-assisted laser desorption/ionization-time of flight) 질량분석기(mass spectrometer)를 이용하면 혈액 내 질량 이온(mass ion)의 스펙트럼(spectrum)을 추출할 수 있다. 기존 단백질체 연구들에 이용된 질량 분석은 주로 800 내지 2500 m/z의 질량값 범위를 분석 대상으로 하였는데, 그 범위가 단백질이 트립신(trypsin)으로 잘려졌을 경우 펩타이드(peptide)의 질량값 영역이기 때문이다. 또한, MALDI-TOF 질량분석기를 이용하면 저질량 이온(low-mass ion)의 질량 스펙트럼도 추출할 수 있다. 그러나 약 800 m/z 이하의 저질량 대역은 분석 대상이 아닌 매트릭스(matrix)의 질량 이온들이 혼재하는 영역이기 때문에 그동안 이 영역에 대한 연구가 활발하지는 않았다.
추출된 저질량 이온의 질량 스펙트럼은 종래의 소프트웨어(software) 중 하나인 MarkerViewTM(버전 version 1.2, 이하 버전 생략)에 의해 분석될 수 있다. 본 발명자들은 BRC 환자군 및 정상 대조군(control, CONT)의 혈청(serum)으로부터 추출된 저질량 이온의 질량 스펙트럼을 MarkerViewTM를 이용하여 분석해 보았는데, 도 3을 참조하여 그 방법을 상세히 설명한다.
표 201의 BRC 환자군 54명과 표 202의 정상 대조군 49명으로 구성된 집합(Set C1)으로부터 수집한 혈청을 시료로 하여 MALDI-TOF 질량분석기를 이용하여 추출한 T2D 파일 형식의 저질량 이온 질량 스펙트럼을 MarkerViewTM로 임포트(import)하였다(B11).
표 201
BRC Sex Ageyear Node ER ER% PR PR% HER2 Tumor Size cm
BRC-C1 F 48 -a 5 33-66% 6 33-66% 2 -
BRC-C2 F 35 - 6 33-66% 6 33-66% 1 -
BRC-C3 F 45 pN1a 5 33-66% 5 33-66% 0 1.5
BRC-C4 F 61 - 0 0% 0 0% 2 -
BRC-C5 F 70 pN0(sn) 0 0% 0 0% 1 <0.1
BRC-C6 F 58 ypN0 3 <10% 3 10-33% 3 0.5
BRC-C7 F 49 ypN0(i+) 0 0% 0 0% 2 1.9
BRC-C8 F 49 ypN2a 0 0% 0 0% 1 2.5
BRC-C9 F 39 pN1a 6 33-66% 7 >66% 1 2.2
BRC-C10 F 48 ypN2a 6 33-66% 4 <10% 3 5.8
BRC-C11 F 39 - 0 0% 0 0% 1 -
BRC-C12 F 56 pN1a 6 33-66% 6 33-66% 0 2.8
BRC-C13 F 59 pN0(sn) 6 33-66% 2 <10% 1 2.3
BRC-C14 F 31 pN1a 5 33-66% 4 10-33% 1 2.2
BRC-C15 F 46 pN3a 6 33-66% 6 33-66% 1 3.5
BRC-C16 F 56 - 7 >66% 4 10-33% 1 -
BRC-C17 F 55 - 0 0% 0 0% 2 -
BRC-C18 F 46 pN0 0 0% 0 0% 0 1.5
BRC-C19 F 60 ypN0 0 0% 0 0% 3 1.9
BRC-C20 F 49 pN0(sn) 5 33-66% 2 <10% 2 1.5
BRC-C21 F 55 pN1mi 0 0% 0 0% 3 1.8
BRC-C22 F 65 pN0 6 33-66% 6 33-66% 0 1.7
BRC-C23 F 35 ypN2a 6 66% 4 10-33% 2 2.6
BRC-C24 F 46 pN1a 6 33-66% 6 33-66% 3 2.5
BRC-C25 F 45 pN0(sn) 6 33-66% 6 33-66% 1 0.8
BRC-C26 F 42 pN0(sn) 3 10-33% 6 33-66% 0 1
BRC-C27 F 58 pN0(sn) 6 33-66% 6 33-66% 1 1.5
BRC-C28 F 62 pN1a 0 0% 0 0% 2 2.2
BRC-C29 F 61 - 0 0% 0 0% 1 -
BRC-C30 F 60 - - - - - - -
BRC-C31 F 51 - - - - - - -
BRC-C32 F 42 pN0 7 >66% 7 >66% 2 -
BRC-C33 F 43 pN0(sn) 3 10-33% 4 10-33% 0 2.3
BRC-C34 F 60 pN0(sn) 0 0% 0 0% 1 2.3
BRC-C35 F 61 - 6 33-66% 0 0% 2 -
BRC-C36 F 61 pN0(sn) 0 0% 2 <10% 2 1.8
BRC-C37 F 49 - - - - - - -
BRC-C38 F 45 ypN0 0 0% 0 0% 0 0.9
BRC-C39 F 59 pN0 0 0% 0 0% 3 1.1
BRC-C40 F 43 pN1 0 0% 0 0% 0 1.5
BRC-C41 F 46 pN1 8 100% 8 100% 0 1.3
BRC-C42 F 48 pN0 6 50-60% 5 10-20% 3 1.3
BRC-C43 F 39 pN0 0 0% 0 0% 0 2.2
BRC-C44 F 66 pN0 8 95% 8 95% 0 1.7
BRC-C45 F 39 ypN0 0 0% 0 0% 0 DCIS
BRC-C46 F 37 pN0 7 70-80% 8 80% 3 1.5
BRC-C47 F 64 pN0 8 95% 8 95% 0 0.5
BRC-C48 F 44 ypN1 7 90% 8 95% 0 2
BRC-C49 F 50 pN2 8 95% 8 100% 0 1.1
BRC-C50 F 47 pN0 7 70% 7 50-60% 1 0.5
BRC-C51 F 44 pN1 8 90% 8 95% 1 0.6
BRC-C52 F 50 pN0 0 0% 0 0% 2 2.2
BRC-C53 F 53 pN0 7 95% 8 95% 0 1.1
BRC-C54 F 65 pN0 8 95% 7 40% 0 1.5
표 202
Control Sex Ageyear CEAng/mL
CONT-C1 F 70 1.2
CONT-C2 F 69 1
CONT-C3 F 68 1.8
CONT-C4 F 45 0.7
CONT-C5 F 57 1.2
CONT-C6 F 68 1.8
CONT-C7 F 68 1.4
CONT-C8 F 52 2.1
CONT-C9 F 59 1.2
CONT-C10 F 68 1
CONT-C11 F 65 3.1
CONT-C12 F 59 0.7
CONT-C13 F 41 2.1
CONT-C14 F 65 3.8
CONT-C15 F 67 1.5
CONT-C16 F 45 0.6
CONT-C17 F 47 1.7
CONT-C18 F 49 1.4
CONT-C19 F 49 1.4
CONT-C20 F 33 1.7
CONT-C21 F 66 1.3
CONT-C22 F 65 1.4
CONT-C23 F 51 2.1
CONT-C24 F 39 0.8
CONT-C25 F 66 1.6
CONT-C26 F 50 2.6
CONT-C27 F 53 2.6
CONT-C28 F 60 3.7
CONT-C29 F 66 1.1
CONT-C30 F 68 5.5
CONT-C31 F 56 1.3
CONT-C32 F 51 1.9
CONT-C33 F 51 1.6
CONT-C34 F 52 1.4
CONT-C35 F 56 1.7
CONT-C36 F 52 1.7
CONT-C37 F 60 1.8
CONT-C38 F 58 0.7
CONT-C39 F 58 3.1
CONT-C40 F 54 1.6
CONT-C41 F 60 1.1
CONT-C42 F 43 -
CONT-C43 F 40 -
CONT-C44 F 60 -
CONT-C45 F 46 -
CONT-C46 F 67 -
CONT-C47 F 49 -
CONT-C48 F 43 -
CONT-C49 F 57 -
CEA : Carcinoembryonic antigen
임포트 조건으로 표 203의 조건들을 사용하였다.
표 203
Mass tolerance 100 ppm
Minimum required response 10.0
Maximum number of peaks 10000
다음, 임포트한 피크 강도(peak intensity)들을 정규화(normalization)하였다(B12). MarkerViewTM에는 다수의 정규화 방법이 존재하는데, "Normalization Using Total Area Sums" 방법을 사용하여 정규화를 수행하였다. 이 방법에서는 각 시료별 강도의 소계를 구하고, 시료별 소계들의 평균을 구한 후, 각 시료별 강도의 소계가 이 평균과 일치하도록 각 피크 강도에 시료별 배율 인자(scaling factor)를 곱한다. 즉, 이와 같이 정규화한 후에는 각 시료별 강도의 소계가 동일해진다.
다음, 정규화한 피크 강도들을 파레토 스케일링(Pareto scaling)하였다(B13). 즉, 정규화한 각 피크 강도에서 질량 이온별 평균값을 뺀 후 표준편차의 제곱근으로 나누어 피크 강도들을 파레토 스케일링하였다.
다음, 파레토 스케일링한 피크 강도들에 대해 주성분 분석 기반 선형 판별 분석(principal component analysis-based linear discriminant analysis, PCA-DA)을 수행하여 판별 점수(discriminant score, DS)를 계산하였다(B14). 즉, 두 단계로 주성분 분석을 수행하여 각 질량 이온별 가중치(weighting factor)인 인자적재값(factor loading)을 구하고, 파레토 스케일링된 강도에 이 인자적재값을 곱한 후 그 결과 값을 모두 더하여 각 시료별 판별 점수를 계산하였다. 표 203의 임포트 조건에서 피크의 최대 개수를 10,000개로 하였고, 충분히 많은 시료들을 함께 임포트하였으므로, 본 계산에서 인자적재값은 10,000개가 계산되었으며, 따라서 10,000개의 항을 더하여 한 개의 판별 점수가 계산되었다.
다음, 계산된 판별 점수가 양수인지 여부를 판단하여(B15), 양수인 경우 양성으로(B16), 음수인 경우 음성으로 판정하였다(B17). 즉, BRC에 적용되어 양수인 경우 BRC 환자군으로, 음수인 경우 정상 대조군으로 판정하였다.
도 4는 이미 임상적으로 판정된 BRC 환자군 54명과 정상 대조군 49명으로 구성된 집합에 대해 도 3의 방법으로 계산한 판별 점수의 분포를 나타낸다. 도 4에 나타낸 판별 점수에 따른 판정 결과를 혼동 행렬(confusion matrix)을 이용하여 정리하면 표 204와 같다.
표 204
Sensitivity 100.0%
Set A1 True BRC True CONT Specificity 100.0%
Predicted BRC 54 0 PPV 100.0%
Predicted CONT 0 49 NPV 100.0%
도 4 및 표 204를 통하여 알 수 있는 바와 같이, 종래 기술인 MarkerViewTM의 주성분 분석 기반 선형 판별 분석 방법을 통하여 민감도(sensitivity), 특이도(specificity), 양성예측도(positive predicitive value, PPV) 및 음성예측도(negative predicitive value, NPV)가 모두 100%인 완벽한 판별 결과를 얻을 수 있었다.
그러나 이를 임상에서 사용할 수 있으려면 우선 식의 강건성(robustness)이 반드시 검증되어야 한다. 즉, 이미 한 번 측정했고 판별식을 구성했던 집합에 대하여 추가적으로 수회 반복 측정한 질량 스펙트럼들에 대해서도 여전히 좋은 판별 결과를 나타내어야 하며, 판별식을 구성할 때 고려하지 않았던 새로운 BRC 환자군 및 정상 대조군에 대해서도 동일한 판별식으로 좋은 판별 결과를 얻을 수 있어야 한다. 질량 스펙트럼을 반복 측정하는 과정에는 혈청을 얼리고 녹이는 과정이 포함되거나, 혈청을 새로 메탄올(methanol)/클로로포름(chloroform)과 혼합하여 추출하는 과정이 포함되기도 한다. 이와 같은 과정들은 질량 스펙트럼에 대한 통계 분석에 있어서 외란들(disturbances)로 볼 수 있는데, 이러한 외란들에 둔감한 판별식을 구성해야만 임상에 적용될 수 있다.
요컨대, 도 3, 4 및 표 204를 참조하여 설명한 종래의 주성분 분석 기반 선형 판별 분석 방법은 특정 시료들로 구성된 집합에 개별적으로 적용되는 경우에는, 즉 개별 훈련 집합(training set)에 대한 판별에서는 매우 우수한 판별 결과를 나타내기도 하나, 검증 집합(validation set)에서의 판별 결과는 만족스럽지 않았다(표 224, 226 참조). 훈련 집합에 대해서는 매우 우수한 판별 결과를 보임에도 불구하고 판별식이 강건성을 갖지 못한 이유는 판별식을 구성하고 있는 10,000개의 질량 이온들 중 상당한 개수의 질량 이온들이 BRC 환자군과 정상 대조군의 판별을 위해서는 최소한 불필요하며, 때로는 훈련 집합의 판별에서는 문제를 일으키지 않았으나 검증 집합의 판별에서는 잠재적으로 판별 결과를 혼동시킬 수 있는 질량 이온들을 포함하고 있기 때문으로 추정된다. 따라서 이와 같이 최소한 불필요하며, 또는 잠재적으로 판별 결과에 혼동을 줄 수 있는 질량 이온들을 적극적으로 제거하는 과정을 통해 우수하며 강건한 판별 결과를 얻기 위해 필수 불가결한 질량 이온들만을 찾아내는 작업이 필요할 것으로 사료된다.
한편, GC는 국내에서 가장 많이 발생하는 암(18.3%)이며 남성에서는 1위 여성에서는 BRC, 갑상선암에 이어 세 번째로 발생 빈도가 높다(주요 암종 발생분율, 2003년-2005년, 통계청). 일반인들을 대상으로 한 내시경 검진과 일반인들의 인식 변화로 인해 조기에 발견되는 빈도가 점차 증가하고 있으나 아직도 암 관련 사망률에 있어서는 폐암, 간암 다음으로 높은 빈도(22%)를 차지하고 있다(2006년 사망원인통계연보, 통계청).
수술적 치료가 완치에 근간이 되는 치료법이며 최근에 조기 GC의 빈도는 약 50%인데 조기 GC의 완치율은 90%를 상회하고 있지만 전이성 혹은 재발성 GC의 경우는 조기 GC과 달리 예후가 극히 불량하여 중앙 생존 기간(median survival time)이 1년을 넘지 못하고 5년 생존율에 있어서도 5% 미만의 결과를 나타내고 있다.
고식적 항암 화학 요법(palliative chemotherapy)은 최적의 지지 요법(best supportive care)과 비교한 제 3 상 연구에서 생존 기간의 연장뿐 아니라 삶의 질 향상에도 효과가 있다는 연구 결과들로부터 전이성 혹은 재발성 GC의 표준 치료법이라 할 수 있다.
1990년 이후 5-fluorouracil(5-FU)과 Platinum 제제의 치료는 현재까지도 가장 널리 사용되고 있는 전이성 GC 치료제이며, 신약의 개발로 효과를 높이고 부작용을 최소화하기 위한 다양한 조합의 임상 연구에 irinotecan, oxaliplatin, paclitaxel, docetaxel, capecitabine 등이 시도되고 있다. 5-FU를 근간으로 하는 항암 화학 요법에 비해 월등히 뛰어난 성과를 보여주는 연구는 아직까지 보고되고 있지 않다. ECF(epirubicin, cisplatin and 5-fluorouracil)는 효과는 뛰어나나 높은 독성의 부작용을 동반한다.
최근 이러한 한계를 극복하고자 여러 연구들이 다양한 방법으로 진행되고 있으며, 생체 표지자 발견을 위한 노력은 이에 근간이 된다. 생체 표지자는 암의 조기 진단에 사용될 수 있을 뿐 아니라 전이성 암종의 치료에 있어 목표가 되는 타깃으로 사용될 수 있다. 기존 항암제와 더불어 표적 치료제의 사용은 CRC, 폐암, BRC, 췌장암 등에서 효과를 나타내고 있으며 GC에 있어서도 많은 개발과 연구가 필요하다고 할 수 있다.
따라서 새로운 분자적 접근을 적용하여 초기 단계에서 GC를 스크리닝할 수 있다면 환자들에게 매우 유용할 것이다. 유전체학(genomics), 단백질체학(proteomics) 및 분자병리학(molecular pathology)은 임상적으로 잠재적인 가치를 지닌 여러 바이오마커(biomarker) 후보들을 제공해 왔다. 암의 병기(stage) 및 환자별 맞춤 치료에 이들을 적극적으로 활용하는 것을 통해 치료 효과를 향상시킬 수 있을 것으로 사료되나, 임상 치료에 적용하기 위해서는 앞으로도 많은 연구가 선행되어야 한다.
한편, MALDI-TOF(matrix-assisted laser desorption/ionization-time of flight) 질량분석기(mass spectrometer)를 이용하면 혈액 내 질량 이온(mass ion)의 스펙트럼(spectrum)을 추출할 수 있다. 기존 단백질체 연구들에 이용된 질량 분석은 주로 800 내지 2500 m/z의 질량값 범위를 분석 대상으로 하였는데, 그 범위가 단백질이 트립신(trypsin)으로 잘려졌을 경우 펩타이드(peptide)의 질량값 영역이기 때문이다. 또한, MALDI-TOF 질량분석기를 이용하면 저질량 이온(low-mass ion)의 질량 스펙트럼도 추출할 수 있다. 그러나 약 800 m/z 이하의 저질량 대역은 분석 대상이 아닌 매트릭스(matrix)의 질량 이온들이 혼재하는 영역이기 때문에 그동안 이 영역에 대한 연구가 활발하지는 않았다.
추출된 저질량 이온의 질량 스펙트럼은 종래의 소프트웨어(software) 중 하나인 MarkerViewTM(버전 version 1.2, 이하 버전 생략)에 의해 분석될 수 있다. 본 발명자들은 GC 환자군 및 정상 대조군(control, CONT)의 혈청(serum)으로부터 추출된 저질량 이온의 질량 스펙트럼을 MarkerViewTM를 이용하여 분석해 보았는데, 도 5를 참조하여 그 방법을 상세히 설명한다.
표 301의 GC 환자군 49명과 표 302의 정상 대조군 84명으로 구성된 집합(Set E1)으로부터 수집한 혈청을 시료로 하여 MALDI-TOF 질량분석기를 이용하여 추출한 T2D 파일 형식의 저질량 이온 질량 스펙트럼을 MarkerViewTM로 임포트(import)하였다(C11).
표 301
GC Sex Ageyear CEAng/mL Stage GC Sex Ageyear CEAng/mL Stage
GC-E1 M 62 5.41 I GC-E26 M 64 - III
GC-E2 M 58 - I GC-E27 M 53 - III
GC-E3 M 62 1.34 I GC-E28 M 61 - III
GC-E4 M 48 - I GC-E29 F 52 3.36 IV
GC-E5 M 51 - I GC-E30 M 65 0.99 IV
GC-E6 M 44 - I GC-E31 M 41 -a IV
GC-E7 F 44 - I GC-E32 M 78 4.93 IV
GC-E8 M 61 - I GC-E33 M 79 1.11 IV
GC-E9 M 76 - I GC-E34 M 76 2.37 IV
GC-E10 M 51 - I GC-E35 M 54 117.13 IV
GC-E11 F 60 1.2 II GC-E36 M 58 2.24 IV
GC-E12 M 73 - II GC-E37 M 67 >1500 IV
GC-E13 F 57 - II GC-E38 F 71 1.92 IV
GC-E14 M 78 - II GC-E39 M 34 3.57 IV
GC-E15 M 75 - II GC-E40 M 69 1.39 IV
GC-E16 F 67 - II GC-E41 M 49 1.67 IV
GC-E17 M 50 - II GC-E42 F 34 13.44 IV
GC-E18 F 60 - II GC-E43 M 50 - IV
GC-E19 F 47 - II GC-E44 M 55 - IV
GC-E20 F 62 8.3 III GC-E45 M 66 - IV
GC-E21 M 64 - III GC-E46 F 40 - IV
GC-E22 M 58 6.89 III GC-E47 M 61 - IV
GC-E23 F 47 2.86 III GC-E48 M 70 - IV
GC-E24 F 55 - III GC-E49 M 39 - IV
GC-E25 F 46 - III
CEA : Carcinoembryonic antigen
표 302
Control Sex Ageyear CEAng/mL Control Sex Ageyear CEAng/mL
CONT-E1 M 39 1.3 CONT-E43 M 48 4.2
CONT-E2 F 70 1.2 CONT-E44 F 41 2.1
CONT-E3 M 66 1.3 CONT-E45 F 65 3.8
CONT-E4 M 53 0.8 CONT-E46 M 64 2.4
CONT-E5 F 69 1 CONT-E47 M 53 3.3
CONT-E6 F 68 1.8 CONT-E48 M 63 0.9
CONT-E7 M 35 1.7 CONT-E49 M 57 1.5
CONT-E8 M 62 3.7 CONT-E50 F 66 1.6
CONT-E9 M 62 1.1 CONT-E51 M 60 1.5
CONT-E10 M 48 5.3 CONT-E52 M 57 2.2
CONT-E11 M 48 1.8 CONT-E53 M 53 1.9
CONT-E12 M 66 1.6 CONT-E54 M 60 0.8
CONT-E13 M 66 1.4 CONT-E55 F 50 2.6
CONT-E14 M 66 4.2 CONT-E56 F 53 2.6
CONT-E15 M 54 1.4 CONT-E57 M 64 1.5
CONT-E16 M 54 1 CONT-E58 F 60 3.7
CONT-E17 M 62 2 CONT-E59 M 58 1.2
CONT-E18 F 45 0.7 CONT-E60 F 66 1.1
CONT-E19 M 39 3.2 CONT-E61 M 57 2.9
CONT-E20 M 67 1.8 CONT-E62 F 68 5.5
CONT-E21 M 63 5.5 CONT-E63 M 56 1.7
CONT-E22 M 48 2.8 CONT-E64 M 51 3.4
CONT-E23 M 55 5 CONT-E65 F 56 1.3
CONT-E24 M 55 1 CONT-E66 M 57 1.5
CONT-E25 M 62 7 CONT-E67 M 61 4.2
CONT-E26 F 57 1.2 CONT-E68 F 51 1.9
CONT-E27 M 61 0.9 CONT-E69 F 51 1.6
CONT-E28 M 50 1.9 CONT-E70 F 52 1.4
CONT-E29 M 46 1.5 CONT-E71 F 56 1.7
CONT-E30 M 51 4 CONT-E72 F 52 1.7
CONT-E31 F 68 1.8 CONT-E73 M 63 1
CONT-E32 F 68 1.4 CONT-E74 F 60 1.8
CONT-E33 M 64 1.7 CONT-E75 F 58 0.7
CONT-E34 F 52 2.1 CONT-E76 M 65 4.1
CONT-E35 F 59 1.2 CONT-E77 M 52 2.2
CONT-E36 M 53 1.6 CONT-E78 M 50 -a
CONT-E37 F 68 1 CONT-E79 F 72 -
CONT-E38 F 65 3.1 CONT-E80 F 57 -
CONT-E39 M 31 1.2 CONT-E81 M 50 -
CONT-E40 F 59 0.7 CONT-E82 F 70 -
CONT-E41 M 43 1.4 CONT-E83 F 42 -
CONT-E42 M 66 2.3 CONT-E84 F 51 -
임포트 조건으로 표 303의 조건들을 사용하였다.
표 303
Mass tolerance 100 ppm
Minimum required response 10.0
Maximum number of peaks 10000
다음, 임포트한 피크 강도(peak intensity)들을 정규화(nomalization)하였다(C12). MarkerViewTM에는 다수의 정규화 방법이 존재하는데, "Normalization Using Total Area Sums" 방법을 사용하여 정규화를 수행하였다. 이 방법에서는 각 시료별 강도의 소계를 구하고, 시료별 소계들의 평균을 구한 후, 각 시료별 강도의 소계가 이 평균과 일치하도록 각 피크 강도에 시료별 배율 인자(scaling factor)를 곱한다. 즉, 이와 같이 정규화한 후에는 각 시료별 강도의 소계가 동일해진다.
다음, 정규화한 피크 강도들을 파레토 스케일링(Pareto scaling)하였다(C13). 즉, 정규화한 각 피크 강도에서 질량 이온별 평균값을 뺀 후 표준편차의 제곱근으로 나누어 피크 강도들을 파레토 스케일링하였다.
다음, 파레토 스케일링한 피크 강도들에 대해 주성분 분석 기반 선형 판별 분석(principal component analysis-based linear discriminant analysis, PCA-DA)을 수행하여 판별 점수(discriminant score, DS)를 계산하였다(C14). 즉, 두 단계로 주성분 분석을 수행하여 각 질량 이온별 가중치(weighting factor)인 인자적재값(factor loading)을 구하고, 파레토 스케일링된 강도에 이 인자적재값을 곱한 후 더하여 각 시료별 판별 점수를 계산하였다. 표 303의 임포트 조건에서 피크의 최대 개수를 10,000개로 하였고, 충분히 많은 시료들을 함께 임포트하였으므로, 본 계산에서 인자적재값은 10,000개가 계산되었으며, 따라서 10,000개의 항을 더하여 한 개의 판별 점수가 계산되었다.
다음, 계산된 판별 점수가 양수인지 여부를 판단하여(C15), 양수인 경우 양성으로(C16), 음수인 경우 음성으로 판정하였다(C17). 즉, GC에 적용되어 양수인 경우 GC 환자군으로, 음수인 경우 정상 대조군으로 판정하였다.
도 6은 이미 임상적으로 판정된 GC 환자군 49명과 정상 대조군 84명으로 구성된 집합에 대해 도 5의 방법으로 계산한 판별 점수의 분포를 나타낸다. 도 6에 나타낸 판별 점수에 따른 판정 결과를 혼동 행렬(confusion matrix)을 이용하여 정리하면 표 304와 같다.
표 304
Sensitivity 97.96%
Set E1 True GC True CONT Specificity 100.0%
Predicted GC 48 0 PPV 100.0%
Predicted CONT 1 84 NPV 98.82%
도 6 및 표 304를 통하여 알 수 있는 바와 같이, 종래 기술인 MarkerViewTM의 주성분 분석 기반 선형 판별 분석 방법을 통하여 민감도(sensitivity), 특이도(specificity), 양성예측도(positive predictive value, PPV) 및 음성예측도(negative predictive value, NPV)가 모두 97% 이상인 매우 우수한 판별 결과를 얻을 수 있었다.
그러나 이를 임상에서 사용할 수 있으려면 우선 식의 강건성(robustness)이 반드시 검증되어야 한다. 즉, 이미 한 번 측정했고 판별식을 구성했던 집합에 대하여 추가적으로 수회 반복 측정한 질량 스펙트럼들에 대해서도 여전히 좋은 판별 결과를 나타내어야 하며, 판별식을 구성할 때 고려하지 않았던 새로운 GC 환자군 및 정상 대조군에 대해서도 동일한 판별식으로 좋은 판별 결과를 얻을 수 있어야 한다. 질량 스펙트럼을 반복 측정하는 과정에는 혈청을 얼리고 녹이는 과정이 포함되거나, 혈청을 새로 메탄올(methanol)/클로로포름(chloroform)과 혼합하여 추출하는 과정이 포함되기도 한다. 이와 같은 과정들은 질량 스펙트럼에 대한 통계 분석에 있어서 외란들(disturbances)로 볼 수 있는데, 이러한 외란들에 둔감한 판별식을 구성해야만 임상에 적용될 수 있다.
요컨대, 도 5, 6 및 표 304를 참조하여 설명한 종래의 주성분 분석 기반 선형 판별 분석 방법은 특정 시료들로 구성된 집합에 개별적으로 적용되는 경우에는, 즉 개별 훈련 집합(traning set)에 대한 판별에서는 매우 우수한 판별 결과를 나타내기도 하나, 검증 집합(validation set)에서의 판별 결과는 만족스럽지 않았다(표 329, 331 참조). 훈련 집합에 대해서는 매우 우수한 판별 결과를 보임에도 불구하고 판별식이 강건성을 갖지 못한 이유는 판별식을 구성하고 있는 10,000개의 질량 이온들 중 상당한 개수의 질량 이온들이 GC 환자군과 정상 대조군의 판별을 위해서는 최소한 불필요하며, 때로는 훈련 집합의 판별에서는 문제를 일으키지 않았으나 검증 집합의 판별에서는 잠재적으로 판별 결과를 혼동시킬 수 있는 질량 이온들을 포함하고 있기 때문으로 추정된다. 따라서 이와 같이 최소한 불필요하며, 또는 잠재적으로 판별 결과에 혼동을 줄 수 있는 질량 이온들을 적극적으로 제거하는 과정을 통해 우수하며 강건한 판별 결과를 얻기 위해 필수 불가결한 질량 이온들만을 찾아내는 작업이 필요할 것으로 사료된다.
본 발명은, 생물학적 시료로부터 추출한 저질량 이온에 대해 생물통계학적 분석을 통하여 암을 진단하기 위한 저질량 이온 질량 스펙트럼을 확인하고, 이 저질량 이온 질량 스펙트럼을 이용하여 암을 진단할 수 있는 암 진단 장치를 제공한다.
본 발명은, CRC 환자 및 비환자 시료에 대해 강건한 판별 결과를 주는 판별식을 제안하고자, 판별식을 도출하였던 CRC 환자 및 비환자 집합에 대해 추가로 수회 반복 측정한 질량 스펙트럼과 새로운 CRC 환자 및 비환자 집합에 대해 수회 반복 측정한 질량 스펙트럼 모두에 대해 85% 이상의 민감도, 특이도, 양성예측도, 음성예측도를 나타내는 판별식을 제안하고, 이를 구성하는 저질량 이온들을 확인하여 CRC를 진단할 수 있는 암 진단 장치를 제공한다.
본 발명은, BRC 환자 및 비환자 시료에 대해 강건한 판별 결과를 주는 판별식을 제안하고자, 판별식을 도출하였던 BRC 환자 및 비환자 집합에 대해 추가로 수회 반복 측정한 질량 스펙트럼과 새로운 BRC 환자 및 비환자 집합에 대해 수회 반복 측정한 질량 스펙트럼 모두에 대해 85% 이상의 민감도, 특이도, 양성예측도, 음성예측도를 나타내는 판별식을 제안하고, 이를 구성하는 저질량 이온들을 확인하여 BRC를 진단할 수 있는 암 진단 장치를 제공한다.
본 발명은, GC 환자 및 비환자 시료에 대해 강건한 판별 결과를 주는 판별식을 제안하고자, 판별식을 도출하였던 GC 환자 및 비환자 집합에 대해 추가로 수회 반복 측정한 질량 스펙트럼과 새로운 GC 환자 및 비환자 집합에 대해 수회 반복 측정한 질량 스펙트럼 모두에 대해 약 80~90% 이상의 민감도, 특이도, 양성예측도, 음성예측도를 나타내는 판별식을 제안하고, 이를 구성하는 저질량 이온들을 확인하여 GC를 진단할 수 있는 암 진단 장치를 제공한다.
전술한 과제를 해결하기 위한 본 발명에 따른 암 진단 장치는, 다수의 암 환자 및 비환자 케이스들의 생물학적 시료로부터 저질량 이온(low-mass ion)의 질량 스펙트럼을 검출하는 저질량 이온 검출부; 상기 저질량 이온의 질량 스펙트럼 패턴을 비교 분석하여 암 진단 정보를 판정하는 암 진단부; 및 상기 암 진단부로부터 판정된 암 진단 정보를 출력 가능한 형태로 변환하여 표시하는 디스플레이부를 포함한다.
상기 저질량 이온 검출부는; 상기 생물학적 시료로부터 저질량 이온의 피크 강도(peak intensity)를 검출하여 상기 저질량 이온의 질량 스펙트럼을 추출할 수 있다.
상기 저질량 이온 검출부는; 질량분석기를 포함할 수 있다.
상기 암 진단부는; 훈련 후보 집합인 상기 암 환자 및 비환자 케이스들의 저질량 이온 질량 스펙트럼들을 정렬하는 제1정렬수단; 정렬된 상기 질량 스펙트럼에 대해 생물통계학적 분석을 수행하여 판별 점수를 계산하는 제1판별점수 계산수단; 상기 판별 점수에 따라 민감도(sensitivity) 및 특이도(specificity)를 계산하고, 이를 기준으로 제1훈련집합을 선정하여 저질량 이온별 인자적재값(factor loading)을 계산하는 인자적재값 계산수단; 후보 조건을 만족하는 후보 저질량 이온들 중 판별 성능을 기반으로 하여 암 진단용 저질량 이온들을 선택하는 암진단용이온 선정수단; 판별 대상 생물학적 시료의 저질량 이온 질량 스펙트럼을 상기 제1훈련집합에 정렬하는 제2정렬수단; 상기 판별 대상의 저질량 이온의 피크 강도와 상기 인자적재값으로부터 판별 점수를 계산하는 제2판별점수 계산수단; 및 상기 판별 점수에 따라 상기 판별 대상을 암의 양성 또는 음성으로 판정하는 암 판정수단을 포함할 수 있다.
상기 제1판별점수 계산수단은; 상기 훈련 후보 집합의 상기 저질량 이온 질량 스펙트럼들의 상기 피크 강도들을 정규화(normalization)하는 정규화 모듈; 상기 정규화한 피크 강도들을 스케일링(scaling)하는 스케일링 모듈; 및 상기 스케일링된 피크 강도들에 대해 상기 생물통계학적 분석을 수행하여 상기 판별 점수를 계산하는 판별점수계산 모듈을 포함할 수 있다.
상기 스케일링 모듈은; 파레토 스케일링(Pareto scaling)을 수행하는 것이 바람직하다.
상기 판별점수계산 모듈은; 주성분 분석 기반 선형 판별 분석(principal component analysis-based linear discriminant analysis, PCA-DA)을 사용하여 상기 생물통계학적 분석을 수행할 수 있다.
상기 판별점수계산 모듈은; 상기 주성분 분석 기반 선형 판별 분석에 의해 획득된 인자적재값과 상기 스케일링된 피크 강도를 함께 사용하여 상기 판별 점수를 계산할 수 있다.
상기 인자적재값 계산수단은; 상기 정렬된 질량 스펙트럼에 대해 생물통계학적 분석을 수행하고, 상기 생물통계학적 분석 결과를 기초로 상기 암 환자 및 비환자 케이스들 중 훈련 조건을 만족하는 훈련 케이스들을 제1훈련집합으로 선택하는 제1훈련집합 선택수단을 포함하며, 상기 제1훈련집합으로부터 인자적재값을 계산할 수 있다.
상기 제1훈련집합 선택수단은; 상기 생물통계학적 분석 결과에 따른 민감도가 문턱값(threshold) N1 이상이고, 특이도가 문턱값 N2 이상일 때의 암 환자 및 비환자 케이스들을 상기 제1훈련집합으로 설정할 수 있다. 상기 문턱값 N1과 N2는 1인 것이 바람직하다.
상기 제2판별점수 계산수단은; 상기 판별 대상의 상기 저질량 이온 질량 스펙트럼의 상기 피크 강도들을 정규화하는 정규화 모듈; 상기 정규화한 피크 강도들을 스케일링하는 스케일링 모듈; 및 상기 스케일링된 피크 강도와 상기 인자적재값을 통해 상기 판별 점수를 계산하는 판별점수계산 모듈을 포함할 수 있다.
상기 스케일링 모듈은; 파레토 스케일링을 수행하는 것이 바람직하다.
상기 판별점수계산 모듈은; 상기 암 진단용 저질량 이온들의 상기 스케일링된 피크 강도와 상기 인자적재값을 통해 상기 판별 점수를 계산할 수 있다.
상기 암 판정수단은; 상기 판별 점수에 따라 상기 판별 대상을 암의 양성 또는 음성으로 판정하되, 상기 판별 점수가 기준값 S보다 크면 양성으로 상기 판별 대상의 암 정보를 판단하고, 상기 판별 점수가 기준값 S보다 작으면 음성으로 상기 판별 대상의 암 정보를 판단할 수 있다. 상기 기준값 S는 0인 것이 바람직하다.
상기 암 판정수단은; 상기 판별 대상의 생물학적 시료를 반복적으로 측정하여 검출한 다수의 상기 저질량 이온 질량 스펙트럼에 대해 계산된 다수의 상기 판별 점수의 평균값으로 상기 판별 대상의 상기 암 정보를 판단할 수 있다.
상기 암진단용이온 선정수단은; 상기 선택된 상기 제1훈련집합으로부터 후보 조건을 만족하는 후보 저질량 이온들을 후보이온집합으로 선택하는 후보이온집합 선택수단; 및 상기 선택된 상기 후보이온집합의 상기 후보 저질량 이온의 개별 또는 조합별 판별 성능을 기반으로 하여 암 진단용 저질량 이온들을 최종이온집합으로 선택하는 최종이온집합 선택수단을 포함할 수 있다.
상기 후보이온집합 선택수단은; 상기 훈련 케이스 각각에 대한 상기 저질량 이온의 상기 피크 강도와, 상기 생물통계학적 분석을 통해 획득된 상기 저질량 이온별 인자적재값의 곱의 절댓값이 문턱값 T1보다 큰 제1저질량 이온들을 상기 훈련 케이스별로 선택하는 제1저질량이온 선택모듈을 포함할 수 있다. 상기 문턱값 T1은 0.1인 것이 바람직하다.
상기 후보이온집합 선택수단은; 상기 제1저질량 이온들 중 상기 훈련 케이스들 전체의 문턱값 T2 퍼센트 이상의 케이스들에서 공통으로 나타나는 제2저질량 이온들을 상기 후보이온집합으로 선택하는 후보이온집합 예비선택모듈을 포함할 수 있다. 상기 문턱값 T2는 50인 것이 바람직하다.
상기 후보이온집합 선택수단은; 상기 제2저질량 이온들을 이용해 상기 훈련 케이스별로 암에 대한 양성 또는 음성을 나타내는 판별 점수를 계산하고, 상기 판별 점수에 따른 민감도 및 특이도를 계산하는 민감도 및 특이도 계산모듈; 및 상기 민감도가 문턱값 N3보다 작거나, 상기 특이도가 문턱값 N4보다 작은 경우 상기 T1 및 상기 T2 중 적어도 하나를 변경하고, 상기 과정을 반복하여 상기 후보이온집합으로 선택하는 후보이온집합 최종선택모듈을 더 포함할 수 있다. 상기 문턱값 N3 및 N4는 0.9인 것이 바람직하다.
상기 최종이온집합 선택수단의 상기 판별 성능의 기준은; 상기 후보 저질량 이온 중 민감도와 특이도의 합이 기준값보다 큰 이온들을 선택하거나 상기 후보 저질량 이온들로 구성되는 조합별 민감도와 특이도의 합이 비교 대상 조합들 중 가장 큰 조합을 선택하는 제1기준을 포함할 수 있다.
상기 최종이온집합 선택수단의 상기 판별 성능의 기준은; 상기 후보 저질량 이온들의 조합들 중 상기 후보 저질량 이온들의 개수가 비교 대상 조합들 중 가장 적은 조합을 선택하는 제2기준을 더 포함할 수 있다.
상기 최종이온집합 선택수단의 상기 판별 성능의 기준은; 상기 후보 저질량 이온들의 조합들 중 진양성(true positive) 케이스의 최소 판별 점수와 진음성(ture negative) 케이스의 최대 판별 점수의 차가 비교 대상 조합들 중 가장 큰 조합을 선택하는 제3기준을 더 포함하며, 상기 판별 점수는 상기 후보 저질량 이온들의 상기 스케일링된 피크 강도와 상기 인자적재값을 통해 계산되며, 암에 대한 양성 또는 음성을 나타내는 것이 바람직하다.
상기 최종이온집합 선택수단은; 상기 후보이온집합에 포함된 상기 후보 저질량 이온들을 상기 민감도가 상기 특이도보다 높은 고민감도 저질량 이온들을 포함하며 상기 고민감도 저질량 이온들을 상기 민감도와 상기 특이도의 합의 내림차순으로 정렬한 고민감도 집합{Sns1, Sns2, Sns3 … SnsI}과, 상기 특이도가 상기 민감도보다 높은 고특이도 저질량 이온들을 포함하며 상기 고특이도 저질량 이온들을 상기 민감도와 상기 특이도의 합의 내림차순으로 정렬한 고특이도 집합{Spc1, Spc2, Spc3 … SpcJ}으로 구분하는 이온 구분모듈; 상기 고민감도 집합에서 상위 L개의 상기 고민감도 저질량 이온들{Sns1, Sns2, Sns3 … SnsL}과 상기 고특이도 집합에서 상위 L개의 상기 고특이도 저질량 이온들{Spc1, Spc2, Spc3 … SpcL} 중 2개 이상의 저질량 이온들로 구성되는 후보 조합들 중 상기 제1기준, 상기 제2기준 및 상기 제3기준 중 적어도 하나 이상에 의한 상기 판별 성능의 기준에 의해 선택된 조합을 바이오마커 그룹으로 선정하는 바이오마커그룹 예비선정모듈; 상기 바이오마커 그룹과, 상기 고민감도 집합에서 차상위 M개의 상기 고민감도 저질량 이온들과 상기 고특이도 집합에서 차상위 M개의 상기 고특이도 저질량 이온들 중 적어도 하나 이상의 저질량 이온을 상기 바이오마커 그룹에 추가한 후보 조합들 중 상기 제1기준, 상기 제2기준 및 상기 제3기준 중 적어도 하나 이상에 의한 상기 판별 성능의 기준에 의해 선택된 조합을 상기 바이오마커 그룹으로 재선정하는 바이오마커그룹 재선정모듈; 및 상기 고민감도 집합 및 상기 고특이도 집합에 차상위 저질량 이온이 존재하지 않을 때까지 상기 재선정 과정을 반복하여 상기 바이오마커 그룹을 최종 선정하는 바이오마커그룹 최종선정모듈을 포함할 수 있다.
상기 최종이온집합 선택수단은; 상기 후보이온집합에서 상기 바이오마커그룹 최종선정모듈에서 얻어진 상기 바이오마커 그룹으로 선정 완료된 조합의 저질량 이온들을 제외한 잔류 후보이온집합을 대상으로 상기 세 바이오마커 그룹 선정 과정을 반복 수행하여 추가 바이오마커 그룹을 선정하되, 상기 고민감도 집합 또는 상기 고특이도 집합에 상기 L개 미만의 질량 이온이 남을 때까지 상기 추가 바이오마커 그룹을 더 선정하는 바이오마커그룹 추가선정모듈; 및 상기 바이오마커 그룹과 상기 추가 바이오마커 그룹들 중 진양성 및 진음성 판정의 정확도(accuracy)를 기준으로 상위 K개의 바이오마커 그룹들의 조합의 저질량 이온들을 상기 암 진단용 저질량 이온으로 선택하는 암진단용저질량이온 최종선택모듈을 더 포함할 수 있다. 상기 L값은 2이고, 상기 M값은 1이며, 상기 K값은 1 내지 3 중 어느 하나의 자연수인 것이 바람직하다.
상기 최종이온집합 선택수단은, 상기 제1훈련집합에 대해 독립적인 제2훈련집합을 상기 제1훈련집합에 추가한 훈련 집합을 대상으로 저질량 이온 선택 과정을 진행하는 것이 바람직하다.
상기 다수의 암 환자 케이스들은; 대장암 환자 케이스들, 유방암 환자 케이스들 및 위암 환자 케이스들 중 어느 하나의 암 환자 케이스들을 포함할 수 있다.
상기 저질량 이온 검출부는; 다수의 대장암 환자 및 비환자 케이스들의 생물학적 시료로부터 질량분석기를 사용하여 상기 저질량 이온의 피크 강도를 검출하여 상기 저질량 이온의 질량 스펙트럼을 추출하고, 상기 암 진단부는; 훈련 후보 집합인 상기 대장암 환자 및 비환자 케이스들의 저질량 이온 질량 스펙트럼들을 정렬하는 제1정렬수단; 정렬된 상기 질량 스펙트럼에 대해 생물통계학적 분석을 수행하여 판별 점수를 계산하는 제1판별점수 계산수단; 상기 판별 점수에 따라 민감도 및 특이도를 계산하고, 이를 기준으로 제1훈련집합을 선정하여 저질량 이온별 인자적재값을 계산하는 인자적재값 계산수단; 후보 조건을 만족하는 후보 저질량 이온들 중 판별 성능을 기반으로 하여 대장암 진단용 저질량 이온들을 선택하는 대장암진단용이온 선정수단; 판별 대상 생물학적 시료의 저질량 이온 질량 스펙트럼을 상기 제1훈련집합에 정렬하는 제2정렬수단; 상기 판별 대상의 저질량 이온의 피크 강도와 상기 인자적재값으로부터 판별 점수를 계산하는 제2판별점수 계산수단; 및 상기 판별 점수에 따라 상기 판별 대상을 대장암의 양성 또는 음성으로 판정하는 대장암 판정수단을 포함하되, 상기 대장암진단용이온 선정수단은; 상기 다수의 대장암 환자 및 비환자 케이스들을, 다수의 대장암 환자 케이스들과 다수의 정상인 케이스들로 구성되는 제1종 판별 케이스들과, 상기 다수의 대장암 환자 케이스들과 다수의 대장암 이외의 암 환자 케이스들로 구성되는 제2종 판별 케이스들로 구분하고, 상기 제1종 판별 케이스들과 상기 제2종 판별 케이스들에 대해 각각 실행되어, 상기 대장암 진단용 저질량 이온들이, 상기 제1종 판별 케이스에 대한 제1종 대장암 진단용 저질량 이온들과 상기 제2종 판별 케이스에 대한 제2종 대장암 진단용 저질량 이온들로 구분될 수 있다.
상기 제1종 대장암 진단용 저질량 이온들의 질량값은 18.0260, 22.9797, 74.0948, 76.0763, 102.0916, 105.1078, 106.0899, 107.0477, 118.0822, 123.0395, 137.0423, 137.0729, 147.0573, 147.1058, 169.0653, 181.0656, 190.0849, 191.0848, 191.3324, 195.0785, 212.3195, 231.0667, 235.0053, 256.0939, 266.9557, 267.9501, 288.2033, 291.0997, 295.0663, 300.1297, 301.1269, 316.2288, 317.2311, 335.1862, 340.2241, 343.2451, 345.2583, 357.0666, 357.2784, 366.2310, 368.2551, 369.3302, 377.0570, 379.1438, 379.4765, 383.0529, 384.1745, 388.2688, 401.0531, 423.0313, 428.1878, 454.2090, 465.3014, 466.1923, 468.1851, 469.2831, 477.1721, 478.1678, 480.1715, 482.3220, 483.3258, 496.8683, 497.7636, 503.8719, 508.3407, 510.3265, 512.3119, 513.3177, 518.2931, 518.8555, 519.2967, 519.8598, 525.3449, 534.2739, 537.2800, 538.3306, 540.2629, 540.8144, 542.8457, 544.8692, 548.2856, 566.8375, 581.1957, 582.1888, 583.2242, 656.0270, 667.3291, 709.3519, 710.3581, 711.3617, 712.3683, 713.3798, 991.6196, 992.6209, 1016.6113, 1020.4817, 1206.5305, 1207.5571, 1465.6184, 1466.6096, 1467.5969, 2450.9701, 2451.9662 및 2452.9546 m/z (단, 오차 범위는 ±0.1 m/z)로 이루어진 그룹으로부터 선택된 하나 이상의 질량값인 것이 바람직하다.
상기 제2종 판별 케이스들 중 상기 다수의 대장암 이외의 암 환자 케이스들은 유방암 환자 케이스들, 비호지킨림프종(non-Hodgkin lymphoma, NHL) 환자 케이스들 및 위암 환자 케이스들 중 적어도 하나 이상의 암 환자 케이스들을 포함하되, 상기 제2종 대장암 진단용 저질량 이온들의 질량값은 60.0476, 138.0540, 172.6653, 173.1158, 179.1451, 191.1277, 279.0855, 280.0895, 280.2642, 281.1440, 296.2574, 312.3248, 332.3224, 333.3324, 369.3406, 465.3161, 486.6356, 488.6882, 544.8908, 551.3287, 566.8737, 707.3475 및 733.3569 m/z (단, 오차 범위는 ±0.1 m/z)로 이루어진 그룹으로부터 선택된 하나 이상의 질량값인 것이 바람직하다.
상기 판별 점수는 상기 제1종 저질량 이온들에 의한 제1종 판별 점수와 상기 제2종 저질량 이온들에 의한 제2종 판별 점수를 포함하며, 상기 제1종 판별 점수가 CS11보다 크고, 상기 제2종 판별 점수가 CS21보다 큰 경우에는 상기 판별 대상을 대장암 양성으로 판단하고, 상기 제1종 판별 점수가 CS12보다 작거나 상기 제2종 판별 점수가 CS22보다 작은 경우에는 상기 판별 대상을 대장암 음성으로 판단할 수 있다. 상기 CS11, CS12, CS21 및 CS22는 0인 것이 바람직하다.
상기 대장암진단용이온 선정수단을 이용해 획득한 대장암 환자와 정상인을 구분하는 저질량 이온군에는 피브리노겐(fibrinogen) 또는 피브리노겐 알파 체인(fibrinogen alpha chain)이 포함될 수 있다.
상기 대장암 환자와 정상인을 구분하는 저질량 이온군에는 트랜스타이레틴(transthyretin)이 포함될 수 있다.
상기 저질량 이온 검출부는; 다수의 유방암 환자 및 비환자 케이스들의 생물학적 시료로부터 질량분석기를 사용하여 상기 저질량 이온의 피크 강도를 검출하여 상기 저질량 이온의 질량 스펙트럼을 추출하고, 상기 암 진단부는; 훈련 후보 집합인 상기 유방암 환자 및 비환자 케이스들의 저질량 이온 질량 스펙트럼들을 정렬하는 제1정렬수단; 정렬된 상기 질량 스펙트럼에 대해 생물통계학적 분석을 수행하여 판별 점수를 계산하는 제1판별점수 계산수단; 상기 판별 점수에 따라 민감도 및 특이도를 계산하고, 이를 기준으로 제1훈련집합을 선정하여 저질량 이온별 인자적재값을 계산하는 인자적재값 계산수단; 후보 조건을 만족하는 후보 저질량 이온들 중 판별 성능을 기반으로 하여 유방암 진단용 저질량 이온들을 선택하는 유방암진단용이온 선정수단; 판별 대상 생물학적 시료의 저질량 이온 질량 스펙트럼을 상기 제1훈련집합에 정렬하는 제2정렬수단; 상기 판별 대상의 저질량 이온의 피크 강도와 상기 인자적재값으로부터 판별 점수를 계산하는 제2판별점수 계산수단; 및 상기 판별 점수에 따라 상기 판별 대상을 유방암의 양성 또는 음성으로 판정하는 유방암 판정수단을 포함하되, 상기 유방암진단용이온 선정수단은; 상기 다수의 유방암 환자 및 비환자 케이스들을 제1종 판별 케이스들로 구성하거나, 상기 다수의 유방암 환자 및 비환자 케이스들을, 다수의 유방암 환자 케이스들과 다수의 정상인 케이스들로 구성되는 제2종 판별 케이스들과, 상기 다수의 유방암 환자 케이스들과 다수의 유방암 이외의 암 환자 케이스들로 구성되는 제3종 판별 케이스들로 구분하고, 상기 제1종 판별 케이스들과, 상기 제2종 판별 케이스들 및 상기 제3종 판별 케이스들에 대해 각각 실행되어, 상기 유방암 진단용 저질량 이온들이, 상기 제1종 판별 케이스에 대한 제1종 유방암 진단용 저질량 이온들과, 상기 제2종 판별 케이스에 대한 제2종 유방암 진단용 저질량 이온들 및 상기 제3종 판별 케이스에 대한 제3종 유방암 진단용 저질량 이온들로 구분될 수 있다.
상기 제1종 판별 케이스들 중 상기 유방암 비환자 케이스들은 정상인 케이스들, 대장암 환자 케이스들, 비호지킨림프종(non-Hodgkin lymphoma, NHL) 환자 케이스들 및 위암 환자 케이스들 중 적어도 하나 이상의 케이스들을 포함하되, 상기 제1종 유방암 진단용 저질량 이온들의 질량값은 74.0937, 74.1155, 76.0728, 136.1067, 173.4872, 193.0665, 208.0565, 212.0949, 231.0726, 258.1364, 279.0841, 280.0847, 282.2777, 313.2638, 331.2024, 332.3181, 401.0588, 427.3441, 432.9954, 452.2269, 476.6038, 490.3427, 498.3237, 499.3265, 512.3145, 562.3074, 583.2323, 584.2415, 646.3851 m/z (단, 오차 범위는 ±0.1 m/z)로 이루어진 그룹으로부터 선택된 하나 이상의 질량값인 것이 바람직하다.
상기 제2종 유방암 진단용 저질량 이온들의 질량값은 38.9779, 46.0647, 74.1164, 76.0733, 97.0686, 122.0777, 123.0821, 130.1539, 185.7723, 191.1175, 208.0530, 212.0960, 225.1870, 229.0005, 231.0675, 244.0962, 281.0913, 284.3205, 313.2618, 332.3150, 342.2482, 368.2624, 398.3034, 416.0901, 424.3216, 426.3389, 428.1885, 497.3194, 513.3193, 532.6918, 538.3428, 540.3250, 570.3234, 580.3281, 581.2310, 581.3377, 610.3273, 616.3286, 618.3352, 646.3959, 725.3469, 757.1117 m/z (단, 오차 범위는 ±0.1 m/z)로 이루어진 그룹으로부터 선택된 하나 이상의 질량값인 것이 바람직하다.
상기 제3종 판별 케이스들 중 상기 다수의 유방암 이외의 암 환자 케이스들은 대장암 환자 케이스들, 비호지킨림프종 환자 케이스들 및 위암 환자 케이스들 중 적어도 하나 이상의 암 환자 케이스들을 포함하되, 상기 제3종 유방암 진단용 저질량 이온들의 질량값은 38.9736, 38.9892, 44.0491, 44.0656, 74.0938, 87.0991, 104.1316, 104.3161, 105.1091, 136.1021, 155.1798, 156.0412, 172.3072, 178.1330, 182.0738, 189.9525, 192.1294, 193.0660, 196.0871, 212.3221, 217.0923, 222.0231, 228.0348, 231.0726, 234.0422, 260.1013, 279.0843, 280.0849, 282.2791, 289.2960, 298.3425, 313.2630, 316.3269, 331.2036, 332.3169, 333.3233, 337.1047, 424.3272, 426.3406, 432.9948, 433.9894, 446.0196, 454.3014, 469.2924, 478.8688, 479.8724, 480.3180, 483.3301, 487.3152, 488.3287, 488.6580, 496.4331, 496.7718, 497.7764, 502.8741, 511.3367, 518.8776, 520.8826, 534.2829, 535.2882, 542.8770, 544.7878, 544.8728, 546.3358, 559.2911, 568.1146, 583.2284, 731.3330, 733.3526, 734.3563, 735.3665, 757.0995, 757.3512, 1465.5872, 1466.5971 m/z (단, 오차 범위는 ±0.1 m/z)로 이루어진 그룹으로부터 선택된 하나 이상의 질량값인 것이 바람직하다.
상기 판별 점수는 상기 제1종 저질량 이온들에 의한 제1종 판별 점수이며, 상기 판별 점수가 BS11보다 큰 경우에는 상기 판별 대상을 유방암 양성으로 판단하고, 상기 판별 점수가 BS12보다 작은 경우에는 상기 판별 대상을 유방암 음성으로 판단할 수 있다. 상기 BS11 및 BS12는 0인 것이 바람직하다.
상기 판별 점수는 상기 제2종 저질량 이온들에 의한 제2종 판별 점수와 상기 제3종 저질량 이온들에 의한 제3종 판별 점수를 포함하며, 상기 제2종 판별 점수가 BS21보다 크고 상기 제3종 판별 점수가 BS31보다 큰 경우에는 상기 판별 대상을 유방암 양성으로 판단하고, 상기 제2종 판별 점수가 BS22보다 작거나 상기 제3종 판별 점수가 BS32보다 작은 경우에는 상기 판별 대상을 유방암 음성으로 판단할 수 있다. 상기 BS21, BS22, BS31 및 BS32는 0인 것이 바람직하다.
상기 저질량 이온 검출부는; 다수의 위암 환자 및 비환자 케이스들의 생물학적 시료로부터 질량분석기를 사용하여 상기 저질량 이온의 피크 강도를 검출하여 상기 저질량 이온의 질량 스펙트럼을 추출하고, 상기 암 진단부는; 훈련 후보 집합인 상기 위암 환자 및 비환자 케이스들의 저질량 이온 질량 스펙트럼들을 정렬하는 제1정렬수단; 정렬된 상기 질량 스펙트럼에 대해 생물통계학적 분석을 수행하여 판별 점수를 계산하는 제1판별점수 계산수단; 상기 판별 점수에 따라 민감도 및 특이도를 계산하고, 이를 기준으로 제1훈련집합을 선정하여 저질량 이온별 인자적재값을 계산하는 인자적재값 계산수단; 후보 조건을 만족하는 후보 저질량 이온들 중 판별 성능을 기반으로 하여 위암 진단용 저질량 이온들을 선택하는 위암진단용이온 선정수단; 판별 대상 생물학적 시료의 저질량 이온 질량 스펙트럼을 상기 제1훈련집합에 정렬하는 제2정렬수단; 상기 판별 대상의 저질량 이온의 피크 강도와 상기 인자적재값으로부터 판별 점수를 계산하는 제2판별점수 계산수단; 및 상기 판별 점수에 따라 상기 판별 대상을 위암의 양성 또는 음성으로 판정하는 위암 판정수단을 포함하되, 상기 위암진단용이온 선정수단은; 상기 다수의 위암 환자 및 비환자 케이스들을, 다수의 위암 환자 케이스들과 다수의 정상인 케이스들로 구성되는 제1종 판별 케이스들과, 상기 다수의 위암 환자 케이스들과 다수의 대장암 환자 케이스들로 구성되는 제2종 판별 케이스들과, 상기 다수의 위암 환자 케이스들과 다수의 유방암 환자 케이스들로 구성되는 제3종 판별 케이스들과, 상기 다수의 위암 환자 케이스들과 다수의 비호지킨림프종(non-Hodgkin lymphoma, NHL) 환자 케이스들로 구성되는 제4종 판별 케이스들로 구분하거나, 상기 다수의 위암 환자 및 비환자 케이스들을, 상기 제1종 판별 케이스들과 상기 다수의 위암 환자 및 정상인 케이스들과 다수의 대장암, 유방암 및 비호지킨림프종 환자 케이스들로 구성되는 제5종 판별 케이스들로 구분하고, 상기 제1종 판별 케이스들, 상기 제2종 판별 케이스들, 상기 제3종 판별 케이스들, 상기 제4종 판별 케이스들 및 상기 제5종 판별 케이스들에 대해 각각 실행되어, 상기 위암 진단용 저질량 이온들이, 상기 제1종 판별 케이스에 대한 제1종 위암 진단용 저질량 이온들, 상기 제2종 판별 케이스에 대한 제2종 위암 진단용 저질량 이온들, 상기 제3종 판별 케이스에 대한 제3종 위암 진단용 저질량 이온들, 상기 제4종 판별 케이스에 대한 제4종 위암 진단용 저질량 이온들 및 상기 제5종 판별 케이스에 대한 제5종 위암 진단용 저질량 이온들로 구분될 수 있다.
상기 제1종 위암 진단용 저질량 이온들의 질량값은 22.9851, 87.0959, 123.0842, 314.2151, 324.1365, 366.2424, 488.6538, 490.3374, 526.3426, 532.3719, 576.2893, 606.2658, 616.1397, 1466.5612 m/z (단, 오차 범위는 ±0.1 m/z)로 이루어진 그룹으로부터 선택된 하나 이상의 질량값인 것이 바람직하다.
상기 제2종 위암 진단용 저질량 이온들의 질량값은 18.0260, 22.9830, 38.9752, 72.0788, 86.1216, 122.0584, 137.0721, 144.1092, 156.0171, 172.3740, 172.6583, 207.0729, 265.2034, 356.1278, 380.1643, 381.0949, 401.0680, 431.9882, 442.3197, 445.0278, 458.3228, 489.3564, 489.5293, 490.2775, 490.3586, 525.3611, 528.3633, 535.2970, 553.3205, 557.4392, 584.2675, 585.2726, 587.2805, 710.3687, 946.4028, 1466.6433 m/z (단, 오차 범위는 ±0.1 m/z)로 이루어진 그룹으로부터 선택된 하나 이상의 질량값인 것이 바람직하다.
상기 제3종 위암 진단용 저질량 이온들의 질량값은 22.9852, 74.0764, 104.1387, 105.1157, 106.0555, 148.0788, 173.4924, 176.1198, 184.1123, 212.1032, 217.9461, 226.0798, 228.0046, 284.3291, 299.1308, 299.3423, 314.2316, 338.1143, 377.0710, 387.9830, 426.3417, 427.3321, 430.3313, 432.9929, 456.2963, 459.2425, 480.3312, 481.3399, 482.3368, 487.3295, 488.3316, 490.3400, 496.8846, 506.9148, 509.3577, 532.3532, 534.2973, 535.3013, 537.3199, 550.3255, 560.3121, 562.3203, 574.3090, 580.3417, 583.2274, 584.2345, 584.3355, 585.2423, 600.3366, 616.1446 m/z (단, 오차 범위는 ±0.1 m/z)로 이루어진 그룹으로부터 선택된 하나 이상의 질량값인 것이 바람직하다.
상기 제4종 위암 진단용 저질량 이온들의 질량값은 18.0264, 22.9798, 23.0539, 38.9638, 38.9937, 46.0666, 86.1328, 112.0850, 123.0738, 129.0710, 155.1762, 164.0701, 165.0955, 175.1219, 176.1298, 178.1388, 179.1466, 192.1245, 201.2036, 204.1077, 212.3577, 213.0575, 229.0033, 232.0822, 234.0749, 235.0331, 240.0907, 251.9799, 274.0827, 284.3265, 314.2277, 326.3916, 383.0532, 417.0381, 429.3172, 430.3169, 434.2556, 456.3015, 459.2257, 460.9913, 489.3314, 490.3361, 491.3348, 532.2725, 534.2841, 569.3303 m/z (단, 오차 범위는 ±0.1 m/z)로 이루어진 그룹으로부터 선택된 하나 이상의 질량값인 것이 바람직하다.
상기 제5종 위암 진단용 저질량 이온들의 질량값은 38.9674, 76.0758, 123.0414, 156.0432, 163.1135, 164.0712, 184.1062, 184.1375, 190.1141, 193.0672, 215.0444, 228.0389, 230.0004, 256.3291, 257.2950, 265.9579, 267.9562, 289.2849, 295.1666, 301.1386, 315.2230, 330.2485, 342.2497, 346.2809, 368.2644, 369.2702, 370.2806, 371.2848, 396.0400, 412.1977, 428.1904, 442.3155, 443.2100, 445.0283, 498.3276, 510.2755, 511.3414, 513.3220, 530.3908, 532.2863, 548.3441, 552.3114, 553.3178, 571.3341, 573.2402, 584.2661, 666.3899, 683.3451, 684.3511, 708.3570, 711.3711, 723.3455, 725.3580, 726.3760, 741.3357 m/z (단, 오차 범위는 ±0.1 m/z)로 이루어진 그룹으로부터 선택된 하나 이상의 질량값인 것이 바람직하다.
상기 판별 점수는 상기 제1종 저질량 이온들에 의한 제1종 판별 점수, 상기 제2종 저질량 이온들에 의한 제2종 판별 점수, 상기 제3종 저질량 이온들에 의한 제3종 판별 점수 및 상기 제4종 저질량 이온들에 의한 제4종 판별 점수를 포함하며, 상기 제1종 판별 점수가 GS11보다 크고, 상기 제2종 판별 점수가 GS21보다 크고, 상기 제3종 판별 점수가 GS31보다 크고, 상기 제4종 판별 점수가 GS41보다 큰 경우에는 상기 판별 대상을 위암 양성으로 판단하고, 상기 제1종 판별 점수가 GS12보다 작거나, 상기 제2종 판별 점수가 GS22보다 작거나, 상기 제3종 판별 점수가 GS32보다 작거나, 상기 제4종 판별 점수가 GS42보다 작은 경우에는 상기 판별 대상을 위암 음성으로 판단할 수 있다. 상기 GS11, GS12, GS21, GS22, GS31, GS32 GS41 및 GS42는 0인 것이 바람직하다.
상기 판별 점수는 상기 제1종 저질량 이온들에 의한 제1종 판별 점수와 상기 제5종 저질량 이온들에 의한 제5종 판별 점수를 포함하며, 상기 제1종 판별 점수가 GS11보다 크고 상기 제5종 판별 점수가 GS51보다 큰 경우에는 상기 판별 대상을 위암 양성으로 판단하고, 상기 제1종 판별 점수가 GS12보다 작거나 상기 제5종 판별 점수가 GS52보다 작은 경우에는 상기 판별 대상을 위암 음성으로 판단할 수 있다. 상기 GS11, GS12, GS51 및 GS52는 0인 것이 바람직하다.
본 발명에 따른 암 진단 장치는, CRC 진단의 경우 분석 비용이 매우 낮으며, 분석 시간이 짧고, 대규모 분석이 가능하다는 장점이 있다. 과정을 간략히 설명하면, 혈액 내 저질량 이온의 질량 스펙트럼을 측정하고, 그 중 CRC 진단용 저질량 이온들의 질량값에 대응하는 피크 강도들을 추출하여 간단한 계산을 거치면 바로 CRC에 대한 양성/음성 정보를 제공할 수 있다.
또한, 판별 성능이 우수하고 강건하여, CRC를 대상으로 한 경우 훈련 집합뿐 아니라 검증 집합의 판별에서도 민감도, 특이도, 양성예측도, 음성 예측도가 모두 85% 이상임을 확인하였다. 또한, CRC 환자 및 비환자 집합을 다른 질병의 환자 및 비환자 집합으로 변경하는 것을 통해 다양한 질병에 유용하게 적용될 수 있다.
또한, CRC를 대상으로 한 경우 분변을 분석 시료로 하는 FOBT와 비교하면, 혈액을 분석 시료로 사용할 수 있으므로 다른 검사와 더불어 분석할 수 있어, 종래의 기술에 비하여 편리하고 신속하게 CRC 정보를 제공할 수 있다. CRC 진단용 저질량 이온들을 사용하는 경우 기존 FOBT의 판별 성능과 비교하면 특이도 측면에서는 필적하는 성능을 보이고 민감도 측면에서는 월등히 우수한 성능을 나타냄을 확인하였다.
본 발명에 따른 암 진단 장치는, BRC 진단의 경우에도 분석 비용이 매우 낮으며, 분석 시간이 짧고, 대규모 분석이 가능하다는 장점이 있다. 과정을 간략히 설명하면, 혈액 내 저질량 이온의 질량 스펙트럼을 측정하고, 그 중 BRC 진단용 저질량 이온들의 질량값에 대응하는 피크 강도들을 추출하여 간단한 계산을 거치면 바로 BRC에 대한 양성/음성 정보를 제공할 수 있다.
또한, 판별 성능이 우수하고 강건하여, BRC를 대상으로 한 경우 훈련 집합뿐 아니라 검증 집합의 판별에서도 민감도, 특이도, 양성예측도, 음성 예측도가 모두 85% 이상임을 확인하였다. 또한, BRC 환자 및 비환자 집합을 다른 질병의 환자 및 비환자 집합으로 변경하는 것을 통해 다양한 질병에 유용하게 적용될 수 있다.
본 발명에 따른 암 진단 장치는, GC 진단의 경우에도 분석 비용이 매우 낮으며, 분석 시간이 짧고, 대규모 분석이 가능하다는 장점이 있다. 과정을 간략히 설명하면, 혈액 내 저질량 이온의 질량 스펙트럼을 측정하고, 그 중 GC 진단용 저질량 이온들의 질량값에 대응하는 피크 강도들을 추출하여 간단한 계산을 거치면 바로 GC에 대한 양성/음성 정보를 제공할 수 있다.
또한, 판별 성능이 우수하고 강건하여, GC를 대상으로 한 경우 훈련 집합뿐 아니라 검증 집합의 판별에서도 민감도, 특이도, 양성예측도, 음성 예측도가 모두 약 80~90% 이상임을 확인하였다. 또한, GC 환자 및 비환자 집합을 다른 질병의 환자 및 비환자 집합으로 변경하는 것을 통해 다양한 질병에 유용하게 적용될 수 있다.
도 1 내지 6은 종래 기술을 설명하기 위한 도면으로,
도 1은 종래 기술에 따라 저질량 이온 질량 스펙트럼을 사용하여 CRC를 판정하는 과정을 설명하는 순서도,
도 2는 종래 기술에 따라 CRC 환자군 133명과 정상 대조군 153명으로 구성된 집합을 판정한 결과를 도시한 그래프,
도 3은 종래 기술에 따라 저질량 이온 질량 스펙트럼을 사용하여 BRC를 판정하는 과정을 설명하는 순서도,
도 4는 종래 기술에 따라 BRC 환자군 54명과 정상 대조군 49명으로 구성된 집합을 판정한 결과를 도시한 그래프,
도 5는 종래 기술에 따라 저질량 이온 질량 스펙트럼을 사용하여 GC를 판정하는 과정을 설명하는 순서도,
도 6은 종래 기술에 따라 GC 환자군 49명과 정상 대조군 84명으로 구성된 집합을 판정한 결과를 도시한 그래프이다.
도 7 내지 13은 본 발명의 바람직한 일 실시 예에 따른 암 진단 장치를 설명하기 위한 도면으로,
도 7은 본 발명의 바람직한 일 실시 예에 따른 암 진단 장치를 나타낸 블록도.
도 8은 도 7의 암 진단부를 더욱 상세히 나타낸 블록도,
도 9는 도 8의 제1판별점수 계산수단을 더욱 상세히 나타낸 블록도,
도 10은 도 8의 제2판별점수 계산수단을 더욱 상세히 나타낸 블록도,
도 11은 도 8의 암진단용이온 선정수단을 더욱 상세히 나타낸 블록도,
도 12는 도 11의 후보이온집합 선택수단을 더욱 상세히 나타낸 블록도,
도 13은 도 11의 최종이온집합 선택수단을 더욱 상세히 나타낸 블록도이다.
도 14 내지 25는 본 발명의 바람직한 일 실시 예에 따른 CRC를 진단하기 위한 암 진단 장치를 설명하기 위한 도면으로서,
도 14는 본 발명의 CRC를 진단하기 위한 도 7의 암 진단부를 더욱 상세히 나타낸 블록도,
도 15는 본 발명에 따른 민감도와 특이도가 소정의 값을 갖는 제1훈련집합 A0를 선정하고 질량 이온별 가중치를 계산하는 과정을 설명하는 순서도,
도 16은 판별 대상 시료에 판별식을 적용하는 과정을 설명하는 순서도,
도 17은 제1훈련집합 A01에서 계산한 질량 이온별 가중치로 집합 A1을 판정한 결과를 도시한 그래프,
도 18은 제1훈련집합 A02에서 계산한 질량 이온별 가중치로 집합 A1을 판정한 결과를 도시한 그래프,
도 19는 본 발명에 따른 예비 판별식을 구성하는 과정을 설명하는 순서도,
도 20은 제1종 예비 판별식으로 집합 A1을 판정한 결과를 도시한 그래프,
도 21은 제2종 예비 판별식으로 집합 A1을 판정한 결과를 도시한 그래프,
도 22는 본 발명에 따른 최종 판별식을 구성하는 과정을 설명하는 순서도,
도 23은 집합 A의 5회 반복 측정한 질량 스펙트럼들에 대해 본 발명의 최종 판별식에 따라 판별 점수를 계산한 후 평균 판별 점수(mean DS)를 구하여 판정한 결과를 도시한 그래프,
도 24는 본 발명의 최종 판별식에 따라 평균 판별 점수를 계산하여 5회 반복 측정한 집합 B를 판정한 결과를 도시한 그래프,
도 25a는 본 발명에 따른 방법에 의하여 확인된 제1종 CRC 진단용 저질량 이온들의 질량값 중 1465.6184 m/z을 동정한 결과를 도시한 그래프,
도 25b는 본 발명에 따른 방법에 의하여 확인된 제1종 CRC 진단용 저질량 이온들의 질량값 중 2450.9701 m/z을 동정한 결과를 도시한 그래프이다.
도 26 내지 37은 본 발명의 바람직한 일 실시 예에 따른 BRC를 진단하기 위한 암 진단 장치를 설명하기 위한 도면으로,
도 26은 본 발명의 BRC를 진단하기 위한 도 7의 암 진단부를 더욱 상세히 나타낸 블록도,
도 27은 본 발명에 따른 민감도와 특이도가 소정의 값을 갖는 제1훈련집합 C0를 선정하고 질량 이온별 가중치를 계산하는 과정을 설명하는 순서도,
도 28은 판별 대상 시료에 판별식을 적용하는 과정을 설명하는 순서도,
도 29는 제1훈련집합 C01에서 계산한 질량 이온별 가중치로 집합 C1을 판정한 결과를 도시한 그래프,
도 30은 제1훈련집합 C03에서 계산한 질량 이온별 가중치로 집합 C1을 판정한 결과를 도시한 그래프,
도 31은 본 발명에 따른 예비 판별식을 구성하는 과정을 설명하는 순서도,
도 32는 제1종 예비 판별식으로 집합 C1을 판정한 결과를 도시한 그래프,
도 33은 제2종 예비 판별식으로 집합 C1을 판정한 결과를 도시한 그래프,
도 34는 제3종 예비 판별식으로 집합 C1을 판정한 결과를 도시한 그래프,
도 35는 본 발명에 따른 최종 판별식을 구성하는 과정을 설명하는 순서도,
도 36은 집합 C의 5회 반복 측정한 질량 스펙트럼들에 대해 본 발명의 제1종 최종 판별식에 따라, 또한, 제2종 및 제3종 최종 판별식에 따라 판별 점수를 계산한 후 평균 판별 점수(mean DS)를 구하여 판정한 결과를 도시한 그래프,
도 37은 본 발명의 제1종 최종 판별식에 따라, 또한, 제2종 및 제3종 최종 판별식에 따라 평균 판별 점수를 계산하여 5회 반복 측정한 집합 D를 판정한 결과를 도시한 그래프이다.
도 38 내지 54는 본 발명의 바람직한 일 실시 예에 따른 GC를 진단하기 위한 암 진단 장치를 설명하기 위한 도면으로,
도 38은 본 발명의 GC를 진단하기 위한 도 7의 암 진단부를 더욱 상세히 나타낸 블록도,
도 39는 본 발명에 따른 민감도와 특이도가 소정의 값을 갖는 제1훈련집합 E0를 선정하고 질량 이온별 가중치를 계산하는 과정을 설명하는 순서도,
도 40은 판별 대상 시료에 판별식을 적용하는 과정을 설명하는 순서도,
도 41은 제1훈련집합 E01에서 계산한 질량 이온별 가중치로 집합 E1을 판정한 결과를 도시한 그래프,
도 42는 제1훈련집합 E02에서 계산한 질량 이온별 가중치로 집합 E1을 판정한 결과를 도시한 그래프,
도 43은 제1훈련집합 E03에서 계산한 질량 이온별 가중치로 집합 E1을 판정한 결과를 도시한 그래프,
도 44는 제1훈련집합 E04에서 계산한 질량 이온별 가중치로 집합 E1을 판정한 결과를 도시한 그래프,
도 45는 제1훈련집합 E05에서 계산한 질량 이온별 가중치로 집합 E1을 판정한 결과를 도시한 그래프,
도 46은 본 발명에 따른 예비 판별식을 구성하는 과정을 설명하는 순서도,
도 47은 제1종 예비 판별식으로 집합 E1을 판정한 결과를 도시한 그래프,
도 48은 제2종 예비 판별식으로 집합 E1을 판정한 결과를 도시한 그래프,
도 49는 제3종 예비 판별식으로 집합 E1을 판정한 결과를 도시한 그래프,
도 50은 제4종 예비 판별식으로 집합 E1을 판정한 결과를 도시한 그래프,
도 51은 제5종 예비 판별식으로 집합 E1을 판정한 결과를 도시한 그래프,
도 52는 본 발명에 따른 최종 판별식을 구성하는 과정을 설명하는 순서도,
도 53은 집합 E의 5회 반복 측정한 질량 스펙트럼들에 대해 본 발명의 제1종 및 제5종 최종 판별식에 따라 판별 점수를 계산한 후 평균 판별 점수(mean DS)를 구하여 판정한 결과를 도시한 그래프,
도 54는 본 발명의 제1종 및 제5종 최종 판별식에 따라 평균 판별 점수를 계산하여 5회 반복 측정한 집합 F를 판정한 결과를 도시한 그래프이다.
1. 용어의 정의
본 발명에서, "생물학적 시료"는 전혈(whole blood), 혈청, 혈장(plasma), 요, 분변, 객담(sputum), 타액, 조직, 세포, 세포 추출물, 체외 세포 배양물 등과 같은 시료들을 포함하나, 이에 제한되지 않는다. 아래에 기술되는 실시 예에서는 환자 또는 비환자의 혈청을 생물학적 시료로 사용하였다.
본 발명에서, "피크 강도"는 MALDI-TOF 질량분석기로부터 얻어지는 값을 말하며, 피크에 해당하는 질량 이온의 양과 상관 관계를 가진다.
본 발명에서, "정규화"는 데이터(data)의 범위를 일치시키거나 분포를 유사하게 만들어 주는 것을 말하며, 평균값(mean), 중간값(median) 등을 이용하여 정규화할 수 있으나 이에 제한되지 않고, 경우에 따라 다양한 공지의 방법들이 적용될 수 있다. 본 실시 예에서는 각 시료별 피크 강도들의 소계를 구하고, 시료별 소계들의 평균을 구한 후, 각 시료별 피크 강도들의 소계가 이 평균과 일치하도록 각 피크 강도에 시료별 배율 인자를 곱하는 방식으로 정규화하였다. 즉, 이와 같이 정규화한 후에는 각 시료별 피크 강도들의 소계가 동일해진다.
본 발명에서, "파레토 스케일링"은 정규화한 각 피크 강도에서 질량 이온별 평균값을 뺀 후 표준편차의 제곱근으로 나누는 것을 말한다. 보다 일반적인 스케일링 방법인 오토스케일링(autoscaling)에서는 표준편차로 나누는 것을 통해 데이터의 크기 정보를 완전히 상쇄시키는 것에 비해, 파레토 스케일링에서는 데이터의 크기 정보를 부분적으로 유지하는 것을 통해 노이즈(noise)의 증폭을 피할 수 있다는 장점이 있다.
본 발명에서, "가중치"는 가중치를 곱한 후의 데이터의 수치적 크기가 통계적 관점에서의 중요성에 비례하도록 조정하는 인자를 말하는데, 아래에 기술되는 실시 예에서 주성분 분석 기반 선형 판별 분석의 결과로 획득되는 질량 이온별 인자적재값을 가중치의 일례라 할 수 있다.
본 발명에서, "저질량 이온"은 MALDI-TOF 질량분석기 등을 이용하여 획득한 질량값이 1500 m/z보다 작은 이온을 의미한다. CRC 진단용 저질량 이온들 중 일부는 이 범위보다 더 높은 질량값을 가지기도 하나, 대부분이 이 범위 내에 들어오므로 이 경우에도 저질량 이온이라는 명칭을 그대로 사용하려고 한다. 즉, 1500 m/z이라는 한계는 확정적인 값이 아니라 대략적인 값의 의미로 사용된 것이다.
본 발명에서, MALDI-TOF 질량분석기에 의해 측정된 질량값은 "±0.05 m/z"의 오차 범위를 포함한다. 실험 환경에 따라 질량값 측정치에 다소의 오차가 발생할 수 있기 때문이다. 예를 들어, 청구범위에 기재된 1467.5969 m/z의 질량값은 실제로 1467.5469 m/z 내지 1467.6469 m/z의 범위를 갖는 것으로 이해되어야 한다. 실험 환경에 따라 오차 범위는 "±0.1 m/z"일 수 있다.
본 발명에서, MALDI-TOF 질량분석기에 의해 측정된 질량값은 MALDI-TOF 질량분석기의 포지티브 모드(positive mode)에서 획득된 질량값임에 유의한다.
본 발명에서, 가중치 벡터(vector)의 부호는 판별 점수가 양수인 경우 양성으로 판정되고 음수인 경우 음성으로 판정되도록 조정한다. 주성분 분석에서의 인자적재값 벡터는 수학적으로 고유벡터(eigenvector)에 해당하는데, 이 벡터의 부호는 임의로 정할 수 있다. 즉, 계산된 질량 이온별 인자적재값에 전체적으로 -1을 곱하여 부호를 변경한다고 하여도 수학적으로는 동일한 고유치 문제(eigenvalue problem)에 대한 동등한 해라고 할 수 있으나, 판별 점수가 음수인 경우를 양성으로 양수인 경우를 음성으로 판정하게 된다. 본 발명에서는 판별 점수가 양수인 경우 양성으로 판정되고 음수인 경우 음성으로 판정되도록 고유벡터의 부호를 조정하였으나, 본 발명의 범위가 이에 제한되지 않음에 유의한다.
또한, 본 발명에서,“판별 점수”라 함은 생물학적 시료로부터 추출한 질량 스펙트럼에 대해 생물통계학적 분석을 통해 계산된 값으로, 이것을 기반으로 하여 특정 암의 양성 또는 음성을 판정할 수 있다. 판정 방식은 계산된 판별 점수가 특정 기준값보다 큰지 여부를 판단하는 간단한 방식이 사용될 수도 있고, 계산된 판별 점수를 입력으로 하여 판정 결과를 출력으로 주는 함수가 사용될 수 있다.
본 발명의 실시 예에서는 판별 점수라는 용어를 특정하여 사용하였으나, 본 발명에서 정의하는 상기 판별 점수는 판별 레벨(level), 판별값(value) 등의 다양한 형태의 용어로 기재될 수 있다. 따라서, 본 발명에서 정의하는 판별 점수라는 용어는 사전적 의미의 판별 점수라는 용어에 한정되지 않으며, 본 발명의 정의에 따라 판별 점수를 의미하는 상기 판별 레벨과 판별값, 또는 이와 유사한 다양한 용어들을 모두 포함하는 것으로 해석되어야 한다.
또한, 본 발명에서, “판별 성능”이라 함은 기본적으로 민감도, 특이도, 양성예측도, 음성예측도 및 정확도 등의 지표를 수치로 나타낸 것을 의미한다. 또한, 이 지표들의 함수로 계산되는 값을 의미하기도 한다. 예를 들어, 민감도, 특이도, 양성예측도, 음성예측도 및 정확도 등의 각각의 값이 판별 성능으로 사용될 수 있으며, 또는 민감도와 특이도의 합, 민감도와 양성예측도의 합, 음성예측도와 정확도의 합 등의 2이상의 합이 판별 성능으로 사용될 수도 있다.
이하, 실시 예를 통하여 본 발명을 보다 상세히 설명한다. 기술되는 실시 예는 본 발명을 예시적으로 설명하기 위한 것이며 본 발명의 권리범위가 실시 예에 한정되는 것은 아님을 밝혀둔다.
도 7 내지 13은 본 발명의 바람직한 일 실시 예에 따른 암 진단 장치를 설명하기 위한 도면이다.
먼저, 도 7은 본 발명의 바람직한 일 실시 예에 따른 암 진단 장치를 나타낸 블록도로서, 도시된 바와 같이 본 발명에 따른 암 진단 장치는, 다수의 암 환자 및 비환자 케이스들의 생물학적 시료로부터 저질량 이온의 질량 스펙트럼을 검출하는 저질량 이온 검출부(1000); 상기 저질량 이온의 질량 스펙트럼 패턴을 비교 분석하여 암 진단 정보를 판정하는 암 진단부(2000); 및 상기 암 진단부(2000)로부터 판정된 암 진단 정보를 출력 가능한 형태로 변환하여 표시하는 디스플레이부(3000)를 포함한다.
상기 저질량 이온 검출부(1000)는; 상기 생물학적 시료로부터 저질량 이온의 피크 강도를 검출하여 상기 저질량 이온의 질량 스펙트럼을 추출할 수 있다. 또한, 상기 저질량 이온 검출부(1000)는; 질량분석기를 포함할 수 있다.
상기 디스플레이부(3000)는; 모니터 화면, 휴대 단말기의 액정 화면 등의 디바이스에 상기 판정된 암 진단 정보를 문자, 숫자, 도형 등의 다양한 형태로 변환하여 표시할 수 있다.
도 8은 도 7의 암 진단부를 더욱 상세히 나타낸 블록도로서, 도시된 바와 같이 상기 암 진단부(2000)는; 훈련 후보 집합인 상기 암 환자 및 비환자 케이스들의 저질량 이온 질량 스펙트럼들을 정렬하는 제1정렬수단(2100); 정렬된 상기 질량 스펙트럼에 대해 생물통계학적 분석을 수행하여 판별 점수를 계산하는 제1판별점수 계산수단(2200); 상기 판별 점수에 따라 민감도 및 특이도를 계산하고, 이를 기준으로 제1훈련집합을 선정하여 저질량 이온별 인자적재값을 계산하는 인자적재값 계산수단(2300); 후보 조건을 만족하는 후보 저질량 이온들 중 판별 성능을 기반으로 하여 암 진단용 저질량 이온들을 선택하는 암진단용이온 선정수단(2400); 판별 대상 생물학적 시료의 저질량 이온 질량 스펙트럼을 상기 제1훈련집합에 정렬하는 제2정렬수단(2500); 상기 판별 대상의 저질량 이온의 피크 강도와 상기 인자적재값으로부터 판별 점수를 계산하는 제2판별점수 계산수단(2600); 및 상기 판별 점수에 따라 상기 판별 대상을 암의 양성 또는 음성으로 판정하는 암 판정수단(2700)을 포함할 수 있다.
상기 인자적재값 계산수단(2300)은; 상기 정렬된 질량 스펙트럼에 대해 생물통계학적 분석을 수행하고, 상기 생물통계학적 분석 결과를 기초로 상기 암 환자 및 비환자 케이스들 중 훈련 조건을 만족하는 훈련 케이스들을 제1훈련집합으로 선택하는 제1훈련집합 선택수단(2310)을 포함할 수 있으며, 상기 제1훈련집합으로부터 인자적재값을 계산할 수 있다.
상기 제1훈련집합 선택수단(2310)은; 상기 생물통계학적 분석 결과에 따른 민감도가 문턱값 N1 이상이고, 특이도가 문턱값 N2 이상일 때의 암 환자 및 비환자 케이스들을 상기 제1훈련집합을 설정할 수 있다. 여기서, 상기 문턱값 N1과 N2는 1인 것이 바람직하다.
상기 암 판정수단(2700)은; 상기 판별 점수에 따라 상기 판별 대상을 암의 양성 또는 음성으로 판정하되, 상기 판별 점수가 기준값 S보다 크면 양성으로 상기 판별 대상의 암 정보를 판단하고, 상기 판별 점수가 기준값 S보다 작으면 음성으로 상기 판별 대상의 암 정보를 판단할 수 있다. 여기서, 상기 기준값 S는 0인 것이 바람직하다.
상기 암 판정수단(2700)은; 상기 판별 대상의 생물학적 시료를 반복적으로 측정하여 검출한 다수의 상기 저질량 이온 질량 스펙트럼에 대해 계산된 다수의 상기 판별 점수의 평균값으로 상기 판별 대상의 상기 암 정보를 판단할 수 있다.
도 9는 도 8의 제1판별점수 계산수단을 더욱 상세히 나타낸 블록도로서, 도시된 바와 같이 상기 제1판별점수 계산수단(2200)은; 상기 훈련 후보 집합의 상기 저질량 이온 질량 스펙트럼들의 상기 피크 강도들을 정규화하는 정규화 모듈(2210); 상기 정규화한 피크 강도들을 스케일링하는 스케일링 모듈(2220); 및 상기 스케일링된 피크 강도들에 대해 상기 생물통계학적 분석을 수행하여 상기 판별 점수를 계산하는 판별점수계산 모듈(2230)을 포함할 수 있다.
상기 스케일링 모듈(2220)은; 파레토 스케일링을 수행할 수 있다. 상기 판별점수계산 모듈(2230)은; 주성분 분석 기반 선형 판별 분석을 사용하여 상기 생물통계학적 분석을 수행할 수 있다. 상기 판별점수계산 모듈(2230)은; 상기 주성분 분석 기반 선형 판별 분석에 의해 획득된 인자적재값과 상기 스케일링된 피크 강도를 함께 사용하여 상기 판별 점수를 계산할 수 있다.
도 10은 도 8의 제2판별점수 계산수단을 더욱 상세히 나타낸 블록도로서, 도시된 바와 같이 상기 제2판별점수 계산수단(2600)은; 상기 판별 대상의 상기 저질량 이온 질량 스펙트럼의 상기 피크 강도들을 정규화하는 정규화 모듈(2610); 상기 정규화한 피크 강도들을 스케일링하는 스케일링 모듈(2620); 및 상기 스케일링된 피크 강도와 상기 인자적재값을 통해 상기 판별 점수를 계산하는 판별점수계산 모듈(2630)을 포함할 수 있다.
상기 스케일링 모듈(2620)은; 파레토 스케일링을 수행할 수 있다. 상기 판별점수계산 모듈(2630)은; 상기 암 진단용 저질량 이온들의 상기 스케일링된 피크 강도와 상기 인자적재값을 통해 상기 판별 점수를 계산할 수 있다.
도 11은 도 8의 암진단용이온 선정수단을 더욱 상세히 나타낸 블록도로서, 도시된 바와 같이 상기 암진단용이온 선정수단(2400)은; 상기 선택된 상기 제1훈련집합으로부터 후보 조건을 만족하는 후보 저질량 이온들을 후보이온집합으로 선택하는 후보이온집합 선택수단(2410); 및 상기 선택된 상기 후보이온집합의 상기 후보 저질량 이온의 개별 또는 조합별 판별 성능을 기반으로 하여 암 진단용 저질량 이온들을 최종이온집합으로 선택하는 최종이온집합 선택수단(2420)을 포함할 수 있다.
상기 최종이온집합 선택수단(2420)의 상기 판별 성능의 기준은; 상기 후보 저질량 이온 중 민감도와 특이도의 합이 기준값보다 큰 이온들을 선택하거나 상기 후보 저질량 이온들로 구성되는 조합별 민감도와 특이도의 합이 비교 대상 조합들 중 가장 큰 조합을 선택하는 제1기준을 포함할 수 있다.
상기 최종이온집합 선택수단(2420)의 상기 판별 성능의 기준은; 상기 후보 저질량 이온들의 조합들 중 상기 후보 저질량 이온들의 개수가 비교 대상 조합들 중 가장 적은 조합을 선택하는 제2기준을 더 포함할 수 있다.
상기 최종이온집합 선택수단(2420)의 상기 판별 성능의 기준은; 상기 후보 저질량 이온들의 조합들 중 진양성(true positive) 케이스의 최소 판별 점수와 진음성(true negative) 케이스의 최대 판별 점수의 차가 비교 대상 조합들 중 가장 큰 조합을 선택하는 제3기준을 더 포함하며, 상기 판별 점수는 상기 후보 저질량 이온들의 상기 스케일링된 피크 강도와 상기 인자적재값을 통해 계산되며, 암에 대한 양성 또는 음성을 나타낼 수 있다.
상기 최종이온집합 선택수단(2420)은, 상기 제1훈련집합에 대해 독립적인 제2훈련집합을 상기 제1훈련집합에 추가한 훈련 집합을 대상으로 저질량 이온 선택 과정을 진행할 수 있다.
도 12는 도 11의 후보이온집합 선택수단을 더욱 상세히 나타낸 블록도로서, 도시된 바와 같이 상기 후보이온집합 선택수단(2410)은; 상기 훈련 케이스 각각에 대한 상기 저질량 이온의 상기 피크 강도와, 상기 생물통계학적 분석을 통해 획득된 상기 저질량 이온별 인자적재값의 곱의 절댓값이 문턱값 T1보다 큰 제1저질량 이온들을 상기 훈련 케이스별로 선택하는 제1저질량이온 선택모듈(2411)을 포함할 수 있다. 여기서, 상기 문턱값 T1은 0.1인 것이 바람직하다.
상기 후보이온집합 선택수단(2410)은; 상기 제1저질량 이온들 중 상기 훈련 케이스들 전체의 문턱값 T2 퍼센트 이상의 케이스들에서 공통으로 나타나는 제2저질량 이온들을 상기 후보이온집합으로 선택하는 후보이온집합 예비선택모듈(2412)을 포함할 수 있다. 여기서, 상기 문턱값 T2는 50인 것이 바람직하다.
상기 후보이온집합 선택수단(2410)은; 상기 제2저질량 이온들을 이용해 상기 훈련 케이스별로 암에 대한 양성 또는 음성을 나타내는 판별 점수를 계산하고, 상기 판별 점수에 따른 민감도 및 특이도를 계산하는 민감도 및 특이도 계산모듈(2413); 및 상기 민감도가 문턱값 N3보다 작거나, 상기 특이도가 문턱값 N4보다 작은 경우 상기 T1 및 상기 T2 중 적어도 하나를 변경하고, 상기 과정을 반복하여 상기 후보이온집합을 선택하는 후보이온집합 최종선택모듈(2414)을 더 포함할 수 있다. 여기서, 상기 문턱값 N3 및 N4는 0.9인 것이 바람직하다.
도 13은 도 11의 최종이온집합 선택수단을 더욱 상세히 나타낸 블록도로서, 도시된 바와 같이 상기 최종이온집합 선택수단(2420)은; 상기 후보이온집합에 포함된 상기 후보 저질량 이온들을 상기 민감도가 상기 특이도보다 높은 고민감도 저질량 이온들을 포함하며 상기 고민감도 저질량 이온들을 상기 민감도와 상기 특이도의 합의 내림차순으로 정렬한 고민감도 집합{Sns1, Sns2, Sns3 … SnsI}과, 상기 특이도가 상기 민감도보다 높은 고특이도 저질량 이온들을 포함하며 상기 고특이도 저질량 이온들을 상기 민감도와 상기 특이도의 합의 내림차순으로 정렬한 고특이도 집합 {Spc1, Spc2, Spc3 … SpcJ}으로 구분하는 이온 구분모듈(2421); 상기 고민감도 집합에서 상위 L개의 상기 고민감도 저질량 이온들{Sns1, Sns2, Sns3 … SnsL}과 상기 고특이도 집합에서 상위 L개의 상기 고특이도 저질량 이온들{Spc1, Spc2, Spc3 … SpcL} 중 2개 이상의 저질량 이온들로 구성되는 후보 조합들 중 상기 제1기준, 상기 제2기준 및 상기 제3기준 중 적어도 하나 이상에 의한 상기 판별 성능의 기준에 의해 선택된 조합을 바이오마커 그룹으로 선정하는 바이오마커그룹 예비선정모듈(2422); 상기 바이오마커 그룹과, 상기 고민감도 집합에서 차상위 M개의 상기 고민감도 저질량 이온들과 상기 고특이도 집합에서 차상위 M개의 상기 고특이도 저질량 이온들 중 적어도 하나 이상의 저질량 이온을 상기 바이오마커 그룹에 추가한 후보 조합들 중 상기 제1기준, 상기 제2기준 및 상기 제3기준 중 적어도 하나 이상에 의한 상기 판별 성능의 기준에 의해 선택된 조합을 상기 바이오마커 그룹으로 재선정하는 바이오마커그룹 재선정모듈(2423); 및 상기 고민감도 집합 및 상기 고특이도 집합에 차상위 저질량 이온이 존재하지 않을 때까지 상기 재선정 과정을 반복하여 상기 바이오마커 그룹을 최종 선정하는 바이오마커그룹 최종선정모듈(2424)을 포함할 수 있다.
상기 최종이온집합 선택수단(2420)은; 상기 후보이온집합에서 상기 바이오마커그룹 최종선정모듈(2424)에서 얻어진 상기 바이오마커 그룹으로 선정 완료된 조합의 저질량 이온들을 제외한 잔류 후보이온집합을 대상으로 상기 세 바이오마커 그룹 선정 과정을 반복 수행하여 추가 바이오마커 그룹을 선정하되, 상기 고민감도 집합 또는 상기 고특이도 집합에 상기 L개 미만의 질량 이온이 남을 때까지 상기 추가 바이오마커 그룹을 더 선정하는 바이오마커그룹 추가선정모듈(2425); 및 상기 바이오마커 그룹과 상기 추가 바이오마커 그룹들 중 진양성 또는 진음성 판정의 정확도(accuracy)를 기준으로 상위 K개의 바이오마커 그룹들의 조합의 저질량 이온들을 상기 암 진단용 저질량 이온으로 선택하는 암진단용저질량이온 최종선택모듈(2426)을 더 포함할 수 있다. 여기서, 상기 L값은 2이고, 상기 M값은 1이며, 상기 K값은 1 내지 3 중 어느 하나의 자연수인 것이 바람직하다.
상기 다수의 암 환자 케이스들은; 대장암 환자 케이스들, 유방암 환자 케이스들 및 위암 환자 케이스들 중 어느 하나의 암 환자 케이스들을 포함할 수 있다.
2. 대장암을 진단하기 위한 암 진단 장치의 실시 예
도 14는 본 발명의 CRC를 진단하기 위한 도 7의 암 진단부를 더욱 상세히 나타낸 블록도이다.
도시된 바와 같이 본 발명에 따른 암 진단부는, 훈련 후보 집합인 상기 대장암 환자 및 비환자 케이스들의 저질량 이온 질량 스펙트럼들을 정렬하는 제1정렬수단(4100); 정렬된 상기 질량 스펙트럼에 대해 생물통계학적 분석을 수행하여 판별 점수를 계산하는 제1판별점수 계산수단(4200); 상기 판별 점수에 따라 민감도 및 특이도를 계산하고, 이를 기준으로 제1훈련집합을 선정하여 저질량 이온별 인자적재값을 계산하는 인자적재값 계산수단(4300); 후보 조건을 만족하는 후보 저질량 이온들 중 판별 성능을 기반으로 하여 대장암 진단용 저질량 이온들을 선택하는 대장암진단용이온 선정수단(4400); 판별 대상 생물학적 시료의 저질량 이온 질량 스펙트럼을 상기 제1훈련집합에 정렬하는 제2정렬수단(4500); 상기 판별 대상의 저질량 이온의 피크 강도와 상기 인자적재값으로부터 판별 점수를 계산하는 제2판별점수 계산수단(4600); 및 상기 판별 점수에 따라 상기 판별 대상을 대장암의 양성 또는 음성으로 판정하는 대장암 판정수단(4700)을 포함하되, 상기 대장암진단용이온 선정수단(4400)은; 상기 다수의 대장암 환자 및 비환자 케이스들을, 다수의 대장암 환자 케이스들과 다수의 정상인 케이스들로 구성되는 제1종 판별 케이스들과, 상기 다수의 대장암 환자 케이스들과 다수의 대장암 이외의 암 환자 케이스들로 구성되는 제2종 판별 케이스들로 구분하고, 상기 제1종 판별 케이스들과 상기 제2종 판별 케이스들에 대해 각각 실행되어, 상기 대장암 진단용 저질량 이온들이 상기 제1종 판별 케이스에 대한 제1종 대장암 진단용 저질량 이온들과 상기 제2종 판별 케이스에 대한 제2종 대장암 진단용 저질량 이온들로 구분되도록 한다.
이를 위하여, 저질량 이온 검출부(1000)는; 다수의 대장암 환자 및 비환자 케이스들의 생물학적 시료로부터 질량분석기를 사용하여 상기 저질량 이온의 피크 강도를 검출하여 상기 저질량 이온의 질량 스펙트럼을 추출한다.
아울러, 상기 CRC를 진단하기 위한 암 진단부의 더욱 세세한 구성 요소들은, 전술한 상기 암 진단 장치에서의 도9 내지 도13을 통하여 설명한 구성 요소들과 대동소이하므로, 여기서 이에 대한 세세한 구성의 도시 및 설명은 생략하기로 하고, 이하 본 발명의 일 실시 예에 대하여 상세히 설명한다.
본 발명의 암 진단 장치는 도 14에 도시된 바와 같이 하드웨어로 구성되거나 또는 프로그램 구조에 의한 소프트웨어로 구성될 수도 있으며, 이하에서는 일 예로서 첨부된 순서도의 프로세스를 참조하여 소프트웨어로 구성된 CRC를 진단하기 위한 암 진단 장치에 대하여 상세히 설명하기로 한다.
(2-1) 시료 준비 - 혈청 수집 대상
전술한 표 101의 133명의 CRC 환자군, 전술한 표 102의 153명의 정상 대조군, 표 105의 111명의 BRC 환자군, 표 106의 36명의 비호지킨림프종(non-Hodgkin lymphoma, NHL) 환자군 및 표 107의 29명의 GC 환자군으로부터 혈청을 수집하였다
표 105
BRC Sex Ageyear Node ER ER% PR PR% HER2 Tumor Size cm
BRC-A1 F 48 - 5 33-66% 6 33-66% 2 -
BRC-A2 F 35 - 6 33-66% 6 33-66% 1 -
BRC-A3 F 45 pN1a 5 33-66% 5 33-66% 0 1.5
BRC-A4 F 61 - 0 0% 0 0% 2 -
BRC-A5 F 70 pN0(sn) 0 0% 0 0% 1 <0.1
BRC-A6 F 58 ypN0 3 <10% 3 10-33% 3 0.5
BRC-A7 F 49 ypN0(i+) 0 0% 0 0% 2 1.9
BRC-A8 F 49 ypN2a 0 0% 0 0% 1 2.5
BRC-A9 F 39 pN1a 6 33-66% 7 >66% 1 2.2
BRC-A10 F 48 ypN2a 6 33-66% 4 <10% 3 5.8
BRC-A11 F 39 - 0 0% 0 0% 1 -
BRC-A12 F 56 pN1a 6 33-66% 6 33-66% 0 2.8
BRC-A13 F 59 pN0(sn) 6 33-66% 2 <10% 1 2.3
BRC-A14 F 31 pN1a 5 33-66% 4 10-33% 1 2.2
BRC-A15 F 46 pN3a 6 33-66% 6 33-66% 1 3.5
BRC-A16 F 56 - 7 >66% 4 10-33% 1 -
BRC-A17 F 55 - 0 0% 0 0% 2 -
BRC-A18 F 46 pN0 0 0% 0 0% 0 1.5
BRC-A19 F 60 ypN0 0 0% 0 0% 3 1.9
BRC-A20 F 49 pN0(sn) 5 33-66% 2 <10% 2 1.5
BRC-A21 F 55 pN1mi 0 0% 0 0% 3 1.8
BRC-A22 F 65 pN0 6 33-66% 6 33-66% 0 1.7
BRC-A23 F 35 ypN2a 6 66% 4 10-33% 2 2.6
BRC-A24 F 46 pN1a 6 33-66% 6 33-66% 3 2.5
BRC-A25 F 45 pN0(sn) 6 33-66% 6 33-66% 1 0.8
BRC-A26 F 42 pN0(sn) 3 10-33% 6 33-66% 0 1
BRC-A27 F 58 pN0(sn) 6 33-66% 6 33-66% 1 1.5
BRC-A28 F 62 pN1a 0 0% 0 0% 2 2.2
BRC-A29 F 61 - 0 0% 0 0% 1 -
BRC-A30 F 60 - - - - - - -
BRC-A31 F 51 - - - - - - -
BRC-A32 F 42 pN0 7 >66% 7 >66% 2 -
BRC-A33 F 43 pN0(sn) 3 10-33% 4 10-33% 0 2.3
BRC-A34 F 60 pN0(sn) 0 0% 0 0% 1 2.3
BRC-A35 F 61 - 6 33-66% 0 0% 2 -
BRC-A36 F 61 pN0(sn) 0 0% 2 <10% 2 1.8
BRC-A37 F 49 - - - - - - -
BRC-A38 F 44 pN0 6 33-66% 7 >66% 1 1.2
BRC-A39 F 72 pN0(sn) 0 0% 0 0% 0 1.8
BRC-A40 F 48 pN0(sn) 5 33-66% 4 10-33% 1 0.8
BRC-A41 F 44 pN0 5 33-66% 7 >66% 1 2
BRC-A42 F 41 pN2a 5 33-66% 6 33-66% 1 4
BRC-A43 F 58 pN0 6 33-66% 0 0% 2 <0.1
BRC-A44 F 42 - 5 33-66% 6 33-66% 2 -
BRC-A45 F 44 pN1a 4 10-33% 2 <10% 2 5.5
BRC-A46 F 62 pN0(sn) 7 >66% 0 0% 0 2
BRC-A47 F 47 pN0 6 33-66% 6 33-66% 2 2.4
BRC-A48 F 52 pN1a 6 33-66% 0 0% 3 1.8
BRC-A49 F 44 pN0(sn) 6 33-66% 0 0% 0 2
BRC-A50 F 49 pN0(sn) 2 <10% 2 <10% 3 0.4
BRC-A51 F 46 pN0(sn) 6 33-66% 5 33-66% 1 0.7
BRC-A52 F 58 pN0(sn) 7 >66% 5 33-66% 1 2.3
BRC-A53 F 64 pN1a 6 33-66% 7 >66% 1 2
BRC-A54 F 47 - 6 33-66% 6 33-66% 2 -
BRC-A55 F 74 pN1a 6 33-66% 6 33-66% 1 1.8
BRC-A56 F 64 pN0(sn) 0 0% 0 0% 1 2.2
BRC-A57 F 40 ypN1a 6 33-66% 6 33-66% 1 3.5
BRC-A58 F 43 pN0 6 33-66% 6 33-66% 2 2.5
BRC-A59 F 43 ypN0 0 0% 0 0% 2 -
BRC-A60 F 42 pN0 0 0% 0 0% 0 2.3
BRC-A61 F 37 pN0(i+) 6 33-66% 6 33-66% 1 1
BRC-A62 F 50 pN1a 6 33-66% 6 33-66% 1 1
BRC-A63 F 57 pN0(sn) 6 33-66% 96 33-66% 1 1.4
BRC-A64 F 38 ypN0 0 0% 0 0% 1 2
BRC-A65 F 67 - 6 33-66% 2 <10% 1 -
BRC-A66 F 42 pN0(sn) 6 33-66% 6 33-66% 2 0.5
BRC-A67 F 46 pN0(sn) 6 33-66% 6 33-66% 1 1
BRC-A68 F 48 pN2a 4 10-33% 4 10-33% 3 2.5
BRC-A69 F 58 pN0 2 <10% 0 0 1 0.5
BRC-A70 F 53 pN0(sn) 0 0% 0 0% 3 <0.1
BRC-A71 F 56 - 0 0% 0 0% 0 -
BRC-A72 F 45 pN0(sn) 6 33-66% 6 33-66% 2 <0.1
BRC-A73 F 59 pN0(sn) 5 33-66% 0 0% 2 1.4
BRC-A74 F 40 ypN1a 2 <10% 0 0% 0 0.3
BRC-A75 F 34 pN0(sn) 2 <10% 0 0% 2 2
BRC-A76 F 69 - 6 33-66% 6 33-66% 1 -
BRC-A77 F 52 - - - - - - -
BRC-A78 F 67 - - - - - - -
BRC-A79 F 61 - 6 33-66% 2 <10% 0 -
BRC-A80 F 38 pN1a 6 33-66% 5 33-66% 1 -
BRC-A81 F 60 pN0 6 33-66% 3 10-33% 1 1
BRC-A82 F 55 pN2a 5 33-66% 0 0% 2 2.2
BRC-A83 F 46 ypN0 5 33-66% 2 <10% 1 1.5
BRC-A84 F 67 pN0 6 33-66% 6 33-66% 1 2.8
BRC-A85 F 46 pN1a 6 33-66% 6 33-66% 2 0.7
BRC-A86 F 39 pN1mi 6 33-66% 6 33-66% 2 2.5
BRC-A87 F 50 pN0(sn) 4 10-33% 5 33-66% 0 1
BRC-A88 F 31 pN1mi(sn) 6 33-66% 6 33-66% 1 1
BRC-A89 F 46 pN0 6 33-66% 7 >66% 1 1.2
BRC-A90 F 44 pN0(sn) 6 33-66% 7 >66% 1 2.5
BRC-A91 F 40 pN0 0 0% 0 0% 0 -
BRC-A92 F 40 - 6 33-66% 6 33-66% 1 -
BRC-A93 F 56 - 7 >66% 0 0 0 0.6
BRC-A94 F 48 pN1a 0 0% 0 0% 0 3
BRC-A95 F 39 pN0(sn) 6 33-66% 6 33-66% 1 3.5
BRC-A96 F 40 ypN1a 6 33-66% 4 10-33% 2 3
BRC-A97 F 48 pN0(sn) 6 33-66% 6 33-66% 0 2.5
BRC-A98 F 59 - 7 >66% 2 <10% 1 -
BRC-A99 F 46 - 0 0% 0 0% 2 -
BRC-A100 F 37 pN3a 6 33-66% 6 33-66% 2 0.6
BRC-A101 F 38 pN0(sn) 6 33-66% 6 33-66% 2 0.3
BRC-A102 F 66 pN1a 6 33-66% 6 33-66% 0 1.5
BRC-A103 F 58 pN0(sn) 0 0% 0 0% 2 1.7
BRC-A104 F 42 pN3a 5 33-66% 6 33-66% 0 1.8
BRC-A105 F 52 pN0 6 33-66% 6 33-66% 0 0.7
BRC-A106 F 46 pN0(sn) 0 0% 2 <10% 1 1.5
BRC-A107 F 42 pN0(sn) 4 10-33% 6 33-66% 1 0.6
BRC-A108 F 48 - - - - - - -
BRC-A109 F 47 pN0 6 33-66% 2 <10% 2 3
BRC-A110 F 59 pN1a 6 33-66% 4 10-33% 1 1.8
BRC-A111 F 56 - 0 0% 0 0% 3 -
표 106
NHL Sex Ageyear Stage Involved Site Subtype IPI
NHL-A1 M 65 3 multiple DLBL 3
NHL-A2 M 63 2 stomach DLBL 1
NHL-A3 M 65 3 multiple DLBL 3
NHL-A4 M 65 3 multiple Follicular L 2
NHL-A5 M 64 2 stomach DLBL 2
NHL-A6 M 52 3 multiple DLBL 2
NHL-A7 M 52 2 spleen, pancreatic LN DLBL 1
NHL-A8 M 52 3 multiple DLBL 2
NHL-A9 M 42 2 multiple DLBL 2
NHL-A10 M 44 1 stomach DLBL 1
NHL-A11 M 44 2 cervical LN, tonsil DLBL 0
NHL-A12 M 40 4 multiple DLBL 3
NHL-A13 M 39 1 nasal cavity NK/T cell L 1
NHL-A14 M 41 1 inguinal LN ALCL 0
NHL-A15 F 57 4 multiple DLBL 3
NHL-A16 F 38 2 tonsil, neck LN DLBL 0
NHL-A17 F 56 1 breast DLBL 0
NHL-A18 M 71 4 multiple Mantle cell L 3
NHL-A19 M 70 2 neck area LN DLBL 1
NHL-A20 M 80 2 stomach PTCL 1
NHL-A21 F 39 2 tonsil, neck LN DLBL 0
NHL-A22 F 38 4 multiple DLBL 3
NHL-A23 F 38 1 stomach DLBL 0
NHL-A24 M 67 4 multiple DLBL 2
NHL-A25 M 67 3 multiple Burkitt's L 3
NHL-A26 F 73 1 nasal cavity DLBL 2
NHL-A27 F 73 3 multiple DLBL 2
NHL-A28 F 41 1 0 DLBL 0
NHL-A29 M 49 3 multiple DLBL 3
NHL-A30 M 31 2 neck DLBL 0
NHL-A31 M 46 2 nasopharynx, tonsil DLBL 0
NHL-A32 M 71 - stomach r/o Lymphoma -
NHL-A33 M 73 1 nasal cavity DLBL 1
NHL-A34 M 73 4 tibia, leg(skin) DLBL 3
NHL-A35 M 72 2 stomach DLBL 1
NHL-A36 M 79 1 nasal cavity malignant L 2
표 107
GC Sex Ageyear CEAng/mL Stage GC Sex Ageyear CEAng/mL Stage
GC-A1 F 52 3.36 IV GC-A16 F 51 0.51 IV
GC-A2 M 65 0.99 IV GC-A17 M 63 27.18 IV
GC-A3 M 41 -a IV GC-A18 M 51 1.93 IV
GC-A4 M 78 4.93 IV GC-A19 M 64 2.41 IV
GC-A5 M 79 1.11 IV GC-A20 M 62 2.72 IV
GC-A6 M 76 2.37 IV GC-A21 M 71 8.46 IV
GC-A7 M 54 117.13 IV GC-A22 M 46 2.67 IV
GC-A8 M 58 2.24 IV GC-A23 M 68 24.93 IV
GC-A9 M 67 >1500 IV GC-A24 M 68 3.23 IV
GC-A10 F 71 1.92 IV GC-A25 M 57 41.32 IV
GC-A11 F 42 <0.4 IV GC-A26 M 71 2.8 IV
GC-A12 M 49 104.73 IV GC-A27 F 43 1.62 IV
GC-A13 M 65 1.69 IV GC-A28 M 58 6.6 IV
GC-A14 F 57 6.98 IV GC-A29 M 73 - IV
GC-A15 M 55 2.03 IV
또한, 이 462명을 집합 A1으로 하여 후술하는 바와 같이 그 부분 집합 A0로 제1훈련집합을 구성하였으며, 이 제1훈련집합에 대한 생물통계학적 분석을 통해 질량 이온별 가중치(인자적재값)를 계산하고, 예비 판별식을 획득하였다. 또한, 이 집합 A1 외에 표 108의 144명의 CRC 환자군, 표 109의 50명의 정상 대조군, 표 110의 25명의 BRC 환자군, 표 111의 15명의 NHL 환자군 및 표 112의 57명의 GC 환자군을 집합 A2(제2훈련집합)로 하여 훈련 집합을 확장하였다. 즉 예비 판별식을 구성하는 저질량 이온들의 예비 후보군으로부터 후술할 방법에 따라 CRC 진단용 저질량 이온들을 확인할 때에는 서로 독립적인 집합인 집합 A1과 집합 A2의 합집합, 즉 집합 A를 훈련 집합으로 사용하였다.
표 108
CRC Sex Ageyear Stage Location Cell Type CEAng/mL
CRC-A134 M 49 I Rectum AC 6.6
CRC-A135 F 60 III A-colon AC 30.4
CRC-A136 M 69 IV A-colon AC 33.5
CRC-A137 M 43 III A-colon MAC 77.6
CRC-A138 F 69 III Rectum AC 1.0
CRC-A139 M 72 III A-colon AC 2.4
CRC-A140 M 54 II Rectum AC 4.6
CRC-A141 M 58 II S-colon AC 2.9
CRC-A142 F 52 III S-colon AC 9.2
CRC-A143 M 52 III S-colon AC 3.2
CRC-A144 M 78 IV Rectum AC 4.1
CRC-A145 F 55 III Rectum AC 0.9
CRC-A146 M 65 II S-colon AC 1.7
CRC-A147 F 46 I S-colon AC 1.4
CRC-A148 M 77 III S-colon AC 2.5
CRC-A149 F 52 II S-colon AC <0.5
CRC-A150 F 47 III S-colon AC 1.5
CRC-A151 M 48 III S-colon AC 1.7
CRC-A152 F 76 II S-colon AC 2.2
CRC-A153 M 51 II S-colon ASC 8.6
CRC-A154 M 61 I Rectum AC 1.4
CRC-A155 M 56 II Rectum AC 3
CRC-A156 F 70 III S-colon MAC 36.0
CRC-A157 M 64 III A-colon AC 2.2
CRC-A158 F 54 III Rectum AC 5.5
CRC-A159 F 77 II Rectum AC 6.2
CRC-A160 M 53 III Rectum AC 1.4
CRC-A161 M 43 I Rectum AC 0.5
CRC-A162 M 81 III A-colon MAC 10.9
CRC-A163 F 52 III A-colon AC 1.2
CRC-A164 F 71 III A-colon AC 2.8
CRC-A165 M 84 III Rectum AC 15.0
CRC-A166 F 33 III D-colon AC 4.7
CRC-A167 F 68 III Rectum AC 3.3
CRC-A168 M 69 III Rectum AC 3.5
CRC-A169 F 61 III A-colon AC 2.8
CRC-A170 M 44 II T-colon AC 1.8
CRC-A171 F 82 II A-colon AC 2.8
CRC-A172 M 38 IV Rectum AC 2.1
CRC-A173 M 73 III Rectum AC 11.1
CRC-A174 M 64 III D-colon AC 8.2
CRC-A175 M 67 II A-colon AC 20.1
CRC-A176 M 72 II A-colon AC 3.4
CRC-A177 M 59 II S-colon AC 2.1
CRC-A178 M 53 I Rectum AC 3.5
CRC-A179 M 70 II Rectum AC 1.3
CRC-A180 M 55 II Rectum AC 22.0
CRC-A181 M 62 II Rectum AC 6.1
CRC-A182 M 64 III Rectum AC 4.8
CRC-A183 M 62 IV Rectum AC 25.3
CRC-A184 M 51 III Rectum AC 149.3
CRC-A185 F 45 II Rectum AC 2.7
CRC-A186 F 49 II Rectum AC 2.1
CRC-A187 F 45 0 Rectum AC 0.9
CRC-A188 M 62 III Rectum AC 2.4
CRC-A189 M 54 0 Rectum AC 6.9
CRC-A190 M 45 0 Rectum AC 7.4
CRC-A191 F 54 0 Rectum AC 3.6
CRC-A192 M 69 II Rectum AC 24.0
CRC-A193 M 51 I Rectum AC 2.7
CRC-A194 M 45 I Rectum AC 3.2
CRC-A195 M 67 I Rectum AC 2.9
CRC-A196 M 60 I Rectum AC 1.5
CRC-A197 M 49 0 Rectum AC 0.8
CRC-A198 M 71 I Rectum AC 9.8
CRC-A199 M 62 III Rectum AC 2.5
CRC-A200 M 54 II Rectum AC 4.6
CRC-A201 M 56 II Rectum AC 3.0
CRC-A202 F 71 III Rectum AC 6.7
CRC-A203 M 73 0 Rectum AC 61.5
CRC-A204 F 50 III Rectum AC 2.2
CRC-A205 F 49 0 Rectum AC 1.6
CRC-A206 F 42 III Rectum AC 9.9
CRC-A207 M 61 III Rectum AC 68.1
CRC-A208 F 72 II Rectum AC 8
CRC-A209 F 69 III Rectum AC 11.3
CRC-A210 M 58 II Rectum AC 5.3
CRC-A211 M 56 I Rectum AC 24.8
CRC-A212 M 72 III Rectum AC 1.4
CRC-A213 M 62 III Rectum AC 1.6
CRC-A214 M 55 II Rectum AC 2.4
CRC-A215 F 71 III Rectum AC 1.3
CRC-A216 M 59 III Rectum AC 2.8
CRC-A217 M 52 II Rectum AC 4.0
CRC-A218 M 47 III Rectum AC 2.3
CRC-A219 M 58 II Rectum AC 1.1
CRC-A220 M 60 0 Rectum AC 2.0
CRC-A221 M 64 I Rectum AC 2.0
CRC-A222 M 41 III Rectum AC 1.6
CRC-A223 M 48 I Rectum AC 0.8
CRC-A224 M 58 II Rectum AC 1.1
CRC-A225 M 61 I Rectum AC 2.6
CRC-A226 M 63 I Rectum AC 1.3
CRC-A227 F 52 II Rectum AC 1.6
CRC-A228 M 53 II Rectum AC 2.0
CRC-A229 M 64 I Rectum AC 2.0
CRC-A230 M 73 II Rectum AC 5.6
CRC-A231 M 41 III Rectum AC 1.6
CRC-A232 M 57 III Rectum AC 2.0
CRC-A233 M 48 I Rectum AC 0.8
CRC-A234 M 72 III Rectum AC 6.1
CRC-A235 F 67 0 Rectum AC 4.4
CRC-A236 F 66 II Rectum AC 4.8
CRC-A237 M 47 III S-colon AC 3.7
CRC-A238 M 40 III A-colon AC 1.2
CRC-A239 M 55 II D-colon AC 6.0
CRC-A240 F 73 I D-colon, T-colon AC 2.0
CRC-A241 F 69 I A-colon AC 5.0
CRC-A242 F 69 I A-colon AC 5.7
CRC-A243 F 74 II D-colon AC 12.5
CRC-A244 M 61 II S-colon MAC 1.9
CRC-A245 M 37 III Rectum AC 6.0
CRC-A246 M 60 III S-colon AC 5.4
CRC-A247 M 70 II S-colon AC 2.6
CRC-A248 M 68 III Rectum AC 13.2
CRC-A249 M 73 I Rectum AC 1.7
CRC-A250 M 82 III T-colon AC 2.1
CRC-A251 F 75 II Rectum AC 0.9
CRC-A252 F 57 I A-colon AC 1.5
CRC-A253 F 62 III S-colon AC 4.4
CRC-A254 M 73 II Rectum AC 15.5
CRC-A255 M 59 I S-colon AC 1.1
CRC-A256 F 74 III Rectum AC 31.0
CRC-A257 F 70 I A-colon AC 2.5
CRC-A258 M 74 II S-colon AC 15.4
CRC-A259 M 69 II Rectum AC 2.1
CRC-A260 M 61 II A-colon, T-colon AC 2.3
CRC-A261 M 73 I Rectum AC 1.9
CRC-A262 M 64 I Rectum AC 2.8
CRC-A263 M 69 II D-colon AC 5.0
CRC-A264 M 58 III Rectum AC 1.6
CRC-A265 M 73 II T-colon AC 2.6
CRC-A266 M 70 II A-colon AC 20.8
CRC-A267 M 56 IV Rectum AC 29.9
CRC-A268 F 70 II A-colon AC 5.9
CRC-A269 M 71 III S-colon AC 110.1
CRC-A270 M 47 III Rectum AC 13.7
CRC-A271 M 61 III Rectum AC 2.8
CRC-A272 F 77 II S-colon AC 1.5
CRC-A273 F 62 III Rectum AC 13.7
CRC-A274 M 61 II S-colon AC 2.3
CRC-A275 M 66 II S-colon AC 1.7
CRC-A276 M 64 III A-colon AC 1.0
CRC-A277 M 69 II S-colon AC 23.0
ASC: Adenosquamous carcinoma
표 109
Control Sex Ageyear CEAng/mL Control Sex Ageyear CEAng/mL
CONT-A154 F 51 1.7 CONT-A179 F 63 1.8
CONT-A155 F 62 1.3 CONT-A180 F 65 1.1
CONT-A156 M 54 4.2 CONT-A181 M 64 1.4
CONT-A157 F 63 1.6 CONT-A182 F 55 4.8
CONT-A158 F 60 1.9 CONT-A183 M 63 2.6
CONT-A159 F 68 1.4 CONT-A184 F 52 4.1
CONT-A160 F 62 1.9 CONT-A185 M 51 4.0
CONT-A161 F 68 5.6 CONT-A186 M 59 2.0
CONT-A162 M 63 4.5 CONT-A187 M 68 4.6
CONT-A163 M 50 2.1 CONT-A188 M 50 5.0
CONT-A164 F 53 2.3 CONT-A189 F 64 <0.5
CONT-A165 M 60 3.3 CONT-A190 F 63 2.2
CONT-A166 M 64 1.8 CONT-A191 M 64 1.7
CONT-A167 M 63 3.4 CONT-A192 M 51 2.3
CONT-A168 F 63 1.1 CONT-A193 F 62 1.1
CONT-A169 M 53 2.0 CONT-A194 M 54 2.5
CONT-A170 F 51 2.0 CONT-A195 F 53 0.7
CONT-A171 M 57 3.3 CONT-A196 F 65 3.8
CONT-A172 M 61 2.8 CONT-A197 F 64 1.5
CONT-A173 F 68 1.4 CONT-A198 F 53 1.0
CONT-A174 F 52 1.5 CONT-A199 M 50 1.1
CONT-A175 M 60 4.6 CONT-A200 F 66 1.7
CONT-A176 M 55 2.2 CONT-A201 F 50 1.0
CONT-A177 M 55 1.8 CONT-A202 F 50 1.9
CONT-A178 M 56 2.2 CONT-A203 M 61 1.5
표 110
BRC Sex Ageyear Node ER ER% PR PR% HER2 Tumor Sizecm
BRC-A112 F 61 pN0(i+0) 7 >95% 0 0% 0 4
BRC-A113 F 53 pN0 7 80% 5 25% 0 0.6
BRC-A114 F 49 pN0 3 20% 7 60% 0 0.3
BRC-A115 F 57 pN0 0 0% 0 0% 0 0.8
BRC-A116 F 68 pN0 0 0% 3 1% 3 1.2
BRC-A117 F 58 pN0 8 95% 4 40% 0 0.8
BRC-A118 F 40 - 8 95% 8 95% 0 -
BRC-A119 F 29 pN0 8 95% 8 95% 1 1.2
BRC-A120 F 40 - - - - - - -
BRC-A121 F 61 pN0(i+0) 7 >95% 0 0% 0 4
BRC-A122 F 40 - 8 95% 8 95% 0 -
BRC-A123 F 43 pN0 0 0% 0 0% 3 0.7
BRC-A124 F 59 pN0 8 95% 8 95% 0 1.2
BRC-A125 F 45 PN2 7 95% 8 95% 1 2.1
BRC-A126 F 55 pN0 0 0% 0 0% 3 1.8
BRC-A127 F 52 pN0 7 80-90% 8 80-90% 0 0.3
BRC-A128 F 59 pN0 8 95% 5 2~3% 1 1.3
BRC-A129 F 39 - 7 >95% 7 70-80% 0 -
BRC-A130 F 39 pN0 0 0% 0 0% 3 1.1
BRC-A131 F 40 pN0 5 50-60% 5 20-30% 0 0.8
BRC-A132 F 46 pN0 7 95% 8 95% 0 4.9
BRC-A133 F 51 pN0 0 <1% 0 0% 0 0.9
BRC-A134 F 61 pN0 7 90% 8 90% 0 1.3
BRC-A135 F 48 pN0 0 0% 0 0% 0 0.6
BRC-A136 F 47 pN0 8 >95% 8 95% 0 0.7
표 111
NHL Sex Ageyear Stage Involved Site Subtype IPI
NHL-A37 F 69 3 multiple ATCL 3
NHL-A38 F 72 1 stomach DLBL 2
NHL-A39 M 24 4 multiple DLBL 3
NHL-A40 F 41 2 stomach DLBL 1
NHL-A41 F 48 4 multiple DLBL 3
NHL-A42 F 66 2 gum, submandibular DLBL 1
NHL-A43 F 61 2 stomach DLBL 3
NHL-A44 M 38 4 multiple Hodgkin L -
NHL-A45 M 70 4 multiple DLBL 3
NHL-A46 M 37 1 cervical LN DLBL 0
NHL-A47 M 64 4 multiple DLBL 4
NHL-A48 F 76 2 stomach DLBL 1
NHL-A49 M 34 2 neck, SCN DLBL 1
NHL-A50 M 25 4 multiple PTCL 2
NHL-A51 M 70 2 stomach DLBL 1
표 112
GC Sex Ageyear CEAng/mL Stage GC Sex Ageyear CEAng/mL Stage
GC-A30 M 70 1.26 III GC-A59 M 62 - II
GC-A31 M 62 5.41 I GC-A60 M 67 - II
GC-A32 M 58 - I GC-A61 F 64 - II
GC-A33 M 62 1.34 I GC-A62 F 40 - II
GC-A34 M 32 - I GC-A63 M 64 - II
GC-A35 M 71 3.54 I GC-A64 M 68 - II
GC-A36 M 56 2.83 I GC-A65 M 54 - II
GC-A37 M 69 21.71 II GC-A66 F 52 - II
GC-A38 F 62 - I GC-A67 M 59 - II
GC-A39 M 52 1.86 I GC-A68 F 81 - II
GC-A40 F 64 4.16 I GC-A69 M 46 - III
GC-A41 M 59 - II GC-A70 M 62 - III
GC-A42 M 61 10.41 IV GC-A71 M 51 - III
GC-A43 F 68 5.56 III GC-A72 M 42 - III
GC-A44 M 48 1.44 III GC-A73 M 81 - III
GC-A45 F 80 - III GC-A74 F 81 - III
GC-A46 M 66 - IV GC-A75 M 70 - III
GC-A47 F 57 2.46 IV GC-A76 M 51 - III
GC-A48 M 46 1.68 III GC-A77 M 68 - IV
GC-A49 M 79 - I GC-A78 M 68 - IV
GC-A50 M 81 - I GC-A79 F 33 - IV
GC-A51 M 52 - I GC-A80 M 31 - IV
GC-A52 M 53 - I GC-A81 M 52 - IV
GC-A53 M 67 - I GC-A82 M 59 - IV
GC-A54 M 61 - I GC-A83 M 56 - IV
GC-A55 F 77 - I GC-A84 M 82 - IV
GC-A56 F 74 - I GC-A85 F 52 - IV
GC-A57 F 81 - I GC-A86 M 82 - IV
GC-A58 F 55 - I
또한, 집합 A와 독립된 표 113의 143명의 CRC 환자군, 표 114의 50명의 정상 대조군, 표 115의 25명의 BRC 환자군, 표 116의 15명의 NHL 환자군, 표 117의 55명의 GC 환자군, 표 118의 25명의 난소암(ovarian cancer, OVC) 환자군, 표 119의 19명의 Tis 또는 Advanced Adenoma (TA) 환자군을 집합 B로 하여 검증 집합을 구성하였다. OVC 환자군과 TA 환자군은 질량 이온별 가중치를 구할 때나 CRC 진단용 저질량 이온을 확인할 때 전혀 반영되지 않은 환자군들로, 본 발명에서 구성한 판별식으로 이 환자군들이 어떻게 판별되는지 살펴보기 위하여 포함하였다.
표 113
CRC Sex Ageyear Stage Location Cell Type CEAng/mL
CRC-B1 F 51 II Rectum AC 6.7
CRC-B2 M 71 I Rectum AC 9.8
CRC-B3 F 47 I Rectum AC 3.9
CRC-B4 F 50 IV Rectum AC 62.0
CRC-B5 M 79 II S-colon AC 6.2
CRC-B6 F 54 I Rectum AC 1.6
CRC-B7 F 52 III S-colon AC 22.1
CRC-B8 M 61 III Rectum AC 128.1
CRC-B9 F 47 III S-colon AC 1.2
CRC-B10 M 73 I S-colon AC 7.1
CRC-B11 F 74 I S-colon AC 2.3
CRC-B12 M 71 III A-colon AC 8.2
CRC-B13 M 57 IV Rectum AC 6.4
CRC-B14 M 57 IV S-colon AC 41.7
CRC-B15 M 52 III S-colon AC 4.1
CRC-B16 F 64 III S-colon AC 6.8
CRC-B17 M 48 IV A-colon AC 59.4
CRC-B18 F 51 III S-colon AC 1.2
CRC-B19 M 67 IV Rectum AC 16.2
CRC-B20 M 71 I Rectum AC 83.7
CRC-B21 M 59 I S-colon AC 3.0
CRC-B22 F 66 IV S-colon AC 18.5
CRC-B23 F 78 IV A-colon AC 12.6
CRC-B24 M 55 III A-colon AC 1.2
CRC-B25 M 62 III Rectum AC 2.5
CRC-B26 M 38 III Rectum AC 6.1
CRC-B27 F 65 III D-colon AC 3.5
CRC-B28 M 49 III S-colon, T-colon AC 3.8
CRC-B29 F 59 II A-colon AC 1
CRC-B30 M 62 II S-colon AC -
CRC-B31 F 54 IV S-colon AC 27.9
CRC-B32 M 66 III S-colon AC 10.7
CRC-B33 M 84 II S-colon AC 11.3
CRC-B34 F 54 III S-colon AC 8.8
CRC-B35 M 68 II Rectum AC 5.8
CRC-B36 M 54 II A-colon AC 1.1
CRC-B37 M 62 III S-colon AC 10.8
CRC-B38 F 60 III S-colon, A-colon AC 28.5
CRC-B39 F 51 II D-colon AC 5.9
CRC-B40 F 73 III Rectum AC 3.7
CRC-B41 F 54 III D-colon AC 1122.2
CRC-B42 M 64 I Rectum AC 2.5
CRC-B43 F 69 II S-colon, A-colon AC 5.1
CRC-B44 M 39 II S-colon AC 2.9
CRC-B45 M 74 II Rectum AC 7.9
CRC-B46 F 59 III Rectum AC 1.4
CRC-B47 M 56 I Rectum AC 2.6
CRC-B48 M 69 II Rectum AC 14.0
CRC-B49 M 58 II Rectum AC 10.2
CRC-B50 F 75 II Rectum AC 2.4
CRC-B51 M 47 II Rectum AC 3.2
CRC-B52 F 68 II Rectum AC 0.7
CRC-B53 M 52 III Rectum AC 2.9
CRC-B54 M 68 I Rectum AC 7.0
CRC-B55 M 51 II Rectum AC 1.4
CRC-B56 M 66 0 Rectum AC 1.2
CRC-B57 M 74 0 Rectum AC 4.5
CRC-B58 M 43 II Rectum AC 12.3
CRC-B59 M 68 III Rectum AC 2.5
CRC-B60 M 68 III Rectum AC 19.4
CRC-B61 F 56 I Rectum AC 2.3
CRC-B62 M 63 0 Rectum AC 1.3
CRC-B63 M 65 II Rectum AC 2.1
CRC-B64 M 60 II Rectum AC 4.6
CRC-B65 M 51 II Rectum AC 1.3
CRC-B66 M 44 0 Rectum AC 2.2
CRC-B67 M 61 II Rectum AC 2.0
CRC-B68 M 57 III Rectum AC 2.2
CRC-B69 M 41 II Rectum AC 3.1
CRC-B70 M 50 I Rectum AC 4.9
CRC-B71 F 56 III Rectum AC 1.0
CRC-B72 M 54 III Rectum AC 1.7
CRC-B73 F 69 I Rectum AC 1.5
CRC-B74 M 54 I Rectum AC 2.6
CRC-B75 M 61 II Rectum AC 3.7
CRC-B76 M 72 III Rectum AC 3.0
CRC-B77 F 71 III Rectum AC 1.8
CRC-B78 M 54 II Rectum AC 3.0
CRC-B79 M 77 II Rectum AC 1.6
CRC-B80 M 67 III Rectum AC 1.1
CRC-B81 M 59 II Rectum AC 7.2
CRC-B82 M 56 III Rectum AC 9.0
CRC-B83 F 51 I Rectum AC 1.5
CRC-B84 F 67 III Rectum AC 3.4
CRC-B85 F 76 III Rectum AC 1.0
CRC-B86 F 38 III Rectum AC 0.7
CRC-B87 M 53 II Rectum AC 3.3
CRC-B88 M 58 III Rectum AC 1.6
CRC-B89 M 69 III Rectum AC 6.4
CRC-B90 F 60 I Rectum AC 1.2
CRC-B91 M 52 II Rectum AC 4.0
CRC-B92 M 59 III Rectum AC 2.8
CRC-B93 F 56 III Rectum AC 2.3
CRC-B94 F 68 I Rectum AC 2.0
CRC-B95 M 65 I Rectum AC 1.6
CRC-B96 M 33 II Rectum AC 1.9
CRC-B97 M 61 III Rectum AC 3.2
CRC-B98 F 41 III Rectum AC 1.5
CRC-B99 M 61 I Rectum AC 1.6
CRC-B100 F 34 III Rectum AC 5.2
CRC-B101 M 47 III Rectum AC 2.3
CRC-B102 F 61 III A-colon AC 30.4
CRC-B103 M 71 IV A-colon AC 33.5
CRC-B104 M 44 III A-colon MAC 77.6
CRC-B105 F 71 III Rectum AC 1.0
CRC-B106 M 59 II S-colon AC 2.9
CRC-B107 M 79 IV Rectum AC 4.1
CRC-B108 M 66 II S-colon AC 1.7
CRC-B109 M 78 III S-colon AC 2.5
CRC-B110 F 53 II S-colon AC 1.3
CRC-B111 M 50 III S-colon AC 1.7
CRC-B112 F 77 II S-colon AC 2.2
CRC-B113 M 53 II S-colon ASC 8.6
CRC-B114 M 63 I Rectum AC 1.4
CRC-B115 F 71 III S-colon MAC 36.0
CRC-B116 F 79 II Rectum AC 6.2
CRC-B117 M 83 III A-colon MAC 10.9
CRC-B118 F 53 III A-colon AC 1.2
CRC-B119 F 72 III A-colon AC 2.8
CRC-B120 F 34 III D-colon AC 4.7
CRC-B121 M 70 III Rectum AC 3.5
CRC-B122 F 62 III A-colon AC 2.8
CRC-B123 M 45 II T-colon AC 1.8
CRC-B124 F 84 II A-colon AC 2.8
CRC-B125 M 74 III Rectum AC 11.1
CRC-B126 M 65 III D-colon AC 8.2
CRC-B127 M 69 II A-colon AC 20.1
CRC-B128 M 73 II A-colon AC 2.3
CRC-B129 M 61 II S-colon AC 2.1
CRC-B130 F 71 II S-colon AC 15.3
CRC-B131 F 56 I S-colon AC 0.7
CRC-B132 F 70 II S-colon AC 1.4
CRC-B133 F 62 III Rectum AC 235.4
CRC-B134 M 61 III S-colon AC 11.2
CRC-B135 F 52 III S-colon AC 6.4
CRC-B136 M 62 II S-colon AC 4.9
CRC-B137 F 61 III T-colon AC 13.9
CRC-B138 F 88 II A-colon AC 3.0
CRC-B139 M 73 II S-colon AC 16.5
CRC-B140 M 69 III A-colon AC 1.7
CRC-B141 M 71 III A-colon MAC 2.4
CRC-B142 F 45 0 Rectum AC -
CRC-B143 M 66 0 Rectum AC 58.4
표 114
Control Sex Ageyear CEAng/mL Control Sex Ageyear CEAng/mL
CONT-B1 M 64 2.4 CONT-B26 F 56 1.7
CONT-B2 M 53 3.3 CONT-B27 F 52 1.7
CONT-B3 M 63 0.9 CONT-B28 M 63 1.0
CONT-B4 M 57 1.5 CONT-B29 F 60 1.8
CONT-B5 F 66 1.6 CONT-B30 F 58 0.7
CONT-B6 M 60 1.5 CONT-B31 M 65 4.1
CONT-B7 M 57 2.2 CONT-B32 M 52 2.2
CONT-B8 M 53 1.9 CONT-B33 F 58 3.1
CONT-B9 M 60 0.8 CONT-B34 M 65 2.8
CONT-B10 F 50 2.6 CONT-B35 M 66 0.8
CONT-B11 F 53 2.6 CONT-B36 M 69 2.1
CONT-B12 M 64 1.5 CONT-B37 F 54 1.6
CONT-B13 F 60 3.7 CONT-B38 M 50 1.9
CONT-B14 M 58 1.2 CONT-B39 F 60 1.1
CONT-B15 F 66 1.1 CONT-B40 F 55 8.8
CONT-B16 M 57 2.9 CONT-B41 M 62 0.9
CONT-B17 F 68 5.5 CONT-B42 F 51 2.0
CONT-B18 M 56 1.7 CONT-B43 M 65 2.3
CONT-B19 M 51 3.4 CONT-B44 M 52 2.4
CONT-B20 F 56 1.3 CONT-B45 F 64 1.7
CONT-B21 M 57 1.5 CONT-B46 M 57 0.8
CONT-B22 M 61 4.2 CONT-B47 F 54 <0.5
CONT-B23 F 51 1.9 CONT-B48 F 59 0.8
CONT-B24 F 51 1.6 CONT-B49 F 65 1.6
CONT-B25 F 52 1.4 CONT-B50 F 68 1.6
표 115
BRC Sex Ageyear Node ER ER% PR PR% HER2 Tumor Sizecm
BRC-B1 F 45 ypN0 0 0% 0 0% 0 0.9
BRC-B2 F 59 pN0 0 0% 0 0% 3 1.1
BRC-B3 F 43 pN1 0 0% 0 0% 0 1.5
BRC-B4 F 46 pN1 8 100% 8 100% 0 1.3
BRC-B5 F 48 pN0 6 50-60% 5 10-20% 3 1.3
BRC-B6 F 39 pN0 0 0% 0 0% 0 2.2
BRC-B7 F 66 pN0 8 95% 8 95% 0 1.7
BRC-B8 F 39 ypN0 0 0% 0 0% 0 DCIS
BRC-B9 F 37 pN0 7 70-80% 8 80% 3 1.5
BRC-B10 F 64 pN0 8 95% 8 95% 0 0.5
BRC-B11 F 44 ypN1 7 90% 8 95% 0 2
BRC-B12 F 50 pN2 8 95% 8 100% 0 1.1
BRC-B13 F 47 pN0 7 70% 7 50-60% 1 0.5
BRC-B14 F 44 pN1 8 90% 8 95% 1 0.6
BRC-B15 F 50 pN0 0 0% 0 0% 2 2.2
BRC-B16 F 53 pN0 7 95% 8 95% 0 1.1
BRC-B17 F 65 pN0 8 95% 7 40% 0 1.5
BRC-B18 F 39 pN1 7 >95% 3 <10% 0 2.2
BRC-B19 F 54 pN0(i+) 7 95% 5 10-30% 1 1.7
BRC-B20 F 48 pN3a 7 90% 8 90% 0 3.2
BRC-B21 F 54 pN0 0 0% 0 0% 0 3
BRC-B22 F 43 pN0 7 50-60% 7 50-60% 3 2.3
BRC-B23 F 61 pN0 8 95% 8 95% 0 1.6
BRC-B24 F 54 - 0 0% 0 0% 3 -
BRC-B25 F 46 pN0 7 80% 8 95% 0 2.2
표 116
NHL Sex Ageyear Stage Involved Site Subtype IPI
NHL-B1 M 58 3 multiple DLBL 2
NHL-B2 F 24 4 multiple DLBL 4
NHL-B3 M 56 4 multiple DLBL 3
NHL-B4 M 54 2 stomach DLBL 1
NHL-B5 F 76 4 multiple DLBL 3
NHL-B6 F 69 4 multiple Mantle cell L 4
NHL-B7 F 49 1 mandibular area DLBL 0
NHL-B8 F 64 4 multiple DLBL 5
NHL-B9 M 44 4 multiple DLBL 2
NHL-B10 F 70 4 multiple DLBL 3
NHL-B11 M 25 4 multiple NK/T cell L 3
NHL-B12 F 48 1 neck, submandibular DLBL 0
NHL-B13 F 48 1 breast DLBL 1
NHL-B14 M 48 4 multiple DLBL 3
NHL-B15 M 67 4 multiple MZBCL 2
표 117
GC Sex Age year CEAng/mL Stage GC Sex Age year CEAng/mL Stage
GC-B1 F 62 8.30 III GC-B29 F 57 - II
GC-B2 M 64 - III GC-B30 M 78 - II
GC-B3 M 58 6.89 III GC-B31 M 75 - II
GC-B4 M 34 3.57 IV GC-B32 F 67 - II
GC-B5 M 69 1.39 IV GC-B33 M 50 - II
GC-B6 M 49 1.67 IV GC-B34 F 60 - II
GC-B7 F 34 13.44 IV GC-B35 F 47 - II
GC-B8 F 47 2.86 III GC-B36 M 69 - II
GC-B9 F 40 0.64 IV GC-B37 M 72 - II
GC-B10 F 60 1.20 II GC-B38 F 49 - II
GC-B11 M 66 11.68 IV GC-B39 F 55 - III
GC-B12 M 73 - II GC-B40 F 46 - III
GC-B13 M 53 1.00 III GC-B41 M 64 - III
GC-B14 M 51 5.60 IV GC-B42 M 53 - III
GC-B15 M 42 0.69 III GC-B43 M 61 - III
GC-B16 M 81 - III GC-B44 F 81 - III
GC-B17 M 72 - II GC-B45 F 36 - III
GC-B18 M 66 1.22 IV GC-B46 M 50 - IV
GC-B19 F 49 - II GC-B47 M 55 - IV
GC-B20 M 48 - I GC-B48 M 66 - IV
GC-B21 M 51 - I GC-B49 F 40 - IV
GC-B22 M 44 - I GC-B50 M 61 - IV
GC-B23 F 44 - I GC-B51 M 70 - IV
GC-B24 M 61 - I GC-B52 M 39 - IV
GC-B25 M 76 - I GC-B53 M 70 - IV
GC-B26 M 51 - I GC-B54 F 71 - IV
GC-B27 F 40 - I GC-B55 F 52 - IV
GC-B28 M 62 I
표 118
OVC Ageyear Stage Histology
OVC-B1 56 IIIc Clear cell carcinoma
OVC-B2 52 IIa Endometrioid adenocarcinoma
OVC-B3 63 IV Papillary serous adenocarcinoma
OVC-B4 55 Ia Malignant Brenner tumor
OVC-B5 47 IIIc Papillary serous adenocarcinoma
OVC-B6 50 Ic Clear cell carcinoma
OVC-B7 68 Ib Serous adenocarcinoma
OVC-B8 74 IIIc Papillary serous adenocarcinoma
OVC-B9 43 Ic Mucinous adenocarcinoma
OVC-B10 44 IIIc Papillary serous adenocarcinoma
OVC-B11 54 IIIc Papillary serous adenocarcinoma
OVC-B12 55 IV Serous adenocarcinoma
OVC-B13 72 IIIc Serous adenocarcinoma
OVC-B14 58 IIIc Mucinous adenocarcinoma
OVC-B15 44 IIIc Papillary serous adenocarcinoma
OVC-B16 57 IV Serous adenocarcinoma
OVC-B17 54 IIIc Papillary serous adenocarcinoma
OVC-B18 73 IIIc Serous adenocarcinoma
OVC-B19 47 IIIc Papillary serous adenocarcinoma
OVC-B20 40 Ic Papillary serous adenocarcinoma
OVC-B21 74 IIb Transitional cell carcinoma
OVC-B22 65 IIIc Papillary serous adenocarcinoma
OVC-B23 47 IV Serous adenocarcinoma
OVC-B24 58 IIc Serous adenocarcinoma
OVC-B25 57 Ib Mixed cell adenocarcinoma
표 119
TA Sex Ageyear FOBT CEAng/mL
TA-B1 M 70 Negative 2.0
TA-B2 M 58 Negative 2.0
TA-B3 M 52 Negative 0.6
TA-B4 M 48 -a 2.6
TA-B5 F 59 Negative 5.8
TA-B6 M 77 Negative 5.1
TA-B7 F 53 Negative 3.2
TA-B8 M 63 Negative -
TA-B9 F 68 - -
TA-B10 M 54 Negative 79.4
TA-B11 M 69 - 1.1
TA-B12 M 56 - 0.5
TA-B13 M 53 - 2.0
TA-B14 F 76 Negative 2.7
TA-B15 M 63 Positive 3.2
TA-B16 F 54 Negative 0.7
TA-B17 F 62 - 1.1
TA-B18 F 64 Negative 1.6
TA-B19 F 46 Positive 1.2
(2-2) 시료 준비 - 혈청 준비 및 질량 스펙트럼 측정
4배 부피의 메탄올/클로로포름(2:1, v/v)을 25㎕의 혈청과 함께 격렬하게 섞은 후에 10분 동안 실온에서 배양하였다. 혼합물은 4℃에서 10분 동안 6000 × g로 원심 분리하였다. 수득한 상청액을 1시간 동안 농축기(concentrator)에서 완전히 건조시켰으며, 30분 동안 교반기(vortexer)에서 30㎕의 50% 아세토니트릴(acetonitrile)/0.1% 트라이플루오린화 아세트산(trifluoroacetic acid, TFA)으로 용해시켰다.
메탄올/클로로포름 추출물을 50% 아세토니트릴/0.1% TFA 내에서 알파-시아노-4-하이드록시 시남산(α-cyano-4-hydroxycinnamic acid) 용액과 혼합하였으며(1:12, v/v), 1㎕의 혼합물을 MALDI-타깃 플레이트(target plate)에 위치시켰다. CRC 환자 및 비환자 혈청 추출물의 질량 스펙트럼을 Proteomics Analyzer(Applied Biosystems, Foster City, CA, USA)를 사용하여 측정하였다.
한 개의 시료에 대해 질량 스펙트럼 데이터는 20번 반복 측정된 스펙트럼의 평균으로 추출된다. 모든 개별 시료의 질량값 구간은 최대 질량값이 약 2500 m/z이 되도록 조정하였다. 실험적 오류를 최소화하기 위하여, 초점 질량(focus mass), 레이저 강도(laser intensity), 타깃 플레이트, 데이터 수집 시각(data acquisition time)을 포함하는 다양한 요소를 점검하였다.
바람직한 초점 질량 및 레이저 강도로 500 m/z 및 5000이 각각 고정되어 사용되었다. 모든 시료들은 고정된 초점 질량 및 레이저 강도와 함께, 다른 추출 및 다른 데이터 수집 시각하에서 최소 5번 반복 측정하였다. 질량 이온별 가중치를 계산한 집합 A1의 경우는 추가로 한 번 더 측정하였다.
따라서, 저질량 이온 검출수단(4000)은 MALDI-TOF 질량분석기를 이용하여 상기와 같은 과정을 통해서 혈청 시료로부터 저질량 이온 질량 스펙트럼을 추출할 수 있다.
(2-3) 판별 전략
구성한 판별식이 CRC 특이적인 식이 되기 위해서는 CRC 환자군은 판별식에 의해 정상 대조군뿐만 아니라 다른 암환자군과도 구분되어야 한다. 본 실시 예에서는 다른 암환자군으로 BRC 환자군, NHL 환자군 및 GC 환자군을 사용하고자 한다. 한 개의 판별식으로 CRC 환자군과 비환자군(정상 대조군, BRC 환자군, NHL 환자군 및 GC 환자군)을 구분할 수 있는지 종래의 주성분 분석 기반 선형 판별 분석 방법을 적용한 결과를 표 120에 나타내었다. 특히 정상 대조군의 특이도가 69.28%로 낮은 것을 확인할 수 있다. 이로부터 한 개의 판별식으로는 CRC 환자군과 비환자군을 구분할 수 없음을 알 수 있다.
표 120
Sensitivity 99.25%
Set A1 True CRC True Non-CRC Specificity CONT 69.28%
CONT BRC NHL GC BRC 97.30%
Predicted CRC 132 47 3 1 0 NHL 97.22%
Predicted Non-CRC 1 106 108 35 29 GC 100.0%
도 2 및 표 104에서 확인한 바와 같이 CRC 환자군과 정상 대조군에 대해서는 우수한 판별 결과를 얻을 수 있었으므로, CRC 환자군과 다른 암환자군이 구분될 수 있는지 살펴보았는데, 그 결과를 표 121에 나타내었다. NHL 환자군의 특이도가 83.33%로 다른 암환자군에 비해 상대적으로 낮기는 하지만 대체적으로 우수한 판별 결과를 보인다고 판단된다.
표 121
Sensitivity 99.25%
Set A1 True CRC True Non-CRC Specificity BRC 99.10%
BRC NHL GC NHL 83.33%
Predicted CRC 132 1 6 1 GC 96.55%
Predicted Non-CRC 1 110 30 28 Total 95.45%
따라서 CRC 환자군과 비환자군을 구분하는 것은 CRC 환자군과 정상 대조군을 구분하는 제1종 판별식과 CRC 환자군과 다른 암환자군을 구분하는 제2종 판별식을 사용하여, 두 판별식에 의해 모두 CRC로 판별된 경우를 CRC 환자로 판정하고, 두 판별식 중 어느 하나의 판별식으로든 CRC 비환자로 판별된 경우에는 CRC 비환자로 판정하는 방식을 통해 수행될 수 있다.
(2-4) 제1훈련집합 A0의 선정 및 질량 이온별 가중치 계산
표 104 및 표 121에 나타낸 판별 결과가 매우 우수하기는 하나 민감도와 특이도가 모두 100%는 아니다. 본 발명에서는 우선 민감도와 특이도가 소정의 값을 갖는 제1훈련집합 A0를 선정하고, 이 제1훈련집합 A0에 대해 질량 이온별 가중치를 계산하였는데, 본 실시 예에서 그 소정의 값은 민감도와 특이도 모두 100%이다.
도 15를 참조하여 민감도와 특이도가 소정의 값을 갖는 제1훈련집합 A0를 선정하는 방법에 대하여 설명한다.
제1판별점수 계산수단(4200)은, 도시된 도 15의 D111 내지 D114 단계들을 통하여, 집합 A1 내 CRC 환자군 및 정상 대조군의 저질량 이온 질량 스펙트럼들을 정렬하여 임포트하고(D111), 임포트한 피크 강도들을 정규화하고(D112), 정규화한 피크 강도들을 파레토 스케일링하고(D113), 파레토 스케일링한 피크 강도들에 대해 생물통계학적 분석을 수행하여 판별 점수를 계산하였다(D114).
다양한 생물통계학적 분석 방법 중 어느 하나를 선택하여 판별 점수를 계산할 수 있으나, 본 실시 예에서는 주성분 분석 기반 선형 판별 분석을 수행하였다. 판별 점수를 통하여 민감도 및 특이도를 계산하였으며(D115), 그 결과는 전술한 도 2 및 표 104와 같다.
다음으로, 민감도의 문턱값 CN1과 특이도의 문턱값 CN2를 설정하여(D116), 민감도 또는 특이도가 각각의 문턱값보다 작은 경우 위양성(false positive) 또는 위음성(false negative) 케이스들을 제외하였다(D117).
본 실시 예에서는 민감도의 문턱값 CN1과 특이도의 문턱값 CN2를 모두 1로 설정함으로써 민감도와 특이도가 모두 100%인 제1훈련집합 A0를 찾았다. 즉 표 104에 나타난 위양성인 두 케이스와 위음성인 두 케이스를 모두 배제하고, 배제한 집합에 대하여 다시 D111 내지 D115 단계를 수행하였다. 배제한 집합에 대하여 D111 내지 D115 단계를 다시 수행하여도 바로 민감도 및 특이도가 100%가 되지는 않았으며, D111 내지 D117 단계를 수회 반복함으로써 비로소 민감도와 특이도가 모두 100%인 제1훈련집합 A0을 찾을 수 있었다(D118).
CRC 환자군과 정상 대조군을 구분하는 제1종 판별식의 경우에는 8개의 위음성, 9개의 위양성 케이스들을 배제한 후에, CRC 환자군과 다른 암환자군을 구분하는 제2종 판별식의 경우에는 5개의 위음성, 10개의 위양성 케이스들(BRC 1개, NHL 8개 및 GC 1개)을 배제한 후에 민감도와 특이도가 모두 100%인 판별 결과에 도달하였다. 이 과정을 통해 민감도와 특이도가 모두 100%인 판별 결과를 주는 질량 이온별 인자적재값을 도출할 수 있다(D119).
상기와 같은 일련의 과정은 상기 인자적재값 계산수단(4300)을 통하여 수행될 수 있다.
(2-5) 판별식의 적용
구성한 판별식을 판별 대상 시료에 적용하는 과정을 설명하면 다음과 같다.
우선 MarkerViewTM에는 이와 유사한 목적으로 사용할 수 있는 기능이 있다. 즉, 함께 임포트한 시료 데이터 중에서 일부 시료들만을 대상으로 하여 주성분 분석 기반 선형 판별 분석을 적용할 수 있으며, 이렇게 구성한 판별식으로 나머지 시료들을 판별할 수 있다. 이 기능을 이용하면 제1훈련집합과 판별 대상 시료를 함께 임포트한 후 제1훈련집합만을 선택해서 주성분 분석 기반 선형 판별 분석을 수행하여 판별 대상 시료가 어떻게 판정되는지 알 수 있다.
그러나, MarkerViewTM의 임포트 과정에서 피크들을 정렬하는 기능(peak alignment)이 수행되는데, 제1훈련집합에 맞추어 판별 대상 시료의 피크들을 정렬하는 기능이 없기 때문에, 제1훈련집합만을 임포트하였을 때의 피크 표(peak table, m/z 열과 시료별 피크 강도 열로 이루어진 행렬)와, 제1훈련집합과 판별 대상 시료를 함께 임포트하였을 때 생성되는 피크 표의 제1훈련집합 부분은 동일하지 않다. 피크 강도 행렬 부분도 다르며, 동일한 피크 강도 행에 대응하는 m/z 값도 항상 동일하게 나타나지는 않는다. 따라서, 제1훈련집합에서 만든 판별식을 판별 대상 시료에 적용하여 판별 점수를 계산하기 위해서는 제1훈련집합과 판별 대상 시료를 함께 임포트했을 때 생성되는 피크 표를 제1훈련집합만을 임포트하였을 때의 피크 표에 재정렬(realignment)하는 작업이 선행되어야 한다.
여러 개의 판별 대상 시료들을 제1훈련집합과 함께 임포트하는 경우 정렬이 어긋나는 정도가 더욱 심해진다. 따라서 본 실시 예에서는 모든 판별 대상 시료들에 대해서 제1훈련집합에 한 개의 판별 대상 시료를 추가하여 임포트한 후, 재정렬, 정규화, 파레토 스케일링을 수행하였다.
도 16을 참조하여 보다 상세히 설명하면 다음과 같다.
먼저, 판별 대상 시료의 저질량 이온 질량 스펙트럼들을 제1훈련집합에 정렬하여 임포트하는 단계를 수행한다(D211).
다만, 본 실시 예에서는 MarkerViewTM에는 판별 대상 시료를 제1훈련집합에 정렬하여 임포트하는 기능이 없으므로, 전술한 바와 같이 판별 대상 시료의 저질량 이온 질량 스펙트럼을 제1훈련집합과 함께 임포트한 후 만들어지는 피크 표를 제1훈련집합만을 임포트하였을 때 만들어지는 피크 표에 재정렬하는 프로그램을 만들어 제1훈련집합에 정렬된 판별 대상 시료의 저질량 이온 질량 스펙트럼을 추출하였다. 그러나 재정렬 없이 처음부터 판별 대상 시료를 제1훈련집합에 정렬하여 임포트하는 것이 보다 바람직하고 이것 역시 프로그램을 만들어 구현 가능하다.
다음으로, 임포트한 피크 강도들을 정규화하고(D212), 정규화한 피크 강도들을 파레토 스케일링하였다(D213).
다음으로, 파레토 스케일링한 저질량 이온들의 피크 강도와 제1훈련집합에 대한 주성분 분석 기반 선형 판별 분석에 의해 획득된 질량 이온별 인자적재값으로부터 판별 점수를 계산하였다(D214).
이렇게 계산된 판별 점수가 기준값 CS보다 큰지 여부를 판단하여(D215), 기준값 CS보다 큰 경우 양성으로 판정하고(D216), 기준값 CS보다 작은 경우 음성으로 판정하였다(D217). 본 실시 예에서 기준값 CS는 0인 것이 바람직하다.
상기와 같은 일련의 과정은 상기 제2정렬수단(4500), 제2판별점수계산 계산수단(4600) 및 대장암 판정수단(4700)을 통하여 수행될 수 있다.
제1종 판별식을 위해 집합 A1에서 제1훈련집합 A01을 구성할 때 제외되었던 8명의 CRC 환자군 및 9명의 정상 대조군 시료와 제2종 판별식을 위해 집합 A1에서 제1훈련집합 A02을 구성할 때 제외되었던 5명의 CRC 환자군, 1명의 BRC 환자군, 8명의 NHL 환자군 및 1명의 GC 환자군 시료에 대해 상기 (2-4)절에서 계산한 질량 이온별 인자적재값을 적용하여 판별 점수를 계산해 보았다. 제1훈련집합 A01 및 A02를 구성할 때 이미 제외된 케이스들이었기 때문에 위양성 또는 위음성 케이스로 판별될 것으로 예상하였는데, 계산 결과 예상대로 위양성 또는 위음성 케이스로 판별되었다. 상기 (2-4)절에서 계산한 질량 이온별 인자적재값을 적용하여 집합 A1을 판별한 결과를 도 17과 도 18에 나타내었는데, 도 17은 제1종 판별식, 도 18은 제2종 판별식의 결과를 보여준다.
(2-6) 예비 판별식의 구성
전술한 종래 기술에서는 주성분 분석 기반 선형 판별 분석에서 고려한 모든 질량 이온들을 사용하여 판별 점수를 계산한 후 그 판별 점수에 따라 CRC 환자 여부를 판정하였으나, 본 발명에서는 강건한 판별 성능을 나타내는 판별식을 도출하기 위해 우선 판별 점수에 큰 기여를 하는 질량 이온들만 사용하는 예비 판별식을 구성하였다. "예비 판별식"이란 본 발명에 따라 최종적으로 구하고자 하는 판별식을 도출하는 중간 단계로서의 판별식을 지칭하며, 이를 구성하는 저질량 이온들은 최종 판별식을 구성할 CRC 진단용 저질량 이온들의 "예비 후보군"이 된다.
도 19의 절차를 통해 10,000개의 질량 이온들 중 판별 점수에 큰 영향을 미치는 소정의 질량 이온들을 선정하였다. 본 실시 예에서 제1종 판별식의 경우 선정된 소정의 질량 이온들의 개수는 278개였으며, 제2종 판별식의 경우는 383개였다.
표 103과 함께 전술한 바와 같이 임포트 조건에서 피크의 최대 개수를 10,000개로 하였고 충분히 많은 시료들을 함께 임포트하였으므로, MarkerViewTM의 주성분 분석 기반 선형 판별 분석 방법을 통해 구성한 판별식은 10,000개의 항으로 이루어져 있다. 그러나, CRC 환자 및 비환자를 구분함에 있어 10,000개의 항이 모두 동등한 중요성을 가지지는 않을 것이므로, 도 19의 절차에 따라 10,000개의 질량 이온들 중 판별 점수에 큰 영향을 미치는 질량 이온들을 두 단계에 걸쳐 선정하였다. 이 단계는 10,000개의 질량 이온들 중 CRC 환자와 비환자를 구분함에 있어 불필요한 질량 이온들을 제거하는 과정이라 할 수 있다.
10,000개 항의 값들 중에서 피크 강도와 질량 이온별 인자적재값의 곱의 절댓값이 문턱값 CT1보다 큰 질량 이온들을 케이스별로 일차적으로 선택하였다(D121). 본 실시 예에서 문턱값 CT1은 0.1인 것이 바람직하다.
다음, 케이스별로 일차적으로 선택한 질량 이온들 중에서 제1훈련집합 전체 케이스들 중 문턱값 CT2 퍼센트 이상의 케이스들에서 공통으로 나타나는 질량 이온들을 이차적으로 선택하였다(D122). 본 실시 예에서 문턱값 CT2는 50인 것이 바람직하다. 즉, 제1종 판별식의 경우를 예로 들어 설명하면 제1훈련집합인 269개 케이스들 중 최소 135개 이상의 케이스들에서 공통으로 등장하는 질량 이온들로만 예비 판별식을 구성하였다.
상기와 같은 과정을 통하여 선택한 질량 이온들만으로 다시 판별 점수를 계산하고 이에 따라 민감도 및 특이도를 계산하였다(D123). 다시, 민감도의 문턱값 CN3와 특이도의 문턱값 CN4를 설정하여(D124), 민감도 또는 특이도가 각각의 문턱값보다 작은 경우 D121 단계에서 사용된 문턱값 CT1 및/또는 D122 단계에서 사용된 문턱값 CT2를 변경하여(D125) D121 내지 D124 단계를 반복하였다. 본 실시 예에서는 민감도의 문턱값 CN3와 특이도의 문턱값 CN4가 각각 0.9인 것이 바람직하다.
이와 같은 단계들을 거쳐 선택한 질량 이온들로 CRC 진단용 저질량 이온들의 예비 후보군을 구성하였는데(D126), 본 실시 예에서는 10,000개의 질량 이온들 중 제1종 판별식의 경우 278개, 제2종 판별식의 경우 383개의 질량 이온들이 선택되었다. 표 122와 표 123에 제1종 예비 판별식과 제2종 예비 판별식으로 제1훈련집합 A01과 A02를 판별한 결과를 나타내었는데, 민감도와 특이도 등 판별 성능이 100%에서 약간 낮아졌으나 전체 질량 이온 개수의 3~4%도 되지 않는 질량 이온들만으로 계산한 결과임에도 불구하고, 전체 질량 이온들을 사용했을 때와 비교하여 필적할 만한 우수한 판별 결과를 보임을 확인할 수 있다.
또한, 예비 판별식으로 집합 A1을 판별한 결과를 도 20과 도 21에 나타내었는데, 도 20은 제1종 예비 판별식, 도 21은 제2종 예비 판별식의 결과를 보여준다. 계산에 사용되는 질량 이온의 개수는 급격하게 감소된 것에 비해 판별 점수의 범위는 그렇지 않음을 알 수 있는데, 이로부터 CRC 환자 및 비환자를 구분함에 있어 10,000개의 질량 이온이 모두 필요한 것이 아니라는 것을 확인할 수 있다.
표 122
Sensitivity 99.20%
Set A01 True CRC True CONT Specificity 97.92%
Predicted CRC 124 3 PPV 97.64%
Predicted CONT 1 141 NPV 99.30%
표 123
Set A02 True CRC True Non-CRC Sensitivity 98.44%
BRC NHL GC Specificity 98.19%
Predicted CRC 126 2 1 0 PPV 97.67%
Predicted Non-CRC 2 108 27 28 NPV 98.79%
상기와 같은 일련의 과정은 상기 후보이온집합 선택수단을 포함하는 대장암진단용이온 선정수단(4400)을 통하여 수행될 수 있다.
(2-7) 최종 판별식의 구성
예비 판별식을 구성하는 과정에서는 임포트한 10,000개의 질량 이온들 중 판별 점수에 수치적으로 큰 기여를 하는 질량 이온들을 추출하였다. 그러나 질량 이온들 중에는 제1훈련집합 A0에서는 문제를 발생시키지 않았으나, 동일한 CRC 환자군 및 비환자군의 혈청에 대해 다시 측정한 질량 스펙트럼에 대한 판별 또는 새로운 CRC 환자군 및 비환자군에 대한 판별에 있어서는 잠재적으로 판별 성능을 저하시킬 수 있는 질량 이온들 역시 포함되어 있을 것이므로 이것들도 적극적으로 제거하는 단계가 필요한데, 최종 판별식의 구성 과정에서는 이 단계를 거쳐 최종적으로 CRC 진단용 저질량 이온들을 결정한다.
판별식의 강건성을 검증하기 위해 먼저 집합 A1에 대해 5회 반복 측정 실험을 하였으며, 이와 독립적이며 또한, 서로 독립적인 집합 A2 및 집합 B에 대해서도 5회 반복 측정 실험을 수행하였다. 질량 스펙트럼의 반복 측정 과정에는 상기 설명한 혈청을 얼리고 녹이는 과정 및 혈청을 새로 메탄올/클로로포름과 혼합하여 추출하는 과정이 개입되는 것 외에, 레이저 빔(laser beam)을 이용한 기화(vaporization), 탈착(desorption), 이온화(ionization) 과정 등도 반복 실험시 동일하게 진행된다고는 할 수 없으며, 또한, 아직 밝혀지지 않은 다양한 원인들로부터의 외란들도 개입할 여지가 많다. 따라서 반복 측정된 개별 질량 스펙트럼에 대한 판별 점수에 어느 정도의 편차가 발생하는 것은 배제할 수 없을 것이므로 본 실시 예에서는 5회 반복 측정한 시료에 대해 평균 판별 점수를 계산하여 판정을 실시하였다.
표 124는 종래 기술인 MarkerViewTM의 주성분 분석 기반 선형 판별 분석 결과인 10,000개 항의 판별식으로 집합 A와 B를 판별한 결과를 나타내며, 표 125는 278개 항을 가지는 제1종 예비 판별식과 383개 항을 가지는 제2종 예비 판별식으로 집합 A와 B를 판별한 결과를 나타낸다. 표에서 CRC LOME(colorectal cancer Low mass ion discriminant equation) 1은 제1종 판별식, CRC LOME 2는 제2종 판별식을 나타내며, 그 뒤에 딸려 있는 숫자는 판별식에 포함되는 저질량 이온들의 개수를 의미한다. 또한, 표 126에는 검증 집합인 집합 B에 대해서만 판별 성능을 나타내었는데, 괄호 안의 숫자는 TA 환자군을 CRC 환자군에 포함하였을 때의 판별 성능이다. TA 환자군은 향후 CRC 환자군으로 발전된 가능성이 높은 환자군으로 TA 환자군을 CRC 환자군으로 판별하는 것은 조기 발견이라는 검진의 목적상 오히려 바람직한 판별 결과라고 할 수 있다.
표 124
CRC LOME 1-10000 CRC LOME 1-10000
Set A TrueCRC True Non-CRC Set B True CRC True Non-CRC
CONT BRC NHL GC CONT BRC NHL GC OVC TA
Predicted CRC 131 18 26 36 36 Predicted CRC 68 0 7 4 23 6 13
Predicted Non-CRC 146 185 110 15 50 Predicted Non-CRC 75 50 18 11 32 19 6
CRC LOME 2-10000 CRC LOME 2-10000
Set A TrueCRC True Non-CRC Set B True CRC True Non-CRC
CONT BRC NHL GC CONT BRC NHL GC OVC TA
Predicted CRC 109 120 21 3 2 Predicted CRC 43 0 4 0 0 0 9
Predicted Non-CRC 168 83 115 48 84 Predicted Non-CRC 100 50 21 15 55 25 10
CRC LOMEs 1 & 2 CRC LOMEs 1 & 2
Set A TrueCRC True Non-CRC Set B True CRC True Non-CRC
CONT BRC NHL GC CONT BRC NHL GC OVC TA
Predicted CRC 80 17 3 3 1 Predicted CRC 39 0 1 0 0 0 8
Predicted Non-CRC 197 186 133 48 85 Predicted Non-CRC 104 50 24 15 55 25 11
표 125
CRC LOME 1-278 CRC LOME 1-278
Set A TrueCRC True Non-CRC Set B True CRC True Non-CRC
CONT BRC NHL GC CONT BRC NHL GC OVC TA
Predicted CRC 136 14 26 36 35 Predicted CRC 70 0 5 4 24 7 13
Predicted Non-CRC 141 189 110 15 51 Predicted Non-CRC 73 50 20 11 31 18 6
CRC LOME 2-383 CRC LOME 2-383
Set A TrueCRC True Non-CRC Set B True CRC True Non-CRC
CONT BRC NHL GC CONT BRC NHL GC OVC TA
Predicted CRC 106 121 21 3 4 Predicted CRC 43 0 3 0 0 0 9
Predicted Non-CRC 171 82 115 48 82 Predicted Non-CRC 100 50 22 15 55 25 10
CRC LOMEs 1 & 2 CRC LOMEs 1 & 2
Set A TrueCRC True Non-CRC Set B True CRC True Non-CRC
CONT BRC NHL GC CONT BRC NHL GC OVC TA
Predicted CRC 75 13 3 3 1 Predicted CRC 39 0 1 0 0 0 8
Predicted Non-CRC 202 190 133 48 85 Predicted Non-CRC 104 50 24 15 55 25 11
표 126
Set B Sensitivity (%) Specificity (%) PPV (%) NPV (%)
CRC LOME 1-10000 &CRC LOME 2-10000 27.27 (29.01) 95.24 (99.41) 81.25 (97.92) 63.38 (59.51)
CRC LOME 1-278 & CRC LOME 2-383 27.27 (29.01) 95.24 (99.41) 81.25 (97.92) 63.38 (59.51)
CRC LOME 1-104 & CRC LOME 2-23 94.41 (93.21) 88.36 (96.47) 85.99 (96.18) 95.43 (93.71)
10,000개 질량 이온으로 구성된 판별식은 제1훈련집합 A0에서 완벽한 판별 성능을 보였음에도 불구하고, 집합 B에서 특히 민감도가 낮게 나타나는 것을 표 126에서 확인할 수 있다. 제1종 및 제2종 예비 판별식도 제1훈련집합 A0에서는 매우 우수한 판별 성능(표 122, 123)을 보였음에도 불구하고 집합 B에서의 판별 결과는 만족스럽지 않았다.
따라서, 본 발명의 바람직한 일 실시 예에서는 예비 판별식을 강건한 판별식으로 개선하고자 도 22의 단계들을 수행하였다.
먼저, 예비 후보군의 질량 이온들을, 고민감도 집합과 고특이도 집합으로 구분하였다(D131). 여기에서, 고민감도 집합의 질량 이온들은 질량 이온별 민감도가 특이도보다 높은 질량 이온들이며, 고특이도 집합의 질량 이온들은 그 반대이다.
다음으로, 고민감도 집합의 질량 이온들과 고특이도 집합의 질량 이온들을 각각 질량 이온별 민감도와 특이도의 합의 내림차순으로 정렬한 후{Sns1, Sns2, Sns3 … SnsI}{Spc1, Spc2, Spc3 … SpcJ}, 각각의 상위 2개의 질량 이온들을 취하고{Sns1, Sns2, Spc1, Spc2}, 4개의 질량 이온들 중 2개 이상의 질량 이온들로 구성할 수 있는 조합들(11개) 중 최고 성능의 조합을 바이오마커 그룹(biomarker group)으로 선정하였다(D132).
여기에서, 최고 성능의 조합인지 여부는 다음의 기준들에 따라 객관적이고 보편적으로 선택될 수 있다. 다음의 기준들은 중요도의 순서에 따른다.
기준1) 민감도와 특이도의 합이 큰 조합이 보다 성능이 높다.
기준2) 질량 이온들의 개수가 적은 조합이 보다 성능이 높다.
기준3) 진양성 케이스 중 최소 판별 점수와 진음성 케이스 중 최대 판별 점수의 차이가 큰 조합이 보다 성능이 높다.
다음으로, 고민감도 집합과 고특이도 집합 각각의 그 다음 상위 1개의 질량 이온들{Sns3, Spc3}을 추가로 더 취하여 상기 바이오마커 그룹 및 상기 바이오마커 그룹에 상기 질량 이온들{Sns3, Spc3} 중 어느 하나 이상을 조합한 4개의 집합들{biomarker group}, {biomarker group, Sns3}, {biomarker group, Spc3}, {biomarker group, Sns3, Spc3} 중 최고 성능의 집합을 다시 바이오마커 그룹으로 선정한다(D133).
이러한 과정은, 고민감도 집합 및 고특이도 집합 모두에 추가할 질량 이온이 없을 때까지 반복된다(D134).
즉, 고민감도 집합 및 고특이도 집합 모두에 추가할 질량 이온이 있을 때에는 상기와 같은 방식(D133)을 반복하고, 고민감도 집합과 고특이도 집합 중 어느 하나에 추가할 질량 이온이 남지 않은 경우에는, 남은 질량 이온이 있는 집합 중 그 다음 상위 1개의 질량 이온{Snsi 또는 Spcj}을 추가로 더 취하여 상기 바이오마커 그룹 및 상기 바이오마커 그룹에 상기 질량 이온{Snsi 또는 Spcj}을 조합한 2개의 집합들{biomarker group}, {biomarker group, Snsi 또는 Spcj} 중 최고 성능의 집합을 다시 바이오마커 그룹으로 선정한다.
이러한 과정은, 고민감도 집합과 고특이도 집합 중 질량 이온이 남았었던 집합의 질량 이온이 남지 않을 때까지 반복되며, 고민감도 집합과 고특이도 집합 모두에 남은 질량 이온이 없는 경우의 바이오마커 그룹이 바이오마커 그룹1(CG)이 된다(D135).
예비 후보군에서 바이오마커 그룹1(CG)을 제거하고(D136) 남은 질량 이온들로 다시 고민감도 집합과 고특이도 집합을 구성하고 위의 과정을 반복한다. 이 과정은 고민감도 집합과 고특이도 집합 중 어느 한 집합이 두 개 미만의 질량 이온만을 가질 때까지 반복된다(D137).
위의 반복 과정을 통해 얻은 바이오마커 그룹1, 2, … 중 정확도 순으로 CK개의 바이오마커 그룹을 조합하여 최종 바이오마커 그룹을 형성한다. 여기서 정확도는 전체 케이스 중 진양성 및 진음성 케이스의 비율을 의미한다. 본 실시 예에서 CK는 1 내지 3 사이의 자연수인 것이 바람직하다(D138).
따라서, 상기 최종 바이오마커 그룹의 질량 이온들이 CRC 진단용 저질량 이온들로 결정된다(D139).
집합 A1에서, 더 정확하게는 그 부분 집합인 A0에서 질량 이온들의 예비 후보군을 선정하였는데, 예비 후보군으로부터 최종 바이오마커 그룹을 결정할 때에는 과적합(overfitting) 문제를 해결하기 위하여 집합 A1에 독립인 집합 A2도 추가하여 훈련 집합을 확장하였다.
상기의 과정들을 CRC 환자군과 정상 대조군을 구분하기 위한 시료들을 대상으로 수행한 결과 제1종 CRC 진단용 저질량 이온으로 104개가 선택되었으며, CRC 환자군과 다른 암환자군을 구분하기 위한 시료들을 대상으로 수행한 결과 제2종 CRC 진단용 저질량 이온으로 23개가 선택되었다. 제1종 및 제2종 CRC 진단용 저질량 이온들의 질량값은 표 127 및 128에 나타내었다. 이와 같은 저질량 이온들을 "제1종 CRC 진단용 저질량 이온들" 및 "제2종 CRC 진단용 저질량 이온들"로 지칭하고, 이를 이용하여 최종적으로 구한 본 발명에 따른 판별식을 "제1종 CRC 진단용 최종 판별식" 및 "제2종 CRC 진단용 최종 판별식"으로 지칭한다.
표 127
18.0260 190.0849 317.2311 401.0531 508.3407 548.2856 1206.5305
22.9797 191.0848 335.1862 423.0313 510.3265 566.8375 1207.5571
74.0948 191.3324 340.2241 428.1878 512.3119 581.1957 1465.6184
76.0763 195.0785 343.2451 454.2090 513.3177 582.1888 1466.6096
102.0916 212.3195 345.2583 465.3014 518.2931 583.2242 1467.5969
105.1078 231.0667 357.0666 466.1923 518.8555 656.0270 2450.9701
106.0899 235.0053 357.2784 468.1851 519.2967 667.3291 2451.9662
107.0477 256.0939 366.2310 469.2831 519.8598 709.3519 2452.9546
118.0822 266.9557 368.2551 477.1721 525.3449 710.3581
123.0395 267.9501 369.3302 478.1678 534.2739 711.3617
137.0423 288.2033 377.0570 480.1715 537.2800 712.3683
137.0729 291.0997 379.1438 482.3220 538.3306 713.3798
147.0573 295.0663 379.4765 483.3258 540.2629 991.6196
147.1058 300.1297 383.0529 496.8683 540.8144 992.6209
169.0653 301.1269 384.1745 497.7636 542.8457 1016.6113
181.0656 316.2288 388.2688 503.8719 544.8692 1020.4817
표 127에서 1465.6184, 1466.6096, 1467.5969, 2450.9701, 2451.9662, 2452.9546 m/z은 피브리노겐 알파 체인(fibrinogen alpha chain)과 트랜스타이레틴(transthyretin)으로 동정되었다.
표 128
60.0476 179.1451 280.2642 332.3224 486.6356 566.8737
138.0540 191.1277 281.1440 333.3324 488.6882 707.3475
172.6653 279.0855 296.2574 369.3406 544.8908 733.3569
173.1158 280.0895 312.3248 465.3161 551.3287
상기와 같은 일련의 과정은 상기 최종이온집합 선택수단을 포함하는 대장암진단용이온 선정수단(4400)을 통하여 수행될 수 있다.
(2-8) 최종 판별식의 적용 및 분석
집합 B에 대하여 제1종 및 제2종 CRC 진단용 저질량 이온들을 이용한 제1종 및 제2종 CRC 진단용 최종 판별식을 도 16의 방법에 따라 적용하면 그 판정 결과를 획득할 수 있다.
최종 판별식으로 판정한 결과를 도 23, 24 및 표 126, 129에 나타내었다. 도 23, 24는 5회 판별 점수의 평균 판별 점수로 판정한 결과를 나타내는데, 도 23은 집합 A, 도 24는 집합 B의 판정 결과를 나타낸다.
표 129
CRC LOME 1-104 CRC LOME 1-104
Set A TrueCRC True Non-CRC Set B True CRC True Non-CRC
CONT BRC NHL GC CONT BRC NHL GC OVC TA
Predicted CRC 258 2 67 44 69 Predicted CRC 141 3 23 10 45 19 17
Predicted Non-CRC 19 201 69 7 17 Predicted Non-CRC 2 47 2 5 10 6 2
CRC LOME 2-23 CRC LOME 2-23
Set A TrueCRC True Non-CRC Set B True CRC True Non-CRC
CONT BRC NHL GC CONT BRC NHL GC OVC TA
Predicted CRC 273 113 0 2 7 Predicted CRC 137 39 1 0 2 2 18
Predicted Non-CRC 4 90 136 49 79 Predicted Non-CRC 6 11 24 15 53 23 1
CRC LOMEs 1 & 2 CRC LOMEs 1 & 2
Set A TrueCRC True Non-CRC Set B True CRC True Non-CRC
CONT BRC NHL GC CONT BRC NHL GC OVC TA
Predicted CRC 254 0 0 2 5 Predicted CRC 135 1 1 0 2 2 16
Predicted Non-CRC 23 203 136 49 81 Predicted Non-CRC 8 49 24 15 53 23 3
검증 집합인 집합 B의 경우 민감도, 특이도, 양성예측도, 음성예측도가 모두 85% 이상임을 확인할 수 있다. 또한, TA 환자군을 CRC 환자군에 포함하면 판별 성능은 모두 90% 이상이 되어 매우 우수한 판별 결과를 나타내는 것을 알 수 있다.
표 130은 분석한 시료 중 종래의 FOBT 분석이 실시된 경우의 판별 성능과 본 발명의 판별 성능을 비교하여 보여주고 있다. 검증 집합 중 CRC 환자군 96개 시료와 정상 대조군 49개 시료에 대한 FOBT 결과는 특이도는 100%였으나 민감도가 50% 밖에는 되지 않았다.
본 실시 예에서는 일반적으로 알려진 FOBT의 민감도인 60~85%에 미치지 못하는 결과를 얻었다. 일반적인 FOBT의 판별 성능과 비교한다고 해도 본 발명은 특이도의 측면에서는 FOBT와 필적할 만하며, 민감도의 관점에서는 차별적으로 우수한 결과를 나타냄을 알 수 있으며, 이는 본 발명의 우수한 판별 성능을 증명한다. 훈련 집합에서도 유사한 결과를 얻을 수 있는데, 훈련 집합과 검증 집합 모두에 대한 FOBT 판별 결과 및 본 발명에 따른 판별 결과를 표 131에 나타내었다.
표 130
Set B CRC LOME 1-104 CRC LOME 1-104 &CRC LOME 2-23 FOBT
True CRC True CONT True CRC True CONT True CRC True CONT
Predicted CRC 94 3 91 1 48 0
Predicted Non-CRC 2 46 5 48 48 49
Set B Sensitivity (%) Specificity (%) PPV (%) NPV (%)
CRC LOME 1-104 97.92 93.88 96.91 95.83
CRC LOME 1-104 & CRC LOME 2-23 94.79 97.96 98.91 90.57
FOBT 50.00 100.0 100.0 50.52
표 131
Control FOBT Prediction Control FOBT Prediction
CRC LOME 1-104 CRC LOME 1-104 & CRC LOME 2-23 CRC LOME 1-104 CRC LOME 1-104 & CRC LOME 2-23
CONT-A1 - Non-CRC Non-CRC CONT-A103 Negative Non-CRC Non-CRC
CONT-A2 Negative Non-CRC Non-CRC CONT-A104 - Non-CRC Non-CRC
CONT-A3 Negative Non-CRC Non-CRC CONT-A105 Negative Non-CRC Non-CRC
CONT-A4 Negative Non-CRC Non-CRC CONT-A106 - Non-CRC Non-CRC
CONT-A5 Negative Non-CRC Non-CRC CONT-A107 Negative Non-CRC Non-CRC
CONT-A6 Negative Non-CRC Non-CRC CONT-A108 Negative Non-CRC Non-CRC
CONT-A7 Negative Non-CRC Non-CRC CONT-A109 Negative Non-CRC Non-CRC
CONT-A8 Negative Non-CRC Non-CRC CONT-A110 Negative Non-CRC Non-CRC
CONT-A9 Negative Non-CRC Non-CRC CONT-A111 Negative Non-CRC Non-CRC
CONT-A10 Negative Non-CRC Non-CRC CONT-A112 Negative Non-CRC Non-CRC
CONT-A11 Negative Non-CRC Non-CRC CONT-A113 Negative Non-CRC Non-CRC
CONT-A12 Negative Non-CRC Non-CRC CONT-A114 Negative Non-CRC Non-CRC
CONT-A13 Negative Non-CRC Non-CRC CONT-A115 Negative Non-CRC Non-CRC
CONT-A14 Negative Non-CRC Non-CRC CONT-A116 Negative Non-CRC Non-CRC
CONT-A15 Negative Non-CRC Non-CRC CONT-A117 Negative Non-CRC Non-CRC
CONT-A16 Negative Non-CRC Non-CRC CONT-A118 Negative Non-CRC Non-CRC
CONT-A17 Negative Non-CRC Non-CRC CONT-A119 Negative Non-CRC Non-CRC
CONT-A18 Negative Non-CRC Non-CRC CONT-A120 - Non-CRC Non-CRC
CONT-A19 - Non-CRC Non-CRC CONT-A121 - Non-CRC Non-CRC
CONT-A20 Negative Non-CRC Non-CRC CONT-A122 Negative Non-CRC Non-CRC
CONT-A21 Negative Non-CRC Non-CRC CONT-A123 Negative Non-CRC Non-CRC
CONT-A22 Negative Non-CRC Non-CRC CONT-A124 Negative Non-CRC Non-CRC
CONT-A23 Negative Non-CRC Non-CRC CONT-A125 Negative Non-CRC Non-CRC
CONT-A24 Negative Non-CRC Non-CRC CONT-A126 Negative Non-CRC Non-CRC
CONT-A25 Negative Non-CRC Non-CRC CONT-A127 Negative Non-CRC Non-CRC
CONT-A26 Negative Non-CRC Non-CRC CONT-A128 Negative Non-CRC Non-CRC
CONT-A27 Negative Non-CRC Non-CRC CONT-A129 Negative Non-CRC Non-CRC
CONT-A28 Negative Non-CRC Non-CRC CONT-A130 - Non-CRC Non-CRC
CONT-A29 Negative Non-CRC Non-CRC CONT-A131 Negative Non-CRC Non-CRC
CONT-A30 Negative Non-CRC Non-CRC CONT-A132 Negative Non-CRC Non-CRC
CONT-A31 Negative Non-CRC Non-CRC CONT-A133 Negative Non-CRC Non-CRC
CONT-A32 Negative Non-CRC Non-CRC CONT-A134 - Non-CRC Non-CRC
CONT-A33 Negative Non-CRC Non-CRC CONT-A135 - Non-CRC Non-CRC
CONT-A34 Negative Non-CRC Non-CRC CONT-A136 Negative Non-CRC Non-CRC
CONT-A35 Negative Non-CRC Non-CRC CONT-A137 Negative Non-CRC Non-CRC
CONT-A36 Negative Non-CRC Non-CRC CONT-A138 Negative Non-CRC Non-CRC
CONT-A37 Negative Non-CRC Non-CRC CONT-A139 Negative Non-CRC Non-CRC
CONT-A38 Negative Non-CRC Non-CRC CONT-A140 Negative Non-CRC Non-CRC
CONT-A39 Negative Non-CRC Non-CRC CONT-A141 Negative Non-CRC Non-CRC
CONT-A40 - Non-CRC Non-CRC CONT-A142 Negative Non-CRC Non-CRC
CONT-A41 Negative Non-CRC Non-CRC CONT-A143 Negative Non-CRC Non-CRC
CONT-A42 Negative Non-CRC Non-CRC CONT-A144 Negative Non-CRC Non-CRC
CONT-A43 Negative Non-CRC Non-CRC CONT-A145 Negative Non-CRC Non-CRC
CONT-A44 - Non-CRC Non-CRC CONT-A146 - Non-CRC Non-CRC
CONT-A45 Negative Non-CRC Non-CRC CONT-A147 - Non-CRC Non-CRC
CONT-A46 Negative Non-CRC Non-CRC CONT-A148 Negative Non-CRC Non-CRC
CONT-A47 Negative Non-CRC Non-CRC CONT-A149 - Non-CRC Non-CRC
CONT-A48 Negative Non-CRC Non-CRC CONT-A150 Negative Non-CRC Non-CRC
CONT-A49 Negative Non-CRC Non-CRC CONT-A151 Negative Non-CRC Non-CRC
CONT-A50 Negative Non-CRC Non-CRC CONT-A152 Negative Non-CRC Non-CRC
CONT-A51 Negative Non-CRC Non-CRC CONT-A153 - Non-CRC Non-CRC
CONT-A52 Negative Non-CRC Non-CRC CONT-A154 Negative Non-CRC Non-CRC
CONT-A53 Negative Non-CRC Non-CRC CONT-A155 Negative Non-CRC Non-CRC
CONT-A54 Negative Non-CRC Non-CRC CONT-A156 Negative Non-CRC Non-CRC
CONT-A55 Negative Non-CRC Non-CRC CONT-A157 Positive Non-CRC Non-CRC
CONT-A56 Negative Non-CRC Non-CRC CONT-A158 Negative Non-CRC Non-CRC
CONT-A57 Negative Non-CRC Non-CRC CONT-A159 Negative Non-CRC Non-CRC
CONT-A58 Negative Non-CRC Non-CRC CONT-A160 Negative Non-CRC Non-CRC
CONT-A59 Negative Non-CRC Non-CRC CONT-A161 Negative Non-CRC Non-CRC
CONT-A60 Negative Non-CRC Non-CRC CONT-A162 Negative Non-CRC Non-CRC
CONT-A61 Negative Non-CRC Non-CRC CONT-A163 Negative Non-CRC Non-CRC
CONT-A62 Negative Non-CRC Non-CRC CONT-A164 - Non-CRC Non-CRC
CONT-A63 Negative Non-CRC Non-CRC CONT-A165 Negative Non-CRC Non-CRC
CONT-A64 Negative Non-CRC Non-CRC CONT-A166 Negative Non-CRC Non-CRC
CONT-A65 Negative Non-CRC Non-CRC CONT-A167 Negative Non-CRC Non-CRC
CONT-A66 Negative Non-CRC Non-CRC CONT-A168 Negative Non-CRC Non-CRC
CONT-A67 Negative Non-CRC Non-CRC CONT-A169 Negative Non-CRC Non-CRC
CONT-A68 Negative Non-CRC Non-CRC CONT-A170 Negative Non-CRC Non-CRC
CONT-A69 Negative Non-CRC Non-CRC CONT-A171 Negative Non-CRC Non-CRC
CONT-A70 Negative Non-CRC Non-CRC CONT-A172 Negative Non-CRC Non-CRC
CONT-A71 Negative Non-CRC Non-CRC CONT-A173 Negative Non-CRC Non-CRC
CONT-A72 Negative Non-CRC Non-CRC CONT-A174 Negative Non-CRC Non-CRC
CONT-A73 Negative Non-CRC Non-CRC CONT-A175 Negative Non-CRC Non-CRC
CONT-A74 Negative Non-CRC Non-CRC CONT-A176 - Non-CRC Non-CRC
CONT-A75 Negative Non-CRC Non-CRC CONT-A177 Negative Non-CRC Non-CRC
CONT-A76 Negative Non-CRC Non-CRC CONT-A178 Negative Non-CRC Non-CRC
CONT-A77 Negative Non-CRC Non-CRC CONT-A179 Negative Non-CRC Non-CRC
CONT-A78 Negative Non-CRC Non-CRC CONT-A180 Negative Non-CRC Non-CRC
CONT-A79 Negative Non-CRC Non-CRC CONT-A181 Negative Non-CRC Non-CRC
CONT-A80 Negative Non-CRC Non-CRC CONT-A182 Negative Non-CRC Non-CRC
CONT-A81 Negative Non-CRC Non-CRC CONT-A183 Negative Non-CRC Non-CRC
CONT-A82 Negative Non-CRC Non-CRC CONT-A184 Negative Non-CRC Non-CRC
CONT-A83 Negative CRC Non-CRC CONT-A185 Negative Non-CRC Non-CRC
CONT-A84 Negative Non-CRC Non-CRC CONT-A186 Negative Non-CRC Non-CRC
CONT-A85 Negative Non-CRC Non-CRC CONT-A187 Negative Non-CRC Non-CRC
CONT-A86 Negative Non-CRC Non-CRC CONT-A188 - Non-CRC Non-CRC
CONT-A87 Negative Non-CRC Non-CRC CONT-A189 Negative Non-CRC Non-CRC
CONT-A88 Negative Non-CRC Non-CRC CONT-A190 Negative Non-CRC Non-CRC
CONT-A89 Negative Non-CRC Non-CRC CONT-A191 Negative Non-CRC Non-CRC
CONT-A90 Negative Non-CRC Non-CRC CONT-A192 Negative Non-CRC Non-CRC
CONT-A91 Negative Non-CRC Non-CRC CONT-A193 Negative Non-CRC Non-CRC
CONT-A92 Negative Non-CRC Non-CRC CONT-A194 Negative Non-CRC Non-CRC
CONT-A93 Negative Non-CRC Non-CRC CONT-A195 Negative Non-CRC Non-CRC
CONT-A94 Negative Non-CRC Non-CRC CONT-A196 Negative Non-CRC Non-CRC
CONT-A95 - Non-CRC Non-CRC CONT-A197 Negative Non-CRC Non-CRC
CONT-A96 Negative Non-CRC Non-CRC CONT-A198 Negative Non-CRC Non-CRC
CONT-A97 Negative Non-CRC Non-CRC CONT-A199 Negative Non-CRC Non-CRC
CONT-A98 Negative Non-CRC Non-CRC CONT-A200 Negative Non-CRC Non-CRC
CONT-A99 Negative Non-CRC Non-CRC CONT-A201 Negative CRC Non-CRC
CONT-A100 Negative Non-CRC Non-CRC CONT-A202 Negative Non-CRC Non-CRC
CONT-A101 Negative Non-CRC Non-CRC CONT-A203 Negative Non-CRC Non-CRC
CONT-A102 Negative Non-CRC Non-CRC
CONT-B1 Negative Non-CRC Non-CRC CONT-B26 Negative Non-CRC Non-CRC
CONT-B2 Negative Non-CRC Non-CRC CONT-B27 Negative Non-CRC Non-CRC
CONT-B3 Negative Non-CRC Non-CRC CONT-B28 Negative Non-CRC Non-CRC
CONT-B4 Negative Non-CRC Non-CRC CONT-B29 Negative Non-CRC Non-CRC
CONT-B5 Negative Non-CRC Non-CRC CONT-B30 Negative Non-CRC Non-CRC
CONT-B6 Negative Non-CRC Non-CRC CONT-B31 Negative Non-CRC Non-CRC
CONT-B7 Negative Non-CRC Non-CRC CONT-B32 - Non-CRC Non-CRC
CONT-B8 Negative Non-CRC Non-CRC CONT-B33 Negative CRC CRC
CONT-B9 Negative Non-CRC Non-CRC CONT-B34 Negative CRC Non-CRC
CONT-B10 Negative Non-CRC Non-CRC CONT-B35 Negative Non-CRC Non-CRC
CONT-B11 Negative Non-CRC Non-CRC CONT-B36 Negative Non-CRC Non-CRC
CONT-B12 Negative Non-CRC Non-CRC CONT-B37 Negative Non-CRC Non-CRC
CONT-B13 Negative Non-CRC Non-CRC CONT-B38 Negative Non-CRC Non-CRC
CONT-B14 Negative Non-CRC Non-CRC CONT-B39 Negative Non-CRC Non-CRC
CONT-B15 Negative Non-CRC Non-CRC CONT-B40 Negative Non-CRC Non-CRC
CONT-B16 Negative Non-CRC Non-CRC CONT-B41 Negative Non-CRC Non-CRC
CONT-B17 Negative Non-CRC Non-CRC CONT-B42 Negative Non-CRC Non-CRC
CONT-B18 Negative Non-CRC Non-CRC CONT-B43 Negative Non-CRC Non-CRC
CONT-B19 Negative Non-CRC Non-CRC CONT-B44 Negative Non-CRC Non-CRC
CONT-B20 Negative Non-CRC Non-CRC CONT-B45 Negative Non-CRC Non-CRC
CONT-B21 Negative Non-CRC Non-CRC CONT-B46 Negative Non-CRC Non-CRC
CONT-B22 Negative Non-CRC Non-CRC CONT-B47 Negative Non-CRC Non-CRC
CONT-B23 Negative CRC Non-CRC CONT-B48 Negative Non-CRC Non-CRC
CONT-B24 Negative Non-CRC Non-CRC CONT-B49 Negative Non-CRC Non-CRC
CONT-B25 Negative Non-CRC Non-CRC CONT-B50 Negative Non-CRC Non-CRC
CRC FOBT Prediction CRC FOBT Prediction
CRC LOME 1-104 CRC LOME 1-104 & CRC LOME 2-23 CRC LOME 1-104 CRC LOME 1-104 & CRC LOME 2-23
CRC-A1 Negative CRC CRC CRC-A140 - CRC CRC
CRC-A2 - CRC CRC CRC-A141 Positive CRC CRC
CRC-A3 Negative CRC CRC CRC-A142 Negative CRC CRC
CRC-A4 Negative CRC CRC CRC-A143 - CRC CRC
CRC-A5 Positive CRC CRC CRC-A144 - CRC CRC
CRC-A6 Negative CRC CRC CRC-A145 - CRC CRC
CRC-A7 - CRC CRC CRC-A146 Positive CRC CRC
CRC-A8 Negative CRC CRC CRC-A147 Negative CRC CRC
CRC-A9 - CRC CRC CRC-A148 - CRC CRC
CRC-A10 Negative CRC CRC CRC-A149 - CRC CRC
CRC-A11 Positive CRC CRC CRC-A150 Positive CRC CRC
CRC-A12 Positive CRC CRC CRC-A151 Negative CRC CRC
CRC-A13 Negative CRC CRC CRC-A152 - CRC CRC
CRC-A14 Positive CRC CRC CRC-A153 Negative CRC CRC
CRC-A15 Negative CRC CRC CRC-A154 Negative CRC CRC
CRC-A16 Negative CRC CRC CRC-A155 - CRC CRC
CRC-A17 Positive CRC CRC CRC-A156 Positive CRC CRC
CRC-A18 Negative CRC CRC CRC-A157 - CRC CRC
CRC-A19 Positive CRC CRC CRC-A158 Negative CRC CRC
CRC-A20 Negative CRC CRC CRC-A159 Negative CRC CRC
CRC-A21 Negative CRC CRC CRC-A160 Negative CRC CRC
CRC-A22 Negative CRC CRC CRC-A161 Positive CRC Non-CRC
CRC-A23 Positive CRC CRC CRC-A162 Positive CRC CRC
CRC-A24 Negative CRC CRC CRC-A163 - CRC CRC
CRC-A25 Positive CRC CRC CRC-A164 Positive CRC CRC
CRC-A26 - CRC CRC CRC-A165 Negative CRC CRC
CRC-A27 Negative CRC CRC CRC-A166 Negative CRC CRC
CRC-A28 Negative CRC CRC CRC-A167 Negative CRC CRC
CRC-A29 - Non-CRC Non-CRC CRC-A168 - CRC CRC
CRC-A30 - CRC CRC CRC-A169 Positive CRC CRC
CRC-A31 Positive CRC CRC CRC-A170 - CRC CRC
CRC-A32 - CRC CRC CRC-A171 Negative CRC CRC
CRC-A33 Negative CRC CRC CRC-A172 Positive Non-CRC Non-CRC
CRC-A34 - CRC CRC CRC-A173 Positive Non-CRC Non-CRC
CRC-A35 Negative CRC CRC CRC-A174 - CRC CRC
CRC-A36 Negative CRC CRC CRC-A175 - CRC CRC
CRC-A37 Positive CRC CRC CRC-A176 Negative CRC CRC
CRC-A38 Negative CRC CRC CRC-A177 Negative CRC CRC
CRC-A39 Negative CRC CRC CRC-A178 - CRC CRC
CRC-A40 - CRC CRC CRC-A179 Positive CRC CRC
CRC-A41 - CRC CRC CRC-A180 - CRC CRC
CRC-A42 Positive CRC CRC CRC-A181 Negative CRC CRC
CRC-A43 Positive CRC CRC CRC-A182 - CRC CRC
CRC-A44 Positive CRC CRC CRC-A183 Negative CRC CRC
CRC-A45 Positive CRC CRC CRC-A184 Positive CRC CRC
CRC-A46 Positive CRC CRC CRC-A185 Positive CRC CRC
CRC-A47 Positive CRC CRC CRC-A186 - CRC CRC
CRC-A48 Negative CRC CRC CRC-A187 Positive CRC CRC
CRC-A49 Positive CRC CRC CRC-A188 - CRC CRC
CRC-A50 Positive CRC CRC CRC-A189 Negative CRC CRC
CRC-A51 Negative CRC CRC CRC-A190 Negative CRC CRC
CRC-A52 - CRC CRC CRC-A191 Positive CRC CRC
CRC-A53 Positive CRC CRC CRC-A192 Positive CRC CRC
CRC-A54 Negative CRC CRC CRC-A193 Negative CRC CRC
CRC-A55 Positive CRC CRC CRC-A194 Negative CRC CRC
CRC-A56 Positive CRC CRC CRC-A195 Negative CRC CRC
CRC-A57 Positive CRC CRC CRC-A196 Positive CRC Non-CRC
CRC-A58 Positive CRC CRC CRC-A197 - CRC CRC
CRC-A59 Negative CRC CRC CRC-A198 Positive CRC CRC
CRC-A60 - CRC CRC CRC-A199 - CRC CRC
CRC-A61 Positive CRC CRC CRC-A200 - CRC CRC
CRC-A62 - CRC CRC CRC-A201 - CRC CRC
CRC-A63 Negative CRC CRC CRC-A202 Negative CRC CRC
CRC-A64 Negative CRC CRC CRC-A203 - CRC CRC
CRC-A65 Negative CRC CRC CRC-A204 Negative CRC CRC
CRC-A66 Positive CRC CRC CRC-A205 Negative CRC CRC
CRC-A67 Negative CRC CRC CRC-A206 Negative CRC CRC
CRC-A68 Negative CRC CRC CRC-A207 Positive CRC CRC
CRC-A69 Positive CRC CRC CRC-A208 Negative CRC CRC
CRC-A70 Positive CRC CRC CRC-A209 - CRC CRC
CRC-A71 Positive CRC CRC CRC-A210 Negative CRC CRC
CRC-A72 Positive Non-CRC Non-CRC CRC-A211 - CRC CRC
CRC-A73 - CRC CRC CRC-A212 - CRC CRC
CRC-A74 - CRC CRC CRC-A213 - CRC CRC
CRC-A75 - Non-CRC Non-CRC CRC-A214 - CRC CRC
CRC-A76 Positive CRC CRC CRC-A215 Negative CRC CRC
CRC-A77 - CRC CRC CRC-A216 Positive CRC CRC
CRC-A78 Positive CRC CRC CRC-A217 - CRC CRC
CRC-A79 Positive Non-CRC Non-CRC CRC-A218 - CRC CRC
CRC-A80 Positive CRC CRC CRC-A219 Negative CRC CRC
CRC-A81 Positive Non-CRC Non-CRC CRC-A220 - CRC CRC
CRC-A82 - CRC CRC CRC-A221 - CRC CRC
CRC-A83 Positive CRC CRC CRC-A222 Negative CRC CRC
CRC-A84 Positive CRC CRC CRC-A223 - CRC CRC
CRC-A85 Positive CRC CRC CRC-A224 Negative CRC CRC
CRC-A86 Positive CRC CRC CRC-A225 - CRC CRC
CRC-A87 - CRC CRC CRC-A226 - CRC CRC
CRC-A88 Negative CRC CRC CRC-A227 - CRC CRC
CRC-A89 - CRC CRC CRC-A228 - CRC CRC
CRC-A90 Positive CRC CRC CRC-A229 Positive CRC CRC
CRC-A91 Negative CRC CRC CRC-A230 Negative CRC CRC
CRC-A92 Positive CRC CRC CRC-A231 Negative CRC CRC
CRC-A93 Negative CRC CRC CRC-A232 - CRC CRC
CRC-A94 - CRC CRC CRC-A233 Positive CRC CRC
CRC-A95 - CRC CRC CRC-A234 Positive CRC CRC
CRC-A96 Positive CRC CRC CRC-A235 - CRC CRC
CRC-A97 Positive CRC CRC CRC-A236 Positive CRC CRC
CRC-A98 Positive CRC CRC CRC-A237 Positive CRC CRC
CRC-A99 Positive CRC CRC CRC-A238 Negative CRC CRC
CRC-A100 Negative CRC CRC CRC-A239 Negative Non-CRC Non-CRC
CRC-A101 - Non-CRC Non-CRC CRC-A240 Negative CRC CRC
CRC-A102 Negative CRC CRC CRC-A241 Negative CRC CRC
CRC-A103 Positive CRC CRC CRC-A242 - CRC CRC
CRC-A104 Positive CRC CRC CRC-A243 - CRC CRC
CRC-A105 Positive CRC CRC CRC-A244 Positive CRC Non-CRC
CRC-A106 Negative CRC CRC CRC-A245 - CRC CRC
CRC-A107 Positive CRC CRC CRC-A246 - CRC CRC
CRC-A108 Positive CRC CRC CRC-A247 Negative CRC CRC
CRC-A109 Positive CRC CRC CRC-A248 - Non-CRC Non-CRC
CRC-A110 Positive CRC CRC CRC-A249 - CRC CRC
CRC-A111 Positive CRC CRC CRC-A250 Negative CRC CRC
CRC-A112 - CRC CRC CRC-A251 Positive CRC CRC
CRC-A113 Positive CRC CRC CRC-A252 Negative CRC CRC
CRC-A114 - CRC CRC CRC-A253 Positive CRC CRC
CRC-A115 Positive CRC CRC CRC-A254 Positive CRC CRC
CRC-A116 - CRC CRC CRC-A255 Negative Non-CRC Non-CRC
CRC-A117 Positive CRC CRC CRC-A256 Negative Non-CRC Non-CRC
CRC-A118 Positive CRC CRC CRC-A257 Negative CRC CRC
CRC-A119 Negative CRC CRC CRC-A258 Positive CRC CRC
CRC-A120 - CRC CRC CRC-A259 Positive CRC CRC
CRC-A121 - CRC CRC CRC-A260 - CRC CRC
CRC-A122 Positive CRC Non-CRC CRC-A261 Negative Non-CRC Non-CRC
CRC-A123 Positive CRC CRC CRC-A262 Negative Non-CRC Non-CRC
CRC-A124 Positive CRC CRC CRC-A263 Negative Non-CRC Non-CRC
CRC-A125 Positive CRC CRC CRC-A264 Positive CRC CRC
CRC-A126 Negative CRC CRC CRC-A265 Positive CRC CRC
CRC-A127 Positive Non-CRC Non-CRC CRC-A266 Positive CRC CRC
CRC-A128 Positive CRC CRC CRC-A267 - CRC CRC
CRC-A129 - CRC CRC CRC-A268 Positive CRC CRC
CRC-A130 - CRC CRC CRC-A269 - CRC CRC
CRC-A131 Positive CRC CRC CRC-A270 - CRC CRC
CRC-A132 - CRC CRC CRC-A271 - CRC CRC
CRC-A133 Positive CRC CRC CRC-A272 Positive Non-CRC Non-CRC
CRC-A134 Positive CRC CRC CRC-A273 Positive Non-CRC Non-CRC
CRC-A135 Positive CRC CRC CRC-A274 Negative Non-CRC Non-CRC
CRC-A136 Negative CRC CRC CRC-A275 - CRC CRC
CRC-A137 Negative CRC CRC CRC-A276 Negative CRC CRC
CRC-A138 Positive CRC CRC CRC-A277 Positive CRC CRC
CRC-A139 Negative CRC CRC
CRC-B1 - CRC CRC CRC-B73 Negative CRC CRC
CRC-B2 Positive CRC CRC CRC-B74 - CRC CRC
CRC-B3 Positive CRC CRC CRC-B75 Negative CRC CRC
CRC-B4 Positive CRC CRC CRC-B76 Negative CRC CRC
CRC-B5 Negative Non-CRC Non-CRC CRC-B77 - CRC CRC
CRC-B6 - CRC CRC CRC-B78 - CRC CRC
CRC-B7 Negative CRC Non-CRC CRC-B79 Positive CRC CRC
CRC-B8 Positive CRC CRC CRC-B80 Negative CRC CRC
CRC-B9 Positive CRC CRC CRC-B81 Negative CRC CRC
CRC-B10 Negative CRC Non-CRC CRC-B82 Negative CRC CRC
CRC-B11 Positive CRC CRC CRC-B83 Positive CRC CRC
CRC-B12 Negative CRC CRC CRC-B84 - CRC CRC
CRC-B13 - CRC CRC CRC-B85 Positive CRC CRC
CRC-B14 Negative CRC CRC CRC-B86 Positive CRC CRC
CRC-B15 - CRC CRC CRC-B87 Negative CRC CRC
CRC-B16 Negative CRC CRC CRC-B88 Negative CRC CRC
CRC-B17 Negative CRC CRC CRC-B89 Positive CRC CRC
CRC-B18 Negative CRC CRC CRC-B90 Positive CRC CRC
CRC-B19 - CRC Non-CRC CRC-B91 Negative CRC CRC
CRC-B20 Positive CRC CRC CRC-B92 Positive CRC CRC
CRC-B21 Negative CRC CRC CRC-B93 - CRC CRC
CRC-B22 Negative CRC CRC CRC-B94 - CRC CRC
CRC-B23 Positive CRC CRC CRC-B95 Negative CRC Non-CRC
CRC-B24 Negative CRC CRC CRC-B96 - CRC Non-CRC
CRC-B25 - CRC CRC CRC-B97 - CRC CRC
CRC-B26 - CRC CRC CRC-B98 Positive CRC CRC
CRC-B27 Negative CRC CRC CRC-B99 Positive CRC CRC
CRC-B28 Positive CRC CRC CRC-B100 - CRC CRC
CRC-B29 - CRC CRC CRC-B101 - CRC CRC
CRC-B30 Positive CRC CRC CRC-B102 Positive CRC CRC
CRC-B31 Positive CRC CRC CRC-B103 Negative CRC CRC
CRC-B32 Negative CRC CRC CRC-B104 Negative CRC CRC
CRC-B33 - CRC CRC CRC-B105 Positive CRC CRC
CRC-B34 Positive CRC CRC CRC-B106 Positive CRC CRC
CRC-B35 Positive CRC CRC CRC-B107 - CRC CRC
CRC-B36 - CRC CRC CRC-B108 Positive CRC CRC
CRC-B37 Negative CRC CRC CRC-B109 - CRC CRC
CRC-B38 Positive Non-CRC Non-CRC CRC-B110 - CRC CRC
CRC-B39 Negative CRC CRC CRC-B111 Negative CRC CRC
CRC-B40 Positive CRC CRC CRC-B112 - CRC CRC
CRC-B41 - CRC Non-CRC CRC-B113 Negative CRC CRC
CRC-B42 Positive CRC CRC CRC-B114 Negative CRC CRC
CRC-B43 - CRC CRC CRC-B115 Positive CRC CRC
CRC-B44 - CRC CRC CRC-B116 Negative CRC CRC
CRC-B45 Negative CRC CRC CRC-B117 Positive CRC CRC
CRC-B46 Positive CRC CRC CRC-B118 - CRC CRC
CRC-B47 Positive CRC CRC CRC-B119 Positive CRC CRC
CRC-B48 Negative CRC CRC CRC-B120 Negative CRC CRC
CRC-B49 Negative CRC CRC CRC-B121 - CRC CRC
CRC-B50 - CRC CRC CRC-B122 Positive CRC CRC
CRC-B51 Negative CRC CRC CRC-B123 - CRC CRC
CRC-B52 - CRC CRC CRC-B124 Negative CRC CRC
CRC-B53 - CRC CRC CRC-B125 Positive CRC CRC
CRC-B54 Positive CRC CRC CRC-B126 - CRC CRC
CRC-B55 - CRC CRC CRC-B127 - CRC CRC
CRC-B56 - CRC CRC CRC-B128 Negative CRC CRC
CRC-B57 Positive CRC CRC CRC-B129 Negative CRC CRC
CRC-B58 Positive CRC CRC CRC-B130 - CRC CRC
CRC-B59 - CRC CRC CRC-B131 - CRC CRC
CRC-B60 Negative CRC CRC CRC-B132 Negative CRC CRC
CRC-B61 Positive CRC CRC CRC-B133 - CRC CRC
CRC-B62 Positive CRC CRC CRC-B134 Positive CRC CRC
CRC-B63 Negative CRC CRC CRC-B135 - CRC CRC
CRC-B64 Negative CRC CRC CRC-B136 - CRC CRC
CRC-B65 Negative CRC CRC CRC-B137 Positive CRC CRC
CRC-B66 Positive CRC CRC CRC-B138 Positive CRC CRC
CRC-B67 Negative CRC CRC CRC-B139 Positive CRC CRC
CRC-B68 Negative CRC CRC CRC-B140 - CRC CRC
CRC-B69 - CRC CRC CRC-B141 Negative CRC CRC
CRC-B70 Positive CRC CRC CRC-B142 Positive CRC CRC
CRC-B71 - CRC CRC CRC-B143 - CRC CRC
CRC-B72 Negative CRC CRC
본 발명에 따른 판별 결과의 재현성을 확인하기 위하여 검증 집합 중 정상 대조군 13개, CRC 환자군 35개, BRC 환자군 7개, 위암 환자군 14개, OVC 환자군 7개, TA 환자군 5개 시료에 대해 같은 과정을 반복하였는데, 그 결과를 표 132에 나타내었다. 판별 결과가 번복되는 경우는 TA 환자군에 집중되었는데 TA 중 Tis는 암으로 분류되기도 하고 분류되지 않기도 하는 등 임상적으로도 혼란이 있는데 본 발명에 따른 판별 결과에서도 혼란스러운 결과를 나타내었다 TA 환자군을 제외하면 90% 이상의 재현율을 나타내는 것을 확인할 수 있는데, 이는 본 발명의 우수한 판별 성능을 증명한다.
표 132
Prediction after1st 5 times repeated Low mass ion measurements Prediction after2nd 5 times repeated Low mass ion measurements Prediction after1st 5 times repeated Low mass ion measurements Prediction after2nd 5 times repeated Low mass ion measurements
CRC LOME 1-104& CRC LOME 2-23 CRC LOME 1-104& CRC LOME 2-23 CRC LOME 1-104& CRC LOME 2-23 CRC LOME 1-104& CRC LOME 2-23
CONT-B1 Non-CRC Non-CRC CRC-B1 CRC CRC
CONT-B5 Non-CRC Non-CRC CRC-B2 CRC CRC
CONT-B9 Non-CRC Non-CRC CRC-B3 CRC CRC
CONT-B13 Non-CRC Non-CRC CRC-B4 CRC CRC
CONT-B17 Non-CRC Non-CRC CRC-B5 Non-CRC Non-CRC
CONT-B21 Non-CRC Non-CRC CRC-B7 Non-CRC CRC
CONT-B26 Non-CRC Non-CRC CRC-B8 CRC CRC
CONT-B29 Non-CRC Non-CRC CRC-B9 CRC CRC
CONT-B33 CRC Non-CRC CRC-B10 Non-CRC CRC
CONT-B36 Non-CRC Non-CRC CRC-B11 CRC CRC
CONT-B41 Non-CRC Non-CRC CRC-B12 CRC CRC
CONT-B47 Non-CRC Non-CRC CRC-B13 CRC CRC
CONT-B49 Non-CRC Non-CRC CRC-B15 CRC CRC
BRC-B1 Non-CRC Non-CRC CRC-B16 CRC CRC
BRC-B5 Non-CRC Non-CRC CRC-B18 CRC CRC
BRC-B9 Non-CRC Non-CRC CRC-B19 Non-CRC CRC
BRC-B13 Non-CRC Non-CRC CRC-B20 CRC CRC
BRC-B17 Non-CRC Non-CRC CRC-B22 CRC CRC
BRC-B21 Non-CRC Non-CRC CRC-B24 CRC CRC
BRC-B25 Non-CRC Non-CRC CRC-B25 CRC CRC
GC-B1 Non-CRC Non-CRC CRC-B26 CRC CRC
GC-B5 Non-CRC Non-CRC CRC-B28 CRC CRC
GC-B9 Non-CRC Non-CRC CRC-B29 CRC CRC
GC-B13 Non-CRC Non-CRC CRC-B32 CRC CRC
GC-B17 Non-CRC Non-CRC CRC-B33 CRC CRC
GC-B21 Non-CRC Non-CRC CRC-B34 CRC CRC
GC-B25 CRC Non-CRC CRC-B35 CRC Non-CRC
GC-B29 Non-CRC Non-CRC CRC-B36 CRC CRC
GC-B33 Non-CRC Non-CRC CRC-B37 CRC CRC
GC-B37 Non-CRC Non-CRC CRC-B38 Non-CRC Non-CRC
GC-B41 Non-CRC Non-CRC CRC-B39 CRC CRC
GC-B45 Non-CRC Non-CRC CRC-B40 CRC CRC
GC-B49 Non-CRC Non-CRC CRC-B41 Non-CRC CRC
GC-B53 Non-CRC Non-CRC CRC-B42 CRC CRC
OVC-B1 Non-CRC Non-CRC CRC-B43 CRC CRC
OVC-B5 Non-CRC Non-CRC TA-B1 CRC Non-CRC
OVC-B9 CRC CRC TA-B5 CRC Non-CRC
OVC-B13 Non-CRC Non-CRC TA-B8 CRC Non-CRC
OVC-B17 Non-CRC Non-CRC TA-B14 CRC Non-CRC
OVC-B21 Non-CRC Non-CRC TA-B18 Non-CRC Non-CRC
OVC-B25 Non-CRC Non-CRC Reproducibility 90.79% (86.42%, when TA was included)
도 25a 및 도 25b는 각각 제1종 CRC 진단용 저질량 이온들 중 1465.6184 m/z과 2450.9701 m/z를 동정한 결과를 나타낸다. 두 개의 저질량 이온 모두 구성하는 동위원소의 수에 따라 약 1 m/z 정도의 질량값 차이가 발생하는 동일 물질 질량 피크군의 형태를 보여 주고 있다. 이는 질량분석기에서 나타나는 단백질 또는 펩타이드 특유의 질량 피크 양상이다.
도 25a 및 25b의 왼쪽 위 그림은 상기한 두 저질량 이온 각각의 질량 스펙트럼을 나타내고 있다. 빨간 선으로 표시된 스펙트럼은 CRC 환자군 혈청 추출물에서의 피크 강도를 나타내며, 파란 선으로 표시된 스펙트럼은 정상 대조군에서 얻어진 것이다. 1465.6184 m/z의 경우 CRC 환자군에서 더 높은 피크 강도를 보이는 반면, 2450.9701 m/z는 반대로 CRC 환자군에서 더 낮은 피크 강도를 보였다. 도 25a 및 25b의 오른쪽 위 그림은 상기한 두 저질량 이온의 MS/MS 분석 스펙트럼을 나타내며, 도 25a 및 25b 내의 표와 왼쪽 아래 그림은 1465.6184 m/z과 2450.9701 m/z 이온 물질이 MS/MS 분석을 통해 각각 피브리노겐 알파 체인과 트랜스타이레틴 단백질로 동정되었음을 보여준다.
피브리노겐 알파 체인에 해당하는 저질량 이온 1465.6184 m/z의 피크 강도가 CRC 환자군에서 높았던 정성적인 결과에 상응되게, 정량적으로 측정해 본 결과 CRC 환자의 혈액 내 피브리노겐의 수치가 정상인에 비해 높으며, 병기가 진행될수록 높았다(표 133 참고).
표 133
Number Plasma fibrinogen level (mg/dL), mean ± standard deviation p-value
Healthy control 37 274.51 ± 93.22 <0.001
Colorectal adenoma 29 279.59 ± 58.03 1.000
Stage I CRC 148 298.93 ± 69.40 0.685
Stage II CRC 340 351.14 ± 96.65 <0.001
Stage III CRC 507 345.19 ± 95.25 <0.001
Stage IV CRC 57 365.33 ± 91.37 <0.001
반면, 트랜스타이레틴에 해당하는 저질량 이온 2450.9701 m/z의 피크 강도가 CRC 환자군에서 낮았던 정성적인 결과에 상응되게, 정량적으로 측정해 본 결과 CRC 환자의 혈액 내 트랜스타이레틴의 수치가 정상인에 비해 낮았다(표 134 참고). 평균 ± 표준편차의 형식으로 요약하면 CRC 환자군 160.39 ± 62.41 ng/mL, 정상 대조군 171.19 ± 30.86 ng/mL이었다.
표 134
Level of Transthyretin(ng/mL) Level of Transthyretin(ng/mL)
CRC-A134 194.4053871 CRC-B25 163.7544561
CRC-A135 160.3388216 CRC-B26 103.763308
CRC-A137 45.31734887 CRC-B27 272.5678515
CRC-A139 154.2433081 CRC-B28 146.0108407
CRC-A140 201.5848401 CRC-B29 157.6719758
CRC-A141 181.6259276 CRC-B30 34.24514756
CRC-A142 181.8730938 CRC-B32 209.2664543
CRC-A143 209.4562651 CRC-B33 14.23188743
CRC-A144 204.9015183 CRC-B34 170.7668514
CRC-A145 204.8086556 CRC-B35 240.8403292
CRC-A146 151.7466189 CRC-B46 314.1906603
CRC-A147 155.5422654 CRC-B47 24.56925637
CRC-A148 241.4415416 CRC-B48 201.2652628
CRC-A149 232.1575272 CONT-B2 131.7631966
CRC-A150 178.8075456 CONT-B3 185.5791386
CRC-A151 150.5475887 CONT-B4 118.2875787
CRC-A152 150.3770739 CONT-B5 134.204582
CRC-A153 140.3009368 CONT-B6 122.8785828
CRC-A154 146.5080959 CONT-B7 163.1616804
CRC-A155 20.11742957 CONT-B8 155.4717726
CRC-A156 148.9523525 CONT-B9 234.9631822
CRC-B2 107.8883621 CONT-B10 162.5710506
CRC-B4 176.2724527 CONT-B11 162.7922858
CRC-B5 39.91544623 CONT-B12 159.0358497
CRC-B6 156.5325266 CONT-B14 251.1537438
CRC-B7 199.4036008 CONT-B15 160.8484111
CRC-B10 145.7793662 CONT-B16 157.2437136
CRC-B11 181.4202125 CONT-B18 187.9070482
CRC-B12 158.8557207 CONT-B19 158.4960747
CRC-B13 176.0328979 CONT-B20 184.9911989
CRC-B14 209.6462481 CONT-B22 177.2741119
CRC-B16 142.1897289 CONT-B23 151.5403947
CRC-B18 224.0415149 CONT-B24 203.7437549
CRC-B19 212.08369 CONT-B27 179.7828571
CRC-B20 179.8236103 CONT-B32 199.8560708
CRC-B21 154.8387737 CONT-B34 185.7895696
CRC-B22 156.8521618 CONT-B35 163.8658411
CRC-B23 89.36660383 CONT-B48 158.9637736
CRC-B24 120.9443976 CONT-B50 198.7268159
본 발명을 통해 혈청의 저질량 이온 질량 스펙트럼을 분석하여 CRC 환자와 비환자를 높은 판별 성능을 갖고 판정할 수 있었다.
3. 유방암을 진단하기 위한 암 진단 장치의 실시 예
도 26은 본 발명의 BRC를 진단하기 위한 도 7의 암 진단부를 더욱 상세히 나타낸 블록도이다.
도시된 바와 같이 본 발명에 따른 암 진단부는, 훈련 후보 집합인 상기 유방암 환자 및 비환자 케이스들의 저질량 이온 질량 스펙트럼들을 정렬하는 제1정렬수단(5100); 정렬된 상기 질량 스펙트럼에 대해 생물통계학적 분석을 수행하여 판별 점수를 계산하는 제1판별점수 계산수단(5200); 상기 판별 점수에 따라 민감도 및 특이도를 계산하고, 이를 기준으로 제1훈련집합을 선정하여 저질량 이온별 인자적재값을 계산하는 인자적재값 계산수단(5300); 후보 조건을 만족하는 후보 저질량 이온들 중 판별 성능을 기반으로 하여 유방암 진단용 저질량 이온들을 선택하는 유방암진단용이온 선정수단(5400); 판별 대상 생물학적 시료의 저질량 이온 질량 스펙트럼을 상기 제1훈련집합에 정렬하는 제2정렬수단(5500); 상기 판별 대상의 저질량 이온의 피크 강도와 상기 인자적재값으로부터 판별 점수를 계산하는 제2판별점수 계산수단(5600); 및 상기 판별 점수에 따라 상기 판별 대상을 유방암의 양성 또는 음성으로 판정하는 유방암 판정수단(5700)을 포함하되, 상기 유방암진단용이온 선정수단(5400)은; 상기 다수의 유방암 환자 및 비환자 케이스들을 제1종 판별 케이스들로 구성하거나, 상기 다수의 유방암 환자 및 비환자 케이스들을, 다수의 유방암 환자 케이스들과 다수의 정상인 케이스들로 구성되는 제2종 판별 케이스들과, 상기 다수의 유방암 환자 케이스들과 다수의 유방암 이외의 암 환자 케이스들로 구성되는 제3종 판별 케이스들로 구분하고, 상기 제1종 판별 케이스들과, 상기 제2종 판별 케이스들 및 상기 제3종 판별 케이스들에 대해 각각 실행되어, 상기 유방암 진단용 저질량 이온들이 상기 제1종 판별 케이스에 대한 제1종 유방암 진단용 저질량 이온들과, 상기 제2종 판별 케이스에 대한 제2종 유방암 진단용 저질량 이온들 및 상기 제3종 판별 케이스에 대한 제3종 유방암 진단용 저질량 이온들로 구분되는 것을 특징으로 한다.
이를 위하여, 저질량 이온 검출부(1000)는; 다수의 유방암 환자 및 비환자 케이스들의 생물학적 시료로부터 질량분석기를 사용하여 상기 저질량 이온의 피크 강도를 검출하여 상기 저질량 이온의 질량 스펙트럼을 추출한다.
아울러, 상기 BRC를 진단하기 위한 암 진단부의 더욱 세세한 구성 요소들은, 전술한 상기 암 진단 장치에서의 도9 내지 도13을 통하여 설명한 구성 요소들과 대동소이하므로, 여기서 이에 대한 세세한 구성의 도시 및 설명은 생략하기로 하고, 이하 본 발명의 일 실시 예에 대하여 상세히 설명한다.
본 발명의 암 진단 장치는 도 26에 도시된 바와 같이 하드웨어로 구성되거나 또는 프로그램 구조에 의한 소프트웨어로 구성될 수도 있으며, 이하에서는 일 예로서 첨부된 순서도의 프로세스를 참조하여 소프트웨어로 구성된 BRC를 진단하기 위한 암 진단 장치를 상세히 설명하기로 한다.
(3-1) 시료 준비 - 혈청 수집 대상
전술한 표 201의 54명의 BRC 환자군, 전술한 표 202의 49명의 정상 대조군, 표 205의 34명의 CRC 환자군, 표 206의 16명의 GC 환자군 및 표 207의 12명의 비호지킨림프종(non-Hodgkin lymphoma, NHL) 환자군으로부터 혈청을 수집하였다.
표 205
CRC Sex Ageyear Stage Location Cell Type CEAng/mL
CRC-C1 F 47 I S-colon AC 0.7
CRC-C2 F 82 I A-colon AC 1.1
CRC-C3 F 47 I Rectum AC 3.9
CRC-C4 F 54 I Rectum AC 1.6
CRC-C5 F 81 II S-colon AC 4.1
CRC-C6 F 76 II Rectum AC 25.3
CRC-C7 F 71 II A-colon AC 1.6
CRC-C8 F 82 II S-colon AC 1.8
CRC-C9 F 68 II D-colon AC 1.7
CRC-C10 F 67 II A-colon AC 1.9
CRC-C11 F 51 II Rectum AC 6.7
CRC-C12 F 59 II A-colon AC 1
CRC-C13 F 51 II D-colon AC 5.9
CRC-C14 F 56 III S-colon AC 1.2
CRC-C15 F 59 III S-colon AC 1.7
CRC-C16 F 73 III S-colon AC 5.7
CRC-C17 F 55 III Rectum AC 2.1
CRC-C18 F 61 III A-colon AC 12.7
CRC-C19 F 50 III S-colon AC 4.8
CRC-C20 F 51 III S-colon AC 7
CRC-C21 F 74 III T-colon AC 2.5
CRC-C22 F 79 III Rectum AC 14.1
CRC-C23 F 52 III S-colon AC 22.1
CRC-C24 F 47 III S-colon AC 1.2
CRC-C25 F 64 III S-colon AC 6.8
CRC-C26 F 51 III S-colon AC 1.2
CRC-C27 F 65 III D-colon AC 3.5
CRC-C28 F 54 III S-colon AC 8.8
CRC-C29 F 60 III S-colon, A-colon AC 28.5
CRC-C30 F 70 IV Rectum AC 3.9
CRC-C31 F 63 IV D-colon AC 12.3
CRC-C32 F 63 IV A-colon AC 1.4
CRC-C33 F 50 IV Rectum AC 62
CRC-C34 F 66 IV S-colon AC 18.5
AC: Adenocarcinoma
표 206
GC Sex Ageyear CEAng/mL Stage
GC-C1 F 62 - I
GC-C2 F 44 - I
GC-C3 F 40 - I
GC-C4 F 60 1.2 II
GC-C5 F 57 - II
GC-C6 F 67 - II
GC-C7 F 60 - II
GC-C8 F 62 8.3 III
GC-C9 F 47 2.86 III
GC-C10 F 55 - III
GC-C11 F 46 - III
GC-C12 F 52 3.36 IV
GC-C13 F 71 1.92 IV
GC-C14 F 34 13.44 IV
GC-C15 F 40 - IV
GC-C16 F 71 - IV
표 207
NHL Sex Ageyear Stage Involved Site Subtype IPI
NHL-C1 F 56 1 breast DLBL 0
NHL-C2 F 38 1 stomach DLBL 0
NHL-C3 F 49 1 mandibular area DLBL 0
NHL-C4 F 48 1 neck, submandibular DLBL 0
NHL-C5 F 38 2 tonsil, neck LN DLBL 0
NHL-C6 F 41 2 stomach DLBL 1
NHL-C7 F 66 2 gum, submandibular DLBL 1
NHL-C8 F 73 3 multiple DLBL 2
NHL-C9 F 69 3 multiple ATCL 3
NHL-C10 F 57 4 multiple DLBL 3
NHL-C11 F 24 4 multiple DLBL 4
NHL-C12 F 76 4 multiple DLBL 3
또한, 이 165명을 집합 C1으로 하여 후술하는 바와 같이 그 부분 집합 C0로 제1훈련집합을 구성하였으며, 이 제1훈련집합에 대한 생물통계학적 분석을 통해 질량 이온별 가중치(인자적재값)를 계산하고, 예비 판별식을 획득하였다. 또한, 이 집합 C1 외에 표 208의 54명의 BRC 환자군, 표 209의 46명의 정상 대조군, 표 210의 29명의 CRC 환자군, 표 211의 15명의 GC 환자군 및 표 212의 7명의 NHL 환자군을 집합 C2(제2훈련집합)로 하여 훈련 집합을 확장하였다. 즉 예비 판별식을 구성하는 저질량 이온들의 예비 후보군으로부터 후술할 방법에 따라 BRC 진단용 저질량 이온들을 확인할 때에는 서로 독립적인 집합인 집합 C1과 집합 C2의 합집합, 즉 집합 C를 훈련 집합으로 사용하였다.
표 208
BRC Sex Ageyear Node ER ER% PR PR% HER2 Tumor Size cm
BRC-C55 F 44 pN0 6 33-66% 7 >66% 1 1.2
BRC-C56 F 72 pN0(sn) 0 0% 0 0% 0 1.8
BRC-C57 F 48 pN0(sn) 5 33-66% 4 10-33% 1 0.8
BRC-C58 F 44 pN0 5 33-66% 7 >66% 1 2
BRC-C59 F 41 pN2a 5 33-66% 6 33-66% 1 4
BRC-C60 F 58 pN0 6 33-66% 0 0% 2 <0.1
BRC-C61 F 42 - 5 33-66% 6 33-66% 2 -
BRC-C62 F 44 pN1a 4 10-33% 2 <10% 2 5.5
BRC-C63 F 62 pN0(sn) 7 >66% 0 0% 0 2
BRC-C64 F 47 pN0 6 33-66% 6 33-66% 2 2.4
BRC-C65 F 52 pN1a 6 33-66% 0 0% 3 1.8
BRC-C66 F 44 pN0(sn) 6 33-66% 0 0% 0 2
BRC-C67 F 49 pN0(sn) 2 <10% 2 <10% 3 0.4
BRC-C68 F 46 pN0(sn) 6 33-66% 5 33-66% 1 0.7
BRC-C69 F 58 pN0(sn) 7 >66% 5 33-66% 1 2.3
BRC-C70 F 64 pN1a 6 33-66% 7 >66% 1 2
BRC-C71 F 47 - 6 33-66% 6 33-66% 2 -
BRC-C72 F 74 pN1a 6 33-66% 6 33-66% 1 1.8
BRC-C73 F 64 pN0(sn) 0 0% 0 0% 1 2.2
BRC-C74 F 40 ypN1a 6 33-66% 6 33-66% 1 3.5
BRC-C75 F 43 pN0 6 33-66% 6 33-66% 2 2.5
BRC-C76 F 43 ypN0 0 0% 0 0% 2 -
BRC-C77 F 42 pN0 0 0% 0 0% 0 2.3
BRC-C78 F 37 pN0(i+) 6 33-66% 6 33-66% 1 1
BRC-C79 F 50 pN1a 6 33-66% 6 33-66% 1 1
BRC-C80 F 57 pN0(sn) 6 33-66% 96 33-66% 1 1.4
BRC-C81 F 38 ypN0 0 0% 0 0% 1 2
BRC-C82 F 67 - 6 33-66% 2 <10% 1 -
BRC-C83 F 42 pN0(sn) 6 33-66% 6 33-66% 2 0.5
BRC-C84 F 46 pN0(sn) 6 33-66% 6 33-66% 1 1
BRC-C85 F 48 pN2a 4 10-33% 4 10-33% 3 2.5
BRC-C86 F 58 pN0 2 <10% 0 0 1 0.5
BRC-C87 F 53 pN0(sn) 0 0% 0 0% 3 <0.1
BRC-C88 F 56 - 0 0% 0 0% 0 -
BRC-C89 F 45 pN0(sn) 6 33-66% 6 33-66% 2 <0.1
BRC-C90 F 59 pN0(sn) 5 33-66% 0 0% 2 1.4
BRC-C91 F 40 ypN1a 2 <10% 0 0% 0 0.3
BRC-C92 F 39 pN1 7 >95% 3 <10% 0 2.2
BRC-C93 F 54 pN0(i+) 7 95% 5 10-30% 1 1.7
BRC-C94 F 48 pN3a 7 90% 8 90% 0 3.2
BRC-C95 F 54 pN0 0 0% 0 0% 0 3
BRC-C96 F 43 pN0 7 50-60% 7 50-60% 3 2.3
BRC-C97 F 61 pN0 8 95% 8 95% 0 1.6
BRC-C98 F 54 - 0 0% 0 0% 3 -
BRC-C99 F 46 pN0 7 80% 8 95% 0 2.2
BRC-C100 F 61 pN0(i+0) 7 >95% 0 0% 0 4
BRC-C101 F 53 pN0 7 80% 5 25% 0 0.6
BRC-C102 F 49 pN0 3 20% 7 60% 0 0.3
BRC-C103 F 57 pN0 0 0% 0 0% 0 0.8
BRC-C104 F 68 pN0 0 0% 3 1% 3 1.2
BRC-C105 F 58 pN0 8 95% 4 40% 0 0.8
BRC-C106 F 40 - 8 95% 8 95% 0 -
BRC-C107 F 29 pN0 8 95% 8 95% 1 1.2
BRC-C108 F 40 - - - - - - -
표 209
Control Sex Ageyear CEAng/mL
CONT-C50 F 40 1.5
CONT-C51 F 50 1.9
CONT-C52 F 64 2.9
CONT-C53 F 52 1.9
CONT-C54 F 37 2.1
CONT-C55 F 49 2.6
CONT-C56 F 30 <0.5
CONT-C57 F 50 1.2
CONT-C58 F 49 2.1
CONT-C59 F 38 0.6
CONT-C60 F 59 1.6
CONT-C61 F 41 1.8
CONT-C62 F 48 1.2
CONT-C63 F 39 0.5
CONT-C64 F 51 1.1
CONT-C65 F 44 1.5
CONT-C66 F 38 1.5
CONT-C67 F 48 1.9
CONT-C68 F 70 4.8
CONT-C69 F 38 2.8
CONT-C70 F 50 1.1
CONT-C71 F 54 1.8
CONT-C72 F 38 0.9
CONT-C73 F 55 8.8
CONT-C74 F 51 2
CONT-C75 F 64 1.7
CONT-C76 F 54 <0.5
CONT-C77 F 59 0.8
CONT-C78 F 65 1.6
CONT-C79 F 68 1.6
CONT-C80 F 51 1.7
CONT-C81 F 62 1.3
CONT-C82 F 63 1.6
CONT-C83 F 60 1.9
CONT-C84 F 68 1.4
CONT-C85 F 62 1.9
CONT-C86 F 68 5.6
CONT-C87 F 53 2.3
CONT-C88 F 63 1.1
CONT-C89 F 46 leiomyoma
CONT-C90 F 39 myoma
CONT-C91 F 46 leiomyoma
CONT-C92 F 46 leiomyoma
CONT-C93 F 23 leiomyoma
CONT-C94 F 38 leiomyoma
CONT-C95 F 40 leiomyoma
표 210
CRC Sex Ageyear Stage Location Cell Type CEAng/mL
CRC-C35 F 78 I Rectum AC 2.6
CRC-C36 F 50 I Rectum AC 1.6
CRC-C37 F 74 I S-colon AC 2.3
CRC-C38 F 65 II S-colon AC 2.1
CRC-C39 F 66 II Rectum AC 4.3
CRC-C40 F 49 II A-colon AC 1.6
CRC-C41 F 79 II A-colon AC 2.9
CRC-C42 F 67 II A-colon AC 1.4
CRC-C43 F 69 II S-colon, A-colon AC 5.1
CRC-C44 F 52 II S-colon AC <0.5
CRC-C45 F 76 II S-colon AC 2.2
CRC-C46 F 44 III S-colon AC 1.4
CRC-C47 F 42 III S-colon AC 0.8
CRC-C48 F 43 III A-colon AC 4.7
CRC-C49 F 81 III Rectum AC 8.4
CRC-C50 F 73 III S-colon AC 1.7
CRC-C51 F 58 III Rectum AC 21.3
CRC-C52 F 42 III Rectum AC 0.7
CRC-C53 F 50 III D-colon AC 6.4
CRC-C54 F 73 III Rectum AC 3.7
CRC-C55 F 54 III D-colon AC 1122.2
CRC-C56 F 60 III A-colon AC 30.4
CRC-C57 F 69 III Rectum AC 1
CRC-C58 F 52 III S-colon AC 9.2
CRC-C59 F 55 III Rectum AC 0.9
CRC-C60 F 47 III S-colon AC 1.5
CRC-C61 F 72 IV A-colon AC 73.4
CRC-C62 F 69 IV A-colon AC 49
CRC-C63 F 78 IV A-colon AC 12.6
표 211
GC Sex Ageyear CEAng/mL Stage
GC-C17 F 64 4.16 I
GC-C18 F 77 - I
GC-C19 F 74 - I
GC-C20 F 49 - II
GC-C21 F 47 - II
GC-C22 F 49 - II
GC-C23 F 64 - II
GC-C24 F 68 5.56 III
GC-C25 F 81 - III
GC-C26 F 36 - III
GC-C27 F 42 <0.4 IV
GC-C28 F 57 6.98 IV
GC-C29 F 40 0.64 IV
GC-C30 F 52 - IV
GC-C31 F 33 - IV
표 212
NHL Sex Ageyear Stage Involved Site Subtype IPI
NHL-C13 F 73 1 nasal cavity DLBL 2
NHL-C14 F 48 1 breast DLBL 1
NHL-C15 F 39 2 tonsil, neck LN DLBL 0
NHL-C16 F 61 2 stomach DLBL 3
NHL-C17 F 38 4 multiple DLBL 3
NHL-C18 F 69 4 multiple Mantle cell L 4
NHL-C19 F 64 4 multiple DLBL 5
또한, 집합 C와 독립된 표 213의 53명의 BRC 환자군, 표 214의 46명의 정상 대조군, 표 215의 88명의 CRC 환자군, 표 216의 11명의 GC 환자군, 표 217의 5명의 NHL 환자군, 표 218의 25명의 난소암(ovarian cancer, OVC) 환자군을 집합 D로 하여 검증 집합을 구성하였다. OVC 환자군은 질량 이온별 가중치를 구할 때나 BRC 진단용 저질량 이온을 확인할 때 전혀 반영되지 않은 환자군으로, 본 발명에서 구성한 판별식으로 이 환자군이 어떻게 판별되는지 살펴보기 위하여 포함하였다.
표 213
BRC Sex Ageyear Node ER ER% PR PR% HER2 Tumor Size cm
BRC-D1 F 34 pN0(sn) 2 <10% 0 0% 2 2
BRC-D2 F 69 - 6 33-66% 6 33-66% 1 -
BRC-D3 F 52 - - - - - - -
BRC-D4 F 67 - - - - - - -
BRC-D5 F 61 - 6 33-66% 2 <10% 0 -
BRC-D6 F 38 pN1a 6 33-66% 5 33-66% 1 -
BRC-D7 F 60 pN0 6 33-66% 3 10-33% 1 1
BRC-D8 F 55 pN2a 5 33-66% 0 0% 2 2.2
BRC-D9 F 46 ypN0 5 33-66% 2 <10% 1 1.5
BRC-D10 F 67 pN0 6 33-66% 6 33-66% 1 2.8
BRC-D11 F 46 pN1a 6 33-66% 6 33-66% 2 0.7
BRC-D12 F 39 pN1mi 6 33-66% 6 33-66% 2 2.5
BRC-D13 F 50 pN0(sn) 4 10-33% 5 33-66% 0 1
BRC-D14 F 31 pN1mi(sn) 6 33-66% 6 33-66% 1 1
BRC-D15 F 46 pN0 6 33-66% 7 >66% 1 1.2
BRC-D16 F 44 pN0(sn) 6 33-66% 7 >66% 1 2.5
BRC-D17 F 40 pN0 0 0% 0 0% 0 -
BRC-D18 F 40 - 6 33-66% 6 33-66% 1 -
BRC-D19 F 56 - 7 >66% 0 0 0 0.6
BRC-D20 F 48 pN1a 0 0% 0 0% 0 3
BRC-D21 F 39 pN0(sn) 6 33-66% 6 33-66% 1 3.5
BRC-D22 F 40 ypN1a 6 33-66% 4 10-33% 2 3
BRC-D23 F 48 pN0(sn) 6 33-66% 6 33-66% 0 2.5
BRC-D24 F 59 - 7 >66% 2 <10% 1 -
BRC-D25 F 46 - 0 0% 0 0% 2 -
BRC-D26 F 37 pN3a 6 33-66% 6 33-66% 2 0.6
BRC-D27 F 38 pN0(sn) 6 33-66% 6 33-66% 2 0.3
BRC-D28 F 66 pN1a 6 33-66% 6 33-66% 0 1.5
BRC-D29 F 58 pN0(sn) 0 0% 0 0% 2 1.7
BRC-D30 F 42 pN3a 5 33-66% 6 33-66% 0 1.8
BRC-D31 F 52 pN0 6 33-66% 6 33-66% 0 0.7
BRC-D32 F 46 pN0(sn) 0 0% 2 <10% 1 1.5
BRC-D33 F 42 pN0(sn) 4 10-33% 6 33-66% 1 0.6
BRC-D34 F 48 - - - - - - -
BRC-D35 F 47 pN0 6 33-66% 2 <10% 2 3
BRC-D36 F 59 pN1a 6 33-66% 4 10-33% 1 1.8
BRC-D37 F 56 - 0 0% 0 0% 3 -
BRC-D38 F 61 pN0(i+0) 7 >95% 0 0% 0 4
BRC-D39 F 40 - 8 95% 8 95% 0 -
BRC-D40 F 43 pN0 0 0% 0 0% 3 0.7
BRC-D41 F 59 pN0 8 95% 8 95% 0 1.2
BRC-D42 F 45 PN2 7 95% 8 95% 1 2.1
BRC-D43 F 55 pN0 0 0% 0 0% 3 1.8
BRC-D44 F 52 pN0 7 80-90% 8 80-90% 0 0.3
BRC-D45 F 59 pN0 8 95% 5 2~3% 1 1.3
BRC-D46 F 39 - 7 >95% 7 70-80% 0 -
BRC-D47 F 39 pN0 0 0% 0 0% 3 1.1
BRC-D48 F 40 pN0 5 50-60% 5 20-30% 0 0.8
BRC-D49 F 46 pN0 7 95% 8 95% 0 4.9
BRC-D50 F 51 pN0 0 <1% 0 0% 0 0.9
BRC-D51 F 61 pN0 7 90% 8 90% 0 1.3
BRC-D52 F 48 pN0 0 0% 0 0% 0 0.6
BRC-D53 F 47 pN0 8 >95% 8 95% 0 0.7
표 214
Control Sex Ageyear CEAng/mL Control Sex Ageyear CEAng/mL
CONT-D1 F 44 - CONT-D24 F 51 2
CONT-D2 F 45 - CONT-D25 F 68 1.4
CONT-D3 F 54 - CONT-D26 F 52 1.5
CONT-D4 F 51 3.1 CONT-D27 F 63 1.8
CONT-D5 F 55 <0.5 CONT-D28 F 65 1.1
CONT-D6 F 46 <0.5 CONT-D29 F 55 4.8
CONT-D7 F 34 0.6 CONT-D30 F 52 4.1
CONT-D8 F 58 1.5 CONT-D31 F 64 <0.5
CONT-D9 F 54 - CONT-D32 F 63 2.2
CONT-D10 F 34 <0.5 CONT-D33 F 62 1.1
CONT-D11 F 45 0.8 CONT-D34 F 53 0.7
CONT-D12 F 44 - CONT-D35 F 65 3.8
CONT-D13 F 46 - CONT-D36 F 64 1.5
CONT-D14 F 54 2.3 CONT-D37 F 53 1
CONT-D15 F 39 1.3 CONT-D38 F 66 1.7
CONT-D16 F 55 1.3 CONT-D39 F 50 1.9
CONT-D17 F 46 - CONT-D40 F 70 pelic organprolapse
CONT-D18 F 45 - CONT-D41 F 44 leiomyoma
CONT-D19 F 63 - CONT-D42 F 70 pelic organprolapse
CONT-D20 F 51 - CONT-D43 F 53 leiomyoma
CONT-D21 F 52 - CONT-D44 F 34 leiomyoma
CONT-D22 F 52 - CONT-D45 F 44 leiomyoma
CONT-D23 F 70 - CONT-D46 F 41 leiomyoma, adenomyosis
표 215
CRC Sex Ageyear Stage Location Cell Type CEAng/mL
CRC-D1 F 59 I Rectum AC 1.6
CRC-D2 F 46 I S-colon AC 1.4
CRC-D3 F 67 II A-colon AC 7.3
CRC-D4 F 75 II Rectum AC 12.6
CRC-D5 F 60 II S-colon AC 3.3
CRC-D6 F 66 II S-colon AC 4.2
CRC-D7 F 81 II S-colon AC 2.4
CRC-D8 F 77 II Rectum AC 6.2
CRC-D9 F 82 II A-colon AC 2.8
CRC-D10 F 58 III S-colon AC 2.1
CRC-D11 F 65 III S-colon MAC 2.7
CRC-D12 F 51 III Rectum AC 1.4
CRC-D13 F 48 III A-colon AC 0.9
CRC-D14 F 54 III A-colon AC 1.7
CRC-D15 F 49 III S-colon AC 1
CRC-D16 F 63 III A-colon AC 58.2
CRC-D17 F 54 III T-colon AC 2.2
CRC-D18 F 70 III S-colon MAC 36
CRC-D19 F 54 III Rectum AC 5.5
CRC-D20 F 52 III A-colon AC 1.2
CRC-D21 F 71 III A-colon AC 2.8
CRC-D22 F 33 III D-colon AC 4.7
CRC-D23 F 68 III Rectum AC 3.3
CRC-D24 F 61 III A-colon AC 2.8
CRC-D25 F 54 IV S-colon AC 29.8
CRC-D26 F 52 IV A-colon MAC 9
CRC-D27 F 54 IV S-colon AC 27.9
CRC-D28 F 59 III Rectum AC 1.4
CRC-D29 F 75 II Rectum AC 2.4
CRC-D30 F 68 II Rectum AC 0.7
CRC-D31 F 56 I Rectum AC 2.3
CRC-D32 F 45 II Rectum AC 2.7
CRC-D33 F 49 II Rectum AC 2.1
CRC-D34 F 45 0 Rectum AC 0.9
CRC-D35 F 54 0 Rectum AC 3.6
CRC-D36 F 71 III Rectum AC 6.7
CRC-D37 F 56 III Rectum AC 1
CRC-D38 F 69 I Rectum AC 1.5
CRC-D39 F 71 III Rectum AC 1.8
CRC-D40 F 51 I Rectum AC 1.5
CRC-D41 F 67 III Rectum AC 3.4
CRC-D42 F 76 III Rectum AC 1
CRC-D43 F 38 III Rectum AC 0.7
CRC-D44 F 50 III Rectum AC 2.2
CRC-D45 F 49 0 Rectum AC 1.6
CRC-D46 F 42 III Rectum AC 9.9
CRC-D47 F 72 II Rectum AC 8
CRC-D48 F 69 III Rectum AC 11.3
CRC-D49 F 71 III Rectum AC 1.3
CRC-D50 F 60 I Rectum AC 1.2
CRC-D51 F 56 III Rectum AC 2.3
CRC-D52 F 68 I Rectum AC 2
CRC-D53 F 41 III Rectum AC 1.5
CRC-D54 F 34 III Rectum AC 5.2
CRC-D55 F 52 II Rectum AC 1.6
CRC-D56 F 67 0 Rectum AC 4.4
CRC-D57 F 66 II Rectum AC 4.8
CRC-D58 F 61 III A-colon AC 30.4
CRC-D59 F 71 III Rectum AC 1
CRC-D60 F 53 II S-colon AC 1.3
CRC-D61 F 77 II S-colon AC 2.2
CRC-D62 F 71 III S-colon MAC 36
CRC-D63 F 79 II Rectum AC 6.2
CRC-D64 F 53 III A-colon AC 1.2
CRC-D65 F 72 III A-colon AC 2.8
CRC-D66 F 34 III D-colon AC 4.7
CRC-D67 F 62 III A-colon AC 2.8
CRC-D68 F 84 II A-colon AC 2.8
CRC-D69 F 71 II S-colon AC 15.3
CRC-D70 F 56 I S-colon AC 0.7
CRC-D71 F 70 II S-colon AC 1.4
CRC-D72 F 62 III Rectum AC 235.4
CRC-D73 F 52 III S-colon AC 6.4
CRC-D74 F 61 III T-colon AC 13.9
CRC-D75 F 88 II A-colon AC 3
CRC-D76 F 73 I D-colon, T-colon AC 2
CRC-D77 F 69 I A-colon AC 5
CRC-D78 F 69 I A-colon AC 5.7
CRC-D79 F 74 II D-colon AC 12.5
CRC-D80 F 75 II Rectum AC 0.9
CRC-D81 F 57 I A-colon AC 1.5
CRC-D82 F 62 III S-colon AC 4.4
CRC-D83 F 74 III Rectum AC 31
CRC-D84 F 70 I A-colon AC 2.5
CRC-D85 F 70 II A-colon AC 5.9
CRC-D86 F 77 II S-colon AC 1.5
CRC-D87 F 62 III Rectum AC 13.7
CRC-D88 F 45 0 Rectum AC -
MAC: Mucinous adenocarcinoma
표 216
GC Sex Ageyear CEAng/mL Stage GC Sex Ageyear CEAng/mL Stage
GC-D1 F 81 - I GC-D7 F 81 - III
GC-D2 F 55 - I GC-D8 F 51 0.51 IV
GC-D3 F 40 - II GC-D9 F 43 1.62 IV
GC-D4 F 52 - II GC-D10 F 57 2.46 IV
GC-D5 F 81 - II GC-D11 F 52 - IV
GC-D6 F 80 - III
표 217
NHL Sex Ageyear Stage Involved Site Subtype IPI
NHL-D1 F 41 1 0 DLBL 0
NHL-D2 F 72 1 stomach DLBL 2
NHL-D3 F 76 2 stomach DLBL 1
NHL-D4 F 70 4 multiple DLBL 3
NHL-D5 F 48 4 multiple DLBL 3
표 218
OVC Ageyear Histology Stage
OVC-D1 56 IIIc Clear cell carcinoma
OVC-D2 52 IIa Endometrioid adenocarcinoma
OVC-D3 63 IV Papillary serous adenocarcinoma
OVC-D4 55 Ia Malignant Brenner tumor
OVC-D5 47 IIIc Papillary serous adenocarcinoma
OVC-D6 50 Ic Clear cell carcinoma
OVC-D7 68 Ib Serous adenocarcinoma
OVC-D8 74 IIIc Papillary serous adenocarcinoma
OVC-D9 43 Ic Mucinous adenocarcinoma
OVC-D10 44 IIIc Papillary serous adenocarcinoma
OVC-D11 54 IIIc Papillary serous adenocarcinoma
OVC-D12 55 IV Serous adenocarcinoma
OVC-D13 72 IIIc Serous adenocarcinoma
OVC-D14 58 IIIc Mucinous adenocarcinoma
OVC-D15 44 IIIc Papillary serous adenocarcinoma
OVC-D16 57 IV Serous adenocarcinoma
OVC-D17 54 IIIc Papillary serous adenocarcinoma
OVC-D18 73 IIIc Serous adenocarcinoma
OVC-D19 47 IIIc Papillary serous adenocarcinoma
OVC-D20 40 Ic Papillary serous adenocarcinoma
OVC-D21 74 IIb Transitional cell carcinoma
OVC-D22 65 IIIc Papillary serous adenocarcinoma
OVC-D23 47 IV Serous adenocarcinoma
OVC-D24 58 IIc Serous adenocarcinoma
OVC-D25 57 Ib Mixed cell adenocarcinoma
(3-2) 시료 준비 - 혈청 준비 및 질량 스펙트럼 측정
4배 부피의 메탄올/클로로포름(2:1, v/v)을 25㎕의 혈청과 함께 격렬하게 섞은 후에 10분 동안 실온에서 배양하였다. 혼합물은 4℃에서 10분 동안 6000 × g로 원심 분리하였다. 수득한 상청액을 1시간 동안 농축기(concentrator)에서 완전히 건조시켰으며, 30분 동안 교반기(vortexer)에서 30㎕의 50% 아세토니트릴(acetonitrile)/0.1% 트라이플루오린화 아세트산(trifluoroacetic acid, TFA)으로 용해시켰다.
메탄올/클로로포름 추출물을 50% 아세토니트릴/0.1% TFA 내에서 알파-시아노-4-하이드록시 시남산(α-cyano-4-hydroxycinnamic acid) 용액과 혼합하였으며(1:12, v/v), 1㎕의 혼합물을 MALDI-타깃 플레이트(target plate)에 위치시켰다. BRC 환자 및 비환자 혈청 추출물의 질량 스펙트럼을 Proteomics Analyzer(Applied Biosystems, Foster City, CA, USA)를 사용하여 측정하였다.
한 개의 시료에 대해 질량 스펙트럼 데이터는 20번 반복 측정된 스펙트럼의 평균으로 추출된다. 모든 개별 시료의 질량값 구간은 최대 질량값이 약 2500 m/z이 되도록 조정하였다. 실험적 오류를 최소화하기 위하여, 초점 질량(focus mass), 레이저 강도(laser intensity), 타깃 플레이트, 데이터 수집 시각(data acquisition time)을 포함하는 다양한 요소를 점검하였다.
바람직한 초점 질량 및 레이저 강도로 500 m/z 및 5000이 각각 고정되어 사용되었다. 모든 시료들은 고정된 초점 질량 및 레이저 강도와 함께, 다른 추출 및 다른 데이터 수집 시각하에서 최소 5번 반복 측정하였다. 질량 이온별 가중치를 계산한 집합 C1의 경우는 추가로 한 번 더 측정하였다.
따라서, 저질량 이온 검출수단(5000)은 MALDI-TOF 질량분석기를 이용하여 상기와 같은 과정을 통해서 혈청 시료로부터 저질량 이온 질량 스펙트럼을 추출할 수 있다.
(3-3) 판별 전략
구성한 판별식이 BRC 특이적인 식이 되기 위해서는 BRC 환자군은 판별식에 의해 정상 대조군뿐만 아니라 다른 암환자군과도 구분되어야 한다. 본 실시 예에서는 다른 암환자군으로 CRC 환자군, GC 환자군 및 NHL 환자군을 사용하고자 한다. 한 개의 판별식으로 BRC 환자군과 비환자군(정상 대조군, CRC 환자군, GC 환자군 및 NHL 환자군)을 구분할 수 있는지 종래의 주성분 분석 기반 선형 판별 분석 방법을 적용한 결과를 표 219에 나타내었다. 표 204에서와 같이 완벽한 판별 결과는 아니나, 대체적으로 80% 이상의 우수한 판별 성능을 보인다는 것을 확인할 수 있는데, 이로부터 한 개의 판별식으로 BRC 환자군과 비환자군을 구분할 수 있을 것으로 판단된다.
표 219
Sensitivity 100.0%
Set C1 True BRC True Non-BRC Specificity CONT 89.80%
CONT CRC GC NHL CRC 91.18%
Predicted BRC 54 5 3 2 2 GC 87.50%
Predicted Non-BRC 0 44 31 14 10 NHL 83.33%
도 4 및 표 204에서 확인한 바와 같이 BRC 환자군과 정상 대조군에 대해서는 완벽한 판별 결과를 얻을 수 있었으므로, BRC 환자군과 다른 암환자군이 구분될 수 있는지 살펴보았는데, 그 결과를 표 220에 나타내었다. 위음성 케이스는 없고 위양성 케이스도 하나만 나타나는 등 매우 우수한 판별 결과를 얻을 수 있었다.
표 220
Sensitivity 100.0%
Set C1 True BRC True Non-BRC Specificity CRC 100.0%
CRC GC NHL GC 93.75%
Predicted BRC 54 0 1 0 NHL 100.0%
Predicted Non-BRC 0 34 15 12 Total 98.39%
따라서 BRC 환자군과 비환자군을 구분하는 것은 하나의 판별식을 사용하는 방법과, 두 개의 판별식을 사용하는 방법을 채택할 수 있는데, 실시 예에서 두 가지 경우를 모두 설명한다. BRC 환자군과 비환자군을 하나의 식으로 구분하는 경우, 이 식을 제1종 판별식이라고 지칭한다. BRC 환자군과 정상 대조군을 구분하는 제2종 판별식과 BRC 환자군과 다른 암환자군을 구분하는 제3종 판별식을 사용하는 경우, BRC 환자군과 비환자군을 구분하는 것은 이 두 판별식에 의해 모두 BRC로 판별된 경우를 BRC 환자로 판정하고, 두 판별식 중 어느 하나의 판별식으로든 BRC 비환자로 판별된 경우에는 BRC 비환자로 판정하는 방식을 통해 수행될 수 있다.
(3-4) 제1훈련집합 C0의 선정 및 질량 이온별 가중치 계산
표 219 및 표 220에 나타낸 판별 결과가 우수하기는 하나 민감도와 특이도가 모두 100%는 아니다. 본 발명에서는 우선 민감도와 특이도가 소정의 값을 갖는 제1훈련집합 C0를 선정하고, 이 제1훈련집합 C0에 대해 질량 이온별 가중치를 계산하였는데, 본 실시 예에서 그 소정의 값은 민감도와 특이도 모두 100%이다.
도 27을 참조하여 민감도와 특이도가 소정의 값을 갖는 제1훈련집합 C0를 선정하는 방법에 대하여 설명한다.
제1판별점수 계산수단(5200)은, 도시된 도 27의 E111 내지 E114 단계들을 통하여, 집합 C1 내 BRC 환자군 및 비환자군의 저질량 이온 질량 스펙트럼들을 정렬하여 임포트하고(E111), 임포트한 피크 강도들을 정규화하고(E112), 정규화한 피크 강도들을 파레토 스케일링하고(E113), 파레토 스케일링한 피크 강도들에 대해 생물통계학적 분석을 수행하여 판별 점수를 계산하였다(E114).
다양한 생물통계학적 분석 방법 중 어느 하나를 선택하여 판별 점수를 계산할 수 있으나, 본 실시 예에서는 주성분 분석 기반 선형 판별 분석을 수행하였다. 판별 점수를 통하여 민감도 및 특이도를 계산하였으며(E115), 그 결과는 전술한 표 219와 같다.
다음으로, 민감도의 문턱값 BN1과 특이도의 문턱값 BN2를 설정하여(E116), 민감도 또는 특이도가 각각의 문턱값보다 작은 경우 위양성(false positive) 또는 위음성(false negative) 케이스들을 제외하였다(E117).
본 실시 예에서는 민감도의 문턱값 BN1과 특이도의 문턱값 BN2를 모두 1로 설정함으로써 민감도와 특이도가 모두 100%인 제1훈련집합 C01을 찾았다. 즉 표 219에 나타난 위양성인 열두 케이스를 모두 배제하고, 배제한 집합에 대하여 다시 E111 내지 E115 단계를 수행하였다. 배제한 집합에 대하여 E111 내지 E115 단계를 다시 수행하여도 바로 민감도 및 특이도가 100%가 되지는 않았으며, E111 내지 E117 단계를 수회 반복함으로써 비로소 민감도와 특이도가 모두 100%인 제1훈련집합 C01을 찾을 수 있었다(E118).
BRC 환자군과 비환자군을 구분하는 제1종 판별식의 경우에는 15개의 위양성 케이스들(CONT 7개, CRC 3개, GC 2개 및 NHL 3개)을 배제한 후에 제1훈련집합 C01에 도달하였고, BRC 환자군과 다른 암환자군을 구분하는 제3종 판별식의 경우에는 1개의 위양성 케이스(GC 1개)을 배제한 후에 제1훈련집합 C03에 도달하였는데, 각 제1훈련집합은 민감도와 특이도가 모두 100%인 판별 결과를 준다.
BRC 환자군과 정상 대조군을 구분하는 제2종 판별식의 경우에는 표 204에 나타낸 바와 같이 이미 민감도 및 특이도가 100%이므로 해당 케이스들을 그대로 훈련 집합 C02로 사용하였다. 이 과정을 통해 민감도와 특이도가 모두 100%인 판별 결과를 주는 질량 이온별 인자적재값을 도출할 수 있다(E119).
상기와 같은 일련의 과정은 상기 인자적재값 계산수단(5300)을 통하여 수행될 수 있다.
(3-5) 판별식의 적용
구성한 판별식을 판별 대상 시료에 적용하는 과정을 설명하면 다음과 같다.
우선 MarkerViewTM에는 이와 유사한 목적으로 사용할 수 있는 기능이 있다. 즉, 함께 임포트한 시료 데이터 중에서 일부 시료들만을 대상으로 하여 주성분 분석 기반 선형 판별 분석을 적용할 수 있으며, 이렇게 구성한 판별식으로 나머지 시료들을 판별할 수 있다. 이 기능을 이용하면 제1훈련집합과 판별 대상 시료를 함께 임포트한 후 제1훈련집합만을 선택해서 주성분 분석 기반 선형 판별 분석을 수행하여 판별 대상 시료가 어떻게 판정되는지 알 수 있다.
그러나, MarkerViewTM의 임포트 과정에서 피크들을 정렬하는 기능(peak alignment)이 수행되는데, 제1훈련집합에 맞추어 판별 대상 시료의 피크들을 정렬하는 기능이 없기 때문에, 제1훈련집합만을 임포트하였을 때의 피크 표(peak table, m/z 열과 시료별 피크 강도 열로 이루어진 행렬)와, 제1훈련집합과 판별 대상 시료를 함께 임포트하였을 때 생성되는 피크 표의 제1훈련집합 부분은 동일하지 않다. 피크 강도 행렬 부분도 다르며, 동일한 피크 강도 행에 대응하는 m/z 값도 항상 동일하게 나타나지는 않는다. 따라서, 제1훈련집합에서 만든 판별식을 판별 대상 시료에 적용하여 판별 점수를 계산하기 위해서는 제1훈련집합과 판별 대상 시료를 함께 임포트했을 때 생성되는 피크 표를 제1훈련집합만을 임포트하였을 때의 피크 표에 재정렬(realignment)하는 작업이 선행되어야 한다.
여러 개의 판별 대상 시료들을 제1훈련집합과 함께 임포트하는 경우 정렬이 어긋나는 정도가 더욱 심해진다. 따라서 본 실시 예에서는 모든 판별 대상 시료들에 대해서 제1훈련집합에 한 개의 판별 대상 시료를 추가하여 임포트한 후, 재정렬, 정규화, 파레토 스케일링을 수행하였다.
도 28을 참조하여 보다 상세히 설명하면 다음과 같다.
먼저, 판별 대상 시료의 저질량 이온 질량 스펙트럼들을 제1훈련집합에 정렬하여 임포트하는 단계를 수행한다(E211).
다만, 본 실시 예에서는 MarkerViewTM에는 판별 대상 시료를 제1훈련집합에 정렬하여 임포트하는 기능이 없으므로, 전술한 바와 같이 판별 대상 시료의 저질량 이온 질량 스펙트럼을 제1훈련집합과 함께 임포트한 후 만들어지는 피크 표를 제1훈련집합만을 임포트하였을 때 만들어지는 피크 표에 재정렬하는 프로그램을 만들어 제1훈련집합에 정렬된 판별 대상 시료의 저질량 이온 질량 스펙트럼을 추출하였다. 그러나 재정렬 없이 처음부터 판별 대상 시료를 제1훈련집합에 정렬하여 임포트하는 것이 보다 바람직하고 이것 역시 프로그램을 만들어 구현 가능하다.
다음으로, 임포트한 피크 강도들을 정규화하고(E212), 정규화한 피크 강도들을 파레토 스케일링하였다(E213).
다음으로, 파레토 스케일링한 저질량 이온들의 피크 강도와 제1훈련집합에 대한 주성분 분석 기반 선형 판별 분석에 의해 획득된 질량 이온별 인자적재값으로부터 판별 점수를 계산하였다(E214).
이렇게 계산된 판별 점수가 기준값 BS보다 큰지 여부를 판단하여(E215), 기준값 BS보다 큰 경우 양성으로 판정하고(E216), 기준값 BS보다 작은 경우 음성으로 판정하였다(E217). 본 실시 예에서 기준값 BS는 0인 것이 바람직하다.
상기와 같은 일련의 과정은 상기 제2정렬수단(5500), 제2판별점수계산 계산수단(5600) 및 유방암 판정수단(5700)을 통하여 수행될 수 있다.
제1종 판별식을 위해 집합 C1에서 제1훈련집합 C01을 구성할 때 제외되었던 15명의 비환자군 시료와 제3종 판별식을 위해 집합 C1에서 제1훈련집합 C03을 구성할 때 제외되었던 1명의 GC 환자군 시료에 대해 상기 (3-4)절에서 계산한 질량 이온별 인자적재값을 적용하여 판별 점수를 계산해 보았다. 제1훈련집합 C01 및 C03을 구성할 때 이미 제외된 케이스들이었기 때문에 위양성 또는 위음성 케이스로 판별될 것으로 예상하였는데, 계산 결과 제1종 판별식 관련 정상 대조군의 한 케이스가 진음성으로 판정된 것을 제외하고는 예상대로 위양성 또는 위음성 케이스로 판별되었다. 상기 (3-4)절에서 계산한 질량 이온별 인자적재값을 적용하여 집합 C1을 판별한 결과를 도 29와 도 30에 나타내었는데, 도 29는 제1종 판별식, 도 30은 제3종의 판별식의 결과를 보여준다.
(3-6) 예비 판별식의 구성
전술한 종래 기술에서는 주성분 분석 기반 선형 판별 분석에서 고려한 모든 질량 이온들을 사용하여 판별 점수를 계산한 후 그 판별 점수에 따라 BRC 환자 여부를 판정하였으나, 본 발명에서는 강건한 판별 성능을 나타내는 판별식을 도출하기 위해 우선 판별 점수에 큰 기여를 하는 질량 이온들만 사용하는 예비 판별식을 구성하였다. "예비 판별식"이란 본 발명에 따라 최종적으로 구하고자 하는 판별식을 도출하는 중간 단계로서의 판별식을 지칭하며, 이를 구성하는 저질량 이온들은 최종 판별식을 구성할 BRC 진단용 저질량 이온들의 "예비 후보군"이 된다.
도 31의 절차를 통해 10,000개의 질량 이온들 중 판별 점수에 큰 영향을 미치는 소정의 질량 이온들을 선정하였다. 본 실시 예에서 제1종 판별식의 경우 선정된 소정의 질량 이온들의 개수는 376개, 제2종 판별식의 경우는 353개, 제3종 판별식의 경우는 345개였다.
표 203과 함께 전술한 바와 같이 임포트 조건에서 피크의 최대 개수를 10,000개로 하였고 충분히 많은 시료들을 함께 임포트하였으므로, MarkerViewTM의 주성분 분석 기반 선형 판별 분석 방법을 통해 구성한 판별식은 10,000개의 항으로 이루어져 있다. 그러나, BRC 환자 및 비환자를 구분함에 있어 10,000개의 항이 모두 동등한 중요성을 가지지는 않을 것이므로, 도 31의 절차에 따라 10,000개의 질량 이온들 중 판별 점수에 큰 영향을 미치는 질량 이온들을 두 단계에 걸쳐 선정하였다. 이 단계는 10,000개의 질량 이온들 중 BRC 환자와 비환자를 구분함에 있어 불필요한 질량 이온들을 제거하는 과정이라 할 수 있다.
10,000개 항의 값들 중에서 피크 강도와 질량 이온별 인자적재값의 곱의 절댓값이 문턱값 BT1보다 큰 질량 이온들을 케이스별로 일차적으로 선택하였다(E121). 본 실시 예에서 문턱값 BT1은 0.1인 것이 바람직하다.
다음, 케이스별로 일차적으로 선택한 질량 이온들 중에서 제1훈련집합 전체 케이스들 중 문턱값 BT2 퍼센트 이상의 케이스들에서 공통으로 나타나는 질량 이온들을 이차적으로 선택하였다(E122). 본 실시 예에서 문턱값 BT2는 50인 것이 바람직하다. 즉, 제2종 판별식의 경우를 예로 들어 설명하면 제1훈련집합인 103개 케이스들 중 최소 52개 이상의 케이스들에서 공통으로 등장하는 질량 이온들로만 예비 판별식을 구성하였다.
상기와 같은 과정을 통하여 선택한 질량 이온들만으로 다시 판별 점수를 계산하고 이에 따라 민감도 및 특이도를 계산하였다(E123). 다시, 민감도의 문턱값 BN3와 특이도의 문턱값 BN4를 설정하여(E124), 민감도 또는 특이도가 각각의 문턱값보다 작은 경우 E121 단계에서 사용된 문턱값 BT1 및/또는 E122 단계에서 사용된 문턱값 BT2를 변경하여(E125) E121 내지 E124 단계를 반복하였다. 본 실시 예에서는 민감도의 문턱값 BN3와 특이도의 문턱값 BN4가 각각 0.9인 것이 바람직하다.
이와 같은 단계들을 거쳐 선택한 질량 이온들로 BRC 진단용 저질량 이온들의 예비 후보군을 구성하였는데(E126), 본 실시 예에서는 10,000개의 질량 이온들 중 제1종 판별식의 경우 376개, 제2종 판별식의 경우 353개, 제3종 판별식의 경우 345개의 질량 이온들이 선택되었다. 표 221, 222, 223에 제1, 2, 3종 예비 판별식으로 제1훈련집합 C01, C02, C03을 판별한 결과를 나타내었는데, 민감도와 특이도 등 판별 성능이 100%에서 낮아지기는 하였으나 전체 질량 이온 개수의 4%도 되지 않는 질량 이온들만으로 계산한 결과임에도 불구하고, 매우 우수한 판별 결과를 보임을 확인할 수 있다.
또한, 예비 판별식으로 집합 C1을 판별한 결과를 도 32, 33 및 34에 나타내었는데, 도 32는 제1종 예비 판별식, 도 33은 제2종 예비 판별식, 도 34는 제3종의 예비 판별식의 결과를 보여준다. 계산에 사용되는 질량 이온의 개수는 급격하게 감소된 것에 비해 판별 점수의 범위는 그렇지 않음을 알 수 있는데, 이로부터 BRC 환자 및 비환자를 구분함에 있어 10,000개의 질량 이온이 모두 필요한 것이 아니라는 것을 확인할 수 있다.
표 221
Set C1 True BRC True Non-BRC Sensitivity 100.0%
CONT CRC GC NHL Specificity 96.88%
Predicted BRC 54 1 0 1 1 PPV 94.74%
Predicted Non-BRC 0 41 31 13 8 NPV 100.0%
표 222
Sensitivity 98.15%
Set C02 True BRC True CONT Specificity 97.96%
Predicted BRC 53 1 PPV 98.15%
Predicted Non-BRC 1 48 NPV 97.96%
표 223
Set C03 True BRC True Non-BRC Sensitivity 96.30%
CRC GC NHL Specificity 96.72%
Predicted BRC 52 2 0 0 PPV 96.30%
Predicted Non-BRC 2 32 15 12 NPV 96.72%
상기와 같은 일련의 과정은 상기 후보이온집합 선택수단을 포함하는 유방암진단용이온 선정수단(5400)을 통하여 수행될 수 있다.
(3-7) 최종 판별식의 구성
예비 판별식을 구성하는 과정에서는 임포트한 10,000개의 질량 이온들 중 판별 점수에 수치적으로 큰 기여를 하는 질량 이온들을 추출하였다. 그러나 이 질량 이온들 중에는 제1훈련집합 C0에서는 문제를 발생시키지 않았으나, 동일한 BRC 환자군 및 비환자군의 혈청에 대해 다시 측정한 질량 스펙트럼에 대한 판별 또는 새로운 BRC 환자군 및 비환자군에 대한 판별에 있어서는 잠재적으로 판별 성능을 저하시킬 수 있는 질량 이온들 역시 포함되어 있을 것이므로 이것들도 적극적으로 제거하는 단계가 필요한데, 최종 판별식의 구성 과정에서는 이 단계를 거쳐 최종적으로 BRC 진단용 저질량 이온들을 결정한다.
판별식의 강건성을 검증하기 위해 먼저 집합 C1에 대해 추가적으로 5회 반복 측정 실험을 하였으며, 이와 독립적이며 또한, 서로 독립적인 집합 C2 및 집합 D에 대해서도 5회 반복 측정 실험을 수행하였다. 질량 스펙트럼의 반복 측정 과정에는 상기 설명한 혈청을 얼리고 녹이는 과정 및 혈청을 새로 메탄올/클로로포름과 혼합하여 추출하는 과정이 개입되는 것 외에, 레이저 빔(laser beam)을 이용한 기화(vaporization), 탈착(desorption), 이온화(ionization) 과정 등도 반복 실험 시 동일하게 진행된다고는 할 수 없으며, 또한, 아직 밝혀지지 않은 다양한 원인들로부터의 외란들도 개입할 여지가 많다. 따라서 반복 측정된 개별 질량 스펙트럼에 대한 판별 점수에 어느 정도의 편차가 발생하는 것은 배제할 수 없을 것이므로 본 실시 예에서는 5회 반복 측정한 시료에 대해 평균 판별 점수를 계산하여 판정을 실시하였다.
표 224는 종래 기술인 MarkerViewTM의 주성분 분석 기반 선형 판별 분석 결과인 10,000개 항의 판별식으로 집합 C와 D를 판별한 결과를 나타내며, 표 225는 376개 항을 가지는 제1종 예비 판별식, 353개 항을 가지는 제2종 예비 판별식, 345개 항을 가지는 제3종 예비 판별식으로 집합 C와 D를 판별한 결과를 나타낸다.
표에서 BRC LOME(breast cancer low-mass ion discriminant equation) 1은 제1종 판별식, BRC LOME 2는 제2종 판별식, BRC LOME 3는 제3종 판별식을 나타내며, 그 뒤에 딸려 있는 숫자는 판별식에 포함되는 저질량 이온들의 개수를 의미한다. 또한, 표 226에는 검증 집합인 집합 D에 대해서만 판별 성능을 나타내었는데, 괄호 안의 숫자는 OVC 환자군을 제외했을 때의 판별 성능이다.
표 224
BRC LOME 1-10000 BRC LOME 1-10000
Set C TrueBRC True Non-BRC Set D TrueBRC True Non-BRC
CONT CRC GC NHL CONT CRC GC NHL OVC
Predicted BRC 104 36 33 0 7 Predicted BRC 46 15 32 0 0 10
Predicted Non-BRC 4 59 30 31 12 Predicted Non-BRC 7 31 56 11 5 15
BRC LOME 2-10000 BRC LOME 2-10000
Set C TrueBRC True Non-BRC Set D TrueBRC True Non-BRC
CONT CRC GC NHL CONT CRC GC NHL OVC
Predicted BRC 100 54 35 1 5 Predicted BRC 46 25 52 0 0 1
Predicted Non-BRC 8 41 28 30 14 Predicted Non-BRC 7 21 36 11 5 24
BRC LOME 3-10000 BRC LOME 3-10000
Set C TrueBRC True Non-BRC Set D TrueBRC True Non-BRC
CONT CRC GC NHL CONT CRC GC NHL OVC
Predicted BRC 90 40 27 1 0 Predicted BRC 41 17 24 0 0 7
Predicted Non-BRC 18 55 36 30 19 Predicted Non-BRC 12 29 64 11 5 18
BRC LOMEs 2 & 3 BRC LOMEs 2 & 3
Set C TrueBRC True Non-BRC Set D TrueBRC True Non-BRC
CONT CRC GC NHL CONT CRC GC NHL OVC
Predicted BRC 88 35 26 0 0 Predicted BRC 35 15 22 0 0 1
Predicted Non-BRC 20 60 37 31 19 Predicted Non-BRC 18 31 66 11 5 24
표 225
BRC LOME 1-376 BRC LOME 1-376
Set C TrueBRC True Non-BRC Set D TrueBRC True Non-BRC
CONT CRC GC NHL CONT CRC GC NHL OVC
Predicted BRC 104 35 33 0 7 Predicted BRC 45 14 33 0 0 10
Predicted Non-BRC 4 60 30 31 12 Predicted Non-BRC 8 32 55 11 5 15
BRC LOME 2-353 BRC LOME 2-353
Set C TrueBRC True Non-BRC Set D TrueBRC True Non-BRC
CONT CRC GC NHL CONT CRC GC NHL OVC
Predicted BRC 99 54 35 3 5 Predicted BRC 46 25 55 0 0 2
Predicted Non-BRC 9 41 28 28 14 Predicted Non-BRC 7 21 33 11 5 23
BRC LOME 3-345 BRC LOME 3-345
Set C TrueBRC True Non-BRC Set D TrueBRC True Non-BRC
CONT CRC GC NHL CONT CRC GC NHL OVC
Predicted BRC 90 40 29 1 0 Predicted BRC 41 17 25 0 0 7
Predicted Non-BRC 18 55 34 30 19 Predicted Non-BRC 12 29 63 11 5 18
BRC LOMEs 2 & 3 BRC LOMEs 2 & 3
Set C TrueBRC True Non-BRC Set D TrueBRC True Non-BRC
CONT CRC GC NHL CONT CRC GC NHL OVC
Predicted BRC 87 35 28 0 0 Predicted BRC 35 15 24 0 0 2
Predicted Non-BRC 21 60 35 31 19 Predicted Non-BRC 18 31 64 11 5 23
표 226
Set D Sensitivity (%) Specificity (%) PPV (%) NPV (%)
BRC LOME 1-10000 86.79 (86.79) 67.43 (68.67) 44.66 (49.46) 94.40 (93.64)
BRC LOME 1-376 84.91 (84.91) 67.43 (68.67) 44.12 (48.91) 93.65 (92.79)
BRC LOME 1-29 96.23 (96.23) 91.43 (94.67) 77.27 (86.44) 98.77 (98.61)
Set D Sensitivity (%) Specificity (%) PPV (%) NPV (%)
BRC LOME 2-10000 &BRC LOME 3-10000 66.04 (66.04) 78.29 (75.33) 47.95 (48.61) 88.39 (86.26)
BRC LOME 2-353 & BRC LOME 3-345 66.04 (66.04) 76.57 (74.00) 46.05 (47.30) 88.16 (86.05)
BRC LOME 2-42 & BRC LOME 3-75 92.45 (92.45) 96.57 (98.67) 89.09 (96.08) 97.69 (97.37)
10,000개 질량 이온으로 구성된 판별식은 제1훈련집합 C0에서 완벽한 판별 성능을 보였음에도 불구하고, 집합 D에서 특히 양성예측도가 낮게 나타나는 것을 표 226에서 확인할 수 있다. 제1, 2, 3종 예비 판별식도 제1훈련집합 C0에서는 매우 우수한 판별 성능(표 221, 222, 223)을 보였음에도 불구하고 집합 D에서의 판별 결과는 만족스럽지 않았다.
따라서, 본 발명의 바람직한 일 실시 예에서는 예비 판별식을 강건한 판별식으로 개선하고자 도 35의 단계들을 수행하였다.
먼저, 예비 후보군의 질량 이온들을, 고민감도 집합과 고특이도 집합으로 구분하였다(E131). 여기에서, 고민감도 집합의 질량 이온들은 질량 이온별 민감도가 특이도보다 높은 질량 이온들이며, 고특이도 집합의 질량 이온들은 그 반대이다.
다음으로, 고민감도 집합의 질량 이온들과 고특이도 집합의 질량 이온들을 각각 질량 이온별 민감도와 특이도의 합의 내림차순으로 정렬한 후{Sns1, Sns2, Sns3 … SnsI}{Spc1, Spc2, Spc3 … SpcJ}, 각각의 상위 2개의 질량 이온들을 취하고{Sns1, Sns2, Spc1, Spc2}, 4개의 질량 이온들 중 2개 이상의 질량 이온들로 구성할 수 있는 조합들(11개) 중 최고 성능의 조합을 바이오마커 그룹으로 선정하였다(E132).
여기에서, 최고 성능의 조합인지 여부는 다음의 기준들에 따라 객관적이고 보편적으로 선택될 수 있다. 다음의 기준들은 중요도의 순서에 따른다.
기준1) 민감도와 특이도의 합이 큰 조합이 보다 성능이 높다.
기준2) 질량 이온들의 개수가 적은 조합이 보다 성능이 높다.
기준3) 진양성 케이스 중 최소 판별 점수와 진음성 케이스 중 최대 판별 점수의 차이가 큰 조합이 보다 성능이 높다.
다음으로, 고민감도 집합과 고특이도 집합 각각의 그 다음 상위 1개의 질량 이온들{Sns3, Spc3}을 추가로 더 취하여 상기 바이오마커 그룹 및 상기 바이오마커 그룹에 상기 질량 이온들{Sns3, Spc3} 중 어느 하나 이상을 조합한 4개의 집합들{biomarker group}, {biomarker group, Sns3}, {biomarker group, Spc3}, {biomarker group, Sns3, Spc3} 중 최고 성능의 집합을 다시 바이오마커 그룹으로 선정한다(E133).
이러한 과정은, 고민감도 집합 및 고특이도 집합 모두에 추가할 질량 이온이 없을 때까지 반복된다(E134).
즉, 고민감도 집합 및 고특이도 집합 모두에 추가할 질량 이온이 있을 때에는 상기와 같은 방식(E133)을 반복하고, 고민감도 집합과 고특이도 집합 중 어느 하나에 추가할 질량 이온이 남지 않은 경우에는, 남은 질량 이온이 있는 집합 중 그 다음 상위 1개의 질량 이온{Snsi 또는 Spcj}을 추가로 더 취하여 상기 바이오마커 그룹 및 상기 바이오마커 그룹에 상기 질량 이온{Snsi 또는 Spcj}를 조합한 2개의 집합들{biomarker group}, {biomarker group, Seni 또는 Spcj} 중 최고 성능의 집합을 다시 바이오마커 그룹으로 선정한다.
이러한 과정은, 고민감도 집합과 고특이도 집합 중 질량 이온이 남았었던 집합의 질량 이온이 남지 않을 때까지 반복되며, 고민감도 집합과 고특이도 집합 모두에 남은 질량 이온이 없는 경우의 바이오마커 그룹이 바이오마커 그룹1(BG)이 된다(E135).
예비 후보군에서 바이오마커 그룹1(BG)을 제거하고(E136) 남은 질량 이온들로 다시 고민감도 집합과 고특이도 집합을 구성하고 위의 과정을 반복한다. 이 과정은 고민감도 집합과 고특이도 집합 중 어느 한 집합이 두 개 미만의 질량 이온만을 가질 때까지 반복된다(E137).
위의 반복 과정을 통해 얻은 바이오마커 그룹1, 2, … 중 정확도순으로 BK개의 바이오마커 그룹을 조합하여 최종 바이오마커 그룹을 형성한다. 여기서 정확도는 전체 케이스 중 진양성 및 진음성 케이스의 비율을 의미한다. 본 실시 예에서 BK는 1 내지 3 사이의 자연수인 것이 바람직하다(E138).
따라서, 상기 최종 바이오마커 그룹의 질량 이온들이 BRC 진단용 저질량 이온들로 결정된다(E139).
집합 C1에서, 더 정확하게는 그 부분 집합인 C0에서 질량 이온들의 예비 후보군을 선정하였는데, 예비 후보군으로부터 최종 바이오마커 그룹을 결정할 때에는 과적합 문제(overfitting)를 해결하기 위하여 집합 C1에 독립인 집합 C2도 추가하여 훈련 집합을 확장하였다.
상기의 과정들을 BRC 환자군과 비환자군을 구분하기 위한 시료들을 대상으로 수행한 결과 제1종 BRC 진단용 저질량 이온으로 29개가 선택되었으며, BRC 환자군과 정상 대조군을 구분하기 위한 시료들을 대상으로 수행한 결과 제2종 BRC 진단용 저질량 이온으로 42개가 선택되었고, BRC 환자군과 다른 암환자군을 구분하기 위한 시료들을 대상으로 수행한 결과 제3종 BRC 진단용 저질량 이온으로 75개가 선택되었다. 제1, 2, 3종 BRC 진단용 저질량 이온들의 질량값은 표 227, 228, 229에 나타내었다. 이와 같은 저질량 이온들을 "제1종 BRC 진단용 저질량 이온들", "제2종 BRC 진단용 저질량 이온들" 및 "제3종 BRC 진단용 저질량 이온들"로 지칭하고, 이를 이용하여 최종적으로 구한 본 발명에 따른 판별식을 "제1종 BRC 진단용 최종 판별식", "제2종 BRC 진단용 최종 판별식" 및 "제3종 BRC 진단용 최종 판별식"으로 지칭한다.
표 227
74.0937 193.0665 279.0841 332.3181 476.6038 562.3074
74.1155 208.0565 280.0847 401.0588 490.3427 583.2323
76.0728 212.0949 282.2777 427.3441 498.3237 584.2415
136.1067 231.0726 313.2638 432.9954 499.3265 646.3851
173.4872 258.1364 331.2024 452.2269 512.3145
표 228
38.9779 123.0821 225.1870 313.2618 424.3216 538.3428 610.3273
46.0647 130.1539 229.0005 332.3150 426.3389 540.3250 616.3286
74.1164 185.7723 231.0675 342.2482 428.1885 570.3234 618.3352
76.0733 191.1175 244.0962 368.2624 497.3194 580.3281 646.3959
97.0686 208.0530 281.0913 398.3034 513.3193 581.2310 725.3469
122.0777 212.0960 284.3205 416.0901 532.6918 581.3377 757.1117
표 229
38.9736 156.0412 228.0348 331.2036 478.8688 511.3367 583.2284
38.9892 172.3072 231.0726 332.3169 479.8724 518.8776 731.3330
44.0491 178.1330 234.0422 333.3233 480.3180 520.8826 733.3526
44.0656 182.0738 260.1013 337.1047 483.3301 534.2829 734.3563
74.0938 189.9525 279.0843 424.3272 487.3152 535.2882 735.3665
87.0991 192.1294 280.0849 426.3406 488.3287 542.8770 757.0995
104.1316 193.0660 282.2791 432.9948 488.6580 544.7878 757.3512
104.3161 196.0871 289.2960 433.9894 496.4331 544.8728 1465.5872
105.1091 212.3221 298.3425 446.0196 496.7718 546.3358 1466.5971
136.1021 217.0923 313.2630 454.3014 497.7764 559.2911
155.1798 222.0231 316.3269 469.2924 502.8741 568.1146
상기와 같은 일련의 과정은 상기 최종이온집합 선택수단을 포함하는 유방암진단용이온 선정수단(5400)을 통하여 수행될 수 있다.
(3-8) 최종 판별식의 적용 및 분석
집합 D에 대하여 제1종, 또는 제2종 및 제3종 BRC 진단용 저질량 이온들을 이용한 제1종, 또는 제2종 및 제3종 BRC 진단용 최종 판별식을 도 28의 방법에 따라 적용하면 그 판정 결과를 획득할 수 있다.
최종 판별식으로 판정한 결과를 도 36, 37 및 표 226, 230에 나타내었다. 도 36 및 37은 5회 판별 점수의 평균 판별 점수로 판정한 결과를 나타내는데, 도 36은 집합 C, 도 37은 집합 D의 판정 결과를 나타낸다.
표 230
BRC LOME 1-29 BRC LOME 1-29
Set C TrueBRC True Non-BRC Set D TrueBRC True Non-BRC
CONT CRC GC NHL CONT CRC GC NHL OVC
Predicted BRC 108 2 2 1 0 Predicted BRC 51 2 6 0 0 7
Predicted Non-BRC 0 93 61 30 19 Predicted Non-BRC 2 44 82 11 5 18
BRC LOME 2-42 BRC LOME 2-42
Set C TrueBRC True Non-BRC Set D TrueBRC True Non-BRC
CONT CRC GC NHL CONT CRC GC NHL OVC
Predicted BRC 93 0 12 9 12 Predicted BRC 49 1 28 2 1 6
Predicted Non-BRC 15 95 51 22 7 Predicted Non-BRC 4 45 60 9 4 19
BRC LOME 3-75 BRC LOME 3-75
Set C TrueBRC True Non-BRC Set D TrueBRC True Non-BRC
CONT CRC GC NHL CONT CRC GC NHL OVC
Predicted BRC 106 31 1 1 1 Predicted BRC 53 22 1 0 0 8
Predicted Non-BRC 2 64 62 30 18 Predicted Non-BRC 0 24 87 11 5 17
BRC LOMEs 2 & 3 BRC LOMEs 2 & 3
Set C TrueBRC True Non-BRC Set D TrueBRC True Non-BRC
CONT CRC GC NHL CONT CRC GC NHL OVC
Predicted BRC 91 0 1 0 1 Predicted BRC 49 1 1 0 0 4
Predicted Non-BRC 17 95 62 31 18 Predicted Non-BRC 4 45 87 11 5 21
증 집합인 집합 D에서의 판별 성능으로 평가하면, 제1종 BRC 진단용 최종 판별식의 결과에 비해, 제2종 및 제3종의 BRC 진단용 최종 판별식의 결과가 더 우수함을 확인할 수 있다. 제2종 및 제3종의 BRC 진단용 최종 판별식을 사용하는 경우에는 훈련 집합에 포함되지 않았던 OVC 환자군을 검증 집합에 포함하는 경우에도 집합 D에서 민감도, 특이도, 양성예측도, 음성예측도가 모두 85% 이상이었다.
반면 제1종 BRC 진단용 최종 판별식을 사용하는 경우에는 훈련 집합에 포함되지 않았던 OVC 환자군을 검증 집합에서 제외하는 경우에만 집합 D에서 민감도, 특이도, 양성예측도, 음성예측도가 모두 85% 이상이었다. 그러나 대체적으로 보아 제1종의 BRC 진단용 최종 판별식도 우수한 판별 결과를 보인다고 할 수 있다.
본 발명을 통해 혈청의 저질량 이온 질량 스펙트럼을 분석하여 BRC 환자와 비환자를 높은 판별 성능을 갖고 판정할 수 있었다.
4. 위암을 진단하기 위한 암 진단 장치의 실시 예
도 38은 본 발명의 GC를 진단하기 위한 도 7의 암 진단부를 더욱 상세히 나타낸 블록도이다.
도시된 바와 같이 본 발명에 따른 암 진단부는, 훈련 후보 집합인 상기 위암 환자 및 비환자 케이스들의 저질량 이온 질량 스펙트럼들을 정렬하는 제1정렬수단(6100); 정렬된 상기 질량 스펙트럼에 대해 생물통계학적 분석을 수행하여 판별 점수를 계산하는 제1판별점수 계산수단(6200); 상기 판별 점수에 따라 민감도 및 특이도를 계산하고, 이를 기준으로 제1훈련집합을 선정하여 저질량 이온별 인자적재값을 계산하는 인자적재값 계산수단(6300); 후보 조건을 만족하는 후보 저질량 이온들 중 판별 성능을 기반으로 하여 위암 진단용 저질량 이온들을 선택하는 위암진단용이온 선정수단(6400); 판별 대상 생물학적 시료의 저질량 이온 질량 스펙트럼을 상기 제1훈련집합에 정렬하는 제2정렬수단(6500); 상기 판별 대상의 저질량 이온의 피크 강도와 상기 인자적재값으로부터 판별 점수를 계산하는 제2판별점수 계산수단(6600); 및 상기 판별 점수에 따라 상기 판별 대상을 위암의 양성 또는 음성으로 판정하는 위암 판정수단(6700)을 포함하되, 상기 위암진단용이온 선정수단(6400)은; 상기 다수의 위암 환자 및 비환자 케이스들을, 다수의 위암 환자 케이스들과 다수의 정상인 케이스들로 구성되는 제1종 판별 케이스들과, 상기 다수의 위암 환자 케이스들과 다수의 대장암 환자 케이스들로 구성되는 제2종 판별 케이스들과, 상기 다수의 위암 환자 케이스들과 다수의 유방암 환자 케이스들로 구성되는 제3종 판별 케이스들과, 상기 다수의 위암 환자 케이스들과 다수의 비호지킨림프종(non-Hodgkin lymphoma, NHL) 환자 케이스들로 구성되는 제4종 판별 케이스들로 구분하거나, 상기 다수의 위암 환자 및 비환자 케이스들을, 상기 제1종 판별 케이스들과 상기 다수의 위암 환자 및 정상인 케이스들과 다수의 대장암, 유방암 및 비호지킨림프종 환자 케이스들로 구성되는 제5종 판별 케이스들로 구분하고, 상기 제1종 판별 케이스들, 상기 제2종 판별 케이스들, 상기 제3종 판별 케이스들, 상기 제4종 판별 케이스들 및 상기 제5종 판별 케이스들에 대해 각각 실행되어, 상기 위암 진단용 저질량 이온들이, 상기 제1종 판별 케이스에 대한 제1종 위암 진단용 저질량 이온들, 상기 제2종 판별 케이스에 대한 제2종 위암 진단용 저질량 이온들, 상기 제3종 판별 케이스에 대한 제3종 위암 진단용 저질량 이온들, 상기 제4종 판별 케이스에 대한 제4종 위암 진단용 저질량 이온들 및 상기 제5종 판별 케이스에 대한 제5종 위암 진단용 저질량 이온들로 구분되는 것을 특징으로 한다.
이를 위하여, 저질량 이온 검출부(1000)는; 다수의 위암 환자 및 비환자 케이스들의 생물학적 시료로부터 질량분석기를 사용하여 상기 저질량 이온의 피크 강도를 검출하여 상기 저질량 이온의 질량 스펙트럼을 추출한다.
아울러, 상기 GC를 진단하기 위한 암 진단부의 더욱 세세한 구성 요소들은, 전술한 상기 암 진단 장치에서의 도9 내지 도13을 통하여 설명한 구성 요소들과 대동소이하므로, 여기서 이에 대한 세세한 구성의 도시 및 설명은 생략하기로 하고, 이하 본 발명의 일 실시 예에 대하여 상세히 설명한다.
본 발명의 암 진단 장치는 도 14에 도시된 바와 같이 하드웨어로 구성되거나 또는 프로그램 구조에 의한 소프트웨어로 구성될 수도 있으며, 이하에서는 일 예로서 첨부된 순서도의 프로세스를 참조하여 소프트웨어로 구성된 GC를 진단하기 위한 암 진단 장치에 대하여 상세히 설명하기로 한다.
(4-1) 시료 준비 - 혈청 수집 대상
전술한 표 301의 49명의 GC 환자군, 전술한 표 302의 84명의 정상 대조군, 표 305의 77명의 CRC 환자군, 표 306의 54명의 BRC 환자군 및 표 307의 24명의 비호지킨림프종 환자군으로부터 혈청을 수집하였다.
표 305
CRC Sex Ageyear Stage Location Cell Type CEAng/mL
CRC-E1 M 77 I A-colon AC 1.8
CRC-E2 M 50 I Rectum AC 1.9
CRC-E3 F 47 I S-colon AC 0.7
CRC-E4 F 82 I A-colon AC 1.1
CRC-E5 M 59 I Rectum AC 1.9
CRC-E6 M 73 I Rectum AC 3.6
CRC-E7 M 71 I S-colon AC 3.6
CRC-E8 M 71 I Rectum AC 9.8
CRC-E9 F 47 I Rectum AC 3.9
CRC-E10 F 54 I Rectum AC 1.6
CRC-E11 M 73 I S-colon AC 7.1
CRC-E12 F 74 I S-colon AC 2.3
CRC-E13 M 75 II A-colon AC 2.1
CRC-E14 F 81 II S-colon AC 4.1
CRC-E15 F 76 II Rectum AC 25.3
CRC-E16 F 71 II A-colon AC 1.6
CRC-E17 M 72 II A-colon AC 3.8
CRC-E18 F 82 II S-colon AC 1.8
CRC-E19 F 68 II D-colon AC 1.7
CRC-E20 M 71 II S-colon AC 3.6
CRC-E21 F 67 II A-colon AC 1.9
CRC-E22 M 45 II D-colon MAC 3.3
CRC-E23 M 60 II S-colon AC 2.8
CRC-E24 M 74 II S-colon AC 5.3
CRC-E25 M 57 II Rectum AC 7.3
CRC-E26 F 51 II Rectum AC 6.7
CRC-E27 M 79 II S-colon AC 6.2
CRC-E28 F 59 II A-colon AC 1
CRC-E29 M 62 II S-colon AC -
CRC-E30 M 84 II S-colon AC 11.3
CRC-E31 M 68 II Rectum AC 5.8
CRC-E32 M 54 II A-colon AC 1.1
CRC-E33 F 51 II D-colon AC 5.9
CRC-E34 F 56 III S-colon AC 1.2
CRC-E35 M 52 III S-colon AC 3.2
CRC-E36 F 59 III S-colon AC 1.7
CRC-E37 F 73 III S-colon AC 5.7
CRC-E38 M 70 III S-colon AC 3.6
CRC-E39 M 68 III A-colon AC 9.2
CRC-E40 F 55 III Rectum AC 2.1
CRC-E41 F 61 III A-colon AC 12.7
CRC-E42 M 59 III S-colon AC 2.7
CRC-E43 M 67 III Rectum AC 9.5
CRC-E44 M 48 III S-colon AC 1.3
CRC-E45 M 58 III Rectum AC 1.7
CRC-E46 F 50 III S-colon AC 4.8
CRC-E47 F 51 III S-colon AC 7
CRC-E48 F 74 III T-colon AC 2.5
CRC-E49 M 60 III Rectum AC 3.5
CRC-E50 M 52 III S-colon AC 2.5
CRC-E51 M 54 III A-colon AC 5.3
CRC-E52 M 82 III S-colon AC 2.4
CRC-E53 M 54 III S-colon AC 5.3
CRC-E54 F 52 III S-colon AC 22.1
CRC-E55 M 61 III Rectum AC 128.1
CRC-E56 F 47 III S-colon AC 1.2
CRC-E57 M 71 III A-colon AC 8.2
CRC-E58 M 52 III S-colon AC 4.1
CRC-E59 F 64 III S-colon AC 6.8
CRC-E60 F 51 III S-colon AC 1.2
CRC-E61 M 55 III A-colon AC 1.2
CRC-E62 M 62 III Rectum AC 2.5
CRC-E63 M 38 III Rectum AC 6.1
CRC-E64 F 65 III D-colon AC 3.5
CRC-E65 M 49 III S-colon, T-colon AC 3.8
CRC-E66 M 66 III S-colon AC 10.7
CRC-E67 F 54 III S-colon AC 8.8
CRC-E68 F 70 IV Rectum AC 3.9
CRC-E69 M 68 IV Rectum AC 6
CRC-E70 M 53 IV Rectum AC 54.7
CRC-E71 F 63 IV D-colon AC 12.3
CRC-E72 F 63 IV A-colon AC 1.4
CRC-E73 M 66 IV S-colon AC 6.4
CRC-E74 F 50 IV Rectum AC 62
CRC-E75 M 57 IV Rectum AC 6.4
CRC-E76 M 57 IV S-colon AC 41.7
CRC-E77 M 48 IV A-colon AC 59.4
AC: Adenocarcinoma
MAC: Mucinous adenocarcinoma
표 306
BRC Sex Ageyear Node ER ER% PR PR% HER2 Tumor Size cm
BRC-E1 F 48 - 5 33-66% 6 33-66% 2 -
BRC-E2 F 35 - 6 33-66% 6 33-66% 1 -
BRC-E3 F 45 pN1a 5 33-66% 5 33-66% 0 1.5
BRC-E4 F 61 - 0 0% 0 0% 2 -
BRC-E5 F 70 pN0(sn) 0 0% 0 0% 1 <0.1
BRC-E6 F 58 ypN0 3 <10% 3 10-33% 3 0.5
BRC-E7 F 49 ypN0(i+) 0 0% 0 0% 2 1.9
BRC-E8 F 49 ypN2a 0 0% 0 0% 1 2.5
BRC-E9 F 39 pN1a 6 33-66% 7 >66% 1 2.2
BRC-E10 F 48 ypN2a 6 33-66% 4 <10% 3 5.8
BRC-E11 F 39 - 0 0% 0 0% 1 -
BRC-E12 F 56 pN1a 6 33-66% 6 33-66% 0 2.8
BRC-E13 F 59 pN0(sn) 6 33-66% 2 <10% 1 2.3
BRC-E14 F 31 pN1a 5 33-66% 4 10-33% 1 2.2
BRC-E15 F 46 pN3a 6 33-66% 6 33-66% 1 3.5
BRC-E16 F 56 - 7 >66% 4 10-33% 1 -
BRC-E17 F 55 - 0 0% 0 0% 2 -
BRC-E18 F 46 pN0 0 0% 0 0% 0 1.5
BRC-E19 F 60 ypN0 0 0% 0 0% 3 1.9
BRC-E20 F 49 pN0(sn) 5 33-66% 2 <10% 2 1.5
BRC-E21 F 55 pN1mi 0 0% 0 0% 3 1.8
BRC-E22 F 65 pN0 6 33-66% 6 33-66% 0 1.7
BRC-E23 F 35 ypN2a 6 66% 4 10-33% 2 2.6
BRC-E24 F 46 pN1a 6 33-66% 6 33-66% 3 2.5
BRC-E25 F 45 pN0(sn) 6 33-66% 6 33-66% 1 0.8
BRC-E26 F 42 pN0(sn) 3 10-33% 6 33-66% 0 1
BRC-E27 F 58 pN0(sn) 6 33-66% 6 33-66% 1 1.5
BRC-E28 F 62 pN1a 0 0% 0 0% 2 2.2
BRC-E29 F 61 - 0 0% 0 0% 1 -
BRC-E30 F 60 - - - - - - -
BRC-E31 F 51 - - - - - - -
BRC-E32 F 42 pN0 7 >66% 7 >66% 2 -
BRC-E33 F 43 pN0(sn) 3 10-33% 4 10-33% 0 2.3
BRC-E34 F 60 pN0(sn) 0 0% 0 0% 1 2.3
BRC-E35 F 61 - 6 33-66% 0 0% 2 -
BRC-E36 F 61 pN0(sn) 0 0% 2 <10% 2 1.8
BRC-E37 F 49 - - - - - - -
BRC-E38 F 45 ypN0 0 0% 0 0% 0 0.9
BRC-E39 F 59 pN0 0 0% 0 0% 3 1.1
BRC-E40 F 43 pN1 0 0% 0 0% 0 1.5
BRC-E41 F 46 pN1 8 100% 8 100% 0 1.3
BRC-E42 F 48 pN0 6 50-60% 5 10-20% 3 1.3
BRC-E43 F 39 pN0 0 0% 0 0% 0 2.2
BRC-E44 F 66 pN0 8 95% 8 95% 0 1.7
BRC-E45 F 39 ypN0 0 0% 0 0% 0 DCIS
BRC-E46 F 37 pN0 7 70-80% 8 80% 3 1.5
BRC-E47 F 64 pN0 8 95% 8 95% 0 0.5
BRC-E48 F 44 ypN1 7 90% 8 95% 0 2
BRC-E49 F 50 pN2 8 95% 8 100% 0 1.1
BRC-E50 F 47 pN0 7 70% 7 50-60% 1 0.5
BRC-E51 F 44 pN1 8 90% 8 95% 1 0.6
BRC-E52 F 50 pN0 0 0% 0 0% 2 2.2
BRC-E53 F 53 pN0 7 95% 8 95% 0 1.1
BRC-E54 F 65 pN0 8 95% 7 40% 0 1.5
표 307
NHL Sex Ageyear Stage Involved Site Subtype IPI
NHL-E1 M 44 1 stomach DLBL 1
NHL-E2 M 39 1 nasal cavity NK/T cell L 1
NHL-E3 M 41 1 inguinal LN ALCL 0
NHL-E4 F 49 1 mandibular area DLBL 0
NHL-E5 F 48 1 neck, submandibular DLBL 0
NHL-E6 M 63 2 stomach DLBL 1
NHL-E7 M 64 2 stomach DLBL 2
NHL-E8 M 52 2 spleen, pancreatic LN DLBL 1
NHL-E9 M 42 2 multiple DLBL 2
NHL-E10 M 54 2 stomach DLBL 1
NHL-E11 F 41 2 stomach DLBL 1
NHL-E12 F 66 2 gum, submandibular DLBL 1
NHL-E13 M 65 3 multiple DLBL 3
NHL-E14 M 65 3 multiple DLBL 3
NHL-E15 M 65 3 multiple Follicular L 2
NHL-E16 M 58 3 multiple DLBL 2
NHL-E17 M 40 4 multiple DLBL 3
NHL-E18 F 57 4 multiple DLBL 3
NHL-E19 F 24 4 multiple DLBL 4
NHL-E20 M 56 4 multiple DLBL 3
NHL-E21 F 76 4 multiple DLBL 3
NHL-E22 F 69 4 multiple Mantle cell L 4
NHL-E23 F 64 4 multiple DLBL 5
NHL-E24 M 44 4 multiple DLBL 2
또한, 이 288명을 집합 E1으로 하여 후술하는 바와 같이 그 부분 집합 E0로 제1훈련집합을 구성하였으며, 이 제1훈련집합에 대한 생물통계학적 분석을 통해 질량 이온별 가중치(인자적재값)를 계산하고, 예비 판별식을 획득하였다. 또한, 이 집합 E1 외에 표 308의 48명의 GC 환자군, 표 309의 83명의 정상 대조군, 표 310의 175명의 CRC 환자군, 표 311의 54명의 BRC 환자군 및 표 312의 22명의 NHL 환자군을 집합 E2(제2훈련집합)로 하여 훈련 집합을 확장하였다. 즉 예비 판별식을 구성하는 저질량 이온들의 예비 후보군으로부터 후술할 방법에 따라 GC 진단용 저질량 이온들을 확인할 때에는 서로 독립적인 집합인 집합 E1과 집합 E2의 합집합, 즉 집합 E를 훈련 집합으로 사용하였다.
표 308
GC Sex Ageyear CEAng/mL Stage
GC-E50 M 32 - I
GC-E51 M 71 3.54 I
GC-E52 M 56 2.83 I
GC-E53 F 40 - I
GC-E54 M 62 - I
GC-E55 M 79 - I
GC-E56 M 81 - I
GC-E57 M 52 - I
GC-E58 M 53 - I
GC-E59 M 72 - II
GC-E60 F 49 - II
GC-E61 M 69 - II
GC-E62 M 72 - II
GC-E63 F 49 - II
GC-E64 M 62 - II
GC-E65 M 67 - II
GC-E66 F 64 - II
GC-E67 F 40 - II
GC-E68 M 53 1 III
GC-E69 M 42 0.69 III
GC-E70 M 81 - III
GC-E71 M 70 1.26 III
GC-E72 F 81 - III
GC-E73 F 36 - III
GC-E74 M 46 - III
GC-E75 M 62 - III
GC-E76 M 51 - III
GC-E77 F 42 <0.4 IV
GC-E78 M 49 104.73 IV
GC-E79 M 65 1.69 IV
GC-E80 F 57 6.98 IV
GC-E81 M 55 2.03 IV
GC-E82 F 51 0.51 IV
GC-E83 M 63 27.18 IV
GC-E84 M 51 1.93 IV
GC-E85 M 64 2.41 IV
GC-E86 M 62 2.72 IV
GC-E87 F 40 0.64 IV
GC-E88 M 66 11.68 IV
GC-E89 M 51 5.6 IV
GC-E90 M 66 1.22 IV
GC-E91 M 70 - IV
GC-E92 F 71 - IV
GC-E93 F 52 - IV
GC-E94 M 68 - IV
GC-E95 M 68 - IV
GC-E96 F 33 - IV
GC-E97 M 31 - IV
표 309
Control Sex Ageyear CEAng/mL
CONT-E85 F 67 1.5
CONT-E86 F 45 0.6
CONT-E87 M 30 1
CONT-E88 M 55 1.2
CONT-E89 M 54 2.1
CONT-E90 M 69 2.8
CONT-E91 M 53 1.8
CONT-E92 F 47 1.7
CONT-E93 M 53 3.2
CONT-E94 F 49 1.4
CONT-E95 M 62 1.7
CONT-E96 M 31 2.3
CONT-E97 M 40 0.8
CONT-E98 F 49 1.4
CONT-E99 F 33 1.7
CONT-E100 M 51 3.4
CONT-E101 M 52 2
CONT-E102 F 66 1.3
CONT-E103 F 65 1.4
CONT-E104 M 50 1.4
CONT-E105 M 54 1.3
CONT-E106 M 68 1.6
CONT-E107 M 59 2.5
CONT-E108 F 51 2.1
CONT-E109 F 39 0.8
CONT-E110 F 50 1.9
CONT-E111 F 64 2.9
CONT-E112 F 52 1.9
CONT-E113 F 37 2.1
CONT-E114 F 49 2.6
CONT-E115 F 30 <0.5
CONT-E116 F 49 2.1
CONT-E117 F 38 0.6
CONT-E118 F 59 1.6
CONT-E119 F 41 1.8
CONT-E120 F 48 1.2
CONT-E121 F 39 0.5
CONT-E122 F 51 1.1
CONT-E123 F 44 1.5
CONT-E124 F 38 1.5
CONT-E125 F 48 1.9
CONT-E126 F 70 4.8
CONT-E127 F 38 2.8
CONT-E128 F 50 1.1
CONT-E129 F 54 1.8
CONT-E130 F 58 3.1
CONT-E131 M 65 2.8
CONT-E132 M 66 0.8
CONT-E133 F 54 1.6
CONT-E134 M 50 1.9
CONT-E135 F 60 1.1
CONT-E136 F 55 8.8
CONT-E137 M 62 0.9
CONT-E138 M 65 2.3
CONT-E139 M 52 2.4
CONT-E140 F 64 1.7
CONT-E141 M 57 0.8
CONT-E142 F 54 <0.5
CONT-E143 F 59 0.8
CONT-E144 F 65 1.6
CONT-E145 F 68 1.6
CONT-E146 F 51 1.7
CONT-E147 F 62 1.3
CONT-E148 F 63 1.6
CONT-E149 F 60 1.9
CONT-E150 F 68 1.4
CONT-E151 F 62 1.9
CONT-E152 F 68 5.6
CONT-E153 M 63 4.5
CONT-E154 M 50 2.1
CONT-E155 F 53 2.3
CONT-E156 M 60 3.3
CONT-E157 M 64 1.8
CONT-E158 F 63 1.1
CONT-E159 M 53 2
CONT-E160 F 51 2
CONT-E161 F 42 -
CONT-E162 M 41 -
CONT-E163 M 40 -
CONT-E164 M 51 -
CONT-E165 F 59 -
CONT-E166 F 57 -
CONT-E167 M 47 -
표 310
CRC Sex Ageyear Stage Location Cell Type CEAng/mL
CRC-E78 M 50 I S-colon AC 2.5
CRC-E79 M 56 I S-colon AC 7.3
CRC-E80 M 61 I Rectum AC 7.7
CRC-E81 F 78 I Rectum AC 2.6
CRC-E82 M 64 I S-colon AC 1.8
CRC-E83 F 50 I Rectum AC 1.6
CRC-E84 F 59 I Rectum AC 1.6
CRC-E85 M 71 I Rectum AC 83.7
CRC-E86 M 59 I S-colon AC 3
CRC-E87 M 64 I Rectum AC 2.5
CRC-E88 M 49 I Rectum AC 6.6
CRC-E89 F 65 II S-colon AC 2.1
CRC-E90 M 77 II A-colon AC 1.5
CRC-E91 M 71 II D-colon AC 4.1
CRC-E92 F 66 II Rectum AC 4.3
CRC-E93 F 49 II A-colon AC 1.6
CRC-E94 F 79 II A-colon AC 2.9
CRC-E95 M 69 II S-colon AC 4.2
CRC-E96 M 66 II S-colon AC 12
CRC-E97 M 74 II A-colon AC 1.5
CRC-E98 M 69 II T-colon AC 1.2
CRC-E99 M 43 II S-colon AC 2.2
CRC-E100 F 67 II A-colon AC 1.4
CRC-E101 M 72 II A-colon AC 4.9
CRC-E102 F 69 II S-colon, A-colon AC 5.1
CRC-E103 M 39 II S-colon AC 2.9
CRC-E104 M 54 II Rectum AC 4.6
CRC-E105 M 58 II S-colon AC 2.9
CRC-E106 M 65 II S-colon AC 1.7
CRC-E107 F 52 II S-colon AC <0.5
CRC-E108 F 76 II S-colon AC 2.2
CRC-E109 M 51 II S-colon ASC 8.6
CRC-E110 F 79 III Rectum AC 14.1
CRC-E111 F 44 III S-colon AC 1.4
CRC-E112 M 66 III Rectum AC 1.2
CRC-E113 M 53 III A-colon AC 4.2
CRC-E114 M 64 III T-colon AC 1.8
CRC-E115 F 42 III S-colon AC 0.8
CRC-E116 M 49 III Rectum AC 2.7
CRC-E117 M 68 III Rectum AC 3.9
CRC-E118 M 51 III S-colon AC 5.2
CRC-E119 M 64 III Rectum AC 7.7
CRC-E120 M 42 III S-colon AC 2.8
CRC-E121 F 43 III A-colon AC 4.7
CRC-E122 M 66 III S-colon AC 9.1
CRC-E123 M 37 III Rectum AC 3.7
CRC-E124 F 81 III Rectum AC 8.4
CRC-E125 F 73 III S-colon AC 1.7
CRC-E126 M 54 III Rectum AC 6.4
CRC-E127 F 58 III Rectum AC 21.3
CRC-E128 F 42 III Rectum AC 0.7
CRC-E129 M 62 III S-colon AC 10.8
CRC-E130 F 60 III S-colon, A-colon AC 28.5
CRC-E131 F 73 III Rectum AC 3.7
CRC-E132 F 54 III D-colon AC 1122.2
CRC-E133 F 60 III A-colon AC 30.4
CRC-E134 M 43 III A-colon MAC 77.6
CRC-E135 F 69 III Rectum AC 1
CRC-E136 M 72 III A-colon AC 2.4
CRC-E137 F 52 III S-colon AC 9.2
CRC-E138 M 52 III S-colon AC 3.2
CRC-E139 F 55 III Rectum AC 0.9
CRC-E140 M 77 III S-colon AC 2.5
CRC-E141 F 47 III S-colon AC 1.5
CRC-E142 M 48 III S-colon AC 1.7
CRC-E143 F 72 IV A-colon AC 73.4
CRC-E144 F 69 IV A-colon AC 49
CRC-E145 M 75 IV S-colon AC 16.7
CRC-E146 M 72 IV Rectum SC 8.2
CRC-E147 M 73 IV Rectum AC 52.2
CRC-E148 M 54 IV A-colon AC 2
CRC-E149 M 67 IV Rectum AC 16.2
CRC-E150 F 66 IV S-colon AC 18.5
CRC-E151 F 78 IV A-colon AC 12.6
CRC-E152 F 54 IV S-colon AC 27.9
CRC-E153 M 70 II Rectum AC 1.3
CRC-E154 M 55 II Rectum AC 22
CRC-E155 M 62 II Rectum AC 6.1
CRC-E156 M 64 III Rectum AC 4.8
CRC-E157 M 62 IV Rectum AC 25.3
CRC-E158 M 51 III Rectum AC 149.3
CRC-E159 F 45 II Rectum AC 2.7
CRC-E160 F 49 II Rectum AC 2.1
CRC-E161 F 45 0 Rectum AC 0.9
CRC-E162 M 62 III Rectum AC 2.4
CRC-E163 M 54 0 Rectum AC 6.9
CRC-E164 M 45 0 Rectum AC 7.4
CRC-E165 F 54 0 Rectum AC 3.6
CRC-E166 M 69 II Rectum AC 24
CRC-E167 M 51 I Rectum AC 2.7
CRC-E168 M 45 I Rectum AC 3.2
CRC-E169 M 67 I Rectum AC 2.9
CRC-E170 M 60 I Rectum AC 1.5
CRC-E171 M 49 0 Rectum AC 0.8
CRC-E172 M 71 I Rectum AC 9.8
CRC-E173 M 62 III Rectum AC 2.5
CRC-E174 M 54 II Rectum AC 4.6
CRC-E175 M 56 II Rectum AC 3
CRC-E176 F 71 III Rectum AC 6.7
CRC-E177 M 73 0 Rectum AC 61.5
CRC-E178 F 50 III Rectum AC 2.2
CRC-E179 F 49 0 Rectum AC 1.6
CRC-E180 F 42 III Rectum AC 9.9
CRC-E181 M 61 III Rectum AC 68.1
CRC-E182 F 72 II Rectum AC 8
CRC-E183 F 69 III Rectum AC 11.3
CRC-E184 M 58 II Rectum AC 5.3
CRC-E185 M 56 I Rectum AC 24.8
CRC-E186 M 72 III Rectum AC 1.4
CRC-E187 M 62 III Rectum AC 1.6
CRC-E188 M 55 II Rectum AC 2.4
CRC-E189 F 71 III Rectum AC 1.3
CRC-E190 M 59 III Rectum AC 2.8
CRC-E191 M 52 II Rectum AC 4
CRC-E192 M 47 III Rectum AC 2.3
CRC-E193 M 58 II Rectum AC 1.1
CRC-E194 M 60 0 Rectum AC 2
CRC-E195 M 64 I Rectum AC 2
CRC-E196 M 41 III Rectum AC 1.6
CRC-E197 M 48 I Rectum AC 0.8
CRC-E198 M 58 II Rectum AC 1.1
CRC-E199 M 61 I Rectum AC 2.6
CRC-E200 M 63 I Rectum AC 1.3
CRC-E201 F 52 II Rectum AC 1.6
CRC-E202 M 53 II Rectum AC 2
CRC-E203 M 64 I Rectum AC 2
CRC-E204 M 73 II Rectum AC 5.6
CRC-E205 M 41 III Rectum AC 1.6
CRC-E206 M 57 III Rectum AC 2
CRC-E207 M 48 I Rectum AC 0.8
CRC-E208 M 72 III Rectum AC 6.1
CRC-E209 F 67 0 Rectum AC 4.4
CRC-E210 F 66 II Rectum AC 4.8
CRC-E211 M 47 III S-colon AC 3.7
CRC-E212 M 40 III A-colon AC 1.2
CRC-E213 M 55 II D-colon AC 6
CRC-E214 F 73 I D-colon, T-colon AC 2
CRC-E215 F 69 I A-colon AC 5
CRC-E216 F 69 I A-colon AC 5.7
CRC-E217 F 74 II D-colon AC 12.5
CRC-E218 M 61 II S-colon MAC 1.9
CRC-E219 M 37 III Rectum AC 6
CRC-E220 M 60 III S-colon AC 5.4
CRC-E221 M 70 II S-colon AC 2.6
CRC-E222 M 68 III Rectum AC 13.2
CRC-E223 M 73 I Rectum AC 1.7
CRC-E224 M 82 III T-colon AC 2.1
CRC-E225 F 75 II Rectum AC 0.9
CRC-E226 F 57 I A-colon AC 1.5
CRC-E227 F 62 III S-colon AC 4.4
CRC-E228 M 73 II Rectum AC 15.5
CRC-E229 M 59 I S-colon AC 1.1
CRC-E230 F 74 III Rectum AC 31
CRC-E231 F 70 I A-colon AC 2.5
CRC-E232 M 74 II S-colon AC 15.4
CRC-E233 M 69 II Rectum AC 2.1
CRC-E234 M 61 II A-colon, T-colon AC 2.3
CRC-E235 M 73 I Rectum AC 1.9
CRC-E236 M 64 I Rectum AC 2.8
CRC-E237 M 69 II D-colon AC 5
CRC-E238 M 58 III Rectum AC 1.6
CRC-E239 M 73 II T-colon AC 2.6
CRC-E240 M 70 II A-colon AC 20.8
CRC-E241 M 56 IV Rectum AC 29.9
CRC-E242 F 70 II A-colon AC 5.9
CRC-E243 M 71 III S-colon AC 110.1
CRC-E244 M 47 III Rectum AC 13.7
CRC-E245 M 61 III Rectum AC 2.8
CRC-E246 F 77 II S-colon AC 1.5
CRC-E247 F 62 III Rectum AC 13.7
CRC-E248 M 61 II S-colon AC 2.3
CRC-E249 M 66 II S-colon AC 1.7
CRC-E250 M 64 III A-colon AC 1
CRC-E251 M 69 II S-colon AC 23
CRC-E252 M 66 0 Rectum AC 58.4
ASC: Adenosquamous carcinoma
표 311
BRC Sex Ageyear Node ER ER% PR PR% HER2 Tumor Size cm
BRC-E55 F 44 pN0 6 33-66% 7 >66% 1 1.2
BRC-E56 F 72 pN0(sn) 0 0% 0 0% 0 1.8
BRC-E57 F 48 pN0(sn) 5 33-66% 4 10-33% 1 0.8
BRC-E58 F 44 pN0 5 33-66% 7 >66% 1 2
BRC-E59 F 41 pN2a 5 33-66% 6 33-66% 1 4
BRC-E60 F 58 pN0 6 33-66% 0 0% 2 <0.1
BRC-E61 F 42 - 5 33-66% 6 33-66% 2 -
BRC-E62 F 44 pN1a 4 10-33% 2 <10% 2 5.5
BRC-E63 F 62 pN0(sn) 7 >66% 0 0% 0 2
BRC-E64 F 47 pN0 6 33-66% 6 33-66% 2 2.4
BRC-E65 F 52 pN1a 6 33-66% 0 0% 3 1.8
BRC-E66 F 44 pN0(sn) 6 33-66% 0 0% 0 2
BRC-E67 F 49 pN0(sn) 2 <10% 2 <10% 3 0.4
BRC-E68 F 46 pN0(sn) 6 33-66% 5 33-66% 1 0.7
BRC-E69 F 58 pN0(sn) 7 >66% 5 33-66% 1 2.3
BRC-E70 F 64 pN1a 6 33-66% 7 >66% 1 2
BRC-E71 F 47 - 6 33-66% 6 33-66% 2 -
BRC-E72 F 74 pN1a 6 33-66% 6 33-66% 1 1.8
BRC-E73 F 64 pN0(sn) 0 0% 0 0% 1 2.2
BRC-E74 F 40 ypN1a 6 33-66% 6 33-66% 1 3.5
BRC-E75 F 43 pN0 6 33-66% 6 33-66% 2 2.5
BRC-E76 F 43 ypN0 0 0% 0 0% 2 -
BRC-E77 F 42 pN0 0 0% 0 0% 0 2.3
BRC-E78 F 37 pN0(i+) 6 33-66% 6 33-66% 1 1
BRC-E79 F 50 pN1a 6 33-66% 6 33-66% 1 1
BRC-E80 F 57 pN0(sn) 6 33-66% 96 33-66% 1 1.4
BRC-E81 F 38 ypN0 0 0% 0 0% 1 2
BRC-E82 F 67 - 6 33-66% 2 <10% 1 -
BRC-E83 F 42 pN0(sn) 6 33-66% 6 33-66% 2 0.5
BRC-E84 F 46 pN0(sn) 6 33-66% 6 33-66% 1 1
BRC-E85 F 48 pN2a 4 10-33% 4 10-33% 3 2.5
BRC-E86 F 58 pN0 2 <10% 0 0 1 0.5
BRC-E87 F 53 pN0(sn) 0 0% 0 0% 3 <0.1
BRC-E88 F 56 - 0 0% 0 0% 0 -
BRC-E89 F 45 pN0(sn) 6 33-66% 6 33-66% 2 <0.1
BRC-E90 F 59 pN0(sn) 5 33-66% 0 0% 2 1.4
BRC-E91 F 40 ypN1a 2 <10% 0 0% 0 0.3
BRC-E92 F 39 pN1 7 >95% 3 <10% 0 2.2
BRC-E93 F 54 pN0(i+) 7 95% 5 10-30% 1 1.7
BRC-E94 F 48 pN3a 7 90% 8 90% 0 3.2
BRC-E95 F 54 pN0 0 0% 0 0% 0 3
BRC-E96 F 43 pN0 7 50-60% 7 50-60% 3 2.3
BRC-E97 F 61 pN0 8 95% 8 95% 0 1.6
BRC-E98 F 54 - 0 0% 0 0% 3 -
BRC-E99 F 46 pN0 7 80% 8 95% 0 2.2
BRC-E100 F 61 pN0(i+0) 7 >95% 0 0% 0 4
BRC-E101 F 53 pN0 7 80% 5 25% 0 0.6
BRC-E102 F 49 pN0 3 20% 7 60% 0 0.3
BRC-E103 F 57 pN0 0 0% 0 0% 0 0.8
BRC-E104 F 68 pN0 0 0% 3 1% 3 1.2
BRC-E105 F 58 pN0 8 95% 4 40% 0 0.8
BRC-E106 F 40 - 8 95% 8 95% 0 -
BRC-E107 F 29 pN0 8 95% 8 95% 1 1.2
BRC-E108 F 40 - - - - - - -
표 312
NHL Sex Ageyear Stage Involved Site Subtype IPI
NHL-E25 F 56 1 breast DLBL 0
NHL-E26 F 38 1 stomach DLBL 0
NHL-E27 F 73 1 nasal cavity DLBL 2
NHL-E28 F 48 1 breast DLBL 1
NHL-E29 F 72 1 stomach DLBL 2
NHL-E30 M 44 2 cervical LN, tonsil DLBL 0
NHL-E31 F 38 2 tonsil, neck LN DLBL 0
NHL-E32 M 70 2 neck area LN DLBL 1
NHL-E33 M 80 2 stomach PTCL 1
NHL-E34 F 61 2 stomach DLBL 3
NHL-E35 F 76 2 stomach DLBL 1
NHL-E36 M 67 3 multiple Burkitt's L 3
NHL-E37 F 73 3 multiple DLBL 2
NHL-E38 M 49 3 multiple DLBL 3
NHL-E39 F 69 3 multiple ATCL 3
NHL-E40 M 71 4 multiple Mantle cell L 3
NHL-E41 F 38 4 multiple DLBL 3
NHL-E42 F 70 4 multiple DLBL 3
NHL-E43 M 25 4 multiple NK/T cell L 3
NHL-E44 M 48 4 multiple DLBL 3
NHL-E45 M 67 4 multiple MZBCL 2
NHL-E46 M 24 4 multiple DLBL 3
또한, 집합 E와 독립된 표 313의 44명의 GC 환자군, 표 314의 81명의 정상 대조군, 표 315의 168명의 CRC 환자군, 표 316의 53명의 BRC 환자군, 표 317의 20명의 NHL 환자군, 표 318의 25명의 난소암(ovarian cancer, OVC) 환자군을 집합 F로 하여 검증 집합을 구성하였다. OVC 환자군은 질량 이온별 가중치를 구할 때나 GC 진단용 저질량 이온을 확인할 때 전혀 반영되지 않은 환자군으로, 본 발명에서 구성한 판별식으로 이 환자군이 어떻게 판별되는지 살펴보기 위하여 포함하였다.
표 313
GC Sex Ageyear CEAng/mL Stage GC Sex Ageyear CEAng/mL Stage
GC-F1 F 62 - I GC-F23 M 81 - III
GC-F2 M 52 1.86 I GC-F24 F 81 - III
GC-F3 F 64 4.16 I GC-F25 M 70 - III
GC-F4 M 67 - I GC-F26 M 51 - III
GC-F5 M 61 - I GC-F27 M 71 8.46 IV
GC-F6 F 77 - I GC-F28 M 46 2.67 IV
GC-F7 F 74 - I GC-F29 M 68 24.93 IV
GC-F8 F 81 - I GC-F30 M 68 3.23 IV
GC-F9 F 55 - I GC-F31 M 57 41.32 IV
GC-F10 M 69 21.71 II GC-F32 M 71 2.8 IV
GC-F11 M 59 - II GC-F33 F 43 1.62 IV
GC-F12 M 64 - II GC-F34 M 58 6.6 IV
GC-F13 M 68 - II GC-F35 M 73 - IV
GC-F14 M 54 - II GC-F36 M 61 10.41 IV
GC-F15 F 52 - II GC-F37 M 66 - IV
GC-F16 M 59 - II GC-F38 F 57 2.46 IV
GC-F17 F 81 - II GC-F39 M 52 - IV
GC-F18 F 68 5.56 III GC-F40 M 59 - IV
GC-F19 M 48 1.44 III GC-F41 M 56 - IV
GC-F20 F 80 - III GC-F42 M 82 - IV
GC-F21 M 46 1.68 III GC-F43 F 52 - IV
GC-F22 M 42 - III GC-F44 M 82 - IV
표 314
Control Sex Ageyear CEAng/mL Control Sex Ageyear CEAng/mL
CONT-F1 M 49 1.2 CONT-F42 M 51 -
CONT-F2 F 38 0.9 CONT-F43 F 52 -
CONT-F3 F 44 - CONT-F44 F 52 -
CONT-F4 M 52 - CONT-F45 M 57 3.3
CONT-F5 F 45 - CONT-F46 M 61 2.8
CONT-F6 F 54 - CONT-F47 F 68 1.4
CONT-F7 F 51 3.1 CONT-F48 F 52 1.5
CONT-F8 M 54 6.4 CONT-F49 M 60 4.6
CONT-F9 M 46 1.1 CONT-F50 M 55 2.2
CONT-F10 M 47 1.8 CONT-F51 M 55 1.8
CONT-F11 M 49 1.7 CONT-F52 M 56 2.2
CONT-F12 F 55 <0.5 CONT-F53 F 63 1.8
CONT-F13 M 46 3.7 CONT-F54 F 65 1.1
CONT-F14 F 46 <0.5 CONT-F55 F 55 4.8
CONT-F15 M 34 1.7 CONT-F56 M 63 2.6
CONT-F16 M 53 2.9 CONT-F57 F 52 4.1
CONT-F17 M 45 3.7 CONT-F58 M 51 4
CONT-F18 M 47 4.5 CONT-F59 M 59 2
CONT-F19 F 34 0.6 CONT-F60 M 68 4.6
CONT-F20 F 58 1.5 CONT-F61 M 50 5
CONT-F21 F 54 - CONT-F62 F 64 <0.5
CONT-F22 M 35 1.8 CONT-F63 F 63 2.2
CONT-F23 M 49 1.4 CONT-F64 M 64 1.7
CONT-F24 M 48 3.2 CONT-F65 M 51 2.3
CONT-F25 F 34 <0.5 CONT-F66 F 62 1.1
CONT-F26 M 45 4.4 CONT-F67 M 54 2.5
CONT-F27 M 52 - CONT-F68 F 53 0.7
CONT-F28 F 44 - CONT-F69 F 65 3.8
CONT-F29 M 58 - CONT-F70 F 64 1.5
CONT-F30 M 45 4.3 CONT-F71 F 53 1
CONT-F31 M 61 1.4 CONT-F72 M 50 1.1
CONT-F32 M 42 2.7 CONT-F73 F 66 1.7
CONT-F33 M 48 3 CONT-F74 F 50 1.9
CONT-F34 M 53 1.9 CONT-F75 M 61 1.5
CONT-F35 F 54 2.3 CONT-F76 M 81 -
CONT-F36 F 39 1.3 CONT-F77 F 53 -
CONT-F37 F 55 1.3 CONT-F78 M 75 -
CONT-F38 M 53 - CONT-F79 F 44 -
CONT-F39 F 45 - CONT-F80 M 42 -
CONT-F40 F 63 - CONT-F81 M 62 -
CONT-F41 F 51 -
표 315
CRC Sex Ageyear Stage Location Cell Type CEAng/mL
CRC-F1 M 73 I Rectum AC 1.9
CRC-F2 M 65 I S-colon AC 14
CRC-F3 M 72 I S-colon AC 4.6
CRC-F4 M 82 I Rectum AC 3.2
CRC-F5 M 77 I D-colon AC 6.4
CRC-F6 M 78 I Rectum AC 2.7
CRC-F7 F 46 I S-colon AC 1.4
CRC-F8 M 61 I Rectum AC 1.4
CRC-F9 M 43 I Rectum AC 0.5
CRC-F10 M 53 I Rectum AC 3.5
CRC-F11 F 67 II A-colon AC 7.3
CRC-F12 F 75 II Rectum AC 12.6
CRC-F13 M 68 II D-colon AC 4.7
CRC-F14 F 60 II S-colon AC 3.3
CRC-F15 M 74 II S-colon AC 9
CRC-F16 M 63 II D-colon AC 4.9
CRC-F17 F 66 II S-colon AC 4.2
CRC-F18 M 48 II Rectum AC 28.4
CRC-F19 M 68 II S-colon AC 2.3
CRC-F20 M 48 II S-colon AC 4.8
CRC-F21 F 81 II S-colon AC 2.4
CRC-F22 M 56 II A-colon AC 34.6
CRC-F23 M 56 II Rectum AC 3
CRC-F24 F 77 II Rectum AC 6.2
CRC-F25 M 44 II T-colon AC 1.8
CRC-F26 F 82 II A-colon AC 2.8
CRC-F27 M 67 II A-colon AC 20.1
CRC-F28 M 72 II A-colon AC 3.4
CRC-F29 M 59 II S-colon AC 2.1
CRC-F30 F 50 III D-colon AC 6.4
CRC-F31 M 56 III S-colon AC 7.3
CRC-F32 F 58 III S-colon AC 2.1
CRC-F33 M 71 III Rectum AC 16.5
CRC-F34 M 66 III S-colon AC 689.8
CRC-F35 M 65 III D-colon AC 3.4
CRC-F36 F 65 III S-colon MAC 2.7
CRC-F37 F 51 III Rectum AC 1.4
CRC-F38 M 58 III S-colon AC 2.8
CRC-F39 F 48 III A-colon AC 0.9
CRC-F40 M 71 III S-colon AC 6
CRC-F41 M 68 III A-colon AC 2.7
CRC-F42 F 54 III A-colon AC 1.7
CRC-F43 F 49 III S-colon AC 1
CRC-F44 F 63 III A-colon AC 58.2
CRC-F45 M 74 III A-colon AC 2.8
CRC-F46 F 54 III T-colon AC 2.2
CRC-F47 M 68 III Rectum AC 22.5
CRC-F48 M 66 III Rectum MAC 1.2
CRC-F49 F 70 III S-colon MAC 36
CRC-F50 M 64 III A-colon AC 2.2
CRC-F51 F 54 III Rectum AC 5.5
CRC-F52 M 53 III Rectum AC 1.4
CRC-F53 M 81 III A-colon MAC 10.9
CRC-F54 F 52 III A-colon AC 1.2
CRC-F55 F 71 III A-colon AC 2.8
CRC-F56 M 84 III Rectum AC 15
CRC-F57 F 33 III D-colon AC 4.7
CRC-F58 F 68 III Rectum AC 3.3
CRC-F59 M 69 III Rectum AC 3.5
CRC-F60 F 61 III A-colon AC 2.8
CRC-F61 M 73 III Rectum AC 11.1
CRC-F62 M 64 III D-colon AC 8.2
CRC-F63 F 54 IV S-colon AC 29.8
CRC-F64 M 43 IV Rectum AC 36.4
CRC-F65 F 52 IV A-colon MAC 9
CRC-F66 M 48 IV S-colon AC 15.9
CRC-F67 M 62 IV Rectum AC 6.3
CRC-F68 M 69 IV A-colon AC 33.5
CRC-F69 M 78 IV Rectum AC 4.1
CRC-F70 M 38 IV Rectum AC 2.1
CRC-F71 M 74 II Rectum AC 7.9
CRC-F72 F 59 III Rectum AC 1.4
CRC-F73 M 56 I Rectum AC 2.6
CRC-F74 M 69 II Rectum AC 14
CRC-F75 M 58 II Rectum AC 10.2
CRC-F76 F 75 II Rectum AC 2.4
CRC-F77 M 47 II Rectum AC 3.2
CRC-F78 F 68 II Rectum AC 0.7
CRC-F79 M 52 III Rectum AC 2.9
CRC-F80 M 68 I Rectum AC 7
CRC-F81 M 51 II Rectum AC 1.4
CRC-F82 M 66 0 Rectum AC 1.2
CRC-F83 M 74 0 Rectum AC 4.5
CRC-F84 M 43 II Rectum AC 12.3
CRC-F85 M 68 III Rectum AC 2.5
CRC-F86 M 68 III Rectum AC 19.4
CRC-F87 F 56 I Rectum AC 2.3
CRC-F88 M 63 0 Rectum AC 1.3
CRC-F89 M 65 II Rectum AC 2.1
CRC-F90 M 60 II Rectum AC 4.6
CRC-F91 M 51 II Rectum AC 1.3
CRC-F92 M 44 0 Rectum AC 2.2
CRC-F93 M 61 II Rectum AC 2
CRC-F94 M 57 III Rectum AC 2.2
CRC-F95 M 41 II Rectum AC 3.1
CRC-F96 M 50 I Rectum AC 4.9
CRC-F97 F 56 III Rectum AC 1
CRC-F98 M 54 III Rectum AC 1.7
CRC-F99 F 69 I Rectum AC 1.5
CRC-F100 M 54 I Rectum AC 2.6
CRC-F101 M 61 II Rectum AC 3.7
CRC-F102 M 72 III Rectum AC 3
CRC-F103 F 71 III Rectum AC 1.8
CRC-F104 M 54 II Rectum AC 3
CRC-F105 M 77 II Rectum AC 1.6
CRC-F106 M 67 III Rectum AC 1.1
CRC-F107 M 59 II Rectum AC 7.2
CRC-F108 M 56 III Rectum AC 9
CRC-F109 F 51 I Rectum AC 1.5
CRC-F110 F 67 III Rectum AC 3.4
CRC-F111 F 76 III Rectum AC 1
CRC-F112 F 38 III Rectum AC 0.7
CRC-F113 M 53 II Rectum AC 3.3
CRC-F114 M 58 III Rectum AC 1.6
CRC-F115 M 69 III Rectum AC 6.4
CRC-F116 F 60 I Rectum AC 1.2
CRC-F117 M 52 II Rectum AC 4
CRC-F118 M 59 III Rectum AC 2.8
CRC-F119 F 56 III Rectum AC 2.3
CRC-F120 F 68 I Rectum AC 2
CRC-F121 M 65 I Rectum AC 1.6
CRC-F122 M 33 II Rectum AC 1.9
CRC-F123 M 61 III Rectum AC 3.2
CRC-F124 F 41 III Rectum AC 1.5
CRC-F125 M 61 I Rectum AC 1.6
CRC-F126 F 34 III Rectum AC 5.2
CRC-F127 M 47 III Rectum AC 2.3
CRC-F128 F 61 III A-colon AC 30.4
CRC-F129 M 71 IV A-colon AC 33.5
CRC-F130 M 44 III A-colon MAC 77.6
CRC-F131 F 71 III Rectum AC 1
CRC-F132 M 59 II S-colon AC 2.9
CRC-F133 M 79 IV Rectum AC 4.1
CRC-F134 M 66 II S-colon AC 1.7
CRC-F135 M 78 III S-colon AC 2.5
CRC-F136 F 53 II S-colon AC 1.3
CRC-F137 M 50 III S-colon AC 1.7
CRC-F138 F 77 II S-colon AC 2.2
CRC-F139 M 53 II S-colon ASC 8.6
CRC-F140 M 63 I Rectum AC 1.4
CRC-F141 F 71 III S-colon MAC 36
CRC-F142 F 79 II Rectum AC 6.2
CRC-F143 M 83 III A-colon MAC 10.9
CRC-F144 F 53 III A-colon AC 1.2
CRC-F145 F 72 III A-colon AC 2.8
CRC-F146 F 34 III D-colon AC 4.7
CRC-F147 M 70 III Rectum AC 3.5
CRC-F148 F 62 III A-colon AC 2.8
CRC-F149 M 45 II T-colon AC 1.8
CRC-F150 F 84 II A-colon AC 2.8
CRC-F151 M 74 III Rectum AC 11.1
CRC-F152 M 65 III D-colon AC 8.2
CRC-F153 M 69 II A-colon AC 20.1
CRC-F154 M 73 II A-colon AC 2.3
CRC-F155 M 61 II S-colon AC 2.1
CRC-F156 F 71 II S-colon AC 15.3
CRC-F157 F 56 I S-colon AC 0.7
CRC-F158 F 70 II S-colon AC 1.4
CRC-F159 F 62 III Rectum AC 235.4
CRC-F160 M 61 III S-colon AC 11.2
CRC-F161 F 52 III S-colon AC 6.4
CRC-F162 M 62 II S-colon AC 4.9
CRC-F163 F 61 III T-colon AC 13.9
CRC-F164 F 88 II A-colon AC 3
CRC-F165 M 73 II S-colon AC 16.5
CRC-F166 M 69 III A-colon AC 1.7
CRC-F167 M 71 III A-colon MAC 2.4
CRC-F168 F 45 0 Rectum AC -
표 316
BRC Sex Ageyear Node ER ER% PR PR% HER2 Tumor Size cm
BRC-F1 F 34 pN0(sn) 2 <10% 0 0% 2 2
BRC-F2 F 69 - 6 33-66% 6 33-66% 1 -
BRC-F3 F 52 - - - - - - -
BRC-F4 F 67 - - - - - - -
BRC-F5 F 61 - 6 33-66% 2 <10% 0 -
BRC-F6 F 38 pN1a 6 33-66% 5 33-66% 1 -
BRC-F7 F 60 pN0 6 33-66% 3 10-33% 1 1
BRC-F8 F 55 pN2a 5 33-66% 0 0% 2 2.2
BRC-F9 F 46 ypN0 5 33-66% 2 <10% 1 1.5
BRC-F10 F 67 pN0 6 33-66% 6 33-66% 1 2.8
BRC-F11 F 46 pN1a 6 33-66% 6 33-66% 2 0.7
BRC-F12 F 39 pN1mi 6 33-66% 6 33-66% 2 2.5
BRC-F13 F 50 pN0(sn) 4 10-33% 5 33-66% 0 1
BRC-F14 F 31 pN1mi(sn) 6 33-66% 6 33-66% 1 1
BRC-F15 F 46 pN0 6 33-66% 7 >66% 1 1.2
BRC-F16 F 44 pN0(sn) 6 33-66% 7 >66% 1 2.5
BRC-F17 F 40 pN0 0 0% 0 0% 0 -
BRC-F18 F 40 - 6 33-66% 6 33-66% 1 -
BRC-F19 F 56 - 7 >66% 0 0 0 0.6
BRC-F20 F 48 pN1a 0 0% 0 0% 0 3
BRC-F21 F 39 pN0(sn) 6 33-66% 6 33-66% 1 3.5
BRC-F22 F 40 ypN1a 6 33-66% 4 10-33% 2 3
BRC-F23 F 48 pN0(sn) 6 33-66% 6 33-66% 0 2.5
BRC-F24 F 59 - 7 >66% 2 <10% 1 -
BRC-F25 F 46 - 0 0% 0 0% 2 -
BRC-F26 F 37 pN3a 6 33-66% 6 33-66% 2 0.6
BRC-F27 F 38 pN0(sn) 6 33-66% 6 33-66% 2 0.3
BRC-F28 F 66 pN1a 6 33-66% 6 33-66% 0 1.5
BRC-F29 F 58 pN0(sn) 0 0% 0 0% 2 1.7
BRC-F30 F 42 pN3a 5 33-66% 6 33-66% 0 1.8
BRC-F31 F 52 pN0 6 33-66% 6 33-66% 0 0.7
BRC-F32 F 46 pN0(sn) 0 0% 2 <10% 1 1.5
BRC-F33 F 42 pN0(sn) 4 10-33% 6 33-66% 1 0.6
BRC-F34 F 48 - - - - - - -
BRC-F35 F 47 pN0 6 33-66% 2 <10% 2 3
BRC-F36 F 59 pN1a 6 33-66% 4 10-33% 1 1.8
BRC-F37 F 56 - 0 0% 0 0% 3 -
BRC-F38 F 61 pN0(i+0) 7 >95% 0 0% 0 4
BRC-F39 F 40 - 8 95% 8 95% 0 -
BRC-F40 F 43 pN0 0 0% 0 0% 3 0.7
BRC-F41 F 59 pN0 8 95% 8 95% 0 1.2
BRC-F42 F 45 PN2 7 95% 8 95% 1 2.1
BRC-F43 F 55 pN0 0 0% 0 0% 3 1.8
BRC-F44 F 52 pN0 7 80-90% 8 80-90% 0 0.3
BRC-F45 F 59 pN0 8 95% 5 2~3% 1 1.3
BRC-F46 F 39 - 7 >95% 7 70-80% 0 -
BRC-F47 F 39 pN0 0 0% 0 0% 3 1.1
BRC-F48 F 40 pN0 5 50-60% 5 20-30% 0 0.8
BRC-F49 F 46 pN0 7 95% 8 95% 0 4.9
BRC-F50 F 51 pN0 0 <1% 0 0% 0 0.9
BRC-F51 F 61 pN0 7 90% 8 90% 0 1.3
BRC-F52 F 48 pN0 0 0% 0 0% 0 0.6
BRC-F53 F 47 pN0 8 >95% 8 95% 0 0.7
표 317
NHL Sex Ageyear Stage Involved Site Subtype IPI
NHL-F1 F 41 1 0 DLBL 0
NHL-F2 M 73 1 nasal cavity DLBL 1
NHL-F3 M 79 1 nasal cavity malignant L 2
NHL-F4 M 37 1 cervical LN DLBL 0
NHL-F5 F 39 2 tonsil, neck LN DLBL 0
NHL-F6 M 31 2 neck DLBL 0
NHL-F7 M 46 2 nasopharynx, tonsil DLBL 0
NHL-F8 M 72 2 stomach DLBL 1
NHL-F9 M 34 2 neck, SCN DLBL 1
NHL-F10 M 70 2 stomach DLBL 1
NHL-F11 M 52 3 multiple DLBL 2
NHL-F12 M 52 3 multiple DLBL 2
NHL-F13 M 67 4 multiple DLBL 2
NHL-F14 M 73 4 tibia, leg(skin) DLBL 3
NHL-F15 F 48 4 multiple DLBL 3
NHL-F16 M 38 4 multiple Hodgkin L -
NHL-F17 M 70 4 multiple DLBL 3
NHL-F18 M 64 4 multiple DLBL 4
NHL-F19 M 25 4 multiple PTCL 2
NHL-F20 M 71 - stomach r/o Lymphoma -
표 318
OVC Ageyear Histology Stage
OVC-F1 56 IIIc Clear cell carcinoma
OVC-F2 52 IIa Endometrioid adenocarcinoma
OVC-F3 63 IV Papillary serous adenocarcinoma
OVC-F4 55 Ia Malignant Brenner tumor
OVC-F5 47 IIIc Papillary serous adenocarcinoma
OVC-F6 50 Ic Clear cell carcinoma
OVC-F7 68 Ib Serous adenocarcinoma
OVC-F8 74 IIIc Papillary serous adenocarcinoma
OVC-F9 43 Ic Mucinous adenocarcinoma
OVC-F10 44 IIIc Papillary serous adenocarcinoma
OVC-F11 54 IIIc Papillary serous adenocarcinoma
OVC-F12 55 IV Serous adenocarcinoma
OVC-F13 72 IIIc Serous adenocarcinoma
OVC-F14 58 IIIc Mucinous adenocarcinoma
OVC-F15 44 IIIc Papillary serous adenocarcinoma
OVC-F16 57 IV Serous adenocarcinoma
OVC-F17 54 IIIc Papillary serous adenocarcinoma
OVC-F18 73 IIIc Serous adenocarcinoma
OVC-F19 47 IIIc Papillary serous adenocarcinoma
OVC-F20 40 Ic Papillary serous adenocarcinoma
OVC-F21 74 IIb Transitional cell carcinoma
OVC-F22 65 IIIc Papillary serous adenocarcinoma
OVC-F23 47 IV Serous adenocarcinoma
OVC-F24 58 IIc Serous adenocarcinoma
OVC-F25 57 Ib Mixed cell adenocarcinoma
(4-2) 시료 준비 - 혈청 준비 및 질량 스펙트럼 측정
4배 부피의 메탄올/클로로포름(2:1, v/v)을 25㎕의 혈청과 함께 격렬하게 섞은 후에 10분 동안 실온에서 배양하였다. 혼합물은 4℃에서 10분 동안 6000 × g로 원심 분리하였다. 수득한 상청액을 1시간 동안 농축기(concentrator)에서 완전히 건조시켰으며, 30분 동안 교반기(vortexer)에서 30㎕의 50% 아세토니트릴(acetonitrile)/0.1% 트라이플루오린화 아세트산(trifluoroacetic acid, TFA)으로 용해시켰다.
메탄올/클로로포름 추출물을 50% 아세토니트릴/0.1% TFA 내에서 알파-시아노-4-하이드록시 시남산(α-cyano-4-hydroxycinnamic acid) 용액과 혼합하였으며(1:12, v/v), 1㎕의 혼합물을 MALDI-타깃 플레이트(target plate)에 위치시켰다. GC 환자 및 비환자 혈청 추출물의 질량 스펙트럼을 Proteomics Analyzer(Applied Biosystems, Foster City, CA, USA)를 사용하여 측정하였다.
한 개의 시료에 대해 질량 스펙트럼 데이터는 20번 반복 측정된 스펙트럼의 평균으로 추출된다. 모든 개별 시료의 질량값 구간은 최대 질량값이 약 2500 m/z이 되도록 조정하였다. 실험적 오류를 최소화하기 위하여, 초점 질량(focus mass), 레이저 강도(laser intensity), 타깃 플레이트, 데이터 수집 시각(data acquisition time)을 포함하는 다양한 요소를 점검하였다.
바람직한 초점 질량 및 레이저 강도로 500 m/z 및 5000이 각각 고정되어 사용되었다. 모든 시료들은 고정된 초점 질량 및 레이저 강도와 함께, 다른 추출 및 다른 데이터 수집 시각하에서 최소 5번 반복 측정하였다. 질량 이온별 가중치를 계산한 집합 E1의 경우는 추가로 한 번 더 측정하였다.
따라서, 저질량 이온 검출수단(6000)은 MALDI-TOF 질량분석기를 이용하여 상기와 같은 과정을 통해서 혈청 시료로부터 저질량 이온 질량 스펙트럼을 추출할 수 있다.
(4-3) 판별 전략
구성한 판별식이 GC 특이적인 식이 되기 위해서는 GC 환자군은 판별식에 의해 정상 대조군뿐만 아니라 다른 암환자군과도 구분되어야 한다. 본 실시 예에서는 다른 암환자군으로 CRC 환자군, BRC 환자군 및 NHL 환자군을 사용하고자 한다. 한 개의 판별식으로 GC 환자군과 비환자군(정상 대조군, CRC 환자군, BRC 환자군 및 NHL 환자군)을 구분할 수 있는지 종래의 주성분 분석 기반 선형 판별 분석 방법을 적용한 결과를 표 319에 나타내었다. 특히 NHL 환자군의 특이도가 25.00%로 낮은 것을 확인할 수 있다. 이로부터 한 개의 판별식으로는 GC 환자군과 비환자군을 구분할 수 없음을 알 수 있다.
표 319
Sensitivity 97.96%
Set E1 True GC True Non-GC Specificity CONT 95.24%
CONT CRC BRC NHL CRC 83.12%
Predicted GC 48 4 13 8 18 BRC 85.19%
Predicted Non-GC 1 80 64 46 6 NHL 25.00%
도 6 및 표 304에서 확인한 바와 같이 GC 환자군과 정상 대조군에 대해서는 우수한 판별 결과를 얻을 수 있었으므로, GC 환자군과 다른 암환자군과도 개별적으로 구분될 수 있는지 살펴보았는데, 그 결과를 표 320 내지 322에 나타내었다.
표 320
Sensitivity 93.88%
Set E1 True GC True CRC Specificity 98.70%
Predicted GC 46 1 PPV 97.87%
Predicted CRC 3 76 NPV 96.20%
표 321
Sensitivity 93.88%
Set E1 True GC True BRC Specificity 98.15%
Predicted GC 46 1 PPV 97.87%
Predicted BRC 3 53 NPV 94.64%
표 322
Sensitivity 100.0%
Set E1 True GC True NHL Specificity 100.0%
Predicted GC 49 0 PPV 100.0%
Predicted NHL 0 24 NPV 100.0%
따라서 GC 환자군과 비환자군을 구분하는 것은 GC 환자군과 정상 대조군을 구분하는 제1종 판별식, GC 환자군과 CRC 환자군을 구분하는 제2종 판별식, GC 환자군과 BRC 환자군을 구분하는 제3종 판별식, GC 환자군과 NHL 환자군을 구분하는 제4종 판별식을 사용하여, 네 개의 판별식에 의해 모두 GC로 판별된 경우를 GC 환자로 판정하고, 네 개의 판별식 중 어느 하나의 판별식으로든 GC 비환자로 판별된 경우에는 GC 비환자로 판정하는 방식을 통해 수행될 수 있다.
또한, 판별식의 개수가 증가함에 따라 모든 판별식에 의해 GC로 판별되어야 한다는 조건은 필연적으로 민감도의 감소를 야기할 것이므로 판별식의 개수를 줄이는 방법도 필요하다. 표 323은 GC 환자군 및 정상 대조군과 다른 암환자군을 구분하는 경우를 보여주고 있는데, 대체적으로 우수한 판별 결과를 나타낸다고 할 수 있다. 따라서 이 판별식과 제1종의 판별식을 결합하여 GC 환자군과 정상 대조군을 다른 암환자군과 구분한 후, 다시 GC 환자군과 정상 대조군을 구분하는 방식으로 GC 환자군을 비환자군과 구분할 수 있다. GC 환자군 및 정상 대조군과 다른 암환자군을 구분하는 판별식을 제5종의 판별식으로 지칭한다. 네 개의 판별식을 사용하는 방법과, 두 개의 판별식을 사용하는 방법을 채택할 수 있는데, 실시 예에서 두 가지 경우를 모두 설명한다.
표 323
Sensitivity GC 89.80%
Set E1 True GC/CONT True CRC/BRC/NHL CONT 95.24%
GC CONT CRC BRC NHL Specificity CRC 87.01%
Predicted GC/CONT 44 80 10 0 0 BRC 100.0%
Predicted CRC/BRC/NHL 5 4 67 54 24 NHL 100.0%
(4-4) 제1훈련집합 E0의 선정 및 질량 이온별 가중치 계산
표 304, 320, 321, 323에 나타낸 판별 결과가 우수하기는 하나 민감도와 특이도가 모두 100%는 아니다. 본 발명에서는 우선 민감도와 특이도가 소정의 값을 갖는 제1훈련집합 E0를 선정하고, 이 제1훈련집합 E0에 대해 질량 이온별 가중치를 계산하였는데, 본 실시 예에서 그 소정의 값은 민감도와 특이도 모두 100%이다.
도 39를 참조하여 민감도와 특이도가 소정의 값을 갖는 제1훈련집합 E0를 선정하는 방법에 대하여 설명한다.
제1판별점수 계산수단(6200)은, 도시된 도 39의 F111 내지 F114 단계들을 통하여, 집합 E1 내 GC 환자군 및 정상 대조군의 저질량 이온 질량 스펙트럼들을 정렬하여 임포트하고(F111), 임포트한 피크 강도들을 정규화하고(F112), 정규화한 피크 강도들을 파레토 스케일링하고(F113), 파레토 스케일링한 피크 강도들에 대해 생물통계학적 분석을 수행하여 판별 점수를 계산하였다(F114).
다양한 생물통계학적 분석 방법 중 어느 하나를 선택하여 판별 점수를 계산할 수 있으나, 본 실시 예에서는 주성분 분석 기반 선형 판별 분석을 수행하였다. 판별 점수를 통하여 민감도 및 특이도를 계산하였으며(F115), 그 결과는 전술한 표 304와 같다.
다음으로, 민감도의 문턱값 GN1과 특이도의 문턱값 GN2를 설정하여(F116), 민감도 또는 특이도가 각각의 문턱값보다 작은 경우 위양성(false positive) 또는 위음성(false negative) 케이스들을 제외하였다(F117).
본 실시 예에서는 민감도의 문턱값 GN1과 특이도의 문턱값 GN2를 모두 1로 설정함으로써 민감도와 특이도가 모두 100%인 제1훈련집합 E0을 찾았다. 즉 표 304에 나타난 위음성인 한 케이스를 배제하고, 배제한 집합에 대하여 다시 F111 내지 F115 단계를 수행하였다. 제1종 판별식의 경우는 이렇게 하여 민감도 및 특이도가 바로 100%가 되는 것을 확인하였으나, 배제한 집합에 대하여 F111 내지 F115 단계를 다시 수행하여도 항상 바로 민감도 및 특이도가 100%가 되지는 않았으며, F111 내지 F117 단계를 수회 반복함으로써 비로소 민감도와 특이도가 모두 100%인 제1훈련 집합 E0을 찾을 수 있었다(F118).
GC 환자군과 정상 대조군을 구분하는 제1종 판별식의 경우에는 1개의 위음성 케이스를 배제한 후에 제1훈련집합 E01에 도달하였고, GC 환자군과 CRC 환자군을 구분하는 제2종 판별식의 경우에는 4개의 위음성 케이스들 및 2개의 위양성 케이스들을 배제한 후에 제1훈련집합 E02에 도달하였고, GC 환자군과 BRC 환자군을 구분하는 제3종 판별식의 경우에는 4개의 위음성 케이스들 및 1개의 위양성 케이스를 배제한 후에 제1훈련집합 E03에 도달하였고, GC 환자군 및 정상 대조군과 다른 암환자군을 구분하는 제5종 판별식의 경우에는 11개의 위음성 케이스들(GC 5개 및 CONT 6개) 및 21개의 위양성 케이스들(CRC 20개 및 BRC 1개)을 배제한 후에 제1훈련집합 E05에 도달하였는데, 각 제1훈련집합은 민감도와 특이도가 모두 100%인 판별 결과를 준다.
GC 환자군과 NHL 환자군을 구분하는 제4종 판별식의 경우에는 표 322에 나타낸 바와 같이 이미 민감도 및 특이도가 100%이므로 해당 케이스들을 그대로 제1훈련집합 E04로 사용하였다. 이 과정을 통해 민감도와 특이도가 모두 100%인 판별 결과를 주는 질량 이온별 인자적재값을 도출할 수 있다(F119).
상기와 같은 일련의 과정은 상기 인자적재값 계산수단(6300)을 통하여 수행될 수 있다.
(4-5) 판별식의 적용
구성한 판별식을 판별 대상 시료에 적용하는 과정을 설명하면 다음과 같다.
우선 MarkerViewTM에는 이와 유사한 목적으로 사용할 수 있는 기능이 있다. 즉, 함께 임포트한 시료 데이터 중에서 일부 시료들만을 대상으로 하여 주성분 분석 기반 선형 판별 분석을 적용할 수 있으며, 이렇게 구성한 판별식으로 나머지 시료들을 판별할 수 있다. 이 기능을 이용하면 제1훈련집합과 판별 대상 시료를 함께 임포트한 후 제1훈련집합만을 선택해서 주성분 분석 기반 선형 판별 분석을 수행하여 판별 대상 시료가 어떻게 판정되는지 알 수 있다.
그러나, MarkerViewTM의 임포트 과정에서 피크들을 정렬하는 기능(peak alignment)이 수행되는데, 제1훈련집합에 맞추어 판별 대상 시료의 피크들을 정렬하는 기능이 없기 때문에, 제1훈련집합만을 임포트하였을 때의 피크 표(peak table, m/z 열과 시료별 피크 강도 열로 이루어진 행렬)와, 제1훈련집합과 판별 대상 시료를 함께 임포트하였을 때 생성되는 피크 표의 제1훈련집합 부분은 동일하지 않다. 피크 강도 행렬 부분도 다르며, 동일한 피크 강도 행에 대응하는 m/z 값도 항상 동일하게 나타나지는 않는다. 따라서, 제1훈련집합에서 만든 판별식을 판별 대상 시료에 적용하여 판별 점수를 계산하기 위해서는 제1훈련집합과 판별 대상 시료를 함께 임포트했을 때 생성되는 피크 표를 제1훈련집합만을 임포트하였을 때의 피크 표에 재정렬(relignment)하는 작업이 선행되어야 한다.
여러 개의 판별 대상 시료들을 제1훈련집합과 함께 임포트하는 경우 정렬이 어긋나는 정도가 더욱 심해진다. 따라서 본 실시 예에서는 모든 판별 대상 시료들에 대해서 제1훈련집합에 한 개의 판별 대상 시료를 추가하여 임포트한 후, 재정렬, 정규화, 파레토 스케일링을 수행하였다.
도 40을 참조하여 보다 상세히 설명하면 다음과 같다.
먼저, 판별 대상 시료의 저질량 이온 질량 스펙트럼들을 제1훈련집합에 정렬하여 임포트하는 단계를 수행한다(F211).
다만, 본 실시 예에서는 MarkerViewTM에는 판별 대상 시료를 제1훈련집합에 정렬하여 임포트하는 기능이 없으므로, 전술한 바와 같이 판별 대상 시료의 저질량 이온 질량 스펙트럼을 제1훈련집합과 함께 임포트한 후 만들어지는 피크 표를 제1훈련집합만을 임포트하였을 때 만들어지는 피크 표에 재정렬하는 프로그램을 만들어 제1훈련집합에 정렬된 판별 대상 시료의 저질량 이온 질량 스펙트럼을 추출하였다. 그러나 재정렬 없이 처음부터 판별 대상 시료를 제1훈련집합에 정렬하여 임포트하는 것이 보다 바람직하고 이것 역시 프로그램을 만들어 구현 가능하다.
다음으로, 임포트한 피크 강도들을 정규화하고(F212), 정규화한 피크 강도들을 파레토 스케일링하였다(F213).
다음으로, 파레토 스케일링한 저질량 이온들의 피크 강도와 제1훈련집합에 대한 주성분 분석 기반 선형 판별 분석에 의해 획득된 질량 이온별 인자적재값으로부터 판별 점수를 계산하였다(F214).
이렇게 계산된 판별 점수가 기준값 GS보다 큰지 여부를 판단하여(F215), 기준값 GS보다 큰 경우 양성으로 판정하고(F216), 기준값 GS보다 작은 경우 음성으로 판정하였다(F217). 본 실시 예에서 기준값 GS는 0인 것이 바람직하다.
상기와 같은 일련의 과정은 상기 제2정렬수단(6500), 제2판별점수계산 계산수단(6600) 및 위암 판정수단(6700)을 통하여 수행될 수 있다.
제1종 판별식을 위해 집합 E1에서 제1훈련집합 E01을 구성할 때 제외되었던 1명의 GC 환자군 시료, 제2종 판별식을 위해 집합 E1에서 제1훈련집합 E02을 구성할 때 제외되었던 4명의 GC 환자군 시료 및 2명의 CRC 환자군 시료, 제3종 판별식을 위해 집합 E1에서 제1훈련집합 E03을 구성할 때 제외되었던 4명의 GC 환자군 시료 및 1명의 BRC 환자군 시료, 제5종 판별식을 위해 집합 E1에서 제1훈련집합 E05을 구성할 때 제외되었던 5명의 GC 환자군 시료, 6명의 정상 대조군 시료, 20명의 CRC 환자군 시료 및 1명의 BRC 환자군 시료에 대해 상기 (4-4)절에서 계산한 질량 이온별 인자적재값을 적용하여 판별 점수를 계산해 보았다. 제1훈련집합 E01, E02, E03 및 E05를 구성할 때 이미 제외된 케이스들이었기 때문에 위양성 또는 위음성 케이스로 판별될 것으로 예상하였는데, 계산 결과 제5종 판별식 관련 GC 환자군 두 케이스와 정상 대조군 한 케이스가 진양성으로 판정된 것을 제외하고는 예상대로 위양성 또는 위음성 케이스로 판별되었다. 상기 (4-4)절에서 계산한 질량 이온별 인자적재값을 적용하여 집합 E1을 판별한 결과를 도 41 내지 도 45에 나타내었는데, 도 41은 제1종 판별식, 도 42는 제2종 판별식, 도 43은 제3종 판별식, 도 44은 제4종의 판별식, 도 45는 제5의 판별식의 결과를 보여준다.
(4-6) 예비 판별식의 구성
전술한 종래 기술에서는 주성분 분석 기반 선형 판별 분석에서 고려한 모든 질량 이온들을 사용하여 판별 점수를 계산한 후 그 판별 점수에 따라 GC 환자 여부를 판정하였으나, 본 발명에서는 강건한 판별 성능을 나타내는 판별식을 도출하기 위해 우선 판별 점수에 큰 기여를 하는 질량 이온들만 사용하는 예비 판별식을 구성하였다. "예비 판별식"이란 본 발명에 따라 최종적으로 구하고자 하는 판별식을 도출하는 중간 단계로서의 판별식을 지칭하며, 이를 구성하는 저질량 이온들은 최종 판별식을 구성할 GC 진단용 저질량 이온들의 "예비 후보군"이 된다.
도 46의 절차를 통해 10,000개의 질량 이온들 중 판별 점수에 큰 영향을 미치는 소정의 질량 이온들을 선정하였다. 본 실시 예에서 제1종 판별식의 경우 선정된 소정의 질량 이온들의 개수는 299개, 제2종 판별식의 경우는 351개, 제3종 판별식의 경우 384개, 제4종 판별식의 경우는 348개, 제5종 판별식의 경우는 383개였다.
표 303과 함께 전술한 바와 같이, 임포트 조건에서 피크의 최대 개수를 10,000개로 하였고 충분히 많은 시료들을 함께 임포트하였으므로, MarkerViewTM의 주성분 분석 기반 선형 판별 분석 방법을 통해 구성한 판별식은 10,000개의 항으로 이루어져 있다. 그러나, GC 환자 및 비환자를 구분함에 있어 10,000개의 항이 모두 동등한 중요성을 가지지는 않을 것이므로, 도 46의 절차에 따라 10,000개의 질량 이온들 중 판별 점수에 큰 영향을 미치는 질량 이온들을 두 단계에 걸쳐 선정하였다. 이 단계는 10,000개의 질량 이온들 중 GC 환자와 비환자를 구분함에 있어 불필요한 질량 이온들을 제거하는 과정이라 할 수 있다.
10,000개 항의 값들 중에서 피크 강도와 질량 이온별 인자적재값의 곱의 절댓값이 문턱값 GT1보다 큰 질량 이온들을 케이스별로 일차적으로 선택하였다(F121). 본 실시 예에서 문턱값 GT1은 0.1인 것이 바람직하다.
다음, 케이스별로 일차적으로 선택한 질량 이온들 중에서 제1훈련집합 전체 케이스들 중 문턱값 GT2 퍼센트 이상의 케이스들에서 공통으로 나타나는 질량 이온들을 이차적으로 선택하였다(F122). 본 실시 예에서 문턱값 GT2는 50인 것이 바람직하다. 즉, 제4종 판별식의 경우를 예로 들어 설명하면 제1훈련집합인 73개 케이스들 중 최소 37개 이상의 케이스들에서 공통으로 등장하는 질량 이온들로만 예비 판별식을 구성하였다.
상기와 같은 과정을 통하여 선택한 질량 이온들만으로 다시 판별 점수를 계산하고 이에 따라 민감도 및 특이도를 계산하였다(F123). 다시, 민감도의 문턱값 GN3와 특이도의 문턱값 GN4를 설정하여(F124), 민감도 또는 특이도가 각각의 문턱값보다 작은 경우 F121 단계에서 사용된 문턱값 T1 및/또는 F122 단계에서 사용된 문턱값 T2를 변경하여(F125) F121 내지 F124 단계를 반복하였다. 본 실시 예에서는 민감도의 문턱값 N3와 특이도의 문턱값 N4가 각각 0.9인 것이 바람직하다.
이와 같은 단계들을 거쳐 선택한 질량 이온들로 GC 진단용 저질량 이온들의 예비 후보군을 구성하였는데(F126), 본 실시 예에서는 10,000개의 질량 이온들 중 제1종 판별식의 경우 299개, 제2종 판별식의 경우 351개, 제3종 판별식의 경우 384개, 제4종 판별식의 경우 348개, 제5종 판별식의 경우 383개의 질량 이온들이 선택되었다. 표 324 내지 328에 제1 내지 5종 예비 판별식으로 제1훈련집합 E01 내지 E05을 판별한 결과를 나타내었는데, 민감도와 특이도 등 판별 성능이 100%에서 낮아지기는 하였으나 전체 질량 이온 개수의 4%도 되지 않는 질량 이온들만으로 계산한 결과임에도 불구하고, 대체적으로 매우 우수한 판별 결과를 보임을 확인할 수 있다.
또한, 예비 판별식으로 집합 E1을 판별한 결과를 도 47 내지 51에 나타내었는데, 도 47은 제1종 예비 판별식, 도 48은 제2종 예비 판별식, 도 49는 제3종의 예비 판별식, 도 50은 제4종의 예비 판별식, 도 51은 제5종의 예비 판별식의 결과를 보여준다. 계산에 사용되는 질량 이온의 개수는 급격하게 감소된 것에 비해 판별 점수의 범위는 그렇지 않음을 알 수 있는데, 이로부터 GC 환자 및 비환자를 구분함에 있어 10,000개의 질량 이온이 모두 필요한 것이 아니라는 것을 확인할 수 있다.
표 324
Sensitivity 95.83%
Set E01 True GC True CONT Specificity 98.81%
Predicted GC 46 1 PPV 97.87%
Predicted CONT 2 83 NPV 97.65%
표 325
Sensitivity 91.11%
Set E02 True GC True CRC Specificity 97.33%
Predicted GC 41 2 PPV 95.35%
Predicted CRC 4 73 NPV 94.81%
표 326
Sensitivity 100.0%
Set E03 True GC True BRC Specificity 100.0%
Predicted GC 45 0 PPV 100.0%
Predicted BRC 0 53 NPV 100.0%
표 327
Sensitivity 93.88%
Set E04 True GC True NHL Specificity 100.0%
Predicted GC 46 0 PPV 100.0%
Predicted NHL 3 24 NPV 88.89%
표 328
Set E05 True GC/CONT True CRC/BRC/NHL Sensitivity 96.72%
GC CONT CRC BRC NHL Specificity 97.76%
Predicted GC/CONT 41 77 3 0 0 PPV 97.52%
Predicted CRC/BRC/NHL 3 1 54 53 24 NPV 97.04%
상기와 같은 일련의 과정은 상기 후보이온집합 선택수단을 포함하는 위암진단용이온 선정수단(6400)을 통하여 수행될 수 있다.
(4-7) 최종 판별식의 구성
예비 판별식을 구성하는 과정에서는 임포트한 10,000개의 질량 이온들 중 판별 점수에 수치적으로 큰 기여를 하는 질량 이온들을 추출하였다. 그러나 이 질량 이온들 중에는 제1훈련집합 E0에서는 문제를 발생시키지 않았으나, 동일한 GC 환자군 및 비환자군의 혈청에 대해 다시 측정한 질량 스펙트럼에 대한 판별 또는 새로운 GC 환자군 및 비환자군에 대한 판별에 있어서는 잠재적으로 판별 성능을 저하시킬 수 있는 질량 이온들 역시 포함되어 있을 것이므로 이것들도 적극적으로 제거하는 단계가 필요한데, 최종 판별식의 구성 과정에서는 이 단계를 거쳐 최종적으로 GC 진단용 저질량 이온들을 결정한다.
판별식의 강건성을 검증하기 위해 먼저 집합 E1에 대해 추가적으로 5회 반복 측정 실험을 하였으며, 이와 독립적이며 또한, 서로 독립적인 집합 E2 및 집합 F에 대해서도 5회 반복 측정 실험을 수행하였다. 질량 스펙트럼의 반복 측정 과정에는 상기 설명한 혈청을 얼리고 녹이는 과정 및 혈청을 새로 메탄올/클로로포름과 혼합하여 추출하는 과정이 개입되는 것 외에, 레이저 빔(laser beam)을 이용한 기화(vaporization), 탈착(desorption), 이온화(ionization) 과정 등도 반복 실험 시 동일하게 진행된다고는 할 수 없으며, 또한, 아직 밝혀지지 않은 다양한 원인들로부터의 외란들도 개입할 여지가 많다. 따라서 반복 측정된 개별 질량 스펙트럼에 대한 판별 점수에 어느 정도의 편차가 발생하는 것은 배제할 수 없을 것이므로 본 실시 예에서는 5회 반복 측정한 시료에 대해 평균 판별 점수를 계산하여 판정을 실시하였다.
표 329는 종래 기술인 MarkerViewTM의 주성분 분석 기반 선형 판별 분석 결과인 10,000개 항의 판별식으로 집합 E와 F를 판별한 결과를 나타내며, 표 330은 299개 항을 가지는 제1종 예비 판별식, 351개 항을 가지는 제2종 예비 판별식, 384개 항을 가지는 제3종 예비 판별식, 348개 항을 가지는 제4종 예비 판별식, 383개 항을 가지는 제5종 예비 판별식으로 집합 E와 F를 판별한 결과를 나타낸다.
표에서 GC LOME(gastric cancer low-mass ion discriminant equation) 1 내지 5는 제1 내지 5종 판별식을 나타내며, 그 뒤에 딸려 있는 숫자는 판별식에 포함되는 저질량 이온들의 개수를 의미한다. 또한, 표 331에는 검증 집합인 집합 F에 대해서만 판별 성능을 나타내었다.
표 329
GC LOME 1-10000 GC LOME 1-10000
Set E TrueGC True Non-GC Set F TrueGC True Non-GC
CONT CRC BRC NHL CONT CRC BRC NHL OVC
Predicted GC 88 9 86 38 46 Predicted GC 36 5 68 21 20 20
Predicted Non-GC 9 158 166 70 0 Predicted Non-GC 8 76 100 32 0 5
GC LOME 2-10000 GC LOME 2-10000
Set E TrueGC True Non-GC Set F TrueGC True Non-GC
CONT CRC BRC NHL CONT CRC BRC NHL OVC
Predicted GC 81 13 76 29 43 Predicted GC 35 10 66 15 18 21
Predicted Non-GC 16 154 176 79 3 Predicted Non-GC 9 71 102 38 2 4
GC LOME 3-10000 GC LOME 3-10000
Set E TrueGC True Non-GC Set F TrueGC True Non-GC
CONT CRC BRC NHL CONT CRC BRC NHL OVC
Predicted GC 88 32 77 19 31 Predicted GC 37 16 45 15 15 18
Predicted Non-GC 9 135 175 89 15 Predicted Non-GC 7 65 123 38 5 7
GC LOME 4-10000 GC LOME 4-10000
Set E TrueGC True Non-GC Set F TrueGC True Non-GC
CONT CRC BRC NHL CONT CRC BRC NHL OVC
Predicted GC 67 146 151 38 0 Predicted GC 32 69 86 11 0 11
Predicted Non-GC 30 21 101 70 46 Predicted Non-GC 12 12 82 42 20 14
GC LOME 5-10000 GC LOME 5-10000
Set E TrueGC True Non-GC Set F TrueGC True Non-GC
CONT CRC BRC NHL CONT CRC BRC NHL OVC
Predicted GC 60 137 87 0 2 Predicted GC 30 36 58 2 1 8
Predicted Non-GC 37 30 165 108 44 Predicted Non-GC 14 45 110 51 19 17
GC LOMEs 1, 2, 3 & 4 GC LOMEs 1, 2, 3 & 4
Set E TrueGC True Non-GC Set F TrueGC True Non-GC
CONT CRC BRC NHL CONT CRC BRC NHL OVC
Predicted GC 54 0 4 0 0 Predicted GC 23 0 4 0 0 6
Predicted Non-GC 43 167 248 108 46 Predicted Non-GC 21 81 164 53 20 19
GC LOMEs 1 & 5 GC LOMEs 1 & 5
Set E TrueGC True Non-GC Set F TrueGC True Non-GC
CONT CRC BRC NHL CONT CRC BRC NHL OVC
Predicted GC 54 5 17 0 2 Predicted GC 24 3 20 0 1 4
Predicted Non-GC 43 162 235 108 44 Predicted Non-GC 20 78 148 53 19 21
표 330
GC LOME 1-299 GC LOME 1-299
Set E TrueGC True Non-GC Set F TrueGC True Non-GC
CONT CRC BRC NHL CONT CRC BRC NHL OVC
Predicted GC 87 9 84 38 46 Predicted GC 36 8 65 21 20 20
Predicted Non-GC 10 158 168 70 0 Predicted Non-GC 8 73 103 32 0 5
GC LOME 2-351 GC LOME 2-351
Set E TrueGC True Non-GC Set F TrueGC True Non-GC
CONT CRC BRC NHL CONT CRC BRC NHL OVC
Predicted GC 78 12 73 29 42 Predicted GC 35 10 63 15 18 21
Predicted Non-GC 19 155 179 79 4 Predicted Non-GC 9 71 105 38 2 4
GC LOME 3-384 GC LOME 3-384
Set E TrueGC True Non-GC Set F TrueGC True Non-GC
CONT CRC BRC NHL CONT CRC BRC NHL OVC
Predicted GC 87 29 75 18 34 Predicted GC 37 16 43 14 15 19
Predicted Non-GC 10 138 177 90 12 Predicted Non-GC 7 65 125 39 5 6
GC LOME 4-348 GC LOME 4-348
Set E TrueGC True Non-GC Set F TrueGC True Non-GC
CONT CRC BRC NHL CONT CRC BRC NHL OVC
Predicted GC 68 146 152 40 0 Predicted GC 32 67 84 10 0 12
Predicted Non-GC 29 21 100 68 46 Predicted Non-GC 12 14 84 43 20 13
GC LOME 5-383 GC LOME 5-383
Set E TrueGC True Non-GC Set F TrueGC True Non-GC
CONT CRC BRC NHL CONT CRC BRC NHL OVC
Predicted GC 56 134 84 2 1 Predicted GC 29 35 59 1 1 6
Predicted Non-GC 41 33 168 106 45 Predicted Non-GC 15 46 109 52 19 19
GC LOMEs 1, 2, 3 & 4 GC LOMEs 1, 2, 3 & 4
Set E TrueGC True Non-GC Set F TrueGC True Non-GC
CONT CRC BRC NHL CONT CRC BRC NHL OVC
Predicted GC 54 0 4 0 0 Predicted GC 23 0 5 0 0 7
Predicted Non-GC 43 167 248 108 46 Predicted Non-GC 21 81 163 53 20 18
GC LOMEs 1 & 5 GC LOMEs 1 & 5
Set E TrueGC True Non-GC Set F TrueGC True Non-GC
CONT CRC BRC NHL CONT CRC BRC NHL OVC
Predicted GC 52 4 13 0 1 Predicted GC 23 5 18 0 1 4
Predicted Non-GC 45 163 239 108 45 Predicted Non-GC 21 76 150 53 19 21
표 331
Set F Sensitivity (%) Specificity (%) PPV (%) NPV (%)
GC LOME 1-10000,GC LOME 2-10000,GC LOME 3-10000 &GC LOME 4-10000 52.27 97.12 69.70 94.13
GC LOME 1-299,GC LOME 2-351,GC LOME 3-384 &GC LOME 4-348 52.27 96.54 65.71 94.10
GC LOME 1-14,GC LOME 2-36,GC LOME 3-50 &GC LOME 4-46 93.18 98.85 91.11 99.13
Set F Sensitivity (%) Specificity (%) PPV (%) NPV (%)
GC LOME 1-10000 &GC LOME 5-10000 54.55 91.93 46.15 94.10
GC LOME 1-299 & GC LOME 5-383 52.27 91.93 45.10 93.82
GC LOME 1-14 & GC LOME 5-55 79.55 98.56 87.50 97.44
0,000개 질량 이온으로 구성된 판별식은 제1훈련집합 E0에서 완벽한 판별 성능을 보였음에도 불구하고, 집합 F에서 특히 민감도와 양성예측도가 낮게 나타나는 것을 표 331에서 확인할 수 있다. 제1 내지 5종 예비 판별식도 제1훈련집합 E0에서는 대체적으로 매우 우수한 판별 성능(표 324 내지 328)을 보였음에도 불구하고 집합 F에서의 판별 결과는 만족스럽지 않았다.
따라서, 본 발명의 바람직한 일 실시 예에서는 예비 판별식을 강건한 판별식으로 개선하고자 도 52의 단계들을 수행하였다.
먼저, 예비 후보군의 질량 이온들을, 고민감도 집합과 고특이도 집합으로 구분하였다(F131). 여기에서, 고민감도 집합의 질량 이온들은 질량 이온별 민감도가 특이도보다 높은 질량 이온들이며, 고특이도 집합의 질량 이온들은 그 반대이다.
다음으로, 고민감도 집합의 질량 이온들과 고특이도 집합의 질량 이온들을 각각 질량 이온별 민감도와 특이도의 합의 내림차순으로 정렬한 후 {Sns1, Sns2, Sns3 … SnsI}{Spc1, Spc2, Spc3 … SpcJ}, 각각의 상위 2개의 질량 이온들을 취하고 {Sns1, Sns2, Spc1, Spc2}, 4개의 질량 이온들 중 2개 이상의 질량 이온들로 구성할 수 있는 조합들(11개) 중 최고 성능의 조합을 바이오마커 그룹으로 선정하였다(F132).
여기에서, 최고 성능의 조합인지 여부는 다음의 기준들에 따라 객관적이고 보편적으로 선택될 수 있다. 다음의 기준들은 중요도의 순서에 따른다.
기준1) 민감도와 특이도의 합이 큰 조합이 보다 성능이 높다.
기준2) 질량 이온들의 개수가 적은 조합이 보다 성능이 높다.
기준3) 진양성 케이스 중 최소 판별 점수와 진음성 케이스 중 최대 판별 점수의 차이가 큰 조합이 보다 성능이 높다.
다음으로, 고민감도 집합과 고특이도 집합 각각의 그 다음 상위 1개의 질량 이온들{Sns3, Spc3}을 추가로 더 취하여 상기 바이오마커 그룹 및 상기 바이오마커 그룹에 상기 질량 이온들{Sns3, Spc3} 중 어느 하나 이상을 조합한 4개의 집합들{biomarker group}, {biomarker group, Sns3}, {biomarker group, Spc3}, {biomarker group, Sns3, Spc3} 중 최고 성능의 집합을 다시 바이오마커 그룹으로 선정한다(F133).
이러한 과정은, 고민감도 집합 및 고특이도 집합 모두에 추가할 질량 이온이 없을 때까지 반복된다(F134).
즉, 고민감도 집합 및 고특이도 집합 모두에 추가할 질량 이온이 있을 때에는 상기와 같은 F133 단계를 반복하고, 고민감도 집합과 고특이도 집합 중 어느 하나에 추가할 질량 이온이 남지 않은 경우에는, 남은 질량 이온이 있는 집합 중 그 다음 상위 1개의 질량 이온{Snsi 또는 Spcj}을 추가로 더 취하여 상기 바이오마커 그룹 및 상기 바이오마커 그룹에 상기 질량 이온{Snsi 또는 Spcj}를 조합한 2개의 집합들{biomarker group}, {biomarker group, Seni 또는 Spcj} 중 최고 성능의 집합을 다시 바이오마커 그룹으로 선정한다.
이러한 과정은, 고민감도 집합과 고특이도 집합 중 질량 이온이 남았었던 집합의 질량 이온이 남지 않을 때까지 반복되며, 고민감도 집합과 고특이도 집합 모두에 남은 질량 이온이 없는 경우의 바이오마커 그룹이 바이오마커 그룹1(GG)이 된다(F135).
예비 후보군에서 바이오마커 그룹1(GG)을 제거하고(F136) 남은 질량 이온들로 다시 고민감도 집합과 고특이도 집합을 구성하고 위의 과정을 반복한다. 이 과정은 고민감도 집합과 고특이도 집합 중 어느 한 집합이 두 개 미만의 질량 이온만을 가질 때까지 반복된다(F137).
위의 반복 과정을 통해 얻은 바이오마커 그룹1, 2, … 중 정확도순으로 GK개의 바이오마커 그룹을 조합하여 최종 바이오마커 그룹을 형성한다. 여기서 정확도는 전체 케이스 중 진양성 및 진음성 케이스의 비율을 의미한다. 본 실시 예에서 GK는 1 내지 3 사이의 자연수인 것이 바람직하다(F138).
따라서, 상기 최종 바이오마커 그룹의 질량 이온들이 GC 진단용 저질량 이온들로 결정된다(F139).
집합 E1에서, 더 정확하게는 그 부분 집합인 E0에서 질량 이온들의 예비 후보군을 선정하였는데, 예비 후보군으로부터 최종 바이오마커 그룹을 결정할 때에는 과적합(overfitting) 문제를 해결하기 위하여 집합 E1에 독립인 집합 E2도 추가하여 훈련 집합을 확장하였다.
상기의 과정들을 GC 환자군과 정상 대조군을 구분하기 위한 시료들을 대상으로 수행한 결과 제1종 GC 진단용 저질량 이온으로 14개가 선택되었으며, GC 환자군과 CRC 환자군을 구분하기 위한 시료들을 대상으로 수행한 결과 제2종 GC 진단용 저질량 이온으로 36개가 선택되었고, GC 환자군과 BRC 환자군을 구분하기 위한 시료들을 대상으로 수행한 결과 제3종 GC 진단용 저질량 이온으로 50개가 선택되었고, GC 환자군과 NHL 환자군을 구분하기 위한 시료들을 대상으로 수행한 결과 제4종 GC 진단용 저질량 이온으로 46개가 선택되었고, GC 환자군 및 정상 대조군과 다른 암환자군을 구분하기 위한 시료들을 대상으로 수행한 결과 제5종 GC 진단용 저질량 이온으로 55개가 선택되었다.
제1 내지 5종 GC 진단용 저질량 이온들의 질량값은 표 332 내지 336에 나타내었다. 이와 같은 저질량 이온들을 "제1종 GC 진단용 저질량 이온들", "제2종 GC 진단용 저질량 이온들", "제3종 GC 진단용 저질량 이온들", "제4종 GC 진단용 저질량 이온들" 및 "제5종 GC 진단용 저질량 이온들"로 지칭하고, 이를 이용하여 최종적으로 구한 본 발명에 따른 판별식을 "제1종 GC 진단용 최종 판별식", "제2종 GC 진단용 최종 판별식", "제3종 GC 진단용 최종 판별식", "제4종 GC 진단용 최종 판별식" 및 "제5종 GC 진단용 최종 판별식"으로 지칭한다.
표 332
22.9851 123.0842 324.1365 488.6538 526.3426 576.2893 616.1397
87.0959 314.2151 366.2424 490.3374 532.3719 606.2658 1466.5612
표 333
18.0260 137.0721 207.0729 401.0680 489.3564 528.3633 585.2726
22.9830 144.1092 265.2034 431.9882 489.5293 535.2970 587.2805
38.9752 156.0171 356.1278 442.3197 490.2775 553.3205 710.3687
72.0788 172.3740 380.1643 445.0278 490.3586 557.4392 946.4028
86.1216 172.6583 381.0949 458.3228 525.3611 584.2675 1466.6433
122.0584
표 334
22.9852 184.1123 299.3423 430.3313 487.3295 534.2973 580.3417
74.0764 212.1032 314.2316 432.9929 488.3316 535.3013 583.2274
104.1387 217.9461 338.1143 456.2963 490.3400 537.3199 584.2345
105.1157 226.0798 377.0710 459.2425 496.8846 550.3255 584.3355
106.0555 228.0046 387.9830 480.3312 506.9148 560.3121 585.2423
148.0788 284.3291 426.3417 481.3399 509.3577 562.3203 600.3366
173.4924 299.1308 427.3321 482.3368 532.3532 574.3090 616.1446
176.1198
표 335
18.0264 112.0850 176.1298 213.0575 274.0827 430.3169 491.3348
22.9798 123.0738 178.1388 229.0033 284.3265 434.2556 532.2725
23.0539 129.0710 179.1466 232.0822 314.2277 456.3015 534.2841
38.9638 155.1762 192.1245 234.0749 326.3916 459.2257 569.3303
38.9937 164.0701 201.2036 235.0331 383.0532 460.9913
46.0666 165.0955 204.1077 240.0907 417.0381 489.3314
86.1328 175.1219 212.3577 251.9799 429.3172 490.3361
표 336
38.9674 190.1141 267.9562 368.2644 443.2100 548.3441 684.3511
76.0758 193.0672 289.2849 369.2702 445.0283 552.3114 708.3570
123.0414 215.0444 295.1666 370.2806 498.3276 553.3178 711.3711
156.0432 228.0389 301.1386 371.2848 510.2755 571.3341 723.3455
163.1135 230.0004 315.2230 396.0400 511.3414 573.2402 725.3580
164.0712 256.3291 330.2485 412.1977 513.3220 584.2661 726.3760
184.1062 257.2950 342.2497 428.1904 530.3908 666.3899 741.3357
184.1375 265.9579 346.2809 442.3155 532.2863 683.3451
상기와 같은 일련의 과정은 상기 최종이온집합 선택수단을 포함하는 위암진단용이온 선정수단(6400)을 통하여 수행될 수 있다.
(4-8) 최종 판별식의 적용 및 분석
집합 F에 대하여 제1 내지 4종, 또는 제1종 및 제5종 GC 진단용 저질량 이온들을 이용한 제1 내지 4종, 또는 제1종 및 제5종 GC 진단용 최종 판별식을 도 40의 방법에 따라 적용하면 그 판정 결과를 획득할 수 있다.
최종 판별식으로 판정한 결과를 도 53, 54 및 표 331, 337에 나타내었다. 도 53 및 도 54은 5회 판별 점수의 평균 판별 점수로 판정한 결과를 나타내는데, 도 53은 집합 E, 도 54는 집합 F의 판정 결과를 나타낸다. 제1 내지 4종 GC 진단용 최종 판별식을 사용하는 경우는 4차원 공간상에 표현되어야 하므로 그림으로 나타내지 않았고, 제1종 및 제5종 GC 진단용 최종 판별식을 사용한 경우만 나타내었다.
표 337
GC LOME 1-14 GC LOME 1-14
Set E TrueGC True Non-GC Set F TrueGC True Non-GC
CONT CRC BRC NHL CONT CRC BRC NHL OVC
Predicted GC 95 0 107 13 43 Predicted GC 42 0 92 5 19 14
Predicted Non-GC 2 167 145 95 3 Predicted Non-GC 2 81 76 48 1 11
GC LOME 2-36 GC LOME 2-36
Set E TrueGC True Non-GC Set F TrueGC True Non-GC
CONT CRC BRC NHL CONT CRC BRC NHL OVC
Predicted GC 93 9 7 5 22 Predicted GC 42 12 9 3 8 14
Predicted Non-GC 4 158 245 103 24 Predicted Non-GC 2 69 159 50 12 11
GC LOME 3-50 GC LOME 3-50
Set E TrueGC True Non-GC Set F TrueGC True Non-GC
CONT CRC BRC NHL CONT CRC BRC NHL OVC
Predicted GC 96 79 133 1 24 Predicted GC 44 35 111 0 13 15
Predicted Non-GC 1 88 119 107 22 Predicted Non-GC 0 46 57 53 7 10
GC LOME 4-46 GC LOME 4-46
Set E TrueGC True Non-GC Set F TrueGC True Non-GC
CONT CRC BRC NHL CONT CRC BRC NHL OVC
Predicted GC 95 145 164 30 0 Predicted GC 44 70 100 6 0 3
Predicted Non-GC 2 22 88 78 46 Predicted Non-GC 0 11 68 47 20 22
GC LOME 5-55 GC LOME 5-55
Set E TrueGC True Non-GC Set F TrueGC True Non-GC
CONT CRC BRC NHL CONT CRC BRC NHL OVC
Predicted GC 70 153 28 7 1 Predicted GC 37 60 12 3 1 0
Predicted Non-GC 27 14 224 101 45 Predicted Non-GC 7 21 156 50 19 25
GC LOMEs 1, 2, 3 & 4 GC LOMEs 1, 2, 3 & 4
Set E TrueGC True Non-GC Set F TrueGC True Non-GC
CONT CRC BRC NHL CONT CRC BRC NHL OVC
Predicted GC 89 0 5 0 0 Predicted GC 41 0 4 0 0 0
Predicted Non-GC 8 167 247 108 46 Predicted Non-GC 3 81 164 53 20 25
GC LOMEs 1 & 5 GC LOMEs 1 & 5
Set E TrueGC True Non-GC Set F TrueGC True Non-GC
CONT CRC BRC NHL CONT CRC BRC NHL OVC
Predicted GC 69 0 12 0 1 Predicted GC 35 0 4 0 1 0
Predicted Non-GC 28 167 240 108 45 Predicted Non-GC 9 81 164 53 19 25
검증 집합인 집합 F에서의 판별 성능으로 평가하면, 제1종 및 제5종 GC 진단용 최종 판별식의 결과에 비해, 제1 내지 4종 GC 진단용 최종 판별식의 결과가 더 우수함을 확인할 수 있다. 판별식의 개수의 증가는 통상 민감도의 감소를 동반하게 되지만 실시 예의 경우 제3종 및 제4종 판별식에서 100%의 민감도를 보였으므로 민감도의 감소의 관점에서는 사실상 판별식의 개수가 두 개인 것과 같게 되므로 판별식의 개수에 비해 민감도의 저하가 현저하게 나타나지는 않았다.
제1 내지 4종 GC 진단용 최종 판별식을 사용하는 경우에는 집합 F에서 민감도, 특이도, 양성예측도, 음성예측도가 모두 90% 이상이었다. 제1종 및 제5종 GC 진단용 최종 판별식을 사용하는 경우에는 민감도, 특이도, 양성예측도, 음성예측도가 모두 약 80% 이상이었다. 따라서 대체적으로 보아 제1종 및 제5종 GC 진단용 최종 판별식도 우수한 결과를 보인다고 할 수 있다.
본 발명을 통해 혈청의 저질량 이온 질량 스펙트럼을 분석하여 GC 환자와 비환자를 높은 판별 성능을 갖고 판정할 수 있었다.
본 발명은 본 실시 예와 유사한 과정을 거쳐 대장암, 유방암 및 위암 외에 다른 특정 암환자군과 정상 대조군을 판별하는 식을 구성하며, 또한, 서로 다른 암환자군을 구별하는 판별식을 구성하는 것으로 쉽게 확장될 수 있다. 또한, 암뿐만 아니라 어떠한 다른 질병에 대하여도 진단할 수 있도록 쉽게 확장될 수 있는 것을 당업자는 용이하게 알 수 있을 것이다.
본 발명에 따른 암 진단 장치는, CRC 진단의 경우 분석 비용이 매우 낮으며, 분석 시간이 짧고, 대규모 분석이 가능하고, CRC를 대상으로 한 경우 훈련 집합뿐 아니라 검증 집합의 판별에서도 민감도, 특이도, 양성예측도, 음성 예측도가 모두 85% 이상임을 확인하였다. 또한, CRC 환자 및 비환자 집합을 다른 질병의 환자 및 비환자 집합으로 변경하는 것을 통해 다양한 질병에 유용하게 적용될 수 있다.
본 발명에 따른 암 진단 장치는, BRC 진단의 경우에도 분석 비용이 매우 낮으며, 분석 시간이 짧고, 대규모 분석이 가능하고, BRC를 대상으로 한 경우 훈련 집합뿐 아니라 검증 집합의 판별에서도 민감도, 특이도, 양성예측도, 음성 예측도가 모두 85% 이상임을 확인하였다. 또한, BRC 환자 및 비환자 집합을 다른 질병의 환자 및 비환자 집합으로 변경하는 것을 통해 다양한 질병에 유용하게 적용될 수 있다.
본 발명에 따른 암 진단 장치는, GC 진단의 경우에도 분석 비용이 매우 낮으며, 분석 시간이 짧고, 대규모 분석이 가능하고, GC를 대상으로 한 경우 훈련 집합뿐 아니라 검증 집합의 판별에서도 민감도, 특이도, 양성예측도, 음성 예측도가 모두 약 80~90% 이상임을 확인하였다. 또한, GC 환자 및 비환자 집합을 다른 질병의 환자 및 비환자 집합으로 변경하는 것을 통해 다양한 질병에 유용하게 적용될 수 있다.

Claims (138)

  1. 다수의 암 환자 및 비환자 케이스들의 생물학적 시료로부터 저질량 이온(low-mass ion)의 질량 스펙트럼을 검출하는 저질량 이온 검출부;
    상기 저질량 이온의 질량 스펙트럼 패턴을 비교 분석하여 암 진단 정보를 판정하는 암 진단부; 및
    상기 암 진단부로부터 판정된 암 진단 정보를 출력 가능한 형태로 변환하여 표시하는 디스플레이부를 포함하는 암 진단 장치.
  2. 제1항에 있어서,
    상기 저질량 이온 검출부는;
    상기 생물학적 시료로부터 저질량 이온의 피크 강도(peak intensity)를 검출하여 상기 저질량 이온의 질량 스펙트럼을 추출하는 것을 특징으로 하는 암 진단 장치.
  3. 제2항에 있어서,
    상기 저질량 이온 검출부는;
    질량분석기를 포함하는 것을 특징으로 하는 암 진단 장치.
  4. 제1항에 있어서,
    상기 암 진단부는;
    훈련 후보 집합인 상기 암 환자 및 비환자 케이스들의 저질량 이온 질량 스펙트럼들을 정렬하는 제1정렬수단;
    정렬된 상기 질량 스펙트럼에 대해 생물통계학적 분석을 수행하여 판별 점수를 계산하는 제1판별점수 계산수단;
    상기 판별 점수에 따라 민감도(sensitivity) 및 특이도(specificity)를 계산하고, 이를 기준으로 제1훈련집합을 선정하여 저질량 이온별 인자적재값(factor loading)을 계산하는 인자적재값 계산수단;
    후보 조건을 만족하는 후보 저질량 이온들 중 판별 성능을 기반으로 하여 암 진단용 저질량 이온들을 선택하는 암진단용이온 선정수단;
    판별 대상 생물학적 시료의 저질량 이온 질량 스펙트럼을 상기 제1훈련집합에 정렬하는 제2정렬수단;
    상기 판별 대상의 저질량 이온의 피크 강도와 상기 인자적재값으로부터 판별 점수를 계산하는 제2판별점수 계산수단; 및
    상기 판별 점수에 따라 상기 판별 대상을 암의 양성 또는 음성으로 판정하는 암 판정수단을 포함하는 것을 특징으로 하는 암 진단 장치.
  5. 제4항에 있어서,
    상기 제1판별점수 계산수단은;
    상기 훈련 후보 집합의 상기 저질량 이온 질량 스펙트럼들의 상기 피크 강도들을 정규화(normalization)하는 정규화 모듈;
    상기 정규화한 피크 강도들을 스케일링(scaling)하는 스케일링 모듈; 및
    상기 스케일링된 피크 강도들에 대해 상기 생물통계학적 분석을 수행하여 상기 판별 점수를 계산하는 판별점수계산 모듈을 포함하는 것을 특징으로 하는 암 진단 장치.
  6. 제5항에 있어서,
    상기 스케일링 모듈은;
    파레토 스케일링(Pareto scaling)을 수행하는 것을 특징으로 하는 암 진단 장치.
  7. 제5항에 있어서,
    상기 판별점수계산 모듈은;
    주성분 분석 기반 선형 판별 분석(principal component analysis-based linear discriminant analysis, PCA-DA)을 사용하여 상기 생물통계학적 분석을 수행하는 것을 특징으로 하는 암 진단 장치.
  8. 제7항에 있어서,
    상기 판별점수계산 모듈은;
    상기 주성분 분석 기반 선형 판별 분석에 의해 획득된 인자적재값과 상기 스케일링된 피크 강도를 함께 사용하여 상기 판별 점수를 계산하는 것을 특징으로 하는 암 진단 장치.
  9. 제4항에 있어서,
    상기 인자적재값 계산수단은;
    상기 정렬된 질량 스펙트럼에 대해 생물통계학적 분석을 수행하고, 상기 생물통계학적 분석 결과를 기초로 상기 암 환자 및 비환자 케이스들 중 훈련 조건을 만족하는 훈련 케이스들을 제1훈련집합으로 선택하는 제1훈련집합 선택수단을 포함하며, 상기 제1훈련집합으로부터 인자적재값을 계산하는 것을 특징으로 하는 암 진단 장치.
  10. 제9항에 있어서,
    상기 제1훈련집합 선택수단은;
    상기 생물통계학적 분석 결과에 따른 민감도가 문턱값(threshold) N1 이상이고, 특이도가 문턱값 N2 이상일 때의 암 환자 및 비환자 케이스들을 상기 제1훈련집합으로 설정하는 것을 특징으로 하는 암 진단 장치.
  11. 제10항에 있어서,
    상기 문턱값 N1과 N2는 1인 것을 특징으로 하는 암 진단 장치.
  12. 제4항에 있어서,
    상기 제2판별점수 계산수단은;
    상기 판별 대상의 상기 저질량 이온 질량 스펙트럼의 상기 피크 강도들을 정규화하는 정규화 모듈;
    상기 정규화한 피크 강도들을 스케일링하는 스케일링 모듈; 및
    상기 스케일링된 피크 강도와 상기 인자적재값을 통해 상기 판별 점수를 계산하는 판별점수계산 모듈을 포함하는 것을 특징으로 하는 암 진단 장치.
  13. 제12항에 있어서,
    상기 스케일링 모듈은;
    파레토 스케일링을 수행하는 것을 특징으로 하는 암 진단 장치.
  14. 제12항에 있어서,
    상기 판별점수계산 모듈은;
    상기 암 진단용 저질량 이온들의 상기 스케일링된 피크 강도와 상기 인자적재값을 통해 상기 판별 점수를 계산하는 것을 특징으로 하는 암 진단 장치.
  15. 제4항에 있어서,
    상기 암 판정수단은;
    상기 판별 점수에 따라 상기 판별 대상을 암의 양성 또는 음성으로 판정하되,
    상기 판별 점수가 기준값 S보다 크면 양성으로 상기 판별 대상의 암 정보를 판단하고, 상기 판별 점수가 기준값 S보다 작으면 음성으로 상기 판별 대상의 암 정보를 판단하는 것을 특징으로 하는 암 진단 장치.
  16. 제15항에 있어서,
    상기 기준값 S는 0인 것을 특징으로 하는 암 진단 장치.
  17. 제15항에 있어서,
    상기 암 판정수단은;
    상기 판별 대상의 생물학적 시료를 반복적으로 측정하여 검출한 다수의 상기 저질량 이온 질량 스펙트럼에 대해 계산된 다수의 상기 판별 점수의 평균값으로 상기 판별 대상의 상기 암 정보를 판단하는 것을 특징으로 하는 암 진단 장치.
  18. 제4항에 있어서,
    상기 암진단용이온 선정수단은;
    상기 선택된 상기 제1훈련집합으로부터 후보 조건을 만족하는 후보 저질량 이온들을 후보이온집합으로 선택하는 후보이온집합 선택수단; 및
    상기 선택된 상기 후보이온집합의 상기 후보 저질량 이온의 개별 또는 조합별 판별 성능을 기반으로 하여 암 진단용 저질량 이온들을 최종이온집합으로 선택하는 최종이온집합 선택수단을 포함하는 것을 특징으로 하는 암 진단 장치.
  19. 제18항에 있어서,
    상기 후보이온집합 선택수단은;
    상기 훈련 케이스 각각에 대한 상기 저질량 이온의 상기 피크 강도와, 상기 생물통계학적 분석을 통해 획득된 상기 저질량 이온별 인자적재값의 곱의 절댓값이 문턱값 T1보다 큰 제1저질량 이온들을 상기 훈련 케이스별로 선택하는 제1저질량이온 선택모듈을 포함하는 것을 특징으로 하는 암 진단 장치.
  20. 제19항에 있어서,
    상기 문턱값 T1은 0.1인 것을 특징으로 하는 암 진단 장치.
  21. 제19항에 있어서,
    상기 후보이온집합 선택수단은;
    상기 제1저질량 이온들 중 상기 훈련 케이스들 전체의 문턱값 T2 퍼센트 이상의 케이스들에서 공통으로 나타나는 제2저질량 이온들을 상기 후보이온집합으로 선택하는 후보이온집합 예비선택모듈을 포함하는 것을 특징으로 하는 암 진단 장치.
  22. 제21항에 있어서,
    상기 문턱값 T2는 50인 것을 특징으로 하는 암 진단 장치.
  23. 제21항에 있어서,
    상기 후보이온집합 선택수단은;
    상기 제2저질량 이온들을 이용해 상기 훈련 케이스별로 암에 대한 양성 또는 음성을 나타내는 판별 점수를 계산하고, 상기 판별 점수에 따른 민감도 및 특이도를 계산하는 민감도 및 특이도 계산모듈; 및
    상기 민감도가 문턱값 N3보다 작거나, 상기 특이도가 문턱값 N4보다 작은 경우 상기 T1 및 상기 T2 중 적어도 하나를 변경하고, 상기 과정을 반복하여 상기 후보이온집합으로 선택하는 후보이온집합 최종선택모듈을 더 포함하는 것을 특징으로 하는 암 진단 장치.
  24. 제23항에 있어서,
    상기 문턱값 N3 및 N4는 0.9인 것을 특징으로 하는 암 진단 장치.
  25. 제18항에 있어서,
    상기 최종이온집합 선택수단의 상기 판별 성능의 기준은;
    상기 후보 저질량 이온 중 민감도와 특이도의 합이 기준값보다 큰 이온들을 선택하거나 상기 후보 저질량 이온들로 구성되는 조합별 민감도와 특이도의 합이 비교 대상 조합들 중 가장 큰 조합을 선택하는 제1기준을 포함하는 것을 특징으로 하는 암 진단 장치.
  26. 제18항에 있어서,
    상기 최종이온집합 선택수단의 상기 판별 성능의 기준은;
    상기 후보 저질량 이온들의 조합들 중 상기 후보 저질량 이온들의 개수가 비교 대상 조합들 중 가장 적은 조합을 선택하는 제2기준을 더 포함하는 것을 특징으로 하는 암 진단 장치.
  27. 제18항에 있어서,
    상기 최종이온집합 선택수단의 상기 판별 성능의 기준은;
    상기 후보 저질량 이온들의 조합들 중 진양성(true positive) 케이스의 최소 판별 점수와 진음성(ture negative) 케이스의 최대 판별 점수의 차가 비교 대상 조합들 중 가장 큰 조합을 선택하는 제3기준을 더 포함하며,
    상기 판별 점수는 상기 후보 저질량 이온들의 상기 스케일링된 피크 강도와 상기 인자적재값을 통해 계산되며, 암에 대한 양성 또는 음성을 나타내는 것을 특징으로 하는 암 진단 장치.
  28. 제18항에 있어서,
    상기 최종이온집합 선택수단은;
    상기 후보이온집합에 포함된 상기 후보 저질량 이온들을 상기 민감도가 상기 특이도보다 높은 고민감도 저질량 이온들을 포함하며 상기 고민감도 저질량 이온들을 상기 민감도와 상기 특이도의 합의 내림차순으로 정렬한 고민감도 집합{Sns1, Sns2, Sns3 … SnsI}과, 상기 특이도가 상기 민감도보다 높은 고특이도 저질량 이온들을 포함하며 상기 고특이도 저질량 이온들을 상기 민감도와 상기 특이도의 합의 내림차순으로 정렬한 고특이도 집합{Spc1, Spc2, Spc3 … SpcJ}으로 구분하는 이온 구분모듈;
    상기 고민감도 집합에서 상위 L개의 상기 고민감도 저질량 이온들{Sns1, Sns2, Sns3 … SnsL}과 상기 고특이도 집합에서 상위 L개의 상기 고특이도 저질량 이온들{Spc1, Spc2, Spc3 … SpcL} 중 2개 이상의 저질량 이온들로 구성되는 후보 조합들 중 상기 제1기준, 상기 제2기준 및 상기 제3기준 중 적어도 하나 이상에 의한 상기 판별 성능의 기준에 의해 선택된 조합을 바이오마커 그룹으로 선정하는 바이오마커그룹 예비선정모듈;
    상기 바이오마커 그룹과, 상기 고민감도 집합에서 차상위 M개의 상기 고민감도 저질량 이온들과 상기 고특이도 집합에서 차상위 M개의 상기 고특이도 저질량 이온들 중 적어도 하나 이상의 저질량 이온을 상기 바이오마커 그룹에 추가한 후보 조합들 중 상기 제1기준, 상기 제2기준 및 상기 제3기준 중 적어도 하나 이상에 의한 상기 판별 성능의 기준에 의해 선택된 조합을 상기 바이오마커 그룹으로 재선정하는 바이오마커그룹 재선정모듈; 및
    상기 고민감도 집합 및 상기 고특이도 집합에 차상위 저질량 이온이 존재하지 않을 때까지 상기 재선정 과정을 반복하여 상기 바이오마커 그룹을 최종 선정하는 바이오마커그룹 최종선정모듈을 포함하는 것을 특징으로 하는 암 진단 장치.
  29. 제28항에 있어서,
    상기 최종이온집합 선택수단은;
    상기 후보이온집합에서 상기 바이오마커그룹 최종선정모듈에서 얻어진 상기 바이오마커 그룹으로 선정 완료된 조합의 저질량 이온들을 제외한 잔류 후보이온집합을 대상으로 상기 세 바이오마커 그룹 선정 과정을 반복 수행하여 추가 바이오마커 그룹을 선정하되, 상기 고민감도 집합 또는 상기 고특이도 집합에 상기 L개 미만의 질량 이온이 남을 때까지 상기 추가 바이오마커 그룹을 더 선정하는 바이오마커그룹 추가선정모듈; 및
    상기 바이오마커 그룹과 상기 추가 바이오마커 그룹들 중 진양성 및 진음성 판정의 정확도(accuracy)를 기준으로 상위 K개의 바이오마커 그룹들의 조합의 저질량 이온들을 상기 암 진단용 저질량 이온으로 선택하는 암진단용저질량이온 최종선택모듈을 더 포함하는 것을 특징으로 하는 암 진단 장치.
  30. 제29항에 있어서,
    상기 L값은 2이고, 상기 M값은 1이며, 상기 K값은 1 내지 3 중 어느 하나의 자연수인 것을 특징으로 하는 암 진단 장치.
  31. 제18항에 있어서,
    상기 최종이온집합 선택수단은,
    상기 제1훈련집합에 대해 독립적인 제2훈련집합을 상기 제1훈련집합에 추가한 훈련 집합을 대상으로 저질량 이온 선택 과정을 진행하는 것을 특징으로 하는 암 진단 장치.
  32. 제4항에 있어서,
    상기 다수의 암 환자 케이스들은;
    대장암 환자 케이스들, 유방암 환자 케이스들 및 위암 환자 케이스들 중 어느 하나의 암 환자 케이스들을 포함하는 것을 특징으로 하는 암 진단 장치.
  33. 제1항에 있어서,
    상기 저질량 이온 검출부는;
    다수의 대장암 환자 및 비환자 케이스들의 생물학적 시료로부터 질량분석기를 사용하여 상기 저질량 이온의 피크 강도를 검출하여 상기 저질량 이온의 질량 스펙트럼을 추출하고,
    상기 암 진단부는;
    훈련 후보 집합인 상기 대장암 환자 및 비환자 케이스들의 저질량 이온 질량 스펙트럼들을 정렬하는 제1정렬수단;
    정렬된 상기 질량 스펙트럼에 대해 생물통계학적 분석을 수행하여 판별 점수를 계산하는 제1판별점수 계산수단;
    상기 판별 점수에 따라 민감도 및 특이도를 계산하고, 이를 기준으로 제1훈련집합을 선정하여 저질량 이온별 인자적재값을 계산하는 인자적재값 계산수단;
    후보 조건을 만족하는 후보 저질량 이온들 중 판별 성능을 기반으로 하여 대장암 진단용 저질량 이온들을 선택하는 대장암진단용이온 선정수단;
    판별 대상 생물학적 시료의 저질량 이온 질량 스펙트럼을 상기 제1훈련집합에 정렬하는 제2정렬수단;
    상기 판별 대상의 저질량 이온의 피크 강도와 상기 인자적재값으로부터 판별 점수를 계산하는 제2판별점수 계산수단; 및
    상기 판별 점수에 따라 상기 판별 대상을 대장암의 양성 또는 음성으로 판정하는 대장암 판정수단을 포함하되,
    상기 대장암진단용이온 선정수단은;
    상기 다수의 대장암 환자 및 비환자 케이스들을, 다수의 대장암 환자 케이스들과 다수의 정상인 케이스들로 구성되는 제1종 판별 케이스들과, 상기 다수의 대장암 환자 케이스들과 다수의 대장암 이외의 암 환자 케이스들로 구성되는 제2종 판별 케이스들로 구분하고,
    상기 제1종 판별 케이스들과 상기 제2종 판별 케이스들에 대해 각각 실행되어,
    상기 대장암 진단용 저질량 이온들이, 상기 제1종 판별 케이스에 대한 제1종 대장암 진단용 저질량 이온들과 상기 제2종 판별 케이스에 대한 제2종 대장암 진단용 저질량 이온들로 구분되는 것을 특징으로 하는 암 진단 장치.
  34. 제33항에 있어서,
    상기 제1종 대장암 진단용 저질량 이온들의 질량값은 18.0260, 22.9797, 74.0948, 76.0763, 102.0916, 105.1078, 106.0899, 107.0477, 118.0822, 123.0395, 137.0423, 137.0729, 147.0573, 147.1058, 169.0653, 181.0656, 190.0849, 191.0848, 191.3324, 195.0785, 212.3195, 231.0667, 235.0053, 256.0939, 266.9557, 267.9501, 288.2033, 291.0997, 295.0663, 300.1297, 301.1269, 316.2288, 317.2311, 335.1862, 340.2241, 343.2451, 345.2583, 357.0666, 357.2784, 366.2310, 368.2551, 369.3302, 377.0570, 379.1438, 379.4765, 383.0529, 384.1745, 388.2688, 401.0531, 423.0313, 428.1878, 454.2090, 465.3014, 466.1923, 468.1851, 469.2831, 477.1721, 478.1678, 480.1715, 482.3220, 483.3258, 496.8683, 497.7636, 503.8719, 508.3407, 510.3265, 512.3119, 513.3177, 518.2931, 518.8555, 519.2967, 519.8598, 525.3449, 534.2739, 537.2800, 538.3306, 540.2629, 540.8144, 542.8457, 544.8692, 548.2856, 566.8375, 581.1957, 582.1888, 583.2242, 656.0270, 667.3291, 709.3519, 710.3581, 711.3617, 712.3683, 713.3798, 991.6196, 992.6209, 1016.6113, 1020.4817, 1206.5305, 1207.5571, 1465.6184, 1466.6096, 1467.5969, 2450.9701, 2451.9662 및 2452.9546 m/z (단, 오차 범위는 ±0.1 m/z)로 이루어진 그룹으로부터 선택된 하나 이상의 질량값인 것을 특징으로 하는 암 진단 장치.
  35. 제33항에 있어서,
    상기 제2종 판별 케이스들 중 상기 다수의 대장암 이외의 암 환자 케이스들은 유방암 환자 케이스들, 비호지킨림프종(non-Hodgkin lymphoma, NHL) 환자 케이스들 및 위암 환자 케이스들 중 적어도 하나 이상의 암 환자 케이스들을 포함하되,
    상기 제2종 대장암 진단용 저질량 이온들의 질량값은 60.0476, 138.0540, 172.6653, 173.1158, 179.1451, 191.1277, 279.0855, 280.0895, 280.2642, 281.1440, 296.2574, 312.3248, 332.3224, 333.3324, 369.3406, 465.3161, 486.6356, 488.6882, 544.8908, 551.3287, 566.8737, 707.3475 및 733.3569 m/z (단, 오차 범위는 ±0.1 m/z)로 이루어진 그룹으로부터 선택된 하나 이상의 질량값인 것을 특징으로 하는 암 진단 장치.
  36. 제33항에 있어서,
    상기 판별 점수는 상기 제1종 저질량 이온들에 의한 제1종 판별 점수와 상기 제2종 저질량 이온들에 의한 제2종 판별 점수를 포함하며,
    상기 제1종 판별 점수가 CS11보다 크고, 상기 제2종 판별 점수가 CS21보다 큰 경우에는 상기 판별 대상을 대장암 양성으로 판단하고,
    상기 제1종 판별 점수가 CS12보다 작거나 상기 제2종 판별 점수가 CS22보다 작은 경우에는 상기 판별 대상을 대장암 음성으로 판단하는 것을 특징으로 하는 암 진단 장치.
  37. 제36항에 있어서,
    상기 CS11, CS12, CS21 및 CS22는 0인 것을 특징으로 하는 암 진단 장치.
  38. 제33항에 있어서,
    상기 대장암진단용이온 선정수단을 이용해 획득한 대장암 환자와 정상인을 구분하는 저질량 이온군에는 피브리노겐(fibrinogen) 또는 피브리노겐 알파 체인(fibrinogen alpha chain)이 포함되는 것을 특징으로 하는 암 진단 장치.
  39. 제 33항에 있어서,
    상기 대장암 환자와 정상인을 구분하는 저질량 이온군에는 트랜스타이레틴(transthyretin)이 포함되는 것을 특징으로 하는 암 진단 장치.
  40. 제33항에 있어서,
    상기 제1판별점수 계산수단은;
    상기 훈련 후보 집합의 상기 저질량 이온 질량 스펙트럼들의 상기 피크 강도들을 정규화하는 정규화 모듈;
    상기 정규화한 피크 강도들을 스케일링하는 스케일링 모듈; 및
    상기 스케일링된 피크 강도들에 대해 상기 생물통계학적 분석을 수행하여 상기 판별 점수를 계산하는 판별점수계산 모듈을 포함하는 것을 특징으로 하는 암 진단 장치.
  41. 제40항에 있어서,
    상기 스케일링 모듈은;
    파레토 스케일링을 수행하는 것을 특징으로 하는 암 진단 장치.
  42. 제40항에 있어서,
    상기 판별점수계산 모듈은;
    주성분 분석 기반 선형 판별 분석을 사용하여 상기 생물통계학적 분석을 수행하는 것을 특징으로 하는 암 진단 장치.
  43. 제42항에 있어서,
    상기 판별점수계산 모듈은;
    상기 주성분 분석 기반 선형 판별 분석에 의해 획득된 인자적재값과 상기 스케일링된 피크 강도를 함께 사용하여 상기 판별 점수를 계산하는 것을 특징으로 하는 암 진단 장치.
  44. 제33항에 있어서,
    상기 인자적재값 계산수단은;
    상기 정렬된 질량 스펙트럼에 대해 생물통계학적 분석을 수행하고, 상기 생물통계학적 분석 결과를 기초로 상기 대장암 환자 및 비환자 케이스들 중 훈련 조건을 만족하는 훈련 케이스들을 제1훈련집합으로 선택하는 제1훈련집합 선택수단을 포함하며, 상기 제1훈련집합으로부터 인자적재값을 계산하는 것을 특징으로 하는 암 진단 장치.
  45. 제44항에 있어서,
    상기 제1훈련집합 선택수단은;
    상기 생물통계학적 분석 결과에 따른 민감도가 문턱값 CN1 이상이고, 특이도가 문턱값 CN2 이상일 때의 대장암 환자 및 비환자 케이스들을 상기 제1훈련집합으로 설정하는 것을 특징으로 하는 암 진단 장치.
  46. 제45항에 있어서,
    상기 문턱값 CN1과 CN2는 1인 것을 특징으로 하는 암 진단 장치.
  47. 제33항에 있어서,
    상기 제2판별점수 계산수단은;
    상기 판별 대상의 상기 저질량 이온 질량 스펙트럼의 상기 피크 강도들을 정규화하는 정규화 모듈;
    상기 정규화한 피크 강도들을 스케일링하는 스케일링 모듈; 및
    상기 스케일링된 피크 강도와 상기 인자적재값을 통해 상기 판별 점수를 계산하는 판별점수계산 모듈을 포함하는 것을 특징으로 하는 암 진단 장치.
  48. 제47항에 있어서,
    상기 스케일링 모듈은;
    파레토 스케일링을 수행하는 것을 특징으로 하는 암 진단 장치.
  49. 제47항에 있어서,
    상기 판별점수계산 모듈은;
    상기 대장암 진단용 저질량 이온들의 상기 스케일링된 피크 강도와 상기 인자적재값을 통해 상기 판별 점수를 계산하는 것을 특징으로 하는 암 진단 장치.
  50. 제33항에 있어서,
    상기 대장암 판정수단은;
    상기 판별 점수에 따라 상기 판별 대상을 대장암의 양성 또는 음성으로 판정하되,
    상기 판별 점수가 기준값 CS보다 크면 양성으로 상기 판별 대상의 대장암 정보를 판단하고, 상기 판별 점수가 기준값 CS보다 작으면 음성으로 상기 판별 대상의 대장암 정보를 판단하는 것을 특징으로 하는 암 진단 장치.
  51. 제50항에 있어서,
    상기 기준값 CS는 0인 것을 특징으로 하는 암 진단 장치.
  52. 제33항에 있어서,
    상기 대장암 판정수단은;
    상기 판별 대상의 생물학적 시료를 반복적으로 측정하여 검출한 다수의 상기 저질량 이온 질량 스펙트럼에 대해 계산된 다수의 상기 판별 점수의 평균값으로 상기 판별 대상의 상기 대장암 정보를 판단하는 것을 특징으로 하는 암 진단 장치.
  53. 제33항에 있어서,
    상기 대장암진단용이온 선정수단은;
    상기 선택된 상기 제1훈련집합으로부터 후보 조건을 만족하는 후보 저질량 이온들을 후보이온집합으로 선택하는 후보이온집합 선택수단; 및
    상기 선택된 상기 후보이온집합의 상기 후보 저질량 이온의 개별 또는 조합별 판별 성능을 기반으로 하여 대장암 진단용 저질량 이온들을 최종이온집합으로 선택하는 최종이온집합 선택수단을 포함하는 것을 특징으로 하는 암 진단 장치.
  54. 제53항에 있어서,
    상기 후보이온집합 선택수단은;
    상기 훈련 케이스 각각에 대한 상기 저질량 이온의 상기 피크 강도와, 상기 생물통계학적 분석을 통해 획득된 상기 저질량 이온별 인자적재값의 곱의 절댓값이 문턱값 CT1보다 큰 제1저질량 이온들을 상기 훈련 케이스별로 선택하는 제1저질량이온 선택모듈을 포함하는 것을 특징으로 하는 암 진단 장치.
  55. 제54항에 있어서,
    상기 문턱값 CT1은 0.1인 것을 특징으로 하는 암 진단 장치.
  56. 제54항에 있어서,
    상기 후보이온집합 선택수단은;
    상기 제1저질량 이온들 중 상기 훈련 케이스들 전체의 문턱값 CT2 퍼센트 이상의 케이스들에서 공통으로 나타나는 제2저질량 이온들을 상기 후보이온집합으로 선택하는 후보이온집합 예비선택모듈을 포함하는 것을 특징으로 하는 암 진단 장치.
  57. 제56항에 있어서,
    상기 문턱값 CT2는 50인 것을 특징으로 하는 암 진단 장치.
  58. 제56항에 있어서,
    상기 후보이온집합 선택수단은;
    상기 제2저질량 이온들을 이용해 상기 훈련 케이스별로 대장암에 대한 양성 또는 음성을 나타내는 판별 점수를 계산하고, 상기 판별 점수에 따른 민감도 및 특이도를 계산하는 민감도 및 특이도 계산모듈; 및
    상기 민감도가 문턱값 CN3보다 작거나, 상기 특이도가 문턱값 CN4보다 작은 경우 상기 CT1 및 상기 CT2 중 적어도 하나를 변경하고, 상기 과정을 반복하여 상기 후보이온집합으로 선택하는 후보이온집합 최종선택모듈을 더 포함하는 것을 특징으로 하는 암 진단 장치.
  59. 제58항에 있어서,
    상기 문턱값 CN3 및 CN4는 0.9인 것을 특징으로 하는 암 진단 장치.
  60. 제53항에 있어서,
    상기 최종이온집합 선택수단의 상기 판별 성능의 기준은;
    상기 후보 저질량 이온 중 민감도와 특이도의 합이 기준값보다 큰 이온들을 선택하거나 상기 후보 저질량 이온들로 구성되는 조합별 민감도와 특이도의 합이 비교 대상 조합들 중 가장 큰 조합을 선택하는 제1기준을 포함하는 것을 특징으로 하는 암 진단 장치.
  61. 제53항에 있어서,
    상기 최종이온집합 선택수단의 상기 판별 성능의 기준은;
    상기 후보 저질량 이온들의 조합들 중 상기 후보 저질량 이온들의 개수가 비교 대상 조합들 중 가장 적은 조합을 선택하는 제2기준을 더 포함하는 것을 특징으로 하는 암 진단 장치.
  62. 제53항에 있어서,
    상기 최종이온집합 선택수단의 상기 판별 성능의 기준은;
    상기 후보 저질량 이온들의 조합들 중 진양성(true positive) 케이스의 최소 판별 점수와 진음성(ture negative) 케이스의 최대 판별 점수의 차가 비교 대상 조합들 중 가장 큰 조합을 선택하는 제3기준을 더 포함하며,
    상기 판별 점수는 상기 후보 저질량 이온들의 상기 스케일링된 피크 강도와 상기 인자적재값을 통해 계산되며, 대장암에 대한 양성 또는 음성을 나타내는 것을 특징으로 하는 암 진단 장치.
  63. 제53항에 있어서,
    상기 최종이온집합 선택수단은;
    상기 후보이온집합에 포함된 상기 후보 저질량 이온들을 상기 민감도가 상기 특이도보다 높은 고민감도 저질량 이온들을 포함하며 상기 고민감도 저질량 이온들을 상기 민감도와 상기 특이도의 합의 내림차순으로 정렬한 고민감도 집합{Sns1, Sns2, Sns3 … SnsI}과, 상기 특이도가 상기 민감도보다 높은 고특이도 저질량 이온들을 포함하며 상기 고특이도 저질량 이온들을 상기 민감도와 상기 특이도의 합의 내림차순으로 정렬한 고특이도 집합{Spc1, Spc2, Spc3 … SpcJ}으로 구분하는 이온 구분모듈;
    상기 고민감도 집합에서 상위 L개의 상기 고민감도 저질량 이온들{Sns1, Sns2, Sns3 … SnsL}과 상기 고특이도 집합에서 상위 L개의 상기 고특이도 저질량 이온들{Spc1, Spc2, Spc3 … SpcL} 중 2개 이상의 저질량 이온들로 구성되는 후보 조합들 중 상기 제1기준, 상기 제2기준 및 상기 제3기준 중 적어도 하나 이상에 의한 상기 판별 성능의 기준에 의해 선택된 조합을 바이오마커 그룹으로 선정하는 바이오마커그룹 예비선정모듈;
    상기 바이오마커 그룹과, 상기 고민감도 집합에서 차상위 M개의 상기 고민감도 저질량 이온들과 상기 고특이도 집합에서 차상위 M개의 상기 고특이도 저질량 이온들 중 적어도 하나 이상의 저질량 이온을 상기 바이오마커 그룹에 추가한 후보 조합들 중 상기 제1기준, 상기 제2기준 및 상기 제3기준 중 적어도 하나 이상에 의한 상기 판별 성능의 기준에 의해 선택된 조합을 상기 바이오마커 그룹으로 재선정하는 바이오마커그룹 재선정모듈; 및
    상기 고민감도 집합 및 상기 고특이도 집합에 차상위 저질량 이온이 존재하지 않을 때까지 상기 재선정 과정을 반복하여 상기 바이오마커 그룹을 최종 선정하는 바이오마커그룹 최종선정모듈을 포함하는 것을 특징으로 하는 암 진단 장치.
  64. 제63항에 있어서,
    상기 최종이온집합 선택수단은;
    상기 후보이온집합에서 상기 바이오마커그룹 최종선정모듈에서 얻어진 상기 바이오마커 그룹으로 선정 완료된 조합의 저질량 이온들을 제외한 잔류 후보이온집합을 대상으로 상기 세 바이오마커 그룹 선정 과정을 반복 수행하여 추가 바이오마커 그룹을 선정하되, 상기 고민감도 집합 또는 상기 고특이도 집합에 상기 L개 미만의 질량 이온이 남을 때까지 상기 추가 바이오마커 그룹을 더 선정하는 바이오마커그룹 추가선정모듈; 및
    상기 바이오마커 그룹과 상기 추가 바이오마커 그룹들 중 진양성 및 진음성 판정의 정확도(accuracy)를 기준으로 상위 K개의 바이오마커 그룹들의 조합의 저질량 이온들을 상기 대장암 진단용 저질량 이온으로 선택하는 암진단용저질량이온 최종선택모듈을 더 포함하는 것을 특징으로 하는 암 진단 장치.
  65. 제64항에 있어서,
    상기 L값은 2이고, 상기 M값은 1이며, 상기 K값은 1 내지 3 중 어느 하나의 자연수인 것을 특징으로 하는 암 진단 장치.
  66. 제53항에 있어서,
    상기 최종이온집합 선택수단은,
    상기 제1훈련집합에 대해 독립적인 제2훈련집합을 상기 제1훈련집합에 추가한 훈련 집합을 대상으로 저질량 이온 선택 과정을 진행하는 것을 특징으로 하는 암 진단 장치.
  67. 제1항에 있어서,
    상기 저질량 이온 검출부는;
    다수의 유방암 환자 및 비환자 케이스들의 생물학적 시료로부터 질량분석기를 사용하여 상기 저질량 이온의 피크 강도를 검출하여 상기 저질량 이온의 질량 스펙트럼을 추출하고,
    상기 암 진단부는;
    훈련 후보 집합인 상기 유방암 환자 및 비환자 케이스들의 저질량 이온 질량 스펙트럼들을 정렬하는 제1정렬수단;
    정렬된 상기 질량 스펙트럼에 대해 생물통계학적 분석을 수행하여 판별 점수를 계산하는 제1판별점수 계산수단;
    상기 판별 점수에 따라 민감도 및 특이도를 계산하고, 이를 기준으로 제1훈련집합을 선정하여 저질량 이온별 인자적재값을 계산하는 인자적재값 계산수단;
    후보 조건을 만족하는 후보 저질량 이온들 중 판별 성능을 기반으로 하여 유방암 진단용 저질량 이온들을 선택하는 유방암진단용이온 선정수단;
    판별 대상 생물학적 시료의 저질량 이온 질량 스펙트럼을 상기 제1훈련집합에 정렬하는 제2정렬수단;
    상기 판별 대상의 저질량 이온의 피크 강도와 상기 인자적재값으로부터 판별 점수를 계산하는 제2판별점수 계산수단; 및
    상기 판별 점수에 따라 상기 판별 대상을 유방암의 양성 또는 음성으로 판정하는 유방암 판정수단을 포함하되,
    상기 유방암진단용이온 선정수단은;
    상기 다수의 유방암 환자 및 비환자 케이스들을 제1종 판별 케이스들로 구성하거나,
    상기 다수의 유방암 환자 및 비환자 케이스들을, 다수의 유방암 환자 케이스들과 다수의 정상인 케이스들로 구성되는 제2종 판별 케이스들과, 상기 다수의 유방암 환자 케이스들과 다수의 유방암 이외의 암 환자 케이스들로 구성되는 제3종 판별 케이스들로 구분하고,
    상기 제1종 판별 케이스들과, 상기 제2종 판별 케이스들 및 상기 제3종 판별 케이스들에 대해 각각 실행되어,
    상기 유방암 진단용 저질량 이온들이, 상기 제1종 판별 케이스에 대한 제1종 유방암 진단용 저질량 이온들과, 상기 제2종 판별 케이스에 대한 제2종 유방암 진단용 저질량 이온들 및 상기 제3종 판별 케이스에 대한 제3종 유방암 진단용 저질량 이온들로 구분되는 것을 특징으로 하는 암 진단 장치.
  68. 제67항에 있어서,
    상기 제1종 판별 케이스들 중 상기 유방암 비환자 케이스들은 정상인 케이스들, 대장암 환자 케이스들, 비호지킨림프종(non-Hodgkin lymphoma, NHL) 환자 케이스들 및 위암 환자 케이스들 중 적어도 하나 이상의 케이스들을 포함하되,
    상기 제1종 유방암 진단용 저질량 이온들의 질량값은 74.0937, 74.1155, 76.0728, 136.1067, 173.4872, 193.0665, 208.0565, 212.0949, 231.0726, 258.1364, 279.0841, 280.0847, 282.2777, 313.2638, 331.2024, 332.3181, 401.0588, 427.3441, 432.9954, 452.2269, 476.6038, 490.3427, 498.3237, 499.3265, 512.3145, 562.3074, 583.2323, 584.2415, 646.3851 m/z (단, 오차 범위는 ±0.1 m/z)로 이루어진 그룹으로부터 선택된 하나 이상의 질량값인 것을 특징으로 하는 암 진단 장치.
  69. 제67항에 있어서,
    상기 제2종 유방암 진단용 저질량 이온들의 질량값은 38.9779, 46.0647, 74.1164, 76.0733, 97.0686, 122.0777, 123.0821, 130.1539, 185.7723, 191.1175, 208.0530, 212.0960, 225.1870, 229.0005, 231.0675, 244.0962, 281.0913, 284.3205, 313.2618, 332.3150, 342.2482, 368.2624, 398.3034, 416.0901, 424.3216, 426.3389, 428.1885, 497.3194, 513.3193, 532.6918, 538.3428, 540.3250, 570.3234, 580.3281, 581.2310, 581.3377, 610.3273, 616.3286, 618.3352, 646.3959, 725.3469, 757.1117 m/z (단, 오차 범위는 ±0.1 m/z)로 이루어진 그룹으로부터 선택된 하나 이상의 질량값인 것을 특징으로 하는 암 진단 장치.
  70. 제67항에 있어서,
    상기 제3종 판별 케이스들 중 상기 다수의 유방암 이외의 암 환자 케이스들은 대장암 환자 케이스들, 비호지킨림프종 환자 케이스들 및 위암 환자 케이스들 중 적어도 하나 이상의 암 환자 케이스들을 포함하되,
    상기 제3종 유방암 진단용 저질량 이온들의 질량값은 38.9736, 38.9892, 44.0491, 44.0656, 74.0938, 87.0991, 104.1316, 104.3161, 105.1091, 136.1021, 155.1798, 156.0412, 172.3072, 178.1330, 182.0738, 189.9525, 192.1294, 193.0660, 196.0871, 212.3221, 217.0923, 222.0231, 228.0348, 231.0726, 234.0422, 260.1013, 279.0843, 280.0849, 282.2791, 289.2960, 298.3425, 313.2630, 316.3269, 331.2036, 332.3169, 333.3233, 337.1047, 424.3272, 426.3406, 432.9948, 433.9894, 446.0196, 454.3014, 469.2924, 478.8688, 479.8724, 480.3180, 483.3301, 487.3152, 488.3287, 488.6580, 496.4331, 496.7718, 497.7764, 502.8741, 511.3367, 518.8776, 520.8826, 534.2829, 535.2882, 542.8770, 544.7878, 544.8728, 546.3358, 559.2911, 568.1146, 583.2284, 731.3330, 733.3526, 734.3563, 735.3665, 757.0995, 757.3512, 1465.5872, 1466.5971 m/z (단, 오차 범위는 ±0.1 m/z)로 이루어진 그룹으로부터 선택된 하나 이상의 질량값인 것을 특징으로 하는 암 진단 장치.
  71. 제67항에 있어서,
    상기 판별 점수는 상기 제1종 저질량 이온들에 의한 제1종 판별 점수이며,
    상기 판별 점수가 BS11보다 큰 경우에는 상기 판별 대상을 유방암 양성으로 판단하고,
    상기 판별 점수가 BS12보다 작은 경우에는 상기 판별 대상을 유방암 음성으로 판단하는 것을 특징으로 하는 암 진단 장치.
  72. 제71항에 있어서,
    상기 BS11 및 BS12는 0인 것을 특징으로 하는 암 진단 장치.
  73. 제67항에 있어서,
    상기 판별 점수는 상기 제2종 저질량 이온들에 의한 제2종 판별 점수와 상기 제3종 저질량 이온들에 의한 제3종 판별 점수를 포함하며,
    상기 제2종 판별 점수가 BS21보다 크고 상기 제3종 판별 점수가 BS31보다 큰 경우에는 상기 판별 대상을 유방암 양성으로 판단하고,
    상기 제2종 판별 점수가 BS22보다 작거나 상기 제3종 판별 점수가 BS32보다 작은 경우에는 상기 판별 대상을 유방암 음성으로 판단하는 것을 특징으로 하는 암 진단 장치.
  74. 제73항에 있어서,
    상기 BS21, BS22, BS31 및 BS32는 0인 것을 특징으로 하는 암 진단 장치.
  75. 제67항에 있어서,
    상기 제1판별점수 계산수단은;
    상기 훈련 후보 집합의 상기 저질량 이온 질량 스펙트럼들의 상기 피크 강도들을 정규화하는 정규화 모듈;
    상기 정규화한 피크 강도들을 스케일링하는 스케일링 모듈; 및
    상기 스케일링된 피크 강도들에 대해 상기 생물통계학적 분석을 수행하여 상기 판별 점수를 계산하는 판별점수계산 모듈을 포함하는 것을 특징으로 하는 암 진단 장치.
  76. 제75항에 있어서,
    상기 스케일링 모듈은;
    파레토 스케일링을 수행하는 것을 특징으로 하는 암 진단 장치.
  77. 제75항에 있어서,
    상기 판별점수계산 모듈은;
    주성분 분석 기반 선형 판별 분석을 사용하여 상기 생물통계학적 분석을 수행하는 것을 특징으로 하는 암 진단 장치.
  78. 제77항에 있어서,
    상기 판별점수계산 모듈은;
    상기 주성분 분석 기반 선형 판별 분석에 의해 획득된 인자적재값과 상기 스케일링된 피크 강도를 함께 사용하여 상기 판별 점수를 계산하는 것을 특징으로 하는 암 진단 장치.
  79. 제67항에 있어서,
    상기 인자적재값 계산수단은;
    상기 정렬된 질량 스펙트럼에 대해 생물통계학적 분석을 수행하고, 상기 생물통계학적 분석 결과를 기초로 상기 유방암 환자 및 비환자 케이스들 중 훈련 조건을 만족하는 훈련 케이스들을 제1훈련집합으로 선택하는 제1훈련집합 선택수단을 포함하며, 상기 제1훈련집합으로부터 인자적재값을 계산하는 것을 특징으로 하는 암 진단 장치.
  80. 제79항에 있어서,
    상기 제1훈련집합 선택수단은;
    상기 생물통계학적 분석 결과에 따른 민감도가 문턱값 BN1 이상이고, 특이도가 문턱값 BN2 이상일 때의 유방암 환자 및 비환자 케이스들을 상기 제1훈련집합으로 설정하는 것을 특징으로 하는 암 진단 장치.
  81. 제80항에 있어서,
    상기 문턱값 BN1과 BN2는 1인 것을 특징으로 하는 암 진단 장치.
  82. 제67항에 있어서,
    상기 제2판별점수 계산수단은;
    상기 판별 대상의 상기 저질량 이온 질량 스펙트럼의 상기 피크 강도들을 정규화하는 정규화 모듈;
    상기 정규화한 피크 강도들을 스케일링하는 스케일링 모듈; 및
    상기 스케일링된 피크 강도와 상기 인자적재값을 통해 상기 판별 점수를 계산하는 판별점수계산 모듈을 포함하는 것을 특징으로 하는 암 진단 장치.
  83. 제82항에 있어서,
    상기 스케일링 모듈은;
    파레토 스케일링을 수행하는 것을 특징으로 하는 암 진단 장치.
  84. 제82항에 있어서,
    상기 판별점수계산 모듈은;
    상기 유방암 진단용 저질량 이온들의 상기 스케일링된 피크 강도와 상기 인자적재값을 통해 상기 판별 점수를 계산하는 것을 특징으로 하는 암 진단 장치.
  85. 제67항에 있어서,
    상기 유방암 판정수단은;
    상기 판별 점수에 따라 상기 판별 대상을 유방암의 양성 또는 음성으로 판정하되,
    상기 판별 점수가 기준값 BS보다 크면 양성으로 상기 판별 대상의 유방암 정보를 판단하고, 상기 판별 점수가 기준값 BS보다 작으면 상기 유방암 정보를 판단하는 것을 특징으로 하는 암 진단 장치.
  86. 제85항에 있어서,
    상기 기준값 BS는 0인 것을 특징으로 하는 암 진단 장치.
  87. 제67항에 있어서,
    상기 유방암 판정수단은;
    상기 판별 대상의 생물학적 시료를 반복적으로 측정하여 검출한 다수의 상기 저질량 이온 질량 스펙트럼에 대해 계산된 다수의 상기 판별 점수의 평균값으로 상기 판별 대상의 상기 유방암 정보를 판단하는 것을 특징으로 하는 암 진단 장치.
  88. 제67항에 있어서,
    상기 유방암진단용이온 선정수단은;
    상기 선택된 상기 제1훈련집합으로부터 후보 조건을 만족하는 후보 저질량 이온들을 후보이온집합으로 선택하는 후보이온집합 선택수단; 및
    상기 선택된 상기 후보이온집합의 상기 후보 저질량 이온의 개별 또는 조합별 판별 성능을 기반으로 하여 유방암 진단용 저질량 이온들을 최종이온집합으로 선택하는 최종이온집합 선택수단을 포함하는 것을 특징으로 하는 암 진단 장치.
  89. 제88항에 있어서,
    상기 후보이온집합 선택수단은;
    상기 훈련 케이스 각각에 대한 상기 저질량 이온의 상기 피크 강도와, 상기 생물통계학적 분석을 통해 획득된 상기 저질량 이온별 인자적재값의 곱의 절댓값이 문턱값 BT1보다 큰 제1저질량 이온들을 상기 훈련 케이스별로 선택하는 제1저질량이온 선택모듈을 포함하는 것을 특징으로 하는 암 진단 장치.
  90. 제89항에 있어서,
    상기 문턱값 BT1은 0.1인 것을 특징으로 하는 암 진단 장치.
  91. 제89항에 있어서,
    상기 후보이온집합 선택수단은;
    상기 제1저질량 이온들 중 상기 훈련 케이스들 전체의 문턱값 BT2 퍼센트 이상의 케이스들에서 공통으로 나타나는 제2저질량 이온들을 상기 후보이온집합으로 선택하는 후보이온집합 예비선택모듈을 포함하는 것을 특징으로 하는 암 진단 장치.
  92. 제91항에 있어서,
    상기 문턱값 BT2는 50인 것을 특징으로 하는 암 진단 장치.
  93. 제91항에 있어서,
    상기 후보이온집합 선택수단은;
    상기 제2저질량 이온들을 이용해 상기 훈련 케이스별로 유방암에 대한 양성 또는 음성을 나타내는 판별 점수를 계산하고, 상기 판별 점수에 따른 민감도 및 특이도를 계산하는 민감도 및 특이도 계산모듈; 및
    상기 민감도가 문턱값 BN3보다 작거나, 상기 특이도가 문턱값 BN4보다 작은 경우 상기 BT1 및 상기 BT2 중 적어도 하나를 변경하고, 상기 과정을 반복하여 상기 후보이온집합으로 선택하는 후보이온집합 최종선택모듈을 더 포함하는 것을 특징으로 하는 암 진단 장치.
  94. 제93항에 있어서,
    상기 문턱값 BN3 및 BN4는 0.9인 것을 특징으로 하는 암 진단 장치.
  95. 제88항에 있어서,
    상기 최종이온집합 선택수단의 상기 판별 성능의 기준은;
    상기 후보 저질량 이온 중 민감도와 특이도의 합이 기준값보다 큰 이온들을 선택하거나 상기 후보 저질량 이온들로 구성되는 조합별 민감도와 특이도의 합이 비교 대상 조합들 중 가장 큰 조합을 선택하는 제1기준을 포함하는 것을 특징으로 하는 암 진단 장치.
  96. 제88항에 있어서,
    상기 최종이온집합 선택수단의 상기 판별 성능의 기준은;
    상기 후보 저질량 이온들의 조합들 중 상기 후보 저질량 이온들의 개수가 비교 대상 조합들 중 가장 적은 조합을 선택하는 제2기준을 더 포함하는 것을 특징으로 하는 암 진단 장치.
  97. 제88항에 있어서,
    상기 최종이온집합 선택수단의 상기 판별 성능의 기준은;
    상기 후보 저질량 이온들의 조합들 중 진양성(true positive) 케이스의 최소 판별 점수와 진음성(ture negative) 케이스의 최대 판별 점수의 차가 비교 대상 조합들 중 가장 큰 조합을 선택하는 제3기준을 더 포함하며,
    상기 판별 점수는 상기 후보 저질량 이온들의 상기 스케일링된 피크 강도와 상기 인자적재값을 통해 계산되며, 유방암에 대한 양성 또는 음성을 나타내는 것을 특징으로 하는 암 진단 장치.
  98. 제88항에 있어서,
    상기 최종이온집합 선택수단은;
    상기 후보이온집합에 포함된 상기 후보 저질량 이온들을 상기 민감도가 상기 특이도보다 높은 고민감도 저질량 이온들을 포함하며 상기 고민감도 저질량 이온들을 상기 민감도와 상기 특이도의 합의 내림차순으로 정렬한 고민감도 집합{Sns1, Sns2, Sns3 … SnsI}과, 상기 특이도가 상기 민감도보다 높은 고특이도 저질량 이온들을 포함하며 상기 고특이도 저질량 이온들을 상기 민감도와 상기 특이도의 합의 내림차순으로 정렬한 고특이도 집합{Spc1, Spc2, Spc3 … SpcJ}으로 구분하는 이온 구분모듈;
    상기 고민감도 집합에서 상위 L개의 상기 고민감도 저질량 이온들{Sns1, Sns2, Sns3 … SnsL}과 상기 고특이도 집합에서 상위 L개의 상기 고특이도 저질량 이온들{Spc1, Spc2, Spc3 … SpcL} 중 2개 이상의 저질량 이온들로 구성되는 후보 조합들 중 상기 제1기준, 상기 제2기준 및 상기 제3기준 중 적어도 하나 이상에 의한 상기 판별 성능의 기준에 의해 선택된 조합을 바이오마커 그룹으로 선정하는 바이오마커그룹 예비선정모듈;
    상기 바이오마커 그룹과, 상기 고민감도 집합에서 차상위 M개의 상기 고민감도 저질량 이온들과 상기 고특이도 집합에서 차상위 M개의 상기 고특이도 저질량 이온들 중 적어도 하나 이상의 저질량 이온을 상기 바이오마커 그룹에 추가한 후보 조합들 중 상기 제1기준, 상기 제2기준 및 상기 제3기준 중 적어도 하나 이상에 의한 상기 판별 성능의 기준에 의해 선택된 조합을 상기 바이오마커 그룹으로 재선정하는 바이오마커그룹 재선정모듈; 및
    상기 고민감도 집합 및 상기 고특이도 집합에 차상위 저질량 이온이 존재하지 않을 때까지 상기 재선정 과정을 반복하여 상기 바이오마커 그룹을 최종 선정하는 바이오마커그룹 최종선정모듈을 포함하는 것을 특징으로 하는 암 진단 장치.
  99. 제98항에 있어서,
    상기 최종이온집합 선택수단은;
    상기 후보이온집합에서 상기 바이오마커그룹 최종선정모듈에서 얻어진 상기 바이오마커 그룹으로 선정 완료된 조합의 저질량 이온들을 제외한 잔류 후보이온집합을 대상으로 상기 세 바이오마커 그룹 선정 과정을 반복 수행하여 추가 바이오마커 그룹을 선정하되, 상기 고민감도 집합 또는 상기 고특이도 집합에 상기 L개 미만의 질량 이온이 남을 때까지 상기 추가 바이오마커 그룹을 더 선정하는 바이오마커그룹 추가선정모듈; 및
    상기 바이오마커 그룹과 상기 추가 바이오마커 그룹들 중 진양성 및 진음성 판정의 정확도(accuracy)를 기준으로 상위 K개의 바이오마커 그룹들의 조합의 저질량 이온들을 상기 유방암 진단용 저질량 이온으로 선택하는 암진단용저질량이온 최종선택모듈을 더 포함하는 것을 특징으로 하는 암 진단 장치.
  100. 제99항에 있어서,
    상기 L값은 2이고, 상기 M값은 1이며, 상기 K값은 1 내지 3 중 어느 하나의 자연수인 것을 특징으로 하는 암 진단 장치.
  101. 제88항에 있어서,
    상기 최종이온집합 선택수단은,
    상기 제1훈련집합에 대해 독립적인 제2훈련집합을 상기 제1훈련집합에 추가한 훈련 집합을 대상으로 저질량 이온 선택 과정을 진행하는 것을 특징으로 하는 암 진단 장치.
  102. 제1항에 있어서,
    상기 저질량 이온 검출부는;
    다수의 위암 환자 및 비환자 케이스들의 생물학적 시료로부터 질량분석기를 사용하여 상기 저질량 이온의 피크 강도를 검출하여 상기 저질량 이온의 질량 스펙트럼을 추출하고,
    상기 암 진단부는;
    훈련 후보 집합인 상기 위암 환자 및 비환자 케이스들의 저질량 이온 질량 스펙트럼들을 정렬하는 제1정렬수단;
    정렬된 상기 질량 스펙트럼에 대해 생물통계학적 분석을 수행하여 판별 점수를 계산하는 제1판별점수 계산수단;
    상기 판별 점수에 따라 민감도 및 특이도를 계산하고, 이를 기준으로 제1훈련집합을 선정하여 저질량 이온별 인자적재값을 계산하는 인자적재값 계산수단;
    후보 조건을 만족하는 후보 저질량 이온들 중 판별 성능을 기반으로 하여 위암 진단용 저질량 이온들을 선택하는 위암진단용이온 선정수단;
    판별 대상 생물학적 시료의 저질량 이온 질량 스펙트럼을 상기 제1훈련집합에 정렬하는 제2정렬수단;
    상기 판별 대상의 저질량 이온의 피크 강도와 상기 인자적재값으로부터 판별 점수를 계산하는 제2판별점수 계산수단; 및
    상기 판별 점수에 따라 상기 판별 대상을 위암의 양성 또는 음성으로 판정하는 위암 판정수단을 포함하되,
    상기 위암진단용이온 선정수단은;
    상기 다수의 위암 환자 및 비환자 케이스들을, 다수의 위암 환자 케이스들과 다수의 정상인 케이스들로 구성되는 제1종 판별 케이스들과, 상기 다수의 위암 환자 케이스들과 다수의 대장암 환자 케이스들로 구성되는 제2종 판별 케이스들과, 상기 다수의 위암 환자 케이스들과 다수의 유방암 환자 케이스들로 구성되는 제3종 판별 케이스들과, 상기 다수의 위암 환자 케이스들과 다수의 비호지킨림프종(non-Hodgkin lymphoma, NHL) 환자 케이스들로 구성되는 제4종 판별 케이스들로 구분하거나,
    상기 다수의 위암 환자 및 비환자 케이스들을, 상기 제1종 판별 케이스들과 상기 다수의 위암 환자 및 정상인 케이스들과 다수의 대장암, 유방암 및 비호지킨림프종 환자 케이스들로 구성되는 제5종 판별 케이스들로 구분하고,
    상기 제1종 판별 케이스들, 상기 제2종 판별 케이스들, 상기 제3종 판별 케이스들, 상기 제4종 판별 케이스들 및 상기 제5종 판별 케이스들에 대해 각각 실행되어,
    상기 위암 진단용 저질량 이온들이, 상기 제1종 판별 케이스에 대한 제1종 위암 진단용 저질량 이온들, 상기 제2종 판별 케이스에 대한 제2종 위암 진단용 저질량 이온들, 상기 제3종 판별 케이스에 대한 제3종 위암 진단용 저질량 이온들, 상기 제4종 판별 케이스에 대한 제4종 위암 진단용 저질량 이온들 및 상기 제5종 판별 케이스에 대한 제5종 위암 진단용 저질량 이온들로 구분되는 것을 특징으로 하는 암 진단 장치.
  103. 제102항에 있어서,
    상기 제1종 위암 진단용 저질량 이온들의 질량값은 22.9851, 87.0959, 123.0842, 314.2151, 324.1365, 366.2424, 488.6538, 490.3374, 526.3426, 532.3719, 576.2893, 606.2658, 616.1397, 1466.5612 m/z (단, 오차 범위는 ±0.1 m/z)로 이루어진 그룹으로부터 선택된 하나 이상의 질량값인 것을 특징으로 하는 암 진단 장치.
  104. 제102항에 있어서,
    상기 제2종 위암 진단용 저질량 이온들의 질량값은 18.0260, 22.9830, 38.9752, 72.0788, 86.1216, 122.0584, 137.0721, 144.1092, 156.0171, 172.3740, 172.6583, 207.0729, 265.2034, 356.1278, 380.1643, 381.0949, 401.0680, 431.9882, 442.3197, 445.0278, 458.3228, 489.3564, 489.5293, 490.2775, 490.3586, 525.3611, 528.3633, 535.2970, 553.3205, 557.4392, 584.2675, 585.2726, 587.2805, 710.3687, 946.4028, 1466.6433 m/z (단, 오차 범위는 ±0.1 m/z)로 이루어진 그룹으로부터 선택된 하나 이상의 질량값인 것을 특징으로 하는 암 진단 장치.
  105. 제102항에 있어서,
    상기 제3종 위암 진단용 저질량 이온들의 질량값은 22.9852, 74.0764, 104.1387, 105.1157, 106.0555, 148.0788, 173.4924, 176.1198, 184.1123, 212.1032, 217.9461, 226.0798, 228.0046, 284.3291, 299.1308, 299.3423, 314.2316, 338.1143, 377.0710, 387.9830, 426.3417, 427.3321, 430.3313, 432.9929, 456.2963, 459.2425, 480.3312, 481.3399, 482.3368, 487.3295, 488.3316, 490.3400, 496.8846, 506.9148, 509.3577, 532.3532, 534.2973, 535.3013, 537.3199, 550.3255, 560.3121, 562.3203, 574.3090, 580.3417, 583.2274, 584.2345, 584.3355, 585.2423, 600.3366, 616.1446 m/z (단, 오차 범위는 ±0.1 m/z)로 이루어진 그룹으로부터 선택된 하나 이상의 질량값인 것을 특징으로 하는 암 진단 장치.
  106. 제102항에 있어서,
    상기 제4종 위암 진단용 저질량 이온들의 질량값은 18.0264, 22.9798, 23.0539, 38.9638, 38.9937, 46.0666, 86.1328, 112.0850, 123.0738, 129.0710, 155.1762, 164.0701, 165.0955, 175.1219, 176.1298, 178.1388, 179.1466, 192.1245, 201.2036, 204.1077, 212.3577, 213.0575, 229.0033, 232.0822, 234.0749, 235.0331, 240.0907, 251.9799, 274.0827, 284.3265, 314.2277, 326.3916, 383.0532, 417.0381, 429.3172, 430.3169, 434.2556, 456.3015, 459.2257, 460.9913, 489.3314, 490.3361, 491.3348, 532.2725, 534.2841, 569.3303 m/z (단, 오차 범위는 ±0.1 m/z)로 이루어진 그룹으로부터 선택된 하나 이상의 질량값인 것을 특징으로 하는 암 진단 장치.
  107. 제102항에 있어서,
    상기 제5종 위암 진단용 저질량 이온들의 질량값은 38.9674, 76.0758, 123.0414, 156.0432, 163.1135, 164.0712, 184.1062, 184.1375, 190.1141, 193.0672, 215.0444, 228.0389, 230.0004, 256.3291, 257.2950, 265.9579, 267.9562, 289.2849, 295.1666, 301.1386, 315.2230, 330.2485, 342.2497, 346.2809, 368.2644, 369.2702, 370.2806, 371.2848, 396.0400, 412.1977, 428.1904, 442.3155, 443.2100, 445.0283, 498.3276, 510.2755, 511.3414, 513.3220, 530.3908, 532.2863, 548.3441, 552.3114, 553.3178, 571.3341, 573.2402, 584.2661, 666.3899, 683.3451, 684.3511, 708.3570, 711.3711, 723.3455, 725.3580, 726.3760, 741.3357 m/z (단, 오차 범위는 ±0.1 m/z)로 이루어진 그룹으로부터 선택된 하나 이상의 질량값인 것을 특징으로 하는 암 진단 장치.
  108. 제102항에 있어서,
    상기 판별 점수는 상기 제1종 저질량 이온들에 의한 제1종 판별 점수, 상기 제2종 저질량 이온들에 의한 제2종 판별 점수, 상기 제3종 저질량 이온들에 의한 제3종 판별 점수 및 상기 제4종 저질량 이온들에 의한 제4종 판별 점수를 포함하며,
    상기 제1종 판별 점수가 GS11보다 크고, 상기 제2종 판별 점수가 GS21보다 크고, 상기 제3종 판별 점수가 GS31보다 크고, 상기 제4종 판별 점수가 GS41보다 큰 경우에는 상기 판별 대상을 위암 양성으로 판단하고,
    상기 제1종 판별 점수가 GS12보다 작거나, 상기 제2종 판별 점수가 GS22보다 작거나, 상기 제3종 판별 점수가 GS32보다 작거나, 상기 제4종 판별 점수가 GS42보다 작은 경우에는 상기 판별 대상을 위암 음성으로 판단하는 것을 특징으로 하는 암 진단 장치.
  109. 제108항에 있어서,
    상기 GS11, GS12, GS21, GS22, GS31, GS32 GS41 및 GS42는 0인 것을 특징으로 하는 암 진단 장치.
  110. 제102항에 있어서,
    상기 판별 점수는 상기 제1종 저질량 이온들에 의한 제1종 판별 점수와 상기 제5종 저질량 이온들에 의한 제5종 판별 점수를 포함하며,
    상기 제1종 판별 점수가 GS11보다 크고 상기 제5종 판별 점수가 GS51보다 큰 경우에는 상기 판별 대상을 위암 양성으로 판단하고,
    상기 제1종 판별 점수가 GS12보다 작거나 상기 제5종 판별 점수가 GS52보다 작은 경우에는 상기 판별 대상을 위암 음성으로 판단하는 것을 특징으로 하는 암 진단 장치.
  111. 제110항에 있어서,
    상기 GS11, GS12, GS51 및 GS52는 0인 것을 특징으로 하는 암 진단 장치.
  112. 제102항에 있어서,
    상기 제1판별점수 계산수단은;
    상기 훈련 후보 집합의 상기 저질량 이온 질량 스펙트럼들의 상기 피크 강도들을 정규화하는 정규화 모듈;
    상기 정규화한 피크 강도들을 스케일링하는 스케일링 모듈; 및
    상기 스케일링된 피크 강도들에 대해 상기 생물통계학적 분석을 수행하여 상기 판별 점수를 계산하는 판별점수계산 모듈을 포함하는 것을 특징으로 하는 암 진단 장치.
  113. 제112항에 있어서,
    상기 스케일링 모듈은;
    파레토 스케일링을 수행하는 것을 특징으로 하는 암 진단 장치.
  114. 제112항에 있어서,
    상기 판별점수계산 모듈은;
    주성분 분석 기반 선형 판별 분석을 사용하여 상기 생물통계학적 분석을 수행하는 것을 특징으로 하는 암 진단 장치.
  115. 제114항에 있어서,
    상기 판별점수계산 모듈은;
    상기 주성분 분석 기반 선형 판별 분석에 의해 획득된 인자적재값과 상기 스케일링된 피크 강도를 함께 사용하여 상기 판별 점수를 계산하는 것을 특징으로 하는 암 진단 장치.
  116. 제102항에 있어서,
    상기 인자적재값 계산수단은;
    상기 정렬된 질량 스펙트럼에 대해 생물통계학적 분석을 수행하고, 상기 생물통계학적 분석 결과를 기초로 상기 위암 환자 및 비환자 케이스들 중 훈련 조건을 만족하는 훈련 케이스들을 제1훈련집합으로 선택하는 제1훈련집합 선택수단을 포함하며, 상기 제1훈련집합으로부터 인자적재값을 계산하는 것을 특징으로 하는 암 진단 장치.
  117. 제116항에 있어서,
    상기 제1훈련집합 선택수단은;
    상기 생물통계학적 분석 결과에 따른 민감도가 문턱값 GN1 이상이고, 특이도가 문턱값 GN2 이상일 때의 위암 환자 및 비환자 케이스들을 상기 제1훈련집합으로 설정하는 것을 특징으로 하는 암 진단 장치.
  118. 제117항에 있어서,
    상기 문턱값 GN1과 GN2는 1인 것을 특징으로 하는 암 진단 장치.
  119. 제102항에 있어서,
    상기 제2판별점수 계산수단은;
    상기 판별 대상의 상기 저질량 이온 질량 스펙트럼의 상기 피크 강도들을 정규화하는 정규화 모듈;
    상기 정규화한 피크 강도들을 스케일링하는 스케일링 모듈; 및
    상기 스케일링된 피크 강도와 상기 인자적재값을 통해 상기 판별 점수를 계산하는 판별점수계산 모듈을 포함하는 것을 특징으로 하는 암 진단 장치.
  120. 제119항에 있어서,
    상기 스케일링 모듈은;
    파레토 스케일링을 수행하는 것을 특징으로 하는 암 진단 장치.
  121. 제119항에 있어서,
    상기 판별점수계산 모듈은;
    상기 위암 진단용 저질량 이온들의 상기 스케일링된 피크 강도와 상기 인자적재값을 통해 상기 판별 점수를 계산하는 것을 특징으로 하는 암 진단 장치.
  122. 제102항에 있어서,
    상기 위암 판정수단은;
    상기 판별 점수에 따라 상기 판별 대상을 위암의 양성 또는 음성으로 판정하되,
    상기 판별 점수가 기준값 GS보다 크면 양성으로 상기 판별 대상의 위암 정보를 판단하고, 상기 판별 점수가 기준값 GS보다 작으면 음성으로 상기 판별 대상의 위암 정보를 판단하는 것을 특징으로 하는 암 진단 장치.
  123. 제122항에 있어서,
    상기 기준값 GS는 0인 것을 특징으로 하는 암 진단 장치.
  124. 제102항에 있어서,
    상기 위암 판정수단은;
    상기 판별 대상의 생물학적 시료를 반복적으로 측정하여 검출한 다수의 상기 저질량 이온 질량 스펙트럼에 대해 계산된 다수의 상기 판별 점수의 평균값으로 상기 판별 대상의 상기 위암 정보를 판단하는 것을 특징으로 하는 암 진단 장치.
  125. 제102항에 있어서,
    상기 위암진단용이온 선정수단은;
    상기 선택된 상기 제1훈련집합으로부터 후보 조건을 만족하는 후보 저질량 이온들을 후보이온집합으로 선택하는 후보이온집합 선택수단; 및
    상기 선택된 상기 후보이온집합의 상기 후보 저질량 이온의 개별 또는 조합별 판별 성능을 기반으로 하여 위암 진단용 저질량 이온들을 최종이온집합으로 선택하는 최종이온집합 선택수단을 포함하는 것을 특징으로 하는 암 진단 장치.
  126. 제125항에 있어서,
    상기 후보이온집합 선택수단은;
    상기 훈련 케이스 각각에 대한 상기 저질량 이온의 상기 피크 강도와, 상기 생물통계학적 분석을 통해 획득된 상기 저질량 이온별 인자적재값의 곱의 절댓값이 문턱값 GT1보다 큰 제1저질량 이온들을 상기 훈련 케이스별로 선택하는 제1저질량이온 선택모듈을 포함하는 것을 특징으로 하는 암 진단 장치.
  127. 제126항에 있어서,
    상기 문턱값 GT1은 0.1인 것을 특징으로 하는 암 진단 장치.
  128. 제126항에 있어서,
    상기 후보이온집합 선택수단은;
    상기 제1저질량 이온들 중 상기 훈련 케이스들 전체의 문턱값 GT2 퍼센트 이상의 케이스들에서 공통으로 나타나는 제2저질량 이온들을 상기 후보이온집합으로 선택하는 후보이온집합 예비선택모듈을 포함하는 것을 특징으로 하는 암 진단 장치.
  129. 제128항에 있어서,
    상기 문턱값 GT2는 50인 것을 특징으로 하는 암 진단 장치.
  130. 제128항에 있어서,
    상기 후보이온집합 선택수단은;
    상기 제2저질량 이온들을 이용해 상기 훈련 케이스별로 위암에 대한 양성 또는 음성을 나타내는 판별 점수를 계산하고, 상기 판별 점수에 따른 민감도 및 특이도를 계산하는 민감도 및 특이도 계산모듈; 및
    상기 민감도가 문턱값 GN3보다 작거나, 상기 특이도가 문턱값 GN4보다 작은 경우 상기 GT1 및 상기 GT2 중 적어도 하나를 변경하고, 상기 과정을 반복하여 상기 후보이온집합으로 선택하는 후보이온집합 최종선택모듈을 더 포함하는 것을 특징으로 하는 암 진단 장치.
  131. 제130항에 있어서,
    상기 문턱값 GN3 및 GN4는 0.9인 것을 특징으로 하는 암 진단 장치.
  132. 제125항에 있어서,
    상기 최종이온집합 선택수단의 상기 판별 성능의 기준은;
    상기 후보 저질량 이온 중 민감도와 특이도의 합이 기준값보다 큰 이온들을 선택하거나 상기 후보 저질량 이온들로 구성되는 조합별 민감도와 특이도의 합이 비교 대상 조합들 중 가장 큰 조합을 선택하는 제1기준을 포함하는 것을 특징으로 하는 암 진단 장치.
  133. 제125항에 있어서,
    상기 최종이온집합 선택수단의 상기 판별 성능의 기준은;
    상기 후보 저질량 이온들의 조합들 중 상기 후보 저질량 이온들의 개수가 비교 대상 조합들 중 가장 적은 조합을 선택하는 제2기준을 더 포함하는 것을 특징으로 하는 암 진단 장치.
  134. 제125항에 있어서,
    상기 최종이온집합 선택수단의 상기 판별 성능의 기준은;
    상기 후보 저질량 이온들의 조합들 중 진양성(true positive) 케이스의 최소 판별 점수와 진음성(ture negative) 케이스의 최대 판별 점수의 차가 비교 대상 조합들 중 가장 큰 조합을 선택하는 제3기준을 더 포함하며,
    상기 판별 점수는 상기 후보 저질량 이온들의 상기 스케일링된 피크 강도와 상기 인자적재값을 통해 계산되며, 위암에 대한 양성 또는 음성을 나타내는 것을 특징으로 하는 암 진단 장치.
  135. 제125항에 있어서,
    상기 최종이온집합 선택수단은;
    상기 후보이온집합에 포함된 상기 후보 저질량 이온들을 상기 민감도가 상기 특이도보다 높은 고민감도 저질량 이온들을 포함하며 상기 고민감도 저질량 이온들을 상기 민감도와 상기 특이도의 합의 내림차순으로 정렬한 고민감도 집합{Sns1, Sns2, Sns3 … SnsI}과, 상기 특이도가 상기 민감도보다 높은 고특이도 저질량 이온들을 포함하며 상기 고특이도 저질량 이온들을 상기 민감도와 상기 특이도의 합의 내림차순으로 정렬한 고특이도 집합{Spc1, Spc2, Spc3 … SpcJ}으로 구분하는 이온 구분모듈;
    상기 고민감도 집합에서 상위 L개의 상기 고민감도 저질량 이온들{Sns1, Sns2, Sns3 … SnsL}과 상기 고특이도 집합에서 상위 L개의 상기 고특이도 저질량 이온들{Spc1, Spc2, Spc3 … SpcL} 중 2개 이상의 저질량 이온들로 구성되는 후보 조합들 중 상기 제1기준, 상기 제2기준 및 상기 제3기준 중 적어도 하나 이상에 의한 상기 판별 성능의 기준에 의해 선택된 조합을 바이오마커 그룹으로 선정하는 바이오마커그룹 예비선정모듈;
    상기 바이오마커 그룹과, 상기 고민감도 집합에서 차상위 M개의 상기 고민감도 저질량 이온들과 상기 고특이도 집합에서 차상위 M개의 상기 고특이도 저질량 이온들 중 적어도 하나 이상의 저질량 이온을 상기 바이오마커 그룹에 추가한 후보 조합들 중 상기 제1기준, 상기 제2기준 및 상기 제3기준 중 적어도 하나 이상에 의한 상기 판별 성능의 기준에 의해 선택된 조합을 상기 바이오마커 그룹으로 재선정하는 바이오마커그룹 재선정모듈; 및
    상기 고민감도 집합 및 상기 고특이도 집합에 차상위 저질량 이온이 존재하지 않을 때까지 상기 재선정 과정을 반복하여 상기 바이오마커 그룹을 최종 선정하는 바이오마커그룹 최종선정모듈을 포함하는 것을 특징으로 하는 암 진단 장치.
  136. 제135항에 있어서,
    상기 최종이온집합 선택수단은;
    상기 후보이온집합에서 상기 바이오마커그룹 최종선정모듈에서 얻어진 상기 바이오마커 그룹으로 선정 완료된 조합의 저질량 이온들을 제외한 잔류 후보이온집합을 대상으로 상기 세 바이오마커 그룹 선정 과정을 반복 수행하여 추가 바이오마커 그룹을 선정하되, 상기 고민감도 집합 또는 상기 고특이도 집합에 상기 L개 미만의 질량 이온이 남을 때까지 상기 추가 바이오마커 그룹을 더 선정하는 바이오마커그룹 추가선정모듈; 및
    상기 바이오마커 그룹과 상기 추가 바이오마커 그룹들 중 진양성 및 진음성 판정의 정확도(accuracy)를 기준으로 상위 K개의 바이오마커 그룹들의 조합의 저질량 이온들을 상기 위암 진단용 저질량 이온으로 선택하는 암진단용저질량이온 최종선택모듈을 더 포함하는 것을 특징으로 하는 암 진단 장치.
  137. 제136항에 있어서,
    상기 L값은 2이고, 상기 M값은 1이며, 상기 K값은 1 내지 3 중 어느 하나의 자연수인 것을 특징으로 하는 암 진단 장치.
  138. 제125항에 있어서,
    상기 최종이온집합 선택수단은,
    상기 제1훈련집합에 대해 독립적인 제2훈련집합을 상기 제1훈련집합에 추가한 훈련 집합을 대상으로 저질량 이온 선택 과정을 진행하는 것을 특징으로 하는 암 진단 장치.
PCT/KR2012/010358 2012-01-03 2012-12-03 암 진단 장치 WO2013103197A1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2015549231A JP6134809B2 (ja) 2012-01-03 2012-12-03 癌診断装置
SG11201502499UA SG11201502499UA (en) 2012-01-03 2012-12-03 Cancer diagnosis device

Applications Claiming Priority (14)

Application Number Priority Date Filing Date Title
KR10-2012-0000730 2012-01-03
KR10-2012-0000729 2012-01-03
KR10-2012-0000745 2012-01-03
KR20120000745 2012-01-03
KR20120000729 2012-01-03
KR20120000730 2012-01-03
KR1020120129390A KR101461615B1 (ko) 2012-01-03 2012-11-15 암 진단 장치
KR10-2012-0129390 2012-11-15
KR10-2012-0134830 2012-11-26
KR1020120134830A KR101439981B1 (ko) 2012-01-03 2012-11-26 유방암 진단 장치
KR1020120134825A KR101439975B1 (ko) 2012-01-03 2012-11-26 대장암 진단 장치
KR10-2012-0134825 2012-11-26
KR10-2012-0134828 2012-11-26
KR1020120134828A KR101439977B1 (ko) 2012-01-03 2012-11-26 위암 진단 장치

Publications (1)

Publication Number Publication Date
WO2013103197A1 true WO2013103197A1 (ko) 2013-07-11

Family

ID=48745240

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2012/010358 WO2013103197A1 (ko) 2012-01-03 2012-12-03 암 진단 장치

Country Status (1)

Country Link
WO (1) WO2013103197A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2017213246A1 (ja) * 2016-06-10 2018-11-08 株式会社日立製作所 尿中代謝物による疾病診断法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19990082173A (ko) * 1996-02-01 1999-11-25 피쉬 앨런 방광암의 검출 및 평가 방법
JP2007501380A (ja) * 2003-08-01 2007-01-25 コレロジック システムズ,インコーポレイティド 卵巣癌検出のための多重高解像度血清プロテオミック特性
KR20090012313A (ko) * 2006-03-29 2009-02-03 칸젠 바이오테크날러지즈, 인코포레이티드 질병을 예측하는 장치 및 방법
US20110315871A1 (en) * 2009-04-10 2011-12-29 Canon Kabushiki Kaisha Method of forming mass image

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19990082173A (ko) * 1996-02-01 1999-11-25 피쉬 앨런 방광암의 검출 및 평가 방법
JP2007501380A (ja) * 2003-08-01 2007-01-25 コレロジック システムズ,インコーポレイティド 卵巣癌検出のための多重高解像度血清プロテオミック特性
KR20090012313A (ko) * 2006-03-29 2009-02-03 칸젠 바이오테크날러지즈, 인코포레이티드 질병을 예측하는 장치 및 방법
US20110315871A1 (en) * 2009-04-10 2011-12-29 Canon Kabushiki Kaisha Method of forming mass image

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2017213246A1 (ja) * 2016-06-10 2018-11-08 株式会社日立製作所 尿中代謝物による疾病診断法

Similar Documents

Publication Publication Date Title
WO2016072756A1 (en) Method of and apparatus for measuring biometric information
WO2023058885A1 (ko) 암 진단용 바이오마커 및 이의 용도
WO2020185003A1 (ko) 초음파 영상 표시 방법, 초음파 진단 장치 및 컴퓨터 프로그램 제품
WO2016099113A1 (en) Noninvasive blood glucose measurement method and apparatus
WO2016195236A1 (en) Strip for analysis and apparatus and system using strip for analysis
WO2015108306A1 (en) Medical image providing apparatus and medical image processing method of the same
WO2014104649A1 (ko) 호흡가스를 이용한 암의 진단방법
WO2018038352A2 (ko) 치매진단용 자가항체 바이오마커 및 이를 이용한 치매진단 방법
WO2018062704A1 (ko) 대장암 진단 장치와 대장암 진단 정보 제공 방법
WO2023080379A1 (ko) 다유전자 위험점수를 이용한 시간 의존 연관성 기반의 질환 발병 정보 생성 장치 및 그 방법
WO2013103197A1 (ko) 암 진단 장치
WO2021182881A1 (ko) 유방암 진단용 다중 바이오마커 및 이의 용도
Talib et al. Fuzzy decision-making framework for sensitively prioritizing autism patients with moderate emergency level
WO2016149971A1 (zh) 糖尿病肾病早期检测试纸盒、生物标志物检测方法及应用
WO2022114920A1 (ko) 혈액 유래 엑소좀에서 발굴한 신규의 알츠하이머 진단용 바이오마커 및 이를 이용한 알츠하이머 진단방법
WO2017217669A1 (ko) 담도암 진단 정보 제공 방법과 담도암 진단 장치
WO2018004191A1 (ko) 바이오 센싱 장치 및 약물 전달 장치
WO2023249252A1 (ko) 폐암 진단용 바이오마커 및 폐암 진단에 대한 인공지능 기반 정보 제공 방법
WO2023191206A1 (ko) 변수 속성에 기반한 탐색적 데이터 분석 자동화 시스템과 방법
WO2023182774A1 (ko) 심박 정보를 기초로 사용자의 질환을 모니터링하는 방법 및 이를 수행하는 서버
WO2022108149A1 (ko) 생리학적 약물동태학 핵심 모델
WO2023033275A1 (ko) 개인 맞춤 생체나이 예측 모형 생성 방법 및 시스템
WO2019235824A1 (ko) Cox2 과발현 질환 진단용 조성물 및 이의 스크리닝 방법
WO2023204366A1 (en) Biosensor chip and biosensor cartridges having the same
WO2022060162A1 (ko) 사용자 측정 모듈 및 이의 구동 방법, 이 사용자 측정 모듈이 탑재된 단말기, 이 단말기가 포함되는 브래지어 추천 플랫폼 서비스 시스템

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 12864052

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 12864052

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2015549231

Country of ref document: JP

Kind code of ref document: A