KR20140057688A - Apparatus for diagnosis colorectal cancer - Google Patents
Apparatus for diagnosis colorectal cancer Download PDFInfo
- Publication number
- KR20140057688A KR20140057688A KR1020120134825A KR20120134825A KR20140057688A KR 20140057688 A KR20140057688 A KR 20140057688A KR 1020120134825 A KR1020120134825 A KR 1020120134825A KR 20120134825 A KR20120134825 A KR 20120134825A KR 20140057688 A KR20140057688 A KR 20140057688A
- Authority
- KR
- South Korea
- Prior art keywords
- low
- mass
- ion
- discrimination
- candidate
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N27/00—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
- G01N27/62—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode
- G01N27/622—Ion mobility spectrometry
- G01N27/623—Ion mobility spectrometry combined with mass spectrometry
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/72—Signal processing specially adapted for physiological signals or for diagnostic purposes
- A61B5/7235—Details of waveform analysis
- A61B5/7264—Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
- A61B5/7267—Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems involving training the classification device
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/574—Immunoassay; Biospecific binding assay; Materials therefor for cancer
- G01N33/57407—Specifically defined cancers
- G01N33/57446—Specifically defined cancers of stomach or intestine
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
- G01N33/6803—General methods of protein analysis not limited to specific proteins or families of proteins
- G01N33/6848—Methods of protein analysis involving mass spectrometry
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
- G16H20/10—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01J—ELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
- H01J49/00—Particle spectrometers or separator tubes
- H01J49/26—Mass spectrometers or separator tubes
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Chemical & Material Sciences (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Biomedical Technology (AREA)
- Medical Informatics (AREA)
- Pathology (AREA)
- Public Health (AREA)
- Urology & Nephrology (AREA)
- Analytical Chemistry (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Hematology (AREA)
- Biochemistry (AREA)
- General Physics & Mathematics (AREA)
- Biophysics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Epidemiology (AREA)
- Data Mining & Analysis (AREA)
- Biotechnology (AREA)
- Medicinal Chemistry (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Microbiology (AREA)
- Evolutionary Computation (AREA)
- Cell Biology (AREA)
- Databases & Information Systems (AREA)
- Food Science & Technology (AREA)
- Primary Health Care (AREA)
- Fuzzy Systems (AREA)
- Evolutionary Biology (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Electrochemistry (AREA)
- Bioethics (AREA)
Abstract
Description
본 발명은 대장암을 진단하는 장치에 관한 것으로, 더욱 상세하게는 생물학적 시료로부터 추출한 저질량 이온에 대해 생물통계학적 분석을 통하여 대장암 진단을 위한 저질량 이온의 질량 스펙트럼을 확인하고, 이 저질량 이온 질량 스펙트럼을 이용하여 대장암을 진단할 수 있는 대장암 진단 장치에 관한 것이다.
The present invention relates to an apparatus for diagnosing colorectal cancer, and more particularly, to a mass spectrometry of low mass ions for diagnosis of colorectal cancer through biostatistical analysis of low mass ions extracted from a biological sample, The present invention relates to a colon cancer diagnostic apparatus capable of diagnosing colon cancer using an ion mass spectrum.
암은 세포가 무한히 증식해 정상적인 세포의 기능을 방해하는 질병으로, 폐암, 위암(gastric cancer, GC), 유방암(breast cancer, BRC), 대장암(colorectal cancer, CRC) 등이 대표적이나, 실질적으로는 어느 조직에서나 발생할 수 있다. 초창기 암 진단은 암 세포의 성장에 따른 생체 조직의 외적 변화에 근거하였으나, 근래에 들어 혈액, 당쇄(glyco chain), 디엔에이(DNA) 등 생물의 조직 또는 세포에 존재하는 미량의 생체 분자를 이용한 진단 및 검출이 시도되고 있다. 그러나 가장 보편적으로 사용되는 암 진단 방법은 생체 조직 검사를 통해 얻어진 조직 샘플을 이용하거나, 영상을 이용한 진단이다. Cancer is a disease in which cells infiltrate infinitely and interfere with the function of normal cells. Lung cancer, gastric cancer, breast cancer (BRC), colorectal cancer (CRC) Can occur in any organization. Early diagnosis of cancer was based on external changes of the biotissue due to the growth of cancer cells. Recently, however, diagnosis using biomolecules such as blood, glycocyte, DNA, And detection has been attempted. However, the most commonly used cancer diagnosis method is a tissue sample obtained through biopsy or an image diagnosis.
그 중 생체 조직 검사는 환자에게 큰 고통을 야기하며, 고비용이 들뿐만 아니라, 진단까지 긴 시간이 소요되는 단점이 있다. 또한, 환자가 실제 암에 걸린 경우, 생체 조직 검사 과정 중 암의 전이가 유발될 수 있는 위험이 있으며, 생체 조직 검사를 통해 조직 샘플을 얻을 수 없는 부위의 경우, 외과적인 수술을 통해 의심되는 조직의 적출이 이루어지기 전에는 질병의 진단이 불가능한 단점이 있다. Among them, biopsy results in great pain for the patient, and it is not only expensive but also takes a long time to diagnose. In addition, when the patient is actually cancerous, there is a risk that cancer metastasis may be induced during the biopsy, and in the case where a tissue sample can not be obtained through biopsy, It is impossible to diagnose the disease until the removal of the disease.
영상을 이용한 진단에서는 엑스레이(X-ray) 영상, 질병 표적 물질이 부착된 조영제를 사용하여 획득한 핵자기 공명(nuclear magnetic resonance, NMR) 영상 등을 기반으로 암을 판정한다. 그러나 이러한 영상 진단은 임상의 또는 판독의의 숙련도에 따라 오진의 가능성이 있으며, 영상을 얻는 기기의 정밀도에 크게 의존하는 단점이 있다. 더 나아가, 가장 정밀한 기기조차도 수 mm 이하의 종양은 검출이 불가능하여, 발병 초기 단계에서는 검출이 어려운 단점이 있다. 또한, 영상을 얻기 위해 환자 또는 질병 보유 가능자가 유전자의 돌연변이를 유발할 수 있는 고에너지의 전자기파에 노출되므로, 또 다른 질병을 야기할 수 있을 뿐만 아니라, 영상을 통한 진단 횟수에 제한이 있는 단점이 있다.In the diagnosis using imaging, cancer is judged based on X-ray image, nuclear magnetic resonance (NMR) image obtained using a contrast agent having a disease target substance, and the like. However, there is a possibility of misdiagnosis according to the skill of the clinician or the reader, and this image diagnosis has a disadvantage that it depends greatly on the precision of the device for obtaining the image. Furthermore, even the most precise apparatus can not detect tumors of a few mm or less, which is difficult to detect in the early stages of onset. In addition, in order to obtain an image, a patient or a disease-capable person is exposed to electromagnetic waves of high energy capable of causing mutation of a gene, so that it may cause another disease, and there is a disadvantage that there are limitations on the number of diagnosis through imaging .
소화기 계통의 경우 통상적으로 내시경을 이용한 육안 영상 관찰을 통해 질병의 유무를 판단하나, 그 과정이 환자에게 무척 고통스러우며, 육안 영상 관찰을 통해 이상이 발견된 경우라 할지라도, 악성/양성 종양, 용종 등의 정확한 질병 판별을 위해서는 생체 조직 검사가 필수적으로 수행되어야 한다.In the case of the digestive system, the presence or absence of the disease is usually judged by visual observation using an endoscope. However, even if the procedure is very painful to the patient and an abnormality is found through visual observation, malignant / benign tumors, Biopsy should be performed to determine the exact disease.
특히 CRC는 세계적으로 발병률이 3위 이내인 흔한 암이며, 치료의 가능성이 암의 진행 단계(stage)에 크게 좌우되는 암이다. 즉, 조기 진단을 통해 초기 단계에서 발견되는 경우 매우 높은 완치율을 가진다. 따라서, 무엇보다 정확한 조기 진단이 중요한 질병이나, 암이 진행됨에 따라 동반되는 이상 징후가 미미하여 대부분 출혈에 의한 분변의 색깔 변화로 병을 인지하는 것이 보통이며, 환자 또는 질병 보유 가능자가 검사를 받는다 하더라도 대장 내시경을 통한 관찰이 통상적이며, 정확한 질병 판별을 위해서는 생체 조직 검사가 필수적으로 수행되어야 한다. 요약하면, CRC의 경우 조기 진단이 중요하며, 대장 내시경 및 생체 조직 검사는 많은 시간, 비용, 불편, 고통 등을 수반하므로, 불필요한 대장 내시경 및 생체 조직 검사의 대상자 수를 획기적으로 줄일 수 있는 진단 방법이 필요하다. In particular, CRC is a common cancer with a worldwide incidence rate of less than 3, and the possibility of treatment is highly dependent on the stage of cancer. In other words, it has a very high cure rate when it is detected at early stage through early diagnosis. Therefore, it is common to recognize the disease by the color change of the feces due to hemorrhage, and the patient or the person having the disease can be examined even though the diagnosis of the disease is important and the abnormality accompanying the cancer progresses is small. Observation through colonoscopy is common and biopsy should be performed for accurate disease identification. In summary, early diagnosis of CRC is important, and colonoscopy and biopsy are time-consuming, costly, inconvenient, and painful. Therefore, diagnostic methods that can dramatically reduce the number of unnecessary colonoscopy and biopsy specimens Is required.
따라서, 새로운 분자적 접근을 적용하여 초기 단계에서 CRC를 스크리닝할 수 있다면 환자들에게 매우 유용할 것이다. 유전체학(genomics), 단백질체학(proteomics) 및 분자병리학(molecular pathology)은 임상적으로 잠재적인 가치를 지닌 여러 바이오마커(biomarker) 후보들을 제공해 왔다. 암의 병기(stage) 및 환자별 맞춤 치료에 이들을 적극적으로 활용하는 것을 통해 치료 효과를 향상시킬 수 있을 것으로 사료되나, 임상 치료에 적용하기 위해서는 앞으로도 많은 연구가 선행되어야 한다. Therefore, it would be very useful for patients if a new molecular approach could be used to screen CRC at an early stage. Genomics, proteomics, and molecular pathology have provided a number of biomarker candidates with clinically significant potential. Although it is thought that the therapeutic effect can be improved by actively using them for the stage of cancer and personalized treatment for each patient, many studies should be preceded in order to be applied to clinical treatment.
근래의 CRC 스크리닝 검사는 대장 내시경을 사용하여 이상(gross abnormality) 여부를 판단하거나 분변에서 혈액을 탐지(fecal occult blood test, FOBT)하는 것을 통해 수행된다. 대장 내시경은 CRC 스크리닝 검사에서 표준적인 방법으로 활용되어 왔으나, 침습적이며, 수용 가능한 환자가 제한되어 있다. 따라서 최근에 많은 노력이 분변 검사에 집중되어 왔는데, 이는 비침습적이고, 장 세척이 요구되지 않으며, 표본의 운반이 가능하기 때문이다. 분변 마커(marker)는 종양으로부터 새어 나오는 것, 분비되는 것, 또는 종양으로부터 박리되는 것으로 분류될 수 있다. 예를 들어 전통적인 FOBT에서 헤모글로빈(hemoglobin)은 CRC를 진단하기 위한 대규모 스크리닝 프로그램에서 새어 나오는 종류의 마커로 인식되어 왔으나, 이것을 포함하여 현재까지 알려진 마커들의 판별 능력은 만족스럽지 못하다.Recent CRC screening tests are performed using a colonoscopy to determine whether a gross abnormality is present or to perform a fecal occult blood test (FOBT). Colonoscopy has been used as a standard method in CRC screening tests, but it is limited to invasive and acceptable patients. Thus, much effort has recently been focused on fecal tests, which are noninvasive, do not require intestinal lavage, and allow delivery of specimens. Fecal markers can be classified as leaking, secreted, or exfoliated from a tumor. For example, in traditional FOBT, hemoglobin has been recognized as a breeding marker in a large-scale screening program to diagnose CRC, but its ability to discriminate markers to date, including this, is unsatisfactory.
한편, MALDI-TOF(matrix-assisted laser desorption/ionization-time of flight) 질량분석기(mass spectrometer)를 이용하면 혈액 내 질량 이온(mass ion)의 스펙트럼(spectrum)을 추출할 수 있다. 기존 단백질체 연구들에 이용된 질량 분석은 주로 800 내지 2500 m/z의 질량값 범위를 분석 대상으로 하였는데, 그 범위가 단백질이 트립신(trypsin)으로 잘렸을 경우 펩타이드(peptide)의 질량값 영역이기 때문이다. 또한, MALDI-TOF 질량분석기를 이용하면 저질량 이온(low-mass ion)의 질량 스펙트럼도 추출할 수 있다. 그러나 약 800 m/z 이하의 저질량 대역은 분석 대상이 아닌 매트릭스(matrix)의 질량 이온들이 혼재하는 영역이기 때문에 그동안 이 영역에 대한 연구가 활발하지는 않았다.On the other hand, the mass spectrometer of MALDI-TOF (mass-assisted laser desorption / ionization-time of flight) mass spectrometer can extract the spectrum of mass ion in the blood. The mass spectrometry used in the existing protein studies mainly focused on the mass value range of 800 to 2500 m / z, which is the mass value range of the peptide when the protein is truncated with trypsin to be. In addition, mass spectra of low-mass ions can be extracted using a MALDI-TOF mass spectrometer. However, since the low mass band below about 800 m / z is a region where the mass ions of the matrix are mixed rather than the object of analysis, research on this region has not been actively carried out.
추출된 저질량 이온의 질량 스펙트럼은 종래의 소프트웨어(software) 중 하나인 MarkerViewTM(버전 version 1.2, 이하 버전 생략)에 의해 분석될 수 있다. 본 발명자들은 CRC 환자군 및 정상 대조군(control, CONT)의 혈청(serum)으로부터 추출된 저질량 이온의 질량 스펙트럼을 MarkerViewTM를 이용하여 분석해 보았는데, 도 1을 참조하여 그 방법을 상세히 설명한다.The mass spectrum of the extracted low mass ions can be analyzed by MarkerView TM (version version 1.2, abbreviated below) which is one of conventional software. The present inventors analyzed the mass spectrum of low mass ions extracted from the serum of the CRC patient group and the normal control (control, CONT) using MarkerView TM , and the method will be described in detail with reference to FIG.
표 1의 CRC 환자군 133명과 표 2의 정상 대조군 153명으로 구성된 집합(Set A1)으로부터 수집한 혈청을 시료로 하여 MALDI-TOF 질량분석기를 이용하여 추출한 T2D 파일 형식의 저질량 이온 질량 스펙트럼을 MarkerViewTM로 임포트(import)하였다(A11).
The low mass ion mass spectrum of the T2D file format, extracted from the serum collected from a set of 133 CRC patients (Table 1) and 153 normal control group (Set A 1 ) of Table 2 using a MALDI-TOF mass spectrometer, And imported into the TM (A11).
yearAge
year
ng/mLCEA
ng / mL
AC: AdenocarcinomaAC: Adenocarcinoma
CEA : Carcinoembryonic antigenCEA: Carcinoembryonic antigen
MAC: Mucinous adenocarcinoma
MAC: Mucinous adenocarcinoma
yearAge
year
ng/mLCEA
ng / mL
yearAge
year
ng/mLCEA
ng / mL
임포트 조건으로 표 3의 조건들을 사용하였다.
The conditions of Table 3 were used as import conditions.
다음, 임포트한 피크 강도(peak intensity)들을 정규화(normalization)하였다(A12). MarkerViewTM에는 다수의 정규화 방법이 존재하는데, "Normalization Using Total Area Sums" 방법을 사용하여 정규화를 수행하였다. 이 방법에서는 각 시료별 강도의 소계를 구하고, 시료별 소계들의 평균을 구한 후, 각 시료별 강도의 소계가 이 평균과 일치하도록 각 피크 강도에 시료별 배율 인자(scaling factor)를 곱한다. 즉, 이와 같이 정규화한 후에는 각 시료별 강도의 소계가 동일해진다. Next, the imported peak intensities were normalized (A12). There are a number of normalization methods in MarkerView TM . Normalization is performed using the "Normalization Using Total Area Sums" method. In this method, the subscales of intensity for each sample are obtained, and the average of the subscales for each sample is obtained. Then, each peak intensity is multiplied by a scaling factor for each sample so that the subscale of each sample coincides with the average. That is, after the normalization as described above, the subtotals of the intensities of the respective samples become equal.
다음, 정규화한 피크 강도들을 파레토 스케일링(Pareto scaling)하였다(A13). 즉, 정규화한 각 피크 강도에서 질량 이온별 평균값을 뺀 후 표준편차의 제곱근으로 나누어 피크 강도들을 파레토 스케일링하였다.Next, the normalized peak intensities were Pareto scaled (A13). That is, the peak intensities of the normalized peak intensities are divided by the square root of the standard deviation, and the peak intensities are Pareto-scaled.
다음, 파레토 스케일링한 피크 강도들에 대해 주성분 분석 기반 선형 판별 분석(principal component analysis-based linear discriminant analysis, PCA-DA)을 수행하여 판별 점수(discriminant score, DS)를 계산하였다(A14). 즉, 두 단계로 주성분 분석을 수행하여 각 질량 이온별 가중치(weighting factor)인 인자적재값(factor loading)을 구하고, 파레토 스케일링된 강도에 이 인자적재값을 곱한 후 그 결과 값을 모두 더하여 각 시료별 판별 점수를 계산하였다. 표 3의 임포트 조건에서 피크의 최대 개수를 10,000개로 하였고, 충분히 많은 시료들을 함께 임포트하였으므로, 본 계산에서 인자적재값은 10,000개가 계산되었으며, 따라서 10,000개의 항을 더하여 한 개의 판별 점수가 계산되었다. Next, the discriminant score (DS) was calculated by performing principal component analysis-based linear discriminant analysis (PCA-DA) on the Pareto-scaled peak intensities (A14). That is, the principal component analysis is performed in two steps to obtain factor loading, which is a weighting factor for each mass ion. The resultant value is multiplied by the Pareto-scaled intensity, And the number of stars discriminated was calculated. Since the maximum number of peaks was set to 10,000 in the import condition of Table 3 and a sufficient number of samples were imported together, the parameter load value was calculated to 10,000 in this calculation, and therefore, one discrimination score was calculated by adding 10,000 terms.
다음, 계산된 판별 점수가 양수인지 여부를 판단하여(A15), 양수인 경우 양성으로(A16), 음수인 경우 음성으로 판정하였다(A17). 즉, CRC에 적용되어 양수인 경우 CRC 환자군으로, 음수인 경우 정상 대조군으로 판정하였다. Next, it is determined whether the calculated discrimination score is a positive number (A15), positive (A16) if negative, negative (A17) if negative. In other words, it was applied to CRC, and it was judged as CRC patients when positive and negative when negative.
도 2는 이미 임상적으로 판정된 CRC 환자군 133명과 정상 대조군 153명으로 구성된 집합에 대해 도 1의 방법으로 계산한 판별 점수의 분포를 나타낸다. 도 2에 나타낸 판별 점수에 따른 판정 결과를 혼동 행렬(confusion matrix)을 이용하여 정리하면 표 4와 같다.
FIG. 2 shows the distribution of discrimination scores calculated by the method of FIG. 1 for a group consisting of 133 CRC patients and 153 normal control patients who were already clinically determined. The results of the determination according to the discrimination score shown in FIG. 2 are summarized by using a confusion matrix.
도 2 및 표 4를 통하여 알 수 있는 바와 같이, 종래 기술인 MarkerViewTM의 주성분 분석 기반 선형 판별 분석 방법을 통하여 민감도(sensitivity), 특이도(specificity), 양성예측도(positive predictive value, PPV), 음성예측도(negative predictive value, NPV)가 모두 98% 이상인 매우 우수한 판별 결과를 얻을 수 있었다. , Prior art MarkerView TM principal component analysis based on linear discriminant through the analysis sensitivity (sensitivity), the specificity of (specificity), positive predictive value (positive predictive value, PPV) As can be seen through the 2 and 4, the audio Very good discrimination results were obtained with a predictive value (NPV) of more than 98%.
그러나 이를 임상에서 사용할 수 있으려면 우선 식의 강건성(robustness)이 반드시 검증되어야 한다. 즉, 이미 한 번 측정했고 판별식을 구성했던 집합에 대하여 추가적으로 수회 반복 측정한 질량 스펙트럼들에 대해서도 여전히 좋은 판별 결과를 나타내어야 하며, 판별식을 구성할 때 고려하지 않았던 새로운 CRC 환자군 및 정상 대조군에 대해서도 동일한 판별식으로 좋은 판별 결과를 얻을 수 있어야 한다. 질량 스펙트럼을 반복 측정하는 과정에는 혈청을 얼리고 녹이는 과정이 포함되거나, 혈청을 새로 메탄올(methanol)/클로로포름(chloroform)과 혼합하여 추출하는 과정이 포함되기도 한다. 이와 같은 과정들은 질량 스펙트럼에 대한 통계 분석에 있어서 외란들(disturbances)로 볼 수 있는데, 이러한 외란들에 둔감한 판별식을 구성해야만 임상에 적용될 수 있다. However, the robustness of the equation must be verified before it can be used in clinical practice. In other words, we should still show good discrimination results for the mass spectra that were measured once and repeatedly several times in addition to the set that constructed the discriminant, and the new CRC patient group and the normal control group It should be possible to obtain good discrimination results with the same discriminant expression. Repeated measurements of mass spectra may involve the process of freezing and thawing serum, or the process of extracting serum by mixing it with fresh methanol / chloroform. These processes can be regarded as disturbances in the statistical analysis of the mass spectrum, and can only be applied to clinical applications by constructing an insensitive discriminant to these disturbances.
요컨대, 도 1, 2 및 표 4를 참조하여 설명한 종래의 주성분 분석 기반 선형 판별 분석 방법은 특정 시료들로 구성된 집합에 개별적으로 적용되는 경우에는, 즉 개별 훈련 집합(training set)에 대한 판별에서는 매우 우수한 판별 결과를 나타내기도 하나, 검증 집합(validation set)에서의 판별 결과는 만족스럽지 않았다. In other words, the conventional principal component analysis based linear discriminant analysis method described with reference to FIGS. 1, 2 and 4 is applied to a set of specific samples individually, that is, in discrimination of individual training sets Although the result is good, the result of the discrimination in the validation set is unsatisfactory.
훈련 집합에 대해서는 매우 우수한 판별 결과를 보임에도 불구하고 판별식이 강건성을 갖지 못한 이유는 판별식을 구성하고 있는 10,000개의 질량 이온들 중 상당한 개수의 질량 이온들이 CRC 환자군과 정상 대조군의 판별을 위해서는 최소한 불필요하며, 때로는 훈련 집합의 판별에서는 문제를 일으키지 않았으나 검증 집합의 판별에서는 잠재적으로 판별 결과를 혼동시킬 수 있는 질량 이온들을 포함하고 있기 때문으로 추정된다. The reason why the discriminant equation does not have robustness is that the significant number of mass ions among the 10,000 mass ions constituting the discriminant equation are at least unnecessary for the discrimination between the CRC patient group and the normal control group It is presumed that sometimes the discrimination of the training set does not cause a problem, but the discrimination of the verification set contains the mass ions which can potentially confuse the discrimination result.
따라서 이와 같이 최소한 불필요하며, 또는 잠재적으로 판별 결과에 혼동을 줄 수 있는 질량 이온들을 적극적으로 제거하는 과정을 통해 우수하며 강건한 판별 결과를 얻기 위해 필수 불가결한 질량 이온들만을 찾아내는 작업이 필요할 것으로 사료된다.
Therefore, it will be necessary to find out only indispensable mass ions in order to obtain a strong and robust discrimination result through the process of positively removing mass ions which are at least unnecessary or potentially confusing the result of discrimination .
본 발명은, 생물학적 시료로부터 추출한 저질량 이온에 대해 생물통계학적 분석을 통하여 대장암을 진단하기 위한 저질량 이온 질량 스펙트럼을 확인하고, 이 저질량 이온 질량 스펙트럼을 이용하여 대장암을 진단할 수 있는 대장암 진단 장치를 제공한다.The present invention relates to a method for diagnosing colorectal cancer by identifying a low mass ion mass spectrum for diagnosing colorectal cancer through biostatistical analysis of low mass ions extracted from a biological sample and for diagnosing colorectal cancer using this low mass ion mass spectrum Provided is a colon cancer diagnostic apparatus.
본 발명은, CRC 환자 및 비환자 시료에 대해 강건한 판별 결과를 주는 판별식을 제안하고자, 판별식을 도출하였던 CRC 환자 및 비환자 집합에 대해 추가로 수회 반복 측정한 질량 스펙트럼과 새로운 CRC 환자 및 비환자 집합에 대해 수회 반복 측정한 질량 스펙트럼 모두에 대해 85% 이상의 민감도, 특이도, 양성예측도, 음성예측도를 나타내는 판별식을 제안하고, 이를 구성하는 저질량 이온들을 확인하여 CRC를 진단할 수 있는 대장암 진단 장치를 제공한다.
The present invention proposes a discriminant equation that gives robust discrimination results for CRC patients and non-patient samples. The present invention also provides a mass discrimination formula for a CRC patient and a non-patient sample, We propose a discriminant equation with more than 85% sensitivity, specificity, positive predictive value, and negative predictive value for all mass spectrums repeatedly measured for patient aggregation. We can diagnose CRC by checking low mass ions constituting it A colon cancer diagnostic apparatus.
전술한 과제를 해결하기 위한 본 발명에 따른 대장암 진단 장치는, 다수의 대장암 환자 및 비환자 케이스들의 생물학적 시료로부터 저질량 이온(low-mass ion)의 질량 스펙트럼을 검출하는 저질량 이온 검출부; 상기 저질량 이온의 질량 스펙트럼 패턴을 비교 분석하여 대장암 진단 정보를 판정하는 대장암 진단부; 및 상기 대장암 진단부로부터 판정된 대장암 진단 정보를 출력 가능한 형태로 변환하여 표시하는 디스플레이부를 포함한다.In order to solve the above-mentioned problems, the present invention provides a colon cancer diagnostic apparatus comprising: a low-mass ion detector for detecting a mass spectrum of a low-mass ion from a biological sample of a plurality of colorectal cancer patients and non-patient cases; A colon cancer diagnosis unit for comparing and analyzing the mass spectral patterns of the low-mass ions to determine colon cancer diagnosis information; And a display unit for converting the colorectal cancer diagnosis information determined by the colorectal cancer diagnosis unit into an outputable form and displaying the converted colorimetric diagnosis information.
상기 저질량 이온 검출부는; 상기 생물학적 시료로부터 저질량 이온의 피크 강도(peak intensity)를 검출하여 상기 저질량 이온의 질량 스펙트럼을 추출할 수 있다. 상기 저질량 이온 검출부는; 질량분석기를 포함할 수 있다.Wherein the low mass ion detector comprises: Mass spectra of the low mass ions can be extracted by detecting peak intensity of low mass ions from the biological sample. Wherein the low mass ion detector comprises: And a mass spectrometer.
상기 대장암 진단부는; 훈련 후보 집합인 상기 대장암 환자 및 비환자 케이스들의 저질량 이온 질량 스펙트럼들을 정렬하는 제1정렬수단; 정렬된 상기 질량 스펙트럼에 대해 생물통계학적 분석을 수행하여 판별 점수를 계산하는 제1판별점수 계산수단; 상기 판별 점수에 따라 민감도(sensitivity) 및 특이도(specificity)를 계산하고, 이를 기준으로 제1훈련집합을 선정하여 저질량 이온별 인자적재값(factor loading)을 계산하는 인자적재값 계산수단; 후보 조건을 만족하는 후보 저질량 이온들 중 판별 성능을 기반으로 하여 대장암 진단용 저질량 이온들을 선택하는 대장암진단용이온 선정수단; 판별 대상 생물학적 시료의 저질량 이온 질량 스펙트럼을 상기 제1훈련집합에 정렬하는 제2정렬수단; 상기 판별 대상의 저질량 이온의 피크 강도와 상기 인자적재값으로부터 판별 점수를 계산하는 제2판별점수 계산수단; 및 상기 판별 점수에 따라 상기 판별 대상을 대장암의 양성 또는 음성으로 판정하는 대장암 판정수단을 포함하되, Wherein the colon cancer diagnosis unit comprises: First alignment means for aligning low mass ion mass spectra of said colorectal cancer patients and non-patient cases which are training candidate sets; A first discrimination score calculating means for calculating a discrimination score by performing a biostatistical analysis on the sorted mass spectrum; A factor load calculation means for calculating a sensitivity and a specificity according to the discrimination score and calculating a factor loading by selecting a first training set based on the sensitivity and the specificity, An ion selection means for diagnosing colon cancer which selects low mass ions for diagnosis of colon cancer based on the discrimination performance among candidate low mass ions satisfying the candidate condition; Second alignment means for aligning the low mass ion mass spectrum of the identified biological sample with the first training set; A second discrimination score calculation means for calculating a discrimination score from the peak intensity of the low-mass ion of the discrimination object and the factor load value; And colorectal cancer determination means for determining the discriminant to be positive or negative for colorectal cancer according to the discrimination score,
상기 대장암진단용이온 선정수단은; 상기 다수의 대장암 환자 및 비환자 케이스들을, 다수의 대장암 환자 케이스들과 다수의 정상인 케이스들로 구성되는 제1종 판별 케이스들과, 상기 다수의 대장암 환자 케이스들과 다수의 대장암 이외의 암 환자 케이스들로 구성되는 제2종 판별 케이스들로 구분하고, 상기 제1종 판별 케이스들과 상기 제2종 판별 케이스들에 대해 각각 실행되어, 상기 대장암 진단용 저질량 이온들이, 상기 제1종 판별 케이스에 대한 제1종 대장암 진단용 저질량 이온들과 상기 제2종 판별 케이스에 대한 제2종 대장암 진단용 저질량 이온들로 구분될 수 있다.The colon cancer diagnostic ion selecting means comprises: The plurality of colorectal cancer patients and non-patient cases are classified into first type discrimination cases each comprising a plurality of colon cancer patient cases and a plurality of normal case cases, And the second type discrimination cases are respectively executed for the first type discrimination cases and the second type discrimination cases so that the low mass ions for diagnosing colorectal cancer are respectively classified into the first type discrimination cases and the second type discrimination cases, A low mass ion for diagnosing first type colorectal cancer and a low mass ion for diagnosis of second type colorectal cancer in the second type discriminating case.
상기 제1종 대장암 진단용 저질량 이온들의 질량값은, 18.0260, 22.9797, 74.0948, 76.0763, 102.0916, 105.1078, 106.0899, 107.0477, 118.0822, 123.0395, 137.0423, 137.0729, 147.0573, 147.1058, 169.0653, 181.0656, 190.0849, 191.0848, 191.3324, 195.0785, 212.3195, 231.0667, 235.0053, 256.0939, 266.9557, 267.9501, 288.2033, 291.0997, 295.0663, 300.1297, 301.1269, 316.2288, 317.2311, 335.1862, 340.2241, 343.2451, 345.2583, 357.0666, 357.2784, 366.2310, 368.2551, 369.3302, 377.0570, 379.1438, 379.4765, 383.0529, 384.1745, 388.2688, 401.0531, 423.0313, 428.1878, 454.2090, 465.3014, 466.1923, 468.1851, 469.2831, 477.1721, 478.1678, 480.1715, 482.3220, 483.3258, 496.8683, 497.7636, 503.8719, 508.3407, 510.3265, 512.3119, 513.3177, 518.2931, 518.8555, 519.2967, 519.8598, 525.3449, 534.2739, 537.2800, 538.3306, 540.2629, 540.8144, 542.8457, 544.8692, 548.2856, 566.8375, 581.1957, 582.1888, 583.2242, 656.0270, 667.3291, 709.3519, 710.3581, 711.3617, 712.3683, 713.3798, 991.6196, 992.6209, 1016.6113, 1020.4817, 1206.5305, 1207.5571, 1465.6184, 1466.6096, 1467.5969, 2450.9701, 2451.9662 및 2452.9546 m/z (단, 오차 범위는 ±0.1 m/z)로 이루어진 그룹으로부터 선택된 하나 이상의 질량값인 것이 바람직하다.The mass values of the low mass ions for diagnosis of the first type colorectal cancer are 18.0260, 22.9797, 74.0948, 76.0763, 102.0916, 105.1078, 106.0899, 107.0477, 118.0822, 123.0395, 137.0423, 137.0729, 147.0573, 147.1058, 169.0653, 181.0656, 190.0849, 191.0848 , 191.3324, 195.0785, 212.3195, 231.0667, 235.0053, 256.0939, 266.9557, 267.9501, 288.2033, 291.0997, 295.0663, 300.1297, 301.1269, 316.2288, 317.2311, 335.1862, 340.2241, 343.2451, 345.2583, 357.0666, 357.2784, 366.2310, 368.2551, 369.3302, 377.0570 , 379.1438, 379.4765, 383.0529, 384.1745, 388.2688, 401.0531, 423.0313, 428.1878, 454.2090, 465.3014, 466.1923, 468.1851, 469.2831, 477.1721, 478.1678, 480.1715, 482.3220, 483.3258, 496.8683, 497.7636, 503.8719, 508.3407, 510.3265, 512.3119, 513.3177 , 518.2931, 518.8555, 519.2967, 519.8598, 525.3449, 534.2739, 537.2800, 538.3306, 540.2629, 540.8144, 542.8457, 544.8692, 548.2856, 566.8375, 581.1957, 582.1888, 583.2242, 656.0270, 667.3291, 709.3519, 710.3581, 711.3617, 712.3683, 713.3798, 991.6196 , 99 It is preferably at least one mass value selected from the group consisting of 2.6209, 1016.6113, 1020.4817, 1206.5305, 1207.5571, 1465.6184, 1466.6096, 1467.5969, 2450.9701, 2451.9662 and 2452.9546 m / z (with an error range of ± 0.1 m / z).
상기 제2종 판별 케이스들 중 상기 다수의 대장암 이외의 암 환자 케이스들은 유방암 환자 케이스들, 비호지킨림프종(non-Hodgkin lymphoma, NHL) 환자 케이스들 및 위암 환자 케이스들 중 적어도 하나 이상의 암 환자 케이스들을 포함하되, 상기 제2종 대장암 진단용 저질량 이온들의 질량값은 60.0476, 138.0540, 172.6653, 173.1158, 179.1451, 191.1277, 279.0855, 280.0895, 280.2642, 281.1440, 296.2574, 312.3248, 332.3224, 333.3324, 369.3406, 465.3161, 486.6356, 488.6882, 544.8908, 551.3287, 566.8737, 707.3475 및 733.3569 m/z (단, 오차 범위는 ±0.1 m/z)로 이루어진 그룹으로부터 선택된 하나 이상의 질량값인 것이 바람직하다.The cancer patient cases other than the plurality of colorectal cancer among the second type discrimination cases include at least one cancer patient case, non-Hodgkin lymphoma (NHL) patient case, and gastric cancer patient case Wherein mass values of the second type of colon cancer diagnostic low mass ions are 60.0476, 138.0540, 172.6653, 173.1158, 179.1451, 191.1277, 279.0855, 280.0895, 280.2642, 281.1440, 296.2574, 312.3248, 332.3224, 333.3324, 369.3406, 465.3161, At least one mass value selected from the group consisting of 486.6356, 488.6882, 544.8908, 551.3287, 566.8737, 707.3475 and 733.3569 m / z (with an error range of +/- 0.1 m / z).
상기 판별 점수는 상기 제1종 저질량 이온들에 의한 제1종 판별 점수와 상기 제2종 저질량 이온들에 의한 제2종 판별 점수를 포함하며, 상기 제1종 판별 점수가 CS11보다 크고, 상기 제2종 판별 점수가 CS21보다 큰 경우에는 상기 판별 대상을 대장암 양성으로 판단하고, 상기 제1종 판별 점수가 CS12보다 작거나 상기 제2종 판별 점수가 CS22보다 작은 경우에는 상기 판별 대상을 대장암 음성으로 판단할 수 있다. 상기 CS11, CS12, CS21 및 CS22는 0인 것이 바람직하다.Wherein the discrimination score includes a first type discrimination score by the first kind low mass ions and a second type discrimination score by the second kind low mass ions and the first type discrimination score is larger than CS 11 . If the second type discrimination score is greater than CS 21 , the discrimination object is judged to be colon cancer positive. If the first type discrimination score is smaller than CS 12 or the second type discrimination score is smaller than CS 22 It is possible to judge the discrimination object as colon cancer negative. Preferably, the CS 11 , CS 12 , CS 21, and CS 22 are zero.
상기 대장암진단용이온 선정수단을 이용해 획득한 대장암 환자와 정상인을 구분하는 저질량 이온군에는 피브리노겐(fibrinogen) 또는 피브리노겐 알파 체인(fibrinogen alpha chain)이 포함될 수 있다.The low-mass ionic group that distinguishes colon cancer patients and normal individuals obtained using the above-mentioned colon selection diagnostic ion selection means may include fibrinogen or fibrinogen alpha chain.
상기 대장암 환자와 정상인을 구분하는 저질량 이온군에는 트랜스타이레틴(transthyretin)이 포함될 수 있다.Transthyretin may be included in the low mass ion group which distinguishes between the colon cancer patient and the normal person.
상기 제1판별점수 계산수단은; 상기 훈련 후보 집합의 상기 저질량 이온 질량 스펙트럼들의 상기 피크 강도들을 정규화(normalization)하는 정규화 모듈; 상기 정규화한 피크 강도들을 스케일링(scaling)하는 스케일링 모듈; 및 상기 스케일링된 피크 강도들에 대해 상기 생물통계학적 분석을 수행하여 상기 판별 점수를 계산하는 판별점수계산 모듈을 포함할 수 있다.Wherein the first discrimination score calculating means comprises: A normalization module for normalizing the peak intensities of the low mass ion mass spectra of the training candidate set; A scaling module for scaling the normalized peak intensities; And a discrimination score calculation module for calculating the discrimination score by performing the biostatistical analysis on the scaled peak intensities.
상기 스케일링 모듈은; 파레토 스케일링(Pareto scaling)을 수행하는 것이 바람직하다.The scaling module comprising: It is preferable to perform Pareto scaling.
상기 판별점수계산 모듈은; 주성분 분석 기반 선형 판별 분석(principal component analysis-based linear discriminant analysis, PCA-DA)을 사용하여 상기 생물통계학적 분석을 수행할 수 있다.Wherein the discrimination score calculation module comprises: The above biostatistical analysis can be performed using principal component analysis-based linear discriminant analysis (PCA-DA).
상기 판별점수계산 모듈은; 상기 주성분 분석 기반 선형 판별 분석에 의해 획득된 인자적재값과 상기 스케일링된 피크 강도를 함께 사용하여 상기 판별 점수를 계산할 수 있다.Wherein the discrimination score calculation module comprises: The discriminant score can be calculated using both the factor load value obtained by the linear discriminant analysis based on the principal component analysis and the scaled peak intensity together.
상기 인자적재값 계산수단은; 상기 정렬된 질량 스펙트럼에 대해 생물통계학적 분석을 수행하고, 상기 생물통계학적 분석 결과를 기초로 상기 대장암 환자 및 비환자 케이스들 중 훈련 조건을 만족하는 훈련 케이스들을 제1훈련집합으로 선택하는 제1훈련집합 선택수단을 포함하며, 상기 제1훈련집합으로부터 인자적재값을 계산할 수 있다.The factor load value calculation means comprising: Performing a biostatistical analysis on the sorted mass spectrum and selecting training cases that satisfy training conditions among the colorectal cancer patients and non-patient cases based on the biostatistical analysis results as a first training set 1 training set selection means, and may calculate an argument load value from the first training set.
상기 제1훈련집합 선택수단은; 상기 생물통계학적 분석 결과에 따른 민감도가 문턱값(threshold) CN1 이상이고, 특이도가 문턱값 CN2 이상일 때의 대장암 환자 및 비환자 케이스들을 상기 제1훈련집합으로 설정할 수 있다. 상기 문턱값 CN1과 CN2는 1인 것이 바람직하다.Wherein the first training set selection means comprises: Patients with colorectal cancer and non-patient cases when the sensitivity according to the biostatistical analysis is equal to or greater than the threshold CN 1 and the specificity is equal to or greater than the threshold CN 2 may be set as the first training set. The threshold values CN 1 and CN 2 are preferably 1s.
상기 제2판별점수 계산수단은; 상기 판별 대상의 상기 저질량 이온 질량 스펙트럼의 상기 피크 강도들을 정규화하는 정규화 모듈; 상기 정규화한 피크 강도들을 스케일링하는 스케일링 모듈; 및 상기 스케일링된 피크 강도와 상기 인자적재값을 통해 상기 판별 점수를 계산하는 판별점수계산 모듈을 포함할 수 있다.And the second discrimination score calculating means comprises: A normalization module for normalizing the peak intensities of the low mass ion mass spectrum of the object to be discriminated; A scaling module for scaling the normalized peak intensities; And a discrimination score calculation module for calculating the discrimination score through the scaled peak intensity and the factor load value.
상기 스케일링 모듈은; 파레토 스케일링을 수행하는 것이 바람직하다.The scaling module comprising: It is preferable to perform Pareto scaling.
상기 판별점수계산 모듈은; 상기 대장암 진단용 저질량 이온들의 상기 스케일링된 피크 강도와 상기 인자적재값을 통해 상기 판별 점수를 계산할 수 있다.Wherein the discrimination score calculation module comprises: The discrimination score can be calculated through the scaled peak intensity of the low mass ions for colorectal cancer diagnosis and the factor load value.
상기 대장암 판정수단은; 상기 판별 점수에 따라 상기 판별 대상을 대장암의 양성 또는 음성으로 판정하되, 상기 판별 점수가 기준값 CS보다 크면 양성으로 상기 판별 대상의 대장암 정보를 판단하고, 상기 판별 점수가 기준값 CS보다 작으면 음성으로 상기 판별 대상의 대장암 정보를 판단할 수 있다. 상기 기준값 CS는 0인 것이 바람직하다.The colorectal cancer determining means comprises: The colorimetric information of the discrimination subject is judged to be positive if the discrimination score is greater than the reference value CS, and if the discrimination score is smaller than the reference value CS, The colon cancer information of the discrimination object can be determined. The reference value CS is preferably zero.
상기 대장암 판정수단은; 상기 판별 대상의 생물학적 시료를 반복적으로 측정하여 검출한 다수의 상기 저질량 이온 질량 스펙트럼에 대해 계산된 다수의 상기 판별 점수의 평균값으로 상기 판별 대상의 상기 대장암 정보를 판단할 수 있다.The colorectal cancer determining means comprises: The colorectal cancer information of the discrimination object can be judged from the average value of a plurality of the discrimination scores calculated for a plurality of the low mass ion mass spectra detected by repeatedly measuring the biological sample to be discriminated.
상기 대장암진단용이온 선정수단은; 상기 선택된 상기 제1훈련집합으로부터 후보 조건을 만족하는 후보 저질량 이온들을 후보이온집합으로 선택하는 후보이온집합 선택수단; 및 상기 선택된 상기 후보이온집합의 상기 후보 저질량 이온의 개별 또는 조합별 판별 성능을 기반으로 하여 대장암 진단용 저질량 이온들을 최종이온집합으로 선택하는 최종이온집합 선택수단을 포함할 수 있다.The colon cancer diagnostic ion selecting means comprises: Candidate ion set selection means for selecting candidate low-mass ions satisfying a candidate condition from the selected first training set as a candidate ion set; And final ion set selection means for selecting low mass ions for colorectal cancer diagnosis as a final ion set based on the discrimination performance of individual candidate or low mass ions of the selected candidate ion set or combination thereof.
상기 후보이온집합 선택수단은; 상기 훈련 케이스 각각에 대한 상기 저질량 이온의 상기 피크 강도와, 상기 생물통계학적 분석을 통해 획득된 상기 저질량 이온별 인자적재값의 곱의 절댓값이 문턱값 CT1보다 큰 제1저질량 이온들을 상기 훈련 케이스별로 선택하는 제1저질량이온 선택모듈을 포함할 수 있다. 상기 문턱값 CT1은 0.1인 것이 바람직하다.The candidate ion set selection means comprises: Wherein a peak intensity of the low mass ion for each of the training cases and an absolute value of a product of the low mass ion charge accumulation value obtained through the biostatistical analysis is greater than a threshold CT 1 And a first low mass ion selection module to select for each training case. The threshold CT 1 is preferably 0.1.
상기 후보이온집합 선택수단은; 상기 제1저질량 이온들 중 상기 훈련 케이스들 전체의 문턱값 CT2 퍼센트 이상의 케이스들에서 공통으로 나타나는 제2저질량 이온들을 상기 후보이온집합으로 선택하는 후보이온집합 예비선택모듈을 포함할 수 있다. 상기 문턱값 CT2는 50인 것이 바람직하다.The candidate ion set selection means comprises: And a candidate ion cluster pre-selection module for selecting the second low-mass ions among the first low-mass ions as the candidate ion cluster, the second low-mass ions being commonly present in cases of CT 2 percent or more of the thresholds of the entire training cases . The threshold CT 2 is preferably 50.
상기 후보이온집합 선택수단은; 상기 제2저질량 이온들을 이용해 상기 훈련 케이스별로 대장암에 대한 양성 또는 음성을 나타내는 판별 점수를 계산하고, 상기 판별 점수에 따른 민감도 및 특이도를 계산하는 민감도 및 특이도 계산모듈; 및 상기 민감도가 문턱값 CN3보다 작거나, 상기 특이도가 문턱값 CN4보다 작은 경우 상기 CT1 및 상기 CT2 중 적어도 하나를 변경하고, 상기 과정을 반복하여 상기 후보이온집합으로 선택하는 후보이온집합 최종선택모듈을 더 포함할 수 있다. 상기 문턱값 CN3 및 CN4는 0.9인 것이 바람직하다.The candidate ion set selection means comprises: A sensitivity and specificity calculating module for calculating a discrimination score indicating positive or negative for colorectal cancer in each training case using the second low-mass ions, and calculating sensitivity and specificity according to the discrimination score; And changing at least one of CT 1 and CT 2 when the sensitivity is smaller than a threshold value CN 3 or the specificity is smaller than a threshold value CN 4 and repeating the process to select the candidate ion set Ion collection final selection module. The thresholds CN 3 and CN 4 are preferably 0.9.
상기 최종이온집합 선택수단의 상기 판별 성능의 기준은; 상기 후보 저질량 이온 중 민감도와 특이도의 합이 기준값보다 큰 이온들을 선택하거나 상기 후보 저질량 이온들로 구성되는 조합별 민감도와 특이도의 합이 비교 대상 조합들 중 가장 큰 조합을 선택하는 제1기준을 포함할 수 있다.The criterion of the discrimination performance of the final ion set selection means is: Wherein the sum of the sensitivity and the specificity among the candidate low mass ions is larger than the reference value or the sum of the sensitivity and the specificity of each combination of the candidate low mass ions is greater than the sum of the sensitivity and the specificity, 1 criteria.
상기 최종이온집합 선택수단의 상기 판별 성능의 기준은; 상기 후보 저질량 이온들의 조합들 중 상기 후보 저질량 이온들의 개수가 비교 대상 조합들 중 가장 적은 조합을 선택하는 제2기준을 더 포함할 수 있다.The criterion of the discrimination performance of the final ion set selection means is: And a second criterion in which the number of the candidate low mass ions among the combinations of the candidate low mass ions is selected as the least combination of the comparison targets.
상기 최종이온집합 선택수단의 상기 판별 성능의 기준은; 상기 후보 저질량 이온들의 조합들 중 진양성(true positive) 케이스의 최소 판별 점수와 진음성(ture negative) 케이스의 최대 판별 점수의 차가 비교 대상 조합들 중 가장 큰 조합을 선택하는 제3기준을 더 포함하며, 상기 판별 점수는 상기 후보 저질량 이온들의 상기 스케일링된 피크 강도와 상기 인자적재값을 통해 계산되며, 대장암에 대한 양성 또는 음성을 나타내는 것이 바람직하다.The criterion of the discrimination performance of the final ion set selection means is: The difference between the minimum discrimination score of the true positive case and the maximum discrimination score of the true negative case among the combinations of the candidate low mass ions is the third criterion for selecting the largest combination of the comparison object combinations Wherein the discrimination score is calculated through the scaled peak intensity of the candidate low mass ions and the factor load value and is preferably positive or negative for colorectal cancer.
상기 최종이온집합 선택수단은; 상기 후보이온집합에 포함된 상기 후보 저질량 이온들을 상기 민감도가 상기 특이도보다 높은 고민감도 저질량 이온들을 포함하며 상기 고민감도 저질량 이온들을 상기 민감도와 상기 특이도의 합의 내림차순으로 정렬한 고민감도 집합{Sns1, Sns2, Sns3 … SnsI}과, 상기 특이도가 상기 민감도보다 높은 고특이도 저질량 이온들을 포함하며 상기 고특이도 저질량 이온들을 상기 민감도와 상기 특이도의 합의 내림차순으로 정렬한 고특이도 집합{Spc1, Spc2, Spc3 … SpcJ}으로 구분하는 이온 구분모듈; 상기 고민감도 집합에서 상위 L개의 상기 고민감도 저질량 이온들{Sns1, Sns2, Sns3 … SnsL}과 상기 고특이도 집합에서 상위 L개의 상기 고특이도 저질량 이온들{Spc1, Spc2, Spc3 … SpcL} 중 2개 이상의 저질량 이온들로 구성되는 후보 조합들 중 상기 제1기준, 상기 제2기준 및 상기 제3기준 중 적어도 하나 이상에 의한 상기 판별 성능의 기준에 의해 선택된 조합을 바이오마커 그룹으로 선정하는 바이오마커그룹 예비선정모듈; 상기 바이오마커 그룹과, 상기 고민감도 집합에서 차상위 M개의 상기 고민감도 저질량 이온들과 상기 고특이도 집합에서 차상위 M개의 상기 고특이도 저질량 이온들 중 적어도 하나 이상의 저질량 이온을 상기 바이오마커 그룹에 추가한 후보 조합들 중 상기 제1기준, 상기 제2기준 및 상기 제3기준 중 적어도 하나 이상에 의한 상기 판별 성능의 기준에 의해 선택된 조합을 상기 바이오마커 그룹으로 재선정하는 바이오마커그룹 재선정모듈; 및 상기 고민감도 집합 및 상기 고특이도 집합에 차상위 저질량 이온이 존재하지 않을 때까지 상기 재선정 과정을 반복하여 상기 바이오마커 그룹을 최종 선정하는 바이오마커그룹 최종선정모듈을 포함할 수 있다.Said final ion set selection means comprising: Wherein the candidate low-mass ions included in the candidate ion set include high-sensitivity low-mass ions whose sensitivity is higher than the specificity, and high sensitivity that aligns the high-sensitivity low-mass ions in descending order of the sensitivity and the specificity The set {Sns 1 , Sns 2 , Sns 3 ... Sns I }, a high specificity set {Spc 1 , Sns I } comprising the high specificity low mass ions whose specificity is higher than the sensitivity, and sorting the high specific low mass ions in descending order of the sensitivity and the specificity, Spc 2 , Spc 3 ... Spc J }; The high-sensitivity low-mass ions {Sns 1 , Sns 2 , Sns 3 ... Sns L } and the high-order L low-mass ions {Spc 1 , Spc 2 , Spc 3 ... Of the candidate combination consisting of Spc L} of two or more of the low mass ions the first reference and the second reference and the third the combination selected by the criterion for the discrimination performance by at least one of the reference biomarker A biomarker group pre-selection module to be selected as a group; Wherein said biomarker group comprises at least one of the above-mentioned high-sensitivity low-mass ions at the next higher-order M in said hypertonic sensitivity set and at least one of said high-specific low- A re-selection of a biomarker group reassigning the combination selected by the criterion of the discrimination performance by at least one of the first criterion, the second criterion and the third criterion among the candidate combinations added to the group to the biomarker group module; And a biomarker group final selection module for finalizing the biomarker group by repeating the re-selection process until there is no next-low mass ion in the hyper-sensitivity set and the high-specificity set.
상기 최종이온집합 선택수단은; 상기 후보이온집합에서 상기 바이오마커그룹 최종선정모듈에서 얻어진 상기 바이오마커 그룹으로 선정 완료된 조합의 저질량 이온들을 제외한 잔류 후보이온집합을 대상으로 상기 세 바이오마커 그룹 선정 과정을 반복 수행하여 추가 바이오마커 그룹을 선정하되, 상기 고민감도 집합 또는 상기 고특이도 집합에 상기 L개 미만의 질량 이온이 남을 때까지 상기 추가 바이오마커 그룹을 더 선정하는 바이오마커그룹 추가선정모듈; 및 상기 바이오마커 그룹과 상기 추가 바이오마커 그룹들 중 진양성 및 진음성 판정의 정확도(accuracy)를 기준으로 상위 CK개의 바이오마커 그룹들의 조합의 저질량 이온들을 상기 대장암 진단용 저질량 이온으로 선택하는 암진단용저질량이온 최종선택모듈을 더 포함할 수 있다. 상기 L값은 2이고, 상기 M값은 1이며, 상기 CK값은 1, 2 또는 3 중 어느 하나인 것이 바람직하다.Said final ion set selection means comprising: The remaining candidate ion sets excluding the combination of the low-mass ions selected as the biomarker group obtained in the biomarker group final selection module in the candidate ion set are repeatedly subjected to the selection process of the three biomarker groups, A biomarker group addition selecting module for further selecting the additional biomarker group until the L or less mass ions remain in the hyperhidimetic sensitivity set or the high specificity set; And selecting low mass ions of the combination of the upper CK biomarker groups based on the accuracy of the true positive and negative negative determinations among the biomarker group and the additional biomarker groups as the low mass ion for colon cancer diagnosis And a low mass ion final selection module for cancer diagnosis. Preferably, the L value is 2, the M value is 1, and the CK value is 1, 2, or 3.
상기 최종이온집합 선택수단은, 상기 제1훈련집합에 대해 독립적인 제2훈련집합을 상기 제1훈련집합에 추가한 훈련 집합을 대상으로 저질량 이온 선택 과정을 진행하는 것이 바람직하다.
The final ion set selection means preferably performs a low mass ion selection process on a training set in which a second training set independent of the first training set is added to the first training set.
본 발명에 따른 대장암 진단 장치는, CRC 진단의 경우 분석 비용이 매우 낮으며, 분석 시간이 짧고, 대규모 분석이 가능하다는 장점이 있다. 과정을 간략히 설명하면, 혈액 내 저질량 이온의 질량 스펙트럼을 측정하고, 그 중 CRC 진단용 저질량 이온들의 질량값에 대응하는 피크 강도들을 추출하여 간단한 계산을 거치면 바로 CRC에 대한 양성/음성 정보를 제공할 수 있다. The diagnosis apparatus for colorectal cancer according to the present invention has an advantage that the analysis cost is very low in the case of CRC diagnosis, the analysis time is short, and large-scale analysis is possible. In brief, the mass spectra of low-mass ions in the blood are measured, peak intensities corresponding to the mass values of low mass ions for CRC diagnosis are extracted, and positive / negative information for CRC is obtained by simple calculation can do.
또한, 판별 성능이 우수하고 강건하여, CRC를 대상으로 한 경우 훈련 집합뿐 아니라 검증 집합의 판별에서도 민감도, 특이도, 양성예측도, 음성 예측도가 모두 85% 이상임을 확인하였다. 또한, CRC 환자 및 비환자 집합을 다른 질병의 환자 및 비환자 집합으로 변경하는 것을 통해 다양한 질병에 유용하게 적용될 수 있다. In addition, it was confirmed that sensitivity, specificity, positive predictive value, and negative predictive value were more than 85% in the discrimination of not only the training set but also the verification set when the discrimination performance was excellent and robust. In addition, it can be usefully applied to various diseases by changing CRC patient and non-patient aggregation to other disease patient and non-patient aggregation.
또한, CRC를 대상으로 한 경우 분변을 분석 시료로 하는 FOBT와 비교하면, 혈액을 분석 시료로 사용할 수 있으므로 다른 검사와 더불어 분석할 수 있어, 종래의 기술에 비하여 편리하고 신속하게 CRC 정보를 제공할 수 있다. CRC 진단용 저질량 이온들을 사용하는 경우 기존 FOBT의 판별 성능과 비교하면 특이도 측면에서는 필적하는 성능을 보이고 민감도 측면에서는 월등히 우수한 성능을 나타냄을 확인하였다.
In comparison with FOBT, which uses feces as an analytical sample, CRC can be used as an analytical sample. Therefore, analysis can be performed in addition to other tests, so that CRC information can be conveniently and quickly provided . In the case of using low mass ions for CRC diagnosis, compared with the discrimination performance of the conventional FOBT, it showed comparable performance in terms of specificity and superior performance in terms of sensitivity.
도 1 및 2는 종래 기술을 설명하기 위한 도면으로,
도 1은 종래 기술에 따라 저질량 이온 질량 스펙트럼을 사용하여 CRC를 판정하는 과정을 설명하는 순서도,
도 2는 종래 기술에 따라 CRC 환자군 133명과 정상 대조군 153명으로 구성된 집합을 판정한 결과를 도시한 그래프이다.
도 3 내지 20은 본 발명의 바람직한 일 실시 예에 따른 대장암 진단 장치를 설명하기 위한 도면으로,
도 3은 본 발명의 바람직한 일 실시 예에 따른 대장암 진단 장치를 나타낸 블록도.
도 4는 도 3의 대장암 진단부를 더욱 상세히 나타낸 블록도,
도 5는 도 3의 제1판별점수 계산수단을 더욱 상세히 나타낸 블록도,
도 6은 도 3의 제2판별점수 계산수단을 더욱 상세히 나타낸 블록도,
도 7은 도 3의 대장암진단용이온 선정수단을 더욱 상세히 나타낸 블록도,
도 8은 도 7의 후보이온집합 선택수단을 더욱 상세히 나타낸 블록도,
도 9는 도 7의 최종이온집합 선택수단을 더욱 상세히 나타낸 블록도,
도 10은 본 발명에 따른 민감도와 특이도가 소정의 값을 갖는 제1훈련집합 A0를 선정하고 질량 이온별 가중치를 계산하는 과정을 설명하는 순서도,
도 11은 판별 대상 시료에 판별식을 적용하는 과정을 설명하는 순서도,
도 12는 제1훈련집합 A01에서 계산한 질량 이온별 가중치로 집합 A1을 판정한 결과를 도시한 그래프,
도 13은 제1훈련집합 A02에서 계산한 질량 이온별 가중치로 집합 A1을 판정한 결과를 도시한 그래프,
도 14는 본 발명에 따른 예비 판별식을 구성하는 과정을 설명하는 순서도,
도 15는 제1종 예비 판별식으로 집합 A1을 판정한 결과를 도시한 그래프,
도 16은 제2종 예비 판별식으로 집합 A1을 판정한 결과를 도시한 그래프,
도 17은 본 발명에 따른 최종 판별식을 구성하는 과정을 설명하는 순서도,
도 18은 집합 A의 5회 반복 측정한 질량 스펙트럼들에 대해 본 발명의 최종 판별식에 따라 판별 점수를 계산한 후 평균 판별 점수(mean DS)를 구하여 판정한 결과를 도시한 그래프,
도 19는 본 발명의 최종 판별식에 따라 평균 판별 점수를 계산하여 5회 반복 측정한 집합 B를 판정한 결과를 도시한 그래프,
도 20a는 본 발명에 따른 방법에 의하여 확인된 제1종 CRC 진단용 저질량 이온들의 질량값 중 1465.6184 m/z을 동정한 결과를 도시한 그래프,
도 20b는 본 발명에 따른 방법에 의하여 확인된 제1종 CRC 진단용 저질량 이온들의 질량값 중 2450.9701 m/z을 동정한 결과를 도시한 그래프이다.1 and 2 are views for explaining a conventional technique,
1 is a flow chart illustrating a process for determining a CRC using a low mass ion mass spectrum in accordance with the prior art,
FIG. 2 is a graph showing a result of determination of a set consisting of 133 CRC patients and 153 normal controls according to the prior art.
3 to 20 are views for explaining a colon cancer diagnosis apparatus according to a preferred embodiment of the present invention,
FIG. 3 is a block diagram showing a colon cancer diagnostic apparatus according to a preferred embodiment of the present invention. FIG.
FIG. 4 is a block diagram showing the colon cancer diagnosis unit of FIG. 3 in more detail;
FIG. 5 is a block diagram showing the first discrimination score calculating means of FIG. 3 in more detail;
FIG. 6 is a block diagram showing the second discrimination score calculating means of FIG. 3 in more detail;
FIG. 7 is a block diagram showing the colon cancer diagnostic ion selecting means of FIG. 3 in more detail;
FIG. 8 is a block diagram showing the candidate ion set selection means of FIG. 7 in more detail;
Fig. 9 is a block diagram showing the final ion set selection means of Fig. 7 in more detail;
FIG. 10 is a flowchart for explaining a process of selecting a first training set A 0 having sensitivity and specificity of a predetermined value according to the present invention and calculating a weight-by-
11 is a flow chart for explaining a process of applying a discrimination equation to a sample to be discriminated,
FIG. 12 is a graph showing the result of determination of the set A 1 by the weight-by-mass weight calculated in the first training set A 01 ,
Figure 13 A graph showing the result of determination of the set A 1 by the weight-by-mass weight calculated in the first training set A 02 ,
FIG. 14 is a flowchart for explaining the process of constructing the preliminary discrimination formula according to the present invention,
FIG. 15 is a graph showing the results of determination of the set A 1 in the first type discrimination formula,
16 is a cross- A graph showing the result of judging the set A 1 by the second type preliminary discrimination formula,
17 is a flowchart for explaining the process of configuring the final discrimination formula according to the present invention,
FIG. 18 is a graph showing the results of determining the mean scores (mean DS) after calculating the discrimination scores according to the final discrimination formulas of the mass spectra measured five times repeatedly in the set A,
FIG. 19 is a graph showing a result of determination of the set B repeatedly measured five times by calculating the average discrimination score according to the final discrimination formula of the present invention,
20A is a graph showing the results of identifying 1465.6184 m / z among the mass values of the low-mass ions for the first kind of CRC diagnosed by the method according to the present invention,
FIG. 20B is a graph showing the results of identifying 2450.9701 m / z among the mass values of the low-mass ions for the first kind of CRC diagnosed by the method according to the present invention.
1. 용어의 정의1. Definition of Terms
본 발명에서, "생물학적 시료"는 전혈(whole blood), 혈청, 혈장(plasma), 요, 분변, 객담(sputum), 타액, 조직, 세포, 세포 추출물, 체외 세포 배양물 등과 같은 시료들을 포함하나, 이에 제한되지 않는다. 아래에 기술되는 실시 예에서는 환자 또는 비환자의 혈청을 생물학적 시료로 사용하였다.In the present invention, the "biological sample" includes samples such as whole blood, serum, plasma, urine, feces, sputum, saliva, tissues, cells, cell extracts, , But is not limited thereto. In the examples described below, sera from patients or non-patients was used as a biological sample.
본 발명에서, "피크 강도"는 MALDI-TOF 질량분석기로부터 얻어지는 값을 말하며, 피크에 해당하는 질량 이온의 양과 상관 관계를 가진다. In the present invention, "peak intensity" refers to a value obtained from a MALDI-TOF mass spectrometer and has a correlation with an amount of a mass ion corresponding to a peak.
본 발명에서, "정규화"는 데이터(data)의 범위를 일치시키거나 분포를 유사하게 만들어 주는 것을 말하며, 평균값(mean), 중간값(median) 등을 이용하여 정규화할 수 있으나 이에 제한되지 않고, 경우에 따라 다양한 공지의 방법들이 적용될 수 있다. 본 실시 예에서는 각 시료별 피크 강도들의 소계를 구하고, 시료별 소계들의 평균을 구한 후, 각 시료별 피크 강도들의 소계가 이 평균과 일치하도록 각 피크 강도에 시료별 배율 인자를 곱하는 방식으로 정규화하였다. 즉, 이와 같이 정규화한 후에는 각 시료별 피크 강도들의 소계가 동일해진다.In the present invention, "normalization" refers to matching the range of data or making the distribution similar, and may be normalized using mean, median, Various known methods may be applied in some cases. In this embodiment, the subtotal of the peak intensities for each sample is obtained, and the average of the sub-fields for each sample is obtained. Then, each peak intensity is normalized by multiplying the peak intensity by the sample magnification factor so that the subtotal of the peak intensities for each sample coincides with this average . That is, after the normalization as described above, the subtotal of the peak intensities of the respective samples becomes equal.
본 발명에서, "파레토 스케일링"은 정규화한 각 피크 강도에서 질량 이온별 평균값을 뺀 후 표준편차의 제곱근으로 나누는 것을 말한다. 보다 일반적인 스케일링 방법인 오토스케일링(autoscaling)에서는 표준편차로 나누는 것을 통해 데이터의 크기 정보를 완전히 상쇄시키는 것에 비해, 파레토 스케일링에서는 데이터의 크기 정보를 부분적으로 유지하는 것을 통해 노이즈(noise)의 증폭을 피할 수 있다는 장점이 있다.In the present invention, "Pareto scaling" refers to subtracting the mean value of each mass ion at each peak intensity normalized and dividing by the square root of the standard deviation. In autoscaling, a more general scaling method, data size information is completely canceled by dividing by standard deviation. In Pareto scaling, partial amplification of data size information is avoided to prevent amplification of noise. There is an advantage that it can be.
본 발명에서, "가중치"는 가중치를 곱한 후의 데이터의 수치적 크기가 통계적 관점에서의 중요성에 비례하도록 조정하는 인자를 말하는데, 아래에 기술되는 실시 예에서 주성분 분석 기반 선형 판별 분석의 결과로 획득되는 질량 이온별 인자적재값을 가중치의 일례라 할 수 있다.In the present invention, "weight" refers to a factor that adjusts the numerical magnitude of the data after multiplying the weight by proportional to its significance from a statistical point of view, which is obtained as a result of principal component analysis based linear discriminant analysis An example of weighting factor loadings for mass ions is an example.
본 발명에서, "저질량 이온"은 MALDI-TOF 질량분석기 등을 이용하여 획득한 질량값이 1500 m/z보다 작은 이온을 의미한다. CRC 진단용 저질량 이온들 중 일부는 이 범위보다 더 높은 질량값을 가지기도 하나, 대부분이 이 범위 내에 들어오므로 이 경우에도 저질량 이온이라는 명칭을 그대로 사용하려고 한다. 즉, 1500 m/z이라는 한계는 확정적인 값이 아니라 대략적인 값의 의미로 사용된 것이다. In the present invention, "low mass ion" means an ion having a mass value obtained using a MALDI-TOF mass spectrometer or the like, which is smaller than 1500 m / z. Some of the low mass ions for CRC diagnosis have higher mass values than this range, but most of them fall within this range, so we will use the name of low mass ion as it is. That is, the limit of 1500 m / z is used as a rough value rather than a definite value.
본 발명에서, MALDI-TOF 질량분석기에 의해 측정된 질량값은 "±0.05 m/z"의 오차 범위를 포함한다. 실험 환경에 따라 질량값 측정치에 다소의 오차가 발생할 수 있기 때문이다. 예를 들어, 청구범위에 기재된 1467.5969 m/z의 질량값은 실제로 1467.5469 m/z 내지 1467.6469 m/z의 범위를 갖는 것으로 이해되어야 한다. 실험 환경에 따라 오차 범위는 "±0.1 m/z"일 수 있다.In the present invention, the mass value measured by a MALDI-TOF mass spectrometer includes an error range of "± 0.05 m / z. This is because some error may occur in the mass value measurement depending on the experimental environment. For example, it should be understood that the mass value of 1467.5969 m / z described in the claims actually has a range of 1467.5469 m / z to 1467.6469 m / z. Depending on the experimental environment, the error range can be "± 0.1 m / z".
본 발명에서, MALDI-TOF 질량분석기에 의해 측정된 질량값은 MALDI-TOF 질량분석기의 포지티브 모드(positive mode)에서 획득된 질량값임에 유의한다.Note that in the present invention, the mass value measured by a MALDI-TOF mass spectrometer is a mass value obtained in a positive mode of a MALDI-TOF mass spectrometer.
본 발명에서, 가중치 벡터(vector)의 부호는 판별 점수가 양수인 경우 양성으로 판정되고 음수인 경우 음성으로 판정되도록 조정한다. 주성분 분석에서의 인자적재값 벡터는 수학적으로 고유벡터(eigenvector)에 해당하는데, 이 벡터의 부호는 임의로 정할 수 있다. 즉, 계산된 질량 이온별 인자적재값에 전체적으로 -1을 곱하여 부호를 변경한다고 하여도 수학적으로는 동일한 고유치 문제(eigenvalue problem)에 대한 동등한 해라고 할 수 있으나, 판별 점수가 음수인 경우를 양성으로 양수인 경우를 음성으로 판정하게 된다. 본 발명에서는 판별 점수가 양수인 경우 양성으로 판정되고 음수인 경우 음성으로 판정되도록 고유벡터의 부호를 조정하였으나, 본 발명의 범위가 이에 제한되지 않음에 유의한다.In the present invention, the sign of the weight vector is adjusted to be positive when the discrimination score is a positive number and negative when it is negative. The factor load vector in the principal component analysis mathematically corresponds to an eigenvector, and the sign of this vector can be arbitrarily set. In other words, even if we change the code by multiplying the computed mass-coefficient-by-factor loadings by -1 as a whole, it is mathematically equivalent to the same eigenvalue problem, but if the discriminant score is negative, And the case of positive is judged by voice. In the present invention, the sign of the eigenvector is adjusted to be positive when the discrimination score is positive and negative when it is negative, but it is noted that the scope of the present invention is not limited thereto.
또한, 본 발명에서, “판별 점수”라 함은 생물학적 시료로부터 추출한 질량 스펙트럼에 대해 생물통계학적 분석을 통해 계산된 값으로, 이것을 기반으로 하여 특정 암의 양성 또는 음성을 판정할 수 있다. 판정 방식은 계산된 판별 점수가 특정 기준값보다 큰지 여부를 판단하는 간단한 방식이 사용될 수도 있고, 계산된 판별 점수를 입력으로 하여 판정 결과를 출력으로 주는 함수가 사용될 수 있다.In the present invention, the " discrimination score " is a value calculated from a biostatistical analysis of a mass spectrum extracted from a biological sample, and based on this, the positive or negative of a specific cancer can be determined. The determination method may be a simple method of determining whether the calculated determination score is greater than a specific reference value or a function of inputting the calculated determination score and outputting the determination result as an output.
본 발명의 실시 예에서는 판별 점수라는 용어를 특정하여 사용하였으나, 본 발명에서 정의하는 상기 판별 점수는 판별 레벨(level), 판별값(value) 등의 다양한 형태의 용어로 기재될 수 있다. 따라서, 본 발명에서 정의하는 판별 점수라는 용어는 사전적 의미의 판별 점수라는 용어에 한정되지 않으며, 본 발명의 정의에 따라 판별 점수를 의미하는 상기 판별 레벨과 판별값, 또는 이와 유사한 다양한 용어들을 모두 포함하는 것으로 해석되어야 한다.In the embodiment of the present invention, the term "discrimination score" is specified and used. However, the discrimination score defined in the present invention may be expressed in various types of terms such as a discrimination level and a discrimination value. Therefore, the term " discriminant score " defined in the present invention is not limited to the term " discriminant score " in the dictionary meaning, but may be the sum of the discriminant level, discriminant value, Should be construed as including.
또한, 본 발명에서, “판별 성능”이라 함은 기본적으로 민감도, 특이도, 양성예측도, 음성예측도 및 정확도 등의 지표를 수치로 나타낸 것을 의미한다. 또한, 이 지표들의 함수로 계산되는 값을 의미하기도 한다. 예를 들어, 민감도, 특이도, 양성예측도, 음성예측도 및 정확도 등의 각각의 값이 판별 성능으로 사용될 수 있으며, 또는 민감도와 특이도의 합, 민감도와 양성예측도의 합, 음성예측도와 정확도의 합 등의 2 이상의 합이 판별 성능으로 사용될 수도 있다.
In the present invention, the term " discriminant performance " means basically indicating numerical values such as sensitivity, specificity, positive predictive value, negative predictive value, and accuracy. It also means a value calculated as a function of these indicators. For example, each value of sensitivity, specificity, positive predictive value, negative predictive value, and accuracy can be used as the discriminant performance, or the sum of sensitivity and specificity, sum of sensitivity and positive predictive value, The sum of two or more such as the sum of the accuracy may be used as the discrimination performance.
이하, 실시 예를 통하여 본 발명을 더욱 상세히 설명한다. 기술되는 실시 예는 본 발명을 예시적으로 설명하기 위한 것이며 본 발명의 권리범위가 실시 예에 한정되는 것은 아님을 밝혀둔다.
Hereinafter, the present invention will be described in more detail by way of examples. It is to be understood that the embodiments described are intended to illustrate the present invention and the scope of the present invention is not limited to the embodiments.
2. 실시 예2. Example
도 3 내지 20은 본 발명의 바람직한 일 실시 예에 따른 대장암 진단 장치를 설명하기 위한 도면이다. 3 to 20 are views for explaining a colon cancer diagnosis apparatus according to a preferred embodiment of the present invention.
먼저, 도 3은 본 발명의 바람직한 일 실시 예에 따른 대장암 진단 장치를 나타낸 블록도로서, 도시된 바와 같이 본 발명에 따른 대장암 진단 장치는, 다수의 대장암 환자 및 비환자 케이스들의 생물학적 시료로부터 저질량 이온의 질량 스펙트럼을 검출하는 저질량 이온 검출부(1000); 상기 저질량 이온의 질량 스펙트럼 패턴을 비교 분석하여 대장암 진단 정보를 판정하는 대장암 진단부(2000); 및 상기 대장암 진단부(2000)로부터 판정된 대장암 진단 정보를 출력 가능한 형태로 변환하여 표시하는 디스플레이부(3000)를 포함한다.FIG. 3 is a block diagram illustrating a colon cancer diagnostic apparatus according to an exemplary embodiment of the present invention. As shown in FIG. 3, the diagnostic apparatus for colon cancer according to the present invention includes a plurality of colorectal cancer patients and non-
상기 저질량 이온 검출부(1000)는; 상기 생물학적 시료로부터 저질량 이온의 특정 정보 예로서, 피크 강도를 검출하여 상기 저질량 이온의 질량 스펙트럼을 추출할 수 있다. 이를 위하여, 상기 저질량 이온 검출부(1000)는 질량분석기를 포함할 수 있다.The low
상기 디스플레이부(3000)는; 모니터 화면, 휴대 단말기의 액정 화면 등의 디스플레이 디바이스에 상기 판정된 암 진단 정보를 문자, 숫자 또는 도형 등의 다양한 출력 형태로 변환하여 표시할 수 있다.The
도 4는 도 3의 대장암 진단부를 더욱 상세히 나타낸 블록도로서, 도시된 바와 같이 상기 대장암 진단부(2000)는; 훈련 후보 집합인 상기 대장암 환자 및 비환자 케이스들의 저질량 이온 질량 스펙트럼들을 정렬하는 제1정렬수단(2100); 정렬된 상기 질량 스펙트럼에 대해 생물통계학적 분석을 수행하여 판별 점수를 계산하는 제1판별점수 계산수단(2200); 상기 판별 점수에 따라 민감도 및 특이도를 계산하고, 이를 기준으로 제1훈련집합을 선정하여 저질량 이온별 인자적재값을 계산하는 인자적재값 계산수단(2300); 후보 조건을 만족하는 후보 저질량 이온들 중 판별 성능을 기반으로 하여 대장암 진단용 저질량 이온들을 선택하는 대장암진단용이온 선정수단(2400); 판별 대상 생물학적 시료의 저질량 이온 질량 스펙트럼을 상기 제1훈련집합에 정렬하는 제2정렬수단(2500); 상기 판별 대상의 저질량 이온의 피크 강도와 상기 인자적재값으로부터 판별 점수를 계산하는 제2판별점수 계산수단(2600); 및 상기 판별 점수에 따라 상기 판별 대상을 대장암의 양성 또는 음성으로 판정하는 대장암 판정수단(2700)을 포함할 수 있다.FIG. 4 is a detailed block diagram of the colon cancer diagnosis unit of FIG. 3, wherein the colon
상기 대장암진단용이온 선정수단(2400)은; 상기 다수의 대장암 환자 및 비환자 케이스들을, 다수의 대장암 환자 케이스들과 다수의 정상인 케이스들로 구성되는 제1종 판별 케이스들과, 상기 다수의 대장암 환자 케이스들과 다수의 대장암 이외의 암 환자 케이스들로 구성되는 제2종 판별 케이스들로 구분하고, 상기 제1종 판별 케이스들과 상기 제2종 판별 케이스들에 대해 각각 실행되어, 상기 대장암 진단용 저질량 이온들이 상기 제1종 판별 케이스에 대한 제1종 대장암 진단용 저질량 이온들과 상기 제2종 판별 케이스에 대한 제2종 대장암 진단용 저질량 이온들로 구분되도록 한다.The colon cancer diagnostic
상기 인자적재값 계산수단(2300)은; 상기 정렬된 질량 스펙트럼에 대해 생물통계학적 분석을 수행하고, 상기 생물통계학적 분석 결과를 기초로 상기 대장암 환자 및 비환자 케이스들 중 훈련 조건을 만족하는 훈련 케이스들을 제1훈련집합으로 선택하는 제1훈련집합 선택수단(2310)을 포함할 수 있으며, 상기 제1훈련집합으로부터 인자적재값을 계산할 수 있다.The parameter value calculation means (2300) comprises: Performing a biostatistical analysis on the sorted mass spectrum and selecting training cases that satisfy training conditions among the colorectal cancer patients and non-patient cases based on the biostatistical analysis results as a first training set 1 training set selection means 2310 and may calculate an argument load value from the first training set.
상기 제1훈련집합 선택수단(2310)은; 상기 생물통계학적 분석 결과에 따른 민감도가 문턱값 CN1 이상이고, 특이도가 문턱값 CN2 이상일 때의 대장암 환자 및 비환자 케이스들을 상기 제1훈련집합으로 설정할 수 있다. 여기서, 상기 문턱값 CN1과 CN2는 1인 것이 바람직하다.The first training set selection means (2310) comprises: The case of colon cancer patients and non-patient cases when the sensitivity according to the biostatistical analysis is equal to or greater than the threshold CN 1 and the specificity is equal to or greater than the threshold CN 2 may be set as the first training set. Here, the threshold values CN 1 and CN 2 are preferably 1s.
상기 대장암 판정수단(2700)은; 상기 판별 점수에 따라 상기 판별 대상을 대장암의 양성 또는 음성으로 판정하되, 상기 판별 점수가 기준값 CS보다 크면 양성으로 상기 판별 대상의 대장암 정보를 판단하고, 상기 판별 점수가 기준값 CS보다 작으면 음성으로 상기 판별 대상의 대장암 정보를 판단할 수 있다. 여기서, 상기 기준값 CS는 0인 것이 바람직하다.The colorectal cancer determining means (2700) comprises: The colorimetric information of the discrimination subject is judged to be positive if the discrimination score is greater than the reference value CS, and if the discrimination score is smaller than the reference value CS, The colon cancer information of the discrimination object can be determined. Here, the reference value CS is preferably zero.
상기 대장암 판정수단(2700)은; 상기 판별 대상의 생물학적 시료를 반복적으로 측정하여 검출한 다수의 상기 저질량 이온 질량 스펙트럼에 대해 계산된 다수의 상기 판별 점수의 평균값으로 상기 판별 대상의 상기 대장암 정보를 판단할 수 있다.The colorectal cancer determining means (2700) comprises: The colorectal cancer information of the discrimination object can be judged from the average value of a plurality of the discrimination scores calculated for a plurality of the low mass ion mass spectra detected by repeatedly measuring the biological sample to be discriminated.
도 5는 도 4의 제1판별점수 계산수단을 더욱 상세히 나타낸 블록도로서, 도시된 바와 같이 상기 제1판별점수 계산수단(2200)은; 상기 훈련 후보 집합의 상기 저질량 이온 질량 스펙트럼들의 상기 피크 강도들을 정규화하는 정규화 모듈(2210); 상기 정규화한 피크 강도들을 스케일링하는 스케일링 모듈(2220); 및 상기 스케일링된 피크 강도들에 대해 상기 생물통계학적 분석을 수행하여 상기 판별 점수를 계산하는 판별점수계산 모듈(2230)을 포함할 수 있다.Fig. 5 is a block diagram showing the first discrimination score calculating means of Fig. 4 in more detail. As shown in Fig. 5, the first discrimination score calculating means 2200 includes: A normalization module (2210) for normalizing the peak intensities of the low mass ion mass spectra of the training candidate set; A scaling module (2220) for scaling the normalized peak intensities; And a discrimination
상기 스케일링 모듈(2220)은; 파레토 스케일링을 수행할 수 있다. 상기 판별점수계산 모듈(2230)은; 주성분 분석 기반 선형 판별 분석을 사용하여 상기 생물통계학적 분석을 수행할 수 있다. 상기 판별점수계산 모듈(2230)은; 상기 주성분 분석 기반 선형 판별 분석에 의해 획득된 인자적재값과 상기 스케일링된 피크 강도를 함께 사용하여 상기 판별 점수를 계산할 수 있다.The
도 6은 도 4의 제2판별점수 계산수단을 더욱 상세히 나타낸 블록도로서, 도시된 바와 같이 상기 제2판별점수 계산수단(2600)은; 상기 판별 대상의 상기 저질량 이온 질량 스펙트럼의 상기 피크 강도들을 정규화하는 정규화 모듈(2610); 상기 정규화한 피크 강도들을 스케일링하는 스케일링 모듈(2620); 및 상기 스케일링된 피크 강도와 상기 인자적재값을 통해 상기 판별 점수를 계산하는 판별점수계산 모듈(2630)을 포함할 수 있다.FIG. 6 is a block diagram showing the second discrimination score calculating means of FIG. 4 in more detail. As shown in FIG. 6, the second discrimination score calculating means 2600 includes: A normalization module (2610) for normalizing the peak intensities of the low mass ion mass spectrum of the object to be discriminated; A scaling module (2620) for scaling the normalized peak intensities; And a discrimination
여기서, 상기 스케일링 모듈(2620)은 파레토 스케일링을 수행할 수 있다. 또한, 상기 판별점수계산 모듈(2630)은; 상기 대장암 진단용 저질량 이온들의 상기 스케일링된 피크 강도와 상기 인자적재값을 통해 상기 판별 점수를 계산할 수 있다.Here, the
도 7은 도 4의 대장암진단용이온 선정수단을 더욱 상세히 나타낸 블록도로서, 도시된 바와 같이 상기 대장암진단용이온 선정수단(2400)은; 상기 선택된 상기 제1훈련집합으로부터 후보 조건을 만족하는 후보 저질량 이온들을 후보이온집합으로 선택하는 후보이온집합 선택수단(2410); 및 상기 선택된 상기 후보이온집합의 상기 후보 저질량 이온의 개별 또는 조합별 판별 성능을 기반으로 하여 대장암 진단용 저질량 이온들을 최종이온집합으로 선택하는 최종이온집합 선택수단(2420)을 포함할 수 있다.FIG. 7 is a detailed block diagram of the colon cancer diagnostic ion selecting means of FIG. 4. As shown in FIG. 7, the colon cancer diagnostic
상기 최종이온집합 선택수단(2420)의 상기 판별 성능의 기준은; 상기 후보 저질량 이온 중 민감도와 특이도의 합이 기준값보다 큰 이온들을 선택하거나 상기 후보 저질량 이온들로 구성되는 조합별 민감도와 특이도의 합이 비교 대상 조합들 중 가장 큰 조합을 선택하는 제1기준을 포함할 수 있다.The criterion of the discrimination performance of the final ion set selection means 2420 is: Wherein the sum of the sensitivity and the specificity among the candidate low mass ions is larger than the reference value or the sum of the sensitivity and the specificity of each combination of the candidate low mass ions is greater than the sum of the sensitivity and the specificity, 1 criteria.
상기 최종이온집합 선택수단(2420)의 상기 판별 성능의 기준은; 상기 후보 저질량 이온들의 조합들 중 상기 후보 저질량 이온들의 개수가 비교 대상 조합들 중 가장 적은 조합을 선택하는 제2기준을 더 포함할 수 있다.The criterion of the discrimination performance of the final ion set selection means 2420 is: And a second criterion in which the number of the candidate low mass ions among the combinations of the candidate low mass ions is selected as the least combination of the comparison targets.
상기 최종이온집합 선택수단(2420)의 상기 판별 성능의 기준은; 상기 후보 저질량 이온들의 조합들 중 진양성(true positive) 케이스의 최소 판별 점수와 진음성(true negative) 케이스의 최대 판별 점수의 차가 비교 대상 조합들 중 가장 큰 조합을 선택하는 제3기준을 더 포함하며, 상기 판별 점수는 상기 후보 저질량 이온들의 상기 스케일링된 피크 강도와 상기 인자적재값을 통해 계산되며, 대장암에 대한 양성 또는 음성을 나타낼 수 있다.The criterion of the discrimination performance of the final ion set selection means 2420 is: The difference between the minimum discrimination score of the true positive case and the maximum discrimination score of the true negative case among combinations of the candidate low mass ions is the third criterion for selecting the largest combination of the comparison target combinations Wherein the discrimination score is calculated through the scaled peak intensity of the candidate low mass ions and the factor load value and can be positive or negative for colorectal cancer.
상기 최종이온집합 선택수단(2420)은, 상기 제1훈련집합에 대해 독립적인 제2훈련집합을 상기 제1훈련집합에 추가한 훈련 집합을 대상으로 저질량 이온 선택 과정을 진행할 수 있다.The final ion set selection means 2420 may perform a low mass ion selection process on a training set in which a second training set independent of the first training set is added to the first training set.
도 8은 도 7의 후보이온집합 선택수단을 더욱 상세히 나타낸 블록도로서, 도시된 바와 같이 상기 후보이온집합 선택수단(2410)은; 상기 훈련 케이스 각각에 대한 상기 저질량 이온의 상기 피크 강도와, 상기 생물통계학적 분석을 통해 획득된 상기 저질량 이온별 인자적재값의 곱의 절댓값이 문턱값 CT1보다 큰 제1저질량 이온들을 상기 훈련 케이스별로 선택하는 제1저질량이온 선택모듈(2411)을 포함할 수 있다. 여기서, 상기 문턱값 CT1은 0.1인 것이 바람직하다.FIG. 8 is a block diagram showing in more detail the candidate ion set selection means of FIG. 7, wherein the candidate ion set selection means 2410 includes: Wherein a peak intensity of the low mass ion for each of the training cases and an absolute value of a product of the low mass ion charge accumulation value obtained through the biostatistical analysis is greater than a threshold CT 1 And a first low mass
상기 후보이온집합 선택수단(2410)은; 상기 제1저질량 이온들 중 상기 훈련 케이스들 전체의 문턱값 CT2 퍼센트 이상의 케이스들에서 공통으로 나타나는 제2저질량 이온들을 상기 후보이온집합으로 선택하는 후보이온집합 예비선택모듈(2412)을 포함할 수 있다. 여기서, 상기 문턱값 CT2는 50인 것이 바람직하다.The candidate ion set selection means (2410) comprises: And a candidate ion set pre-selection module (2412) for selecting the second low-mass ions as the candidate ion set common to the cases of not less than 2 percent of the threshold CT of the entire training cases among the first low-mass ions can do. Here, the threshold value CT 2 is preferably 50.
상기 후보이온집합 선택수단(2410)은; 상기 제2저질량 이온들을 이용해 상기 훈련 케이스별로 대장암에 대한 양성 또는 음성을 나타내는 판별 점수를 계산하고, 상기 판별 점수에 따른 민감도 및 특이도를 계산하는 민감도 및 특이도 계산모듈(2413); 및 상기 민감도가 문턱값 CN3보다 작거나, 상기 특이도가 문턱값 CN4보다 작은 경우 상기 CT1 및 상기 CT2 중 적어도 하나를 변경하고, 상기 과정을 반복하여 상기 후보이온집합을 선택하는 후보이온집합 최종선택모듈(2414)을 더 포함할 수 있다. 여기서, 상기 문턱값 CN3 및 CN4는 0.9인 것이 바람직하다.The candidate ion set selection means (2410) comprises: A sensitivity and
도 9는 도 7의 최종이온집합 선택수단을 더욱 상세히 나타낸 블록도로서, 도시된 바와 같이, 상기 최종이온집합 선택수단(2420)은; 상기 후보이온집합에 포함된 상기 후보 저질량 이온들을 상기 민감도가 상기 특이도보다 높은 고민감도 저질량 이온들을 포함하며, 상기 고민감도 저질량 이온들을 상기 민감도와 상기 특이도의 합의 내림차순으로 정렬한 고민감도 집합{Sns1, Sns2, Sns3 … SnsI}과, 상기 특이도가 상기 민감도보다 높은 고특이도 저질량 이온들을 포함하며 상기 고특이도 저질량 이온들을 상기 민감도와 상기 특이도의 합의 내림차순으로 정렬한 고특이도 집합 {Spc1, Spc2, Spc3 … SpcJ}으로 구분하는 이온 구분모듈(2421); 상기 고민감도 집합에서 상위 L개의 상기 고민감도 저질량 이온들{Sns1, Sns2, Sns3 … SnsL}과 상기 고특이도 집합에서 상위 L개의 상기 고특이도 저질량 이온들{Spc1, Spc2, Spc3 … SpcL} 중 2개 이상의 저질량 이온들로 구성되는 후보 조합들 중 상기 제1기준, 상기 제2기준 및 상기 제3기준 중 적어도 하나 이상에 의한 상기 판별 성능의 기준에 의해 선택된 조합을 바이오마커 그룹으로 선정하는 바이오마커그룹 예비선정모듈(2422); 상기 바이오마커 그룹과, 상기 고민감도 집합에서 차상위 M개의 상기 고민감도 저질량 이온들과 상기 고특이도 집합에서 차상위 M개의 상기 고특이도 저질량 이온들 중 적어도 하나 이상의 저질량 이온을 상기 바이오마커 그룹에 추가한 후보 조합들 중 상기 제1기준, 상기 제2기준 및 상기 제3기준 중 적어도 하나 이상에 의한 상기 판별 성능의 기준에 의해 선택된 조합을 상기 바이오마커 그룹으로 재선정하는 바이오마커그룹 재선정모듈(2423); 및 상기 고민감도 집합 및 상기 고특이도 집합에 차상위 저질량 이온이 존재하지 않을 때까지 상기 재선정 과정을 반복하여 상기 바이오마커 그룹을 최종 선정하는 바이오마커그룹 최종선정모듈(2424)을 포함할 수 있다.FIG. 9 is a block diagram showing in more detail the final ion set selection means of FIG. 7, wherein the final ion set selection means 2420 includes: Wherein the candidate low-mass ions included in the candidate ion set include high-sensitivity low-mass ions whose sensitivity is higher than the specificity, and wherein the low-sensitivity low-mass ions are arranged in descending order of the sensitivity and the sum of the specificities Sensitivity set {Sns 1 , Sns 2 , Sns 3 ... Sns I }, a high specificity set {Spc 1 , Sns I } comprising the high specificity low mass ions whose specificity is higher than the sensitivity, and sorting the high specific low mass ions in descending order of the sensitivity and the specificity, Spc 2 , Spc 3 ... An
상기 최종이온집합 선택수단(2420)은; 상기 후보이온집합에서 상기 바이오마커그룹 최종선정모듈(2424)에서 얻어진 상기 바이오마커 그룹으로 선정 완료된 조합의 저질량 이온들을 제외한 잔류 후보이온집합을 대상으로 상기 세 바이오마커 그룹 선정 과정을 반복 수행하여 추가 바이오마커 그룹을 선정하되, 상기 고민감도 집합 또는 상기 고특이도 집합에 상기 L개 미만의 질량 이온이 남을 때까지 상기 추가 바이오마커 그룹을 더 선정하는 바이오마커그룹 추가선정모듈(2425); 및 상기 바이오마커 그룹과 상기 추가 바이오마커 그룹들 중 진양성 또는 진음성 판정의 정확도(accuracy)를 기준으로 상위 CK개의 바이오마커 그룹들의 조합의 저질량 이온들을 상기 대장암 진단용 저질량 이온으로 선택하는 암진단용저질량이온 최종선택모듈(2426)을 더 포함할 수 있다. 여기서, 상기 L값은 2이고, 상기 M값은 1이며, 상기 CK값은 1, 2 또는 3 중 어느 하나인 것이 바람직하다.The final ion set selection means (2420) comprises: The above-mentioned three biomarker group selection process is repeated for the remaining candidate ion sets excluding the combination of the low-mass ions selected as the biomarker group obtained in the biomarker group
본 발명의 대장암 진단 장치는 도 4에 도시된 바와 같이 하드웨어로 구성되거나 또는 프로그램 구조에 의한 소프트웨어로 구성될 수도 있으며, 이하에서는 일 예로서 첨부된 순서도의 프로세스를 참조하여 소프트웨어로 구성된 CRC를 진단하기 위한 대장암 진단 장치에 대하여 상세히 설명하기로 한다.
The colorectal cancer diagnosis apparatus of the present invention may be constituted by hardware or software by a program structure as shown in FIG. 4. Hereinafter, referring to the flowchart of the attached flowchart, for example, The colorectal cancer diagnosing apparatus will be described in detail.
2-1. 시료 준비 - 혈청 수집 대상2-1. Sample Preparation - Serum Collection Target
전술한 표 1의 133명의 CRC 환자군, 전술한 표 2의 153명의 정상 대조군, 표 5의 111명의 BRC 환자군, 표 6의 36명의 비호지킨림프종(non-Hodgkin lymphoma, NHL) 환자군 및 표 7의 29명의 GC 환자군으로부터 혈청을 수집하였다.
133 CRC patients in Table 1, 153 normal controls in Table 2, 111 BRC patients in Table 5, 36 non-Hodgkin lymphoma (NHL) patients in Table 6, and 29 patients in Table 7 Serum was collected from a group of GC patients.
yearAge
year
yearAge
year
yearAge
year
ng/mLCEA
ng / mL
yearAge
year
ng/mLCEA
ng / mL
또한, 이 462명을 집합 A1으로 하여 후술하는 바와 같이 그 부분 집합 A0로 제1훈련집합을 구성하였으며, 이 제1훈련집합에 대한 생물통계학적 분석을 통해 질량 이온별 가중치(인자적재값)를 계산하고, 예비 판별식을 획득하였다. 또한, 이 집합 A1 외에 표 8의 144명의 CRC 환자군, 표 9의 50명의 정상 대조군, 표 10의 25명의 BRC 환자군, 표 11의 15명의 NHL 환자군 및 표 12의 57명의 GC 환자군을 집합 A2(제2훈련집합)로 하여 훈련 집합을 확장하였다. 즉 예비 판별식을 구성하는 저질량 이온들의 예비 후보군으로부터 후술할 방법에 따라 CRC 진단용 저질량 이온들을 확인할 때에는 서로 독립적인 집합인 집합 A1과 집합 A2의 합집합, 즉 집합 A를 훈련 집합으로 사용하였다.
The first training set is composed of 462 persons as a set A 1 , as described below, and its subset A 0 is constructed. Through the biostatistical analysis of the first training set, the mass ion weight ), And a preliminary discriminant was obtained. In addition to this set A 1 , 144 CRC patients in Table 8, 50 normal controls in Table 9, 25 BRC patients in Table 10, 15 NHL patients in Table 11, and 57 GC patients in Table 12 were grouped into groups A 2 (The second training set). That is, from the preliminary candidates of the low-mass ions constituting the preliminary discrimination formula, when the low-mass ions for CRC diagnosis are identified according to the method described later, the union of the groups A 1 and A 2 , Respectively.
yearAge
year
ng/mLCEA
ng / mL
ASC: Adenosquamous carcinoma
ASC: Adenosquamous carcinoma
yearAge
year
ng/mLCEA
ng / mL
yearAge
year
ng/mLCEA
ng / mL
yearAge
year
cmTumor Size
cm
95%>
95%
95%>
95%
90%80-
90%
90%80-
90%
3%2 ~
3%
95%>
95%
80%70-
80%
60%50-
60%
30%20-
30%
95%>
95%
yearAge
year
yearAge
year
ng/mLCEA
ng / mL
yearAge
year
ng/mLCEA
ng / mL
또한, 집합 A와 독립된 표 13의 143명의 CRC 환자군, 표 14의 50명의 정상 대조군, 표 15의 25명의 BRC 환자군, 표 16의 15명의 NHL 환자군, 표 17의 55명의 GC 환자군, 표 18의 25명의 난소암(ovarian cancer, OVC) 환자군, 표 19의 19명의 Tis 또는 Advanced Adenoma (TA) 환자군을 집합 B로 하여 검증 집합을 구성하였다. OVC 환자군과 TA 환자군은 질량 이온별 가중치를 구할 때나 CRC 진단용 저질량 이온을 확인할 때 전혀 반영되지 않은 환자군들로, 본 발명에서 구성한 판별식으로 이 환자군들이 어떻게 판별되는지 살펴보기 위하여 포함하였다.
In addition, there were 143 CRC patients in Table 13, 13 healthy controls in Table 14, 25 BRC patients in Table 15, 15 NHL patients in Table 16, 55 GC patients in Table 17, 25 patients in Table 18 (OVC) and 19 patients with Tis or Advanced Adenoma (TA) in Table 19 were group B, and the test set was constructed. The OVC patients and the TA patients were included in the group of patients who were not reflected in the calculation of the mass ion specific weight or the low mass ion for CRC diagnosis.
yearAge
year
ng/mLCEA
ng / mL
yearAge
year
ng/mLCEA
ng / mL
yearAge
year
ng/mLCEA
ng / mL
yearAge
year
cmTumor Size
cm
60%50-
60%
20%10-
20%
80%70-
80%
60%50-
60%
95%>
95%
10%<
10%
30%10-
30%
60%50-
60%
60%50-
60%
yearAge
year
yearAge
year
ng/mLCEA
ng / mL
yearAge
year
ng/mLCEA
ng / mL
yearAge
year
yearAge
year
ng/mLCEA
ng / mL
2-2. 시료 준비 - 혈청 준비 및 질량 스펙트럼 측정2-2. Sample Preparation - Serum Preparation and Mass Spectrometry
4배 부피의 메탄올/클로로포름(2:1, v/v)을 25㎕의 혈청과 함께 격렬하게 섞은 후에 10분 동안 실온에서 배양하였다. 혼합물은 4℃에서 10분 동안 6000 × g로 원심 분리하였다. 수득한 상청액을 1시간 동안 농축기(concentrator)에서 완전히 건조시켰으며, 30분 동안 교반기(vortexer)에서 30㎕의 50% 아세토니트릴(acetonitrile)/0.1% 트라이플루오린화 아세트산(trifluoroacetic acid, TFA)으로 용해시켰다. Four volumes of methanol / chloroform (2: 1, v / v) were vigorously mixed with 25 μl of serum and then incubated at room temperature for 10 minutes. The mixture was centrifuged at 6000 x g for 10 minutes at 4 < 0 > C. The resulting supernatant was completely dried in a concentrator for 1 hour and dissolved in 30 μl of 50% acetonitrile / 0.1% trifluoroacetic acid (TFA) in a vortexer for 30 minutes .
메탄올/클로로포름 추출물을 50% 아세토니트릴/0.1% TFA 내에서 알파-시아노-4-하이드록시 시남산(α-cyano-4-hydroxycinnamic acid) 용액과 혼합하였으며(1:12, v/v), 1㎕의 혼합물을 MALDI-타깃 플레이트(target plate)에 위치시켰다. CRC 환자 및 비환자 혈청 추출물의 질량 스펙트럼을 Proteomics Analyzer(Applied Biosystems, Foster City, CA, USA)를 사용하여 측정하였다.The methanol / chloroform extract was mixed (1:12, v / v) with a solution of alpha-cyano-4-hydroxycinnamic acid in 50% acetonitrile / 0.1% 1 [mu] l of the mixture was placed on a MALDI-target plate. The mass spectra of CRC patients and non-patient serum extracts were measured using a Proteomics Analyzer (Applied Biosystems, Foster City, CA, USA).
한 개의 시료에 대해 질량 스펙트럼 데이터는 20번 반복 측정된 스펙트럼의 평균으로 추출된다. 모든 개별 시료의 질량값 구간은 최대 질량값이 약 2500 m/z이 되도록 조정하였다. 실험적 오류를 최소화하기 위하여, 초점 질량(focus mass), 레이저 강도(laser intensity), 타깃 플레이트, 데이터 수집 시각(data acquisition time)을 포함하는 다양한 요소를 점검하였다. For one sample, mass spectral data is extracted as the mean of the 20 repeatedly measured spectra. The mass value interval of all the individual samples was adjusted so that the maximum mass value was about 2500 m / z. To minimize experimental errors, various factors were examined including focus mass, laser intensity, target plate, and data acquisition time.
바람직한 초점 질량 및 레이저 강도로 500 m/z 및 5000이 각각 고정되어 사용되었다. 모든 시료들은 고정된 초점 질량 및 레이저 강도와 함께, 다른 추출 및 다른 데이터 수집 시각하에서 최소 5번 반복 측정하였다. 질량 이온별 가중치를 계산한 집합 A1의 경우는 추가로 한 번 더 측정하였다.500 m / z and 5000 were used with fixed focus mass and laser intensity, respectively. All samples were measured at least five times under different extraction and different data acquisition times, with fixed focus mass and laser intensity. In the case of the set A 1 in which the weight per weight ion was calculated, an additional measurement was performed.
따라서, 상기 저질량이온 검출부(1000)는 MALDI-TOF 질량분석기를 이용하여 상술한 바와 같은 과정을 통해서 혈청 시료로부터 저질량 이온의 질량 스펙트럼을 추출할 수 있다.
Accordingly, the low
2-3. 판별 전략2-3. Discrimination strategy
구성한 판별식이 CRC 특이적인 식이 되기 위해서는 CRC 환자군은 판별식에 의해 정상 대조군뿐만 아니라 다른 암환자군과도 구분되어야 한다. 본 실시 예에서는 다른 암환자군으로 BRC 환자군, NHL 환자군 및 GC 환자군을 사용하고자 한다. 한 개의 판별식으로 CRC 환자군과 비환자군(정상 대조군, BRC 환자군, NHL 환자군 및 GC 환자군)을 구분할 수 있는지 종래의 주성분 분석 기반 선형 판별 분석 방법을 적용한 결과를 표 20에 나타내었다. 특히 정상 대조군의 특이도가 69.28%로 낮은 것을 확인할 수 있다. 이로부터 한 개의 판별식으로는 CRC 환자군과 비환자군을 구분할 수 없음을 알 수 있다.
In order for the discriminant formula to be CRC-specific, CRC patients should be distinguished from other cancer patients as well as the normal control group by discrimination. In this example, we would like to use BRC patients, NHL patients, and GC patients as other cancer patients. Table 20 shows the results of applying the linear discriminant analysis method based on the principal component analysis to discriminate between the CRC patient group and the non-patient group (normal control group, BRC group, NHL patient group and GC patient group) as one discrimination formula. In particular, the specificity of the normal control group is as low as 69.28%. From this, one discriminant can not distinguish between CRC patients and non-CR patients.
True Non-CRC
Specificity
Specificity
NHL
도 2 및 표 4에서 확인한 바와 같이 CRC 환자군과 정상 대조군에 대해서는 우수한 판별 결과를 얻을 수 있었으므로, CRC 환자군과 다른 암환자군이 구분될 수 있는지 살펴보았는데, 그 결과를 표 21에 나타내었다. NHL 환자군의 특이도가 83.33%로 다른 암환자군에 비해 상대적으로 낮기는 하지만 대체적으로 우수한 판별 결과를 보인다고 판단된다.
As shown in FIG. 2 and Table 4, excellent discrimination results were obtained for the CRC patient group and the normal control group, so that the CRC patient group and the other cancer patient group could be distinguished from each other, and the results are shown in Table 21. The specificity of the NHL patient group was 83.33%, which is relatively low compared to other cancer patients.
True Non-CRC
Specificity
Specificity
NHL
따라서 CRC 환자군과 비환자군을 구분하는 것은 CRC 환자군과 정상 대조군을 구분하는 제1종 판별식과 CRC 환자군과 다른 암환자군을 구분하는 제2종 판별식을 사용하여, 두 판별식에 의해 모두 CRC로 판별된 경우를 CRC 환자로 판정하고, 두 판별식 중 어느 하나의 판별식으로든 CRC 비환자로 판별된 경우에는 CRC 비환자로 판정하는 방식을 통해 수행될 수 있다.
Therefore, the discrimination between CRC patients and non-CRC patients was discriminated by CRC by using two discriminant equations using the first discriminant, which distinguishes between CRC patients and normal controls, and the second discriminant, which distinguishes CRC patients from other cancer patients The CRC patient is judged as a CRC patient, and in the case where it is discriminated as a CRC non-patient by any of the two discrimination equations, it can be judged as a CRC non-patient.
2-4. 제1훈련집합 A2-4. First training set A 00 의 선정 및 질량 이온별 가중치 계산Selection of weight and calculation of weight by mass ion
표 4 및 표 21에 나타낸 판별 결과가 매우 우수하기는 하나 민감도와 특이도가 모두 100%는 아니다. 본 발명에서는 우선 민감도와 특이도가 소정의 값을 갖는 제1훈련집합 A0를 선정하고, 이 제1훈련집합 A0에 대해 질량 이온별 가중치를 계산하였는데, 본 실시 예에서 그 소정의 값은 민감도와 특이도 모두 100%이다.The results of discrimination shown in Table 4 and Table 21 are excellent, but the sensitivity and the specificity are not all 100%. In the present invention, a first training set A 0 having sensitivity and specificity of a predetermined value is selected, and a weight-by-weight of each of the first training set A 0 is calculated. In this embodiment, Both sensitivity and specificity are 100%.
도 10을 참조하여 민감도와 특이도가 소정의 값을 갖는 제1훈련집합 A0를 선정하는 방법에 대하여 설명한다.A method of selecting a first training set A 0 having sensitivity and specificity of a predetermined value will be described with reference to FIG.
제1판별점수 계산수단(2200)은, 도시된 도 10의 D111 내지 D114 단계들을 통하여, 집합 A1 내 CRC 환자군 및 정상 대조군의 저질량 이온 질량 스펙트럼들을 정렬하여 임포트하고(D111), 임포트한 피크 강도들을 정규화하고(D112), 정규화한 피크 강도들을 파레토 스케일링하고(D113), 파레토 스케일링한 피크 강도들에 대해 생물통계학적 분석을 수행하여 판별 점수를 계산하였다(D114). The first discrimination score calculating means 2200 arranges and imports the low mass ion mass spectra of the CRC patient group and the normal control group in the set A 1 (D111) through the steps D111 to D114 shown in FIG. 10 (D111) Strengths were normalized (D112), normalized peak intensities were Pareto-scaled (D113), and Pareto-scaled peak intensities were subjected to biostatistical analysis (D114).
다양한 생물통계학적 분석 방법 중 어느 하나를 선택하여 판별 점수를 계산할 수 있으나, 본 실시 예에서는 주성분 분석 기반 선형 판별 분석을 수행하였다. 판별 점수를 통하여 민감도 및 특이도를 계산하였으며(D115), 그 결과는 전술한 도 2 및 표 4와 같다.The discriminant score can be calculated by selecting one of various biostatistical analysis methods. In this embodiment, linear discriminant analysis based on principal component analysis is performed. Sensitivity and specificity were calculated through discriminant scores (D115), and the results are shown in FIG. 2 and Table 4 described above.
다음으로, 민감도의 문턱값 CN1과 특이도의 문턱값 CN2를 설정하여(D116), 민감도 또는 특이도가 각각의 문턱값보다 작은 경우 위양성(false positive) 또는 위음성(false negative) 케이스들을 제외하였다(D117). Next, except for the (D116), the sensitivity or specificity case is less than a respective threshold value false positives (false positive) or false negative (false negative) case by setting the threshold value CN 1 and the specific threshold value CN 2 in view of the sensitivity (D117).
본 실시 예에서는 민감도의 문턱값 CN1과 특이도의 문턱값 CN2를 모두 1로 설정함으로써 민감도와 특이도가 모두 100%인 제1훈련집합 A0를 찾았다. 즉 표 4에 나타난 위양성인 두 케이스와 위음성인 두 케이스를 모두 배제하고, 배제한 집합에 대하여 다시 D111 내지 D115 단계를 수행하였다. 배제한 집합에 대하여 D111 내지 D115 단계를 다시 수행하여도 바로 민감도 및 특이도가 100%가 되지는 않았으며, D111 내지 D117 단계를 수회 반복함으로써 비로소 민감도와 특이도가 모두 100%인 제1훈련집합 A0을 찾을 수 있었다(D118). In the present embodiment, by setting both the sensitivity threshold CN 1 and the threshold value CN 2 of the specificity as 1, a first training set A 0 with a sensitivity of 100% and a specificity of 100% is found. That is, the two false positive cases and the two false positive cases shown in Table 4 were excluded, and the excluded sets were again subjected to the steps D111 to D115. The sensitivity and specificity were not 100% even after the steps D111 to D115 were repeated for the excluded assemblies. By repeating the steps D111 to D117 several times, the first training set A having sensitivity and specificity of 100% 0 was found (D118).
CRC 환자군과 정상 대조군을 구분하는 제1종 판별식의 경우에는 8개의 위음성, 9개의 위양성 케이스들을 배제한 후에, CRC 환자군과 다른 암환자군을 구분하는 제2종 판별식의 경우에는 5개의 위음성, 10개의 위양성 케이스들(BRC 1개, NHL 8개 및 GC 1개)을 배제한 후에 민감도와 특이도가 모두 100%인 판별 결과에 도달하였다. 이 과정을 통해 민감도와 특이도가 모두 100%인 판별 결과를 주는 질량 이온별 인자적재값을 도출할 수 있다(D119). In the case of the first discriminant, which distinguishes between the CRC patient group and the normal control group, there are 5 false negatives, 10 false negatives, 8 false negatives, and 9 false positive cases, After excluding the 1 false positive cases (1 BRC, 8 NHL, and 1 GC), we reached the discrimination result that both the sensitivity and the specificity were both 100%. Through this process, it is possible to derive the mass-ion-specific factor load value which gives the discrimination result that both the sensitivity and the specificity are 100% (D119).
상기와 같은 일련의 과정은 상기 제1훈련집합 선택수단(2310)을 포함하는 인자적재값 계산수단(2300)을 통하여 수행될 수 있다.
The above-described series of processes may be performed through the parameter set calculation means 2300 including the first training set selection means 2310.
2-5. 판별식의 적용2-5. Application of discriminant equation
구성한 판별식을 판별 대상 시료에 적용하는 과정을 설명하면 다음과 같다.The process of applying the discriminant equation to the discriminant sample will be described as follows.
우선 MarkerViewTM에는 이와 유사한 목적으로 사용할 수 있는 기능이 있다. 즉, 함께 임포트한 시료 데이터 중에서 일부 시료들만을 대상으로 하여 주성분 분석 기반 선형 판별 분석을 적용할 수 있으며, 이렇게 구성한 판별식으로 나머지 시료들을 판별할 수 있다. 이 기능을 이용하면 제1훈련집합과 판별 대상 시료를 함께 임포트한 후 제1훈련집합만을 선택해서 주성분 분석 기반 선형 판별 분석을 수행하여 판별 대상 시료가 어떻게 판정되는지 알 수 있다. First of all, MarkerView TM has features that can be used for similar purposes. That is, the linear discriminant analysis based on principal component analysis can be applied to only some of the sample data imported together, and the remaining samples can be discriminated by the discriminant thus constructed. With this function, the first training set and the discrimination sample are imported together, and then only the first training set is selected, and the linear discrimination analysis based on the principal component analysis is performed to know how the discrimination target sample is judged.
그러나 MarkerViewTM의 임포트 과정에서 피크들을 정렬하는 기능(peak alignment)이 수행되는데, 제1훈련집합에 맞추어 판별 대상 시료의 피크들을 정렬하는 기능이 없기 때문에, 제1훈련집합만을 임포트하였을 때의 피크 표(peak table, m/z 열과 시료별 피크 강도 열로 이루어진 행렬)와, 제1훈련집합과 판별 대상 시료를 함께 임포트하였을 때 생성되는 피크 표의 제1훈련집합 부분은 동일하지 않다. 피크 강도 행렬 부분도 다르며, 동일한 피크 강도 행에 대응하는 m/z 값도 항상 동일하게 나타나지는 않는다. 따라서, 제1훈련집합에서 만든 판별식을 판별 대상 시료에 적용하여 판별 점수를 계산하기 위해서는 제1훈련집합과 판별 대상 시료를 함께 임포트했을 때 생성되는 피크 표를 제1훈련집합만을 임포트하였을 때의 피크 표에 재정렬(realignment)하는 작업이 선행되어야 한다.However, since the peak alignment is performed during the import process of MarkerView (TM), since there is no function of aligning the peaks of the sample to be discriminated in accordance with the first training set, the peak table peak table, m / z column and sample peak intensity column) and the first training set part of the peak table generated when the first training set and the discrimination sample are imported together are not the same. The peak intensity matrix portions are also different, and the m / z values corresponding to the same peak intensity row are not always the same. Therefore, in order to calculate the discrimination score by applying the discrimination equation made in the first training set to the discrimination sample, the peak table generated when the first training set and the discrimination sample are imported together is used as the peak when the first training set is imported The table should be preceded by realignment.
여러 개의 판별 대상 시료들을 제1훈련집합과 함께 임포트하는 경우 정렬이 어긋나는 정도가 더욱 심해진다. 따라서 본 실시 예에서는 모든 판별 대상 시료들에 대해서 제1훈련집합에 한 개의 판별 대상 시료를 추가하여 임포트한 후, 재정렬, 정규화, 파레토 스케일링을 수행하였다. When multiple samples to be discriminated are imported together with the first training set, the degree of misalignment becomes worse. Therefore, in this embodiment, one discrimination sample is added to the first training set for all the discrimination samples, and then the rearranging, normalization, and pareto scaling are performed.
도 11을 참조하여 더욱 상세히 설명하면 다음과 같다. This will be described in more detail with reference to FIG.
먼저, 판별 대상 시료의 저질량 이온 질량 스펙트럼들을 제1훈련집합에 정렬하여 임포트하는 단계를 수행한다(D211).First, a step of sorting and importing low mass ion mass spectra of a discrimination target sample to a first training set is performed (D211).
다만, 본 실시 예에서는 MarkerViewTM에는 판별 대상 시료를 제1훈련집합에 정렬하여 임포트하는 기능이 없으므로, 전술한 바와 같이 판별 대상 시료의 저질량 이온 질량 스펙트럼을 제1훈련집합과 함께 임포트한 후 만들어지는 피크 표를 제1훈련집합만을 임포트하였을 때 만들어지는 피크 표에 재정렬하는 프로그램을 만들어 제1훈련집합에 정렬된 판별 대상 시료의 저질량 이온 질량 스펙트럼을 추출하였다. 그러나 재정렬 없이 처음부터 판별 대상 시료를 제1훈련집합에 정렬하여 임포트하는 것이 보다 바람직하고 이것 역시 프로그램을 만들어 구현 가능하다. However, in the present embodiment, since the MarkerView TM does not have a function of sorting and importing the discrimination target sample into the first training set, the low mass ion mass spectrum of the discrimination sample is imported together with the first training set A program for realigning the peak table to the peak table created when only the first training set was imported was created to extract the low mass ion mass spectrum of the discriminated sample arranged in the first training set. However, it is more preferable to arrange and import the discriminant sample from the beginning into the first training set without rearranging it, and this is also possible to create and implement the program.
다음으로, 임포트한 피크 강도들을 정규화하고(D212), 정규화한 피크 강도들을 파레토 스케일링하였다(D213). Next, the imported peak intensities are normalized (D212) and the normalized peak intensities are Pareto-scaled (D213).
다음으로, 파레토 스케일링한 저질량 이온들의 피크 강도와 제1훈련집합에 대한 주성분 분석 기반 선형 판별 분석에 의해 획득된 질량 이온별 인자적재값으로부터 판별 점수를 계산하였다(D214). Next, the discrimination score was calculated from the peak intensity of the Pareto-scaled low-mass ions and the factor loadings of mass ions obtained by the linear discriminant analysis based on principal component analysis on the first training set (D214).
이렇게 계산된 판별 점수가 기준값 CS보다 큰지 여부를 판단하여(D215), 기준값 CS보다 큰 경우 양성으로 판정하고(D216), 기준값 CS보다 작은 경우 음성으로 판정하였다(D217). 본 실시 예에서 기준값 CS는 0인 것이 바람직하다.It is determined whether the thus calculated discrimination score is greater than the reference value CS (D215). If it is greater than the reference value CS, it is determined to be positive (D216). In this embodiment, the reference value CS is preferably zero.
상기와 같은 일련의 과정은 상기 제2정렬수단(2500), 제2판별점수계산 계산수단(2600) 및 대장암 판정수단(2700)을 통하여 수행될 수 있다.The above-described series of steps may be performed through the second alignment means 2500, the second discrimination score calculation means 2600, and the colon cancer determination means 2700.
제1종 판별식을 위해 집합 A1에서 제1훈련집합 A01을 구성할 때 제외되었던 8명의 CRC 환자군 및 9명의 정상 대조군 시료와 제2종 판별식을 위해 집합 A1에서 제1훈련집합 A02을 구성할 때 제외되었던 5명의 CRC 환자군, 1명의 BRC 환자군, 8명의 NHL 환자군 및 1명의 GC 환자군 시료에 대해 상기 2-4절에서 계산한 질량 이온별 인자적재값을 적용하여 판별 점수를 계산해 보았다. 제1훈련집합 A01 및 A02를 구성할 때 이미 제외된 케이스들이었기 때문에 위양성 또는 위음성 케이스로 판별될 것으로 예상하였는데, 계산 결과 예상대로 위양성 또는 위음성 케이스로 판별되었다. 상기 2-4절에서 계산한 질량 이온별 인자적재값을 적용하여 집합 A1을 판별한 결과를 도 12와 도 13에 나타내었는데, 도 12는 제1종 판별식, 도 13은 제2종 판별식의 결과를 보여준다.
The time to configure the first training set A 01 in the set A 1 to the discriminant one kinds of negative eight CRC patients and nine normal control samples and the first training set from set A 1 to the discriminant two kinds were A For each of the five CRC patients, one BRC patient, eight NHL patients, and one GC patient sample that were excluded when constructing the 02 , calculate the discrimination score by applying the mass-specific factor loadings calculated in Section 2-4 above saw. Because it was already excluded when constructing the first training set A 01 and A 02 , it was expected to be judged as a false positive or false negative case, and the calculation result was judged as false positive or false negative case as expected. 12 and 13 show the result of discriminating the set A 1 by applying the mass load factor values calculated in the above section 2-4. FIG. 12 shows the first type discriminant, FIG. 13 shows the second kind discriminant The results of the equation are shown.
2-6. 예비 판별식의 구성2-6. Composition of the preliminary discrimination formula
전술한 종래 기술에서는 주성분 분석 기반 선형 판별 분석에서 고려한 모든 질량 이온들을 사용하여 판별 점수를 계산한 후 그 판별 점수에 따라 CRC 환자 여부를 판정하였으나, 본 발명에서는 강건한 판별 성능을 나타내는 판별식을 도출하기 위해 우선 판별 점수에 큰 기여를 하는 질량 이온들만 사용하는 예비 판별식을 구성하였다. "예비 판별식"이란 본 발명에 따라 최종적으로 구하고자 하는 판별식을 도출하는 중간 단계로서의 판별식을 지칭하며, 이를 구성하는 저질량 이온들은 최종 판별식을 구성할 CRC 진단용 저질량 이온들의 "예비 후보군"이 된다.In the above-described conventional technique, the discrimination score is calculated using all the mass ions considered in the linear discriminant analysis based on the principal component analysis, and then the CRC patient is judged according to the discrimination score. In the present invention, however, the discriminant expressing robust discrimination performance is derived We made a preliminary discrimination equation using only mass ions which make a big contribution to the discrimination score. The "preliminary discrimination formula" refers to a discriminant function as an intermediate step for deriving a discriminant to be ultimately obtained according to the present invention. The low-mass ions constituting the discriminant form a "reserve " Candidate ".
도 14에 도시된 순서도의 절차를 통해 10,000개의 질량 이온들 중 판별 점수에 큰 영향을 미치는 소정의 질량 이온들을 선정하였다. 본 실시 예에서 제1종 판별식의 경우 선정된 소정의 질량 이온들의 개수는 278개였으며, 제2종 판별식의 경우는 383개였다.Through the procedure of the flowchart shown in FIG. 14, predetermined mass ions having a large influence on the discrimination score among 10,000 mass ions were selected. In the present embodiment, the number of predetermined mass ions was 278 in the case of the first kind discrimination formula, and 383 in the case of the second kind discrimination formula.
표 3과 함께 전술한 바와 같이 임포트 조건에서 피크의 최대 개수를 10,000개로 하였고 충분히 많은 시료들을 함께 임포트하였으므로, MarkerViewTM의 주성분 분석 기반 선형 판별 분석 방법을 통해 구성한 판별식은 10,000개의 항으로 이루어져 있다. 그러나 CRC 환자 및 비환자를 구분함에 있어 10,000개의 항이 모두 동등한 중요성을 가지지는 않을 것이므로, 도 19의 절차에 따라 10,000개의 질량 이온들 중 판별 점수에 큰 영향을 미치는 질량 이온들을 두 단계에 걸쳐 선정하였다. 이 단계는 10,000개의 질량 이온들 중 CRC 환자와 비환자를 구분함에 있어 불필요한 질량 이온들을 제거하는 과정이라 할 수 있다. As described above, the maximum number of peaks in the import condition was 10,000, and a sufficient number of samples were imported together. As a result, the discriminant formed by the linear discriminant analysis based on the principal component analysis of MarkerView TM is composed of 10,000 terms. However, since 10,000 terms would not be of equal importance in distinguishing between CRC patients and non-patients, mass ions having a large influence on the discrimination score among the 10,000 mass ions were selected in two steps according to the procedure of FIG. This step can be regarded as a process of removing unnecessary mass ions in discriminating between CRC patient and non-patient among 10,000 mass ions.
10,000개 항의 값들 중에서 피크 강도와 질량 이온별 인자적재값의 곱의 절댓값이 문턱값 CT1보다 큰 질량 이온들을 케이스별로 일차적으로 선택하였다(D121). 본 실시 예에서 문턱값 CT1은 0.1인 것이 바람직하다.From 10,000 term values the absolute value of a product of a peak intensity and a mass ion-specific factor loading values were primarily selected by the large mass ions than the threshold value CT 1 on a case-by-case basis (D121). The threshold value CT 1 in this embodiment is preferably 0.1.
다음, 케이스별로 일차적으로 선택한 질량 이온들 중에서 제1훈련집합 전체 케이스들 중 문턱값 CT2 퍼센트 이상의 케이스들에서 공통으로 나타나는 질량 이온들을 이차적으로 선택하였다(D122). 본 실시 예에서 문턱값 CT2는 50인 것이 바람직하다. 즉, 제1종 판별식의 경우를 예로 들어 설명하면 제1훈련집합인 269개 케이스들 중 최소 135개 이상의 케이스들에서 공통으로 등장하는 질량 이온들로만 예비 판별식을 구성하였다.Next, among the mass ions selected on a case-by-case basis, among the entire cases of the first training set, mass ions commonly appearing in cases of 2 % or more of the threshold value CT were secondarily selected (D122). In this embodiment, the threshold value CT 2 is preferably 50. In other words, the preliminary discriminant is composed of only the mass ions that appear in common in at least 135 cases among the 269 cases of the first training set.
상기와 같은 과정을 통하여 선택한 질량 이온들만으로 다시 판별 점수를 계산하고 이에 따라 민감도 및 특이도를 계산하였다(D123). 다시, 민감도의 문턱값 CN3와 특이도의 문턱값 CN4를 설정하여(D124), 민감도 또는 특이도가 각각의 문턱값보다 작은 경우 D121 단계에서 사용된 문턱값 CT1 및/또는 D122 단계에서 사용된 문턱값 CT2를 변경하여(D125) D121 내지 D124 단계를 반복하였다. 본 실시 예에서는 민감도의 문턱값 CN3와 특이도의 문턱값 CN4가 각각 0.9인 것이 바람직하다.The discrimination score was again calculated using only selected mass ions and the sensitivity and specificity were calculated (D123). Again, by setting the threshold value CN 3 and specificity threshold CN 4 of the sensitivity (D124), the sensitivity or specificity is less than the respective threshold value in the threshold value CT 1 and / or D122 step in D121 step by changing the threshold value CT 2 using (D125) D121 to D124 was repeated steps: In the present embodiment, it is preferable that the sensitivity threshold CN 3 and the threshold value CN 4 of the specificity are 0.9, respectively.
이와 같은 단계들을 거쳐 선택한 질량 이온들로 CRC 진단용 저질량 이온들의 예비 후보군을 구성하였는데(D126), 본 실시 예에서는 10,000개의 질량 이온들 중 제1종 판별식의 경우 278개, 제2종 판별식의 경우 383개의 질량 이온들이 선택되었다. 표 22와 표 23에 제1종 예비 판별식과 제2종 예비 판별식으로 제1훈련집합 A01과 A02를 판별한 결과를 나타내었는데, 민감도와 특이도 등 판별 성능이 100%에서 약간 낮아졌으나 전체 질량 이온 개수의 3~4%도 되지 않는 질량 이온들만으로 계산한 결과임에도 불구하고, 전체 질량 이온들을 사용했을 때와 비교하여 필적할 만한 우수한 판별 결과를 보임을 확인할 수 있다. The preliminary candidates of the low mass ions for the CRC diagnosis were constituted by the mass ions selected through the above steps (D126). In this embodiment, 278 of the 10,000 kinds of mass ions are classified into the first type discrimination type, 383 mass ions were selected. Table 22 and Table 23 show the result of discrimination of the first training set A 01 and A 02 in the first type preliminary discrimination type and the second type discrimination type. The discrimination performance such as the sensitivity and the specificity was slightly lowered from 100% Although it is calculated by using only mass ions not more than 3 to 4% of the total number of mass ions, it can be confirmed that there is an excellent discrimination result which is comparable to that when using all mass ions.
또한, 예비 판별식으로 집합 A1을 판별한 결과를 도 15와 도 16에 나타내었는데, 도 15는 제1종 예비 판별식, 도 16은 제2종 예비 판별식의 결과를 보여준다. 계산에 사용되는 질량 이온의 개수는 급격하게 감소된 것에 비해 판별 점수의 범위는 그렇지 않음을 알 수 있는데, 이로부터 CRC 환자 및 비환자를 구분함에 있어 10,000개의 질량 이온이 모두 필요한 것이 아니라는 것을 확인할 수 있다.
15 and 16 show the result of discrimination of the set A 1 in the preliminary discrimination formula. FIG. 15 shows the results of the first type discrimination method and FIG. 16 shows the results of the second type discrimination method. It can be seen that the number of mass ions used in the calculation is sharply reduced, whereas the range of the discrimination score is not so. From this, it can be seen that 10,000 mass ions are not necessary in distinguishing between CRC patients and non-patients have.
True Non-CRC
NHL
상기와 같은 일련의 과정은 상기 후보이온집합 선택수단(2410)을 포함하는 대장암진단용이온 선정수단(2400)을 통하여 효과적으로 수행될 수 있다.
The above-described series of processes can be effectively performed through the colon cancer diagnostic
2-7. 최종 판별식의 구성2-7. Composition of the final discriminant equation
예비 판별식을 구성하는 과정에서는 임포트한 10,000개의 질량 이온들 중 판별 점수에 수치적으로 큰 기여를 하는 질량 이온들을 추출하였다. 그러나 질량 이온들 중에는 제1훈련집합 A0에서는 문제를 발생시키지 않았으나, 동일한 CRC 환자군 및 비환자군의 혈청에 대해 다시 측정한 질량 스펙트럼에 대한 판별 또는 새로운 CRC 환자군 및 비환자군에 대한 판별에 있어서는 잠재적으로 판별 성능을 저하시킬 수 있는 질량 이온들 역시 포함되어 있을 것이므로 이것들도 적극적으로 제거하는 단계가 필요한데, 최종 판별식의 구성 과정에서는 이 단계를 거쳐 최종적으로 CRC 진단용 저질량 이온들을 결정한다.In the process of constructing the preliminary discriminant, mass ions which contribute a great numerical contribution to the discrimination score among the 10,000 imported mass ions were extracted. However, among the mass ions, there was no problem in the first training set A 0 , but in the discrimination of the mass spectra re-measured for the serum of the same CRC patient group and the non-patient group, or in the discrimination for the new CRC patient group and the non- Since the mass ions that may degrade the discrimination performance are also included, it is necessary to actively remove them. In the final discrimination process, the low-mass ions for CRC diagnosis are finally determined through this step.
판별식의 강건성을 검증하기 위해 먼저 집합 A1에 대해 5회 반복 측정 실험을 하였으며, 이와 독립적이며 또한, 서로 독립적인 집합 A2 및 집합 B에 대해서도 5회 반복 측정 실험을 수행하였다. 질량 스펙트럼의 반복 측정 과정에는 상기 설명한 혈청을 얼리고 녹이는 과정 및 혈청을 새로 메탄올/클로로포름과 혼합하여 추출하는 과정이 개입되는 것 외에, 레이저 빔(laser beam)을 이용한 기화(vaporization), 탈착(desorption), 이온화(ionization) 과정 등도 반복 실험시 동일하게 진행된다고는 할 수 없으며 또한, 아직 밝혀지지 않은 다양한 원인들로부터의 외란들도 개입할 여지가 많다. 따라서 반복 측정된 개별 질량 스펙트럼에 대한 판별 점수에 어느 정도의 편차가 발생하는 것은 배제할 수 없을 것이므로 본 실시 예에서는 5회 반복 측정한 시료에 대해 평균 판별 점수를 계산하여 판정을 실시하였다. In order to verify the robustness of the discriminant equation, five experiments were repeatedly performed on the set A 1 , and five independent experiments were performed on the independent and independent sets A 2 and B, respectively. In the repeated measurement of the mass spectrum, a process of melting and dissolving the serum described above and a process of mixing the serum with methanol / chloroform are newly introduced, and vaporization, desorption, and the like using a laser beam are performed. And ionization process can not be said to be the same in repetitive experiments, and disturbances from various causes that have not yet been revealed can be intervened. Therefore, it can not be excluded that a certain deviation occurs in the discrimination score for the repeated mass spectra. Therefore, in this embodiment, the average discrimination score was calculated for the samples repeated five times and the judgment was made.
표 24는 종래 기술인 MarkerViewTM의 주성분 분석 기반 선형 판별 분석 결과인 10,000개 항의 판별식으로 집합 A와 B를 판별한 결과를 나타내며, 표 25는 278개 항을 가지는 제1종 예비 판별식과 383개 항을 가지는 제2종 예비 판별식으로 집합 A와 B를 판별한 결과를 나타낸다. 표에서 CRC LOME(colorectal cancer Low mass ion discriminant equation) 1은 제1종 판별식, CRC LOME 2는 제2종 판별식을 나타내며, 그 뒤에 딸려 있는 숫자는 판별식에 포함되는 저질량 이온들의 개수를 의미한다. 또한, 표 26에는 검증 집합인 집합 B에 대해서만 판별 성능을 나타내었는데, 괄호 안의 숫자는 TA 환자군을 CRC 환자군에 포함하였을 때의 판별 성능이다. TA 환자군은 향후 CRC 환자군으로 발전된 가능성이 큰 환자군으로 TA 환자군을 CRC 환자군으로 판별하는 것은 조기 발견이라는 검진의 목적상 오히려 바람직한 판별 결과라고 할 수 있다.
Table 24 shows the results of discrimination of sets A and B by the discriminant of 10,000 terms, which is the result of the linear discriminant analysis based on the principal component analysis of the prior art MarkerView TM . Table 25 shows the results of the first type discriminant equation having 278 terms and 383 terms The results of discrimination between sets A and B are shown in the second kind discriminant equation. In the table, CRC LOME (colorectal cancer low mass discriminant equation) 1 is the first discriminant,
CRCTrue
CRC
CRCTrue
CRC
CRCTrue
CRC
CRCTrue
CRC
CRCTrue
CRC
CRCTrue
CRC
CRC LOME 2-10000CRC LOME 1-10000 &
CRC LOME 2-10000
CRC LOME 2-383CRC LOME 1-278 &
CRC LOME 2-383
CRC LOME 2-23CRC LOME 1-104 &
CRC LOME 2-23
10,000개 질량 이온으로 구성된 판별식은 제1훈련집합 A0에서 완벽한 판별 성능을 보였음에도 불구하고, 집합 B에서 특히 민감도가 낮게 나타나는 것을 표 26에서 확인할 수 있다. 제1종 및 제2종 예비 판별식도 제1훈련집합 A0에서는 매우 우수한 판별 성능(표 22, 23)을 보였음에도 불구하고 집합 B에서의 판별 결과는 만족스럽지 않았다. Table 26 shows that the discriminant composed of 10,000 mass ions showed a particularly low sensitivity in the set B, although the complete discrimination performance in the first training set A 0 was shown. The results of discrimination in group B were unsatisfactory despite the excellent discrimination performance (Table 22, Table 23) in the first training group A 0 and the first
따라서, 본 발명의 바람직한 일 실시 예에서는 예비 판별식을 강건한 판별식으로 개선하고자 도 17에 도시된 순서도의 단계들을 수행하였다. Therefore, in a preferred embodiment of the present invention, the steps of the flowchart shown in FIG. 17 have been performed in order to improve the preliminary discrimination equation to a robust discriminant.
먼저, 예비 후보군의 질량 이온들을, 고민감도 집합과 고특이도 집합으로 구분하였다(D131). 여기에서, 고민감도 집합의 질량 이온들은 질량 이온별 민감도가 특이도보다 높은 질량 이온들이며, 고특이도 집합의 질량 이온들은 그 반대이다. First, the mass ions of the preliminary candidate group are classified into a set of high sensitivity and a high specificity group (D131). Here, mass ions in the hypertonic set are mass ions whose mass ion specificity is higher than specificity, and mass ions in the high specificity set are the opposite.
다음으로, 고민감도 집합의 질량 이온들과 고특이도 집합의 질량 이온들을 각각 질량 이온별 민감도와 특이도의 합의 내림차순으로 정렬한 후{Sns1, Sns2, Sns3 … SnsI}{Spc1, Spc2, Spc3 … SpcJ}, 각각의 상위 2개의 질량 이온들을 취하고{Sns1, Sns2, Spc1, Spc2}, 4개의 질량 이온들 중 2개 이상의 질량 이온들로 구성할 수 있는 조합들(11개) 중 최고 성능의 조합을 바이오마커 그룹(biomarker group)으로 선정하였다(D132).Next, the mass ions of the hypertonic set and the mass ions of the high specificity set are sorted in descending order of the sensitivity and specificity of each mass ion, respectively, and then {Sns 1 , Sns 2 , Sns 3 ... Sns I } {Spc 1 , Spc 2 , Spc 3 ... Spc J }, each of the top two mass ions {Sns 1 , Sns 2 , Spc 1 , Spc 2 }, combinations (11) that can consist of two or more mass ions of four mass ions, (D132) were selected as the biomarker group.
여기에서, 최고 성능의 조합인지 여부는 다음의 기준들에 따라 객관적이고 보편적으로 선택될 수 있다. 다음의 기준들은 중요도의 순서에 따른다.Here, whether or not the combination of the highest performance can be objectively and universally selected according to the following criteria. The following criteria are in order of importance.
기준1) 민감도와 특이도의 합이 큰 조합이 보다 성능이 높다.Criteria 1) The combination of sensitivity and specificity is higher.
기준2) 질량 이온들의 개수가 적은 조합이 보다 성능이 높다.Criteria 2) Combinations with fewer mass ions have higher performance.
기준3) 진양성 케이스 중 최소 판별 점수와 진음성 케이스 중 최대 판별 점수의 차이가 큰 조합이 보다 성능이 높다.Criterion 3) A combination with a large difference between the minimum discrimination score and the maximum discrimination score among the true cases is higher than the true discrimination case.
다음으로, 고민감도 집합과 고특이도 집합 각각의 그 다음 상위 1개의 질량 이온들{Sns3, Spc3}을 추가로 더 취하여 상기 바이오마커 그룹 및 상기 바이오마커 그룹에 상기 질량 이온들{Sns3, Spc3} 중 어느 하나 이상을 조합한 4개의 집합들{biomarker group}, {biomarker group, Sns3}, {biomarker group, Spc3}, {biomarker group, Sns3, Spc3} 중 최고 성능의 집합을 다시 바이오마커 그룹으로 선정한다(D133).Next, the next one of the next higher mass ions {Sns 3 , Spc 3 } of each of the set of sensitivity sensitivity and the high specificity set is further taken, and the mass ions {Sns 3 , the Spc 3} any set of four combining one or more of the {biomarker group}, {biomarker group , Sns 3}, {biomarker group, Spc 3}, set the highest performance of the {biomarker group, Sns 3, Spc 3} Is selected again as a biomarker group (D133).
이러한 과정은, 고민감도 집합 및 고특이도 집합 모두에 추가할 질량 이온이 없을 때까지 반복된다(D134). This process is repeated until there are no mass ions to add to both the hypertonic and high specificity sets (D134).
즉, 고민감도 집합 및 고특이도 집합 모두에 추가할 질량 이온이 있을 때에는 상기와 같은 방식(D133)을 반복하고, 고민감도 집합과 고특이도 집합 중 어느 하나에 추가할 질량 이온이 남지 않은 경우에는, 남은 질량 이온이 있는 집합 중 그 다음 상위 1개의 질량 이온{Snsi 또는 Spcj}을 추가로 더 취하여 상기 바이오마커 그룹 및 상기 바이오마커 그룹에 상기 질량 이온{Snsi 또는 Spcj}을 조합한 2개의 집합들{biomarker group}, {biomarker group, Snsi 또는 Spcj} 중 최고 성능의 집합을 다시 바이오마커 그룹으로 선정한다. That is, when there are mass ions to be added to both the hyperhidimetic sensitivity set and the high specificity set, the above method (D133) is repeated. When no mass ion to be added to any of the hyperhidophilic set and the high specificity set is left , that of the remaining sets in the mass ion, and then the upper one mass ion {Sns i or Spc j} one more more taken as a combination of the mass ion {Sns i or Spc j} on the biomarker group and the biomarker group Biomarker group, biomarker group, Sns i or Spc j } among the two sets of biomarker groups.
이러한 과정은, 고민감도 집합과 고특이도 집합 중 질량 이온이 남았었던 집합의 질량 이온이 남지 않을 때까지 반복되며, 고민감도 집합과 고특이도 집합 모두에 남은 질량 이온이 없는 경우의 바이오마커 그룹이 바이오마커 그룹1(CG)이 된다(D135).This process is repeated until there is no remaining mass ion in the set of hypertonic and high specificity mass ions remaining, and when the biomarker group in which there is no remaining mass ion in both hypertonic and high specificity sets is bio Marker group 1 (CG) (D135).
예비 후보군에서 바이오마커 그룹1(CG)을 제거하고(D136) 남은 질량 이온들로 다시 고민감도 집합과 고특이도 집합을 구성하고 위의 과정을 반복한다. 이 과정은 고민감도 집합과 고특이도 집합 중 어느 한 집합이 두 개 미만의 질량 이온만을 가질 때까지 반복된다(D137).Remove the biomarker group 1 (CG) from the preliminary candidate group (D136) and construct a set of high sensitivity and high specificity again with the remaining mass ions and repeat the above procedure. This process is repeated until either a set of critical sensitivity and a set of high specificity have less than two mass ions (D137).
위의 반복 과정을 통해 얻은 바이오마커 그룹1, 2, … 중 정확도순으로 CK개의 바이오마커 그룹을 조합하여 최종 바이오마커 그룹을 형성한다. 여기서 정확도는 전체 케이스 중 진양성 및 진음성 케이스의 비율을 의미한다. 본 실시 예에서 CK는 1, 2 또는 3 중 어느 하나인 것이 바람직하다(D138).The
따라서, 상기 최종 바이오마커 그룹의 질량 이온들이 CRC 진단용 저질량 이온들로 결정된다(D139).Accordingly, the mass ions of the final biomarker group are determined as low mass ions for CRC diagnosis (D139).
집합 A1에서, 더 정확하게는 그 부분 집합인 A0에서 질량 이온들의 예비 후보군을 선정하였는데, 예비 후보군으로부터 최종 바이오마커 그룹을 결정할 때에는 과적합(overfitting) 문제를 해결하기 위하여 집합 A1에 독립인 집합 A2도 추가하여 훈련 집합을 확장하였다.Were in the set A 1, more accurately, selected pre-candidate group of the mass ion at the A 0 set the portion, of the set A 1 to when determining the final biomarker group from the pre-candidate group to address effectively the sum (overfitting) issues independent We expanded the training set by adding the set A 2 .
상기의 과정들을 CRC 환자군과 정상 대조군을 구분하기 위한 시료들을 대상으로 수행한 결과 제1종 CRC 진단용 저질량 이온으로 104개가 선택되었으며, CRC 환자군과 다른 암환자군을 구분하기 위한 시료들을 대상으로 수행한 결과 제2종 CRC 진단용 저질량 이온으로 23개가 선택되었다. 제1종 및 제2종 CRC 진단용 저질량 이온들의 질량값은 표 27 및 28에 나타내었다. 이와 같은 저질량 이온들을 "제1종 CRC 진단용 저질량 이온들" 및 "제2종 CRC 진단용 저질량 이온들"로 지칭하고, 이를 이용하여 최종적으로 구한 본 발명에 따른 판별식을 "제1종 CRC 진단용 최종 판별식" 및 "제2종 CRC 진단용 최종 판별식"으로 지칭한다.
As a result of performing the above procedures to distinguish between the CRC patient group and the normal control group, 104 low-mass ions for the first type CRC diagnosis were selected and samples for distinguishing between the CRC patient group and the other cancer group were performed RESULTS: Twenty-three of the low-mass ions for the second-type CRC diagnosis were selected. Mass values of low mass ions for the first and second species CRC diagnostics are shown in Tables 27 and 28. Such low-mass ions are referred to as " low-mass ions for the first kind of CRC diagnosis "and" low-mass ions for the second kind of CRC diagnosis ", and finally the discriminant according to the present invention, Final discrimination formula for CRC diagnosis "and" second discrimination formula for CRC diagnosis for type II ".
표 27에서 1465.6184, 1466.6096, 1467.5969, 2450.9701, 2451.9662, 2452.9546 m/z은 피브리노겐 알파 체인(fibrinogen alpha chain)과 트랜스타이레틴(transthyretin)으로 동정되었다.
In Table 27, 1465.6184, 1466.6096, 1467.5969, 2450.9701, 2451.9662, 2452.9546 m / z were identified as the fibrinogen alpha chain and transthyretin.
상기와 같은 일련의 과정은 상기 후보이온집합 선택수단(2410) 및 최종이온집합 선택수단(2420)을 포함하는 대장암진단용이온 선정수단(2400)을 통하여 효과적으로 수행될 수 있다.
The above-described series of processes can be effectively performed through the colorectal cancer diagnosis
2-8. 최종 판별식의 적용 및 분석2-8. Application and analysis of the final discriminant equation
집합 B에 대하여 제1종 및 제2종 CRC 진단용 저질량 이온들을 이용한 제1종 및 제2종 CRC 진단용 최종 판별식을 도 11에 도시된 순서도의 방법에 따라 적용하면 그 판정 결과를 획득할 수 있다. Applying the final discriminant for first and second CRC diagnostics using the low-mass ions for the first kind and the second kind CRC diagnosis to the set B according to the method of the flowchart shown in FIG. 11, the judgment result can be obtained have.
최종 판별식으로 판정한 결과를 도 18, 19 및 표 26, 29에 나타내었다. 도 18, 19는 5회 판별 점수의 평균 판별 점수로 판정한 결과를 나타내는데, 도 18은 집합 A, 도 19는 집합 B의 판정 결과를 나타낸다.
The results of the final discrimination are shown in Figs. 18 and 19 and Tables 26 and 29. 18 and 19 show the results of judging by the average discrimination score of the five discrimination scores. FIG. 18 shows the result of the judgment of the set A and FIG. 19 shows the judgment result of the set B. FIG.
CRCTrue
CRC
CRCTrue
CRC
CRCTrue
CRC
검증 집합인 집합 B의 경우 민감도, 특이도, 양성예측도, 음성예측도가 모두 85% 이상임을 확인할 수 있다. 또한, TA 환자군을 CRC 환자군에 포함하면 판별 성능은 모두 90% 이상이 되어 매우 우수한 판별 결과를 나타내는 것을 알 수 있다.The sensitivity, specificity, positive predictive value, and negative predictive value of the set B, which is a verification set, are all above 85%. In addition, if the TA patient group is included in the CRC patient group, the discrimination performance is more than 90%, which indicates a very good discrimination result.
표 30은 분석한 시료 중 종래의 FOBT 분석이 실시된 경우의 판별 성능과 본 발명의 판별 성능을 비교하여 보여주고 있다. 검증 집합 중 CRC 환자군 96개 시료와 정상 대조군 49개 시료에 대한 FOBT 결과는 특이도는 100%였으나 민감도가 50% 밖에는 되지 않았다. Table 30 shows the discrimination performance when the conventional FOBT analysis is performed among the analyzed samples and the discrimination performance of the present invention. The FOBT results for 96 samples from CRC patients and 49 samples from normal controls were 100% specific, but the sensitivity was only 50%.
본 실시 예에서는 일반적으로 알려진 FOBT의 민감도인 60~85%에 미치지 못하는 결과를 얻었다. 일반적인 FOBT의 판별 성능과 비교한다고 해도 본 발명은 특이도의 측면에서는 FOBT와 필적할 만하며, 민감도의 관점에서는 차별적으로 우수한 결과를 나타냄을 알 수 있으며, 이는 본 발명의 우수한 판별 성능을 증명한다. 훈련 집합에서도 유사한 결과를 얻을 수 있는데, 훈련 집합과 검증 집합 모두에 대한 FOBT 판별 결과 및 본 발명에 따른 판별 결과를 표 31에 나타내었다.
In this example, the sensitivity of the commonly known FOBT is less than 60 ~ 85%. Even when compared with the discrimination performance of general FOBT, it can be seen that the present invention is comparable to FOBT in terms of specificity and shows excellent discrimination from the viewpoint of sensitivity, which proves the excellent discrimination performance of the present invention. Similar results are obtained in the training set. Table 31 shows the FOBT discrimination results for both the training set and the verification set and the discrimination results according to the present invention.
CRC LOME 2-23CRC LOME 1-104 &
CRC LOME 2-23
CRCTrue
CRC
CONTTrue
CONT
CRCTrue
CRC
CONTTrue
CONT
CRCTrue
CRC
CONTTrue
CONT
CRCPredicted
CRC
Non-CRCPredicted
Non-CRC
CRC LOME 1-104
CRC LOME 2-23CRC LOME 1-104 &
CRC LOME 2-23
본 발명에 따른 판별 결과의 재현성을 확인하기 위하여 검증 집합 중 정상 대조군 13개, CRC 환자군 35개, BRC 환자군 7개, 위암 환자군 14개, OVC 환자군 7개, TA 환자군 5개 시료에 대해 같은 과정을 반복하였는데, 그 결과를 표 32에 나타내었다. 판별 결과가 번복되는 경우는 TA 환자군에 집중되었는데 TA 중 Tis는 암으로 분류되기도 하고 분류되지 않기도 하는 등 임상적으로도 혼란이 있는데 본 발명에 따른 판별 결과에서도 혼란스러운 결과를 나타내었다 TA 환자군을 제외하면 90% 이상의 재현율을 나타내는 것을 확인할 수 있는데, 이는 본 발명의 우수한 판별 성능을 증명한다.
In order to confirm the reproducibility of the discrimination results according to the present invention, the same procedure was applied to 13 normal controls, 35 CRC patients, 7 BRC patients, 14 gastric cancer patients, 7 OVC patients and 5 TA patients The results are shown in Table 32. When the result of the discrimination was reversed, it was concentrated in the TA patient group. Tis in the TA was classified as cancer or not classified, and the clinical result was confusing, and the discrimination result according to the present invention showed confusing results. It can be confirmed that the reproducibility is 90% or more, which demonstrates the excellent discrimination performance of the present invention.
1st 5 times repeated
Low mass ion measurementsPrediction after
1st 5 times repeated
Low mass ion measurements
2nd 5 times repeated
Low mass ion measurementsPrediction after
2nd 5 times repeated
Low mass ion measurements
1st 5 times repeated
Low mass ion measurementsPrediction after
1st 5 times repeated
Low mass ion measurements
2nd 5 times repeated
Low mass ion measurementsPrediction after
2nd 5 times repeated
Low mass ion measurements
& CRC LOME 2-23CRC LOME 1-104
& CRC LOME 2-23
& CRC LOME 2-23CRC LOME 1-104
& CRC LOME 2-23
& CRC LOME 2-23CRC LOME 1-104
& CRC LOME 2-23
& CRC LOME 2-23CRC LOME 1-104
& CRC LOME 2-23
도 20a 및 도 20b는 각각 제1종 CRC 진단용 저질량 이온들 중 1465.6184 m/z과 2450.9701 m/z를 동정한 결과를 나타낸다. 두 개의 저질량 이온 모두 구성하는 동위원소의 수에 따라 약 1 m/z 정도의 질량값 차이가 발생하는 동일 물질 질량 피크군의 형태를 보여 주고 있다. 이는 질량분석기에서 나타나는 단백질 또는 펩타이드 특유의 질량 피크 양상이다. FIGS. 20A and 20B show results of identifying 1465.6184 m / z and 2450.9701 m / z, respectively, among low mass ions for the first kind CRC diagnosis. Both of the two low mass ions show the shape of the peak mass of the same material with a mass value difference of about 1 m / z depending on the number of constituent isotopes. This is a mass peak pattern specific to a protein or peptide appearing in a mass spectrometer.
도 20a 및 20b의 왼쪽 위 그림은 상기한 두 저질량 이온 각각의 질량 스펙트럼을 나타내고 있다. 빨간 선으로 표시된 스펙트럼은 CRC 환자군 혈청 추출물에서의 피크 강도를 나타내며, 파란 선으로 표시된 스펙트럼은 정상 대조군에서 얻어진 것이다. 1465.6184 m/z의 경우 CRC 환자군에서 더 높은 피크 강도를 보이는 반면, 2450.9701 m/z는 반대로 CRC 환자군에서 더 낮은 피크 강도를 보였다. 도 20a 및 20b의 오른쪽 위 그림은 상기한 두 저질량 이온의 MS/MS 분석 스펙트럼을 나타내며, 도 20a 및 20b 내의 표와 왼쪽 아래 그림은 1465.6184 m/z과 2450.9701 m/z 이온 물질이 MS/MS 분석을 통해 각각 피브리노겐 알파 체인과 트랜스타이레틴 단백질로 동정되었음을 보여준다. 20A and 20B show the mass spectra of each of the above two low mass ions. The spectrum indicated by the red line represents the peak intensity in the serum extract of the CRC patients and the spectrum indicated by the blue line is obtained from the normal control group. 1465.6184 m / z showed higher peak intensity in CRC patients whereas 2450.9701 m / z showed lower peak intensity in CRC patients. 20A and 20B show MS / MS analysis spectra of the above two low mass ions, and the tables in FIGS. 20A and 20B and the lower left graph show that 1465.6184 m / z and 2450.9701 m / The analysis shows that each of them was identified as a fibrinogen alpha chain and a trans-retinin protein.
피브리노겐 알파 체인에 해당하는 저질량 이온 1465.6184 m/z의 피크 강도가 CRC 환자군에서 높았던 정성적인 결과에 상응되게, 정량적으로 측정해 본 결과 CRC 환자의 혈액 내 피브리노겐의 수치가 정상인에 비해 높으며, 병기가 진행될수록 높았다(표 33 참고).
Quantitative measurement of the peak intensity of low mass ion 1465.6184 m / z corresponding to the fibrinogen alpha chain in the CRC patients showed that the level of fibrinogen in the blood of the CRC patients was higher than that of the normal ones, (See Table 33).
반면, 트랜스타이레틴에 해당하는 저질량 이온 2450.9701 m/z의 피크 강도가 CRC 환자군에서 낮았던 정성적인 결과에 상응되게, 정량적으로 측정해 본 결과 CRC 환자의 혈액 내 트랜스타이레틴의 수치가 정상인에 비해 낮았다(표 34 참고). 평균 ± 표준편차의 형식으로 요약하면 CRC 환자군 160.39 ± 62.41 ng/mL, 정상 대조군 171.19 ± 30.86 ng/mL이었다.
On the other hand, quantitative measurement of the peak intensity of low mass ion 2450.9701 m / z corresponding to the trans-retin, corresponding to the low qualitative result in the CRC patient group, showed that the blood trans-retinol level in the CRC patient (See Table 34). The mean ± standard deviation was 160.39 ± 62.41 ng / mL in CRC patients and 171.19 ± 30.86 ng / mL in normal controls.
(ng/mL)Level of Transthyretin
(ng / mL)
(ng/mL)Level of Transthyretin
(ng / mL)
본 발명의 일 실시예를 통해 혈청의 저질량 이온 질량 스펙트럼을 분석하여 CRC 환자와 비환자를 높은 판별 성능을 갖고 판정할 수 있었다. According to one embodiment of the present invention, a low mass ion mass spectrum of serum was analyzed, and CRC patients and non-patients could be discriminated with high discrimination ability.
본 발명은 본 실시 예와 유사한 과정을 거쳐 대장암 외에 다른 특정 암환자군과 정상 대조군을 판별하는 식을 구성하며 또한, 서로 다른 암환자군을 구별하는 판별식을 구성하는 것으로 쉽게 확장될 수 있다. 또한, 암뿐만 아니라 어떠한 다른 질병에 대하여도 진단할 수 있도록 쉽게 확장될 수 있는 것을 당업자는 용이하게 알 수 있을 것이다.
The present invention can be easily expanded to form a formula for discriminating between a specific cancer patient group and a normal control group other than colorectal cancer through a process similar to that of the present embodiment, and also constituting a discrimination formula for discriminating different cancer patient groups. It will also be readily apparent to those of skill in the art that it can be readily extended to diagnose cancer as well as any other disease.
1000 : 저질량 이온 검출부 2000 : 대장암 진단부
2100 : 제1정렬수단 2200 : 제1판별점수 계산수단
2210 : 정규화 모듈 2220 : 스케일링 모듈
2230 : 판별점수계산 모듈 2300 : 인자적재값 계산수단
2310 : 제1훈련집합 선택수단 2400 : 대장암진단용이온 선정수단
2410 : 후보이온집합 선택수단 2411 : 제1저질량이온 선택모듈
2412 : 후보이온집합 예비선택모듈 2413 : 민감도 및 특이도 계산모듈
2414 : 후보이온집합 최종선택모듈 2420 : 최종이온집합 선택수단
2421 : 이온 구분모듈 2422 : 바이오마커그룹 예비선정모듈
2423 : 바이오마커그룹 재선정모듈 2424 : 바이오마커그룹 최종선정모듈
2425 : 바이오마커그룹 추가선정모듈 2426 : 암진단용저질량이온 최종선택모듈
2500 : 제2정렬수단 2600 : 제2판별점수 계산수단
2610 : 정규화 모듈 2620 : 스케일링 모듈
2630 : 판별점수계산 모듈 2700 : 대장암 판정수단
3000 : 디스플레이부1000: low mass ion detection unit 2000: colon cancer diagnosis unit
2100: first alignment means 2200: first discrimination score calculation means
2210: Normalization module 2220: Scaling module
2230: discrimination score calculation module 2300: factor accumulation value calculation means
2310: First training set selection means 2400: Colon cancer diagnosis ion selection means
2410: Candidate ion set selection means 2411: First low mass ion selection module
2412: Candidate ion set preliminary selection module 2413: Sensitivity and specificity calculation module
2414: Candidate ion set final selection module 2420: Final ion set selection means
2421: Ionizing module 2422: Biomarker group pre-selection module
2423: Biomarker group re-selection module 2424: Biomarker group final selection module
2425: Biomarker group addition module 2426: Low mass ion selective module for cancer diagnosis
2500: second aligning means 2600: second discrimination score calculating means
2610: Normalization module 2620: Scaling module
2630: discrimination score calculation module 2700: colon cancer determination means
3000:
Claims (37)
상기 저질량 이온의 질량 스펙트럼 패턴을 비교 분석하여 대장암 진단 정보를 판정하는 대장암 진단부; 및
상기 대장암 진단부로부터 판정된 대장암 진단 정보를 출력 가능한 형태로 변환하여 표시하는 디스플레이부를 포함하는 대장암 진단 장치.A low mass ion detector for detecting mass spectra of low-mass ions from biological samples of a plurality of colorectal cancer patients and non-patient cases;
A colon cancer diagnosis unit for comparing and analyzing the mass spectral patterns of the low-mass ions to determine colon cancer diagnosis information; And
And a display unit for converting the colorectal cancer diagnosis information determined by the colorectal cancer diagnosis unit into an outputable form and displaying the colorimetric cancer diagnosis information.
상기 저질량 이온 검출부는;
상기 생물학적 시료로부터 저질량 이온의 피크 강도(peak intensity)를 검출하여 상기 저질량 이온의 질량 스펙트럼을 추출하는 것을 특징으로 하는 대장암 진단 장치.The method according to claim 1,
Wherein the low mass ion detector comprises:
And a peak intensity of a low-mass ion is detected from the biological sample to extract a mass spectrum of the low-mass ion.
상기 저질량 이온 검출부는;
질량분석기를 포함하는 것을 특징으로 하는 대장암 진단 장치.3. The method of claim 2,
Wherein the low mass ion detector comprises:
And a mass analyzer.
상기 대장암 진단부는;
훈련 후보 집합인 상기 대장암 환자 및 비환자 케이스들의 저질량 이온 질량 스펙트럼들을 정렬하는 제1정렬수단;
정렬된 상기 질량 스펙트럼에 대해 생물통계학적 분석을 수행하여 판별 점수를 계산하는 제1판별점수 계산수단;
상기 판별 점수에 따라 민감도(sensitivity) 및 특이도(specificity)를 계산하고, 이를 기준으로 제1훈련집합을 선정하여 저질량 이온별 인자적재값(factor loading)을 계산하는 인자적재값 계산수단;
후보 조건을 만족하는 후보 저질량 이온들 중 판별 성능을 기반으로 하여 대장암 진단용 저질량 이온들을 선택하는 대장암진단용이온 선정수단;
판별 대상 생물학적 시료의 저질량 이온 질량 스펙트럼을 상기 제1훈련집합에 정렬하는 제2정렬수단;
상기 판별 대상의 저질량 이온의 피크 강도와 상기 인자적재값으로부터 판별 점수를 계산하는 제2판별점수 계산수단; 및
상기 판별 점수에 따라 상기 판별 대상을 대장암의 양성 또는 음성으로 판정하는 대장암 판정수단을 포함하되,
상기 대장암진단용이온 선정수단은;
상기 다수의 대장암 환자 및 비환자 케이스들을, 다수의 대장암 환자 케이스들과 다수의 정상인 케이스들로 구성되는 제1종 판별 케이스들과, 상기 다수의 대장암 환자 케이스들과 다수의 대장암 이외의 암 환자 케이스들로 구성되는 제2종 판별 케이스들로 구분하고,
상기 제1종 판별 케이스들과 상기 제2종 판별 케이스들에 대해 각각 실행되어, 상기 대장암 진단용 저질량 이온들이, 상기 제1종 판별 케이스에 대한 제1종 대장암 진단용 저질량 이온들과 상기 제2종 판별 케이스에 대한 제2종 대장암 진단용 저질량 이온들로 구분되는 것을 특징으로 하는 대장암 진단 장치.The method according to claim 1,
Wherein the colon cancer diagnosis unit comprises:
First alignment means for aligning low mass ion mass spectra of said colorectal cancer patients and non-patient cases which are training candidate sets;
A first discrimination score calculating means for calculating a discrimination score by performing a biostatistical analysis on the sorted mass spectrum;
A factor load calculation means for calculating a sensitivity and a specificity according to the discrimination score and calculating a factor loading by selecting a first training set based on the sensitivity and the specificity,
An ion selection means for diagnosing colon cancer which selects low mass ions for diagnosis of colon cancer based on the discrimination performance among candidate low mass ions satisfying the candidate condition;
Second alignment means for aligning the low mass ion mass spectrum of the identified biological sample with the first training set;
A second discrimination score calculation means for calculating a discrimination score from the peak intensity of the low-mass ion of the discrimination object and the factor load value; And
And colorectal cancer determination means for determining the discrimination target as positive or negative for colorectal cancer based on the discrimination score,
The colon cancer diagnostic ion selecting means comprises:
The plurality of colorectal cancer patients and non-patient cases are classified into first type discrimination cases each comprising a plurality of colon cancer patient cases and a plurality of normal case cases, And second type discrimination cases composed of cancer patient cases of the second kind,
The low-mass ions for diagnosing colorectal cancer are subjected to the first type discrimination cases and the second type discrimination cases, respectively, and the low-mass ions for diagnosis of the first type colorectal cancer and the low- And a low-mass ion for diagnosing second-type colorectal cancer for the second-type discriminating case.
상기 제1종 대장암 진단용 저질량 이온들의 질량값은 18.0260, 22.9797, 74.0948, 76.0763, 102.0916, 105.1078, 106.0899, 107.0477, 118.0822, 123.0395, 137.0423, 137.0729, 147.0573, 147.1058, 169.0653, 181.0656, 190.0849, 191.0848, 191.3324, 195.0785, 212.3195, 231.0667, 235.0053, 256.0939, 266.9557, 267.9501, 288.2033, 291.0997, 295.0663, 300.1297, 301.1269, 316.2288, 317.2311, 335.1862, 340.2241, 343.2451, 345.2583, 357.0666, 357.2784, 366.2310, 368.2551, 369.3302, 377.0570, 379.1438, 379.4765, 383.0529, 384.1745, 388.2688, 401.0531, 423.0313, 428.1878, 454.2090, 465.3014, 466.1923, 468.1851, 469.2831, 477.1721, 478.1678, 480.1715, 482.3220, 483.3258, 496.8683, 497.7636, 503.8719, 508.3407, 510.3265, 512.3119, 513.3177, 518.2931, 518.8555, 519.2967, 519.8598, 525.3449, 534.2739, 537.2800, 538.3306, 540.2629, 540.8144, 542.8457, 544.8692, 548.2856, 566.8375, 581.1957, 582.1888, 583.2242, 656.0270, 667.3291, 709.3519, 710.3581, 711.3617, 712.3683, 713.3798, 991.6196, 992.6209, 1016.6113, 1020.4817, 1206.5305, 1207.5571, 1465.6184, 1466.6096, 1467.5969, 2450.9701, 2451.9662 및 2452.9546 m/z (단, 오차 범위는 ±0.1 m/z)로 이루어진 그룹으로부터 선택된 하나 이상의 질량값인 것을 특징으로 하는 대장암 진단 장치.5. The method of claim 4,
The mass values of the low mass ions for diagnosis of the first type colorectal cancer are 18.0260, 22.9797, 74.0948, 76.0763, 102.0916, 105.1078, 106.0899, 107.0477, 118.0822, 123.0395, 137.0423, 137.0729, 147.0573, 147.1058, 169.0653, 181.0656, 190.0849, 191.0848, 369.3302, 377.0570, 369.3302, 357.2781, 367.2669, 367.2784, 366.2310, 368.2551, 369.3302, 377.0570, 290.036, 379.4765, 383.0529, 384.1745, 388.2688, 401.0531, 423.0313, 428.1878, 454.2090, 465.3014, 466.1923, 468.1851, 469.2831, 477.1721, 478.1678, 480.1715, 482.3220, 483.3258, 496.8683, 497.7636, 503.8719, 508.3407, 510.3265, 512.3119, 513.3177, 518.2931, 518.8555, 519.2967, 519.8598, 525.3449, 534.2739, 537.2800, 538.3306, 540.2629, 540.8144, 542.8457, 544.8692, 548.2856, 566.8375, 581.1957, 582.1888, 583.2242, 656.0270, 667.3291, 709.3519, 710.3581, 711.3617, 712.3683, 713.3798, 991.6196, 992 Characterized in that the mass value is at least one mass value selected from the group consisting of m / z of 6209, 1016.6113, 1020.4817, 1206.5305, 1207.5571, 1465.6184, 1466.6096, 1467.5969, 2450.9701, 2451.9662 and 2452.9546 m / z A colon cancer diagnostic device.
상기 제2종 판별 케이스들 중 상기 다수의 대장암 이외의 암 환자 케이스들은 유방암 환자 케이스들, 비호지킨림프종(non-Hodgkin lymphoma, NHL) 환자 케이스들 및 위암 환자 케이스들 중 적어도 하나 이상의 암 환자 케이스들을 포함하되,
상기 제2종 대장암 진단용 저질량 이온들의 질량값은 60.0476, 138.0540, 172.6653, 173.1158, 179.1451, 191.1277, 279.0855, 280.0895, 280.2642, 281.1440, 296.2574, 312.3248, 332.3224, 333.3324, 369.3406, 465.3161, 486.6356, 488.6882, 544.8908, 551.3287, 566.8737, 707.3475 및 733.3569 m/z (단, 오차 범위는 ±0.1 m/z)로 이루어진 그룹으로부터 선택된 하나 이상의 질량값인 것을 특징으로 하는 대장암 진단 장치.5. The method of claim 4,
The cancer patient cases other than the plurality of colorectal cancer among the second type discrimination cases include at least one cancer patient case, non-Hodgkin lymphoma (NHL) patient case, and gastric cancer patient case ≪ / RTI >
The mass values of the second kind of colorectal cancer diagnostic low mass ions are 60.0476, 138.0540, 172.6653, 173.1158, 179.1451, 191.1277, 279.0855, 280.0895, 280.2642, 281.1440, 296.2574, 312.3248, 332.3224, 333.3324, 369.3406, 465.3161, 486.6356, 488.6882, 544.8908, 551.3287, 566.8737, 707.3475 and 733.3569 m / z (with an error range of +/- 0.1 m / z).
상기 판별 점수는 상기 제1종 저질량 이온들에 의한 제1종 판별 점수와 상기 제2종 저질량 이온들에 의한 제2종 판별 점수를 포함하며,
상기 제1종 판별 점수가 CS11보다 크고, 상기 제2종 판별 점수가 CS21보다 큰 경우에는 상기 판별 대상을 대장암 양성으로 판단하고,
상기 제1종 판별 점수가 CS12보다 작거나 상기 제2종 판별 점수가 CS22보다 작은 경우에는 상기 판별 대상을 대장암 음성으로 판단하는 것을 특징으로 하는 대장암 진단 장치. 5. The method of claim 4,
Wherein the discrimination score includes a first type discrimination score by the first kind low mass ions and a second type discrimination score by the second kind low mass ions,
When the first type discrimination score is greater than CS 11 and the second type discrimination score is greater than CS 21 , the discrimination object is judged to be colon cancer positive,
If the first type discrimination score is smaller than CS 12 or the second type discrimination score is smaller than CS 22 , the discrimination object is judged as negative colon cancer.
상기 CS11, CS12, CS21 및 CS22는 0인 것을 특징으로 하는 대장암 진단 장치.8. The method of claim 7,
Wherein the CS 11 , CS 12 , CS 21, and CS 22 are zero.
상기 대장암진단용이온 선정수단을 이용해 획득한 대장암 환자와 정상인을 구분하는 저질량 이온군에는 피브리노겐(fibrinogen) 또는 피브리노겐 알파 체인(fibrinogen alpha chain)이 포함되는 것을 특징으로 하는 대장암 진단 장치.5. The method of claim 4,
Wherein the low-mass ion group that distinguishes colon cancer patients and normal persons obtained using the ion selection means for colon cancer diagnosis includes fibrinogen or fibrinogen alpha chain.
상기 대장암 환자와 정상인을 구분하는 저질량 이온군에는 트랜스타이레틴(transthyretin)이 포함되는 것을 특징으로 하는 대장암 진단 장치.5. The method of claim 4,
Wherein the low-mass ion group that distinguishes between the colon cancer patient and the normal person includes transthyretin.
상기 제1판별점수 계산수단은;
상기 훈련 후보 집합의 상기 저질량 이온 질량 스펙트럼들의 상기 피크 강도들을 정규화하는 정규화 모듈;
상기 정규화한 피크 강도들을 스케일링하는 스케일링 모듈; 및
상기 스케일링된 피크 강도들에 대해 상기 생물통계학적 분석을 수행하여 상기 판별 점수를 계산하는 판별점수계산 모듈을 포함하는 것을 특징으로 하는 대장암 진단 장치.5. The method of claim 4,
Wherein the first discrimination score calculating means comprises:
A normalization module for normalizing the peak intensities of the low mass ion mass spectra of the training candidate set;
A scaling module for scaling the normalized peak intensities; And
And a discrimination score calculation module for calculating the discrimination score by performing the biostatistical analysis on the scaled peak intensities.
상기 스케일링 모듈은;
파레토 스케일링을 수행하는 것을 특징으로 하는 대장암 진단 장치.12. The method of claim 11,
The scaling module comprising:
And performing Pareto scaling.
상기 판별점수계산 모듈은;
주성분 분석 기반 선형 판별 분석을 사용하여 상기 생물통계학적 분석을 수행하는 것을 특징으로 하는 대장암 진단 장치.12. The method of claim 11,
Wherein the discrimination score calculation module comprises:
Wherein the biostatistical analysis is performed using linear discriminant analysis based on principal component analysis.
상기 판별점수계산 모듈은;
상기 주성분 분석 기반 선형 판별 분석에 의해 획득된 인자적재값과 상기 스케일링된 피크 강도를 함께 사용하여 상기 판별 점수를 계산하는 것을 특징으로 하는 대장암 진단 장치.14. The method of claim 13,
Wherein the discrimination score calculation module comprises:
Wherein the discrimination score is calculated using both the factor load value obtained by the principal component analysis based linear discriminant analysis and the scaled peak intensity together.
상기 인자적재값 계산수단은;
상기 정렬된 질량 스펙트럼에 대해 생물통계학적 분석을 수행하고, 상기 생물통계학적 분석 결과를 기초로 상기 대장암 환자 및 비환자 케이스들 중 훈련 조건을 만족하는 훈련 케이스들을 제1훈련집합으로 선택하는 제1훈련집합 선택수단을 포함하며, 상기 제1훈련집합으로부터 인자적재값을 계산하는 것을 특징으로 하는 대장암 진단 장치.5. The method of claim 4,
The factor load value calculation means comprising:
Performing a biostatistical analysis on the sorted mass spectrum and selecting training cases that satisfy training conditions among the colorectal cancer patients and non-patient cases based on the biostatistical analysis results as a first training set 1 training set selection means, and calculates the parameter load value from the first training set.
상기 제1훈련집합 선택수단은;
상기 생물통계학적 분석 결과에 따른 민감도가 문턱값 CN1 이상이고, 특이도가 문턱값 CN2 이상일 때의 대장암 환자 및 비환자 케이스들을 상기 제1훈련집합으로 설정하는 것을 특징으로 하는 대장암 진단 장치.16. The method of claim 15,
Wherein the first training set selection means comprises:
Wherein colon cancer patients and non-cancer cases when the sensitivity according to the result of the biostatistical analysis is equal to or greater than the threshold value CN 1 and the specificity is equal to or greater than the threshold value CN 2 are set as the first training set. Device.
상기 문턱값 CN1과 CN2는 1인 것을 특징으로 하는 대장암 진단 장치.17. The method of claim 16,
Wherein the threshold values CN 1 and CN 2 are 1.
상기 제2판별점수 계산수단은;
상기 판별 대상의 상기 저질량 이온 질량 스펙트럼의 상기 피크 강도들을 정규화하는 정규화 모듈;
상기 정규화한 피크 강도들을 스케일링하는 스케일링 모듈; 및
상기 스케일링된 피크 강도와 상기 인자적재값을 통해 상기 판별 점수를 계산하는 판별점수계산 모듈을 포함하는 것을 특징으로 하는 대장암 진단 장치.5. The method of claim 4,
And the second discrimination score calculating means comprises:
A normalization module for normalizing the peak intensities of the low mass ion mass spectrum of the object to be discriminated;
A scaling module for scaling the normalized peak intensities; And
And a discrimination score calculation module for calculating the discrimination score through the scaled peak intensity and the factor load value.
상기 스케일링 모듈은;
파레토 스케일링을 수행하는 것을 특징으로 하는 대장암 진단 장치.19. The method of claim 18,
The scaling module comprising:
And performing Pareto scaling.
상기 판별점수계산 모듈은;
상기 대장암 진단용 저질량 이온들의 상기 스케일링된 피크 강도와 상기 인자적재값을 통해 상기 판별 점수를 계산하는 것을 특징으로 하는 대장암 진단 장치.19. The method of claim 18,
Wherein the discrimination score calculation module comprises:
Wherein the discrimination score is calculated through the scaled peak intensity of the low mass ions for colorectal cancer diagnosis and the factor load value.
상기 대장암 판정수단은;
상기 판별 점수에 따라 상기 판별 대상을 대장암의 양성 또는 음성으로 판정하되,
상기 판별 점수가 기준값 CS보다 크면 양성으로 상기 판별 대상의 대장암 정보를 판단하고, 상기 판별 점수가 기준값 CS보다 작으면 음성으로 상기 판별 대상의 대장암 정보를 판단하는 것을 특징으로 하는 대장암 진단 장치.5. The method of claim 4,
The colorectal cancer determining means comprises:
Determining whether the discriminant is positive or negative for colorectal cancer according to the discrimination score,
If the discrimination score is greater than the reference value CS, colon cancer information of the discrimination object is judged to be positive, and if the discrimination score is lower than the reference value CS, colon cancer information of the discrimination subject is judged by voice negatively .
상기 기준값 CS는 0인 것을 특징으로 하는 대장암 진단 장치.22. The method of claim 21,
Wherein the reference value CS is zero.
상기 대장암 판정수단은;
상기 판별 대상의 생물학적 시료를 반복적으로 측정하여 검출한 다수의 상기 저질량 이온 질량 스펙트럼에 대해 계산된 다수의 상기 판별 점수의 평균값으로 상기 판별 대상의 상기 대장암 정보를 판단하는 것을 특징으로 하는 대장암 진단 장치.5. The method of claim 4,
The colorectal cancer determining means comprises:
Characterized in that the colorectal cancer information of the discrimination object is judged by using an average value of a plurality of the discrimination scores calculated for a plurality of the low mass ion mass spectra obtained by repeatedly measuring the biological sample to be discriminated Diagnostic device.
상기 대장암진단용이온 선정수단은;
상기 선택된 상기 제1훈련집합으로부터 후보 조건을 만족하는 후보 저질량 이온들을 후보이온집합으로 선택하는 후보이온집합 선택수단; 및
상기 선택된 상기 후보이온집합의 상기 후보 저질량 이온의 개별 또는 조합별 판별 성능을 기반으로 하여 대장암 진단용 저질량 이온들을 최종이온집합으로 선택하는 최종이온집합 선택수단을 포함하는 것을 특징으로 하는 대장암 진단 장치.5. The method of claim 4,
The colon cancer diagnostic ion selecting means comprises:
Candidate ion set selection means for selecting candidate low-mass ions satisfying a candidate condition from the selected first training set as a candidate ion set; And
And final ion collection means for selecting low mass ions for colorectal cancer diagnosis as a final collection of ions based on the discrimination performance of the candidate low mass ions of the selected candidate collection of ions or individual combinations thereof Diagnostic device.
상기 후보이온집합 선택수단은;
상기 훈련 케이스 각각에 대한 상기 저질량 이온의 상기 피크 강도와, 상기 생물통계학적 분석을 통해 획득된 상기 저질량 이온별 인자적재값의 곱의 절댓값이 문턱값 CT1보다 큰 제1저질량 이온들을 상기 훈련 케이스별로 선택하는 제1저질량이온 선택모듈을 포함하는 것을 특징으로 하는 대장암 진단 장치.25. The method of claim 24,
The candidate ion set selection means comprises:
Wherein a peak intensity of the low mass ion for each of the training cases and an absolute value of a product of the low mass ion charge accumulation value obtained through the biostatistical analysis is greater than a threshold CT 1 And a first low mass ion selection module for selecting each of the training cases.
상기 문턱값 CT1은 0.1인 것을 특징으로 하는 대장암 진단 장치.26. The method of claim 25,
Colon cancer diagnosis apparatus as the threshold value CT 1 is characterized in that 0.1.
상기 후보이온집합 선택수단은;
상기 제1저질량 이온들 중 상기 훈련 케이스들 전체의 문턱값 CT2 퍼센트 이상의 케이스들에서 공통으로 나타나는 제2저질량 이온들을 상기 후보이온집합으로 선택하는 후보이온집합 예비선택모듈을 포함하는 것을 특징으로 하는 대장암 진단 장치.26. The method of claim 25,
The candidate ion set selection means comprises:
And a candidate ion collection preliminary selection module for selecting the second low mass ions common to the cases among the first low-mass ions in the cases of CT 2 percent or more of the entire training cases CT as the candidate ion collection A colon cancer diagnosis device.
상기 문턱값 CT2는 50인 것을 특징으로 하는 대장암 진단 장치.28. The method of claim 27,
Colon cancer diagnostic device, characterized in that the threshold value CT 2 is 50.
상기 후보이온집합 선택수단은;
상기 제2저질량 이온들을 이용해 상기 훈련 케이스별로 대장암에 대한 양성 또는 음성을 나타내는 판별 점수를 계산하고, 상기 판별 점수에 따른 민감도 및 특이도를 계산하는 민감도 및 특이도 계산모듈; 및
상기 민감도가 문턱값 CN3보다 작거나, 상기 특이도가 문턱값 CN4보다 작은 경우 상기 CT1 및 상기 CT2 중 적어도 하나를 변경하고, 상기 과정을 반복하여 상기 후보이온집합으로 선택하는 후보이온집합 최종선택모듈을 더 포함하는 것을 특징으로 하는 대장암 진단 장치.28. The method of claim 27,
The candidate ion set selection means comprises:
A sensitivity and specificity calculating module for calculating a discrimination score indicating positive or negative for colorectal cancer in each training case using the second low-mass ions, and calculating sensitivity and specificity according to the discrimination score; And
Candidate ions to the sensitivity of less than or equal to the threshold value CN 3, wherein the specificity is less than the threshold value CN 4 to change at least one of the CT 1 and the CT 2, by repeating the process selected for the candidate ion set And a set final selection module.
상기 문턱값 CN3 및 CN4는 0.9인 것을 특징으로 하는 대장암 진단 장치.30. The method of claim 29,
Wherein the thresholds CN 3 and CN 4 are 0.9.
상기 최종이온집합 선택수단의 상기 판별 성능의 기준은;
상기 후보 저질량 이온 중 민감도와 특이도의 합이 기준값보다 큰 이온들을 선택하거나 상기 후보 저질량 이온들로 구성되는 조합별 민감도와 특이도의 합이 비교 대상 조합들 중 가장 큰 조합을 선택하는 제1기준을 포함하는 것을 특징으로 하는 대장암 진단 장치.25. The method of claim 24,
The criterion of the discrimination performance of the final ion set selection means is:
Wherein the sum of the sensitivity and the specificity among the candidate low mass ions is larger than the reference value or the sum of the sensitivity and the specificity of each combination of the candidate low mass ions is greater than the sum of the sensitivity and the specificity, 1 criteria for colorectal cancer.
상기 최종이온집합 선택수단의 상기 판별 성능의 기준은;
상기 후보 저질량 이온들의 조합들 중 상기 후보 저질량 이온들의 개수가 비교 대상 조합들 중 가장 적은 조합을 선택하는 제2기준을 더 포함하는 것을 특징으로 하는 대장암 진단 장치.25. The method of claim 24,
The criterion of the discrimination performance of the final ion set selection means is:
And a second criterion for selecting a combination of the candidate low-mass ions among the combinations of the candidate low-mass ions as the lowest combination of the comparison-target combinations.
상기 최종이온집합 선택수단의 상기 판별 성능의 기준은;
상기 후보 저질량 이온들의 조합들 중 진양성(true positive) 케이스의 최소 판별 점수와 진음성(ture negative) 케이스의 최대 판별 점수의 차가 비교 대상 조합들 중 가장 큰 조합을 선택하는 제3기준을 더 포함하며,
상기 판별 점수는 상기 후보 저질량 이온들의 상기 스케일링된 피크 강도와 상기 인자적재값을 통해 계산되며, 대장암에 대한 양성 또는 음성을 나타내는 것을 특징으로 하는 대장암 진단 장치.25. The method of claim 24,
The criterion of the discrimination performance of the final ion set selection means is:
The difference between the minimum discrimination score of the true positive case and the maximum discrimination score of the true negative case among the combinations of the candidate low mass ions is the third criterion for selecting the largest combination of the comparison object combinations ≪ / RTI &
Wherein the discrimination score is calculated through the scaled peak intensity of the candidate low mass ions and the factor load value and represents positive or negative for colorectal cancer.
상기 최종이온집합 선택수단은;
상기 후보이온집합에 포함된 상기 후보 저질량 이온들을 상기 민감도가 상기 특이도보다 높은 고민감도 저질량 이온들을 포함하며 상기 고민감도 저질량 이온들을 상기 민감도와 상기 특이도의 합의 내림차순으로 정렬한 고민감도 집합{Sns1, Sns2, Sns3 … SnsI}과, 상기 특이도가 상기 민감도보다 높은 고특이도 저질량 이온들을 포함하며 상기 고특이도 저질량 이온들을 상기 민감도와 상기 특이도의 합의 내림차순으로 정렬한 고특이도 집합{Spc1, Spc2, Spc3 … SpcJ}으로 구분하는 이온 구분모듈;
상기 고민감도 집합에서 상위 L개의 상기 고민감도 저질량 이온들{Sns1, Sns2, Sns3 … SnsL}과 상기 고특이도 집합에서 상위 L개의 상기 고특이도 저질량 이온들{Spc1, Spc2, Spc3 … SpcL} 중 2개 이상의 저질량 이온들로 구성되는 후보 조합들 중 상기 제1기준, 상기 제2기준 및 상기 제3기준 중 적어도 하나 이상에 의한 상기 판별 성능의 기준에 의해 선택된 조합을 바이오마커 그룹으로 선정하는 바이오마커그룹 예비선정모듈;
상기 바이오마커 그룹과, 상기 고민감도 집합에서 차상위 M개의 상기 고민감도 저질량 이온들과 상기 고특이도 집합에서 차상위 M개의 상기 고특이도 저질량 이온들 중 적어도 하나 이상의 저질량 이온을 상기 바이오마커 그룹에 추가한 후보 조합들 중 상기 제1기준, 상기 제2기준 및 상기 제3기준 중 적어도 하나 이상에 의한 상기 판별 성능의 기준에 의해 선택된 조합을 상기 바이오마커 그룹으로 재선정하는 바이오마커그룹 재선정모듈; 및
상기 고민감도 집합 및 상기 고특이도 집합에 차상위 저질량 이온이 존재하지 않을 때까지 상기 재선정 과정을 반복하여 상기 바이오마커 그룹을 최종 선정하는 바이오마커그룹 최종선정모듈을 포함하는 것을 특징으로 하는 대장암 진단 장치.25. The method of claim 24,
Said final ion set selection means comprising:
Wherein the candidate low-mass ions included in the candidate ion set include high-sensitivity low-mass ions whose sensitivity is higher than the specificity, and high sensitivity that aligns the high-sensitivity low-mass ions in descending order of the sensitivity and the specificity The set {Sns 1 , Sns 2 , Sns 3 ... Sns I }, a high specificity set {Spc 1 , Sns I } comprising the high specificity low mass ions whose specificity is higher than the sensitivity, and sorting the high specific low mass ions in descending order of the sensitivity and the specificity, Spc 2 , Spc 3 ... Spc J };
The high-sensitivity low-mass ions {Sns 1 , Sns 2 , Sns 3 ... Sns L } and the high-order L low-mass ions {Spc 1 , Spc 2 , Spc 3 ... Of the candidate combination consisting of Spc L} of two or more of the low mass ions the first reference and the second reference and the third the combination selected by the criterion for the discrimination performance by at least one of the reference biomarker A biomarker group pre-selection module to be selected as a group;
Wherein said biomarker group comprises at least one of the above-mentioned high-sensitivity low-mass ions at the next higher-order M in said hypertonic sensitivity set and at least one of said high-specific low- A re-selection of a biomarker group reassigning the combination selected by the criterion of the discrimination performance by at least one of the first criterion, the second criterion and the third criterion among the candidate combinations added to the group to the biomarker group module; And
And a final biomarker group final selection module for selecting the biomarker group by repeating the re-selection process until there is no next-low mass ion in the hyper-sensitivity set and the high specificity aggregate. Cancer diagnostic device.
상기 최종이온집합 선택수단은;
상기 후보이온집합에서 상기 바이오마커그룹 최종선정모듈에서 얻어진 상기 바이오마커 그룹으로 선정 완료된 조합의 저질량 이온들을 제외한 잔류 후보이온집합을 대상으로 상기 세 바이오마커 그룹 선정 과정을 반복 수행하여 추가 바이오마커 그룹을 선정하되, 상기 고민감도 집합 또는 상기 고특이도 집합에 상기 L개 미만의 질량 이온이 남을 때까지 상기 추가 바이오마커 그룹을 더 선정하는 바이오마커그룹 추가선정모듈; 및
상기 바이오마커 그룹과 상기 추가 바이오마커 그룹들 중 진양성 및 진음성 판정의 정확도(accuracy)를 기준으로 상위 CK개의 바이오마커 그룹들의 조합의 저질량 이온들을 상기 대장암 진단용 저질량 이온으로 선택하는 암진단용저질량이온 최종선택모듈을 더 포함하는 것을 특징으로 하는 대장암 진단 장치.35. The method of claim 34,
Said final ion set selection means comprising:
The remaining candidate ion sets excluding the combination of the low-mass ions selected as the biomarker group obtained in the biomarker group final selection module in the candidate ion set are repeatedly subjected to the selection process of the three biomarker groups, A biomarker group addition selecting module for further selecting the additional biomarker group until the L or less mass ions remain in the hyperhidimetic sensitivity set or the high specificity set; And
Wherein the low mass ions of the combination of the upper CK biomarker groups are selected as the low mass ion for the diagnosis of colorectal cancer based on the accuracy of the true positive and negative negative determinations among the biomarker group and the additional biomarker groups Further comprising a diagnostic low mass ion final selection module.
상기 L값은 2이고, 상기 M값은 1이며, 상기 CK값은 1, 2 또는 3 중 어느 하나인 것을 특징으로 하는 대장암 진단 장치.36. The method of claim 35,
Wherein the L value is 2, the M value is 1, and the CK value is 1, 2, or 3.
상기 최종이온집합 선택수단은,
상기 제1훈련집합에 대해 독립적인 제2훈련집합을 상기 제1훈련집합에 추가한 훈련 집합을 대상으로 상기 저질량 이온을 선택하는 것을 특징으로 하는 대장암 진단 장치.
25. The method of claim 24,
Wherein said final ion set selection means comprises:
Wherein the low mass ion is selected for a training set in which a second training set independent of the first training set is added to the first training set.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SG11201502499UA SG11201502499UA (en) | 2012-01-03 | 2012-12-03 | Cancer diagnosis device |
PCT/KR2012/010358 WO2013103197A1 (en) | 2012-01-03 | 2012-12-03 | Cancer diagnosis device |
JP2015549231A JP6134809B2 (en) | 2012-01-03 | 2012-12-03 | Cancer diagnostic equipment |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020120000729 | 2012-01-03 | ||
KR20120000729 | 2012-01-03 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20140057688A true KR20140057688A (en) | 2014-05-13 |
KR101439975B1 KR101439975B1 (en) | 2014-11-21 |
Family
ID=50888246
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020120134825A KR101439975B1 (en) | 2012-01-03 | 2012-11-26 | Apparatus for diagnosis colorectal cancer |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101439975B1 (en) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2242856A1 (en) * | 1996-02-01 | 1997-08-07 | University Of Miami | Methods for detection and evaluation of bladder cancer |
AU2004261222A1 (en) | 2003-08-01 | 2005-02-10 | Correlogic Systems, Inc. | Multiple high-resolution serum proteomic features for ovarian cancer detection |
US20080046224A1 (en) * | 2006-03-29 | 2008-02-21 | Cangen Biotechnologies, Inc. | Apparatus and method for predicting disease |
EP2391886A4 (en) | 2009-04-10 | 2013-04-17 | Canon Kk | Method of forming mass image |
-
2012
- 2012-11-26 KR KR1020120134825A patent/KR101439975B1/en active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
KR101439975B1 (en) | 2014-11-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Günther | Metabolomics biomarkers for breast cancer | |
KR101461615B1 (en) | Apparatus for diagnosis cancer | |
Russell et al. | Protein Z: A putative novel biomarker for early detection of ovarian cancer | |
KR101223270B1 (en) | Method for determining low―mass ions to screen colorectal cancer, method for providing information to screen colorectal cancer by using low―mass ions, and operational unit therefor | |
Kozar et al. | Identification of novel diagnostic biomarkers in breast cancer using targeted metabolomic profiling | |
CN107273717A (en) | A kind of detection model of Sera of Lung Cancer gene and its construction method and application | |
Issaq et al. | Biomarker discovery: study design and execution | |
CN104818322A (en) | Use of miRNA-Cyfra21-1 combination in detection of non-small cell lung cancer | |
KR101439977B1 (en) | Apparatus for diagnosis gastric cancer | |
EP3137631B1 (en) | Srm/mrm assay for the tyrosine-protein kinase receptor ufo (axl) protein | |
KR101439975B1 (en) | Apparatus for diagnosis colorectal cancer | |
CN116735889A (en) | Protein marker for early colorectal cancer screening, kit and application | |
EP3167293B1 (en) | Srm/mrm assay for the gtpase kras protein (kras) | |
KR101439981B1 (en) | Apparatus for diagnosis breast cancer | |
EP2623984B1 (en) | Apparatus for screening cancer | |
Hocker et al. | Distinguishing early-stage pancreatic cancer patients from disease-free individuals using serum profiling | |
US20170052197A1 (en) | SRM/MRM Assay for the Androgen Receptor (AR) Protein | |
CN111583992A (en) | System and method for analyzing load of tumor caused by RNA level fusion gene mutation | |
KR102617882B1 (en) | Method of Identifying Microsatellite Instability | |
US20130090550A1 (en) | Methods of identifying patients with ovarian epithelial neoplasms based on high-resolution mass spectrometry | |
US20080312514A1 (en) | Serum Patterns Predictive of Breast Cancer | |
EP3295180B1 (en) | Srm/mrm assay for the mesothelin (msln) protein | |
Li et al. | Urinary peptidome analysis in CKD and IgA nephropathy | |
WO2024107923A1 (en) | Methods for the detection and treatment of lung cancer | |
WO2024107924A2 (en) | A blood-based lipid biomarker panel for personalized risk assessment of breast cancer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20170818 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20180614 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20190823 Year of fee payment: 6 |