KR20130079988A - 위암 진단 장치 - Google Patents

위암 진단 장치 Download PDF

Info

Publication number
KR20130079988A
KR20130079988A KR1020120134828A KR20120134828A KR20130079988A KR 20130079988 A KR20130079988 A KR 20130079988A KR 1020120134828 A KR1020120134828 A KR 1020120134828A KR 20120134828 A KR20120134828 A KR 20120134828A KR 20130079988 A KR20130079988 A KR 20130079988A
Authority
KR
South Korea
Prior art keywords
discrimination
gastric cancer
ion
low
low mass
Prior art date
Application number
KR1020120134828A
Other languages
English (en)
Other versions
KR101439977B1 (ko
Inventor
유병철
김경희
김인후
이준화
Original Assignee
국립암센터
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 국립암센터 filed Critical 국립암센터
Priority to SG11201502499UA priority Critical patent/SG11201502499UA/en
Priority to PCT/KR2012/010358 priority patent/WO2013103197A1/ko
Priority to JP2015549231A priority patent/JP6134809B2/ja
Publication of KR20130079988A publication Critical patent/KR20130079988A/ko
Application granted granted Critical
Publication of KR101439977B1 publication Critical patent/KR101439977B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N27/00Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
    • G01N27/62Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating the ionisation of gases, e.g. aerosols; by investigating electric discharges, e.g. emission of cathode
    • G01N27/622Ion mobility spectrometry
    • G01N27/623Ion mobility spectrometry combined with mass spectrometry
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • A61B5/7267Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems involving training the classification device
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57446Specifically defined cancers of stomach or intestine
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6848Methods of protein analysis involving mass spectrometry
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01JELECTRIC DISCHARGE TUBES OR DISCHARGE LAMPS
    • H01J49/00Particle spectrometers or separator tubes
    • H01J49/26Mass spectrometers or separator tubes

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Public Health (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Hematology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Urology & Nephrology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Epidemiology (AREA)
  • Medicinal Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Food Science & Technology (AREA)
  • Microbiology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Primary Health Care (AREA)
  • Cell Biology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Bioethics (AREA)
  • Software Systems (AREA)
  • Veterinary Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • Surgery (AREA)
  • Evolutionary Biology (AREA)

Abstract

본 발명은 생물학적 시료로부터 추출한 저질량 이온에 대해 생물통계학적 분석을 통하여 위암을 진단하기 위한 저질량 이온을 확인하고, 이 저질량 이온 질량 스펙트럼을 이용하여 위암을 진단할 수 있는 위암 진단 장치를 제공하는 것으로, 본 발명에서는, 위암 환자군을 각각 그 비환자군에 대해 강건하게 판별해 주는 판별식을 제안하고자 한다. 즉, 판별식을 도출하였던 훈련 집합뿐 아니라 이에 독립적인 검증 집합에 대해서도 매우 우수하며 강건한 판별 성능을 나타내는 판별식을 제안하고, 이를 구성하는 저질량 이온들을 확인하여 위암을 진단할 수 있는 위암 진단 장치를 제공한다.

Description

위암 진단 장치{Apparatus for diagnosis gastric cancer}
본 발명은 위암을 진단하는 장치에 관한 것으로, 더욱 상세하게는 생물학적 시료로부터 추출한 저질량 이온에 대해 생물통계학적 분석을 통하여 위암 진단을 위한 저질량 이온의 질량 스펙트럼을 확인하고, 이 저질량 이온 질량 스펙트럼을 이용하여 위암을 진단할 수 있는 위암 진단 장치에 관한 것이다.
암은 세포가 무한히 증식해 정상적인 세포의 기능을 방해하는 질병으로, 폐암, 위암(gastric cancer, GC), 유방암(breast cancer, BRC), 대장암(colorectal cancer, CRC) 등이 대표적이나, 실질적으로는 어느 조직에서나 발생할 수 있다. 초창기 암 진단은 암 세포의 성장에 따른 생체 조직의 외적 변화에 근거하였으나, 근래에 들어 혈액, 당쇄(glyco chain), 디엔에이(DNA) 등 생물의 조직 또는 세포에 존재하는 미량의 생체 분자를 이용한 진단 및 검출이 시도되고 있다. 그러나 가장 보편적으로 사용되는 암 진단 방법은 생체 조직 검사를 통해 얻어진 조직 샘플을 이용하거나, 영상을 이용한 진단이다.
그 중 생체 조직 검사는 환자에게 큰 고통을 야기하며, 고비용이 들뿐만 아니라, 진단까지 긴 시간이 소요되는 단점이 있다. 또한, 환자가 실제 암에 걸린 경우, 생체 조직 검사 과정 중 암의 전이가 유발될 수 있는 위험이 있으며, 생체 조직 검사를 통해 조직 샘플을 얻을 수 없는 부위의 경우, 외과적인 수술을 통해 의심되는 조직의 적출이 이루어지기 전에는 질병의 진단이 불가능한 단점이 있다.
영상을 이용한 진단에서는 엑스레이(X-ray) 영상, 질병 표적 물질이 부착된 조영제를 사용하여 획득한 핵자기 공명(nuclear magnetic resonance, NMR) 영상 등을 기반으로 암을 판정한다. 그러나 이러한 영상 진단은 임상의 또는 판독의의 숙련도에 따라 오진의 가능성이 있으며, 영상을 얻는 기기의 정밀도에 크게 의존하는 단점이 있다. 더 나아가, 가장 정밀한 기기조차도 수 mm 이하의 종양은 검출이 불가능하여, 발병 초기 단계에서는 검출이 어려운 단점이 있다. 또한, 영상을 얻기 위해 환자 또는 질병 보유 가능자가 유전자의 돌연변이를 유발할 수 있는 고에너지의 전자기파에 노출되므로, 또 다른 질병을 야기할 수 있을 뿐만 아니라, 영상을 통한 진단 횟수에 제한이 있는 단점이 있다.
소화기 계통의 경우 통상적으로 내시경을 이용한 육안 영상 관찰을 통해 질병의 유무를 판단하나, 그 과정이 환자에게 무척 고통스러우며, 육안 영상 관찰을 통해 이상이 발견된 경우라 할지라도, 악성/양성 종양, 용종 등의 정확한 질병 판별을 위해서는 생체 조직 검사가 필수적으로 수행되어야 한다.
특히, GC는 국내에서 가장 자주 발생하는 암(18.3%)이며 남성에서는 1위 여성에서는 BRC, 갑상선암에 이어 세 번째로 발생 빈도가 높다(주요 암종 발생분율, 2003년-2005년, 통계청). 일반인들을 대상으로 한 내시경 검진과 일반인들의 인식 변화로 인해 조기에 발견되는 빈도가 점차 증가하고 있으나 아직도 암 관련 사망률에 있어서는 폐암, 간암 다음으로 높은 빈도(22%)를 차지하고 있다(2006년 사망원인통계연보, 통계청).
수술적 치료가 완치에 근간이 되는 치료법이며 최근에 조기 GC의 빈도는 약 50%인데 조기 GC의 완치율은 90%를 상회하고 있지만 전이성 혹은 재발성 GC의 경우는 조기 GC과 달리 예후가 극히 불량하여 중앙 생존 기간(median survival time)이 1년을 넘지 못하고 5년 생존율에 있어서도 5% 미만의 결과를 나타내고 있다.
고식적 항암 화학 요법(palliative chemotherapy)은 최적의 지지 요법(best supportive care)과 비교한 제3상 연구에서 생존기간의 연장뿐 아니라 삶의 질 향상에도 효과가 있다는 연구 결과들로부터 전이성 혹은 재발성 GC의 표준 치료법이라 할 수 있다.
1990년 이후 5-fluorouracil(5-FU)과 Platinum 제제의 치료는 현재까지도 가장 널리 사용되고 있는 전이성 GC 치료제이며, 신약의 개발로 효과를 높이고 부작용을 최소화하기 위한 다양한 조합의 임상 연구에 irinotecan, oxaliplatin, paclitaxel, docetaxel, capecitabine 등이 시도되고 있다. 5-FU를 근간으로 하는 항암 화학 요법에 비해 월등히 뛰어난 성과를 보여주는 연구는 아직까지 보고되고 있지 않다. ECF(epirubicin, cisplatin and 5-fluorouracil)는 효과는 뛰어나나 높은 독성의 부작용을 동반한다.
최근 이러한 한계를 극복하고자 여러 연구들이 다양한 방법으로 진행되고 있으며, 생체 표지자 발견을 위한 노력은 이에 근간이 된다. 생체 표지자는 암의 조기 진단에 사용될 수 있을 뿐 아니라 전이성 암종의 치료에 있어 목표가 되는 타깃으로 사용될 수 있다. 기존 항암제와 더불어 표적 치료제의 사용은 CRC, 폐암, BRC, 췌장암 등에서 효과를 나타내고 있으며 GC에 있어서도 많은 개발과 연구가 필요하다고 할 수 있다.
따라서 새로운 분자적 접근을 적용하여 초기 단계에서 GC를 스크리닝할 수 있다면 환자들에게 매우 유용할 것이다. 유전체학(genomics), 단백질체학(proteomics) 및 분자병리학(molecular pathology)은 임상적으로 잠재적인 가치를 지닌 여러 바이오마커(biomarker) 후보들을 제공해 왔다. 암의 병기(stage) 및 환자별 맞춤 치료에 이들을 적극적으로 활용하는 것을 통해 치료 효과를 향상시킬 수 있을 것으로 사료되나, 임상 치료에 적용하기 위해서는 앞으로도 많은 연구가 선행되어야 한다.
한편, MALDI-TOF(matrix-assisted laser desorption/ionization-time of flight) 질량분석기(mass spectrometer)를 이용하면 혈액 내 질량 이온(mass ion)의 스펙트럼(spectrum)을 추출할 수 있다. 기존 단백질체 연구들에 이용된 질량 분석은 주로 800 내지 2500 m/z의 질량값 범위를 분석 대상으로 하였는데, 그 범위가 단백질이 트립신(trypsin)으로 잘려졌을 경우 펩타이드(peptide)의 질량값 영역이기 때문이다. 또한, MALDI-TOF 질량분석기를 이용하면 저질량 이온(low-mass ion)의 질량 스펙트럼도 추출할 수 있다. 그러나 약 800 m/z 이하의 저질량 대역은 분석 대상이 아닌 매트릭스(matrix)의 질량 이온들이 혼재하는 영역이기 때문에 그동안 이 영역에 대한 연구가 활발하지는 않았다.
추출된 저질량 이온의 질량 스펙트럼은 종래의 소프트웨어(software) 중 하나인 MarkerViewTM(버전 version 1.2, 이하 버전 생략)에 의해 분석될 수 있다. 본 발명자들은 GC 환자군 및 정상 대조군(control, CONT)의 혈청(serum)으로부터 추출된 저질량 이온의 질량 스펙트럼을 MarkerViewTM를 이용하여 분석해 보았는데, 도 1을 참조하여 그 방법을 상세히 설명한다.
표 1의 GC 환자군 49명과 표 2의 정상 대조군 84명으로 구성된 집합(Set E1)으로부터 수집한 혈청을 시료로 하여 MALDI-TOF 질량분석기를 이용하여 추출한 T2D 파일 형식의 저질량 이온 질량 스펙트럼을 MarkerViewTM로 임포트(import)하였다(C11).
GC Sex Age
year
CEA
ng/mL
Stage GC Sex Age
year
CEA
ng/mL
Stage
GC-E1 M 62 5.41 I GC-E26 M 64 - III
GC-E2 M 58 - I GC-E27 M 53 - III
GC-E3 M 62 1.34 I GC-E28 M 61 - III
GC-E4 M 48 - I GC-E29 F 52 3.36 IV
GC-E5 M 51 - I GC-E30 M 65 0.99 IV
GC-E6 M 44 - I GC-E31 M 41 -a IV
GC-E7 F 44 - I GC-E32 M 78 4.93 IV
GC-E8 M 61 - I GC-E33 M 79 1.11 IV
GC-E9 M 76 - I GC-E34 M 76 2.37 IV
GC-E10 M 51 - I GC-E35 M 54 117.13 IV
GC-E11 F 60 1.2 II GC-E36 M 58 2.24 IV
GC-E12 M 73 - II GC-E37 M 67 >1500 IV
GC-E13 F 57 - II GC-E38 F 71 1.92 IV
GC-E14 M 78 - II GC-E39 M 34 3.57 IV
GC-E15 M 75 - II GC-E40 M 69 1.39 IV
GC-E16 F 67 - II GC-E41 M 49 1.67 IV
GC-E17 M 50 - II GC-E42 F 34 13.44 IV
GC-E18 F 60 - II GC-E43 M 50 - IV
GC-E19 F 47 - II GC-E44 M 55 - IV
GC-E20 F 62 8.3 III GC-E45 M 66 - IV
GC-E21 M 64 - III GC-E46 F 40 - IV
GC-E22 M 58 6.89 III GC-E47 M 61 - IV
GC-E23 F 47 2.86 III GC-E48 M 70 - IV
GC-E24 F 55 - III GC-E49 M 39 - IV
GC-E25 F 46 - III
CEA : Carcinoembryonic antigen
Control Sex Age
year
CEA
ng/mL
Control Sex Age
year
CEA
ng/mL
CONT-E1 M 39 1.3 CONT-E43 M 48 4.2
CONT-E2 F 70 1.2 CONT-E44 F 41 2.1
CONT-E3 M 66 1.3 CONT-E45 F 65 3.8
CONT-E4 M 53 0.8 CONT-E46 M 64 2.4
CONT-E5 F 69 1 CONT-E47 M 53 3.3
CONT-E6 F 68 1.8 CONT-E48 M 63 0.9
CONT-E7 M 35 1.7 CONT-E49 M 57 1.5
CONT-E8 M 62 3.7 CONT-E50 F 66 1.6
CONT-E9 M 62 1.1 CONT-E51 M 60 1.5
CONT-E10 M 48 5.3 CONT-E52 M 57 2.2
CONT-E11 M 48 1.8 CONT-E53 M 53 1.9
CONT-E12 M 66 1.6 CONT-E54 M 60 0.8
CONT-E13 M 66 1.4 CONT-E55 F 50 2.6
CONT-E14 M 66 4.2 CONT-E56 F 53 2.6
CONT-E15 M 54 1.4 CONT-E57 M 64 1.5
CONT-E16 M 54 1 CONT-E58 F 60 3.7
CONT-E17 M 62 2 CONT-E59 M 58 1.2
CONT-E18 F 45 0.7 CONT-E60 F 66 1.1
CONT-E19 M 39 3.2 CONT-E61 M 57 2.9
CONT-E20 M 67 1.8 CONT-E62 F 68 5.5
CONT-E21 M 63 5.5 CONT-E63 M 56 1.7
CONT-E22 M 48 2.8 CONT-E64 M 51 3.4
CONT-E23 M 55 5 CONT-E65 F 56 1.3
CONT-E24 M 55 1 CONT-E66 M 57 1.5
CONT-E25 M 62 7 CONT-E67 M 61 4.2
CONT-E26 F 57 1.2 CONT-E68 F 51 1.9
CONT-E27 M 61 0.9 CONT-E69 F 51 1.6
CONT-E28 M 50 1.9 CONT-E70 F 52 1.4
CONT-E29 M 46 1.5 CONT-E71 F 56 1.7
CONT-E30 M 51 4 CONT-E72 F 52 1.7
CONT-E31 F 68 1.8 CONT-E73 M 63 1
CONT-E32 F 68 1.4 CONT-E74 F 60 1.8
CONT-E33 M 64 1.7 CONT-E75 F 58 0.7
CONT-E34 F 52 2.1 CONT-E76 M 65 4.1
CONT-E35 F 59 1.2 CONT-E77 M 52 2.2
CONT-E36 M 53 1.6 CONT-E78 M 50 -a
CONT-E37 F 68 1 CONT-E79 F 72 -
CONT-E38 F 65 3.1 CONT-E80 F 57 -
CONT-E39 M 31 1.2 CONT-E81 M 50 -
CONT-E40 F 59 0.7 CONT-E82 F 70 -
CONT-E41 M 43 1.4 CONT-E83 F 42 -
CONT-E42 M 66 2.3 CONT-E84 F 51 -
임포트 조건으로 표 3의 조건들을 사용하였다.
Mass tolerance 100 ppm
Minimum required response 10.0
Maximum number of peaks 10000
다음, 임포트한 피크 강도(peak intensity)들을 정규화(nomalization)하였다(C12). MarkerViewTM에는 다수의 정규화 방법이 존재하는데, "Normalization Using Total Area Sums" 방법을 사용하여 정규화를 수행하였다. 이 방법에서는 각 시료별 강도의 소계를 구하고, 시료별 소계들의 평균을 구한 후, 각 시료별 강도의 소계가 이 평균과 일치하도록 각 피크 강도에 시료별 배율 인자(scaling factor)를 곱한다. 즉, 이와 같이 정규화한 후에는 각 시료별 강도의 소계가 동일해진다.
다음, 정규화한 피크 강도들을 파레토 스케일링(Pareto scaling)하였다(C13). 즉, 정규화한 각 피크 강도에서 질량 이온별 평균값을 뺀 후 표준편차의 제곱근으로 나누어 피크 강도들을 파레토 스케일링하였다.
다음, 파레토 스케일링한 피크 강도들에 대해 주성분 분석 기반 선형 판별 분석(principal component analysis-based linear discriminant analysis, PCA-DA)을 수행하여 판별 점수(discriminant score, DS)를 계산하였다(C14). 즉, 두 단계로 주성분 분석을 수행하여 각 질량 이온별 가중치(weighting factor)인 인자적재값(factor loading)을 구하고, 파레토 스케일링된 강도에 이 인자적재값을 곱한 후 더하여 각 시료별 판별 점수를 계산하였다. 표 3의 임포트 조건에서 피크의 최대 개수를 10,000개로 하였고, 충분히 많은 시료들을 함께 임포트하였으므로, 본 계산에서 인자적재값은 10,000개가 계산되었으며, 따라서 10,000개의 항을 더하여 한 개의 판별 점수가 계산되었다.
다음, 계산된 판별 점수가 양수인지 여부를 판단하여(C15), 양수인 경우 양성으로(C16), 음수인 경우 음성으로 판정하였다(C17). 즉, GC에 적용되어 양수인 경우 GC 환자군으로, 음수인 경우 정상 대조군으로 판정하였다.
도 2는 이미 임상적으로 판정된 GC 환자군 49명과 정상 대조군 84명으로 구성된 집합에 대해 도 1의 방법으로 계산한 판별 점수의 분포를 나타낸다. 도 2에 나타낸 판별 점수에 따른 판정 결과를 혼동 행렬(confusion matrix)을 이용하여 정리하면 표 4와 같다.
Sensitivity 97.96%
Set E1 True GC True CONT Specificity 100.0%
Predicted GC 48 0 PPV 100.0%
Predicted CONT 1 84 NPV 98.82%
도 2 및 표 4를 통하여 알 수 있는 바와 같이, 종래 기술인 MarkerViewTM의 주성분 분석 기반 선형 판별 분석 방법을 통하여 민감도(sensitivity), 특이도(specificity), 양성예측도(positive predictive value, PPV) 및 음성예측도(negative predictive value, NPV)가 모두 97% 이상인 매우 우수한 판별 결과를 얻을 수 있었다.
그러나 이를 임상에서 사용할 수 있으려면 우선 식의 강건성(robustness)이 반드시 검증되어야 한다. 즉, 이미 한 번 측정했고 판별식을 구성했던 집합에 대하여 추가적으로 수회 반복 측정한 질량 스펙트럼들에 대해서도 여전히 좋은 판별 결과를 나타내어야 하며, 판별식을 구성할 때 고려하지 않았던 새로운 GC 환자군 및 정상 대조군에 대해서도 동일한 판별식으로 좋은 판별 결과를 얻을 수 있어야 한다. 질량 스펙트럼을 반복 측정하는 과정에는 혈청을 얼리고 녹이는 과정이 포함되거나, 혈청을 새로 메탄올(methanol)/클로로포름(chloroform)과 혼합하여 추출하는 과정이 포함되기도 한다. 이와 같은 과정들은 질량 스펙트럼에 대한 통계 분석에 있어서 외란들(disturbances)로 볼 수 있는데, 이러한 외란들에 둔감한 판별식을 구성해야만 임상에 적용될 수 있다.
요컨대, 도 1, 2 및 표 4를 참조하여 설명한 종래의 주성분 분석 기반 선형 판별 분석 방법은 특정 시료들로 구성된 집합에 개별적으로 적용되는 경우에는, 즉 개별 훈련 집합(traning set)에 대한 판별에서는 매우 우수한 판별 결과를 나타내기도 하나, 검증 집합(validation set)에서의 판별 결과는 만족스럽지 않았다.
훈련 집합에 대해서는 매우 우수한 판별 결과를 보임에도 불구하고 판별식이 강건성을 갖지 못한 이유는 판별식을 구성하고 있는 10,000개의 질량 이온들 중 상당한 개수의 질량 이온들이 GC 환자군과 정상 대조군의 판별을 위해서는 최소한 불필요하며, 때로는 훈련 집합의 판별에서는 문제를 일으키지 않았으나 검증 집합의 판별에서는 잠재적으로 판별 결과를 혼동시킬 수 있는 질량 이온들을 포함하고 있기 때문으로 추정된다.
따라서 이와 같이 최소한 불필요하며, 또는 잠재적으로 판별 결과에 혼동을 줄 수 있는 질량 이온들을 적극적으로 제거하는 과정을 통해 우수하며 강건한 판별 결과를 얻기 위해 필수 불가결한 질량 이온들만을 찾아내는 작업이 필요할 것으로 사료된다.
본 발명은, 생물학적 시료로부터 추출한 저질량 이온에 대해 생물통계학적 분석을 통하여 위암을 진단하기 위한 저질량 이온 질량 스펙트럼을 확인하고, 이 저질량 이온 질량 스펙트럼을 이용하여 위암을 진단할 수 있는 위암 진단 장치를 제공한다.
본 발명은, GC 환자 및 비환자 시료에 대해 강건한 판별 결과를 주는 판별식을 제안하고자, 판별식을 도출하였던 GC 환자 및 비환자 집합에 대해 추가로 수회 반복 측정한 질량 스펙트럼과 새로운 GC 환자 및 비환자 집합에 대해 수회 반복 측정한 질량 스펙트럼 모두에 대해 약 80~90% 이상의 민감도, 특이도, 양성예측도, 음성예측도를 나타내는 판별식을 제안하고, 이를 구성하는 저질량 이온들을 확인하여 GC를 진단할 수 있는 위암 진단 장치를 제공한다.
전술한 과제를 해결하기 위한 본 발명에 따른 위암 진단 장치는, 다수의 위암 환자 및 비환자 케이스들의 생물학적 시료로부터 저질량 이온(low-mass ion)의 질량 스펙트럼을 검출하는 저질량 이온 검출부; 상기 저질량 이온의 질량 스펙트럼 패턴을 비교 분석하여 위암 진단 정보를 판정하는 위암 진단부; 및 상기 위암 진단부로부터 판정된 위암 진단 정보를 출력 가능한 형태로 변환하여 표시하는 디스플레이부를 포함한다.
상기 저질량 이온 검출부는; 상기 생물학적 시료로부터 저질량 이온의 피크 강도(peak intensity)를 검출하여 상기 저질량 이온의 질량 스펙트럼을 추출할 수 있다. 상기 저질량 이온 검출부는; 질량분석기를 포함할 수 있다.
상기 위암 진단부는; 훈련 후보 집합인 상기 위암 환자 및 비환자 케이스들의 저질량 이온 질량 스펙트럼들을 정렬하는 제1정렬수단; 정렬된 상기 질량 스펙트럼에 대해 생물통계학적 분석을 수행하여 판별 점수를 계산하는 제1판별점수 계산수단; 상기 판별 점수에 따라 민감도(sensitivity) 및 특이도(specificity)를 계산하고, 이를 기준으로 제1훈련집합을 선정하여 저질량 이온별 인자적재값(factor loading)을 계산하는 인자적재값 계산수단; 후보 조건을 만족하는 후보 저질량 이온들 중 판별 성능을 기반으로 하여 위암 진단용 저질량 이온들을 선택하는 위암진단용이온 선정수단; 판별 대상 생물학적 시료의 저질량 이온 질량 스펙트럼을 상기 제1훈련집합에 정렬하는 제2정렬수단; 상기 판별 대상의 저질량 이온의 피크 강도와 상기 인자적재값으로부터 판별 점수를 계산하는 제2판별점수 계산수단; 및 상기 판별 점수에 따라 상기 판별 대상을 위암의 양성 또는 음성으로 판정하는 위암 판정수단을 포함하되,
상기 위암진단용이온 선정수단은; 상기 다수의 위암 환자 및 비환자 케이스들을, 다수의 위암 환자 케이스들과 다수의 정상인 케이스들로 구성되는 제1종 판별 케이스들과, 상기 다수의 위암 환자 케이스들과 다수의 대장암 환자 케이스들로 구성되는 제2종 판별 케이스들과, 상기 다수의 위암 환자 케이스들과 다수의 유방암 환자 케이스들로 구성되는 제3종 판별 케이스들과, 상기 다수의 위암 환자 케이스들과 다수의 비호지킨림프종(non-Hodgkin lymphoma, NHL) 환자 케이스들로 구성되는 제4종 판별 케이스들로 구분하거나, 상기 다수의 위암 환자 및 비환자 케이스들을, 상기 제1종 판별 케이스들과 상기 다수의 위암 환자 및 정상인 케이스들과 다수의 대장암, 유방암 및 비호지킨림프종 환자 케이스들로 구성되는 제5종 판별 케이스들로 구분하고, 상기 제1종 판별 케이스들, 상기 제2종 판별 케이스들, 상기 제3종 판별 케이스들, 상기 제4종 판별 케이스들 및 상기 제5종 판별 케이스들에 대해 각각 실행되어, 상기 위암 진단용 저질량 이온들이, 상기 제1종 판별 케이스에 대한 제1종 위암 진단용 저질량 이온들, 상기 제2종 판별 케이스에 대한 제2종 위암 진단용 저질량 이온들, 상기 제3종 판별 케이스에 대한 제3종 위암 진단용 저질량 이온들, 상기 제4종 판별 케이스에 대한 제4종 위암 진단용 저질량 이온들 및 상기 제5종 판별 케이스에 대한 제5종 위암 진단용 저질량 이온들로 구분될 수 있다.
상기 제1종 위암 진단용 저질량 이온들의 질량값은 22.9851, 87.0959, 123.0842, 314.2151, 324.1365, 366.2424, 488.6538, 490.3374, 526.3426, 532.3719, 576.2893, 606.2658, 616.1397, 1466.5612 m/z (단, 오차 범위는 ±0.1 m/z)로 이루어진 그룹으로부터 선택된 하나 이상의 질량값인 것이 바람직하다.
상기 제2종 위암 진단용 저질량 이온들의 질량값은 18.0260, 22.9830, 38.9752, 72.0788, 86.1216, 122.0584, 137.0721, 144.1092, 156.0171, 172.3740, 172.6583, 207.0729, 265.2034, 356.1278, 380.1643, 381.0949, 401.0680, 431.9882, 442.3197, 445.0278, 458.3228, 489.3564, 489.5293, 490.2775, 490.3586, 525.3611, 528.3633, 535.2970, 553.3205, 557.4392, 584.2675, 585.2726, 587.2805, 710.3687, 946.4028, 1466.6433 m/z (단, 오차 범위는 ±0.1 m/z)로 이루어진 그룹으로부터 선택된 하나 이상의 질량값인 것이 바람직하다.
상기 제3종 위암 진단용 저질량 이온들의 질량값은 22.9852, 74.0764, 104.1387, 105.1157, 106.0555, 148.0788, 173.4924, 176.1198, 184.1123, 212.1032, 217.9461, 226.0798, 228.0046, 284.3291, 299.1308, 299.3423, 314.2316, 338.1143, 377.0710, 387.9830, 426.3417, 427.3321, 430.3313, 432.9929, 456.2963, 459.2425, 480.3312, 481.3399, 482.3368, 487.3295, 488.3316, 490.3400, 496.8846, 506.9148, 509.3577, 532.3532, 534.2973, 535.3013, 537.3199, 550.3255, 560.3121, 562.3203, 574.3090, 580.3417, 583.2274, 584.2345, 584.3355, 585.2423, 600.3366, 616.1446 m/z (단, 오차 범위는 ±0.1 m/z)로 이루어진 그룹으로부터 선택된 하나 이상의 질량값인 것이 바람직하다.
상기 제4종 위암 진단용 저질량 이온들의 질량값은 18.0264, 22.9798, 23.0539, 38.9638, 38.9937, 46.0666, 86.1328, 112.0850, 123.0738, 129.0710, 155.1762, 164.0701, 165.0955, 175.1219, 176.1298, 178.1388, 179.1466, 192.1245, 201.2036, 204.1077, 212.3577, 213.0575, 229.0033, 232.0822, 234.0749, 235.0331, 240.0907, 251.9799, 274.0827, 284.3265, 314.2277, 326.3916, 383.0532, 417.0381, 429.3172, 430.3169, 434.2556, 456.3015, 459.2257, 460.9913, 489.3314, 490.3361, 491.3348, 532.2725, 534.2841, 569.3303 m/z (단, 오차 범위는 ±0.1 m/z)로 이루어진 그룹으로부터 선택된 하나 이상의 질량값인 것이 바람직하다.
상기 제5종 위암 진단용 저질량 이온들의 질량값은 38.9674, 76.0758, 123.0414, 156.0432, 163.1135, 164.0712, 184.1062, 184.1375, 190.1141, 193.0672, 215.0444, 228.0389, 230.0004, 256.3291, 257.2950, 265.9579, 267.9562, 289.2849, 295.1666, 301.1386, 315.2230, 330.2485, 342.2497, 346.2809, 368.2644, 369.2702, 370.2806, 371.2848, 396.0400, 412.1977, 428.1904, 442.3155, 443.2100, 445.0283, 498.3276, 510.2755, 511.3414, 513.3220, 530.3908, 532.2863, 548.3441, 552.3114, 553.3178, 571.3341, 573.2402, 584.2661, 666.3899, 683.3451, 684.3511, 708.3570, 711.3711, 723.3455, 725.3580, 726.3760, 741.3357 m/z (단, 오차 범위는 ±0.1 m/z)로 이루어진 그룹으로부터 선택된 하나 이상의 질량값인 것이 바람직하다.
상기 판별 점수는 상기 제1종 저질량 이온들에 의한 제1종 판별 점수, 상기 제2종 저질량 이온들에 의한 제2종 판별 점수, 상기 제3종 저질량 이온들에 의한 제3종 판별 점수 및 상기 제4종 저질량 이온들에 의한 제4종 판별 점수를 포함하며, 상기 제1종 판별 점수가 GS11보다 크고, 상기 제2종 판별 점수가 GS21보다 크고, 상기 제3종 판별 점수가 GS31보다 크고, 상기 제4종 판별 점수가 GS41보다 큰 경우에는 상기 판별 대상을 위암 양성으로 판단하고, 상기 제1종 판별 점수가 GS12보다 작거나, 상기 제2종 판별 점수가 GS22보다 작거나, 상기 제3종 판별 점수가 GS32보다 작거나, 상기 제4종 판별 점수가 GS42보다 작은 경우에는 상기 판별 대상을 위암 음성으로 판단할 수 있다. 상기 GS11, GS12, GS21, GS22 , GS31, GS32 GS41 및 GS42는 0인 것이 바람직하다.
상기 판별 점수는 상기 제1종 저질량 이온들에 의한 제1종 판별 점수와 상기 제5종 저질량 이온들에 의한 제5종 판별 점수를 포함하며, 상기 제1종 판별 점수가 GS11보다 크고 상기 제5종 판별 점수가 GS51보다 큰 경우에는 상기 판별 대상을 위암 양성으로 판단하고, 상기 제1종 판별 점수가 GS12보다 작거나 상기 제5종 판별 점수가 GS52보다 작은 경우에는 상기 판별 대상을 위암 음성으로 판단할 수 있다. 상기 GS11, GS12, GS51 및 GS52는 0인 것이 바람직하다.
상기 제1판별점수 계산수단은; 상기 훈련 후보 집합의 상기 저질량 이온 질량 스펙트럼들의 상기 피크 강도들을 정규화(normalization)하는 정규화 모듈; 상기 정규화한 피크 강도들을 스케일링(scaling)하는 스케일링 모듈; 및 상기 스케일링된 피크 강도들에 대해 상기 생물통계학적 분석을 수행하여 상기 판별 점수를 계산하는 판별점수계산 모듈을 포함할 수 있다.
상기 스케일링 모듈은; 파레토 스케일링(Pareto scaling)을 수행하는 것이 바람직하다.
상기 판별점수계산 모듈은; 주성분 분석 기반 선형 판별 분석(principal component analysis-based linear discriminant analysis, PCA-DA)을 사용하여 상기 생물통계학적 분석을 수행할 수 있다.
상기 판별점수계산 모듈은; 상기 주성분 분석 기반 선형 판별 분석에 의해 획득된 인자적재값과 상기 스케일링된 피크 강도를 함께 사용하여 상기 판별 점수를 계산할 수 있다.
상기 인자적재값 계산수단은; 상기 정렬된 질량 스펙트럼에 대해 생물통계학적 분석을 수행하고, 상기 생물통계학적 분석 결과를 기초로 상기 위암 환자 및 비환자 케이스들 중 훈련 조건을 만족하는 훈련 케이스들을 제1훈련집합으로 선택하는 제1훈련집합 선택수단을 포함하며, 상기 제1훈련집합으로부터 인자적재값을 계산할 수 있다.
상기 제1훈련집합 선택수단은; 상기 생물통계학적 분석 결과에 따른 민감도가 문턱값(threshold) GN1 이상이고, 특이도가 문턱값 GN2 이상일 때의 위암 환자 및 비환자 케이스들을 상기 제1훈련집합으로 설정할 수 있다. 상기 문턱값 GN1과 GN2는 1인 것이 바람직하다.
상기 제2판별점수 계산수단은; 상기 판별 대상의 상기 저질량 이온 질량 스펙트럼의 상기 피크 강도들을 정규화하는 정규화 모듈; 상기 정규화한 피크 강도들을 스케일링하는 스케일링 모듈; 및 상기 스케일링된 피크 강도와 상기 인자적재값을 통해 상기 판별 점수를 계산하는 판별점수계산 모듈을 포함할 수 있다.
상기 스케일링 모듈은; 파레토 스케일링을 수행하는 것이 바람직하다.
상기 판별점수계산 모듈은; 상기 위암 진단용 저질량 이온들의 상기 스케일링된 피크 강도와 상기 인자적재값을 통해 상기 판별 점수를 계산할 수 있다.
상기 위암 판정수단은; 상기 판별 점수에 따라 상기 판별 대상을 위암의 양성 또는 음성으로 판정하되, 상기 판별 점수가 기준값 S보다 크면 양성으로 상기 판별 대상의 위암 정보를 판단하고, 상기 판별 점수가 기준값 S보다 작으면 음성으로 상기 판별 대상의 위암 정보를 판단할 수 있다. 상기 기준값 S는 0인 것이 바람직하다.
상기 위암 판정수단은; 상기 판별 대상의 생물학적 시료를 반복적으로 측정하여 검출한 다수의 상기 저질량 이온 질량 스펙트럼에 대해 계산된 다수의 상기 판별 점수의 평균값으로 상기 판별 대상의 상기 위암 정보를 판단할 수 있다.
상기 위암진단용이온 선정수단은; 상기 선택된 상기 제1훈련집합으로부터 후보 조건을 만족하는 후보 저질량 이온들을 후보이온집합으로 선택하는 후보이온집합 선택수단; 및 상기 선택된 상기 후보이온집합의 상기 후보 저질량 이온의 개별 또는 조합별 판별 성능을 기반으로 하여 위암 진단용 저질량 이온들을 최종이온집합으로 선택하는 최종이온집합 선택수단을 포함할 수 있다.
상기 후보이온집합 선택수단은; 상기 훈련 케이스 각각에 대한 상기 저질량 이온의 상기 피크 강도와, 상기 생물통계학적 분석을 통해 획득된 상기 저질량 이온별 인자적재값의 곱의 절댓값이 문턱값 GT1보다 큰 제1저질량 이온들을 상기 훈련 케이스별로 선택하는 제1저질량이온 선택모듈을 포함할 수 있다. 상기 문턱값 GT1은 0.1인 것이 바람직하다.
상기 후보이온집합 선택수단은; 상기 제1저질량 이온들 중 상기 훈련 케이스들 전체의 문턱값 GT2 퍼센트 이상의 케이스들에서 공통으로 나타나는 제2저질량 이온들을 상기 후보이온집합으로 선택하는 후보이온집합 예비선택모듈을 포함할 수 있다. 상기 문턱값 GT2는 50인 것이 바람직하다.
상기 후보이온집합 선택수단은; 상기 제2저질량 이온들을 이용해 상기 훈련 케이스별로 위암에 대한 양성 또는 음성을 나타내는 판별 점수를 계산하고, 상기 판별 점수에 따른 민감도 및 특이도를 계산하는 민감도 및 특이도 계산모듈; 및 상기 민감도가 문턱값 GN3보다 작거나, 상기 특이도가 문턱값 GN4보다 작은 경우 상기 GT1 및 상기 GT2 중 적어도 하나를 변경하고, 상기 과정을 반복하여 상기 후보이온집합으로 선택하는 후보이온집합 최종선택모듈을 더 포함할 수 있다. 상기 문턱값 GN3 및 GN4는 0.9인 것이 바람직하다.
상기 최종이온집합 선택수단의 상기 판별 성능의 기준은; 상기 후보 저질량 이온 중 민감도와 특이도의 합이 기준값보다 큰 이온들을 선택하거나 상기 후보 저질량 이온들로 구성되는 조합별 민감도와 특이도의 합이 비교 대상 조합들 중 가장 큰 조합을 선택하는 제1기준을 포함할 수 있다.
상기 최종이온집합 선택수단의 상기 판별 성능의 기준은; 상기 후보 저질량 이온들의 조합들 중 상기 후보 저질량 이온들의 개수가 비교 대상 조합들 중 가장 적은 조합을 선택하는 제2기준을 더 포함할 수 있다.
상기 최종이온집합 선택수단의 상기 판별 성능의 기준은; 상기 후보 저질량 이온들의 조합들 중 진양성(true positive) 케이스의 최소 판별 점수와 진음성(ture negative) 케이스의 최대 판별 점수의 차가 비교 대상 조합들 중 가장 큰 조합을 선택하는 제3기준을 더 포함하며, 상기 판별 점수는 상기 후보 저질량 이온들의 상기 스케일링된 피크 강도와 상기 인자적재값을 통해 계산되며, 위암에 대한 양성 또는 음성을 나타내는 것이 바람직하다.
상기 최종이온집합 선택수단은; 상기 후보이온집합에 포함된 상기 후보 저질량 이온들을 상기 민감도가 상기 특이도보다 높은 고민감도 저질량 이온들을 포함하며 상기 고민감도 저질량 이온들을 상기 민감도와 상기 특이도의 합의 내림차순으로 정렬한 고민감도 집합{Sns1, Sns2, Sns3 … SnsI}과, 상기 특이도가 상기 민감도보다 높은 고특이도 저질량 이온들을 포함하며 상기 고특이도 저질량 이온들을 상기 민감도와 상기 특이도의 합의 내림차순으로 정렬한 고특이도 집합{Spc1, Spc2, Spc3 … SpcJ}으로 구분하는 이온 구분모듈; 상기 고민감도 집합에서 상위 L개의 상기 고민감도 저질량 이온들{Sns1, Sns2, Sns3 … SnsL}과 상기 고특이도 집합에서 상위 L개의 상기 고특이도 저질량 이온들{Spc1, Spc2, Spc3 … SpcL} 중 2개 이상의 저질량 이온들로 구성되는 후보 조합들 중 상기 제1기준, 상기 제2기준 및 상기 제3기준 중 적어도 하나 이상에 의한 상기 판별 성능의 기준에 의해 선택된 조합을 바이오마커 그룹으로 선정하는 바이오마커그룹 예비선정모듈; 상기 바이오마커 그룹과, 상기 고민감도 집합에서 차상위 M개의 상기 고민감도 저질량 이온들과 상기 고특이도 집합에서 차상위 M개의 상기 고특이도 저질량 이온들 중 적어도 하나 이상의 저질량 이온을 상기 바이오마커 그룹에 추가한 후보 조합들 중 상기 제1기준, 상기 제2기준 및 상기 제3기준 중 적어도 하나 이상에 의한 상기 판별 성능의 기준에 의해 선택된 조합을 상기 바이오마커 그룹으로 재선정하는 바이오마커그룹 재선정모듈; 및 상기 고민감도 집합 및 상기 고특이도 집합에 차상위 저질량 이온이 존재하지 않을 때까지 상기 재선정 과정을 반복하여 상기 바이오마커 그룹을 최종 선정하는 바이오마커그룹 최종선정모듈을 포함할 수 있다.
상기 최종이온집합 선택수단은; 상기 후보이온집합에서 상기 바이오마커그룹 최종선정모듈에서 얻어진 상기 바이오마커 그룹으로 선정 완료된 조합의 저질량 이온들을 제외한 잔류 후보이온집합을 대상으로 상기 세 바이오마커 그룹 선정 과정을 반복 수행하여 추가 바이오마커 그룹을 선정하되, 상기 고민감도 집합 또는 상기 고특이도 집합에 상기 L개 미만의 질량 이온이 남을 때까지 상기 추가 바이오마커 그룹을 더 선정하는 바이오마커그룹 추가선정모듈; 및 상기 바이오마커 그룹과 상기 추가 바이오마커 그룹들 중 진양성 및 진음성 판정의 정확도(accuracy)를 기준으로 상위 GK개의 바이오마커 그룹들의 조합의 저질량 이온들을 상기 암 진단용 저질량 이온으로 선택하는 암진단용저질량이온 최종선택모듈을 더 포함할 수 있다. 상기 L값은 2이고, 상기 M값은 1이며, 상기 GK값은 1, 2 또는 3 중 어느 하나인 것이 바람직하다.
상기 최종이온집합 선택수단은, 상기 제1훈련집합에 대해 독립적인 제2훈련집합을 상기 제1훈련집합에 추가한 훈련 집합을 대상으로 저질량 이온 선택 과정을 진행하는 것이 바람직하다.
본 발명에 따른 위암 진단 장치는, GC 진단의 경우에 분석 비용이 매우 낮으며, 분석 시간이 짧고, 대규모 분석이 가능하다는 장점이 있다. 과정을 간략히 설명하면, 혈액 내 저질량 이온의 질량 스펙트럼을 측정하고, 그 중 GC 진단용 저질량 이온들의 질량값에 대응하는 피크 강도들을 추출하여 간단한 계산을 거치면 바로 GC에 대한 양성/음성 정보를 제공할 수 있다.
또한, 판별 성능이 우수하고 강건하여, GC를 대상으로 한 경우 훈련 집합뿐 아니라 검증 집합의 판별에서도 민감도, 특이도, 양성예측도, 음성 예측도가 모두 약 80~90% 이상임을 확인하였다. 또한, GC 환자 및 비환자 집합을 다른 질병의 환자 및 비환자 집합으로 변경하는 것을 통해 다양한 질병에 유용하게 적용될 수 있다.
도 1 및 2는 종래 기술을 설명하기 위한 도면으로,
도 1은 종래 기술에 따라 저질량 이온 질량 스펙트럼을 사용하여 GC를 판정하는 과정을 설명하는 순서도,
도 2는 종래 기술에 따라 GC 환자군 49명과 정상 대조군 84명으로 구성된 집합을 판정한 결과를 도시한 그래프이다.
도 3 내지 25는 본 발명의 바람직한 일 실시 예에 따른 위암 진단 장치를 설명하기 위한 도면으로,
도 3은 본 발명의 바람직한 일 실시 예에 따른 위암 진단 장치를 나타낸 블록도.
도 4는 도 3의 위암 진단부를 더욱 상세히 나타낸 블록도,
도 5는 도 3의 제1판별점수 계산수단을 더욱 상세히 나타낸 블록도,
도 6은 도 3의 제2판별점수 계산수단을 더욱 상세히 나타낸 블록도,
도 7은 도 3의 위암진단용이온 선정수단을 더욱 상세히 나타낸 블록도,
도 8은 도 7의 후보이온집합 선택수단을 더욱 상세히 나타낸 블록도,
도 9는 도 7의 최종이온집합 선택수단을 더욱 상세히 나타낸 블록도,
도 10은 본 발명에 따른 민감도와 특이도가 소정의 값을 갖는 제1훈련집합 E0를 선정하고 질량 이온별 가중치를 계산하는 과정을 설명하는 순서도,
도 11은 판별 대상 시료에 판별식을 적용하는 과정을 설명하는 순서도,
도 12는 제1훈련집합 E01에서 계산한 질량 이온별 가중치로 집합 E1을 판정한 결과를 도시한 그래프,
도 13은 제1훈련집합 E02에서 계산한 질량 이온별 가중치로 집합 E1을 판정한 결과를 도시한 그래프,
도 14는 제1훈련집합 E03에서 계산한 질량 이온별 가중치로 집합 E1을 판정한 결과를 도시한 그래프,
도 15는 제1훈련집합 E04에서 계산한 질량 이온별 가중치로 집합 E1을 판정한 결과를 도시한 그래프,
도 16은 제1훈련집합 E05에서 계산한 질량 이온별 가중치로 집합 E1을 판정한 결과를 도시한 그래프,
도 17은 본 발명에 따른 예비 판별식을 구성하는 과정을 설명하는 순서도,
도 18은 제1종 예비 판별식으로 집합 E1을 판정한 결과를 도시한 그래프,
도 19는 제2종 예비 판별식으로 집합 E1을 판정한 결과를 도시한 그래프,
도 20은 제3종 예비 판별식으로 집합 E1을 판정한 결과를 도시한 그래프,
도 21은 제4종 예비 판별식으로 집합 E1을 판정한 결과를 도시한 그래프,
도 22는 제5종 예비 판별식으로 집합 E1을 판정한 결과를 도시한 그래프,
도 23은 본 발명에 따른 최종 판별식을 구성하는 과정을 설명하는 순서도,
도 24는 집합 E의 5회 반복 측정한 질량 스펙트럼들에 대해 본 발명의 제1종 및 제5종 최종 판별식에 따라 판별 점수를 계산한 후 평균 판별 점수(mean DS)를 구하여 판정한 결과를 도시한 그래프,
도 25는 본 발명의 제1종 및 제5종 최종 판별식에 따라 평균 판별 점수를 계산하여 5회 반복 측정한 집합 F를 판정한 결과를 도시한 그래프이다.
1. 용어의 정의
본 발명에서, "생물학적 시료"는 전혈(whole blood), 혈청, 혈장(plasma), 요, 분변, 객담(sputum), 타액, 조직, 세포, 세포 추출물, 체외 세포 배양물 등과 같은 시료들을 포함하나, 이에 제한되지 않는다. 아래에 기술되는 실시 예에서는 환자 또는 비환자의 혈청을 생물학적 시료로 사용하였다.
본 발명에서, "피크 강도"는 MALDI-TOF 질량분석기로부터 얻어지는 값을 말하며, 피크에 해당하는 질량 이온의 양과 상관 관계를 가진다.
본 발명에서, "정규화"는 데이터(data)의 범위를 일치시키거나 분포를 유사하게 만들어 주는 것을 말하며, 평균값(mean), 중간값(median) 등을 이용하여 정규화할 수 있으나 이에 제한되지 않고, 경우에 따라 다양한 공지의 방법들이 적용될 수 있다. 본 실시 예에서는 각 시료별 피크 강도들의 소계를 구하고, 시료별 소계들의 평균을 구한 후, 각 시료별 피크 강도들의 소계가 이 평균과 일치하도록 각 피크 강도에 시료별 배율 인자를 곱하는 방식으로 정규화하였다. 즉, 이와 같이 정규화한 후에는 각 시료별 피크 강도들의 소계가 동일해진다.
본 발명에서, "파레토 스케일링"은 정규화한 각 피크 강도에서 질량 이온별 평균값을 뺀 후 표준편차의 제곱근으로 나누는 것을 말한다. 보다 일반적인 스케일링 방법인 오토스케일링(autoscaling)에서는 표준편차로 나누는 것을 통해 데이터의 크기 정보를 완전히 상쇄시키는 것에 비해, 파레토 스케일링에서는 데이터의 크기 정보를 부분적으로 유지하는 것을 통해 노이즈(noise)의 증폭을 피할 수 있다는 장점이 있다.
본 발명에서, "가중치"는 가중치를 곱한 후의 데이터의 수치적 크기가 통계적 관점에서의 중요성에 비례하도록 조정하는 인자를 말하는데, 아래에 기술되는 실시 예에서 주성분 분석 기반 선형 판별 분석의 결과로 획득되는 질량 이온별 인자적재값을 가중치의 일례라 할 수 있다.
본 발명에서, "저질량 이온"은 MALDI-TOF 질량분석기 등을 이용하여 획득한 질량값이 1500 m/z보다 작은 이온을 의미한다. CRC 진단용 저질량 이온들 중 일부는 이 범위보다 더 높은 질량값을 가지기도 하나, 대부분이 이 범위 내에 들어오므로 이 경우에도 저질량 이온이라는 명칭을 그대로 사용하려고 한다. 즉, 1500 m/z이라는 한계는 확정적인 값이 아니라 대략적인 값의 의미로 사용된 것이다.
본 발명에서, MALDI-TOF 질량분석기에 의해 측정된 질량값은 "±0.05 m/z"의 오차 범위를 포함한다. 실험 환경에 따라 질량값 측정치에 다소의 오차가 발생할 수 있기 때문이다. 예를 들어, 청구범위에 기재된 1467.5969 m/z의 질량값은 실제로 1467.5469 m/z 내지 1467.6469 m/z의 범위를 갖는 것으로 이해되어야 한다. 실험 환경에 따라 오차 범위는 "±0.1 m/z"일 수 있다.
본 발명에서, MALDI-TOF 질량분석기에 의해 측정된 질량값은 MALDI-TOF 질량분석기의 포지티브 모드(positive mode)에서 획득된 질량값임에 유의한다.
본 발명에서, 가중치 벡터(vector)의 부호는 판별 점수가 양수인 경우 양성으로 판정되고 음수인 경우 음성으로 판정되도록 조정한다. 주성분 분석에서의 인자적재값 벡터는 수학적으로 고유벡터(eigenvector)에 해당하는데, 이 벡터의 부호는 임의로 정할 수 있다. 즉, 계산된 질량 이온별 인자적재값에 전체적으로 -1을 곱하여 부호를 변경한다고 하여도 수학적으로는 동일한 고유치 문제(eigenvalue problem)에 대한 동등한 해라고 할 수 있으나, 판별 점수가 음수인 경우를 양성으로 양수인 경우를 음성으로 판정하게 된다. 본 발명에서는 판별 점수가 양수인 경우 양성으로 판정되고 음수인 경우 음성으로 판정되도록 고유벡터의 부호를 조정하였으나, 본 발명의 범위가 이에 제한되지 않음에 유의한다.
또한, 본 발명에서,“판별 점수”라 함은 생물학적 시료로부터 추출한 질량 스펙트럼에 대해 생물통계학적 분석을 통해 계산된 값으로, 이것을 기반으로 하여 특정 암의 양성 또는 음성을 판정할 수 있다. 판정 방식은 계산된 판별 점수가 특정 기준값보다 큰지 여부를 판단하는 간단한 방식이 사용될 수도 있고, 계산된 판별 점수를 입력으로 하여 판정 결과를 출력으로 주는 함수가 사용될 수 있다.
본 발명의 실시 예에서는 판별 점수라는 용어를 특정하여 사용하였으나, 본 발명에서 정의하는 상기 판별 점수는 판별 레벨(level), 판별값(value) 등의 다양한 형태의 용어로 기재될 수 있다. 따라서, 본 발명에서 정의하는 판별 점수라는 용어는 사전적 의미의 판별 점수라는 용어에 한정되지 않으며, 본 발명의 정의에 따라 판별 점수를 의미하는 상기 판별 레벨과 판별값, 또는 이와 유사한 다양한 용어들을 모두 포함하는 것으로 해석되어야 한다.
또한, 본 발명에서, “판별 성능”이라 함은 기본적으로 민감도, 특이도, 양성예측도, 음성예측도 및 정확도 등의 지표를 수치로 나타낸 것을 의미한다. 또한, 이 지표들의 함수로 계산되는 값을 의미하기도 한다. 예를 들어, 민감도, 특이도, 양성예측도, 음성예측도 및 정확도 등의 각각의 값이 판별 성능으로 사용될 수 있으며, 또는 민감도와 특이도의 합, 민감도와 양성예측도의 합, 음성예측도와 정확도의 합 등의 2 이상의 합이 판별 성능으로 사용될 수도 있다.
이하, 실시 예를 통하여 본 발명을 보다 상세히 설명한다. 기술되는 실시 예는 본 발명을 예시적으로 설명하기 위한 것이며 본 발명의 권리범위가 실시 예에 한정되는 것은 아님을 밝혀둔다.
2. 실시 예
도 3 내지 25는 본 발명의 바람직한 일 실시 예에 따른 암 진단 장치를 설명하기 위한 도면이다.
먼저, 도 3은 본 발명의 바람직한 일 실시 예에 따른 위암 진단 장치를 나타낸 블록도로서, 도시된 바와 같이 본 발명에 따른 위암 진단 장치는, 다수의 위암 환자 및 비환자 케이스들의 생물학적 시료로부터 저질량 이온의 질량 스펙트럼을 검출하는 저질량 이온 검출부(1000); 상기 저질량 이온의 질량 스펙트럼 패턴을 비교 분석하여 위암 진단 정보를 판정하는 위암 진단부(2000); 및 상기 위암 진단부(2000)로부터 판정된 위암 진단 정보를 출력 가능한 형태로 변환하여 표시하는 디스플레이부(3000)를 포함한다.
상기 저질량 이온 검출부(1000)는; 상기 생물학적 시료로부터 저질량 이온의 특정 정보 예로서, 피크 강도를 검출하여 상기 저질량 이온의 질량 스펙트럼을 추출할 수 있다. 이를 위하여, 상기 저질량 이온 검출부(1000)는 질량분석기를 포함할 수 있다.
상기 디스플레이부(3000)는; 모니터 화면, 휴대 단말기의 액정 화면 등의 디스플레이 디바이스에 상기 판정된 암 진단 정보를 문자, 숫자 또는 도형 등의 다양한 출력 형태로 변환하여 표시할 수 있다.
도 4는 도 3의 위암 진단부를 더욱 상세히 나타낸 블록도로서, 도시된 바와 같이 상기 위암 진단부(2000)는; 훈련 후보 집합인 상기 위암 환자 및 비환자 케이스들의 저질량 이온 질량 스펙트럼들을 정렬하는 제1정렬수단(2100); 정렬된 상기 질량 스펙트럼에 대해 생물통계학적 분석을 수행하여 판별 점수를 계산하는 제1판별점수 계산수단(2200); 상기 판별 점수에 따라 민감도 및 특이도를 계산하고, 이를 기준으로 제1훈련집합을 선정하여 저질량 이온별 인자적재값을 계산하는 인자적재값 계산수단(2300); 후보 조건을 만족하는 후보 저질량 이온들 중 판별 성능을 기반으로 하여 위암 진단용 저질량 이온들을 선택하는 위암진단용이온 선정수단(2400); 판별 대상 생물학적 시료의 저질량 이온 질량 스펙트럼을 상기 제1훈련집합에 정렬하는 제2정렬수단(2500); 상기 판별 대상의 저질량 이온의 피크 강도와 상기 인자적재값으로부터 판별 점수를 계산하는 제2판별점수 계산수단(2600); 및 상기 판별 점수에 따라 상기 판별 대상을 위암의 양성 또는 음성으로 판정하는 위암 판정수단(2700)을 포함할 수 있다.
상기 위암진단용이온 선정수단(2400)은; 상기 다수의 위암 환자 및 비환자 케이스들을, 다수의 위암 환자 케이스들과 다수의 정상인 케이스들로 구성되는 제1종 판별 케이스들과, 상기 다수의 위암 환자 케이스들과 다수의 대장암 환자 케이스들로 구성되는 제2종 판별 케이스들과, 상기 다수의 위암 환자 케이스들과 다수의 유방암 환자 케이스들로 구성되는 제3종 판별 케이스들과, 상기 다수의 위암 환자 케이스들과 다수의 비호지킨림프종(non-Hodgkin lymphoma, NHL) 환자 케이스들로 구성되는 제4종 판별 케이스들로 구분하거나, 상기 다수의 위암 환자 및 비환자 케이스들을, 상기 제1종 판별 케이스들과 상기 다수의 위암 환자 및 정상인 케이스들과 다수의 대장암, 유방암 및 비호지킨림프종 환자 케이스들로 구성되는 제5종 판별 케이스들로 구분하고, 상기 제1종 판별 케이스들, 상기 제2종 판별 케이스들, 상기 제3종 판별 케이스들, 상기 제4종 판별 케이스들 및 상기 제5종 판별 케이스들에 대해 각각 실행되어, 상기 위암 진단용 저질량 이온들이, 상기 제1종 판별 케이스에 대한 제1종 위암 진단용 저질량 이온들, 상기 제2종 판별 케이스에 대한 제2종 위암 진단용 저질량 이온들, 상기 제3종 판별 케이스에 대한 제3종 위암 진단용 저질량 이온들, 상기 제4종 판별 케이스에 대한 제4종 위암 진단용 저질량 이온들 및 상기 제5종 판별 케이스에 대한 제5종 위암 진단용 저질량 이온들로 구분될 수 있다.
상기 인자적재값 계산수단(2300)은; 상기 정렬된 질량 스펙트럼에 대해 생물통계학적 분석을 수행하고, 상기 생물통계학적 분석 결과를 기초로 상기 위암 환자 및 비환자 케이스들 중 훈련 조건을 만족하는 훈련 케이스들을 제1훈련집합으로 선택하는 제1훈련집합 선택수단(2310)을 포함할 수 있으며, 상기 제1훈련집합으로부터 인자적재값을 계산할 수 있다.
상기 제1훈련집합 선택수단(2310)은; 상기 생물통계학적 분석 결과에 따른 민감도가 문턱값 GN1 이상이고, 특이도가 문턱값 GN2 이상일 때의 암 환자 및 비환자 케이스들을 상기 제1훈련집합을 설정할 수 있다. 여기서, 상기 문턱값 GN1과 GN2는 1인 것이 바람직하다.
상기 위암 판정수단(2700)은; 상기 판별 점수에 따라 상기 판별 대상을 위암의 양성 또는 음성으로 판정하되, 상기 판별 점수가 기준값 GS보다 크면 양성으로 상기 판별 대상의 위암 정보를 판단하고, 상기 판별 점수가 기준값 GS보다 작으면 음성으로 상기 판별 대상의 위암 정보를 판단할 수 있다. 여기서, 상기 기준값 GS는 0인 것이 바람직하다.
상기 위암 판정수단(2700)은; 상기 판별 대상의 생물학적 시료를 반복적으로 측정하여 검출한 다수의 상기 저질량 이온 질량 스펙트럼에 대해 계산된 다수의 상기 판별 점수의 평균값으로 상기 판별 대상의 상기 위암 정보를 판단할 수 있다.
도 5는 도 4의 제1판별점수 계산수단을 더욱 상세히 나타낸 블록도로서, 도시된 바와 같이 상기 제1판별점수 계산수단(2200)은; 상기 훈련 후보 집합의 상기 저질량 이온 질량 스펙트럼들의 상기 피크 강도들을 정규화하는 정규화 모듈(2210); 상기 정규화한 피크 강도들을 스케일링하는 스케일링 모듈(2220); 및 상기 스케일링된 피크 강도들에 대해 상기 생물통계학적 분석을 수행하여 상기 판별 점수를 계산하는 판별점수계산 모듈(2230)을 포함할 수 있다.
상기 스케일링 모듈(2220)은; 파레토 스케일링을 수행할 수 있다. 상기 판별점수계산 모듈(2230)은; 주성분 분석 기반 선형 판별 분석을 사용하여 상기 생물통계학적 분석을 수행할 수 있다. 상기 판별점수계산 모듈(2230)은; 상기 주성분 분석 기반 선형 판별 분석에 의해 획득된 인자적재값과 상기 스케일링된 피크 강도를 함께 사용하여 상기 판별 점수를 계산할 수 있다.
도 6은 도 4의 제2판별점수 계산수단을 더욱 상세히 나타낸 블록도로서, 도시된 바와 같이 상기 제2판별점수 계산수단(2600)은; 상기 판별 대상의 상기 저질량 이온 질량 스펙트럼의 상기 피크 강도들을 정규화하는 정규화 모듈(2610); 상기 정규화한 피크 강도들을 스케일링하는 스케일링 모듈(2620); 및 상기 스케일링된 피크 강도와 상기 인자적재값을 통해 상기 판별 점수를 계산하는 판별점수계산 모듈(2630)을 포함할 수 있다.
상기 스케일링 모듈(2620)은; 파레토 스케일링을 수행할 수 있다. 상기 판별점수계산 모듈(2630)은; 상기 위암 진단용 저질량 이온들의 상기 스케일링된 피크 강도와 상기 인자적재값을 통해 상기 판별 점수를 계산할 수 있다.
도 7은 도 4의 위암진단용이온 선정수단을 더욱 상세히 나타낸 블록도로서, 도시된 바와 같이 상기 위암진단용이온 선정수단(2400)은; 상기 선택된 상기 제1훈련집합으로부터 후보 조건을 만족하는 후보 저질량 이온들을 후보이온집합으로 선택하는 후보이온집합 선택수단(2410); 및 상기 선택된 상기 후보이온집합의 상기 후보 저질량 이온의 개별 또는 조합별 판별 성능을 기반으로 하여 위암 진단용 저질량 이온들을 최종이온집합으로 선택하는 최종이온집합 선택수단(2420)을 포함할 수 있다.
상기 최종이온집합 선택수단(2420)의 상기 판별 성능의 기준은; 상기 후보 저질량 이온 중 민감도와 특이도의 합이 기준값보다 큰 이온들을 선택하거나 상기 후보 저질량 이온들로 구성되는 조합별 민감도와 특이도의 합이 비교 대상 조합들 중 가장 큰 조합을 선택하는 제1기준을 포함할 수 있다.
상기 최종이온집합 선택수단(2420)의 상기 판별 성능의 기준은; 상기 후보 저질량 이온들의 조합들 중 상기 후보 저질량 이온들의 개수가 비교 대상 조합들 중 가장 적은 조합을 선택하는 제2기준을 더 포함할 수 있다.
상기 최종이온집합 선택수단(2420)의 상기 판별 성능의 기준은; 상기 후보 저질량 이온들의 조합들 중 진양성(true positive) 케이스의 최소 판별 점수와 진음성(true negative) 케이스의 최대 판별 점수의 차가 비교 대상 조합들 중 가장 큰 조합을 선택하는 제3기준을 더 포함하며, 상기 판별 점수는 상기 후보 저질량 이온들의 상기 스케일링된 피크 강도와 상기 인자적재값을 통해 계산되며, 위암에 대한 양성 또는 음성을 나타낼 수 있다.
상기 최종이온집합 선택수단(2420)은, 상기 제1훈련집합에 대해 독립적인 제2훈련집합을 상기 제1훈련집합에 추가한 훈련 집합을 대상으로 저질량 이온 선택 과정을 진행할 수 있다.
도 8은 도 7의 후보이온집합 선택수단을 더욱 상세히 나타낸 블록도로서, 도시된 바와 같이 상기 후보이온집합 선택수단(2410)은; 상기 훈련 케이스 각각에 대한 상기 저질량 이온의 상기 피크 강도와, 상기 생물통계학적 분석을 통해 획득된 상기 저질량 이온별 인자적재값의 곱의 절댓값이 문턱값 GT1보다 큰 제1저질량 이온들을 상기 훈련 케이스별로 선택하는 제1저질량이온 선택모듈(2411)을 포함할 수 있다. 여기서, 상기 문턱값 GT1은 0.1인 것이 바람직하다.
상기 후보이온집합 선택수단(2410)은; 상기 제1저질량 이온들 중 상기 훈련 케이스들 전체의 문턱값 GT2 퍼센트 이상의 케이스들에서 공통으로 나타나는 제2저질량 이온들을 상기 후보이온집합으로 선택하는 후보이온집합 예비선택모듈(2412)을 포함할 수 있다. 여기서, 상기 문턱값 GT2는 50인 것이 바람직하다.
상기 후보이온집합 선택수단(2410)은; 상기 제2저질량 이온들을 이용해 상기 훈련 케이스별로 위암에 대한 양성 또는 음성을 나타내는 판별 점수를 계산하고, 상기 판별 점수에 따른 민감도 및 특이도를 계산하는 민감도 및 특이도 계산모듈(2413); 및 상기 민감도가 문턱값 GN3보다 작거나, 상기 특이도가 문턱값 GN4보다 작은 경우 상기 GT1 및 상기 GT2 중 적어도 하나를 변경하고, 상기 과정을 반복하여 상기 후보이온집합을 선택하는 후보이온집합 최종선택모듈(2414)을 더 포함할 수 있다. 여기서, 상기 문턱값 GN3 및 GN4는 0.9인 것이 바람직하다.
도 9는 도 7의 최종이온집합 선택수단을 더욱 상세히 나타낸 블록도로서, 도시된 바와 같이 상기 최종이온집합 선택수단(2420)은; 상기 후보이온집합에 포함된 상기 후보 저질량 이온들을 상기 민감도가 상기 특이도보다 높은 고민감도 저질량 이온들을 포함하며 상기 고민감도 저질량 이온들을 상기 민감도와 상기 특이도의 합의 내림차순으로 정렬한 고민감도 집합{Sns1, Sns2, Sns3 … SnsI}과, 상기 특이도가 상기 민감도보다 높은 고특이도 저질량 이온들을 포함하며 상기 고특이도 저질량 이온들을 상기 민감도와 상기 특이도의 합의 내림차순으로 정렬한 고특이도 집합 {Spc1, Spc2, Spc3 … SpcJ}으로 구분하는 이온 구분모듈(2421); 상기 고민감도 집합에서 상위 L개의 상기 고민감도 저질량 이온들{Sns1, Sns2, Sns3 … SnsL}과 상기 고특이도 집합에서 상위 L개의 상기 고특이도 저질량 이온들{Spc1, Spc2, Spc3 … SpcL} 중 2개 이상의 저질량 이온들로 구성되는 후보 조합들 중 상기 제1기준, 상기 제2기준 및 상기 제3기준 중 적어도 하나 이상에 의한 상기 판별 성능의 기준에 의해 선택된 조합을 바이오마커 그룹으로 선정하는 바이오마커그룹 예비선정모듈(2422); 상기 바이오마커 그룹과, 상기 고민감도 집합에서 차상위 M개의 상기 고민감도 저질량 이온들과 상기 고특이도 집합에서 차상위 M개의 상기 고특이도 저질량 이온들 중 적어도 하나 이상의 저질량 이온을 상기 바이오마커 그룹에 추가한 후보 조합들 중 상기 제1기준, 상기 제2기준 및 상기 제3기준 중 적어도 하나 이상에 의한 상기 판별 성능의 기준에 의해 선택된 조합을 상기 바이오마커 그룹으로 재선정하는 바이오마커그룹 재선정모듈(2423); 및 상기 고민감도 집합 및 상기 고특이도 집합에 차상위 저질량 이온이 존재하지 않을 때까지 상기 재선정 과정을 반복하여 상기 바이오마커 그룹을 최종 선정하는 바이오마커그룹 최종선정모듈(2424)을 포함할 수 있다.
상기 최종이온집합 선택수단(2420)은; 상기 후보이온집합에서 상기 바이오마커그룹 최종선정모듈(2424)에서 얻어진 상기 바이오마커 그룹으로 선정 완료된 조합의 저질량 이온들을 제외한 잔류 후보이온집합을 대상으로 상기 세 바이오마커 그룹 선정 과정을 반복 수행하여 추가 바이오마커 그룹을 선정하되, 상기 고민감도 집합 또는 상기 고특이도 집합에 상기 L개 미만의 질량 이온이 남을 때까지 상기 추가 바이오마커 그룹을 더 선정하는 바이오마커그룹 추가선정모듈(2425); 및 상기 바이오마커 그룹과 상기 추가 바이오마커 그룹들 중 진양성 또는 진음성 판정의 정확도(accuracy)를 기준으로 상위 GK개의 바이오마커 그룹들의 조합의 저질량 이온들을 상기 암 진단용 저질량 이온으로 선택하는 암진단용저질량이온 최종선택모듈(2426)을 더 포함할 수 있다. 여기서, 상기 L값은 2이고, 상기 M값은 1이며, 상기 GK값은 1, 2 또는 3 중 어느 하나인 것이 바람직하다.
본 발명의 위암 진단 장치는 도 4에 도시된 바와 같이 하드웨어로 구성되거나 또는 프로그램 구조에 의한 소프트웨어로 구성될 수도 있으며, 이하에서는 일 예로서 첨부된 순서도의 프로세스를 참조하여 소프트웨어로 구성된 GC를 진단하기 위한 위암 진단 장치에 대하여 상세히 설명하기로 한다.
2-1. 시료 준비 - 혈청 수집 대상
전술한 표 1의 49명의 GC 환자군, 전술한 표 2의 84명의 정상 대조군, 표 5의 77명의 CRC 환자군, 표 6의 54명의 BRC 환자군 및 표 7의 24명의 비호지킨림프종 환자군으로부터 혈청을 수집하였다.
CRC Sex Age
year
Stage Location Cell Type CEA
ng/mL
CRC-E1 M 77 I A-colon AC 1.8
CRC-E2 M 50 I Rectum AC 1.9
CRC-E3 F 47 I S-colon AC 0.7
CRC-E4 F 82 I A-colon AC 1.1
CRC-E5 M 59 I Rectum AC 1.9
CRC-E6 M 73 I Rectum AC 3.6
CRC-E7 M 71 I S-colon AC 3.6
CRC-E8 M 71 I Rectum AC 9.8
CRC-E9 F 47 I Rectum AC 3.9
CRC-E10 F 54 I Rectum AC 1.6
CRC-E11 M 73 I S-colon AC 7.1
CRC-E12 F 74 I S-colon AC 2.3
CRC-E13 M 75 II A-colon AC 2.1
CRC-E14 F 81 II S-colon AC 4.1
CRC-E15 F 76 II Rectum AC 25.3
CRC-E16 F 71 II A-colon AC 1.6
CRC-E17 M 72 II A-colon AC 3.8
CRC-E18 F 82 II S-colon AC 1.8
CRC-E19 F 68 II D-colon AC 1.7
CRC-E20 M 71 II S-colon AC 3.6
CRC-E21 F 67 II A-colon AC 1.9
CRC-E22 M 45 II D-colon MAC 3.3
CRC-E23 M 60 II S-colon AC 2.8
CRC-E24 M 74 II S-colon AC 5.3
CRC-E25 M 57 II Rectum AC 7.3
CRC-E26 F 51 II Rectum AC 6.7
CRC-E27 M 79 II S-colon AC 6.2
CRC-E28 F 59 II A-colon AC 1
CRC-E29 M 62 II S-colon AC -
CRC-E30 M 84 II S-colon AC 11.3
CRC-E31 M 68 II Rectum AC 5.8
CRC-E32 M 54 II A-colon AC 1.1
CRC-E33 F 51 II D-colon AC 5.9
CRC-E34 F 56 III S-colon AC 1.2
CRC-E35 M 52 III S-colon AC 3.2
CRC-E36 F 59 III S-colon AC 1.7
CRC-E37 F 73 III S-colon AC 5.7
CRC-E38 M 70 III S-colon AC 3.6
CRC-E39 M 68 III A-colon AC 9.2
CRC-E40 F 55 III Rectum AC 2.1
CRC-E41 F 61 III A-colon AC 12.7
CRC-E42 M 59 III S-colon AC 2.7
CRC-E43 M 67 III Rectum AC 9.5
CRC-E44 M 48 III S-colon AC 1.3
CRC-E45 M 58 III Rectum AC 1.7
CRC-E46 F 50 III S-colon AC 4.8
CRC-E47 F 51 III S-colon AC 7
CRC-E48 F 74 III T-colon AC 2.5
CRC-E49 M 60 III Rectum AC 3.5
CRC-E50 M 52 III S-colon AC 2.5
CRC-E51 M 54 III A-colon AC 5.3
CRC-E52 M 82 III S-colon AC 2.4
CRC-E53 M 54 III S-colon AC 5.3
CRC-E54 F 52 III S-colon AC 22.1
CRC-E55 M 61 III Rectum AC 128.1
CRC-E56 F 47 III S-colon AC 1.2
CRC-E57 M 71 III A-colon AC 8.2
CRC-E58 M 52 III S-colon AC 4.1
CRC-E59 F 64 III S-colon AC 6.8
CRC-E60 F 51 III S-colon AC 1.2
CRC-E61 M 55 III A-colon AC 1.2
CRC-E62 M 62 III Rectum AC 2.5
CRC-E63 M 38 III Rectum AC 6.1
CRC-E64 F 65 III D-colon AC 3.5
CRC-E65 M 49 III S-colon, T-colon AC 3.8
CRC-E66 M 66 III S-colon AC 10.7
CRC-E67 F 54 III S-colon AC 8.8
CRC-E68 F 70 IV Rectum AC 3.9
CRC-E69 M 68 IV Rectum AC 6
CRC-E70 M 53 IV Rectum AC 54.7
CRC-E71 F 63 IV D-colon AC 12.3
CRC-E72 F 63 IV A-colon AC 1.4
CRC-E73 M 66 IV S-colon AC 6.4
CRC-E74 F 50 IV Rectum AC 62
CRC-E75 M 57 IV Rectum AC 6.4
CRC-E76 M 57 IV S-colon AC 41.7
CRC-E77 M 48 IV A-colon AC 59.4
AC: Adenocarcinoma
MAC: Mucinous adenocarcinoma
BRC Sex Age
year
Node ER ER% PR PR% HER2 Tumor Size cm
BRC-E1 F 48 - 5 33-66% 6 33-66% 2 -
BRC-E2 F 35 - 6 33-66% 6 33-66% 1 -
BRC-E3 F 45 pN1a 5 33-66% 5 33-66% 0 1.5
BRC-E4 F 61 - 0 0% 0 0% 2 -
BRC-E5 F 70 pN0(sn) 0 0% 0 0% 1 <0.1
BRC-E6 F 58 ypN0 3 <10% 3 10-33% 3 0.5
BRC-E7 F 49 ypN0(i+) 0 0% 0 0% 2 1.9
BRC-E8 F 49 ypN2a 0 0% 0 0% 1 2.5
BRC-E9 F 39 pN1a 6 33-66% 7 >66% 1 2.2
BRC-E10 F 48 ypN2a 6 33-66% 4 <10% 3 5.8
BRC-E11 F 39 - 0 0% 0 0% 1 -
BRC-E12 F 56 pN1a 6 33-66% 6 33-66% 0 2.8
BRC-E13 F 59 pN0(sn) 6 33-66% 2 <10% 1 2.3
BRC-E14 F 31 pN1a 5 33-66% 4 10-33% 1 2.2
BRC-E15 F 46 pN3a 6 33-66% 6 33-66% 1 3.5
BRC-E16 F 56 - 7 >66% 4 10-33% 1 -
BRC-E17 F 55 - 0 0% 0 0% 2 -
BRC-E18 F 46 pN0 0 0% 0 0% 0 1.5
BRC-E19 F 60 ypN0 0 0% 0 0% 3 1.9
BRC-E20 F 49 pN0(sn) 5 33-66% 2 <10% 2 1.5
BRC-E21 F 55 pN1mi 0 0% 0 0% 3 1.8
BRC-E22 F 65 pN0 6 33-66% 6 33-66% 0 1.7
BRC-E23 F 35 ypN2a 6 66% 4 10-33% 2 2.6
BRC-E24 F 46 pN1a 6 33-66% 6 33-66% 3 2.5
BRC-E25 F 45 pN0(sn) 6 33-66% 6 33-66% 1 0.8
BRC-E26 F 42 pN0(sn) 3 10-33% 6 33-66% 0 1
BRC-E27 F 58 pN0(sn) 6 33-66% 6 33-66% 1 1.5
BRC-E28 F 62 pN1a 0 0% 0 0% 2 2.2
BRC-E29 F 61 - 0 0% 0 0% 1 -
BRC-E30 F 60 - - - - - - -
BRC-E31 F 51 - - - - - - -
BRC-E32 F 42 pN0 7 >66% 7 >66% 2 -
BRC-E33 F 43 pN0(sn) 3 10-33% 4 10-33% 0 2.3
BRC-E34 F 60 pN0(sn) 0 0% 0 0% 1 2.3
BRC-E35 F 61 - 6 33-66% 0 0% 2 -
BRC-E36 F 61 pN0(sn) 0 0% 2 <10% 2 1.8
BRC-E37 F 49 - - - - - - -
BRC-E38 F 45 ypN0 0 0% 0 0% 0 0.9
BRC-E39 F 59 pN0 0 0% 0 0% 3 1.1
BRC-E40 F 43 pN1 0 0% 0 0% 0 1.5
BRC-E41 F 46 pN1 8 100% 8 100% 0 1.3
BRC-E42 F 48 pN0 6 50-60% 5 10-20% 3 1.3
BRC-E43 F 39 pN0 0 0% 0 0% 0 2.2
BRC-E44 F 66 pN0 8 95% 8 95% 0 1.7
BRC-E45 F 39 ypN0 0 0% 0 0% 0 DCIS
BRC-E46 F 37 pN0 7 70-80% 8 80% 3 1.5
BRC-E47 F 64 pN0 8 95% 8 95% 0 0.5
BRC-E48 F 44 ypN1 7 90% 8 95% 0 2
BRC-E49 F 50 pN2 8 95% 8 100% 0 1.1
BRC-E50 F 47 pN0 7 70% 7 50-60% 1 0.5
BRC-E51 F 44 pN1 8 90% 8 95% 1 0.6
BRC-E52 F 50 pN0 0 0% 0 0% 2 2.2
BRC-E53 F 53 pN0 7 95% 8 95% 0 1.1
BRC-E54 F 65 pN0 8 95% 7 40% 0 1.5
NHL Sex Age
year
Stage Involved Site Subtype IPI
NHL-E1 M 44 1 stomach DLBL 1
NHL-E2 M 39 1 nasal cavity NK/T cell L 1
NHL-E3 M 41 1 inguinal LN ALCL 0
NHL-E4 F 49 1 mandibular area DLBL 0
NHL-E5 F 48 1 neck, submandibular DLBL 0
NHL-E6 M 63 2 stomach DLBL 1
NHL-E7 M 64 2 stomach DLBL 2
NHL-E8 M 52 2 spleen, pancreatic LN DLBL 1
NHL-E9 M 42 2 multiple DLBL 2
NHL-E10 M 54 2 stomach DLBL 1
NHL-E11 F 41 2 stomach DLBL 1
NHL-E12 F 66 2 gum, submandibular DLBL 1
NHL-E13 M 65 3 multiple DLBL 3
NHL-E14 M 65 3 multiple DLBL 3
NHL-E15 M 65 3 multiple Follicular L 2
NHL-E16 M 58 3 multiple DLBL 2
NHL-E17 M 40 4 multiple DLBL 3
NHL-E18 F 57 4 multiple DLBL 3
NHL-E19 F 24 4 multiple DLBL 4
NHL-E20 M 56 4 multiple DLBL 3
NHL-E21 F 76 4 multiple DLBL 3
NHL-E22 F 69 4 multiple Mantle cell L 4
NHL-E23 F 64 4 multiple DLBL 5
NHL-E24 M 44 4 multiple DLBL 2
또한, 이 288명을 집합 E1으로 하여 후술하는 바와 같이 그 부분 집합 E0로 제1훈련집합을 구성하였으며, 이 제1훈련집합에 대한 생물통계학적 분석을 통해 질량 이온별 가중치(인자적재값)를 계산하고, 예비 판별식을 획득하였다. 또한, 이 집합 E1 외에 표 8의 48명의 GC 환자군, 표 9의 83명의 정상 대조군, 표 10의 175명의 CRC 환자군, 표 11의 54명의 BRC 환자군 및 표 12의 22명의 NHL 환자군을 집합 E2(제2훈련집합)로 하여 훈련 집합을 확장하였다. 즉 예비 판별식을 구성하는 저질량 이온들의 예비 후보군으로부터 후술할 방법에 따라 GC 진단용 저질량 이온들을 확인할 때에는 서로 독립적인 집합인 집합 E1과 집합 E2의 합집합, 즉 집합 E를 훈련 집합으로 사용하였다.
GC Sex Age
year
CEA
ng/mL
Stage
GC-E50 M 32 - I
GC-E51 M 71 3.54 I
GC-E52 M 56 2.83 I
GC-E53 F 40 - I
GC-E54 M 62 - I
GC-E55 M 79 - I
GC-E56 M 81 - I
GC-E57 M 52 - I
GC-E58 M 53 - I
GC-E59 M 72 - II
GC-E60 F 49 - II
GC-E61 M 69 - II
GC-E62 M 72 - II
GC-E63 F 49 - II
GC-E64 M 62 - II
GC-E65 M 67 - II
GC-E66 F 64 - II
GC-E67 F 40 - II
GC-E68 M 53 1 III
GC-E69 M 42 0.69 III
GC-E70 M 81 - III
GC-E71 M 70 1.26 III
GC-E72 F 81 - III
GC-E73 F 36 - III
GC-E74 M 46 - III
GC-E75 M 62 - III
GC-E76 M 51 - III
GC-E77 F 42 <0.4 IV
GC-E78 M 49 104.73 IV
GC-E79 M 65 1.69 IV
GC-E80 F 57 6.98 IV
GC-E81 M 55 2.03 IV
GC-E82 F 51 0.51 IV
GC-E83 M 63 27.18 IV
GC-E84 M 51 1.93 IV
GC-E85 M 64 2.41 IV
GC-E86 M 62 2.72 IV
GC-E87 F 40 0.64 IV
GC-E88 M 66 11.68 IV
GC-E89 M 51 5.6 IV
GC-E90 M 66 1.22 IV
GC-E91 M 70 - IV
GC-E92 F 71 - IV
GC-E93 F 52 - IV
GC-E94 M 68 - IV
GC-E95 M 68 - IV
GC-E96 F 33 - IV
GC-E97 M 31 - IV
Control Sex Age
year
CEA
ng/mL
CONT-E85 F 67 1.5
CONT-E86 F 45 0.6
CONT-E87 M 30 1
CONT-E88 M 55 1.2
CONT-E89 M 54 2.1
CONT-E90 M 69 2.8
CONT-E91 M 53 1.8
CONT-E92 F 47 1.7
CONT-E93 M 53 3.2
CONT-E94 F 49 1.4
CONT-E95 M 62 1.7
CONT-E96 M 31 2.3
CONT-E97 M 40 0.8
CONT-E98 F 49 1.4
CONT-E99 F 33 1.7
CONT-E100 M 51 3.4
CONT-E101 M 52 2
CONT-E102 F 66 1.3
CONT-E103 F 65 1.4
CONT-E104 M 50 1.4
CONT-E105 M 54 1.3
CONT-E106 M 68 1.6
CONT-E107 M 59 2.5
CONT-E108 F 51 2.1
CONT-E109 F 39 0.8
CONT-E110 F 50 1.9
CONT-E111 F 64 2.9
CONT-E112 F 52 1.9
CONT-E113 F 37 2.1
CONT-E114 F 49 2.6
CONT-E115 F 30 <0.5
CONT-E116 F 49 2.1
CONT-E117 F 38 0.6
CONT-E118 F 59 1.6
CONT-E119 F 41 1.8
CONT-E120 F 48 1.2
CONT-E121 F 39 0.5
CONT-E122 F 51 1.1
CONT-E123 F 44 1.5
CONT-E124 F 38 1.5
CONT-E125 F 48 1.9
CONT-E126 F 70 4.8
CONT-E127 F 38 2.8
CONT-E128 F 50 1.1
CONT-E129 F 54 1.8
CONT-E130 F 58 3.1
CONT-E131 M 65 2.8
CONT-E132 M 66 0.8
CONT-E133 F 54 1.6
CONT-E134 M 50 1.9
CONT-E135 F 60 1.1
CONT-E136 F 55 8.8
CONT-E137 M 62 0.9
CONT-E138 M 65 2.3
CONT-E139 M 52 2.4
CONT-E140 F 64 1.7
CONT-E141 M 57 0.8
CONT-E142 F 54 <0.5
CONT-E143 F 59 0.8
CONT-E144 F 65 1.6
CONT-E145 F 68 1.6
CONT-E146 F 51 1.7
CONT-E147 F 62 1.3
CONT-E148 F 63 1.6
CONT-E149 F 60 1.9
CONT-E150 F 68 1.4
CONT-E151 F 62 1.9
CONT-E152 F 68 5.6
CONT-E153 M 63 4.5
CONT-E154 M 50 2.1
CONT-E155 F 53 2.3
CONT-E156 M 60 3.3
CONT-E157 M 64 1.8
CONT-E158 F 63 1.1
CONT-E159 M 53 2
CONT-E160 F 51 2
CONT-E161 F 42 -
CONT-E162 M 41 -
CONT-E163 M 40 -
CONT-E164 M 51 -
CONT-E165 F 59 -
CONT-E166 F 57 -
CONT-E167 M 47 -
CRC Sex Age
year
Stage Location Cell Type CEA
ng/mL
CRC-E78 M 50 I S-colon AC 2.5
CRC-E79 M 56 I S-colon AC 7.3
CRC-E80 M 61 I Rectum AC 7.7
CRC-E81 F 78 I Rectum AC 2.6
CRC-E82 M 64 I S-colon AC 1.8
CRC-E83 F 50 I Rectum AC 1.6
CRC-E84 F 59 I Rectum AC 1.6
CRC-E85 M 71 I Rectum AC 83.7
CRC-E86 M 59 I S-colon AC 3
CRC-E87 M 64 I Rectum AC 2.5
CRC-E88 M 49 I Rectum AC 6.6
CRC-E89 F 65 II S-colon AC 2.1
CRC-E90 M 77 II A-colon AC 1.5
CRC-E91 M 71 II D-colon AC 4.1
CRC-E92 F 66 II Rectum AC 4.3
CRC-E93 F 49 II A-colon AC 1.6
CRC-E94 F 79 II A-colon AC 2.9
CRC-E95 M 69 II S-colon AC 4.2
CRC-E96 M 66 II S-colon AC 12
CRC-E97 M 74 II A-colon AC 1.5
CRC-E98 M 69 II T-colon AC 1.2
CRC-E99 M 43 II S-colon AC 2.2
CRC-E100 F 67 II A-colon AC 1.4
CRC-E101 M 72 II A-colon AC 4.9
CRC-E102 F 69 II S-colon, A-colon AC 5.1
CRC-E103 M 39 II S-colon AC 2.9
CRC-E104 M 54 II Rectum AC 4.6
CRC-E105 M 58 II S-colon AC 2.9
CRC-E106 M 65 II S-colon AC 1.7
CRC-E107 F 52 II S-colon AC <0.5
CRC-E108 F 76 II S-colon AC 2.2
CRC-E109 M 51 II S-colon ASC 8.6
CRC-E110 F 79 III Rectum AC 14.1
CRC-E111 F 44 III S-colon AC 1.4
CRC-E112 M 66 III Rectum AC 1.2
CRC-E113 M 53 III A-colon AC 4.2
CRC-E114 M 64 III T-colon AC 1.8
CRC-E115 F 42 III S-colon AC 0.8
CRC-E116 M 49 III Rectum AC 2.7
CRC-E117 M 68 III Rectum AC 3.9
CRC-E118 M 51 III S-colon AC 5.2
CRC-E119 M 64 III Rectum AC 7.7
CRC-E120 M 42 III S-colon AC 2.8
CRC-E121 F 43 III A-colon AC 4.7
CRC-E122 M 66 III S-colon AC 9.1
CRC-E123 M 37 III Rectum AC 3.7
CRC-E124 F 81 III Rectum AC 8.4
CRC-E125 F 73 III S-colon AC 1.7
CRC-E126 M 54 III Rectum AC 6.4
CRC-E127 F 58 III Rectum AC 21.3
CRC-E128 F 42 III Rectum AC 0.7
CRC-E129 M 62 III S-colon AC 10.8
CRC-E130 F 60 III S-colon, A-colon AC 28.5
CRC-E131 F 73 III Rectum AC 3.7
CRC-E132 F 54 III D-colon AC 1122.2
CRC-E133 F 60 III A-colon AC 30.4
CRC-E134 M 43 III A-colon MAC 77.6
CRC-E135 F 69 III Rectum AC 1
CRC-E136 M 72 III A-colon AC 2.4
CRC-E137 F 52 III S-colon AC 9.2
CRC-E138 M 52 III S-colon AC 3.2
CRC-E139 F 55 III Rectum AC 0.9
CRC-E140 M 77 III S-colon AC 2.5
CRC-E141 F 47 III S-colon AC 1.5
CRC-E142 M 48 III S-colon AC 1.7
CRC-E143 F 72 IV A-colon AC 73.4
CRC-E144 F 69 IV A-colon AC 49
CRC-E145 M 75 IV S-colon AC 16.7
CRC-E146 M 72 IV Rectum SC 8.2
CRC-E147 M 73 IV Rectum AC 52.2
CRC-E148 M 54 IV A-colon AC 2
CRC-E149 M 67 IV Rectum AC 16.2
CRC-E150 F 66 IV S-colon AC 18.5
CRC-E151 F 78 IV A-colon AC 12.6
CRC-E152 F 54 IV S-colon AC 27.9
CRC-E153 M 70 II Rectum AC 1.3
CRC-E154 M 55 II Rectum AC 22
CRC-E155 M 62 II Rectum AC 6.1
CRC-E156 M 64 III Rectum AC 4.8
CRC-E157 M 62 IV Rectum AC 25.3
CRC-E158 M 51 III Rectum AC 149.3
CRC-E159 F 45 II Rectum AC 2.7
CRC-E160 F 49 II Rectum AC 2.1
CRC-E161 F 45 0 Rectum AC 0.9
CRC-E162 M 62 III Rectum AC 2.4
CRC-E163 M 54 0 Rectum AC 6.9
CRC-E164 M 45 0 Rectum AC 7.4
CRC-E165 F 54 0 Rectum AC 3.6
CRC-E166 M 69 II Rectum AC 24
CRC-E167 M 51 I Rectum AC 2.7
CRC-E168 M 45 I Rectum AC 3.2
CRC-E169 M 67 I Rectum AC 2.9
CRC-E170 M 60 I Rectum AC 1.5
CRC-E171 M 49 0 Rectum AC 0.8
CRC-E172 M 71 I Rectum AC 9.8
CRC-E173 M 62 III Rectum AC 2.5
CRC-E174 M 54 II Rectum AC 4.6
CRC-E175 M 56 II Rectum AC 3
CRC-E176 F 71 III Rectum AC 6.7
CRC-E177 M 73 0 Rectum AC 61.5
CRC-E178 F 50 III Rectum AC 2.2
CRC-E179 F 49 0 Rectum AC 1.6
CRC-E180 F 42 III Rectum AC 9.9
CRC-E181 M 61 III Rectum AC 68.1
CRC-E182 F 72 II Rectum AC 8
CRC-E183 F 69 III Rectum AC 11.3
CRC-E184 M 58 II Rectum AC 5.3
CRC-E185 M 56 I Rectum AC 24.8
CRC-E186 M 72 III Rectum AC 1.4
CRC-E187 M 62 III Rectum AC 1.6
CRC-E188 M 55 II Rectum AC 2.4
CRC-E189 F 71 III Rectum AC 1.3
CRC-E190 M 59 III Rectum AC 2.8
CRC-E191 M 52 II Rectum AC 4
CRC-E192 M 47 III Rectum AC 2.3
CRC-E193 M 58 II Rectum AC 1.1
CRC-E194 M 60 0 Rectum AC 2
CRC-E195 M 64 I Rectum AC 2
CRC-E196 M 41 III Rectum AC 1.6
CRC-E197 M 48 I Rectum AC 0.8
CRC-E198 M 58 II Rectum AC 1.1
CRC-E199 M 61 I Rectum AC 2.6
CRC-E200 M 63 I Rectum AC 1.3
CRC-E201 F 52 II Rectum AC 1.6
CRC-E202 M 53 II Rectum AC 2
CRC-E203 M 64 I Rectum AC 2
CRC-E204 M 73 II Rectum AC 5.6
CRC-E205 M 41 III Rectum AC 1.6
CRC-E206 M 57 III Rectum AC 2
CRC-E207 M 48 I Rectum AC 0.8
CRC-E208 M 72 III Rectum AC 6.1
CRC-E209 F 67 0 Rectum AC 4.4
CRC-E210 F 66 II Rectum AC 4.8
CRC-E211 M 47 III S-colon AC 3.7
CRC-E212 M 40 III A-colon AC 1.2
CRC-E213 M 55 II D-colon AC 6
CRC-E214 F 73 I D-colon, T-colon AC 2
CRC-E215 F 69 I A-colon AC 5
CRC-E216 F 69 I A-colon AC 5.7
CRC-E217 F 74 II D-colon AC 12.5
CRC-E218 M 61 II S-colon MAC 1.9
CRC-E219 M 37 III Rectum AC 6
CRC-E220 M 60 III S-colon AC 5.4
CRC-E221 M 70 II S-colon AC 2.6
CRC-E222 M 68 III Rectum AC 13.2
CRC-E223 M 73 I Rectum AC 1.7
CRC-E224 M 82 III T-colon AC 2.1
CRC-E225 F 75 II Rectum AC 0.9
CRC-E226 F 57 I A-colon AC 1.5
CRC-E227 F 62 III S-colon AC 4.4
CRC-E228 M 73 II Rectum AC 15.5
CRC-E229 M 59 I S-colon AC 1.1
CRC-E230 F 74 III Rectum AC 31
CRC-E231 F 70 I A-colon AC 2.5
CRC-E232 M 74 II S-colon AC 15.4
CRC-E233 M 69 II Rectum AC 2.1
CRC-E234 M 61 II A-colon, T-colon AC 2.3
CRC-E235 M 73 I Rectum AC 1.9
CRC-E236 M 64 I Rectum AC 2.8
CRC-E237 M 69 II D-colon AC 5
CRC-E238 M 58 III Rectum AC 1.6
CRC-E239 M 73 II T-colon AC 2.6
CRC-E240 M 70 II A-colon AC 20.8
CRC-E241 M 56 IV Rectum AC 29.9
CRC-E242 F 70 II A-colon AC 5.9
CRC-E243 M 71 III S-colon AC 110.1
CRC-E244 M 47 III Rectum AC 13.7
CRC-E245 M 61 III Rectum AC 2.8
CRC-E246 F 77 II S-colon AC 1.5
CRC-E247 F 62 III Rectum AC 13.7
CRC-E248 M 61 II S-colon AC 2.3
CRC-E249 M 66 II S-colon AC 1.7
CRC-E250 M 64 III A-colon AC 1
CRC-E251 M 69 II S-colon AC 23
CRC-E252 M 66 0 Rectum AC 58.4
ASC: Adenosquamous carcinoma
BRC Sex Age
year
Node ER ER% PR PR% HER2 Tumor Size cm
BRC-E55 F 44 pN0 6 33-66% 7 >66% 1 1.2
BRC-E56 F 72 pN0(sn) 0 0% 0 0% 0 1.8
BRC-E57 F 48 pN0(sn) 5 33-66% 4 10-33% 1 0.8
BRC-E58 F 44 pN0 5 33-66% 7 >66% 1 2
BRC-E59 F 41 pN2a 5 33-66% 6 33-66% 1 4
BRC-E60 F 58 pN0 6 33-66% 0 0% 2 <0.1
BRC-E61 F 42 - 5 33-66% 6 33-66% 2 -
BRC-E62 F 44 pN1a 4 10-33% 2 <10% 2 5.5
BRC-E63 F 62 pN0(sn) 7 >66% 0 0% 0 2
BRC-E64 F 47 pN0 6 33-66% 6 33-66% 2 2.4
BRC-E65 F 52 pN1a 6 33-66% 0 0% 3 1.8
BRC-E66 F 44 pN0(sn) 6 33-66% 0 0% 0 2
BRC-E67 F 49 pN0(sn) 2 <10% 2 <10% 3 0.4
BRC-E68 F 46 pN0(sn) 6 33-66% 5 33-66% 1 0.7
BRC-E69 F 58 pN0(sn) 7 >66% 5 33-66% 1 2.3
BRC-E70 F 64 pN1a 6 33-66% 7 >66% 1 2
BRC-E71 F 47 - 6 33-66% 6 33-66% 2 -
BRC-E72 F 74 pN1a 6 33-66% 6 33-66% 1 1.8
BRC-E73 F 64 pN0(sn) 0 0% 0 0% 1 2.2
BRC-E74 F 40 ypN1a 6 33-66% 6 33-66% 1 3.5
BRC-E75 F 43 pN0 6 33-66% 6 33-66% 2 2.5
BRC-E76 F 43 ypN0 0 0% 0 0% 2 -
BRC-E77 F 42 pN0 0 0% 0 0% 0 2.3
BRC-E78 F 37 pN0(i+) 6 33-66% 6 33-66% 1 1
BRC-E79 F 50 pN1a 6 33-66% 6 33-66% 1 1
BRC-E80 F 57 pN0(sn) 6 33-66% 96 33-66% 1 1.4
BRC-E81 F 38 ypN0 0 0% 0 0% 1 2
BRC-E82 F 67 - 6 33-66% 2 <10% 1 -
BRC-E83 F 42 pN0(sn) 6 33-66% 6 33-66% 2 0.5
BRC-E84 F 46 pN0(sn) 6 33-66% 6 33-66% 1 1
BRC-E85 F 48 pN2a 4 10-33% 4 10-33% 3 2.5
BRC-E86 F 58 pN0 2 <10% 0 0 1 0.5
BRC-E87 F 53 pN0(sn) 0 0% 0 0% 3 <0.1
BRC-E88 F 56 - 0 0% 0 0% 0 -
BRC-E89 F 45 pN0(sn) 6 33-66% 6 33-66% 2 <0.1
BRC-E90 F 59 pN0(sn) 5 33-66% 0 0% 2 1.4
BRC-E91 F 40 ypN1a 2 <10% 0 0% 0 0.3
BRC-E92 F 39 pN1 7 >95% 3 <10% 0 2.2
BRC-E93 F 54 pN0(i+) 7 95% 5 10-30% 1 1.7
BRC-E94 F 48 pN3a 7 90% 8 90% 0 3.2
BRC-E95 F 54 pN0 0 0% 0 0% 0 3
BRC-E96 F 43 pN0 7 50-60% 7 50-60% 3 2.3
BRC-E97 F 61 pN0 8 95% 8 95% 0 1.6
BRC-E98 F 54 - 0 0% 0 0% 3 -
BRC-E99 F 46 pN0 7 80% 8 95% 0 2.2
BRC-E100 F 61 pN0(i+0) 7 >95% 0 0% 0 4
BRC-E101 F 53 pN0 7 80% 5 25% 0 0.6
BRC-E102 F 49 pN0 3 20% 7 60% 0 0.3
BRC-E103 F 57 pN0 0 0% 0 0% 0 0.8
BRC-E104 F 68 pN0 0 0% 3 1% 3 1.2
BRC-E105 F 58 pN0 8 95% 4 40% 0 0.8
BRC-E106 F 40 - 8 95% 8 95% 0 -
BRC-E107 F 29 pN0 8 95% 8 95% 1 1.2
BRC-E108 F 40 - - - - - - -
NHL Sex Age
year
Stage Involved Site Subtype IPI
NHL-E25 F 56 1 breast DLBL 0
NHL-E26 F 38 1 stomach DLBL 0
NHL-E27 F 73 1 nasal cavity DLBL 2
NHL-E28 F 48 1 breast DLBL 1
NHL-E29 F 72 1 stomach DLBL 2
NHL-E30 M 44 2 cervical LN, tonsil DLBL 0
NHL-E31 F 38 2 tonsil, neck LN DLBL 0
NHL-E32 M 70 2 neck area LN DLBL 1
NHL-E33 M 80 2 stomach PTCL 1
NHL-E34 F 61 2 stomach DLBL 3
NHL-E35 F 76 2 stomach DLBL 1
NHL-E36 M 67 3 multiple Burkitt's L 3
NHL-E37 F 73 3 multiple DLBL 2
NHL-E38 M 49 3 multiple DLBL 3
NHL-E39 F 69 3 multiple ATCL 3
NHL-E40 M 71 4 multiple Mantle cell L 3
NHL-E41 F 38 4 multiple DLBL 3
NHL-E42 F 70 4 multiple DLBL 3
NHL-E43 M 25 4 multiple NK/T cell L 3
NHL-E44 M 48 4 multiple DLBL 3
NHL-E45 M 67 4 multiple MZBCL 2
NHL-E46 M 24 4 multiple DLBL 3
또한, 집합 E와 독립된 표 13의 44명의 GC 환자군, 표 14의 81명의 정상 대조군, 표 15의 168명의 CRC 환자군, 표 16의 53명의 BRC 환자군, 표 17의 20명의 NHL 환자군, 표 18의 25명의 난소암(ovarian cancer, OVC) 환자군을 집합 F로 하여 검증 집합을 구성하였다. OVC 환자군은 질량 이온별 가중치를 구할 때나 GC 진단용 저질량 이온을 확인할 때 전혀 반영되지 않은 환자군으로, 본 발명에서 구성한 판별식으로 이 환자군이 어떻게 판별되는지 살펴보기 위하여 포함하였다.
GC Sex Age
year
CEA
ng/mL
Stage GC Sex Age
year
CEA
ng/mL
Stage
GC-F1 F 62 - I GC-F23 M 81 - III
GC-F2 M 52 1.86 I GC-F24 F 81 - III
GC-F3 F 64 4.16 I GC-F25 M 70 - III
GC-F4 M 67 - I GC-F26 M 51 - III
GC-F5 M 61 - I GC-F27 M 71 8.46 IV
GC-F6 F 77 - I GC-F28 M 46 2.67 IV
GC-F7 F 74 - I GC-F29 M 68 24.93 IV
GC-F8 F 81 - I GC-F30 M 68 3.23 IV
GC-F9 F 55 - I GC-F31 M 57 41.32 IV
GC-F10 M 69 21.71 II GC-F32 M 71 2.8 IV
GC-F11 M 59 - II GC-F33 F 43 1.62 IV
GC-F12 M 64 - II GC-F34 M 58 6.6 IV
GC-F13 M 68 - II GC-F35 M 73 - IV
GC-F14 M 54 - II GC-F36 M 61 10.41 IV
GC-F15 F 52 - II GC-F37 M 66 - IV
GC-F16 M 59 - II GC-F38 F 57 2.46 IV
GC-F17 F 81 - II GC-F39 M 52 - IV
GC-F18 F 68 5.56 III GC-F40 M 59 - IV
GC-F19 M 48 1.44 III GC-F41 M 56 - IV
GC-F20 F 80 - III GC-F42 M 82 - IV
GC-F21 M 46 1.68 III GC-F43 F 52 - IV
GC-F22 M 42 - III GC-F44 M 82 - IV
Control Sex Age
year
CEA
ng/mL
Control Sex Age
year
CEA
ng/mL
CONT-F1 M 49 1.2 CONT-F42 M 51 -
CONT-F2 F 38 0.9 CONT-F43 F 52 -
CONT-F3 F 44 - CONT-F44 F 52 -
CONT-F4 M 52 - CONT-F45 M 57 3.3
CONT-F5 F 45 - CONT-F46 M 61 2.8
CONT-F6 F 54 - CONT-F47 F 68 1.4
CONT-F7 F 51 3.1 CONT-F48 F 52 1.5
CONT-F8 M 54 6.4 CONT-F49 M 60 4.6
CONT-F9 M 46 1.1 CONT-F50 M 55 2.2
CONT-F10 M 47 1.8 CONT-F51 M 55 1.8
CONT-F11 M 49 1.7 CONT-F52 M 56 2.2
CONT-F12 F 55 <0.5 CONT-F53 F 63 1.8
CONT-F13 M 46 3.7 CONT-F54 F 65 1.1
CONT-F14 F 46 <0.5 CONT-F55 F 55 4.8
CONT-F15 M 34 1.7 CONT-F56 M 63 2.6
CONT-F16 M 53 2.9 CONT-F57 F 52 4.1
CONT-F17 M 45 3.7 CONT-F58 M 51 4
CONT-F18 M 47 4.5 CONT-F59 M 59 2
CONT-F19 F 34 0.6 CONT-F60 M 68 4.6
CONT-F20 F 58 1.5 CONT-F61 M 50 5
CONT-F21 F 54 - CONT-F62 F 64 <0.5
CONT-F22 M 35 1.8 CONT-F63 F 63 2.2
CONT-F23 M 49 1.4 CONT-F64 M 64 1.7
CONT-F24 M 48 3.2 CONT-F65 M 51 2.3
CONT-F25 F 34 <0.5 CONT-F66 F 62 1.1
CONT-F26 M 45 4.4 CONT-F67 M 54 2.5
CONT-F27 M 52 - CONT-F68 F 53 0.7
CONT-F28 F 44 - CONT-F69 F 65 3.8
CONT-F29 M 58 - CONT-F70 F 64 1.5
CONT-F30 M 45 4.3 CONT-F71 F 53 1
CONT-F31 M 61 1.4 CONT-F72 M 50 1.1
CONT-F32 M 42 2.7 CONT-F73 F 66 1.7
CONT-F33 M 48 3 CONT-F74 F 50 1.9
CONT-F34 M 53 1.9 CONT-F75 M 61 1.5
CONT-F35 F 54 2.3 CONT-F76 M 81 -
CONT-F36 F 39 1.3 CONT-F77 F 53 -
CONT-F37 F 55 1.3 CONT-F78 M 75 -
CONT-F38 M 53 - CONT-F79 F 44 -
CONT-F39 F 45 - CONT-F80 M 42 -
CONT-F40 F 63 - CONT-F81 M 62 -
CONT-F41 F 51 -
CRC Sex Age
year
Stage Location Cell Type CEA
ng/mL
CRC-F1 M 73 I Rectum AC 1.9
CRC-F2 M 65 I S-colon AC 14
CRC-F3 M 72 I S-colon AC 4.6
CRC-F4 M 82 I Rectum AC 3.2
CRC-F5 M 77 I D-colon AC 6.4
CRC-F6 M 78 I Rectum AC 2.7
CRC-F7 F 46 I S-colon AC 1.4
CRC-F8 M 61 I Rectum AC 1.4
CRC-F9 M 43 I Rectum AC 0.5
CRC-F10 M 53 I Rectum AC 3.5
CRC-F11 F 67 II A-colon AC 7.3
CRC-F12 F 75 II Rectum AC 12.6
CRC-F13 M 68 II D-colon AC 4.7
CRC-F14 F 60 II S-colon AC 3.3
CRC-F15 M 74 II S-colon AC 9
CRC-F16 M 63 II D-colon AC 4.9
CRC-F17 F 66 II S-colon AC 4.2
CRC-F18 M 48 II Rectum AC 28.4
CRC-F19 M 68 II S-colon AC 2.3
CRC-F20 M 48 II S-colon AC 4.8
CRC-F21 F 81 II S-colon AC 2.4
CRC-F22 M 56 II A-colon AC 34.6
CRC-F23 M 56 II Rectum AC 3
CRC-F24 F 77 II Rectum AC 6.2
CRC-F25 M 44 II T-colon AC 1.8
CRC-F26 F 82 II A-colon AC 2.8
CRC-F27 M 67 II A-colon AC 20.1
CRC-F28 M 72 II A-colon AC 3.4
CRC-F29 M 59 II S-colon AC 2.1
CRC-F30 F 50 III D-colon AC 6.4
CRC-F31 M 56 III S-colon AC 7.3
CRC-F32 F 58 III S-colon AC 2.1
CRC-F33 M 71 III Rectum AC 16.5
CRC-F34 M 66 III S-colon AC 689.8
CRC-F35 M 65 III D-colon AC 3.4
CRC-F36 F 65 III S-colon MAC 2.7
CRC-F37 F 51 III Rectum AC 1.4
CRC-F38 M 58 III S-colon AC 2.8
CRC-F39 F 48 III A-colon AC 0.9
CRC-F40 M 71 III S-colon AC 6
CRC-F41 M 68 III A-colon AC 2.7
CRC-F42 F 54 III A-colon AC 1.7
CRC-F43 F 49 III S-colon AC 1
CRC-F44 F 63 III A-colon AC 58.2
CRC-F45 M 74 III A-colon AC 2.8
CRC-F46 F 54 III T-colon AC 2.2
CRC-F47 M 68 III Rectum AC 22.5
CRC-F48 M 66 III Rectum MAC 1.2
CRC-F49 F 70 III S-colon MAC 36
CRC-F50 M 64 III A-colon AC 2.2
CRC-F51 F 54 III Rectum AC 5.5
CRC-F52 M 53 III Rectum AC 1.4
CRC-F53 M 81 III A-colon MAC 10.9
CRC-F54 F 52 III A-colon AC 1.2
CRC-F55 F 71 III A-colon AC 2.8
CRC-F56 M 84 III Rectum AC 15
CRC-F57 F 33 III D-colon AC 4.7
CRC-F58 F 68 III Rectum AC 3.3
CRC-F59 M 69 III Rectum AC 3.5
CRC-F60 F 61 III A-colon AC 2.8
CRC-F61 M 73 III Rectum AC 11.1
CRC-F62 M 64 III D-colon AC 8.2
CRC-F63 F 54 IV S-colon AC 29.8
CRC-F64 M 43 IV Rectum AC 36.4
CRC-F65 F 52 IV A-colon MAC 9
CRC-F66 M 48 IV S-colon AC 15.9
CRC-F67 M 62 IV Rectum AC 6.3
CRC-F68 M 69 IV A-colon AC 33.5
CRC-F69 M 78 IV Rectum AC 4.1
CRC-F70 M 38 IV Rectum AC 2.1
CRC-F71 M 74 II Rectum AC 7.9
CRC-F72 F 59 III Rectum AC 1.4
CRC-F73 M 56 I Rectum AC 2.6
CRC-F74 M 69 II Rectum AC 14
CRC-F75 M 58 II Rectum AC 10.2
CRC-F76 F 75 II Rectum AC 2.4
CRC-F77 M 47 II Rectum AC 3.2
CRC-F78 F 68 II Rectum AC 0.7
CRC-F79 M 52 III Rectum AC 2.9
CRC-F80 M 68 I Rectum AC 7
CRC-F81 M 51 II Rectum AC 1.4
CRC-F82 M 66 0 Rectum AC 1.2
CRC-F83 M 74 0 Rectum AC 4.5
CRC-F84 M 43 II Rectum AC 12.3
CRC-F85 M 68 III Rectum AC 2.5
CRC-F86 M 68 III Rectum AC 19.4
CRC-F87 F 56 I Rectum AC 2.3
CRC-F88 M 63 0 Rectum AC 1.3
CRC-F89 M 65 II Rectum AC 2.1
CRC-F90 M 60 II Rectum AC 4.6
CRC-F91 M 51 II Rectum AC 1.3
CRC-F92 M 44 0 Rectum AC 2.2
CRC-F93 M 61 II Rectum AC 2
CRC-F94 M 57 III Rectum AC 2.2
CRC-F95 M 41 II Rectum AC 3.1
CRC-F96 M 50 I Rectum AC 4.9
CRC-F97 F 56 III Rectum AC 1
CRC-F98 M 54 III Rectum AC 1.7
CRC-F99 F 69 I Rectum AC 1.5
CRC-F100 M 54 I Rectum AC 2.6
CRC-F101 M 61 II Rectum AC 3.7
CRC-F102 M 72 III Rectum AC 3
CRC-F103 F 71 III Rectum AC 1.8
CRC-F104 M 54 II Rectum AC 3
CRC-F105 M 77 II Rectum AC 1.6
CRC-F106 M 67 III Rectum AC 1.1
CRC-F107 M 59 II Rectum AC 7.2
CRC-F108 M 56 III Rectum AC 9
CRC-F109 F 51 I Rectum AC 1.5
CRC-F110 F 67 III Rectum AC 3.4
CRC-F111 F 76 III Rectum AC 1
CRC-F112 F 38 III Rectum AC 0.7
CRC-F113 M 53 II Rectum AC 3.3
CRC-F114 M 58 III Rectum AC 1.6
CRC-F115 M 69 III Rectum AC 6.4
CRC-F116 F 60 I Rectum AC 1.2
CRC-F117 M 52 II Rectum AC 4
CRC-F118 M 59 III Rectum AC 2.8
CRC-F119 F 56 III Rectum AC 2.3
CRC-F120 F 68 I Rectum AC 2
CRC-F121 M 65 I Rectum AC 1.6
CRC-F122 M 33 II Rectum AC 1.9
CRC-F123 M 61 III Rectum AC 3.2
CRC-F124 F 41 III Rectum AC 1.5
CRC-F125 M 61 I Rectum AC 1.6
CRC-F126 F 34 III Rectum AC 5.2
CRC-F127 M 47 III Rectum AC 2.3
CRC-F128 F 61 III A-colon AC 30.4
CRC-F129 M 71 IV A-colon AC 33.5
CRC-F130 M 44 III A-colon MAC 77.6
CRC-F131 F 71 III Rectum AC 1
CRC-F132 M 59 II S-colon AC 2.9
CRC-F133 M 79 IV Rectum AC 4.1
CRC-F134 M 66 II S-colon AC 1.7
CRC-F135 M 78 III S-colon AC 2.5
CRC-F136 F 53 II S-colon AC 1.3
CRC-F137 M 50 III S-colon AC 1.7
CRC-F138 F 77 II S-colon AC 2.2
CRC-F139 M 53 II S-colon ASC 8.6
CRC-F140 M 63 I Rectum AC 1.4
CRC-F141 F 71 III S-colon MAC 36
CRC-F142 F 79 II Rectum AC 6.2
CRC-F143 M 83 III A-colon MAC 10.9
CRC-F144 F 53 III A-colon AC 1.2
CRC-F145 F 72 III A-colon AC 2.8
CRC-F146 F 34 III D-colon AC 4.7
CRC-F147 M 70 III Rectum AC 3.5
CRC-F148 F 62 III A-colon AC 2.8
CRC-F149 M 45 II T-colon AC 1.8
CRC-F150 F 84 II A-colon AC 2.8
CRC-F151 M 74 III Rectum AC 11.1
CRC-F152 M 65 III D-colon AC 8.2
CRC-F153 M 69 II A-colon AC 20.1
CRC-F154 M 73 II A-colon AC 2.3
CRC-F155 M 61 II S-colon AC 2.1
CRC-F156 F 71 II S-colon AC 15.3
CRC-F157 F 56 I S-colon AC 0.7
CRC-F158 F 70 II S-colon AC 1.4
CRC-F159 F 62 III Rectum AC 235.4
CRC-F160 M 61 III S-colon AC 11.2
CRC-F161 F 52 III S-colon AC 6.4
CRC-F162 M 62 II S-colon AC 4.9
CRC-F163 F 61 III T-colon AC 13.9
CRC-F164 F 88 II A-colon AC 3
CRC-F165 M 73 II S-colon AC 16.5
CRC-F166 M 69 III A-colon AC 1.7
CRC-F167 M 71 III A-colon MAC 2.4
CRC-F168 F 45 0 Rectum AC -
BRC Sex Age
year
Node ER ER% PR PR% HER2 Tumor Size cm
BRC-F1 F 34 pN0(sn) 2 <10% 0 0% 2 2
BRC-F2 F 69 - 6 33-66% 6 33-66% 1 -
BRC-F3 F 52 - - - - - - -
BRC-F4 F 67 - - - - - - -
BRC-F5 F 61 - 6 33-66% 2 <10% 0 -
BRC-F6 F 38 pN1a 6 33-66% 5 33-66% 1 -
BRC-F7 F 60 pN0 6 33-66% 3 10-33% 1 1
BRC-F8 F 55 pN2a 5 33-66% 0 0% 2 2.2
BRC-F9 F 46 ypN0 5 33-66% 2 <10% 1 1.5
BRC-F10 F 67 pN0 6 33-66% 6 33-66% 1 2.8
BRC-F11 F 46 pN1a 6 33-66% 6 33-66% 2 0.7
BRC-F12 F 39 pN1mi 6 33-66% 6 33-66% 2 2.5
BRC-F13 F 50 pN0(sn) 4 10-33% 5 33-66% 0 1
BRC-F14 F 31 pN1mi(sn) 6 33-66% 6 33-66% 1 1
BRC-F15 F 46 pN0 6 33-66% 7 >66% 1 1.2
BRC-F16 F 44 pN0(sn) 6 33-66% 7 >66% 1 2.5
BRC-F17 F 40 pN0 0 0% 0 0% 0 -
BRC-F18 F 40 - 6 33-66% 6 33-66% 1 -
BRC-F19 F 56 - 7 >66% 0 0 0 0.6
BRC-F20 F 48 pN1a 0 0% 0 0% 0 3
BRC-F21 F 39 pN0(sn) 6 33-66% 6 33-66% 1 3.5
BRC-F22 F 40 ypN1a 6 33-66% 4 10-33% 2 3
BRC-F23 F 48 pN0(sn) 6 33-66% 6 33-66% 0 2.5
BRC-F24 F 59 - 7 >66% 2 <10% 1 -
BRC-F25 F 46 - 0 0% 0 0% 2 -
BRC-F26 F 37 pN3a 6 33-66% 6 33-66% 2 0.6
BRC-F27 F 38 pN0(sn) 6 33-66% 6 33-66% 2 0.3
BRC-F28 F 66 pN1a 6 33-66% 6 33-66% 0 1.5
BRC-F29 F 58 pN0(sn) 0 0% 0 0% 2 1.7
BRC-F30 F 42 pN3a 5 33-66% 6 33-66% 0 1.8
BRC-F31 F 52 pN0 6 33-66% 6 33-66% 0 0.7
BRC-F32 F 46 pN0(sn) 0 0% 2 <10% 1 1.5
BRC-F33 F 42 pN0(sn) 4 10-33% 6 33-66% 1 0.6
BRC-F34 F 48 - - - - - - -
BRC-F35 F 47 pN0 6 33-66% 2 <10% 2 3
BRC-F36 F 59 pN1a 6 33-66% 4 10-33% 1 1.8
BRC-F37 F 56 - 0 0% 0 0% 3 -
BRC-F38 F 61 pN0(i+0) 7 >95% 0 0% 0 4
BRC-F39 F 40 - 8 95% 8 95% 0 -
BRC-F40 F 43 pN0 0 0% 0 0% 3 0.7
BRC-F41 F 59 pN0 8 95% 8 95% 0 1.2
BRC-F42 F 45 PN2 7 95% 8 95% 1 2.1
BRC-F43 F 55 pN0 0 0% 0 0% 3 1.8
BRC-F44 F 52 pN0 7 80-90% 8 80-90% 0 0.3
BRC-F45 F 59 pN0 8 95% 5 2~3% 1 1.3
BRC-F46 F 39 - 7 >95% 7 70-80% 0 -
BRC-F47 F 39 pN0 0 0% 0 0% 3 1.1
BRC-F48 F 40 pN0 5 50-60% 5 20-30% 0 0.8
BRC-F49 F 46 pN0 7 95% 8 95% 0 4.9
BRC-F50 F 51 pN0 0 <1% 0 0% 0 0.9
BRC-F51 F 61 pN0 7 90% 8 90% 0 1.3
BRC-F52 F 48 pN0 0 0% 0 0% 0 0.6
BRC-F53 F 47 pN0 8 >95% 8 95% 0 0.7
NHL Sex Age
year
Stage Involved Site Subtype IPI
NHL-F1 F 41 1 0 DLBL 0
NHL-F2 M 73 1 nasal cavity DLBL 1
NHL-F3 M 79 1 nasal cavity malignant L 2
NHL-F4 M 37 1 cervical LN DLBL 0
NHL-F5 F 39 2 tonsil, neck LN DLBL 0
NHL-F6 M 31 2 neck DLBL 0
NHL-F7 M 46 2 nasopharynx, tonsil DLBL 0
NHL-F8 M 72 2 stomach DLBL 1
NHL-F9 M 34 2 neck, SCN DLBL 1
NHL-F10 M 70 2 stomach DLBL 1
NHL-F11 M 52 3 multiple DLBL 2
NHL-F12 M 52 3 multiple DLBL 2
NHL-F13 M 67 4 multiple DLBL 2
NHL-F14 M 73 4 tibia, leg(skin) DLBL 3
NHL-F15 F 48 4 multiple DLBL 3
NHL-F16 M 38 4 multiple Hodgkin L -
NHL-F17 M 70 4 multiple DLBL 3
NHL-F18 M 64 4 multiple DLBL 4
NHL-F19 M 25 4 multiple PTCL 2
NHL-F20 M 71 - stomach r/o Lymphoma -
OVC Age
year
Histology Stage
OVC-F1 56 IIIc Clear cell carcinoma
OVC-F2 52 IIa Endometrioid adenocarcinoma
OVC-F3 63 IV Papillary serous adenocarcinoma
OVC-F4 55 Ia Malignant Brenner tumor
OVC-F5 47 IIIc Papillary serous adenocarcinoma
OVC-F6 50 Ic Clear cell carcinoma
OVC-F7 68 Ib Serous adenocarcinoma
OVC-F8 74 IIIc Papillary serous adenocarcinoma
OVC-F9 43 Ic Mucinous adenocarcinoma
OVC-F10 44 IIIc Papillary serous adenocarcinoma
OVC-F11 54 IIIc Papillary serous adenocarcinoma
OVC-F12 55 IV Serous adenocarcinoma
OVC-F13 72 IIIc Serous adenocarcinoma
OVC-F14 58 IIIc Mucinous adenocarcinoma
OVC-F15 44 IIIc Papillary serous adenocarcinoma
OVC-F16 57 IV Serous adenocarcinoma
OVC-F17 54 IIIc Papillary serous adenocarcinoma
OVC-F18 73 IIIc Serous adenocarcinoma
OVC-F19 47 IIIc Papillary serous adenocarcinoma
OVC-F20 40 Ic Papillary serous adenocarcinoma
OVC-F21 74 IIb Transitional cell carcinoma
OVC-F22 65 IIIc Papillary serous adenocarcinoma
OVC-F23 47 IV Serous adenocarcinoma
OVC-F24 58 IIc Serous adenocarcinoma
OVC-F25 57 Ib Mixed cell adenocarcinoma
2-2. 시료 준비 - 혈청 준비 및 질량 스펙트럼 측정
4배 부피의 메탄올/클로로포름(2:1, v/v)을 25㎕의 혈청과 함께 격렬하게 섞은 후에 10분 동안 실온에서 배양하였다. 혼합물은 4℃에서 10분 동안 6000 × g로 원심 분리하였다. 수득한 상청액을 1시간 동안 농축기(concentrator)에서 완전히 건조시켰으며, 30분 동안 교반기(vortexer)에서 30㎕의 50% 아세토니트릴(acetonitrile)/0.1% 트라이플루오린화 아세트산(trifluoroacetic acid, TFA)으로 용해시켰다.
메탄올/클로로포름 추출물을 50% 아세토니트릴/0.1% TFA 내에서 알파-시아노-4-하이드록시 시남산(α-cyano-4-hydroxycinnamic acid) 용액과 혼합하였으며(1:12, v/v), 1㎕의 혼합물을 MALDI-타깃 플레이트(target plate)에 위치시켰다. GC 환자 및 비환자 혈청 추출물의 질량 스펙트럼을 Proteomics Analyzer(Applied Biosystems, Foster City, CA, USA)를 사용하여 측정하였다.
한 개의 시료에 대해 질량 스펙트럼 데이터는 20번 반복 측정된 스펙트럼의 평균으로 추출된다. 모든 개별 시료의 질량값 구간은 최대 질량값이 약 2500 m/z이 되도록 조정하였다. 실험적 오류를 최소화하기 위하여, 초점 질량(focus mass), 레이저 강도(laser intensity), 타깃 플레이트, 데이터 수집 시각(data acquisition time)을 포함하는 다양한 요소를 점검하였다.
바람직한 초점 질량 및 레이저 강도로 500 m/z 및 5000이 각각 고정되어 사용되었다. 모든 시료들은 고정된 초점 질량 및 레이저 강도와 함께, 다른 추출 및 다른 데이터 수집 시각하에서 최소 5번 반복 측정하였다. 질량 이온별 가중치를 계산한 집합 E1의 경우는 추가로 한 번 더 측정하였다.
따라서, 상기 저질량 이온 검출부(1000)는 MALDI-TOF 질량분석기를 이용하여 상술한 바와 같은 과정을 통해서 혈청 시료로부터 저질량 이온 질량 스펙트럼을 추출할 수 있다.
2-3. 판별 전략
구성한 판별식이 GC 특이적인 식이 되기 위해서는 GC 환자군은 판별식에 의해 정상 대조군뿐만 아니라 다른 암환자군과도 구분되어야 한다. 본 실시 예에서는 다른 암환자군으로 CRC 환자군, BRC 환자군 및 NHL 환자군을 사용하고자 한다. 한 개의 판별식으로 GC 환자군과 비환자군(정상 대조군, CRC 환자군, BRC 환자군 및 NHL 환자군)을 구분할 수 있는지 종래의 주성분 분석 기반 선형 판별 분석 방법을 적용한 결과를 표 19에 나타내었다. 특히 NHL 환자군의 특이도가 25.00%로 낮은 것을 확인할 수 있다. 이로부터 한 개의 판별식으로는 GC 환자군과 비환자군을 구분할 수 없음을 알 수 있다.

Sensitivity 97.96%
Set E1 True GC True Non-GC
Specificity CONT 95.24%
CONT CRC BRC NHL CRC
83.12%
Predicted GC 48 4 13 8 18 BRC 85.19%
Predicted Non-GC 1 80 64 46 6 NHL 25.00%
도 2 및 표 4에서 확인한 바와 같이 GC 환자군과 정상 대조군에 대해서는 우수한 판별 결과를 얻을 수 있었으므로, GC 환자군과 다른 암환자군과도 개별적으로 구분될 수 있는지 살펴보았는데, 그 결과를 표 20 내지 22에 나타내었다.
Sensitivity 93.88%
Set E1 True GC True
CRC
Specificity 98.70%
Predicted GC 46 1 PPV 97.87%
Predicted CRC 3 76 NPV 96.20%
Sensitivity 93.88%
Set E1 True GC True
BRC
Specificity 98.15%
Predicted GC 46 1 PPV 97.87%
Predicted BRC 3 53 NPV 94.64%
Sensitivity 100.0%
Set E1 True GC True
NHL
Specificity 100.0%
Predicted GC 49 0 PPV 100.0%
Predicted NHL 0 24 NPV 100.0%
따라서 GC 환자군과 비환자군을 구분하는 것은 GC 환자군과 정상 대조군을 구분하는 제1종 판별식, GC 환자군과 CRC 환자군을 구분하는 제2종 판별식, GC 환자군과 BRC 환자군을 구분하는 제3종 판별식, GC 환자군과 NHL 환자군을 구분하는 제4종 판별식을 사용하여, 네 개의 판별식에 의해 모두 GC로 판별된 경우를 GC 환자로 판정하고, 네 개의 판별식 중 어느 하나의 판별식으로든 GC 비환자로 판별된 경우에는 GC 비환자로 판정하는 방식을 통해 수행될 수 있다.
또한, 판별식의 개수가 증가함에 따라 모든 판별식에 의해 GC로 판별되어야 한다는 조건은 필연적으로 민감도의 감소를 야기할 것이므로 판별식의 개수를 줄이는 방법도 필요하다. 표 23은 GC 환자군 및 정상 대조군과 다른 암환자군을 구분하는 경우를 보여주고 있는데, 대체적으로 우수한 판별 결과를 나타낸다고 할 수 있다. 따라서 이 판별식과 제1종의 판별식을 결합하여 GC 환자군과 정상 대조군을 다른 암환자군과 구분한 후, 다시 GC 환자군과 정상 대조군을 구분하는 방식으로 GC 환자군을 비환자군과 구분할 수 있다. GC 환자군 및 정상 대조군과 다른 암환자군을 구분하는 판별식을 제5종의 판별식으로 지칭한다. 네 개의 판별식을 사용하는 방법과, 두 개의 판별식을 사용하는 방법을 채택할 수 있는데, 실시 예에서 두 가지 경우를 모두 설명한다.
Sensitivity GC 89.80%
Set E1 True GC/CONT True CRC/BRC/NHL CONT 95.24%
GC CONT CRC BRC NHL Specificity CRC
87.01%
Predicted GC/CONT 44 80 10 0 0 BRC 100.0%
Predicted CRC/BRC/NHL 5 4 67 54 24 NHL 100.0%
2-4. 제1훈련집합 E 0 의 선정 및 질량 이온별 가중치 계산
표 19, 20, 21, 23에 나타낸 판별 결과가 우수하기는 하나 민감도와 특이도가 모두 100%는 아니다. 본 발명에서는 우선 민감도와 특이도가 소정의 값을 갖는 제1훈련집합 E0를 선정하고, 이 제1훈련집합 E0에 대해 질량 이온별 가중치를 계산하였는데, 본 실시 예에서 그 소정의 값은 민감도와 특이도 모두 100%이다.
도 10을 참조하여 민감도와 특이도가 소정의 값을 갖는 제1훈련집합 E0를 선정하는 방법에 대하여 설명한다.
제1판별점수 계산수단(2200)은, 도시된 도 10의 F111 내지 F114 단계들을 통하여, 집합 E1 내 GC 환자군 및 정상 대조군의 저질량 이온 질량 스펙트럼들을 정렬하여 임포트하고(F111), 임포트한 피크 강도들을 정규화하고(F112), 정규화한 피크 강도들을 파레토 스케일링하고(F113), 파레토 스케일링한 피크 강도들에 대해 생물통계학적 분석을 수행하여 판별 점수를 계산하였다(F114).
다양한 생물통계학적 분석 방법 중 어느 하나를 선택하여 판별 점수를 계산할 수 있으나, 본 실시 예에서는 주성분 분석 기반 선형 판별 분석을 수행하였다. 판별 점수를 통하여 민감도 및 특이도를 계산하였으며(F115), 그 결과는 전술한 표 4와 같다.
다음으로, 민감도의 문턱값 GN1과 특이도의 문턱값 GN2를 설정하여(F116), 민감도 또는 특이도가 각각의 문턱값보다 작은 경우 위양성(false positive) 또는 위음성(false negative) 케이스들을 제외하였다(F117).
본 실시 예에서는 민감도의 문턱값 GN1과 특이도의 문턱값 GN2를 모두 1로 설정함으로써 민감도와 특이도가 모두 100%인 제1훈련집합 E0을 찾았다. 즉 표 4에 나타난 위음성인 한 케이스를 배제하고, 배제한 집합에 대하여 다시 F111 내지 F115 단계를 수행하였다. 제1종 판별식의 경우는 이렇게 하여 민감도 및 특이도가 바로 100%가 되는 것을 확인하였으나, 배제한 집합에 대하여 F111 내지 F115 단계를 다시 수행하여도 항상 바로 민감도 및 특이도가 100%가 되지는 않았으며, F111 내지 F117 단계를 수회 반복함으로써 비로소 민감도와 특이도가 모두 100%인 제1훈련 집합 E0을 찾을 수 있었다(F118).
GC 환자군과 정상 대조군을 구분하는 제1종 판별식의 경우에는 1개의 위음성 케이스를 배제한 후에 제1훈련집합 E01에 도달하였고, GC 환자군과 CRC 환자군을 구분하는 제2종 판별식의 경우에는 4개의 위음성 케이스들 및 2개의 위양성 케이스들을 배제한 후에 제1훈련집합 E02에 도달하였고, GC 환자군과 BRC 환자군을 구분하는 제3종 판별식의 경우에는 4개의 위음성 케이스들 및 1개의 위양성 케이스를 배제한 후에 제1훈련집합 E03에 도달하였고, GC 환자군 및 정상 대조군과 다른 암환자군을 구분하는 제5종 판별식의 경우에는 11개의 위음성 케이스들(GC 5개 및 CONT 6개) 및 21개의 위양성 케이스들(CRC 20개 및 BRC 1개)을 배제한 후에 제1훈련집합 E05에 도달하였는데, 각 제1훈련집합은 민감도와 특이도가 모두 100%인 판별 결과를 준다.
GC 환자군과 NHL 환자군을 구분하는 제4종 판별식의 경우에는 표 22에 나타낸 바와 같이 이미 민감도 및 특이도가 100%이므로 해당 케이스들을 그대로 제1훈련집합 E04로 사용하였다. 이 과정을 통해 민감도와 특이도가 모두 100%인 판별 결과를 주는 질량 이온별 인자적재값을 도출할 수 있다(F119).
상기와 같은 일련의 과정은 상기 제1훈련집합 선택수단(2310)을 포함하는 인자적재값 계산수단(2300)을 통하여 수행될 수 있다.
2-5. 판별식의 적용
구성한 판별식을 판별 대상 시료에 적용하는 과정을 설명하면 다음과 같다.
우선 MarkerViewTM에는 이와 유사한 목적으로 사용할 수 있는 기능이 있다. 즉, 함께 임포트한 시료 데이터 중에서 일부 시료들만을 대상으로 하여 주성분 분석 기반 선형 판별 분석을 적용할 수 있으며, 이렇게 구성한 판별식으로 나머지 시료들을 판별할 수 있다. 이 기능을 이용하면 제1훈련집합과 판별 대상 시료를 함께 임포트한 후 제1훈련집합만을 선택해서 주성분 분석 기반 선형 판별 분석을 수행하여 판별 대상 시료가 어떻게 판정되는지 알 수 있다.
그러나 MarkerViewTM의 임포트 과정에서 피크들을 정렬하는 기능(peak alignment)이 수행되는데, 제1훈련집합에 맞추어 판별 대상 시료의 피크들을 정렬하는 기능이 없기 때문에, 제1훈련집합만을 임포트하였을 때의 피크 표(peak table, m/z 열과 시료별 피크 강도 열로 이루어진 행렬)와, 제1훈련집합과 판별 대상 시료를 함께 임포트하였을 때 생성되는 피크 표의 제1훈련집합 부분은 동일하지 않다. 피크 강도 행렬 부분도 다르며, 동일한 피크 강도 행에 대응하는 m/z 값도 항상 동일하게 나타나지는 않는다. 따라서, 제1훈련집합에서 만든 판별식을 판별 대상 시료에 적용하여 판별 점수를 계산하기 위해서는 제1훈련집합과 판별 대상 시료를 함께 임포트했을 때 생성되는 피크 표를 제1훈련집합만을 임포트하였을 때의 피크 표에 재정렬(relignment)하는 작업이 선행되어야 한다.
여러 개의 판별 대상 시료들을 제1훈련집합과 함께 임포트하는 경우 정렬이 어긋나는 정도가 더욱 심해진다. 따라서 본 실시 예에서는 모든 판별 대상 시료들에 대해서 제1훈련집합에 한 개의 판별 대상 시료를 추가하여 임포트한 후, 재정렬, 정규화, 파레토 스케일링을 수행하였다.
도 11을 참조하여 보다 상세히 설명하면 다음과 같다.
먼저, 판별 대상 시료의 저질량 이온 질량 스펙트럼들을 제1훈련집합에 정렬하여 임포트하는 단계를 수행한다(F211).
다만, 본 실시 예에서는 MarkerViewTM에는 판별 대상 시료를 제1훈련집합에 정렬하여 임포트하는 기능이 없으므로, 전술한 바와 같이 판별 대상 시료의 저질량 이온 질량 스펙트럼을 제1훈련집합과 함께 임포트한 후 만들어지는 피크 표를 제1훈련집합만을 임포트하였을 때 만들어지는 피크 표에 재정렬하는 프로그램을 만들어 제1훈련집합에 정렬된 판별 대상 시료의 저질량 이온 질량 스펙트럼을 추출하였다. 그러나 재정렬 없이 처음부터 판별 대상 시료를 제1훈련집합에 정렬하여 임포트하는 것이 보다 바람직하고 이것 역시 프로그램을 만들어 구현 가능하다.
다음으로, 임포트한 피크 강도들을 정규화하고(F212), 정규화한 피크 강도들을 파레토 스케일링하였다(F213).
다음으로, 파레토 스케일링한 저질량 이온들의 피크 강도와 제1훈련집합에 대한 주성분 분석 기반 선형 판별 분석에 의해 획득된 질량 이온별 인자적재값으로부터 판별 점수를 계산하였다(F214).
이렇게 계산된 판별 점수가 기준값 GS보다 큰지 여부를 판단하여(F215), 기준값 GS보다 큰 경우 양성으로 판정하고(F216), 기준값 GS보다 작은 경우 음성으로 판정하였다(F217). 본 실시 예에서 기준값 GS는 0인 것이 바람직하다.
상기와 같은 일련의 과정은 상기 제2정렬수단(2500), 제2판별점수계산 계산수단(2600) 및 위암 판정수단(2700)을 통하여 수행될 수 있다.
제1종 판별식을 위해 집합 E1에서 제1훈련집합 E01을 구성할 때 제외되었던 1명의 GC 환자군 시료, 제2종 판별식을 위해 집합 E1에서 제1훈련집합 E02을 구성할 때 제외되었던 4명의 GC 환자군 시료 및 2명의 CRC 환자군 시료, 제3종 판별식을 위해 집합 E1에서 제1훈련집합 E03을 구성할 때 제외되었던 4명의 GC 환자군 시료 및 1명의 BRC 환자군 시료, 제5종 판별식을 위해 집합 E1에서 제1훈련집합 E05을 구성할 때 제외되었던 5명의 GC 환자군 시료, 6명의 정상 대조군 시료, 20명의 CRC 환자군 시료 및 1명의 BRC 환자군 시료에 대해 상기 2-4절에서 계산한 질량 이온별 인자적재값을 적용하여 판별 점수를 계산해 보았다. 제1훈련집합 E01, E02, E03 및 E05를 구성할 때 이미 제외된 케이스들이었기 때문에 위양성 또는 위음성 케이스로 판별될 것으로 예상하였는데, 계산 결과 제5종 판별식 관련 GC 환자군 두 케이스와 정상 대조군 한 케이스가 진양성으로 판정된 것을 제외하고는 예상대로 위양성 또는 위음성 케이스로 판별되었다. 상기 2-4절에서 계산한 질량 이온별 인자적재값을 적용하여 집합 E1을 판별한 결과를 도 12 내지 도 16에 나타내었는데, 도 12는 제1종 판별식, 도 13은 제2종 판별식, 도 14는 제3종 판별식, 도 15는 제4종의 판별식, 도 16은 제5의 판별식의 결과를 보여준다.
2-6. 예비 판별식의 구성
전술한 종래 기술에서는 주성분 분석 기반 선형 판별 분석에서 고려한 모든 질량 이온들을 사용하여 판별 점수를 계산한 후 그 판별 점수에 따라 GC 환자 여부를 판정하였으나, 본 발명에서는 강건한 판별 성능을 나타내는 판별식을 도출하기 위해 우선 판별 점수에 큰 기여를 하는 질량 이온들만 사용하는 예비 판별식을 구성하였다. "예비 판별식"이란 본 발명에 따라 최종적으로 구하고자 하는 판별식을 도출하는 중간 단계로서의 판별식을 지칭하며, 이를 구성하는 저질량 이온들은 최종 판별식을 구성할 GC 진단용 저질량 이온들의 "예비 후보군"이 된다.
도 17의 절차를 통해 10,000개의 질량 이온들 중 판별 점수에 큰 영향을 미치는 소정의 질량 이온들을 선정하였다. 본 실시 예에서 제1종 판별식의 경우 선정된 소정의 질량 이온들의 개수는 299개, 제2종 판별식의 경우는 351개, 제3종 판별식의 경우 384개, 제4종 판별식의 경우는 348개, 제5종 판별식의 경우는 383개였다.
표 3과 함께 전술한 바와 같이, 임포트 조건에서 피크의 최대 개수를 10,000개로 하였고 충분히 많은 시료들을 함께 임포트하였으므로, MarkerViewTM의 주성분 분석 기반 선형 판별 분석 방법을 통해 구성한 판별식은 10,000개의 항으로 이루어져 있다. 그러나 GC 환자 및 비환자를 구분함에 있어 10,000개의 항이 모두 동등한 중요성을 가지지는 않을 것이므로, 도 17의 절차에 따라 10,000개의 질량 이온들 중 판별 점수에 큰 영향을 미치는 질량 이온들을 두 단계에 걸쳐 선정하였다. 이 단계는 10,000개의 질량 이온들 중 GC 환자와 비환자를 구분함에 있어 불필요한 질량 이온들을 제거하는 과정이라 할 수 있다.
10,000개 항의 값들 중에서 피크 강도와 질량 이온별 인자적재값의 곱의 절댓값이 문턱값 GT1보다 큰 질량 이온들을 케이스별로 일차적으로 선택하였다(F121). 본 실시 예에서 문턱값 GT1은 0.1인 것이 바람직하다.
다음, 케이스별로 일차적으로 선택한 질량 이온들 중에서 제1훈련집합 전체 케이스들 중 문턱값 GT2 퍼센트 이상의 케이스들에서 공통으로 나타나는 질량 이온들을 이차적으로 선택하였다(F122). 본 실시 예에서 문턱값 GT2는 50인 것이 바람직하다. 즉, 제4종 판별식의 경우를 예로 들어 설명하면 제1훈련집합인 73개 케이스들 중 최소 37개 이상의 케이스들에서 공통으로 등장하는 질량 이온들로만 예비 판별식을 구성하였다.
상기와 같은 과정을 통하여 선택한 질량 이온들만으로 다시 판별 점수를 계산하고 이에 따라 민감도 및 특이도를 계산하였다(F123). 다시, 민감도의 문턱값 GN3와 특이도의 문턱값 GN4를 설정하여(F124), 민감도 또는 특이도가 각각의 문턱값보다 작은 경우 F121 단계에서 사용된 문턱값 T1 및/또는 F122 단계에서 사용된 문턱값 GT2를 변경하여(F125) F121 내지 F124 단계를 반복하였다. 본 실시 예에서는 민감도의 문턱값 GN3와 특이도의 문턱값 GN4가 각각 0.9인 것이 바람직하다.
이와 같은 단계들을 거쳐 선택한 질량 이온들로 GC 진단용 저질량 이온들의 예비 후보군을 구성하였는데(F126), 본 실시 예에서는 10,000개의 질량 이온들 중 제1종 판별식의 경우 299개, 제2종 판별식의 경우 351개, 제3종 판별식의 경우 384개, 제4종 판별식의 경우 348개, 제5종 판별식의 경우 383개의 질량 이온들이 선택되었다. 표 24 내지 328에 제1 내지 5종 예비 판별식으로 제1훈련집합 E01 내지 E05을 판별한 결과를 나타내었는데, 민감도와 특이도 등 판별 성능이 100%에서 낮아지기는 하였으나 전체 질량 이온 개수의 4%도 되지 않는 질량 이온들만으로 계산한 결과임에도 불구하고, 대체적으로 매우 우수한 판별 결과를 보임을 확인할 수 있다.
또한, 예비 판별식으로 집합 E1을 판별한 결과를 도 18 내지 22에 나타내었는데, 도 18은 제1종 예비 판별식, 도 19는 제2종 예비 판별식, 도 20은 제3종의 예비 판별식, 도 21은 제4종의 예비 판별식, 도 22는 제5종의 예비 판별식의 결과를 보여준다. 계산에 사용되는 질량 이온의 개수는 급격하게 감소된 것에 비해 판별 점수의 범위는 그렇지 않음을 알 수 있는데, 이로부터 GC 환자 및 비환자를 구분함에 있어 10,000개의 질량 이온이 모두 필요한 것이 아니라는 것을 확인할 수 있다.
Sensitivity 95.83%
Set E01 True GC True CONT Specificity 98.81%
Predicted GC 46 1 PPV 97.87%
Predicted CONT 2 83 NPV 97.65%
Sensitivity 91.11%
Set E02 True GC True
CRC
Specificity 97.33%
Predicted GC 41 2 PPV 95.35%
Predicted CRC 4 73 NPV 94.81%
Sensitivity 100.0%
Set E03 True GC True
BRC
Specificity 100.0%
Predicted GC 45 0 PPV 100.0%
Predicted BRC 0 53 NPV 100.0%
Sensitivity 93.88%
Set E04 True GC True
NHL
Specificity 100.0%
Predicted GC 46 0 PPV 100.0%
Predicted NHL 3 24 NPV 88.89%
Set E05 True GC/CONT True CRC/BRC/NHL Sensitivity 96.72%
GC CONT CRC BRC NHL Specificity 97.76%
Predicted GC/CONT 41 77 3 0 0 PPV 97.52%
Predicted CRC/BRC/NHL 3 1 54 53 24 NPV 97.04%
상기와 같은 일련의 과정은 상기 후보이온집합 선택수단(2410)을 포함하는 위암진단용이온 선정수단(2400)을 통하여 효과적으로 수행될 수 있다.
2-7. 최종 판별식의 구성
예비 판별식을 구성하는 과정에서는 임포트한 10,000개의 질량 이온들 중 판별 점수에 수치적으로 큰 기여를 하는 질량 이온들을 추출하였다. 그러나 이 질량 이온들 중에는 제1훈련집합 E0에서는 문제를 발생시키지 않았으나, 동일한 GC 환자군 및 비환자군의 혈청에 대해 다시 측정한 질량 스펙트럼에 대한 판별 또는 새로운 GC 환자군 및 비환자군에 대한 판별에 있어서는 잠재적으로 판별 성능을 저하시킬 수 있는 질량 이온들 역시 포함되어 있을 것이므로 이것들도 적극적으로 제거하는 단계가 필요한데, 최종 판별식의 구성 과정에서는 이 단계를 거쳐 최종적으로 GC 진단용 저질량 이온들을 결정한다.
판별식의 강건성을 검증하기 위해 먼저 집합 E1에 대해 추가적으로 5회 반복 측정 실험을 하였으며, 이와 독립적이며 또한, 서로 독립적인 집합 E2 및 집합 F에 대해서도 5회 반복 측정 실험을 수행하였다. 질량 스펙트럼의 반복 측정 과정에는 상기 설명한 혈청을 얼리고 녹이는 과정 및 혈청을 새로 메탄올/클로로포름과 혼합하여 추출하는 과정이 개입되는 것 외에, 레이저 빔(laser beam)을 이용한 기화(vaporization), 탈착(desorption), 이온화(ionization) 과정 등도 반복 실험 시 동일하게 진행된다고는 할 수 없으며 또한, 아직 밝혀지지 않은 다양한 원인들로부터의 외란들도 개입할 여지가 많다. 따라서 반복 측정된 개별 질량 스펙트럼에 대한 판별 점수에 어느 정도의 편차가 발생하는 것은 배제할 수 없을 것이므로 본 실시 예에서는 5회 반복 측정한 시료에 대해 평균 판별 점수를 계산하여 판정을 실시하였다.
표 29는 종래 기술인 MarkerViewTM의 주성분 분석 기반 선형 판별 분석 결과인 10,000개 항의 판별식으로 집합 E와 F를 판별한 결과를 나타내며, 표 30은 299개 항을 가지는 제1종 예비 판별식, 351개 항을 가지는 제2종 예비 판별식, 384개 항을 가지는 제3종 예비 판별식, 348개 항을 가지는 제4종 예비 판별식, 383개 항을 가지는 제5종 예비 판별식으로 집합 E와 F를 판별한 결과를 나타낸다.
표에서 GC LOME(gastric cancer low-mass ion discriminant equation) 1 내지 5는 제1 내지 5종 판별식을 나타내며, 그 뒤에 딸려 있는 숫자는 판별식에 포함되는 저질량 이온들의 개수를 의미한다. 또한, 표 31에는 검증 집합인 집합 F에 대해서만 판별 성능을 나타내었다.
GC LOME 1-10000 GC LOME 1-10000
Set E True
GC
True Non-GC Set F True
GC
True Non-GC
CONT CRC BRC NHL CONT CRC BRC NHL OVC
Predicted GC 88 9 86 38 46 Predicted GC 36 5 68 21 20 20
Predicted Non-GC 9 158 166 70 0 Predicted Non-GC 8 76 100 32 0 5
GC LOME 2-10000 GC LOME 2-10000
Set E True
GC
True Non-GC Set F True
GC
True Non-GC
CONT CRC BRC NHL CONT CRC BRC NHL OVC
Predicted GC 81 13 76 29 43 Predicted GC 35 10 66 15 18 21
Predicted Non-GC 16 154 176 79 3 Predicted Non-GC 9 71 102 38 2 4
GC LOME 3-10000 GC LOME 3-10000
Set E True
GC
True Non-GC Set F True
GC
True Non-GC
CONT CRC BRC NHL CONT CRC BRC NHL OVC
Predicted GC 88 32 77 19 31 Predicted GC 37 16 45 15 15 18
Predicted Non-GC 9 135 175 89 15 Predicted Non-GC 7 65 123 38 5 7
GC LOME 4-10000 GC LOME 4-10000
Set E True
GC
True Non-GC Set F True
GC
True Non-GC
CONT CRC BRC NHL CONT CRC BRC NHL OVC
Predicted GC 67 146 151 38 0 Predicted GC 32 69 86 11 0 11
Predicted Non-GC 30 21 101 70 46 Predicted Non-GC 12 12 82 42 20 14
GC LOME 5-10000
GC LOME 5-10000
Set E True
GC
True Non-GC Set F True
GC
True Non-GC
CONT CRC BRC NHL CONT CRC BRC NHL OVC
Predicted GC 60 137 87 0 2 Predicted GC 30 36 58 2 1 8
Predicted Non-GC 37 30 165 108 44 Predicted Non-GC 14 45 110 51 19 17
GC LOMEs 1, 2, 3 & 4 GC LOMEs 1, 2, 3 & 4
Set E True
GC
True Non-GC Set F True
GC
True Non-GC
CONT CRC BRC NHL CONT CRC BRC NHL OVC
Predicted GC 54 0 4 0 0 Predicted GC 23 0 4 0 0 6
Predicted Non-GC 43 167 248 108 46 Predicted Non-GC 21 81 164 53 20 19
GC LOMEs 1 & 5 GC LOMEs 1 & 5
Set E True
GC
True Non-GC Set F True
GC
True Non-GC
CONT CRC BRC NHL CONT CRC BRC NHL OVC
Predicted GC 54 5 17 0 2 Predicted GC 24 3 20 0 1 4
Predicted Non-GC 43 162 235 108 44 Predicted Non-GC 20 78 148 53 19 21
GC LOME 1-299 GC LOME 1-299
Set E True
GC
True Non-GC Set F True
GC
True Non-GC
CONT CRC BRC NHL CONT CRC BRC NHL OVC
Predicted GC 87 9 84 38 46 Predicted GC 36 8 65 21 20 20
Predicted Non-GC 10 158 168 70 0 Predicted Non-GC 8 73 103 32 0 5
GC LOME 2-351 GC LOME 2-351
Set E True
GC
True Non-GC Set F True
GC
True Non-GC
CONT CRC BRC NHL CONT CRC BRC NHL OVC
Predicted GC 78 12 73 29 42 Predicted GC 35 10 63 15 18 21
Predicted Non-GC 19 155 179 79 4 Predicted Non-GC 9 71 105 38 2 4
GC LOME 3-384 GC LOME 3-384
Set E True
GC
True Non-GC Set F True
GC
True Non-GC
CONT CRC BRC NHL CONT CRC BRC NHL OVC
Predicted GC 87 29 75 18 34 Predicted GC 37 16 43 14 15 19
Predicted Non-GC 10 138 177 90 12 Predicted Non-GC 7 65 125 39 5 6
GC LOME 4-348 GC LOME 4-348
Set E True
GC
True Non-GC Set F True
GC
True Non-GC
CONT CRC BRC NHL CONT CRC BRC NHL OVC
Predicted GC 68 146 152 40 0 Predicted GC 32 67 84 10 0 12
Predicted Non-GC 29 21 100 68 46 Predicted Non-GC 12 14 84 43 20 13
GC LOME 5-383 GC LOME 5-383
Set E True
GC
True Non-GC Set F True
GC
True Non-GC
CONT CRC BRC NHL CONT CRC BRC NHL OVC
Predicted GC 56 134 84 2 1 Predicted GC 29 35 59 1 1 6
Predicted Non-GC 41 33 168 106 45 Predicted Non-GC 15 46 109 52 19 19
GC LOMEs 1, 2, 3 & 4 GC LOMEs 1, 2, 3 & 4
Set E True
GC
True Non-GC Set F True
GC
True Non-GC
CONT CRC BRC NHL CONT CRC BRC NHL OVC
Predicted GC 54 0 4 0 0 Predicted GC 23 0 5 0 0 7
Predicted Non-GC 43 167 248 108 46 Predicted Non-GC 21 81 163 53 20 18
GC LOMEs 1 & 5 GC LOMEs 1 & 5
Set E True
GC
True Non-GC Set F True
GC
True Non-GC
CONT CRC BRC NHL CONT CRC BRC NHL OVC
Predicted GC 52 4 13 0 1 Predicted GC 23 5 18 0 1 4
Predicted Non-GC 45 163 239 108 45 Predicted Non-GC 21 76 150 53 19 21
Set F Sensitivity (%) Specificity (%) PPV (%) NPV (%)
GC LOME 1-10000,
GC LOME 2-10000,
GC LOME 3-10000 &
GC LOME 4-10000
52.27 97.12 69.70 94.13
GC LOME 1-299,
GC LOME 2-351,
GC LOME 3-384 &
GC LOME 4-348
52.27 96.54 65.71 94.10
GC LOME 1-14,
GC LOME 2-36,
GC LOME 3-50 &
GC LOME 4-46
93.18 98.85 91.11 99.13
Set F Sensitivity (%) Specificity (%) PPV (%) NPV (%)
GC LOME 1-10000 &
GC LOME 5-10000
54.55 91.93 46.15 94.10
GC LOME 1-299 &
GC LOME 5-383
52.27 91.93 45.10 93.82
GC LOME 1-14 &
GC LOME 5-55
79.55 98.56 87.50 97.44
10,000개 질량 이온으로 구성된 판별식은 제1훈련집합 E0에서 완벽한 판별 성능을 보였음에도 불구하고, 집합 F에서 특히 민감도와 양성예측도가 낮게 나타나는 것을 표 31에서 확인할 수 있다. 제1 내지 5종 예비 판별식도 제1훈련집합 E0에서는 대체적으로 매우 우수한 판별 성능(표 24 내지 28)을 보였음에도 불구하고 집합 F에서의 판별 결과는 만족스럽지 않았다.
따라서, 본 발명의 바람직한 일 실시 예에서는 예비 판별식을 강건한 판별식으로 개선하고자 도 23에 도시된 순서도의 단계들을 수행하였다.
먼저, 예비 후보군의 질량 이온들을, 고민감도 집합과 고특이도 집합으로 구분하였다(F131). 여기에서, 고민감도 집합의 질량 이온들은 질량 이온별 민감도가 특이도보다 높은 질량 이온들이며, 고특이도 집합의 질량 이온들은 그 반대이다.
다음으로, 고민감도 집합의 질량 이온들과 고특이도 집합의 질량 이온들을 각각 질량 이온별 민감도와 특이도의 합의 내림차순으로 정렬한 후 {Sns1, Sns2, Sns3 … SnsI}{Spc1, Spc2, Spc3 … SpcJ}, 각각의 상위 2개의 질량 이온들을 취하고 {Sns1, Sns2, Spc1, Spc2}, 4개의 질량 이온들 중 2개 이상의 질량 이온들로 구성할 수 있는 조합들(11개) 중 최고 성능의 조합을 바이오마커 그룹으로 선정하였다(F132).
여기에서, 최고 성능의 조합인지 여부는 다음의 기준들에 따라 객관적이고 보편적으로 선택될 수 있다. 다음의 기준들은 중요도의 순서에 따른다.
기준1) 민감도와 특이도의 합이 큰 조합이 보다 성능이 높다.
기준2) 질량 이온들의 개수가 적은 조합이 보다 성능이 높다.
기준3) 진양성 케이스 중 최소 판별 점수와 진음성 케이스 중 최대 판별 점수의 차이가 큰 조합이 보다 성능이 높다.
다음으로, 고민감도 집합과 고특이도 집합 각각의 그 다음 상위 1개의 질량 이온들{Sns3, Spc3}을 추가로 더 취하여 상기 바이오마커 그룹 및 상기 바이오마커 그룹에 상기 질량 이온들{Sns3, Spc3} 중 어느 하나 이상을 조합한 4개의 집합들{biomarker group}, {biomarker group, Sns3}, {biomarker group, Spc3}, {biomarker group, Sns3, Spc3} 중 최고 성능의 집합을 다시 바이오마커 그룹으로 선정한다(F133).
이러한 과정은, 고민감도 집합 및 고특이도 집합 모두에 추가할 질량 이온이 없을 때까지 반복된다(F134).
즉, 고민감도 집합 및 고특이도 집합 모두에 추가할 질량 이온이 있을 때에는 상기와 같은 F133 단계를 반복하고, 고민감도 집합과 고특이도 집합 중 어느 하나에 추가할 질량 이온이 남지 않은 경우에는, 남은 질량 이온이 있는 집합 중 그 다음 상위 1개의 질량 이온{Snsi 또는 Spcj}을 추가로 더 취하여 상기 바이오마커 그룹 및 상기 바이오마커 그룹에 상기 질량 이온{Snsi 또는 Spcj}를 조합한 2개의 집합들{biomarker group}, {biomarker group, Seni 또는 Spcj} 중 최고 성능의 집합을 다시 바이오마커 그룹으로 선정한다.
이러한 과정은, 고민감도 집합과 고특이도 집합 중 질량 이온이 남았었던 집합의 질량 이온이 남지 않을 때까지 반복되며, 고민감도 집합과 고특이도 집합 모두에 남은 질량 이온이 없는 경우의 바이오마커 그룹이 바이오마커 그룹1(GG)이 된다(F135).
예비 후보군에서 바이오마커 그룹1(GG)을 제거하고(F136) 남은 질량 이온들로 다시 고민감도 집합과 고특이도 집합을 구성하고 위의 과정을 반복한다. 이 과정은 고민감도 집합과 고특이도 집합 중 어느 한 집합이 두 개 미만의 질량 이온만을 가질 때까지 반복된다(F137).
위의 반복 과정을 통해 얻은 바이오마커 그룹1, 2, … 중 정확도순으로 GK개의 바이오마커 그룹을 조합하여 최종 바이오마커 그룹을 형성한다. 여기서 정확도는 전체 케이스 중 진양성 및 진음성 케이스의 비율을 의미한다. 본 실시 예에서 GK는 1, 2 또는 3 중 어느 하나인 것이 바람직하다(F138).
따라서, 상기 최종 바이오마커 그룹의 질량 이온들이 GC 진단용 저질량 이온들로 결정된다(F139).
집합 E1에서, 더 정확하게는 그 부분 집합인 E0에서 질량 이온들의 예비 후보군을 선정하였는데, 예비 후보군으로부터 최종 바이오마커 그룹을 결정할 때에는 과적합(overfitting) 문제를 해결하기 위하여 집합 E1에 독립인 집합 E2도 추가하여 훈련 집합을 확장하였다.
상기의 과정들을 GC 환자군과 정상 대조군을 구분하기 위한 시료들을 대상으로 수행한 결과 제1종 GC 진단용 저질량 이온으로 14개가 선택되었으며, GC 환자군과 CRC 환자군을 구분하기 위한 시료들을 대상으로 수행한 결과 제2종 GC 진단용 저질량 이온으로 36개가 선택되었고, GC 환자군과 BRC 환자군을 구분하기 위한 시료들을 대상으로 수행한 결과 제3종 GC 진단용 저질량 이온으로 50개가 선택되었고, GC 환자군과 NHL 환자군을 구분하기 위한 시료들을 대상으로 수행한 결과 제4종 GC 진단용 저질량 이온으로 46개가 선택되었고, GC 환자군 및 정상 대조군과 다른 암환자군을 구분하기 위한 시료들을 대상으로 수행한 결과 제5종 GC 진단용 저질량 이온으로 55개가 선택되었다.
제1 내지 5종 GC 진단용 저질량 이온들의 질량값은 표 32 내지 36에 나타내었다. 이와 같은 저질량 이온들을 "제1종 GC 진단용 저질량 이온들", "제2종 GC 진단용 저질량 이온들", "제3종 GC 진단용 저질량 이온들", "제4종 GC 진단용 저질량 이온들" 및 "제5종 GC 진단용 저질량 이온들"로 지칭하고, 이를 이용하여 최종적으로 구한 본 발명에 따른 판별식을 "제1종 GC 진단용 최종 판별식", "제2종 GC 진단용 최종 판별식", "제3종 GC 진단용 최종 판별식", "제4종 GC 진단용 최종 판별식" 및 "제5종 GC 진단용 최종 판별식"으로 지칭한다.
22.9851 123.0842 324.1365 488.6538 526.3426 576.2893 616.1397
87.0959 314.2151 366.2424 490.3374 532.3719 606.2658 1466.5612
18.0260 137.0721 207.0729 401.0680 489.3564 528.3633 585.2726
22.9830 144.1092 265.2034 431.9882 489.5293 535.2970 587.2805
38.9752 156.0171 356.1278 442.3197 490.2775 553.3205 710.3687
72.0788 172.3740 380.1643 445.0278 490.3586 557.4392 946.4028
86.1216 172.6583 381.0949 458.3228 525.3611 584.2675 1466.6433
122.0584
22.9852 184.1123 299.3423 430.3313 487.3295 534.2973 580.3417
74.0764 212.1032 314.2316 432.9929 488.3316 535.3013 583.2274
104.1387 217.9461 338.1143 456.2963 490.3400 537.3199 584.2345
105.1157 226.0798 377.0710 459.2425 496.8846 550.3255 584.3355
106.0555 228.0046 387.9830 480.3312 506.9148 560.3121 585.2423
148.0788 284.3291 426.3417 481.3399 509.3577 562.3203 600.3366
173.4924 299.1308 427.3321 482.3368 532.3532 574.3090 616.1446
176.1198
18.0264 112.0850 176.1298 213.0575 274.0827 430.3169 491.3348
22.9798 123.0738 178.1388 229.0033 284.3265 434.2556 532.2725
23.0539 129.0710 179.1466 232.0822 314.2277 456.3015 534.2841
38.9638 155.1762 192.1245 234.0749 326.3916 459.2257 569.3303
38.9937 164.0701 201.2036 235.0331 383.0532 460.9913
46.0666 165.0955 204.1077 240.0907 417.0381 489.3314
86.1328 175.1219 212.3577 251.9799 429.3172 490.3361
38.9674 190.1141 267.9562 368.2644 443.2100 548.3441 684.3511
76.0758 193.0672 289.2849 369.2702 445.0283 552.3114 708.3570
123.0414 215.0444 295.1666 370.2806 498.3276 553.3178 711.3711
156.0432 228.0389 301.1386 371.2848 510.2755 571.3341 723.3455
163.1135 230.0004 315.2230 396.0400 511.3414 573.2402 725.3580
164.0712 256.3291 330.2485 412.1977 513.3220 584.2661 726.3760
184.1062 257.2950 342.2497 428.1904 530.3908 666.3899 741.3357
184.1375 265.9579 346.2809 442.3155 532.2863 683.3451
상기와 같은 일련의 과정은 상기 후보이온집합 선택수단(2410) 및 최종이온집합 선택수단(2420)을 포함하는 위암진단용이온 선정수단(2400)을 통하여 효과적으로 수행될 수 있다.
2-8. 최종 판별식의 적용 및 분석
집합 F에 대하여 제1 내지 4종, 또는 제1종 및 제5종 GC 진단용 저질량 이온들을 이용한 제1 내지 4종, 또는 제1종 및 제5종 GC 진단용 최종 판별식을 도 11의 방법에 따라 적용하면 그 판정 결과를 획득할 수 있다.
최종 판별식으로 판정한 결과를 도 24, 54 및 표 31, 37에 나타내었다. 도 24 및 도 25는 5회 판별 점수의 평균 판별 점수로 판정한 결과를 나타내는데, 도 24는 집합 E, 도 25는 집합 F의 판정 결과를 나타낸다. 제1 내지 4종 GC 진단용 최종 판별식을 사용하는 경우는 4차원 공간상에 표현되어야 하므로 그림으로 나타내지 않았고, 제1종 및 제5종 GC 진단용 최종 판별식을 사용한 경우만 나타내었다.
GC LOME 1-14 GC LOME 1-14
Set E True
GC
True Non-GC Set F True
GC
True Non-GC
CONT CRC BRC NHL CONT CRC BRC NHL OVC
Predicted GC 95 0 107 13 43 Predicted GC 42 0 92 5 19 14
Predicted Non-GC 2 167 145 95 3 Predicted Non-GC 2 81 76 48 1 11
GC LOME 2-36 GC LOME 2-36
Set E True
GC
True Non-GC Set F True
GC
True Non-GC
CONT CRC BRC NHL CONT CRC BRC NHL OVC
Predicted GC 93 9 7 5 22 Predicted GC 42 12 9 3 8 14
Predicted Non-GC 4 158 245 103 24 Predicted Non-GC 2 69 159 50 12 11
GC LOME 3-50 GC LOME 3-50
Set E True
GC
True Non-GC Set F True
GC
True Non-GC
CONT CRC BRC NHL CONT CRC BRC NHL OVC
Predicted GC 96 79 133 1 24 Predicted GC 44 35 111 0 13 15
Predicted Non-GC 1 88 119 107 22 Predicted Non-GC 0 46 57 53 7 10
GC LOME 4-46 GC LOME 4-46
Set E True
GC
True Non-GC Set F True
GC
True Non-GC
CONT CRC BRC NHL CONT CRC BRC NHL OVC
Predicted GC 95 145 164 30 0 Predicted GC 44 70 100 6 0 3
Predicted Non-GC 2 22 88 78 46 Predicted Non-GC 0 11 68 47 20 22
GC LOME 5-55 GC LOME 5-55
Set E True
GC
True Non-GC Set F True
GC
True Non-GC
CONT CRC BRC NHL CONT CRC BRC NHL OVC
Predicted GC 70 153 28 7 1 Predicted GC 37 60 12 3 1 0
Predicted Non-GC 27 14 224 101 45 Predicted Non-GC 7 21 156 50 19 25
GC LOMEs 1, 2, 3 & 4 GC LOMEs 1, 2, 3 & 4
Set E True
GC
True Non-GC Set F True
GC
True Non-GC
CONT CRC BRC NHL CONT CRC BRC NHL OVC
Predicted GC 89 0 5 0 0 Predicted GC 41 0 4 0 0 0
Predicted Non-GC 8 167 247 108 46 Predicted Non-GC 3 81 164 53 20 25
GC LOMEs 1 & 5 GC LOMEs 1 & 5
Set E True
GC
True Non-GC Set F True
GC
True Non-GC
CONT CRC BRC NHL CONT CRC BRC NHL OVC
Predicted GC 69 0 12 0 1 Predicted GC 35 0 4 0 1 0
Predicted Non-GC 28 167 240 108 45 Predicted Non-GC 9 81 164 53 19 25
검증 집합인 집합 F에서의 판별 성능으로 평가하면, 제1종 및 제5종 GC 진단용 최종 판별식의 결과에 비해, 제1 내지 4종 GC 진단용 최종 판별식의 결과가 더 우수함을 확인할 수 있다. 판별식의 개수의 증가는 통상 민감도의 감소를 동반하게 되지만 실시 예의 경우 제3종 및 제4종 판별식에서 100%의 민감도를 보였으므로 민감도의 감소의 관점에서는 사실상 판별식의 개수가 두 개인 것과 같게 되므로 판별식의 개수에 비해 민감도의 저하가 현저하게 나타나지는 않았다.
제1 내지 4종 GC 진단용 최종 판별식을 사용하는 경우에는 집합 F에서 민감도, 특이도, 양성예측도, 음성예측도가 모두 90% 이상이었다. 제1종 및 제5종 GC 진단용 최종 판별식을 사용하는 경우에는 민감도, 특이도, 양성예측도, 음성예측도가 모두 약 80% 이상이었다. 따라서 대체적으로 보아 제1종 및 제5종 GC 진단용 최종 판별식도 우수한 결과를 보인다고 할 수 있다.
본 발명을 통해 혈청의 저질량 이온 질량 스펙트럼을 분석하여 GC 환자와 비환자를 높은 판별 성능을 갖고 판정할 수 있었다.
본 발명은 본 실시 예와 유사한 과정을 거쳐 위암 외에 다른 특정 암환자군과 정상 대조군을 판별하는 식을 구성하며 또한, 서로 다른 암환자군을 구별하는 판별식을 구성하는 것으로 쉽게 확장될 수 있다. 또한, 암뿐만 아니라 어떠한 다른 질병에 대하여도 진단할 수 있도록 쉽게 확장될 수 있는 것을 당업자는 용이하게 알 수 있을 것이다.
1000 : 저질량 이온 검출부 2000 : 위암 진단부
2100 : 제1정렬수단 2200 : 제1판별점수 계산수단
2210 : 정규화 모듈 2220 : 스케일링 모듈
2230 : 판별점수계산 모듈 2300 : 인자적재값 계산수단
2310 : 제1훈련집합 선택수단 2400 : 위암진단용이온 선정수단
2410 : 후보이온집합 선택수단 2411 : 제1저질량이온 선택모듈
2412 : 후보이온집합 예비선택모듈 2413 : 민감도 및 특이도 계산모듈
2414 : 후보이온집합 최종선택모듈 2420 : 최종이온집합 선택수단
2421 : 이온 구분모듈 2422 : 바이오마커그룹 예비선정모듈
2423 : 바이오마커그룹 재선정모듈 2424 : 바이오마커그룹 최종선정모듈
2425 : 바이오마커그룹 추가선정모듈 2426 : 암진단용저질량이온 최종선택모듈
2500 : 제2정렬수단 2600 : 제2판별점수 계산수단
2610 : 정규화 모듈 2620 : 스케일링 모듈
2630 : 판별점수계산 모듈 2700 : 위암 판정수단
3000 : 디스플레이부

Claims (40)

  1. 다수의 위암 환자 및 비환자 케이스들의 생물학적 시료로부터 저질량 이온(low-mass ion)의 질량 스펙트럼을 검출하는 저질량 이온 검출부;
    상기 저질량 이온의 질량 스펙트럼 패턴을 비교 분석하여 위암 진단 정보를 판정하는 위암 진단부; 및
    상기 암 진단부로부터 판정된 위암 진단 정보를 출력 가능한 형태로 변환하여 표시하는 디스플레이부를 포함하는 위암 진단 장치.
  2. 제1항에 있어서,
    상기 저질량 이온 검출부는;
    상기 생물학적 시료로부터 저질량 이온의 피크 강도(peak intensity)를 검출하여 상기 저질량 이온의 질량 스펙트럼을 추출하는 것을 특징으로 하는 위암 진단 장치.
  3. 제2항에 있어서,
    상기 저질량 이온 검출부는;
    질량분석기를 포함하는 것을 특징으로 하는 위암 진단 장치.
  4. 제1항에 있어서,
    상기 위암 진단부는;
    훈련 후보 집합인 상기 암 환자 및 비환자 케이스들의 저질량 이온 질량 스펙트럼들을 정렬하는 제1정렬수단;
    정렬된 상기 질량 스펙트럼에 대해 생물통계학적 분석을 수행하여 판별 점수를 계산하는 제1판별점수 계산수단;
    상기 판별 점수에 따라 민감도(sensitivity) 및 특이도(specificity)를 계산하고, 이를 기준으로 제1훈련집합을 선정하여 저질량 이온별 인자적재값(factor loading)을 계산하는 인자적재값 계산수단;
    후보 조건을 만족하는 후보 저질량 이온들 중 판별 성능을 기반으로 하여 위암 진단용 저질량 이온들을 선택하는 위암진단용이온 선정수단;
    판별 대상 생물학적 시료의 저질량 이온 질량 스펙트럼을 상기 제1훈련집합에 정렬하는 제2정렬수단;
    상기 판별 대상의 저질량 이온의 피크 강도와 상기 인자적재값으로부터 판별 점수를 계산하는 제2판별점수 계산수단; 및
    상기 판별 점수에 따라 상기 판별 대상을 위암의 양성 또는 음성으로 판정하는 위암 판정수단을 포함하되,
    상기 위암진단용이온 선정수단은;
    상기 다수의 위암 환자 및 비환자 케이스들을, 다수의 위암 환자 케이스들과 다수의 정상인 케이스들로 구성되는 제1종 판별 케이스들과, 상기 다수의 위암 환자 케이스들과 다수의 대장암 환자 케이스들로 구성되는 제2종 판별 케이스들과, 상기 다수의 위암 환자 케이스들과 다수의 유방암 환자 케이스들로 구성되는 제3종 판별 케이스들과, 상기 다수의 위암 환자 케이스들과 다수의 비호지킨림프종(non-Hodgkin lymphoma, NHL) 환자 케이스들로 구성되는 제4종 판별 케이스들로 구분하거나, 상기 다수의 위암 환자 및 비환자 케이스들을, 상기 제1종 판별 케이스들과 상기 다수의 위암 환자 및 정상인 케이스들과 다수의 대장암, 유방암 및 비호지킨림프종 환자 케이스들로 구성되는 제5종 판별 케이스들로 구분하고,
    상기 제1종 판별 케이스들, 상기 제2종 판별 케이스들, 상기 제3종 판별 케이스들, 상기 제4종 판별 케이스들 및 상기 제5종 판별 케이스들에 대해 각각 실행되어, 상기 위암 진단용 저질량 이온들이, 상기 제1종 판별 케이스에 대한 제1종 위암 진단용 저질량 이온들, 상기 제2종 판별 케이스에 대한 제2종 위암 진단용 저질량 이온들, 상기 제3종 판별 케이스에 대한 제3종 위암 진단용 저질량 이온들, 상기 제4종 판별 케이스에 대한 제4종 위암 진단용 저질량 이온들 및 상기 제5종 판별 케이스에 대한 제5종 위암 진단용 저질량 이온들로 구분되는 것을 특징으로 하는 위암 진단 장치.
  5. 제4항에 있어서,
    상기 제1종 위암 진단용 저질량 이온들의 질량값은 22.9851, 87.0959, 123.0842, 314.2151, 324.1365, 366.2424, 488.6538, 490.3374, 526.3426, 532.3719, 576.2893, 606.2658, 616.1397, 1466.5612 m/z (단, 오차 범위는 ±0.1 m/z)로 이루어진 그룹으로부터 선택된 하나 이상의 질량값인 것을 특징으로 하는 위암 진단 장치.
  6. 제4항에 있어서,
    상기 제2종 위암 진단용 저질량 이온들의 질량값은 18.0260, 22.9830, 38.9752, 72.0788, 86.1216, 122.0584, 137.0721, 144.1092, 156.0171, 172.3740, 172.6583, 207.0729, 265.2034, 356.1278, 380.1643, 381.0949, 401.0680, 431.9882, 442.3197, 445.0278, 458.3228, 489.3564, 489.5293, 490.2775, 490.3586, 525.3611, 528.3633, 535.2970, 553.3205, 557.4392, 584.2675, 585.2726, 587.2805, 710.3687, 946.4028, 1466.6433 m/z (단, 오차 범위는 ±0.1 m/z)로 이루어진 그룹으로부터 선택된 하나 이상의 질량값인 것을 특징으로 하는 위암 진단 장치.
  7. 제4항에 있어서,
    상기 제3종 위암 진단용 저질량 이온들의 질량값은 22.9852, 74.0764, 104.1387, 105.1157, 106.0555, 148.0788, 173.4924, 176.1198, 184.1123, 212.1032, 217.9461, 226.0798, 228.0046, 284.3291, 299.1308, 299.3423, 314.2316, 338.1143, 377.0710, 387.9830, 426.3417, 427.3321, 430.3313, 432.9929, 456.2963, 459.2425, 480.3312, 481.3399, 482.3368, 487.3295, 488.3316, 490.3400, 496.8846, 506.9148, 509.3577, 532.3532, 534.2973, 535.3013, 537.3199, 550.3255, 560.3121, 562.3203, 574.3090, 580.3417, 583.2274, 584.2345, 584.3355, 585.2423, 600.3366, 616.1446 m/z (단, 오차 범위는 ±0.1 m/z)로 이루어진 그룹으로부터 선택된 하나 이상의 질량값인 것을 특징으로 하는 위암 진단 장치.
  8. 제4항에 있어서,
    상기 제4종 위암 진단용 저질량 이온들의 질량값은 18.0264, 22.9798, 23.0539, 38.9638, 38.9937, 46.0666, 86.1328, 112.0850, 123.0738, 129.0710, 155.1762, 164.0701, 165.0955, 175.1219, 176.1298, 178.1388, 179.1466, 192.1245, 201.2036, 204.1077, 212.3577, 213.0575, 229.0033, 232.0822, 234.0749, 235.0331, 240.0907, 251.9799, 274.0827, 284.3265, 314.2277, 326.3916, 383.0532, 417.0381, 429.3172, 430.3169, 434.2556, 456.3015, 459.2257, 460.9913, 489.3314, 490.3361, 491.3348, 532.2725, 534.2841, 569.3303 m/z (단, 오차 범위는 ±0.1 m/z)로 이루어진 그룹으로부터 선택된 하나 이상의 질량값인 것을 특징으로 하는 위암 진단 장치.
  9. 제4항에 있어서,
    상기 제5종 위암 진단용 저질량 이온들의 질량값은 38.9674, 76.0758, 123.0414, 156.0432, 163.1135, 164.0712, 184.1062, 184.1375, 190.1141, 193.0672, 215.0444, 228.0389, 230.0004, 256.3291, 257.2950, 265.9579, 267.9562, 289.2849, 295.1666, 301.1386, 315.2230, 330.2485, 342.2497, 346.2809, 368.2644, 369.2702, 370.2806, 371.2848, 396.0400, 412.1977, 428.1904, 442.3155, 443.2100, 445.0283, 498.3276, 510.2755, 511.3414, 513.3220, 530.3908, 532.2863, 548.3441, 552.3114, 553.3178, 571.3341, 573.2402, 584.2661, 666.3899, 683.3451, 684.3511, 708.3570, 711.3711, 723.3455, 725.3580, 726.3760, 741.3357 m/z (단, 오차 범위는 ±0.1 m/z)로 이루어진 그룹으로부터 선택된 하나 이상의 질량값인 것을 특징으로 하는 위암 진단 장치.
  10. 제4항에 있어서,
    상기 판별 점수는 상기 제1종 저질량 이온들에 의한 제1종 판별 점수, 상기 제2종 저질량 이온들에 의한 제2종 판별 점수, 상기 제3종 저질량 이온들에 의한 제3종 판별 점수 및 상기 제4종 저질량 이온들에 의한 제4종 판별 점수를 포함하며,
    상기 제1종 판별 점수가 GS11보다 크고, 상기 제2종 판별 점수가 GS21보다 크고, 상기 제3종 판별 점수가 GS31보다 크고, 상기 제4종 판별 점수가 GS41보다 큰 경우에는 상기 판별 대상을 위암 양성으로 판단하고,
    상기 제1종 판별 점수가 GS12보다 작거나, 상기 제2종 판별 점수가 GS22보다 작거나, 상기 제3종 판별 점수가 GS32보다 작거나, 상기 제4종 판별 점수가 GS42보다 작은 경우에는 상기 판별 대상을 위암 음성으로 판단하는 것을 특징으로 하는 위암 진단 장치.
  11. 제10항에 있어서,
    상기 GS11, GS12, GS21, GS22 , GS31, GS32 GS41 및 GS42는 0인 것을 특징으로 하는 위암 진단 장치.
  12. 제4항에 있어서,
    상기 판별 점수는 상기 제1종 저질량 이온들에 의한 제1종 판별 점수와 상기 제5종 저질량 이온들에 의한 제5종 판별 점수를 포함하며,
    상기 제1종 판별 점수가 GS11보다 크고 상기 제5종 판별 점수가 GS51보다 큰 경우에는 상기 판별 대상을 위암 양성으로 판단하고,
    상기 제1종 판별 점수가 GS12보다 작거나 상기 제5종 판별 점수가 GS52보다 작은 경우에는 상기 판별 대상을 위암 음성으로 판단하는 것을 특징으로 하는 위암 진단 장치.
  13. 제12항에 있어서,
    상기 GS11, GS12, GS51 및 GS52는 0인 것을 특징으로 하는 위암 진단 장치.
  14. 제4항에 있어서,
    상기 제1판별점수 계산수단은;
    상기 훈련 후보 집합의 상기 저질량 이온 질량 스펙트럼들의 상기 피크 강도들을 정규화하는 정규화 모듈;
    상기 정규화한 피크 강도들을 스케일링하는 스케일링 모듈; 및
    상기 스케일링된 피크 강도들에 대해 상기 생물통계학적 분석을 수행하여 상기 판별 점수를 계산하는 판별점수계산 모듈을 포함하는 것을 특징으로 하는 위암 진단 장치.
  15. 제14항에 있어서,
    상기 스케일링 모듈은;
    파레토 스케일링을 수행하는 것을 특징으로 하는 위암 진단 장치.
  16. 제14항에 있어서,
    상기 판별점수계산 모듈은;
    주성분 분석 기반 선형 판별 분석을 사용하여 상기 생물통계학적 분석을 수행하는 것을 특징으로 하는 위암 진단 장치.
  17. 제16항에 있어서,
    상기 판별점수계산 모듈은;
    상기 주성분 분석 기반 선형 판별 분석에 의해 획득된 인자적재값과 상기 스케일링된 피크 강도를 함께 사용하여 상기 판별 점수를 계산하는 것을 특징으로 하는 위암 진단 장치.
  18. 제4항에 있어서,
    상기 인자적재값 계산수단은;
    상기 정렬된 질량 스펙트럼에 대해 생물통계학적 분석을 수행하고, 상기 생물통계학적 분석 결과를 기초로 상기 위암 환자 및 비환자 케이스들 중 훈련 조건을 만족하는 훈련 케이스들을 제1훈련집합으로 선택하는 제1훈련집합 선택수단을 포함하며, 상기 제1훈련집합으로부터 인자적재값을 계산하는 것을 특징으로 하는 위암 진단 장치.
  19. 제18항에 있어서,
    상기 제1훈련집합 선택수단은;
    상기 생물통계학적 분석 결과에 따른 민감도가 문턱값 GN1 이상이고, 특이도가 문턱값 GN2 이상일 때의 위암 환자 및 비환자 케이스들을 상기 제1훈련집합으로 설정하는 것을 특징으로 하는 위암 진단 장치.
  20. 제19항에 있어서,
    상기 문턱값 GN1과 GN2는 1인 것을 특징으로 하는 위암 진단 장치.
  21. 제4항에 있어서,
    상기 제2판별점수 계산수단은;
    상기 판별 대상의 상기 저질량 이온 질량 스펙트럼의 상기 피크 강도들을 정규화하는 정규화 모듈;
    상기 정규화한 피크 강도들을 스케일링하는 스케일링 모듈; 및
    상기 스케일링된 피크 강도와 상기 인자적재값을 통해 상기 판별 점수를 계산하는 판별점수계산 모듈을 포함하는 것을 특징으로 하는 위암 진단 장치.
  22. 제21항에 있어서,
    상기 스케일링 모듈은;
    파레토 스케일링을 수행하는 것을 특징으로 하는 위암 진단 장치.
  23. 제21항에 있어서,
    상기 판별점수계산 모듈은;
    상기 위암 진단용 저질량 이온들의 상기 스케일링된 피크 강도와 상기 인자적재값을 통해 상기 판별 점수를 계산하는 것을 특징으로 하는 위암 진단 장치.
  24. 제4항에 있어서,
    상기 위암 판정수단은;
    상기 판별 점수에 따라 상기 판별 대상을 위암의 양성 또는 음성으로 판정하되,
    상기 판별 점수가 기준값 GS보다 크면 양성으로 상기 판별 대상의 위암 정보를 판단하고, 상기 판별 점수가 기준값 GS보다 작으면 음성으로 상기 판별 대상의 위암 정보를 판단하는 것을 특징으로 하는 위암 진단 장치.
  25. 제24항에 있어서,
    상기 기준값 GS는 0인 것을 특징으로 하는 위암 진단 장치.
  26. 제4항에 있어서,
    상기 위암 판정수단은;
    상기 판별 대상의 생물학적 시료를 반복적으로 측정하여 검출한 다수의 상기 저질량 이온 질량 스펙트럼에 대해 계산된 다수의 상기 판별 점수의 평균값으로 상기 판별 대상의 상기 위암 정보를 판단하는 것을 특징으로 하는 위암 진단 장치.
  27. 제4항에 있어서,
    상기 위암진단용이온 선정수단은;
    상기 선택된 상기 제1훈련집합으로부터 후보 조건을 만족하는 후보 저질량 이온들을 후보이온집합으로 선택하는 후보이온집합 선택수단; 및
    상기 선택된 상기 후보이온집합의 상기 후보 저질량 이온의 개별 또는 조합별 판별 성능을 기반으로 하여 위암 진단용 저질량 이온들을 최종이온집합으로 선택하는 최종이온집합 선택수단을 포함하는 것을 특징으로 하는 위암 진단 장치.
  28. 제27항에 있어서,
    상기 후보이온집합 선택수단은;
    상기 훈련 케이스 각각에 대한 상기 저질량 이온의 상기 피크 강도와, 상기 생물통계학적 분석을 통해 획득된 상기 저질량 이온별 인자적재값의 곱의 절댓값이 문턱값 GT1보다 큰 제1저질량 이온들을 상기 훈련 케이스별로 선택하는 제1저질량이온 선택모듈을 포함하는 것을 특징으로 하는 위암 진단 장치.
  29. 제28항에 있어서,
    상기 문턱값 GT1은 0.1인 것을 특징으로 하는 위암 진단 장치.
  30. 제28항에 있어서,
    상기 후보이온집합 선택수단은;
    상기 제1저질량 이온들 중 상기 훈련 케이스들 전체의 문턱값 GT2 퍼센트 이상의 케이스들에서 공통으로 나타나는 제2저질량 이온들을 상기 후보이온집합으로 선택하는 후보이온집합 예비선택모듈을 포함하는 것을 특징으로 하는 위암 진단 장치.
  31. 제30항에 있어서,
    상기 문턱값 GT2는 50인 것을 특징으로 하는 위암 진단 장치.
  32. 제30항에 있어서,
    상기 후보이온집합 선택수단은;
    상기 제2저질량 이온들을 이용해 상기 훈련 케이스별로 위암에 대한 양성 또는 음성을 나타내는 판별 점수를 계산하고, 상기 판별 점수에 따른 민감도 및 특이도를 계산하는 민감도 및 특이도 계산모듈; 및
    상기 민감도가 문턱값 GN3보다 작거나, 상기 특이도가 문턱값 GN4보다 작은 경우 상기 GT1 및 상기 GT2 중 적어도 하나를 변경하고, 상기 과정을 반복하여 상기 후보이온집합으로 선택하는 후보이온집합 최종선택모듈을 더 포함하는 것을 특징으로 하는 위암 진단 장치.
  33. 제32항에 있어서,
    상기 문턱값 GN3 및 GN4는 0.9인 것을 특징으로 하는 위암 진단 장치.
  34. 제27항에 있어서,
    상기 최종이온집합 선택수단의 상기 판별 성능의 기준은;
    상기 후보 저질량 이온 중 민감도와 특이도의 합이 기준값보다 큰 이온들을 선택하거나 상기 후보 저질량 이온들로 구성되는 조합별 민감도와 특이도의 합이 비교 대상 조합들 중 가장 큰 조합을 선택하는 제1기준을 포함하는 것을 특징으로 하는 위암 진단 장치.
  35. 제27항에 있어서,
    상기 최종이온집합 선택수단의 상기 판별 성능의 기준은;
    상기 후보 저질량 이온들의 조합들 중 상기 후보 저질량 이온들의 개수가 비교 대상 조합들 중 가장 적은 조합을 선택하는 제2기준을 더 포함하는 것을 특징으로 하는 위암 진단 장치.
  36. 제27항에 있어서,
    상기 최종이온집합 선택수단의 상기 판별 성능의 기준은;
    상기 후보 저질량 이온들의 조합들 중 진양성(true positive) 케이스의 최소 판별 점수와 진음성(ture negative) 케이스의 최대 판별 점수의 차가 비교 대상 조합들 중 가장 큰 조합을 선택하는 제3기준을 더 포함하며,
    상기 판별 점수는 상기 후보 저질량 이온들의 상기 스케일링된 피크 강도와 상기 인자적재값을 통해 계산되며, 위암에 대한 양성 또는 음성을 나타내는 것을 특징으로 하는 위암 진단 장치.
  37. 제27항에 있어서,
    상기 최종이온집합 선택수단은;
    상기 후보이온집합에 포함된 상기 후보 저질량 이온들을 상기 민감도가 상기 특이도보다 높은 고민감도 저질량 이온들을 포함하며 상기 고민감도 저질량 이온들을 상기 민감도와 상기 특이도의 합의 내림차순으로 정렬한 고민감도 집합{Sns1, Sns2, Sns3 … SnsI}과, 상기 특이도가 상기 민감도보다 높은 고특이도 저질량 이온들을 포함하며 상기 고특이도 저질량 이온들을 상기 민감도와 상기 특이도의 합의 내림차순으로 정렬한 고특이도 집합{Spc1, Spc2, Spc3 … SpcJ}으로 구분하는 이온 구분모듈;
    상기 고민감도 집합에서 상위 L개의 상기 고민감도 저질량 이온들{Sns1, Sns2, Sns3 … SnsL}과 상기 고특이도 집합에서 상위 L개의 상기 고특이도 저질량 이온들{Spc1, Spc2, Spc3 … SpcL} 중 2개 이상의 저질량 이온들로 구성되는 후보 조합들 중 상기 제1기준, 상기 제2기준 및 상기 제3기준 중 적어도 하나 이상에 의한 상기 판별 성능의 기준에 의해 선택된 조합을 바이오마커 그룹으로 선정하는 바이오마커그룹 예비선정모듈;
    상기 바이오마커 그룹과, 상기 고민감도 집합에서 차상위 M개의 상기 고민감도 저질량 이온들과 상기 고특이도 집합에서 차상위 M개의 상기 고특이도 저질량 이온들 중 적어도 하나 이상의 저질량 이온을 상기 바이오마커 그룹에 추가한 후보 조합들 중 상기 제1기준, 상기 제2기준 및 상기 제3기준 중 적어도 하나 이상에 의한 상기 판별 성능의 기준에 의해 선택된 조합을 상기 바이오마커 그룹으로 재선정하는 바이오마커그룹 재선정모듈; 및
    상기 고민감도 집합 및 상기 고특이도 집합에 차상위 저질량 이온이 존재하지 않을 때까지 상기 재선정 과정을 반복하여 상기 바이오마커 그룹을 최종 선정하는 바이오마커그룹 최종선정모듈을 포함하는 것을 특징으로 하는 위암 진단 장치.
  38. 제37항에 있어서,
    상기 최종이온집합 선택수단은;
    상기 후보이온집합에서 상기 바이오마커그룹 최종선정모듈에서 얻어진 상기 바이오마커 그룹으로 선정 완료된 조합의 저질량 이온들을 제외한 잔류 후보이온집합을 대상으로 상기 세 바이오마커 그룹 선정 과정을 반복 수행하여 추가 바이오마커 그룹을 선정하되, 상기 고민감도 집합 또는 상기 고특이도 집합에 상기 L개 미만의 질량 이온이 남을 때까지 상기 추가 바이오마커 그룹을 더 선정하는 바이오마커그룹 추가선정모듈; 및
    상기 바이오마커 그룹과 상기 추가 바이오마커 그룹들 중 진양성 및 진음성 판정의 정확도(accuracy)를 기준으로 상위 GK개의 바이오마커 그룹들의 조합의 저질량 이온들을 상기 위암 진단용 저질량 이온으로 선택하는 암진단용저질량이온 최종선택모듈을 더 포함하는 것을 특징으로 하는 위암 진단 장치.
  39. 제38항에 있어서,
    상기 L값은 2이고, 상기 M값은 1이며, 상기 GK값은 1, 2 또는 3 중 어느 하나인 것을 특징으로 하는 위암 진단 장치.
  40. 제27항에 있어서,
    상기 최종이온집합 선택수단은,
    상기 제1훈련집합에 대해 독립적인 제2훈련집합을 상기 제1훈련집합에 추가한 훈련 집합을 대상으로 상기 저질량 이온을 선택하는 것을 특징으로 하는 위암 진단 장치.
KR1020120134828A 2012-01-03 2012-11-26 위암 진단 장치 KR101439977B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
SG11201502499UA SG11201502499UA (en) 2012-01-03 2012-12-03 Cancer diagnosis device
PCT/KR2012/010358 WO2013103197A1 (ko) 2012-01-03 2012-12-03 암 진단 장치
JP2015549231A JP6134809B2 (ja) 2012-01-03 2012-12-03 癌診断装置

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20120000730 2012-01-03
KR1020120000730 2012-01-03

Publications (2)

Publication Number Publication Date
KR20130079988A true KR20130079988A (ko) 2013-07-11
KR101439977B1 KR101439977B1 (ko) 2014-09-12

Family

ID=48992273

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120134828A KR101439977B1 (ko) 2012-01-03 2012-11-26 위암 진단 장치

Country Status (1)

Country Link
KR (1) KR101439977B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160104330A (ko) 2015-02-26 2016-09-05 국립암센터 난소암 진단 장치와 난소암 진단 정보 제공 방법
KR20190130477A (ko) * 2018-04-20 2019-11-22 주식회사 에이엠아이티 예측 모델 훈련을 위한 데이터 세트 생성 방법 및 상기 예측 모델을 포함하는 장치

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2242856A1 (en) * 1996-02-01 1997-08-07 University Of Miami Methods for detection and evaluation of bladder cancer
AU2004261222A1 (en) 2003-08-01 2005-02-10 Correlogic Systems, Inc. Multiple high-resolution serum proteomic features for ovarian cancer detection
US20080046224A1 (en) * 2006-03-29 2008-02-21 Cangen Biotechnologies, Inc. Apparatus and method for predicting disease
EP2391886A4 (en) 2009-04-10 2013-04-17 Canon Kk METHOD FOR FORMING MASS IMAGE

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160104330A (ko) 2015-02-26 2016-09-05 국립암센터 난소암 진단 장치와 난소암 진단 정보 제공 방법
KR20190130477A (ko) * 2018-04-20 2019-11-22 주식회사 에이엠아이티 예측 모델 훈련을 위한 데이터 세트 생성 방법 및 상기 예측 모델을 포함하는 장치

Also Published As

Publication number Publication date
KR101439977B1 (ko) 2014-09-12

Similar Documents

Publication Publication Date Title
Yang et al. Comparative proteomic analysis for the insoluble fractions of colorectal cancer patients
KR101461615B1 (ko) 암 진단 장치
Buas et al. Candidate serum metabolite biomarkers for differentiating gastroesophageal reflux disease, Barrett’s esophagus, and high-grade dysplasia/esophageal adenocarcinoma
US20210405053A1 (en) Method for providing diagnostic information for biliary tract cancer and apparatus for diagnosing biliary tract cancer
CN105603101A (zh) 检测8个miRNA表达量的系统在制备诊断或辅助诊断肝细胞癌产品中的应用
Liang et al. Serum metabolomics uncovering specific metabolite signatures of intra-and extrahepatic cholangiocarcinoma
Hocker et al. Serum discrimination of early-stage lung cancer patients using electrospray-ionization mass spectrometry
KR101223270B1 (ko) 대장암 진단용 저질량 이온 결정 방법, 이를 이용하여 대장암 진단을 위한 정보를 제공하는 방법, 및 이를 위한 연산 장치
Ye et al. 1H NMR‐based metabolomics of paired esophageal tumor tissues and serum samples identifies specific serum biomarkers for esophageal cancer
Huang et al. Liquid chromatography–mass spectrometry based serum peptidomic approach for renal clear cell carcinoma diagnosis
CN107273717A (zh) 一种肺癌血清基因的检测模型及其构建方法和应用
Ossoliński et al. Targeted and untargeted urinary metabolic profiling of bladder cancer
CN111763740B (zh) 基于lncRNA分子模型预测食管鳞癌患者新辅助放化疗的疗效和预后的系统
Veronesi et al. The challenge of small lung nodules identified in CT screening: can biomarkers assist diagnosis?
KR101439977B1 (ko) 위암 진단 장치
Men et al. A prognostic 11 genes expression model for ovarian cancer
CN104818322A (zh) miRNA和Cyfra21-1联合在检测非小细胞肺癌中的应用
Wuxiao et al. A prognostic model to predict survival in stage III colon cancer patients based on histological grade, preoperative carcinoembryonic antigen level and the neutrophil lymphocyte ratio
CN116859050A (zh) 蛋白标志物组合在制备结直肠癌早期辅助诊断产品中的应用
Derveaux et al. Diagnosis of lung cancer: what metabolomics can contribute
KR101439981B1 (ko) 유방암 진단 장치
KR101439975B1 (ko) 대장암 진단 장치
Nannini et al. Chemotherapy-induced acceleration of DNA methylation-based biological age in breast cancer
Hocker et al. Distinguishing early-stage pancreatic cancer patients from disease-free individuals using serum profiling
EP2623984B1 (en) Apparatus for screening cancer

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20170818

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20180614

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20190823

Year of fee payment: 6