KR102094326B1 - 위장암의 위험을 평가하는 방법 및 시스템 - Google Patents

위장암의 위험을 평가하는 방법 및 시스템 Download PDF

Info

Publication number
KR102094326B1
KR102094326B1 KR1020147026479A KR20147026479A KR102094326B1 KR 102094326 B1 KR102094326 B1 KR 102094326B1 KR 1020147026479 A KR1020147026479 A KR 1020147026479A KR 20147026479 A KR20147026479 A KR 20147026479A KR 102094326 B1 KR102094326 B1 KR 102094326B1
Authority
KR
South Korea
Prior art keywords
test results
blood test
past
blood
classifier
Prior art date
Application number
KR1020147026479A
Other languages
English (en)
Other versions
KR20150005909A (ko
Inventor
니르 칼크스타인
야론 키나르
바르다 샬레브
가브리엘 초딕
인발 골드슈테인
Original Assignee
미디얼 리서치 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 미디얼 리서치 리미티드 filed Critical 미디얼 리서치 리미티드
Publication of KR20150005909A publication Critical patent/KR20150005909A/ko
Application granted granted Critical
Publication of KR102094326B1 publication Critical patent/KR102094326B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/483Physical analysis of biological material
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7271Specific aspects of physiological measurement analysis
    • A61B5/7275Determining trends in physiological measurement data; Predicting development of a medical condition based on physiological measurements, e.g. determining a risk factor
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57419Specifically defined cancers of colon
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57446Specifically defined cancers of stomach or intestine
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/50Determining the risk of developing a disease
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/5005Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
    • G01N33/5091Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing the pathological state of an organism
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57484Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites
    • G01N33/57488Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites involving compounds identifable in body fluids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16ZINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS, NOT OTHERWISE PROVIDED FOR
    • G16Z99/00Subject matter not provided for in other main groups of this subclass

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Immunology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Chemical & Material Sciences (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Physics & Mathematics (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • General Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Biochemistry (AREA)
  • Hospice & Palliative Care (AREA)
  • Microbiology (AREA)
  • Cell Biology (AREA)
  • Biotechnology (AREA)
  • Oncology (AREA)
  • Data Mining & Analysis (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Biophysics (AREA)
  • Artificial Intelligence (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physiology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Psychiatry (AREA)
  • Computational Linguistics (AREA)

Abstract

본 발명은 위장암의 위험을 평가하는 방법에 관한 것이다. 본 발명의 방법은 표적 개체로부터 수집된 혈액으로부터 복수의 현재 혈액 검사 결과를 포함하는 특징부 세트를 생성하는 단계; 또 다른 복수의 샘플링된 개체 각각의 복수의 개개 과거 혈액 검사 결과의 분석에 따라 생성된 적어도 하나의 분류기를 제공하는 단계; 및 상기 적어도 하나의 분류기를 사용하여 상기 특징부 세트를 분류함으로써 프로세서를 사용하여 상기 표적 개체의 위장암 위험을 평가하는 단계를 포함한다.

Description

위장암의 위험을 평가하는 방법 및 시스템 {METHODS AND SYSTEMS OF EVALUATING A RISK OF A GASTROINTESTINAL CANCER}
본 발명은, 일부 실시양태에서, 암의 진단, 및 보다 특히, 배타적이지는 않지만, 암의 위험을 평가하는 방법 및 시스템에 관한 것이다.
결장직장암의 진단은 면역학적 분변 잠혈 반응에 근거한 진단, 대장내시경에 의한 진단 등을 포함한다. 그러나, 분변 잠혈 검사에 근거한 진단은 확정 진단으로 사용되지 않고, 양성-소견을 갖는 대부분의 인간은 허위-양성 (false-positive)이다. 추가로, 초기 결장직장암과 관련하여, 검출 감도 및 검출 특이성은 분변 잠혈 검사에 기반한 진단 또는 대장내시경에 의한 진단에서 저하될 염려가 있다. 특히, 우측 결장에서의 초기 암은 분변 잠혈 검사에 의해 진단하는 경우에 빈번히 간과되고 있다. CT(컴퓨터 단층촬영법), MRI(자기 공명 영상), PET(양전자 방사형 컴퓨터 단층촬영) 등은 결장직장암의 진단에 적합하지 않다.
한편, 대장내시경 검사에 의한 결장직장암의 생검은 확정 진단으로 이용되고 있지만, 침습성이 높은 검사이고, 스크리닝 단계에서 대장내시경 검사를 실시하는 것은 실용적이지 않다. 추가로, 대장내시경 검사 등의 침습성 진단은 통증을 수반하는 것과 같이 개체에게 부담을 주고, 검사시에 출혈의 위험성 등도 있을 수 있다.
최근 수년 동안, 몇몇 신규한 방법이 결장직장암의 진단을 위해 개발되어 왔다. 예를 들어, 미국 특허공개공보 제US 2010/0009401호는 결장직장암을 평가하는 방법을 기재하며, 여기서 평가되는 대상체로부터 수집된 혈액 중의 아미노산의 농도치에 대한 아미노산 농도 데이터는 대상체의 측정된 아미노산 농도 데이터에 함유된 Arg, Cys, Om, Trp, Glu, ABA, Val, Phe, Leu, Gln, Ile 및 His 중의 적어도 하나의 농도치에 기초하여 평가된다.
미국 특허 제 6,059,724는, 개체의 향후 건강 상태를 예측하기 위한 컴퓨터-기반 시스템으로서, (a) 시험 모집단의 개체 구성원, 일정 기간 또는 일정 연령대에서 구체적인 생물학적 상태를 확인하여 분류한 보조 구성원의 소집단 D 및, 일정 기간 또는 일정 연령대에서 구체적인 생물학적 상태를 확인하지 않고 분류한 소집단 D로부터의 종렬로-얻은 생체지표 값의 데이타베이스를 포함하는 프로세서를 포함하는 컴퓨터; 및 (b) (1) 소집단 D 및 D에 속하는 구성원을 차별화하는 생체지표의 아단위를 상기 생체지표로부터 선택하는 단계로서, 상기 시험 모집단의 개체 구성원의 생체지표 값의 분포에 기초하여 상기 생체지표의 아단위를 선택하는 단계; 및 (2) (i) 일정 기간 또는 일정 연령대에서 구체적인 생물학적 상태를 확인할 수 있는 가능성이 낮은 소집단 PD 또는 일정 기간 또는 일정 연령대에서 구체적인 생물학적 상태를 확인할 수 있는 가능성이 높은 소집단 PD로 상기 시험 모집단의 구성원을 분류하거나; 또는 (ii) 상기 시험 모집단의 각 구성원에 대하여, 일정 기간 또는 일정 연령대에서 구체적인 생물학적 상태를 확인할 수 있는 가능성을 양적으로 추정하는데 사용할 수 있는 통계학적 과정을 개발하기 위해 상기의 선택된 생체지표의 분포를 이용하는 단계를 포함하는 컴퓨터 프로그램을 포함하는 컴퓨터-기반 시스템을 기술하고 있다.
미국 특허 제 5,692,220호는 혈액 병리학 분석, 예를 들어 혈액학 분석 및/또는 다른 혈액 검사 장치 또는 혈액 검사 시험으로부터의 데이타를 입력하고, 특정 환자의 상태에 상응하는 패턴과 비교하는 진단 시스템 및 진단 방법을 기술하고 있다. 일치 패턴은 미리 결정한 규칙에 따라 체계적으로 배열한다. 우선, 일치 패턴을 제시하고, 임의로 추가 검사를 권고한다. 추가 검사가 완료되면, 원 검사 데이타와 새로운 데이타를 비교하고, 일치 패턴 및 적어도 하나의 가장 고순위에 랭크된 패턴을 확인하고, 임의로 다른 진단을 적용한다.
미국 특허 출원 공개공보 제 2009/0069639호는 대상체로부터 채취한 시료를 분석하기 위한 분석 부분; 상기 분석 부분에서 얻은 분석 결과에 기초한 예측 질병을 대상체가 보유하고 있을 가능성을 결정하기 위한 결정 부분; 상기 결정 부분에서, 상기 예측 질병과 관련된 진단 보조 정보를 제시하는 진단 보조 정보 스크린을 제시하기 위한 진단 보조 정보 제시 부분을 포함하는 진단 보조 시스템을 제안하고 있다. 진단 보조 정보 제공 장치 및 컴퓨터 프로그램 생성물이 또한 기술되어 있다.
미국 특허 출원 공개공보 제 2010/0009401호는 본 발명의 대장암 평가 방법을 기술하고 있으며, 상기 방법에 따르면, 평가되는 대상체에서 채취한 혈액 중 아미노산 농도 값의 아미노산 농도 데이타를 측정하고, 상기 대상체의 측정된 아미노산 농도 데이타에 포함된 Arg, Cys, Orn, Trp, Glu, ABA, Val, Phe, Leu, Gln, Ile 및 His 중 적어도 하나의 농도 값에 기초하여 상기 대상체의 대장암 상태를 평가한다.
본 발명의 일부 실시양태에 따르면, 위장암 위험을 평가하는 컴퓨터화된 방법이 제공된다. 이 방법은 표적 개체로부터 수집된 혈액으로부터 복수의 현재 혈액 검사 결과를 포함하는 특징부(feature) 세트를 생성하는 단계; 또 다른 복수의 샘플링된 개체 각각의 복수의 개개 과거 혈액 검사 결과의 분석에 따라 생성된 적어도 하나의 분류기를 제공하는 단계; 및 프로세서를 사용하여, 상기 적어도 하나의 분류기를 사용하여 상기 특징부 세트를 분류함으로써 상기 표적 개체의 위장암 위험을 평가하는 단계를 포함한다. 복수의 과거 및 현재 혈액 검사 결과는 각각 하기 혈액 검사: 적혈구(RBC), 헤모글로빈(HGB) 헤마토크릿(HCT) 중의 적어도 하나의 결과, 및 하기 혈액 검사: 헤모글로빈(MCH) 및 평균 적혈구 헤모글로빈 농도(MCHC) 중의 적어도 하나의 결과를 포함한다. 임의로, 혈액 검사 결과는 전체 혈구수(CBC) 검사로부터 추출된다.
임의로, 특징부 세트는 표적 개체의 연령을 포함하고, 여기서 적어도 하나의 분류기는 또 다른 복수의 샘플링된 개체 각각의 연령의 분석에 따라 생성된다.
임의로, 복수의 과거 및 현재 혈액 검사 결과는 각각 적혈구 분포 폭(RDW)의 결과를 포함한다.
임의로, 복수의 과거 및 현재 혈액 검사 결과는 각각 혈소판 헤마토크릿(PCT)의 결과를 포함한다.
임의로, 복수의 과거 및 현재 혈액 검사 결과는 각각 평균 세포 용적(MCV)의 결과를 포함한다.
임의로, 복수의 과거 및 현재 혈액 검사 결과는 각각 하기 혈액 검사: 백혈구수-WBC(CBC); 평균 혈소판 용적(MPV); 평균 세포; 혈소판수(CBC); 호산구수; 호중구 비율; 단핵구 비율; 호산구 비율; 호염기구 비율 및 호중구수; 단핵구수 중의 적어도 하나를 포함한다.
임의로, 적어도 하나의 분류기는 가중 선형 회귀 분류기, K-최근방(KNN) 분류기 및 랜덤 포레스트(random forest) 분류기로 이루어진 그룹의 구성요소를 포함한다.
임의로, 상기 특징부 세트는 표적 개체의 적어도 하나의 인구통계학적 특성, 및 복수의 샘플링된 개체 각각의 상기 적어도 하나의 인구통계학적 특성 각각의 분석에 따라 생성된 적어도 하나의 분류기를 포함한다.
임의로, 본 발명의 방법은 적어도 하나의 상이한 인구통계학적 특성을 갖는 샘플링된 개체의 복수의 개개 과거 혈액 검사 결과에 따라 각각 생성된 복수의 분류기로부터 상기 개체의 적어도 하나의 인구통계학적 특성에 따라 상기 적어도 하나의 분류기를 선택하는 단계를 추가로 포함한다.
임의로, 복수의 혈액 검사 결과는 하기 복수의 혈액 검사로부터의 적어도 하나의 결과를 포함하고, 생화학적 혈액 검사 결과는 임의의 하기 혈액 검사 결과: 알부민, 칼슘, 클로라이드, 콜레스테롤, 크레아티닌, 고밀도 지단백질(HDL), 저밀도 지단백질(LDL), 칼륨, 나트륨, 트리글리세라이드, 우레아 및/또는 요산을 포함할 수 있다.
본 발명의 일부 실시양태에 따르면, 위장암 평가 시스템이 제공된다. 이 시스템은 프로세서; 또 다른 복수의 샘플링된 개체 각각의 복수의 과거 혈액 검사 결과의 분석에 따라 생성된 적어도 하나의 분류기를 저장하는 기억 유닛; 표적 개체의 혈액으로부터 채취한 복수의 현재 혈액 검사 결과를 수신하는 입력 유닛 및 상기 프로세서를 사용하여, 상기 적어도 하나의 분류기를 사용하여 상기 복수의 현재 혈액 검사 결과로부터 추출된 특징부 세트를 분류함으로써 상기 표적 개체의 위장암 위험을 평가하는 위장암 평가 모듈을 포함한다. 복수의 과거 및 현재 혈액 검사 결과는 하기 복수의 혈액 검사: 적혈구 세포(RBC), 헤모글로빈(HGB) 및 헤마토크릿(HCT) 중의 적어도 하나의 결과, 및 하기 혈액 검사: 헤모글로빈(MCH) 및 평균 적혈구 헤모글로빈 농도(MCHC) 중의 적어도 하나의 결과를 포함한다.
임의로, 복수의 과거 및 현재 혈액 검사 결과는 각각 적혈구 분포 폭(RDW)의 결과를 포함한다.
임의로, 복수의 과거 및 현재 혈액 검사 결과는 각각 혈소판 헤마토크릿(PCT)의 결과를 포함한다.
임의로, 복수의 과거 및 현재 혈액 검사 결과는 각각 평균 세포 용적(MCV)의 결과를 포함한다.
본 발명의 일부 실시양태에 따르면, CRC 위험 평가를 위한 분류기를 생성하는 방법이 제공된다. 이 방법은 또 다른 복수의 샘플링된 개체 각각의 복수의 과거 혈액 검사 결과를 제공하는 단계; 또 다른 상기 복수의 샘플링된 개체의 복수의 과거 혈액 검사 결과 각각에 따라 생성된 복수의 특징부 세트를 갖는 데이터세트를 생성하는 단계; 상기 분석 데이터세트에 따라 적어도 하나의 분류기를 생성하는 단계 및 상기 적어도 하나의 분류기를 출력하는 단계를 포함한다.
임의로, 상기 생성은, 각각의 상기 특징부 세트에 대한 특징부로서 상기 복수의 과거 혈액 검사 결과로부터 채취한 과거 혈액 검사 결과의 적어도 하나의 조작된 버젼을 계산 및 부가하는 것을 포함한다.
임의로, 상기 생성은 상기 각각의 복수의 과거 혈액 검사 결과의 일수에 따라 상기 특징부 세트를 가중하는 것을 포함한다.
임의로, 상기 생성은 표준 편차 최대 역치에 따라 이상치(outlier)를 제거하기 위해 상기 복수의 특징부 세트를 여과하는 것을 포함한다.
임의로, 복수의 특징부 세트는 상기 각각의 복수의 과거 혈액 검사 결과의 일수에 따라 가중된다.
임의로, 복수의 혈액 검사 결과는 하기 혈액 검사: 적혈구 세포(RBC), 헤모글로빈(HGB) 및 헤마토크릿(HCT) 중의 적어도 하나의 결과, 및 하기 혈액 검사: 헤모글로빈(MCH) 및 평균 적혈구 헤모글로빈 농도(MCHC) 중의 적어도 하나의 결과를 포함한다.
임의로, 복수의 과거 및 현재 혈액 검사 결과는 각각 적혈구 분포 폭(RDW)의 결과를 포함한다.
임의로, 복수의 과거 및 현재 혈액 검사 결과는 각각 혈소판 헤마토크릿(PCT)의 결과를 포함한다.
임의로, 복수의 과거 및 현재 혈액 검사 결과는 각각 평균 세포 용적(MCV)의 결과를 포함한다.
보다 임의로, 상기 방법은 상기 복수의 샘플링된 개체 각각의 적어도 하나의 인구통계학적 파라미터를 각각의 상기 특징부 세트에 부가하는 것을 추가로 포함한다.
보다 임의로, 상기 적어도 하나의 인구통계학적 파라미터는 성별, 연령, 거주 영역, 인종 및 사회경제적 특징으로 이루어진 그룹의 구성요소이다.
보다 임의로, 상기 생성은 각각의 상기 특징부 세트에 대한 특징부로서 상기 적어도 하나의 인구통계학적 파라미터의 적어도 하나의 조작된 버젼을 계산 및 부가하는 것을 포함한다.
달리 정의하지 않는 한, 본원에서 사용된 모든 기술 및/또는 과학 용어는 본 발명이 관계하는 기술분야의 통상의 기술자에 의해 통상 이해되는 바와 동일한 의미를 갖는다. 본원에 기재된 것들과 유사하거나 동등한 방법 및 재료가 본 발명의 실시양태의 실시 또는 시험에 사용될 수 있고, 예시적 방법 및/또는 재료가 하기에 기재되어 있다. 모순하는 경우, 정의를 포함하는 특허 명세서가 우선한다. 또한, 재료, 방법 및 실시예는 예시적인 것이며, 반드시 한정을 의도하는 것은 아니다.
본 발명의 실시양태의 방법 및/또는 시스템의 실시는 선택된 과제를 수동으로, 자동으로 또는 이들의 조합으로 실시 또는 완성하는 것을 포함한다. 더욱이, 본 발명의 방법 및/또는 시스템의 실시양태의 실제 기구 및 장비에 따라, 몇몇 선택된 과제는 하드웨어, 소프트웨어 또는 운영 체계를 사용하는 이들의 조합에 의해 실시할 수 있다.
예를 들어, 본 발명의 실시양태에 따르는 선택된 과제를 실시하기 위한 하드웨어는 칩 또는 회로로서 실현할 수 있다. 소프트웨어로서, 본 발명의 실시양태에 따르는 선택된 과제는 임의의 적합한 운영 체계를 사용하는 컴퓨터에 의해 실행되는 다수의 소프트웨어 명령으로 실현할 수 있다. 본 발명의 예시적 실시양태에서, 본원에 기재된 방법 및/또는 시스템의 예시적 실시양태에 따르는 하나 이상의 과제는 데이터 프로세서, 예를 들어, 복수의 명령을 실행하는 컴퓨팅 플랫폼에 의해 실행된다. 임의로, 데이터 프로세서는 명령 및/또는 데이터를 저장하는 휘발성 메모리 및/또는 명령 및/또는 데이터를 저장하는 비-휘발성 저장, 예를 들어, 자기 하드-디스크 및/또는 제거가능한 매체를 포함한다. 임의로, 네트워크 접속도 또한 제공된다. 키보드 또는 마우스 등과 같은 디스플레이 및/또는 사용자 입력 장치가 또한 임의로 제공된다.
본 발명의 일부 실시양태는 첨부하는 도면을 참조로 하여 단지 예로서만 본원에 기재되어 있다. 이제 도면을 상세하게 구체적으로 참조하면, 제시되어 있는 상세는 예시로서 및 본 발명의 실시양태의 예시적 논의를 목적으로 하는 것이 강조된다. 이와 관련하여, 도면과 함께 첨부된 기재는 본 발명의 실시양태가 실시될 수 있는 방법을 당해 기술분야의 통상의 기술자에게 명백하게 한다.
도면에서,
도 1은, 본 발명의 일부 실시양태에 따라, 복수의 개체 기록의 분석에 따라 위장암 위험 스코어를 평가하기 위한 하나 이상의 분류기를 생성하는 방법의 흐름도이고;
도 2는, 본 발명의 일부 실시양태에 따라, 예를 들어, 도 1에 제시된 방법을 실시함으로써 하나 이상의 분류기를 생성하는 시스템의 개략도이고;
도 3은, 본 발명의 일부 실시양태에 따라, 수신자 작동 특성(ROC) 곡선 그래프이고;
도 4a 내지 4c는, 본 발명의 일부 실시양태에 따라, 상이한 예시적 분류기의 성능을 요약한 표이고;
도 5a는 남성의 경우에 랜덤 포레스트 분류기에서 이들의 중요성에 따라 수록되어 있는 사용된 특징부 세트의 표의 이미지이고;
도 5b는 혈액 검사의 결과의 쌍 사이의 상관관계를 나타내는 표이고;
도 6은 몇몇 시간-윈도우에 대한 성능을 나타내는 표의 이미지이고;
도 7은 랜덤 포레스트 분류기의 성능을 나타내는 표의 이미지이고;
도 8은, 본 발명의 일부 실시양태에 따라, 표적 개체의 경우에 위장 위험 스코어를 평가하는 분류기(들)를 사용하는 방법의 흐름도이고;
도 9는, 본 발명의 일부 실시양태에 따라, 상이한 모집단 그룹에 대한 상이한 감도에서 결장, 위, 직장 및 식도암 중의 각각의 하나에 대한 분류기의 성능을 나타내는 표이고;
도 10은, 본 발명의 일부 실시양태에 따라, 빈혈 및 빈혈이 아닌 개체(백인 미국인)를 분류하는 상술한 분류기를 사용한 결과의 분석을 요약한 표 세트이다.
본 발명은, 이의 일부 실시양태에서, 암 진단 및 보다 특히, 배타적이지는 않지만, 암 위험을 평가하는 방법 및 시스템에 관한 것이다.
본 발명의 일부 실시양태에 따르면, 복수 개체의 과거 혈액 검사 결과의 분석에 따라 생성되는 하나 이상의 분류기를 사용하여 표적 개체의 현재 혈액 검사 결과의 세트를 분류함으로써 위장암 위험을 평가하는 방법 및 시스템이 제공된다. 현재 혈액 검사 결과의 세트는 하기 혈액 검사: 헤모글로빈(HGB), 헤마토크릿(HCT) 및 적혈구(RBC) 중의 적어도 하나의 결과, 및 하기 혈액 검사: 평균 세포 헤모글로빈(MCH) 및 평균 적혈구 헤모글로빈 농도(MCHC) 중의 적어도 하나의 결과 및 표적 개체의 연령을 포함한다. 임의로, 현재 혈액 검사 결과의 세트는 하기 혈액 검사: 백혈구수-WBC(CBC); 평균 혈소판 용적(MPV); 평균 세포 용적(MCV); 적혈구 분포 폭(RDW); 혈소판수(CBC); 호산구수; 호중구 비율; 단핵구 비율; 호산구 비율; 호염기구수 비율; 호중구수; 단핵구수 및 혈소판 헤마토크릿(PCT) 중의 하나 이상을 추가로 포함한다.
임의로, 위장암 위험은 대상 개체의 생화학적 혈액 검사 결과를 분류함으로써 평가된다. 이러한 실시양태에서, 분류기는 복수 개체의 과거 생화학적 혈액 검사 결과의 분석에 따라 생성된다. 생화학적 혈액 검사 결과는 임의의 하기 혈액 검사: 알부민, 칼슘, 클로라이드, 콜레스테롤, 크레아티닌, 고밀도 지단백질(HDL), 저밀도 지단백질(LDL), 칼륨, 나트륨, 트리글리세라이드, 우레아 및/또는 요산의 결과를 포함할 수 있다.
임의로, 위장암 위험은 표적 개체의 인구통계학적 특성을 분류함으로써 평가된다. 이러한 실시양태에서, 분류기는 복수 개체의 인구통계학적 특성의 분석에 따라 생성된다.
임의로, 표적 개체의 현재 혈액 검사 결과 및 샘플링된 개체의 과거 혈액 검사 결과 둘 다는 조작된 및/또는 가중된 값을 포함하는 사용된 특징부 세트를 생성하기 위해 사용된다. 임의로, 각각의 사용된 특징부 세트는, 예를 들어, 하기 기재된 바와 같이, 각 개체의 인구통계학적 특성에 기초한다.
임의로, 하나 이상의 분류기는 표적 개체의 하나 이상의 인구통계학적 특성에 적합하다. 임의로, 분류기는 표적 개체의 하나 이상의 인구통계학적 특성에 일치하도록 선택된다. 이러한 실시양태에서, 상이한 분류기가 여성 및 남성을 위해 사용될 수 있다.
본 발명의 일부 실시양태에 따라, 위장 위험 평가를 위한 하나 이상의 분류기를 생성하는 방법 및 시스템이 제공된다. 상기 방법 및 시스템은, 또 다른 복수의 샘플링된 개체 각각의 복수의 과거 혈액 검사 결과를 분석하고, 따라서 각각의 과거 혈액 검사 결과에 따라 각각 생성된 복수의 특징부 세트를 갖는 데이터세트를 생성하는 것에 기반한다. 이어서, 데이터세트를 사용하여 하나 이상의 분류기, 예를 들어, K-최근방(KNN) 분류기, 랜덤 포레스트 분류기 및 가중 선형 회귀 분류기를 생성 및 출력한다. 분류기는 클라이언트 단말로 실행하기 위한 모듈로서 제공되거나, 이들의 현재 혈액 검사 결과에 기초하여 표적 개체의 위장암 위험을 평가하는 온라인 서비스로서 사용될 수 있다.
본 발명의 적어도 하나의 실시양태를 상세히 설명하기 전에, 본 발명은 하기 상세한 설명에 기재되고/되거나 도면 및/또는 실시예에 설명된 성분 및/또는 방법의 구성 및 배치의 상세로 이의 적용이 반드시 한정되지 않는 것이 이해되어야 한다. 본 발명은 또 다른 실시양태가 가능하거나 다양한 방식으로 실시 및 수행될 수 있다.
이제 도 1을 참조하면, 도 1은, 본 발명의 일부 실시양태에 따라, 복수의 진단된 개체 각각의 복수의 과거 검사 결과의 분석에 따라 위장암 위험 스코어를 평가하기 위한 하나 이상의 분류기를 생성하는 방법(100)의 흐름도이다. 본원에 사용된 바와 같이, 위장암은 결장, 위, 직장 또는 식도 암일 수 있다. 또한 도 2를 참조하면, 도 2는, 본 발명의 일부 실시양태에 따라, 예를 들어, 도 1에 제시된 방법을 실시함으로써 위장암 위험 스코어를 평가하기 위한 분류기(들)를 생성하는 시스템(200)의 개략도이다.
시스템(200)은 하나 이상의 의료 기록 데이터베이스(들)(201)을 포함하고/하거나 의료 기록 데이터베이스 인터페이스에 접속되어 있다. 데이터베이스(들)(201)는, 복수의 개체 샘플로서 지칭되는, 복수의 개체 기록을 포함하고, 이는, 또 다른 복수의 샘플링된 개체 각각의 경우, 또 다른 개체의 복수의 과거 검사 결과 각 세트의 하나 이상의 세트, 및 임의로 하나 이상의 인구통계학적 파라미터(들) 및 위장암 예후를 기재한다. 복수의 과거 검사 결과, 인구통계학적 파라미터(들), 예를 들어, 연령, 및/또는 위장암 예후의 세트는 통상의 샘플 기록에 저장될 수 있고/있거나 다수의 독립적 및/또는 접속된 데이터베이스로부터 수집될 수 있다. 임의로, 위장암 예후는 암 등록 기록에 따르는 2진수 표시 세트이다. 상이한 검사 결과는 통상 실시된 혈액 검사 및/또는 동일한 기간 동안 유지된 혈액 검사의 것일 수 있다. 임의로, 복수의 과거 검사 결과의 일부 세트는 소실 혈액 검사 결과를 갖는다. 이들 결과는 임의로 다른 개체의 이용가능한 혈액 검사 결과의 가중 평균에 의해 완성된다. 상기 방법은 프로세서(204), 분류기 생성 모듈(205) 및 인터페이스 유닛(206), 예를 들어, 네트워크 인터페이스를 추가로 포함한다.
본원에 사용된 바와 같이, 인구통계학적 파라미터는 연령, 성별, 인종, 체중, 국적, 거주지 등을 포함한다.
먼저, (101)에 제시된 바와 같이, 복수의 개체 샘플의 하나 이상의 데이터베이스(들)이 제공된다.
임의로, (102)에 제시된 바와 같이, 복수의 개체 샘플은 일치 기준에 따라 스크리닝 및/또는 선택된다. 예를 들어, 샘플 기록은 결장암을 갖고 임의로 다른 유형의 암을 갖지 않는 암 등록에서 나타나거나 암 등록에서 나타나지 않는 40세 이상 연령의 개체의 것이다. 임의로, 암 등록에서 나타나는 개체의 샘플 기록은, 이들이 기록하는 복수의 과거 검사 결과의 최근 세트가 암 등록에서 각각의 개체의 등록 전의 특정 기간 동안, 예를 들어, 금일전 적어도 30일 및 최대 2년의 기간 동안 채취한 경우에만 취한다. 임의로, 암 등록에 나타나지 않는 개체의 샘플 기록은 양성 및 음성 위장암 모집단에 대한 동등 시간-분포(혈액 검사 타이밍)를 생성하는 복수의 과거 검사 결과의 세트를 포함하는 경우에만 취한다. 양성 및 음성 샘플의 시간-분포를 동등화하는 방법은 또한 적어도 일부 음성(미등록) 샘플의 생략을 유도하고 데이터 세트에서 위장 유병율의 변화를 유도한다.
이제, (103)에 제시된 바와 같이, 매트릭스 등의 평가 데이터세트는, 예를 들어, 분류기 생성 모듈(205)에 의해 샘플 기록으로부터 추출된 샘플 데이터에 따라 생성된다. 평가 데이터세트는 임의로 사용된 복수의 특징부 세트를 포함한다. 각각의 특징부 세트는 스크리닝된 및/또는 선택된 샘플 기록 중의 각각으로부터 생성된다. 특징부 세트는 임의로 실제 혈액 검사 및/또는 인구통계학적 특성 값을 포함하는 미처리 특징부이다.
상기한 바와 같이, 각각의 샘플 기록은 개체의 복수의 과거 검사 결과의 하나 이상의 세트를 포함하고, 각각은 조합 혈액 검사 결과의 조합, 예를 들어, 10개, 15개, 20개 및/또는 임의의 중간수의 혈액 검사 결과의 조합을 포함한다. 한 가지 예에서, 미처리 특징부의 각각의 추출된 세트는 적어도 하기 18개 혈액 검사 결과: 적혈구(RBC); 백혈구수-WBC(CBC); 평균 혈소판 용적(MPV); 헤모글로빈(HGB); 헤마토크릿(HCT); 평균 세포 용적(MCV); 평균 세포 헤모글로빈(MCH); 평균 적혈구 헤모글로빈 농도(MCHC); 적혈구 분포 폭(RDW); 혈소판수(CBC); 호산구수; 호중구 비율; 단핵구 비율; 호산구 비율; 호염기구 비율; 호중구수; 단핵구수 및 혈소판 헤마토크릿(PCT)를 포함한다. 또 다른 예에서, 미처리 특징부의 각각 추출된 세트는 적어도 하기 혈액 검사 결과: HGB, HCT 및 RBC, 하기 혈액 검사: MCH 및 MCHC 중의 적어도 하나의 결과 및 표적 개체의 연령을 반영하는 추가의 데이터를 포함한다. 임의로, 미처리 특징부의 이러한 추출된 세트는 하나 이상의 하기 혈액 검사: RDW, 혈소판 및 MCV를 추가로 포함한다. 추가로, 미처리 특징부의 이러한 추출된 세트는 하나 이상의 하기 혈액 검사: WBC, 호산구수, 호중구 비율 및/또는 수, 호염기구 비율 및/또는 수, 및 단핵구 비율 및/또는 수를 추가로 포함한다.
임의로, 미처리 특징부의 세트가 사용된다. 특징부의 사용된 세트는, 상기 미처리 혈액 검사 결과 및/또는 하나 이상의 인구통계학적 파라미터(들) 및 임의로 조작된 혈액 검사 결과 및/또는, 예를 들어, 하기 기재된 바와 같은 혈액 검사 결과의 조합으로서의 특징부를 함유한다. 예를 들어, 사용된 특징부 세트 중의 각각의 특징부는 혈액 검사 결과, 인구통계학적 특성, 혈액 검사 결과(들) 및/또는 인구통계학적 특성(들)의 조합, 및/또는 혈액 검사 결과(들) 및/또는 인구통계학적 특성(들)의 조작에 기초한다. 예를 들어, 미처리 특징부의 세트가 18개 검사 결과를 포함하는 경우, 114개 특징부의 사용된 세트는 하기에 기초하여 생성된다:
1. 18개 특징부, 각각은 또 다른 18개 혈액 검사 결과를 포함한다.
2. 18개 특징부, 각각은 18개 혈액 검사 결과 중의 하나와 제1 가상 결과 사이의 차이(예: 비율)를 포함한다. 제1 가상 결과는 샘플 기록으로부터 각각의 이용가능한 결과의 가중 평균에 의해 임의로 계산된다. 임의로, 각각의 이용가능한 검사는 이의 실시 및 표적 일수, 임의로 본원에서 표적 일수로 지칭되는, 표적 개체의 복수의 과거 검사 결과의 세트 일수로부터 경과된 기간에 따라 가중된다. 임의로, 이용가능한 검사는 제1 기간 동안, 예를 들어, 표적 일수 540일 전에 취한 검사이다. 예를 들어, 중량은 이의 기록(예: 검사가 수행된 경우)으로부터 경과된 시간으로부터 유도된 절대값으로 계산될 수 있다. 중량은 스퀘어 함수, 또는 절대값에 대해 일정한 기타 임의의 함수로서 계산할 수 있다.
3. 18개 특징부, 각각은 18개 혈액 검사 결과 중의 하나 및 제2 가상 결과 사이의 차이(예: 비율)를 포함하고, 이는 제2 기간, 예를 들어, 표적 일수전 1080일 동안 취한 이용가능한 검사에 기초하여 상기한 제1 가상 결과로서 임의로 계산된다.
4. 1개 특징부 - 사용자가 표적 일수전 1년 기간 동안 수행한 복수의 과거 검사 결과의 세트 수.
5. 1개 특징부 - 사용자가 표적 일수전 180*6 및 180*10일 사이의 기간 동안 수행한 복수의 과거 검사 결과의 세트 수.
6. 1개 특징부 - 개체의 연령, 예를 들어, 개체의 출생년.
7. 상기 특징부 모두의 제곱 값인 57개 특징부(1 내지 6 항목에 상세히 설명됨).
임의로, 하나 이상의 생화학적 혈액 검사 결과는 개체별로 문서화할 수 있고, 임의로 특징부 세트에 대한 특징으로 부가될 수 있다. 이들 특징부는 상기 혈액 검사 결과로 처리될 수 있다. 생화학적 혈액 검사 결과는 임의의 하기 혈액 검사 결과, 알부민, 칼슘, 클로라이드, 콜레스테롤, 크레아티닌, 고밀도 지단백질(HDL), 저밀도 지단백질(LDL), 칼륨, 나트륨, 트리글리세라이드, 우레아 및/또는 요산을 포함할 수 있다.
임의로, 상이한 세트의 사용된 특징부를 갖는 상이한 평가 데이터세트, 예를 들어, 매트릭스는 상이한 인구통계학적 특성(들), 예를 들어, 성별을 갖는 표적 개체를 분류하는 상이한 분류기를 작성하기 위해 생성된다.
임의로, 평가 데이터세트, 예를 들어, 매트릭스는 반복적으로 이상치(outliers)를 제거하기 위해 여과된다. 임의로, 평균 편차 및/또는 각 특징부의 표준 편차를 계산하고, 예외의 값, 예를 들어, 표준 편차 최대 역치, 예를 들어, 10을 초과하는 특징부는 표준 편차 최대 역치로 절삭한다. 예를 들어, 상기 공정은 10회(또는 임의의 절삭이 수행되는 경우, 보다 적음) 반복적으로 반복한다. 클리닝 공정을 기재하는 예시적 의사 코드는 다음과 같다:
Figure 112014089787110-pct00001
이제, (104)에 제시된 바와 같이, 평가 데이터세트는, 예를 들어, 분류기 생성 모듈(205)에 의해 하나 이상의 이의 인구통계학적 특성 및 복수의 검사 결과의 현재 세트에 기반하여 표적 개체의 위장암 위험을 각각 분류하는 분류기(들)를 생성하기 위해 사용된다. 임의로, 하나 이상의 하기 분류기는 평가 데이터세트에 기반하여 생성될 수 있다:
양성 샘플 기록이 음성 샘플 기록의 스코어의 약 100배인 스코어를 수용하는 가중 선형 회귀 분류기;
K-최근방(KNN) 분류기, 예를 들어, 음성 샘플 기록의 100배 다운-샘플링; 및
랜덤 포레스트 분류기, 예를 들어, 각각의 트리가 2:1 비율의 음성 대 양성 샘플 기록을 사용하여 작성되는 경우.
임의로, 분류기 중의 각각의 성능은, 본원에서 모집단으로 지칭되는 평가 데이터세트를 10의 균등-크기 부분으로 랜덤으로 분할하는 10분할 교차 검정 프로세스를 사용하여 평가한다. 각 부분에 대해서, 하기를 수행할 수 있다:
각각의 부분에서 없는 모집단의 90%로부터 혈액 검사 결과의 사용가능한 세트를 선택하고;
혈액 검사 결과의 선택된 세트에 따라 분류기를 훈련하고;
각각의 부분에서 모집단의 10%로부터의 혈액 검사 결과 세트를 선택하고; 및
모집단의 10%로부터 혈액 검사 결과의 선택된 세트에 대해 분류기를 사용하는 것.
이제, 또한 예측으로도 지칭되는 분류는 각 분류기의 성능을 측정하기 위해 수집된다. 예를 들어, 성능의 측정치는, 예를 들어, 도 3에 제시된 바와 같이, 수신자 작동 특성(ROC) 곡선에 따라 선택된다. 임의로, 상이한(5%, 10%, 20%, 50% 및 70%) 감소(리콜) 값에서의 특이성은 측정치를 식별하기 위해 사용된다. 상이한 예시적 분류기의 성능은 도 4a 내지 4c에 제공된 표에 요약되어 있고, 이들은 각각 0.840±0.001, 0.820±0.001 및 0.833±0.001의 곡선하 면적(AUC)를 갖는다. 도 3 및 도 4a 내지 4c는 40세 이상의 217,246명의 전체 모집단에 기초하여 계산되고, 1,415명은 양성 결장직장암(CRC)을 갖는 것으로 식별되었음에 주의해야 한다. 임의로, 표 중의 번호의 각각(리프트, 평가된 정확도 및 특이성)은, 예를 들어, 10의 상이한 교차 검증 도식에 대해 계산된 평균 ± 표준 편차(std)를 나타낸다.
본원에 사용된 바와 같이, 리콜은 CRC 개체의 비율(TP 및 거짓 음성(FN) 둘 다)에 상응하는 TP 분류된 개체의 진정 양성(TP) 비율, 예를 들어, TP/(TP+FN)을 나타낸다. 본원에 사용된 바와 같이, 정확도는 CRC를 갖는 것으로 분류되는 모집단의 비율, 예를 들어 TP/(TP+FP)을 나타낸다. 본원에 사용된 바와 같이, 리프트는 모집단에서 정확도 대 전체 CRC 유병율의 비율을 나타낸다. 예를 들어, 40세 이상의 217,246명의 전체 모집단 중에서, 1,415명은 양성 CRC를 갖는 것으로 확인되었다. 이 예에서, 유병율은 0.65%이다. 정확한 시간-분포(상기 참조)를 작성하기 위한 음성 샘플의 선택은 학습 및 검사 모집단에서 바이어스를 생성하여, 1.2%의 CRC 유병율을 유도한다. 따라서, 리프트는 직접 발견할 수 있지만, 측정된 정확도를 조절함으로써 평가된 정확도를 판단하기 위해 간접적으로 사용된다.
임의로, 분류를 위해 특정 분류기에 의해 사용되는 특징부의 세트는 분류 중요성에 따라 가중된다. 특징부의 중요성은, 분할에 기인하여 기니 계수(통계학적 분산)에 의해 측정된 바와 같이, 데이터 트리와 비교하여 노드 불순물의 감소의 평균 값으로 결정될 수 있다. 예를 들어, 도 5a는 남성에 대한 랜덤 포레스트 분류기에서 이들의 중요성에 따라 수록되는 특징부의 사용된 세트의 표를 나타낸다.
분류기의 과거 혈액 검사 결과 및 현재 혈액 검사는 성질상 유사한 것으로 간주되는 혈액 검사의 혈액 검사 결과의 쌍을 포함할 수 있음에 주의해야 한다. 이들 쌍은 하나 이상의 하기 쌍: 헤모글로빈(HGB) 및 헤마토크릿(HCT), 호중구 비율/수 및 림프구 비율/수(즉, CBC 검사로부터 추출됨), MCV 및 MCH, RBC 및 헤마토크릿(HCT), RBC 및 MCV를 포함한다. 이러한 쌍의 혈액 결과 둘 다의 검사는, 이들 혈액 결과가 공통의 지표를 갖고 누적 값을 갖지 않는, 당해 기술분야의 기술자에게 사소하지 않고, 따라서 당해 기술분야의 기술자는, 유사한 혈액 검사의 쌍의 구성요소 둘 다가 아니라, 유사한 혈액 검사의 쌍의 하나의 구성요소의 결과만을 사용할 것이다. 본 발명자들은 놀랍게도 이러한 쌍의 구성요소 사이의 상관관계가 절대적이지 않고 상기 기재된 분류기(들)의 성능에 대한 기여가 실질적이라는 것을 발견했다. 예를 들어, 도 5b 중의 표 참조.
분류기의 성능은, 암 등록에서 등록된 바와 같이, 혈액 검사 결과 일수 및 암 발견 일수의 최종 세트 사이의 시간에 의존하는 것에 주의해야 한다. 이러한 의존성은 양성 샘플에 대한 허용가능한 혈액 검사가 제한 시간-윈도우(예를 들어, 암 등록전 30 내지 90일, 90 내지 180일 등) 내에 존재하는 분류기를 고려함으로써 포착된다. 예를 들어, 도 6은 몇몇 시간-윈도우에 대한 성능을 나타내는 표를 도시한다. 당해 표는 장기간 변동을 나타내는 건강한 대조군 데이터와 비교하여 CRC 케이스로부터 진단전 30 내지 720일에 취한 연령 조정된 CBC 데이터를 나타낸다. 또한, 각각의 케이스에 있어서, 선택된 파라미터 값/결과는 선택된 파라미터 값/결과 평가 전에 1.5년(델타 1.5) 및 3년(델타 3)의 동일한 파라미터 결과와 비교했다. 도 6의 표에 의해 제시된 바와 같이, 데이터가 보다 오래된 경우에 특이성은 감소되었다.
혈액 중의 빈혈은 몇몇 위장 상태 등에 의해 유발될 수 있고, GI 암은 최소 공배수인 것에 주의해야 한다. 원인불명의 빈혈은 고령자에 있어서 CRC에 대한 주요 예측인자이고, 치질과 함께, CRC 진단의 지연에 대한 일반적 원인이다. 혈액 소실은 CRC 케이스의 60%에서 존재하고, 분변 중의 3ml와 같이 적은 1일 손실은 철 빈혈을 유발할 수 있다. CRC 케이스의 거의 18%는 진단 14 전에 1년 이상 동안 빈혈을 갖지만, 상당한 비율은 빈혈 1이 아니다. 양성 잠혈 검사가 존재할 수도 있다. 그러나, CRC 스크리닝에 현재 사용되는 분변 혈액은 현재의 출혈만을 검출하고, CRC에서는 혈액 손실이 만성적이다.
문헌[참조: Spell DW, Jones DV, Jr., Harper WF, David Bessman J. The value of a complete blood count in predicting cancer of the colon. Cancer Detect Prev 2004;28(1):37-42]에서, CRC 환자의 88%는 적어도 하나의 혈액 이상을 갖는 것으로 보고되어 있다. 이와 같이, 전체 혈구수(CBC)로부터 CRC를 예측하려는 시도는 활발히 연구중에 있다. CBC 파라미터가 진단전 0 내지 122일에 이용가능한 새롭게 진단된 CRC 환자에 대한 소급적용 연구에서, 적혈구 세포 분포 폭(RDW)은 정상 범위 이상으로 증가했고, 주로 우측 CRC 케이스에 있어서 84% 감도 및 88% 특이성을 갖는 것으로 나타났다. RDW, 헤모글로빈 및 평균 적혈구 용적(MCV)과의 조합으로 어떠한 개선된 감도도 기록되지 않았다.
본 발명의 일부 실시양태에 따르면, 본원에 기재된 바와 같이 생성된 분류기의 성능은 빈혈 상태를 갖는 개체와 빈혈 상태 없는 개체 둘 다를 분류하는데 사용할 수 있다. 예를 들어, 도 11은 빈혈 개체와 빈혈이 아닌 개체(백인 미국인)를 분류하기 위한 상기 분류기를 사용한 결과 분석을 요약한 표 세트이다. 세트는 각각 다른 그룹 개체의 비빈혈 개체와 관련된 특정 그룹 개체의 빈혈 개체의 가능성을 요약하는 다수의 표를 포함한다. 그룹은 임의로 혈액 결과 연령 및 개체의 연령 사이의 조합에 따라 분할된다. 도 10은 혈구수 파라미터의 독립적인 측정치가 CRC와 관련되고, CBC 파라미터의 조합된 변화가 정상 범위내에서 미묘한 것일지라도, 예를 들어, 빈혈 개체 또는 빈혈 없는 개체에 대해 채점하여 CRC 스크리닝 프로세스의 일부로 사용될 수 있다는 증거를 보여준다.
이하, (105)에 제시된 바와 같이, 분류기(들)는 임의로, 예를 들어, 인터페이스 유닛(206)에 의해 표적 개체 분류를 가능하게 하는 모듈로서 출력된다. 임의로, 상이한 분류기는 상이한 인구통계학적 특징을 갖는 개체에 대해, 예를 들어, 남성을 위한 하나의 분류기 및 여성을 위한 다른 분류기로 정의된다. 예를 들어, 상기 18개 특징부로부터 한 그룹의 특징부를 기반으로 분류기는 남성용으로 설정되는 반면, 생화학 검사를 하지 않은 랜덤 포레스트 분류기는 여성용으로 사용된다. 랜덤 포레스트 분류기는 0.833±0.001의 AUC 및 정확도 0.45%의 총 유병률에 따라 추정되는 도 7에 도시된 바와 같은 성능을 갖는다.
이하, 본 발명의 일부 실시양태에 따라서 표적 개체에 대한 위장암 위험 스코어를 추정하기 위해 분류기(들), 예를 들어, 상기 분류기(들)를 사용하는 방법의 흐름도(400)인 도 8을 참조한다. 사용시, 분류기(들)는 표적 개체 데이터를 받고, 분류기(들)을 사용하는 위장암 평가 모듈을 사용하여 평가되는 대상체의 위장암 위험 스코어를 평가하는 웹 서버에서 호스트될 수 있다. 표적 개체 데이터는 대상체의 혈액 검사 결과 세트 및 인구통계학적 특징 또는 본 표적 데이터에 대한 참조를 제공하는 클라이언트 단말기, 예를 들어, 랩탑, 데스크탑, 스마트폰, 태블릿 및/또는 이와 유사한 것으로부터 통신 네트워크, 예를 들어, 인터넷을 통해 수신될 수 있다.
먼저, (401) 및 (402)에 제시된 바와 같이, 분류기(들) 및 표적 개체 데이터가 제공된다. 표적 개체 데이터는 하나 이상의 인구통계학적 파라미터(들) 및 표적 일수에 채취된 다수의 현재 혈액 검사 결과의 세트를 포함하고, 이는 표적 개체의 현재 시험 결과의 수를 포함한다. 표적 개체 데이터는, 예를 들어, 그래픽 사용자 인터페이스(GUI)를 사용하여 사용자가 수동적으로 투입하고, 사용자가 임의로 GUI를 사용하여 선택하고/하거나, 예를 들어, 컴퓨터 지원 진단(CAD) 모듈 및/또는 시스템을 사용하여 자동적으로 제공될 수 있다. 임의로, 표적 개체 데이터는 사용자가 지난해, 지난 십년간 및/또는 임의의 중간 기간 동안 수행한 혈액 검사 결과 세트의 수를 포함한다. 혈액 검사 결과의 세트의 각각은 혈액 검사 결과, 예를 들어, 상기 18개의 상이한 혈액 검사 결과에서 선택된 그룹을 포함한다.
이하, (403)에 제시된 바와 같이, 표적 개체 특징부의 세트는 표적 개체 데이터로부터 추출되고, 임의로 상기한 바와 같이 확장된다.
이어서, (404)에 제시된 바와 같이, 분류기(들)는 표적 개체 특징부의 세트에 각 특징부를 가중시켜 표적 개체에 대한 위장암 위험 스코어를 계산하는데 사용된다. 이하, (405)에 제시된 바와 같이, 위장암 위험 스코어가 출력된다.
상기한 분류기는 결장암, 위암, 직장암, 식도암일 수 있는 위장암에 대한 암 위험 스코어를 추정하는데 사용될 수 있음에 유의해야 한다. 예를 들어, 도 9는 모집단의 상이한 그룹에 대해 상이한 선택도의 결장암, 위암, 직장암 및 식도암 각각에 대한 분류기의 성능을 나타내는 표이다. 모집단의 그룹은 각각의 검사 혈액 결과 연령(일로 명시됨, 예를 들어, 90-540일, 90-540일, 30-270일 및 360-720일) 및 연령 범위, 예를 들어, 40-100세 및 50-75세 사이의 조합에 따라 규정된다. 도 9의 표는 도 4a 및 4B를 참조하여 문서화된 분류기에 사용되는 것과 다른 집단에 대한 분류기의 성능을 나타냄을 주의해야 한다. 도 9에서, 데이터는 결장암을 진단받은 3,099명, 직장암을 진단받은 1,286명, 위암을 진단받은 578명 및 식도암을 진단받은 1,061명의 40세 이상 총 81,641명의 영국 개체로부터의 혈액 조사 결과를 포함한다.
본원으로부터 완성된 특허의 수명 동안, 많은 관련 시스템 및 방법이 개발되고, 용어 프로세서, 디스플레이 및 사용자 인터페이스의 범위가 선험적으로 이러한 신규 기술 모두를 포함할 것으로 기대된다.
본원에 사용된 용어 "약"은 ±10 %를 나타낸다.
용어 "이루어지다 (comprises)", "이루어진 (comprising)", "포함한다 (includes)", "포함하는 (including)", "갖는 (having)" 및 이의 복합체는 "포함하지만, 이에 제한되지 않는다 (including but not limited to)"를 의미한다. 이 용어는 용어 "로 구성된 (consisting of)" 및 "본질적으로 구성된 (consisting essentially of)"을 포함한다.
"본질적으로 구성된"이라는 구는 조성물 또는 방법이, 추가의 성분 및/또는 단계가 특허청구된 조성물 또는 방법의 기본적이고 신규한 특징을 실질적으로 변경하지 않는 경우에만 추가 성분 및/또는 단계를 포함할 수 있음을 의미한다.
본 명세서에서 사용된 단수 형태 "하나 (a, an)" 및 "상기 (the)"는 문맥이 명확하게 달리 지시하지 않는 한 복수 참조를 포함한다. 예를 들어, 용어 "화합물" 또는 "적어도 하나의 화합물"은 이의 혼합물을 포함하는 다수의 화합물을 포함할 수 있다.
"예시적인"이라는 단어는 "예, 사례 또는 예시로 작용하는"을 의미하기 위해 사용된다. "예시적"으로 기술되는 임의의 실시양태는 반드시 다른 실시양태보다 바람직하거나 유리한 것으로 해석되고/되거나 다른 실시양태로부터의 특징의 통합을 배제할 필요는 없다.
"임의로"라는 단어는 "일부 실시양태에 제공되고 기타 실시양태에는 제공되지 않는다"는 것을 의미하기 위해 본원에 사용된다. 본 발명의 임의의 특정 실시양태는 이러한 특징이 모순되지 않는 한 "임의의" 특징의 다수를 포함할 수 있다.
본원 전반에 걸쳐, 본 발명의 각종 실시양태가 범위 형식으로 제공될 수 있다. 범위 형식으로의 기재는 단지 편의 및 간소화를 위한 것으로 이해되어야 하고, 본 발명의 범위에 대한 유연성이 없는 제한으로 해석되어서는 안된다. 따라서, 범위의 기재는 구체적으로는 기재된 모든 가능한 부분 범위 및 그 범위 내의 개별 수치를 갖는 것으로 간주되어야 한다. 예를 들어, 1 내지 6과 같은 범위의 기재는 1 내지 3, 1 내지 4, 1 내지 5, 2 내지 4, 2 내지 6, 3 내지 6 등과 같은 구체적으로 기재된 부분 범위 뿐만 아니라 그 범위 내의 개별 수치, 예를 들어, 1, 2, 3, 4, 5 및 6을 갖는 것으로 간주되어야 한다. 이는 범위의 넓이에 관계 없이 적용된다.
수치 범위가 본원에 지시되는 모든 경우에 항상, 이는 지시된 범위 내의 임의의 인용된 수치(분수 또는 정수)를 포함하는 것을 의미한다. 첫 번째 수와 두 번째 "사이의 범위/범위에서"라는 구 및 첫 번째 수"로부터 두 번째 수로의 범위/범위에서"는 본원에서 호환적으로 사용되고, 첫 번째 및 두 번째 수 및 이들 사이의 모든 분수 및 정수를 포함하는 것을 의미한다.
명확성을 위해, 개별 실시양태의 맥락으로 기술된 본 발명의 특정한 특징은 또한 단일 실시양태로 조합하여 제공될 수 있다. 반대로, 간결함을 위해, 개별 실시양태의 맥락으로 기술된 본 발명의 각종 특징은 또한 개별적으로 또는 임의의 적합한 서브 조합으로 또는 본 발명의 임의의 기타 기술된 실시양태에서 적합한 것으로서 제공될 수 있다. 다양한 실시양태의 맥락에서 기술된 특정한 특징은, 당해 실시양태가 이러한 요소 없이 작동불능이지 않는 한, 이러한 실시양태의 본질적인 특징을 고려하지 않는다.
본 발명은 이의 특정 실시양태와 함께 기재되었지만, 많은 대안, 변경 및 변형이 당업자에게 명백할 것임이 분명하다. 따라서, 첨부된 특허청구범위의 취지 및 광범위한 범위 내에 속하는 모든 상기한 대안, 변경 및 변형을 포함하고자 한다.
본 명세서에서 언급되는 모든 공보, 특허 및 특허 출원은 이들이 전문이 본 명세서에서 각 공보, 특허 또는 특허 출원이 구체적이고 개별적으로 참조로 본원에 인용된 바와 동일한 정도로 본 명세서에 참조로 인용된다. 또한, 본원에서 임의의 참조문헌의 인용 또는 식별은 이러한 참조문헌이 본 발명의 종래 기술로서 이용가능하다는 것을 허용하는 것으로 해석되지 않아야 한다. 섹션 표제가 사용되는 정도까지, 이들은 반드시 한정하는 것으로 해석되지 않아야 한다.

Claims (33)

  1. 표적 개체로부터 수집된 혈액으로부터 복수의 현재 혈액 검사 결과를 포함하는 특징부 세트를 생성하는 단계;
    또 다른 복수의 샘플링된 개체 각각의 복수의 개개 과거 혈액 검사 결과의 분석에 따라 생성된 적어도 하나의 분류기를 제공하는 단계로서, 상기 적어도 하나의 분류기 각각은 적어도 0.820±0.001의 곡선하 면적(AUC)을 갖는 단계; 및
    프로세서를 사용하여, 상기 적어도 하나의 분류기를 사용하여 상기 특징부 세트를 분류함으로써 상기 표적 개체의 위장암 위험을 평가하는 단계를 포함하는, 표적 개체의 현재 혈액 검사 결과에 대응하여 위장암 위험을 평가하는 컴퓨터화된 방법으로서,
    상기 복수의 과거 및 현재 혈액 검사 결과의 각각이 적혈구(RBC), 헤모글로빈(HGB) 및 헤마토크릿(HCT)의 혈액 검사 중 적어도 하나의 결과, 및 평균 세포 헤모글로빈(MCH) 및 평균 적혈구 헤모글로빈 농도(MCHC)의 혈액 검사 중 적어도 하나의 결과를 포함하고;
    상기 적어도 하나의 분류기는 위장암 위험 평가를 제공하기 위한 상기 복수의 과거 검사 결과에 따라 생성된 것인, 컴퓨터화된 방법.
  2. 제1항에 있어서, 상기 위장암 위험이 결장암, 위암, 직장암 및 식도암으로 이루어진 그룹으로부터 선택된 암에 대한 것인, 컴퓨터화된 방법.
  3. 제1항에 있어서, 상기 특징부 세트가 상기 표적 개체의 연령을 포함하고, 상기 적어도 하나의 분류기가 또 다른 복수의 샘플링된 개체 각각의 연령의 분석에 따라 생성되는, 컴퓨터화된 방법.
  4. 제1항에 있어서, 상기 복수의 과거 및 현재 혈액 검사 결과의 각각이 적혈구 분포 폭(RDW)의 결과를 포함하는, 컴퓨터화된 방법.
  5. 제1항에 있어서, 상기 복수의 과거 및 현재 혈액 검사 결과의 각각이 헤마토크릿의 결과를 포함하는, 컴퓨터화된 방법.
  6. 제1항에 있어서, 상기 복수의 과거 및 현재 혈액 검사 결과의 각각이 MCH의 결과를 포함하는, 컴퓨터화된 방법.
  7. 제1항에 있어서, 상기 복수의 과거 및 현재 혈액 검사 결과의 각각이 HGB 및 HCT 둘 다의 결과를 포함하는, 컴퓨터화된 방법.
  8. 제1항에 있어서, 상기 복수의 과거 및 현재 혈액 검사 결과의 각각이 호중구 비율/계수 및 림프구 비율/계수 둘 다의 결과를 포함하는, 컴퓨터화된 방법.
  9. 제1항에 있어서, 상기 복수의 과거 및 현재 혈액 검사 결과의 각각이 RBC 및 HCT 둘 다의 결과를 포함하는, 컴퓨터화된 방법.
  10. 제1항에 있어서, 상기 복수의 과거 및 현재 혈액 검사 결과의 각각이 RBC 및 MCH 둘 다의 결과를 포함하는, 컴퓨터화된 방법.
  11. 제1항에 있어서, 상기 복수의 과거 및 현재 혈액 검사 결과의 각각이 백혈구수-WBC(CBC); 평균 혈소판 용적(MPV); 평균 세포; 혈소판수(CBC); 호산구수; 호중구 비율; 단핵구 비율; 호산구 비율; 호염기구 비율 및 호중구수; 단핵구수 중 적어도 하나의 혈액 검사를 포함하는, 컴퓨터화된 방법.
  12. 제1항에 있어서, 상기 적어도 하나의 분류기가 가중 선형 회귀 분류기, K-최근방(KNN) 분류기 및 랜덤 포레스트(random forest) 분류기로 이루어진 그룹의 구성요소를 포함하는, 컴퓨터화된 방법.
  13. 제1항에 있어서, 상기 특징부 세트가 상기 표적 개체의 적어도 하나의 인구통계학적 특성, 및 상기 복수의 샘플링된 개체 각각의 상기 적어도 하나의 인구통계학적 특성 각각의 분석에 따라 생성된 상기 적어도 하나의 분류기를 포함하는, 컴퓨터화된 방법.
  14. 제1항에 있어서, 적어도 하나의 상이한 인구통계학적 특성을 갖는 샘플링된 개체의 복수의 개개 과거 혈액 검사 결과에 따라 각각 생성된 복수의 분류기로부터 상기 개체의 적어도 하나의 인구통계학적 특성에 따라 상기 적어도 하나의 분류기를 선택하는 단계를 추가로 포함하는, 컴퓨터화된 방법.
  15. 제1항에 있어서, 상기 복수의 혈액 검사 결과가 하기 복수의 혈액 검사로부터의 적어도 하나의 결과를 포함하고, 생화학적 혈액 검사 결과가 임의의 하기 혈액 검사 결과 알부민, 칼슘, 클로라이드, 콜레스테롤, 크레아티닌, 고밀도 지단백질(HDL), 저밀도 지단백질(LDL), 칼륨, 나트륨, 트리글리세라이드, 우레아 및 요산을 포함할 수 있는, 컴퓨터화된 방법.
  16. 제1항의 방법을 실행하기 위해 적용된 컴퓨터 실행가능 명령을 포함하는 컴퓨터 판독 가능 매체.
  17. 프로세서;
    또 다른 복수의 샘플링된 개체 각각의 복수의 과거 혈액 검사 결과의 분석에 따라 생성된 적어도 하나의 분류기를 저장하는 기억 유닛;
    표적 개체의 혈액으로부터 채취한 복수의 현재 혈액 검사 결과를 수신하는 입력 유닛; 및
    상기 프로세서를 사용하여, 상기 적어도 하나의 분류기를 사용하여 상기 복수의 현재 혈액 검사 결과로부터 추출된 특징부 세트를 분류함으로써 상기 표적 개체의 위장암 위험을 평가하는 위장암 평가 모듈을 포함하고, 상기 적어도 하나의 분류기 각각은 적어도 0.820±0.001의 곡선하 면적(AUC)을 갖는, 표적 개체의 현재 혈액 검사 결과에 대응하여 위장암 위험 평가를 제공하기 위한 위장암 평가 시스템으로서,
    상기 복수의 과거 및 현재 혈액 검사 결과는 적혈구(RBC), 헤모글로빈(HGB) 및 헤마토크릿(HCT)의 복수의 혈액 검사 중 적어도 하나의 결과, 및 평균 세포 헤모글로빈(MCH) 및 평균 적혈구 헤모글로빈 농도(MCHC)의 혈액 검사 중 적어도 하나의 결과를 포함하고;
    상기 적어도 하나의 분류기는 위장암 위험 평가를 제공하기 위한 상기 복수의 과거 검사 결과에 따라 생성되는, 위장암 평가 시스템.
  18. 제17항에 있어서, 상기 복수의 과거 및 현재 혈액 검사 결과의 각각이 적혈구 분포 폭(RDW)의 결과를 포함하는, 위장암 평가 시스템.
  19. 제17항에 있어서, 상기 복수의 과거 및 현재 혈액 검사 결과의 각각이 헤마토크릿의 결과를 포함하는, 위장암 평가 시스템.
  20. 제17항에 있어서, 상기 복수의 과거 및 현재 혈액 검사 결과의 각각이 평균 세포 용적(MCV)의 결과를 포함하는, 위장암 평가 시스템.
  21. 또 다른 복수의 샘플링된 개체 각각의 복수의 과거 혈액 검사 결과를 제공하는 단계;
    또 다른 상기 복수의 샘플링된 개체의 복수의 과거 혈액 검사 결과 각각에 따라 각기 생성된 복수의 특징부 세트를 갖는 데이터세트를 생성하는 단계;
    상기 데이터세트의 분석에 따라 표적 개체의 현재 혈액 검사 결과에 대응하여 위장암 위험 평가를 제공하기 위한 적어도 하나의 분류기를 생성하는 단계; 및
    상기 적어도 하나의 분류기를 출력하는 단계를 포함하는, 표적 개체의 현재 혈액 검사 결과에 대응하여 위장암 위험 평가를 제공하기 위한 분류기를 생성하는 방법으로서,
    상기 복수의 과거 및 현재 혈액 검사 결과는 적혈구(RBC), 헤모글로빈(HGB) 및 헤마토크릿(HCT)의 복수의 혈액 검사 중 적어도 하나의 결과 및 평균 세포 헤모글로빈(MCH) 및 평균 적혈구 헤모글로빈 농도(MCHC)의 혈액 검사 중 적어도 하나의 결과를 포함하고;
    상기 적어도 하나의 분류기 각각은 적어도 0.820±0.001의 곡선하 면적(AUC)을 갖는, 분류기를 생성하는 방법.
  22. 제21항에 있어서, 상기 생성이, 각각의 상기 특징부 세트에 대한 특징부로서 상기 각각의 복수의 과거 혈액 검사 결과로부터 채취한 과거 혈액 검사 결과의 적어도 하나의 조작된 버젼을 계산 및 부가하는 것을 포함하는, 방법.
  23. 제21항에 있어서, 상기 생성이 상기 각각의 복수의 과거 혈액 검사 결과의 일수에 따라 각각의 상기 특징부 세트를 가중하는 것을 포함하는, 방법.
  24. 제21항에 있어서, 상기 생성이 표준 편차 최대 역치에 따라 이상치(outlier)를 제거하기 위해 상기 복수의 특징부 세트를 여과하는 것을 포함하는, 방법.
  25. 제21항에 있어서, 상기 복수의 특징부 세트가 상기 각각의 복수의 과거 혈액 검사 결과의 일수에 따라 가중되는, 방법.
  26. 제21항에 있어서, 상기 복수의 혈액 검사 결과가 적혈구(RBC), 헤모글로빈(HGB) 및 헤마토크릿(HCT)의 혈액 검사 중 적어도 하나의 결과, 및 평균 세포 헤모글로빈(MCH) 및 평균 적혈구 헤모글로빈 농도(MCHC)의 혈액 검사 중 적어도 하나의 결과를 포함하는, 방법.
  27. 제1항에 있어서, 상기 복수의 과거 및 현재 혈액 검사 결과의 각각이 적혈구 분포 폭(RDW)의 결과를 포함하는, 방법.
  28. 제1항에 있어서, 상기 복수의 과거 및 현재 혈액 검사 결과의 각각이 헤마토크릿의 결과를 포함하는, 방법.
  29. 제1항에 있어서, 상기 복수의 과거 및 현재 혈액 검사 결과의 각각이 평균 세포 용적(MCV)의 결과를 포함하는, 방법.
  30. 제21항에 있어서, 상기 복수의 샘플링된 개체 각각의 적어도 하나의 인구통계학적 파라미터를 각각의 상기 특징부 세트에 부가하는 단계를 추가로 포함하는, 방법.
  31. 제30항에 있어서, 상기 적어도 하나의 인구통계학적 파라미터가 성별, 연령, 거주 영역, 인종 및 사회경제적 특징으로 이루어진 그룹의 구성요소인, 방법.
  32. 제30항에 있어서, 상기 생성이 각각의 상기 특징부 세트에 대한 특징부로서 상기 적어도 하나의 인구통계학적 파라미터의 적어도 하나의 조작된 버젼을 계산 및 부가하는 것을 포함하는, 방법.
  33. 삭제
KR1020147026479A 2012-05-03 2013-05-02 위장암의 위험을 평가하는 방법 및 시스템 KR102094326B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261641979P 2012-05-03 2012-05-03
US61/641,979 2012-05-03
PCT/IL2013/050368 WO2013164823A1 (en) 2012-05-03 2013-05-02 Methods and systems of evaluating a risk of a gastrointestinal cancer

Publications (2)

Publication Number Publication Date
KR20150005909A KR20150005909A (ko) 2015-01-15
KR102094326B1 true KR102094326B1 (ko) 2020-03-30

Family

ID=49514271

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020147026479A KR102094326B1 (ko) 2012-05-03 2013-05-02 위장암의 위험을 평가하는 방법 및 시스템

Country Status (14)

Country Link
US (3) US9474490B2 (ko)
EP (1) EP2844131B1 (ko)
JP (1) JP6267687B2 (ko)
KR (1) KR102094326B1 (ko)
CN (1) CN104271033B (ko)
AU (1) AU2013255401B2 (ko)
CA (1) CA2865892C (ko)
ES (1) ES2655184T3 (ko)
HK (1) HK1205448A1 (ko)
IN (1) IN2014MN01809A (ko)
MX (1) MX347850B (ko)
PL (1) PL2844131T3 (ko)
RU (1) RU2640568C2 (ko)
WO (1) WO2013164823A1 (ko)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2013255401B2 (en) 2012-05-03 2017-02-23 Medial Research Ltd. Methods and systems of evaluating a risk of a gastrointestinal cancer
US10614287B2 (en) 2014-06-16 2020-04-07 Siemens Healthcare Diagnostics Inc. Virtual staining of cells in digital holographic microscopy images using general adversarial networks
CN108426994B (zh) 2014-06-16 2020-12-25 西门子医疗保健诊断公司 分析数字全息显微术数据以用于血液学应用
US20160110516A1 (en) * 2014-10-20 2016-04-21 Liwei Ma Dynamic monitoring early cancer risk
CN104573410A (zh) * 2015-01-20 2015-04-29 合肥工业大学 基于分子子网与随机森林分类器的癌症化疗敏感性预测方法
CN104615894B (zh) * 2015-02-13 2018-09-28 上海中医药大学 一种基于k近邻标签特定权重特征的中医诊断系统
CN106339569B (zh) * 2015-07-09 2021-01-05 深圳迈瑞生物医疗电子股份有限公司 判断样本检验结果异常的方法及装置
US10332638B2 (en) 2015-07-17 2019-06-25 Massachusetts Institute Of Technology Methods and systems for pre-symptomatic detection of exposure to an agent
JP6100867B1 (ja) * 2015-11-06 2017-03-22 振武 曽 免疫状態の分析のための検査方法
EP3455753A1 (en) * 2016-05-12 2019-03-20 F. Hoffmann-La Roche AG System for predicting efficacy of a target-directed drug to treat a disease
US20180000428A1 (en) * 2016-05-18 2018-01-04 Massachusetts Institute Of Technology Methods and Systems for Pre-Symptomatic Detection of Exposure to an Agent
KR101747783B1 (ko) 2016-11-09 2017-06-15 (주) 바이오인프라생명과학 특정 항목이 속하는 클래스를 예측하기 위한 2-클래스 분류 방법 및 이를 이용하는 컴퓨팅 장치
US20170140115A1 (en) * 2017-01-24 2017-05-18 Liwei Ma Intelligent stroke risk prediction and monitoring system
US20170147768A1 (en) * 2017-02-06 2017-05-25 Liwei Ma System and method for detecting and monitoring acute myocardial infarction risk
US20210249136A1 (en) * 2018-08-17 2021-08-12 The Regents Of The University Of California Diagnosing hypoadrenocorticism from hematologic and serum chemistry parameters using machine learning algorithm
CN109670526A (zh) * 2018-11-09 2019-04-23 全球能源互联网研究院有限公司 一种电网的干扰源类型辨识方法、装置、设备及存储介质
WO2020193045A1 (en) * 2019-03-28 2020-10-01 F. Hoffmann-La Roche Ag Cancer prognosis
US20210299339A1 (en) * 2020-03-31 2021-09-30 Fresenius Medical Care Holdings, Inc. Blood monitoring system for determining a calibrated hemoglobin concentration value for a patient based on patient-specific mean corpuscular hemoglobin concentration data
TWI763215B (zh) * 2020-12-29 2022-05-01 財團法人國家衛生研究院 篩選用於預測生理狀態的特徵的電子裝置和方法
CN112735606B (zh) * 2021-01-22 2023-04-25 张厚德 结直肠癌风险预测方法、设备及存储介质
CN112908470B (zh) * 2021-02-08 2023-10-03 深圳市人民医院 一种基于rna结合蛋白基因的肝细胞癌预后评分系统及其应用
CN112986446A (zh) * 2021-04-19 2021-06-18 生态环境部华南环境科学研究所 禽蛋类产品中有机磷酸酯及代谢物的同步检测方法及应用
GB202109560D0 (en) * 2021-07-01 2021-08-18 Chancellor Masters And Scholars Of The Univ Of Cambridge Anomaly detection based on complete blood counts
WO2023147472A1 (en) * 2022-01-28 2023-08-03 Freenome Holdings, Inc. Methods and systems for risk stratification of colorectal cancer
CN115620909B (zh) * 2022-11-04 2023-08-04 内蒙古卫数数据科技有限公司 一种基于全血细胞计数融合指标hbi的癌症风险评估系统
CN117524464B (zh) * 2024-01-04 2024-04-05 北京和兴创联健康科技有限公司 一种基于大数据的计算手术后目标血红蛋白的方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001511680A (ja) 1997-02-14 2001-08-14 バイオマー インターナショナル,インコーポレイティド 将来の健康を予測するためのシステム
US20100009401A1 (en) 2006-12-21 2010-01-14 Ajinomoto Co., Inc. Method of evaluating colorectal cancer, colorectal cancer-evaluating apparatus, colorectal cancer-evaluating method, colorectal cancer-evaluating system, colorectal cancer-evaluating program and recording medium

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5692220A (en) * 1993-09-02 1997-11-25 Coulter Corporation Decision support system and method for diagnosis consultation in laboratory hematopathology
US6881548B2 (en) 1997-05-23 2005-04-19 A&G Pharmaceutical, Inc. Methods and kits for diagnosing tumorigenicity and determining resistance to the antineoplastic effects of antiestrogen therapy
US7838296B2 (en) 2002-08-28 2010-11-23 Separation Technology, Inc. Methods and apparatus for ultrasonic determination of red blood cell indices
US20040122703A1 (en) * 2002-12-19 2004-06-24 Walker Matthew J. Medical data operating model development system and method
US7951078B2 (en) 2005-02-03 2011-05-31 Maren Theresa Scheuner Method and apparatus for determining familial risk of disease
US9075062B2 (en) 2005-03-22 2015-07-07 The United States Of America, As Represented By The Secretary, Department Of Health & Human Services Identification of biomarkers by serum protein profiling
ES2717627T3 (es) * 2005-07-29 2019-06-24 Siemens Healthcare Diagnostics Inc Métodos, kits, sistemas y bases de datos relacionados con enfermedades neoplásicas
JP5025371B2 (ja) 2007-07-31 2012-09-12 シスメックス株式会社 血液分析装置
US8512240B1 (en) * 2007-11-14 2013-08-20 Medasense Biometrics Ltd. System and method for pain monitoring using a multidimensional analysis of physiological signals
US20100076787A1 (en) * 2008-09-11 2010-03-25 Stephen Naylor Method for preparing a medical data report
NZ592241A (en) 2008-09-15 2012-11-30 Herlev Hospital Ykl-40 as a marker for gastrointestinal cancers
EP2350902A4 (en) 2008-10-21 2014-03-19 Rothman Healthcare Corp METHODS OF RISK ASSESSMENT ASSOCIATED WITH MEDICAL DATA AND USES THEREOF
CN102301002A (zh) 2008-11-12 2011-12-28 卡里斯生命科学卢森堡控股有限责任公司 使用外来体来确定表现型的方法和系统
WO2011060098A1 (en) 2009-11-10 2011-05-19 Prometheus Laboratories Inc. Methods for predicting post-surgery risk associated with ileal pouch-anal anastomosis
AU2010321562A1 (en) 2009-11-23 2012-06-14 Children's Medical Center Corporation Normalization of platelet biomarkers
AU2013255401B2 (en) 2012-05-03 2017-02-23 Medial Research Ltd. Methods and systems of evaluating a risk of a gastrointestinal cancer

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001511680A (ja) 1997-02-14 2001-08-14 バイオマー インターナショナル,インコーポレイティド 将来の健康を予測するためのシステム
US20100009401A1 (en) 2006-12-21 2010-01-14 Ajinomoto Co., Inc. Method of evaluating colorectal cancer, colorectal cancer-evaluating apparatus, colorectal cancer-evaluating method, colorectal cancer-evaluating system, colorectal cancer-evaluating program and recording medium

Also Published As

Publication number Publication date
CN104271033B (zh) 2017-05-24
JP6267687B2 (ja) 2018-01-24
RU2014140114A (ru) 2016-06-20
KR20150005909A (ko) 2015-01-15
MX2014011202A (es) 2014-11-21
AU2013255401B2 (en) 2017-02-23
EP2844131A4 (en) 2015-11-18
EP2844131B1 (en) 2017-10-11
AU2013255401A1 (en) 2014-09-18
US11651189B2 (en) 2023-05-16
CA2865892C (en) 2021-08-24
WO2013164823A1 (en) 2013-11-07
MX347850B (es) 2017-05-16
US10452970B2 (en) 2019-10-22
ES2655184T3 (es) 2018-02-19
HK1205448A1 (en) 2015-12-18
PL2844131T3 (pl) 2018-03-30
US20200050917A1 (en) 2020-02-13
JP2015517653A (ja) 2015-06-22
US20140235956A1 (en) 2014-08-21
US20170039334A1 (en) 2017-02-09
CA2865892A1 (en) 2013-11-07
US9474490B2 (en) 2016-10-25
EP2844131A1 (en) 2015-03-11
IN2014MN01809A (ko) 2015-07-03
CN104271033A (zh) 2015-01-07
RU2640568C2 (ru) 2018-01-09

Similar Documents

Publication Publication Date Title
KR102094326B1 (ko) 위장암의 위험을 평가하는 방법 및 시스템
Mesas et al. Predictors of in-hospital COVID-19 mortality: A comprehensive systematic review and meta-analysis exploring differences by age, sex and health conditions
KR102310799B1 (ko) 폐암 위험 평가 방법 및 시스템
Moosmann et al. Age‐and sex‐specific pediatric reference intervals for neutrophil‐to‐lymphocyte ratio, lymphocyte‐to‐monocyte ratio, and platelet‐to‐lymphocyte ratio
Rahman et al. QCovSML: A reliable COVID-19 detection system using CBC biomarkers by a stacking machine learning model
KR20090024686A (ko) 바이오마커를 이용하여 질병 상태를 식별하기 위한 방법 및장치
Ramoji et al. Leukocyte activation profile assessed by Raman spectroscopy helps diagnosing infection and sepsis
KR20150079641A (ko) 동적 네트워크 바이오마커의 검출 장치, 검출 방법 및 검출 프로그램
WO2017177192A1 (en) White blood cell population dynamics
Ray et al. A robust COVID-19 mortality prediction calculator based on lymphocyte count, urea, C-reactive protein, age and sex (LUCAS) with chest X-rays
JP2023545704A (ja) エクスポソーム臨床応用のためのシステム及び方法
JP2016201123A (ja) 動的ネットワークバイオマーカーの検出装置、検出方法及び検出プログラム
Tawsifur et al. QCovSML: A reliable COVID-19 detection system using CBC biomarkers by a stacking machine learning model
Melnykova A Novel Approach for the Automatic Detection of COVID in a Patient by Using a Categorization Methods
Tian et al. Identifying subjects who benefit from additional information for better prediction of the outcome variables
JP2024525499A (ja) 機械学習を使用した全血算に基づく異常検出
CA3223948A1 (en) Anomaly detection based on complete blood counts using machine learning
Vomanesh et al. Detection and Classification of Leukaemia using Artificial Intelligence
WO2022177746A1 (en) Predicting disease progression based on digital-pathology and gene-expression data
Murphy Longitudinal studies and determination of risk

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant