KR20130132802A - 심혈관 질환들의 발병을 예측하기 위한 건강관리 정보 기술 시스템 - Google Patents

심혈관 질환들의 발병을 예측하기 위한 건강관리 정보 기술 시스템 Download PDF

Info

Publication number
KR20130132802A
KR20130132802A KR1020137012198A KR20137012198A KR20130132802A KR 20130132802 A KR20130132802 A KR 20130132802A KR 1020137012198 A KR1020137012198 A KR 1020137012198A KR 20137012198 A KR20137012198 A KR 20137012198A KR 20130132802 A KR20130132802 A KR 20130132802A
Authority
KR
South Korea
Prior art keywords
patient
cardiovascular disease
interest
data
predicting
Prior art date
Application number
KR1020137012198A
Other languages
English (en)
Inventor
글렌 풍
파이살 파루크
하라트 알. 라오
슈테판 베. 펠릭스
틸 이테르만
헤요 카. 크뢰머
라이너 레티크
헨리 ?츠케
Original Assignee
지멘스 메디컬 솔루션즈 유에스에이, 인크.
에른스트-모리츠-아른츠 유니버시태트
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 지멘스 메디컬 솔루션즈 유에스에이, 인크., 에른스트-모리츠-아른츠 유니버시태트 filed Critical 지멘스 메디컬 솔루션즈 유에스에이, 인크.
Publication of KR20130132802A publication Critical patent/KR20130132802A/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/40Population genetics; Linkage disequilibrium
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Primary Health Care (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Computing Systems (AREA)
  • Pure & Applied Mathematics (AREA)
  • Physiology (AREA)
  • Algebra (AREA)
  • Mathematical Physics (AREA)
  • Ecology (AREA)
  • Mathematical Optimization (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Analysis (AREA)

Abstract

환자 내의 관심 있는 심혈관 질환의 발병을 예측하기 위한 프레임워크가 여기서 설명된다. 프레임워크는, 관심 있는 심혈관 질환에 관련된 이전 도메인 지식에 기초하여, 환자 데이터의 함수로서 위험 점수를 결정하는 것을 포함한다. 환자 데이터는 유전 데이터 및 비-유전 데이터 둘 다를 포함할 수 있다. 일 구현에서, 위험 점수는, 환자를 다수의 위험 카테고리들 중 적어도 하나로 카테고리화하는데 사용되고, 상기 다수의 위험 카테고리들은 심혈관 질환의 발병을 방지하기 위해 상이한 전략들과 관련된다. 프레임워크에 의해 생성된 결과들은 의사에게 제시되어, 해석, 위험 평가 및/또는 임상 의사결정 지원을 용이하게 할 수 있다.

Description

심혈관 질환들의 발병을 예측하기 위한 건강관리 정보 기술 시스템{HEALTHCARE INFORMATION TECHNOLOGY SYSTEM FOR PREDICTING DEVELOPMENT OF CARDIOVASCULAR CONDITION}
본 출원은 2009년 7월 21일자로 출원된 USSN 12/506,583의 일부계속출원(continuation-in-part application)이다. 또한, 본 출원은, 2010년 3월 12일자로 출원된 미국 임시 출원 번호 61/313,446 및 2010년 10월 12일자로 출원된 미국 임시 출원 번호 61/392,156의 이익을 주장한다; 위에-인용된 출원들의 전체 내용들이 인용에 의해 본 명세서에 포함된다.
본 기재는 일반적으로 건강관리(healthcare) 정보 기술(HIT) 시스템들에 관한 것이고, 더욱 구체적으로, 환자의 심혈관 질환 발병 위험을 평가하기 위한 조합된 진단 모델에 관한 것이다.
고혈압(hypertension) 또는 고혈압(high blood pressure)은 혈관 이병율(vascular morbidity) 및 사망율(mortality)에 대한 중요한 위험 인자로서 인식되었다. 지속적인 고혈압으로부터 초래될 수 있는 생명을 위협하는 심혈관 질환들 중에서, 뇌졸증(stroke) 및 심근경색증(myocardial infarction)(즉, 심장마비)은 고혈압으로부터의 최고 상관 위험과 관련되고, 그리고 따라서 혈압-관련 사망율에 크게 기여한다. 연구들은, 전세계적인 죽음들 전체의 13.5%가 고혈압에 기인함을 나타냈다. 제어되지 않는 혈압의 지구적 연간 비용은 거의 오천억 달러(500 billion dollar)인 것으로 추정되었다. 미국에서는, 관상 심장병(coronary heart disease)에 대한 지출들이 2008년도에 천오백억 달러를 초과하는 것으로 추정되었다. 이러한 추정은, 질병과 관련된 직접적인 비용들(예컨대, 의사들, 병원들, 약 비용들)뿐만 아니라, 이병율 및 사망율 때문에 손실된 생산성과 관련된 간접적인 비용들도 고려한다. 2009년도에는 미국에서만 8,500,000건들의 심근경색증의 추정 수치가 있었다.
유사하게, 미국 내의 관상 심장병에 대한 지출들은 단지 몇 년 전에 천오백억 달러를 초과하는 것으로 추정되었다. 이러한 추정은, 질병과 관련된 직접적인 비용(의사들, 병원들, 약 비용들)뿐만 아니라, 이병율 및 사망율 때문에 손실된 생산성과 관련된 간접적인 비용들도 고려한다. 2009년도에는 미국에서만 심근경색증의 추정 수치의 8,500,000건들이 있었던 것이 보고된다.
고혈압-관련 사망율과 싸우기 위해, 전문가들은, 더 큰 혈압 감소를 더 저렴한 비용으로 달성하기 위한 일반적인 항고혈압성 약들의 사용뿐만 아니라, 입법, 자발적인 산업계 참여, 그리고 소금 소비량을 줄임으로써 어떻게 고혈압의 위험을 감소시키는지에 관해 국민을 교육하기 위한 대중매체 캠페인들의 조합을 제안했다. 부가하여, 고혈압을 발병시킬 고위험에 처한 개인들을 식별함으로써, 적절한 경제적인 예방 조치들이 구현될 수 있다.
고혈압의 직접적인 원인이 일반적으로 알려져 있지 않지만, 고혈압을 발병시킬 위험을 증가시키는 것으로 믿어지는 많은 인자들이 있다. 그러한 인자들은, 예컨대, 비만, 앉아서 일하는 생활양식(sedentary lifestyle), 비타민 D 결핍, 나이, 가족력 등등을 포함한다. 고혈압 위험의 정확하고 잘 알려진 진단을 만들어 내기 위하여, 의사들은, 의료 히스토리 리포트들, 검진(physical examination)들, 실험실 시험 결과들, 이미징 양상(imaging modality)들 등과 같은 많은 상이한 소스들로부터의 계속 늘어나는 양의 데이터를 고려해야 한다. 정보 소스들의 개수가 확장됨에 따라, 모든 이용가능한 진단 데이터를 수동으로 추출하고 흡수(assimilate)하는 것, 그리고 다양한 치료 및 환자 관리 옵션들을 평가하는 것은, 점점 더 지루하고, 시간 소모적이고 오류 발생이 쉽게 된다.
각각의 진단에서 고려되어야 하는 데이터의 양이 주어진다면, 자동 데이터 마이닝 기술이 대량 데이터 세트들로부터 예측 정보를 추출하고 요약해야 한다는 것이 바람직하다. 그러나, 고혈압을 자동으로 예측하기 위한 통계 및 데이터-마이닝 기반 모델들을 만들어 내는데 작업이 거의 없다. 부가하여, 임의의 그러한 노력에 맞서는 도전은, 임의의 의미 있거나 또는 신뢰성 있는 방식으로 추출될 수 있거나 또는 분석될 수 있는 고품질 데이터의 부족이다. 그 이유는, 불완전한 데이터 수집 프로세스들, 환자 인자들의 정확한 평가 및 지식의 부족, 장비에 관련된 비용 제한들 등등으로 인해 대부분의 예측기 변수들이 보통 완전하지 않기 때문이다. 대부분의 예측 방법들은 빠진 데이터 또는 값들의 존재시 실패한다.
상기를 고려하면, 다양한 소스들로부터의 환자 정보를 조합하여, 고혈압 또는 심근경색증과 같은 심혈관 질환의 발병, 그리고 이들 질환들과 관련된 건강 합병증(complication)들을 정확하게 예측하기 위한 자동화되거나 또는 반-자동화된 기술들에 대한 필요가 존재한다.
환자의 심혈관 질환의 발병을 예측하기 위한 프레임워크가 여기에 설명된다. 프레임워크는, 관심 있는 심혈관 질환에 관련된 이전 도메인 지식에 기초하여, 환자 데이터의 함수로서 위험 점수를 결정하는 것을 포함한다. 환자 데이터는 유전 데이터 및 비-유전 데이터 둘 다를 포함할 수 있다. 일 구현에서, 위험 점수는 다수의 위험 카테고리들 중 적어도 하나로 환자를 분류하는데 사용되고, 상기 다수의 위험 카테고리들은 심혈관 질환의 발병(onset)을 방지하기 위한 상이한 전략들과 관련된다. 프레임워크에 의해 생성된 결과들은, 해석, 위험 평가 및/또는 임상적 결정 지원을 용이하게 하기 위하여 의사에게 제시될 수 있다.
이러한 요약은, 아래의 상세한 설명에서 아래에서 추가로 설명되는 개념들의 선택을 단순화된 형태로 도입하기 위해 제공된다. 청구되는 청구대상의 특징들 또는 필수적 특징들을 식별하는 것이 의도되지도, 청구되는 청구대상의 범위를 제한시키는데 사용되는 것도 의도되지 않는다. 또한, 청구되는 청구대상은, 이러한 기재의 임의의 부분에 언급된 임의의 또는 모든 단점들을 해결하는 구현들로 제한되지 않는다.
동반된 도면들과 관련되어 고려될 때, 아래의 상세한 설명을 참조하여, 본 기재 및 본 기재의 수반되는 양상들 중 많은 양상들이 더욱 잘 이해됨에 따라, 본 기재 및 본 기재의 수반되는 양상들 중 많은 양상들의 더욱 완벽한 평가가 쉽게 획득될 것이다.
도 1은 예시적 시스템을 도시한다.
도 2는 심혈관 질환을 예측하는 예시적 방법을 도시한다.
도 3은 위험 점수를 결정하는 예시적 방법을 도시한다.
도 4는 예시적 베이지언(Bayesian) 네트워크-기반 모델 네트워크를 도시한다.
도 5a 및 도 5b는 예시적 수신기 동작 곡선들을 도시한다.
도 6은 고혈압의 지속적인 모니터링, 예방 및/또는 치료를 위한 예시적 프로세스를 도시한다.
아래의 설명에서는, 본 발명의 실시예들의 완전한 이해를 제공하기 위하여, 특정 컴포넌트들, 디바이스들, 방법들 등의 예들과 같이 다수의 특정 세부사항들이 전개된다. 그러나, 본 발명의 실시예들을 구현하는데 이들 특정 세부사항들이 사용될 필요가 없음은 기술분야의 당업자에게 명백할 것이다. 다른 예시들에서, 본 발명의 실시예들을 불필요하게 모호하게 하는 것을 피하기 위하여, 잘 알려진 물질들 또는 방법들은 상세하게 설명되지 않았다. 본 발명이 다양한 수정들 및 대안적인 형태들을 허락하지만, 본 발명의 특정 실시예들은 도면들에서 예로서 도시되고 그리고 여기에서 상세하게 설명될 것이다. 그러나, 본 발명을 개시된 특정한 형태들로 제한시키려는 의도가 없으며, 반대로 본 발명은 본 발명의 사상 및 범위 내에 속하는 모든 수정들, 균등물들, 및 대안들을 커버하기 위한 것임이 이해되어야 한다.
아래의 설명은 환자의 심혈관 질환의 발병의 예측을 용이하게 하는 시스템들 및 방법들의 하나 또는 그 초과의 구현들을 전개한다. 일 구현에서, 예측 모델에 의해 생성된 위험 점수는, 선택된 위험 카테고리에 따라 더욱 개인화된 예방 전략들의 공식화를 용이하게 하기 위하여, 환자들(또는 피실험자들)을 상이한 위험 카테고리들로 분류하는데 사용된다. 예측 모델은, 예컨대, 베이지안 네트워크(BN)와 같은 확률 모델에 기초하여 구성될 수 있다. BN-기반 예측 모델들을 사용하는 주요한 장점들 중 하나는, 빠진 값들의 존재시의 정확한 예측 및 예측 모델의 해석능력이고, 이는 아래의 설명에서 더욱 상세하게 논의될 것이다.
고혈압 예측으로 지향된 특정한 적용이 도시될 수 있지만, 기술이 예시된 특정 실시예에 제한되지 않음이 주의된다. 본 기술은, 상이한 타입들의 고혈압(예컨대, 본태성 고혈압, 속발성 고혈압, 악성 고혈압 등)과 같은 관심 있는 다른 타입들의 심혈관 질환들, 또는 심근경색증(즉, 심장 마비), 뇌졸증 또는 임의의 다른 관상 심장 질환와 같은, 고혈압의 발병에 의해 촉발될 수 있거나 또는 관련될 수 있는 다른 타입들의 질환들에 적용된다. 예컨대, 본 기술은 근래에 심근경색증(MI)을 발병시키는 환자의 위험의 정확하고 개인화된 예측을 제시하는데 사용될 수 있다.
도 1은 여기에 설명되는 바와 같은 프레임워크를 구현하기 위한 예시적 시스템(101)을 예시한 블록도를 도시한다. 일 구현예에서, 시스템(101)은, 통신 및 의사결정을 위한 건강관리 정보, 데이터 및 지식을 관리하는 건강관리 정보 기술(HIT) 시스템으로서의 역할을 한다. 시스템(101)은 데스크톱 퍼스널 컴퓨터, 휴대용 랩톱 컴퓨터, 다른 휴대용 디바이스, 미니-컴퓨터, 메인프레임 컴퓨터, 서버, 스토리지 시스템, 전용 디지털 어플라이언스, 또는 디지털 데이터 아이템들의 수집물을 저장하도록 구성된 스토리지 서브-시스템을 갖는 다른 디바이스일 수 있다. 일 구현에서, 시스템(101)은 입출력 인터페이스(121)를 통해 하나 또는 그 초과의 비-일시적 컴퓨터-판독가능 매체(106)(예컨대, 컴퓨터 스토리지 또는 메모리), 네트워크 인터페이스(102), 디스플레이 디바이스(108)(예컨대, 모니터) 및 다양한 입력 디바이스들(110)(예컨대, 마우스 또는 키보드)에 결합된 프로세서(104)를 포함한다. 시스템(101)은 캐시, 전원, 클록 회로들 및 통신 버스와 같은 지원 회로들을 더 포함할 수 있다.
본 기술이 다양한 형태들의 하드웨어, 소프트웨어, 펌웨어, 특별 목적 프로세서들, 또는 이들의 조합으로 구현될 수 있음이 인정되어야 한다. 일 구현에서, 여기에 설명되는 기술들은 비-일시적 컴퓨터-판독가능 매체(106) 내에 유형으로 구현된 컴퓨터-판독가능 프로그램 코드로서 구현된다. 특히, 여기에 설명되는 기술들은 정보 프로세싱 모듈(107)에 의해 구현될 수 있다. 컴퓨터-판독가능 매체(106)는 예컨대 랜덤 액세스 메모리(RAM), 읽기 전용 메모리(ROM), 자기 플로피 디스크, 플래시 메모리, 및 다른 타입들의 메모리들, 또는 이들의 조합을 포함한다. 예컨대 외부 스토리지 디바이스(112) 내에 구현된 데이터베이스로부터 데이터(예컨대, 환자 데이터, 레코드들)를 검색하고 프로세싱하기 위해, 컴퓨터-판독가능 프로그램 코드는 프로세서(104)에 의해 실행된다. 시스템(101)은, 컴퓨터 판독가능 프로그램 코드를 실행할 때 특정 목적 컴퓨터 시스템이 되는 범용 컴퓨터 시스템이다. 컴퓨터-판독가능 프로그램 코드는, 임의의 특정한 프로그래밍 언어 및 그 구현에 제한되는 것이 의도되지 않는다. 다양한 프로그래밍 언어들 및 그 코딩이 여기에 포함되는 기재의 지침들을 구현하는데 사용될 수 있음이 인정될 것이다.
또한, 일 구현에서, 시스템(101)은 또한, 비-일시적 컴퓨터 판독가능 매체(106) 내에 저장된 마이크로명령 코드와 운영체제를 포함한다. 여기에 설명되는 다양한 기술들은, 마이크로명령 코드의 일부로서든 또는 애플리케이션 프로그램 또는 소프트웨어 물건의 일부로서든, 또는 운영체제를 통해 실행되는 이들의 조합으로 어느 쪽으로든 구현될 수 있다. 부가적인 데이터 스토리지 디바이스들 및 프린팅 디바이스들과 같은 다양한 다른 주변 디바이스들이 시스템(101)에 연결될 수 있다.
일 구현에서, 외부 스토리지 디바이스(112)는, 데이터베이스를 저장하기 위해, 하드 디스크 또는 다른 타입들의 메모리들과 같은 비-일시적 컴퓨터 판독가능 매체를 포함한다. 데이터베이스는 데이터베이스 관리 시스템(DBMS)에 의해 관리될 수 있다. 외부 스토리지 디바이스(112)가 또한 하나 또는 그 초과의 부가적인 컴퓨터 시스템들 상에서 구현될 수 있음이 인정되어야 한다. 예컨대, 외부 스토리지 디바이스(112)는 별도의 컴퓨터 시스템 상에 상주하는 데이터 웨어하우스 시스템을 포함할 수 있다.
시스템(101)은 독립형 시스템일 수 있거나, 네트워크 인터페이스(102)를 통해 유선 또는 무선 네트워크를 경유하여 다른 워크스테이션들, 서버들 또는 네트워크(미도시)에 추가로 연결될 수 있다. 네트워크 인터페이스(102)는 하드-와이어드 인터페이스 또는 유니버설 비동기 수신기/송신기(UART), 병렬 디지털 인터페이스, 소프트웨어 인터페이스 또는 알려지거나 또는 이후에 개발되는 소프트웨어 및 하드웨어의 임의의 조합과 같은 다른 디바이스로부터 또는 상기 다른 디바이스에 정보를 송신하기에 적절한 임의의 디바이스일 수 있다. 네트워크 인터페이스(102)는, 로컬 영역 네트워크(LAN), 광역 네트워크(WAN), 인트라넷, 가상사설망(VPN), 및 인터넷을 포함하는 다양한 타입들의 유선 또는 무선 네트워크들에 링크될 수 있다.
기술분야의 당업자는 본 발명의 사상 및 범위로부터 벗어남 없이 다른 대안적인 컴퓨팅 환경들이 사용될 수 있음을 인정할 것이다.
도 2는 고혈압(예컨대, 본태성 고혈압, 속발성 고혈압, 악성 고혈압 등)과 같은 관심 있는 심혈관 질환, 또는 심근경색증(MI) 또는 뇌졸증과 같은, 고혈압의 발병에 의해 촉발될 수 있거나 또는 관련될 수 있는 임의의 질환의 예측을 용이하게 하기 위한 예시적 방법(200)을 도시한다. 일 구현에서, 예시적 방법(200)은 근래에 심혈관 질환을 발병시킬 위험에 있다고 간주되는 환자들에게 현장(point-of-care)에서의 결정 또는 해석 지원을 제공한다. 그러한 지원은, 관심 있는 심혈관 질환의 발병을 막거나 또는 지연시키기 위해 예방 단계들이 취해져야 하는지를 결정할 때 1차 진료의(primary care physician)를 도울 것이다. 본 프레임워크는, 일차 친족(first-degree relative)들 내에 심혈관 질환들의 가족력을 갖는 피실험자들, 그리고 다른 심장 대사 질병(cardio metabolic disease)들(예컨대, 당뇨병(diabete)들 또는 심장병들)을 갖고 있는 피실험자들을 치료하는데 특히 유용한데, 그 이유는 본 프레임워크가 예측 결과들을 결정할 때 다른 임상적 관련 정보와 함께 이들 인자들을 고려하기 때문이다. 예측 결과들은 위험에 처한 환자들을 특정 타입들의 예방 중재를 필요로 하는 상이한 카테고리들로 계층화하는데 사용될 수 있다.
예시적 방법(200)은 도 1을 참조하여 앞서 설명된 시스템(101) 내의 정보 프로세싱 모듈(107)에 의해 구현될 수 있다. 도 2 및 후속 도면들의 논의에서, 도 1에 도시된 엘리먼트들 및 참조 부호들에 대해 지속적인 참조가 이루어질 수 있음이 주의되어야 한다.
202에서, 시스템(101)은 환자 데이터를 검색한다. 일 구현에서, 환자 데이터는 하나 또는 그 초과의 컴퓨터화된 환자 레코드(CPR:computerized patient record)들의 형태로 저장되고, 상기 컴퓨터화된 환자 레코드(CPR)들은 전자 건강 레코드(EHR:electronic health record)들로서 또한 알려진다. 다른 형태들이 또한 유용하다는 것이 인정되어야 한다. 예시적 CPR(또는 EHR)은 환자의 치료 동안에 수집되고 통상적으로 다수의 데이터 소스들로부터 얻는 정보를 포함한다. 아래에서 더욱 상세히 제공되는 바와 같이, 예시적 CPR은, 예컨대, 컴퓨팅된 단층촬영(CT) 이미지들, X-레이 이미지들, 실험실 시험 결과들, 의사 진행 노트(doctor progress note)들, 의료 절차들에 관한 세부사항들, 처방 약물(prescription drug) 정보, 방사선 리포트들, 다른 전문가 리포트들, 인구통계 정보, 및 요금청구(재정) 정보를 포함한다. 재정 데이터베이스, 실험실 데이터베이스, 및 약국 데이터베이스와 같은 구조화된 데이터 소스들은 일반적으로 데이터베이스 테이블들 내에 환자 정보를 유지한다. 또한, 정보는, 자유 텍스트, 이미지들, 파형들, 또는 의사 리포트들(예컨대, 구술들)과 같은 비구조화된 데이터 소스들 내에 저장될 수 있다. 데이터베이스들 내의 환자 데이터의 저장 및 표현과 소프트웨어 애플리케이션들에 의한 환자 데이터의 조작은, 펜실베이니아 몰번에 위치된 Siemens Healthcare에 의해 제조되는 Soarian®과 같은 작업흐름 관리 시스템들과의 통합 가능성을 제안한다.
일 구현에서, 환자 데이터는 유전 데이터 및/또는 비-유전 데이터(예컨대, 임상적 데이터)를 포함한다. 유전 데이터는, 관심 있는 심혈관 질환에 대한 유전 위험 인자들을 표시하는 데이터를 포함하고, 그리고 환자로부터 취해진 생체 샘플(예컨대, 혈액)로부터 수집될 수 있다. 비-유전 데이터는 일반적으로 비-유전 위험 인자들을 표시하는 모든 다른 타입들의 데이터를 지칭하고, 그리고 환자의 검진, 실험실 측정들 및 시험들, 방사선 이미징, 인터뷰, 질문서, 이전 레코드들, 또는 임의의 다른 적절한 수단과 같이 다양한 방법들에 의해 수집될 수 있다. 환자 데이터를 수집할 때 평가시, 환자는 고혈압의 최소 초기 증상들을 나타낼 수 있거나 또는 고혈압의 어떠한 초기 증상들도 나타내지 않을 수 있거나 또는 임의의 다른 관련 질환들을 나타낼 수 있다(즉, 환자는 증상이 없을 수 있다).
유전 데이터는, 예컨대, 단일 뉴클레오티드 다형성(SNP:single nucleotide polymorphism) 또는 환자 내의 다른 다형성들, 또는 지노타이핑(genotyping)에 의해 측정된 다른 종류들의 데이터와 같은 유전 서열(sequence) 세그먼트들 또는 생체지표 데이터의 존재 또는 부재의 표시자들을 포함할 수 있다. 유전 다형성은 유전 서열의 두 개 또는 그 초과의 불연속적인 형태들의 공존을 지칭한다. SNP ― 가장 흔한 다형성들 중 하나임 ― 는, 디옥시리보핵산(DNA) 서열 또는 다른 공유된 서열에서 단일 뉴클레오티드 내에서 발생하는 작은 변형(variation)이다. SNP들은 특정 질병과 관련되는 것으로 발견된 유전자에 또는 상기 유전자 부근에 종종 발생한다. 그러므로, SNP들은 종종, 인간들이 어떻게 질병을 발병시키고 약물들, 화학물질들 및 다른 약제(agent)들에 응답하는지, 그리고 인간들이 얼마나 질병에 걸리기 쉬운지 또는 질병에 저항력이 있는지를 표시하는 우수한 유전 지표들이다. 예컨대, SNP rs16998073은 약 150,000명의 환자들을 포함하는 연구들의 대규모 컨소시엄에서 확장기 혈압과 관련되는 것으로 최근 식별되었고, 그리고 그러므로 고혈압을 발병시키는 환자의 위험을 평가하는데 임상적으로 관련된다. SNP rs4852139는, 단백질들 및 지질들로의 당사슬들의 부가를 포함하는 프로세스인 글리코실화의 최종 산물들과 관련된 유전 지표로서 식별되었다. 글리코실화된 헤모글로빈과 같은 글리코실화된 최종 산물들은 심근경색증(MI)의 위험과 상관되는 것으로 알려졌다.
비-유전 데이터는, 예컨대, 병리학 데이터, 히스토리 데이터, 생화학 데이터, 개인 데이터, 임상적 데이터 또는 이들의 임의의 조합을 포함할 수 있다. 그러한 데이터의 예들은 환자 의료 히스토리(예컨대, 고혈압 또는 다른 심장 대사 질병의 이전 히스토리), 환자 습관들(예컨대, 흡연 상태, 운동 습관들 등), 가족력 데이터(예컨대, 고혈압 또는 다른 심장 대사 질병의 임의의 히스토리), 약물 치료 데이터(예컨대, 당뇨병 또는 지질 저하 약의 사용), 방사선 이미지들(예컨대, 컴퓨팅된 단층촬영(CT) 이미지들, X-레이 이미지들 등), 방사선 리포트들, 의사 진행 노트들, 의료 절차들 및/또는 검사들에 관한 세부사항들(예컨대, 첫 번째 검사와 후속 검사 사이의 시간), 인구통계 정보(예컨대, 나이, 인종, 성, 위치 등), 클리닉 측정 데이터(예컨대, 심박수, 수축기 혈압 및 확장기 혈압, 평균 동맥 혈압 등), 실험실 시험 결과들 등을 포함한다. 실험실 시험 결과들은, 예컨대 포도당, 혈청 인슐린, 스타틴, 알부민 단백질, 고비중 지단백(HDL) 콜레스테롤, 저비중 지단백(LDL) 콜레스테롤, 뇌성 나트륨이뇨펩타이드(BNP), N-종말 프로 b-타입 나트륨이뇨펩타이드(NT-proBNP), 글리코실화된 헤모글로빈, 테스토스테론, 또는 임의의 다른 수량화할 수 있는 특징을 포함하는, 환자로부터 취해진 생체 샘플(예컨대, 소변, 혈액 등) 내에서 발견된 적어도 하나의 생체-지표의 측정치들을 포함할 수 있다.
부가하여, 비-유전 데이터는 임상적 데이터로부터 도출되는 분석적 데이터를 더 포함할 수 있다. 예컨대, 체질량지수(BMI), 평균 동맥압, 맥압(PP), 이중 산물(DP), 비-HDL 콜레스테롤, 크레아티닌 청소율, 사구체 여과 속도, 환자 생활양식 데이터(예컨대, 스트레스 레벨), 또는 다른 생화학 파라미터들과 같은 임상적 유의성의 파라미터들을 생성하기 위해 임상적 데이터에 대해 분석이 수행될 수 있다.
204에서, 환자 데이터는 미래에 환자의 심혈관 질환 발병의 위험 점수를 결정하는데 사용된다. 위험 점수는, 환자 데이터로부터 추출되는 히스토리 정보(또는 피처들)를 이용하여 예측 모델을 훈련시킴으로써 결정될 수 있다. 추출은, 펜실베이니아 몰번에 위치된 Siemens Healthcare에 의해 제조되는 REMINDTM 시스템에서 사용되는 것들과 같은 데이터 마이닝 기술들을 사용하여 수행될 수 있다. 그러한 예시적 데이터 마이닝 기술들은, 2002년 11월 4일자로 출원되고 "Patient Data Mining"으로 명명된 Rao 등에 의한 미국 공개 특허 출원 번호 20030120458 ― 현재 US 7,617,078 ― 에서 설명되며, 상기는 인용에 의해 본 명세서에 그 전체가 포함된다. 상기 특허 출원에서 설명된 데이터 마이닝 프레임워크는, 이전 도메인-특정 지식에 기초하여 CPR들로부터 의료 정보를 마이닝하는 기능들 및 능력들을 갖는 데이터 마이너를 포함한다. 이전 도메인 지식은 관심 있는 심혈관 질환(예컨대, 고혈압 또는 심근경색증), 병원 등에 관련된다. 이전 도메인 지식은, 시스템(101), 또는 시스템(101)에 의해 이해될 수 있는 정보를 생성하는 프로그램들에 입력됨으로써 생성될 수 있고, 그리고 지식 데이터베이스 내에 저장될 수 있다. 데이터 마이너는, CPR들로부터 정보를 추출하고, 시간에 따라 원칙에 입각한 방식으로 모든 이용가능한 증거를 조합하고, 그리고 이러한 조합 프로세스로부터 추론(inference)들을 얻기 위한 컴포넌트들을 포함한다. 그런 다음, 마이닝된 의료 정보는 구조화된 데이터베이스 내에 저장될 수 있다.
도 3은 개인화된 베이지안 네트워크-기반 예측 모델을 이용함으로써 위험 점수를 결정하는 예시적 방법을 도시한다. 인공지능망(ANN:artificial neural network)들, 지원 벡터 머신(SVM:support vector machine)들, 로지스틱 회귀법 등과 같은 다른 예측 데이터 마이닝 모델들이 또한 사용될 수 있음이 인정되어야 한다. 그러나, 베이지안 네트워크-기반 모델은 다른 타입들의 예측 모델들에 비해 두 개의 중요한 장점들을 제공한다: (1) 빠진 값의 존재시 정확한 예측; 그리고 (2) 모델의 본래의 해석능력.
더욱 구체적으로, 베이지안 네트워크는 예측자 변수들이 불완전하거나 또는 빠진 상황들을 쉽게 다룬다. 이는, 예컨대, 불완전한 데이터 수집 프로세스들(예컨대, 환자가 질문서들에 관한 정확한 답변들을 제공하는데 실패함), 환자 관련 인자들의 정확한 평가 및 지식의 부족, 장비에 관련된 비용 제한들, 유전 분석 실패 등으로 인해 발생한다. 대부분의 예측 방법들은, 빠진 데이터의 존재시 어려움을 갖고, 그리고 빠진 값들을 다루기 위해 단순한 평균화 방법 또는 더욱 복잡한 외부 귀속(imputation) 방법을 종종 적용한다. 베이지안 네트워크들은, 변수들 사이에서 종속성들을 인코딩함으로써, 불확실성 하에서 추론하기 위한 방법으로서 그러한 빠진 데이터를 본래 다룰 수 있다. 부가하여, 사용자에게 블랙 박스들인 ANN들 또는 SVM들과 달리, 베이지안 네트워크들은 또한, 관찰되지 않은 노드들에 관한 주변 확률 분포(marginal probability distribution) 및 조건부 확률 분포를 계산하는데 사용될 수 있고, 이로써 의사결정 의료 시스템들 내의 불확실성들의 본래 표현이 제공된다. 또한, 베이지안 네트워크의 그래픽적인 표현은 상이한 속성들 사이의 인과 관계들의 의미 있는 해석을 가능케 하고, 그리고 새로운 링크들 및 그래프들에 관해 추론하기 위한 효과적인 수단을 제공하며, 이로써 문제 도메인에 관한 이해가 용이하게 된다.
베이지안 네트워크들은 방향성 비사이클 그래프들로서 형식적으로 표현되고, 이때 각각의 노드는 랜덤 변수를 표현한다. 두 개의 노드들 사이의 링크는 변수들 사이의 관계를 표시하고, 방향은 인과관계를 표시한다. 연결되지 않은 노드들은 조건부로 서로 독립적인 변수들을 표현한다. 노드가 알려진 값을 갖는다면, 상기 노드는 증거 노드로서 지칭된다. 현재 상황에서, 각각의 노드의 변수들은 특정 의료 조건(예컨대, 고혈압 또는 당뇨병들)의 존재 또는 부재 또는 측정가능한 수량(예컨대, 혈당치)를 표현할 수 있다. 각각의 노드는 조건부 확률 분포와 관련될 수 있고, 조건부 확률 분포는 자신의 부모들과의 자신의 파라메트릭 종속성 관계를 표현한다. 확률 분포는 연속적일 수 있거나 또는 이산적일 수 있다. 연속 확률 함수와 관련된 노드는 가우시안 랜덤 변수로서 표현될 수 있다.
도 3을 참조하면, 302에서, 심혈관 질환에 임상적으로 관련되는 환자 데이터가 먼저 검색된다. 관련 환자 데이터는, 예컨대, 앞서 설명된 바와 같은 데이터 마이너에 의해 파퓰레이팅(populate)되는 구조화된 데이터베이스로부터 검색될 수 있다.
304에서, 베이지안 네트워크의 구조는 관련 환자 데이터로부터 학습된다. 변수들의 세트
Figure pct00001
가 주어지면, 베이지안 네트워크 구조 S는 방향성 비사이클 그래프로서 표현되는 X 내 변수들에 관한 조건부 독립성 주장(conditional independence assertion)들의 세트를 인코딩한다. 그래프를 수립하기 위한 탐색 공간은, 다모드이고, 노드들의 개수와 함께 급격히 성장하고, 그리고 탐색 방법이 막히도록 유발할 수 있는 많은 국지적 최적화(local optima)(예컨대, 최대치들 또는 최소치들)를 포함한다. 다양한 타입들의 탐색 방법들이 탐색 공간 내에서 최적 구조를 발견하는데 사용될 수 있다. 일 구현에서, 마르코프 사슬 몬테 카를로(MCMC:Markov Chain Monte Carlo) 국지적 탐색 방법은 베이지안 네트워크의 구조를 학습하는데 사용된다. MCMC는 다른 방법들보다 더 빨리 국지적으로 최적 구조로 수렴되어, 더욱 정확한 구조 학습 및 시험 데이터에 관한 더 높은 예측 가능성들이 야기된다. 시뮬레이팅된 어닐링, 개미 집단 최적화(ACO:ant colony optimization)-기반 기술들, 또는 임의의 근사 전역 탐색 또는 최적화 방법과 같은 전역(global) 탐색들을 포함하는 다른 탐색 기술들이 또한 사용될 수 있다.
306에서, 베이지안 네트워크의 파라미터들은 관련 환자 데이터로부터 학습된다. 이들 파라미터들은, 베이지안 네트워크를 정의하는 조건부 확률들의 일부를 형성한다. 상기 파라미터들은 종종 알려져 있지 않고, 그리고, 예컨대 예상 최대화(EM:expectation maximization) 접근법을 이용하여 환자 데이터로부터 추정될 수 있다. EM은 데이터세트 내에서 빠진 값들의 존재를 다루는데 적절한 탐색 기술이다. EM 방법은 파라미터들의 최대 가능성 추정을 계산하기 위해 두 개의 문제점들(E 및 M 단계들)을 번갈아 해결한다. 더욱 구체적으로, EM 방법은, 이전에 계산된 예상 값들이 정확하다고 가정하면, 전체 가능성(complete likelihood)(또는 후방)을 최대화하면서, 관찰된 데이터에 달려있는 관찰되지 않은 변수들의 예상 값들을 번갈아 계산한다. 최적 지점 추정치로 수렴되기 위해, 알고리즘은 모델 파라미터들의 랜덤 초기화들로 시작된다.
308에서, 결과적인 훈련된 베이지안 네트워크는 환자의 위험 점수를 계산하는데 사용된다. 일 구현에서, 위험 점수는, 관찰된 환자 값들이 네트워크 구조 내에 포함된 것이 주어진다면, 환자가 관심 있는 심혈관 질환을 근래에(예컨대, 5년 또는 10년) 발병시킬 확률을 표현한다. 점수는 미리정의된 척도로(예컨대, 0 내지 100) 수치 값일 수 있고, 이때 더 높은 값들은 더 높은 확률들에 대응한다. 반대 척도들 또는 정규화된 값들을 포함하는 임의의 다른 타입들의 표현들이 또한 사용될 수 있음이 인정되어야 한다.
나머지 변수들에 관해 관찰된 증거를 고려하여 주어진 노드 또는 노드들의 서브세트의 후방을 계산하는 프로세스는 확률적 추론으로 불린다. 확률적 추론은 정확할 수 있거나 또는 근사적일 수 있다. 정확한 추론은, 증거 변수들의 정확한 상태가 주어진다면, 질의 변수들의 확률들을 결정하는 것을 포함한다. 정확한 추론을 수행하기 위해 정션 트리(junction tree) 알고리즘, 기호 확률적 추론(SPI:symbolic probabilistic inference) 등이 사용될 수 있다. 정확한 통계적 추론이 가능하지 않은 경우, 근사 추론이 사용될 수 있다. 근사 추론을 수행하기 위해, 보이엔-콜러(Boyen-Koller) 알고리즘, 입자 필터링, 깁스(Gibbs) 샘플링 또는 다른 적절한 기술이 사용될 수 있다.
도 4는 고혈압의 발병을 예측하도록 훈련된 예시적 베이지안 네트워크-기반 모델(400)을 도시한다. 베이지안 네트워크-기반 모델(400)은, 두 개의 노드들(402) 사이의 각각의 관계에 대응하는 가중치들(404)을 갖는 방향성 비사이클 그래프로 표현되는 전체 통계적 모델(complete statistical model)이다. 환자가 고혈압(또는 위험 점수)을 발병시킬 확률은 노드 "hyp"(408)로 표현된다.
"SHIP(The Study of Health in Pomerania)"로서 알려진 인구-기반 역학 연구로부터 훈련 및 확인(validation) 시험 데이터가 획득되었다. 예컨대, John U 등에 의한 "Study of health in Pomerania(SHIP):a health examination survey in an east German region:objectives and design"(Sozial- und Praeventivmedizin, 46(3):186-194(2001))을 참조하라 ― 상기는, 본 명세서에 인용에 의해 포함됨 ―. SHIP은, 모든 독일 국민들이 등록되어야 하는 인구 등록부들을 이용하여, 20세-79세 나이의 인구로부터 샘플들을 얻었다. 연구 구역 내의 독일 시민권 및 주요 거주(main residency)를 갖는 개인들만이 포함되었다. 7008명의 피실험자들이 샘플링되었고, 이때 각각의 성(gender)의 292명의 사람들이 12개의 5-년 나이 계층들(5-year age strata) 각각 내에 있다. 이민(migration) 또는 사망에 의한 이탈(drop-out)들을 최소화하기 위하여, 피실험자들은 두 개의 웨이브들로 선택되었다. (이민간 사람들 또는 사망한 사람들이 없는) 순 샘플(net sample)은 6267명의 적격 피실험자들을 포함했다. 선택된 사람들은 최대 세 개의 서면으로 된 초대장들을 받았다. 무-응답의 경우, 편지들 다음에 전화 호출 또는 전화에 의한 접촉이 가능하지 않았다면 가정 방문들이 뒤를 이었다. SHIP-0(베이스라인) 연구 및 SHIP-1(후속) 연구로부터의 4310명의 개인들로부터 이용가능한 데이터는 베이지안 네트워크-기반 모델(400)을 훈련시키는데 사용되었다. 데이터는: 임상적 히스토리(나이, 약들, BMI, 흡연 상태), 게놈(genomic)(SNP)들과 다른 생체지표들 및 측정치들 ― 혈당치들(혈청), HDL 및 LDL 콜레스테롤 등을 포함함 ― 을 포함했다. 목표는, SHIP-0 연구(베이스라인) 동안에 건강하다고 간주된 어느 개인들이 대략 5년 후에 후속 검사(SHIP-1)에서 고혈압을 발병시켰는지를 명료하게(perspectively) 정확하게 예측하는 것이었다. 현재 연구의 장점(strength)들은 인구-대표성 및 고품질의 데이터를 포함한다. 연구 인구가 훈련 세트와 확인 세트로 분할되었지만, 결과(finding)들은 독립적인 인구들에서 되풀이되지 않았다. 그러므로, 그러한 결과들은 가설 생성(hypothesis generating)으로서 간주되어야 한다.
베이지안 네트워크-기반 모델을 구성하기 위하여, 먼저 인공 피처들이 훈련 데이터로부터 추출되었다.
Figure pct00002
에 대한 프로덕트(product)들
Figure pct00003
의 조합을 포함하는 인공 피처들은 피처들 사이에서 비-선형(예컨대, 이차) 상호작용들을 고려하도록 생성되었다. 이는, 1225개 피처들을 야기했다. 분류에 관련된 피처들의 작은 서브세트를 획득하기 위해 훈련 세트 내의 교차-확인을 이용하여 L1-기준(norm) 지원 벡터 머신이 피처 선택 방법으로서 적용되었다. 관련 피처들의 서브세트는 환자 나이("AGE_0"), (2*평균 수축기 혈압+평균 확장기 혈압)/3으로서 정의된 평균 동맥 혈압("MAP_0"), 첫 번째 검사와 후속 검사 사이의 시간("time_fu"), 혈당치("GLUC_S_0"), 당뇨병 약들의 사용("diab_med"), 지질 저하 약들의 사용("Statins_0"), 소변 샘플 내에서 발견된 알부민 단백질의 양("ALB_U_0"), 그리고 확장기 혈압과 관련된 SNP rs16998703 측정치("rs16998703")를 포함했다. 관심 있는 질환에 따라, 다른 타입들의 관련 피처들이 또한 추출될 수 있음이 인정되어야 한다.
도 4를 참조하면, 베이지안 네트워크-기반 모델(400)의 구조는 추출된 피처들:
Figure pct00004
Figure pct00005
에 기초하여 5개의 변수-드래프트 구조로부터 학습되었다. 그런 다음, 베이지안 지능망(BNN) 알고리즘은 변수들(402)의 가중치들을 추정하는데 적용되었다. 예컨대, Eaton D, Murphy K.에 의한 "Bayesian structure learning using dynamic programming and MCMC"(2007 Proceedings of the 23nd Annual Conference on Uncertainty in Artificial Intelligence(UAI-07))을 보라 ― 상기는 본 명세서에 인용에 의해 포함됨 ―. 링크 가중치들(404)뿐만 아니라, 각각의 피처에 대한 평균들 및 분산(variance)들이, 관찰된 데이터의 가능성을 최대화시키면서 각자의 포인트 추정치들로 수렴되기 위해 EM 알고리즘을 이용하여 반복적으로 학습되었다.
고혈압(408)을 발병시킬 확률을 갖는 변수
Figure pct00006
의 네거티브 상관(406)을 주의하는 것이 흥미롭다. 제1 노드와 제2 노드 사이의 네거티브 링크 가중치가 제1 노드의 값의 증가가 제2 노드의 값의 감소를 유발할 것임을 표시하는 반면에, 포지티브 링크 가중치는 제1 노드의 값의 증가가 제2 노드의 값이 증가하도록 유발할 것임을 의미한다. 흔히 있는(incident) 고혈압과의 역 관련성(inverse association)에 대한 항당뇨병 약과 스타틴들 사이의 상호작용은 이 연구의 중요 결과(key finding)를 표현한다. 이러한 결과는, 적어도 당뇨병들을 갖는 피실험자들에서, 스타틴들의 항고혈압성 효과를 표시할 수 있다. 이는, 스타틴들의 가능한 다면발현성 항고혈압성 효과들을 증명하는 이전 연구들과 비슷하다.
다른 흥미로운 결과는, 증상이 없는 환자들의 고혈압을 예측하는데 사용될 수 있는 rs16998073과 단백뇨 사이의 상호작용이다. SNP rs16998073는 ~150,000명의 참가자들을 포함한 대규모 컨소시엄에서 확장기 혈압과 관련되는 것으로 최근 식별되었다. 그러나, 흔히 있는 고혈압에 대한 단백뇨와 SNP의 상호작용을 넘어선 정확한 메커니즘은 추가의 연구가치가 있다.
도 5a는 고혈압을 예측하기 위한 훈련된 베이지안 네트워크-기반 모델(400)에 대응하는 예시적 수신기 동작 곡선(ROC:receiver operating curve)(500)을 도시한다. 이전에 논의된 바와 같이, 마지막 모델이 훈련되었을 때까지, 주요 코호트(main cohort)가 랜덤하게 훈련 데이터(70%)와 처음보는(unseen) 시험 데이터(30%)로 분할되었다. 훈련 데이터 세트(502)에 대한 ROC 곡선(AUC) 아래의 면적은 0.802였다. 이는, 0.796의 AUC를 갖는, 처음보는 시험 데이터 세트(504)에 대해 달성된 성과와 거의 동일했다.
도 5b는 심근경색증(MI)을 예측하도록 훈련된 예측 모델에 의해 획득되는 다른 예시적 ROC(550)를 도시한다. 실험용 코호트 세트는 고혈압환자(hyper tense)로 간주되지 않은, SHIP 데이터베이스로부터의 4310명의 개인들을 포함한다. 코호트 세트는 랜덤하게, 예측 모델을 훈련시키기 위한 훈련 세트(70%)와 모델을 확인하기 위한 처음보는 시험 세트(30%)로 분할되었다. 이들 4310명의 개인들 중에서, 그들 중 44명은 SHIP-0 검사와 SHIP-1 검사 사이에 MI로 고통받았다. 예측 모델을 구성하기 위해 관련 피처들의 서브세트가 훈련 세트로부터 추출되었다. 관련 피처들은 환자 나이, 글리코실화된 헤모글로빈의 퍼센티지 레벨, 흡연 상태, 테스토테론 레벨, 혈압, 및 SNP rs4852139 측정치를 포함한다. 도 5b에 도시된 바와 같이, 훈련 세트(552)에 대한 ROC 곡선(AUC) 아래의 면적은, 0.78의 AUC를 갖는, 처음보는 시험 세트(554)에 의해 달성된 성과와 거의 동일한 0.78였다.
일단 위험 점수가 획득되면, 위험 점수는 환자를 위험 카테고리로 분류하는데 사용될 수 있다. 도 2를 다시 참조하면, 206에서, 위험 점수에 따라 환자는 다수의 위험 카테고리들 중 적어도 하나로 분류된다. 위험에 처한 환자들을 상이한 위험 카테고리들로 계층화함으로써, 관심 있는 심혈관 질환의 발병을 방지하기 위해, 선택된 위험 그룹과 관련된 개인화된 예방 전략이 권고될 수 있다. 일 구현에서, 위험 카테고리들은 위험 점수에 기초하여 적어도 제1 타입 및 제2 타입으로 그룹화된다. 예컨대, 더 낮은 위험 점수들(예컨대, 50 또는 그 미만)을 갖는 환자들이 고혈압의 비-강제적 표시들과 연관된 카테고리들로 분류되는 반면에, 더 높은 위험 점수들(예컨대, 51-100)을 갖는 환자들은 강제적 표시들과 관련된 카테고리들 내에 분류된다. 제1 타입 및 제2 타입은 위험 점수에 따라 다수의 서브-카테고리들(예컨대, 스테이지 1, 스테이지 2 등)로 추가로 세분화될 수 있다. 서브-카테고리화의 추가 레벨들을 포함하는 다른 타입들의 카테고리화들이 또한 사용될 수 있음이 인정되어야 한다.
208에서, 개인화된 리포트가 선택된 위험 카테고리와 관련된 예방 전략의 권고와 함께 제시된다. 공통적으로 사용되는 가이드라인들에 따라 다양한 타입들의 예방 중재가 권고될 수 있다. 질병의 발병을 방지하기 위한 예시적 예방 조치들은 지질 저하 약물들을 처방하는 것, 생활양식 수정, 추가 테스팅을 이용한 더욱 규칙적인 모니터링, 다른 의사에게로 보내기(referral) 등을 포함한다.
일 구현에서, 시스템(101)은 자동으로 선택된 권고 및/또는 관련된 결과들(예컨대, 위험 점수, 위험 카테고리 등)과 함께 개인화된 리포트를 제시한다. 부가하여, 다양한 분석적 파라미터들, 원시 실험실 판독들, 유전 데이터 또는 관심 있는 심혈관 질환을 예측하는데 임상적 유의성의 임의의 다른 환자 정보가 또한 리포트에서 제시될 수 있다. 그러한 정보의 예들은, 예컨대, 환자의 나이, 평균 동맥 혈압, 제1 검사와 후속 검사 사이의 시간, 혈당치, 당뇨병 약 및 지질 저하 약의 존재, 소변 샘플 내에서 발견된 알부민 단백질의 양, 확장기 혈압과 관련된 SNP 측정치들(예컨대, rs16998703), 또는 이들의 임의의 조합을 포함한다. 리포트는, 환자의 후속 및 예방 치료 선택에 관해 의사결정하는데 도움을 주기 위해, 1차 진료의 또는 임의의 다른 의료 개업자에게 즉시 이용가능하게 될 수 있다. 리포트의 제시는, 예컨대 전자 의료 레코드, 인쇄된 레코드, 디스플레이 또는 통신 디바이스에 있는 팝업 경보 메시지 박스, 또는 임의의 다른 적절한 수단의 형태로 있을 수 있다. 부가하여, 리포트는, 환자의 고위험 점수에 관해 의료 개업자에게 경보하기 위해 의료 개업자에게 직접적으로 송신되는 통신 메시지로서 제시될 수 있다. 통신 메시지는 예컨대 전자 메일(email), 팩시밀리, 음성 메시지, 단문 메시지 서비스(SMS) 텍스트, 존재 시스템, 소셜 미디어 네트워크(예컨대, 트위터) 등을 통해 송신될 수 있다.
본 프레임워크는 또한 진단 작업흐름을 간소화(streamline)하는데 사용될 수 있다. 일 구현에서, 진단 작업흐름은 실험실 시험들, 클리닉 내 검사(in-clinic examination)들, 및/또는 환자들로부터의 다른 환자 정보의 수집을 이용하여 개시된다. 정보 수집은 특정 특성들과 관련된 환자들의 코호트의 연간 스크리닝 검사의 일부로서 수행될 수 있다. 예컨대, 코호트는, 일차 친족들 사이에서 고혈압의 가족력으로 인해 고혈압에 대해 위험에 처한 특정 환자들, 및/또는 다른 심장 대사 질병들(예컨대, 당뇨병들 또는 심장 질병들)을 갖는 환자들을 포함할 수 있다. 다른 예에서, 코호트는, 일차 친족들 사이에서 심장 질병 또는 만성 고혈압의 가족력 때문에 MI에 대해 위험에 처한 환자들, 또는 다른 심장 대사 질병들 및/또는 다른 관련 인자들을 갖는 환자들을 포함할 수 있다.
일 구현에서, 예방 전략들의 임의의 권고를 포함하는 본 프레임워크의 결과들은, 해석 리포트로서 1차 진료의에게 제시된다. 권고 외에, 해석 리포트가 원시 실험실 판독들 또는 시험 결과들을 또한 포함할 수 있다. 해석 리포트는 실험실로부터 1차 진료의에게 직접적으로 인쇄된 형태로 또는 전자 형태로 송신될 수 있다. 해석 리포트는, 의사결정지원을 제공하여, 근래에 환자의 심혈관 질환 발병 위험을 평가하는데 의사에게 도움을 줄 수 있다. 리포트에 기초하여, 의사는 최적 예방 전략을 권고할 수 있다. 부가하여, 권고는 시스템(101)에 입력되어, 환자를 모니터링하기 위한 또는 수년 내 후속 위험 평가를 위한 추가 입력으로서 사용될 수 있다. 대안적으로 또는 이들의 조합으로, 시스템(101)은 권고된 예방 전략에 따라 하나 또는 그 초과의 직무 아이템들을 자동으로 생성할 수 있다. 직무 아이템들은 컴퓨터화된 의사 오더(order) 엔트리(CPOE:computerized physician order entry) 시스템에 명령들로서 입력될 수 있고, 상기 컴퓨터화된 의사 오더 엔트리(CPOE)는 각자의 치료 하에서 환자들을 치료하기 위해 명령들을 관리하고 의료 개업자들(예컨대, 의사, 방사선전문의, 약사, 간호사 등)에게 명령들을 통신한다. 직무 아이템들은 또한, 각자의 치료 하에 있는 환자들을 치료하기 위해 의료 개업자들에 의해 완료될 단계들로서 임상 작업흐름 관리 시스템에 입력될 수 있다.
도 6은 고혈압의 지속적인 모니터링, 예방 및/또는 치료를 위한 예시적 프로세스(600)를 도시한다. 602에서, 위험에 처해 있는 것으로 식별된 환자들(예컨대, 특정한 미리결정된 레벨을 초과하는 위험 점수를 갖는 환자들)의 후속 고혈압의 위험을 낮추기 위해 생활양식 수정들이 권고된다. 그러한 생활양식 수정들은, 예컨대 정상 체중을 유지하는 것, 규칙적인 유산소 운동, 식이요법 변화들, 나트륨 섭취량 감소, 적당한 칼륨 섭취량을 유지하는 것, 알코올 소비량을 알맞게 하는 것 등을 포함한다. 그러한 생활양식 수정들의 목표는 혈압을 원하는 레벨(예컨대, <140/90 mm Hg)로 낮추거나 또는 상기 원하는 레벨에서 유지시키는 것이다. 시스템(101)은, 증상이 없는(즉, 건강한) 환자들을 위한 일차 예방으로서 또는 급성 관상 이벤트(acute coronary event)(예컨대, 심부전)를 이미 겪은 환자들을 위한 이차 예방으로서 그러한 생활양식 수정들을 권고할 수 있다.
604에서, 원하는 혈압이 달성되지 않으면, 시스템(101)은 예방 조치들의 추가 권고들을 제시할 수 있다. 예컨대, 606에서, 초기 약물 선택이 환자와 관련된 위험 카테고리에 따라 제공될 수 있다. 일 구현에서, 비-강제적 표시들(또는 저위험 점수)과 관련된 위험 카테고리(608) 내의 환자들은 더 낮은 위험 점수 및 더 높은 위험 점수에 따라 스테이지 1 및 스테이지 2로서 각각 추가로 분류될 수 있다. 612에서, 스테이지 1 고혈압 위험 카테고리와 관련된 환자들은 티아지드 이뇨제(thiazide diuretic), 안지오텐신-전환 효소(ACE:angiotensin-converting enzyme) 억제(inhibiting) 약, 베타 차단제들, 또는 임의의 다른 적절한 약을 처방받을 수 있다. 614에서, 스테이지 2 고혈압 위험 카테고리 내의 환자들은 예컨대 다제(multi-drug) 조합을 처방받을 수 있다. 예시적 조합들은, CCB를 갖는 ACE 억제제, 또는 ACEI, ARB, BB 또는 CCB를 갖는 티아지드를 포함한다. 616에서, 강제적 표시들(또는 고위험 점수)과 관련된 위험 카테고리(610) 내의 환자들에게는 특정 약물들이 처방될 수 있다.
618에서, 원하는 혈압이 달성되지 않으면, 시스템(101)은 부가적인 예방 조치들을 권고할 수 있다. 예컨대, 620에서, 타겟 혈압이 달성될 때까지, 약의 복용량은 최적화될 수 있거나, 수정될 수 있거나, 부가적인 약물들이 부가될 수 있다. 또한, 시스템(101)은, 환자가 고혈압 전문가와 상의하는 것을 권고할 수 있다. 다른 예방 조치들이 또한 권고될 수 있다는 것이 이해된다.
하나 또는 그 초과의 위에서-설명된 구현들이 구조적 피처들 및/또는 방법론적 단계들로 특정되는 언어로 설명되었지만, 설명된 특정 피처들 또는 단계들 없이 다른 구현들이 구현될 수 있음이 이해될 것이다. 그보다는, 특정 피처들 및 단계들은 하나 또는 그 초과의 구현들 중 바람직한 형태들로서 개시된다.
추가로, 방법 또는 프로세스 단계들, 알고리즘들 등등이 순차적인 순서로 설명될 수 있더라도, 그러한 프로세스들은 상이한 순서들로 작업하도록 구성될 수 있다. 다시 말해, 명시적으로 설명될 수 있는 단계들의 임의의 시퀀스 또는 순서는 반드시 상기 단계들이 그 순서로 수행된다는 요건을 표시하지 않는다. 여기서 설명된 프로세스들의 단계들은 실현가능한 임의의 순서로 수행될 수 있다. 추가로, 몇몇의 단계들은, 비-동시적으로 발생하는 것으로서 설명되거나 또는 암시되더라도, 동시에 수행될 수 있다(예컨대, 왜냐하면 하나의 단계는 다른 단계 이후에 설명되기 때문이다). 또한, 도면 내에서 프로세스의 묘사에 의한 상기 프로세스의 예시는, 예시된 프로세스가 다른 변형들 및 상기 다른 변형들에 대한 수정들을 시제외함을 암시하지 않고, 예시된 프로세스 또는 상기 예시된 프로세스의 단계들 중 임의의 단계가 본 발명에 필요함을 암시하지 않으며, 그리고 예시된 프로세스가 바람직함을 암시하지 않는다.
프로세스가 복수의 단계들을 포함하는 것으로서 설명될 수 있더라도, 상기는, 단계들 중 전부 또는 심지어 임의의 단계가 필수적이거나 또는 요구됨을 표시하지 않는다. 설명된 발명(들)의 범위 내의 다양한 다른 실시예들은, 설명된 단계들 중 몇몇 또는 전부를 생략하는 다른 프로세스들을 포함한다. 명시적으로 그렇지 않다고 특정되지 않는 한, 필수적이거나 또는 요구되는 단계는 없다.

Claims (24)

  1. 환자 내의 관심 있는 심혈관 질환의 발병을 예측하는 방법으로서,
    (ⅰ) 유전 데이터 및 비-유전 데이터를 포함하는, 상기 환자와 관련된 환자 데이터를 검색하는 단계;
    (ⅱ) 관심 있는 상기 심혈관 질환에 관련된 이전 도메인 지식을 이용하여, 상기 환자 데이터의 함수로서 위험 점수를 결정하는 단계; 및
    (ⅲ) 상기 위험 점수에 따라, 상기 환자를 다수의 위험 카테고리들 중 적어도 하나의 카테고리로 분류하는 단계 ― 상기 다수의 위험 카테고리들은 상이한 예방 전략들과 관련됨 ―
    를 포함하는,
    환자 내의 관심 있는 심혈관 질환의 발병을 예측하는 방법.
  2. 제 1 항에 있어서,
    다수의 위험 카테고리들 중 상기 적어도 하나의 카테고리와 관련된 예방 전략을 권고하는 리포트를 제시하는 단계
    를 더 포함하는,
    환자 내의 관심 있는 심혈관 질환의 발병을 예측하는 방법.
  3. 제 1 항에 있어서,
    상기 유전 데이터는 단일 뉴클레오티드 다형성(SNP:single nucleotide polymorphism) 지표 데이터를 포함하는,
    환자 내의 관심 있는 심혈관 질환의 발병을 예측하는 방법.
  4. 제 1 항에 있어서,
    상기 비-유전 데이터는 병리학 데이터, 히스토리 데이터, 생화학 데이터, 개인 데이터, 임상적 데이터 또는 이들의 임의의 조합을 포함하는,
    환자 내의 관심 있는 심혈관 질환의 발병을 예측하는 방법.
  5. 제 1 항에 있어서,
    상기 비-유전 데이터는, 환자 의료 히스토리, 환자 습관들, 가족력 데이터, 약물 치료 데이터, 방사선 이미지들, 방사선 리포트들, 의사 진행 노트들, 의료 절차들 및/또는 검사들에 관한 세부사항들, 인구통계 정보, 클리닉 측정 데이터, 실험실 시험 결과들, 또는 이들의 임의의 조합을 포함하는,
    환자 내의 관심 있는 심혈관 질환의 발병을 예측하는 방법.
  6. 제 5 항에 있어서,
    상기 실험실 시험 결과들은 상기 환자로부터 취해진 생체 샘플 내에서 발견된 적어도 하나의 생체-지표의 측정치들을 포함하는,
    환자 내의 관심 있는 심혈관 질환의 발병을 예측하는 방법.
  7. 제 6 항에 있어서,
    상기 생체-지표는, 포도당, 혈청 인슐린, 스타틴, 알부민 단백질, 고비중 지단백(HDL) 콜레스테롤, 저비중 지단백(LDL) 콜레스테롤, 뇌성 나트륨이뇨펩타이드(BNP), N-종말 프로 b-타입 나트륨이뇨펩타이드(NT-proBNP), 글리코실화된 헤모글로빈, 테스토스테론, 또는 이들의 임의의 조합을 포함하는,
    환자 내의 관심 있는 심혈관 질환의 발병을 예측하는 방법.
  8. 제 1 항에 있어서,
    (ⅱ) 단계는,
    상기 환자 데이터로부터 마이닝된 피처들을 이용하여 예측 모델을 훈련시키는 단계; 및
    상기 예측 모델을 통해 상기 위험 점수를 결정하는 단계
    를 포함하는,
    환자 내의 관심 있는 심혈관 질환의 발병을 예측하는 방법.
  9. 제 8 항에 있어서,
    상기 예측 모델은 지능망-기반 예측 모델을 포함하는,
    환자 내의 관심 있는 심혈관 질환의 발병을 예측하는 방법.
  10. 제 8 항에 있어서,
    상기 예측 모델은 베이지안 네트워크-기반 예측 모델을 포함하는,
    환자 내의 관심 있는 심혈관 질환의 발병을 예측하는 방법.
  11. 제 10 항에 있어서,
    마르코프 사슬 몬테 카를로(MCMC:Markov Chain Monte Carlo) 탐색, 시뮬레이팅된 어닐링, 또는 개미 집단 최적화(ACO:ant colony optimization)-기반 기술을 수행함으로써, 상기 베이지안 네트워크-기반 예측 모델의 구조를 학습하는 단계
    를 더 포함하는,
    환자 내의 관심 있는 심혈관 질환의 발병을 예측하는 방법.
  12. 제 10 항에 있어서,
    예상-최대화(expectation-maximization) 방법을 수행함으로써, 상기 베이지안 네트워크-기반 예측 모델의 하나 또는 그 초과의 파라미터들을 학습하는 단계
    를 더 포함하는,
    환자 내의 관심 있는 심혈관 질환의 발병을 예측하는 방법.
  13. 제 8 항에 있어서,
    상기 위험 점수를 계산하기 위해 확률적 추론을 수행하는 단계 ― 상기 위험 점수는, 상기 예측 모델 내에 관찰된 값들이 주어진다면, 상기 환자가 상기 심혈관 질환을 발병시킬 확률을 표현함 ―
    를 더 포함하는,
    환자 내의 관심 있는 심혈관 질환의 발병을 예측하는 방법.
  14. 제 1 항에 있어서,
    상기 다수의 위험 카테고리들은 적어도 제1 그룹 및 제2 그룹으로 그룹화되고, 상기 제1 그룹이 관심 있는 상기 심혈관 질환의 비-강제적 표시들과 관련되는 반면에, 상기 제2 그룹은 관심 있는 상기 심혈관 질환의 강제적 표시들과 관련되는,
    환자 내의 관심 있는 심혈관 질환의 발병을 예측하는 방법.
  15. 제 14 항에 있어서,
    적어도 상기 제1 그룹 또는 상기 제2 그룹은 위험 카테고리들의 서브-그룹들로 세분화되는,
    환자 내의 관심 있는 심혈관 질환의 발병을 예측하는 방법.
  16. 제 1 항에 있어서,
    상기 예방 전략들은 생활양식 수정, 약 처방, 규칙적인 모니터링, 추가의 테스팅, 다른 의사에게로 보내기, 또는 이들의 임의의 조합을 포함하는,
    환자 내의 관심 있는 심혈관 질환의 발병을 예측하는 방법.
  17. 제 16 항에 있어서,
    상기 생활양식 수정은, 정상 체중을 유지하는 것, 규칙적인 유산소 운동, 식이요법 변화들, 나트륨 섭취량 감소, 적당한 칼륨 섭취량을 유지하는 것, 알코올 소비량을 알맞게 하는 것, 또는 이들의 임의의 조합을 포함하는,
    환자 내의 관심 있는 심혈관 질환의 발병을 예측하는 방법.
  18. 제 2 항에 있어서,
    원하는 혈압이 달성되지 않으면 적어도 하나의 부가적인 권고를 제시하는 단계
    를 더 포함하는,
    환자 내의 관심 있는 심혈관 질환의 발병을 예측하는 방법.
  19. 제 1 항에 있어서,
    상기 환자 데이터를 수집할 때 평가 시점에, 상기 환자는 증상이 없는,
    환자 내의 관심 있는 심혈관 질환의 발병을 예측하는 방법.
  20. 제 1 항에 있어서,
    다수의 위험 카테고리들 중 상기 적어도 하나의 위험 카테고리와 연관된 예방 전략에 따라 하나 또는 그 초과의 직무 아이템들을 자동으로 생성하는 단계
    를 더 포함하는,
    환자 내의 관심 있는 심혈관 질환의 발병을 예측하는 방법.
  21. 제 1 항에 있어서,
    관심 있는 상기 심혈관 질환은 고혈압을 포함하는,
    환자 내의 관심 있는 심혈관 질환의 발병을 예측하는 방법.
  22. 제 1 항에 있어서,
    관심 있는 상기 심혈관 질환은 심근경색증 또는 뇌졸증을 포함하는,
    환자 내의 관심 있는 심혈관 질환의 발병을 예측하는 방법.
  23. 환자 내의 관심 있는 심혈관 질환의 발병을 예측하기 위한 단계들을 수행하기 위해 머신에 의해 실행가능한 명령들의 프로그램을 사용하는 비-일시적 컴퓨터 판독가능 매체로서,
    상기 단계들은,
    (ⅰ) 유전 데이터 및 비-유전 데이터를 포함하는, 상기 환자와 관련된 환자 데이터를 검색하는 단계;
    (ⅱ) 관심 있는 상기 심혈관 질환에 관련된 이전 도메인 지식을 이용하여, 상기 환자 데이터의 함수로서 위험 점수를 결정하는 단계; 및
    (ⅲ) 상기 위험 점수에 따라, 상기 환자를 다수의 위험 카테고리들 중 적어도 하나의 카테고리로 분류하는 단계 ― 상기 다수의 위험 카테고리들은 상이한 예방 전략들과 관련됨 ―
    를 포함하는,
    비-일시적 컴퓨터 판독가능 매체.
  24. 건강관리 정보 기술 시스템으로서,
    비-일시적 컴퓨터 판독가능 프로그램 코드를 저장하기 위한 메모리 디바이스; 및
    상기 메모리 디바이스와 통신하는 프로세서
    를 포함하고,
    상기 프로세서는, 상기 컴퓨터 판독가능 프로그램 코드를 이용하여,
    (ⅰ) 유전 데이터 및 비-유전 데이터를 포함하는, 환자와 관련된 환자 데이터를 검색하고;
    (ⅱ) 관심 있는 상기 심혈관 질환에 관련된 이전 도메인 지식을 이용하여, 상기 환자 데이터의 함수로서 위험 점수를 결정하고; 그리고
    (ⅲ) 상기 위험 점수에 따라, 상기 환자를 다수의 위험 카테고리들 중 적어도 하나의 카테고리로 분류하기 위해 ― 상기 다수의 위험 카테고리들은 상이한 예방 전략들과 관련됨 ―
    동작되는,
    건강관리 정보 기술 시스템.
KR1020137012198A 2010-10-12 2011-10-12 심혈관 질환들의 발병을 예측하기 위한 건강관리 정보 기술 시스템 KR20130132802A (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US39215610P 2010-10-12 2010-10-12
US61/392,156 2010-10-12
US13/046,990 US20110202486A1 (en) 2009-07-21 2011-03-14 Healthcare Information Technology System for Predicting Development of Cardiovascular Conditions
US13/046,990 2011-03-14
PCT/US2011/055924 WO2012051269A1 (en) 2010-10-12 2011-10-12 Healthcare information technology system for predicting development of cardiovascular conditions

Publications (1)

Publication Number Publication Date
KR20130132802A true KR20130132802A (ko) 2013-12-05

Family

ID=44860549

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020137012198A KR20130132802A (ko) 2010-10-12 2011-10-12 심혈관 질환들의 발병을 예측하기 위한 건강관리 정보 기술 시스템

Country Status (5)

Country Link
US (1) US20110202486A1 (ko)
EP (1) EP2628113A1 (ko)
KR (1) KR20130132802A (ko)
CN (1) CN103493054A (ko)
WO (1) WO2012051269A1 (ko)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180040287A (ko) * 2016-10-12 2018-04-20 (주)헬스허브 기계학습을 통한 의료영상 판독 및 진단 통합 시스템
WO2018124831A1 (ko) * 2016-12-30 2018-07-05 서울대학교 산학협력단 대사이상 질환의 질병 위험도를 예측하는 장치 및 방법
KR20180099185A (ko) * 2017-02-28 2018-09-05 연세대학교 산학협력단 질병 예측 모델을 생성하는 방법, 서버 및 시스템
KR101897419B1 (ko) * 2017-12-05 2018-09-13 신성대학 산학협력단 심전도 기반의 뇌졸중 발병 예측 시스템
KR20190066683A (ko) * 2017-12-06 2019-06-14 주식회사 쓰리빌리언 질병 유전자 발병 확률 보정 방법 및 그 장치
KR20190076237A (ko) * 2017-12-22 2019-07-02 주식회사 데이터젠 심뇌혈관질환 위험도 데이터 예측 방법 및 시스템
KR20190081268A (ko) * 2017-12-29 2019-07-09 주식회사 라이프시맨틱스 개인건강기록을 이용한 가족력 위험도 산출 방법
KR102049829B1 (ko) * 2018-12-05 2019-11-28 주식회사 뷰노 피검체의 위험도를 평가하여 상기 위험도에 따라 상기 피검체를 분류하는 방법 및 이를 이용한 장치
KR20210063748A (ko) * 2019-11-25 2021-06-02 (의) 삼성의료재단 관상동맥경화의 발생을 예측하기 위한 장치 및 방법
KR102660560B1 (ko) * 2024-02-14 2024-04-25 삼성화재해상보험 주식회사 심뇌혈관 위험도 평가 서비스 제공 방법 및 장치

Families Citing this family (70)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8781988B1 (en) * 2007-07-19 2014-07-15 Salesforce.Com, Inc. System, method and computer program product for messaging in an on-demand database service
US8898149B2 (en) 2011-05-06 2014-11-25 The Translational Genomics Research Institute Biological data structure having multi-lateral, multi-scalar, and multi-dimensional relationships between molecular features and other data
CA2846594A1 (en) * 2011-08-26 2013-03-07 Majid Sarrafzadeh Systems and methods for missing data imputation
US8739290B1 (en) * 2011-09-29 2014-05-27 Emc Corporation Generating alerts in event management systems
US9536052B2 (en) * 2011-10-28 2017-01-03 Parkland Center For Clinical Innovation Clinical predictive and monitoring system and method
EP3739596B1 (en) * 2012-06-21 2024-04-24 Battelle Memorial Institute Clinical predictive analytics system
US10496788B2 (en) 2012-09-13 2019-12-03 Parkland Center For Clinical Innovation Holistic hospital patient care and management system and method for automated patient monitoring
US20150213222A1 (en) * 2012-09-13 2015-07-30 Parkland Center For Clinical Innovation Holistic hospital patient care and management system and method for automated resource management
US10593426B2 (en) 2012-09-13 2020-03-17 Parkland Center For Clinical Innovation Holistic hospital patient care and management system and method for automated facial biological recognition
US20140081659A1 (en) 2012-09-17 2014-03-20 Depuy Orthopaedics, Inc. Systems and methods for surgical and interventional planning, support, post-operative follow-up, and functional recovery tracking
US10403403B2 (en) * 2012-09-28 2019-09-03 Cerner Innovation, Inc. Adaptive medical documentation system
US10424403B2 (en) 2013-01-28 2019-09-24 Siemens Aktiengesellschaft Adaptive medical documentation system
WO2014145705A2 (en) 2013-03-15 2014-09-18 Battelle Memorial Institute Progression analytics system
EP3074900B1 (en) * 2013-10-30 2018-06-27 Mehmet, Tansu Method for preparing a customized exercise strategy
US10431339B1 (en) * 2014-06-19 2019-10-01 Epic Systems Corporation Method and system for determining relevant patient information
US10755369B2 (en) 2014-07-16 2020-08-25 Parkland Center For Clinical Innovation Client management tool system and method
KR102662004B1 (ko) * 2014-09-11 2024-04-29 버그 엘엘씨 환자 데이터에 기반한 헬스케어 진단 및 치료를 위한 베이지안 인과 관계 네트워크 모델
EP3892198B1 (en) 2014-11-14 2024-03-06 ZOLL Medical Corporation Medical premonitory event estimation
CN104462858A (zh) * 2014-12-30 2015-03-25 天津迈沃医药技术有限公司 基于多阶隐马尔可夫模型的健康预警方法
CN107430645B (zh) * 2015-04-08 2022-08-23 皇家飞利浦有限公司 用于重症监护病房中的实验室值自动化分析和风险通知的系统
US11011256B2 (en) * 2015-04-26 2021-05-18 Inovalon, Inc. System and method for providing an on-demand real-time patient-specific data analysis computing platform
US10395759B2 (en) 2015-05-18 2019-08-27 Regeneron Pharmaceuticals, Inc. Methods and systems for copy number variant detection
CN108351862B (zh) * 2015-08-11 2023-08-22 科格诺亚公司 利用人工智能和用户输入来确定发育进展的方法和装置
US20170137968A1 (en) * 2015-09-07 2017-05-18 Global Gene Corporation Pte. Ltd. Method and System for Diagnosing Disease and Generating Treatment Recommendations
TW201725526A (zh) * 2015-09-30 2017-07-16 伊佛曼基因體有限公司 用於預測治療療法相關之結果之系統及方法
US10213145B1 (en) 2015-10-01 2019-02-26 Cerner Innovation, Inc. Context-aware post traumatic stress disorder monitoring and intervention
US11972336B2 (en) 2015-12-18 2024-04-30 Cognoa, Inc. Machine learning platform and system for data analysis
CN105787252B (zh) * 2016-01-18 2018-06-29 贡京京 一种医疗决策支持方法及系统
CN107145702B (zh) * 2016-03-01 2022-04-19 西门子保健有限责任公司 基于医疗图像的心源性栓塞型中风风险预测系统和方法
JP6861481B2 (ja) 2016-07-06 2021-04-21 オムロンヘルスケア株式会社 リスク分析システム及びリスク分析方法
CN106407696A (zh) * 2016-09-28 2017-02-15 湖南老码信息科技有限责任公司 一种基于增量式神经网络模型的痱子预测方法和预测系统
CN106407697A (zh) * 2016-09-28 2017-02-15 湖南老码信息科技有限责任公司 一种基于增量式神经网络模型的慢性疲劳综合症预测方法和预测系统
CN106407695A (zh) * 2016-09-28 2017-02-15 湖南老码信息科技有限责任公司 一种基于增量式神经网络模型的焦虑症预测方法和预测系统
CN106407693A (zh) * 2016-09-28 2017-02-15 湖南老码信息科技有限责任公司 一种基于增量式神经网络模型的乙肝预测方法和预测系统
CN106446551A (zh) * 2016-09-28 2017-02-22 湖南老码信息科技有限责任公司 一种基于增量式神经网络模型的慢性肠胃炎预测方法和预测系统
CN106407698A (zh) * 2016-09-28 2017-02-15 湖南老码信息科技有限责任公司 一种基于增量式神经网络模型的植物神经紊乱预测方法和预测系统
CN106407694A (zh) * 2016-09-28 2017-02-15 湖南老码信息科技有限责任公司 一种基于增量式神经网络模型的神经衰弱预测方法和预测系统
CN106446550A (zh) * 2016-09-28 2017-02-22 湖南老码信息科技有限责任公司 一种基于增量式神经网络模型的伤风感冒预测方法和预测系统
US11069432B2 (en) 2016-10-17 2021-07-20 International Business Machines Corporation Automatic disease detection from unstructured textual reports
US11195600B2 (en) 2016-10-17 2021-12-07 International Business Machines Corporation Automatic discrepancy detection in medical data
US11177022B2 (en) 2016-10-17 2021-11-16 International Business Machines Corporation Workflow for automatic measurement of doppler pipeline
JP2020507149A (ja) * 2017-01-11 2020-03-05 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. 包含基準又は除外基準の検出自動化のための方法及びシステム
US20200168314A1 (en) * 2017-04-25 2020-05-28 Coremedica Europe Sarl Methods to enable personalized nutrition
CN109949921A (zh) * 2017-05-09 2019-06-28 北京华信诚达科技有限公司 一种远程评估系统性红斑狼疮患者心脏功能的系统
WO2019018533A1 (en) * 2017-07-18 2019-01-24 Neubay Inc NEURO-BAYESIAN ARCHITECTURE FOR THE IMPLEMENTATION OF GENERAL ARTIFICIAL INTELLIGENCE
US11735317B2 (en) * 2017-08-11 2023-08-22 Vuno, Inc. Method for generating prediction result for predicting occurrence of fatal symptoms of subject in advance and device using same
JP2021501415A (ja) * 2017-10-31 2021-01-14 ジーイー・ヘルスケア・リミテッド 認知症の病理学および/または転帰を診断するための医療システム
WO2019153039A1 (en) * 2018-02-06 2019-08-15 Alerte Echo IQ Pty Ltd Systems and methods for ai-assisted echocardiography
CN108428478B (zh) * 2018-02-27 2022-03-29 东北师范大学 基于异质医疗数据挖掘的甲状腺癌风险预测方法
CN108538390A (zh) * 2018-04-28 2018-09-14 中南大学 一种面向医学数据的增量式处理方法
US20190371472A1 (en) * 2018-06-05 2019-12-05 Fresenius Medical Care Holdings, Inc. Systems and methods for identifying comorbidities
CA3103980A1 (en) * 2018-06-29 2020-01-02 Fresenius Medical Care Holdings, Inc. Systems and methods for identifying risk of infection in dialysis patients
CN111354464B (zh) * 2018-12-24 2024-05-17 深圳先进技术研究院 Cad预测模型建立方法、装置以及电子设备
CN112151130B (zh) * 2019-01-15 2022-11-04 合肥工业大学 一种基于文献检索的决策支持系统和构建方法
CN109840932A (zh) * 2019-01-23 2019-06-04 平安科技(深圳)有限公司 心脑血管疾病展示方法、装置、设备及存储介质
CN109949941A (zh) * 2019-03-15 2019-06-28 南方医科大学顺德医院(佛山市顺德区第一人民医院) 基于大数据精准医疗的心血管疾病风险监控系统
EP3941340A4 (en) 2019-03-22 2022-11-30 Cognoa, Inc. PERSONALIZED DIGITAL THERAPY METHODS AND DEVICES
US11103142B2 (en) * 2019-04-02 2021-08-31 Tencent America LLC System and method for predicting vertebral artery dissection
CN110200620A (zh) * 2019-06-06 2019-09-06 中山大学孙逸仙纪念医院 多模态心脏数据检测方法、装置、存储介质及终端设备
US11468320B1 (en) 2019-07-31 2022-10-11 Express Scripts Strategic Development, Inc. Methods and systems for predicting prescription directions using machine learning algorithm
US11600388B2 (en) * 2019-08-19 2023-03-07 MediSync Inc. Artificial intelligence systems that incorporate expert knowledge related to hypertension treatments
US11810669B2 (en) 2019-08-22 2023-11-07 Kenneth Neumann Methods and systems for generating a descriptor trail using artificial intelligence
CN110718272B (zh) * 2019-09-10 2020-11-17 上海派拉软件股份有限公司 基于基因序列与基因功能的非数值字段的加密及解密方法
CN110838366A (zh) * 2019-10-15 2020-02-25 平安科技(深圳)有限公司 一种患病风险的预测方法及装置
US20210319900A1 (en) * 2020-04-14 2021-10-14 Siemens Healthcare Gmbh Cardiovascular assessment of patients suspected of having covid-19
CN111933284B (zh) * 2020-09-27 2021-01-05 平安科技(深圳)有限公司 一种并发症风险预测系统、方法、装置、设备及介质
US10998102B1 (en) * 2020-10-20 2021-05-04 Analytics4Medicine Llc Systems for managing resistant hypertension
CN113066531B (zh) * 2021-04-13 2023-12-12 深圳平安智慧医健科技有限公司 风险预测方法、装置、计算机设备及存储介质
CN115769239A (zh) * 2021-04-29 2023-03-07 京东方科技集团股份有限公司 一种疾病预测方法、装置、电子设备和计算机可读存储介质
CN113257413B (zh) * 2021-06-22 2021-10-19 安翰科技(武汉)股份有限公司 基于深度学习的癌症预后生存预测方法、设备及存储介质

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6647341B1 (en) * 1999-04-09 2003-11-11 Whitehead Institute For Biomedical Research Methods for classifying samples and ascertaining previously unknown classes
US8388530B2 (en) * 2000-05-30 2013-03-05 Vladimir Shusterman Personalized monitoring and healthcare information management using physiological basis functions
WO2003040966A2 (en) * 2001-11-02 2003-05-15 Siemens Medical Solutions Usa, Inc. Patient data mining for automated compliance
US8140569B2 (en) * 2003-05-29 2012-03-20 Microsoft Corporation Dependency network based model (or pattern)
US20060034508A1 (en) * 2004-06-07 2006-02-16 Zhou Xiang S Computer system and method for medical assistance with imaging and genetics information fusion
WO2006072011A2 (en) * 2004-12-30 2006-07-06 Proventys, Inc. Methods, systems, and computer program products for developing and using predictive models for predicting a plurality of medical outcomes, for evaluating intervention strategies, and for simultaneously validating biomarker causality
US7844560B2 (en) * 2006-04-17 2010-11-30 Siemens Medical Solutions Usa, Inc. Personalized prognosis modeling in medical treatment planning
CA2659082A1 (en) * 2006-06-07 2007-12-21 Tethys Bioscience, Inc. Markers associated with arteriovascular events and methods of use thereof
US20080208630A1 (en) * 2007-02-22 2008-08-28 General Electric Company Methods and systems for accessing a saved patient context in a clinical information system
WO2009064817A1 (en) * 2007-11-13 2009-05-22 Entelos, Inc. Simulating patient-specific outcomes
US20090132443A1 (en) * 2007-11-16 2009-05-21 Odilo Mueller Methods and Devices for Analyzing Lipoproteins

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180040287A (ko) * 2016-10-12 2018-04-20 (주)헬스허브 기계학습을 통한 의료영상 판독 및 진단 통합 시스템
KR101880678B1 (ko) * 2016-10-12 2018-07-20 (주)헬스허브 기계학습을 통한 의료영상 판독 및 진단 통합 시스템
WO2018124831A1 (ko) * 2016-12-30 2018-07-05 서울대학교 산학협력단 대사이상 질환의 질병 위험도를 예측하는 장치 및 방법
KR20180099185A (ko) * 2017-02-28 2018-09-05 연세대학교 산학협력단 질병 예측 모델을 생성하는 방법, 서버 및 시스템
KR101897419B1 (ko) * 2017-12-05 2018-09-13 신성대학 산학협력단 심전도 기반의 뇌졸중 발병 예측 시스템
KR20190066683A (ko) * 2017-12-06 2019-06-14 주식회사 쓰리빌리언 질병 유전자 발병 확률 보정 방법 및 그 장치
KR20190076237A (ko) * 2017-12-22 2019-07-02 주식회사 데이터젠 심뇌혈관질환 위험도 데이터 예측 방법 및 시스템
KR20190081268A (ko) * 2017-12-29 2019-07-09 주식회사 라이프시맨틱스 개인건강기록을 이용한 가족력 위험도 산출 방법
KR102049829B1 (ko) * 2018-12-05 2019-11-28 주식회사 뷰노 피검체의 위험도를 평가하여 상기 위험도에 따라 상기 피검체를 분류하는 방법 및 이를 이용한 장치
WO2020116942A1 (ko) * 2018-12-05 2020-06-11 주식회사 뷰노 피검체의 위험도를 평가하여 상기 위험도에 따라 상기 피검체를 분류하는 방법 및 이를 이용한 장치
KR20210063748A (ko) * 2019-11-25 2021-06-02 (의) 삼성의료재단 관상동맥경화의 발생을 예측하기 위한 장치 및 방법
WO2021107607A1 (ko) * 2019-11-25 2021-06-03 (의) 삼성의료재단 관상동맥경화의 발생을 예측하기 위한 장치 및 방법
KR102660560B1 (ko) * 2024-02-14 2024-04-25 삼성화재해상보험 주식회사 심뇌혈관 위험도 평가 서비스 제공 방법 및 장치

Also Published As

Publication number Publication date
EP2628113A1 (en) 2013-08-21
CN103493054A (zh) 2014-01-01
WO2012051269A1 (en) 2012-04-19
US20110202486A1 (en) 2011-08-18

Similar Documents

Publication Publication Date Title
KR20130132802A (ko) 심혈관 질환들의 발병을 예측하기 위한 건강관리 정보 기술 시스템
Nazari et al. A fuzzy inference-fuzzy analytic hierarchy process-based clinical decision support system for diagnosis of heart diseases
US20190108912A1 (en) Methods for predicting or detecting disease
Anderson et al. Electronic health record phenotyping improves detection and screening of type 2 diabetes in the general United States population: A cross-sectional, unselected, retrospective study
Lee et al. Prediction of heart failure mortality in emergent care: a cohort study
Abbas et al. Predicting long-term type 2 diabetes with support vector machine using oral glucose tolerance test
US20200227172A1 (en) Determining indicators of individual health
Himes et al. Prediction of chronic obstructive pulmonary disease (COPD) in asthma patients using electronic medical records
US9466024B2 (en) Learning health systems and methods
US20170308981A1 (en) Patient condition identification and treatment
JP2008532104A (ja) 複数の医療関連アウトカムの予測を行い、インターベンション計画の評価を行い、更に同時にバイオマーカー因果性検証を行うことのできる、予測モデルを生成して適用する方法、そのシステム、及びそのコンピュータ・プログラム製品
Liu et al. Missed opportunities in preventing hospital readmissions: Redesigning post‐discharge checkup policies
Jiang et al. Readmission risk trajectories for patients with heart failure using a dynamic prediction approach: retrospective study
Ahmad et al. REVeAL-HF: design and rationale of a pragmatic randomized controlled trial embedded within routine clinical practice
Doudesis et al. Validation of the myocardial-ischaemic-injury-index machine learning algorithm to guide the diagnosis of myocardial infarction in a heterogenous population: a prespecified exploratory analysis
Hsu A decision-making mechanism for assessing risk factor significance in cardiovascular diseases
Holder et al. A locally optimized data-driven tool to predict sepsis-associated vasopressor use in the ICU
Li et al. Evaluating and mitigating bias in machine learning models for cardiovascular disease prediction
Lin et al. Can machine learning predict pharmacotherapy outcomes? An application study in osteoporosis
Chen et al. Patient stratification using electronic health records from a chronic disease management program
Lee et al. Design and rationale for the acute congestive heart failure urgent care evaluation: the ACUTE study
Shin et al. Development of various diabetes prediction models using machine learning techniques
Zeltzer et al. Diagnostic accuracy of artificial intelligence in virtual primary care
JP6901169B1 (ja) 年齢学習装置、年齢推定装置、年齢学習方法及び年齢学習プログラム
Hamburger et al. Utility of the Diamond-Forrester classification in stratifying acute chest pain in an academic chest pain center

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment