KR102338369B1 - 데이터 연합 기반의 질병 진단 시스템 및 그 운용 방법 - Google Patents

데이터 연합 기반의 질병 진단 시스템 및 그 운용 방법 Download PDF

Info

Publication number
KR102338369B1
KR102338369B1 KR1020200024553A KR20200024553A KR102338369B1 KR 102338369 B1 KR102338369 B1 KR 102338369B1 KR 1020200024553 A KR1020200024553 A KR 1020200024553A KR 20200024553 A KR20200024553 A KR 20200024553A KR 102338369 B1 KR102338369 B1 KR 102338369B1
Authority
KR
South Korea
Prior art keywords
code
vector
event
medical
diagnostic
Prior art date
Application number
KR1020200024553A
Other languages
English (en)
Other versions
KR20200104828A (ko
Inventor
이정혜
임치현
Original Assignee
울산과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 울산과학기술원 filed Critical 울산과학기술원
Publication of KR20200104828A publication Critical patent/KR20200104828A/ko
Application granted granted Critical
Publication of KR102338369B1 publication Critical patent/KR102338369B1/ko

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7271Specific aspects of physiological measurement analysis
    • A61B5/7275Determining trends in physiological measurement data; Predicting development of a medical condition based on physiological measurements, e.g. determining a risk factor
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/0033Features or image-related aspects of imaging apparatus classified in A61B5/00, e.g. for MRI, optical tomography or impedance tomography apparatus; arrangements of imaging apparatus in a room
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Pathology (AREA)
  • Veterinary Medicine (AREA)
  • Biophysics (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Artificial Intelligence (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Radiology & Medical Imaging (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physiology (AREA)
  • Psychiatry (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

본 발명은 시스템을 포함하여 물리적으로 서로 다른 병원에서 수집된 데이터를 통합하여 향후 폐암 발병을 예측하고, 질병의 조기 진단 서비스를 제공하는 진단 시스템 및 그 운용 방법에 관한 것이다. 본 발명의 데이터 연합 기반의 질병 진단 방법은 제1 데이터 소스로부터 적어도 하나의 진단 코드를 포함하는 제1 의료 코드를 획득하고, 제1 데이터 소스와 상이한 제2 데이터 소스로부터 적어도 하나의 진단 코드를 포함하는 제2 의료 코드를 획득하는 단계, 제1 의료 코드 및 제2 의료 코드 중 기준 진단 코드를 식별하는 단계, 제1 의료 코드 및 제2 의료 코드로부터 각각 제1 이벤트 벡터 및 제2 이벤트 벡터를 획득하는 단계, 진단 코드를 기초로 제1 이벤트 벡터 및 제2 이벤트 벡터를 통합 벡터 공간으로 변환하는 단계 및 통합 벡터 공간 및 기준 진단 코드를 기초로 제1 의료 코드 및 제2 의료 코드와 관련된 환자의 발병 확률을 예측하는 단계를 포함한다.

Description

데이터 연합 기반의 질병 진단 시스템 및 그 운용 방법{System for Providing Efficient Detection of Disease Based on Data Association and its Operation Method}
본 발명은 시스템을 포함하여 물리적으로 서로 다른 병원에서 수집된 데이터를 통합하여 향후 폐암 발병을 예측하고, 질병의 조기 진단 서비스를 제공하는 진단 시스템 및 그 운용 방법에 관한 것이다.
근래의 병원은 환자가 병원에 방문하여 겪는 모든 종류의 이벤트에 대하여 코드를 부여한다. 이때, 이벤트는 상태, 증상, 검진, 진단, 처방 등이 있다. 병원은 각각의 이벤트에 대하여 이벤트 코드를 부여한다. 한편, 서로 다른 병원의 경우, 병원이 환자에 대한 이벤트에 부여하는 이벤트 코드가 서로 상이하다.
종래에는 병원마다 이벤트 코드가 상이하기 때문에, 서로 다른 병원에 방문한 동일한 환자에 대한 이벤트를 통합하는데 문제다. 동일한 환자가 다른 병원에서 수행한 이벤트를 즉각적으로 활용할 수 없고, 병원은 동일한 이벤트를 재수행하는 등 환자에 대한 효과적이고 신속한 질병 예측이 어렵다는 문제가 있어왔다.
본 발명의 배경이 되는 기술은 대한민국 공개특허공보 제10-2014-0129591호(2014.11.07)에 개시되어 있다.
본 발명은 상술한 문제를 해결하기 위한 필요성에 따라, 서로 다른 병원의 이종 시스템에 저장된 환자 이벤트 데이터를 효과적으로 통합하고 관리할 수 있는 시스템을 제공하고자 한다.
또한, 본 발명은 통합된 환자의 정보를 이용하여 보다 신속하고, 정확도가 향상된 질병 진단 시스템을 제공하고자 한다.
본 발명의 데이터 연합 기반의 질병 진단 방법은 제1 데이터 소스로부터 적어도 하나의 진단 코드를 포함하는 제1 의료 코드를 획득하고, 상기 제1 데이터 소스와 상이한 제2 데이터 소스로부터 적어도 하나의 진단 코드를 포함하는 제2 의료 코드를 획득하는 단계; 상기 제1 의료 코드 및 상기 제2 의료 코드 중 기준 진단 코드를 식별하는 단계; 상기 제1 의료 코드 및 상기 제2 의료 코드로부터 각각 제1 이벤트 벡터 및 제2 이벤트 벡터를 획득하는 단계; 상기 진단 코드를 기초로 상기 제1 이벤트 벡터 및 제2 이벤트 벡터를 통합 벡터 공간으로 변환하는 단계; 및 상기 통합 벡터 공간 및 상기 기준 진단 코드를 기초로 상기 제1 의료 코드 및 상기 제2 의료 코드와 관련된 환자의 발병 확률을 예측하는 단계; 를 포함한다.
또한, 상기 기준 진단 코드를 식별하는 단계는 상기 제1 의료 코드 및 제2 의료 코드에 포함된 상기 진단 코드 중 중복되어 포함된 진단 코드를 상기 기준 진단 코드로 식별한다.
또한, 상기 제1 이벤트 벡터 및 제2 이벤트 벡터를 획득하는 단계는, 상기 제1 의료 코드 및 상기 제2 의료 코드를 시계열적으로 정렬하는 단계; 및 상기 시계열적으로 정렬된 제1 의료 코드 및 제2 의료 코드를 기초로 각각 제1 이벤트 시퀀스 코드 및 제2 이벤트 시퀀스 코드를 획득하는 단계;를 더 포함하고, 상기 제1 이벤트 시퀀스 코드 및 상기 제2 이벤트 시퀀스 코드를 변환 알고리즘에 입력하여 각각 상기 제1 이벤트 벡터 및 제2 이벤트 벡터를 획득한다.
또한, 상기 통합 벡터 공간으로 변환하는 단계는, 상기 제1 이벤트 벡터 중 상기 진단 코드에 대응하는 제1 진단 코드 벡터 및 상기 제2 이벤트 벡터 중 상기 진단 코드에 대응하는 제2 진단 코드 벡터를 추출하는 단계; 상기 제1 진단 코드 벡터를 기초로 상기 제1 이벤트 벡터를 제1 벡터 공간으로 변환하고, 상기 제2 진단 코드 벡터를 기초로 상기 제2 이벤트 벡터를 제2 벡터 공간으로 변환하는 단계; 및 상기 제1 벡터 공간 및 상기 제2 벡터 공간을 상기 통합 벡터 공간으로 병합하는 단계;를 더 포함한다.
또한, 상기 질병을 판단하는 단계는, 상기 통합 벡터 공간 상 상기 기준 진단 코드에 대한 벡터를 식별하는 단계; 및 상기 제1 이벤트 벡터 및 제2 이벤트 벡터를 기초로 적어도 하나의 환자 벡터를 획득하는 단계; 및 상기 식별된 기준 진단 코드에 대한 벡터와 상기 적어도 하나의 환자 벡터를 비교하는 단계;를 더 포함하고, 상기 비교 결과를 기초로 질병 여부를 판단한다.
본 발명의 데이터 연합 기반의 질병 진단 장치는 제1 데이터 소스로부터 적어도 하나의 진단 코드를 포함하는 제1 의료 코드를 획득하고, 상기 제1 데이터 소스와 상이한 제2 데이터 소스로부터 적어도 하나의 진단 코드를 포함하는 제2 의료 코드를 획득하는 데이터 수집부; 상기 제1 의료 코드 및 상기 제2 의료 코드 중 기준 진단 코드를 식별하는 코드 식별부; 상기 제1 의료 코드 및 상기 제2 의료 코드로부터 각각 제1 이벤트 벡터 및 제2 이벤트 벡터를 획득하는 이벤트 벡터 획득부; 상기 진단 코드를 기초로 상기 제1 이벤트 벡터 및 제2 이벤트 벡터를 통합 벡터 공간으로 변환하는 벡터 변환부; 및 상기 통합 벡터 공간 및 상기 기준 진단 코드를 기초로 상기 제1 의료 코드 및 상기 제2 의료 코드와 관련된 환자의 질병 여부를 판단하는 발병 확률 예측부;를 포함한다.
본 발명의 일 실시예에 따른 기록매체는 상술한 데이터 연합 기반의 질병 진단 방법을 실행 시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체일 수 있다.
또한, 본 발명의 일 실시예에 따른 프로그램은 컴퓨터를 이용하여 상술한데이터 연합 기반의 질병 진단 방법을 실행하기 위하여 매체에 저장된 컴퓨터 프로그램일 수 있다.
본 발명의 시스템에 의하면, 물리적으로 서로 다른 병원의 이종 데이터를 프라이버시 누출 없이 통합하여 질병 발병 예측의 정확도를 향상시킬 수 있다. 즉, 본 발명은 병원간에 공유할 수 있는 검진 데이터 (예: CT 영상)를 통합하여 사용함으로써 질병 예측의 정확도를 향상시킬 수 있다.
또한, 본 발명은 하나의 병원 데이터에만 적용하더라도, 환자의 시간의 흐름에 따라 수집된 시퀀스 데이터를 활용함으로써, 종래의 연구 방식인 특정 시간대에 수집된 정적인 데이터를 통해 구성한 예측 모형에 비해 우수한 성능을 제공할 수 있다.
나아가, 본 발명은 폐암을 포함하는 다양한 암 및 희귀암 진단 및 예측, 고혈압/합병증 예방, 건강관리 서비스 제공, 신약후보물질 생성 모델 개발 및 공공건강 DB 구축에 활용될 수 있다.
도 1은 본 발명의 일 실시예에 따른 진단 시스템을 설명하기 위한 시스템도이다.
도 2는 본 발명의 일 실시예에 따른 서버의 구성요소를 설명하기 위한 블록도이다.
도 3은 본 발명의 일 실시예에 따른 이벤트 시퀀스 코드를 예시적으로 도시한다.
도 4는 본 발명의 일 실시예에 따른 서버가 이벤트 벡터를 획득하는 것을 도시한 도면이다.
도 5a는 제1 병원의 의료 코드에 포함된 진단 코드를 기초로 획득한 이벤트 벡터의 벡터 공간을 도시하고, 도 5b는 제2 병원의 의료 코드에 포함된 진단 코드를 기초로 획득한 이벤트 벡터의 벡터 공간을 도시한다.
도 6은 본 발명의 일 실시예에 따른 통합 벡터 공간에 진단 코드에 대응하는 이벤트 벡터가 사영된 것을 도시한다.
도 7은 본 발명의 일 실시예에 따른 서버가 통합 벡터 공간을 기초로 환자의 발병 확률을 예측하는 것을 도시한다.
본 발명은 다양한 변환을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 본 발명의 효과 및 특징, 그리고 그것들을 달성하는 방법은 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 다양한 형태로 구현될 수 있다.
이하, 첨부된 도면을 참조하여 본 발명의 실시예들을 상세히 설명하기로 하며, 도면을 참조하여 설명할 때 동일하거나 대응하는 구성 요소는 동일한 도면부호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다.
이하의 실시예에서, 제1, 제2 등의 용어는 한정적인 의미가 아니라 하나의 구성 요소를 다른 구성 요소와 구별하는 목적으로 사용되었다. 이하의 실시예에서, 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 이하의 실시예에서, 포함하다 또는 가지다 등의 용어는 명세서상에 기재된 특징, 또는 구성요소가 존재함을 의미하는 것이고, 하나 이상의 다른 특징들 또는 구성요소가 부가될 가능성을 미리 배제하는 것은 아니다. 도면에서는 설명의 편의를 위하여 구성 요소들이 그 크기가 과장 또는 축소될 수 있다. 예컨대, 도면에서 나타난 각 구성의 크기 및 형태는 설명의 편의를 위해 임의로 나타내었으므로, 본 발명이 반드시 도시된 바에 한정되지 않는다.
도 1은 본 발명의 일 실시예에 따른 진단 시스템을 설명하기 위한 시스템도이다.
도 1을 참조하면, 본 발명의 진단 시스템(1)은 적어도 하나의 병원(100) 및 서버(200)를 포함할 수 있다.
적어도 하나의 병원(100)은 환자에 대한 의료 코드와 같은 의료 데이터를 저장 및 관리하는 데이터 소스일 수 있다. 이때, 환자에 대한 의료 데이터는 EMR(Electronice Medical Records) 데이터, 이미지 데이터, 바이오센서(Biosensor) 데이터, 오믹스(Omics) 데이터 및 행동(Behavioral) 데이터 등 다양한 데이터를 포함할 수 있다.
이때, EMR 데이터는 명목형 또는 숫자형 데이터, 정형 또는 비정형 데이터, 정적 또는 동적 데이터 등으로 각각 상이하게 분류될 수 있고, 기입의 차이에 따라 일관성 없는 데이터로 분류될 수 있다. 이미지 데이터는 행렬 형식 및 크기에 따라 상이하게 분류될 수 있다. 바이오 센서 데이터는 시계열적인 데이터로써 간헐적으로 수집되기 때문에 노이즈가 크도록 측정 및 분류될 수 있다. 오믹스 데이터는 명목형 또는 숫자형 데이터로 상이하게 분류될 수 있고, 행동 데이터는 표준화되어 있지 않아 결측치가 높게 분류될 수 있다.
즉, 제1 병원(110) 및 제2 병원(120)은 각각의 의료 데이터에 대한 분류가 상이할 수 있다. 특히, 제1 병원(110) 및 제2 병원(120)은 동일한 환자가 내방하여 동일한 이벤트가 발생하더라도 이에 대하여 서로 상이한 이벤트 코드로 분류할 수 있다. 이때, 이벤트의 종류로는 상태, 증상, 검진, 진단, 처방 등이 있으나, 이에 한정하지 않는다.
본 발명의 일 실시예에 따른 서버(200)는 적어도 하나의 병원(100)으로부터 의료 데이터를 수신할 수 있다. 서버(200)는 수신한 의료 데이터로부터 환자별 이벤트 시퀀스 코드를 수집할 수 있다. 이때, 이벤트 시퀀스 코드란 특정 환자가 적어도 하나의 병원(100) 각각에 내방하여 발생한 모든 의료 코드를 시계열로 정렬하여 획득한 데이터일 수 있다.
한편, 의료 코드 중 진단 코드는 ICD 9 또는 10으로 전세계적으로 통일되어있지만, 대부분의 의료 코드의 경우 병원마다 다르게 지정할 수 있다. 이에 따라, 서버(200)는 적어도 하나의 병원(100)으로부터 수집하여 획득한 이벤트 시퀀스 코드 중 진단 코드를 기초로 환자의 질병 예측 진단을 수행할 수 있다. 이에 대하여 추후에 추가적으로 설명하기로 한다.
도 2는 본 발명의 일 실시예에 따른 서버의 구성요소를 설명하기 위한 블록도이다.
도 2를 참조하면, 본 발명의 서버(200)는 데이터 수집부(210), 코드 식별부(220), 이벤트 벡터 획득부(230), 벡터 변환부(240) 및 발병 확률 예측부(250)를 포함할 수 있다.
데이터 수집부(210)는 적어도 하나의 병원(100)으로부터 적어도 하나의 환자에 대한 의료 데이터를 수집하기 위한 구성이다. 이때, 의료 데이터는 적어도 하나의 진단 코드를 포함할 수 있다.
데이터 수집부(210)는 적어도 하나의 병원(100)과 통신하기 위한 통신 수단을 포함하여 구현된 것일 수 있다. 이때, 통신 수단(미도시)는 다양한 유형의 통신방식에 따라 다양한 유형의 외부 장치와 통신을 수행하는 구성일 수 있다. 통신 수단은 와이파이칩, 블루투스 칩, 무선 통신 칩 중 적어도 하나를 포함할 수 있다. 특히, 무선통신 칩은 IEEE, Zigbee, 3G(3rd Generation), 3GPP(3rd Generation Partnership Project), LTE(Long Term Evolution), 5G(Fifth Generation)등과 같은 다양한 통신 규격에 따라 통신을 수행하는 칩을 의미한다. 5G 통신 규격에 따른 무선 통신 칩은 3.5GHz 등 주파수(Below 6GHz) 대역뿐만 아니라, 26, 28, 38, 39, 60 GHz 등의 밀리미터파(㎜Wave), 즉 초고주파 대역(Above 6GHz)까지 사용할 수 있다.
코드 식별부(220)는 데이터 수집부(210)에서 수집한 의료 코드 중 기준 진단 코드를 식별하기 위한 구성일 수 있다. 이때, 기준 진단 코드는 복수의 병원(또는 데이터 소스)로부터 수신한 의료 코드에 포함된 진단 코드에 중복되어 포함된 진단 코드일 수 있다.
이벤트 벡터 획득부(230)는 데이터 수집부(210)에서 수신한 의료 코드를 기초로 이벤트 벡터를 획득하기 위한 구성이다. 구체적으로, 이벤트 벡터 획득부(220)는 이벤트 데이터를 시계열적으로 정렬하여 이벤트 시퀀스 코드를 획득할 수 있다. 이벤트 데이터 획득부(220)는 획득한 이벤트 시퀀스 코드에 변환 알고리즘을 적용하여 이벤트 벡터를 획득할 수 있다.
본 발명의 변환 알고리즘은 Word2Vec을 이용할 수 있으나, 이에 한정하지 않는다. 이때, 이벤트 벡터는 이벤트 코드에 대한 숫자형 벡터일 수 있다.
본 발명의 일 실시예에 따른 벡터 변환부(240)는 진단 코드를 기초로 이벤트 벡터를 통합 벡터 공간으로 변환하기 위한 구성일 수 있다. 벡터 변환부(240)는 이벤트 벡터 중 진단 코드에 대응하는 진단 코드 벡터를 추출할 수 있다.
벡터 변환부(240)는 진단 코드 벡터를 기초로 이벤트 벡터를 벡터 공간으로 변환할 수 있다. 본 발명의 일 실시예에 따르면, 데이터 소스가 2개인 경우, 벡터 변환부(240)는 제1 이벤트 벡터 중 진단 코드에 대응하는 제1 진단 코드 벡터 및 제2 이벤트 벡터 중 진단 코드에 대응하는 제2 진단 코드 벡터를 추출할 수 있다. 이후, 벡터 변환부(240)는 제1 진단 코드 벡터를 기초로 제1 이벤트 벡터를 제1 벡터 공간으로 변환하고, 제2 진단 코드 벡터를 기초로 제2 이벤트 벡터를 제2 벡터 공간으로 변환할 수 있다. 벡터 변환부(240)는 제1 벡터 공간 및 제2 벡터 공간을 통합 벡터 공간으로 병합할 수 있다.
구체적으로, 벡터 변환부(240)는 이벤트 벡터 획득부(230)가 획득한 이벤트 벡터를 기초로 매핑(mapping) 함수 또는 사상 함수를 획득할 수 있다. 이때, 매핑 함수는 적어도 2개의 이벤트 시퀀스 코드로부터 획득한 이벤트 벡터의 행렬을 기초로 획득된 것일 수 있다.
본 발명의 일 실시예에 따른 매핑 함수는 상이한 이벤트 시퀀스 코드에대응하는 이벤트 벡터를 하나의 벡터 공간에 사영함으로써, 상이한 의료 코드를 하나로 통합하기 위한 목적 함수일 수 있다. 즉, 이벤트 벡터(또는 이벤트 벡터 행렬)가 있을 때, 그 이벤트 벡터가 속하는 벡터 공간에서 이벤트 벡터를 매개변수로 갖는 함수의 선형계획문제의 목적 함수가 상기 매핑 함수일 수 있다.
본 발명의 일 실시예에 따른 발병 확률 예측부(250)는 통합 벡터 공간 및 기준 진단 코드를 기초로 의료 코드와 관련된 환자의 발병 확률을 예측하기 위한 구성이다.
본 발명의 발병 확률 예측부(250)는 통합 벡터 공간 상 기준 진단 코드에 대한 벡터를 식별하고, 식별된 기준 진단 코드에 대한 벡터와 이벤트 벡터를 기초로 획득한 환자 벡터를 비교할 수 있다. 이후, 발병 확률 예측부(250)는 비교 결과를 기초로 질병 여부를 판단할 수 있다. 이에 대하여 추후에 자세히 설명하기로 한다.
도 3은 본 발명의 일 실시예에 따른 이벤트 시퀀스 코드를 예시적으로 도시한다.
본 발명의 일 실시예에 따른 서버(200)는 병원(100)으로부터 수신한 의료데이터에 포함된 의료 코드를 기초로 이벤트 시퀀스 코드를 획득할 수 있다.
도 3에 도시된 이벤트 시퀀스 코드는 병원에서 수행된 모든 이벤트에 대한 의료 코드(예로, l_509701, l_50971, l_50820 등)가 시계열적으로 정렬된 것일 수 있다.
본 발명의 일 실시예에 따르면, 서버(200)는 의료 코드 중 진단 코드가 별도로 구분된 이벤트 시퀀스 코드를 획득할 수 있다. 도 3의 이벤트 시퀀스 코드는 진단 코드(l_51249 등)가 Prediction window로 분류된 것일 수 있다.
도 4는 본 발명의 일 실시예에 따른 서버가 이벤트 벡터를 획득하는 것을 도시한 도면이다.
제1 병원에 n_1명의 환자가 있다면, 서버(200)는 n_1개의 이벤트 시퀀스 코드를 획득할 수 있다. 마찬가지로, 제2 병원에 명의 n-_2환자가 있다면, 서버(200)는 n_2개의 이벤트 시퀀스 코드를 획득할 수 있다.
본 발명의 서버(200)는 제1 병원에서 획득한 적어도 하나의 제1 의료 시퀀스 코드(410)를 변환 알고리즘을 통해 제1 이벤트 벡터 행렬(411)로 변환할 수 있다. 도 4의 예에서는, 제1 이벤트 벡터 행렬(411)는 nA행의 행렬일 수 있다.
마찬가지로, 서버(200)는 제2 병원에서 획득한 적어도 하나의 제2 의료 시퀀스 코드(420)를 변환 알고리즘을 통해 제2 이벤트 벡터 행렬(421)로 변환할 수 있다. 제2 이벤트 벡터 행렬(421)는 nB행의 행렬일 수 있다.
본 발명의 변환 알고리즘은 각각의 이벤트 시퀀스 코드에 포함된 의료 코드의 전후 순서를 기초로 이벤트 벡터가 출력한다. 이때, 본 발명의 변환 알고리즘은 Word2Vec일 수 있으나, 이에 한정하지 않는다.
본 발명의 일 실시예에 따른 변환 알고리즘은 환자의 이벤트 시퀀스 코드에 대해 각 이벤트에 대응하는 시간을 반영하여, 이를 중첩하여 환자에 대한 이벤트 벡터를 도출할 수 있다.
본 발명의 변환 알고리즘은 변환 시 매번 새로운 이벤트 벡터를 출력하도록 구현된 것일 수 있다. 따라서, 병원 별로 도출된 의료 시퀀스 코드에 대한 이벤트 벡터 행렬은 각기 다른 벡터 공간에 위치하게 되고 이를 함께 활용할 수 없다.
이에 따라, 본 발명의 서버(200)는 두 이벤트 벡터 행렬을 하나의 공간으로 사상시킬 수 있다. 전세계적으로 진단 코드는 통일되어 있기 때문에, 서버(200)는 제1 병원의 이벤트 시퀀스 코드에 포함된 진단 코드와 제2 병원의 이벤트 시퀀스 코드에 포함된 진단 코드를 활용할 수 있다.
서버(200)는 제1 병원의 진단 코드들에 대한 이벤트 벡터들을 기초로 제2 쪽 병원의 진단 코드들에 대한 이벤트 벡터로의 사영을 통해 사상 함수를 학습할 수 있다. 본 발명의 서버(200)가 학습할 사상 함수의 목적 함수는 아래의 수학식 1과 같다.
Figure 112020021048281-pat00001
이때, A, B는 각각 제1 병원의 진단 코드 및 제2 병원의 진단 코드들에 대한 진단 코드 벡터 행렬을 의미하고,
Figure 112020021048281-pat00002
,
Figure 112020021048281-pat00003
는 각 데이터의 변수에 대한 평균 벡터를 의미한다. 수학식 1의 목적 함수를 최적화하여 구해진 Q, k 값은 아래의 수학식 2와 같다.
Figure 112020021048281-pat00004
서버(200)는 의료 코드 중 진단 코드가 아닌 코드의 이벤트 벡터에 대하여 수학식 2를 통해 구해진 Q와 k를 기초로 사영을 시킬 수 있다. 이 경우, 제1 병원 및 제2 병원의 모든 이벤트 시퀀스 코드들에 대한 이벤트 벡터들이 하나의 공간에 위치할 수 있다.
도 5a는 제1 병원의 의료 코드에 포함된 진단 코드를 기초로 획득한 이벤트 벡터의 벡터 공간을 도시하고, 도 5b는 제2 병원의 의료 코드에 포함된 진단 코드를 기초로 획득한 이벤트 벡터의 벡터 공간을 도시한다.
특히, 도 5a 및 도 5b는 제1 병원 및 제2 병원에 대응하는 이벤트 시퀀스 코드 중 진단 코드에 대한 이벤트 벡터를 도시한다.
상술한 바와 같이, 본 발명의 서버(200)는 수학식 1 및 수학식 2를 통해 제1 병원 및 제2 병원에 대응하는 이벤트 시퀀스 코드 중 단 코드가 아닌 코드의 이벤트 벡터에 대하여 사영할 수 있고, 통합 벡터 공간으로 병합할 수 있다.
도 6은 본 발명의 일 실시예에 따른 통합 벡터 공간에 진단 코드에 대응하는 이벤트 벡터가 사영된 것을 도시한다.
도 6을 참조하면, 제1 병원의 진단 코드 벡터 및 제2 병원 진단 코드 벡터 중 중복하여 포함된 진단 코드 벡터를 확인할 수 있다. 예를 들어, cirrhosis, hepatitis-c, Renal-failure, myocardial, lungs 등의 진단 코드는 제1 병원의 이벤트 시퀀스 코드 및 제2 병원의 이벤트 시퀀스 코드에 중복하여 포함된 진단 코드로 기준 진단 코드일 수 있다.
본 발명의 일 실시예에 따른 서버(200)는 상술한 기준 진단 코드를 기초로 환자의 발병 확률을 예측할 수 있다.
도 7은 본 발명의 일 실시예에 따른 서버가 통합 벡터 공간을 기초로 환자의 발병 확률을 예측하는 것을 도시한다.
도 7을 참조하면, 서버(200)는 환자에 대한 이벤트 벡터와 기준 진단 코드에 대한 이벤트 벡터 사이의 코사인 유사도를 구할 수 있고, 이를 각 환자가 폐암에 발병할 확률로 판단할 수 있다.
예를 들어, 서버(200)는 적어도 하나의 병원(100)을 통해 수신한 의료 코드를 통해 획득한 이벤트 벡터를 기초로 환자 벡터를 획득할 수 있다. 이때, 환자 벡터는 제1 이벤트 벡터 및 제2 이벤트 벡터를 환자 별로 대응시켜 재구성하여 획득한 벡터일 수 있다.
환자 벡터가
Figure 112020021048281-pat00005
이고, 기준 진단 질병 폐암(Lung Caner)에 대한 기준 진단 벡터가
Figure 112020021048281-pat00006
인 경우, 서버(200)는 수학식 3을 통해 획득한 코사인 유사도 값을 기초로 폐암(Lung Cancer)의 발병 확률을 예측할 수 있다.
Figure 112020021048281-pat00007
이는 일예에 불과하고, 본 발명의 서버(200)는 폐암 진단명 코드가 아닌 다른 진단명 코드에 대해서도 코사인 거리를 구하여 발병 확률을 예측할 수 있다.
본 개시에서는 데이터 소스로써, 병원(100)이 제1 병원 및 제2 병원으로 2개인 경우를 상정하여 설명하였으나, 병원(100)은 2개 초과하는 임의의 수일 수 있음은 물론이다.
이상 설명된 본 발명에 따른 실시예는 컴퓨터 상에서 다양한 구성요소를 통하여 실행될 수 있는 컴퓨터 프로그램의 형태로 구현될 수 있으며, 이와 같은 컴퓨터 프로그램은 컴퓨터로 판독 가능한 매체에 기록될 수 있다. 이때, 매체는 컴퓨터로 실행 가능한 프로그램을 저장하는 것일 수 있다. 매체의 예시로는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM 및 DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical medium), 및 ROM, RAM, 플래시 메모리 등을 포함하여 프로그램 명령어가 저장되도록 구성된 것이 있을 수 있다.
한편, 상기 컴퓨터 프로그램은 본 발명을 위하여 특별히 설계되고 구성된 것이거나 컴퓨터 소프트웨어 분야의 당업자에게 공지되어 사용 가능한 것일 수 있다. 컴퓨터 프로그램의 예에는, 컴파일러에 의하여 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용하여 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드도 포함될 수 있다.
본 발명에서 설명하는 특정 실행들은 일 실시 예들로서, 어떠한 방법으로도 본 발명의 범위를 한정하는 것은 아니다. 명세서의 간결함을 위하여, 종래 전자적인 구성들, 제어 시스템들, 소프트웨어, 상기 시스템들의 다른 기능적인 측면들의 기재는 생략될 수 있다. 또한, 도면에 도시된 구성 요소들 간의 선들의 연결 또는 연결 부재들은 기능적인 연결 및/또는 물리적 또는 회로적 연결들을 예시적으로 나타낸 것으로서, 실제 장치에서는 대체 가능하거나 추가의 다양한 기능적인 연결, 물리적인 연결, 또는 회로 연결들로서 나타내어질 수 있다. 또한, "필수적인", "중요하게" 등과 같이 구체적인 언급이 없다면 본 발명의 적용을 위하여 반드시 필요한 구성 요소가 아닐 수 있다.
따라서, 본 발명의 사상은 상기 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐만 아니라 이 특허청구범위와 균등한 또는 이로부터 등가적으로 변경된 모든 범위는 본 발명의 사상의 범주에 속한다고 할 것이다.
100: 병원
200: 서버

Claims (8)

  1. 데이터 연합 기반의 질병 진단 장치에서 수행되는 데이터 연합 기반의 질병 진단 방법에 있어서,
    제1 데이터 소스로부터 적어도 하나의 진단 코드를 포함하는 제1 의료 코드를 획득하고, 상기 제1 데이터 소스와 상이한 제2 데이터 소스로부터 적어도 하나의 진단 코드를 포함하는 제2 의료 코드를 획득하는 단계;
    상기 제1 의료 코드 및 상기 제2 의료 코드 중 기준 진단 코드를 식별하는 단계;
    상기 제1 의료 코드 및 상기 제2 의료 코드로부터 각각 제1 이벤트 벡터 및 제2 이벤트 벡터를 획득하는 단계;
    상기 진단 코드를 기초로 상기 제1 이벤트 벡터 및 제2 이벤트 벡터를 통합 벡터 공간으로 변환하는 단계; 및
    상기 통합 벡터 공간 및 상기 기준 진단 코드를 기초로 상기 제1 의료 코드 및 상기 제2 의료 코드와 관련된 환자의 발병 확률을 예측하는 단계; 를 포함하는 질병 진단 장치에서 수행되는 데이터 연합 기반의 질병 진단 방법.
  2. 제1항에 있어서,
    상기 기준 진단 코드를 식별하는 단계는 상기 제1 의료 코드 및 제2 의료 코드에 포함된 상기 진단 코드 중 중복되어 포함된 진단 코드를 상기 기준 진단 코드로 식별하는 질병 진단 장치에서 수행되는 데이터 연합 기반의 질병 진단 방법.
  3. 제2항에 있어서,
    상기 제1 이벤트 벡터 및 제2 이벤트 벡터를 획득하는 단계는,
    상기 제1 의료 코드 및 상기 제2 의료 코드를 시계열적으로 정렬하는 단계; 및
    상기 시계열적으로 정렬된 제1 의료 코드 및 제2 의료 코드를 기초로 각각 제1 이벤트 시퀀스 코드 및 제2 이벤트 시퀀스 코드를 획득하는 단계;를 더 포함하고,
    상기 제1 이벤트 시퀀스 코드 및 상기 제2 이벤트 시퀀스 코드를 변환 알고리즘에 입력하여 각각 상기 제1 이벤트 벡터 및 제2 이벤트 벡터를 획득하는 것인 질병 진단 장치에서 수행되는 데이터 연합 기반의 질병 진단 방법.
  4. 제1항에 있어서,
    상기 통합 벡터 공간으로 변환하는 단계는,
    상기 제1 이벤트 벡터 중 상기 진단 코드에 대응하는 제1 진단 코드 벡터 및 상기 제2 이벤트 벡터 중 상기 진단 코드에 대응하는 제2 진단 코드 벡터를 추출하는 단계;
    상기 제1 진단 코드 벡터를 기초로 상기 제1 이벤트 벡터를 제1 벡터 공간으로 변환하고, 상기 제2 진단 코드 벡터를 기초로 상기 제2 이벤트 벡터를 제2 벡터 공간으로 변환하는 단계; 및
    상기 제1 벡터 공간 및 상기 제2 벡터 공간을 상기 통합 벡터 공간으로 병합하는 단계;를 더 포함하는 질병 진단 장치에서 수행되는 데이터 연합 기반의 질병 진단 방법.
  5. 제1항에 있어서,
    상기 질병을 판단하는 단계는,
    상기 통합 벡터 공간 상 상기 기준 진단 코드에 대한 벡터를 식별하는 단계;
    상기 제1 이벤트 벡터 및 제2 이벤트 벡터를 기초로 적어도 하나의 환자 벡터를 획득하는 단계; 및
    상기 식별된 기준 진단 코드에 대한 벡터와 상기 적어도 하나의 환자 벡터를 비교하는 단계;를 더 포함하고,
    상기 비교 결과를 기초로 질병 여부를 판단하는 질병 진단 장치에서 수행되는 데이터 연합 기반의 질병 진단 방법.
  6. 데이터 연합 기반의 질병 진단 장치에 있어서,
    제1 데이터 소스로부터 적어도 하나의 진단 코드를 포함하는 제1 의료 코드를 획득하고, 상기 제1 데이터 소스와 상이한 제2 데이터 소스로부터 적어도 하나의 진단 코드를 포함하는 제2 의료 코드를 획득하는 데이터 수집부;
    상기 제1 의료 코드 및 상기 제2 의료 코드 중 기준 진단 코드를 식별하는 코드 식별부;
    상기 제1 의료 코드 및 상기 제2 의료 코드로부터 각각 제1 이벤트 벡터 및 제2 이벤트 벡터를 획득하는 이벤트 벡터 획득부;
    상기 진단 코드를 기초로 상기 제1 이벤트 벡터 및 제2 이벤트 벡터를 통합 벡터 공간으로 변환하는 벡터 변환부; 및
    상기 통합 벡터 공간 및 상기 기준 진단 코드를 기초로 상기 제1 의료 코드 및 상기 제2 의료 코드와 관련된 환자의 질병 여부를 판단하는 발병 확률 예측부;를 포함하는 데이터 연합 기반의 질병 진단 장치.
  7. 제1항 내지 제5항 중 어느 한 항의 상기 데이터 연합 기반의 질병 진단 방법을 실행 시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
  8. 컴퓨터를 이용하여 제1항 내지 제5항 중 어느 한 항의 상기 데이터 연합 기반의 질병 진단 방법을 실행하기 위하여 매체에 저장된 컴퓨터 프로그램.
KR1020200024553A 2019-02-27 2020-02-27 데이터 연합 기반의 질병 진단 시스템 및 그 운용 방법 KR102338369B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20190023295 2019-02-27
KR1020190023295 2019-02-27

Publications (2)

Publication Number Publication Date
KR20200104828A KR20200104828A (ko) 2020-09-04
KR102338369B1 true KR102338369B1 (ko) 2021-12-13

Family

ID=72470928

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200024553A KR102338369B1 (ko) 2019-02-27 2020-02-27 데이터 연합 기반의 질병 진단 시스템 및 그 운용 방법

Country Status (1)

Country Link
KR (1) KR102338369B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20230215519A1 (en) * 2022-01-05 2023-07-06 Merative Us L.P. Indexing of clinical background information for anatomical relevancy

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018175850A (ja) 2017-04-14 2018-11-15 株式会社Nttドコモ データ収集装置及びデータ収集方法
WO2019022779A1 (en) 2017-07-28 2019-01-31 Google Llc SYSTEM AND METHOD FOR PREDICTING AND SUMMING MEDICAL EVENTS FROM ELECTRONIC HEALTH RECORDINGS

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170139238A (ko) * 2016-06-09 2017-12-19 경북대학교 산학협력단 정밀의학을 활용한 가족 단위의 유병률 예측 가계도 제공 방법, 이를 수행하기 위한 기록 매체 및 장치
KR101869438B1 (ko) * 2016-11-22 2018-06-20 네이버 주식회사 딥 러닝을 이용하여 환자의 진단 이력으로부터 질병 예후를 예측하는 방법 및 시스템

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018175850A (ja) 2017-04-14 2018-11-15 株式会社Nttドコモ データ収集装置及びデータ収集方法
WO2019022779A1 (en) 2017-07-28 2019-01-31 Google Llc SYSTEM AND METHOD FOR PREDICTING AND SUMMING MEDICAL EVENTS FROM ELECTRONIC HEALTH RECORDINGS

Also Published As

Publication number Publication date
KR20200104828A (ko) 2020-09-04

Similar Documents

Publication Publication Date Title
CN112292691B (zh) 用于使用深度学习提高癌症检测的方法与系统
KR101818074B1 (ko) 인공지능 기반 의료용 자동 진단 보조 방법 및 그 시스템
CN110796656A (zh) 图像检测方法、装置、计算机设备和存储介质
US20220122253A1 (en) Information processing device, program, trained model, diagnostic support device, learning device, and prediction model generation method
KR102289277B1 (ko) 복수의 의료 영상 판독 알고리듬들에 대한 평가 스코어를 생성하는 의료 영상 판독 지원 장치 및 방법
KR101894278B1 (ko) 일련의 슬라이스 영상을 재구성하는 방법 및 이를 이용한 장치
KR20190105452A (ko) 딥러닝 기반 뇌 질환 진단 방법
CN110717905B (zh) 脑部图像检测方法、计算机设备和存储介质
Lee et al. Early detection of disease and scheduling of screening examinations
JP2006500075A (ja) 肺がん判別のための患者データマイニング
Yan et al. A fully automatic artificial intelligence–based CT image analysis system for accurate detection, diagnosis, and quantitative severity evaluation of pulmonary tuberculosis
WO2013078370A1 (en) Voxel-based approach for disease detection and evolution
KR20190132832A (ko) 딥러닝을 기반으로 하는 아밀로이드 양성 또는 음성을 예측하기 위한 방법 및 장치
KR102030435B1 (ko) 질환 예측 장치 및 방법
Jayender et al. Automatic segmentation of invasive breast carcinomas from dynamic contrast‐enhanced MRI using time series analysis
CN103177179A (zh) 诊断因素集合确定设备和方法
Marimuthu et al. Deep Learning for Automated Lesion Detection in Mammography
KR102338369B1 (ko) 데이터 연합 기반의 질병 진단 시스템 및 그 운용 방법
CN111916185A (zh) 为ai诊断模型提供影像数据的管理系统及方法
US20210048941A1 (en) Method for providing an image base on a reconstructed image group and an apparatus using the same
KR102515068B1 (ko) 기계학습을 이용한 유방암 림프절 전이 예측에 대한 정보 제공 방법
US10957038B2 (en) Machine learning to determine clinical change from prior images
Lu et al. Deep learning-based long term mortality prediction in the national lung screening trial
KR20200062656A (ko) 의료 영상으로부터 뇌혈관 나이를 추정하는 방법 및 시스템
WO2021101833A1 (en) Methods and systems for remote analysis of medical image records

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant