KR20170023770A - 진단모델 생성 시스템 및 방법 - Google Patents
진단모델 생성 시스템 및 방법 Download PDFInfo
- Publication number
- KR20170023770A KR20170023770A KR1020167022328A KR20167022328A KR20170023770A KR 20170023770 A KR20170023770 A KR 20170023770A KR 1020167022328 A KR1020167022328 A KR 1020167022328A KR 20167022328 A KR20167022328 A KR 20167022328A KR 20170023770 A KR20170023770 A KR 20170023770A
- Authority
- KR
- South Korea
- Prior art keywords
- time series
- data
- model
- analysis
- unit
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 238000003745 diagnosis Methods 0.000 title description 7
- 238000004458 analytical method Methods 0.000 claims abstract description 71
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 58
- 201000010099 disease Diseases 0.000 claims abstract description 54
- 238000012731 temporal analysis Methods 0.000 claims abstract description 52
- 238000000700 time series analysis Methods 0.000 claims abstract description 52
- 238000007781 pre-processing Methods 0.000 claims abstract description 46
- 239000000284 extract Substances 0.000 claims abstract description 17
- 230000001373 regressive effect Effects 0.000 claims description 4
- 238000013499 data model Methods 0.000 claims description 2
- 238000000605 extraction Methods 0.000 claims description 2
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 claims 2
- 239000008280 blood Substances 0.000 description 20
- 210000004369 blood Anatomy 0.000 description 20
- 230000000694 effects Effects 0.000 description 18
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 16
- 239000008103 glucose Substances 0.000 description 16
- 208000006096 Attention Deficit Disorder with Hyperactivity Diseases 0.000 description 10
- 238000010586 diagram Methods 0.000 description 10
- 238000012544 monitoring process Methods 0.000 description 10
- 239000000306 component Substances 0.000 description 9
- 208000036864 Attention deficit/hyperactivity disease Diseases 0.000 description 8
- 208000015802 attention deficit-hyperactivity disease Diseases 0.000 description 8
- 230000008859 change Effects 0.000 description 8
- 238000005259 measurement Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000002123 temporal effect Effects 0.000 description 5
- 206010003119 arrhythmia Diseases 0.000 description 4
- 230000006793 arrhythmia Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 206010012601 diabetes mellitus Diseases 0.000 description 4
- 206010012289 Dementia Diseases 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 208000024827 Alzheimer disease Diseases 0.000 description 2
- 206010003658 Atrial Fibrillation Diseases 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000001788 irregular Effects 0.000 description 2
- 208000017667 Chronic Disease Diseases 0.000 description 1
- 206010019280 Heart failures Diseases 0.000 description 1
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000006736 behavioral deficit Effects 0.000 description 1
- 239000012503 blood component Substances 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000003862 health status Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000009662 stress testing Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 210000000707 wrist Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/50—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
- G16H20/70—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to mental therapies, e.g. psychological therapy or autogenous training
-
- G06F19/3437—
-
- G06F19/3443—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/22—Social work or social welfare, e.g. community support activities or counselling services
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H40/00—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
- G16H40/60—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices
- G16H40/63—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the operation of medical equipment or devices for local operation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H70/00—ICT specially adapted for the handling or processing of medical references
- G16H70/60—ICT specially adapted for the handling or processing of medical references relating to pathologies
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Epidemiology (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Pathology (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- Child & Adolescent Psychology (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Psychiatry (AREA)
- Social Psychology (AREA)
- Psychology (AREA)
- Hospice & Palliative Care (AREA)
- Developmental Disabilities (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
Abstract
진단모델 생성 시스템 및 방법이 개시된다. 일 예에 따라, 진단모델 생성 시스템은 특정 질환을 가진 환자들로부터 관측된 시계열 데이터를 전처리하는 전처리부; 전처리된 시계열 데이터에 대해 시계열 변동성 분석을 위한 분석모델을 이용하여 적어도 하나의 데이터 특성을 산출하는 시계열 분석부; 산출된 상기 적어도 하나의 데이터 특성을 피처로서 추출하고, 추출된 피처에 기초하여 진단모델을 생성하는 모델 생성부를 포함한다.
Description
진단모델 생성 기술에 관련된다. 보다 상세하게는 관측 데이터에 대한 시계열 변동성 분석에 기초하는 진단모델 생성 기술에 관련된다.
일반적으로, 환자의 건강 상태를 모니터링하기 위한 센서 기반 모니터링 기법들이 알려져 있다. 이는 환자의 혈액 성분을 분석하거나, 심박 데이터를 측정하거나, 활동량을 측정하는 센서들을 이용하여 환자를 모니터링하는 기법이다. 예를 들어, 혈당 모니터링 장치, 휴대용 ECG(Electrocardiogram) 센서, 액티그라피(actigraphy) 등의 다양한 모바일 센서 기기들을 이용하여 환자로부터 관측 데이터를 획득할 수 있다. 이러한 센서 기반 모니터링 기법들은, 수 일 내지 수 개월에 걸쳐서 대상의 일상생활에 지장을 주지 않으면서 연속적으로 모니터링 하는 것을 가능하게 한다.
모니터링 결과, 예컨대 당뇨 환자의 혈당치에 대한 관측 데이터, 부정맥 환자의 심방 세동에 대한 관측 데이터, 주의력 결핍 과잉행동 장애(ADHD, attention deficit hyperactivity disorder) 환자, 알츠하이머 등의 치매 질환자, 우울증 환자의 활동량 등과 같은 관측 값들이 얻어질 수 있다. 얻어진 관측 값들은 다양한 다른 임상적 진단 결과들과 함께 이용됨으로써 질환 진단이나 치료를 위해 이용될 수 있다. 더 나아가, 종래에 모니터링 관측 데이터로부터, 몇몇 특성 값들을 추출하고, 추출된 특성 값들을 이용하여 생성한 진단모델들이 알려져 있다. 그러나, 이러한 특성 값 기반 진단모델은 관측 값들의 단순한 변화만으로 질환 여부를 진단할 수 있는 질환들만으로 그 적용 범위가 제한된다. 다시 말해서, 특성 값 기반 진단모델은 예컨대, ADHD, 우울증, 만성 질환, 장기적인 치료가 필요한 질환 등과 같이, 관측 값들의 단순 변화를 이용하여 진단이나 예측이 어려운 질환들에 대해 특성 값 기반 진단모델이 적용되기 어렵다는 한계가 있다.
관측 데이터에 대한 시계열 변동성 분석에 기초하여 진단모델을 생성하는 시스템 및 방법을 제안한다.
일 양상에 따라 제공되는 진단모델 생성 시스템은, 특정 질환을 가진 환자들로부터 관측된 시계열 데이터를 전처리하는 전처리부; 전처리된 시계열 데이터에 대해 시계열 변동성 분석을 위한 분석모델을 이용하여 적어도 하나의 데이터 특성을 산출하는 시계열 분석부; 산출된 상기 적어도 하나의 데이터 특성을 피처로서 추출하고, 추출된 피처에 기초하여 진단모델을 생성하는 모델 생성부를 포함한다.
일 실시예항에 있어서, 상기 모델 생성부에 의해 생성된 진단모델을 상기 전처리부에서 전처리되기 전의 시계열 데이터를 이용하여 학습시키는 학습부를 더 포함한다.
다른 실시예에 있어서, 상기 분석모델을 상기 질환의 특성에 따라 선택하는 분석모델 선택부를 더 포함한다.
또 다른 실시예에 있어서, 상기 시계열 분석부는, 전처리된 시계열 데이터에 대해 시계열 변동성 분석을 위한 분석모델을 이용하여 적어도 하나의 데이터 특성을 산출하는 1차 시계열 분석부, 및 상기 1차 시계열 분석부에 의해 산출된 상기 적어도 하나의 데이터 특성 각각에 대해 재차 시계열 변동성 분석을 수행하여 각 데이터 특성의 데이터 특성을 산출하는 2차 시계열 분석부를 포함하고; 상기 모델 생성부는, 상기 1차 시계열 분석부에 의해 산출된 상기 적어도 하나의 데이터 특성을 피처로서 추출하는 1차 모델 생성부, 및 상기 2차 시계열 분석부에 의해 산출된 상기 데이터 특성의 데이터 특성을 피처로서 추출하는 2차 모델 생성부를 포함한다.
또 다른 실시예에 있어서, 상기 전처리부는: 상기 시계열 데이터 중 적어도 일부를 선택하거나; 미리 결정된 시간단위마다 상기 시계열 데이터의 총합, 평균, 중앙값, 최대값, 최소값, 분산, 표준편차, 이상치 개수, 기준값 이상, 기준값 이하 중 적어도 하나의 값을 생성하거나; 또는 미리 결정된 시간 길이마다 상기 시계열 데이터의 일부 또는 특정 값을 발췌한다.
또 다른 실시예에 있어서, 상기 데이터 특성은, 추세(trend), 주기(cycle), 계절성(seasonality), 변동성(volatility)을 포함한다.
또 다른 실시예에 있어서, 상기 분석모델은, 시간 변동 계수 모델(time varying coefficient model), ARCH(AutoRegressive Conditional Heteroskedasticity) 모델, GARCH(generalized ARCH) 모델, 추계학적 변동(Stochastic volatility) 모델, ARIMA(AutoRegressive Integrated Moving Average) 모델과 결합한 모델을 포함한다.
다른 양상에 따라 제공되는 진단모델 생성 방법은, 특정 질환을 가진 환자들로부터 관측된 시계열 데이터를 전처리하는 전처리 단계; 전처리된 시계열 데이터에 대해 시계열 변동성 분석을 위한 분석모델을 이용하여 적어도 하나의 데이터 특성을 산출하는 시계열 분석 단계; 산출된 상기 적어도 하나의 데이터 특성을 피처로서 추출하고, 추출된 피처에 기초하여 진단모델을 생성하는 피처 추출 단계를 포함한다.
상술한 양상들 및 실시예들과 그 외 다른 실시예들에 대한 더 상세한 설명이 아래에서 도면을 참조하여 제공될 것이다.
환자로부터 획득된 관측 데이터에 대한 시계열 변동성 분석에 기초하여 진단모델을 생성함으로써, 질환 여부의 판별 이외에, 질환의 발병이나 재발, 호전 등과 같은 변동 상태를 파악할 수 있고, 더 나아가 향후의 발병 위험도를 예측할 수 있도록 한 진단모델을 제공할 수 있는 효과가 있다.
도 1은 일 실시예에 따른 진단모델 생성 시스템의 구성을 보여주는 블록도.
도 2는 액티그래피 센서에 의해 획득된 특정 개인의 활동량 관측값들로 이루어진 시계열 데이터의 일 예를 보여주는 그래프.
도 3은 혈당 측정기기에 의해 획득된 특정 개인의 혈당치 관측값들로 이루어진 시계열 데이터의 일 예를 보여주는 그래프.
도 4는 다른 실시예에 따른 진단모델 생성 시스템의 구성을 보여주는 블록도.
도 5는 또 다른 실시예에 따른 진단모델 생성 시스템의 구성을 보여주는 블록도.
도 6은 또 다른 실시예에 따른 진단모델 생성 시스템의 구성을 보여주는 블록도.
도 7은 일 실시예에 따른 진단모델 생성 방법의 단계들을 보여주는 흐름도.
도 7은 일 실시예에 따른 진단모델 생성 방법의 단계들을 보여주는 흐름도.
도 8은 다른 실시예에 따른 진단모델 생성 방법의 단계들을 보여주는 흐름도.
도 9는 또 다른 실시예에 따른 진단모델 생성 방법의 단계들을 보여주는 흐름도.
도 10은 또 다른 실시예에 따른 진단모델 생성 방법의 단계들을 보여주는 흐름도.
도 2는 액티그래피 센서에 의해 획득된 특정 개인의 활동량 관측값들로 이루어진 시계열 데이터의 일 예를 보여주는 그래프.
도 3은 혈당 측정기기에 의해 획득된 특정 개인의 혈당치 관측값들로 이루어진 시계열 데이터의 일 예를 보여주는 그래프.
도 4는 다른 실시예에 따른 진단모델 생성 시스템의 구성을 보여주는 블록도.
도 5는 또 다른 실시예에 따른 진단모델 생성 시스템의 구성을 보여주는 블록도.
도 6은 또 다른 실시예에 따른 진단모델 생성 시스템의 구성을 보여주는 블록도.
도 7은 일 실시예에 따른 진단모델 생성 방법의 단계들을 보여주는 흐름도.
도 7은 일 실시예에 따른 진단모델 생성 방법의 단계들을 보여주는 흐름도.
도 8은 다른 실시예에 따른 진단모델 생성 방법의 단계들을 보여주는 흐름도.
도 9는 또 다른 실시예에 따른 진단모델 생성 방법의 단계들을 보여주는 흐름도.
도 10은 또 다른 실시예에 따른 진단모델 생성 방법의 단계들을 보여주는 흐름도.
일반적으로, 시계열(time series) 데이터는 시간적인 순서에 따라 관측하거나 검출한 값들을 포함하는 데이터를 말하며, 시계열 데이터를 분석하여 시간의 흐름에 따라 나타나는 규칙을 발견하기 위한 다양한 시계열 분석법(time series analysis)이 알려져 있다. 시계열 분석법은, 시간 개념을 포함한 데이터(time-oriented data)를 분석하거나 시계열 데이터(time series data)의 미래값들(future values)를 예측하는데 널리 사용되고 있는 기법이다. 이러한 시계열 분석법은 금융 및 경제 분야, 제조 공정 관리, 정치 및 사회 정책 분석, 환경 등 많은 분야에서 널리 사용되고 있다.
예를 들어, 시계열 분석 기법에는 AR(Autoregressive model), MA(Moving Average model), ARMA(Autoregressive Moving Average Model), ARIMA(Autoregressive Integrated Moving Average Model), seasonal ARIMA models, stochastic volatility models, ARMAX(Autoregressive-moving average model with exogeneous inputs model), 칼만 필터(Kalman filter) 등이 포함된다. 특히 시계열 데이터의 변동성(variability 또는 volatility)를 분석할 수 있는 기법들 중에 추계학적 변동성 모델(stochastic volatility model)을 이용하는 기법이 알려져 있다. 추계학적 변동성 모델에는 ARCH(Autoregressive conditional heteroskedasticity), GARCH(Generalized Autoregressive Conditional Heteroskedasticity), general stochastic volatility model 등이 포함된다.
통상적으로, 환자의 건강 상태를 장기간 모니터링 하면서 획득하는 데이터는 시계열 데이터이다. 예컨대, 당뇨 환자의 혈당치에 대한 관측값들, 부정맥 환자의 심방 세동에 대한 관측 값들, 주의력결핍과잉행동장애(ADHD, attention deficit hyperactivity disorder) 환자, 알츠하이머 등의 치매질 환자, 우울증 환자 등의 활동량에 대한 관측값들은 일정한 시간 간격마다 수 일 ~ 수 개월에 걸쳐 측정되는 시계열 데이터로 취급될 수 있다. 그러므로, 환자로부터 측정된 시계열 데이터에 대해 다양한 시계열 분석기법을 적용함으로써 환자의 상태에 대한 시간적인 변동성을 발견할 수 있다. 일반적으로 시계열 분석 기법은 시계열 데이터의 변동성 특성들을 다양한 방식으로 추출할 수 있고, 더 나아가 관측 값들의 변화 안에 숨겨져 있는 변동성까지도 분석 가능하다. 그러므로, 환자의 질환을 나타내는 관측 데이터에 대하여 시계열 분석 기법을 적용함으로써, 질환과 관련된 다양하고 심층적인 변동성을 발견할 수 있다.
만약 질환의 시간적인 변동성에 기초하여 진단모델을 생성한다면, 질환 상태를 시간적인 변동 과정을 예측할 수 있을 것이다. 질환의 시간적 변동성에 기반한 진단모델은, 특정 질환의 시간적 변동성에 기초한 파라미터들을 가지고 있으므로, 특정 개인의 질환 여부의 진단을 가능하게 할 뿐만 아니라, 질환의 발병이나 재발, 호전 등과 같은 변동 상태를 파악할 수 있게 하며, 더 나아가 심지어 향후의 발병 위험도를 예측하는 것도 가능하게 할 수 있다.
특히, 시계열 분석 방법은 시계열 데이터로부터 변동성 또는 가변성 특성을 캡쳐(capture)하고 숨겨진 변동성(hidden variability)까지 모델링할 수 있기 때문에, 단순히 관측값들에서 나타나는 일시적인 변화만을 보고 판정하기 어려운 질환에 잘 적용될 것이 예상된다. 예를 들면, 일반적으로 ADHD는 겉으로 보기에 일시적으로 행동이 격하고 집중을 못한다고 해서 일률적으로 ADHD라고 판정할 수 없고, 오히려 환자에 대한 오랜 기간에 걸친 관찰과 다양한 테스트를 거쳐야 ADHD 판정이 가능하다. 반면에, 만약 미리 축적된 질환군 데이터에 대한 시계열 변동성 분석을 통해 생성한 진단모델을 이용한다면, 임의의 환자에 대한 상대적으로 단기간의 일상생활 모니터링을 통해 손쉽게 질환여부를 판정할 수 있을 것이다.
상술한 점들을 고려하여, 실시예들에 따른 진단모델 생성 시스템 및 방법은, 질환자들로부터 획득된 시계열 데이터에 대한 시계열 변동성 분석(time series variability analysis)을 통해 추출된 적어도 하나의 피처(feature)에 기초한 진단모델 생성 기법을 제공한다. 시계열 변동성 분석을 통해 추출된 피처(들)은, 생성된 진단모델이 입력 데이터로부터 특정 질환 판정 및/또는 질환 상태 호전 여부를 판정할 수 있도록 하는 파라미터, 함수, 모델 등에 대응될 수 있다.
아래에서 실시예들에 따른 진단모델 생성 시스템 및 방법이 도면들을 참조하여 예시로서 기술된다.
이하 도 1 내지 도 6을 참조하여 진단모델 생성 시스템의 실시예들이 기술된다. 도 1 내지 도 6를 참조하여 기술된 진단모델 생성 시스템들은 단지 예시에 불과하다. 해당 기술분야의 통상의 지식을 가진 자는, 청구항들의 범위 내에서 다양한 조합의 다른 시스템들이 가능하다는 것을 쉽게 이해할 것이다.
도 1은 일 실시예에 따른 진단모델 생성 시스템의 구성을 보여주는 블록도다.
도 1을 참조하면, 진단모델 생성 시스템(10)은 기준데이터(12)로부터 진단모델(19)을 생성하기 위한 전처리부(14), 시계열 분석부(16), 및 모델 생성부(18)를 포함한다.
실시예에 따라 기준데이터(12)는 특정 질병을 가진 환자 즉 질환자로부터 얻어진 관측 데이터로서, 예컨대, 수 일 내지 수 개월 동안 연속적으로 측정한, 시계열 데이터일 수 있다. 이 시계열 데이터는 유사한 패턴이 반복적으로 나타나거나 육안으로는 패턴을 파악하기 어려운 불규칙한 패턴을 보일 수 있다.
일 예에 따라, 기준데이터(12)는 액티그래피, 페도미터(pedometer) 등의 환자 몸에 착용하는 모션 센서 기기를 통해 얻어진 환자의 활동량 데이터이다. 액티그래피는 일반적으로 2축 및/또는 3축 가속도 센서를 구비한 손목시계형 모션 센서 기기로서, 환자의 움직임을 예컨대 60 Hz와 같이 일정한 시간 간격마다 측정하여 저장하거나 외부 기기로 전송할 수 있다. 이러한 활동량 데이터의 구체적인 예가 도 2에 도시된다. 도 2를 참조하면, 관측 대상인 사람으로부터 액티그래피에 의해 측정된 관측 값들 중 어느 날의 20시(저녁 8시)에서 다음 날 20시까지의 데이터를 보여주는 그래프가 도시된다. 도시된 활동량 데이터(20)는 시간에 따라 불규칙한 활동량의 변화를 보여준다. 도면에서 왼쪽 첫번째 구간(22)은, 약 20시에서 약 22시 사이의 구간으로서, 관측되고 있는 개인이 직장에서 집으로 퇴근하는 때의 활동량 관측 값들이 나타난다. 그 다음 구간(24)은 약 24시에서 약 6시 사이의 구간으로서 수면 중에 측정된 활동량 관측 값들이 나타난다. 그리고, 그 다음 구간들(26, 28)은 각각 아침 7시 근처에서 조깅과 같은 운동을 하는 경우, 및 낮에 실내에 머물고 있는 경우를 각각 나타낸다. 도시된 예에서와 같이, 활동량 데이터는 관측되고 있는 사람의 움직임을 나타내는 시계열 데이터이다. 이러한 활동량 데이터는, 치매 환자 또는 ADHD 환자 등을 대상으로 하여 얻어질 수 있다.
다시 도 1로 돌아가서, 다른 예에 따라 기준데이터(12)는 일정 시간 간격마다 환자 또는 보호자가 당뇨 환자의 혈당을 측정하여 기록한 데이터이다. 환자는 병원을 방문하지 않고도 모바일 전자기기 형태의 혈당 측정기를 이용하여 집에서 일정한 시간 간격마다 자신의 손가락 끝에서 채취한 혈액으로부터 혈당을 측정할 수 있다. 측정된 혈당 수치는 혈당 측정기 내에 저장되었다가 외부기기로 전송될 수 있다. 또는 환자나 보호자가 혈당을 측정할 때마다 혈당 측정기에 구비된 디스플레이 화면에 표시된 혈당 수치를, 컴퓨팅 장치의 워드프로세서 프로그램이나 혈당 수치 전용 애플리케이션을 실행시킨 후 키보드나 마우스를 이용하여 입력함으로써, 기록할 수 있다. 이러한 혈당 데이터의 구체적인 예가 도 3에 도시된다. 도 3을 참조하면, 혈당 측정기기에 의해 획득된 특정 개인의 혈당치 관측값들로 이루어진 시계열 데이터의 일 예를 보여주는 그래프(30)가 도시된다. 도시된 그래프(30)에서 수평축은 시간을 나타내며, 수직축은 혈당 수치를 나타낸다.
다시 도 1로 돌아가면, 기준데이터(12)는 특정 질환을 가진 환자에 대해 측정된 시계열 데이터이면 충분하므로, 위에서 예시된 바와 같은 ADHD 환자의 활동량 데이터, 당뇨 환자의 혈당 데이터 이외에 다른 관측 데이터를 포함할 수 있다. 예를 들면, 기준데이터(12)는 심부전 환자의 ECG 데이터, 스트레스 테스트를 받는 환자의 생리학적 상태를 나타내는 다양한 형태의 측정 데이터를 포함할 수 있지만, 이에만 제한되지 않는다.
실시예에 따라 전처리부(14)는 기준데이터(12)의 특정 질환자로부터 측정된 관측 값들을 전처리하는 컴포넌트이다. 전처리부(14)는 특정 질환에 대한 진단 효율을 높이기 위해 기준데이터(12)의 관측 값들을 처리할 수 있다. 다시 말해서, 전처리부(14)는 기준데이터(12)의 관측 값들 중에서 특정 질환의 특성을 효과적으로 나타내는 특징구간을 추출할 수 있다.
일 예에 따라 전처리부(14)는 원래 관측 값들 모두를 그대로 선택함으로써, 원래 관측 값들 모두를 특징구간으로서 추출한다. 다른 예에 따라 전처리부(14)는 특정 시간단위(예컨대, 1초 단위, 1일 단위, 1주 단위)마다 관측 값들의 총합, 평균, 중앙값, 최대값, 최소값, 분산, 표준편차, 이상치 개수, 기준 값 이상, 기준 값 이하 등과 같이 가공된 값들을 생성함으로써, 이 가공된 값들을 특징구간으로서 추출한다. 또 다른 예에 따라 전처리부(14)는 관측 값들의 연속적인 단위 시간 기간들 중에서 일부 기간 또는 시점의 관측 값들을 발췌함으로써, 발췌된 관측 값들을 단위 시간 기간 동안의 대표 값, 즉 특징구간으로서 추출한다. 예를 들어, 하루 24시간 중에서 낮 또는 밤 시간 기간 동안의 관측 값들이, 하루 동안의 대표 값들로서 발췌될 수 있다. 다른 예를 들어, 수면 중일 때의 관측 값들만이, 하루 동안의 대표 값들로서 발췌될 수 있다. 또 다른 예를 들어, 복약 후 3시간 이후의 관측 값들만이, 다음 복약 시까지의 기간 동안의 대표 값들로서 발췌될 수 있다. 결과적으로, 전처리부(14)는 기준데이터(12)의 관측 값들 중에서 선택, 가공, 또는 발췌 등의 프로세스를 통해 특징구간을 추출하고, 추출된 특징구간의 값들을 시계열 분석부(16)로 제공한다.
실시예에 따라 시계열 분석부(16)는 전처리부(14)를 통해 입력된 특징구간 값들에 대해 시계열 분석 기법을 적용하여 분석하는 컴포넌트이다. 전처리부(14)로부터 입력되는 특징구간의 값들은 시간적인 순서를 가진 값들이며 시계열 데이터이다. 시계열 분석부(16)는 시계열 모델링 기법을 이용할 수 있으며, 특히 시계열 변동성 분석(variability analysis)을 이용하여 시계열 데이터를 분석할 수 있다. 시계열 분석부(16)는 시계열 데이터의 특성, 즉 추세(trend), 주기(cycle), 계절성(seasonality), 규칙성(regularity) 불규칙성(irregularity), 변동성(variability 또는 volatility) 등을 파악할 수 있다.
시계열 분석부(16)가 이용할 수 있는 시계열 변동성 분석을 위한 분석모델들에, 시간 변동 계수 모델(time varying coefficient model), ARCH(AutoRegressive Conditional Heteroskedasticity) 모델, GARCH(generalized ARCH) 모델, 추계학적 변동(Stochastic volatility) 모델, ARIMA(AutoRegressive Integrated Moving Average) 모델과 결합한 모델 등을 포함하지만, 이들로만 제한되는 것은 아니다. 이러한 다양한 시계열 변동성 분석을 위한 분석모델들은 해당 기술 분야에서 잘 알려져 있으므로, 본 명세서에서는 상세한 설명을 생략한다.
결과적으로, 시계열 분석부(16)에 의해, 특징구간의 값들의 데이터 특성, 즉 추세, 주기성, 계절성, 변동성, 규칙성, 불규칙성 등이 산출될 수 있다. 이러한 데이터 특성들은 이후 모델 생성부(18)로 입력될 수 있다.
실시예에 따라, 모델 생성부(18)는 이들 데이터 특성들을 특정 질환의 진단에 도움이 되는 피처로서 추출하고, 추출된 피처들에 기초하여 진단모델을 생성하는 컴포넌트이다. 일 예에서, 데이터 특성들 중에서 '추세'는 질환의 상태 호전을 지시하는 파라미터를 나타내는 피처로서 추출된다. 다른 예에서, 데이터 특성들 중에서 '계절성'은 질환의 진행 상태를 보여주는 모델을 나타내는 피처로서 추출된다. 또 다른 예에서, 데이터 특성들 중에서 '불규칙성'은 질환의 발병 단계를 검출하기 위한 함수를 나타내는 피처로서 추출된다. 이와 같이 적어도 하나의 피처가 추출되면, 모델 생성부(18)는 이들 피처를 파라미터, 함수, 모델 등으로 대응시킴으로써 특정 질환에 대한 진단모델(19)을 생성할 수 있다.
이후 진단모델(19)은 진단 대상으로부터 얻어진 시계열적인 측정 데이터에 대해 적용됨으로써 특정 질환의 변동(예컨대, 악화되고 있음, 호전되고 있음) 상태나 발병 위험도 예측 등의 진단 결과를 제공할 수 있다.
도 4는 다른 실시예에 따른 진단모델 생성 시스템의 구성을 보여주는 블록도이다.
도 4를 참조하면, 진단모델 생성 시스템(40)은 기준데이터(41)로부터 진단모델(46)을 생성하기 위한 전처리부(42), 시계열 분석부(43), 모델 생성부(44), 및 학습부(45)를 포함한다. 학습부(45)를 제외한 나머지 컴포넌트들은 도 1을 참조하여 기술한 진단모델 생성 시스템(10)의 컴포넌트들과 유사하게 대응한다.
실시예에 따라 기준데이터(41)는, 도 1의 기준데이터(12)와 유사하며, 특정 질환 유병자들을 대상으로 하여 시간적인 순서를 가지는 관측 값들을 포함한다. 전처리부(42)는, 도 1의 전처리부(14)와 유사하며, 기준데이터(41)의 관측 값들 중에서 특정 질환의 특성을 가장 잘 나타내는 특징구간을 추출하고 이를 시계열 분석부(43)로 제공한다. 시계열 분석부(43)는, 도 1의 시계열 분석부(16)와 유사하며, 특징구간의 값들에 대해 시계열 변동성을 반영한 시계열 모델을 이용하여 분석함으로써 추세, 주기성, 계절성, 규칙성, 불규칙성, 변동성 등의 다양한 데이터 특성들을 산출한다. 이들 데이터 특성들은 모델 생성부(44)로 제공된다. 모델 생성부(44)는, 도 1의 모델 생성부(18)와 유사하며, 데이터 특성들 중에서 추세(442), 주기성(444), 계절성(446), 변동성(448)과 같은 특성을 피처로서 추출할 수 있다. 추출된 피처는 진단모델(46)을 구성하는 파라미터, 함수, 또는 모델 등에 대응됨으로써, 특정 질환을 진단할 수 있는 진단모델(46)이 결정된다. 도 4에서, 모델 생성부(44)는 추세(442), 주기성(444), 계절성(446), 변동성(448)을 피처로서 추출한 것으로 도시되어 있으나, 이것은 오로지 예시를 위한 것이며, 실시예들이 이들로만 제한되는 것은 아니다.
실시예에 따라, 학습부(45)는 모델 생성부(44)에서 추출된 피처들을 원래의 기준데이터(41)를 이용하여 검증 또는 학습시킴으로써 조정하는 컴포넌트이다. 모델 생성부(44)에서 추출된 피처는 전처리부(42)에서 전처리된 값들을 시계열 분석한 결과에 기초하기 때문에, 원래의 특정 질환자로부터 직접 측정한 관측 값들을 이용하여 검증함으로써, 보다 신뢰성 있는 진단모델(46)이 생성될 수 있다.
도 5는 또 다른 실시예에 따른 진단모델 생성 시스템의 구성을 보여주는 블록도이다.
도 5를 참조하면, 진단모델 생성 시스템(50)은, 도 4를 참조하여 기술된 시스템(40)과 유사하게, 기준데이터(41)로부터 진단모델(46)을 생성하기 위한 전처리부(42), 시계열 분석부(43), 모델 생성부(44), 및 학습부(45)를 포함한다. 도 5의 시스템(50)은 도 4의 시스템(40)에 비하여 시계열 분석부(43)의 분석모델을 선택할 수 있도록 하는 분석모델 선택부(54) 및 분석모델 저장부(52)를 더 포함한다.
도 1 및 도 4의 시계열 분석부가 미리 정의되어 있는 분석모델을 이용하여 시계열 변동성 분석 프로세스를 수행하는 것임에 비하여, 도 5의 시계열 분석부(43)는, 분석모델 선택부(54)에 의해 선택된 분석모델을 이용하여 시계열 변동성 분석 프로세스를 수행한다는 점에서 상이하다. 분석모델 저장부(52)에는 ARCH 모델, ARIMA와 결합된 모델, 추계학적 변동성 모델, 갑작스러운 점프 성분들(jump components)을 포함하는 추계학적 변동성 모델 등의 다양한 기존의 이미 알려져 있는 분석모델들이 저장될 수 있다. 분석모델 선택부(54)는 분석모델 저장부(52)에 저장되어 있는 여러 가지 분석모델들 중에서 기준데이터(41)에 저장되어 있는 데이터에 대응하는 특정 질환의 분석에 적합한 분석모델을 선택한다. 분석모델 선택부(54)는 예컨대 BIC(Bayesian information Criterion), AIC(Akaike information criterion) 등을 이용하여 특정 분석모델을 선택하도록 동작할 수 있다. 도면에서, 모델 생성부(44)는 추세(442), 주기성(444), 계절성(446), 변동성(448)을 피처로서 추출한 것으로 도시되어 있으나, 이것은 오로지 예시를 위한 것이며, 실시예들이 이들로만 제한되는 것은 아니다.
도 6은 또 다른 실시예에 따른 진단모델 생성 시스템의 구성을 보여주는 블록도이다.
도 6을 참조하면, 진단모델 생성 시스템(60)은, 도 4를 참조하여 기술된 시스템(40)과 유사하게, 기준데이터(41)로부터 진단모델(46)을 생성하기 위한 전처리부(42), 시계열 분석부(43, 62), 모델 생성부(44, 64), 및 학습부(45)를 포함한다. 도 6의 시스템(60)은 도 4의 시스템(40)에 비하여 시계열 분석 및 피처 추출이 이중으로 이루어진다는 점에서 상이하다.
1차 시계열 분석부(43)는 전처리부(42)로부터 입력되는 특징구간의 값들에 대해 시계열 변동성 분석모델을 사용하여 분석함으로써, 추세, 주기성, 계절성, 규칙성, 불규칙성, 변동성 등의 데이터 특성을 산출할 수 있다. 그러면, 1차 모델 생성부(44)는 1차 시계열 분석부(43)에 의해 산출된 데이터 특성들 중에서 피처를 추출한다. 2차 시계열 분석부(62)는 1차 모델 생성부(44)의 피처들 각각에 대해 시계열 변동성 분석모델을 사용하여 더 분석한다. 2차 시계열 분석부(62)는 1차 모델 생성부(44)의 피처들 중 추세(442), 주기성(444), 계절성(446), 또는 변동성(448)에 대해, 각각 별도의 시계열 변동성 분석을 수행함으로써, 각각의 추세(642), 주기성(644), 계절성(646), 및 변동성(648)을 포함하는 데이터 특성 정보를 산출한다. 그러면, 2차 모델 생성부(64)는 이들을 또 다른 피처들로서 추출할 수 있다. 이에 따라, 진단모델 생성 시스템(60)은 1차 모델 생성부(44)와 2차 모델 생성부(64) 둘 모두 또는 어느 하나에서 추출된 피처들을 고려하여 진단모델(46)을 생성할 수 있다. 도면에서, 모델 생성부(44, 64)는 추세(442, 642), 주기성(444, 644), 계절성(446, 646), 변동성(448, 648)을 피처로서 추출한 것으로 도시되어 있으나, 이것은 오로지 예시를 위한 것이며, 실시예들이 이들로만 제한되는 것은 아니다.
이제 도 7 내지 도 10을 참조하여 진단모델 생성 방법의 실시예들이 기술된다. 도 7 내지 도 10을 참조하여 기술된 진단모델 생성 방법들은 단지 예시에 불과하다. 해당 기술분야의 통상의 지식을 가진 자는, 청구항들의 범위 내에서 다양한 조합의 다른 방법들이 가능하다는 것을 쉽게 이해할 것이다.
도 7은 일 실시예에 따른 진단모델 생성 방법의 단계들을 보여주는 흐름도가 도시된다.
도 7을 참조하면, 진단모델 생성 방법(700)은 기준데이터 획득 단계(702), 전처리 단계(704), 시계열 분석 단계(706), 진단모델 생성 단계(708)를 포함하여 수행될 수 있다.
실시예에 따라 기준데이터 획득 단계(702)는 특정 질환을 가진 환자 즉 질환자를 대상으로 하여 센서 기반의 모니터링을 통해 관측한 시계열 측정 데이터를 획득하는 단계이다. 일 예에서, 시계열 측정 데이터는 실시간으로 관측되고 있는 값들을 통신망을 통해 전송받음으로써 획득된다. 다른 예에서, 시계열 측정 데이터는 컴퓨팅 장치가 시계열 측정 데이터가 저장되어 있는 메모리, 하드디스크 등의 저장장치를 판독함으로써 획득된다. 또 다른 예에서, 시계열 측정 데이터는 사용자에 의해 수동으로 입력됨으로써 획득될 수 있다. 기준데이터를 이루는 관측 값들은 시간적으로 순서를 가진 데이터이면 충분하며, 각각의 관측 값들에 대응하는 관측 시점들이 반드시 규칙적일 필요는 없다.
그런 다음, 기준데이터는 전처리 단계(704)에서 특정 질환의 특성을 가장 잘 나타나면서 시계열 분석에 적합한 시계열 데이터로서 전처리된다. 전처리 단계(704)에서는 기준데이터의 관측 값들 중에서, 특정 질환의 특성을 가장 잘 나타나는 시간대의 관측 값들만을 선택할 수 있다. 또는 전처리 단계(704)에서 기준데이터의 관측 값들 중에서, 일정한 시점이나 시간 기간의 관측 값만이 발췌될 수 있다. 또는 전처리 단계(704)는, 기준데이터의 관측 값들로부터, 특정 시간기간의 관측값들의 평균, 편차, 총합, 분산, 최대값, 중간값, 최소값, 기준값 이하의 값 등과 같은, 가공된 값을 생성할 수 있다.
시계열 분석 단계(706)에서, 이전 단계(704)의 전처리된 값들에 대해 시계열 변동성 분석 기법에 따라 분석이 이루어지고, 분석모델에 따라 추세, 주기성, 계절성, 규칙성, 불규칙성, 변동성 등의 데이터 특성을 나타내는 정보가 생성될 수 있다.
그런 다음, 진단모델 생성 단계(708)에서, 시계열 분석에 의해 생성된 데이터 특성 정보로부터 특정 질환의 진단을 위한 피처들이 추출될 수 있고, 이들 피처를 파라미터로서 포함하는 진단모델이 생성될 수 있다.
도 8은 다른 실시예에 따른 진단모델 생성 방법의 단계들을 보여주는 흐름도이다.
도 8을 참조하면, 진단모델 생성 방법(800)은 기준데이터 전처리 단계(802), 분석모델 선택 단계(804), 시계열 분석 단계(806), 진단모델 생성 단계(808), 및 진단모델 학습 단계(810)를 포함하여 수행될 수 있다.
실시예에 따라 기준데이터 전처리 단계(802)는 기준데이터를 전처리한다. 기준데이터는 특정 질환을 가진 환자 즉 질환자를 대상으로 하여 센서 기반의 모니터링을 통해 관측한 시계열 측정 데이터이다. 기준데이터를 이루는 관측 값들은 시간적으로 순서를 가진 데이터이면 충분하며, 각각의 관측 값들에 대응하는 관측 시점들이 반드시 규칙적일 필요는 없다. 이러한 기준데이터는 전처리 단계(802)에서 특정 질환의 특성을 가장 잘 나타나면서 시계열 분석에 적합한 시계열 데이터로서 전처리된다.
전처리 단계(802) 이후(또는 동시에) 분석모델 선택 단계(804)에서, 전처리된 값들에 대해 시계열 분석을 수행하기 위한 분석모델이 선택된다. 예를 들어, 급격한 변화를 보이는 특성을 가진 질환의 경우, 급격한 변동성 특성을 분석하는 분석모델이 선택된다. 반면에, 변화가 장기간에 걸쳐 점진적으로 이루어지는 특성을 가진 질환의 경우, 장기간에 걸친 느린 변동성 특성을 분석하는 분석모델이 선택될 수 있다.
그런 다음 시계열 분석 단계(806)에서, 이전 단계들(802, 804)의 전처리된 값들에 대해 선택된 분석모델에 따라 시계열 변동성 분석이 이루어지고, 추세, 주기성, 계절성, 규칙성, 불규칙성, 변동성 등의 데이터 특성을 나타내는 정보가 생성될 수 있다. 그러면, 추세, 주기성, 계절성, 변동성 등과 관련된 피처를 추출하고, 추출된 피처에 기초하여 파라미터를 계산함으로써, 계산된 파라미터를 가진 진단모델이 생성된다(808).
이후, 생성된 진단모델의 파라미터는 전처리 단계(802)에서 사용되었던 처음의 기준데이터를 이용하여 학습됨으로써, 최적의 피처 셋을 가진 진단모델이 생성될 수 있다(810).
도 9는 또 다른 실시예에 따른 진단모델 생성 방법의 단계들을 보여주는 흐름도이다.
도 9를 참조하면, 진단모델 생성 방법(900)은 기준데이터 획득 단계(902), 전처리 단계(904), 분석모델 선택 단계(906), 진단모델 생성 단계(908), 및 진단모델 학습 단계(910)를 포함하여 수행될 수 있다.
실시예에 따라 기준데이터 획득 단계(902)에서, ADHD 질환군의 활동량을 측정한 데이터(원데이터)를 획득한다. 활동량은, ADHD 질환을 가졌다고 판명된 환자들의 손목에 착용된 액티그래피 장치에 의해 수집될 수 있다. 일반적으로 액티그래피 장치는 예컨대 30Hz 또는 60Hz와 같이 일정한 시간 간격마다 감지된 활동량 데이터를 수집하는 성능을 가지므로, 액티그래피 장치에 의해 수집된 활동량 데이터는 시계열 데이터이다.
전처리 단계(904)에서, 획득된 활동량 데이터 즉 원데이터가 전처리된다. 도시된 예에서, 원데이터의 유효 구간에 대해 단위시간당 평균, 분산, 표준편자, 총합, 중앙값, 최소값, 최대값, 이상치 개수, 문턱 이상/이하 값 등으로 값들 중 적어도 하나로 가공된 전처리 데이터가 산출된다.
전처리 단계(904) 이전, 이후, 또는 동시에, 분석모델 선택 단계(906)가 수행될 수 있다. 이 예에서, 시계열 변동성 또는 가변성 분석을 수행하기 위한 분석모델로서 급격한 변화 특성을 분석하도록 특화된 추계학적 모델이 선택된다.
그런 다음 시계열 분석 단계(908)에서, 이전 단계들(904, 906)의 전처리된 값들에 대해 선택된 분석모델에 따라 시계열 변동성 분석이 이루어지고, 추세, 주기성, 계절성, 규칙성, 불규칙성, 변동성 등의 데이터 특성을 나타내는 정보가 생성될 수 있다. 그러면, 추세, 주기성, 계절성, 변동성 등과 관련된 피처를 추출하고, 추출된 피처에 기초하여 파라미터를 계산함으로써, 계산된 파라미터를 가진 진단모델이 생성된다(908). 이후, 생성된 진단모델의 파라미터는 전처리 단계(904)에서 사용되었던 처음의 원데이터를 이용하여 학습됨으로써, 최적의 피처 셋을 가진 진단모델이 생성될 수 있다(910).
도 10은 또 다른 실시예에 따른 진단모델 생성 방법의 단계들을 보여주는 흐름도이다.
도 10을 참조하면, 진단모델 생성 방법(1000)은 기준데이터 획득 단계(1002), 전처리 단계(1004), 분석모델 선택 단계(1006), 진단모델 생성 단계(1008), 및 진단모델 학습 단계(1010)를 포함하여 수행될 수 있다.
실시예에 따라 기준데이터 획득 단계(1002)에서, 부정맥 질환군의 심전도 데이터(원데이터)를 획득한다. 심전도 데이터는, 부정맥 질환을 가졌다고 판명된 환자들에게 착용된 ECG 센서에 의해 수집될 수 있다. 일반적으로 ECG 센서는 예컨대 30Hz 또는 60Hz와 같이 일정한 시간 간격마다 감지된 심전도 데이터를 수집하는 성능을 가지므로, ECG 센서에 의해 수집된 심전도 데이터는 시계열 데이터이다.
전처리 단계(1004)에서, 획득된 심전도 데이터 즉 원데이터가 전처리된다. 도시된 예에서, 원데이터의 유효 구간에 대해 단위시간당 평균, 분산, 표준편자, 총합, 중앙값, 최소값, 최대값, 이상치 개수, 문턱 이상/이하 값 등으로 값들 중 적어도 하나로 가공된 전처리 데이터가 산출된다.
전처리 단계(1004) 이전, 이후, 또는 동시에, 분석모델 선택 단계(1006)가 수행될 수 있다. 이 예에서, 심전도 데이터의 시계열 변동성 또는 가변성 분석을 수행하기 위한 분석모델로서 장기간에 걸친 느린 변동성 특성을 분석하도록 특화된 추계학적 모델이 선택된다. 분석 모델의 선택은 질환에 따라 자동으로 이루어질 수도 있고, 사용자에게 선택을 요청하고 사용자 선택이 입력됨으로써 이루어질 수 있다.
그런 다음 시계열 분석 단계(1008)에서, 이전 단계들(1004, 1006)에서 전처리된 값들에 대해 선택된 분석모델에 따라 시계열 변동성 또는 가변성 분석이 이루어지고, 추세, 주기성, 계절성, 규칙성, 불규칙성, 변동성 등의 데이터 특성을 나타내는 정보가 생성될 수 있다. 그러면, 추세, 주기성, 계절성, 변동성 등과 관련된 피처를 추출하고, 추출된 피처에 기초하여 파라미터를 계산함으로써, 계산된 파라미터를 가진 진단모델이 생성된다(1008). 이후, 생성된 진단모델의 파라미터는 전처리 단계(904)에서 사용되었던 처음의 원데이터를 이용하여 학습됨으로써, 최적의 피처 셋을 가진 진단모델이 생성될 수 있다(1010).
상술한 진단모델 생성 시스템의 컴포넌트들은 특정 기능을 수행하도록 구성된 회로를 포함하는 하드웨어에 의해 구현될 수 있다. 다른 방식으로, 진단모델 생성 시스템의 컴포넌트들은 프로세서, 메모리, 사용자 입력장치, 및/또는 프레젠테이션 장치 등을 포함할 수 있는 컴퓨팅 장치의 하드웨어, 펌웨어, 소프트웨어 컴포넌트들의 조합에 의해 구현될 수 있다. 메모리는, 프로세서에 의해 실행되면 특정 태스크를 수행할 있도록 코딩되어 있는 컴퓨터 실행가능 소프트웨어, 애플리케이션, 프로그램 모듈, 루틴, 인스트럭션(instructions), 및/또는 데이터 등을 저장하는 컴퓨터 판독가능 스토리지 매체이다. 프로세서는 컴퓨터 판독가능 매체에 포함되어 있는 컴퓨터 실행가능 소프트웨어, 애플리케이션, 프로그램 모듈, 루틴, 인스트럭션, 및/또는 데이터 등을 판독하여 실행할 수 있다. 사용자 입력장치는 사용자로 하여금 프로세서에게 특정 태스크를 실행하도록 하는 명령을 입력하거나 특정 태스크의 실행에 필요한 데이터를 입력하도록 하는 수단일 수 있다. 사용자 입력장치는 물리적인 또는 가상적인 키보드나 키패드, 키버튼, 마우스, 조이스틱, 트랙볼, 터치-민감형 입력수단, 또는 마이크로폰 등을 포함할 수 있다. 프레젠테이션 장치는 디스플레이, 프린터, 스피커, 또는 진동장치 등을 포함할 수 있다.
한편 상술한 진단모델 생성 방법의 단계, 과정, 프로세스들은 특정 기능을 수행하도록 구성된 회로를 포함하는 하드웨어에 의해 실행될 수 있다. 다른 방식으로, 진단모델 생성 방법은, 컴퓨터 실행가능 인스트럭션으로서 코딩되어 컴퓨팅 장치의 프로세서에 의해 실행됨으로써 구현될 수 있다. 컴퓨터 실행가능 인스트럭션은 소프트웨어, 애플리케이션, 모듈, 프로시저, 플러그인, 프로그램, 인스트럭션, 및/또는 데이터 구조 등을 포함할 수 있다. 컴퓨터 실행가능 인스트럭션은 컴퓨터 판독가능 매체 상에 포함될 수 있다. 컴퓨터 판독가능 매체는 컴퓨터 판독가능 스토리지 매체 및 컴퓨터 판독가능 통신 매체를 포함한다. 컴퓨터 판독가능 스토리지 매체는 RAM, ROM, 플래시 메모리, 광 디스크, 자기 디스크, 자기 테이프, 자기 카세트, 하드 디스크, 솔리드 스테이트 디스크 등을 포함할 수 있다. 컴퓨터 판독가능 통신 매체는 진단 방법이 코딩되어 있는 컴퓨터 실행가능 인스트럭션이 통신망을 통해 송수신 가능한 신호의 형태로 코딩된 것을 의미할 수 있다.
Claims (14)
- 특정 질환을 가진 환자들로부터 관측된 시계열 데이터를 전처리하는 전처리부;
전처리된 시계열 데이터에 대해 시계열 변동성 분석을 위한 분석모델을 이용하여 적어도 하나의 데이터 특성을 산출하는 시계열 분석부;
산출된 상기 적어도 하나의 데이터 특성을 피처로서 추출하고, 추출된 피처에 기초하여 진단모델을 생성하는 모델 생성부를
포함하는, 진단모델 생성 시스템. - 제 1 항에 있어서,
상기 모델 생성부에 의해 생성된 진단모델을 상기 전처리부에서 전처리되기 전의 시계열 데이터를 이용하여 학습시키는 학습부를
더 포함하는, 진단모델 생성 시스템. - 제 1 항에 있어서,
상기 분석모델을 상기 질환의 특성에 따라 선택하는 분석모델 선택부를
더 포함하는, 진단모델 생성 시스템. - 제 1 항에 있어서,
상기 시계열 분석부는, 전처리된 시계열 데이터에 대해 시계열 변동성 분석을 위한 분석모델을 이용하여 적어도 하나의 데이터 특성을 산출하는 1차 시계열 분석부, 및 상기 1차 시계열 분석부에 의해 산출된 상기 적어도 하나의 데이터 특성 각각에 대해 재차 시계열 변동성 분석을 수행하여 각 데이터 특성의 데이터 특성을 산출하는 2차 시계열 분석부를 포함하고;
상기 모델 생성부는, 상기 1차 시계열 분석부에 의해 산출된 상기 적어도 하나의 데이터 특성을 피처로서 추출하는 1차 모델 생성부, 및 상기 2차 시계열 분석부에 의해 산출된 상기 데이터 특성의 데이터 특성을 피처로서 추출하는 2차 모델 생성부를 포함하는,
진단모델 생성 시스템. - 제 1 항에 있어서,
상기 전처리부는:
상기 시계열 데이터 중 적어도 일부를 선택하거나;
미리 결정된 시간단위마다 상기 시계열 데이터의 총합, 평균, 중앙값, 최대값, 최소값, 분산, 표준편차, 이상치 개수, 기준값 이상, 기준값 이하 중 적어도 하나의 값을 생성하거나; 또는
미리 결정된 시간 길이마다 상기 시계열 데이터의 일부 또는 특정 값을 발췌하는, 진단모델 생성 시스템. - 제 1 항에 있어서,
상기 데이터 특성은, 추세(trend), 주기(cycle), 계절성(seasonality), 변동성(volatility)을 포함하는, 진단모델 생성 시스템. - 제 1 항에 있어서,
상기 분석모델은, 시간 변동 계수 모델(time varying coefficient model), ARCH(AutoRegressive Conditional Heteroskedasticity) 모델, GARCH(generalized ARCH) 모델, 추계학적 변동(Stochastic volatility) 모델, ARIMA(AutoRegressive Integrated Moving Average) 모델과 결합한 모델을 포함하는, 진단모델 생성 시스템. - 특정 질환을 가진 환자들로부터 관측된 시계열 데이터를 전처리하는 전처리 단계;
전처리된 시계열 데이터에 대해 시계열 변동성 분석을 위한 분석모델을 이용하여 적어도 하나의 데이터 특성을 산출하는 시계열 분석 단계;
산출된 상기 적어도 하나의 데이터 특성을 피처로서 추출하고, 추출된 피처에 기초하여 진단모델을 생성하는 피처 추출 단계를
포함하는, 진단모델 생성 방법. - 제 8 항에 있어서,
상기 진단모델 생성 단계에 의해 생성된 진단모델을 상기 전처리 단계에서 전처리되기 전의 시계열 데이터를 이용하여 학습시키는 학습 단계를
더 포함하는, 진단모델 생성 방법. - 제 8 항에 있어서,
상기 분석모델을 상기 질환의 특성에 따라 선택하는 분석모델 선택 단계를
더 포함하는, 진단모델 생성 방법. - 제 8 항에 있어서,
상기 시계열 분석 단계는, 전처리된 시계열 데이터에 대해 시계열 변동성 분석을 위한 분석모델을 이용하여 적어도 하나의 데이터 특성을 산출하는 1차 시계열 분석 단계, 및 상기 1차 시계열 분석 단계에 의해 산출된 상기 적어도 하나의 데이터 특성 각각에 대해 재차 시계열 변동성 분석을 수행하여 각 데이터 특성의 데이터 특성을 산출하는 2차 시계열 분석 단계를 포함하고;
상기 피처 추출 단계는, 상기 1차 시계열 분석 단계에 의해 산출된 상기 적어도 하나의 데이터 특성을 피처로서 추출하는 1차 피처 추출 단계, 및 상기 2차 시계열 분석 단계에 의해 산출된 상기 데이터 특성의 데이터 특성을 피처로서 추출하는 2차 피처 추출 단계를 포함하는,
진단모델 생성 방법. - 제 8 항에 있어서,
상기 전처리 단계는:
상기 시계열 데이터 중 적어도 일부를 선택하거나;
미리 결정된 시간단위마다 상기 시계열 데이터의 총합, 평균, 중앙값, 최대값, 최소값, 분산, 표준편차, 이상치 개수, 기준값 이상, 기준값 이하 중 적어도 하나의 값을 생성하거나; 또는
미리 결정된 시간 길이마다 상기 시계열 데이터의 일부 또는 특정 값을 발췌하는, 진단모델 생성 방법. - 제 8 항에 있어서,
상기 데이터 특성은, 추세(trend), 주기(cycle), 계절성(seasonality), 변동성(volatility)을 포함하는, 진단모델 생성 방법. - 제 8 항에 있어서,
상기 분석모델은, 시간 변동 계수 모델(time varying coefficient model), ARCH(AutoRegressive Conditional Heteroskedasticity) 모델, GARCH(generalized ARCH) 모델, 추계학적 변동(Stochastic volatility) 모델, ARIMA(AutoRegressive Integrated Moving Average) 모델과 결합한 모델을 포함하는, 진단모델 생성 방법.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/KR2014/005647 WO2015199258A1 (ko) | 2014-06-25 | 2014-06-25 | 진단모델 생성 시스템 및 방법 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20170023770A true KR20170023770A (ko) | 2017-03-06 |
Family
ID=54938333
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020167022328A KR20170023770A (ko) | 2014-06-25 | 2014-06-25 | 진단모델 생성 시스템 및 방법 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20170103174A1 (ko) |
KR (1) | KR20170023770A (ko) |
WO (1) | WO2015199258A1 (ko) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101864614B1 (ko) * | 2017-03-29 | 2018-06-05 | 안동과학대학교 산학협력단 | 아토피 오토케어 장치 및 그 방법 |
KR101886374B1 (ko) * | 2017-08-16 | 2018-08-07 | 재단법인 아산사회복지재단 | 딥러닝 기반의 패혈증 조기 감지방법 및 프로그램 |
KR20190000195A (ko) * | 2017-06-22 | 2019-01-02 | 연세대학교 산학협력단 | 신경계 질환 관리를 위한 시스템 및 방법 |
KR20190000194A (ko) * | 2017-06-22 | 2019-01-02 | 연세대학교 산학협력단 | 신경계 질환 관리를 위한 시스템 및 방법 |
KR20190009166A (ko) * | 2017-07-18 | 2019-01-28 | 사회복지법인 삼성생명공익재단 | 기계 학습을 이용한 난소암의 예후 예측 방법, 장치 및 프로그램 |
KR102007922B1 (ko) * | 2018-04-05 | 2019-08-06 | 사회복지법인 삼성생명공익재단 | 스트레스 측정 모형 개발 방법 및 시스템 |
KR20200051343A (ko) * | 2018-11-05 | 2020-05-13 | (주)엔키아 | 시계열 데이터 예측 모델 평가 방법 및 장치 |
KR20200082893A (ko) * | 2018-12-31 | 2020-07-08 | 한국전자통신연구원 | 시계열 데이터 처리 장치 및 이의 동작 방법 |
KR20210073763A (ko) * | 2019-12-11 | 2021-06-21 | 한국전자통신연구원 | 시계열 데이터 처리 장치 및 이의 동작 방법 |
KR20210119289A (ko) * | 2020-03-24 | 2021-10-05 | 가부시키가이샤 스크린 홀딩스 | 학습 완료된 모델 생성 방법, 이상 요인 추정 장치, 기판 처리 장치, 이상 요인 추정 방법, 학습 방법, 학습 장치, 및 학습 데이터 작성 방법 |
WO2021242010A1 (ko) * | 2020-05-29 | 2021-12-02 | 연세대학교 산학협력단 | 학습 모델 기반의 아토피 피부염 관리 장치 및 그 방법 |
KR102405900B1 (ko) * | 2021-10-12 | 2022-06-08 | 주식회사 바스젠바이오 | 시간 변동성 기반의 질환 연관성 요인 분석을 통한 질환 발병 정보 생성 장치 및 그 방법 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10854335B2 (en) | 2017-06-16 | 2020-12-01 | Htc Corporation | Computer aided medical method and medical system for medical prediction |
US11177024B2 (en) * | 2017-10-31 | 2021-11-16 | International Business Machines Corporation | Identifying and indexing discriminative features for disease progression in observational data |
US20190156953A1 (en) * | 2017-11-20 | 2019-05-23 | Koninklijke Philips N.V. | Statistical analysis of subject progress and responsive generation of influencing digital content |
KR101881731B1 (ko) * | 2018-02-27 | 2018-07-25 | 한국과학기술정보연구원 | 기계 학습을 통한 치매 예측용 데이터 처리 장치 및 그 방법, 이를 수록한 기록 매체 |
WO2019227690A1 (zh) * | 2018-06-01 | 2019-12-05 | 中国科学院上海生命科学研究院 | 行为范式指标的筛选及其应用 |
US11176095B2 (en) * | 2019-02-28 | 2021-11-16 | International Business Machines Corporation | Systems and methods for determining data storage health and alerting to breakdowns in data collection |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1810197A4 (en) * | 2004-05-07 | 2009-08-05 | Intermed Advisor Inc | METHOD AND APPARATUS FOR PREDICTIVE REAL-TIME MODELING FOR CHRONICALLY SICK PATIENTS |
US20060025931A1 (en) * | 2004-07-30 | 2006-02-02 | Richard Rosen | Method and apparatus for real time predictive modeling for chronically ill patients |
US20070027368A1 (en) * | 2005-07-14 | 2007-02-01 | Collins John P | 3D anatomical visualization of physiological signals for online monitoring |
US7733224B2 (en) * | 2006-06-30 | 2010-06-08 | Bao Tran | Mesh network personal emergency response appliance |
US20130035579A1 (en) * | 2011-08-02 | 2013-02-07 | Tan Le | Methods for modeling neurological development and diagnosing a neurological impairment of a patient |
KR101993716B1 (ko) * | 2012-09-28 | 2019-06-27 | 삼성전자주식회사 | 카테고리별 진단 모델을 이용한 병변 진단 장치 및 방법 |
-
2014
- 2014-06-25 KR KR1020167022328A patent/KR20170023770A/ko not_active Application Discontinuation
- 2014-06-25 WO PCT/KR2014/005647 patent/WO2015199258A1/ko active Application Filing
-
2016
- 2016-12-22 US US15/388,916 patent/US20170103174A1/en not_active Abandoned
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101864614B1 (ko) * | 2017-03-29 | 2018-06-05 | 안동과학대학교 산학협력단 | 아토피 오토케어 장치 및 그 방법 |
KR20190000195A (ko) * | 2017-06-22 | 2019-01-02 | 연세대학교 산학협력단 | 신경계 질환 관리를 위한 시스템 및 방법 |
KR20190000194A (ko) * | 2017-06-22 | 2019-01-02 | 연세대학교 산학협력단 | 신경계 질환 관리를 위한 시스템 및 방법 |
KR20190009166A (ko) * | 2017-07-18 | 2019-01-28 | 사회복지법인 삼성생명공익재단 | 기계 학습을 이용한 난소암의 예후 예측 방법, 장치 및 프로그램 |
KR101886374B1 (ko) * | 2017-08-16 | 2018-08-07 | 재단법인 아산사회복지재단 | 딥러닝 기반의 패혈증 조기 감지방법 및 프로그램 |
WO2019035639A1 (ko) * | 2017-08-16 | 2019-02-21 | 재단법인 아산사회복지재단 | 딥러닝 기반의 패혈증 조기 감지방법 및 프로그램 |
KR102007922B1 (ko) * | 2018-04-05 | 2019-08-06 | 사회복지법인 삼성생명공익재단 | 스트레스 측정 모형 개발 방법 및 시스템 |
KR20200051343A (ko) * | 2018-11-05 | 2020-05-13 | (주)엔키아 | 시계열 데이터 예측 모델 평가 방법 및 장치 |
KR20200082893A (ko) * | 2018-12-31 | 2020-07-08 | 한국전자통신연구원 | 시계열 데이터 처리 장치 및 이의 동작 방법 |
KR20210073763A (ko) * | 2019-12-11 | 2021-06-21 | 한국전자통신연구원 | 시계열 데이터 처리 장치 및 이의 동작 방법 |
KR20210119289A (ko) * | 2020-03-24 | 2021-10-05 | 가부시키가이샤 스크린 홀딩스 | 학습 완료된 모델 생성 방법, 이상 요인 추정 장치, 기판 처리 장치, 이상 요인 추정 방법, 학습 방법, 학습 장치, 및 학습 데이터 작성 방법 |
WO2021242010A1 (ko) * | 2020-05-29 | 2021-12-02 | 연세대학교 산학협력단 | 학습 모델 기반의 아토피 피부염 관리 장치 및 그 방법 |
KR102405900B1 (ko) * | 2021-10-12 | 2022-06-08 | 주식회사 바스젠바이오 | 시간 변동성 기반의 질환 연관성 요인 분석을 통한 질환 발병 정보 생성 장치 및 그 방법 |
WO2023063528A1 (ko) * | 2021-10-12 | 2023-04-20 | 주식회사 바스젠바이오 | 시간 변동성 기반의 질환 연관성 요인 분석을 통한 질환 발병 정보 생성 장치 및 그 방법 |
Also Published As
Publication number | Publication date |
---|---|
WO2015199258A1 (ko) | 2015-12-30 |
US20170103174A1 (en) | 2017-04-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR20170023770A (ko) | 진단모델 생성 시스템 및 방법 | |
CN107209807B (zh) | 疼痛管理可穿戴设备 | |
CN102908130B (zh) | 用于监测人体健康状态的设备 | |
Wu et al. | Evaluating physiological dynamics via synchrosqueezing: Prediction of ventilator weaning | |
JP2018524750A (ja) | ストレス状態をモニターするための方法およびシステム | |
JP2018524137A (ja) | 心理状態を評価するための方法およびシステム | |
CN110945597A (zh) | 用于预测癫痫发作的方法和系统 | |
KR20150113700A (ko) | 진단 시스템 및 방법 | |
US20160128638A1 (en) | System and method for detecting and quantifying deviations from physiological signals normality | |
AU2018285950A1 (en) | Mental state indicator | |
KR102053604B1 (ko) | 수면 분석 방법 및 이를 이용한 수면 분석 디바이스 | |
JP2017530849A (ja) | 生理データに基づく患者の継続的な心拍出量(cco)を予測する方法およびシステム | |
Kelly et al. | Automatic prediction of health status using smartphone-derived behavior profiles | |
WO2019075522A1 (en) | RISK INDICATOR | |
CN113171080B (zh) | 一种基于可穿戴传感信息融合的能量代谢评估方法和系统 | |
Massaro et al. | Decisional support system with artificial intelligence oriented on health prediction using a wearable device and big data | |
WO2013151773A1 (en) | Data collection for vestibulogram construction | |
JP2017522939A (ja) | 対象の健康状態を検出するデバイス、システム及び方法 | |
Côté-Allard et al. | Long–short ensemble network for bipolar manic-euthymic state recognition based on wrist-worn sensors | |
US20200265949A1 (en) | Anxiety detection in different user states | |
KR20180109867A (ko) | 심박수 변동부전을 검출하기 위한 장치 및 방법 | |
CN117653053A (zh) | 一种通过智能手表预测健康风险的方法 | |
AU2021363110A1 (en) | Method and system for personalized prediction of infection and sepsis | |
Tao et al. | Effective severity assessment of parkinson’s disease with wearable intelligence using free-living environment data | |
JP2020048622A (ja) | 生体状態推定装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
WITN | Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid |