KR102088296B1 - 대기질 데이터에 기초한 질병 상관 관계 예측 방법 및 장치 - Google Patents

대기질 데이터에 기초한 질병 상관 관계 예측 방법 및 장치 Download PDF

Info

Publication number
KR102088296B1
KR102088296B1 KR1020190090357A KR20190090357A KR102088296B1 KR 102088296 B1 KR102088296 B1 KR 102088296B1 KR 1020190090357 A KR1020190090357 A KR 1020190090357A KR 20190090357 A KR20190090357 A KR 20190090357A KR 102088296 B1 KR102088296 B1 KR 102088296B1
Authority
KR
South Korea
Prior art keywords
air quality
disease
quality data
data
correlation
Prior art date
Application number
KR1020190090357A
Other languages
English (en)
Inventor
백정현
방한성
Original Assignee
백정현
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 백정현 filed Critical 백정현
Priority to KR1020190090357A priority Critical patent/KR102088296B1/ko
Application granted granted Critical
Publication of KR102088296B1 publication Critical patent/KR102088296B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks

Abstract

일 실시예에 따른 대기질 데이터에 기초한 질병 상관 관계 예측 방법 및 장치는 실내 공기 측정기 및 실외 공기 측정기 중 적어도 하나로부터 제1 대기질 데이터를 획득하고, 제1 대기질 데이터가 획득된 지역에서, 현재를 기준으로 미리 정의된 과거 구간 동안에 획득된 대기질 데이터에 시간 별 가중치를 적용한 제2 대기질 데이터를 생성하고, 제1 대기질 데이터, 제2 대기질 데이터 및 지역의 정보에 기초하여 대기질 관련 정보와 미세 먼지로 인해 발생한 질병 간의 상관 관계에 기초하여 학습된 신경망을 포함하는 질병 예측 모델의 입력 레이어에 대응하는 입력 벡터를 생성하고, 입력 벡터를 질병 예측 모델에 인가함으로써 질병 예측 모델에 의해 생성된 출력 벡터를 획득하고, 출력 벡터에 기초하여, 제1 대기질 데이터에 따라 발생 가능한 질병 및 상기 발생 가능한 질병의 발생 빈도 중 적어도 하나를 예측하며, 제1 대기질 데이터, 상기 예측한 질병 및 상기 예측한 질병의 발생 빈도 중 적어도 하나를 표시한다.

Description

대기질 데이터에 기초한 질병 상관 관계 예측 방법 및 장치{METHOD AND APPARATUS OF PREDICTING DISEASE CORRELATION BASED ON AIR QUALITY DATA}
아래의 실시예들은 대기질 데이터에 기초한 질병 상관 관계 예측 방법 및 장치에 관한 것이다.
미세 먼지 및 각종 산업과 석유 정제, 화학, 자동차, 선박 제조 공정 등으로부터 발생되는 대기 오염 물질(Hazardous air pollutants; HAPs)은 대기 중으로 비산되어 다양한 질병을 일으킬 수 있다. 특히, 대기 오염 물질은 예를 들어, 영, 유아나 고령자 등과 같은 노약자에게 호흡기 질병뿐만 아니라 발암, 기형 유발 등의 원인으로 작용하는 것으로 밝혀지고 있다. 또한, 입자가 작은 초미세 먼지는 폐 속 깊은 곳까지 침투하여 천식이나 폐질환의 유병률, 조사망률 증가에 영향을 미친다. 다만, 이러한 대기 오염 물질과 다양한 질병 간의 상관 관계를 정확하게 예측하는 데에는 어려움이 있다.
KR 1020150116082 A KR 100650267 B KR 101545319 B KR 101915704 B
일 실시예에 따르면, 와이파이(Wi-Fi) 통신 또는 IoT LTE 통신을 통해 실외 공기 측정기 및 실내 공기 측정기로부터 실시간으로 대기질 데이터를 수집하고, 현재 대기질 데이터에 따라 발생 가능한 질병 및 해당 질병의 발생 빈도를 예측할 수 있다.
일 실시예에 따르면, 과거부터 누적된 대기질 데이터에 기초하여 학습된 신경망을 포함하는 질병 예측 모델을 이용하여 현재의 대기질 데이터에 따라 발생 가능한 질병 및 해당 질병의 발생 빈도를 예측할 수 있다.
일 실시예에 따르면, 빅 대시보드 또는 디지털 사이니지 등을 통해 미세 먼지를 포함하는 대기질 데이터, 기상 정보, 공지 사항 및 대기질과 질병의 상관 관계 등의 정보를 포함하는 대기질 알리미 서비스를 제공할 수 있다.
일 실시예에 따르면, 대기질 데이터에 기초한 질병 상관 관계 예측 방법은 실내 공기 측정기 및 실외 공기 측정기 중 적어도 하나로부터 제1 대기질 데이터(air quality data)를 획득하는 단계; 상기 제1 대기질 데이터가 획득된 지역에서, 현재를 기준으로 미리 정의된 과거 구간 동안에 획득된 대기질 데이터에 시간 별 가중치를 적용한 제2 대기질 데이터를 생성하는 단계; 상기 제1 대기질 데이터, 상기 제2 대기질 데이터 및 상기 지역의 정보에 기초하여 질병 예측 모델- 상기 질병 예측 모델은 대기질 관련 정보와 미세 먼지로 인해 발생한 질병 간의 상관 관계에 기초하여 학습된 신경망을 포함함 -의 입력 레이어에 대응하는 입력 벡터를 생성하는 단계; 상기 입력 벡터를 상기 질병 예측 모델에 인가함으로써 상기 질병 예측 모델에 의해 생성된 출력 벡터를 획득하는 단계; 상기 출력 벡터에 기초하여, 상기 제1 대기질 데이터에 따라 발생 가능한 질병 및 상기 발생 가능한 질병의 발생 빈도 중 적어도 하나를 예측하는 단계; 및 상기 제1 대기질 데이터, 상기 예측한 질병 및 상기 예측한 질병의 발생 빈도 중 적어도 하나를 표시하는 단계를 포함한다.
상기 입력 벡터는 상기 입력 레이어의 제1 노드에 대응하는 상기 제1 대기질 데이터, 제2 노드에 대응하는 상기 제2 대기질 데이터 및 제3 노드에 대응하는 상기 지역의 정보를 포함할 수 있다.
상기 신경망은 해당 지역에서 과거에 미세 먼지로 인해 발생한 질병에 대한 정보 와 상기 과거부터 현재까지의 미세 먼지 측정 데이터를 결합하여, 상기 해당 지역의 현재 질병 관련 정보를 예측할 수 있다.
상기 대기질 관련 정보는 실내 미세 먼지 농도, 실외 미세 먼지 농도, 기상 기후 데이터, 및 행정 단위별 인구 통계 기록 중 적어도 하나의 후보 예측 인자, 및 건강 보험 심사 평가원의 환자 진료 내역 정보를 포함할 수 있다.
상기 질병 예측 모델은 상기 환자 진료 내역 정보와 상기 후보 예측 인자 간의 상관 관계를 분석한 결과에 기초하여 상기 후보 예측 인자 중 상관성이 없는 후보 예측 인자를 제거함으로써 선정된 잠재 예측 인자, 및 상기 미세 먼지에 의한 지상 오존 농도 분포의 상관 관계에 따른 정분류율 (hit rate; HR) 및 탐지 확률(probability of detection; POD)을 제1 임계치보다 높이고, 허위 경고율(false alarm rate; FAR)을 제2 임계치보다 낮추는 기준값에 기초한 범위 내에서 학습될 수 있다.
상기 질병 예측 모델의 손실 함수는 상기 정분류율, 상기 탐지 확률, 및 상기 허위 경고율을 기초로 정의될 수 있다.
상기 질병 예측 모델은 로지스틱 회귀 모형을 통한 회귀 분석을 통해 상기 대기질 관련 정보와 상기 미세 먼지로 인해 발생한 질병 간의 상관 관계를 분석하고, 피어슨 상관 계수, 스피어만 상관 계수, 및 켄달 상관 계수 중 적어도 하나의 상관 계수에 의해 상기 대기질 관련 정보와 상기 질병 간의 상관 관계의 크기를 정량화할 수 있다.
상기 제1 대기질 데이터를 획득하는 단계는 상기 실내 공기 측정기 및 상기 실외 공기 측정기 중 적어도 하나로부터 와이파이 통신 및 IoT LTE 통신 중 적어도 하나의 무선 통신을 통해 상기 제1 대기질 데이터를 획득하는 단계를 포함할 수 있다.
상기 실내 공기 측정기 및 실외 공기 측정기 중 적어도 하나는 적외선을 방출하는 광원, 기체 고유의 흡수 스펙트럼에 맞는 파장을 통과시키는 필터 및 상기 기체를 통과한 적외선을 감지하는 적외선 센서를 포함하고, 상기 제1 대기질 데이터를 획득하는 단계는 이산화탄소(CO2) 농도를 측정하는 적외선 분석법에 기초하여, 상기 제1 대기질 데이터를 획득하는 단계를 포함할 수 있다.
일 측에 따르면, 와이파이(Wi-Fi) 통신 또는 IoT LTE 통신을 통해 실외 공기 측정기 및 실내 공기 측정기로부터 실시간으로 대기질 데이터를 수집하고, 현재 대기질 데이터에 따라 발생 가능한 질병 및 해당 질병의 발생 빈도를 예측할 수 있다.
일 측에 따르면, 과거부터 누적된 대기질 데이터에 기초하여 학습된 신경망을 포함하는 질병 예측 모델을 이용하여 현재의 대기질 데이터에 따라 발생 가능한 질병 및 해당 질병의 발생 빈도를 예측할 수 있다.
일 측에 따르면, 빅 대시보드 또는 디지털 사이니지 등을 통해 미세 먼지를 포함하는 대기질 데이터, 기상 정보, 공지 사항 및 대기질과 질병의 상관 관계 등의 정보를 포함하는 대기질 알리미 서비스를 제공할 수 있다.
도 1은 일 실시예에 따른 대기질 데이터에 기초한 질병 상관 관계 예측 장치의 동작을 설명하기 위한 도면.
도 2는 일 실시예에 따른 대기질 데이터에 기초한 질병 상관 관계 예측 방법을 나타낸 흐름도.
도 3은 일 실시예에 따른 질병 예측 모델을 생성하는 학습 페이즈(Learning Phase) 및 질병 예측 모델을 이용하여 질병 발생을 예측하는 예측 페이즈(Prediction Phase)의 동작을 설명하기 위한 도면.
도 4는 일 실시예에 따른 대기질 관련 정보를 포함하는 빅 데이터에 기반한 딥 러닝에 의해 대기질 데이터와 질병 간의 상관 관계를 분석하는 방법을 설명하기 위한 도면.
도 5는 일 실시예에 따라 예측한 질병의 발생 빈도를 표시하는 방법을 나타낸 도면.
도 6은 일 실시예에 따른 신경망을 학습하는 방법을 나타낸 흐름도.
도 7은 일 실시예에 따른 신경망을 학습 하는 과정을 설명하기 위한 도면.
도 8은 일 실시예에 따른 대기질 데이터에 기초한 질병 상관 관계 예측 장치의 블록도.
이하에서, 첨부된 도면을 참조하여 실시예들을 상세하게 설명한다. 각 도면에 제시된 동일한 참조 부호는 동일한 부재를 나타낸다.
아래 설명하는 실시예들에는 다양한 변경이 가해질 수 있다. 아래 설명하는 실시예들은 실시 형태에 대해 한정하려는 것이 아니며, 이들에 대한 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
실시예에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 실시예를 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 명세서 상에 기재된 특징, 숫자, 단계, 동작, 생성 요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 생성 요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
또한, 첨부 도면을 참조하여 설명함에 있어, 도면 부호에 관계없이 동일한 생성 요소는 동일한 참조 부호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 실시예를 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 실시예의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.
도 1은 일 실시예에 따른 대기질 데이터에 기초한 질병 상관 관계 예측 장치의 동작을 설명하기 위한 도면이다. 도 1을 참조하면, 일 실시예에 따른 대기질 데이터에 기초한 질병 상관 관계 예측 장치(이하, '예측 장치')는 딥 러닝을 기반으로 대기질 데이터를 포함하는 다양한 데이터들을 융합하여 질병 발생과의 상관 관계를 예측할 수 있다.
일 실시예에 따른 예측 장치는 예를 들어, 미세 먼지 실시간 데이터, 기상청의 초단기 실황 관측 자료 등과 같은 대기질 데이터와 질병의 발병 및 전이의 역동성에 영향을 받는 환자 발생, 진료, 처방, 및 실시간 DUR(Drug Utilization Review) 점검 자료 등의 데이터를 융합할 수 있다. 예측 장치는 융합할 데이터들을 수집하고, 수집한 데이터들의 이력을 관리할 수 있다. 예측 장치는 융합한 데이터들을 분석하거나, 및/또는 융합한 데이터들의 통계치를 산출하여 미세 먼지로 인해 발생하는 질병 간의 상관 관계를 파악할 수 있다. 다시 말해, 예측 장치는 대기질 데이터와 질병 발생 간의 상관 관계를 파악할 수 있다. 이때, 예측 장치는 GIS(Geographic Information System) 위치 분석을 통해 대기질 데이터와 질병이 발생한 지역 간의 상관 관계 또한 함께 파악할 수 있다.
예측 장치는 예를 들어, 암환자 발생 건수, 미세 먼지 발생량, 인구 통계 데이터, 대중 교통 데이터, 시설물 데이터 등을 기초로, 딥 러닝 또는 머신 러닝에 기반한 예측 모델을 이용하여 분석을 수행할 수 있다. 대중 교통 데이터는 예를 들어, 미세 먼지 등으로 인해 증가한 교통 사고율 등을 포함할 수 있다. 또한, 시설물 데이터는 예를 들어, 대기 오염 물질을 배출하는 공장 설비 등의 위치, 배출하는 대기 오염 물질의 종류 등의 데이터를 포함할 수 있다. 여기서, 딥 러닝 또는 머신 러닝에 기반한 예측 모델은 아래에서 설명하는 질병 예측 모델에 해당할 수 있다. 일 실시예에서 질병 예측 모델을 생성 및 이용하는 과정은 아래의 도 3을 참조하여 구체적으로 설명한다.
예측 장치는 전술한 대기질 데이터 및 의료 관련 자료 이외에도 예를 들어, 유형별 유동 인구, 교통 카드 통계, 교통 시설, 성별 취업률, 취업자 수, 인구 통계 DB 등과 같은 다양한 정보들을 포함하는 빅데이터 통합 데이터베이스(DB)에 기초하여 대기질 데이터와 질병 발생 간의 상관 관계를 파악할 수 있다. 또는 예측 장치는 GIS 데이터 및 유동 인구/교통 데이터를 함께 연계하여 대기질 데이터와 질병이 발생한 지역 간의 상관 관계 또는 질병 발생의 이동 경향 등 또한 함께 파악할 수 있다. 일 실시예에서 대기질 데이터를 포함하는 빅 데이터를 기초로 딥 러닝에 기반하여 대기질 데이터와 질병 간의 상관 관계를 분석하는 방법은 아래의 도 4를 참조하여 구체적으로 설명한다.
또한, 예측 장치는 과거부터 누적된 대기질 데이터에 기초하여 학습된 신경망을 포함하는 질병 예측 모델을 이용하여 현재의 대기질 데이터에 따라 발생 가능한 질병 및 해당 질병의 발생 빈도를 예측할 수 있다. 이때, 예측 장치는 예를 들어, 과거부터 현재까지의 누적된 대기질 데이터에 기초하여 생성된 시계열 모형을 이용하여 현재의 대기질 데이터에 따라 발생 가능한 질병 및 해당 질병의 발생 빈도를 예측할 수 있다.
예측 장치는 최종적인 예측 결과(예를 들어, 대기질 데이터와 상관 관계를 가지며 발생 가능한 질병 또는 질환, 해당 질병의 발생 지역, 해당 질병의 발생 빈도, 미세 먼지 등으로 인해 발생한 질환의 실제값과 예측값 간의 비율 등)를 정기 또는 비정기적으로 갱신할 수 있다. 예측 장치는 예를 들어, 사이니지 디스플레이 등과 같은 대시보드 형태의 알리미 화면에 예측 결과를 표시할 수 있다.
도 2는 일 실시예에 따른 대기질 데이터에 기초한 질병 상관 관계 예측 방법을 나타낸 흐름도이다. 도 2를 참조하면, 일 실시예에 따른 예측 장치는 실내 공기 측정기 및 실외 공기 측정기 중 적어도 하나로부터 제1 대기질 데이터(air quality data)를 획득한다(210). 예측 장치는 예를 들어, 실내 공기 측정기 및 실외 공기 측정기 중 적어도 하나로부터 와이파이 통신 및 IoT LTE 통신 중 적어도 하나의 무선 통신을 통해 제1 대기질 데이터를 획득할 수 있다. 이때, 실내 공기 측정기 및 실외 공기 측정기 중 적어도 하나는 예를 들어, 적외선을 방출하는 광원, 기체 고유의 흡수 스펙트럼에 맞는 파장을 통과시키는 필터 및 기체를 통과한 적외선을 감지하는 적외선 센서를 포함할 수 있다. 예측 장치는 예를 들어, 이산화탄소(CO2) 농도를 측정하는 적외선 분석법에 기초하여, 제1 대기질 데이터를 획득할 수도 있다. 여기서, '대기질'은 공기 중의 오염 물질들의 농도로 기술되는 공기의 청결함의 척도로 이해될 수 있다.
예측 장치는 제1 대기질 데이터가 획득된 지역에서, 현재를 기준으로 미리 정의된 과거 구간 동안에 획득된 대기질 데이터에 시간 별 가중치를 적용한 제2 대기질 데이터를 생성한다(220). 이하에서, '제1 대기질 데이터'는 현재의 대기질 데이터로 이해될 수 있다. 또한, '제2 대기질 데이터'는 제1 대기질 데이터가 획득된 지역에서, 과거부터 현재까지의 시간 동안에 누적적으로 획득된 대기질 데이터로서, 해당 데이터가 획득된 시간 별 가중치에 의해 가공된 데이터로 이해될 수 있다. 이때, 시간 별 가중치는 예를 들어, 현재 시간에 가까울수록 높은 값을 가지고, 과거 시간에 가까울수록 낮은 값을 가질 수 있다. 예를 들어, 제2 대기질 데이터를 획득한 시간이 현지 시간에 가까울수록 높은 값을 갖는 가중치를 적용함으로써 제2 대기질 데이터는 데이터의 수집 이력을 반영하되 과거보다는 최근 경향성을 더 잘 반영할 수 있다.
예측 장치는 제1 대기질 데이터, 제2 대기질 데이터 및 지역의 정보에 기초하여 질병 예측 모델의 입력 레이어에 대응하는 입력 벡터를 생성한다(230). 질병 예측 모델은 대기질 관련 정보와 미세 먼지로 인해 발생한 질병 간의 상관 관계에 기초하여 학습된 신경망을 포함한다. 여기서, 신경망은 예를 들어, 대기질 데이터에 대응하는 예측 질병 정보를 생성하도록 미리 학습된 복수의 레이어들을 포함하는 신경망일 수 있다. 신경망은 예를 들어, 해당 지역에서 과거에 미세 먼지로 인해 발생한 질병에 대한 정보와 과거부터 현재까지의 미세 먼지 측정 데이터를 결합하여, 해당 지역의 현재 질병 관련 정보를 예측할 수 있다. 이때, 입력 벡터는 예를 들어, 입력 레이어의 제1 노드에 대응하는 제1 대기질 데이터, 제2 노드에 대응하는 제2 대기질 데이터 및 제3 노드에 대응하는 지역의 정보를 포함할 수 있다.
대기질 관련 정보는 예를 들어, 실내 미세 먼지 농도, 실외 미세 먼지 농도, 기상 기후 데이터, 및 행정 단위별 인구 통계 기록 중 적어도 하나의 후보 예측 인자, 및 건강 보험 심사 평가원의 환자 진료 내역 정보를 포함할 수 있다. 환자 진료 내역 정보는 이외에도 환자 정보, 청구 명세서, 의약품 처방 등과 같은 진료 내역 정보, 상병 내역, DUR 정보, 및 요양 기관 정보 등을 포함할 수 있다.
일 실시예에서는 범주 예측 모형을 평가하고, 최적 문턱치를 결정하기 위하여 예측성 평가 측도(skill score)를 고려할 수 있다. 예측 장치는 예를 들어, 계절별, 성별, 연령군 별로 구분된 데이터 각각에 대하여 세 모형을 적용하여 얻은 범주 예측치를 비교할 수 있다. 예측 장치는 비교 결과를 기초로, 예측성 평가측도인 정분류율(hit rate, HR), 탐지확률(probability of detection, POD), 허위경고율(false alarm rate, FAR)을 구하여 비교 분석함으로써 최적의 질병 예측 모델을 구성할 수 있다.
질병 예측 모델은 예를 들어, 환자 진료 내역 정보와 후보 예측 인자 간의 상관 관계를 분석한 결과에 기초하여 후보 예측 인자 중 상관성이 없는 후보 예측 인자를 제거함으로써 선정된 잠재 예측 인자, 및 미세 먼지에 의한 지상 오존 농도 분포의 상관 관계에 따른 정분류율(hit rate; HR) 및 탐지 확률(probability of detection; POD)을 제1 임계치보다 높이고, 허위 경고율(false alarm rate; FAR)을 제2 임계치보다 낮추는 기준값에 기초한 범위 내에서 학습될 수 있다. 제1 임계치는 예를 들어, 70%이고, 제2 임계치는 예를 들어, 50%일 수 있다.
이때, 정분률, 탐지 확률, 허위 경고율은 질병 예측 모델의 예측성을 비교 및/또는 평가하기 위한 예측성 평가 측도들(skill scores)에 해당할 수 있다. 범주(category) 예측 결과는 예를 들어, 아래의 [표 1]과 같은 은 2 범주 예측(지속 관리, 주의)을 나타내는 2 X 2 분할표로 요약하여 나타낼 수 있다.
Figure 112019076628654-pat00001
[표 1]은 모형의 예측성을 비교하기 위하여 2 범주 예측 결과를 2 X 2 분할표로 요약하여 예측성 평가 측도들을 계산하여 비교한 것이다. 2 범주의 경우, 예측성 평가 측도들로 정분류율(hit rate; HR), 탐지 확률(probability of detection; POD), 및 허위 경고율(false alarm rate; FAR)을 사용할 수 있다. 각 예측성 평가 측도(HR, POD 및 FAR)는 아래의 수학식 1과 같이 표현할 수 있다.
Figure 112019076628654-pat00002
여기서, 정분류율(HR)은 질병 예측 모델이 실제 상태(예를 들어, 대기질 데이터와 미세 먼지로 인해 발생한 질병 간의 상관 관계)를 정확하게 예측한 비율을 나타낸다. 탐지 확률(POD)은 질병 예측 모델이 실제 상태가 주의일 경우를 정확하게 분류한 비율을 나타낸다. 허위 경고율(FAR)은 질병 예측 모델이 실제 상태가 지속 관리인데 주의라고 잘못 예측한 경우를 나타낸다.
여기서, '주의'인 경우는 예를 들어, 호흡기 질환자의 발생 비율이 높다는 것, 다시 말해 질병 발생 확률이 높다는 것을 의미하므로 '지속 관리'보다 '주의'에 더 비중을 두게 된다. 따라서 실제 상태가 주의일 때 정확히 예측한 것을 양의 정분류(hit), 실제가 지속 관리일 때 정확히 예측한 것을 음의 정분류(negative correction)로 구분하여 정의할 수 있다. 예를 들어, 한다. 정분류율(HR)이 높더라도 탐지 확률(POD)이 낮으면, 질병 예측 모델로 활용할 수 없다. 정분류율(HR)과 탐지 확률(POD)은 높을수록 좋고, 허위 경고율(FAR)은 낮을수록 좋은 질병 예측 모델이 될 수 있다. 일 실시예에서는 범주 유형 별로 각각의 예측 모델을 생성하여 예측 결과를 비교할 수 있다.
질병 예측 모델의 손실 함수는 예를 들어, 정분류율, 탐지 확률, 및 허위 경고율을 기초로 정의될 수 있다.
또는 질병 예측 모델은 예를 들어, 로지스틱 회귀 모형을 이용한 회귀 분석을 통해 대기질 관련 정보와 미세 먼지로 인해 발생한 질병 간의 상관 관계를 분석할 수 있다. 또한, 질병 예측 모델은 예를 들어, 두 변수 X 와 Y 간의 선형 상관 관계를 계량화한 피어슨 상관 계수(pearson's correlation coefficient), 두 변수의 순위 사이의 통계적 의존성을 측정하는 비모수적인 척도를 나타내는 스피어만 상관 계수(spearman correlation coefficient), 및 서열변인에 적용될 수 있는 등위 상관 계수인 켄달 상관 계수(Kendall's ) 중 적어도 하나의 상관 계수에 의해 대기질 관련 정보와 질병 간의 상관 관계의 크기를 정량화할 수 있다.
예측 장치는 단계(230)에서 생성한 입력 벡터를 질병 예측 모델에 인가함으로써 질병 예측 모델에 의해 생성된 출력 벡터를 획득할 수 있다(240).
예측 장치는 단계(240)에서 획득한 출력 벡터에 기초하여, 제1 대기질 데이터에 따라 발생 가능한 질병 및 발생 가능한 질병의 발생 빈도 중 적어도 하나를 예측한다(250). 여기서, '발생 가능한 질병'은 예를 들어, 미세 먼지로 인한 호흡기 질환자, 피부 질환자 이 외에도 심한 미세 먼지로 인해 시계 확보가 어려움에 따라 발생한 교통 사고 환자의 질환, 다시 말해 미세 먼지로 인해 2차적으로 발생한 사고, 질환 등을 모두 포괄하는 의미로 사용될 수 있다.
예측 장치는 단계(210)에서 획득한 제1 대기질 데이터, 단계(250)에서 예측한 질병 및 예측한 질병의 발생 빈도 중 적어도 하나를 표시할 수 있다(260). 예측 장치는 예를 들어, 디지털 사이니지(Digital Signage) 등과 같은 디스플레이 장치를 통해 제1 대기질 데이터, 단계(250)에서 예측한 질병 및 예측한 질병의 발생 빈도 중 적어도 하나를 표시할 수 있다. 예측 장치는 전술한 제1 대기질 데이터, 예측한 질병, 및 예측한 질병의 발생 빈도 이외에도, 질병 발생 지역, 미세 먼지 경고 문구, 공기 관리 행동 요령 등을 함께 표시할 수 있다. 예측 장치는 예를 들어, 아래의 도 5에 도시된 것과 같이 질병의 발생 빈도를 표시할 수 있다.
도 3은 일 실시예에 따른 질병 예측 모델을 생성하는 학습 페이즈(Learning Phase) 및 질병 예측 모델을 이용하여 질병 발생을 예측하는 예측 페이즈(Prediction Phase)의 동작을 설명하기 위한 도면이다.
학습 페이즈에서, 일 실시예에 따른 학습 장치는 훈련 데이터(310)를 기초로 머신 러닝(machine learning) 또는 딥 러닝(deep learning)에 의한 학습을 통해 예측 모델링(320)을 수행할 수 있다. 학습 장치는 예를 들어, 감독(supervised) 학습, 비감독(unsupervised) 학습, 및 강화(reinforcement) 학습 등과 같은 다양한 학습 방법을 통해 예측 모델링(320)을 수행할 수 있다. 여기서, 감독 학습은 입력과 이에 대응하여 미리 알려진(또는 미리 주어진) 출력을 매핑(mapping)하는 함수를 학습하는 것으로 이해될 수 있다. 비감독 학습은 출력 없이 입력만으로 모델을 구축하여 학습하는 것으로 이해될 수 있다. 일반적으로 데이터마이닝(datamining)의 대부분의 기법이 비감독 학습에 해당할 수 있다. 강화 학습은 학습자가 행동을 선택하여 행동으로 환경에 영향을 미치고, 이에 대한 피드백으로 보상치를 얻어 학습 알고리즘의 가이드로 사용하여 학습하는 것으로 이해될 수 있다.
학습 장치는 예측 모델링(320)의 결과로서 예측 모델(330)을 생성할 수 있다. 학습 장치는 예측 모델(330)의 생성 시에 예를 들어, 상관성이 없는 예측 인자를 제거하기 위하여 심사평가원 환자 자료와 예측 인자 사이의 상관 분석을 수행하여 잠재적 예측 인자를 선정할 수 있다. 예측 모델(330)의 생성 시에 예를 들어, 지속성 인자, 일평균 기온, 감염병 예측 자료, 호흡기 질환자수 비율, 봄과 여름의 일교차, 가을과 겨울의 최저 습도 등의 인자들이 유의미하게 사용될 수 있다. 예측 모델(330)은 예를 들어, 미세먼지 지상 오존 농도 분포와 질병 간의 상관 관계 등을 분석할 수 있다. 예측 모델(330)은 전술한 질병 예측 모델에 해당할 수 있다.
예측 모델(330)은 전술한 정분류율, 탐지 확률, 및 허위 경고율을 참고하여 생성될 수 있다. 예측 모델(330)은 예를 들어, 정분류율과 탐지확률을 높이고 허위 경고율을 낮추는 문턱치를 선정하여 범주 예측에 사용함으로써 생성될 수 있다.
예측 모델(330)의 선택 기준은 예를 들어, 정분류율과 탐지 확률은 70%이상, 허위 경고율은 50% 미만의 값을 가지는 범위 내에서 학습될 수 있다. 예를 들어, 정분류율, 탐지 확률, 및 허위 경고율이 모두 기준에 미치는 못하는 경우에는 예측성이 가장 좋은 예측 모델이 선택될 수 있다.
학습 장치는 예를 들어, 트리 구조 형태를 예측 모델로 사용하는 의사 결정 나무(Decision Tree), 생물의 신경 네트워크 구조와 기능을 모방하는 인공 신경망(Neural Network), 생물의 진화 알고리즘에 기반한 유전자 프로그래밍(Genetic Programming), 관측된 예를 군집이라는 부분 집합으로 분배하는 군집화(Clustering), 무작위로 추출된 난수를 통해 함수값을 확률로 계산하는 몬테카를로 방법(Monter Carlo method), 및 로직스틱 회귀 등에 의해 예측 모델(330)을 생성할 수 있다.
예를 들어, 예측 모델(330)이 로직스틱 회귀 또는 의사 결정 나무에 의해 생성된 경우, 예측 모델(330)은 예측성 평가 측도 향상을 위하여 임계치(threshold)를 사용하여 범주 예측치(또는 확률 예측치)를 결정할 수 있다. 범주 예측치를 결정할 때 예를 들어, 최대 확률을 기준으로 분류하고 임계치를 기준으로 분류하는 것이 예측치가 높게 나타날 수 있다.
학습 페이즈에서 생성된 예측 모델(330)은 실시간의 예측 페이즈에서 신규 데이터에 대응하는 예측 결과를 출력하는 데에 이용될 수 있다.
예측 페이즈에서, 일 실시예에 따른 예측 장치는 신규 데이터(340)가 입력되면, 신규 데이터를 예측 모델(350)에 인가하여 예측 결과(360)를 출력할 수 있다. 이때, 예측 모델(350)은 학습 페이즈에서 생성된 예측 모델(330)에 해당할 수 있다.
예측 장치는 예를 들어, 회귀 분석을 사용하여 변수들 간의 인과 관계를 분석할 수 있다. 이때, 두 변수 간 상관 관계의 크기는 상관 계수로 정량화될 수 있다. 이때, 정량화되는 상관 계수는 예를 들어, 피어슨 상관 계수, 스피어만 상관 계수, 켄달 상관 계수 등일 수 있다. 정량화되는 상관 계수는 예를 들어, -1 ~ 1사이의 값을 가질 수 있다. 켄달 상관 계수로 순위 척도 데이터 또는 변환한 데이터를 이용해 두 변수간 상관 계수를 나타낼 수 있다.
도 4는 일 실시예에 따른 대기질 관련 정보를 포함하는 빅 데이터에 기반한 딥 러닝에 의해 대기질 데이터와 질병 간의 상관 관계를 분석하는 방법을 설명하기 위한 도면이다. 도 4를 참조하면, 일 실시예에 따른 대기질 데이터에 대한 군집화 및/또는 분류를 통해 대기질 데이터와 질병 발생 간의 상관 관계를 분석하는 과정이 도시된다.
일 실시예에 따른 딥 러닝 데이터 통합 관리 허브(이하, 관리 허브')는 데이터 소스를 수집 및 저장할 수 있다. 이때, 데이터 소스는 예를 들어 미세 먼지, 오존 등의 외부 데이터, 시설물 현황과 같은 내/외부 데이터, 그 밖의 사외 데이터 등을 포함할 수 있다. 데이터 소스는 예를 들어, 전술한 빅데이터 통합 데이터베이스(DB)에 포함된 데이터에 해당할 수 있다. 관리 허브는 일 실시예에 따른 예측 장치에 해당할 수 있다.
관리 허브는 예를 들어, 데이터를 일정 기간 또는 일정량 모아서 처리하는 배치(batch) 처리, 실시간 처리, 오픈 API (open application program interface), 및 다수의 컴퓨터에 분산 저장되어 있는 데이터들을 수집하여 검색 대상의 색인으로 포함시키는 크롤링(crawling) 등을 통해 데이터를 수집할 수 있다.
이때, 관리 허브는 예를 들어, 대용량 데이터 분석 처리를 위한 오픈 소스 프레임워크인 하둡 분산 파일 시스템(Hadoop Distributed File System; HDFS) 또는 빅 데이터 처리를 위한 비관계형 데이터 베이스 관리 시스템인 노에스큐엘(NoSQL)을 이용하여 가공되지 않은 로우 데이터(Raw data)를 저장할 수 있다.
관리 허브는 저장된 로우 데이터에 대한 전처리를 수행할 수 있다. 관리 허브는 예를 들어, 로우 데이터로부터 특징을 추출하거나, 로우 데이터를 변환하거나, 또는 로우 데이터를 적재하는 등과 같은 전처리를 수행할 수 있다.
관리 허브는 전처리 결과를 딥 러닝으로 분석하고, 분석 결과를 저장할 수 있다. 관리 허브는 전처리 결과를 예를 들어, 시계열 예측(time series prediction) 방법 또는 랜덤 포레스트(random forest) 방법에 의해 분석하여 결과를 예측하여 저장할 수 있다.
관리 허브는 전처리 결과 및/또는 저장된 분석 결과에 대하여 딥러닝 분석 수행 환경에 따른 최종 분석을 수행할 수 있다. 관리 허브는 예를 들어, 전처리 결과 및/또는 저장된 분석 결과에 대하여 예를 들어, 정형 분석, 탐색전 시각화, 비정형 분석 및 딥러닝 분석 등을 수행할 수 있다.
관리 허브는 최종 분석 결과를 시각화할 수 있다. 관리 허브는 예를 들어, 대시 보드(dash board), 실시간 리포트, 모바일 리포트, BI(Business Intelligence) 연계 디지털 사이니지 디스플레이 등을 통해 최종 분석 결과를 시각화할 수 있다.
도 5는 일 실시예에 따라 예측한 질병의 발생 빈도를 표시하는 방법을 나타낸 도면이다. 도 5를 참조하면, 일 실시예에 따른 미세 먼지 관련 질병 예측도가 도시된다.
일 실시예에 따르면, 미세 먼지 관련 질병 예측도는 예를 들어, 전국 광역시도 별 호흡기 질환의 실제 위험도 및 호흡기 질환 진료 내역 건수 등을 각 날짜 별로 나타날 수 있다. 호흡기 질환 진료 내역 건수는 예측 진료 내역 건수 대시 실제 진료 내역 건수를 나타낼 수 있다.
일 실시예에 따른 예측 장치는 예를 들어, 빅보드 대시 보드 등을 통해 상황 별 능동적 경고 메시지를 생성하고, 이를 통제하고 해결하기 위해 다양한 IoT 기기와 연동될 수 있다.
도 6은 일 실시예에 따른 신경망을 학습하는 방법을 나타낸 흐름도이고, 도 7은 일 실시예에 따른 신경망을 학습 하는 과정을 설명하기 위한 도면이다. 도 6 및 도 7을 참조하면, 일 실시예에 따른 학습 장치가 정답 질병 정보와 예측 질병 정보 간의 차이에 의해 신경망을 학습하는 과정이 도시된다.
학습 장치는 제1 대기질 데이터, 제2 대기질 데이터 및 지역 정보를 포함하는 학습 데이터(710)를 수신할 수 있다(610).
학습 장치는 신경망(720)을 이용하여 학습 데이터(710)에 대응하여 발생하는 것으로 예측되는 예측 질병 정보(730)를 생성할 수 있다(620).
학습 장치는 단계(610)에서 수신한 학습 데이터(710)에 대응하는 정답(Ground Truth) 질병 정보(750)와 신경망(720)을 통해 생성된 예측 질병 정보(730) 간의 차이(즉, 손실(loss))에 기초하여, 신경망(720)을 학습할 수 있다(630). 이때, 학습 장치는 정답 질병 정보(750)와 예측 질병 정보(730) 간의 손실에 기초한 손실 함수(740)에 의해 신경망(720)을 학습할 수 있다. 학습 장치는 예를 들어, 감독 학습(supervised learning)을 통해 신경망(720)을 학습할 수 있다. 학습 장치는 예를 들어, 손실 함수(740)가 최소화 되도록, 다시 말해 정답 질병 정보(750)와 예측 질병 정보(730) 간의 손실이 최소화되도록 신경망(720)을 학습할 수 있다. 학습 장치는 손실 역 전파 학습(back-propagation learning)을 통해 신경망(720)에 역전파되는 손실에 의해 신경망(720)을 갱신할 수 있다. 손실 역 전파 학습은 주어진 학습 데이터(710)에 대해 포워드 계산(forward computation)을 통하여 손실 함수(740)를 추정한 후, 신경망(720)의 출력 레이어에서 시작하여 히든 레이어 및 입력 레이어를 향하는 역 방향으로 추정한 손실을 전파하면서, 손실을 줄이는 방향으로 신경망(720)을 갱신하는 방법이다.
신경망(720)은 많은 수의 인공 뉴런(노드)들을 이용하여 생물학적인 시스템의 계산 능력을 모방하는 소프트웨어나 하드웨어로 구현된 학습 모델을 나타낼 수 있다. 신경망(720)은 인공 뉴런들을 통해 인간의 인지 작용을 수행할 수 있다. 신경망(720)은 예를 들어, 예를 들어, CNN(convolutional neural network), DNN (Deep Neural Network), RNN (recurrent neural network), 또는 BLSTM (Bidirectional Long Short Term Memory) 등과 같이 다양한 구조로 구현될 수 있다.
도 8은 일 실시예에 따른 대기질 데이터에 기초한 질병 상관 관계 예측 장치의 블록도이다. 도 8을 참조하면, 일 실시예에 따른 질병 상관 관계 예측 장치(이하, '예측 장치')(800)는 프로세서(810), 메모리(830) 및 통신 인터페이스(850)를 포함할 수 있다. 프로세서(810), 메모리(830) 및 통신 인터페이스(850)는 통신 버스(805)를 통해 서로 통신할 수 있다.
프로세서(810)는 통신 인터페이스(850)를 통해 수신한 제1 대기질 데이터가 획득된 지역에서, 현재를 기준으로 미리 정의된 과거 구간 동안에 획득된 대기질 데이터에 시간 별 가중치를 적용한 제2 대기질 데이터를 생성한다. 프로세서(810)는 제1 대기질 데이터, 제2 대기질 데이터 및 지역의 정보에 기초하여 질병 예측 모델의 입력 레이어에 대응하는 입력 벡터를 생성한다. 여기서, 질병 예측 모델은 대기질 관련 정보와 미세 먼지로 인해 발생한 질병 간의 상관 관계에 기초하여 학습된 신경망을 포함한다. 프로세서(810)는 입력 벡터를 질병 예측 모델에 인가함으로써 질병 예측 모델에 의해 생성된 출력 벡터를 획득한다. 프로세서(810)는 출력 벡터에 기초하여, 제1 대기질 데이터에 따라 발생 가능한 질병 및 발생 가능한 질병의 발생 빈도 중 적어도 하나를 예측한다. 프로세서(810)는 제1 대기질 데이터, 예측한 질병 및 예측한 질병의 발생 빈도 중 적어도 하나를 디스플레이(미도시)를 통해 표시한다. 여기서, 디스플레이는 예를 들어, 디지털 사이니지(Digital Signage)일 수 있다. 프로세서(810)에 의하여 실행되는 프로그램 코드는 메모리(830)에 저장될 수 있다.
이 밖에도, 프로세서(810)는 도 1 내지 도 7에서 예측 장치(800)와 관련하여 기술된 동작들 중 어느 하나 또는 이들의 조합을 실행할 수 있다.
메모리(830)는 제1 공기질 데이터, 제2 공기질 데이터, 이외에도 대기질 관련 정보, 제1 대기질 데이터가 획득된 지역의 정보 등을 저장할 수 있다. 또한, 메모리(830)는 프로세서(810)가 제1 대기질 데이터에 따라 발생할 것으로 예측한 질병 및 예측한 질병의 발생 빈도 또한 저장할 수 있다.
메모리(830)는 휘발성 메모리 또는 비 휘발성 메모리일 수 있다. 메모리(830)는 예를 들어, 프로세서(810)에 의해 실행될 때, 프로세서(810)가 도 1 내지 도 7과 관련하여 설명하는 과정들 중 어느 하나 또는 이들의 조합을 실행하도록 하는 명령어들을 저장할 수 있다.
통신 인터페이스(850)는 실내 공기 측정기 및 실외 공기 측정기 중 적어도 하나로부터 제1 대기질 데이터(air quality data)를 획득한다.
본 발명의 일 실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 실행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 생성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 실행하도록 특별히 생성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 동작을 실행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 생성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변이가이 가능하다. 그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐만 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.
800: 통신 장치
805: 통신 버스
810: 프로세서
830: 메모리
850: 통신 인터페이스

Claims (6)

  1. 예측 장치의 프로세서가, 실내 공기 측정기 및 실외 공기 측정기 중 적어도 하나로부터 제1 대기질 데이터(air quality data)를 획득하는 단계;
    상기 프로세서가, 상기 제1 대기질 데이터가 획득된 지역에서, 현재를 기준으로 미리 정의된 과거 구간 동안에 획득된 대기질 데이터에 시간 별 가중치를 적용한 제2 대기질 데이터를 생성하는 단계;
    상기 프로세서가, 상기 제1 대기질 데이터, 상기 제2 대기질 데이터 및 상기 지역의 정보에 기초하여 질병 예측 모델- 상기 질병 예측 모델은 대기질 관련 정보와 미세 먼지로 인해 발생한 질병 간의 상관 관계를 분석하고, 피어슨 상관 계수, 스피어만 상관 계수, 및 켄달 상관 계수 중 적어도 하나의 상관 계수에 의해 상기 대기질 관련 정보와 상기 질병 간의 상관 관계의 크기를 정량화 함으로써 발생 가능한 질병 및 상기 질병의 발생 빈도를 예측하도록 학습된 신경망을 포함함 -의 입력 레이어에 대응하는 입력 벡터를 생성하는 단계;
    상기 프로세서가, 상기 입력 벡터를 상기 질병 예측 모델에 인가함으로써 상기 질병 예측 모델에 의해 생성된 출력 벡터를 획득하는 단계;
    상기 프로세서가, 상기 출력 벡터에 기초하여, 상기 제1 대기질 데이터에 따라 발생 가능한 질병 및 발생 가능한 질병의 발생 빈도를 예측하는 단계; 및
    상기 프로세서가, 상기 제1 대기질 데이터, 상기 예측한 질병 및 상기 예측한 질병의 발생 빈도 중 적어도 하나를 표시하는 단계
    를 포함하고,
    상기 대기질 관련 정보는
    실내 미세 먼지 농도, 실외 미세 먼지 농도, 기상 기후 데이터, 및 행정 단위별 인구 통계 기록 중 적어도 하나의 후보 예측 인자, 및 건강 보험 심사 평가원의 환자 진료 내역 정보
    를 포함하고,
    상기 질병 예측 모델은
    상기 환자 진료 내역 정보와 상기 후보 예측 인자 간의 상관 관계를 분석한 결과에 기초하여 상기 후보 예측 인자 중 상관성이 없는 후보 예측 인자를 제거함으로써 선정된 잠재 예측 인자에 기초하여 학습된 것이고,
    상기 예측 장치는
    빅데이터 통합 데이터베이스(DB)에 포함된 GIS(Geographic Information System) 데이터 및 유동 인구/교통 데이터를 함께 연계하여 질병 발생의 이동 경향을 파악하는, 대기질 데이터에 기초한 질병 상관 관계 예측 방법.
  2. 제1항에 있어서,
    상기 입력 벡터는
    상기 입력 레이어의 제1 노드에 대응하는 상기 제1 대기질 데이터, 제2 노드에 대응하는 상기 제2 대기질 데이터 및 제3 노드에 대응하는 상기 지역의 정보를 포함하는, 대기질 데이터에 기초한 질병 상관 관계 예측 방법.
  3. 제1항에 있어서,
    상기 신경망은
    해당 지역에서 과거에 미세 먼지로 인해 발생한 질병에 대한 정보와 상기 과거부터 현재까지의 미세 먼지 측정 데이터를 결합하여, 상기 해당 지역의 현재 질병 관련 정보를 예측하는, 대기질 데이터에 기초한 질병 상관 관계 예측 방법.
  4. 삭제
  5. 제1항에 있어서,
    상기 질병 예측 모델은
    상기 잠재 예측 인자에 더하여, 상기 미세 먼지에 의한 지상 오존 농도 분포의 상관 관계에 따른 정분류율(hit rate; HR) 및 탐지 확률(probability of detection; POD)을 제1 임계치보다 높이고, 허위 경고율(false alarm rate; FAR)을 제2 임계치보다 낮추는 기준값에 기초한 범위 내에서 학습되는, 대기질 데이터에 기초한 질병 상관 관계 예측 방법.
  6. 제5항에 있어서,
    상기 질병 예측 모델의 손실 함수는
    상기 정분류율, 상기 탐지 확률, 및 상기 허위 경고율을 기초로 정의되는, 대기질 데이터에 기초한 질병 상관 관계 예측 방법.

KR1020190090357A 2019-07-25 2019-07-25 대기질 데이터에 기초한 질병 상관 관계 예측 방법 및 장치 KR102088296B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190090357A KR102088296B1 (ko) 2019-07-25 2019-07-25 대기질 데이터에 기초한 질병 상관 관계 예측 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190090357A KR102088296B1 (ko) 2019-07-25 2019-07-25 대기질 데이터에 기초한 질병 상관 관계 예측 방법 및 장치

Publications (1)

Publication Number Publication Date
KR102088296B1 true KR102088296B1 (ko) 2020-05-29

Family

ID=70911652

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190090357A KR102088296B1 (ko) 2019-07-25 2019-07-25 대기질 데이터에 기초한 질병 상관 관계 예측 방법 및 장치

Country Status (1)

Country Link
KR (1) KR102088296B1 (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113744888A (zh) * 2021-09-02 2021-12-03 深圳万海思数字医疗有限公司 区域流行病趋势预测预警方法及系统
KR20220146084A (ko) * 2021-04-23 2022-11-01 순천향대학교 산학협력단 문진표를 이용한 인공지능 기반의 질병 예측 방법 및 장치
KR20230022486A (ko) * 2021-08-09 2023-02-16 배재대학교 산학협력단 시계열 데이터의 에러 값 보정을 위한 필터링 및 성능 비교 시스템 및 방법
KR102590753B1 (ko) * 2023-07-26 2023-10-20 주식회사 위즈아이 상세 기상관측 및 기상수치모델 정보 기반 고해상도온열질환 발생 확률 예측 장치 및 상세 기상관측 및 기상수치모델 정보 기반 고해상도 온열질환 발생 확률 예측 방법

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005063218A (ja) * 2003-08-15 2005-03-10 Nippon Telegr & Teleph Corp <Ntt> 疾病対策支援方法および疾病対策支援システム
KR100650267B1 (ko) 2005-10-19 2006-11-27 주식회사 포스코 분진 예측방법
KR20140107714A (ko) * 2013-02-25 2014-09-05 한국전자통신연구원 건강 관리 시스템 및 그것의 건강 정보 제공 방법
KR101545319B1 (ko) 2013-10-30 2015-08-19 동의대학교 산학협력단 미세 먼지 농도 결정 시스템 및 방법
KR20150116082A (ko) 2014-04-04 2015-10-15 순천향대학교 산학협력단 다중 회귀 모형을 이용하여 초미세 먼지 노출에 따른 폐기능 저하 예측방법
KR20160060479A (ko) * 2014-11-20 2016-05-30 주식회사 플리노 환경 대응 장치 및 컴퓨터 프로그램
KR101915704B1 (ko) 2016-10-13 2018-11-06 우연정 미세먼지 측정 시스템 및 방법

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005063218A (ja) * 2003-08-15 2005-03-10 Nippon Telegr & Teleph Corp <Ntt> 疾病対策支援方法および疾病対策支援システム
KR100650267B1 (ko) 2005-10-19 2006-11-27 주식회사 포스코 분진 예측방법
KR20140107714A (ko) * 2013-02-25 2014-09-05 한국전자통신연구원 건강 관리 시스템 및 그것의 건강 정보 제공 방법
KR101545319B1 (ko) 2013-10-30 2015-08-19 동의대학교 산학협력단 미세 먼지 농도 결정 시스템 및 방법
KR20150116082A (ko) 2014-04-04 2015-10-15 순천향대학교 산학협력단 다중 회귀 모형을 이용하여 초미세 먼지 노출에 따른 폐기능 저하 예측방법
KR20160060479A (ko) * 2014-11-20 2016-05-30 주식회사 플리노 환경 대응 장치 및 컴퓨터 프로그램
KR101915704B1 (ko) 2016-10-13 2018-11-06 우연정 미세먼지 측정 시스템 및 방법

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220146084A (ko) * 2021-04-23 2022-11-01 순천향대학교 산학협력단 문진표를 이용한 인공지능 기반의 질병 예측 방법 및 장치
KR102536982B1 (ko) * 2021-04-23 2023-05-26 순천향대학교 산학협력단 문진표를 이용한 인공지능 기반의 질병 예측 방법 및 장치
KR20230022486A (ko) * 2021-08-09 2023-02-16 배재대학교 산학협력단 시계열 데이터의 에러 값 보정을 위한 필터링 및 성능 비교 시스템 및 방법
KR102544621B1 (ko) 2021-08-09 2023-06-15 배재대학교 산학협력단 시계열 데이터의 에러 값 보정을 위한 필터링 및 성능 비교 시스템 및 방법
CN113744888A (zh) * 2021-09-02 2021-12-03 深圳万海思数字医疗有限公司 区域流行病趋势预测预警方法及系统
CN113744888B (zh) * 2021-09-02 2023-09-22 深圳万海思数字医疗有限公司 区域流行病趋势预测预警方法及系统
KR102590753B1 (ko) * 2023-07-26 2023-10-20 주식회사 위즈아이 상세 기상관측 및 기상수치모델 정보 기반 고해상도온열질환 발생 확률 예측 장치 및 상세 기상관측 및 기상수치모델 정보 기반 고해상도 온열질환 발생 확률 예측 방법

Similar Documents

Publication Publication Date Title
KR102088296B1 (ko) 대기질 데이터에 기초한 질병 상관 관계 예측 방법 및 장치
Fong et al. Composite Monte Carlo decision making under high uncertainty of novel coronavirus epidemic using hybridized deep learning and fuzzy rule induction
JP7200311B2 (ja) 人工知能およびユーザ入力を用いて発達進度を判定するための方法および装置
Kirasich et al. Random forest vs logistic regression: binary classification for heterogeneous datasets
Chen et al. Learning deep representation from big and heterogeneous data for traffic accident inference
Niyogisubizo et al. Predicting student's dropout in university classes using two-layer ensemble machine learning approach: A novel stacked generalization
JP7295278B2 (ja) 発症率を監視する方法、装置、設備および記憶媒体
Liu et al. Smart environment design planning for smart city based on deep learning
WO2020102220A1 (en) Adherence monitoring through machine learning and computing model application
Pan et al. Discovering optimal strategies for mitigating COVID-19 spread using machine learning: Experience from Asia
Serulle et al. The optimal time to evacuate: A behavioral dynamic model on Louisiana resident data
Carlson et al. Measuring and modeling behavioral decision dynamics in collective evacuation
Mitra et al. Learning from data with structured missingness
Rahman et al. Household evacuation preparation time during a cyclone: random Forest algorithm and variable degree analysis
Hu et al. Examining nonlinearity in population inflow estimation using big data: An empirical comparison of explainable machine learning models
Li et al. Introduce structural equation modelling to machine learning problems for building an explainable and persuasive model
Li et al. Impact of the pre-simulation process of occupant behaviour modelling for residential energy demand simulations
Mittal et al. Deep-learning spatiotemporal prediction framework for particulate matter under dynamic monitoring
Ahmed et al. Forecasting of fine particulate matter based on LSTM and optimization algorithm
Rahman et al. Predictive analytics for children: An assessment of ethical considerations, risks, and benefits
Preetha Data Analysis on Student's Performance based on Health status using Genetic Algorithm and Clustering algorithms
Islam et al. College life is hard!-shedding light on stress prediction for autistic college students using data-driven analysis
Fantechi et al. Learning from the past: a machine-learning approach for predicting the resilience of locked-in regions after a natural shock
Li et al. One step ahead: a framework for detecting unexpected incidents and predicting the stock markets
CN117591944B (zh) 一种针对于大数据分析的学习预警方法及系统